Qlean Dataset、方言音声データセット「日本語・地域方言対話音声」を提供開始
[26/05/19]
提供元:PRTIMES
提供元:PRTIMES
〜大阪弁・広島弁の自然対話音声を収録した商用利用対応コーパス。ASRロバスト性検証・方言適応LLM・TTSファインチューニングに活用可能。GENIAC採択企業のVisual Bankが提供〜
[画像1: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-f1c30346a7ea23fda8055aafc96a15da-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、「日本語・地域方言対話音声データセット」の提供を開始します。
■ 方言音声データセットとは
方言音声データセットとは、標準語コーパスではカバーできない地域固有の音声パターン・アクセント・語彙を含む音声コーパスです。ASRモデルの方言汎化性能検証、LLMの方言理解向上、地域特化TTSモデルの構築を目的とした機械学習データとして活用されます。カスタム収録・追加方言への対応も可能です。
■ 今回提供を開始する「日本語・地域方言対話音声データセット」の概要
大阪弁・広島弁を話す日本人男女による自然発話の2話者対話音声を収録。台本読み上げではなく自発的発話のため、方言特有のイントネーション・文末表現・語彙など実環境に近い音声的特徴を含みます。性別ラベル付きの話者情報により、属性別の音響モデル評価や多話者モデルの適応実験にも対応します。
[表1: https://prtimes.jp/data/corp/108024/table/169_1_147a4c622ba6e93cac7a3d290bf61a68.jpg?v=202605190615 ]
サンプルデータはこちら:https://qleandataset.visual-bank.co.jp/lineup/ds-098
■ よくある質問(FAQ)
Q. 方言音声データセットはどんなASR開発に使えますか?
A. Whisper・ESPnetなど標準語ベースで学習済みのASRモデルに対し、大阪弁・広島弁音声でWERを測定するロバスト性ベンチマーク、およびLoRAやfull fine-tuningによる方言適応に利用できます。
Q. LLM開発での活用シーンは?
A. 方言特有の文末詞・助詞・イントネーションを含む対話テキストを用いて、方言→標準語スタイル変換モデルの学習や、コンテキスト依存の意味解釈タスクの評価データとして利用できます。
Q. TTS(音声合成)への活用は可能ですか??
A. 大阪弁・広島弁の自然なプロソディを持つ音声データとして、VITS・StyleTTSなどへのファインチューニングに活用可能です。地域密着型ガイドロボットや対話エージェントの音声生成に実装できます。
Q. 大阪弁・広島弁以外の方言追加収録は対応していますか?
A. 特定地域・年齢層・シチュエーション限定の対話収集など、開発要件に応じたカスタムデータ収集に対応しています。
■ 「日本語・地域方言対話音声データセット」のユースケースイメージ
- ASRモデルのロバスト性ベンチマーク(大阪弁・広島弁音声データ)
標準語コーパスで学習したモデルが方言音声に対してどの程度の認識精度を維持できるかをWER・CERで定量評価。方言ASRの性能ギャップ計測に使用できます。
- 方言適応ファインチューニング
少量の方言音声データでASRモデルにドメイン適応をかけるfew-shot・LoRAファインチューニング用データとして活用。標準語コーパスとの混合比調整による汎化性能検証にも有効です。
- LLMの方言理解・スタイル変換
方言テキストを用いた感情分析・方言→標準語変換・談話構造解析など、LLMの方言理解精度向上のための学習・評価データとして利用できます。
- 地域特化TTS(大阪弁・広島弁 音声合成)の構築
自然なイントネーションとリズムを持つ方言音声データをTTSモデルにファインチューニングし、地域密着型サービスや対話キャラクターの音声生成エンジンを構築できます。
- コンタクトセンター向けドメイン適応STT
方言語彙が頻出する業務環境でのカスタム言語モデル構築や、Google STT・Amazon Transcribeのカスタムボキャブラリーと組み合わせた地域最適化STTエンジンの開発に活用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する権利クリア・商用利用可能なAI学習用データソリューションです。
音声・画像・動画・3D・テキストなど多様な形式に対応し、基盤モデル開発者をはじめとするAI開発者が、法的リスクなく高品質なデータを調達・活用できる環境を提供しています。
国内外のデータホルダーや、ラジオ・新聞社・通信社等のメディアとの協業により、業界特化・トレンド直結のデータラインナップ『AIデータレシピ』を随時追加中です。既存データは最短2営業日で納品し、その他カスタム収録・収集にも対応しています。
Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup
お問い合わせ
[画像2: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-c18be7e6bc1cf5c1c1ff16c582ccd685-1813x1116.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL:https://amanaimages.com/about/
Qlean Dataset Launches Japanese Regional Dialect Speech Dataset for ASR, LLM, and TTS Development
~ Commercially licensed corpus of Kansai and Hiroshima dialect conversational audio. Designed for ASR robustness benchmarking, dialect-adapted LLM training, and TTS fine-tuning. Released by Visual Bank, a GENIAC-selected AI company. ~
[画像3: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-21a14b64d59c6a8f6db503788752f32c-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank, Inc. (Minato, Tokyo; CEO: Masayuki Nagai), through its subsidiary amanaimages Inc., has released the Japanese Regional Dialect Conversational Speech Dataset under its AI training data solution Qlean Dataset.
■ What Is a Japanese Dialect Speech Dataset?
A speech corpus covering region-specific phonetics, accents, and vocabulary absent from standard Japanese (hyojungo) corpora. Used as ML data for ASR robustness benchmarking, LLM dialect comprehension, and region-specific TTS development. Part of the AI Data Recipe lineup; custom dialect recordings available on request.
■ Dataset Specifications
Two-speaker spontaneous conversational audio by male and female native speakers of Kansai (Osaka-ben) and Hiroshima dialects. Captures naturalistic intonation, sentence-final particles, and turn-taking patterns reflecting real-world spoken Japanese.
[表2: https://prtimes.jp/data/corp/108024/table/169_2_56564678f34875d77caff77be0be3d72.jpg?v=202605190615 ]
→ Sample data & full details: https://qleandataset.visual-bank.co.jp/en/lineup/ds-098
■ FAQ
Q: How can this dataset be used for ASR development?
Use it to measure WER on Kansai and Hiroshima dialect audio against standard-Japanese-trained models such as Whisper or ESPnet, quantifying the robustness gap. It also serves as fine-tuning data for dialect adaptation via LoRA or full fine-tuning.
Q: How does this dataset support LLM development?
Dialogue transcripts with dialect-specific sentence-final particles, particles, and intonation patterns can be used as training or evaluation data for dialect-to-standard-Japanese style transfer, context-dependent semantic interpretation, and discourse structure analysis.
Q: Can this data be used for TTS fine-tuning?
Yes. The naturalistic prosody of Kansai and Hiroshima dialects makes this corpus well-suited for fine-tuning models such as VITS or StyleTTS to generate region-specific speech for local service agents, guide robots, or dialogue characters.
Q: Is custom dialect recording available beyond Kansai and Hiroshima?
Yes. Qlean Dataset supports custom data collection for additional regional dialects, specific age groups, or targeted conversational scenarios based on your development requirements.
■ Use Cases
- ASR Robustness Benchmarking- Kansai & Hiroshima Dialect Audio Evaluate how well standard-Japanese ASR models handle regional speech variants using WER and CER metrics. Quantify the dialect performance gap before and after domain adaptation.
- Dialect Adaptation Fine-Tuning
Use as few-shot or LoRA fine-tuning data to adapt ASR models to regional Japanese. Experiment with standard/dialect corpus mixing ratios to optimize generalization without catastrophic forgetting.
- LLM Dialect Understanding & Style Transfer
Train and evaluate LLMs on dialect-to-standard-Japanese conversion, sentiment analysis of dialect text, and discourse structure tasks using authentic conversational transcripts.
- Region-Specific TTS - Kansai & Hiroshima Dialect Voice Synthesis
Fine-tune VITS, StyleTTS, or similar architectures on naturalistic dialect prosody to build voice synthesis engines for regional service applications or conversational AI characters.
- Domain-Adapted STT for Contact Centers
Build custom language models and lexicons for environments where regional Japanese is prevalent. Combine with custom vocabulary features in Google STT or Amazon Transcribe for region-optimized speech-to-text pipelines.
About Qlean Dataset
Qlean Dataset is a commercially licensed AI training data solution provided by amanaimages Inc., a wholly owned subsidiary of Visual Bank. All datasets are rights-cleared for commercial use, giving AI developers a legally secure environment to source and deploy high-quality training data.
The platform covers audio, image, video, 3D, and text modalities - serving foundation model developers and applied AI teams alike. Through partnerships with domestic and international data holders, broadcasters, newspapers, and newswire agencies, Qlean Dataset continuously expands its AI Data Recipe lineup of industry-specific, trend-driven datasets. Existing datasets ship within 2 business days; custom recording and data collection are also available on request.
URL:https://qleandataset.visual-bank.co.jp/en
URL:https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Contact
[画像4: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-bfca454fe9e14b9e4bbd310b7f60f5b8-1813x1116.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
About Visual Bank Inc.
Visual Bank Group is a technology company developing data infrastructure and AI solutions that support advanced AI development. The company operates THE PEN, an AI tool for manga creators, and its subsidiary, amanaimages Inc., provides commercial digital content and AI training data solutions, including Qlean Dataset. Visual Bank is also a selected participant in GENIAC, a Japanese government initiative supporting the advancement of next generation AI technologies.
CEO: Saneyuki Nagai
Website:https://visual-bank.co.jp/en
[画像1: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-f1c30346a7ea23fda8055aafc96a15da-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、「日本語・地域方言対話音声データセット」の提供を開始します。
■ 方言音声データセットとは
方言音声データセットとは、標準語コーパスではカバーできない地域固有の音声パターン・アクセント・語彙を含む音声コーパスです。ASRモデルの方言汎化性能検証、LLMの方言理解向上、地域特化TTSモデルの構築を目的とした機械学習データとして活用されます。カスタム収録・追加方言への対応も可能です。
■ 今回提供を開始する「日本語・地域方言対話音声データセット」の概要
大阪弁・広島弁を話す日本人男女による自然発話の2話者対話音声を収録。台本読み上げではなく自発的発話のため、方言特有のイントネーション・文末表現・語彙など実環境に近い音声的特徴を含みます。性別ラベル付きの話者情報により、属性別の音響モデル評価や多話者モデルの適応実験にも対応します。
[表1: https://prtimes.jp/data/corp/108024/table/169_1_147a4c622ba6e93cac7a3d290bf61a68.jpg?v=202605190615 ]
サンプルデータはこちら:https://qleandataset.visual-bank.co.jp/lineup/ds-098
■ よくある質問(FAQ)
Q. 方言音声データセットはどんなASR開発に使えますか?
A. Whisper・ESPnetなど標準語ベースで学習済みのASRモデルに対し、大阪弁・広島弁音声でWERを測定するロバスト性ベンチマーク、およびLoRAやfull fine-tuningによる方言適応に利用できます。
Q. LLM開発での活用シーンは?
A. 方言特有の文末詞・助詞・イントネーションを含む対話テキストを用いて、方言→標準語スタイル変換モデルの学習や、コンテキスト依存の意味解釈タスクの評価データとして利用できます。
Q. TTS(音声合成)への活用は可能ですか??
A. 大阪弁・広島弁の自然なプロソディを持つ音声データとして、VITS・StyleTTSなどへのファインチューニングに活用可能です。地域密着型ガイドロボットや対話エージェントの音声生成に実装できます。
Q. 大阪弁・広島弁以外の方言追加収録は対応していますか?
A. 特定地域・年齢層・シチュエーション限定の対話収集など、開発要件に応じたカスタムデータ収集に対応しています。
■ 「日本語・地域方言対話音声データセット」のユースケースイメージ
- ASRモデルのロバスト性ベンチマーク(大阪弁・広島弁音声データ)
標準語コーパスで学習したモデルが方言音声に対してどの程度の認識精度を維持できるかをWER・CERで定量評価。方言ASRの性能ギャップ計測に使用できます。
- 方言適応ファインチューニング
少量の方言音声データでASRモデルにドメイン適応をかけるfew-shot・LoRAファインチューニング用データとして活用。標準語コーパスとの混合比調整による汎化性能検証にも有効です。
- LLMの方言理解・スタイル変換
方言テキストを用いた感情分析・方言→標準語変換・談話構造解析など、LLMの方言理解精度向上のための学習・評価データとして利用できます。
- 地域特化TTS(大阪弁・広島弁 音声合成)の構築
自然なイントネーションとリズムを持つ方言音声データをTTSモデルにファインチューニングし、地域密着型サービスや対話キャラクターの音声生成エンジンを構築できます。
- コンタクトセンター向けドメイン適応STT
方言語彙が頻出する業務環境でのカスタム言語モデル構築や、Google STT・Amazon Transcribeのカスタムボキャブラリーと組み合わせた地域最適化STTエンジンの開発に活用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する権利クリア・商用利用可能なAI学習用データソリューションです。
音声・画像・動画・3D・テキストなど多様な形式に対応し、基盤モデル開発者をはじめとするAI開発者が、法的リスクなく高品質なデータを調達・活用できる環境を提供しています。
国内外のデータホルダーや、ラジオ・新聞社・通信社等のメディアとの協業により、業界特化・トレンド直結のデータラインナップ『AIデータレシピ』を随時追加中です。既存データは最短2営業日で納品し、その他カスタム収録・収集にも対応しています。
Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup
お問い合わせ
[画像2: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-c18be7e6bc1cf5c1c1ff16c582ccd685-1813x1116.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL:https://amanaimages.com/about/
Qlean Dataset Launches Japanese Regional Dialect Speech Dataset for ASR, LLM, and TTS Development
~ Commercially licensed corpus of Kansai and Hiroshima dialect conversational audio. Designed for ASR robustness benchmarking, dialect-adapted LLM training, and TTS fine-tuning. Released by Visual Bank, a GENIAC-selected AI company. ~
[画像3: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-21a14b64d59c6a8f6db503788752f32c-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank, Inc. (Minato, Tokyo; CEO: Masayuki Nagai), through its subsidiary amanaimages Inc., has released the Japanese Regional Dialect Conversational Speech Dataset under its AI training data solution Qlean Dataset.
■ What Is a Japanese Dialect Speech Dataset?
A speech corpus covering region-specific phonetics, accents, and vocabulary absent from standard Japanese (hyojungo) corpora. Used as ML data for ASR robustness benchmarking, LLM dialect comprehension, and region-specific TTS development. Part of the AI Data Recipe lineup; custom dialect recordings available on request.
■ Dataset Specifications
Two-speaker spontaneous conversational audio by male and female native speakers of Kansai (Osaka-ben) and Hiroshima dialects. Captures naturalistic intonation, sentence-final particles, and turn-taking patterns reflecting real-world spoken Japanese.
[表2: https://prtimes.jp/data/corp/108024/table/169_2_56564678f34875d77caff77be0be3d72.jpg?v=202605190615 ]
→ Sample data & full details: https://qleandataset.visual-bank.co.jp/en/lineup/ds-098
■ FAQ
Q: How can this dataset be used for ASR development?
Use it to measure WER on Kansai and Hiroshima dialect audio against standard-Japanese-trained models such as Whisper or ESPnet, quantifying the robustness gap. It also serves as fine-tuning data for dialect adaptation via LoRA or full fine-tuning.
Q: How does this dataset support LLM development?
Dialogue transcripts with dialect-specific sentence-final particles, particles, and intonation patterns can be used as training or evaluation data for dialect-to-standard-Japanese style transfer, context-dependent semantic interpretation, and discourse structure analysis.
Q: Can this data be used for TTS fine-tuning?
Yes. The naturalistic prosody of Kansai and Hiroshima dialects makes this corpus well-suited for fine-tuning models such as VITS or StyleTTS to generate region-specific speech for local service agents, guide robots, or dialogue characters.
Q: Is custom dialect recording available beyond Kansai and Hiroshima?
Yes. Qlean Dataset supports custom data collection for additional regional dialects, specific age groups, or targeted conversational scenarios based on your development requirements.
■ Use Cases
- ASR Robustness Benchmarking- Kansai & Hiroshima Dialect Audio Evaluate how well standard-Japanese ASR models handle regional speech variants using WER and CER metrics. Quantify the dialect performance gap before and after domain adaptation.
- Dialect Adaptation Fine-Tuning
Use as few-shot or LoRA fine-tuning data to adapt ASR models to regional Japanese. Experiment with standard/dialect corpus mixing ratios to optimize generalization without catastrophic forgetting.
- LLM Dialect Understanding & Style Transfer
Train and evaluate LLMs on dialect-to-standard-Japanese conversion, sentiment analysis of dialect text, and discourse structure tasks using authentic conversational transcripts.
- Region-Specific TTS - Kansai & Hiroshima Dialect Voice Synthesis
Fine-tune VITS, StyleTTS, or similar architectures on naturalistic dialect prosody to build voice synthesis engines for regional service applications or conversational AI characters.
- Domain-Adapted STT for Contact Centers
Build custom language models and lexicons for environments where regional Japanese is prevalent. Combine with custom vocabulary features in Google STT or Amazon Transcribe for region-optimized speech-to-text pipelines.
About Qlean Dataset
Qlean Dataset is a commercially licensed AI training data solution provided by amanaimages Inc., a wholly owned subsidiary of Visual Bank. All datasets are rights-cleared for commercial use, giving AI developers a legally secure environment to source and deploy high-quality training data.
The platform covers audio, image, video, 3D, and text modalities - serving foundation model developers and applied AI teams alike. Through partnerships with domestic and international data holders, broadcasters, newspapers, and newswire agencies, Qlean Dataset continuously expands its AI Data Recipe lineup of industry-specific, trend-driven datasets. Existing datasets ship within 2 business days; custom recording and data collection are also available on request.
URL:https://qleandataset.visual-bank.co.jp/en
URL:https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Contact
[画像4: https://prcdn.freetls.fastly.net/release_image/108024/169/108024-169-bfca454fe9e14b9e4bbd310b7f60f5b8-1813x1116.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
About Visual Bank Inc.
Visual Bank Group is a technology company developing data infrastructure and AI solutions that support advanced AI development. The company operates THE PEN, an AI tool for manga creators, and its subsidiary, amanaimages Inc., provides commercial digital content and AI training data solutions, including Qlean Dataset. Visual Bank is also a selected participant in GENIAC, a Japanese government initiative supporting the advancement of next generation AI technologies.
CEO: Saneyuki Nagai
Website:https://visual-bank.co.jp/en









SEO関連




