音声コーパス
国立情報学研究所に設置された音声資源コンソーシアム(NII-SRC)がさまざまな機関やグループから受け入れて研究者に提供している音声のデータセットです。
2024/02/28 現在
データの概要
各音声コーパスの内容については音声資源コンソーシアムのページをご参照ください。
更新情報
- 「広島市立大学 感情音声コーパス (HCUDB)」の配布を開始しました。(2024/02/28) NEW!!
- 「超高齢者音声コーパス (EARS)」の配布を開始しました。(2023/11/30)
- 「日本語声質表現文音声ペアコーパス (Coco-Nut)」の配布を開始しました。(2023/10/31)
- 「高齢女性二者間初対面会話テキストコーパス (TDU-Kao)」の配布を開始しました。(2023/05/02)
- 「日本語共感的音声対話コーパス (STUDIES)」にデータを追加しました。(2023/03/24)
- 「神戸大 日中対照調音動態MRI動画コーパス (KUJC-MRI)」の配布を開始しました。(2023/02/14)
- 「リアルタイムMRI調音運動データベース 第1版 (rtMRIDB)」の配布を開始しました。(2022/09/22)
- 「日本語共感的音声対話コーパス (STUDIES)」の配布を開始しました。(2022/03/29)
- 「日本語多話者オーディオブックコーパス (J-MAC)」の配布を開始しました。(2021/07/12)
- 「日本語単一話者オーディオブック・紙芝居朗読音声コーパス (J-KAC)」の配布を開始しました。(2021/06/17)
- 「三重大 日本語地図課題対話コーパス (MapTask-Mie)」の配布を開始しました。(2020/03/10)
- 無償の全コーパスについてオンライン配布を開始しました。(2019/03/18)
- 「近畿大 児童の単語音声データベース (JWC)」の配布を開始しました。(2017/03/14)
利用目的・提供対象者
- コーパスの利用目的は研究に限ります。
- 提供対象者は主に大学および公的研究機関の研究者としますが,研究内容によっては民間企業等の研究者にも提供可能です。利用の可否をお知りになりたい場合は末尾の「問い合わせ窓口」までお問い合わせください。
- 原則として,提供の単位は研究室(大学以外の場合は研究室に相当するグループ)としますので,利用申請は研究室を代表する方が行ってください。
データ提供方法
データはIDR事務局より,原則としてWebサーバからのダウンロードにより提供します。技術的な理由によりダウンロードができない場合は,従来通り音声資源コンソーシアムのページからメールにてCD/DVD版の利用申請をお願いします。
メーリングリストについて
音声コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内を目的として,利用者のメーリングリストを作成しています。申請時に入力されたメールアドレスを登録しますのでご了承ください。登録済みアドレスの変更や追加登録をご希望の場合は,末尾の「問い合わせ窓口」までメールでご連絡ください。
利用報告について
利用誓約書に従い,毎年度,コーパスを使用した研究活動について報告書と発表文献のコピーの提出をお願いします。毎年3月頃に上記メーリングリストに提出方法等の案内を配信します。
この報告は,コーパスについて利用者の使用状況を把握するだけでなく,IDR/SRCの活動を継続するためのエビデンスとしても重要なものですので,提出にご協力ください。
利用申請
利用に際しては,コーパスごとに定められた利用誓約書の内容にご同意いただきます。下記よりご希望のコーパス名をクリックすると当該コーパスの利用申請ページに移りますので,そちらからお申し込みください。
<無償コーパス>
- 重点領域研究「音声言語」・試験研究「音声DB」 連続音声データベース (PASL-DSR)
- 筑波大 多言語音声コーパス (UT-ML)
- 東北大‐松下 単語音声データベース (TMW)
- 基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD)
- RWCP 音声データベース
- RWCP 実環境音声・音響データベース (RWCP-SSD)
- 重点領域研究「音声対話」 対話音声コーパス (PASD)
- CIAIR 子供の声データベース (CIAIR-VCV)
- IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
- 特定領域研究「メディア教育利用」音声データベース (UME)
- 理研ワープロ操作対話音声コーパス (RIKEN-DLG)
- 地図課題対話コーパス
- 宇都宮大学 パラ言語情報研究向け音声対話データベース (UUDB)
- 電総研 単語音声データベース (ETL-WD)
- 鶴岡調査音声データベース91-92 (Tsuruoka91-92)
- 音声研究用X線フィルムデータベース (X-Ray)
- 特定領域研究「韻律と音声処理」日本語MULTEXT韻律コーパス (MULTEXT-J)
- 中国語MULTEXTコーパス (MULTEXT-C)
- 慶應義塾大学 研究用感情音声データベース (Keio-ESD)
- 身体情報付き男・女・子どもの母音音声データベース (JVPD)
- 東工大 多言語音声コーパス (TITML)
- AWA長期間収録音声コーパス (AWA-LTR)
- 南琉球新城方言音声データベース (Aragusuku)
- 宮古大神島方言音声データベース (Oogami)
- 感情評定値付きオンラインゲーム音声チャットコーパス (OGVC)
- 千葉大学 3人会話コーパス (Chiba3Party)
- 近畿大 児童の単語音声データベース (JWC)
- 日本語単一話者オーディオブック・紙芝居朗読音声コーパス (J-KAC)
- 日本語多話者オーディオブックコーパス (J-MAC)
- 日本語共感的音声対話コーパス (STUDIES)
- リアルタイムMRI調音運動データベース 第1版 (rtMRIDB)
- 神戸大 日中対照調音動態MRI動画コーパス (KUJC-MRI)
- 高齢女性二者間初対面会話テキストコーパス (TDU-Kao)
- 日本語声質表現文音声ペアコーパス (Coco-Nut)
- 超高齢者音声コーパス (EARS)
- 広島市立大学 感情音声コーパス (HCUDB) -NEW!!
※有償コーパスと取り次ぎのコーパスについては,DVD等のメディアで納品しますので,従来通り
音声資源コンソーシアムのページからメールにて利用申請してください。
<有償コーパス>
- 日本音響学会 新聞記事読み上げ音声コーパス (JNAS)
- 新聞記事読み上げ高齢者音声コーパス (S-JNAS)
- 日本音響学会 研究用連続音声データベース (ASJ-JIPDEC)
- NTT・東北大 親密度別単語了解度試験用音声データセット (FW03)
- NTT・東北大 親密度別単語了解度試験用音声データセット2007 (FW07)
- NTT 乳幼児音声データベース (INFANT)
<取り次ぎ>
- 電子協 日本語共通音声データ (JEIDA-JCSD)
- 電子協 騒音データベース (JEIDA-NOISE)
問い合わせ窓口(IDR事務局)
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局(音声コーパス担当)
電話: 03-4212-2009
電子メール:idr-speech [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。