> HOME > データ一覧 > 音声コーパス

音声コーパス

国立情報学研究所に設置された音声資源コンソーシアムがさまざまな機関やグループから受け入れて研究者に提供している音声のデータセットです。

2017/03/14 現在

データの概要

各音声コーパスの内容については音声資源コンソーシアムのページをご参照下さい。

提供対象者・利用目的

  • コーパスは,主に大学および公的研究機関の研究者を対象として,研究目的での利用に限り提供致します(研究目的利用であれば民間企業の研究所等でも提供可能です)。利用の可否をお知りになりたい方は下記「問い合わせ窓口」までお問い合わせ下さい。
  • 利用申請は研究室(大学以外の場合は研究室に相当するグループ)を単位としてご提供致します。研究室の代表者に当たる方からご申請いただくようお願い致します。

データ提供方法

データはIDR事務局より,原則としてWebサーバからのダウンロードにより提供します。技術的な理由によりダウンロードができない場合は代替のメディアも考慮しますのでご相談下さい。

メーリングリストについて

音声コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内を目的として,利用者のメーリングリストを作成しております。申請時に入力されたメールアドレスを登録させていただきますので予めご承知置き下さい。登録済みアドレスの変更や追加登録をご希望の場合は,IDR事務局までメールでご連絡下さい。

研究成果の収集について ― 研究成果の収集にご協力下さい

利用誓約書に従い,本コーパスの使用状況の報告が必要です。また国立情報学研究所は情報学研究の推進を目的として各種データセットを提供していますが,このサービスを継続するためにもその効果のエビデンスを示す必要があります。

そこで,年に1回程度,本コーパスを使用して得た研究成果の提出のお願いをメーリングリストに配信させていただきます。コーパスの継続利用の確認,所属や利用者等の変更の確認も目的としておりますので,研究成果がない場合でも必ず提出をお願い致します。

お申し込み

ご利用に際しては,コーパスごとに定められた利用誓約書の内容に同意いただく必要がございます。下記よりご希望のコーパス名をクリックすると当該コーパスの利用申請ページに移りますので,そちらからお申し込み下さい。

※現在,試行的に新規公開の「27. 近畿大 児童の単語音声データベース (JWC)」のみこちらから配布しています。平成29年度以降,無償コーパスについては全コーパスについてオンライン配布に移行する予定です。それまでの間は従来通り音声資源コンソーシアムのページからメールにてDVD版の利用申請をお願い致します。

<無償コーパス>

  1. 重点領域研究「音声言語」・試験研究「音声DB」 連続音声データベース (PASL-DSR)
  2. 筑波大 多言語音声コーパス (UT-ML)
  3. 東北大‐松下 単語音声データベース (TMW)
  4. 基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD)
  5. RWCP 音声データベース
    1. 音声対話データベース 96年版 (RWCP-SP96)
    2. 音声対話データベース 97年版 (RWCP-SP97)
    3. 検索・要約用ニュース音声データベース (RWCP-SP99)
    4. 会議音声データベース (RWCP-SP01)
  6. RWCP 実環境音声・音響データベース (RWCP-SSD)
  7. 重点領域研究「音声対話」 対話音声コーパス (PASD)
  8. CIAIR 子供の声データベース (CIAIR-VCV)
  9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
    1. 雑音重畳日本語連続数字 音声認識評価環境 (CENSREC-1 ⟨AURORA-2J⟩)
    2. 雑音下日本語連続数字 音声区間検出評価環境 (CENSREC-1-C)
    3. マルチモーダル音声認識評価環境 (CENSREC-1-AV)
    4. 実環境車内 日本語連続数字 音声認識評価環境 (CENSREC-2)
    5. 実環境車内 日本語単語 音声認識評価環境 (CENSREC-3)
    6. 残響下日本語連続数字 音声認識評価環境 (CENSREC-4)
  10. 特定領域研究「メディア教育利用」音声データベース (UME)
    1. 日本人学生による読み上げ英語音声データベース (UME-ERJ)
    2. 留学生による読み上げ日本語音声データベース (UME-JRF)
  11. 理研ワープロ操作対話音声コーパス (RIKEN-DLG)
  12. 千葉大 日本語地図課題対話コーパス (MapTask)
  13. 宇都宮大学 パラ言語情報研究向け音声対話データベース (UUDB)
  14. 電総研 単語音声データベース (ETL-WD)
  15. 鶴岡調査音声データベース91-92 (Tsuruoka91-92)
  16. 音声研究用X線フィルムデータベース (X-Ray)
  17. 特定領域研究「韻律と音声処理」日本語MULTEXT韻律コーパス (MULTEXT-J)
  18. 中国語MULTEXTコーパス (MULTEXT-C)
  19. 慶應義塾大学 研究用感情音声データベース (Keio-ESD)
  20. 身体情報付き男・女・子どもの母音音声データベース (JVPD)
  21. 東工大 多言語音声コーパス (TITML)
    1. インドネシア語 (TITML-IDN)
    2. アイスランド語 (TITML-ISL)
  22. AWA長期間収録音声コーパス (AWA-LTR)
  23. 南琉球新城方言音声データベース (Aragusuku)
  24. 宮古大神島方言音声データベース (Oogami)
  25. 感情評定値付きオンラインゲーム音声チャットコーパス (OGVC)
  26. 千葉大学 3人会話コーパス (Chiba3Party)
  27. 近畿大 児童の単語音声データベース (JWC) 2017-03-14 NEW!!

<有償コーパス>

  1. 日本音響学会 新聞記事読み上げ音声コーパス (JNAS)
  2. 新聞記事読み上げ高齢者音声コーパス (S-JNAS)
  3. 日本音響学会 研究用連続音声データベース (ASJ-JIPDEC)
  4. NTT・東北大 親密度別単語了解度試験用音声データセット (FW03)
  5. NTT・東北大 親密度別単語了解度試験用音声データセット2007 (FW07)
  6. NTT 乳幼児音声データベース (INFANT)

<取り次ぎ>

  1. 電子協 日本語共通音声データ (JEIDA-JCSD)
  2. 電子協 騒音データベース (JEIDA-NOISE)

問い合わせ窓口(IDR事務局)

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール:idr-speech [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。