> HOME > データ一覧 > 音声コーパス

音声コーパス

国立情報学研究所に設置された音声資源コンソーシアムがさまざまな機関やグループから受け入れて研究者に提供している音声コーパスです。(当面の間,提供は音声資源コンソーシアムからとなります。)

2012/03/30 現在

音声資源コンソーシアムから提供中のコーパス

各コーパスの詳細は音声コーパスリストをご参照下さい。入手手続きについては利用登録をご覧下さい。


<無償コーパス>

  1. 重点領域研究「音声言語」・試験研究「音声DB」 連続音声データベース (PASL-DSR)
  2. 筑波大 多言語音声コーパス (UT-ML)
  3. 東北大‐松下 単語音声データベース (TMW)
  4. 基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD)
  5. RWCP 音声データベース
    1. RWCP-SP96 音声対話データベース(96年版)
    2. RWCP-SP97 音声対話データベース(97年版)
    3. RWCP-SP99 検索・要約用ニュース音声データベース
    4. RWCP-SP01 会議音声データベース
  6. RWCP 実環境音声・音響データベース (RWCP-SSD)
  7. 重点領域研究「音声対話」 対話音声コーパス (PASD)
  8. CIAIR 子供の声データベース (CIAIR-VCV)
  9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
    1. CENSREC-1 (AURORA-2J) 雑音重畳日本語連続数字 音声認識評価環境
    2. CENSREC-1-C 雑音下日本語連続数字 音声区間検出評価環境
    3. CENSREC-1-AV マルチモーダル音声認識評価環境
    4. CENSREC-2  実環境車内 日本語連続数字 音声認識評価環境
    5. CENSREC-3  実環境車内 日本語単語 音声認識評価環境
    6. CENSREC-4  残響下日本語連続数字 音声認識評価環境
  10. 特定領域研究「メディア教育利用」音声データベース (UME)
    1. UME-ERJ 日本人学生による読み上げ英語音声データベース
    2. UME-JRF 留学生による読み上げ日本語音声データベース
  11. 理研ワープロ操作対話音声コーパス (RIKEN-DLG)
  12. 千葉大 日本語地図課題対話コーパス (MapTask)
  13. 宇都宮大学 パラ言語情報研究向け音声対話データベース (UUDB)
  14. 電総研 単語音声データベース (ETL-WD)
  15. 鶴岡調査音声データベース91-92 (Tsuruoka91-92)
  16. 音声研究用X線フィルムデータベース (X-Ray)
  17. 特定領域研究「韻律と音声処理」日本語MULTEXT韻律コーパス (MULTEXT-J)
  18. 中国語MULTEXTコーパス (MULTEXT-C)
  19. 慶應義塾大学 研究用感情音声データベース (Keio-ESD)
  20. 身体情報付き男・女・子どもの母音音声データベース (JVPD)
  21. 東工大 多言語音声コーパス-インドネシア語 (TITML-IDN)

<有償コーパス>

  1. 日本音響学会 新聞記事読み上げ音声コーパス (JNAS)
  2. 新聞記事読み上げ高齢者音声コーパス (S-JNAS)
  3. 日本音響学会 研究用連続音声データベース (ASJ-JIPDEC)
  4. NTT・東北大 親密度別単語了解度試験用音声データセット (FW03)
  5. NTT・東北大 親密度別単語了解度試験用音声データセット2007 (FW07)
  6. NTT 乳幼児音声データベース (INFANT)

<取り次ぎ>

  1. 電子協 日本語共通音声データ (JEIDA-JCSD)
  2. 電子協 騒音データベース (JEIDA-NOISE)