> HOME > データ一覧 > 音声コーパス > Coco-Nut

34. 日本語声質表現文音声ペアコーパス (Coco-Nut)

2026/03/16 更新

概要

データDOI

https://doi.org/10.32130/src.Coco-Nut

提供機関, プロジェクト

渡邊亞椰氏,高道慎之介先生(提供当時:東京大学)

コーパスの内容

音声合成時の自由記述文による声質制御に向けて,7,330の日本語発話(延べ約8時間)に対し,それらの声質を自由記述によりアノテーションしたもの。

音声データは,YouTubeより24kHzのmp3ファイルとして収集したものの中から,音質等を考慮して1コンテンツあたり1~数発話(1発話は10秒以内)を抽出し,44.1kHzのwavファイルに加工している。

声質表現文は複数のクラウドワーカが音声を聴取して作文しており,学習セットでは1発話あたり1件以上,検証および評価セットでは1発話あたり5件付与されている。

なお声質表現文は作成者のGitHubサイトより公開されており,NII-SRCからは音声データとその書き起こし文を提供する。

話者数

延べ7,330名

音声ファイルフォーマット

WAV形式(44.1kHz・16bit・Stereo)

利用範囲

研究目的に限る

配布価格

無償

詳細情報

https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus

サンプル音声

更新情報

  • 配布を開始しました。(2023/10/31)

お申し込み

本コーパスの申込み方法は次の通りです。ご利用に際しては,利用誓約書の内容に同意いただく必要がございます。また提供の条件等について,こちら(全コーパス共通)を事前に必ずご確認ください。

  1. フォームに機関名,責任者,使用目的等の必要事項を入力してください。(※全項目必須入力)
    注: ご入力いただいた情報は本コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。
  2. 以下の「音声コーパスの利用に関する誓約書」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
  3. 入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
  4. 申請内容についてIDR事務局にて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
  5. 審査が完了しましたら,「責任者メールアドレス」宛てにコーパスへのアクセス情報をご連絡いたします。


音声コーパスの利用に関する誓約書

大学共同利用機関法人 情報・システム研究機構 殿

私は、大学共同利用機関法人 情報・システム研究機構(以下「甲」という。)の研究機関である国立情報学研究所より、このたび提供を受けた次に示す音声コーパス(以下「本コーパス」という。)の利用に際し、下記の事項を遵守することを誓約いたします。

音声コーパスの名称 : 日本語声質表現文音声ペアコーパス (Coco-Nut)

代表著作権者 : 高道 慎之介

  1. 本コーパスの利用者の範囲は、利用者欄に記載した者、または利用者の所属する課または研究室に限定します。
  2. 本コーパスは、研究目的にのみ利用します。
  3. 本コーパス及びその複製物、または改変物を第三者に提供しません。
  4. 本コーパスを利用して得られた研究成果(報告書、出版物、派生ソフトウェア等)を公表する場合には、音声資料として上記「音声コーパスの名称」を明記し、甲の要請に応じてその写しを提供します。
  5. 前項の研究成果の公表を含む全ての開示に、発声者個人を識別できる情報を含むことはしません。
  6. 本コーパスが、第三者の知的財産権その他の財産権を侵害しないものであることを保証するものではなく、また本コーパスの利用によって生じた損害等についても、利用者において一切解決し、甲および本コーパスの著作権者に対して責任を問わないことを承諾します。
  7. 利用者の所属する課または研究室に変更が生じた場合は、遅滞なくこれを甲に報告し、甲の要請があれば改めて誓約書を提出します。
  8. 本コーパスを利用した研究活動に関する報告書を甲の要請に応じて提出します。
  9. 甲または代表著作権者から本コーパスの利用中止の要請を受けた場合、利用者自ら利用を中止した場合または利用者において本誓約書に違反する行為があった場合、本コーパスの利用は終了し、利用者は、本コーパスのデータを消去し、甲に対し消去した旨を通知します。
  10. 本誓約書の内容について変更が生じた場合、変更を含めた当該誓約書の遵守に努めます。
  11. 本誓約書に記載のない事項が生じた場合は、甲と誠意をもって協議し、問題の解決に努めます。

 

「IDRデータセット提供サービス規約」も必ず事前にご確認ください。

* 全項目必須入力

住所*

大学または会社名*

研究室または部署名*

責任者名*

※上記の研究室または部署(グループ)の責任者もしくはコーパスの管理責任者(常勤職員相当の方)
 を入力してください(学生不可)

責任者職名*

責任者メールアドレス*

※原則として所属機関発行の個人のアドレスを入力してください
 コーパスご提供後,利用者のメーリングリストへ登録させていただきます

使用目的*
(最大256文字)

例:「音声認識システムの性能評価」「方言のアクセント研究」 など

 

利用誓約書およびサービス規約の内容を確認し,同意の上,利用を申請します。

※入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りします。
 メールの内容をご確認の上,24時間以内に「確定」の処理をお願いいたします。