ニュース / News
NII情報
「日本語声質表現文音声ペアコーパス(Coco-Nut)」提供開始
国立情報学研究所 音声資源コンソーシアム(NII-SRC)では、東京大学の渡邊亞椰氏、高道慎之介講師を中心に構築された「日本語声質表現文音声ペアコーパス(Coco-Nut)」の提供を開始しました。
本コーパスは、音声合成時の自由記述文による声質制御に向けて、7,330の日本語発話(延べ約8時間)に対し、それらの声質を自由記述によりアノテーションしたテキストデータからなります。
音声データは、ウェブより収集したものの中から、音質等を考慮して1コンテンツあたり1~数発話(1発話は10秒以内)を抽出したものです。
声質表現文は、複数のクラウドワーカが音声を聴取して作文したもので、1発話あたり1~5件付与されています。
なお声質表現文は作成者のGitHubサイトより公開されており、NII-SRCからは音声データとその書き起こし文を提供します。
情報学研究データリポジトリ(IDR)のサイトの「音声コーパス」よりオンライン申請にて入手可能です。提供は無償で、利用は研究目的に限ります。
- コーパスの内容や利用条件等の詳細については以下をご覧ください。
- 音声資源コンソーシアム(SRC)
- オンライン申請については以下をご覧ください。
- 情報学研究データリポジトリ(IDR)
- その他提供中の音声コーパスについては下記のページをご参照ください。
- 国立情報学研究所 音声資源コンソーシアム(SRC)
- 2019年より、無償のコーパスについてはIDRのサイトよりオンラインにてご提供しております。詳細は下記のページをご参照ください。
- 国立情報学研究所 情報学研究データリポジトリ(IDR) -音声コーパス

NII Today No.106
NIIサービスニュース
国立情報学研究所 2025年度 概要
SINET広報サイト
ウェブサイト「軽井沢土曜懇話会アーカイブス」を公開
SINETStream 事例紹介:トレーラー型動物施設 [徳島大学 バイオイノベーション研究所]
情報研シリーズ これからの「ソフトウェアづくり」との向き合い方
学術研究プラットフォーム紹介動画
教育機関DXシンポ
高等教育機関におけるセキュリティポリシー