ニュース / News

NII情報

「日本語声質表現文音声ペアコーパス(Coco-Nut)」提供開始

国立情報学研究所 音声資源コンソーシアム(NII-SRC)では、東京大学の渡邊亞椰氏、高道慎之介講師を中心に構築された「日本語声質表現文音声ペアコーパス(Coco-Nut)」の提供を開始しました。

本コーパスは、音声合成時の自由記述文による声質制御に向けて、7,330の日本語発話(延べ約8時間)に対し、それらの声質を自由記述によりアノテーションしたテキストデータからなります。

音声データは、ウェブより収集したものの中から、音質等を考慮して1コンテンツあたり1~数発話(1発話は10秒以内)を抽出したものです。
声質表現文は、複数のクラウドワーカが音声を聴取して作文したもので、1発話あたり1~5件付与されています。

なお声質表現文は作成者のGitHubサイトより公開されており、NII-SRCからは音声データとその書き起こし文を提供します。

情報学研究データリポジトリ(IDR)のサイトの「音声コーパス」よりオンライン申請にて入手可能です。提供は無償で、利用は研究目的に限ります。


6067

注目コンテンツ / SPECIAL