9-e. 実環境車内 日本語単語 音声認識評価環境 (CENSREC-3)
2026/03/16 更新
概要
データDOI
https://doi.org/10.32130/src.CENSREC-3
提供機関, プロジェクト
(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ
コーパスの内容
CENSREC-2と同じ実験車両で収録した単語および音素バランス文の音声データ
- 学習データ: ATR音素バランス503文
- 走行速度はアイドリングと低速走行,車内環境は通常走行のみ
- マイク種別 : 接話マイク
※遠隔マイク(バイザーマイク)収録のデータを (公財)名古屋産業科学研究所 中部TLO より購入可
- テストデータ: 「交通情報」「東京都」「ホテル一覧」など単語 50種類
- 下記の走行速度と車内環境を組み合わせた16種類の環境で収録
- — 走行速度 3種類 :
- アイドリング,低速(市街地)走行,高速走行
- — 車内環境 6種類 :
- 通常走行,ハザードOn,エアコン(Low),エアコン(High),
オーディオOn,窓開 - マイク 2種類 : 接話マイク,遠隔マイク(バイザーマイク)
上記音声データを対象とした音声認識実験を評価するための評価ツール
話者数, 発声回数
- 学習データ:
- 293名(男性 202名,女性 91名),各マイク 計 14,050発話
- テストデータ:
- 18名(男性 8名,女性 10名),各マイク 計 14,216発話
音声ファイルフォーマット
RAW形式(16kHz・16bit・Mono・LittleEndian)
利用範囲
研究・開発目的に限る
配布価格
無償
補足情報
学習データのうち,遠隔マイク(バイザーマイク)で収録されたデータは,名古屋大学統合音響情報研究拠点CIAIRで構築されたデータベースの一部であるため,そのデータを使用する場合には別途 (公財)名古屋産業科学研究所 中部TLO からの購入が必要です(大学関係 : 21,600円,企業 : 108,000円)。
ベースライン評価を行なうためには,この有償データが必要になりますのであらかじめご了承下さい。
有償データの入手もご希望の場合は,中部TLOへ取り次ぎしますので,CENSREC-3の利用申請時にお知らせ下さい。(2017/07/21 更新)
サンプル音声
CENSREC-2と同じ実験車両で収録した単語データ
| 接話マイク | 遠隔マイク | |
|---|---|---|
| 低速走行 | ♫ | ♫ |
| 高速走行 | ♫ | ♫ |
| アイドリング | ♫ | ♫ |
更新情報
- 提供を開始しました。(2006/10/31)
- 有償分データの案内を更新しました。(2017/07/21)
- オンラインでの配布を開始しました。(2019/03/18)
お申し込み
本コーパスの申込み方法は次の通りです。ご利用に際しては,利用誓約書の内容に同意いただく必要がございます。また提供の条件等について,こちら(全コーパス共通)を事前に必ずご確認ください。
- フォームに機関名,責任者,使用目的等の必要事項を入力してください。(※全項目必須入力)
注: ご入力いただいた情報は本コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。- 以下の「音声コーパスの利用に関する誓約書」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
- 入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
- 申請内容についてIDR事務局にて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
- 審査が完了しましたら,「責任者メールアドレス」宛てにコーパスへのアクセス情報をご連絡いたします。
音声コーパスの利用に関する誓約書
大学共同利用機関法人 情報・システム研究機構 殿
私は、大学共同利用機関法人 情報・システム研究機構(以下「甲」という。)の研究機関である国立情報学研究所より、このたび提供を受けた次に示す音声コーパス(以下「本コーパス」という。)の利用に際し、下記の事項を遵守することを誓約いたします。
音声コーパスの名称 :
(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ
実環境車内 日本語単語 音声認識評価環境 (CENSREC-3)音声コーパスの内容 :
- 複数の話者により読み上げられた単語音声データを、(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ(以下「WG」という。)が収録・加工したデータ、そのテキスト情報、および名古屋大学統合音響情報研究拠点で収録された音素バランス文読み上げ音声データからなるデータ群
- 上記音声データを対象とした音声認識実験を評価するためにWGによって準備された評価ツール群
- 上記データ群および評価ツール群について述べたドキュメント類
代表著作権者 : 中村 哲
記
- 本コーパスの利用者の範囲は、利用者欄に記載した者、または利用者の所属する課または研究室に限定します。
- 本コーパスは、研究・開発目的にのみ利用します。
- 本コーパスのデータを製品に組込む場合には、事前に甲および代表著作権者の了解をとります。
- 本コーパス及びその複製物、または改変物を第三者に提供しません。
- 本コーパスを利用して得られた研究成果(報告書、出版物、派生ソフトウェア等)を公表する場合には、音声資料として上記「音声コーパスの名称」を明記し、甲の要請に応じてその写しを提供します。
- 前項の研究成果の公表を含む全ての開示に、発声者個人を識別できる情報を含むことはしません。
- 本コーパスが、第三者の知的財産権その他の財産権を侵害しないものであることを保証するものではなく、また本コーパスの利用によって生じた損害等についても、利用者において一切解決し、甲および本コーパスの著作権者に対して責任を問わないことを承諾します。
- 利用者の所属する課または研究室に変更が生じた場合は、遅滞なくこれを甲に報告し、甲の要請があれば改めて誓約書を提出します。
- 本コーパスを利用した研究活動に関する報告書を甲の要請に応じて提出します。
- 甲または代表著作権者から本コーパスの利用中止の要請を受けた場合、利用者自ら利用を中止した場合または利用者において本誓約書に違反する行為があった場合、本コーパスの利用は終了し、利用者は、本コーパスのデータを消去し、甲に対し消去した旨を通知します。
- 本誓約書の内容について変更が生じた場合、変更を含めた当該誓約書の遵守に努めます。
- 本誓約書に記載のない事項が生じた場合は、甲と誠意をもって協議し、問題の解決に努めます。
※「IDRデータセット提供サービス規約」も必ず事前にご確認ください。
* 全項目必須入力