> HOME > データ一覧 > 音声コーパス > RIKEN-DLG

11. 理研ワープロ操作対話音声コーパス (RIKEN-DLG)

2026/03/16 更新

概要

データDOI

https://doi.org/10.32130/src.RIKEN-DLG

提供機関, プロジェクト

理化学研究所脳科学総合研究センター 言語知能システム研究チーム

コーパスの内容

a. 文書作成依頼対話

  • ワープロ操作の専門家がユーザの希望を聞きながらコンピュータを用いて文書作成を行う。(ユーザ ⇔ 秘書 ⇔ オペレーター ⇔ 専門家の対話)
  • 文書作成画面を録画したビデオを見ながら,専門家が自分の作業について説明する。(専門家の独話)

b. 質問応答対話

  • ユーザが自ら文書を作成しながら,ワープロ操作方法について専門家に質問をする対話。(ユーザ ⇔ 専門家の対話)

Vol.1~3 : 音声データ,書き起こしテキスト,形態素タグ付きデータベース

Vol.4 : 書き起こしテキスト,形態素タグ付きデータベース 注1

話者数, 発声回数

Vol.1 : 文書作成依頼対話(9対話,9独話)1対話あたり最長2時間

Vol.2 : 質問応答対話 2002-1 (18対話)1対話あたり最長1時間

Vol.3 : 質問応答対話 2002-2(18対話)1対話あたり最長1時間

Vol.4 : 質問応答対話 2001 (15対話)1対話あたり最長2時間 注1

のべ129名

音声ファイルフォーマット

RAW形式(16kHz・16bit・Stereo・LittleEndian)注2

利用範囲

研究目的に限る

配布価格

無償

補足情報

注1:Vol.4に音声データは含まれません。

注2:Vol.1の独話の一部は「32kHz・16bit・Mono」で録音されています。

収録年度により,録音レベルにばらつきがあります。

ファイル毎のサンプリング周波数,チャンネル数,録音状態の情報一覧をVol.1に格納しています。

サンプル音声

0238 R:
でここで画像をどうやって置けばいいのかわからなくて
0239 R:
えっと
0240 R:
操作方法がわからなくていろいろと悪戦苦闘
0241 R:
えしてるわけなんですけれども
0242 R:
えっとその前にサンタがぼつになったんですね

更新情報

  • 提供を開始しました。(2007/09/05)
  • オンラインでの配布を開始しました。(2019/03/18)

お申し込み

本コーパスの申込み方法は次の通りです。ご利用に際しては,利用誓約書の内容に同意いただく必要がございます。また提供の条件等について,こちら(全コーパス共通)を事前に必ずご確認ください。

  1. フォームに機関名,責任者,使用目的等の必要事項を入力してください。(※全項目必須入力)
    注: ご入力いただいた情報は本コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。
  2. 以下の「音声コーパスの利用に関する誓約書」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
  3. 入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
  4. 申請内容についてIDR事務局にて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
  5. 審査が完了しましたら,「責任者メールアドレス」宛てにコーパスへのアクセス情報をご連絡いたします。


音声コーパスの利用に関する誓約書

大学共同利用機関法人 情報・システム研究機構 殿

私は、大学共同利用機関法人 情報・システム研究機構(以下「甲」という。)の研究機関である国立情報学研究所より、このたび提供を受けた次に示す音声コーパス(以下「本コーパス」という。)の利用に際し、下記の事項を遵守することを誓約いたします。

音声コーパスの名称 : 理研ワープロ操作対話音声コーパス (RIKEN-DLG)

著作権者 : 国立研究開発法人 理化学研究所

  1. 本コーパスの利用者の範囲は、利用者欄に記載した者、または利用者の所属する課または研究室に限定します。
  2. 本コーパスは、研究目的にのみ利用します。
  3. 本コーパス及びその複製物、または改変物を第三者に提供しません。
  4. 本コーパスを利用して得られた研究成果(報告書、出版物、派生ソフトウェア等)を公表する場合には、音声資料として上記「音声コーパスの名称」を明記し、甲の要請に応じてその写しを提供します。
  5. 前項の研究成果の公表を含む全ての開示に、発声者個人を識別できる情報を含むことはしません。
  6. 本コーパスが、第三者の知的財産権その他の財産権を侵害しないものであることを保証するものではなく、また本コーパスの利用によって生じた損害等についても、利用者において一切解決し、甲および本コーパスの著作権者に対して責任を問わないことを承諾します。
  7. 利用者の所属する課または研究室に変更が生じた場合は、遅滞なくこれを甲に報告し、甲の要請があれば改めて誓約書を提出します。
  8. 本コーパスを利用した研究活動に関する報告書を甲の要請に応じて提出します。
  9. 甲または著作権者から本コーパスの利用中止の要請を受けた場合、利用者自ら利用を中止した場合または利用者において本誓約書に違反する行為があった場合、本コーパスの利用は終了し、利用者は、本コーパスのデータを消去し、甲に対し消去した旨を通知します。
  10. 本誓約書の内容について変更が生じた場合、変更を含めた当該誓約書の遵守に努めます。
  11. 本誓約書に記載のない事項が生じた場合は、甲と誠意をもって協議し、問題の解決に努めます。

 

「IDRデータセット提供サービス規約」も必ず事前にご確認ください。

* 全項目必須入力

住所*

大学または会社名*

研究室または部署名*

責任者名*

※上記の研究室または部署(グループ)の責任者もしくはコーパスの管理責任者(常勤職員相当の方)
 を入力してください(学生不可)

責任者職名*

責任者メールアドレス*

※原則として所属機関発行の個人のアドレスを入力してください
 コーパスご提供後,利用者のメーリングリストへ登録させていただきます

使用目的*
(最大256文字)

例:「音声認識システムの性能評価」「方言のアクセント研究」 など

 

利用誓約書およびサービス規約の内容を確認し,同意の上,利用を申請します。

※入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りします。
 メールの内容をご確認の上,24時間以内に「確定」の処理をお願いいたします。