ニュース / News

NII情報

「大阪大学 マルチモーダル対話コーパス(Hazumi)」オンライン収録版追加 提供開始

国立情報学研究所 情報学研究データリポジトリ(IDR)では、2020年8月に提供を 開始しました「大阪大学 マルチモーダル対話コーパス(Hazumi)」につきまし て、追加データの提供を開始しました。

本コーパスは、大阪大学産業科学研究所の駒谷教授を中心として構築された、 対話エージェントと人との対話の様子を収めたもので、Wizard-of-Oz方式により 別室から操作する対話エージェントと実験参加者との雑談の様子を、1名あたり 15分程度収録しています。

今回、これまでの対面収録版に加え、コロナ禍においてオンライン会議システム を用いて収録した、以下のオンライン収録版のデータが追加されました。

  • Hazumi2010(2020年10月収録開始データ)

    実験参加者が対話を楽しんでいる時間が長くなるように話題を調整しながら対話を行ったもので、実験参加者は20代~60代の男女33名です。

  • Hazumi2012(2020年12月収録開始データ)

    対話の進め方はHazumi2010と同様で、実験参加者は20代~60代の男女63名です。

  • Hazumi2105(2021年5月収録開始データ)

    Hazumi2010とHazumi2012で一度収録を行った実験参加者のうち、システムが操作していたことに気づいていなかった者に対して再度収録を行ったもので、実験参加者は男女29名です。

IDRからは、ビデオ会議システムで収録した映像データを提供します。データサイズは圧縮ファイルで計約9GBです。

また、この対話データに対して、交換(システム-ユーザ発話対)ごとに付与した様々なアノテーションを含むELAN用ファイル(eafファイル)や、機械学習用csvファイル、事前と事後に実施したアンケートの結果等が提供者のgithubサイトより公開されています。

従来の対面収録版を含めたコーパス全体の内容、利用条件や申請方法等の詳細については以下をご覧ください。

・情報学研究データリポジトリ 大阪大学マルチモーダル対話コーパス(Hazumi)


IDRでは、「研究者等提供データセット受入要項」に基づき、大学等の研究者が 作成したデータセットの受入を行っています。本データセットはこの受入要項に 基づき受入・提供を行うものです。データセット受入の詳細に関しては下記をご 覧ください。

・大学等研究者提供データセット受入

また、その他提供中のデータセットについては次のウェブサイトをご覧ください。

国立情報学研究所 情報学研究データリポジトリ

5406

注目コンテンツ / SPECIAL