29. 日本語多話者オーディオブックコーパス (J-MAC)
2026/03/16 更新
概要
データDOI
https://doi.org/10.32130/src.J-MAC
提供機関, プロジェクト
高道慎之介 先生(提供当時:東京大学)
コーパスの内容
市販のオーディオブックの時間対応付きテキストデータ。大量の市販品の中から音声合成研究に適するものを選択した,小説24作品のオーディオブック延べ74点について,章や段落に構造化し振り仮名を付与したテキストに,文単位での発話者や時間情報を付与したもの。
※注意:本コーパスに音声データは含まれておらず,別途販売元より購入いただく必要があります。
(販売元の情報はコーパス内に含まれています。本コーパスの配布は販売元の許諾を得ています)
話者数
プロ話者39名
音声ファイルフォーマット
(音声ファイルは含まれません)
利用範囲
研究目的に限る
配布価格
無償
詳細情報
https://sites.google.com/site/shinnosuketakamichi/research-topics/j-mac_corpus
サンプルデータ
「セロ弾きのゴーシュ」(作・宮沢賢治)
chapt000:
parag016:
style000:
- character: narrative
sent: ゴーシュの畑からとった、半分熟したトマトを、さも重そうに持って来て、ゴーシュの前におろして云いました。
time: [383.12, 391.795]
to whom: narrative
style001:
- character: 猫
sent: 「ああくたびれた。
time: [392.25, 394.395]
to whom: ゴーシュ
- character: 猫
sent: なかなか、[運搬|うんぱん]はひどいやな。」
time: [394.42, 397.575]
to whom: ゴーシュ
style002:
- character: ゴーシュ
sent: 「[何|なん]だと」
time: [397.6, 398.715]
to whom: 猫
style003:
- character: narrative
sent: ゴーシュがききました。
time: [398.74, 400.575]
to whom: narrative
更新情報
- 提供を開始しました。(2021/07/12)
- テキストデータに発話者("character", "to whom")の項目を追加しました。(2022/03/29)
お申し込み
本コーパスの申込み方法は次の通りです。ご利用に際しては,利用誓約書の内容に同意いただく必要がございます。また提供の条件等について,こちら(全コーパス共通)を事前に必ずご確認ください。
- フォームに機関名,責任者,使用目的等の必要事項を入力してください。(※全項目必須入力)
注: ご入力いただいた情報は本コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。- 以下の「音声コーパスの利用に関する誓約書」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
- 入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
- 申請内容についてIDR事務局にて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
- 審査が完了しましたら,「責任者メールアドレス」宛てにコーパスへのアクセス情報をご連絡いたします。
音声コーパスの利用に関する誓約書
大学共同利用機関法人 情報・システム研究機構 殿
私は、大学共同利用機関法人 情報・システム研究機構(以下「甲」という。)の研究機関である国立情報学研究所より、このたび提供を受けた次に示す音声コーパス(以下「本コーパス」という。)の利用に際し、下記の事項を遵守することを誓約いたします。
音声コーパスの名称 : 日本語多話者オーディオブックコーパス (J-MAC)
代表著作権者 : 高道 慎之介
記
- 本コーパスの利用者の範囲は、利用者欄に記載した者、または利用者の所属する課または研究室に限定します。
- 本コーパスは、研究目的にのみ利用します。
- 本コーパス及びその複製物、または改変物を第三者に提供しません。
- 本コーパスを利用して得られた研究成果(報告書、出版物、派生ソフトウェア等)を公表する場合には、音声資料として上記「音声コーパスの名称」を明記し、甲の要請に応じてその写しを提供します。
- 前項の研究成果の公表を含む全ての開示に、発声者個人を識別できる情報を含むことはしません。
- 本コーパスが、第三者の知的財産権その他の財産権を侵害しないものであることを保証するものではなく、また本コーパスの利用によって生じた損害等についても、利用者において一切解決し、甲および本コーパスの著作権者に対して責任を問わないことを承諾します。
- 利用者の所属する課または研究室に変更が生じた場合は、遅滞なくこれを甲に報告し、甲の要請があれば改めて誓約書を提出します。
- 本コーパスを利用した研究活動に関する報告書を甲の要請に応じて提出します。
- 甲または代表著作権者から本コーパスの利用中止の要請を受けた場合、利用者自ら利用を中止した場合または利用者において本誓約書に違反する行為があった場合、本コーパスの利用は終了し、利用者は、本コーパスのデータを消去し、甲に対し消去した旨を通知します。
- 本誓約書の内容について変更が生じた場合、変更を含めた当該誓約書の遵守に努めます。
- 本誓約書に記載のない事項が生じた場合は、甲と誠意をもって協議し、問題の解決に努めます。
※「IDRデータセット提供サービス規約」も必ず事前にご確認ください。
* 全項目必須入力