18. 中国語MULTEXTコーパス (MULTEXT-C)
2026/03/16 更新
概要
データDOI
https://doi.org/10.32130/src.MULTEXT-C
提供機関, プロジェクト
北海道医療大学 小松 雅彦 准教授(現・神奈川大学)
コーパスの内容
ヨーロッパの Multilingual Text Tools and Corpora(MULTEXT)プロジェクトに倣って作成された中国語版のコーパス。
MULTEXT英語版・日本語版より翻訳した,1つが5~6文で構成される40の原稿を,できるだけ自然に話すように指示して収録。
話者数, 発声回数
中国語母語話者10名(男女各5名), 各1回発声
1名は全40文章,残り9名は15文章を読み上げ(1文章あたり4~5名)
収録環境
防音室
音声ファイルフォーマット
WAV形式(22,050Hz・16bit・Mono)
利用範囲
研究目的に限る
配布価格
無償
サンプル音声
「我刚到伦敦,而我的行李却去了罗马。因为我有糖尿病,明天必须拿到我的行李,请拜托有关负责人尽快帮我去找。这期间,我还需要一些应急药,麻烦您帮我联系一下儿。」
更新情報
- 提供を開始しました。(2010/07/01)
- オンラインでの配布を開始しました。(2019/03/18)
お申し込み
本コーパスの申込み方法は次の通りです。ご利用に際しては,利用誓約書の内容に同意いただく必要がございます。また提供の条件等について,こちら(全コーパス共通)を事前に必ずご確認ください。
- フォームに機関名,責任者,使用目的等の必要事項を入力してください。(※全項目必須入力)
注: ご入力いただいた情報は本コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。- 以下の「音声コーパスの利用に関する誓約書」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
- 入力内容およびご本人確認のため,「責任者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
- 申請内容についてIDR事務局にて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
- 審査が完了しましたら,「責任者メールアドレス」宛てにコーパスへのアクセス情報をご連絡いたします。
音声コーパスの利用に関する誓約書
大学共同利用機関法人 情報・システム研究機構 殿
私は、大学共同利用機関法人 情報・システム研究機構(以下「甲」という。)の研究機関である国立情報学研究所より、このたび提供を受けた次に示す音声コーパス(以下「本コーパス」という。)の利用に際し、下記の事項を遵守することを誓約いたします。
音声コーパスの名称 : 中国語MULTEXTコーパス (MULTEXT-C)
代表著作権者 : 小松 雅彦
記
- 本コーパスの利用者の範囲は、利用者欄に記載した者、または利用者の所属する課または研究室に限定します。
- 本コーパスは、研究目的にのみ利用します。
- 本コーパス及びその複製物、または改変物を第三者に提供しません。
- 本コーパスを利用して得られた研究成果(報告書、出版物、派生ソフトウェア等)を公表する場合には、音声資料として上記「音声コーパスの名称」を明記し、甲の要請に応じてその写しを提供します。
- 前項の研究成果の公表を含む全ての開示に、発声者個人を識別できる情報を含むことはしません。
- 本コーパスが、第三者の知的財産権その他の財産権を侵害しないものであることを保証するものではなく、また本コーパスの利用によって生じた損害等についても、利用者において一切解決し、甲および本コーパスの著作権者に対して責任を問わないことを承諾します。
- 利用者の所属する課または研究室に変更が生じた場合は、遅滞なくこれを甲に報告し、甲の要請があれば改めて誓約書を提出します。
- 本コーパスを利用した研究活動に関する報告書を甲の要請に応じて提出します。
- 甲または代表著作権者から本コーパスの利用中止の要請を受けた場合、利用者自ら利用を中止した場合または利用者において本誓約書に違反する行為があった場合、本コーパスの利用は終了し、利用者は、本コーパスのデータを消去し、甲に対し消去した旨を通知します。
- 本誓約書の内容について変更が生じた場合、変更を含めた当該誓約書の遵守に努めます。
- 本誓約書に記載のない事項が生じた場合は、甲と誠意をもって協議し、問題の解決に努めます。
※「IDRデータセット提供サービス規約」も必ず事前にご確認ください。
* 全項目必須入力