理研記述問題採点データセット
国立情報学研究所が研究者提供データセットとして理化学研究所から受け入れたデータセットです。
2022/12/23 更新
データ概要
大学受験予備校や教育関連会社にて行われたテストの記述問題の答案に対し,理化学研究所において採点アノテーションを付与したデータセットです。今後も順次同様のデータの追加を予定しています。
- 代々木ゼミナールデータ(2022年12月時点,29問各約500~2000件)※2022-12-23 更新
2014年~2015年に行われた高校生対象模擬試験の国語記述問題に採点アノテーションを付与したものです。全体点および採点項目ごとの部分点や,その根拠となる単語・フレーズがアノテーションされています。
- 2020年7月提供開始:9問各約2000件の答案に対する採点者1名のアノテーションデータ
- 2022年1月追加:上記のうち6問各100件の答案に対する別の採点者1名によるアノテーションデータ,異なる8問各500件の答案に対する採点者2名のアノテーションデータ
- 2022年12月追加:異なる12問各500件の答案に対する採点者2名のアノテーションデータ
データの詳細は理化学研究所の「記述答案採点の自動化に関する研究」のページもご参照ください。
また本データを用いた研究成果として理化学研究所が発表した論文(Tomoya Mizumoto et al.(2019)),(Hiroaki Funayama et al.(2020))(Hiroaki Funayama et al.(2022))もご参照ください。
更新情報
- 「代々木ゼミナールデータ」を更新しました。(2022/12/23)
- 「代々木ゼミナールデータ」を更新しました。(2022/01/31)
- 「理研記述問題採点データセット」の提供を開始しました。(2020/07/14)
提供対象者・利用目的
- データセットの利用目的は学術研究に限ります。
- 提供対象者は主に大学,公的研究機関または非営利の民間研究機関に所属する研究者とします。利用の可否をお知りになりたい場合は末尾の「問い合わせ窓口」までお問い合わせください。また「よくある質問 FAQ」のページもご参照ください。
- 原則として,提供の単位は研究室(大学以外の場合は研究室に相当するグループ)としますので,利用申請は研究室を代表する方が行ってください。
データ提供方法
データはIDR事務局より,原則としてWebサーバからのダウンロードにより提供します。
お申し込み
本データセットの申込み方法は次の通りです。ご利用に際しては,規約の内容に同意いただく必要がございます。
- フォームに機関名,代表者,使用目的等の必要事項を入力してください。(※全項目必須入力)
注:ご提出いただいた情報は,利用の可否の判断および利用者の把握のため,理化学研究所および原データ提供者に提供します。また本データセットに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。
- 「『理研記述問題採点データセット』利用規約」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
- 入力内容およびご本人確認のため,「代表者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
- 申請内容についてIDR事務局にて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
- 審査が完了しましたら,「代表者メールアドレス」宛てにデータセットへのアクセス情報をご連絡いたします。
(全項目必須入力です)
データ提供後の報告等について
- メディアを対象として広報や研究発表等を行う場合は,事前にご連絡ください。
- 学会や学術雑誌等での研究発表については,年に一度,利用報告書のご提出をお願いします。
問い合わせ窓口(IDR事務局)
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール: idr [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。
利用者向けページ (既にデータをご利用中の方へ)
理研記述問題採点データセットの利用者向けの情報を掲載しています。→ 利用者向けページ