日本の判例HTMLデータ
国立情報学研究所が研究者提供データセットとして情報・システム研究機構 データサイエンス共同利用基盤施設 人工知能法学研究支援センターから受け入れたデータセットです。
2024/10/30 更新
データ概要
人工知能法学研究支援センターにて,最高裁判所が公開している判例集のPDFデータをテキスト化(HTML化)したデータセットです。
最高裁判所のサイトで検索可能な最高裁判所判例集,高等裁判所判例集,下級裁判所裁判例速報,行政事件裁判例集,労働事件裁判例集,知的財産裁判例集のPDFデータをテキスト化したもので,2024年10月10日時点で検索可能であった1947年~2024年までの65,855件の判例データからなります。
HTMLデータでは,本文内容に無関係な部分を除去し,小見出し,箇条書き,段落などの構造を認識して,それぞれに応じたタグを付与しています。(ただし各処理は自動処理をしたままのものであり,認識誤りを含んでいることがあります)
判例リスト(メタデータ)はCSV形式,判例本文はHTML形式で,サイズは全体で約2GBです。
なお,人工知能法学研究支援センターでは,基本的なメタデータや,法令参照,裁判官・当事者,キーワードなどをRDF化したデータを以下で公開していますので,合わせてご利用ください。
https://idea.linkdata.org/idea/idea1s4030i
更新情報
- データを更新しました。利用者の方は配布サイトよりダウンロードしてご利用頂けます。(2024/10/30)
- 「日本の判例HTMLデータ」の提供を開始しました。(2024/08/20)
利用目的・提供対象者
- データセットの利用目的は学術研究に限ります。
- 提供対象者は主に大学および公的研究機関の研究者としますが,研究内容によっては民間企業等の研究者にも提供可能です。利用の可否をお知りになりたい場合は末尾の「問い合わせ窓口」までお問い合わせください。また「よくある質問 FAQ」のページもご参照ください。
- 原則として,提供の単位は研究室(大学以外の場合は研究室に相当するグループ)としますので,利用申請は研究室を代表する方が行ってください。
データ提供方法
データはIDR事務局より,原則としてWebサーバからのダウンロードにより提供します。
お申し込み
本データセットの申込み方法は次の通りです。ご利用に際しては,規約の内容に同意いただく必要がございます。
- フォームに機関名,代表者,使用目的等の必要事項を入力してください。(※全項目必須入力)
ご提出いただいた情報は,情報・システム研究機構 人工知能法学研究支援センターに提供します。また,利用の可否の判断,利用者の把握,本データセットに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。
- 「『日本の判例HTMLデータ』利用規約」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
- 入力内容およびご本人確認のため,「代表者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
- 申請内容についてIDR事務局および人工知能法学研究支援センターにて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
- 審査が完了しましたら,「代表者メールアドレス」宛てにデータセットへのアクセス情報をご連絡いたします。
(全項目必須入力です)
データ提供後の報告等について
- 学会や学術雑誌等での研究発表については,年に一度,利用報告書のご提出をお願いします。
問い合わせ窓口(IDR事務局)
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール: idr [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。
利用者向けページ (既にデータをご利用中の方へ)
日本の判例HTMLデータの利用者向けの情報を掲載しています。→ 利用者向けページ