> HOME > データ一覧 > 日本の判例HTMLデータ

日本の判例HTMLデータ

国立情報学研究所が研究者提供データセットとして情報・システム研究機構 データサイエンス共同利用基盤施設 人工知能法学研究支援センターから受け入れたデータセットです。

2024/10/30 更新

データ概要

人工知能法学研究支援センターにて,最高裁判所が公開している判例集のPDFデータをテキスト化(HTML化)したデータセットです。

最高裁判所のサイトで検索可能な最高裁判所判例集,高等裁判所判例集,下級裁判所裁判例速報,行政事件裁判例集,労働事件裁判例集,知的財産裁判例集のPDFデータをテキスト化したもので,2024年10月10日時点で検索可能であった1947年~2024年までの65,855件の判例データからなります。

HTMLデータでは,本文内容に無関係な部分を除去し,小見出し,箇条書き,段落などの構造を認識して,それぞれに応じたタグを付与しています。(ただし各処理は自動処理をしたままのものであり,認識誤りを含んでいることがあります)

判例リスト(メタデータ)はCSV形式,判例本文はHTML形式で,サイズは全体で約2GBです。

なお,人工知能法学研究支援センターでは,基本的なメタデータや,法令参照,裁判官・当事者,キーワードなどをRDF化したデータを以下で公開していますので,合わせてご利用ください。
https://idea.linkdata.org/idea/idea1s4030i

更新情報

  • データを更新しました。利用者の方は配布サイトよりダウンロードしてご利用頂けます。(2024/10/30)
  • 「日本の判例HTMLデータ」の提供を開始しました。(2024/08/20)

利用目的・提供対象者

  • データセットの利用目的は学術研究に限ります。
  • 提供対象者は主に大学および公的研究機関の研究者としますが,研究内容によっては民間企業等の研究者にも提供可能です。利用の可否をお知りになりたい場合は末尾の「問い合わせ窓口」までお問い合わせください。また「よくある質問 FAQ」のページもご参照ください。
  • 原則として,提供の単位は研究室(大学以外の場合は研究室に相当するグループ)としますので,利用申請は研究室を代表する方が行ってください。

データ提供方法

データはIDR事務局より,原則としてWebサーバからのダウンロードにより提供します。

お申し込み

本データセットの申込み方法は次の通りです。ご利用に際しては,規約の内容に同意いただく必要がございます。

  1. フォームに機関名,代表者,使用目的等の必要事項を入力してください。(※全項目必須入力)

    ご提出いただいた情報は,情報・システム研究機構 人工知能法学研究支援センターに提供します。また,利用の可否の判断,利用者の把握,本データセットに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内のために利用します。

  2. 「『日本の判例HTMLデータ』利用規約」および「IDRデータセット提供サービス規約」の内容をご確認の上,「仮申請」ボタンをクリックしてください。
  3. 入力内容およびご本人確認のため,「代表者メールアドレス」宛てに確認メールをお送りいたしますので,メールの案内に従い申請確定の処理をお願いします。
  4. 申請内容についてIDR事務局および人工知能法学研究支援センターにて審査させていただきます(数日かかることがありますがご了承ください)。入力内容の修正を求めることや,ご希望に添えないことがあることをご承知おきください。
  5. 審査が完了しましたら,「代表者メールアドレス」宛てにデータセットへのアクセス情報をご連絡いたします。

(全項目必須入力です)

住所

大学または機関名

研究室または部署名

代表者名

※上記の研究室または部署(グループ)の責任者もしくはデータセットの管理責任者(常勤職員相当の方)を入力してください(学生不可)

代表者職名

代表者メールアドレス

※原則として所属機関発行の個人のアドレスを入力してください
データセットご提供後,利用者のメーリングリストへ登録させていただきます

使用目的
(最大256文字)

例:「判例文の使用語彙の定量的分析」 「判決の時系列的分析」など

利用規約

以下の規約に同意します。

メーリングリスト登録

IDR事務局では関連情報(新規データ,シンポジウム開催案内等)を配信するためにメーリングリスト(idr-announce [at] nii.ac.jp)を運用しています。本メーリングリストへの登録を希望する場合は以下へ入力して下さい。(すでに登録済みの方は記入は不要です。)

登録するメールアドレス:

※アナウンス用メーリングリストへの登録は任意です。なお,本データセットに関する連絡や利用報告の依頼等のために運用している利用者用メーリングリストについては「利用者向けページ」をご覧下さい。

申請送信

記入内容をよく確認の上,仮申請ボタンを押してください。

※入力内容およびご本人確認のため,「代表者メールアドレス」宛てに確認メールをお送りします。
メールの内容をご確認の上,24時間以内に「確定」の処理をお願いいたします。

データ提供後の報告等について

  • 学会や学術雑誌等での研究発表については,年に一度,利用報告書のご提出をお願いします。
(詳細は「利用者向けページ」をご覧ください)

問い合わせ窓口(IDR事務局)

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール: idr [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。

利用者向けページ (既にデータをご利用中の方へ)

日本の判例HTMLデータの利用者向けの情報を掲載しています。→ 利用者向けページ