ニュース / News

NII情報

提供中の「日本の判例HTMLデータ」を更新

国立情報学研究所 情報学研究データリポジトリ(IDR)では、2024年から提供している「日本の判例HTMLデータ」につきまして、最新のデータに更新しましたのでお知らせ致します。

本データセットは,情報・システム研究機構 データサイエンス共同利用基盤施設 人工知能法学研究センターが作成した、最高裁判所が公開している判例集のPDFデータをテキスト化(HTMLデータ化)したものです。

これまで、2024年10月10日時点の65,855件の判例データを使用していましたが、今回の更新で、2026年3月23日時点で検索可能な、1947年~2026年までの67,313件の判例データに拡充されました。

また小見出し、箇条書き、段落といった構造に加え,意味セクションのタグが追加されるとともに、自動解析の精度が改善されています。

さらに、各判例のメタデータや、HTMLデータから抽出した裁判官・当事者,キーワード、参照法令、参照特許などの情報、PDFのページ数などをTurtle形式でRDF化したデータも新たに付随しています。

データは情報学研究データリポジトリ(IDR)のサイトよりオンライン申請にて入手可能です。提供は無償で、利用は学術研究目的に限ります

データの内容や利用条件等の詳細については以下をご覧ください。


その他提供中のデータセットについては次のウェブサイトをご覧ください。

提供データは今後も増やしていく予定です。
研究に広くご活用いただければ幸いです。

7433

注目コンテンツ / SPECIAL