2024/02/28 現在
民間企業提供データ
Yahoo!データセット
国立情報学研究所がLINEヤフー株式会社(旧社名 ヤフー株式会社)から提供を受けて研究者に提供しているデータセットです。
- Yahoo!知恵袋データ(第3版)
楽天データセット
楽天グループ株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。
- 楽天市場の全商品データ,レビューデータ
- 楽天トラベルの施設データ,レビューデータ
- 楽天GORAのゴルフ場データ,レビューデータ
- 楽天レシピのレシピ情報,レシピ画像
- アノテーション付きデータ
ニコニコデータセット
国立情報学研究所が株式会社ドワンゴから提供を受けて研究者に提供しているデータセットです。
- ニコニコ動画コメント等データ
- ニコニコ大百科データ
リクルートデータセット
国立情報学研究所が株式会社リクルートから提供を受けて研究者に提供しているデータセットです。
- ホットペッパービューティーデータ
クックパッドデータセット
クックパッド株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。
- レシピデータ,献立データ
LIFULL HOME'Sデータセット
国立情報学研究所が株式会社LIFULL(旧社名 株式会社ネクスト)から提供を受けて研究者に提供しているデータセットです。
- 賃貸物件スナップショットデータ(賃貸物件データ+画像データ)
- 高精細度間取り図画像データ
- 賃貸・売買物件月次データ
不満調査データセット
国立情報学研究所が株式会社Insight Tech(旧社名 株式会社不満買取センター)から提供を受けて研究者に提供しているデータセットです。
- 不満調査データ
- 新型コロナ不満アンケ―トデータ
- カテゴリ別不満特徴語辞書
Sansanデータセット
国立情報学研究所がSansan株式会社から提供を受けて研究者に提供しているデータセットです。
- サンプル名刺データ
インテージデータセット
株式会社インテージが国立情報学研究所を通じて研究者に提供しているデータセットです。
- インテージパネルデータ
オリコンデータセット
国立情報学研究所が株式会社oricon MEから提供を受けて研究者に提供しているデータセットです。
- 顧客満足度調査データ (2023-12-07 更新)
ダイエット口コミデータセット
ダイエットカフェ株式会社(旧社名 株式会社T.M.Community)が国立情報学研究所を通じて研究者に提供しているデータセットです。
- ダイエット商品口コミデータ (2023-11-07 更新)
弁護士ドットコムデータセット
弁護士ドットコム株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。
- 法律相談データ
アットホームデータセット
アットホーム株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。
- 不動産物件データ (2023-04-04 更新)
JASTメディカルデータセット
国立情報学研究所が日本システム技術株式会社から提供を受けて研究者に提供しているデータセットです。
- レセプト集計データ (2023-12-26 更新)
トリガーデータセット
国立情報学研究所が株式会社トリガーから提供を受けて研究者に提供しているデータセットです。
- アニメ作品素材データ
みんなの評判口コミデータセット (2022-08-18 新規)
株式会社マイスタースタジオが国立情報学研究所を通じて研究者に提供しているデータセットです。
- 商品・サービス口コミデータ
メルカリデータセット (2022-09-01 新規)
株式会社メルカリが国立情報学研究所を通じて研究者に提供しているデータセットです。
- フリマ商品データ
地球の歩き方旅行記データセット (2022-11-24 新規)
株式会社地球の歩き方が国立情報学研究所を通じて研究者に提供しているデータセットです。
- 投稿旅行記データ
NTCIRテストコレクション
国立情報学研究所が主催するNTCIRプロジェクトにより構築されたテストコレクションです。
IDRから提供しているテストコレクションはこちらをご覧ください。その他,NTCIR事務局より提供しているテストコレクションを含めた一覧についてはNTCIRのページをご覧ください。
音声コーパス
国立情報学研究所に設置された音声資源コンソーシアム(SRC)がさまざまな機関やグループから受け入れて研究者に提供している音声コーパスです。
IDRから提供している音声コーパスはこちらをご覧ください(IDRからは無償コーパスを提供しています)。その他,SRCより提供している有償コーパスを含めた一覧についてはSRCのページをご覧ください。
研究者提供データ
グループコミュニケーションコーパス(TDU-NEDO)
東京電機大学が作成したコミュニケーション解析用の映像データで,6名によるグループディスカッションの様子と,学生等によるポスターセッションの様子を収録したものです。
立命館ARC所蔵浮世絵データベース
立命館大学アートリサーチセンター(ARC)が所蔵する浮世絵約11,000件について,書誌情報(作品名,役者,版元,絵師,上演年等)および画像ファイルへのリンク(URL)が収載されているデータベースです。
理研記述問題採点データセット
大学受験予備校や教育関連会社にて行われたテストの記述問題に対し,理化学研究所が採点アノテーションを付与したデータセットです。
大阪大学 マルチモーダル対話コーパス(Hazumi)
大阪大学産業科学研究所において収録された,対話エージェントと人との対話の様子を収めたマルチモーダルコーパスです。(2022-07-07 更新)
工学院大学 多用途型日本手話言語データベース(KoSign)
科研費基盤研究(S)「多用途型日本手話言語データベース構築に関する研究」により作成された,6,000超の手話単語と数対話の高精細映像データならびに3次元動作データ等のデータセットです。(2022-07-08 更新)
NIIグランドチャレンジ会話コーパス (準備中)
国立情報学研究所のグランドチャレンジ研究「情報環境を支える日常的インタラクションデータ収録のためのプラットフォーム構築」(2009-2011) にて収録された3人会話の映像・音声データです。
提供を終了したデータセット
国文研データセット (移管)
国立情報学研究所が人間文化研究機構 国文学研究資料館に協力して提供していた古典籍データは,正式公開版の提供に際し取り扱いを情報・システム研究機構 人文学オープンデータ共同利用センターに移管しました。新しいサイトはこちらです。
映像処理評価用映像データベース (終了)
電子情報通信学会パターン認識・メディア理解研究会VDBWGにより作成された映像処理評価用映像データベースは,平成29年度をもちまして提供を終了しました。