> HOME > データ一覧

2020/08/18 現在

民間企業提供データ

Yahoo!データセット

国立情報学研究所がヤフー株式会社から提供を受けて研究者に提供しているデータセットです。

  1. Yahoo!知恵袋データ(第3版) (2020-04-01 更新)

楽天データセット

楽天株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。

  1. 楽天市場の全商品データ,レビューデータ (2020-02-25 更新)
  2. 楽天トラベルの施設データ,レビューデータ (2020-02-25 更新)
  3. 楽天GORAのゴルフ場データ,レビューデータ
  4. 楽天レシピのレシピ情報,レシピ画像
  5. アノテーション付きデータ (2020-02-25 更新)

ニコニコデータセット

国立情報学研究所が株式会社ドワンゴから提供を受けて研究者に提供しているデータセットです。

  1. ニコニコ動画コメント等データ
  2. ニコニコ大百科データ

リクルートデータセット

国立情報学研究所が株式会社リクルートテクノロジーズから提供を受けて研究者に提供しているデータセットです。

  1. ホットペッパービューティーデータ

クックパッドデータセット

クックパッド株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。

  1. レシピデータ,献立データ

LIFULL HOME'Sデータセット

国立情報学研究所が株式会社LIFULL(旧社名 株式会社ネクスト)から提供を受けて研究者に提供しているデータセットです。

  1. 賃貸物件スナップショットデータ(賃貸物件データ+画像データ)
  2. 高精細度間取り図画像データ
  3. 賃貸・売買物件月次データ

不満調査データセット

国立情報学研究所が株式会社Insight Tech(旧社名 株式会社不満買取センター)から提供を受けて研究者に提供しているデータセットです。

  1. 投稿された不満データ,ユーザ情報
  2. カテゴリ別不満特徴語辞書

Sansanデータセット

国立情報学研究所がSansan株式会社から提供を受けて研究者に提供しているデータセットです。

  1. サンプル名刺データ

インテージデータセット

株式会社インテージが国立情報学研究所を通じて研究者に提供しているデータセットです。

  1. インテージパネルデータ

オリコンデータセット

国立情報学研究所が株式会社oricon MEから提供を受けて研究者に提供しているデータセットです。

  1. 顧客満足度調査データ

ダイエット口コミデータセット

株式会社T.M.Communityが国立情報学研究所を通じて研究者に提供しているデータセットです。

  1. ダイエット商品口コミデータ

弁護士ドットコムデータセット (2020-03-11 新規)

弁護士ドットコム株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。

  1. 法律相談データ

NTCIRテストコレクション

国立情報学研究所が主催するNTCIRプロジェクトにより構築されたテストコレクションです。

IDRから提供しているテストコレクションはこちらをご覧ください。その他,NTCIR事務局より提供しているテストコレクションを含めた一覧についてはNTCIRのページをご覧ください。

音声コーパス

国立情報学研究所に設置された音声資源コンソーシアム(SRC)がさまざまな機関やグループから受け入れて研究者に提供している音声コーパスです。

IDRから提供している音声コーパスはこちらをご覧ください(IDRからは無償コーパスを提供しています)。その他,SRCより提供している有償コーパスを含めた一覧についてはSRCのページをご覧ください。

研究者提供データ

グループコミュニケーションコーパス(TDU-NEDO)

東京電機大学が作成したコミュニケーション解析用の映像データで,6名によるグループディスカッションの様子と,学生等によるポスターセッションの様子を収録したものです。

立命館ARC所蔵浮世絵データベース (2020-03-05 新規)

立命館大学アートリサーチセンター(ARC)が所蔵する浮世絵約11,000件について,書誌情報(作品名,役者,版元,絵師,上演年等)および画像ファイルへのリンク(URL)が収載されているデータベースです。

理研記述問題採点データセット (2020-07-14 新規)

大学受験予備校や教育関連会社にて行われたテストの記述問題に対し,理化学研究所が採点アノテーションを付与したデータセットです。

大阪大学 マルチモーダル対話コーパス(Hazumi) (2020-08-18 新規)

大阪大学産業科学研究所において収録された,対話エージェントと人との対話の様子を収めたマルチモーダルコーパスです。

NIIグランドチャレンジ会話コーパス (準備中)

国立情報学研究所のグランドチャレンジ研究「情報環境を支える日常的インタラクションデータ収録のためのプラットフォーム構築」(2009-2011) にて収録された3人会話の映像・音声データです。

提供を終了したデータセット

国文研データセット (移管)

国立情報学研究所が人間文化研究機構 国文学研究資料館に協力して提供していた古典籍データは,正式公開版の提供に際し取り扱いを情報・システム研究機構 人文学オープンデータ共同利用センターに移管しました。新しいサイトはこちらです。

映像処理評価用映像データベース (終了)

電子情報通信学会パターン認識・メディア理解研究会VDBWGにより作成された映像処理評価用映像データベースは,平成29年度をもちまして提供を終了しました。