> HOME > データ一覧

2019/08/20 現在

民間企業提供データ

Yahoo!データセット

国立情報学研究所がヤフー株式会社から提供を受けて研究者に提供しているデータセットです。

  1. Yahoo!知恵袋データ(第3版) (2019-04-01 更新)

楽天データセット

国立情報学研究所が楽天株式会社との協力により研究者に提供しているデータセットです。

  1. 楽天市場の全商品データ,レビューデータ
  2. 楽天トラベルの施設データ,レビューデータ
  3. 楽天GORAのゴルフ場データ,レビューデータ
  4. 楽天レシピのレシピ情報,レシピ画像
  5. アノテーション付きデータ (2019-07-05 更新)

ニコニコデータセット

国立情報学研究所が株式会社ドワンゴおよび株式会社大百科ニュース社から提供を受けて研究者に提供しているデータセットです。

  1. ニコニコ動画コメント等データ (2018-12-14 更新)
  2. ニコニコ大百科データ

リクルートデータセット

国立情報学研究所が株式会社リクルートテクノロジーズから提供を受けて研究者に提供しているデータセットです。

  1. ホットペッパービューティーデータ

クックパッドデータセット

国立情報学研究所がクックパッド株式会社との協力により研究者に提供しているデータセットです。

  1. レシピデータ,献立データ

LIFULL HOME'Sデータセット

国立情報学研究所が株式会社LIFULL(旧社名 株式会社ネクスト)から提供を受けて研究者に提供しているデータセットです。

  1. 賃貸物件スナップショットデータ(賃貸物件データ+画像データ)
  2. 高精細度間取り図画像データ
  3. 賃貸・売買物件月次データ (2018-12-05 追加)

不満調査データセット

国立情報学研究所が株式会社Insight Tech(旧社名 株式会社不満買取センター)から提供を受けて研究者に提供しているデータセットです。

  1. 投稿された不満データ,ユーザ情報
  2. カテゴリ別不満特徴語辞書

Sansanデータセット

国立情報学研究所がSansan株式会社から提供を受けて研究者に提供しているデータセットです。

  1. サンプル名刺データ

インテージデータセット

国立情報学研究所が株式会社インテージとの協力により研究者に提供しているデータセットです。

  1. i-SSPデータ

オリコンデータセット (2019-06-24 新規)

国立情報学研究所が株式会社oricon MEから提供を受けて研究者に提供しているデータセットです。

  1. 顧客満足度調査データ

NTCIRテストコレクション

国立情報学研究所が主催するNTCIRプロジェクトにより構築されたテストコレクションです。

IDRから提供しているテストコレクションはこちらをご覧ください。その他,NTCIR事務局より提供しているテストコレクションを含めた一覧についてはNTCIRのページをご覧ください。

音声コーパス

国立情報学研究所に設置された音声資源コンソーシアム(SRC)がさまざまな機関やグループから受け入れて研究者に提供している音声コーパスです。

IDRから提供している音声コーパスはこちらをご覧ください(IDRからは無償コーパスを提供しています)。その他,SRCより提供している有償コーパスを含めた一覧についてはSRCのページをご覧ください。

研究者提供データ

グループコミュニケーションコーパス(TDU-NEDO) (2019-08-20 新規)

東京電機大学が作成したコミュニケーション解析用の映像データで,6名によるグループディスカッションの様子と,学生等によるポスターセッションの様子を収録したものです。

NIIグランドチャレンジ会話コーパス (準備中)

国立情報学研究所のグランドチャレンジ研究「情報環境を支える日常的インタラクションデータ収録のためのプラットフォーム構築」(2009-2011) にて収録された3人会話の映像・音声データです。

提供を終了したデータセット

国文研データセット (移管)

国立情報学研究所が人間文化研究機構 国文学研究資料館に協力して提供していた古典籍データは,正式公開版の提供に際し取り扱いを情報・システム研究機構 人文学オープンデータ共同利用センターに移管しました。新しいサイトはこちらです。

映像処理評価用映像データベース (終了)

電子情報通信学会パターン認識・メディア理解研究会VDBWGにより作成された映像処理評価用映像データベースは,平成29年度をもちまして提供を終了しました。