> HOME > データ一覧

データセット一覧

国立情報学研究所が情報学関連分野の研究者に提供しているデータセットの一覧です。一部,準備中のデータセットも含まれています。

2016/05/25 現在

Yahoo!データセット

国立情報学研究所がヤフー株式会社から提供を受けて研究者に提供しているデータセットです。

  1. Yahoo!知恵袋データ(第2版)

楽天データセット(2016-01-12 更新・追加)

国立情報学研究所が楽天株式会社との協力により研究者に提供しているデータセットです。

  1. 楽天市場の全商品データ,レビューデータ
  2. 楽天トラベルの施設データ,レビューデータ ※更新
  3. 楽天ゴルフの施設データ,レビューデータ
  4. 楽天レシピのレシピ情報,レシピ画像 ※更新・追加
  5. 楽天オークションの評価コメント情報,取引情報
  6. アノテーション付きデータ
  7. 楽天Vikiのビデオ情報,ユーザ情報 ※新規追加

ニコニコデータセット

国立情報学研究所が株式会社ドワンゴおよび有限会社未来検索ブラジルから提供を受けて研究者に提供しているデータセットです。

  1. ニコニコ動画コメント等データ
  2. ニコニコ大百科データ

リクルートデータセット

国立情報学研究所が株式会社リクルートテクノロジーズから提供を受けて研究者に提供しているデータセットです。

  1. ホットペッパービューティーデータ

クックパッドデータセット

国立情報学研究所がクックパッド株式会社との協力により研究者に提供しているデータセットです。

  1. レシピデータ
  2. 献立データ

HOME'Sデータセット(2016-02-01 追加)

国立情報学研究所が株式会社ネクストから提供を受けて研究者に提供しているデータセットです。

  1. 賃貸物件データ,画像データ
  2. 高精細度間取り図画像データ ※新規追加

不満調査データセット(2016-05-25 新規提供)

国立情報学研究所が株式会社不満買取センターから提供を受けて研究者に提供しているデータセットです。

  1. 投稿された不満データ,ユーザ情報

国文研データセット

国立情報学研究所が人間文化研究機構 国文学研究資料館に協力して提供するデータセットです。

  1. 古典籍データ(書誌,画像,タグ,本文テキスト)

NTCIRテストコレクション

国立情報学研究所が主催するNTCIRプロジェクトにより構築されたテストコレクションです。IDRから提供しているテストコレクションはこちらをご覧ください。その他のテストコレクションについてはテストコレクション一覧をご覧下さい。(提供はNTCIR事務局からとなります。)

音声コーパス

国立情報学研究所に設置された音声資源コンソーシアムがさまざまな機関やグループから受け入れて研究者に提供している音声コーパスです。(当面の間,提供は音声資源コンソーシアムからとなります。)

会話コーパス (準備中)

国立情報学研究所のグランドチャレンジ研究「情報環境を支える日常的インタラクションデータ収録のためのプラットフォーム構築」(2009-2011) にて収録された3人会話の映像・音声データです。

  1. アニメ再生課題
    1. 発話書き起こしデータ
    2. 話者ごとの音声データ
    3. 話者ごとの正面映像データ(無音)
    4. 3人の話者の俯瞰映像データ(無音)

映像データベース (配布停止中)

電子情報通信学会パターン認識・メディア理解研究会VDBWGにより作成された映像処理評価用映像データベースです。(現在,新規配布を停止しております。配布再開の準備ができましたら本サイトにてご案内します。)