> HOME > データ一覧 > 不満調査データセット > 不満調査データ

不満調査データ

株式会社Insight Techが運営するWebサービス「不満買取センター」に一般ユーザが投稿した様々な不満に関するデータです。

2021/01/25 更新

更新情報

  • データを更新しました。利用者の方は配布サイトよりダウンロードしてご利用頂けます。(2017/08/29)
  • 「不満調査データ」の配布を開始しました。(2016/05/25)

データ概要

2015年3月18日(サービス開始日)から2017年3月12日までに「不満買取センター」に投稿された約525万件のデータで,個人情報が含まれた投稿はデータセットから除外されています。これらの不満を投稿した約10万人分のユーザプロフィール情報(性別や居住都道府県など)も付随していますが,特定の個人につながる情報は含まれません。

データはCSV形式(タグ部分はJSON仕様)で,サイズはタグデータも含めると約120GBとなります。

<前バージョンとの比較>

2016年5月に提供を開始したデータに,最近の約1年半分のデータが追加され,データ量が約20倍に増加しました。
また分析作業支援を目的に,機械的に付与した「構文解析システムKNPによる解析結果」「意見タグ」「WikiDataタグ」も新規に提供します。

  前回提供版 今回の更新版
対象期間 2015年3月18日-2015年8月31日 2015年3月18日-2017年3月12日
投稿データ数 254,683 5,248,820
ユーザ数 25,092 106,173
メタ情報 構文解析結果,意見タグ,WikiDataタグ

データの説明については,Insight Tech(当時不満買取センター)が発表した国際会議LREC併催ワークショップの論文(当該論文のページが直接開かない場合は p.11(ファイルの16ページ目)をご覧ください),「意見タグ」「WikiDataタグ」については言語処理学会年次大会の論文もご参照ください。

なお本データの一部に言語アノテーションを付与した「不満調査データセットタグ付きコーパス」が京都大学黒橋研究室より提供されています。※2021-01-25 追記

お申し込み

本データの申込み方法はデータセットのページをご覧ください。