不満調査データ
株式会社Insight Techが運営するWebサービス「不満買取センター」に一般ユーザが投稿した様々な不満に関するデータです。
2021/01/25 更新
更新情報
- データを更新しました。利用者の方は配布サイトよりダウンロードしてご利用頂けます。(2017/08/29)
- 「不満調査データ」の配布を開始しました。(2016/05/25)
データ概要
2015年3月18日(サービス開始日)から2017年3月12日までに「不満買取センター」に投稿された約525万件のデータで,個人情報が含まれた投稿はデータセットから除外されています。これらの不満を投稿した約10万人分のユーザプロフィール情報(性別や居住都道府県など)も付随していますが,特定の個人につながる情報は含まれません。
データはCSV形式(タグ部分はJSON仕様)で,サイズはタグデータも含めると約120GBとなります。
<前バージョンとの比較>
2016年5月に提供を開始したデータに,最近の約1年半分のデータが追加され,データ量が約20倍に増加しました。
また分析作業支援を目的に,機械的に付与した「構文解析システムKNPによる解析結果」「意見タグ」「WikiDataタグ」も新規に提供します。
前回提供版 | 今回の更新版 | |
---|---|---|
対象期間 | 2015年3月18日-2015年8月31日 | 2015年3月18日-2017年3月12日 |
投稿データ数 | 254,683 | 5,248,820 |
ユーザ数 | 25,092 | 106,173 |
メタ情報 | ― | 構文解析結果,意見タグ,WikiDataタグ |
データの説明については,Insight Tech(当時不満買取センター)が発表した国際会議LREC併催ワークショップの論文(当該論文のページが直接開かない場合は p.11(ファイルの16ページ目)をご覧ください),「意見タグ」「WikiDataタグ」については言語処理学会年次大会の論文もご参照ください。
なお本データの一部に言語アノテーションを付与した「不満調査データセットタグ付きコーパス」が京都大学黒橋研究室より提供されています。※2021-01-25 追記
お申し込み
本データの申込み方法はデータセットのページをご覧ください。