> HOME > データ一覧 > 不満調査データセット > カテゴリ別不満特徴語辞書

カテゴリ別不満特徴語辞書(旧・不満カテゴリ辞書データ)

国立情報学研究所が株式会社Insight Techから提供を受けて研究者に提供しているデータセットです。

2017/11/22 更新

データ概要

「不満買取センター」に2015年3月18日(サービス開始日)から2017年8月1日までに投稿されたデータのうち,特定カテゴリ下に投稿された約472万件より作成された,カテゴリごとに特徴的な単語を抽出した辞書データです。

本データに含まれるのは「カテゴリ」「単語」「単語の品詞情報」「単語のカテゴリ所属スコア」だけであり,特定の個人につながる情報は一切含まれていません。

提供するカテゴリは不満買取センターで運用されているカテゴリおよびサブカテゴリで,総務省の「日本標準産業分類」を参考に株式会社Insight Techがカスタマイズした体系であり,約190万単語について,TF-IDF,PMI(自己相互情報量),SOA の3種類の特徴量抽出手法により算出されたスコアがついています。

データはJSON形式で保存されています。

更新情報

  • 名称を「カテゴリ別不満特徴語辞書」に変更し,データを更新しました。(2017/11/22)
  • 株式会社不満買取センターの社名が株式会社Insight Techに変更されました。(2017/05/11)
  • 「不満カテゴリ辞書データ」の配布を開始しました。(2017/02/27)

提供対象者

本データはどなたでもご利用頂けます。

データ提供方法

以下の「申請・ダウンロード手順」に従い利用者情報をご登録頂ければ,その場で利用者専用のダウンロードページが表示されます。記載内容をご確認の上,データをダウンロードしてください。なお,個別のご要望には応じかねますのでご了解ください。

申請・ダウンロード手順

「カテゴリ別不満特徴語辞書」は以下の手順で申請・ダウンロードしてください。

  1. 以下の申請フォームに必要事項を入力してください。
  2. 株式会社Insight Techが定めた「『カテゴリ別不満特徴語辞書』利用規約」及び国立情報学研究所が定めた「『カテゴリ別不満特徴語辞書』ダウンロードサービス規約」を良く読み,同意いただける場合はチェック欄にチェックしてください。(同意いただけない場合はデータはご利用頂けません。)
  3. 入力した内容を確認の上,「送信」ボタンをクリックしてください(別のWebサーバに接続します)。
  4. ダウンロード用のWebページが表示されます。表示に従ってデータをダウンロードしてください。

注:

入力いただいたデータは統計及び本データを利用した研究業績の収集・整理に利用します。氏名,所属についても,なるべく正式名をご記入ください。できれば和英両方の記入をお願いします。

メールアドレスは利用者メーリングリストに登録させて頂きます。また,メールアドレスはデータへのアクセス制御にも使用しますので,必ずご自分のメールアドレスを正確に記入してください。

申請フォーム


メールアドレス *必須
(最大128文字)

(注意) データのアクセス制御にも使用しますので,ご自分のメールアドレスを正確に記入してください。

氏名 *和英いずれか必須
(最大64文字)

和文:

英文:

所属種別 *必須

所属名称
(最大256文字)

和文:

英文:

利用規約 *必須

以下の規約に同意します。

 

問い合わせ窓口(IDR事務局)

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール: idr [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。

利用者向けページ (既にデータをご利用中の方へ)

不満調査データセットの利用者向けの情報を掲載しています。→ 利用者向けページ