カテゴリ別不満特徴語辞書(旧・不満カテゴリ辞書データ)
国立情報学研究所が株式会社Insight Techから提供を受けて研究者に提供しているデータセットです。
2017/11/22 更新
データ概要
「不満買取センター」に2015年3月18日(サービス開始日)から2017年8月1日までに投稿されたデータのうち,特定カテゴリ下に投稿された約472万件より作成された,カテゴリごとに特徴的な単語を抽出した辞書データです。
本データに含まれるのは「カテゴリ」「単語」「単語の品詞情報」「単語のカテゴリ所属スコア」だけであり,特定の個人につながる情報は一切含まれていません。
提供するカテゴリは不満買取センターで運用されているカテゴリおよびサブカテゴリで,総務省の「日本標準産業分類」を参考に株式会社Insight Techがカスタマイズした体系であり,約190万単語について,TF-IDF,PMI(自己相互情報量),SOA の3種類の特徴量抽出手法により算出されたスコアがついています。
データはJSON形式で保存されています。
更新情報
- 名称を「カテゴリ別不満特徴語辞書」に変更し,データを更新しました。(2017/11/22)
- 株式会社不満買取センターの社名が株式会社Insight Techに変更されました。(2017/05/11)
- 「不満カテゴリ辞書データ」の配布を開始しました。(2017/02/27)
提供対象者
本データはどなたでもご利用頂けます。
データ提供方法
以下の「申請・ダウンロード手順」に従い利用者情報をご登録頂ければ,その場で利用者専用のダウンロードページが表示されます。記載内容をご確認の上,データをダウンロードしてください。なお,個別のご要望には応じかねますのでご了解ください。
申請・ダウンロード手順
「カテゴリ別不満特徴語辞書」は以下の手順で申請・ダウンロードしてください。
- 以下の申請フォームに必要事項を入力してください。
- 株式会社Insight Techが定めた「『カテゴリ別不満特徴語辞書』利用規約」及び国立情報学研究所が定めた「『カテゴリ別不満特徴語辞書』ダウンロードサービス規約」を良く読み,同意いただける場合はチェック欄にチェックしてください。(同意いただけない場合はデータはご利用頂けません。)
- 入力した内容を確認の上,「送信」ボタンをクリックしてください(別のWebサーバに接続します)。
- ダウンロード用のWebページが表示されます。表示に従ってデータをダウンロードしてください。
注:
入力いただいたデータは統計及び本データを利用した研究業績の収集・整理に利用します。氏名,所属についても,なるべく正式名をご記入ください。できれば和英両方の記入をお願いします。
メールアドレスは利用者メーリングリストに登録させて頂きます。また,メールアドレスはデータへのアクセス制御にも使用しますので,必ずご自分のメールアドレスを正確に記入してください。
申請フォーム
問い合わせ窓口(IDR事務局)
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール: idr [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。
利用者向けページ (既にデータをご利用中の方へ)
不満調査データセットの利用者向けの情報を掲載しています。→ 利用者向けページ