ニュース / News

お知らせ

「Yahoo!知恵袋データ(第3版)」の提供を開始

 国立情報学研究所 データセット共同利用研究開発センターの情報学研究データリポジトリ(IDR)では、ヤフー株式会社の協力の下、大学および公的研究機関の研究者を対象に、「Yahoo!知恵袋データ(第3版)」の提供を開始いたしました。

 「Yahoo!知恵袋」とは、質問したい人と回答したい人をむすび、知恵と知識を参加者同士で共有することを目的として、2004年4月からヤフー株式会社が提供している日本最大の知識検索サービスです。

 今回提供するデータは、「Yahoo!知恵袋」において解決済みとなった質問と回答についての、質問・回答のID、質問のカテゴリ、質問・回答のタイトルおよび本文、投稿および解決の日時、ベストアンサーフラグ、画像付きフラグ、投稿デバイスです。投稿者を特定できる個人情報は含まれておりません。

 提供データは年度ごとに更新され、データの収録期間は、年度を単位として提供時期より3~5年前の3年間です。データには、データ収録期間に投稿され解決した質問の10%をランダムサンプリングしたものと、それらの各質問に対するすべての回答が含まれます。

今回提供のデータ(2018年度提供版)
収録期間:2013年4月1日〜2016年3月31日
質問数:約250万
回答数:約625万

 データの使用期間は、提供を開始した年度を基準として最大5年間です。各年度版の提供は当該年度限りとなります。

 データの内容や利用条件、申請方法等の詳細については以下をご覧ください。

 → 情報学研究データリポジトリ Yahoo!知恵袋データ(第3版)
   https://www.nii.ac.jp/dsc/idr/yahoo/chiebkr3/Y_chiebukuro.html


 提供データは今後も増やしていく予定です。研究に広くご活用いただければ幸いです。

関連リンク
3465

注目コンテンツ / SPECIAL