イベント / EVENT

平成30年度 第5回 リポート

データセットの安全な共同利用に向けて

 国立情報学研究所は11月20日、平成30年度 市民講座「情報学最前線」第5回を開催し、コンテンツ科学研究系 大山 敬三教授(NIIデータセット共同利用研究開発センター長)が、「リアルデータの『共同利用』-あなたの情報が学術研究に!?でも大丈夫-」と題して講義しました。

 近年、ウェブ上にあるテキストや音声、画像、映像、センサーデータなど、実社会で生成された大規模なリアルデータが情報学研究に必須の資源となっています。しかし、個々の研究者や研究機関がこれらのデータを取得することは難しく、また、研究の透明性や再現性の確保が問題になります。そこで、NIIは、情報学研究データリポジトリ(IDR)を設置し、様々な民間企業や研究機関が保有する各種のデータセットを受け入れ、IDRを介して研究コミュニティーに「共同利用」というかたちでデータ提供を行っています。現在、IDRで取り扱っているデータセットは、「Yahoo!データセット」「楽天データセット」「クックパッドデータセット」など多岐にわたります。

 講義の中で大山教授は、データ提供元のサービス利用者(ユーザー)に関わるリスクに触れ、データセットの共同利用に際しては、企業、IDR、研究者が連携して、データ利用のルールを決めたり、本人が特定できるデータを削除または匿名化するなどデータを整備したりして、データを安全に利用できるように対策を行っていることを説明しました。その上で、「研究の深化には、時系列データやユーザーログなど、よりディープなデータが必要。それに伴い、利用目的や利用方法、データセキュリティの厳密な管理が重要になるため、ユーザへの情報開示や理解の増進に努めていきたい」と述べました。

 参加した方からは、「企業が扱うデータを提供することで得られるメリットがあることを知った」「共同利用のおかげで『安全』の担保とデータ活用研究の両立が行なわれていることがわかった」などの感想が寄せられました。

pic_shimin_report_h30_5-2.jpg

データセットの安全な共同利用について話す大山教授

pic_shimin_report_h30_5-1.jpg

市民講座「情報学最前線」第5回の様子

shimin 2018-report-5 page3408

注目コンテンツ / SPECIAL