研究シーズ2017情報メディア科学

ビッグデータを研究し産業と学問をつなぐプラットフォームをつくる

大須賀 智子データセット共同利用 研究開発センター 特任研究員

研究分野研究⽤データセット/共同利⽤/データサイエンス

研究背景・目的

近年、情報学分野では、ウェブ上にあるテキストや、音声、画像、映像、センサーデータなど、実社会で生成された大規模なデータが研究に必須の資源となっています。個々の研究者や大学等でこれらのデータを取得することは難しく、また研究の透明性や再現性の確保も問題となります。そこで我々は、個々では整備できない研究資源や研究環境を、大学等の研究者に「共同利用」として提供する大学共同利用機関の使命に基づき、「情報学研究データリポジトリ(IDR)」を介して、これらのデータを持っている産学界と、データを使いたい大学等の研究者との橋渡しをすると共に、データ提供者を巻き込んだ研究コミュニティーの活性化に努めています。

研究内容

「オープンサイエンス」という世界的動向の下、研究データについてもオープン化の動きが進んでいますが、観測結果等のデータとは異なり、民間企業の実サービスで生み出されたデータは、権利関係等の制約があり広くオープンにはなっていません。 そこでIDRでは、データ保有者及び研究者それぞれに対する窓口となって、契約手続きや利用者管理などを引き受け、学術研究目的に限りデータを配布。双方がコストを抑えつつ安心してデータを利用できる環境を提供しています。 2010年の設置から実績を積み上げることで、徐々にデータ提供者は増えており、現在では「Yahoo!データセット」「楽天データセット」をはじめ、7社のデータを取り扱っています。データの利用者も延べ約600研究室と年々増加しており、提供したデータを用いた研究成果も量的に厚みを増すとともに、多様化も進んでいます。

17-osuga-02.jpg

産業応用の可能性

自社で保有しているデータを提供いただき、学術界で広く研究に利用してもらうことで、自社内では気づかなかったデータの活用や新たな技術開発に加え、社会貢献や人材確保へもつながることが期待できます。データ提供者と利用者とが一堂に会するIDRユーザフォーラムでのイベント企画や、評価型ワークショップNTCIRのタスク提案・運営など、研究コミュニティーの中に自ら参画することもできます。IDRでは今後更に、より踏み込んだデータを使った密な共同研究のためのマッチングの場を提供するなど、産学連携に根ざした共同利用の深化に取り組んでいきます。

連絡先

大須賀 智子[データセット共同利用 研究開発センター 特任研究員]
osuga[at]nii.ac.jp ※[at]を@に変換してください

Recommend

さらにみる