研究 / Research

コンテンツ科学研究系

高須 淳宏
TAKASU Atsuhiro
コンテンツ科学研究系 教授/主幹
学位:1989年 工学博士(東京大学)
専門分野:コンテンツ基盤
研究内容:http://researchmap.jp/takasu/
研究室WEB センシングデータの収集・蓄積・解析基盤システム

サイエンスライターによる研究紹介

大量のデータ群から有用な情報を引き出す

現代の情報化社会では、世界中で日々さまざまなデータが収集され蓄積されています。これらを解析・解釈して使えるようにしなくては、データを集めている意味がありません。しかし、現実にはデータの量があまりにも多く、人間の処理能力を超えている状態です。人間の能力を高めるには限界があるので、その能力を補助するしかけが必要になっています。大量のデータ群から有用な情報を引き出し活用することができる社会、また、それによって人類の情報知識が蓄積する社会の構築を目指し、研究に取り組んでいます。

ユーザーの意図を取り込む

データから情報を発見する学問領域は統計学ですが、統計学の基本的考え方は「データに語らせる」、つまり、データの中にひそむ何らかのパターンを見つけ情報を取り出そうというものです。これに対し、私が取り組んでいるのは、ユーザーの情報や意図をどのようにモデルの中に取り込み、その人にとって有用な情報をいかに効率的に取り出すことができるかということです。
そのためには、人とコンピューターとのインタラクションが必要です。最初のレベルは、コンピューターが提示する、例えば、「こんなデータがありますが、これはあなたの目的に合っていますか」などという問いに対し、ユーザーが「はい」や「いいえ」を選択し、それにコンピューターが反応して、データがだんだん精査されていく仕組みです。この最初のステップは研究もずいぶん進んでいるので、現在私は、より精度の高いインタラクションの仕組みを研究しています。例えば、人工衛星のような複雑なシステムの設計・開発をコンピューターで支援するためには、数多くの構成部品に関する個々のデータや部品相互の関係をコンピューターで管理することになります。具体的には、部品に関する情報を表やグラフ、あるいは枝分かれするようなデータ構造(ツリー構造)などを用いて表します。そして、データ構造から、類似部品との比較を行ったり、代替部品を探したりするなどの操作を行います。ユーザーがこの操作を自在に進めるには、高精度の類似検索技術が必要です。私はこの研究に取り組んでいます。
具体的には、枝分かれのようなデータ構造である「ツリー構造」を使って情報をやり取りするメカニズムを研究しています。

データクリーニングにも活用

この技術は、データクリーニングにも適用できます。例えば、NII は大量の図書データを持っていますが、その登録方法が人によってさまざまだった場合、同じ本でも同じだということがわからなくなる可能性があります。そのようなとき、人が「このデータとこのデータは同じだ」とか「この部分を照合すればいい」などの指示をコンピューターに与えることで、データがすっきりまとまり、使いやすくなります。
人に負担をあまりかけず、コンピューターとの効率のいいインタラクションによって、いかに有用な情報を引き出せるか、そして、その結果として情報知識を深めることができればと思っています。

PDFをダウンロード


取材・構成 村上朝子

注目コンテンツ / SPECIAL