分野横断型融合研究のための実用的な情報空間を構築する方法を実証的に追究します。特に、専門的な知識記述(論文や専門辞書、教科書)と、非専門家向けの知識記述(科学雑誌や新聞)等を大規模・横断的に収集し、これらを研究者の自由な発想で動的に結合・統合する手段、情報の類似性に基づく大規模・異種データ群の連想的な結合・融合と自動分類の実現を目指します。 このため、連想的に結合された異種データの有用性を示すため、環境問題を具体例として、論文、専門辞典、教科書、新聞記事、書籍、特許など多様な情報を、テーマ別に自動分類する方式について研究します。
また、異分野研究者間コミュニケーションのギャップを埋めるため、生命科学分野を具体例にとって、コミュニケーションを阻害する原因となっている表現(固有名称の多用や遺伝子の機能構造に関する自然言語表現など)の解決法を追究しています。さらに、異種情報源から情報内容の類似性に基づいて関連情報を収集し、これらの概観が容易な形で提示する情報システム等、方式や手法を実装したシステムを試作、その有効性の実証を行います。
連想検索、汎用連想計算エンジンGETA:
http://geta.ex.nii.ac.jp/
大規模・複雑で急速に増大・進化し続ける情報空間から新しい情報を汲み出していく仕組みを、情報空間の中核となっている要素間の「参照」や「つながり」を表わす情報(「リンケージ情報」と総称)の活用によって解明することを目指しています。
図1:共著関係を表したグラフを用いた論文の著者同定
著者名(suzuki.k)を含む6論文についての共著関係を表すグラフ。共著関係の分析から、2つの連結成分(点線の円)に分類・分離され、同名の別著者の存在を解明。
(※画像をクリックすると、別ウィンドウで拡大画像が開きます。)
このため、リンケージ情報を収集・解析し、活用するための横断的な研究が具体的な課題です。まず、機械学習や情報検索の最新の成果に統計分析的な観点を導入することで、効率的で対象データに依存しないリンケージ情報収集・処理技術の開発を目指します。また、引用文献によるリンク構造や研究者どうしの関係ネットワークに注目して、情報や統計、生物、地球など各学問領域の研究者と協力してビブリオメトリックス分析を行います。これにより、融合分野における学問分野の構造的変化、研究コミュニケーションネットワークの形成過程、研究の国際連携・セクター間の連携の実態などについて、解明を図ります。