研究シーズ2018知能システム科学

データやモデルの幾何的構造を大切にした機械学習技術の研究

杉山 麿人情報学プリンシプル研究系 准教授

研究分野機械学習/データマイニング/バイオインフォマティクス

研究背景・目的

人工知能の要素技術である機械学習がさまざまな応用分野で注目されています。機械学習の目的は、経験から学習して自動的に賢くなる計算機プログラムをつくることで、自動運転、音声認識、創薬、不良品検知、ゲームなど応用は多岐にわたります。インターネットやIoTの普及などによるデータ量の増加(いわゆるビッグデータ)、GPU等の計算機ハードウェアの発達、そして学習アルゴリズムの理論的発展によって、いろいろなことが一気にできるようになり、とてもエキサイティングな状況です。しかし、機械学習の応用分野が広がるにつれて、より高い信頼性が求められます。そこで、機械学習の健全性を担保し、さらなる応用の可能性を広げるための理論的および実践的研究を進めています。

研究内容

データに内在する構造や、機械学習で用いる計算モデルが持つ構造に着目し、これらを適切に取り扱うための機械学習手法を研究しています。これによって、データが多数の変数で記述されているとき、どの変数(の組合せ)が効いているのか、計算モデルが複雑な構造を持っているとき、どの構成要素が重要なのか、といったことを調べることができるようになり、より信頼性の高いデータ解析が実現できます。具体的には、情報幾何を用いて構造を持つ対象の空間や幾何を解析し、各対象が持つ情報量を分解します(図)。また、パターンマイニング技術によって、膨大な解空間から必要な候補を高速に見つけ出します。これらの技術の集積によって、信頼性が高く効率的な機械学習手法を構築すると同時に、情報理論的、統計的観点から、機械学習で得られる結果をより深く評価します。

18-sugiyama-image1.png

図 離散構造を持つデータや計算モデルを幾何的空間で捉えることで、機械学習や統計的解析を実現

産業応用の可能性

情報幾何を用いた情報量分解技術は、汎用的な手法として、幅広いデータ解析に使えます。特に、データが多数の変数で表現されているときには、変数間の関連を調べることができるので、例えばヘルスケアへの応用などが考えられます。また、一般には、データがグラフやネットワークなどの離散的な構造を持っているとき、その構造を適切に考慮することができるので、化合物データや時空間データの解析などが可能です。

連絡先

杉山 麿人[情報学プリンシプル研究系 准教授]
mahito[at]nii.ac.jp ※[at]を@に変換してください

Recommend

さらにみる