Sep. 2018No.81

機械学習のための新しいソフトウエア工学AIの品質をどう担保するか

Interview

一本の論文で世界は変わる 国内外と連携し、課題に挑む

「一部の研究者が手がけてきた機械学習が注目を浴び、さまざまな領域での応用が期待されている。基礎を担ってきた我々研究者としてはたいへん嬉しい。安全性など課題が見え、プレッシャーも感じるが、ここでなら世界を変える研究がやり遂げられる」 機械学習研究の第一人者、杉山将東京大学大学院教授はこう語る。 杉山氏がセンター長を務める理化学研究所 革新知能統合研究センターでは総勢600人ほどの研究者が国内外の組織と連携し、機械学習以外の方法論も含めて、応用や課題を意識した活動に取り組む。杉山氏に現状と課題、研究者の役割を尋ねた。

杉山 将

Masashi Sugiyama

2001年に東京工業大学 情報理工学研究科にて博士(工学)の学位を取得。同年、同大学助手。2003年同大学准教授。2014年東京大学教授。
2016 年より理化学研究所 革新知能統合研究センター( AIPセンター) 長を併任。
機械学習とデータマイニングの理論研究とアルゴリズムの開発、および、その信号処理、画像処理、ロボット制御などへの応用研究に従事。

聞き手Nobuyuki Yajima

1960年生まれ。大学で数学を学び、コンピュータのエンジニアをめざしたが、 1985年日経マグロウヒル社(現・日経BP社)に入社、『日経コンピュータ』誌の記者になる。
2009年から『日経コンピュータ』編集長。2016年から現職。

方法論を担う研究者として品質への責任を果たす

世の中が一変した

 「世の中、変わったよね」。

 機械学習の研究者が集まるコミュニティで時々こんな話になります。私は20年ほど機械学習の研究をしてきましたが、かつては時流に乗っていない分野でしたから、好きなことを好きなように研究できました。しかしディープモデルを使った機械学習、いわゆるディープラーニングが一大ブームになり、社会のあちこちで応用され、それが大きく報道され、多くの方から我々研究者に声をかけてもらえる ようになりました。研究者が考案したアルゴリズムが社会で実際に使われる。責任重大です。「楽しかった昔に戻れないね」と言い合ったりしています。

 世界の超大手企業が巨額の研究費を投入して研究する分野になりましたが、まだまだ解決できない問題は多い。機械学習やディープラーニングの拡張が必要ですし、まったく新しいやり方もありえるわけで、研究者のやりがいは変わりません。

 私が取り組んでいるのは、集めたデータをコンピュータによって統計処理し、問題を解くアルゴリズムです。複数の問題に使える汎用性があるアルゴリズムや、不完全なデータからでも学習できるアルゴリズムなどを考案してきました。一方、アルゴリズムを裏付ける数学理論に取り組む研究者もいます。基礎となる方法論を両者で研究しているわけです。

 方法論は研究者の発想しだいで優れたものをつくれますから、「一本の論文で世界が変わる」研究成果を日本から出せると考えています。ディープラーニングも2006年に出た一本の論文がきっかけで、あれだけのブームになったわけですから。

誰もやらない問題に取り組む

 私は革新知能統合研究センター(AIPセンター)のセンター長として、研究者を探したり、海外の大学と協力関係を結んだり、企業と提携して共同研究をする関係を築いたり、といった仕事をしています。

 AIPセンターには今、フルタイムで120 人、パートタイムで500人の研究者がいます。機械学習だけを研究しているわけではありませんし、方法論の研究に留まらず、応用に近い研究にも取り組んでもらっています。

 AIPセンターでは10 年間、じっくり研究ができます。これは世界でも例を見ない研究環境です。基礎に近い研究者の皆さんには「訳がわからないと言われてもかまわないから、解決できない問題を自分で見つけて挑戦し、10年後に一発当ててください」とお願いしています。画像処理や自動翻訳など、楽しそうな基礎研究の領域はあるのですが、世界の超大手企業が血眼で取り組んでいますから、そこはあえて避けています。

 訳がわからなくてもよいというのは、「なぜそんな問題に取り組むのか」と周囲から言われるような問題を見つけることが大事だからです。どう解くのかまったくわからない問題と格闘するうちに、新しい方法論にたどりつくことを期待しています。

 応用に近い研究者は他の科学分野、例えば医療や材料科学などを支援する研究と、防災や社会インフラ整備、高齢者のヘルスケアといった社会問題をにらんだ研究に、それぞれ取り組んでいます。応用といってもAIPセンターにいるのは情報系の研究者ですから、医療や材料の研究者の方や企業、社会問題に取り組んでいるパートナーの方と連携して研究を進めています。

pic_niitoday_81_2-1.jpg

課題はロバストネス

 一人の研究者として研究に取り組み、AIPセンター長として数々の研究を見てくると課題がはっきりしてきます。研究者の間で今、最もホットなテーマは「ロバストネス」です。変化に強い方法論をどう用意するか。安全性あるいは品質への配慮ということです。

 我々が研究する場合、ある問題をいったん抽象化してモデルにし、それを解くアルゴリズムを考えます。つまり綺麗な前提で綺麗な解き方を用意する。ところが応用の世界に入ると前提がすぐ変わる。そうなると前提が揺らぐことが前提となっているような、すべてを綺麗に決めておかない緩いモデルでも答えを出せるアルゴリズムが必要になってきます。

 公平性や透明性という課題もあります。過去のデータに基づいてコンピュータに何かを判断させる場合、過去の人間の判断があまり公平でなかったとしたら、今後も公平でない判断をコンピュータが下しかねない。公平性については、日本ではあまり言及されていませんが、欧米は重要視しています。透明性とは、なぜそう判断をしたのか、はっきり示せるようにすることです。

 いろいろな課題がありますが、方法論を担う研究者からすると、汎用性のあるコアの部分を押さえればよいはずだと考えます。実際、コアを押さえるやり方で、アルゴリズムの実装に苦労する、良いデータを集められない、といった課題に取り組んできました。安全性より前の実装段階でこうした課題があったのです。

 実装について、私は「確率密度推定」という考え方を使って、ある程度まで汎用性があるアルゴリズムを複数集めたフレームワークを用意し、それを企業に使ってもらいました。特定の問題に特定のアルゴリズムを実装するやり方ですと、エンジニアの方がそのつどアルゴリズムを勉強しなければならず、時間とコストがかかっていました。

 データ収集については、不完全なデータやスモールデータから判断できるアルゴリズムを研究しています。ビッグデータ時代と言われますが、それはインターネットサービスの分野くらいで、製造業や医療、社会インフラといった他分野では皆さんデータ収集に苦労されています。

 ロバストネスを考えていくと方法論の研究だけでは足りません。AIPセンターに弁護士など法律の専門家に来ていただき、社会に応用した際の倫理あるいは法的な課題を研究しています。応用に近い側の研究者との協力関係をもっと密にする必要もあります。

 先日、「機械学習工学研究会」(2~3頁参照)の会合に呼んでいただき、集まった方の熱意に衝撃を受けました。方法論は大事ですが、しょせんはアルゴリズムですから、実装するにはソフトウエアエンジニアの方が不可欠です。実装するといろいろな課題が見つかり、我々はアルゴリズムや理論を見直すわけです。

 AIPセンターにはソフトウエア工学の研究者は少ないので、ソフトウエア工学側から我々を呼んでもらえるのはたいへんありがたいことです。我々からもソフトウエア工学側へ貢献していきたいと思っています。

(写真=佐藤祐介)

インタビュアーからのひとこと

研究者と組織の長を兼ねる。激務である。だが、杉山氏は研究を続けながら、その成果をまとめた書籍を英文で準備し、良い人材を求めて国内外を飛び回る。考案した方法論を企業に提案するなど、研究者の頃からコラボレーションに積極的だった。その姿勢があるから組織の長をこなせているのだろう。研究者あるいはセンター長として、ぜひ一発当ててほしい。

第81号の記事一覧