Interview
医療ビッグデータ 研究センターがめざすもの
医療画像データの収集と解析で日本の医療を支援する
医療ビッグデータの活用に社会の注目が集まっている。NIIは2017年11月、国内の医学系学会の画像情報を集めて解析を進める「医療ビッグデータ研究センター」を設立した。その目的は、ネットワークやクラウド、セキュリティ、人工知能(AI)などの最先端情報技術を活用して、医療分野の課題解決を促すことにある。センター設立の狙いと今後の展望について、喜連川優所長に聞いた。
喜連川 優Kitsuregawa Masaru
国立情報学研究所 所長
館林牧子Makiko Tatebayashi
読売新聞社 医療部編集委員
1988年、京都大学理学部卒業、読売新聞社入社。科学部などを経て、2016年から医療部編集委員。
館林 センターを設立した経緯を教えてください。
喜連川 日本医療研究開発機構(AMED)の「医療のデジタル革命実現プロジェクト」という事業の中で、医療健康分野での人工知能(AI)などを開発していくICT基盤をつくるという課題があります。これまでに日本消化器内視鏡学会、日本病理学会、日本医学放射線学会、日本眼科学会の4医学会が採択され、NIIがパートナーになりました。それを機に、NIIの方でも受け手となるセンターを設立することになったのです。
各医学系学会が病院等から医療画像を集め、それを匿名化し、NIIが2017年末に構築した「医療画像ビッグデータクラウド基盤」に投入します。このクラウドにはITの研究者、医療の研究者がアクセスでき、協力してその解析をすることが可能になります。プロジェクトではAIという言い方をしていますが、具体的には機械学習や深層学習を使った医療画像解析により、病気の診断支援システムをつくることが研究課題になります。すなわち、ビッグデータ循環系と解析系が統合したプラットフォームの構築をめざしています。
館林 医療ビッグデータの拠点というわけですね。
喜連川 医療現場では、検査技術の進歩で膨大な情報がとれるようになりました。現在はむしろ、検査情報がありすぎて困る時代になりつつあります。情報を「とる」だけでなく、情報を「見る」側のテクノロジーも並行して高度化していく。つまり、情報を見て、分析し、診断するためにも高度な技術が必要になってきています。そのため、診断を支援する技術の開発が必要となっているのです。
ビッグデータ解析の立場からみると、この分野の研究では、大量の情報を収集し、解析できるデータにしていく過程が実は大変です。今回のプロジェクトでは、NIIが構築・運用する学術情報ネットワーク「SINET5」という極めて高速なネットワークを利用して、継続的に情報をセキュアに収集し、さらにそれをセキュアなクラウド上に格納します。少量のデータを集めて小規模な解析をするという従来の研究スタイルではなく、圧倒的に大規模なデータを扱おうとすると、ネットワーク、クラウド、セキュリティといったITの総合力が必須になります。解析はとても重要ですが、それだけでは全くもって不十分です。以前、データマイニングの時代によく言われていたのは、データの収集・整理に必要となる時間は全体の90%、マイニング時間は10%以下ということでしたが、AIになってもたいして変わりません。プロジェクトの成否は、いかに大量かつ高品質のデータを集めるかにかかっています。医療分野でITの果たす役割が大きくなっていく中で、今、日本の次のステージに向けた医療ビッグデータ基盤整備をしっかりやっていこうというわけです。
館林 ビッグデータで医療はどう変わるのでしょうか?
喜連川 病理診断では、2人以上の病理医が診断することが望ましいとされていますが、実際には1人しかいない病院が多いと聞いています。スクリーニングなどの簡単な部分はITがかなりお手伝いできるかもしれません。
珍しい症例、例えばお医者さんが一生のうちに1度しか診ないような場合でも、内視鏡医が1万人いるとすると1万の症例が蓄積できる。その蓄積したデータを解析して、知見として活用できれば、高い確率で特定できる可能性があるわけです。
1人の患者さんの継続した検診画像がある場合、いったいどの時点で病気が発見できるのかという時間を遡る研究もできると思います。日本のように医療制度が整っていて、医療機関がきちんと検査データを保管している国だからこそできるテーマにも着目しています。
館林 情報学からみた医療ビッグデータ解析の面白みは?
喜連川 今日のITの研究者は引く手あまたです。やれることではなく、やるべきことを選んでいます。私どもは、この研究はNIIがやるべき研究と判断しました。膨大な数の国民のデータを利用するわけですが、私企業がこの種の画像収集・蓄積・解析基盤を構築することには社会的な抵抗があるかもしれません。その抵抗感が公的研究機関であれば、少し軽減されるのではないかと感じた次第です。もちろん、最近生まれた深層学習を中心とした画像解析の基礎研究において、実際に社会に役立つ応用を念頭に理論研究を推進することは研究者にとってたいへんエキサイティングですし、十分なデータが揃う応用テーマに巡り会えることは喜びです。
館林 NII以外の研究者も参加しているそうですね。
喜連川 それが今回の大きな特徴でもあります。画像解析等はグローバルな視点では多様なコンペの場が提供されています。いろいろなプレーヤーが集まり技術を競う場をつくることが重要です。現在、東京大学、名古屋大学、九州大学からの参加がありますが、オールジャパンで、もっと多くの方々に参加していただけるように工夫するとともに、そのような場をつくろうと思っています。
NIIと同じく、情報・システム研究機構に属する統計数理研究所(ISM)では、2018年4月1日に医療健康データ科学研究センターを立ち上げます。今後は、このISMの医療健康データ科学研究センターと可能な領域で連携し、医療ビッグデータ解析の研究を加速させていきたいと考えています。
館林 できたシステムの商用化などはどうお考えでしょうか?
喜連川 まだできてもいないものの知財の心配をする段階ではないと判断し、プロジェクト終了時の2018年3月末までの期間では、いっさい考えないこととしました。企業からのアプローチに関しても、遠慮しています。ただ、一定程度成果が出ている学会もあるので、4月以降、支援をいただいているAMEDとしっかりと検討を深めていきたいと考えています。私は内閣府知財本部に関連する委員会にも参加していますが、深い検討が必要なテーマと理解しています。
館林 日本はこの分野で世界をリードできるでしょうか?
喜連川 IBMがなぜ医療機関を買収しているか、グーグルがなぜ自動運転車の公道テストで地球何周分も自動走行しているか。現状のアルゴリズムでは、データがないと学習できないからです。個々の病院ではなく、日本の多くの医学系学会と協働で取り組む今回のフレームワークは、従来にはなかったことではないかと思います。
今回の医療画像ビッグデータの場をつくるためには多様な情報分野の技術の結集も必要です。NIIにはセキュリティのチームも、クラウドの専門家も、インフラのチームも、また、個人情報の法制度に通じた専門家もいます。もちろん、画像解析のトッププレーヤーもいます。ITの総合力を結集するという意味でも、IT全体の専門家が集うNIIがお手伝いさせていただくことで、大きな機動力を提供できていると感じています。
ただ、まだ始まったばかりですので、成果はこれからに期待していただければと思います。まず身の丈に合った課題を学会から頂戴し、きっちりと成果を出す中で、医療側から「それなら、こんな問題解けますか?」という声が出てくるようなキャッチボールをしていくことで、よりよい循環が生まれるのではないかと期待しています。
手堅いことを言っているように感じられるかもしれませんが、そうでもありません。あまりにチャレンジングすぎると解けないかもしれないものの、ぶっとんだ問題にも当然挑戦したいと思っています。夢想することはたくさん出てきています。先日もお医者様から、「え、そんなことが結構出来るのですね」と褒めていただきました。次回のインタビューを楽しみにしていてください。
(写真=佐藤祐介)
インタビュアーからのひとこと
最近、大病院の医師たちから、「診療データをAI解析する共同研究を企業から提案されたけれど何をするのか。個人情報の取り扱いも心配」という戸惑いの声を聞いた。ビッグデータが世界を変えつつあると言っても、診療に多忙を極める医師の耳には届いていないらしい。こうした医師たちにとっても、医学系学会、NIIが中心となった今回の枠組みは、理解を得やすいかと思う。
身体に負担の少ない手術、個々の患者の遺伝子変異を解析して治療につなげる「がんゲノム医療」─。医療費の問題はあるが、先端技術で救われる患者は着実に増えている。多方面と協力関係を築き、患者が恩恵を実感できるプロジェクトに成長するよう、現場の努力に期待したい。