Mar. 2018No.79

ITによる新しい医療支援「医療ビッグデータ研究センター」始動

Interview

医療の発展に貢献する画像解析の力

画像診断・検査の分野で医師をサポート

AI のコア技術である深層学習と画像認識を活用して医療画像解析技術の開発をめざす、「医療ビッグデータ研究センター」が動き始めている。現在、四つの医学系学会との共同研究プロジェクトが進行しているが、どのような研究に取り組み、どのような課題が見えてきたのだろうか。また、将来はどのような活用が期待されるのか。画像解析のエキスパートとして研究を支える、佐藤真一センター長と原田達也副センター長が語り合った。

原田達也

Tatsuya Harada

医療ビッグデータ研究センター 副センター長
東京大学大学院 情報理工学系研究科 教授
国立情報学研究所 客員教授 / 理化学研究所 革新知能統合研究センター
医用機械知能チーム チームリーダー

2001年、東京大学 大学院工学系研究科 機械工学専攻 博士課程修了。2013年、東京大学大学院情報理工学系研究科教授、現在に至る。画像認識、機械学習、知能ロボットなどの研究に従事している。

佐藤真一

Shinichi Satoh

医療ビッグデータ研究センター長
国立情報学研究所 コンテンツ科学研究系 教授
東京大学大学院 情報理工学系研究科 教授
総合研究大学院大学 複合科学研究科 客員教授

扱ってわかった医療画像解析の難しさ

佐藤 医療ビッグデータ研究センターでは、現在、日本消化器内視鏡学会、日本病理学会、日本医学放射線学会、日本眼科学会をパートナーに、全国から10 万症例以上の医療画像を集め、AI のコア技術である「深層学習」と「画像認識」を活用して医療画像解析技術を開発するという、前例のない大規模のプロジェクトを遂行しています。そのため、研究体制もNII にある他の研究センターとは異なり、所内のネットワーク、クラウド、セキュリティ、個人情報の専門家に加え、外部の研究者にも参加していただいています。高次画像処理手法の開発とその医療画像への応用で成果をあげておられる名古屋大学の森健策教授、パターン認識と機械学習を専門とされている九州大学の内田誠一教授、そして原田達也教授はディープニューラルネットワークの第一人者と、精鋭ぞろいで心強い限りですが、 5 カ月間、研究を進めてみた印象はいかがですか。

原田 私はこれまで、画像解析でも医療画像は扱ったことがなかったため、一般的な画像の解析とは違った難しさを感じています。例えば、私が担当している内視鏡画像は、食道や胃の内部を写したもので、ぐにゃぐにゃとして輪郭がはっきりしません。これまで画像認識の対象としてきたペットボトルや携帯電話のように形のはっきりしたものとは異なり、コンピュータに認識させにくいことがわかりました。

佐藤 私自身は、特にテレビ放送を対象とした解析技術に取り組んできたのですが、テレビ放送や身の周りの物などは、認識させた結果が正しいかどうか自分で判断できます。ところが医療画像の場合、自分ではその正誤が判断できないもどかしさもありますね。

医師の診断をコンピュータに学習させる

佐藤 医療画像解析の目的の一つは、画像の中から病変が疑われる部分、正常な部分との微妙な差異を見つけ出すことです。それに向けて、まずは医師の診断を学習させるために、各分野のエキスパートの医師に、症例画像の中で診断の根拠となる部分をマーキングした学習用のデータを作成していただいています。その学習用データと健康な人のデータを使ってコンピュータに学習させ、出てきた結果について、月に1 ~2 回開いているミーティングで医師の方々とディスカッションするというプロセスを踏んでいますが、この開発方法についてはどう思われますか。

原田 我々は医療に関しては素人ですし、病理画像を見ても、どの細胞に問題があるのかよくわかりません。また、医師側でどこまでのレベルを求めていて、我々はどこまで応えられるのか、技術的な方向性は合っているのかといった確認も含めて、医師とのキャッチボールは不可欠です。その中で、学習用データや学習モデルの問題点を抽出し、改善して、その結果をまた検証して、というように一歩一歩進めていくしかないと思います。

 病理画像とともに私の担当分野である内視鏡画像では、まずテストデータとして、約10 万枚の健康な人の画像と1000 ~2000 枚の学習用症例データをいただいています。それらを使ってコンピュータに学習させていますが、正常データの数に対して症例データが少なすぎることも、医療画像の特性ではないかと思います。今後、症例データが増えていっても相対的なアンバランスは変わりませんから、そうした条件下で賢い学習システムが開発できれば、技術的なブレークスルーになる可能性があります。そのためのアルゴリズムや理論を突き詰めるのも、研究者にとっては一つのチャレンジと言えます。

佐藤 深層学習で画像認識精度を高めるには、いかに大量のデータから学ばせるかがカギになります。ただ、診断根拠にマーキングした学習用データの作成には、病理画像を例にとると、一点について数十分から1 時間程度要するそうです。医師の方々は、AI を画像診断に活用することへの期待から、忙しい中で労を惜しまず協力してくださっていますから、我々もそれに応えなければなりませんね。

原田 ここ数年の深層学習の進歩で画像解析の精度も飛躍的に向上していますから、期待が高まっているのもうなずけます。囲碁や将棋のように、トップクラスの人のスキルをしのぐような精度を出すのは難しくても、ある程度のレベルでの診断サポートや、スクリーニングに使えるようなシステムができれば、有用性は高いでしょう。

研究者としてやりがいのある仕事

佐藤 すでに成果の一つとして、内視鏡画像のテストデータについて、食道や胃の上中下部、十二指腸など、「どこを写したものか」を自動的に高精度で判定してラベル付けする技術を開発しています。これは、医師のレポート作成の支援に役立ちます。

原田 内視鏡の検査では、食道から胃、十二指腸へとカメラを動かしながら、医師がチェックすべきポイントや気になった箇所で画像を撮影するそうです。ということは、撮影した画像の中には、医師が何も感じなかったものと、「おかしいな」と感じたものが混在していることになる。早期発見をめざすのであれば、明らかな症例だけでなく、医師が判断に迷ったようなケースにもデータとしての意味があるはずです。今後はそれらを拾い上げる方法も考えていく必要があるかもしれません。

佐藤 医療とAI 研究という異分野の協働を通して、違った角度からの気づきもあるでしょう。それらを共有しながらよりよい成果に結びつけたいですね。

 三つのプロジェクトは2017 年度末でいったん区切りを迎えますが、そこまでのミッションは、複数の病院から医療画像データを安全に集める仕組みの構築や、深層学習技術を用いた画像解析の試験的研究です。前者については、「SINET5」を活用して大量の医療画像データを安全に転送、管理する基盤を構築しました。後者についても、厳選したデータだけを学習に用いるという条件下であれば、正解を100 点とすると80 点台のスコアが出るぐらいの認識精度は達成しています。実用化のレベルとなる99 点以上の達成に向けて、ある程度の手応えは得られました。

原田 医療にAI を活用する動きは海外でも見られますが、人種固有の体質や疾病があることを考えると、日本人のデータを用いた診断支援システムを開発することは重要ですね。医療の発展という社会的な利益に直結する仕事は、研究者としてもやりがいがあります。

佐藤 医療ビッグデータ研究の究極の目標、AI による自動診断の実現にはまだまだ時間を要しますから、まずは、症例数の多い疾患の判定で平均的な医師のレベルを超えることをめざします。画像診断や検査の分野で医師をサポートすることで、見落としの防止や業務の効率化といった側面から医療の質の向上に貢献できるよう、引き続き研究に努めましょう。(取材・文=関亜希子 写真=佐藤祐介)

第79号の記事一覧