Sep. 2020No.89

COVID-19と向き合う情報学の挑戦データから新型コロナウイルスをみる

Interview

CT画像の解析結果を感染症対策に役立てる

学会や大学と連携してCOVID-19肺炎の診断支援AIを開発

現在、COVID-19の診断にはPCR検査が用いられているが、より精密な診断や予後の予測にはCT(コンピュータ断層撮影法)検査が有用だという。とくに日本の医療機関における人口あたりのCT装置保有台数は世界一を誇り、CT画像データの活用に大きな期待が寄せられている。そうしたなか、NIIの「医療ビッグデータ研究センター(Research Center for Medical Bigdata :RCMB)」は日本医学放射線学会とともに、収集したCT画像を用いてCOVID-19肺炎の診断支援AI(人工知能)の開発を進めてきた。その成果とRCMBの取り組み、医療支援AIの可能性などについて、日本医学放射線学会の青木茂樹理事長とRCMBの佐藤真一センター長に聞いた。

青木茂樹

Shigeki Aoki

順天堂大学大学院医学研究科 放射線診断学 教授/日本医学放射線学会 理事長
1959年東京生まれ。1984年 東京大学医学部卒業。臨床研修の後、1987年米国UCSF(カリフォルニア大学サンフランシスコ校)神経放射線部門留学。1995年山梨医科大学放射線部助教授、2000年東京大学大学院医学系研究科放射線医学助教授を経て、2008年より現職。現在、日本医学放射線学会理事長の他、日本磁気共鳴医学会理事長、中央社会保険医療協議会技術評価委員。2012年第107回医師国家試験委員長。

佐藤真一

Shinichi Satoh

国立情報学研究所 コンテンツ科学研究系 教授/医療ビッグデータ研究センター センター長

田井中麻都佳

聞き手Madoka Tainaka

『NII Today』編集デスク/サイエンスライター
2012年より『NII Today』編集デスク。中央大学法学部卒。科学技術情報誌『ネイチャーインタフェイス』編集長、文部科学省 科学技術・学術審議会情報科学技術委員会専門委員などを歴任。書籍編集や執筆、大学や企業の広報媒体を中心に活動中。NIIの河原林健一氏との共著『これも数学だった!?~カーナビ、路線図、SNS』(丸善ライブラリー)がある。専門家の言葉をわかりやすく伝えるインタープリターの役割を追求している。

より精密な診断や予後予測に役立つCT検査

─ COVID-19の診断に、CT検査はどのように活用されているのでしょうか ?

青木 COVID-19の方の肺のCT画像を見ると、多くの場合、ウイルス性肺炎特有のすりガラス状や網目状の影が見られます。さらにそれが1カ所だけでなく、末梢や両肺に見られるのが特徴的です(図1)。たとえば多くの感染者を出したダイヤモンド・プリンセス号では、PCR検査で陽性となった方のうち、112例についてCT検査が実施されました。そのなかで症状があったのは30例で、82例は無症状でしたが、この82例の半数以上の44例の肺にCOVID-19に特徴的とされる所見が見られたのです。CTはX線写真と比べてたいへん感度の高い検査方法なので、微細な病巣の検出に役立つといえます。

niitoday89_1-1.png

図1│左の写真は症状もなく、偶発的に見つかったCOVID-19肺炎の症例。特徴的なCTの所見から感染を疑い、その後PCR検査で陽性と判明した。CTはCOVID-19の診断に有用だといえる。ただし、CTでは病変を指摘できない症例や、右の写真の赤丸で示すように感染初期では変化が軽微で専門家でないと病変を指摘しにくい場合がある。このような人間では見つけにくい病変をAIが判別することが期待されている。(画像提供:順天堂大学医学部放射線医学教室・放射線診断学講座 明石敏昭 准教授)

―― 無症状の方の半数以上に肺の炎症が見られたのは驚きです。

青木 人間の身体は予備能が高いため、組織の形状が多少変化しても正常範囲内で機能するということはよくあることです。沈黙の臓器と言われる肝臓などは、肝硬変でカチカチに硬く小さくなってしまっても、症状が出ないことがあります。つまりCT検査は、無症状の方の病巣を見つけたり、より精密に症状を把握したりするのに有効なのです。
 ただし、CT検査をCOVID-19のスクリーニングに使うことは学会としては推奨していません。というのも、CTは感度は高いものの、特異度は比較的低いためです。特異度が低いとは、陰性のものを間違って陽性と判断してしまう可能性が高いということ。肺線維症やそのほかのウイルス性肺炎と区別することが難しく、感染初期では変化が軽微なこともあって、専門医でないと病変を見つけにくいのです。
 もっとも、ほかのウイルス性肺炎が蔓延していない状況であれば、肺に疾患のない患者群に対してCT検査をCOVID-19のスクリーニングに用いることは、ある程度は効果があります。したがって、学会のガイドラインでは、CT検査をPCR検査の代用とすることは推奨しないが、COVID-19の疑いがある患者に対する医療行為の意思決定に利用することは許容される、という微妙な表現をしています。

―― ではどういった方にCT検査を実施するのがいいのでしょう?

青木 PCR検査が陽性で、症状のある方、悪化傾向にある方は、CT検査を受けたほうがいい。病変を詳細に診るのに役立ちますし、快方に向かっているのか、さらに悪化するのか、予後の予測にも有用です。

画像診断医の診断を教師データに用いてAIの精度を高める

―― 日本医学放射線学会とRCMBは、共同でCOVID-19の診断支援AIの開発をされました。経緯を教えてください。

青木 学会では5年ほど前から、東京大学、京都大学、大阪大学、岡山大学、九州大学、慶應義塾大学、順天堂大学からすべてのCT画像を集め、J-MID(Japan Medical Imaging Database)データセンターに蓄積するプロジェクトを進めてきました。一昨年末から本格的に収集できるようになり、そのデータをNIIのRCMBのクラウド基盤に送付して、すでに1億3000万枚以上のレポート付きCT画像によるビッグデータを構築しています。これらを活用して診断支援AIの開発を進めてきた経緯があり、COVID-19対策にも役立てたいと考えました。

佐藤 RCMBは、医療ビッグデータクラウド基盤の構築とAIによる医療画像解析研究のハブとしての役割を担うため、日本医療研究開発機構(AMED)の予算支援のもとに 2017年にNII内に設立された組織です。特徴的なのは国内の主要な研究機関と連携して研究チームを編成している点で、機械学習や深層学習、ネットワーク、クラウド、セキュリティ分野などの研究者とともにさまざまな解析を行っています。また、解析に必要不可欠なリアルな医療画像の収集については、日本医学放射線学会をはじめ、現在6つの医学系学会に提供していただいています。これらの画像を匿名化したうえで、NIIの医療画像ビッグデータクラウド基盤に投入して画像解析を進めています。
 そして今回、COVID-19拡大の状況を受けて、J-MIDとオンラインで接続されている7施設からすでに128例のCOVID-19のCT画像を提供していただき、日々新たな画像を送信していただいております。また、ダイヤモンド・プリンセス号のCT画像を保有する自衛隊中央病院からは240例を提供していただき、AI開発を進めました。

―― それらが深層学習における教師データとなったわけですね?

佐藤 はい。CT画像に限らず、画像解析に深層学習を用いる際には、たくさんの教師データが必要です。今回は正解データに、実際の患者さんの画像とPCR検査による陽性/陰性の結果、画像診断医による診断結果を用いました。その結果、8割の精度で正しく判定できるAIを開発することができました。今後さらに症例数が増えれば、より精度を高めることができるでしょう。ただしPCR検査は偽陰性、つまり陽性なのに陰性という結果が出てしまうことが多いため、これを正解データとして採用すると成績が伸びないことがわかりました。そこで現在は画像診断医による診断結果を正解データとしています。

異常データが極端に少ないという不均衡を超えて

―― 症例のデータが 400例弱というのは、深層学習に投入するには少ないように感じます。それでも精度は出るものなのですね?

佐藤 教師データには、明らかにCOVID-19肺炎ではない画像も不可欠です。J-MIDには2019年11月以前のデータも大量にありますが、とくに肺に影があるのにCOVID-19でないというデータは、AIを賢くするための難しい訓練データとしてたいへん有用です。症例の画像だけでなく、背景に何万というビッグデータがあればこそ、精度を高めることができるのです。
 そもそも医療データには、正常なデータに比べて症例のデータが圧倒的に少ないという特徴があります。そうした不均衡なデータに対して、アルゴリズムをさまざまに工夫して精度を高めるのも、我々の研究の大きなテーマの1つなのです。

―― すでに医療現場で活用され始めているのでしょうか。

青木 いずれ広く活用していきたいと考えていますが、現場で使うためには薬事承認や倫理委員会の承認など、さまざまな 手続きを経る必要があります。まずは J-MIDに参加している大学を中心に、実証実験を通じて精度を高めていきたい。現在、順天堂大学ではCOVID-19の疑いのある方には画像診断医がずっと張り付いて、CT検査の結果を見て、疑いが濃厚なら、PCR検査の結果を待たずに陽性患者と同等の対応をしています。このCTに張り付いている画像診断医の役割をAIで代替できれば、医療現場の負担を大いに軽減できるでしょう。
 なお、COVID-19肺炎の画像解析AIの開発は国内外で急ピッチに進められており、すでに薬事承認を受けたものもあります。ただしいずれも精度はさほど高くありません。コロナ禍で素早く薬事承認が下りるようになったのはいいことですが、医療現場で安心して使っていくためには、まだまだ検証を重ねる必要があります。

ビッグデータから感染症の初期の流行を捉える

―― COVID-19に関して、放射線学会ではほかに「ウイルス性肺炎サーベイランス」というユニークな取り組みをされていますね。

青木 これは放射線科医がCT検査でウイルス性肺炎の症例を見たら、COVID-19らしさを評価したうえで学会のWebサイトに報告するという試みです。画像を送るのではなく、所見を報告するだけの簡単なシステムで、すでに1300人分のデータが集まりました。その結果を棒グラフにして時系列で示したところ、まったく別の検査かつ別のデータ収集法であるはずのPCRの陽性者数(厚生労働省発表)とグラフの形が重なりました。これを見れば、第二波が収束に向かいつつあることや、第一波に比べて第二波のほうが比較的症状が軽い人が多いことなどがわかります。
 さらに特徴的なのが、第一波の初期に、PCR検査による陽性者数に先行してウイルス性肺炎の患者が増えている点です。つまり、このシステムが未知の感染症の早期の検知に役立つ可能性を示唆しています(図2)。
 現在はデータを人の手で入力していますが、今後、NIIと協力してクラウドにCT画像を投入するだけで、コロナ肺炎らしさなどを自動で判定・入力できるようにしたいと考えています。また、流行の全体像を把握するためには、J-MIDに接続している7大学だけでなく、感染症指定医療機関などの協力も得てデータ数を増やしていく必要があります。実現すれば、未知の感染症の検知やクラスターの拡大を初期段階で食い止めるのにも効果を発揮するはずです。

niitoday89_1-2.png

図2│青の棒グラフのPCR陽性の新規患者数と見比べると、黄色の折れ線グラフのCTサーベイランスでは第一波だけでなく、第二波も正確に捉えていることがわかる。検査数が限られているPCR検査で流行の全体像を捉えられているのかは不明だが、簡便・迅速に行うことのできるCT検査は検査数が多く十分に活用できるため、PCR検査体制が不十分な初期に、感染拡大状況を捉える極めて有用な指標になる。

医療の支援に役立つ医療画像ビッグデータの可能性

―― RCMBでは、COVID-19以外にもさまざまな医療画像の解析に取り組んできました。

佐藤 日本医学放射線学会とは、CT画像を用いた、くも膜下出血の検出や腎臓がんの検出、造影剤を用いることなく血管を 推定して見える化する AIの開発などを進めています。ユニークなものに、MRI(磁気共鳴画像診断装置)による脳腫瘍画像に関する研究があります。これは、正常なデータに比べて病変のデータが極端に少ないことから、「敵対的生成ネットワーク=GAN(Generative Adversarial Networks)」というフェイク画像の生成などに使われる深層学習の手法を使って、本物そっくりの病変データを作成して病変画像を増やし、AIの精度を高める研究です。そのほか、大量の骨盤のCT画像を用いて、年齢や性別によって日本人の骨盤がどう変化していくのか、腰痛と相関のある骨盤後傾について調べるなど、解剖学の新しい知見を得るためのチャレンジもしています。
 ちなみに、最初に着手したくも膜下出血の検出はいまだに開発の途中です。くも膜下出血は素人目には出血がまったくわからない画像もあって、見た目のバリエーションがとても多いためです。特徴がつかみにくいため、AI の精度が出ないのです。

青木 当初、私たち医療研究者はAIに対して過度な期待を抱いていたんですね(笑)。くも膜下出血は絶対に見逃してはならない病気の 1 つですが、夜間で専門医がいないと判断が難しくて見逃してしまうこともあります。微妙な症状の所見をAIで拾えるなら、当直医もAIに相談できるし、わざわざ夜間 に専門医に聞かなくても、次の処置に進むことができる。実現すればたいへん有用なAIになります。
 いずれにせよ、RCMBと共同で開発を進めるなかで何度も話し合いの場をもち、AIで解くべき問題をともに考え、AIは何ができて、何が不得手なのかを理解できたのは非常によかった。肝臓がんの検査で偶然に腎臓がんを見つけることがあるように、CTやMRIの画像は多種多様な情報をいっぺんに写し撮るのが特徴的で、そこから読み取れる情報はまだまだあるはずです。また、すべてデジタル化されているのでAIに投入しやすい。しかも日本の医療機関は質のいいデータを膨大に保有しています。これらをうまく活用すれば、世界に通用するAIを生み出すことができるでしょう。ぜひ、NIIでさまざまなユー スケースを示していただき、さらなるデータ収集や活用を促していただきたいと思っています。

佐藤 やはり現場で役に立つことを示していかなければなりませんね。すでに、病理画像から胃がんを検出するAIを開発し、福島県の医療機関ネットワークで活用されている例もあり、これに続くユースケースを示していきたいと考えています。また、個別の疾患に対応するだけでなく、医療画像のビッグデータを活用することで、先のウイルス性肺炎サーベイランスのように、未知の感染症の流行や疾病を早期に捉えるといった異常検知に役立てることもできるでしょう。今後はさらにデータを増やして、より現場で役立つ医療画像診断支援 AIの開発や医療インフラの構築をめざして研究を加速していきたいと思います。

インタビュアーからのひとこと

 第三次AIブームに火をつけた深層学習のなかで、飛躍的な成果をあげたのが「画像解析」だ。条件さえ整えば、いまやエラー率は人間より低く、とりわけ医療画像解析AIは専門医の診断支援に役立つとして大いに期待されている。ただし、医療データの収集やAI診断の活用が進むかどうかは、受容する側の人間次第である。コロナ禍のなかで、ゼロリスクを追い求めても立ち行かないことを多くの人が実感したはずだ。人命にかかわることだけに難しい問題だが、闇雲にシンギュラリティを恐れるより、AIを優秀な相棒とするために人間の側がリテラシーの向上に努めるほうが得策ではないか。

関連リンク
第89号の記事一覧