ニュース / News

ニュースリリース

世界初、CT画像をAIが比較・解析し日本語の所見文を生成
~放射線科医の経過観察支援に期待~

 名古屋大学大学院情報学研究科の森 健策 研究室、情報・システム研究機構 国立情報学研究所医療ビッグデータ研究センターの共同研究グループは、経過観察のために撮影された2つの3次元X線CT画像注1)を解析し、自然な日本語所見文を生成する世界初の生成AI注2)を開発しました。本生成AIを利用し、2つの異なるCT像画像を比較して、その結果を日本語文章として出力することができるようになりました。これによって、放射線科医の正確なCT画像読影所見文の作成を支援することが期待されます。
 本研究成果は、2025年4月30日に開催のSIP第3期「統合型ヘルスケアシステムの構築における生成AIの活用」公開シンポジウムで発表されます。

【本研究のポイント】

  • 経過観察のために撮影された2つの3次元X線CT画像を解析し、自然な日本語所見文を生成する世界初の生成AIを開発。
  • 経過観察のために2つの3次元CT画像と所見文を生成するための質問文を入力し、所見文を生成する生成AIモデルを開発。
  • 大規模医用画像データベースの3次元CT画像と付随する所見文を用いて生成AIモデルを訓練。

【研究背景と内容】

 名古屋大学大学院情報学研究科の森 健策 研究室、国立情報学研究所医療ビッグデータ研究センターの共同研究グループは、経過観察のために撮影された2つの3次元X線CT画像を解析し、自然な日本語所見文を生成する世界初の生成AIを開発しました。本生成AIを利用することで、2つの異なるCT像画像を比較して、その結果を日本語文章として出力することができるようになりました。これによって、放射線科医の正確なCT画像読影所見文の作成を支援することが期待されます。
 大規模言語モデル(Large Language Model, LLM)の実現を端緒とする生成AIはまたたく間に社会に浸透し、今や人間の知的活動を支える重要なツールとなっています。LLMを言語以外の他のモダリティ、例えば画像と組み合わせた生成AIを用いると、画像内容の説明を文章で出力する、逆に、文章で指示した内容を画像として描画することが可能です。こうした異なる文章を含むモダリティを統合して処理・認識することは知性の核であり、生成AIは人間の知的活動に類するものを機械が獲得する第一歩と言えます。
 医療行為はさまざまな症状や画像、検査結果などを統合して処理・認識し、所見文の記載と共に診断することが最初に求められます。このような知的活動は知識と経験を有する医師のみが可能で、これまでの医療AIは単一モダリティの医療画像などから疾患の有無や種類を判定するような簡単な医療支援に止まっていました。医療文書に関するLLMをベースにして画像認識などを組み合わせた生成AIを実現することで、根拠となる所見を文章で示しつつ診断を示唆する、いわば医師の知的活動を支援する医療AIを実現することができます。
 名古屋大学大学院情報学研究科の森 健策らの研究チーム(教授 森 健策、准教授 小田 昌宏、博士後期課程学生 Nguyen Cong Khang)は、国立情報学研究所医療ビッグデータ研究センターとの共同研究で、撮影日時の異なる2つの3次元X線CT画像から特徴を読み取り、その経時的変化を所見文として出力するLMM (Large Multi-modal Model)注3)の研究開発に成功しました。このLMMは生成AIの一種であり、同じ患者の異なる時点の2つの3次元X線CT画像を読み込み、その経時的変化を所見文として自然な文章で出力します。これは、これまで放射線科医しかできなかった経過観察を支援し、より迅速で精確な読影所見の記述や病変の定量評価の実現につながるものです。

【研究開発の概要】

 本研究で開発された生成AIモデルは、CT画像の経時変化を文章として出力するものです。この生成AIにおいては、2つの3次元画像 (人体の断面画像を積み重ねたもの)を、画像特徴を表現するトークン注4)へと3D Vision Encoder注5)を用いて変換します。そして、所見文の出力を命令する命令文のトークンも併せて大規模言語モデルに入力することで経時変化の所見文を出力します。
 この生成AIを実現するために、国立情報学研究所と日本医学放射線学会が構築を進めてきたX線CT画像データベース(画像と各画像に記録されている所見文)を利用して、生成AIの学習を名古屋大学にて行いました。名古屋大学は、国立情報学研究所が管理する画像データベースに接続し、本研究で開発された生成AIモデルの学習処理を行いました。
 本生成AIの画面の例を図1に示します。時間をおいて撮影された2つの画像を入力すると、2つの画像を比較して、その結果を自然な文章として返します。生成AIと対話することも可能であり、単なる読影レポートの生成だけでなく、現時点では限定的ではありますが、読影レポートに記載された事項についての質問も可能となります。

release_20250424_fig1.png
図1 比較読影注6)のための生成AIモデルの概要

release_20250424_fig2.png
図2 比較読影を行う生成AIモデルの画面例

【研究成果の外部発表】

 2025年4月30日に開催のSIP第3期「統合型ヘルスケアシステムの構築における生成AIの活用」公開シンポジウムにて、デモンストレーション発表の予定です。

【研究プロジェクトについて】

 本研究は、戦略的イノベーション創造プログラム(SIP)「統合型ヘルスケアシステムの構築(課題番号:JPJ012425) テーマ2 研究代表者 東京大学教授 原田 達也 主たる共同研究者 名古屋大学教授 森 健策 主たる共同研究者 国立情報学研究所准教授 村尾 晃平 / テーマ4 研究代表者 情報・システム研究機構教授 合田 憲人 主たる共同研究者 名古屋大学教授 森 健策 主たる共同研究者 国立情報学研究所教授 相澤 彰子 および、テーマE-2 研究代表者 京都大学特定教授 黒橋 禎夫 主たる共同研究者 名古屋大学教授 森 健策 主たる共同研究者 国立情報学研究所教授 合田 憲人」の支援を受けました。

関連リンク

News Release: PDF

世界初、CT画像をAIが比較・解析し日本語の所見文を生成
~放射線科医の経過観察支援に期待~


注1) X線CT画像/3次元X線CT画像:X線CT画像はX線を用いて人体の輪切り断面画像を撮影する装置。3次元X線CT画像は、人体輪切り断面画像を積み重ねて得られる3次元画像。
注2) 生成AI:文章・画像などを作り出すAIのこと。
注3) LMM:大規模マルチモーダルモデル(Large Multi-modal Model)
注4) トークン:入力される画像や文章を細かな特徴ベクトルに分解したもの。
注5) 3D Vision Encoder:入力された3次元画像を特徴ベクトルへと変換する機構。
注6) 比較読影:時期を経て撮影された医用画像を比較して病態等の変化を診断すること。
6918

注目コンテンツ / SPECIAL