Interview
情報学が社会をドライブする
2023年4月、国立情報学研究所(NII)所長に黒橋禎夫教授が就任した。NII教授で京都大学大学院情報学研究科特定教授も務める、AI(人工知能)研究における日本の第一人者のひとり。コンピュータに「ことば」を教える研究を続けてきた。その黒橋所長が、これからNIIをどのように率いていくのか、またAIの将来をどう見ているのか、展望を聞いた。
黒橋 禎夫KUROHASHI, Sadao
国立情報学研究所 所長
聞き手増谷 文生MASUTANI, Fumio
朝日新聞論説委員兼編集委員
宇都宮市出身。大阪市立大学を卒業後、1994 年に朝日新聞社に入社し、東京、大阪、名古屋、仙台、京都などに勤務。2005 年以降、断続的に約8年間、高等教育を取材。2020年 4 月から高等教育担当の編集委員、同 10 月から教育全般を担当する論説委員も兼務する。
データ基盤の構築から、知識基盤の構築へ
――まず、簡単に自己紹介をお願いします。
私は京都で生まれ育ち、自動翻訳で世界的な業績をあげた京都大学の長尾真先生に京大で指導を受け、2001年から東京大学の助教授、2006年から京都大学の教授を務めています。
専門は自然言語処理で、人間が日常的に使っている「自然言語」を、コンピュータに教えこむ方法を研究してきました。
特に、力を入れてきたのが、コンピュータに日本語を理解させることです。
このところ、ニューラルネットワーク、それから大規模言語モデルが急激に関心を集めていますが、それらも踏まえ、これからの新しいAIの世界について引き続き考えていきたいと思っています。
―――所長としての目標を教えてください。
NIIにおいては、「データ基盤から知識基盤へ」というのが私の目標です。喜連川優前所長は、データベースの専門家で、早くからデータの重要性に着目され、NIIにおいても研究データ基盤の整備を進められました。私はその上に「知識」の基盤を構築したいと考えています。
21世紀の学術および社会の大きな潮流として、データの重要性が明確に認識されました。様々な観測や計測からデータを作成し、デジタル化し、オープンにして議論・利活用することで学術的に大きな進展が起こっています。このような状況下で、日本ではNIIを中心に SINET6に至るネットワーク整備と、研究データ基盤の整備が継続的に進められてきました。
しかし、今、社会で起こっている問題は、一つの学問分野だけでは解決できない複合的な課題になってきています。様々な学術研究の協働を進める上で問題となるのは、特定分野の専門家も他分野については素人であり、多様な分野を見通してデータを直に活用することは容易ではないという点です。
これからの学術研究が総合知として深化し、複合的な社会課題を解決していくためには、データの解釈、知識の関係付け・体系化を自動化し、分野を横断する新たな知の創造を支援する知識基盤の構築が必要です。
研究データ基盤が整いつつある今こそ、大規模言語モデルに基づき、データを解釈し、さまざまな分野の知識を関係付け、体系化した知識基盤を構築し、これによって新たな知の創造や社会課題解決を支援していきたいと考えています。
データが社会にもたらす恩恵
――データは情報社会の「血液」とも言われます。
日本では慎重な国民性もあって、まだオープンにされていないデータがたくさんあります。
このデータの流通強化に、AIの活用が期待できます。例えば、医療分野です。問題になるのが匿名化ですが、AIを使うとかなりの部分を処理できます。
NIIが提供する学術基盤や、これからの知識基盤の必要性は10年以上前から指摘されてきました。ここへきてようやくデータ基盤が整い、データをオープンにすることの価値が認識され始め、機械翻訳研究に端を発する大規模言語モデルにより論文やマルチメディアデータを高度に解釈することが可能となりつつあることから、ついに知識基盤の構築を本格的に目指すべき時代となったと感じています。
しかし一方で、大規模言語モデルの構築には大規模な計算資源を必要とし、一部の海外企業による寡占化が進んでいることが大きな問題です。日本全体の連携のもとに、大規模言語モデルの研究・開発・運用の体制を整備し、知識基盤の構築に取り組むことも必要です。データをより多く流通させることで、より暮らしやすい世の中に変えていくことができます。
――データのオープン化、知識基盤の確立によって世の中にどんな良い影響がありますか。
匿名化された大量の医療データを分析していけば、一人ひとりに最適な医療を提供できるようになります。
今は、患者さんの症状を典型的なケースにあてはめ「この薬を飲みなさい」となりますね。医学の世界も日進月歩ですから、場合によっては少し古い知識に基づいて判断してしまうケースもあるでしょう。
しかし大量のデータを使った研究が進めば、患者さんのより詳細な特徴に基づいて、この治療法が有効である確率が高い、ということがわかるようになります。どんどん更新されていく治療法や薬などの情報もふまえ、一人ひとりの病気が治る確率を高めることができるのです。
かつてないほど増しているNIIの存在意義
――2020年から続く「教育機関DXシンポ [1]」に ついて、大学関係者から「シンポにずいぶん助けられた」という声をよく聞きます。今後も続けていくお考えですか。
コロナ禍が始まった当初は、多くの大学関係者はゼロからオンライン授業に挑戦していました。シンポには毎回、文科省の方が登場して、著作権の特例措置など最新の情報を提供していただきました。その後は、時代の変化に合わせてメタバースや、話題のChatGPTなどの情報も紹介し、非常に大きな成果を挙げてきたと考えています。
ただ、今後は、NIIの設置者である情報・システム研究機構と共同で開く方向で検討しています。シンポには、今回機構長に就かれた喜連川前所長の MCが欠かせない、との声が強いという理由が一つ。また、NIIのみなさんには、きっちり取り組もうと頑張りすぎる傾向があるようで、負担軽減を図る目的もあります。
――NIIの今後のあり方については、どのようにお考えですか
情報学を上手に活用すれば、もっと社会をうまくドライブすることができます。このためNIIの存在意義は、かつてないほど増していると思います。
大学には、競争する部分と共有でいい部分があります。研究ではデータ基盤は共有できていて、私たちがサポートしています。他にも教務やオンライン授業、病院などのシステムには、もっと共有できる部分があると思います。
大学共同利用という視点から少し広い ITシステムを提供できないか考えています。いま、クラウドサービスを導入する時には、どんなサービスがあり、それぞれ一長一短がありますよ、といった情報を整理して、全国の大学に提供しています。こうした大学が共有できるところで、もっと支援することはあるのかな、と。
ただ、期待が高まっている分、NIIのみなさんは非常に忙しいようです。限られた人員と予算でできる限り期待に応えつつ、より働きやすい環境づくりにも取り組んでいきたいですね。
予想を超える生成AIの誕生
――ChatGPTが世界を席巻するさなかの就任です。このタイミングは偶然ですか。
ChatGPT が登場したのは昨年、2022年11月です。私の就任が決まったのは2022年6月ですから、偶然です。
2023年3月には、さらにGPT-4[2]が公開されました。ここまでのものが登場するとは、予想できませんでした。AIが社会の注目を集める中の就任となったことを「追い風だね」と言ってくれる人もいます。しかし、私にしてみると「暴風」という感じですね。
政府も動くほどの事態になっていますが、まだ着任したばかりで、どのように振る舞ったらよいのか模索中です。1 年くらいたって、NIIに慣れた頃に盛り上がってくれたらよかったのですが。
ChatGPTは「知的なパートナー」
――世界的関心が高まっているChatGPTについても詳しく教えてください。まず、グーグルなどの検索エンジンとどこが違うのですか。
検索エンジンは、単語の頻度などをベースにして、クエリとウェブ文書をマッチさせています。関連する資料を示すだけで、後は人間が解釈してくださいというものです。
ChatGPT以前のAIの対話システムは、与えられた限定的な知識で動いている感じでしたね。すべてを知っているような存在ではありませんでした。
しかし、ChatGPTは違います。その本質は言語モデルなので、次の単語を予測するというのが根本ですが、それを色々な方法で、さらに賢くしています。
長い文章で使われてきた単語をふまえることができれば、その先に出てくる単語を高い確率で予測できます。最新のGPT-4は、小説1冊分くらいの文章をふまえて回答できると聞いています。
――使ってみた感想はいかがですか。
本当に賢いです。「要約して」「関西弁にして」「中学生風にして」などと指示すれば、そのとおりに変換してくれます。
たとえば、外国人留学生の日本での奨学金申請や学費免除の作文にアドバイスをするのですが、やはり不自然な言葉づかいがあります。以前は、かなりの時間を使って直していました。でもChatGPTに「自然な日本語にしてください」とお願いすれば、あっという間に直してくれました。
また、知的な作業のパートナーとして、ディスカッションができる相手にもなります。すごいことを言ってくれなくても、頭の中が整理され、新しい発想が生まれることもあります。
こうしたことは、これまでの機械学習では到達できない領域です。どうしてこんなことができるのか、専門家である私でも細かい仕組みはわかりません。
AIの世界を開かれたものに
――専門家でもわからないのですか。
このレベルで研究や実験ができるのは、(ChatGPTを開発した)米国のOpenAIやグーグル、中国の百度(バイドゥ)など、一部の企業に限られているのです。
このままでは、人類にとって非常に良くないことが、「密室」で起きる可能性があります。何かあった時のインパクトが大きいだけに、閉じられた世界にするべきではないと思います。
――ChatGPT を含めた生成AIは、まだまだ進化していくのでしょうか。まだ限界は見えないのでしょうか。
ChatGPTは、直線的に進化していくものではありません。ずっと学習していくと、あるところでドカンとジャンプするのです。今後さらに、想像がつかないような何かが起こるかもしれない、と思っています。
――ChatGPTなど生成AIを使う人は、どんな点に注意すればいいですか。
これからも、すごいスピードで進歩していくでしょう。だから、方針をきちっと決めるよりも、柔軟に対応していく態度が大事だと思います。
また、なめらかな文章で説明されるため、ともすると、正しい回答として受け入れてしまう恐れがあります。このため利用する時には、批判的思考を持って臨むことが、より重要になってくるでしょう。
NIIとしても、このような急速な社会変革の時代に、大学共同利用機関、さらには日本の情報学の中核機関として、研究と事業の両面で社会の要請に応えていかなければなりません。今後も、基礎論から最先端までの総合的な情報学研究、そして、学術ネットワーク基盤、研究データ基盤等に関する事業をさらに推し進めるとともに、学術研究の協働の土壌となる知識基盤の構築に一歩一歩取り組んでいきたいです。
聞き手からのひとこと
ChatGPTが世界中で大騒ぎになっているさなかに、その専門家が NIIの所長に就任する。偶然だったようだが、なんとも出来すぎた人事だ。当人は「追い風ではなく暴風」と笑う。だが、NIIや大学関係者、そして政府にとっては、心強い存在となるだろう。今後しばらくの間、活用するにしても制限するにしても、ChatGPTは教育・研究分野で大きな話題であり続けるはずだ。
コロナ禍と交代するかのように、また社会を大きく変えうるトピックが現れた。数年後にどんな進化を見せているのか、新所長でも予想ができないという。その時、社会はどんな姿を見せているのだろうか。
[1]教育機関 DX シンポ
2020 年 3 月末より週 1 回から隔週のペースで、大学等における遠隔授業や教育 DX 等に関する情報を共有することを目的に開催。
[2] GPT-4
Generative Pre-trainedTransformer 4の略で 2023年3月に発表された。ChatGPTに使われている「GPT3.5」より扱える単語が約8倍に増えた。