「ネット言説の信頼性評価に挑む」第85号 - NII Today / 国立情報学研究所

Sep. 2019No.85

フェイクに挑む不正な情報を見抜くために

Interview

ネット言説の信頼性評価に挑む

ファクトチェック・イニシアティブでの取り組みと研究の意義

東北大学の乾健太郎教授は、自然言語処理の技術を用い、ネットで流通する言説の信頼性を判別する研究に取り組んできた。数年前からは、特定非営利活動法人ファクトチェック・イニシアティブ（FIJ、瀬川至朗理事長）の活動に参加、ジャーナリストと連携して活動の幅を広げてきた。「ネット上で加速度的に拡散する情報の信頼性検証は情報科学にとっても重要な関心事だ」と話す。

乾健太郎Kentaro Inui

東北大学大学院情報科学研究科教授／国立情報学研究所客員教授
1995年、東京工業大学情報理工学研究科博士課程を修了。博士（工学）。同大学で助手を務めたあと、九州工業大学助教授、奈良先端科学技術大学院大学助教授を経て、2010年より現職。
専門は知能情報学、自然言語処理。コンピュータによる言語情報や知識の自動編集、それを支える人工知能の基礎研究に従事している。

滝順一Jun-ichi Taki

日本経済新聞社編集局編集委員
早稲田大学政治経済学部卒業後、日本経済新聞社に入り地方支局や企業取材を経て、1980 年代半ばから科学技術や環境分野を担当してきた。著書に『エコうまに乗れ！』（小学館）、共著に『感染症列島』（日本経済新聞社）など。

ファクトチェック・イニシアティブとは

─ ファクトチェック・イニシアティブとはどんな組織ですか。

乾　マスコミ誤報検証サイトGoHooを運営する日本報道検証機構の楊井人文（やないひとふみ）氏やジャーナリストの立岩（たていわ）陽一郎氏らが中心になって立ち上げた団体です。社会に広まっているニュースや情報、言説が事実に基づいているかを調べるファクトチェックを支援しています。ソーシャル・ネットワーキング・サービス（SNS）で流通する情報や言説の中から事実に基づいているのか疑わしいものを収集し、疑わしさの程度を示すスコアを付けてファクトチェックに取り組むマスメディアなどに提供しています。FIJ自身はチェックをしません。
　私の研究室では、疑わしい情報を探し出しスコアリングして提供する作業をコンピュータに実行させるプログラムを考案・改良し、FIJを支援しているスマートニュースのエンジニアがそれを実装しました。それまで人手で何万という情報を読み込んで探していたので、担当の人は毎日10時間前後も疑義のある情報の探索作業に費やしていたそうです。それを機械化し、同じ作業が1時間以内で可能になったと聞きます。しかし機械にできるのはそこまでで、情報の真偽判定は機械にはできません。最後はジャーナリストの仕事です。

─ ファクトチェックに関わるようになったのはなぜですか。

乾　デマや流言は昔からありましたが、インターネット時代になって個人が情報発信や拡散をしやすくなり、誤った情報も加速度的に広がるようになりました。これは情報科学の立場からみても非常に重要な関心事です。
　私が東北大学に来た1年後に東日本大震災が起き、「うがい薬で被ばくを防げる」など根拠のない情報が流れました。こうした情報に対し、それを肯定的に捉える書き込みもあれば、否定したり疑義を呈したりする書き込みもたくさん現れます。それらをともに検出し並列して表示・提供する試みをしました。肯定・否定の両方の書き込みを読んで、個々人が真偽を判断できればよいと考えたからです。また特定の話題に関する書き込みがどのように拡散、収束していくのかを解析したりもしました。
　実は東北大に来る前から、すでに京都大学の黒橋禎夫教授がリーダーとなって進められた情報の信頼性評価に関する情報通信研究機構（NICT）のプロジェクトに参加して、自然言語処理の技術でネット上の情報の信頼性を評価する研究に取り組んでいました。こうした活動が楊井氏らの目にとまってファクトチェックへの協力を依頼されました。

選挙で役立った疑義情報の提供

─ FIJ の活動を拝見していると、社会的に注目される選挙を契機に活動を活発化されているようですね。

乾　ファクトチェックは日常的に行われていますが、まだ社会的に広く認知されているとは思いません。ファクトチェックの大切さを知ってもらう良い機会が選挙だと考えて、FIJ は選挙時の言説のファクトチェックを一種のプロジェクトとして取り組んでいます。
　これまで2018 年の沖縄県知事選、2019 年の参議院選の2 回がありましたが、前者では約5200 件の報道や言説をコンピュータでチェックし、およそ100 件をチェックの対象候補としてメディアに提供、13 本の記事になりました。後者では約7 万件の情報にあたって72 件を提供し10 本の記事になりました。誤った情報は（政党を問わず）どの選挙陣営の側にもありました。

実世界の言語情報を取り扱う意義

─ FIJ の活動への参加が研究にもたらす意義は何でしょうか。

乾　実世界の情報は、実験のために用意した情報とは違って研究者の想定を超えたものが含まれています。例えば、自分の書き込みに対して後から「間違いでした」とする自己訂正の書き込みがかなりありますが、これは最初の情報に対して他者から提示された疑義や否定ではないわけです。こうしたものも判別しなければなりません。
さまざまな課題が出てきますが、技術が社会に本当に役に立つようになるためには、複雑で多様な実世界の情報を扱って技術を鍛えていくことが必要だと思います。

─ ファクトチェックにはどのような言語処理の手法が使われているのでしょうか。また将来は情報の真偽判定まで機械ができるようになるのでしょうか。

乾　現在、ファクトチェックに利用している技術は必ずしも研究の最先端のものではありません。ディープラーニング（深層学習）を自然言語処理に応用する研究はいま急テンポで進展しています。ビジョン（視覚情報）ほどではありませんが、例えばかなり実用性の高い自動翻訳機が登場するなど、非常にエポックメイキングな時代を迎えています。
　ネットの疑わしい情報が本当に誤った情報なのか、真偽の確認は機械にとって容易なことではありません。真実は現実世界の中にあり、ネットにはそのほんの一部しか上がっていないからです。
　いずれはそこに切り込んでいきたいと考えていますが、その前に、まず、ネット上にある情報と照合して真偽を判定することに挑んでいきたいと思っています。ネット上で正しい情報のありかを探して、それと疑わしい言説を照らし合わせるわけです。これとて簡単ではないのですが、ここ数年の技術の進歩をみると、次のターゲットになりうるとみています。

─ フェイク画像を見破るよりも誤った言説を見破ることの方が難しいのですね。

乾　フェイク画像をつくる技術は巧妙になっていますが、機械の手が入ったものであることをうかがわせる痕跡が残ります。人には判別が難しくても機械ならこれを見つけることができます。一方、多くの人を騙してしまうような文章を書くのは現状では機械ではなかなか難しく、人間が書いていると考えられます。視覚情報と言語情報とではフェイク情報の発展のフェーズが違います。こうした噓を見破るのには、現段階ではジャーナリストによるファクトチェックといった丁寧な営みが必要なのです。

（写真＝高橋美都）

インタビュアーからのひとこと

　自然言語処理研究の進展の一例として、乾研究室の学生が設立したベンチャー企業Langsmith（ラングスミス）が提供する文章推敲支援AI を見せていただいた。つたない英語の文章を打ち込んでいくと、より英語らしいスマートな表現を次々と提案してくれる。驚きだった。
　機械が文章の意味を理解しているわけではない。しかし単語の連なりの背後に見いだした情報をもとに、機械が同じような意味を持つ単語の連なりをつくりだし提供する。わかっているふりに過ぎないが、まるで意味がわかっているかのようだ。深層学習によって言語を扱う世界が大きく変わる予兆を感じた。

第85号の記事一覧

フェイクに挑む不正な情報を見抜くために