言語理解システムの長所や短所を明確にし説明性・信頼性の高いタスクを設計する

昨今の機械学習システムは表面的なパターンの学習・記憶が非常に得意なため、評価内容・信頼性の担保が非常に困難です。そこで、言葉の理解を評価するうえで説明性の高いタスクデザイン・データセットの構築に取り組んでいます。

研究背景・目的

自然言語処理という、人間の言葉をコンピュータで処理する技術の研究をしています。この分野の大きな目標の一つは、人間のように文章を理解するシステムを作ることです。一時期の人工知能ブームでは人間の知能を超えるようなシステムが現れるのではないかと話題になりましたが、実際はそのような領域はまだ限定的です。システムの性能に誤解があると、社会で応用するときに大きな問題が起こるかもしれないため、研究・開発にあたっては誇張のない正確な性能を確認する必要があります。そのためには言葉の理解をどのような観点で評価し、どのように信頼性のある評価結果を得るか、ということを考えなければなりません。

研究内容

言語理解システムを対象として、正答するためにどのような理解が要求されているのかが正確に説明できるような文章読解データセットの構築をめざしています。既存の評価データでは、システムが文章を正確に理解しないでも正答できてしまうような質問が多数存在し、仮に性能がよくても人間らしい高度な理解を示しているか疑わしいような例が多数ありました。昨今の機械学習システムは人間が気づかないような表面的なパターンを学習・記憶するのが非常に得意なため、評価内容と信頼性を担保するのが非常に困難です。言葉の理解を評価するうえで説明性の高いタスクデザイン・データセットの構築に、中心的に取り組んでいます（図）。

図）読解問題の例と研究目標

産業応用の可能性

言語理解という複雑な過程について説明性・信頼性の高いタスクを設計するというアプローチは、直接的にはファクトチェッキングや質問応答システム、さらには自然言語をインタフェースとするさまざまな技術（対話システム、機械翻訳、ロボティクスなど）の評価設計で重要です。知的エージェントを評価する枠組みとしてソフトウェアの単体テストのような方法論を与えることも狙いとしており、幅広い応用技術に貢献する可能性を持ちます。また、教育分野でオンライン化・効率化が望まれる現状の社会情勢では、文章読解力を含めたさまざまな学習項目について、学習者の成績に合わせたテスト・評価指標を自動的に設計することに貢献できると考えます。

Recommend

映像・センサーデータの解析による
社会基盤のモニタリングシステム

情報メディア科学

高須淳宏

コンテンツ科学研究系教授

光をデザインして物体の中を見る非接触・非侵襲のイメージング技術

情報メディア科学

佐藤いまり

コンテンツ科学研究系教授

研究用データセットの有効活用へ
データを核とした産学連携を橋渡し

情報メディア科学

大山敬三

コンテンツ科学研究系教授／データセット共同利用研究開発センター長

改ざん領域を特定し判断根拠示す
フェイクメディアの自動検知技術

情報メディア科学

越前功

山岸順一

クラウド（crowd）とともに
社会課題の解決を図る

情報メディア科学

相原健郎

コンテンツ科学研究系准教授

画像や映像を高速・高精度に検索
放送映像アーカイブから知識発見も

情報メディア科学

佐藤真一

コンテンツ科学研究系教授

さらにみる

言語理解システムの長所や短所を明確にし
説明性・信頼性の高いタスクを設計する

研究背景・目的

研究内容

産業応用の可能性

関連リンク

Recommend

映像・センサーデータの解析による
社会基盤のモニタリングシステム

光をデザインして物体の中を見る非接触・非侵襲のイメージング技術

研究用データセットの有効活用へ
データを核とした産学連携を橋渡し

改ざん領域を特定し判断根拠示す
フェイクメディアの自動検知技術

クラウド（crowd）とともに
社会課題の解決を図る

画像や映像を高速・高精度に検索
放送映像アーカイブから知識発見も

言語理解システムの長所や短所を明確にし説明性・信頼性の高いタスクを設計する

研究背景・目的

研究内容

産業応用の可能性

関連リンク

Recommend

映像・センサーデータの解析による社会基盤のモニタリングシステム

光をデザインして物体の中を見る非接触・非侵襲のイメージング技術

研究用データセットの有効活用へデータを核とした産学連携を橋渡し

改ざん領域を特定し判断根拠示すフェイクメディアの自動検知技術

クラウド（crowd）とともに社会課題の解決を図る

画像や映像を高速・高精度に検索放送映像アーカイブから知識発見も

言語理解システムの長所や短所を明確にし
説明性・信頼性の高いタスクを設計する

映像・センサーデータの解析による
社会基盤のモニタリングシステム

研究用データセットの有効活用へ
データを核とした産学連携を橋渡し

改ざん領域を特定し判断根拠示す
フェイクメディアの自動検知技術

クラウド（crowd）とともに
社会課題の解決を図る

画像や映像を高速・高精度に検索
放送映像アーカイブから知識発見も