Dec. 2023No.101

若手研究者と研究環境

NII Today 第101号

Interview

多言語音声合成の無限の可能性を追求

近年進化が著しい音声合成技術。 少数話者、語族からの音声合成など、多言語音声合成を研究する、クーパー エリカ 特任助教に研究の概要と活動、目標、研究環境等について聞いた。

クーパー エリカ

COOPER, Erica

国立情報学研究所
コンテンツ科学研究系 特任助教

誰でも合成音声が作れる未来

──NIIで取り組んでいる研究の概要を教えてください。

低リソース言語(AIが学習するための元データが少ない言語)を中心に音声合成を研究しています。少数言語用の音声合成装置を作成しようと、博士課程で低リソース言語のテキスト音声合成を専門に研究しました。従来の音声合成は制御された環境で長時間の録音が必要ですが、あえてノイズの多い会話データを用いて研究しました。国立情報学研究所(NII)ではこの研究を多話者合成に拡大し、話者認識モデルの転移学習を利用して、より少ないデータセットで課題に取り組んでいます。

現在は、カナダ国立研究評議会とイギリスのエディンバラ大学と共同で、カナダ先住民の言語を対象に音声合成技術の構築プロジェクトを進めています。また、音声合成モデルの評価も研究していますが、音声は多様な方法で生成されるため、プロセスは複雑です。そこで、大規模な聞き取りテストを実施し、合成音声の自動評価方法を改善するコンテスト「VoiceMOS Challenge」を実施しました。このような多面的な研究の目的は、コミュニケーションを高め、言語を保存し、音声合成をもっと利用しやすくすることです。

──研究の目標は何ですか?

短期的には音声合成モデル評価の研究を重視しています。社会にすぐに影響はしないかもしれませんが、実験を迅速化・容易化することで、音声合成の研究者には直接役立ちます。現在の商用のテキスト音声合成システムは、音質は良いのですが、大量のデータが必要で、利用できる言語も少なく、スタイルは曖昧です。

長期的な目標は、これは博士課程研究から発想を得たものですが、音声合成を大衆化することです。少数言語の話者であっても、誰もが合成音声を簡単に作れる未来を思い描いています。ノートパソコンの前に座って数分間音声を録音し、膨大なデータも計算資源も使わず自言語の質の高い合成音声を作るところを想像してみてください。この長期的目標は、音声合成が世界中の人々にとって利用しやすく、用途が広い包摂的なものになるという根本的な転換になります。

音声合成システムを利用しやすいものにするには

──研究の全般的な重要性について詳しく教えてください。

語族など従来の要素を疑問視し、音声合成における言語の独立を研究しています。話し言葉のどの特徴が普遍的に適応可能なのか、何がそれらを区別するのかなどです。このような広い視点に立つことで、適応性のある音声合成システムを作成し、より効果的に言語間のギャップを埋めることが可能になります。音声合成技術が利用しやすいと、より創造的に応用することもできます。もちろん、ディープフェイクなど、悪用への対策について引き続き研究は必要ですが、それ以上に創造的な用途の可能性は広大で予測不可能なため、研究成果のオープンアクセスが必要なのは明らかです。

──複数の専門分野を融合させた研究から得られた発見などを教えてください。

この分野の長所は学際的な性質にあり、言語学、信号処理、機械学習、プログラミングの要素をダイナミックに組み合わせて豊かな知識を生み出します。これまで、言語前処理は細かな規則や要素を伴うため複雑でしたが、ニューラルネットワークに基づくアプローチ、中でもエンドツーエンドモデルの登場によって、プロセスが大幅に簡素化されました。こうした最新手法のおかげで柔軟性が向上し、未処理の文字入力からの音声合成が可能になり、多様な言語への適応性が高まっています。

──長期的な目標の達成にはどのような課題がありますか。

現在のアプローチは膨大なデータと計算資源に依存しているため、とても利用しにくくなっていますが、従来の技術を見直して最新の進歩と組み合わせると、アクセシビリティを高めることが可能になります。大規模なニューラルネットワークモデルの不要な部分を削ぎ、小型のデバイスに適合させて、少ないデータを用いることで、アクセシビリティの拡大が期待できるでしょう。

世界各国からのインターンに刺激を受けるNIIの環境

──NIIならではの研究上のメリットを教えてください。

NIIの大きな強みは、国際共同研究と世界各国からのインターンの存在です。この多様性によって実験プロジェクトが可能になり、インターンは進行中の研究に貴重な貢献をしてくれています。こうした国際共同研究は多数の出版物につながっており、他の共同研究への道を開き続けています。

──海外出身の同僚やインターンの多様な文化的背景は、NIIでの研究にどのような影響を与えていますか。

NIIの同僚やインターンの多様な文化的背景は、私たちの研究のダイナミックな作業環境に多大な影響を与えています。多様な視点、経験、専門知識は、共同研究のプロセスを豊かにし、研究活動の奥行きを広げ、創造性を高めます。

──NIIの研究環境を高めるには何が必要でしょうか。

つながりを広げ、協調を促す継続的な努力が必要だと思います。こうした努力は間違いなく研究活動を向上させるでしょう。強みは私たちの多様性にあり、革新的なアイデアが花開く土壌が作られています。多様な背景や経験を持つ人々が集まることで、新しいアイデアを探求、検証、洗練できる環境が整い、NIIはやりがいと活気に満ち溢れた研究とイノベーションの場になっています。

──NIIでの経験と研究を踏まえて、最後にメッセージをお願いします。

 意欲溢れる若手研究者の皆さん、今こそがこの分野に飛び込む時です。可能性は無限大で、この分野はアクセスしやすくなっています。ためらわずに進んで試してみること、そして何より大切なことは、その過程を楽しむこと。大いに刺激的で楽しい道のりです。

関連リンク
記事へのご意見等はこちら
第101号の記事一覧