NII Today 第65号
Sep. 2014No.65

音声の合成と認識~声をつくる、声を聞く~

スマートフォンやタブレットを音声で操作する人が増えてきました。また、スマホなどから発せられる音声を聞き、対話をしながら操作する人も増加してきました。前者は音声認識技術であり、後者は音声合成技術によるものです。この2つの技術は近いようで遠い関係にあったが、ここ数年で急接近しています。音声認識に役立つ音声分離などの研究に取り組むNIIの小野順貴准教授と、音声合成を研究するNIIの山岸順一准教授に、音声認識と音声合成の最前線を聞きました。

CONTENTS

Interview

音声合成と音声認識の組み合わせが豊かな社会を作り上げる

スマートフォンやタブレットを音声で操作する人が増えてきた。また、スマホなどから発せられる音声を聞き、対話をしながら操作する人も増加してきた。前者は音声認識技術であり、後者は音声合成技術によるものだ。この2つの技術は近いようで遠い関係にあったが、ここ数年で急接近している。音声認識に役立つ音声分離などの研究に取り組むNIIの小野順貴准教授と、音声合成を研究するNIIの山岸順一准教授に、音声認識と音声合成の最前線を聞いた。

本文を読む

Other

応用領域が急拡大する「統計的音声合成」技術

統計的手法「HMM」による自然な音声合成術とは?

いま、音声合成技術は、かつての「宇宙人の声」のような不自然なものから、普通の人間の発話と見分けがつかない高品質なものへと進化している。その背後には、統計的な手法を使った音声合成技術の進歩がある。従来よりも学習データ量、計算データ量ともに劇的に軽減したこともあり、デジタルサイネージやロボット、障碍者支援、携帯デバイスナビゲーションなど、応用領域を急速に広げつつあるのだ。発語機能を失った人の元の声の再現、オリジナル話者の声を使った翻訳の読み上げなど、音声合成研究の最前線について、世界のトップを走る3人の研究者に聞いた。

本文を読む

Other

実用化へ走り出した音声認識

母国語のようなスムーズな会話の実現へ

現在、コンピュータ技術の進展や膨大な音声データの集積などに伴い、音声認識の実用化に向けた研究が加速している。一方で、本格的な実利用が始まり、期待が高まる中で、いくつかの課題も見えてきた。音声認識技術の進化の歴史と実用化に向けた取り組み、そして現状の課題について、音声認識研究の専門家である京都大学の河原達也教授と独立行政法人 情報通信研究機構(以下NICT) ユニバーサルコミュニケーション研究所 音声コミュニケーション研究室の堀智織室長に、NIIで音の信号処理等の研究を手掛ける小野順貴准教授が話を伺った。

本文を読む

Essay

声が伝わる、声で伝える?

本文を読む

NII Todayは無料で冊子PDFをダウンロードしてご覧いただけます。

NII Today 第65号

NII Today 第65号

2014年9月発行

・音声合成と音声認識の組み合わせが豊かな社会を作り上げる
・応用領域が急拡大する「統計的音声合成」技術
・実用化へ走り出した音声認識
・声が伝わる、声で伝える?

PDFダウンロード
バックナンバー 一覧