NIIについて / About NII

NII Today

第65号/2014年9月発行

音声の合成と認識
~声をつくる、声を聞く~

・ビッグデータ社会の課題にアルゴリズムと数理で挑む
・「数理」と「アルゴリズム」と「熱血」が新しい扉を開く
・越境により進化する新アルゴリズムの威力
・脳から新しいアルゴリズムを抽出する

PDFダウンロード

CONTENTS
NII Interview:音声合成と音声認識の組み合わせが豊かな社会を作り上げる

スマートフォンやタブレットを音声で操作する人が増えてきました。また、スマホなどから発せられる音声を聞き、対話をしながら操作する人も増加してきました。前者は音声認識技術であり、後者は音声合成技術によるものです。この2つの技術は近いようで遠い関係にあったが、ここ数年で急接近しています。音声認識に役立つ音声分離などの研究に取り組むNIIの小野順貴准教授と、音声合成を研究するNIIの山岸順一准教授に、音声認識と音声合成の最前線を聞きました。

  • 小野順貴 国立情報学研究所 情報学プリンシプル研究系 准教授総合研究大学院大学 複合科学研究科情報学専攻 准教授
  • 山岸順一 国立情報学研究所 コンテンツ科学研究系 准教授 総合研究大学院大学 複合科学研究科 情報学専攻 准教授

本文を読む

応用領域が急拡大する「統計的音声合成」技術

いま、音声合成技術は、かつての「宇宙人の声」のような不自然なものから、普通の人間の発話と見分けがつかない高品質なものへと進化しています。その背後には、統計的な手法を使った音声合成技術の進歩があります。従来よりも学習データ量、計算データ量ともに劇的に軽減したこともあり、デジタルサイネージやロボット、障碍者支援、携帯デバイスナビゲーションなど、応用領域を急速に広げつつあるのです。発語機能を失った人の元の声の再現、オリジナル話者の声を使った翻訳の読み上げなど、音声合成研究の最前線について、世界のトップを走る3人の研究者に聞きました。

  • 山岸順一 国立情報学研究所 コンテンツ科学研究系 准教授 / 総合研究大学院大学 複合科学研究科 情報学専攻 准教授
  • 徳田恵一 国立情報学研究所 客員教授名古屋工業大学 大学院工学研究科 教授
  • 戸田智基 国立情報学研究所 客員准教授 / 奈良先端科学技術大学院大学情報科学研究科 准教授

本文を読む

実用化へ走り出した音声認識

現在、コンピュータ技術の進展や膨大な音声データの集積などに伴い、音声認識の実用化に向けた研究が加速しています。一方で、本格的な実利用が始まり、期待が高まる中で、いくつかの課題も見えてきました。音声認識技術の進化の歴史と実用化に向けた取り組み、そして現状の課題について、音声認識研究の専門家である京都大学の河原達也教授と独立行政法人 情報通信研究機構(以下NICT) ユニバーサルコミュニケーション研究所 音声コミュニケーション研究室の堀智織室長に、NIIで音の信号処理等の研究を手掛ける小野順貴准教授が話を伺いました。

  • 聞き手 小野順貴 国立情報学研究所 情報学プリンシプル研究系 准教授総合研究大学院大学 複合科学研究科情報学専攻 准教授
  • 河原達也 京都大学 学術情報メディアセンター/情報学研究科教授
  • 堀 智織 独立行政法人 情報通信研究機構 (NICT)ユニバーサルコミュニケーション研究所音声コミュニケーション研究室 室長

本文を読む

声が伝わる、声で伝える? - Essay
  • 津崎 実 京都市立芸術大学 音楽学部 教授

本文を読む

PDFダウンロード

NII Todayは無料で冊子PDFをダウンロードしてご覧いただけます。

第65号「音声の合成と認識 ~声をつくる、声を聞く~」

関連ページ
バックナンバー

NII Todayバックナンバー

お問合せ先

国立情報学研究所 総務部 企画課 広報チーム
〒101-8430 東京都千代田区一ツ橋2-1-2
E-mail: kouhou(a)nii.ac.jp
※(a)の部分を@に置き換えて送信してください。

entry2318

注目コンテンツ / SPECIAL