研究 / Research

情報学プリンシプル研究系

小野 順貴
ONO Nobutaka
情報学プリンシプル研究系 教授
学位:2001年 博士(工学)(東京大学)
専門分野:知能情報
研究内容:http://researchmap.jp/onono/
研究室WEB

サイエンスライターによる研究紹介

"機械の耳"を実現するマイクロフォンアレイ技術

大勢の人ががやがや話している状況でも、私たちは特定の人の声を聞き分け、会話をすることができます。両耳に入る音の強さや到来時間を比較して音の方向を判断したり、特定の音に注意を向けたりできるからです。私は、この聴覚のような機能を機械で実現するため、「マイクロフォンアレイ」という音響信号処理技術の研究を行っています。

混ざり合った音の中から特定の音を取り出す

マイクロフォンアレイは、複数のマイクを用い、取得した音に信号処理を施すことで音を空間的にとらえる技術です。私は、音源の位置がわからない状態で録音された混合音を、マイクロフォンアレイ技術を使って個々の音に分ける「ブラインド音源分離」の研究をしています。従来のアルゴリズムは演算処理に時間がかかるという問題がありましたが、新たな高速アルゴリズムの開発に成功しました。ステレオマイクを装着したiPhone 上で動作するアプリもすでに開発済みで、同時に発話された2 人の音声を短時間で分離し、別々の音声として再生することができます。家電製品や補聴器などへの応用を想定した研究も行っています。この技術が実用化されれば、たとえばピアノの発表会を録音中に隣の人の話し声が入ってしまっても、あとからピアノの音だけを取り出すといった、編集や加工ができるようになるでしょう。

未来に広がるさまざまな可能性

複数のマイクで音を取得する場合、それぞれのマイクに入ってくる音にはわずかな時間差が生じます。マイクロフォンアレイ技術はこの時間差を利用するため、各マイクを完全に同期させることが必要でした。しかし、私たちのまわりにはスマートフォンやIC レコーダーなど、録音機能を備えた機器がたくさんあります。その同期していないマイクを、マイクロフォンアレイとして用いることができれば便利でしょう。会議中に各自がスマートフォンで会話を録音してサーバーに上げると、自動的に同期をとって各人の発言を抽出し、議事録を作成する。そんな便利なシステムの実現を目指して新たな研究を進めています。
また、生物にとって聴覚は異常を感知するセンサーでもあります。人工システムでもロボットでも今は視覚情報が主体ですが、音の情報ももっと活用できるのではないかと考えています。街で銃声などの異常な音を検知したら、各自のスマートフォンが自動的に音情報をサーバーに送り、発生場所を特定して通報するといった分散型セキュリティシステムも考えられると思います。ほかにもさまざまな分野での実用化を目指していきたいと思っています。

PDFをダウンロード


取材・構成 財部 恵子

関連情報

注目コンテンツ / SPECIAL