研究 / Research

コンテンツ科学研究系

小山 翔一
KOYAMA Shoichi
コンテンツ科学研究系 准教授
学位:博士(情報理工学)
研究内容:https://researchmap.jp/shoichi_koyama
研究室WEB

研究紹介

音の研究に魅了されて

 私が音の研究に携わるきっかけは、大学院修了後に入社した日本電信電話株式会社(NTT)で音の研究チームに配属されたことでした。遠隔コミュニケーションにおいて、直接会って話をしているかのような臨場感を再現するには、音をどのように伝達、再生すればいいのか、それが当時の研究課題でした。それを実現するには、実際の音から音の空間的な情報を正確に計測し、それをリアルに再生するという技術が重要になります。

 基礎技術ではあるのですが、研究を進めていけばいくほど、課題や新しい研究テーマが次々と見つかり、音という物理現象の奥深さに心が高鳴りました。応用の可能性が広がっていくことにも大きな手ごたえを感じました。NTTから東京大学大学院情報理工学系研究科、さらに国立情報学研究所(NII)と場所を変えながらも音の研究を続けているのは、音の研究に魅了されたからに他なりません。

物理情報を取り入れた新しい方法論の確立

 音を計測して、音を合成するための核となる基礎技術としては、信号処理や機械学習などがあります。信号処理にしても、機械学習にしても、すでにいくつもの技術や方法論が存在しています。しかしながら、既存のものをそのまま適用しても、実際にはうまく機能しないのです。

 私は、物理的な情報を信号処理や機械学習に盛り込むことによって、新しい方法論を確立できるのではないかと考えました。すなわち、「音空間の分析と合成のための波動場の性質を取り入れた信号処理と機械学習」が、現在取り組んでいる研究テーマです。

 機械学習にも、目的に応じて様々な手法がありますが、私は一例として学習データを利用して少数のセンサで波動場を計測する、深層ニューラルネットワークについて研究しています。通常の機械学習に頼ってしまうと、学習データが少ない場合に未知のデータには通用しないというオーバーフィッティング(過剰適合)が生じやすくなりますが、物理制約下において学習させることで、過剰適合を防げます。

 VRARでは、ヘッドセットを通じて臨場感のある音を楽しめますが、実際の環境で聴く音とは少し異なることもあります。音源から耳に至るまでの音の伝達特性(頭部伝達関数)が一人一人異なるためです。深層ニューラルネットワークを駆使して、その人の頭部伝達関数を簡易的に測定して補間する技術も研究対象にしています。

 これからさらに力を入れていきたい研究トピックスの一つに、空間アクティブ騒音制御があります。雑音をカットしてくれるイヤホンはすでに実用化されていますが、私が研究しているのは、そのようなデバイスを装着したり、物理的な防音壁を設置したりすることなく、複数のスピーカーを使って特定の空間で騒音を軽減する技術です。この技術が確立できれば、駅構内のテレワーク用スペースなどに応用できるでしょう。

 私が進めている研究には、物理情報を取り入れているという共通点があります。基礎技術を理論的に研究できている優位性は大きいと自負しており、今後もこの方針で研究を広げていくつもりです。

音を制御することで社会問題を解決したい

 現代社会は、近代化や都市化が進んだことで、身の回りには実に多様な音が溢れています。人間は優秀な聴覚を持っているがゆえに、人工的な音は大きなストレスになっています。意識されない程度の交通騒音でも、大気汚染に匹敵するほど人間の体に悪影響を及ぼしているという調査結果もあります。私は音に関する基礎技術をブラッシュアップすることで、健康被害など、音に起因する社会問題をできるだけなくすことを目標にしています。

 音は、超音波、電磁波、光のような波動の一種です。音を詳しく知ることで、音以外の様々な波動現象に適用できる可能性が生まれます。他の波動とはセンシングのためのデバイスが異なるため、そのまま適用するには多少時間がかかるかもしれませんが、将来的には様々な応用が可能だと考えています。

PDFをダウンロード


構成・執筆=佐藤 尚規 2023年12月更新

注目コンテンツ / SPECIAL