(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-16
(45)【発行日】2024-12-24
(54)【発明の名称】音処理方法、および、音処理装置
(51)【国際特許分類】
H04S 7/00 20060101AFI20241217BHJP
G10K 15/00 20060101ALI20241217BHJP
H04R 3/00 20060101ALI20241217BHJP
【FI】
H04S7/00 300
G10K15/00 M
H04R3/00 310
(21)【出願番号】P 2020090333
(22)【出願日】2020-05-25
【審査請求日】2023-03-20
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】弁理士法人 楓国際特許事務所
(72)【発明者】
【氏名】三輪 明宏
(72)【発明者】
【氏名】田中 健一
【審査官】稲葉 崇
(56)【参考文献】
【文献】特開2007-026222(JP,A)
【文献】特許第3089421(JP,B2)
【文献】特開2017-102085(JP,A)
【文献】国際公開第2014/152746(WO,A1)
【文献】国際公開第2009/128366(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00-7/00
G10K 15/00-15/12
H04R 1/00-31/00
(57)【特許請求の範囲】
【請求項1】
音響空間の画像を取得し、
前記画像から前記音響空間における平面を設定し、
前記音響空間の画像内に仮想スピーカを設定し、
前記仮想スピーカの特性から、前記平面に対する音圧分布を算出し、
前記音圧分布を、前記平面に重ねあわせ、
前記音響空間の画像内に聴取位置を設定し、
前記音圧分布に対応して、前記仮想スピーカから前記聴取位置に放音される音の伝搬特性を算出し、
前記音の伝搬特性と、聴取したい原音データとを用いて、前記聴取位置での音データを生成し、
前記画像の取得位置を検出し、前記画像の取得位置を前記聴取位置に設定する、
音処理方法。
【請求項2】
前記音データを再生して放音する、
請求項
1に記載の音処理方法。
【請求項3】
前記平面は、前記音響空間に複数設定される、
請求項1
または請求項2に記載の音処理方法。
【請求項4】
前記仮想スピーカは、前記音響空間に複数設定され、
前記音圧分布を、複数の前記仮想スピーカ毎の音圧分布を合成することによって生成する、
請求項1乃至請求項
3のいずれかに記載の音処理方法。
【請求項5】
前記音圧分布は、前記仮想スピーカからの直接音の音圧分布である、
請求項1乃至請求項
4のいずれかに記載の音処理方法。
【請求項6】
前記画像の特徴部を解析して、前記平面を検出する、
請求項1乃至請求項
5のいずれかに記載の音処理方法。
【請求項7】
音響空間の画像を取得する画像取得部と、
前記画像から前記音響空間における平面を設定する平面設定部と、
前記音響空間の画像内に仮想スピーカを設定する仮想スピーカ設定部と、
前記仮想スピーカの特性から、前記平面に対する音圧分布を算出する音圧分布算出部と、
前記音圧分布を前記平面に重ねあわせて合成画像を生成する合成画像生成部と、
前記音響空間の画像内に聴取位置を設定する聴取位置設定部と、
前記音圧分布に対応して、前記仮想スピーカから前記聴取位置に放音される音の伝搬特性を算出する伝搬特性算出部と、
前記音の伝搬特性と、聴取したい原音データとを用いて、前記聴取位置での音データを生成する音信号生成部と、
を備え、
聴取位置設定部は、前記画像の取得位置を検出し、前記画像の取得位置を前記聴取位置に設定する、
音処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
この発明の一実施形態は、空間の音像確認を行う技術に関する。
【背景技術】
【0002】
特許文献1の音響調整装置は、音量レベルを測定したい音場に設置される。音響調整装置は、スピーカの出力音量レベルを検出して記憶する。
【0003】
音響調整装置は、音場内における指定された聴取位置の出力音量レベルをグラフ化する。音響調整装置は、グラフを2次元画面で表示する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の音響調整装置は、実際のスピーカを空間に設置して、スピーカの出力レベルを検出する。したがって、特許文献1に記載の音響調整装置のような従来の装置は、スピーカが未配置の部屋等の空間に、所望のスピーカを配置した時の音圧分布等の音像を出力できない。
【0006】
したがって、本発明の目的は、スピーカが未配置の空間に所望のスピーカを配置したときの音像を、実際にスピーカを配置しなくても、ユーザに提供することにある。
【課題を解決するための手段】
【0007】
音処理方法は、音響空間の画像を取得し、画像から音響空間における平面を設定し、音響空間の画像内に仮想スピーカを設定し、仮想スピーカの特性から平面に対する音圧分布を算出し、音圧分布を平面に重ねあわせる。
【発明の効果】
【0008】
音処理方法は、スピーカが未配置の空間に所望のスピーカを配置したときの音像を、実際にスピーカを配置しなくても、ユーザに提供することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、音処理装置のハードウェア構成図の一例を示す図である。
【
図2】
図2は、実施形態1に係る音処理装置の構成を示す機能ブロック図である。
【
図3】
図3(A)は、仮想スピーカおよび音圧分布の合成前の画像の一例を示す図であり、
図3(B)は、仮想スピーカおよび音圧分布の合成後の画像の一例を示す図である。
【
図4】
図4は、仮想スピーカが設定される空間の概略的な平面図である。
【
図5】
図5は、複数の平面に対して音圧分布を算出する態様の一例を示す図である。
【
図6】
図6は、仮想スピーカと音圧分布を空間の画像に合成する方法を示すフローチャートである。
【
図7】
図7は、実施形態2に係る音処理装置の構成を示す機能ブロック図である。
【
図8】
図8は、実施形態に係る音処理装置の予想リスニング音の再生パートの構成を示す機能ブロック図である。
【
図9】
図9は、予想リスニング音の生成方法を示すフローチャートである。
【発明を実施するための形態】
【0010】
[音処理装置のハードウェア構成]
図1は、音処理装置のハードウェア構成図の一例を示す図である。
図1に示すように、音処理装置10は、ハードウェア構成として、コンピュータ等の演算装置70を備える。演算装置70は、CPU71、メモリ72、インターフェース731、映像出力ポート732、音出力ポート733、および、バス700を備える。バス700は、CPU71、メモリ72、インターフェース731、映像出力ポート732、および、音出力ポート733を接続する。
【0011】
メモリ72は、音処理装置の各部の動作を行うためのプログラムを含む各種プログラムやデータ等を記憶する。CPU71は、メモリ72に記憶された各種プログラムを実行することで、音処理装置を実現する。メモリ72が、各種のプログラムやデータを記憶することに限らず、インターフェース731を介して接続される外部記憶装置やネットワークにつながれているサーバ等が、各種のプログラムやデータを記憶してもよい。この場合、CPU71は、インターフェース731を介して、サーバ等から各種のプログラムやデータを読み出す。
【0012】
インターフェース731は、操作入力デバイス74およびカメラ75に対してデータ通信を実行する。また、インターフェース731は、操作入力デバイス74およびカメラ75に限らず、演算装置70に接続する外部の各種装置や外部のネットワークとの通信制御を実行する。
【0013】
操作入力デバイス74は、例えば、タッチパネル等である。操作入力デバイス74は、受け付けた操作に応じた指示データ等を、インターフェース731を介して、CPU71に出力する。指示データは、例えば、音圧分布の合成画像の開始指示、仮想スピーカの配置位置の指示等である。カメラ75は、撮像した画像データを、インターフェース731を介して、CPU71に出力する。
【0014】
映像出力ポート732は、ディスプレイ装置76に接続する。演算装置70、すなわち、音処理装置は、音圧分布を含む画像データ(後述の合成画像データ)を、映像出力ポート732を介して、ディスプレイ装置76に出力する。なお、音圧分布を含む画像データを出力しない場合、映像出力ポート732およびディスプレイ装置76は、省略できる。
【0015】
音出力ポート733は、放音装置77に接続する。放音装置77は、例えば、ヘッドホンスピーカ、設置型のステレオスピーカ等である。演算装置70、すなわち、音処理装置は、仮想スピーカから所望位置へ放音されたものとして算出された音(予想リスニング音)を、放音装置77に出力する。なお、予想リスニング音を出力しない場合、音出力ポート733および放音装置77は、省略できる。
【0016】
[実施形態1]
(音処理装置の機能的構成)
図2は、実施形態1に係る音処理装置の構成を示す機能ブロック図である。
図3(A)は、仮想スピーカおよび音圧分布の合成前の画像の一例を示す図であり、
図3(B)は、仮想スピーカおよび音圧分布の合成後の画像の一例を示す図である。
【0017】
図2に示すように、音処理装置10は、画像取得部11、平面設定部12、仮想スピーカ設定部13、音圧分布算出部14、合成画像生成部15、および、スピーカ特性記憶部20を備える。
【0018】
画像取得部11は、上述のカメラ75等から、音圧分布を算出する空間(本願発明の「音響空間」)の画像を取得する(
図3(A)参照)。例えば、画像取得部11は、音圧分布を算出する部屋91の画像90Pを取得する。画像取得部11は、画像90Pを、平面設定部12に出力する。
【0019】
平面設定部12は、画像90Pから、音圧分布を算出する平面を設定する。例えば、平面設定部12は、画像90Pから、部屋91における床面911を設定する。なお、平面設定部12は、具体的には、後述する各種の方法によって、音圧分布を算出する平面、具体的な一例として床面911を設定できる。この際、平面設定部12は、例えば、床面911にx-y座標を設定する。平面設定部12は、画像とともに、床面911のx-y座標を、合成画像生成部15に出力する。
【0020】
仮想スピーカ設定部13は、仮想スピーカの位置および種類を設定する。仮想スピーカの位置は、表示された画像における仮想スピーカの配置位置を指定することによって、設定する。配置位置の指定は、例えば、操作入力デバイス74による操作入力によって実現する。
【0021】
仮想スピーカ設定部13は、例えば、床面911に設定されたx-y座標で、仮想スピーカ92の位置を設定する。また、仮想スピーカ92の正面方向は、例えば、操作入力デバイス74による指定によって、設定できる。
【0022】
仮想スピーカ92の種類は、例えば、仮想スピーカの種類を選択する画像(ウィンドウ)等を、画像に表示し、種類を指定することによって設定する。種類の指定は、例えば、操作入力デバイス74による操作入力によって実現する。
【0023】
仮想スピーカ設定部13は、仮想スピーカの位置P92、および、仮想スピーカの種類を、音圧分布算出部14に出力する。
【0024】
スピーカ特性記憶部20は、仮想スピーカの種類毎に、スピーカ特性を記憶している。スピーカ特性は、スピーカを中心とする全周(360度)に亘る周波数特性によって構成されている。より具体的には、全周(360度)を所定分解能で分解して、複数の角度を設定する。そして、複数の角度のそれぞれに対して、周波数特性を設定している。スピーカ特性は、この複数の角度のそれぞれに対して設定された周波数特性によって構成される。スピーカ特性は、周波数特性を示すWAVデータ(時間波形)であってもよく、周波数スペクトルであってもよい。
【0025】
音圧分布算出部14は、仮想スピーカの種類から、この仮想スピーカに対応したスピーカ特性を、スピーカ特性記憶部20から取得する。
【0026】
音圧分布算出部14は、スピーカ特性と仮想スピーカの位置P92とを用いて、床面911の複数の位置における音圧を算出する。音圧は、直接音の音圧である。
【0027】
図4は、仮想スピーカが設定される空間の概略的な平面図である。より具体的には、音圧分布算出部14は、床面911において、音圧の算出位置Ppを設定する。音圧分布算出部14は、音圧の算出位置Ppと仮想スピーカの位置P92との距離DISを算出する。また、音圧分布算出部14は、仮想スピーカの位置P92を基準点とした音圧の算出位置Ppの方位角θを算出する。音圧分布算出部14は、例えば、
図4に示すように、仮想スピーカの正面方向を方位角θ=0として、床面911を正面視して、左回りに進む角度で設定する。なお、方位角θの設定方法は、これに限らない。また、ここでは、基準点は、仮想スピーカ92を平面視した中心に設定している。しかしながら、仮想スピーカ92に対する基準点の位置は、仮想スピーカ92のモデルとなるスピーカの形状によって異なる。例えば、仮想スピーカ92の前面に基準点を設定してもよく、仮想スピーカ92の背面に基準点を設定してもよい。さらには、仮想スピーカ92のモデルとなるスピーカが、天井913や壁912に音を反射させるタイプの場合、この反射点の位置が、基準点の位置となる。なお、基準点の設定は、これらの限りでなく、仮想スピーカ92のモデルやスピーカ形状等のよって、適宜設定可能である。
【0028】
音圧分布算出部14は、方位角θから、スピーカ特性における方位角θの成分を抽出する。これにより、音圧分布算出部14は、仮想スピーカに対して、方位角θの方向で、且つ、距離1mの位置での音圧(基準音圧)を算出できる。
【0029】
音圧分布算出部14は、基準音圧に対して、距離DISを用いて、距離方向の補正を行う。より具体的には、音圧分布算出部14は、音線法を用いて、音圧が距離の二乗に反比例して減衰する補正を行う。すなわち、音圧分布算出部14は、k・(距離DISの音圧)/(DIS)2の演算を行う。なお、kは、係数であり、基本的には、「1」でよいが、温度や湿度によって調整できる。これにより、音圧分布算出部14は、空気による音のエネルギーの吸収の影響を加味して、音圧を算出できる。
【0030】
音圧分布算出部14は、このような音圧の算出処理を、床面911に設定した複数の位置に対して行う。例えば、音圧分布算出部14は、音圧の算出処理を、床面911の全体や、床面911における所望範囲内に対して行う。なお、所望範囲の指定は、例えば、操作入力デバイス74による操作入力によって実現可能である。
【0031】
音圧分布算出部14は、複数の位置で算出した音圧、すなわち、音圧分布を、合成画像生成部15に出力する。この際、音圧分布算出部14は、音圧分布を、x-y座標に関連づけして出力する。
【0032】
図3(B)に示すように、合成画像生成部15は、仮想スピーカ92と音圧分布93とを、画像90Pに合成し、合成画像90を生成する。この際、合成画像生成部15は、画像90Pに関連付けされたx-y座標、仮想スピーカ92に関連付けされたx-y座標、および、音圧分布93に関連付けされたx-y座標を一致させて合成する。
【0033】
これにより、
図3(B)に示すように、合成画像90は、空間の画像90P(部屋91の画像)における指定位置に仮想スピーカ92が配置され、これに応じた音圧分布93が床面911に重畳された画像となる。これにより、現実のスピーカが実際に配置されていなくても、ユーザは、この現実のスピーカに対応した仮想スピーカ92を設置して、空間の音圧を、視覚的に把握できる。ここで、
図3(B)のハッチングに示すように、音圧分布93は、音圧の大きさに応じて表示態様が変化する画像とする。これにより、ユーザは、仮想スピーカ92を設置したときの空間の音圧を、視覚的に、さらに容易に把握できる。
【0034】
なお、上述の説明において、音圧分布は、床面911の表面、すなわち、x―y座標面に直交するz方向の0の位置の平面に限るものでなく、所定の高さ(z座標が0でない値)の平面に対しても算出する。すなわち、音圧を算出する平面を、床面911から所定高さの平面に設定することもできる。この場合、音圧分布算出部14は、z軸の位置も加味して、距離補正を行えばよい。
【0035】
また、上述の説明は、音処理装置10は、1個の平面に対して音圧分布を算出する。しかしながら、音処理装置10は、複数の平面に対して、それぞれに音圧分布を算出することもできる。
【0036】
図5は、複数の平面に対して音圧分布を算出する態様の一例を示す図である。
図5に示すように、コンサートホール等は、1階席、2階席、3階席等の複数の階を備えることがある。この場合、例えば、
図5に示すように、音処理装置10は、1階を第1の床面911F、2階を第2の床面911S、3階を第3の床面911Tに設定する。そして、音処理装置10は、第1の床面911F、第2の床面911S、および、第3の床面911Tのそれぞれに対して、上述の方法を用いて、音圧分布を算出する。
【0037】
また、上述の構成は、仮想スピーカ92を1台配置する態様を示した。しかしながら、仮想スピーカ92の台数は、1台に限らず、複数台であってもよい。この場合、音圧分布算出部14は、複数の仮想スピーカ92からの音圧を周波数領域で加算することによって、各位置の音圧を算出することができる。
【0038】
また、上述の音処理装置10は、直接音の音圧分布を算出する態様を示した。しかしながら、音処理装置10は、空間(部屋91)の初期反射音や残響音の設定パラメータを用いれば、間接音も含めて、音圧分布を算出することができる。
【0039】
(音処理方法(合成画像の生成方法))
上述の説明では、合成画像の生成方法、より具体的には、仮想スピーカ92および音圧分布を空間(部屋91)の画像に重畳する処理は、複数の機能部によって実現されている。しかしながら、上述のようなコンピュータ等の演算装置70でプログラムを実行して合成画像を生成する場合、概略的には、
図6のフローチャートに示す処理を実行すればよい。
図6は、仮想スピーカと音圧分布を空間の画像に合成する方法を示すフローチャートである。なお、各処理の具体的な内容は、上述しているので、ここでは、概略的な流れのみを説明する。
【0040】
演算装置70は、カメラ75等から、空間の画像を取得する(S11)。演算装置70は、空間の画像に対して、平面を設定する(S12)。演算装置70は、仮想スピーカ92を設定する(S13)。
【0041】
演算装置70は、仮想スピーカ92の位置と、仮想スピーカ92の種類(スピーカ特性)から、音圧分布を算出する(S14)。演算装置70は、仮想スピーカ92と音圧分布を、空間の画像に合成し、合成画像を生成する(S15)。
【0042】
(音圧分布を算出する平面(一例として床面911)の具体的な設定方法)
(A)平面設定部12は、画像90Pに映る各物体に対して、それぞれの特徴から、床、側壁、天井をラベリングする。そして、平面設定部12は、床としてラベリングされた物体の表面を、床面911に設定する。この際、平面設定部12は、側壁としてラベリングされた物体に接続する物体の表面、天井としてラベリングされた物体に対向する物体の表面を、床面911に設定してもよい。
【0043】
(B)平面設定部12は、床面911の形状を長方形と仮定し、画像90Pの横方向および奥行き方向に広がる略長方形を、画像90Pから抽出する。平面設定部12は、この略長方形の平面を、床面911に設定する。
【0044】
(C)ユーザは、移動検出装置を備える。移動検出装置は、自装置の移動を検出する。ユーザは、床面911の外周(側面)に沿って移動する。移動検出装置は、自装置の移動を検出し、検出結果を、平面設定部12に出力する。平面設定部12は、検出結果から、床面911を設定する。なお、移動検出装置は、自装置の継続的な移動を検出せず、自装置の位置を検出してもよい。この場合、ユーザは、床面911の頂点(角部)において、移動検出装置に位置を検出させる。平面設定部12は、例えば、指定された各位置によって囲まれる領域を、床面911に設定する。
【0045】
(D)操作入力デバイス74は、画像90Pに対する位置の指定を受け付ける。ユーザは、操作入力デバイス74を用いて、床面911の頂点(角部)の位置を指定する。平面設定部12は、例えば、指定された各位置によって囲まれる領域を、床面911に設定する。または、操作入力デバイス74は、領域の指定を受け付ける。ユーザは、操作入力デバイス74を用いて、床面911の領域を指定する。平面設定部12は、指定された領域を、床面911に設定する。
【0046】
なお、床面911の検出は、例えば、床面911の特徴部等を抽出して用いる既知の画像解析を用いて行うことも可能である。この場合、ユーザは、床面911を別途指定すること無く、床面911を設定できる。
【0047】
[実施形態2]
(音処理装置の機能的構成)
図7は、実施形態2に係る音処理装置の構成を示す機能ブロック図である。
図8は、実施形態に係る音処理装置の予想リスニング音の再生パートの構成を示す機能ブロック図である。
【0048】
図7に示すように、音処理装置10Aは、上述の音処理装置10に対して、聴取位置設定部31、伝搬特性算出部32、音信号生成部33、および、原音データ記憶部40を、さらに備える点で異なる。音処理装置10Aの他の構成は、音処理装置10と同様であり、同様の箇所の説明は省略する。
【0049】
聴取位置設定部31は、例えば、操作入力デバイス74から画像への聴取位置の指定によって、聴取位置を設定する。聴取位置設定部31は、空間に関連付けられたx-y座標を用いて、聴取位置を設定する。聴取位置設定部31は、聴取位置を、伝搬特性算出部32に出力する。
【0050】
図8に示すように、伝搬特性算出部32は、位置関係算出部321、スピーカ特性取得部322、IFFT処理部323、および、特性調整部324を備える。
【0051】
位置関係算出部321は、仮想スピーカ92の位置と聴取位置とから、仮想スピーカ92の位置を基準とした聴取位置迄の距離、および、聴取位置の方位角を算出する。位置関係算出部321は、聴取位置の距離および方位角を、上述の音圧分布の算出の場合と同様に、算出する。位置関係算出部321は、方位角を、スピーカ特性取得部322に出力する。位置関係算出部321は、距離を、特性調整部324に出力する。
【0052】
スピーカ特性取得部322は、設定された仮想スピーカ92のスピーカ特性を、スピーカ特性記憶部20から取得する。スピーカ特性取得部322は、取得したスピーカ特性における、算出された方位角の成分(所望方位角成分)を、周波数波形(周波数スペクトル)で取得する。スピーカ特性取得部322は、スピーカ特性の所望方位角成分の周波数波形を、IFFT処理部323に出力する。
【0053】
IFFT処理部323は、スピーカ特性の所望方位角成分の周波数スペクトルを、逆フーリエ変換することで、聴取位置の方位角に対するインパルス応答データを生成する。IFFT処理部323は、インパルス応答データを、特性調整部324に出力する。
【0054】
特性調整部324は、インパルス応答データに対して、聴取位置の距離を用いて、距離減衰の補正を行う。特性調整部324は、上述の音圧分布算出部14と同様に、音線法を用いて、インパルス応答データに対する距離減衰の補正を行う。
【0055】
これにより、伝搬特性算出部32は、仮想スピーカ92の種類と仮想スピーカ92の位置P92に対する聴取位置とに応じて設定されたインパルス応答データ(聴取位置のインパルス応答データ)を算出できる。伝搬特性算出部32は、聴取位置のインパルス応答データを、音信号生成部33に出力する。このインパルス応答データが、本発明の「音の伝搬特性」に対応する。
【0056】
図8に示すように、音信号生成部33は、FFT処理部331、原音データ取得部332、FFT処理部333、畳み込み演算部334、IFFT処理部335、および、出力音調整部336を備える。
【0057】
FFT処理部331は、伝搬特性算出部32の特性調整部324から出力された聴取位置のインパルス応答データをフーリエ変換することで、聴取位置のインパルス応答データの周波数波形(周波数スペクトル)を生成する。FFT処理部331は、聴取位置のインパルス応答データの周波数波形を、畳み込み演算部334に出力する。
【0058】
原音データ取得部332は、原音データ記憶部40から、可聴化したい原音データを取得する。より具体的には、原音データ取得部332は、例えば、操作入力デバイス74を用いた指定によって、可聴化したい原音データの選択を受け付ける。原音データ取得部332は、選択を受け付けた原音データを、原音データ記憶部40から取得する。なお、原音データ記憶部40は、原音データを、例えば、WAVデータ等の時間波形のデータで記憶しており、原音データ取得部332は、この時間波形の原音データを、取得する。原音データ取得部332は、原音データを、FFT処理部333に出力する。
【0059】
FFT処理部333は、時間波形の原音データをフーリエ変換することで、周波数波形の原音データを生成する。FFT処理部333は、周波数波形の原音データを、畳み込み演算部334に出力する。この際、FFT処理部333は、原音データに対して窓関数を乗算して、所望とする短時間でのFFTを行うとよい。
【0060】
畳み込み演算部334は、聴取位置のインパルス応答データと原音データとを畳み込み演算し、周波数波形の予想リスニング音データを生成し、IFFT処理部335に出力する。
【0061】
IFFT処理部335は、周波数波形の予想リスニング音データを、逆フーリエ変換し、時間波形の予想リスニング音信号を生成する。IFFT処理部335は、時間波形の予想リスニング音信号を、出力音調整部336に出力する。
【0062】
これにより、音信号生成部33は、空間における聴取位置と仮想スピーカ92の位置P92および種類とに応じた予想リスニング音信号を生成できる。
【0063】
出力音調整部336は、予想リスニング音信号から、Lチャンネル用予想リスニング音信号SoLとRチャンネル用予想リスニング音信号SoRとを生成する。出力音調整部336は、Lチャンネル用予想リスニング音信号SoLを、Lチャンネルスピーカ82Lに出力し、Rチャンネル用予想リスニング音信号SoRを、Rチャンネルスピーカ82Rに出力する。Lチャンネルスピーカ82Lは、Lチャンネル用予想リスニング音信号SoLを放音し、Rチャンネルスピーカ82Rは、Rチャンネル用予想リスニング音信号SoRを放音する。
【0064】
これにより、ユーザは、空間内の所望位置に配置した所望スピーカからの音を、所望のスピーカを実際に配置しなくても、その場にいるかのように、仮想的に聞くことができる。
【0065】
さらに、出力音調整部336は、位置関係算出部321からの方位角θ、すなわち、仮想スピーカ92に対する聴取位置の方向を用いて、Lチャンネル用予想リスニング音信号SoLとRチャンネル用予想リスニング音信号SoRとのレベルバランスを調整する。これにより、ユーザは、空間内の所望位置に配置した仮想スピーカ92からの予想リスニング音を、より臨場感をもって聞くことができる。
【0066】
なお、上述の音処理装置10Aの例では、仮想スピーカ92の個数を1個としたが、仮想スピーカ92の個数は、複数個であってもよい。この場合、音処理装置10Aは、複数の仮想スピーカ92からの予測リスニング音信号を合成して出力すればよい。
【0067】
また、上述の音処理装置10Aは、ステレオスピーカを用いて、ステレオ型の予想リスニング音を出力する。しかしながら、音処理装置に複数のスピーカを接続する構成とし、音処理装置は、複数のスピーカのそれぞれに出力する予想リスニング音信号の位相、振幅を調整することで、音像定位を実現できる。これにより、ユーザは、空間内の所望位置に配置した仮想スピーカ92からの予想リスニング音を、より一層、臨場感をもって聞くことができる。
【0068】
また、上述の音処理装置10Aは、操作入力デバイス74による指定によって聴取位置を設定する。しかしながら、カメラ75に位置検出機能を持たせることで、音処理装置10Aは、カメラ75の位置、すなわち、画像の撮像位置を、聴取位置に設定することができる。これにより、ユーザは、聴取位置をわざわざ設定しなくても、カメラ75の位置、すなわち、ユーザの位置を聴取位置に設定できる。したがって、ユーザは、撮像位置での予想リスニング音を、容易に聞くことができる。
【0069】
また、音処理装置10Aは、合成画像の出力と、予想リスニング音の放音とを行う。しかしながら、予想リスニング音の放音のみを行うのであれば、音処理装置10Aは、画像取得部11、平面設定部12、音圧分布算出部14、および、合成画像生成部15を省略できる。
【0070】
(音処理方法(予想リスニング音の生成方法))
上述の説明では、予想リスニング音の生成方法は、複数の機能部によって実現されている。しかしながら、上述のようなコンピュータ等の演算装置70でプログラムを実行して予想リスニング音を生成する場合、概略的には、
図9、
図10、
図11のフローチャートに示す処理を実行すればよい。
図9は、予想リスニング音の生成方法を示すフローチャートである。
図10は、
図9に示す伝搬特性の算出方法を示すフローチャートである。
図11は、
図9に示す音信号の生成方法を示すフローチャートである。なお、各処理の具体的な内容は、上述しているので、ここでは、概略的な流れのみを説明する。
【0071】
演算装置70は、聴取位置を取得し、聴取位置に応じた伝搬特性(聴取位置のインパルス応答データ)を算出する(S21)。より具体的には、
図10に示すように、演算装置70は、仮想スピーカ92の位置P92と聴取位置との位置関係を算出する(S31)。演算装置70は、スピーカ特性を取得する(S32)。演算装置70は、仮想スピーカ92の位置P92と聴取位置との位置関係と、スピーカ特性と、を用いて、聴取位置に対するインパルス応答データを生成する(S33)。
【0072】
演算装置70は、聴取位置の伝搬特性と、放音したい原音データとを用いて、予想リスニング音を生成する(S22)。より具体的には、
図11に示すように、演算装置70は、可聴化したい原音データを取得する(S41)。演算装置70は、伝搬特性、すなわち、聴取位置に対するインパルス応答データと、原音データと、を畳み込み演算する(S42)。演算装置70は、聴取位置に応じて、LRバランスを調整する(S43)。
【0073】
このような処理を行うことによって、ユーザは、空間内の所望位置に配置した所望スピーカからの音を、所望のスピーカを実際に配置しなくても、その場にいるかのように、仮想的に聞くことができる。
【0074】
さらに、ユーザは、LRバランスが調整されたステレオ音によって、仮想スピーカ92からのリスニング音を聞くことができる。これにより、ユーザは、空間内の所望位置に配置した仮想スピーカ92からのリスニング音を、より臨場感をもって聞くことができる。
【0075】
なお、上述のステップS43の処理に代えて、ヘッドホンスピーカによる音の再生を用いれば、より正確な音像定位が可能になる。これにより、空間内の所望位置に配置した仮想スピーカ92からのリスニング音の再現性は、さらに向上する。したがって、ユーザは、仮想スピーカ92からのリスニング音を、より一層、臨場感をもって聞くことができる。
【0076】
本実施形態の説明は、すべての点で例示であって、制限的なものではない。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲には、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0077】
10、10A:音処理装置
11:画像取得部
12:平面設定部
13:仮想スピーカ設定部
14:音圧分布算出部
15:合成画像生成部
20:スピーカ特性記憶部
31:聴取位置設定部
32:伝搬特性算出部
33:音信号生成部
40:原音データ記憶部
70:演算装置
71:CPU
72:メモリ
74:操作入力デバイス
75:カメラ
76:ディスプレイ装置
77:放音装置
82L:Lチャンネルスピーカ
82R:Rチャンネルスピーカ
90:合成画像
90P:画像
91:部屋
92:仮想スピーカ
93:音圧分布
321:位置関係算出部
322:スピーカ特性取得部
323:IFFT処理部
324:特性調整部
331:FFT処理部
332:原音データ取得部
333:FFT処理部
334:畳み込み演算部
335:IFFT処理部
336:出力音調整部
700:バス
731:インターフェース
732:映像出力ポート
733:音出力ポート
911:床面
911F:第1の床面
911S:第2の床面
911T:第3の床面
SoL:Lチャンネル用予想リスニング音信号
SoR:Rチャンネル用予想リスニング音信号