IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝ソリューション株式会社の特許一覧

<>
  • 特開-推定装置、推定方法及びプログラム 図1
  • 特開-推定装置、推定方法及びプログラム 図2
  • 特開-推定装置、推定方法及びプログラム 図3A
  • 特開-推定装置、推定方法及びプログラム 図3B
  • 特開-推定装置、推定方法及びプログラム 図4
  • 特開-推定装置、推定方法及びプログラム 図5
  • 特開-推定装置、推定方法及びプログラム 図6A
  • 特開-推定装置、推定方法及びプログラム 図6B
  • 特開-推定装置、推定方法及びプログラム 図7
  • 特開-推定装置、推定方法及びプログラム 図8
  • 特開-推定装置、推定方法及びプログラム 図9
  • 特開-推定装置、推定方法及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025032595
(43)【公開日】2025-03-12
(54)【発明の名称】推定装置、推定方法及びプログラム
(51)【国際特許分類】
   G10L 25/51 20130101AFI20250305BHJP
   H04R 3/00 20060101ALI20250305BHJP
【FI】
G10L25/51 400
H04R3/00 320
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023137957
(22)【出願日】2023-08-28
(71)【出願人】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(71)【出願人】
【識別番号】301063496
【氏名又は名称】東芝デジタルソリューションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】菊川 裕作
(72)【発明者】
【氏名】平山 直樹
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA06
5D220BC05
(57)【要約】
【課題】より低い計算コストで、音源の到来方向をロバストに推定できるようにする。
【解決手段】実施形態の推定装置は、変換部と空間相関算出部と空間相関フィルタ部と方向推定部とを備える。変換部は、複数のチャンネルの音響信号に時間周波数変換を行うことによって、周波数スペクトルを取得する。空間相関算出部は、前記周波数スペクトルから空間相関行列を算出する。空間相関フィルタ部は、前記空間相関行列から空間相関フィルタを算出する。方向推定部は、前記空間相関フィルタに含まれる部分要素から概括的な方向情報を推定する。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数のチャンネルの音響信号に時間周波数変換を行うことによって、周波数スペクトルを取得する変換部と、
前記周波数スペクトルから空間相関行列を算出する空間相関算出部と、
前記空間相関行列から空間相関フィルタを算出する空間相関フィルタ部と、
前記空間相関フィルタに含まれる部分要素から概括的な方向情報を推定する方向推定部と、
を備える推定装置。
【請求項2】
前記方向推定部は、
前記空間相関フィルタから、前記複数のチャンネルの位相差を示す情報を含む主要要素を抽出する抽出部と、
前記主要要素から、特定の時間における特定の周波数の傾向を特定し、前記傾向によって示される局所方向情報を推定し、前記局所方向情報に基づき、前記概括的な方向情報を出力する推定部と、
を備える請求項1に記載の推定装置。
【請求項3】
前記方向推定部は、
前記空間相関フィルタから、前記複数のチャンネルの位相差を示す情報を含む主要要素を抽出する抽出部と、
前記主要要素から、特定の時間における特定の周波数の傾向を特定し、前記傾向によって示される局所方向情報を推定する推定部と、
前記局所方向情報を、時間方向及び帯域方向の少なくとも一方にスムージング補正し、前記スムージング補正された局所方向情報に基づき、前記概括的な方向情報を出力するスムージング処理部と、
を備える請求項1に記載の推定装置。
【請求項4】
前記推定部は、前記特定の時間における特定の周波数の傾向が、所定の値より大きいか否かによって、前記局所方向情報を推定する、
請求項2又は3に記載の推定装置。
【請求項5】
前記推定部は、前記所定の値を、前記概括的な方向情報の推定精度を向上させる調整値によって調整する、
請求項4に記載の推定装置。
【請求項6】
前記概括的な方向情報は、+θ又は-θの角度によって示される方向、左又は右、前又は後、及び、上又は下のいずれかを示す、
請求項1乃至3のいずれか1項に記載の推定装置。
【請求項7】
前記音響信号から認識された音声認識パターンによる制御を、前記概括的な方向情報に基づき変更する制御部、
を更に備える請求項1乃至3のいずれか1項に記載の推定装置。
【請求項8】
推定装置が、複数のチャンネルの音響信号に時間周波数変換を行うことによって、周波数スペクトルを取得するステップと、
前記推定装置が、前記周波数スペクトルから空間相関行列を算出するステップと、
前記推定装置が、前記空間相関行列から空間相関フィルタを算出するステップと、
前記推定装置が、前記空間相関フィルタに含まれる部分要素から概括的な方向情報を推定するステップと、
を含む推定方法。
【請求項9】
コンピュータを、
複数のチャンネルの音響信号に時間周波数変換を行うことによって、周波数スペクトルを取得する変換部と、
前記周波数スペクトルから空間相関行列を算出する空間相関算出部と、
前記空間相関行列から空間相関フィルタを算出する空間相関フィルタ部と、
前記空間相関フィルタに含まれる部分要素から概括的な方向情報を推定する方向推定部と、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は推定装置、推定方法及びプログラムに関する。
【背景技術】
【0002】
複数のマイクロフォンから入力された音響信号を周波数変換し、周波数変換された時間周波数変換信号から、音信号に含まれる目的音源に対する方向を示す目的音源方向情報に基づく空間相関フィルタを用いて、ビームフォーミングする方法が従来から知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第7182168号公報
【特許文献2】特許第3677143号公報
【特許文献3】特許第7191793号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、より低い計算コストで、音源の到来方向をロバストに推定することが難しかった。
【課題を解決するための手段】
【0005】
実施形態の推定装置は、変換部と空間相関算出部と空間相関フィルタ部と方向推定部とを備える。変換部は、複数のチャンネルの音響信号に時間周波数変換を行うことによって、周波数スペクトルを取得する。空間相関算出部は、前記周波数スペクトルから空間相関行列を算出する。空間相関フィルタ部は、前記空間相関行列から空間相関フィルタを算出する。方向推定部は、前記空間相関フィルタに含まれる部分要素から概括的な方向情報を推定する。
【図面の簡単な説明】
【0006】
図1図1は、第1実施形態の複数のマイクの配置例を示す図である。
図2図2は、第1実施形態の推定装置の機能構成の例を示す図である。
図3A図3Aは、位相スペクトルについて説明するための図である。
図3B図3Bは、位相スペクトルについて説明するための図である。
図4図4は、第1実施形態の空間相関フィルタの例とその適用例を示す図である。
図5図5は、第1実施形態の方向推定部の機能構成の例を示す図である。
図6A図6Aは、第1実施形態の概括的な方向情報の推定例1を示す図である。
図6B図6Bは、第1実施形態の概括的な方向情報の推定例2を示す図である。
図7図7は、第1実施形態の推定方法の例を示すフローチャートである。
図8図8は、第2実施形態の方向推定部の機能構成の例を示す図である。
図9図9は、第2実施形態の推定方法の例を示すフローチャートである。
図10図10は、第1及び第2実施形態の推定装置のハードウェア構成の例を示す図である。
【発明を実施するための形態】
【0007】
以下に添付図面を参照して、推定装置、推定方法及びプログラムの実施形態を詳細に説明する。
【0008】
(第1実施形態)
音声認識パターン等の通知結果を制御する場合であれば、ビームフォーミングまでする必要はなく、例えば、左右の推定等の概括的な方向情報が得られれば良いこともある。また、目的音源が完全に固定されず微動してしまう場合、または、マイク間距離が変わる場合などは、厳密な方向推定は用途に合わないこともある。一方で、方向判定は、周囲雑音にはロバストであることが求められる場合がある。
【0009】
以下、計算コストを節約し、かつ、ノイズ耐性を強化することができる第1実施形態の推定装置について説明する。
【0010】
はじめに、第1実施形態の複数のマイクの配置例について説明する。
【0011】
[複数のマイクの配置例]
図1は、第1実施形態の複数のマイクL及びRの配置例を示す図である。図1の例は、車載ユースケースの場合を示す。第1実施形態の推定装置は、2つのマイクL及びRによって取得された情報から、音源の概括的な到来方向(図1の例では、左又は右)を推定する。音源の概括的な到来方向は、例えば、音声認識により検出されたキーワードによる機器制御に活用される。
【0012】
具体的には、例えば、音楽・テレビ・ラジオなどの車内エンタメ操作(例えば、「おんがくさいせい」など、ユーザによる音声入力による操作)は、誰の音声にも反応させる機器制御が考えられる。図1の例では、車内エンタメ操作による機器制御では、右から到来した音声(すなわち助手席に座るユーザの音声)、及び、左から到来した音声(すなわち運転席に座るドライバーの音声)の両方の音声に反応させる。
【0013】
また例えば、運転操作のキーワード(例えば、「りあもにたー」など)による運転支援制御では、運転席のドライバーの声だけに反応させることが考えられる。図1の運転支援制御の例では、左から到来した音声(すなわち運転席に座るドライバーの音声)に反応させ、右から到来した音声(すなわち助手席に座るユーザの音声)には反応させない。
【0014】
なお、第1実施形態の推定装置は、複数のマイクの配置次第で、左右だけではなく、上下・前後等の概括的な到来方向も推定可能である。また、複数のマイク(複数のチャンネル)の数は2つに限られず、3つ以上でもよい。
【0015】
[機能構成の例]
図2は、第1実施形態の推定装置10の機能構成の例を示す図である。第1実施形態の推定装置10は、変換部1、遅延部2、空間相関算出部3、空間相関算出部4、空間相関フィルタ部5、方向推定部6及び制御部7を備える。
【0016】
変換部1は、マイクLから入力された音響信号を、時間周波数変換することによって、周波数スペクトルX[0][size]に変換する。ここで、[0]は、マイクLからの入力であることを示すチャンネル数を示す。[size]は、周波数ビンの番号を示す。時間周波数変換は、例えば、高速フーリエ変換及び離散フーリエ変換などの処理によって算出される。
【0017】
同様に、変換部1は、マイクRから入力された音響信号を、時間周波数変換することによって、周波数スペクトルX[1][size]に変換する。ここで、[1]は、マイクRからの入力であることを示すチャンネル数を示す。
【0018】
以下、周波数スペクトルX[0][size]及びX[1][size]を区別しない場合は、周波数スペクトルX[ch][size]により表す。
【0019】
周波数スペクトルX[ch][size]の成分、すなわち、時間周波数変換された音響信号の成分は、下記式(1)のように、複素スペクトルで表現される。
【0020】
【数1】
【0021】
ここで、reは実部を示し、imは虚部を示す。この複素スペクトルは、例えば、下記式(2)によるパワースペクトル(周波数毎の振幅成分)、及び、下記式(3)による位相スペクトル(周波数毎の位相成分)などの計算に利用される。
【0022】
【数2】
【0023】
【数3】
【0024】
図3A及び3Bは、位相スペクトルについて説明するための図である。位相スペクトルは、音響信号が基準時刻からどれだけ進んでいるか(あるいは遅れているか)を示す指標である。図3Aに示すように、音源からの音の到来方向に方向差があると、それぞれのマイクL及びRまでの到来距離がΔd変わる。そのため、マイクRに到来する音響信号に、図3Bのように位相遅れΔdが生じる。
【0025】
図2に戻り、遅延部2は、変換部1から周波数スペクトルX[ch][size]を受け付けると、周波数スペクトルX[ch][size]を所定の時間だけ遅延させる。遅延時間は、強調すべき音声であるコマンドワード発声の継続長が概ね遅延時間以下となるように設定すればよい。コマンドワードが「スイッチオン」などの短い言葉である場合、コマンドワード発声の継続長は1秒以下であると仮定できる。この場合、遅延時間は例えば1秒に設定される。1秒の遅延時間は125(=16000×1/128)の遅延フレーム数に等しい。すなわち、遅延部2は、125フレーム分の周波数スペクトルX[ch][size]をバッファリングし、125フレーム遅延させたX[ch][size]を出力する。
【0026】
空間相関算出部3は、周波数スペクトルX[ch][size]に基づいて、音声と雑音の空間相関行列を算出する。空間相関行列は、チャンネル間の空間相関を表す情報であり、空間的なエネルギー分布が表現されている。具体的には、まず空間相関算出部3は、時間周波数変換された音響信号(周波数スペクトルX[ch][size])から混合行列信号Conv[size][f]を計算する。混合行列Conv[size][f]は、下記式(4)のように、複数チャンネルの情報が混ざり合うように計算される。
【0027】
【数4】
【0028】
ここで、fは要素番号を示す。なお混合行列信号には、複数のチャンネル全ての情報が含まれている要素が存在する。上記式(4)では、要素番号がf及びfの混合行列には、複数のチャンネル(第1実施形態では、チャンネル0及び1)の位相差を含む情報が含まれる。
【0029】
次に、空間相関算出部3は、下記式(5)により、混合行列Conv[size][f]から空間相関行列Φs[size][f]及びΦn[size][f]を計算する。ここで、sは信号を示し、nはノイズを示す。
【0030】
【数5】
【0031】
同様に、空間相関算出部4は、遅延部2から受け取った周波数スペクトルX[ch][size]に基づいて、音声と雑音の空間相関行列を算出する。第1実施形態の空間相関算出部3及び4のように、空間相関行列信号は、複数個計算しても良い。例えば、空間相関算出部3により計算された現時刻の空間相関行列を空間相関行列信号成分とし、空間相関算出部4により計算された一定時間前(所定のフレーム数前)の空間相関行列を空間相関雑音成分としても良い(詳細は、特許文献3参照)。
【0032】
なお、一定時間前(所定のフレーム数前)の空間相関行列の計算が行われない場合には、遅延部2及び空間相関算出部4が、推定装置10に備えられていなくてもよい。
【0033】
空間相関フィルタ部5は、空間相関行列Φs[size][f]及びΦn[size][f]に基づいて、1以上の空間相関フィルタ(第1実施形態では、2つの空間相関フィルタ)を算出する。具体的には、まず、空間相関フィルタ部5は、空間相関行列Φs[size][f]及びΦn[size][f]信号から、固有値ベクトル信号を算出する。固有値ベクトル信号の算出に当たっては、処理負荷を抑えるため、下記式(6)の2次元固有値ベクトルM[size]のように、2次元程度の固有値ベクトルでも良い。
【0034】
【数6】
【0035】
固有値ベクトルは各要素に関して、複数チャンネルの全情報が含まれている要素がある。上記式(6)の例では、要素番号がf及びfの混合行列を使う固有値Mはいずれも位相差情報が含まれる。
【0036】
次に、空間相関フィルタ部5は、固有値ベクトル信号から空間相関フィルタ係数を計算する。例えば2次元の固有値とした場合、4つの要素成分が生成される。
【0037】
図4は、第1実施形態の空間相関フィルタVector[size]の例とその適用例を示す図である。図4の例では、空間相関フィルタ係数は、現時刻の信号成分の信号・ノイズ比率(SNR)が最大化されるように計算される。
【0038】
なお、空間相関フィルタVector[size]の1要素から、概括的な方向差を判定可能である。概括的な方向差の判定方法の詳細は、図5を参照して後述する。
【0039】
また、空間相関フィルタVector[size]の要素は、複数、使用されてもよい。例えば、空間相関フィルタVector[size]の1以上の要素が、概括的な方向推定のパラメータ調整に使用されてもよい。
【0040】
また、空間相関フィルタVector[size]を時間周波数変換された音響信号の各要素に乗算することで、現時刻の信号を強調することが可能となる。
【0041】
図2に戻り、方向推定部6は、1以上の空間相関フィルタの部分要素から概括的な方向情報を推定する。概括的な方向情報は、厳密な方向情報ではなく、左右情報などのような大括りの情報となる。例えば、概括的な方向情報は、θ又は-θの角度によって示される方向、左又は右、前又は後、及び、上又は下などである。
【0042】
概括的な方向情報は、例えば、認識パターンの結果通知等の制御に利用される。なお、音声と雑音の空間相関行列から得られる空間相関フィルタが用いられることで、周囲雑音からの耐性を強化できる。また、概括的な方向情報を推定することに限るため、計算コストを節約できる。また、概括的な方向情報の推定は、マイク間距離や目的音源移動にも影響も受けづらい。
【0043】
制御部7は、音響信号から認識された音声認識パターンによる制御を、概括的な方向情報に基づき変更する。例えば、制御部7は、概括的な方向情報から、運転席からの音声であるのか、助手席からの音声であるのかを推定し、推定結果に基づき音声認識パターンによる制御を変更する。
【0044】
図5は、第1実施形態の方向推定部6の機能構成の例を示す図である。第1実施形態の方向推定部6は、抽出部61、推定部62及びスムージング処理部63を備える。
【0045】
抽出部61は、空間相関フィルタ係数の1要素を主要要素として抽出する。先の通り、2次元の固有値とした場合、4つの要素成分が生成される。抽出部61は、4つの要素成分を1要素に絞り込む。具体的には、抽出部61は、複数のチャンネル全ての情報(例えば、複数のチャンネルの位相差を示す情報)が含まれている要素を、主要要素として抽出する。抽出部61は、複数のチャンネル全ての情報が含まれている要素が複数ある場合は、効果(概括的な方向情報の推定精度)から一意に抽出してもよいし、後から1要素を抽出または変更できるようにしてもよい。
【0046】
抽出部61は、もちろん1種類の要素だけではなく、同時に複数の要素を抽出し、その差分などを計算してもよい。また、抽出部1が、主要要素以外の補助要素を抽出し、推定部62が、局所方向情報の補正のために、補助要素を加重してもよい。
【0047】
推定部62は、抽出部61により抽出された主要要素、または、主要要素及び補助要素に基づき、推定された局所方向を、概括的な方向情報として出力する。例えば、推定部62は、主要要素から、特定の時間における特定の周波数の傾向(トレンド)を特定し、当該傾向によって示される局所方向情報を推定し、当該局所方向情報に基づき、概括的な方向情報を出力する。具体的には、推定部62は、空間相関フィルタ係数の主要要素は、周波数毎の情報となっているため、纏まった周波数帯域で主要要素を合算し、平均化する。そして、推定部62は、平均化された主要要素を示す局所方向情報を、概括的な方向情報として出力する。
【0048】
図6A及び6Bは、第1実施形態の概括的な方向情報の推定例1及び2を示す図である。図6A及び6Bの主要成分の値は、空間相関フィルタに含まれる部分要素(例えば、1要素)から得られた局所方向情報を示す。局所方向情報は、特定の時間における特定の周波数の傾向(トレンド)を含む。図6A及び6Bでは、空間相関フィルタの主要要素から推定される概括的な方向情報が、+30度方向及び-30度方向である場合の例を示す。
【0049】
推定部62は、特定の時間における特定の周波数の傾向が、所定の値より大きいか否かによって、局所方向情報を推定する。図6A及び6Bの例では、所定の値は0である。
【0050】
図6Aでは、局所方向を示す主要成分は、マイナスの値よりもプラスの値が多い。そのため、推定部62は、図6Aの局所方向情報が得られた場合、+30度方向の音声(例えば、助手席からの音声)であることを推定する。
【0051】
一方、図6Bでは、局所方向を示す主要成分は、プラスの値よりもマイナスの値が多い。そのため、推定部62は、図6Bの局所方向情報が得られた場合、+30度方向の音声(例えば、運転席からの音声)であることを推定する。
【0052】
なお、推定部62は、局所方向情報に任意の調整値を加えても良い。調整値を加えることで、判定の閾値を調整することが可能となる。例えば、図6A及び6Bの例では、調整値によって、主要成分が0付近の値が、+30度方向又は-30度方向の音声のどちらの音声であることを示すのかを調整することができる。調整値により、概括的な方向情報の推定精度を更に向上させることができる。
【0053】
また、纏める周波数帯域は、低域から高域までの全帯域としても良いし、音声成分が多く含まれる音声帯域の範囲に留めても良い。その他、推定部62は、特定周波数成分に対して重みづけを与えても良い。また、推定部62は、局所方向情報を時間方向に平均化しても良い。これら平均化によって、局所方向をより概括的な方向として出力できる。
【0054】
[推定方法の例]
図7は、第1実施形態の推定方法の例を示すフローチャートである。はじめに、変換部1が、複数チャンネルの音声(音響信号)の入力を受け付け(ステップS1)、入力された音響信号の時間周波数変換を行う(ステップS2)。次に、空間相関算出部3は、時間周波数変換によって得られた周波数スペクトルX[ch][size]に基づいて、音声と雑音の空間相関行列を計算する(ステップS3)。
【0055】
次に、抽出部61は、空間相関フィルタ係数の部分要素(例えば、1要素)を主要要素として抽出する(ステップS4)。次に、推定部62が、空間相関フィルタに含まれる部分要素から概括的な方向情報を算出する(ステップS5)。
【0056】
次に、制御部7が、概括的な方向情報に基づき音声認識パターンの制御を変更する(ステップS6)。
【0057】
以上、説明したように、第1実施形態の推定装置10では、変換部1が、複数のチャンネルの音響信号に時間周波数変換を行うことによって、周波数スペクトルを取得する。空間相関算出部3が、周波数スペクトルから空間相関行列を算出する。空間相関フィルタ部5が、前記空間相関行列から空間相関フィルタを算出する。そして、方向推定部6が、前記空間相関フィルタに含まれる部分要素から概括的な方向情報を推定する。
【0058】
これにより第1実施形態の推定装置10によれば、より低い計算コストで、音源の到来方向をロバストに推定することができる。
【0059】
(第2実施形態)
次に第2実施形態について説明する。第2実施形態の説明では、第1実施形態と同様の説明については省略し、第1実施形態と異なる箇所について説明する。
【0060】
[機能構成の例]
図8は、第2実施形態の方向推定部6の機能構成の例を示す図である。第2実施形態の方向推定部6は、抽出部61、推定部62及びスムージング処理部63を備える。第2実施形態では、第1実施形態の構成に、スムージング処理部63が更に追加されている。
【0061】
推定部62は、抽出部61により抽出された部分要素に基づき、特定の時間における特定の周波数の傾向(トレンド)によって示される局所方向を推定する。
【0062】
スムージング処理部63は、推定部62により得られた局所方向情報を調整し、最終的に、調整された局所方向情報を概括的な方向情報として出力する。例えば、スムージング処理部63は、時間方向及び帯域方向の少なくとも一方にスムージング補正し、スムージング補正された局所方向情報に基づき、概括的な方向情報を出力する。局所方向情報を、時間方向及び帯域方向の少なくとも一方(時間方向、帯域方向、または双方)にスムージング補正することによって、より方向情報の推定結果の厳密さを削減することができる。これによって、更に外乱要因に耐性を持つ概括的な方向情報を出力することができる。
【0063】
[推定方法の例]
図9は、第2実施形態の推定方法の例を示すフローチャートである。ステップS11~S14は、第1実施形態のステップS1~S4と同じであるので、説明を省略する。
【0064】
推定部62は、抽出部61により抽出された部分要素に基づき、特定の時間における特定の周波数のトレンド(傾向)を含む局所方向を推定する(ステップS15)。
【0065】
次に、スムージング処理部63が、推定部62により得られた局所方向をスムージングし、概括的な方向情報を算出する(ステップS16)。
【0066】
ステップS17は、第1実施形態のステップS6と同じであるので、説明を省略する。
【0067】
最後に、第1及び第2実施形態の推定装置10のハードウェア構成の例について説明する。
【0068】
[ハードウェア構成の例]
図10は、第1及び第2実施形態の推定装置10のハードウェア構成の例を示す図である。第1及び第2実施形態の推定装置10は、プロセッサ201、主記憶装置202、補助記憶装置203、表示装置204、入力装置205及び通信装置206を備える。プロセッサ201、主記憶装置202、補助記憶装置203、表示装置204、入力装置205及び通信装置206は、バス210を介して接続されている。
【0069】
なお、推定装置10は、上記構成の一部が備えられていなくてもよい。例えば、推定装置10が、外部の装置の入力機能及び表示機能を利用可能な場合、推定装置10に表示装置204及び入力装置205が備えられていなくてもよい。
【0070】
プロセッサ201は、補助記憶装置203から主記憶装置202に読み出されたプログラムを実行する。主記憶装置202は、ROM及びRAM等のメモリである。補助記憶装置203は、HDD(Hard Disk Drive)及びメモリカード等である。
【0071】
表示装置204は、例えば液晶ディスプレイ等である。入力装置205は、推定装置10を操作するためのインタフェースである。なお、表示装置204及び入力装置205は、表示機能と入力機能とを有するタッチパネル等により実現されていてもよい。通信装置206は、他の装置と通信するためのインタフェースである。
【0072】
例えば、推定装置10で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルで、メモリカード、ハードディスク、CD-RW、CD-ROM、CD-R、DVD-RAM及びDVD-R等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
【0073】
また例えば、推定装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
【0074】
また例えば、推定装置10で実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。具体的には、サーバコンピュータから、プログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、推定処理を実行する構成としてもよい。
【0075】
また例えば、推定装置10のプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
【0076】
推定装置10で実行されるプログラムは、上述の機能構成のうち、プログラムによっても実現可能な機能を含むモジュール構成となっている。当該各機能は、実際のハードウェアとしては、プロセッサ201が記憶媒体からプログラムを読み出して実行することにより、上記各機能ブロックが主記憶装置202上にロードされる。すなわち上記各機能ブロックは主記憶装置202上に生成される。
【0077】
なお上述した各機能の一部又は全部をソフトウェアにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
【0078】
また複数のプロセッサ201を用いて各機能を実現してもよく、その場合、各プロセッサ201は、各機能のうち1つを実現してもよいし、各機能のうち2以上を実現してもよい。
【0079】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0080】
L,R マイク
1 変換部
2 遅延部
3 空間相関算出部
4 空間相関算出部
5 空間相関フィルタ部
6 方向推定部
7 制御部
10 推定装置
61 抽出部
62 推定部
63 スムージング処理部
201 プロセッサ
202 主記憶装置
203 補助記憶装置
204 表示装置
205 入力装置
206 通信装置
210 バス
図1
図2
図3A
図3B
図4
図5
図6A
図6B
図7
図8
図9
図10