IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 本田技研工業株式会社の特許一覧 ▶ 国立大学法人東京工業大学の特許一覧

特許7555543音響処理装置、音響処理システム、音響処理方法およびプログラム
<>
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図1
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図2
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図3
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図4
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図5
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図6
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図7
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図8
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図9
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図10
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図11
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図12
  • 特許-音響処理装置、音響処理システム、音響処理方法およびプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-13
(45)【発行日】2024-09-25
(54)【発明の名称】音響処理装置、音響処理システム、音響処理方法およびプログラム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20240917BHJP
   G01S 3/808 20060101ALI20240917BHJP
【FI】
H04R3/00 320
G01S3/808
【請求項の数】 8
(21)【出願番号】P 2021031527
(22)【出願日】2021-03-01
(65)【公開番号】P2022132839
(43)【公開日】2022-09-13
【審査請求日】2023-09-11
(73)【特許権者】
【識別番号】000005326
【氏名又は名称】本田技研工業株式会社
(73)【特許権者】
【識別番号】304021417
【氏名又は名称】国立大学法人東京工業大学
(74)【代理人】
【識別番号】100165179
【弁理士】
【氏名又は名称】田▲崎▼ 聡
(74)【代理人】
【識別番号】100126664
【弁理士】
【氏名又は名称】鈴木 慎吾
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】杉山 地塩
(72)【発明者】
【氏名】糸山 克寿
(72)【発明者】
【氏名】中臺 一博
(72)【発明者】
【氏名】西田 健次
【審査官】佐久 聖子
(56)【参考文献】
【文献】S. Wozniak et. al,Passive Joint Localization and Synchronization of Distributed Microphone Arrays,IEEE Signal Processing Letters,Volume 26, Issue 2,2018年12月23日,pp.292-296
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/00- 3/14
H04R 1/20- 1/40
H04S 1/00- 7/00
G01S 3/808
(57)【特許請求の範囲】
【請求項1】
N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、
N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値との合計値、より小さくなるように、
前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定める推定部を備える
音響処理装置。
【請求項2】
N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、
N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、
前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定める推定部を備え、
前記推定部は、
第1の位置から第2の位置の距離の前記マイクロホンアレイの対間の総和が、より小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定め、
前記第1の位置は、前記マイクロホンアレイを基準とする前記音源の位置を当該マイクロホンアレイの方向に回転させた位置であり、
前記第2の位置は、前記マイクロホンアレイの対の一方のマイクロホンアレイから前記観測音源方向に、当該マイクロホンアレイの対の他方のマイクロホンアレイから前記音源までの距離から、前記時間差分における音の伝搬距離の差分に相当する距離離れた位置であることを特徴とする
音響処理装置。
【請求項3】
N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、
N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、
前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定める推定部を備え
前記推定部は、
前記第1の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、
前記第2の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、を交互に実行することを特徴とする
音響処理装置。
【請求項4】
前記マイクロホンアレイと、
前記マイクロホンアレイごとに収音される音響信号に基づいて前記観測音源方向を定める音源方向観測部と、
前記対ごとに前記観測到達時間差を定める到達時間差観測部と、
請求項1から請求項のいずれか一項に記載の音響処理装置と、
を備える音響処理システム。
【請求項5】
コンピュータに請求項1から請求項のいずれか一項に記載の音響処理装置として機能させるためのプログラム。
【請求項6】
N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、
N個のうち2個のマイクロホンアレイの対ごとに定めた、前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値との合計値、より小さくなるように、
前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定めるステップを有する
音響処理方法。
【請求項7】
N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、
N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、
前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定めるステップを有し
前記ステップは、
第1の位置から第2の位置の距離の前記マイクロホンアレイの対間の総和が、より小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定め、
前記第1の位置は、前記マイクロホンアレイを基準とする前記音源の位置を当該マイクロホンアレイの方向に回転させた位置であり、
前記第2の位置は、前記マイクロホンアレイの対の一方のマイクロホンアレイから前記観測音源方向に、当該マイクロホンアレイの対の他方のマイクロホンアレイから前記音源までの距離から、前記時間差分における音の伝搬距離の差分に相当する距離離れた位置であることを特徴とする
音響処理方法。
【請求項8】
N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、
N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、
前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定めるステップを有し
前記ステップは、
前記第1の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、
前記第2の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、を交互に実行することを特徴とする
音響処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響処理装置、音響処理システム、音響処理方法およびプログラムに関する。
【背景技術】
【0002】
音源定位は、マイクロホンアレイを用いて収音された複数チャネルの音響信号から音源方向を推定する手法である。従来から、音響信号処理の要素技術として種々の方式が提案されている。1個のマイクロホンアレイでは、音源方向を推定することができるが、音源位置までは推定することはできない。近年では、複数のマイクロホンアレイを用いて、音源位置を推定する手法も提案されている。
【0003】
しかしながら、個々のマイクロホンアレイは個体差を有する。複数のマイクロホンアレイを用いる場合には、それぞれの位置、向き、および時刻を複数のマイクロホンアレイ間で校正させておく必要がある。非特許文献1には、観測された音源方向から、マイクロホンアレイの位置、向き、ならびに音源の位置の相互間の関係を示す目的関数を用いて、未知のマイクロホンアレイの位置、向き、ならびに音源の位置を推定する手法について記載されている。
【先行技術文献】
【非特許文献】
【0004】
【文献】S. Wozniak and K. Kowalczyk: “Passive Joint Localization and Synchronization of Distributed Microphone Arrays”, IEEE Signal Processing Letters, Volume 26, Issue 2, pp.292-296, February 2019
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、非特許文献1に記載の目的関数では、マイクロホンアレイの位置、向き、ならびに音源の位置を推定するのが困難なことがあった。例えば、当該目的関数では、マイクロホンアレイ位置や音源の位置について、その大きさの程度まで定めることができない。また、局所最適解に陥り、より適切な解が得られないことがあった。
【0006】
本実施形態は上記の点に鑑みてなされたものであり、マイクロホンアレイの位置、向き、および、音源位置をより正確に同時推定することができる音響処理装置、音響処理システム、音響処理方法およびプログラムを提供することを課題とする。
【課題を解決するための手段】
【0007】
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値との合計値、より小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定める推定部を備える音響処理装置である。
【0009】
(2)本発明の他の態様は、N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定める推定部を備え、前記推定部は、第1の位置から第2の位置の距離の前記マイクロホンアレイの対間の総和が、より小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定め、前記第1の位置は、前記マイクロホンアレイを基準とする前記音源の位置を当該マイクロホンアレイの方向に回転させた位置であり、前記第2の位置は、前記マイクロホンアレイの対の一方のマイクロホンアレイから前記観測音源方向に、当該マイクロホンアレイの対の他方のマイクロホンアレイから前記音源までの距離から、前記時間差分における音の伝搬距離の差分に相当する距離離れた位置であることを特徴とする音響処理装置である。
【0010】
(3)本発明の他の態様は、N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定める推定部を備え、前記推定部は、前記第1の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、前記第2の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、を交互に実行することを特徴とする音響処理装置である
【0011】
(4)本発明の他の態様は、(1)から(3)のいずれかの音響処理装置と、前記マイクロホンアレイと、前記マイクロホンアレイごとに収音される音響信号に基づいて前記観測音源方向を定める音源方向観測部と、前記対ごとに前記観測到達時間差を定める到達時間差観測部と、を備える音響処理システムであってもよい。
【0012】
(5)本発明の他の態様は、コンピュータに(1)から(3)のいずれかの音響処理装置として機能させるためのプログラムであってもよい。
【0013】
(6)本発明の他の態様は、N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、N個のうち2個のマイクロホンアレイの対ごとに定めた、前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値との合計値、より小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定めるステップを有する音響処理方法である。
(7)本発明の他の態様は、N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定めるステップを有し、前記ステップは、第1の位置から第2の位置の距離の前記マイクロホンアレイの対間の総和が、より小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定め、前記第1の位置は、前記マイクロホンアレイを基準とする前記音源の位置を当該マイクロホンアレイの方向に回転させた位置であり、前記第2の位置は、前記マイクロホンアレイの対の一方のマイクロホンアレイから前記観測音源方向に、当該マイクロホンアレイの対の他方のマイクロホンアレイから前記音源までの距離から、前記時間差分における音の伝搬距離の差分に相当する距離離れた位置であることを特徴とする音響処理方法である。
(8)本発明の他の態様は、N(Nは、2個以上の整数)個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す第1の目的関数の関数値と、N個のうち2個のマイクロホンアレイの対ごとに定めた前記音源からの音の到達時間差である観測到達時間差から、前記音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す第2の目的関数の関数値が、それぞれより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を定めるステップを有し、前記ステップは、前記第1の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、前記第2の目的関数の関数値がより小さくなるように、前記マイクロホンアレイの位置、方向、ならびにオフセット時間、および、前記音源の位置を更新するステップと、を交互に実行することを特徴とする音響処理方法である。
【発明の効果】
【0014】
上述した(1)-(8)の構成によれば、第1の目的関数と第2の目的関数に対して、それぞれ第2の目的関数と第1の目的関数が拘束条件となるため、第1の目的関数に基づいて推定されるマイクロホンアレイの位置と音源の位置に含まれうる解の不定性と、第2の目的関数に基づいて推定されるマイクロホンアレイから音源の方向に含まれうる解の不定性が解消される。そのため、第1の目的関数と第2の目的関数のそれぞれの関数値をより小さくすることで、局所最適解を回避して、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0015】
上述した(1)、(6)の構成において、第1の目的関数の関数値と、第2の目的関数の関数値との合計値は、推定されたマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置の正確性を示す指標となる。また、当該合計値を用いて推定されるマイクロホンアレイの位置、音源の位置、および、マイクロホンアレイから音源の方向には不定性が含まれない。そのため、局所最適解を回避して、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0016】
上述した(2)、(7)の構成において、第1の位置から第2の位置の距離のマイクロホンアレイの対間の総和も、推定されたマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置の正確性を示す指標となる。また、当該総和を用いて推定されるマイクロホンアレイの位置、音源の位置、および、マイクロホンアレイから音源の方向には不定性が含まれない。そのため、局所最適解を回避して、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0017】
上述した(3)、(8)の構成によれば、第1の目的関数の関数値をより小さくするステップと、第2の目的関数の関数値をより小さくするステップとが交互に実行されるので、いずれかのステップが継続して生じうる局所最適解と解の不定性を回避することができる。そのため、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【図面の簡単な説明】
【0018】
図1】本実施形態に係る音響処理システムの一構成例を示すブロック図である。
図2】第1目的関数を説明するための説明図である。
図3】第2目的関数を説明するための説明図である。
図4】本実施形態に係る推定処理の第1例を示すフローチャートである。
図5】本実施形態に係る推定処理の第2例を示すフローチャートである。
図6】本実施形態に係る推定処理の第3例を示すフローチャートである。
図7】マイクロホンの一配置例を示す図である。
図8】マイクロホンの他の配置例を示す図である。
図9】本実施形態に係る音響処理システムの他の構成例を示すブロック図である。
図10】誤差平均の変化の一例を示す図である。
図11】計算時間の一例を示す図である。
図12】誤差平均の変化の他の例を示す図である。
図13】計算時間の他の例を示す図である。
【発明を実施するための形態】
【0019】
以下、図面を参照しながら本発明の実施形態について説明する。
図1は、本実施形態に係る音響処理システムS1の構成例を示すブロック図である。
音響処理システムS1は、音響処理装置10と、収音部20と、を備える。
【0020】
収音部20は、複数のマイクロホンアレイを有する。マイクロホンアレイの数Nは、2以上の整数である。個々のマイクロホンアレイは、それぞれ異なる位置において、異なる方向に向けて設置される。本願では、マイクロホンアレイの位置、方向を、それぞれ「アレイ位置」、「アレイ方向」と呼ぶことがある。また、個々のマイクロホンアレイを、それぞれ、A、A、などとインデックスを付して区別することがある。N個のマイクロホンアレイに共通の事項、その他、個々のマイクロホンアレイを区別しない場合には、単に「マイクロホンアレイ」または「マイクロホンアレイA」と呼ぶことがある。
【0021】
個々のマイクロホンアレイAは、それぞれ複数個のマイクロホンを備える。個々のマイクロホンは、それぞれ異なる位置に配置され、それぞれ自部に到来する音波を収音する。個々のマイクロホンは、それぞれ到来した音波を音響信号に変換するアクチュエータを備え、変換した音響信号を音響処理装置10に出力する。本願では、マイクロホンごとに収音される音響信号の単位を「チャネル」と呼ぶ。図7に例示されるマイクロホンアレイAは、L個のマイクロホンmic1~micLが直線上に等間隔に配置されてなる。マイクロホンアレイAにおける複数のマイクロホンの空間的配置は、これには限られない。図8に例示されるように、マイクロホンアレイAを構成する複数のマイクロホンは円弧上に配置されてもよい。
【0022】
マイクロホンアレイの方向は、当該マイクロホンアレイの音源方向の基準となる方向であればよい。マイクロホンアレイの方向は、マイクロホンが配置される方向であってもよいが、これには限られない。また、本願では、個々のマイクロホンアレイにより収音される音響信号の同期がとれていないことを前提とする。従って、マイクロホンアレイごとにオフセット時間を有する。オフセット時間とは、個々のマイクロホンアレイの時刻の音響処理システムS1全体としての基準時刻からの時間差に相当する。
【0023】
音響処理装置10は、N個のマイクロホンアレイのそれぞれについて、取得される複数チャネルの音響信号を用いて音源の方向を観測音源方向として定める(音源定位(sound source localization))。本願では、音源の方向を「音源方向」と呼び、特に、複数チャネルの音響信号から定めた音源方向を「観測音源方向」と呼ぶことがある。また、音源の位置を「音源位置」と呼ぶことがある。
音響処理装置10は、N個のうち2個のマイクロホンアレイからなるマイクロホンアレイの対(ペア)ごとに、音源からマイクロホンアレイのそれぞれに音が到達する到達時刻の差を観測到達時間差として定める(到達時間差観測)。本願では、マイクロホンアレイの対を、「アレイ対」と呼ぶことがある。
【0024】
音響処理装置10は、マイクロホンアレイごとの観測音源方向と、アレイ対ごとの観測到達時間差に基づいて第1目的関数の関数値と第2目的関数の関数値が、それぞれより小さくなるように、アレイ位置、アレイ方向、オフセット時間、および、音源の位置を未知情報として推定する。第1目的関数、第2目的関数については、後述する。
音響処理装置10は、推定したアレイ位置、アレイ方向、オフセット時間、および、音源の位置の一部または全部を示す出力情報を出力先機器30に出力する。
出力先機器30は、推定されたアレイ位置、アレイ方向、オフセット時間、および音源の位置の一部または全部の出力先となる機器である。出力先機器30は、PC(Personal Computer)、多機能携帯電話機、などの情報通信機器であってもよいし、計測器、監視装置、などであってもよい。
【0025】
次に、本実施形態に係る音響処理装置10の機能構成例について説明する。
音響処理装置10は、入出力部110と、制御部120と、を含んで構成される。
入出力部110は、他の機器と各種のデータを入力および出力可能に無線または有線で接続する。入出力部110は、入力データとして、個々のマイクロホンアレイAから入力される複数チャネルの音響信号を制御部120に出力する。入出力部110は、出力データとして、制御部120から入力される推定情報を出力先機器に出力する。入出力部110は、例えば、入出力インタフェース、通信インタフェースなどのいずれか、または、それらの組み合わせであってもよい。
【0026】
制御部120は、音響処理装置10の機能を実現するための処理、その機能を制御するための処理、などを実行する。制御部120は、専用の部材を用いて構成されてもよいが、CPU(Central Processing Unit)などのプロセッサと各種の記憶媒体を含んでコンピュータシステムとして構成されてもよい。プロセッサは、予め記憶媒体に記憶された所定のプログラムを読み出し、読み出したプログラムに記述された各種の命令で指示される処理を実行して制御部120の機能を実現する。
制御部120は、音源方向観測部122、到達時間差観測部124、推定部126、および出力処理部128を含んで構成される。
【0027】
音源方向観測部122は、個々のマイクロホンアレイAから入出力部110を用いて入力される複数チャネルの音響信号に基づいて、音源定位処理を行って個々の音源の音源方向の観測値である観測音源方向を定める。音源方向観測部122は、音源定位処理において、例えば、MUSIC(Multiple Signal Classification,多重信号分類)法、WDS-BF(Weighted Delay and Sum Beam Forming)法などの手法が利用可能である。音源方向観測部122は、マイクロホンアレイAごとに定めた観測音源方向を示す音源方向情報を推定部126に出力する。
【0028】
到達時間差観測部124は、個々のマイクロホンアレイAから入出力部110を経由して入力される複数チャネルの音響信号に基づいて、アレイ対ごとに、音源から個々のマイクロホンアレイAに音波が到達する到達時刻の差の観測値である観測到達時間差を定める。到達時間差観測部124は、アレイ対ごとに定めた観測到達時間差を示す到達時間差情報を推定部126に出力する。
到達時間差観測部124は、観測到達時間差を定める際、例えば、アレイ対をなす一方のマイクロホンアレイの1つのチャネルの音響信号と、他方のマイクロホンアレイの1つのチャネルの音響信号を遅延させた遅延信号との相互相関を遅延量ごとに、各チャネル対について算出する。チャネル対は、一方のマイクロホンアレイの1つのチャネルと他方のマイクロホンアレイの1つのチャネルの組に相当する。到達時間差観測部124は、相互相関が極大となる遅延量をチャネル対間で平均して得られる平均遅延量を観測到達時間差として定める。
【0029】
なお、音響空間に所在する音源数は、1個に限らず、複数となりうる。そのため、到達時間差は、マイクロホンアレイごとに複数個定まりうる。異なるマイクロホンアレイ間で異なる音源からの音波の到達時刻差が誤って推定されるおそれが生ずる。但し、到達時間差観測部124は、所定の極大値の閾値以下となる相互相関を与える遅延量を棄却し、その閾値以上となる相互相関を与える遅延量を、到達時間差を定める際に採用してもよい。これにより、マイクロホンアレイ間で異なる音源からの到達時刻を用いて到達時間差を定めることが回避され、到達時間差観測部124は、マイクロホンアレイ間で共通の音源からの到達時刻を用いて到達時間差を定めることができる。
【0030】
推定部126には、音源方向観測部122から音源方向情報が入力され、到達時間差観測部124から到達時間差情報が入力される。
推定部126は、音源方向情報が示すマイクロホンアレイごとの観測音源方向と到達時間差情報が示すアレイ対ごとの観測到達時間差に基づいて、第1目的関数の関数値と第2目的関数の関数値が、それぞれ最小化されるように、推定値であるアレイ位置、アレイ方向、オフセット時間、および、音源の位置を定める。「最小化」において、例えば、勾配法が適用可能である。本願では、「最小化」、「最適化」とは、それぞれ、できるだけ関数値が小さくなる、最適値に近似するように推定値を探索するとの意味を含み、関数値が絶対的に最小、最適となる推定値を定めることに限られない。従って、「最小化」、「最適化」の過程において、それぞれ一時的に関数値が大きくなること、最適値から乖離することもありうる。推定部126は、定めたアレイ位置、アレイ方向、オフセット時間、および、音源の位置を示す推定情報を出力処理部128に出力する。
【0031】
出力処理部128は、推定部126から入力される推定情報の一部または全部を出力情報として、入出力部110を経由して出力先機器30に出力する。
出力処理部128は、例えば、推定部126から推定情報が入力されるごとに、入力される推定情報のうち、所定の項目の情報(例えば、音源位置)を出力先機器30に出力する(プッシュ型送信)。出力処理部128は、出力先機器30から要求情報が入力されるとき、要求情報で指示される項目の情報を、その応答として出力先機器30に出力してもよい(プル型送信)。出力処理部128は、入力された推定情報の一部または全部を外部機器に出力せずに、自装置の記憶媒体に記憶してもよい。
【0032】
(目的関数)
次に、本実施形態に係る目的関数について説明する。図2は、第1目的関数を説明するための説明図である。第1目的関数Lは、マイクロホンアレイAからの音源Sの観測音源方向θi,jを示す方向ベクトルdi,jが、式(1)に示すように、マイクロホンアレイAの位置aを基準とした音源Sの位置sへの方向ベクトルを、マイクロホンアレイAの方向θで回転させて得られる単位ベクトルに相当するという関係に基づく。但し、図2に示す例では、マイクロホンアレイAがx-y直交座標系の原点に配置され、その方向θがx軸方向に向けられている。
【0033】
【数1】
【0034】
式(1)において、Rは、マイクロホンアレイAの方向θに係る回転行列を示す。二次元の回転行列は、式(2)に示される。…は、行列…またはベクトル…の転置を示す。s‐aは、マイクロホンアレイAの位置aを基準とする音源Siの位置sを示す位置ベクトルに相当する。||…||は、ベクトル…の、L2ノルム、つまり、各次元の要素値の平方和の平方根を示す。
【0035】
【数2】
【0036】
式(1)の両辺に||s‐s||を乗じ、さらに左辺を右辺に移項して、両辺を二乗して得られる関数Dのマイクロホンアレイ間の総和をとると第1目的関数Lが導かれる。但し、式(3)は、音源数Mが2以上の場合も含めて一般化されている。第1目的関数Lは、M個の音源間の総和をなしている。
【0037】
【数3】
【0038】
式(3)に示すように、第1目的関数Lは、マイクロホンアレイAごとに、当該マイクロホンアレイAを基準とする音源位置の座標値s‐aを当該マイクロホンアレイAのアレイ方向θに回転させた位置の座標値である回転座標値R (s‐a)と、原点から観測音源方向の方向ベクトルdi,jに当該マイクロホンアレイAから音源Sまでの距離||s‐a||に相当する距離だけ離れた位置の座標値である観測音源方向座標値di,j||s‐a||との差の大きさを示す関数値を与える関数である。つまり、第1目的関数Lは、マイクロホンアレイAからの音源Sの観測音源方向θi,jと、マイクロホンアレイAからの音源Sの位置sへの方向を、マイクロホンアレイAの方向θで回転した方向との差分の大きさを示す指標値を与える関数である。
【0039】
式(1)は、アレイ位置の座標値aから音源位置の座標値sの差分値を正規化して得られる単位ベクトルを、マイクロホンアレイAの方向θで回転させて方向ベクトルdi,jが得られることを示す。そのため、あるアレイ位置の座標値aと音源位置の座標値sに共通の倍率α(αは、0以外の実数)で、それぞれ拡大または縮小した値であっても、式(1)が成立する。即ち、式(3)に示す第1目的関数Lを最小化して推定されるアレイ位置の座標値aと音源位置の座標値sには、α倍の不定性が残される。倍率αは、座標スケールとも呼ばれる。倍率αを定めるためには、別個の拘束条件を用いる必要がある。例えば、別個の拘束条件としてマイクロホン間の音波の到達時間差とマイクロホン間距離など、が用いられうる。本実施形態では、次に説明する第2目的関数が別個の拘束条件の役割を担う。
【0040】
図3は、第2目的関数を説明するための説明図である。第2目的関数は、音源SからマイクロホンアレイAへの音波の到達時刻と音源iからマイクロホンアレイAへの観測到達時間差τi,(j,k)が、式(4)に示すように音源SからマイクロホンアレイAへの音波の伝搬時間c―1||s―a||と音源SからマイクロホンアレイAへの音波の伝搬時間c―1||s―a||との時間差と、マイクロホンアレイAのオフセット時間δとマイクロホンアレイAのオフセット時間δの時間差に相当するという関係に基づく。式(4)において、cは、音速を示す。
【0041】
【数4】
【0042】
式(4)の両辺に音速cを乗じ、さらに左辺を右辺に移項して得られる関数Tのアレイ対間の総和をとると第2目的関数Lが導かれる。但し、式(5)は、音源数Mが2以上の場合も含めて一般化されている。
【0043】
【数5】
【0044】
式(5)に示すように、第2目的関数Lは、2個のマイクロホンアレイA、Aからなるアレイ対ごとに、当該アレイ対をなす一方のマイクロホンアレイAから音源Sへの第1の距離||s-a||から、他方のマイクロホンアレイAから音源Sへの第2の距離||s-a||の距離差と、一方のマイクロホンアレイAのオフセット時間δから他方のマイクロホンアレイAのオフセット時間δの時間差における音の進行距離c(δ-δ)から当該アレイ対の観測到達時間差τi,(j,k)における音の進行距離cの距離差cτi,(j,k)との和の大きさを示す関数値を与える関数である。即ち、第2目的関数Lは、音源Sからの音波に対するマイクロホンアレイA、A間の観測到達時間差τi,(j,k)から、音源iからマイクロホンアレイA、Aのそれぞれへの音波の伝搬時間c―1||s―a||の時間差と、マイクロホンアレイAのオフセット時間δからマイクロホンアレイAのオフセット時間δの時間差との差分の大きさを示す指標値を与える関数である。
【0045】
ところで、式(4)は、音源iからマイクロホンアレイAへの距離||s―a||と音源iからマイクロホンアレイAへの距離||s―a||との距離差における音の到達時間差と、マイクロホンアレイAのオフセット時間δとマイクロホンアレイAのオフセット時間δの時間差(δ-δ)の和が観測到達時間差τi,(j,k)として得られることを示す。そのため、マイクロホンアレイAから音源Sの方向を示す方向ベクトルdi,jに、マイクロホンアレイ間で共通の回転行列γが乗じられた値であっても式(4)が成立する。即ち、式(5)に示す第2目的関数Lを最小化して推定される個々の方向ベクトルdi,jには回転に対する不定性が含まれる。回転行列γを定めるためには、別個の拘束条件を用いる必要がある。例えば、別個の拘束条件として個々の音源の位置が用いられうる。なお、未知数と第2目的関数Lから導出される方程式の数が一致するように、マイクロホンアレイ数N、音源数Mを定めておけば、解析的に推定情報が定まるはずである。しかしながら、観測到達時間差τi,(j,k)に含まれる誤差は、推定情報の精度を低下させる要因となる。このことは、観測音源方向θi,jに対しても当てはまる。
【0046】
第1目的関数L、第2目的関数Lに基づく方程式は、いずれも非線形方程式であり、複数の局所最適解が存在する。そのため、局所最適解への収束を回避することが望まれる。本実施形態では、解の不定性が異なる第1目的関数Lと第2目的関数Lの両者に基づいて推定情報を求めることができる。第1目的関数Lと第2目的関数Lの一方が他方に対する拘束条件として作用することで、局所最適解を回避することが期待される。
【0047】
(推定処理)
次に、第1目的関数Lと第2目的関数Lの両者を用いて、推定情報を推定する手法について説明する。推定情報は、マイクロホンアレイごとの位置、方向、ならびに、オフセット時間、および音源位置となる。ここで、個々のマイクロホンアレイの位置、方向、オフセット時間は、基準とする所定のマイクロホンアレイ(例えば、マイクロホンアレイA)の位置、方向、オフセット時間との相対値であればよい。また、二次元空間では、2個の座標値で1個の位置が表現される。そのため、推定情報をなす未知数の個数は、音源の位置について2M個、マイクロホンアレイの位置として2(N-1)個、マイクロホンアレイの向きとしてN-1個、マイクロホンアレイのオフセット時間としてN-1個となる。推定情報の推定においては、連立する方程式の個数が未知数の個数2M+4(N-1)と等しいか、より多くする必要がある。連立する方程式は、計算に用いる目的関数をいずれかの未知数で偏微分して得られる導関数を0とする方程式である。例えば、N=3の場合、後述する手法1、手法2、手法3のそれぞれについて、必要とする音源数は、それぞれ3、3、6となる。
【0048】
推定情報を推定する手法は、次の手法1ないし手法3のいずれであってもよい。
手法1は、第1目的関数Lと第2目的関数Lを連立して推定情報を推定する手法である。本願では、手法1を、単に「連立評価」(simultaneous evaluation)と呼ぶことがある。より具体的には、手法1は、式(6)に示す連立目的関数Sがより小さくなるように推定情報を推定する手法である。連立目的関数Hは、式(6)に示されるように、第1目的関数Lと第2目的関数Lの和に相当する目的関数である。第1目的関数Lと第2目的関数Lは、いずれも推定情報が正しく推定されるほど、0に近似する関数値を与える関数であるため、これらの和である連立目的関数Hも推定情報が正しく推定されるほど0に近似することが期待される。手法1によれば、1回の計算で用いられる方程式の数が多くなるので、推定に係る音源数が他の手法よりも少なくなる。連立目的関数Hの導関数を0とする方程式の数は、M(2N-1)本となる。
【0049】
【数6】
【0050】
本実施形態に係る手法2は、第1目的関数Lと第2目的関数Lを統合して得られる統合目的関数Iの関数値がより小さくなるように推定情報を定める手法である。本願では、手法2を、「目的関数の統合」(integration of objective functions)と呼ぶことがある。統合目的関数Iは、式(7)に示される。統合目的関数Iは、第1目的関数Lと第2目的関数Lに共通する||s-a||に係る項を、第1目的関数Lから消去して得られる。第1目的関数Lと第2目的関数Lは、いずれも推定情報が正確に推定されるほど、0に近似する関数値を与える関数であるため、これらから導出される統合目的関数Iも推定情報が正しく推定されるほど0に近似する。手法2も、統合目的関数Iの導関数を0とする方程式の数は、M(2N-1)本となる。
【0051】
【数7】
【0052】
式(7)に示す統合目的関数Iは、第1の位置R (s-a)から第2の位置di,j(||s-a||-cδ+cδ+cτi,(j,k))の距離の大きさのアレイ対間の総和に相当する。第1の位置R (s-a)は、マイクロホンアレイAを基準とする音源の位置aを当該マイクロホンアレイAの方向θに回転させた位置に相当する。第2の位置di,j(||s-a||-cδ+cδ+cτi,(j,k))は、アレイ対の一方のマイクロホンアレイAから方向ベクトルdi,jで示される観測音源方向に、当該アレイ対の他方のマイクロホンアレイAから音源Sまでの距離||s-a||から、一方のマイクロホンアレイAのオフセット時間δから他方のマイクロホンアレイAのオフセット時間δの時間差分δ-δにおける音の伝搬距離c(δ-δ)の差分に相当する距離||s-a||-cδ+cδ+cτi,(j,k)だけ離れた位置に相当する。
【0053】
本実施形態に係る手法3は、第1目的関数Lの関数値をより小さくするように推定情報を更新する処理3-1と、第2目的関数Lの関数値をより小さくするように推定情報を更新する処理3-2とを交互に繰り返す手法である。本願では、手法3を、「繰り返し推定」(iteration)と呼ぶことがある。処理3-1では、マイクロホンアレイの時間オフセットは推定されない。そのため、未知数の数は、2M+3N-3個となる。これに対し、第1目的関数Lの導関数を0とする方程式の数はMN本となる。処理3-2では、マイクロホンアレイの方向が推定されない。そのため、未知数の数は、M+3N-3個となる。これに対し、第2目的関数Lの導関数を0とする方程式の数は、M(N-1)本となる。なお、処理3-1と処理3-2の繰り返しにおいて、処理3-2を処理3-1よりも先行してもよい。第1目的関数Lの方が未知数の数に対する方程式の数が多いので、第2目的関数Lよりも安定的に解を求めるための条件が厳しいためである。
【0054】
次に、本実施形態に係る推定処理について説明する。図4は、本実施形態に係る推定処理の第1例を示すフローチャートである。図4に示す処理は、ステップS108において手法1を用いて推定情報を定める処理を含む。
(ステップS102)音源方向観測部122は、マイクロホンアレイAごとに複数チャネルの音響信号に基づいて観測音源方向を定める。
(ステップS104)到達時間差観測部124は、アレイ対ごとに音源から個々のマイクロホンアレイに音が到達する時刻の差である観測到達時間差を定める。
(ステップS106)推定部126は、未知数であるマイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置の初期値を定める。
【0055】
(ステップS108)推定部126は、第1目的関数L1と第2目的関数L2の合計値を与える連立目的関数Hがより小さくなるように、マイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置を更新する。
(ステップS110)推定部126は、マイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置が収束したか否かを判定する。推定部126は、例えば、更新前における目的関数と更新後における目的関数、または、いずれかの推定値の差分の大きさが、所定の差分の大きさの閾値以下となったか否かに基づいて、収束したか否かを判定することができる。収束していないと判定するとき(ステップS110 NO)、ステップS108の処理に戻る。収束したと判定するとき(ステップS110 YES)、ステップS112の処理に進む。
(ステップS112)出力処理部112は、推定値となるマイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置の一部または全部を示す出力情報を出力先機器30に出力する。その後、図4に示す処理を終了する。
【0056】
図5は、本実施形態に係る推定処理の第2例を示すフローチャートである。図5に示す処理は、ステップS102、S104、S106、S110、S112、およびS108’の処理を有する。図4に示す処理は、ステップS108’において手法2を用いて推定情報を定める処理を含む。ステップS102、S104、S106、S110、およびS112については、図4の説明を援用する。図5に示す処理では、ステップS106の終了後、ステップS108’の処理に進む。
【0057】
(ステップS108’)推定部126は、第1目的関数Lと第2目的関数Lを統合して得られる統合目的関数Iの関数値がより小さくなるようにマイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置を更新する。統合目的関数Iは、第1の位置から第2の位置の距離の大きさのアレイ対間の総和に相当する。第1の位置は、マイクロホンアレイを基準とする音源の位置を当該マイクロホンアレイの方向に回転させた位置に相当する。第2の位置は、アレイ対の一方のマイクロホンアレイから観測音源方向に、当該アレイ対の他方のマイクロホンアレイから音源までの距離から、一方のマイクロホンアレイのオフセット時間から他方のマイクロホンアレイのオフセット時間の時間差分における音の伝搬距離の差分に相当する距離だけ離れた位置に相当する。その後、ステップS110の処理に進む。
【0058】
図6は、本実施形態に係る推定処理の第3例を示すフローチャートである。図5に示す処理は、ステップS102、S104、S106、S110、S112、S108’’、およびS109の処理を有する。図6に示す処理は、ステップS108’’およびS109において手法3を用いて推定情報を定める処理を含む。ステップS102、S104、S106、S110、およびS112については、図4の説明を援用する。図6に示す処理では、ステップS106の終了後、ステップS108’’の処理に進む。
【0059】
(ステップS108’’)推定部126は、第2目的関数Lの関数値をより小さくするようにマイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置を更新する。
(ステップS109)推定部126は、第1目的関数Lの関数値をより小さくするようにマイクロホンアレイの位置、方向ならびにオフセット時間、および音源位置を更新する。その後、ステップS110の処理に進む。
【0060】
なお、図4図6に示す処理において、ステップS110の処理が省略される代わりに、ステップS108の処理、ステップS108’の処理、または、ステップS108’’ならびにステップS109の処理が所定回数繰り返された後で、ステップS112の処理に進んでもよい。
【0061】
(音源定位)
次に、音源定位の手法であるMUSIC法とWDS-BF法について説明する。
MUSIC法は、空間スペクトルのパワーPext(θ)が極大であって、所定のレベルよりも高い方向θを定位音源方向として定める手法である。音源方向観測部122には、予め所定の間隔(例えば、1°~3°)で分布した方向θごとの伝達関数を記憶させておく。
【0062】
音源方向観測部122は、音源から各チャネルq(qは、1以上Q以下の整数)に対応するマイクロホンまでの伝達関数G[q](ω)を要素とする伝達関数ベクトル[G(θ)]を方向θごとに生成する。
音源方向観測部122は、各チャネルqの音響信号ξを所定の要素数からなるフレームごとに周波数領域に変換することによって変換係数ξ(ω)を算出する。音源方向観測部122は、算出した変換係数を要素として含む入力ベクトル[ξ(ω)]から式(8)に示す入力相関行列[Rξξ]を算出する。
【0063】
【数8】
【0064】
式(8)において、E[…]は、…の期待値を示す。[…]は、…が行列またはベクトルであることを示す。[…]は、行列またはベクトルの共役転置を示す。
音源方向観測部122は、入力相関行列[Rξξ]の固有値δおよび固有ベクトル[ε]を算出する。入力相関行列[Rξξ]、固有値δ、および固有ベクトル[ξ]は、式(9)に示す関係を有する。
【0065】
【数9】
【0066】
式(9)において、pは、1以上Q以下の整数である。インデックスpの順序は、固有値δの降順である。
音源方向観測部122は、伝達関数ベクトル[G(θ)]と算出した固有ベクトル[εp]に基づいて、次式(10)に示す周波数別空間スペクトルのパワーPsp(θ)を算出する。
【0067】
【数10】
【0068】
式(10)において、Dは、検出可能とする音源の最大個数(例えば、4)であって、Qよりも小さい予め定めた自然数である。
音源方向観測部122は、S/N比が予め定めた閾値(例えば、20dB)よりも大きい周波数帯域における空間スペクトルPsp(θ)の総和を全帯域の空間スペクトルのパワーPext(θ)として算出することができる。
【0069】
次に、WDS-BF法について説明する。WDS-BF法は、式(11)に示すように各チャネルqの全帯域の音響信号ξ(t)の遅延和の二乗値を空間スペクトルのパワーPext(θ)として算出し、空間スペクトルのパワーPext(θ)が極大となる音源方向θを探索する手法である。式(11)において[G(θ)]の各要素が示す伝達関数は、音源から各チャネルq(qは、1以上Q以下の整数)に対応するマイクロホンまでの位相の遅延による寄与を示す。[ξ(t)]は、時刻tの時点における各チャネルqの音響信号ξ(t)の信号値を要素とするベクトルである。
【0070】
【数11】
【0071】
(シミュレーション)
次に、音響処理装置10の有効性を評価するために実施したシミュレーションについて説明する。シミュレーションでは、手法1-手法3に加え、従来手法のそれぞれについて推定情報を推定した。従来手法は、第1目的関数Lの関数値がより小さくなるように、マイクロホンアレイごとの位置ならびに方向、および音源位置を推定する手法である。この段階では、マイクロホンアレイの時間オフセットは推定対象とならない。従来手法では、推定されたマイクロホンアレイの位置ならびに方向、および音源位置から、マイクロホンアレイにおけるマイクロホン間の音波の到達時間差とマイクロホン間距離を拘束条件として用いて、マイクロホンアレイごとの時間オフセットを算出することができる。
【0072】
シミュレーションでは、特に断らない限り次の条件を仮定した。一辺の長さが120mである正方形の二次元空間において、各音源の位置と各マイクロホンの位置がランダムに分布し、各マイクロホンアレイの方向が-180°から+180°までの全周にわたりランダムに向けられている。各音源の位置、各マイクロホンの位置、および各マイクロホンアレイの方向の真値を、それぞれ一様乱数を用いて定めた。但し、マイクロホンアレイAの位置が原点(0,0)に、x軸方向(θ=0°)に向けられている。また、各マイクロホンアレイの時間オフセットの真値が平均0、標準偏差σとなる正規分布に従って分布している。さらに、観測音源方向に平均0、標準偏差σとなる正規分布に従う誤差が含まれ、観測到達時間差に平均0、標準偏差στとなる正規分布で従う誤差が含まれる。なお、音源数Mを4または7とし、マイクロホンアレイ数Nを3とし、音響信号のサンプリング周波数fを16000Hzとした。音源方向推定分解能ρを1°とし、音源方向推定の標準偏差σを2°とし、到達時間差の標準偏差στを1msとし、時間オフセットの標準偏差σδを10°とした。
【0073】
シミュレーションでは、各手法の有効性を検証するため、推定値の更新ステップごとに推定したマイクロホンアレイと音源の位置の誤差と、位置が収束するまでに要した時間を計算時間として定めた。但し、マイクロホンアレイ、音源それぞれの二乗平均誤差を1回のシミュレーションごとに定め、100回にわたる平均値を誤差平均として算出した。図10は、手法ごとの誤差平均の変化を示す図である。図10は、手法2での誤差平均が最も小さく、手法1、手法3の順に誤差平均が大きくなることを示す。手法1から手法3のいずれも従来手法よりも誤差平均が小さくなった。従来手法では、計算が進行しても誤差平均が低下せずに、ほぼ一定値に収束する。このことは、局所最適解に陥っていることを示す。また、収束後の誤差平均は、手法1と手法2とで同等となる。このことは、第1目的関数Lと第2目的関数Lを連立または統合することで、高い精度でマイクロホンアレイと音源のそれぞれの位置を推定することを示す。図11は、手法ごとの平均計算時間を示す図である。図11は、手法2の計算時間が最も少なく、従来手法、手法1、手法3の順に計算時間が多くなることを示す。但し、手法2、従来手法、手法1の相互間では計算時間の差は比較的少ない。
【0074】
また、三次元空間を仮定して手法1と手法2をそれぞれ用いて同様のシミュレーションを行った。一辺の長さが120mとなる立方体をなす三次元空間において、マイクロホンアレイと音源がランダムに分布し、全球面内にマイクロホンアレイの方向がランダムに向けられていることを仮定した。図12は、三次元空間におけるステップごとの誤差平均の変化を示す図である。図12は、手法1、手法2ともにシミュレーション当初において一時的に誤差平均が増加するが、その後、減少に転じ、ある一定値まで低下して収束する。三次元空間での誤差平均は、二次元空間と同等またはそれ以下となった。但し、図13に示すように、三次元空間ではシミュレーション開始から収束までに要する計算時間が二次元空間よりも増加する傾向がある。
【0075】
(総括)
以上に説明したように、本実施形態に係る音響処理装置10は、第1の目的関数(例えば、第1目的関数L)の関数値と、第2の目的関数(例えば、第2目的関数L)の関数値が、それぞれより小さくなるように、N個のマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定める推定部126を備える。第1の目的関数は、N個のマイクロホンアレイのそれぞれについて定めた音源方向である観測音源方向と、当該マイクロホンアレイからの音源の方向を当該マイクロホンアレイの方向で回転した方向との差分である方向差分の大きさを示す。第2の目的関数の関数値は、N個のうち2個のマイクロホンアレイの対ごとに定めた音源からの音の到達時間差である観測到達時間差から、音源から個々のマイクロホンアレイへの音波の伝搬時間の時間差と、個々のマイクロホンアレイのオフセット時間の時間差との差分である時間差分の大きさを示す。
この構成によれば、第1の目的関数と第2の目的関数に対して、それぞれ第2の目的関数と第1の目的関数が拘束条件となるため、第1の目的関数に基づいて推定されるマイクロホンアレイの位置と音源の位置に含まれうる解の不定性と、第2の目的関数に基づいて推定されるマイクロホンアレイから音源の方向に含まれうる解の不定性が解消される。ここで、第1の目的関数に基づいて推定されるマイクロホンアレイの位置と音源の位置には、それぞれ大きさに対する不定性が含まれるが、マイクロホンアレイから音源の方向の回転に対する不定性は含まれない。第2の目的関数に基づいて推定されるマイクロホンアレイから音源の方向の回転に対する不定性が含まれるが、マイクロホンアレイの位置と音源の大きさに対する不定性は含まれない。そのため、第1の目的関数と第2の目的関数のそれぞれの関数値をより小さくすることで、局所最適解を回避して、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0076】
推定部126は、第1の目的関数の関数値と、第2の目的関数の関数値との合計値が、より小さくなるように、マイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めてもよい。
第1の目的関数の関数値と、第2の目的関数の関数値との合計値も、推定されたマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置の正確性を示す指標となる。また、推定されるマイクロホンアレイの位置、音源の位置、およびマイクロホンアレイから音源の方向には不定性が含まれない。そのため、局所最適解を回避して、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0077】
推定部126は、第1の位置から第2の位置の距離のマイクロホンアレイの対間の総和が、より小さくなるように、マイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めてもよい。第1の位置は、マイクロホンアレイを基準とする音源の位置を当該マイクロホンアレイの方向に回転させた位置であり、第2の位置は、マイクロホンアレイの対の一方のマイクロホンアレイから観測音源方向に、当該対の他方のマイクロホンアレイから音源までの距離から、時間差分における音の伝搬距離の差分に相当する距離離れた位置である。
第1の位置から第2の位置の距離のマイクロホンアレイの対間の総和も、推定されたマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置の正確性を示す指標となる。また、推定されるマイクロホンアレイの位置、音源の位置、およびマイクロホンアレイから音源の方向には不定性が含まれない。そのため、局所最適解を回避して、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0078】
推定部126は、第1の目的関数の関数値がより小さくなるように、マイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を更新するステップと、
第2の目的関数の関数値がより小さくなるように、マイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を更新するステップと、を交互に実行してもよい。
第1の目的関数の関数値をより小さくするステップと、第2の目的関数の関数値をより小さくするステップとが交互に実行されるので、いずれかのステップが継続して生じうる局所最適解と解の不定性を回避することができる。そのため、より正確にマイクロホンアレイの位置、方向、ならびにオフセット時間、および、音源の位置を定めることができる。
【0079】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0080】
例えば、音響処理装置10は、N個のうち、少なくとも1個のマイクロホンアレイと一体に構成されていてもよい。
上記の説明では、音響処理装置10が音源方向観測部122、到達時間差観測部124、および推定部126をいずれも備える場合を例にしたが、これには限られない。例えば、音響処理装置10において音源方向観測部122と到達時間差観測部124の一方または両方が省略されていてもよい。但し、音響処理システムS1において、その一方または両方が備わり、音響処理装置10と各種のデータを入出力可能とする。
【0081】
図9に示す例では、個々のマイクロホンアレイA-Aにそれぞれ音源方向観測部122-1~122-Nが接続され、音響処理装置10において音源方向観測部122が省略されている。音源方向観測部122-1~122-Nは、それぞれマイクロホンアレイA~Aと一体化されてもよいし、別体であってもよい。
音源方向観測部122-1~122-Nは、それぞれ自部に接続されるマイクロホンアレイA~Aが取得した複数チャネルの音響信号に基づいて、音源定位処理を行って個々の音源の音源方向を定める。音源方向観測部122-1~122-Nは、それぞれ定めた音源方向を観測音源方向として示す音源方向情報を推定部126に出力する。
【0082】
なお、上述した実施形態における音響処理装置10の一部、例えば、音源方向観測部122、到達時間差観測部124、推定部126、および出力処理部128の一部または全部をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムを、プロセッサを含むコンピュータシステムに読み込ませ、実行することによって実現してもよい。
また、上述した実施形態及び変形例における音響処理装置10の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。音響処理装置10の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【符号の説明】
【0083】
S1…音響処理システム、10…音響処理装置、110…入出力部、120…制御部、122…音源方向観測部、124…到達時間差観測部、126…推定部、128…出力処理部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13