特開2023-177213 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 沖電気工業株式会社の特許一覧

特開2023-177213収音装置、収音プログラム及び収音方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023177213

(43)【公開日】2023-12-13

(54)【発明の名称】収音装置、収音プログラム及び収音方法

(51)【国際特許分類】

H04R 3/00 20060101AFI20231206BHJP

H04R 1/40 20060101ALI20231206BHJP

【ＦＩ】

H04R3/00 320

H04R1/40 320Z

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2022203002

(22)【出願日】2022-12-20

(31)【優先権主張番号】P 2022089418

(32)【優先日】2022-06-01

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】000000295

【氏名又は名称】沖電気工業株式会社

(74)【代理人】

【識別番号】100180275

【弁理士】

【氏名又は名称】吉田倫太郎

(74)【代理人】

【識別番号】100161861

【弁理士】

【氏名又は名称】若林裕介

(72)【発明者】

【氏名】石黒高詩

【テーマコード（参考）】

5D220

【Ｆターム（参考）】

5D220BA06

5D220BC01

5D220BC05

(57)【要約】

【課題】目的方向収音処理においてより高音質な収音結果を得る。
【解決手段】本発明は、収音装置に関する。そして、本発明の収音装置は、第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、選択処理で選択した成分から非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段とを有することを特徴とする。
【選択図】図１

【特許請求の範囲】

【請求項1】

第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、
周波数ごとに、前記第１のマイクロホンからの第１の入力信号の成分と前記第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段と
を有することを特徴とする収音装置。

【請求項2】

前記目的方向音抽出手段は、前記選択処理において、周波数ごとに前記第１の入力信号の成分と前記第２の入力信号の成分のうち強度の大きい方を選択することを特徴とする請求項１に記載の収音装置。

【請求項3】

コンピュータを、
第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、
周波数ごとに、前記第１のマイクロホンからの第１の入力信号の成分と前記第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段と
して機能させることを特徴とする収音プログラム。

【請求項4】

収音装置が行う収音方法において、
前記収音装置は、非目的エリア音抽出手段及び目的方向音抽出手段を備え、
前記非目的エリア音抽出手段は、第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出し、
前記目的方向音抽出手段は、周波数ごとに、前記第１のマイクロホンからの第１の入力信号の成分と前記第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する
ことを特徴とする収音方法。

【請求項5】

２つのマイクロホンを備える複数のマイクロホンアレイのそれぞれについて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、
それぞれのマイクロホンアレイについて、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段と、
それぞれの前記マイクロホンアレイの前記目的方向音抽出信号を用いて前記目的エリアを音源とする目的エリア音を収音するエリア収音手段と
を有することを特徴とする収音装置。

【請求項6】

コンピュータを、
２つのマイクロホンを備える複数のマイクロホンアレイのそれぞれについて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、
それぞれのマイクロホンアレイについて、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段と、
それぞれの前記マイクロホンアレイの前記目的方向音抽出信号を用いて前記目的エリアを音源とする目的エリア音を収音するエリア収音手段と
して機能させることを特徴とする収音プログラム。

【請求項7】

収音装置が行う収音方法において、
前記収音装置は、非目的エリア音抽出手段、目的方向音抽出手段及びエリア収音手段を有し、
前記非目的エリア音抽出手段は、２つのマイクロホンを備える複数のマイクロホンアレイのそれぞれについて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出し、
前記目的方向音抽出手段は、それぞれのマイクロホンアレイについて、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得し、
前記エリア収音手段は、それぞれの前記マイクロホンアレイの前記目的方向音抽出信号を用いて前記目的エリアを音源とする目的エリア音を収音する
ことを特徴とする収音方法。

【発明の詳細な説明】

【技術分野】

【0001】

この発明は、収音装置、収音プログラム及び収音方法に関し、例えば、特定のエリアへの方向の音を強調し、それ以外の方向の音を抑制するシステムに適用し得る。

【背景技術】

【0002】

従来、目的音の音源が存在する特定の目的エリアの方向（以下、「目的方向」と呼ぶ）からの音を強調し、それ以外の方向の音を抑制する処理（以下、「目的方向収音処理」又は単に「収音処理」と呼ぶ）として特許文献１や非特許文献１のような技術が存在する。

【0003】

特許文献１及び非特許文献１の目的方向収音処理では、２つのマイクロホンを備えるマイクロホンアレイを用いたビームフォーマ（ＢｅａｍＦｏｒｍｅｒ；以下「ＢＦ」と呼ぶ）出力により、目的方向以外に存在する音（以下、「非目的音」と呼ぶ）を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的方向の音を強調する処理が用いられている。

【0004】

ＢＦとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である（非特許文献１参照）。ＢＦは、加算型と減算型の大きく２つの種類に分けられる。
特に減算型ＢＦは、加算型ＢＦに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。

【0005】

図９は、マイクロホン数が２個（Ｍ１、Ｍ２）の場合の減算型ＢＦ４００に係る構成を示すブロック図である。

【0006】

減算型ＢＦ４００は、遅延器４１０と減算器４２０を有している。

【0007】

減算型ＢＦ４００は、目的方向に存在する音（以下、「目的音」と呼ぶ）が各マイクロホンに到来する信号の時間差を算出し、遅延器４１０により遅延を加えることにより目的音の位相を合わせる。このときの時間差は下記（１）式により算出される。ここで、ｄはマイクロホン間の距離であり、ｃは音速であり、τ_Ｌは遅延量であり、θ_Ｌは各マイクロホンを結んだ直線に対する垂直方向から目的方向への角度である。

【0008】

また、ここで、遅延器４１０は、死角がマイクロホンＭ１とマイクロホンＭ２の中心に対し、マイクロホンＭ１の方向に存在する場合、マイクロホンＭ１の入力信号ｘ_１（ｔ）に対し遅延処理を行う。その後、減算器４２０が、（２）式に従った減算処理を行う。

【0009】

減算器４２０では、周波数領域でも同様に減算処理を行うことができ、その場合（２）式は以下の（３）式のように変更される。

【0010】

【数1】

【0011】

ここでθ_Ｌ＝±π／２の場合、形成される指向性は図１０（ａ）に示すように、カージオイド型の単一指向性となり、θ_Ｌ＝０，πの場合は、図１０（ｂ）のような８の字型の双指向性となる。ここでは、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」、双指向性を形成するフィルタを「双指向性フィルタ」と呼ぶものとする。

【0012】

減算器４２０では、スペクトル減算法（ＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏｎ；以下、「ＳＳ」とも呼ぶ）を用いることで、双指向性の死角に強い指向性を形成することもできる。ＳＳによる指向性は、（４）式に従い全周波数、もしくは指定した周波数帯域で形成される。（４）式では、マイクロホンＭ１の入力信号Ｘ_１を用いているが、マイクロホンＭ２の入力信号Ｘ_２でも同様の効果を得ることができる。ここでβはＳＳの強度を調節するための係数である。（４）式に従ってＳＳの処理を行う際、減算時に値がマイナスになった場合は、０または元の値を小さくした値に置き換えるフロアリング処理を行う。この方式は、双指向性フィルタにより目的方向以外に存在する音（以下、「非目的音」と呼ぶ）を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的方向を強調することができる。

【0013】

Ｙ（ｎ）＝Ｘ_１（ｎ）－βＭ（ｎ） …（４）

【0014】

以上のように特許文献１及び非特許文献１の記載技術では、２つのマイクロホンを用いたマイクロホンアレイにおいて、双指向性フィルタにより目的方向以外に存在する音（＝非目的音）を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算（ＳＳ）することで、目的方向の音を強調する方法（目的方向収音処理方法）が示されている。

【先行技術文献】

【特許文献】

【0015】

【特許文献1】特開２０２０－１９４０９３号公報

【非特許文献】

【0016】

【非特許文献1】浅野太著，“音響テクノロジーシリーズ１６音のアレイ信号処理－音源の定位・追跡と分離－”，日本音響学会編，コロナ社，２０１１年２月２５日発行

【発明の概要】

【発明が解決しようとする課題】

【0017】

ところで、上記の通り、従来の目的方向収音処理において、（４）式では、マイクロホンＭ１の入力信号Ｘ_１を用いているが、マイクロホンＭ２の入力信号Ｘ_２でも同様の効果を得ることができる。

【0018】

また、例えば、目的音のみが直接マイクロホンに到達するだけではなく、目的音が壁などに反射してマイクロホンに入力された場合には、目的音と反射音が合成されマイクロホンに入力されるので、周波数によっては、反射音の影響により、マイクロホンへの入力信号が減衰することがあり、音質劣化の原因となり得る。

【0019】

以上のような問題点に鑑みて、目的方向収音処理においてより高音質な収音結果を得ることができる収音装置、収音プログラム及び収音方法が望まれている。

【課題を解決するための手段】

【0020】

第１の本発明の収音装置は、第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、周波数ごとに、前記第１のマイクロホンからの第１の入力信号の成分と前記第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段とを有することを特徴とする。

【0021】

第２の本発明の収音プログラムは、コンピュータを、第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、周波数ごとに、前記第１のマイクロホンからの第１の入力信号の成分と前記第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段として機能させることを特徴とする。

【0022】

第３の本発明は、収音装置が行う収音方法において、前記収音装置は、非目的エリア音抽出手段及び目的方向音抽出手段を備え、前記非目的エリア音抽出手段は、第１のマイクロホンと第２のマイクロホンとを備えるマイクロホンアレイから供給される入力信号に基づいて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出し、前記目的方向音抽出手段は、周波数ごとに、前記第１のマイクロホンからの第１の入力信号の成分と前記第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得することを特徴とする。

【0023】

第４の本発明の収音装置において、２つのマイクロホンを備える複数のマイクロホンアレイのそれぞれについて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、それぞれのマイクロホンアレイについて、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段と、それぞれの前記マイクロホンアレイの前記目的方向音抽出信号を用いて前記目的エリアを音源とする目的エリア音を収音するエリア収音手段とを有することを特徴とする。

【0024】

第５の本発明の収音プログラムは、コンピュータを、２つのマイクロホンを備える複数のマイクロホンアレイのそれぞれについて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出する非目的エリア音抽出手段と、それぞれのマイクロホンアレイについて、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得する目的方向音抽出手段と、それぞれの前記マイクロホンアレイの前記目的方向音抽出信号を用いて前記目的エリアを音源とする目的エリア音を収音するエリア収音手段として機能させることを特徴とする。

【0025】

第６の本発明は、収音装置が行う収音方法において、前記収音装置は、非目的エリア音抽出手段、目的方向音抽出手段及びエリア収音手段を有し、前記非目的エリア音抽出手段は、２つのマイクロホンを備える複数のマイクロホンアレイのそれぞれについて、前記マイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力に基づいて目的エリアへの目的方向以外からの非目的方向音を抽出し、前記目的方向音抽出手段は、それぞれのマイクロホンアレイについて、周波数ごとに、第１のマイクロホンからの第１の入力信号の成分と第２のマイクロホンからの第２の入力信号の成分のいずれかを選択する選択処理を行い、周波数ごとに、前記選択処理で選択した成分から前記非目的エリア音抽出手段が抽出した非目的方向音の成分を減算して目的方向からの目的方向音を抽出した目的方向音抽出信号を取得し、前記エリア収音手段は、それぞれの前記マイクロホンアレイの前記目的方向音抽出信号を用いて前記目的エリアを音源とする目的エリア音を収音することを特徴とする。

【発明の効果】

【0026】

本発明によれば、目的方向収音処理においてより高音質な収音結果を得ることができる。

【図面の簡単な説明】

【0027】

【図1】第１の実施形態に係る収音装置の機能的構成について示したブロック図である。

【図2】第１の実施形態に係る収音処理部の目的方向収音処理による収音エリアの例について示した図である。

【図3】第１の実施形態に係る収音処理部による目的音方向収音処理の内容を説明するための環境モデル（説明用環境モデル）について示した図である。

【図4】第１の実施形態に係るシミュレーションにおける環境モデル（シミュレーション用環境モデル）について示した説明図（その１）である。

【図5】第１の実施形態に係るシミュレーションにおける環境モデル（シミュレーション用環境モデル）について示した説明図（その２）である。

【図6】第１の実施形態に係るシミュレーション結果の評価において、２値の分類問題を場合分けした表である。

【図7】第１の実施形態に係る収音処理部の収音結果をｔ検定の分析ツールで評価した結果について示した図である。

【図8】第１の実施形態に係る収音処理部における再現率の改善量の分布（改善量ごとのデータ数）について示したヒストグラムである。

【図9】従来の減算型ＢＦ（マイクロホンの数が２個の場合）の構成を示すブロック図。

【図10】従来の減算型ＢＦ（マイクロホンの数が２個の場合）により形成される指向性フィルタの例について示した説明図。

【図11】第２の実施形態に係る収音装置の機能的構成について示したブロック図である。

【図12】第２の実施形態に係るマイクロホンアレイの配置構成の例について示した図である。

【図13】第２の実施形態に係るマイクロホンアレイのビームフォーマ出力について周波数領域で示したグラフ（イメージ図）である。

【図14】第２の実施形態に係るマイクロホンアレイを用いて取得したビームフォーマ出力に基づいてエリア収音処理した場合における各周波数成分のパワースペクトルの変化について示した説明図（イメージ図）である。

【図15】第２の実施形態における各信号の成分をベン図（論理式）の形式で表した図である。

【図16】第２の実施形態に係るシミュレーションにおける環境モデル（シミュレーション用環境モデル）について示した説明図（その１）である。

【図17】第２の実施形態に係るシミュレーションにおける環境モデル（シミュレーション用環境モデル）について示した説明図（その２）である。

【図18】第２の実施形態に係る収音処理部の収音結果をｔ検定の分析ツールで評価した結果について示した図である。

【図19】第２の実施形態に係る収音処理部における再現率の改善量の分布（改善量ごとのデータ数）について示したヒストグラムである。

【図20】第３の実施形態に係る収音装置の機能的構成について示したブロック図である。

【図21】第３の実施形態における各信号の成分をベン図（論理式）の形式で表した図である。

【図22】第４実施形態に係る収音装置の機能的構成について示したブロック図である。

【発明を実施するための形態】

【0028】

（Ａ）第１の実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の第１の実施形態を図面を参照しながら詳述する。

【0029】

（Ａ－１）第１の実施形態の構成
図１は、この実施形態に係る収音装置１０の機能的構成を示すブロック図である。

【0030】

収音装置１０は、マイクロホンアレイＭＡから供給される音響信号に基づいて目的方向収音処理を行い、収音処理した結果を出力する装置である。

【0031】

マイクロホンアレイＭＡは、２つのマイクロホンＭ（Ｍ１、Ｍ２）を備えているものとする。各マイクロホンＭ（Ｍ１、Ｍ２）が捕捉した音響に基づく音響信号は、収音装置１０に供給されることになる。各マイクロホンＭ（Ｍ１、Ｍ２）については、例えば、指向性を持たない全指向性マイク（例えば、全指向性のＭＥＭＳ（ＭｉｃｒｏＥｌｅｒｃｔｒｏｎｉｃｓＭｅｃｈａｎｉｃａｌＳｙｓｔｅｍ）マイク）を適用することができる。

【0032】

次に、収音装置１０の構成概要について説明する。

【0033】

収音装置１０は、データ入力部１１、収音処理部１２、及び出力部１３を有している。

【0034】

収音装置１０は、全てハードウェア（例えば、専用チップ等）により構成するようにしてもよいし一部又は全部についてソフトウェア（プログラム）として構成するようにしてもよい。収音装置１０は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム（実施形態の音声プログラムを含む）をインストールすることにより構成するようにしてもよい。

【0035】

データ入力部１１は、マイクロホンアレイＭＡで捕捉した音響信号をアナログ信号からディジタル信号に変換して収音処理部１２に供給する。また、データ入力部１１は、当該ディジタル信号を時間領域から周波数領域に変換（例えば、ＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）等のフーリエ変換処理）する。以下では、データ入力部１１から、収音処理部１２に供給される信号（周波数領域の信号）を「入力信号」と呼ぶものとする。

【0036】

以下では、マイクロホンＭ１、Ｍ２からの入力信号を、それぞれＸ_１、Ｘ_２と表すものとする。

【0037】

収音処理部１２は、マイクロホンアレイＭＡの入力信号から、目的エリア（目的音の音源）からの目的方向音を収音する目的方向収音処理を行い、目的方向音を抽出した信号（目的方向音を強調した信号；以下、「目的方向音抽出信号」と呼ぶ）Ｙ（ｎ）を取得し、出力部１３に供給する。

【0038】

図２は、収音処理部１２の目的方向収音処理による収音エリアの例について示した図である。

【0039】

図２では、マイクロホンＭ１、Ｍ２との間の中間点の位置をＰＭとしている。また、図２では、目的エリア（目的音の音源の存在する領域）をＡとし、位置ＰＭから目的エリアＡ（目的エリアＡへの中心位置）への方向（目的方向）の矢印にＤＴを付している。

【0040】

ここで、収音処理部１２は、マイクロホンアレイＭＡ（マイクロホンＭ１、Ｍ２）の入力信号Ｘ_１（ｎ），Ｘ_２（ｎ）に基づき、位置ＰＭから目的方向ＤＴ（目的エリアＡへの方向）へ指向性を向けて目的音収音処理を行うものとする。ここでは、収音処理部１２は、位置ＰＭから目的方向ＤＴへ死角を向けた双指向性フィルタを形成し、当該双指向性フィルタを用いて目的方向以外の方向からの非目的音を抽出し、抽出した非目的音の振幅スペクトルをいずれかの入力信号の振幅スペクトルから減算することで、目的方向収音処理（目的方向音を強調する処理）を行うものとする。図２では、当該双指向性フィルタの指向特性（位置ＰＭを基準とする指向特性）の曲線を一点鎖線で図示し、当該双指向性フィルタを用いた目的方向収音処理による収音エリアの外形を２点鎖線で示している。

【0041】

具体的には、収音処理部１２は、周波数ごとに以下の（５）の計算処理を行うことで、目的方向音抽出信号Ｙ（ｎ）を取得するものとする。

【0042】

（５）式において、βは上記の（４）式のときと同様にＳＳの強度を調節するための係数である。また、（５）式において、非目的音Ｍ（ｎ）は上記の（３）式により求めることができる。さらに、（５）式において、ｍａｘ（Ｘ_１（ｎ），Ｘ_２（ｎ））は、Ｘ_１（ｎ）又はＸ_２（ｎ）のうち大きい方を選択することを意味している。例えば、ある周波数ｆｎにおいて、Ｘ_１（ｎ）＞Ｘ_２（ｎ）である場合、ｍａｘ（Ｘ_１（ｎ），Ｘ_２（ｎ））＝Ｘ_１（ｎ）となる。つまり、収音処理部１２は、（５）式に基づき、周波数毎に、入力信号Ｘ_１と入力信号Ｘ_２の信号（成分）の大きい方から、非目的音βＭを差し引くことにより、目的方向音抽出信号Ｙを取得する。

【0043】

Ｙ（ｎ）＝ｍａｘ（Ｘ_１（ｎ），Ｘ_２（ｎ））－βＭ（ｎ） …（５）

【0044】

出力部１３は、供給された目的方向音抽出信号を所定の方式／形式で出力する。出力部１３が出力する信号（以下、「出力信号」とも呼ぶものとする）の形式は限定されないものであり、種々の形式を適用することができる。例えば、出力部１３は、出力信号を所定の形式のディジタル音響信号（例えば、ＰＣＭ形式の信号）や所定のコーデックにより符号化して出力（出力する方式については限定されない）するようにしてもよい。また、出力部１３は、出力信号を、アナログ音響信号として出力（例えば、図示しないスピーカに出力）するようにしてもよい。さらに、出力部１３は、出力信号を周波数領域の形式で出力するようにしてもよいし時間領域の形式で出力するようにしてもよい。

【0045】

次に、収音処理部１２において、目的方向収音処理に上記の（５）式を用いることの理論的な効果について説明する。

【0046】

ここで、収音処理部１２による目的方向収音処理について図３に示す環境モデルを用いて説明する。

【0047】

図３は、収音処理部１２による目的音方向収音処理の内容を説明するための環境モデル（以下、「説明用環境モデル」と呼ぶ）について示した図である。なお、図３に示す説明用環境モデルでは、説明を簡易とするため、実際よりも要素を単純化している。

【0048】

図３では、マイクロホンアレイＭＡ（マイクロホンＭ１、Ｍ２）と目的エリアＡの周辺に壁Ｗが存在している。壁Ｗは、位置ＰＭから目的エリアＡの方向を見た場合に右側に壁Ｗが存在する状態となっている。また、図３では、目的エリアＡから位置ＰＭの方に向かう目的音の周波数をｆ１、壁Ｗから位置ＰＭの方に向かう妨害音の周波数をｆ２とそれぞれ図示している。さらに、図３では、目的エリアＡからの目的音が壁Ｗに反射して位置ＰＭに向かう音を反射音として図示している。なお、ここでは、説明の単純化のために、目的音ｆ１及び妨害音ｆ２をそれぞれ単周波の音として説明するものとする。また、ｆ１とｆ２は異なる周波数であるものとする。

【0049】

次に、説明用環境モデルにおいて、仮に反射音が存在しないとした場合（壁Ｗが存在しない場合）における収音処理部１２による目的音方向収音処理について説明する。このとき、マイクロホンアレイＭＡの正面方向（ＰＭから目的エリアＡへの方向）から入力される目的音ｆ１は、マイクロホンＭ１、Ｍ２に同じ振幅で且つ同相で入力されたものとする。また、このとき、妨害音ｆ２は、マイクロホンＭ１，Ｍ２に同じ振幅で異なる位相で入力されたものとする。そうすると、この場合（反射音が存在しないとした場合）、マイクロホンＭ１，Ｍ２では目的音も妨害音も同じ振幅となる。

【0050】

次に、説明用環境モデルにおいて、反射音が存在するとした場合（壁Ｗが存在する場合）における収音処理部１２による目的音方向収音処理について説明する。このとき、図３に示すように、マイクロホンアレイＭＡ（位置ＰＭ）の近くに壁Ｗがあったとすると、マイクロホンアレイＭＡの各マイクロホンＭ１、Ｍ２には、目的方向と壁Ｗの両方から周波数ｆ１の成分（目的エリアＡから発せられた音の成分）が入力されることになる。つまり、説明用環境モデルにおいて、反射音が存在するとした場合、図３に示すように、目的エリアＡから各マイクロホンＭ１、Ｍ２に到達する目的音と、壁Ｗの方向から各マイクロホンＭ１、Ｍ２に到達する反射音の両方に周波数ｆ１の成分が含まれることになる。

【0051】

ここで、反射音が存在するとした場合（壁Ｗが存在する場合）において、目的音に含まれる周波数ｆ１の成分の振幅ａ１を１とし、反射音に含まれる周波数ｆ１の成分の振幅ａ２をｋ（つまりａ２をａ１のｋ倍；例えば、ｋ＝０．５程度）とする。また、ここで、目的エリアＡにおける目的音の位相を基準とし、マイクロホンＭ１で捕捉される入力信号Ｘ_１での目的音と反射音の位相差をθ_１、マイクロホンＭ２で捕捉される入力信号Ｘ_２での目的音と反射音の位相差をθ_２とする。そうすると、Ｘ_１、Ｘ_２はそれぞれ以下の（６）式、（７）式で示すことができる。さらに、｜Ｘ_１｜、｜Ｘ_２｜はそれぞれ以下の（８）式、（９）式で示すことができる。

【0052】

【数2】

【0053】

このとき、θ_１≠θ_２であることは自明であるので、ほとんどのケースで｜Ｘ_１｜≠｜Ｘ_２｜となり、Ｘ_１とＸ_２に振幅の差分が生じることになる。また、このとき、Ｘ_１とＸ_２のどちらの振幅がより大きく減衰するかは一意に定まらない。従って、従来における目的方向収音処理（上記の（４）式に基づく収音処理）のように、基準となるマイクロホンを固定するよりも、この実施形態の目的方向収音処理（上記の（５）式に基づく収音処理）のように、周波数毎に、入力信号Ｘ_１と入力信号Ｘ_２の信号の大きい方から、非目的音βＭを差し引くことにより、収音結果における反射音の影響を低減することができることが分かる。

【0054】

（Ａ－２）第１の実施形態の動作
次に、以上のような構成を有するこの実施形態の収音装置１０の動作（実施形態の収音方法）を説明する。

【0055】

データ入力部１１は、マイクロホンアレイＭＡで収音した音響信号をアナログ信号からディジタル信号に変換する。さらに、データ入力部１１は、ディジタル信号をさらに時間領域から周波数領域に変換して入力信号Ｘ_１、Ｘ_２として取得し、収音処理部１２に供給する。

【0056】

収音処理部１２は、マイクロホンアレイＭＡの入力信号Ｘ_１、Ｘ_２に基づき、目的方向収音処理を行って目的方向音抽出信号Ｙを取得して出力部１３に供給する。このとき、収音処理部１２は、周波数毎に、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分を比較していずれかを選択する選択処理を行い、選択した入力信号の成分から、非目的音の成分（βＭ）を差し引く（減算する）ことにより、目的方向音抽出信号Ｙを取得する。具体的には、収音処理部１２は、周波数ごとに上記の（５）の計算処理を行うことで、目的方向音抽出信号Ｙ（ｎ）を取得する。

【0057】

出力部１３は、供給された目的方向音抽出信号Ｙ（ｎ）を所定の方式／形式で出力信号として出力する。

【0058】

（Ａ－３）第１の実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。

【0059】

この実施形態の収音装置１０（収音処理部１２）は、周波数毎に、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分を比較していずれかを選択する選択処理を行い、選択処理により選択した入力信号の成分から、非目的音の成分（βＭ）を差し引く（減算する）ことにより、目的方向音抽出信号Ｙを取得する。これにより、この実施形態の収音装置１０では、従来よりも収音結果における反射音の影響を低減することができる。

【0060】

上記の図３の説明用環境モデルを用いた説明の通り、収音装置１０の目的方向収音処理では、従来よりも収音結果における反射音の影響を低減することができることは理論的に説明可能であるが、本願発明者は、さらにシミュレーション（以下、「第１の本シミュレーション」と呼ぶ）によってもこの実施形態における収音装置１０の効果（従来よりも収音結果における反射音の影響等を低減することができるという特有な効果）を奏することを確認した。

【0061】

以下、第１の本シミュレーションにおける条件とその結果について説明する。

【0062】

図４、図５は、第１の本シミュレーションにおける環境モデル（以下、「第１のシミュレーション用環境モデル」と呼ぶ）について示した説明図である。

【0063】

第１の本シミュレーションでは、図４、図５のような第１のシミュレーション用環境モデルにおいて各マイクロホンＭ１、Ｍ２で捕捉される音響信号を取得（コンピュータ上のシミュレーションにより取得）し、さらに取得した音響信号を、実際に構築（同様にコンピュータ上で構築）した収音装置１０に入力して結果を評価した。また、第１の本シミュレーションでは、ＰｙＲｏｏｍＡｃｏｕｓｔｉｃｓを用いて、図４、図５のような第１のシミュレーション用環境モデルを設定してインパルス応答を取得し、取得したインパルス応答をドライソース信号（目的エリア音又は指向性雑音（妨害音）のサンプルとなるドライソース信号）に畳み込むことで、マイクロホンＭ１、Ｍ２の観測信号Ｘ_１、Ｘ_２を得た。ＰｙＲｏｏｍＡｃｏｕｓｔｉｃｓは、音響アレイ信号処理に関するアルゴリズムの迅速な開発や評価を目的としてインターネット上で公開されているオープンソースのライブラリである。

【0064】

第１の本シミュレーションでは、目的音源及び指向性雑音のドライソース信号として、既存の音声信号のサンプルを適用した。具体的には、第１の本シミュレーションでは、ＡＴＲ音声言語データベースから、ドライソースとして用いる音声信号のサンプルを取得した。ＡＴＲ音声言語データベースは、株式会社ＡＴＲ－Ｐｒｏｍｏｔｉｏｎｓが提供する音声サンプルのデータベースであり、標準的な音声データベースとして音声認識等の研究に幅広く利用されている。第１の本シミュレーションでは、目的音源のドライソース信号として、ＡＴＲ音声言語データベースから男女各々３話者の２センテンス（計１２パターン）を取得した。また、第１の本シミュレーションでは、指向性雑音のドライソース信号として、目的音源とは異なる男女各３話者の１センテンス（計６パターン）を取得した。

【0065】

図４、図５に示す第１のシミュレーション用環境モデルでは、マイクロホンアレイＭＡ、目的音源の位置ＰＯ及び指向性雑音の音源の位置ＰＩは全て同じ平面上に存在するものとする。具体的には、第１のシミュレーション用環境モデルでは、マイクロホンアレイＭＡ、目的音源の位置ＰＯ及び指向性雑音の位置ＰＩは全て床面から高さ１５ｃｍの平面上に存在するものとする。

【0066】

また、図４、図５において、上側を「奥」、下側を「手前」、左側を「左」、右側を「右」とそれぞれ呼ぶものとする。また、図４、図５において、縦方向（垂直方向）を「奥行方向」と呼び、横方向（水平方向）を「幅方向」と呼ぶものとする。

【0067】

そして、第１のシミュレーション用環境モデルでは複数の条件下でのシミュレーションを行うが、マイクロホンアレイＭＡと、目的音源の位置ＰＯと、指向性雑音の位置ＰＩとの相対的な位置関係は図４に示す関係で統一されているものとする。図４では、マイクロホンアレイの位置ＰＭから奥側に０．３ｍ離れた位置に目的音源の位置ＰＯが配置され、目的音源の位置ＰＯから右側に１．０ｍ離れた位置に指向性雑音の位置ＰＩが配置されている。
また、第１のシミュレーション用環境モデルでは、マイクロホンＭ１、Ｍ２の間の距離は３ｃｍであるものとする。

【0068】

また、第１の本シミュレーションでは、図５に示すように、幅方向Ｘ［ｍ］×奥行き方向Ｙ［ｍ］×高さ方向Ｚ［ｍ］のサイズの部屋のモデル（以下、「シミュレーション用部屋モデル」と呼ぶ）に、マイクロホンアレイＭＡ及び各音源を配置した環境モデルを適用するものとする。具体的には、第１の本シミュレーションでは、「奥行Ｘ＝６ｍ、幅ｙ＝６ｍ、高さ＝３ｍ」のシミュレーション用部屋モデル（以下、「第１のシミュレーション用部屋モデル」と呼ぶ）と、「奥行Ｘ＝９ｍ、幅Ｙ＝９ｍ、高さＺ＝３ｍ」のシミュレーション用部屋モデル（以下、「第２のシミュレーション用部屋モデル」と呼ぶ）を用意して、それぞれのシミュレーション用部屋モデルで目的方向収音処理を行った。

【0069】

第１の本シミュレーションでは、図５に示すようなシミュレーション用部屋モデル内の複数の位置にマイクロホンアレイＭＡ及び各音源の位置（目的音源の位置ＰＯ及び指向性雑音の位置ＰＩ）を配置して目的方向収音処理を行った。具体的には、図５に示すように、シミュレーション用部屋モデルの中で、マイクロホンアレイＭＡの位置を、中央の位置ＰＭ＿Ｄ、中央奥側の位置ＰＭ＿Ｆ、中央手前側の位置ＰＭ＿Ｂ、左側手前の位置ＰＭ＿Ａ、左側の位置ＰＭ＿Ｃ及び左奥側の位置ＰＭ＿Ｅの６か所に変化させて目的方向収音処理を行った。具体的には、図５に示すように、位置ＰＭ＿ＤからＸ／３［ｍ］左側に離れたところに位置ＰＭ＿Ｃを配置し、位置ＰＭ＿ＤからＹ／３［ｍ］手前側に離れたところに位置ＰＭ＿Ｂを配置し、位置ＰＭ＿ＤからＹ／３［ｍ］奥側に離れたところに位置ＰＭ＿Ｆを配置し、位置ＰＭ＿ＣからＹ／３［ｍ］手前側に離れたところに位置ＰＭ＿Ａを配置し、位置ＰＭ＿ＣからＹ／３［ｍ］奥側に離れたところに位置ＰＭ＿Ｅを配置するものとする。図５では、位置ＰＭ＿Ａ～位置ＰＭ＿Ｆのそれぞれに対応する目的音源の位置をＰＯ＿Ａ～ＰＯ＿Ｆとして図示している。例えば、マイクロホンアレイＭＡの位置が位置ＰＭ＿Ａにある場合、目的音源の位置はＰＯ＿Ａとなる。なお、図５では、図示を簡易とするため、マイクロホンアレイＭＡの各位置ＰＭ＿Ａ～ＰＭ＿Ｆのそれぞれに応じて、指向性雑音の位置ＰＩも変化するが、指向性雑音の各位置については図示を省略している。

【0070】

また、第１の本シミュレーションでは、各シミュレーション用部屋モデルについて、壁の吸音率を０．３、０．６、０．９の３パターンに変化させて目的方向収音処理を行った。さらに、第１の本シミュレーションでは、各シミュレーション用部屋モデルにおいて、壁面での最大反射階数を３０回とした。

【0071】

以上のように、第１の本シミュレーションでは、シミュレーション用部屋モデルが２パターン、各部屋モデルにおけるマイクロホンアレイＭＡの位置が６パターン、壁の吸収率が３パターンとなるので、シミュレーション用環境モデルが２×６×３＝３６パターン存在することになる。また、第１の本シミュレーションでは、目的音源のドライソース信号が１２パターン、指向性雑音のドライソース信号が６パターン存在するので、ドライソース信号の組合せパターンが１２×６＝７２パターン存在することになる。したがって、第１の本シミュレーションでは、シミュレーション用部屋モデルのパターンが３６パターン、ドライソース信号の組合せパターンが７２パターン存在するので、シミュレーションの条件（シミュレーション用部屋モデルとドライソース信号の組合せにより定まる条件）が計２５９２パターン（３６×７２＝２５９２）存在することになる。

【0072】

第１の本シミュレーションでは、上記の２５９２パターンの各条件について、コンピュータ上で、従来の目的方向収音処理（上記の（４）式に基づく処理）による収音結果（以下、「従来の収音処理結果」とも呼ぶ）と、この実施形態の目的方向収音処理（上記の（５）式に基づく処理）による収音結果（以下、「本実施形態の収音処理結果」とも呼ぶ）とを比較評価し、有意差があるかを確認した。ここでは、収音結果（音質）の評価方法として、ｔ検定（ｔ検定ツール）の手法を用いた。ｔ検定とは、分散が等しくないと仮定した２標本による検定手法である。

【0073】

また、ここでは、ｔ検定に適用する評価指標の一つとして、音切れを評価する指標（以下、「音切れ評価指標」と呼ぶ）を用いるものとする。ここでは、音切れ評価指標として、Ｆ値（Ｆ－ｍｅａｓｕｒｅ）を構成する再現率（ｒｅｃａｌｌ）を用いるものとする。

【0074】

Ｆ値及び再現率の詳細については、例えば、以下の参考文献１に記載されている。

【0075】

参考文献１：「Ｆ値（Ｆ－ｍｅａｓｕｒｅ）」、朱鷺の杜Ｗｉｋｉ（ときのもりうぃき）、産業技術総合研究所、[online]<URL:https://ibisforest.org/index.php?F%E5%80%A4>
Ｆ値は、予測結果の評価尺度の一つである。Ｆ値は、再現率と適合率（ｐｒｅｃｉｓｉｏｎ）の調和平均により表される。再現率とは、実際（真）に正であるもののうち、正であると予測されたものの割合である。適合率は、正と予測したデータのうち、実際に正であるものの割合である。

【0076】

ここで、再現率と適合率の算出にあたって、２値（正と負の２クラス）の分類問題を検討する。ここで、評価対象となるデータにおける「予測結果」と「真の結果」との関係について図６のように整理する。

【0077】

図６は、２値の分類問題を場合分けした表である。

【0078】

図６では、予測結果及び真の結果の両方が正のデータ数を「ＴＰ」、予測結果及び真の結果の両方が負のデータ数を「ＴＮ」、予測結果が正で真の結果が負のデータ数を「ＦＰ」、予測結果が負で真の結果が正のデータ数を「ＦＮ」としている。

【0079】

そうすると、再現率（ｒｅｃａｌｌ）と適合率（ｐｒｅｃｉｓｉｏｎ）は、それぞれ以下の（１０）式、（１１）式のように示すことができる。そして、再現率と適合率を以下の（１２）式に当てはめるとＦ値（Ｆ－ｍｅａｓｕｒｅ）を算出することができる。

【0080】

【数3】

【0081】

ここでは、上記の２５９２パターンのデータ（サンプル）について、目的方向収音処理による収音結果を予測結果とし、目的音のドライソース信号を真の結果とした場合における再現率（ｒｅｃａｌｌ）を算出することで評価（音切れの評価）を行った。つまり。上記の２５９２パターンのデータ（サンプル）について、従来の収音処理結果と本実施形態の収音処理結果のそれぞれの再現率を算出してｔ検定（ｔ検定の分析ツール）を用いて評価することで、本実施形態の収音処理結果の評価を行った。

【0082】

ここでは、ｔ検定の分析ツールとして、Ｍｉｃｒｏｓｏｆｔ（登録商標）社がＥｘｃｅｌ（登録商標）上で提供するツール（詳細については以下の参考文献２のｗｅｂページの「ｔ検定」のタブを参照）を適用した。

【0083】

参考文献２：「分析ツールを使用して統計学的および工学的分析を行う（「ｔ検定」タブ）」、Microsoft、[online]<URL:https://support.microsoft.com/ja-jp/office/分析ツールを使用して統計学的および工学的分析を行う-6c67ccf0-f4a9-487c-8dec-bdb5a2cefab6>
図７は、従来の収音処理結果と本実施形態の収音処理結果のそれぞれの再現率を算出し、上記のｔ検定の分析ツールにそれぞれの再現率のデータを入力して得られた結果について示した図である。

【0084】

図８は、従来の収音処理結果と本実施形態の収音処理結果との間の「再現率の改善量」の分布（改善量ごとのデータ数）について示したヒストグラムである。

【0085】

なお、図７、図８において「データ」とは再現率の値のことである。また、図７において、「平均」は各データの平均値であり、「分散」は各データの不偏分散であり、「観測数」は、各データのサンプルサイズであり、「プールされた分散」は２つのデータの分散を併合した値であり、「仮説平均との差異」は仮説平均との差異に設定した値である。さらに、図７において、「ｔ」はデータから算出されたｔ値であり、「Ｐ（Ｔ＜＝ｔ）両側」は両側検定の場合のＰ値であり、「ｔ境界値両側」は両側検定の場合の棄却限界値（この値をｔ値が超えると有意）である。

【0086】

図７において、「自由度」については下記のように定義される値である。

【0087】

ここで、２つのデータサンプルの不変分散が等しくないと仮定した際は、例えば、Ｗｅｌｃｈ＝Ｓａｔｔｅｒｔｈｗａｉｔｅの式を用いてｔ分布の自由度について計算することができる。具体的には、例えば、以下の（１３）式により、ｔ分布の自由度について計算することができる。Ｗｅｌｃｈ＝Ｓａｔｔｅｒｔｈｗａｉｔｅの式の詳細については、例えば、以下の参考文献３に記載されている（参考文献３では、「Ｗｅｌｃｈの方法」と記載されている）。

【0088】

（１３）式は、２標本の母平均の差の検定を行う際の計算方法の一つであり、ｔ検定におけるｔ_０値を算出し、２標本の母集団の平均値が等しいという帰無仮説を検定することができる。（１３）式において、（ｎ_１，ｎ_２）は母集団からサンプリングした２標本のサンプルサイズ、（＾ｘ_１，＾ｘ_２）（許明細書における表記の都合上（１３）式におけるｘに対するオーバーラインを「＾」で代用）は当該２標本の平均値、（ｓ_１ ^２，ｓ_２ ^２）は当該２標本の不偏分散をそれぞれ示している。そして、（１３）式に、Ｓ_１ ^２＝０．０２３８６２３６、Ｓ_２ ^２＝０．０１２７８４８２６、ｎ_１＝ｎ_２＝２５９２のように第１の本シミュレーションにおけるパラメータを代入すると、自由度ｄｆ＝４７４８（小数点以下は四捨五入）という結果を得ることができる。

【0089】

参考文献３：「Ｗｅｌｃｈの方法（Ｗｅｌｃｈ’ｓｍｅｔｈｏｄ）」、統計用語集、株式会社社会情報サービス、[online]<URL:https://bellcurve.jp/statistics/glossary/1898.html>

【0090】

【数4】

【0091】

ここで、図７に示すｔ検定の結果を参照すると、本実施形態の収音処理結果では、従来の収音処理結果と比較して、再現率が平均して０．１７程度向上しており、かつ、「ｔ（４７４８）＝４５．１」、「ｐ＜０．０１」となっている。このことから、本実施形態の収音処理結果では、従来の収音処理結果と比較して有意差があることがわかる。つまり、第１の本シミュレーションの結果から、本実施形態の収音処理結果では、従来の収音処理結果と比較して、明らかに音質（音切れ）が改善していることが確認できた。

【0092】

（Ｂ）第２の実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の第２の実施形態を図面を参照しながら詳述する。

【0093】

（Ｂ－１）第２の実施形態の構成及び動作
図１１は、この実施形態に係る収音装置１０Ａの機能的構成を示すブロック図である。

【0094】

第１の実施形態の収音装置１０では、１つのマイクロホンアレイＭＡの入力信号に基づいて目的方向ＤＴ（目的エリアＡへの方向）へ指向性を向けて目的音収音処理を行っていたが、第２の実施形態の収音装置１０Ａでは、２つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２）の入力信号に基づいて、目的エリアＡを音源とする音をエリア収音処理する構成となっている。

【0095】

マイクロホンアレイＭＡ１、ＭＡ２は、目的エリアＡが存在する空間の任意の場所に配置される。目的エリアＡに対するマイクロホンアレイＭＡ１、ＭＡ２の位置は、指向性が目的エリアＡでのみ重なればどこでも良い。各マイクロホンアレイＭＡは２つのマイクロホンＭ（Ｍ１、Ｍ２）から構成されている。

【0096】

第２の実施形態の収音装置１０Ａでは、データ入力部１１、収音処理部１２が、データ入力部１１Ａ、収音処理部１２Ａに置き換わっている点で第１の実施形態と異なっている。以下、第２の実施形態について第１の実施形態との差異を説明する。

【0097】

データ入力部１１Ａは、各マイクロホンアレイＭＡ１、ＭＡ２で収音した音響信号をアナログ信号からディジタル信号に変換する。

【0098】

収音処理部１２Ａは、マイクロホンアレイＭＡ１、ＭＡ２の入力信号から、目的エリアＡを音源とする目的エリア音を収音するエリア収音処理を行って目的エリア音抽出信号Ｚ（ｎ）を取得し、出力部１３に供給する。

【0099】

出力部１３は、供給された目的エリア音抽出信号Ｚ（ｎ）を所定の方式／形式で出力信号として出力する。

【0100】

次に、収音処理部１２Ａの処理の詳細について説明する。

【0101】

この実施形態では、マイクロホンアレイＭＡ１を構成するマイクロホンＭ１、Ｍ２の入力信号をそれぞれＸ_１１（ｎ）、Ｘ_１２（ｎ）と表し、マイクロホンアレイＭＡ２を構成するマイクロホンＭ１、Ｍ２の入力信号をそれぞれＸ_２１（ｎ）、Ｘ_２２（ｎ）と表すものとする。また、この実施形態では、マイクロホンアレイＭＡ１、ＭＡ２から目的エリアＡへの目的方向音抽出信号を、それぞれＹ_１、Ｙ_２と表すものとする。さらに、この実施形態では、マイクロホンアレイＭＡ１、ＭＡ２から見て目的方向以外に存在する非目的音を、それぞれＭ_１、Ｍ_２とする。さらにまた、この実施形態では、目的方向音抽出信号Ｙ_１、Ｙ_２に含まれる非目的エリア音（雑音）の成分を、それぞれＮ_１、Ｎ_２とする。

【0102】

図１２は、２つのマイクロホンアレイＭＡ１、ＭＡ２を用いて、目的エリアＡの音源からの目的エリア音を収音する場合における各マイクロホンアレイＭＡ１、ＭＡ２の構成例について示した説明図である。

【0103】

図１３は、図１２に示すマイクロホンアレイＭＡ１、ＭＡ２のそれぞれのＢＦ出力について周波数領域で示した説明図（グラフ）である。図１３（ａ）、図１３（ｂ）は、それぞれマイクロホンアレイＭＡ１、ＭＡ２のＢＦ出力について周波数領域で示したグラフ（イメージ図）である。

【0104】

図１４は、図１２に示すマイクロホンアレイＭＡ１、ＭＡ２を用いて取得したＢＦ出力に基づいてエリア収音処理した場合における各周波数成分のパワースペクトルの変化について示した説明図（イメージ図）である。

【0105】

図１５は、第２の実施形態における各信号の成分をベン図（論理式）の形式で表した図である。

【0106】

この実施形態において、収音処理部１２Ａは、図１２～図１５に示すような処理により、目的エリア音Ｚを取得するものとする。収音処理部１２Ａは、まず各マイクロホンアレイＭＡ１、ＭＡ２から目的エリアＡへの目的方向音を、第１の実施形態と同様の処理により抽出するものとする。

【0107】

このとき、目的方向音抽出信号Ｙ_１、Ｙ_２は、（１４）式、（１５）式のようになる。（１４）式において、ｍａｘ（Ｘ_１１，Ｘ_１２）は、Ｘ_１１（ｎ）又はＸ_１２（ｎ）のうち大きい方を選択することを意味している。また、（１５）式において、ｍａｘ（Ｘ_２１，Ｘ_２２）は、Ｘ_２１（ｎ）又はＸ_２２（ｎ）のうち大きい方を選択することを意味している。

【0108】

Ｙ_１＝ｍａｘ（Ｘ_１１，Ｘ_１２）－βＭ_１ …（１４）
Ｙ_２＝ｍａｘ（Ｘ_２１，Ｘ_２２）－βＭ_２ …（１５）

【0109】

ここで、（１６）式、（１７）式に示すようにＸ_１、Ｘ_２を定めると、Ｙ_１、Ｙ_２は、それぞれ（１８）式、（１９）式のように示すことができる。

【0110】

Ｘ_１＝ｍａｘ（Ｘ_１１，Ｘ_１２） …（１６）
Ｘ_２＝ｍａｘ（Ｘ_２１，Ｘ_２２） …（１７）
Ｙ_１＝Ｘ_１－βＭ_１ …（１８）
Ｙ_２＝Ｘ_２－βＭ_２ …（１９）

【0111】

そうすると、非目的エリア音Ｎ_１、Ｎ_２は、それぞれ（２０）式、（２１）式のように示すことができる。αはＢＦ出力に対するパワー補正係数である。

【0112】

Ｎ_１＝Ｙ_１－αＹ_２ …（２０）
Ｎ_２＝Ｙ_２－αＹ_１ …（２１）

【0113】

収音処理部１２では、以上の処理による非目的エリア音Ｎ_１、Ｎ_２のいずれかを用いることで、（２２）式又は（２３）式に示すように目的エリア音抽出信号Ｚを求めることができる。なお、Ｙ_１、Ｙ_２、Ｎ_１、Ｎ_２、Ｚの関係をベン図／論理式で表すと図１５のような関係となる。また、γはＳＳ時の強度を変更するための係数である。

【0114】

Ｚ＝Ｙ_１－γＮ_１ …（２２）
Ｚ＝Ｙ_２－γＮ_２ …（２３）

【0115】

以上のように、収音処理部１２Ａは、周波数ごとに、各マイクロホンアレイについていずれかのマイクロホンの入力信号を選択する選択処理を行い、選択結果に基づいて目的エリア音抽出信号Ｚ（ｎ）を取得する。具体的には、収音処理部１２Ａは、周波数ごとに、（１４）式、（１５）式により、目的方向音抽出信号Ｙ_１、Ｙ_２を取得し、取得した目的方向音抽出信号Ｙ_１、Ｙ_２を用いて（２２）式又は（２３）式により目的エリア音抽出信号Ｚを取得する処理を行う。なお、ここでは、上記のような処理により収音処理部１２Ａが、目的方向音抽出信号Ｙ_１、Ｙ_２に基づいて目的エリア音抽出信号Ｚを取得する例について示したが、上記の（１４）式、（１５）式のように求めたＹ_１、Ｙ_２に基づいた処理であれば他の処理に置き換えるようにしてもよい。

【0116】

（Ｂ－２）第２の実施形態の効果
この実施形態によれば、第１の実施形態と比較して以下のような効果を奏することができる。

【0117】

第２の実施形態の収音装置１０Ａでは、２つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２）の入力信号に基づいたエリア収音処理により、目的エリアＡを音源とする目的エリア音抽出信号Ｚ（ｎ）を取得することができる。

【0118】

また、第２の実施形態の収音装置１０Ａでは、第１の実施形態と同様に、周波数ごとに各マイクロホンアレイについていずれかのマイクロホンの入力信号を選択する選択処理を行い、選択結果に基づいて目的エリア音抽出信号Ｚ（ｎ）を取得する。これにより、この実施形態の収音装置１０Ａにおいても、第１の実施形態と同様に従来よりも収音結果における反射音等の影響を低減することができる。

【0119】

本願発明者は、第２の実施形態の収音装置１０Ａの構成についてもシミュレーション（以下、「第２の本シミュレーション」と呼ぶ）を行うことにより、この実施形態における収音装置１０Ａの効果（従来よりも収音結果における反射音の影響等を低減することができるという特有な効果）を奏することを確認した。

【0120】

以下、第２の本シミュレーションにおける条件とその結果について説明する。

【0121】

図１６、図１７は、第２の本シミュレーションにおける環境モデル（以下、「第２のシミュレーション用環境モデル」と呼ぶ）について示した説明図である。

【0122】

第２の本シミュレーションでは、図１６、図１７のような第２のシミュレーション用環境モデルにおいてマイクロホンアレイＭＡ１、ＭＡ２の各マイクロホンＭ１、Ｍ２で捕捉される音響信号を取得（コンピュータ上のシミュレーションにより取得）し、さらに取得した音響信号を、実際に構築（同様にコンピュータ上で構築）した収音装置１０Ａに入力して結果を評価した。また、第２の本シミュレーションでは、第１の本シミュレーションと同様にＰｙＲｏｏｍＡｃｏｕｓｔｉｃｓを用いて、図１６、図１７のような第２のシミュレーション用環境モデルを設定してインパルス応答を取得し、取得したインパルス応答をドライソース信号（目的エリア音又は指向性雑音（妨害音）のサンプルとなるドライソース信号）に畳み込むことで、各観測信号Ｘ_１１、Ｘ_１２、Ｘ_２１、Ｘ_２２を得た。

【0123】

第２の本シミュレーションでは、目的音源及び指向性雑音のドライソース信号として、第１の本シミュレーションと同様のサンプルを適用した。

【0124】

図１６、図１７に示す第２のシミュレーション用環境モデルでは、第１の本シミュレーションと同様にマイクロホンアレイＭＡ１、ＭＡ２、目的音源の位置ＰＯ及び指向性雑音の音源の位置ＰＩは全て床面から高さ１５ｃｍの平面上に存在するものとする。

【0125】

そして、第２のシミュレーション用環境モデルでは複数の条件下でのシミュレーションを行うが、マイクロホンアレイＭＡ１、ＭＡ２と、目的音源の位置ＰＯと、指向性雑音の位置ＰＩとの相対的な位置関係は図１６に示す関係で統一されているものとする。図１６では、マイクロホンアレイＭＡ１、ＭＡ２の中心位置（マイクロホンＭ１、Ｍ２の間の中点）を、それぞれＰＭ１、ＰＭ２としている。そして、図１６では、マイクロホンアレイＭＡ１、ＭＡ２の位置ＰＭ１、ＰＭ２の間の中間点（中点）の位置をＰＣとしている。また、図１６に示すように、マイクロホンアレイＭＡ１、ＭＡ２の中間位置ＰＣから目的音源の位置ＰＯへの方向と、マイクロホンアレイＭＡ１、ＭＡ２の中心位置ＰＭ１、ＰＭ２の間を結んだ線とは直交する関係にあるものとする。さらに、図１６に示すように、マイクロホンアレイＭＡ１、ＭＡ２の正面方向（指向性）は目的音源の位置ＰＯに向けられているものとする。さらにまた、図１６に示すように、マイクロホンアレイＭＡ１、ＭＡ２の位置ＰＭ１、ＰＭ２の間の距離は０．６ｍ（０．３ｍ＋０．３ｍ）であるものとする。また、図１６に示すように、マイクロホンアレイＭＡ１は位置ＰＣの左方向に配置されており、マイクロホンアレイＭＡ２は位置ＰＣの右方向に配置されている。さらに、図１６に示すように、マイクロホンアレイＭＡ１、ＭＡ２の中間位置ＰＣから奥側に０．３ｍ離れた位置に目的音源の位置ＰＯが配置され、目的音源の位置ＰＯから右側に１．０ｍ離れた位置に指向性雑音の位置ＰＩが配置されている。さらにまた、第２のシミュレーション用環境モデルでは、各マイクロホンアレイＭＡ１、ＭＡ２において、マイクロホンＭ１、Ｍ２の間の距離は３ｃｍであるものとする。

【0126】

第２の本シミュレーションでは、図１７に示すように、第１の本シミュレーションと同様のシミュレーション用部屋モデルが用意されているものとする。

【0127】

第２の本シミュレーションでは、図１７に示すようなシミュレーション用部屋モデル内の複数の位置にマイクロホンアレイＭＡ及び各音源の位置（目的音源の位置ＰＯ及び指向性雑音の位置ＰＩ）を配置して目的方向収音処理を行った。具体的には、図１７に示すように、シミュレーション用部屋モデルの中で、マイクロホンアレイＭＡ１、ＭＡ２の中間位置ＰＣを、中央の位置ＰＣ＿Ｄ、中央奥側の位置ＰＣ＿Ｆ、中央手前側の位置ＰＣ＿Ｂ、左側手前の位置ＰＣ＿Ａ、左側の位置ＰＣ＿Ｃ及び左奥側の位置ＰＣ＿Ｅの６か所に変化させて目的方向収音処理を行った。具体的には、図１７に示すように、位置ＰＣ＿ＤからＸ／３［ｍ］左側に離れたところに位置ＰＣ＿Ｃを配置し、位置ＰＣ＿ＤからＹ／３［ｍ］手前側に離れたところに位置ＰＣ＿Ｂを配置し、位置ＰＣ＿ＤからＹ／３［ｍ］奥側に離れたところに位置ＰＣ＿Ｆを配置し、位置ＰＣ＿ＣからＹ／３［ｍ］手前側に離れたところに位置ＰＣ＿Ａを配置し、位置ＰＣ＿ＣからＹ／３［ｍ］奥側に離れたところに位置ＰＣ＿Ｅを配置するものとする。図１７では、位置ＰＣ＿Ａ～位置ＰＣ＿Ｆのそれぞれに対応する目的音源の位置をＰＯ＿Ａ～ＰＯ＿Ｆとして図示している。なお、図１７では、図示を簡易とするため、マイクロホンアレイＭＡの各位置ＰＣ＿Ａ～ＰＣ＿Ｆのそれぞれに応じて、指向性雑音の位置ＰＩも変化するが、指向性雑音の各位置については図示を省略している。

【0128】

また、第２の本シミュレーションでは、第１の本シミュレーションと同様に各シミュレーション用部屋モデルについて、壁の吸音率を０．３、０．６、０．９の３パターンに変化させて目的方向収音処理を行った。さらに、第２の本シミュレーションでは、第１の本シミュレーションと同様に各シミュレーション用部屋モデルにおいて、壁面での最大反射階数を３０回とした。

【0129】

第２の本シミュレーションでは、第１の本シミュレーションと同様に、シミュレーション用部屋モデルのパターンが３６パターン、ドライソース信号の組合せパターンが７２パターン存在するので、シミュレーションの条件（シミュレーション用部屋モデルとドライソース信号の組合せにより定まる条件）が計２５９２パターン（３６×７２＝２５９２）存在する。

【0130】

第２の本シミュレーションでは、上記の２５９２パターンの各条件について、第１の本シミュレーションと同様の手法（ｔ検定による音切れ評価指標）を用いて評価した。

【0131】

図１８は、従来の収音処理結果とこの実施形態の収音処理結果のそれぞれの再現率を算出し、上記のｔ検定の分析ツールにそれぞれの再現率のデータを入力して得られた結果について示した図である。

【0132】

図１９は、従来の収音処理結果と本実施形態の収音処理結果との間の「再現率の改善量」の分布（改善量ごとのデータ数）について示したヒストグラムである。

【0133】

ここで、（１３）式に、Ｓ_１ ^２＝０．０５４７２１９９５、Ｓ_２ ^２＝０．０１３７０８３０８、ｎ_１＝ｎ_２＝２５９２のように第２の本シミュレーションにおけるパラメータを代入すると、自由度ｄｆ＝３７４５（小数点以下は四捨五入）という結果を得ることができる。

【0134】

ここで、図１８に示すｔ検定の結果を参照すると、本実施形態の収音処理結果では、従来の収音処理結果と比較して、再現率が平均して０．１５程度向上しており、かつ、「ｔ（４７４８）＝２９．７」、「ｐ＜０．０１」となっている。このことから、この実施形態の収音処理結果では、従来の収音処理結果と比較して有意差があることがわかる。つまり、第２の本シミュレーションの結果から、この実施形態のような複数マイクロホンアレイ（例えば、２マイクロホンアレイ）の構成の収音処理結果では、従来の収音処理結果と比較して、明らかに音質（音切れ）が改善していることが確認できた。

【0135】

（Ｃ）第３の実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の第３の実施形態を図面を参照しながら詳述する。

【0136】

（Ｃ－１）第３の実施形態の構成及び動作
図２０は、この実施形態に係る収音装置１０Ｂの機能的構成を示すブロック図である。

【0137】

第２の実施形態の収音装置１０Ａでは、２つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２）の入力信号に基づいて、目的エリアＡを音源とする音をエリア収音処理する構成となっているが、第３の実施形態の収音装置１０Ｂでは、３つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２、ＭＡ３）の入力信号に基づいて、目的エリアＡを音源とする音をエリア収音処理する構成となっている。

【0138】

マイクロホンアレイＭＡ１～ＭＡ３は、目的エリアＡが存在する空間の任意の場所に配置される。目的エリアＡに対するマイクロホンアレイＭＡ１～ＭＡ３の位置は、指向性が目的エリアＡでのみ重なればどこでも良い。また、この実施形態では、各マイクロホンアレイＭＡに、音響信号を収音する２つのマイクロホンＭ（Ｍ１、Ｍ２）が配置されるものとする。

【0139】

第３の実施形態の収音装置１０Ｂでは、データ入力部１１Ａ、収音処理部１２Ａが、データ入力部１１Ｂ、収音処理部１２Ｂに置き換わっている点で第２の実施形態と異なっている。以下、第３の実施形態について第２の実施形態との差異を説明する。

【0140】

データ入力部１１Ｂは、各マイクロホンアレイＭＡ１～ＭＡ３で収音した音響信号をアナログ信号からディジタル信号に変換する。

【0141】

この実施形態では、マイクロホンアレイＭＡ１を構成するマイクロホンＭ１、Ｍ２の入力信号をそれぞれＸ_１１（ｎ）、Ｘ_１２（ｎ）と表し、マイクロホンアレイＭＡ２を構成するマイクロホンＭ１、Ｍ２の入力信号をそれぞれＸ_２１（ｎ）、Ｘ_２２（ｎ）と表し、マイクロホンアレイＭＡ３を構成するマイクロホンＭ１、Ｍ２の入力信号をそれぞれＸ_３１（ｎ）、Ｘ_３２（ｎ）と表すものとする。また、この実施形態では、マイクロホンアレイＭＡ１、ＭＡ２、ＭＡ３から目的エリアＡへの目的方向音抽出信号を、それぞれＹ_１、Ｙ_２、Ｙ_３と表すものとする。さらに、この実施形態では、マイクロホンアレイＭＡ１、ＭＡ２、ＭＡ３から見て目的方向以外に存在する非目的音を、それぞれＭ_１、Ｍ_２、Ｍ_３とする。さらにまた、この実施形態では、目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３に含まれる非目的エリア音（雑音）の成分を、それぞれＮ_１、Ｎ_２、Ｎ_３とする。

【0142】

収音処理部１２Ｂは、マイクロホンアレイＭＡ１～ＭＡ３の入力信号から、目的エリアＡを音源とする目的エリア音を収音するエリア収音処理を行って目的エリア音抽出信号Ｚ（ｎ）を取得し、出力部１３に供給する。

【0143】

出力部１３は、供給された目的エリア音抽出信号Ｚ（ｎ）を所定の方式／形式で出力信号として出力する。

【0144】

次に、収音処理部１２Ｂによるエリア収音処理の詳細について説明する。

【0145】

収音処理部１２Ｂは、まず各マイクロホンアレイＭＡ１～ＭＡ３から目的エリアＡへの目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３を、第２の実施形態と同様の処理により抽出するものとする。そうすると、目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３は、（２４）式、（２５）式、（２６）式のようになる。（２４）式において、ｍａｘ（Ｘ_１１，Ｘ_１２）は、Ｘ_１１（ｎ）又はＸ_１２（ｎ）のうち大きい方を選択することを意味している。また、（２５）式において、ｍａｘ（Ｘ_２１，Ｘ_２２）は、Ｘ_２１（ｎ）又はＸ_２２（ｎ）のうち大きい方を選択することを意味している。さらに、（２６）式において、ｍａｘ（Ｘ_３１，Ｘ_３２）は、Ｘ_３１（ｎ）又はＸ_３２（ｎ）のうち大きい方を選択することを意味している。

【0146】

Ｙ_１＝ｍａｘ（Ｘ_１１，Ｘ_１２）－βＭ_１ …（２４）
Ｙ_２＝ｍａｘ（Ｘ_２１，Ｘ_２２）－βＭ_２ …（２５）
Ｙ_３＝ｍａｘ（Ｘ_３１，Ｘ_３２）－βＭ_３ …（２６）

【0147】

ここで、（２７）式、（２８）式、（２９）式に示すようにＸ_１、Ｘ_２、Ｘ_３を定めると、Ｙ_１、Ｙ_２、Ｙ_３は、それぞれ（３０）式、（３１）式、（３２）式のように示すことができる。

【0148】

Ｘ_１＝ｍａｘ（Ｘ_１１，Ｘ_１２） …（２７）
Ｘ_２＝ｍａｘ（Ｘ_２１，Ｘ_２２） …（２８）
Ｘ_３＝ｍａｘ（Ｘ_３１，Ｘ_３２） …（２９）
Ｙ_１＝Ｘ_１－βＭ_１ …（３０）
Ｙ_２＝Ｘ_２－βＭ_２ …（３１）
Ｙ_３＝Ｘ_３－βＭ_３ …（３２）

【0149】

図２１は、第３の実施形態における各信号の成分をベン図（論理式）の形式で表した図である。

【0150】

図２１（ａ）では、目的方向音抽出信号Ｙ_１、Ｙ_２で重なる部分の音の成分をＺ_１２としている。Ｚ_１２は、マイクロホンアレイＭＡ１、ＭＡ２の指向性が重なる部分の領域を音源とする音の成分であるといえる。

【0151】

そして、図２１（ｂ）に示すように、Ｚ_１２と目的方向音抽出信号Ｙ_３で重なる部分の音が、求めるべき目的エリア音抽出信号Ｚとなる。また、図２１（ｂ）に示すように、Ｚ_１２と目的方向音抽出信号Ｙ_３で重なる部分は、目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３で重なる部分の音（すなわち、マイクロホンアレイＭＡ１～ＭＡ３の全ての指向性が重なる部分の領域を音源とする音）と一致する。

【0152】

そうすると、非目的エリア音Ｎ_１、Ｎ_２は、それぞれ（３３）式、（３４）式のように示すことができる。また、Ｚ_１２は、以下の（３５）式又は（３６）式のように示すことができる。さらに、（３７）式に示すように目的方向音抽出信号Ｙ_３とＺ_１２を用いることで非目的エリア音Ｎ_３が求まり、（３８）式に示すように目的エリア音抽出信号Ｚを求めることができる。

【0153】

Ｎ_１＝Ｙ_１－αＹ_２ …（３３）
Ｎ_２＝Ｙ_２－αＹ_１ …（３４）
Ｚ_１２＝Ｙ_１－γＮ_１ …（３５）
Ｚ_１２＝Ｙ_２－γＮ_２ …（３６）
Ｎ_３＝Ｙ_３－αＺ_１２ …（３７）
Ｚ＝Ｙ_３－γＮ_３…（３８）

【0154】

以上のように、収音処理部１２Ｂは、周波数ごとに、各マイクロホンアレイについていずれかのマイクロホンの入力信号を選択する選択処理を行い、選択結果に基づいて目的エリア音抽出信号Ｚ（ｎ）を取得する。具体的には、収音処理部１２Ｂは、周波数ごとに、（２４）式、（２５）式、（２６）式により、目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３を取得し、取得した目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３を用いて（３８）式等により目的エリア音抽出信号Ｚ（ｎ）を取得する処理を行う。なお、ここでは、上記のような処理により収音処理部１２Ｂが、目的方向音抽出信号Ｙ_１、Ｙ_２、Ｙ_３に基づいて目的エリア音抽出信号Ｚを取得する例について示したが、上記の（２４）式、（２５）式、（２６）式のように求めたＹ_１、Ｙ_２、Ｙ_３に基づいた処理であれば他の処理に置き換えるようにしてもよい。

【0155】

（Ｃ－２）第３の実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。

【0156】

第３の実施形態の収音装置１０Ｂでは、３つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２、ＭＡ３）の入力信号に基づいて、目的エリアＡを音源とする目的エリア音抽出信号Ｚ（ｎ）を取得することができる。また、上記の第１及び第２の本シミュレーションの結果から、３以上のマイクロホンアレイを用いたエリア収音処理を行う第３の実施形態の収音装置１０Ｂにおいても、第２の実施形態と同様に従来の収音処理結果と比較して、音質（音切れ）が改善するという効果を奏することができる。

【0157】

（Ｄ）第４の実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の第４の実施形態を図面を参照しながら詳述する。

【0158】

（Ｄ－１）第４の実施形態の構成及び動作
図２２は、この実施形態に係る収音装置１０Ｃの機能的構成を示すブロック図である。

【0159】

第２の実施形態の収音装置１０Ａでは、４つのマイクロホンを用いて２つのマイクロホンアレイＭＡ１、ＭＡ２を構成していた。これに対して、第４の実施形態では、図２２に示すように、３つのマイクロホンＭ１、Ｍ２、Ｍ３を用いて２つの２ｃｈマイクロホンアレイＭＡ１、ＭＡ２が構成されている。図２２に示すように、第４の実施形態では、マイクロホンＭ１、Ｍ２を用いて第１のマイクロホンアレイＭＡ１が構成されており、マイクロホンＭ２、Ｍ３を用いて第２のマイクロホンアレイＭＡ２が構成されている。つまり、第４の実施形態では、２つのマイクロホンアレイＭＡ１、ＭＡ２でマイクロホンＭ２が共通して用いられる構成となっている。

【0160】

第４の実施形態の収音装置１０Ｃでは、データ入力部１１Ａ、収音処理部１２Ａが、データ入力部１１Ｃ、収音処理部１２Ｃに置き換わっている点で第２の実施形態と異なっている。以下、第４の実施形態について第２の実施形態との差異を説明する。

【0161】

データ入力部１１Ｃは、２つのマイクロホンアレイＭＡ１、ＭＡ２を構成する３つのマイクロホンＭ１～Ｍ３で収音した音響信号をアナログ信号からディジタル信号に変換する。以下では、マイクロホンＭ１、Ｍ２、Ｍ３の入力信号をそれぞれＸ_１０１（ｎ）、Ｘ_１０２（ｎ）、Ｘ_１０３（ｎ）と表すものとする。そうすると、この実施形態では、マイクロホンアレイＭＡ１からの入力信号がＸ_１０１（ｎ）、Ｘ_１０２（ｎ）となり、マイクロホンアレイＭＡ２からの入力信号がＸ_１０２（ｎ）、Ｘ_１０３（ｎ）となる。

【0162】

収音処理部１２Ｃは、マイクロホンアレイＭＡ１、ＭＡ２の入力信号（Ｘ_１０１（ｎ）、Ｘ_１０２（ｎ）、Ｘ_１０３（ｎ））から、目的エリアＡを音源とする目的エリア音抽出信号Ｚ（ｎ）を収音するエリア収音処理を行って目的エリア音抽出信号Ｚ（ｎ）を取得し、出力部１３に供給する。上記の通り、第４の実施形態では、マイクロホンアレイＭＡ１からの入力信号がＸ_１０１（ｎ）、Ｘ_１０２（ｎ）となり、マイクロホンアレイＭＡ２からの入力信号がＸ_１０２（ｎ）、Ｘ_１０３（ｎ）となること以外は第２の実施形態と同様の処理により目的エリア音抽出信号Ｚ（ｎ）を取得できるので詳しい説明を省略する。

【0163】

（Ｄ－２）第４の実施形態の効果
第４の実施形態の収音装置１０Ｃでは、３つのマイクロホンＭ１～Ｍ３により構成された２つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２）の入力信号に基づいて、目的エリアＡを音源とする目的エリア音抽出信号Ｚ（ｎ）を取得することができる。つまり、第４の実施形態では、第２の実施形態よりも少ない総数のマイクロホンを用いて同様の効果を奏するエリア収音処理を実現することができる。

【0164】

（Ｅ）他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。

【0165】

（Ｅ－１）上記の実施形態において収音処理部１２は、周波数毎に、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分を比較していずれかを選択する選択処理を行い、選択した入力信号の成分から、非目的音の成分（βＭ）を差し引く（減算する）ことにより、目的方向音抽出信号Ｙを取得する。ここで、例えば、ある周波数ｆｎにおいて、非目的音の影響から入力信号Ｘ_１の成分と入力信号Ｘ_２の成分の大小関係が頻繁に入れ替わるような場合、目的方向収音処理の音質が劣化する可能性がある。そのため、収音処理部１２において、周波数ごとに、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分の選択結果が切り替わる頻度が短くなり過ぎないように制御してもよい。例えば、収音処理部１２において、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分の選択結果が切り替わる頻度の最低期間を設定するようにしてもよい。また、例えば、収音処理部１２において、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分について、直近の一定期間内のサンプル（所定数のサンプル）の平均又は加重平均を比較し、その比較結果に基づいて選択する入力信号（基準となる選択信号）を決定するようにしてもよい。さらにまた、例えば、収音処理部１２において、入力信号Ｘ_１の成分と入力信号Ｘ_２の成分とのそれぞれの直近の一定期間内のサンプル（所定数のサンプル）について時定数フィルタや忘却係数を用いた計算結果（加算結果）を比較し、その比較結果に基づいて選択する入力信号（基準となる選択信号）を決定するようにしてもよい。また、例えば、収音処理部１２において、周波数ごとに、選択する入力信号が切り替わる際の基準を非対称に設定するようにしてもよい。例えば、収音処理部１２において、入力信号Ｘ_１の成分が選択されているときに、単純に入力信号Ｘ_２の値が入力信号Ｘ_１の値を超えただけでは選択する入力信号の切替をおこなわずに、入力信号Ｘ_２の値が入力信号Ｘ_１の値を一定以上超えた場合（例えば、入力信号Ｘ_２の値が入力信号Ｘ_１の１．１倍以上となった場合）に、選択する入力信号をＸ_１からＸ_２に切り替えるようにしてもよい。

【0166】

（Ｅ－２）上記の各実施形態において、アナログＭＥＭＳマイクの代わりにディジタルＭＥＭＳマイクを用いるようにして、ディジタルＭＥＭＳマイクからのディジタル信号を入力するようにしても良い。その場合、データ入力部１１にはインタフェース変換やデシメーションフィルタの機能を具備するようにしても良い。デシメーションフィルタはサンプリング周波数を間引くとともに、音声帯域のみを通過させる低域透過フィルタである。

【0167】

（Ｅ－３）第４の実施形態では、３つのマイクロホンアレイを用いてエリア収音する構成について説明したが、４つ以上のマイクロホンアレイを用いてエリア収音する構成としてもよい。

【符号の説明】

【0168】

１０…収音装置、１１…データ入力部、１２…収音処理部、１３…出力部、ＭＡ…マイクロホンアレイ、Ｍ１、Ｍ２…マイクロホン。

【図1】