IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イギリス国の特許一覧

特表2024-515820音声情報の指向性処理のための方法およびシステム
<>
  • 特表-音声情報の指向性処理のための方法およびシステム 図1
  • 特表-音声情報の指向性処理のための方法およびシステム 図2
  • 特表-音声情報の指向性処理のための方法およびシステム 図3
  • 特表-音声情報の指向性処理のための方法およびシステム 図4
  • 特表-音声情報の指向性処理のための方法およびシステム 図5
  • 特表-音声情報の指向性処理のための方法およびシステム 図6
  • 特表-音声情報の指向性処理のための方法およびシステム 図7
  • 特表-音声情報の指向性処理のための方法およびシステム 図8
  • 特表-音声情報の指向性処理のための方法およびシステム 図9
  • 特表-音声情報の指向性処理のための方法およびシステム 図10
  • 特表-音声情報の指向性処理のための方法およびシステム 図11
  • 特表-音声情報の指向性処理のための方法およびシステム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-10
(54)【発明の名称】音声情報の指向性処理のための方法およびシステム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20240403BHJP
   H04R 1/40 20060101ALI20240403BHJP
【FI】
H04R3/00 320
H04R1/40 320A
H04R3/00 310
H04R1/40 310
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023566461
(86)(22)【出願日】2022-04-20
(85)【翻訳文提出日】2023-12-13
(86)【国際出願番号】 IB2022053711
(87)【国際公開番号】W WO2022229797
(87)【国際公開日】2022-11-03
(31)【優先権主張番号】2106094.2
(32)【優先日】2021-04-29
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
(71)【出願人】
【識別番号】390040604
【氏名又は名称】イギリス国
【氏名又は名称原語表記】THE SECRETARY OF STATE FOR DEFENCE IN HER BRITANNIC MAJESTY’S GOVERNMENT OF THE UNETED KINGDOM OF GREAT BRITAIN AND NORTHERN IRELAND
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭
(74)【代理人】
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【弁理士】
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【弁理士】
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100141553
【弁理士】
【氏名又は名称】鈴木 信彦
(72)【発明者】
【氏名】シングルトン グレゴリー
(72)【発明者】
【氏名】グラッソン フィリップ ヘンリー
【テーマコード(参考)】
5D018
5D220
【Fターム(参考)】
5D018AF22
5D018BB22
5D220AA16
5D220AB06
5D220BA06
5D220BC05
(57)【要約】
音声情報がマイクロフォンアレイから受け取られるか、またはスピーカアレイに適用される、デジタルシグナルプロセッサにおいて音声情報を処理するための方法およびシステムが提供される。デジタルシグナルプロセッサは、アレイに指向性向上と、ビームフォーミングされた信号の主ビームから離れた、より一様な信号除去とをもたらすように、同一線上にない2対のマイクロフォン出力またはスピーカ入力に二重遅延減算ビームフォーミングアルゴリズムを適用する。これは、複数のアレイをテッセレートしてマクロアレイにすることと、アレイの応答を重ね合わせることとによってさらに向上させることができる。
【特許請求の範囲】
【請求項1】
マイクロフォンアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための方法であって、
マイクロフォンアレイの各マイクロフォンから音声信号を受信することであって、前記マイクロフォンアレイが、互いに同一線上にない平行な少なくとも2対のマイクロフォンを含み、第1の対のマイクロフォンが第1のマイクロフォンと第2のマイクロフォンとを含み、第2の対のマイクロフォンが第3のマイクロフォンと第4のマイクロフォンとを含み、各マイクロフォンが平面上に配置されている、各マイクロフォンから音声信号を受信することと、
前記第2のマイクロフォンからの前記音声信号に第1の時間遅延を加え、前記第1の対のマイクロフォンに関連付けられた音声信号を判定するために前記第1のマイクロフォンからの前記音声信号から前記第2のマイクロフォンの前記遅延音声信号を減算することと、
前記第4のマイクロフォンからの前記音声信号に第2の時間遅延を加え、前記第2の対のマイクロフォンに関連付けられた音声信号を判定するために前記第3のマイクロフォンからの前記音声信号から前記第4のマイクロフォンの前記遅延音声信号を減算することと、
前記第2の対のマイクロフォンに関連付けられた前記音声信号に第3の時間遅延を加え、前記マイクロフォンアレイに関連付けられた音声信号を判定するために前記第1の対のマイクロフォンに関連付けられた前記音声信号から前記第2の対のマイクロフォンに関連付けられた前記遅延音声信号を減算することとを含み、
前記第1、第2、および第3の時間遅延が、前記マイクロフォンアレイに関連付けられた前記音声信号の指向性を制御するように構成されている、方法。
【請求項2】
前記第1の時間遅延が前記第1のマイクロフォンと前記第2のマイクロフォンとの間の相対距離に基づいて設定され、前記第2の時間遅延が前記第3のマイクロフォンと前記第4のマイクロフォンとの間の相対距離に基づいて設定され、前記第3の時間遅延が前記第1の対のマイクロフォンと前記第2の対のマイクロフォンとの間の相対距離に基づいて設定される、請求項1に記載の方法。
【請求項3】
1対のマイクロフォンにおけるマイクロフォン間の距離が前記少なくとも2対のマイクロフォン全体にわたり一様であり、前記第1の時間遅延と前記第2の時間遅延とが等しい、請求項1または2に記載の方法。
【請求項4】
前記マイクロフォンアレイが2対のマイクロフォンを含み、前記第1、第2、第3および第4のマイクロフォンが平行四辺形の頂点に配置されている、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記マイクロフォンアレイに関連付けられた前記音声信号に周波数等化フィルタをかけることをさらに含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記マイクロフォンアレイの各マイクロフォンが全方向性極性パターンを有する、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記マイクロフォンアレイに関連付けられた判定された前記音声信号が、前記第1、第2および第3の時間遅延の値に基づく所与の方向に対応し、前記方法が、
前記第1、第2および第3の時間遅延を反復的に調整し、反復的に調整された前記第1、第2および第3の時間遅延に関連付けられた複数の対応する音声信号を判定することと、
所望の音声シグネチャまたは音源に最も近く対応する方向を判定するために前記複数の対応する音声信号を比較することとをさらに含む、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記平面上に配置された1つまたは複数の対応するさらなるマイクロフォンアレイに関連付けられた1つまたは複数のそれぞれの音声信号を判定することと、ビームフォーミングアルゴリズムを使用して前記マイクロフォンアレイのアレイに関連付けられた音声信号を判定するために前記マイクロフォンアレイに関連付けられた各音声信号を結合することとをさらに含む、請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記ビームフォーミングアルゴリズムが遅延和ビームフォーミングアルゴリズムである、請求項8に記載の方法。
【請求項10】
前記複数のマイクロフォンアレイが、少なくとも1つのマイクロフォンが2つの隣接マイクロフォンアレイ間で共用されるように互いにテッセレートされている、請求項8または9に記載の方法。
【請求項11】
マイクロフォンアレイ用の音声情報の指向性処理のための装置であって、
マイクロフォンアレイが互いに同一線上にない平行な少なくとも2対のマイクロフォンを含み、第1の対のマイクロフォンが第1のマイクロフォンと第2のマイクロフォンとを含み、第2の対のマイクロフォンが第3のマイクロフォンと第4のマイクロフォンとを含み、各マイクロフォンが平面上に配置されている、前記マイクロフォンアレイの各マイクロフォンから音声信号を受信するように構成された1つまたは複数の入力部と、
前記第2のマイクロフォンからの前記音声信号に第1の時間遅延を加え、前記第1の対のマイクロフォンに関連付けられた音声信号を判定するために前記第1のマイクロフォンからの前記音声信号から前記第2のマイクロフォンの前記遅延音声信号を減算し、前記第4のマイクロフォンからの前記音声信号に第2の時間遅延を加え、前記第2の対のマイクロフォンに関連付けられた音声信号を判定するために前記第3のマイクロフォンからの前記音声信号から前記第4のマイクロフォンの前記遅延音声信号を減算するように構成され、前記第2の対のマイクロフォンに関連付けられた前記音声信号に第3の時間遅延を加え、前記マイクロフォンアレイに関連付けられた音声信号を判定するために前記第1の対のマイクロフォンに関連付けられた前記音声信号から前記第2の対のマイクロフォンに関連付けられた前記遅延音声信号を減算するように構成された、デジタルシグナルプロセッサとを含み、
前記第1、第2および第3の時間遅延が前記マイクロフォンアレイに関連付けられた前記音声信号の指向性を制御するように構成されている、装置。
【請求項12】
前記第1の時間遅延が前記第1のマイクロフォンと前記第2のマイクロフォンとの間の相対距離に基づいて設定され、前記第2の時間遅延が前記第3のマイクロフォンと前記第4のマイクロフォンとの間の相対距離に基づいて設定され、前記第3の時間遅延が前記第1の対のマイクロフォンと前記第2の対のマイクロフォンとの間の相対距離に基づいて設定される、請求項11に記載の装置。
【請求項13】
1対のマイクロフォンにおけるマイクロフォン間の距離が前記少なくとも2対のマイクロフォン全体にわたり一様であり、前記第1の時間遅延と前記第2の時間遅延とが等しい、請求項11または12に記載の装置。
【請求項14】
前記マイクロフォンアレイが2対のマイクロフォンを含み、前記第1、第2、第3および第4のマイクロフォンが平行四辺形の頂点に配置されている、請求項11~13のいずれか1項に記載の装置。
【請求項15】
前記デジタルシグナルプロセッサが、前記マイクロフォンアレイに関連付けられた前記音声信号に周波数等化フィルタをかけるようにさらに構成されている、請求項11~14のいずれか1項に記載の装置。
【請求項16】
前記受信音声信号が、全方向性極性パターンを有する前記マイクロフォンアレイのマイクロフォンに対応する、請求項11~15のいずれか1項に記載の装置。
【請求項17】
前記デジタルシグナルプロセッサが、前記第1、第2および第3の時間遅延の値に基づいて、前記マイクロフォンアレイに関連付けられた前記音声信号が所与の方向に対応すると判定するようにさらに構成され、前記デジタルシグナルプロセッサが、前記第1、第2および第3の時間遅延を反復的に調整し、反復的に調整された前記第1、第2および第3の時間遅延に関連付けられた複数の対応する音声信号を判定するように構成され、さらには、所望の音声シグネチャまたは音源に最も近く対応する方向を判定するために前記複数の対応する音声信号を比較するように構成されている、請求項11~16のいずれか1項に記載の装置。
【請求項18】
前記デジタルシグナルプロセッサが、前記平面上に配置された1つまたは複数の対応するさらなるマイクロフォンアレイに関連付けられた1つまたは複数のそれぞれの音声信号を判定し、ビームフォーミングアルゴリズムを使用して前記マイクロフォンアレイのアレイに関連付けられた音声信号を判定するために前記マイクロフォンアレイに関連付けられた各音声信号を結合するようにさらに構成されている、請求項11~17のいずれか1項に記載の装置。
【請求項19】
前記ビームフォーミングアルゴリズムが遅延和ビームフォーミングアルゴリズムである、請求項18に記載の装置。
【請求項20】
前記複数のマイクロフォンアレイが、少なくとも1つのマイクロフォンが2つの隣接マイクロフォンアレイ間で共用されるように互いにテッセレートされている、請求項18または19に記載の装置。
【請求項21】
マイクロフォンアレイ用の音声情報の指向性処理のためのシステムであって、
互いに同一線上にない平行な少なくとも2対のマイクロフォンを含むマイクロフォンアレイであって、第1の対のマイクロフォンが第1のマイクロフォンと第2のマイクロフォンとを含み、第2の対のマイクロフォンが第3のマイクロフォンと第4のマイクロフォンとを含み、各マイクロフォンが平面上に配置されている、前記マイクロフォンアレイと、
請求項11~20のいずれか1項に記載の装置とを含む、システム。
【請求項22】
スピーカアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための方法であって、
前記スピーカアレイによって送信される音声信号を受信することと、
スピーカアレイの各スピーカに印加するそれぞれの音声信号を判定することとを含み、前記スピーカアレイが互いに同一線上にない平行な少なくとも2対のスピーカを含み、第1の対のスピーカが第1のスピーカと第2のスピーカとを含み、第2の対のスピーカが第3のスピーカと第4のスピーカとを含み、各スピーカが平面上に配置され、各スピーカに印加する前記それぞれの音声信号を判定することが、
前記第1の対のスピーカに関連付けられた前記音声信号が前記スピーカアレイによって送信される前記音声信号であると判定することと、
前記第2の対のスピーカに関連付けられた音声信号を判定するために前記スピーカアレイによって送信される前記音声信号に、第1の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、
前記第1のスピーカに印加される前記音声信号が前記第1の対のスピーカに関連付けられた前記音声信号であると判定することと、
前記第2のスピーカに印加される前記音声信号を判定するために前記第1の対のスピーカに関連付けられた前記音声信号に、第2の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、
前記第3のスピーカに印加される前記音声信号が前記第2の対のスピーカに関連付けられた前記音声信号であると判定することと、
前記第4のスピーカに印加される前記音声信号を判定するために前記第2の対のスピーカに関連付けられた前記音声信号に、第3の時間遅延を使用して、遅延および反転アルゴリズムを適用することとを含み、
前記第1、第2および第3の時間遅延が前記スピーカアレイによって送信される前記音声信号の指向性を制御するように構成されている、方法。
【請求項23】
スピーカアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための装置であって、
前記スピーカアレイが互いに同一線上にない平行な少なくとも2対のスピーカを含み、第1の対のスピーカが第1のスピーカと第2のスピーカとを含み、第2の対のスピーカが第3のスピーカと第4のスピーカとを含み、各スピーカが平面上に配置されている、前記スピーカアレイによって送信される音声信号を受信するように構成された入力部と、
デジタルシグナルプロセッサとを含み、前記デジアルシグナルプロセッサが、
前記第1の対のスピーカに関連付けられた前記音声信号が前記スピーカアレイによって送信される前記音声信号であると判定することと、
前記第2の対のスピーカに関連付けられた音声信号を判定するために前記スピーカアレイによって送信される前記音声信号に、第1の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、
前記第1のスピーカに印加される前記音声信号が前記第1の対のスピーカに関連付けられた前記音声信号であると判定することと、
前記第2のスピーカに印加される前記音声信号を判定するために前記第1の対のスピーカに関連付けられた前記音声信号に、第2の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、
前記第3のスピーカに印加される前記音声信号が前記第2の対のスピーカに関連付けられた前記音声信号であると判定することと、
前記第4のスピーカに印加される前記音声信号を判定するために前記第2の対のスピーカに関連付けられた前記音声信号に、第3の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、
によってスピーカアレイの各スピーカに印加するそれぞれの音声信号を判定するように構成され、
前記第1、第2および第3の時間遅延が前記スピーカアレイによって送信される前記音声信号の指向性を制御するように構成されている、装置。
【請求項24】
前記第1の時間遅延が前記第1のスピーカと前記第2のスピーカとの間の相対距離に基づいて設定され、前記第2の時間遅延が前記第3のスピーカと前記第4のスピーカとの間の相対距離に基づいて設定され、前記第3の時間遅延が前記第1の対のスピーカと前記第2の対のスピーカとの間の相対距離に基づいて設定され、1対のスピーカにおけるスピーカ間の距離が前記少なくとも2対のスピーカ全体にわたり一様であり、前記第1の時間遅延と前記第2の時間遅延とが等しく、前記第1、第2、第3および第4のスピーカが平行四辺形の頂点に配置されている、請求項23に記載の装置。
【請求項25】
前記デジアルシグナルプロセッサが、ビームフォーミングアルゴリズムを使用して、前記平面上に配置された1つまたは複数の対応するさらなるスピーカアレイに関連付けられた1つまたは複数のそれぞれの音声信号を判定するようにさらに構成されている、請求項23または24に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、マイクロフォンアレイまたはスピーカアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための方法および装置に関する。具体的には、本出願は、音声ビームフォーミングに関連する音声信号の処理のための方法および装置を対象とする。
【背景技術】
【0002】
1組のマイクロフォンに音声ビームフォーミングを適用することができ、それにより、比較すると減衰している所与の方向からの音声を、他のすべての方向からの音声に対して相対的に増幅するためにその1組のマイクロフォンの出力が結合される。代わりにスピーカに適用される場合、音声ビームフォーミングは、指向性の高い音声出力を提供するために1組のスピーカを駆動する。それぞれの組をアレイと呼ぶ場合がある。
【0003】
これらの指向性マイクロフォンアレイは「カクテルパーティー効果」の解決策として使用されることがあり、この効果では、雑音環境において人が単一の話者または会話などの特定の音源に集中することが困難な場合があり、音声がまずマイクロフォンにおいて録音されてからたとえば補聴器を介して再生されるかまたは録音を後で再生する場合にはさらに聞き分けることが困難な場合がある。これは1つには、ライブ環境および関連する音声フィルタリングの人間の脳の神経学的処理が失われ、したがって発話またはその他の音源の了解度が著しく低減されることがあるためである。
【0004】
この問題は、たとえば、人の聴覚補助のため、または動物、車両、ドローンまたはその他の航空機などの特定の音声シグネチャに関連付けられることがわかっている対象の位置を検出するため、あるいは緊急救助状況における生命兆候の方向を検出するために、単一の話者または音源を周囲の雑音から区別することができる必要がある、現代生活の多くの分野で出現する。
【0005】
知られている指向性マイクロフォンアレイは、特定の周波数帯で良好な指向性を示すことができるが、知られている方法を使用してこの指向性を低周波数で維持するには、ますます大型となる寸法を有するマイクロフォンアレイを必要とする。たとえば、直径が約2メートルのいくつかのアレイが提案されている。したがって、従来の技術には、マイクロフォンアレイのサイズと、広帯域の可聴周波数にわたる応答および指向性の一様性との間で望ましくないトレードオフがある。
【0006】
ビームフォーミングアルゴリズムの知られている一例は遅延和アルゴリズムであり、このアルゴリズムでは、意図したビームフォーミング方向の信号がすべて同期され、強め合うように互いに加算されるように、(各マイクロフォンから受信されるかまたは各スピーカに印加される)1つまたは複数の音声信号に遅延が付加される。逆に、他の方向の信号は同期されず、弱め合うように加算することによって互いに相殺する傾向がある。これは、高周波数では所望の狭いビームを生じさせる可能性があるが、低周波数のビームは典型的には比較するときわめて広い。これは、アレイが典型的にはこれらの低周波数においてあらゆる方向に(全方向に)感度が等しいことを意味する。
【0007】
低周波数範囲におけるこのような欠点を克服するために、遅延和ビームフォーミングアルゴリズムの従来技術の方法は、ますます大型化するマイクロフォン/スピーカのアレイを使用する。アレイの物理的サイズを大きくすることは、アレイが特定の周波数範囲において感度が高い、意図されたビームの外部の角度に相当するグレーティングローブの数または影響を減らすためにも望ましい。しかし、アレイのこの物理的に大型化したサイズは、当然ながら、製造、可搬性およびそのような技術の実用性にとって望ましくない。
【0008】
ビームフォーミングアルゴリズムの別の例は、1対のマイクロフォンのうちの一方のマイクロフォンに遅延が付加され、次に音声信号が減算される、遅延減算アルゴリズムである。音源がその1対のマイクロフォンを通る軸に対して直角な方向にある場合、音は両方のマイクロフォンに同時に到達することになる。減算の前に音声信号の一方に遅延を加えない場合、マイクロフォンのそれぞれにおいて音源の音声信号が相殺されることになる。音声信号が(相殺されるために)検出されないこの方向は、ヌルと呼ばれ、この方向のマイクロフォン対の応答または感度はゼロになる。軸の反対側にも第2のヌルがあることになる。
【0009】
減算の前に音声信号の1つに遅延を付加することによって、これらのヌル方向がその1対のマイクロフォンを通る軸に直角な方向からずらされる。図1を参照すると、実線矢印は互いに距離dだけ離隔した1対のマイクロフォンAおよびBに進入する音波の到来方向に相当し、角度θは、その1対のマイクロフォンを通る軸に対して相対的な音波の進入角度に相当する。図1に示すように、以下の計算は、音源が、音波の波面が平坦な波面に近くなるほど十分に離れていることに基づいている。この場合、音声信号は時点tにおいてマイクロフォンAに到達し、その後、時点(t+T)においてマイクロフォンBに到達し、ヌル差分方程式は以下のようになる。
【0010】
A(t)-B(t+T)=0 (1)
ここで、Tは以下によって与えられ、
【0011】
【数1】
cは音速であり、または以下のように表すことができる。
【0012】
B(t)-A(t-T)=0 (3)
【0013】
2次元では、両方が軸に対して角度θの2つのヌル方向があることになり、3次元では、これは図2に示すような2θの円錐開口/頂角を有するヌル円錐を形成することになる。これらのヌルから離れた方向から到来する音声信号は相殺されないが、この配置の性質の結果として、対におけるマイクロフォン間の距離より信号の波長がはるかに大きい低周波数に対して感度が低くなる。これに対処するため、ビームフォーミング方向から発している音声信号の平坦な周波数応答を得るためにより低い周波数帯のゲインを上昇させるように、このような遅延減算対の出力にフィルタをかけるのが一般的である。しかし、これはこれらの周波数帯におけるノイズフロアも上昇させ、したがって、このホワイトノイズゲインを適切に設定する際にバランスをとる必要がある。このフィルタを、周波数等化フィルタまたは正規化フィルタと呼ぶことがある。
【0014】
約±110°でヌルを示すように設定された時間遅延を有する遅延減算対の場合について、正規化(上述のように周波数等化フィルタでフィルタリングされた)応答の一例は、図3に示すようになる可能性があり、ここでx軸は意図したビームフォーミング方向からの度数単位のアジマス角を示し、y軸はkHz単位の周波数の対数尺度であり、より明るい領域はその周波数および角度におけるより高いdB感度に対応する。このマイクロフォンの対の音声信号Bdiff(t)は以下のように書くことができる。
【0015】
diff(t)=B(t)-A(t-T1) (4)
【0016】
diff(t)は、式2が成立する場合にゼロ(すなわちヌル)となる。この対は、マルチセンサマイクロフォンとみなすことができ、線状アレイに配置されたマイクロフォンのさらなる対のうちの1つとして使用可能であり、遅延減算ビームフォーミングアルゴリズムに投入されるとみなすことができる。具体的には、1対のマイクロフォンAおよびBが、対ABに関連付けられた音声信号を発生するように遅延減算ビームフォーミングを施されることができ、(AB対と同一線上にある)別の1対のマイクロフォンCおよびDが、対CDに関連付けられた音声信号を発生するように遅延減算ビームフォーミングを施されることができ、その後、ABの音声信号およびCDの音声信号が遅延減算ビームフォーミングを施されることができる。これを、共線二重遅延減算ビームフォーミングアレイと呼ぶ場合がある。
【0017】
マイクロフォンCD対間の距離がマイクロフォン対AB間の距離と等しく設定されている場合、マイクロフォンCD対の音声信号Ddiff(t)は以下のように書き直すことができる。
【0018】
diff(t)=D(t)-C(t-T1) (5)
【0019】
数学的にBdiffとDdiffを二重遅延減算のためのマイクロフォンの新たな対とみなすと、以下の式が与えられる。
【0020】
double-dif(t)=Ddiff(t)-Bdiff(t-T2) (6)
double-diff(t)=D(t)-C(t-T1)-B(t-T2)+A(t-T1-T2) (7)
ここで、T1はAとBとの間およびCとDとの間の音声信号の到着の時間差に相当し、T2はマイクロフォンBとマイクロフォンDとの間の距離に基づくAB対とCD対との間の音声信号の到着の時間差に相当する。
【0021】
これは、図4に示すように図式的に表すことができ、ここでは2つのヌル円錐がある。θ1ヌル円錐はBdiffおよびDdiff音声信号に対応し、遅延T1を調整することによってAB対とCD対のそれぞれにおけるマイクロフォン間の所与の間隔のためにステアリングすることができる。θ2ヌル円錐は、Ddouble-diff音声信号に対応し、遅延T2を調整することによってAB対とCD対の間の所与の間隔のためにステアリングすることができる。
【0022】
2つのヌル円錐を生じさせるように二重遅延減算法の線状マイクロフォンアレイの指向性周波数応答に与える影響は、図5でわかり、ここではヌル円錐が±90°と±150°において示されている。追加のヌルはビームフォーミング角度から離れた角度においてより広い音声信号除去をもたらす。しかし、特により高い周波数において、これら2つのヌル円錐間には依然としてかなりな量の感度があり、これらの技術は遅延和ビームフォーミングアルゴリズムよりもパフォーマンスが悪いことがわかる。
【0023】
マイクロフォンアレイの感度のステアリングの制御性をより高めるための1つの選択肢は、二重遅延減算を使用する線状の向きの2対ではなく、直角な向きとされた2対のゼロ遅延減算マイクロフォン対を使用することである。各対におけるマイクロフォンの間の離隔が関心音の波長より大幅に小さい場合、ゼロ遅延減算された対の出力は音圧の空間導関数δp/δxに近く、ここでxは対の軸に沿った距離であり、pは音圧である。この対を双極子と呼ぶことがあり、減算を使用する離隔が狭い双極子を差分対と呼ぶことがある。
【0024】
2つの互いに直角の差分対を使用して勾配ベクトル
【数2】
を推算することができ、これから2つのアレイ出力の線形加重加算によって任意の方向uの方向導関数U・∇pを推算することができる。これにより、対応する直交ヌルを使用してビームフォーミング角度を平面(またはより多くの互いに直交する差分対を使用して3次元空間)内の任意の方向に電子的にステアリングすることが可能になる。しかし、それぞれの音声信号をこのようにして結合するとヌルが変更される。結合されたステアリング音声信号には構成ヌルが存在しないため、ステアリング音声信号のための所望の1組の特性を有するマイクロフォンアレイを設計するのはきわめて困難になる。したがって、このような技術は典型的には高周波数ではパフォーマンスがよくなく、容易にスケーリングすることができない。それどころか、これらの技術は計算コストが高く、スタンドアロンハードウェアで実施するのが困難である。
【0025】
したがって、本発明人らは、設計と実施が簡単であり、計算効率が高い一方、ホワイトノイズゲインを向上させる、マイクロフォンアレイの音声情報の指向性処理のための方法およびシステムを提供することが望ましいであろうと認識した。具体的には、良好な高周波数パフォーマンスも提供することができるシステムにスケーリング可能であり、容易に実施することができるように計算コストがきわめて低い、良好な低周波数パフォーマンスを有する小型のシステムである。
【発明の概要】
【0026】
本発明は、独立請求項で定義されており、それについて以下に言及する。有利な特徴が従属請求項に記載されている。
【0027】
本開示の第1の態様では、マイクロフォンアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための方法が提供される。方法は、マイクロフォンアレイの各マイクロフォンから音声信号を受信することを含み、マイクロフォンアレイが、互いに同一線上にない平行な少なくとも2対のマイクロフォンを含み、第1の対のマイクロフォンが第1のマイクロフォンと第2のマイクロフォンとを含み、第2の対のマイクロフォンが第3のマイクロフォンと第4のマイクロフォンとを含み、各マイクロフォンが平面上に配置されている。
【0028】
方法は、さらに、第2のマイクロフォンからの音声信号に第1の時間遅延を加え、第1の対のマイクロフォンに関連付けられた音声信号を判定するために第1のマイクロフォンからの音声信号から第2のマイクロフォンの遅延音声信号を減算することと、第4のマイクロフォンからの音声信号に第2の時間遅延を加え、第2の対のマイクロフォンに関連付けられた音声信号を判定するために第3のマイクロフォンからの音声信号から第4のマイクロフォンの遅延音声信号を減算することと、第2の対のマイクロフォンに関連付けられた音声信号に第3の時間遅延を加え、マイクロフォンアレイに関連付けられた音声信号を判定するために第1の対のマイクロフォンに関連付けられた音声信号から第2の対のマイクロフォンに関連付けられた遅延音声信号を減算することとを含み、第1、第2、および第3の時間遅延が、マイクロフォンアレイに関連付けられた音声信号の指向性を制御するように構成される。
【0029】
このようにして、この方法は、マイクロフォンアレイの平面における音源の分離/位置特定のために関心方向から離れた広帯域抑制を有する、指向性周波数応答を有利に提供する。
【0030】
任意により、第1の時間遅延は第1のマイクロフォンと第2のマイクロフォンとの間の相対距離に基づいて設定されてもよく、第2の時間遅延は第3のマイクロフォンと第4のマイクロフォンとの間の相対距離に基づいて設定されてもよく、第3の時間遅延は第1の対のマイクロフォンと第2の対のマイクロフォンとの間の相対距離に基づいて設定されてもよい。
【0031】
任意により、1対のマイクロフォンにおけるマイクロフォン間の距離はすべてのマイクロフォン対全体にわたり一様であってもよく、この結果として、第1の時間遅延と第2の時間遅延も互いに等しくなる。このようにマイクロフォンの対を一致させることにより、それぞれの対の結合された出力が同じ特性を有することになり、それにより、それぞれの出力の関連する処理が簡略化される。任意により、マイクロフォンアレイは、4つのマイクロフォンが平行四辺形の頂点に位置づけられている2対のマイクロフォンの特定の実施形態に従ってもよい。
【0032】
任意により、マイクロフォンアレイに関連付けられた音声信号に周波数等化フィルタが適用されてもよい。この周波数等化フィルタは、周波数の動作範囲にわたって正規化された平坦な周波数応答を提供するように、アレイのアルゴリズムで処理された出力の周波数応答における減衰を補償するようにチューニングすることができる。これらの減衰は、アレイを構成する物理マイクロフォンの周波数応答における欠陥の結果として、および/または、遅延減算処理自体の結果として生じることがある。実際には、より低い周波数は典型的には、より高い周波数よりも遅延減算アルゴリズム処理によって大幅に減衰され、したがって周波数等化フィルタは典型的には、出力が、観測されている現実世界の音をより正確に反映するように、これらのより低い周波数のゲインを上昇させるためにチューニングされることになる。
【0033】
任意により、アレイ内のマイクロフォンのそれぞれは、全方向性極性パターンを有するように選定されてもよい。これにより、所与のシステムの作製の設計段階において、アレイ応答の可視化処理/シミュレーションが簡略化されるので有利である。また、アレイ内のマイクロフォンを互いに同じ応答を有するように選択することによって、たとえば減算計算時にマイクロフォンのうちの1つに関連付けられた音声信号に重み付けを導入することによって異なる極性応答パターンを考慮する必要がないため、それぞれの物理マイクロフォンによって検出される音声信号の処理が簡略化される。
【0034】
任意により、マイクロフォンアレイに関連付けられた判定された音声信号が第1、第2のおよび第3の時間遅延の値に基づく所与の方向に対応してもよく、方法は、第1、第2および第3の時間遅延を反復的に調整し、反復的に調整された第1、第2および第3の時間遅延に関連付けられた複数の対応する音声信号を判定することをさらに含んでもよい。複数の対応する音声信号を比較することにより、所望の音声シグネチャまたは音源に最も近く対応する方向を判定することができる。これは観察中または観察したい音声シグネチャの到着の方向を突き止めるのに使用するために、マイクロフォンアレイの指向性の掃引調整を実現するので有利である。
【0035】
任意により、方法は、平面上に配置された1つまたは複数の対応するさらなるマイクロフォンアレイに関連付けられた1つまたは複数のそれぞれの音声信号を判定することと、ビームフォーミングアルゴリズムを使用してマイクロフォンアレイのアレイに関連付けられた音声信号を判定するためにマイクロフォンアレイに関連付けられた各音声信号を結合することとをさらに含む。これらのマイクロフォンアレイのアレイを結合してより大きなマクロアレイとすることにより、単一のマイクロフォンアレイと比較して向上したパフォーマンスを実現する。具体的には、各構成マイクロフォンアレイのヌル方向を結合してビームフォーミング方向または関心方向/最大感度方向から離れた方向に重なり合ったヌルを形成することによって、マクロアレイの指向性を最適化することができる。それぞれのマイクロフォンアレイのヌルを、既存のマクロアレイにおける弱点と重なるように照準を合わせること、またはその逆が可能であるので有利である。
【0036】
任意により、ビームフォーミングアルゴリズムは遅延加算ビームフォーミングアルゴリズムとして選択されてもよい。これは、遅延和アルゴリズムと遅延減算アルゴリズムとを有利に混合する。たとえば、マイクロフォンアレイ内で使用される遅延減算は、より低い周波数においてもビームフォーミング方向から離れた方向における広帯域信号除去をもたらすように最適化することができ、それぞれのマイクロフォンアレイの遅延加算を、より高い周波数においてもビームフォーミング方向における主ビームの幅を狭くするように最適化することができる。
【0037】
任意により、複数のマイクロフォンアレイは、少なくとも1つのマイクロフォンが2つの隣接マイクロフォンアレイ間で共用されるようにテッセレート(tessellate)されてもよい。これは、単一の物理マイクロフォンの出力を複数の隣接マイクロフォンアレイの遅延減算アルゴリズムの入力として使用することができるため、マクロアレイを形成するために必要な物理マイクロフォンの総数を減らすことができるので有利である。
【0038】
本開示の第2の態様では、マイクロフォンアレイ用の音声情報の指向性処理のための装置が提供される。装置は、マイクロフォンアレイの各マイクロフォンから音声信号を受信するように構成された1つまたは複数の入力部を含み、マイクロフォンアレイは、互いに同一線上にない平行な少なくとも2対のマイクロフォンを含む。第1の対のマイクロフォンは、第1のマイクロフォンと第2のマイクロフォンとを含み、第2の対のマイクロフォンは、第3のマイクロフォンと第4のマイクロフォンとを含み、各マイクロフォンは平面上に配置されている。装置は、第2のマイクロフォンからの音声信号に第1の時間遅延を加え、第1の対のマイクロフォンに関連付けられた音声信号を判定するために第1のマイクロフォンからの音声信号から第2のマイクロフォンの遅延音声信号を減算するように構成され、第4のマイクロフォンからの音声信号に第2の時間遅延を加え、第2の対のマイクロフォンに関連付けられた音声信号を判定するために第3のマイクロフォンからの音声信号から第4のマイクロフォンの遅延音声信号を減算するように構成された、デジタルシグナルプロセッサをさらに含む。デジタルシグナルプロセッサは、第2の対のマイクロフォンに関連付けられた音声信号に第3の時間遅延を加え、マイクロフォンアレイに関連付けられた音声信号を判定するために第1の対のマイクロフォンに関連付けられた音声信号から第2の対のマイクロフォンに関連付けられた遅延音声信号を減算するようにさらに構成される。ここで、第1、第2および第3の時間遅延は、マイクロフォンアレイに関連付けられた音声信号の指向性を制御するように構成される。
【0039】
任意により、第1の時間遅延は第1のマイクロフォンと第2のマイクロフォンとの間の相対距離に基づいて設定され、第2の時間遅延は第3のマイクロフォンと第4のマイクロフォンとの間の相対距離に基づいて設定され、第3の時間遅延は、第1の対のマイクロフォンと第2の対のマイクロフォンとの間の相対距離に基づいて設定される。
【0040】
任意により、1対のマイクロフォンにおけるマイクロフォン間の距離は、すべてのマイクロフォン対全体にわたり一様であり、したがって、第1の時間遅延と第2の時間遅延は互いに等しく設定される。
【0041】
任意により、マイクロフォンアレイは、2対のマイクロフォンを含み、第1、第2、第3および第4のマイクロフォンが平行四辺形の頂点に配置される。任意により、デジタルシグナルプロセッサは、マイクロフォンアレイに関連付けられた音声信号に周波数等化フィルタをかけるようにさらに構成される。任意により、受信音声信号は、全方向性極性パターンを有するマイクロフォンアレイのマイクロフォンに対応する。
【0042】
任意により、デジタルシグナルプロセッサは、第1、第2および第3の時間遅延の値に基づいて、マイクロフォンアレイに関連付けられた音声信号が所与の方向に対応すると判定するようにさらに構成され、デジタルシグナルプロセッサは、第1、第2および第3の時間遅延を反復的に調整し、反復的に調整された第1、第2および第3の時間遅延に関連付けられた複数の対応する音声信号を判定するように構成され、さらには、所望の音声シグネチャまたは音源に最も近く対応する方向を判定するために複数の対応する音声信号を比較するように構成される。
【0043】
任意により、デジタルシグナルプロセッサは、平面上に配置された1つまたは複数の対応するさらなるマイクロフォンアレイに関連付けられた1つまたは複数のそれぞれの音声信号を判定し、ビームフォーミングアルゴリズムを使用してマイクロフォンアレイのアレイに関連付けられた音声信号を判定するためにマイクロフォンアレイに関連付けられた各音声信号を結合するようにさらに構成される。任意により、遅延和ビームフォーミングアルゴリズムがビームフォーミングアルゴリズムとして選定される。
【0044】
任意により、複数のマイクロフォンアレイは、少なくとも1つのマイクロフォンが2つの隣接マイクロフォンアレイ間で共用されるように互いにテッセレートされる。
【0045】
本開示の第3の態様では、マイクロフォンアレイ用の音声情報の指向性処理のためのシステムが開示される。システムは、本開示の第2の態様の装置と、マイクロフォンアレイとを含む。マイクロフォンアレイは、互いに同一線上にない平行な少なくとも2対のマイクロフォンを含み、第1の対のマイクロフォンが第1のマイクロフォンと第2のマイクロフォンとを含み、第2の対のマイクロフォンが第3のマイクロフォンと第4のマイクロフォンとを含み、各マイクロフォンが平面上に配置されている。
【0046】
本開示の第4の態様では、スピーカアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための方法が提供される。方法は、スピーカアレイによって送信される音声信号を受信することと、スピーカアレイの各スピーカに印加するそれぞれの音声信号を判定することとを含み、スピーカアレイが互いに同一線上にない平行な少なくとも2対のスピーカを含み、第1の対のスピーカが第1のスピーカと第2のスピーカとを含み、第2の対のスピーカが第3のスピーカと第4のスピーカとを含み、各スピーカが平面上に配置されている。
【0047】
各スピーカに印加するそれぞれの音声信号は、第1の対のスピーカに関連付けられた音声信号がスピーカアレイによって送信される音声信号であると判定することと、第2の対のスピーカに関連付けられた音声信号を判定するためにスピーカアレイによって送信される音声信号に、第1の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、第1のスピーカに印加される音声信号が第1の対のスピーカに関連付けられた音声信号であると判定することと、第2のスピーカに印加される音声信号を判定するために、第1の対のスピーカに関連付けられた音声信号に、第2の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、第3のスピーカに印加される音声信号が第2の対のスピーカに関連付けられた音声信号であると判定することと、第4のスピーカに印加される音声信号を判定するために第2の対のスピーカに関連付けられた音声信号に、第3の時間遅延を使用して、遅延および反転アルゴリズムを適用することとによって判定される。第1、第2および第3の時間遅延は、スピーカアレイによって送信される音声信号の指向性を制御するように構成される。
【0048】
このようにして、この方法は、スピーカアレイのビーム幅内での送信のための比較的一様な周波数応答を維持しながら、音波ビームの方向から離れた広帯域抑制によるきわめて指向性の高い音波ビームを送信することができるスピーカアレイを提供するので有利である。
【0049】
本開示の第5の態様では、スピーカアレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための装置が提供される。装置は、スピーカアレイによって送信される音声信号を受信するように構成された入力部を含み、スピーカアレイは、互いに同一線上にない平行な少なくとも2対のスピーカを含み、第1の対のスピーカは第1のスピーカと第2のスピーカとを含み、第2の対のスピーカは第3のスピーカと第4のスピーカとを含み、各スピーカが平面上に配置されている。
【0050】
装置は、第1の対のスピーカに関連付けられた音声信号がスピーカアレイによって送信される音声信号であると判定することと、第2の対のスピーカに関連付けられた音声信号を判定するためにスピーカアレイによって送信される音声信号に、第1の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、第1のスピーカに印加される音声信号が第1の対のスピーカに関連付けられた音声信号であると判定することと、第2のスピーカに印加される音声信号を判定するために第1の対のスピーカに関連付けられた音声信号に、第2の時間遅延を使用して、遅延および反転アルゴリズムを適用することと、第3のスピーカに印加される音声信号が第2の対のスピーカに関連付けられた音声信号であると判定することと、第4のスピーカに印加される音声信号を判定するために第2の対のスピーカに関連付けられた音声信号に、第3の時間遅延を使用して、遅延および反転アルゴリズムを適用することとによって、スピーカアレイの各スピーカに印加するそれぞれの音声信号を判定するように構成されたデジタルシグナルプロセッサをさらに含む。第1、第2および第3の時間遅延は、スピーカアレイによって送信される音声信号の指向性を制御するように構成される。
【0051】
任意により、第1の時間遅延は第1のスピーカと第2のスピーカとの間の相対距離に基づいて設定され、第2の時間遅延は第3のスピーカと第4のスピーカとの間の相対距離に基づいて設定され、第3の時間遅延は第1の対のスピーカと第2の対のスピーカとの間の相対距離に基づいて設定され、1対のスピーカにおけるスピーカ間の距離がすべてのスピーカ対全体にわたり一様であり、第1の時間遅延と第2の時間遅延とが等しく、第1、第2、第3および第4のスピーカが平行四辺形の頂点に配置されている。
【0052】
任意により、デジタルシグナルプロセッサは、ビームフォーミングアルゴリズムを使用して、平面上に配置された1つまたは複数の対応するさらなるスピーカアレイに関連付けられた1つまたは複数のそれぞれの音声信号を判定するようにさらに構成される。
【0053】
以下、本発明の実施形態について、例としてのみ、添付図面を参照しながら説明する。
【図面の簡単な説明】
【0054】
図1】マイクロフォン対の軸に対して角度をなして1対のマイクロフォンに接近する音波を示す図である。
図2】3次元におけるヌルの円錐を示すマイクロフォン対を示す図である。
図3】1対のマイクロフォンに適用された遅延減算アルゴリズムの出力の正規化指向性周波数応答の例を示す図である。
図4】二重遅延減算アルゴリズムの結果として生じるヌルの2つの円錐を3次元で示す、2対の同一線上のマイクロフォンを示す図である。
図5】2対の同一線上のマイクロフォンに適用された二重遅延減算アルゴリズムの出力の正規化指向性周波数応答の例を示す図である。
図6】本開示のマイクロフォン実施形態によるシステム10を示すブロック図である。
図7】平行四辺形の形状の4つのマイクロフォンの配置を示す図である。
図8】4つのマイクロフォンのための二重遅延減算アレイアルゴリズムを示すブロック図である。
図9図7に示すマイクロフォンの配置に適用された二重遅延減算アルゴリズムの結果としてのヌルの2つの円錐を示す図である。
図10】同一線上にない2対のマイクロフォンに適用された二重遅延減算アルゴリズムの出力の正規化指向性周波数応答の例を示す図である。
図11】それぞれが二重遅延減算アルゴリズムを使用する複数のサブアレイに適用された遅延和アルゴリズムの出力の正規化指向性周波数応答の例を示す図である。
図12】本開示のスピーカ実施形態によるシステム40のブロック図である。
【発明を実施するための形態】
【0055】
本開示は、音声変換器アレイ用のデジタルシグナルプロセッサにおける音声情報の指向性処理のための方法および装置と、音声変換器アレイを含む対応するシステムを対象とする。一実施形態では、音声変換器はマイクロフォンであり、マイクロフォンアレイは所与の方向から発せられた音を検出するために使用可能である。しかし、当業者は、同じ動作原理をマイクロフォンの代わりにスピーカのアレイに逆に適用することもできることがわかるであろう。このさらなる実施形態では、スピーカアレイは指向性の高い音波ビームを生じさせるために使用可能である。
【0056】
図6は、本開示の一実施形態によるシステム10を示すブロック図である。システム10は、装置12とマイクロフォンアレイ14とを含む。装置12は、マイクロフォンアレイ内のマイクロフォンのそれぞれから音声信号を受信するための複数の入力部16と、入力部16のそれぞれと通信するデジタルシグナルプロセッサ18とを含む。デジタルシグナルプロセッサは、デジタル信号処理の結果を出力するための出力モジュール20とも通信する。
【0057】
マイクロフォンアレイのマイクロフォンによって捕捉された音声信号のためのプリアンプとアナログ-デジタル変換器が、マイクロフォン14とデジタルシグナルプロセッサ18の間の通信路に沿った任意の点に配置可能であることはわかるであろう。たとえば、装置14内でのアナログ-デジタル変換のために個別のマイクロフォンが装置12の1つまたは複数の入力部16に接続されてもよく、または、マイクロフォンアレイ内のすべてのマイクロフォンの音声信号がデジタル領域において装置において単一の入力部16で受信されるように、装置12の前にアナログ-デジタル変換が行われてもよい。
【0058】
一実施形態では、マイクロフォンアレイ14は、図7に示すように平行四辺形の頂点に配置された4つのマイクロフォンを含み得る。具体的には、4つのマイクロフォンは第1の対のマイクロフォンAおよびBと、第2の対のマイクロフォンCおよびDとに分割されてもよい。マイクロフォン対のそれぞれにおけるマイクロフォン間の距離は、d1であり、マイクロフォンのそれぞれの対の間の距離はd2である。本発明人らは、改良されたビームフォーミング出力を提供するために、このようなマイクロフォンアレイとともに遅延減算ビームフォーミングアルゴリズムを使用することができることを認識した。
【0059】
第1の対のマイクロフォン(AB)と第2の対のマイクロフォン(CD)は互いに平行であるが、直線状に並んで配置されておらず、したがって本明細書では同一線上にない1対のマイクロフォン対と呼ぶ。所与の方向の音源から受信した音声について、二重遅延減算アルゴリズムは、上記の式7に関して記載したのと同じ分析に従う。具体的には、マイクロフォンアレイ14によって検出された音声信号は以下のように出力可能である。
【0060】
double-diff(t)=D(t)-C(t-T1)-B(t-T2)+A(t-T1-T2) (8)
【0061】
式(8)の論理を、平坦な周波数応答に近づくようにマイクロフォンアレイ14の周波数応答を補正するための上述の正規化/周波数等化フィルタを追加して、図8にも示す。
【0062】
この二重遅延減算アルゴリズムは、この場合も2つのヌル円錐を生じさせるが、この2対は同一線上にないため、これら2つのヌル円錐は異なる方向に向くことになる。図8からわかるように、2つの遅延減算対に対応するヌル円錐はそれらの対の軸の方向に沿って向き、距離d1と時間遅延T1とに基づく角度θ1を有することになる。次にこのアルゴリズムの二重遅延減算ステップに進むと、第1の対のマイクロフォンABと第2の対のマイクロフォンCDのそれぞれの出力が、数学的に、それぞれの単一の架空/仮想マイクロフォンにおいて受信された出力として扱われる。したがって、これら2つの仮想マイクロフォンを通る軸は、マイクロフォンBとDの(または同様にAとCの)間の方向に沿うことになり、したがって、二重減算組合せに対応する追加のヌル円錐が、距離d2と時間遅延T2とに基づく角度θ2を有するこの方向に沿った向きになる。
【0063】
マイクロフォンアレイの平面において、これら2つのヌル円錐は4つのヌル方向(2つのヌル対)に対応することになる。マイクロフォンアレイの幾何形状を適切に構成することと、マイクロフォン信号に加えられる遅延を調整することとによって、関心方向以外の方向のマイクロフォンアレイの感度を低下させるためにマイクロフォンアレイ14の感度に穴を形成するように互いに結合する一連のヌルを構築するようにヌルの位置を調整するために、ヌル方向の角度を調整/ステアリングすることができる。狭角度のヌル円錐は広角度(たとえば90°の領域内)のヌル円錐より効果的であり、したがって、ヌル円錐の向きを異なる向きとすることにより、狭いヌル円錐を隣接角度に照準を定めさせてその領域における音声信号除去を向上させることが有利にできることがわかっている。
【0064】
このようなアレイを設計する際、各対におけるマイクロフォン間の距離d1は、最も短い関心波長の半分より小さく(理想的には4分の1波長より短く)設定する必要がある。しかし、この距離を最小化するとシステム出力に存在する低周波ノイズが増大することになり、したがって、アレイを設計する際にこの2つの間の妥協が必要となる可能性がある。同じ論理はアレイの距離d2の選択にも当てはまる。特定の使用事例では、d1をd2と等しく選択することによって、システムの処理をさらに簡略化することができる。
【0065】
1(式2参照)の値を使用した半角θ1の調整の細分度は理論上は無限であるが、この方法およびシステムはT1存続時間の値が、マイクロフォンで受信した音声信号の録音のサンプルレートを考慮した場合の整数のサンプル数に等しく設定された場合に、最も計算効率が高くなる。これは、遅延T1が整数のサンプル数と等しくない場合、遅延されるマイクロフォンにおける音声信号の遅延値を、2つの隣接サンプル間の値からデジタルシグナルプロセッサによって補間される必要が生じることになるためである。知られている方法を使用したナイキスト-シャノンサンプリング定理に基づくスケーリングされたシンク関数を使用して、正確な補間音声信号を判定することができる。しかし、T1の選択値を整数のサンプル数に最適化した場合、この追加の処理の必要を回避することができる。
【0066】
この手法は、このようにせずに電子的にステアリング可能な主ビームを生じさせることに焦点を合わせた従来の技術とは概念的に異なり、ここで主ビームは、マイクロフォンアレイのステアリングされた方向に対して一様な応答パターンを有する、アレイの応答が最大ゲインにある方向の範囲である。
【0067】
この同一線上にない配置でアレイのマイクロフォンを設けることによって、交差した向きを有するヌルはアレイの平面内の主ビームから離れたより広い干渉抑制をもたらすことができる。たとえば、図10に、図5のものと直接対比することができる、同一線上にない配置の指向性周波数応答のプロットを示す。この改良は、面内ビームフォーミング方向の使用が、同一線上にない配置において主ビームから離れた角度範囲に狭いヌル円錐によって引き続き照準を定めることができるようにヌルの配置により柔軟性を持たせ、より狭いヌル円錐が典型的には目標ヌル角度の周囲により広い抑制範囲をもたらすために得られる。
【0068】
要約すると、本提案のマイクロフォンの平行な対の同一線上にない配置は、知られている様々なシステムに対する改良をもたらすが、その理由は以下のとおりである。
・2次元アレイのための二重遅延減算ビームフォーミングの使用は、低電力および/またはモバイルシステムでも実装可能なように、実施が容易であり、計算効率が高い。
・ 遅延減算法は、本質的に広帯域であり(マイクロフォン離隔に依存する上限より下のすべての周波数で有効である)、したがって、計算コストが高くなる対応する重み付けを使用する独立した計算のために音声信号を様々な異なる周波数帯に分割する必要がない(これは、発話などの広帯域信号が関与する用途にとって特に有利である)。
・ 良好な低周波数パフォーマンスを依然として維持しながら、マイクロフォンアレイの平面内のより高い周波数音声の分離におけるシステムの指向性が向上する。
・ 低周波数パフォーマンスを、従来技術と比較してマイクロフォン間の増大した離隔によって達成することができ、さらにそれによって、同じ低周波数パターンを有するがより近接した間隔のマイクロフォンを有する従来の差分システムと比較して、低周波数におけるシステムのノイズを低減する(ホワイトノイズゲインを向上させる)。
・ マイクロフォン間のより大きな離隔は、対応するデジタル信号処理の複雑さを低減するために音声サンプル長の整数倍である時間遅延を使用する構成の設計のためのシステムの柔軟性を向上させる。
【0069】
上述のシステムおよび方法は、それぞれが全方向性であり(すなわち、マイクロフォンの感度があらゆる方向から到来する音声信号に対して同じ)、平坦な周波数応答(すなわち、マイクロフォンの感度がすべての周波数で同じ)を有するマイクロフォンのアレイに適用することができる。しかし、これは必須ではなく、全方向性ではない極性応答パターンを有するマイクロフォンも使用可能である。1対のマイクロフォンのそれぞれのマイクロフォンが同じ極性応答パターンを有していない場合、減算計算時にマイクロフォンの一方に関連付けられた音声信号に重み付けを導入することによってそれらの差違を計算に入れる必要が生じる可能性がある。マイクロフォンが共通の指向性極性応答パターンを有する場合、これは、結果のマイクロフォンアレイの指向性を向上させることができるともに、この追加の重み付けが不要になるためそれぞれの音声信号の処理を簡略化することができる。
【0070】
設計段階において、アレイの応答は、アレイ内の各単一の指向性マイクロフォンの実際の応答への全方向性アレイ応答の重ね合わせとみなすことができる。これは、(振幅ゲインと位相シフトの両方を示す)複素数を使用して指向性マイクロフォン応答と全方向性応答とを表すことと、これらを互いに乗じることとによって計算することができる。この単純な計算は、それぞれの予測応答のパフォーマンスを別々に考慮することによって、または互いに乗じて、最終的なシステムを設計することを可能にする。このようなアレイ内のマイクロフォンは、好ましくは互いに同じ極性応答パターンを有し、同じ方向に向けられることになる。
【0071】
上記の使用事例は、菱形、矩形または正方形などの(図7および図9に示すような)平行四辺形の頂点に配置された平行な2対のマイクロフォンを設ける。しかし、別の形状を有する構成も使用可能である。たとえば、マイクロフォンのそれぞれの対の間の距離は等しくなくてもよく、それによって平行四辺形は、より一般的な不等辺四辺形形状になる。その場合、一方の対のマイクロフォンのマイクロフォン間の距離は、平行な他方の対の間の距離とは異なることになるため、マイクロフォンの対のそれぞれに、異なる時間遅延が必要になる。同様に、2つの対のゲインレベルを一致させるために、対のうちの一方の対の出力の音声信号のゲインが重み付けを必要とする場合がある。
【0072】
また、同じプロセスを追加のマイクロフォンを使用してより大型のアレイに拡張することができる。たとえば、プロセスは4対のマイクロフォンに適用される三重遅延減算アルゴリズムに拡張されてもよく、それによって4対のそれぞれの対に遅延減算処理が施され、その結果の4つの仮想マイクロフォンが前述の二重遅延減算アルゴリズムの入力部として使用される。この結果、3つのヌル円錐が生じ、したがって、マイクロフォンアレイの平面内に6つのヌル方向が生じる。この拡張は、ビームフォーミングの指向性を向上させるが、このような追加のマイクロフォンの使用は、追加の自己誘導マイクロフォンノイズも無用に生じさせる。
【0073】
あるいは、システムは、上述のアレイを、組み合わさってマクロアレイを形成する複数の対応するサブアレイのサブアレイとして扱うことによって拡張することができる。各サブアレイは、重ね合わせを使用して互いに結合可能な指向性応答を有する新たな仮想マイクロフォンとみなすことができる。具体的には、まったく同じサブアレイの場合、1つのサブアレイの応答を上記のように計算することができ、次に、各仮想マイクロフォンを全方向性マイクロフォンとみなすことによって仮想マイクロフォン(それぞれがサブアレイのうちの1つの位置に対応する)のアレイ配置に関連付けられた応答を計算することができる。最後に、マクロアレイの応答は前のステップで計算した2つの応答の複素乗算とみなすことができる。
【0074】
サブアレイ内の各ヌルは、到来音声信号の所与の角度のゼロ応答/感度に対応するため、このように応答を互いに乗算することでこれらのヌルを、マクロアレイのヌルが各サブアレイのヌルと、仮想マイクロフォンのアレイ配置に関連付けられたあらゆるヌルとを含むように保持する。重ね合わされる2つの応答を独立して設計し、照準を合わせることができ、所望の1組の特性を有するようにアレイを設計するのがはるかに簡単であるため、これは強力なアレイ設計技術である。
【0075】
任意により、遅延和アルゴリズムを使用して仮想マイクロフォンのアレイ配置の応答を判定し、一方、構成サブアレイの応答を判定するために二重遅延減算アルゴリズムを使用することが有利な場合がある。このようにして、遅延減算技術の低周波数における一貫したビーム幅を、マクロアレイの平面においてステアリング可能なより狭い主ビームを提供するための遅延和技術の高周波数における狭いビーム幅と重ね合わせることができる。このようにサブアレイを結合する場合、結合の前に各サブアレイにフィルタを個別にかけるのではなく、マクロアレイの判定された応答に対して周波数等化フィルタを使用した正規化を1回だけかけることができる。
【0076】
このさらなる改良の効果を図11に示し、この図では、このようにサブアレイを結合することで、それぞれのサブアレイ(またはサブアレイに対応する仮想マイクロフォン)のサイドローブをマクロアレイのヌル(またはそれ以外の低応答領域)において隠されるようにすることができ、またはその逆も同様である。この結合は、単一のサブアレイが特に狭い主ビームを有する応答を優先させる必要がない(さらに、その代わりに、サイドローブなどを除去またはなくすためにヌルを互いにより密接に束ねることによって主ビームから離れたより一貫した信号除去の実現に焦点を合わせることができる)ことも意味する。なぜならば、サブアレイの結合はマクロアレイの主ビームをさらに狭めるからである。次に、広範囲な進入角にわたって高レベルな音声除去を実現するように結合する、ヌルの壁と呼び得るほぼ連続したヌルの広がりを指向させることによって、主ビームから離れた除去を行うことができる。
【0077】
さらに、比較的広い主ビーム幅を有するサブアレイの遅延和集合体は、遅延和アルゴリズムで使用される遅延値によって、サブアレイのより広い主ビーム内でのより狭いマクロアレイ主ビームのステアリングを適応的に調整することを可能にする。
【0078】
また、サブアレイ内のマイクロフォンの数を増やすのではなく、マクロアレイ内のサブアレイの数を増やすことで、ホワイトノイズゲインとシステムの全体的なノイズレベルが低減される。
【0079】
平行四辺形に配置された4つのマイクロフォンを有するサブアレイの使用によって、マクロアレイの形成は隣接サブアレイを結合するためにテッセレーション(tessellation)を使用することができ、これは、単一のマイクロフォンの出力を両方のサブアレイのビームフォーミングアルゴリズムへの入力として使用することができるように、1つのサブアレイ内のマイクロフォンの位置を、隣接するサブアレイ内のマイクロフォンの位置と重なるようにすることができるというさらなる利点を提供する。実際に、平行四辺形のテッセレーションでは、各マイクロフォンを最大4つのサブアレイの入力部に寄与するように配置することができる。これは、明らかに、マクロアレイを実施するのに必要な物理マイクロフォンの総数の大幅な削減を実現する。一例として、他の方法では100個の物理マイクロフォンを必要とすることになる平行四辺形形状を使用した25個のサブアレイのテッセレーションを、36個のみの物理マイクロフォンで実施することができる。
【0080】
このようなテッセレーションは、従来技術の波長限界の考慮に基づく従来技術に見られるものよりも大きなサブアレイの使用によって可能となる。平行四辺形以外のサブアレイ形状も同様にしてテッセレート可能であり、本開示はこれに関して限定されないことを理解されたい。
【0081】
上記のように、本開示は、個人用補聴器、または動物、車両、ドローンまたはその他の飛行機などの特定の音声シグネチャに関連付けられることがわかっている対象の位置の検出のため、あるいは緊急救助状況における生命兆候の方向を検出するためなど、広範囲な用途における使用のために、周囲雑音から単一の話者または音源を区別するためのシステムおよび方法を提供する。音声シグネチャの音源に関連付けられた方向を判定するために、マクロアレイのビームフォーミングに関連付けられた様々な時間遅延を反復的に調整して最も強い音声信号が検出される方向を突き止めるためにマクロアレイの主ビームを掃引することができる。
【0082】
しかし、本発明はこの態様には限定されず、マイクロフォンのアレイの出力を処理するためのこれらの同じ原理は、指向性の高い音声出力を提供するためにスピーカのアレイへの入力の処理にも使用することができる。当業者は、スピーカの動作は単純にマイクロフォンの逆であることと、上記の教示をスピーカアレイの実施形態に適用するために単純に逆にすることができることがわかるであろう。
【0083】
音声情報の指向性処理を提供する本開示のこの態様のための例示のシステム40を図12に示す。システム40は、装置42とスピーカアレイ44とを含む。装置42は、入力部46と、デジタルシグナルプロセッサ48と、1つまたは複数の出力50とを含む。スピーカを駆動するのに必要な電力増幅をスピーカ44とデジタルシグナルプロセッサ48との間の通信路に沿った任意の点に配置可能であることがわかるであろう。たとえば、電力増幅器は装置42の一部をなすか、あるいはスピーカアレイ44に近接して配置されてもよい。
【0084】
一実施形態では、スピーカアレイは、互いに同一線上にない少なくとも2対の平行なスピーカを含んでもよく、第1の対のスピーカが第1のスピーカと第2のスピーカとを含み、第2の対のスピーカが第3のスピーカと第4のスピーカとを含み、これらのスピーカのそれぞれが平面上に配置されている。これらのスピーカを共通の指向性/分散パターンを有するように構成することによって、それぞれのスピーカに印加される音声信号を判定するのに必要な関連処理を簡略化することができるが、その代わりに、反転を伴う各段階においてスピーカのうちの1つに関連付けられた音声信号に重み付けを導入することによって、1対のスピーカの指向性/分散パターンの差異に対処することができる。
【0085】
装置40の入力部46は、スピーカアレイによって送信される音声信号を受信し、それを処理のためにデジタルシグナルプロセッサ48に伝達するように構成可能である。デジタルシグナルプロセッサ48は、第1の対のスピーカに関連付けられた音声信号がスピーカアレイによって送信される音声信号であると判定することと、第2の対のスピーカに関連付けられた音声信号を判定するために、スピーカアレイによって送信される音声信号に、第1の時間遅延を使用して、遅延と反転アルゴリズムとを適用することとによって、スピーカアレイ44の各スピーカに印加するそれぞれの音声信号を判定するように構成可能である。
【0086】
遅延および反転アルゴリズムは、音声信号に遅延を加え、次にそれにマイナス1を乗じることによってその音声信号を反転させる。これは、マイクロフォン実施形態の遅延減算アルゴリズムに対応するが、スピーカ実施形態では、それぞれの音声信号を結合するのではなく、音声信号を分割するため、加算と減算の概念はない。したがって、スピーカ実施形態における反転はマイクロフォン実施形態における減算に相当する。
【0087】
次に、第1のスピーカに印加する音声信号を第1の対のスピーカに関連付けられた音声信号であると判定し、第2のスピーカに印加される音声信号を判定するために、第1の対のスピーカに関連付けられた音声信号に第2の時間遅延を使用して遅延および反転アルゴリズムを適用することができる。同様に、第3のスピーカに印加される音声信号を第2の対のスピーカに関連付けられた音声信号であると判定することができ、第4のスピーカに印加される音声信号を判定するために、第2の対のスピーカに関連付けられた音声信号に第3の遅延を使用して遅延と反転アルゴリズムを適用することができる。第1、第2および第3の時間遅延を制御することによって、装置40はスピーカアレイ44によって送信される音声信号の指向性を制御することができる。
【0088】
マイクロフォン配置と同様に、本開示のこの態様の一実施形態は、平行四辺形の頂点に配置された4つのスピーカを備え、第1の対のスピーカ間の距離と第2の対のスピーカ間の距離が同じになるため第1の時間遅延と第2の時間遅延が等しく設定されることになる、スピーカアレイを提供することができる。この場合も、このスピーカアレイは、マイクロフォンアレイに関して上述した教示を使用してスピーカの対応するサブアレイをテッセレートすることによって形成されるスピーカのより大きなマクロアレイのサブアレイとみなすことができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【国際調査報告】