IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キャタピラー インコーポレイテッドの特許一覧 ▶ ブリガム・ヤング・ユニバーシティの特許一覧

特開2024-28164高ノイズ環境に存在するオーディオ通信信号の検出
<>
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図1
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図2
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図3
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図4
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図5
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図6
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図7
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図8
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図9
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図10
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図11
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図12
  • 特開-高ノイズ環境に存在するオーディオ通信信号の検出 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024028164
(43)【公開日】2024-03-01
(54)【発明の名称】高ノイズ環境に存在するオーディオ通信信号の検出
(51)【国際特許分類】
   H04R 3/00 20060101AFI20240222BHJP
   E02F 9/16 20060101ALI20240222BHJP
   G10L 25/51 20130101ALI20240222BHJP
   G10L 21/0208 20130101ALI20240222BHJP
【FI】
H04R3/00 320
E02F9/16 C
G10L25/51 400
G10L21/0208 100B
G10L21/0208 100A
【審査請求】未請求
【請求項の数】10
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023129163
(22)【出願日】2023-08-08
(31)【優先権主張番号】17/889,871
(32)【優先日】2022-08-17
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】391020193
【氏名又は名称】キャタピラー インコーポレイテッド
【氏名又は名称原語表記】CATERPILLAR INCORPORATED
(71)【出願人】
【識別番号】592087647
【氏名又は名称】ブリガム・ヤング・ユニバーシティ
【氏名又は名称原語表記】BRIGHAM YOUNG UNIVERSITY
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(72)【発明者】
【氏名】デイビッド シー.コプリー
(72)【発明者】
【氏名】スコット ディ.ゾンマーフェルト
(72)【発明者】
【氏名】ジョナサン ディ.ブロッター
(72)【発明者】
【氏名】カーティス エル.ガーナー
【テーマコード(参考)】
2D015
5D220
【Fターム(参考)】
2D015EC00
2D015EC02
5D220BA06
5D220BB04
5D220BC05
(57)【要約】      (修正有)
【課題】高ノイズ環境に存在するオーディオ通信信号を抽出するためのシステム及び方法を提供する。
【解決手段】方法は、捕捉されたオーディオ信号から基準ノイズ信号の一部を除去して部分的に処理されたオーディオ信号を生成し1306、部分的に処理されたオーディオ信号を対にして信号ペアを形成する1308。信号ペアの各々について、低周波内容の影響が除去された修正相互相関ベクトルを生成し1312、その後、関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて回転角度領域相互相関ベクトルに変換する1314。回転角度領域相互相関ベクトルを合計し1316、重み付けベクトルを合計に適用し1318、スピーチに関連する所望のオーディオ信号の方向情報を識別する。方向情報は、部分的に処理されたオーディオ信号をビームフォーミング1320し、所望のオーディオ信号を出力するために使用される。
【選択図】図13
【特許請求の範囲】
【請求項1】
システム(104)であって、
所定のパターンで配置された複数のエラーマイクフォン(130)であって、前記エラーマイクフォン(130A、130B、130C、130D)の各々は、
スピーチ(204)を含むそれぞれのオーディオ信号を捕捉し(1302)、
それぞれの捕捉されたオーディオ信号を生成するように動作する複数のエラーマイクフォン(130)と、
ノイズ源(108)から基準ノイズ信号を捕捉する(1304)ように動作する1つ以上の基準センサ(132)と、
前記複数のエラーマイクフォン(130)および前記1つ以上の基準センサ(132)に通信可能に結合されたプロセッサ(126)と、
前記プロセッサ(126)に通信可能に結合されたメモリ(128)であって、前記メモリ(128)は、前記プロセッサ(126)によって実行されるときに、
前記捕捉されたオーディオ信号の各々から前記基準ノイズ信号の少なくとも一部を除去することによって、複数の部分的に処理されたオーディオ信号を生成する動作(1306)と、
前記部分的に処理されたオーディオ信号をペアリングすることによって、複数の信号ペアを生成する動作(1308)と、
複数の信号ペアの各々について、前記信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成する動作(1314)と、
前記回転角度領域相互相関ベクトルを合計することによって、合計角度領域相互相関ベクトルを生成する動作(1316)と、
重み付けベクトルを前記合計角度領域相互相関ベクトルに適用することによって、加重角度領域ベクトルを生成する動作(1318)と、
前記スピーチに関連する所望のオーディオ信号の方向情報を前記加重角度領域ベクトルから識別する動作(1318)と、を前記プロセッサ(126)に実行させるコンピュータ実行可能指令を記憶したメモリ(128)と、を含む、システム(104)。
【請求項2】
前記動作は、
前記方向情報に基づいて、前記複数の部分的に処理されたオーディオ信号をビームフォーミングし、前記スピーチに関連する所望のオーディオ信号を出力する動作(1320)をさらに含む、請求項1に記載のシステム。
【請求項3】
前記捕捉されたオーディオ信号の各々から前記基準ノイズ信号の少なくとも一部を除去することは、最小二乗平均(LMS)フィルタを使用して、前記捕捉されたオーディオ信号の各々をフィルタリングすることによって、前記基準ノイズ信号の少なくとも一部を除去することを含む、請求項1に記載のシステム。
【請求項4】
前記複数の信号ペアの各々について、それぞれの回転角度領域相互相関ベクトルを生成することは、
前記オーディオ信号ペアのオーディオ信号間の相互相関ベクトルを生成すること(1310)と、
サンプル領域内の相互相関ベクトルを角度領域内の回転角度領域相互相関ベクトルに変換すること(1314)と、を含む、請求項1に記載のシステム。
【請求項5】
前記オーディオ信号ペアのオーディオ信号間の相互相関ベクトルを生成することは、
低周波数内容の影響を前記相互相関ベクトルから除去することによって、前記相互相関ベクトルを修正すること(1312)を含む、請求項4に記載のシステム。
【請求項6】
方法(1300)であって、
所定のパターンで配置された複数のエラーマイクフォン(130)の各々(130A、130B、130C、130D)によって、スピーチ(204)を含むそれぞれのオーディオ信号を捕捉すること(1302)と、
1つ以上の基準センサによってノイズ源(108)から基準ノイズ信号を捕捉すること(1304)と、
前記捕捉されたオーディオ信号の各々から前記基準ノイズ信号の少なくとも一部を除去することによって、複数の部分的に処理されたオーディオ信号を生成すること(1306)と、
前記部分的に処理されたオーディオ信号をペアリングすることによって、複数の信号ペアを生成すること(1308)と、
前記複数の信号ペアの各々について、前記信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成すること(1314)と、
前記回転角度領域相互相関ベクトルを合計することによって、合計角度領域相互相関ベクトルを生成すること(1316)と、
重み付けベクトルを前記合計角度領域相互相関ベクトルに適用することによって、加重角度領域ベクトルを生成すること(1318)と、
前記スピーチに関連する所望のオーディオ信号の方向情報を前記加重角度領域ベクトルから識別すること(1318)と、を含む、方法。
【請求項7】
前記方向情報に基づいて、前記複数の部分的に処理されたオーディオ信号をビームフォーミングし、所望のオーディオ信号を出力すること(1320)をさらに含む、請求項6に記載の方法。
【請求項8】
前記複数の信号ペアの各々について、それぞれの回転角度領域相互相関ベクトルを生成することは、
前記オーディオ信号ペアのオーディオ信号間の相互相関ベクトルを生成すること(1310)と、
前記相互相関ベクトルから低周波内容の影響を除去することによって相互相関ベクトルを修正すること(1312)と、
サンプル領域内の修正相互相関ベクトルを角度領域内の回転角度領域相互相関ベクトルに変換すること(1314)と、を含む、請求項6に記載の方法。
【請求項9】
機械(102)であって、
エンジン(108)を支持するフレーム(106)と、
前記フレーム(106)によって支持され、音を発するように構成された1つ以上のスピーカー(134)を含む運転室(112)と、
前記フレーム(106)によって支持された作業器具(120)と、
所定のパターンで機械の外部に配置された複数のエラーマイクフォン(130)であって、前記複数のエラーマイクフォン(130)の各々(130A、130B、130C、130D)は、
スピーチ(204)を含むそれぞれのオーディオ信号を捕捉し(1302)、
それぞれの捕捉されたオーディオ信号を生成するように動作する複数のエラーマイクフォン(130)と、
前記エンジン(108)から基準ノイズ信号を捕捉するように動作する1つ以上の基準センサ(132)と、
前記複数のエラーマイクフォン(130)および前記1つ以上の基準センサ(132)に動作可能に接続されたプロセッサ(126)と、
前記プロセッサ(126)に通信可能に結合されたメモリ(128)であって、前記メモリ(128)は、前記プロセッサ(126)によって実行されたときに、
前記捕捉されたオーディオ信号の各々から前記基準ノイズ信号の少なくとも一部を除去することによって、複数の部分的に処理されたオーディオ信号を生成する動作(1306)と、
前記部分的に処理されたオーディオ信号をペアリングすることによって、複数の信号ペアを生成する動作(1308)と、
前記複数の信号ペアの各々について、前記信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成する動作(1314)と、
前記回転角度領域相互相関ベクトルを合計することによって、合計角度領域相互相関ベクトルを生成する動作(1316)と、
重み付けベクトルを前記合計角度領域相互相関ベクトルに適用することによって、加重角度領域ベクトルを生成する動作(1308)と、
前記スピーチに関連する所望のオーディオ信号の方向情報を前記加重角度領域ベクトルから識別する動作(1318)と、
前記方向情報に基づいて、前記複数の部分的に処理されたオーディオ信号をビームフォーミングし、前記スピーチに関連する所望のオーディオ信号を出力する動作(1320)と、
前記1つ以上のスピーカーによって、前記スピーチに関連する所望のオーディオ信号を再生する動作(1322)と、を含む動作を、前記プロセッサ(126)に実行させるコンピュータ実行可能指令を記憶した、機械(102)。
【請求項10】
前記複数の信号ペアの各々について、それぞれの回転角度領域相互相関ベクトルを生成することは、
前記オーディオ信号ペアのオーディオ信号間の相互相関ベクトルを生成すること(1310)と、
低周波数内容の影響を前記相互相関ベクトルから除去することによって、初期相互相関ベクトルを修正すること(1312)と、
サンプル領域内の修正相互相関ベクトルを角度領域内の回転角度領域相互相関ベクトルに変換すること(1314)と、を含む、請求項9に記載の機械。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、高ノイズ環境に存在するオーディオ通信信号(例えば、スピーチ)を抽出するためのシステムおよび方法に関し、より具体的には、空間的に分離されたオーディオ信号を相関させ、相関させたオーディオ信号に重み付けベクトルを適用して、所望のオーディオ通信信号を抽出するためのシステムおよび方法に関する。
【背景技術】
【0002】
機械は、工事現場で様々なタスクを実行するために使用することができる。例えば、機械は、砂利、コンクリート、アスファルト、土壌、および/または他の材料などの工事現場に存在する材料を掘削、移動、成形、輪郭の形成、および/または除去するために使用することができる。多くの機械タスクでは、機械オペレータは、監視員や機械の外にいる他の人など、近くにいる人からの指令を聞く必要がある。インターホンなどの無線機がないと、機械のノイズのため、オペレータは監視員の指令を聞き取ることが困難である。
【0003】
2021年12月16日に公開された米国特許公開第2021/0390952A1号(「第952号公報」)は、複数のオーディオ入力信号を生成するための複数のオーディオ入力コンポーネントと、複数のオーディオ入力信号を受信するための論理デバイスとを含むシステムおよび方法を記載している。このシステムおよび方法は、複数のオーディオ信号がオーディオ源に関連するターゲットオーディオを含むか否かを決定し、複数のオーディオ信号および複数のオーディオ信号がターゲットオーディオを含むか否かの決定に基づいて、複数のオーディオ入力コンポーネントに対するオーディオ源の相対位置を推定し、推定した相対位置に基づいてターゲットオーディオを強調することによって、複数のオーディオ信号を処理してオーディオ出力信号を生成する。具体的には、第952号公報には、より強力な支配的ノイズ/干渉源が常に存在する場合、1人以上の同時話者の修正到着時間差(TDOA)または到着方向(DOA)を適用し、支配的ノイズ源を効果的に無効にすることによって推定されるターゲット話者の一意な空間指紋または相対伝達関数(RTF)を利用することによって、ターゲット話者の位置を推定することが記載されている。
【0004】
第952号公報には、オーディオ処理デバイスのマイクフォンロフォンに様々な方向からターゲットオーディオおよびノイズが到着し、ターゲットオーディオを強調し、ノイズを抑制するために、推定された位置に基づいてオーディオ入力信号が処理されることが記載されているが、第952号公報に記載されたマイクフォンロフォンは静止しており、第952号公報に記載されたシステムは、ターゲットオーディオを受信する同じマイクフォンロフォンからのノイズを識別するようにのみ構成されている。その結果、第952号公報に記載されたシステムのマイクフォンは、ターゲットオーディオとは別に一次ノイズを検出することができない。さらに、第952号公報に記載されたシステムは、全方向使用に設定されているので、たとえターゲットオーディオの可能な方向が既知であっても、ターゲットオーディオの方向知識を利用することはできない。
【0005】
本明細書で説明されるシステムおよび方法は、上記の1つ以上の欠点を解決することを意図している。
【発明の概要】
【0006】
第1態様によれば、システムであって、所定のパターンで配置された複数のエラーマイクフォンロフォンであって、複数のエラーマイクフォンロフォンの各々は、スピーチを含むそれぞれのオーディオ信号を捕捉し、それぞれの捕捉されたオーディオ信号を生成するように動作可能である複数のエラーマイクフォンロフォと、ノイズ源から基準ノイズ信号を捕捉するように動作する1つ以上の基準センサと、複数のエラーマイクフォンおよび1つ以上の基準センサに通信可能に結合されたプロセッサと、プロセッサに通信可能に結合され、プロセッサによって実行されたときにプロセッサに動作を実行させるコンピュータ実行可能指令を記憶するメモリと、を含む。動作は、捕捉されたオーディオ信号の各々から基準ノイズ信号の少なくとも一部を除去することによって複数の部分的に処理されたオーディオ信号を生成する動作と、部分的に処理されたオーディオ信号をペアリングすることによって複数の信号ペアを生成する動作と、複数の信号ペアの各々について、信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成する動作と、回転角度領域相互相関ベクトルを合計することによって、合計角度領域相互相関ベクトルを生成する動作と、重み付けベクトルを合計角度領域相互相関ベクトルに適用することによって、加重角度領域ベクトルを生成する動作と、スピーチに関連する所望のオーディオ信号の方向情報を加重角度領域ベクトルから識別する動作と、を含む。
【0007】
別の態様によれば、方法は、所定のパターンで配置された複数のエラーマイクフォンの各々によって、スピーチを含むそれぞれのオーディオ信号を捕捉することと、1つ以上の基準センサによってノイズ源から基準ノイズ信号を捕捉することと、捕捉されたオーディオ信号の各々から基準ノイズ信号の少なくとも一部を除去することによって、複数の部分的に処理されたオーディオ信号を生成することと、部分的に処理されたオーディオ信号をペアリングすることによって複数の信号ペアを生成すること、複数の信号ペアの各々について、信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成することと、回転角度領域相互相関ベクトルを合計することによって、合計角度領域相互相関ベクトルを生成することと、合計角度領域相互相関ベクトルに重み付けベクトルを適用することによって、加重角度領域ベクトルを生成することと、スピーチに関連する所望のオーディオ信号の方向情報を加重角度領域ベクトルから識別することと、を含む。
【0008】
別の態様によれば、機械は、エンジンを支持するフレームと、フレームによって支持され、音を発するように構成された1つ以上のスピーカーを含む運転室と、フレームによって支持された作業器具と、所定のパターンで機械の外部に配置された複数のエラーマイクフォンであって、複数のエラーマイクフォンの各々は、スピーチを含むそれぞれのオーディオ信号を捕捉し、それぞれの捕捉されたオーディオ信号を生成するように動作する複数のエラーマイクフォンと、前記エンジンから基準ノイズ信号を捕捉するように動作する1つ以上の基準センサと、複数のエラーマイクフォンおよび1つ以上の基準センサに動作可能に接続されたプロセッサと、プロセッサに通信可能に結合されたメモリであって、プロセッサによって実行されたときに動作をプロセッサに実行させるコンピュータ実行可能指令を記憶したメモリと、を含む。動作は、捕捉されたオーディオ信号の各々から基準ノイズ信号の少なくとも一部を除去することによって、複数の部分的に処理されたオーディオ信号を生成する動作と、部分的に処理されたオーディオ信号をペアリングすることによって複数の信号ペアを生成する動作と、複数の信号ペアの各々について、信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成する動作と、回転角度領域相互相関ベクトルを合計することによって、合計角度領域相互相関ベクトルを生成する動作と、重み付けベクトルを合計角度領域相互相関ベクトルに適用することによって、加重角度領域ベクトルを生成する動作と、スピーチに関連する所望のオーディオ信号の方向情報を加重角度領域ベクトルから識別する動作と、方向情報に基づいて複数の部分的に処理されたオーディオ信号をビームフォーミングし、スピーチに関連する所望のオーディオ信号を出力する動作と、1つ以上のスピーカーによって、スピーチに関連する所望のオーディオ信号を再生する動作と、を含む。
【図面の簡単な説明】
【0009】
図面を参照して具体的な実施形態について説明する。図において、参照番号の最左の桁は、その参照番号が最初に現れる図を識別する。異なる図面における同一の符号は、類似または同一の項目を示す。
図1】オーディオ通信信号を検出するための例示的なシステムを含む例示的な機械の概略上面図である。
図2】オーディオ通信信号検出システムを有する機械と、口頭で指令を提供する監視員とを含む作業現場例の概略上面図を示す概略図である。
図3】機械の一部が左側に向いている例示的な作業現場を示す概略平面図である。
図4】修正相互相関ベクトルを生成するために複数の捕捉されたオーディオ信号を処理するためのモジュールのブロック図を示す。
図5】低周波内容の効果を除去した場合および除去しない場合の相互相関ベクトルの例示的な比較を示す図である。
図6】角度領域計算装置の機能を説明するブロック図の一例を示す。
図7】修正相互相関ベクトルの領域と角度領域との間の関係の例示的なグラフィック表示を示す。
図8】角度領域変換に関連するエラーマイクフォンペアのセットアップの概略図を示す。
図9】領域変換処理における信号プロファイルの一例を示す。
図10】合計角度領域相互相関ベクトルを生成するための例示的な信号プロファイルを示す。
図11】合計回転角度領域相互相関ベクトルに対する重み付けベクトルの適用例を示す。
図12】方向情報に基づいてオーディオ信号を処理するための重み付けベクトル、ビーム形成器、フィルタ、およびスピーカーのブロック図を示す。
図13】高ノイズ環境に存在するオーディオ通信信号を検出するための例示的なプロセスを示すフローチャートを提供する。
【発明を実施するための形態】
【0010】
図1は、例示的なオーディオ通信信号検出システム104を含む例示的な機械102の概略上面グラフ100を示すブロック図である。この例では、図1に示す機械102は掘削機である。しかし、機械102は、自動車、トラック、農業用車両、および/またはホイールローダ、トラックローダ、スキッドステアローダ、グレーダ、オンハイウェイトラック、オフハイウェイトラックなどの作業車両、および/または当業者に知られている他の任意の機械など、地形を横切って移動するように構成された任意のタイプの機械であってもよい。
【0011】
機械102は、動力源108が取り付けられたシャーシまたはフレーム106を含む。動力源108は、内燃機関であってもよいし、電動機であってもよい。この例では、動力源108をエンジン108と交換して呼んでもよい。エンジン108は、例えば作業ツール、電子装置、およびステアリングの動作を含む機械102の動作のための動力を供給するように構成され、および/または機械102を地形を横切って推進または移動させるための駆動部材にトルクを供給するように構成される。例えば、図1に示す機械102は、機械102を路面、砂利、土、または作業現場の他の作業面を横切るように推進するように構成された一対のトラック110を含む。機械102はトラックを含むが、機械102は、トラックの代わりに、またはトラックに加えて、1つ以上の車輪を含んでもよいことが想定される。機械102は、機械102のオペレータ114を保護し、および/または快適性を提供するために、および/または機械102の制御関連デバイスを保護するために、フレーム106に動作可能に接続された運転室112をさらに含む。いくつかの例では、機械102は、半自動または完全自動であってもよく、車載または遠隔オペレータなしで、遠隔動作のように動作してもよい。
【0012】
図1に示す例では、機械102は、ブーム116を有し、その近位端はフレーム106に動作可能に接続され、フレーム106に対して動作可能に枢動される。機械102は、ブーム116の遠位端に作動可能に接続され、ブーム116に対して作動可能に枢動されるスティック118をさらに含む。機械102は、一端がフレーム106に結合され、他端がブーム116に結合されたブームアクチュエータ(図示せず)をさらに含む。ブームアクチュエータは、ブーム116の遠位端部をそれぞれ上昇および下降させるように伸長および後退するように構成されている。機械102はさらに、掘削、運搬、吊り上げ、および/または材料の堆積など機械102に関連する動作を実行する作業ツール120を含む。機械102は、フレーム106および/またはブーム116の近位端に接続された一端を有する作業ツールアクチュエータ(図示せず)を含む。作業ツールアクチュエータは、作業ツール120を、例えば直立方向と少なくとも部分的に反転方向との間で枢動させるように、伸張および後退するように構成されている。作業ツール120は、直立方向には材料を保持することができ、作業ツール120は、少なくとも部分的に反転する方向には材料を保管または廃棄することができる。他の形態の作業ツールも考慮されている。例えば、図1の作業ツール120はバケットとして示されているが、作業ツール120は、オーガ、刈払機、ほうき、グラップル、ハンマー、粉砕機、リッパー、ローターなどを含んでもよい。ブーム116、スティック118、作業ツール120およびブームアクチュエータ、あるいは機械102タイプに適した任意の対応するデバイスは、総称して作業器具と呼ぶ場合がある。
【0013】
図1に示すように、機械102は、オーディオ通信信号検出システム104、エンジン108、バッテリ122、および機械102の動作に関連するコンポーネント124を含み、これらのすべてのはがフレーム106にマウントされ、取り付けられ、または結合されてもよい。バッテリ122によって電力供給可能なオーディオ通信信号検出システム104は、オーディオ通信信号検出システム104に関連する任意のモジュール、コンポーネント、またはシステムを実行可能な1つ以上のプロセッサ(プロセッサ)126を含む。いくつかの例では、プロセッサ126は、中央処理装置(CPU)、グラフィックス処理装置(GPU)、フィールドプログラマブルゲートアレイ(FPGA)、CPU、GPUおよびFPGAの任意の組み合わせ、または当技術分野で知られている他の処理装置またはコンポーネントを含んでもよく、さらに、プロセッサの各々は、プログラムモジュール、プログラムデータ、および/または1つ以上のオペレーティングシステムを記憶することができる独自のローカルメモリを有してもよい。オーディオ通信信号検出システム104は、揮発性メモリ(例えば、RAM)、不揮発性メモリ(例えば、ROM、フラッシュメモリ、ミニハードディスクドライブ、メモリカードなど)、またはそれらのいくつかの組み合わせに関連するコンピュータ可読記憶媒体またはメモリ128をさらに含む。コンピュータ可読記憶媒体128は、非一時的なコンピュータ可読記憶媒体であってもよい。
【0014】
オーディオ通信信号検出システム104は、複数のエラーセンサ130、1つ以上の基準センサ132、および1つ以上のスピーカー(スピーカー)134をさらに含む。例えば、エラーセンサ130は、オーディオ信号を受信および/または検出することができる任意のタイプのオーディオ、振動または圧力センサまたは信号センサであってもよい。この例では、エラーセンサ130は、エラーマイクフォンロフォン130と交換して呼んでもよい。4つのエラーマイクフォン130A、130B、130C、130Dは、複数のエラーセンサ130の一例として使用/図示されており、これらは、監視員からのスピーチまたは指令を含むオーディオ信号を捕捉するために、半円形パターンで等間隔に運転室112のルーフ136(図示の拡大図)上にマウントされてもよい。しかし、エラーマイクフォン130は、機械102の任意の外部部品に分散してマウントされてもよく、ここでは、監視員からのスピーチまたは指令を含むオーディオ信号が捕捉されてもよい。1つ以上の基準センサ132は、基準ノイズ信号を受信および/または検出することができる任意のタイプのオーディオ、振動、圧力センサまたは信号コンバータであってもよい。この例では、1つ以上の基準センサ132は、単一基準マイクフォン132として示されて参照され、それは、監視員からのスピーチを検出するために除去されるべき主要なノイズまたは望ましくないオーディオ源を捕捉するために、エンジン108の近傍のエンジンコンパートメント内にマウントされてもよい。しかし、基準マイクフォンロフォン132は、102に関連する任意の顕著なノイズ源の近くに代替的にまたは追加的にマウントされてもよい。また、オペレータ114にスピーチを再生するために、運転室112内にスピーカー134をマウントしてもよい。オーディオ通信信号検出システム104は、フィルタ138、ペアジェネレータ140、相互相関計算装置142、角度領域計算装置144、重み付けベクトル146、またはビーム形成器148のうちの少なくとも1つをさらに含む。これらのモジュールまたはコンポーネントについては、図2図13を参照して以下でより詳細に説明する。
コンピュータ可読記憶媒体128は、オーディオ通信信号検出システム104に関連する様々な動作を実行する1つ以上の上述したモジュールを含むか、またはそれに関連してもよい。いくつかの例では、1つ以上のモジュールは、コンピュータ可読記憶媒体128によって記憶され、そのような動作を実行するためにプロセッサ126によって実行可能な、または関連するコンピュータ実行可能指令を含んでもよい。オーディオ通信信号検出システム104はまた、任意の既知の有線および/または無線通信プロトコルおよび/またはネットワークを使用して外部エンティティ152と通信するための通信モジュール150を含んでもよい。例えば、運転室112内でスピーカー134によって再生されたスピーチは、オペレータ114および/または機械102の電話局などの外部エンティティ152にも伝達されて売る。オーディオ通信信号検出システム104は、オーディオ通信信号検出システム104に関連する任意の機能を実行することができる、上述しない追加コンポーネントをさらに含んでもよい。
【0015】
以下で説明するように、いくつかの例では、運転室112のルーフ136上に配置された複数のエラーマイクフォン130は、スピーチを含むオーディオ信号を捕捉することができ、エンジン108の近傍に配置された基準マイクフォン132は、低レベルのスピーチも含むことができる基準ノイズ信号を捕捉してもよい。フィルタ138は、捕捉されたオーディオ信号から基準ノイズ信号の少なくとも一部を除去し、複数の部分的に処理されたオーディオ信号を生成してもよい。ペアジェネレータ140は、複数の部分的に処理されたオーディオ信号を互いにとペアにして、複数の部分的に処理されたオーディオ信号ペアを形成してもよい。複数の部分的に処理されたオーディオ信号ペアは、順列ペアではなく、組み合わせペアを含む、すなわち、組み合わせの順序は重要ではない(例えば、ABはBAと同じ)。部分的に処理されたオーディオ信号ペアの各々について、相互相関計算装置142は相互相関ベクトルを生成し、相互相関ベクトル(修正相互相関ベクトル)から低周波内容の影響を除去し、角度領域計算装置144は修正相互相関ベクトルを角度領域相互相関ベクトルに変換してもよい。角度領域計算装置144は、角度領域相互相関ベクトルを、対応するエラーマイクフォン位置間の物理角度だけ回転させてもよい。そして、角度領域計算装置144は、回転角度領域相互相関ベクトルの全てを合計し、合計角度領域相互相関ベクトルを生成してもよい。重み付けベクトル146は、角度に基づいて合計角度領域相互相関ベクトルの部分を選択的に抑制し、可能な到来方向またはスピーチの方向情報を識別してもよい。そして、ビーム形成器148は、方向情報を適用してフィルタ138からのオーディオ信号を処理し、スピーカー134は、スピーチに関連する処理されたオーディオ信号を再生してもよい。
【0016】
図2は、オーディオ通信信号検出システム104を有する機械102とオペレータ114に口頭指令またはスピーチ204を提供する監視員202を含む作業現場200の一例の概略上面図を示す。監視員202は、機械102と同じ平坦な地面盤、機械102よりも高いプラットホーム上、または溝などの低い水平面に位置する。オーディオ通信信号検出システム104は、図2には具体的に示されていないが、図1を参照して説明したように、機械102の一部として存在するか、または機械102i上にインストールされているものと理解される。機械102の周辺領域は、運転室112およびオペレータ114を中心として、0°、90°、180°、270°の角度を示す軸で区切られた4つの象限206、208、210、212にマーキングされている。監視員202は、第4象限212に位置するように示されている。監視員202の位置は、監視員が指令を提供するために使用する可能な領域であることが知られている線214および216によって定義される領域(監視員領域218)内にある。
【0017】
図3は、機械102の一部を左に向けた作業現場300の一例の概略上面図を示す概略図である。より正確には、エンジン108、運転室112、ブーム116、スティック118、および作業ツール120を含む機械102の上部は、機械102自体が同じ位置にあるまま、ほぼ垂直な中心軸を中心に回転している。座標または象限206、208、210、212は、運転室112、すなわちオペレータ114に対して設定されたため、監視員202は機械102の回転に伴って移動可能であるので、監視員領域218はオペレータ114に対して固定されたままである。
【0018】
図4は、修正相互相関ベクトルを生成するために複数の捕捉されたオーディオ信号を処理するためのモジュールのブロック図400を示す。複数のエラーマイクフォン130A、130B、130C、130Dのそれぞれは、スピーチ204を含む対応するオーディオ信号を捕捉し、複数の捕捉されたオーディオ信号を一緒に生成してもよい。この例では、一次ノイズ源であるエンジン108の近傍に配置された基準マイクフォンロフォン132は、エンジン108からの基準ノイズ信号を捕捉してもよい。そして、フィルタ138は、複数の捕捉されたオーディオ信号の各々から基準ノイズ信号の少なくとも一部を除去し、複数の部分的に処理されたオーディオ信号を生成してもよい。フィルタ138は、複数のオーディオ信号の捕捉されたオーディオ信号の各々に最小二乗平均(LMS)フィルタリングを適用して、基準ノイズ信号の少なくとも一部を除去してもよい。ペアジェネレータ140は、複数の部分的に処理されたオーディオ信号の各々をペアにし、複数の部分的に処理されたオーディオ信号ペアを生成してもよい。
【0019】
例えば、エラーマイクフォン130Aに関連する部分的に処理されたオーディオ信号がAであり、エラーマイクフォン130Bに関連する部分的に処理されたオーディオ信号がBであり、エラーマイクフォン130Cに関連する部分的に処理されたオーディオ信号がCであり、エラーマイクフォン130Dに関連する部分的に処理されたオーディオ信号がDである場合、複数の部分的に処理されたオーディオ信号ペアはAB、AC、AD、BC、BD、CDを含むことになる。言い換えれば、複数の部分的に処理されたオーディオ信号は、部分的に処理されたオーディオ信号の順列ではなく、組み合わせのみを含む。
【0020】
複数の部分的に処理されたオーディオ信号ペアの各々について、相互相関計算装置142は、相互相関ベクトルCXを算出して生成してもよい。例えば、部分的に処理されたABオーディオ信号ペアについて、相互相関計算装置142は、相互相関ベクトルCXABを生成してもよい。残りのペアCXAC、CXAD、CXBC、CXBD、CXCDについても、同様に相互相関ベクトルを算出して生成する。相互相関ベクトルは、低周波内容の影響を相互相関ベクトルから除去するために、さらに処理または修正されてもよい。例えば、修正相互相関ベクトルは、以下の方程式に基づいて算出されてもよい。
【数1】

ここで、
CXは、修正相互相関ベクトルであり、
CXは、元の相互相関ベクトルであり、
Lは、ウィンドウの長さであり、
△s=[-L+1,-L+2,...,L-2,L-1]および
| |は、要素に基づく絶対値演算子である。
【0021】
図5は、相互相関ベクトル502と、低周波内容(低周波バイアス506)の影響が除去された修正相互相関ベクトル504との比較例500を示す。図3に戻ると、修正相互相関ベクトルCX’AB、CX’AC、CX’AD、CX’BC、CX’BD、およびCX’CDは、相互相関計算装置142からの出力として示されている。
【0022】
図6は、角度領域計算装置144の機能を説明する例示的なブロック図600を示す。角度領域計算装置144は、エラーマイクフォンロフォンペアとサンプルシフト値との間の空間的関係に基づいて、修正相互相関ベクトルを対応する角度領域相互相関ベクトルに変換するように動作する角度領域コンバータ602を含んでもよい。例えば、角度領域コンバータ602は、修正相互相関ベクトルCX’AB、CX’AC、CX’AD、CX’BC、CX’BD、およびCX’CDの各々を、対応する角度領域相互相関ベクトル∠CX’AB、∠CX’AC、∠CX’AD、∠CX’BC、∠CX’BD、∠CX’CDにそれぞれ変換してもよい。修正相互相関ベクトルの各々はサンプル領域にあり、ここで、ベクトルの各々の値は、2つの時間領域信号間のサンプル単位で測定された異なる時間シフトに対応する。これらの相互相関ベクトルを単一の複合ベクトルに結合する前に、それらを同じ領域に変換する必要がある。後の算出を簡単にするために、これは、相互相関ベクトルの各々を角度領域に変換することによって達成される。
図7は、修正相互相関ベクトルの領域と角度領域との間の関係の例示的なグラフィック表示700を示す。帯域はサンプル遅延を表す。変換の目的は、相互相関ベクトルの値を新しいベクトルに結合することであり、これらの値は、サンプル遅延の代わりに、線形に間隔を開けた角度に対応する。図8は、エラーマイクフォンペア(130Aおよび130B)のセットアップおよび角度領域変換に関連するパラメータの概略図800を示す。帯域内の任意の位置を有する物理源の信号は、対応するサンプル遅延を伴って、エラーマイクフォン130Aおよび130Bに到着する。各帯域は、相互相関ベクトルの個々の要素に順次対応する。
【0023】
変換を実行するプロセスの例を以下に説明する。注目角度のベクトルAを最初に生成してもよい。たとえば、1度の解像度が必要な場合、Aは次のように定義できる。
【数2】

このベクトルAはラジアンに変換され、Φだけ回転してもよく、これは、図8に示すように、グローバルx軸と2つのエラーマイクフォン130Aおよび130Bを結ぶ線との間の角度である。
【数3】

次に、修正相互相関の領域と角度領域との間の関係を定義する変換ベクトルTを算出してもよい。
【数4】

ここで、dは、2つのエラーマイクフォン130Aおよび130B間の距離、Fsはサンプリング周波数、Lは、修正相互相関を算出する際に、信号の各々に含まれるサンプル数である。Tの値は、最も近い整数に四捨五入される。角度領域相互相関ベクトル∠CX’ABは、修正相互相関ベクトルCX’ABから次のように組み立てられる。
【数5】

式(5)は、Tのメンバが∠CX’ABを形成するCX’ABの順序付きインデックスであるインデックス付け演算である。たとえば、A=[1,4,3]の場合、B=C(A)は、BをCの最初の要素、次に4番目の要素、最後に3番目の要素として定義する。なお、式(5)において、∠CX’ABおよびTの長さは常に、と同じであるが、∠CX’とは異なる場合がある。ほとんどの場合、Tに重複値も含まれる。これは、図7に示すように、複数の角度が同じサンプル遅延帯域内(例えば、135°と225°)に収まるためである。以下に示すように、式(2)-(5)を組み合わせて、エラーマイクフォンのいずれかのペアからの修正相互相関を任意の角度領域に変換してもよい。
【数6】
【0024】
グラフ9は、領域変換プロセスにおける信号プロファイル900の例を示す。図4および図5を参照して上述したように、グラフ902は、低周波内容の影響が除去された修正相互相関ベクトル904の例を示す。修正相互相関ベクトルの角度領域への領域変換は、式(6)に従って単一のステップとして行われ得ることが理解されるが、領域変換および角度回転の効果は、領域変換プロセスをより良く視覚化するために別々に示されている。グラフ906は、修正相互相関ベクトル904から変換された角度領域相互相関ベクトル908の例を示す。角度領域相互相関ベクトル908は、約180°の対称性を示し、約105°および約255°でピークに達し、可能なオーディオ信号の初期方向を示してもよい。グラフ910は、回転角度領域相互相関ベクトル912の例を示しており、角度領域相互相関ベクトル908は、関連するエラーマイクフォンロフォンペア(例えば、エラーマイクフォンロフォン130Aおよび130B)を結ぶ線とグローバルx軸との間で、対応する角度Φを回転または修正角度領域相互相関ベクトル908である。
【0025】
図10は、合計角度領域相互相関ベクトルを生成するための例示的な信号プロファイル1000を示す。この例では、関係するエラーマイクフォン130は、エラーマイクフォン130A、130B、および130Cであってもよく、ペアジェネレータは、図4および図5を参照して説明したように、相互相関計算装置142によって修正相互相関ベクトルとして、CX’AB、CX’ACおよびCX’BCの3対のAB、ACおよびBCを出力してもよい。グラフ9と同様に、領域変換および角度回転の効果は、領域変換プロセスをよりよく視覚化するために、別々に示されている。グラフ1002には、グラフ9の3つの角度領域相互相関ベクトル908、1004、1006が示されている。グラフ1002に示すように、3つの角度領域相互相関ベクトル908、1004および1006のすべては、約180°対称である。グラフ1008には、3つの回転角度領域相互相関ベクトル912、1010、および1012が示されている。3つの角度領域相互相関ベクトル908、1004および1006の各々は、対応する角度Φだけ回転され、図5に示すように、角度領域コンバータ602からの出力∠CX’AB、∠CX’AC、および∠CX’BCに対応して、それぞれ、回転角度領域相互相関ベクトル908、1004、および1006の3つとして出力される。例えば、角度領域相互相関ベクトル908は、約25°回転され、角度領域相互相関ベクトル1004は約-15°回転され、角度領域相互相関ベクトル1006は約165°回転されたものとして示された。
【0026】
グラフ1014には、角度領域ベクトル合計モジュール604からの出力SCX’に対応する回転角度領域相互相関ベクトル912、1010および1012の合計結果である、合計回転角度領域相互相関ベクトル1016が示されている。合計回転角度領域相互相関ベクトル1016は、スピーチ204を含むオーディオ信号の方向の3つの候補を示す、それぞれ50°、130°、280°近傍の3つのピーク1018、1020、および1022を示す。どのピークがオーディオ信号の最も可能な方向であるかを決定するために、重み付けベクトル146が、以下で説明されるように、合計回転角度領域相互相関ベクトル1016に適用される。
【0027】
図11は、重み付けベクトル146を合計回転角度領域相互相関ベクトル1016に適用する例示的な表現1100を示す。グラフ1014は、図8を参照して上述したように、重み付けベクトル146が適用される合計回転角度領域相互相関ベクトル1016を示す。重み付けベクトル146は、監視員領域218に有利であり、ノイズ源の方向にバイアスを掛ける上述のフィルタリング形状を有するグラフ1102に示されている。図2および図3に示すように、重み係数1は、線214および216によって定義される監視員領域218、約220°から約320°の範囲にほぼ対応し、オペレータ114からエンジン108に向かう角度が約90°に近づくにつれて、重み係数は減少する。グラフ1104は、重み付けベクトル146を合計回転角度領域相互相関ベクトル1016に適用した結果である、加重角度領域ベクトル1106を示している。加重角度領域ベクトル1106は、相対ピーク1108(相対ピーク1022は抑制されていない)を示し、監視員領域218内の1つの角度において、所望のオーディオ信号の最も可能な方向を示す。この例では、相対ピーク1108は約280°に位置している。加重角度領域ベクトル1106は、相対ピーク1018および1020が重み付けベクトル146,によって抑制され、それぞれ抑制されたピーク1110および1112として示されている。運転室112で再生スピーチを生成する際に、280°における相対ピーク1108の方向情報を用いて、約280°に位置する監視員202の方向をシミュレートすることもできる。
【0028】
図12は、方向情報に基づいてオーディオ信号を処理するための重み付けベクトル146、ビーム形成器148、フィルタ138、およびスピーカー134のブロック図1200を示す。
【0029】
重み付けベクトル146は、スピーチ204を提供するために監視員202がいる可能性のある領域であって、エンジン108のようにノイズ源の方向に偏ったことが知られている監視員領域218を優先するように形成されたフィルタを合計回転角度領域相互相関ベクトル1016に適用してもよい。例えば、監視員202は、オペレータ114から見えない、スピーチ204がエンジン108のノイズによって妨害される可能性が高い運転室112の背後に位置させる可能性は低い。言い換えれば、重み付けベクトル146は加重角度領域ベクトルSCX’を生成するように設計され、この加重角度領域ベクトルは、監視員領域218から発生すると判定されたオーディオ信号を、いかなる抑制もなしに効果的に通過させることによって、オーディオ信号の最も可能な方向を識別すると同時に、主要なノイズ源であるエンジン108から発生すると判定された方向を低減する。そして、ビーム形成器148は、加重角度領域ベクトルSCX’からの方向情報を用いてビーム形成器148の視線方向を設定し、フィルタ138からの複数の部分的に処理されたオーディオ信号を視線方向に基づいてビームフォーミングし、スピーチ204の復元版である所望のオーディオ信号を出力してもよい。そして、ビーム形成器148からの出力は、運転室112内のスピーカー134によって、スピーチ204に関連する再生スピーチ1202としてオペレータ114に再生されてもよい。いくつかの例では、再生スピーチ1202は、スピーカー134によって、加重角度領域ベクトルSCX’からの方向情報に基づいてオペレータ114に対する監視員202またはスピーチ204の方向をオペレータ114に示すように生成されてもよい。
図13は、高ノイズ環境に存在するオーディオ通信信号を検出するための例示的なプロセス1300を表すフローチャートを提供する。プロセス1300は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実現され得る動作シーケンスを表す動作を有する論理フロー図として示されている。ソフトウェアのコンテキストにおいて、動作は、動作は、1つ以上のプロセッサによって実行されると、記載された動作を実行する、1つ以上のコンピュータ可読記憶媒体に格納されたコンピュータ実行可能指令を表す。説明の目的で、別段の記載がない限り、以下に、ステップを実行するオーディオ通信信号検出システム104のプロセッサ126に関して図13を説明する。一般に、コンピュータ実行可能指令は、特定の機能を実行する、または特定のデータタイプを実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。記述された動作の順序は限定的と解釈されることを意図しておらず、記述された任意の数の動作を任意の順序および/または並列に組み合わせてプロセスを実現することができる。
【0030】
いくつかの例では、プロセッサ126は、複数のエラーマイクフォン130A、130B、130C、および130Dを制御して、スピーチ204を含むそれぞれのオーディオ信号を捕捉し、ブロック1302において複数の捕捉されたオーディオ信号を生成してもよい。プロセッサ126は、予め選択されたサンプリング周波数でオーディオ信号をサンプリングすることによって、捕捉されたオーディオ信号を生成してもよい。プロセッサ126はまた、エンジン108の近くに配置された基準マイクフォンロフォン132を制御して、エンジン108からブロック1304で低レベルスピーチも含むことができる基準ノイズ信号(一次ノイズ)を捕捉してもよい。ブロック1306において、プロセッサ126は、例えば最小二乗平均(LMS)フィルタリングを使用することによって、複数の捕捉されたオーディオ信号の各々から基準ノイズ信号の少なくとも一部をフィルタリングし、複数の部分的に処理されたオーディオ信号を生成してもよい。プロセッサ126は、ペアジェネレータ140を利用して、複数の部分的に処理されたオーディオ信号から、ブロック1308で部分的に処理されたオーディオ信号ペアを生成してもよい。図3を参照して上述したように、複数の部分的に処理されたオーディオ信号ペアは、部分的に処理されたオーディオ信号の順列ではなく、組み合わせペアを含み、組み合わせの順序は重要ではない(例えば、ABはBAと同じ)。例えば、エラーマイクフォン130Aに関連する部分的に処理されたオーディオ信号がAであり、エラーマイクフォン130Bに関連する部分的に処理されたオーディオ信号がBであり、エラーマイクフォン130Cに関連する部分的に処理されたオーディオ信号がCであり、エラーマイクフォン130Dに関連する部分的に処理されたオーディオ信号がDである場合、複数の部分的に処理されたオーディオ信号ペアはAB、AC、AD、BC、BD、およびCDを含む。
【0031】
部分的に処理されたオーディオ信号ペアの各々について、プロセッサ126は、図3を参照して上述したように、ブロック1310において、相互相関計算装置142を利用して、CXAB、CXAC、CXAD、CXBC、CXBD、CXCDなどのAB、AC、AD、BC、BDおよびCDペアの相互相関をそれぞれ算出して生成してもよい。ブロック1312において、プロセッサ126は、相互相関計算装置142を利用して、低周波内容の影響を相互相関ベクトルから除去して、例えば、図3を参照して上述したように、相互相関計算装置142からの出力として示されている修正相互相関ベクトルCX’AB、CX’AC、CX’AD、CX’BC、CX’BD、およびCX’CDを生成する例えば、上記のように、修正相互相関ベクトルは、式(1)に基づいて算出されてもよい。
【0032】
ブロック1314において、プロセッサ126は、角度領域コンバータ602を利用して、図6~9を参照して上述したように、エラーマイクフォンロフォンペアとサンプル位置との間の空間的関係に基づいて、修正相互相関ベクトルを回転角度領域相互相関ベクトルに変換してもよい。例えば、プロセッサ126は、図7および図8を参照して説明する式(2)-(6)に基づいて、角度領域コンバータ602を利用して、修正相互相関ベクトルCX’AB、CX’AC、CX’AD、CX’BC、CX’BD、およびCX’CDの各々を、対応する回転角度領域相互相関ベクトル∠CX’AB、∠CX’AC、∠CX’AD、∠CX’BC、∠CX’BD、および∠CX’CDにそれぞれ変換する。
【0033】
ブロック1316において、プロセッサ126は、図6および図10を参照して上述したように、角度領域ベクトル合計モジュール604を利用して回転角度領域相互相関ベクトルを合計し、合計角度領域相互相関ベクトルを生成してもよい。図6および図10を参照して上述したように、グラフ1014には、角度領域ベクトル合計モジュール604からの出力SCX’に対応する回転角度領域相互相関ベクトル912、1010および1012の合計結果である合計回転角度領域相互相関ベクトル1016が示されている。合計回転角度領域相互相関ベクトル1016は、スピーチ204を含むオーディオ信号の方向の3つの候補を示す、それぞれ50°、130°、280°近傍の3つのピーク1018、1020、および1022を示す。どのピークがオーディオ信号の最も可能な方向であるかを決定するために、重み付けベクトル146は、以下に説明するように、合計回転角度領域相互相関ベクトル1016に適用される。
【0034】
ブロック1318において、プロセッサ126は、重み付けベクトル146を、合計回転角度領域相互相関ベクトル1016に適用してもよい。図11および図12を参照して上述したように、重み付けベクトル146は加重角度領域ベクトル1106を生成するように設計され、この加重角度領域ベクトル1106は、監視員領域218から発生すると判定されたオーディオ信号を抑制なしに効果的に通過させ、一方、エンジン108の方向から発生すると判定されたオーディオ信号を減少させて、オーディオ信号の最も可能な方向を識別する。図11を参照して上述したように、加重角度領域ベクトル1106は、監視員領域218内の1つの角度におけるスピーチ204の最も可能な方向を含む相対ピーク1108(抑制されていない相対ピーク1022)を示す。この例では、相対ピーク1108は約280°に位置している。加重角度領域ベクトル1106はまた、相対ピーク1018および1020が、重み付けベクトル146によって抑制され、それぞれ抑制されたピーク1110および1112として示されていることを示す。運転室112において再生スピーチ1202が生成されると、280°における相対ピーク1108の方向情報を用いて、約280°に位置する監視員202の方向をシミュレーションすることもできる。
【0035】
ブロック1320において、プロセッサ126は、ビーム形成器148を用いて加重角度領域ベクトル1106からの方向情報を適用することによってビーム形成器148の視線方向を設定し、フィルタ138からの複数の部分的に処理されたオーディオ信号を視線方向に基づいてビームフォーミングし、スピーチ204の復元版である所望のオーディオ信号を出力してもよい。ブロック1322において、プロセッサ126は、スピーカー134を利用して、運転室112内で、スピーチ204に関連する再生スピーチ1202として、所望のオーディオ信号をオペレータ114に再生してもよい。いくつかの例では、再生スピーチ1202は、スピーカー134によって、オペレータ114に対する監視員202またはスピーチ204の方向をオペレータ114に示すように生成されてもよい。
【産業上の利用可能性】
【0036】
本開示の例示的なシステムおよび方法は、ノイズの高い作業環境において、機械運転室にいるオペレータが機械運転室外にいる監視員から口頭指令を受信するのに適している。例えば、船舶、トラック、農業用車両、舗装機械、鉱山機械、および/または建設車両などのさまざまな大型機械を使用して、砂利、コンクリート、アスファルト、土壌、および/または他の材料などの工事現場に存在する材料を掘削、移動、成形、輪郭の形成、および/または除去することができる。多くの機械タスクでは、オペレータは、監視員や機械の外にいる他の人など、近くにいる人からの指令を聞く必要がある。インターホン等の無線機を使用せずに作業現場のような高ノイズ環境下で、作業者が監視員からの指令を聞くことができるように、運転室または機械の外部に所定のパターンで複数のエラーマイクフォンを設け、監視員からの指令(スピーチ)を含むオーディオ信号を捕捉する。その後、システムのプロセッサは、捕捉されたオーディオ信号からエンジンノイズのような一次ノイズを除去し、複数の部分的に処理されたオーディオ信号を生成し、複数の部分的に処理されたオーディオ信号をペアにして信号ペアを生成してもよい。信号ペアの各々について、プロセッサは、信号ペアに関連するエラーマイクフォンペアの位置に関連する物理角度に少なくとも部分的に基づいて、それぞれの回転角度領域相互相関ベクトルを生成し、回転角度領域相互相関ベクトルを合計してもよい。次いで、プロセッサは、合計角度領域相互相関ベクトルに重み付けベクトルを適用し、ノイズ源の方向に合計角度領域相互相関ベクトルの一部を抑制するように設計された、スピーチに関連する所望のオーディオ信号の方向情報を加重角度領域ベクトルから識別してもよい。プロセッサは、方向情報に基づいて、部分的に処理された複数のオーディオ信号をビームフォーミングし、運転室内でオペレータのために再生可能な所望のオーディオ信号を出力してもよい。
【0037】
本開示の様々な態様が、上述の例を参照して特に示され、説明されてきたが、開示されたデバイス、システム、および方法の修正によって、開示されたものの精神および範囲を逸脱することなく、様々な追加の実施形態が想定され得ることを当業者は理解するであろう。そのような実施形態は、請求項およびその任意の均等物に基づいて決定される本開示の範囲内に入るものとして理解されるべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
【外国語明細書】