特開2021-110948 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ハーマン　インターナショナル　インダストリーズ，　インコーポレイテッドの特許一覧

特開2021-110948車両音声システム用の空間発話分離による音声ダッキング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】特開2021-110948(P2021-110948A)

(43)【公開日】2021年8月2日

(54)【発明の名称】車両音声システム用の空間発話分離による音声ダッキング

(51)【国際特許分類】

G10L 21/034 20130101AFI20210705BHJP

G10L 21/0364 20130101ALI20210705BHJP

G10L 25/78 20130101ALI20210705BHJP

G10L 21/0272 20130101ALI20210705BHJP

G10L 21/0208 20130101ALI20210705BHJP

H04R 3/00 20060101ALI20210705BHJP

H04R 3/02 20060101ALI20210705BHJP

H04R 1/40 20060101ALI20210705BHJP

【ＦＩ】

G10L21/034

G10L21/0364

G10L25/78

G10L21/0272 100A

G10L21/0208 100A

H04R3/00 310

H04R3/02

H04R3/00 320

H04R1/40 320Z

【審査請求】未請求

【請求項の数】20

【出願形態】ＯＬ

【外国語出願】

【全頁数】22

(21)【出願番号】特願2020-219773(P2020-219773)

(22)【出願日】2020年12月29日

(31)【優先権主張番号】62/954,991

(32)【優先日】2019年12月30日

(33)【優先権主張国】US

(31)【優先権主張番号】17/130,175

(32)【優先日】2020年12月22日

(33)【優先権主張国】US

(71)【出願人】

【識別番号】512168283

【氏名又は名称】ハーマンインターナショナルインダストリーズ，インコーポレイテッド

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】クリストファーマイケルトレステン

(72)【発明者】

【氏名】ライリーウィントン

(72)【発明者】

【氏名】クリストファールドウィグ

【テーマコード（参考）】

5D220

【Ｆターム（参考）】

5D220AA02

5D220BA06

5D220BB04

5D220BC05

(57)【要約】（修正有）

【課題】車両音声システム用の空間発話分離による音声ダッキングのためのシステムを提供する。
【解決手段】車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも２つのマイクロホンと、人間以外の音声を発するように構成された少なくとも１つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて、人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
【選択図】図１２

【特許請求の範囲】

【請求項1】

車両ラウドスピーカシステムであって、
マイクロホンアレイを形成する少なくとも２つのマイクロホンと、
人間以外の音声を発するように構成された少なくとも１つのラウドスピーカと、
前記マイクロホンアレイから着信音声信号を受信し、
前記着信音声信号にビームフォーミングを適用し、
人間が生成した音声が前記音声信号内で検出されるかどうかを判断し、
人間が生成した音声が検出されることに応えて、前記人間以外の音声を調整するように前記ラウドスピーカに指示する
ようにプログラムされるプロセッサと
を備える、前記車両ラウドスピーカシステム。

【請求項2】

前記プロセッサは、閾値を超えている前記着信音声信号のうちの少なくとも１つの着信音声信号の音響入力に少なくとも部分的に基づいて、前記人間が生成した音声が前記音声信号内で検出されるかどうかを判断するようにプログラムされる、請求項１に記載のシステム。

【請求項3】

前記音響入力は、前記車両内の特定の領域と関連付けられる、請求項２に記載のシステム。

【請求項4】

前記音響入力は、前記ビームフォーミングを介して前記特定の領域と関連付けられる、請求項３に記載のシステム。

【請求項5】

前記マイクロホンアレイは、前記車両内の乗員のヘッドレストに隣接して配置される、請求項２に記載のシステム。

【請求項6】

前記プロセッサは、人間の発話が少なくとも１つの発信音声信号内で検出されることに応えて、前記人間以外の音声の音量を下げるようにプログラムされる、請求項１に記載のシステム。

【請求項7】

前記プロセッサは、前記ビームフォーミングにより、少なくとも１つの着信音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも１つを適用するようにプログラムされる、請求項１に記載のシステム。

【請求項8】

前記プロセッサは、前記マイクロホンアレイが音響信号を検出することに応えて、前記マイクロホンアレイで人間が生成した音声を検出するようにプログラムされる、請求項１に記載のシステム。

【請求項9】

前記マイクロホンアレイは４つのマイクロホンを含む、請求項１に記載のシステム。

【請求項10】

車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体であって、
車両マイクロホンアレイから着信音声信号を受信することと、
前記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が前記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、前記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、前記非一過性コンピュータ可読媒体。

【請求項11】

人間が生成した音声が前記音声信号内で検出されるかどうかを前記判断することは、閾値を超えている前記音声信号内の音響入力に少なくとも部分的に基づく、請求項１０に記載の媒体。

【請求項12】

前記音響入力は、前記車両内の特定の領域と関連付けられる、請求項１１に記載の媒体。

【請求項13】

前記音響入力は、前記ビームフォーミングを介して前記特定の領域と関連付けられる、請求項１１に記載の媒体。

【請求項14】

前記マイクロホンアレイは、前記車両内の乗員のヘッドレストに隣接して配置される、請求項１１に記載の媒体。

【請求項15】

人間の発話が少なくとも１つの音声信号内で検出されることに応えて、前記人間以外の音声の音量を下げることをさらに含む、請求項１０に記載の媒体。

【請求項16】

前記ビームフォーミングにより、少なくとも１つの音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも１つを適用することをさらに含む、請求項１０に記載の媒体。

【請求項17】

前記マイクロホンアレイが音響信号を検出することに応えて、前記マイクロホンアレイで人間が生成した音声を検出することをさらに含む、請求項１０に記載の媒体。

【請求項18】

車両内のラウドスピーカシステムを介して音声を生成するための方法であって、
車両マイクロホンアレイから着信音声信号を受信することと、
前記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が前記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、前記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、前記方法。

【請求項19】

人間が生成した音声が少なくとも１つの音声信号内で検出されるかどうかを前記判断することは、閾値を超えている前記音声信号内の音響入力に少なくとも部分的に基づく、請求項１８に記載の方法。

【請求項20】

前記音響入力は、前記車両内の特定の領域と関連付けられる、請求項１８に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本願は、その開示が本明細書で参照することによりその全体で本明細書に援用される、２０１９年１２月３０日に出願された米国仮出願第６２／９５４，９９１号の利益を主張する。

【0002】

本開示は、車両音声システム用の空間発話分離による音声ダッキングのためのシステムに関する。

【背景技術】

【0003】

現在の車室音響は、車室内で発生するいかなる音声も、一般に１つのノイズ刺激として知覚されると断定している。干渉源の一般的な例は、交通雑音、風切り音、乗客の発話、及びマルチメディアコンテンツを含む。これらの雑音源の存在は、発話の明瞭度、信号対雑音比、及び主観的な通話品質を低下させることにより発話の知覚を複雑化している。音声ダッキングは、車両内での品質及び運転者の満足度を高めるために使用され得る。しかしながら、音声信号が人間の発話を含むかどうかを判断するために使用されるアルゴリズムは、多くの場合、煩雑かつ不正確である。

【発明の概要】

【課題を解決するための手段】

【0004】

車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも２つのマイクロホンと、人間以外の音声を発するように構成された少なくとも１つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。

【0005】

車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体は、車両マイクロホンアレイから着信音声信号を受信することと、着信音声信号にビームフォーミングを適用することと、人間が生成した音声が音声信号内で検出されるかどうかを判断することと、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示することを含む。

【0006】

車両内でラウドスピーカシステムを介して音声を生成するための方法は、車両マイクロホンアレイから着信音声信号を受信することと、着信音声信号にビームフォーミングを適用することと、人間が生成した音声が音声信号内で検出されるかどうかを判断することと、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示することとを含む。
例えば、本願は以下の項目を提供する。
（項目１）
車両ラウドスピーカシステムであって、
マイクロホンアレイを形成する少なくとも２つのマイクロホンと、
人間以外の音声を発するように構成された少なくとも１つのラウドスピーカと、
上記マイクロホンアレイから着信音声信号を受信し、
上記着信音声信号にビームフォーミングを適用し、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断し、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するように上記ラウドスピーカに指示する
ようにプログラムされるプロセッサと
を備える、上記車両ラウドスピーカシステム。
（項目２）
上記プロセッサは、閾値を超えている上記着信音声信号のうちの少なくとも１つの着信音声信号の音響入力に少なくとも部分的に基づいて、上記人間が生成した音声が上記音声信号内で検出されるかどうかを判断するようにプログラムされる、上記項目に記載のシステム。
（項目３）
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載のシステム。
（項目４）
上記音響入力は、上記ビームフォーミングを介して上記特定の領域と関連付けられる、上記項目のいずれか一項に記載のシステム。
（項目５）
上記マイクロホンアレイは、上記車両内の乗員のヘッドレストに隣接して配置される、上記項目のいずれか一項に記載のシステム。
（項目６）
上記プロセッサは、人間の発話が少なくとも１つの発信音声信号内で検出されることに応えて、上記人間以外の音声の音量を下げるようにプログラムされる、上記項目のいずれか一項に記載のシステム。
（項目７）
上記プロセッサは、上記ビームフォーミングにより、少なくとも１つの着信音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも１つを適用するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
（項目８）
上記プロセッサは、上記マイクロホンアレイが音響信号を検出することに応えて、上記マイクロホンアレイで人間が生成した音声を検出するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
（項目９）
上記マイクロホンアレイは４つのマイクロホンを含む、上記項目のいずれか一項に記載のシステム。
（項目１０）
車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体であって、
車両マイクロホンアレイから着信音声信号を受信することと、
上記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、上記非一過性コンピュータ可読媒体。
（項目１１）
人間が生成した音声が上記音声信号内で検出されるかどうかを上記判断することは、閾値を超えている上記音声信号内の音響入力に少なくとも部分的に基づく、上記項目に記載の媒体。
（項目１２）
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載の媒体。
（項目１３）
上記音響入力は、上記ビームフォーミングを介して上記特定の領域と関連付けられる、上記項目のいずれか一項に記載の媒体。
（項目１４）
上記マイクロホンアレイは、上記車両内の乗員のヘッドレストに隣接して配置される、上記項目のいずれか一項に記載の媒体。
（項目１５）
人間の発話が少なくとも１つの音声信号内で検出されることに応えて、上記人間以外の音声の音量を下げることをさらに含む、上記項目のいずれか一項に記載の媒体。
（項目１６）
上記ビームフォーミングにより、少なくとも１つの音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも１つを適用することをさらに含む、上記項目のいずれか一項に記載の媒体。
（項目１７）
上記マイクロホンアレイが音響信号を検出することに応えて、上記マイクロホンアレイで人間が生成した音声を検出することをさらに含む、上記項目のいずれか一項に記載の媒体。
（項目１８）
車両内のラウドスピーカシステムを介して音声を生成するための方法であって、
車両マイクロホンアレイから着信音声信号を受信することと、
上記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、上記方法。
（項目１９）
人間が生成した音声が少なくとも１つの音声信号内で検出されるかどうかを上記判断することは、閾値を超えている上記音声信号内の音響入力に少なくとも部分的に基づく、上記項目に記載の方法。
（項目２０）
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載の方法。
（摘要）
車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも２つのマイクロホンと、人間以外の音声を発するように構成された少なくとも１つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて、人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。

【図面の簡単な説明】

【0007】

【図1】本開示の１つ以上の実施形態に従って、車両内の近端参加者と車両外部に位置する遠隔の遠端参加者との間の電気通信を容易にするための電気通信ネットワークを示す。

【図2】本開示の１つ以上の実施形態に係る、遠端電気通信用の車室内ノイズキャンセルシステムのブロック図である。

【図3】本開示の１つ以上の実施形態に係る、遠端電気通信のためのノイズキャンセル方法３００を示す簡略化された例示的な流れ図である。

【図4】本開示の１つ以上の実施形態に係る、例示的なマイクロホン配置を示す。

【図5】本開示の１つ以上の実施形態に係る、車両用のヘッドレストベースの電気通信システムの例示的なセットアップを示す。

【図6】本開示の１つ以上の実施形態に係る、車両用のヘッドレストベースの電気通信システムの別の例示的なセットアップを示す。

【図7】本開示の１つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための少なくとも１つのヘッドレストマイクロホンアレイを含む車両の平面図である。

【図8】本開示の１つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための少なくとも１つのヘッドレストマイクロホンアレイを含む車両の別の平面図である。

【図9】本開示の１つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための少なくとも１つのヘッドレストマイクロホンアレイと、バックミラーアセンブリマイクロホンアレイとを含む車両のさらに別の平面図である。

【図10】本開示の１つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための複数の様々なヘッドレストマイクロホンアレイを含む車両のなおさらに別の平面図である。

【図11】音声ダッキングシステムのブロック図を示す。

【図12】図１１のシステムの例のプロセスを示す。

【発明を実施するための形態】

【0008】

必要に応じて、本発明の詳細な実施形態が本明細書中に開示されるが、開示された実施形態は、様々なかつ代替の形式で具現化され得る発明の単なる例であることが理解されよう。図は必ずしも縮尺通りではなく、一部の特徴は、特定の構成要素の詳細を示すために誇張または最小化される場合がある。したがって、本明細書に開示される具体的な構造的及び機能的詳細は、限定的と解釈されるべきではなく、単に、本発明を様々に用いるように当業者を教示するための代表的な基礎として解釈されるべきである。

【0009】

本明細書に説明するのは、音声ダッキングに対するビームフォーミング手法である。音声ダッキングシステムは、ユーザーが会話を試みているときに、気を散らす媒体信号の音量を自動的に調整するのに役立ち得る。発話が完了すると、媒体は、より大きい音量を再開するために自動的に調整してよい。マイクロホンのアレイ及びビームフォーミングプロセスは、ユーザーの頭部及び口の回りの関心のある狭い空間領域から発話信号を受信し、識別するために使用されてよい。これにより、その関心領域からのありとあらゆる音声を音声ダッキングシステムに即座に送ることができる。

【0010】

音声ダッキングは、明確な通信を促進するための一般的な方法である。音声信号が存在するとき、媒体の音量は、通信することを容易にするために途切れなく「ダッキング」、つまり減衰される。多くの既存のシステムは、いつマイクロホンの着信発話信号が人間の発話を含むのかを決定するためにアルゴリズムを使用する。これらのアルゴリズムは煩雑で大きく、着信信号を発話信号として確認し得る前に所与の待ち時間を要する場合がある。つまり、ユーザーの発言の始まりは、ダッキングエンジンに送られない場合がある。さらに、「ああ」、「ふふん」、または「シーッ」などの発話以外の発声は、発話信号として分類されない場合があり、したがってダッキングエンジンに送られない。

【0011】

本明細書に開示する概念は関心のある空間的な領域に依存しているので、その関心領域からのありとあらゆる音声はダッキングエンジンに自動的にかつ即座に送られる。これは、発話以外の発声を含み、関心領域は、ビームフォーミングを介してすでに定義及び局所化されているのでいかなる遅延も必要としない。したがって、指向性マイクロホン及び煩雑な信号処理は回避される。

【0012】

また、本開示は、遠端ユーザー体験を最適化するための車載ノイズキャンセルシステムも説明する。ノイズキャンセルシステムは、電気通信の交換またはバーチャルパーソナルアシスタントとの対話などを含む通信交換の遠端における近端発話の明瞭度を改善し得る。ノイズキャンセルシステムは、電気通信デバイスのマイクロホンからだけではなく、車両からのリアルタイム音響入力を組み込んでよい。さらに、車両内の１つ以上の不要な音源からの音響エネルギーを効果的に除去するために、車の中に取り付けられた小型の埋め込みマイクロホンからの音声信号を処理し、発信電気通信信号の中に混合することができる。埋め込みマイクロホンによって取り込まれた不要な雑音（例えば、子供の叫び声及び背景の会話）に加えて、車両のインフォテインメントシステムの中の既知の音声ストリームから再生する音声（例えば、音楽、効果音、及び映画音声の台詞）は、ノイズキャンセルシステムへの直接的な入力として使用され得る。したがって、直接的な入力として、これらのストリームは、発信電気通信信号から除去することができ、このようにしてユーザーの遠端の通信相手にはるかに高い信号対雑音比、通話品質、及び発話明瞭度を与える。

【0013】

図１は、セルラー基地局１０８を介して、車両１０４内の近端参加者１０２と車両外部に位置する遠隔の遠端参加者１０６との間の電気通信を容易にするための電気通信ネットワーク１００を示す。車両１０４は、図１では電気通信信号１１２として集合的に示す着信電気通信信号及び発信電気通信信号を処理するための電気通信システム１１０を含んでよい。電気通信システム１１０は、以下により詳細に説明するように、音声電気通信信号を処理するためのデジタルシグナルプロセッサ（ＤＳＰ）１１４を含んでよい。別の実施形態によれば、ＤＳＰ１１４は、電気通信システム１１０とは別個のモジュールであってよい。車両インフォテインメントシステム１１６は、電気通信システム１１０に接続されてよい。第１の変換器１１８またはスピーカは、車室１２０内部の電気通信交換の近端参加者に着信電気通信信号を送信し得る。したがって、第１の変換器１１８は、近端参加者に近接して位置する場合もあれば、近端参加者によって占有される特定の座席場所で局所化された音場を生成する場合もある。第２の変換器１２２は、車両のインフォテインメントシステム１１６からの音声（例えば、音楽、効果音、及び映画音声からの台詞）を送信してよい。

【0014】

第１のマイクロホンアレイ１２４は、電気通信の近端参加者（すなわち、音源車両の運転者または別の乗員）の発話を受け取るために車室１２０内に位置してよい。第２のマイクロホンアレイ１２６は、集合的に雑音と呼ばれる不要な音源（例えば、交通雑音、風切り音、背景発話、及びマルチメディアコンテンツ）を検出するために車室１２０内に位置する場合がある。集合的に、電気通信システム１１０、ＤＳＰ１１４、インフォテインメントシステム１１６、変換器１１８、１２２、及びマイクロホンアレイ１２４、１２６は、遠端電気通信用の車室内ノイズキャンセルシステム１２８を形成し得る。

【0015】

図２は、図１に示すノイズキャンセルシステム１２８のブロック図である。図２に示すように、遠端参加者（図示せず）からの着信電気通信信号１１２ａは、ＤＳＰ１１４によって受信されてよい。ＤＳＰ１１４は、本明細書に開示する音声アプリケーションに特有である場合がある、デジタル信号処理の操作上の必要のために最適化された特殊マイクロホンプロセッサ及び／または集積回路の組み合わせなどのハードウェアベースのデバイスであってよい。着信電気通信信号１１２ａは、自動利得制御装置（ＡＧＣ）２０２で自動利得制御を受ける場合がある。ＡＧＣ２０２は、入力信号の振幅の変動にも関わらず、その出力で制御された信号振幅を提供し得る。平均またはピーク出力信号レベルは、入出力利得を適切な値に動的に調整するために使用され、回路がより広い範囲の入力信号レベルと十分に機能できるようにする。ＡＧＣ２０２からの出力は、次いで損失制御を受けるために損失制御装置２０４によって受け取られてよく、それは次いで着信電気通信信号１１２ａを等化するために等化器２０６に渡される。等化は、電子信号内の周波数成分間のバランスを調整するプロセスである。等化器は、特定の周波数バンドまたは「周波数範囲」のエネルギーを強化（ブースト）する、または弱める（削減する）。

【0016】

等化器２０６の出力は、リミッタ２０８によって受け取られてよい。リミッタは、指定された入力電力またはレベル未満の信号が、影響を受けずに通過できるようにし、一方この閾値を超えるより強い信号のピークを減衰させる回路である。制限することは、一種のダイナミックレンジ圧縮である。これは、デバイスの出力の指定された特性（通常は振幅）が所定の値を超えるのを防ぐ任意のプロセスである。リミッタは、突然の音量ピークが発生するのを防ぐために、ライブ音声及び放送アプリケーションでの安全装置として一般的である。デジタル処理された着信電気通信信号１１２ａ’は、次いで電気通信交換の近端参加者への可聴送信のために第１の変換器１１８によって受信されてよい。

【0017】

同じく図２に示すように、ノイズキャンセルシステム１２８は、第１のマイクロホンアレイ１２４と、第２のマイクロホンアレイ１２６とを含んでよい。第１のマイクロホンアレイ１２４は、電気通信交換の近端参加者（すなわち、音源車両の運転者または別の乗員）からの発話を受け取るために、車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。第１のマイクロホンアレイ１２４は、反射面から可能限り遠くにある一方、近端の参加者に可能な限り近くに位置決めされてよい。例えば、第１のマイクロホンアレイ１２４は、図４に示すようにヘッドレストまたはヘッドライナーなどに埋め込まれてよい。第２のマイクロホンアレイ１２６は、集合的に雑音と呼ばれる不要な音源（例えば、交通雑音、風切り音、背景発話、及びマルチメディアコンテンツ）を検出するために車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。

【0018】

第１のマイクロホンアレイと第２のマイクロホンアレイへの両方の入力、近端発話及びノイズは、それぞれＤＳＰ１１４を使用し、処理され得る。第１のマイクロホンアレイ１２４からの第１の音声信号２０９の集合（すなわち、近端発話を示す）は、ビームフォーミングのための第１のビームフォーマ２１０に送られてよい。一方、第２の音声信号２１１の集合（すなわち、雑音を示す）は、第２のビームフォーマ２１２に送られてよい。ビームフォーミングまたは空間フィルタリングは、指向性信号の送信または受信用のセンサアレイで使用される信号処理技術である。これは、特定の角度の信号が建設的な干渉を経験し、一方他の信号が破壊的な干渉を経験するようにアレイ内の要素を結合することによって達成される。ビームフォーミングは、空間選択性を達成するために送信側と受信側の両方で使用できる。全指向性の受信／送信と比較した改善は、アレイの方向性として知られている。送信時にアレイの指向性を変更するためには、ビームフォーマは各送信機での信号の位相及び相対振幅を制御して、波面で建設的な干渉と破壊的な干渉のパターンを作り出す。受信時、異なるセンサからの情報は、予想される放射のパターンが優先的に観察されるように組み合わされる。

【0019】

第１のビームフォーマ２１０は、第１のマイクロホンアレイ１２４によって検出された近端発話を示す近端発話信号２１３を出力してよい。代わりに、近端発話信号２１３は、第１のマイクロホンアレイ１２４または第１のマイクロホンアレイの中の個々のマイクロホンから直接的にＤＳＰ１１４によって受信されてよい。第２のビームフォーマ２１２は、第２のマイクロホンアレイ１２６によって検出された予測不可能な背景雑音を示す雑音信号２１８を出力してよい。代わりに、雑音信号２１８は、第２のマイクロホンアレイ１２６または第２のマイクロホンアレイの中の個々のマイクロホンから直接的にＤＳＰ１１４によって受信されてよい。

【0020】

近端発話信号２１３は、遠端参加者１０６からのデジタル処理された着信電気通信信号１１２ａ’とともに、エコーキャンセラ２１４によって受信されてよい。エコーキャンセルは、エコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。このプロセスは、主観的な品質を改善することに加えて、エコーがネットワーク全体で移動するのを防ぐことによって無音抑制を通して達成される容量を増加させる。音響エコー（経時的にかなり変動する場合がある、マイクロホンによって反射され、録音される、ラウドスピーカからの音声）、及びラインエコー（音響エコーよりも変動がはるかに少ない、例えば送信電線と受信電線との間の結合、インピーダンス不一致、電気反射などによって引き起こされる電気的なインパルス）を含む一意の特性を有する様々なタイプのエコー及びエコーの原因がある。しかしながら、実際には、すべてのタイプのエコーを処理するために同じ技術が使用されるため、音声エコーキャンセラは音声エコーだけではなくラインエコーも除去できる。エコーキャンセルは、送信信号または受信信号で多少の遅延をもって再現する、最初に送信された信号を最初に認識することを必要とする。エコーが認識されると、エコーはそれを送信信号または受信信号から差し引くことによって取り除くことができる。この技術は、一般的に、デジタルシグナルプロセッサまたはソフトウェアを使用し、デジタルで実装されるが、技術はアナログ回路でも実装できる。

【0021】

エコーキャンセラ２１４の出力は、ノイズサプレッサ２１６で、第２のビームフォーマ２１２からの雑音信号２１８（すなわち、予測不可能な雑音）及びインフォテインメントシステム１１６からのインフォテインメント音声信号２２０（すなわち、予測可能な雑音）と混合されてよい。ノイズサプレッサ２１６で、近端発話信号２１３を雑音信号２１８及び／またはインフォテインメント音声信号２２０と混合することによって、車両１０４内の１つ以上の不要な音源から音響エネルギーを効果的に除去することができる。車両のインフォテインメントシステム１１６内の既知の音声ストリームから再生する音声（例えば、音楽、効果音、及び映画音声からの台詞）は、予測可能な雑音と見なされてよく、ノイズキャンセルシステム１２８への直接的な入力として使用され、近端発話信号２１３から除去または抑制され得る。さらに、埋め込みマイクロホンによって取り込まれた追加の不要かつ予測不可能な雑音（例えば、子供の叫び声及び背景会話）もノイズキャンセルシステム１２８への直接的な入力として使用され得る。不要な雑音は、発信電気通信信号１１２ｂとして遠端参加者に通信される前に、雑音信号２１８及びインフォテインメント音声信号２２０に基づいて、ノイズサプレッサ２１６によって近端発話信号２１３から除去または抑制され得る。雑音抑制は、取り込んだ信号から背景雑音を取り除く音声プリプロセッサである。

【0022】

雑音が抑制された近端発話信号２１３’は、ノイズサプレッサ２１６から出力されてよく、エコーサプレッサ２２２での遠端参加者からの処理された着信電気通信信号１１２ａ’と混合されてよい。エコー抑制は、エコーキャンセルと同様に、エコーが作り出されるのを防ぐ、またはエコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。エコーサプレッサは、回路上で一方向に移動する音声信号を検出し、次いで他方向に大きな損失を挿入することによって機能する。通常、回路の遠端にあるエコーサプレッサは、エコーサプレッサが回路の近端から着信する音声を検出すると、この損失を追加する。この追加された損失によって、発話者は、自身の声を聞かないようになる。

【0023】

エコーサプレッサ２２２からの出力は、次いで自動利得制御装置（ＡＧＣ）２２４で自動利得制御を受けてよい。ＡＧＣ２２４は、入力信号の振幅の変動にも関わらず、その出力で制御された信号振幅を提供し得る。平均またはピーク出力信号レベルは、入出力利得を適切な値に動的に調整するために使用され、回路がより広い範囲の入力信号レベルで十分に機能できるようにする。ＡＧＣ２２４からの出力は、次いで近端発話信号を等化するために、等化器２２６によって受け取られてよい。等化は、電子信号内の周波数成分間のバランスを調整するプロセスである。等化器は、特定の周波数バンドまたは「周波数範囲」のエネルギーを強化（ブースト）する、または弱める（削減する）。

【0024】

等化器２２６からの出力は、損失制御を受けるために損失制御装置２２８に送信されてよい。出力は、次いでコンフォートノイズジェネレータ（ＣＮＧ）２３０を通過してよい。ＣＮＧ２３０は、受信される信号がない期間中にコンフォートノイズを挿入するモジュールである。ＣＮＧは、不連続送信（ＤＴＸ）と関連して使用されてよい。ＤＴＸは、送信機のスイッチが、無音期間中オフになることを意味する。したがって、背景音響雑音は、受信側（例えば、遠端）で突然消える。これは、受信者（例えば、遠端参加者）にとって非常に煩わしい場合がある。無音期間がかなり長い場合、受信者は、回線が切れたとさえ考える可能性がある。これらの問題を克服するために、送信のスイッチがオフになるたびに、「コンフォートノイズ」が受信側（すなわち、遠端）で生成されてよい。コンフォートノイズはＣＮＧによって生成される。コンフォートノイズが発話期間中に送信された背景音響雑音のコンフォートノイズと十分に適合される場合、発話期間の間のギャップは、受信者が会話中に切替に気が付かないように埋めることができる。雑音は常に変化するので、コンフォートノイズジェネレータ２３０は定期的に更新されてよい。

【0025】

ＣＮＧ２３０からの出力は、次いで発信電気通信信号１１２ｂとして電気通信システムによって、電気通信交換の遠端参加者に送信されてよい。発信電気通信信号から直接的に雑音入力を除去することによって、ユーザーの遠端通信相手は、はるかに高い信号対雑音比、通話品質、及び発話明瞭度を与えられ得る。

【0026】

ノイズキャンセルシステム１２８は、電気通信交換の遠端参加者での近端発話明瞭度を改善するとして示され、説明されているが、任意の通信交換の遠端で近端発話明瞭度を改善するために用いられてよい。例えば、ノイズキャンセルシステム１２８は、遠端（つまり、バーチャルパーソナルアシスタント）での発話認識を最適化するためにバーチャルパーソナルアシスタンス（ＶＰＡ）アプリケーションとの関連で使用されてよい。したがって、背景（不要な）雑音は、ＶＰＡとの通信交換の近端発話から同様に抑制または除去され得る。

【0027】

図３は、遠端電気通信のためのノイズキャンセル方法３００を示す簡略化された例示的な流れ図である。ステップ３０５で、近端発話は、第１のマイクロホンアレイ１２４などのマイクロホンアレイによってノイズキャンセルシステム１２８で受け取られてよい。一方、ノイズキャンセルシステム１２８は、ステップ３１０で示すように、第２のマイクロホンアレイ１２６からの予測不可能な雑音及び／またはインフォテインメントシステム１１６からの予測可能な雑音などの不要な音源からの音声入力ストリームを受け取る場合がある。近端発話は、電気通信交換の遠端参加者が受信するための発信電気通信信号１１２ｂに処理されてよい。したがって、ステップ３１５で、近端発話信号は、エコーがすでに存在してからそれを取り除くことによって音声品質を改善するためのエコーキャンセル動作を受ける場合がある。上述のように、エコーキャンセルは、送信信号または受信信号で多少の遅延をもって再現する、最初に送信された信号を最初に認識することを必要とする。エコーが認識されると、エコーはそれを送信信号または受信信号から差し引くことによって取り除くことができる。

【0028】

近端発話信号は、ステップ３１０で受け取られた雑音入力、及び遠端参加者のための着信電気通信信号とともにノイズサプレッサで受信されてよい（ステップ３２０）。ノイズキャンセル中、ステップ３２５で示すように、雑音は近端発話信号から除去または抑制され得る。ステップ３３０で、近端発話信号の中の発話の明瞭度は、外部からの音によるマスキングの効果を低減または除去することによって復元されてよい。近端発話信号は、次いで、ステップ３３５に示すように、着信電気通信信号を使用し、エコー抑制を受けてよい。上述のように、エコー抑制は、エコーキャンセルと同様に、エコーが作り出されるのを防ぐ、またはエコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。近端発話信号は、それが発信電気通信信号として電気通信ネットワークを介して遠端参加者に送信される（ステップ３４５）前に、ステップ３４０で追加の音声フィルタリングを受けてよい。一方で、着信電気通信信号は、スピーカを通して車室内で再生されてよい（ステップ３５０）。

【0029】

図４は、本開示の１つ以上の実施形態に係る、車両１０４の車室１２０内での例示的なマイクロホン配置を示す。例えば、近端発話をとらえるための第１のマイクロホンアレイ１２４からの第１のマイクロホン１２４ａは、１つ以上のヘッドレスト４１０に埋め込まれてよい。また、雑音をとらえるための第２のマイクロホンアレイ１２６からの第２のマイクロホン１２６ａは、１つ以上のヘッドレスト４１０、ヘッドライナー（図示せず）などに埋め込まれてよい。図示するように、ユーザーの口に可能な限り近くのように、車室１２０に対して乗客の内部に向かって位置決めされたマイクロホンは、車室に対して乗客の外部に位置決めされたマイクロホンと比較すると、信号の反射エネルギーを最小限に抑え得る。これは、車室に対して乗客の外部に位置決めされたマイクロホンが、ガラスなどの、車室１２０を囲む反射面４１２からより多くの反射エネルギーを受け取る場合があるためである。近端発話信号の反射エネルギーを最小限に抑えると、電気通信の遠端での発話明瞭度が上がる場合がある。図４に示すマイクロホンの配置及び／または場所は、例に過ぎない。マイクロホンアレイの正確な場所は、境界及び車両の内部のサービスエリアに依存する。

【0030】

図５は、車両用のヘッドレストベースの電気通信システムの例示的なセットアップを示す。前方を向く第１のマイクロホンアレイ５０２は、電気通信交換の近端発話を受け取るために助手席ヘッドレスト５０６の前部５０４の近くに配置されてよい。後方を向く第２のマイクロホンアレイ５０８は、背景発話を含む雑音を受け取るために助手席ヘッドレスト５０６の後部５１０の近くに配置されてよい。図６は、車両用のヘッドレストベースの電気通信システムの別の例示的なセットアップを示す。前方を向く第１のマイクロホンアレイ６０２は、電気通信交換の近端発話を受け取るために助手席ヘッドレスト６０６の前部６０４の近くに配置されてよい。前方を向く第２のマイクロホンアレイ６０８は、背景発話を含む雑音を受け取るために後部乗客ヘッドレスト６１２の前部６１０の近くに配置されてよい。図４と同様に、図５及び図６に示すマイクロホンアレイの正確な場所は、境界及び車両内部のサービスエリアに依存する。

【0031】

図７〜図１０は、車両１０４などの車両の車室１２０内のノイズキャンセルシステム１２８（図示せず）のためのサンプルマイクロホン構成の様々な平面図を示す。図１及び図２に関連して説明するマイクロホン及びマイクロホンアレイと同様に、図７〜図１０に示す様々なマイクロホンアレイ及び／または個々のマイクロホンは、車載通信システムまたは電気通信システム１１０などの車両通信システムに関連して機能するためにデジタルシグナルプロセッサ１１４と通信してよい。例えば、図７は、本開示の１つ以上の実施形態に係る、第１のサンプルマイクロホン構成を示す車両１０４の平面図である。図示するように、ノイズキャンセルシステム１２８（図示せず）は、少なくとも２つのマイクロホン−第１のマイクロホン７１０ａ及び第２のマイクロホン７１０ｂ−を含む少なくとも１つのマイクロホンアレイ７１０を含んでよい。第１の及び第２のマイクロホンは、離間した場所にある第１のヘッドレスト７１４の外面７１２に取り付けられてよい。第１のヘッドレスト７１４は、運転者側のヘッドレストであってよい。

【0032】

第１のヘッドレスト７１４の外面７１２は、内向き側面７１６と、外向き側面７１８とを含んでよい。内向き側面７１６は、反射面４１２（図４を参照）を含む車両１０４の側面により近い外向き側面７１８よりも車室１２０の中心により近い。図７に示すように、第１の及び第２のマイクロホン７１０ａ、７１０ｂは、第１のヘッドレスト７１４の内向き側面７１６と同一平面で位置決めされてよい。第１の及び第２のマイクロホン７１０ａ、７１０ｂは、車両１０４に対して少なくとも長手方向で離間されてよい。したがって、第１の及び第２のマイクロホンを隔てる距離は、長手方向に向けられた少なくとも１つの第１のリスニングゾーン７２０及び第２のリスニングゾーン７２２を作り出すために、少なくとも長手方向の距離Ｘを含んでよい。マイクロホンアレイ７１０の２つのマイクロホンの間の長手方向の距離Ｘは、着信音声の方向、一般的に前部または後部の表示を示してよい。したがって、第１のリスニングゾーン７２０は、前部座席列を含む領域などの、車室１２０の前方領域を包含してよい。一方、リスニングゾーン７２２は、後部乗客座席を含む領域などの、第１のリスニングゾーン７２０の後方に向けられる領域を包含してよい。一実施形態では、第１のマイクロホンと第２のマイクロホン７１０ａ、７１０ｂとの間の長手方向の距離Ｘは、ほぼ１インチであってよいが、マイクロホン間の他の距離も用いて、着信音声の方向、前方または後方の表示を示してもよい。

【0033】

デジタルシグナルプロセッサ１１４は、図２に示すように、マイクロホンアレイ７１０からの音声を示すマイクロホン信号を受信し、マイクロホン信号に基づいて、音声が第１のリスニングゾーン７２０の方向から受け取られるのか、それとも第２のリスニングゾーン７２２の方向から受け取られるのかを識別するようにプログラムされ得る。例えば、デジタルシグナルプロセッサ１１４は、第１の及び第２のマイクロホン７１０ａ、７１０ｂからのマイクロホン信号を比較し、２つのマイクロホンのそれぞれにおけるマイクロホン信号の受信の時間差に基づいて、第１のリスニングゾーンまたは第２のリスニングゾーンのどちらかからの音声の方向を局所化してよい。さらに、デジタルシグナルプロセッサ１１４は、不要なまたは騒がしい背景雑音と同等と見なし得る、第２のリスニングゾーン７２２（の方向）からの音声を示すマイクロホン信号を抑制または除去し得る。他方、デジタルシグナルプロセッサ１１４は、所望の近端発話と同等と見なし得る、第１のリスニングゾーン７２０（の方向）からの音を示すマイクロホン信号を、通信交換の遠端参加者に送信してよい。

【0034】

一実施形態によれば、第１の及び第２のマイクロホン７１０ａ、７１０ｂは、全方向性マイクロホンであってよい。別の実施形態によれば、第１の及び第２のマイクロホン７１０ａ、７１０ｂは、対応するリスニングゾーンの方向に方向性を有する指向性マイクロホンであってよい。したがって、着信音声は、第１のリスニングゾーン７２０からの音声が遠端参加者に送信され得、一方第２のリスニングゾーン７２２からの音声が抑制され得るように、マイクロホンの方向性に基づいて減衰されてよい。

【0035】

図８は、本開示の１つ以上の実施形態に係る、別のサンプルマイクロホン構成を示す車両１０４の平面図である。図示するように、ノイズキャンセルシステム１２８（図示せず）は、第１のヘッドレスト８１４の外面８１２の底面８１１に取り付けられた少なくとも２つのマイクロホン−第１のマイクロホン８１０ａ及び第２のマイクロホン８１０ｂ−を含む、少なくとも１つの第１のマイクロホンアレイ８１０を含んでよい。図７と同様に、第１の及び第２のマイクロホン８１０ａ、８１０ｂは、車両１０４に対して長手方向に離間されてよい。したがって、第１の及び第２のマイクロホン８１０ａ、８１０ｂを隔てる距離は、長手方向に向けられた少なくとも１つの第１のリスニングゾーン８２０及び第２のリスニングゾーン８２２を作り出すために、少なくとも長手方向の距離Ｘを含んでよい。図７に関して説明するように、デジタルシグナルプロセッサ１１４は、図２に示すように、マイクロホンアレイ８１０からの音声を示すマイクロホン信号を受信し、マイクロホン信号に基づいて、音声が第１のリスニングゾーン８２０の方向から受け取られるのか、それとも第２のリスニングゾーン８２２の方向から受け取られるのかを識別するようにプログラムされてよい。さらに、デジタルシグナルプロセッサ１１４は、不要なまたは騒がしい背景雑音と同等と見なし得る、第２のリスニングゾーン８２２（の方向）からの音声を示すマイクロホン信号を抑制または除去し得る。他方、デジタルシグナルプロセッサ１１４は、所望の近端発話と同等と見なし得る、第１のリスニングゾーン８２０（の方向）からの音声を示すマイクロホン信号を、通信交換の遠端参加者に送信してよい。

【0036】

図８に示すように、第１の及び第２のマイクロホン８１０ａ、８１０ｂは、車両１０４に対して横方向に離間されてもよい。したがって、第１の及び第２のマイクロホン８１０ａ、８１０ｂを隔てる距離は、第１のリスニングゾーン８２０が車両１０４に対して横方向に向けられた２つのリスニングサブゾーンを含むように、横方向距離Ｙをさらに含んでよい。例えば、第１のリスニングサブゾーン８２０ａは、運転者の座席８２４を取り囲む領域を包含してよい。一方、第２のリスニングサブゾーン８２０ｂは、助手席８２６を取り囲む領域を包含してよい。第１のマイクロホンアレイ８１０の２つのマイクロホン８１０ａ、８１０ｂの間の横方向距離Ｙは、着信音声の方向、一般に左または右の表示を示してよく、その結果、デジタルシグナルプロセッサ１１４は、マイクロホン信号に基づいて、音声が、第１のリスニングサブゾーン８２０ａの方向から受け取られるのか、それとも第２のリスニングサブゾーン８２０ｂの方向から受け取られるのかをさらに識別してよい。さらに、デジタルシグナルプロセッサ１１４は、不要なまたは騒がしい背景雑音と同等と見なし得る第２のリスニングサブゾーン８２０ｂ（の方向）からの音声を示すマイクロホン信号を抑制または除去するようにプログラムされてよい。他方、デジタルシグナルプロセッサ１１４は、所望の近端発話と同等と見なし得る、第１のリスニングサブゾーン８２０ａ（の方向）からの音声を示すマイクロホン信号を通信交換の遠端参加者に送信してよい。

【0037】

さらに図８に示すように、ノイズキャンセルシステムは、第１のヘッドレスト８１４に側面に沿って隣接する第２のヘッドレスト８３２の底面８３０に取り付けられた少なくとも２つのマイクロホン−第１のマイクロホン８２８ａ及び第２のマイクロホン８２８ｂを含む、第２のマイクロホンアレイ８２８を含んでよい。第２のマイクロホンアレイの構成は、第１のマイクロホンアレイの構成に酷似する場合がある。したがって、第２のマイクロホンアレイ８２８の第１の及び第２のマイクロホン８２８ａ、８２８ｂも、着信音声の方向、一般に左または右の追加の表示を示すために、長手方向と横方向の両方に離間されてよく、その結果、デジタルシグナルプロセッサ１１４は、マイクロホン信号に基づいて、音声が第１のリスニングサブゾーン８２０ａの方向から受け取られるのか、それとも第２のリスニングサブゾーン８２０ｂの方向から受け取られるのかをさらに識別してよい。第１の及び／または第２のマイクロホンアレイのマイクロホンは、全方向性マイクロホンまたは指向性マイクロホンのどちらかであってよい。

【0038】

図９は、図８に示すスリーゾーン構成に類似したさらに別のサンプルマイクロホン構成を示す。図示するように、第１のマイクロホンアレイ９１０は、例えば図７に示すマイクロホンアレイなど、ヘッドレスト９１４の内向き側面９１６に取り付けられてよい。図７と同様に、第１のマイクロホンアレイ９１０は、着信音声の方向、前方または後方の表示を示すために、長手方向の距離で隔てられた、離間した場所で内向き側面９１６に位置決めされた第１のマイクロホン９１０ａ及び第２のマイクロホン９１０ｂを含んでよい。したがって、上述のように、第１の及び第２のマイクロホン９１０ａ、９１０ｂの長手方向の分離によって、長手方向に向けられた第１のリスニングゾーン９２０及び第２のリスニングゾーン９２２を作り出し得る。第１の及び第２のマイクロホン９３４ａ、９３４ｂを含む第２のマイクロホンアレイ９３４は、着信音声の方向、左または右の表示を示すために、（図８においてのように）第２のヘッドレストによりむしろバックミラーアセンブリ９３６に配置されてよく、その結果、デジタルシグナルプロセッサ１１４は、マイクロホン信号に基づいて、音声が第１のリスニングサブゾーン９２０ａの方向から受け取られるのか、それとも第２のリスニングサブゾーン９２０ｂの方向から受け取られるのかをさらに識別してよい。第１のマイクロホンアレイ９１０の第１の及び第２のマイクロホン９１０ａ、９１０ｂは全方向性マイクロホンであってよい。さらに、第２のマイクロホンアレイ９３４の第１の及び第２のマイクロホン９３４ａ、９３４ｂは指向性マイクロホンであってよい。

【0039】

図１０は、本開示の１つ以上の実施形態に係る、さらに別のサンプルマイクロホン構成を示す車両１００４の平面図である。図示するように、車両１００４は、３列の座席を含んでよい。図１０に示すマイクロホン構成は、図７〜図９に関して上述した様々な構成の組み合わせを用いてよい。例えば、座席の第１列１０４０は、図８に示すように、第１のヘッドレスト１０１４の中の第１のマイクロホンアレイ１０１０及び第２のヘッドレスト１０３０の中の第２のマイクロホンアレイ１０２８を含んでよい。したがって、第１の及び第２のマイクロホンアレイ１０１０、１０２８のそれぞれの中のマイクロホンは、それぞれの対応するヘッドレストの底面１０１１に取り付けられ、長手方向と横方向との両方で離間されてよい。横方向の間隔によって、上述のように、横方向の向きを有する第１のリスニングサブゾーン１０２０ａ及び第２のリスニングサブゾーン１０２０ｂを含む第１のリスニングゾーン１０２０を作り出し得る。さらに、長手方向の間隔によって、第１のリスニングゾーン１０２０の後方に第２のリスニングゾーン１０２２を作り出し得る。

【0040】

座席の第２列１０４４の中の少なくとも１つのヘッドレスト１０４２は、図７に示すマイクロホンアレイ７１０に類似した第３のマイクロホンアレイ１０４６を含んでよい。したがって、第３のマイクロホンアレイ１０４６のマイクロホンは、ヘッドレスト１０４２の内向き側面１０１６に取り付けられ、少なくとも長手方向で離間されて、座席の第３の列１０５２を包含する、第２のリスニングゾーン１０２２の後方に第３のリスニングゾーン１０５０を作り出し得る。車両１００４は、一般に車両の中心線に沿って、車両の天井またはヘッドライナー（図示せず）の中に位置決めされた追加のマイクロホンアレイ１０５４を含んでよい。これらの追加のマイクロホンアレイ１０５４は、全方向性であってよい（図示するような）３つまたは４つのマイクロホンを含んでよい。図１０に示すすべての様々なマイクロホンアレイは、ノイズキャンセルシステム１２８の一部を形成してよく、図７〜図９に関連して説明するのと同様にデジタルシグナルプロセッサ１１４と協調してよい。さらに、図１０に示すヘッドレストの１つ以上は、少なくとも１つのスピーカ１０５６をさらに含んでよい。ヘッドレストに取り付けたスピーカ１０５６は、通信交換の遠端参加者からの音声を送信するために用いられてよい。

【0041】

図１１は、例のダッキングシステム８００を示す。ダッキングシステム８００は、着信音声信号８０４をとらえ、受信するように構成されたマイクロホンアレイ８０２を含んでよい。アレイ８０２は、上述されたアレイに類似してよく、電気通信交換の近端参加者（すなわち、音源車両の運転者または別の乗員）から発話を受け取るために車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。アレイ８０２の配置及び場所は、例えば図５〜図１０に関して本明細書に説明するように配置されてよい。アレイ８０２は、４つのマイクロホンを含むとして図１１に示されるが、より多いまたはより少ないマイクロホンを含んでもよい。着信音声信号８０４は、音楽、背景雑音、交通雑音などを含む他の雑音信号だけではなく、人間の発話を含んでもよい。アレイ８０２は、２つのマイクロホンを含むとして示されているが、アレイ８０２は、４マイクロホンのアレイを含む２つ以上のマイクロホンを含んでもよい。マイクロホンは、指向性マイクロホンであるであろう。

【0042】

システム８００は、リアルタイム発話クリーニングアルゴリズム、または第１のビームフォーマ２１０及び第２のビームフォーマ２１２などの上述のビームフォーマに類似したビームフォーマ８０６を含んでよい。ビームフォーマ８０６はこのように説明されているが、このブロックは、雑音抑制、エコーキャンセルなどの他の処理を含んでもよい。ビームフォーミングまたは空間フィルタリングは、指向性信号送信または受信用のセンサアレイで使用される信号処理技術である。これは、特定の角度での信号が建設的な干渉を経験し、一方他の信号が破壊的な干渉を経験するようにアレイの中の要素を結合することによって達成される。ビームフォーミングは、空間選択性を達成するために送信側と受信側の両方で使用されてよい。全指向性の受信／送信と比較した改善は、アレイの方向性として知られている。送信時にアレイの指向性を変更するためには、ビームフォーマは各送信機での信号の位相及び相対振幅を制御して、波面で建設的な干渉と破壊的な干渉のパターンを作り出す。受信時、異なるセンサからの情報は、予想される放射のパターンが優先的に観察されるように組み合わされる。

【0043】

ビームフォーマ８０６は、発話信号８１０を出力してよい。発話信号８１０は、着信音声信号８０４から取り除かれた人間の声の信号を含む場合がある。すなわち、雑音は取り除かれ、人間の発話だけを残してよい。これは、着信音声信号が人間の発話を含むか否かを認識する際に役立つ場合がある。また、発話信号８１０は、鼻歌、指を鳴らすこと、拍手など、任意のタイプの人間が生成した音声を含む場合があり、発話に制限されない。人間の発話が含まれているかどうかを判断する従来の方法は、多くの場合、大きなメモリ及び高い処理能力を必要とする。さらに、人間の発話が存在するかどうかを判断するための広範な処理の必要性のために、既存のシステムは、着信信号を発話信号として確認できるようになる前に待ち時間を要する。これにより、会話の始まりはダッキングステーションに送られない場合がある。さらに、「ああ」、「ふふん」、または「シーッ」などの発話ではないが、人間の雑音は、発話信号として分類されない場合があり、ダッキングステーションに適切に送られない場合もある。

【0044】

ビームフォーマは、関心のある空間的領域に依存するので、その領域からのありとあらゆる音声はダッキングステーションにただちに送られる。これは発話以外の発声を含み、発話を検出するために使用されているビームフォーミングのため、関心領域はすでに定義され、局所化されているため、待ち時間の問題は回避される。

【0045】

音楽及び他の媒体などの車両スピーカから発する人間が生成したのではない音声は、車両の使用中に再生される場合がある。しかしながら、会話中、乗員は、より容易な聞き取り及び傾聴を可能にするために発話以外の音声を下げることを望む場合がある。音声ダッキングは、人間の音量制御との相互作用を必要とせずに自動的にこれを可能にしてよい。図１１では、これらの発話以外の音声８１２は、ブロック８１４で手作業で制御される場合もあれば、ブロック８１６で自動的にダッキングされる場合もある。ダッキングされた発話信号は、車両音声システムに送信されてよい。

【0046】

図１２は、図１１のシステム８００の例のプロセス１２００を示す。プロセス１２００は、プロセッサ１１４がアレイ８０２から着信音声信号を受信してよいブロック１２０５で開始する。

【0047】

ブロック１２１０で、プロセッサ１１４は、ビームフォーマ８０６を適用してよい。ビームフォーマ８０６は、人間の発話音声を空間的に除外してよい。

【0048】

ブロック１２１５で、プロセッサ１１４は、例えば乗員からの音響信号が検出されるかどうかなど、関心のある空間領域が検出されるかどうかを、ブロック１２１０から判断してよい。すなわち、閾値を超える関心領域からの任意の音響入力である。そうである場合、閾値は、発話以外のメディアレベルを調整するために使用される。これは、各乗員の頭部／口の領域に向かって輝くスポットライトとして視覚化できる。そうである場合、プロセス１２００はブロック１２２０に進み、そうではない場合、プロセスはブロック１２０５に戻る。

【0049】

ブロック１２２０で、プロセッサ１１４は、車両音声システムによって再生されている発話以外または人間以外の音声の音量を調整してよい。音量は、所定のレベルまで下がるように調整されてよい。すなわち、音量は減少してよいが、依然として乗員に可聴であってよい。音量は、完全にミュートされてよい。プレイバックは、完全に休止されてよい。さらにまたは代わりに、音量はミュートまでフェードダウンされる場合もあれば、所定のレベルまでフェードダウンされる場合もある。音量レベルは、ユーザー、ユーザー選択などによって事前に定められてよい。

【0050】

ブロック１２２５で、プロセッサ１１４は、人間の発話が依然として存在しているのか否かを判断するためにビームフォーミングされた音声信号を監視してよい。人間の発話が所定の時間量の間存在しない場合、次いで会話は終わった可能性がある。この場合、発話以外の音声はその通常の音量レベルで再生を再開してよい。音声が検出されなくなると、プロセス１２００はブロック１２３０に進む。

【0051】

ブロック１２３０で、プロセッサ１１４は、調整される発話以外の音声のプレイバックを指示してよい。これは、ダッキングの前に、以前に確立された音量レベルで再開するために発話以外の音声のプレイバックを指示することを含む場合がある。ダッキング中の調整と同様に、フェード、ミュートなどもプレイバック音量の調整の１つの形である場合がある。

【0052】

プロセス１２００は次いで終了してよい。

【0053】

したがって、人間が生成した音声を検出し、車両スピーカから発せられる人間以外の音声をダッキングするためのシステムが開示される。局所的なマイクロホン及び／またはビームフォーミング技術が使用されるため、閾値を超える任意の音響音声は人間が生成したと見なされる場合がある。したがって、音声が人間によって生成されているのかどうかを判断するための煩雑な信号処理を回避できる。さらに、指向性マイクロホンは必要ではない。本明細書に説明するビームフォーミングプロセスは、人間が生成した音声の実行可能性を高めるために、雑音抑制、エコーキャンセル、及び他の信号処理とともに使用できる。

【0054】

本明細書に説明するコントローラまたはデバイスの任意の１つ以上は、様々なプログラミング言語及び／または技術を使用し、作成されたコンピュータプログラムからコンパイルまたは解釈され得るコンピュータ実行可能命令を含む。一般に、（マイクロホンプロセッサなどの）プロセッサは、例えばメモリ、コンピュータ可読媒体などから命令を受け取り、命令を実行する。処理ユニットは、ソフトウェアプログラムの命令を実行できる非一過性のコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体は、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、またはその任意の適切な組み合わせであってよいが、これに限定されるものではない。

【0055】

例示的な実施形態を上述したが、これらの実施形態が本発明のあらゆる可能な形式を記載するとは意図されない。むしろ、明細書で用いられた単語は限定ではなく説明のための単語であり、本発明の精神及び範囲から逸脱することなく様々な変更が成され得ることが理解される。さらに、様々な実装実施形態の特徴は組み合わされて本発明のさらなる実施形態を形成し得る。

【図1】