【解決手段】車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも2つのマイクロホンと、人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて、人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
前記プロセッサは、閾値を超えている前記着信音声信号のうちの少なくとも1つの着信音声信号の音響入力に少なくとも部分的に基づいて、前記人間が生成した音声が前記音声信号内で検出されるかどうかを判断するようにプログラムされる、請求項1に記載のシステム。
前記プロセッサは、人間の発話が少なくとも1つの発信音声信号内で検出されることに応えて、前記人間以外の音声の音量を下げるようにプログラムされる、請求項1に記載のシステム。
前記プロセッサは、前記ビームフォーミングにより、少なくとも1つの着信音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用するようにプログラムされる、請求項1に記載のシステム。
前記プロセッサは、前記マイクロホンアレイが音響信号を検出することに応えて、前記マイクロホンアレイで人間が生成した音声を検出するようにプログラムされる、請求項1に記載のシステム。
人間が生成した音声が前記音声信号内で検出されるかどうかを前記判断することは、閾値を超えている前記音声信号内の音響入力に少なくとも部分的に基づく、請求項10に記載の媒体。
前記ビームフォーミングにより、少なくとも1つの音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用することをさらに含む、請求項10に記載の媒体。
人間が生成した音声が少なくとも1つの音声信号内で検出されるかどうかを前記判断することは、閾値を超えている前記音声信号内の音響入力に少なくとも部分的に基づく、請求項18に記載の方法。
【発明の概要】
【課題を解決するための手段】
【0004】
車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも2つのマイクロホンと、人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
【0005】
車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体は、車両マイクロホンアレイから着信音声信号を受信することと、着信音声信号にビームフォーミングを適用することと、人間が生成した音声が音声信号内で検出されるかどうかを判断することと、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示することを含む。
【0006】
車両内でラウドスピーカシステムを介して音声を生成するための方法は、車両マイクロホンアレイから着信音声信号を受信することと、着信音声信号にビームフォーミングを適用することと、人間が生成した音声が音声信号内で検出されるかどうかを判断することと、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示することとを含む。
例えば、本願は以下の項目を提供する。
(項目1)
車両ラウドスピーカシステムであって、
マイクロホンアレイを形成する少なくとも2つのマイクロホンと、
人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、
上記マイクロホンアレイから着信音声信号を受信し、
上記着信音声信号にビームフォーミングを適用し、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断し、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するように上記ラウドスピーカに指示する
ようにプログラムされるプロセッサと
を備える、上記車両ラウドスピーカシステム。
(項目2)
上記プロセッサは、閾値を超えている上記着信音声信号のうちの少なくとも1つの着信音声信号の音響入力に少なくとも部分的に基づいて、上記人間が生成した音声が上記音声信号内で検出されるかどうかを判断するようにプログラムされる、上記項目に記載のシステム。
(項目3)
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載のシステム。
(項目4)
上記音響入力は、上記ビームフォーミングを介して上記特定の領域と関連付けられる、上記項目のいずれか一項に記載のシステム。
(項目5)
上記マイクロホンアレイは、上記車両内の乗員のヘッドレストに隣接して配置される、上記項目のいずれか一項に記載のシステム。
(項目6)
上記プロセッサは、人間の発話が少なくとも1つの発信音声信号内で検出されることに応えて、上記人間以外の音声の音量を下げるようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目7)
上記プロセッサは、上記ビームフォーミングにより、少なくとも1つの着信音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目8)
上記プロセッサは、上記マイクロホンアレイが音響信号を検出することに応えて、上記マイクロホンアレイで人間が生成した音声を検出するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目9)
上記マイクロホンアレイは4つのマイクロホンを含む、上記項目のいずれか一項に記載のシステム。
(項目10)
車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体であって、
車両マイクロホンアレイから着信音声信号を受信することと、
上記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、上記非一過性コンピュータ可読媒体。
(項目11)
人間が生成した音声が上記音声信号内で検出されるかどうかを上記判断することは、閾値を超えている上記音声信号内の音響入力に少なくとも部分的に基づく、上記項目に記載の媒体。
(項目12)
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載の媒体。
(項目13)
上記音響入力は、上記ビームフォーミングを介して上記特定の領域と関連付けられる、上記項目のいずれか一項に記載の媒体。
(項目14)
上記マイクロホンアレイは、上記車両内の乗員のヘッドレストに隣接して配置される、上記項目のいずれか一項に記載の媒体。
(項目15)
人間の発話が少なくとも1つの音声信号内で検出されることに応えて、上記人間以外の音声の音量を下げることをさらに含む、上記項目のいずれか一項に記載の媒体。
(項目16)
上記ビームフォーミングにより、少なくとも1つの音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用することをさらに含む、上記項目のいずれか一項に記載の媒体。
(項目17)
上記マイクロホンアレイが音響信号を検出することに応えて、上記マイクロホンアレイで人間が生成した音声を検出することをさらに含む、上記項目のいずれか一項に記載の媒体。
(項目18)
車両内のラウドスピーカシステムを介して音声を生成するための方法であって、
車両マイクロホンアレイから着信音声信号を受信することと、
上記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、上記方法。
(項目19)
人間が生成した音声が少なくとも1つの音声信号内で検出されるかどうかを上記判断することは、閾値を超えている上記音声信号内の音響入力に少なくとも部分的に基づく、上記項目に記載の方法。
(項目20)
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載の方法。
(摘要)
車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも2つのマイクロホンと、人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて、人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
【発明を実施するための形態】
【0008】
必要に応じて、本発明の詳細な実施形態が本明細書中に開示されるが、開示された実施形態は、様々なかつ代替の形式で具現化され得る発明の単なる例であることが理解されよう。図は必ずしも縮尺通りではなく、一部の特徴は、特定の構成要素の詳細を示すために誇張または最小化される場合がある。したがって、本明細書に開示される具体的な構造的及び機能的詳細は、限定的と解釈されるべきではなく、単に、本発明を様々に用いるように当業者を教示するための代表的な基礎として解釈されるべきである。
【0009】
本明細書に説明するのは、音声ダッキングに対するビームフォーミング手法である。音声ダッキングシステムは、ユーザーが会話を試みているときに、気を散らす媒体信号の音量を自動的に調整するのに役立ち得る。発話が完了すると、媒体は、より大きい音量を再開するために自動的に調整してよい。マイクロホンのアレイ及びビームフォーミングプロセスは、ユーザーの頭部及び口の回りの関心のある狭い空間領域から発話信号を受信し、識別するために使用されてよい。これにより、その関心領域からのありとあらゆる音声を音声ダッキングシステムに即座に送ることができる。
【0010】
音声ダッキングは、明確な通信を促進するための一般的な方法である。音声信号が存在するとき、媒体の音量は、通信することを容易にするために途切れなく「ダッキング」、つまり減衰される。多くの既存のシステムは、いつマイクロホンの着信発話信号が人間の発話を含むのかを決定するためにアルゴリズムを使用する。これらのアルゴリズムは煩雑で大きく、着信信号を発話信号として確認し得る前に所与の待ち時間を要する場合がある。つまり、ユーザーの発言の始まりは、ダッキングエンジンに送られない場合がある。さらに、「ああ」、「ふふん」、または「シーッ」などの発話以外の発声は、発話信号として分類されない場合があり、したがってダッキングエンジンに送られない。
【0011】
本明細書に開示する概念は関心のある空間的な領域に依存しているので、その関心領域からのありとあらゆる音声はダッキングエンジンに自動的にかつ即座に送られる。これは、発話以外の発声を含み、関心領域は、ビームフォーミングを介してすでに定義及び局所化されているのでいかなる遅延も必要としない。したがって、指向性マイクロホン及び煩雑な信号処理は回避される。
【0012】
また、本開示は、遠端ユーザー体験を最適化するための車載ノイズキャンセルシステムも説明する。ノイズキャンセルシステムは、電気通信の交換またはバーチャルパーソナルアシスタントとの対話などを含む通信交換の遠端における近端発話の明瞭度を改善し得る。ノイズキャンセルシステムは、電気通信デバイスのマイクロホンからだけではなく、車両からのリアルタイム音響入力を組み込んでよい。さらに、車両内の1つ以上の不要な音源からの音響エネルギーを効果的に除去するために、車の中に取り付けられた小型の埋め込みマイクロホンからの音声信号を処理し、発信電気通信信号の中に混合することができる。埋め込みマイクロホンによって取り込まれた不要な雑音(例えば、子供の叫び声及び背景の会話)に加えて、車両のインフォテインメントシステムの中の既知の音声ストリームから再生する音声(例えば、音楽、効果音、及び映画音声の台詞)は、ノイズキャンセルシステムへの直接的な入力として使用され得る。したがって、直接的な入力として、これらのストリームは、発信電気通信信号から除去することができ、このようにしてユーザーの遠端の通信相手にはるかに高い信号対雑音比、通話品質、及び発話明瞭度を与える。
【0013】
図1は、セルラー基地局108を介して、車両104内の近端参加者102と車両外部に位置する遠隔の遠端参加者106との間の電気通信を容易にするための電気通信ネットワーク100を示す。車両104は、
図1では電気通信信号112として集合的に示す着信電気通信信号及び発信電気通信信号を処理するための電気通信システム110を含んでよい。電気通信システム110は、以下により詳細に説明するように、音声電気通信信号を処理するためのデジタルシグナルプロセッサ(DSP)114を含んでよい。別の実施形態によれば、DSP114は、電気通信システム110とは別個のモジュールであってよい。車両インフォテインメントシステム116は、電気通信システム110に接続されてよい。第1の変換器118またはスピーカは、車室120内部の電気通信交換の近端参加者に着信電気通信信号を送信し得る。したがって、第1の変換器118は、近端参加者に近接して位置する場合もあれば、近端参加者によって占有される特定の座席場所で局所化された音場を生成する場合もある。第2の変換器122は、車両のインフォテインメントシステム116からの音声(例えば、音楽、効果音、及び映画音声からの台詞)を送信してよい。
【0014】
第1のマイクロホンアレイ124は、電気通信の近端参加者(すなわち、音源車両の運転者または別の乗員)の発話を受け取るために車室120内に位置してよい。第2のマイクロホンアレイ126は、集合的に雑音と呼ばれる不要な音源(例えば、交通雑音、風切り音、背景発話、及びマルチメディアコンテンツ)を検出するために車室120内に位置する場合がある。集合的に、電気通信システム110、DSP114、インフォテインメントシステム116、変換器118、122、及びマイクロホンアレイ124、126は、遠端電気通信用の車室内ノイズキャンセルシステム128を形成し得る。
【0015】
図2は、
図1に示すノイズキャンセルシステム128のブロック図である。
図2に示すように、遠端参加者(図示せず)からの着信電気通信信号112aは、DSP114によって受信されてよい。DSP114は、本明細書に開示する音声アプリケーションに特有である場合がある、デジタル信号処理の操作上の必要のために最適化された特殊マイクロホンプロセッサ及び/または集積回路の組み合わせなどのハードウェアベースのデバイスであってよい。着信電気通信信号112aは、自動利得制御装置(AGC)202で自動利得制御を受ける場合がある。AGC202は、入力信号の振幅の変動にも関わらず、その出力で制御された信号振幅を提供し得る。平均またはピーク出力信号レベルは、入出力利得を適切な値に動的に調整するために使用され、回路がより広い範囲の入力信号レベルと十分に機能できるようにする。AGC202からの出力は、次いで損失制御を受けるために損失制御装置204によって受け取られてよく、それは次いで着信電気通信信号112aを等化するために等化器206に渡される。等化は、電子信号内の周波数成分間のバランスを調整するプロセスである。等化器は、特定の周波数バンドまたは「周波数範囲」のエネルギーを強化(ブースト)する、または弱める(削減する)。
【0016】
等化器206の出力は、リミッタ208によって受け取られてよい。リミッタは、指定された入力電力またはレベル未満の信号が、影響を受けずに通過できるようにし、一方この閾値を超えるより強い信号のピークを減衰させる回路である。制限することは、一種のダイナミックレンジ圧縮である。これは、デバイスの出力の指定された特性(通常は振幅)が所定の値を超えるのを防ぐ任意のプロセスである。リミッタは、突然の音量ピークが発生するのを防ぐために、ライブ音声及び放送アプリケーションでの安全装置として一般的である。デジタル処理された着信電気通信信号112a’は、次いで電気通信交換の近端参加者への可聴送信のために第1の変換器118によって受信されてよい。
【0017】
同じく
図2に示すように、ノイズキャンセルシステム128は、第1のマイクロホンアレイ124と、第2のマイクロホンアレイ126とを含んでよい。第1のマイクロホンアレイ124は、電気通信交換の近端参加者(すなわち、音源車両の運転者または別の乗員)からの発話を受け取るために、車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。第1のマイクロホンアレイ124は、反射面から可能限り遠くにある一方、近端の参加者に可能な限り近くに位置決めされてよい。例えば、第1のマイクロホンアレイ124は、
図4に示すようにヘッドレストまたはヘッドライナーなどに埋め込まれてよい。第2のマイクロホンアレイ126は、集合的に雑音と呼ばれる不要な音源(例えば、交通雑音、風切り音、背景発話、及びマルチメディアコンテンツ)を検出するために車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。
【0018】
第1のマイクロホンアレイと第2のマイクロホンアレイへの両方の入力、近端発話及びノイズは、それぞれDSP114を使用し、処理され得る。第1のマイクロホンアレイ124からの第1の音声信号209の集合(すなわち、近端発話を示す)は、ビームフォーミングのための第1のビームフォーマ210に送られてよい。一方、第2の音声信号211の集合(すなわち、雑音を示す)は、第2のビームフォーマ212に送られてよい。ビームフォーミングまたは空間フィルタリングは、指向性信号の送信または受信用のセンサアレイで使用される信号処理技術である。これは、特定の角度の信号が建設的な干渉を経験し、一方他の信号が破壊的な干渉を経験するようにアレイ内の要素を結合することによって達成される。ビームフォーミングは、空間選択性を達成するために送信側と受信側の両方で使用できる。全指向性の受信/送信と比較した改善は、アレイの方向性として知られている。送信時にアレイの指向性を変更するためには、ビームフォーマは各送信機での信号の位相及び相対振幅を制御して、波面で建設的な干渉と破壊的な干渉のパターンを作り出す。受信時、異なるセンサからの情報は、予想される放射のパターンが優先的に観察されるように組み合わされる。
【0019】
第1のビームフォーマ210は、第1のマイクロホンアレイ124によって検出された近端発話を示す近端発話信号213を出力してよい。代わりに、近端発話信号213は、第1のマイクロホンアレイ124または第1のマイクロホンアレイの中の個々のマイクロホンから直接的にDSP114によって受信されてよい。第2のビームフォーマ212は、第2のマイクロホンアレイ126によって検出された予測不可能な背景雑音を示す雑音信号218を出力してよい。代わりに、雑音信号218は、第2のマイクロホンアレイ126または第2のマイクロホンアレイの中の個々のマイクロホンから直接的にDSP114によって受信されてよい。
【0020】
近端発話信号213は、遠端参加者106からのデジタル処理された着信電気通信信号112a’とともに、エコーキャンセラ214によって受信されてよい。エコーキャンセルは、エコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。このプロセスは、主観的な品質を改善することに加えて、エコーがネットワーク全体で移動するのを防ぐことによって無音抑制を通して達成される容量を増加させる。音響エコー(経時的にかなり変動する場合がある、マイクロホンによって反射され、録音される、ラウドスピーカからの音声)、及びラインエコー(音響エコーよりも変動がはるかに少ない、例えば送信電線と受信電線との間の結合、インピーダンス不一致、電気反射などによって引き起こされる電気的なインパルス)を含む一意の特性を有する様々なタイプのエコー及びエコーの原因がある。しかしながら、実際には、すべてのタイプのエコーを処理するために同じ技術が使用されるため、音声エコーキャンセラは音声エコーだけではなくラインエコーも除去できる。エコーキャンセルは、送信信号または受信信号で多少の遅延をもって再現する、最初に送信された信号を最初に認識することを必要とする。エコーが認識されると、エコーはそれを送信信号または受信信号から差し引くことによって取り除くことができる。この技術は、一般的に、デジタルシグナルプロセッサまたはソフトウェアを使用し、デジタルで実装されるが、技術はアナログ回路でも実装できる。
【0021】
エコーキャンセラ214の出力は、ノイズサプレッサ216で、第2のビームフォーマ212からの雑音信号218(すなわち、予測不可能な雑音)及びインフォテインメントシステム116からのインフォテインメント音声信号220(すなわち、予測可能な雑音)と混合されてよい。ノイズサプレッサ216で、近端発話信号213を雑音信号218及び/またはインフォテインメント音声信号220と混合することによって、車両104内の1つ以上の不要な音源から音響エネルギーを効果的に除去することができる。車両のインフォテインメントシステム116内の既知の音声ストリームから再生する音声(例えば、音楽、効果音、及び映画音声からの台詞)は、予測可能な雑音と見なされてよく、ノイズキャンセルシステム128への直接的な入力として使用され、近端発話信号213から除去または抑制され得る。さらに、埋め込みマイクロホンによって取り込まれた追加の不要かつ予測不可能な雑音(例えば、子供の叫び声及び背景会話)もノイズキャンセルシステム128への直接的な入力として使用され得る。不要な雑音は、発信電気通信信号112bとして遠端参加者に通信される前に、雑音信号218及びインフォテインメント音声信号220に基づいて、ノイズサプレッサ216によって近端発話信号213から除去または抑制され得る。雑音抑制は、取り込んだ信号から背景雑音を取り除く音声プリプロセッサである。
【0022】
雑音が抑制された近端発話信号213’は、ノイズサプレッサ216から出力されてよく、エコーサプレッサ222での遠端参加者からの処理された着信電気通信信号112a’と混合されてよい。エコー抑制は、エコーキャンセルと同様に、エコーが作り出されるのを防ぐ、またはエコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。エコーサプレッサは、回路上で一方向に移動する音声信号を検出し、次いで他方向に大きな損失を挿入することによって機能する。通常、回路の遠端にあるエコーサプレッサは、エコーサプレッサが回路の近端から着信する音声を検出すると、この損失を追加する。この追加された損失によって、発話者は、自身の声を聞かないようになる。
【0023】
エコーサプレッサ222からの出力は、次いで自動利得制御装置(AGC)224で自動利得制御を受けてよい。AGC224は、入力信号の振幅の変動にも関わらず、その出力で制御された信号振幅を提供し得る。平均またはピーク出力信号レベルは、入出力利得を適切な値に動的に調整するために使用され、回路がより広い範囲の入力信号レベルで十分に機能できるようにする。AGC224からの出力は、次いで近端発話信号を等化するために、等化器226によって受け取られてよい。等化は、電子信号内の周波数成分間のバランスを調整するプロセスである。等化器は、特定の周波数バンドまたは「周波数範囲」のエネルギーを強化(ブースト)する、または弱める(削減する)。
【0024】
等化器226からの出力は、損失制御を受けるために損失制御装置228に送信されてよい。出力は、次いでコンフォートノイズジェネレータ(CNG)230を通過してよい。CNG230は、受信される信号がない期間中にコンフォートノイズを挿入するモジュールである。CNGは、不連続送信(DTX)と関連して使用されてよい。DTXは、送信機のスイッチが、無音期間中オフになることを意味する。したがって、背景音響雑音は、受信側(例えば、遠端)で突然消える。これは、受信者(例えば、遠端参加者)にとって非常に煩わしい場合がある。無音期間がかなり長い場合、受信者は、回線が切れたとさえ考える可能性がある。これらの問題を克服するために、送信のスイッチがオフになるたびに、「コンフォートノイズ」が受信側(すなわち、遠端)で生成されてよい。コンフォートノイズはCNGによって生成される。コンフォートノイズが発話期間中に送信された背景音響雑音のコンフォートノイズと十分に適合される場合、発話期間の間のギャップは、受信者が会話中に切替に気が付かないように埋めることができる。雑音は常に変化するので、コンフォートノイズジェネレータ230は定期的に更新されてよい。
【0025】
CNG230からの出力は、次いで発信電気通信信号112bとして電気通信システムによって、電気通信交換の遠端参加者に送信されてよい。発信電気通信信号から直接的に雑音入力を除去することによって、ユーザーの遠端通信相手は、はるかに高い信号対雑音比、通話品質、及び発話明瞭度を与えられ得る。
【0026】
ノイズキャンセルシステム128は、電気通信交換の遠端参加者での近端発話明瞭度を改善するとして示され、説明されているが、任意の通信交換の遠端で近端発話明瞭度を改善するために用いられてよい。例えば、ノイズキャンセルシステム128は、遠端(つまり、バーチャルパーソナルアシスタント)での発話認識を最適化するためにバーチャルパーソナルアシスタンス(VPA)アプリケーションとの関連で使用されてよい。したがって、背景(不要な)雑音は、VPAとの通信交換の近端発話から同様に抑制または除去され得る。
【0027】
図3は、遠端電気通信のためのノイズキャンセル方法300を示す簡略化された例示的な流れ図である。ステップ305で、近端発話は、第1のマイクロホンアレイ124などのマイクロホンアレイによってノイズキャンセルシステム128で受け取られてよい。一方、ノイズキャンセルシステム128は、ステップ310で示すように、第2のマイクロホンアレイ126からの予測不可能な雑音及び/またはインフォテインメントシステム116からの予測可能な雑音などの不要な音源からの音声入力ストリームを受け取る場合がある。近端発話は、電気通信交換の遠端参加者が受信するための発信電気通信信号112bに処理されてよい。したがって、ステップ315で、近端発話信号は、エコーがすでに存在してからそれを取り除くことによって音声品質を改善するためのエコーキャンセル動作を受ける場合がある。上述のように、エコーキャンセルは、送信信号または受信信号で多少の遅延をもって再現する、最初に送信された信号を最初に認識することを必要とする。エコーが認識されると、エコーはそれを送信信号または受信信号から差し引くことによって取り除くことができる。
【0028】
近端発話信号は、ステップ310で受け取られた雑音入力、及び遠端参加者のための着信電気通信信号とともにノイズサプレッサで受信されてよい(ステップ320)。ノイズキャンセル中、ステップ325で示すように、雑音は近端発話信号から除去または抑制され得る。ステップ330で、近端発話信号の中の発話の明瞭度は、外部からの音によるマスキングの効果を低減または除去することによって復元されてよい。近端発話信号は、次いで、ステップ335に示すように、着信電気通信信号を使用し、エコー抑制を受けてよい。上述のように、エコー抑制は、エコーキャンセルと同様に、エコーが作り出されるのを防ぐ、またはエコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。近端発話信号は、それが発信電気通信信号として電気通信ネットワークを介して遠端参加者に送信される(ステップ345)前に、ステップ340で追加の音声フィルタリングを受けてよい。一方で、着信電気通信信号は、スピーカを通して車室内で再生されてよい(ステップ350)。
【0029】
図4は、本開示の1つ以上の実施形態に係る、車両104の車室120内での例示的なマイクロホン配置を示す。例えば、近端発話をとらえるための第1のマイクロホンアレイ124からの第1のマイクロホン124aは、1つ以上のヘッドレスト410に埋め込まれてよい。また、雑音をとらえるための第2のマイクロホンアレイ126からの第2のマイクロホン126aは、1つ以上のヘッドレスト410、ヘッドライナー(図示せず)などに埋め込まれてよい。図示するように、ユーザーの口に可能な限り近くのように、車室120に対して乗客の内部に向かって位置決めされたマイクロホンは、車室に対して乗客の外部に位置決めされたマイクロホンと比較すると、信号の反射エネルギーを最小限に抑え得る。これは、車室に対して乗客の外部に位置決めされたマイクロホンが、ガラスなどの、車室120を囲む反射面412からより多くの反射エネルギーを受け取る場合があるためである。近端発話信号の反射エネルギーを最小限に抑えると、電気通信の遠端での発話明瞭度が上がる場合がある。
図4に示すマイクロホンの配置及び/または場所は、例に過ぎない。マイクロホンアレイの正確な場所は、境界及び車両の内部のサービスエリアに依存する。
【0030】
図5は、車両用のヘッドレストベースの電気通信システムの例示的なセットアップを示す。前方を向く第1のマイクロホンアレイ502は、電気通信交換の近端発話を受け取るために助手席ヘッドレスト506の前部504の近くに配置されてよい。後方を向く第2のマイクロホンアレイ508は、背景発話を含む雑音を受け取るために助手席ヘッドレスト506の後部510の近くに配置されてよい。
図6は、車両用のヘッドレストベースの電気通信システムの別の例示的なセットアップを示す。前方を向く第1のマイクロホンアレイ602は、電気通信交換の近端発話を受け取るために助手席ヘッドレスト606の前部604の近くに配置されてよい。前方を向く第2のマイクロホンアレイ608は、背景発話を含む雑音を受け取るために後部乗客ヘッドレスト612の前部610の近くに配置されてよい。
図4と同様に、
図5及び
図6に示すマイクロホンアレイの正確な場所は、境界及び車両内部のサービスエリアに依存する。
【0031】
図7〜
図10は、車両104などの車両の車室120内のノイズキャンセルシステム128(図示せず)のためのサンプルマイクロホン構成の様々な平面図を示す。
図1及び
図2に関連して説明するマイクロホン及びマイクロホンアレイと同様に、
図7〜
図10に示す様々なマイクロホンアレイ及び/または個々のマイクロホンは、車載通信システムまたは電気通信システム110などの車両通信システムに関連して機能するためにデジタルシグナルプロセッサ114と通信してよい。例えば、
図7は、本開示の1つ以上の実施形態に係る、第1のサンプルマイクロホン構成を示す車両104の平面図である。図示するように、ノイズキャンセルシステム128(図示せず)は、少なくとも2つのマイクロホン−第1のマイクロホン710a及び第2のマイクロホン710b−を含む少なくとも1つのマイクロホンアレイ710を含んでよい。第1の及び第2のマイクロホンは、離間した場所にある第1のヘッドレスト714の外面712に取り付けられてよい。第1のヘッドレスト714は、運転者側のヘッドレストであってよい。
【0032】
第1のヘッドレスト714の外面712は、内向き側面716と、外向き側面718とを含んでよい。内向き側面716は、反射面412(
図4を参照)を含む車両104の側面により近い外向き側面718よりも車室120の中心により近い。
図7に示すように、第1の及び第2のマイクロホン710a、710bは、第1のヘッドレスト714の内向き側面716と同一平面で位置決めされてよい。第1の及び第2のマイクロホン710a、710bは、車両104に対して少なくとも長手方向で離間されてよい。したがって、第1の及び第2のマイクロホンを隔てる距離は、長手方向に向けられた少なくとも1つの第1のリスニングゾーン720及び第2のリスニングゾーン722を作り出すために、少なくとも長手方向の距離Xを含んでよい。マイクロホンアレイ710の2つのマイクロホンの間の長手方向の距離Xは、着信音声の方向、一般的に前部または後部の表示を示してよい。したがって、第1のリスニングゾーン720は、前部座席列を含む領域などの、車室120の前方領域を包含してよい。一方、リスニングゾーン722は、後部乗客座席を含む領域などの、第1のリスニングゾーン720の後方に向けられる領域を包含してよい。一実施形態では、第1のマイクロホンと第2のマイクロホン710a、710bとの間の長手方向の距離Xは、ほぼ1インチであってよいが、マイクロホン間の他の距離も用いて、着信音声の方向、前方または後方の表示を示してもよい。
【0033】
デジタルシグナルプロセッサ114は、
図2に示すように、マイクロホンアレイ710からの音声を示すマイクロホン信号を受信し、マイクロホン信号に基づいて、音声が第1のリスニングゾーン720の方向から受け取られるのか、それとも第2のリスニングゾーン722の方向から受け取られるのかを識別するようにプログラムされ得る。例えば、デジタルシグナルプロセッサ114は、第1の及び第2のマイクロホン710a、710bからのマイクロホン信号を比較し、2つのマイクロホンのそれぞれにおけるマイクロホン信号の受信の時間差に基づいて、第1のリスニングゾーンまたは第2のリスニングゾーンのどちらかからの音声の方向を局所化してよい。さらに、デジタルシグナルプロセッサ114は、不要なまたは騒がしい背景雑音と同等と見なし得る、第2のリスニングゾーン722(の方向)からの音声を示すマイクロホン信号を抑制または除去し得る。他方、デジタルシグナルプロセッサ114は、所望の近端発話と同等と見なし得る、第1のリスニングゾーン720(の方向)からの音を示すマイクロホン信号を、通信交換の遠端参加者に送信してよい。
【0034】
一実施形態によれば、第1の及び第2のマイクロホン710a、710bは、全方向性マイクロホンであってよい。別の実施形態によれば、第1の及び第2のマイクロホン710a、710bは、対応するリスニングゾーンの方向に方向性を有する指向性マイクロホンであってよい。したがって、着信音声は、第1のリスニングゾーン720からの音声が遠端参加者に送信され得、一方第2のリスニングゾーン722からの音声が抑制され得るように、マイクロホンの方向性に基づいて減衰されてよい。
【0035】
図8は、本開示の1つ以上の実施形態に係る、別のサンプルマイクロホン構成を示す車両104の平面図である。図示するように、ノイズキャンセルシステム128(図示せず)は、第1のヘッドレスト814の外面812の底面811に取り付けられた少なくとも2つのマイクロホン−第1のマイクロホン810a及び第2のマイクロホン810b−を含む、少なくとも1つの第1のマイクロホンアレイ810を含んでよい。
図7と同様に、第1の及び第2のマイクロホン810a、810bは、車両104に対して長手方向に離間されてよい。したがって、第1の及び第2のマイクロホン810a、810bを隔てる距離は、長手方向に向けられた少なくとも1つの第1のリスニングゾーン820及び第2のリスニングゾーン822を作り出すために、少なくとも長手方向の距離Xを含んでよい。
図7に関して説明するように、デジタルシグナルプロセッサ114は、
図2に示すように、マイクロホンアレイ810からの音声を示すマイクロホン信号を受信し、マイクロホン信号に基づいて、音声が第1のリスニングゾーン820の方向から受け取られるのか、それとも第2のリスニングゾーン822の方向から受け取られるのかを識別するようにプログラムされてよい。さらに、デジタルシグナルプロセッサ114は、不要なまたは騒がしい背景雑音と同等と見なし得る、第2のリスニングゾーン822(の方向)からの音声を示すマイクロホン信号を抑制または除去し得る。他方、デジタルシグナルプロセッサ114は、所望の近端発話と同等と見なし得る、第1のリスニングゾーン820(の方向)からの音声を示すマイクロホン信号を、通信交換の遠端参加者に送信してよい。
【0036】
図8に示すように、第1の及び第2のマイクロホン810a、810bは、車両104に対して横方向に離間されてもよい。したがって、第1の及び第2のマイクロホン810a、810bを隔てる距離は、第1のリスニングゾーン820が車両104に対して横方向に向けられた2つのリスニングサブゾーンを含むように、横方向距離Yをさらに含んでよい。例えば、第1のリスニングサブゾーン820aは、運転者の座席824を取り囲む領域を包含してよい。一方、第2のリスニングサブゾーン820bは、助手席826を取り囲む領域を包含してよい。第1のマイクロホンアレイ810の2つのマイクロホン810a、810bの間の横方向距離Yは、着信音声の方向、一般に左または右の表示を示してよく、その結果、デジタルシグナルプロセッサ114は、マイクロホン信号に基づいて、音声が、第1のリスニングサブゾーン820aの方向から受け取られるのか、それとも第2のリスニングサブゾーン820bの方向から受け取られるのかをさらに識別してよい。さらに、デジタルシグナルプロセッサ114は、不要なまたは騒がしい背景雑音と同等と見なし得る第2のリスニングサブゾーン820b(の方向)からの音声を示すマイクロホン信号を抑制または除去するようにプログラムされてよい。他方、デジタルシグナルプロセッサ114は、所望の近端発話と同等と見なし得る、第1のリスニングサブゾーン820a(の方向)からの音声を示すマイクロホン信号を通信交換の遠端参加者に送信してよい。
【0037】
さらに
図8に示すように、ノイズキャンセルシステムは、第1のヘッドレスト814に側面に沿って隣接する第2のヘッドレスト832の底面830に取り付けられた少なくとも2つのマイクロホン−第1のマイクロホン828a及び第2のマイクロホン828bを含む、第2のマイクロホンアレイ828を含んでよい。第2のマイクロホンアレイの構成は、第1のマイクロホンアレイの構成に酷似する場合がある。したがって、第2のマイクロホンアレイ828の第1の及び第2のマイクロホン828a、828bも、着信音声の方向、一般に左または右の追加の表示を示すために、長手方向と横方向の両方に離間されてよく、その結果、デジタルシグナルプロセッサ114は、マイクロホン信号に基づいて、音声が第1のリスニングサブゾーン820aの方向から受け取られるのか、それとも第2のリスニングサブゾーン820bの方向から受け取られるのかをさらに識別してよい。第1の及び/または第2のマイクロホンアレイのマイクロホンは、全方向性マイクロホンまたは指向性マイクロホンのどちらかであってよい。
【0038】
図9は、
図8に示すスリーゾーン構成に類似したさらに別のサンプルマイクロホン構成を示す。図示するように、第1のマイクロホンアレイ910は、例えば
図7に示すマイクロホンアレイなど、ヘッドレスト914の内向き側面916に取り付けられてよい。
図7と同様に、第1のマイクロホンアレイ910は、着信音声の方向、前方または後方の表示を示すために、長手方向の距離で隔てられた、離間した場所で内向き側面916に位置決めされた第1のマイクロホン910a及び第2のマイクロホン910bを含んでよい。したがって、上述のように、第1の及び第2のマイクロホン910a、910bの長手方向の分離によって、長手方向に向けられた第1のリスニングゾーン920及び第2のリスニングゾーン922を作り出し得る。第1の及び第2のマイクロホン934a、934bを含む第2のマイクロホンアレイ934は、着信音声の方向、左または右の表示を示すために、(
図8においてのように)第2のヘッドレストによりむしろバックミラーアセンブリ936に配置されてよく、その結果、デジタルシグナルプロセッサ114は、マイクロホン信号に基づいて、音声が第1のリスニングサブゾーン920aの方向から受け取られるのか、それとも第2のリスニングサブゾーン920bの方向から受け取られるのかをさらに識別してよい。第1のマイクロホンアレイ910の第1の及び第2のマイクロホン910a、910bは全方向性マイクロホンであってよい。さらに、第2のマイクロホンアレイ934の第1の及び第2のマイクロホン934a、934bは指向性マイクロホンであってよい。
【0039】
図10は、本開示の1つ以上の実施形態に係る、さらに別のサンプルマイクロホン構成を示す車両1004の平面図である。図示するように、車両1004は、3列の座席を含んでよい。
図10に示すマイクロホン構成は、
図7〜
図9に関して上述した様々な構成の組み合わせを用いてよい。例えば、座席の第1列1040は、
図8に示すように、第1のヘッドレスト1014の中の第1のマイクロホンアレイ1010及び第2のヘッドレスト1030の中の第2のマイクロホンアレイ1028を含んでよい。したがって、第1の及び第2のマイクロホンアレイ1010、1028のそれぞれの中のマイクロホンは、それぞれの対応するヘッドレストの底面1011に取り付けられ、長手方向と横方向との両方で離間されてよい。横方向の間隔によって、上述のように、横方向の向きを有する第1のリスニングサブゾーン1020a及び第2のリスニングサブゾーン1020bを含む第1のリスニングゾーン1020を作り出し得る。さらに、長手方向の間隔によって、第1のリスニングゾーン1020の後方に第2のリスニングゾーン1022を作り出し得る。
【0040】
座席の第2列1044の中の少なくとも1つのヘッドレスト1042は、
図7に示すマイクロホンアレイ710に類似した第3のマイクロホンアレイ1046を含んでよい。したがって、第3のマイクロホンアレイ1046のマイクロホンは、ヘッドレスト1042の内向き側面1016に取り付けられ、少なくとも長手方向で離間されて、座席の第3の列1052を包含する、第2のリスニングゾーン1022の後方に第3のリスニングゾーン1050を作り出し得る。車両1004は、一般に車両の中心線に沿って、車両の天井またはヘッドライナー(図示せず)の中に位置決めされた追加のマイクロホンアレイ1054を含んでよい。これらの追加のマイクロホンアレイ1054は、全方向性であってよい(図示するような)3つまたは4つのマイクロホンを含んでよい。
図10に示すすべての様々なマイクロホンアレイは、ノイズキャンセルシステム128の一部を形成してよく、
図7〜
図9に関連して説明するのと同様にデジタルシグナルプロセッサ114と協調してよい。さらに、
図10に示すヘッドレストの1つ以上は、少なくとも1つのスピーカ1056をさらに含んでよい。ヘッドレストに取り付けたスピーカ1056は、通信交換の遠端参加者からの音声を送信するために用いられてよい。
【0041】
図11は、例のダッキングシステム800を示す。ダッキングシステム800は、着信音声信号804をとらえ、受信するように構成されたマイクロホンアレイ802を含んでよい。アレイ802は、上述されたアレイに類似してよく、電気通信交換の近端参加者(すなわち、音源車両の運転者または別の乗員)から発話を受け取るために車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。アレイ802の配置及び場所は、例えば
図5〜
図10に関して本明細書に説明するように配置されてよい。アレイ802は、4つのマイクロホンを含むとして
図11に示されるが、より多いまたはより少ないマイクロホンを含んでもよい。着信音声信号804は、音楽、背景雑音、交通雑音などを含む他の雑音信号だけではなく、人間の発話を含んでもよい。アレイ802は、2つのマイクロホンを含むとして示されているが、アレイ802は、4マイクロホンのアレイを含む2つ以上のマイクロホンを含んでもよい。マイクロホンは、指向性マイクロホンであるであろう。
【0042】
システム800は、リアルタイム発話クリーニングアルゴリズム、または第1のビームフォーマ210及び第2のビームフォーマ212などの上述のビームフォーマに類似したビームフォーマ806を含んでよい。ビームフォーマ806はこのように説明されているが、このブロックは、雑音抑制、エコーキャンセルなどの他の処理を含んでもよい。ビームフォーミングまたは空間フィルタリングは、指向性信号送信または受信用のセンサアレイで使用される信号処理技術である。これは、特定の角度での信号が建設的な干渉を経験し、一方他の信号が破壊的な干渉を経験するようにアレイの中の要素を結合することによって達成される。ビームフォーミングは、空間選択性を達成するために送信側と受信側の両方で使用されてよい。全指向性の受信/送信と比較した改善は、アレイの方向性として知られている。送信時にアレイの指向性を変更するためには、ビームフォーマは各送信機での信号の位相及び相対振幅を制御して、波面で建設的な干渉と破壊的な干渉のパターンを作り出す。受信時、異なるセンサからの情報は、予想される放射のパターンが優先的に観察されるように組み合わされる。
【0043】
ビームフォーマ806は、発話信号810を出力してよい。発話信号810は、着信音声信号804から取り除かれた人間の声の信号を含む場合がある。すなわち、雑音は取り除かれ、人間の発話だけを残してよい。これは、着信音声信号が人間の発話を含むか否かを認識する際に役立つ場合がある。また、発話信号810は、鼻歌、指を鳴らすこと、拍手など、任意のタイプの人間が生成した音声を含む場合があり、発話に制限されない。人間の発話が含まれているかどうかを判断する従来の方法は、多くの場合、大きなメモリ及び高い処理能力を必要とする。さらに、人間の発話が存在するかどうかを判断するための広範な処理の必要性のために、既存のシステムは、着信信号を発話信号として確認できるようになる前に待ち時間を要する。これにより、会話の始まりはダッキングステーションに送られない場合がある。さらに、「ああ」、「ふふん」、または「シーッ」などの発話ではないが、人間の雑音は、発話信号として分類されない場合があり、ダッキングステーションに適切に送られない場合もある。
【0044】
ビームフォーマは、関心のある空間的領域に依存するので、その領域からのありとあらゆる音声はダッキングステーションにただちに送られる。これは発話以外の発声を含み、発話を検出するために使用されているビームフォーミングのため、関心領域はすでに定義され、局所化されているため、待ち時間の問題は回避される。
【0045】
音楽及び他の媒体などの車両スピーカから発する人間が生成したのではない音声は、車両の使用中に再生される場合がある。しかしながら、会話中、乗員は、より容易な聞き取り及び傾聴を可能にするために発話以外の音声を下げることを望む場合がある。音声ダッキングは、人間の音量制御との相互作用を必要とせずに自動的にこれを可能にしてよい。
図11では、これらの発話以外の音声812は、ブロック814で手作業で制御される場合もあれば、ブロック816で自動的にダッキングされる場合もある。ダッキングされた発話信号は、車両音声システムに送信されてよい。
【0046】
図12は、
図11のシステム800の例のプロセス1200を示す。プロセス1200は、プロセッサ114がアレイ802から着信音声信号を受信してよいブロック1205で開始する。
【0047】
ブロック1210で、プロセッサ114は、ビームフォーマ806を適用してよい。ビームフォーマ806は、人間の発話音声を空間的に除外してよい。
【0048】
ブロック1215で、プロセッサ114は、例えば乗員からの音響信号が検出されるかどうかなど、関心のある空間領域が検出されるかどうかを、ブロック1210から判断してよい。すなわち、閾値を超える関心領域からの任意の音響入力である。そうである場合、閾値は、発話以外のメディアレベルを調整するために使用される。これは、各乗員の頭部/口の領域に向かって輝くスポットライトとして視覚化できる。そうである場合、プロセス1200はブロック1220に進み、そうではない場合、プロセスはブロック1205に戻る。
【0049】
ブロック1220で、プロセッサ114は、車両音声システムによって再生されている発話以外または人間以外の音声の音量を調整してよい。音量は、所定のレベルまで下がるように調整されてよい。すなわち、音量は減少してよいが、依然として乗員に可聴であってよい。音量は、完全にミュートされてよい。プレイバックは、完全に休止されてよい。さらにまたは代わりに、音量はミュートまでフェードダウンされる場合もあれば、所定のレベルまでフェードダウンされる場合もある。音量レベルは、ユーザー、ユーザー選択などによって事前に定められてよい。
【0050】
ブロック1225で、プロセッサ114は、人間の発話が依然として存在しているのか否かを判断するためにビームフォーミングされた音声信号を監視してよい。人間の発話が所定の時間量の間存在しない場合、次いで会話は終わった可能性がある。この場合、発話以外の音声はその通常の音量レベルで再生を再開してよい。音声が検出されなくなると、プロセス1200はブロック1230に進む。
【0051】
ブロック1230で、プロセッサ114は、調整される発話以外の音声のプレイバックを指示してよい。これは、ダッキングの前に、以前に確立された音量レベルで再開するために発話以外の音声のプレイバックを指示することを含む場合がある。ダッキング中の調整と同様に、フェード、ミュートなどもプレイバック音量の調整の1つの形である場合がある。
【0052】
プロセス1200は次いで終了してよい。
【0053】
したがって、人間が生成した音声を検出し、車両スピーカから発せられる人間以外の音声をダッキングするためのシステムが開示される。局所的なマイクロホン及び/またはビームフォーミング技術が使用されるため、閾値を超える任意の音響音声は人間が生成したと見なされる場合がある。したがって、音声が人間によって生成されているのかどうかを判断するための煩雑な信号処理を回避できる。さらに、指向性マイクロホンは必要ではない。本明細書に説明するビームフォーミングプロセスは、人間が生成した音声の実行可能性を高めるために、雑音抑制、エコーキャンセル、及び他の信号処理とともに使用できる。
【0054】
本明細書に説明するコントローラまたはデバイスの任意の1つ以上は、様々なプログラミング言語及び/または技術を使用し、作成されたコンピュータプログラムからコンパイルまたは解釈され得るコンピュータ実行可能命令を含む。一般に、(マイクロホンプロセッサなどの)プロセッサは、例えばメモリ、コンピュータ可読媒体などから命令を受け取り、命令を実行する。処理ユニットは、ソフトウェアプログラムの命令を実行できる非一過性のコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体は、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、またはその任意の適切な組み合わせであってよいが、これに限定されるものではない。
【0055】
例示的な実施形態を上述したが、これらの実施形態が本発明のあらゆる可能な形式を記載するとは意図されない。むしろ、明細書で用いられた単語は限定ではなく説明のための単語であり、本発明の精神及び範囲から逸脱することなく様々な変更が成され得ることが理解される。さらに、様々な実装実施形態の特徴は組み合わされて本発明のさらなる実施形態を形成し得る。