特開2021-110948(P2021-110948A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ハーマン インターナショナル インダストリーズ, インコーポレイテッドの特許一覧

特開2021-110948車両音声システム用の空間発話分離による音声ダッキング
<>
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000003
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000004
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000005
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000006
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000007
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000008
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000009
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000010
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000011
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000012
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000013
  • 特開2021110948-車両音声システム用の空間発話分離による音声ダッキング 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2021-110948(P2021-110948A)
(43)【公開日】2021年8月2日
(54)【発明の名称】車両音声システム用の空間発話分離による音声ダッキング
(51)【国際特許分類】
   G10L 21/034 20130101AFI20210705BHJP
   G10L 21/0364 20130101ALI20210705BHJP
   G10L 25/78 20130101ALI20210705BHJP
   G10L 21/0272 20130101ALI20210705BHJP
   G10L 21/0208 20130101ALI20210705BHJP
   H04R 3/00 20060101ALI20210705BHJP
   H04R 3/02 20060101ALI20210705BHJP
   H04R 1/40 20060101ALI20210705BHJP
【FI】
   G10L21/034
   G10L21/0364
   G10L25/78
   G10L21/0272 100A
   G10L21/0208 100A
   H04R3/00 310
   H04R3/02
   H04R3/00 320
   H04R1/40 320Z
【審査請求】未請求
【請求項の数】20
【出願形態】OL
【外国語出願】
【全頁数】22
(21)【出願番号】特願2020-219773(P2020-219773)
(22)【出願日】2020年12月29日
(31)【優先権主張番号】62/954,991
(32)【優先日】2019年12月30日
(33)【優先権主張国】US
(31)【優先権主張番号】17/130,175
(32)【優先日】2020年12月22日
(33)【優先権主張国】US
(71)【出願人】
【識別番号】512168283
【氏名又は名称】ハーマン インターナショナル インダストリーズ, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】クリストファー マイケル トレステン
(72)【発明者】
【氏名】ライリー ウィントン
(72)【発明者】
【氏名】クリストファー ルドウィグ
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220AA02
5D220BA06
5D220BB04
5D220BC05
(57)【要約】      (修正有)
【課題】車両音声システム用の空間発話分離による音声ダッキングのためのシステムを提供する。
【解決手段】車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも2つのマイクロホンと、人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて、人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
【選択図】図12
【特許請求の範囲】
【請求項1】
車両ラウドスピーカシステムであって、
マイクロホンアレイを形成する少なくとも2つのマイクロホンと、
人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、
前記マイクロホンアレイから着信音声信号を受信し、
前記着信音声信号にビームフォーミングを適用し、
人間が生成した音声が前記音声信号内で検出されるかどうかを判断し、
人間が生成した音声が検出されることに応えて、前記人間以外の音声を調整するように前記ラウドスピーカに指示する
ようにプログラムされるプロセッサと
を備える、前記車両ラウドスピーカシステム。
【請求項2】
前記プロセッサは、閾値を超えている前記着信音声信号のうちの少なくとも1つの着信音声信号の音響入力に少なくとも部分的に基づいて、前記人間が生成した音声が前記音声信号内で検出されるかどうかを判断するようにプログラムされる、請求項1に記載のシステム。
【請求項3】
前記音響入力は、前記車両内の特定の領域と関連付けられる、請求項2に記載のシステム。
【請求項4】
前記音響入力は、前記ビームフォーミングを介して前記特定の領域と関連付けられる、請求項3に記載のシステム。
【請求項5】
前記マイクロホンアレイは、前記車両内の乗員のヘッドレストに隣接して配置される、請求項2に記載のシステム。
【請求項6】
前記プロセッサは、人間の発話が少なくとも1つの発信音声信号内で検出されることに応えて、前記人間以外の音声の音量を下げるようにプログラムされる、請求項1に記載のシステム。
【請求項7】
前記プロセッサは、前記ビームフォーミングにより、少なくとも1つの着信音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用するようにプログラムされる、請求項1に記載のシステム。
【請求項8】
前記プロセッサは、前記マイクロホンアレイが音響信号を検出することに応えて、前記マイクロホンアレイで人間が生成した音声を検出するようにプログラムされる、請求項1に記載のシステム。
【請求項9】
前記マイクロホンアレイは4つのマイクロホンを含む、請求項1に記載のシステム。
【請求項10】
車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体であって、
車両マイクロホンアレイから着信音声信号を受信することと、
前記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が前記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、前記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、前記非一過性コンピュータ可読媒体。
【請求項11】
人間が生成した音声が前記音声信号内で検出されるかどうかを前記判断することは、閾値を超えている前記音声信号内の音響入力に少なくとも部分的に基づく、請求項10に記載の媒体。
【請求項12】
前記音響入力は、前記車両内の特定の領域と関連付けられる、請求項11に記載の媒体。
【請求項13】
前記音響入力は、前記ビームフォーミングを介して前記特定の領域と関連付けられる、請求項11に記載の媒体。
【請求項14】
前記マイクロホンアレイは、前記車両内の乗員のヘッドレストに隣接して配置される、請求項11に記載の媒体。
【請求項15】
人間の発話が少なくとも1つの音声信号内で検出されることに応えて、前記人間以外の音声の音量を下げることをさらに含む、請求項10に記載の媒体。
【請求項16】
前記ビームフォーミングにより、少なくとも1つの音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用することをさらに含む、請求項10に記載の媒体。
【請求項17】
前記マイクロホンアレイが音響信号を検出することに応えて、前記マイクロホンアレイで人間が生成した音声を検出することをさらに含む、請求項10に記載の媒体。
【請求項18】
車両内のラウドスピーカシステムを介して音声を生成するための方法であって、
車両マイクロホンアレイから着信音声信号を受信することと、
前記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が前記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、前記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、前記方法。
【請求項19】
人間が生成した音声が少なくとも1つの音声信号内で検出されるかどうかを前記判断することは、閾値を超えている前記音声信号内の音響入力に少なくとも部分的に基づく、請求項18に記載の方法。
【請求項20】
前記音響入力は、前記車両内の特定の領域と関連付けられる、請求項18に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、その開示が本明細書で参照することによりその全体で本明細書に援用される、2019年12月30日に出願された米国仮出願第62/954,991号の利益を主張する。
【0002】
本開示は、車両音声システム用の空間発話分離による音声ダッキングのためのシステムに関する。
【背景技術】
【0003】
現在の車室音響は、車室内で発生するいかなる音声も、一般に1つのノイズ刺激として知覚されると断定している。干渉源の一般的な例は、交通雑音、風切り音、乗客の発話、及びマルチメディアコンテンツを含む。これらの雑音源の存在は、発話の明瞭度、信号対雑音比、及び主観的な通話品質を低下させることにより発話の知覚を複雑化している。音声ダッキングは、車両内での品質及び運転者の満足度を高めるために使用され得る。しかしながら、音声信号が人間の発話を含むかどうかを判断するために使用されるアルゴリズムは、多くの場合、煩雑かつ不正確である。
【発明の概要】
【課題を解決するための手段】
【0004】
車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも2つのマイクロホンと、人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
【0005】
車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体は、車両マイクロホンアレイから着信音声信号を受信することと、着信音声信号にビームフォーミングを適用することと、人間が生成した音声が音声信号内で検出されるかどうかを判断することと、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示することを含む。
【0006】
車両内でラウドスピーカシステムを介して音声を生成するための方法は、車両マイクロホンアレイから着信音声信号を受信することと、着信音声信号にビームフォーミングを適用することと、人間が生成した音声が音声信号内で検出されるかどうかを判断することと、人間が生成した音声が検出されることに応えて人間以外の音声を調整するようにラウドスピーカに指示することとを含む。
例えば、本願は以下の項目を提供する。
(項目1)
車両ラウドスピーカシステムであって、
マイクロホンアレイを形成する少なくとも2つのマイクロホンと、
人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、
上記マイクロホンアレイから着信音声信号を受信し、
上記着信音声信号にビームフォーミングを適用し、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断し、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するように上記ラウドスピーカに指示する
ようにプログラムされるプロセッサと
を備える、上記車両ラウドスピーカシステム。
(項目2)
上記プロセッサは、閾値を超えている上記着信音声信号のうちの少なくとも1つの着信音声信号の音響入力に少なくとも部分的に基づいて、上記人間が生成した音声が上記音声信号内で検出されるかどうかを判断するようにプログラムされる、上記項目に記載のシステム。
(項目3)
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載のシステム。
(項目4)
上記音響入力は、上記ビームフォーミングを介して上記特定の領域と関連付けられる、上記項目のいずれか一項に記載のシステム。
(項目5)
上記マイクロホンアレイは、上記車両内の乗員のヘッドレストに隣接して配置される、上記項目のいずれか一項に記載のシステム。
(項目6)
上記プロセッサは、人間の発話が少なくとも1つの発信音声信号内で検出されることに応えて、上記人間以外の音声の音量を下げるようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目7)
上記プロセッサは、上記ビームフォーミングにより、少なくとも1つの着信音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目8)
上記プロセッサは、上記マイクロホンアレイが音響信号を検出することに応えて、上記マイクロホンアレイで人間が生成した音声を検出するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目9)
上記マイクロホンアレイは4つのマイクロホンを含む、上記項目のいずれか一項に記載のシステム。
(項目10)
車両内で音声を生成するラウドスピーカシステムのための命令を含む非一過性コンピュータ可読媒体であって、
車両マイクロホンアレイから着信音声信号を受信することと、
上記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、上記非一過性コンピュータ可読媒体。
(項目11)
人間が生成した音声が上記音声信号内で検出されるかどうかを上記判断することは、閾値を超えている上記音声信号内の音響入力に少なくとも部分的に基づく、上記項目に記載の媒体。
(項目12)
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載の媒体。
(項目13)
上記音響入力は、上記ビームフォーミングを介して上記特定の領域と関連付けられる、上記項目のいずれか一項に記載の媒体。
(項目14)
上記マイクロホンアレイは、上記車両内の乗員のヘッドレストに隣接して配置される、上記項目のいずれか一項に記載の媒体。
(項目15)
人間の発話が少なくとも1つの音声信号内で検出されることに応えて、上記人間以外の音声の音量を下げることをさらに含む、上記項目のいずれか一項に記載の媒体。
(項目16)
上記ビームフォーミングにより、少なくとも1つの音声信号に雑音抑制またはエコーキャンセルのうちの少なくとも1つを適用することをさらに含む、上記項目のいずれか一項に記載の媒体。
(項目17)
上記マイクロホンアレイが音響信号を検出することに応えて、上記マイクロホンアレイで人間が生成した音声を検出することをさらに含む、上記項目のいずれか一項に記載の媒体。
(項目18)
車両内のラウドスピーカシステムを介して音声を生成するための方法であって、
車両マイクロホンアレイから着信音声信号を受信することと、
上記着信音声信号にビームフォーミングを適用することと、
人間が生成した音声が上記音声信号内で検出されるかどうかを判断することと、
人間が生成した音声が検出されることに応えて、上記人間以外の音声を調整するようにラウドスピーカに指示することと
を含む、上記方法。
(項目19)
人間が生成した音声が少なくとも1つの音声信号内で検出されるかどうかを上記判断することは、閾値を超えている上記音声信号内の音響入力に少なくとも部分的に基づく、上記項目に記載の方法。
(項目20)
上記音響入力は、上記車両内の特定の領域と関連付けられる、上記項目のいずれか一項に記載の方法。
(摘要)
車両ラウドスピーカシステムは、マイクロホンアレイを形成する少なくとも2つのマイクロホンと、人間以外の音声を発するように構成された少なくとも1つのラウドスピーカと、マイクロホンアレイから着信音声信号を受信するようにプログラムされたプロセッサとを含む。プロセッサは、着信音声信号にビームフォーミングを適用し、人間が生成した音声が音声信号内で検出されるかどうかを判断し、人間が生成した音声が検出されることに応えて、人間以外の音声を調整するようにラウドスピーカに指示するようにさらにプログラムされる。
【図面の簡単な説明】
【0007】
図1】本開示の1つ以上の実施形態に従って、車両内の近端参加者と車両外部に位置する遠隔の遠端参加者との間の電気通信を容易にするための電気通信ネットワークを示す。
図2】本開示の1つ以上の実施形態に係る、遠端電気通信用の車室内ノイズキャンセルシステムのブロック図である。
図3】本開示の1つ以上の実施形態に係る、遠端電気通信のためのノイズキャンセル方法300を示す簡略化された例示的な流れ図である。
図4】本開示の1つ以上の実施形態に係る、例示的なマイクロホン配置を示す。
図5】本開示の1つ以上の実施形態に係る、車両用のヘッドレストベースの電気通信システムの例示的なセットアップを示す。
図6】本開示の1つ以上の実施形態に係る、車両用のヘッドレストベースの電気通信システムの別の例示的なセットアップを示す。
図7】本開示の1つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための少なくとも1つのヘッドレストマイクロホンアレイを含む車両の平面図である。
図8】本開示の1つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための少なくとも1つのヘッドレストマイクロホンアレイを含む車両の別の平面図である。
図9】本開示の1つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための少なくとも1つのヘッドレストマイクロホンアレイと、バックミラーアセンブリマイクロホンアレイとを含む車両のさらに別の平面図である。
図10】本開示の1つ以上の実施形態に係る、車室内ノイズキャンセルシステムで使用するための複数の様々なヘッドレストマイクロホンアレイを含む車両のなおさらに別の平面図である。
図11】音声ダッキングシステムのブロック図を示す。
図12図11のシステムの例のプロセスを示す。
【発明を実施するための形態】
【0008】
必要に応じて、本発明の詳細な実施形態が本明細書中に開示されるが、開示された実施形態は、様々なかつ代替の形式で具現化され得る発明の単なる例であることが理解されよう。図は必ずしも縮尺通りではなく、一部の特徴は、特定の構成要素の詳細を示すために誇張または最小化される場合がある。したがって、本明細書に開示される具体的な構造的及び機能的詳細は、限定的と解釈されるべきではなく、単に、本発明を様々に用いるように当業者を教示するための代表的な基礎として解釈されるべきである。
【0009】
本明細書に説明するのは、音声ダッキングに対するビームフォーミング手法である。音声ダッキングシステムは、ユーザーが会話を試みているときに、気を散らす媒体信号の音量を自動的に調整するのに役立ち得る。発話が完了すると、媒体は、より大きい音量を再開するために自動的に調整してよい。マイクロホンのアレイ及びビームフォーミングプロセスは、ユーザーの頭部及び口の回りの関心のある狭い空間領域から発話信号を受信し、識別するために使用されてよい。これにより、その関心領域からのありとあらゆる音声を音声ダッキングシステムに即座に送ることができる。
【0010】
音声ダッキングは、明確な通信を促進するための一般的な方法である。音声信号が存在するとき、媒体の音量は、通信することを容易にするために途切れなく「ダッキング」、つまり減衰される。多くの既存のシステムは、いつマイクロホンの着信発話信号が人間の発話を含むのかを決定するためにアルゴリズムを使用する。これらのアルゴリズムは煩雑で大きく、着信信号を発話信号として確認し得る前に所与の待ち時間を要する場合がある。つまり、ユーザーの発言の始まりは、ダッキングエンジンに送られない場合がある。さらに、「ああ」、「ふふん」、または「シーッ」などの発話以外の発声は、発話信号として分類されない場合があり、したがってダッキングエンジンに送られない。
【0011】
本明細書に開示する概念は関心のある空間的な領域に依存しているので、その関心領域からのありとあらゆる音声はダッキングエンジンに自動的にかつ即座に送られる。これは、発話以外の発声を含み、関心領域は、ビームフォーミングを介してすでに定義及び局所化されているのでいかなる遅延も必要としない。したがって、指向性マイクロホン及び煩雑な信号処理は回避される。
【0012】
また、本開示は、遠端ユーザー体験を最適化するための車載ノイズキャンセルシステムも説明する。ノイズキャンセルシステムは、電気通信の交換またはバーチャルパーソナルアシスタントとの対話などを含む通信交換の遠端における近端発話の明瞭度を改善し得る。ノイズキャンセルシステムは、電気通信デバイスのマイクロホンからだけではなく、車両からのリアルタイム音響入力を組み込んでよい。さらに、車両内の1つ以上の不要な音源からの音響エネルギーを効果的に除去するために、車の中に取り付けられた小型の埋め込みマイクロホンからの音声信号を処理し、発信電気通信信号の中に混合することができる。埋め込みマイクロホンによって取り込まれた不要な雑音(例えば、子供の叫び声及び背景の会話)に加えて、車両のインフォテインメントシステムの中の既知の音声ストリームから再生する音声(例えば、音楽、効果音、及び映画音声の台詞)は、ノイズキャンセルシステムへの直接的な入力として使用され得る。したがって、直接的な入力として、これらのストリームは、発信電気通信信号から除去することができ、このようにしてユーザーの遠端の通信相手にはるかに高い信号対雑音比、通話品質、及び発話明瞭度を与える。
【0013】
図1は、セルラー基地局108を介して、車両104内の近端参加者102と車両外部に位置する遠隔の遠端参加者106との間の電気通信を容易にするための電気通信ネットワーク100を示す。車両104は、図1では電気通信信号112として集合的に示す着信電気通信信号及び発信電気通信信号を処理するための電気通信システム110を含んでよい。電気通信システム110は、以下により詳細に説明するように、音声電気通信信号を処理するためのデジタルシグナルプロセッサ(DSP)114を含んでよい。別の実施形態によれば、DSP114は、電気通信システム110とは別個のモジュールであってよい。車両インフォテインメントシステム116は、電気通信システム110に接続されてよい。第1の変換器118またはスピーカは、車室120内部の電気通信交換の近端参加者に着信電気通信信号を送信し得る。したがって、第1の変換器118は、近端参加者に近接して位置する場合もあれば、近端参加者によって占有される特定の座席場所で局所化された音場を生成する場合もある。第2の変換器122は、車両のインフォテインメントシステム116からの音声(例えば、音楽、効果音、及び映画音声からの台詞)を送信してよい。
【0014】
第1のマイクロホンアレイ124は、電気通信の近端参加者(すなわち、音源車両の運転者または別の乗員)の発話を受け取るために車室120内に位置してよい。第2のマイクロホンアレイ126は、集合的に雑音と呼ばれる不要な音源(例えば、交通雑音、風切り音、背景発話、及びマルチメディアコンテンツ)を検出するために車室120内に位置する場合がある。集合的に、電気通信システム110、DSP114、インフォテインメントシステム116、変換器118、122、及びマイクロホンアレイ124、126は、遠端電気通信用の車室内ノイズキャンセルシステム128を形成し得る。
【0015】
図2は、図1に示すノイズキャンセルシステム128のブロック図である。図2に示すように、遠端参加者(図示せず)からの着信電気通信信号112aは、DSP114によって受信されてよい。DSP114は、本明細書に開示する音声アプリケーションに特有である場合がある、デジタル信号処理の操作上の必要のために最適化された特殊マイクロホンプロセッサ及び/または集積回路の組み合わせなどのハードウェアベースのデバイスであってよい。着信電気通信信号112aは、自動利得制御装置(AGC)202で自動利得制御を受ける場合がある。AGC202は、入力信号の振幅の変動にも関わらず、その出力で制御された信号振幅を提供し得る。平均またはピーク出力信号レベルは、入出力利得を適切な値に動的に調整するために使用され、回路がより広い範囲の入力信号レベルと十分に機能できるようにする。AGC202からの出力は、次いで損失制御を受けるために損失制御装置204によって受け取られてよく、それは次いで着信電気通信信号112aを等化するために等化器206に渡される。等化は、電子信号内の周波数成分間のバランスを調整するプロセスである。等化器は、特定の周波数バンドまたは「周波数範囲」のエネルギーを強化(ブースト)する、または弱める(削減する)。
【0016】
等化器206の出力は、リミッタ208によって受け取られてよい。リミッタは、指定された入力電力またはレベル未満の信号が、影響を受けずに通過できるようにし、一方この閾値を超えるより強い信号のピークを減衰させる回路である。制限することは、一種のダイナミックレンジ圧縮である。これは、デバイスの出力の指定された特性(通常は振幅)が所定の値を超えるのを防ぐ任意のプロセスである。リミッタは、突然の音量ピークが発生するのを防ぐために、ライブ音声及び放送アプリケーションでの安全装置として一般的である。デジタル処理された着信電気通信信号112a’は、次いで電気通信交換の近端参加者への可聴送信のために第1の変換器118によって受信されてよい。
【0017】
同じく図2に示すように、ノイズキャンセルシステム128は、第1のマイクロホンアレイ124と、第2のマイクロホンアレイ126とを含んでよい。第1のマイクロホンアレイ124は、電気通信交換の近端参加者(すなわち、音源車両の運転者または別の乗員)からの発話を受け取るために、車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。第1のマイクロホンアレイ124は、反射面から可能限り遠くにある一方、近端の参加者に可能な限り近くに位置決めされてよい。例えば、第1のマイクロホンアレイ124は、図4に示すようにヘッドレストまたはヘッドライナーなどに埋め込まれてよい。第2のマイクロホンアレイ126は、集合的に雑音と呼ばれる不要な音源(例えば、交通雑音、風切り音、背景発話、及びマルチメディアコンテンツ)を検出するために車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。
【0018】
第1のマイクロホンアレイと第2のマイクロホンアレイへの両方の入力、近端発話及びノイズは、それぞれDSP114を使用し、処理され得る。第1のマイクロホンアレイ124からの第1の音声信号209の集合(すなわち、近端発話を示す)は、ビームフォーミングのための第1のビームフォーマ210に送られてよい。一方、第2の音声信号211の集合(すなわち、雑音を示す)は、第2のビームフォーマ212に送られてよい。ビームフォーミングまたは空間フィルタリングは、指向性信号の送信または受信用のセンサアレイで使用される信号処理技術である。これは、特定の角度の信号が建設的な干渉を経験し、一方他の信号が破壊的な干渉を経験するようにアレイ内の要素を結合することによって達成される。ビームフォーミングは、空間選択性を達成するために送信側と受信側の両方で使用できる。全指向性の受信/送信と比較した改善は、アレイの方向性として知られている。送信時にアレイの指向性を変更するためには、ビームフォーマは各送信機での信号の位相及び相対振幅を制御して、波面で建設的な干渉と破壊的な干渉のパターンを作り出す。受信時、異なるセンサからの情報は、予想される放射のパターンが優先的に観察されるように組み合わされる。
【0019】
第1のビームフォーマ210は、第1のマイクロホンアレイ124によって検出された近端発話を示す近端発話信号213を出力してよい。代わりに、近端発話信号213は、第1のマイクロホンアレイ124または第1のマイクロホンアレイの中の個々のマイクロホンから直接的にDSP114によって受信されてよい。第2のビームフォーマ212は、第2のマイクロホンアレイ126によって検出された予測不可能な背景雑音を示す雑音信号218を出力してよい。代わりに、雑音信号218は、第2のマイクロホンアレイ126または第2のマイクロホンアレイの中の個々のマイクロホンから直接的にDSP114によって受信されてよい。
【0020】
近端発話信号213は、遠端参加者106からのデジタル処理された着信電気通信信号112a’とともに、エコーキャンセラ214によって受信されてよい。エコーキャンセルは、エコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。このプロセスは、主観的な品質を改善することに加えて、エコーがネットワーク全体で移動するのを防ぐことによって無音抑制を通して達成される容量を増加させる。音響エコー(経時的にかなり変動する場合がある、マイクロホンによって反射され、録音される、ラウドスピーカからの音声)、及びラインエコー(音響エコーよりも変動がはるかに少ない、例えば送信電線と受信電線との間の結合、インピーダンス不一致、電気反射などによって引き起こされる電気的なインパルス)を含む一意の特性を有する様々なタイプのエコー及びエコーの原因がある。しかしながら、実際には、すべてのタイプのエコーを処理するために同じ技術が使用されるため、音声エコーキャンセラは音声エコーだけではなくラインエコーも除去できる。エコーキャンセルは、送信信号または受信信号で多少の遅延をもって再現する、最初に送信された信号を最初に認識することを必要とする。エコーが認識されると、エコーはそれを送信信号または受信信号から差し引くことによって取り除くことができる。この技術は、一般的に、デジタルシグナルプロセッサまたはソフトウェアを使用し、デジタルで実装されるが、技術はアナログ回路でも実装できる。
【0021】
エコーキャンセラ214の出力は、ノイズサプレッサ216で、第2のビームフォーマ212からの雑音信号218(すなわち、予測不可能な雑音)及びインフォテインメントシステム116からのインフォテインメント音声信号220(すなわち、予測可能な雑音)と混合されてよい。ノイズサプレッサ216で、近端発話信号213を雑音信号218及び/またはインフォテインメント音声信号220と混合することによって、車両104内の1つ以上の不要な音源から音響エネルギーを効果的に除去することができる。車両のインフォテインメントシステム116内の既知の音声ストリームから再生する音声(例えば、音楽、効果音、及び映画音声からの台詞)は、予測可能な雑音と見なされてよく、ノイズキャンセルシステム128への直接的な入力として使用され、近端発話信号213から除去または抑制され得る。さらに、埋め込みマイクロホンによって取り込まれた追加の不要かつ予測不可能な雑音(例えば、子供の叫び声及び背景会話)もノイズキャンセルシステム128への直接的な入力として使用され得る。不要な雑音は、発信電気通信信号112bとして遠端参加者に通信される前に、雑音信号218及びインフォテインメント音声信号220に基づいて、ノイズサプレッサ216によって近端発話信号213から除去または抑制され得る。雑音抑制は、取り込んだ信号から背景雑音を取り除く音声プリプロセッサである。
【0022】
雑音が抑制された近端発話信号213’は、ノイズサプレッサ216から出力されてよく、エコーサプレッサ222での遠端参加者からの処理された着信電気通信信号112a’と混合されてよい。エコー抑制は、エコーキャンセルと同様に、エコーが作り出されるのを防ぐ、またはエコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。エコーサプレッサは、回路上で一方向に移動する音声信号を検出し、次いで他方向に大きな損失を挿入することによって機能する。通常、回路の遠端にあるエコーサプレッサは、エコーサプレッサが回路の近端から着信する音声を検出すると、この損失を追加する。この追加された損失によって、発話者は、自身の声を聞かないようになる。
【0023】
エコーサプレッサ222からの出力は、次いで自動利得制御装置(AGC)224で自動利得制御を受けてよい。AGC224は、入力信号の振幅の変動にも関わらず、その出力で制御された信号振幅を提供し得る。平均またはピーク出力信号レベルは、入出力利得を適切な値に動的に調整するために使用され、回路がより広い範囲の入力信号レベルで十分に機能できるようにする。AGC224からの出力は、次いで近端発話信号を等化するために、等化器226によって受け取られてよい。等化は、電子信号内の周波数成分間のバランスを調整するプロセスである。等化器は、特定の周波数バンドまたは「周波数範囲」のエネルギーを強化(ブースト)する、または弱める(削減する)。
【0024】
等化器226からの出力は、損失制御を受けるために損失制御装置228に送信されてよい。出力は、次いでコンフォートノイズジェネレータ(CNG)230を通過してよい。CNG230は、受信される信号がない期間中にコンフォートノイズを挿入するモジュールである。CNGは、不連続送信(DTX)と関連して使用されてよい。DTXは、送信機のスイッチが、無音期間中オフになることを意味する。したがって、背景音響雑音は、受信側(例えば、遠端)で突然消える。これは、受信者(例えば、遠端参加者)にとって非常に煩わしい場合がある。無音期間がかなり長い場合、受信者は、回線が切れたとさえ考える可能性がある。これらの問題を克服するために、送信のスイッチがオフになるたびに、「コンフォートノイズ」が受信側(すなわち、遠端)で生成されてよい。コンフォートノイズはCNGによって生成される。コンフォートノイズが発話期間中に送信された背景音響雑音のコンフォートノイズと十分に適合される場合、発話期間の間のギャップは、受信者が会話中に切替に気が付かないように埋めることができる。雑音は常に変化するので、コンフォートノイズジェネレータ230は定期的に更新されてよい。
【0025】
CNG230からの出力は、次いで発信電気通信信号112bとして電気通信システムによって、電気通信交換の遠端参加者に送信されてよい。発信電気通信信号から直接的に雑音入力を除去することによって、ユーザーの遠端通信相手は、はるかに高い信号対雑音比、通話品質、及び発話明瞭度を与えられ得る。
【0026】
ノイズキャンセルシステム128は、電気通信交換の遠端参加者での近端発話明瞭度を改善するとして示され、説明されているが、任意の通信交換の遠端で近端発話明瞭度を改善するために用いられてよい。例えば、ノイズキャンセルシステム128は、遠端(つまり、バーチャルパーソナルアシスタント)での発話認識を最適化するためにバーチャルパーソナルアシスタンス(VPA)アプリケーションとの関連で使用されてよい。したがって、背景(不要な)雑音は、VPAとの通信交換の近端発話から同様に抑制または除去され得る。
【0027】
図3は、遠端電気通信のためのノイズキャンセル方法300を示す簡略化された例示的な流れ図である。ステップ305で、近端発話は、第1のマイクロホンアレイ124などのマイクロホンアレイによってノイズキャンセルシステム128で受け取られてよい。一方、ノイズキャンセルシステム128は、ステップ310で示すように、第2のマイクロホンアレイ126からの予測不可能な雑音及び/またはインフォテインメントシステム116からの予測可能な雑音などの不要な音源からの音声入力ストリームを受け取る場合がある。近端発話は、電気通信交換の遠端参加者が受信するための発信電気通信信号112bに処理されてよい。したがって、ステップ315で、近端発話信号は、エコーがすでに存在してからそれを取り除くことによって音声品質を改善するためのエコーキャンセル動作を受ける場合がある。上述のように、エコーキャンセルは、送信信号または受信信号で多少の遅延をもって再現する、最初に送信された信号を最初に認識することを必要とする。エコーが認識されると、エコーはそれを送信信号または受信信号から差し引くことによって取り除くことができる。
【0028】
近端発話信号は、ステップ310で受け取られた雑音入力、及び遠端参加者のための着信電気通信信号とともにノイズサプレッサで受信されてよい(ステップ320)。ノイズキャンセル中、ステップ325で示すように、雑音は近端発話信号から除去または抑制され得る。ステップ330で、近端発話信号の中の発話の明瞭度は、外部からの音によるマスキングの効果を低減または除去することによって復元されてよい。近端発話信号は、次いで、ステップ335に示すように、着信電気通信信号を使用し、エコー抑制を受けてよい。上述のように、エコー抑制は、エコーキャンセルと同様に、エコーが作り出されるのを防ぐ、またはエコーがすでに存在してからそれを取り除くことによって音声品質を改善するための電話通信技術の方法である。近端発話信号は、それが発信電気通信信号として電気通信ネットワークを介して遠端参加者に送信される(ステップ345)前に、ステップ340で追加の音声フィルタリングを受けてよい。一方で、着信電気通信信号は、スピーカを通して車室内で再生されてよい(ステップ350)。
【0029】
図4は、本開示の1つ以上の実施形態に係る、車両104の車室120内での例示的なマイクロホン配置を示す。例えば、近端発話をとらえるための第1のマイクロホンアレイ124からの第1のマイクロホン124aは、1つ以上のヘッドレスト410に埋め込まれてよい。また、雑音をとらえるための第2のマイクロホンアレイ126からの第2のマイクロホン126aは、1つ以上のヘッドレスト410、ヘッドライナー(図示せず)などに埋め込まれてよい。図示するように、ユーザーの口に可能な限り近くのように、車室120に対して乗客の内部に向かって位置決めされたマイクロホンは、車室に対して乗客の外部に位置決めされたマイクロホンと比較すると、信号の反射エネルギーを最小限に抑え得る。これは、車室に対して乗客の外部に位置決めされたマイクロホンが、ガラスなどの、車室120を囲む反射面412からより多くの反射エネルギーを受け取る場合があるためである。近端発話信号の反射エネルギーを最小限に抑えると、電気通信の遠端での発話明瞭度が上がる場合がある。図4に示すマイクロホンの配置及び/または場所は、例に過ぎない。マイクロホンアレイの正確な場所は、境界及び車両の内部のサービスエリアに依存する。
【0030】
図5は、車両用のヘッドレストベースの電気通信システムの例示的なセットアップを示す。前方を向く第1のマイクロホンアレイ502は、電気通信交換の近端発話を受け取るために助手席ヘッドレスト506の前部504の近くに配置されてよい。後方を向く第2のマイクロホンアレイ508は、背景発話を含む雑音を受け取るために助手席ヘッドレスト506の後部510の近くに配置されてよい。図6は、車両用のヘッドレストベースの電気通信システムの別の例示的なセットアップを示す。前方を向く第1のマイクロホンアレイ602は、電気通信交換の近端発話を受け取るために助手席ヘッドレスト606の前部604の近くに配置されてよい。前方を向く第2のマイクロホンアレイ608は、背景発話を含む雑音を受け取るために後部乗客ヘッドレスト612の前部610の近くに配置されてよい。図4と同様に、図5及び図6に示すマイクロホンアレイの正確な場所は、境界及び車両内部のサービスエリアに依存する。
【0031】
図7図10は、車両104などの車両の車室120内のノイズキャンセルシステム128(図示せず)のためのサンプルマイクロホン構成の様々な平面図を示す。図1及び図2に関連して説明するマイクロホン及びマイクロホンアレイと同様に、図7図10に示す様々なマイクロホンアレイ及び/または個々のマイクロホンは、車載通信システムまたは電気通信システム110などの車両通信システムに関連して機能するためにデジタルシグナルプロセッサ114と通信してよい。例えば、図7は、本開示の1つ以上の実施形態に係る、第1のサンプルマイクロホン構成を示す車両104の平面図である。図示するように、ノイズキャンセルシステム128(図示せず)は、少なくとも2つのマイクロホン−第1のマイクロホン710a及び第2のマイクロホン710b−を含む少なくとも1つのマイクロホンアレイ710を含んでよい。第1の及び第2のマイクロホンは、離間した場所にある第1のヘッドレスト714の外面712に取り付けられてよい。第1のヘッドレスト714は、運転者側のヘッドレストであってよい。
【0032】
第1のヘッドレスト714の外面712は、内向き側面716と、外向き側面718とを含んでよい。内向き側面716は、反射面412(図4を参照)を含む車両104の側面により近い外向き側面718よりも車室120の中心により近い。図7に示すように、第1の及び第2のマイクロホン710a、710bは、第1のヘッドレスト714の内向き側面716と同一平面で位置決めされてよい。第1の及び第2のマイクロホン710a、710bは、車両104に対して少なくとも長手方向で離間されてよい。したがって、第1の及び第2のマイクロホンを隔てる距離は、長手方向に向けられた少なくとも1つの第1のリスニングゾーン720及び第2のリスニングゾーン722を作り出すために、少なくとも長手方向の距離Xを含んでよい。マイクロホンアレイ710の2つのマイクロホンの間の長手方向の距離Xは、着信音声の方向、一般的に前部または後部の表示を示してよい。したがって、第1のリスニングゾーン720は、前部座席列を含む領域などの、車室120の前方領域を包含してよい。一方、リスニングゾーン722は、後部乗客座席を含む領域などの、第1のリスニングゾーン720の後方に向けられる領域を包含してよい。一実施形態では、第1のマイクロホンと第2のマイクロホン710a、710bとの間の長手方向の距離Xは、ほぼ1インチであってよいが、マイクロホン間の他の距離も用いて、着信音声の方向、前方または後方の表示を示してもよい。
【0033】
デジタルシグナルプロセッサ114は、図2に示すように、マイクロホンアレイ710からの音声を示すマイクロホン信号を受信し、マイクロホン信号に基づいて、音声が第1のリスニングゾーン720の方向から受け取られるのか、それとも第2のリスニングゾーン722の方向から受け取られるのかを識別するようにプログラムされ得る。例えば、デジタルシグナルプロセッサ114は、第1の及び第2のマイクロホン710a、710bからのマイクロホン信号を比較し、2つのマイクロホンのそれぞれにおけるマイクロホン信号の受信の時間差に基づいて、第1のリスニングゾーンまたは第2のリスニングゾーンのどちらかからの音声の方向を局所化してよい。さらに、デジタルシグナルプロセッサ114は、不要なまたは騒がしい背景雑音と同等と見なし得る、第2のリスニングゾーン722(の方向)からの音声を示すマイクロホン信号を抑制または除去し得る。他方、デジタルシグナルプロセッサ114は、所望の近端発話と同等と見なし得る、第1のリスニングゾーン720(の方向)からの音を示すマイクロホン信号を、通信交換の遠端参加者に送信してよい。
【0034】
一実施形態によれば、第1の及び第2のマイクロホン710a、710bは、全方向性マイクロホンであってよい。別の実施形態によれば、第1の及び第2のマイクロホン710a、710bは、対応するリスニングゾーンの方向に方向性を有する指向性マイクロホンであってよい。したがって、着信音声は、第1のリスニングゾーン720からの音声が遠端参加者に送信され得、一方第2のリスニングゾーン722からの音声が抑制され得るように、マイクロホンの方向性に基づいて減衰されてよい。
【0035】
図8は、本開示の1つ以上の実施形態に係る、別のサンプルマイクロホン構成を示す車両104の平面図である。図示するように、ノイズキャンセルシステム128(図示せず)は、第1のヘッドレスト814の外面812の底面811に取り付けられた少なくとも2つのマイクロホン−第1のマイクロホン810a及び第2のマイクロホン810b−を含む、少なくとも1つの第1のマイクロホンアレイ810を含んでよい。図7と同様に、第1の及び第2のマイクロホン810a、810bは、車両104に対して長手方向に離間されてよい。したがって、第1の及び第2のマイクロホン810a、810bを隔てる距離は、長手方向に向けられた少なくとも1つの第1のリスニングゾーン820及び第2のリスニングゾーン822を作り出すために、少なくとも長手方向の距離Xを含んでよい。図7に関して説明するように、デジタルシグナルプロセッサ114は、図2に示すように、マイクロホンアレイ810からの音声を示すマイクロホン信号を受信し、マイクロホン信号に基づいて、音声が第1のリスニングゾーン820の方向から受け取られるのか、それとも第2のリスニングゾーン822の方向から受け取られるのかを識別するようにプログラムされてよい。さらに、デジタルシグナルプロセッサ114は、不要なまたは騒がしい背景雑音と同等と見なし得る、第2のリスニングゾーン822(の方向)からの音声を示すマイクロホン信号を抑制または除去し得る。他方、デジタルシグナルプロセッサ114は、所望の近端発話と同等と見なし得る、第1のリスニングゾーン820(の方向)からの音声を示すマイクロホン信号を、通信交換の遠端参加者に送信してよい。
【0036】
図8に示すように、第1の及び第2のマイクロホン810a、810bは、車両104に対して横方向に離間されてもよい。したがって、第1の及び第2のマイクロホン810a、810bを隔てる距離は、第1のリスニングゾーン820が車両104に対して横方向に向けられた2つのリスニングサブゾーンを含むように、横方向距離Yをさらに含んでよい。例えば、第1のリスニングサブゾーン820aは、運転者の座席824を取り囲む領域を包含してよい。一方、第2のリスニングサブゾーン820bは、助手席826を取り囲む領域を包含してよい。第1のマイクロホンアレイ810の2つのマイクロホン810a、810bの間の横方向距離Yは、着信音声の方向、一般に左または右の表示を示してよく、その結果、デジタルシグナルプロセッサ114は、マイクロホン信号に基づいて、音声が、第1のリスニングサブゾーン820aの方向から受け取られるのか、それとも第2のリスニングサブゾーン820bの方向から受け取られるのかをさらに識別してよい。さらに、デジタルシグナルプロセッサ114は、不要なまたは騒がしい背景雑音と同等と見なし得る第2のリスニングサブゾーン820b(の方向)からの音声を示すマイクロホン信号を抑制または除去するようにプログラムされてよい。他方、デジタルシグナルプロセッサ114は、所望の近端発話と同等と見なし得る、第1のリスニングサブゾーン820a(の方向)からの音声を示すマイクロホン信号を通信交換の遠端参加者に送信してよい。
【0037】
さらに図8に示すように、ノイズキャンセルシステムは、第1のヘッドレスト814に側面に沿って隣接する第2のヘッドレスト832の底面830に取り付けられた少なくとも2つのマイクロホン−第1のマイクロホン828a及び第2のマイクロホン828bを含む、第2のマイクロホンアレイ828を含んでよい。第2のマイクロホンアレイの構成は、第1のマイクロホンアレイの構成に酷似する場合がある。したがって、第2のマイクロホンアレイ828の第1の及び第2のマイクロホン828a、828bも、着信音声の方向、一般に左または右の追加の表示を示すために、長手方向と横方向の両方に離間されてよく、その結果、デジタルシグナルプロセッサ114は、マイクロホン信号に基づいて、音声が第1のリスニングサブゾーン820aの方向から受け取られるのか、それとも第2のリスニングサブゾーン820bの方向から受け取られるのかをさらに識別してよい。第1の及び/または第2のマイクロホンアレイのマイクロホンは、全方向性マイクロホンまたは指向性マイクロホンのどちらかであってよい。
【0038】
図9は、図8に示すスリーゾーン構成に類似したさらに別のサンプルマイクロホン構成を示す。図示するように、第1のマイクロホンアレイ910は、例えば図7に示すマイクロホンアレイなど、ヘッドレスト914の内向き側面916に取り付けられてよい。図7と同様に、第1のマイクロホンアレイ910は、着信音声の方向、前方または後方の表示を示すために、長手方向の距離で隔てられた、離間した場所で内向き側面916に位置決めされた第1のマイクロホン910a及び第2のマイクロホン910bを含んでよい。したがって、上述のように、第1の及び第2のマイクロホン910a、910bの長手方向の分離によって、長手方向に向けられた第1のリスニングゾーン920及び第2のリスニングゾーン922を作り出し得る。第1の及び第2のマイクロホン934a、934bを含む第2のマイクロホンアレイ934は、着信音声の方向、左または右の表示を示すために、(図8においてのように)第2のヘッドレストによりむしろバックミラーアセンブリ936に配置されてよく、その結果、デジタルシグナルプロセッサ114は、マイクロホン信号に基づいて、音声が第1のリスニングサブゾーン920aの方向から受け取られるのか、それとも第2のリスニングサブゾーン920bの方向から受け取られるのかをさらに識別してよい。第1のマイクロホンアレイ910の第1の及び第2のマイクロホン910a、910bは全方向性マイクロホンであってよい。さらに、第2のマイクロホンアレイ934の第1の及び第2のマイクロホン934a、934bは指向性マイクロホンであってよい。
【0039】
図10は、本開示の1つ以上の実施形態に係る、さらに別のサンプルマイクロホン構成を示す車両1004の平面図である。図示するように、車両1004は、3列の座席を含んでよい。図10に示すマイクロホン構成は、図7図9に関して上述した様々な構成の組み合わせを用いてよい。例えば、座席の第1列1040は、図8に示すように、第1のヘッドレスト1014の中の第1のマイクロホンアレイ1010及び第2のヘッドレスト1030の中の第2のマイクロホンアレイ1028を含んでよい。したがって、第1の及び第2のマイクロホンアレイ1010、1028のそれぞれの中のマイクロホンは、それぞれの対応するヘッドレストの底面1011に取り付けられ、長手方向と横方向との両方で離間されてよい。横方向の間隔によって、上述のように、横方向の向きを有する第1のリスニングサブゾーン1020a及び第2のリスニングサブゾーン1020bを含む第1のリスニングゾーン1020を作り出し得る。さらに、長手方向の間隔によって、第1のリスニングゾーン1020の後方に第2のリスニングゾーン1022を作り出し得る。
【0040】
座席の第2列1044の中の少なくとも1つのヘッドレスト1042は、図7に示すマイクロホンアレイ710に類似した第3のマイクロホンアレイ1046を含んでよい。したがって、第3のマイクロホンアレイ1046のマイクロホンは、ヘッドレスト1042の内向き側面1016に取り付けられ、少なくとも長手方向で離間されて、座席の第3の列1052を包含する、第2のリスニングゾーン1022の後方に第3のリスニングゾーン1050を作り出し得る。車両1004は、一般に車両の中心線に沿って、車両の天井またはヘッドライナー(図示せず)の中に位置決めされた追加のマイクロホンアレイ1054を含んでよい。これらの追加のマイクロホンアレイ1054は、全方向性であってよい(図示するような)3つまたは4つのマイクロホンを含んでよい。図10に示すすべての様々なマイクロホンアレイは、ノイズキャンセルシステム128の一部を形成してよく、図7図9に関連して説明するのと同様にデジタルシグナルプロセッサ114と協調してよい。さらに、図10に示すヘッドレストの1つ以上は、少なくとも1つのスピーカ1056をさらに含んでよい。ヘッドレストに取り付けたスピーカ1056は、通信交換の遠端参加者からの音声を送信するために用いられてよい。
【0041】
図11は、例のダッキングシステム800を示す。ダッキングシステム800は、着信音声信号804をとらえ、受信するように構成されたマイクロホンアレイ802を含んでよい。アレイ802は、上述されたアレイに類似してよく、電気通信交換の近端参加者(すなわち、音源車両の運転者または別の乗員)から発話を受け取るために車室内に戦略的に配置された複数の小型の埋め込みマイクロホンを含んでよい。アレイ802の配置及び場所は、例えば図5図10に関して本明細書に説明するように配置されてよい。アレイ802は、4つのマイクロホンを含むとして図11に示されるが、より多いまたはより少ないマイクロホンを含んでもよい。着信音声信号804は、音楽、背景雑音、交通雑音などを含む他の雑音信号だけではなく、人間の発話を含んでもよい。アレイ802は、2つのマイクロホンを含むとして示されているが、アレイ802は、4マイクロホンのアレイを含む2つ以上のマイクロホンを含んでもよい。マイクロホンは、指向性マイクロホンであるであろう。
【0042】
システム800は、リアルタイム発話クリーニングアルゴリズム、または第1のビームフォーマ210及び第2のビームフォーマ212などの上述のビームフォーマに類似したビームフォーマ806を含んでよい。ビームフォーマ806はこのように説明されているが、このブロックは、雑音抑制、エコーキャンセルなどの他の処理を含んでもよい。ビームフォーミングまたは空間フィルタリングは、指向性信号送信または受信用のセンサアレイで使用される信号処理技術である。これは、特定の角度での信号が建設的な干渉を経験し、一方他の信号が破壊的な干渉を経験するようにアレイの中の要素を結合することによって達成される。ビームフォーミングは、空間選択性を達成するために送信側と受信側の両方で使用されてよい。全指向性の受信/送信と比較した改善は、アレイの方向性として知られている。送信時にアレイの指向性を変更するためには、ビームフォーマは各送信機での信号の位相及び相対振幅を制御して、波面で建設的な干渉と破壊的な干渉のパターンを作り出す。受信時、異なるセンサからの情報は、予想される放射のパターンが優先的に観察されるように組み合わされる。
【0043】
ビームフォーマ806は、発話信号810を出力してよい。発話信号810は、着信音声信号804から取り除かれた人間の声の信号を含む場合がある。すなわち、雑音は取り除かれ、人間の発話だけを残してよい。これは、着信音声信号が人間の発話を含むか否かを認識する際に役立つ場合がある。また、発話信号810は、鼻歌、指を鳴らすこと、拍手など、任意のタイプの人間が生成した音声を含む場合があり、発話に制限されない。人間の発話が含まれているかどうかを判断する従来の方法は、多くの場合、大きなメモリ及び高い処理能力を必要とする。さらに、人間の発話が存在するかどうかを判断するための広範な処理の必要性のために、既存のシステムは、着信信号を発話信号として確認できるようになる前に待ち時間を要する。これにより、会話の始まりはダッキングステーションに送られない場合がある。さらに、「ああ」、「ふふん」、または「シーッ」などの発話ではないが、人間の雑音は、発話信号として分類されない場合があり、ダッキングステーションに適切に送られない場合もある。
【0044】
ビームフォーマは、関心のある空間的領域に依存するので、その領域からのありとあらゆる音声はダッキングステーションにただちに送られる。これは発話以外の発声を含み、発話を検出するために使用されているビームフォーミングのため、関心領域はすでに定義され、局所化されているため、待ち時間の問題は回避される。
【0045】
音楽及び他の媒体などの車両スピーカから発する人間が生成したのではない音声は、車両の使用中に再生される場合がある。しかしながら、会話中、乗員は、より容易な聞き取り及び傾聴を可能にするために発話以外の音声を下げることを望む場合がある。音声ダッキングは、人間の音量制御との相互作用を必要とせずに自動的にこれを可能にしてよい。図11では、これらの発話以外の音声812は、ブロック814で手作業で制御される場合もあれば、ブロック816で自動的にダッキングされる場合もある。ダッキングされた発話信号は、車両音声システムに送信されてよい。
【0046】
図12は、図11のシステム800の例のプロセス1200を示す。プロセス1200は、プロセッサ114がアレイ802から着信音声信号を受信してよいブロック1205で開始する。
【0047】
ブロック1210で、プロセッサ114は、ビームフォーマ806を適用してよい。ビームフォーマ806は、人間の発話音声を空間的に除外してよい。
【0048】
ブロック1215で、プロセッサ114は、例えば乗員からの音響信号が検出されるかどうかなど、関心のある空間領域が検出されるかどうかを、ブロック1210から判断してよい。すなわち、閾値を超える関心領域からの任意の音響入力である。そうである場合、閾値は、発話以外のメディアレベルを調整するために使用される。これは、各乗員の頭部/口の領域に向かって輝くスポットライトとして視覚化できる。そうである場合、プロセス1200はブロック1220に進み、そうではない場合、プロセスはブロック1205に戻る。
【0049】
ブロック1220で、プロセッサ114は、車両音声システムによって再生されている発話以外または人間以外の音声の音量を調整してよい。音量は、所定のレベルまで下がるように調整されてよい。すなわち、音量は減少してよいが、依然として乗員に可聴であってよい。音量は、完全にミュートされてよい。プレイバックは、完全に休止されてよい。さらにまたは代わりに、音量はミュートまでフェードダウンされる場合もあれば、所定のレベルまでフェードダウンされる場合もある。音量レベルは、ユーザー、ユーザー選択などによって事前に定められてよい。
【0050】
ブロック1225で、プロセッサ114は、人間の発話が依然として存在しているのか否かを判断するためにビームフォーミングされた音声信号を監視してよい。人間の発話が所定の時間量の間存在しない場合、次いで会話は終わった可能性がある。この場合、発話以外の音声はその通常の音量レベルで再生を再開してよい。音声が検出されなくなると、プロセス1200はブロック1230に進む。
【0051】
ブロック1230で、プロセッサ114は、調整される発話以外の音声のプレイバックを指示してよい。これは、ダッキングの前に、以前に確立された音量レベルで再開するために発話以外の音声のプレイバックを指示することを含む場合がある。ダッキング中の調整と同様に、フェード、ミュートなどもプレイバック音量の調整の1つの形である場合がある。
【0052】
プロセス1200は次いで終了してよい。
【0053】
したがって、人間が生成した音声を検出し、車両スピーカから発せられる人間以外の音声をダッキングするためのシステムが開示される。局所的なマイクロホン及び/またはビームフォーミング技術が使用されるため、閾値を超える任意の音響音声は人間が生成したと見なされる場合がある。したがって、音声が人間によって生成されているのかどうかを判断するための煩雑な信号処理を回避できる。さらに、指向性マイクロホンは必要ではない。本明細書に説明するビームフォーミングプロセスは、人間が生成した音声の実行可能性を高めるために、雑音抑制、エコーキャンセル、及び他の信号処理とともに使用できる。
【0054】
本明細書に説明するコントローラまたはデバイスの任意の1つ以上は、様々なプログラミング言語及び/または技術を使用し、作成されたコンピュータプログラムからコンパイルまたは解釈され得るコンピュータ実行可能命令を含む。一般に、(マイクロホンプロセッサなどの)プロセッサは、例えばメモリ、コンピュータ可読媒体などから命令を受け取り、命令を実行する。処理ユニットは、ソフトウェアプログラムの命令を実行できる非一過性のコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体は、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、またはその任意の適切な組み合わせであってよいが、これに限定されるものではない。
【0055】
例示的な実施形態を上述したが、これらの実施形態が本発明のあらゆる可能な形式を記載するとは意図されない。むしろ、明細書で用いられた単語は限定ではなく説明のための単語であり、本発明の精神及び範囲から逸脱することなく様々な変更が成され得ることが理解される。さらに、様々な実装実施形態の特徴は組み合わされて本発明のさらなる実施形態を形成し得る。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【外国語明細書】
2021110948000001.pdf