(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-04
(45)【発行日】2022-03-14
(54)【発明の名称】ラウドスピーカ位置推定システム及び方法
(51)【国際特許分類】
H04S 7/00 20060101AFI20220307BHJP
G10K 15/00 20060101ALI20220307BHJP
H04R 3/00 20060101ALI20220307BHJP
G01H 3/00 20060101ALI20220307BHJP
【FI】
H04S7/00 310
G10K15/00 L
H04R3/00 320
G01H3/00 B
(21)【出願番号】P 2019526297
(86)(22)【出願日】2017-11-10
(86)【国際出願番号】 US2017061033
(87)【国際公開番号】W WO2018093670
(87)【国際公開日】2018-05-24
【審査請求日】2020-11-09
(32)【優先日】2016-12-01
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2016-11-16
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】503206684
【氏名又は名称】ディーティーエス・インコーポレイテッド
【氏名又は名称原語表記】DTS,Inc.
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100122563
【氏名又は名称】越柴 絵里
(72)【発明者】
【氏名】シー グァンジー
(72)【発明者】
【氏名】グッドウィン マイケル エム
(72)【発明者】
【氏名】スタイン エドワード
【審査官】大石 剛
(56)【参考文献】
【文献】特開2007-110357(JP,A)
【文献】特開2011-259097(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 7/00
G10K 15/00
H04R 3/00
G01H 3/00
(57)【特許請求の範囲】
【請求項1】
マルチチャネルサラウンドサウンドシステムにおけるラウドスピーカの位置を推定する装置であって、前記装置が、
第1マイクロフォン及び第2マイクロフォンを含むマイクロフォンアレイであって、前記第1マイクロフォンが、試験信号を出力する前記ラウドスピーカに応答して第1オーディオ信号を生成するよう構成され、前記第2マイクロフォンが、前記試験信号を出力する前記ラウドスピーカに応答して第2オーディオ信号を生成するように構成される、マイクロフォンアレイと、
前記マイクロフォンアレイに結合された位置推定エンジンと、
を備え、
前記位置推定エンジンが、
前記第1オーディオ信号及び前記第2オーディオ信号に基づいて到着時間差推定値を決定し、
前記到着時間差推定値に基づいて第1角度を決定し、
前記第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別し、
前記第2オーディオ信号から得られたインパルス応答における第2ダイレクトパス成分を識別し、
前記第1ダイレクトパス成分及び前記第2ダイレクトパス成分に基づいて第2角度を決定し、
前記第1角度と前記第2角度の比較に基づいて異常状態が存在するかどうかを決定する、
ように構成される、装置。
【請求項2】
前記位置推定エンジンが更に、
前記第1オーディオ信号を1又は2以上の第1セグメントに区分し、
前記第2オーディオ信号を1又は2以上の第2セグメントに区分し、
前記1又は2以上の第1セグメントにおける第1セグメントのフーリエ変換を生成して第1フーリエ変換を形成し、
前記1又は2以上の第2セグメントにおける第
2セグメントのフーリエ変換を生成して第2フーリエ変換を形成し、
前記第1フーリエ変換及び前記第2フーリエ変換に基づいて前記到着時間差推定値を決定する、
ように構成される、ことを特徴とする請求項1に記載の装置。
【請求項3】
前記位置推定エンジンは更に、
前記1又は2以上の第1セグメント及び前記1又は2以上の第2セグメントの生成されたフーリエ変換に基づいて複数の到着時間差推定値を決定し、
前記複数の到着時間差推定値をヒストグラムに集約し、
前記ヒストグラムにおいて最多発生を有する前記複数の到着時間差推定値のうちの1つの到着時間差推定値に基づいて前記到着時間差推定値を決定する、
ように構成されることを特徴とする請求項2に記載の装置。
【請求項4】
前記位置推定エンジンは更に、前記第1オーディオ信号から得られたインパルス応答における最高振幅に基づいて、前記第1オーディオ信号から得られたインパルス応答における前記第1ダイレクトパス成分を識別するように構成される、
ことを特徴とする請求項1に記載の装置。
【請求項5】
前記位置推定エンジンは更に、
前記第1ダイレクトパス成分を含む第1時間ウィンドウを選択し、
前記第2ダイレクトパス成分を含む第2時間ウィンドウを選択し、
前記第1時間ウィンドウのデータ及び前記第2時間ウィンドウのデータを用いて相互相関を決定し、
前記決定した相互相関を用いて前記第2角度を決定する、
ように構成される、
ことを特徴とする請求項1に記載の装置。
【請求項6】
前記位置推定エンジンは更に、
前記第1角度と前記第2角度を比較し、
前記第1角度及び前記第2角度
の差が閾値角度値内ではないという決定に応答して前記異常状態が存在すると決定する、
ように構成される、
ことを特徴とする請求項1に記載の装置。
【請求項7】
前記閾値角度値は、0と15度の間の値を含む、
ことを特徴とする請求項6に記載の装置。
【請求項8】
前記異常状態が存在するという決定に応答してネットワークを介してユーザデバイスに通知を送信するよう構成された通知生成器を更に備える、
ことを特徴とする請求項1に記載の装置。
【請求項9】
前記通知は、前記ラウドスピーカの角度が正しくないという指示、物体が前記ラウドスピーカと前記マイクロフォンアレイの間の経路を塞いでいるという指示、前記ラウドスピーカの極性が正しくないという指示、又は前記ラウドスピーカの位置が正しくないという指示のうちの1つを含む、
ことを特徴とする請求項8に記載の装置。
【請求項10】
前記装置は、サウンドバー、音声/視覚(A/V)受信機、中央スピーカ、又はテレビジョンのうちの1つを含む、
ことを特徴とする請求項1に記載の装置。
【請求項11】
前記マルチチャネルサラウンドサウンドシステムは、ステレオ、2.1、3.1、5.1、5.2、7.1、7.2、11.1、11.2、又は22.2スピーカレイアウトのうちの1つに配列される、
ことを特徴とする請求項1に記載の装置。
【請求項12】
マルチチャネルサラウンドサウンドシステムにおけるラウドスピーカの位置を推定する方法であって、前記方法は、
マイクロフォンアレイの第1マイクロフォンから第1オーディオ信号及び前記マイクロフォンアレイの第2マイクロフォンから第2オーディオ信号を受信する段階と、
前記第1オーディオ信号及び前記第2オーディオ信号に基づいて到着時間差推定値を決定する段階と、
前記到着時間差推定値に基づいて第1角度を決定する段階と、
前記第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別する段階と、
前記第2オーディオ信号から得られたインパルス応答における第2ダイレクトパス成分を識別する段階と、
前記第1ダイレクトパス成分及び前記第2ダイレクトパス成分に基づいて第2角度を決定する段階と、
前記第1角度と前記第2角度の比較に基づいて異常状態が存在するかどうかを決定する段階と、
を含む、方法。
【請求項13】
到着時間差推定値を決定する段階は更に、
前記第1オーディオ信号を1又は2以上の第1セグメントに区分する段階と、
前記第2オーディオ信号を1又は2以上の第2セグメントに区分する段階と、
前記1又は2以上の第1セグメントにおける第1セグメントのフーリエ変換を生成して第1フーリエ変換を形成する段階と、
前記1又は2以上の第2セグメントにおける第1セグメントのフーリエ変換を生成して第2フーリエ変換を形成する段階と、
前記第1フーリエ変換及び前記第2フーリエ変換に基づいて前記到着時間差推定値を決定する段階と、
を含む、請求項12に記載の方法。
【請求項14】
前記第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別する段階は更に、前記第1オーディオ信号から得られた前記インパルス応答における最高振幅に基づいて前記第1オーディオ信号から得られた前記インパルス応答における前記第1ダイレクトパス成分を識別する段階を含む、
ことを特徴とする請求項12に記載の方法。
【請求項15】
異常状態が存在するかどうかを決定する段階は更に、
前記第1角度と前記第2角度を比較する段階と、
前記第1角度及び前記第2角度が閾値角度値内にないという決定に応答して前記異常状態が存在すると決定する段階と、
を含む、請求項12に記載の方法。
【請求項16】
前記閾値角度値は、0と15度の間の値を含む、請求項15に記載の方法。
【請求項17】
前記異常状態が存在するという決定に応答してネットワークを介してユーザデバイスに通知を送信する段階を更に含み、前記通知は、前記ラウドスピーカの角度が正しくないという指示、物体が前記ラウドスピーカと前記マイクロフォンアレイの間の経路を塞いでいるという指示、前記ラウドスピーカの極性が正しくないという指示、又は前記ラウドスピーカの位置が正しくないという指示のうちの1つを含む、
ことを特徴とする請求項12に記載の方法。
【請求項18】
実行可能命令を格納した非一時的物理コンピュータストレージであって、前記実行可能命令は、ハードウェアプロセッサによって実行されたときに、少なくとも、
試験信号を送信するようラウドスピーカに指示し、
第1技術を用いて、マイクロフォンアレイの第1マイクロフォンから録音された第1オーディオ信号及び前記マイクロフォンアレイの第2マイクロフォンから録音された第2オーディオ信号に基づいて第1角度を決定し、
第2技術を用いて、前記第1オーディオ信号及び前記第2オーディオ信号に基づいて第2角度を決定し、
前記第1角度及び前記第2角度の比較に基づいて異常状態が存在するかどうかを決定する、
ように構成される、非一時的物理コンピュータストレージ。
【請求項19】
前記第1技術は、一般化相互相関及び位相変換(GCC-PHAT)技術を含む、請求項18に記載の非一時的物理コンピュータストレージ。
【請求項20】
前記第2技術は、ダイレクトパス成分(DPC)技術を含む、請求項18に記載の非一時的物理コンピュータストレージ。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願に対する相互参照)
本出願は、全体が引用により本明細書に組み入れられる、2016年11月16日に申請された「ラウドスピーカ位置推定システム及び方法(SYSTEM AND METHOD FOR LOUDSPEAKER POSITION ESTIMATION)」という名称の米国仮出願第62/423,041号明細書に対し、米国特許法119条に基づく優先権を主張するものである。
【背景技術】
【0002】
サラウンドサウンドシステムは、一般に、高品質リスニング経験を達成するためにリスナーによる較正を必要とする。従来は、サラウンドサウンドシステムは、スイートスポット又はデフォルトリスニング位置に配置されたマルチ要素マイクロフォンを用いて、サラウンドサウンドシステムの各ラウドスピーカによって再生される試験信号を受信するよう手動で較正される。マルチ要素マイクロフォンは、通常は、長いケーブルを介して音声/視覚(A/V)受信機又はプロセッサに繋がれる。しかしながら、スイートスポットでのマルチ要素マイクロフォンの物理的配置又はデフォルトのリスニング位置付けは、リスナーにとって面倒である可能性がある。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【課題を解決するための手段】
【0004】
本開示の1つの態様は、マルチチャネルサラウンドサウンドシステムにおけるラウドスピーカの位置を推定する装置を提供する。本装置は、第1マイクロフォン及び第2マイクロフォンを含むマイクロフォンアレイを備え、第1マイクロフォンが、試験信号を出力するラウドスピーカに応答して第1オーディオ信号を生成するよう構成され、第2マイクロフォンが、試験信号を出力するラウドスピーカに応答して第2オーディオ信号を生成するように構成される。本装置は、マイクロフォンアレイに結合された位置推定エンジンを備え、この位置推定エンジンが、第1オーディオ信号及び第2オーディオ信号に基づいて到着時間差推定値を決定し、到着時間差推定値に基づいて第1角度を決定し、第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別し、第2オーディオ信号から得られたインパルス応答における第2ダイレクトパス成分を識別し、第1ダイレクトパス成分及び第2ダイレクトパス成分に基づいて第2角度を決定し、第1角度及び第2角度の比較に基づいて異常状態が存在するかどうかを決定する、ように構成される。
【0005】
前段落の装置は、以下の特徴の何れかの部分的組み合わせを含むことができ、位置推定エンジンが更に、第1オーディオ信号を1又は2以上の第1セグメントに区分し、第2オーディオ信号を1又は2以上の第2セグメントに区分し、1又は2以上の第1セグメントにおける第1セグメントのフーリエ変換を生成して第1フーリエ変換を形成し、1又は2以上の第2セグメントにおける第1セグメントのフーリエ変換を生成して第2フーリエ変換を形成し、且つ第1フーリエ変換及び第2フーリエ変換に基づいて到着時間差推定値を決定する、よう構成され、この位置推定エンジンは更に、1又は2以上の第1セグメント及び1又は2以上の第2セグメントの生成されたフーリエ変換に基づいて複数の到着時間差推定値を決定し、複数の到着時間差推定値をヒストグラムに集約し、ヒストグラムで最も多くの発生を有する複数の到着時間差推定値における到着時間差推定値に基づいて到着時間差推定値を決定するよう構成され、位置推定エンジンは更に、第1オーディオ信号から得られたインパルス応答における最高振幅に基づいて第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別するよう構成され、位置推定エンジンは更に、第1ダイレクトパス成分を含む第1時間ウィンドウを選択し、第2ダイレクトパス成分を含む第2時間ウィンドウを選択し、第1時間ウィンドウのデータ及び第2時間ウィンドウのデータを用いて相互相関を決定し、決定された相互相関を用いて第2角度を決定するよう構成され、位置推定エンジンは更に、第1角度と第2角度を比較し、第1角度と第2角度が閾値角度値内にないという決定に応答して異常状態が存在すると決定するよう構成され、閾値角度値は、0と15度の間の値を含み、本装置は更に、異常状態が存在するという決定に応答してネットワークを介してユーザデバイスに通知を送信するよう構成された通知生成器を備え、この通知は、ラウドスピーカの角度が正しくないという指示、物体がラウドスピーカとマイクロフォンアレイの間の経路を塞いでいるという指示、ラウドスピーカの極性が正しくないという指示、又はラウドスピーカの位置が正しくないという指示の1つを含み、本装置は、サウンドバー、音声/視覚(A/V)受信機、中央スピーカ、又はテレビジョンの1つを含み、マルチチャネルサラウンドサウンドシステムは、ステレオ、2.1、3.1、5.1、5.2、7.1、7.2、11.1、11.2、又は22.2スピーカレイアウトのうちの1つに配列される。
【0006】
本開示の別の態様は、マルチチャネルサラウンドサウンドシステムのラウドスピーカの位置を推定する方法を提供する。本方法は、マイクロフォンアレイの第1マイクロフォンから第1オーディオ信号及びマイクロフォンアレイの第2マイクロフォンから第2オーディオ信号を受信する段階と、第1オーディオ信号及び第2オーディオ信号に基づいて到着時間差推定値を決定する段階と、到着時間差推定値に基づいて第1角度を決定する段階と、第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別する段階と、第2オーディオ信号から得られたインパルス応答における第2ダイレクトパス成分を識別する段階と、第1ダイレクトパス成分及び第2ダイレクトパス成分に基づいて第2角度を決定する段階と、第1角度と第2角度の比較に基づいて異常状態が存在するかどうかを決定する段階と、を含む。
【0007】
前段落の方法は、以下の特徴の何れかの部分的組み合わせを含むことができ、到着時間差推定値を決定する段階は更に、第1オーディオ信号を1又は2以上の第1セグメントに区分する段階と、第2オーディオ信号を1又は2以上の第2セグメントに区分する段階と、1又は2以上の第1セグメントにおける第1セグメントのフーリエ変換を生成して第1フーリエ変換を形成する段階と、1又は2以上の第2セグメントにおける第1セグメントのフーリエ変換を生成して第2フーリエ変換を形成する段階と、第1フーリエ変換及び第2フーリエ変換に基づいて到着時間差推定値を決定する段階と、を含み、第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別する段階は更に、第1オーディオ信号から得られたインパルス応答の最高振幅に基づいて第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別する段階を含み、異常状態が存在するかどうかを決定する段階は更に、第1角度と第2角度を比較する段階と、第1角度及び第2角度が閾値角度値内にないという決定に応答して異常状態が存在すると決定する段階と、を含み、閾値角度値は、0と15度の間の値を含み、本方法は更に、異常状態が存在するという決定に応答してネットワークを介してユーザデバイスに通知を送信する段階を含み、この通知は、ラウドスピーカの角度が正しくないという指示、物体がラウドスピーカとマイクロフォンアレイの間の経路を塞いでいるという指示、ラウドスピーカの極性が正しくないという指示、又はラウドスピーカの位置が正しくないという指示のうちの1つを含む。
【0008】
本開示の別の態様は、ハードウェアプロセッサによって実行されたときに、試験信号を送信するようラウドスピーカに指示し、第1技術を用いてマイクロフォンアレイの第1マイクロフォンから録音された第1オーディオ信号及びマイクロフォンアレイの第2マイクロフォンから録音された第2オーディオ信号に基づいて第1角度を決定し、第2技術を用いて第1オーディオ信号及び第2オーディオ信号に基づいて第2角度を決定し、異常状態が第1角度及び第2角度の比較に基づいて存在するかどうかを決定する、よう少なくとも構成される実行可能命令を格納して含む非一時的物理コンピュータストレージを提供する。
【0009】
前段落の非一時的物理コンピュータストレージは、以下の特徴の何れかの部分的組み合わせを含むことができ、第1技術は、一般化相互相関及び位相変換(GCC-PHAT)技術を含み、第2技術はダイレクトパス成分(DPC)技術を含む。
【0010】
本開示の要約の目的で、本発明の特定の態様、利点及新規の特徴を本明細書で説明してきた。全てのこのような利点が必ずしも本明細書で開示する発明の何れの特定の実施形態によっても達成できるとは限らない点を理解されたい。従って、本明細書に開示する発明は、本明細書で教示又は提案することができる他の利点を必ずしも達成することなく、本明細書にて教示されるように1つの利点又は利点の一群を達成又は最適化する方式で実施又は具現化することができる。
【0011】
図面全体を通じて、参照要素間の対応関係を示すために参照符号は再使用される。図面は、本明細書で説明する発明の実施形態を例証するために提供され、本発明の範囲を限定するものではない。
【図面の簡単な説明】
【0012】
【
図1A】1実施形態による、ラウドスピーカ位置を推定してマルチチャネルサラウンドサウンドシステムを較正する例示的な部屋環境を示すハイレベルブロック図である。
【
図1B】1実施形態によるネットワークを介してサウンドバーと通信するユーザデバイスを示すブロック図である。
【
図2A】例示的なラウドスピーカ位置推定プロセスを示す図である。
【
図2B】例示的なダイレクトパス成分(DPC)選択プロセスを示す図である。
【
図2C】DPCを用いた例示的なラウドスピーカ角度決定プロセスを示す図である。
【
図2D】例示的なラウドスピーカ異常状態検出プロセスを示す図である。
【
図3】
図1Aのマイクロフォンアレイにおける第1マイクロフォンのインパルス応答及び
図1Aのマイクロフォンアレイにおける第2マイクロフォンのインパルス応答を示す例示的なグラフである。
【
図4】決定された第1角度及び決定された第2角度が同様の値を有する状況を示す例示的なグラフである。
【
図5】決定された第1角度及び決定された第2角度が同様の値を有していない状況を示す例示的なグラフである。
【
図6】
図1Bのユーザデバイスによって表示することができる例示的なグラフィカルユーザインタフェース(GUI)を示す図である。
【
図7】別の例示的なラウドスピーカ位置推定プロセスを示す図である。
【
図8】1実施形態による
図1Aの例示的な部屋環境における第1角度の実施例を示すハイレベルブロック図である。
【発明を実施するための形態】
【0013】
背景技術において上述したように、スイートスポットにてマルチ要素マイクロフォンを物理的に配置するようリスナーに要求すること又は較正の目的でのデフォルトリスニング位置付けは、面倒である可能性がある。従って、1又は2以上のマイクロフォンを中央の既知の位置に統合することができる。例えば、1又は2以上のマイクロフォンは、サウンドバー、A/V受信機、中央スピーカ、テレビジョン、マルチチャネルサラウンドサウンドシステムの前方構成要素に、テレビジョンの下方又は上方のデバイス及び/又はその他に一体化することができる。
【0014】
標準的なレイアウトは、1又は2以上のマイクロフォンの中央の既知の位置又は別の基準ポイント(例えば、リスニング位置)に対して1又は2以上のラウドスピーカを配置する位置を示し、最適又は最適に近いリスニング経験を達成することができる。しかしながら、リスナーが最適位置にラウドスピーカを配置することは困難であることが多い。例えば、壁、ドア、家具、及び/又は他の物体が、リスナーが1又は2以上のラウドスピーカを最適位置に配置するのを妨げる場合がある。ラウドスピーカを最適位置に配置できない場合、音声画像の歪みが生じ、リスナーは、コンテンツクリエータが意図したサウンドシーンを経験できない可能性がある。
【0015】
ラウドスピーカが最適位置に配置できないときには、ラウドスピーカに送信されたオーディオ信号を修正して、空間較正及び補償を介して歪みを最小限にすることができる。空間較正では、1又は2以上のマイクロフォンの中央の既知の位置に対して、又はリスニング位置に対してラウドスピーカの位置を決定するのが重要である場合がある。
【0016】
典型的には、ラウドスピーカの位置は、ラウドスピーカを通じて較正信号を再生すること、較正マイクロフォンで結果音響信号を受信すること、マイクロフォン出力信号を録音すること、及び一般化相互相関位相変換重み付け(GCC-PHAT)などの技術によって録音信号を分析することによって推定される。GCC-PHAT技術は、ラウドスピーカが1又は2以上のマイクロフォンに直接向かい合っているときには、信頼できる結果を生成することができる。しかしながら、GCC-PHAT技術は、他の状況下では信頼できない結果を生じることがある。例えば、GCC-PHAT技術は、ラウドスピーカと1又は2以上のマイクロフォンの間の経路を物体が塞いだ場合に信頼できない結果を生じることがある。別の例として、GCC-PHAT技術は、ラウドスピーカが1又は2以上のマイクロフォンに面する方向以外の方向に向けられた場合に信頼できない結果を生じることがある。
【0017】
従って、ラウドスピーカの位置及び/又は向きを推定し且つラウドスピーカの向きが正しくない場合又はラウドスピーカとマイクロフォンとの間の経路の経路を物体が塞いでいる場合にリスナーに知らせるラウドスピーカ位置推定システムの実施形態を本明細書で説明する。例えば、ラウドスピーカ位置推定システムは、2又は3以上のマイクロフォンを含むデバイス(例えば、A/V受信機、サウンドバー、中央スピーカ、テレビジョンなど)の中に一体化することができる。ラウドスピーカ位置推定システムは、試験信号(例えば、最大長シーケンス)を出力するようラウドスピーカに指示することができる。マイクロフォンの各々は、出力された試験信号の結果として生じた音響信号を受信することができる。マイクロフォンの各々は、音響信号をオーディオ信号に変換することができ、ここでオーディオ信号は、ストレージデバイスに録音することができる。ラウドスピーカ位置推定システムは、ラウドスピーカの距離を決定することができる。更に、ラウドスピーカ位置推定システムは、GCC-PHAT技術及び録音されたオーディオ信号を用いてラウドスピーカの推定角度を決定することができる。ラウドスピーカ位置推定システムはまた、録音されたオーディオ信号から得られたダイレクトパス成分(DPC)を用いてラウドスピーカの推定角度を決定することができる。
【0018】
ラウドスピーカ位置推定システムは、2つの推定された角度を比較することができる。2つの推定角度が閾値角度値内にある場合、ラウドスピーカ位置推定システムは、マイクロフォンとラウドスピーカとの間に障害物が検出されなかったことをリスナーに通知することができる。ラウドスピーカ位置推定システムは同様に、ラウドスピーカがリスニングサークルの中心に正しく向けられていることをリスナーに通知することができる。任意選択的に、ラウドスピーカ位置推定システムは、2つの推定角度が閾値角度値内にある場合に推定角度の少なくとも1つに基づいて補償成分のパラメータを導き出すことができ、ここでパラメータを用いて、非理想のラウドスピーカ配置又は将来の他の異常状態(例えば、ラウドスピーカを通じた再生の前にオーディオを処理するとき)を補償することができる。しかしながら、2つの推定角度が閾値角度値内である場合、ラウドスピーカの正しくない又は非理想の角度及び/又は正しくない又は非理想のラウドスピーカ位置が存在することがある。ラウドスピーカ位置推定システムは、1又は両方の推定角度を理想角度(例えば、理想的なラウドスピーカレイアウトにおいて指定された角度)と比較することができ、比較された角度が別の閾値角度値内にない場合、ラウドスピーカ位置推定システムは、ラウドスピーカの正しくない又は非理想の角度及び/又は正しくない又は非理想のラウドスピーカ位置が存在すると決定することができる。2つの推定角度が閾値角度値内にない場合、ラウドスピーカ位置推定システムは、異常状態が検出されたことをリスナーに通知することができる。異常状態の例としては、マイクロフォンとラウドスピーカとの間の障害物、ラウドスピーカの正しくない又は非理想の角度、正しくないラウドスピーカの極性、及び/又は正しくない又は非理想のラウドスピーカ位置を挙げることができる。モバイルコンピュータデバイスなどのユーザデバイス上で実行されるアプリケーションは、ラウドスピーカ位置推定システムと通信して、通知を表示するインタフェースを生成することができる。これに代えて又は加えて、ラウドスピーカ位置推定システムは、ラウドスピーカに送信された信号を修正して非理想のラウドスピーカ配置又は他の異常状態を補償する情報を補償成分に提供することができる。ラウドスピーカ位置推定システムの追加の詳細は、
図1Aから
図8に関して以下に説明する。
【0019】
例示的なラウドスピーカ位置推定システムの概要
概要として、
図1Aは、1つの実施形態によるラウドスピーカ位置を推定し且つマルチチャネルサラウンドサウンドシステムを較正するための例示的な部屋環境100を示すハイレベルブロック図を示している。マルチチャネルサラウンドサウンドシステムは、ステレオ、2.1、3.1、5.1、5.2、7.1、7.2、11.1、11.2、又は22.などの標準化ラウドスピーカレイアウトに従って配列されることが多い。波面合成(WFS)アレイ又は他のオブジェクトベースのレンダリングレイアウトなどの他のラウドスピーカレイアウト又はアレイを用いることもできる。サウンドバーは、モニタ又はテレビジョンなどのディスプレイデバイスの上又は下に据え付けることができる特殊ラウドスピーカエンクロージャである。最新のサウンドバーモデルは、左及び右チャネルスピーカと任意の中央スピーカ及び/又はサブウーファを同様に統合するスピーカアレイを含む給電式システムであることが多い。サウンドバーは、有線又は無線サラウンドスピーカ及び/又はサブウーファに接続されたときにホームシアターシステムの独立サラウンドサウンドシステム又はキーフロント構成要素の何れかのための融通性のあるソリューションになる。
【0020】
図1Aでは、部屋環境100は、3.1ラウドスピーカ構成(例えば、サウンドバー11、左サラウンドラウドスピーカ106、右サラウンドラウドスピーカ108、及びサブウーファ104)、テレビジョン102(又はモニタ又はビデオ画面)、リスナー120及びカウチ122を含む。サウンドバー110は、サウンドバー110のエンクロージャ内に統合されたスピーカアレイ112、マイクロフォンアレイ114、位置推定エンジン116、較正エンジン(図示せず)、及びA/V処理エンジン(図示せず)を含むことができる。他の実施形態では、サウンドバー110は、
図1Aに示したものとは異なる、より少ないか、又はより多い構成要素を含む。
【0021】
DVD、Blu-ray(登録商標)及びストリーミングコンテンツの出現及び普及は、マルチチャネルサウンドトラックの広範囲な利用可能性に繋がってきた。最新のサラウンドサウンドフォーマットは、このようなコンテンツを適正に再生するための理想的なラウドスピーカの配置を指定する。サラウンドサウンドシステムを所有する一般的なリスナーは、部屋のレイアウト又は家具の配置などの実際的な理由のためにラウドスピーカセットアップのためのこのような指示に従えないことが多い。このことは、コンテンツ制作者の意図とリスナーの空間オーディオ経験との間のミスマッチを生じることが多い。例えば、推奨される配置円130に沿ってラウドスピーカを配置すること及び推奨される配置円130の中心又は中心近くにリスナーが座ることが最前事例として推奨されることが多い。推奨されるラウドスピーカ配置の詳細は、全体が引用による組み入れられる国際テレコミュニケーションユニオン(ITU:International Telecommunication Union)レポートITU-R BS.2159-4(2012年5月)「ホーム及びブロードキャスティングアプリケーションにおけるマルチチャネルサウンド技術」に見い出すことができる。しかしながら、部屋環境100の部屋の制約又はユーザプリファレンスのせいで、右サラウンドラウドスピーカ108が、その推奨される位置109に配置されず、リスナー120は、推奨される配置円130の中心から離れたカウチ122に座っている。
【0022】
空間較正として一般的に知られるこのような問題の1つの解決策は、典型的には、デフォルトリスニング位置(又はスイートスポット)にマイクロフォンアレイを配置するようリスナーに要求することである。本発明のシステムは、各それぞれのラウドスピーカを介して試験信号を再生し、対応するマイクロフォン信号(例えば、マイクロフォンアレイによって取り込まれた音響信号の変換バージョン)を録音し、録音した信号を分析して各ラウドスピーカの位置を近似する。各ラウドスピーカ106及び108の位置を近似することによって、本システムは、補償プロセスを用いてマルチチャネルサウンドトラックを実際のスピーカレイアウトに空間的に再フォーマット化することができる。分かり易くすると、空間較正プロセスは、一般的には、各ラウドスピーカの位置を近似する段階と、近似された位置を用いてラウドスピーカセットアップエラーを決定する段階と、セットアップエラーに対する改善措置を提案する段階と、及び/又は補償プロセスによって使用することができる補償パラメータ(例えば、ラウドスピーカ位置推定値)を推定する段階を含む。この補償プロセスは、推定された補償パラメータを用いて最適再生のために(例えば、ラウドスピーカが非理想のシステムレイアウトにあるとき)オーディオ信号を修正する段階を含むことができる。しかしながら、この空間較正プロセスは、一般的なリスナーに対する強要となるか、又は不都合となる可能性がある。リスナー120が異なる位置に動いたときに、このような既存の方法は、この変化を検出して補償するすべがなく、リスナー120が、新しいリスニング位置に配置されたマイクロフォンを用いて手動で全体の較正プロセスをやり遂げる必要がある。対照的に、サウンドバー110において一体化されたマイクロフォンアレイ114を用いて、サウンドバー110の較正エンジン(図示せず)は、ラウドスピーカ106及び108に対する空間較正を実行して、同時に、全体が引用により本明細書に組み入れられる「リスナー位置推定を含むサラウンドサウンドシステムの空間較正(SPATIAL CALIBRATION OF SURROUND SOUND SYSTEMS INCLUDING LISTENER POSITION ESTIMATION)」という名称の米国特許公開第2015/0016642号明細書に詳細に記載されるように、最小のユーザ介入によってリスナー120の位置を推定することができる。一部の実施形態では、全体が引用により本明細書に組み入れられる「サラウンドサウンドシステムを較正するためのグラフィカルユーザインタフェース(GRAPHICAL USER INTERFACE FOR CALIBRATING A SURROUND SOUND SYSTEM)」という名称の2016年11月21日に出願された米国特許出願第15/357,971号明細書に詳細に記載されているように、リスナー位置をグラフィカルユーザインタフェースを介して指定することができる。空間較正の別の方法は、各ラウドスピーカ106及び108にマイクロフォンを組み込むことであり、中央構成要素において一体化された小型マイクロフォンアレイの使用と比較して極めて高価となる可能性がある。
【0023】
しかしながら、補償パラメータの正確な推定は、ラウドスピーカ106及び108の位置の正確な推定に依存することがある。不正確なラウドスピーカ106及び108の位置推定は、不十分なオーディオ信号修正及び/又は次善のリスニング経験をもたらすことがある。従来のラウドスピーカ位置推定技術は、例えば、ラウドスピーカ106又は108がマイクロフォンアレイ114から外方に面するか又はマイクロフォンアレイ114とラウドスピーカ106又は108との間の経路が物体によって塞がれている場合には、機能しなくなる場合がある。例えば、左サラウンドスピーカ106の前面は、マイクロフォンアレイ114に面する方向に向けられていないので、従来のラウドスピーカ位置推定技術は、左サラウンドラウドスピーカ106の位置の推定が不正確であることがある。別の例として、カウチ122が右サラウンドラウドスピーカ108とマイクロフォンアレイ114の間の経路にあるので、右サラウンドスピーカ108の前面がマイクロフォンアレイ114に面する方向で向けられていても、従来のラウドスピーカ位置推定技術は右サラウンドラウドスピーカ108の位置を正確に推定できない場合がある。
【0024】
従って、位置推定エンジン116は、ラウドスピーカ106又は108がマイクロフォンアレイ114の方向に向けられていないか、又はラウドスピーカ106又は108とマイクロフォンアレイ114との間の経路が塞がれている場合でも、ラウドスピーカ106及び108の位置推定を改善する技術を実施することができる。例えば、位置推定エンジン116は、第1技術を用いてラウドスピーカ106又は108の位置を推定することができる。第1技術を用いて推定された位置は、ベースライン推定値と考えることができる。位置推定エンジン116はまた、第2技術を用いてラウドスピーカ106又は108の位置を推定することができる。第2技術を用いて推定された位置は、遮られた経路又は正しくないラウドスピーカの向きのような異常状況を検出するのに活用することができる。位置推定エンジン116は、両方の位置推定値を用いて、信頼できるラウドスピーカ位置推定値を導くことができる。ラウドスピーカ位置推定値を用いて、ユーザ通知を生成及び/又は非理想のラウドスピーカ106又は108の配置又は他の異常状態を補償することができる。第1及び第2技術の追加の詳細は、
図2A-2Dに関して以下に説明する。位置推定エンジン116は、2つの位置推定技術を用いるものとして本明細書で説明しているが、これは限定を意図するものではない。位置推定エンジン116は、幾つかの位置推定技術の結果(例えば、3、4、5、6など)を組み合わせて、より信頼できるラウドスピーカ位置推定値を導くことができる。ニューラルネットワークなどの人工知能、又はヒューリスティック方法を用いて、位置推定技術の結果を組み合わせて、信頼できるラウドスピーカ位置推定値を導くことができる。
【0025】
加えて、サウンドバー110は、異常状況が検出されたときにリスナー120に対する通知を生成することができる。
図1Bは、1つの実施形態による、ネットワーク115を介してサウンドバー110と通信するユーザデバイス140を示すブロック図を示している。ネットワーク115は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、又は同様の組み合わせを含むことができる。
図1Bに示すように、例示的なサウンドバー110は、位置推定エンジン116及び通知生成器118を含む。
【0026】
ユーザデバイス140は、デスクトップコンピュータ、ラップトップ、タブレット、携帯情報端末(PDA)、テレビジョン、無線ハンドヘルドデバイス(スマートフォンなど)、サウンドバー、セットトップボックス、A/V受信機、ホームシアターシステムコンポーネント、これらの組み合わせ、及び/又はリスナー120によって操作されるものどとすることができる。ユーザデバイス140は、ユーザデバイス140に対してユーザインタフェースを表示させるアプリケーションを実行することができる。例えば、ユーザインタフェースは、サウンドバー110、サブウーファ104、左サラウンドラウドスピーカ106、及び/又は右サラウンドラウドスピーカ108の推定位置を表示することができる。ユーザインタフェースはまた、リスナー120が較正(例えば、空間較正及び/又は非空間較正)を開始するのを可能にする機能を含むことができる。リスナー120が較正を開始した場合、ユーザデバイス140は、ネットワーク115を介してサウンドバー110(例えば、図示していないが、サウンドバー110に組み込まれた較正エンジン)に較正作動の開始を指示することができる。較正作動の一部として、サウンドバー110は、本明細書で説明する方式で1又は2以上のラウドスピーカ106及び108の位置を推定するよう位置推定エンジン116に指示する。位置推定値の結果に基づいて、位置推定エンジン116は、異常状態が存在するかどうかを決定することができる。異常状態の例は、マイクロフォンアレイ114とラウドスピーカ106又は108との間の経路を塞ぐ物体、正しくないラウドスピーカ106又は108の角度、正しくないラウドスピーカ106又は108の極性、及び/又は正しくない又は非理想のラウドスピーカ106又は108の位置を含むことができる。この決定は、位置推定エンジン116によって通知生成器118に送信することができる。加えて、位置推定値(又は位置推定値から得られたパラメータ)をサウンドバー110内の補償成分(例えば、本明細書で説明する補償プロセスを実行する成分)に送信することができ、本明細書で説明するように配置されたラウドスピーカ106及び108を介した最適再生のためにマルチチャネルオーディオを修正する。
【0027】
通知生成器118は、位置推定エンジン116によって提供された決定に基づいて通知を生成することができる。例えば、異常状態が検出されなかった場合、通知生成器118は、異常状態が検出されなかったという通知を生成でき、又は通知を全く生成しなくてもよい。代替として、異常状態が検出された場合、通知生成器118は、どの異常状態が検出されたかを示す通知を生成し、問題を修正する方法をリスナー120に指示し、及び/又は問題が修正されると較正選択肢を再度選択するようリスナー120に指示することができる。任意選択的に、サウンドバー110は、以下に詳細に説明するように、問題を自動的に修正することができる。
【0028】
通知生成器118は、ネットワーク115を介してユーザデバイス140に通知を送信することができる。通知生成器118から通知を受信すると、本出願は、ユーザデバイス140に対してユーザインタフェースにおいて通知を表示させるようにすることができる。
【0029】
図1A-1Bは、サラウンドサウンドシステム構成の1つの実施例を例示しているに過ぎない点に留意されたい。他の実施形態は、より多く又はより少ないラウドスピーカを有する異なるラウドスピーカレイアウトを含むことができる。例えば、サウンドバー110は、中央チャネルスピーカ、2つの前方チャネルスピーカ(1つが左及び1つが右)、及びA/V受信機に置き換えて、従来の5.1構成を形成することができる。この例では、マイクロフォンアレイ114は、中央チャネルスピーカ又はAV受信機において統合することができ、較正エンジン、位置推定エンジン116、及び通知生成器118は、A/V受信機の一部とすることができ、更に、マイクロフォンアレイ114は、較正エンジン、位置推定エンジン116、及び/又は通知生成器118に結合することができる。サウンドバー110はまた、テレビジョン又は何れかの別のA/V構成要素に置き換えることができ、置き換えA/V構成要素は、較正エンジン、位置推定エンジン116、通知生成器118、及び/又はマイクロフォンアレイ114を含む。
【0030】
図1Aは2つのマイクロフォンを含むものとしてマイクロフォンアレイ114を示しているが、これは限定を意図するものではない。追加のマイクロフォン又はマイクロフォンアレイは、上部ラウドスピーカ、左側前方ラウドスピーカ、右側前方ラウドスピーカ、及び/又は適正な測定及び位置推定のための何れかの他のラウドスピーカに向かい合うように設置することができる。例えば、第3のマイクロフォンは、他の2つのマイクロフォンとは異なる深度及び/又は異なる高度でマイクロフォンアレイ114に含めることができる(例えば、他の2つのマイクロフォンと直線上に並ばない)。他の2つのマイクロフォンによって形成されたラインの外側に第3のマイクロフォンを位置付けることで、位置推定エンジン116がラウドスピーカの角度(例えば、アジマス角に加えて天頂角)を3次元で推定できるようになる。
【0031】
図1A-1Bは、サウンドバー110に含まれる単一の位置推定エンジン116を示すが、これは限定を意図するものではない。サウンドバー110は、あらゆる数の位置推定エンジン116(例えば、マイクロフォンアレイ114のマイクロフォンの複数の異なるサブセットの各々に対して1つの位置推定エンジン116)を含めることができる。例えば、位置推定エンジン116は、コンピュータプロセッシングユニット(CPU)、メモリ、及び/又は他のハードウェア構成要素(例えば、アナログ-デジタルコンバータ(ADC))を含むハードウェアデバイスとすることができる。CPUがマイクロフォンから録音されたオーディオ信号をプロセスできるように、バスは、CPUをマイクロフォンアレイ114のマイクロフォンに直接結合することができる。サウンドバー110が単一の位置推定エンジン116を含む場合、バスは、それぞれのマイクロフォンから録音されたオーディオ信号を一時的に格納するバッファにマイクロフォンアレイ114の各マイクロフォンを結合することができる。スイッチング機構を用いて、バッファからのデータをプロセスのためのCPUに向けることができる。代替として、単一の位置推定エンジン116は、複数のCPUを含むことができ、バスは、マイクロフォンアレイ114の各マイクロフォンを処理のための別個のCPUに結合することができる。
【0032】
例示的なラウドスピーカ位置推定プロセス
図2Aは、例示的なラウドスピーカ位置推定プロセス200を示している。1つの実施形態では、プロセス200は、
図1A-1Bに関して上述したサウンドバー110(例えば、位置推定エンジン116及び/又は通知生成器118)を含む、本明細書で説明するシステムの何れかによって実行することができる。実施形態によっては、プロセス200は、より少ない及び/又は追加のブロックを含むことができ、又は図示したものとは異なる順序でブロックを実行することができる。
【0033】
ブロック204、206、208、210、212、214、及び216は、ラウドスピーカの位置を推定する第1の例示的な技術に対応する。例えば、第1技術は、GCC-PHAT技術とすることができ、第1角度推定値を生成することができる。
図2B及び2Cに記述したプロセス218及び220はそれぞれ、ラウドスピーカの位置を推定するための第2技術に対応する。例えば、第2技術は、DPC技術とすることができ、第2角度推定値を生成することができる。
【0034】
プロセス200は、リスナーが較正を開始した後にブロック202で始めることができ、較正を実行するためのサウンドバー110によって実施される幾つかのプロセスのうちの1つとすることができる。本明細書で説明するプロセス200は、サウンドバー110(例えば、位置推定エンジン116及び/又は通知生成器118)によって実施されて、単一のラウドスピーカの位置を推定し、及び/又は推定された位置に関する通知を生成することができる。サウンドバー110は、マルチチャネルサラウンドサウンドシステムの1又は2以上のラウンドスピーカに対してプロセス200を繰り返すことができる。例えばサウンドバー110は、左サラウンドラウドスピーカ106に対して一度、及び右サラウンドラウドスピーカ108に対して一度、プロセス200を実行することができる。
【0035】
ブロック202において、ラウドスピーカは、試験信号を送信するよう指示される。例えば試験信号は、最大長シーケンス(例えば、疑似乱数バイナリシーケンス)とすることができる。有線又は無線接続を介して位置推定エンジン116による試験信号を送信するようラウドスピーカに指示することができる。1つの実施形態では、試験信号は500msの出力である。ラウドスピーカは、ループバック遅延(例えば、ハードウェアバッファ、ハードウェアフィルタリング、デジタルからアナログへの信号の変換、アナログからデジタルへの信号の変換などによって引き起こされる遅延など、サウンドバー110及び/又はラウドスピーカにおけるハードウェア構成要素によって引き起こされる遅延)などの遅延後、試験信号を出力することができる。マイクロフォンアレイ114のマイクロフォンは各々、出力された試験信号の結果として生じた音響信号を受信することができる。マイクロフォンアレイ114のマイクロフォンは次いで、オーディオ信号にそれぞれ対応する電気信号に音響信号を変換することができる。オーディオ信号は、ストレージデバイス(図示せず)に順次的に録音することができる。例えば、オーディオ信号は、出力された試験信号のダイレクトパス成分並びに部屋環境100内の物体(例えば、壁、物体など)によって起こる反響を含む可能性がある。ブロック202の完了後、プロセス200はブロック204及びプロセス218に続く。
【0036】
ブロック204において、変数nは、マイクロフォンアレイ114のマイクロフォンの数に等しく設定される。例えば変数nは、2、3、4、5、6などに設定することができる。
【0037】
ブロック206において、変数iは1に等しく設定される。変数iは、マイクロフォンアレイ114の特定のマイクロフォンを識別することができる。
【0038】
ブロック208において、マイクロフォンiから録音されたオーディオ信号のフーリエ変換が実行されて、フーリエ変換iを生成する。マイクロフォンiからのオーディオ信号は、設定時間の間録音することができる。例えば、設定時間は、サウンドバー110からのラウドスピーカの最大距離及び試験信号の時間長に基づくことができる。例として、サウンドバー110からのラウンドスピーカの最大距離は、15mと20mの間と予測することができる。従って、空中の音の速度が約342m/sであるとすると、出力された試験信号がラウドスピーカからマイクロフォンiに達する予測される最大伝播時間は、約43.9msと58.5msの間とすることができる。マイクロフォンiからのオーディオ信号は、少なくとも予測される最大伝播時間に加えて試験信号の時間長(例えば、少なくとも約558.5ms)の間録音することができる。フーリエ変換は、録音されたオーディオ信号全体(例えば、オーディオ信号の約558.5ms)に対して実行することができる。代替として、フーリエ変換は、録音されたオーディオ信号の一部(例えば、録音されたオーディオ信号の10msから30msセグメント)に実行することができ、及び/又は複数のフーリエ変換は、録音されたオーディオ信号の異なる部分に実行することができる(例えば、フーリエ変換を録音されたオーディオ信号の各30msセグメントに実行することができる)。
【0039】
ブロック210において、プロセス200は、変数iが変数nに等しいかどうかを決定する。変数iとnが等しい場合、プロセス200は、マイクロフォンアレイ114の各マイクロフォンから録音されたオーディオ信号にフーリエ変換を実行しブロック214に進むことができる。そうでなければ、プロセス200は、マイクロフォンアレイ114の各マイクロフォンから録音されたオーディオ信号にフーリエ変換が実行されず、ブロック212に進むことができる。
【0040】
ブロック212において、変数iは1ずつ増分される。変数iを1だけ増分した後に、プロセス200はブロック208に戻る。
【0041】
ブロック214において、フーリエ変換に基づいて、到着時間差が決定される。例えば、出力された試験信号(例えば音響信号の形態)は、マイクロフォンアレイ114のマイクロフォンの異なる位置が与えられた場合に、異なる時間にマイクロフォンアレイ114の各マイクロフォンに到達することができる。到着時間差は、この時間差を表すことができる。マイクロフォンアレイ114が2つのマイクロフォンを含む場合、到着時間差は以下のように決定することができる。
【数1】
(1)
ここで、
は、2つのマイクロフォンの到着時間差であり、X1(ω)及びX2(ω) は、2つのマイクロフォンからそれぞれ録音されたオーディオ信号のフーリエ変換であり、W(ω)は、加重関数である。加重関数は以下のように定義することができる。
【数2】
(2)
【0042】
代替の実施形態では、位置推定エンジン116は、可能な到着時間差推定値のセットを決定し、第1角度を決定する際に用いる到着時間差推定値であるとして1つの到着時間差推定値を選択する。例えば、上述のように、フーリエ変換は、録音されたオーディオ信号の10msから30msセグメントなど、録音されたオーディオ信号の一部分に実行することができる。試験信号が長い期間(例えば500ms)持続する可能性があるので、録音されたオーディオ信号は、類似の時間長を有することができ、複数の等しい又はほぼ等しいセグメントに分割又は区分することができる。到着時間差は、各セグメントに対して決定することができる。例えば、第1到着時間差は、マイクロフォンアレイ114の第1マイクロフォンから録音された第1セグメント及びマイクロフォンアレイ114の第2マイクロフォンから録音された第1セグメントに対して決定することができ、第2到着時間差は、マイクロフォンアレイ114の第1マイクロフォンから録音された第2セグメント及びマイクロフォンアレイ114の第2マイクロフォンから録音された第2セグメントに対して決定することができる、等々。位置推定エンジン116は、様々な到着時間差推定値をヒストグラムに体系化することができる。例えば、位置推定エンジン116は到着時間差推定値を量子化して、量子化された到着時間差推定値をビンに入れることができる。最高発生数を有する到着時間差推定値(例えば、量子化された到着時間差推定値の最高数を有するビン)を、第1角度を決定する際に用いる到着時間差推定値として選択することができる。任意選択的に、各到着時間差推定値は、補間された相互相関から導き出しサブサンプル精度を達成することができる。各到着時間差推定値は、整数部分及び分数部分を含むことができる。到着時間差推定値の整数部分をヒストグラムに体系化することができる。到着時間差の整数部分は、ヒストグラムに基づいて選択することができる(例えば、発生の最高数を有する到着時間差推定値に対応する整数部分は、到着時間差の整数部分として選択することができる)且つ選択された到着時間差推定値に対応する分数部分を整数部分に追加することができる。例として、選択された到着時間差推定値に対応する分数部分は、選択されたビンに整数部分がある最初の到着時間差推定値の分数部分の平均値を取ることによって導くことができる。
【0043】
ブロック216において、到着時間差に基づいて、ラウドスピーカの第1角度が決定される。例えば、マイクロフォンアレイ114のマイクロフォン間の距離を既知とすることができる。第1角度は以下のように決定することができる。
【数3】
(3)
ここで、cは空気中の音の速度であり、dはマイクロフォンアレイ114のマイクロフォン間の距離であり、
は、到着時間差である。第1角度は、マイクロフォンアレイ114のマイクロフォンを通過する線に対するラウドスピーカの中心とマイクロフォンアレイ114の中心をつなぐ線の角度を表すことができる。例として、マイクロフォンアレイ114のマイクロフォンがx-y座標面のy成分を持たない線に整列され、ラウドスピーカの中心とマイクロフォンアレイ114の中心をつなぐ線がx-y座標面のx成分を持たないようにラウドスピーカの中心が位置付けられる場合、決定される第1角度は、90度とすることができる。
図8は、1つの実施形態による、
図1Aの例示的な部屋環境100における第1角度810の例を示すハイレベルブロック図を示している。
図8に示すように、線820は、左サラウンドラウドスピーカ106の中心とマイクロフォンアレイ114の中心をつなぎ、線830は、マイクロフォンアレイ114のマイクロフォンを通過する線を表す。第1角度810は、線820と線830の間の角度を表す。第1角度が決定された後、プロセス200は、
図2Dに関して詳細に記載されるプロセス222に進む。1つの実施形態では、(1)マイクロフォンの各ペアに対する第1角度を決定して(例えば、マイクロフォンの各ペアに対してブロック214及び216を繰り返す)、次いで結果を融合させることにより、及び/又は(2)線形代数式を用いて到着方向を決定することによって、2より多いマイクロフォンを含むマイクロフォンアレイ114についての第1角度を決定することができる。
【0044】
図2Bは、例示的なDPC選択プロセス218を示している。1つの実施形態では、プロセス218は、
図1A-1Bに関して上述したサウンドバー110(例えば、位置推定エンジン116)を含む、本明細書で説明されるシステムの何れかによって実行することができる。実施形態によっては、プロセス218は、より少ない及び/又は追加のブロックを含むことができ、又は図示したものとは異なる順序でブロックを実行することができる。
【0045】
プロセス218は、プロセス200のブロック202が完了した後、ブロック224で開始することができる。ブロック224において、変数nがマイクロフォンアレイ114のマイクロフォンの数に等しく設定される。例えば変数nは、2、3、4、5、6などに設定することができる。
【0046】
ブロック226において、変数iは1に等しく設定される。変数iは、マイクロフォンアレイ114の特定のマイクロフォンを識別することができる。
【0047】
ブロック228において、マイクロフォンiから録音されたオーディオ信号及び試験信号から得られたインパルス応答における最大ピークが決定される。例として、位置推定エンジン116は、録音されたオーディオ信号のフーリエ変換を行い、試験信号のフーリエ変換で結果を除算することによって、インパルス応答を導くことができる。除算は、伝達関数のフーリエ変換を生じる。位置推定エンジン116は、伝達関数のフーリエ変換の逆フーリエ変換を行い、インパルス応答を導くことができる。1つの実施形態では、位置推定エンジン116は、ラウドスピーカが試験信号を出力するよう指示された後に1つのループバック遅延に対応する時間に開始し且つ試験信号に加えて試験信号の時間長を受信するための予測最大時間量に対応する時間に終わる、時間ウィンドウ内の最大ピークを識別する。
【0048】
ブロック230において、決定された最大ピークに基づいて、閾値振幅が決定される。例えば、閾値振幅は、決定された最大ピークの設定パーセンテージ(例えば、50%、60%、70%、80%、90%など)とすることができる。
【0049】
ブロック232において、最大ピークの時間前の時間に対応し且つ閾値振幅よりも大きなインパルス応答のピークが存在するかどうかが決定される。場合によっては、部屋環境100内の反響に起因して、最大ピークは、DPC(例えば、1又は2以上の表面から反射した後にマイクロフォンiに達することがある他のオーディオ信号とは対照的にラウドスピーカからマイクロフォンiへのダイレクトパスで移動するオーディオ信号)ではない。従って、位置推定エンジン116は、最大ピークの前に発生し且つ一定の閾値より上の振幅を有する別のピークを発見することによってDPCを決定することができる。
【0050】
ブロック234において、プロセス218は、閾値振幅よりも大きな振幅を有する最大ピーク前のピークが存在する場合、ブロック238に進む。そうでなければ、プロセス218はブロック236に進む。
【0051】
ブロック236において、マイクロフォンiのDPCは、最大ピークになるよう設定される。例えば、DPCは、DPCとみなされるのに十分高い振幅を有する他のピークが最大ピーク前に起こっていないので、最大ピークに設定することができる。
図3は、マイクロフォンアレイ114のマイクロフォン314Aについてのインパルス応答及びマイクロフォンアレイ114のマイクロフォン314Bについてのインパルス応答を示す、例示的なグラフ300を示している。
図3に示すように、ピーク310Aは、マイクロフォン314Aのインパルス応答の最大ピークであり、ピーク310Bは、マイクロフォン314Bのインパルス応答の最大ピークである。ピーク310A及び310Bの前に起こるピークは、閾値振幅を超えない場合があり、従って、ピーク310Aは、マイクロフォン314Aのインパルス応答のDPCとして設定することができ、ピーク310Bは、マイクロフォン314Bのインパルス応答のDPCとして設定することができる。
【0052】
ブロック238において、マイクロフォンiのDPCは、最大ピークの時間前の時間に対応し且つ閾値振幅よりも大きいインパルス応答における第1ピークになるよう設定される。例えば、最大ピーク前に起こる複数のピークは、閾値振幅を超えることがある。しかしながら、閾値振幅を超える第1ピークは、DPCとして選択することができる。
【0053】
ブロック240において、プロセス218は、変数iが変数nに等しいかどうかを決定する。変数i及びnが等しい場合、プロセス218は、マイクロフォンアレイ114の各マイクロフォンのDPCを決定し、プロセス220のブロック244に進むことができる。そうでなければ、プロセス218は、マイクロフォンアレイ114の各マイクロフォンに対してDPCを決定せず、ブロック242に進むことができる。
【0054】
ブロック242において、変数iは1ずつ増分される。変数iを1増分した後で、プロセス218はブロック228に戻る。
【0055】
図2Cは、DPCを用いた例示的なラウドスピーカ角度決定プロセス220を示している。1つの実施形態では、プロセス220は、
図1A-1Bに関して上述したサウンドバー110(例えば、位置推定エンジン116)を含む、本明細書で説明するシステムの何れかによって実行することができる。実施形態によっては、プロセス220は、より少ない及び/又は追加のブロックを含むことができ、或いは、ブロックは、図示したものとは異なる順序で実行することができる。
【0056】
プロセス220は、プロセス218のブロック240が完了した後、ブロック244で開始することができる。ブロック244において、各DPCの周りの時間ウィンドウが選択される。例えば、位置推定エンジン116は、各マイクロフォンiDPCに対して、それぞれのDPCの周りの時間ウィンドウを選択することができる。時間ウィンドウは、DPCピークの時間前の数ms(例えば、10ms、20msなど)で開始することができ、DPCピークの時間後の数ms(例えば、10ms、20msなど)で終了することができる。
【0057】
ブロック246において、選択された時間ウィンドウの間の相互相関が、時間遅延を推定するために決定される。例えば、位置推定エンジン116は、選択された時間ウィンドウに含まれるデータの相互相関を決定することができる。推定された時間遅延は、相互相関データの開始(例えば、マイクロフォンi時間ウィンドウの開始に対応する時間)と相互相関データが最高振幅を有する時間との間の時間の長さに対応することができる。任意選択的に、時間遅延推定の精度を改善するために、相互相関出力に対して補間を実行することができる。代替の実施形態では、位置推定エンジン116は、第2マイクロフォンのDPCピークに対応する時間から第1マイクロフォンのDPCピークに対応する時間を減算することによって推定時間遅延を決定することができる。しかしながら、この方式は、一部の実施形態では1サンプルのエラーでさえ結果として得られる角度決定に重大な影響を与える可能性があるので、相互相関を実行するよりも高いノイズをもたらすことがある。
【0058】
ブロック248において、推定時間遅延に基づいて、第2角度が決定される。例えば、式(3)を推定時間遅延(例えば、到着時間差に置き換える)と共に用いて、第2角度を決定することができる。第2角度は、マイクロフォンアレイ114のマイクロフォンを通過する線に対するマイクフォンアレイ114の中心とラウドスピーカの中心をつなぐ線の角度を表すことができる。プロセス220が第2角度を決定すると、プロセス220は、プロセス222のブロック250に進むことができる。
【0059】
図2Dは、例示的なラウドスピーカ異常状態検出プロセス222を示している。1つの実施形態では、プロセス222は、
図1A-1Bに関して上述したサウンドバー110(例えば、位置推定エンジン116及び/又は通知生成器118)を含む、本明細書で説明するシステムの何れかによって実行することができる。実施形態によっては、プロセス222はより少ない及び/又は追加のブロックを含むことができ、又は図示したものとは異なる順序でブロックを実行することができる。
【0060】
プロセス222は、プロセス220のブロック248が完了した後、ブロック250で開始することができる。ブロック250において、第1角度が第2角度と比較される。一部の実施形態では、ブロック202、204、206、208、210、212、214、及び216、プロセス218、及びプロセス220は、複数回繰り返される。従って、第1角度及び第2角度は、一連の試験を介して比較することができる。
【0061】
決定された第1角度は、ラウドスピーカの出力がマイクロフォンアレイ114に直接向いているときに正確であるとすることができる。しかしながら、ラウドスピーカの出力が、マイクロフォンアレイ114に向いた方向以外の方向に面しているとき、又はマイクロフォンアレイ14とラウドスピーカとの間の経路に障害物があるときに、決定された第1角度は正確でないとすることができる。ラウドスピーカの出力がマイクロフォンアレイ114に直接向いているときには、決定された第2角度も正確であるとすることができ、ラウドスピーカがマイクロフォンアレイ114に向いた方向以外の方向に面しているとき、又はマイクロフォンアレイ114とラウドスピーカとの間の経路に障害物があるときに、決定された第1角度よりも決定された第2角度が正確であるとすることができる。
【0062】
従って、ブロック252において、第1角度と第2角度との差が閾値角度値よりも大きいかどうか、比較に基づいて決定される。2つの角度の差が閾値角度値を超える場合、これは、異常状態が存在することを示すことができる。例として、閾値角度値は、0と15度の間とすることができる。ラウドスピーカがマイクロフォンアレイ114に面していないか、又は物体がラウドスピーカとマイクロフォンアレイ114との間の経路を塞いでいるときにDPC技術の比較的一貫した精度及びGCC-PHAT技術の不正確さを前提とすると、位置推定エンジン116は、このような状況ではDPC方法によって得られた結果を提供することができる。しかしながら、2つの角度の間の差が閾値角度値を超えない場合でも、ラウドスピーカの正しくない又は非理想の角度及び/又は正しくない又は非理想のラウドスピーカ位置が、依然として存在することがある。
【0063】
ブロック254において、2つの角度が閾値角度値内である場合、プロセス222はブロック256に進む。そうでなければ、プロセス222はブロック262に進む。
図4は、決定された第1角度410(例えば、GCC-PHAT技術を用いて決定された)及び決定された第2角度420(例えば、DPC技術を用いて決定された)が同様の値を有する状況を示す例示的なグラフ400を示している。例えば、決定された第1角度410及び決定された第2角度420の値は、閾値角度値内とすることができる(例えば、角度は約0.3度内である)。複数の第1及び第2角度410及び420が決定されるように複数の試験を実行することができる。
図5は、決定された第1角度510(例えば、GCC-PHAT技術を用いて決定された)及び決定された第2角度450(例えば、DPC技術を用いて決定された)が同様の値を持たない状況を示す例示的なグラフ500を示している。例えば、決定された第1角度510及び決定された第2角度520の値は、閾値角度値内にないことがある(例えば、角度は約11度離れている)。複数の第1及び第2角度510及び520が決定されるように複数の試験を実行することができる。
【0064】
ブロック256において、第1及び/又は第2角度が、理想角度と比較される。理想角度は、理想ラウドスピーカレイアウトから得られ又は提供される角度とすることができる。この比較を実行して、ラウドスピーカの正しくない又は非理想の角度及び/又は正しくない又は非理想のラウドスピーカ位置が存在するかどうかを決定することができる。
【0065】
ブロック258において、プロセス222は、第1及び/又は第2角度が理想角度(例えば、ラウドスピーカの正しくない又は非理想の角度及び/又は正しくない又は非理想のラウドスピーカ位置が検出されないことを示す)の閾値角度値(ブロック252又は254と同じ閾値角度値か又は異なるかの何れか)内である場合、ブロック260に進む。そうでなければ、プロセス222はブロック262に進む。
【0066】
ブロック260において、エラーは検出されない。位置推定エンジン116は、エラーが検出されなかったことを通知生成器118に示すことができる。通知生成器118は、エラーが検出されなかったこと、ラウドスピーカの角度が正しいこと、及び/又は物体がラウドスピーカとサウンドバー110(例えば、マイクロフォンアレイ114)との間の経路を塞いでいないことを示す通知を生成することができる。代替として、通知生成器118は、通知を生成しなくてもよい。サウンドバー110は、決定された角度及び/又はDPCピークに基づいて決定された距離の何れかを用いて較正の残りの部分を実行することができる。
【0067】
ブロック262において、異常状態が検出される。位置推定エンジン116は、異常状態が検出されたことを通知生成器118に示すことができる。通知生成器118は、物体がマイクロフォンアレイ114とラウドスピーカとの間の経路を塞いでいること及び/又は物体を取り除かなくてはならないこと、ラウドスピーカの正しくない又は非理想の角度が検出されたこと、正しくない又は非理想のラウドスピーカ位置が検出されたこと、及び/又は正しくない極性が検出されたことを示す通知を生成することができる。
【0068】
代替として又はこれに加えて、通知は、ラウドスピーカが間違って向けられていることを示すことができる。例えば、通知は、ラウドスピーカの向きをチェックする(例えば、ラウドスピーカが円130の中心に向けられているかどうかチェックする)ようリスナー120に通知することができる。
【0069】
代替として又はこれに加えて、通知は、ラウドスピーカが正しくない位置を有する(例えば、ラウドスピーカが繋がれている出力が与えられる場合に、ラウドスピーカが部屋の間違った側に配置されている)ことを示すことができる。例えば、較正が開始されたときには、サウンドバー110は、試験信号を出力するようラウドスピーカの1又は2以上に指示する。従って、サウンドバー110は、例えば、どのサラウンドラウドスピーカが所与の時間に試験信号を出力しているかを認識する。左サラウンドラウドスピーカ106が右サラウンドジャックに接続され右サラウンドラウドスピーカ108が左サラウンドジャックに接続されるように、リスナー120が左サラウンド及び右サラウンドラウドスピーカを配線した場合、サウンドバー110は、右サラウンドラウドスピーカ108が試験信号を出力することが予測されるときに試験信号を出力するよう左サラウンドラウドスピーカ106に指示することができる。決定された第2角度(及び/又は決定された第1角度)は、左サラウンドラウドスピーカ106が試験信号を出力し且つ右サラウンドラウドスピーカ108が出力しない場合、予測される値を有することができる。従って、代わりの指定のラウドスピーカに予測される値(例えば、右サラウンドラウドスピーカに予測される値に類似である左サラウンドラウドスピーカの決定された第2角度の値)は、位置推定エンジン116によって認識することができ、リスナー120に相応に通知することができる。追加の実施形態では、リスナー120がラウドスピーカを手動で交換しなくてよいように、サウンドバー110は、このような状況でサウンドバー110の内部配線をリルートすることができる。
【0070】
代替として又はこれに加えて、通知は、ラウドスピーカが正しくない極性を有することを示すことができる。例えば、ユーザは、ラウドスピーカの正入力を負ジャックに接続することができ、ラウドスピーカの負入力を正ジャックに接続することができる。このような状況では、マイクロフォンアレイ114のマイクロフォンから録音されたオーディオ信号は、試験信号と位相ずれ(例えば、180度位相ずれ)になる可能性がある。従って、位置推定エンジン116は、録音されたオーディオ信号と試験信号を比較することができる。2つの信号が一定の値の閾値(例えば、180度)内で互いに位相ずれである場合、正しくない極性を位置推定エンジン116によって認識することができ、リスナー120に適切に通知することができる。追加の実施形態では、リスナー120が手動でラウドスピーカを再配線しなくてよいように、サウンドバー110は、このような状況で極性を逆にするためにサウンドバー110の内部配線をリルートすることができる。
【0071】
代替として又はこれに加えて、通知は、ラウドスピーカ位置が正しくない又は非理想の的であること、及び/又はラウドスピーカを再位置付けしなくてはならない位置を示すことができる。例えば、DPCピークは、ラウドスピーカとマイクロフォンアレイ114との間の距離に対応することができる。DPCピークがラウドスピーカからマイクロフォンアレイ114までのオーディオ信号のダイレクトパスに対応するので、ラウドスピーカが試験信号を出力するよう指示された時間にループバック遅延を付加して、DPCピークが起こった時間から組み合わせ時間を減算することは、オーディオ信号がラウドスピーカからマイクロフォンアレイ114に移動した時間に対応する。この時間は、空気中の音速で時間を乗算することによって位置推定エンジン116による距離推定値に変換することができる。この距離推定値は、ラウドスピーカとマイクロフォンアレイ114との間の距離を表すことができる。距離推定値は、角度推定値(例えば、第1角度)と組み合わせてラウドスピーカの可能な位置を決定することができる。位置推定エンジン116は、決定された可能な位置に基づいて最適再生のためにオーディオ信号を修正する補償成分によって使用する補償パラメータを取得することができ、及び/又は決定された可能な位置は、ユーザデバイス140上のグラフィカルユーザインタフェースに表示することができる。位置推定エンジン116はまた、ラウドスピーカを再位置付けするための提案される位置として実施可能な位置に近い推奨される配置円130に沿った位置(例えば、標準的なレイアウトにおける最も近い位置)を決定することもできる。一部の実施形態では、較正は、ラウドスピーカを推奨される位置に再位置付けした後に実行することができる。一部の実施形態では、ラウドスピーカの1又は2以上の可能な位置は、ユーザデバイス140上のグラフィカルユーザインタフェースに表示され、リスナー120は、ラウドスピーカの物理的な位置にぴったりの位置を選択することができる(例えば、リスナー120がラウドスピーカの再位置付けを要求されないように)。
【0072】
ブロック260又は262で生成された通知は、通知生成器118によってネットワーク115を介してユーザデバイス140に送信することができる。ユーザデバイス140は通知を表示することができる。
【0073】
代替の実施形態では、決定された角度の間の差が閾値角度値を超える場合、位置推定エンジン116は、決定された第2角度及び/又は較正を実行する場合に使用するDPCピークに基づいて決定された距離を選択する。従って、通知を生成しなくてもよく較正を完了させることができる。
【0074】
例示的なグラフィカルユーザインタフェース
図6は、
図1Bのユーザデバイス140によって表示することができる例示的なグラフィカルユーザインタフェース(GUI)600を示している。例えば、ユーザデバイス140は、ユーザデバイス140にGUI600を表示させるアプリケーションを実行することができる。GUI600は、較正ボタン660、補償ボタン662、及びサウンドバー610のグラフィカル表示、リスナー620、左サラウンドラウドスピーカ606、及び右サラウンドラウドスピーカ608を含むことができる。
【0075】
較正ボタン660の選択は、ユーザデバイス140に、サウンドバー610(例えば、物理デバイスでありGUI600に示した表現ではない)に命じて空間及び/又は非空間(例えば、正しくない極性検出)較正を実行させることができる。較正の一部として、サウンドバー610は、本明細書で説明するように通知を生成することができる。通知が生成された場合、通知をユーザデバイス140に送信してGUI600に表示することができる。代替として、サウンドバー610が較正の結果をユーザデバイス140に送信することができ、ユーザデバイス140が、通知を生成すべきかどうかを決定することができる。
【0076】
補償ボタン662の選択は、補償プロセスのオン及びオフを切り替えることができる。加えて、リスナー620アイコンを選択してGUI内でドラッグし、リスナー620の真の位置を表すことができる。GUI600内で、リスナー620が、ラウドスピーカ606及び608のレイアウト、リスナー620の位置、ラウドスピーカ606及び608の位置などを変更するのを可能にする追加の選択肢を選択することができる(図示せず)。例えば、通知がリスナー620に提供される及び/又は較正が1又は2以上の回数起動された後に異常状態の検出が続く場合、これらの追加の選択肢(例えば、リスナー620が幾つかの可能な表示選択肢からGUI600でラウドスピーカの位置を選択できるようにする手動較正選択肢など)をリスナー620に提示することができる。
【0077】
別の例示的なラウドスピーカ位置推定プロセス
図7は、別の例示的なラウドスピーカ位置推定プロセス700を示している。1つの実施形態では、プロセス700は、
図1A-1Bに関して上述したサウンドバー110(例えば、位置推定エンジン116及び/又は通知生成器118)を含む本明細書で説明したシステムの何れかによって実行することができる。実施形態によっては、プロセス700は、より少ない及び/又は追加のブロックを含むことができ、又は図示したものとは異なる順序でブロックを実行することができる。
【0078】
ブロック702において、試験信号を送信するようラウドスピーカに命じられる。例えば試験信号は最大長シーケンスとすることができる。ラウドスピーカに命じて有線又は無線接続を介して位置推定エンジン116による試験信号を送信することができる。マイクロフォンアレイ114のマイクロフォンは各々、出力された試験信号の結果としてオーディオ信号を生成することができる。オーディオ信号はストレージデバイス(図示せず)に録音することができる。
【0079】
ブロック704において、第1角度が、第1技術を用いてマイクロフォンアレイ114の第1マイクロフォンから録音された第1オーディオ信号及びマイクロフォンアレイ114の第2マイクロフォンから録音された第2オーディオ信号に基づいて決定される。この第1技術は、ラウドスピーカの位置を推定するために用いられる何れの技術にもすることができる。例えば第1技術は、本明細書で説明するGCC-PHAT技術とすることができる。
【0080】
ブロック706において、第2角度が第2技術を用いて第1オーディオ信号及び第2オーディオ信号に基づいて決定される。この第2技術は、第1技術以外のラウドスピーカの位置を推定するために用いられる何れかの技術とすることができる。例えば第2技術は、本明細書で説明するDPC技術とすることができる。
【0081】
図7に示すように、ブロック704及び706は、順序通りに実行され、ブロック704が最初に実行される。しかしながら、これは限定を意図するものではない。例えば、ブロック704及び706を連続して実行することができ、ブロック706を最初に実行することもできる。別の例として、ブロック704及び706を同時に実行することができる。
【0082】
ブロック708において、異常状態が存在するかどうかが、第1角度と第2角度の比較に基づいて決定される。例えば、第1角度と第2角度が閾値角度値より大きく異なる場合、本明細書で説明する異常状態の1又は2以上などの異常状態が存在することになる。そうでなければ、異常状態が存在しないことになる。
【0083】
追加の実施形態
本開示の1つの態様は、マルチチャネルサラウンドサウンドシステムにおけるラウドスピーカの位置を推定する装置を提供する。本装置は、第1マイクロフォン及び第2マイクロフォンを含むマイクロフォンアレイを備え、第1マイクロフォンは、試験信号を出力するラウドスピーカに応答して第1オーディオ信号を生成するよう構成され、第2マイクロフォンは、試験信号を出力するラウドスピーカに応答して第2オーディオ信号を生成するように構成される。本装置は更に、マイクロフォンアレイに結合された位置推定エンジンを備え、位置推定エンジンは、第1オーディオ信号及び第2オーディオ信号に基づいて到着時間差を決定し、到着時間差に基づいて第1角度を決定し、第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別し、第2オーディオ信号から得られたインパルス応答における第2ダイレクトパス成分を識別し、第1ダイレクトパス成分及び第2ダイレクトパス成分に基づいて第2角度を決定し、第1角度と第2角度の比較に基づいて異常状態が存在するかどうかを決定する、ように構成される。
【0084】
前段落の装置は、以下の特徴の何れかの部分的組み合わせを有することができ、位置推定エンジンは更に、第1オーディオ信号のフーリエ変換を生成して第1フーリエ変換を形成し、第2オーディオ信号のフーリエ変換を生成して第2フーリエ変換を形成し、第1フーリエ変換及び第2フーリエ変換に基づいて到着時間差を決定する、よう構成され、位置推定エンジンは更に、第1オーディオ信号の異なる部分及び第2オーディオ信号の異なる部分に基づいて他の到着時間差を決定し、到着時間差と他の到着時間差を集約し、集約された到着時間差における到着時間差に対応する値の発生の数に基づいて第1角度を決定するための到着時間差を選択するよう構成され、位置推定エンジンは更に、第1オーディオ信号から得られたインパルス応答における最高振幅に基づいて第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別するよう構成され、位置推定エンジンは更に、第1オーディオ信号から得られたインパルス応答における最高振幅の前に発生し且つ最高振幅の閾値内である第1オーディオ信号から得られたインパルス応答における第1振幅に基づいて第1オーディオ信号から得られたインパルス応答における第1ダイレクトパス成分を識別するよう構成され、位置推定エンジンは更に、第1ダイレクトパス成分を含む第1時間ウィンドウを選択し、第2ダイレクトパス成分を含む第2時間ウィンドウを選択し、第1時間ウィンドウのデータ及び第2時間ウィンドウのデータを用いて相互相関を決定し、決定した相互相関を用いて第2角度を決定するよう構成され、位置推定エンジンは更に、第1角度と第2角度を比較し、第1角度及び第2角度が閾値角度値内にないという決定に応答して異常状態が存在すると決定するよう構成され、位置推定エンジンは更に、第1角度及び第2角度が閾値角度値内にあるという決定に応答して異常状態が存在しないと決定するよう構成され、閾値角度値は0と15度の間を含み、本装置は更に、異常状態が存在するという決定に応答してネットワークを介してユーザデバイスに通知を送信するよう構成された通知生成器を含み、この通知は、ラウドスピーカの角度が正しくないという指示、物体がラウドスピーカとマイクロフォンアレイの間の経路を塞いでいるという指示、ラウドスピーカの極性が正しくないという指示、又はラウドスピーカの位置が正しくないか又は理想的でないという指示の1つを含み、位置推定エンジンは更に、試験信号の出力をラウドスピーカに指示するよう構成され、本装置は、サウンドバー、音声/視覚(A/V)受信機、中央スピーカ、又はテレビジョンの1つを備え、マルチチャネルサラウンドサウンドシステムは、ステレオ、2.1、3.1、5.1、5.2、7.1、7.2、11.1、11.2、又は22.2スピーカレイアウトのうちの1つに配列される。
【0085】
(用語)
本明細書で記載したこと以外の多くの他の変形形態は、本開示から明らかになるであろう。例えば実施形態によっては、本明細書で説明したアルゴリズムの何れかの一定の動作、事象、又は機能は、異なる順序で実行することができ、追加することができ、統合することができ、又は互いに省くことができる(例えば、全ての説明した動作又は事象が必ずしもアルゴリズムの実施に必要であるわけではない)。一定の実施形態では、動作又は事象は、同時に、例えば、マルチスレッドプロセス、割り込みプロセス、又はマルチプロセッサ又はプロセッサコア、又は順次ではない他の並行アーキテクチャを介して実行することができる。加えて、異なるタスク又はプロセスは、共に機能することができる異なる機械及び/又はコンピュータシステムによって実行することができる。
【0086】
本明細書で開示した実施形態に関して記載される様々な例証の論理ブロック、モジュール、及びアルゴリズムのステップは、電子ハードウェア、コンピュータソフトウェア、又はこれらの組み合わせとして実施することができる。ハードウェアとソフトウェアのこの互換性を分かり易く示すために、様々な例証の構成要素、ブロック、モジュール、及びステップが、これらの機能の点で全体的に説明されている。このような機能がハードウェア又はソフトウェアとして実施されるかどうかは、特定の応用及び全体のシステムに課される設計制約に依存する。記載された機能は、各特定の応用に対して異なる方式で実施することができるが、このような実施の決定は、本開示の範囲から逸脱するものとして解釈すべきではない。
【0087】
本明細書で開示した実施形態に関して説明した様々な例証の論理ブロック及びモジュールは、デジタル論理回路を含むハードウェアプロセッサ、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又は他のプログラマブル論理デバイス、離散的ゲート又はトランジスタ論理、離散的ハードウェア構成要素、又は本明細書で説明する機能を実行するよう設計されたこれらの何れかの組み合わせなどの機械によって実施又は実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替として、プロセッサは、コントローラ、マイクロコントローラ、又は状態機械、同様の組み合わせなどとすることができる。プロセッサは、コンピュータ実行可能命令をプロセスするよう構成された電気回路を含むことができる。別の実施形態では、プロセッサは、コンピュータ実行可能命令をプロセスすることなく論理動作を実行するFPGA又は他のプログラマブルデバイスを含む。プロセッサは、コンピュータデバイスの組み合わせ、例えばDSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアと連動した1又は2以上のマイクロプロセッサ、又は何れかの他のこのような構成として実施することもできる。コンピュータ環境は、限定されないが、例を挙げると、マイクロプロセッサ、メインフレームコンピュータ、デジタル信号プロセッサ、携帯式コンピュータデバイス、デバイスコントローラ、又は機器内のコンピュータエンジンに基づくコンピュータシステムを含む何れかのタイプのコンピュータシステムを含むことができる。
【0088】
本明細書で開示した実施形態に関して説明した方法、プロセス、又はアルゴリズムのステップは、ハードウェアで直接、1又は2以上のメモリデバイスに格納され且つ1又は2以上のプロセッサによって実行されるソフトウェアモジュールで、又はこの2つの組み合わせで実施することができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、取り外し可能ディスク、CD-ROM、又は非一時的コンピュータ可読ストレージ媒体、複数の媒体、又は当技術で既知の物理的コンピュータストレージの何れかの他の形態に存在することができる。例示的なストレージ媒体は、プロセッサがストレージ媒体から情報を読み取りストレージ媒体に情報を書き込むことができるようにプロセッサに結合することができる。代わりに、ストレージ媒体は、プロセッサに統合することができる。ストレージ媒体は、揮発性又は不揮発性とすることができる。プロセッサ及びストレージ媒体はASICに存在することができる。
【0089】
とりわけ、「canできる」、「might」、「may」、「e.g.」などの本明細書で使用する条件言語は、一般的には、他に具体的に指示がない限り、又は使用される文脈内で理解される以外は、特定の実施形態が、特定の特徴、要素及び/又は状態を含むが、他の実施形態は含まないことを伝えることが意図される。従って、このような条件言語は、一般的には、特徴、要素及び/又は状態が、1又は2以上の実施形態に要求されること、又は1又は2以上の実施形態が、これらの特徴、要素及び/又は状態が何れかの特定の実施形態に含まれるか又は実行されるかどうかを、作成者入力又は指示の有無に関わらず、決定するための論理を必然的に含むことを意味するものではない。「comprising(含む)」、「including(含む)」、「having(有する)」などの語は同義語であり、包括的に、オープンエンド方式で使用され、追加の要素、特徴、動作、作動などを除外するものではない。「or」という語は、例えば要素のリストをつなぐために使用されたときに、リストの中の要素の1つ、幾つか、又は全部を意味するように包括的な意味で(及び排他的な意味ではなく)使用される。本明細書で使用する「各々」という語は、その元々の意味を持つことに加えて、「各」という語が付けられる要素のセットの何れのサブセットも意味することができる。
【0090】
「X、Y及びZの少なくとも1つ」という句のような離接語は、他に具体的に指示がない限り、項目、語などが、X、Y、又はZ、又はこれらの組み合わせの何れかであることを伝えるために一般的に使用される文脈によって理解すべきである。従って、このような接続語は、一般的には、特定の実施形態が、Xの少なくとも1つ、Yの少なくとも1つ及びZの少なくとも1つが各々存在することを要求することを意味するようには意図されない。
【0091】
他に明示的に指示されない限り、「a」又は「an」などの冠詞は、一般的には1又は2以上の記述された項目を含むと解釈すべきである。従って、「ように構成されたデバイス」などの句は、1又は2以上の列挙されたデバイスを含むことを意図する。このような1又は2以上の列挙されたデバイスは、表示された列挙を実行するようまとめて構成することもできる。例えば、「列挙A、B及びCを実行するよう構成されたプロセッサ」は、列挙B及びCを実行するよう構成された第2プロセッサと共に作用する列挙Aを実行するよう構成された第1プロセッサを含むことができる。
【0092】
上記の詳細な説明は、様々な実施形態に適用される新しい特徴を図示、説明、及び指摘してきたが、図示したデバイス又はアルゴリズムの形態及び詳細における様々な省略、置換、及び変更は、本開示の精神から逸脱することなく行い得ることが理解されるであろう。理解されるように、本明細書で説明した本発明の特定の実施形態は、一部の特徴を他の特徴とは別に使用又は実施できる場合に、本明細書に示した特徴及び利点の全てを提供しない形式で実施することができる。
【符号の説明】
【0093】
100 部屋環境
102 TV
104 サブウーファ
106 左サラウンド
108 右サラウンド
109 推奨される位置
110 サウンドバー
112 スピーカアレイ
114 マイクロフォンアレイ
116 位置推定エンジン
120 リスナー
122 カウチ
130 推奨される配置円