IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-02-28
(54)【発明の名称】オーディオデバイス自動場所選定
(51)【国際特許分類】
   H04S 7/00 20060101AFI20230220BHJP
   G10K 15/00 20060101ALI20230220BHJP
【FI】
H04S7/00 320
G10K15/00 L
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022537580
(86)(22)【出願日】2020-12-17
(85)【翻訳文提出日】2022-08-12
(86)【国際出願番号】 US2020065769
(87)【国際公開番号】W WO2021127286
(87)【国際公開日】2021-06-24
(31)【優先権主張番号】19217580.0
(32)【優先日】2019-12-18
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】62/949,998
(32)【優先日】2019-12-18
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/992,068
(32)【優先日】2020-03-19
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】トーマス,マーク アール. ピー.
(72)【発明者】
【氏名】ディキンズ,グレン
(72)【発明者】
【氏名】ゼーフェルト,アラン
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA13
5D162CC12
5D162CC18
5D162DA02
5D162DA04
5D162DA06
5D162DA51
5D162EG04
(57)【要約】
環境内のオーディオデバイス場所を推定する方法は、環境内の複数のオーディオデバイスのうちの各オーディオデバイスについての到着方向(DOA)データを取得することと、DOAデータに基づいて複数の三角形のうちの各三角形についての内角を決定することとを含んでよい。各三角形は、オーディオデバイス場所と対応する頂点を有してよい。本方法は、各三角形の各辺について辺の長さを決定することと、複数の三角形の各三角形を整列させる順方向アライメントプロセスを実行して順方向アライメント行列を生成することと、逆のシーケンスにおいて複数の三角形の各三角形を整列させる逆方向アライメントプロセスを実行して逆方向アライメント行列を生成することとを含んでよい。各オーディオデバイス場所の最終的な推定値は、順方向アライメント行列の値および逆方向アライメント行列の値に少なくとも部分的に基づいてよい。
【特許請求の範囲】
【請求項1】
環境内の少なくとも4つの複数のオーディオデバイスの場所を決定する方法であって、各オーディオデバイスは、前記複数のオーディオデバイスのうちの異なるオーディオデバイスによって生成される信号を検出するように構成され、当該方法は、
前記環境内の前記複数のオーディオデバイスのうちの別のオーディオデバイスによって生成される前記信号の検出される方向に基づいて到着方向データを取得することと、
前記到着方向データに基づいて複数の三角形の各三角形の内角を決定することであって、前記複数の三角形の各三角形は、前記複数のオーディオデバイスのうちの3つのオーディオデバイスの場所と対応する頂点を有する、決定することと、
前記内角に基づいて並びに決定されるべき辺の長さによって分離される前記オーディオデバイスによって生成される前記信号に基づいて、前記三角形の各三角形の各辺について辺の長さを決定すること、または
前記内角に基づいて前記辺の長さを決定することであって、前記三角形のうちの1つの三角形の1つの辺の長さは、所定の値に設定される、決定することと、
第1のシーケンスにおいて前記複数の三角形の各三角形を整列させる順方向アライメントプロセスを実行して順方向アライメント行列を生成することであって、前記順方向アライメントプロセスは、各三角形の辺の長さを隣接する三角形の辺の長さと一致させることおよび前記隣接する三角形について決定される前記内角を用いることによって実行される、生成することと、
前記複数の三角形の各三角形を整列させる逆方向アライメントプロセスを実行して逆方向アライメント行列を生成することであって、前記逆方向アライメントプロセスは、前記順方向アライメントプロセスとして事項されるが、前記第1のシーケンスの逆である第2のシーケンスにおいて実行される、生成することと、
前記順方向アライメント行列の値および前記逆方向アライメント行列の値に少なくとも部分的に基づいて、各オーディオデバイス場所の最終的な推定値を生成することと、を含む、
方法。
【請求項2】
各オーディオデバイス場所の前記最終的な推定値を生成することは、
前記順方向アライメント行列を並進およびスケーリングして、並進およびスケーリングされた順方向アライメント行列を生成することと、
前記逆方向アライメント行列を並進およびスケーリングして、並進およびスケーリングされた逆方向アライメント行列を生成することと、を含み、
前記順方向アライメント行列および前記逆方向アライメント行列を並進およびスケーリングすることは、それぞれの行列の質量中心を原点まで移動させることと、各行列のフロベニウスノルムをゼロにさせることと、を含む、
請求項1に記載の方法。
【請求項3】
各オーディオデバイス場所の前記最終的な推定値を生成することは、前記並進およびスケーリングされた順方向アライメント行列ならびに前記並進およびスケーリングされた逆方向アライメント行列に基づいて更なる行列を生成することを更に含み、該更なる行列は、各オーディオデバイスについての複数の推定されたオーディオデバイス場所を含む、請求項2に記載の方法。
【請求項4】
前記更なる行列を生成することは、前記並進およびスケーリングされた順方向アライメント行列ならびに前記並進およびスケーリングされた逆方向アライメント行列に対して特異値分解を実行することを含む、請求項3に記載の方法。
【請求項5】
各オーディオデバイス場所の前記最終的な推定値を生成することは、複数の三角形の頂点をオーバーラップさせることから得られる前記オーディオデバイスの前記場所の複数の推定値を平均化することを更に含む、請求項1~4のうちのいずれか1項に記載の方法。
【請求項6】
前記辺の長さを決定することは、
三角形の第1の辺の第1の長さを決定することと、
前記三角形の前記内角に基づいて前記三角形の第2の辺の長さおよび第3の辺の長さを決定することと、を含み、
前記第1の長さを決定することは、前記第1の長さを所定の値に設定することを含み、或いは、前記第1の長さを決定することは、到着時間データまたは受信する信号強度データのうちの少なくとも1つに基づく、
請求項1~5のうちのいずれか1項に記載の方法。
【請求項7】
各オーディオデバイスは、複数のオーディオデバイスマイクロホンを含み、前記到着方向データを決定することは、前記複数のオーディオデバイスの単一のオーディオデバイスに対応する複数のオーディオデバイスマイクロホンの各マイクロホンからマイクロホンデータを受信することと、前記マイクロホンデータに少なくとも部分的に基づいて前記単一のオーディオデバイスについての前記到着方向データを決定することとを含む、
請求項1~6のうちのいずれか1項に記載の方法。
【請求項8】
各オーディオデバイスは、1つ以上のアンテナを含み、前記到着方向データを決定することは、前記複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する1つ以上のアンテナからアンテナデータを受信することと、前記アンテナデータに少なくとも部分的に基づいて前記単一のオーディオデバイスについての前記到着方向データを決定することと、を含む、請求項1~6のうちのいずれか1項に記載の方法。
【請求項9】
少なくとも1つのオーディオデバイス場所の前記最終的な推定値に少なくとも部分的に基づいて前記オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することを更に含む、請求項1~8のうちのいずれか1項に記載の方法。
【請求項10】
前記複数のオーディオデバイスの各オーディオデバイスは、ラウドスピーカを含み、前記オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することは、前記オーディオデバイスのうちの少なくとも1つのオーディオデバイスに基づいてラウドスピーカを制御することを含む、請求項9に記載の方法。
【請求項11】
請求項1~10のうちのいずれか1項に記載の方法を実行するように構成される装置。
【請求項12】
命令を含むコンピュータプログラムであって、前記命令は、前記コンピュータプログラムがコンピュータによって実行されるときに、前記コンピュータに請求項1~10のうちのいずれか1項に記載の方法を実行させる、コンピュータプログラム。
【請求項13】
請求項12に記載のコンピュータプログラムを含む、コンピュータ読取可能媒体。
【請求項14】
複数のオーディオデバイスのうちのオーディオデバイスを構成する方法であって、
前記複数のオーディオデバイスの各オーディオデバイスは、前記複数のオーディオデバイスのうちの同じオーディオデバイスまたは異なるオーディオデバイスによって生成される信号を検出する1つ以上のセンサを含み、当該方法は、
制御システムを介して、環境内の複数のオーディオデバイスの各オーディオデバイスについてのオーディオデバイスの到着方向データを取得することと、
前記制御システムを介して、前記到着方向データに少なくとも部分的に基づいてオーディオデバイス場所データを生成することであって、該オーディオデバイス場所データは、各オーディオデバイスについてのオーディオデバイス場所の推定値を含む、生成することと、
前記制御システムを介して、前記環境内の視聴者場所を示す視聴者場所データを決定することと、
前記制御システムを介して、視聴者角度向きを示す視聴者角度向きデータを決定することと、
前記制御システムを介して、前記視聴者場所および前記視聴者角度向きに対する各オーディオデバイスについてのオーディオデバイス角度向きを示すオーディオデバイス角度向きデータを決定することと、を含む、
方法。
【請求項15】
対応するオーディオデバイス場所、対応するオーディオデバイス角度向き、前記視聴者場所データおよび前記視聴者角度向きに少なくとも部分的に基づいて、前記オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することを更に含む、請求項14に記載の方法。
【請求項16】
前記オーディオデバイス場所データ、前記オーディオデバイス角度向きデータ、前記視聴者場所データおよび前記視聴者角度向きデータを、オーディオレンダリングシステムに提供することを更に含む、請求項14または15に記載の方法。
【請求項17】
前記オーディオデバイス場所データ、前記オーディオデバイス角度向き、前記視聴者場所データおよび前記視聴者角度向きデータに少なくとも部分的に基づいて、オーディオデータレンダリングプロセスを制御することを更に含む、請求項14~16のうちのいずれか1項に記載の方法。
【請求項18】
各オーディオデバイスは、ラウドスピーカを含み、前記到着方向データを取得することは、前記環境内の複数のラウドスピーカの各ラウドスピーカを制御して試験信号を再生することを含む、請求項14~17のうちのいずれか1項に記載の方法。
【請求項19】
前記視聴者場所データおよび前記視聴者角度向きデータのうちの少なくとも1つは、前記視聴者の1つ以上の発話に対応する前記到着方向データに基づく、請求項14~18のうちのいずれか1項に記載の方法。
【請求項20】
前記視聴者角度向きは、視聴者視認方向に対応する、請求項14~19のうちのいずれか1項に記載の方法。
【請求項21】
前記視聴者視認方向は、視聴者場所とテレビ場所とに従って決定される、請求項20に記載の方法。
【請求項22】
前記視聴者視認方向は、前記視聴者場所とテレビサウンドバー場所とに従って決定される、請求項20に記載の方法。
【請求項23】
前記視聴者視認方向は、視聴者入力に従って決定される、請求項20に記載の方法。
【請求項24】
前記視聴者入力は、前記視聴者によって保持されるデバイスから受信される慣性センサデータを含む、請求項20に記載の方法。
【請求項25】
前記慣性センサデータは、音を出しているラウドスピーカに対応する慣性センサデータを含む、請求項24に記載の方法。
【請求項26】
前記視聴者入力は、前記視聴者によって選択されるオーディオデバイスの表示を含む、請求項23に記載の方法。
【請求項27】
ラウドスピーカ音響能力データをレンダリングシステムに提供することを更に含み、前記ラウドスピーカ音響能力データは、1つ以上のドライバの向き、複数のドライバ、または1つ以上のドライバのドライバ周波数応答のうちの少なくとも1つを示す、請求項14~26のうちのいずれか1項に記載の方法。
【請求項28】
前記オーディオデバイス場所を生成することは、請求項1~10のうちのいずれか1項に記載の方法に従って実行される、請求項14~26のうちのいずれか1項に記載の方法。
【請求項29】
請求項14~28のうちのいずれか1項に記載の方法を実行するように構成される装置。
【請求項30】
命令を含むコンピュータプログラムであって、前記命令は、コンピュータによって実行されるときに、該コンピュータに請求項14~28のうちのいずれか1項に記載の方法を実行させる、コンピュータプログラム。
【請求項31】
請求項30に記載のコンピュータプログラムを含む、コンピュータ読取可能媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の参照)
この出願は、参照により本明細書に援用する2019年12月18日に出願された米国仮特許出願第62/949,998号、2019年12月18日に出願された欧州特許出願第19217580.0号、および2020年3月19日に出願された米国仮特許出願第62/992,068号に対する優先権を主張する。
【0002】
この開示は、オーディオデバイスを自動的に場所特定する(locating)ためのシステムおよび方法に関する。
【背景技術】
【0003】
スマートオーディオデバイス(smart audio devices)を含むが、これに限定されない、オーディオデバイスは、広く配置されており、多くの家庭の一般的な機能となっている。オーディオデバイスを場所特定するための既存のシステムおよび方法は利益をもたらすが、改良されたシステムおよび方法が望ましい。
【発明の概要】
【0004】
本明細書では、「スマートオーディオデバイス」という表現を用いて、単一目的オーディオデバイスまたは仮想アシスタント(例えば、接続された仮想アシスタント)のいずれかであるスマートデバイスを示す。単一目的オーディオデバイスは、少なくとも1つのマイクロホンを含むか或いは少なくとも1つのマイクロホンに結合されるデバイス(例えば、スマートスピーカ、テレビジョン(TV)または携帯電話)であり、(幾つかの例において、それは少なくとも1つのスピーカを含むか或いは少なくとも1つのマイクロホンに結合されることもあり)、それは概ねまたは主として単一目的を達成するように設計されている。TVは、典型的には、番組素材からオーディオを再生することができる(或いは再生することができると考えられている)が、殆どの場合、現代のTVは、テレビを視聴するアプリケーションを含むアプリケーションがローカルに動作する何らかのオペレーティングシステムを実行する。同様に、携帯電話におけるオーディオ入力および出力は、多くのことをすることがあるが、これらは電話上で動作するアプリケーションによってサービス提供される。この意味において、スピーカおよびマイクロホンを有する単一目的オーディオデバイスは、しばしば、スピーカおよびマイクロホンを直接的に使用するためのローカルアプリケーションおよび/またはサービスを実行するように構成される。幾つかの単一目的オーディオデバイスは、ゾーンまたはユーザ設定エリアでオーディオの再生を達成するために、互いにグループ化するように設定されることがある。
【0005】
本明細書において、「仮想アシスタント」(例えば、接続された仮想アシスタント)は、少なくとも1つのマイクロホンを含むか或いは少なくとも1つのマイクロホンに結合される(任意的に少なくとも1つのスピーカを含むか或いは少なくとも1つのスピーカに結合される)デバイス(例えば、スマートスピーカ、スマートディスプレイまたは音声(voice)アシスタント統合デバイス)であり、それはある意味においてクラウド対応であるか或いはその他の方法で仮想アシスタント自体内または上で実装されていないアプリケーションのための(仮想アシスタントとは別個の)複数のデバイスを利用する能力を提供することがある。仮想アシスタントは、時折、例えば、非常に離散的且つ条件付きで定義された方法で、協働することがある。例えば、2つ以上の仮想アシスタントは、それらのうちの1つ、すなわち、ウエークワード(wakeword)を聞いたことに最も自信がある仮想アシスタントが、そのワードに応答するという意味で、協働することがある。接続されたデバイスは、一種の集団(constellation)を形成することがあり、それは仮想アシスタントである(或いは仮想アシスタントを含むか或いは実装する)ことがある1つのメインアプリケーションによって管理されることがある。
【0006】
本明細書において、「ウエークワード」とは、広義には、任意のサウンド(音)(sound)(例えば、人間によって発声された単語(word)、または何らかの他の音)を示すために使用され、スマートオーディオデバイスは、(スマートオーディオデバイスに含まれるか或いは結合される少なくとも1つのマイクロホン、または少なくとも1つの他のマイクロホンを使用して)その音(を聞くこと)の検出に応答して、覚醒する(awake)ように構成される。この文脈において、「覚醒する」とは、デバイスがサウンドコマンドを待つ(すなわち、聞いている)状態に入ることを意味する。
【0007】
本明細書において、「ウエークワード検出器」という表現は、リアルタイムサウンド(例えば、発話(speech))機構と訓練されたモデルとの間の整列のために連続的に探索するように構成されたデバイス(またはデバイスを構成するための命令を含むソフトウェア)を意味する。典型的には、ウエークワードが検出された確率が所定の閾値を超えることがウエークワード検出器によって決定されるときにはいつでも、ウエークワードイベントがトリガされる。例えば、閾値は、誤り受理(false acceptance)と誤り拒絶(false rejection)との間の良好な妥協を与えるように調整される所定の閾値であってよい。ウエークワードイベントに続いて、デバイスは、デバイスがコマンドを聞き、受け取ったコマンドをより大きな、より計算集約的な認識器に渡す(「覚醒された」状態または「注意(attentiveness)」の状態と呼ぶことがある)状態に入ることがある。
【0008】
特許請求の範囲を含むこの開示を通じて、「スピーカ」および「ラウドスピーカ」は、単一のスピーカフィード(speaker feed)によって駆動される任意のサウンド放射トランスデューサ(またはトランスデューサのセット)を示すよう同義的に使用される。ヘッドフォンの典型的なセットは、2つのスピーカを含む。スピーカは、全てが単一の共通スピーカフィードによって駆動される複数のトランスデューサ(例えば、ウーファおよびツイータ)を含むように実装されてよい。スピーカフィードは、幾つかの例において、異なるトランスデューサに結合された異なる回路構成分岐において異なる処理を受けることがある。
【0009】
特許請求の範囲を含むこの開示を通じて、信号またはデータを「オン」にする操作を実行する表現(例えば、信号またはデータをフィルタリングすること(filtering)、スケーリングすること(scaling)、変換すること(transforming)、或いは信号またはデータに利得を適用すること(applying))は、広義には、信号またはデータに対して或いは処理されたバージョンの信号またはデータに対して(例えば、操作の実行前に予備的なフィルタリングまたは前処理を受けた信号のバージョンに対して)直接的に操作を実行することを示すために使用される。
【0010】
特許請求の範囲を含むこの開示を通じて、「システム」という表現は、広義には、デバイス、システム、またはサブシステムを示すために使用される。例えば、復号器(デコーダ)を実装するサブシステムを復号器システムと呼ぶことがあり、そのようなサブシステムを含むシステム(例えば、複数の入力に応答してX出力信号を生成するシステムであって、サブシステムはMの入力を生成し、他のX-M入力が外部ソースから受信されるシステム)を復号器システムと呼ぶこともある。
【0011】
特許請求の範囲を含むこの開示を通じて、「プロセッサ」という用語は、広義には、データ(例えば、オーディオ、ビデオまたは他の画像データ)に対して操作を実行するために、(例えば、ソフトウェアまたはファームウェアを用いて)プログラム可能または他の方法で構成能なシステムまたはデバイスを示すために使用される。プロセッサの例は、フィールドプログラマブルゲートアレイ(または他の構成可能な集積回路またはチップセット)、オーディオまたは他のサウンドデータに対してパイプライン処理を行うようにプログラムされたおよび/または他の方法で構成されたデジタル信号プロセッサ、プログラム可能な汎用プロセッサまたはコンピュータ、およびプログラム可能なマイクロプロセッサチップまたはチップセットを含む。
【0012】
本開示の少なくとも幾つかの態様は、方法を介して実装されてよい。幾つかのそのような方法は、オーディオデバイス場所、すなわち、環境内の複数の(例えば、少なくとも4つ以上の)オーディオデバイスの場所を決定する方法を含んでよい。例えば、幾つかの方法は、複数のオーディオデバイスのうちの各オーディオデバイスについての到着方向(DOA:direction of arrival)データを取得することと、DOAデータに基づいて複数の三角形の各三角形についての内角を決定することとを含んでよい。幾つかの例において、複数の三角形のうちの各三角形は、オーディオデバイスのうちの3つのオーディオデバイスの場所と対応する頂点を有してよい。幾つかのそのような方法は、少なくとも部分的に内角に基づいて三角形の各三角形の各辺の辺の長さを決定することを含んでよい。
【0013】
幾つかのそのような方法は、第1のシークエンスにおいて複数の三角形のうちの各三角形を整列させる順方向アライメントプロセスを実行して、順方向アライメント行列を生成することを含んでよい。幾つかのそのような方法は、第1のシーケンスの逆である第2のシーケンスにおいて複数の三角形のうちの各三角形を整列させる逆方向アライメントプロセスを実行して、逆方向アライメント行列を生成することを含んでよい。幾つかのそのような方法は、順方向アライメント行列の値および逆方向アライメント行列の値に少なくとも部分的に基づいて、各オーディオデバイス場所の最終的な推定値を生成することを含んでよい。
【0014】
幾つかの例によれば、各オーディオデバイス場所の最終的な推定値を生成することは、順方向アライメント行列を並進(平行移動)およびスケーリングして、並進およびスケーリングされた順方向アライメント行列を生成することと、逆方向アライメント行列を並進およびスケーリングして、並進およびスケーリングされた逆方向アライメント行列を生成することとを含んでよい。幾つかのそのような方法は、並進およびスケーリングされた順方向アライメント行列ならびに並進およびスケーリングされた逆方向アライメント行列に基づいて回転行列を生成することを含んでよい。回転行列は、各オーディオデバイスについて複数の推定されるオーディオデバイス場所を含むことがある。幾つかの実装において、回転行列を生成することは、並進およびスケーリングされた順方向アライメント行列ならびに並進およびスケーリングされた逆方向アライメント行列に対して特異値分解を実行することを含んでよい。幾つかの例によれば、各オーディオデバイス場所の最終的な推定値を作成することは、各オーディオデバイスについて推定されるオーディオデバイス場所を平均化して、各オーディオデバイス場所の最終的な推定値を作成することを含んでよい。
【0015】
幾つかの実装において、辺の長さを決定することは、三角形の第1の辺の第1の長さを決定することと、三角形の内角に基づいて三角形の第2の辺の長さおよび第3の辺の長さを決定することを含んでよい。第1の長さを決定することは、幾つかの例において、第1の長さを所定の値に設定することを含んでよい。第1の長さを決定することは、幾つかの例において、到着時間データおよび/または受信される信号強度データに基づいてよい。
【0016】
幾つかの例によれば、DOAデータを取得することは、複数のオーディオデバイスのうちの少なくとも1つのオーディオデバイスについてのDOAデータを決定することを含んでよい。幾つかの例において、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する複数のオーディオデバイスマイクロホンのうちの各マイクロホンからマイクロホンデータを受信することと、少なくとも部分的にマイクロホンデータに基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含んでよい。幾つかの例によれば、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する1つ以上のアンテナからアンテナデータを受信することと、アンテナデータに少なくとも部分的に基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含んでよい。
【0017】
幾つかの実装において、本方法は、少なくとも1つのオーディオデバイス場所の最終的な推定値に少なくとも部分的に基づいて、オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することを含んでもよい。幾つかのそのような幾つかの例において、オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することは、オーディオデバイスのうちの少なくとも1つのオーディオデバイスのラウドスピーカを制御することを含んでよい。
【0018】
本明細書に記載する動作、機能および/または方法の一部または全部は、1つ以上の非一時的媒体に格納された命令(例えば、ソフトウェア)に従って1つ以上のデバイスによって実行されてよい。そのような非一時的媒体は、ランダムアクセスメモリ(RAM)デバイス、読出し専用メモリ(ROM)デバイスなどを含むが、これらに限定されない、本明細書に記載するもののようなメモリデバイスを含んでよい。従って、この開示に記載する主題のうちの幾つかの革新的な態様は、その上に格納されたソフトウェアを有する非一時的媒体内に実装されることができる。
【0019】
例えば、ソフトウェアは、1つ以上のデバイスを制御して、オーディオデバイス場所を含む方法を実行するための命令を含んでよい。幾つかの方法は、複数のオーディオデバイスのうちの各オーディオデバイスについてDOAデータを取得することと、DOAデータに基づいて複数の三角形のうちの各三角形についての内角を決定することとを含んでよい。幾つかの例において、複数の三角形のうちの各三角形は、オーディオデバイスのうちの3つのオーディオデバイスのオーディオデバイス場所にと応する頂点を有してよい。幾つかのそのような方法は、少なくとも部分的に内角に基づいて、三角形のうちの各三角形の各辺の辺の長さを決定することを含んでよい。
【0020】
幾つかのそのような方法は、第1のシークエンスにおいて複数の三角形のうちの各三角形を整列させる順方向アライメントプロセスを実行して、順方向アライメント行列を生成することを含んでよい。幾つかのそのような方法は、第1のシーケンスの逆である第2のシーケンスにおいて複数の三角形のうちの各三角形を整列させる逆方向アライメントプロセスを実行して、逆方向アライメント行列を生成することを含んでよい。幾つかのそのような方法は、順方向アライメント行列の値および逆方向アライメント行列の値に少なくとも部分的に基づいて、各オーディオデバイス場所の最終的な推定値を生成することを含んでよい。
【0021】
幾つかの例によれば、各オーディオデバイス場所の最終的な推定値を生成することは、順方向アライメント行列を並進(平行移動)およびスケーリングして、並進およびスケーリングされた順方向アライメント行列を生成することと、逆方向アライメント行列を並進およびスケーリングして、並進およびスケーリングされた逆方向アライメント行列を生成することとを含んでよい。幾つかのそのような方法は、並進およびスケーリングされた前方アライメント行列ならびに並進およびスケーリングされた逆アライメント行列に基づいて回転行列を生成することを含んでよい。回転行列は、各オーディオデバイスについての複数の推定されるオーディオデバイス場所を含んでよい。幾つかの実装において、回転行列を生成することは、並進およびスケーリングされた順方向アライメント行列ならびに並進およびスケーリングされた逆方向アライメント行列に対して特異値分解を実行することを含んでよい。幾つかの例によれば、各オーディオデバイス場所の最終的な推定値を作成することは、各オーディオデバイスについて推定されたオーディオデバイス場所を平均化して、各オーディオデバイス場所の最終的な推定値を作成することを含んでよい。
【0022】
幾つかの実装において、辺の長を決定することは、三角形の第1の辺の第1の長さを決定することと、三角形の内角に基づいて三角形の第2の辺の長さおよび第3の辺の長さを決定することを含んでよい。第1の長さを決定することは、幾つかの例において、第1の長さを所定の値に設定することを含んでよい。第1の長さを決定することは、幾つかの例において、到着時間データおよび/または受信される信号強度データに基づいてよい。
【0023】
幾つかの例によれば、DOAデータを取得することは、複数のオーディオデバイスのうちの少なくとも1つのオーディオデバイスについてのDOAデータを決定することを含んでよい。幾つかの例において、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する複数のオーディオデバイスマイクロホンのうちの各マイクロホンからマイクロホンデータを受信することと、少なくとも部分的にマイクロホンデータに基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含んでよい。幾つかの例によれば、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する1つ以上のアンテナからアンテナデータを受信することと、アンテナデータに少なくとも部分的に基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含んでよい。
【0024】
幾つかの実装において、本方法は、少なくとも1つのオーディオデバイス場所の最終的な推定値に少なくとも部分的に基づいて、オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することを含んでよい。幾つかのそのような例において、オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することは、オーディオデバイスのうちの少なくとも1つのオーディオデバイスのラウドスピーカを制御することを含んでよい。
【0025】
本開示の少なくとも幾つかの態様は、装置を介して実装されてよい。例えば、1つ以上のデバイスは、少なくとも部分的に、本明細書に開示する方法を実行することができてよい。幾つかの実装では、装置が、インターフェースシステムと、制御システムとを含んでよい。制御システムは、1つ以上の汎用単一チップまたはマルチチッププロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のプログラマブル論理デバイス、離散ゲートまたはトランジスタ論理、離散ハードウェアコンポーネント、またはそれらの組み合わせを含んでよい。幾つかの例において、装置は、上述のオーディオデバイスのうちの1つであってよい。しかしながら、幾つかの実装において、装置は、モバイルデバイス、ラップトップ、サーバなどのような、別のタイプのデバイスであってよい。
【0026】
本開示の幾つかの態様において、記載の方法のいずれかは、命令を含むコンピュータプログラム(コンピュータプログラム製品)において実装されてよく、命令は、プログラムがコンピュータによって実行されるときに、コンピュータに本開示に記載する方法のうちのいずれかまたは方法のステップを実行させる。
【0027】
本開示の幾つかの態様では、コンピュータプログラム製品を含むコンピュータ読取可能媒体が記載される。
【0028】
本明細書に記載する主題の1つ以上の実装の詳細は、添付の図面および以下の記述に記載される。他の構成、態様、および利点は、明細書、図面、および特許請求の範囲から明らかになるであろう。以下の図の相対的な寸法は、縮尺通りに描かれない場合があることに留意されたい。
【図面の簡単な説明】
【0029】
図1】環境内の3つのオーディオデバイス間の幾何学的関係の例を示している。
図2図1に示す環境における3つのオーディオデバイス間の幾何学的関係の別の例を示している。
図3A】対応するオーディオデバイスおよび環境の他の構成を伴わない、図1および図2に示す両方の三角形を示している。
図3B】3つのオーディオデバイスによって形成された三角形の内角を推定する例を示している。
図4図11に示すような装置によって実行されることがある方法の一例を概説するフロー図である。
図5】環境内の各オーディオデバイスが複数の三角形の頂点である例を示している。
図6】順方向アライメントプロセスの一部分の例を提供している。
図7】順方向アライメントプロセス中に発生したオーディオデバイス場所の複数の推定値の例を示している。
図8】逆方向アライメントプロセスの一部分の例を提供している。
図9】逆方向アライメントプロセス中に発生したオーディオデバイス場所の複数の推定値の例を示している。
図10】推定されたオーディオデバイス場所および実際のオーディオデバイス場所の比較を示している。
図11】この開示の様々な態様を実装することができる装置のコンポーネントの例を示すブロック図である。
図12図11に示すような装置によって実行されることがある方法の一例を概説するフロー図である。
図13A図12の幾つかのブロックの例を示している。
図13B】視聴者角度向きデータを決定する追加的な例を示している。
図13C】視聴者角度向きデータを決定する追加的な例を示している。
図13D図13Cを参照して記載した方法に従ったオーディオデバイス座標のための適切な回転を決定する一例を示している。
図14】これらの特定のスピーカ位置についての式11の最適解を含むスピーカアクティブ化を示している。
図15】スピーカアクティブ化が図14に示されている個々のスピーカ位置をプロットしている。
【発明を実施するための形態】
【0030】
様々な図面における同等の参照番号および呼称(designations)は、同等の要素を示している。
【0031】
テレビとサウンドバーとを含む既存のオーディオデバイス、ならびに電球およびマイクロ波のような新しいマイクロホンおよびラウドスピーカ対応の接続されたデバイスに加えて、複数の駆動ユニットおよびマイクロホンアレイを組み込んだスマートスピーカの出現は、オーケストレーション(orchestration)を達成するために数十のマイクロホンおよびラウドスピーカを互いに対して位置付ける必要があるという問題を引き起こしている。オーディオデバイスは、(離散的なドルビー5.1ラウドスピーカレイアウトのような)標準的なレイアウトにあるとはみなさることはできない。幾つかの場合には、環境内のオーディオデバイスは、無作為に配置されてもよく、或いは少なくとも不規則および/または非対称的な方法で環境内に分散されてよい。
【0032】
更に、オーディオデバイスが異種(heterogeneous)または同期(synchronous)であると想定されることはできない。本明細書で使用するとき、サウンドが同じサンプルクロックまたは同期されたサンプルクロックに従ってオーディオデバイスによって検出または放射されるならば、オーディオデバイスを「同期」または「同期されている」と呼ぶことがある。例えば、ある環境内の第1のオーディオデバイスの第1の同期されたマイクロホンは、第1のサンプルクロックに従ってオーディオデータをデジタル的にサンプリングすることがあり、その環境内の第2の同期されたオーディオデバイスの第2のマイクロホンは、第1のサンプルクロックに従ってオーディオデータをデジタル的にサンプリングすることがある。代替的にまたは追加的に、ある環境内の第1のオーディオデバイスの第1の同期されたスピーカは、あるスピーカセットアップクロックに従ってサウンドを放射することがあり、その環境内の第2のオーディオデバイスの第2の同期されたスピーカは、そのスピーカセットアップクロックに従ってサウンドを放射することがある。
【0033】
自動スピーカ場所選定(location)のための幾つかの十全に開示された方法は、同期されたマイクロホンおよび/またはスピーカを必要とする。例えば、デバイス場所特定(localization)のための幾つかの従前のツールは、システム内の全てのマイクロホン間のサンプル同期性(synchrony)に依存して、既知の試験刺激を必要とし、センサ間で全帯域幅オーディオデータを通過させる。
【0034】
本譲受人は、シネマおよび家庭のための幾つかのスピーカ場所特定技術を生成し、スピーカ場所特定技術は、それらが設計されたユースケースにおける優れた解決策である。幾つかのそのような方法は、各ラウドスピーカとほぼ同じ場所にあるマイクロホンと音源との間のインパルス応答(impulse response)から導き出される飛行時間(time-of-flight)に基づく。記録(record)および再生(playback)チェーン内のシステム待ち時間を推定することもあるが、インパルス応答を推定するための既知の試験刺激の必要性と共に、クロック間のサンプル同期性が必要とされる。
【0035】
この文脈におけるソース場所特定の最近の例は、デバイス内マイクロホン同期性を必要とするが、デバイス間同期性を必要としないことによって、制約を緩和している。加えて、幾つかのそのような方法は、直接(反射されない)サウンドの到着時間(TOA:time of arrival)の検出を介する或いは直接サウンドの支配的な到着方向(DOA:direction of arrival)の検出を介するような低帯域幅メッセージ通過によって、センサ間でサウンドを通過させる必要性を放棄する。各アプローチは、幾つかの潜在的な利点および潜在的な欠点を有する。例えば、TOA法は、未知の並進(平行移動)(translation)、回転、および3つの軸のうちの1つの軸についての反射までのデバイス幾何学的形状(geometry)を決定することができる。デバイスト毎に1つだけのマイクロホンがあるならば、個々のデバイスの回転も未知である。DOA法は、未知の並進(平行移動)、回転、およびスケールまでのデバイス幾何学を決定することができる。幾つかのそのような方法は、理想的な条件の下で満足な結果をもたらすが、測定誤差に対するそのような方法の堅牢性(ロバスト性)は実証されていない。
【0036】
本開示の幾つかの実装は、各デバイス内のマイクロホンアレイによって観測される制御されていない音源からの非同期DOA推定値を使用する幾何学的ベースの最適化を適用することによって、ある環境内(例えば、部屋内)の複数のオーディオデバイスの位置を自動的に場所選定する(locate)。様々な開示されたオーディオデバイス場所選定アプローチは、大きなDOA推定誤差に対して堅牢(ロバスト)であることが証明されている。
【0037】
幾つかのそのような実装は、DOAデータのセットから導き出される三角形を反復的に整列させることを含む。幾つかのそのような例において、各オーディオデバイスは、制御されていないソースからDOAを推定するマイクロホンアレイを含むことがある。幾つかの実装において、マイクロホンアレイは、少なくとも1つのラウドスピーカと同一場所にあることがある。しかしながら、少なくとも幾つかの開示された方法は、全てのマイクロホンアレイがラウドスピーカと同一場所にあるわけではない場合に一般化される。
【0038】
幾つかの開示された方法によれば、環境内のあらゆるオーディオデバイスからあらゆる他のオーディオデバイスへのDOAデータは集約されることがある。オーディオデバイス場所は、DOAのペアによってパラメータ化された三角形を反復的に整列させることによって推定されることがある。幾つかのそのような方法は、未知のスケールおよび回転まで正しい結果をもたらすことがある。多くの用途において、絶対スケールは不要であり、解に追加的な制約を加えることによって回転を解決することができる。例えば、幾つかのマルチスピーカ環境は、テレビジョン(TV)スピーカと、TV視聴のために位置付けられたカウチとを含むことがある。その環境内のスピーカを場所選定した後に、幾つかの方法は、TVを指すベクトルを見出すことと、三角測量によってカウチに座っているユーザの発話を場所特定することとを含むことがある。次に、幾つかのそのような方法は、TVにそのスピーカからサウンドを放射させること、および/またはユーザを促してTVまで歩かせて、三角測量によってユーザの発話を場所特定することと、を含むことがある。幾つかの実装は、環境の周囲をパンする(pan)オーディオオブジェクトをレンダリングすることを含むことがある。ユーザは、オーディオオブジェクトが、環境の前方、環境のテレビ場所などのような、環境内の1つ以上の所定の位置にあるときを示す、ユーザ入力(例えば、「停止」と言うこと)を提供してよい。幾つかのそのような例によれば、環境内でスピーカを場所特定し、それらの向きを決定した後に、ユーザは、複数のスピーカによって放射されるサウンドの到来方向の交点を見出すことによって場所特定されてよい。幾つかの実装は、少なくとも2つのオーディオデバイス間の推定される距離を決定することと、推定される距離に従って環境内の他のオーディオデバイス間の距離をスケーリングすることとを含む。
【0039】
図1は、環境内の3つのオーディオデバイス間の幾何学的関係の例を示している。この例において、環境100は、テレビ101、ソファ105、および5つのオーディオデバイス105を含む、部屋である。この例によれば、オーディオデバイス105は、環境100の場所1~5にある。この実装において、オーディオデバイス105の各々は、少なくとも3つのマイクロホンを有するマイクロホンシステム120と、少なくとも1つのスピーカを含むスピーカシステム125とを含む。幾つかの実装において、各マイクロホンシステム120は、マイクロホンのアレイを含む。幾つかの実装によれば、オーディオデバイス105の各々は、少なくとも3つのアンテナを含むアンテナシステムを含んでよい。
【0040】
本明細書に開示される他の例と同様に、図1に示される要素のタイプ(type)、数(number)、および構成(arrangement)は、単に一例として作られているにすぎない。他の実装は、異なるタイプ、数および構成の要素、例えば、より多くのまたはより少ないオーディオデバイス105、異なる場所にあるオーディオデバイス105などを有することがある。
【0041】
この例において、三角形110aは、場所1、2および3に、その頂点を有する。ここで、三角110aは、辺12、23aおよび13aを有する。この例によれば、辺12と辺23との間の角度は、θであり、辺12と辺13aとの間の角度は、θであり、辺23aと辺13aとの間の角度は、θである。これらの角度は、以下により詳細に記載されるように、DOAデータに従って決定されてよい。
【0042】
幾つかの実装では、三角形の辺の相対的な長さのみが決定されてよい。代替的な実装では、三角形の辺の実際の長さが推定されてよい。幾つかのそのような実装によれば、三角側の辺の実際の長さは、TOAデータに従って、例えば、1つの三角形の頂点に位置するオーディオデバイスによって生成され且つ別の三角形の頂点に位置するオーディオデバイスによって検出されるサウンドの到着時間に従って推定されてよい。代替的にまたは追加的に、三角形の辺の長さは、1つの三角形の頂点に位置するオーディオデバイスによって生成され且つ別の三角形の頂点に位置するオーディオデバイスによって検出される電磁波に従って推定されてよい。例えば、三角形の辺の長さは、1つの三角形の頂点に位置するオーディオデバイスによって生成され且つ別の三角形の頂点に位置するオーディオデバイスによって検出される電磁波の信号強度に従って推定されてよい。幾つかの実装において、三角形の辺の長さは、電磁波の検出される位相シフトに従って推定されてよい。
【0043】
図2は、図1に示す環境内の3つのオーディオデバイス間の幾何学的関係の別の例を示している。この例において、三角形110bは、場所1、3および4に、その頂点を有する。ここで、三角形110bは、辺13b、14、および34aを有する。この例によれば、辺13bと辺14との間の角度は、θであり、辺13bと辺34aとの間の角度は、θであり、辺34aと辺14との間の角度は、θである。
【0044】
図1図2とを比較することによって、三角形110aの辺13aの長さが、三角形110bの辺13bの長さと等しいはずであることが観察される。幾つかの実装では、1つの三角形(例えば、三角形110a)の辺の長さが正しいと仮定されてよく、隣接する三角形によって共有される辺の長さはこの長さに制約される。
【0045】
図3Aは、対応するオーディオデバイスおよび環境の他の構成を伴わない、図1および図2に示す両方の三角形を示している。図3は、三角形110aおよび110bの辺の長さおよび角度向きの推定値を示している。図3Aに示す例において、三角形110bの辺13bの長さは、三角形110aの辺13aと同じ長さに制約される。三角形110bの他の辺の長さは、結果として生じる辺13bの長さの変化に比例してスケーリング(拡大縮小)される。結果として得られた三角形110b’は、三角形110aに隣接して図3Aに示されている。
【0046】
幾つかの実装によれば、三角形110aおよび110bに隣接する他の三角形の辺の長さは、全て、環境100内の全てのオーディオデバイス場所が決定されるまで、同様の方法で決定されてよい。
【0047】
オーディオデバイス場所の幾つかの例は以下の通り続く。各オーディオデバイスは、環境内のあらゆる他のオーディオデバイスによって生成されるサウンドに基づいて、環境(例えば、部屋)内のあらゆる他のオーディオデバイスのDOAを報告してよい。i番目のオーディオデバイスのデカルト座標は、x=[x,yのように表されてよく、ここで、上付き文字Tは、ベクトル転位を示す。環境内のオーディオデバイスがMであるならば、i={1...M}である。
【0048】
図3Bは、3つのオーディオデバイスによって形成された三角形の内角を推定する例を示している。この例において、オーディオデバイスはi、jおよびkである。デバイスiから観測されるようなデバイスjから発する音源のDOAは、θjiとして表されることがある。デバイスiから観測されるようなデバイスkから発する音源のDOAは、θkiとして表わされることがある。図3Bに示す例において、θjiおよびθkiは、軸305aから測定され、それらの向きは任意であり、例えば、オーディオデバイスiの向きに対応することがある。三角形310の内角aは、a=θki-θjiとして表されることがある。内部角aの計算は軸305aの向きに依存しないことが観察されることがある。
【0049】
図3Bに示す例において、θijおよびθkjは、軸305bから測定され、それらの向きは任意であり、オーディオデバイスjの向きに対応することがある。三角形310の内角bは、b=θij-θkjとして表されることがある。同様に、θjkおよびθikは、この例では、軸305cから測定される。三角形310の内角cは、c=θjk-θikとして表されることがある。
【0050】
測定誤差が存在する場合、a+b+c≠180°である。堅牢性(ロバストネス)は、他の2つの角度から各角度を予測して、平均化することによって、例えば、以下のように改良されることができる。
【数1】
【0051】
幾つかの実装において、エッジ長(A,B,C)は、正弦則を適用することによって(スケーリング誤差まで)計算されてよい。幾つかの例において、1つのエッジ長は、1のような任意の値を割り当てられてよい。例えば、A=1を作り、頂点
(外1)
を原点に置くことによって、残りの2つの頂点の場所は、以下のように計算されてよい。
【数2】
【0052】
しかしながら、任意の回転が許容可能であることがある。
【0053】
幾つかの実装によれば、三角パラメータ化のプロセスは、サイズ
(外2)
のスーパーセットζ内に列挙される、環境内の3つのオーディオデバイスの全ての可能なサブセットについて繰り返されてよい。幾つかの例において、Tは、l番目の三角形を表すことがある。実装に依存して、三角形は、如何なる特定の順序において列挙されなくてもよい。三角形は、重なり合うことがあり、DOAおよび/または辺の長さの推定値における可能な誤差の故に、完全には整列しないことがある。
【0054】
図4は、図11に示すような装置によって実行されることがある方法の一例を概略するフロー図である。方法400のブロックは、本明細書に記載する他の方法と同様に、図示する順序で必ずしも実行されるわけではない。更に、そのような方法は、図示する且つ/或いは記載するよりも多いまたは少ないブロックを含むことがある。この実装において、方法400は、環境内のスピーカの場所を推定することを含む。方法400のブロックは、図11に示す装置1100であってもよい(或いは図11に示す装置1100を含んでよい)1つ以上のデバイスによって実行されてよい。
【0055】
この例において、ブロック405は、複数のオーディオデバイスの各オーディオデバイスについての到着方向(DOA:direction of arrival)データを取得することを含む。幾つかの例において、複数のオーディオデバイスは、図1に示す全てのオーディオデバイス105のような、環境内の全てのオーディオデバイスを含むことができる。
【0056】
しかしながら、幾つかの場合において、複数のオーディオデバイスは、環境内の全てのオーディオデバイスのサブセットのみを含むことがある。例えば、複数のオーディオデバイスは、環境内の全てのスマートスピーカを含むが、環境内の他のオーディオデバイスの1つ以上を含まないことがある。
【0057】
DOAデータは、特定の実装に依存して、様々な方法で取得されてよい。幾つかの例において、DOAデータを決定することは、複数のオーディオデバイスのうちの少なくとも1つのオーディオデバイスについてのDOAデータを決定することを含むことがある。例えば、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する複数のオーディオデバイスマイクロホンの各マイクロホンからマイクロホンデータを受信することと、少なくとも部分的にマイクロホンデータに基づいて、単一のオーディオデバイスについてのDOAデータを決定することとを含むことがある。代替的にまたは追加的に、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する1つ以上のアンテナからアンテナデータを受信することと、少なくとも部分的にアンテナデータに基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含むことがある。
【0058】
幾つかのそのような例において、単一のオーディオデバイス自体は、DOAデータを決定することがある。幾つかのそのような実装によれば、複数のオーディオデバイスの各オーディオデバイスは、それ自体のDOAデータを決定することがある。しかしながら、他の実装では、ローカルまたはリモートデバイスであることがある別のデバイスが、環境内の1つ以上のオーディオデバイスのDOAデータを決定することがある。幾つかの実装によれば、サーバが、環境内の1つ以上のオーディオデバイスについてのDOAデータを決定することがある。
【0059】
この例によれば、ブロック410は、DOAデータに基づいて複数の三角形の各三角形の内角を決定することを含む。この例において、複数の三角形の各三角形は、3つのオーディオデバイスのオーディオデバイス場所と対応する頂点を有する。幾つかのそのような例は、上述されている。
【0060】
図5は、環境内の各オーディオデバイスが複数の三角形の頂点である例を示している。各三角形の辺は、2つのオーディオデバイス105の間の距離と対応する。
【0061】
この実装において、ブロック415は、各三角形の各辺について辺の長さを決定することを含む。(本明細書では三角形の一辺を「エッジ」と呼ぶこともある)。この例によれば、辺の長さは、少なくとも部分的に内角に基づく。幾つかの場合において、辺の長さは、三角形の第1の辺の第1の長さを決定すること、および三角形の内角に基づいて三角形の第2の辺および第3の辺の長さを決定することによって、計算されてよい。幾つかのそのような例は、上述されている。
【0062】
幾つかのそのような実装によれば、第1の長さを決定することは、第1の長さを所定の値に設定することを含んでよい。次に、第2および第3の辺の長さは、三角形の内角に基づいて決定されてよい。三角形の全ての辺は、所定の値、例えば、基準値に基づいて決定されてよい。環境内のオーディオデバイス間の実際の距離(長さ)を得るために、標準化されたなスケーリングが、図4のブロック420および425を参照して以下に記載する整列プロセスから得られる幾何学的形状に適用されてよい。この標準化されたスケーリングは、整列させられた三角形が、環境に対応するサイズの境界形状、例えば、円形、多角形などに適合するように、整列させられた三角形をスケーリングすることを含んでよい。形状のサイズは、典型的な家庭環境のサイズまたは特定の実装に適する任意のサイズであってよい。しかしながら、整列された三角形をスケーリングすることは、幾何学的形状を特定の境界形状に適合させることに限定されず、特定の実装に適する任意の他のスケーリング基準が用いられてよい。
【0063】
幾つかの例において、第1の長さを決定することは、到着時間データおよび/または受信する信号強度データに基づいてよい。到着時間データおよび/または受信する信号強度データは、幾つかの実装において、環境内の第2のオーディオデバイスによって検出される環境内の第1のオーディオデバイスからの音波に対応することがある。代替的にまたは追加的に、到着時間データおよび/または受信する信号強度データは、環境内の第2のオーディオデバイスによって検出される環境内の第1のオーディオデバイスからの電磁波(例えば、電波、赤外線波など)に対応することがある。到着時間データおよび/または受信する信号強度データが入手可能でないときに、第1の強度は、上述のような所定の値に設定されてよい。
【0064】
この例によれば、ブロック420は、第1のシーケンスにおいて複数の三角形の各三角形を整列させる順方向アライメントプロセス(forward alignment process)を実行することを含む。この例によれば、順方向アライメントプロセスは、順方向アライメント行列(matrix)を生成する。
【0065】
幾つかのそのような例によれば、三角形は、例えば、図3Aに示し且つ上述したように、エッジ(x,x)が隣接するエッジに等しくなるような方法で整列することが期待される。εがサイズの全てのエッジのセットであるとすると、
(外3)
である。幾つかのそのような実装において、ブロック420は、εを通じて横断させることと、エッジを従前に整列させられたエッジと一致させることによって順方向において三角形の共通エッジを整列させることとを含んでよい。
【0066】
図6は、順方向アライメントプロセスの一部分の例を提供する。図6に太字で示す1~5の数字は、図1図2および図5に示すオーディオデバイス場所と対応する。図6に示し且つ本明細書に記載する順方向アライメントプロセスのシーケンスは、単なる例である。
【0067】
この例では、図3Aにおけるように、三角形110bの辺13bの長さは、三角形110aの辺13aの長さと一致させられる。結果として得られた三角110b’は、同じ内角が維持されて、図6に示されている。この例によれば、三角形110cの辺13cの長さも、三角形110aの辺13aの長さと一致させられる。結果として得られた三角形110c’は、同じ内角が維持されて、図6に示されている。
【0068】
次に、この例において、三角形110dの辺34bの長さは、三角形110b’の辺34aの長さと一致させられる。更に、この例において、三角形110dの辺23bの長さは、三角110aの辺23aの長さと一致させられる。結果として得られた三角110d’は、同じ内角が維持されて、図6に示されている。幾つかのそのような例によれば、図5に示す残りの三角形は、三角形110b、110cおよび110dと同じ方法で処理されてよい。
【0069】
順方向アライメントプロセスの結果は、データ構造に格納されてよい。幾つかのそのような例によれば、順方向アライメントプロセスの結果は、順方向アライメント行列に格納されてよい。例えば、順方向アライメントプロセスの結果は、行列
(外4)
に格納されてよく、ここで、Nは、三角形の総数を示す。
【0070】
DOAデータおよび/または初期的な辺の長さの決定が誤差を含むとき、オーディオデバイス場所の複数の推定値が発生する。誤差は、一般に、順方向アライメントプロセスの間に増加する。
【0071】
図7は、順方向アライメントプロセス中に発生したオーディオデバイス場所の複数の推定値の例を示している。この例において、順方向アライメントプロセスは、7つのオーディオデバイス場所を頂点として有する三角形に基づく。ここで、三角形は、DOA推定値における加法的誤差の故に完全に整列しない。図7に示す番号1~7の場所は、順方向アライメントプロセスによって生成された、推定されたオーディオデバイス場所に対応する。この例において、「1」と印されたオーディオデバイス場所推定値は一致するが、オーディオデバイス「6」および「7」についてのオーディオデバイス場所推定値は、数字6および7が位置する比較的より大きな領域によって示すように、より大きな差を示す。
【0072】
図4に戻ると、この例において、ブロック425は、第1のシーケンスの逆である第2のシーケンスにおいて複数の三角形の各三角形を整列させる逆方向アライメントプロセスを含む。幾つかの実装によれば、逆方向アライメントプロセスは、前の通りであるが、逆の順序において、εを通じて横断することを含んでよい。代替的な例において、逆方向アライメントプロセスは、正確には、順方向アライメントプロセスの動作のシーケンスの逆でないことがある。この例によれば、逆方向アライメントプロセスは、本明細書では
(外5)
のように表されることがある、逆方向アライメント行列を生成する。
【0073】
図8は、逆方向アライメントプロセスの一部分の例を提供する。図8に太字で示す番号1~5は、図1図2および図5に示すオーディオデバイス場所と対応する。図8に示し且つ本明細書に記載する逆方向アライメントプロセスのシーケンスは、単なる例である。
【0074】
図8に示す例において、三角形110eは、オーディオデバイス場所3、4および5に基づく。この実装において、三角形110eの辺の長さ(または「エッジ」)は正しいと仮定され、隣接する三角形の辺の長さはそれらと一致させられる。この例によれば、三角形110fの辺45bの長さは、三角形110eの辺45aの長さと一致させられる。内角が同じままである、結果として得られる三角形110f’が、図8に示されている。この例において、三角形110cの辺35bの長さは、三角110eの辺35aの長さと一致させられる。内角が同じままである、結果として得られる三角形110c”が、図8に示されている。幾つかのそのような例によれば、図5に示す残りの三角形は、逆方向アライメントプロセスが全ての残りの三角形を含むまで、三角形110cおよび110fと同様に処理されてよい。
【0075】
図9は、逆方向アライメントプロセス中に発生したオーディオデバイス場所の複数の推定値の例を示している。この例において、逆方向アライメントプロセスは、図7を参照して上述した7つのオーディオデバイス場所を頂点として有する三角形に基づく。図9に示す番号1~7の場所は、逆方向アライメントプロセスによって生成される、推定されるオーディオデバイス場所に対応する。ここでも、三角形は、DOA推定値における加法的誤差の故に完全には整列しない。この例において、6および7と印されるオーディオデバイス場所推定値は一致するが、オーディオデバイス1および2についてのオーディオデバイス場所推定値はより大きな差を示す。
【0076】
図4に戻ると、ブロック430は、少なくとも部分的には順方向アライメント行列の値および逆方向アライメント行列の値に基づいて、各オーディオデバイス場所の最終的な推定値を生成することを含む。幾つかの例において、各オーディオデバイス場所の最終的な推定値を生成することは、順方向アライメント行列を並進(平行移動)およびスケーリングして、並進(平行移動)およびスケーリングされた順方向アライメント行列を生成することと、逆方向アライメント行列を並進(平行移動)およびスケーリングして、並進(平行移動)およびスケーリングされた逆方向アライメント行列を生成することとを含んでよい。
【0077】
例えば、並進(平行移動)およびスケーリングは、重心を原点に移動させることおよび単位をフロベニウスノルムにすること、例えば、
(外6)
および
(外7)
によって固定される。
【0078】
幾つかのそのような例によれば、各オーディオデバイス場所の最終的な推定値を生成することは、並進(平行移動)およびスケーリングされた順方向アライメント行列および並進(平行移動)およびスケーリングされた逆方向アライメント行列に基づく回転行列を生成することを含んでもよい。回転行列は、各オーディオデバイスについての複数の推定されたオーディオデバイス場所を含んでよい。順方向アライメントと逆方向アライメントとの間の最適な回転は、例えば、特異値分解(singular value decomposition)によって見出されることができる。幾つかのそのような例において、回転行列を生成することは、例えば、以下のように、
【数3】
並進(平行移動)およびスケーリングされた順方向アライメント行列および並進(平行移動)およびスケーリングされた逆方向アライメント行列に対して特異値分解を実行することを含んでよい。
【0079】
前述の式において、UおよびVは、それぞれ、行列
(外8)
の左特異ベクトルおよび右特異ベクトルを表す。Σは、特異値の行列を表す。前述の式は、回転行列R=VUをもたらす。行列積VUは、
(外9)
が最適に回転されて
(外10)
と整列させられるような、回転行列をもたらす。
【0080】
幾つかの例によれば、回転行列R=VUを決定した後に、整列を、例えば、以下のように平均化してよい。
【数4】
【0081】
幾つかの実装において、各オーディオデバイス場所の最終的な推定値を生成することは、各オーディオデバイスの推定されるオーディオデバイス場所を平均化して、各オーディオデバイス場所の最終的な推定値を生成することを含んでもよい。DOAデータおよび/または他の計算が有意な誤差を含むときでさえ、様々な開示された実装は堅牢であることが証明されている。例えば、
(外11)
は、
(外12)
、すなわち、複数の三角形の頂点が重なり合うことに起因する同じノードの複数の推定値を含む。共通のノードに亘って平均化することは、最終的な推定値
(外13)
をもたらす。
【0082】
図10は、推定されたオーディオデバイス場所および実際のオーディオデバイス場所の比較を示している。図10に示す例において、オーディオデバイス場所は、図7および図9を参照して上述した順方向および逆方向アライメント処理中に推定される場所に対応する。これらの例において、DOA推定値における誤差は、15度の標準偏差を有した。それにもかかわらず、各オーディオデバイス場所の最終的な推定値(それらの各々は図10に「x」で表されている)は、実際のオーディオデバイス場所(それらの各々は図10に円で表されている)とよく一致する。第1のシーケンスにおいて順方向アライメントプロセスを実行し、第1のシーケンスとは逆の第2のシーケンスにおいて逆方向アライメントプロセスを実行することによって、到着推定値の方向(データ)における誤差/不正確性が平均化され、それによって、環境内のオーディオデバイス場所の推定値の全体的な誤差が減少させられる。(より多い頂点の数がより大きな整列の広がりを示す)図7および(より少ない頂点の数がより大きな広がりを示す)図9に示すように、誤差は、整列シーケンスにおいて蓄積する傾向がある。逆の順序においてシーケンスを横断するプロセスは、整列誤差も逆転させ、それによって、最終的な場所推定値における全体的な誤差を平均化させる。
【0083】
図11は、この開示の様々な態様を実装することができる装置のコンポーネントの例を示すブロック図である。幾つかの例によれば、装置1100は、本明細書に開示する方法の少なくとも一部を実行するように構成された(スマートスピーカのような)スマートオーディオデバイスであってよく、或いはそのようなスマートオーディオデバイスを含んでよい。他の実装において、装置1100は、本明細書に開示する方法の少なくとも一部を実行するように構成された別のデバイスであってよく、或いはそのような別のデバイスを含んでよい。幾つかのそのような実装において、装置1100は、サーバであってよく、或いはサーバを含んでよい。
【0084】
この例において、装置1100は、インターフェースシステム1105と、制御システム1110とを含む。インターフェースシステム1105は、幾つかの実装において、環境内の複数のマイクロホンの各マイクロホンから入力を受信するように構成されてよい。インターフェースシステム1105は、1つ以上のネットワークインターフェースおよび/または(1つ以上のユニバーサルシリアルバス(USB)インターフェースのような)1つ以上の外部デバイスインターフェースを含んでよい。幾つかの実装によれば、インターフェースシステム1105は、1つ以上の無線インターフェースを含んでよい。インターフェースシステム1105は、1つ以上のマイクロホン、1つ以上のスピーカ、ディスプレイシステム、タッチセンサシステムおよび/またはジェスチャセンサシステムのような、ユーザインターフェースを実装するための1つ以上のデバイスを含んでよい。幾つかの例において、インターフェースシステム1105は、制御システム1110と図11に示す任意的なメモリシステム1115のようなメモリシステムとの間に1つ以上のインターフェースを含んでもよい。しかしながら、制御システム1110は、メモリシステムを含んでよい。
【0085】
制御システム1110は、例えば、汎用の単一またはマルチチッププロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)または他のプログラマブルロジックデバイス、離散ゲートまたはトランジスタロジック、および/または離散ハードウェアコンポーネントを含んでよい。幾つかの実装において、制御システム1110は、1つよりも多くのデバイス内に存在してよい。例えば、制御システム1110の一部分は、図1に示す環境100内のデバイス内に存在してよく、制御システム1110の別の部分は、サーバ、モバイルデバイス(例えば、スマートフォンまたはタブレットコンピュータ)などのような、環境100の外側にあるデバイス内に存在してよい。インターフェースシステム1105は、幾つかのそのような例において、1つよりも多くのデバイス内に存在してよい。
【0086】
幾つかの実装において、制御システム1110は、少なくとも部分的に本明細書に開示する方法を実行するように構成されてよい。幾つかの例によれば、制御システム1110は、例えば、図4を参照して上述した方法、および/または図12以下を参照して以下に記載する方法を実装するように構成されてよい。幾つかのそのような例において、制御システム1110は、少なくとも部分的に分類器からの出力に基づいて、環境内の複数のオーディオデバイス場所の各場所の推定値を決定するように構成されてよい。
【0087】
幾つかの例において、装置1100は、図11に示す任意的なマイクロホンシステム1120を含んでよい。マイクロホンシステム1120は、1つ以上のマイクロホンを含んでよい。幾つかの例において、マイクロホンシステム1120は、マイクロホンのアレイを含んでよい。幾つかの例において、装置1100は、図11に示す任意的なスピーカシステム1125を含んでよい。スピーカシステム1125は、1つ以上のラウドスピーカを含んでよい。幾つかの例において、マイクロホンシステム1120は、ラウドスピーカのアレイを含んでよい。幾つかのそのような例において、装置1100は、オーディオデバイスであってよく、或いはオーディオデバイスを含んでよい。例えば、装置1100は、図1に示すオーディオデバイス105のうちの1つであってよく、或いは図1に示すオーディオデバイス105のうちの1つを含んでよい。
【0088】
幾つかの例において、装置1100は、図11に示す任意的なアンテナシステム1130を含んでよい。幾つかの例によれば、アンテナシステム1130は、アンテナのアレイを含んでよい。幾つかの例において、アンテナシステム1130は、電磁波を送信および/または受信するように構成されてよい。幾つかの実装によれば、制御システム1110は、アンテナシステム1130からのアンテナデータに基づいて、環境内の2つのオーディオデバイス間の距離を推定するように構成されてよい。例えば、制御システム1110は、アンテナデータの到着時間および/または受信するアンテナデータの信号強度に従って、環境内の2つのオーディオデバイス間の距離を推定するように構成されてよい。
【0089】
本明細書に記載する方法の一部または全部は、1つ以上の非一時的な媒体に格納される命令(例えば、ソフトウェア)に従って1つ以上のデバイスによって実行されてよい。そのような非一時的な媒体は、ランダムアクセスメモリ(RAM)デバイス、読出し専用メモリ(ROM)デバイスなどを含むが、これらに限定されない、本明細書に記載するもののような、メモリデバイスを含んでよい。1つ以上の非一時的な媒体は、例えば、図11に示す任意的なメモリシステム1115内におよび/または制御システム1110内に存在してよい。従って、この開示に記載する主題の様々な革新的な態様は、1つ以上の非一時的な媒体内に実装されることができ、1つ以上の非一時的な媒体は、その上に格納されたソフトウェアを有する。ソフトウェアは、例えば、オーディオデータを処理するように少なくとも1つのデバイスを制御するための命令を含んでよい。ソフトウェアは、例えば、図11の制御システム1110のような制御システムの1つ以上のコンポーネントによって実行可能であってよい。
【0090】
前述の議論の多くは、オーディオデバイス自動場所選定(auto-location)に関する。以下の議論は、上記で簡単に記載した視聴者(リスナー)場所(listener location)および視聴者角度向き(listener angular orientation)を決定する幾つかの方法に基づく。前述の記載において、「回転(rotation)」という用語は、「向き(orientation)」という用語が以下の記載において使用されるのと本質的に同じ方法で使用される。例えば、上述の「回転」は、図4以下を参照して上述したプロセス中の個々の三角形の回転ではなく、最終的なスピーカ幾何学的形状の全体的な回転を指すことがある。この全体的な回転または向きは、視聴者角度向きを参照して、例えば、視聴者が見ている方向、視聴者の鼻が指している方向などによって決定されてよい。
【0091】
視聴者場所を推定する様々な満足できる方法が当該技術分野で知られており、その一部が以下に記載される。しかしながら、視聴者角度向きの推定は困難であり得る。幾つかの関連する方法を以下に詳述する。
【0092】
視聴者場所および視聴者角度向きを決定することは、位置付けられたオーディオデバイスを視聴者に対して方向付けることのような、幾つかの所望の構成を可能にすることができる。視聴者場所および角度向きを知ることは、例えば、視聴者に対して、環境内のどのスピーカが前方にあるか、どのスピーカが後方にあるか、(もしあるならば)どのスピーカが中心付近にあるかなどの決定を可能にする。
【0093】
オーディオデバイス場所と視聴者場所および向きとの間で相関を行った後に、幾つかの実装は、オーディオデバイス場所データ、オーディオデバイス角度向きデータ、視聴者場所データ、視聴者角度向きデータを、オーディオレンダリングシステムに提供することを含んでよい。代替的にまたは追加的に、幾つかの実装は、少なくとも部分的に、オーディオデバイス場所データ、オーディオデバイス角度向きデータ、視聴者場所データおよび視聴者角度向きデータに基づく、オーディオデータレンダリングプロセスを含んでよい。
【0094】
図12は、図11に示すような装置によって実行されることがある方法の一例を概説するフロー図である。方法1200のブロックは、本明細書に記載する他の方法と同様に、図示する順序で必ずしも実行されるわけではない。更に、そのような方法は、図示および/または記載するよりも多いまたは少ないブロックを含むことがある。この例において、方法1200のブロックは、図11に示す制御システム1110であってよい(或いは図11に示す制御システム1110を含んでよい)制御システムによって実行される。上述のように、幾つかの実装において、制御システム1110は、単一のデバイスに存在することがあるのに対し、他の実施形態では、制御システム1110は、2つ以上のデバイスに存在することがある。
【0095】
この例において、ブロック1205は、環境内の複数のオーディオデバイスの各オーディオデバイスについて到着方向(DOA)データを取得することを含む。幾つかの例において、複数のオーディオデバイスは、図1に示す全てのオーディオデバイス105のような、環境内の全てのオーディオデバイスを含んでよい。
【0096】
しかしながら、幾つかの場合において、複数のオーディオデバイスは、環境内の全てのオーディオデバイスのサブセットのみを含むことがある。例えば、複数のオーディオデバイスは、環境内の全てのスマートスピーカを含むことがあるが、環境内の他のオーディオデバイスのうちの1つ以上を含まないことがある。
【0097】
DOAデータは、特定の実装に依存して、様々な方法で取得されることがある。幾つかの例において、DOAデータを決定することは、複数のオーディオデバイスのうちの少なくとも1つのオーディオデバイスのDOAデータを決定することを含むことがある。幾つかの例おいて、DOAデータは、試験信号(test signal)を再生する(reproduce)ために環境内の複数のラウドスピーカの各ラウドスピーカを制御することによって取得されてよい。例えば、DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する複数のオーディオデバイスマイクロホンの各マイクロホンからマイクロホンデータを受信することと、少なくとも部分的にマイクロホンデータに基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含んでよい。代替的にまたは追加的に、DOAデータを決定することは、複数のオーディオデバイスの単一のオーディオデバイスに対応する1つ以上のアンテナからアンテナデータを受信することと、少なくとも部分的にアンテナデータに基づいて単一のオーディオデバイスについてのDOAデータを決定することとを含んでよい。
【0098】
幾つかのそのような例では、単一のオーディオデバイス自体が、DOAデータを決定してよい。幾つかのそのような実装によれば、複数のオーディオデバイスの各オーディオデバイスは、それ自体のDOAデータを決定することがある。しかしながら、他の実装では、ローカルまたはリモートデバイスであることがある他のデバイスが、環境内の1つ以上のオーディオデバイスのDOAデータを決定してよい。幾つかの実装によれば、サーバが、環境内の1つ以上のオーディオデバイスについてのDOAデータを決定してよい。
【0099】
図12に示す例によれば、ブロック1210は、制御システムを介して、少なくとも部分的にはDOAデータに基づいてオーディオデバイス場所データを生成することを含む。この例において、オーディオデバイス場所データは、ブロック1205で参照する各オーディオデバイスについてのオーディオデバイス場所の推定値を含む。
【0100】
オーディオデバイス場所データは、例えば、デカルト座標系、球面座標系または円筒座標系のような、座標系の座標であってよい(或いはそのような座標系を含んでよい)。本明細書では座標系をオーディオデバイス座標系と呼ぶことがある。幾つかのそのような例において、オーディオデバイス座標系は、環境内のオーディオデバイスのうちの1つを参照して方向付けられることがある。他の例において、オーディオデバイス座標系は、環境内の2つのオーディオデバイス間の線によって定義される軸を参照して方向付けられてよい。しかしながら、他の例において、オーディオデバイス座標系は、テレビ、部屋の壁などのような、環境の別の部分を参照して方向付けられてよい。
【0101】
幾つかの例において、ブロック1210は、図4を参照して上述したプロセスを含むことがある。幾つかのそのような例によれば、ブロック1210は、DOAデータに基づいて複数の三角形の各三角形についての内角を決定することを含むことがある。幾つかの場合において、複数の三角形の各三角形は、3つのオーディオデバイスのオーディオデバイス場所と対応する頂点を有することがある。幾つかのそのような方法は、少なくとも部分的に内角に基づいて、三角形の各三角形の各辺についての長さを決定することを含んでよい。
【0102】
幾つかのそのような方法は、第1のシークエンスにおいて複数の三角形の各三角形を整列させる順方向アライメントプロセスを実行して、順方向アライメント行列を生成することを含むことがある。幾つかのそのような方法は、第1のシーケンスの逆方向である第2のシーケンスにおいて複数の三角形の各三角形を整列させる逆方向アライメントプロセスを実行して、逆方向アライメント行列を生成することを含むことがある。幾つかのそのような方法は、少なくとも部分的には順方向アライメント行列の値および逆方向アライメント行列の値に基づいて、各オーディオデバイス場所の最終的な推定値を生成することを含むことがある。しかしながら、方法1200の幾つかの実装において、ブロック1210は、図4を参照して上述したもの以外の方法を適用することを含んでよい。
【0103】
この例において、ブロック1215は、制御システムを介して、環境内の視聴者場所を示す視聴者場所データを決定することを含む。視聴者場所データは、例えば、オーディオデバイス座標系を参照することがある。しかしながら、他の例において、座標系は、視聴者を参照して、或いはテレビ、部屋の壁などのような環境の一部を参照して、方向付けられてよい。
【0104】
幾つかの例において、ブロック1215は、(例えば、環境内の1つ以上のラウドスピーカからのオーディオプロンプトを介して)視聴者に1つ以上の発話を行うよう促すことと、DOAデータに従って視聴者場所を推定することとを含んでよい。DOAデータは、環境内の複数のマイクロホンによって取得されるマイクロホンデータに対応してよい。マイクロホンデータは、マイクロホンによる1つ以上の発話の検出に対応してよい。マイクロホンの少なくとも一部は、ラウドスピーカと同一場所にあってよい。幾つかの例によれば、ブロック1215は、三角測量プロセスを含んでよい。例えば、ブロック1215は、例えば、図13Aを参照して後述するように、オーディオデバイスを通過するDOAベクトル間の交点を見出すことによって、ユーザの音声を三角測量することを含んでよい。幾つかの実装によれば、ブロック1215(または方法1200の別の動作)は、オーディオデバイス座標系および視聴者座標系の原点を同一場所に配置することを含んでよく、それは視聴者場所が決定された後である。オーディオデバイス座標系および視聴者座標系の原点を同一場所に配置することは、オーディオデバイスの位置をオーディオデバイスの座標系から視聴者の座標系に変換すること(transforming)を含んでもよい。
【0105】
この実施態様によれば、ブロック1220は、制御システムを介して、視聴者角度向きを示す視聴者角度向きデータを決定することを含む。視聴者角度向きデータは、例えば、オーディオデバイス座標系のような、視聴者場所データを表すために使用される座標系を参照して作られてよい。幾つかのそのような例において、視聴者角度向きデータは、オーディオデバイス座標系の原点および/または軸を参照して作られてよい。
【0106】
しかしながら、幾つかの実装において、視聴者角度向きデータは、視聴者場所によって定義される軸と、テレビ、オーディオデバイス、壁などのような、環境内の別の点とを参照して作られてよい。幾つかのそのような実装において、視聴者場所は、視聴者座標系の原点を定義するために使用されてよい。視聴者角度向きデータは、幾つかのそのような例において、視聴者座標系の軸を参照して作られてよい。
【0107】
ブロック1220を実行するための様々な方法が本明細書に開示される。幾つかの例によれば、視聴者角度向きは、視聴者視認方向(viewing direction)に対応することがある。幾つかのそのような例において、視聴者の視認方向は、例えば、視聴者がテレビのような特定の物体を見ていると仮定することによって、視聴者場所データを参照して推測されることがある。幾つかのそのような実装において、視聴者視認方向は、視聴者場所およびテレビ場所に従って決定されてよい。代替的にまたは追加的に、視聴者視認方向は、視聴者場所およびテレビサウンドバー場所に従って決定されてよい。
【0108】
しかしながら、幾つかの例において、視聴者視認方向は、視聴者入力に従って決定されてよい。幾つかのそのような例によれば、視聴者入力は、視聴者が保持するデバイスから受信される慣性センサデータを含んでよい。視聴者は、デバイスを使用して、環境内の場所、例えば、視聴者が向いている方向に対応する場所を指してよい。例えば、視聴者は、デバイスを使用して、音響ラウドスピーカ(sounding loudspeaker)(サウンドを再生するラウドスピーカ)を指してよい。従って、そのような例において、慣性センサデータは、音響ラウドスピーカに対応する慣性センサデータを含むことがある。
【0109】
幾つかのそのような場合において、視聴者入力は、視聴者によって選択されるオーディオデバイスの表示を含んでよい。オーディオデバイスの表示は、幾つかの例において、選択されるオーディオデバイスに対応する慣性センサデータを含んでよい。
【0110】
しかしながら、他の例において、オーディオデバイスの表示は、視聴者の1つ以上の発話(例えば、「テレビがいま私の前にある」、「スピーカ2がいま私の前にある」など)に従って行われてよい。視聴者の1つ以上の発話に従って視聴者角度向きデータを決定する他の例が以下に記載される。
【0111】
図12に示す例によれば、ブロック1225は、制御システムを介して、視聴者場所および視聴者角度向きに対する各オーディオデバイスについてのオーディオデバイス角度向きデータを示すオーディオデバイス角度向きデータを決定することを含む。幾つかのそのような例によれば、ブロック1225は、視聴者場所によって定義される点の周りのオーディオデバイス座標の回転を含むことがある。幾つかの実装において、ブロック1225は、オーディオデバイス場所データをオーディオデバイス座標系から視聴者座標系に変換することを含むことがある。幾つかの例を以下に記載する。
【0112】
図13Aは、図12の幾つかのブロックの例を示している。幾つかのそのような例によれば、オーディオデバイス場所データは、オーディオデバイス座標系1307を参照して、オーディオデバイス1~5の各オーディオデバイスについてのオーディオデバイス場所の推定値を含む。この実装において、オーディオデバイス座標系1307は、オーディオデバイス2のマイクロホンの場所を原点として有するデカルト座標系である。ここで、オーディオデバイス座標系1307のx軸は、オーディオデバイス2のマイクロホンの場所とオーディオデバイス1のマイクロホンの場所との間の線1303に対応する。
【0113】
この例において、視聴者場所は、(例えば、環境1300a内の1つ以上のラウドスピーカからのオーディオプロンプトを介して)カウチ103に着座して示されている視聴者1305に1つ以上の発話1327を行うように促すことと、到着時間(TOA)データに従って視聴者場所を推定することとによって、決定される。TOAデータは、環境内の複数のマイクロホンから取得されるマイクロホンデータに対応する。この例において、マイクロホンデータは、オーディオデバイス1~5のうちの少なくとも一部(例えば、3つ、4つまたは全て5つ)のマイクロホンによる1つ以上の発話1327の検出と対応する。
【0114】
代替的にまたは追加的に、DOAデータに従った視聴者場所は、オーディオデバイス1~5の少なくとも一部(例えば、2つ、3つ、4つまたは全て5つ)のマイクロホンによって提供される。幾つかのそのような例によれば、視聴者場所は、DOAデータに対応する線1309a、1309bなどの交点に従って決定されてよい。
【0115】
この例によれば、視聴者場所は、視聴者座標系1320の原点と対応する。この例において、視聴者角度向きデータは、視聴者の頭1310(および/または視聴者の鼻1325)とテレビ101のサウンドバー1330との間の線1313aと対応する、視聴者座標系1320のy’軸によって示されている。図13Aに示す例において、線1313aは、y’軸に対して平行である。従って、角度θは、y軸とy’軸との間の角度を表す。この例において、図12のブロック1225は、視聴者座標系1320の原点の周りのオーディオデバイス座標の角度θによる回転を含んでよい。従って、オーディオデバイス座標系1307の原点は、図13Aのオーディオデバイス2と対応するように示されているが、幾つかの実装は、視聴者座標系1320の原点の周りでのオーディオデバイス座標の角度θだけの回転の前に、オーディオデバイス座標系1307の原点を視聴者座標系1320の原点と同一場所に配置すること(co-locating)を含む。この同一場所に配置すること(co-location)は、オーディオデバイス座標系1307から視聴者座標系1320への座標変換によって実行されてよい。
【0116】
幾つかの例において、サウンドバー1330および/またはテレビ101の場所は、サウンドバーにサウンドを発するようにさせること、並びにDOAおよび/またはTOAデータに従ってサウンドバーの場所を推定することによって決定されてよく、それはオーディオデバイス1~5のうちの少なくとも一部(例えば、3つ、4つまたは全て5つ)のオーディオデバイスのマイクロホンによるサウンドの検出に対応してよい。代替的にまたは追加的に、サウンドバー1330および/またはテレビ101の場所は、テレビまで歩くようにユーザを促すこと、並びにDOAおよび/またはTOAデータによってユーザの発話を場所特定することによって決定されてよく、それはオーディオデバイス1~5のうちの少なくとも一部(例えば、3つ、4つまたは全て5つ)のマイクロホンによる音の検出に対応してよい。そのような方法は、三角測量を含むことがある。そのような例は、サウンドバー1330および/またはテレビ101が関連するマイクロホンを持たない状況において有益なことがある。
【0117】
サウンドバー1330および/またはテレビ101が関連するマイクロホンを有する他の幾つかの他の例において、サウンドバー1330および/またはテレビ101の場所は、本明細書に開示するDOA法のような、TOA法またはDOA法に従って決定されてよい。幾つかのそのような方法によれば、マイクロホンは、サウンドバー1330と同一場所に配置されてよい。
【0118】
幾つかの実装によれば、サウンドバー1330および/またはテレビ101は、関連するカメラ1311を有してよい。制御システムが、視聴者の頭1310(および/または視聴者の鼻1325)の画像を取り込むように構成されてよい。幾つかのそのような例において、制御システムは、視聴者の頭1310(および/または視聴者の鼻1325)とカメラ1311との間の線1313aを決定するように構成されてよい。視聴者角度向きデータは、線1313aと対応してよい。代替的にまたは追加的に、制御システムは、線1313aとオーディオデバイス座標系のy軸との間の角度θを決定するように構成されてよい。
【0119】
図13Bは、視聴者角度向きデータを決定する追加的な例を示している。この例によれば、視聴者場所は、図12のブロック1215において既に決定されている。ここでは、制御システムが、環境1300bのラウドスピーカを制御して、オーディオオブジェクト1335を環境1300b内の様々な場所にレンダリングしている。幾つかのそのような例において、制御システムは、例えば、オーディオオブジェクト1335が視聴者座標系1320の原点の周りで回転するようにオーディオオブジェクト1335をレンダリングすることによって、オーディオオブジェクト1335が視聴者1305の周りを回転するように見えるように、ラウドスピーカにオーディオオブジェクト1335をレンダリングさせてよい。この例において、湾曲した矢印1340は、オーディオオブジェクト1335が視聴者1305の周りを回転するときのオーディオオブジェクト1335の軌跡の一部分を示している。
【0120】
幾つかのそのような例によれば、視聴者1305は、オーディオオブジェクト1335が、視聴者1305が面している方向にあるときを示す、ユーザ入力(例えば、「停止」と言うこと)を提供してよい。幾つかのそのような例において、制御システムは、視聴者場所とオーディオオブジェクト1335の場所との間の線1313bを決定するように構成されてよい。この例において、線1313bは、視聴者1305が面している方向を示す視聴者座標系のy’軸と対応する。代替的な実装において、視聴者1305は、オーディオオブジェクト1335が、環境の前方、環境のテレビ場所、オーディオデバイス場所などにあるときを示す、ユーザ入力を提供してよい。
【0121】
図13Cは、視聴者角度向きデータを決定する追加的な例を示している。この例によれば、視聴者場所は、図12のブロック1215において既に決定されている。ここで、視聴者1305は、ハンドヘルドデバイス1345をテレビ101またはサウンドバー1330に向けることによって、ハンドヘルドデバイス1345を使用して、視聴者1305の視認方向に関する入力を提供する。ハンドヘルドデバイス1345と視聴者の腕の破線の輪郭は、視聴者1305がハンドヘルドデバイス1345をテレビ101またはサウンドバー1330に向けていた時よりも前の時に、この例では、視聴者1305がハンドヘルドデバイス1345をオーディオデバイス2に向けていたことを示す。他の例において、視聴者1305は、ハンドヘルドデバイス1345をオーディオデバイス1のような別のオーディオデバイスに向けてよい。この例によれば、ハンドヘルドデバイス1345は、オーディオデバイス2とテレビ101またはサウンドバー1330との間の角度αを決定するように構成され、それはオーディオデバイス2と視聴者1305の視認方向との間の角度を近似する。
【0122】
ハンドヘルドデバイス1345は、幾つかの例において、慣性センサシステムと、環境1300cのオーディオデバイスを制御している制御システムと通信するように構成された無線インターフェースとを含む、携帯電話であってよい。幾つかの例において、ハンドヘルドデバイス1345は、例えば、(例えば、グラフィカルユーザインターフェースを介して)ユーザプロンプトを提供することによって、ハンドヘルドデバイス1345が所望の方向を指していることを示す入力を受信することによって、対応する慣性センサデータを保存することおよび/または対応する慣性センサデータを環境1300cのオーディオデバイスを制御している制御システムに送信することなどによって、必要な機能性を実行するようにハンドヘルドデバイス1345を制御するように構成されたアプリケーションまたは「アプリ」を実行してよい。
【0123】
この例によれば、(ハンドヘルドデバイス1345の制御システムまたは環境1300cのオーディオデバイスを制御している制御システムであってよい)制御システムは、慣性センサデータ、例えば、ジャイロスコープデータに従って、線1313cおよび1350の向きを決定するように構成される。この例において、線1313cは、軸y’に対して平行であり、視聴者角度向きを決定するために使用されてよい。幾つかの例によれば、制御システムは、オーディオデバイス2と視聴者1305の視認方向との間の角度αに従って、視聴者座標系1320の原点の周りのオーディオデバイス座標についての適切な回転を決定することがある。
【0124】
図13Dは、図13Cを参照して記載した方法に従って、オーディオデバイス座標についての適切な回転を決定する一例を示している。この例において、オーディオデバイス座標系1307の原点は、視聴者座標系1320の原点と同一場所にある。オーディオデバイス座標系1307および視聴者座標系1320の原点を同一場所に配置することは、視聴者場所が決定される1215の処理後に可能にされる。オーディオデバイス座標系1307および視聴者座標系1320の原点を同一場所に配置することは、オーディオデバイス場所をオーディオデバイス座標系1307から視聴者座標系1320に変換することを含むことがある。角度αは、図13Cを参照して上述したように決定されている。従って、角度αは、視聴者座標系1320におけるオーディオデバイス2の所望の向きと対応する。この例において、角度βは、オーディオデバイス座標系1307におけるオーディオデバイス2の向きと対応する。この実施例ではβ-αである角度θは、オーディオデバイス座標系1307のy軸を視聴者座標系1320のy’軸と整列させるために必要な回転を示す。
【0125】
幾つかの実装において、図12の方法は、対応するオーディオデバイス場所、対応するオーディオデバイス角度向き、視聴者場所データおよび視聴者角度向きデータに少なくとも部分的に基づいて、環境内のオーディオデバイスの少なくとも1つを制御することを含んでよい。
【0126】
例えば、幾つかの実装は、オーディオデバイス場所データ、オーディオデバイス角度向きデータ、視聴者場所データおよび視聴者角度向きデータを、オーディオレンダリングシステムに提供することを含んでよい。幾つかの例において、オーディオレンダリングシステムは、図11の制御システム1110のような制御システムによって実装されてよい。幾つかの実装は、オーディオデバイス場所データ、オーディオデバイス角度向きデータ、視聴者場所データおよび視聴者角度向きデータに少なくとも部分的に基づいて、オーディオデータレンダリングプロセスを制御することを含んでよい。幾つかのそのような実装は、ラウドスピーカ音響能力データをレンダリングシステムに提供することを含んでよい。ラウドスピーカ音響能力データは、環境の1つ以上のラウドスピーカに対応してよい。ラウドスピーカ音響能力データは、1つ以上のドライバ、複数のドライバ、または1つ以上のドライバのドライバ周波数応答の向きを示すことがある。幾つかの例において、ラウドスピーカ音響能力データは、メモリから取り出され、次に、レンダリングシステムに提供される。
【0127】
既存のフレキシブルレンダリング技術は、CMAP(Center of Mass Amplitude Panning)およびFV(Flexible Virtualization)を含む。高レベルから、これらの技術の両方は、各々が関連する所望の知覚された空間位置を有する1つ以上のオーディオ信号のセットを、2つ以上のスピーカのセットの上で再生するためにレンダリングし、その場合、セットのスピーカの相対的なアクティブ化は、スピーカの上で再生される前記オーディオ信号の知覚された空間位置のモデルおよびスピーカの位置に対するオーディオ信号の所望の知覚された空間位置の近接性の関数である。モデルは、オーディオ信号が、その意図される空間位置の近くで視聴者によって確実に聞かれることを保証し、近接性項(proximity term)は、この空間的印象を達成するために、どのスピーカが使用されるかを制御する。特に、近接性項は、オーディオ信号の所望の知覚された空間位置に近いスピーカのアクティブ化を好む。CMAPおよびFVの両方について、この関数関係は、以下のように、2つの項、すなわち、空間的側面についての1つの項および近接性についての1つ項の合計として書かれた費用関数から便利に導き出される。
【数5】
【0128】
ここで、セット
(外14)
は、Mラウドスピーカのセットの位置を示し、
(外15)
は、オーディオ信号の所望の知覚された空間位置を示し、gは、スピーカアクティブ化のM次元ベクトルを示す。CMAPについて、ベクトル中の各アクティブ化は、スピーカ当たりの利得を表し一方で、FVについて、各アクティブ化は、フィルタを表す(この第2の場合において、gは、同等に、特定の周波数での複素値のベクトルと考えられることができ、異なるgが、フィルタを形成するために複数の周波数に亘って計算される)。アクティブ化の最適ベクトルは、以下のように、アクティブ化に亘ってコスト関数を最小化することによって求められる
【数6】
【0129】
コスト関数の特定の定義では、上記最小化の結果として得られる最適アクティブ化の絶対レベルを制御することは困難であるが、goptの成分間の相対レベルは適切である。この問題に対処するために、アクティブ化の絶対レベルが制御されるように、goptの引き続きの正規化が実行されてよい。例えば、単位長を有するベクトルの正規化が望ましく、それは以下のような一般的に使用される定電力パンルール(constant power panning rules)と一致する。
【数7】
【0130】
フレキシブルレンダリングアルゴリズムの正確な挙動は、コスト関数の2つの項、すなわち、CspatialおよびCproximityの特定の構成によって決定される。CMAPについて、Cspatialは、ラウドスピーカのセットから再生するオーディオ信号の知覚される空間的位置を、それらのラウドスピーカの関連するアクティブ化利得g(ベクトルgの要素)によって重み付けられたそれらのラウドスピーカの位置の質量中心に置くモデルから、以下のように導き出される。
【数8】
【0131】
次に、式3は、以下のように、所望のオーディオ位置とアクティブ化されたラウドスピーカによって生成され位置との間の誤差の二乗を表す空間コストに操作される。
【数9】
【0132】
FVでは、コスト関数の空間項は、異なって定義される。ここでは、目標は、聴者の左耳および右耳でのオーディオオブジェクト位置
(外16)
に対応する両耳応答bを生成することである。概念的には、bは、フィルタ(各耳について1つのフィルタ)の2×1ベクトルであるが、特定の周波数での複素値の2×1ベクトルとしてより便利に取り扱われる。特定の周波数でこの表現を続けると、所望の両耳応答が、以下のように、オブジェクト位置によるHRTF指数(index)のセットから取り出されることがある
【数10】
【0133】
同時に、ラウドスピーカによって視聴者の耳で生成される2×1両耳応答eは、以下のように、2×M音響伝達行列(acoustic transmission matrix)Hを複素スピーカアクティブ化値のMx1ベクトルgで乗じたものとしてモデル化される
【数11】
【0134】
音響伝達行列Hは、視聴者場所に対するラウドスピーカ位置
(外17)
のセットに基づいてモデル化される。最後に、コスト関数の空間成分は、以下のように、所望の両耳応答(式5)とラウドスピーカによって生成される応答(式6)との間の誤差の二乗として定義される。
【数12】
【0135】
便利なことに、式4および式7で定義されるCMAPおよびFVのコスト関数の空間項は、両方とも、以下のように、スピーカアクティブ化gの関数として、行列2次に再構成されことができる
【数13】
ここで、Aは、M×Mの正方行列であり、Bは、1×Mベクトルであり、Cは、スカラーである。行列Aは、ランク2であり、従って、M>2であるときに、空間誤差項がゼロに等しい無限数のスピーカアクティブ化gが存在する。コスト関数の第2の項、すなわち、Cproximityを導入することは、この不確定性(indeterminacy)を除去し、他の可能な解決策と比較して知覚的に有益な特性を有する特別な解決策をもたらす。CMAPおよびFVの両方について、Cproximityは、その位置
(外18)
が所望のオーディオ信号位置
(外19)
から離れているスピーカのアクティブ化が、その位置が所望の位置に近いスピーカのアクティブ化よりも多くペナルティが課されるように構成される。この構成は、僅かであるスピーカアクティブ化の最適なセットをもたらし、その場合には、所望のオーディオ信号の位置に近接近するスピーカのみが有意にアクティブ化され、スピーカのセットの周りの視聴者の動きに対して知覚的により堅牢であるオーディオ信号の空間的再生を実際にもたらす。
【0136】
この目的のために、コスト関数の第2の項は、すなわち、Cproximityは、視聴者アクティブ化の絶対値の2乗の距離加重和として定義されよてい。これは、以下のように、行列形式でコンパクトに表現される
【数14】
ここで、Dは、以下のように、所望のオーディオ位置と各スピーカとの間の距離ペナルティの対角行列である。
【数15】
【0137】
距離ペナルティ関数は、多くの形式をとることができるが、以下は、有用なパラメータ化である。
【数16】
ここで、
(外20)
は、所望のオーディオ位置とスピーカ位置の間のユークリッド距離であり、αおよびβは、調整可能なパラメータである。パラメータαは、ペナルティの大域的な強さを示し、dは、距離ペナルティの空間的な広がりに対応し(約dの距離にあるか或いはそれよりも更に離れたラウドスピーカはペナルティを課される)、βは、距離dでペナルティが発生する突然性を説明する。
【0138】
式8および式9aで定義されるコスト関数の2つの項を組み合わせると、以下のように、全体的なコスト関数をもたらす。
【数17】
以下のように、gに関するこのコスト関数の導関数を0に等しく設定してgの値を求めると、最適なスピーカアクティブ化解(activation solution)をもたらす。
【数18】
【0139】
一般に、式11の最適解は、値が負であるスピーカアクティブ化をもたらすことがある。フレキシブルレンダラのCMAP構造について、そのような負のアクティブ化は望ましくないことがあり、よって、式11は、全てのアクティブ化が正のままであることを条件として、最小限に抑えられることがある。
【0140】
図14および図15は、スピーカ位置が4、64、165、-87および-4度であることを前提とした、スピーカアクティブ化およびオブジェクトレンダリング位置の例示的なセットを示す図である。図14は、これらの特定のスピーカ位置についての式11の最適解を含むスピーカアクティブ化を示している。図15は、個々のスピーカの位置を、それぞれ、橙色、紫色、緑色、金色および青色の点としてプロットしている。図15は、緑色ドットとしての多数の可能なオブジェクト角度についての理想的なオブジェクト位置(すなわち、オーディオオブジェクトがレンダリングされるべき位置)と、黒色の点線によって理想的なオブジェクト位置に接続された、赤色ドットとしてのそれらのオブジェクトについての対応する実際のレンダリング位置とを示している。
【0141】
本開示の特定の実施形態および用途が本明細書に記載されているが、本明細書に記載される実施形態および用途の多くの変形が、この開示の範囲から逸脱することなく可能であることが、当業者に明らかであろう。
【0142】
本開示の様々な態様が、以下に列挙する例示的な実施形態(EEE)から理解されることがある。
【0143】
1.オーディオデバイス場所を選定する方法であって、
複数のオーディオデバイスの各オーディオデバイスについての到着方向(DOA)データの取得することと、
DOAデータに基づいて複数の三角形の各三角形の内角を決定することであって、複数の三角形の各三角形は、オーディオデバイスのうちの3つのオーディオデバイスのオーディオデバイス場所と対応する頂点を有する、決定することと、
内角に少なくとも部分的に基づいて三角形の各三角形の各辺の辺の長さを決定することと、
第1のシークエンスにおいて複数の三角形の各三角形を整列させる順方向アライメントプロセスを実行して順方向アライメント行列を生成することと、
第1のシーケンスの逆方向である第2のシーケンスにおいて複数の三角形の各三角形を整列させる逆方向アライメントプロセスを実行して逆方向アライメント行列を生成することと、
順方向アライメント行列の値および逆方向アライメント行列の値に少なくとも部分的に基づいて、各オーディオデバイス場所の最終的な推定値を生成することと、を含む、
方法。
【0144】
2.各オーディオデバイス場所の最終的な推定値を生成することは、
順方向アライメント行列を並進およびスケーリングして、並進およびスケーリングされた順方向アライメント行列を生成することと、
逆方向アライメント行列を並進およびスケーリングして、並進およびスケーリングされた逆方向アライメント行列を生成することと、を含む、
EEE1の方法。
【0145】
3.各オーディオデバイス場所の最終的な推定値を生成することは、並進およびスケーリングされた順方向アライメント行列ならびに並進およびスケーリングされた逆方向アライメント行列に基づく回転行列を生成することを更に含み、回転行列は、各オーディオデバイスについて複数の推定されたオーディオデバイス場所を含む、
EEE2の方法。
【0146】
4.回転行列を生成することは、並進およびスケーリングされた順方向アライメント行列ならびに並進およびスケーリングされた逆方向アライメント行列に対して特異値分解を実行することを含む、
EEE3の方法。
【0147】
5.各オーディオデバイス場所の最終的な推定値を生成することは、各オーディオデバイスについて推定されるオーディオデバイス場所を平均化して、各オーディオデバイス場所の最終的な推定値を生成することを更に含む、
EEE3またはEEE4の方法。
【0148】
6.辺の長さを決定することは、
三角形の第1の辺の第1の長さを決定することと、
三角形の内角に基づいて三角形の第2の辺の長さと第3の辺の長さを決定することと、を含む、
EEE1~5のうちのいずれか1つの方法。
【0149】
7.第1の長さを決定することは、第1の長さを所定の値に設定することを含む、EEE6の方法。
【0150】
8.第1の長さを決定することは、到着時間データまたは受信される信号強度データのうちの少なくとも1つに基づく、EEE6の方法。
【0151】
9.DOAデータを取得することは、複数のオーディオデバイスのうちの少なくとも1つのオーディオデバイスについてDOAデータを決定することを含む、EEE1~8のうちのいずれか1つの方法。
【0152】
10.DOAデータを決定するステップは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する複数のオーディオデバイスマイクロホンの各マイクロホンからマイクロホンデータを受信することと、マイクロホンデータに少なくとも部分的に基づいて単一のオーディオデバイスについてのDOAデータを決定することと、を含む、EEE9の方法。
【0153】
11.DOAデータを決定することは、複数のオーディオデバイスのうちの単一のオーディオデバイスに対応する1つ以上のアンテナからアンテナデータを受信することと、アンテナデータに少なくとも部分的に基づいて単一のオーディオデバイスについてのDOAデータを決定することと、を含む、EEE9の方法。
【0154】
12.少なくとも1つのオーディオデバイス場所の最終的な推定値に少なくとも部分的に基づいてオーディオデバイスの少なくとも1つのオーディオデバイスを制御することを更に含む、EEE1~11のうちのいずれか1つの方法。
【0155】
13.オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することは、オーディオデバイスのうちの少なくとも1つのオーディオデバイスのラウドスピーカを制御することを含む、EEE12の方法。
【0156】
14.EEE1~13のうちのいずれか1つの方法を実行するように構成される装置。
【0157】
その上に記録されたソフトウェアを含む1つ以上の非一時的媒体であって、ソフトウェアは、EEE1-13のうちのいずれかの方法を実行するために1つ以上のデバイスを制御するための命令を含む、1つ以上の非一時的媒体。
【0158】
オーディオデバイスを構成する方法であって、
制御システムを介して、環境内の複数のオーディオデバイスの各オーディオデバイスについてオーディオデバイス到着方向(DOA)データを取得することと、
制御システムを介して、DOAデータに少なくとも部分的に基づいてオーディオデバイス場所データを生成することであって、オーディオデバイス場所データは、各オーディオデバイスについてのオーディオデバイス場所の推定値を含む、生成することと、
制御システムを介して、環境内の視聴者場所を示す視聴者場所データを決定することと、
制御システムを介して、視聴者角度向きを示す視聴者角度向きデータを決定することと、
制御システムを介して、視聴者場所および視聴者角度向きに対する各オーディオデバイスについてのオーディオデバイス角度向きを示すオーディオデバイス角度向きデータを決定することと、を含む、
方法。
【0159】
17.対応するオーディオデバイス場所、対応するオーディオデバイス角度向き、視聴者場所データおよび視聴者角度向きデータに少なくとも部分的に基づいて、オーディオデバイスのうちの少なくとも1つのオーディオデバイスを制御することを更に含む、EEE16の方法。
【0160】
18.オーディオデバイス場所データ、オーディオデバイス角度向きデータ、視聴者場所データおよび視聴者角度向きデータを、オーディオレンダリングシステムに提供することを更に含む、EEE16の方法。
【0161】
19.オーディオデバイス場所データ、オーディオデバイス角度向きデータ、視聴者場所データおよび視聴者角度向きデータに少なくとも部分的に基づいて、オーディオデータレンダリングプロセスを制御することを更に含む、EEE16の方法。
【0162】
20.DOAデータを取得することは、環境内の複数のラウドスピーカの各ラウドスピーカを制御して試験信号を再生することを含む、EEE16~19のいずれか1つの方法。
【0163】
21.視聴者場所データまたは視聴者角度向きデータのうちの少なくとも1つは、視聴者の1つ以上の発話に対応するDOAデータに基づく、EEE16~20のいずれか1つの方法。
【0164】
22.視聴者角度向きは、視聴者視認方向に対応する、EEE16~21のいずれか1つの方法。
【0165】
23.視聴者視認方向は、視聴者場所とテレビ場所とに従って決定される、EEE22の方法。
【0166】
24.視聴者視認方向は、視聴者場所とテレビサウンドバー場所とに従って決定される、EEE22の方法。
【0167】
25.視聴者視認方向は、視聴者入力に従って決定される、EEE22の方法。
【0168】
26.視聴者入力は、視聴者によって保持されるデバイスから受信される慣性センサデータを含む、EEE25の方法。
【0169】
27.慣性センサデータは、音を出しているラウドスピーカに対応する慣性センサデータを含む、EEE25の方法。
【0170】
28.視聴者入力は、視聴者によって選択されるオーディオデバイスの表示を含む、EEE25の方法。
【0171】
29.ラウドスピーカ音響能力データをレンダリングシステムに提供することを更に含み、ラウドスピーカ音響能力データは、1つ以上のドライバの向き、複数のドライバ、または1つ以上のドライバのドライバ周波数応答のうちの少なくとも1つを示す、EEE16~28のいずれか1つの方法。
【0172】
30.オーディオデバイス場所データを生成することは、
オーディオデバイスDOAデータに基づいて複数の三角形の各三角形についての内角を決定することであって、複数の三角形の各三角形は、オーディオデバイスのうちの3つのオーディオデバイスのオーディオデバイス場所と対応する頂点を有する、決定することと、
内角に少なくとも部分的に基づいて三角形の各三角形の各辺の辺の長さを決定することと、
第1のシークエンスにおいて複数の三角形の各三角形を整列させる順方向アライメントプロセスを実行して順方向アライメント行列を生成することと、
第1のシーケンスの逆方向である第2のシーケンスにおいて複数の三角形の各三角形を整列させる逆方向アライメントプロセスを実行して逆方向アライメント行列を生成することと、
順方向アライメント行列の値および逆方向アライメント行列の値に少なくとも部分的に基づいて、各オーディオデバイス場所の最終的な推定値を生成することと、を含む、
EEE16~29のいずれか1つの方法。
【0173】
EEE16~30のうちのいずれか1の方法を実行するように構成される装置。
【0174】
その上に記録されたソフトウェアを有する1つ以上の非一時的媒体であって、ソフトウェアは、EEE16-30のちのいずれか1つの方法を実行するために1つ以上のデバイスを制御するための命令を含む、非一時的媒体。
図1
図2
図3A
図3B
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13A
図13B
図13C
図13D
図14
図15
【国際調査報告】