(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-23
(45)【発行日】2024-05-02
(54)【発明の名称】反響利得正規化
(51)【国際特許分類】
H04S 7/00 20060101AFI20240424BHJP
【FI】
H04S7/00 300
(21)【出願番号】P 2020569075
(86)(22)【出願日】2019-06-14
(86)【国際出願番号】 US2019037384
(87)【国際公開番号】W WO2019241754
(87)【国際公開日】2019-12-19
【審査請求日】2022-06-01
(32)【優先日】2018-06-14
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】514108838
【氏名又は名称】マジック リープ, インコーポレイテッド
【氏名又は名称原語表記】Magic Leap,Inc.
【住所又は居所原語表記】7500 W SUNRISE BLVD,PLANTATION,FL 33322 USA
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】オードフレイ, レミ サミュエル
(72)【発明者】
【氏名】ジョット, ジャン-マルク
(72)【発明者】
【氏名】ディッカー, サミュエル チャールズ
【審査官】堀 洋介
(56)【参考文献】
【文献】国際公開第2019/078034(WO,A1)
【文献】特開2003-330477(JP,A)
【文献】特開2011-217068(JP,A)
【文献】特開平11-338487(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00- 7/00
G10K 15/12
(57)【特許請求の範囲】
【請求項1】
方法であって、前記方法は、
入力信号を受信することであって、前記入力信号は、第1の部分と、第2の部分とを含む、ことと、
反響処理システムを使用して、
反響初期利得(RIG)値を前記入力信号の第1の部分に適用することと、
反響初期パワー(RIP)補正係数を前記入力信号の第1の部分に適用することであって、前記RIP補正係数は、前記RIG値が適用された後に、適用され
、前記RIG値の適用は、
反響利得(RG)値を前記入力信号の第1の部分に適用することと、
反響エネルギー(RE)補正係数を前記入力信号の第1の部分に適用することであって、前記RE補正係数は、前記RG値が適用された後に、適用される、ことと
を含む、ことと、
前記入力信号の第1の部分内に反響効果を導入することであって、前記反響効果は、前記RIG値および前記RIP補正係数とは別個に適用される、ことと
を行うことと、
直接処理システムを使用して、前記入力信号の第2の部分内に遅延を導入し、前記入力信号の第2の部分に利得を適用することと、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、オーディオ信号である、ことと
を含む、方法。
【請求項2】
前記RIP補正係数を計算することであって、前記RIP補正係数は、RIP補正器によって、計算され、前記入力信号の第1の部分に適用される、こと
をさらに含み、前記RIP補正係数は、前記RIP補正器から出力される信号が1.0に正規化されるように、計算される、請求項1に記載の方法。
【請求項3】
前記RIP補正係数は、リバーブレータトポロジ、遅延ユニットの数および持続時間、接続利得、およびフィルタパラメータのうちの1つ以上のものに依存する、請求項1に記載の方法。
【請求項4】
方法であって、前記方法は、
入力信号を受信することであって、前記入力信号は、第1の部分と、第2の部分とを含む、ことと、
反響処理システムを使用して、
反響初期利得(RIG)値を前記入力信号の第1の部分に適用することと、
反響初期パワー(RIP)補正係数を前記入力信号の第1の部分に適用することであって、前記RIP補正係数は、前記RIG値が適用された後に、適用され、前記RIP補正係数は、反響インパルス応答のRMSパワーに等しい、
ことと、
前記入力信号の第1の部分内に反響効果を導入することであって、前記反響効果は、前記RIG値および前記RIP補正係数とは別個に適用される、ことと
を行うことと、
直接処理システムを使用して、前記入力信号の第2の部分内に遅延を導入し、前記入力信号の第2の部分に利得を適用することと、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、オーディオ信号である、ことと
を含む、方法。
【請求項5】
前記入力信号の第1の部分内の前記反響効果の導入は、1つ以上の周波数をフィルタ処理して取り除くことを含む、請求項1に記載の方法。
【請求項6】
前記反響効果の導入は、前記入力信号の第1の部分の位相を変化させることを含む、請求項1に記載の方法。
【請求項7】
前記反響効果の導入は、リバーブレータトポロジを選択し、内部リバーブレータパラメータを設定することを含む、請求項1に記載の方法。
【請求項8】
前記RIG値は、1.0に等しく、前記方法は、前記反響処理システムのRIPが1.0に等しいように、前記RIP補正係数を計算することをさらに含む、請求項1に記載の方法。
【請求項9】
方法であって、前記方法は、
入力信号を受信することであって、前記入力信号は、第1の部分と、第2の部分とを含む、ことと、
反響処理システムを使用して、
反響初期利得(RIG)値を前記入力信号の第1の部分に適用することと、
反響初期パワー(RIP)補正係数を前記入力信号の第1の部分に適用することであって、前記RIP補正係数は、前記RIG値が適用された後に、適用される、ことと、
前記入力信号の第1の部分内に反響効果を導入することであって、前記反響効果は、前記RIG値および前記RIP補正係数とは別個に適用される、ことと
を行うことと、
直接処理システムを使用して、前記入力信号の第2の部分内に遅延を導入し、前記入力信号の第2の部分に利得を適用することと、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、オーディオ信号である、ことと、
反響時間を無限大に設定することと、
リバーブレータインパルス応答を記録することと、
反響RMS振幅を測定することと
によって、前記RIP補正係数を計算すること
と
を含み、
前記RIP補正係数は、前記反響RMS振幅の逆数に関連する
、方法。
【請求項10】
方法であって、前記方法は、
入力信号を受信することであって、前記入力信号は、第1の部分と、第2の部分とを含む、ことと、
反響処理システムを使用して、
反響初期利得(RIG)値を前記入力信号の第1の部分に適用することと、
反響初期パワー(RIP)補正係数を前記入力信号の第1の部分に適用することであって、前記RIP補正係数は、前記RIG値が適用された後に、適用される、ことと、
前記入力信号の第1の部分内に反響効果を導入することであって、前記反響効果は、前記RIG値および前記RIP補正係数とは別個に適用される、ことと
を行うことと、
直接処理システムを使用して、前記入力信号の第2の部分内に遅延を導入し、前記入力信号の第2の部分に利得を適用することと、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、オーディオ信号である、ことと、
反響時間を有限値に設定することと、
リバーブレータインパルス応答を記録することと、
反響RMS振幅消滅曲線を導出することと、
放出の時間における反響RMS振幅を決定することと
によって、前記RIP補正係数を計算すること
と
を含み、
前記RIP補正係数は、前記反響RMS振幅の逆数に関連する
、方法。
【請求項11】
前記RE補正係数を計算することであって、前記RE補正係数は、RE補正器によって、計算され、前記入力信号の第1の部分に適用される、こと
をさらに含み、前記RE補正器は、前記RE補正から出力される信号が1.0に正規化されるように、計算される、請求項
1に記載の方法。
【請求項12】
前記RIG値を計算することであって、前記RIG値は、前記RG値を前記RE補正係数で乗算したものに等しい、こと
をさらに含む、請求項
1に記載の方法。
【請求項13】
前記反響効果は、前記RIP補正係数が適用された後に、導入される、請求項1に記載の方法。
【請求項14】
システムであって、
オーディオ信号をユーザに提供するように構成されるウェアラブル頭部デバイスと、
前記オーディオ信号をレンダリングするように構成される回路であって、前記回路は、
反響処理システムであって、
反響初期利得(RIG)値を入力信号の第1の部分に適用するように構成されるRIG
であって、前記RIGは、反響利得(RG)値を前記入力信号の第1の部分に適用するように構成されるRGを含み、前記RIGは、反響エネルギー(RE)補正係数を前記RGからの信号に適用するように構成されるRE補正器をさらに含む、RIGと、
反響初期パワー(RIP)補正係数を前記RIGからの信号に適用するように構成されるRIP補正器と
を含む、反響処理システムと、
前記RIP補正器からの信号内に反響効果を導入するように構成されるリバーブレータであって、前記反響効果は、前記RIG値および前記RIP補正係数とは別個に適用される、リバーブレータと、
前記入力信号の第2の部分内に遅延を導入し、前記入力信号の第2の部分に利得を適用するように構成される直接処理と、
コンバイナであって、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、前記オーディオ信号である、ことと
を行うように構成される、コンバイナと
を含む、回路と
を備える、システム。
【請求項15】
前記リバーブレータは、前記RIP補正器からの前記信号内の1つ以上の周波数をフィルタ処理して取り除くように構成される複数のコムフィルタを含む、請求項
14に記載のシステム。
【請求項16】
前記リバーブレータは、前記複数のコムフィルタからの信号の位相を変化させるように構成される複数のオールパスフィルタを含む、請求項
15に記載のシステム。
【請求項17】
方法であって、前記方法は、
入力信号を受信することであって、前記入力信号は、第1の部分と、第2の部分とを含む、ことと、
反響処理システムを使用して、
反響初期利得(RIG)値を前記入力信号の第1の部分に適用することと、
反響初期パワー(RIP)補正係数を前記入力信号の第1の部分に適用することであって、前記RIP補正係数は、前記RIG値が適用された後に適用され、前記RIG値の適用は、
反響利得(RG)値を前記入力信号の第1の部分に適用することと、
反響エネルギー(RE)補正係数を前記入力信号の第1の部分に適用することであって、前記RE補正係数は、前記RG値が適用された後に適用される、ことと
を含む、ことと、
前記入力信号の第1の部分内に反響効果を導入することと
を行うことと、
直接処理システムを使用して、前記入力信号の第2の部分内に遅延を導入し、前記入力信号の第2の部分に利得を適用することと、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、オーディオ信号である、ことと
を含む、方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、参照することによってその全体として本明細書に組み込まれる、2018年6月14日に出願された、米国仮特許出願第62/685,235号の利益を主張する。
【0002】
本開示は、一般に、反響アルゴリズムおよび開示される反響アルゴリズムを使用するためのリバーブレータに関する。より具体的には、本開示は、反響初期パワー(RIP)補正係数を計算し、リバーブレータと直列にこれを適用することに関する。本開示はまた、反響エネルギー補正(REC)係数を計算し、リバーブレータと直列にこれを適用することに関する。
【背景技術】
【0003】
仮想環境は、コンピューティング環境において普遍的であって、ビデオゲーム(仮想環境が、ゲーム世界を表し得る)、マップ(仮想環境が、ナビゲートされるべき地形を表し得る)、シミュレーション(仮想環境が、実環境をシミュレートし得る)、デジタルストーリーテリング(仮想キャラクタが、仮想環境内で相互に相互作用し得る)、および多くの他の用途において使用を見出している。現代のコンピュータユーザは、概して、快適に仮想環境を知覚し、それと相互作用する。しかしながら、仮想環境を伴うユーザの体験は、仮想環境を提示するための技術によって限定され得る。例えば、従来のディスプレイ(例えば、2Dディスプレイ画面)およびオーディオシステム(例えば、固定スピーカ)は、人を引き付け、現実的で、かつ没入型の体験を作成するように、仮想環境を実現することが不可能であり得る。
【0004】
仮想現実(「VR」)、拡張現実(「AR」)、複合現実(「MR」)、および関連技術(集合的に、「XR」)は、XRシステムのユーザにコンピュータシステム内のデータによって表される仮想環境に対応する感覚情報を提示する能力を共有する。そのようなシステムは、仮想視覚およびオーディオキューを現実の視界および音と組み合わせることによって、一意に強調された没入感および臨場感を提供することができる。故に、音が、ユーザの実環境内で自然に、かつユーザの予期する音と一貫して発生しているように現れるように、XRシステムのユーザにデジタル音を提示することが、望ましくあり得る。概して言えば、ユーザは、仮想音が、それらが聞こえる実環境の音響性質を帯びるであろうと予期する。例えば、大きいコンサートホール内のXRシステムのユーザは、XRシステムの仮想音が、大きい洞窟に似た音性品質を有することを予期し、逆に、小さいアパートメント内のユーザは、音が、より減衰され、近接し、即時であることを予期するであろう。
【0005】
デジタルまたは人工リバーブレータが、室内の拡散音響反響の知覚される効果をシミュレートするために、オーディオおよび音楽信号処理において使用され得る。例えば、サウンドデザイナのための直感的制御のために、デジタルリバーブレータ毎に反響音量および反響消滅の正確かつ独立した制御を提供するシステムが、所望され得る。
【発明の概要】
【課題を解決するための手段】
【0006】
反響性質の正確かつ独立した制御を提供するためのシステムおよび方法が、開示される。いくつかの実施形態では、システムは、反響処理システムと、直接処理システムと、コンバイナとを含んでもよい。反響処理システムは、反響初期パワー(RIP)制御システムと、リバーブレータとを含むことができる。RIP制御システムは、反響初期利得(RIG)と、RIP補正器とを含むことができる。RIGは、RIG値を入力信号に適用するように構成されることができ、RIP補正器は、RIP補正係数をRIGからの信号に適用するように構成されることができる。リバーブレータは、反響効果をRIP制御システムからの信号に適用するように構成されることができる。
【0007】
いくつかの実施形態では、リバーブレータは、本システム内の1つ以上の周波数をフィルタ処理して取り除くために、1つ以上のコムフィルタを含むことができる。1つ以上の周波数は、例えば、環境効果を模倣するためにフィルタ処理して取り除かれることができる。いくつかの実施形態では、リバーブレータは、1つ以上のオールパスフィルタを含むことができる。各オールパスフィルタは、コムフィルタから信号を受信することができ、その大きさを変化させることなく、その入力信号を通過させるように構成されることができるが、信号の位相を変化させることができる。
【0008】
いくつかの実施形態では、RIGは、RG値を入力信号に適用するように構成される、反響利得(RG)を含むことができる。いくつかの実施形態では、RIGは、RE補正係数をRGからの信号に適用するように構成される、RECを含むことができる。
本発明は、例えば、以下を提供する。
(項目1)
オーディオ信号をレンダリングするための方法であって、前記方法は、
入力信号を受信することであって、前記入力信号は、第1の部分と、第2の部分とを含む、ことと、
反響処理システムを使用することにより
反響初期利得(RIG)値を前記入力信号の第1の部分に適用することと、
反響初期パワー(RIP)補正係数を前記入力信号の第1の部分に適用することであって、前記RIP補正係数は、前記RIG値が、適用された後に適用される、ことと、
前記入力信号の第1の部分内に反響効果を導入することと
を行うことと、
直接処理システムを使用することにより、
遅延を前記入力信号の第2の部分の中に導入することと、
利得を前記入力信号の第2の部分に適用することと
を行うことと、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、前記オーディオ信号である、ことと
を含む、方法。
(項目2)
前記RIP補正係数を計算することであって、前記RIP補正係数は、RIP補正器によって、計算され、前記入力信号の第1の部分に適用される、こと
をさらに含み、前記RIP補正係数は、前記RIP補正器から出力される信号が、1.0に正規化されるように計算される、項目1に記載の方法。
(項目3)
前記RIP補正係数は、リバーブレータトポロジ、遅延ユニットの数および持続時間、接続利得、およびフィルタパラメータのうちの1つ以上のものに依存する、項目1に記載の方法。
(項目4)
前記RIP補正係数は、反響インパルス応答のRMSパワーに等しい、項目1に記載の方法。
(項目5)
前記入力信号の第1の部分内の前記反響効果の導入は、1つ以上の周波数をフィルタ処理して取り除くことを含む、項目1に記載の方法。
(項目6)
前記反響効果の導入は、前記入力信号の第1の部分の位相を変化させることを含む、項目1に記載の方法。
(項目7)
前記反響効果の導入は、リバーブレータトポロジを選択し、内部リバーブレータパラメータを設定することを含む、項目1に記載の方法。
(項目8)
前記RIG値は、1.0に等しく、前記方法はさらに、前記反響処理システムのRIPが、1.0に等しいように、前記RIP補正係数を計算することを含む、項目1に記載の方法。
(項目9)
反響時間を無限大に設定することと、
リバーブレータインパルス応答を記録することと、
反響RMS振幅を測定することと
によって、前記RIP補正係数を計算すること
をさらに含み、
前記RIP補正係数は、前記反響RMS振幅の逆数に関連する、項目1に記載の方法。
(項目10)
反響時間を有限値に設定することと、
リバーブレータインパルス応答を記録することと、
反響RMS振幅消滅曲線を導出することと、
放出の時間におけるRMS振幅を決定することと
によって、前記RIP補正係数を計算すること
をさらに含み、
前記RIP補正係数は、前記反響RMS振幅の逆数に関連する、項目1に記載の方法。
(項目11)
前記RIG値の適用は、
反響利得(RG)値を前記入力信号の第1の部分に適用することと、
反響エネルギー(RE)補正係数を前記入力信号の第1の部分に適用することであって、前記RE補正係数は、前記RG値が、適用された後に適用される、ことと
を含む、項目1に記載の方法。
(項目12)
前記RE補正係数を計算することであって、前記RE補正係数は、RE補正器によって、計算され、前記入力信号の第1の部分に適用される、こと
をさらに含み、前記RE補正器は、前記RE補正から出力される信号が、1.0に正規化されるように計算される、項目11に記載の方法。
(項目13)
前記RIG値を計算することであって、前記RIG値は、前記RG値を前記RE補正係数で乗算したものに等しい、こと
をさらに含む、項目11に記載の方法。
(項目14)
前記反響効果は、前記RIP補正係数が、適用された後に導入される、項目1に記載の方法。
(項目15)
システムであって、
オーディオ信号をユーザに提供するように構成されるウェアラブル頭部デバイスと、
前記オーディオ信号をレンダリングするように構成される回路であって、前記回路は、
反響処理システムであって、
RIG値を入力信号の第1の部分に適用するように構成される反響初期利得(RIG)と、
RIP補正係数を前記RIGからの信号に適用するように構成される反響初期パワー(RIP)補正器と
を含む、反響処理システムと、
前記RIP補正器からの信号内に反響効果を導入するように構成されるリバーブレータと、
直接処理システムであって、
前記入力信号の第2の部分内に遅延を導入するように構成される伝搬遅延と、
利得を前記入力信号の第2の部分に適用するように構成される直接利得と
を含む、直接処理システムと、
コンバイナであって、
前記反響処理システムからの前記入力信号の第1の部分および前記直接処理システムからの前記入力信号の第2の部分を組み合わせることと、
前記入力信号の組み合わせられた第1および第2の部分を出力信号として出力することであって、前記出力信号は、前記オーディオ信号である、ことと
を行うように構成される、コンバイナと
を含む、回路と
を備える、システム。
(項目16)
前記リバーブレータは、前記RIP補正器からの前記信号内の1つ以上の周波数をフィルタ処理して取り除くように構成される複数のコムフィルタを含む、項目15に記載のシステム。
(項目17)
前記リバーブレータは、前記複数のコムフィルタからの信号の位相を変化させるように構成される複数のオールパスフィルタを含む、項目16に記載のシステム。
(項目18)
前記RIGは、RG値を前記入力信号の第1の部分に適用するように構成される反響利得(RG)を含む、項目15に記載のシステム。
(項目19)
前記RIGはさらに、RE補正係数を前記RGからの信号に適用するように構成される反響エネルギー(RE)補正器を含む、項目18に記載のシステム。
【図面の簡単な説明】
【0009】
【
図1】
図1は、いくつかの実施形態による、例示的ウェアラブルシステムを図示する。
【0010】
【
図2】
図2は、いくつかの実施形態による、例示的ウェアラブルシステムと併用され得る例示的ハンドヘルドコントローラを図示する。
【0011】
【
図3】
図3は、いくつかの実施形態による、例示的ウェアラブルシステムと併用され得る例示的補助ユニットを図示する。
【0012】
【
図4】
図4は、いくつかの実施形態による、例示的ウェアラブルシステムに関する例示的機能ブロック図を図示する。
【0013】
【
図5A】
図5Aは、いくつかの実施形態による、例示的オーディオレンダリングシステムのブロック図を図示する。
【0014】
【
図5B】
図5Bは、いくつかの実施形態による、
図5Aのオーディオレンダリングシステムを動作させるための例示的プロセスのフローを図示する。
【0015】
【
図6】
図6は、いくつかの実施形態による、反響時間が無限大に設定されるときの、例示的反響RMS振幅のプロットを図示する。
【0016】
【
図7】
図7は、いくつかの実施形態による、実質的に、反響開始時間の後に指数関数的消滅を辿る、例示的RMSパワーのプロットを図示する。
【0017】
【
図8】
図8は、いくつかの実施形態による、
図5のリバーブレータからの例示的出力信号を図示する。
【0018】
【
図9】
図9は、いくつかの実施例による、コムフィルタのみを含む、例示的リバーブレータに関するインパルス応答の振幅を図示する。
【0019】
【
図10】
図10は、本開示の実施例による、オールパスフィルタステージを含む、例示的リバーブレータに関するインパルス応答の振幅を図示する。
【0020】
【
図11A】
図11Aは、いくつかの実施形態による、コムフィルタを含むリバーブレータを有する、例示的反響処理システムを図示する。
【0021】
【
図11B】
図11Bは、いくつかの実施形態による、
図11Aの反響処理システムを動作させるための例示的プロセスのフローを図示する。
【0022】
【
図12A】
図12Aは、複数のオールパスフィルタを含むリバーブレータを有する、例示的反響処理システムを図示する。
【0023】
【
図12B】
図12Bは、いくつかの実施形態による、
図12Aの反響処理システムを動作させるための例示的プロセスのフローを図示する。
【0024】
【
図13】
図13は、いくつかの実施形態による、
図12の反響処理システムのインパルス応答を図示する。
【0025】
【
図14】
図14は、いくつかの実施形態による、反響処理システム510を通した信号入力および出力を図示する。
【0026】
【
図15】
図15は、いくつかの実施形態による、フィードバック行列を備える、例示的FDNのブロック図を図示する。
【0027】
【
図16】
図16は、いくつかの実施形態による、複数のオールパスフィルタを備える、例示的FDNのブロック図を図示する。
【0028】
【
図17A】
図17Aは、いくつかの実施形態による、RECを含む、例示的反響処理システムのブロック図を図示する。
【0029】
【
図17B】
図17Bは、いくつかの実施形態による、
図17Aの反響処理システムを動作させるための例示的プロセスのフローを図示する。
【0030】
【
図18A】
図18Aは、いくつかの実施形態による、仮想聴者と併置される仮想音源に関する経時的な例示的な計算されたREを図示する。
【0031】
【
図18B】
図18Bは、いくつかの実施形態による、瞬間的反響開始を伴う例示的な計算されたREを図示する。
【0032】
【
図19】
図19は、いくつかの実施形態による、例示的反響処理システムのフローを図示する。
【発明を実施するための形態】
【0033】
実施例の以下の説明では、本明細書の一部を形成し、例証として、実践され得る具体的実施例が示される、付随の図面が、参照される。他の実施例も、使用され得、構造変更が、開示される実施例の範囲から逸脱することなく、行われ得ることを理解されたい。
【0034】
例示的ウェアラブルシステム
【0035】
図1は、ユーザの頭部上に装着されるように構成される、例示的ウェアラブル頭部デバイス100を図示する。ウェアラブル頭部デバイス100は、頭部デバイス(例えば、ウェアラブル頭部デバイス100)、ハンドヘルドコントローラ(例えば、下記に説明されるハンドヘルドコントローラ200)、および/または補助ユニット(例えば、下記に説明される補助ユニット300)等の1つ以上のコンポーネントを備える、より広範なウェアラブルシステムの一部であってもよい。いくつかの実施例では、ウェアラブル頭部デバイス100は、仮想現実、拡張現実、または複合現実システムまたは用途のために使用されることができる。ウェアラブル頭部デバイス100は、ディスプレイ110Aおよび110B(左および右透過性ディスプレイと、直交瞳拡大(OPE)格子セット112A/112Bおよび射出瞳拡大(EPE)格子セット114A/114B等、ディスプレイからユーザの眼に光を結合するための関連付けられるコンポーネントとを備え得る)等の1つ以上のディスプレイと、スピーカ120Aおよび120B(それぞれ、つるアーム122Aおよび122B上に搭載され、ユーザの左および右耳に隣接して位置付けられ得る)等の左および右音響構造と、赤外線センサ、加速度計、GPSユニット、慣性測定ユニット(IMU)(例えば、IMU126)、音響センサ(例えば、マイクロホン150)等の1つ以上のセンサと、直交コイル電磁受信機(例えば、左つるアーム122Aに搭載されるように示される受信機127)と、ユーザから離れるように配向される、左および右カメラ(例えば、深度(飛行時間)カメラ130Aおよび130B)と、ユーザに向かって配向される、左および右眼カメラ(例えば、ユーザの眼移動を検出するため)(例えば、眼カメラ128および128B)とを備えることができる。しかしながら、ウェアラブル頭部デバイス100は、本発明の範囲から逸脱することなく、任意の好適なディスプレイ技術およびセンサまたは他のコンポーネントの任意の好適な数、タイプ、または組み合わせを組み込むことができる。いくつかの実施例では、ウェアラブル頭部デバイス100は、ユーザの音声によって発生されるオーディオ信号を検出するように構成される、1つ以上のマイクロホン150を組み込んでよく、そのようなマイクロホンは、ユーザの口に隣接してウェアラブル頭部デバイス内に位置付けられてもよい。いくつかの実施例では、ウェアラブル頭部デバイス100は、他のウェアラブルシステムを含む、他のデバイスおよびシステムと通信するために、ネットワーキング特徴(例えば、Wi-Fi能力)を組み込んでもよい。ウェアラブル頭部デバイス100はさらに、バッテリ、プロセッサ、メモリ、記憶ユニット、または種々の入力デバイス(例えば、ボタン、タッチパッド)等のコンポーネントを含んでもよい、または1つ以上のそのようなコンポーネントを備えるハンドヘルドコントローラ(例えば、ハンドヘルドコントローラ200)または補助ユニット(例えば、補助ユニット300)に結合されてもよい。いくつかの実施例では、センサは、ユーザの環境に対する頭部搭載型ユニットの座標のセットを出力するように構成されてもよく、入力をプロセッサに提供し、同時位置特定およびマッピング(SLAM)プロシージャおよび/またはビジュアルオドメトリアルゴリズムを実施してもよい。いくつかの実施例では、ウェアラブル頭部デバイス100は、下記にさらに説明されるように、ハンドヘルドコントローラ200および/または補助ユニット300に結合されてもよい。
【0036】
図2は、例示的ウェアラブルシステムの例示的モバイルハンドヘルドコントローラコンポーネント200を図示する。いくつかの実施例では、ハンドヘルドコントローラ200は、ウェアラブルヘッドデバイス100および/または下記に説明される補助ユニット300と有線または無線通信してもよい。いくつかの実施例では、ハンドヘルドコントローラ200は、ユーザによって保持されるべきハンドル部分220と、上面210に沿って配置される1つ以上のボタン240とを含む。いくつかの実施例では、ハンドヘルドコントローラ200は、光学追跡標的として使用するために構成されてもよく、例えば、ウェアラブル頭部デバイス100のセンサ(例えば、カメラまたは他の光学センサ)は、ハンドヘルドコントローラ200の位置および/または配向を検出するように構成されることができ、これは、転じて、ハンドヘルドコントローラ200を保持するユーザの手の位置および/または配向を示し得る。いくつかの実施例では、ハンドヘルドコントローラ200は、プロセッサ、メモリ、記憶ユニット、ディスプレイ、または上記に説明されるもの等の1つ以上の入力デバイスを含んでもよい。いくつかの実施例では、ハンドヘルドコントローラ200は、1つ以上のセンサ(例えば、ウェアラブル頭部デバイス100に関して上記に説明されるセンサまたは追跡コンポーネントのうちのいずれか)を含む。いくつかの実施例では、センサは、ウェアラブル頭部デバイス100に対する、またはウェアラブルシステムの別のコンポーネントに対するハンドヘルドコントローラ200の位置または配向を検出することができる。いくつかの実施例では、センサは、ハンドヘルドコントローラ200のハンドル部分220内に位置付けられてもよい、および/またはハンドヘルドコントローラに機械的に結合されてもよい。ハンドヘルドコントローラ200は、例えば、ボタン240の押下状態、またはハンドヘルドコントローラ200の位置、配向、および/または運動(例えば、IMUを介して)に対応する、1つ以上の出力信号を提供するように構成されることができる。そのような出力信号は、ウェアラブル頭部デバイス100のプロセッサへの、補助ユニット300への、またはウェアラブルシステムの別のコンポーネントへの入力として使用されてもよい。いくつかの実施例では、ハンドヘルドコントローラ200は、音(例えば、ユーザの発話、環境音)を検出し、ある場合には、検出された音に対応する信号をプロセッサ(例えば、ウェアラブル頭部デバイス100のプロセッサ)に提供するために、1つ以上のマイクロホンを含むことができる。
【0037】
図3は、例示的ウェアラブルシステムの例示的補助ユニット300を図示する。いくつかの実施例では、補助ユニット300は、ウェアラブル頭部デバイス100および/またはハンドヘルドコントローラ200と有線または無線通信してもよい。補助ユニット300は、ウェアラブル頭部デバイス100および/またはハンドヘルドコントローラ200(ディスプレイ、センサ、音響構造、プロセッサ、マイクロホン、および/またはウェアラブル頭部デバイス100またはハンドヘルドコントローラ200の他のコンポーネントを含む)等のウェアラブルシステムの1つ以上のコンポーネントを動作させるためのエネルギーを提供するために、バッテリを含むことができる。いくつかの実施例では、補助ユニット300は、プロセッサ、メモリ、記憶ユニット、ディスプレイ、1つ以上の入力デバイス、および/または上記に説明されるもの等の1つ以上のセンサを含んでもよい。いくつかの実施例では、補助ユニット300は、補助ユニットをユーザに取り付けるためのクリップ310(例えば、ユーザによって装着されるベルト)を含む。ウェアラブルシステムの1つ以上のコンポーネントを格納するために補助ユニット300を使用する利点は、そのように行うことが、大きいまたは重いコンポーネントが、(例えば、ウェアラブル頭部デバイス100内に格納される場合)ユーザの頭部に搭載される、または(例えば、ハンドヘルドコントローラ200内に格納される場合)ユーザの手によって担持されるのではなく、大きく重い物体を支持するために比較的に良好に適しているユーザの腰部、胸部、または背部の上に担持されることを可能にし得ることである。これは、バッテリ等の比較的に重いまたは嵩張るコンポーネントに関して特に有利であり得る。
【0038】
図4は、上記に説明される、例示的ウェアラブル頭部デバイス100と、ハンドヘルドコントローラ200と、補助ユニット300とを含み得る等、例示的ウェアラブルシステム400に対応し得る、例示的機能ブロック図を示す。いくつかの実施例では、ウェアラブルシステム400は、仮想現実、拡張現実、または複合現実用途のために使用され得る。
図4に示されるように、ウェアラブルシステム400は、ここでは「トーテム」と称される(および上記に説明されるハンドヘルドコントローラ200に対応し得る)例示的ハンドヘルドコントローラ400Bを含むことができ、ハンドヘルドコントローラ400Bは、トーテム/ヘッドギヤ6自由度(6DOF)トーテムサブシステム404Aを含むことができる。ウェアラブルシステム400はまた、(上記に説明されるウェアラブルヘッドギヤデバイス100に対応し得る)例示的ウェアラブル頭部デバイス400Aを含むことができ、ウェアラブル頭部デバイス400Aは、トーテム/ヘッドギヤ6DOFヘッドギヤサブシステム404Bを含む。実施例では、6DOFトーテムサブシステム404Aおよび6DOFヘッドギヤサブシステム404Bは、協働し、ウェアラブル頭部デバイス400Aに対するハンドヘルドコントローラ400Bの6つの座標(例えば、3つの平行移動方向におけるオフセットおよび3つの軸に沿った回転)を決定する。6自由度は、ウェアラブル頭部デバイス400Aの座標系に対して表されてもよい。3つの平行移動オフセットは、そのような座標系内におけるX、Y、およびZオフセット、平行移動行列、またはある他の表現として表されてもよい。回転自由度は、ヨー、ピッチ、およびロール回転のシーケンス、ベクトル、回転行列、四元数、またはある他の表現として表されてもよい。いくつかの実施例では、ウェアラブル頭部デバイス400A内に含まれる1つ以上の深度カメラ444(および/または1つ以上の非深度カメラ)および/または1つ以上の光学標的(例えば、上記に説明されるようなハンドヘルドコントローラ200のボタン240またはハンドヘルドコントローラ内に含まれる専用光学標的)は、6DOF追跡のために使用されることができる。いくつかの実施例では、ハンドヘルドコントローラ400Bは、上記に説明されるようなカメラを含むことができ、ヘッドギヤ400Aは、カメラと併せた光学追跡のための光学標的を含むことができる。いくつかの実施例では、ウェアラブル頭部デバイス400Aおよびハンドヘルドコントローラ400Bは、それぞれ、3つの直交して配向されるソレノイドのセットを含み、これは、3つの区別可能な信号を無線で送信および受信するために使用される。受信するために使用される、コイルのそれぞれの中で受信される3つの区別可能な信号の相対的大きさを測定することによって、ウェアラブル頭部デバイス400Aに対するハンドヘルドコントローラ400Bの6DOFが、決定されてもよい。いくつかの実施例では、6DOFトーテムサブシステム404Aは、改良された正確度および/またはハンドヘルドコントローラ400Bの高速移動に関するよりタイムリーな情報を提供するために有用である、慣性測定ユニット(IMU)を含むことができる。
【0039】
拡張現実または複合現実用途を伴ういくつかの実施例では、座標をローカル座標空間(例えば、ウェアラブル頭部デバイス400Aに対して固定される座標空間)から慣性座標空間に、または環境座標空間に変換することが、望ましくあり得る。例えば、そのような変換は、ウェアラブル頭部デバイス400Aのディスプレイが、ディスプレイ上の固定位置および配向において(例えば、ウェアラブル頭部デバイス400Aのディスプレイにおける同一の位置において)ではなく、仮想オブジェクトを実環境に対する予期される位置および配向において提示する(例えば、ウェアラブル頭部デバイス400Aの位置および配向にかかわらず、前方に向いた実椅子に着座している仮想人物)ために必要であり得る。これは、仮想オブジェクトが、実環境内に存在する(かつ、例えば、ウェアラブル頭部デバイス400Aが、偏移および回転するにつれて、実環境内に不自然に位置付けられて現れない)という錯覚を維持することができる。いくつかの実施例では、座標空間の間の補償変換が、慣性または環境座標系に対するウェアラブル頭部デバイス400Aの変換を決定するために、(例えば、同時位置特定およびマッピング(SLAM)および/またはビジュアルオドメトリプロシージャを使用して)深度カメラ444からの画像を処理することによって決定されることができる。
図4に示される実施例では、深度カメラ444は、SLAM/ビジュアルオドメトリブロック406に結合されることができ、画像をブロック406に提供することができる。SLAM/ビジュアルオドメトリブロック406実装は、本画像を処理し、次いで、頭部座標空間と実座標空間との間の変換を識別するために使用され得る、ユーザの頭部の位置および配向を決定するように構成される、プロセッサを含むことができる。同様に、いくつかの実施例では、ユーザの頭部姿勢および場所に関する情報の付加的源が、ウェアラブル頭部デバイス400AのIMU409から取得される。IMU409からの情報は、SLAM/ビジュアルオドメトリブロック406からの情報と統合され、改良された正確度および/またはユーザの頭部姿勢および位置の高速調節に関するよりタイムリーな情報を提供することができる。
【0040】
いくつかの実施例では、深度カメラ444は、ウェアラブル頭部デバイス400Aのプロセッサ内に実装され得る、手のジェスチャトラッカ411に、3D画像を供給することができる。手のジェスチャトラッカ411は、例えば、深度カメラ444から受信された3D画像を手のジェスチャを表す記憶されたパターンに合致させることによって、ユーザの手のジェスチャを識別することができる。ユーザの手のジェスチャを識別する他の好適な技法も、明白となるであろう。
【0041】
いくつかの実施例では、1つ以上のプロセッサ416は、ヘッドギヤサブシステム404B、IMU409、SLAM/ビジュアルオドメトリブロック406、深度カメラ444、マイクロホン(図示せず)、および/または手のジェスチャトラッカ411からのデータを受信するように構成されてもよい。プロセッサ416はまた、制御信号を6DOFトーテムシステム404Aに送信し、それから受信することができる。プロセッサ416は、ハンドヘルドコントローラ400Bがテザリングされない実施例等では、無線で、6DOFトーテムシステム404Aに結合されてもよい。プロセッサ416はさらに、視聴覚コンテンツメモリ418、グラフィカル処理ユニット(GPU)420、および/またはデジタル信号プロセッサ(DSP)オーディオ空間化装置422等の付加的コンポーネントと通信してもよい。DSPオーディオ空間化装置422は、頭部関連伝達関数(HRTF)メモリ425に結合されてもよい。GPU420は、画像毎に変調された光の左源424に結合される、左チャネル出力と、画像毎に変調された光の右源426に結合される、右チャネル出力とを含むことができる。GPU420は、立体視画像データを画像毎に変調された光の源424、426に出力することができる。DSPオーディオ空間化装置422は、オーディオを左スピーカ412および/または右スピーカ414に出力することができる。DSPオーディオ空間化装置422は、プロセッサ416から、ユーザから仮想音源(例えば、ハンドヘルドコントローラ400Bを介して、ユーザによって移動され得る)への方向ベクトルを示す入力を受信することができる。方向ベクトルに基づいて、DSPオーディオ空間化装置422は、対応するHRTFを決定することができる(例えば、HRTFにアクセスすることによって、または複数のHRTFを補間することによって)。DSPオーディオ空間化装置422は、次いで、決定されたHRTFを仮想オブジェクトによって発生された仮想音に対応するオーディオ信号等のオーディオ信号に適用することができる。これは、複合現実環境内の仮想音に対するユーザの相対的位置および配向を組み込むことによって、すなわち、その仮想音が、実環境内の実音である場合に聞こえるであろうもののユーザの予期に合致する仮想音を提示することによって、仮想音の信憑性および現実性を向上させることができる。
【0042】
図4に示されるもの等のいくつかの実施例では、プロセッサ416、GPU420、DSPオーディオ空間化装置422、HRTFメモリ425、およびオーディオ/視覚的コンテンツメモリ418のうちの1つ以上のものは、補助ユニット400C(上記に説明される補助ユニット320に対応し得る)内に含まれてもよい。補助ユニット400Cは、バッテリ427を含み、そのコンポーネントを給電する、および/またはパワーをウェアラブル頭部デバイス400Aおよび/またはハンドヘルドコントローラ400Bに供給してもよい。そのようなコンポーネントを、ユーザの腰部に搭載され得る、補助ユニット内に含むことは、ウェアラブル頭部デバイス400Aのサイズおよび重量を限定することができ、これは、ひいては、ユーザの頭部および頸部の疲労を低減させることができる。
【0043】
図4は、例示的ウェアラブルシステム400の種々のコンポーネントに対応する要素を提示するが、これらのコンポーネントの種々の他の好適な配列も、当業者に明白となるであろう。例えば、補助ユニット400Cと関連付けられているような
図4に提示される要素は、代わりに、ウェアラブル頭部デバイス400Aまたはハンドヘルドコントローラ400Bと関連付けられ得る。さらに、いくつかのウェアラブルシステムは、ハンドヘルドコントローラ400Bまたは補助ユニット400Cを完全に無くしてもよい。そのような変更および修正は、開示される実施例の範囲内に含まれるものとして理解されるものである。
【0044】
複合現実環境
【0045】
全ての人々のように、複合現実システムのユーザは、実環境、すなわち、ユーザによって知覚可能である、「実世界」の3次元部分およびその内容全ての中に存在している。例えば、ユーザは、その通常の人間感覚、すなわち、視覚、聴覚、触覚、味覚、嗅覚を使用して実環境を知覚し、実環境内でその自身の身体を移動させることによって実環境と相互作用する。実環境内の場所は、座標空間内の座標として説明されることができ、例えば、座標は、緯度、経度、および海面に対する高度、基準点からの3つの直交する次元における距離、または他の好適な値を含むことができる。同様に、ベクトルは、座標空間内の方向および大きさを有する量を説明することができる。
【0046】
コンピューティングデバイスは、例えば、本デバイスと関連付けられるメモリ内で、仮想環境の表現を維持することができる。本明細書に使用されるように、仮想環境は、3次元空間のコンピュータ表現である。仮想環境は、任意のオブジェクト、アクション、信号、パラメータ、座標、ベクトル、またはその空間と関連付けられる他の特性の表現を含むことができる。いくつかの実施例では、コンピューティングデバイスの回路(例えば、プロセッサ)は、仮想環境の状態を維持および更新することができ、すなわち、プロセッサは、第1の時間に、仮想環境と関連付けられるデータおよび/またはユーザによって提供される入力に基づいて、第2の時間における仮想環境の状態を決定することができる。例えば、仮想環境内のオブジェクトが、ある時間に第1の座標に位置し、あるプログラムされた物理的パラメータ(例えば、質量、摩擦係数)を有し、ユーザから受信された入力が、力が、ある方向ベクトルにおいてオブジェクトに印加されるべきであると示す場合、プロセッサは、運動学の法則を適用し、基本的力学を使用してその時間におけるオブジェクトの場所を決定することができる。プロセッサは、仮想環境についての既知の任意の好適な情報および/または任意の好適な入力を使用し、ある時間における仮想環境の状態を決定することができる。仮想環境の状態を維持および更新する際、プロセッサは、仮想環境内の仮想オブジェクトの作成および削除に関連するソフトウェア、仮想環境内の仮想オブジェクトまたはキャラクタの挙動を定義するためのソフトウェア(例えば、スクリプト)、仮想環境内の信号(例えば、オーディオ信号)の挙動を定義するためのソフトウェア、仮想環境と関連付けられるパラメータを作成および更新するためのソフトウェア、仮想環境内のオーディオ信号を発生させるためのソフトウェア、入力および出力を取り扱うためのソフトウェア、ネットワーク動作を実装するためのソフトウェア、アセットデータ(例えば、経時的に仮想オブジェクトを移動させるためのアニメーションデータ)を適用するためのソフトウェア、または多くの他の可能性を含む、任意の好適なソフトウェアを実行することができる。
【0047】
ディスプレイまたはスピーカ等の出力デバイスは、仮想環境の任意または全ての側面をユーザに提示することができる。例えば、仮想環境は、ユーザに提示され得る仮想オブジェクト(無生物オブジェクト、人物、動物、光等の表現を含み得る)を含んでもよい。プロセッサは、仮想環境のビュー(例えば、原点座標、視軸、および錐台を伴う「カメラ」に対応する)を決定し、ディスプレイに、そのビューに対応する仮想環境の視認可能な場面をレンダリングすることができる。任意の好適なレンダリング技術が、本目的のために使用されてもよい。いくつかの実施例では、視認可能な場面は、仮想環境内のいくつかの仮想オブジェクトのみを含み、ある他の仮想オブジェクトを除外してもよい。同様に、仮想環境は、1つ以上のオーディオ信号としてユーザに提示され得るオーディオ側面を含んでもよい。例えば、仮想環境内の仮想オブジェクトが、オブジェクトの場所座標から生じる音を発生させてもよい(例えば、仮想キャラクタが、発話する、または効果音を引き起こしてもよい)、または仮想環境は、特定の場所と関連付けられる場合とそうではない場合がある音楽的キューまたは周囲音と関連付けられてもよい。プロセッサが、「聴者」座標に対応するオーディオ信号、例えば、仮想環境内の音の複合物に対応し、聴者座標における聴者に聞こえるであろうオーディオ信号をシミュレートするために混合および処理されるオーディオ信号を決定し、1つ以上のスピーカを介してユーザにオーディオ信号を提示することができる。
【0048】
仮想環境は、コンピュータ構造としてのみ存在するため、ユーザは、その通常の感覚を使用して仮想環境を直接知覚することができない。代わりに、ユーザは、例えば、ディスプレイ、スピーカ、触覚出力デバイス等によって、ユーザに提示されるような仮想環境を間接的にのみ知覚することができる。同様に、ユーザは、仮想環境に直接触れる、それを操作する、または別様にそれと相互作用することができないが、入力デバイスまたはセンサを介して、仮想環境を更新するためにデバイスまたはセンサデータを使用し得るプロセッサに入力データを提供することができる。例えば、カメラセンサは、ユーザが仮想環境内のオブジェクトを移動させようとしていることを示す光学データを提供することができ、プロセッサは、そのデータを使用し、オブジェクトに仮想環境内でそれに応じて応答させることができる。
【0049】
反響アルゴリズムおよびリバーブレータ
【0050】
いくつかの実施形態では、デジタルリバーブレータが、フィードバックを伴う遅延ネットワークに基づいて設計されてもよい。そのような実施形態では、リバーブレータアルゴリズム設計ガイドラインが、正確なパラメトリック消滅時間制御のために、かつ消滅時間が、変動されるとき、反響音量を維持するために含まれてもよい/利用可能であってもよい。反響音量の相対的調節は、デジタルリバーブレータとカスケードする調節可能信号振幅利得を提供することによって実現されてもよい。本アプローチは、サウンドデザイナまたはレコーディングエンジニアが、所望の効果を達成するために、リバーブレータ出力信号を可聴的に監視しながら、独立して反響消滅時間および反響音量を調整することを可能にし得る。
【0051】
ビデオゲームまたはVR/AR/MRのための双方向オーディオエンジン等のプログラム的アプリケーションは、部屋/環境(例えば、仮想部屋/環境)内の聴者(例えば、仮想聴者)の周囲の種々の位置および距離における複数の移動する音源をシミュレートし得、相対的反響音量制御は、十分ではない場合がある。いくつかの実施形態では、レンダリング時に各仮想音源から体験され得る、絶対的反響音量が、適用される。例えば、聴者および音源位置、および、例えば、リバーブレータによってシミュレートされる部屋/環境の音響性質等の多くの因子が、本値を調節し得る。双方向オーディオアプリケーションにおいて等のいくつかの実施形態では、例えば、Jean-Marc Jot、Laurent Cerveau、およびOlivier Warusfelによる「Analysis and synthesis of room reverberation based on a statistical time-frequency model」に定義されるように、反響初期パワー(RIP)をプログラム的に制御することが、望ましい。RIPは、仮想聴者または仮想音源の位置にかかわらず、仮想部屋を特性評価するために使用されてもよい。
【0052】
いくつかの実施形態では、反響アルゴリズム(リバーブレータによって実行される)が、具体的部屋の音響反響性質に知覚的に合致するように構成されてもよい。例示的音響反響性質は、限定ではないが、反響初期パワー(RIP)および反響消滅時間(T60)を含むことができる。いくつかの実施形態では、部屋の音響反響性質は、実部屋内で測定される、実部屋または仮想部屋の幾何学的および/または物理的記述に基づくコンピュータシミュレーションによって計算される、または同等物であってもよい。
【0053】
例示的オーディオレンダリングシステム
【0054】
図5Aは、いくつかの実施形態による、例示的オーディオレンダリングシステムのブロック図を図示する。
図5Bは、いくつかの実施形態による、
図5Aのオーディオレンダリングシステムを動作させるための例示的プロセスのフローを図示する。
【0055】
オーディオレンダリングシステム500は、反響処理システム510Aと、直接処理システム530と、コンバイナ540とを含むことができる。反響処理システム510Aおよび直接処理システム530は両方とも、入力信号501を受信することができる。
【0056】
反響処理システム510Aは、RIP制御システム512と、リバーブレータ514とを含むことができる。RIP制御システム512は、入力信号501を受信することができ、信号をリバーブレータ514に出力することができる。RIP制御システム512は、反響初期利得(RIG)516と、RIP補正器518とを含むことができる。RIG516は、入力信号501の第1の部分を受信することができ、信号をRIP補正器518に出力することができる。RIG516は、RIG値を入力信号501に適用するように構成されることができる(プロセス550のステップ552)。RIG値を設定するステップは、反響処理システム510Aの出力信号内のRIPの絶対量を規定する効果を及ぼすことができる。
【0057】
RIP補正器518は、RIG516から信号を受信することができ、RIP補正係数を計算し、(RIG516からの)その入力信号に適用するように構成されることができる(ステップ554)。RIP補正器518は、信号をリバーブレータ514に出力することができる。リバーブレータ514は、RIP補正器518から信号を受信することができ、信号内に反響効果を導入するように構成されることができる(ステップ556)。反響効果は、例えば、仮想環境に基づくことができる。リバーブレータ514は、下記により詳細に議論される。
【0058】
直接処理システム530は、伝搬遅延532と、直接利得534とを含むことができる。直接処理システム530および伝搬遅延532は、入力信号501の第2の部分を受信することができる。伝搬遅延532は、入力信号501内に遅延を導入するように構成されることができ(ステップ558)、遅延された信号を直接利得534に出力することができる。直接利得534は、伝搬遅延532から信号を受信することができ、利得を信号に適用するように構成されることができる(ステップ560)。
【0059】
コンバイナ540は、反響処理システム510Aおよび直接処理システム530の両方から出力信号を受信することができ、信号を組み合わせる(例えば、追加する、集約する等)ように構成されることができる(ステップ562)。コンバイナ540からの出力は、オーディオレンダリングシステム500の出力信号540であり得る。
【0060】
例示的反響初期パワー(RIP)正規化
【0061】
反響処理システム510Aでは、RIG516およびRIP補正器518は両方とも、直列に適用されると、RIP補正器518から出力される信号が、所定の値(例えば、ユニティ(1.0))に正規化され得るように、それぞれ、RIG値およびRIP補正係数を適用(および/または計算)することができる。すなわち、出力信号のRIG値は、RIP補正器518と直列にRIG516を適用することによって制御されることができる。いくつかの実施形態では、RIP補正係数は、RIG値の直後に適用されることができる。RIP正規化プロセスは、下記により詳細に議論される。
【0062】
いくつかの実施形態では、拡散反響テールを生成するために、反響アルゴリズムは、例えば、並列コムフィルタを含み、一連のオールパスフィルタが続いてもよい。いくつかの実施形態では、デジタルリバーブレータは、信号利得スケーリングまたはフィルタユニットもまた含み得る、フィードバックおよび/またはフィードフォワード経路と相互接続される1つ以上の遅延ユニットを含む、ネットワークとして構築されてもよい。
図5Aの反響処理システム510A等の反響処理システムのRIP補正係数は、例えば、リバーブレータトポロジ、ネットワーク内に含まれる遅延ユニットの数および持続時間、接続利得、およびフィルタパラメータ等の1つ以上のパラメータに依存してもよい。
【0063】
いくつかの実施形態では、反響処理システムのRIP補正係数は、反響時間が、無限大に設定されるとき、反響システムのインパルス応答の二乗平均平方根(RMS)パワーに等しくあり得る。いくつかの実施形態では、例えば、
図6に図示されるように、リバーブレータの反響時間が、無限大に設定されるとき、リバーブレータのインパルス応答は、時間に対して一定のRMS振幅を有する、非消滅雑音様信号であり得る。
【0064】
サンプルにおいて表される、時間tにおけるデジタル信号{x}のRMSパワーP
rms(t)は、二乗された信号振幅のアベレージに等しくあり得る。いくつかの実施形態では、RMSパワーは、以下のように表されてもよい。
【化1】
式中、tは、時間であり、Nは、連続的信号サンプルの数であり、nは、信号サンプルである。アベレージは、時間tにおいて始まり、N個の連続的信号サンプルを含有する信号窓にわたって評価され得る。
【0065】
RMS振幅は、RMSパワーP
rms(t)の平方根に等しくあり得る。いくつかの実施形態では、RMS振幅は、以下のように表されてもよい。
【化2】
【0066】
いくつかの実施形態では、リバーブレータのインパルス応答(
図6に図示されるような)では、RIP補正係数は、反響消滅時間が、無限大に設定される、反響開始に続く一定パワー信号の予期されるRMSパワーとして導出されてもよい。
図8は、
図5Aのオーディオレンダリングシステム500の中に振幅1.0の単一のインパルスを投入することからの例示的出力信号を図示する。そのようなインスタンスでは、反響消滅時間は、無限大に設定され、直接信号出力は、1.0に設定され、直接信号出力は、源から聴者への伝搬遅延によって遅延される。
【0067】
いくつかの実施形態では、反響処理システム510Aの反響時間は、有限値に設定されてもよい。有限値を用いると、RMSパワーは、
図7に示されるように、実質的に、(反響開始時間後に)指数関数的消滅を辿り得る。反響処理システム510Aの反響時間(T60)は、概して、それにわたってRMSパワー(または振幅)が60dBだけ消滅する持続時間として定義されてもよい。RIP補正係数は、時間t=0に外挿されるRMSパワー消滅曲線上で測定されるパワーとして定義されてもよい。時間t=0は、(
図5Aにおける)入力信号501の放出の時間であり得る。
【0068】
例示的リバーブレータ
【0069】
いくつかの実施形態では、(
図5Aの)リバーブレータ514は、Smith 「J.O. Physical Audio Signal Processing」(http://ccrma.stanford.edu/~jos/pasp/(online book, 2010 edition))に説明されるもの等の反響アルゴリズムを動作させるように構成されてもよい。これらの実施形態では、リバーブレータは、コムフィルタステージを含有してもよい。コムフィルタステージは、16個のコムフィルタ(例えば、耳毎に8つのコムフィルタ)を含んでもよく、各コムフィルタは、異なるフィードバックループ遅延長を有することができる。
【0070】
いくつかの実施形態では、リバーブレータに関するRIP補正係数は、反響時間を無限大に設定することによって計算されてもよい。反響時間を無限大に設定することは、コムフィルタが、いかなる内蔵減衰も有していないと仮定することと同等であり得る。ディラックインパルスが、コムフィルタを通して入力される場合、リバーブレータ514の出力信号は、例えば、完全スケールインパルスのシーケンスであり得る。
【0071】
図8は、いくつかの実施形態による、
図5Aのリバーブレータ514からの例示的出力信号を図示する。リバーブレータ514は、コムフィルタ(図示せず)を含んでもよい。サンプルにおいて表される、フィードバックループ遅延長dを伴う1つのみのコムフィルタが、存在する場合、エコー密度は、フィードバックループ遅延長dの逆数に等しくあり得る。RMS振幅は、エコー密度の平方根に等しくあり得る。RMS振幅は、以下のように表されてもよい。
【化3】
【0072】
いくつかの実施形態では、リバーブレータは、複数のコムフィルタを有してもよく、RMS振幅は、以下のように表されてもよい。
【化4】
式中、Nは、リバーブレータ内のコムフィルタの数であり、d
meanは、平均フィードバック遅延長である。平均フィードバック遅延長d
meanは、サンプルにおいて表され、N個のコムフィルタを横断して平均化されてもよい。
【0073】
図9は、いくつかの実施例による、コムフィルタのみを含む、例示的リバーブレータに関するインパルス応答の振幅を図示する。いくつかの実施形態では、リバーブレータは、有限値に設定される消滅時間を有してもよい。図に示されるように、リバーブレータインパルス応答のRMS振幅は、経時的に指数関数的に低下する。dBスケールでは、RMS振幅は、直線に沿って低下し、時間t=0においてRIPに等しい値から開始する。時間t=0は、入力における単位インパルスの放出の時間(例えば、仮想音源によるインパルスの放出の時間)であり得る。
【0074】
図10は、本開示の実施例による、オールパスフィルタステージを含む、例示的リバーブレータに関するインパルス応答の振幅を図示する。リバーブレータは、Smith「J.O. Physical Audio Signal Processing」(http://ccrma.stanford.edu/~jos/pasp/(online book, 2010 edition))に説明されるものに類似し得る。オールパスフィルタの包含は、(
図9のリバーブレータインパルス応答のRMS振幅と比較して)リバーブレータインパルス応答のRMS振幅に有意に影響を及ぼし得ないため、dBにおけるRMS振幅の線形消滅傾向は、
図9の傾向と同じであり得る。いくつかの実施形態では、線形消滅傾向は、時間t=0において観察される同一のRIP値から開始し得る。
【0075】
図11Aは、いくつかの実施形態による、コムフィルタを含むリバーブレータを有する、例示的反響処理システムを図示する。
図11Bは、いくつかの実施形態による、
図11Aの反響処理システムを動作させるための例示的プロセスのフローを図示する。
【0076】
反響処理システム510Bは、RIP制御システム512と、リバーブレータ1114とを含むことができる。RIP制御システム512は、RIG516と、RIP補正器518とを含むことができる。RIP制御システム512およびRIP補正器518は、(
図5Aの)反響処理システム510A内に含まれるものに対応して類似し得る。反響処理システム510Bは、入力信号501を受信し、出力信号502Aおよび502Bを出力することができる。いくつかの実施形態では、反響処理システム510Bは、(
図5Aの)反響処理システム510Aの代わりに、
図5Aのオーディオレンダリングシステム500内に含まれることができる。
【0077】
RIG516は、RIG値を適用するように構成されてもよく(プロセス1150のステップ1152)、RIP補正器518は、RIP補正係数を適用することができ(ステップ1154)、両方とも、リバーブレータ1114と直列である。RIG516、RIP補正器518、およびリバーブレータ114の直列的構成は、反響処理システム510BのRIPをRIGに等しくさせ得る。
【0078】
いくつかの実施形態では、RIP補正係数は、以下のように表されることができる。
【化5】
信号へのRIP補正係数の適用は、RIG値が、1.0に設定されるとき、RIPをユニティ(1.0)等の所定の値に設定させることができる。
【0079】
リバーブレータ514は、RIP制御システム512から信号を受信することができ、反響効果を入力信号の第1の部分の中に導入するように構成されることができる(ステップ1156)。リバーブレータ514は、1つ以上のコムフィルタ1115を含むことができる。コムフィルタ1115は、信号内の1つ以上の周波数をフィルタ処理して取り除くように構成されることができる(ステップ1158)。例えば、コムフィルタ1115は、環境効果(例えば、部屋の壁)を模倣するために、1つ以上の周波数をフィルタ処理して取り除く(例えば、キャンセルする)ことができる。リバーブレータ1114は、2つ以上の出力信号502Aおよび502Bを出力することができる(ステップ1160)。
【0080】
図12Aは、複数のオールパスフィルタを含むリバーブレータを有する、例示的反響処理システムを図示する。
図12Bは、いくつかの実施形態による、
図12Aの反響処理システムを動作させるための例示的プロセスのフローを図示する。
【0081】
反響処理システム510Cは、(
図11Aの)反響処理システム510Bに類似し得るが、そのリバーブレータ1214は、加えて、複数のオールパスフィルタ1216を含んでもよい。ステップ1252、1254、1256、1258、および1260は、それぞれ、ステップ1152、1154、1156、1158、および1160に対応して類似し得る。
【0082】
反響処理システム510Cは、RIP制御システム512と、リバーブレータ1214とを含むことができる。RIP制御システム512は、RIG516と、RIP補正器518とを含むことができる。RIP制御システム512およびRIP補正器518は、(
図5Aの)反響処理システム510A内に含まれるものに対応して類似し得る。反響処理システム510Bは、入力信号501を受信し、出力信号502Aおよび502Bを出力することができる。いくつかの実施形態では、反響処理システム510Bは、(
図5Aの)反響処理システム510Aまたは(
図11の)反響処理システム510Bの代わりに、
図5Aのオーディオレンダリングシステム500内に含まれることができる。
【0083】
リバーブレータ1214は、加えて、コムフィルタ1115から信号を受信し得る、オールパスフィルタ1215を含んでもよい。各オールパスフィルタ1215は、コムフィルタ1115から信号を受信することができ、その大きさを変化させることなく、その入力信号を通過させるように構成されることができる(ステップ1262)。いくつかの実施形態では、オールパスフィルタ1215は、信号の位相を変化させることができる。いくつかの実施形態では、各オールパスフィルタは、コムフィルタから一意の信号を受信することができる。オールパスフィルタ1215の出力は、反響処理システム510Cおよびオーディオレンダリングシステム500の出力信号502であり得る。例えば、オールパスフィルタ1215Aは、コムフィルタ1115から一意の信号を受信することができ、信号502Aを出力することができ、同様に、オールパスフィルタ1215Bは、コムフィルタ1115から一意の信号を受信することができ、信号502Bを出力することができる。
【0084】
図9および10を比較すると、オールパスフィルタ1216の包含は、出力RMS振幅消滅傾向に有意に影響を及ぼし得ない。
【0085】
RIP補正係数を適用するとき、反響時間が、無限大に設定される場合、RIG値は、1.0に設定され、単一の単位インパルスが、反響処理システム510Cを通して入力され、1の一定RMSレベルを伴う雑音様出力が、取得され得る。
【0086】
図13は、いくつかの実施形態による、
図12の反響処理システム510Cの例示的インパルス応答を図示する。反響時間は、有限数に設定されてもよく、RIGは、1.0に設定されてもよい。dBスケールでは、RMSレベルは、
図10に示されるように、直線消滅線に沿って低下し得る。しかしながら、RIP補正係数に起因して、時間t=0において
図13で観察されるRIPは、0dBに正規化され得る。
【0087】
いくつかの実施形態では、
図5、6、7、および18Aと関連して説明されるRIP正規化方法は、
図5のリバーブレータ514内に実装される特定のデジタル反響アルゴリズムにかかわらず、適用されてもよい。例えば、リバーブレータは、利得行列と接続されるフィードバックおよびフィードフォワード遅延要素のネットワークから構築されてもよい。
【0088】
図14は、いくつかの実施形態による、反響処理システム510を通した信号入力および出力を図示する。例えば、
図14は、
図5A、11A、および12Aに議論されるもの等、上記に議論される反響処理システム510のうちのいずれか1つの信号のフローを図示する。RIG適用ステップ1416は、RIG値を設定し、これを入力信号501に適用するステップを含むことができる。RIP補正係数適用ステップ1418は、選定されるリバーブレータ設計および内部リバーブレータパラメータ設定に関するRIP補正係数を計算するステップを含むことができる。加えて、リバーブレータ1414を通して信号を通過させることは、本システムに、リバーブレータトポロジを選択させ、内部リバーブレータパラメータを設定させることができる。図に示されるように、リバーブレータ1414の出力は、出力信号502であり得る。
【0089】
例示的フィードバック遅延ネットワーク
【0090】
本明細書に開示される実施形態は、いくつかの実施形態による、フィードバック遅延ネットワーク(FDN)を含む、リバーブレータを有してもよい。FDNは、遅延ユニットの出力がその入力にフィードバックされることを可能にし得る、恒等行列を含んでもよい。
図15Aは、いくつかの実施形態による、フィードバック行列を備える、例示的FDNのブロック図を図示する。FDN1515は、フィードバック行列1520と、複数のコンバイナ1522と、複数の遅延1524と、複数の利得1526とを含むことができる。
【0091】
コンバイナ1522は、入力信号1501を受信することができ、その入力を組み合わせる(例えば、追加する、集約する等)ように構成されることができる(プロセス1550のステップ1552)。コンバイナ1522はまた、フィードバック行列1520から信号を受信することができる。遅延1524は、コンバイナ1522から組み合わせられた信号を受信することができ、遅延を1つ以上の信号の中に導入するように構成されることができる(ステップ1554)。利得1526は、遅延1524から信号を受信することができ、利得を1つ以上の信号の中に導入するように構成されることができる(ステップ1556)。利得1526からの出力信号は、出力信号1502を形成することができ、また、フィードバック行列1520の中に入力されてもよい。いくつかの実施形態では、フィードバック行列1520は、N×Nユニタリ(エネルギー保全)行列であってもよい。
【0092】
フィードバック行列1520が、ユニタリ行列である一般的な場合では、RIP補正係数の式はまた、リバーブレータのフィードバックループの周囲の全体的エネルギー伝達が、変化せず、遅延がないままであるため、方程式(5)によって与えられてもよい。
【0093】
リバーブレータ設計および内部パラメータ設定の所与の恣意的選定に関して、例えば、RIP補正係数が、計算されてもよい。計算されるRIP補正係数は、RIG値が、1.0に設定される場合、全体的反響処理システム510のRIPもまた、1.0であるようなものであり得る。
【0094】
いくつかの実施形態では、リバーブレータは、1つ以上のオールパスフィルタを伴うFDNを含んでもよい。
図16は、いくつかの実施形態による、複数のオールパスフィルタを備える、例示的FDNのブロック図を図示する。
【0095】
FDN1615は、複数のオールパスフィルタ1630と、複数の遅延1632と、混合行列1640Bとを含むことができる。オールパスフィルタ1630は、複数の利得1526と、吸収性遅延1632と、別の混合行列1640Aとを含むことができる。FDN1615はまた、複数のコンバイナ(図示せず)を含んでもよい。
【0096】
オールパスフィルタ1630は、入力信号1501を受信し、その大きさを変化させることなく、その入力信号を通過させるように構成されてもよい。いくつかの実施形態では、オールパスフィルタ1630は、信号の位相を変化させることができる。いくつかの実施形態では、各オールパスフィルタ1630は、オールパスフィルタ1630へのパワー入力が、オールパスフィルタからのパワー出力に等しくあり得るように構成されることができる。言い換えると、各オールパスフィルタ1630は、いかなる吸収も行い得ない。具体的には、吸収性遅延1632は、入力信号1501を受信することができ、信号内に遅延を導入するように構成されることができる。いくつかの実施形態では、吸収性遅延1632は、サンプルの数だけその入力信号を遅延させることができる。いくつかの実施形態では、各吸収性遅延1632は、その出力信号が、その入力信号未満のあるレベルであるような吸収レベルを有することができる。
【0097】
利得1526Aおよび1526Bは、その個別の入力信号内に利得を導入するように構成されることができる。利得1526Aに関する入力信号は、吸収性遅延への入力信号であり得、利得1526Bに関する出力信号は、混合行列1640Aへの出力信号であり得る。
【0098】
オールパスフィルタ1630からの出力信号は、遅延1632への入力信号であり得る。遅延1632は、オールパスフィルタ1630から信号を受信することができ、その個別の信号の中に遅延を導入するように構成されることができる。いくつかの実施形態では、遅延1632からの出力信号は、出力信号1502を形成するように組み合わせられることができる、またはいくつかの実施形態では、これらの信号は、その他における複数の出力チャネルとして別個にとられてもよい。いくつかの実施形態では、出力信号1502は、ネットワーク内の他の点からとられてもよい。
【0099】
遅延1632からの出力信号はまた、混合行列1640Bの中への入力信号であり得る。混合行列1640Bは、複数の入力信号を受信するように構成されることができ、オールパスフィルタ1630の中にフィードバックされるべきその信号を出力することができる。いくつかの実施形態では、各混合行列は、完全混合行列であり得る。
【0100】
これらのリバーブレータトポロジでは、RIP補正係数は、リバーブレータのフィードバックループ内およびその周囲の全体的エネルギー伝達が、変化せず、遅延がないままであり得るため、方程式(5)によって表されてもよい。いくつかの実施形態では、FDN1615は、所望の出力信号1501を達成するために、入力および/または出力信号配置を変動させてもよい。
【0101】
オールパスフィルタ1630を伴うFDN1615は、その入力として入力信号1501をとり、正しい消滅反響信号を含み得るマルチチャネル出力を作成する、反響システムであり得る。入力信号1501は、モノ入力信号であり得る。
【0102】
いくつかの実施形態では、RIP補正係数は、
図6に示されるように、反響時間が、無限大に設定されるとき、反響RMS振幅A
rms({P})を決定するリバーブレータパラメータ{P}のセットの数学関数として表されてもよい。例えば、RIP補正係数は、以下のように表されることができる。
【化6】
【0103】
所与のリバーブレータトポロジおよびリバーブレータの遅延ユニット長の所与の設定に関して、RIP補正係数は、以下のステップ、すなわち、(1)反響時間を無限大に設定するステップ、(2)(
図6に示されるような)リバーブレータインパルス応答を記録するステップ、(3)反響RMS振幅A
rmsを測定するステップ、および(4)方程式(6)に従ってRIP補正係数を決定するステップを実施することによって計算されてもよい。
【0104】
いくつかの実施形態では、RIP補正係数は、以下のステップ、すなわち、(1)反響時間を任意の有限値に設定するステップ、(2)リバーブレータインパルス応答を記録するステップ、(3)(
図7Aまたは
図7Cに示されるような)反響RMS振幅消滅曲線A
rms(t)を導出するステップ、(4)(A
rms(0)として表され、
図10に示されるような)放出の時間t=0において外挿されるその値(RMS振幅)を決定するステップ、および(5)方程式7(下記)に従ってRIP補正係数を決定するステップを実施することによって計算されてもよい。
【化7】
【0105】
例示的反響エネルギー正規化方法
【0106】
いくつかの実施形態では、例えば、アプリケーション開発者、サウンドデザイナ、および同様の人物のために、知覚的に関連する反響利得制御方法を提供することが、望ましくあり得る。例えば、いくつかのリバーブレータまたは部屋シミュレータ実施形態では、入力信号のパワーに対する反響処理システムの効果を表すパワー増幅係数の測度に対するプログラム制御を提供することが、望ましくあり得る。入力信号のパワーは、例えば、dBにおいて表されてもよい。パワー増幅係数に対するプログラム制御は、アプリケーション開発者、サウンドデザイナ、および同様の人物が、例えば、反響出力信号音量と入力信号音量との間のバランス、または直接音出力信号音量を決定することを可能にし得る。
【0107】
いくつかの実施形態では、本システムは、反響エネルギー(RE)補正係数を適用することができる。
図17Aは、いくつかの実施形態による、RE補正器を含む、例示的反響処理システムのブロック図を図示する。
図17Bは、いくつかの実施形態による、
図17Aの反響処理システムを動作させるための例示的プロセスのフローを図示する。
【0108】
反響処理システム510Dは、RIP制御システム512と、リバーブレータ514とを含むことができる。RIP制御システム512は、RIG516と、RIP補正器518とを含むことができる。RIP制御システム512、リバーブレータ514、およびRIP補正器518は、(
図5Aの)反響処理システム510A内に含まれるものに対応して類似し得る。反響処理システム510Dは、入力信号501を受信することができ、出力信号502を出力することができる。いくつかの実施形態では、反響処理システム510Dは、(
図5Aの)反響処理システム510A、(
図11Aの)反響処理システム510B、または(
図12Aの)反響処理システム510Cの代わりに、
図5Aのオーディオレンダリングシステム500内に含まれることができる。
【0109】
反響処理システム510Dはまた、反響利得(RG)1716と、RE補正器1717とを備える、RIG516を含んでもよい。RG1716は、入力信号501を受信することができ、信号をRE補正器1717に出力することができる。RG1716は、RG値を入力信号501の第1の部分に適用するように構成されることができる(プロセス1750のステップ1752)。いくつかの実施形態では、RIGは、RE補正係数が、RG値が、適用された後に入力信号の第1の部分に適用されるように、RG1716をRE補正器1717とカスケードすることによって実現されることができる。いくつかの実施形態では、RIG516は、RIP補正器518とカスケードされ、リバーブレータ514とカスケードされるRIP制御システム512を形成することができる。
【0110】
RE補正器1717は、RG1716から信号を受信することができ、RE補正係数を計算し、(RG1716からの)その入力信号に適用するように構成されることができる(ステップ1754)。いくつかの実施形態では、RE補正係数は、これが、(1)RIPが、1.0に設定され、(2)反響開始時間が、音源による単位インパルスの放出の時間に等しく設定されるとき、リバーブレータインパルス応答における合計エネルギーを表すように計算されてもよい。RG1716およびREC1717は両方とも、直列に適用されるとき、RE補正器1717から出力される信号が、所定の値(例えば、ユニティ(1.0))に正規化され得るように、それぞれ、RG値およびREC補正係数を適用(および/または計算)することができる。出力信号のRIPは、
図17Aに示されるように、リバーブレータ、リバーブレータエネルギー補正係数、およびリバーブレータ初期パワー係数と直列にリバーブレータ利得を適用することによって制御されることができる。RE正規化プロセスは、下記により詳細に議論される。
【0111】
RIP補正器518は、RIG516から信号を受信することができ、RIP補正係数を計算し、(RIG516からの)その入力信号に適用するように構成されることができる(ステップ1756)。リバーブレータ514は、RIP補正器518から信号を受信することができ、信号内に反響効果を導入するように構成されることができる(ステップ1758)。
【0112】
いくつかの実施形態では、仮想部屋のRIPは、
図5Aの反響処理システム510A(オーディオレンダリングシステム500内に含まれる)、
図11Aの反響処理システム510B(オーディオレンダリングシステム500内に含まれる)、または両方を使用して制御されてもよい。(
図5Aの)反響処理システム510AのRIG516は、RIPを直接規定してもよく、例えば、Jean-Marc Jot、Laurent Cerveau、およびOlivier Warusfelによる「Analysis and synthesis of room reverberation based on a statistical time-frequency model」に示されるように、仮想部屋の立方体積の平方根の逆数に比例するとして物理的に解釈されてもよい。
【0113】
(
図17Aの)反響処理システム510DのRG516は、REを規定することによって間接的に仮想部屋のRIPを制御してもよい。REは、これが、仮想部屋内の仮想聴者と同一の位置に併置される場合、ユーザが仮想音源から受け取るであろう反響の予期されるエネルギーに比例する、知覚的に関連する量であり得る。仮想聴者と同一の位置に併置される一例示的仮想音源は、仮想聴者自身の声または足音である。
【0114】
いくつかの実施形態では、REは、反響処理システムによる入力信号の増幅を表すために計算および使用されることができる。増幅は、信号パワーの観点から表され得る。
図7に示されるように、REは、反響開始時間から積分される反響RMSパワーエンベロープの下の面積に等しくあり得る。いくつかの実施形態では、ビデオゲームまたは仮想現実のための双方向オーディオエンジンでは、反響開始時間は、少なくとも所与の仮想音源に関する伝搬遅延に等しくあり得る。したがって、所与の仮想音源に関するREの計算は、仮想音源の位置に依存し得る。
【0115】
図18Aは、いくつかの実施形態による、仮想聴者と併置される仮想音源に関する経時的な計算されたREを図示する。いくつかの実施形態では、反響開始時間は、音放出の時間に等しいと仮定されることができる。この場合では、REは、反響開始時間が、音源による単位インパルスの放出の時間に等しいと仮定されるとき、リバーブレータインパルス応答における合計エネルギーを表すことができる。REは、反響開始時間から積分される反響RMSパワーエンベロープの下の面積に等しくあり得る。
【0116】
いくつかの実施形態では、RMSパワー曲線は、時間tの連続関数として表されてもよい。そのようなインスタンスでは、REは、以下のように表されてもよい。
【化8】
【0117】
反響処理システムの離散時間実施形態等のいくつかの実施形態では、RMSパワー曲線は、離散時間t=n/F
sの関数として表されることができる。そのようなインスタンスでは、REは、以下のように表されてもよい。
【化9】
式中、F
Sは、同一のレートである。
【0118】
いくつかの実施形態では、RE補正係数は、REが、所定の値(例えば、ユニティ(1.0))に正規化され得るように、RIP補正係数およびリバーブレータと直列に計算および適用されてもよい。RECは、以下の通り、REの平方根の逆数に等しく設定されてもよい。
【化10】
【0119】
いくつかの実施形態では、出力反響信号のRIPは、
図17Aの反響処理システム510Cに示されるもの等、RE補正係数、RIP補正係数、およびリバーブレータと直列にRG値を適用することによって制御されてもよい。RG値およびRE補正は、以下の通り、RIGを決定するために組み合わせられてもよい。
【化11】
したがって、RE補正係数(REC)は、RIGの代わりに、信号領域RG量の観点からRIP補正係数を制御するために使用されてもよい。
【0120】
いくつかの実施形態では、RIPは、システムインパルス応答内に統合されたREによって導出される、測定された信号パワー増幅にマッピングされてもよい。方程式(10)-(11)において上記に示されるように、本マッピングは、信号増幅係数、すなわち、RGの熟知された考えを介したRIPの制御を可能にする。いくつかの実施形態では、
図18Bおよび方程式(8)-(9)に示されるように、RE計算に関して瞬間的反響開始を仮定する利点は、本マッピングが、ユーザまたは聴者位置が考慮されることを要求することなく表され得ることであり得る。
【0121】
いくつかの実施形態では、リバーブレータ514のインパルス応答の反響RMSパワー曲線は、消滅する時間の関数として表されることができる。消滅する時間の関数は、t=0において開始することができる。
【化12】
【0122】
いくつかの実施形態では、消滅パラメータは、以下の通り、消滅時間T60の関数として表されることができる。
【化13】
【0123】
合計REは、以下のように表されてもよい。
【化14】
【0124】
いくつかの実施形態では、RIPは、所定の値(例えば、ユニティ(1.0))に正規化されてもよく、RECは、以下の通り、表されてもよい。
【化15】
【0125】
いくつかの実施形態では、RECは、以下の方程式に従って近似されてもよい。
【化16】
【0126】
図19は、いくつかの実施形態による、例示的反響処理システムのフローを図示する。例えば、
図19は、
図17Aの反響処理システム510Dのフローを図示することができる。リバーブレータ設計および内部パラメータ設定の所与の恣意的選定に関して、RIP補正係数が、例えば、方程式(5)-(7)を適用することによって計算されることができる。いくつかの実施形態では、反響消滅時間T60の所与のランタイム調節に関して、合計REは、方程式(8)-(9)を適用することによって再計算されてもよく、RIPは、1.0に正規化されると仮定されることができる。REC係数は、方程式(10)に従って導出されることができる。
【0127】
REC係数の適用に起因して、ランタイム時にRG値または反響消滅時間T60を調節することは、RGが、入力信号(例えば、入力信号501)のRMS振幅に対して、出力信号(例えば、出力信号502)のRMS振幅に関する増幅係数として動作し得るように、反響処理システムのRIPを自動的に補正する効果を及ぼし得る。反響消滅時間T60を調節することが、いくつかの実施形態では、RIPが、消滅時間の修正によって影響を受け得ないため、RIP補正係数を再計算することを要求し得ないことに留意されたい。
【0128】
いくつかの実施形態では、RECは、RIP補正係数を適用することによってRIPを1.0に設定した後、音源放出からのある時間において規定された2つの点の間の反響テールにおけるエネルギーとしてREを測定することに基づいて定義されてもよい。これは、例えば、測定された反響テールを伴う畳み込みを使用するときに有益であり得る。
【0129】
いくつかの実施形態では、RE補正係数は、RIP補正係数を適用することによってRIPを1.0に設定した後、エネルギー閾値を使用して定義された2つの点の間の反響テールにおけるエネルギーとしてREを測定することに基づいて定義されてもよい。いくつかの実施形態では、直接音に対するエネルギー閾値または絶対的エネルギー閾値が、使用されてもよい。
【0130】
いくつかの実施形態では、RE補正係数は、RIP補正係数を適用することによってRIPを1.0に設定した後、ある時間において定義された1つの点とエネルギー閾値を使用して定義された1つの点との間の反響テールにおけるエネルギーとしてREを測定することに基づいて定義されてもよい。
【0131】
いくつかの実施形態では、RE補正係数は、RIP補正係数を各反響に適用することによって反響テールのそれぞれのRIPを1.0に設定した後、異なる結合された空間によって寄与されるエネルギーの加重和を考慮することによって算出されてもよい。本RE補正係数算出の一例示的用途は、音響環境が、2つ以上の結合された空間を含む場合であり得る。
【0132】
上記に説明されるシステムおよび方法に関して、本システムおよび方法の要素は、適宜、1つ以上のコンピュータプロセッサ(例えば、CPUまたはDSP)によって実装されることができる。本開示は、これらの要素を実装するために使用される、コンピュータプロセッサを含むコンピュータハードウェアの任意の特定の構成に限定されない。ある場合には、複数のコンピュータシステムが、上記に説明されるシステムおよび方法を実装するために採用されることができる。例えば、第1のコンピュータプロセッサ(例えば、マイクロホンに結合されるウェアラブルデバイスのプロセッサ)が、入力マイクロホン信号を受信し、それらの信号の初期処理(例えば、上記に説明されるもの等の信号調整および/またはセグメント化)を実施するために利用されることができる。第2の(おそらく、よりコンピュータ的に強力な)プロセッサが、次いで、それらの信号の発話セグメントと関連付けられる確率値の決定等のよりコンピュータ的に集約的な処理を実施するために利用されることができる。クラウドサーバ等の別のコンピュータデバイスが、発話認識エンジンをホストすることができ、それに入力信号が、最終的に提供される。他の好適な構成も、明白になり、本開示の範囲内である。
【0133】
開示される実施例は、付随の図面を参照して完全に説明されたが、種々の変更および修正が、当業者に明白となるであろうことに留意されたい。例えば、1つ以上の実装の要素は、組み合わせられ、削除され、修正され、または補完され、さらなる実装を形成してもよい。そのような変更および修正は、添付される請求項によって定義されるような開示される実施例の範囲内に含まれるものとして理解されるものである。