特許第5964311号(P5964311)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ディーティーエス・エルエルシーの特許一覧

<>
  • 特許5964311-ステレオイメージ拡張システム 図000002
  • 特許5964311-ステレオイメージ拡張システム 図000003
  • 特許5964311-ステレオイメージ拡張システム 図000004
  • 特許5964311-ステレオイメージ拡張システム 図000005
  • 特許5964311-ステレオイメージ拡張システム 図000006
  • 特許5964311-ステレオイメージ拡張システム 図000007
  • 特許5964311-ステレオイメージ拡張システム 図000008
  • 特許5964311-ステレオイメージ拡張システム 図000009
  • 特許5964311-ステレオイメージ拡張システム 図000010
  • 特許5964311-ステレオイメージ拡張システム 図000011
  • 特許5964311-ステレオイメージ拡張システム 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5964311
(24)【登録日】2016年7月8日
(45)【発行日】2016年8月3日
(54)【発明の名称】ステレオイメージ拡張システム
(51)【国際特許分類】
   H04S 1/00 20060101AFI20160721BHJP
【FI】
   H04S1/00 B
【請求項の数】10
【全頁数】24
(21)【出願番号】特願2013-535098(P2013-535098)
(86)(22)【出願日】2011年10月20日
(65)【公表番号】特表2013-544046(P2013-544046A)
(43)【公表日】2013年12月9日
(86)【国際出願番号】US2011057135
(87)【国際公開番号】WO2012054750
(87)【国際公開日】20120426
【審査請求日】2014年9月12日
(31)【優先権主張番号】61/405,115
(32)【優先日】2010年10月20日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】512293312
【氏名又は名称】ディーティーエス・エルエルシー
【氏名又は名称原語表記】DTS LLC
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100109830
【弁理士】
【氏名又は名称】福原 淑弘
(74)【代理人】
【識別番号】100088683
【弁理士】
【氏名又は名称】中村 誠
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100095441
【弁理士】
【氏名又は名称】白根 俊郎
(74)【代理人】
【識別番号】100075672
【弁理士】
【氏名又は名称】峰 隆司
(74)【代理人】
【識別番号】100119976
【弁理士】
【氏名又は名称】幸長 保次郎
(74)【代理人】
【識別番号】100153051
【弁理士】
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100140176
【弁理士】
【氏名又は名称】砂川 克
(74)【代理人】
【識別番号】100158805
【弁理士】
【氏名又は名称】井関 守三
(74)【代理人】
【識別番号】100124394
【弁理士】
【氏名又は名称】佐藤 立志
(74)【代理人】
【識別番号】100112807
【弁理士】
【氏名又は名称】岡田 貴志
(74)【代理人】
【識別番号】100111073
【弁理士】
【氏名又は名称】堀内 美保子
(74)【代理人】
【識別番号】100134290
【弁理士】
【氏名又は名称】竹内 将訓
(72)【発明者】
【氏名】ワン、ウェン
【審査官】 菊池 充
(56)【参考文献】
【文献】 米国特許出願公開第2007/0076892(US,A1)
【文献】 特開平11−252698(JP,A)
【文献】 特開2000−287294(JP,A)
【文献】 特表2008−502200(JP,A)
【文献】 特開平08−111899(JP,A)
【文献】 特開2010−004512(JP,A)
【文献】 特開平04−150400(JP,A)
【文献】 特開平02−092200(JP,A)
【文献】 特表平09−505702(JP,A)
【文献】 米国特許出願公開第2008/0279401(US,A1)
【文献】 特開平08−102999(JP,A)
【文献】 特開平06−051759(JP,A)
【文献】 米国特許出願公開第2005/0271213(US,A1)
【文献】 米国特許第06643375(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00− 7/00
(57)【特許請求の範囲】
【請求項1】
1対のスピーカによって再生されるステレオオーディオ信号を仮想的に拡張するための方法であって、前記方法は、
左オーディオ信号と右オーディオ信号とを備えるステレオオーディオ信号を受信することと;
前記左オーディオ信号を左チャネルに供給し、前記右オーディオ信号を右チャネルに供給することと;
1対のスピーカと聴取者の反対側の両耳との間のクロストークを完全に打ち消す試みにおいて、計算集約型頭部伝達関数(HRTF)を採用することなく前記クロストークの影響を軽減することと、ここで、前記軽減することは、
1つ以上のプロセッサによって、
反転済み左オーディオ信号を生成するために前記左オーディオ信号を反転させることと、
前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせることと、
反転済み右オーディオ信号を生成するために前記右オーディオ信号を反転させることと、
前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせることと、
を備える;
左フィルタ処理済み信号を生成するために、第1の音響ダイポールに単一の第1の逆HRTFを適用することと、前記第1の逆HRTFは前記左チャネルから前記右チャネルへの第1のクロストーク経路よりもむしろ前記左チャネルの第1の直接経路に適用される;
右フィルタ処理済み信号を生成するために、第2の音響ダイポールに単一の第2の逆HRTF関数を適用することと、前記第2の逆HRTFは前記右チャネルから前記左チャネルへの第2のクロストーク経路よりもむしろ前記右チャネルの第2の直接経路に適用される、ここで、前記第1および第2の逆HRTFは前記左および右フィルタ処理済み信号の間の両耳間強度差(IID)をもたらす;
増強済み左オーディオ信号を生成するために第1の低域通過フィルタにより前記左オーディオ信号を増強することと;
増強済み左フィルタ処理済みオーディオ信号を生成するために前記増強済み左オーディオ信号を前記左フィルタ処理済み信号と組み合わせることと;
増強済み右オーディオ信号を生成するために第2の低域通過フィルタにより前記右オーディオ信号を増強することと;
増強済み右フィルタ処理済みオーディオ信号を生成するために前記増強済み右オーディオ信号を前記右フィルタ処理済み信号と組み合わせることと、
増強済み左オーディオ信号を生成するために、少なくとも前記左フィルタ処理済み信号を高域通過フィルタ処理することにより前記増強済み左フィルタ処理済み信号を増強することと;
増強済み右オーディオ信号を生成するために、少なくとも前記右フィルタ処理済み信号を高域通過フィルタ処理することにより前記増強済み右フィルタ処理済み信号を増強することと;
聴取者によって左右のスピーカの間の実際の距離よりも広く知覚されるように構成されたステレオイメージをもたらすように、前記1対のスピーカにおける再生のために前記左および右増強済み信号を供給することと、
を備える方法。
【請求項2】
前記軽減することは、前記左オーディオ信号に第1の遅延を適用することをさらに備えており、前記軽減することは、前記右オーディオ信号に第2の遅延を適用することをさらに備えており、前記第1および第2の遅延は、両耳間時間差(ITD)をもたらすように選択される請求項1に記載の方法。
【請求項3】
前記増強済み左または右信号を増強することは、
より低い周波数をより高い周波数と比べて増強することによってより高い周波数のクリッピングを回避するために、前記増強済み左および右オーディオ信号のうちの一方または両方のダイナミックレンジの圧縮を実行すること
をさらに備える請求項1または2に記載の方法。
【請求項4】
前記ダイナミックレンジの圧縮を実行することは、
前記左および右フィルタ処理済み信号のうちの一方または両方にリミッタを適用すること
を備える請求項3に記載の方法。
【請求項5】
1対のスピーカによって再生されるステレオオーディオ信号を仮想的に拡張するためのシステムであって、前記システムは、
左オーディオ信号および右オーディオ信号を受信し、
反転済み左オーディオ信号を生成するために前記左オーディオ信号を反転させ、
前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせ、
反転済み右オーディオ信号を生成するために前記右オーディオ信号を反転させ、
前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせる
ように構成された音響ダイポールコンポーネント;
左フィルタ処理済み信号を生成するために第1の音響ダイポールに単一の第1の聴き取り応答関数を適用し、
右フィルタ処理済み信号を生成するために第2の音響ダイポールに単一の第2の聴き取り応答関数を適用する、
ように構成された両耳間強度差(IID)コンポーネント;
増強済み左オーディオ信号を生成するために前記左オーディオ信号を増強するように構成された第1の低域通過フィルタ;
増強済み右オーディオ信号を生成するために前記右オーディオ信号を増強するように構成された第2の低域通過フィルタ;
増強済み左フィルタ処理済みオーディオ信号を生成するために前記増強済み左オーディオ信号を前記左フィルタ処理済み信号と組み合わせように構成された第1の結合器;
増強済み右フィルタ処理済みオーディオ信号を生成するために前記増強済み右オーディオ信号を前記右フィルタ処理済み信号と組み合わせるように構成された、第2の結合器;
増強済み左および右オーディオ信号を生成するために、少なくとも前記左および右フィルタ処理済み信号を高域通過フィルタ処理することにより前記左および右フィルタ処理済み信号を増強するように構成された増強コンポーネント;
を備えており、
ここで、前記システムは、聴取者によって前記左右のスピーカの間の実際の距離よりも広く知覚されるように構成されたステレオイメージをもたらすように、左右のスピーカによる再生のために前記増強済左および右フィルタ処理済み信号を供給するように構成され;
前記音響ダイポールコンポーネントおよび前記IIDコンポーネントは、1つ以上のプロセッサによって実現されるように構成されている、システム。
【請求項6】
前記第1および第2の聴き取り応答関数は、実質的に同じスペクトル特性を有する請求項5に記載のシステム。
【請求項7】
前記第1および第2の聴き取り応答関数は、利得においてのみ相違する請求項6に記載のシステム。
【請求項8】
前記利得の相違が、前記左右のスピーカの間の両耳間強度差をもたらす請求項7に記載のシステム。
【請求項9】
前記音響ダイポールコンポーネントは、前記左および右オーディオ信号のうちの一方または両方に利得を加えるようにさらに構成されている請求項5ないし8のいずれか一項に記載のシステム。
【請求項10】
前記音響ダイポールコンポーネントおよび前記IIDコンポーネントは、前記左右のスピーカの間のクロストークを完全に打ち消すことなく、ステレオ分離をもたらすように構成されている請求項5ないし8のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、「ステレオイメージ拡張システム(Stereo Image Widening System)」という名称の2010年10月20日付の米国仮特許出願第61/405,115号について、米国特許法第119条(e)に規定の優先権を主張し、この米国仮特許出願の開示の全体が、ここでの言及によって援用される。
【背景技術】
【0002】
ステレオサウンドを、複数のマイクロホンを使用して左側および右側のオーディオ信号を別々に記録することによって生成することができる。あるいは、ステレオサウンドを、モノラル信号にバイノーラル(binaural)合成フィルタを適用して左側および右側のオーディオ信号を生成することによって合成することができる。ステレオサウンドは、多くの場合、ステレオ信号がヘッドホンによって再生される場合に優秀な性能を有する。しかしながら、信号が2つのスピーカによって再生される場合、2つのスピーカおよび聴取者の両耳の間のクロストーク(crosstalk)が生じ、ステレオ知覚が損なわれる可能性がある。したがって、クロストークキャンセラが、左側のスピーカ信号が聴取者の右耳にて聴かれることがなく、右側のスピーカ信号が聴取者の左耳にて聴かれることがないように、両方の信号の間のクロストークを打ち消し、あるいは軽減するために、使用されることが多い。
【発明の概要】
【0003】
いくつかの実施形態において、既存のクロストーク打ち消しシステムと比べて少ない処理リソースでステレオイメージを広げることができるステレオ拡張システムおよび関連の信号処理アルゴリズムが、本明細書に記載される。これらのシステムおよびアルゴリズムを、スピーカが互いに近く配置されている携帯デバイスまたは他のデバイスにおいて好都合に実行し、そのようなデバイスにおいて生み出されるステレオ効果を、より少ない演算の負担で増強することができる。しかしながら、本明細書に記載のシステムおよびアルゴリズムは、携帯デバイスに限られず、より一般的に、複数のスピーカを有する任意の装置において実行することが可能である。
【0004】
開示を要約する目的で、本発明の特定の態様、利点、および新規な特徴が、本明細書に説明されている。本明細書に開示される本発明の個々の実施形態において、必ずしもそのような利点のすべてが達成される必要はないことを、理解すべきである。すなわち、本明細書に開示される本発明を、本明細書において教示される1つの利点または利点群を達成または最適化するが、必ずしも本明細書において教示または示唆されうる他の利点を達成することのないやり方で、具現化または実行することが可能である。
【0005】
いくつかの実施形態においては、1対のスピーカによって再生されるステレオオーディオ信号を仮想的に拡張するための方法が、左オーディオ信号と右オーディオ信号とを含むステレオオーディオ信号を受信することを含む。この方法は、前記左オーディオ信号を左チャネルに供給し、前記右オーディオ信号を右チャネルに供給することと、1対のスピーカと聴取者の反対側の両耳との間のクロストークの影響を、クロストークを完全に打ち消す試みにおいて計算集約型頭部伝達関数(computationally-intensive head-related transfer functions:HRTF)または逆HRTFを使用することなく、音響ダイポール(dipole)の原理を使用して軽減することとをさらに含むことができる。使用は、(1つ以上のプロセッサによって)少なくとも(a)前記左オーディオ信号を反転させて反転済み左オーディオ信号を生成し、(b)前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせることによって、第1の音響ダイポールを近似すること、少なくとも(a)前記右オーディオ信号を反転させることによって反転済み右オーディオ信号を生成し、(b)前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせることによって、第2の音響ダイポールを近似すること、および前記第1の音響ダイポールに単一の第1の逆HRTFを適用して左フィルタ処理済み信号を生成することを含むことができる。前記第1の逆HRTFを、前記左チャネルから前記右チャネルへの第1のクロストーク経路よりもむしろ、前記左チャネルの第1の直接経路に適用することができる。この方法が、前記第2の音響ダイポールに単一の第2の逆HRTFを適用して右フィルタ処理済み信号を生成することをさらに含むことができ、ここで前記第2の逆HRTFを、前記右チャネルから前記左チャネルへの第2のクロストーク経路よりもむしろ、前記右チャネルの第2の直接経路に適用することができ、前記第1および第2の逆HRTFによって、前記左および右フィルタ処理済み信号の間に両耳間強度差(IID)がもたらされる。さらに、この方法は、前記1対のスピーカにおける再生のために前記左および右フィルタ処理済み信号を供給することによって、聴取者によって前記左右のスピーカの間の実際の距離よりも広く知覚されるように構成されたステレオイメージをもたらすことを含むことができる。
【0006】
いくつかの実施形態においては、1対のスピーカによって再生されるステレオオーディオ信号を仮想的に広げるためのシステムが、左オーディオ信号および右オーディオ信号を受け取り、少なくとも(a)前記左オーディオ信号を反転させて反転済み左オーディオ信号を生成し、(b)前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせることによって、第1の音響ダイポールを近似し、少なくとも(a)前記右オーディオ信号を反転させて反転済み右オーディオ信号を生成し、(b)前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせることによって、第2の音響ダイポールを近似することができる音響ダイポールコンポーネントを含む。このシステムが、前記第1の音響ダイポールに単一の第1の聴き取り応答関数を適用して左フィルタ処理済み信号を生成し、前記第2の音響ダイポールに単一の第2の聴き取り応答関数を適用して右フィルタ処理済み信号を生成することができる両耳間強度差(IID)コンポーネントをさらに含むことができる。このシステムは、左右のスピーカによる再生のために前記左および右フィルタ処理済み信号を供給することによって、聴取者によって前記左右のスピーカの間の実際の距離よりも広く知覚されるように構成されたステレオイメージをもたらすことができる。さらに、前記音響ダイポールコンポーネントおよび前記IIDコンポーネントを、1つ以上のプロセッサによって実現することができる。
【0007】
いくつかの実施形態においては、非一時的物理的な電子ストレージが、プロセッサによって実行することができる命令を記憶しており、そのような命令は、1つ以上のプロセッサによって実行されたときに、1対のスピーカによって再生されるステレオオーディオ信号を仮想的に広げるためコンポーネントを実現する。それらのコンポーネントは、左オーディオ信号および右オーディオ信号を受信し、少なくとも(a)前記左オーディオ信号を反転させて反転済み左オーディオ信号を生成し、(b)前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせることによって、第1の模擬音響ダイポールを形成し、少なくとも(a)前記右オーディオ信号を反転させて反転済み右オーディオ信号を生成し、(b)前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせることによって、第2の模擬音響ダイポールを形成することができる音響ダイポールコンポーネントを含むことができる。さらにコンポーネントは、前記第1の模擬音響ダイポールに単一の第1の逆頭部伝達関数(HRTF)を適用して左フィルタ処理済み信号を生成し、前記第2の模擬音響ダイポールに単一の第2の逆HRTFを適用して右フィルタ処理済み信号を生成するように構成された両耳間強度差(IID)を含むことができる。
【図面の簡単な説明】
【0008】
図面の全体を通して、参照番号は、参照先の構成要素の間の類似性を示すために再度使用されることがある。図面は、本明細書に記載の本発明の実施形態を説明するために提示されており、本発明の技術的範囲を限定するものではない。
図1図1は、クロストーク軽減の筋書きの実施形態を示す。
図2図2は、ステレオイメージの拡張に使用することができる理想的な音響ダイポールの原理を示す。
図3図3は、聴取者のオーディオ体験を向上させるために拡張されたステレオイメージを使用する典型的な聴取の筋書きを示す。
図4図4は、ステレオ拡張システムの実施形態を示す。
図5図5は、図4のステレオ拡張システムのさらに詳細な実施形態を示す。
図6図6は、典型的な頭部伝達関数(HRTF)の時間ドメインにおけるプロットを示す。
図7図7は、図6の典型的なHRTFの周波数応答のプロットを示す。
図8図8は、図7のHRTFを反転させることによって得られた逆HRTFの周波数応答のプロットを示す。
図9図9は、図8の逆HRTFを操作することによって得られた逆HRTFの周波数応答のプロットを示す。
図10図10は、図9の逆HRTFのうちの1つについて、周波数応答のプロットを示す。
図11図11は、ステレオ拡張システムの実施形態の周波数掃引のプロットを示す。
【発明を実施するための形態】
【0009】
I.はじめに
携帯型の電子デバイスは、典型的には、小さな間隔で配置された小型のスピーカを備えている。間隔が小さいことで、これらのスピーカでは、チャネルの分離が乏しくなり、音像が広がりに欠ける傾向にある。結果として、そのようなスピーカにおいては、ステレオおよび3Dの音響効果を聴くことがきわめて困難である可能性がある。現在のクロストーク打ち消しアルゴリズムは、スピーカのクロストークを軽減または打ち消すことによって、これらの問題を軽減しようとしている。しかしながら、これらのアルゴリズムは、多数の頭部伝達関数(HRTF)を利用する傾向にあるため、実行が演算に関して高価につく可能性がある。例えば、一般的なクロストーク打ち消しアルゴリズムは4つ以上のHRTFを使用するが、これは、演算に係るリソースが限られている可搬のデバイスにおいて実行するには、演算に関する負担が大きすぎる可能性がある。
【0010】
好都合なことに、いくつかの実施形態において、本明細書に記載のオーディオシステムは、既存のクロストーク打ち消しの手法と比べて少ない演算リソースの消費にて、ステレオ拡張を提供する。一実施形態においては、オーディオシステムが、多数のHRTFの代わりに、各々のチャネル経路にたった1つの逆HRTFを使用する。クロストークの打ち消しに一般的に使用されているHRTFを排除することで、打ち消し後のクロストーク経路の伝達関数がゼロでなければならないというクロストーク打ち消しの根底にある仮定が取り除かれる。しかしながら、いくつかの実施形態においては、オーディオシステムにおいて音響ダイポールの特徴を実行することで、この仮定を無視しながら、依然としてステレオ拡張をもたらし、おそらくは少なくとも或る程度のクロストーク軽減をもたらすことを、好都合に可能にできる。
【0011】
本明細書に記載のオーディオシステムの特徴を、電話機、ラップトップ、その他のコンピュータ、携帯メディアプレイヤー、などの携帯型の電子デバイスにおいて、これらのデバイスの内部のスピーカまたはこれらのデバイスへと接続された外部のスピーカによって再生されるステレオイメージの拡張に使用することができる。本明細書に記載のシステムの利点は、いくつかの実施形態において、電話機、タブレット、ラップトップ、またはスピーカが狭い間隔で配置されている他のデバイスなど、可搬のデバイスにおいて最も顕著となりうる。しかしながら、本明細書に記載のシステムの利点の少なくとも一部は、とりわけテレビ受像機およびカーステレオシステムなど、可搬のデバイスと比べてスピーカの間隔がより大きい装置においても達成可能である。より一般的には、本明細書に記載のオーディオシステムを、2つ以上のスピーカを有する装置など、任意のオーディオ装置において実現することができる。
【0012】
II.典型的なステレオイメージ拡張の特徴
図面を参照すると、図1が、クロストークの軽減の筋書き100の実施形態を示している。筋書き100においては、聴取者102が、左側スピーカ104Lおよび右側スピーカ104Rを含む2つのスピーカ104から広がる音を聴取する。スピーカ104の出力と聴取者102の耳において受信される音との間の関係を表す伝達関数106も示されている。これらの伝達関数は、同一側経路(same-side path)伝達関数(「S」)および交代側経路(alternate side path)伝達関数(「A」)を含む。交代側経路の「A」伝達関数106が、各々のスピーカと聴取者102の反対側の耳との間のクロストークをもたらす。
【0013】
既存のクロストーク打ち消し技法の目的は、「A」伝達関数の値がゼロになるように「A」伝達関数を打ち消すことにある。これを行うために、そのような技法は、図1の上半分に示されるようなクロストーク処理を実行することができる。この処理は、多くの場合、左側(L)および右側(R)のオーディオ入力信号を受信し、これらの信号を多数のフィルタ110、112へと供給することによって始まる。クロストーク経路フィルタ110および直接経路フィルタ112の両者が図示されている。クロストーク経路フィルタ110および直接経路フィルタ112が、クロストークを打ち消すようにオーディオ入力信号を操作するHRTFを実行することができる。クロストーク経路フィルタ110が、クロストークの打ち消しの大部分を実行するが、それ自身が二次クロストーク作用を引き起こす可能性がある。直接経路フィルタ112が、これらの二次クロストーク作用を軽減でき、あるいは打ち消すことができる。
【0014】
一般的な仕組みは、各々のクロストーク経路フィルタ110を、−A/S(または、その推定値)に設定することである(ここで、AおよびSは、上述の伝達関数106である)。直接経路フィルタ112を、さまざまな技術を使用して実現することができ、このいくつかの例が、その開示の全体がここでの言及によって援用される「三次元音場の合成方法(Method of Synthesizing a Three Dimensional Sound-Field)」という名称の1999年6月14日付の米国特許第6,577,736号の図4に図示および説明されている。クロストーク経路フィルタ110の出力が、それぞれのチャネルの各々の結合ブロック114を使用して直接経路フィルタ112の出力と組み合わせられ、出力オーディオ信号が生成される。フィルタ処理の順序を、例えば直接経路フィルタ112を結合ブロック114とスピーカ104との間に配置することによって逆にしてもよいことに、注意すべきである。
【0015】
クロストークキャンセラの欠点の1つは、クロストークの打ち消しの効果を知覚するために、聴取者の頭部が2つのスピーカ104の真ん中または2つのスピーカ104の間の小さなスイートスポットの範囲内に正確に位置していなければならない点にある。しかしながら、聴取者がそのようなスイートスポットを特定することが難しい場合があり、あるいはスイートスポットの辺りを移動し、スイートスポットに出入りする可能性があるため、クロストークの打ち消しの効果が低くなる。クロストークの打ち消しの他の欠点として、使用されるHRTFが、個々の聴取者の耳の実際の聴き取りの応答関数と異なる可能性がある。したがって、クロストークの打ち消しのアルゴリズムは、一部の聴取者において他の聴取者と比べて良好に機能する可能性がある。
【0016】
クロストークの打ち消しの有効性におけるこれらの欠点に加えて、クロストーク経路フィルタ110によって使用される−A/Sの計算が、演算に関して高価につく可能性がある。モバイルデバイスおよび演算能力が比較的低い他のデバイスにおいては、このクロストークの演算を排除することが望ましくあり得る。本明細書に記載のシステムおよび方法は、実際に、このクロストークの計算を排除する。したがって、クロストーク経路フィルタ110が、クロストーク処理から除去することができる旨を示すために、破線で図示されている。これらのフィルタ110を取り除くことは、これらのフィルタ110がクロストークの打ち消しの大部分を実行しているがゆえに、直感に反している。これらのフィルタ110がないと、交代側経路伝達関数(A)の値をゼロにすることができない。しかしながら、(おそらくは他の特徴の中でもとりわけ)音響ダイポールの原理を使用することによって、これらのクロストークフィルタ110を、良好なステレオ分離を依然としてもたらしながら、好都合に取り除くことができる。
【0017】
いくつかの実施形態においては、クロストークの打ち消しに使用される音響ダイポールが、スイートスポットのサイズを既存のクロストークアルゴリズムと比べて大きくすることもでき、聴き取りの応答関数の個人差に正確には一致しないHRTFを補償することができる。さらに、より詳細に後述されるように、クロストークの打ち消しに使用されるHRTFを、いくつかの実施形態においてクロストーク経路フィルタ110の排除を促進するように調節することができる。
【0018】
本明細書に記載のオーディオシステムにおいて音響ダイポールの原理をどのように使用できるのかについての説明を助けるために、図2が、理想的な音響ダイポール200を示している。ダイポール200は、同様であるが逆位相である音響エネルギを放射する2つの点音源210、212を備えている。ダイポール200は、二次元において、第1の軸224に沿った最大音響放射と第1の軸224に垂直な第2の軸226に沿った最小音響放射とを有する2つのローブ(lobe)222を含む放射パターンを生成する。最小音響放射の第2の軸226は、2つの点音源210、212の間に位置する。したがって、音源210、212の間のこの軸226に沿って位置する聴取者202は、クロストークが少なく、あるいは皆無である広がりのあるステレオイメージを知覚することができる。
【0019】
理想的な音響ダイポール200の物理的な近似を、2つのスピーカを背中合わせに配置し、一方のスピーカに他方のスピーカへと供給される信号を反転させた信号を供給することによって、構築することができる。モバイルデバイスのスピーカは、典型的には、このやり方で配置し直すことが不可能であるが、いくつかの実施形態においては、スピーカをこのような構成にて備える装置を設計することが可能である。しかしながら、一方のオーディオ入力の極性を反転させ、この反転させた入力を他方のチャネルと組み合わせることで、音響ダイポールをソフトウェアまたは回路にて模擬または近似することができる。例えば、左チャネルの入力を(180度)反転させ、右チャネルの入力と組み合わせることができる。非反転の左チャネルの入力を、左側のスピーカへと供給でき、右チャネルの入力および反転させた左チャネルの入力(R−L)を、右側のスピーカへと供給することができる。得られる再生が、左チャネルの入力に関して模擬による音響ダイポールを含むと考えられる。
【0020】
同様に、右チャネルの入力を反転させ、左チャネルの入力と組み合わせる(L−Rを生成する)ことで、第2の音響ダイポールを生成することができる。このようにして、左側のスピーカがL−R信号を出力できる一方で、右側のスピーカがR−L信号を出力することができる。本明細書に記載のシステムおよびプロセスは、ステレオ分離を向上させるために、1つまたは2つのダイポールによるこの音響ダイポールの模擬を、随意により他の処理とともに実行することができる。
【0021】
図3が、ステレオイメージを拡張して、聴取者のオーディオ体験を向上させるために音響ダイポールの技術を使用する典型的な聴き取りの筋書き300を示している。筋書き300においては、聴取者302が、タブレットコンピュータであるモバイルデバイス304によって出力されるオーディオを聴取する。モバイルデバイス304は、デバイスのサイズが小さいがゆえに互いに比較的近い位置にある2つのスピーカ(図示されていない)を備えている。模擬による音響ダイポールを使用し、おそらくは本明細書に記載の他の特徴を使用するステレオ拡張処理が、聴取者302にとってステレオサウンドの拡張された知覚を生み出すことができる。このステレオ拡張が、聴取者302がサウンドを発していると知覚することができる仮想の音源である2つの仮想のスピーカ310、312によって表されている。このように、本明細書に記載のステレオ拡張の特徴は、デバイス304における実際のスピーカの間の物理的な距離よりも大きく離れた音源の知覚を生み出すことができる。好都合なことに、ステレオ分離を向上させる音響ダイポールにおいては、クロストーク経路をゼロに等しく設定するというクロストークの打ち消しの仮定を、無視することができる。存在しうる他の利点の中でもとりわけ、典型的なクロストークの打ち消しのアルゴリズムと比べて、HRTFの個人差が聴取体験にあまり影響しない。
【0022】
図4が、ステレオ拡張システム400の実施形態を示している。ステレオ拡張システム400は、上述の音響ダイポールの特徴を実行することができる。さらに、ステレオ拡張システム400は、ステレオサウンドを拡張し、あるいは他のやり方で向上させるための他の特徴を備えている。
【0023】
図示のコンポーネントには、両耳間時間差(ITD)コンポーネント410、音響ダイポールコンポーネント420、両耳間強度差(IID)コンポーネント430、および随意による増強コンポーネント440が含まれる。これらのコンポーネントの各々を、ハードウェアおよび/またはソフトウェアにて実現できる。さらに、いくつかの実施形態においては、図示のコンポーネントの少なくとも一部を省略でき、いくつかの実施形態においては、コンポーネントの順序を並べ直すこともできる。
【0024】
ステレオ拡張システム400は、左右のオーディオ入力402、404を受け取る。これらの入力402、404が、両耳間時間差(ITD)コンポーネントへともたらされる。ITDコンポーネントは、左右の入力402、404の間に両耳間時間差を生成するために1つ以上の遅延を使用することができる。この入力402、404の間のITDは、スピーカの出力の間に幅または方向性の感覚を生み出すことができる。ITDコンポーネント410によって適用される遅延の量は、左右の入力402、404にエンコードされたメタデータに依存することができる。このメタデータは、左右の入力402、404における音源の位置に関する情報を含むことができる。音源の位置にもとづき、ITDコンポーネント410は、音が示された音源から到来しているように見えるようにするための適切な遅延を生成することができる。例えば、音が左方から到来すべき場合に、ITDコンポーネント410は、左の入力402には遅延を加えずに、右の入力404へと遅延を加えることができ、あるいは右の入力404に左の入力402よりも大きな遅延を加えることができる。いくつかの実施形態においては、ITDコンポーネント410が、その開示の全体がここでの言及によって援用される「オーディオ処理のためのシステムおよび方法(Systems and Methods for Audio Processing)」という名称の2006年9月13日付の米国特許第8,027,477号(「‘477号特許」)に記載の考え方の一部またはすべてを使用して、ITDを動的に計算する。
【0025】
ITDコンポーネント410は、左チャネル信号および右チャネル信号を音響ダイポールコンポーネント420へともたらす。図3に関して上述した音響ダイポールの原理を使用して、音響ダイポールコンポーネント420は、音響ダイポールを模擬または近似する。例えば、音響ダイポールコンポーネント420は、左チャネル信号および右チャネル信号の両方を反転させ、反転させた信号を反対側のチャネルと組み合わせることができる。結果として、2つのスピーカによって生成される音波を、2つのスピーカの間で打ち消すことができ、あるいは他のやり方で軽減することができる。便利のため、本明細書の残りの部分においては、反転させた左チャネル信号を右チャネル信号に組み合わせることによって生成されるダイポールを「左音響ダイポール」と呼び、反転させた右チャネル信号を左チャネル信号に組み合わせることによって生成されるダイポールを「右音響ダイポール」と呼ぶ。
【0026】
一実施形態においては、音響ダイポール効果の大きさを調節するために、音響ダイポールコンポーネント420が、反対側のチャネルの信号に組み合わせられるべき反転させた信号に、利得を適用することができる。この利得が、反転させた信号の大きさを減らし、あるいは増やすことができる。一実施形態においては、音響ダイポールコンポーネント420によって適用される利得の大きさが、2つのスピーカの実際の物理的な隔たりに依存することができる。いくつかの実施形態において、2つのスピーカが近いほど、音響ダイポールコンポーネント420によって適用される利得は小さくてよく、その逆も然りである。この利得は、2つのスピーカの間の両耳間強度差を効果的に生成することができる。この効果を、種々のスピーカの構成を補償するために調節することができる。例えば、ステレオ拡張システム400が、ユーザによるスピーカの実際の物理的な幅の入力を可能にするスライダ、テキストボックス、または他のユーザインターフェイス制御部を有するユーザインターフェイスを提供することができる。この情報を使用して、音響ダイポールコンポーネント420は、反転させた信号に加える利得を相応に調節することができる。いくつかの実施形態においては、この利得を、音響ダイポールコンポーネント420によるだけでなく、図4に示した一連の処理の任意の時点において加えることができる。あるいは、いかなる利得も加えられない。
【0027】
音響ダイポールコンポーネント420によって適用される利得を、選択されたスピーカの幅にもとづいて固定することができる。しかしながら、別の実施形態においては、反転させた信号経路の利得が、左または右のオーディオ入力402、404にエンコードされたメタデータに依存し、入力402、404の方向性の感覚を高めるために使用可能である。例えば、左の信号に右の信号と比べてより大きい分離を生じさせるために、より強い左の音響ダイポールを、左の反転させた入力に利得を使用して生成することができ、その逆も然りである。
【0028】
音響ダイポールコンポーネント420は、処理後の左チャネル信号および右チャネル信号を、両耳間強度差(IID)コンポーネント430へともたらす。IIDコンポーネント430は、2つのチャネルまたはスピーカの間の両耳間強度差を生成することができる。一実施形態においては、IIDコンポーネント430が、上述の利得を実行する音響ダイポールコンポーネント420の代わりに、左チャネルおよび右チャネルの一方または両方に上述の利得を適用する。IIDコンポーネント430は、左右の入力402、404にエンコードされた音位置情報にもとづいて、これらの利得を動的に変化させることができる。各チャネルの利得の差が、ユーザの耳の間にIIDをもたらすことができ、一方のチャネルの音が他方のチャネルの音と比べて聴取者により近いという知覚をもたらすことができる。IIDコンポーネント430によって適用される利得は、いくつかの実施形態において各々のチャネルに適用される個々の逆HRTFの差異の欠如を補償することもできる。さらに詳しく後述されるように、単一の逆HRTFを各々のチャネルへと適用でき、IIDおよび/またはITDを、チャネル間の分離の感覚を生成または強調するために適用することができる。
【0029】
各々のチャネルの利得に加え、あるいは代えて、IIDコンポーネント430は、一方または両方のチャネルに逆HRTFを含むことができる。さらに、逆HRTFを、クロストークを軽減するように選択することができる(後述)。複数の逆HRTFに、ステレオ効果を高めるように固定することができる異なる利得を割り当てることができる。あるいは、これらの利得が、後述のようにスピーカの構成にもとづいて可変であってよい。
【0030】
一実施形態においては、IIDコンポーネント430が、各々のチャネルについて、複数の逆HRTFのうちの1つを所望の方向性を生み出すように動的に選択し、利用することができる。ITDコンポーネント、音響ダイポールコンポーネント420、およびIIDコンポーネント430が協働し、音源の位置の知覚を左右することができる。上記にて援用した‘477号特許に記載のIID技法を、IIDコンポーネントによって使用することもできる。さらに、簡略化された逆HRTFを、‘477号特許に記載のように使用することができる。
【0031】
いくつかの実施形態においては、ステレオ拡張システム400によって生成されるITD、音響ダイポール、および/またはIIDが、伝達関数の値がゼロでないクロストーク経路(図1を参照)を補償することができる。すなわち、いくつかの実施形態においては、チャネルの分離を、既存のクロストーク打ち消しのアルゴリズムにおいて使用されるよりも少ない演算リソースでもたらすことができる。しかしながら、図示のコンポーネントのうちの1つ以上を、或る程度のステレオ分離を依然としてもたらしながら省略できることに、注意すべきである。
【0032】
随意による増強コンポーネント440も示されている。1つ以上の増強コンポーネント440を、ステレオ拡張システム400において設けることができる。一般に、増強コンポーネント440は、左チャネル信号および右チャネル信号のいくつかの特徴を、そのような信号のオーディオ再生を向上させるために調節することができる。図示の実施形態においては、随意による増強コンポーネント440が、左チャネル信号および右チャネル信号を受信し、左右の出力信号452、454を生成する。左右の出力信号452、454を、左右のスピーカへと供給でき、あるいはさらなる処理のために他のブロックへと供給することができる。
【0033】
増強コンポーネント440は、小さなスピーカにおける再生を増強するためにオーディオ信号をスペクトル的に操作するための特徴を含むことができ、このいくつかの例が、図4に関して後述される。より一般的には、増強コンポーネント440は、カリフォルニア州サンタアナのエスアールエス ラボズ インコーポレイテッド(SRS Labs,Inc.)の以下の米国特許および特許出願公開、とりわけ第5,319,713号、第5,333,201号、第5,459,813号、第5,638,452号、第5,912,976号、第6,597,791号、第7,031,474号、第7,555,130号、第7,764,802号、第7,720,240号、第2007/0061026号、第2009/0161883号、第2011/0038490号、第2011/0040395号、および第2011/0066428号(これらの各々は、その全体がここでの言及によって援用される)のいずれかに記載のオーディオ増強のいずれかを含むことができる。さらに、増強コンポーネント440を、入力402、404と出力452、454との間に示されている信号経路の任意の地点に挿入することができる。
【0034】
ステレオ拡張システム400を、デバイスにおいて、システム400の態様を制御する機能をユーザに提供するユーザインターフェイスとともに備えることができる。ユーザは、デバイスの製造者または販売者であってよく、あるいはデバイスの末端ユーザであってよい。制御部は、ステレオ拡張効果の全体的な制御またはステレオ拡張効果の各態様の個別の制御をユーザが(間接的または直接的に)行うことを可能にするスライダなどの形態であってよく、あるいは随意により調節可能な値であってよい。例えば、スライダを、より広いステレオ効果またはより狭いステレオ効果を全体的に選択するために使用することができる。他の例では、他の特徴の中でもとりわけITD、一方または両方のダイポールの反転させた信号の経路の利得、あるいはIIDなど、ステレオ拡張システムの個別の特徴を調節できるよう、より多数のスライダを設けることができる。一実施形態においては、本明細書に記載のステレオ拡張システムが、携帯電話機において最大約4〜6フィート(約1.2〜1.8m)またはそれ以上の左右のチャネルの間の分離をもたらすことができる。
【0035】
主としてステレオを意図しているが、ステレオ拡張システム400の特徴を、3つ以上のスピーカを有するシステムにおいて実行することも可能である。例えば、サラウンドサウンドシステムにおいて、音響ダイポールの機能を、左後ろおよび右後ろのサラウンドサウンドの入力に1つ以上のダイポールを生成するために使用することができる。さらに、ダイポールを、多数の他に考えられる構成の中でもとりわけ、前側の入力と後ろ側の入力との間または前側の入力と中央の入力との間に生成することができる。サラウンドサウンドの環境において使用される音響ダイポール技術は、音場における幅の感覚を向上させることができる。
【0036】
図5が、図4のステレオ拡張システム400のより詳細な実施形態、すなわちステレオ拡張システム500を示している。ステレオ拡張システム500は、ステレオ拡張システム400の1つの典型的な実施例を呈しているが、ステレオ拡張システム400の特徴のいずれかを実行することができる。図示のシステム500は、DSPプロセッサなど(FPGAを基盤とするプロセッサなど)の1つ以上のプロセッサによって実行することができるアルゴリズムの流れを表している。システム500は、アナログおよび/またはデジタル回路を使用して実現することができるコンポーネントを呈することもできる。
【0037】
ステレオ拡張システム500は、左右のオーディオ入力502、504を受信し、左右のオーディオ出力552、554を生成する。説明を容易にするため、左のオーディオ入力502から左のオーディオ出力552への直接の信号経路を、本明細書においては左チャネルと称し、右のオーディオ入力504から右のオーディオ出力554への直接の信号経路を、本明細書においては右チャネルと称する。
【0038】
入力502、504の各々が、遅延ブロック510へとそれぞれ供給される。遅延ブロック510は、ITDコンポーネント410の典型的な実施例を呈している。上述のように、遅延510は、いくつかの実施形態においては、音場の広がりまたは方向性の感覚を生み出すために異なってよい。遅延ブロックの出力が、結合器512へと入力される。結合器512は、遅延後の入力を(マイナスの符号によって)反転させ、遅延および反転後の入力を各々のチャネルの左右の入力502、504と組み合わせる。したがって、結合器512が、各々のチャネルにおいて音響ダイポールを生成するように機能する。すなわち、結合器512は、音響ダイポールコンポーネント420の典型的な実施例である。例えば、左チャネルの結合器512の出力が、L−Rdelayedであってよい一方で、右チャネルの結合器512の出力は、R−Ldelayedであってよい。音響ダイポールコンポーネント420を実現するための別のやり方が、遅延ブロック510と結合器512との間(または、遅延ブロック510の前)にインバータを設け、結合器512を加算器(減算器ではなく)に変えることであることに、注意すべきである。
【0039】
結合器512の出力が、逆HRTFブロック520へともたらされる。これらの逆HRTFブロック520は、上述のIIDコンポーネント430の典型的な実施例である。逆HRTF 520の典型的な実施例の好都合な特徴が、さらに詳しく後述される。各々の逆HRTF 520が、フィルタ処理された信号を結合器522へと出力し、結合器522は、図示の実施形態においては、随意による増強コンポーネント518からの入力も受け取る。この増強コンポーネント518は、(チャネルに応じて)左または右の信号502を入力として取り、増強された出力を生成する。この増強された出力は、後述される。
【0040】
各々の結合器522が、結合後の信号を別の随意による増強コンポーネント530へと出力する。図示の実施形態においては、増強コンポーネント530が、高域通過フィルタ532およびリミッタ534を備えている。高域通過フィルタ532を、携帯電話機など、低音の周波数の再生能力が限られているきわめて小型のスピーカを有しているいくつかのデバイスに使用することができる。この高域通過フィルタ532は、逆HRTF 520または他の処理によって引き起こされる低周波数範囲の増強を軽減することによって、小型のスピーカにおける低周波ひずみを軽減することができる。しかしながら、この低周波成分の軽減は、低および高周波成分の不釣り合いを引き起こし、音質の色変化につながる可能性がある。したがって、上述の増強コンポーネント518は、元の入力502、504の少なくとも低周波数の部分を逆HRTF 520の出力と混合するための低域通過フィルタを備えることができる。
【0041】
高域通過フィルタ532の出力が、ハードリミッタ(hard limiter)534へともたらされる。ハードリミッタ534は、少なくとも何らかの利得を信号へと加える一方で、信号のクリッピングを軽減することもできる。より一般的には、いくつかの実施形態において、ハードリミッタ534が、低周波数の利得を強調する一方で、高い周波数におけるクリッピングまたは信号飽和を軽減することができる。結果として、ハードリミッタ534を、音の色を実質的に変えることがない実質的に平坦な周波数応答の生成を助けるために使用することができる(図11を参照)。一実施形態においては、ハードリミッタ534が、実験的に決定される何らかのしきい値を下回る低い周波数の利得を大きくする一方で、このしきい値を上回るより高い周波数には利得をほとんどまたはまったく加えない。他の実施形態においては、より低い周波数へとハードリミッタ534によって加えられる利得の大きさが、より高い周波数に加えられる利得よりも大きい。より一般的には、任意の動的なレンジ圧縮機を、ハードリミッタ534の代わりに使用することができる。ハードリミッタ534は随意であり、いくつかの実施形態においては省略可能である。
【0042】
増強コンポーネント518のどちらかを、省略でき、他の増強の特徴と置き換えることができ、あるいは他の増強の特徴と組み合わせることができる。
【0043】
III.典型的な逆HRTFの特徴
次に、典型的な逆HRTF 520の特徴を、さらに詳しく説明する。理解できるとおり、逆HRTF 520を、クロストーク経路フィルタ110(図1)の排除をさらに促進するように設計することができる。すなわち、いくつかの実施形態において、逆HRTF、音響ダイポール、およびITDコンポーネントの特徴の任意の組み合わせが、演算に関して過酷なクロストーク経路フィルタ110の使用の排除を促進することができる。
【0044】
図6が、ステレオ拡張システム400または500において使用するための改良された逆HRTFを設計するために使用することができる典型的な頭部伝達関数(HRTF)612、614の時間ドメインのプロット600を示している。各々のHRTF 612、614が、聴取者の耳についての模擬による聴き取りの応答関数を示している。例えば、HRTF 612が右耳についてであってよく、HRTF 614が左耳についてであってよく、あるいはその逆も然りである。時間に関して整列させられているが、HRTF 612、614を、いくつかの実施形態においてはITDを生み出すために互いに遅延させることができる。
【0045】
HRTFは、典型的には、1メートルの距離で測定される。そのようなHRTFのデータベースは、市販されている。しかしながら、モバイルデバイスは、典型的には、ユーザによって聴取者の頭部から25〜50cmの範囲に保持される。この聴取範囲をより正確に反映するHRTFを生成するために、いくつかの実施形態においては、市販のHRTFをデータベースから選択する(あるいは、1mの範囲において生成する)ことができる。次いで、選択されたHRTFの大きさを、約3dB、約2〜6dB、または約1〜12dB、あるいは何らかの他の値など、選択された量だけ減らすことができる。しかしながら、送受話器のユーザの耳までの典型的な距離が、典型的なHRTFについて測定された1mの距離の約半分(50cm)であることから、3dBの差が、いくつかの実施形態においては良好な結果をもたらすことができる。しかしながら、他の範囲も、やはり所望の効果の少なくとも一部またはすべてをもたらすことができる。
【0046】
図示の例では、HRTF 614を3dB(または、何らかの他の値)だけ減らすことによって、左右のチャネルの間にIIDが生成されている。したがって、HRTF 614の大きさがHRTF 612よりも小さい。
【0047】
図7が、図6の典型的なHRTF 612、614の周波数応答のプロット700を示している。プロット700に、HRTF 612、614のそれぞれの周波数応答712、714が示されている。図示の典型的な周波数応答712、714は、25〜50cmの距離範囲において右側5度に位置しているという音源の知覚を生じさせることができる。しかしながら、これらの周波数応答を、別の場所から到来する音源の知覚を生じさせるように調節することができる。
【0048】
図8が、図7のHRTF周波数応答712、714を反転させることによって得られた逆HRTF 812、814の周波数応答のプロット800を示している。一実施形態において、逆HRTF 812、814は、反数(additive inverse)である。逆HRTF 812、814は、非反転のHRTFがスピーカから耳への実際の伝達関数を表すことができ、したがってこの関数の反転をクロストークの打ち消しまたは軽減に使用することができるため、クロストークの軽減または打ち消しにおいて有用となりうる。図示の典型的な逆HRTF 812、814の周波数応答は、とりわけ高い周波数において異なっている。これらの相違が、クロストークの打ち消しのアルゴリズムにおいて一般的に利用される。例えば、HRTF 812を、図1の直接経路フィルタ112として使用できる一方で、HRTF 814を、クロストーク経路フィルタ110として使用することができる。これらのフィルタを、好都合に、ステレオ画像を広げるためにクロストーク経路フィルタ110を使用する必要性を除去または軽減する直接経路フィルタ112を生み出すように調整することができる。
【0049】
図9が、図8の逆HRTF 812、814を操作することによって得られた逆HRTF 912、914の周波数応答のプロット900を示している。これらの逆HRTF 912、914は、逆HRTF 812、814のパラメータを調節して実験を試み、逆HRTFをいくつかの異なる携帯デバイスにおいて目隠し聴き取り試験にて試験することによって得られている。いくつかの実施形態において、低い周波数を弱めることで、音の色を実質的に変えることなく良好なステレオ拡張効果をもたらすことができることが明らかになった。あるいは、高い周波数を弱めることも可能である。低い周波数の低減が、図示の逆フィルタ912、914によって、これらの逆フィルタがスピーカと聴取者の耳との間の典型的なクロストークHRTFの逆数(multiplicative inverse)であるがゆえに生じる(例えば、逆HRTFの別の組における低周波数の減衰に関して図7を参照)。したがって、図示の周波数応答のプロット900の低周波数が、逆フィルタ912、914によって強調されているが、クロストークの実際の低周波数は強調されない。
【0050】
見て取ることができるとおり、逆HRTF 912、914は、周波数特性において類似している。この類似性は、一実施形態において、携帯デバイスまたは他の小型デバイスにおけるスピーカの間隔が比較的小さい可能性があり、結果として各々のスピーカからのクロストークを軽減するための逆HRTFが類似するがゆえに生じる。好都合には、この類似性ゆえに、逆HRTF 912、914の一方を、図1に示したクロストーク処理から省くことができる。したがって、例えば図10に示されるように、単一の逆HRTF 1012を、ステレオ拡張システム400、500において使用することができる(図示の逆HRTF 1012を任意の所望の利得レベルへと拡大/縮小することができる)。とくには、クロストーク経路フィルタ110を、処理から省くことができる。4つのフィルタ110、112によるこれまでの演算は、合計で4つのFFT(高速フーリエ変換)畳み込みおよび4つのIFFT(逆FFT)畳み込みを含む可能性がある。クロストーク経路フィルタ110を省くことで、FFT/IFFTの演算を、オーディオ性能をあまり犠牲にすることなく半分にすることができる。代わりに、逆HRTFフィルタ処理を時間ドメインにおいて実行することができる。
【0051】
上述のように、IIDコンポーネント430が、各々のチャネルの逆HRTFに異なる利得を適用する(あるいは、一方のチャネルに利得を適用するが、他方のチャネルには適用しない)ことによって、各々のチャネルへと適用される逆HRTFの類似性または同一性を補償することができる。利得の適用は、各々のチャネルに第2の逆HRTFを適用することと比べ、処理に関してはるかに軽い負担であることができる。本明細書において使用されるとき、用語「利得」は、通常の意味に加えて、いくつかの実施形態においては減衰も指すことができる。
【0052】
逆HRTF 1012の周波数特性は、約700〜900Hzにおいて始まり、約3kHzおよび4kHzの間の谷へと達する周波数帯におけるおおむね減衰の応答を含む。約4kHzから約9kHz〜約10kHzの間まで、周波数応答の大きさはおおむね増加している。約9kHz〜10kHzの間から始まり、少なくとも約11kHzまで続く範囲において、逆HRTF 1012は、10kHz〜11kHzの範囲に2つの顕著なピークを有するより振動的な応答を有する。図示されていないが、逆HRTF 1012は、約20kHzの辺りに位置する可聴スペクトルの終わりまでなど、11kHzよりも上のスペクトル特性も有することができる。さらに、逆HRTF 1012は、約700〜900Hzを下回るより低い周波数についてはいかなる効果も有さないものとして示されている。しかしながら、別の実施形態においては、逆HRTF 1012が、これらの周波数における応答を有する。好ましくは、そのような応答は、低い周波数における減衰効果である。しかしながら、中立(平坦)または強調の効果も、いくつかの実施形態においては有益となりうる。
【0053】
図11が、1つの典型的なスピーカ構成に特有のステレオ拡張システム500の実施形態の典型的な周波数掃引のプロット1100を示している。プロット1100を生成するために、対数掃引1210をステレオ拡張システム500の左チャネルへと供給する一方で、右チャネルは無音とした。得られたシステム500の出力は、左出力1220および右出力1222を含んでいる。これらの出力の各々は、20Hzから20kHzまでの可聴スペクトルの大部分または全体にわたって実質的に平坦な周波数応答を有している。これらの実質的に平坦な周波数応答は、上述の処理にもかかわらず音の色が実質的に変わらないことを示している。一実施形態においては、逆HRTF 1012の形状および/またはハードリミッタ534が、音の色の変化を少なくし、小型のスピーカからの低周波ひずみを少なくするために、この実質的に平坦な応答を促進する。とくには、ハードリミッタ534が、高い周波数のクリッピングを生じることなく周波数応答の平坦さを増強するために低い周波数を増強できる。ハードリミッタ534は、いくつかの実施形態においては、逆HRTF 1012によって引き起こされる色の変化を補償するために低い周波数を増強する。いくつかの実施形態においては、低い周波数の代わりに高い周波数を減衰させる逆HRTFが構成される。そのような実施形態においては、ハードリミッタ534が、実質的に平坦な周波数応答を生成するために、より低い周波数を制限し、あるいは強調せずに、より高い周波数を強調することができる。
【0054】
IV.さらなる実施形態
いくつかの実施形態において、左右のオーディオ信号を、コンピュータにとって読み取り可能な媒体(例えば、DVD、Blu−Rayディスク、ハードディスク装置、など)などに位置するデジタルファイルから読み出すことができることに、注意すべきである。別の実施形態においては、左右のオーディオ信号が、ネットワークを介して受信されるオーディオストリームであってよい。左右のオーディオ信号を、左右のオーディオ信号をデコードすることによって3つ以上の出力信号を生み出すことができるように、Circle Surroundのエンコード情報でエンコードすることができる。別の実施形態においては、左右のオーディオ信号が、最初にモノラル(「モノ」)信号から合成される。多数の他の構成が可能である。さらに、いくつかの実施形態においては、図8の逆HRTFのいずれかを、ステレオ拡張システム400、500によって図9および10に示した修正逆HRTFの代わりに使用することができる。
【0055】
V.用語
本明細書に記載の変種以外の多数の他の変種が、本明細書の開示から明らかであろう。例えば、実施形態に応じて、本明細書に記載の任意のアルゴリズムの特定の行為、事象、または機能を、別の順序で実行することができ、あるいは追加、合併、または完全に省略することも可能である(例えば、アルゴリズムの実行に上述のすべての行為または事象が必要というわけではない)。さらに、特定の実施形態においては、複数の行為または事象を、例えばマルチスレッド処理、割り込み処理、もしくは複数のプロセッサまたはプロセッサコアあるいは他の並列アーキテクチャによって、順次にではなくて同時に実行することができる。さらに、異なるタスクまたは処理を、協働して機能する別々の装置および/またはコンピュータシステムによって実行することが可能である。
【0056】
本明細書に開示の実施形態に関連して説明した種々の例示の論理ブロック、モジュール、およびアルゴリズムの各段階を、電子ハードウェア、コンピュータソフトウェア、または両者の組み合わせとして実現することができる。このハードウェアおよびソフトウェアの入れ換え可能性を明瞭に示すために、種々の例示のコンポーネント、ブロック、モジュール、および段階は、上記においては、おおむねそれらの機能に関して説明されている。そのような機能がハードウェアまたはソフトウェアのどちらで実現されるかは、個々の用途ならびに全体としてのシステムに課せられる設計の制約に依存する。上述の機能を、個々の用途の各々においてさまざまなやり方で実行することができるが、そのような実行の決定を、本発明の技術的範囲からの離脱を引き起こすものと解釈してはならない。
【0057】
本明細書に開示の実施形態に関連して説明した種々の例示の論理ブロックおよびモジュールを、本明細書に記載の機能を実行するように設計された汎用のプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のプログラマブルな論理素子、ディスクリートなゲートまたはトランジスタロジック、ディスクリートなハードウェアコンポーネント、あるいはこれらの任意の組み合わせなどの装置によって実現または実行することができる。汎用のプロセッサは、マイクロプロセッサであってよいが、代案においては、プロセッサが、コントローラ、マイクロコントローラ、または状態機械、あるいはこれらの組み合わせ、などであってよい。プロセッサを、演算装置の組み合わせとして実現することもでき、例えばDSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアと結合した1つ以上のマイクロプロセッサ、あるいは任意の他のそのような構成として実現することができる。主としてデジタル技術に関して説明を行ったが、プロセッサは、本質的にアナログのコンポーネントを含むこともできる。例えば、本明細書に記載の信号処理アルゴリズムのいずれかを、アナログ回路にて実行することができる。コンピュータ環境は、これらに限られるわけではないが、例えばマイクロプロセッサにもとづくコンピュータシステム、メインフレームコンピュータ、デジタル信号プロセッサ、可搬のコンピュータデバイス、電子手帳(personal organizer)、デバイスコントローラ、および電気機器における計算エンジンなど、任意の種類のコンピュータシステムを含むことができる。
【0058】
本明細書に開示の実施形態に関連して説明した方法、プロセス、またはアルゴリズムの各段階を、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、または両者の組み合わせにおいて、直接的に具現化することができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、またはコンピュータにとって読み取り可能な任意の他の形態の非一時的記憶媒体、媒体、あるいは技術的に公知の物理的なコンピュータ記憶装置に属することができる。典型的な記憶媒体を、記憶媒体からの情報の読み出しおよび記憶媒体への情報の書き込みが可能であるようにプロセッサに接続することができる。代案においては、記憶媒体がプロセッサと一体であってよい。プロセッサおよび記憶媒体が、ASICに属することができる。ASICは、ユーザ端末に属することができる。代案においては、プロセッサおよび記憶媒体が、個別のコンポーネントとしてユーザ端末に属することができる。
【0059】
とりわけ「・・・できる」、「・・・してもよい」、「・・・が可能である」、「例えば」、など、本明細書において使用される条件付きの表現は、一般に、とくにそのようでないと述べられず、あるいは使用の文脈からそのようでないと理解されない限り、特定の特徴、要素、および/または状態が特定の実施形態には含まれるが、他の実施形態には含まれない旨を伝えることを意図している。したがって、そのような条件付きの表現は、一般に、特徴、要素、および/または状態が1つ以上の実施形態にとって必ずや必要であるという意味ではなく、1つ以上の実施形態がこれらの特徴、要素、および/または状態が任意の特定の実施形態に含まれ、あるいは実行されるかどうかを著者の入力または促しにより、あるいは著者の入力または促しを必要とせずに決定するための論理を必ずや含むという意味でもない。用語「・・・を備える」、「・・・を含む」、「・・・を有する」、などは、同義語であり、制限のないやり方で包含を意味して使用され、さらなる要素、特徴、行為、動作、などを排除するものではない。また、用語「または」は、(除外の意味ではなくて)包含の意味で使用され、例えば要素の列挙をつなげるために使用されるとき、用語「または」は、列挙される要素のうちの1つ、一部、またはすべてを意味する。
【0060】
以上の詳細な説明は、種々の実施形態に適用された新規な特徴を図示し、説明し、指摘しているが、例示した装置またはアルゴリズムの形態および詳細において、種々の省略、置換、および変更が、本発明の技術的思想から離れることなく可能であることを、理解できるであろう。理解されるとおり、いくつかの特徴を他の特徴とは別個に使用または実施できるため、本明細書に記載の本発明の特定の実施形態を、本明細書に記載の特徴および利点をすべては提供しない形態で具現化することが可能である。
以下に、本願出願時の特許請求の範囲に記載された発明を付記する。
[1] 1対のスピーカによって再生されるステレオオーディオ信号を仮想的に拡張するための方法であって、前記方法は、
左オーディオ信号と右オーディオ信号とを備えるステレオオーディオ信号を受信することと;
前記左オーディオ信号を左チャネルに供給し、前記右オーディオ信号を右チャネルに供給することと;
1対のスピーカと聴取者の反対側の両耳との間のクロストークを完全に打ち消す試みにおいて、前記クロストークの影響を軽減するために、計算集約型頭部伝達関数(HRTF)を採用することなく音響ダイポールの原理を採用することと、ここで、前記採用することは、
1つ以上のプロセッサによって、
少なくとも(a)反転済み左オーディオ信号を生成するために前記左オーディオ信号を反転させることと、(b)前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせることとによって、第1の音響ダイポールを近似することと、
少なくとも(a)反転済み右オーディオ信号を生成するために前記右オーディオ信号を反転させることと、(b)前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせることとによって、第2の音響ダイポールを近似することと、
を備える;
左フィルタ処理済み信号を生成するために、前記第1の音響ダイポールに単一の第1の逆HRTFを適用することと、前記第1の逆HRTFは前記左チャネルから前記右チャネルへの第1のクロストーク経路よりもむしろ前記左チャネルの第1の直接経路に適用される;
右フィルタ処理済み信号を生成するために、前記第2の音響ダイポールに単一の第2の逆HRTF関数を適用することと、前記第2の逆HRTFは前記右チャネルから前記左チャネルへの第2のクロストーク経路よりもむしろ前記右チャネルの第2の直接経路に適用される、ここで、前記第1および第2の逆HRTFは前記左および右フィルタ処理済み信号の間の両耳間強度差(IID)をもたらす;
聴取者によって左右のスピーカの間の実際の距離よりも広く知覚されるように構成されたステレオイメージをもたらすように、前記1対のスピーカにおける再生のために前記左および右フィルタ処理済み信号を供給することと、
を備える方法。
[2] 前記第1の音響ダイポールを近似することは、前記左オーディオ信号に第1の遅延を適用することをさらに備えており、前記第2の音響ダイポールを近似することは、前記右オーディオ信号に第2の遅延を適用することをさらに備えており、前記第1および第2の遅延は、両耳間時間差(ITD)をもたらすように選択される前記[1]に記載の方法。
[3] 増強済み左オーディオ信号を生成するために前記左オーディオ信号を増強することと;
増強済み左フィルタ処理済みオーディオ信号を生成するために前記増強済み左オーディオ信号を前記左フィルタ処理済み信号と組み合わせることと;
増強済み右オーディオ信号を生成するために前記右オーディオ信号を増強することと;
増強済み右フィルタ処理済みオーディオ信号を生成するために前記増強済み右オーディオ信号を前記右フィルタ処理済み信号と組み合わせることと、
をさらに備える前記[1]または[2]に記載の方法。
[4] 前記供給することを実行する前に、前記左および右フィルタ処理済み信号を増強すること
をさらに備える前記[1]ないし[3]のいずれか一項]に記載の方法。
[5] 前記増強することは、
第2の左フィルタ処理済み信号を生成するために前記左フィルタ処理済み信号を高域通過フィルタ処理することと、これにより、前記左フィルタ処理済み信号中の低周波ひずみを軽減する;
第2の右フィルタ処理済み信号を生成するために前記右フィルタ処理済み信号を高域通過フィルタ処理することと、これにより、前記右フィルタ処理済み信号中の低周波ひずみを軽減する、
を備える前記[4]に記載の方法。
[6] 前記増強することは、
より低い周波数をより高い周波数と比べて増強することによってより高い周波数のクリッピングを回避するために、前記左および右オーディオ信号のうちの一方または両方のダイナミックレンジの圧縮を実行すること
をさらに備える前記[4]または[5]に記載の方法。
[7] 前記ダイナミックレンジの圧縮を実行することは、
前記左および右フィルタ処理済み信号のうちの一方または両方にリミッタを適用すること
を備える前記[6]に記載の方法。
[8] 1対のスピーカによって再生されるステレオオーディオ信号を仮想的に拡張するためのシステムであって、前記システムは、
左オーディオ信号および右オーディオ信号を受信し、
少なくとも(a)反転済み左オーディオ信号を生成するために前記左オーディオ信号を反転させ、(b)前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせることによって、第1の音響ダイポールを近似し、
少なくとも(a)反転済み右オーディオ信号を生成するために前記右オーディオ信号を反転させ、(b)前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせることによって、第2の音響ダイポールを近似する
ように構成された音響ダイポールコンポーネント;および
左フィルタ処理済み信号を生成するために前記第1の音響ダイポールに単一の第1の聴き取り応答関数を適用し、
右フィルタ処理済み信号を生成するために前記第2の音響ダイポールに単一の第2の聴き取り応答関数を適用する、
ように構成された両耳間強度差(IID)コンポーネント;
を備えており、
ここで、前記システムは、聴取者によって前記左右のスピーカの間の実際の距離よりも広く知覚されるように構成されたステレオイメージをもたらすように、左右のスピーカによる再生のために前記左および右フィルタ処理済み信号を供給するように構成され;
前記音響ダイポールコンポーネントおよび前記IIDコンポーネントは、1つ以上のプロセッサによって実現されるように構成されている、システム。
[9] 前記供給することは、
前記左および右フィルタ処理済み信号を増強して増強済み左および右信号をもたらし、前記増強済み左および右信号を前記左右のスピーカの各々へともたらすように構成された少なくとも1つの増強コンポーネントへと、前記左および右フィルタ処理済み信号をもたらすこと
を備えている前記[8]に記載のシステム。
[10] 前記第1および第2の逆HRTFは、実質的に同じスペクトル特性を有する前記[8]または[9]に記載のシステム。
[11] 前記第1および第2の逆HRTFは、利得においてのみ相違する前記[10]に記載のシステム。
[12] 前記利得の相違が、前記左右のスピーカの間の両耳間強度差をもたらす前記[11]に記載のシステム。
[13]
前記音響ダイポールコンポーネントは、前記左および右オーディオ信号のうちの一方または両方に利得を加えるようにさらに構成されている前記[8]ないし[12]のいずれか一項]に記載のシステム。
[14] 前記音響ダイポールコンポーネントおよび前記IIDコンポーネントは、前記左右のスピーカの間のクロストークを完全に打ち消すことなく、ステレオ分離をもたらすように構成されている前記[8]ないし[12]のいずれか一項]に記載のシステム。
[15] プロセッサによって実行することができる命令を記憶している非一時的物理的な電子ストレージであって、
前記命令は、1つ以上のプロセッサによって実行されたときに、1対のスピーカによって再生されるステレオオーディオ信号を仮想的に拡張するためのコンポーネントを実現し、
前記コンポーネントは、
左オーディオ信号および右オーディオ信号を受信し、
少なくとも(a)反転済み左オーディオ信号を生成するために前記左オーディオ信号を反転させ、(b)第1の模擬音響ダイポールを形成するために前記反転済み左オーディオ信号を前記右オーディオ信号と組み合わせ、
少なくとも(a)反転済み右オーディオ信号を生成させるために前記右オーディオ信号を反転させ、(b)第2の模擬音響ダイポールを形成するために前記反転済み右オーディオ信号を前記左オーディオ信号と組み合わせる、ように構成された音響ダイポールコンポーネントと;
左フィルタ処理済み信号を生成するために前記第1の模擬音響ダイポールに単一の第1の逆頭部伝達関数(HRTF)を適用し、
右フィルタ処理済み信号を生成するために前記第2の模擬音響ダイポールに単一の第2の逆HRTFを適用する、ように構成された両耳間強度差(IID)と、
を備える非一時的物理的な電子ストレージ。
[16] 前記第1および第2の逆HRTFは、同じ逆HRTFである前記[15]に記載の非一時的物理的な電子ストレージ。
[17] 前記第1および第2の逆HRTFは、同じ逆HRTFから導出される前記[15]または[16]に記載の非一時的物理的な電子ストレージ。
[18] 前記IIDコンポーネントは、前記第1の逆HRTFに前記第2の逆HRTFとは異なる利得を割り当てることによって両耳間強度差を生成するように構成されている前記[18]に記載の非一時的物理的な電子ストレージ。
[19] 1つ以上の物理的なプロセッサに組み合わせられた前記[15]ないし[18]のいずれか一項]に記載の非一時的物理的な電子ストレージ。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11