IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ティ エイチ エックス リミテッドの特許一覧

特表2023-522995音響クロストークのキャンセルと仮想スピーカ技術
<>
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図1
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図2
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図3
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図4
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図5
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図6
  • 特表-音響クロストークのキャンセルと仮想スピーカ技術 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-06-01
(54)【発明の名称】音響クロストークのキャンセルと仮想スピーカ技術
(51)【国際特許分類】
   H04S 1/00 20060101AFI20230525BHJP
   H04S 3/00 20060101ALI20230525BHJP
【FI】
H04S1/00 200
H04S3/00 200
H04S1/00 700
H04S3/00 800
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022564357
(86)(22)【出願日】2021-04-05
(85)【翻訳文提出日】2022-12-16
(86)【国際出願番号】 US2021025813
(87)【国際公開番号】W WO2021216274
(87)【国際公開日】2021-10-28
(31)【優先権主張番号】16/857,033
(32)【優先日】2020-04-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】503289676
【氏名又は名称】ティ エイチ エックス リミテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】グレイ,ラッセル
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA09
5D162CA12
5D162CB18
5D162CC34
5D162CD07
5D162DA12
5D162DA13
5D162DA16
5D162DA17
5D162EA02
5D162EC02
(57)【要約】
実施形態は、クロストークのキャンセル及び/又は仮想スピーカの生成を実行するための方法、装置、及びシステムを提供する。オーディオプロセッサは、クロストークキャンセル回路と線形化回路とを含むことができる。線形化回路は、クロストークキャンセル回路の周波数応答をオフセットして、フラットな全体的周波数応答を提供することができる。仮想スピーカ回路は、出力チャネルに関連付けられた入力信号を受信し、入力信号を変更せずに出力チャネルに渡すことができる。仮想スピーカ回路は、入力信号に基づいて仮想化信号を生成し、仮想化信号を別の物理チャネルに渡す。仮想化信号は、仮想スピーカ回路によって生成された仮想スピーカの仮想スピーカ位置に対応する同側の頭部伝達関数(HRTF)と反対側のHRTFに基づいてさらに生成されることができる。他の実施形態は記載され及び/又は請求されることができる。
【特許請求の範囲】
【請求項1】
オーディオプロセッサ回路であって:
入力オーディオ信号を受信する入力ターミナルと;
出力オーディオ信号を提供する出力ターミナルと;
前記入力ターミナルと前記出力ターミナルとの間に結合され、出力オーディオ信号にクロストークキャンセル信号を提供するクロストークキャンセル回路であって、前記クロストークキャンセル回路は第1周波数応答を有する、クロストークキャンセル回路と;
前記入力ターミナルと前記出力ターミナルとの間で前記クロストークキャンセル回路と直列に結合された線形化回路であって、前記線形化回路は、第2周波数応答を有し、動作レンジにわたってフラットな、オーディオプロセッサ回路のための全体的周波数応答を提供する、線形化回路と;
を備える、オーディオプロセッサ回路。
【請求項2】
前記クロストークキャンセル回路は、フィルタを有するフィードバックループと、前記クロストークキャンセル回路の出力と前記クロストークキャンセル回路の入力との間で前記フィードバックループに結合された、減衰要素と、遅延要素と、を含む、
請求項1記載のオーディオプロセッサ回路。
【請求項3】
前記フィルタは第1フィルタであり、前記減衰要素は第1減衰要素であり、前記遅延要素は第1遅延要素であり、
前記線形化回路は、第2フィルタを有するフィードフォワードループと、前記線形化回路の入力と前記線形化回路の出力との間でフィードフォワードループに結合された第2遅延要素と、第2減衰要素と、を含む、
請求項2記載のオーディオプロセッサ回路。
【請求項4】
前記線形化回路の1つ以上の値を、前記クロストークキャンセル回路の対応する1つ以上の値と同じになるように制御する制御回路をさらに備える、
請求項1記載のオーディオプロセッサ回路。
【請求項5】
前記線形化回路は、前記入力オーディオ信号を受信し、前記入力オーディオ信号に基づいて中間オーディオ信号を生成するものであり、
前記クロストークキャンセル回路は、前記中間オーディオ信号を受信し、前記中間オーディオ信号に基づいて前記出力オーディオ信号を生成するものである、
請求項1記載のオーディオプロセッサ回路。
【請求項6】
前記入力ターミナルと前記出力ターミナルとの間の信号経路上の前記クロストークキャンセル回路の第1周波数応答は:
【数11】
であり、Y(z)は前記出力オーディオ信号であり、Kは第1遅延値であり、aは第1減衰値であり、H(z)は第1フィルタ関数であり;
前記線形化回路の前記第2周波数応答は:
【数12】
であり、M(z)は前記中間オーディオ信号であり、X(z)は前記入力オーディオ信号であり、Kは第2遅延値であり、aは第2減衰値であり、H(z)は第2フィルタ関数であり;
【数13】
である、
請求項5記載のオーディオプロセッサ回路。
【請求項7】
前記入力オーディオ信号は第1入力オーディオ信号であり、前記オーディオプロセッサ回路は仮想スピーカ回路をさらに含み、前記仮想スピーカ回路は:
第2入力オーディオ信号を受信し、前記第2入力オーディオ信号はマルチチャネルリスニング環境の第1物理チャネルに対応し;
前記第2入力オーディオ信号を、前記第1物理チャネルのための前記第1入力オーディオ信号として、前記クロストークキャンセル回路に渡し;
前記第2入力オーディオ信号に基づいて前記マルチチャネルリスニング環境の仮想チャネルを生成し、前記仮想チャネルは仮想チャネル位置に関連する、ものであり、
前記仮想スピーカ回路は、前記仮想チャネルを生成するために:
前記第2入力オーディオ信号、仮想チャネル位置に対応する同側の頭部伝達関数(HRTF)、及び、前記仮想チャネル位置に対応する反対側のHRTFに基づいて、仮想化オーディオ信号を生成し;
前記仮想化オーディオ信号をマルチチャネルリスニング環境の第2物理チャネルに提供する、ものである、
請求項1乃至6いずれか1項記載のオーディオプロセッサ回路。
【請求項8】
前記仮想スピーカ回路は、前記第2入力オーディオ信号を、変更することなく、クロストークキャンセル回路に渡すものである、
請求項7記載のオーディオプロセッサ回路。
【請求項9】
前記仮想化オーディオ信号は、
【数14】
にしたがって生成され、Yは周波数ドメイン内の前記仮想化オーディオ信号であり、H12は前記反対側のHRTFであり、H11は同側のHRTFであり、Xは前記第1物理チャネルの前記第2入力オーディオ信号である、
請求項7記載のオーディオプロセッサ回路。
【請求項10】
オーディオプロセッサ回路であって:
マルチチャネルリスニング環境の第1物理チャネルに対応する入力オーディオ信号を受信する入力ターミナルと;
前記入力ターミナルに結合する仮想スピーカ回路と;を備え、
前記仮想スピーカ回路は、前記入力オーディオ信号に基づいて前記マルチチャネルリスニング環境の仮想チャネルを生成し、前記仮想チャネルは仮想チャネル位置に関連し、
前記仮想スピーカ回路は、前記仮想チャネルを生成するために:
前記入力オーディオ信号、仮想チャネル位置に対応する同側の頭部伝達関数(HRTF)、及び、前記仮想チャネル位置に対応する反対側のHRTFに基づいて、仮想化オーディオ信号を生成し;
前記仮想化オーディオ信号をマルチチャネルリスニング環境の第2物理チャネルに提供する、ものである、
オーディオプロセッサ回路。
【請求項11】
前記仮想スピーカ回路はさらに、前記入力オーディオ信号を、変更することなく、前記第1物理チャネルに関連する物理的なスピーカに渡すものである、
請求項10記載のオーディオプロセッサ回路。
【請求項12】
前記仮想化オーディオ信号は、
【数15】
は周波数ドメイン内の前記仮想化オーディオ信号であり、H12は前記反対側のHRTFであり、H11は同側のHRTFであり、Xは前記第1物理チャネルのための前記入力オーディオ信号である、
請求項10記載のオーディオプロセッサ回路。
【請求項13】
前記入力オーディオ信号は第1入力オーディオ信号であり、前記仮想化オーディオ信号は第1仮想化オーディオ信号であり、
前記仮想スピーカ回路はさらに:
前記マルチチャネルリスニング環境の前記第2物理チャネルと関連する第2入力オーディオ信号を受信し;
第2入力オーディオ信号に基づいて前記仮想チャネルのための第2仮想化オーディオ信号を生成し;
前記第2仮想化オーディオ信号を前記第1物理チャネルに提供する、ものである、
請求項10乃至12いずれか1項記載のオーディオプロセッサ回路。
【請求項14】
オーディオプロセッサを備えるオーディオ出力システムであって、
前記オーディオプロセッサは:
入力オーディオ信号を受信し、前記入力オーディオ信号に基づいて中間オーディオ信号を生成する線形化回路であって、前記線形化回路は第1周波数応答を有する、線形化回路と;
前記中間オーディオ信号を受信し、出力オーディオ信号を生成して前記中間オーディオ信号のクロストークをキャンセルするクロストークキャンセル回路であって、前記クロストークキャンセル回路は、第2周波数応答を有し、動作レンジにわたってフラットな、前記オーディオプロセッサのための全体的周波数応答を提供する、クロストークキャンセル回路と;
前記オーディオプロセッサと結合するオーディオ増幅器であって、前記オーディオ増幅器は、前記出力オーディオ信号を増幅し、前記出力オーディオ信号を1つ以上のスピーカに提供する、オーディオ増幅器と、
を備える、オーディオ出力システム。
【請求項15】
前記クロストークキャンセル回路は、フィルタを有するフィードバックループと、前記クロストークキャンセル回路の出力と前記クロストークキャンセル回路の入力との間で前記フィードバックループに結合された、減衰要素と、遅延要素と、を含む、
請求項14記載のオーディオ出力システム。
【請求項16】
前記フィルタは第1フィルタであり、前記減衰要素は第1減衰要素であり、前記遅延要素は第1遅延要素であり、
前記線形化回路は、
前記第1フィルタと同じフィルタ機能を有する第2フィルタを備えたフィードフォワードループと、
前記第1減衰要素と同じ減衰値を有する第2減衰要素と、
前記第1遅延要素と同じ遅延値を有する第2遅延要素と、を含み、
前記第2フィルタ、前記第2減衰要素及び前記第2遅延要素は、前記線形化回路の入力と前記線形化回路の出力との間でフィードフォワードループ内に結合されている、
請求項15記載のオーディオ出力システム。
【請求項17】
前記線形化回路の前記第1周波数応答は:
【数16】
であり、M(z)は前記中間オーディオ信号であり、X(z)は前記入力オーディオ信号であり、Kは線形化遅延値であり、aは線形化減衰値であり、H(z)は線形化フィルタ関数であり;
前記クロストークキャンセル回路の前記第2周波数応答は:
【数17】
であり、Y(z)は前記出力オーディオ信号であり、Kはクロストーク遅延値であり、aはクロストーク減衰値であり、H(z)はクロストークフィルタ関数であり;
【数18】
である、
請求項14記載のオーディオ出力システム。
【請求項18】
前記入力オーディオ信号は第1入力オーディオ信号であり、
前記オーディオプロセッサは仮想スピーカ回路をさらに含み、前記仮想スピーカ回路は:
第2入力オーディオ信号を受信し、前記第2入力オーディオ信号はマルチチャネルリスニング環境の第1物理チャネルに対応し;
前記第2入力オーディオ信号を変更せずに前記線形化回路の第1入力に渡し、前記第1入力は前記第1物理チャネルのためのものであり;
前記出力オーディオ信号、仮想チャネル位置に対応する同側の頭部伝達関数(HRTF)、及び、前記仮想チャネル位置に対応する反対側のHRTFに基づいて仮想化オーディオ信号を生成し;
前記仮想化オーディオ信号を前記線形化回路の第2入力に提供し、前記仮想チャネル位置と関連する仮想チャネルを生成し、前記第2入力は、前記マルチチャネルリスニング環境の第2物理チャネルに対応する、ものである、
請求項14記載のオーディオ出力システム。
【請求項19】
前記仮想化オーディオ信号は、
【数19】
であり、Yは周波数ドメイン内の前記仮想化オーディオ信号であり、H12は前記反対側のHRTFであり、H11は同側のHRTFであり、Xは前記第1物理チャネルのための前記第2入力オーディオ信号である、
請求項18記載のオーディオ出力システム。
【請求項20】
前記オーディオ増幅器に結合され、増幅された前記出力オーディオ信号を受信する、前記1つ以上のスピーカをさらに有する、
請求項14乃至19いずれか1項記載のオーディオ出力システム。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願]
本願は、2020年4月23日に出願された米国出願第16/857,033号 「ACOUSTIC CROSSTALK CANCELLATION AND VIRTUAL SPEAKERS TECHNIQUES(音響クロストークキャンセル及びバーチャルスピーカー技術)」に基づく先権を主張する。
[技術分野]
本明細書の実施形態は、オーディオ再生の分野、より具体的には、音響クロストークキャンセル及び仮想スピーカ技術に関する。
【背景技術】
【0002】
オーディオ再生システムでは、左ラウドスピーカがリスナの右耳にサウンドエネルギーを導入するとき、及び/又は、右ラウドスピーカがリスナの左耳にサウンドエネルギーを導入するときに、音響クロストークが発生する。いくつかのシステムでは、この不所望なサウンドエネルギーを除去するためにクロストークキャンセルプロセスが実装されている。ただし、これらのクロストークキャンセルプロセスは、スペクトルアーティファクト(例えば、フィードバック動作におけるコムフィルタリング(comb filtering))をもたらす。
【0003】
さらに、いくつかのオーディオ再生システムでは、仮想スピーカ技術を実装して、リスナに、ラウドスピーカの物理的位置(physical location)以外のソースに由来する音として認識させることができる。これは典型的には、ソースオーディオを操作して音響心理学的な位置の手がかり又はキュー(location cues)が含まれるようにすることで実現される。例えば、従来の方法では、各チャネルで頭部インパルス応答(HRIR)コンボリューションを実行して、心理音響的な位置の手がかりを追加する。しかし、これらの仮想スピーカ技術は、出力信号にスペクトルアーティファクトももたらす。
【図面の簡単な説明】
【0004】
添付の図面及び添付の特許請求の範囲と併せて、以下の詳細な説明によれば、実施形態は容易に理解されよう。
実施形態は、添付の図面の図示において限定ではなく例として示されている。
図1図1は、種々の実施形態による、クロストークキャンセル回路及び線形化回路を備えたオーディオプロセッサを模式的に示す図である。
図2図2は、種々の実施形態による、クロストークキャンセル回路及び線形化回路の実装例を模式的に示す図である。
図3図3は、種々の実施形態による、仮想スピーカ回路、クロストークキャンセル回路及び線形化回路を備えたオーディオプロセッサを模式的に示す図である。
図4図4は、種々の実施形態による、仮想スピーカ回路を備えたオーディオプロセッサを模式的に示す図である。
図5図5は、種々の実施形態による、仮想スピーカ回路の実装例を模式的に示す図である。
図6図6は、種々の実施形態による、仮想スピーカ方法を示すためのリスニング環境を模式的に示す図である。
図7図7は、種々の実施形態による、本明細書に記載されたクロストークキャンセル方法及び/又は仮想スピーカ方法を実装することができるオーディオ再生システムを模式的に示す図である。
【発明を実施するための形態】
【0005】
本明細書の種々の実施形態は、クロストークをキャンセルし及び/又は1つ以上の仮想スピーカを生成するオーディオプロセッサについて記載する。例えば、オーディオプロセッサは、入力ターミナルと出力オーディオターミナルとの間で、互いに直列に結合されたクロストークキャンセル回路と線形化回路とを含むことができる。クロストークキャンセル回路は、入力信号に基づいて出力ターミナルにクロストークキャンセル信号を提供し、クロストークをキャンセルすることができる。クロストークキャンセル回路は第1周波数応答を有する。線形化回路は第2周波数応答を有し、動作レンジにわたってフラットな(flat)(例えば1に等しい)、クロストークキャンセル方法のための全体的周波数応答(overall frequency response)を提供する。例えば、第2周波数応答は、第1周波数応答の逆数又は逆関数(inverse)でありうる。したがって、線形化回路とクロストークキャンセル回路との組み合わせは、出力信号に対してクロストークキャンセルを提供しつつ、フラットな周波数応答も提供することができる。
【0006】
付加的に又は代替的に、オーディオプロセッサは仮想スピーカ回路を含むことができる。仮想スピーカ回路は、マルチチャネルリスニング環境の物理チャネルの入力信号を受信することができる。仮想スピーカ回路は、変更されていない入力信号を、物理チャネルに関連する第1出力ターミナルに渡すことができる(例えば、同側出力(the ipsilateral output))。仮想スピーカ回路は、入力信号に基づいて仮想化信号を生成し、仮想化信号を第2物理チャネルに関連する第2出力ターミナルに提供することができる(例えば、反対側出力(the contralateral output))。仮想化信号は、後述するように、仮想スピーカの仮想スピーカ位置に対応する同側の頭部伝達関数(HRTF)と反対側のHRTFに基づいてさらに生成されることができる。したがって、仮想スピーカ方法は、同側の出力にスペクトルアーティファクトをもたらさないことができる。さらに、仮想スピーカ方法はリアルタイムで動作することができ、限られたデジタル信号処理リソースしか必要としないことができ、幅広い製品価格カテゴリに展開することができる。
【0007】
これら及び他の実施形態については、以下でさらに詳細に記載する。
【0008】
この詳細な説明では、本明細書の一部を形成し、実施され得る例示的な実施形態として示される添付の図面を参照する。本発明の範囲から逸脱することなく、他の実施形態を利用することができ、構造的又は論理的な変更を行うことができることを理解されたい。したがって、詳細な説明は、限定的な意味で解釈されるべきではない。
【0009】
実施形態を理解するのに役立つように、種々の動作を複数の個別の動作として順番に記載することができる;ただし、記載の順序は、これらの動作が順序に依存することを意味すると解されるべきではない。
【0010】
説明は、上/下(up/down)、後/前(back/front)、頂部/底部(top/bottom)などの視点ベースの記載を使用することがある。かかる記載は、議論を容易にするために使用されるだけであり、開示された実施形態の適用を制限することを意図するものではない。
【0011】
「結合された(coupled)」及び「接続された(connected)」という用語は、それらの派生語とともに使用されることができる。これらの用語は、互いに同義語として意図されていないことを理解されたい。むしろ、特定の実施形態では、「接続された」は、2つ以上の要素が互いに物理的又は電気的に直接コンタクトしていることを示すために使用されることができる。「結合」とは、2つ以上の要素が物理的又は電気的に直接コンタクトしていることを意味することができる。しかしながら、「結合」は、2つ以上の要素が互いに直接コンタクトしていないが、それでもなお互いに協働又は相互作用することを意味することもできる。
【0012】
説明の目的で、「A/B」の形又は「A及び/又はB」の形のフレーズは、(A)、(B)、又は(A及びB)を意味する。説明の目的で、「A、B、及びCの少なくとも1つ」という形のフレーズは、(A)、(B)、(C)、(A及びB)、(A及びC)、(B及びC)、又は(A、B及びC)を意味する。説明の目的で、「(A)B」という形の語句は、(B)又は(AB)を意味する、つまり、Aは任意の要素である。
【0013】
説明では、「実施形態」又は「複数の実施形態」という用語を使用することができ、これらはそれぞれ、同じ又は異なる実施形態のうちの1つ以上を指すことができる。さらに、実施形態に関して使用される「備える(comprising)」、「含む(including)」、「有する(having)」などの用語は同義語であり、一般に「オープンな」用語として意図されている(例えば、「含む」という用語は「含むが、これに限定されない」と解釈されるべきであり、「有する」という用語は「少なくとも有する」と解釈されるべきであり、「含む」という用語は、「含むがこれに限定されない」などと解釈されるべきである)。
【0014】
本明細書で使用される「回路網」又は「回路」という用語は、1つ以上のソフトウェア又はファームウェアプログラム、組み合わせ論理回路、及び/又は記述された機能を提供する他の適切なコンポーネントを実行する、特定用途向け集積回路(ASIC)、電子回路、プロセッサ(共有、専用又はグループ)及び/又はメモリ(共有、専用又はグループ)を指すか、その一部であるか、又はそれを含むことができる。
【0015】
本明細書における任意の複数及び/又は単数の用語の使用に関して、当業者は、文脈及び/又は適用に適切であるように、複数から単数に及び/又は単数から複数に変換することができる。明確にするために、本明細書では、種々の単数/複数の順列が明示的に示されている場合がある。
【0016】
図1は、種々の実施形態によるオーディオプロセッサ100を示す。オーディオプロセッサ100は、入力ターミナル102で入力オーディオ信号x[n]を受信し、出力ターミナル104で出力オーディオ信号y[n]を生成することができる。オーディオプロセッサ100は、入力ターミナル102と出力ターミナル104との間で互いに直列に結合されたクロストークキャンセル回路106と線形化回路108とを含むことができる。
例えば、いくつかの実施形態では、信号経路に沿って線形化回路108の後にクロストークキャンセル回路106を(例えば、線形化回路108と出力ターミナル104のと間に)結合することができる。
【0017】
いくつかの実施形態では、入力オーディオ信号x[n]は、複数のチャネルを有するオーディオ再生システムの1つのチャネルに対応することができる。オーディオ再生システムは、システムの個々のチャネルにそれぞれ対応するオーディオプロセッサ100を含むことができる。いくつかの実施形態では、オーディオプロセッサ100は、左スピーカと右スピーカとを有する2チャネルオーディオシステムに実装することができる。付加的に又は代替的に、オーディオプロセッサ100は、2つ以上のスピーカを有するマルチチャネルオーディオシステム(例えば、サラウンドサウンドシステム)に実装することもできる。マルチチャネルオーディオシステムは、左右のスピーカと同じ平面に追加のスピーカ(例えば、リスナレベルのスピーカ)、及び/又は1つ以上の他の平面に追加のスピーカ(例えば、高さスピーカ)を含むことができる。
【0018】
種々の実施形態では、異なるチャネルのためのオーディオプロセッサ100は、いくつかの実施形態では、同じ処理回路(例えば、デジタルシグナルプロセッサ)に実装され、共有コンポーネントを含むことがあるか又は含まないことがある。代替的に又は付加的に、オーディオ再生システムは、1つ以上のそれぞれのチャネルのための個別のオーディオプロセッサを有する複数の集積回路を含むことができる。いくつかの実施形態では、オーディオプロセッサ100は、入力オーディオ信号をデジタル信号として(例えば、デジタルソースから及び/又はアナログ-デジタル変換器(ADC)を介して)受信することができる。出力オーディオ信号を、スピーカに渡す前に、デジタルアナログ(DAC)変換器によってアナログオーディオ信号に変換されることができる。
【0019】
様々な実施形態において、クロストークキャンセル回路106は、その入力オーディオ信号に基づいて出力オーディオ信号を生成し、オーディオ信号中のクロストークアーティファクトをキャンセルすることができる(例えば、リスナの片方の耳に向けられたサウンドエネルギーが、リスナのもう片方の耳に届かないようにする)。クロストークキャンセル回路106は、図2に関して後述するように、非線形周波数応答を有することができる。したがって、クロストークキャンセル回路106は出力信号にスペクトルアーティファクトを導入することがある。
【0020】
種々の実施形態では、線形化回路108が含まれ、クロストークキャンセル回路106の周波数応答をオフセットし、(例えば、クロストークキャンセル回路106及び/又は線形化回路108の動作範囲にわたって)フラットなオーディオプロセッサ100の全体的な周波数応答を提供することができる。例えば、線形化回路108は、入力オーディオ信号x[n]を事前に歪ませて(pre-distort)、クロストークキャンセル回路106に提供される中間オーディオ信号m[n]を生成することができる。クロストークキャンセル回路106は中間オーディオ信号m[n]を処理して出力オーディオ信号y[n]を生成することができる。線形化回路108の周波数応答は、クロストークキャンセル回路106の周波数応答の数又は逆関数(inverse)でありうる。したがって、線形化回路108とクロストークキャンセル回路106との両方がオーディオ信号を処理すると、全体の周波数応答はフラットになる一方で、所望のクロストークキャンセルを提供することができる。これらの概念は、図2に関して以下にさらに説明する。
【0021】
図2は、種々の実施形態によるオーディオプロセッサ100に対応することができるオーディオプロセッサ200を示す。オーディオプロセッサ200は、入力ターミナル202で入力オーディオ信号x[n]を受信し、出力ターミナル204で出力オーディオ信号y[n]を提供することができる。前述のように、いくつかの実施形態では、入力オーディオ信号x[n]は、複数のチャネルを有するオーディオ再生システムの1つのチャネルに対応することができる。
【0022】
種々の実施形態において、オーディオプロセッサ200は、入力ターミナル202と出力ターミナル204との間に互いに直列に結合された(カスケードとも呼ばれる)クロストークキャンセル回路206と線形化回路208とを含むことができる。例えば、線形化回路208は、図2に示すように、クロストークキャンセル回路206よりも信号経路内で早く結合されることができる。線形化回路208は、入力オーディオ信号x[n]を受信し、クロストークキャンセル回路206に(例えば中間ノード216で)提供される中間オーディオ信号m[n]を生成することができる。クロストークキャンセル回路206は、中間オーディオ信号m[n]を受信し、出力オーディオ信号y[n]を生成することができる。図2に示すクロストークキャンセル回路206は、(例えば、異なる入力チャネル及び/又は出力チャネルに対応する)複数の入力と出力とを含む、より大きなクロストークキャンセル回路の1つの信号経路を示すことができる。
【0023】
種々の実施形態において、クロストークキャンセル回路206は、その入力オーディオ信号(例えばm[n])を変更して、クロストークのアーティファクトをキャンセルすることができる。例えば、クロストークキャンセル回路206は、出力ターミナル204からクロストークキャンセル回路206の入力に結合された加算器218へのフィードバックループ内で結合された、フィルタ210、遅延要素212、及び/又は減衰素子214を含むことができる。クロストークキャンセル回路206のフィードバックループからのフィードバックは、加算器218によって入力オーディオ信号から減算され、出力ターミナル204で出力オーディオ信号y[n]が生成される。いくつかの実施形態は、追加のフィードバックループ及び/又はクロストークキャンセル回路206のフィードバックループ上に追加の又は異なる処理要素を含むことができる。
【0024】
フィルタ210、遅延要素212、及び/又は減衰要素214の値及び/又は構成は、システム構成(例えば、スピーカの数やスピーカーレイアウトなど)、予測、測定、又は決定されたリスナ位置、頭部伝達関数、意図された出力機能などの、任意の適切な要因に基づいて決定することができる。
【0025】
クロストークキャンセル回路206を単独(例えば、線形化回路208を使用しない場合)で見ると、クロストークキャンセル回路206の入力(m[n])に基づく離散時間ドメインにおけるクロストークキャンセル回路206の出力(y[n])は、式(1)で与えられる:
【数1】
ここで、Kは遅延素子212の遅延値、aは減衰素子214の減衰値、h[n]はフィルタ210のフィルタ関数である。
【0026】
式(1)を周波数ドメインに変換し、いくつかの代数的操作を実行すると、式(2)によるクロストークキャンセル回路206の周波数応答が得られる:
【数2】
【0027】
したがって、式(2)で示されるように、クロストークキャンセル回路206のフィードバックループによって提供されるクロストークキャンセルは、一様でない周波数応答を有する(例えば、スペクトルアーティファクトを導く)。
【0028】
種々の実施形態では、線形化回路208は、クロストークキャンセル回路206への入力として提供される中間オーディオ信号m[n]を生成し、フィードバックループの周波数効果のバランスをとり、オーディオプロセッサ200の全体的な周波数応答を均一にする。例えば、線形化回路208は、入力ターミナル202から中間ノード216に結合された加算器226へのフィードフォワードループで結合されたフィルタ220、遅延素子222、及び/又は減衰素子224を含むことができる。フィードフォワードループからのフィードフォワード信号は、加算器226によって線形化回路208の出力に加算され、中間オーディオ信号m[n]が生成される。
【0029】
線形化回路208を単独で見ると、線形化回路208の出力は式(3)で与えられる:
【数3】
ここで、Kは遅延要素222の遅延値、aは減衰要素224の減衰値、h[n]はフィルタ220のフィルタ関数である。
【0030】
式(3)を周波数ドメインに変換し、いくつかの代数的操作を実行すると、式(4)によるフィードフォワードループ208の周波数応答が得られる:
【数4】
【0031】
式(2)と式(4)とを組み合わせると、図(5)に示されるオーディオプロセッサ200の全体的な周波数応答が得られる:
【数5】
【0032】
したがって、次の条件を満たす場合、オーディオプロセッサ200の全体的な周波数応答は1になることがわかる(すなわち、周波数スペクトルにわたってフラットである):
【数6】
【0033】
したがって、クロストークキャンセル回路206のフィードバックループ及び線形化回路208のフィードフォワードループの要素は、式(6)の上記の条件を満たすように設計及び/又は制御することができる。例えば、制御回路(例えば、デジタル信号プロセッサで実装される)は、フィルタ、遅延、減衰の値及び/又はその他の値がフィードバックループ全体で同じになり、フィードフォワードループがフィードバックループと対応するフィードフォワードループとの間で同じになるように制御することができる。
【0034】
オーディオプロセッサ200は、複数のクロストークキャンセル回路206及び線形化回路208及び/又は追加の信号経路を含み、複数の入力オーディオ信号(例えば、異なるチャネルに対応する)から出力オーディオ信号を生成することができる。結果として得られるオーディオプロセッサ200は、フラットな周波数応答を提供しながら、オーディオ信号の音響クロストークをキャンセルする。オーディオプロセッサ200の要素は、式(6)の条件が残っている限り、任意の所望の遅延、動作の帯域、及び/又は減衰レベル(例えば、フィルタ210と220、遅延要素212と222、及び/又は減衰要素214と224の値を調整することによって)で構成されることができる。
【0035】
前述のように、ここでは仮想スピーカのオーディオ処理方法、及び関連する装置やシステムについても説明する。仮想スピーカ方法は、ステレオ又はマルチチャネル(例えば2チャネル以上)のソースオーディオからの2つ以上の個別のドライブユニット(例えばスピーカ)を含むラウドスピーカーシステム(loudspeaker system)から再生される没入型空間オーディオリスニング環境を作成することができる。マルチチャネルリスニング環境には、環境のそれぞれの物理チャネルに対応する2つ以上の物理スピーカを含むことができる。マルチチャネルリスニング環境は、物理スピーカの位置とは異なるそれぞれの仮想スピーカ位置に関連付けられた1つ以上の仮想スピーカをさらに含むことができる。仮想スピーカは、仮想スピーカ方法によって、1つ以上の物理スピーカに提供されるオーディオ信号を変更することによって、生成されることができ、リスナに仮想出力チャネルがそれぞれの仮想スピーカ位置から到来すると認識させる。種々の実施形態において、物理的なスピーカはヘッドホンスピーカ及び/又はアウトボードスピーカ(outboard speakers)を含むことができる。
【0036】
種々の実施形態では、ここで記載する線形クロストークキャンセルプロセスに加えて仮想スピーカ方法を実装することができ、スペクトルアーティファクトの無い没入型リスニング環境(an immersive listening environment)を生成することができる。例えば、図3は、いくつかの実施形態によるオーディオプロセッサ300を示す。オーディオプロセッサ300は、入力ターミナル302と出力ターミナル304との間に結合された線形化回路308とクロストークキャンセル回路306とを含む。線形化回路308及び/又はクロストークキャンセル回路306は、ここで説明するそれぞれの線形化回路108及び/又は208、及び/又は、クロストークキャンセル回路106及び/又は206に対応することができる。オーディオプロセッサ300は、オーディオプロセッサ300の入力ターミナル302と線形化回路308の入力との間に結合された仮想スピーカ回路310をさらに含むことができる。仮想スピーカ回路310は、ここで記載する仮想スピーカ方法を実装することができる。
【0037】
あるいは、仮想スピーカ方法は、クロストークキャンセルなしで(例えばヘッドホンで使用する場合)、又はここに記載されているものとは異なるクロストークキャンセル方法と共に実装することもできる。例えば、図4は、入力ターミナル402と出力ターミナル404との間に直列に結合された仮想スピーカ回路410を含むオーディオプロセッサ400を示す。仮想スピーカ回路410は、ここで記載する仮想スピーカ方法を実装できる。
【0038】
仮想スピーカ方法の種々の実施形態では、物理的出力チャネルに関連付けられた所定の入力チャネルについて、仮想スピーカ処理方法による任意の修正なしに(ただし、入力オーディオ信号は、クロストークキャンセルなど、使用され得る他の処理動作によって処理されることはある)、入力オーディオ信号を対応する物理スピーカに渡す又は通過させる(passed)ことができる。仮想スピーカは、1つ以上の他の物理スピーカに追加の仮想化オーディオ信号を提供することによって生成されることができる。
【0039】
仮想スピーカ方法は、サラウンドサウンド環境の印象を作り出すために、リスナに心理音響的な手掛かり(psychoacoustic cues)を与える追加の信号処理とともに、着信オーディオストリームに適用される差分フィルタ(difference filters)を作成することによって動作することができる。この方法は、トランスデューサが物理的に互いに離れている2つの別個にアドレス可能な音響再生チャネルを含む任意の再生デバイス上で実装することができる。
【0040】
例えば、図5は、種々の実施形態による仮想スピーカ方法を実装することができる仮想スピーカ回路500を示す。いくつかの実施形態では、仮想スピーカ回路500は、仮想スピーカ回路310及び/又は410に対応することができる。仮想スピーカ回路500は、入力ターミナル502で入力信号x[n]を受信することができる。入力信号x[n]は、マルチチャネルリスニング環境の物理チャネル(例えば左スピーカチャネル)に対応することができる。仮想スピーカ回路500は、入力信号x[n]を変更せずに、物理チャネルに対応する第1出力ターミナル504に渡すことができる(例えば、物理的なスピーカ及び/又は物理チャネルの後続の処理回路(例えば、線形化回路及び/又はクロストークキャンセル回路)に渡す)。したがって、物理チャネルの出力信号y[n]は、物理チャネルの入力信号x[n]と同じになる。
【0041】
あるいは、仮想スピーカ回路500は、入力信号x[n]に基づいて仮想化信号y[n]を生成し、異なる物理チャネル(例えば、この例では右スピーカチャネル)に対応する第2出力ターミナル506に仮想化信号を渡すことができる。仮想化信号は、以下でさらに説明するように、仮想スピーカの仮想スピーカ位置に対応する同側HRTFと反対側HRTFに基づいてさらに生成されることができる。例えば、いくつかの実施形態では、仮想スピーカ回路500は、フィルタ520、減衰要素524、及び/又は遅延要素522を含み、それぞれのフィルタリング、減衰、及び遅延を入力信号x[n]に提供し、仮想化信号y[n]を生成することができる。他の実施形態は、仮想化信号を生成するためのより少ないコンポーネント、追加コンポーネント、及び/又はコンポーネントの異なる配置を含むことができる。
【0042】
図6は、仮想スピーカ方法を実装できるリスニング環境600を示す。リスニング環境600は、左スピーカ602と右スピーカ604を含むことができる。仮想スピーカ方法は、スピーカ602及び604に対して相対的に配置されたリスニングポジション606を考慮することによって実装することができる。例えば、スピーカ602及び604は、両方のスピーカ602及び604の基準軸が互いに平行であり、リスニングポジション606にあるリスナの鼻先からリスナの後頭部(the back of the listener’s head)まで地面に平行に引かれた仮想線に平行であり、リスニングポジション606が両方の音源から等距離にある、ように配置されることができる。着信ステレオオーディオを方位角のみの(azimuth-only)空間環境に処理する(例:仰角キュー(elevation cues)が生成されない)。いくつかの実施形態では、他のスピーカ配置及び/又はリスナポジションを実装するために、本方法に修正を加えることができる。例えば、いくつかの実施形態は、仰角キューを有する仮想の高さチャネルを含むことができる。
【0043】
リスニング環境600では、リスニングポジション606は、A点、B点、C点、及びD点によるコーナーにおいて定義されたボックスの中心に配置されることができる。従来のオーディオ空間化アプローチでは、着信オーディオ(incoming audio)は頭部インパルス応答(HRIR)データとコンボリューションされ、適切な遅延とスペクトルシフトを生成し、それによってオーディオをポジション情報又は位置情報(localization information)でエンコードする。この方法の欠点の1つは、処理されたすべてのオーディオにスペクトル変化が生じることである。対照的に、本明細書で記載する仮想スピーカ方法は、任意のスペクトル変化を導入することなく、リスニングポジションにおいて空間化された音場を作成することができる。
【0044】
仮想スピーカ方法は、リスニング環境600に関して記載され、ステレオ物理スピーカによる再生のためにステレオオーディオ信号を空間化する(spatialize)。理解しやすいように、着信ステレオオーディオの1つのチャネルに関してプロセスを説明する。着信オーディオのもう一方のチャネルの処理は、チャネル指定を除いて同じである。このプロセスは、(たとえば、追加のプロセスパスを含めるか、及び/又は、空間化信号(spatialization signals)を複数の物理スピーカに分散させる方法を変更することにより、)2つ以上の物理スピーカで使用されることもできる。
【0045】
仮想化の1つの方法では、左側の着信時間ドメインオーディオチャネルxLは、所望の左側位置:同側(hLL)及び反対側(hLR)に対応するHRIRの2つのチャネルとコンボリューションされる。その結果は2つの出力信号であり、1つは再生システムの左チャネル(y)に送られ、1つは再生システムの右チャネル(y)に送られる:
【数7】
【0046】
式(7)を周波数ドメインに変換すると、式(8)が得られる:
【数8】
【0047】
式(8)を並べ替えると、同側出力に関して反対側出力の式を得ることができる:
【数9】
【0048】
式(9)の最終形は、反対側の出力信号によって与えられる心理音響位置効果が、周波数ドメインにおける同側と反対側の頭部伝達関数(HRTF)の差によって変更された、同側出力信号の線形関数であること、を示している。ここでの種々の実施形態に従って、仮想スピーカプロセスの同側出力は、変更されていない入力チャネルである。
【0049】
したがって、式(9)に基づいて反対側の出力を生成することができる。例えば、仮想スピーカ方法の同側出力と反対側出力は次のようになる:
【数10】
したがって、種々の実施形態において、空間化された信号は、意図された位置起点(localization origins)に対応する2つのHRTFの比に等しいフィルタを適用することによって(例えば図5のフィルタ520によって適用される)、任意のリスニング次元にわたってソースオーディオから任意に生成されることができる。再び図6を参照すると、サイドツーサイド(STS)プロセス608を適用して、A-B次元で入力オーディオを空間化することができる。付加的に又は代替的に、A-C次元で入力オーディオを空間化するために、フロントツーバック(FTB)プロセス610を適用することもできる。プロセス608及び/又は610は、適切な位置キュー又は手掛り(the proper localization cues)を作成するために、(例えば、図5に示すように)遅延、減衰、位相調整などの追加の信号処理要素を含むことができる。位相調整は、例えば、1つ以上のオールパスフィルタを使用して、フィルタ520によって提供されることができる。
【0050】
いくつかの実施形態は、STSプロセス608及び/又はFTBプロセス610に加えて又はその代えて、1つ以上の他の次元の空間化プロセスを含むことができる。例えば、いくつかの実施形態は、付加的又は代替的に、入力オーディオを垂直方向に空間化するための仰角プロセス、及び/又は、入力オーディオを対角方向に空間化するための対角空間化プロセス(diagonal spatialization process)を含むことができる。
【0051】
種々の実施形態では、ここに記載されているクロストークキャンセル方法及び/又は仮想スピーカ方法は、任意の適切なオーディオ再生システムに実装することができる。図7は、クロストークキャンセル方法及び/又は仮想スピーカ方法を実装できるオーディオプロセッサ回路702を含むシステム700の一例を模式的に図示する。例えば、オーディオプロセッサ回路702は、ここで記載するオーディオプロセッサ100,200,300及び/又は400、及び/又は、仮想スピーカ回路500を含むことができる。
【0052】
種々の実施形態では、システム700はマルチチャネル入力オーディオ信号であり得る入力オーディオ信号を受信することができる。入力オーディオ信号は、デジタル及び/又はアナログ形式で受信できる。入力オーディオ信号は、システム700の別の構成要素(例えば、メディアプレーヤ及び/又はストレージデバイス)から、及び/又は、システム700と通信可能に結合された別のデバイス(例えば有線接続(例えば、ユニバーサルシリアルバス(USB)、光デジタル、同軸デジタル、高品位メディア相互接続(HDMI(登録商標))、有線ローカルエリアネットワーク(LAN)など)及び/又は無線接続(例えば、Bluetooth(登録商標)、ワイヤレスローカルエリアネットワーク(WiFiなどのWLAN)、セルラーなど)経由)から受信され得る。
【0053】
種々の実施形態において、オーディオプロセッサ回路702は出力オーディオ信号を生成し、出力オーディオ信号を増幅回路704に渡すことができる。オーディオプロセッサ回路702は、ここで説明する(1つ以上の)クロストークキャンセル回路及び/又は(1つ以上の)仮想スピーカ回路を実装して、それぞれクロストークキャンセルを提供し及び/又は(1つ以上の)仮想スピーカを生成することができる。出力オーディオ信号は、2つ以上の出力チャネルを有するマルチチャネルオーディオ信号であることができる。
【0054】
増幅回路704は、有線及び/又は無線接続を介してオーディオプロセッサ回路702からの出力オーディオ信号を受信することができる。増幅回路704は、オーディオプロセッサ回路702から受信した出力オーディオ信号を増幅し、増幅されたオーディオ信号を生成することができる。増幅回路704は、増幅されたオーディオ信号を複数の物理スピーカ706に渡すことができる。スピーカ706は、増幅されたオーディオ信号に基づいて可聴音を生成するのに適した任意のオーディオ出力デバイス、例えば、アウトボードスピーカ及び/又はヘッドホンスピーカを含むことができる。スピーカ706は、増幅回路から増幅されたオーディオ信号を受信するためのスタンドアロンスピーカであることができ、及び/又は、増幅回路704及び/又はオーディオプロセッサ回路702も含むデバイスに統合されることができる。例えば、スピーカ706は、増幅回路704を含まないパッシブスピーカ及び/又は同じデバイスに統合された増幅回路704を含むアクティブスピーカであることができる。
【0055】
一実施例では、スピーカ706は、例えば、リスナの左耳にオーディオを提供する左スピーカと、リスナの右耳にオーディオを提供する右スピーカとを備えたヘッドホンスピーカであることができる。ヘッドホンは、有線及び/又は無線インターフェイスを介して入力オーディオを受信することができる。ヘッドホンはオーディオ増幅器704(例えば、無線インターフェイスからのオーディオ再生)を含むことも、又は、含まないこともできる。いくつかの実施形態では、ヘッドホンは、ここで説明する仮想スピーカ方法を適用するためにオーディオプロセッサ回路702を含むことができる。あるいは、仮想スピーカ方法を適用した後、ヘッドホンが別のデバイスから処理済みのオーディオを受信することができる。
【0056】
種々の実施形態において、システム700の一部又は全ての要素は、携帯電話、コンピュータ、オーディオ/ビデオ受信器、集積アンプ、スタンドアロンオーディオプロセッサ(オーディオ/ビデオプロセッサを含む)、パワードスピーカ(例えばスマートスピーカ又は非スマートパワードスピーカ)、ヘッドホン、アウトボードUSB DACデバイスなど、任意の適切なデバイスに含まれることができる。
【0057】
種々の実施形態において、オーディオプロセッサ回路702は、1つ以上のデジタル信号プロセッサ回路などの1つ以上の集積回路を含むことができる。付加的に又は代替的に、システム700は、1つ以上のプロセッサ、メモリ(例えば、ランダムアクセスメモリ(RAM)、大容量記憶装置(例えば、フラッシュメモリ、ハードディスクドライブ(HDD)など)、アンテナ、ディスプレイなどの、1つ以上の追加コンポーネントを含むことができる。
【0058】
ここでは、特定の実施形態が例示され説明されているが、同じ目的を達成するために計算された多種多様な代替的及び/又は均等な実施形態又は実装が、本発明の技術的範囲から逸脱することなく、示され説明された実施形態の代わりに使用できることは、当業者には理解されるであろう。当業者は、実施形態が非常に多種多様な方法で実装され得ることを容易に理解するであろう。本出願は、本明細書に記載されている実施形態のあらゆる適応又は変形を対象とすることを意図している。したがって、実施形態は特許請求の範囲及びその均等物によってのみ制限されることが明白に意図されている。
図1
図2
図3
図4
図5
図6
図7
【国際調査報告】