(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-29
(45)【発行日】2023-09-06
(54)【発明の名称】バイノーラルスピーカーの指向性補償
(51)【国際特許分類】
H04S 7/00 20060101AFI20230830BHJP
H04R 3/00 20060101ALI20230830BHJP
【FI】
H04S7/00 320
H04R3/00 310
(21)【出願番号】P 2021521395
(86)(22)【出願日】2018-12-11
(86)【国際出願番号】 US2018064961
(87)【国際公開番号】W WO2020081103
(87)【国際公開日】2020-04-23
【審査請求日】2021-12-07
(32)【優先日】2018-10-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】503206684
【氏名又は名称】ディーティーエス・インコーポレイテッド
【氏名又は名称原語表記】DTS,Inc.
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(72)【発明者】
【氏名】ノー テギョン
(72)【発明者】
【氏名】ウォーカー オヴィール
【審査官】冨澤 直樹
(56)【参考文献】
【文献】米国特許出願公開第2017/0257725(US,A1)
【文献】特開2008-160265(JP,A)
【文献】米国特許出願公開第2009/0052703(US,A1)
【文献】NOH, Daekyoung,Effect of Binaural Difference in Loudspeaker Directivity on Spatial Audio Processing,AES CONVENTION 145th,10079,米国,AES,2018年10月07日,pp.675-683
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00-7/00
(57)【特許請求の範囲】
【請求項1】
バイノーラル指向性補償音を生成するためのシステムであって、
複数のスピーカー
であって、
前記複数のスピーカーの各々は方位角、仰角、および周波数の関数として前記スピーカーにより出力される相対的な音量レベルを表す特徴的な指向性を有し、
前記スピーカーの前記指向性は前記複数のスピーカーのリスナーの左右の耳の間にスペクトル成分不均衡を操作上生成するものである、
複数のスピーカーと、
前記複数のスピーカーに結合されたプロセッサであって、前記プロセッサは
入力マルチチャネルオーディオ信号を受信し、
出力マルチチャネルオーディオ信号を形成するために前記入力マルチチャネルオーディオ信号に対する処理を実行し、前記処理は
前記リスナーの前記左右の耳の間の前記スペクトル成分不均衡を操作上低減または排除するためのバイノーラル指向性補償を含み、
前記出力マルチチャネルオーディオ信号を前記複数のスピーカーに向け
、前記複数のスピーカーは前記出力マルチチャネルオーディオ信号に対応する音を生成するように構成される、
ように構成される、プロセッサと、
を備え
る、システム。
【請求項2】
前記処理は
前記複数のスピーカーに前記リスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、
前記複数のスピーカーに前記リスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる
空間オーディオ処理をさらに含む、
請求項
1に記載のシステム。
【請求項3】
前記左耳の位置および前記右耳の位置を能動的に追跡するように構成されたヘッドトラッカーをさらに備える、請求項
2に記載のシステム。
【請求項4】
前記プロセッサは推定された時不変の左右の耳の位置を使用するように構成される、請求項
2に記載のシステム。
【請求項5】
前記複数のスピーカーは左スピーカーおよび右スピーカーのみを含み、
前記入力マルチチャネルオーディオ信号は左入力オーディオ信号および右入力オーディオ信号に対応するデータを含み、
前記出力マルチチャネルオーディオ信号は左出力オーディオ信号および右出力オーディオ信号に対応するデータを含む、
請求項
2に記載のシステム。
【請求項6】
前記プロセッサは前記空間オーディオ処理において前記バイノーラル指向性補償を実行するように構成される、請求項
5に記載のシステム。
【請求項7】
前記プロセッサは前記左スピーカーと前記リスナーの前記右耳との間および前記右スピーカーと前記リスナーの前記左耳との間のクロストークをキャンセルすることを含めるために前記空間オーディオ処理を実行するように構成される、請求項
6に記載のシステム。
【請求項8】
前記プロセッサは
前記左耳の位置における前記左スピーカーの指向性に対応する第一の指向性値を提供することと、
前記右耳の位置における前記左スピーカーの指向性に対応する第二の指向性値を提供することと、
前記左耳の位置における前記右スピーカーの指向性に対応する第三の指向性値を提供することと、
前記右耳の位置における前記右スピーカーの指向性に対応する第四の指向性値を提供することと、
前記リスナーの前記左耳が前記左耳の位置において前記左スピーカーから音をどのように受け取るかを特徴付ける第一の頭部伝達関数を提供することと、
前記リスナーの前記右耳が前記右耳の位置において前記左スピーカーから音をどのように受け取るかを特徴付ける第二の頭部伝達関数を提供することと、
前記リスナーの前記左耳が前記左耳の位置において前記右スピーカーから音をどのように受け取るかを特徴付ける第三の頭部伝達関数を提供することと、
前記リスナーの前記右耳が前記右耳の位置において前記右スピーカーから音をどのように受け取るかを特徴付ける第四の頭部伝達関数を提供することと、
前記第二の頭部伝達関数として、前記第三の指向性値を乗算し、前記第四の指向性値で除算された、修正された第二の頭部伝達関数を形成することと、
前記第二の頭部伝達関数として、前記第一の指向性値を乗算し、前記第二の指向性値で除算された、修正された第三の頭部伝達関数を形成することと、
前記第一、修正された第二、修正された第三、および第四の頭部伝達関数を含む行列の逆行列として補償行列を形成することと、
前記左入力オーディオ信号および前記右入力オーディオ信号の変換を含む入力行列を形成することと、
前記補償行列と前記入力行列との積として計算された出力行列を形成することであって、前記出力行列は前記左出力オーディオ信号および前記右出力オーディオ信号の変換を含む、出力行列を形成することと、
により前記クロストークをキャンセルするように構成される、
請求項
7に記載のシステム。
【請求項9】
前記プロセッサは前記空間オーディオ処理および前記バイノーラル指向性補償の下流でスピーカー等化をさらに実行するように構成される、請求項
6に記載のシステム。
【請求項10】
前記プロセッサは前記空間オーディオ処理の下流で前記バイノーラル指向性補償を実行するように構成される、請求項
5に記載のシステム。
【請求項11】
前記プロセッサは前記左スピーカーと前記リスナーの前記右耳との間および前記右スピーカーと前記リスナーの前記左耳との間のクロストークをキャンセルすることを含めるために前記空間オーディオ処理を実行するように構成される、請求項
10に記載のシステム。
【請求項12】
前記プロセッサは
前記左耳の位置における前記リスナーの前記左耳が前記左スピーカーから音をどのように受け取るかを特徴付ける第一の頭部伝達関数を提供することと、
前記右耳の位置における前記リスナーの前記右耳が前記左スピーカーから音をどのように受け取るかを特徴付ける第二の頭部伝達関数を提供することと、
前記左耳の位置における前記リスナーの前記左耳が前記右スピーカーから音をどのように受け取るかを特徴付ける第三の頭部伝達関数を提供することと、
前記右耳の位置における前記リスナーの前記右耳が前記右スピーカーから音をどうか受け取るかを特徴付ける第四の頭部伝達関数を提供することと、
前記第一、第二、第三、および第四の頭部伝達関数を含む行列の逆行列として補償行列を形成することと、
前記左入力オーディオ信号および前記右入力オーディオ信号の変換を含む入力行列を形成することと、
前記補償行列と前記入力行列との積として計算された出力行列を形成することであって、前記出力行列は前記左出力オーディオ信号および前記右出力オーディオ信号の変換を含む、出力行列を形成することと、
により前記クロストークをキャンセルするように構成される、
請求項
11に記載のシステム。
【請求項13】
前記プロセッサは前記空間オーディオ処理の下流でスピーカー等化をさらに実行し、前記スピーカー等化において前記バイノーラル指向性補償実行するように構成される、請求項
10に記載のシステム。
【請求項14】
バイノーラル指向性補償音を生成するための方法であって、
プロセッサにおいて入力マルチチャネルオーディオ信号を受信することと、
前記プロセッサを用いて出力マルチチャネルオーディオ信号を形成するために前記入力マルチチャネルオーディオ信号に対して処理を実行することであって、前記処理は複数のスピーカーの各スピーカーの性能の方向変動を補償するためのバイノーラル指向性補償を含
み、
前記複数のスピーカーの各々は方位角、仰角、および周波数の関数として前記スピーカーにより出力される相対的な音量レベルを表す特徴的な指向性を有し、前記スピーカーの前記指向性は前記複数のスピーカーのリスナーの左右の耳の間にスペクトル成分不均衡を操作上生成するものであり、前記バイノーラル指向性補償は前記リスナーの前記左右の耳の間の前記スペクトル成分不均衡を操作上低減または排除する、実行することと、
前記出力マルチチャネルオーディオ信号を前記複数のスピーカーに向けることと、
前記複数のスピーカーを用いて前記出力マルチチャネルオーディオ信号に対応する音を生成することと、
を含む、方法。
【請求項15】
前記処理は
前記複数のスピーカーに前記リスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、
前記複数のスピーカーに前記リスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる
空間オーディオ処理をさらに含む、
請求項
14に記載の方法。
【請求項16】
バイノーラル指向性補償音を生成するためのシステムであって、
左スピーカーであって、方位角、仰角、および周波数の関数として前記左スピーカーにより出力される相対的な音量レベルを表す特徴的な左指向性を有する左スピーカーと、
右スピーカーであって、方位角、仰角、および周波数の関数として前記右スピーカーにより出力される相対的な音量レベルを表す特徴的な右指向性を有し、前記左指向性および前記右指向性は前記左スピーカーのリスナーの左右の耳と前記右スピーカーとの間にスペクトル成分不均衡を操作上生成する、右スピーカーと、
前記左スピーカーおよび前記右スピーカーに結合されたプロセッサであって、前記プロセッサは
入力マルチチャネルオーディオ信号を受信し、
出力マルチチャネルオーディオ信号を形成するために前記入力マルチチャネルオーディオ信号に対して処理を実行し、前記処理は操作上前記複数のスピーカーに前記リスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、操作上前記複数のスピーカーに前記リスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理を含み、前記処理は前記リスナーの前記左右の耳の間のスペクトル成分不均衡を操作上低減または排除するためのバイノーラル指向性補償をさらに含み、
前記出力マルチチャネルオーディオ信号を前記左スピーカーおよび前記右スピーカーに向け
、前記左スピーカーおよび前記右スピーカーは前記出力マルチチャネルオーディオ信号に対応する音を生成するように構成される、
ように構成される、プロセッサと、
を備え
る、システム。
【請求項17】
前記処理は前記複数のスピーカーに前記リスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、前記複数のスピーカーに前記リスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理をさらに含み、
前記プロセッサは前記空間オーディオ処理において前記バイノーラル指向性補償を実行するように構成され、
前記プロセッサは前記空間オーディオ処理および前記バイノーラル指向性補償の下流でスピーカー等化をさらに実行するように構成される、
請求項
16に記載のシステム。
【請求項18】
前記処理は前記複数のスピーカーに前記リスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、前記複数のスピーカーに前記リスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理をさらに含み、
前記プロセッサは前記空間オーディオ処理の下流で前記バイノーラル指向性補償を実行するように構成され、
前記プロセッサは前記空間オーディオ処理の下流でスピーカー等化をさらに実行し、前記スピーカー等化において前記バイノーラル指向性補償を実行するように構成される、
請求項
16に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本出願は、「Compensating for Binaural Loudspeaker Directivity」と題する、2018年10月18日に出願された米国特許出願第16/164,367号に関連し、これに基づく優先権を主張するものであり、参照により本明細書にその全体が組み入れられる。
【0002】
[技術分野]
本開示はオーディオシステムおよび方法に関する。
【背景技術】
【0003】
方向に依存する性能を数学的に表すスピーカーの物理的特性は指向性として知られている。
【0004】
スピーカーの指向性はスピーカーから離れる伝搬角度に関して音圧レベル(例えば、音量レベル)がどのように変化するかを表す。伝搬角度はスピーカーの中心軸(例えば、スピーカーのキャビネットに直交する方向)に沿ったゼロとして定義することができる。伝搬角度は中心軸から離れて三次元で増加する可能性があるため、指向性は通常水平方向および垂直方向で表すことができる。通常、特定の方向における指向性は、特定の方向に沿った音量をスピーカーの中心軸に沿った音量で割った比率から形成されるデシベル(dB)で表すことができる。
【0005】
スピーカーの指向性は周波数によって大きく変化する。低周波音は角度による変化が比較的少ないスピーカーから伝搬する傾向がある。高周波音は指向性がより強い傾向がある。
【図面の簡単な説明】
【0006】
【
図1】いくつかの実施形態による、バイノーラル指向性補償音を生成するためのシステムの一例の上面図を示す。
【
図2】いくつかの実施形態による、プロセッサが空間オーディオ処理においてバイノーラル指向性補償を実行することのできる構成を示す。
【
図3】いくつかの実施形態による、プロセッサが空間オーディオ処理の下流でスピーカー等化をさらに実行し、スピーカー等化においてバイノーラル指向性補償を実行することのできる構成を示す。
【
図4】いくつかの実施形態による、プロセッサが空間オーディオ処理の下流でスピーカー等化をさらに実行し、スピーカー等化の下流でバイノーラル指向性補償を実行することのできる構成を示す。
【
図5】いくつかの実施形態による、バイノーラル指向性補償を実行するための方法の一例のフローチャートを示す。
【0007】
対応する参照番号はいくつかの図を通して対応する部分を示す。図面内の要素は必ずしも一定の縮尺で描かれているわけではない。図面に示されている構成は単なる例であり、いかなる方法でも本発明の範囲を限定するものとして解釈されるべきではない。
【発明を実施するための形態】
【0008】
マルチスピーカーサウンドシステムはマルチスピーカーシステム内の各スピーカーの性能の方向変動を補償するためのバイノーラル指向性補償を用いることができる。システムはスピーカーに送信される信号を生成するために使用される処理にバイノーラル指向性補償を組み込むことができる。
【0009】
バイノーラル指向性補償を理解するために、最初にスピーカーの指向性の特性を理解することは有益である。
【0010】
指向性はスピーカーの固有の特性である。スピーカーの指向性はある範囲のリスニングポイントについて、周波数の関数として、スピーカーの中心軸から離れた水平(方位角)および垂直(仰角)角度の関数として音圧レベルの低下を数学的に表す。
【0011】
指向性の各値に関連付けられた三つの独立変数があるため、指向性データを表示するためのいくつかの方法がある。一例では、指向性は、縦軸を(通常は正規化された)音圧レベル、横軸を周波数として一連の曲線としてプロットされ、各曲線は単一の角度(水平または垂直のいずれか)に対応する。別の例では、指向性は、縦軸を角度、横軸を周波数として等音量曲線の一連の等高線としてプロットされる。さらに別の例では、指向性は極グラフ上に一連の曲線としてプロットされ、各曲線は周波数に対応し、円形座標は角度(水平または垂直)に対応し、音圧レベルの値はプロットの中心から離れて半径が大きくなるにつれて増加する。
【0012】
スピーカーの設計者は通常、指向性を含む特定のターゲット基準を満たすように個々のスピーカーを設計することができる。例えば、家庭環境用のスピーカーは指向性が比較的フラットである比較的広い角度範囲を有するように設計することができるため、リスナーがスピーカーのサウンドステージ内を移動する際にリスナーは音量の大きな変化を聞くことがない。別の例では、比較的長距離にわたって音を出すように設計されたスピーカーの場合、音響エネルギーを比較的小さいリスニングエリアにより効率的に集中させるためにスピーカーは意図的に狭い指向性を有するように設計することができる。
【0013】
スピーカーの特定の作りおよびモデルの指向性を測定することは直接的であるが、面倒である。指向性の測定はスピーカーのサウンドステージで特定の角度間隔で音圧レベルを個々に測定することを含む。指向性が測定されると、ルックアップテーブルまたは他の好適なメカニズムを介して必要に応じて結果を保存および呼び出すことができる。
【0014】
スピーカーの指向性の特性はよく知られており、スピーカーの設計段階においてしばしば対処されるが、スピーカーの指向性によって引き起こされる問題はよく知られていない。具体的には、スピーカーの指向性がリスナーの左耳と右耳との間で音量の不均衡またはスペクトル成分の不均衡を引き起こす可能性があることはよく知られていない。
【0015】
バイノーラル環境(例えば、両耳が共通のサウンドステージに浸されている)のリスナーにとって、スピーカーの指向性はリスナーの耳の間に不均衡を生じさせる可能性がある。例えば、リスナーの左耳と右耳は異なるリスニングポイントに位置しているため、リスナーの左耳はスピーカーの指向性の一つの値を経験する可能性があり、リスナーの右耳はスピーカーの指向性の異なる値を経験する可能性がある。リスナーにとって、これは一方の耳では高周波の消音のように聞こえるが、他方の耳では聞こえない。このようなアーティファクトは、リスナーがスピーカーに比較的近く、スピーカーの中心軸に対して比較的高い方位角または仰角に位置し、および/または指向性の高いスピーカーを聞いている場合に最も顕著になる。
【0016】
特定のスピーカーのサウンドステージにおける特定の左耳および右耳の位置について、非限定的な数値例が続く。
【0017】
250Hz等の比較的低い(例えば、低音の)周波数の場合、スピーカーの指向性は伝搬角度によって比較的わずかに変化し得る。その結果、250Hz等の比較的低い周波数の場合、左耳における音圧レベルは右耳における音圧レベルとほぼ同じである可能性がある。
【0018】
1000Hz等の中音域の周波数の場合、スピーカーの指向性は低音周波数よりも多くの変化を示し得る。その結果、二つの耳の位置の間で音圧レベルにいくらかの変動があり得る。例えば、スピーカーからの左耳における音量は右耳における音量よりも3dB、または1000Hz等の中音域周波数の場合、別の好適な値だけ大きい可能性がある。
【0019】
4000Hz等の比較的高い(例えば、高音の)周波数の場合、スピーカーの指向性は伝搬角度によって著しく変化し得る。その結果二つの位置の間で音圧レベルにかなりの変動があり得る。例えば、スピーカーからの左耳における音量は右耳における音量よりも9dB、または4000Hz等の比較的高い周波数の場合、別の好適な値だけ大きい可能性がある。
【0020】
リスナーにとって、リスナーの二つの耳の間のスピーカーの指向性の変動は、リスナーの左耳と比較して、リスナーの右耳において高周波がこもったように思われるという知覚等のアーティファクトを生成する可能性がある。上記で論じた周波数値および音量レベルは単なる非限定的な数値例にすぎない。他の周波数値および音量レベルもまた使用することができる。
【0021】
以前の努力はリスナーの耳の間の不均衡を引き起こすスピーカーの指向性の問題を実現できなかったため、以前の努力はまたそのような不均衡を補償することのできる解決策を実現できなかった。そのような解決策はバイノーラル指向性補償により達成することができ、これについては以下でさらに詳細に説明する。
【0022】
バイノーラル指向性補償は複数のスピーカーを使用するサウンドシステムにおいて動作することができ、リスナーは(例えば、ヘッドホンを使用せず、両耳を共通のサウンドステージに浸して)バイノーラル環境において聞く。バイノーラル指向性補償は既存のスピーカー(例えば、最初から特定のアプリケーションように設計されたとは限らないスピーカー)が互いに固定された(例えば、時不変の)向きで取り付けられているシステムに用いることができる。例えば、バイノーラル指向性補償はラップトップコンピュータのスピーカーに用いることができ、これらのスピーカーは典型的にコンピュータハウジングの左端および右端近くに位置し、通常は再配置することができない。バイノーラル指向性補償は他の好適なマルチスピーカーシステムにも用いることができる。以下で論じるバイノーラル指向性補償は左右の耳を有する一人のリスナーがマルチスピーカーシステムをバイノーラルで聞くシステムに最も効果的である。
【0023】
図1は、いくつかの実施形態による、バイノーラル指向性補償音を生成するためのシステム100の一例の上面図を示している。システム100の非限定的な例には、ブルートゥース(登録商標)スピーカー、ネットワークスピーカー、ラップトップデバイス、モバイルデバイス等を含むことができる。
図1の構成はこのようなシステム100の一例に過ぎず、他の構成を使用することもできる。
【0024】
複数のスピーカー102(四つのスピーカー102A-Dを含むものとして
図1に示されているが、任意選択的に二以上のスピーカーを含む)は音をある面積または体積に向けることができる。各スピーカー102は方位角(例えば、スピーカー面またはキャビネットに垂直であることのできる中心軸に対する水平角)、仰角(例えば、中心軸に対する垂直角)、および周波数の関数としてスピーカー102により出力される相対的な音量レベルを表す特徴的な指向性を有することができる。スピーカー102の指向性は複数のスピーカー102のリスナー106の左右の耳104A-Bの間に音量不均衡またはスペクトル成分不均衡を操作上生成することができる。いくつかの例では、複数のスピーカー102は左スピーカー102Aおよび右スピーカー102Bのみを含むことができ、これらはラップトップコンピュータ等において通常リスナー106の左右に配置することができる。
【0025】
プロセッサ108は複数のスピーカー102に結合することができる。いくつかの例では、プロセッサ108はデジタルデータを複数のスピーカー102に供給することができる。他の例では、プロセッサ108は時変電圧または電流等のアナログ信号を複数のスピーカー102に供給することができる。
【0026】
プロセッサ108は入力マルチチャネルオーディオ信号110を受信することができる。入力マルチチャネルオーディオ信号110は、複数のオーディオチャネル、各々が単一のオーディオチャネルに対応するデジタルデータを含む複数のデータストリーム、複数のオーディオチャネルに対応する複数のアナログ時変電圧もしくは電流、または複数のスピーカー102を駆動するために使用することのできるデジタルおよび/またはアナログ信号の任意の組合せに対応するデジタルデータを含むデータストリームの形態とすることができる。複数のスピーカー102が左スピーカー102Aおよび右スピーカー102Bのみを含むいくつかの例では、入力マルチチャネルオーディオ信号110は左入力オーディオ信号および右入力オーディオ信号に対応するデータを含むことができる。
【0027】
プロセッサ108は出力マルチチャネルオーディオ信号112を形成するために入力マルチチャネルオーディオ信号110に対して処理を実行することができる。出力マルチチャネルオーディオ信号112は複数のスピーカー102を駆動するために使用することのできるデジタルおよび/またはアナログ信号の任意の組合せの形態とすることもできる。複数のスピーカー102が左スピーカー102Aおよび右スピーカー102Bのみを含むいくつかの例では、出力マルチチャネルオーディオ信号112は左出力オーディオ信号および右出力オーディオ信号に対応するデータを含むことができる。(
図2-4に関連して以下で詳細に説明される)処理は複数のスピーカー102の各スピーカー102の性能の方向変動を補償するためのバイノーラル指向性補償を含むことができる。
【0028】
プロセッサ108は出力マルチチャネルオーディオ信号を複数のスピーカー102に向けることができる。複数のスピーカー102は出力マルチチャネルオーディオ信号112に対応する音を生成することができる。いくつかの例では、バイノーラル指向性補償はリスナー106の左右の耳104A-Bの間の音量不均衡またはスペクトル成分不均衡を操作上低減または排除することができる。
【0029】
(以下で論じられる)バイノーラル指向性補償はリスナー106の左右の耳104A-Bの位置に依存することができる。いくつかの例では、システム100は左耳の位置および右耳の位置を能動的に追跡し、測定された左耳および右耳の位置116をプロセッサ108に提供することのできるヘッドトラッカー114を任意選択的に含むことができる。例えば、リスナー106がサウンドステージ内を動き回り、ゲームをプレイするためにオーディオ情報に依存するビデオゲーム環境では、ヘッドトラッカー114はプロセッサ108が左右の耳の位置の信頼できる値を有することを保証するのに役立つ可能性がある。他の例では、プロセッサ108は推定された時不変の左右の耳の位置を使用することができる。例えば、ラップトップコンピュータ内のプロセッサ108はリスナーの頭がラップトップのスクリーンにほぼ直交して左右のラップトップスピーカー102A-Bの中間に位置し、リスナーの左右の耳104A-Bが人間の頭の平均幅だけ離隔されていると想定することができる。これらは単なる例であり、他の例も適用することができる。
【0030】
いくつかの例では、処理は空間オーディオ処理をさらに含むことができ、これはリスナー106の左右の耳104A-Bの位置にも依存することができる。空間オーディオ処理は、複数のスピーカー102にリスナー106の左耳104Aに対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させることができ、複数のスピーカー102にリスナー106の右耳104Bに対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させることができる。いくつかの例では、空間オーディオ処理は、壁もしくは他の物体からの反射等の特定の音に位置固有の特性を与えること、またはリスナー106のサウンドステージ内の特定の位置に特定の音を配置することを含むことができる。ビデオゲームは、プレーヤーの臨場感を高めるために空間オーディオ処理を使用することができるため、オーディオの位置固有の効果により対応するビデオに表示されるアクションに臨場感を加えることができる。左スピーカー102Aおよび右スピーカー102Bのみを含む複数のスピーカー102の特殊なケースの場合、空間オーディオ処理はより一般的なマルチスピーカー空間オーディオ処理の特殊なケースであるクロストークキャンセルを含むことができる。
【0031】
図2-4は、いくつかの実施形態による、
図1のプロセッサ108がバイノーラル指向性補償をどのように実行するかの三つの例を示している。これらは単なる例であり、あるは、プロセッサ108はバイノーラル指向性補償を実行するために他の好適なプロセスを使用することができる。
【0032】
図2は、いくつかの実施形態による、プロセッサ108が空間オーディオ処理202においてバイノーラル指向性補償を実行することのできる構成を示している。
【0033】
複数のスピーカー102が左スピーカー102Aおよび右スピーカー120Bのみを含む例等のいくつかの例では、プロセッサ108は空間オーディオ処理202を実行して左スピーカー102Aとリスナー106の右耳104Bとの間、および右スピーカー102Bとリスナー106の左耳104Aとの間のクロストークをキャンセルすることを含むことができる。
【0034】
いくつかの例では、プロセッサ108は以下の動作を実行することによりクロストークをキャンセルすることができ、これは任意の好適な順序で任意選択的に実行することができる。第一に、プロセッサ108は左耳の位置における左スピーカー102Aの指向性に対応する第一の指向性値を提供することができる。第二に、プロセッサ108は右耳の位置における右スピーカー102Bの指向性に対応する第二の指向性値を提供することができる。第三に、プロセッサ108は左耳の位置における右スピーカー102Bの指向性に対応する第三の指向性値を提供することができる。第四に、プロセッサ108は右耳の位置における左スピーカー102Aの指向性に対応する第四の指向性値を提供することができる。第五に、プロセッサ108はリスナー106の左耳104Aが左耳の位置において左スピーカー102Aから音をどのように受け取るかを特徴付ける第一の頭部伝達関数を提供することができる。(頭部伝達関数は、指向性効果を含むスピーカーからの伝搬に関する効果、および耳の解剖学的効果を含むリスナーの耳における受信に関する効果を含むことに留意されたい。)第六に、プロセッサ108はリスナー106の右耳104Bが右耳の位置において左スピーカー102Aから音をどのように受け取るかを特徴付ける第二の頭部伝達関数を提供することができる。第七に、プロセッサ108はリスナー106の左耳104Aが左耳の位置において右スピーカー102Bから音をどのように受け取るかを特徴付ける第三の頭部伝達関数を提供することができる。第八に、プロセッサ108はリスナー106の右耳104Bが右耳の位置において右スピーカー102Bから音をどのように受け取るかを特徴付ける第四の頭部伝達関数を提供することができる。第九に、プロセッサ108は第二の頭部伝達関数として、第三の指向性値を乗算し、第四の指向性値で除算された、修正された第二の頭部伝達関数を形成することができる。第十に、プロセッサ108は第二の頭部伝達関数として、第一の指向性値を乗算し、第二の指向性値で除算された、修正された第三の頭部伝達関数を形成することができる。第十一に、プロセッサ108は第一、修正された第二、修正された第三、および第四の頭部伝達関数を含む行列の逆行列として補償行列を形成することができる。第十二に、プロセッサ108は左入力オーディオ信号および右入力オーディオ信号の変換を含む入力行列を形成することができる。第十三に、プロセッサ108は補償行列と入力行列との積として計算された出力行列を形成することができ、出力行列は左出力オーディオ信号および右出力オーディオ信号の変換を含む。出力オーディオ信号が計算されるとプロセッサ108は出力オーディオ信号をスピーカー102に向けることができ、スピーカー102は出力オーディオ信号に対応する音を生成する。スピーカー102により生成される音はバイノーラル指向性の補償を含むことができる。このような補償は、スピーカー指向性の特性により引き起こされるリスナーの耳の間の音量不均衡またはスペクトル成分不均衡等のアーティファクトを低減するのに役立つ。
【0035】
付録は、クロストークをキャンセルし、バイノーラル指向性を補償するためにプロセッサ108により使用される行列代数の例を示している。
【0036】
いくつかの例では、プロセッサ108は空間オーディオ処理202およびバイノーラル指向性補償204の下流でスピーカー等化206をさらに実行することができる。
【0037】
図3および
図4は、いくつかの実施形態による、プロセッサ108が空間オーディオ処理の下流でバイノーラル指向性補償を実行することのできる二つの構成を示している。
図3では、プロセッサ108はさらに、空間オーディオ処理302の下流でスピーカー等化304を実行し、スピーカー等化304においてバイノーラル指向性補償306を実行することができる。
図4では、プロセッサ108はさらに空間オーディオ処理402の下流でスピーカー等化404を実行し、スピーカー等化の下流でバイノーラル指向性補償406を実行することができる。
図3および
図4の構成は単なる例であり、他の構成を使用することもできる。
【0038】
プロセッサ108が空間オーディオ処理302、402の下流でバイノーラル指向性補償を実行することができ、複数のスピーカー102が左スピーカー102Aおよび右スピーカー102Bのみを含むいくつかの例では、プロセッサ108は、左スピーカー102Aとリスナー106の右耳104Bとの間、および右スピーカー102Bとリスナー106の左耳104Aとの間のクロストークのキャンセルを含めるために空間オーディオ処理302、402を実行することができる。
【0039】
プロセッサ108が空間オーディオ処理302、402の下流でバイノーラル指向性補償を実行することができ、複数のスピーカー102が左スピーカー102Aおよび右スピーカー102Bのみを含むいくつかの例では、プロセッサ108は以下の動作を実行することによりクロストークをキャンセルすることができ、これは任意の好適な順序で任意選択的に実行することができる。第一に、プロセッサ108はリスナー106の左耳104Aが左耳の位置において左スピーカー102Aから音をどのように受け取るかを特徴付ける第一の頭部伝達関数を提供することができる。第二に、プロセッサ108はリスナー106の右耳104Bが右耳の位置において左スピーカー102Aから音をどのように受け取るかを特徴付ける第二の頭部伝達関数を提供することができる。第三に、プロセッサ108はリスナー106の左耳104Aが左耳の位置において右スピーカー102Bから音をどのように受け取るかを特徴付ける第三の頭部伝達関数を提供することができる。第四に、プロセッサ108はリスナー106の右耳104Bが右耳の位置において右スピーカー102Bから音をどのように受け取るかを特徴付ける第四の頭部伝達関数を提供することができる。第五に、プロセッサ108は第一、第二、第三、および第四の頭部伝達関数を含む行列の逆行列として補償行列を形成することができる。第六に、プロセッサ108は左入力オーディオ信号および右入力オーディオ信号の変換を含む入力行列を形成することができる。第七に、プロセッサ108は補償行列と入力行列との積として計算された出力行列を形成することができ、出力行列は左出力オーディオ信号および右出力オーディオ信号の変換を含む。出力オーディオ信号が計算されるとプロセッサ108は出力オーディオ信号をスピーカー102に向けることができ、スピーカー102は出力オーディオ信号に対応する音生成する。スピーカー102により生成される音はバイノーラル指向性の補償を含むことができる。このような補償は、スピーカー指向性の特性により引き起こされるリスナーの耳の間の音量不均衡またはスペクトル成分不均衡等のアーティファクトを低減するのに役立つ。
【0040】
図5は、いくつかの実施形態による、バイノーラル指向性補償音を生成するための方法500の一例のフローチャートを示している。方法500は
図1のシステム100、または任意の他の好適なマルチスピーカーシステムにより実行することができる。方法500はバイノーラル指向性補償音を生成するための一つの方法に過ぎず、他の好適な方法を使用することもできる。
【0041】
動作502において、システムのプロセッサは入力マルチチャネルオーディオ信号を受信することができる。
【0042】
動作504において、システムのプロセッサは出力マルチチャネルオーディオ信号を形成するために入力マルチチャネルオーディオ信号に対して処理を実行することができる。処理は複数のスピーカーの各スピーカーの性能の方向変動を補償するためのバイノーラル指向性補償を含むことができる。
【0043】
動作506において、システムのプロセッサは出力マルチチャネルオーディオ信号を複数のスピーカーに向けることができる。
【0044】
動作508において、システムは複数のスピーカーを用いて出力マルチチャネルオーディオ信号に対応する音を生成することができる。
【0045】
いくつかの例では、複数のスピーカーの各々は方位角、仰角、および周波数の関数としてスピーカーにより出力される相対的な音量レベルを表す特徴的な指向性を有することができる。いくつかの例では、スピーカーの指向性は複数のスピーカーのリスナーの左右の耳の間に音量不均衡またはスペクトル成分不均衡を操作上生成することができる。いくつかの例では、バイノーラル指向性補償はリスナーの左右の耳の間の音量不均衡またはスペクトル成分不均衡を操作上低減または排除することができる。
【0046】
いくつかの例では、動作504において、処理は複数のスピーカーにリスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、複数のスピーカーにリスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させることができる。
【0047】
本明細書に記載される以外の変形はこの文書から明らかになるであろう。例えば、実施形態に応じて、本明細書に記載の方法およびアルゴリズムのいずれかの所定の行為、事象、または機能は異なる順序で実行することができ、追加、併合、または完全に除外することができる(記載された全ての行為または事象が方法およびアルゴリズムの実施に必要であるとは限らない)。さらに、所定の実施形態では、行為または事象はマルチスレッド処理、割り込み処理、または複数のプロセッサもしくはプロセッサコアを介して、または他の並列アーキテクチャ上で、順次ではなく、同時に実行することができる。加えて、様々なタスクまたはプロセスを、一緒に機能することのできる異なるマシンまたはコンピューティングシステムにより実行することができる。
【0048】
本明細書に開示される実施形態に関連して説明される様々な例示的な論理ブロック、モジュール、方法、およびアルゴリズムのプロセスおよび順序は、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実装することができる。ハードウェアとソフトウェアとのこの互換性を明確に説明するために、様々な例示的な構成要素、ブロック、モジュール、およびプロセスアクションについて、上記で一般的にそれらの機能性の観点から説明された。このような機能がハードウェアとして実装されるかソフトウェアとして実装されるかは、システム全体に課される特定のアプリケーションおよび設計上の制約による。説明されている機能は各特定のアプリケーションについて様々な方法で実装することができるが、そのような実装の決定はこの文書の範囲から逸脱を引き起こすものとして解釈されるべきではない。
【0049】
本明細書に開示される実施形態に関連して説明される様々な例示的な論理ブロックおよびモジュールは、汎用プロセッサ、処理デバイス、一または二以上の処理デバイスを有するコンピューティングデバイス、デジタル信号プロセッサ(DSP)、特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは他のプログラム可能な論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、または本明細書に記載の機能を実行するように設計されたそれらの任意の組合せ等のマシンにより実装または実行することができる。汎用プロセッサおよび処理デバイスはマイクロプロセッサとすることができるが、あるいは、プロセッサは、コントローラ、マイクロコントローラ、またはステートマシン、それらの組合せ等である。プロセッサはまたDSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと組み合わせられた一または二以上のマイクロプロセッサ、または任意の他のそのような構成等のコンピューティングデバイスの組合せとして実装することができる。
【0050】
本明細書に記載のシステムおよび方法の実施形態は多数のタイプの汎用または専用コンピューティングシステム環境または構成内で動作可能である。一般に、コンピューティング環境は、いくつかを挙げると、一または二以上のマイクロプロセッサに基づくコンピュータシステム、メインフレームコンピュータ、デジタル信号プロセッサ、ポータブルコンピューティングデバイス、パーソナルオーガナイザー、デバイスコントローラ、電化製品内の計算エンジン、携帯電話、デスクトップコンピュータ、モバイルコンピュータ、タブレットコンピュータ、スマートフォン、およびコンピュータが埋め込まれた電化製品を含む任意のタイプのコンピュータシステムを含むことができるが、これらに限定されない。
【0051】
このようなコンピューティングデバイスは通常、パーソナルコンピュータ、サーバコンピュータ、手持ち式コンピューティングデバイス、ラップトップまたはモバイルコンピュータ、携帯電話およびPDA等の通信デバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な家電、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、オーディオまたはビデオメディアプレイヤー等を含む少なくともいくつかの最小限の計算能力を有するデバイスに見られるが、これらに限定されない。いくつかの実施形態では、コンピューティングデバイスは一または二以上のプロセッサを含む。各プロセッサは、デジタル信号プロセッサ(DSP)、超長命令語(VLIW)、もしくは他のマイクロコントローラである場合もあれば、マルチコアCPU内に専用グラフィックプロセッシングユニット(GPU)ベースのコアを含む一または二以上のプロセッシングコアを有する従来の中央処理装置(CPU)である場合もある。
【0052】
本明細書に開示される実施形態に関連して説明される方法、プロセスまたはアルゴリズムのプロセスアクションは、ハードウェア、プロセッサにより実行されるソフトウェアモジュール、またはその二つの任意の組合せで直接具現化することができる。ソフトウェアモジュールはコンピューティングデバイスによりアクセス可能なコンピュータ可読媒体に含めることができる。コンピュータ可読媒体は、取外し可能、取外し不可能、またはそれらの組合せのいずれかである揮発性媒体および不揮発性媒体の両方を含む。コンピュータ可読媒体は、コンピュータ可読もしくはコンピュータ実行可能命令、データ構造、プログラムモジュール、または他のデータ等の情報を格納するために使用される。限定するものではなく例として、コンピュータ可読媒体はコンピュータストレージ媒体および通信媒体を備え得る。
【0053】
コンピュータストレージ媒体は、Blu-ray(登録商標)ディスク(BD)、デジタル多用途ディスク(DVD)、コンパクトディスク(CD)、フロッピーディスク(登録商標)、テープドライブ、ハードドライブ、光学ドライブ、固体メモリドライブ、RAMメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、フラッシュメモリもしくは他のメモリ技術、磁気カセット、磁気テープ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、または所望の情報を格納するために使用することができ、一または二以上のコンピューティングデバイスによりアクセス可能な任意の他のデバイス等のコンピュータもしくはマシン可読媒体またはストレージデバイスを含むが、これらに限定されない。
【0054】
ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CDROM、または非一時的コンピュータ可読ストレージ媒体、メディア、もしくは当該技術分野において知られる物理コンピュータストレージの任意の他の形態に常駐することができる。例示的なストレージ媒体は、プロセッサがストレージ媒体から情報を読み取り、ストレージ媒体に情報を書き込むことができるようにプロセッサに結合することができる。代替案では、ストレージ媒体はプロセッサと一体化することができる。プロセッサおよびストレージ媒体は特定用途集積回路(ASIC)に常駐することができる。ASICがユーザ端末に常駐することができる。あるいは、プロセッサおよびストレージ媒体はユーザ端末にディスクリートコンポーネントとして常駐することができる。
【0055】
本明細書で使用される「非一時(non-transitory)」という句は、「持続的(enduring)または長寿命(longlived)」を意味する。「非一時的なコンピュータ可読媒体」という句には、一時的な伝搬信号を唯一の例外として、あらゆるコンピュータ可読媒体が含まれる。これには、例としてレジスタメモリ、プロセッサキャッシュおよびランダムアクセスメモリ(RAM)等の非一時的コンピュータ可読媒体を含むが、これらに限定されない。
【0056】
「オーディオ信号」という句は、物理的な音を表す信号である。
【0057】
コンピュータ可読またはコンピュータ実行可能命令、データ構造、プログラムモジュール等の情報の保持は、一または二以上の変調データ信号、(搬送波等の)電磁波、または他の輸送メカニズムもしくは通信プロトコルをエンコードするための様々な通信媒体を使用することにより達成することもでき、任意の有線または無線情報伝達メカニズムを含む。一般に、これらの通信媒体は、信号内の情報または命令をエンコードするような方法でその特性のうち一または二以上が設定または変更された信号を指す。例えば、通信媒体は、一または二以上の変調データ信号を搬送する有線ネットワークまたは直接有線接続等の有線媒体、および、一または二以上の変調データ信号または電磁波を送信、受信、またはその両方をするための音響、無線周波数(RF)、赤外線、レーザー、および他の無線媒体等の無線媒体を含む。上記の任意の組合せもまた通信媒体の範囲に含まれるべきである。
【0058】
さらに、本明細書に記載のエンコードまたはデコードシステムおよび方法の様々な実施形態のいくつかまたは全てを具現化するソフトウェア、プログラム、コンピュータプログラム製品の一つまたは任意の組合せ、またはその一部は、コンピュータ実行可能命令または他のデータ構造の形態で、コンピュータまたはマシン可読媒体またはストレージデバイスおよび通信媒体の任意の所望の組合せから格納し、受信し、送信し、または読み取ることができる。
【0059】
本明細書に記載のシステムおよび方法の実施形態は、コンピューティングデバイスにより実行されているプログラムモジュール等のコンピュータ実行可能命令の一般的な文脈においてさらに説明され得る。一般に、プログラムモジュールはルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含み、これらは特定のタスクを実行したり、特定の抽象データ型を実装したりする。本明細書に記載の実施形態は、一または二以上のリモート処理デバイスによりタスクが実行される分散コンピューティング環境、または一または二以上の通信ネットワークを通じてリンクされた一または二以上のデバイスのクラウドにおいて実施され得る。分散コンピューティング環境では、プログラムモジュールはメディアストレージデバイスを含むローカルまたはリモートコンピュータストレージに配置することができる。
【0060】
とりわけ、「できる(can)」、「かもしれない(might)」、「し得る(may)」、「例えば、(e.g.,)」等の本明細書で使用される条件付き言語は、特に明記されていない限り、または使用される文脈において異なる意味で理解されない限り、一般に所定の実施形態は所定の特徴、要素および/または状態を含むが、他の実施形態は含まないことを伝えることを意図している。したがって、そのような条件付き言語は一般に、特徴、要素および/または状態が一または二以上の実施形態に何らかの形で必要であること、または、一または二以上の実施形態は作成者の入力またはプロンプトの有無にかかわらず、これらの特徴、要素および/または状態が任意の特定の実施形態に含まれるかまたは実行されるかを決定するためのロジックを必然的に含むことを意味することを意図していない。「備える(comprising)」、「含む(including)」、「有する(having)」等の用語は同義語であり、包括的かつオープンエンド方式で使用され、追加の要素、特徴、行為、動作等を除外するものではない。さらに、「または(or)」という用語はその包括的な意味で(そして排他的な意味でなく)使用されるため、例えば要素のリストを接続するために使用される場合、「または」という用語は、リスト内の要素の一つ、いくつか、または全てを意味する。
【0061】
上記の詳細な説明は様々な実施形態に適用される新規な特徴を示し、説明し、指摘したが、示されたデバイスまたはアルゴリズムの形態および詳細において、本開示の範囲から逸脱することなく様々な省略、置換および変更がなされることができることを理解されたい。認識されるように、本明細書に記載される発明の所定の実施形態は、いくつかの特徴は他の特徴とは別に使用または実施することができるため、本明細書に記載される特徴および利点の全て提供しない形態において具現化することができる。
【0062】
さらに、主題は構造的特徴および方法論的行為に特有の言語で説明されているが、添付の特許請求の範囲において定義される主題は必ずしも上記の固有の特徴または行為に限定されないことを理解されたい。むしろ、上記の特定の特徴および行為は特許請求の範囲を実施する例示的な形態として開示される。
【0063】
付録
スピーカーの指向性をバイノーラルに等化するために使用することのできる三つの一般的な手順がある。第一に、スピーカーの指向性を測定することができる。第二に、各耳への指向性の伝達関数を作成することができる。第三に、補償行列Tを以下のように形成することができる。
【数1】
【0064】
量Tiは同側伝達関数であり、左耳の位置でリスナーの左耳が左スピーカーから音をどのように受け取るかを特徴付け、また、対称性のために、右耳の位置でリスナーの右耳が右スピーカーから音をどのように受け取るかを特徴付ける。
【0065】
量Tcは対側伝達関数であり、左耳の位置でリスナーの左耳が右スピーカーから音をどのように受け取るかを特徴付け、また、対称性のために、右耳の位置でリスナーの右耳が左スピーカーから音をどのように受け取るかを特徴付ける。
【0066】
量Dは量(Ti
2-Tc
2)に等しく設定される。
【0067】
ステレオ再生システムが二つのスピーカーを使用するもののリスナーに関して対称的な配置でない場合、頭部伝達関数を修正することにより非対称性を説明することができる。頭部伝達関数には、可聴周波数の範囲にわたる両耳間時間差と両耳間強度差が含まれる。スピーカーの非対称な配置を説明するために、(非対称な)頭部伝達関数を、純粋な頭部伝達関数と、スピーカーの指向性により引き起こされる両耳間強度差に分けることができる。
【0068】
システムが事前に測定された/合成された頭部伝達関数を既に含んでいる場合、次のように、指向性から対側の頭部伝達関数への振幅比を乗じることによりバイノーラル指向性の差を埋め込むことができる。
【数2】
【数3】
【数4】
【0069】
は、左耳への左スピーカーの指向性の測定または計算された値である。
【0070】
は、右耳への左スピーカーの指向性の測定または計算された値である。
【0071】
は、右耳への右スピーカーの指向性の測定または計算された値である。
【0072】
は、左耳への右スピーカーの指向性の測定または計算された値である。
【0073】
このように指向性値を組み込むことには利点がある。例えば、新しいデバイスの頭部伝達関数を測定することにより、毎回空間処理を再設計するよりもシステム全体の設計をはるかに簡単にすることができる。頭部伝達関数データが複数の被験者または所定の個人の測定データに基づいている場合、既存の要素の新しい構成のために頭部伝達関数の測定を再度行うのは面倒である。加えて、バイノーラル指向性の差を含めることで、対側の頭部伝達関数値を更新することにより合成された頭部伝達関数を簡単に修正することができる。加えて、バイノーラル指向性補償を空間処理またはデバイス等化に統合することにより全体的な計算コストを低減することができる。
【0074】
例
本明細書に開示されるデバイスおよび関連する方法をさらに説明するために、非限定的な例のリストが以下に提供される。以下の非限定的な例の各々は単独で成り立つか、または他の例の任意の一または二以上と任意の順列または組合せで組み合わせることができる。
【0075】
実施例1において、バイノーラル指向性補償音を生成するためのシステムは、複数のスピーカーと、複数のスピーカーに結合されたプロセッサとを含むことができ、プロセッサは入力マルチチャネルオーディオ信号を受信し、出力マルチチャネルオーディオ信号を形成するために入力マルチチャネルオーディオ信号に対する処理を実行し、処理は複数のスピーカーの各スピーカーの性能の方向変動を補償するためのバイノーラル指向性補償を含み、出力マルチチャネルオーディオ信号を複数のスピーカーに向けるように構成され、複数のスピーカーは出力マルチチャネルオーディオ信号に対応する音を生成するように構成される。
【0076】
実施例2において、実施例1のシステムは、複数のスピーカーの各々が方位角、仰角、および周波数の関数としてスピーカーにより出力される相対的な音量レベルを表す特徴的な指向性を有し、スピーカーの指向性が複数のスピーカーのリスナーの左右の耳の間に音量不均衡またはスペクトル成分不均衡を操作上生成し、バイノーラル指向性補償がリスナーの左右の耳の間の音量不均衡またはスペクトル成分不均衡を操作上低減または排除するように構成されるように任意選択的にさらに構成することができる。
【0077】
実施例3において、実施例1-2のいずれか一つのシステムは、処理が複数のスピーカーにリスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、複数のスピーカーにリスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理をさらに含むように任意選択的にさらに構成することができる。
【0078】
実施例4において、実施例1-3のいずれか一つのシステムは、左耳の位置および右耳の位置を能動的に追跡するように構成されたヘッドトラッカーを任意選択的にさらに含むことができる。
【0079】
実施例5において、実施例1-4のいずれか一つのシステムは、プロセッサが推定された時不変の左右の耳の位置を使用するように構成されるように任意選択的にさらに構成することができる。
【0080】
実施例6において、実施例1-5のいずれか一つのシステムは、複数のスピーカーが左スピーカーおよび右スピーカーのみを含み、入力マルチチャネルオーディオ信号が左入力オーディオ信号および右入力オーディオ信号に対応するデータを含み、出力マルチチャネルオーディオ信号が左出力オーディオ信号および右出力オーディオ信号に対応するデータを含むように任意選択的にさらに構成することができる。
【0081】
実施例7において、実施例1-6のいずれか一つのシステムは、プロセッサが空間オーディオ処理においてバイノーラル指向性補償を実行するように構成されるように任意選択的にさらに構成することができる。
【0082】
実施例8において、実施例1-7のいずれか一つのシステムは、プロセッサが左スピーカーとリスナーの右耳との間および右スピーカーとリスナーの左耳との間のクロストークをキャンセルすることを含めるために空間オーディオ処理を実行するように構成されるように任意選択的にさらに構成することができる。
【0083】
実施例9において、実施例1-8のいずれか一つのシステムは、プロセッサが、左耳の位置における左スピーカーの指向性に対応する第一の指向性値を提供することと、右耳の位置における左スピーカーの指向性に対応する第二の指向性値を提供することと、左耳の位置における右スピーカーの指向性に対応する第三の指向性値を提供することと、右耳の位置における右スピーカーの指向性に対応する第四の指向性値を提供することと、リスナーの左耳が左耳の位置において左スピーカーから音をどのように受け取るかを特徴付ける第一の頭部伝達関数を提供することと、リスナーの右耳が右耳の位置において左スピーカーから音をどのように受け取るかを特徴付ける第二の頭部伝達関数を提供することと、リスナーの左耳が左耳の位置において右スピーカーから音をどのように受け取るかを特徴付ける第三の頭部伝達関数を提供することと、リスナーの右耳が右耳の位置において右スピーカーから音をどのように受け取るかを特徴付ける第四の頭部伝達関数を提供することと、第二の頭部伝達関数として、第三の指向性値を乗算し、第四の指向性値で除算された、修正された第二の頭部伝達関数を形成することと、第二の頭部伝達関数として、第一の指向性値を乗算し、第二の指向性値で除算された、修正された第三の頭部伝達関数を形成することと、第一、修正された第二、修正された第三、および第四の頭部伝達関数を含む行列の逆行列として補償行列を形成することと、左入力オーディオ信号および右入力オーディオ信号の変換を含む入力行列を形成することと、補償行列と入力行列との積として計算された出力行列を形成することであって、出力行列は左出力オーディオ信号および右出力オーディオ信号の変換を含む、出力行列を形成することと、によりクロストークをキャンセルするように構成されるように任意選択的にさらに構成することができる。
【0084】
実施例10において、実施例1-9のいずれか一つのシステムは、プロセッサが空間オーディオ処理およびバイノーラル指向性補償の下流でスピーカー等化をさらに実行するように構成されるように任意選択的にさらに構成することができる。
【0085】
実施例11において、実施例1-10のいずれか一つのシステムは、プロセッサが空間オーディオ処理の下流でバイノーラル指向性補償を実行するように構成されるように任意選択的にさらに構成することができる。
【0086】
実施例12において、実施例1-11のいずれか一つのシステムは、プロセッサが左スピーカーとリスナーの右耳との間および右スピーカーとリスナーの左耳との間のクロストークをキャンセルすることを含めるために空間オーディオ処理を実行するように構成されるように任意選択的にさらに構成することができる。
【0087】
実施例13において、実施例1-12のいずれか一つのシステムは、プロセッサが、左耳の位置におけるリスナーの左耳が左スピーカーから音をどのように受け取るかを特徴付ける第一の頭部伝達関数を提供することと、右耳の位置におけるリスナーの右耳が左スピーカーから音をどのように受け取るかを特徴付ける第二の頭部伝達関数を提供することと、左耳の位置におけるリスナーの左耳が右スピーカーから音をどのように受け取るかを特徴付ける第三の頭部伝達関数を提供することと、右耳の位置におけるリスナーの右耳が右スピーカーから音をどのように受け取るかを特徴付ける第四の頭部伝達関数を提供することと、第一、第二、第三、および第四の頭部伝達関数を含む行列の逆行列として補償行列を形成することと、左入力オーディオ信号および右入力オーディオ信号の変換を含む入力行列を形成することと、補償行列と入力行列との積として計算された出力行列を形成することであって、出力行列は左出力オーディオ信号および右出力オーディオ信号の変換を含む、出力行列を形成することと、によりクロストークをキャンセルするように構成されるように任意選択的にさらに構成することができる。
【0088】
実施例14において、実施例1-13のいずれか一つのシステムは、プロセッサが空間オーディオ処理の下流でスピーカー等化をさらに実行し、スピーカー等化においてバイノーラル指向性補償実行するように構成されるように任意選択的にさらに構成することができる。
【0089】
実施例15において、バイノーラル指向性補償音を生成するための方法は、プロセッサにおいて入力マルチチャネルオーディオ信号を受信することと、プロセッサを用いて出力マルチチャネルオーディオ信号を形成するために入力マルチチャネルオーディオ信号に対して処理を実行することであって、処理は複数のスピーカーの各スピーカーの性能の方向変動を補償するためのバイノーラル指向性補償を含む、実行することと、出力マルチチャネルオーディオ信号を複数のスピーカーに向けることと、複数のスピーカーを用いて出力マルチチャネルオーディオ信号に対応する音を生成することと、を含むことができる。
【0090】
実施例16において、実施例15の方法は、複数のスピーカーの各々が方位角、仰角、および周波数の関数としてスピーカーにより出力される相対的な音量レベルを表す特徴的な指向性を有し、スピーカーの指向性が複数のスピーカーのリスナーの左右の耳の間に音量不均衡またはスペクトル成分不均衡を操作上生成し、バイノーラル指向性補償がリスナーの左右の耳の間の音量不均衡またはスペクトル成分不均衡を操作上低減または排除するように任意選択的にさらに構成することができる。
【0091】
実施例17において、実施例15-16の方法は、処理が複数のスピーカーにリスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、複数のスピーカーにリスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理をさらに含むように任意選択的にさらに構成することができる。
【0092】
実施例18において、バイノーラル指向性補償音を生成するためのシステムは、左スピーカーであって、方位角、仰角、および周波数の関数として左スピーカーにより出力される相対的な音量レベルを表す特徴的な左指向性を有する左スピーカーと、右スピーカーであって、方位角、仰角、および周波数の関数として右スピーカーにより出力される相対的な音量レベルを表す特徴的な右指向性を有し、左指向性および右指向性は左スピーカーのリスナーの左右の耳と右スピーカーとの間に音量不均衡またはスペクトル成分不均衡を操作上生成する、右スピーカーと、左スピーカーおよび右スピーカーに結合されたプロセッサであって、プロセッサは入力マルチチャネルオーディオ信号を受信し、出力マルチチャネルオーディオ信号を形成するために入力マルチチャネルオーディオ信号に対して処理を実行し、処理は操作上複数のスピーカーにリスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、操作上複数のスピーカーにリスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理を含み、処理はリスナーの左右の耳の間の音量不均衡またはスペクトル成分不均衡を操作上低減または排除するためのバイノーラル指向性補償をさらに含み、出力マルチチャネルオーディオ信号を左スピーカーおよび右スピーカーに向けるように構成される、プロセッサとを含むことができ、左スピーカーおよび右スピーカーが出力マルチチャネルオーディオ信号に対応する音を生成するように構成される。
【0093】
実施例19において、実施例18のシステムは、処理が複数のスピーカーにリスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、複数のスピーカーにリスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理をさらに含み、プロセッサが空間オーディオ処理においてバイノーラル指向性補償を実行するように構成され、プロセッサが空間オーディオ処理およびバイノーラル指向性補償の下流でスピーカー等化をさらに実行するように構成されるように任意選択的にさらに構成することができる。
【0094】
実施例20において、実施例18-19のシステムは、処理が複数のスピーカーにリスナーの左耳に対応する左耳の位置まで特定の左オーディオチャネルに対応する音を伝達させ、複数のスピーカーにリスナーの右耳に対応する右耳の位置まで特定の右オーディオチャネルに対応する音を伝達させる空間オーディオ処理をさらに含み、プロセッサが空間オーディオ処理の下流でバイノーラル指向性補償を実行するように構成され、プロセッサが空間オーディオ処理の下流でスピーカー等化をさらに実行し、スピーカー等化においてバイノーラル指向性補償を実行するように構成されるように任意選択的にさらに構成することができる。