(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022117950
(43)【公開日】2022-08-12
(54)【発明の名称】3次元没入型サウンドを提供するためのシステム及び方法
(51)【国際特許分類】
H04S 7/00 20060101AFI20220804BHJP
H04R 3/00 20060101ALN20220804BHJP
【FI】
H04S7/00 300
H04R3/00 310
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022006915
(22)【出願日】2022-01-20
(31)【優先権主張番号】17/164,437
(32)【優先日】2021-02-01
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】512168283
【氏名又は名称】ハーマン インターナショナル インダストリーズ, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ジアド ラメズ ハタブ
【テーマコード(参考)】
5D162
5D220
【Fターム(参考)】
5D162AA13
5D162CA11
5D162CB12
5D162CC11
5D162CD06
5D162EG02
5D220AA14
(57)【要約】 (修正有)
【課題】3次元没入型サウンドを提供するためのシステム及び方法を提供する。
【解決手段】システム300は、複数のラウドスピーカー304に動作可能に結合されるコントローラ302を含む。コントローラ302は、第1のフィルタバンク304、混合マトリックスブロック306、ブラウアートクロスオーバーネットワーク308、音響心理学的モデリングブロック310、ゲインブロック312及び第2のフィルタバンク314を含む。コントローラは、各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶し、方向決定帯域毎にサブバンドを含む少なくとも音響心理学的尺度を記憶する。コントローラは、さらに、サブバンドのエネルギーを決定し、サブバンドのエネルギーに基づいて、ラウドスピーカー駆動信号を生成して、ラウドスピーカーを駆動させる。
【選択図】
図6
【特許請求の範囲】
【請求項1】
3次元(3D)没入型サウンドを提供するためのシステムであって、前記システムは、
リスニング環境で音声出力信号を伝送するためのラウドスピーカーと、
少なくとも1つのコントローラと、を含み、前記少なくとも1つのコントローラは、
各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶することと、
各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、
前記サブバンドのエネルギーを決定することと、
少なくとも前記サブバンドの前記エネルギーに基づいて、ラウドスピーカー駆動信号を生成して、前記ラウドスピーカーを駆動させ、前記音声出力信号を伝送することと、
を行うようにプログラムされる、前記システム。
【請求項2】
前記少なくとも1つのコントローラは、さらに、前記サブバンドの前記エネルギーとマスキング聴力閾値との差を決定するようにプログラムされる、請求項1に記載のシステム。
【請求項3】
前記マスキング聴力閾値はリスナーによって聴取可能な可聴信号に対応する、請求項2に記載のシステム。
【請求項4】
前記少なくとも1つのコントローラは、さらに、前記差を1つ以上の閾値と比較するようにプログラムされる、請求項2に記載のシステム。
【請求項5】
前記少なくとも1つのコントローラは、さらに、前記1つ以上の閾値との前記差の比較に基づいて、前記ラウドスピーカー駆動信号にゲインを適用するようにプログラムされる、請求項4に記載のシステム。
【請求項6】
前記ゲインは、前記音声出力信号の指向性の増加、または前記音声出力信号の歪みを最小にすることのうちの1つを行う、請求項5に記載のシステム。
【請求項7】
前記複数の方向決定帯域は複数のブラウアート方向決定帯域に対応する、請求項1に記載のシステム。
【請求項8】
前記少なくとも音響心理学的尺度は少なくとも1つのバーク尺度である、請求項7に記載のシステム。
【請求項9】
3次元(3D)没入型サウンドを提供するようにプログラムされる非一時的コンピュータ可読媒体に具体化されるコンピュータプログラム製品であって、前記コンピュータプログラム製品は命令を含み、前記命令は、
リスニング環境で音声出力信号を伝送することと、
各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶することと、
各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、
前記サブバンドのエネルギーを決定することと、
少なくとも前記サブバンドの前記エネルギーに基づいて、ラウドスピーカー駆動信号を生成して、前記ラウドスピーカーを駆動させ、前記音声出力信号を伝送することと、
を行う、前記コンピュータプログラム製品。
【請求項10】
前記サブバンドの前記エネルギーとマスキング聴力閾値との差を決定するための命令をさらに含む、請求項9に記載のコンピュータプログラム製品。
【請求項11】
前記マスキング聴力閾値はリスナーによって聴取可能な可聴信号に対応する、請求項10に記載のコンピュータプログラム製品。
【請求項12】
前記差を1つ以上の閾値と比較するための命令をさらに含む、請求項10に記載のコンピュータプログラム製品。
【請求項13】
前記差を前記1つ以上の閾値との前記比較に基づいて、前記ラウドスピーカー駆動信号にゲインを適用するための命令をさらに含む、請求項12に記載のコンピュータプログラム製品。
【請求項14】
前記ゲインは、前記音声出力信号の指向性の増加、または前記音声出力信号の歪みを最小にすることのうちの1つを行う、請求項13に記載のコンピュータプログラム製品。
【請求項15】
前記複数の方向決定帯域は複数のブラウアート方向決定帯域に対応する、請求項9に記載のコンピュータプログラム製品。
【請求項16】
前記少なくとも音響心理学的尺度は少なくとも1つのバーク尺度である、請求項15に記載のコンピュータプログラム製品。
【請求項17】
3次元(3D)没入型サウンドを提供するための方法であって、前記方法は、
リスニング環境で音声出力信号を伝送することと、
各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶することと、
各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、
前記サブバンドのエネルギーを決定することと、
少なくとも前記サブバンドの前記エネルギーに基づいて、ラウドスピーカー駆動信号を生成して、前記ラウドスピーカーを駆動させ、前記音声出力信号を伝送することと、
を行う、前記方法。
【請求項18】
前記サブバンドの前記エネルギーとマスキング聴力閾値との差を決定するための命令をさらに含む、請求項17に記載の方法。
【請求項19】
前記差を1つ以上の閾値と比較するための命令をさらに含む、請求項18に記載の方法。
【請求項20】
前記差を前記1つ以上の閾値との前記比較に基づいて、前記ラウドスピーカー駆動信号にゲインを適用するための命令をさらに含む、請求項19に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書に開示される態様は、概して、3次元(3D)没入型サウンドのためのシステム及び方法に関する。一例では、3D没入型サウンドを提供するためのシステム及び方法は、音響心理学的方向決定帯域及び狭帯域ラウドスピーカーのうちの少なくとも1つに基づき得る。これらの態様及び他の態様は、本明細書では、より詳細に説明される。
【背景技術】
【0002】
現在の広帯域ラウドスピーカーの配置は多くの欠点がある。1つの欠点として限られた音像定位があり、これは、ラウドスピーカーが位置付けられる場所に関して一貫している。例えば、フロントラウドスピーカーはリスナーの位置の前に局所化され、リアラウドスピーカーはリスナーの位置の後方に局所化される等のことがある。別の欠点として、仮想高さ効果を実現するために使用される多くのデジタル信号処理(DSP)技術は、リスナーのスイートスポットが制限され大きな計算負荷がかかること、または係る技術は音源を反射するために音場の障害物及び部屋の形状に依存することのいずれか一方が挙げられる。
【0003】
狭帯域ラウドスピーカーの配置に関して、聴覚システムは信号の周波数だけに依存する方向に音感覚を形成する。信号周波数と音感覚の方向との音響心理学的関係は、ブラウアート方向決定帯域(BDB)によって説明できる。
【0004】
また、ヘッドフォンも3D没入型サウンドを作成する別の方法であるが、自動車の運転中等の特定の状況では、ヘッドフォンの使用は制限されている及び/または禁止されている。さらに、ヘッドフォンは、ラウドスピーカー、特にサブウーファーから発生する低周波振動を再現する能力がない。
【発明の概要】
【課題を解決するための手段】
【0005】
一実施形態では、3次元(3D)没入型サウンドを提供するためのシステムが提供される。本システムはラウドスピーカー及び少なくとも1つのコントローラを含む。ラウドスピーカーはリスニング環境で音声出力信号を伝送する。少なくとも1つのコントローラは、各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶し、方向決定帯域毎にサブバンドを含む少なくとも音響心理学的尺度を記憶するようにプログラムされる。少なくとも1つのコントローラは、さらに、サブバンドのエネルギーを決定し、少なくともサブバンドのエネルギーに基づいて、ラウドスピーカー駆動信号を生成して、ラウドスピーカーを駆動させ、音声出力信号を伝送するようにプログラムされる。
【0006】
少なくとも別の実施形態では、3次元(3D)没入型サウンドを提供するようにプログラムされる非一時的コンピュータ可読媒体に具体化されたコンピュータプログラム製品が提供される。コンピュータプログラム製品は、リスニング環境で音声出力信号を伝送するための命令と、複数の方向決定帯域を記憶するための命令とを含み、各方向決定帯域は狭帯域周波数間隔によって定義される。コンピュータプログラム製品は、各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶するための命令と、サブバンドのエネルギーを決定するための命令とを含む。コンピュータプログラム製品は、少なくとも、ラウドスピーカーを駆動して音声出力信号を伝送するためのサブバンドのエネルギーに基づいて、ラウドスピーカー駆動信号を生成するための命令を含む。
【0007】
少なくとも別の実施形態では、3次元(3D)没入型サウンドを提供するための方法が提供される。本方法は、リスニング環境で音声出力信号を伝送することと、複数の方向決定帯域を記憶することとを含み、各方向決定帯域は狭帯域周波数間隔によって定義される。本方法は、各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、サブバンドのエネルギーを決定することとを含む。本方法は、少なくとも、ラウドスピーカーを駆動して音声出力信号を伝送するためのサブバンドのエネルギーに基づいて、ラウドスピーカー駆動信号を生成することを含む。
【0008】
本開示の実施形態は、添付の特許請求の範囲において特に指摘されている。しかしながら、様々な実施形態の他の特徴はより明らかになり、以下の詳細な説明を添付の図面と併せて参照することによって最良に理解されるであろう。
例えば、本願は以下の項目を提供する。
(項目1)
3次元(3D)没入型サウンドを提供するためのシステムであって、上記システムは、
リスニング環境で音声出力信号を伝送するためのラウドスピーカーと、
少なくとも1つのコントローラと、を含み、上記少なくとも1つのコントローラは、
各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶することと、
各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、
上記サブバンドのエネルギーを決定することと、
少なくとも上記サブバンドの上記エネルギーに基づいて、ラウドスピーカー駆動信号を生成して、上記ラウドスピーカーを駆動させ、上記音声出力信号を伝送することと、
を行うようにプログラムされる、上記システム。
(項目2)
上記少なくとも1つのコントローラは、さらに、上記サブバンドの上記エネルギーとマスキング聴力閾値との差を決定するようにプログラムされる、上記項目に記載のシステム。
(項目3)
上記マスキング聴力閾値はリスナーによって聴取可能な可聴信号に対応する、上記項目のいずれか一項に記載のシステム。
(項目4)
上記少なくとも1つのコントローラは、さらに、上記差を1つ以上の閾値と比較するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目5)
上記少なくとも1つのコントローラは、さらに、上記1つ以上の閾値との上記差の比較に基づいて、上記ラウドスピーカー駆動信号にゲインを適用するようにプログラムされる、上記項目のいずれか一項に記載のシステム。
(項目6)
上記ゲインは、上記音声出力信号の指向性の増加、または上記音声出力信号の歪みを最小にすることのうちの1つを行う、上記項目のいずれか一項に記載のシステム。
(項目7)
上記複数の方向決定帯域は複数のブラウアート方向決定帯域に対応する、上記項目のいずれか一項に記載のシステム。
(項目8)
上記少なくとも音響心理学的尺度は少なくとも1つのバーク尺度である、上記項目のいずれか一項に記載のシステム。
(項目9)
3次元(3D)没入型サウンドを提供するようにプログラムされる非一時的コンピュータ可読媒体に具体化されるコンピュータプログラム製品であって、上記コンピュータプログラム製品は命令を含み、上記命令は、
リスニング環境で音声出力信号を伝送することと、
各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶することと、
各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、
上記サブバンドのエネルギーを決定することと、
少なくとも上記サブバンドの上記エネルギーに基づいて、ラウドスピーカー駆動信号を生成して、上記ラウドスピーカーを駆動させ、上記音声出力信号を伝送することと、
を行う、上記コンピュータプログラム製品。
(項目10)
上記サブバンドの上記エネルギーとマスキング聴力閾値との差を決定するための命令をさらに含む、上記項目に記載のコンピュータプログラム製品。
(項目11)
上記マスキング聴力閾値はリスナーによって聴取可能な可聴信号に対応する、上記項目のいずれか一項に記載のコンピュータプログラム製品。
(項目12)
上記差を1つ以上の閾値と比較するための命令をさらに含む、上記項目のいずれか一項に記載のコンピュータプログラム製品。
(項目13)
上記差を上記1つ以上の閾値との上記比較に基づいて、上記ラウドスピーカー駆動信号にゲインを適用するための命令をさらに含む、上記項目のいずれか一項に記載のコンピュータプログラム製品。
(項目14)
上記ゲインは、上記音声出力信号の指向性の増加、または上記音声出力信号の歪みを最小にすることのうちの1つを行う、上記項目のいずれか一項に記載のコンピュータプログラム製品。
(項目15)
上記複数の方向決定帯域は複数のブラウアート方向決定帯域に対応する、上記項目のいずれか一項に記載のコンピュータプログラム製品。
(項目16)
上記少なくとも音響心理学的尺度は少なくとも1つのバーク尺度である、上記項目のいずれか一項に記載のコンピュータプログラム製品。
(項目17)
3次元(3D)没入型サウンドを提供するための方法であって、上記方法は、
リスニング環境で音声出力信号を伝送することと、
各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶することと、
各方向決定帯域にサブバンドを含む少なくとも音響心理学的尺度を記憶することと、
上記サブバンドのエネルギーを決定することと、
少なくとも上記サブバンドの上記エネルギーに基づいて、ラウドスピーカー駆動信号を生成して、上記ラウドスピーカーを駆動させ、上記音声出力信号を伝送することと、
を行う、上記方法。
(項目18)
上記サブバンドの上記エネルギーとマスキング聴力閾値との差を決定するための命令をさらに含む、上記項目に記載の方法。
(項目19)
上記差を1つ以上の閾値と比較するための命令をさらに含む、上記項目のいずれか一項に記載の方法。
(項目20)
上記差を上記1つ以上の閾値との上記比較に基づいて、上記ラウドスピーカー駆動信号にゲインを適用するための命令をさらに含む、上記項目のいずれか一項に記載の方法。
(摘要)
一実施形態では、3次元(3D)没入型サウンドを提供するためのシステムが提供されている。本システムはラウドスピーカー及び少なくとも1つのコントローラを含む。ラウドスピーカーはリスニング環境において音声出力信号を伝送する。少なくとも1つのコントローラは、各方向決定帯域が狭帯域周波数間隔によって定義されている複数の方向決定帯域を記憶し、方向決定帯域毎にサブバンドを含む少なくとも音響心理学的尺度を記憶するようにプログラムされる。少なくとも1つのコントローラは、さらに、サブバンドのエネルギーを決定し、少なくともサブバンドのエネルギーに基づいて、ラウドスピーカー駆動信号を生成して、ラウドスピーカーを駆動させ、音声出力信号を伝送するようにプログラムされる。
【図面の簡単な説明】
【0009】
【
図1】正中面と、正中面の上部とに分割される対応するリスナーの3D没入型サウンド感覚平面を示す。
【
図2】音源の位置に関係ない、正中面における狭帯域音の定位の概略図を示す。
【
図3A】リスニング環境の第1の構成における、音響心理学的ラウドスピーカー、サブウーファー、及びツイーターの様々な配置例を示す。
【
図3B】リスニング環境の第2の構成における音響心理学的ラウドスピーカー、サブウーファー、及びツイーターの様々な配置例を示す。
【
図4】ブラウアート方向決定帯域とクリティカルサブバンドとの関係を示す。
【
図5】クリティカルサブバンド及び周波数範囲を含む音響心理学的バーク尺度を示す。
【
図6】一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供するためのシステムを示す。
【
図7】一実施形態による、BDBの範囲外の周波数を減衰させながら、BDBの範囲内の周波数を高める、選択されたBDB帯域用の平滑化フィルタの一例を示すプロットを示す。
【
図8】一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供するための方法を示す。
【
図9】一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供するシステムの一例を示す。
【
図10】一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供するシステムの別の例を示す。
【発明を実施するための形態】
【0010】
必要に応じて、本発明の詳細な実施形態が本明細書に開示されるが、開示された実施形態は、様々な形態及び代替の形態で具体化され得る本発明の単なる例であることを理解されたい。図は必ずしも縮尺通りではない。いくつかの特徴は、特定の構成要素の詳細を示すために誇張または最小にされ得る。したがって、本明細書に開示される特定の構造及び機能の詳細は、限定するものではなく、単に当業者が本発明を様々に使用するのに教示するための代表的な基礎として解釈されたい。
【0011】
本明細書に開示されるコントローラ/デバイスは、任意の数のマイクロプロセッサ、集積回路、メモリデバイス(例えば、フラッシュメモリ、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的プログラム可能読み出し専用メモリ(EPROM)、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM)、または他の適切な異形)、及び本明細書に開示される動作(複数可)を行うために相互作用して働くソフトウェアを含み得ることが認識される。さらに、開示される係るコントローラは、1つ以上のマイクロプロセッサを利用して、開示される任意の数の機能を行うようにプログラムされる非一時的コンピュータ可読媒体内で具体化されるコンピュータプログラムを実行する。さらに、本明細書に提供されるコントローラ(複数可)は、筐体、筐体内に位置付けられる、様々な数のマイクロプロセッサ、集積回路、及びメモリデバイス(例えば、フラッシュメモリ、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的プログラム可能読み出し専用メモリ(EPROM)、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM))を含む。また、開示されるコントローラ(複数可)は、各々、本明細書に説明される他のハードウェアベースのデバイスを往復して、データを送受信するためのハードウェアベースの入力及び出力を含む。本明細書に記載の様々なシステム、ブロック、及び/またはフロー図は、時間領域、周波数領域等を参照しているが、係るシステム、ブロック、及び/またはフロー図は、時間領域、周波数領域等のいずれか1つ以上で実装され得ることが認識される。
【0012】
リスナーの位置の全体及び周囲に3D没入型サウンドを届けるための現在の技術は、次の2つのカテゴリに分類される。例えば、第1のカテゴリでは、5.1及び7.1等のサラウンド音響技術を利用する複数のラウドスピーカーを使用し得る。これらの対応するサラウンド音響技術は、システムに高さチャンネルを追加している。結果的に、天井にラウドスピーカーを追加し、上向きのスピーカーを追加することによって、完全没入型の3D音声が可能になり、より高い面で音が跳ね返る。11.2または22.4等の新しい構成は係る配置の例である。
【0013】
3D没入型サウンドを届けるための第2のカテゴリはサウンドバーを含む。例えば、既存のサウンドバー技術は、線形配列に配置される複数のラウドスピーカーに依存する。いくつかのラウドスピーカーは正中面を直接横切って指すが、他のラウドスピーカーはリスニング位置を越えて向けられ、表面及びリスナーの位置の周囲で反射される音に依存する。さらに、いくつかのサウンドバーは、音声の個別のチャネルをリスニング位置の周囲の特定の場所に向けるために、位相及び大きさの補正等の追加のデジタル信号処理(DSP)技術を含み得る。
【0014】
上述した現在の技術とは異なり、本明細書に開示される態様は、とりわけ、ラウドスピーカーチャネルの数を最小にし、ラウドスピーカーの配置及び音の指向性に依存せず、DSP計算負荷を最小にしながら、3D没入型サウンドを提供する。さらに、本明細書に開示される態様は、概して、クリティカルサブバンド(CSB)(またはバーク尺度(または音響心理学的尺度)のサブバンド)、ブラウアート方向決定帯域(BDB)(または方向決定帯域)、マスキング閾値、実質的に高められた音響画像等の音響心理学的概念に依存し得る。これらの態様及び他の態様は下記により詳細に説明される。
【0015】
図1は、様々な平面(またはセクター)104a~104cに分割されたリスナー(またはユーザー)102の3D没入型サウンド感覚平面100を示す。例えば、平面104aはリスナー102に対して後部上側正中面(またはRU面)として定義され得、平面104bはリスナー102に対して上部正中面(またはTOP面)として定義され得、平面104cはリスナー102に対して前部上側正中面(またはFU面)として定義され得る。概して、3D没入型サウンドは、モノラル、ステレオ、及びサラウンドミックスよりも空間次元の認識の向上をリスナー(複数可)102に提供する。一方、モノラル、ステレオ、及びサラウンドミックスにおける音像定位は、リスナー102の正中面106に対して水平から±15度以内まで制限され得る。3D没入型サウンド感覚は、水平正中面に加えて、正中面106の上部(例えば、平面104a~104c)に分布している。
【0016】
図2は、音源の位置に関係ない、正中面106における狭帯域音の定位の概略
図120を示す。音響心理学の研究では、狭帯域音の定位は、音源の場所に関係なく、特定の方向から来ていると知覚できることが示されている。言い換えれば、人間の聴覚システムは、音声信号の周波数に依存する方向に音感覚を形成する。信号周波数と音感覚の方向との間の音響心理学的機能は、下記の
図2に示されるように、ブラウアートの方向決定帯域によって説明できる(また、J.Blauert,「Sound Localization in the Median Plane」,Acta Acustica 22(4),pp.205-13,Nov.1969、及びH.Fastl and E.Zwicker,「Psychoacoustics Facts and Models」,Third Edition,Springer 2007参照)。
【0017】
例えば、300Hzまたは3kHzの中心周波数を有する狭帯域音がリスナー102に提示される場合、サウンドステージは、正中面106のFU面104cにおいてリスナー102によって知覚される。例えば、8kHzを中心とする狭帯域音は、音源がリスナー102の前にある場合でも、正中面106のTOP面104bから来るものとして知覚される。例えば、1kHzまたは10kHzを中心とする狭帯域音は、音源の実際の場所に関係なく、正中面106のRU面104aで発生すると知覚される。
【0018】
図3Aは、リスニング環境161における、音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156a、サブウーファー158、ならびにツイーター160の配置または位置の様々な一例の実施態様150を示す。概して、実装されている音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156aの数は、少なくともブラウアート方向決定帯域(BDB)の数に基づいている。音響心理学的ラウドスピーカー152a、152bは、リスニング環境161のFU面104cにおいてリスナー102に音声を提供するように配向され得る。音響心理学的ラウドスピーカー154a、154bは、リスニング環境161のRU面104aにおいてリスナー102に音声を提供するように配向され得る。音響心理学的ラウドスピーカー156aは、リスニング環境161のTOP面104bに音声を提供するように配向され得る。サブウーファー158及びツイーター160は、音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156aを補完して、各々、低周波数範囲(例えば、サブウーファー範囲)及び高周波数範囲(例えば、ツイーター範囲)の音声を提供する。明確にするために、音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156aは実際の物理的なラウドスピーカーであると認識される。音声源159は、リスニング環境161内に位置付けられ、リスニング環境161で再生するために、様々な音響心理学的ラウドスピーカー152a~152b、154a~154b、156a、サブウーファー158、及びツイーター160に音声を伝送し得る。
【0019】
概して、1つ以上の音響心理学的ラウドスピーカー152a~152b、154a~154b、156aの配置または場所は、所望の音源(または、音声源159)の場所とは無関係であり得る。これは、
図3Bの実施態様170にさらに示され、音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156aの全てはリスナー102の前に位置付けられる。対照的に、
図3Aでは、音響心理学的ラウドスピーカー152a及び154aは、リスナー102aの後方に及び音響心理学的ラウドスピーカー152b、154b、及び156aの後方に位置付けられる。サブウーファー158は、その全方向性により、部屋の囲い(またはリスニング環境161)のどこにでも設置され得る。ツイーター160は、その集束ビームの方向性のために、リスナー102の前に設置され得る。概して、両方の実施態様150、170について、それぞれが同等の3D没入型効果を生成するものとする。
【0020】
音響心理学スピーカー152a~152b、154a~154b、及び156aは、バーク尺度または等価長方形帯域幅(ERB)尺度またはメル尺度等の音響心理学的クリティカルサブバンド尺度を含む個々の狭帯域スピーカーの組み合わせであり得る。追加的または代替的に、音響心理学スピーカー152a~152b、154a~154b、及び156aのいずれか1つは、BDB周波数範囲を対象とする単一のラウドスピーカーであり得る。
【0021】
図4は、様々な音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156aに関するブラウアート方向決定帯域(BDB)とクリティカルサブバンド(CSB)との関係を示す。
図5は、下記の
図4の説明に関連して参照される対応するブラウアート方向決定帯域及び周波数を示す。CSBはバーク番号(例えば、1~25)として指定され、対応するBDBは周波数範囲を定義するCSBのグループを含む。概して、音響心理学ラウドスピーカー152a(例えば、FU1ベースのラウドスピーカー)に示されるように、音響心理学ラウドスピーカー152aは、バーク帯域3、4、5、及び6(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む4つの別個の狭帯域ラウドスピーカー、または250Hz~570Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)もしくはこれらの4つのバーク帯域のいずれかのグループの組み合わせを有する1つのラウドスピーカーを含み得る。音響心理学的ラウドスピーカー154a(例えば、RU1ベースのラウドスピーカー)は、バーク帯域7、8、9、10、11、12、13(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む7つの別個の狭帯域スピーカー、または700Hz~1850Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)もしくはこれらの7つのバーク帯域のいずれかのグループの組み合わせを有する1つのラウドスピーカーを含む。
【0022】
音響心理学的ラウドスピーカー152b(例えば、FU2ベースのラウドスピーカー)は、バーク帯域14、15、16、17、18、19、20、21(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む8つの別個の狭帯域スピーカー、または2150Hz~7000Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)もしくはこれらの8つのバーク帯域のいずれかのグループの組み合わせを有する1つのラウドスピーカーを含む。音響心理学的ラウドスピーカー156a(例えば、TOPラウドスピーカー)は、バーク帯域22(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む単一の狭帯域ラウドスピーカー、または8500Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)を有する単一のラウドスピーカーを備える。
【0023】
音響心理学的ラウドスピーカー154b(例えば、RU2ラウドスピーカー)は、バーク帯域23,24(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む2つの狭帯域ラウドスピーカー、または10500Hz~13500Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)を有する単一のラウドスピーカーを備える。ラウドスピーカー158(例えば、サブウーファー)は、バーク帯域1,2(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む2つの狭帯域ラウドスピーカー、または50Hz~150Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)を有する単一のラウドスピーカーを備える。ラウドスピーカー160(例えば、ツイーターラウドスピーカー)は、バーク帯域25(
図4、及び
図5の表題「バーク」の下の値を参照)を対象に含む単一の狭帯域ラウドスピーカー、または17750Hzの範囲のプログラム可能な中心周波数(
図5の表題「中心周波数(Hz)」の下の値を参照)を有するラウドスピーカーを備える。概して、本明細書に開示される態様は、限定ではないが、CSB及びBDBのエネルギーを変更して、いずかの追加の歪みを最小にしながら、指向性係数を増加させるシステム及び方法を提供する。例えば、CSB及びDBDのスペクトル成分は、物理的な高さのラウドスピーカーを使用しないで、知覚される音像を高めることができる。
【0024】
図6は、一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供するためのシステム300を示す。システム300は、複数のラウドスピーカー304(例えば、音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156a、サブウーファー158、ならびにツイーター160)に動作可能に結合される少なくとも1つのコントローラ302(以下、「コントローラ302」)を含む。コントローラ302は、任意の数のデジタル信号プロセッサ(DSP)を含み得、概して、リスニング環境161において、リスナー102が再生するために複数のラウドスピーカー304に入力音声信号を提供するようにプログラムされることが認識される。
【0025】
コントローラ302は、第1のフィルタバンク304、混合マトリックスブロック306、クロスオーバーネットワーク308(例えば、ブラウアートクロスオーバーネットワーク308)、音響心理学的モデリングブロック310、ゲインブロック312、及び第2のフィルタバンク314を含む。入力音声信号は右チャネル及び左チャネルに分割され得、両方のチャネル信号は第1のフィルタバンク304に提供される。第1のフィルタバンク304は、チャネル信号を時間領域から周波数領域に変換する。第1のフィルタバンク304は、バーク尺度、メル尺度、またはERB尺度に従って、周波数領域チャネル信号をM個のクリティカルサブバンド(CSB)のセットにマッピングし得る。例えば、第1のフィルタバンク304によって行われるマッピングは、バーク尺度、メル尺度、またはERB尺度の離散サブバンドへのヘルツスケールの離散周波数の線形変換であり得る。
【0026】
混合マトリックスブロック306は、様々な倍率を適用することによって、ラウドスピーカーの数Nに一致するように入力チャネルの数を減少または増加し得る。
図6の例では、混合マトリックスブロック306からのN個の出力チャネルは、ステレオ入力信号の場合、分析フィルタブロック304から左右の入力チャネルの線形結合に等しくなり得る。例えば、チャネル1=0.5*inputR+0.5*inputLであり、他のN-1チャネルについても同様である。この例では、0.5の増倍率は実数であるが、また、増倍率は複素数であり得る。クロスオーバーネットワーク308は、
図4に示される例に図示されるようにCSBの事前設定したマッピングに従って、様々なラウドスピーカー152a~152b、154a~154b、156a、158、及び160にBDBをグループする。
図4に関連して述べたように、CSBはバーク番号(例えば、1~25)として指定され、対応するBDBは周波数範囲を定義するCSBのグループを含む。
【0027】
音響心理学的モデリングブロック310は、エネルギー、マスキング聴力閾値、及びBDB内の各CSBのエネルギーとマスキング聴力閾値との差(またはデルタ(Δ))を計算する。CSBのエネルギーは、フィルタバンクブロック304によって計算されたCSBに関連付けられる複素数の二乗の大きさである。BDB内のCSBのマスキング聴力閾値は、その閾値を下回るといずれかのCSBエネルギーが聞こえなくなる一方、その閾値を超えるといずれかのエネルギーレベルが人間に聞こえる音響レベルである。マスキング閾値の計算は、上記に紹介したH.Fastl and E.Zwicker,「Psychoacoustics Facts and Models」,Third Edition,Springer 2007に記載されている音響心理学的モデルに基づき得る。音響心理学モデリングブロック310は、BDB内の各CSBのデルタ(Δ)(またはエネルギーとマスキング聴力閾値との差)を計算する。ゲインブロック312はゲインをクロスオーバーネットワークブロック308からNチャネルに適用して、CSBのエネルギーの増幅または減衰のいずれかを行う。BDB内の各CSBのエネルギー量の増幅または減衰のいずれかを行うことによって、本態様は、いずかの追加の歪みを最小にしながら、特定のラウドスピーカーの指向性係数を増加させ得る。本態様は
図8に関連してより詳細に説明される。
【0028】
第2のフィルタバンク314は、BDBのラウドスピーカーチャネルを周波数領域から時間領域に変換し直し、第2のフィルタバンク314はまた平滑化フィルタを適用する。所与のBDB帯域の平滑化フィルタは、BDBの範囲外の周波数を減衰させながら、BDBの範囲内の周波数を高めるように選ばれる。これは
図7にさらに示され、単一のCSB#22及び中心周波数が8.5kHzのBDBの例が示される。概して、BDDラウドスピーカーチャネルは、音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156a(例えば、FU1面、FU2面、RU1面、RU2面、及びTOP面で音声を伝送するラウドスピーカー)に関連付けられる様々なチャネルに対応する。時間領域ベースの狭帯域信号(またはラウドスピーカー駆動信号)を使用して、可能な増幅で複数のラウドスピーカー304を駆動する。
【0029】
図8は、一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供するための方法400を示す。動作402では、コントローラ302は、そのメモリに記憶された様々なBDBグループ(例えば、関連する音響心理学的ラウドスピーカー152a~152b、154a~154b、及び156a、サブウーファー158、ならびにツイーター160のBDBグループ)をループする。同様に、動作404では、コントローラ302は、各BDBグループの様々なCSB(またはバーク尺度)グループをループする。
【0030】
動作406では、コントローラ302は各CSBのエネルギーを計算する。同様に、コントローラ302は、BDBグループの各CSBについて、計算されたエネルギーとマスキング聴力閾値との差(またはデルタ(Δ))を計算する。動作408では、コントローラ302は、デルタ(Δ)を第1の閾値T1及び第2の閾値T2と比較する。第1の閾値T1及び第2の閾値T2は所定値に対応し、特定の実施態様の所望の基準に基づいて変化し得ることが認識される。コントローラ302が、デルタ(Δ)が第1の閾値T1より大きく、第2の閾値T2よりも小さいと決定した場合、方法400は動作416に進む。そうでない場合、本方法は動作410及び動作412に進む。
【0031】
動作410では、コントローラ302は、デルタ(Δ)が第1の閾値T1よりも小さいかどうかを決定する。この条件が真である場合、方法400は動作414に進み、それにより、コントローラ302は、ゲインブロック312を介して、第1のゲインG1を、動作410に記載された条件を満たすCSB(例えば、下限周波数、上限周波数、中心周波数、及び帯域幅を含むCSB(またはバーク尺度#)に対応する音声出力)に適用する。動作414では、コントローラ302は、第1のゲインG1をBDBグループ内の単一のCSBに適用する。第1のゲインG1は、減衰ゲイン(低減ゲイン)または音声出力を増加させるゲイン(または、BDBグループ内の単一のCSBの減衰ゲイン(低減ゲイン)もしくは音声出力を増加させるゲイン)に対応し得ることが認識される。したがって、BDBグループ内の単一のCSBに第1のゲインG1を適用した最終結果は、係るゲインでCSBによって指定された中心周波数で音声を出力する対応する音響心理学的ラウドスピーカー152a~152b、154a~154b、または156aを駆動するための駆動信号の生成をもたらす。全てのゲインを周波数領域のCSBに適用した後、コントローラ302は、第2のフィルタバンクブロック314を介してNチャネル信号を時間領域に変換し、上述したように選ばれた中心周波数で平滑化フィルタを適用する。さらに、第1のゲインG1は、実数及び/または複素数に対応し得ることが認識される。上述したように、対応するCSBに適用されるゲイン(例えば、第1のゲインG1、第2のゲインG2、及び第3のゲインG3)の増加は、そのCSBの指向性係数を増加させ得る。逆に、対応するCSBに適用されるゲインが減少すると、そのCSBの歪みが減少し得る。
【0032】
動作412では、コントローラ302は、また、デルタ(Δ)が第2の閾値T2よりも大きいかどうかを決定する。この条件が真である場合、方法400は動作418に進み、それにより、コントローラ302は、ゲインブロック312を介して、第3のゲインG3を、動作412に記載された条件を満たすCSB(例えば、下限周波数、上限周波数、中心周波数、及び帯域幅を含むCSB(またはバーク尺度#)に対応する音声出力)に適用する。動作418では、コントローラ302は、第3のゲインG1をBDBグループ内の単一のCSBに適用する。第3のゲインG3は、減衰ゲイン(低減ゲイン)または音声出力を増加させるゲイン(または、BDBグループ内の単一のCSBの減衰ゲイン(低減ゲイン)もしくは音声出力を増加させるゲイン)に対応し得ることが認識される。したがって、BDBグループ内の単一のCSBに第1のゲインG3を適用した最終結果は、係るゲインでCSBによって指定された中心周波数で音声を出力する対応する音響心理学的ラウドスピーカー152a~152b、154a~154b、または156aを駆動するための駆動信号の生成をもたらす。さらに、第3のゲインG3は、実数及び/または複素数に対応し得ることが認識される。
【0033】
動作416では、コントローラ302は、ゲインブロック312を介して、第2のゲインG2を、動作408に記載された条件を満たすCSB(例えば、下限周波数、上限周波数、中心周波数、及び帯域幅を含むCSB(またはバーク尺度#)に対応する音声出力)に適用する。動作416では、コントローラ302は、第3のゲインG3をBDBグループ内の単一のCSBに適用する。第2のゲインG2は、減衰ゲイン(低減ゲイン)または音声出力を増加させるゲインに対応し得ることが認識されている。第2のゲインG2は、減衰ゲイン(低減ゲイン)または音声出力を増加させるゲイン(または、BDBグループ内の単一のCSBの減衰ゲイン(低減ゲイン)もしくは音声出力を増加させるゲイン)に対応し得ることが認識される。したがって、BDBグループ内の単一のCSBに第2のゲインG2を適用した最終結果は、係るゲインでCSBによって指定された中心周波数で音声を出力する対応する音響心理学的ラウドスピーカー152a~152b、154a~154b、または156aを駆動するための駆動信号の生成をもたらす。さらに、第2のゲインG2は、実数及び/または複素数に対応し得ることが認識される。
【0034】
動作420では、コントローラ302は、特定のBDBの全てのCSB(すなわち、バーク尺度)が、デルタ(Δ)に関する分析、閾値T1、T2、及びT3の比較、ならびに第1のゲインG1、第2のゲインG2、及び第3のゲインG3の適用に関して検証されたかどうかを決定する。特定のBDBの全てのCSBが検証された場合、方法400は動作422に進む。そうでない場合、方法400は、動作404に戻り、検証する必要のある次のCSBにループする。
【0035】
動作422では、コントローラ302は、全てのBDBが検証されたかどうかを決定する。全てのBDBが検証された場合、方法400は停止する。全てのBDBが検証されていない場合、方法400は動作402に戻り、次のBDBを検証する。
【0036】
図9は、一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供する例示的なシステム500を示す。
図9に関連して示されるシステム500は、
図6に関連して示されるシステム300とほぼ同じである。しかしながら、システム500は、音声入力信号が単一入力音声信号の信号であることを示す。この場合、混合マトリックスブロック306は、単一のモノラル入力チャネルを、ラウドスピーカーの数に対応するN個の出力チャネルにアップミキシングする。N番目の出力チャネルは、単一入力チャネルのスケーリングされたバージョンとして与えられ、例えば、Channel1=A1*InputR(ここで、A1は増倍率に対応し、さらに、A2~A7も増倍率に適用される)。
図9に示される混合マトリックスブロック306では、システム500がモノラル入力音声信号だけを受信したと仮定して、左チャンネル用の振幅がゼロにされることを示す。クロスオーバーネットワークブロック308では、例えば、25のバーク尺度(
図5で参照される)がモノラル入力音声信号に適用されることが示される。上述したように、25のバーク尺度(またはCSB)の1つ以上がBDBにグループ化される。
【0037】
図10は、一実施形態による、少なくとも1つの音響心理学的方向決定帯域及び狭帯域ラウドスピーカーに基づいて、3次元没入型サウンドを提供する例示的なシステム600を示す。
図10に関連して示されるシステム600は、
図6に関連して示されるシステム300とほぼ同様である。システム600は、また、音声入力信号がステレオ入力音声信号の信号であることも示す。この場合、
図9に示される混合マトリックスブロック306は、システム600がステレオ入力音声信号を受信したと仮定して、左右のチャネルの振幅を示す。混合マトリックスブロック306は、デュアルステレオ入力チャンネルをラウドスピーカーの数に対応するN個の出力チャンネルにアップミキシングする。N番目の出力チャンネルは、ステレオ入力チャンネルのスケーリングされたバージョンとして与えられ、例えば、Channel1=A1*InputR+B1*InputL、Channel2=A2*InputR+B2*InputLであり、同様に、A1~A7及びB1~B7は増倍率に対応する。クロスオーバーネットワークブロック308では、例えば、25のバーク尺度(
図5で参照される)がモノラル入力音声信号に適用されることが示される。上述したように、25のバーク尺度(またはCSB)の1つ以上がBDBにグループ化される。
【0038】
例示的な実施形態が上述されるが、これらの実施形態は本発明の全ての可能な形式を説明することが意図されない。むしろ、明細書で使用される単語は限定ではなく説明のための単語であり、本発明の主旨及び範囲から逸脱することなく様々な変更がなされ得ることが理解される。さらに、様々な実施形態を実装する特徴を組み合わせて、本発明のさらなる実施形態を形成し得る。