(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024105545
(43)【公開日】2024-08-06
(54)【発明の名称】Mチャネル入力のS個のスピーカーでのレンダリング(S<M)
(51)【国際特許分類】
H04S 3/02 20060101AFI20240730BHJP
【FI】
H04S3/02
【審査請求】有
【請求項の数】19
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024079078
(22)【出願日】2024-05-15
(62)【分割の表示】P 2021574291の分割
【原出願日】2020-06-17
(31)【優先権主張番号】PCT/CN2019/092021
(32)【優先日】2019-06-20
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】62/875,160
(32)【優先日】2019-07-17
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ヤーン,ズーユイ
(72)【発明者】
【氏名】シュワーン,ジーウエイ
(72)【発明者】
【氏名】リウ,ヤーン
(72)【発明者】
【氏名】リウ,ジーファーン
(57)【要約】 (修正有)
【課題】Mチャネル入力のS個のスピーカーでのレンダリング(S<M)を提供する。
【解決手段】M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーは、入力オーディオ信号に一次レンダリング行列を適用して、複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと、入力オーディオ信号に二次レンダリング行列を適用して、複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと、時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと、混合利得に基づいて第1、第2のプリレンダリングされた信号を混合し、レンダリングされた出力信号を生成するように構成された混合モジュールと、を有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
M個のチャネルを有するマルチチャネルのオーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーであって、S<Mであり、当該オーディオ・レンダラーは:
前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと;
前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと;
時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと;
前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有しており、
前記チャネル解析モジュールは、前記入力チャネルの間のエネルギー分布および/または前記入力チャネルの間の拡散性分布に基づいて前記混合利得を決定する、
オーディオ・レンダラー。
【請求項2】
前記二次レンダリング行列は、前記入力オーディオ信号におけるチャネルの少なくとも1つを無視するように構成される、請求項1に記載のオーディオ・レンダラー。
【請求項3】
前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、請求項2に記載のオーディオ・レンダラー。
【請求項4】
前記入力オーディオ信号は、8つのチャネルを有する5.1.2オーディオ信号であり(M=8)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数16】
に設定される、請求項1ないし3のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項5】
前記入力オーディオ信号は、8つのチャネルを有する5.1.2オーディオ信号であり(M=8)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数17】
に設定される、請求項1ないし3のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項6】
前記入力オーディオ信号は、8つのチャネルを有する5.1.2オーディオ信号であり(M=8)、独立したスピーカーの数は4であり(S=4)、前記二次レンダリング行列は、
【数18】
に設定される、請求項1ないし5のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項7】
先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する平滑化モジュールをさらに有する、請求項1ないし6のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項8】
前記一次レンダリング行列および前記二次レンダリング行列のエントリーは、実定数または周波数依存の複素ベクトルである、請求項1ないし7のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項9】
前記一次レンダリング行列の少なくともいくつかのエントリーは複数の周波数帯域において細分される、請求項1ないし8のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項10】
前記細分された複数の周波数帯域は7kHzから9kHzの範囲である、請求項9に記載のオーディオ・レンダラー。
【請求項11】
前記一次レンダリング行列および前記二次レンダリング行列の少なくともいくつかのエントリーは等しい、請求項1ないし10のうちいずれか一項に記載のオーディオ・レンダラー。
【請求項12】
M個のチャネルを有するマルチチャネルのオーディオ信号を、S個の独立したスピーカーを有するポータブル装置のためにレンダリングする方法であって、S<Mであり、当該方法は:
前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する段階と;
前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する段階と;
時間変化するチャネル分布に従って混合利得を計算する段階と;
前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合して、レンダリングされた出力信号を生成する段階とを含み、
前記混合利得は、前記入力チャネルの間のエネルギー分布、前記入力チャネルの間の拡散性分布、または両方に基づいて計算される、
方法。
【請求項13】
前記二次レンダリング行列は、前記入力チャネルのうちの少なくとも1つを無視するように構成される、請求項12に記載の方法。
【請求項14】
前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記2つの高さチャネルを無視するように構成される、請求項13に記載の方法。
【請求項15】
前記入力オーディオ信号は、8つのチャネルを有する5.1.2オーディオ信号であり(M=8)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数19】
に設定される、請求項12ないし14のうちいずれか一項に記載の方法。
【請求項16】
前記入力オーディオ信号は、8つのチャネルを有する5.1.2オーディオ信号であり(M=8)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数20】
に設定される、請求項12ないし14のうちいずれか一項に記載の方法。
【請求項17】
前記入力オーディオ信号は、8つのチャネルを有する5.1.2オーディオ信号であり(M=8)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数21】
に設定される、請求項12ないし14のうちいずれか一項に記載の方法。
【請求項18】
先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する段階をさらに有する、請求項12ないし14のうちいずれか一項に記載の方法。
【請求項19】
プロセッサ上で実行されたときに請求項12ないし18のうちいずれか一項に記載の段階を実行するように構成されたコンピュータ・プログラム・コード部分を含む、非一時的なコンピュータ読み取り可能な媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、2019年6月20日に出願されたPCT出願第PCT/CN2019/092021号、および2019年7月17日に出願された米国仮出願第62/875,160号(それぞれ参照によりその全体が本明細書に組み込まれる)に対する優先権を主張する。
【0002】
技術分野
本発明は、SがMより小さい場合に、Sスピーカー上でのMチャネル入力のレンダリングに関する。
【背景技術】
【0003】
携帯電話やタブレット端末などのポータブル装置は、ますます普及してきており、現在では非常に一般的になっている。そうした機器は、YouTube(登録商標)または同様な源などからの映画や音楽を含むメディア再生のためによく使用される。没入的な聴取体験を実現するために、ポータブル装置は、しばしば、複数の独立したスピーカーを備える。たとえば、タブレットは、2つの上層(top-layer)スピーカーと2つの下層(bottom-layer)スピーカーを備えることができる。さらに、これらの装置は、通例、再生制御のために装置を柔軟にするために、それらのスピーカーのための複数の独立した電力増幅器(PA)を備えている。
【0004】
同時に、マルチチャネル・オーディオコンテンツ、すなわち、2つより多いチャネルをもつコンテンツ、たとえば、5.1、5.1.2がより一般的になってきている。マルチチャネル・オーディオは、オリジナルとして制作されることができ、あるいは他のフォーマット、たとえば、オブジェクトベースのオーディオから、またはさまざまなアップミックス方法によって、変換されることができる。
【0005】
マルチチャネル・オーディオを、チャネル数より少ないスピーカーを有するポータブル装置にレンダリングすることに向けた異なるアプローチがある。5.1.2オーディオ信号(8チャネル)を4スピーカーのタブレットにレンダリングすることに向けた1つの手法は、入力信号の高さチャネルを2つの上層スピーカーにレンダリングすることである。上層スピーカーおよび下層スピーカーに関して再生サウンドをバランスさせるために、直接チャネル(すなわち、非高さチャネル)は、2つの下層スピーカーにレンダリングされる。そのようなレンダリング手法の一例は、特許文献1によって提供されている。
【0006】
しかしながら、従来技術のレンダリング手法は、入力オーディオチャネルの時間変化する挙動を考慮していない。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明の目的は、入力オーディオに基づいた、よりダイナミックなレンダリング手法を提供することである。
【課題を解決するための手段】
【0009】
本発明の第1の側面によれば、このおよび他の目的は、M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーによって達成される。ここで、S<Mであり、当該オーディオ・レンダラーは、入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと、入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと、時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと、前記混合利得に基づいて第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有する。
【0010】
本発明の第2の側面によれば、このおよび他の目的は、M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングする方法によって達成される。ここで、S<Mであり、当該方法は、入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する段階と、入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する段階と、時間変化するチャネル分布に従って混合利得を計算する段階と、前記混合利得に基づいて第1および第2のプリレンダリングされた信号を混合して、レンダリングされた出力信号を生成する段階とを含む。
【0011】
本発明は、マルチチャネル・オーディオ入力がさまざまな数のアクティブ・チャネルを有することができるという認識に基づいている。いくつかの(少なくとも2つの)異なるレンダリング行列を提供し、入力信号の解析に基づいてレンダリング行列の適切な混合を選択することによって、利用可能なスピーカー上での、より効率的なレンダリングが達成できる。
【0012】
極端な場合には、レンダリングされた出力は、プリレンダリングされた信号の1つに対応し、他の場合には、両方の混合である。
【0013】
二次レンダリング行列は、入力オーディオフォーマットにおける前記チャネルの少なくとも1つを無視するように構成されることができる。これは、入力信号の一つまたは複数のチャネルが比較的弱く、よって、レンダリングされた出力にもはや著しく寄与しない場合に適切でありうる。諸時間期間の間、弱いことがありうるチャネルの一例は、高さチャネル、すなわち、聴取者の上方に位置する、または少なくとも他の(直接)スピーカーよりも高くに位置する(高さ)スピーカー上での再生のために意図されたチャネルである。
【0014】
ある特定の例は、5.1.2オーディオ、すなわち、左、右、中央、左後、右後、LFE、および左/右高さチャネルを有するオーディオに関する。いくつかの期間の間、たとえば、高さチャネルは比較的弱いことがあり、その場合、5.1.2信号は5.1信号、すなわち8チャネルではなく6チャネルに縮退する。その状況では、もとのレンダリング行列(5.1.2に適応されている)が、上レベルと下レベルのスピーカーの間の不均衡なラウドネスにつながる可能性がある。本発明によれば、レンダリングは、現在アクティブなチャネルに焦点を合わせるように動的に調節されてもよい。したがって、与えられた例では、入力オーディオは、5.1.2に適応されたレンダリング行列ではなく、5.1に適応されたレンダリング行列を使用してレンダリングできる。以下の詳細な説明は、レンダリング行列のより詳細な例を提供する。
【図面の簡単な説明】
【0015】
本発明は、本発明の現在好ましい実施形態を示す添付図面を参照して、より詳細に説明される。
【
図1】本発明のある実施形態によるオーディオ・レンダラーのブロック図である。
【
図2】本発明のある実施形態のフローチャートである。
【
図3】a~bは、上/下発射(a)および左/右発射(b)に対応する、ポータブル装置の横置き配向の4スピーカー・レイアウトの2つの例を示す。
【発明を実施するための形態】
【0016】
現在好ましい実施形態の詳細な説明
以下に開示されるシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせとして実装されうる。ハードウェア実装では、タスクの分割は必ずしも物理的ユニットへの分割に対応しない;逆に、一つの物理的コンポーネントが複数の機能を有することがあり、一つのタスクが協働する複数の物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、またはハードウェアとして、または特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含みうるコンピュータ読み取り可能な媒体上で配布されてもよい。当業者には周知のように、用語「コンピュータ記憶媒体」は、コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、または他のデータのような情報の記憶のための任意の方法または技術で実装される揮発性および不揮発性の、取り外し可能型および非取り外し可能型の媒体の両方を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ、または他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)、または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶、または他の磁気記憶装置、または所望の情報を記憶するために使用することができ、コンピュータによってアクセスされることができる他の任意の媒体を含むが、これらに限定されない。さらに、通信媒体は、典型的には、変調されたデータ信号、たとえば搬送波または他のトランスポート機構においてコンピュータ読み取り可能な命令、データ構造、プログラムモジュールまたは他のデータを具現し、任意の情報送達媒体を含むことが当業者には周知である。
【0017】
ここで、本発明のある実施形態について、
図1のブロック図および
図2のフローチャートを参照して論じる。
【0018】
本方法はリアルタイムで実行される。最初に、ステップS1でマルチチャネル入力オーディオが受領され(たとえばデコードされ)、ステップS2で受領されたチャネルの数Mおよび利用可能なスピーカーの数Sに基づいてレンダリング行列の集合が生成される。各レンダリング行列は、M個の受領された信号をS個のスピーカー・フィードにレンダリングするように構成される。ここで、S<Mである。図示される例では、集合は、一次(デフォルト)行列と二次(代替)行列を含むが、一つまたは複数の追加的な代替行列が可能である。ステップS3では、各行列は、行列適用モジュール11、12によって入力信号に適用され、さらなる混合のためにあらかじめレンダリングされた信号を生成する。並列なステップS4では、入力オーディオはチャネル解析モジュール13によって解析される。ステップS5では、たとえばチャネル間のエネルギー分布に基づいて、解析モジュール13によって利得が計算される。この利得は、ステップS6において平滑化モジュール14によってさらに平滑化され、次いで混合モジュール15に入力され、混合モジュール15は、行列適用モジュール11、12からの出力も受け取る。ステップS7では、混合モジュール15は、平滑化された利得に基づいて、事前にレンダリングされた信号を混合(加重)し、レンダリングされたオーディオ信号を出力する。レンダリング処理の詳細については、以下で説明する。
【0019】
レンダリング行列
Mチャネルの入力信号とSスピーカー装置が与えられた場合、一般的なレンダリング処理は次の式で表される:
y=Rx (1)
ここで、xは入力信号を表すM次元ベクトルであり、yはレンダリングされた信号を表すS次元ベクトルであり、RはS×Mレンダリング行列である。レンダリング行列Rについては、行はスピーカーに対応し、列は入力信号のチャネルに対応する。レンダリング行列のエントリーは、チャネルからスピーカーへのマッピングを示す。
【0020】
S個の独立したスピーカー(S>2)を備えたポータブル装置が与えられると、一次レンダリング行列R
primと二次レンダリング行列R
secは、入力チャネル数Mに応じて決定される。R
primとR
secは、両方とも同じサイズのS×Mをもつ。具体的には、行列R
primおよびR
secは次のように書くことができる。
【数1】
ここで、R
primは、入力Mチャネル・オーディオをレンダリングするための最適行列であり、一方、R
secは、縮退信号のための最適行列である。縮退信号とは、すなわち、D個だけの有意なチャネル(D<M)と、取るに足りない寄与を有し、無視されてもよい一つまたは複数のチャネルとを含むMチャネル・オーディオ信号である。よって、レンダリング行列R
secもS×M行列であるが、一つまたは複数のゼロ列をもつ(ゼロ列はMチャネルのうちの1つからのゼロ寄与を与える)。2つのレンダリング行列R
primおよびR
secが入力信号xに適用されると、2つのプリレンダリングされた信号y
primおよびy
secが生成される:
【数2】
【0021】
一般に、マルチチャネル・オーディオは、通例、4つのカテゴリーのチャネルを含む:
1)前方チャネル、すなわち左、右、中央チャネル(L、R、C)
2)聴取者平面のサラウンドチャネル、たとえば5.1/5.1.2/5.1.4などの左/右サラウンド(Ls/Rs)または7.1/7.1.2/7.1.4などの左/右サラウンド(Lrs/Rrs)
3)高さチャネル、たとえば、5.1.2/7.1.2/9.1.2などの左/右上(Lt/Rt)、5.1.4/7.1.4/9.1.4などの左/右上前/後(Ltf/Rtf、Ltr/Rtr)
4)LFEチャネル。
【0022】
目標スピーカー・レイアウトが与えられた場合、式(2)で定義された一次行列はブロック行列として書き直すことができる:
【数3】
ここで、F、R、Hはそれぞれ前方、サラウンド、高さチャネルの数であり、l
iはLFEの係数に対応する。
【0023】
二次行列Rsecは、一つまたは複数のゼロ列を用いてRprimから導出できる。
【0024】
本発明の実施形態によるレンダリング行列の、いくつかの、より具体的な例を以下に説明する。
【0025】
図3のaおよびbは、ポータブル装置、ここでは横置き配向のタブレットの2つの例を示しており、この装置は複数の独立に制御されるスピーカーを備えている。どちらの例でも、装置は4つのスピーカーa~dをもつ(S=4)。
図1のaでは、スピーカーは、装置の上側および下側(upper and lower sides)に配置され、よって、音を上方に(upwards)発する2つのスピーカーa、bと、音を下方に(downwards)発する2つのスピーカーc、dを含む。
図1のbでは、スピーカーは、装置の左側および右側に配置され、よって、音を側方に発する2つの上(upper)スピーカーa、bおよび音を側方に発する2つの下(lower)スピーカーc、dを含む。
【0026】
本例では、5.1.2チャネル・オーディオ信号(M=8)が、
図3のaまたはbのポータブル装置で再生される。
【0027】
この場合、一次行列R
primは次式によって定義できる。
【数4】
ここで、行インデックス1~4はスピーカーa~dに対応し、列インデックス1~8は5.1.2フォーマットのL、R、C、Ls、Rs、LFE、Lt、Rtチャネルに対応する。
【0028】
もとの5.1.2信号の高さチャネルがほぼ無音である期間中は、オーディオ信号は5.1信号に、無視されうる2チャネルを加えたものに縮退する。よって、二次レンダリング行列R
sec1は、次式によって定義できる。
【数5】
ここで、最後の2つの列は、2つの無音の高さチャネルLtとRtに対応するゼロである。
【0029】
所与の装置および入力信号について複数の二次レンダリング行列R
secxが存在しうることに留意されたい。5.1.2オーディオを4つのスピーカーにレンダリングする上記の例では高さチャネルに加えてサラウンドチャネルLs、Rsもほぼ無音である場合、信号はC、L、R、LFEチャネルのみを含む3.1信号と、無視されうるチャネルの集合に縮退する。その場合、対応する二次行列R
sec2は次のようになる。
【数6】
【0030】
実際上は、複数の二次行列が存在する場合、適正な二次行列は、以下に記載されるチャネル解析に基づいて動的に選択される。
【0031】
入力信号の効率的なレンダリングを保証することに加えて、すべての入力チャネル(たとえば、高さチャネル)がレンダリング後に明確に区別されることを保証するという課題もある。これは、ポータブル装置内のスピーカー位置間の距離が小さいためである。高さチャネルの例をとると、それらは非高さチャネルのためのスピーカーに比較的近いスピーカーにレンダリングされる可能性が高くなる。これは、高さの音像に関して空間的なつぶれにつながる。
【0032】
空間的なつぶれを緩和し、レンダリング後に高さチャネルを区別可能にするためには、レンダリング行列Rprimの適正なエントリーを生成することが決定的に重要である。具体的には、高さチャネルの大半を上スピーカー(top speakers)にレンダリングし、一方、前方チャネルを下スピーカー(bottom speakers)にレンダリングすることが望ましい。これにより、高さチャネルが前方チャネルに「沈み込む」ことが緩和される。
【0033】
上記の例については、R
primのエントリーは次のように設定できる。
【数7】
【0034】
あるいはまた、R
primのエントリーは次のように設定できる。
【数8】
【0035】
上記の両方の例において、列は(左から右へ)、それぞれ、チャネルL、R、C、LFE、Ls、Rs、LtおよびRtに対応する。
【0036】
2つの高さチャネルLtおよびRt(列7および8)を無視するように構成された第1の二次行列R
sec1のエントリーは、次のように設定できる。
【数9】
【0037】
2つの高さチャネルLtおよびRt(列7および8)および2つのサラウンドチャネルLsおよびRs(列5および6)を無視するように構成された第2の二次行列のエントリーは、次のように設定できる。
【数10】
【0038】
別の例では、7.1.2チャネル(M=10)入力信号が、
図3aまたは
図3b(S=4)の装置によって再生される。この場合、R
primのエントリーは次のように設定できる。
【数11】
この場合、列は(左から右へ)、それぞれチャネルL、R、C、LFE、Ls、Rs、Lrs、Rrs、Lt、およびRtに対応する。
【0039】
二次行列R
sec1およびR
sec2のエントリーは次のように設定できる。
【数12】
ここで、R
primおよびR
secxは、縮退した7.1および3.1信号にそれぞれ対応する。
【0040】
レンダリング行列RprimおよびRsecxのエントリーは、実定数または周波数依存複素ベクトルでありうることに注意されたい。たとえば、式(2)におけるRprimのエントリーは、B次元の複素ベクトルに拡張することができる。ここで、Bは周波数帯域の数である。前述の使用事例では、高さチャネルを向上させるために、式(2)におけるRprimの最後の2つの列のエントリーについて特定の諸周波数帯域が修正されることができる。特定の周波数帯域の例は、7kHz~9kHzでありうる。
【0041】
また、上記の例によって例示されるように、RprimおよびRsecx行列のエントリーの少なくともいくつかは同じに設定できることに留意されたい。
【0042】
チャネル解析
チャネル解析モジュール23は、入力信号が縮退しているか否かを決定することを目的とし、それにより、適正なプリレンダリングされた信号またはそれらの適切な混合信号が使用できる。モジュール23は、フレームごとに実行される。
【0043】
1つの手法は、入力チャネル間のエネルギー分布に基づく。
【0044】
2つの異なるレンダリング行列のみをもつ前述の使用事例が、例として取り上げられる。4スピーカーのポータブル装置および5.1.2入力信号については、利得g
rawは次式によって計算される。
【数13】
ここで、r
heightは高さチャネルのエネルギーと全エネルギーの比であり、mは冪パラメータであり、T
uおよびT
lはそれぞれ上限および下限である。
【0045】
エネルギーに加えて、拡散性(diffuseness)が、入力チャネルを解析するための代替的または追加的な基準となりうる。拡散性が大きいと、上下のスピーカーの間で、L/Rチャネルについて不均衡な係数が割り当てられる傾向がある。
【0046】
適応的な平滑化および混合
利得g
rawは、入力信号の履歴に従って平滑化モジュール14によってさらに平滑化されることができる。現在のフレームn(n>1)では、平滑化された利得は下のように計算できる。
【数14】
ここで、αは平滑化パラメータである。
【0047】
最終的なレンダリング信号yは、下のような混合プロセスによって得られる。
【数15】
【0048】
2つより多くの異なるレンダリング行列がある場合、レンダリングされた出力は、チャネル解析に依存して、3つ以上のプリレンダリングされた信号の混合を含むことになる。
【0049】
結語
本明細書中で使用されるところでは、別段の規定がない限り、共通の対象を記述するための順序形容詞「第1の」、「第2の」、「第3の」などの使用は、単に、類似の対象の異なるインスタンスが言及されていることを示し、そのように記載された対象が、時間的に、空間的に、ランク付けにおいて、または任意の他の仕方で、所与のシーケンスになければならないことを意味することを意図するものではない。
【0050】
特許請求の範囲および本明細書中の説明において、有する、から構成される、含む、という用語はどれも、少なくとも後続の要素/特徴を含むが他の要素を除外しないことを意味するオープンな用語である。よって、特許請求の範囲において使用される場合、有する/含むという用語は、その後に列挙される手段、要素、またはステップに限定されるものとして解釈されるべきではない。たとえば、AおよびBを含む装置という表現の範囲は、要素AおよびBのみからなる装置に限定されるべきではない。本明細書で使用されるところの、含む、含んでいる、包含するという用語も、どれも、少なくとも後続の要素/特徴を含むが他の要素を除外しないことを意味するオープンな用語である。よって、特許請求の範囲において使用される場合、有する/含むという用語は、その後に列挙される手段、要素、またはステップに限定されるものとして解釈されるべきではない。たとえば、AおよびBを含む装置という表現の範囲は、要素AおよびBのみからなる装置に限定されるべきではない。よって、含むは、有すると同義であり、有するを意味する。
【0051】
本明細書で使用されるところでは、用語「例示的」は、特質を示すのではなく、例を提供するという意味で使用される。すなわち、「例示的実施形態」は、必ず例示的特質の実施形態ではなく、例として提供される実施形態である。
【0052】
本発明の例示的な実施形態の上述の説明では、本発明のさまざまな特徴が、開示の流れをよくし、さまざまな発明的側面の一つまたは複数の理解を助ける目的で、単一の実施形態、図面、またはその説明において一緒にまとめられることがあることが理解されるべきである。しかしながら、この開示方法は、特許請求される発明が各請求項において明示的に記載されているよりも多くの特徴を必要とするという意図を反映するものと解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明的な側面は、単一の上述の実施形態のすべての特徴よりも少ないものに存する。よって、詳細な説明に続く特許請求の範囲は、ここに明示的にこの詳細な説明に組み込まれ、各請求項が本発明の別個の実施形態として自立する。
【0053】
さらに、本明細書に記載されるいくつかの実施形態は、他の実施形態に含まれるいくつかの特徴を含むが他の特徴は含まないものの、当業者には理解されるように、異なる実施形態の特徴の組み合わせは、本発明の範囲内であり、異なる実施形態を形成することが意図されている。たとえば、以下の請求項では、請求項に記載された実施形態の任意のものが、任意の組み合わせで使用できる。
【0054】
さらに、実施形態のいくつかは、コンピュータ・システムのプロセッサによって、または機能を実行する他の手段によって実現できる方法または方法の要素の組み合わせとして本明細書に記載されている。よって、そのような方法または方法の要素を実行するための必要な命令を有するプロセッサが、該方法または方法の要素を実行するための手段をなす。さらに、装置実施形態の本明細書に記載されている要素は、本発明を実施する目的のために該要素によって実行される機能を実行するための手段の例である。
【0055】
本明細書において提供される説明において、多数の特定の詳細が記載されている。しかしながら、本発明の実施形態は、こうした特定の詳細なしで実施されうることが理解される。他方では、周知の方法、構造および技法は、本稿の理解を不明瞭にしないため、詳細には示されていない。
【0056】
同様に、結合されるという用語は、請求項において使用される場合、直接接続のみに限定されるものとして解釈されるべきではないことに留意されたい。「結合された」および「接続された」という用語ならびにそれらの派生形が使用されうる。これらの用語は、互いに同義語として意図されるものではないことを理解しておくべきである。よって、装置Bに結合された装置Aという表現の範囲は、装置Aの出力が装置Bの入力に直接接続される装置またはシステムに限定されるべきではなく、装置Aの出力とBの入力との間に経路が存在し、該経路は他の装置または手段を含む経路であってもよいことを意味する。「結合された」は、2つ以上の要素が、直接的な物理的または電気的接触にあるか、または2つ以上の要素が、互いに直接的に接触していないが、それでも互いと協働または相互作用することを意味しうる。
【0057】
よって、本発明の特定の実施形態が記載されているが、当業者は、本発明の精神から逸脱することなく、他のさらなる修正がそれに加えられてもよく、あらゆるそのような変更および修正を本発明の範囲内にはいるものとして請求することが意図されていることを理解するであろう。たとえば、上述の式は、単に使用されうる手順を表す。ブロック図から機能が追加または削除されてもよく、機能ブロック間で動作が交換されてもよい。本発明の範囲内に記載される方法にステップが追加または削除されてもよい。
【0058】
このように、本発明の特定の実施形態が記載されているが、当業者は、本発明の精神から逸脱することなく、他のさらなるなる修正がそれに加えられてもよく、あらゆるそのような変更および修正を本発明の範囲内にはいるものとして請求することが意図されていることを理解するであろう。たとえば、上述の式は、単に使用されうる手順を表す。ブロック図から機能が追加または削除されてもよく、機能ブロック間で動作が交換されてもよい。本発明の範囲内に記載される方法にステップが追加または削除されてもよい。
たとえば、図示した実施形態では、ポータブル装置は、4つのスピーカー(S=4)を有する。もちろん、4つより多くの(または少ない)スピーカーをもつことが可能であり、その結果、異なる行列サイズが生じる。
【0059】
いくつかの態様を記載しておく。
〔態様1〕
M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーであって、S<Mであり、当該オーディオ・レンダラーは:
前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと;
前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと;
時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと;
前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有する、
オーディオ・レンダラー。
〔態様2〕
前記二次レンダリング行列は、前記入力オーディオ信号における前記チャネルの少なくとも1つを無視するように構成される、態様1に記載のオーディオ・レンダラー。
〔態様3〕
前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、態様2に記載のオーディオ・レンダラー。
〔態様4〕
前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数16】
に設定される、態様1ないし3のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様5〕
前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数17】
に設定される、態様1ないし3のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様6〕
前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記二次レンダリング行列は、
【数18】
に設定される、態様1ないし5のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様7〕
先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する平滑化モジュールをさらに有する、態様1ないし6のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様8〕
前記一次レンダリング行列および前記二次レンダリング行列のエントリーは、実定数または周波数依存の複素ベクトルである、態様1ないし7のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様9〕
前記一次レンダリング行列の少なくともいくつかのエントリーは、特定の諸周波数帯域、たとえば7kHz~9kHzにおいて細分される、態様1ないし8のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様10〕
前記一次レンダリング行列および前記二次レンダリング行列の少なくともいくつかのエントリーは等しい、態様1ないし9のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様11〕
前記チャネル解析モジュールは、前記入力チャネルの間でのエネルギー分布に基づいて前記混合利得を決定する、態様1ないし10のうちいずれか一項に記載のオーディオ・レンダラー。
〔態様12〕
M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングする方法であって、S<Mであり、当該方法は:
前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する段階と;
前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する段階と;
時間変化するチャネル分布に従って混合利得を計算する段階と;
前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合して、レンダリングされた出力信号を生成する段階とを含む、
方法。
〔態様13〕
前記二次レンダリング行列は、前記入力オーディオ信号における前記チャネルの少なくとも1つを無視するように構成される、態様12に記載の方法。
〔態様14〕
前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、態様13に記載の方法。
〔態様15〕
前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数19】
に設定される、態様12ないし14のうちいずれか一項に記載の方法。
〔態様16〕
前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数20】
に設定される、態様12ないし14のうちいずれか一項に記載の方法。
〔態様17〕
前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
【数21】
に設定される、態様12ないし14のうちいずれか一項に記載の方法。
〔態様18〕
先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する段階をさらに有する、態様12ないし17のうちいずれか一項に記載の方法。
〔態様19〕
プロセッサ上で実行されたときに態様12ないし18のうちいずれか一項に記載の段階を実行するように構成されたコンピュータ・プログラム・コード部分を含む、コンピュータ・プログラム・プロダクト。
〔態様20〕
非一時的なコンピュータ読み取り可能な媒体に記憶された、態様19に記載のコンピュータ・プログラム・プロダクト。
【外国語明細書】