IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特表2024-538368音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法
<>
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図1
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図2
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図3
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図4
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図5
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図6
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図7
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図8
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図9
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図10
  • 特表-音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-18
(54)【発明の名称】音処理装置、デコーダ、エンコーダ、ビットストリームおよび対応する方法
(51)【国際特許分類】
   H04S 7/00 20060101AFI20241010BHJP
   G10L 19/00 20130101ALI20241010BHJP
【FI】
H04S7/00 300
H04S7/00 350
H04S7/00 360
G10L19/00 330B
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024527191
(86)(22)【出願日】2022-11-08
(85)【翻訳文提出日】2024-07-04
(86)【国際出願番号】 EP2022081065
(87)【国際公開番号】W WO2023083780
(87)【国際公開日】2023-05-19
(31)【優先権主張番号】21207255.7
(32)【優先日】2021-11-09
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】500341779
【氏名又は名称】フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100085660
【弁理士】
【氏名又は名称】鈴木 均
(74)【代理人】
【識別番号】100149892
【弁理士】
【氏名又は名称】小川 弥生
(74)【代理人】
【識別番号】100185672
【弁理士】
【氏名又は名称】池田 雅人
(72)【発明者】
【氏名】ヘレ,ユルゲン
(72)【発明者】
【氏名】ジールツレ,アンドレアス
(72)【発明者】
【氏名】ペータース,ニルス
(72)【発明者】
【氏名】ガイアー,マティアス
(72)【発明者】
【氏名】ボース,クリスティアン
(72)【発明者】
【氏名】ローゼンベルガー,デニス
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA05
5D162CC36
5D162CD07
5D162CD23
5D162DA23
5D162EG02
5D162EG07
5D162EG08
(57)【要約】
音処理装置は、複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合するためのパンナーを備える。音処理装置は、空間信号を受信し、フィルタリングされた空間信号のセットを取得するために空間信号を分散フィルタリングするための分散フィルタ段を備える。音処理装置は、フィルタリングされた空間信号に基づいていくつかの出力信号を提供するためのインターフェースを備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の入力信号(14)を空間的に位置決めし、前記入力信号(14)を少なくとも2つの空間信号(16)へと結合するためのパンナー(12;12、12、12)と、
前記空間信号(16)を受信し、フィルタリングされた空間信号(22)のセットを取得するために前記空間信号(16)を分散フィルタリングするための分散フィルタ段(18)と、
前記フィルタリングされた空間信号(22)に基づいていくつかの出力信号(24)を提供するためのインターフェース(23)と
を備える音処理装置。
【請求項2】
前記入力信号(14)は、初期反射信号および/または回折音信号を含む、請求項1に記載の音処理装置。
【請求項3】
前記分散フィルタ段(18)に含まれるいくつかの分散フィルタ(38)は、前記いくつかの出力信号(24)に対応する、請求項1または2に記載の音処理装置。
【請求項4】
前記分散フィルタ段(18)は、オールパスフィルタである少なくとも1つの分散フィルタを備える、請求項1~3のいずれか1項に記載の音処理装置。
【請求項5】
前記分散フィルタ段(18)は、有限インパルス応答(FIR)フィルタまたは無限インパルス応答(IIR)フィルタである少なくとも1つの分散フィルタを備える、請求項1~4のいずれか1項に記載の音処理装置。
【請求項6】
前記分散フィルタ段(18)の少なくとも1つの分散フィルタは、時変フィルタ特性を備える、請求項1~5のいずれか1項に記載の音処理装置。
【請求項7】
前記複数の入力信号(14)を提供するためのレンダラを備える、請求項1~6のいずれか1項に記載の音処理装置。
【請求項8】
前記音処理装置は、直接音成分(42)および反響音成分(46)を提供するように構成される、請求項7に記載の音処理装置。
【請求項9】
前記分散フィルタ段(18)は、前記空間信号(16)のセットをフィルタリングするように構成され、前記音処理装置は、前記分散フィルタ段(18)から前記直接音成分(42)および前記反響音成分(46)を排除するように構成される、請求項8に記載の音処理装置。
【請求項10】
前記分散フィルタ段(18)の少なくとも1つの分散フィルタ(38)を、例えば初期化段階中に、生成するように構成された分散フィルタジェネレータ(56)を備える、請求項1~9のいずれか1項に記載の音処理装置。
【請求項11】
前記分散フィルタジェネレータ(56)は、
前記分散フィルタによって提供される時間的な広がりの量を決定する長さ、
例えば高レベル制御によって、チャネル間相互相関の程度を変化させるための空間的な広がり、および/または
利得
に基づいて前記少なくとも1つの分散フィルタ(38)を生成するように構成される、請求項10に記載の音処理装置。
【請求項12】
前記分散フィルタジェネレータ(56)は、第1の空間信号(16)に対する第1の分散フィルタ(38)として前記分散フィルタ(38)を生成するように構成され、前記音処理装置は、許容範囲内で同じエネルギーの、互いに異なる相関の程度を有する、記憶されたノイズ信号のセットを記憶したメモリを備え、
前記音処理装置は、ノイズ系列の基礎として前記記憶されたノイズ信号から選択するように構成される、請求項10または11に記載の音処理装置。
【請求項13】
前記ノイズ信号が同一のまたは弱く脱相関した系列であるという特性と、
前記系列の長さを示す、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと、
脱相関または空間的な広がりの強さを示す、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと、
小さい前面開口を有する音源の両耳間相互相関(IACC)に関連する、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと
のうちの少なくとも1つに基づいて前記ノイズ信号を取得するように構成される、請求項12に記載の音処理装置。
【請求項14】
前記分散フィルタジェネレータ(56)は、前記第1の分散フィルタ(38)と、例えば両耳間相互相関(IACC)に基づいて取得される、周波数依存フィルタ脱相関を有する第2の分散フィルタ(38)とを生成するように構成される、請求項12または13に記載の音処理装置。
【請求項15】
第1のノイズ系列および第2のノイズ系列は、等しいエネルギーレベルを備える、請求項12~14のいずれか1項に記載の音処理装置。
【請求項16】
前記分散フィルタ段(18)の分散フィルタ(38)は、窓化ノイズ系列に基づく、請求項1~15のいずれか1項に記載の音処理装置。
【請求項17】
前記窓化ノイズ系列は、ホワイトノイズ系列に基づくか、または対応する、請求項16に記載の音処理装置。
【請求項18】
前記分散フィルタ段(18)の分散フィルタは、第1の空間信号(16)に対する第1の分散フィルタであり、第2の分散フィルタは、異なる第2の空間信号(16)をフィルタリングするためのものであり、
第1の分散フィルタ(38)および第2の分散フィルタ(38)は、同一の窓化ノイズ系列に基づくか、または
前記第1の分散フィルタ(38)および前記第2の分散フィルタ(38)は、知覚基準に従う所定の相関を有する異なるノイズ系列に基づく、請求項1~17のいずれか1項に記載の音処理装置。
【請求項19】
エネルギー保存的であり、フィルタ利得を考慮して調整可能である、請求項1~18のいずれか1項に記載の音処理装置。
【請求項20】
バイノーラル化された前記入力信号(14)にのみ前記分散フィルタ段(18)を用いて分散フィルタ処理を適用するように構成される、請求項1~19のいずれか1項に記載の音処理装置。
【請求項21】
前記分散フィルタ段(18)は、第1の空間信号(16)をフィルタリングするための第1の分散フィルタ(38)と、第2の空間信号(16)をフィルタリングするための第2の分散フィルタ(38)とを少なくとも備え、前記第1の分散フィルタ(38)および前記第2の分散フィルタ(38)は、例えば両耳間相互相関(IACC)に基づいて取得される、周波数依存フィルタ脱相関を備える、請求項1~20のいずれか1項に記載の音処理装置。
【請求項22】
前記パンナーは、
複数のバイノーラル化段(26)であって、各バイノーラル化段(26)は、前記入力信号(14)のうちの1つを受信するため、ならびに第1のバイノーラル化チャネルおよび第2のバイノーラル化チャネルを取得するために前記受信された入力信号をバイノーラル化するためのものである、複数のバイノーラル化段(26)と、
前記バイノーラル化段(26)の前記第1のバイノーラル化チャネルの第1の結合を提供し、前記バイノーラル化段(26)の前記第2のバイノーラル化チャネルの第2の結合を提供するコンバイナ(32)と、を備え、
第1の空間信号(16)が前記第1の結合に基づき、
第2の空間信号(16)が前記第2の結合に基づく、
請求項1~21のいずれか1項に記載の音処理装置。
【請求項23】
前記パンナー(12)は、中間空間信号(66)を取得するために前記入力信号(14)を受信し処理するための仮想スピーカプロセッサ(64)と、
複数のバイノーラル化段(26)であって、各バイノーラル化段(26)は、前記中間空間信号(66)のうちの1つを受信するため、ならびに第1のバイノーラル化チャネルおよび第2のバイノーラル化チャネルを取得するために前記受信された中間空間信号(66)をバイノーラル化するためのものである、複数のバイノーラル化段(26)と、
前記バイノーラル化段(26)の前記第1のバイノーラル化チャネルの第1の結合を提供し、前記バイノーラル化段(26)の前記第2のバイノーラル化チャネルの第2の結合を提供するコンバイナ(32)と
第1の空間信号(16)が前記第1の結合に基づき、
第2の空間信号(16)が前記第2の結合に基づく
請求項1~21のいずれか1項に記載の音処理装置。
【請求項24】
前記バイノーラル化段(26)は、頭部伝達関数(HRTF)に従って構成される、請求項22または23に記載の音処理装置。
【請求項25】
前記出力信号(24)のためのちょうど2つのオーディオチャネル(L、R)を提供するように構成される、請求項22~24のいずれか1項に記載の音処理装置。
【請求項26】
前記パンナー(12)は、
少なくとも1つの初期反射信号および/または少なくとも1つの回折音信号を含む前記入力信号(14)を受信し、
前記入力信号(14)に関連付けられた直接音成分(42)および反響音成分(46)を受信する
ように構成され、前記空間信号(16)は、スピーカ設備のスピーカ(68)に各々関連付けられる、請求項1~21のいずれか1項に記載の音処理装置。
【請求項27】
前記出力信号(24)は、オーディオチャネル(L、R)、例えばL/R、に各々関連付けられ、前記音処理装置は、前記複数の入力信号(14)に関連付けられた直接音成分(42)を処理するための直接音プロセッサ(1006)を備え、
前記パンナーは、前記オーディオチャネル(L、R)のうちの1つに各々関連する成分を取得するために、前記直接音成分(42)を受信しバイノーラル化するための直接音バイノーラル化段(26)をさらに備え、
前記音処理装置は、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネル(L、R)に関連する信号を結合するためのコンバイナを備える、請求項1~26のいずれか1項に記載の音処理装置。
【請求項28】
前記出力信号(24)は、オーディオチャネル(L、R)、例えばL/R、に各々関連付けられ、前記音処理装置は、前記複数の入力信号(14)に関連付けられた後期反響成分(46)を処理するための反響プロセッサ(1008)を備え、
前記パンナーは、前記オーディオチャネル(L、R)のうちの1つに各々関連する成分を取得するために、前記後期反響成分を受信しバイノーラル化するための反響バイノーラル化段(26)をさらに備え、
前記音処理装置は、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネルに関連する信号を結合するためのコンバイナを備える、請求項1~27のいずれか1項に記載の音処理装置。
【請求項29】
前記分散フィルタ段(18)のちょうど2つの分散フィルタ(38、38)の使用によってすべての入力信号(14)をフィルタリングするように構成される、請求項1~28のいずれか1項に記載の音処理装置。
【請求項30】
前記ちょうど2つの分散フィルタ(38、38)の数は、入力信号(14)の数とは独立であり、および/または前記複数の入力信号(14)を提供する音源の数とは独立である、請求項29に記載の音処理装置。
【請求項31】
前記音処理装置は、ビットストリーム(74;78)の一部として前記入力信号(14)またはその基礎を受信し、前記ビットストリームの1つまたは複数のデータフィールドに基づいて前記分散フィルタ段(18)を使用および/または構成するように構成され、前記1つまたは複数のデータフィールドは、前記分散フィルタ段(18)の使用および/または構成の指示を含む、請求項1~30のいずれか1項に記載の音処理装置。
【請求項32】
オーディオ信号を表す情報を含むビットストリーム(78)を復号するためのデコーダ(80)であって、
請求項1~31のいずれか1項に記載の音処理装置(10)を備える、デコーダ(80)。
【請求項33】
オーディオ信号(72)をビットストリーム(74)に符号化するためのエンコーダ(70)であって、
分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
初期反射音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
回折音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
前記分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で示す情報と、
分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
前記分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの1つまたは複数を含むように前記ビットストリーム(74)を生成するように構成される、エンコーダ(70)。
【請求項34】
ビットストリーム(74;78)であって、
オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報と、
前記ビットストリームからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドと
を含む、ビットストリーム(74;78)。
【請求項35】
前記1つまたは複数のデータフィールド内の前記情報は、
分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
初期反射音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
回折音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
前記分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で示す情報と、
分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
前記分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの少なくとも1つを示す、請求項34に記載のビットストリーム。
【請求項36】
音処理のための方法(900)であって、
複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合すること(910)と、
フィルタリングされた空間信号のセットを取得するために前記空間信号を分散フィルタリングすること(920)と、
前記フィルタリングされた空間信号に基づいて、いくつかの出力信号を提供すること(930)と
を含む、方法(900)。
【請求項37】
オーディオシーンを符号化するための方法(1000)であって、
前記オーディオシーンから、前記オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報を生成すること(1010)と、
前記符号化されたオーディオシーンからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドを提供すること(1020)と
を含む、方法(1000)。
【請求項38】
コンピュータまたは信号プロセッサ上で実行されるときに請求項36または37に記載の方法を実施するためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、フィルタリングされた空間信号に基づいて出力信号を提供するための音処理装置、およびそのような装置を備えるビットストリームを復号するためのデコーダに関する。本発明はさらに、オーディオ信号をビットストリームに符号化するためのエンコーダに関し、ビットストリームに関し、音処理のための方法、およびオーディオシーンを符号化するための方法に関する。本発明は、特に、初期反射のための分散フィルタに関する。
【背景技術】
【0002】
仮想現実(VR)または拡張現実(AR)のように、音を仮想音響環境にレンダリングする場合、音響の正確なおよび/または妥当なレンダリングが重要である。通常、仮想環境の音響挙動は、直接音、初期反射、および後期残響の挙動によって記述される。
初期反射は、鏡像法[1]を介して仮想音響リアルタイム環境で計算されることが多い。これらの鏡面反射の計算は効率的であることが知られているが、それらの音響知覚は臨場感を欠く可能性がある。この臨場感の欠如は、すべての反射面が滑らかであり、音響散乱なしで鏡面反射のみを引き起こすというアルゴリズム的仮定、または空気中の音の伝播が、例えば室内の温度差に依存する乱流または異なる伝播速度のない線形プロセスであるというアルゴリズム的仮定によって引き起こされ得る。
実際には、空気中の音響反射および音の伝播は完全に線形には挙動しない。意図的に設計されたフィルタを適用することにより、音響分散の効果は、計算の複雑さにおいて非常に妥当なコストで、初期反射シミュレーションの知覚を効率的に改善し、信憑性および臨場感を高めることができる。
【0003】
初期反射をシミュレートする既知の方法は以下のとおりである。
-鏡像法[1]
-粒子シミュレーション法[2]
-レイトレーシング[3]
-ビームトレーシング[4]
これらの幾何学的音響方法は、ルームシミュレーションにおける初期またはすべての反射を計算するために異なる手法を使用する。Gerzon[5]が既に定式化しているように、「幾何学的モデルにより部屋をモデル化する際の欠点の1つは、部屋の境界における分散効果が一般にうまくモデル化されず、これが一般に不快なカラレーションをもたらすことである」。これを改善するために、彼は2次オールパスフィルタを提案した。これは、反射ごとに1つの「オールパス」フィルタの複雑さをもたらす。
Mooreは、[6]において、指数関数的に減衰するホワイトノイズは、コンサートホールのインパルス応答に知覚的に非常に類似していると述べている。
【0004】
図11は、初期反射にオールパスフィルタリングを適用する全体的なアーキテクチャを示す。具体的には、オールパスフィルタまたは分散フィルタDF1002が各初期反射ER1004について使用され、各オールパスフィルタ1002は、音源から空気および反射面を経由してリスナへ向かう途中でこの初期反射1004に発生する(時間的)分散効果をモデル化する。異なる分散強度での材料上の反射は、異なる分散量を有するオールパスフィルタ1002を適用することによってモデル化することができる。このようにして、各初期反射1004の分散効果の個々のモデル化が達成され、オールパスフィルタ処理の複雑さは、考慮される初期反射の数とともに線形に増大する。これは、システムにかなりの計算複雑性をもたらす可能性がある。
少数のn個の初期反射に必要ないくつかのn個の分散フィルタを示す図11に示すバイノーラル再生のための分散フィルタリングの既知の使用は、直接音プロセッサ1006および後期残響/反響プロセッサ1008をさらに備える。バイノーラル化フィルタ1012は、スピーカ1016に信号を提供するためにコンバイナ1014、1014に入力を提供するように適合される。
したがって、初期反射フィルタリングを効率的に提供する必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
そこで、本発明の目的は、音処理装置、ビットストリームを復号するためのデコーダ、オーディオ信号をビットストリームに符号化するためのエンコーダ、ビットストリーム、および対応する方法を提供し、初期反射フィルタリングを効率的に提供することにある。
【課題を解決するための手段】
【0006】
この目的は、独立請求項に規定される主題によって達成される。
本発明の発見は、例えば、同じ壁材料に当たるために、各初期反射について類似する分散特性が類似するという仮定に基づいて、(同一の)オールパスフィルタ、バイノーラル化段および加算/結合の順序は、すべて線形系であるために入れ替えることができるということである。実施形態は、例えば初期反射からの空間信号を提供し、それらの空間信号を分散フィルタ段に提供することによって、分散フィルタの数を、例えば初期反射における入力信号の数の代わりに空間信号の数に関連付けることができるという知見に関する。これにより、比較的少数の分散フィルタを使用することが可能であり、初期反射フィルタリングを効率的に提供することが可能になる。
【0007】
一実施形態によれば、音処理装置は、複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合するためのパンナーを備える。音処理装置は、空間信号を受信し、フィルタリングされた空間信号のセットを取得するために空間信号を分散フィルタリングするための分散フィルタ段を備える。音処理装置は、フィルタリングされた空間信号に基づいていくつかの入力信号を提供するためのインターフェースを備える。
一実施形態によれば、オーディオ信号を表す情報を含むビットストリームを復号するためのデコーダは、一実施形態による音処理装置を備える。これにより、ビットストリームからオーディオ信号を効率的に提供することができる。
【0008】
一実施形態によれば、オーディオ信号をビットストリームに符号化するためのエンコーダは、分散フィルタ処理を有効または無効にすることを可能にする情報と、初期反射音に対する分散フィルタ処理を有効または無効にする情報と、分散フィルタ処理または回折音を有効または無効にする情報と、分散フィルタ処理に使用される分散フィルタのインパルス応答の持続時間をシグナリングするためのパラメータを示す情報と、分散フィルタ利得をシグナリングするためのパラメータを示す情報と、分散フィルタの空間的な広がりをシグナリングするためのパラメータを示す情報とのうちの1つまたは複数を含むようにビットストリームを生成するように構成される。これにより、正確に復号されるビットストリームを効率的に提供することができる。
【0009】
一実施形態によれば、ビットストリームは、オーディオシーンの少なくとも1つの空間位置入力信号を示す情報と、ビットストリームからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドとを含む。
一実施形態によれば、音処理のための方法は、複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合することと、フィルタリングされた空間信号のセットを取得するために空間信号を分散フィルタリングすることと、フィルタリングされた空間信号に基づいて、いくつかの出力信号を提供することとを含む。
一実施形態によれば、オーディオシーンを符号化するための方法は、オーディオシーンから、オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報を生成することを含む。方法は、例えばビットストリームに挿入されるべき、符号化されたオーディオシーンからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドを提供することを含む。
さらなる実施形態は、そのような方法を表すためのコンピュータプログラムに関する。
本発明のさらなる有利な実施形態は、従属請求項に規定される。
本発明の有利な実施態様は、添付の図面を参照しながら本明細書で説明される。
【図面の簡単な説明】
【0010】
図1】一実施形態による音処理装置の概略ブロック図である。
図2】一実施形態による音処理装置の概略ブロック図を示し、音処理装置は、直接音プロセッサと、後期残響プロセッサとを備える。
図3】一実施形態による信号フローの概略図である。
図4】いくつかの実施形態で使用する頭部伝達関数を説明するための、人間の耳チャネル内のエコーチャンバ内の頭部コヒーレンス測定値を示す図である。
図5】一実施形態による音処理装置の概略ブロック図を示し、音処理装置は、仮想スピーカプロセッサを有するパンナーを備える。
図6】いくつかのスピーカに接続され得る一実施形態による音処理装置の概略ブロック図である。
図7】一実施形態によるエンコーダの概略ブロック図である。
図8】一実施形態によるデコーダの概略ブロック図である。
図9】一実施形態による音処理のための方法の概略フローチャートである。
図10】オーディオシーンを符号化するために使用され得る一実施形態による方法の概略フローチャートである。
図11】初期反射にオールパスフィルタリングを適用する全体的なアーキテクチャを示す図である。
【発明を実施するための形態】
【0011】
同等もしくは等価な要素、または同等もしくは等価な機能を有する要素は、異なる図で発生する場合であっても、以下の説明では同等または等価な参照番号で示される。
以下の説明では、本発明の実施形態のより完全な説明を提供するために、複数の詳細が記載される。しかしながら、本発明の実施形態がこれらの具体的な詳細なしに実施され得ることは、当業者には明らかであろう。他の例では、本発明の実施形態を不明瞭にすることを避けるために、周知の構造およびデバイスが詳細ではなくブロック図形式で示されている。さらに、以下に説明する異なる実施形態の特徴は、特に明記しない限り、互いに組み合わせてもよい。
【0012】
図1は、一実施形態による音処理装置10の概略ブロック図を示す。音処理装置10は、n>1である複数の入力信号14~14の空間的位置決めのためのパンナー12を備える。入力信号は、例えば、オーディオシーンの初期反射および/または回折音源を含んでもよい。実施形態によれば、初期反射ERの数は、靴箱形の部屋などの場合の例えば1次の少なくとも2つのER、少なくとも6つのERの一定数または可変数であってもよいが、複雑な形状の部屋の高次ERの場合は100個程度またはより多数の任意の他の数のERであってもよい。初期反射は、各直接音源ごとに個別であることができ、または直接音の数とは無関係の一般的なパターンであることができる。
パンナー12は、入力信号を少なくとも2つの空間信号16および16へと結合するように構成される。例えば、空間信号16および16は、ヘッドフォンなどのステレオシステム向けの左/右信号に関連してもよい。より多数の空間信号は、より高次の空間シーンを表し得る。
音処理装置は、空間信号16および16またはそれらから導出された信号を受信し、フィルタリングされた空間信号22および22のセットを取得するために空間信号16および16を分散フィルタリングするための分散フィルタ段18を備える。フィルタリングされた空間信号22の数は、場合によるが必然的に空間信号16の数に等しい。
【0013】
一実施形態によれば、分散フィルタ段18は、分散フィルタリングを提供するために、図11に示すフィルタ1002などの少なくとも1つの分散フィルタを備える。分散フィルタは、オールパスフィルタを備えてもよく、またはオールパスフィルタとして実装されてもよい。代替的または追加的に、分散フィルタ段18は、有限インパルス応答(FIR)フィルタおよび/または無限インパルス応答(IIR)フィルタである少なくとも1つの分散フィルタを備えてもよい。それらの構成の各々は、一実施形態による音処理装置において動作するように適宜適合されてよい。
入力信号14は、例えば、ビットストリームから受信されてもよく、および/または、例えば音処理装置10の一部を形成するレンダラまたは本明細書に記載の異なる音処理装置によって提供されてもよく、レンダラは、複数の入力信号を提供するように構成される。例えば、音処理装置10は、直接音成分および反響音成分を提供するように構成されてもよい。図2および/または図5に示すように、このような直接音成分42および/または反響音成分46は、分散フィルタ段18から排除されてもよい。しかしながら、例えば図6に示すように、これらの成分はまた、パンナーに供給されてもよく、少なくとも間接的に分散フィルタに供給されてもよい。
【0014】
一実施形態によれば、分散フィルタ段18の少なくとも1つの分散フィルタは、時変フィルタ特性を含んでもよく、例えば、ノイズ系列の低周波時間変調を使用して、より複雑で自然な/生き生きとした音分散特性を達成することができる。
音処理装置は、インターフェース、例えば、いくつかの少なくとも1つの出力信号24を提供するように構成された有線、無線、電気、光学、または他のタイプのインターフェース24を備え、少なくとも1つの出力信号24は、フィルタリングされた空間信号22、22に基づく。例えば、出力信号24は、異なる音再生システムに関連して、オーディオチャネル、例えばステレオシステムの左チャネルもしくは右チャネル、または異なるチャネルを含んでもよく、またはそれらと関連付けられてもよい。
一実施形態によれば、入力信号14~14は、オーディオシーンの少なくとも1つの初期反射信号および/または少なくとも1つの異なる音信号を含んでもよい。
【0015】
図2は、一実施形態による音処理装置の概略ブロック図を示す。音処理装置20は、図11に関連して説明したように、バイノーラル化フィルタ1012に接続された直接音プロセッサ1006を備えてもよい。直接音プロセッサは、直接音成分を処理するように構成されてもよい。音処理装置20は、図11に関連して説明したように、バイノーラル化フィルタ1012に接続された後期残響プロセッサ1008をさらに備えてもよい。後期残響プロセッサは、オーディオシーンの後期残響成分を処理するように構成されてもよい。
実施形態によれば、音処理装置10で使用され得るパンナー12は、バイノーラル化段26および26を備えてもよい。バイノーラル化段26および26の各々は、例えば初期反射(ER)であるn個の入力信号の入力信号14~14のうちの1つを受信するように構成されてもよい。バイノーラル化段26および26は、図11のバイノーラル化フィルタと同様に適合されてもよいが、それらは実施形態による入力信号に接続され、一方、図11は、バイノーラル化フィルタがそれらの入力を分散フィルタから受信する構成を示す。
【0016】
バイノーラル化段26および26は、それぞれの第1のバイノーラル化チャネル281,1、28n,1をそれぞれ、および第2のバイノーラル化チャネル281,2、28n,2をそれぞれ取得するために、受信された入力信号14~14をバイノーラル化するように構成されてもよい。なお、バイノーラル化は、ステレオ方式用のオーディオ信号を提供する一例である。多数のチャネルまたはスピーカが使用される場合、バイノーラル化は、より多数のチャネル28を提供するように制限なく拡張されてもよい。
パンナー12は、結合段34および34などの1つまたは複数の結合段を有するコンバイナ32を備えてもよく、一方では例えばコンバイナ段34を使用することによってそれぞれの第1のバイノーラル化チャネル281,1および28n,1の結合を提供し、他方では例えばコンバイナ段34を使用することによってそれぞれの第2のバイノーラル化チャネル281,2および28n,2の結合を提供するように各々構成される。これは、空間信号16および16の少なくとも基礎を形成し得る。それにより、各空間信号16および16は、バイノーラル化段26および26によって提供される対応するまたは関連付けられたバイノーラル化チャネルのそれぞれの結合に基づいてもよい。
【0017】
分散フィルタ段18は、フィルタリングされた出力信号22および22を提供するように構成された分散フィルタ38および38を備えてもよい。
n個の入力信号に対してn個のバイノーラル化段26を使用するが、本発明を実施することによって、より少ない数の分散フィルタ38、例えば、出力信号の数に対応する数の分散フィルタ段、フィルタ出力信号24、24の使用が可能である。図2に示す実施形態では、音処理装置20は、分散フィルタ段18のちょうど2つの分散フィルタ38および38のn個の入力信号すべてをフィルタリングするように構成されてもよい。一実施形態によれば、ちょうど2つの分散フィルタ38および38の数は、入力信号14~14の数とは独立であってもよく、および/または複数の入力信号14~14を提供する音源の数とは独立であってもよい。
【0018】
直接音プロセッサ1006および/または後期残響プロセッサ1008が音処理装置20の一部を形成する場合、フィルタリングされた空間信号22および22をバイノーラル化フィルタ1012および1012のそれぞれのチャネルと結合するために、コンバイナ1014および1014が使用されてもよい。
直接音プロセッサ1006は、直接音チャネル44および44を提供するバイノーラル化フィルタ1012の入力を形成する直接音信号42を提供してもよい。例えば、左Lおよび右Rチャネルを有するステレオシステムなどのスピーカ設備1016による。後期残響プロセッサ1008は、同じくスピーカ設備1016による後期残響チャネル48および48を導出するためにバイノーラル化フィルタ1012に供給され得る後期残響信号46を提供してもよい。
【0019】
本明細書に記載の実施形態の一態様は、個々の反射ではなく、耳信号和に適用される既知の分散フィルタを使用することである。実施形態はまた、ステレオ効果が扱われる方法に関する。この意図された目的を有する、信号処理チェーン内のこの位置における所与の相関を有するフィルタの設計(図4参照)は、既知の構造とは異なる。
換言すれば、図2は、2つのフィルタのみが必要なバイノーラル再生における初期反射処理のための分散フィルタリングの本発明の使用を示している。フィルタの適用に関して、好ましい実施形態の1つおよび初期反射信号に分散フィルタリングを適用する可能性。具体的には、各初期反射14は、最初に、例えば適切な頭部伝達関数HRTFを使用して、それらの入射の方向を反映してバイノーラル化され、次いで左右の耳のバイノーラルは、1対の分散フィルタを介して供給される。これは、分散フィルタリングによって追加される計算複雑度をn/2倍に低減する可能性があり、ここでnは初期反射の数であり、すなわち、低減は考慮される初期反射の数とともに増大する。
【0020】
図3は、信号フロー30の概略図を示し、さらに、本明細書に記載の実施形態の重要な、またはさらには本質的な部分を形成し得る分散フィルタの生成を視覚化しており、その部分は、いくつかの知覚基準を満たすように設計される。分散フィルタの生成は、実施形態によれば、オーディオ処理装置の開始時またはセットアップ時に有用であり得るが、例えばフィルタの更新としての動作中にも有用であり得る。
レンダラ54は、チャネル14、14;44、44;48および48の生成を提供してもよい。レンダラ54は、本明細書に記載の音処理装置の一部、一実施形態による符号化ビットストリームを提供するエンコーダの一部、および/または一実施形態による符号化ビットストリームを復号するデコーダの一部を形成してもよい。
【0021】
分散フィルタ生成ユニット56、すなわち、分散フィルタ段18の分散フィルタ38のうちの1つまたは複数の特性および/または設定および/またはパラメータを決定するエンティティは、例えば、1つまたは複数の制御パラメータ58に基づいて、分散フィルタ処理52を制御するように適合されてもよい。分散フィルタジェネレータ56は、本明細書に記載のエンコーダ、デコーダ、および/または音処理装置、例えば音処理装置10および/または20の一部であってもよい。すなわち、本明細書に記載の音処理装置は、分散フィルタ段の少なくとも1つの分散フィルタを生成および/または更新するように構成された分散フィルタジェネレータ56を備えてもよい。
【0022】
図3では、分散フィルタ処理52を用いた、分散フィルタ生成を含むバイノーラル再生のための初期反射信号の分散フィルタリングを示している。図3に示すように、例えば入力信号14および14を形成する、バイノーラル化された初期反射ER成分に、分散フィルタ処理52を適用すれば十分であり得る。これは、例えば、音処理装置10および/または20内の分散フィルタ段18を使用することによって実施されてもよい。
【0023】
分散フィルタ処理52をバイノーラル化ER成分にのみ適用すれば十分であり得、これは、いくつかの実施形態によれば、分散フィルタ処理52を直接音チャネル44、44および後期残響チャネル48および48に適用しないように解釈され得る。このようにして、直接経路内の過渡音は不鮮明にならず、聴取者の知覚に関して「クリーン」なままであり得る。さらに、音源または初期反射の数とは独立に、(バイノーラル化に基づく)2個のフィルタリング動作のみが必要とされる。スピーカ設備に対してより多くの数の空間信号が生成される場合、2つの分散フィルタの数は、対応して増加し得るが、n個の入力信号の各々に対してDFを提供することと比較した場合、依然として比較的低いままである。
しかしながら、本明細書に記載された実施形態のいくつかは、本発明の分散フィルタによる初期反射音成分の扱いに関連して記載されているが、それに関連して記載されたすべての利点は、回折音DS成分にも適用することができる。したがって、初期反射処理を示す初期反射に関する実施形態および例示的な図、例えば図2は、回折音の処理に加えて、または代替として適用可能であると理解されるべきである。
【0024】
好ましい実施形態では、初期反射のための音響分散フィルタの設計は、例えば、レンダラの初期化段階中に1回生成することができる、Lチャネルのために1つ、およびRチャネルのために1つの、2つの窓化されたホワイトノイズ系列に基づくFIRフィルタ構造である。これは、フィルタを再生成すること、またはフィルタを後で更新することを除外するものではない。これらのLおよびRノイズ系列は、少なくとも平均して平坦な周波数応答/スペクトルを有してもよく、初期反射信号の時間的なスミアリング、すなわち分散を提供してもよい。それらは、以下の入力パラメータまたは制御パラメータ58のうちの1つまたは複数に基づいて設計されてもよい。
・分散フィルタによって提供される時間的な広がりの量を決定する長さ、
・例えば、チャネル間相互相関の程度を変更するための高レベル制御による空間的な広がり、および/または
・利得値
例えば、LおよびRチャネルノイズ系列は、
・LチャネルおよびRチャネルのための同一の窓化されたホワイトノイズ系列(時間的スミアリング)、または
・知覚基準に従って明確に定義/制御された(高い)相関を有する2つのホワイトノイズ系列(時空間スミアリング)
のいずれかであってもよい。
【0025】
分散フィルタジェネレータに関して、一実施形態によれば、それは、第1の空間信号、例えば左信号または右信号のための第1の分散フィルタとして分散フィルタを生成するように構成されてもよい。音処理装置は、少なくとも許容範囲内で、かつ互いに対して異なる相関度を有する、同じエネルギーの記憶されたノイズ信号のセットを記憶したメモリを備えてもよい。音処理装置は、記憶されたノイズ信号から、ノイズ系列の基礎として選択するように構成されてもよい。すなわち、実施形態によれば、分散フィルタ段の分散フィルタは、窓化されたノイズ系列に基づく。例えば、窓化ノイズ系列は、ホワイトノイズ系列に基づくか、またはそれに対応する。したがって、分散フィルタ段の異なる分散フィルタは、同一の窓化されたノイズ系列、または知覚基準に従って所定の相関を有する異なるノイズ系列に基づいてもよい。
【0026】
一実施形態によれば、音処理装置は、
・ノイズ信号が同一のまたは弱く脱相関した系列であるという特性と、
・系列の長さを示す、ビットストリーム内のビットストリームパラメータとして受信されるパラメータなどのパラメータと、
・脱相関または空間的な広がりの強さを示すパラメータ、例えばビットストリーム内のビットストリームパラメータとして受信されるパラメータと、
・小さい前面開口を有する音源の両耳間相互相関(IACC)に関連する、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと
のうちの少なくとも1つに基づいてノイズ信号を取得するように構成されてもよい。
例えば、分散フィルタジェネレータは、例えばIACCに基づいて取得される周波数依存フィルタ脱相関を有する少なくとも2つの分散フィルタを生成するように構成されてもよい。好ましくは、少なくとも許容範囲内で、異なるノイズ系列は等しいエネルギーレベルを備える。
【0027】
入力パラメータからのパラメータ長は、例えば、少なくとも10msから高々20msの範囲内のFIRフィルタ長を規定してもよい。あるいは、窓関数の勾配も、分散フィルタ長を制御するために使用することができる。
初期反射に所望の追加の周波数応答を適用するために、非ホワイトノイズ系列も使用され得ることに留意されたい。これは、関連する追加の計算コストなしに取得され得る。
空間分散効果は、2つのフィルタ間の慎重に規定されたわずかな脱相関によって達成され得る。完全に無相関のフィルタは、完全に無相関の耳信号をもたらす可能性がある。これは、不自然な効果であるため、望ましくない可能性がある効果であり、完全に拡散した音場であっても、実際のバイノーラル信号、例えばダミーヘッドから記録されたバイノーラル信号の両耳間相関は、頭部の直径よりも大きい波長のために低周波数で高い相関を有し、例えば図4を参照されたく、完全な脱相関は音の定位を禁止し、知覚アーチファクトを導入する可能性がある。
【0028】
図4は、測定された実部を示すための曲線62と、測定された虚部およびそれらの近似されたコヒーレンス62を表すための曲線62とを示す、人間の耳チャネル内のエコーチャンバ内の頭部コヒーレンス測定値を示し、[7]を参照されたい。横軸は周波数をヘルツ単位で示し、縦軸はコヒーレンスを表す。
一実施形態によれば、分散フィルタ段は、1対の空間信号16および16をフィルタリングするための少なくとも1対の分散フィルタを備えてもよく、異なる分散フィルタは、例えば、両耳間相互相関(IACC)に基づいて取得され得る周波数依存フィルタ脱相関を含む。周波数依存フィルタ脱相関の程度は、IACCを使用して、例えば分散フィルタジェネレータ56によってモデル化されてもよく、本発明の好ましい実施形態では、例えば完全なパラメータ58の少なくとも一部を形成する空間的広がりパラメータを介して設定されることができる。すなわち、分散フィルタジェネレータは、例えばIACCに基づいて得られる、周波数依存フィルタ相関を有する第1の分散フィルタおよび第2の分散フィルタを生成するように構成されてもよい。例えば、2つの(LおよびR)ノイズ系列間の周波数依存相互相関は、リスナに対する特定の開口角内に分布する2つ以上の前面音源によって作成される周波数依存IACC目標値、例えば、±4°方位角で2つの音源によってリスナの耳で引き起こされる(脱)相関に基づいて設定できる。0の値の空間的広がりは、完全に相関する系列と見なされ得る2つの等しいノイズ系列を生成し得る。空間的広がりの値を増加させると、2つのノイズ系列間の相互相関が徐々に減少する。全体的な概念を変更することなく、弱く脱相関化したホワイトノイズ系列を生成するための他の手法を適用することができる。例えば、バイノーラル化された初期反射の和のコヒーレンスを使用して、所望のコヒーレンスが達成されるように分散フィルタのコヒーレンスを調整してもよい。
【0029】
(2つの空間チャネルを有する例では)2つのホワイトノイズ系列は、少なくとも許容範囲内で等しいエネルギーを有してもよく、調整可能な減衰時間を有する窓関数によって重み付けされてもよい。窓関数は、減衰特性、例えば指数関数的に減衰する特性を示してもよい。減衰時間は、分散効果処理に提供される制御パラメータ、すなわち図3の制御パラメータ58のうちの少なくとも1つを形成してもよい。
減衰窓関数をノイズ系列に適用することにより、離散的な初期反射鏡像に信号を一時的にぼかす、コンパクトであるが密集したFIRフィルタ係数セットを作成してもよい。
2つの重み付きノイズ系列は、エネルギー保存的であるように正規化されてもよい。このようにして、信号の適性に望ましくない影響を与えることなく、時間的分散の量を制御することができる。代替的または追加的に、追加の全体的なフィルタ利得は、制御パラメータ58として提供される利得パラメータを使用して設定することができる。一実施形態によれば、音処理装置は、エネルギー保存的であってもよく、および/またはフィルタ利得を考慮して調整可能であってもよい。
【0030】
本明細書に記載される実施形態、例えば本発明の方法の利点は、仮想音響シーンのすべての初期反射を処理するために、例えば2つのフィルタリング操作のみを有することにより労力をほとんど必要とせず、必要に応じて、時空間分散を達成するために追加のランタイム計算が必要ないことである。例えば、本明細書に記載の音処理装置は、分散フィルタ段による分散フィルタ処理をバイノーラル化された入力信号のみに適用するように構成されてもよい。
なお、ここで説明する実施形態は、上記に限定されるものではない。上記から、本発明による実施形態は、以下のうちの少なくとも1つを考慮して逸脱または拡張してもよい。
【0031】
代替的なフィルタ設計の使用
FIRベースの実施態様を参照したが、本発明の概念は、例えば分散フィルタを実施するために、異なるフィルタタイプを使用して実施することもできる。例えば、FIRフィルタは、低複雑度のIIRフィルタ設計に変換することができる。
【0032】
時変フィルタの使用
代替的または追加的に、例えば2つのノイズ系列の低周波時間変調によるフィルタの時変バージョンを使用して、より複雑で自然な/生き生きとした音分散特性を達成することができる。
【0033】
仮想スピーカ再生への拡張
バイノーラルオーディオ再生では、対応する頭部伝達関数HRTFを使用してバイノーラル化される「仮想スピーカ」間で音源(初期反射を含む)をパンニングすることによって音源を再生することが非常に一般的である。仮想スピーカの使用後のバイノーラル化の場合、図5に関連して説明される本発明の好ましい実施形態において必要な分散フィルタは依然として2つしかない。すなわち、そこに記載されている音処理装置のバイノーラル化段は、頭部伝達関数(HRTF)に従って構成されてもよい。
【0034】
回折音の処理への拡張
仮想音レンダリング、特にリスナが仮想シーン内で自由に動くことができる6自由度(6DoF)レンダリングでは、回折音成分のレンダリングが重要である。回折音は、音が聴取者に到達する前に1つまたはいくつかの角の周りを伝播するときに現れる。回折角の周りの音の屈曲のために、音は通常、その高周波数部分で減衰され、間接的で場合によっては長い伝播経路のために、直接音成分よりも反響が大きい。また、この効果は、初期反射に適用されるのと類似した、またより同じ方法で回折音成分の合計寄与に本発明の分散フィルタを適用することによって、良好な品質および高効率でモデル化することができる。これは図5にも示されており、仮想スピーカ再生に加えて、または仮想スピーカ再生の代替として実装されてもよい。
【0035】
図5は、一実施形態による音処理装置の概略ブロック図を示す。音処理装置50は、例えば音処理装置10および/または20で使用され得るパンナー12を備える。パンナー12は、図2に関連して説明したように動作し得る、すなわち、頭部伝達関数(HRTF)に従って構成され得る、入力信号を受信および処理して、中間空間信号66~66を取得するように構成された仮想スピーカプロセッサ64を備える。
各バイノーラル化段26~26は、中間空間信号66~66のうちの1つを受信してもよく、それぞれのバイノーラル化チャネル281,1~28n,2を取得するために、受信された中間空間信号66をバイノーラル化してもよい。コンバイナ12は、コンバイナ段34および34を有するコンバイナ32を備えてもよく、コンバイナ32は、バイノーラル化段の第1のバイノーラル化チャネルの第1の結合、例えばLを提供するように構成され、空間信号16は、コンバイナ段34によって提供される結合に基づき、空間信号16は、コンバイナ段34によって提供される結合に基づく。これに限定されないが、音処理装置50は、ちょうど2つのオーディオチャネルまたは出力信号24および24を提供するように構成されてもよい。
【0036】
仮想スピーカプロセッサ64は、初期反射ER、回折源DS、またはそれらの結合を含み得る入力信号を受信するように構成されてもよい。例えば、n個の1つまたは複数のより初期の反射141,1~141,nが仮想スピーカプロセッサに供給されてもよい。代替的または追加的に、いくつかの少なくとも1つの回折源142,1~142,iが仮想スピーカプロセッサ64に供給されてもよい。nおよびjの数は、互いに独立または無関係であってもよく、最終的に2である経時的に可変または一定の値を各々含んでもよい。
回折源142,i、i=1,...,j、j≧1、を仮想スピーカプロセッサ64の入力として示しているが、音処理装置20を参照すると、そのような入力信号はまた、バイノーラル化段26に直接供給されてもよい。1人のリスナの使用を説明する1つの単一のヘッドフォンを表示することによって図5に示されるように、n=2のちょうど2つのバイノーラライザ26および26が十分であり得るか、または必要であり、例えば、左右のヘッドフォン信号に対して1つである。
【0037】
音処理装置50に実装された概念によれば、バイノーラル再生のための仮想スピーカ処理とともに分散フィルタリングを使用することが可能になる。このような概念では、それぞれ2つの分散フィルタのみが必要であり、十分である。可能性はあるが、必ずしもより好ましくはない一実施形態によれば、各仮想スピーカ信号に含まれる初期反射音成分ERに1つの分散フィルタが適用されてもよい。
【0038】
従来のスピーカ再生への拡張
バイノーラルヘッドフォンに基づく再生ではなく従来のスピーカ再生のために本発明の概念を実施するために、各スピーカ信号に1つの分散フィルタが適用されてもよい。すなわち、より多数のオーディオチャネルに基づいて、2つよりも多い対応する数の分散フィルタが使用されてもよい。
【0039】
図6は、いくつかのスピーカ68~68に接続され得る一実施形態による音処理装置60の概略ブロック図を示す。分散フィルタ38の数mは、スピーカ68の数oに等しくてもよい。しかしながら、回折源の数jおよびERの数nは必ずしも等しくなく、通常はスピーカの数よりも明らかに大きい。
音処理装置20および/または50によれば、音処理装置は、分散フィルタ段18から直接音成分42および/または反響音成分46を排除するように構成されてもよいが、音処理装置60のパンナー12は、前記音成分または音チャネル42および/または46を受信するように構成されてもよい。したがって、空間信号16~16は、直接音プロセッサ1006および/または後期残響プロセッサ1008に基づく情報も含んでもよい。
【0040】
音処理装置16は、音処理装置10、20および/または50と同様に、直接音プロセッサ1006および/または後期残響プロセッサ1008を備えてもよい。
音処理装置60に実装される実施形態によれば、パンナー12は、少なくとも1つの初期反射信号および/または少なくとも1つの回折音信号を含む入力信号141,1~142,nを受信するように構成されてもよい。パンナー12は、入力信号14に関連付けられた直接音成分42および反響音成分46を受信するように構成されてもよい。空間信号16は、スピーカ68~68を備えるスピーカ設備のスピーカに各々関連付けられてもよい。
パンナー12、12、12および/または12は、オーディオチャネルのうちの1つに各々関連するそれぞれの成分を取得するために、直接音成分42を受信してバイノーラル化するための直接音バイノーラル化段を備えてもよい。音処理装置は、例えば出力信号として、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネルに関連する信号を結合するためのコンバイナを備えてもよい。例えば、コンバイナ段1014および1014が、そのような結合のために使用されてもよい。
【0041】
代替的にまたは追加的に、音処理装置の一部である後期残響プロセッサ1008は、オーディオチャネルのうちの1つに各々関連するそれぞれの成分を取得するために、後期残響成分46を受信してバイノーラル化するための残響バイノーラル化段を備えるようにパンナーを実装するための基礎を形成してもよい。音処理装置は、例えば出力信号として、第1のオーディオ信号および第2のオーディオ信号を取得するために同じオーディオチャネルに関連する信号を結合するためのコンバイナ、例えばコンバイナ段1014および/または1014を備えてもよい。
換言すれば、図6は、実際のスピーカ再生による分散フィルタリングに関連する実施形態の使用を示す。
【0042】
オールパスフィルタ、バイノーラル化段および総和の順序は、すべて線形システムであるために交換することができるという発見に基づいて、実施形態は、時間および任意選択的に空間の両方において、鏡像モデルによって生成された離散的な初期反射をぼかす/滲ませ、わずかな計算しか必要としないフィルタ設計を提案する。空間および/または時間成分は、個別にパラメータ表示することができる。
ビットストリームを使用して、それぞれのオーディオシーンに関する情報を提供してもよい。そのようなビットストリームは、エンコーダによって生成されてもよく、デコーダによって使用、処理、および/または復号されてもよい。代替的または追加的に、本明細書に記載の音処理装置は、ビットストリームの一部として入力信号またはその基礎を受信し、ビットストリームの1つまたは複数のデータフィールドに基づいて分散フィルタ段18を使用および/または構成するように構成されてもよく、1つまたは複数のデータフィールドは、分散フィルタの使用および/または構成の指示を含む。
【0043】
図7は、オーディオ信号72をビットストリーム74に符号化するように構成された、一実施形態によるエンコーダ70の概略ブロック図を示す。エンコーダ70は、
・分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
・初期反射音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・回折音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で示す情報と、
・分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
・分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの1つまたは複数を含むように、例えばビットストリームジェネレータ76を使用して、ビットストリーム74を生成するように構成される。
【0044】
したがって、他の実施形態は、ビットストリームであって、オーディオシーンの少なくとも1つの空間位置入力信号を示す情報と、そのビットストリームからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドとを含むビットストリームである。そのような情報は、既知のシステムでは必要ではないが、記載された実施形態による分散フィルタの有利な使用を構成してもよい。例えば、そのようなビットストリームはビットストリーム70であってもよい。そのような実施形態では、1つまたは複数のデータフィールド内の情報は、上記、例えば、
・分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
・初期反射音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・回折音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で、または0msと1000msとの間で示す情報と、
・分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
・分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの少なくとも1つを示してもよい。
【0045】
図8は、ビットストリーム78を復号するように構成された、一実施形態によるデコーダ80の概略ブロック図を示す。デコーダ80は、本明細書に記載の音処理装置、例えば音処理装置10、20、50および/または60を備えてもよい。ビットストリーム78は、ビットストリーム74に従ってもよく、および/またはビットストリーム78からオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含んでもよい。
【0046】
ビットストリームシンタックスに関して、仮想聴覚シーンのオーディオ成分をビットストリームに符号化するエンコーダを含むアプリケーションシナリオでは、ビットストリームは、聴覚シーンのデコーダ/レンダラに記憶および/または送信される可能性があり、上記で識別された情報の少なくとも一部が単一のビットまたはフラグを介してシグナリングされることを考慮しながら、ビットストリームデータは、本発明の好ましい実施形態では以下のうちの1つまたは複数を含んでもよい。
・EnableDispersionFilterフラグ(オン/オフ)
○分散フィルタ処理を有効または無効にすることを可能にするブール値フラグ
・EnableDispersionFilterForERフラグ(オン/オフ)
○初期反射音に対する分散フィルタ処理を有効または無効にするブール値フラグ
・EnableDispersionFilterForDiffractionフラグ(オン/オフ)
○回折音に対する分散フィルタ処理を有効または無効にするブール値フラグ
・DispersionFilterLength Int[0,1000]
○分散フィルタの持続時間をシグナリングするためのパラメータ、例えば、ms単位で、典型的には0~100msまたは1000ms
・DispersionFilterGain
○分散フィルタ利得をシグナリングするためのパラメータ
・DispersionFilterOpeningAngle
○例えば、0度と±180度との間の、分散フィルタの空間的広がりをシグナリングするためのパラメータ
【0047】
実施形態の少なくともいくつかの本発明のさらなる態様は、それぞれ信号処理態様およびビットストリーム態様に関する。
信号処理態様
・(バイノーラル)分散効果を生み出す2チャネルフィルタ
○好ましい実施形態:FIRフィルタ
○フィルタは、(個々の反射ではなく)仮想音響シーンのバイノーラル化され合計された初期反射寄与のLおよびRチャネル信号を処理する
・あるいは、仮想または実際のスピーカ再生を使用する場合、各(仮想または実際の)スピーカ信号における初期反射寄与のために1つのフィルタが使用される
・分散効果は、時間的、および任意選択的に、空間的領域内の信号を変更する
・時間的および空間的強さは、制御パラメータを介して制御することができる
・フィルタはエネルギー保存的であるが、その全体的な利得を変更することができる
・等しいエネルギーおよび様々な相関度を有する(好ましくは、ホワイト)ノイズ信号の記憶されたセットに基づいて生成されるフィルタ
○それらは同一または弱く脱相関した系列である
○系列の長さは、例えばビットストリームパラメータによって、制御することができる
○脱相関は、例えばビットストリームパラメータによって、制御することができる
○小さい前面開口を有する音源のIACCに基づく。開口は、例えばビットストリームパラメータによって、制御することができる
・上記の特性を有するフィルタ系列を生成する分散フィルタジェネレータ
・回折音成分に適用される上記のフィルタのすべて
ビットストリーム態様
ビットストリームの一部であるフラグに少なくとも部分的に関連する上記の詳細に加えて、ビットストリームはまた、例えばより多くのビットを使用して、より一般的なおよび/またはより正確な情報を含んでもよい。すなわち、以下を使用して分散フィルタの使用および/または構成を示す指示を有するビットストリームに関する実施形態である。
・分散フィルタ処理を有効または無効にすることを可能にするブール値フラグなどの情報
・初期反射音に対する分散フィルタ処理を有効または無効にするブール値フラグなどの情報
・回折音に対する分散フィルタ処理を有効または無効にするブール値フラグなどの情報
・分散フィルタの持続時間をシグナリングするためのパラメータ、例えば、ms単位で、典型的には0~100msまたは1000ms、などの情報
・分散フィルタ利得をシグナリングするためのパラメータなどの情報
・例えば、0度と±180度との間の、分散フィルタの空間的広がりをシグナリングするためのパラメータなどの情報
ビットストリームは、任意選択的に、揮発性または不揮発性メモリなどのデジタル記憶媒体に記憶されてもよい。
【0048】
本発明のいくつかの態様は、以下のように定式化されてもよい。
1.複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合するためのパンナー、例えば、仮想スピーカ処理とバイノーラル化との結合としての図5に関連し、パンニングのバージョンとしての図6のパンニングおよび/または図2のバイノーラル化と、
空間信号を受信し、フィルタリングされた空間信号のセットを取得するために空間信号を分散フィルタリングするための、例えば1つまたは複数の分散フィルタを有する分散フィルタ段と、
例えば、フィルタリングされた信号のさらなる処理のために、フィルタリングされた空間信号に基づいていくつかの出力信号を提供するためのインターフェース、例えば、図2または図5のDFの後のL/R、または図6のパンニングの出力と
を備える音処理装置。
2.入力信号は、初期反射信号および/または回折音信号を含む、態様1に記載の音処理装置。
【0049】
セクション DFの数とスピーカの数との関連付け
3.分散フィルタ段に含まれるいくつかの分散フィルタは、いくつかの出力信号に対応する、態様1または2に記載の音処理装置。
【0050】
セクション DFフィルタ
4.分散フィルタ段は、オールパスフィルタである少なくとも1つの分散フィルタを備える、先行する態様のいずれか1つに記載の音処理装置。
5.分散フィルタ段は、有限インパルス応答(FIR)フィルタおよび/または無限インパルス応答(IIR)フィルタである少なくとも1つの分散フィルタを備える、先行する態様のいずれか1つに記載の音処理装置。
6.分散フィルタ段の少なくとも1つの分散フィルタは、時変フィルタ特性を備える、先行する態様のいずれか1つに記載の音処理装置。
7.複数の入力信号を提供するためのレンダラを備える、先行する態様のいずれか1つに記載の音処理装置。
8.音処理装置は、直接音成分および反響音成分を提供するように構成される、態様7に記載の音処理装置。
9.分散フィルタ段は、空間信号のセットをフィルタリングするように構成され、音処理装置は、分散フィルタ段から直接音成分および反響音成分を排除するように構成される、態様8に記載の音処理装置。
10.分散フィルタ段の少なくとも1つの分散フィルタを、例えば初期化段階中に、生成するように構成された分散フィルタジェネレータを備える、先行する態様のいずれか1つに記載の音処理装置。
11.分散フィルタジェネレータは、
・分散フィルタによって提供される、例えば、窓の減衰時間に関連する、時間的な広がりの量を決定する長さ、
・例えば高レベル制御によって、チャネル間相互相関の程度を変化させるための空間的な広がり、および/または
・利得、
に基づいて少なくとも1つの分散フィルタを生成するように構成される、態様10に記載の音処理装置。
12.分散フィルタジェネレータは、第1の空間信号に対する第1の分散フィルタとして分散フィルタを生成するように構成され、音処理装置は、許容範囲内で同じエネルギーの、互いに異なる相関の程度を有する、記憶されたノイズ信号のセットを記憶したメモリを備え、
音処理装置は、ノイズ系列の基礎として記憶されたノイズ信号から選択するように構成される、態様10または11に記載の音処理装置。
13.
・ノイズ信号が同一のまたは弱く脱相関した系列であるという特性と、
・系列の長さを示す、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと、
・脱相関または空間的な広がりの強さを示す、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと、
・小さい前面開口を有する音源の両耳間相互相関(IACC)に関連する、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと
のうちの少なくとも1つに基づいてノイズ信号を取得するように構成される、態様12に記載の音処理装置。
14.分散フィルタジェネレータは、例えば両耳間相互相関(IACC)に基づいて取得される、周波数依存フィルタ脱相関を有する第1の分散フィルタおよび第2の分散フィルタを生成するように構成される、態様12または13に記載の音処理装置。
15.第1のノイズ系列および第2のノイズ系列は、等しいエネルギーレベルを備える、態様12~14のいずれか1つに記載の音処理装置。
16.分散フィルタ段の分散フィルタは、窓化ノイズ系列に基づく、先行する態様のいずれか1つに記載の音処理装置。
17.窓化ノイズ系列は、ホワイトノイズ系列に基づくか、またはそれに対応する、態様16に記載の音処理装置。
18.分散フィルタ段の分散フィルタは、第1の空間信号に対する第1の分散フィルタであり、第2の分散フィルタは、異なる第2の空間信号をフィルタリングするためのものであり、
第1の分散フィルタおよび第2の分散フィルタは、同一の窓化ノイズ系列に基づくか、または
第1の分散フィルタおよび第2の分散フィルタは、知覚基準に従う所定の相関を有する異なるノイズ系列に基づく、先行のいずれか1つに記載の音処理装置。
19.エネルギー保存的であり、フィルタ利得を考慮して調整可能である、先行する態様のいずれか1つに記載の音処理装置。
20.バイノーラル化された入力信号にのみ分散フィルタ段を用いて分散フィルタ処理を適用するように構成される、先行する態様のいずれか1つに記載の音処理装置。
21.分散フィルタ段は、第1の空間信号をフィルタリングするための第1の分散フィルタと、第2の空間信号をフィルタリングするための第2の分散フィルタとを少なくとも備え、第1の分散フィルタおよび第2の分散フィルタは、例えば両耳間相互相関(IACC)に基づいて取得される、周波数依存フィルタ脱相関を備える、先行する態様のいずれか1つに記載の音処理装置。
【0051】
セクション バイノーラル化
22.パンナーは、
複数のバイノーラル化段であって、各バイノーラル化段は、入力信号のうちの1つを受信するため、ならびに第1のバイノーラル化チャネルおよび第2のバイノーラル化チャネルを取得するために受信された入力信号をバイノーラル化するためのものである、複数のバイノーラル化段と、
バイノーラル化段の第1のバイノーラル化チャネルの第1の結合を提供し、第1の空間信号が第1の結合に基づき、バイノーラル化段の第2のバイノーラル化チャネルの第2の結合を提供し、第2の空間信号が第2の結合に基づくためのコンバイナと
を備える、先行する態様のいずれか1つに記載の音処理装置。
23.パンナーは、中間空間信号を取得するために入力信号を受信し処理するための仮想スピーカプロセッサと、
複数のバイノーラル化段であって、各バイノーラル化段は、中間空間信号のうちの1つを受信するため、ならびに第1のバイノーラル化チャネルおよび第2のバイノーラル化チャネルを取得するために受信された中間空間信号をバイノーラル化するためのものである、複数のバイノーラル化段と、
バイノーラル化段の第1のバイノーラル化チャネルの第1の結合を提供し、第1の空間信号が第1の結合に基づき、バイノーラル化段の第2のバイノーラル化チャネルの第2の結合を提供し、第2の空間信号が第2の結合に基づくためのコンバイナと
を備える、態様1~21のいずれか1つに記載の音処理装置。
24.バイノーラル化段は、頭部伝達関数(HRTF)に従って構成される、態様22または23に記載の音処理装置。
25.出力信号のためのちょうど2つのオーディオチャネルを提供するように構成される、態様22~24のいずれか1つに記載の音処理装置。
26.パンナーは、
少なくとも1つの初期反射信号および/または少なくとも1つの回折音信号を含む入力信号を受信し、
入力信号に関連付けられた直接音成分および反響音成分を受信する
ように構成され、空間信号は、スピーカ設備のスピーカに各々関連付けられる、態様1~21のいずれか1つに記載の音処理装置。
27.出力信号は、例えば左/右、L/Rなどのオーディオチャネルに各々関連付けられ、音処理装置は、複数の入力信号に関連付けられた直接音成分を処理するための直接音プロセッサを備え、
パンナーは、オーディオチャネルのうちの1つに各々関連する成分を取得するために、直接音成分を受信しバイノーラル化するための直接音バイノーラル化段をさらに備え、
音処理装置は、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネルに関連する信号を結合するためのコンバイナを備える、先行する態様のいずれか1つに記載の音処理装置。
28.出力信号は、オーディオチャネル、例えばL/R、に各々関連付けられ、音処理装置は、複数の入力信号に関連付けられた後期反響成分を処理するための反響プロセッサを備え、
パンナーは、オーディオチャネルのうちの1つに各々関連する成分を取得するために、後期反響成分を受信しバイノーラル化するための反響バイノーラル化段をさらに備え、
音処理装置は、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネルに関連する信号を結合するためのコンバイナを備える、先行する態様のいずれか1つに記載の音処理装置。
29.分散フィルタ段のちょうど2つの分散フィルタの使用によってすべての入力信号をフィルタリングするように構成される、先行する態様のいずれか1つに記載の音処理装置。
30.ちょうど2つの分散フィルタの数は、入力信号の数とは独立であり、および/または複数の入力信号を提供する音源の数とは独立である、態様29に記載の音処理装置。
31.音処理装置は、ビットストリームの一部として入力信号またはその基礎を受信し、ビットストリームの1つまたは複数のデータフィールドに基づいて分散フィルタ段を使用および/または構成するように構成され、1つまたは複数のデータフィールドは、分散フィルタの使用および/または構成の指示を含む、先行する態様のいずれか1つに記載の音処理装置。
32.オーディオ信号を表す情報を含むビットストリームを復号するためのデコーダであって、
先行する態様のいずれか1つに記載の音処理装置を備える、デコーダ。
33.オーディオ信号をビットストリームに符号化するためのエンコーダであって、
・分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
・初期反射音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・回折音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で、または0msと1000msとの間で示す情報と、
・分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
・分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの1つまたは複数を含むようにビットストリームを生成するように構成される、エンコーダ。
34.ビットストリームであって、
オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報と、
ビットストリームからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドと
を含む、ビットストリーム。
35.1つまたは複数のデータフィールド内の情報は、
・分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
・初期反射音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・回折音に対する分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
・分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で、または0msと1000msとの間で示す情報と、
・分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
・分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの少なくとも1つを示す、態様34に記載のビットストリーム。
36.音処理のための方法であって、
複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合することと、
フィルタリングされた空間信号のセットを取得するために空間信号を分散フィルタリングすることと、
フィルタリングされた空間信号に基づいて、いくつかの出力信号を提供することと
を含む、方法。
37.オーディオシーンを符号化するための方法であって、
オーディオシーンから、オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報を生成することと、
符号化されたオーディオシーンからからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドを提供することと
を含む、方法。
38.コンピュータまたは信号プロセッサ上で実行されるときに態様36または37に記載の方法を実施するためのコンピュータプログラム。
【0052】
図9は、一実施形態による方法900の概略フローチャートを示す。ステップ910は、複数の入力信号の空間的位置決めと、それらを少なくとも2つの空間信号へと結合することとを含む。ステップ920は、フィルタリングされた空間信号のセットを取得するために空間信号を分散フィルタリングすることを含む。ステップ930は、フィルタリングされた空間信号に基づいていくつかの出力信号を提供することを含む。方法900は、例えば、本明細書に記載の音処理装置のうちの1つを使用する音処理のために使用されてもよい。
【0053】
図10は、例えばエンコーダ70を使用して、例えばオーディオシーンを符号化するために使用され得る一実施形態による方法1000の概略フローチャートを示す。ステップ1010は、オーディオシーンから、オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報を生成することを含む。ステップ1020は、符号化されたオーディオシーンからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドを提供することを含む。
本発明に関連する実施形態の少なくともいくつかは、音響室シミュレーションおよび/またはレンダリングにおける初期反射の知覚される信憑性および快さを効率的に改善することを目的とする。この概念は、バイノーラル再生シナリオに関連して詳細に実装、試験、および説明されているが、他の形態のオーディオ再生に拡張することができる。
本明細書に記載の実施形態は、とりわけ、リアルタイム聴覚仮想環境および/またはリアルタイム仮想現実および拡張現実アプリケーションにおいて修正されてもよい。
【0054】
いくつかの態様を装置の文脈で説明したが、これらの態様は対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様はまた、対応する装置の対応するブロックまたは項目または特徴の説明を表す。
本発明の符号化されたオーディオ信号は、デジタル記憶媒体に記憶することができ、または無線伝送媒体などの伝送媒体またはインターネットなどの有線伝送媒体上で伝送することができる。
特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装することができる。実装は、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働することができる)、電子的に読み取り可能な制御信号が記憶されたデジタル記憶媒体、例えばフロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実行することができる。
本発明によるいくつかの実施形態は、本明細書に記載の方法のうちの1つが実行されるように、ビットストリームを有する、および/またはプログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0055】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法のうちの1つを実行するように動作する。プログラムコードは、例えば、機械可読キャリアに記憶されてもよい。
他の実施形態は、機械可読キャリアに記憶された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含む。
換言すれば、したがって、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを記録して含むデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号系列である。データストリームまたは信号系列は、例えば、データ通信接続を介して、例えばインターネットを介して転送されるように構成されてもよい。
【0056】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するように構成または適合された処理手段、例えばコンピュータまたはプログラマブル論理デバイスを含む。
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
いくつかの実施形態では、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ)を使用して、本明細書に記載の方法の機能の一部またはすべてを実行してもよい。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法のうちの1つを実行するためにマイクロプロセッサと協働してもよい。一般に、方法は、任意のハードウェア装置によって実行されることが好ましい。
上述の実施形態は、本発明の原理の単なる例示である。本明細書に記載の構成および詳細の修正および変形は、当業者には明らかであることが理解される。したがって、本明細書の実施形態の説明および説明として提示された特定の詳細によってではなく、添付の特許請求の範囲によってのみ限定されることが意図される。
【0057】
文献
[1]Allen,J.B.and D.A.Berkley,Image method for efficiently simulating small-room acoustics.J.Acoust.Soc.Am.,1979.65(4):p.943-950.
[2]Stephenson,U.,Comparison of the mirror image source method and the sound particle simulation method.,Applied Acoustics,1990.29(1):p.35..72,DOI:https://doi.org/10.1016/0003-682X(90)90070-B.
[3]Kulowski,A.,Algorithmic Representation of the Ray Tracing Technique.Applied Acoustics,1985.18:p.449-469.
[4]Funkouser,T.,A Beam Tracing Approach to Acoustic Modeling for Interactive Virtual Environments.1998.
[5]Gerzon,M.A.The Design of Distance Panpots,92nd AES Convention.1992.ウィーン,オーストリア.
[6]Moorer,J.A.,About This Reverberation Business,Computer Music Journal,1979.3(2):p.13-28.https://www.music.mcgill.ca/~gary/courses/papers/Moorer-Reverb-CMJ-1979.pdfから入手可能.
[7]Bors,C.,An Improved Parametric Model for the Design of Virtual Acoustics and its Applications,Fakultat fur Elektrotechnik,博士論文.2011:ルール大学ボーフム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
【手続補正書】
【提出日】2024-07-04
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の入力信号(14)を空間的に位置決めし、前記入力信号(14)を少なくとも2つの空間信号(16)へと結合するためのパンナー(12;12、12、12)と、
前記空間信号(16)を受信し、フィルタリングされた空間信号(22)のセットを取得するために前記空間信号(16)を分散フィルタリングするための分散フィルタ段(18)と、
前記フィルタリングされた空間信号(22)に基づいていくつかの出力信号(24)を提供するためのインターフェース(23)と
を備える音処理装置。
【請求項2】
前記入力信号(14)は、オーディオシーンの初期反射信号および/または回折音信号を含む、請求項1に記載の音処理装置。
【請求項3】
前記分散フィルタ段(18)に含まれるいくつかの分散フィルタ(38)は、前記いくつかの出力信号(24)に対応する、請求項に記載の音処理装置。
【請求項4】
前記分散フィルタ段(18)は、オールパスフィルタである少なくとも1つの分散フィルタを備える、請求項に記載の音処理装置。
【請求項5】
前記分散フィルタ段(18)は、有限インパルス応答(FIR)フィルタまたは無限インパルス応答(IIR)フィルタである少なくとも1つの分散フィルタを備える、請求項に記載の音処理装置。
【請求項6】
前記分散フィルタ段(18)の少なくとも1つの分散フィルタは、時変フィルタ特性を備える、請求項に記載の音処理装置。
【請求項7】
前記複数の入力信号(14)を提供するためのレンダラを備える、請求項に記載の音処理装置。
【請求項8】
前記音処理装置は、直接音成分(42)および反響音成分(46)を提供するように構成される、請求項7に記載の音処理装置。
【請求項9】
前記分散フィルタ段(18)は、前記空間信号(16)のセットをフィルタリングするように構成され、前記音処理装置は、前記分散フィルタ段(18)から前記直接音成分(42)および前記反響音成分(46)を排除するように構成される、請求項8に記載の音処理装置。
【請求項10】
前記分散フィルタ段(18)の少なくとも1つの分散フィルタ(38)を、例えば初期化段階中に、生成するように構成された分散フィルタジェネレータ(56)を備える、請求項に記載の音処理装置。
【請求項11】
前記分散フィルタジェネレータ(56)は、
前記分散フィルタによって提供される時間的な広がりの量を決定する長さ、
例えば高レベル制御によって、チャネル間相互相関の程度を変化させるための空間的な広がり、および/または
利得
に基づいて前記少なくとも1つの分散フィルタ(38)を生成するように構成される、請求項10に記載の音処理装置。
【請求項12】
前記分散フィルタジェネレータ(56)は、第1の空間信号(16)に対する第1の分散フィルタ(38)として前記分散フィルタ(38)を生成するように構成され、前記音処理装置は、許容範囲内で同じエネルギーの、互いに異なる相関の程度を有する、記憶されたノイズ信号のセットを記憶したメモリを備え、
前記音処理装置は、ノイズ系列の基礎として前記記憶されたノイズ信号から選択するように構成される、請求項10に記載の音処理装置。
【請求項13】
前記ノイズ信号が同一のまたは弱く脱相関した系列であるという特性と、
前記系列の長さを示す、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと、
脱相関または空間的な広がりの強さを示す、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと、
小さい前面開口を有する音源の両耳間相互相関(IACC)に関連する、例えばビットストリーム内のビットストリームパラメータとして受信される、パラメータと
のうちの少なくとも1つに基づいて前記ノイズ信号を取得するように構成される、請求項12に記載の音処理装置。
【請求項14】
前記分散フィルタジェネレータ(56)は、前記第1の分散フィルタ(38)と、例えば両耳間相互相関(IACC)に基づいて取得される、周波数依存フィルタ脱相関を有する第2の分散フィルタ(38)とを生成するように構成される、請求項12に記載の音処理装置。
【請求項15】
第1のノイズ系列および第2のノイズ系列は、等しいエネルギーレベルを備える、請求項12に記載の音処理装置。
【請求項16】
前記分散フィルタ段(18)の分散フィルタ(38)は、窓化ノイズ系列に基づく、請求項に記載の音処理装置。
【請求項17】
前記窓化ノイズ系列は、ホワイトノイズ系列に基づくか、または対応する、請求項16に記載の音処理装置。
【請求項18】
前記分散フィルタ段(18)の分散フィルタは、第1の空間信号(16)に対する第1の分散フィルタであり、第2の分散フィルタは、異なる第2の空間信号(16)をフィルタリングするためのものであり、
第1の分散フィルタ(38)および第2の分散フィルタ(38)は、同一の窓化ノイズ系列に基づくか、または
前記第1の分散フィルタ(38)および前記第2の分散フィルタ(38)は、知覚基準に従う所定の相関を有する異なるノイズ系列に基づく、請求項に記載の音処理装置。
【請求項19】
エネルギー保存的であり、フィルタ利得を考慮して調整可能である、請求項に記載の音処理装置。
【請求項20】
バイノーラル化された入力信号(14)にのみ前記分散フィルタ段(18)を用いて分散フィルタ処理を適用するように構成される、請求項に記載の音処理装置。
【請求項21】
前記分散フィルタ段(18)は、第1の空間信号(16)をフィルタリングするための第1の分散フィルタ(38)と、第2の空間信号(16)をフィルタリングするための第2の分散フィルタ(38)とを少なくとも備え、前記第1の分散フィルタ(38)および前記第2の分散フィルタ(38)は、例えば両耳間相互相関(IACC)に基づいて取得される、周波数依存フィルタ脱相関を備える、請求項に記載の音処理装置。
【請求項22】
前記パンナーは、
複数のバイノーラル化段(26)であって、各バイノーラル化段(26)は、前記入力信号(14)のうちの1つを受信するため、ならびに第1のバイノーラル化チャネルおよび第2のバイノーラル化チャネルを取得するために前記受信された入力信号をバイノーラル化するためのものである、複数のバイノーラル化段(26)と、
前記バイノーラル化段(26)の前記第1のバイノーラル化チャネルの第1の結合を提供し、前記バイノーラル化段(26)の前記第2のバイノーラル化チャネルの第2の結合を提供するコンバイナ(32)と、を備え、
第1の空間信号(16)が前記第1の結合に基づき、
第2の空間信号(16)が前記第2の結合に基づく、
請求項に記載の音処理装置。
【請求項23】
前記パンナー(12)は、中間空間信号(66)を取得するために前記入力信号(14)を受信し処理するための仮想スピーカプロセッサ(64)と、
複数のバイノーラル化段(26)であって、各バイノーラル化段(26)は、前記中間空間信号(66)のうちの1つを受信するため、ならびに第1のバイノーラル化チャネルおよび第2のバイノーラル化チャネルを取得するために前記受信された中間空間信号(66)をバイノーラル化するためのものである、複数のバイノーラル化段(26)と、
前記バイノーラル化段(26)の前記第1のバイノーラル化チャネルの第1の結合を提供し、前記バイノーラル化段(26)の前記第2のバイノーラル化チャネルの第2の結合を提供するコンバイナ(32)と
第1の空間信号(16)が前記第1の結合に基づき、
第2の空間信号(16)が前記第2の結合に基づく
請求項に記載の音処理装置。
【請求項24】
前記バイノーラル化段(26)は、頭部伝達関数(HRTF)に従って構成される、請求項22に記載の音処理装置。
【請求項25】
前記出力信号(24)のためのちょうど2つのオーディオチャネル(L、R)を提供するように構成される、請求項22に記載の音処理装置。
【請求項26】
前記パンナー(12)は、
少なくとも1つの初期反射信号および/または少なくとも1つの回折音信号を含む前記入力信号(14)を受信し、
前記入力信号(14)に関連付けられた直接音成分(42)および反響音成分(46)を受信する
ように構成され、前記空間信号(16)は、スピーカ設備のスピーカ(68)に各々関連付けられる、請求項に記載の音処理装置。
【請求項27】
前記出力信号(24)は、オーディオチャネル(L、R)、例えばL/R、に各々関連付けられ、前記音処理装置は、前記複数の入力信号(14)に関連付けられた直接音成分(42)を処理するための直接音プロセッサ(1006)を備え、
前記パンナーは、前記オーディオチャネル(L、R)のうちの1つに各々関連する成分を取得するために、前記直接音成分(42)を受信しバイノーラル化するための直接音バイノーラル化段(26)をさらに備え、
前記音処理装置は、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネル(L、R)に関連する信号を結合するためのコンバイナを備える、請求項に記載の音処理装置。
【請求項28】
前記出力信号(24)は、オーディオチャネル(L、R)、例えばL/R、に各々関連付けられ、前記音処理装置は、前記複数の入力信号(14)に関連付けられた後期反響成分(46)を処理するための反響プロセッサ(1008)を備え、
前記パンナーは、前記オーディオチャネル(L、R)のうちの1つに各々関連する成分を取得するために、前記後期反響成分を受信しバイノーラル化するための反響バイノーラル化段(26)をさらに備え、
前記音処理装置は、第1のオーディオ信号および第2のオーディオ信号を取得するために、同じオーディオチャネルに関連する信号を結合するためのコンバイナを備える、請求項に記載の音処理装置。
【請求項29】
すべての入力信号(14)から取得した前記空間信号(16)をフィルタリングするための前記分散フィルタ段(18)のちょうど2つの分散フィルタ(38、38)の使用によってすべての入力信号(14)をフィルタリングするように構成される、請求項に記載の音処理装置。
【請求項30】
前記ちょうど2つの分散フィルタ(38、38)の数は、入力信号(14)の数とは独立であり、および/または前記複数の入力信号(14)を提供する音源の数とは独立である、請求項29に記載の音処理装置。
【請求項31】
前記音処理装置は、ビットストリーム(74;78)の一部として前記入力信号(14)またはその基礎を受信し、前記ビットストリームの1つまたは複数のデータフィールドに基づいて前記分散フィルタ段(18)を使用および/または構成するように構成され、前記1つまたは複数のデータフィールドは、前記分散フィルタ段(18)の使用および/または構成の指示を含む、請求項に記載の音処理装置。
【請求項32】
オーディオ信号を表す情報を含むビットストリーム(78)を復号するためのデコーダ(80)であって、
請求項に記載の音処理装置(10)を備える、デコーダ(80)。
【請求項33】
オーディオ信号(72)をビットストリーム(74)に符号化するためのエンコーダ(70)であって、
分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
初期反射音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
回折音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
前記分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で示す情報と、
分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
前記分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの1つまたは複数を含むように前記ビットストリーム(74)を生成するように構成される、エンコーダ(70)。
【請求項34】
ビットストリーム(74;78)であって、
オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報と、
前記ビットストリームからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドと
を含む、ビットストリーム(74;78)。
【請求項35】
前記1つまたは複数のデータフィールド内の前記情報は、
分散フィルタ処理を有効または無効にすることを可能にする情報、例えばブール値フラグと、
初期反射音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
回折音に対する前記分散フィルタ処理を有効または無効にする情報、例えばブール値フラグと、
前記分散フィルタ処理に使用される分散フィルタの持続時間をシグナリングするためのパラメータを、例えばms単位で、例として0msと100msとの間で示す情報と、
分散フィルタ利得をシグナリングするためのパラメータを示す情報と、
前記分散フィルタの空間的な広がりをシグナリングするためのパラメータを、例えば0度と±180度との間で示す情報と
のうちの少なくとも1つを示す、請求項34に記載のビットストリーム。
【請求項36】
音処理のための方法(900)であって、
複数の入力信号を空間的に位置決めし、それらを少なくとも2つの空間信号へと結合すること(910)と、
フィルタリングされた空間信号のセットを取得するために前記空間信号を分散フィルタリングすること(920)と、
前記フィルタリングされた空間信号に基づいて、いくつかの出力信号を提供すること(930)と
を含む、方法(900)。
【請求項37】
オーディオシーンを符号化するための方法(1000)であって、
前記オーディオシーンから、前記オーディオシーンの少なくとも1つの空間的に位置決めされた入力信号を示す情報を生成すること(1010)と、
前記符号化されたオーディオシーンからオーディオ信号を生成するための分散フィルタの使用および/または構成の指示を含む情報を含む1つまたは複数のデータフィールドを提供すること(1020)と
を含む、方法(1000)。
【請求項38】
コンピュータまたは信号プロセッサ上で実行されるときに請求項36または37に記載の方法を実施するためのコンピュータプログラム。
【国際調査報告】