特許第6130507号(P6130507)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオの特許一覧

特許6130507帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置および方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6130507
(24)【登録日】2017年4月21日
(45)【発行日】2017年5月17日
(54)【発明の名称】帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置および方法
(51)【国際特許分類】
   G10L 21/0388 20130101AFI20170508BHJP
   G10L 19/02 20130101ALI20170508BHJP
【FI】
   G10L21/0388 100
   G10L19/02 150
【請求項の数】16
【全頁数】33
(21)【出願番号】特願2015-531548(P2015-531548)
(86)(22)【出願日】2013年9月11日
(65)【公表番号】特表2015-534112(P2015-534112A)
(43)【公表日】2015年11月26日
(86)【国際出願番号】EP2013068808
(87)【国際公開番号】WO2014041020
(87)【国際公開日】20140320
【審査請求日】2015年5月8日
(31)【優先権主張番号】12184706.5
(32)【優先日】2012年9月17日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】591037214
【氏名又は名称】フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】100079577
【弁理士】
【氏名又は名称】岡田 全啓
(74)【代理人】
【識別番号】100167966
【弁理士】
【氏名又は名称】扇谷 一
(72)【発明者】
【氏名】ナーゲル フレドリック
(72)【発明者】
【氏名】ヴィルデ シュテファン
【審査官】 安田 勇太
(56)【参考文献】
【文献】 国際公開第2011/155170(WO,A1)
【文献】 米国特許出願公開第2010/0094638(US,A1)
【文献】 Frederik Nagel et al.,A HARMONIC BANDWIDTH EXTENSION METHOD FOR AUDIO CODECS,ICASSP 2009,2009年 1月,PP. 145-148
【文献】 則松 武志,音声と楽音を統合した音響信号符号化,日本音響学会誌,2012年 3月 1日,第68巻,第3号,PP.123−128
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/0388
G10L 19/00 −19/26
(57)【特許請求の範囲】
【請求項1】
帯域幅制限されたオーディオ信号(105)から帯域幅拡張された信号(135)を生成するための装置(100)であって、前記帯域幅制限されたオーディオ信号(105)は、複数の連続した帯域幅制限された時間ブロック(511)を含み、それぞれの帯域幅制限された時間ブロックは、コア周波数帯域を含む少なくとも1つの関連したスペクトルバンド複製パラメータ(121)を有し、さらに、前記帯域幅拡張された信号(135)は、複数の連続した帯域幅拡張された時間ブロック(513)を含み、前記装置(100)は、
前記帯域幅制限されたオーディオ信号(105)の帯域幅制限された時間ブロックを用いて、高域周波数帯域を含むパッチされた信号(115)を生成するためのパッチジェネレータ(110)、
前記パッチジェネレータ(110)は、前記パッチされた信号(115)を得るためにハーモニックパッチングアルゴリズム(515)を実行するように構成され、
前記パッチジェネレータ(110)は、前記帯域幅制限されたオーディオ信号(105)の前記複数の連続した帯域幅制限された時間ブロック(511)の時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて、前記複数の連続した帯域幅拡張された時間ブロック(513)の現在の帯域幅拡張された時間ブロック(m’)について前記ハーモニックパッチングアルゴリズム(515)を実行するように構成され、
前記高域周波数帯域を含む操作されたパッチされた信号(125)を得るために、現在の帯域幅制限された時間ブロック(m)に関連するスペクトルバンド複製パラメータ(121)を用いて、パッチング前の前記時間的に先行する帯域幅制限された時間ブロック(m−1)、または、前記時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて生成される前記パッチされた信号(115)を操作するための信号操作器(120)、
前記時間的に先行する帯域幅制限された時間ブロック(m−1)は、前記帯域幅制限されたオーディオ信号(105)の前記複数の連続した帯域幅制限された時間ブロック(511)において前記現在の帯域幅制限された時間ブロック(m)に時間的に先行し、および
前記帯域幅拡張された信号(135)を得るために、前記コア周波数帯域を含む前記帯域幅制限されたオーディオ信号(105)および前記高域周波数帯域を含む前記操作されたパッチされた信号(125)を結合するためのコンバイナ(130)を含む、装置。
【請求項2】
前記パッチジェネレータ(110)は、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ加算処理を用いて、前記ハーモニックパッチングアルゴリズム(515)を実行するように構成される、請求項1に記載の装置(100)。
【請求項3】
前記パッチジェネレータ(110)は、帯域幅拡張ファクタ(σ1)用いて、前記ハーモニックパッチングアルゴリズム(515)を前記時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成され、前記帯域幅拡張ファクタ(σ1)は、値が2であり、
前記パッチジェネレータ(110)は、前記時間的に先行する帯域幅制限された時間ブロック(m−1)の前記コア周波数帯域(505)から前記現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域(507)を生成するように構成され、さらに
前記パッチジェネレータ(110)は、前記時間的に先行する帯域幅制限された時間ブロック(m−1)の前記コア周波数帯域(505)から生成される前記現在の帯域幅拡張された時間ブロック(m’)の前記第1の目標周波数帯域(507)を前記現在の帯域幅拡張された時間ブロック(m’)の第2の目標周波数帯域(509)にコピーアップするためのコピーアップパッチングアルゴリズム(525)を適用するように構成される、請求項1または請求項2に記載の装置(100)。
【請求項4】
前記パッチジェネレータ(110)は、帯域幅拡張ファクタ(σ1)を用いて、前記ハーモニックパッチングアルゴリズム(515)を前記時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成され、前記帯域幅拡張ファクタ(σ1)は、値が2であり、
前記パッチジェネレータ(110)は、前記時間的に先行する帯域幅制限された時間ブロック(m−1)の前記コア周波数帯域(505)から前記現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域(507)を生成するように構成され、
前記パッチジェネレータジェネレータ(110)は、帯域幅拡張ファクタ(σ2)を用いて、前記ハーモニックパッチングアルゴリズム(825)を前記時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成され、前記帯域幅拡張ファクタ(σ2)は、値が3であり、さらに
前記パッチジェネレータ(110)は、前記時間的に先行する帯域幅制限された時間ブロック(m−1)の前記コア周波数帯域(505)から前記現在の帯域幅拡張された時間ブロック(m’)の第2の目標周波数帯域(509)を生成するように構成される、請求項1ないし請求項3のうちの1つに記載の装置(100)。
【請求項5】
前記パッチジェネレータ(110)は、前記ハーモニックパッチングアルゴリズム(515)を前記帯域幅制限されたオーディオ信号(105)のそれぞれの帯域幅制限された時間ブロックに連続的に適用するように構成される、請求項1ないし請求項4のうちの1つに記載の装置(100)。
【請求項6】
パッチングアルゴリズム情報(911)を提供するためのプロバイダ(910)をさらに含み、
前記パッチジェネレータ(110)は、前記時間的に先行する帯域幅拡張された時間ブロックについては、前記時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて、または時間的に後続する帯域幅拡張された時間ブロックについては、時間的に後続する帯域幅制限された時間ブロック(m+1)を用いて、コピーアップパッチングアルゴリズム(925)を実行するように構成され、前記時間的に後続する帯域幅制限された時間ブロック(m+1)は、前記現在の帯域幅制限された時間ブロック(m)に時間的に後続し、
前記パッチジェネレータ(110)は、前記パッチングアルゴリズム情報(911)に応じて、前記ハーモニックパッチングアルゴリズム(515)から生成される前記現在の帯域幅拡張された時間ブロック(m’)のために前記パッチされた信号(115)を用いるように構成される、請求項1ないし請求項5のうちの1つに記載の装置(100)。
【請求項7】
前記プロバイダ(910)は、前記帯域幅制限されたオーディオ信号(105)内で符号化されるサイド情報(111)を用いて、前記パッチングアルゴリズム情報(911)を提供するように構成される、請求項6に記載の装置(100)。
【請求項8】
前記プロバイダ(910)は、前記帯域幅制限されたオーディオ信号(105)の信号分析に依存して、前記パッチングアルゴリズム情報(911)を提供するように構成される、請求項6に記載の装置(100)。
【請求項9】
前記プロバイダ(910)は、前記帯域幅制限されたオーディオ信号(105)の帯域幅制限された時間ブロックごとにトランジェントフラグ(915)を決定するように構成され、
前記パッチジェネレータ(110)は、前記帯域幅制限されたオーディオ信号(105)の定常性が前記トランジェントフラグ(915)によって示されるときに、前記ハーモニックパッチングアルゴリズム(515)から生成される前記現在の帯域幅拡張された時間ブロック(m’)について前記パッチされた信号(115)を用いるように構成され、さらに
前記パッチジェネレータ(110)は、前記帯域幅制限されたオーディオ信号(105)の非定常性が前記トランジェントフラグ(915)によって示されるときに、前記コピーアップパッチングアルゴリズム(925)から生成される前記パッチされた信号(115)を用いるように構成される、請求項7または請求項8に記載の装置(100)。
【請求項10】
前記パッチジェネレータ(110)は、前記時間的に先行する帯域幅制限された時間ブロック(m−1)および前記現在の帯域幅拡張された時間ブロック(m’)間で第1の時間遅延(1010)を含む前記ハーモニックパッチングアルゴリズム(515)を実行するように構成され、
前記パッチジェネレータ(110)は、前記現在の帯域幅制限された時間ブロック(m)を用いて、コピーアップパッチングアルゴリズム(925)を実行するように構成され、前記コピーアップパッチングアルゴリズム(925)は、第2の時間遅延(1020)を含み、
前記ハーモニックパッチングアルゴリズム(515)の前記第1の遅延(1010)は、前記コピーアップパッチングアルゴリズム(925)の前記第2の時間遅延(1020)よりも大きい、請求項1ないし請求項9のうちの1つに記載の装置(100)。
【請求項11】
前記パッチジェネレータ(110)は、前記第1の時間遅延(1010)を含む前記ハーモニックパッチングアルゴリズム(515)を実行するためのフェーズボコーダを含み、さらに
前記フェーズボコーダは、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ追加処理を用いるように構成される、請求項10に記載の装置(100)。
【請求項12】
前記帯域幅制限されたオーディオ信号(105)においてトランジェントイベント(1105)を検出するためのトランジェント検出器をさらに含み、
前記パッチジェネレータ(110)は、前記トランジェントイベント(1105)が前記帯域幅制限されたオーディオ信号(105)において検出されるときに、コピーアップパッチングアルゴリズム(1025)を実行するように構成され、さらに
前記パッチジェネレータ(110)は、前記トランジェントイベント(1105)が前記帯域幅制限されたオーディオ信号(105)において検出されるときに、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ加算処理を用いて、前記ハーモニックパッチングアルゴリズム(515)を実行しないように構成される、請求項1ないし請求項11のうちの1つに記載の装置(100)。
【請求項13】
前記パッチジェネレータ(110)は、コピーアップパッチングアルゴリズム(1025)を実行するように構成され、さらに
前記パッチジェネレータ(110)は、前記ハーモニックパッチングアルゴリズム(515)から生成される前記現在の帯域幅拡張された時間ブロック(m’)と前記コピーアップパッチングアルゴリズム(1025)から生成される時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)との間で位相連続(1210)を実行するように構成され、前記時間的に先行する帯域幅拡張された時間ブロック(m’−1)は、前記現在の帯域幅拡張された時間ブロック(m’)に時間的に先行し、さらに、前記時間的に後続する帯域幅拡張された時間ブロック(m’+1)は、前記現在の帯域幅拡張された時間ブロック(m’)に時間的に後続する、請求項1ないし請求項12のうちの1つに記載の装置(100)。
【請求項14】
前記パッチジェネレータ(110)は、コピーアップパッチングアルゴリズム(1025)を実行するように構成され、
前記パッチジェネレータ(110)は、前記ハーモニックパッチングアルゴリズム(515)から生成される前記現在の帯域幅拡張された時間ブロック(m’)と前記コピーアップパッチングアルゴリズム(1025)から生成される時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)との間でクロスフェードオペレーション(1210)を実行するように構成され、前記時間的に先行する帯域幅拡張された時間ブロック(m’−1)は、前記現在の帯域幅拡張された時間ブロック(m’)に時間的に先行し、さらに、前記時間的に後続する帯域幅拡張された時間ブロック(m’+1)は、前記現在の帯域幅拡張された時間ブロック(m’)に時間的に後続し、さらに
前記現在の帯域幅拡張された時間ブロック(m’)と、前記時間的に先行する帯域幅拡張された時間ブロック(m’−1)または前記時間的に後続する帯域幅拡張された時間ブロック(m’+1)とは、その遷移領域(1217)において少なくとも部分的にオーバーラップする、請求項1ないし請求項13のうちの1つに記載の装置(100)。
【請求項15】
帯域幅制限されたオーディオ信号(105)から帯域幅拡張された信号(135)を生成するための方法(100)であって、前記帯域幅制限されたオーディオ信号(105)は、複数の連続した帯域幅制限された時間ブロック(511)を含み、それぞれの帯域幅制限された時間ブロックは、コア周波数帯域を含む少なくとも1つの関連したスペクトルバンド複製パラメータを有し、さらに、前記帯域幅拡張された信号(135)は、複数の連続した帯域幅拡張された時間ブロック(513)を含み、前記方法(100)は、
前記帯域幅制限されたオーディオ信号(105)の帯域幅制限された時間ブロックを用いて、高域周波数帯域を含むパッチされた信号(115)を生成するステップ(110)、
前記パッチされた信号(115)を得るためにハーモニックパッチングアルゴリズムを実行するステップ(110)、
前記帯域幅制限されたオーディオ信号(105)の前記複数の連続した帯域幅制限された時間ブロック(511)の時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて、前記複数の連続した帯域幅拡張された時間ブロック(513)の現在の帯域幅拡張された時間ブロック(m’)について前記ハーモニックパッチングアルゴリズムを実行するステップ(110)、
前記高域周波数帯域を含む操作されたパッチされた信号(125)を得るために、現在の帯域幅制限された時間ブロック(m)に関連するスペクトルバンド複製パラメータ(121)用いて、パッチング前の前記時間的に先行する帯域幅制限された時間ブロック(m−1)、または、前記時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて生成される前記パッチされた信号(115)を操作するステップ(120)、
前記時間的に先行する帯域幅制限された時間ブロック(m−1)は、前記帯域幅制限されたオーディオ信号(105)の前記複数の連続した帯域幅制限された時間ブロック(511)において前記現在の帯域幅制限された時間ブロック(m)に時間的に先行し、および
前記帯域幅拡張された信号(135)を得るために、前記コア周波数帯域を含む前記帯域幅制限されたオーディオ信号(105)および前記高域周波数帯域を含む前記操作されたパッチされた信号(125)を結合するステップ(130)を含む、方法。
【請求項16】
コンピュータプログラムがコンピュータ上で実行されるときに、請求項15に記載の方法(100)を実行するためのプログラムコードを有するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号処理に関し、特に、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置および方法に関する。
【背景技術】
【0002】
オーディオ信号の記憶または伝送は、しばしば厳しいビットレートの制約を受ける。過去において、コーダは、非常に低いビットレートしか利用できないときに、送信されたオーディオ帯域幅を大幅に低減することを余儀なくされた。今日では、現代のオーディオコーダは、
M. Dietz, L. Liljeryd, K. Kjoerling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002(非特許文献1)、
S. Meltzer, R. Boehm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," in 112th AES Convention, Munich, May 2002(非特許文献2)、
T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," in 112th AES Convention, Munich, May 2002(非特許文献3)、
International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002. Speech bandwidth extension method and apparatus, Vasu Iyengar et al.(非特許文献4)、
E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002(非特許文献5)、
R. M. Aarts, E. Larsen, and O. Ouweltjes. A unified approach to low- and high frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003(非特許文献6)、
K. Kayhko. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001(非特許文献7)、
E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004(非特許文献8)、
E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002(非特許文献9)、
J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973(非特許文献10)、
米国特許出願第08/951029号 Ohmori , et al., Audio band width extending system and method(特許文献1)、および
米国特許第6895375号 Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech(特許文献2)
に記載されるような帯域幅拡張(BWE)方法を用いることによって広帯域信号を符号化することができる。これらのアルゴリズムは、高周波数成分(HF)のパラメータ表現に依存し、それは、復号化された信号の低周波数部分(LF)から、HFスペクトル領域への転置(「パッチング」)およびパラメータ駆動型後処理の適用によって生成される。LF部分は、あらゆるオーディオまたはスピーチコーダで符号化される。例えば、
M. Dietz, L. Liljeryd, K. Kjoerling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002(非特許文献1)、
S. Meltzer, R. Boehm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," in 112th AES Convention, Munich, May 2002(非特許文献2)、
T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," in 112th AES Convention, Munich, May 2002(非特許文献3)、および
International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002. Speech bandwidth extension method and apparatus, Vasu Iyengar et al.(非特許文献4)
に記載される帯域幅拡張方法は、単側波帯変調(SSB)に依存し、複数のHFパッチを生成するために、しばしば「コピーアップ」方法とも呼ばれる。
【0003】
最近、異なるパッチの生成のために、
M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995(非特許文献11)、
Roebel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html(非特許文献12)、
Laroche L., Dolson M.: "Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332(非特許文献13)、および
米国特許第6549884号 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting(特許文献3)
に記載されるようなフェーズボコーダのバンクを用いる新しいアルゴリズムが、
Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009(非特許文献14)
に記載されるように提示されている。この方法は、SSB帯域幅拡張を受ける信号においてしばしば観察される聴覚粗さを回避するために開発されている。多くの音の信号のために有益であるが、「ハーモニック帯域幅拡張」(HBE)と呼ばれるこの方法は、サブバンドにわたる垂直コヒーレンスが、標準フェーズボコーダアルゴリズムにおいて保存されることが保証されなく、さらに、位相の再計算が、変換の、または代わりにフィルタバンクの、時間ブロックにおいて実行されなければならないので、
Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, "A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs," 126th AES Convention , Munich, Germany, May 2009(非特許文献15)
に記載されるようなオーディオ信号に含まれるトランジェントを品質劣化する傾向がある。したがって、必要性は、トランジェントを含む信号部分のための特別な処理のために生じる。さらに、HBEアルゴリズムにおいて適用されるオーバーラップ加算ベースのフェーズボコーダは、通信目的のために設計されるアプリケーション用に受け入れられるには大きすぎるさらなる遅延を生じる。
【0004】
上述のように、既存の帯域幅拡張スキームは、一度に所定の信号ブロックに1つのパッチング方法を適用することができ、それは、
M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995(非特許文献11)、
Roebel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html(非特許文献12)、
Laroche L., Dolson M.: "Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332(非特許文献13)、および
米国特許第6549884号 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting(特許文献3)
に記載されるようなフェーズボコーダ技術に基づいて、
M. Dietz, L. Liljeryd, K. Kjoerling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002(非特許文献1)、
S. Meltzer, R. Boehm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," in 112th AES Convention, Munich, May 2002(非特許文献2)、
T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," in 112th AES Convention, Munich, May 2002(非特許文献3)、および
International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002. Speech bandwidth extension method and apparatus, Vasu Iyengar et al.(非特許文献4)
に記載されるようなSSBベースのパッチングであってもよく、または、
Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," in ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009(非特許文献14)
に説明されるHBEボコーダベースのパッチングであってもよい。
【0005】
あるいは、米国特許仮出願第61/312,127号(特許文献4)に記載されるように、HBEおよびSSBベースのパッチングの結合を用いることができる。さらに、
Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jeremie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates, ICASSP 2009, April 19-24, 2009, Taipei, Taiwan(非特許文献16)、および
Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jeremie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126th AES Convention, May 7, 2009, Munich(非特許文献17)
に記載されるような現代のオーディオコーダが、パッチング方法を代替パッチングスキーム間で時間ブロックベースにグローバルに切り替える可能性を提供する。
【0006】
従来のSSBコピーアップパッチングは、それが不必要な粗さをオーディオ信号にもたらすという不利な点を有する。しかしながら、それは、計算的に単純であり、さらに、トランジェントの時間エンベロープを保存する。
【0007】
HBEパッチングを用いるオーディオコーダにおいて、不利な点は、トランジェント再生品質がしばしば次善であるということである。さらに、計算の複雑性は、計算の非常に単純なSSBコピーアップ方法よりも著しく増加する。さらに、HBEパッチングは、通信シナリオにおいてアプリケーションのために、受け入れられる範囲を超えるさらなるアルゴリズムの遅延をもたらす。
【0008】
最新の処理のさらなる不利な点は、1つの時間ブロック内のHBEおよびSSBベースのパッチングの結合がHBEによって生じるさらなる遅延を排除しないということである。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許出願第08/951029号 Ohmori , et al., Audio band width extending system and method
【特許文献2】米国特許第6895375号 Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech
【特許文献3】米国特許第6549884号 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting
【特許文献4】米国特許仮出願第61/312,127号
【非特許文献】
【0010】
【非特許文献1】M. Dietz, L. Liljeryd, K. Kjoerling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002
【非特許文献2】S. Meltzer, R. Boehm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," in 112th AES Convention, Munich, May 2002
【非特許文献3】T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," in 112th AES Convention, Munich, May 2002
【非特許文献4】International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002. Speech bandwidth extension method and apparatus, Vasu Iyengar et al.
【非特許文献5】E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002
【非特許文献6】R. M. Aarts, E. Larsen, and O. Ouweltjes. A unified approach to low- and high frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003
【非特許文献7】K. Kayhko. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001
【非特許文献8】E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004
【非特許文献9】E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002
【非特許文献10】J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973
【非特許文献11】M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995
【非特許文献12】Roebel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html
【非特許文献13】Laroche L., Dolson M.: "Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332
【非特許文献14】Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009
【非特許文献15】Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, "A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs," 126th AES Convention , Munich, Germany, May 2009
【非特許文献16】Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jeremie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates, ICASSP 2009, April 19-24, 2009, Taipei, Taiwan
【非特許文献17】Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jeremie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126th AES Convention, May 7, 2009, Munich
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明の目的は、そのような不利な点を回避する改良された知覚的な品質を可能にする、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための概念を提供することである。
【課題を解決するための手段】
【0012】
この目的は、請求項1に記載の装置および請求項15に記載の方法によって達成される。
【0013】
本発明の実施形態によれば、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置は、パッチジェネレータ、信号操作器およびコンバイナを含む。帯域幅制限されたオーディオ信号は、複数の連続した帯域幅制限された時間ブロックを含み、それぞれの帯域幅制限された時間ブロックは、コア周波数帯域を含む少なくとも1つの関連したスペクトルバンド複製パラメータを有する。帯域幅拡張された信号は、複数の連続した帯域幅拡張された時間ブロックを含む。パッチジェネレータは、帯域幅制限されたオーディオ信号の帯域幅制限された時間ブロックを用いて、高域周波数帯域を含むパッチされた信号を生成するように構成される。パッチジェネレータは、パッチされた信号を得るためにハーモニックパッチングアルゴリズムを実行するように構成される。パッチジェネレータは、帯域幅制限されたオーディオ信号の複数の連続した帯域幅制限された時間ブロックの時間的に先行する帯域幅制限された時間ブロックを用いて、複数の連続した帯域幅拡張された時間ブロックの現在の帯域幅拡張された時間ブロックのためにハーモニックパッチングアルゴリズムを実行するように構成される。信号操作器は、高域周波数帯域を含む操作されたパッチされた信号を得るために、現在の帯域幅制限された時間ブロックに関連するスペクトルバンド複製パラメータを用いて、パッチング前の信号、または、時間的に先行する帯域幅制限された時間ブロックを用いて生成されるパッチされた信号を操作するように構成される。時間的に先行する帯域幅制限された時間ブロックは、帯域幅制限されたオーディオ信号の複数の連続した帯域幅制限された時間ブロックにおいて現在の帯域幅制限された時間ブロックに時間的に先行する。コンバイナは、帯域幅拡張された信号を得るために、コア周波数帯域を含む帯域幅制限されたオーディオ信号および高域周波数帯域を含む操作されたパッチされた信号を結合するように構成される。
【0014】
本発明の基礎となる基本的な考えは、高域周波数帯域を含むパッチされた信号が、帯域幅制限されたオーディオ信号の帯域幅制限された時間ブロックを用いて生成され、ハーモニックパッチングアルゴリズムが、パッチされた信号を得るために実行され、ハーモニックパッチングアルゴリズムが、帯域幅制限されたオーディオ信号の複数の連続した帯域幅制限された時間ブロックの時間的に先行する帯域幅制限された時間ブロックを用いて、複数の連続した帯域幅拡張された時間ブロックの現在の帯域幅拡張された時間ブロックのために実行され、さらに、パッチング前の信号またはパッチされた信号が、高域周波数帯域を含む操作されたパッチされた信号を得るために、現在の帯域幅制限された時間ブロックに関連するスペクトルバンド複製パラメータを用いて操作される場合、今述べた改良された知覚的な品質を達成することができるということであり、時間的に先行する帯域幅制限された時間ブロックは、帯域幅制限されたオーディオ信号の複数の連続した帯域幅制限された時間ブロックにおいて現在の帯域幅制限された時間ブロックに時間的に先行する。このようにして、帯域幅拡張された信号においてHBEアルゴリズムによって生じるさらなる遅延の悪影響を回避することが可能である。したがって、帯域幅拡張された信号の知覚的な品質を著しく改善することができる。
【0015】
実施形態によれば、パッチジェネレータは、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ加算処理を用いて、ハーモニックパッチングアルゴリズムを実行するように構成される。オーバーラップ加算処理を用いることによって、さらなる遅延がハーモニックパッチングアルゴリズムにもたらされる。
【0016】
実施形態によれば、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための方法であって、帯域幅制限されたオーディオ信号は、複数の連続した帯域幅制限された時間ブロックを含み、それぞれの帯域幅制限された時間ブロックは、コア周波数帯域を含む少なくとも1つの関連したスペクトルバンド複製パラメータを有し、さらに、帯域幅拡張された信号は、複数の連続した帯域幅拡張された時間ブロックを含み、その方法は、高域周波数帯域を含むパッチされた信号を生成するステップ、パッチされた信号を得るためにハーモニックパッチングアルゴリズムを実行するステップ、高域周波数帯域を含む操作されたパッチされた信号を得るために、パッチング前の信号またはパッチされた信号を操作するステップ、および帯域幅拡張された信号を得るために、コア周波数帯域を含む帯域幅制限されたオーディオ信号および高域周波数帯域を含む操作されたパッチされた信号を結合するステップを含む。生成するステップは、帯域幅制限されたオーディオ信号の帯域幅制限された時間ブロックを用いて、高域周波数帯域を含むパッチされた信号を生成するステップを含む。実行するステップは、帯域幅制限されたオーディオ信号の複数の連続した帯域幅制限された時間ブロックの時間的に先行する帯域幅制限された時間ブロックを用いて、複数の連続した帯域幅拡張された時間ブロックの現在の帯域幅拡張された時間ブロックのためにハーモニックパッチングアルゴリズムを実行するステップを含む。操作するステップは、高域周波数帯域を含む操作されたパッチされた信号を得るために、現在の帯域幅制限された時間ブロックに関連するスペクトルバンド複製パラメータを用いて、パッチング前の信号またはパッチされた信号を操作するステップを含む。ここで、時間的に先行する帯域幅制限された時間ブロックは、帯域幅制限されたオーディオ信号の複数の連続した帯域幅制限された時間ブロックにおいて現在の帯域幅制限された時間ブロックに時間的に先行する。
【0017】
さらに、本発明の実施形態は、トランジェントに影響を与えることなくオーディオ信号の定常部分の知覚的な品質を改善するための概念に関する。両方の要件を満たすために、ハーモニックパッチングおよびコピーアップパッチングからなる混合パッチングを適用するスキームを導入することができる。
【0018】
本発明によるいくつかの実施形態は、SSBと比較してさらなるアルゴリズムの遅延をもたらす従来のHBEよりも良好な知覚的な品質を提供する。この発明において、ハーモニック信号のための高周波数成分を生成するために、過去からのフレームを用いて、信号の定常性を利用することによって、これを補償することができる。
【0019】
以下には、本発明の実施形態が、添付の図面に関して説明される。
【図面の簡単な説明】
【0020】
図1図1は、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置の実施形態のブロック図を示す。
図2図2は、フィルタバンク領域においてハーモニックパッチングアルゴリズムを実行するためのパッチジェネレータの実施形態のブロック図を示す。
図3図3は、図2によるパッチジェネレータの実施形態の非線形処理ブロックの例示的な実施のブロック図を示す。
図4図4は、フィルタバンク領域においてコピーアップパッチングアルゴリズムを実行するためのパッチジェネレータの実施形態のブロック図を示す。
図5a図5aは、ハーモニックパッチングアルゴリズムおよびコピーアップパッチングアルゴリズムを用いる例示的な帯域幅拡張スキームの概略図を示す。
図5b図5bは、図5aの帯域幅拡張スキームから得られる例示的なスペクトルを示す。
図6a図6aは、ハーモニックパッチングアルゴリズムおよびコピーアップパッチングアルゴリズムを用いる例示的な帯域幅拡張スキームのさらなる概略図を示す。
図6b図6bは、図6aの帯域幅拡張スキームから得られる例示的なスペクトルを示す。
図7a図7aは、コピーアップパッチングアルゴリズムだけを用いる例示的な帯域幅拡張スキームの概略図を示す。
図7b図7bは、図7aの帯域幅拡張スキームから得られる例示的なスペクトルを示す。
図8a図8aは、ハーモニックパッチングアルゴリズムだけを用いる例示的な帯域幅拡張スキームの概略図を示す。
図8b図8bは、図8aの帯域幅拡張スキームから得られる例示的なスペクトルを示す。
図9図9は、図1による装置の実施形態のパッチジェネレータの実施形態のブロック図を示す。
図10図10は、図1による装置の実施形態のパッチジェネレータのさらなる実施形態のブロック図を示す。
図11図11は、例示的なパッチングスキームの概略図を示す。
図12図12は、異なる帯域幅拡張された時間ブロック間の位相連続/クロスフェードオペレーションの例示的な実施を示す。
図13図13は、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置のさらなる実施形態のブロック図を示す。
【発明を実施するための形態】
【0021】
図1は、帯域幅制限されたオーディオ信号105から帯域幅拡張された信号135を生成するための装置100の実施形態のブロック図を示す。ここで、帯域幅制限されたオーディオ信号105は、複数の連続した帯域幅制限された時間ブロックを含み、それぞれの帯域幅制限された時間ブロックは、コア周波数帯域を含む少なくとも1つの関連したスペクトルバンド複製パラメータ121を有する。さらに、帯域幅拡張された信号135は、複数の連続した帯域幅拡張された時間ブロックを含む。図1に示されるように、装置100は、パッチジェネレータ110、信号操作器120およびコンバイナ130を含む。パッチジェネレータ110は、帯域幅制限されたオーディオ信号105の帯域幅制限された時間ブロックを用いて、高域周波数帯域を含むパッチされた信号115を生成するように構成される。図1の実施形態において、パッチジェネレータ110は、パッチされた信号115を得るためにハーモニックパッチングアルゴリズムを実行するように構成される。例えば、パッチジェネレータ110は、帯域幅制限されたオーディオ信号105の複数の連続した帯域幅制限された時間ブロックの時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて、複数の連続した帯域幅拡張された時間ブロックの現在の帯域幅拡張された時間ブロック(m’)のためにハーモニックパッチングアルゴリズムを実行するように構成される。図1に例示的に表されるように、信号操作器120は、高域周波数帯域を含む操作されたパッチされた信号125を得るために、現在の帯域幅制限された時間ブロック(m)に関連するスペクトルバンド複製(SBR)パラメータ121を用いて、パッチング前の信号105(任意)、または、時間的に先行する帯域幅制限された時間ブロック(m−1)を用いて生成されるパッチされた信号115を操作するように構成される。図1の実施形態において、時間的に先行する帯域幅制限された時間ブロック(m−1)は、帯域幅制限されたオーディオ信号105の複数の連続した帯域幅制限された時間ブロックにおいて現在の帯域幅制限された時間ブロック(m)に時間的に先行する。コンバイナ130は、帯域幅拡張された信号135を得るために、コア周波数帯域を含む帯域幅制限されたオーディオ信号105および高域周波数帯域を含む操作されたパッチされた信号125を結合するように構成される。
【0022】
図1の実施形態を参照すると、インデックスmは、帯域幅制限されたオーディオ信号105の複数の連続した帯域幅制限された時間ブロックの個々の帯域幅制限された時間ブロックに対応することができる一方、インデックスm’は、パッチジェネレータ110から得られる複数の連続した帯域幅拡張された時間ブロックの個々の帯域幅拡張された時間ブロックに対応することができる。
【0023】
例えば、図1の実施形態に示されるパッチジェネレータ110は、それぞれ、the MPEG audio standard ISO/IEC FDIS 23003-3, 2011のsections 7.5.3および7.5.4に記載されるような、DFTベースのハーモニックトランスポーザまたはQMFベースのハーモニックトランスポーザを用いる。
【0024】
実施形態において、信号操作器120は、エンベロープ調整されまたは操作されたパッチされた信号125を得るために、SBRパラメータ121に依存して、パッチされた信号115のエンベロープを調整するためのエンベロープ調整器を含むことができる。
【0025】
図2は、フィルタバンク領域においてハーモニックパッチングアルゴリズムを実行するための図1による装置100の実施形態のパッチジェネレータ110の実施形態のブロック図を示す。図2を参照すると、装置100は、QMF分析フィルタバンク210、パッチジェネレータ110の実施形態およびQMF合成フィルタバンク220を含むことができる。
【0026】
例えば、QMF分析フィルタバンク210は、復号化された低周波信号205を複数の周波数サブバンド信号215に変換するように構成される。図2に示される複数の周波数サブバンド信号215は、図1に示される帯域幅制限されたオーディオ信号105のコア周波数帯域を表すことができる。
【0027】
図2の実施形態において、パッチジェネレータ110は、QMF分析フィルタバンク210によって提供される複数の周波数サブバンド信号215に作動し、さらに、QMF合成フィルタバンク220のために複数のパッチされた周波数サブバンド信号217を出力するように構成される。図2に示される複数のパッチされた周波数サブバンド信号217は、図1に示されるパッチされた信号115を表すことができる。
【0028】
QMF合成フィルタバンク220は、例えば、複数のパッチされた周波数サブバンド信号217を帯域幅拡張された信号135に変換するように構成される。
【0029】
図2の実施形態を参照すると、QMF合成フィルタバンク220によって受信されるパッチされた周波数サブバンド信号217は、だんだんと高くなる周波数によって特徴付けられる異なるパッチされた周波数サブバンド信号を表す、「1」、「2」、「3」、・・・で示される。
【0030】
図2に例示的に表されるように、パッチジェネレータ110は、複数の周波数サブバンド信号215から、第1グループのパッチされた周波数サブバンド信号219−1、第2グループのパッチされた周波数サブバンド信号219−2および第3グループのパッチされた周波数サブバンド信号219−3を得るように構成される。例えば、パッチジェネレータ110は、第1グループのパッチされた周波数サブバンド信号219−1をQMF分析フィルタバンク210からQMF合成フィルタバンク220に直接供給するように構成される。また、パッチジェネレータ110が複数の非線形処理ブロック250を含むことは、図2に例示的に表される。
【0031】
複数の非線形処理ブロック250は、第1グループの非線形処理ブロック252および第2グループの非線形処理ブロック254を含むことができる。例えば、パッチジェネレータ110の第1グループの非線形処理ブロック252は、第2グループのパッチされた周波数サブバンド信号219−2を得るために非線形処理を実行するように構成される。さらに、パッチジェネレータ110の第2グループの非線形処理ブロック254は、第3グループのパッチされた周波数サブバンド信号219−3を得るために非線形処理を実行するように構成されうる。図2の実施形態において、第1グループの非線形処理ブロック252は、第1の非線形処理ブロック253−1および第2の非線形処理ブロック253−2を含む一方、第2グループの非線形処理ブロック254は、第1の非線形処理ブロック255−1および第2の非線形処理ブロック255−2を含む。
【0032】
例えば、第1グループの非線形処理ブロック252の第1の非線形処理ブロック253−1および第2の非線形処理ブロック253−2は、それぞれ、対応する非線形処理された出力信号271−1、271−2を得るために、第1のより高い周波数サブバンド信号261および第2のより高い周波数サブバンド信号263の位相が2の帯域幅拡張ファクタ(s)で乗算される、非線形処理を実行するように構成される。さらに、第2グループの非線形処理ブロック254の第1の非線形処理ブロック255−1および第2の非線形処理ブロック255−2は、それぞれ、対応する非線形処理された出力信号273−1、273−2を得るために、第1のより高い周波数サブバンド信号261および第2のより高い周波数サブバンド信号263の位相が3の帯域幅拡張ファクタ(s)で乗算される、非線形処理を実行するように構成されうる。
【0033】
第1の非線形処理ブロック253−1および第2の非線形処理ブロック253−2によって出力される非線形処理された出力信号271−1、271−2は、それぞれ、信号操作器120の対応する信号操作ブロック122−1、122−2によって操作されうる。図2に例示的に表されるように、信号操作器120は、図1のスペクトルバンド複製パラメータ121を用いて、非線形処理された出力信号271−1、271−2を操作するように構成される。信号操作器120の出力で、第2グループのパッチされた周波数サブバンド信号219−2が得られることは、図2に例示的に示される。特に、第2グループのパッチされた周波数サブバンド信号219−2は、コア周波数帯域から生成される第1の目標周波数帯域(または第1のより高いパッチ)に対応することができ、第1のより高いパッチは、2の帯域幅拡張ファクタ(s)に基づく。
【0034】
さらに、第1の非線形処理ブロック255−1および第2の非線形処理ブロック255−2によって出力される非線形処理された出力信号273−1、273−2は、QMF合成フィルタバンク220によって受信される第3グループのパッチされた周波数サブバンド信号219−3を構成することができる。特に、第3グループのパッチされた周波数サブバンド信号219−3は、コア周波数帯域から生成される第2の目標周波数帯域(または第2のより高いパッチ)に対応することができ、第2の目標周波数帯域は、3の帯域幅拡張ファクタ(s)に基づく。
【0035】
図2の実施形態を参照すると、より高いパッチのための非線形処理された出力信号(例えば、非線形処理された出力信号271−2)および異なるより高いパッチのための非線形処理された出力信号(例えば、非線形処理された出力信号273−1)は、図2に点線211で示されるように、合計しまたは結合することができる。
【0036】
特に、図2に示されるパッチジェネレータ110を提供することによって、コア周波数帯域に対応する第1グループのパッチされた周波数サブバンド信号219−1、第1のより高いパッチに対応する第2グループのパッチされた周波数サブバンド信号219−2および第2のより高いパッチに対応する第3グループのパッチされた周波数サブバンド信号219−3を用いて、帯域幅拡張された信号135を生成することが可能である。
【0037】
図3は、図2によるパッチジェネレータ110の実施形態の非線形処理ブロック300の例示的な実施のブロック図を示す。図3に示される非線形処理ブロック300は、図2に示される非線形処理ブロック250のうちの1つに対応することができる。図3の例示的な実施において、非線形処理ブロック300は、ウィンドウイングブロック309、位相乗算ブロック310、デシメータ320およびタイムストレッチングユニット330(例えば、オーバーラップ加算(OLA)ステージを用いる)を含む。例えば、位相乗算ブロック310は、位相乗算された周波数サブバンド信号315を得るために、周波数サブバンド信号305の位相を帯域幅拡張ファクタ(σ)で乗算するように構成される。さらに、デシメータ320は、間引かれた周波数サブバンド信号325を得るために、位相乗算された周波数サブバンド信号315を間引くように構成されうる。さらに、タイムストレッチングユニット330は、時間的に広げられたタイムストレッチされた出力信号335を得るために、間引かれた周波数サブバンド信号325をタイムストレッチするように構成されうる。好ましくは、ブロック330は、タイムストレッチングオペレーションを得るために、ブロック309のウィンドウイングにおいて用いられるものよりも大きいホップサイズを有するオーバーラップ加算処理を実行する。図3に示される位相乗算ブロック310に入力される周波数サブバンド信号305は、図2に示されるパッチジェネレータ110に入力される周波数サブバンド信号215のうちの1つに対応することができる一方、図3に示されるタイムストレッチングユニット330によって提供されるタイムストレッチされた出力信号335は、図2に示されるパッチジェネレータ110の非線形処理ブロック250のうちの1つによって提供される非線形処理された出力信号に対応することができる。特に、帯域幅拡張された信号135が得られるように、信号操作を用いることによって、タイムストレッチされた出力信号335を操作することができる。
【0038】
図3の例示的な実施において、位相乗算ブロック310は、帯域幅拡張ファクタ(σ)を用いて、周波数サブバンド信号305に作動するように実施されうる。例えば、帯域幅拡張ファクタσ=2およびσ=3は、それぞれ、図2に関して記載されるように、帯域幅拡張された信号135のための第1のより高いパッチおよび第2のより高いパッチを提供するために用いることができる。さらに、図3に示される非線形処理ブロック300のデシメータ320は、帯域幅拡張ファクタ(σ)に依存して、位相乗算された周波数サブバンド信号315のサンプルレートを変換するためのサンプルレートコンバータによって実施されうる。例えば、帯域幅拡張ファクタσ=2がデシメータ320によって用いられる場合、位相乗算された周波数サブバンド信号315の1つおきのサンプルが、それから取り除かれる。これは、デシメータ320によって出力される間引かれた信号325が位相乗算された周波数サブバンド信号315の期間の半分の期間によって実質的に特徴付けられ、さらに、拡張された帯域幅を有するということをもたらす。
【0039】
さらに、タイムストレッチングユニット330は、タイムストレッチングユニット330によって出力されるタイムストレッチされた出力信号335が、位相乗算ブロック310に入力される周波数サブバンド信号305のオリジナルの期間を再び有するように、2のタイムストレッチングファクタによって(例えば、OLAステージによるオーバーラップ加算処理を用いて)、間引かれた周波数サブバンド信号325のタイムストレッチングを実行するように構成されうる。
【0040】
図3の例示的な実施において、デシメータ320およびタイムストレッチングユニット330は、信号処理方向に関して逆の順序に配置されてもよい。これは、図3に両方向矢印311で示される。タイムストレッチングユニット330がデシメータ320の前に設けられている場合、位相乗算された周波数サブバンド信号315は、最初に、タイムストレッチされた信号を得るために時間的にストレッチされ、そして、帯域幅拡張された信号のための間引かれた出力信号を提供するために間引かれる。例えば、位相乗算された周波数サブバンド信号315が、最初に、2のタイムストレッチングファクタによって時間的にストレッチされる場合、タイムストレッチされた信号は、位相乗算された周波数サブバンド信号315の期間の2倍の期間によって特徴付けられる。2の対応する間引きファクタによる後の間引きは、例えば、間引かれた出力信号が、位相乗算ブロック310に入力される周波数サブバンド信号305のオリジナルの期間を再び有し、さらに、拡張された帯域幅を有するということをもたらす。
【0041】
図3を参照すると、いずれの場合でも、オーバーラップ加算処理を用いてタイムストレッチングユニット330によって実行されるタイムストレッチングオペレーションが、例えばパッチジェネレータ110内などでハーモニックパッチングアルゴリズムのさらなる遅延をもたらすことがここで指摘される。ハーモニックパッチングアルゴリズム内でタイムストレッチングオペレーションによるさらなる遅延のこの影響は、図3に矢印350で示される。しかしながら、本発明の実施形態は、図1に関して記載されるように、現在の帯域幅拡張された時間ブロック(m’)を得るために、ハーモニックパッチングアルゴリズムを時間的に先行する帯域幅制限された時間ブロック(m−1)に適用することによって、このさらなる遅延を効果的に補償することができる利点を提供する。
【0042】
図3に記載の実施形態において、パッチジェネレータジェネレータ110は、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ加算処理を用いて、ハーモニックパッチングアルゴリズムを実行するように構成されうる。
【0043】
図4は、フィルタバンク領域においてコピーアップパッチングアルゴリズムを実行するためのパッチジェネレータ110の実施形態のブロック図を示す。図4に示されるパッチジェネレータ110は、図1に示される装置100において実施されうる。これは、図1の装置100において、パッチジェネレータ110が、図2に関して記載されるハーモニックパッチングアルゴリズムの他に、図4に関して記載されるコピーアップパッチングアルゴリズムを実行するように構成されうることを意味する。
【0044】
図4の実施形態を参照すると、装置100は、QMF分析フィルタバンク410、処理チェーンにおいて「パッチング」で示されるパッチジェネレータ110、処理チェーンにおいて「信号操作」で示される信号操作器120およびQMF合成フィルタバンク420を含む。例えば、QMF分析フィルタバンク410は、復号化された低周波信号205を複数の周波数サブバンド信号415に変換するように構成される。さらに、パッチジェネレータ110および信号操作器120の協働によって、複数のパッチされた周波数サブバンド信号417は、QMF合成フィルタバンク420のために提供されうる。次に、QMF合成フィルタバンク420は、複数のパッチされた周波数サブバンド信号417を帯域幅拡張された信号135に変換するように構成されうる。
【0045】
図4において、QMF合成フィルタバンク420によって受信されるパッチされた周波数サブバンド信号417は、「1」、「2」、・・・、「6」によって例示的に示され、さらに、だんだんと高くなる周波数を有する異なるパッチされた周波数サブバンド信号を表すことができる。
【0046】
図4の実施形態を参照すると、パッチジェネレータ110は、第1グループのパッチされた周波数サブバンド信号419−1のために複数の周波数サブバンド信号415をQMF分析フィルタバンク410からQMF合成フィルタバンク420に直接送るように構成される。目標帯域がLF領域の第1の帯域である必要がないことに留意すべきである。ソース領域は、典型的な場合においてより高い帯域番号でさらに開始する。これは、特に図4においてアイテム1および4に適用される。
【0047】
さらに、パッチジェネレータ110は、QMF合成フィルタバンク420によって受信される第2グループのパッチされた周波数サブバンド信号419−2のために、QMF分析フィルタバンク410によって提供される周波数サブバンド信号415を分岐し、さらに、それらを送るように構成されうる。信号操作器120が、複数の信号操作ブロック122−1、122−2、122−3を含み、さらに、スペクトルバンド複製パラメータ121に依存して作動することは、図4に例示的に表される。例えば、信号操作ブロック122−1、122−2、122−3は、QMF合成フィルタバンク420によって受信される第2グループのパッチされた周波数サブバンド信号419−2を得るために、QMF分析フィルタバンク410によって提供される複数の周波数サブバンド信号415から分岐されるパッチされた周波数サブバンド信号を操作するように構成される。図4の実施形態において、パッチジェネレータ110から得られる第1グループのパッチされた周波数サブバンド信号419−1は、復号化された低周波信号205または帯域幅拡張された信号135のコア周波数帯域に対応することができる一方、パッチジェネレータ110から得られる第2グループのパッチされた周波数サブバンド信号419−2は、帯域幅拡張された信号135の第1のより高い目標周波数帯域(または第1のより高いパッチ)に対応することができる。第1のより高い目標周波数帯域のために実施されるのと同様の方法において、第2のより高い目標周波数帯域(または第2のより高いパッチ)を、図4の実施形態に示されるパッチジェネレータ110および信号操作器120の協働によって生成することができる。
【0048】
例えば、図4の実施形態に示されるようにフィルタバンク領域においてパッチジェネレータ110で実行されるコピーアップパッチングアルゴリズムは、例えば単側波帯変調(SSB)を用いるような非ハーモニックパッチングアルゴリズムを表すことができる。
【0049】
図4の実施形態を参照すると、QMF分析フィルタバンク410は、例えば、32個の周波数サブバンド信号415を提供するように構成される32バンド分析フィルタバンクであってもよい。さらに、QMF合成フィルタバンク420は、例えば、64個のパッチされた周波数サブバンド信号417を受信するように構成される64バンド合成フィルタバンクであってもよい。
【0050】
特に、図4に示されるパッチジェネレータ110の実施形態は、基本的に、例えばMPEG−4オーディオ標準において定められるようなハイエフィシェンシーアドバンストオーディオ符号化(high−efficiency advanced audio coding(HE−AAC))スキームを実現するために用いることができる。
【0051】
図5aは、ハーモニックパッチングアルゴリズム515およびコピーアップパッチングアルゴリズム525を用いる例示的な帯域幅拡張スキームの概略図510を示す。図5aの概略図510において、垂直軸(縦座標)は、周波数504を示す一方、水平軸(横座標)は、時間502を示す。図5aにおいて、複数の連続した帯域幅制限された時間ブロック511が、例示的に表される。連続した帯域幅制限された時間ブロック511は、図5aに、「フレームn」、「フレームn+1」、「フレームn+2」および「フレームn+3」で例示的に示される。連続した帯域幅制限された時間ブロック511の周波数成分は、基本的にコア周波数帯域またはLF(コア)505を表す。さらに、図5aは、複数の連続した帯域幅拡張された時間ブロック513を例示的に表す。帯域幅拡張された時間ブロック513の周波数成分は、基本的に、第1のより高い目標周波数帯域(パッチI507)または第2のより高い目標周波数帯域(パッチII509)に対応する。パッチI507に対応する連続した帯域幅拡張された時間ブロック513は、図5aに、「f(フレームn−1)」、「f(フレームn)」、「f(フレームn+1)」および「f(フレームn+2)」で例示的に示される。さらに、パッチII509に対応する連続した帯域幅拡張された時間ブロックは、図5aに、「f(フレームn−1)」、「g(f(フレームn))」、「g(f(フレームn+1))」および「g(f(フレームn+2))」で例示的に示される。ここで、関数依存性f(...)は、ハーモニックパッチングアルゴリズムのアプリケーションを示すことができる一方、関数依存性g(...)は、コピーアップパッチングアルゴリズムのアプリケーションを示すことができる。図5aの概略図510において、LF(コア)505は、帯域幅制限されたオーディオ信号105内に含まれうり、さらに、パッチI507およびパッチII509は、例えば図1の装置100に示されるような帯域幅拡張された信号135内に含まれうる。また、信号135は、それが図においてコンバイナの出力であるように示されるので、LF(コア)を含む。それぞれの帯域幅制限された時間ブロックが少なくとも1つの関連したスペクトルバンド複製パラメータを有することは、図1に関してすでに記載されている。
【0052】
図5bは、図5aの帯域幅拡張スキームから得られる例示的なスペクトル550を示す。図5bにおいて、垂直軸(縦座標)は、振幅553に対応する一方、水平軸(横座標)は、スペクトル550の周波数551に対応する。スペクトル550が、コア周波数帯域またはLF(コア)505と、第1のより高い目標周波数帯域またはパッチI507と、第2のより高い目標周波数帯域またはパッチII509とを含むことは、図5bに例示的に表される。さらに、クロオーバー周波数(fx)、2倍のクロスオーバー周波数(2・fx)および3倍のクロスオーバー周波数(3・fx)が、スペクトル550の周波数軸において例示的に表される。
【0053】
図1図5aおよび図5bに記載の実施形態において、パッチジェネレータ110は、2の帯域幅拡張ファクタ(σ1)を用いて、ハーモニックパッチングアルゴリズム515を時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成されうる。さらに、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)のコア周波数帯域505から現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域507を生成するように構成されうる。さらに、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)のコア周波数帯域505から生成される現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域507を現在の帯域幅拡張された時間ブロック(m’)の第2の目標周波数帯域509にコピーアップするためのコピーアップパッチングアルゴリズム525を適用するように構成されうる。図5aにおいて、ハーモニックパッチングアルゴリズム515は、傾斜した矢印で示される一方、コピーアップパッチングアルゴリズム525は、傾斜していない矢印で示される。
【0054】
図5bのスペクトル550に例示的に表されるように、コア周波数帯域505は、クロスオーバー周波数(fx)までの範囲の周波数を含むことができる。さらに、例示的な帯域幅拡張ファクタσ1=2を用いてハーモニックパッチングアルゴリズム515を適用することによって、クロスオーバー周波数(fx)から2倍のクロスオーバー周波数(2・fx)までの範囲の周波数を含む第1の目標周波数帯域507が得られる。さらに、コピーアップパッチングアルゴリズム525を適用することによって、2倍のクロスオーバー周波数(2・fx)から3倍のクロスオーバー周波数(3・fx)までの範囲の周波数を含む第2の目標周波数帯域509が得られる。
【0055】
図6aは、ハーモニックパッチングアルゴリズム515およびコピーアップパッチングアルゴリズム625を用いる例示的な帯域幅拡張スキームのさらなる概略図を示す。図6bは、図6aの帯域幅拡張スキームから得られる例示的なスペクトル650を示す。図6aの概略図610において要素504、502、511、513、505、507、509および515と図6bの例示的なスペクトル650において要素553、551、505、507、509および515とは、図5aの概略図510および図5bの例示的なスペクトル550において同じ数字を有する要素に対応することができる。したがって、これらの要素の繰り返された説明が省略される。
【0056】
図1図6aおよび図6bを参照すると、パッチジェネレータ110は、2の帯域幅拡張ファクタ(σ1)を用いて、ハーモニックパッチングアルゴリズム515を時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成されうる。さらに、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)のコア周波数帯域505から現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域507を生成するように構成されうる。さらに、パッチジェネレータ110は、現在の帯域幅制限された時間ブロック(m)のコア周波数帯域505を現在の帯域幅拡張された時間ブロック(m’)の第2の目標周波数帯域509にコピーアップするためのコピーアップパッチングアルゴリズム625を適用するように構成されうる。
【0057】
図6bのスペクトル650に例示的に表されるように、コア周波数帯域505は、クロスオーバー周波数(fx)までの範囲の周波数を含むことができ、例示的な帯域幅拡張ファクタσ1=2を用いてハーモニックパッチングアルゴリズム515を適用することから得られる第1の目標周波数帯域507は、クロスオーバー周波数(fx)から2倍のクロスオーバー周波数(2・fx)までの範囲の周波数を含むことができる一方、コピーアップパッチングアルゴリズム625を適用することから得られる第2の目標周波数帯域509は、2倍のクロスオーバー周波数(2・fx)から3倍のクロスオーバー周波数(3・fx)までの範囲の周波数を含むことができる。
【0058】
図7aは、コピーアップパッチングアルゴリズム715、625だけを用いる例示的な帯域幅拡張スキームの概略図710を示す。図7bは、図7aの帯域幅拡張スキームから得られる例示的なスペクトル750を示す。図7aの概略図710において要素504、502、511、513、505、507、509および図7bの例示的なスペクトル750において要素553、551、505、507、509は、それぞれ、図5aの概略図510および図5bの例示的なスペクトル550において同じ数字を有する要素に対応することができる。したがって、これらの要素の繰り返された説明が省略される。
【0059】
図1図7aおよび図7bを参照すると、パッチジェネレータ110は、現在の帯域幅制限された時間ブロック(m)のコア周波数帯域505を現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域507にコピーアップするためのコピーアップパッチングアルゴリズム715を適用するように構成されうる。さらに、パッチジェネレータ110は、現在の帯域幅制限された時間ブロック(m)のコア周波数帯域505を現在の帯域幅拡張された時間ブロック(m’)の第2の目標周波数帯域509にコピーアップするためのコピーアップパッチングアルゴリズム625を適用するように構成されうる。同様の方法において、そのようなコピーアップパッチングアルゴリズムは、時間的に先行する帯域幅制限された時間ブロック(m−1)に適用されてもよい(例えば、図7aを参照)。
【0060】
図7bのスペクトル750に例示的に表されるように、コア周波数帯域505は、クロスオーバー周波数(fx)までの範囲の周波数を含むことができ、コピーアップパッチングアルゴリズム715を適用することから得られる第1の目標周波数帯域507は、クロスオーバー周波数(fx)から2倍のクロスオーバー周波数(2・fx)までの範囲の周波数を含むことができる一方、コピーアップパッチングアルゴリズム625を適用することから得られる第2の目標周波数帯域509は、2倍のクロスオーバー周波数(2・fx)から3倍のクロスオーバー周波数(3・fx)までの範囲の周波数を含むことができる。
【0061】
図8aは、ハーモニックパッチングアルゴリズム515、825だけを用いる例示的な帯域幅拡張スキームの概略図810を示す。図8bは、図8aの帯域幅拡張スキームから得られる例示的なスペクトル850を示す。図8aの概略図810において要素504、502、511、513、505、507および509と図8bの例示的なスペクトル850において要素553、551、505、507および509とは、それぞれ、図5aの概略図510および図5bの例示的なスペクトル550に示される同じ数字を有する要素に対応することができる。したがって、これらの要素の繰り返された説明が省略される。
【0062】
図1図8aおよび図8bを参照すると、パッチジェネレータ110は、2の帯域幅拡張ファクタ(σ1)を用いて、ハーモニックパッチングアルゴリズム825を時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成されうる。さらに、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)のコア周波数帯域505から現在の帯域幅拡張された時間ブロック(m’)の第1の目標周波数帯域507を生成するように構成されうる。さらに、パッチジェネレータ110は、3の帯域幅拡張ファクタ(σ2)を用いて、ハーモニックパッチングアルゴリズム515を時間的に先行する帯域幅制限された時間ブロック(m−1)に適用するように構成されうる。さらに、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)のコア周波数帯域505から現在の帯域幅拡張された時間ブロック(m’)の第2の目標周波数帯域509を生成するように構成されうる。
【0063】
図8bのスペクトル850に例示的に表されるように、コア周波数帯域505は、クロスオーバー周波数(fx)までの範囲の周波数を含むことができ、例示的な帯域幅拡張ファクタσ1=2を用いてハーモニックパッチングアルゴリズム515を適用することから得られる第1の目標周波数帯域507は、クロスオーバー周波数(fx)から2倍のクロスオーバー周波数(2・fx)までの範囲の周波数を含むことができる一方、例示的な帯域幅拡張ファクタσ2=3を用いてハーモニックパッチングアルゴリズム825を適用することから得られる第2の目標周波数帯域509は、2倍のクロスオーバー周波数(2・fx)から3倍のクロスオーバー周波数(3・fx)までの範囲の周波数を含むことができる。
【0064】
図9は、図1による装置100の実施形態のパッチジェネレータ110の実施形態のブロック図を示す。図9に示されるように、装置100は、パッチングアルゴリズム情報911を提供するためのプロバイダ910をさらに含むことができる。図9の実施形態において、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)を用いるハーモニックパッチングアルゴリズム515の他に、対応する先行するまたは後続するブロックのための時間的に先行する帯域幅制限された時間ブロック(m−1)または時間的に後続する帯域幅制限された時間ブロック(m+1)を用いるコピーアップパッチングアルゴリズム925を実行するように構成されうる。特に、時間的に後続する帯域幅制限された時間ブロック(m+1)は、現在の帯域幅制限された時間ブロック(m)に時間的に後続する。図9の実施形態において、パッチジェネレータ110は、さらに、パッチングアルゴリズム情報911に応じて、ハーモニックパッチングアルゴリズム515から生成される現在の帯域幅拡張された時間ブロック(m’)のために、パッチされた信号115を用いるように構成されうる。
【0065】
特に、図9に示されるパッチジェネレータ110の実施形態を提供することによって、帯域幅拡張された信号135のために、異なる連続した帯域幅拡張された時間ブロックをブロック単位で用いることが可能である。ここで、異なる連続した帯域幅拡張された時間ブロックのブロック単位の使用は、基本的にパッチングアルゴリズム情報911に応じる。
【0066】
実施形態において、プロバイダ910は、帯域幅制限されたオーディオ信号105内で符号化されるサイド情報111を用いて、パッチングアルゴリズム情報911を提供するように(任意に)構成されうる。例えば、帯域幅制限されたオーディオ信号105は、符号化されたオーディオ信号(ビットストリーム)によって表されうる。プロバイダ910によって受信されるサイド情報111は、例えば、ビットストリームパーサを用いることによってビットストリームから抽出されうる。
【0067】
あるいは、プロバイダ910は、帯域幅制限されたオーディオ信号105の信号分析に依存して、パッチングアルゴリズム情報911を提供するように構成されうる。例えば、装置100は、帯域幅制限されたオーディオ信号105の信号分析に依存して、プロバイダ910のための分析結果信号913を得るように構成される信号アナライザ912をさらに含むことができる。
【0068】
例えば、プロバイダ910は、帯域幅制限されたオーディオ信号105のそれぞれの帯域幅制限された時間ブロックからトランジェントフラグ915を決定するように構成されうる。この場合、信号アナライザ912は、プロバイダ910に含まれうる。図9の実施形態を参照すると、パッチジェネレータ110は、帯域幅制限されたオーディオ信号105の定常性がトランジェントフラグ915によって示されるときに、ハーモニックパッチングアルゴリズム515から生成される現在の帯域幅拡張された時間ブロック(m’)のためのパッチされた信号115を用いるように構成される。さらに、パッチジェネレータ110は、帯域幅制限されたオーディオ信号105の非定常性がトランジェントフラグ915によって示されるときに、コピーアップパッチングアルゴリズム925から生成されるパッチされた信号115を用いるように構成されうる。
【0069】
例えば、帯域幅制限されたオーディオ信号105の定常性(または帯域幅制限されたオーディオ信号においてトランジェントイベントの欠如)は、「0」で示されるトランジェントフラグ915に対応することができる一方、帯域幅制限されたオーディオ信号105の非定常性(または帯域幅制限されたオーディオ信号においてトランジェントイベントの存在)は、「1」で示されるトランジェントフラグ915に対応することができる。
【0070】
図10は、図1による装置100の実施形態のパッチジェネレータ110のさらなる実施形態のブロック図を示す。図10の実施形態によれば、パッチジェネレータ110は、時間的に先行する帯域幅制限された時間ブロック(m−1)および現在の帯域幅拡張された時間ブロック(m’)間で第1の時間遅延1010を含むハーモニックパッチングアルゴリズム515を実行するように構成される。さらに、パッチジェネレータ110は、現在の帯域幅制限された時間ブロック(m)を用いて、コピーアップパッチングアルゴリズム925を実行するように構成されうる。特に、コピーアップパッチングアルゴリズム925は、第2の時間遅延1020を含む。図10の実施形態を参照すると、ハーモニックパッチングアルゴリズム515の第1の時間遅延1010は、コピーアップパッチングアルゴリズム925の第2の時間遅延1020よりも大きい。
【0071】
例えば、図10に示されるパッチジェネレータ110は、第1の時間遅延1010を含むハーモニックパッチングアルゴリズム515を実行するためのフェーズボコーダを含むことができる。フェーズボコーダは、特に、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ加算処理を用いるように構成されうる。
【0072】
図11は、例示的なパッチングスキーム1100の概略図を示す。図11のパッチングスキーム1100は、例えば、図1の装置100に示されるパッチジェネレータ110で実現される。図11において、帯域幅制限されたオーディオ信号105の例示的なグラフ1101が示される。グラフ1101に例示的に表されるように、帯域幅制限されたオーディオ信号105は、例えば、図5aの概略図510に示されるようなコア周波数帯域を含む複数の連続した帯域幅制限された時間ブロック511を含む。さらに、帯域幅制限されたオーディオ信号105の垂直軸(縦座標)は、振幅1110に対応する一方、グラフ1101の水平軸(横座標)は、時間1120に対応する。
【0073】
図11において、連続した帯域幅制限された時間ブロック511は、それぞれ、対応するフレーム番号1102(「0」、「1」、「2」、・・・)で示される。さらに、連続した帯域幅制限された時間ブロック511は、それぞれ、対応するトランジェントフラグ915で示され(例えば、「1」または「0」で示され)うり、それは、例えば図9に示されるプロバイダ910を用いることによって、帯域幅制限されたオーディオ信号105のそれぞれの帯域幅制限された時間ブロックから決定することができる。帯域幅制限されたオーディオ信号105がトランジェント領域1107においてトランジェントイベント1105を含むことができることは、図11に例示的に表される。この例示的なトランジェントイベント1105は、例えば、トランジェント検出器によって検出される。
【0074】
図11の概略図1100を参照すると、パッチジェネレータ110は、ハーモニックパッチングアルゴリズム515を帯域幅制限されたオーディオ信号105のそれぞれの帯域幅制限された時間ブロックに連続的に適用するように構成されうる。これは、図11に「HBEは、常にバックグラウンドで実行されている」で示される矢印1130で例示的に表される。
【0075】
別の実施形態によれば、上述のトランジェント検出器は、帯域幅制限されたオーディオ信号105においてトランジェントイベント1105を検出するように構成される。例えば、パッチジェネレータ110は、トランジェントイベント1105が帯域幅制限されたオーディオ信号105において検出されるときに、コピーアップパッチングアルゴリズム1025を実行するように構成される。さらに、パッチジェネレータ110は、トランジェントイベント1105が帯域幅制限されたオーディオ信号105において検出されるときに、少なくとも2つの帯域幅制限された時間ブロック間でオーバーラップ加算処理を用いて、ハーモニックパッチングアルゴリズム515を実行しないように構成されうる。これは、基本的に別の状況に対応し、帯域幅制限されたオーディオ信号105のトランジェント領域1107において、コピーアップパッチングアルゴリズム1025は、実行される一方、ハーモニックパッチングアルゴリズムは、バックグラウンドで実行されていない。
【0076】
さらに、図11は、帯域幅拡張された信号135の複数の連続した帯域幅拡張された時間ブロックのために、それぞれのパッチングアルゴリズムを実行するパッチング結果1111を概略的に示す。このパッチング結果1111は、図11に「パッチング(ソースフレーム)」で示される。特に、パッチング結果1111は、フレーム番号1102(すなわち、ソースフレーム)を有する対応する帯域幅制限された時間ブロックに適用されるそれぞれのパッチングアルゴリズム(すなわち「HBE」で示されるハーモニックパッチングアルゴリズムまたは「コピーアップ」で示されるコピーアップパッチングアルゴリズム)から生成されるパッチされた信号を示す。パッチング結果1111に対応する異なる帯域幅拡張された時間ブロックは、図12との関連で記載されるように、帯域幅拡張された信号135の知覚的な品質を増加するためにさらに処理されうる。
【0077】
図12は、例えば図11に示されるような異なるパッチングアルゴリズムから得られる異なる帯域幅拡張された時間ブロック1202、1204間の位相連続/クロスフェードオペレーション1210の例示的な実施を示す。図11および図12を参照すると、パッチジェネレータ110は、ハーモニックパッチングアルゴリズム515およびコピーアップパッチングアルゴリズム1025を実行するように構成されうる。特に、(図11に示されるハーモニックパッチングアルゴリズム515から得られる)図12に示されるブロック1202は、現在の帯域幅拡張された時間ブロック(m’)に対応することができる一方、(図11に示されるコピーアップパッチングアルゴリズム1025から得られる)図12に示されるブロック1204は、時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)に対応することができる。ここで、時間的に先行する帯域幅拡張された時間ブロック(m’−1)は、現在の帯域幅拡張された時間ブロック(m’)に時間的に先行し、さらに、時間的に後続する帯域幅拡張された時間ブロック(m’+1)は、現在の帯域幅拡張された時間ブロック(m’)に時間的に後続する。
【0078】
図12によれば、パッチジェネレータ110は、ハーモニックパッチングアルゴリズム515から生成される現在の帯域幅拡張された時間ブロック(m’)とコピーアップパッチングアルゴリズム1025から生成される時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)1204との間で位相連続1210を実行するように構成されうる。位相連続1210の結果、位相連続された信号1215が得られる。図12において、位相連続の後に得られる例示的な信号1212が表される。例えば、位相連続1210は、現在の帯域幅拡張された時間ブロック(m’)1202と、時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)1204とが、その境界領域1213において滑らかで連続的な位相遷移を含むように、実行される。例えば、位相連続1210は、ブロック1204の例示的な正弦波信号がその開始点で境界領域1213において以前のブロック1202の例示的な正弦波信号の終了点と同じ位相を含むように、実行される。位相連続1210を実行することによって、位相連続された信号1215において位相の不連続またはステップを回避することが可能である。
【0079】
さらに、パッチジェネレータ110は、クロスフェードされた信号1215を得るために、ハーモニックパッチングアルゴリズム515から生成される現在の帯域幅拡張された時間ブロック(m’)1202とコピーアップパッチングアルゴリズム1025から生成される時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)1204との間でクロスフェードオペレーション1210を実行するように構成されうる。クロスフェードオペレーション1210の結果、現在の帯域幅拡張された時間ブロック(m’)1202と、時間的に先行する帯域幅拡張された時間ブロック(m’−1)または時間的に後続する帯域幅拡張された時間ブロック(m’+1)とは、その遷移領域1217において少なくとも部分的にオーバーラップする。図12において、クロスフェードオペレーションの後に得られる例示的な信号1214が表される。例えば、クロスフェードオペレーション1210は、連続したブロック1202、1204のそれぞれの開始領域が0から1の範囲の例示的な重みファクタによって重み付けられ、連続したブロック1202、1204のそれぞれの終了領域が1から0の範囲の例示的な重みファクタによって重み付けられ、さらに、2つの連続したブロック1202、1204がその遷移領域1217において時間的にオーバーラップされるように、実行される。この遷移領域1217においてクロスフェード領域は、例えば、50%の連続したブロック1202、1204のオーバーラップに対応することができる。クロスフェードオペレーション1210を実行することによって、ブロック境界でのクリッキングアーチファクトひいては知覚的な品質の低下を回避することが可能である。
【0080】
図11の概略図1100において、図12に関して記載される位相連続/クロスフェードオペレーション1210は、「クロスフェードおよびフェーズアライメント領域」で示される矢印1132で例示的に表される。特に、矢印1132は、帯域幅制限されたオーディオ信号105において非トランジェント領域からトランジェント領域1107への遷移に対応する、ハーモニックパッチングアルゴリズム515から生成されるパッチされた信号からコピーアップパッチングアルゴリズム1025から生成されるパッチされた信号への遷移(またはその逆)が生じるときに、位相連続/クロスフェードオペレーション1210が好ましくは実行されることを示す。このようにして、例えばブロック境界での位相中断またはクリッキングアーチファクトによる帯域幅拡張された信号135のための知覚的な品質の低下を回避することが可能である。
【0081】
コピーアップパッチングアルゴリズムの同じタイプから得られる帯域幅拡張された時間ブロック間の遷移の間、コピーアップパッチングアルゴリズムが位相連続/クロスフェードオペレーション1210なしに連続的に実行されることは、図11に概略的に表される。これは、図11に「コピーアップ(クロスフェードなし)」で示される矢印1134で例示的に表される。これは、基本的に、クロスフェードオペレーションが帯域幅制限されたオーディオ信号105のトランジェント領域1107に対応する帯域幅拡張された時間ブロックのために実行されないということに対応する。
【0082】
さらに、「クロスフェードおよびフェーズアライメントを有するコピーアップ」で示される矢印1136が、図11に例示的に表される。この矢印1136は、トランジェント領域1107に対応する帯域幅拡張された時間ブロックのために、位相連続/クロスフェードオペレーション1210が(例えば、矢印1134で示されるように)実行されないことを示す一方、ハーモニックパッチングアルゴリズムから生成されるパッチされた信号およびコピーアップパッチングアルゴリズムから生成されるパッチされた信号間の遷移領域において(すなわち、異なるタイプのパッチングアルゴリズムを用いるときに)、位相連続/クロスフェードオペレーション1210は、(例えば、矢印1132で示されるように)実行される。
【0083】
図13は、帯域幅制限されたオーディオ信号から帯域幅拡張された信号を生成するための装置100のさらなる実施形態のブロック図を示す。図13の実施形態によれば、帯域幅拡張された信号は、時間領域出力135によって表されうる一方、帯域幅制限されたオーディオ信号は、例えば、図2および図4に関して記載されるような複数の周波数サブバンド信号215、415によって表されうる。図13の実施形態において、装置100は、コアデコーダ1310、図2および図4のQMF分析フィルタバンク210、410、パッチジェネレータ110、エンベロープ調整ユニット1320および図2および図4のQMF合成フィルタバンク220、420を含む。さらに、図13に示されるパッチジェネレータ110は、ハーモニックパッチングアルゴリズム515を実行するための第1のパッチングユニット、コピーアップパッチングアルゴリズム525を実行するための第2のパッチングユニットおよび例えば図12に関して記載されるような位相連続/クロスフェードオペレーション1210を実行するためのコンバイナを含む。
【0084】
特に、コアデコーダ1310は、帯域幅制限されたオーディオ信号を表すビットストリーム1305から復号化された低周波信号205を提供するように構成されうる。QMF分析フィルタバンク210、410は、復号化された低周波信号205を複数の周波数サブバンド信号215、415に変換するように構成されうる。「HBEパッチング(フレームn−1)」で示される第1のパッチングユニットは、時間的に先行する帯域幅制限された時間ブロック(ここで、フレームn−1で示される)を用いて、第1のパッチされた信号1307を得るために、複数の周波数サブバンド信号215、415に作動するように構成されうる。さらに、パッチジェネレータ110の第2のパッチングユニットは、現在の帯域幅制限された時間ブロック(ここで、フレームnで示される)を用いて、第2のパッチされた信号1309を得るために、複数の周波数サブバンド信号215、415に作動するように構成されうる。さらに、「位相連続およびクロスフェードを有するコンバイナ」で示されるパッチジェネレータ110のコンバイナは、パッチされた信号115を表す位相連続された/クロスフェードされた信号1215を得るために、位相連続/クロスフェードオペレーション1210を用いて、第1のパッチされた信号1307および第2のパッチされた信号1309を結合するように構成されうる。ここで、図13に示されるパッチジェネレータ110が図9に記載されるようなパッチングアルゴリズム情報911に対応する切り替え情報(例えば、トランジェントフラグ)を受信するように構成されうることに留意すべきである。例えば、パッチジェネレータ110は、トランジェントフラグが帯域幅制限されたオーディオ信号の定常性を示すときに、第1のパッチングユニットによってハーモニックパッチングアルゴリズム515を実行し、さらに、トランジェントフラグが帯域幅制限されたオーディオ信号の非定常性を示すときに、コピーアップパッチングアルゴリズム525を実行するように構成される。エンベロープ調整ユニット1320は、エンベロープ調整された信号1325を得るために、SBRパラメータ121に依存して、パッチジェネレータ110によって提供される位相連続された/クロスフェードされた信号1215のエンベロープを調整するように構成されうる。さらに、QMF合成フィルタバンク220、420は、帯域幅拡張された信号を表す時間領域出力135を得るために、エンベロープ調整ユニット1320によって提供されるエンベロープ調整された信号1325およびQMF分析フィルタバンク210、410によって提供される複数の周波数サブバンド信号215、415を結合するように構成されうる。
【0085】
本発明は、ブロックが実際のまたは論理的なハードウェアコンポーネントを表すブロック図との関連で記載されているにもかかわらず、本発明は、コンピュータ実施方法によって実施することもできる。後者の場合、ブロックは、ステップが対応する論理的なまたは物理的なハードウェアブロックによって実行される機能を表す対応する方法ステップを表す。
【0086】
記載された実施形態は、本発明の原理のために単に例示するだけである。ここに記載される構成および詳細の修正および変更が他の当業者にとって明らかであるものと理解される。したがって、本発明は、特許請求の範囲によってだけ制限され、ここに実施形態の記述および説明として示される具体的な詳細によって制限されないと意図される。
【0087】
いくつかの態様が装置との関連で記載されているにもかかわらず、これらの態様は、対応する方法の説明も表すことも明らかであり、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップとの関連で記載されている態様は、対応するブロック若しくはアイテムまたは対応する装置の特徴の説明も表す。方法ステップのいくらかまたはすべては、例えば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路のようなハードウェア装置によって(またはそれを用いて)実行されてもよい。いくつかの実施形態において、最も重要な方法ステップのいずれかの1つ以上は、そのような装置によって実行されてもよい。
【0088】
特定の実施要件に応じて、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。実施は、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または協働することができる)電子的に可読の制御信号が格納される、デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ(登録商標)、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリを用いて実行することができる。したがって、デジタル記憶媒体は、コンピュータ可読であってもよい。
【0089】
本発明によるいくつかの実施形態は、ここに記載される方法のうちの1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に可読の制御信号を有するデータキャリアを含む。
【0090】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、そのプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに、それらの方法のうちの1つを実行するために働く。プログラムコードは、例えば、機械可読のキャリアに格納されてもよい。
【0091】
他の実施形態は、機械可読のキャリアに格納される、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0092】
したがって、換言すれば、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、ここに記載される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0093】
したがって、本発明の方法のさらなる実施形態は、それに記録される、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムを含むデータキャリア(またはデジタル記憶媒体またはコンピュータ可読の媒体)である。データキャリア、デジタル記憶媒体または記録媒体は、典型的に有形でありおよび/または一時的でない。
【0094】
したがって、本発明の方法のさらなる実施形態は、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは一連の信号は、例えば、データ通信接続を介して、例えばインターネットを介して、転送されるように構成されてもよい。
【0095】
さらなる実施形態は、ここに記載される方法のうちの1つを実行するように構成されまたは適している処理手段、例えばコンピュータまたはプログラム可能な論理デバイスを含む。
【0096】
さらなる実施形態は、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。
【0097】
本発明によるさらなる実施形態は、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムをレシーバに(例えば、電子的にまたは光学的に)転送するように構成される装置またはシステムを含む。レシーバは、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置またはシステムは、例えば、コンピュータプログラムをレシーバに転送するためのファイルサーバを含んでもよい。
【0098】
いくつかの実施形態において、プログラム可能な論理デバイス(例えばフィールドプログラム可能なゲートアレイ)は、ここに記載される方法の機能のいくらかまたはすべてを実行するために用いられてもよい。いくつかの実施形態において、フィールドプログラム可能なゲートアレイは、ここに記載される方法のうちの1つを実行するために、マイクロプロセッサと協働してもよい。一般に、その方法は、好ましくは、いかなるハードウェア装置によっても実行される。
【0099】
上述の実施形態は、本発明の原理のために単に例示するだけである。ここに記載される構成および詳細の修正および変更が他の当業者にとって明らかであるものと理解される。したがって、本発明は、特許請求の範囲によってだけ制限され、ここに実施形態の記述および説明として示される具体的な詳細によって制限されないと意図される。
【0100】
本発明の実施形態は、オーディオ信号のために低遅延ハーモニック帯域幅拡張スキームのための概念を提供する。
【0101】
要約すると、本発明による実施形態は、SSBベースのパッチングおよびHBEベースのパッチングの結合からなる混合パッチングスキームを用い、フェーズボコーダベースのHBEのアルゴリズム遅延は、補償されなく、すなわち、HBEパッチングは、コア符号化されたLF部分と比較して遅延される。本発明によるいくつかの実施形態は、時間ブロックベースにおいて混合パッチング方法のアプリケーションを提供する。いくつかの実施形態によれば、SSBベースのパッチングは、トランジェント領域において適用されるべきであり、サブバンドにわたる垂直コヒーレンスを確実にすることが重要であり、さらに、HBEベースのパッチングは、定常部分のために用いられるべきであり、信号のハーモニック構造を維持することが重要である。本発明の実施形態は、信号の音の領域の定常性質により、両方のパッチングアルゴリズム間の切り替えが信頼できる信号依存分類によって制御されるべきであるように、HBEベースのパッチングの遅延が帯域幅拡張された信号に悪影響を与えないという利点を提供する。例えば、所定の時間ブロックのためのパッチングアルゴリズムは、ビットストリームを介して送信することができる。HFスペクトルの異なる領域の完全な適用範囲のために、BWE(帯域幅拡張)は、例えば、いくつかのパッチを含む。SSBコピーアップオペレーションのために、低周波数情報を用いることができる。HBEにおいて、より高いパッチは、複数のフェーズボコーダによって生成することができ、または、高域スペクトル領域を占有する高次のパッチは、計算的に効率的なSSBコピーアップパッチングと中間スペクトル領域をカバーする低次のパッチとによって生成することができ、ハーモニック構造の保存が好ましくはHBEパッチングよって要求される。パッチング方法の個々の混合は、経時的にスタティックであり、または、好ましくは、ビットストリームにおいて信号で送ることができる。
【0102】
2つのパッチのために例示される新しいパッチングのいくつかのアルゴリズムは、図7aおよび図8aに示される。しかしながら、SSBおよびHBEは、図5a(または図6a)に関して記載されるように結合することができる。HBEのアプリケーションは、f(フレームx)として示される。HBE処理が例えば他のオーバーラップおよび加算方法のような信号の定常性を活用する他の帯域幅拡張技術によって交換することができることは、注目すべきである。
【0103】
本発明の実施形態は、規則的なHBEパッチングと比較して、定常信号部分の改良された知覚的な品質およびより低いアルゴリズム遅延の利点を提供する。
【0104】
本発明の処理は、帯域幅拡張スキームに依存するオーディオコーデックを強化することに役立つ。この処理は、所定のビットレートで最適な知覚的な品質が非常に重要であり、さらに、同時に、低い全体のシステム遅延が要求される場合に、特に役立つ。
【0105】
大部分の顕著なアプリケーションは、非常に小さい時間遅延を要求する通信シナリオのために用いられるオーディオデコーダである。
図1
図2
図3
図4
図5a
図5b
図6a
図6b
図7a
図7b
図8a
図8b
図9
図10
図11
図12
図13