特表2016-539377(P2016-539377A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特表2016-539377低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2016-539377(P2016-539377A)
(43)【公表日】2016年12月15日
(54)【発明の名称】低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法
(51)【国際特許分類】
   G10L 19/02 20130101AFI20161118BHJP
   G10L 21/038 20130101ALI20161118BHJP
【FI】
   G10L19/02 150
   G10L21/038
   G10L19/02 160A
【審査請求】有
【予備審査請求】未請求
【全頁数】25
(21)【出願番号】特願2016-536886(P2016-536886)
(86)(22)【出願日】2014年11月28日
(85)【翻訳文提出日】2016年6月17日
(86)【国際出願番号】EP2014076000
(87)【国際公開番号】WO2015086351
(87)【国際公開日】20150618
(31)【優先権主張番号】13196305.0
(32)【優先日】2013年12月9日
(33)【優先権主張国】EP
(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JP,KE,KG,KN,KP,KR,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG,US
(71)【出願人】
【識別番号】500341779
【氏名又は名称】フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100085497
【弁理士】
【氏名又は名称】筒井 秀隆
(72)【発明者】
【氏名】ニーデルマイエル,アンドレアス
(72)【発明者】
【氏名】ヴィルデ,ステファン
(72)【発明者】
【氏名】フィッシャー,ダニエル
(72)【発明者】
【氏名】ヒルデンブラント,マティアス
(72)【発明者】
【氏名】ガイエル,マルク
(72)【発明者】
【氏名】ノイエンドルフ,マックス
(57)【要約】
第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する装置は、第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号を受信するための入力インターフェイス(100)と、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号(101)を復号化するためのプロセッサ(102)と、符号化済み信号に対して帯域幅拡張制御データが第1のハーモニック帯域幅拡張モードを示している場合でも、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するようプロセッサ(102)を制御するためのコントローラ(104)と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する装置であって、
前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれかを示す前記帯域幅拡張制御データを含む前記符号化済みオーディオ信号を受信するための入力インターフェイス(100)と、
前記第2の非ハーモニック帯域幅拡張モードを使用して、前記オーディオ信号(101)を復号化するためのプロセッサ(102)と、
前記帯域幅拡張制御データが前記符号化済み信号について前記第1のハーモニック帯域幅拡張モードを示している場合でも、前記第2の非ハーモニック帯域幅拡張モードを使用して前記オーディオ信号を復号化するよう、前記プロセッサ(102)を制御するためのコントローラ(104)と、
を備える装置。
【請求項2】
請求項1に記載の装置において、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有し、前記メモリ又は処理資源は前記第1のハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのには十分でない、装置。
【請求項3】
請求項1又は2に記載の装置において、
前記入力インターフェイス(100)は前記帯域幅拡張制御データを読み出し、前記符号化済みオーディオ信号が前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれを使用して復号化されるべきかを決定し、かつ前記帯域幅拡張制御データをプロセッサ制御レジスタ内に格納するよう構成され、
前記コントローラ(104)は前記プロセッサ制御レジスタにアクセスし、前記入力インターフェイス(100)が前記第1のハーモニック帯域幅拡張モードを示す値を格納していた場合に、前記第2の非ハーモニック帯域幅拡張モードを示す値によって前記プロセッサ制御レジスタ内の値を上書きするよう構成されている、装置。
【請求項4】
請求項1乃至3のいずれか1項に記載の装置において、前記符号化済みオーディオ信号は前記第1のハーモニック帯域幅拡張モードと前記第2の非ハーモニック帯域幅拡張モードとについて共通の帯域幅拡張ペイロードデータ(302)を含み、かつ前記第1のハーモニック帯域幅拡張モードのみについての追加的ペイロードデータ(304)を含み、
前記コントローラ(104)は、前記追加的ペイロードデータ(304)を使用して、前記第2の非ハーモニック帯域幅拡張モードにおけるパッチング操作に比べて、前記プロセッサによって実行されるパッチング操作を修正するように前記プロセッサ(102)を制御するよう構成され、前記修正されたパッチング操作は非ハーモニックパッチング操作である、装置。
【請求項5】
請求項4に記載の装置において、
前記追加的ペイロードデータ(304)は、前記符号化済みオーディオ信号のハーモニック特性に関する情報を含み、
前記コントローラ(104)は、前記符号化済みオーディオ信号を復号化する際にパッチング操作を実行するため、前記プロセッサ(102)によって使用されるパッチングバッファのパッチングバッファコンテンツ(828、830、832)を、パッチ済み信号のハーモニック特性が前記パッチングバッファコンテンツを修正しないパッチ済み信号のハーモニック特性に比べて前記ハーモニック特性により近くなるように、修正するよう構成されている、装置。
【請求項6】
請求項4又は5に記載の装置において、
前記コントローラ(104)は、
前記追加的ペイロードデータからピッチ周波数を示すハーモニックグリッドを計算(310)し、
周波数境界を持つパッチングソース帯域と周波数境界を持つパッチング目標帯域とについて、パッチングソース情報とパッチング目標情報とを決定(312)し、
前記ハーモニックグリッドに合致しているパッチングソース帯域内の周波数部分が、パッチング(914)の後に、前記ハーモニックグリッドに合致している目標周波数部分(912)内に配置されるように、パッチング(914)操作の前又は後に、前記パッチングソース帯域内の前記データを前記周波数境界内で修正(314)する、
よう構成されている装置。
【請求項7】
請求項4乃至6のいずれか1項に記載の装置において、
前記プロセッサ(102)はパッチングバッファを備え、
前記プロセッサは前記共通の帯域幅拡張ペイロードデータを使用して前記パッチングバッファをロード(400)するよう構成され、
前記コントローラは、前記符号化済みオーディオ信号のハーモニックグリッドを示す追加の帯域幅拡張データを使用し、パッチソース帯域情報(903)及びパッチ目標帯域情報(908)を使用して、バッファシフト値を計算(402)するよう構成され、
前記コントローラは、バッファコンテンツに対してバッファシフト操作を生じさせる(404)よう構成され、
前記プロセッサ(102)は前記バッファシフト値によってシフトされた前記バッファコンテンツを使用してパッチ済みデータを生成(406、408)するよう構成されている、装置。
【請求項8】
請求項7に記載の装置において、前記コントローラは循環方式の前記バッファシフト操作を生じさせる(404)よう構成されている、装置。
【請求項9】
請求項1乃至8のいずれか1項に記載の装置において、
前記プロセッサは、
コア符号化済みオーディオ信号(902)を復号化するコア復号器(500)と、
前記符号化済みオーディオ信号からの帯域幅拡張データを使用して、前記コア符号化済みオーディオ信号のソース周波数領域を、前記非ハーモニック帯域幅拡張モードに従って目標周波数領域へパッチングするパッチャ(502)と、
前記符号化済みオーディオ信号からの帯域幅拡張データを使用して、前記目標周波数領域におけるパッチ済み信号を修正するパッチ修正器(504)と、を備える装置。
【請求項10】
請求項1乃至9のいずれか1項に記載の装置において、
前記帯域幅拡張制御データは、複数のオーディオのフレームを含む1つのオーディオ項目についての第1の制御データエンティティ(114)と、前記符号化済みオーディオ信号の各フレームについての第2の制御データエンティティ(116a,118a,120a)とを含み、前記第1の制御データエンティティは前記第1のハーモニック帯域幅拡張モードが前記複数のフレームについて活性か又は不活性かを示し、前記第2の制御データエンティティは前記第1のハーモニック帯域幅拡張モードが前記符号化済みオーディオ信号の各個別のフレームについて活性か又は不活性かを示しており、
前記入力インターフェイス(100)は、前記オーディオ項目についての前記第1の制御データエンティティと前記複数のフレームの各フレームについての前記第2の制御データエンティティとを読み出すよう構成され、
前記コントローラ(104)は、第1の制御データエンティティの値及び第2の制御データエンティティの値とは関係なく、前記第2の非ハーモニック帯域幅拡張モードを使用して前記オーディオ信号を復号化するように、前記プロセッサ(102)を制御するよう構成されている、装置。
【請求項11】
請求項1乃至10のいずれか1項に記載の装置において、
前記符号化済みオーディオ信号はUSAC標準によって定義されたビットストリームであり、
前記プロセッサ(102)は前記USAC標準によって定義された前記第2の非ハーモニック帯域幅拡張モードを実行するよう構成され、
前記入力インターフェイスは前記USAC標準に従って前記符号化済みオーディオ信号を含む前記ビットストリームを解析するよう構成されている、装置。
【請求項12】
請求項1乃至11のいずれか1項に記載の装置において、
前記符号化済みオーディオ信号が符号化済みステレオ又は多チャネルオーディオ信号である場合に、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有し、前記メモリ又は処理資源は前記第1のハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのには十分でなく、
前記符号化済みオーディオ信号が符号化済みモノラル信号である場合に、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モード及び前記第1のハーモニック帯域幅拡張モードを使用して、前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有する、装置。
【請求項13】
第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する方法であって、
前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれかを示す前記帯域幅拡張制御データを含む前記符号化済みオーディオ信号を受信するステップ(100)と、
前記第2の非ハーモニック帯域幅拡張モードを使用して、前記オーディオ信号(101)を復号化するステップ(102)と、
前記帯域幅拡張制御データが前記符号化済み信号について前記第1のハーモニック帯域幅拡張モードを示している場合でも、前記第2の非ハーモニック帯域幅拡張モードを使用して前記オーディオ信号を復号化するよう、前記プロセッサ(102)を制御するステップ(104)と、
を含む方法。
【請求項14】
コンピュータ上で作動するとき、請求項13に従って符号化済みオーディオ信号を復号化する方法を実行するためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はオーディオ処理に関し、特に低減された演算資源を用いて符号化済みオーディオ信号を復号化する概念に関するものである。
【背景技術】
【0002】
「スピーチ及びオーディオ統合符号化」(USAC)標準(非特許文献1)は、ハーモニック転換器を用いたハーモニック帯域幅拡張ツールHBEを標準化しており、このツールはスペクトル帯域複製(SBR)システムの拡張であり、非特許文献1及び2においてそれぞれ標準化されている。
【0003】
SBRは、所与の低周波数部分を所与のサイド情報と一緒に使用することによって、帯域幅制限されたオーディオ信号の高周波コンテンツを合成する。SBRツールは非特許文献2に記載されており、強化されたSBR、つまりeSBRは非特許文献1に記載されている。位相ボコーダを用いるハーモニック帯域幅拡張HBEはeSBRの一部であり、標準的なSBR処理において実行されるコピーパッチング(copy-up patching)された信号の中で度々観測される聴覚的粗さを避けるために発展してきた。HBEの主たる目的は、eSBRを適用しながら、所与のオーディオ信号の合成された高周波領域におけるハーモニックな構造を保存することである。
【0004】
符号器がHBEツールの使用を選択できる一方で、非特許文献1に適合する復号器は、HBE関連データの復号化及び適用を提供しなければならない。
【0005】
リスニング試験(非特許文献3)は、HBEを使用することで、非特許文献1に従って復号化されたビットストリームの知覚的オーディオ品質を改善するであろうことを示している。
【0006】
HBEツールは、従来のSBRシステムの単純なコピーパッチングを、先進的な信号処理手順によって置き換えるものである。これら手順は、フィルタ状態及び遅延ラインのために、かなりの量の処理パワーとメモリとを必要とする。これとは対照的に、コピーパッチングの演算複雑性は無視できる。
【0007】
HBEについて観測された複雑性の増大は、パーソナルコンピュータ装置については問題にならない。しかしながら、復号器チップを設計するチップ製作者は、演算上の作業量とメモリ消費に関して、確実で複雑性の低い制約を求めている。その一方で、聴覚的粗さを避ける目的で、HBE処理が望まれている。
【0008】
USAC−ビットストリームは、非特許文献1に記載のように復号化される。このことは、非特許文献1の7.5.3に記載のように、HBE復号器ツールの実装を必然的に暗示している。このツールは、eSBR処理を含む全てのコーデック作動ポイントにおいて信号伝達され得る。非特許文献1のプロファイルと適合基準を満足する復号器装置にとって、このことは、演算上の作業量とメモリ消費の全体が、最悪の場合には有意に増大することを意味している。
【0009】
演算複雑性における実際の増大は、実装とプラットフォームに依存する。オーディオチャネル毎のメモリ消費の増大は、メモリが最適化された現在の実装においては、実際のHBE処理について少なくとも15kワードである。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】[1]ISO/IEC 23003-3:2012: “Unified speech and audio coding”
【非特許文献2】[2]ISO/IEC 14496-3:2009: “Audio”
【非特許文献3】[3]ISO/IEC JTCI/SC29/WG11 MPEG2011/N12232: “USAC Verification Test Report”
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明の目的は、現存の符号化済みオーディオ信号を処理するために、低い演算量でかつそれにも拘わらず適切な、符号化済みオーディオ信号を復号化する改良された概念を提供することである。
【課題を解決するための手段】
【0012】
この目的は、請求項1に従う符号化済みオーディオ信号を復号化する装置、請求項13に従う符号化済みオーディオ信号を復号化する方法、又は請求項14に従うコンピュータプログラムによって達成される。
【0013】
本発明は、次のような知見に基づいている。すなわち、ハーモニック帯域幅拡張モードを使用して復号化されるべき部分を含み、非ハーモニック帯域幅拡張モードを使用して復号化されるべき部分をさらに含むオーディオ信号が、全体信号に亘って非ハーモニック帯域幅拡張モードだけを使用して復号化される場合、低減されたメモリ資源を必要とするオーディオ復号化概念が達成されるという知見である。換言すれば、ある信号がハーモニック帯域幅拡張モードを使用して復号化されるべく信号伝達されている部分又はフレームを含む場合であっても、これら部分又はフレームが非ハーモニック帯域幅拡張モードを使用して復号化されるということである。この目的で、非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するためのプロセッサが提供され、加えて、符号化済みオーディオ信号内に含まれた帯域幅拡張制御データがそのオーディオ信号について第1の−つまりハーモニックな−帯域幅拡張モードを示す場合であっても、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するようにプロセッサを制御するために、その装置内にコントローラが実装されるか、又は復号化の方法の中で制御ステップが実行される。それ故、プロセッサは、演算的に非常に効率的な非ハーモニック帯域幅拡張モードにだけ対応するための、メモリ及び処理パワーのような対応するハードウエア資源だけを持って実装されればよい。他方で、オーディオ復号器は、許容可能な品質を持つ復号化済み信号を得るために、符号化済みオーディオ信号を受け入れかつハーモニック帯域幅拡張モードを用いて復号化することもできる。換言すれば、低い演算資源要求アプリケーションに対しては、たとえ符号化済みオーディオ信号それ自体が、内部に含まれた帯域幅拡張制御データによって、この信号の少なくとも複数の部分がハーモニック帯域幅拡張モードを使用して復号化されることを必要としたとしても、コントローラは、全体のオーディオ信号を、非ハーモニック帯域幅拡張モードを使用して復号化するように、プロセッサを制御するよう構成されている。このように、両方の帯域幅拡張モードを必要とする符号化済みオーディオ信号に対し、完全な後方互換性を維持しながら、演算資源を一方としオーディオ品質を他方とする二者間の良好な妥協が取得される。本発明は、特にUSAC復号器の演算量とメモリ要求を低減するという事実により有利である。さらに、好適な実施形態において、所定の又は標準化された非ハーモニック帯域幅拡張モードは、基本的に非ハーモニック帯域幅拡張モードのためには必要でない帯域幅拡張モードデータをできるだけ再利用するためにビットストリーム内で伝送されたハーモニック帯域幅拡張モードデータを使用して修正され、その非ハーモニック帯域幅拡張モードのオーディオ品質が改善される。このように、USAC標準(非特許文献1)において開示された位相ボコーダ処理に典型的に基づいているハーモニック帯域幅拡張モードを省略することに起因する知覚的品質の障害を緩和するために、この好適な実施形態において、代替的復号化スキームが提案される。
【0014】
一実施形態では、符号化済みオーディオ信号が符号化済みステレオ又は多チャネルオーディオ信号である場合、プロセッサは第2の非ハーモニック帯域幅拡張モードを使用して符号化済みオーディオ信号を復号化するのに十分なメモリ資源と処理資源とを有する一方で、そのメモリ資源又は処理資源は第1のハーモニック帯域幅拡張モードを使用して符号化済みオーディオ信号を復号化するのには十分でない。これと対照的に、符号化済みオーディオ信号が符号化済みモノラル信号である場合、プロセッサは第2の非ハーモニック帯域幅拡張モードを使用し、かつ第1のハーモニック帯域幅拡張モードを使用して、符号化済みオーディオ信号を復号化するのに十分なメモリ資源と処理資源とを有する。なぜなら、モノラル復号化のための資源は、ステレオ又は多チャネル復号化のための資源に比べて低減されるからである。よって、利用可能な資源はビットストリーム構成、すなわちツールとサンプリングレート等との組合せに依存する。例えば、資源はハーモニックBWEを使用してモノラルビットストリームを復号化するのには十分であるが、プロセッサはハーモニックBWEを使用してステレオビットストリームを復号化するためには資源不足となる可能性がある。
【0015】
以下に、好適な実施形態について添付の図面を参照しながら以下に説明する。
【図面の簡単な説明】
【0016】
図1a】限られた資源のプロセッサを使用して符号化済みオーディオ信号を復号化するための装置の一実施形態を示す。
図1b】両方の帯域幅拡張モードについての符号化済みオーディオ信号データの一例を示す。
図1c】USAC標準復号器と新規な復号器とを示す表である。
図2図1aのコントローラを構成するための実施形態のフローチャートを示す。
図3a】共通の帯域幅拡張ペイロードデータと追加のハーモニック帯域幅拡張データとを有する、符号化済みオーディオ信号の他の構造を示す。
図3b】標準の非ハーモニック帯域幅拡張モードを修正するためのコントローラの構成を示す。
図3c】コントローラの他の構成を示す。
図4】改良された非ハーモニック帯域幅拡張モードの一構成を示す。
図5】プロセッサの好適な構成を示す。
図6】単一チャネル要素のための復号化手順のシンタックスを示す。
図7a】チャネルペア要素のための復号化手順のシンタックスの前半を示す。
図7b】チャネルペア要素のための復号化手順のシンタックスの後半を示す。
図8a】改良された非ハーモニック帯域幅拡張モードの他の構成を示す。
図8b図8aに示されたデータの概要を示す。
図8c】コントローラによって実行された非ハーモニック帯域幅拡張モードの改良の他の構成を示す。
図8d】パッチングバッファとそのパッチングバッファのコンテンツのシフトとを示す。
図9】非ハーモニック帯域幅拡張モードの好ましい修正の説明を示す。
【発明を実施するための形態】
【0017】
図1aは、符号化済みオーディオ信号を復号化する装置の一実施形態を示す。符号化済みオーディオ信号は、第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す、帯域幅拡張制御データを含む。符号化済みオーディオ信号はライン101によって入力インターフェイス100に入力される。入力インターフェイスはライン108を介して限られた資源のプロセッサ102に接続されている。さらに、少なくとも任意にライン106を介して入力インターフェイス100に接続され、さらにライン110を介してプロセッサ102に接続されている、コントローラ104が設けられている。プロセッサ102の出力は、符号112で示すような復号化済みオーディオ信号である。入力インターフェイス100は、符号化済みオーディオ信号の1フレームのような符号化済み部分について、第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す、帯域幅拡張制御データを含む符号化済みオーディオ信号を受信するよう構成されている。プロセッサ102は、図1aのライン110の近傍に示すように、第2の非ハーモニック帯域幅拡張モードのみを使用してオーディオ信号を復号化するよう構成されている。このことは、コントローラ104によって確実になる。コントローラ104は、たとえ帯域幅拡張制御データが符号化済みオーディオ信号について第1のハーモニック帯域幅拡張モードを示していても、第2の非ハーモニック帯域幅拡張モードを使用してそのオーディオ信号を復号化するよう、プロセッサ102を制御するよう構成されている。
【0018】
図1bは、データストリーム又はビットストリーム内の符号化済みオーディオ信号の好ましい構成を示している。符号化済みオーディオ信号は、全体のオーディオ項目についてのヘッダ114を含み、かつ全体のオーディオ項目はフレーム1(116)、フレーム2(118)及びフレーム3(120)のような一連のフレームの中に組織化されている。各フレームはさらに、フレーム1についてのヘッダ116aのような関連ヘッダとフレーム1についてのペイロードデータ116bとを有している。さらに、第2フレーム118も、ヘッダデータ118aとペイロードデータ118bとを有する。同様に、第3フレーム120も、ヘッダ120aとペイロードデータブロック120bとを有する。USAC標準においては、ヘッダ114はフラグ「harmonicSBR」を有する。もしこのフラグ「harmonicSBR」が0であれば、USAC標準に定義されているように、全体のオーディオ項目は非ハーモニック帯域幅拡張モードを使用して復号化される。この文脈においてUSAC標準については、ISO/IEC 1449-3:2009,オーディオ部門である高効率AAC標準(HE−AAC)を参照されたい。しかしながら、harmonicSBRフラグが1の値を有する場合には、ハーモニック帯域幅拡張モードが有効化され、各フレームについて0又は1であり得る個別フラグsbrPatchingModeによって信号伝達され得る。この文脈の中で、2つのフラグの異なる値を示す図1cを参照されたい。このように、フラグharmonicSBRが1で、フラグsbrPatchingModeが0である場合には、USAC標準復号器はハーモニック帯域幅拡張モードを実行する。しかしながら、図1cの130で示される場合、図1aのコントローラ104は、プロセッサ102に非ハーモニック帯域幅拡張モードを実行させるよう制御する。
【0019】
図2は、本発明の手順の好ましい構成を示す。ステップ200では、入力インターフェイス100又は復号化装置の中の他のエンティティが符号化済みオーディオから帯域幅拡張制御データを読み出し、この帯域幅拡張制御データが1フレーム当り1つの指示となり得るか、又は、もし可能なら、USAC標準に関して図1bの文脈において説明したように、1項目当り1つの追加指示となり得る。ステップ202では、プロセッサ102は帯域幅拡張制御データを受け取り、その帯域幅拡張制御データを図1aのプロセッサ102内に実装されている特異な制御レジスタに格納する。次に、ステップ204では、コントローラ104がこのプロセッサ制御レジスタにアクセスし、そして206に示すように、この制御レジスタを非ハーモニック帯域幅拡張を示す値で上書きする。この点は、USACシンタックス内で、単一チャネル要素については図6の符号600で、又はsbr_channel_pair_elementについては図7aのステップ700及び図7bのステップ702、704でそれぞれ示されるように、例示的に示されている。特に、図2のブロック206において示された「上書き」は、USACシンタックス内に行600、700、702、704を挿入することによって実行され得る。特に、図6の残りの部分はISO/IEC DIS 23003-3の表41に対応しており、図7a,7bはISO/IEC DIS 23003-3の表42に対応している。この国際標準は、参照によってその全体が本願に組み込まれる。この標準の中で、図6及び図7a,7bにおける全てのパラメータ/値の詳細な定義が付与されている。
【0020】
特に、600、700、702、704で示されたハイレベルシンタックス内の追加行は次のことを示している。すなわち、602においてビットストリームから読み出された値sbrPatchingModeとは関係なく、sbrPatchingModeフラグは1に設定される。即ち、復号器におけるさらなる処理に対し、非ハーモニック帯域幅拡張モードが実行されるべきことを信号伝達している。重要な点は、シンタックス行600が、604で示されるsbrOversampllingFlag, sbrPitchInBinsFlag及びsbrPitchInBinsからなる特異なハーモニック帯域幅拡張データの復号器側の読み出しの後に配置されていることである。それ故、図6に示され、同様に図7aにも示されるように、符号化済みオーディオ信号は、両方の帯域幅拡張モード、すなわち非ハーモニック帯域幅拡張モードとハーモニック帯域幅拡張モードとについて共通の帯域幅拡張ペイロードデータ606を含んでおり、かつ604で示すようにハーモニック帯域幅拡張モードについて特異な追加のデータを含んでいる。この点は図3aの文脈の中でも後述されるであろう。変数「lpHBE」は本発明の手順、すなわち「低いパワーのハーモニック帯域幅拡張」モードを示しており、このモードは非ハーモニック帯域幅拡張モードであるが、「ハーモニック帯域幅拡張」に関して後述するような追加の修正が加えられたモードである。
【0021】
好適には、図1aに示すように、プロセッサ102は限られた資源のプロセッサである。特に、限られた資源の資源プロセッサ102は、第2の非ハーモニック帯域幅拡張モードを用いてオーディオ信号を復号化するのに十分な処理資源とメモリ資源とを有する。しかしながら、特にそのメモリ又は処理資源は第1のハーモニック帯域幅拡張モードを用いてオーディオ信号を復号化するのには十分でない。図3aで示すように、1フレームは、ヘッダ300と、共通の帯域幅拡張ペイロードデータ302と、ピッチ、ハーモニックグリッドなどに関するデータのような追加のハーモニック帯域幅拡張データ304と、さらに追加的に符号化済みコアデータ306とを含む。しかしながら、これらデータ項目の順序は、図3aと相違していてもよい。異なる好適な実施形態においては、符号化済みコアデータが最初である。次に、sbrPatchingModeフラグ/ビットを有するヘッダ300が続き、追加のHBEデータ304が後続し、最後に共通の帯域幅拡張ペイロードデータ302が続く。
【0022】
追加のハーモニック帯域幅拡張データは、USACの例において、図6の文脈の中で項目604として説明したように、7ビットからなるsbrPitchInBins情報である。特に、USAC標準で示したように、データsbrPitchInBinsはSBRハーモニック転換器において、外積項目(cross-product terms)の加算を制御している。sbrPitchInBinsは0〜127の間の範囲における整数値であり、コアコーダのサンプリング周波数に対して作動している1536−DFTについて、周波数binで測定された距離を表している。特に、sbrPitchInBins情報を使用して、ピッチ又はハーモニックグリッドが決定され得ることが発見された。この点は、図8bの式(1)の中で示されている。このハーモニックグリッドを計算するために、sbrPitchInBins及びsbrRatioの値が計算され、ここでSBR比は上述の図8bにおいて示される通りであり得る。
【0023】
当然ながら、ハーモニックグリッド、ピッチ、又はハーモニックグリッドを定義している基本トーンの他の指示がビットストリーム内に含まれ得る。このデータは第1のハーモニック帯域幅拡張モードを制御するために使用され、本発明の一実施形態では、いかなる修正もない非ハーモニック帯域幅拡張モードが実行されるように、廃棄され得る。しかしながら、他の実施形態では、図3b及び他の図に示すように、単純な非ハーモニック帯域幅拡張モードはハーモニック帯域幅拡張モードについての制御データを使用して修正される。換言すれば、符号化済みオーディオ信号は、第1のハーモニック帯域幅拡張モードと第2の非ハーモニック帯域幅拡張モードとについての共通の帯域幅拡張ペイロードデータ302を含み、かつ第1のハーモニック帯域幅拡張モードについての追加的ペイロードデータ304を含む。この文脈で、図1に示されたコントローラ104は、プロセッサ102を制御するために追加的ペイロードデータを使用するよう構成され、それは、如何なる修正もなしに第2の非ハーモニック帯域幅拡張モードでパッチング操作を行う場合に比べて、プロセッサによって実行されるパッチング操作を修正するためである。この目的で、プロセッサ102は図3bに示されるようなパッチングバッファを有することが望ましく、そのバッファの具体的な構成は図8dに関して例示的に説明される。
【0024】
さらなる実施形態において、第1のハーモニック帯域幅拡張モードについての追加的ペイロードデータ304は、符号化済みオーディオ信号のハーモニック特性に関する情報を含み、このハーモニック特性は、sbrPitchInBinsデータ、他のハーモニックグリッドデータ、基本トーンデータ、又は如何なる他のデータであってもよく、他のデータとは、符号化済みオーディオ信号の対応する部分のハーモニックグリッド、基本トーン、又はピッチがそのデータから導出され得るデータのことである。コントローラ104は、符号化済みオーディオ信号を復号化する際にパッチング操作を実行するために、プロセッサ102によって使用されるパッチングバッファのパッチングバッファコンテンツを修正するよう構成されており、それにより、パッチ信号のハーモニック特性がパッチングバッファを修正しないパッチ済み信号に比べて前記ハーモニック特性により近くなる。
【0025】
この目的で、図9を参照されたい。ここでは、符号900において、ハーモニックグリッドk・f0におけるスペクトルラインを有するオリジナルスペクトルを示し、ハーモニックラインは1からNまで延びている。さらに、基本トーンf0は、この実例では3に等しく、その結果、ハーモニックグリッドは3の全ての倍数を含む。さらに、項目902はパッチング前の復号化済みコアスペクトルを示している。特に、クロスオーバー周波数x0は16の位置で示され、パッチソースは周波数ライン4から周波数ライン10まで延びるように示されている。パッチソースの開始及び/又は終了周波数は、好ましくは符号化済みオーディオ信号の中で信号伝達され、典型的には図3aの共通の帯域幅拡張ペイロードデータ302の中のデータとして信号伝達される。項目904は項目902と同じ状況を示しているが、906に追加的に計算されたハーモニックグリッドk・f0を有している。さらに、パッチ目標(patch destination)908が示されている。このパッチ目標は、図3aの共通の帯域幅拡張ペイロードデータ302の中に好ましくは追加的に含まれる。よって、パッチソースは903で示すようにソース範囲の低域周波数を示しており、パッチ目標はパッチ目標の低域側境界を示している。もし、910で示すように典型的な非ハーモニックなパッチングが適用された場合には、パッチ済みデータの調性ライン又はハーモニックラインと計算されたハーモニックグリッド906との間に不一致が存在することが見て取れるであろう。それ故、従来のSBRパッチング、単純なUSAC又は高効率AACの非ハーモニックパッチングモードでは、誤ったハーモニックグリッドを持つパッチを導入することになる。この問題を解決するため、プロセッサによってこの単純な非ハーモニックパッチの修正が実行される。修正の一つの方法は、パッチングバッファのコンテンツを回転させること、別の言い方をすれば、ハーモニックラインの周波数における距離を変化させずに、ハーモニックラインをパッチング帯域内で移動させることである。パッチのハーモニックグリッドをパッチング前の復号化済みスペクトルの計算されたハーモニックグリッドに一致させる他の方法は、当業者にとって自明のことである。本発明のこの好ましい実施形態では、符号化済みオーディオ信号内に共通の帯域幅拡張ペイロードデータと共に含まれている追加のハーモニック帯域幅拡張データは、単純に廃棄されるのではなく、典型的にはビットストリーム内で信号伝達されている非ハーモニック帯域幅拡張モードを修正することによって、オーディオ品質を改善するために再利用される。しかしながら、修正された非ハーモニック帯域幅拡張モードが依然として隣接する周波数binのセットの隣接する周波数binのセットへのコピー操作に依存する非ハーモニック帯域幅拡張モードであるという事実により、この手順は、単純な非ハーモニック帯域幅拡張モードを実行する場合に比べてメモリ資源の増量という結果を招くことがない一方で、図9の912で示すようにハーモニックグリッドの一致により、再生された信号のオーディオ品質を有意に強化する。
【0026】
図3cは、図3bのコントローラ104によって実行される好ましい構成を示す。ステップ310では、コントローラ104は追加のハーモニック帯域幅拡張データからハーモニックグリッドを計算し、この目的で如何なる計算が実行されてもよいが、USACの文脈においては、図8bの式(1)が実行される。さらに、ステップ312ではパッチングソース帯域及びパッチング目標帯域が決定され、すなわち、この決定は基本的に、共通の帯域幅拡張データからパッチソースデータ903とパッチ目標データ908とを読み出すことを含んでも良い。しかしながら、他の実施形態においては、このデータは予め定義されており、従って既に復号器側に知られており、必ずしも伝送される必要はない。
【0027】
ステップ314では、パッチングソース帯域が周波数境界内で修正される。つまりパッチソースのパッチ境界は、伝送されたデータに比べて変更されない。この修正は、パッチングの前、つまりパッチデータが902で示されたパッチングの前のコア又は復号化済みスペクトルに関連しているとき、又はパッチコンテンツが高周波数領域に既に転換された後、のいずれでも実行可能であり、すなわち図9の中でパッチングが矢印914で示され、符号910と、回転がパッチングの後で実行された符号912とによって示されている。
【0028】
このパッチング914又は「コピー」は、非ハーモニックパッチングであり、図9においては、周波数刻み6個分を持つパッチソースの広がりと、目標領域内の同じ周波数刻み6個分を持つ広がり、即ち、910又は912の広がりとを比べることによって、確認され得る。
【0029】
この修正は、ハーニックグリッドと合致するパッチングソース帯域における周波数部分が、パッチングの後で、ハーニックグリッドと合致する目標周波数部分内に配置されるように、実行される。
【0030】
好適には、図8dに示されるように、3つの異なる状態828、830、832で示されたパッチングバッファがプロセッサ102内に設けられている。プロセッサは図4内の400で示されるように、パッチングバッファをロードするよう構成されている。次に、コントローラは、追加の帯域幅拡張データと共通の帯域幅拡張データとを使用して、バッファシフト値を計算402するよう構成されている。次に、ステップ404では、計算されたバッファシフト値によってバッファコンテンツがシフトされる。項目830は、シフト値が「−2」であると計算された場合を示し、項目832は、2のシフト値がステップ402で計算され、+2によるシフトがステップ404で実行された場合のバッファ状態を示している。次に、図4の406で示されるように、パッチングバッファコンテンツを使用してパッチングが実行されるが、そのパッチは非ハーモニック方式で実行される。次に、ステップ408では、パッチ結果が共通の帯域幅拡張データを使用して修正される。そのような追加的に使用される共通の帯域幅拡張データは、高効率AAC又はUSACから知られているように、スペクトル包絡データ、ノイズデータ、特異なハーモニックライン上のデータ、逆フィルタリングデータ等であってもよい。
【0031】
この目的で、図1aのプロセッサ102のさらなる詳細構成を示す図5を参照されたい。このプロセッサは、典型的には、コア復号器500と、パッチングバッファを有するパッチャ502と、パッチ修正器504と、結合器506とを含む。コア復号器は、符号化済みオーディオ信号を復号化して、図9の902に示されるように、パッチング前の復号化済みスペクトルを得るよう構成されている。次に、パッチングバッファを有するパッチャ502は、図9における操作914を実行する。パッチャ502は、図9の文脈の中で説明したように、パッチングの前又は後に、パッチングバッファの修正を実行する。パッチ修正器504は最後に、図4の408で示されたように、追加の帯域幅拡張データを使用してパッチ結果を修正する。次に、例えば合成フィルタバンク形式の周波数ドメイン結合器であり得る結合器506は、パッチ修正器504の出力とコア復号器500の出力、つまり低帯域信号とを結合して、図1aのライン112での出力として最終的に帯域幅拡張オーディオ信号を取得する。
【0032】
図1bの文脈の中で既に説明した通り、帯域幅拡張制御データは、オーディオ項目について、図1bにおいて説明されたharmonicSBRのような第1の制御データエンティティを含んでも良く、このオーディオ項目は複数のオーディオフレーム116、118、120を含む。第1の制御データエンティティは、第1のハーモニック帯域幅拡張モードが前記複数のフレームについて活性か又は不活性かを示している。さらに、例示的にはUSAC標準におけるSBRパッチングモードに対応する第2の制御データエンティティが準備され、個別のフレームについて各ヘッダ116a,118a,120aの中に提供される。
【0033】
図1aの入力インターフェイス100は、オーディオ項目についての第1の制御データエンティティと、複数のフレームの各フレームについての第2の制御データエンティティとを読み出すよう構成され、図1aのコントローラ104は、第1の制御データエンティティの値及び第2の制御データエンティティの値とは関係なく、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するように、プロセッサ102を制御するよう構成されている。
【0034】
本発明の一実施形態では、図6及び図7a、7bにおいてシンタックス変更によって示されたように、USAC復号器は比較的高い複雑性を持つハーモニック帯域幅拡張計算をスキップするよう強制される。よって、もし600、700、702、704で示されるフラグlpHBEが非ゼロ値に設定されたとき、帯域幅拡張又は「低パワーHBE」が動作する。lpHBEフラグは、利用可能なハードウエア資源に依存して、復号器によって個別に設定されてもよい。ゼロ値は、復号器が完全な標準準拠、つまり図1bの第1と第2の制御データエンティティによって指示されるように動作するであろうことを意味している。しかしながら、もしこの値が1であれば、ハーモニック帯域幅拡張モードが信号伝達された場合でも、非ハーモニック帯域幅拡張モードがプロセッサによって実行されるであろう。
【0035】
よって、本発明は、低い演算複雑性と低いメモリ消費とを必要とするプロセッサを、新たな復号化手順と共に提供している。非特許文献1に定義されたeSBRのビットストリームシンタックスは、HBE(非特許文献1)及び従来のSBR復号化(非特許文献2)の双方にとって共通のベースを共有している。しかしながら、HBEの場合には、追加情報がビットストリームの中に符号化される。本発明の好適な実施形態における「低複雑性HBE」復号器は、非特許文献1に従ってUSAC符号化済みデータを復号化し、全てのHBE特異情報を廃棄する。残りのeSBRデータは、次に従来のSBR(非特許文献2)アルゴリズムへと供給されかつそれによって解釈される。つまり、そのデータはハーモニック転換(harmonic transposition)に代えてコピーパッチング(非特許文献2)を適用するよう使用される。eSBR復号化メカニズムの修正は、シンタックス変更に関して、図6及び図7a,7bで示されている。さらに、好適な一実施形態においては、ビットストリームによって運ばれるsbrPitchInBins情報のような特異なHBE情報が再利用される。
【0036】
従来のUSAC符号化済みビットストリームデータを用いて、sbrPitchInBins値がUSACフレームの中で伝送されてもよい。この値は、現在のUSACフレームのハーモニック構造を記述している情報を伝送するために、符号器によって決定されていた周波数値を反映している。標準HBE機能を使用せずにこの値を活用するために、以下の本発明方法がステップ毎に適用されるべきである。
【0037】
1.ビットストリームからsbrPitchInBinsを抽出する。
USACビットストリームからビットストリーム要素sbrPitchInBinsを如何にして抽出するかの情報について、それぞれ表44及び表45を参照(非特許文献1)。
2.式(1)に従ってハーモニックグリッドを計算する。
【数1】
3.ソースパッチ開始サブバンドと目標パッチ開始サブバンドとの双方のハーモニックグリッドに対する距離を計算する。
【0038】
図8aにおけるフローチャートは、開始及び終了パッチのハーモニックグリッドに対する距離をどのように計算するかについて、本発明アルゴリズムの詳細な説明を与えている。
harmonicGrid (hg) 式(1)に従うハーモニックグリッド
source_band 図9のQMFパッチソース帯域903
dest_band 図9のQMFパッチ目標帯域908
p_mod_x ソース帯域mod hg
k_mod_x 目標帯域 mod hg
mod モジュロ演算
NINT 直近の整数への丸め操作
sbrRatio SBR比、即ち1/2,3/8又は1/4
pitchInBins ビットストリーム内で伝送されたピッチ情報
【0039】
以下に、図8aについてさらに詳細に説明する。好適には、この制御すなわち全体の計算は図1aのコントローラ104内で実行される。ステップ800では、ハーモニックグリッドが図8bに示すように式(1)に従って計算される。次に、ハーモニックグリッドhgが2より小さいかどうかが判定される。もしそうでない場合には、次に制御はステップ810へ移行する。しかしながら、ハーモニックグリッドが2より小さいと判定された場合には、次にステップ804でソース帯域値が偶数かどうかを判定する。もしそうであれば、ハーモニックグリッドは2であると判定され、もしそうでないときには、ハーモニックグリッドは3に等しいと判定される。次に、ステップ810において、モジュロ計算が実行される。ステップ812では、両方のモジュロ計算が異なるかどうかが判定される。もしその結果が同じである場合には、手順は終了し、もし結果が異なる場合には、ブロック814内で示されるように、シフト値が両方のモジュロ計算結果の間の差分として計算される。次に、ステップ814でも示されるように、循環方式のバッファシフトが実行される。シフトを適用する場合に、好ましくは位相関係が考慮されるべきであることを注意する必要がある。この制御はブロック816で終了する。
【0040】
要約すると、図8cに示されるように、全体の手順は、820で示されるようにビットストリームからsbrPitchInBins情報を抽出するステップを含む。次に、コントローラは、822で示されるようにハーモニックグリッドを計算する。次に、ステップ824において、ソース開始サブバンドと目標開始サブバンドとのハーモニックグリッドに対する両方の距離が計算され、その計算は、好適な実施形態では、ステップ810に対応する。最後に、ブロック826で示すように、QMFバッファシフト、すなわち高効率AAC非ハーモニック帯域幅拡張のQMFドメイン内での循環シフトが実行される。
【0041】
QMFバッファシフトでは、たとえ非ハーモニック帯域幅拡張手順が実行されていても、伝送されたsbrPitchInBins情報に従って信号のハーモニック構造が再構成される。
【0042】
これまで幾つかの特徴を符号化又は復号化装置の文脈で説明してきたが、これら特徴はまた対応する方法の記述を表現していることは明白であり、そこではブロック又は装置は方法ステップ又は方法ステップの特徴に対応している。同様に、方法ステップの文脈で説明された特徴はまた、対応するブロック又は項目の説明、又は対応する装置の特徴を表現している。方法ステップの幾つか又は全部は、例えばマイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路などのハードウエア装置によって(を用いて)実行されてもよい。幾つかの実施形態では、最も重要な方法ステップの幾つか又はそれ以上がそのような装置によって実行されてもよい。
【0043】
ある実装要件にもよるが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、非一時的記憶媒体、すなわちその中に格納された電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、例えばフレキシブルディスク,ハードディスクトライブ(HDD),DVD,ブルーレイ,CD,ROM,PROM,EPROM,EEPROM又はフラッシュメモリなどのデジタル記憶媒体を使用して実行され得る。従って、そのデジタル記憶媒体はコンピュータ読み取り可能であり得る。
【0044】
本発明に従う幾つかの実施形態は、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0045】
一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、そのプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動可能である。そのプログラムコードは、例えば機械読み取り可能なキャリアに格納されていても良い。
【0046】
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリアに格納されたコンピュータプログラムを含む。
【0047】
換言すれば、本発明方法の一実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0048】
本発明の他の実施形態は、上述した方法の1つを実行するために記録されたコンピュータプログラムを含む、データキャリア(又はデジタル記憶媒体、又はコンピュータ読み取り可能な媒体)である。データキャリア、デジタル記憶媒体、又は記録された媒体は、典型的には有形であり、及び/又は非一時的である。
【0049】
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットのようなデータ通信接続を介して伝送されるよう構成されても良い。
【0050】
他の実施形態は、上述した方法の1つを実行するように構成又は適応された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
【0051】
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0052】
本発明に従う他の実施形態は、ここで説明した方法の1つを実行するためのコンピュータプログラムを受信機へ(例えば電子的に又は光学的に)伝送するよう構成された、装置又はシステムを含む。受信機は、例えばコンピュータ、携帯機器、メモリーデバイス又はそれらの類似物であってもよい。装置又はシステムは、例えばコンピュータプログラムを受信機へと転送するファイルサーバを含んでもよい。
【0053】
幾つかの実施形態においては、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイが、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
【0054】
上述した実施形態は、本発明の原理を単に例示的に示したに過ぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、添付した特許請求の範囲によってのみ限定されるべきであり、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではない。
図1a
図1b
図1c
図2
図3a
図3b
図3c
図4
図5
図6
図7a
図7b
図8a
図8b
図8c
図8d
図9
【手続補正書】
【提出日】2016年6月20日
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する装置であって、
前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれかを示す前記帯域幅拡張制御データを含む前記符号化済みオーディオ信号を受信するための入力インターフェイス(100)と、
前記第2の非ハーモニック帯域幅拡張モードを使用して、前記符号化済みオーディオ信号(101)を復号化するためのプロセッサ(102)と、
前記帯域幅拡張制御データが前記符号化済みオーディオ信号について前記第1のハーモニック帯域幅拡張モードを示している場合でも、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するよう、前記プロセッサ(102)を制御するためのコントローラ(104)と、
を備える装置。
【請求項2】
請求項1に記載の装置において、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有し、前記メモリ又は処理資源は前記第1のハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのには十分でない、装置。
【請求項3】
請求項1又は2に記載の装置において、
前記入力インターフェイス(100)は前記帯域幅拡張制御データを読み出し、前記プロセッサは、前記符号化済みオーディオ信号が前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれを使用して復号化されるべきかを決定し、かつ前記帯域幅拡張制御データをプロセッサ制御レジスタ内に格納するよう構成され、
前記コントローラ(104)は前記プロセッサ制御レジスタにアクセスし、前記プロセッサ制御レジスタが前記第1のハーモニック帯域幅拡張モードを示す値を格納していた場合に、前記第2の非ハーモニック帯域幅拡張モードを示す値によって前記プロセッサ制御レジスタ内の値を上書きするよう構成されている、装置。
【請求項4】
請求項1乃至3のいずれか1項に記載の装置において、前記符号化済みオーディオ信号は前記第1のハーモニック帯域幅拡張モードと前記第2の非ハーモニック帯域幅拡張モードとについて共通の帯域幅拡張ペイロードデータ(302)を含み、かつ前記第1のハーモニック帯域幅拡張モードのみについての追加的ペイロードデータ(304)を含み、
前記コントローラ(104)は、前記追加的ペイロードデータ(304)を使用して、前記第2の非ハーモニック帯域幅拡張モードにおけるパッチング操作に比べて、前記プロセッサによって実行されるパッチング操作を修正するように前記プロセッサ(102)を制御するよう構成され、前記修正されたパッチング操作は非ハーモニックパッチング操作である、装置。
【請求項5】
請求項4に記載の装置において、
前記追加的ペイロードデータ(304)は、前記符号化済みオーディオ信号のハーモニック特性に関する情報を含み、
前記コントローラ(104)は、前記符号化済みオーディオ信号を復号化する際にパッチング操作を実行するため、前記プロセッサ(102)によって使用されるパッチングバッファのパッチングバッファコンテンツ(828、830、832)を、前記パッチングバッファコンテンツを修正したパッチ済み信号が前記パッチングバッファコンテンツを修正しないパッチ済み信号に比べてよりハーモニックな特性を持つように、修正するよう構成されている、装置。
【請求項6】
請求項4又は5に記載の装置において、
前記コントローラ(104)は、
前記追加的ペイロードデータからピッチ周波数を示すハーモニックグリッドを計算(310)し、
周波数境界を持つパッチングソース帯域と周波数境界を持つパッチング目標帯域とについて、それぞれパッチングソース情報とパッチング目標情報とを決定(312)し、
前記ハーモニックグリッドに合致しているパッチングソース帯域内の周波数部分が、パッチング(914)の後に、前記ハーモニックグリッドに合致している目標周波数部分(912)内に配置されるように、パッチング(914)操作の前又は後に、前記パッチングソース帯域内の前記データを前記周波数境界内で修正(314)する、
よう構成されている装置。
【請求項7】
請求項4乃至6のいずれか1項に記載の装置において、
前記プロセッサ(102)はパッチングバッファを備え、
前記プロセッサは前記共通の帯域幅拡張ペイロードデータを使用して前記パッチングバッファをロード(400)するよう構成され、
前記コントローラは、前記符号化済みオーディオ信号のハーモニックグリッドを示す追加の帯域幅拡張データを使用し、パッチソース帯域情報(903)及びパッチ目標帯域情報(908)を使用して、バッファシフト値を計算(402)するよう構成され、
前記コントローラは、バッファコンテンツに対してバッファシフト操作を生じさせる(404)よう構成され、
前記プロセッサ(102)は前記バッファシフト値によってシフトされた前記バッファコンテンツを使用してパッチ済みデータを生成(406、408)するよう構成されている、装置。
【請求項8】
請求項7に記載の装置において、前記コントローラは循環方式の前記バッファシフト操作を生じさせる(404)よう構成されている、装置。
【請求項9】
請求項1乃至8のいずれか1項に記載の装置において、
前記プロセッサは、
コア符号化済みオーディオ信号(902)を復号化するコア復号器(500)と、
前記符号化済みオーディオ信号からの帯域幅拡張データを使用して、前記コア符号化済みオーディオ信号のソース周波数領域を、前記非ハーモニック帯域幅拡張モードに従って目標周波数領域へパッチングするパッチャ(502)と、
前記符号化済みオーディオ信号からの帯域幅拡張データを使用して、前記目標周波数領域におけるパッチ済み信号を修正するパッチ修正器(504)と、を備える装置。
【請求項10】
請求項1乃至9のいずれか1項に記載の装置において、
前記帯域幅拡張制御データは、複数のオーディオのフレームを含む1つのオーディオ項目についての第1の制御データエンティティ(114)と、前記符号化済みオーディオ信号の各フレームについての第2の制御データエンティティ(116a,118a,120a)とを含み、前記第1の制御データエンティティは前記第1のハーモニック帯域幅拡張モードが前記複数のフレームについて活性か又は不活性かを示し、前記第2の制御データエンティティは前記第1のハーモニック帯域幅拡張モードが前記符号化済みオーディオ信号の各個別のフレームについて活性か又は不活性かを示しており、
前記入力インターフェイス(100)は、前記オーディオ項目についての前記第1の制御データエンティティと前記複数のフレームの各フレームについての前記第2の制御データエンティティとを読み出すよう構成され、
前記コントローラ(104)は、第1の制御データエンティティの値及び第2の制御データエンティティの値とは関係なく、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するように、前記プロセッサ(102)を制御するよう構成されている、装置。
【請求項11】
請求項1乃至10のいずれか1項に記載の装置において、
前記符号化済みオーディオ信号はUSAC標準によって定義されたビットストリームであり、
前記プロセッサ(102)は前記USAC標準によって定義された前記第2の非ハーモニック帯域幅拡張モードを実行するよう構成され、
前記入力インターフェイスは前記USAC標準に従って前記符号化済みオーディオ信号を含む前記ビットストリームを解析するよう構成されている、装置。
【請求項12】
請求項1乃至11のいずれか1項に記載の装置において、
前記符号化済みオーディオ信号が符号化済みステレオ又は多チャネルオーディオ信号である場合に、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有し、前記メモリ又は処理資源は前記第1のハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのには十分でなく、
前記符号化済みオーディオ信号が符号化済みモノラル信号である場合に、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モード及び前記第1のハーモニック帯域幅拡張モードを使用して、前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有する、装置。
【請求項13】
第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する方法であって、
前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれかを示す前記帯域幅拡張制御データを含む前記符号化済みオーディオ信号を受信するステップ(100)と、
前記第2の非ハーモニック帯域幅拡張モードを使用して、前記符号化済みオーディオ信号(101)を復号化するステップ(102)と、
前記帯域幅拡張制御データが前記符号化済みオーディオ信号について前記第1のハーモニック帯域幅拡張モードを示している場合でも、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するよう、前記プロセッサ(102)を制御するステップ(104)と、
を含む方法。
【請求項14】
コンピュータ上で作動するとき、請求項13に従って符号化済みオーディオ信号を復号化する方法を実行するためのコンピュータプログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0034
【補正方法】変更
【補正の内容】
【0034】
本発明の一実施形態では、図6及び図7a、7bにおいてシンタックス変更によって示されたように、USAC復号器は比較的高い複雑性を持つハーモニック帯域幅拡張計算をスキップするよう強制される。よって、もし600、700、702、704で示されるフラグlpHBEが非ゼロ値に設定されたとき、非ハーモニック帯域幅拡張又は「低パワーHBE」が動作する。lpHBEフラグは、利用可能なハードウエア資源に依存して、復号器によって個別に設定されてもよい。ゼロ値は、復号器が完全な標準準拠、つまり図1bの第1と第2の制御データエンティティによって指示されるように動作するであろうことを意味している。しかしながら、もしこの値が1であれば、ハーモニック帯域幅拡張モードが信号伝達された場合でも、非ハーモニック帯域幅拡張モードがプロセッサによって実行されるであろう。
【国際調査報告】