特許第5770476号(P5770476)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ トムソン ライセンシングの特許一覧

特許5770476ビデオ符号化に於いてレート制御を正確にする方法及び装置
<>
  • 特許5770476-ビデオ符号化に於いてレート制御を正確にする方法及び装置 図000008
  • 特許5770476-ビデオ符号化に於いてレート制御を正確にする方法及び装置 図000009
  • 特許5770476-ビデオ符号化に於いてレート制御を正確にする方法及び装置 図000010
  • 特許5770476-ビデオ符号化に於いてレート制御を正確にする方法及び装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5770476
(24)【登録日】2015年7月3日
(45)【発行日】2015年8月26日
(54)【発明の名称】ビデオ符号化に於いてレート制御を正確にする方法及び装置
(51)【国際特許分類】
   H04N 19/115 20140101AFI20150806BHJP
   H04N 19/136 20140101ALI20150806BHJP
   H04N 19/172 20140101ALI20150806BHJP
   H04N 19/192 20140101ALI20150806BHJP
   H04N 19/503 20140101ALI20150806BHJP
   H04N 19/51 20140101ALI20150806BHJP
   H04N 19/593 20140101ALI20150806BHJP
   H04N 19/60 20140101ALI20150806BHJP
   H04N 19/61 20140101ALI20150806BHJP
   H04N 19/82 20140101ALI20150806BHJP
   H04N 19/91 20140101ALI20150806BHJP
【FI】
   H04N19/115
   H04N19/136
   H04N19/172
   H04N19/192
   H04N19/503
   H04N19/51
   H04N19/593
   H04N19/60
   H04N19/61
   H04N19/82
   H04N19/91
【請求項の数】10
【全頁数】19
(21)【出願番号】特願2010-543129(P2010-543129)
(86)(22)【出願日】2009年1月15日
(65)【公表番号】特表2011-510563(P2011-510563A)
(43)【公表日】2011年3月31日
(86)【国際出願番号】US2009000225
(87)【国際公開番号】WO2009091548
(87)【国際公開日】20090723
【審査請求日】2011年12月6日
(31)【優先権主張番号】61/021,687
(32)【優先日】2008年1月17日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】リウ,ヤリ
(72)【発明者】
【氏名】シユイ,チエン
(72)【発明者】
【氏名】ルウ,シヤオアン
(72)【発明者】
【氏名】ゴミラ,クリステイーナ
【審査官】 畑中 高行
(56)【参考文献】
【文献】 特表2001−518247(JP,A)
【文献】 特開2001−069511(JP,A)
【文献】 特開2006−157881(JP,A)
【文献】 特開2006−067302(JP,A)
【文献】 特開2002−152734(JP,A)
【文献】 特開2006−333444(JP,A)
【文献】 特表2010−541469(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00−19/98
(57)【特許請求の範囲】
【請求項1】
あるピクチャの画像データを、レート制御を用いて1回の符号化パスで符号化するビデオ符号器を含む装置であって、
前記レート制御は、量子化ステップ・サイズ値と丸めオフセット値とを設定することと、前記量子化ステップ・サイズ値と前記丸めオフセット値を改良することとを含み、
前記量子化ステップ・サイズ値と前記丸めオフセット値は、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの少なくとも一方を、初めに推定値として設定し、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの他方を、前記推定値に基づいて設定することによって改良され、前記推定値は前記ピクチャの目標ビット数をモデル化することに基づき、前記ピクチャの前記画像データは、前記改良された量子化ステップ・サイズ値と前記改良された丸めオフセット値とに応じて符号化される、前記装置。
【請求項2】
請求項1記載の装置であって、前記丸めオフセット値が、初めに前記推定値として設定され、前記推定値が前記レート制御についての目標ビットと前記丸めオフセットとの間の対数関係に基づいている、装置。
【請求項3】
請求項1記載の装置であって、前記レート制御が固定ビット・レート用途と可変ビット・レート用途のうちの少なくとも一方に適用される、装置。
【請求項4】
請求項1記載の装置であって、前記ビデオ符号器が、国際標準化機構/国際電気標準会議のムービング・ピクチャ・エキパーツ・グループ−4のパート10のアドバンスト・ビデオ・コーディング規格/国際電気通信連合の電気通信標準化部門のH.264の勧告に準拠する合成ビットストリームに於ける前記画像データを符号化する、装置。
【請求項5】
請求項1記載の装置であって、前記レート制御用の各レート制御パラメータが、ρ領域レート・モデル、TM5レート・モデル、及び、TMN8レート・モデルのうちの少なくとも1つに基づいている、装置。
【請求項6】
あるピクチャの画像データを、レート制御を用いて1回の符号化パスで符号化することを含む方法であって、前記レート制御には量子化ステップ・サイズ値と丸めオフセット値とを設定することと、前記ピクチャの前記量子化ステップ・サイズ値と前記丸めオフセット値を改良することと、が含まれており、前記量子化ステップ・サイズ値と前記丸めオフセット値は、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの少なくとも一方を、初めに推定値として設定し、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの他方を、前記推定値に基づいて設定することによって改良され、前記推定値は前記ピクチャの目標ビット数をモデル化することに基づき、前記ピクチャの前記画像データが、前記改良された量子化ステップ・サイズ値と前記改良された丸めオフセット値とに応じて符号化される、前記方法。
【請求項7】
請求項6記載の方法であって、前記丸めオフセット値が、初めに前記推定値として設定され、前記推定値が前記レート制御についての目標ビットと前記丸めオフセットとの間の対数関係に基づいている、方法。
【請求項8】
請求項6記載の方法であって、前記レート制御が固定ビット・レート用途と可変ビット・レート用途のうちの少なくとも一方に適用される、方法。
【請求項9】
請求項6記載の方法であって、前記符号化に於いて、国際標準化機構/国際電気標準会議のムービング・ピクチャ・エキパーツ・グループ−4のパート10のアドバンスト・ビデオ・コーディング規格/国際電気通信連合の電気通信標準化部門のH.264の勧告に準拠する合成ビットストリームに於ける前記画像データを符号化する、方法。
【請求項10】
請求項6記載の方法であって、前記レート制御用の各レート制御パラメータが、ρ領域レート・モデル、TM5レート・モデル、及び、TMN8レート・モデルのうちの少なくとも1つに基づいている、方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願のクロス・リファレンス)
この出願は、2008年1月17日に出願された米国仮出願第61/021687(代理人整理番号PU080009)の権利を主張し、その全文をここに引用して援用する。
【0002】
本原理は、概してビデオ符号化に関し、更に詳しくは、ビデオ符号化に於いてレート制御を正確にする方法及び装置に関する。
【背景技術】
【0003】
ビデオ符号化を適用する殆どの場合、符号器が所定の目標ビット・レートで入力ビデオを圧縮する必要がある。それを達成する為に、符号器はレート制御システムを利用している。あるレート制御システムでは、入力ビデオ供給源に於いて各々のピクチャに所定のビット数を割り当てて、各符号化パラメータをこの割り当てられたビット数と整合するように調整している。レート制御システムの性能は、目標ビット・レートに適合する精度と圧縮ビデオの視覚品質とによって評価される。例えば、国際標準化機構/国際電気標準会議(ISO/IEC)のムービング・ピクチャ・エキパーツ・グループ−2(MPEG−2)規格、ISO/IECのムービング・ピクチャ・エキパーツ・グループ−4(MPEG−4)パート10のアドバンスト・ビデオ・コーディング(AVC)規格/国際電気通信連合の電気通信標準化部門(ITU−T)のH.264の勧告(以下、「MPEG−4AVC規格」という)、及び、ソサイエティ・オブ・モーション・ピクチャ・アンド・テレビジョン・エンジニアズ(SMPTE)ビデオ・コーデック−1規格(以下、「VC−1規格」という)のようなビデオ符号化規格では、例えば、量子化ステップ・サイズ、丸めオフセット、及び、量子化マトリクスのような幾つかの量子化パラメータがビット・レートに影響を及ぼし得る。
【0004】
次に、MPEG−4AVC規格に従うビデオ量子化処理の一例を説明する。数学的に説明すると、符号器に於いて、被変換係数は、次の如く量子化される。
【数1】
ここで、Wは被変換係数、Zは被変換係数が量子化された量子化レベル、qは量子化ステップ・サイズ、及び、sは丸めオフセットを表している。ファンクション
はある値を最も近い整数に丸め、及び、ファンクションsng(・)は信号の符号を戻す。量子化マトリクスを適用する場合、各係数は、先ず、符号器に於ける量子化処理の前に基準化される。0に量子化されるWの範囲はデッドゾーンと呼ばれている。この特定のケースでは、デッドゾーンはΔ = 2 × (1 - s) × qである。復号器に於いて、量子化レベルZは、信号W’に復元される。これは、逆量子化と呼ばれ、数学的には次の如く表現される。
【数2】
【0005】
レート制御アルゴリズムは、主に各量子化パラメータを調整して、目標のビット数を得る。レート制御が正確であると見なされるのは、ある時間間隔の間に使用されるビット数が、その時間間隔の間、割り当てられたビット数に近いか、或いは、等しい場合である。レート制御の精度を測定するのに使用される具体的な時間間隔は、用途に応じて規定される。ある用途では、ビット・レートは、ピクチャ・レベルで正確であることが望まれる。放送のような別の用途では、ビット・レートは、チャンネル帯域幅の制約に因り、数フレームに亘って正確である必要がある。更に、デジタル・ビデオ・ディスク(DVD)オーサリングのような別の用途では、ビット・レートの精度は、シーケンス全体について測定される場合が多く、動画全体が消費するビット数が要求条件を満たす場合に正確であると見なされる。
【0006】
既存のレート制御アルゴリズムは、通常、丸めオフセットと量子化マトリクスとが一定であることを前提としており、ただ量子化ステップ・サイズを調整するのみである。量子化ステップ・サイズは、限られた数の選択肢しか持たない。量子化ステップ・サイズは量子化インデックスによって表され、該量子化インデックスは、符号化ビットストリーム内に埋め込まれて、復号器に伝送されて、ビデオの復元に使用される。選択すべき量子化ステップ・サイズの数が限られているので、既存のレート制御アルゴリズムでは、品質の劣化なしに高精度な制御を実現することは殆ど不可能である。このレート制御アルゴリズムに因る品質の劣化は、一つのピクチャ内、或いは、複数のピクチャ間での品質のばらつきとして現れることが多い。品質が低下したピクチャには、ピクチャの一部の表示を歪ませるような可視アーティファクトが含まれることがある。
【0007】
ピクチャについてのレート制御の精度を向上させる為に、既存のアルゴリズムに於ける一般的なアプローチでは、マクロブロック・レベル(MBレベル)のレート制御を利用している。従来技術に従えば、ρ領域レート制御方法が使用されている。ρ領域レート制御方法はρとRとの間の線形関係を前提としており、ρは符号化領域についての各量子化済み変換済み係数内に於けるゼロ係数の割合を表し、Rは領域を符号化するのに使用されるビット数を表している。数学的に説明すると、線形のレート・モデルは次の如く表される。
【数3】
ここで、Rは領域を符号化するのに使用される非テクスチャ・ビット数を表しており、θは定数を表している。
【0008】
ρは量子化ステップ・サイズqと共に単調に増加するが、このことは両者間に1対1のマッピング(写像)が存在することを示している。従って、ρ領域レート制御方法では、目標ビット数R、各推定パラメータθ及びRが与えられると、ρの値と、従って、1対1のρ−qマッピング(写像)に基づいて、量子化ステップ・サイズqとが得られる。
【0009】
上述の如く算出された量子化ステップ・サイズqは、符号器に於いて、量子化インデックスによって表せる限られた数の量子化ステップ・サイズに当て嵌まらない場合が多い。1つのアプローチに従えば、ピクチャ内の各マクロブロックが、qに非常に近く、且つ、量子化インデックスによって表せる量子化ステップ・サイズであるq’の付近の各量子化ステップ・サイズを使用する。更に、ピクチャが使用する平均量子化ステップ・サイズは、およそqである。一実施形態では、マクロブロックは、幾つかの量子化ステップ・サイズ{q’-Δ1, q’, q’+Δ2}の中から選択できる。別のアプローチに従えば、マクロブロックを各々符号化した毎にθ及びRを更新して、マクロブロック毎にqを算出する。
【0010】
更に別の一般的なレート制御アルゴリズムは、TMN8レート制御アルゴリズムである。このTMN8レート制御アルゴリズムでは、先ず、量子化ステップ・サイズqがピクチャについて算出される。符号器は、各マクロブロックの符号化をqで開始する。次に、より多くのマクロブロックが符号化されるに従って、各レート制御モデル・パラメータが更新され、量子化ステップ・サイズがマクロブロック・ベースで更新される。
【0011】
マクロブロック・レベルの調整についての問題点の1つは、量子化ステップ・サイズがマクロブロック間で変動することである。場合によっては、各量子化パラメータが相違することによって、ピクチャ内で品質のばらつきが生じ得る。
【0012】
図1には、ビデオ符号化についてのレート制御方法の全体が参照番号100によって示されている。
【0013】
方法100には、開始ブロック105が含まれており、制御権を機能ブロック110に送る。該機能ブロック110は、符号化セットアップの実施、及び/又は、関与を行って、制御権を機能ブロック115に送る。該機能ブロック115は、各レート制御パラメータを初期化して、制御権をループ端ブロック120に送る。該ループ端ブロック120は、変数i(ここでi=1、・・・、ピクチャ内のマクロブロック数(#))を用いて、処理中の現在のピクチャ内の各々のマクロブロックについてループを設定して、制御権を機能ブロック125に送る。該機能ブロック125は、マクロブロックiについて量子化ステップ・サイズqを計算して、制御権を機能ブロック130に送る。該機能ブロック130は、マクロブロックiを量子化ステップ・サイズqで符号化して、制御権を機能ブロック135に送る。該機能ブロック135は、各レート制御モデル・パラメータを(例えば、これまで符号化した各マクロブロックに基づいて)更新して、制御権をループ端ブロック140に送る。該ループ端ブロックは、当該ループを終了して、制御権を終了ブロック199に送る。
【0014】
従って、符号化処理は、ピクチャ内の全てのマクロブロックが符号化された後に終了する。尚、図1の方法100に於いて、丸めオフセットのパラメータは、方法100が適用される符号化処理の全体を通じて一定である。また、機能ブロック110は、オプションとして、オペレータによる補助を必要とする場合もある。更に、機能ブロック110に対応する符号器のセットアップは、目標ビット・レートのセットアップと、符号化処理に付随する任意の一連のパラメータの指定とを要する場合もある。
【0015】
全てのマクロブロックが使用する量子化ステップ・サイズ{qi}(ここでi=1、・・・、MB#)は、顕著に変動することがあり、ピクチャ内で品質のばらつきを生じさせることがある。ピクチャ内での品質の均一性を高める為に、符号器は、量子化ステップ・サイズのダイナミックな範囲を制限することも選択できる。その結果、ピクチャが消費するビット数が目標ビット数とは著しく異なってしまう場合もある。
【発明の概要】
【0016】
本原理は、従来技術についての上述の、及び、その他の欠点と不都合に取り組むものであり、ビデオ符号化に於けるレート制御を正確にする方法と装置に向けられたものである。
【0017】
本原理の一形態に従えば、1つの装置が提供される。該装置は、レート制御を用いて1回の符号化パスで画像データを符号化するビデオ符号器を含む。上記レート制御には、量子化ステップ・サイズ値と丸めオフセット値とを設定することと、少なくとも上記丸めオフセット値を改良することとが含まれる。上記画像データは、上記量子化ステップ・サイズ値と上記改良された丸めオフセット値とに応じて符号化される。
【0018】
本原理の別の一形態に従えば、1つの方法が提供される。該方法には、レート制御を用いて1回の符号化パスで画像データを符号化することが含まれる。上記レート制御には、量子化ステップ・サイズ値と丸めオフセット値とを設定することと、少なくとも該丸めオフセット値を改良することとが含まれる。上記画像データは、上記量子化ステップ・サイズ値と上記改良された丸めオフセット値とに応じて符号化される。
【0019】
本原理のこれらの、及び、その他の形態、特徴、及び、利点は、添付図面を参照しつつ読まれるべき以下の各実施例の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0020】
本原理は、以下の例としての各図面を参照することにより、より良く理解できるであろう。
図1】従来技術に従う、ビデオ符号器に於けるレート制御方法についての流れ図である。
図2】本原理の一実施形態に従う、本原理が適用可能なビデオ符号器の例についてのブロック図である。
図3】本原理の一実施形態に従う、シングル・パス型ビデオ符号器に於けるレート制御方法(非定値の丸めオフセットが組み込まれている)の例についての流れ図である。
図4】本原理の一実施形態に従う、シングル・パス型ビデオ符号器に於ける別のレート制御方法(非定値の丸めオフセットが組み込まれている)の例についての流れ図である。
【発明を実施するための形態】
【0021】
本原理は、ビデオ符号化に於けるレート制御を正確にする方法と装置に向けられたものである。
【0022】
本明細書に於ける記載は、本原理を例示するものである。当業者であれば、ここに明示的に記載、或いは、図示されていないが、本原理を実施する、本原理の意図とその範囲内に含まれる様々な構成を考案できるであろう。
【0023】
ここに記載の全ての例、及び、条件言語は、本発明の発明者が技術促進のために提供した本原理と概念とを読者が理解する助けとなる教授を目的とするものであって、本発明は、これらの具体的に記載された各例、及び、各条件に限定されるものではない。
【0024】
更に、本発明の各原理、各特徴、及び、各実施形態、並びに、それらの具体例についての本明細書に於ける各記載は、全て、それらの構造的な等価物と機能的な等価物とを包含するものである。また、そのような等価物には、現時点で既知のもの、及び、将来開発されるもの(即ち、構成の如何に関係なく同じ機能を実施するように開発されたあらゆる要素)も含まれる。
【0025】
従って、例えば、当業者であれば、本願に於いて示される各ブロック図が、本原理を実施する回路例の概念図を表していることが分かるであろう。同様に、あらゆるフローチャート、フロー図、状態遷移図、擬似コード等が、コンピュータ読み取り可能媒体で実質的に表すことが出来、従って、明示的にコンピュータ又はプロセッサが示されているか否かに関らず、コンピュータ又はプロセッサによって実行され得ることが分かるであろう。
【0026】
各図面に示された種々の要素の各機能は、専用ハードウェアを用いても、また、適切なソフトウェアと共にソフトウェア実行可能ハードウェアを用いても提供できる。これらの各機能は、プロセッサによって提供される場合、1つの専用プロセッサによって、或いは、1つの共用プロセッサによって、或いは、一部が共用可能な複数の個別プロセッサによって提供可能である。更に、「プロセッサ」或いは「コントローラ(制御器)」という用語の明示的な使用は、ソフトウェア実行可能ハードウェアのみを意味していると解釈されるべきではなく、暗示的に、デジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを記憶するリード・オンリ・メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、及び、不揮発性記憶装置が無制限に含まれ得る。
【0027】
その他の従来型、及び/又は、特定用途向けのハードウェアも含まれ得る。同様に、各図面に示されるあらゆるスイッチも概念のみを表している。それらの機能は、プログラム論理の動作を介して、或いは、専用論理を介して、或いは、プログラム制御と専用論理との相互作用を介して、或いは、手動でも実施可能であり、本明細書から更に具体的に理解できるように、実施者が特定の技術を選択できる。
【0028】
本願に於ける特許請求の範囲の各請求項に於いて、特定の機能を実施する手段として表現されたあらゆる要素は、例えば、a)当該機能を実施する各回路要素の組み合わせ、或いは、b)あらゆる形態のソフトウェア(当該ソフトウェアを実行して当該機能を実施する適切な回路と組み合わされるファームウェア、或いは、マイクロコード等も含む)を含む当該機能を実施するあらゆる形態を包含する。そのような各請求項によって規定される本原理は、各請求項に記載された種々の手段によって提供される各機能が、各請求項に記載された態様で組み合わされて統合されるということに在る。従って、当該機能を提供し得るあらゆる手段は、本明細書に示された手段と等価であると認められる。
【0029】
本明細書に於いて、本原理の「一実施形態」、「実施形態」等と言えば、それは、当該実施形態に関連して説明された特定の特徴、構造、及び、特性等が本原理の少なくとも一実施形態に含まれていることを意味する。従って、本明細書全体を通して様々な箇所に現れる「一実施形態」、「実施形態」等の表現は、必ずしも全てが同一の実施形態を意味している訳ではない。
【0030】
また、例えば「A/B」、「A及び/又はB」、「AとBの少なくとも一方」等の場合に於ける「/」、「及び/又は」、「〜の少なくとも一方」等の何れかの使用は、最初に述べた選択項目(A)のみの選択、或いは、次に述べた選択項目(B)のみの選択、或いは、両方の選択項目(A及びB)の選択を包含するものである。別の例として、「A、B及び/又はC」、「A、B及びCの少なくとも1つ」等の場合、そのような語句は、1番目に述べた選択項目(A)のみの選択、或いは、2番目に述べた選択項目(B)のみの選択、或いは、3番目に述べた選択項目(C)のみの選択、或いは、1番目と2番目に述べた選択項目(A及びB)のみの選択、或いは、1番目と3番目に述べた選択項目(A及びC)のみの選択、或いは、2番目と3番目に述べた選択項目(B及びC)のみの選択、或いは、3つの選択項目全て(A、B及びC)の選択を包含するものである。このことが、多数の選択項目が挙げられた場合にも拡張できることは、当該技術分野及びその他の関連技術分野の当業者に明らかである。
【0031】
更に、本明細書の記載に於いては、MPEG−4AVC規格を用いて、ビデオ符号化の量子化処理の例を示すと共に、本原理の1つ或いは複数の実施形態を例として説明する。しかしながら、当該技術分野、及び、関連技術分野の当業者であれば、ITU−TのH.263の勧告(以下、「H.263勧告」という)とMPEG−2規格とを含む(これらに限定される訳ではない)その他の規格、その他の勧告、及び、それらの拡張機能でも同様の量子化手法が用いられること、従って、本明細書で詳細に説明する本原理が、例示のために採用したMPEG−4AVC規格に限定されるものではなく、また、その他の特定のビデオ符号化の規格、勧告、及び/又は、それらの拡張機能に限定されるものではないことを明確に理解できるであろう。
【0032】
上述の如く、本原理は、ビデオ符号化に於けるレート制御を正確にする方法と装置に向けられたものである。
【0033】
図2には、本原理が適用可能なビデオ符号器の一例の全体が参照番号200によって示されている。
【0034】
ビデオ符号器200にはフレーム配列バッファ210が含まれており、該フレーム配列バッファ210の出力は、結合器285に非反転入力に対して信号伝達可能に接続されている。該結合器285の出力は、変換器及び量子化器225の第1の入力に対して信号伝達可能に接続されている。該変換器及び量子化器225の出力は、エントロピー符号器245の第1の入力と、逆変換器及び逆量子化器250の入力とに対して信号伝達可能に接続されている。該エントロピー符号器245の出力は、結合器290の第1の非反転入力に対して信号伝達可能に接続されている。該結合器290の出力は、出力バッファ235の第1の入力に対して信号伝達可能に接続されている。
【0035】
レート制御器205の出力が、ピクチャ・タイプ決定モジュール215の入力と、マクロブロック・タイプ(MBタイプ)決定モジュール220の第1の入力と、変換器及び量子化器225の第2の入力と、シーケンス・パラメータ・セット(SPS)及びピクチャ・パラメータ・セット(PPS)挿入器240の入力とに対して信号伝達可能に接続されている。出力バッファ235の第2の出力が、レート制御器205の入力に対して信号伝達可能に接続されている。
【0036】
SEI挿入器230の出力が、結合器290の第2の非反転入力に対して信号伝達可能に接続されている。
【0037】
ピクチャ・タイプ決定モジュール215の第1の出力が、フレーム配列バッファ210の第2の入力に対して信号伝達可能に接続されている。ピクチャ・タイプ決定モジュール215の第2の出力が、マクロブロック・タイプ決定モジュール220の第2の入力に対して信号伝達可能に接続されている。
【0038】
シーケンス・パラメータ・セット(SPS)及びピクチャ・パラメータ・セット(PPS)挿入器240の出力が、結合器290の第3の非反転入力に対して信号伝達可能に接続されている。
【0039】
逆変換器及び逆量子化器250の出力が、結合器219の第1の非反転入力に対して信号伝達可能に接続されている。該結合器219の出力は、イントラ予測モジュール260の入力と、非ブロック化フィルタ265の入力とに対して信号伝達可能に接続されている。非ブロック化フィルタ265の出力は、参照ピクチャ・バッファ280の入力に対して信号伝達可能に接続されている。該参照ピクチャ・バッファ280の出力は、動き推定器275の入力と、動き補償器270の第1の入力とに対して信号伝達可能に接続されている。該動き推定器275の第1の出力は、動き補償器270の第2の入力に対して信号伝達可能に接続されている。該動き推定器275の第2の出力は、エントロピー符号器245の第3の入力に対して信号伝達可能に接続されている。
【0040】
動き補償器270の出力は、スイッチ297の第1の入力に対して信号伝達可能に接続されている。イントラ予測モジュール260の出力が、該スイッチ297の第2の入力に対して信号伝達可能に接続されている。マクロブロック・タイプ決定モジュール220の出力が、該スイッチ297の第3の入力に対して信号伝達可能に接続されている。該スイッチ297の第3の入力は、当該スイッチの「データ」入力(第3の入力である制御入力と対比される)が動き補償器270とイントラ予測モジュール260の何れによって供給されるべきかを決定する。該スイッチ297の出力は、結合器219の第2の非反転入力と、結合器285の反転入力とに対して信号伝達可能に接続されている。
【0041】
フレーム配列バッファ210の入力は、入力ピクチャを受信するための符号器200の入力として使用可能である。更に、補助的拡張情報(Supplemental_Enhancement_Information)(SEI)挿入器230の入力は、メタデータを受信するための符号器200の入力として使用可能である。出力バッファ235の第1の出力は、ビットストリームを出力するための符号器200の出力として使用可能である。
【0042】
前述の如く、既存のレート制御方法は、レート制御の精度を欠いているか、或いは、品質のばらつきを生じさせる。本原理に従えば、丸めオフセットという別のパラメータ、即ち、メトリック(metric)をレート制御アルゴリズムに導入する。この丸めオフセットを組み込むことによって、ピクチャ内の品質を均一に保ちつつ、ピクチャ毎に非常に正確なレート制御を実現できる。本原理を、ビット・レートの精度が1つピクチャの期間よりも長い期間で測定されるようなその他の用途に適用した場合でも、本原理によって、正確なレート制御が容易に実現できる。
【0043】
一実施形態に於いて、本原理は、演算のオーバーヘッドが少ない、ビデオ符号器に於けるピクチャ・レベルについての正確なレート制御アルゴリズムを設計する課題への取り組みに向けられたものである。既存のレート制御アルゴリズムは、ビット・レートの精度を制御する為に、主に量子化ステップ・サイズのパラメータの調整に依存している。しかし、MPEG−2規格、MPEG−4AVC規格、及び、VC−1規格のようなビデオ符号化規格に於いては、ビット・レートに影響を及ぼすその他の符号化パラメータも存在する。特に、一実施形態に於いて、丸めオフセットを利用してビット・レート制御の精度を向上させ、且つ、シングル・パス(1回のパス)に於いてランする(実行される)方法が提供される。本原理に従って、レート制御アルゴリズムにより、ピクチャ・レベルについての正確なビット・レートが得られる場合、そのレート制御アルゴリズムにより、そのような正確なビット・レートが、より長い時間間隔の間、容易に実現できる。
【0044】
一実施形態に於いて、別の量子化パラメータ、即ち、丸めオフセットsを組み込んでピクチャ・レベルについてのレート制御の精度を向上させることを提案する。量子化ステップ・サイズと丸めオフセットは、両者とも、符号器が使用するビット数Rに影響を及ぼす。これは、数学的に次のように表現できる。
【数4】
ここで、ファンクションf(・)は、如何に量子化ステップ・サイズと丸めオフセットとがビット数に影響を及ぼすかを表している。このファンクションの一例を次に示す。
【数5】
ここで、k、k及びcは定数である。
【0045】
図3及び図4には、レート制御アルゴリズムに、量子化ステップ・サイズに加えて、丸めオフセットを組み込む各実施形態が例示されている。尚、これらの例示された各実施形態は、ビット数の割り当て方に従って、可変ビット・レート(variable−bit−rate)(VBR)、或いは、固定ビット・レート(constant−bit−rate)(CBR)の応用例となり得る。更に、本原理は、マルチ・パス型符号器の一部として実施でき、且つ、その他のパスに情報を提供するように構成できる。
【0046】
(実施形態1)
先ず、シングル・パス型ビデオ符号器についてのレート制御方法の一実施形態を大まかに説明し、次に、図3について、更に説明する。
【0047】
この実施形態に従えば、符号器は、先ず初期の丸めオフセットsを選択して、この初期のsに基づいて量子化ステップ・サイズqを計算する。qを調整して目標ビット・レートを得る既存のレート制御アルゴリズム(TM5、TMN8、ρ領域レート制御アルゴリズム等を含むが、これらに限定されるものではない)が使用できる。求めた量子化ステップ・サイズqとR(q,s)のモデルとを用いて、丸めオフセットsを計算して、より良く目標ビット・レートを得ることが出来る。
【0048】
q及びsが計算された後に、更なる改良が必要か否かが確認される。一実施形態では、sが、隣接ピクチャ相互間で視覚品質が均一であることを保証する所定の範囲を外れているか否かが判定される。改良が必要でない状態まで、或いは、演算に課せられた制約条件が満たされるまで、q及びsを更新する処理が繰り返される。
【0049】
もはや改良の必要がない量子化ステップ・サイズq及び丸めオフセットsが符号化処理に使用される。その符号化処理が完了した後に、各レート制御パラメータが更新される。符号化すべき複数のピクチャがある場合、それらのピクチャの一部、或いは、全部から得られる全ての情報を用いて、各レート制御モデル・パラメータを更新できる。
【0050】
図3には、シングル・パス型ビデオ符号器に於けるレート制御方法例(非定値の丸めオフセットが組み込まれている)の全体が参照番号300によって示されている。
【0051】
方法300には開始ブロック305が含まれており、該開始ブロック305は、制御権を機能ブロック310に送る。該機能ブロック310は、符号化セットアップの実施、及び/又は、関与を行って、制御権を機能ブロック315に送る。該機能ブロック315は、各レート制御モデル・パラメータを初期化して、制御権をループ端ブロック320に送る。該ループ端ブロック320は、変数i(ここでi=1、・・・、ピクチャ数(#))を用いて、処理中の現在のビデオ・シーケンス内の各々のピクチャについて、ループを設定して、制御権を機能ブロック325に送る。該機能ブロック325は、ピクチャiについて丸めオフセットsを初期化して、制御権を機能ブロック330に送る。該機能ブロック330は、ピクチャiについて量子化ステップ・サイズqを計算して、制御権を機能ブロック335に送る。該機能ブロック335は、ピクチャiについて丸めオフセットsを更新して、制御権を決定ブロック340に送る。該決定ブロック340は、q及び/又はsが改良を必要とするか否かを判定する。必要とすると判定された場合、制御権は機能ブロック330に戻される。必要でないと判定された場合、制御権は、機能ブロック345に送られる。
【0052】
該機能ブロック345は、ピクチャiをq及びsで符号化して、制御権を機能ブロック350に送る。該機能ブロック350は、各レート制御モデル・パラメータを更新して、制御権をループ端ブロック355に送る。該ループ端ブロック355は、当該ループを終了して、制御権を終了ブロック399に送る。
【0053】
機能ブロック315に於いて、丸めオフセットは、イントラ・ピクチャ及びインタ・ピクチャについて、それぞれ、例えば1/3.0及び1/6.0に初期化されても良い。決定ブロック340に於ける、量子化ステップ・サイズq及び/又は丸めオフセットsが改良を必要とするか否かの判定に関して、更なる改良が必要である場合、機能ブロック330及び335に対応する各処理が繰り返されて、q及びsのより正確な値が得られる。
【0054】
図1について説明した一般的なレート制御方法と比較した場合のこの方法の利点は、ピクチャ内の全てのマクロブロックが同一の量子化ステップ・サイズ及び同一の丸めオフセットで符号化され、従って、全てのマクロブロックの品質が均一なことである。また、この方法は、図1について説明した方法に非常に近い演算量(演算複雑度:computation_complexity)でランする。
【0055】
(実施形態2)
図4には、図3について説明した方法の変形例が示されている。図4の方法では、先ずピクチャについての量子化ステップ・サイズが初期化される。特定の実施形態として、量子化ステップ・サイズが、同一のピクチャ・タイプの直前のピクチャからの量子化ステップ・サイズに初期化される。量子化ステップ・サイズが与えられると、次に、丸めオフセットが計算される。量子化ステップ・サイズは更新される。
【0056】
図4には、ビデオ符号器に於けるレート制御方法例(非定値の丸めオフセットが組み込まれている)の全体が参照番号400によって示されている。
【0057】
方法400には開始ブロック405が含まれており、該開始ブロック405は、制御権を機能ブロック410に送る。該機能ブロック410は、符号化セットアップの実施、及び/又は、関与を行って、制御権を機能ブロック415に送る。該機能ブロック415は、各レート制御モデル・パラメータを初期化して、制御権をループ端ブロック420に送る。該ループ端ブロック420は、変数i(ここでi=1、・・・、ピクチャ数(#))を用いて、処理中の現在のビデオ・シーケンス内の各々のピクチャについて、ループを設定して、制御権を機能ブロック425に送る。該機能ブロック425は、ピクチャiについて量子化ステップ・サイズqを初期化して、制御権を機能ブロック430に送る。該機能ブロック430は、ピクチャiについて丸めオフセットsを計算して、制御権を機能ブロック435に送る。該機能ブロック435は、ピクチャiについて量子化ステップ・サイズqを更新して、制御権を決定ブロック440に送る。該決定ブロック440は、q及び/又はsが改良を必要とするか否かを判定する。必要とすると判定された場合、制御権は機能ブロック430に戻される。必要でないと判定された場合、制御権は、機能ブロック445に送られる。
【0058】
該機能ブロック445は、ピクチャiをq及びsで符号化して、制御権を機能ブロック450に送る。該機能ブロック450は、各レート制御モデル・パラメータを更新して、制御権をループ端ブロック455に送る。該ループ端ブロック455は、当該ループを終了して、制御権を終了ブロック499に送る。
【0059】
以下、本発明に伴う多数の利点/特徴の一部について説明するが、そのうちの一部は既に上述したものである。例えば、1つの利点/特徴は、レート制御を用いて1回の符号化パスで画像データを符号化するビデオ符号器を有する装置である。上記レート制御には、量子化ステップ・サイズ値と丸めオフセット値とを設定することと、少なくとも該丸めオフセット値を改良することとが含まれる。上記画像データは、上記量子化ステップ・サイズ値と上記改良された丸めオフセット値とに応じて符号化される。
【0060】
別の利点/特徴は、上記符号器を有する装置であって、上記レート制御には上記量子化ステップ・サイズ値を改良することが更に含まれており、上記画像データが上記改良された量子化ステップ・サイズ値と上記改良された丸めオフセット値とに応じて符号化される装置である。
【0061】
更に別の利点/特徴は、上記符号器を有する装置であって、上記量子化ステップ・サイズ値と上記丸めオフセット値のうちの少なくとも一方が、初めに、推定値として、設定される、装置である。
【0062】
更に別の利点/特徴は、上記符号器を有する装置であって、上述の如く、上記量子化ステップ・サイズ値と上記丸めオフセット値のうちの少なくとも一方が、初めに、推定値として、設定され、上記量子化ステップ・サイズ値と上記丸めオフセット値のうちの他方が、上記推定値に基づいて、設定される、装置である。
【0063】
更に別の利点/特徴は、上記符号器を有する装置であって、上述の如く、上記量子化ステップ・サイズ値と上記丸めオフセット値のうちの少なくとも一方が、初めに、推定値として、設定され、上記丸めオフセット値が、初めに、上記推定値として、設定され、上記推定値が上記レート制御についての目標ビット・レートと丸めオフセットとの間の線形関係に基づいている、装置である。
【0064】
更に別の利点/特徴は、上記符号器を有する装置であって、上記レート制御が固定ビット・レート用途と可変ビット・レート用途のうちの少なくとも一方に適用される、装置である。
【0065】
更に別の利点/特徴は、上記符号器を有する装置であって、上記ビデオ符号器が、国際標準化機構/国際電気標準会議のムービング・ピクチャ・エキパーツ・グループ−4のパート10のアドバンスト・ビデオ・コーディング規格/国際電気通信連合の電気通信標準化部門のH.264の勧告に準拠する合成ビットストリームに於ける上記画像データを符号化する、装置である。
【0066】
更に別の利点/特徴は、上記符号器を有する装置であって、上記レート制御用の各レート制御パラメータが、ρ領域レート・モデル、TM5レート・モデル、及び、TMN8レート・モデルのうちの少なくとも1つに基づいている、装置である。
【0067】
本原理のこれらの、及び、その他の特徴と利点は、当業者であれば、本明細書の各開示事項に基づいて容易に把握できるであろう。本原理の各開示事項は、ハードウェア、ソフトウェア、ファームウェア、特定用途プロセッサ、或いは、それらの組み合わせの様々な形態で実施できる。
【0068】
本原理の各開示事項は、ハードウェアとソフトウェアとの組み合わせとして実施するのが最も望ましい。更に、該ソフトウェアは、プログラム記憶装置に実装されたアプリケーション・プログラムとして実施できる。該アプリケーション・プログラムは、任意の適切なアーキテクチャから成るマシンにアップロードして、該マシンにより実行できる。該マシンは、1つ以上の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、及び、入力/出力(I/O)インタフェース等のハードウェアを有するコンピュータ・プラットフォームで実施するのが望ましい。該コンピュータ・プラットフォームには、オペレーティング・システムとマイクロインストラクション・コードが含まれていても良い。本明細書に記載された種々の処理と機能は、CPUによって実行され得るマイクロインストラクション・コードの一部、或いは、アプリケーション・プログラムの一部、或いは、それらの組み合わせであっても良い。更に、例えば、増設データ記憶装置、及び、印刷装置等の種々のその他の周辺装置をコンピュータ・プラットフォームに接続しても良い。
【0069】
更に、添付図面に示された各構成システム・コンポーネント及び方法の一部はソフトウェアの形態で実施されることが望ましいため、システム・コンポーネント相互間、或いは、処理機能ブロック相互間の実際の接続は、本原理がプログラムされる態様に従って、異なることがある。本明細書に記載された各開示事項により、当業者であれば、本原理のそのような、及び、同様な実施形態、或いは、コンフィギュレーション(環境設定、機器構成等)を考案できるであろう。
【0070】
本明細書では、添付図面を参照して各実施例を説明したが、本原理は、これらの各実施例そのものに限定されるものではなく、当業者であれば、本原理の範囲から、或いは、本原理の意図から逸脱することなく、種々の変更、及び、修正を行なうことが出来るであろう。そのような変更、及び、修正の全ては、本願の特許請求の範囲の各請求項に記載された本原理の範囲内に含まれるものである。
[付記1]
レート制御を用いて1回の符号化パスで画像データを符号化するビデオ符号器(200)を含む装置であって、前記レート制御には、量子化ステップ・サイズ値と丸めオフセット値とを設定することと、少なくとも前記丸めオフセット値を改良することとが含まれており、前記画像データが前記量子化ステップ・サイズ値と前記改良された丸めオフセット値とに応じて符号化される、前記装置。
[付記2]
付記1記載の装置であって、前記レート制御には前記量子化ステップ・サイズ値を改良することが更に含まれており、前記画像データが前記改良された量子化ステップ・サイズ値と前記改良された丸めオフセット値とに応じて符号化される、装置。
[付記3]
付記1記載の装置であって、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの少なくとも一方が、初めに、推定値として、設定される、装置。
[付記4]
付記3記載の装置であって、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの他方が、前記推定値に基づいて、設定される、装置。
[付記5]
付記3記載の装置であって、前記丸めオフセット値が、初めに、前記推定値として、設定され、前記推定値が前記レート制御についての目標ビット・レートと丸めオフセットとの間の線形関係に基づいている、装置。
[付記6]
付記1記載の装置であって、前記レート制御が固定ビット・レート用途と可変ビット・レート用途のうちの少なくとも一方に適用される、装置。
[付記7]
付記1記載の装置であって、前記ビデオ符号器(200)が、国際標準化機構/国際電気標準会議のムービング・ピクチャ・エキパーツ・グループ−4のパート10のアドバンスト・ビデオ・コーディング規格/国際電気通信連合の電気通信標準化部門のH.264の勧告に準拠する合成ビットストリームに於ける前記画像データを符号化する、装置。
[付記8]
付記1記載の装置であって、前記レート制御用の各レート制御パラメータが、ρ領域レート・モデル、TM5レート・モデル、及び、TMN8レート・モデルのうちの少なくとも1つに基づいている、装置。
[付記9]
レート制御を用いて1回の符号化パスで画像データを符号化すること(345、445)を含む方法であって、前記レート制御には量子化ステップ・サイズ値と丸めオフセット値とを設定すること(325、330、425)と少なくとも前記丸めオフセット値を改良すること(335、430、435)とが含まれており、前記画像データが前記量子化ステップ・サイズ値と前記改良された丸めオフセット値とに応じて符号化される(345、445)、前記方法。
[付記10]
付記9記載の方法であって、前記レート制御には前記量子化ステップ・サイズ値を改良すること(330、435)が更に含まれており、前記画像データが前記改良された量子化ステップ・サイズ値と前記改良された丸めオフセット値とに応じて符号化される、方法。
[付記11]
付記9記載の方法であって、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの少なくとも一方が、初めに、推定値として、設定される(325、425)、方法。
[付記12]
付記11記載の方法であって、前記量子化ステップ・サイズ値と前記丸めオフセット値のうちの他方が、前記推定値に基づいて、設定される(330、430)、方法。
[付記13]
付記11記載の方法であって、前記丸めオフセット値が、初めに、前記推定値として設定され(325)、前記推定値が前記レート制御についての目標ビット・レートと丸めオフセットとの間の線形関係に基づいている、方法。
[付記14]
付記9記載の方法であって、前記レート制御が固定ビット・レート用途と可変ビット・レート用途のうちの少なくとも一方に適用される、方法。
[付記15]
付記9記載の方法であって、前記符号化に於いて、国際標準化機構/国際電気標準会議のムービング・ピクチャ・エキパーツ・グループ−4のパート10のアドバンスト・ビデオ・コーディング規格/国際電気通信連合の電気通信標準化部門のH.264の勧告に準拠する合成ビットストリームに於ける前記画像データを符号化する、方法。
[付記16]
付記9記載の方法であって、前記レート制御用の各レート制御パラメータが、ρ領域レート・モデル、TM5レート・モデル、及び、TMN8レート・モデルのうちの少なくとも1つに基づいている、方法。
図1
図2
図3
図4