(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6739770
(24)【登録日】2020年7月28日
(45)【発行日】2020年8月12日
(54)【発明の名称】強化されたCABAC復号を用いた画像復号装置
(51)【国際特許分類】
H04N 19/91 20140101AFI20200730BHJP
H04N 19/593 20140101ALI20200730BHJP
H04N 19/70 20140101ALI20200730BHJP
【FI】
H04N19/91
H04N19/593
H04N19/70
【請求項の数】3
【外国語出願】
【全頁数】13
(21)【出願番号】特願2017-112361(P2017-112361)
(22)【出願日】2017年6月7日
(62)【分割の表示】特願2014-520448(P2014-520448)の分割
【原出願日】2012年11月7日
(65)【公開番号】特開2017-184266(P2017-184266A)
(43)【公開日】2017年10月5日
【審査請求日】2017年6月12日
【審判番号】不服2019-6942(P2019-6942/J1)
【審判請求日】2019年5月28日
(31)【優先権主張番号】13/291,015
(32)【優先日】2011年11月7日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100140534
【弁理士】
【氏名又は名称】木内 敬二
(72)【発明者】
【氏名】ミスラ キラン
(72)【発明者】
【氏名】セガール クリストファー エー.
【合議体】
【審判長】
清水 正一
【審判官】
樫本 剛
【審判官】
川崎 優
(56)【参考文献】
【文献】
Kiran Misra and Andrew Segall,”Using CABAC bypass mode for coding intra prediction mode”,Joint Collaborative Team on Video Coding(JCT−VC) of ITU−T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting,2011.11.9,JCTVC−G707,p.1−3
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
現在ブロックの予測モードを復号する復号装置であって、前記復号装置は、レギュラー復号化エンジンおよびバイパス復号化エンジンを含み、前記レギュラー復号化エンジンは、コンテキストを使用する算術復号化のためのものであり、前記バイパス復号化エンジンは、バイパス復号化プロセスを伴う算術復号化のためのものであり、前記復号装置は、
前記レギュラー復号化エンジンを介してフラグを復号するように構成された復号化手段であって、前記フラグは、第1のリスト内に前記予測モードが含まれるか否かを示し、前記第1のリストは、少なくとも2つの候補予測モードを含み、前記第1のリストは、前記現在ブロックの左側のブロックおよび上側のブロックの予測モードに基づいて生成される、復号化手段と、
前記予測モードが前記第1のリスト内に含まれることを前記フラグの復号された値が示すとき、前記バイパス復号化エンジンを介して復号された第1の情報を使用して、前記第1のリストから前記予測モードを決定するように構成された選択手段と
を含む、
ことを特徴とする復号装置。
【請求項2】
現在ブロックの予測モードを復号する方法であって、
コンテキストを使用する算術復号化プロセスによってフラグを復号するステップであって、前記フラグは、第1のリスト内に前記予測モードが含まれるか否かを示し、前記第1のリストは、少なくとも2つの候補予測モードを含み、前記第1のリストは、前記現在ブロックの左側のブロックおよび上側のブロックの予測モードに基づいて生成される、ステップと、
前記予測モードが前記第1のリスト内に含まれることを前記フラグの復号された値が示すとき、バイパス算術復号化プロセスによって復号された第1の情報を使用して、前記第1のリストから前記予測モードを決定するステップと
を含む
ことを特徴とする方法。
【請求項3】
現在ブロックの予測モードを符号化する符号化装置であって、前記符号化装置は、レギュラー符号化エンジンおよびバイパス符号化エンジンを含み、前記レギュラー符号化エンジンは、コンテキストを使用する算術符号化のためのものであり、前記バイパス符号化エンジンは、バイパス符号化プロセスを伴う算術符号化のためのものであり、前記符号化装置は、
前記レギュラー符号化エンジンを介してフラグを符号化するように構成された符号化手段であって、前記フラグは、第1のリスト内に前記予測モードが含まれるか否かを示し、前記第1のリストは、少なくとも2つの候補予測モードを含み、前記第1のリストは、前記現在ブロックの左側のブロックおよび上側のブロックの予測モードに基づいて生成される、符号化手段と、
前記予測モードが前記第1のリスト内に含まれることを前記フラグの符号化された値が示すとき、前記バイパス符号化エンジンを介して符号化された第1の情報を使用して、前記第1のリストから前記予測モードを選択するように構成された選択手段と
を含む
ことを特徴とする符号化装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化および/または復号に関して強化されたCABACを用いた画像復号に関する。
【背景技術】
【0002】
H.264/AVCのような、既存のビデオ符号化規格は、一般に、計算複雑度の増加を代償として比較的高い符号化効率を提供する。計算複雑度が増加するにつれて、符号化および/または復号速度は減少する傾向がある。また、忠実度のさらなる向上への要望が時とともに増加する傾向にあり、必要メモリはますます大きくなり、ますますより複雑な処理が必要とされる傾向にある。
【0003】
図1を参照すると、画像のブロックに関する符号化されたデータを多くの復号装置(デコーダ)が受信する(および符号化装置(エンコーダ)が供給する)。典型的に、画像は、ブロックに分割され、ブロックのそれぞれが何らかの方法で、例えば、離散コサイン変換(DCT:discrete cosine transform)を用いて符号化されて、復号装置へ供給される。復号装置は、符号化されたブロックを受信し、ブロックのそれぞれを何らかの方法で、例えば、逆離散コサイン変換を用いて復号する。
【0004】
MPEG−4 part10(H.264)のような、ビデオ符号化規格は、限られた周波数帯域幅および/または限られた記憶容量を持つチャネルを通じた送信のためにビデオ・データを圧縮する。これらのビデオ符号化規格は、フレームをより効果的に符号化および復号するために、イントラ予測、空間領域から周波数領域への変換、量子化、エントロピー符号化、動き推定、および動き補償のような、複数の符号化段階を含む。符号化および復号段階の多くは、計算が甚だしく複雑である。
【0005】
コンテキスト適応2値算術符号化(CABAC:context adaptive binary arithmetic coding)に基づく符号化/復号技術は、一般に、コンテキスト適応であり、これは、(i)過去に符号化および/または復号された前のシンボルの値に基づいてシンボルを適応的に符号化すること、および(ii)過去に符号化および/または復号されたシンボルのセットを識別するコンテキストを適応に用いることを意味する。過去のシンボルは、空間的および/または時間的に隣接したブロックに位置することができる。多くの場合、コンテキストは、隣接したブロックのシンボル値に基づく。
【0006】
コンテキスト適応2値算術符号化(CABAC)の符号化技術は、以下の段階を用いてシンボルを符号化することを含む。第1段階では、CABACは、「バイナライザ(binarizer)」を用いて入力シンボルを2値シンボル列、または「ビン(bin)」へマッピングする。入力シンボルは、ビットに符号化される前に2値化(binarize)されるか、別の状況では2値(1または0)シンボル列に変換される非2値(no−binary)のシンボルである。ビンは、「バイパス符号化エンジン」か、または「レギュラー符号化エンジン」のいずれかを用いてビットに符号化できる。
【0007】
CABACにおけるレギュラー符号化エンジンについては、第2段階で確率モデルが選択される。確率モデルは、2値化された入力シンボルの1つ以上のビンを算術符号化するために用いられる。このモデルは、最近符号化されたシンボルの関数であるコンテキストに依存して利用可能な確率モデルのリストから選択できる。確率モデルは、「1」または「0」であるビンの確率を記憶する。第3段階では、選択された確率モデルに従って算術符号化装置が各ビンを符号化する。「0」および「1」に対応する2つの部分範囲がビン毎に存在する。第4段階は、確率モデルをアップデートすることを含む。選択された確率モデルは、実際に符号化されたビン値に基づいてアップデートされる(例えば、ビンが「1」であったとすれば、「1」の頻度数が増やされる)。CABAC復号のための復号技術は、処理を逆に行う。
【0008】
CABACにおけるバイパス符号化エンジンについては、第2段階は、計算コストが高いコンテキスト推定および確率アップデート段階が省略されたビンからビットへの変換を含む。バイパス符号化エンジンは、入力ビンに関して一定の確率分布を仮定する。CABAC復号のための復号技術は、処理を逆に行う。
【0009】
CABACは、概念的に2つのステップを用いてシンボルを符号化する。第1のステップにおいて、CABACは、入力シンボルのビンへの2値化を行う。第2のステップにおいて、CABACは、バイパス符号化エンジンか、またはレギュラー符号化エンジンのいずれかを用いてビンのビットへの変換を行う。結果として生じる符号化されたビット値は、ビットストリームで復号装置へ供給される。
CABACは、概念的に2つのステップを用いてシンボルを復号する。第1のステップにおいて、CABACは、入力ビットをビン値へ変換するために、バイパス復号エンジンか、またはレギュラー(regular)復号エンジンのいずれかを用いる。第2のステップにおいて、CABACは、送信されたシンボル値をビン値へ復元するために逆2値化(de−binarization)を行う。復元されたシンボルは、本質的に非2値であろう。復元されたシンボルは、復号装置の残りの様態に用いられる。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】Toru Kumakura(外2名), "Fixing the number of mpm candidates", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-F340, ITU-T, 2011.07.22, p.1-8
【非特許文献2】Hisao Sasai(外1名), "Fixed Probability coding for Intra Mode Coding", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-F426, ITU-T, 2011.07.22, p.1-4
【非特許文献3】Vadim Seregin(外1名), "Utilisation of CABAC equal probability mode for intra modes coding", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-F376, ITU-T, 2011.07.22, p.1-3
【発明の概要】
【発明が解決しようとする課題】
【0011】
前述のように、CABACの符号化および/または復号処理は、少なくとも2つの異なる動作モードを含む。第1のモードでは、確率モデルは、実際に符号化されたビン値に基づいてアップデートされ、一般に「レギュラー符号化モード」と呼ばれる。レギュラー符号化モードは、関連する計算が複雑であり、終了までにかなり時間がかかるのに加えて、いくつか逐次的な直列動作を必要とする。第2のモードでは、確率モデルは、実際に符号化されたビン値に基づいてアップデートされず、一般に「バイパス(bypass)符号化モード」と呼ばれる。第2のモードでは、ビンを復号するために(おそらく一定の確率より他に)確率モデルは存在せず、従って確率モデルをアップデートする必要がなく、システムの計算複雑度が低減される。
【課題を解決するための手段】
【0012】
本発明のある様態は、動画像を復号する復号装置(デコーダ)を提供し、
(a)前記復号装置は、複数の画素を表す動画像のブロックを表すビットストリームを受信し、
(b)前記復号装置は、コンテキスト適応2値算術符号化により符号化された前記ビットストリームを復号し、
(c)前記復号装置は、少なくとも2つの復号モードを用いて前記ビットストリームを復号し、前記第1のモードは、復号されている現シンタックス要素に基づく確率推定に基づいて前記ビットストリームを復号し、前記第2のモードは、復号されている前記現シンタックス要素に基づく確率推定に基づかないで前記ビットストリームを復号し、
(d)前記復号装置は、前記第1のモードを用いてイントラ予測モードを復号するために、イントラ予測モードのリストを用いるべきかどうかを示すデータを復号し、
(e)前記復号装置は、前記第2のモードを用いて対象ブロックのイントラ予測モードを示すデータを復号する、復号装置であって、 イントラ予測モードの前記リストは、前に決定されたイントラ予測モードに基づいて決定される。
【発明の効果】
【0013】
本発明の先述および他の目的、特徴、ならびに利点は、本発明の以下の詳細な説明を添付図面と併せて考察したときにさらに容易に理解されるであろう。
【図面の簡単な説明】
【0014】
【
図4】CABACに関するコンテキスト復号を示す。
【
図6】バイパス復号モードを用いて符号化されたシンボルのサブセット、およびレギュラー復号モードを用いて符号化されたシンボルの別のサブセットを持つビットストリームを示す。
【
図7】バイパス復号モードおよびレギュラー復号モードを用いた復号技術を示す。
【
図8】イントラ符号化されることに対応するシンタックス要素タイプを有するブロックのシンボルに関する復号技術を示す。
【発明を実施するための形態】
【0015】
図2を参照すると、例示的な符号化装置(エンコーダ)200は、CABACを含みうるエントロピー符号化部260を含み、符号化装置200のいくつかの異なる他の様態からの入力を受信する。エントロピー符号化部260への1つの入力としては、サンプル適応オフセット(SAO:sample adaptive offset)部235からのSAO情報である。エントロピー符号化部260への他の入力としては、適応ループフィルタ245からのALF(adaptive loop filter)情報である。エントロピー符号化部260への他の入力としては、動き推定/動き補償(ME/MC:motion estimation/motion compensation)部230からのインターモード情報である。エントロピー符号化部260への他の入力としては、イントラ予測部270からのイントラモード情報である。また、エントロピー符号化部260への他の入力としては、量子化部310からの残差である。エントロピー符号化部260は、符号化されたビットストリームを供給する。エントロピー符号化部260へ供給されたこの情報は、ビットストリームに符号化される。SAO部235は、サンプルを適応ループフィルタ245へ供給し、適応ループフィルタ245は、復元されたサンプル225を参照フレームバッファ220へ供給し、参照フレームバッファ220は、データを動き推定/動き補償(ME/MC)部230へ供給する。デブロッキングフィルタ250からのデブロッキングされたサンプル240は、SAO部235へ供給される。多くの符号化装置と同様に、符号化装置は、イントラ予測部270をさらに含むことができ、予測されたサンプル280は、イントラ予測部270とME/MC部230との間で選択される。減算器290は、予測されたサンプル280を入力から減算する。符号化装置200は、変換部300、逆量子化部320、逆変換部330、および再構築部340も含むことができる。
【0016】
図3を参照すると、
図2の符号化装置に関連する復号装置400は、CABACを含みうるエントロピー復号部450を含むことができる。エントロピー復号部450は、符号化されたビットストリーム440を受信し、データを復号装置400の別の様態へ供給する。エントロピー復号部450は、イントラモード情報455をイントラ予測部460へ供給する。エントロピー復号部450は、インターモード情報465をMC部430へ供給する。エントロピー復号部450は、ALF情報495を適応ループフィルタ415へ供給する。エントロピー復号部450は、SAO情報475をSAO部410へ供給する。エントロピー復号部450は、符号化された残差485を逆量子化部470へ供給し、逆量子化部470は、データを逆変換部480へ供給し、逆変換部480は、データを再構築部490へ供給し、再構築部490は、データをイントラ予測部460および/またはデブロッキングフィルタ500へ供給する。サンプル適応オフセット(SAO)部410は、サンプルを適応ループフィルタ415へ供給し、適応ループフィルタ415は、復元されたサンプル445を参照フレームバッファ420へ供給し、参照フレームバッファ420は、データを動き補償(MC)部430へ供給する。デブロッキングフィルタ500は、デブロッキングされたサンプル510をSAO部410へ供給する。
【0017】
図4を参照すると、ビン570を復号するためにCABACレギュラー復号エンジンを用い、かつ隣接コンテキストを用いたときに、確率モデルを選択する説明図が示される。コンテキストは、復号されたシンボルCtxtA572および復号されたシンボルCtxtB574の関数として決定される。CtxtAは、ラインバッファ576に記憶されていたものである。このコンテキストが570を復号するために用いられる確率モデルを決定する。対照的に、
図5を参照すると、シンボル580を復号するためにCABACバイパス復号エンジンを用いたときに確率モードを選択する説明図が示される。選択される確率モードは、コンテキスト情報には依存しない。
図6を参照すると、ビットストリーム590は、バイパス符号化エンジンを用いて符号化された2値化シンタックス要素592のセットと、CABACにおける確率モデルのアップデートを必要とするためレギュラー符号化エンジンを用いて符号化された2値化シンタックス要素594のセットを含む。また、バイパス符号化モードを用いたときに、ラインバッファは必要でなくなり、必要メモリ量は削減され、確率モデルのアップデートは行われず、CABACのスループットは向上する。
【0018】
CABACは、可能な符号化構成の複雑なセットに基づいて動画像を復号する。例えば、符号化構成は、動き補償されたブロックおよびイントラ予測ブロックを含むことがある。動き補償された動画像ブロックの符号化および復号は、比較的複雑になりがちであり、一般に、CABACレギュラー符号化エンジンによって加わる複雑さから利益を享受する傾向がある。複雑さの一端は、復号技術に加えて、シンボルが依存する情報の記憶ならびにシンボルを符号化および/または復号するたびに確率モデル・メカニズムをアップデートする必要性にある。イントラ予測された動画像ブロックの符号化および復号は、比較的より複雑ではなく、CABACレギュラー符号化エンジンによって加わる複雑さから享受する利益は、それほど大きくない傾向がある。この場合、バイパス符号化モードは、圧縮効率に有意な影響を与えることなく、さらなる記憶、コンテキストの決定、および確率モデルのアップデートの必要性を減少させる傾向がある。特に、ビットストリームにおけるいくつかのシンボルは、2値化後に0または1の値のビンを概して等しい尤度で含む。なお、それと同時に、かかるシンボルは、CABACレギュラー符号化エンジンのコンテキスト適応によって有意な圧縮の利益をもたらすことはない。有意な圧縮の利益がこのように欠如するのは、おそらくそれらの確率分布が急速に変動するためであろう。
【0019】
図7を参照すると、一実施形態において、復号装置400のエントロピー復号450の一部として含まれるCABACは、ビットストリーム600に由来したビットを受信する。イントラ符号化されたブロック610に属するシンタックス要素、またはシンボルに関して、符号化効率への効果が追加される計算複雑度を正当化しない場合には、その特定のシンボルが、バイパス復号エンジンを用いるのに適しているかどうかが判定されるとよい(ステップ620)。イントラ符号化されたブロック610に属するシンタックス要素またはシンボルが、バイパス復号エンジンを用いるのに適していれば、2値化シンボルは、バイパス復号モード630を用いて復号される。イントラ符号化されたブロック610に属するシンタックス要素またはシンボルが、バイパス復号エンジンを用いるのに適していなければ、2値化シンボルは、レギュラー復号モード640を用いて復号される。
【0020】
図8を参照すると、CABACは、復号すべきシンボル570をビットストリームから受信する。対象ブロック(current block)の左側のブロックに属するシンボル574は、すでに復号済みであり、左側のブロックに関する予測モードがMleft650として決定されている。ここで予測モードは、すでに復号済みのデータを用いてブロック内の画素値を予測するための方法を特定する。同様に、対象ブロックの上側のブロックに属するシンボル572は、すでに復号済みであり、上側のブロックに関する予測モードがMabove652として決定されている。ほとんどの状況において、対象ブロックに関する予測モードは、明示的にビットストリームで送信されないが、代わりに、前述のMleftおよびMaboveのような、すでに決定された予測モードの尤度(likelifood)に基づいて決定される。従って、ある関数は、Mlist=f(Mleft,Mabove)として参照される、プロバブルモード(prоbable mоdes:確からしいモード)のリストを、Mleft650およびMabove652に基づくf(Mleft,Mabove)654を用いて発生させる。結果は、プロバブルモードのリストMlist656である。
【0021】
一実施形態において、関数によって発生したプロバブルモードのリストMlist656は、f(Mleft,Mabove)654を用いてモーストプロバブルモード(most prоbable mоdes:最も確からしいモード)のリストを発生させ、予測モードの(別の状況では単一のリストに組み合わされる)2つのリストを含み、第1のリストは「モーストプロバブルモード」を含み、第2のリストは「非モーストプロバブルモード」を含む。ビットストリームから、システムは、レギュラー復号エンジン657を用いることが適しているか否かを示すMPM_FLAGビット655を選択し、結果として、対象ブロックに関する予測モードが(典型的に「1」でシグナリングされる)「モーストプロバブルモード・リスト」中にあるか、または(典型的に「0」でシグナリングされる)「非モーストプロバブルモード・リスト」中にあるかどうかを示すMPM_FLAG660のような、シンタックス要素を選択する。対象ブロックに関するMPM_FLAG660との比較658は、適切な予測モードが「モーストプロバブルモード・リスト」662中にあるか、あるいは「非モーストプロバブルモード・リスト」664中にあるかどうかを判定するために用いられる。対象ブロックに関するMPM_FLAG660が、予測モードが「モーストプロバブルモード・リスト」662中にあることを示し、かつ単一の予測モードのみが「モーストプロバブルモード・リスト」中に存在する場合には、その予測モードが、対象ブロックに関して選択された予測モード674である。選択された予測モード674は、選択されたモード675として出力される。対象ブロックに関するMPM_FLAG660が、予測モードが「モーストプロバブルモード・リスト」662中にあることを示し、かつ2つの予測モードのみが「モーストプロバブルモード・リスト」インデックス中に存在する場合には、MPM_INDEXインデックス670を用いて、2つの予測モードから選択された予測モード674をシグナリングし、選択されたモード675を出力する。MPM_INDEXインデックス670は、バイパス復号エンジン673を用いることが適しているか否かを示す、MPM_INDEXビット671を選択することにより、システムがビットストリームから決定する。結果としてMPM_Indexインデックス670を出力する。「モーストプロバブルモード・リスト」のエントリのうちから選択する(ステップ662)処理は、追加された異なるモードを区別するために、MPM_INDEXインデックス670へ追加のビットを割り当てることによって拡張できる。
【0022】
先述のように、ビットストリームにおける過去のビンに基づいて、CABACは、現ビンが「1」または「0」となる確率を決定できる。「モーストプロバブルリスト内」および「非モーストプロバブルリスト内」からの選択は、CABACの符号化効率に有意な影響を与える決定であり、従ってアップデートされた確率を有することが有益である。
【0023】
対象ブロックに関するMPM_FLAG660が、予測モードが「非モーストプロバブルモード・リスト」664中にあることを示し、かつ単一の予測モードのみが「非モーストプロバブルモード・リスト」664中に存在する場合には、その予測モードが、対象ブロックに関して選択された予測モード680である。対象ブロックに関するMPM_FLAG660が、予測モードが「非モーストプロバブルモード・リスト」664中にあることを示し、かつ2つの予測モードのみが「非モーストプロバブルモード・リスト」中に存在する場合には、REM_INTRA_PRED_MODEインデックス690を用いて、2つの予測モードから選択された予測モード680を通知し、選択されたモード675を出力する。REM_INTRA_PRED_MODEインデックス690はバイパス復号エンジン693を用いることが適しているか否かを示しており、システムによって、ビットストリームから、REM_INTRA_PRED_MODEビット691を選択することにより決定され、結果としてREM_INTRA_PRED_MODEインデックス690が提供される。対象ブロックに関するMPM_FLAG660が、予測モードが「非モーストプロバブルモード・リスト」664中にあることを示し、かつ4つの予測モードのみが「非モーストプロバブルモード・リスト」インデックスに存在する場合には、2ビットのREM_INTRA_PRED_MODEインデックス690を用いて、4つの予測モードから選択された予測モード680を通知し、選択されたモード675を出力する。対象ブロックに関するMPM_FLAG660が、予測モードが「非モーストプロバブルモード・リスト」中にあることを示し、かつ8つの予測モードのみが「非モーストプロバブルモード・リスト」インデックス中に存在する場合には、3ビットのREM_INTRA_PRED_MODEインデックス690を用いて、8つの予測モードから選択された予測モード680を通知し、選択されたモード675を出力する。非モーストプロバブルモード・リストからモードを選択するこの処理は、異なるモードを区別するために、REM_INTRA_PRED_MODEインデックスへ追加のビットを割り当てることによって拡張できる。
【0024】
前述のように、ビットストリームにおける過去のビンに基づいて、CABACは、現ビンが「1」または「0」となる確率を決定できる。前述のように、「モーストプロバブルモード・リスト」および「非モーストプロバブルモード・リスト内」からの選択は、CABACの符号化効率に有意な影響を与える決定であり、従ってアップデートされた確率を有することが有益である。しかしながら、「非モーストプロバブルモード・リスト」664内の可能性からの選択は、CABACの符号化効率に与える影響が限られており、確率はアップデートされるべきではなく、システムの計算複雑度は低減される。ほとんどの場合、アップデートされない特定の2値化シンボルに割り当てられる確率は50%である。
【0025】
図9を参照すると、CABACに基づく例示的な符号化装置は、通常は非2値であるシンタックス要素値700を受信する。バイナライザ710は、シンタックス要素値700を受信し、シンタックス要素タイプ720に基づいて、2値列(binary string)730を発生させる。シンタックス要素タイプ720は、例えば、対象ブロックのイントラ予測モードに関して導出された索引語(index term)に対応する入力値、または対象ブロックのイントラ予測モードに関して導出されたフラグに対応する入力値をシグナリングする。セレクタ740は、1つ以上の入力に基づいて、バイパス符号化エンジン750か、またはレギュラー符号化エンジン760を用いるべきかどうかを選択する。セレクタ740への1つの入力としては、シンタックス要素タイプ720を含む。セレクタ740への他の入力としては、スライス・タイプ770を含む。スライス・タイプ770は、例えば、Iスライス(イントラ予測スライス)、Pスライス(前方予測スライス)、および/またはBスライス(双方向予測スライス)を含む。セレクタ740への他の入力としては、量子化パラメータ780である。2値化されたシンタックス要素値の統計的な振舞いは、例えば、ビットストリームのビットレートにしばしば関係する量子化パラメータに基づいて変化することがある。セレクタ740への他の入力としては、結果として生じるビットストリーム800から収集された統計データ790である。収集された統計データ790によって、符号化効率をさらに改善するためにビットストリームに基づいて符号化の仕方を修正することが容易になる。セレクタ740が、1つ以上の入力に基づいて、バイパス符号化モード810を選択すれば、2値列730は、ビットストリーム800を発生させるためにバイパス符号化エンジン750を用いて符号化される。セレクタ740が1つ以上の入力に基づいてレギュラー符号化モード820を選択した場合には、2値列730が算術符号化装置であるレギュラー符号化エンジン760へ供給される。加えて、現確率推定850が、空間的および/または時間的に隣接したシンタックス要素値840と、過去に符号化された2値シンボルに基づいて、コンテキスト・モデラ830によりレギュラー符号化エンジンへ入力として供給される。レギュラー符号化エンジン760は、ビットストリーム800を発生させる。レギュラー符号化エンジン760の出力は、コンテキスト・モデラ830の確率をアップデートするために用いられる。セレクタ740は、ビットストリーム800にどの符号化されたビットが含まれるべきかを示すために用いることもできる。
【0026】
図10を参照すると、ビットストリーム800は、CABACに基づく復号装置によって受信される。セレクタ810は、ビットストリーム800からの1つ以上の入力に基づいて、バイパス復号エンジン820か、またはレギュラー復号エンジン830を用いるべきかどうかを選択する。セレクタ810への1つの入力としては、シンタックス要素タイプ720を含む。セレクタ810への他の入力としては、スライス・タイプ770を含む。セレクタ810への他の入力としては、量子化パラメータ780を含む。セレクタ810への他の入力としては、収集された統計データ790である。セレクタ810が1つ以上の入力に基づいてバイパス復号モード840を選択した場合、ビットストリーム800は、2値の復号されたビット850を発生させるためにバイパス復号エンジン820を用いて復号される。セレクタ810が1つ以上の入力に基づいてレギュラー復号モード860を選択した場合、ビットストリーム800は、算術復号装置のエンジンであるレギュラー復号エンジン830へ供給される。加えて、現確率推定875が、空間的および/または時間的に隣接したシンタックス要素値880に基づいて、コンテキスト・モデラ870によりレギュラー復号エンジンへ入力として供給される。レギュラー復号エンジン830は、2値の復号されたビット890を発生させる。レギュラー復号エンジン830の出力は、コンテキスト・モデラ870の確率をアップデートするために用いられる。セレクタ810は、どの2値の復号されたビット850、890がデバイナライザ(debinarizer)900へ供給されるべきかを示すために用いることもできる。デバイナライザ900は、2値の復号された入力をシンタックス要素タイプ720とともに受信して、非2値のシンタックス要素値910を供給する。
【0027】
本発明の様態は、動画像を復号する復号装置を提供し、
(a)復号装置は、複数の画素を表す動画像のブロックを表す量子化された係数を含んだビットストリームを受信し、
(b)復号装置は、コンテキスト適応2値算術符号化を用いてビットストリームを復号し、
(c)コンテキスト適応2値算術符号化は、少なくとも復号されている現シンタックス要素に空間的および時間的に隣接するシンタックス要素値の少なくとも1つに基づく確率推定に基づいてビットストリームを復号する第1のモードと、第2のモードは、復号されている現シンタックス要素への他のシンタックス要素に基づく確率推定に基づかないでビットストリームを復号する第2のモードを含み、 (d)コンテキスト適応2値算術符号化は、現シンタックス要素がイントラ符号化されている場合に第1のモードを用い、プロバブルモードの第1のセットおよびプロバブルモードの第2のセットから選択して、現シンタックス要素を復号し、プロバブルモードの第1のセットは、プロバブルモードの第2のセットより尤度が高く、
(e)コンテキスト適応2値算術符号化は、現シンタックス要素がイントラ符号化されている場合、かつプロバブルモードの第2のセットの1つのうちから選択する場合に、第2のモードを用いて現シンタックス要素を復号する。
【0028】
別の様態によれば、第1のモードは、復号することに基づいて確率推定をアップデートすることを含む。
【0029】
別の様態によれば、プロバブルモードの第1のセットは、少なくとも2つのモードを含む。
【0030】
別の様態によれば、プロバブルモードの第1のセットは、単一のモードを含む。
【0031】
別の様態によれば、プロバブルモードの第2のセットは、少なくとも2つのモードを含む。
【0032】
別の様態によれば、プロバブルモードの第2のセットは、単一のモードを含む。
【0033】
別の様態によれば、ビットストリームは、プロバブルモードの第1のセットおよびプロバブルモードの第2のセットの間で選択することを示すためのフラグを含む。
【0034】
別の様態によれば、ビットストリームは、複数のプロバブルモードの第1のセットのうちからの選択を示すためのインデックスを含む。
【0035】
別の様態によれば、ビットストリームは、複数のプロバブルモードの第2のセットのうちからの選択を示すためのインデックスを含む。
【0036】
別の様態によれば、プロバブルモードの第1のセットおよびプロバブルモードの第2のセットからの選択は、さらにシンタックス要素タイプに基づく。
【0037】
別の様態によれば、プロバブルモードの第1のセットおよびプロバブルモードの第2のセットからの選択は、さらにスライス・タイプに基づく。
【0038】
別の様態によれば、プロバブルモードの第1のセットおよびプロバブルモードの第2のセットからの選択は、さらに量子化パラメータに基づく。
【0039】
別の様態によれば、プロバブルモードの第1のセットおよびプロバブルモードの第2のセットからの選択は、さらに、復号されたビットストリームの収集された統計データに基づく。
【0040】
前述の明細書に使用された用語および表現は、限定ではなく、説明の用語として本明細書に用いられ、かかる用語および表現の使用には図示され、説明される特徴またはその部分の等価物を除外する意図はなく、本発明の範囲は、添付される特許請求の範囲によってのみ規定され、限定されることが理解される。
【符号の説明】
【0041】
810……セレクタ
820……バイパス復号エンジン
830……標準復号エンジン
870……コンテキスト・モデラ
900……デバイナライザ