(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023029886
(43)【公開日】2023-03-07
(54)【発明の名称】ビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置
(51)【国際特許分類】
H04N 19/119 20140101AFI20230228BHJP
H04N 19/70 20140101ALI20230228BHJP
H04N 19/176 20140101ALI20230228BHJP
【FI】
H04N19/119
H04N19/70
H04N19/176
【審査請求】有
【請求項の数】45
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022187281
(22)【出願日】2022-11-24
(62)【分割の表示】P 2020067323の分割
【原出願日】2010-06-29
(31)【優先権主張番号】61/222,177
(32)【優先日】2009-07-01
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ジエン,ユンフエイ
(72)【発明者】
【氏名】シユイ,チエン
(72)【発明者】
【氏名】ルウ,シヤオアン
(72)【発明者】
【氏名】イン,ペン
(72)【発明者】
【氏名】ソレ,ジヨエル
(72)【発明者】
【氏名】アツバス,アデイール
(57)【要約】 (修正有)
【課題】大きなブロックにつき、イントラ予測を信号伝達する方法および装置を提供する。
【解決手段】装置は、ピクチャ内の大きなブロックにつき、イントラ予測を信号伝達することにより、ピクチャデータを符号化するビデオエンコーダ400を備える。イントラ予測は、基本的符号化単位サイズを選択し、基本的符号化単位サイズについて単一の空間イントラ・パーティション・タイプを割り当てることにより信号伝達される。単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能である。大きなブロックは、基本的符号化単位のブロックサイズより大きなブロックサイズを有する。イントラ予測は、階層的なレイヤイントラ予測であり、大きなブロックサイズから基本的符号化単位サイズに分割し、基本的符号化単位サイズから大きなブロックサイズに結合することにより、大きなブロックにつき実行される。
【選択図】
図4
【特許請求の範囲】
【請求項1】
ピクチャ内の少なくとも一つの大きなブロックにつき、イントラ予測を信号伝達することにより、ピクチャデータを符号化するビデオエンコーダ(400)を備え、前記イントラ予測は、基本的符号化単位サイズを選択し、該基本的符号化単位サイズについての単一の空間イントラ・パーティション・タイプを割り当てることにより信号伝達され、前記単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能であり、前記少なくとも一つの大きなブロックは、前記基本的符号化単位のブロックサイズより大きい大きなブロックサイズを有し、
前記イントラ予測は、階層的なレイヤイントラ予測であり、前記大きなブロックサイズから前記基本的符号化単位サイズに分割すること、および前記基本的符号化単位サイズから前記大きなブロックサイズに結合することの少なくとも一つにより、前記少なくとも一つの大きなブロックにつき実行される、装置。
【請求項2】
前記複数の空間イントラ・パーティション・タイプの各々については、複数の利用可能なイントラ予測モードのうち最も頻繁に使用される特定のイントラ予測モードに対し、より高い優先度が割り当てられる、請求項1に記載の装置。
【請求項3】
前記大きなブロックサイズが適宜、選択される、請求項1に記載の装置。
【請求項4】
前記信号伝達は、1つ以上のハイレベル・シンタックス要素を使用して行われる、請求項1に記載の装置。
【請求項5】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが事前に格納され、前記ビデオエンコーダ(400)により使用されて、前記少なくとも一つの大きなブロックを符号化し、前記空間イントラ・パーティション・タイプテーブルおよび前記イントラ予測モードテーブルの少なくとも一つは、事前に格納され、対応するビデオデコーダにより使用されて、前記少なくとも一つの大きなブロックを復号化するように構成されている、請求項1に記載の装置。
【請求項6】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが、前記ビデオエンコーダ(400)により使用されて前記少なくとも一つの大きなブロックを符号化し、1つ以上のハイレベル・シンタックス要素を使用して前記ビデオエンコーダ(400)により送信される、請求項1に記載の装置。
【請求項7】
ピクチャ内の少なくとも一つの大きなブロックにつき、イントラ予測を信号伝達することにより(775,780,755,742)、ピクチャデータを符号化するステップを備え、前記イントラ予測は、基本的符号化単位サイズを選択し、基本的符号化単位サイズについての単一の空間イントラ・パーティション・タイプを割り当てることにより信号伝達され、前記単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能であり、前記少なくとも一つの大きなブロックは、前記基本的符号化単位のブロックサイズより大きい大きなブロックサイズを有し、
前記イントラ予測は、階層的なレイヤイントラ予測であり、前記大きなブロックサイズから前記基本的符号化単位サイズに分割すること(720,725)、および前記基本的符号化単位サイズから前記大きなブロックサイズに結合すること(742,750,755,770,775,780)の少なくとも一つにより、前記少なくとも一つの大きなブロックにつき実行される、ビデオエンコーダにおける方法。
【請求項8】
前記複数の空間イントラ・パーティション・タイプの各々については、複数の利用可能なイントラ予測モードのうち最も頻繁に使用される特定のイントラ予測モードに対し、より高い優先度が割り当てられる(785,790,730)、請求項7に記載の方法。
【請求項9】
前記大きなブロックサイズが適宜、選択される(750,770)、請求項7に記載の方法。
【請求項10】
前記信号伝達は、1つ以上のハイレベル・シンタックス要素を使用して行われる(742,755,775,780,785,790,797)、請求項7に記載の方法。
【請求項11】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが事前に格納され、前記ビデオエンコーダにより使用されて、前記少なくとも一つの大きなブロックを符号化し、前記空間イントラ・パーティション・タイプテーブルおよび前記イントラ予測モードテーブルの少なくとも一つは、事前に格納され、対応するビデオデコーダにより使用されて、前記少なくとも一つの大きなブロックを復号化する(710)ように構成されている、請求項7に記載の方法。
【請求項12】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが、前記ビデオエンコーダにより使用されて前記少なくとも一つの大きなブロックを符号化し、1つ以上のハイレベル・シンタックス要素を使用して前記ビデオエンコーダにより送信される(797)、請求項7に記載の方法。
【請求項13】
ピクチャ内の少なくとも一つの大きなブロックにつき、イントラ予測が実行されるべきことを決定することにより、ピクチャデータを復号化するビデオデコーダ(500)を備え、前記イントラ予測は、基本的符号化単位サイズを決定し、該基本的符号化単位サイズにつき、単一の空間イントラ・パーティション・タイプを決定することにより決定され、前記単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから決定可能であり、前記少なくとも一つの大きなブロックは、前記基本的符号化単位のブロックサイズより大きい大きなブロックサイズを有し、
前記イントラ予測は、階層的なレイヤイントラ予測であり、前記大きなブロックサイズから前記基本的符号化単位サイズに分割すること、および前記基本的符号化単位サイズから前記大きなブロックサイズに結合することの少なくとも一つにより、前記少なくとも一つの大きなブロックにつき実行される、装置。
【請求項14】
前記複数の空間イントラ・パーティション・タイプの各々については、複数の利用可能なイントラ予測モードのうち最も頻繁に使用される特定のイントラ予測モードに対し、より高い優先度が割り当てられる、請求項13に記載の装置。
【請求項15】
前記大きなブロックサイズが適宜、決定される、請求項13に記載の装置。
【請求項16】
前記イントラ予測は、1つ以上のハイレベル・シンタックス要素を使用して決定される、請求項13に記載の装置。
【請求項17】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが事前に格納され、前記ビデオデコーダ(500)により使用されて、前記少なくとも一つの大きなブロックを復号化し、前記少なくとも一つの大きなブロックは、対応するエンコーダにより、その場所に事前に格納されている前記空間イントラ・パーティション・タイプテーブルおよび前記イントラ予測モードテーブルの少なくとも一つを使用して、事前に符号化されている、請求項13に記載の装置。
【請求項18】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つは、一つ以上のハイレベル・シンタックス要素を使用して前記ビデオデコーダ(500)により受信され、前記ビデオデコーダ(500)により使用されて前記少なくとも一つの大きなブロックを復号化する、請求項13に記載の装置。
【請求項19】
ピクチャ内の少なくとも一つの大きなブロックにつき、イントラ予測が実行されることを決定する(820, 830)ことにより、ピクチャデータを復号化するステップを備え、前記イントラ予測は、基本的符号化単位サイズを決定し、該基本的符号化単位サイズにつき単一の空間イントラ・パーティション・タイプを決定することにより決定され、前記単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから決定可能であり、前記少なくとも一つの大きなブロックは、前記基本的符号化単位のブロックサイズより大きい大きなブロックサイズを有し、
前記イントラ予測は、階層的なレイヤイントラ予測であり、前記大きなブロックサイズから前記基本的符号化単位サイズに分割すること、および前記基本的符号化単位サイズから前記大きなブロックサイズに結合する(820,830)ことの少なくとも一つにより、前記少なくとも一つの大きなブロックにつき実行される、ビデオデコーダにおける方法。
【請求項20】
前記複数の空間イントラ・パーティション・タイプの各々については、複数の利用可能なイントラ予測モードの中から、最も頻繁に使用される特定のイントラ予測モードのうちより高い優先度が割り当てられる(855,835,850)、請求項19に記載の方法。
【請求項21】
前記大きなブロックサイズが適宜、決定される(820,830)、請求項19に記載の方法。
【請求項22】
前記イントラ予測は、1つ以上のハイレベル・シンタックス要素を使用して決定される(820,830,835,885,850)、請求項19に記載の方法。
【請求項23】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが事前に格納され、前記ビデオデコーダにより使用されて、前記少なくとも一つの大きなブロックを復号化し、前記少なくとも一つの大きなブロックは、対応するエンコーダにより、その場所に事前に格納されている前記空間イントラ・パーティション・タイプテーブルおよび前記イントラ予測モードテーブルの少なくとも一つを使用して、事前に符号化されている(808)、請求項19に記載の方法。
【請求項24】
空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つは、一つ以上のハイレベル・シンタックス要素を使用して前記ビデオデコーダにより受信され、前記ビデオデコーダにより使用されて前記少なくとも一つの大きなブロックを復号化する(810)、請求項19に記載の方法。
【請求項25】
符号化されたビデオ信号データを有する記憶媒体であって、
ピクチャ内の少なくとも一つの大きなブロックについて、イントラ予測を信号伝達することにより符号化されたピクチャデータを備え、前記イントラ予測は、基本的符号化単位サイズを選択し、該基本的符号化単位サイズについての単一の空間イントラ・パーティション・タイプを割り当てることにより信号伝達され、前記単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能であり、前記少なくとも一つの大きなブロックは、前記基本的符号化単位のブロックサイズより大きい大きなブロックサイズを有し、
前記イントラ予測は、階層的なレイヤイントラ予測であり、前記大きなブロックサイズから前記基本的符号化単位サイズに分割すること、および前記基本的符号化単位サイズから前記大きなブロックサイズに結合することの少なくとも一つにより、前記少なくとも一つの大きなブロックにつき実行される、前記記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、米国特許仮出願番号第61/222,177号(2009年7月1日出願、代理人整理番号PU090082)の利益を主張し、当該出願は参照されることにより、その内容は全体として本明細書に参考として包含されている。
【0002】
本発明の原理は、一般にビデオ符号化および復号化に関し、より詳細にはビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置に関する。
【背景技術】
【0003】
直近のビデオ符号化標準は、種々の符号化モードを採用し、空間ドメインと時間ドメインの相関を効果的に減少させている。例えば、国際標準化機構/国際電気標準会議(ISO/IEC)動画専門グループ4(MPEG-4;Moving Picture Experts Group-4)のパート10、高度動画像圧縮符号化(AVC;Advanced Video Coding)規格/国際電気通信連合電気通信セクタ(ITU-T)H.264勧告(以下「MPEG-4AVD規格」という)においては、動画はフレーム内符号化またはフレーム間符号化が可能である。イントラピクチャでは、すべてのマクロブロックは、イントラ・モードで符号化されるため、ピクチャ内の空間的相関を活用することができる。イントラ・モードは以下の3つのタイプに分類できる:INTRA4×4,INTRA8×8,INTRA16×16である。INTRA4×4およびINTRA8×8は9つのINTRA予測モードに対応しており、INTRA16×16は4つのintra予測モードに対応している。
【0004】
INTRA4×4およびINTRA8×8は、以下の9つのイントラ予測モードに対応している:垂直、水平、DC、斜め左下、斜め右下、垂直左、水平下、垂直右、水平上予測である。INTRA16×16は、以下の4つのイントラ予測モードに対応している:垂直、水平、DC、平面予測である。
図1を参照すると、INTRA4×4およびINTRA8×8予測モードは、全体的に参照番号100により示されている。
図1では、参照番号0は垂直予測モードを示しており、参照番号1は水平予測モードを示しており、参照番号3は斜め左下モードを示しており、参照番号4は斜め右下予測モードを示しており、参照番号5は垂直右予測モードを示しており、参照番号6は水平下予測モードを示しており、参照番号7は、垂直左予測モードを示しており、参照番号8は水平上予測モードを示している。DCモードはINTRA4×4およびINTRA8×8予測モードの一部であり、図示されていない。
図2を参照すると、INTRA16×16予測モードは、参照番号200により全体的に示されている。
図2においては、参照番号0が垂直予測モードを示しており、参照番号1が水平予測モード1を示しており、参照番号3が平面予測モードを示している。DCモードは、INTRA16×16予測モードの一部であり、図示されていない。
【0005】
INTRA4×4は、4×4離散コサイン変換(DCT)を使用している。INTRA8×8は、8×8変換を使用している。INTRA16×16は、縦続型4×4変換を使用している。信号伝達のために、INTRA4×4およびINTRA8×8は、同一のマクロブロックタイプ(mb_type)0を共有し、変換サイズフラグ(transform_8×8_size_flag)により区別される。そしてINTRA4×4またはINTRA8×8のイントラ予測モードの選択は、必要であれば、おそらく残りのモードと共に最も確からしいモードにより信号伝達される。INTRA16×16については、符号化ブロックパターン(cbp)タイプと共に、すべてのイントラ予測モードがmb_typeで信号伝達され、これはmb_type値1~24を使用している。表1は、イントラ符号化スライス(Iスライス)についてのマクロブロックタイプのための詳細な信号伝達を示している。16×16より大きなブロックサイズがイントラ予測に使用される場合は、以下のようにいくつかの起こりうる課題に直面する。
【0006】
(1)単にMPEG―4AVC規格のmb_typeを単に拡張することにより、INTRA32×32またはINTRA64×64予測が追加される場合、これらの2つの新たなモードに過剰なオーバーヘッドを引きおこし、さらにイントラ予測の階層型を許容しない。イントラ予測の階層型の具体例は以下のように説明される。32×32ブロックが大きなブロックとして使用され、サブパーティションを16×16として許容すると、各16×16サブパーティションについては、INTRA4×4、INTRA8×8、INTRA16×16が許容されるべきである。
(2)縦続型変換の代わりにより大きなサイズの変換(16×16変換など)がINTRA16×16に使用されると、現在の信号伝達は適用できない。
(3)一つのイントラ・パーティション・タイプ内のイントラ予測モードにつき、種々な優先的扱いをする必要がある。
【0007】
【0008】
MPEG―4 AVC規格の拡張における大きな動作(インター)パーティションの信号伝達に関し、いくつかの先行技術アプローチが存在する。MPEG―4 AVC規格の拡張において、どの程度大きな動作(インター)パーティションが信号伝達されるかの一つの具体例は、最初の先行技術アプローチに関して記載されている。最初の先行技術アプローチは、階層的符号化構造を使用して、32×32ブロックまたは64×64ブロックにつき、どのように信号伝達がなされるかを記載している。
【0009】
さらに、MPEG―4 AVC規格の既存の動作パーティションサイズ(16×16,16×8,8×16,8×8,8×4,4×8,4×4)に加え、32×32,32×16,16×32パーティションを使用して、MPEG―4 AVC規格の拡張につき、インター符号化も提案されてきた。
図3を参照すると、32×32ブロックに使用される動作パーティションは、参照番号300により全体的に示されている。当該パーティションには、32×32,32×16,16×32,16×16がある。16×16パーティションは更に、サイズ16×16,16×8,8×16,8×8のパーティションに細分化できる。また8×8のパーティションは、サイズ8×8,8×4,4×8,4×4のパーティションに更に細分化できる。
【0010】
各32×32のブロックについては、SKIPモードまたはDIRECTモードが、mb32_skip_flagを使用して、MPEG―4 AVC規格の他のモードについて行われたのと同様の態様で信号伝達される。さらにMPEG―4 AVC規格のM×N(M=8または16かつN=8または16)パーティションについての本来のmb_typeも、32×32ブロックの2M×2Nパーティションを信号伝達するためにも使用される。32×32のmb32_typeが、16×16パーティションが使用されることを示している場合、4つの16×16ブロックが、MPEG―4 AVC規格のmacroblock_layer()と同一のシンタックス要素を使用することにより、ラスタスキャン順序で信号伝達される。各16×16ブロックは、四分木手法で更にサイズ16×16からサイズ4×4に至るまで分割することができる。
【0011】
64×64のマクロブロックサイズについては、32×32ブロックで使用されるパーティションに加え、以下のパーティションが追加される。すなわち64×64、64×32、32×64である。よってもう一つの階層的なレイヤが、ブロックサイズ32×32に加え、マクロブロックパーティションに追加される。64×64マクロブロックの4M×4Nマクロブロックパーティションを信号伝達するために、MPEG―4 AVC規格のM×N(M=8または16かつN=8または16)マクロブロックパーティションについての本来のmb_typeが使用される。32×32マクロブロックパーティションが64×64ブロックに使用されると、各32×32ブロックは、上記で記載したのと同様の態様で処理される。
【0012】
しかし既存の文献は、大きいイントラ・モードが、32×32と等しいか、それより大きいサイズのパーティションブロックを伴うイントラ予測を意味するように定義される場合、どの程度の大きさのイントラ・モードが信号伝達されるかの問題を扱っていない。
【発明の概要】
【0013】
先行技術の上記かつ他の欠点および不都合は、本発明の原理により対処されており、これはビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置を対象としている。
【0014】
本発明の原理の一つの態様によると、一つの装置が提供されている。当該装置は、少なくとも一つの大きなブロックにつきイントラ予測を信号伝達することにより、ピクチャ内の少なくとも一つの大きなブロックにつき、ピクチャデータを符号化するビデオエンコーダを含んでいる。イントラ予測は、基本的符号化単位サイズを選択し、基本的符号化単位サイズについての単一の空間イントラ・パーティション・タイプを割り当てることにより信号伝達される。単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能である。少なくとも一つの大きなブロックは、基本的符号化単位のブロックサイズより大きい、大きなブロックサイズを有する。イントラ予測は、階層的なレイヤイントラ予測であり、大きなブロックサイズから基本的符号化単位サイズに分割すること、および基本的符号化単位サイズから大きなブロックサイズに結合することの少なくとも一つにより、少なくとも一つの大きなブロックにつき実行される。
【0015】
本発明の原理の別の態様によれば、ビデオエンコーダにおける一つの方法が提供される。当該方法は、少なくとも一つの大きなブロックにつきイントラ予測を信号伝達することにより、ピクチャ内の少なくとも一つの大きなブロックにつき、ピクチャデータを符号化するステップを含んでいる。基本的符号化単位サイズを選択し、基本的符号化単位サイズについての単一の空間イントラ・パーティション・タイプを割り当てることにより、イントラ予測は信号伝達される。単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能である。少なくとも一つの大きなブロックは、基本的符号化単位のブロックサイズより大きい、大きなブロックサイズを有する。イントラ予測は、階層的なレイヤイントラ予測であり、大きなブロックサイズから基本的符号化単位サイズに分割すること、および基本的符号化単位サイズから大きなブロックサイズに結合することの少なくとも一つにより、少なくとも一つの大きなブロックにつき実行される。
【0016】
本発明の原理のさらに別の態様によれば、一つの装置が提供される。当該装置は、イントラ予測が少なくとも一つの大きなブロックにつき実行されるべきことを決定することにより、ピクチャ内の少なくとも一つの大きなブロックにつき、ピクチャデータを復号化するビデオデコーダを含んでいる。イントラ予測は、基本的符号化単位サイズを決定し、基本的符号化単位サイズにつき、単一の空間イントラ・パーティション・タイプを決定することにより、決定される。単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから決定可能である。少なくとも一つの大きなブロックは、基本的符号化単位のブロックサイズより大きい、大きなブロックサイズを有する。イントラ予測は、階層的なレイヤイントラ予測であり、大きなブロックサイズから基本的符号化単位サイズに分割すること、および基本的符号化単位サイズから大きなブロックサイズに結合することの少なくとも一つにより、少なくとも一つの大きなブロックにつき実行される。
【0017】
本発明の原理のさらに別の態様によれば、ビデオデコーダにおける一つの方法が提供される。当該方法は、イントラ予測が少なくとも一つの大きなブロックにつき実行されるべきことを決定することにより、ピクチャ内の少なくとも一つの大きなブロックにつき、ピクチャデータを復号化するステップを含んでいる。イントラ予測は、基本的符号化単位サイズを決定し、基本的符号化単位サイズにつき、単一の空間イントラ・パーティション・タイプを決定することにより、決定される。単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから決定可能である。少なくとも一つの大きなブロックは、基本的符号化単位のブロックサイズより大きい、大きなブロックサイズを有する。イントラ予測は、階層的なレイヤイントラ予測であり、大きなブロックサイズから基本的符号化単位サイズに分割すること、および基本的符号化単位サイズから大きなブロックサイズに結合することの少なくとも一つにより、少なくとも一つの大きなブロックにつき実行される。
【0018】
本発明の原理の上記および他の態様、特徴および利点は、添付図面に関連して解釈される例示的実施形態の以下の詳細な説明から明らかになる。
【図面の簡単な説明】
【0019】
本発明の原理は、以下の例示的図面によりより良く理解できる。
【
図1】本発明の原理を適用できるINTRA4×4およびINTRA8×8予測モードを示す概略図である。
【
図2】本発明の原理を適用できるINTRA16×16予測モードを示す概略図である。
【
図3】本発明の原理を適用できる32×32ブロックに使用する動作パーティションを示す概略図である。
【
図4】本発明の原理の実施形態により、本発明の原理を適用できる例示的ビデオエンコーダのブロック図である。
【
図5】本発明の原理の実施形態により、本発明の原理を適用できる例示的ビデオデコーダのブロック図である。
【
図6】本発明の原理の実施形態により、本発明の原理を適用できる例示的階層的パーティションのブロック図である。
【
図7A】本発明の原理の実施形態により、大きなブロックについて、イントラ予測を信号伝達することにより、大きなブロックについてピクチャデータを符号化する例示的方法の流れ図を示す。
【
図7B】本発明の原理の実施形態により、大きなブロックについて、イントラ予測を信号伝達することにより、大きなブロックについてピクチャデータを符号化する例示的方法の流れ図を示す。
【
図8A】本発明の原理の実施形態により、イントラ予測が大きなブロックに適用されるべきことを決定することにより、大きなブロックについてピクチャデータを復号化する例示的方法を示す流れ図を示す。
【
図8B】本発明の原理の実施形態により、イントラ予測が大きなブロックに適用されるべきことを決定することにより、大きなブロックについてピクチャデータを復号化する例示的方法を示す流れ図を示す。
【発明を実施するための形態】
【0020】
本発明の原理は、ビデオエンコーダおよびビデオデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置を対象としている。
【0021】
本説明は、本発明の原理を記述している。よって当業者は、種々の構成配置を考案し、本明細書に明示的に記述されておらず、または図示されていない場合であっても、本発明の原理を採用してその趣旨および範囲に含めることが可能であることが理解される。
【0022】
本明細書に列挙されたすべての具体例および条件付文言は、技術を進歩させるために発明者(ら)が提供する本発明の原理および概念を理解する際に、読み手を助けるという教育目的を有しており、特に列挙されたかかる具体例および条件に限定することがないものとして解釈されるべきである。
【0023】
また、本発明の原理の原則、態様および実施形態を列挙する本明細書中のすべての記述、ならびにこれらの特定の具体例は、これらの構造的かつ機能的な均等物の双方を包含することを意図としている。また、かかる均等物は、現在知られており、かつ将来開発される均等物、すなわち構造に関わらず、同一の機能を発揮する開発されたいずれの構成要件も包含することを意図している。
【0024】
よって、例えば、本明細書で提示されたブロック図は、本発明の原理を具体化する例示的回路の概念図を表現していることが、当業者により理解されるであろう。同様に、いずれのフローチャート、流れ図、状態遷移図、擬似コード等も、コンピュータまたはプロセッサが明示的に示されているか否かにかかわらず、コンピュータ読み取り可能媒体に十分に表現することができ、コンピュータまたはプロセッサによりそのように実行される種々のプロセスを表現することが理解されるであろう。
【0025】
図面に示された種々の要素の機能は、専用ハードウェアならびに適切なソフトエアと関連してソフトウェアを実行できるハードウェアの使用を介して提供できる。プロセッサにより提供される場合、機能は単一の専用プロセッサにより提供されてもよいし、単一の共有プロセッサにより提供されてもよいし、一部を共有できる複数の個別のプロセッサにより提供されてもよい。また、「プロセッサ」または「コントローラ」の文言の明示的使用は、ソフトウェアを実行することができるハードウェアのみを言及するように解釈されるべきではなく、黙示的にディジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを記憶する読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、不揮発性記憶装置を含むが、これに限定されない。
【0026】
従来型および/またはカスタムの他のハードウェアが含まれてもよい。同様に、図示されたいずれのスイッチも概念的に過ぎない。その機能は、プログラムロジックの動作を介して、専用のロジックを介して、プログラム制御および専用のロジックの相互作用を介して、あるいは手動でも実行でき、特定の技術は、コンテキストからより詳細に理解されるように、実施者により選択可能である。
【0027】
本明細書の請求項において、特定の機能を実行するための手段として表わされる任意の要素は、例えば、a)その機能を実行する複数の回路素子の組み合わせ、またはb)ファームウェア、マイクロコードなどを含む任意の形態のソフトウェアであって、その機能を実行する当該ソフトウェアを実行するための適切な回路と組み合わされたものなどを含め、当該機能を実行する任意の方法を含むことが意図されている。請求項によって定義される本発明の原理は、列挙される様々な手段によって提供される機能が、請求項によって提唱される手法で組み合わされ、かつ結合されるという事実に属する。したがって、これらの機能を提供することができるいずれの手段も、本明細書に示されているものと均等であるとみなされる。
【0028】
明細書中の本発明の原理の「一つの実施形態」または「ある実施形態」並びにその他の変形に対する言及は、実施形態との関連で記載される特定の特徴、構造、特性等が、本発明の原理の少なくとも一つの実施形態に含まれることを意味している。よって、明細書全体を通して様々な箇所に現れている「一つの実施形態においては」または「ある実施形態においては」のフレーズの出現、並びに他のいずれの変形も、必ずしも全てが同一の実施形態に言及しているものではない。
【0029】
例えば、「A/B」、「Aおよび/またはB」、「AおよびBの少なくとも一つ」という場合の以下の「/」、「および/または」、および「少なくとも一つの」のいずれかの使用は、最初に挙げたオプション(A)のみの選択を含むか、2番目に列記されたオプション(B)のみの選択を含むか、双方のオプション(AおよびB)の選択を意図していると理解されるべきである。他の具体例としては、「A,Bおよび/またはC」と「A、B、Cのうち少なくとも一つ」の場合は、当該フレーズは、最初に挙げられたオプション(A)のみの選択を含むか、第2番目に挙げられたオプション(B)のみの選択を含むか、第3番目に挙げられたオプション(C)のみの選択を含むか、第1および第2番目に挙げられたオプション(AおよびB)のみの選択を含むか、第1および第3番目に挙げられたオプション(AおよびC)のみの選択を含むか、第2および第3番目に挙げられたオプション(BおよびC)のみの選択を含むか、3つすべてのオプション(AおよびBおよびC)の選択を含むことを意図している。上記は、当該技術分野および関連する技術分野の当業者に直ちに明らかなように、列挙された多くの項目についても拡張適用できる。
【0030】
さらに、本発明の原理の1つ以上の実施形態が、MPEG―4 AVC規格の拡張に関して、本明細書に記載されており、一方で本発明の原理は、この拡張および/またはこの規格にのみ限定されるものではないため、本発明の原理の趣旨を維持しつつ、他のビデオ符号化標準、勧告、およびその拡張に関しても利用できる点が理解されるべきである。
【0031】
本明細書で使用される際、「ハイレベル・シンタックス」は、マクロブロックレイヤよりも上の階層に存在するビットストリーム内に存在するシンタックスをいう。例えば、本明細書において使用されているハイレベル・シンタックスは、スライスヘッダレベルのシンタックス、付加拡張情報(SEI)レベルのシンタックス、ピクチャパラメータセット(PPS)レベルのシンタックス、シーケンスパラメータセット(SPS)レベルのシンタックス、及びネットワーク抽象化レイヤ(NAL)ユニットヘッダレベルのシンタックスを指す場合もあるが、これらに限定されない。
【0032】
さらに本明細書で使用される際に、「ピクチャ」および「画像」の用語は、互換可能に使用され、静止画またはビデオシーケンスからのピクチャを指す。周知のように、ピクチャはフレームあるいはフィールドであってもよい。
【0033】
さらに本明細書で使用される際に、「信号伝達」の用語は、対応するデコーダに何かを示すことを指す。例えば、いずれの特定の予測タイプ(例えば、イントラまたはインター)がエンコーダ側で使用されたかをデコーダに知らせるために、(本明細書で定義される)特定の大きなブロックにイントラ予測が使用されるように指定されることをエンコーダは信号伝達することができる。このように、同一の予測タイプがエンコーダ側とデコーダ側の双方で使用できる。よって例えば、単にデコーダが当該大きなブロックにつき同一の予測タイプを知り、かつこれを選択できるように、当該大きなブロック上でイントラ予測が実行されるべきである、という特定の大きなブロックに関する表示(すなわち信号)を、エンコーダは送信できる。信号伝達は種々の態様で実現できることが理解されるべきである。例えば、対応するデコーダに情報を信号伝達するために、1つ以上のシンタックス要素、フラグ等を使用してもよい。
【0034】
図4を参照すると、本発明の原理の実施形態に従って本発明の原理が適用できる例示的ビデオエンコーダは、参照番号400により全体的に表示されている。
【0035】
ビデオエンコーダ400は、コンバイナ485の非反転入力と信号通信する出力を備えたフレーム順序付けバッファ410を含む。コンバイナ485の出力は、変換器および量子化器425の第1の入力と信号通信により接続されている。変換器および量子化器425の出力は、エントロピーコーダ445の第1の入力、ならびに逆変換器および逆量子化器450の第1の入力と信号通信により接続されている。エントロピーコーダ445の出力は、コンバイナ490の第1の非反転入力と信号通信により接続されている。コンバイナ490の出力は、出力バッファ435の第1の入力と信号通信により接続されている。
【0036】
エンコーダコントローラ405の第1の出力は、フレーム順序付けバッファ410の第2の入力と、逆変換器および逆量子化器450の第2の入力と、ピクチャタイプ決定モジュール415の入力と、マクロブロック(macroblock)タイプ(MB‐タイプ)決定モジュール420の入力と、超イントラ予測モジュール460の第2の入力と、デブロッキングフィルタ465の第2の入力と、動き補償手段470の第1の入力と、動き予測手段475の第1の入力と、参照ピクチャバッファ480の第2の入力と信号通信により接続されている。
【0037】
エンコーダコントローラ405の第2の出力は、付加拡張情報(SEI)インサータ430の第1の入力と、変換器および量子化器425の第2の入力と、エントロピーコーダ445の第2の入力と、出力バッファ435の第2の入力と、シーケンスパラメータセット(SPS)およびピクチャパラメータセット(PPS)インサータ440の入力と信号通信により接続されている。
【0038】
ピクチャタイプ決定モジュール415の第1の出力は、フレーム順序付けバッファ410の第3の入力と信号通信により接続されている。ピクチャタイプ決定モジュール415の第2の出力は、マクロブロック-タイプ決定モジュール420の第2の入力と信号通信により接続されている。
【0039】
シーケンスパラメータセット(SPS)およびピクチャパラメータセット(PPS)インサータ440の出力は、コンバイナ490の第3の非反転入力と信号通信により接続されている。
【0040】
逆量子化器および逆変換器450の出力は、コンバイナ419の第1の非反転入力と信号通信により接続されている。コンバイナ419の出力は、超イントラ予測モジュール460の第1の入力と、デブロッキングフィルタ465の第1の入力と信号通信により接続されている。デブロッキングフィルタ465の出力は、参照ピクチャバッファ480の第1の入力と信号通信により接続されている。参照ピクチャバッファ480の出力は、動き予測手段475の第2の入力と信号通信により接続されている。動き予測手段475の第1の出力は、動き補償手段470の第2の入力と信号通信により接続されている。動き予測手段475の第2の出力は、エントロピーコーダ445の第3の入力と信号通信により接続されている。
【0041】
動き補償手段470の出力は、スイッチ497の第1の入力と信号通信により接続されている。超イントラ予測モジュール460の出力は、スイッチ497の第2の入力と信号通信により接続されている。マクロブロック-タイプ決定モジュール420の出力は、スイッチ497の第3の入力と信号通信により接続されている。スイッチ497の第3の入力は、(制御入力、すなわち第3の入力と比較して)スイッチの「データ」入力が、動き補償手段470または超イントラ予測モジュール460により提供されるべきか否かを決定する。スイッチ497の出力は、コンバイナ419の第2の非反転入力およびコンバイナ485の反転入力と信号通信により接続されている。
【0042】
フレーム順序付けバッファ410およびエンコーダコントローラ405の入力は、入力ピクチャ401を受信するためのエンコーダ400の入力として利用可能である。また、付加拡張情報(SEI)インサータ430の入力は、メタデータを受信するためのエンコーダ400の入力として利用可能である。出力バッファ435の出力は、ビットストリームを出力するためのエンコーダ400の出力として利用可能である。
【0043】
図5を参照すると、本発明の原理の実施形態により本発明の原理が適用可能な例示的ビデオデコーダが、参照番号500により全体的に示されている。
【0044】
ビデオデコーダ500は、エントロピーデコーダ545の第1の入力と信号通信により接続されている出力を備えた入力バッファ510を含んでいる。エントロピーデコーダ545の第1の出力は、逆変換器および逆量子化器550の第1の入力と信号通信により接続されている。逆変換器および逆量子化器550の出力は、コンバイナ525の第2の非反転入力と信号通信により接続されている。コンバイナ525の出力は、デブロッキングフィルタ565の第2の入力と超イントラ予測モジュール560の第1の入力と信号通信により接続されている。デブロッキングフィルタ565の第2の出力は、参照ピクチャバッファ580の第1の入力と信号通信により接続されている。参照ピクチャバッファ580の出力は、動き補償手段570の第2の入力と信号通信により接続されている。
【0045】
エントロピーデコーダ545の第2の出力は、動き補償手段570の第3の入力と、デブロッキングフィルタ565の第1の入力と信号通信により接続されている。エントロピーデコーダ545の第3の出力は、デコーダコントローラ505の入力と信号通信により接続されている。デコーダコントローラ505の第1の出力は、エントロピーデコーダ545の第2の入力と信号通信により接続されている。デコーダコントローラ505の第2の出力は、逆変換器および逆量子化器550の第2の入力と信号通信により接続されている。デコーダコントローラ505の第3の出力は、デブロッキングフィルタ565の第3の入力と信号通信により接続されている。デコーダコントローラ505の第4の出力は、スーパーイントラ予測モジュール560の第2の入力、動き補償手段570の第1の入力、参照ピクチャバッファ580の第2の入力と信号通信により接続されている。
【0046】
動き補償手段570の出力は、スイッチ597の第1の入力と信号通信により接続されている。超イントラ予測モジュール560の出力は、スイッチ597の第2の入力と信号通信により接続されている。スイッチ597の出力は、コンバイナ525の第1の非反転入力と信号通信により接続されている。
【0047】
入力バッファ510の入力は、入力ビットストリームを受信するためのデコーダ500の入力として利用可能である。デブロッキングフィルタ565の第1の出力は、出力ピクチャを出力するためのデコーダ500の出力として利用可能である。
【0048】
上記で言及したように、本発明の原理は、ビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置を対象とする。また上記で言及したように、本発明の原理を適用できる大きなブロックは、32×32と等しいか、それより大きいサイズのブロックを意味するように定義される。
【0049】
ある実施形態においては、言及を容易にするために、イントラ予測の信号伝達を以下の2つの部分に分割する。sip_type(空間イントラ・パーティション・タイプであって、INTRA4×4,INTRA8×8,INTRA16×16等であってもよい)、および各sip_type内のイントラ予測モード(intra_pred_mode)(例えば、INTRA4×4およびINTRA8×8内の9つのイントラ予測モードなど)である。特定の実施形態に関連してより詳細には、本発明の原理に関する以下の3つのルールを提案する。(1)基本的符号化単位を選択し、(2)最大イントラ予測タイプから分割すること、あるいは基本的符号化単位から結合することにより、階層的なレイヤイントラ予測を可能にし、(3)各sip_typeについて、最も頻繁に使用されるイントラ予測モード(intra_pred_mode)に対し、より高い優先度を割り当てる。ルール(1)に関しては、基本的符号化単位について複数のsip_type(空間イントラ・パーティション・タイプ)を認める。
【実施例0050】
ある実施形態においては、基本的符号化単位を16×16に設定する。この符号化単位では、sip_type(空間イントラ・パーティション・タイプ)をINTRA4×4,INTRA8×8,INTRA16×16とすることができる。さらに
図6に示すような階層的なレイヤイントラ予測を可能にする。
【0051】
図6を参照すると、本発明の原理を適用できる例示的階層的パーティションは、参照番号600により全体的に示されている。この実施形態においては、最大ブロックサイズが64×64に設定されている場合、階層的なレイヤイントラ予測を可能にするために、「信号伝達の分割」を利用する。すなわち、ある実施形態では、intra64_flagを加える。intra64_flagが1に等しい場合は、INTRA64×64が使用される。あるいはintra64_flagが0に等しい場合は、64×64ブロック611を4つの32×32ブロック621に分割する。各32×32ブロック621については、intra32_flagを加える。intra32_flagが1に等しい場合は、INTRA32×32が使用される。あるいはintra32_flagが0に等しい場合は、16×16基本的符号化単位で認められるすべてのsip_type(空間イントラ・パーティション・タイプ)が(すなわち32×32ブロック621に関して)ここでも認められる。INTRA16×16のイントラ予測モード(intra_pred_mode)については、DCモード、方向モードがあり、後者はモード情報を送信することにより、異なるタイプの方向予測を可能にしている。よって、32×32イントラ予測ブロック621は、更に4つの16×16イントラ予測ブロック631に分割できる。4つの16×16イントラ予測ブロック631のうち1つ以上は、更にDCモード(図示せず)、16×16モード641、8×8モード651,4×4モード661に分割できる。この実施形態においては、以下の4つの16×16イントラ予測モード、すなわちDC、水平(HOR)、垂直(VER)、多方向(Multi-DIR)を有すると仮定する。イントラ予測モード(intra_pred_mode)は、各モードの優先度を考慮して信号伝達される。INTRA16×16においては、DCモードが他のモードより頻繁に使用されるため、INTRA16×16の前にsip_type(空間イントラ・パーティション・タイプ)テーブルにINTRA16×16_DCを加える。そして、INTRA16×16についてのイントラ予測モード(intra_pred_mode)の最優先モード(most_probable_mode)表示を削除する。その代わりに他の3つのモード(16×16,8×8,4×4)が確実に表示される。
【0052】
シンタックス
表2および表3にこの実施形態に関するシンタックスの具体例を記述する。特に表2は、本発明の原理の実施形態に従った16×16符号化ユニットについてのsip type(空間イントラ・パーティション・タイプ)の例示的仕様を示し、表3は、本発明の原理の実施形態に従った例示的INTRA16×16予測モードを示している。INTRA32×32/INTRA64×64については、INTRA16×16と同一のモードが使用される。信号伝達については、DCが最も頻繁に使用されるため、最優先モード(most_probable_mode)表示をintra32_DC_flagおよびintra64_DC flagで置き換える。そして他のイントラ予測モード(intra_pred_mode)を確実に符号化する。
【0053】
INTRA4×4およびINTRA8×8についてのイントラ予測モード(intra_pred_mode)信号伝達は、MPEG―4 AVC規格におけるのと全く同様に実行することができるため、いずれの表にもこれらのモードは挙げないこととする。
【0054】
【0055】
【表3】
表4は、本発明の原理の実施形態により、例示的マクロブロックレイヤシンタックスを示している。
【0056】
【0057】
表4の一部のシンタックス要素のセマンティクスは以下の通りである。
1に等しいIntra64_flagは、INTRA64×64が使用されることを指定している。0と等しいIntra64_flagは、64×64の大きなブロックが32×32の区画に更に分割されることを指定している。
1に等しいIntra64_DC_flagは、INTRA64×64についてのintra_pred_mode(イントラ予測モード)がDCモードであることを指定している。0と等しいIntra64_DC_flagは、INTRA64×64につき、intra_pred_mode(イントラ予測モード)がDCモードではないことを指定している。
intra_pred_mode_64は、INTRA64×64につき(DCモードを含まない)イントラ予測モードを指定している。
Intra64_multidir_indexは、INTRA64×64のMulti_Dirモードにつき角度の指数を指定している。
1に等しいintra32_flag[i]は、INTRA32×32が、i番目の32×32の大きなブロックに使用されることを指定している。0に等しいIntra32_flag[i]は、i番目の32×32の大きなブロックが、更に16×16のパーティションに更に分割されることを指定している。
1に等しいintra32_DC_flag[i]は、intra_pred_mode(イントラ予測モード)が、i番目の32×32のブロックにつき、INTRA32×32のためのDCモードであることを指定している。0に等しいintra32_DC_flag[i]は、i番目の32×32ブロックにつき、intra_pred_mode(イントラ予測モード)が、INTRA32×32のためのDCモードではないことを指定している。
intra_pred_mode_32[i]は、i番目の32×32の大きなブロックにつき、INTRA32×32のための(DCモードを含まない)イントラ予測モードを指定している。
Intra32_multidir_indexは、INTRA32×32のMulti_Dir(多方向)モードにつき角度の指数を指定している。
sip_type[i]は、i番目の16×16のブロックの基本的ブロック符号化単位についての空間イントラ・パーティション・タイプを指定している。
Intra_pred_mode_16[i]は、i番目の16×16のブロックにつき、INTRA16×16のための(DCモードを含まない)イントラ予測モードを指定している。
Intra16_multidir_indexは、i番目の16×16のブロックにつき、INTRA16×16のMulti_Dirモードについての角度の指数を指定している。
他の実施形態においては適宜、大きなブロック単位を32×32または64×64であるように選択する。選択は、1つ以上のハイレベル・シンタックス要素を使用して信号伝達することができる。ある実施形態において32×32が選択される場合、64×64に関連するすべてのシンタックスを単に削除するだけである。
他の実施形態では、階層的なレイヤイントラ予測は、基本的符号化単位から結合することを伴う場合がある。例えば、最大ブロック単位が64×64であり、基本的符号化単位が16×16の場合、「一つの64×64のブロック内の16×16のブロックのすべてが16×16符号化タイプである場合」を表示するのに、一つのフラグ(is_all_16×16_coding)を使用する。(is_all_16×16_coding)が1に等しい場合は、これは、16×16符号化タイプが使用されることを示しており、信号伝達を中止する。他の場合は、一つの64×64のブロック内の32×32のブロックのすべてが32×32符号化タイプである場合を表示するのに、一つのフラグ(is_all_32×32_coding)を使用する。(is_all_32×32_coding)が1に等しい場合は、これは、一つの64×64のブロック内の32×32のブロックのすべてが32×32符号化タイプであることを示している。他の場合は、(is_all_32×32_coding)および(is_all_16×16_coding)が0に等しい場合は、これは、INTRA64×64が使用されることを示している。
他の実施形態では、16×16以上のサイズのブロック単位(large_sip_type)につきSIP type(空間イントラ・パーティション・タイプ)を導入する。3つのタイプは以下を指す:large_intra_16×16;large_intra_32×32;large_intra_64×64である。large_intra_16×16は、一つの大きなブロック内のすべての16×16のブロックは、16×16符号化タイプであることを意味している。large_intra_32×32は、一つの大きなブロック内のすべての32×32のブロックは、32×32符号化タイプであることを意味している。ある実施形態においては、large_intra_32×32は、上記の実施形態とintra32_flagと共に組合せることにより、階層的なイントラ予測が可能になる。large_intra_64×64は、一つの大きなブロック内のすべての64×64のブロックは、INTRA64×64として符号化されることを意味する。
他の実施形態においては、複数のsip/modeテーブルを導入することができる。テーブルは、エンコーダおよびデコーダの双方に事前に格納することができ、あるいはテーブルはユーザ指定であってもよく、1つ以上のハイレベル・シンタックス要素を使用して送信できる。表5は、本発明の原理一つの実施形態に従って例示的マクロブロックレイヤシンタックスを示している。
機能ブロック785は、Intra64×64モード決定を行い、Intra64_DC flagをRD64(すなわち、Intra64×64モード決定から生じるレート歪み)に基づいて設定し、制御を決定ブロック770に渡す。
ループ端ブロック720は、4つの32×32ブロック(すなわち32×32のブロックサイズを有し、現64×64ブロックがループ1により処理されることにより得られる4つのブロック)をループ(以下「ループ2」ともいう)にかけ、制御ブロック790およびループ端ブロック725に制御を渡す。
機能ブロック790は、Intra32×32モード決定を行い、Intra32_DC flagをRD32(すなわち、Intra32×32モード決定から生じるレート歪み)に基づいて設定し、制御を決定ブロック750に渡す。
ループ端ブロック725は、4つの16×16ブロック(すなわち16×16のブロックサイズを有し、現32×32ブロックがループ2により処理されることにより得られる4つのブロック)をループ(以下「ループ3」ともいう)にかけ、機能ブロック730および機能ブロック735に制御を渡す。
機能ブロック730は、Intra16×16_DCモードを判定し、制御を機能ブロック740に渡す。機能ブロック735は、他の16×16モード(すなわちIntra16×16_DC以外)およびそれ以下のモード(例えば、8×8,4×4等)を判定し、制御を機能ブロック740に渡す。
機能ブロック740は、RD16(すなわち、intra16×16モード決定から生じるレート歪み)に基づいて、16×16モード決定を行い、次に(4つの16×16ブロックにより符号化された場合の32×32ブロック全体の全レート歪みを示す)TotRD16を得るために、各16×16ブロックのRD16を蓄積し、制御をループ端ブロック745に渡す。ループ端ブロック745は、16×16ブロックのループ(すなわち「ループ3」)を閉じ、決定ブロック750に制御を渡す。
決定ブロック750は、RD32<TotRD16か否か(すなわち、現32×32ブロックについてのレート歪コストが、現32×32ブロックから得られた4つの16×16ブロックについての全レート歪コストより少ないか否か)を判断する。そうであれば、制御が機能ブロック755に渡される。そうでない場合は、制御は機能ブロック742に渡される。
機能ブロック755は、1に等しいIntra32_flagを設定し、機能ブロック760に制御を渡す。機能ブロック742は、0に等しいIntra32_flagを設定し、機能ブロック760に制御を渡す。
機能ブロック760は、各32×32ブロックのRD32の蓄積をTotRD32に設定し、4つの32×32ブロックにより符号化された場合に全64×64ブロックの全レート歪を表示し、ループ端ブロック765に制御を渡す。ループ端ブロック765は、32×32ブロックのループ(すなわちループ2)を閉じ、決定ブロック770に制御を渡す。
決定ブロック770は、RD64<TotRD32か否か(すなわち、現64×64ブロックについてのレート歪コストが、現64×64ブロックから得られた4つの32×32ブロックについての全レート歪コストより少ないか否か)を判断する。そうであれば、制御が機能ブロック775に渡される。そうでない場合は、制御は機能ブロック780に渡される。
機能ブロック775は、1に等しいIntra64_flagを設定し、ループ端ブロック795に制御を渡す。機能ブロック780は、0に等しいIntra64_flagを設定し、機能ブロック795に制御を渡す。
機能ブロック795は、64×64ブロックのループ(すなわちループ1)を閉じ、機能ブロック797に制御を渡す。機能ブロック797は、フラグ、イントラ予測モード(intra_pred_mode)、残余をエントロピー符号化し、終了ブロック99に制御を渡す。
ループ端ブロック825は、4つの32×32ブロックをループ(以下「ループ2」という)にかけ、決定ブロック830に制御を渡す。決定ブロック830は、Intra32_flagが1に等しいか否かを判断する。そうであれば、制御は機能ブロック835に渡される。そうでない場合は、制御はループ端ブロック845に渡される。
機能ブロック835は、Intra32_DC_flagが1に等しいか否かを判断する。そうであれば、制御は機能ブロック837に渡される。そうでない場合は、制御は機能ブロック838に渡される。機能ブロック837は、intra32×32DC予測を行い、制御を機能ブロック840に渡す。機能ブロック838は、intra32×32DCモード以外のイントラ予測を行った後、機能ブロック840に制御を渡す。機能ブロック840は、32×32ブロックを復号化し、ループ端ブロック875に制御を渡す。
ループ端ブロック845は、4つの16×16ブロックをループ(以下「ループ3」という)にかけ、決定ブロック850に制御を渡す。決定ブロック850は、sip_type(空間イントラ・パーティション・タイプ)=Intra16_DCであるか否かを判断する。そうであれば、制御は機能ブロック855に渡される。そうでない場合は、制御は機能ブロック860に渡される。
機能ブロック855は、Intra16×16_DCモード予測を行い、機能ブロック865に制御を渡す。機能ブロック860は、他のイントラ予測モード(すなわち、Intra16×16_DCモード以外)を使用してモード予測を行い、機能ブロック865に制御を渡す。
機能ブロック865は16×16ブロックを復号化し、ループ端ブロック870に制御を渡す。ループ端ブロック870は、16×16ブロックのループ(すなわちループ3)を閉じ、ループ端ブロック875に制御を渡す。
本発明の多くの付随する利点/特徴の幾つかに関する記載がなされており、その一部は上述されている。例えば、一つの利点/特徴は、装置が、少なくとも一つの大きなブロックにつき、イントラ予測を信号伝達することにより、ピクチャ内の少なくとも一つのブロックについてのピクチャデータを符号化するビデオエンコーダを有しているという点である。イントラ予測は、基本的符号化単位サイズを選択し、基本的符号化単位サイズについての単一の空間イントラ予測タイプを割り当てることにより信号伝達される。単一の空間イントラ・パーティション・タイプは、複数の空間イントラ・パーティション・タイプから選択可能である。少なくとも一つの大きなブロックは、基本的符号化単位のブロックサイズより大きい大きなブロックサイズを有する。イントラ予測は、階層的なレイヤイントラ予測であり、大きなブロックサイズから基本的符号化単位サイズに分割し、基本的符号化単位サイズから大きなブロックサイズに結合することの少なくとも一つにより、少なくとも一つの大きなブロックにつき実行される。
他の利点/特徴は、装置が上記したビデオエンコーダを有し、複数の空間イントラ・パーティション・タイプの各々については、複数の利用可能なイントラ予測モードのうち最も頻繁に使用される特定のイントラ予測モードに対し、より高い優先度が割り当てられる、という点である。
また他の利点/特徴は、装置が上記したビデオエンコーダを有し、空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つが事前に格納され、ビデオエンコーダにより使用され、少なくとも一つの大きなブロックを符号化する、という点である。空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つは、事前に格納され、対応するビデオデコーダにより使用され、少なくとも一つの大きなブロックを復号化するように構成されている。
更に他の利点/特徴は、装置が上記したビデオエンコーダを有し、空間イントラ・パーティション・タイプテーブルおよびイントラ予測モードテーブルの少なくとも一つがビデオエンコーダにより使用され、少なくとも一つの大きなブロックを符号化し、かつ一つ以上のハイレベル・シンタックス要素を使用して、ビデオエンコーダにより送信される、という点である。
本発明の原理の上記および他の特徴および利点は、本明細書に記載された教示に基づき、関連する技術分野の当業者により容易に確認できる。本発明の原理の教示は、様々な形態のハードウェア、ソフトウェア、ファームウェア、専用プロセッサまたはこれらの組合せにより実施できる。
最も好ましくは、本発明の原理の教示は、ハードウェアおよびソフトウェアの組合せとして実施される。さらにソフトウェアは、プログラム記憶装置上で実体的に具現化されるアプリケーションプログラムとして実施されてもよい。アプリケーションプログラムは、何らかの適切なアーキテクチャを有するマシンにアップロードされ、そのマシンによって実行されてもよい。好ましくは、マシンは1つ以上の中央処理装置(CPU)、ランダムアクセスメモリ(RAM)、および入力/出力(I/O)インターフェース等のハードウェアを有するコンピュータ・プラットフォーム上で実施される。コンピュータ・プラットフォームには、オペレーティングシステムおよびマイクロインストラクションコードを含んでいてもよい。本明細書に記載される種々の処理および機能は、マイクロインストラクションコードの一部、アプリケーションプログラムの一部、またはそのいずれの組合せであってもよく、CPUにより実行されるものであってもよい。また他の種々の周辺装置は、補助データ記憶装置および印刷装置等のコンピュータ・プラットフォームに接続されていてもよい。
添付図面に記載された構成システム要素および方法の一部は、ソフトウェアによって好適に実施されるため、システム構成要素間又はプロセス機能ブロック間の実際の接続は、本発明の原理がプログラミングされる態様によって異なる場合があることが理解されるべきである。本明細書に記載された教示を前提とすると、当業者は、本発明の原理のこれらおよび類似の実装または構造を予測することができるであろう。
例示的実施形態が添付の図面を参照して本明細書中で記載されてきたが、当然に、本発明の原理はこれらの厳密な実施形態に限られず、様々な変更及び改変が、本発明の原理の範囲及び趣旨から逸脱することなく、当該実施形態において当業者によって行われ得る。全てのこのような変更及び改変は、添付の特許請求の範囲に記載されている本発明の原理の範囲内に包含されることが意図される。