特表2022-529645 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ テンセント・アメリカ・エルエルシーの特許一覧

特表2022-529645デコーダ側イントラモード導出と適応イントラ予測モードとの間の相互作用のための方法及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6A
6B
6C
6D
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-06-23

(54)【発明の名称】デコーダ側イントラモード導出と適応イントラ予測モードとの間の相互作用のための方法及び装置

(51)【国際特許分類】

H04N 19/11 20140101AFI20220616BHJP

H04N 19/136 20140101ALI20220616BHJP

H04N 19/176 20140101ALI20220616BHJP

H04N 19/463 20140101ALI20220616BHJP

【ＦＩ】

H04N19/11

H04N19/136

H04N19/176

H04N19/463

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2021561659

(86)(22)【出願日】2021-02-03

(85)【翻訳文提出日】2021-10-15

(86)【国際出願番号】 US2021016343

(87)【国際公開番号】W WO2021158615

(87)【国際公開日】2021-08-12

(31)【優先権主張番号】62/970,505

(32)【優先日】2020-02-05

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/094,923

(32)【優先日】2020-11-11

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】520353802

【氏名又は名称】テンセント・アメリカ・エルエルシー

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】ジャオ，リアン

(72)【発明者】

【氏名】ジャオ，シン

(72)【発明者】

【氏名】リィウ，シャン

【テーマコード（参考）】

5C159

【Ｆターム（参考）】

5C159RC12

5C159RC38

5C159TA32

5C159TA33

5C159TB08

5C159TC02

5C159TC42

(57)【要約】

ビデオシーケンスの画像の現在のブロックのイントラ予測を実行する方法は、現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定するステップと、現在のブロックに対応するイントラ予測モードが指向性モードであることを示すと第１のフラグが決定されていることに基づいて、許可されたイントラ予測モード（ＡＩＰＭ）リストにおけるイントラ予測モードのインデックスを決定するステップと、ＡＩＰＭリストにおける決定されたインデックスに対応するイントラ予測モードを使用して、現在のブロックのイントラ予測を実行するステップを含む。

【特許請求の範囲】

【請求項1】

ビデオシーケンスの画像の現在のブロックのイントラ予測を実行する方法であって、前記方法は、少なくとも１つのプロセッサによって実行され、前記方法は：
前記現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定するステップと；
前記現在のブロックに対応するイントラ予測モードが前記指向性モードであることを示すと前記第１のフラグが決定されていることに基づいて：
許可されたイントラ予測モード（ＡＩＰＭ）リストにおける前記イントラ予測モードのインデックスを決定するステップと；
前記ＡＩＰＭリストの決定された前記インデックスに対応する前記イントラ予測モードを使用して、前記現在のブロックの前記イントラ予測を実行するステップと；を含む、
方法。

【請求項2】

前記現在のブロックに対応する前記イントラ予測モードが前記指向性モードであることを示すと前記第１のフラグが決定されていることに基づいて、前記イントラ予測モードがデコーダ側イントラモード導出（ＤＩＭＤ）モードであることを第２のフラグが示しているかどうかを決定するステップと；
前記イントラ予測モードが前記ＤＩＭＤモードであることを示していないと前記第２のフラグが決定されていることに基づいて：
前記ＡＩＰＭリストにおける前記イントラ予測モードの前記インデックスを決定するステップ；及び
前記ＡＩＰＭリストの決定された前記インデックスに対応する前記イントラ予測モードを使用して、前記現在のブロックの前記イントラ予測を実行するステップと；
前記イントラ予測モードが前記ＤＩＭＤモードにあることを示すと前記第２のフラグが決定されていることに基づいて：
前記イントラ予測モードを決定するようにＤＩＭＤを実行するステップ；及び
決定された前記イントラ予測モードを使用して、前記現在のブロックの前記イントラ予測を実行するステップと；
をさらに含む、
請求項１に記載の方法。

【請求項3】

デコーダ側のイントラモード導出（ＤＩＭＤ）を実行することによって決定されたイントラ予測モードを、最初に、前記ＡＩＰＭリストの第１のレベルに挿入するステップをさらに含む、
請求項１又は２に記載の方法。

【請求項4】

前記ＤＩＭＤを実行することによって決定された前記イントラ予測モードを使用して、前記現在のブロックのクロマ成分のイントラ予測を実行するステップをさらに含む、
請求項２又は３に記載の方法。

【請求項5】

前記現在のブロックに対応する前記イントラ予測モードが前記指向性モードであることを示さないと前記第１のフラグが決定されていることに基づいて：
前記イントラ予測モードを無指向性モードの１つに決定するステップと；
決定された前記イントラ予測モードを使用して、前記現在のブロックの前記イントラ予測を実行するステップと；
をさらに含む、
請求項１乃至４のいずれか１項に記載の方法。

【請求項6】

前記ＡＩＰＭリストにおける少なくとも１つのイントラ予測モードを使用して、前記現在のブロックのルマ成分のイントラ予測を実行するステップをさらに含む、
請求項１乃至５のいずれか１項に記載の方法。

【請求項7】

前記ＡＩＰＭリストは、指向性モードのみを含み、
前記ＡＩＰＭリストに含まれる前記指向性モードの数は、２の累乗又は２の累乗の和に等しい、
請求項１乃至６のいずれか１項に記載の方法。

【請求項8】

ビデオシーケンスの画像の現在のブロックのイントラ予測を実行するための装置であって、前記装置は：
コンピュータプログラムコードを記憶するように構成された少なくとも１つのメモリと；
前記少なくとも１つのメモリにアクセスし、前記コンピュータプログラムコードに従って動作するように構成される少なくとも１つのプロセッサと；を含み、
前記コンピュータプログラムコードは、前記少なくとも１つのプロセッサに、請求項１乃至７のいずれか１項に記載の方法を実行させる、
装置。

【請求項9】

コンピュータプログラムであって、少なくとも１つのプロセッサに、請求項１乃至７のいずれか１項に記載の方法を実行させる、コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

［関連出願の相互参照］
本出願は、2020年2月5日に出願された米国仮特許出願第６2/970,505号、及び2020年11月11日に米国特許商標庁に出願された米国特許出願第17/094,923号からの優先権を主張し、それらの全体は参照により本明細書に組み込まれる。

【0002】

実施形態と一致する方法及び装置は、ビデオコーディング（video coding）に関し、より詳細には、デコーダ側イントラモード導出と適応イントラ予測モードとの間の相互作用のための方法及び装置に関する。

【背景技術】

【0003】

ビデオコーディングフォーマットVP9は、45度から207度までの角度に対応する８つの指向性モード（directional modes）をサポートしている。指向性テクスチャのより多様な空間冗長性を利用するために、ビデオコーディングフォーマットAOMedia Video 1（AV1）では、指向性イントラモードがより細かな粒度で設定された角度に拡張されている。元の８つの角度は、わずかに変更されるとともに公称角度として作成され、これらの８つの公称角度は、図１に示すように、V_PRED、H_PRED、D45_PRED、D135_PRED、D113_PRED、D157_PRED、D203_PRED、及びD67_PREDと命名される。各公称角度に対して、AV1は７つのより細い角度を有するため、AV1は合計５６の方向角度を有する。予測角度は、公称イントラ角度に角度デルタを加えたものによって表され、この角度デルタは、３度のステップサイズの－３～３倍である。一般的な方法を介してAV1に指向性予測モードを実装するために、AV1の５６のすべての指向性イントラ予測モードは、各ピクセルを参照サブピクセル位置に投影し、２タップ双線形フィルタによって参照ピクセルを補間する統一された指向性予測器を用いて実装される。

【発明の概要】

【0004】

実施形態によれば、ビデオシーケンスの画像の現在のブロックのイントラ予測を実行する方法は、少なくとも１つのプロセッサによって実行され、現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定するステップと、現在のブロックに対応するイントラ予測モードが指向性モードであることを示すと第１のフラグが決定されていることに基づいて、許可されたイントラ予測モード（ＡＩＰＭ）リストにおけるイントラ予測モードのインデックスを決定するステップと、ＡＩＰＭリストの決定されたインデックスに対応するイントラ予測モードを使用して、現在のブロックのイントラ予測を実行するステップと、を含む。

【0005】

実施形態によれば、ビデオシーケンスの画像の現在のブロックのイントラ予測を実行するための装置は、コンピュータプログラムコードを記憶するように構成される少なくとも１つのメモリと、少なくとも１つのメモリにアクセスし、コンピュータプログラムコードに従って動作するように構成される少なくとも１つのプロセッサと、を含む。コンピュータプログラムコードは、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定させるように構成される第１の決定コードと、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを示すと第１のフラグが決定されていることに基づいて、許可されたイントラ予測モード（ＡＩＰＭ）リストにおけるイントラ予測モードのインデックスを決定させるように構成される第２の決定コードと、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを示すと第１のフラグが決定されていることに基づいて、ＡＩＰＭリストにおける決定されたインデックスに対応するイントラ予測モードを使用して、現在のブロックのイントラ予測を実行させるように構成される第１の実行コードと、を含む。

【0006】

実施形態によれば、非一時的コンピュータ読取可能記憶媒体は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定させ、現在のブロックに対応するイントラ予測モードが指向性モードであることを示すと第１のフラグが決定されていることに基づいて、許可されたイントラ予測モード（ＡＩＰＭ）リスト内のイントラ予測モードのインデックスを決定させ、ＡＩＰＭリストの決定されたインデックスに対応するイントラ予測モードを使用して、現在のブロックのイントラ予測を実行させる命令を記憶する。

【図面の簡単な説明】

【0007】

【図1】ＡＶ１における８つの公称角度の図である。

【0008】

【図2】実施形態による通信システムの簡略ブロック図である。

【0009】

【図3】実施形態による、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置図である。

【0010】

【図4】実施形態によるビデオデコーダの機能ブロック図である。

【0011】

【図5】実施形態によるビデオエンコーダの機能ブロック図である。

【0012】

【図6A】ＰＡＥＴＨモードの上、左、及び左上の位置の図である。

【0013】

【図6B】再帰的イントラフィルタリングモードの図である。

【0014】

【図6C】ピクセルのＴラインを持つ再構成された領域からのテンプレート選択を示す図である。

【0015】

【図6D】２つのグラディエントヒストグラム（ＨｏＧ）モード及び平面モードを荷重平均することによる予測融合を示す図である。

【0016】

【図7】実施形態による、ビデオシーケンスの画像の現在のブロックのイントラ予測を実行する方法を示すフローチャートである。

【0017】

【図8】実施形態による、ビデオシーケンスの画像の現在のブロックのイントラ予測を実行するための装置の簡略ブロック図である。

【0018】

【図9】実施形態を実装するのに適したコンピュータシステムの図である。

【発明を実施するための形態】

【0019】

図２は、実施形態に係る通信システム（２００）の簡略ブロック図である。通信システム（２００）は、ネットワーク（２５０）を介して相互接続された少なくとも２つの端末（２１０～２２０）を含み得る。データの一方向伝送のために、第１の端末（２１０）は、ネットワーク（２５０）を介して他の端末（２２０）に伝送するために、ローカル位置でビデオデータをコード化（符号化）（code）し得る。第２の端末（２２０）は、ネットワーク（２５０）から他の端末のコード化されたビデオデータを受信し、コード化されたデータをデコードし、回復されたビデオデータを表示し得る。一方向データ伝送は、メディア提供アプリケーション等において一般的である。

【0020】

図２は、例えば、ビデオ会議中に発生し得るコード化されたビデオの双方向伝送をサポートするために設けられた第２の端末（２３０、２４０）の対を示す。データの双方向伝送のために、各端末（２３０、２４０）は、ネットワーク（２５０）を介して他の端末に伝送するために、ローカル位置でキャプチャされたビデオデータをコード化し得る。各端末（２３０、２４０）はまた、他の端末によって送信されたコード化されたビデオデータを受信し得、コード化されたデータをデコードし得、回復されたビデオデータをローカルディスプレイ装置に表示し得る。

【0021】

図２では、端末（２１０～２４０）は、サーバ、パーソナルコンピュータ及びスマートフォンとして図示され得るが、実施形態の原理はそれに限定されない。実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤ、及び／又は専用のテレビ会議装置への適用を見出す。ネットワーク（２５０）は、例えば、有線及び／又は無線通信ネットワークを含む、端末（２１０～２４０）間でコード化されたビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク（２５０）は、回線交換及び／又はパケット交換チャネル内のデータを交換し得る。代表的なネットワークは、通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク及び／又はインターネットを含む。本説明の目的のために、ネットワーク（２５０）のアーキテクチャ及びトポロジは、以下に説明しない限り、実施形態の動作には重要ではない場合がある。

【0022】

図３は、実施形態による、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置図である。開示された主題は、例えば、ビデオ会議、デジタルTV、CD、DVD、メモリスティックなどを含むデジタルメディア上の圧縮ビデオの記憶などを含む、他のビデオ対応アプリケーションに同様に適用可能であることができる。

【0023】

ストリーミングシステムは、例えば非圧縮ビデオサンプルストリーム（３０２）を生成するビデオソース（３０１）、例えばデジタルカメラを含むことができるキャプチャサブシステム（３１３）を含み得る。このサンプルストリーム（３０２）は、エンコードされたビデオビットストリームと比較するときに高いデータボリュームを強調するための太線として示され、カメラ（３０１）に結合されたエンコーダ（３０３）によって処理されることができる。エンコーダ（３０３）は、以下により詳細に説明されるように、開示された主題の態様を可能にする又は実装するために、ハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができる。エンコードされたビデオビットストリーム（３０４）は、サンプルストリームと比較するときにより低いデータボリュームを強調するために細いラインとして示され、将来の使用のためにストリーミングサーバ（３０５）に記憶されることができる。１つ以上のストリーミングクライアント（３０６、３０８）は、ストリーミングサーバ（３０５）にアクセスして、エンコードされたビデオビットストリーム（３０４）のコピー（３０７、３０９）を取得することができる。クライアント（３０６）は、ビデオデコーダ（３１０）を含むことができ、このビデオデコーダは、エンコードされたビデオビットストリーム（３０７）の入力コピーをデコードし、ディスプレイ（３１２）又は他のレンダリングデバイス（図示せず）上でレンダリングされることができる出力ビデオサンプルストリーム（３１１）を生成する。いくつかのストリーミングシステムでは、ビデオビットストリーム（３０４、３０７、３０９）は、特定のビデオコーディング／圧縮規格に従ってエンコードされることができる。これらの規格の例は、ITU-T勧告H.265を含む。開発中のものは、VVCとして知られるビデオコーディング規格である。開示された主題は、VVCの文脈で使用され得る。

【0024】

図４は、実施形態によるビデオデコーダ（３１０）の機能ブロック図である。

【0025】

受信器（４１０）は、デコーダ（３１０）によってデコードされることになる１つ以上のコーデックビデオシーケンスを受信し得；同じ又は実施形態において、一度に１つのコード化されたビデオシーケンスを受信し得、各コード化されたビデオシーケンスのデコードは、他のコード化されたビデオシーケンスから独立している。コード化されたビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得るチャネル（４１２）から受信され得る。受信器（４１０）は、エンコードされたビデオデータを、例えば、コード化されたオーディオデータ及び／又は補助的なデータストリームなどの他のデータと共に受信し得、これらのデータは、それらのそれぞれの使用エンティティ（図示せず）に転送され得る。受信器（４１０）は、コード化されたビデオシーケンスを他のデータから分離し得る。ネットワークジッタと闘うために、バッファメモリ（４１５）が、受信器（４１０）とエントロピーデコーダ／パーサ（４２０）（以下「パーサ」）との間に結合され得る。受信器（４１０）が、十分な帯域幅及び可制御性を有するストア／フォワードデバイスから、又は等同期ネットワークからデータを受信している場合、バッファ（４１５）は、必要とされなくてもよく、又は小さくすることができる。インターネットのようなベストエフォート型パケットネットワークでの使用のために、バッファ（４１５）が必要とされ得、比較的大きくすることができ、有利に適応サイズにすることができる。

【0026】

ビデオデコーダ（３１０）は、エントロピーコード化されたビデオシーケンスからシンボル（４２１）を再構成するためのパーサ（４２０）を含み得る。これらのシンボルのカテゴリは、デコーダ（３１０）の動作を管理するために使用される情報と、図４に示されているように、デコーダの不可欠な部分ではないが、デコーダに結合することができるディスプレイ（３１２）のようなレンダリングデバイスを制御するための潜在的な情報とを含む。レンダリングデバイス（複数可）のための制御情報は、補足拡張情報（ＳＥＩメッセージ）又はビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（図示せず）の形式であり得る。パーサ（４２０）は、受信したコード化されたビデオシーケンスを構文解析（parse）/エントロピーデコードし得る。コード化されたビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト感度を伴う又は伴わない算術コーディングなどを含む、当業者によく知られた原理に従うことができる。パーサ（４２０）は、グループに対応する少なくとも１つのパラメータに基づいて、ビデオデコーダ内のピクセルのサブグループのうちの少なくとも１つに対するサブグループパラメータのセットを、コード化されたビデオシーケンスから抽出し得る。サブグループは、画像のグループ（ＧＯＰ）、画像、タイル、スライス、マクロブロック、コーディングユニット（ＣＵ）、ブロック、変換ユニット（ＴＵ）、予測ユニット（ＰＵ）などを含むことができる。エントロピーデコーダ／パーサはまた、変換係数などのコード化されたビデオシーケンス情報から、量子化パラメータ（ＱＰ）値、モーションベクトル等を抽出し得る。

【0027】

パーサ（４２０）は、シンボル（４２１）を生成するために、バッファ（４１５）から受信したビデオシーケンスに対してエントロピーデコーディング／構文解析操作を実行し得る。パーサ（４２０）は、エンコードされたデータを受信し、特定のシンボル（４２１）を選択的にデコードし得る。さらに、パーサ（４２０）は、特定のシンボル（４２１）が、動き補償予測ユニット（４５３）、スケーラ／逆変換ユニット（４５１）、イントラ予測ユニット（４５２）、又はループフィルタユニット（４５４）に提供されるべきかどうかを決定し得る。

【0028】

シンボル（４２１）の再構成は、コード化されたビデオ画像又はその部分（例えば、インター及びイントラ画像、インター及びイントラブロック）のタイプ及び他の要因に応じて、複数の異なるユニットを含むことができる。どのユニットが関与し、どのようにかは、パーサ（４２０）によってコード化されたビデオシーケンスから構文解析されたサブグループ制御情報によって制御することができる。パーサ（４２０）と以下の複数ユニットとの間のこのようなサブグループ制御情報のフローは、明確にするために図示されていない。

【0029】

既に述べた機能ブロックの他に、デコーダ（３１０）は、概念的に、以下に説明するように、いくつかの機能ユニットに分割することができる。商業的制約の下で動作する実用的な実装では、これらのユニットの多くは互いに密接に相互作用し、少なくとも部分的に互いに統合することができる。しかしながら、開示された主題を説明するためには、以下の機能ユニットに概念的に細分化することが適切である。

【0030】

第１のユニットは、スケーラ／逆変換ユニット（４５１）である。スケーラ／逆変換ユニット（４５１）は、パーサ（４２０）からシンボル（複数可）（４２１）として、使用する変換、ブロックサイズ、量子化係数、量子化スケーリング行列などを含む制御情報とともに、量子化された変換係数を受信する。それは、アグリゲータ（４５５）に入力することができるサンプル値を含むブロックを出力できる。

【0031】

場合によっては、スケーラ／逆変換（４５１）の出力サンプルは、イントラコード化ブロック、すなわち、以前に再構成された画像からの予測情報を使用していないが、現在の画像の以前に再構成された部分からの予測情報を使用することができるブロックに関連付けることができる。このような予測情報は、イントラ画像予測ユニット（４５２）によって提供することができる。場合によっては、イントラ画像予測ユニット（４５２）は、現在の（部分的に再構成された）画像（４５６）から取り出された既に再構成された周囲の情報を使用して、再構成中のブロックの同じサイズ及び形状のブロックを生成する。アグリゲータ（４５５）は、場合によっては、サンプル毎に、イントラ予測ユニット（４５２）が生成した予測情報を、スケーラ／逆変換ユニット（４５１）によって提供されるように、出力サンプル情報に追加する。

【0032】

他の場合には、スケーラ／逆変換ユニット（４５１）の出力サンプルは、インターコード化された、潜在的に動き補償ブロックに関係することができる。このような場合、動き補償予測ユニット（４５３）は、予測に使用されるサンプルを取り出すために参照画像メモリ（４５７）にアクセスすることができる。ブロックに関連するシンボル（４２１）に従って取り出されたサンプルを動き補償した後、これらのサンプルは、アグリゲータ（４５５）によって、スケーラ／逆変換ユニットの出力（この場合、残差サンプル又は残差信号と呼ぶ）に加えられて、出力サンプル情報を生成することができる。動き補償ユニットが予測サンプルを取り出す参照画像メモリ形態内のアドレスは、例えばＸ、Ｙ、及び参照画像成分を有することができるシンボル（４２１）の形態で、動き補償ユニットに利用可能なモーションベクトルによって制御することができる。また、動き補償は、サブサンプルの正確なモーションベクトルが使用されているときに参照画像メモリから取り出されるサンプル値の補間、モーションベクトル予測メカニズムなどを含むことができる。

【0033】

アグリゲータ（４５５）の出力サンプルは、ループフィルタユニット（４５４）内の種々のループフィルタリング技術の対象であることができる。ビデオ圧縮技術は、コード化されたビデオビットストリームに含まれるパラメータによって制御され、パーサ（４２０）からのシンボル（４２１）としてループフィルタユニット（４５４）に利用可能にされるが、コード化された画像又はコード化されたビデオシーケンスの前の（デコーディング順で）部分のデコーディング中に得られたメタ情報に応答することができると共に、以前に再構成されループフィルタリングされたサンプル値に応答することもできる、インループフィルタ技術を含むことができる。

【0034】

ループフィルタユニット（４５４）の出力は、レンダリングデバイス（３１２）に出力することができ、また将来のインター画像予測に使用するために参照画像メモリ（４５６）に記憶することができるサンプルストリームであることができる。

【0035】

特定のコード化された画像は、いったん完全に再構成されると、将来の予測のための参照画像として使用することができる。コード化された画像が完全に再構成され、コード化された画像が（例えば、パーサ（４２０）によって）参照画像として識別されると、現在の参照画像（４５６）は、参照画像バッファ（４５７）の一部となることができ、次のコード化された画像の再構成を開始する前に、新しい現在の画像メモリを再割当てすることができる。

【0036】

ビデオデコーダ（３１０）は、IＴＵ－ＴＲｅｃ．Ｈ．２６５のような規格で文書化され得る所定のビデオ圧縮技術に従ってデコーディング動作を実行し得る。コード化されたビデオシーケンスは、ビデオ圧縮技術文書又は規格の中で、特にその中のプロファイル文書の中で規定されているように、ビデオ圧縮技術又は規格の構文に準拠しているという意味で、使用されているビデオ圧縮技術又は規格によって規定された構文に適合し得る。また、準拠のために必要なことは、コード化されたビデオシーケンスの複雑さが、ビデオ圧縮技術又は規格のレベルによって定義される範囲内にあることであり得る。ある場合には、レベルは、最大画像サイズ、最大フレームレート、最大再構成サンプルレート（例えば、毎秒メガサンプルで測定される）、最大参照画像サイズなどを制限する。レベルによって設定された制限は、場合によっては、仮想参照デコーダ（ＨＲＤ）仕様と、コード化されたビデオシーケンスで信号送信されるＨＲＤバッファ管理のためのメタデータとを通してさらに制限することができる。

【0037】

実施形態では、受信器（４１０）は、エンコードされたビデオと共に追加の（冗長な）データを受信し得る。追加のデータは、コード化されたビデオシーケンス（複数可）の一部として含まれ得る。追加のデータは、データを適切にデコードするため、及び／又は元のビデオデータをより正確に再構成するために、ビデオデコーダ（３１０）によって使用され得る。追加のデータは、例えば、時間的、空間的、又は信号対雑音比（ＳＮＲ）強化層、冗長スライス、冗長画像、前方誤り訂正コードなどの形態であることができる。

【0038】

図５は、実施形態によるビデオエンコーダ（３０３）の機能ブロック図である。

【0039】

エンコーダ（３０３）は、エンコーダ（３０３）によってコード化されることになるビデオ画像をキャプチャし得るビデオソース（３０１）（エンコーダの一部ではない）からビデオサンプルを受信し得る。

【0040】

ビデオソース（３０１）は、任意の適切なビット深さ（例えば、8ビット、10ビット、12ビット、...）、任意の色空間（例えば、BT.601 Y CrCB、RGB、...）及び任意の適切なサンプリング構造（例えば、Y CrCb 4:2:0、Y CrCb 4:4:4）であることができるデジタルビデオサンプルストリームの形態で、エンコーダ（３０３）によってコード化されることになるソースビデオシーケンスを提供し得る。メディア供給システムでは、ビデオソース（３０１）は、事前に準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース（３０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、シーケンスで見たときに動きを伝える複数の個々の画像として提供され得る。画像自体は、ピクセルの空間アレイとして構成され得、各ピクセルは、使用中のサンプリング構造、色空間などに応じて、１つ以上のサンプルを含むことができる。当業者は、ピクセルとサンプルとの間の関係を容易に理解することができる。以下の説明は、サンプルに焦点を当てている。

【0041】

実施形態によれば、エンコーダ（３０３）は、ソースビデオシーケンスの画像を、コード化されたビデオシーケンス（５４３）に、リアルタイムで、又はアプリケーションによって要求される任意の他の時間制約の下で、コード化及び圧縮し得る。適切なコーディング速度を実施することは、コントローラ（５５０）の一つの機能である。コントローラは、以下に記載されるように他の機能ユニットを制御し、これらのユニットに機能的に結合される。結合は、明確にするために示されていない。コントローラによって設定されるパラメータは、レート制御関連パラメータ（画像スキップ、量子化器、レート歪み最適化技術のラムダ値、...）、画像サイズ、画像グループ（ＧＯＰ）レイアウト、最大モーションベクトル探索範囲などを含むことができる。当業者は、特定のシステム設計のために最適化されたビデオエンコーダ（３０３）に関連し得るので、コントローラ（５５０）の他の機能を容易に識別することができる。

【0042】

いくつかのビデオエンコーダは、当業者が「コーディングループ」として容易に認識するもので動作する。過度に単純化された説明として、コーディングループは、エンコーダ（５３０）のエンコーディング部分（以下、「ソースコーダ」）（コード化されることになる入力画像と参照画像（複数可）に基づいてシンボルを生成することを担当する）と、（リモート）デコーダがまた生成する（シンボルとコード化されたビデオビットストリームとの間の任意の圧縮が、開示された主題において考慮されたビデオ圧縮技術においてロスレスであるため）サンプルデータを生成するためにシンボルを再構成するエンコーダ（３０３）に埋め込まれた（ローカル）デコーダ（５３３）とからなることができる。その再構成されたサンプルストリームは、参照画像メモリ（５３４）に入力される。シンボルストリームのデコーディングは、デコーダ位置（ローカル又はリモート）に依存しないビット正確な結果（bit-exact results）をもたらすので、参照画像バッファ内容もまた、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分は、デコーダがデコーディング中に予測を使用するときに「見る」のとまったく同じサンプル値を参照画像サンプルとして「見る」。参照画像の同期性のこの基本原理（及び、例えば、チャネルエラーのために同期性を維持することができない場合の結果として生じるドリフト）は、当業者にはよく知られている。

【0043】

「ローカル」デコーダ（５３３）の動作は、「リモート」デコーダ（３１０）と同じであることができ、図４と関連して既に上述した。しかし、図４も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（５４５）及びパーサ（４２０）によるコード化されたビデオシーケンスへのシンボルのエンコーディング/デコーディングがロスレスであることができるので、チャネル（４１２）、受信器（４１０）、バッファ（４１５）及びパーサ（４２０）を含むデコーダ（３１０）のエントロピーデコーディング部分は、ローカルデコーダ（５３３）に完全には実装されなくてもよい。

【0044】

この時点で行うことができる観察は、デコーダ内に存在する構文解析／エントロピーデコーディングを除く任意のデコーダ技術も、対応するエンコーダ内に実質的に同一の機能的形態で存在する必要があることである。エンコーダ技術の記述は、包括的に記述されたデコーダ技術の逆であるため、省略することができる。特定の領域においてのみ、より詳細な説明が必要であり、以下に提供される。

【0045】

その動作の一部として、ソースコーダ（５３０）は、「参照フレーム」として指定されたビデオシーケンスからの１つ以上の以前にコード化されたフレームを参照して入力フレームを予測的にコード化する動き補償予測コーディングを実行し得る。このようにして、コーディングエンジン（５３２）は、入力フレームのピクセルブロックと、入力フレームに対する予測参照（複数可）として選択され得る参照フレーム（複数可）のピクセルブロックとの間の差分をコード化する。

【0046】

ローカルビデオデコーダ（５３３）は、ソースコーダ（５３０）によって生成されたシンボルに基づいて、参照フレームとして指定され得るフレームのコード化されたビデオデータをデコードし得る。コーディングエンジン（５３２）の動作は、有利には、ロッシー（lossy）プロセスであり得る。コード化されたビデオデータがビデオデコーダ（図４には示されていない）でデコードされ得る場合、再構成されたビデオシーケンスは、典型的には、いくつかのエラーを伴うソースビデオシーケンスのレプリカであり得る。ローカルビデオデコーダ（５３３）は、ビデオデコーダによって参照フレーム上で実行され得、再構成された参照フレームを参照画像キャッシュ（５３４）に記憶させ得るデコーディングプロセスを複製する。このようにして、エンコーダ（３０３）は、遠端ビデオデコーダによって得られる再構成された参照フレームとして共通の内容を有する再構成された参照フレームのコピーを、ローカルに記憶し得る（送信エラーがない）。

【0047】

予測器（５３５）は、コーディングエンジン（５３２）のための予測探索を実行し得る。すなわち、コード化されることになる新しいフレームに対して、予測器（５３５）は、新しい画像に対する適切な予測参照として役立ち得る参照画像モーションベクトル、ブロック形状などの特定のメタデータ又はサンプルデータ（候補参照ピクセルブロックとして）について参照画像メモリ（５３４）を検索し得る。予測器（５３５）は、適切な予測参照を見出すために、サンプルのブロックごとのピクセルのブロックベース（sample block-by-pixel block basis）で動作し得る。場合によっては、予測器（５３５）によって得られた検索結果によって決定されるように、入力画像は、参照画像メモリ（５３４）に記憶された複数の参照画像から引き出された予測参照を有し得る。

【0048】

コントローラ（５５０）は、例えば、ビデオデータをエンコードするために使用されるパラメータ及びサブグループパラメータの設定を含む、ビデオコーダ（５３０）のコーディング動作を管理し得る。

【0049】

すべての前述の機能ユニットの出力は、エントロピーコーダ（５４５）におけるエントロピーコーディングの対象となり得る。エントロピーコーダは、例えば、ハフマンコーディング、可変長コーディング、算術コーディングなど、当業者に知られた技術に従ってシンボルをロスレス圧縮することによって、種々の機能ユニットによって生成されるシンボルをコード化されたビデオシーケンスに変換する。

【0050】

送信器（５４０）は、エントロピーコーダ（５４５）によって生成されるようにコード化されたビデオシーケンス（複数可）をバッファに入れて、通信チャネル（５６０）を介した送信の準備をし得、この通信チャネルは、エンコードされたビデオデータを記憶し得る記憶装置へのハードウェア／ソフトウェアリンクであり得る。送信器（５４０）は、ビデオコーダ（５３０）からのコード化されたビデオデータを、送信されることになる他のデータ、例えばコード化されたオーディオデータ及び／又は補助データストリーム（ソースは図示せず）とマージし得る。

【0051】

コントローラ（５５０）は、エンコーダ（３０３）の動作を管理し得る。コーディングの間、コントローラ（５５０）は、各コード化された画像に、特定のコード化された画像タイプを割り当て得、これは、それぞれの画像に適用され得るコーディング技術に影響を及ぼし得る。例えば、画像はしばしば次のフレームタイプの１つとして割り当てられる：

【0052】

イントラ画像（Ｉ画像）は、予測のソースとしてシーケンス内の他のフレームを使用せずに、コード化され得る及びデコードされ得るものであり得る。いくつかのビデオコーデックは、例えば、独立したデコーダリフレッシュ画像を含む、異なるタイプのイントラ画像を許容する。当業者は、Ｉ画像のこれらの変形例、並びにそれらのそれぞれの用途及び特徴を知っている。

【0053】

予測画像（Ｐ画像）は、各ブロックのサンプル値を予測するために、最大で１つのモーションベクトル及び参照インデックスを用いるイントラ予測又はインター予測を用いてコード化され得る及びデコードされ得るものであり得る。

【0054】

双方向予測画像（Ｂ画像）は、各ブロックのサンプル値を予測するために、最大で２つのモーションベクトル及び参照インデックスを用いるイントラ予測又はインター予測を用いてコード化され得る及びデコードされ得るものであり得る。同様に、複数の予測画像は、１つのブロックの再構成のために、２より多い参照画像及び関連するメタデータを使用することができる。

【0055】

ソース画像は、通常、空間的に複数のサンプルブロック（例えば、4×4、8×8、4×8、又は16×16の各サンプルのブロック）に分割され、ブロック毎にコード化される。ブロックは、ブロックのそれぞれの画像に適用されるコーディング割り当てによって決定されるように、他の（既にコード化された）ブロックを参照して予測的にコード化され得る。例えば、Ｉ画像のブロックは、非予測的にコード化され得る、又は、それらは、同じ画像の既にコード化されたブロックを参照して予測的にコード化され得る（空間予測又はイントラ予測）。Ｐ画像のピクセルブロックは、以前にコード化された１つの参照画像を参照して、非予測的に、空間予測を介して又は時間予測を介してコード化され得る。Ｂ画像のブロックは、１つ又は２つの以前にコード化された参照画像を参照して、非予測的に、空間予測を介して又は時間予測を介してコード化され得る。

【0056】

ビデオコーダ（３０３）は、ITU-T Rec H.265又はVersatile Video Coding（VVC） H.266などの所定のビデオコーディング技術又は規格に従ってコーディング動作を実行し得る。その動作において、ビデオコーダ（３０３）は、入力ビデオシーケンスにおける時間的及び空間的冗長性を活用する予測コーディング動作を含む種々の圧縮動作を実行し得る。従って、コード化されたビデオデータは、使用されているビデオコーディング技術又は規格によって指定された構文に適合し得る。

【0057】

実施形態では、送信器（５４０）は、コード化されたビデオと共に追加データを送信し得る。ビデオコーダ（５３０）は、コード化されたビデオシーケンスの一部としてそのようなデータを含み得る。追加データは、時間的、空間的、及び／又はＳＮＲ強調層、冗長画像及びスライスのような他の形式の冗長データ、補足強調情報（ＳＥＩ）メッセージ、視覚的ユーザビリティ情報（ＶＵＩ）パラメータセットフラグメントなどを含み得る。

【0058】

ＡＶ１では、ＤＣ、ＰＡＥＴＨ、ＳＭＯＯＯＴＨ、ＳＭＯＯＴＨ＿Ｖ、ＳＭＯＯＴＨ＿Ｈである５つの無指向性の滑らかなイントラ予測モード（5 non-directional smooth intra prediction modes）がある。ＤＣ予測について、左及び上の隣接するサンプルの平均が、予測されることになるブロックの予測子（predictor）として使用される。ＰＡＥＴＨ予測子について、上、左、及び左上の参照サンプルが最初に取り出され、次に（上＋左－左上）に最も近い値が、予測されることになるピクセルの予測子として設定される。図６Ａは、現在のブロックにおける１ピクセルについての上、左、及び左上のサンプルの位置を示す。ＳＭＯＯＴＨ、ＳＭＯＯＴＨ＿Ｖ、ＳＭＯＯＯＴＨ＿Ｈモードについて、それらは、垂直方向又は水平方向の２次補間、又は両方向の平均を使用してブロックを予測する。

【0059】

エッジ上の参照との減衰する空間相関をキャプチャするために、フィルタイントラモードがルマ（輝度）（luma）ブロック用に設計されている。５つのフィルタイントラモードがＡＶ１について定義されており、各々は４×２パッチのピクセルとそれに隣接する７つの隣接するものとの間の相関を反映する８つの７タップフィルタのセットによって表される。言い換えれば、７タップフィルタについての重み付け係数は位置に依存する。例えば、８×８ブロックを取り上げると、８つの４×２パッチに分割され、これは図６Ｂに示される。これらのパッチは、図６ＢにおいてＢ０、Ｂ１、Ｂ２、Ｂ３、Ｂ４、Ｂ５、Ｂ６、及びＢ７によって示される。各パッチについて、Ｒ０～Ｒ６で示される７つの隣接するものが、現在のパッチのピクセルを予測するために使用される。パッチＢ０について、すべての隣接するものはすでに再構成されている。しかし、他のパッチについて、すべての隣接するものが再構成されるわけではなく、すぐ隣接するものの予測値が参照として使用される。例えば、パッチＢ７のすべての隣接するものは再構成されないので、隣接するもの（すなわち、Ｂ５及びＢ６）の予測サンプルが代わりに使用される。

【0060】

ルマからのクロマ（ＣｆＬ）は、クロマピクセルを同時再構成ルマピクセルの線形関数としてモデル化するクロマ（Chrom）のみのイントラ予測子である。ＣｆＬ予測は以下のように表される：

【0061】

【数1】

【0062】

ここで、Ｌ_ＡＣは、ルマ成分のＡＣ寄与を表し、αは線形モデルのパラメータを表し、ＤＣはクロマ成分のＤＣ寄与を表す。具体的には、再構成されたルマピクセルはクロマ解像度にサブサンプリングされ、次に平均値がＡＣ寄与を形成するように差し引かれる。クロマＡＣ成分をＡＣ寄与から近似するために、いくつかの方法でのようにデコーダにスケーリングパラメータを計算させることを要求する代わりに、ＡＶ１ＣｆＬは、元のクロマピクセルに基づいてパラメータαを決定し、それらをビットストリームで信号送信する。これは、デコーダの複雑さを低減し、より正確な予測をもたらす。クロマ成分のＤＣ寄与に関して、それは、ほとんどのクロマ内容に十分であり、成熟した高速実装を有するイントラＤＣモードを用いて計算される。

【0063】

Versatile Video Coding（VVC）標準のイントラモードコーディングを改善するための提案を行った。例えば、２つのイントラ予測モードセットが各ブロックに対して定義され得、これらは許容されるイントラ予測モードセット（ＡＩＰＭ、適応イントラ予測モードとも呼ばれる）及び禁止されるイントラ予測モード（ＤＩＰＭ）セットとして命名される。ＡＩＰＭは、現在のブロックのイントラ予測に使用できるモードの１つのモードセットとして定義され、ＤＩＰＭは、現在のブロックのイントラ予測のために信号送信できない又は使用できないモードの１つのモードセットとして定義される。各ブロックに対して、これら２つのモードセットのモードは、隣接するブロックのイントラ予測モードに従って導出される。隣接するモードは、ＡＩＰＭセットに含まれるが、ＤＩＰＭセットには含まれない。ＡＩＰＭ及びＤＩＰＭセットに含まれるモードの数は、すべてのブロックに対してあらかじめ定義され、固定される。ＡＩＰＭセットのサイズがＳであり、隣接するモードからの導出されたイントラ予測モードの数がＳより小さい場合、デフォルトモードがＡＩＰＭセットを埋めるために使用される。

【0064】

ＡＩＰＭをＡＶ１に適用する場合、現在のブロックのブロックサイズ及び隣接するブロックの予測モードにもかかわらず、すべての公称角度が常にＡＩＰＭに含まれる。

【0065】

デコーダ側イントラモード導出（ＤＩＭＤ）プロセスでは、事前にエンコード／デコードされたピクセルに基づいてイントラ予測モードが導出され、これはエンコーダ及びデコーダ側で同様に行われる。従って、ＤＩＭＤプロセスでは、イントラ予測モードインデックスの信号送信は回避される。このプロセスは、ＤＩＭＤと呼ばれる新しいコーディングモードを定義する。１つのフラグは、ＤＩＭＤモードが選択されているか否かを示すために、ビットストリームにおいて信号送信される。デコーダ側のイントラモード導出は導出されたイントラモードとも呼ばれ、フラグCONFIG_DERIVED_INTRA_MODEの下の提案で実装されている。

【0066】

ＤＩＭＤプロセスでは、２つの主要なステップが用いられ、これは以下に詳細に記載される。

【0067】

ＤＩＭＤブロックのイントラ予測モード（ＩＰＭ）を暗黙的に導出するために、テクスチャ勾配分析（texture gradient analysis）がエンコーダ側とデコーダ側の両方で実行される。このプロセスは、角度モードの数に対応する６５エントリの空のＨｏＧから始まる。これらのエントリの振幅はテクスチャ勾配分析中に決定される。

【0068】

第１のステップでは、ＤＩＭＤは、図６Ｃの部分（ａ）に示すように、Ｔ＝３の列及び行のテンプレートを、それぞれ、現在のブロックの左及び上からピックする。この領域は、勾配に基づくＩＰＭ導出のための参照として使用される。

【0069】

第２のステップでは、図６Ｃの部分（ｂ）に示すように、水平及び垂直ソーベルフィルタが、テンプレートの中央の線のピクセルを中心にして、すべての３×３ウィンドウ位置に適用される。各ウィンドウ位置で、ソーベルフィルタは、純粋な水平方向及び垂直方向の強度をそれぞれG_hor及びG_verとして計算する。次に、ウィンドウのテクスチャ角度が次のように計算される：

【0070】

【数2】

【0071】

これは、６５の角度ＩＰＭのうちの１つに変換することができる。現在のウィンドウのＩＰＭインデックスがｉｄｘとして導出されると、ＨｏＧ［ｉｄｘ］のエントリの振幅は以下の追加によって更新される：

【0072】

【数3】

【0073】

図６Ｃの部分（ｃ）は、テンプレート内の全てのピクセル位置に上記演算を適用した後に計算されたＨｏＧの例を示す。

【0074】

ＨｏＧの最も高いスパイクに対応する単一のＩＰＭのみが使用される場合、このプロセスは不要である。

【0075】

さもなければ、１より多いＩＰＭがＤＩＭＤプロセスから導出される場合、この予測融合（prediction fusion）プロセスが使用され得る。

【0076】

予測融合は、複数の予測子の加重平均を用いて計算される。図６Ｄは、融合アルゴリズムの一例を示す。このように、ＨｏＧの３つの最も高いスパイクに対応する２つのＩＰＭが、Ｍ１及びＭ２として検出される。第３のＩＰＭは、平面モード（planar mode）として固定されている。これらの３つのＩＰＭによるピクセル予測を適用し、Pred1、Pred2及びPred3を得た後、それらの融合が上記３つの予測子の加重平均によって計算される。一例では、平面モードの重みは２１／６４（～１／３）に固定されている。４３／６４（～２／３）の残りの重みは、ＨｏＧバーの振幅に比例して、２つのＨｏＧＩＰＭ間で共有される（shared）。

【0077】

詳細には、第１の重みω1、第２の重みω2、及び第３の重みω3は、以下のように表され得る：

【0078】

【数4】

【0079】

【数5】

【0080】

【数6】

【0081】

従って、予測子ブロックは、以下のように表され得る：

【0082】

【数7】

【0083】

ＤＩＭＤは、１つ又は複数の角度ＩＰＭを導出するために現在のブロックの隣接するサンプルを使用し、これらの導出されたＩＰＭに短いコードワード（codeword）を割り当てる。ＡＩＰＭは隣接するモードのＩＰＭを使用して選択したＩＰＭリストを導出し、隣接するモードのＩＰＭに短いコードワードを割り当てる。どちらの方法も、現在のブロックのＩＰＭの信号送信（signaling）を最適化するために隣接情報を使用する。しかし、これらの２つの方法を組み合わせる方法についての解決策がない。

【0084】

デコーダ側イントラモード導出と適応イントラ予測モードとの間の相互作用のための方法及び装置の実施形態が、本明細書に記載される。

【0085】

この詳細な説明では、１つのモードが滑らかなモードでない場合、又は所与の予測方向に従って予測サンプルを生成している場合、この１つのモードは、角度モード又は指向性（directional）モードと呼ばれる。ＤＩＭＤは一般的な用語であり、１つのプロセスは、隣接する再構成サンプルを使用してイントラ予測モードを導出する場合、ＤＩＭＤと呼ばれる。

【0086】

実施形態では、各ブロックに対して２つのイントラ予測モードセットがあり、これらはＡＩＰＭセット及びＤＩＰＭセットと命名される。現在のブロックのブロックサイズ及び隣接するブロックの予測モードにもかかわらず、全ての無指向性モードは常にＡＩＰＭセットに含まれる。

【0087】

一実施形態では、ＡＶ１におけるすべての無指向性の滑らかなイントラ予測モードは、隣接するブロックのイントラ予測モードにもかかわらず、ＡＩＰＭセットに常に挿入される。

【0088】

一実施形態では、ＤＣ、ＰＡＥＴＨ、ＳＭＯＯＯＴＨ、ＳＭＯＯＴＨ＿Ｖ、及びＳＭＯＯＯＴＨ＿Ｈモードは、隣接するブロックのイントラ予測モードにもかかわらず、ＡＩＰＭセットに常に最初に含まれる。

【0089】

一実施形態では、ＡＩＰＭセットに含まれるモードは、Ｋレベルに分割することができ、Ｋは、２又は３又は４などの正の整数である。第１のレベルについて、モードの数は、無指向性モードの数に等しい。その他のレベルについて、モードの数は、２^Ｌなどの２の累乗に等しく、Ｌは1より大きい正の整数である。例えば、ＡＩＰＭセット内のモードの数はＳであり得、ＡＩＰＭセットは３つのレベルを有し得る。ＳはＫ＋２^Ｌ＋２^Ｍと等しく、ＡＩＰＭセットのＫ未満であるインデックスを持つモードを第1のレベルモードと呼び、ＡＩＰＭセットのＫ以上であるがＫ＋２^Ｌ未満であるインデックスを持つモードを第２のレベルモードと呼ぶ。一実施形態では、全ての無指向性ＩＰＭは、ＡＩＰＭセットの第１のレベルに配置される。

【0090】

実施形態では、指向性ＩＰＭのみがＡＩＰＭリストに含まれ、ＡＩＰＭのモードの数は、２の累乗又は２の累乗の倍数の和に等しく設定される。

【0091】

一実施形態では、イントラ予測モードの信号送信のために、現在のブロックが指向性モードであるか否かを示すために、１つのフラグが信号送信される。イエスである場合、ＡＩＰＭリストの現在のモードのインデックスを示すために、第２のフラグが信号送信される。さもなければ、第２のフラグは、現在のモードがどの無指向性モードであるかを示すために信号送信される。

【0092】

一実施形態では、イントラ予測モードの信号送信のために、現在のブロックが指向性モードであるか否かを示すために、１つのフラグが信号送信される。現在のブロックが指向性モードである場合、現在のモードがＤＩＭＤモードであるか否かを示すために、第２のフラグが信号送信される。現在のモードがＤＩＭＤモードでない場合、ＡＩＰＭリストの現在のモードのインデックスを示すために第３のフラグが信号送信される。さもなければ、現在のモードがＤＩＭＤモードである場合、第３のフラグは回避され、現在のブロックのＩＰＭがデコーダ側から導出される。さもなければ、現在のモードが指向性ＩＰＭでない場合、現在のモードがどの無指向性モードであるかを示すために第２のフラグが信号送信される。

【0093】

一実施形態では、ＤＩＭＤプロセスから導出されるＩＰＭは、常にＡＩＰＭリストに挿入される。一実施形態では、ＤＩＭＤプロセスから導出されるＩＰＭは、常にＡＩＰＭリストに最初に挿入され、ＡＩＰＭリストの第１のレベルに配置される。

【0094】

実施形態では、ＡＩＰＭスキームはルマ成分のみに適用され、一方、ＤＩＭＤスキームはクロマ成分のみに適用される。

【0095】

図７は、実施形態による、ビデオシーケンスの画像の現在のブロックのイントラ予測を実行する方法（７００）を示すフローチャートである。いくつかの実施では、図７の１つ又は複数のプロセスブロックは、デコーダ（３１０）によって実行され得る。幾つかの実装形態では、図７の１つ又は複数のプロセスブロックは、エンコーダ（３０３）などの、デコーダ（３１０）から離れた、又はデコーダ（３１０）を含む、別のデバイス又はデバイスのグループによって実行され得る。

【0096】

図７を参照すると、第１のブロック（７１０）において、方法（７００）は、現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定することを含む。

【0097】

現在のブロックに対応するイントラ予測モードが指向性モードであることを示す（７１０－イエス）と第１のフラグが決定されていることに基づいて、第２のブロック（７２０）において、方法（７００）は、イントラ予測モードがデコーダ側イントラモード導出（ＤＩＭＤ）モードであることを示すかどうかを決定することを含む。

【0098】

現在のブロックに対応するイントラ予測モードがＤＩＭＤモードであることを示さない（７２０－ノー）と第２のフラグが決定されていることにフラグに基づいて、第３のブロック（７３０）において、方法（７００）は、許可されたイントラ予測モード（ＡＩＰＭ）リストにおいてイントラ予測モードのインデックスを決定することを含み、第４のブロック（７４０）において、方法（７００）は、ＡＩＰＭリストにおいて決定されたイントラ予測モードに対応するイントラ予測モードを用いて、現在のブロックのイントラ予測を実行することを含む。

【0099】

現在のブロックに対応するイントラ予測モードがＤＩＭＤモードであることを示す（７２０－イエス）と第２のフラグが決定されていることに基づいて、第５のブロック（７５０）において、方法（７００）は、イントラ予測モードを決定するためにＤＩＭＤを実行することを含み、第４のブロック（７４０）に続き、そこで方法（７００）は、決定されたイントラ予測モードを使用して、現在のブロックのイントラ予測を実行することを含む。

【0100】

現在のブロックに対応するイントラ予測モードが指向性モードであることを示さない（７１０－ノー）と第１のフラグが決定されていること基づいて、第６のブロック（７６０）において、方法（７００）は、イントラ予測モードを無指向性モードのうちの１つに決定することを含み、第４のブロック（７４０）に続き、そこで方法（７００）は、決定されたイントラ予測モードを用いて、現在のブロックのイントラ予測を実行することを含む。

【0101】

方法（７００）は、ＤＩＭＤを実行することによって決定されたイントラ予測モードを、最初にＡＩＰＭリストの第１のレベルに挿入することをさらに含み得る。

【0102】

方法（７００）は、ＡＩＰＭリストの少なくとも１つのイントラ予測モードを使用して、現在のブロックのルマ成分のイントラ予測を実行することをさらに含み得る。

【0103】

方法（７００）は、ＤＩＭＤを実行することによって決定されたイントラ予測モードを使用して、現在のブロックのクロマ成分のイントラ予測を実行することをさらに含み得る。

【0104】

ＡＩＰＭリストは、指向性モードのみを含み得、ＡＩＰＭリストに含まれる指向性モードの数は、２の累乗又は２の累乗の和に等しく成り得る。

【0105】

図７は、方法（７００）の例示のブロックを示しているが、いくつかの実装では、方法（７００）は、図７に示されたものよりも、追加のブロック、より少ないブロック、異なるブロック、又は異なる配置のブロックを含み得る。追加的に、又は代替的に、方法（７００）のブロックのうちの２つ以上は、並行して実施され得る。

【0106】

図８は、実施形態による、ビデオシーケンスの画像の現在のブロックのイントラ予測を実行するための装置（８００）の簡略化されたブロック図である。

【0107】

図８を参照すると、装置（８００）は、第１の決定コード（８０５）、第２の決定コード（８１０）、第３の決定コード（８１５）、第１の実行コード（８２０）、第２の実行コード（８２５）及び第４の決定コード（８３０）を含む。

【0108】

第１の決定コード（８０５）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを第１のフラグが示すかどうかを決定させるように構成される。

【0109】

第３の決定コード（８１５）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを示すと第１のフラグが決定されていることに基づいて、イントラ予測モードがデコーダ側イントラモード導出（ＤＩＭＤ）モードであることを第２のフラグが示すかどうかを決定させるように構成される。

【0110】

第２の決定コード（８１０）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードがＤＩＭＤモードであることを示さないと第２のフラグが決定されていること基づいて、許可されたイントラ予測モード（ＡＩＰＭ）リストにおいてイントラ予測モードのインデックスを決定させるように構成される。

【0111】

第１の実行コード（８２０）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードがＤＩＭＤモードであることを示さないと第２のフラグが決定されていることに基づいて、ＡＩＰＭリストの決定されたインデックスに対応するイントラ予測モードを使用して、現在のブロックのイントラ予測を実行させるように構成される。

【0112】

第２の実行コード（８２５）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードがＤＩＭＤモードであることを示すと第２のフラグが決定されていることに基づいて、イントラ予測モードを決定するようＤＩＭＤを実行させるように構成される。

【0113】

第１の実行コード（８２０）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードがＤＩＭＤモードであることを示すと第２のフラグが決定されていることに基づいて、決定されたイントラ予測モードを使用して、現在のブロックのイントラ予測を実行させるようにさらに構成される。

【0114】

第４の決定コード（８３０）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを示さないと第１のフラグが決定されていることに基づいて、イントラ予測モードを無指向性モードのうちの１つに決定させるように構成される。

【0115】

第１の実行コード（８２０）は、少なくとも１つのプロセッサに、現在のブロックに対応するイントラ予測モードが指向性モードであることを示さないと第１のフラグが決定されていることに基づいて、決定されたイントラ予測モードを使用して、現在のブロックのイントラ予測を実行させるようにさらに構成される。

【0116】

装置（８００）は、少なくとも１つのプロセッサに、ＤＩＭＤを実行することによって決定されたイントラ予測モードを、最初にＡＩＰＭリストの第１のレベルに挿入させるように構成される挿入コードをさらに含み得る。

【0117】

装置（８００）は、少なくとも１つのプロセッサに、ＡＩＰＭリストの少なくとも１つのイントラ予測モードを使用して、現在のブロックのルマ成分のイントラ予測を実行させるように構成される第３の実行コードをさらに含み得る。

【0118】

第３の実行コードは、少なくとも１つのプロセッサに、ＤＩＭＤを実行することによって決定されたイントラ予測モードを使用して、現在のブロックのクロマ成分のイントラ予測を実行させるようにさらに構成され得る。

【0119】

ＡＩＰＭリストは、指向性モードのみを含み得、ＡＩＰＭリストに含まれる指向性モードの数は、２の累乗又は２の累乗の和に等しくなり得る。

【0120】

図９は、実施形態を実施するのに適したコンピュータシステム（９００）の図である。

【0121】

コンピュータソフトウェアは、コンピュータ中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）などによって、直接的に、又は解釈を通じて、マイクロコード実行などを通して実行することができる命令を含むコードを作成するために、アセンブリ、コンパイル、リンク、又は同様のメカニズムの対象となり得る任意の適切な機械コード又はコンピュータ言語を用いてコード化されることができる。

【0122】

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーミングデバイス、モノのインターネットデバイス等を含む種々のタイプのコンピュータ又はそのコンポーネント上で実行されることができる。

【0123】

コンピュータシステム（９００）について図９に示すコンポーネントは、本質的に例示的なものであり、実施形態を実装するコンピュータソフトウェアの使用範囲又は機能に関する限定を示唆することを意図するものではない。コンポーネントの構成は、コンピュータシステム（９００）の実施形態に例示されているコンポーネントの任意の１つ又は組み合わせに関するいかなる従属性又は要件を有するものとして解釈されてはならない。

【0124】

コンピュータシステム（９００）は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力装置は、例えば、触覚入力（例えば、キーストローク、スワイプ、データグローブの動き）、音声入力（例えば、音声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（図示せず）を通じて、一人又は複数の人間のユーザによる入力に応答し得る。また、ヒューマンインターフェースデバイスは、オーディオ（例えば、スピーチ、音楽、周囲の音声）、画像（例えば、スキャンされた画像、静画カメラから得られる写真画像）、ビデオ（例えば、２次元ビデオ、立体画像を含む３次元ビデオ）のような、人間による意識的入力に必ずしも直接関係しない特定の媒体をキャプチャするために使用することができる。

【0125】

入力ヒューマンインターフェースデバイスは、キーボード（９０１）、マウス（９０２）、トラックパッド（９０３）、タッチスクリーン（９１０）、データグローブ、ジョイスティック（９０５）、マイクロホン（９０６）、スキャナ（９０７）、カメラ（９０８）の１つ以上を含み得る。

【0126】

コンピュータシステム（９００）はまた、特定のヒューマンインターフェース出力デバイスを含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、及びにおい／味を通して、１人又は複数の人間ユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（９１０）、データグローブ、又はジョイスティック（９０５）による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る）、オーディオ出力デバイス（例えば：スピーカ（９０９）、ヘッドフォン（図示せず）など）、視覚出力デバイス（陰極線管（ＣＲＴ）スクリーン、液晶ディスプレイ（ＬＣＤ）スクリーン、プラズマスクリーン、有機発光ダイオード（ＯＬＥＤ）スクリーンを含むスクリーン（９１０）など、各々が触覚フィードバック機能を有していても有していなくてもよく、各々は触覚フィードバック機能を有していても有していなくてもよく－それらのいくつかは、二次元視覚出力又は立体画像出力などの手段を通して三次元出力以上を出力することができるものであり得る；仮想現実メガネ（図示せず）、ホログラフィックディスプレイ及びスモークタンク（図示せず））、及びプリンタ（図示せず）を含み得る。グラフィックスアダプタ（９５０）は、タッチスクリーン（９１０）に画像を生成し出力する。

【0127】

コンピュータシステム（９００）はまた、人間がアクセス可能な記憶装置、及び、CD/DVD又は類似の媒体（９２１）を有するCD/DVD ROM/RW（９２０）を含む光媒体、サムドライブ（９２２）、取り外し可能なハードドライブ又はソリッドステートドライブ（９２３）、テープ及びフロッピー（登録商標）ディスク（図示せず）のようなレガシー磁気媒体、セキュリティドングル（図示せず）のような特殊化されたROM/ASIC/PLDベースのデバイスなどの関連媒体を含むことができる。

【0128】

当業者はまた、現在開示されている主題に関連して使用される用語「コンピュータ可読媒体」が、伝送媒体、搬送波、又は他の一時的な信号を包含しないことを理解すべきである。

【0129】

コンピュータシステム（９００）はまた、１つ又は複数の通信ネットワーク（９５５）へのインターフェース（複数可）を含むことができる。ネットワーク（９５５）は、例えば、無線、有線、光であることができる。ネットワーク（９５５）は、さらに、ローカル、広域、メトロポリタン、車両及び産業、リアルタイム、遅延耐性などであることができる。ネットワーク（９５５）の例は、イーサネット（登録商標）、無線LAN、移動通信のためのグローバルシステム（ＧＳＭ）、第３世代（３Ｇ）、第４世代（４Ｇ）、第５世代（５Ｇ）、ロングタームエボリューション（ＬＥＴ）などを含むセルラーネットワーク、ケーブルテレビ、衛星テレビ、地上波テレビを含むテレビ有線又は無線ワイドエリアデジタルネットワーク、CANバスを含む車両及び産業用などを含む。特定のネットワーク（９５５）は、一般に、特定の汎用データポート又は周辺バス（（９４９））（例えば、コンピュータシステム（９００）のユニバーサルシリアルバス（ＵＳＢ）ポート；他は、一般に、後述するように、システムバスに取り付けることによって、コンピュータシステム９００のコアに組み込まれる（例えば、PCコンピュータシステムへのイーサネットインターフェース又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース（９５４）など）に取り付けられる外部ネットワークインターフェースアダプタを必要とする。これらのネットワーク（９５５）のいずれかを使用して、コンピュータシステム（９００）は、他のエンティティと通信することができる。このような通信は、単指向性、受信のみ（例えば、放送テレビ）、単指向性送信専用（例えば、特定のCANバスデバイスへのCANバス）、又は、例えば、ローカル又はワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの双指向性であることができる。特定のプロトコル及びプロトコルスタックは、上述のように、それらのネットワーク（９５５）及びネットワークインターフェース（９５４）の各々で使用することができる。

【0130】

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶デバイス、及びネットワークインターフェース（９５４）は、コンピュータシステム（９００）のコア（９４０）に取り付けることができる。

【0131】

コア（９４０）は、１つ以上の中央処理ユニット（ＣＰＵ）（９４１）、グラフィックス処理ユニット（ＧＰＵ）（９４２）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）（９４３）の形の特殊なプログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ（９４４）などを含むことができる。これらのデバイスは、読出し専用メモリ（ＲＯＭ）（９４５）、ランダムアクセスメモリ（ＲＡＭ）（９４６）、内部非ユーザアクセス可能ハードドライブ、ソリッドステートドライブ（ＳＳＤ）などの内部大容量記憶装置（９４７）と共に、システムバス（９４８）を介して接続され得る。いくつかのコンピュータシステムでは、システムバス（９４８）は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするために、１つ又は複数の物理プラグの形態でアクセス可能であることができる。周辺装置は、コアのシステムバス（９４８）に直接取り付けることも、周辺バス（９４９）を介して取り付けることもできる。周辺バスのアーキテクチャは、ペリフェラルコンポーネント相互接続（ＰＣＩ）、ＵＳＢなどを含む。

【0132】

ＣＰＵ（９４１）、ＧＰＵ（９４２）、ＦＰＧＡ（９４３）、及びアクセラレータ（９４４）は、組み合わせて、上述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（９４５）又はＲＡＭ（９４６）に記憶することができる。過渡的なデータは、ＲＡＭ（９４６）に記憶することもでき、一方、永久データは、例えば、内部大容量記憶装置（９４７）に記憶することができる。１つ以上のＣＰＵ（９４１）、ＧＰＵ（９４２）、大容量記憶装置（９４７）、ＲＯＭ（９４５）、ＲＡＭ（９４６）などと密接に関連付けることができるキャッシュメモリの使用を通じて、メモリデバイスのいずれかへの高速記憶及び取得を可能にすることができる。

【0133】

コンピュータ読取可能媒体は、種々のコンピュータ実装された動作を実行するためのコンピュータコードをその上に有することができる。媒体及びコンピュータコードは、実施形態の目的のために特別に設計及び構築されたものであることができる、又はそれらは、コンピュータソフトウェア技術に熟練した者に良く知られかつ入手可能な種類のものであることができる。

【0134】

一例として、限定するものではなく、アーキテクチャ（９００）、具体的にはコア（９４０）を有するコンピュータシステムは、１つ以上の有形のコンピュータ可読媒体に具現化されたソフトウェアを実行するプロセッサ（複数可）（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ等を含む）の結果として機能を提供することができる。そのようなコンピュータ読取可能媒体は、コア内部大容量記憶装置（９４７）又はＲＯＭ（９４５）のような非一時的な性質のものであるコア（９４０）の特定の記憶装置と同様に、上述のようなユーザがアクセス可能な大容量記憶装置に関連する媒体であることができる。様々な実施形態を実装するソフトウェアは、そのような装置に記憶され、コア（９４０）によって実行されることができる。コンピュータ読取可能媒体は、特定のニーズに応じて、１つ又は複数のメモリデバイス又はチップを含むことができる。ソフトウェアは、ＲＡＭ（９４６）に記憶されたデータ構造を定義し、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を修正することを含む、本明細書に記載された特定のプロセス又は特定のプロセスの部分を、コア（９４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に実行させることができる。加えて、又は代替的に、コンピュータシステムは、回路（例えば、アクセラレータ（９４４））内に配線された又は他の方法で具現化された論理の結果として機能を提供することができ、これは、本明細書に記載される特定のプロセス又は特定のプロセスの特定の部分を実行するためのソフトウェアの代わりに、又はそれと共に動作することができる。ソフトウェアへの言及は、論理を含み、また、必要に応じて、その逆も可能である。コンピュータ読取可能媒体への参照は、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のための論理を具体化する回路、又は適切な場合にはその両方を含むことができる。実施形態は、ハードウェア及びソフトウェアの任意の適切な組み合わせを包含する。

【0135】

本開示は、いくつかの実施形態を記載してきたが、本開示の範囲内にある変更、置換、及び種々の代替均等物がある。したがって、当業者は、本明細書に明示的に示されていないか又は記載されていないが、本開示の原理を具体化し、したがって、本開示の精神及び範囲内にある多くのシステム及び方法を考え出すことができることが理解されるであろう。

【図1】