(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-09
(45)【発行日】2024-05-17
(54)【発明の名称】四分木二分木のブロック形状適応イントラ予測方向
(51)【国際特許分類】
H04N 19/11 20140101AFI20240510BHJP
H04N 19/136 20140101ALI20240510BHJP
H04N 19/176 20140101ALI20240510BHJP
H04N 19/46 20140101ALI20240510BHJP
【FI】
H04N19/11
H04N19/136
H04N19/176
H04N19/46
(21)【出願番号】P 2020556773
(86)(22)【出願日】2019-05-10
(86)【国際出願番号】 US2019031702
(87)【国際公開番号】W WO2019222042
(87)【国際公開日】2019-11-21
【審査請求日】2022-05-02
(32)【優先日】2018-05-14
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2018-07-16
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2018-08-06
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ルリアネック,ファブリス
(72)【発明者】
【氏名】ラケイプ,ファビアン
(72)【発明者】
【氏名】ラス,ガガン
(72)【発明者】
【氏名】アーバン,ファブリス
【審査官】田部井 和彦
(56)【参考文献】
【文献】国際公開第2018/127624(WO,A1)
【文献】特表2020-503785(JP,A)
【文献】米国特許出願公開第2019/0356909(US,A1)
【文献】Rickard Sjoberg et al.,Description of SDR and HDR video coding technology proposal by Ericsson and Nokia [online],JVET-J0012-v1 (JVET-J0012-v2.zip), [2023年6月2日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/10_San%20Diego/wg11/JVET-J0012-v2.zip>,2018年04月13日,第i-iii頁、第5-7頁
【文献】Vadim Seregin et al.,Block shape dependent intra mode coding [online],JVET-G0159, [2023年6月2日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/7_Torino/wg11/JVET-G0159-v1.zip>,2017年07月16日
【文献】Fabien Racape et al.,CE3-related: Wide-angle intra prediction for non-square blocks [online],JVET-K0500_r2 (JVET-K0500-v5.zip), [2023年6月2日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0500-v5.zip>,2018年07月15日
【文献】Rickard Sjoberg et al.,Description of SDR and HDR video coding technology proposal by Ericsson and Nokia [online],JVET-J0012-v1 (JVET-J0012-v2.zip),インターネット <URL: https://jvet-experts.org/doc_end_user/documents/10_San%20Diego/wg11/JVET-J0012-v2.zip>,2018年04月13日,第i-iii頁、第5-7頁
【文献】Vadim Seregin et al.,Block shape dependent intra mode coding [online],JVET-G0159,インターネット <URL: https://jvet-experts.org/doc_end_user/documents/7_Torino/wg11/JVET-G0159-v1.zip>,2017年07月16日
【文献】Fabien Racape et al.,CE3-related: Wide-angle intra prediction for non-square blocks [online],JVET-K0500_r2 (JVET-K0500-v5.zip),インターネット <URL: https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0500-v5.zip>,2018年07月15日
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/11
H04N 19/136
H04N 19/176
H04N 19/46
(57)【特許請求の範囲】
【請求項1】
長方形ブロックのブロック形状に基づく方向に沿って並ぶ近隣のブロックの少なくとも1つのサンプルに基づいて、前記長方形ブロックに属する映像サンプルを予測することであって、前記長方形ブロックの短い方の辺に沿ってよりも多くの予測方向が前記長方形ブロックの長い方の辺に沿って利用可能である、予測することと、
前記予測された映像サンプルに基づいてイントラ予測を使用して前記長方形ブロックを符号化することであって、レギュラーモードの広角度モードへのマッピングが、前記符号化される長方形ブロックについての予測方向に対応するブロック高さに対するブロック幅の比率に基づいて行われ、固定数の予測インデックスがイントラ予測方向の範囲を示すために用いられ、前記イントラ予測方向の全体数は、固定であり、前記イントラ予測方向の範囲は、前記長方形ブロックの形状に適合され、前記イントラ予測方向の範囲は、正方形ブロックについての予測方向を超え、近隣のブロックの予測モードは、最確モードのリストに追加されるときに、予測方向インデックスを通じて、前記長方形ブロックの予測モードにマッピングされ、レギュラーモード方向とは反対の方向を示すためにフラグが用いられ、前記長方形ブロックの上のサンプルの参照アレイは、2W+1の長さを有し、前記長方形ブロックの左のサンプルの参照アレイは、2H+1の高さを有し、Wは、長方形ブロックの幅であり、Hは、長方形ブロックの高さであり、前記長方形ブロックの長い方の辺についての予測方向は、45度から-135度の範囲の角度にわたる、こと、
を含む、方法。
【請求項2】
映像ブロックを符号化するための装置であって、
メモリと、
プロセッサと
を含む、装置であり、前記プロセッサが、
長方形ブロックのブロック形状に基づく方向に沿って並ぶ近隣のブロックの少なくとも1つのサンプルに基づいて、前記長方形ブロックに属する映像サンプルを予測することであって、前記長方形ブロックの短い方の辺に沿ってよりも多くの予測方向が前記長方形ブロックの長い方の辺に沿って利用可能である、予測することと、
前記予測された映像サンプルに基づいてイントラ予測を使用して前記長方形ブロックを符号化することであって、レギュラーモードの広角度モードへのマッピングが、前記符号化される長方形ブロックについての予測方向に対応するブロック高さに対するブロック幅の比率に基づいて行われ、固定数の予測インデックスがイントラ予測方向の範囲を示すために用いられ、前記イントラ予測方向の全体数は、固定であり、前記イントラ予測方向の範囲は、前記長方形ブロックの形状に適合され、前記イントラ予測方向の範囲は、正方形ブロックについての予測方向を超え、近隣のブロックの予測モードは、最確モードのリストに追加されるときに、予測方向インデックスを通じて、前記長方形ブロックの予測モードにマッピングされ、レギュラーモード方向とは反対の方向を示すためにフラグが用いられ、前記長方形ブロックの上のサンプルの参照アレイは、2W+1の長さを有し、前記長方形ブロックの左のサンプルの参照アレイは、2H+1の高さを有し、Wは、長方形ブロックの幅であり、Hは、長方形ブロックの高さであり、前記長方形ブロックの長い方の辺についての予測方向は、45度から-135度の範囲の角度にわたる、こと、
を行うように構成される、装置。
【請求項3】
長方形ブロックのブロック形状に基づく方向に沿って並ぶ近隣の再構築されたブロックの少なくとも1つのサンプルに基づいて、前記長方形ブロックに属する映像サンプルを予測することであって、前記長方形ブロックの短い方の辺に沿ってよりも多くの予測方向が前記長方形ブロックの長い方の辺に沿って利用可能である、予測することと、
前記予測された映像サンプルに基づいてイントラ予測を使用して前記長方形ブロックを復号することであって、レギュラーモードの広角度モードへのマッピングが、
符号化される長方形ブロックについての予測方向に対応するブロック高さに対するブロック幅の比率に基づいて行われ、固定数の予測インデックスがイントラ予測方向の範囲を示すために用いられ、前記イントラ予測方向の全体数は、固定であり、前記イントラ予測方向の範囲は、前記長方形ブロックの形状に適合され、前記イントラ予測方向の範囲は、正方形ブロックについての予測方向を超え、近隣のブロックの予測モードは、最確モードのリストに追加されるときに、予測方向インデックスを通じて、前記長方形ブロックの予測モードにマッピングされ、レギュラーモード方向とは反対の方向を示すためにフラグが用いられ、前記長方形ブロックの上のサンプルの参照アレイは、2W+1の長さを有し、前記長方形ブロックの左のサンプルの参照アレイは、2H+1の高さを有し、Wは、長方形ブロックの幅であり、Hは、長方形ブロックの高さであり、前記長方形ブロックの長い方の辺についての予測方向は、45度から-135度の範囲の角度にわたる、こと、
を含む、方法。
【請求項4】
映像ブロックを復号するための装置であって、
メモリと、
プロセッサと
を含む、装置であり、前記プロセッサが、
長方形ブロックのブロック形状に基づく方向に沿って並ぶ近隣の再構築されたブロックの少なくとも1つのサンプルに基づいて、前記長方形ブロックに属する映像サンプルを予測することであって、前記長方形ブロックの短い方の辺に沿ってよりも多くの予測方向が前記長方形ブロックの長い方の辺に沿って利用可能である、予測することと、
前記予測された映像サンプルに基づいてイントラ予測を使用して前記長方形ブロックを復号することであって、レギュラーモードの広角度モードへのマッピングが、
符号化される長方形ブロックについての予測方向に対応するブロック高さに対するブロック幅の比率に基づいて行われ、固定数の予測インデックスがイントラ予測方向の範囲を示すために用いられ、前記イントラ予測方向の全体数は、固定であり、前記イントラ予測方向の範囲は、前記長方形ブロックの形状に適合され、前記イントラ予測方向の範囲は、正方形ブロックについての予測方向を超え、近隣のブロックの予測モードは、最確モードのリストに追加されるときに、予測方向インデックスを通じて、前記長方形ブロックの予測モードにマッピングされ、レギュラーモード方向とは反対の方向を示すためにフラグが用いられ、前記長方形ブロックの上のサンプルの参照アレイは、2W+1の長さを有し、前記長方形ブロックの左のサンプルの参照アレイは、2H+1の高さを有し、Wは、長方形ブロックの幅であり、Hは、長方形ブロックの高さであり、前記長方形ブロックの長い方の辺についての予測方向は、45度から-135度の範囲の角度にわたる、こと、
を行うように構成される、装置。
【請求項5】
前記長方形ブロックの長い方のエッジに沿って近隣のブロックのさらなる多くの予測サンプルが存在する、請求項1に記載の方法。
【請求項6】
前記長方形ブロックの前記長い方の辺に沿って方向が追加され、前記長方形ブロックの前記短い方の辺に沿って方向が除去される、請求項1に記載の方法。
【請求項7】
予測モードが、フラグを使用して信号伝達される、請求項1に記載の方法。
【請求項8】
予測モードが、前記
予測モードが最確モードリストに属するかどうかに基づいて異なる方法で信号伝達される、請求項1に記載の方法。
【請求項9】
インデックスが、前記近隣のブロックの予測モードを前記長方形ブロックの予測モードにマッピングするために使用される、請求項1に記載の方法。
【請求項10】
レート歪み最適化が、予測を見出すために実行される、請求項1に記載の方法。
【請求項11】
前記長方形ブロックの前記長い方の辺に沿って予測方向が追加され、前記長方形ブロックの前記短い方の辺に沿って予測方向が除去される、請求項1に記載の方法。
【請求項12】
請求項4に記載の装置と、
(i)信号を受信するように構成されたアンテナであって、前記信号が映像ブロックを含む、アンテナ、(ii)前記映像ブロックを含む周波数の帯域に前記受信信号を制限するように構成されたバンドリミッタ、(iii)出力を表示するように構成されたディスプレイの少なくとも1つと
を含む、デバイス。
【請求項13】
プロセッサを使用してプレイバックするための、請求項1に記載の方法を実行するコンピュータプログラムを含む非一時的なコンピュータ可読媒体。
【請求項14】
命令を含むコンピュータプログラムであって、コンピュータプログラムがコンピュータによって実行されると、前記命令が、請求項1に記載の方法を前記コンピュータに実行させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本態様は、映像圧縮並びに映像符号化及び復号に関する。
【背景技術】
【0002】
発明の背景
HEVC(高効率映像コード化、ISO/IEC23008-2、ITU-T H.265)映像圧縮規格では、映像の連続ピクチャ間に存在する冗長性を利用するために動き補償時間予測が採用される。
【0003】
その達成のため、動きベクトルは、各予測単位(PU)と関連付けられる。各コード化木単位(CTU)は、圧縮領域のコード化木によって表される。これは、CTUの四分木分割であり、各葉は、コード化単位(CU)と呼ばれる。
【0004】
次いで、各CUには、いくつかのイントラ又はインター予測パラメータ(予測情報)が与えられる。その達成のため、各CUは、1つ又は複数の予測単位(PU)に空間的に分割され、各PUには、いくつかの予測情報が割り当てられる。イントラ又はインターコード化モードは、CUレベルで割り当てられる。
【0005】
共同探査モデル(JEM:Joint Exploration Model)として知られている新しい映像圧縮規格に対する共同映像探査チーム(JVET:Joint Video Exploration Team)提案では、高圧縮性能のため、四分木二分木(QTBT)ブロック分割構造を受け入れることが提案されている。二分木(BT)のブロックは、中央で水平又は垂直に分割することによって、2つの等しいサイズのサブブロックに分割することができる。結果的に、ブロックが常に高さと幅が等しい正方形であるQTのブロックとは異なり、BTブロックは、幅と高さが異なる長方形であり得る。HEVCでは、角度イントラ予測方向は、45度から180度の角度にわたる-135度まで定義されており、それらの方向はJEMでも維持され、それにより、ターゲットブロック形状とは無関係に角度方向が定義付けられた。
【発明の概要】
【0006】
発明の概要
先行技術の欠点や不利な点は、本明細書で説明される一般態様によって対処され、それらの一般態様は、符号化及び復号におけるブロック形状適応イントラ予測方向を対象とする。
【0007】
第1の態様によれば、方法が提供される。方法は、長方形ブロックのブロック形状に基づく方向に沿って並ぶ近隣のブロックの少なくとも1つのサンプルに基づいて、長方形ブロックに属する映像サンプルを予測するステップと、予測された映像サンプルに基づいてイントラ予測を使用して長方形ブロックを符号化するステップとを含む。
【0008】
別の態様によれば、第2の方法が提供される。方法は、長方形ブロックのブロック形状に基づく方向に沿って並ぶ近隣の再構築されたブロックの少なくとも1つのサンプルに基づいて、長方形ブロックに属する映像サンプルを予測するステップと、予測された映像サンプルに基づいてイントラ予測を使用して長方形ブロックを復号するステップとを含む。
【0009】
別の態様によれば、装置が提供される。装置は、メモリと、プロセッサとを含む。プロセッサは、前述の方法のいずれかを実行することによって、映像ブロックを符号化するか又はビットストリームを復号するように構成することができる。
【0010】
少なくとも1つの実施形態の別の一般態様によれば、復号の実施形態のいずれかによる装置と、(i)信号を受信するように構成されたアンテナであって、信号が映像ブロックを含む、アンテナ、(ii)映像ブロックを含む周波数の帯域に受信信号を制限するように構成されたバンドリミッタ、(iii)出力を表示するように構成されたディスプレイの少なくとも1つとを含むデバイスが提供される。
【0011】
少なくとも1つの実施形態の別の一般態様によれば、説明される符号化の実施形態又は変形形態のいずれかに従って生成されたデータコンテンツを含む非一時的なコンピュータ可読媒体が提供される。
【0012】
少なくとも1つの実施形態の別の一般態様によれば、説明される符号化の実施形態又は変形形態のいずれかに従って生成された映像データを含む信号が提供される。
【0013】
少なくとも1つの実施形態の別の一般態様によれば、説明される符号化の実施形態又は変形形態のいずれかに従って生成されたデータコンテンツを含むようにビットストリームがフォーマットされる。
【0014】
少なくとも1つの実施形態の別の一般態様によれば、命令を含むコンピュータプログラム製品であって、プログラムがコンピュータによって実行されると、命令が、説明される復号の実施形態又は変形形態のいずれかをコンピュータに実行させる、コンピュータプログラム製品が提供される。
【0015】
一般態様のこれらの及び他の態様、特徴及び利点は、添付の図面と関連付けて読み進めるべきである例示的な実施形態の以下の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0016】
図面の簡単な説明
【
図1】その上及び左の参照アレイを有する正方形ターゲットブロックを示す。
【
図2】それらの上及び左の参照アレイを有する長方形ターゲットブロック(左側は横長のブロック、右側は縦長のブロック)を示す。
【
図3】それらの上及び左の参照アレイを有する長方形ターゲットブロック(左側は横長のブロック、右側は縦長のブロック)を示す。
【
図5】長方形ブロックに対する予測方向の定義を示す。
【
図6】上の参照アレイが2W+1の長さを有し、左の参照アレイが2H+1の長さを有することを示す。
【
図7】同じブロック形状又はアスペクト比を有するブロックが同じ予測方向延いては同じmodeShiftを有することを示す。
【
図8】-135度を超える垂直方向に対する角度パラメータAの導出の例を示す。
【
図9a】異なる方向と関連付けられたdirIndex(dir#として示される)を示す。
【
図10】実施形態1のルマブロックに対するエンコーダ及びデコーダフローグラフを示す。
【
図11】実施形態2のルマブロックに対するエンコーダ及びデコーダフローグラフを示す。
【
図12】本実施形態を適用することができる一般的な符号化の実施形態を示す。
【
図13】本実施形態を適用することができる一般的な復号の実施形態を示す。
【
図14】様々な態様及び例示的な実施形態が実装される例示的な通信チャネルのブロック図を示す。
【
図15】一般的に説明される態様の下での符号化のための方法の一実施形態を示す。
【
図16】一般的に説明される態様の下での復号のための方法の一実施形態を示す。
【
図17】一般的に説明される態様の下での符号化又は復号のための装置の一実施形態を示す。
【発明を実施するための形態】
【0017】
詳細な説明
共同探査モデル(JEM:Joint Exploration Model)として知られている新しい映像圧縮規格に対する共同映像探査チーム(JVET:Joint Video Exploration Team)提案では、高圧縮性能のため、四分木二分木(QTBT)ブロック分割構造を受け入れることが提案されている。二分木(BT)のブロックは、中央で水平又は垂直に分割することによって、2つの等しいサイズのサブブロックに分割することができる。結果的に、ブロックが常に高さと幅が等しい正方形である四分木(QT)のブロックとは異なり、BTブロックは、幅と高さが異なる長方形であり得る。HEVCでは、角度イントラ予測方向は、45度から180度の角度にわたる-135度まで定義されており、それらの方向はJEMでも維持され、それにより、ターゲットブロック形状とは無関係に角度方向が定義付けられた。しかし、コード化木単位(CTU)をCUに分割するアイデアはオブジェクト又はオブジェクトの一部を捕捉することであり、より高い圧縮効率に対して、ブロックの形状はオブジェクトの方向性と関連付けられるため、ブロック形状に従って、定義された予測方向を適応させることは有意義である。この文脈では、説明される一般態様は、長方形ターゲットブロックに対してイントラ予測方向を再定義することを提案する。
【0018】
本明細書で説明される一般態様は、QTBT構造を用いてイントラ予測を改善することによって、従来の映像の圧縮性能を改善することを目的とする。本明細書で説明される一般態様は、CUの形状に従ってイントラ予測方向を適応させることを提案する。CUの形状が正方形である場合は、JEMで既に定義されている方向は変わらないままである。そうでなければ、CUの形状に従って探索方向が修正される。しかし、任意のCUに対する角度方向の総数は変わらないままである。予測方向をブロック形状に適応させる目的は、現在定義されている予測方向(ブロック形状とは無関係な方向)の集合にわたって予測精度を改善することである。
【0019】
その上、ターゲットCUに対する予測方向の総数は変わらないままであるため、MPM(最確モード)集合を使用する予測モードの符号化及び復号は変わらないままである。しかし、異なる形状を有するCUは定義された異なる方向集合を有するため、近隣のブロックの予測モードは、ターゲットブロックの予測モードにマッピングされる。マッピングは、モードの再インデックス付けでしかなく、実際の予測方向は変わらない。
【0020】
HEVC(高効率映像コード化、H.265)では、映像シーケンスのフレームの符号化は、四分木(QT)ブロック分割構造に基づく。フレームは、正方形コード化木単位(CTU)に分割され、CTUはすべて、レート歪み(RD)基準に基づいて、複数のコード化単位(CU)への四分木に基づく分割が行われる。各CUは、イントラ予測される(すなわち、因果関係を示す近隣のCUから空間的に予測される)か又はインター予測される(すなわち、既に復号済みの参照フレームから時間的に予測される)。Iスライスでは、すべてのCUがイントラ予測されるのに対して、P及びBスライスでは、イントラ予測されても、インター予測されてもよい。イントラ予測の場合、HEVCは、35個の予測モードを定義し、1つの平面モード(モード0としてインデックス付けされる)、1つのDCモード(モード1としてインデックス付けされる)及び33個の角度モード(モード2~34としてインデックス付けされる)を含む。角度モードは、時計回りの方向に45度~-135度の範囲を有する予測方向と関連付けられる。HEVCは四分木(QT)ブロック分割構造をサポートするため、すべての予測単位(PU)は、正方形である。従って、45度~-135度の予測角度の定義は、PU(予測単位)形状の視点から正当化される。N×Nの画素サイズのターゲット予測単位の場合、上の参照アレイ及び左の参照アレイは、各々が2N+1個のサンプルサイズであり、そのサイズは、すべてのターゲット画素に対する前述の角度範囲をカバーするために必要とされるものである。PUの高さと幅の長さは等しいものであることを考慮すると、2つの参照アレイの長さが等しいことは道理にかなっている。
【0021】
次世代の映像コード化規格の場合、共同探査モデル(JEM)としてのJVETの試みにより、平面及びとDCモードに加えて、65個の角度イントラ予測モードを使用することが提案される。しかし、予測方向は、同じ角度範囲(すなわち、時計回りの方向に45度~-135度の範囲)にわたって定義される。W×Hの画素サイズのターゲットブロックの場合、上の参照アレイ及び左の参照アレイは、各々が(W+H+1)個の画素サイズであり、そのサイズは、すべてのターゲット画素に対する前述の角度範囲をカバーするために必要とされるものである。JEMにおけるこの角度の定義は、他の任意の特別な理由のためにというよりも、簡単にすることを目的として行われた。しかし、そうすることで、いくつかの非効率性が導入された。
【0022】
JEMでは、より高い圧縮性能のため、四分木構造のみの代わりに、四分木二分木(QTBT)ブロック分割構造を使用することが提案されている。常に正方形であるQTブロックとは異なり、BTブロックは、水平又は垂直二分割により、幅と高さが異なる長方形であり得る。現在のJEMコードでは、長方形ブロックのアスペクト比は、2:1から8:1まで様々であり得る。従って、異なる角度予測モードのアイデアは、異なるオブジェクト方向性を捕捉することであり、CTUをCUに分割するアイデアは、そのような方向性を有するオブジェクト又はオブジェクトの一部を捕捉することである。従って、ターゲットブロックの形状は、ブロックのオブジェクトの方向性に構造的に関連する。ブロックの形状が長方形である場合は、ある予測方向の方が他の予測方向より起こる可能性が高くなり得る。従って、予測方向の定義は、ターゲットブロック形状とは無関係である(JEMに当てはまる)というものであってはならない。
【0023】
正方形ブロックの事例では、構造対称性が存在する。正方形ブロックは、
図1に見られるように、高さと幅の両方に沿って対称であるのみならず、2つの参照アレイに対しても対称的に配置される。
【0024】
図1は、その上及び左の参照アレイを有する正方形ターゲットブロックを示す。ターゲットブロックは、2つの参照アレイに対して対称的に配置される。予測方向は、時計回りの方向に45度~-135度の範囲で定義され、モード2は、45度の角度に相当し、モード66は、-135度の角度に相当する。
【0025】
長方形ブロックの事例では、現在定義されている方向に関してそうはならない。ブロックが横長(すなわち、W>H)である場合、ブロックは、上の参照アレイにさらに近づいて配置され、非対称的である。同様に、ブロックが縦長(すなわち、W<H)である場合、ブロックは、左の参照アレイにさらに近づいて配置され、非対称的である。この非対称性は、
図2に示されている。
【0026】
図2は、それらの上及び左の参照アレイを有する長方形ターゲットブロック(左側は横長のブロック、右側は縦長のブロック)を示す。ターゲットブロックは、2つの参照アレイに対して非対称的に配置される。
【0027】
この非対称性の結果、定義された角度が原因で、いくつかの予測モードに対して、さらに遠くの参照アレイからターゲット画素が予測されるのに対して、さらに近くの参照アレイが除外されることになる。これは、
図3に示されている。
【0028】
図3は、それらの上及び左の参照アレイを有する長方形ターゲットブロック(左側は横長のブロック、右側は縦長のブロック)を示す。左側では、ターゲット画素Aは、水平予測方向において左の参照アレイ上に予測因子サンプルLを有する。上の参照アレイ上のサンプルTの方が近いが、垂直予測方向(TがAに対する予測因子サンプルとなり得る)は、JEMでは認められていない。右の図は、縦長のブロックのターゲット画素に対する類似した事例を示す。
【0029】
ブロックが横長又は縦長になるほど(すなわち、長い方の辺と短い方の辺との比率が高くなるほど)、この非対称性は、より顕著になる。予測の不正確性のため、実際のテスト結果に見られるように、そのような予測モードの可能性は低くなる。
【0030】
現在定義されている方向の非効率性に対する別の議論は、水平方向と垂直方向において予測方向の数が等しいことである。JEMでは、対角線モード(モード34)を除外すると、水平方向と垂直方向の両方に32個のモードがある。正方形のCUの場合、高さと幅は等しく、水平方向と垂直方向の両方に沿って同じ数の予測モードを有することは道理にかなっている。ブロックが、一方が他方より長い長方形である場合、単純に長い方の辺において構造上の方向性の数がより高い可能性があることを理由に、長い方の辺の予測方向の数の方が高いはずである。横長のブロックの場合、垂直モード数と水平モード数との比率は、幅と高さの比率ほどであるはずである。同様に、縦長のブロックの場合、水平モード数と垂直モード数との比率は、高さと幅の比率ほどであるはずである。関連する考慮すべき点は、参照アレイの長さである。正方形のCUの場合、高さと幅は等しく、参照アレイが同じ長さを有することは道理にかなっている。しかし、長方形ブロックの場合、直観的に、高さより幅の方が大きい場合は、上の参照アレイの方が左の参照アレイより多くのサンプルを有するはずである。
【0031】
同様に、幅より高さの方が大きいブロックの場合は、左の参照アレイの方が上の参照アレイより多くのサンプルを有するはずである。この直観は、横長の(縦長の)長方形ブロックが水平(垂直)方向に沿ってより多くのサンプル又は情報を有するという事実に基づく。同様に、縦長の長方形ブロックは、垂直方向に沿ってより多くのサンプル又は情報を有する。従って、45度~-135度の範囲の現在定義されている方向(水平方向と垂直方向において等しい数の予測モード及び等しい長さの参照アレイをもたらす)は、長方形ブロックに対してやや非効率的である。
【0032】
上記の問題を解決し、長方形ブロックの予測効率を高めるため、以下では、様々なブロック形状に対する角度予測モードを定義してインデックスを付けるための組織的な方法が提示される。次いで、次のセクションでは、このモード定義をサポートするための予測モードコード化における提案される変更を提示する。
【0033】
JEMでは、BT(二分木)ターゲットブロックは、それらの幅及び高さの長さに応じて異なる形状を有し得る。ブロック形状に依存するモードを定義するため、以下では、一般的な方法が提示される。この方法では、任意のブロックに対する予測モードの数は、JEMと同じままであるが、予測方向は、異なる形状のブロックに対して異なり得る。それに、正方形ブロックは、等しい高さ及び幅を有する単なる特別な事例であり、この事例では何も変わらない。言い換えれば、正方形ターゲットブロックの場合、予測モード及び関連予測方向は変わらないままである。
【0034】
長方形は、
図4に示されるように、その幅W及び高さHによって定義される。図に示されるように、A、B、C、Dがその4つの頂点を示す場合は、ACはその主対角線であり、BDはその副対角線である。正方形は、W=Hである特別な長方形である。
図4は、長方形ブロックの属性を示す。
【0035】
幅W及び高さHの任意のターゲットブロックに対し、
図5に示されるように、副対角線に沿って、モード2は、頂点Dから頂点Bへ向かう方向と関連付けられ、モード66は、頂点Bから頂点Dへ向かう方向と関連付けられる。対角線モードは、主対角線に沿って、頂点Aから頂点Cへ向かう方向と関連付けられる。モード2から対角線モードまでのすべてのモードは、左モードと呼ばれる。同様に、対角線モードからモード66までのすべてのモード(対角線モードを含む)は、上モードと呼ばれる。左モードは、水平方向と関連付けられる。同様に、上モードは、垂直方向と関連付けられる。水平モード又は純粋な水平モードは、ゼロ度の角度に相当する左モードである。垂直モード又は純粋な垂直モードは、-90度の角度に相当する上モードである。
【0036】
図5は、長方形ブロックに対する予測方向の定義を示す。モード2は、頂点Dから頂点Bへ向かう副対角線に沿ったものである。モード66は、モード2の反対方向に沿ったものである。対角線モードは、頂点Aから頂点Cへ向かう主対角線に沿ったものである。
【0037】
図6は、上の参照アレイが2W+1の長さを有し、左の参照アレイが2H+1の長さを有することを示す。幅W及び高さHは、
図6の白ブロックの寸法である。
【0038】
これらの予測方向をサポートするため、2W+1の長さを有する上の参照及び2H+1の長さを有する左の参照は、
図6に示されるように定義される。正方形ブロックの事例では、図は、
図1のものと同一であり、W=H=Nである。
【0039】
横長のブロックの場合、上の参照の長さは、左の参照アレイの長さより大きいことに留意されたい。従って、左モードと比べて、上モードの数も大きい。同様に、縦長のブロックの場合、その逆が当てはまる。その事例では、左の参照の長さは、上の参照アレイの長さより大きい。
【0040】
その上、ブロックの場所は参照アレイに対して対称である。ターゲットブロックが正方形である場合、完全な対称性が存在し、予測方向及び参照アレイの長さは、
図1のように、JEM定義と正確にマッチする。
【0041】
上記の定義の美点は、ブロック形状との予測方向の適応性である。ここでは、モード2及び66は、45度の角度及び-135度の角度に沿った方向に相当するようには定義されず、むしろ、副対角線に沿った方向に相当するように定義されることに留意されたい。横長のブロックの事例では、45度を含むその近辺のいくつかの方向は除去されるが、-135度の角度を超える真逆の方向では等しい数の方向が追加される。同様に、縦長のブロックの事例では、-135度を含むその近辺のいくつかの方向は除去されるが、45度の角度を超える真逆の方向では等しい数の方向が追加される。45度の角度からのモード2のオフセットを「modeShift」と呼ぶことにし、「modeShift」は、除去されたモードの数(モード2と45度の角度との間)又は言い換えれば追加されたモードの数(-135度の角度とモード66との間)として定義される。横長のブロックは正のmodeShiftを有するのに対して、縦長のブロックは負のmodeShiftを有する。正方形ブロックの場合、modeShiftは0に等しい。
【0042】
ブロックのmodeShiftは、正方形ブロックの開始モードに対するその開始モード(モード2である)のオフセットを表す。明確には、modeShiftは、ブロックの形状の関数である。行うべき重要な観察は、ブロックのmodeShiftがその幅及び高さの絶対値に依存せず、むしろ、それらの比率に依存することである。これは、
図7に示されている。長方形ABCD(幅W1及び高さH1)と長方形EFGH(幅W2及び高さH2)は、同じ予測方向(従って、同じmodeShift)を有する。三角形の類似性を使用することにより、W1/W2=H1/H2であることが分かる。従って、W1/H1=W2/H2である。従って、同じ比率の幅と高さ(又は逆も同様)を有するブロックは、水平方向と垂直方向の両方において同じ予測モードを有する。
【0043】
図7は、同じアスペクト比(幅と高さの比率)を有するブロックが同じ予測方向延いては同じmodeShiftを有することを示す。
【0044】
モード番号(2~66)は、予測方向に対する単なるインデックス又はラベルである。対応する方向は、HEVC及びJEMにおいて、角度パラメータAによって指定される。JEMにおける異なる予測モードに対するAの値は、表1に示されている。
【0045】
45度又は-135度の角度を超えて導入される方向に対する角度パラメータは、反対方向の角度パラメータから容易に導出することができる。
図8を考慮すると、ターゲット画素は、-135度の角度を超える予測方向に沿って垂直方向に予測される。ブロックの幅及び高さをW及びHで示すものとする。ターゲット画素の座標を(x,y)と示し、式中、0≦x<W及び0≦y<Hである。ターゲットサンプルからの上の参照アレイ上の予測因子サンプルの水平変位は、Δxによって与えられる。予測方向が左の参照アレイと交差するように拡張されれば、ターゲットサンプルからの交点の垂直変位は、Δyとして与えられる。
【0046】
図8は、-135度を超える垂直方向に対する角度パラメータAの導出の例である。Δxは、(x,y)のターゲット画素に対する予測因子の水平変位である。予測が反対方向である(水平方向である)とすれば、予測因子は、垂直変位Δyを有することになる。
【0047】
三角形の類似性を使用することにより、
【数1】
が得られる。
【0048】
【0049】
【0050】
JEMで使用されるように、ここでは、計算において、最も近い2つのサンプルの間の距離は(1/32)サンプル解像度を使用すると(1<<5)であるという事実を使用した。これを簡素化することにより、
ΔxΔy=((1+x)(1+y)<<10)
が得られる。
【0051】
予測角度は、Δy=(1+x)Aを有する水平方向とは逆であり、Aは、水平方向に対する角度パラメータの値を示す。上記の方程式に代入すると、
【数2】
が得られる。
【0052】
従って、垂直方向に対する角度パラメータは、
【数3】
として得られ、式中、Aは、反対方向の角度パラメータである。Aは整数値しか有さないため、上記の式は、小数値のA
nをもたらし得る。従って、値を四捨五入して最も近い整数にすると、
【数4】
が得られる。
【0053】
45度の角度を超える水平方向について考慮した場合は、同じ式が得られることになる。
【0054】
その事例では、Aは、反対の垂直方向の角度パラメータを示すことになる。BTブロックの形状に関係なく、ブロックが長方形である場合は、新しく導入される方向は、除去される方向とは真逆である(四捨五入の範囲内)ことに留意されたい。従って、除去される方向のAパラメータは、新しく導入される反対方向のAパラメータを演算するために使用することができる。除去される方向と新しく導入される方向は両方とも、常に正(正の水平方向又は正の垂直方向)である。従って、それらは、正のAパラメータ値を有する。表2は、上記で演算されるようなJEMにおける正のA値及び対応するAnの値をリストする。
【0055】
表2からの値を使用することにより、以下では、異なる横長のブロック形状に対する角度パラメータが得られる。縦長のブロックに対する角度パラメータは、類似した方法で導出することができるが、ここでは示さない。表を指定する前に、留意すべき点が2つある。第1に、上記の表に見られるように、JEMは、離散的な角度方向に対する角度を指定する。従って、開始及び終了方向は、副対角線と正確にはマッチしない可能性がある。同様に、一方向は、対角線方向と正確にはマッチしない可能性がある。この事例では、JEMにおける指定方向を変更することなく、提案される方法は、この目的のために最も近い方向を取り入れる。第2に、JEMでは、BTブロックに対し、大きい方の辺と小さい方の辺との長さの比率は、1、2、4、8の値のみを有し得る。比率が1に等しい際は、それは正方形ブロックであり、この事例では、方向は変わらないままである。従って、以下では、W/H(幅/高さ)が2、4、8のみに等しいモード番号に対するブロックのA値が提示される。W/H値が増加するにつれて、水平方向の数は減少し、垂直方向の数は増加する。従って、W/H=4に対し、W/H=2からの垂直方向を再利用し、W/H=8に対し、W/H=4からの垂直方向を再利用する。これらは、表では太字体で示されている。慣習により、垂直方向に対角線モードが含まれる。JEM又は任意の規格の今後の変更において認められる可能性がある16や32などのより高いW/H比率の場合も同様の手法を取れることに留意されたい。
【0056】
事例1:W/H=2
modeShift=6
水平方向(左モード)の数=20
垂直方向(上モード)の数=2*6+33=45
【0057】
表3では、モード22~27に相当する方向は、JEMで既に定義されており、水平方向であることに留意されたい。ここでは対角線方向はモード22に相当するため、ここではそれらの方向は、垂直方向にグループ分けされている。ブロックの上端に沿った変位の観点から、Aパラメータ値を再計算する必要があった。
【0058】
事例2:W/H=4
modeShift:10
水平方向(左モード)の数=12
垂直方向(上モード)の数=2*4+45=53
【0059】
【0060】
【0061】
表4では、モード14~17に相当する方向は、JEMで既に定義されており、水平方向であることに留意されたい。ここでは対角線方向はモード14に相当するため、ここではそれらの方向は、垂直方向にグループ分けされている。
【0062】
事例3:W/H=8
modeShift:12
水平方向(左モード)の数=8
垂直方向(上モード)の数=2*2+53=57
【0063】
表5では、モード10、11に相当する方向は、JEMで既に定義されており、水平方向であることに留意されたい。ここでは対角線方向はモード10に相当するため、ここではそれらの方向は、垂直方向にグループ分けされている。
【0064】
表に見られるように、モードインデックスは、ブロック形状に関係なく、2~66の間で常に変化する。しかし、異なるブロックの場合、同じモードインデックスは、異なる予測方向に相当し得る。従って、それらを区別するため、ここでは、以下の通り定義されるdirIndexと呼ばれるパラメータを導入することが提案される。
dirIndex=modeIndex+modeShift-2………(1)
【0065】
dirIndexは、1つの予測方向にのみ相当し、その逆も同様である。表6は、異なるターゲットブロック形状に対するdirIndexの範囲をmodeShift値と共に示す。
【0066】
図9aは、方向インデックスで(dir#として)指定された予測方向を示す。180度より大きい角度に広がる合計で89個の想定される予測方向がある。方向の総数は65より大きいが、任意の所定のターゲットブロックの場合、予測のために65個の隣接する方向のみがチェックされる。これらの65個の方向は、線に沿って180度に広がる。垂直又は水平方向においてより多くの又はより少ない数の方向をチェックするため、方向は、ターゲットブロックサイズと適応させる。
【0067】
予測方向のJEM定義では、たった1つの方向対(dir#0とdir#64)しか存在せず、それらの方向は、互いに真逆である。ここでは、真逆の様々な方向対が存在することに留意されたい。
【0068】
【0069】
【0070】
インデックスが0以下又は64以上の任意の方向の場合、反対方向は、想定されるすべての方向の集合に含まれる。しかし、任意の所定のターゲットブロックの場合、モード2とモード66に相当する方向のみが反対方向である。dirIndexが0以下の方向は、45度の角度を超える正の水平方向に相当し、正のA値を有する。同様に、dirIndexが64以上の方向は、-135度の角度を超える正の垂直方向に相当し、正のA値を有する。
【0071】
図9aは、異なる方向と関連付けられたdirIndex(dir#として示される)を示す。正方形ブロックの場合、dirIndexは、45度から-135度までで定義される65個の方向に相当する0から64まで様々である。横長のブロックの場合、形状に応じて、dirIndexは、いくつかの垂直方向に対して64より大きい。同様に、縦長のブロックの場合、形状に応じて、dirIndexは、いくつかの水平方向に対して0より小さい。
【0072】
また、方向の数は、制限することも、上記で提示される数を超えて拡大することもできる。
図9bの33個のHEVC方向の仮定の事例を考慮し、対角線モードに最も近い2つのモードに演算を制限する。この事例では、ブロック幅がその高さより大きい場合は、モード2及びモード3は、水平モードから除去されることになる。それに加えて、モード3及びモード4は、従来のモードを使用するか又は新しく作成されたモード35及びモード36による反転した広角度方向を使用するかを示す追加のフラグを有することになり、新しい垂直モードは、新しい予測方向を説明する。
【0073】
角度パラメータAの上記の定義では、ブロック形状に従って対角線方向が変更されている。しかし、これは、必須要件ではない。対角線モードの変更は、いくつかの負の水平方向を負の垂直方向に変換するだけであり、その逆も同様である。変換により、新しい角度パラメータAnを有する広角度として新しい方向が作られる。角度パラメータAnの導出には四捨五入を伴うため、これらの角度は、変換前のオリジナルの負の方向と関連付けられたオリジナルの角度と同一ではない可能性がある。しかし、それらは非常に近くなる。従って、対角線モードの変更は、本質的には、それほど大きな性能向上にはつながらない。重要なのは、正の方向(横長のブロックの場合は正の垂直方向、縦長のブロックの場合は正の水平方向)における広角度であり、それは、いくつかの既存の正の方向(横長のブロックの場合は正の水平方向、縦長のブロックの場合は正の垂直方向)を置き換えるために追加される。従って、すべての実用的な目的のため、オリジナルの対角線方向は、そのままにしておくことができる。表3、表4及び表5では、この変換により、関与するモードは、垂直側から水平側に移動され、それらのA値は、古いA値に置き換えられる。これは、すべての表において、水平モードの最後の列が29に等しいA値を有し、垂直モードの第1列が-32に等しいA値を有することを意味する。また、対角線モードを変えないでおくことは、横長のブロックの場合は-135度を超えるところにのみ及び縦長のブロックの場合は45度を超えるところにのみ新しい広角度方向を追加するという目標とも一致する。様々なW/H比率の表は、以下の表3-b、表4-b及び表5-bに提示されている。
【0074】
【0075】
【0076】
【0077】
新しい予測方向をサポートするため、参照アレイの長さを調整する必要がある。先に述べたように、提案される予測方法を用いると、上の参照アレイの長さは2*W+1であり、左の参照アレイの長さは2*H+1であり、式中、W及びHは、ターゲットブロックの幅及び高さを示す。しかし、異なるブロック形状に対して定義された方向はブロック形状と正確にはマッチしないため、さらに数個のサンプル分だけ短い方の参照アレイを拡張する必要がある。長い方の参照アレイサイズは、その側での定義された方向をサポートするのに十分である。これは以下で説明される。
【0078】
W>Hの第1の事例を考慮する。表3、表4及び表5を参照すると、モードインデックス2に対応する角度パラメータAは((H*32)/W)+1に等しいことが指摘されている。従って、W/Hが2、4、8に等しい場合は、角度パラメータAは、17、9、5にそれぞれ等しい。所定の値のAに対し、任意の行に沿ったW個のサンプルに対する予測をサポートするための参照アレイの部分は、(A*W+31)>>5に等しい。上記の角度と共に、これをターゲットブロックの最後の行に適用すると、左の参照アレイ上に1+H+((A*W+31)>>5)個の参照サンプルを有する必要がある。従って、左の参照アレイにおいて必要な拡張は、
H_Ext=1+H+((A*W+31)>>5)-(1+2*H)=((A*W+31)>>5)-H
として得られる。
モード2に対応するAの値を代入すると、上記の式は、以下の通り簡素化することができる。
H_Ext=(W+31)>>5
異なるブロックサイズに対するH_Extの値は、以下で得られる。ここでは、JEMで使用されるように、128個の最大ブロックサイズが想定される。また、(W/H)の最大値が8に等しいことも想定される。
【0079】
【0080】
H>Wの場合、上の参照は、さらに数個のサンプル分だけ拡張する必要がある。サンプルの数は、類似した方法で推測することができる。
W_Ext=1+W+((A*H+31)>>5)-(1+2*W)=((A*H+31)>>5)-W
角度パラメータAの対称性のため、Aの値は、ここでは、W>Hの事例のものと同一である。モードインデックス66に対応する角度パラメータは、((W*32)/H+1に等しくなる。この値を使用すると、上記の式は、以下の通り簡素化することができる。
W_Ext=(H+31)>>5
異なるブロックサイズに対するW_Extの値は、以下で得られる。ここでは、JEMで使用されるように、128個の最大ブロックサイズが想定される。また、(H/W)の最大値が8に等しいことも想定される。
【0081】
【0082】
H_Ext及びW_Extの拡張値は、より高い幅と高さの比率又は高さと幅の比率に対して同じ方法で計算することができる。
【0083】
上記の拡張は、短い方の参照アレイにおいて必要な追加のサンプルの最小数である。しかし、実装形態の利点を得るため、最低限必要な参照サンプルにさらなる数を加えて、すべての予測角度をサポートすることが好ましい場合がある。以下では、いくつかの変形形態を提供する。
【0084】
一変形形態では、上又は左の参照アレイのサンプルの数は、2*max(W,H)+1に等しく、W≧Hの場合は、max(W,H)=Wであり、それ以外は、max(W,H)=Hである。
【0085】
別の変形形態では、上の参照アレイのサンプルの数は、W+max(W,H)+1であり、左の参照アレイのサンプルの数は、H+max(W,H)+1に等しい。
【0086】
長い方の参照アレイのサンプルの数は十分条件だが必ずしも必要条件ではない。いくつかの事例では、いかなる予測モードに対しても使用されないいくつかの冗長サンプル長い方の参照アレイがある。従って、長い方の辺の参照サンプルの数を低減することが可能である。別の変形形態では、W>Hの場合は、左の参照上のサンプル数は(2*H+1+d_h)に等しく、上の参照アレイ上のサンプルの数は(2*W+1-d_h)に等しく、パラメータdは、ブロックサイズに依存する。例えば、W=8及びH=4の場合は、d_h=0であり、それ以外は、d_h=H_extである。H>Wの場合は、左の参照上のサンプル数は(2*H+1-d_w)に等しく、上の参照アレイ上のサンプルの数は(2*W+1+d_w)に等しく、パラメータd_wは、ブロックサイズに依存する。例えば、H=8及びW=4の場合は、d_w=0であり、それ以外は、d_w=W_extである。この変形形態は、両方の参照アレイ上のサンプルの総数(左上のサンプルの重複なしで)は約2*W+2*H+1のままであり、それは正方形ターゲットブロックに対する参照サンプルの総数に等しいという利点を有する。
【0087】
ハードウェア又はシステム制約によって広角度の数が特定の最大値に限定される事例では、追加のサンプルの必要数は、モードインデックス2に対応する角度パラメータ(W>Hの場合)又はモードインデックス66に対応する角度パラメータ(H>Wの場合)を使用する上記で与えられる方法と同じ方法で正確に計算することができる。「CE3-related: Wide angle intra prediction for non-square blocks, JVET-K0500, Ljubljana, SI, 10-18 July 2018」では、広角度の最大数は10であり、それは、W/H=4又はH/W=4に相当する。より高い値のW/H(又はH/W)の場合、広角度の最大数は依然として10であり、それらはW/H=4(又はH/W=4)に対するものと全く同じである。この制限により、拡張として短い方の参照辺において必要な追加の参照サンプルの総数は、単に4つのサンプルにとどまらない。例えば、4×32ブロックの場合、追加のサンプルの数は、1の代わりに、5に等しい。同様に、JEMのランダムアクセス構成(W/H=16、32をそれぞれ有する)で認められている4×64及び4×128のサイズのブロック、追加のサンプルの数はそれぞれ、2及び4の代わりに、14及び32である。この事例では、以下の変形形態が提案される。
【0088】
別の変形形態では、参照アレイの長さは、以下の通り計算することができる。
leftRefLength = (H << 1);
topRefLength = (W << 1);
If W > H
leftRefLength += 4 if W/H <= 4;
else
leftRefLength += (W >> 2).
Else if H > W
topRefLength += 4 if H/W <= 4;
else
topRefLength += (H >> 2).
【0089】
別の変形形態では、参照アレイの長さは、サンプルの総数が約1+2*W+2*Hとなるように計算することができる。
leftRefLength = (H << 1);
topRefLength = (W << 1);
If W > H
Ext = 4 if W/H <= 4
= (W >> 2) otherwise.
leftRefLength += Ext
topRefLength -= ((Ext >> 3) << 3).
Else if H > W
Ext = 4 if H/W <= 4
= (H >> 2) otherwise.
topRefLength += Ext;
leftRefLength -= ((Ext >> 3) << 3).
【0090】
上記の変形形態では、最大で64×128又は128×64の想定されるすべてのブロックサイズを考慮するために、4つの画素の拡張が使用されることに留意されたい。システム又はハードウェア制約によって最大ブロックサイズが制限される場合は、1又は2などのより小さい値を使用することができる。以下の変形形態は、短い方の参照辺において必要なサンプルの正確な最小数を使用する。
【0091】
擬似コードにおける演算は整数演算であり、例えば、W/Hは1、2、4、8、16、32…のみ(すなわち、小数ではない)に等しいことに留意されたい。一変形形態では、参照アレイの長さは、以下の通り計算することができる。
leftRefLength = (H << 1);
topRefLength = (W << 1);
If W > H
leftRefLength += (max(9,A) * W + 31) >> 5) - H;
where A = (32 * H)/W + 1.
Else if H > W
topRefLength += (max(9,A) * H + 31) >> 5) - W;
where A = (32 * W)/H + 1
【0092】
上記の変形形態では、長い方の参照アレイの長さは変わっていない。別の変形形態では、参照アレイの長さは、以下の通り計算することができる。
leftRefLength = (H << 1);
topRefLength = (W << 1);
If W > H
Ext = (max(9,A) * W + 31) >> 5) - H,
where A = (32 * H)/W + 1.
leftRefLength += Ext;
topRefLength -= ((Ext >> 1) << 1).
Else if H > W
Ext = (max(9,A) * H + 31) >> 5) - W,
where A = (32 * W)/H + 1.
topRefLength += Ext;
leftRefLength -= ((Ext >> 1) << 1).
【0093】
広角度の最大数が上記のように制限される際は、H_Ext(W>Hの場合)又はW_Ext(H>Wの場合)は、以下の通り簡素化された形式で表現することができる。
If W > H, H_Ext = max(0,((W>>2) - H)) + ((W + 31) >> 5);
Else, if H >W, W_Ext = max(0,((H>>2) - W)) + ((H + 31) >> 5)
それらは、以下のように同等に表現することができる。
If W > H, H_Ext = ((W>>blockShapeRatio) - H) + ((W + 31) >> 5);
else, if H >W, W_Ext = ((H>>blockShapeRatio) - W)) + ((H + 31) >> 5)
where, blockShapeRatio = min(2, abs(log2(W)-log2(H))).
【0094】
これらの簡素化された式を使用することにより、上記で与えられる2つの変形形態は、以下のように同等に表現することができる。一変形形態では、短い方の参照アレイのみが拡張される場合は、
leftRefLength = (H << 1);
topRefLength = (W << 1);
If W > H
leftRefLength += ((W>>blockShapeRatio) - H) + ((W + 31) >> 5
Else if H > W
topRefLength += ((H>>blockShapeRatio) - W)) + ((H + 31) >> 5)
【0095】
他の変形形態では、参照サンプルの総数が約1+2*W+2*Hとなるように、長い方の参照の長さも変更される。
leftRefLength = (H << 1);
topRefLength = (W << 1);
If W > H
Ext = ((W>>blockShapeRatio) - H) + ((W + 31) >> 5)
leftRefLength += Ext;
topRefLength -= ((Ext >> 1) << 1).
Else if H > W
Ext = ((H>>blockShapeRatio) - W)) + ((H + 31) >> 5)
topRefLength += Ext;
leftRefLength -= ((Ext >> 1) << 1).
【0096】
輝度に対する予測モードを符号化するため、最確モード(MPM)の概念がJVETにおいて維持される。因果関係を示す近隣のブロックの予測モード(利用可能であり、イントラ予測される場合)、平面及びDC予測モード並びにいくつかの固定角度モード(垂直真下、水平真横、モード2、モード66、モード34など)を使用することにより、6つのモードのMPM集合が構築される。残りの予測モードは、16個のモードの選択された集合及び45個の残りのモードの集合に分割される。ターゲットブロックの予測モードがMPM集合に属する場合は、予測モードは、メンバーMPMのインデックスで符号化される。ターゲットブロックの予測モードが選択された集合に属する場合は、予測モードは、4ビットで符号化される。そうでなければ、予測モードは、切り捨てバイナリコードで符号化される。
【0097】
長方形BTブロックに対する予測方向の提案される修正は、JEMと同じコード化スキームを維持するが、いくつかの変更を伴う。ターゲットブロックの因果関係を示す近隣のブロックは、異なる形状を有し得る。従って、それらのブロックは、異なる予測方向範囲を有し得る。その上、それらのブロックは、異なる予測方向と関連付けられたとしても、同じ予測モードを有し得る。これにより、MPM集合の構築における問題が生じる。従って、第1のステップでは、近隣のブロックの予測モードが予測方向インデックス(dirIndex)を通じてターゲットブロックの予測モードにマッピングされる。
【0098】
第2に、所定のターゲットブロックの場合、dirIndexは、65個の隣接方向並びに平面及びDCモードしか有することができない。近隣のブロックの予測モードが0(平面)又は1(DC)である場合は、マッピングは行われず、MPM集合への含有に対してモードがチェックされる。モードが1より大きい場合は、モードは、対応する方向インデックスにマッピングされる。方向インデックスがターゲットブロックに対する65個の方向の範囲に属する場合は、ターゲットブロックに対する対応するモード数が、MPM集合への含有に対してチェックされる。そうでなければ、反対方向に対応するモードが、MPM集合への含有に対してチェックされる。方向がターゲットブロックの方向集合に属さない場合は、対応する広角度方向が集合に属さなければならないことに留意されたい。
【0099】
方向へのモードのマッピングは、方程式1を使用して行われる。次いで、方向を考慮して、ターゲットブロックのモードへのマッピングは、以下の方程式を使用して行われる。
modeIndex=dirIndex-modeShift+2………(2)
この場合、ターゲットブロックのmodeShiftが使用される。方程式1からのdirIndexを使用すると、
modeIndexTB=modeIndexNB+modeShiftNB-modeShiftTB………(3)
が得られ、この場合、TB及びNBの添字はそれぞれ、ターゲットブロック及び近隣のブロックを示すために使用される。結果として得られたmodeIndexTBが0より小さいか又は66より大きい場合は、それは、近隣のブロックのモードと関連付けられた方向がターゲットブロックに対する予測方向の集合に属さないことを含意する。この事例では、関連付けられた広角度方向が使用される。modeIndexTB<0の場合は、それに67を加えるか、又は、modeIndexTB>66の場合は、そこから65を減じる。結果として得られたモードは、関連付けられた広角度方向と関連付けられる。
【0100】
上記のマッピングを明確化するための2つの例は、以下に示されている。
【0101】
例1:ターゲットブロックは、W=8及びH=8を有する。その左の近隣のブロックは、W=8及びH=4並びに予測モードm=2を有する。
【0102】
W/H=2であるため、左の近隣のブロックに対するmodeShiftは6である。ターゲットブロックは正方形であり、そのmodeShiftは0である。従って、新しいmodeIndexは、m=2+6-0=8として得られる。
【0103】
例2:ターゲットブロックは、W=4及びH=32を有する。その左の近隣のブロックは、W=16及びH=4並びに予測モードm=8を有する。
【0104】
W/H=16/4=4であるため、左の近隣のブロックに対するmodeShiftは10である。ターゲットブロックの場合は、W/H=4/32=1/8である。そのmodeShiftは-12であり、方向インデックスは-12~52の範囲である。従って、新しいmodeIndexは、m=8+10-(-12)=30として得られる。
【0105】
モード符号化プロセスの残りは変わらないままである。MPM集合の6つのモードは別として、残りのモードは、16個のモードの選択された集合及び45個の残りのモードからなる集合に分割される。
【0106】
ターゲットブロックが正方形であっても、すべてが正方形であるとは限らない近隣のブロックの予測モードを有するMPM集合を構築するためにマッピングが必要であることに留意されたい。
【0107】
MPMの数が変化しても、近隣のブロックの予測モードがターゲットブロックの予測モード集合にマッピングされる限り、採用される予測モード符号化アルゴリズムは変わらないままであることに留意すべきである。
【0108】
クロマCUの場合もまた、少なくとも1つの実施形態は、ルマ及びクロマ成分木が別々である事例(すなわち、Iスライス)において直接モードを得るために、予測モードの同じリマッピングを行う。配列された近隣のルマCUの予測モードは、ターゲットクロマブロックのモードにリマッピングすることができる。
【0109】
イントラモードコード化に対するモードマッピングを避ける代替の方法は、オリジナルのモード及びそれらの関連付けられた方向を維持することである。この方法は、新しい方向に新しいモードインデックスを与えることによって行われ、この新しい方向は、広角度方向(すなわち、-135度又は45度を超える方向)と呼ぶことができる。従って、例えば、モード66を超える広角度方向には、67、68などのモードインデックスが与えられる。同様に、モード2を超える広角度方向には、-1、-2などのモードインデックスが与えられる(モード0及び1は既に平面及びDCモードと関連付けられているため)。これは、先に提供したdirIndexと同様であり、modeShiftを必要としない。この事例では、以下の通り、dirIndexとmodeIndexとの間に1対1のマッピングがある。
dirIndex≧0の場合は、modeIndex=dirIndex+2
dirIndex<0の場合は、modeIndex=dirIndex
【0110】
異なるブロック形状に対するmodeIndexの範囲の値は、表7に示されている。表から分かるように、所定のブロック形状値の場合、modeIndexの最大値は78であり、最小値は-12である。ここでは、ハードウェア又はシステム制約によって最大方向の数が特定の値に限定される場合は、modeIndex値の範囲を相応に決定できることに留意すべきである。例えば、「CE3-related: Wide angle intra prediction for non-square blocks, JVET-K0500, Ljubljana, SI, 10-18 July 2018」で提案されるように、-135度を超えるか又は45度を超える追加方向の数が10に限定される場合は、W/H=8及び1/8の事例に対するdirIndex及びmodeIndexの範囲はそれぞれ、W/H=4及びW/H=1/4のものと同一である。
【0111】
【0112】
dirIndexとmodeIndexは1対1の対応を有するため、ここでは、modeIndexのみを使用して作業することができる。
【0113】
追加される広角度方向は、除去されるいくつかのオリジナルの方向に対応するため、それらのmodeIndex値の間にも1対1の対応が存在する。一般的に言えば、ブロックのオリジナルのmodeIndex及び広角度のmodeIndexをそれぞれorigMode及びwaModeで示すものとする。0(平面モード)及び1(DCモード)のmodeIndex値は角度モードに対応しないため、ここではそれらについて考慮しない。waModeの値は、以下の通り、origMode値から得られる。
If W > H and origMode < 2 + modeShift,
waMode = origMode + 65
Else, if H > W, and origMode > 66 - modeShift,
waMode = origMode - 67
else
waMode = origMode
【0114】
角度パラメータA(JEMコードのintraPredAngle)とmodeShiftは関連するため、上記のマッピングは、以下のように同等に行うことができる。
If W > H and intraPredAngle > ( ( 32 * H / W ) + 1 ) and origMode < 34
waMode = origMode + 65
Else, if H >W and intraPredAngle > ( ( 32 * W / H ) + 1 ) and origMode > 34
waMode = origMode - 67
else
waMode = origMode
【0115】
上記の広角度マッピングは、除去されたすべてのモードが反対方向に近いモードに置き換えられることを確認する。例えば、W/H>1の横長のブロックの場合、モード2は、モード67に置き換えられる。モード67は、モード2の反対方向(モード66である)に最も近い広角度方向である。除去されないそれらのモードは、マッピングの後も同じmodeIndex値のままである。
【0116】
「CE3-related: Wide angle intra prediction for non-square blocks, JVET-K0500, Ljubljana, SI, 10-18 July 2018」のように広角度の数が10に限定される際は、マッピングは、以下の通り得ることができる。
If W > H and origMode < 2 + min(10, modeShift),
waMode = origMode + 65
Else, if H > W and origMode > 66 - min(10, modeShift),
waMode = origMode - 67
else
waMode = origMode
或いはそれと同等に、
If W > H and intraPredAngle > max (9, (( 32 * H / W ) + 1 )) and origMode < 34
waMode = origMode + 65
Else, if H > W, and intraPredAngle > max(9, ( ( 32 * W / H ) + 1 )) and origMode > 34
waMode = origMode - 67
else
waMode = origMode
のように得ることができる。
【0117】
また、これは、以下のように同等に得ることができる。
blockShapeRatio = min(2, abs(log2(W) - log2(H)));
If W > H, and origMode < 2 + ((blockShapeRatio << 2) + 2)
waMode = origMode + 65
else if H > W and origMode < 66 - ((blockShapeRatio << 2) + 2)
waMode = origMode - 67
else
waMode = origMode
【0118】
また、上記のマッピングは、65個のオリジナルの角度モードに対し、上記の広角度マッピングの後に65個の一意の角度モードが存在することも確認する。これは、一意のマッピングのみならず、除去される方向の集合と追加される広角度方向の集合との間において可能な様々な他のマッピングも存在することに留意されたい。しかし、上記のマッピングは、追加される広角度モードが、除去されるモードの反対方向に近くなるようにする。
【0119】
上記の方法は、以前に説明されるように、イントラモードコード化の間に近隣のブロックのモードインデックスのマッピングを避ける上で間接的に役立つ。広角度モードインデックスへのオリジナルのモードインデックスのマッピングは、予測ステップでのみ行われる。エンコーダ側では、予測ステップに続くイントラモードコード化は、広角度モードインデックスの代わりに、オリジナルのモードインデックスを使用する。同様に、デコーダ側では、予測ステップに先行するイントラモード復号は、オリジナルのモードインデックスを使用するが、予測ステップにおいて広角度モードインデックスへのマッピングが行われる。
【0120】
本技法は、幅と高さの比率が[1/8,8]の範囲である長方形ブロック形状について考慮している。しかし、より大きな範囲の幅と高さの比率まで非常に簡単に原理を拡張できることに留意すべきである。表8は、より高い値のブロック形状比率に対するmodeIndex値を含む。この事例では、-135度又は45度を超える14個の広角度方向がある。ここでは、追加される広角度方向の数はさらに増加し、それは、より大きな谷のW/H又は(H/W)に相当する。しかし、先に提供したようなorigModeからwaModeへのマッピングは依然として当てはまる。
【0121】
【0122】
提案される方向定義に基づいて、想定される実装形態のオプションとしていくつかの実施形態が提示される。これらは、例えば、JEMで実装することができる。
【0123】
実施形態1と呼ばれる第1の例示的な実施形態では、ターゲットブロックに対する角度予測方向が広角度方向を含むように修正される。ターゲットブロックが正方形である場合は、予測方向に変更はない。所定の予測モードの場合、エンコーダ及びデコーダは、既存の方法で予測を実行する。他方では、ターゲットブロックが長方形である場合は、先に提供したように、最初に、ターゲットブロック形状に対応するmodeShift値を使用して、角度予測モードが広角度モードにマッピングされる。エンコーダ及びデコーダは、広角度モードに対応する方向に沿って予測を実行する。広角度モードへのマッピングは、予測段階でのみ起こる。エンコーダ側のイントラモードコード化及びデコーダ側のイントラモード復号は変わらないままである。エンコーダは、RD(レート歪み)最適化を用いて最良の予測モード探索を通常の方法で実行し、オリジナルのモードインデックスからなるMPM集合を使用してオリジナルのモードインデックス値を符号化する。同様に、デコーダは、オリジナルのモードインデックスからなるMPM集合を使用してオリジナルのモードインデックス値を復号する。
【0124】
実施形態2と呼ばれる第2の例示的な実施形態では、ターゲットブロックに対する角度予測方向が先に提示されたように修正される。ターゲットブロックが正方形である場合は、予測方向に変更はない。それ以外は、ターゲットブロックが長方形である場合は、予測モードは、ブロックのアスペクト比に応じて定義された方向と関連付けられる。エンコーダは、モード2~66に対して関連付けられた予測方向がブロック形状に依存すること以外は通常の方法で、RD(レート歪み)最適化を用いて最良の予測モード探索を実行する。
【0125】
ルマターゲットブロックの場合、エンコーダは、以前のセクションで説明されるように、MPM集合を使用して予測モードを符号化し、MPM集合は、近隣のブロックの予測モードのマッピングによって構築される。クロマターゲットブロックの場合、エンコーダは、配列された近隣のルマブロックの予測モードをマッピングすることによって、直接モードを導出する。このマッピングは、ルマ成分とクロマ成分が同じコード化木構造を有するインターコード化スライスのブロックには不要である。
【0126】
デコーダは、ルマターゲットブロックの場合は、MPM集合を用いて予測モードを復号し、MPM集合は、エンコーダが実行する方法と同じ方法で構築される。クロマターゲットブロックの場合は、デコーダは、配列された近隣のルマブロックの予測モードをマッピングした後に、エンコーダが実行する方法と全く同じ方法で直接モードを導出する。デコーダは、モード2~66に対して関連付けられた予測方向がブロック形状に依存すること以外は通常の方法で、ターゲットブロックに対する予測を構築する。
【0127】
図10は、実施形態1のルマブロックに対するエンコーダ及びデコーダフロー図を示す。
【0128】
実施形態3では、予測方向に関する限り、実施形態2が拡大される。いかなるターゲットブロックに対しても、予測方向は、JEMで定義された方向の集合(すなわち、時計回りの方向に45度~-135度の65個の方向)と、ターゲットブロック形状に依存するこの提案において定義された方向の集合との和集合として定義される。任意のターゲットブロックに対する定義された方向の集合は、JEM方向の部分集合と、いくつかの新しく導入される方向の部分集合からなるため、2つの集合の和集合は、65個のJEM方向の集合にブロック形状に依存する新しく導入される方向の集合を加えたものからなる。新しく導入される方向は、JEM方向集合の正の方向のいくつか(提案において除去されているもの)の反対である。これらの反対方向の対を区別するため、modeFlagと呼ばれる1ビットのフラグが使用され、その数は、ブロック形状に応じて異なる。JEM方向が含まれるため、この実施形態は、JEMと同じモードインデックスを保持する。すなわち、モード2は45度の角度に相当し、モード66は-135度の角度に相当する。また、反対方向も有するモード(モード2及びモード66を除く)は、0に等しいそれらのmodeFlag値を有する。反対方向は、同じモード番号を使用するが、modeFlag値は1に等しくなる。すなわち、反対方向の対は、同じモード番号と関連付けられるが、0及び1のそれぞれに等しいmodeFlagと関連付けられる。
【0129】
予測モード符号化はJEMと同じままである。しかし、反対方向を有するモード(モード2及びモード66を除く)の場合は、modeFlagは、固定された、モードに依存する又は近隣のブロックに依存するコンテキストで符号化される。
【0130】
方向の集合は拡大された集合であるため、上及び左の参照アレイの長さも変化することに留意されたい。上の参照アレイの長さは、H+W+1又は2W+1のいずれか大きい方である。同様に、左の参照アレイの長さは、H+W+1又は2H+1のいずれか大きい方である。これは、横長のブロックの場合、上の参照アレイが2W+1個のサンプルを有し、左の参照アレイがH+W+1個のサンプルを有することを意味する。同様に、縦長のブロックの場合、上の参照アレイはH+W+1個のサンプルを有し、左の参照アレイは2H+1個のサンプルを有する。ブロックが正方形である場合は、上の参照アレイと左の参照アレイは両方とも、JEMと同様に、H+W+1(=2H+1=2W+1(W=Hであるため))個のサンプルを有する。
【0131】
デコーダ側では、通常のMPMに基づく方法を使用して予測モードが復号される。モードが反対方向を有する方向の集合に属する場合は、modeFlag値もまた復号される。予測モードが平面又はDCである場合は、デコーダは、JEMと同様に、予測を演算する。それ以外は、modeFlagが復号されていない場合、又は、復号済みであり、その値がゼロである場合は、デコーダは、JEMと同様に、対応する方向における予測を構築する。それ以外は、デコーダは、新しい角度パラメータAを用いて、復号済みのモードと関連付けられたものとは反対の方向における予測を構築する。
【0132】
クロマターゲットブロックの場合、直接モードは、対応するルマブロックに対するmodeFlag値(モードが反対方向を有する場合)に関係なく、JEMと同じ方法で演算される。ターゲットブロックのアスペクト比に応じて、任意の直接モードが反対方向を有する場合は、エンコーダは、最良の予測モードを探索しながら、その探索の中に反対方向も含める。そのようなモードが最良のモードであると最終的に決定された場合は、最良の方向に応じて、1ビットのmodeFlagが符号化される。デコーダ側では、直接モードの導出、予測モードの復号及びmodeFlag(モードが反対方向を有する事例)は、エンコーダと全く同じである。
【0133】
ルマブロックに対するエンコーダ及びデコーダフローグラフは、
図11に示されている。
【0134】
実施形態4と呼ばれる第4の例示的な実施形態では、実施形態1~3において説明される変更は、関連参照サンプルが利用可能な際にのみ適用される。例えば、横長のブロックの事例では、この発明は、-135°の後に方向を拡張する。しかし、現在のブロック形状とは無関係に、右上の近隣のブロックは利用可能ではない場合がある。その事例では、ターゲットブロックは、JEMと同様に(すなわち、時計回りの方向に45度~-135度に広がる65個の角度方向を使用して)予測される。エンコーダとデコーダは両方とも、再構築された近隣のブロックの存在を容易に検出することができるため、対応する方法で、拡張方向を適用するかどうかを決定する。
【0135】
実施形態5である第5の実施形態では、実施形態1から実施形態4までと同様に、1つのスライスのすべてのターゲットブロックが予測され、スライスヘッダにおいて1ビットフラグを使用してデコーダに信号伝達される。
【0136】
実施形態6である第6の実施形態では、実施形態1から実施形態4までと同様に、1つのフレームのすべてのターゲットブロックが予測され、ピクチャパラメータ集合(PPS)ヘッダにおいて1ビットフラグを使用してデコーダに信号伝達される。
【0137】
実施形態7である第7の実施形態では、実施形態1から実施形態4までと同様に、1つのシーケンスの任意のフレームのすべてのターゲットブロックが予測され、シーケンスパラメータ集合(SPS)ヘッダにおいて1ビットフラグを使用してデコーダに信号伝達される。
【0138】
提案される実施形態の利点の1つは、提案される実施形態が長方形ブロックに対する予測方向をブロック形状に適応させることである。目的の1つは、複雑性を増すことなく、圧縮性能を改善することである。
【0139】
図15は、エンコーダにおける適応ブロックサイズでのイントラ予測のための方法1500の一実施形態を示す。方法は、開始ブロック1501から始まり、制御はブロック1510に進み、長方形ブロックのアスペクト比に基づく方向に沿って並ぶ近隣のブロックの少なくとも1つのサンプルに基づいて、長方形ブロックに属する映像サンプルを予測する。制御は、ブロック1510からブロック1520に進み、予測された映像サンプルに基づいてイントラ予測を使用して長方形ブロックを符号化する。
【0140】
図16は、エンコーダにおける適応ブロックサイズでのイントラ予測のための方法1600の一実施形態を示す。方法は、開始ブロック1601から始まり、制御はブロック1610に進み、長方形ブロックのアスペクト比に基づく方向に沿って並ぶ近隣の再構築されたブロックの少なくとも1つのサンプルに基づいて、長方形ブロックに属する映像サンプルを予測する。制御は、ブロック1610からブロック1620に進み、予測された映像サンプルに基づいてイントラ予測を使用して長方形ブロックを復号する。
【0141】
図17は、適応ブロックサイズでのイントラ予測を使用して映像ブロックを符号化又は復号するための装置1700の一実施形態を示す。装置は、プロセッサ1710を含み、プロセッサ1710は、1つ又は複数の入力及び出力ポートを有し、1つ又は複数の通信ポートを通じてメモリ1720に相互接続される。装置1700は、
図15若しくは
図16の方法又は任意の変形形態の実行が可能である。
【0142】
この文書は、ツール、特徴、実施形態、モデル、手法などを含む、様々な態様について説明する。これらの態様の多くは、特異性を持って説明されており、少なくとも個々の特性を示すために、制限を意図すると思われるような方法で説明される場合が多い。しかし、これは、説明を明確にするためであり、それらの態様の応用又は範囲を制限するものではない。現に、異なる態様はすべて、さらなる態様を提供するために、組み合わせたり交換したりすることができる。その上、態様は、先の出願において説明されている態様と組み合わせたり交換したりすることもできる。
【0143】
この文書において説明及び企図される態様は、多くの異なる形態で実装することができる。
図12、13及び14はいくつかの実施形態を提供しているが、他の実施形態も企図され、
図12、13及び14における論考は実装形態の広さを制限するものではない。少なくとも1つの態様は、一般に、映像符号化及び復号に関連し、少なくとも1つの他の態様は、一般に、生成又は符号化されたビットストリームを送信することに関連する。これらの及び他の態様は、方法として、装置として、説明される方法のいずれかに従って映像データを符号化若しくは復号するための命令が格納されたコンピュータ可読記憶媒体として、及び/又は、説明される方法のいずれかに従って生成されたビットストリームが格納されたコンピュータ可読記憶媒体として実装することができる。
【0144】
本出願では、「再構築された」及び「復号された」という用語は、交換可能に使用することができ、「画素」及び「サンプル」という用語は、交換可能に使用することができ、「画像」、「ピクチャ」及び「フレーム」という用語は、交換可能に使用することができる。通常、一概には言えないが、「再構築された」という用語は、エンコーダ側で使用され、「復号された」という用語は、デコーダ側で使用される。
【0145】
上記では様々な方法が説明されており、方法の各々は、説明される方法を達成するための1つ又は複数のステップ又は行動を含む。方法の正しい動作のためにステップ又は行動の特定の順番が必要でない限り、特定のステップ及び/又は行動の順番及び/又は使用を修正することも、組み合わせることもできる。
【0146】
この文書において説明される様々な方法及び他の態様は、例えば、
図12の動き補償170及び動き推定175並びに
図13の動き推定275などのモジュールを修正するために使用することができる。その上、本態様は、JVET又はHEVCに限定されず、例えば、先在するか又は今後開発されるかにかかわらず、他の規格及び勧告並びにそのような規格及び勧告の拡張版(JVET及びHEVCを含む)に適用することができる。別段の指示がない限り又は技術的に除外されない限り、この文書において説明される態様は、個別に使用することも、組み合わせて使用することもできる。
【0147】
本文書には様々な数値が示されている。具体的な値は、例示を目的とするものであり、説明される態様は、これらの具体的な値に限定されない。
【0148】
図12は、例示的なエンコーダ100を示す。このエンコーダ100の変形形態が企図されるが、以下では、エンコーダ100は、期待される変形形態をすべて説明することなく明確にする目的で説明される。
【0149】
符号化される前、映像シーケンスは、符号化前の処理(101)を行うことができ、例えば、入力カラーピクチャに色変換を適用すること(例えば、RGB 4:4:4からYCbCr 4:2:0への変換)又は圧縮に対する回復力がより早い信号分布を得るために入力ピクチャ成分のリマッピングを実行すること(例えば、色成分のうちの1つのヒストグラム平坦化を使用する)ができる。メタデータは、前処理と関連付け、ビットストリームに載せることができる。
【0150】
例示的なエンコーダ100では、ピクチャは、以下で説明されるようなエンコーダ要素によって符号化される。符号化予定のピクチャは、分割され(102)、単位(例えば、CU)で処理される。各単位は、例えば、イントラ又はインターモードを使用して符号化される。単位がイントラモードで符号化される際、イントラ予測(160)が実行される。インターモードでは、動き推定(175)及び補償(170)が実行される。エンコーダは、単位の符号化に対してイントラモードとインターモードのどちらを使用するかを決定し(105)、例えば、予測モードフラグによって、イントラ/インター決定を示す。予測残差は、例えば、オリジナルの画像ブロックから予測ブロックを減じること(110)によって計算される。
【0151】
次いで、予測残差は、変換(125)及び量子化(130)が行われる。量子化済みの変換係数並びに動きベクトル及び他の構文要素は、ビットストリームを出力するためにエントロピーコード化される(145)。エンコーダは、変換をスキップして、非変換残差信号に量子化を直接適用することができる。エンコーダは、変換と量子化の両方を回避することができる(すなわち、残差は、変換又は量子化プロセスを適用することなく直接コード化される)。
【0152】
エンコーダは、さらなる予測のための参照を提供するために、符号化済みのブロックを復号する。量子化済みの変換係数は、予測残差を復号するために、非量子化(140)及び逆変換(150)が行われる。復号済みの予測残差と予測ブロックを組み合わせること(155)で、画像ブロックが再構築される。インループフィルタ(165)は、例えば、符号化アーチファクトを低減するために非ブロック化/SAO(サンプル適応オフセット)フィルタリングを実行するため、再構築されたピクチャに適用される。フィルタリング済みの画像は、参照ピクチャバッファ(180)に格納される。
【0153】
図13は、例示的な映像デコーダ200のブロック図を示す。例示的なデコーダ200では、ビットストリームは、以下で説明されるようなデコーダ要素によって復号される。映像デコーダ200は、一般に、
図12で説明されるような符号化パスとは逆の復号パスを実行する。エンコーダ100もまた、一般に、映像データの符号化の一部として映像復号を実行する。
【0154】
具体的には、デコーダの入力は、映像ビットストリームを含み、映像ビットストリームは、映像エンコーダ100によって生成することができる。ビットストリームは、最初に、変換係数、動きベクトル及び他のコード化情報を得るために、エントロピー復号(230)が行われる。ピクチャ分割情報は、ピクチャがどのように分割されるかを示す。従って、デコーダは、復号済みのピクチャ分割情報に従って、ピクチャを分割すること(235)ができる。変換係数は、予測残差を復号するために、非量子化(240)及び逆変換(250)が行われる。復号済みの予測残差と予測ブロックを組み合わせること(255)で、画像ブロックが再構築される。予測ブロックは、イントラ予測(260)又は動き補償予測(すなわち、インター予測)(275)から得ること(270)ができる。インループフィルタ(265)は、再構築された画像に適用される。フィルタリング済みの画像は、参照ピクチャバッファ(280)に格納される。
【0155】
復号済みのピクチャは、復号後の処理(285)をさらに行うことができ、例えば、逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)又は符号化前の処理(101)において実行されるリマッピングプロセスの逆を実行する逆リマッピングを行うことができる。復号後の処理は、メタデータを使用することができ、メタデータは、符号化前の処理において導出され、ビットストリームで信号伝達される。
【0156】
図14は、様々な態様及び実施形態が実装されるシステムの例のブロック図を示す。システム1000は、以下で説明される様々なコンポーネントを含むデバイスとして具体化することができ、この文書において説明される態様のうちの1つ又は複数を実行するように構成される。そのようなデバイスの例は、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビレシーバ、パーソナル映像記録システム、接続された家庭用器具及びサーバなどの様々な電子デバイスを含む。システム1000の要素は、単独で又は組み合わせて、単一の集積回路、複数のIC及び/又は離散コンポーネントにおいて具体化することができる。例えば、少なくとも1つの実施形態では、システム1000の処理及びエンコーダ/デコーダ要素は、複数のIC及び/又は離散コンポーネントにわたって分配される。様々な実施形態では、システム1000は、例えば、通信バスを介して或いは専用入力及び/又は出力ポートを通じて、他のシステム又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム1000は、この文書において説明される態様のうちの1つ又は複数を実装するように構成される。
【0157】
システム1000は、例えば、この文書において説明される様々な態様を実装するためにその中にロードされた命令を実行するように構成された少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、当技術分野で知られているような埋め込みメモリ、入力出力インタフェース及び様々な他の回路を含み得る。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム1000は、不揮発性メモリ及び/又は揮発性メモリを含み得る記憶装置1040を含み、これらに限定されないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ及び/又は光ディスクドライブを含む。記憶装置1040は、非限定的な例として、内部記憶装置、取り付けられた記憶装置及び/又はネットワークアクセス可能記憶装置を含み得る。
【0158】
システム1000は、例えば、符号化済みの映像又は復号済みの映像を提供するためにデータを処理するように構成されたエンコーダ/デコーダモジュール1030を含み、エンコーダ/デコーダモジュール1030は、それ自体のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール1030は、符号化及び/又は復号機能を実行するためにデバイスに含めることができるモジュールを表す。知られているように、デバイスは、符号化及び復号モジュールの一方又は両方を含み得る。それに加えて、エンコーダ/デコーダモジュール1030は、当業者に知られているように、システム1000の別個の要素として実装することも、ハードウェアとソフトウェアの組合せとしてプロセッサ1010内に組み込むこともできる。
【0159】
この文書において説明される様々な態様を実行するためにプロセッサ1010又はエンコーダ/デコーダ1030にロードされる予定のプログラムコードは、記憶装置1040に格納し、その後、プロセッサ1010による実行のためにメモリ1020にロードすることができる。様々な実施形態によれば、プロセッサ1010、メモリ1020、記憶装置1040及びエンコーダ/デコーダモジュール1030のうちの1つ又は複数は、この文書において説明されるプロセスの実行の間、様々なアイテムのうちの1つ又は複数を格納することができる。そのような格納されるアイテムは、これらに限定されないが、入力映像、復号済みの映像又は復号済みの映像の一部分、ビットストリーム、行列、変数、並びに、方程式、公式、演算及び演算論理の処理からの中間又は最終結果を含み得る。
【0160】
いくつかの実施形態では、命令を格納するため及び符号化又は復号の間に必要なものを処理するためのワーキングメモリを提供するため、プロセッサ1010及び/又はエンコーダ/デコーダモジュール1030の内部のメモリが使用される。しかし、他の実施形態では、これらの機能のうちの1つ又は複数に対して、処理デバイス(例えば、処理デバイスは、プロセッサ1010又はエンコーダ/デコーダモジュール1030であり得る)の外部のメモリが使用される。外部のメモリは、メモリ1020及び/又は記憶装置1040であり得、例えば、動的揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部の不揮発性フラッシュメモリは、テレビのオペレーティングシステムを格納するために使用される。少なくとも1つの実施形態では、RAMなどの外部の高速動的揮発性メモリは、MPEG-2、HEVC又はVVC(多目的映像コード化)に対するものなどの映像コード化及び復号動作のためのワーキングメモリとして使用される。
【0161】
システム1000の要素への入力は、ブロック1130に示されるような様々な入力デバイスを通じて提供することができる。そのような入力デバイスは、これらに限定されないが、(i)例えば放送局によって無線で送信されたRF信号を受信するRF部分、(ii)複合入力端末、(iii)USB入力端末及び/又は(iv)HDMI(登録商標)入力端末を含む。
【0162】
様々な実施形態では、ブロック1130の入力デバイスは、当技術分野で知られているようなそれぞれの関連入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択すること(信号を選択すること又は周波数の帯域に信号を帯域制限することとも呼ばれる)、(ii)選択された信号をダウンコンバートすること、(iii)信号周波数帯域を選択するために(例えば)、周波数のより狭い帯域に再び帯域制限すること(ある実施形態では、チャネルとも呼ぶことができる)、(iv)ダウンコンバート済みの且つ帯域制限済みの信号を復調すること、(v)誤り訂正を実行すること、及び、(vi)データパケットの所望のストリームを選択するために逆多重化することに適した要素と関連付けることができる。様々な実施形態のRF部分は、これらの機能を実行するための1つ又は複数の要素を含み、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器及びデマルチプレクサが挙げられる。RF部分は、チューナを含み得、チューナは、例えば、より低い周波数(例えば、中間周波数若しくはベースバンド近くの周波数)又はベースバンドへの受信信号のダウンコンバートを含む、これらの様々な機能を実行する。セットトップボックスの一実施形態では、RF部分及びその関連入力処理要素は、有線(例えば、ケーブル)媒体上で送信されたRF信号を受信し、次いで、所望の周波数帯域を得るために、フィルタリングを行い、ダウンコンバートを行い、再びフィルタリングを行うことによって周波数選択を実行する。様々な実施形態は、上記で説明される(及び他の)要素の順番を再構成すること、これらの要素のいくつかを取り除くこと及び/又は同様の若しくは異なる機能を実行する他の要素を追加することを行う。要素を追加することは、既存の要素の間に要素を挿入すること(例えば、増幅器及びアナログ/デジタル変換器を挿入すること)を含み得る。様々な実施形態では、RF部分はアンテナを含む。
【0163】
それに加えて、USB及び/又はHDMI(登録商標)端末は、USB及び/又はHDMI(登録商標)接続を通じてシステム1000を他の電子デバイスに接続するためのそれぞれのインタフェースプロセッサを含み得る。入力処理の様々な態様(例えば、リードソロモン誤り訂正)は、例えば、別個の入力処理IC内又はプロセッサ1010内で実装できることを理解されたい。同様に、USB又はHDMI(登録商標)インタフェース処理の態様は、別個のインタフェースIC内又はプロセッサ1010内で実装することができる。復調済みの、誤り訂正済みの及び逆多重化済みのストリームは、出力デバイス上で提示するためのデータストリームを処理するために、様々な処理要素(例えば、メモリと連動するプロセッサ1010及びエンコーダ/デコーダ1030並びに記憶素子を含む)に提供することができる。
【0164】
システム1000の様々な要素は、統合筐体内に提供することができる。統合筐体内では、様々な要素を相互接続することができ、当技術分野で知られている内部バス(例えば、I2Cバス、配線及びプリント基板を含む)などの適切な接続配列1140を使用して、様々な要素間でデータを送信することができる。
【0165】
システム1000は、通信チャネル1060を介して他のデバイスとの通信を可能にする通信インタフェース1050を含む。通信インタフェース1050は、これらに限定されないが、通信チャネル1060上でデータを送信及び受信するように構成されたトランシーバを含み得る。通信インタフェース1050は、これらに限定されないが、モデム又はネットワークカードを含み得、通信チャネル1060は、例えば、有線及び/又は無線媒体内で実装することができる。
【0166】
データは、様々な実施形態では、IEEE802.11などの無線ネットワークを使用して、システム1000にストリーミングされる。これらの実施形態の無線信号は、Wi-Fi通信などの無線通信用に適応させた通信チャネル1060及び通信インタフェース1050上で受信される。これらの実施形態の通信チャネル1060は、典型的には、アプリケーションのストリーミング及び他のオーバーザトップ通信を可能にするためのインターネットを含む外部のネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態は、入力ブロック1130のHDMI(登録商標)接続上でデータを伝達するセットトップボックスを使用して、ストリーミングされたデータをシステム1000に提供する。さらなる他の実施形態は、入力ブロック1130のRF接続を使用して、ストリーミングされたデータをシステム1000に提供する。
【0167】
システム1000は、ディスプレイ1100、スピーカ1110及び他の周辺デバイス1120を含む様々な出力デバイスに出力信号を提供することができる。他の周辺デバイス1120は、実施形態の様々な例では、スタンドアロンDVR、ディスクプレーヤ、ステレオシステム、照明システム、及び、システム1000の出力に基づいて機能を提供する他のデバイスのうちの1つ又は複数を含む。様々な実施形態では、制御信号は、AV.Link、CEC、又は、ユーザ介入の有無にかかわらずデバイス間制御を可能にする他の通信プロトコルなどの信号伝達を使用して、システム1000とディスプレイ1100、スピーカ1110又は他の周辺デバイス1120との間で伝達される。出力デバイスは、専用接続を介して、それぞれのインタフェース1070、1080及び1090を通じて、システム1000に通信可能に結合することができる。或いは、出力デバイスは、通信チャネル1060を使用して、通信インタフェース1050を介して、システム1000に接続することができる。ディスプレイ1100及びスピーカ1110は、電子デバイス(例えば、テレビ)のシステム1000の他のコンポーネントと共に単一のユニットに統合することができる。様々な実施形態では、ディスプレイインタフェース1070は、例えば、タイミングコントローラ(T Con)チップなどのディスプレイドライバを含む。
【0168】
例えば、入力1130のRF部分が別個のセットトップボックスの一部である場合は、ディスプレイ1100及びスピーカ1110は、他のコンポーネントのうちの1つ又は複数から選択的に分離することができる。ディスプレイ1100及びスピーカ1110が外部のコンポーネントである様々な実施形態では、出力信号は、専用出力接続(例えば、HDMI(登録商標)ポート、USBポート又はCOMP出力を含む)を介して提供することができる。
【0169】
例示的な実施形態は、プロセッサ1010によって実装されるコンピュータソフトウェアによって、ハードウェアによって又はハードウェアとソフトウェアの組合せによって実行することができる。非限定的な例として、例示的な実施形態は、1つ又は複数の集積回路によって実装することができる。メモリ1020は、技術環境に適切ないかなるタイプのものでもあり得、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ及び取り外し可能メモリなど、任意の適切なデータ格納技術を使用して実装することができる。プロセッサ1010は、技術環境に適切ないかなるタイプのものでもあり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ又は複数を包含し得る。
【0170】
本明細書で説明される実装形態及び態様は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は、信号で実装することができる。実装の単一の形態の文脈においてのみ論じられる(例えば、方法としてのみ論じられる)場合であっても、論じられる特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア及びファームウェアで実装することができる。方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路又はプログラマブル論理デバイスを含む、例えば、一般に処理デバイスを指す装置(例えば、プロセッサなど)で実装することができる。また、プロセッサは、例えば、コンピュータ、携帯電話、ポータブル/携帯情報端末(「PDA」)、及び、エンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスも含む。
【0171】
「一実施形態」、「実施形態」、「一実装形態」又は「実装形態」及びその他の変形形態への言及は、実施形態と関係して説明される特定の特徴、構造、特性などが少なくとも1つの実施形態に含まれることを意味する。従って、この文書全体を通じて様々な場所に現れる「一実施形態では」、「実施形態では」、「一実装形態では」又は「実装形態では」という記載及び他の任意の変形形態の出現は、必ずしもすべてが同じ実施形態を指すとは限らない。
【0172】
それに加えて、この文書は、様々な情報片を「決定すること」について言及し得る。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は、メモリから情報を回収することのうちの1つ又は複数を含み得る。
【0173】
さらに、この文書は、様々な情報片に「アクセスすること」について言及し得る。情報にアクセスすることは、例えば、情報を受信すること、情報を回収すること(例えば、メモリから)、情報を格納すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、又は、情報を推定することのうちの1つ又は複数を含み得る。
【0174】
それに加えて、この文書は、様々な情報片を「受信すること」について言及し得る。受信することは、「アクセスすること」と同様に、幅広い用語であることを意図する。情報を受信することは、例えば、情報にアクセスすること又は情報を回収すること(例えば、メモリから)のうちの1つ又は複数を含み得る。さらに、「受信すること」は、典型的には、例えば、情報を格納すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、又は、情報を推定することなど、動作の間にいろいろな方法で関与する。
【0175】
当業者には明らかであるように、実装形態は、例えば、格納又は送信することができる、情報を伝えるようにフォーマットされた様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、又は、説明される実装形態のうちの1つによって生成されたデータを含み得る。例えば、信号は、説明される実施形態のビットストリームを伝えるようにフォーマットすることができる。そのような信号は、例えば、電磁波として(例えば、スペクトルの高周波部分を使用して)又はベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化し、符号化済みのデータストリームで搬送波を変調することを含み得る。信号が伝える情報は、例えば、アナログ又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンク上で送信することができる。信号は、プロセッサ可読媒体上に格納することができる。
【0176】
先行説明では多くの実施形態について説明した。これらの実施形態は、様々な異なる請求項カテゴリ及びタイプにわたって、以下のオプションの特徴を単独で又は組合せで含む。
- 符号化及び復号においてイントラ予測の間に-135度及び45度を超える予測方向を使用する
- 同じ方向総数を維持するために、水平又は垂直方向に予測方向を拡張する一方で、反対方向のいくつかの方向を除去する
- -135度を超える方向と45度を超える方向の両方の数を拡大する
- 短い方の参照アレイの長さは、ブロック幅と高さの両方に基づく
- 短い方の参照アレイの長さは、ブロックの対応する辺の長さの2倍に1を加えて、拡張を少し加えたものである
- 角度パラメータ値は2の累乗ではないため、拡張が必要である
- 小さい方の辺におけるこの拡張を補償するため、ブロックの長い方の辺の参照アレイサイズを適切に低減することができ、その結果、広角度予測に必要な参照サンプルの総数は、通常のイントラ予測に必要な数とほぼ同じままである
- 参照アレイの長さは、符号化予定の又は復号予定のブロックの高さと幅の両方に基づいて決定される
- エンコーダからデコーダ(予測方向が使用されているもの)に信号伝達する
- 予測方向の部分集合を使用する
- ブロックは、長方形のCUである
- 他のブロックは、近隣のブロックである
- 角度予測モードは、ターゲットブロック形状に対応する値によって広角度モードにマッピングされる
- 広角度モードへの角度モードのマッピングは1対1である
- ブロックに対して使用される広角度方向の数は、ターゲットブロック形状に依存する
- イントラ予測は、広角度モードに基づく
- 説明される構文要素又はその変形形態のうちの1つ又は複数を含むビットストリーム又は信号
- 信号伝達の際、デコーダがエンコーダによって実行されるものとは逆の方法でビットストリームを処理できるようにするための構文要素を挿入する
- 説明される構文要素又はその変形形態のうちの1つ又は複数を含むビットストリーム又は信号を作成及び/又は送信する及び/又は受信及び/又は復号する
- 説明される実施形態のいずれかを実行するテレビ、セットトップボックス、携帯電話、タブレット又は他の電子デバイス
- 説明される実施形態のいずれかを実行し、結果として得られた画像を表示する(例えば、モニタ、スクリーン又は他のタイプのディスプレイを使用して)テレビ、セットトップボックス、携帯電話、タブレット又は他の電子デバイス
- 符号化済みの画像を含む信号を受信するためにチャネルをチューニングし(例えば、チューナを使用して)、説明される実施形態のいずれかを実行するテレビ、セットトップボックス、携帯電話、タブレット又は他の電子デバイス
- 符号化済みの画像を含む信号を受信し(例えば、アンテナを使用して)、説明される実施形態のいずれかを実行するテレビ、セットトップボックス、携帯電話、タブレット又は他の電子デバイス
- この開示全体を通じて、様々な他の一般化された及び特殊化された特徴もサポートされ、企図される。