IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル ヴイシー ホールディングス, インコーポレイテッドの特許一覧

特表2022-525686サブパーティションを有する広角度イントラ予測
<>
  • 特表-サブパーティションを有する広角度イントラ予測 図1
  • 特表-サブパーティションを有する広角度イントラ予測 図2
  • 特表-サブパーティションを有する広角度イントラ予測 図3
  • 特表-サブパーティションを有する広角度イントラ予測 図4
  • 特表-サブパーティションを有する広角度イントラ予測 図5
  • 特表-サブパーティションを有する広角度イントラ予測 図6
  • 特表-サブパーティションを有する広角度イントラ予測 図7
  • 特表-サブパーティションを有する広角度イントラ予測 図8
  • 特表-サブパーティションを有する広角度イントラ予測 図9
  • 特表-サブパーティションを有する広角度イントラ予測 図10
  • 特表-サブパーティションを有する広角度イントラ予測 図11
  • 特表-サブパーティションを有する広角度イントラ予測 図12
  • 特表-サブパーティションを有する広角度イントラ予測 図13
  • 特表-サブパーティションを有する広角度イントラ予測 図14
  • 特表-サブパーティションを有する広角度イントラ予測 図15
  • 特表-サブパーティションを有する広角度イントラ予測 図16
  • 特表-サブパーティションを有する広角度イントラ予測 図17
  • 特表-サブパーティションを有する広角度イントラ予測 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-05-18
(54)【発明の名称】サブパーティションを有する広角度イントラ予測
(51)【国際特許分類】
   H04N 19/11 20140101AFI20220511BHJP
   H04N 19/176 20140101ALI20220511BHJP
   H04N 19/134 20140101ALI20220511BHJP
【FI】
H04N19/11
H04N19/176
H04N19/134
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021556722
(86)(22)【出願日】2020-04-09
(85)【翻訳文提出日】2021-11-17
(86)【国際出願番号】 US2020027402
(87)【国際公開番号】W WO2020210443
(87)【国際公開日】2020-10-15
(31)【優先権主張番号】19305478.0
(32)【優先日】2019-04-12
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
2.BLUETOOTH
(71)【出願人】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ラケイプ,ファビアン
(72)【発明者】
【氏名】ラス,ガガン
(72)【発明者】
【氏名】アーバン,ファブリス
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LC09
5C159MA04
5C159MA05
5C159MA21
5C159MC11
5C159ME01
5C159PP04
5C159RC12
5C159TA33
5C159TB08
5C159TB10
5C159TC26
5C159UA02
5C159UA05
(57)【要約】
エンコーディング及びデコーディング用の予測を実行する方法及び装置は、サブパーティションを有するイントラ予測を使用している。サブパーティションは、水平方向において又は垂直方向において方向付けされており、且つ自身が由来するビデオブロックのものとは異なる広角度モードを使用することができる。サブパーティションの基準サンプルは、サブパーティションの基準サンプルが、例えば、方向に起因して利用可能ではない際には、ビデオブロックのものである。一実施形態において、サブパーティションが正方形である際には、従来のイントラ予測方向が使用されている。垂直方向において又は水平方向において、予測方向に沿ったマッピングを使用することにより、ビデオブロックの上方及び右の或いはビデオブロックの左及び下方のブロックから、基準サンプルを使用することができる。
【特許請求の範囲】
【請求項1】
方法であって、
サブパーティションの寸法の比率が特定の範囲内にある際には前記サブパーティションの寸法に基づいて、且つ前記サブパーティションの寸法の比率が前記特定の範囲外にある際には前記ビデオブロックの寸法に基づいて、ビデオブロックの前記矩形サブパーティションのイントラ予測方向を判定することと、
前記ビデオブロックの前記サブパーティションの予測のための上方右又は下方左基準サンプルとして前記ビデオブロックの上方右又は下方左からの基準サンプルをマッピングすることと、
前記ビデオブロックの上方の行からの基準サンプル又は前記ビデオブロックの左の列からの基準サンプルを使用して前記矩形サブパーティションのサンプルを予測することであって、前記ビデオブロックの上方の行又は前記ビデオブロックの左の列内の基準サンプルの数は、前記矩形サブパーティションの寸法に基づいて判定されている、ことと、
イントラコーディングモードにおいて前記予測を使用してビデオブロックの前記矩形サブパーティションをエンコーディングすることと、
を有する方法。
【請求項2】
装置であって、
サブパーティションの寸法の比率が特定の範囲内にある際には前記サブパーティションの寸法に基づいて、且つ前記サブパーティションの寸法の比率が前記特定の範囲外にある際には前記ビデオブロックの寸法に基づいて、ビデオブロックの前記矩形サブパーティションのイントラ予測方向を判定することと、
前記ビデオブロックの前記サブパーティションの予測のための上方右又は下方左基準サンプルとして前記ビデオブロックの上方右又は下方左からの基準サンプルをマッピングすることと、
前記ビデオブロックの上方の行からの基準サンプル又は前記ビデオブロックの左の列からの基準サンプルを使用して前記矩形サブパーティションのサンプルを予測することであって、前記ビデオブロックの上方の行又は前記ビデオブロックの左側の列内の基準サンプルの数は、前記矩形サブパーティションの寸法に基づいて判定されている、ことと、
イントラコーディングモードにおいて前記予測を使用してビデオブロックの前記矩形サブパーティションをエンコーディングすることと、
を実行するように構成されたプロセッサを有する装置。
【請求項3】
方法であって、
サブパーティションの寸法の比率が特定の範囲内にある際には前記サブパーティションの寸法に基づいて、且つ前記サブパーティションの寸法の比率が前記特定の範囲外にある際には前記ビデオブロックの寸法に基づいて、ビデオブロックの前記矩形サブパーティションのイントラ予測方向を判定することと、
前記ビデオブロックの前記サブパーティションの予測のための上方右又は下方左の基準サンプルとして前記ビデオブロックの上方右又は下方左からの基準サンプルをマッピングすることと、
前記ビデオブロックの上方の行からの基準サンプル又は前記ビデオブロックの左の列からの基準サンプルを使用して前記矩形のサブパーティションのサンプルを予測することとであって、前記ビデオブロックの上方の行又は前記ビデオブロックの左の列内の基準サンプルの数は、前記矩形サブパーティションの寸法に基づいて判定されている、ことと、
イントラコーディングモードにおいて前記予測を使用してビデオブロックの前記矩形のサブパーティションをデコーディングすることと、
を有する方法。
【請求項4】
装置であって、
サブパーティションの寸法の比率が特定の範囲内にある際には前記サブパーティションの寸法に基づいて、且つ前記サブパーティションの寸法の比率が前記特定の範囲外にある際には前記ビデオブロックの寸法に基づいて、ビデオブロックの前記矩形サブパーティションのイントラ予測方向を判定することと、
前記ビデオブロックの前記サブパーティションの予測のための上方右又は下方左の基準サンプルとして前記ビデオブロックの上方右又は下方左からの基準サンプルをマッピングすることと、
前記ビデオブロックの上方の行からの基準サンプル又は前記ビデオブロックの左の列からの基準サンプルを使用して前記矩形のサブパーティションのサンプルを予測することであって、前記ビデオブロックの上方の行又は前記ビデオブロックの左の列内の基準サンプルの数は、前記矩形サブパーティションの寸法に基づいて判定されている、ことと、
イントラコーディングモードにおいて前記予測を使用してビデオブロックの前記矩形のサブパーティションをデコーディングすることと、
を実行するように構成されたプロセッサを有する装置。
【請求項5】
非広角度予測モードが、正方形であるサブパーティションに適用されている請求項1又は3に記載の方法或いは請求項2又は4に記載の装置。
【請求項6】
垂直方向サブパーティションの場合には左基準アレイに最も近接したものを超えた又は水平方向サブパーティションの場合には最上位エッジに最も近接したものを超えたサブパーティションの場合に、消失基準サンプルが前記ビデオブロックからマッピングされている請求項1又は3に記載の方法或いは請求項2又は4に記載の装置。
【請求項7】
前記イントラ予測方向は、16超又は1/16未満の幅/高さ比率を有するサブパーティションの場合に前記ビデオブロックの寸法に基づいている請求項6に記載の方法又は装置。
【請求項8】
前記イントラ予測方向は、16超又は1/16未満の幅/高さ比率を有するサブパーティションの場合に前記ビデオブロックの寸法に基づいており、且つ垂直方向サブパーティションの場合には左基準アレイに最も近接したものを超えた又は水平方向サブパーティションの場合には最上位エッジに最も近接したものを超えたサブパーティションの場合に、消失基準サンプルが、前記ビデオブロックから水平方向又は垂直方向において直接的にマッピングされている請求項1又は3に記載の方法或いは請求項2又は4に記載の装置。
【請求項9】
サブパーティションは、前記ビデオブロックの少なくとも単一の行又は単一の列である請求項6に記載の方法又は装置。
【請求項10】
サブパーティションは、等しくない形状を有しているが、2の累乗に等しい高さ及び幅を有する請求項1又3に記載の方法或いは請求項2又は4に記載の装置。
【請求項11】
サブパーティションは、複数の基準ラインを使用することができる請求項1又は3に記載の方法又は請求項2又は4に記載の装置。
【請求項12】
装置であって、
請求項4乃至11のいずれか1項に記載の装置と、
(i)信号を受け取るように構成されアンテナであって、前記信号は、前記ビデオブロックを含む、アンテナ、(ii)前記受け取られた信号を前記ビデオブロックを含む周波数帯域に制限するように構成された帯域リミッタ、及び(iii)ビデオブロックを表す出力を表示するように構成されたディスプレイの少なくとも1つと、
を有する装置。
【請求項13】
プロセッサを使用した再生のために請求項1及び5乃至11のいずれか1項に記載の方法或いは請求項2及び5乃至11のいずれか1項に記載の装置に従って生成されたデータコンテンツを含む一時的ではないコンピュータ可読媒体。
【請求項14】
プロセッサを使用した再生のために請求項1及び5乃至11のいずれか1項に記載の方法或いは請求項2及び5乃至11のいずれか1項に記載の装置に従って生成されたビデオデータを有する信号。
【請求項15】
プログラムがコンピュータによって実行された際にコンピュータが請求項1、3、及び5乃至11のいずれか1項に記載の方法を実行するようにする命令を有するコンピュータプログラムプロダクト。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本実施形態の少なくとも1つは、一般に、ビデオエンコーディング又はデコーディング用の方法又は装置に関する。
【背景技術】
【0002】
背景
高圧縮効率を実現するべく、画像及びビデオのコーディング方式は、通常、空間及び/又はモーションベクトル予測を含む予測を利用しており、且つビデオコンテンツ内の空間及び時間冗長性を活用するように変換している。一般には、イントラ又はインターフレーム相関を活用するべく、イントラ又はインター予測が使用され、次いで、しばしば、予測誤差又は予測残差と表記されるオリジナルの画像と予測された画像の間の差が変換され、量子化され、且つエントロピーコーディングされている。ビデオを再構築するべく、エントロピーコーディング、量子化、変換、及び予測に対応する逆プロセスにより、圧縮されたデータがデコーディングされている。
【発明の概要】
【0003】
概要
従来技術の欠点及び不利な点に対しては、エンコーディング及びデコーディングにおけるブロック形状適応型のイントラ予測方向を対象とする本明細書において記述されている一般的な態様により、対処することができる。
【0004】
第1の態様によれば、方法が提供されている。方法は、サブパーティションの寸法の比率が特定の範囲内にある際にはサブパーティションの寸法に基づいて、且つサブパーティションの寸法の比率が前記特定の範囲外にある際にはビデオブロックの寸法に基づいて、ビデオブロックの前記矩形サブパーティションのイントラ予測方向を判定するステップと、ビデオブロックの上方右又は下方左からの基準サンプルをビデオブロックの前記サブパーティションの予測のための上方右又は下方左基準サンプルとしてマッピングするステップと、ビデオブロックの上方の行からの基準サンプル又はビデオブロックの左の列からの基準サンプルを使用して矩形サブパーティションのサンプルを予測するステップであって、ビデオブロックの上方の行又はビデオブロックの左の列内の基準サンプルの数は、矩形サブパーティションの寸法に基づいて判定されている、ステップと、イントラコーディングモードにおいて前記予測を使用してビデオブロックの矩形サブパーティションをエンコーディングするステップと、を有する。
【0005】
第2の態様によれば、方法が提供されている。方法は、前記サブパーティションの寸法の比率が特定の範囲内にある際にはサブパーティションの寸法に基づいて、且つ前記サブパーティションの寸法の比率が前記特定の範囲外にある際にはビデオブロックの寸法に基づいて、ビデオブロックの矩形サブパーティションのイントラ予測方向を判定するステップと、ビデオブロックの上方右又は下方左からの基準サンプルをビデオブロックの前記サブパーティションの予測のための上方右又は下方左基準サンプルとしてマッピングするステップと、ビデオブロックの上方の行からの基準サンプル又はビデオブロック左の列からの基準サンプルを使用して矩形サブパーティションのサンプルを予測するステップであって、ビデオブロックの上方の行又はビデオブロックの左の列内の基準サンプルの数は、矩形サブパーティションの寸法に基づいて判定されている、ステップと、イントラコーディングモードにおいて前記予測を使用してビデオブロックの矩形サブパーティションをデコーディングするステップと、を有する。
【0006】
別の態様によれば、装置が提供されている。装置は、プロセッサを有する。プロセッサは、上述の方法の任意のものを実行することにより、ビデオのブロックをエンコーディングするように又はビットストリームをデコーディングするように構成することができる。
【0007】
少なくとも1つの実施形態の別の一般的な態様によれば、デコーディング実施形態の任意のものによる装置と、(i)信号を受け取るように構成されたアンテナであって、信号は、ビデオブロックを含む、アンテナ、(ii)受け取られた信号をビデオブロックを含む周波数の帯域に制限するように構成された帯域リミッタ、又は(iii)ビデオブロックを表す出力を表示するように構成されたディスプレイの少なくとも1つと、を有する装置が提供されている。
【0008】
少なくとも1つの実施形態の別の一般的な態様によれば、記述されているエンコーディング実施形態又は変形の任意のものに従って生成されたデータコンテンツを含む一時的ではないコンピュータ可読媒体が提供されている。
【0009】
少なくとも1つの実施形態の別の一般的な態様によれば、記述されているエンコーディング実施形態又は変形の任意のものに従って生成されたビデオデータを有する信号が提供されている。
【0010】
少なくとも1つの実施形態の別の一般的な態様によれば、ビットストリームは、記述されているエンコーディング実施形態又は変形の任意のものに従って生成されたデータコンテンツを含むようにフォーマッティングされている。
【0011】
少なくとも1つの実施形態の別の一般的な態様によれば、プログラムがコンピュータによって実行された際にコンピュータが記述されているデコーディング実施形態又は変形の任意のものを実行するようにする命令を有するコンピュータプログラムプロダクトが提供されている。
【0012】
一般的な態様のこれらの及びその他の態様、特徴、及び利点については、添付図面との関連において参照される例示用の実施形態に関する以下の詳細な説明から明らかとなろう。
【図面の簡単な説明】
【0013】
図面の簡単な説明
図1】VTMにおけるイントラ予測用の基準サンプルを示す。
図2】VTMにおけるイントラ予測用の複数の基準ラインを示す。
図3】正方形ターゲットブロックの場合のVTMにおけるイントラ予測方向を示す。
図4】4×8及び8×4ブロックの分割の一例を示す。
図5】4×8、8×4、及び4×4を除くすべてのブロックの分割の一例を示す。
図6】非正方形ブロックの場合の広角度イントラ予測を示す。
図7】CUの高さ及び幅から演算されたISP広角度を示す。
図8】広角度及び水平方向スプリットISPのケースにおける使用された基準サンプルを示す。
図9】サブパーティションを予測するための提案されている基準サンプルのアレイの一例を示す。
図10】2つのサブパーティションの例示用のケースの場合のVTMにおける基準アレイパディングの一例を示す。
図11】水平方向スプリットのケースにおけるコーディングユニットの最上位基準からの基準サンプルのマッピングを示す。
図12】水平方向スプリットのケースにおけるコーディングユニットの最上位基準からの基準サンプルのマッピングを示す。
図13】一般的な標準エンコーディング方式を示す。
図14】一般的な標準デコーディング方式を示す。
図15】記述されている実施形態が実装されうる代表的なプロセッサ構成を示す。
図16】一般的な標準エンコーディング方式を示す。
図17】一般的な標準デコーディング方式を示す。
図18】記述されている実施形態が実装されうる代表的なプロセッサ構成を示す。
【発明を実施するための形態】
【0014】
詳細な説明
本明細書において記述されている実施形態は、ビデオ圧縮の分野におけるものであり、及びビデオの圧縮及びビデオのエンコーディング及びデコーディングに関する。
【0015】
多用途ビデオコーディング(VVC)試験モデル4.0(VTM)は、サブパーティションを有するイントラ予測(ISP:Intra Prediction with Sub-partitioning)をサポートしており、この場合に、ターゲットブロックは、水平方向又は垂直方向サブパーティション化の選択肢を伴ってエンコーディングされている。それぞれのサブパーティションの予測は、ターゲットコーディングユニットのものと同一の予測方向を使用している。サブパーティション予測は、親コーディングユニットとは独立したそれぞれのサブパーティションのアスペクト比に対して適合された広角度予測を利用することにより、改善することができる。第2に、サブパーティションの予測は、以前のサブパーティション内のデコーディング済みのピクセルを基準サンプルとして使用している。この結果、サブパーティションの最上位右又は最下位左基準サンプルが利用不能となる場合がある。これらのサンプルを必要とする方向に沿った予測を改善するべく、親CUの基準サンプルを使用することができる。
【0016】
多用途ビデオコーディング(VVC)試験モデル(VTM)において、イントラ予測における任意のターゲットブロックは、67個の予測モードの1つを有することができる。HEVCと同様に、1つがPLANARモードであり、1つがDCモードであり、及び残りの65が方向性モードである。65個の方向性モードは、95個の方向から選択されており、これは、ターゲットが正方形である場合には、45°~-135°に跨る65個の通常角度を含み、及びブロックが矩形である際には、潜在的に、28個の広角度方向を含む。VTMは、6つの予測モードから構成される最確モード(MPM:Most Probable Mode)セットを使用してブロックの予測モードをエンコーディングしている。予測モードがMPMセットに属していない場合には、これは、5又は6ビットによる切り捨て型のバイナリエンコーディングが実行されている。
【0017】
ビデオ圧縮におけるイントラ予測は、原因隣接ブロック、即ち、既にデコーディング済みの同一フレーム内の隣接ブロック、からの情報を使用したピクセルのブロックの空間予測を意味している。これは、強力なコーディングツールであり、その理由は、これが、相対的に良好な時間予測が存在していない際には常に、INTRAフレームにおいてみならず、INTERフレームにおいても、高圧縮効率を許容しているからである。従って、イントラ予測は、H.264/AVC、HEVC、などを含むすべてのビデオ圧縮規格において、コアコーディングツールとして含まれている。以下においては、説明を目的として、本発明者らは、多用途ビデオコーディング(VVC)ソフトウェア試験モデル(VTM)におけるイントラ予測を参照することとする。
【0018】
VTMにおいて、ビデオシーケンスのフレームのエンコーディングは、クアッド-ツリー(QT:Quad-Tree)/マルチタイプツリー(MTT:Multi-Type Tree)ブロック構造に基づいている。フレームは、オーバーラップしていない正方形のコーディングツリーユニット(CTU:Coding Tree Unit)に分割されており、これらは、そのすべてが、レート-歪基準に基づいて複数のコーディングユニット(CU:Coding Unit)へのQT/MTTに基づいたスプリッティングを経験している。相対的に容易な参照を目的として、本発明者らは、用語「CU」及び「ブロック」を本明細書の全体を通じて相互交換可能に使用することとする。
【0019】
イントラ予測において、CUは、原因隣接CU、即ち、最上位及び左におけるCU、から空間的に予測されている。これを目的として、VTMは、予測モードと呼称される単純な空間モデルを使用している。基準ピクセルと呼称される最上位及び左CUにおけるデコーディング済みのピクセル値に基づいて、エンコーダは、ターゲットブロックの異なる予測を構築し、及び最良のRD性能をもたらすものを選択している。95個の定義されたモードのうち、1つは、(モード0とインデックス付けされる)PLANARモードであり、1つは、(モード1とインデックス付けされる)DCモードであり、及び(モード-14...-1、2...80とインデックス付けされる)残りの93個は、角度モードである。93個の角度モードのうち、65個の隣接モードのみが、その形状に応じて任意のターゲットCUのために選択されている。角度モードは、フレーム内のオブジェクトの方向性構造をモデル化することを狙いとしている。従って、ターゲットCUを充填するべく、最上位及び左CU内のデコーディング済みのピクセル値が、定義された方向に沿って単純に反復されている。いくつかの予測モードは、最上位及び左基準境界に沿った不連続性をもたらす可能性があり、従って、これらの予測モードは、位置依存性イントラ予測組合せ(PDPC:Position Dependent Intra Prediction Combination)と呼称されるその後の後処理を含むことが可能であり、これは、その境界に沿ってピクセル値をスムージングすることを狙いとしている。
【0020】
VTMにおけるイントラ予測プロセスは、(1)基準サンプル生成、(2)イントラサンプル予測、及び(3)予測されたサンプルの後処理という3つのステップから構成されている。基準サンプル生成プロセスは、VTMにおけるイントラ予測用の基準サンプルを示す図1に示されている。H及びWは、それぞれ、現時点のブロックの高さ及び幅を表している。サイズH×WのCUの場合には、最上位における2Wデコーディングされたサンプルの行が、現時点のCUの予め再構築された最上位及び最上位右ピクセルから形成されている。同様に、左における2Hサンプルの列が、再構築された左及び下方左ピクセルから形成されている。また、最上位左位置におけるコーナーピクセルが、最上位行と左列基準の間のギャップを充填するべく使用されている。最上位又は左におけるサンプルのいくつかが利用不能である場合には、対応するCUが同一のスライス内に存在していない又は現時点のCUがフレーム境界に位置していることに起因して、或いは、なんらかのその他の理由から、基準サンプル置換と呼称される方法を実行することができる。
【0021】
また、VTMは、複数の基準ライン(MRL:Multiple Reference Line)を有するイントラ予測をもサポートしている。概念は、図2に示されているように基準ラインのいくつかの組に基づいた予測を実施し、次いで、最良のレート-歪性能を付与する基準ラインを選択するというものである。使用される基準ラインは、可変長コードによってデコーダにシグナリングされている。
【0022】
イントラサンプル予測である次のステップは、基準サンプルに基づいてターゲットCUのピクセルを予測することから構成されている。上述のように、異なる種類のコンテンツを効率的に予測するべく、VTMは、一連の予測モデルをサポートしている。滑らかな及び徐々に変化する領域を予測するべく、PLANAR及びDC予測モードが使用される一方で、異なる方向性構造をキャプチャするべく、角度予測モードが使用されている。VTMは、-14~-1及び2~80とインデックス付けされた95個の方向性予測モードをサポートしている。正方形CUの場合には、予測モード2~66のみが使用される。これらの予測モードは、図3に示されているように、時計回りの方向において45度~-135度の異なる予測方向に対応しており、これらは、正方形ターゲットブロックの場合のVTMにおけるイントラ予測方向を示している。また、一般に、拡張された予測方向と共に、非正方形ブロックを使用することもできるが、この図は、正方形ブロックを示している。数値は、対応する方向と関連する予測モードインデックスを表記している。モード2~33は、水平方向予測を示し、モード34~66は、垂直方向予測を示している。
【0023】
-14~-1のインデックス及び67~80のインデックスを有するモードは、異なる形状の矩形ブロックのために使用される広角度モードである。モード-14~-1は、モード2を超えて(角度45度を超えて)定義されており、背の高い矩形ブロック(幅超の高さを有するブロック)の場合に使用される。同様に、モード67~80は、モード66を超えて(角度-135度を超えて)定義されており、及びフラットな矩形ブロック(高さ超の幅を有するブロック)の場合に使用される。矩形ブロックに使用される広角度モードの数は、ブロックのアスペクト比に依存している。いずれのケースにおいても、任意のブロックに使用される角度モードの合計数は、65であり、モードは、方向において常に連続している。
【0024】
本明細書において記述されている一般的な態様は、サブパーティションを伴うイントラ予測における予測効率の改善を狙いとしている。第1に、これは、親コーディングユニットの広角度モードではなく、その独自の広角度モードを利用してそれぞれのサブパーティションを予測することを提案している。また、第2に、これは、それらのサンプルが利用不能である際に、サブパーティションの予測のために親CUの基準サンプルを利用することをも提案している。これら2つの提案は、コーディング性能を改善するべく、現時点のVTMコード内において内蔵することができる。これらの変更を内蔵するべく追加される複雑さ及びメモリ要件は、ある程度のコーディング利得の潜在性を伴って最小限のものである。
【0025】
多用途ビデオコーディング(VVC)試験モデル(VTM)において、ビデオシーケンスのフレームのエンコーディングは、クアッド-ツリー(QT)/マルチタイプツリー(MTT)ブロック構造に基づいている。フレームは、オーバーラップしていない正方形コーディングツリーユニット(CTU)に分割され、これらは、そのすべてが、レート-歪基準に基づいた複数のコーディングユニット(CU)に対するQT/MTTに基づいたスプリッティングを経験している。イントラ予測において、CUは、原因隣接CU、即ち、最上位及び左のCU、から空間的に予測されている。これを目的として、VTMは、予測モードと呼称される単純な空間モデルを使用している。基準ピクセルと呼称される最上位及び左CU内のデコーディング済みのピクセル値に基づいて、エンコーダは、ターゲットブロック用の異なる予測を構築し、及び最良のRD性能をもたらすものを選択している。
【0026】
VTM4.0において、ターゲットブロックは、CU全体のイントラ予測とCUのサブパーティションを伴うイントラ予測(ISP)の間において選択するという選択肢を有する。後者の予測においては、ターゲットCUは、2つ又は4つの等しいサイズのサブパーティションに分割されており、これらは、1つの予測モードにより、順番にデコーディングされる。即ち、それぞれのサブパーティションは、独立的にデコーディングされている。従って、サブパーティションは、隣接サブパーティションからのデコーディング済みのサンプルの利用可能性から受益することが可能であり、これらは、現時点のサブパーティションの直接的な隣接部分である。そして、これにより予測が向上し、従って圧縮効率が向上する。
【0027】
また、VTM4.0は、矩形CUの広角度予測方向の使用を許容する広角度イントラ予測(WAIP:Wide Angle Intra Prediction)をもサポートしている。ターゲットブロックのアスペクト比に応じて、いくつかの通常予測方向が、対応する広角度方向によって置換されている。また、予測方向は、定義された予測方向がブロックの二次対角線上においてアライメントされるように、異なる矩形ブロック形状に対して適切に適合されるべく、変更されている。事実上、方法は、通常角度の代わりに広角度を使用することにより、相対的に高い圧縮効率をもたらす相対的に良好な予測を提供することを狙いとしている。
【0028】
VTM4.0においては、ISPをWAIPと組み合わせることは簡単である。ISP内のそれぞれのサブパーティションごとに、予測方向は、親CUの予測方向と同一である。但し、これは必須ではない。サブパーティションは、独立的にデコーディングされることから、WAIPにより、それぞれのサブパーティションの予測方向を独立的に決定することができる。第2に、第1サブパーティションを除いて、残りのサブパーティションは、以前のサブパーティションからのデコーディング済みのピクセルを予測用の基準サンプルとして使用している。これは、いくつかの基準サンプルが予測方向に応じて利用不能となりうるという望ましくない結果をもたらす。この状況は、親CUからの基準サンプルを使用することにより、軽減することができる。提案されているモードについて説明する前に、本発明者らは、以下において、VTM4.0におけるISP及びWAIPについて簡潔に提示する。参照の容易性を目的として、本発明者らは、本明細書全体を通じて、「CU」及び「ブロック」という用語を相互交換可能に使用することする。
【0029】
VTM4.0におけるISPツールは、ブロックサイズに応じて、ルマイントラ予測されたブロックを2つ又は4つのサブパーティションに垂直方向又は水平方向において分割している。サブパーティションは、少なくとも16個のサンプルを有していなければならない。従って、サイズ4×4のブロックは、サブパーティションに分割されない一方で、サイズ4×8及び8×4のブロックは、2つのパーティションのみを有する。すべてのその他のサイズのブロックは、4つのサブパーティションのみを有する。サブパーティションは、水平方向又は垂直方向でありうる。サイズ4×8のブロックは、それぞれ、サイズ4×4の2つの垂直方向パーティションのみを有しうる一方で、サイズ8×4のブロックは、それぞれ、サイズ4×4の2つの水平方向パーティションのみを有することができる。同様に、別の例として、サイズ4×16のブロックは、それぞれ、サイズ4×4の4つの垂直方向サブパーティションを有することが可能であり、或いは、それぞれサイズ1×16の4つの水平方向サブパーティションを有することができる。図4及び図5は、2つの可能性の例を示している。
【0030】
【表1】
【0031】
これらのサブパーティションのそれぞれごとに、予測が、親CUのデコーディング済みの予測モードを使用して構築されている。この予測信号は、サブパーティション内においてピクセルを再構築するべく、エンコーダによって送信された係数をエントロピーデコーディングし次いでこれらを逆量子化及び逆変換することによって生成されたデコーディング済みの残差信号に加えられている。第1サブパーティションを除いて、それぞれのサブパーティションの再構築された値が、次のものの予測を生成するべく利用可能となる。
【0032】
サブパーティションは、利用されているイントラモード及びスプリットとは無関係に、通常の順序において処理されており、即ち、処理されるべき第1サブパーティションは、CUの最上位左サンプルを含むものであり、次いで、下方に(水平方向スプリット)又は右に(垂直方向スプリット)連続的に継続している。
【0033】
また、VTM4.0は、複数の基準ライン(MRL)を有するイントラ予測をもサポートしている。ターゲットブロックは、最良のレート-歪性能を付与するものを使用するべく、第1、第2、及び第4基準ラインのうちから選択することができる。選択された基準ラインは、それぞれ、第1基準ライン又は第2及び第4基準ラインの間を通知するべく、1ビット(0)又は2ビット(10又は11)のフラグによってシグナリングされている。VTM4.0において、ISPは、第1基準ラインを利用するブロックにのみ適用されている。従って、ブロックが、0ではないMRLインデックスを有する場合には、ISPコーディングモードは、0であるものと推定されることになり、従って、これは、デコーダに送信されなくなる。
【0034】
ISP法は、MPMリストの一部分であるイントラモードによって試験されており、これは、67個の予測モードのうちの6つの個別トモードから構成されている。ISPによって試験された任意のブロックについて、MPMリストが、DCモードを排除するように及び水平方向スプリット用の水平方向イントラモード及び垂直方向スプリット用の垂直方向イントラモードを優先するように変更されている。
【0035】
広角度予測の背後の基本的な概念は、予測モードの合計数を同一に維持しつつ、ブロック形状に従って予測方向を適合させるというものである。これは、ブロックの相対的に大きな側においていくつかの予測方向を追加し、及び相対的に短い側において予測方向を低減することにより、実行されている。全体的な狙いは、予測精度を改善して相対的に高い圧縮効率をもたらすというものである。新たに導入された方向は、45度から-135度の角度までの180度という通常の範囲を超えていることから、これらは、広角度方向と呼称される。
【0036】
ターゲットブロックが正方形である際には、広角度は、果たすべき役目を有しておらず、その理由は、ブロックの定義されたモードが不変の状態に留まっているからである。ターゲットブロックがフラットである、即ち、その幅Wがその高さHを上回っている、際には、45度に近接したいくつかのモードが除去され、-135度超の等しい数の広角度モードが追加されている。追加された方向は、予測モード67、68、...などとしてインデックス付けされる。同様に、ターゲットブロックの背が高い際には、-135度に近接したいくつかのモードが除去され、45度超の等しい数の広角度モードが追加されている。予測モード0及び1は、PLANAR及びDC予測のために予約されていることから、追加された方向は、-1、-2、...などとしてインデックス付けされている。
【0037】
二次対角線の方向は、ブロックの形状に依存していることから、利用される広角度の合計数は、ブロックの形状に依存している。表2は、異なるブロック形状において広角度モードによって置換される通常モードの数を示している。
【0038】
【表2】
【0039】
任意のターゲットブロックの場合に、置換された通常モードから広角度モードへのマッピングは、以下のように実行されている。
modeShift[5] = {0, 6, 10, 12, 14};
ratio = Abs(Log2(W/H))
if W > H and 1 < predMode < 2 + modeShift[ratio]
predMode = predMode + 65;
else if H > W and (66 - modeShift[ratio]) < predMode <= 66
predMode = predMode - 67;
【0040】
ISPの場合には、通常モードから広角度モードへのマッピングは、サブパーティションの高さ及び幅ではなく、親CUの高さ及び幅を使用して実行されている。新しいモードが広角度モードであるのか又は通常モードであるのかとは無関係に、同一のモードが、それぞれのサブパーティションにおける予測のために使用されている。図7には、これが例によって示されている。
【0041】
以上において示されているように、WAIPを伴うISPに対する現時点の方式は、親CUのアスペクト比から予測角度を判定し及びこれをそれぞれのサブパーティションにおける予測のために使用するというものである。サブパーティションが、順番に、但し、独立的に、処理されていることから、この制約は、必ずしも拘束的なものではない。個々のサブパーティション処理から結果的にもたらされる第2の問題は、いくつかの基準サンプルの利用不能性であり、これは、特定の方向において予測に影響しうる。本発明者らは、以下において、これらの問題に対する2つの解決策を提供する。
【0042】
一般性を目的として、以下において、本発明者らは、幅W及び高さHを有する矩形ブロックを仮定することとする。正方形ターゲットブロックは、W=Hを有する特別なケースである。
【0043】
イントラサブパーティション用のWAIP
ISPを伴うブロックの場合に、現時点のVTMコード(VTM4.0)は、通常の順序において、それぞれのサブパーティションを個々に処理している。予測プロセスにおいて、予測ツールは、まず、パーティションの最上位におけるサンプルの1つの基準アレイを生成し及び左におけるサンプルの1つの基準アレイを生成している。ISPスプリットが水平方向である場合には、最上位における基準アレイは、以前のサブパーティションの最後の行内のデコーディング済みのサンプルを使用して構築されている。同様に、ISPスプリットが垂直方向である場合には、左における基準アレイは、以前のサブパーティションの最後の列内のデコーディング済みのサンプルを使用して構築されている。図8には、これが示されている。
【0044】
現時点のVTMコードは、親CUに必要とされているものから、それぞれのパーティションごとに基準アレイのサイズを判定している。本発明者らは、サブパーティションの寸法から予測方向を判定することを提案している。実装における利点として、本発明者らは、パーティションの寸法からパーティションの基準アレイの長さを判定することをも提案している。
【0045】
及びHがそれぞれのパーティションの幅及び高さを表記しているとしよう。この結果、最上位及び左における基準アレイの長さは、最上位-左ピクセルを排除することにより、それぞれ、2*W及び2*Hとして判定される。
【0046】
任意のサブパーティションの場合に、図9に示されているように、通常モードから広角度モードへのマッピングは、以下のように実行されている。
modeShift[5] = {0, 6, 10, 12, 14};
whRatio = Abs(Log2(Wp/Hp))
if Wp > Hp and 1 < predMode < 2 + modeShift[whRatio]
predMode = predMode + 65;
else if Hp > Wp and (66 - modeShift[whRatio]) < predMode <= 66
predMode = predMode - 67;
【0047】
上述のマッピングは、サブパーティションのアスペクト比が表2において付与されている有効な範囲内にある限り、有効である。Wp/Hp>16又はWp/Hp<1/16である場合には、本発明者らは、VTMにおいて実行されているように、広角度導出のために親CU寸法を使用することを提案する。
【0048】
上述の方法の単純な一変形において、サブパーティションが正方形の形状を有する場合には、即ち、Wp=Hpである場合には、通常の予測モードが適用され、さもなければ、広角度が、CUの寸法を使用して取得される。この単純化は、正方形のサブパーティションに対する(親矩形CUから導出された)広角度予測モードの使用を回避することになる。換言すれば、広角度は、サブパーティションが正方形である場合にのみサブパーティション寸法から導出され、その他の場合には、これらは、CU寸法から導出されている。正方形形状の場合には、広角度が存在していないことから、これは、正方形サブパーティションの場合には広角度導出を有しておらず及び矩形サブパーティションの場合には広角度導出を保全することと等価である。また、これは、以下の実施形態1においても提示されている。
【0049】
ISPにおけるすべてのサブパーティションは、等しい寸法を有していることから、1つのサブパーティションについて演算された広角度モードは、すべてのサブパーティションについて同一である。
【0050】
消失基準サンプルの置換
ISPに対する第2の改善は、親CUの最上位又は左からの基準サンプルを使用するという点にある。ここでは、サブパーティションがVTM4.0と同様に通常の順序において処理されるものと仮定しよう。水平方向スプリットの場合に、サブパーティション2以上の最上位基準サンプルは、以前のサブパーティションからのデコーディング済みのピクセルを使用している。以前のパーティションは、親CUと同一の幅を有していることから、最上位右基準サンプルは、単に利用不能である。現時点のVTMコーデックは、このケースにおいては、パディングを使用することになり、この場合には、利用可能である最後の基準ピクセルが、長さWの最上位-右部分を通じて反復されることになる。図10には、これが、2つのサブパーティションのケースについて示されている。同様のケースは、最下位左基準サンプルがサブパーティション2以降において消失することになる垂直方向スプリットにおいても当て嵌まる。このケースにおいて、現時点のVTMコーデックは、パディングを使用することになり、この場合には、利用可能である最後の基準ピクセルが、長さHの最下位-左部分を通じて反復されることになる。
【0051】
これらの消失基準サンプルは、2つのサブパーティションへの水平方向スプリットについて図11に示されているように、親CUの最上位基準から置換することができる。即ち、消失サンプルは、予測方向を踏襲して、対応する親CUの基準アレイからマッピングされている。置換プロセスの後においても、いくつかの基準サンプルが依然として消失している場合には、通常のパディングプロセスを適用することが可能であり、この場合には、最後の基準サンプルが、基準アレイを充填するべく反復されることになる。
【0052】
予測方向を踏襲して対応する親CUの基準アレイからマッピングされた消失サンプルは、予測と同一の補間プロセス(線形、4-タップ...)を使用することができる。また、複雑さを低減するべく、最も近い隣接部分を使用することもできる(補間なし)。最後のケースにおいては、これは、予測角度に対応するピクセルの数だけ基準サンプルをシフトさせることに対応している。
【0053】
この基準サンプル置換のプロセスは、ピクセルが親CUの最上位基準から複写されている位置において強度不連続性を生成しうるという望ましくない結果を有する。この結果を軽減するべく、単純な低域通過フィルタを使用することができる。例えば、本発明者らは、3-タップフィルタ[1 2 1]/4を使用することができる。
【0054】
図8においては、最上位基準上のマッピングされたサンプルが、予測方向に沿って配置されている。別の方法は、CUのすべての最上位右基準サンプルを第2又はこれ以降のサブパーティションの最上位右基準サンプル上に複写し、この後に、不連続性を軽減するべく最上位コーナーにおいて低域通過フィルタリングを実行するというものである。図12には、これが示されている。
【0055】
この置換プロセスは、以前の節におけるWAIP変更が適用されるかどうかとは無関係である。これは、それぞれのサブパーティションごとのWAIP変更を伴うことなしに適用することが可能であり、或いは、これと共に適用することもできる。
【0056】
以下においては、本発明者らは、ISP及びWAIPが適用されている任意の一般的なビデオコーデックを仮定している。VTMコーデックは、このようなコーデックの一例である。
【0057】
実施形態1:この実施形態において、ターゲットブロックがISPにおいてスプリッティングされている場合には、任意の予測モードにおいて、本発明者らは、サブパーティションが正方形形状を有していない限り、親CUの寸法を使用して広角度を判定している。サブパーティションが正方形形状を有している場合には、広角度へのマッピングを伴うことなしに、通常の予測モードがこれらに適用されている。すべてのその他のコーデックパラメータは、VTM4におけると同様に、不変の状態に留まっている。
【0058】
実施形態2:この実施形態においては、ターゲットブロックがISPにおいてスプリッティングされている場合には、任意の予測モードにおいて、本発明者らは、VTM4におけると同様に、親CUの寸法を使用して広角度を判定している。但し、第2サブパーティション以降から、本発明者らは、水平方向(垂直方向)スプリットの場合に親CUの最上位(左)基準アレイから最上位右(最下位左)の消失基準サンプルを置換している。最上位(左)基準アレイ上の基準サンプルは、図11におけると同様に、予測方向に沿って配置されている。すべてのその他のコーデックパラメータは、VTM4におけると同様に、不変の状態に留まっている。
【0059】
実施形態3:この実施形態においては、ターゲットブロックがISPにおいてスプリッティングされている場合には、任意の予測モードにおいて、本発明者らは、VTM4におけると同様に、親CUの寸法を使用して広角度を判定している。但し、第2サブパーティション以降から、本発明者らは、水平方向(垂直方向)スプリットの場合に親CUの最上位(左)基準アレイから最上位右(最下位左)の消失基準サンプルを置換している。最上位(左)基準アレイ上の基準サンプルは、図12におけると同様に、第2サブパーティション以降の場合に基準アレイの最上位-右(最下位左)部分上に直接的に複写されている。すべてのその他のコーデックパラメータは、VTM4.0におけると同様に、不変の状態に留まっている。
【0060】
実施形態4:この実施形態においては、ターゲットブロックがISPにおいてスプリッティングされている場合には、任意の予測モードにおいて、本発明者らは、サブパーティションが正方形形状を有していない限り、親CUの寸法を使用して広角度を判定している。サブパーティションが正方形形状を有している場合には、広角度へのマッピングを伴うことなしに、通常の予測モードがこれらに対して適用されている。これに加えて、第2サブパーティション以降から、本発明者らは、水平方向(垂直方向)スプリットの場合に親CUの最上位(左)基準アレイから最上位右(最下位左)の消失基準サンプルを置換している。基準サンプルマッピングは、実施形態2又は実施形態3におけると同様に実行されている。すべてのその他のコーデックパラメータは、VTM4.0におけると同様に、不変の状態に留まっている。
【0061】
実施形態5:この実施形態においては、ターゲットブロックがISPにおいてスプリッティングされている場合には、任意の予測モードにおいて、本発明者らは、親CUの寸法ではなく、サブパーティションの寸法を使用して広角度を判定している。サブパーティションの幅対長さ比率(Wp/Hp)が16超であるか又は1/16未満である場合には、本発明者らは、広角度を演算するべく親CUのW/H比率を使用することになり、これをすべてのサブパーティションに使用することになる。これに加えて、第2サブパーティション以降から、本発明者らは、水平方向(垂直方向)スプリットの場合に親CUの最上位(左)基準アレイから最上位右(最下位左)の消失基準サンプルを置換している。最上位(左)基準アレイ上の基準サンプルは、図11におけると同様に、予測方向に沿って配置されている。すべてのその他のコーデックパラメータは、VTM4.0におけると同様に、不変の状態に留まっている。予測ステップをスピードアップするべく、基準アレイは、親CUの寸法の2倍ではなく、その寸法の2倍だけ、サブパーティションについて使用することができる。CU寸法を使用する際には、オリジナルの基準アレイ長を保全することができる。
【0062】
実施形態6:この実施形態において、ターゲットブロックがISPにおいてスプリッティングされている場合には、任意の予測モードにおいて、本発明者らは、親CUの寸法ではなく、サブパーティションの寸法を使用して広角度を判定している。サブパーティションの幅対高さ比率(Wp/Hp)が16超であるか又は1/16未満である場合には、本発明者らは、広角度を演算するべく親CUのW/H比率を使用することになり、これをすべてのサブパーティションについて使用することになる。これに加えて、第2サブパーティション以降から、本発明者らは、水平方向(垂直方向)スプリットの場合に親CUの最上位(左)基準から最上位右(最下位左)の消失基準サンプルを置換している。最上位(左)基準アレイ上の基準サンプルは、図12におけると同様に、第2サブパーティション以降の場合に基準アレイの最上位右(最下位左)部分上に直接的に複写されている。すべてのその他のコーデックパラメータは、VTM4.0におけると同様に、不変の状態に留まっている。予測ステップをスピードアップするべく、基準アレイは、親CUの寸法の2倍ではなく、その寸法の2倍だけ、サブパーティションについて使用することができる。CU寸法を使用する際には、オリジナルの基準アレイ長さを保全することができる。
【0063】
実施形態7:VTM4.0は、それぞれのサブパーティションが16個のピクセルという最小値を有していなければならないという条件の下に、2又は4個のサブパーティションを有するISPを使用している。本実施形態において、本発明者らは、これらの制約を緩和し、それぞれのサブパーティションが、少なくとも単一の行又は単一の列でありうるという条件の下に、ISPをすべてのブロック形状に適用している。また、CUサイズに応じて、CU内のサブパーティションの数も、8又は16又は32などのように、更に大きくなりうる。すべてのサブパーティションは、水平方向又は垂直方向スプリットとは無関係に、形状において同一となるように制約されている。サブパーティションの幅対高さ比率(Wp/Hp)が16超であるか又は1/16未満である場合には、本発明者らは、広角度を演算するべく親CUのW/H比率を使用することになり、これをすべてのサブパーティションについて使用することになる。第2サブパーティション以降から、本発明者らは、水平方向(垂直方向)スプリットの場合に親CUの最上位(左)基準から最上位右(最下位左)の消失基準サンプルを置換している。消失サンプルのマッピングは、実施形態2又は実施形態3におけると同様に実行されている。
【0064】
実施形態8:この実施形態においては、本発明者らは、すべてのサブパーティションが同一の形状を有していなければならないという制約を緩和している。サブパーティションは、等しくない形状を有しうるが、2の累乗としての高さ及び幅を有するべく制約されている。従って、サブパーティションの数は、実施形態1~7におけると同様に2の累乗である必要はない。例えば、8×8ブロックは、サイズ4×8、2×8、及び2×8という3つのパーティションにスプリッティングすることができる。相応して、実施形態1~7の任意のものを変更することができる。
【0065】
実施形態9:VTM4.0は、MRLを使用していないブロックに対してISPを使用している。この実施形態においては、本発明者らは、この制約を緩和している。一般的なケースにおいて、ISPは、CUが複数の基準ラインを使用している場合にも適用することができる。一変形において、スプリットが水平方向であり及び予測方向が垂直方向である場合には、或いは、スプリットが垂直方向であり及び予測方向が水平方向である場合には、第1サブパーティションのみがMRLを使用しうる。別の変形においては、すべてのサブパーティションは、スプリットタイプ及び予測方向とは無関係にMRLを使用することができる。すべてのこれらの変形において、本発明者らは、サブパーティションの広角度を演算するべく及び/又は第2サブパーティション以降から消失基準サンプルをマッピングするべく、実施形態1~8の任意のものを使用することができる。
【0066】
実施形態10:VTM4.0は、ルマコンポーネントに対してのみISPを使用している。この実施形態において、本発明者らは、この制約を緩和しており、実施形態1~9の任意のものをルマ及びクロマコンポーネントの両方に適用している。
【0067】
VTM4.0基準ソフトウェアにおける変更を内蔵することにより、提案されているISPを有する広角度モード導出を実施形態1におけると同様に実装した。全イントラ(AI:All-Intra)構成の下に、JVET試験シーケンスからの1つのフレームにより、試験を実行した。表3には、VTM4.0アンカー結果との関係における試験された方法のBDレート性能が示されている。なんらの追加のエンコーダ又はデコーダの複雑さを伴うことなしに、ルマBDレートが0.04%だけ改善していることを観察されたい。クラスC及びクラスEシーケンスにおける利得は、ルマの場合に0.11%であり、注目に値する。
【0068】
【表3】
【0069】
本明細書において記述されている一般的な態様は、広角度導出を変更することにより及び親CUの基準サンプルからのものによっていくつかのサブパーティション用の消失基準サンプルを置換することにより、ISPにおけるイントラ予測効率を改善することを狙いとしている。利点の1つは、大きな更なる複雑さを伴うことのない相対的に高い圧縮効率である。
【0070】
図13には、本明細書において記述されている一般的な態様を使用してビデオデータのブロックをエンコーディングする方法1300の一実施形態が示されている。方法は、開始ブロック1301において開始しており、制御は、サブパーティションの寸法の比率が特定の範囲内にある際にはサブパーティションの寸法に基づいて、及びサブパーティションの寸法の比率が特定の範囲外にある際にはビデオブロックの寸法に基づいて、ビデオブロックの矩形サブパーティションのイントラ予測方向を判定する機能ブロック1310に進んでいる。次いで、制御は、ブロック1310から、ビデオブロックの上方右又は下方左からの基準サンプルをビデオブロックのサブパーティションの予測のための上方右又は下方左基準サンプルとしてマッピングするブロック1320に進んでいる。制御は、ブロック1320から、ビデオブロックの上方の行からの基準サンプル又はビデオブロックの左の列からの基準サンプルを使用して矩形サブパーティションのサンプルを予測するブロック1330に進んでおり、この場合に、ビデオブロックの上方の行又はビデオブロックの左の列内の基準サンプルの数は、矩形サブパーティションの寸法に基づいて判定されている。制御は、ブロック1330から、イントラコーディングモードにおいて予測を使用してビデオブロックをエンコーディングするブロック1340に進んでいる。
【0071】
図14には、本明細書において記述されている一般的態様を使用してビデオデータのブロックをデコーディングする方法1400の一実施形態が示されている。方法は、開始ブロック1401において始まっており、及び制御は、サブパーティションの寸法の比率が特定の範囲内にある際にはサブパーティションの寸法に基づいて、及びサブパーティションの寸法の比率が特定の範囲外にある際にはビデオブロックの寸法に基づいて、ビデオブロックの矩形サブパーティションのイントラ予測方向を判定する機能ブロック1410に進んでいる。次いで、制御は、ブロック1410から、ビデオブロックの上方右又は下方左からの基準サンプルをビデオブロックのサブパーティションの予測のための上方右又は下方左基準サンプルとしてマッピングするブロック1420に進んでいる。制御は、ブロック1420から、ビデオブロックの上方の行からの基準サンプル又はビデオブロックの左の列からの基準サンプルを使用して矩形サブパーティションのサンプルを予測するブロック1430に進んでおり、この場合に、ビデオブロックの上方の行又はビデオブロックの左の列内の基準サンプルの数は、矩形サブパーティションの寸法に基づいて判定されている。制御は、ブロック1430から、イントラコーディングモードにおける予測を使用してビデオブロックをエンコーディングするブロック1440に進んでいる。
【0072】
図15は、ビデオデータのブロックをエンコーディング又はデコーディングする装置1500の一実施形態を示している。装置は、プロセッサ1510を有しており、少なくとも1つのポートを通じてメモリ1520に相互接続することができる。また、プロセッサ1510及びメモリ1520の両方は、外部接続に対する1つ又は複数の更なる相互接続を有することもできる。
【0073】
プロセッサ1510は、サブパーティションを伴うイントラ予測モードを使用することにより、サブパーティションを有するイントラ予測モードを使用してビデオデータのブロックをエンコーディング又はデコーディングすることにより、ビデオデータをエンコーディング又はデコーディングするように構成されている。
【0074】
記述されている一般的な態様は、サブパーティションを有するイントラ予測及びこれらのモードに必要とされる必要な変更を通じてイントラ予測効率を改善することを狙いとしている。利点は、多くの更なる複雑さを伴うことのない相対的に高い圧縮効率である。
【0075】
本出願は、ツール、特徴、実施形態、モデル、方式、などを含む様々な態様について記述している。これらの態様の多くは、専門性を伴って記述されており、個々の特性を少なくとも示すべく、しばしば、限定のように解釈されうる方式によって記述されている。但し、これは、説明におけるわかりやすさを目的としたものであり、その態様の適用又は範囲を限定するものではない。実際に、更なる態様を提供するべく、異なる態様のすべてを組み合わせることが可能であり及び相互交換することができる。更には、態様は、同様に、先行する出願において記述されている態様と組み合わせることも可能であり及び相互交換することもできる。
【0076】
本出願において記述及び想定されている態様は、多くの異なる形態において実装することができる。図16図17、及び図18は、いくつかの実施形態を提供しているが、その他の実施形態も想定されており、図16図17、及び図18の説明は、実装形態の幅を限定するものではない。態様の少なくとも1つは、一般に、ビデオエンコーディング及びデコーディングに関し、少なくとも1つのその他の態様は、一般に、生成又はエンコーディングされたビットストリームの送信に関する。これらの及びその他の態様は、方法、装置、記述されている方法の任意のものに従ってビデオデータをエンコーディング又はデコーディングするための命令をその上部において保存したコンピュータ可読ストレージ媒体、及び/又は、記述されている方法の任意のものに従って生成されたビットストリームをその上部において保存したコンピュータ可読ストレージ媒体として実装することができる。
【0077】
本出願において、「再構築される(reconstructed)」及び「デコーディングされる(decoded)」という用語は、相互交換可能に使用されてもよく、「ピクセル」及び「サンプル」という用語は、相互交換可能に使用されてもよく、「画像」、「ピクチャ」、及び「フレーム」という用語は、相互交換可能に使用されてもよい。通常は、但し、必須ではないが、「再構築される」という用語は、エンコーダ側において使用されている一方で、「デコーディングされる」は、デコーダ側において使用されている。
【0078】
様々な方法が本明細書において記述されており、方法のそれぞれは、記述されている方法を実現するための1つ又は複数のステップ又はアクションを有する。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされていない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、変更されてもよく或いは組み合わせられてもよい。
【0079】
本出願において記述されている様々な方法及びその他の態様は、例えば、図16図17、及び図18に示されているビデオエンコーダ100及びデコーダ200のイントラ予測、エントロピーコーディング、及び/又はデコーディングモジュール(160、360、145、330)などのモジュールを変更するべく使用される。更には、本態様は、VVC又はHEVCに限定されるものではなく、例えば、既存のものであるのか又は将来開発されるものであるのかを問わず、その他の規格及び推奨並びに任意のそのような規格及び推奨(VVC及びHEVCを含む)の拡張版に適用することができる。そうではない旨が示されていない限り或いは技術的に排除されていない限り、本出願において記述されている態様は、個々に又は組合せにおいて使用することができる。
【0080】
本出願においては、様々な数値が使用されている。特定の値は、例えば、目的であり、記述されている態様は、これらの特定の値に限定されるものではない。
【0081】
図16は、エンコーダ100を示している。このエンコーダ100の変形が想定されるが、すべての予想される変形を記述することなしに、わかりやすさを目的として、以下、このエンコーダ100について説明する。
【0082】
エンコーディングされる前に、ビデオシーケンスは、例えば、(例えば、色成分の1つのもののヒストグラム等化を使用して)圧縮に対して相対的に回復力を有する信号分布を得るべく、入力カラーピクチャに対する色変換(例えば、RGB4:4:4からYCbCr4:2:0への変換)の適用又は入力されたピクチャコンポーネントのリマッピングの実行などの事前エンコーディング処理(101)を経験しうる。メタデータを前処理と関連付けることが可能であり及びビットストリームに添付することができる。
【0083】
エンコーダ100においては、ピクチャが、後述するように、エンコーダ要素によってエンコーディングされている。エンコーディング対象のピクチャは、パーティション化され(102)、例えば、CUを単位として処理されている。それぞれの単位は、例えば、イントラ又はインターモードを使用してエンコーディングされている。1つの単位がイントラモードにおいてエンコーディングされる際には、これは、イントラ予測(160)を実行している。インターモードにおいては、モーション推定(175)及び補償(170)が実行されている。エンコーダは、その単位のエンコーディングのために使用するべきイントラ又はインターモードの1つを決定し(105)、例えば、予測モードフラグにより、イントラ/インター決定を通知している。例えば、オリジナル画像ブロックから予測されたブロックを減算する(110)ことにより、予測残差が算出されている。
【0084】
次いで、予測残差が、変換(125)され且つ量子化(130)されている。ビットストリームを出力するべく、量子化された変換係数のみならず、モーションベクトル及びその他の構文要素がエントロピーコーディングされている(145)。エンコーダは、変換をスキップすることが可能であり、且つ量子化を変換されていない残差信号に対して直接的に適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることが可能であり、即ち、残差が、変換又は量子化プロセスの適用を伴うことなしに、直接的にコーディングされている。
【0085】
エンコーダは、更なる予測のための基準を提供するべくエンコーディングされたブロックをデコーディングしている。予測残差をデコーディングするべく、量子化された変換係数が逆量子化され(140)且つ逆変換されている(150)。デコーディングされた予測残差及び予測されたブロックを組み合わせること(155)により、画像ブロッが再構築されている。例えば、エンコーディングアーチファクトを低減するべく、例えば、デブロッキング/SAO(Sample Adaptive Offset)フィルタリングを実行するべく、インループフィルタ(165)が、再構築済みのピクチャに適用されている。フィルタリング済みの画像は、基準ピクチャバッファ(180)内において保存されている。
【0086】
図17は、ビデオデコーダ200のブロック図を示している。デコーダ200において、ビットストリームは、後述するように、デコーダ要素によってデコーディングされている。ビデオデコーダ200は、一般に、図16において記述されているように、エンコーディングパスとは逆であるデコーディングパスを実行している。また、エンコーダ100は、一般に、ビデオデータのエンコーディングの一部としてビデオデコーディングを実行している。
【0087】
具体的には、デコーダの入力は、ビデオエンコーダ100によって生成されうるビデオビットストリームを含む。ビットストリームは、まず、変換係数、モーションベクトル、及びその他のコーディング済みの情報を得るべく、エントロピーデコーディングされている(230)。ピクチャパーティション情報は、ピクチャがパーティション化される方式を示している。従って、デコーダは、デコーディング済みのピクチャパーティション化情報に従ってピクチャを分割している(235)。予測残差をデコーディングするべく、変換係数が逆量子化され(240)且つ逆変換されている(250)。デコーディング済みの予測残差及び予測されたブロックを組み合わせることにより(255)、画像ブロックが再構築されている。予測されたブロックは、イントラ予測(260)又はモーション補償された予測(即ち、インター予測)(275)から取得することができる(270)。インループフィルタ(265)が再構築済みの画像に適用されている。フィルタリング済みの画像は、基準ピクチャバッファ(280)において保存されている。
【0088】
デコーディング済みのピクチャは、例えば、逆色変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)又は事前エンコーディング処理(101)において実行されたリマッピングプロセスの逆を実行する逆リマッピングなどの事後デコーディング処理(285)を更に経験しうる。事後デコーディング処理は、事前エンコーディング処理において導出された及びビットストリーム内においてシグナリングされたメタデータを使用することができる。
【0089】
図18は、様々な態様及び実施形態が実装されるシステムの一例のブロック図を示している。システム1000は、後述する様々なコンポーネントを含む装置として実施することが可能であり、本明細書において記述されている態様の1つ又は複数を実行するように構成されている。このような装置の例は、限定を伴うことなしに、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受像機、パーソナルビデオレコーディングシステム、接続されたホームアプライアンス、及びサーバーなどの様々な電子装置を含む。システム1000の要素は、単独で又は組合せにおいて、単一集積回路(IC)、複数のIC、及び/又は個別コンポーネントにおいて実施することができる。例えば、少なくとも1つの実施形態において、システム1000の処理及びエンコーダ/デコーダ要素は、複数のIC及び/又は個別コンポーネントに跨って分散されている。様々な実施形態において、システム1000は、例えば、通信バスを介して或いは専用の入力及び/又は出力ポートを通じて1つ又は複数のその他のシステム又はその他の電子装置に通信自在に結合されている。様々な実施形態において、システム1000は、本明細書において記述されている態様の1つ又は複数を実装するように構成されている。
【0090】
システム1000は、例えば、本明細書において記述されている様々な態様を実装するべくその内部において読み込まれた命令を実行するように構成された少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、当技術分野において既知の埋め込み型のメモリ、入出力インターフェイス、及び様々なその他の回路を含みうる。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリ装置及び/又は不揮発性メモリ装置)を含む。システム1000は、ストレージ装置1040を含み、これは、限定を伴うことなしに、電気的に消去可能なプログラム可能な読み出し専用メモリ(EEPROM)、読み出し専用メモリ(ROM)、プログラム可能な読み出し専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブを含む不揮発性メモリ及び/又は揮発性メモリを含みうる。ストレージ装置1040は、非限定的な例として、内部ストレージ装置、装着されたストレージ装置(着脱自在及び非着脱自在のストレージ装置を含む)、及び/又はネットワークアクセス可能ストレージ装置を含みうる。
【0091】
システム1000は、例えば、エンコーディング済みのビデオ又はデコーディング済みのビデオを提供するべくデータを処理するように構成されたエンコーダ/デコーダモジュール1030を含み、エンコーダ/デコーダ1030は、その独自のプロセッサ及びメモリを含みうる。エンコーダ/デコーダ1030は、エンコーディング及び/又はデコーディング機能を実行するべく装置内において含まれうる1つ又は複数のモジュールを表している。既知のように、装置は、エンコーディング及びデコーディングモジュールの1つ又は両方を含みうる。これに加えて、エンコーダ/デコーダモジュール1030は、システム1000の別個の要素として実装することも可能であり、或いは、当業者に既知であるようにハードウェア及びソフトウェアの組合せとしてプロセッサ1010内において内蔵することもできる。
【0092】
本明細書において記述されている様々な態様を実行するべくプロセッサ1010又はエンコーダ/デコーダ1030上に読み込まれるプログラムコードは、ストレージ装置1040内において保存することが可能であり、プロセッサ1010による実行のためにメモリ1020上に後から読み込むことができる。様々な実施形態によれば、プロセッサ1010、メモリ1020、ストレージ装置1040、及びエンコーダ/デコーダモジュール1030の1つ又は複数は、本明細書において記述されているプロセスの稼働の際に様々な項目の1つ又は複数を保存することができる。このような保存された項目は、限定を伴うことなしに、入力ビデオ、デコーディング済みのビデオ又はデコーディング済みのビデオの一部分、ビットストリーム、行列、変数、及び式、定式、動作、及び動作ロジックの処理から結果的に得られる中間又は最終的結果を含みうる。
【0093】
いくつかの実施形態において、プロセッサ1010及び/又はエンコーダ/デコーダモジュール1030の内側のメモリは、命令を保存するべく且つエンコーディング又はデコーディングにおいて必要とされる処理用のワーキングメモリを提供するべく使用されている。但し、その他の実施形態においては、処理装置(例えば、処理装置は、プロセッサ1010又はエンコーダ/デコーダモジュール1030でありうる)の外部のメモリが、これらの機能の1つ又は複数のために使用されている。外部メモリは、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリなどのメモリ1020及び/又はストレージ装置1040であってよい。いくつかの実施形態において、外部不揮発性フラッシュメモリは、例えば、テレビのオペレーティングシステムを保存するべく使用されている。少なくとも1つの実施形態において、RAMなどの高速外部ダイナミック揮発性メモリは、MPEG-2(MPEGは、Moving Picture Experts Groupを意味し、MPEG-2は、また、ISO/IEC13818とも呼称され、また、13818-1は、H.222とも呼称され、13818-2は、また、H.262とも呼称されている)、HEVC(HEVCは、High Efficiency Video Codingを意味し、また、H.265及びMPEG-H Part2とも呼称されている)、或いは、VVC(多用途ビデオコーディングであり、新しい規格がJoint Video Experts Team(JVET)によって開発中である)などのビデオコーディング及びデコーディング動作のためのワーキングメモリとして使用されている。
【0094】
システム1000の要素に対する入力は、ブロック1130において示されている様々な入力装置を通じて提供することができる。このような入力装置は、限定を伴うことなしに、(i)例えば、ブロードキャスタによって無線で送信されたRF信号を受け取る高周波(RF)部分、(ii)コンポーネント(COMP)入力端末(或いは、COMP入力端末の組)、(iii)ユニバーサルシリアルバス(USB)入力端末、及び/又は(iv)高精細マルチメディアインターフェイス(HDMI)入力端末を含む。図18に示されていないその他の例は、コンポジットビデオを含む。
【0095】
様々な実施形態において、ブロック1130の入力装置は、当技術分野において既知である関連する個々の入力処理要素を有する。例えば、RF部分は、(i)望ましい周波数を選択すること(また、信号を選択すること、或いは、信号を周波数の帯域に帯域制限すること)、(ii)選択された信号をダウンコンバージョンすること、(iii)(例えば)特定の実施形態においてチャネルと呼称されうる信号周波数帯域を選択するべく、再度周波数の狭い帯域に帯域制限すること、(iv)ダウンコンバージョンされた及び帯域限定された信号を復調すること、(v)エラー補正を実行すること、並びに、(vi)データパケットの望ましいストリームを選択するべく逆多重化することに適した要素と関連付けることができる。様々な実施形態のRF部分は、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー補正器、及びデマルチプレクサなどの、これらの機能を実行するための1つ又は複数の要素を含む。RF部分は、例えば、受け取られた信号を相対的に低い周波数(例えば、中間周波数又はベースバンドに近い周波数)に又はベースバンドにダウンコンバージョンすることを含むこれらの機能の様々なものを実行するチューナを含みうる。1つのセットトップボックス実施形態において、RF部分及びその関連する入力処理要素は、有線(例えば、ケーブル)媒体上において送信されるRF信号を受け取り、再度、望ましい周波数帯域にフィルタリング、ダウンコンバージョン、及びフィルタリングすることにより、周波数選択を実行している。様々な実施形態は、上述の(並びに、その他の)要素を再構成し、これらの要素のいくつかを除去し、及び/又は類似の又は異なる機能を実行するその他の要素を追加している。要素の追加は、例えば、増幅器及びアナログ-デジタルコンバータの挿入などの要素を既存の要素の間において挿入することを含みうる。様々な実施形態において、RF部分は、アンテナを含む。
【0096】
これに加えて、USB及び/又はHDMI端子は、USB及び/又はHDMI接続に跨ってシステム1000をその他の電子装置に接続するための個々のインターフェイスプロセッサを含みうる。例えば、例えば、必要に応じて、別個の入力処理IC内において又はプロセッサ1010内において、リード・ソロモンエラー補正などの入力処理の様々な態様を実装しうることを理解されたい。同様に、必要に応じて、別個のインターフェイスIC内において又はプロセッサ1010内においてUSB又はHDMIインターフェイス処理の態様を実装することもできる。復調された、エラー補正された、及び逆多重化されたストリームは、例えば、出力装置上における提示のために必要に応じてデータストリームを処理するべくメモリ及びストレージ要素との組合せにおいて稼働しているプロセッサ1010及びエンコーダ/デコーダ1030を含む様々な処理要素に提供されている。
【0097】
システム1000の様々な要素は、統合されたハウジング内において提供することができる。統合されたハウジング内において、様々な要素は、相互接続することが可能であり例えば、インターIC(I2C)バス、配線、及び印刷回路基板を含む当技術分野において既知の内部バスなどの適切な接続構成を使用してその間においてデータを送信することができる。
【0098】
システム1000は、通信チャネル1060を介したその他の装置との間の通信を可能にする通信インターフェイス1050を含む。通信インターフェイス1050は、限定を伴うことなしに、通信チャネル1060上においてデータを送信し且つ受け取るように構成されたトランシーバを含みうる。通信インターフェイス1050は、限定を伴うことなしに、モデム又はネットワークカードを含むことが可能であり、通信チャネル1060は、例えば、有線及び/又は無線媒体内において実装することができる。
【0099】
データは、様々な実施形態において、例えば、IEEE802.11(IEEEは、Institute of Electrical and Electronics Engineersを意味している)などのWi-Fiネットワークなどの無線ネットワークを使用してシステム1000にストリーミングされているか又はその他の方法で提供されている。これらの実施形態のWi-Fi信号は、Wi-Fi通信用に適合された通信チャネル1060及び通信インターフェイス1050上において受け取られている。これらの実施形態の通信チャネル1060は、通常、ストリーミングアプリケーション及びその他のオーバーザトップ通信を許容するインターネットを含む外部ネットワークに対するアクセスを提供するアクセスポイント又はルーターに接続されている。その他の実施形態は、入力ブロック1130のHDMI接続上においてデータを供給するセットトップボックスを使用することにより、ストリーミングされたデータをシステム1000に提供している。更にその他の実施形態は、入力されたブロック1130のRF接続を使用することにより、ストリーミングされたデータをシステム1000に提供している。上述のように、様々な実施形態は、非ストリーミング方式により、データを提供している。これに加えて、様々な実施形態は、例えば、セルラーネットワーク又はBluetoothネットワークなどの、Wi-Fi以外の無線ネットワークをも使用している。
【0100】
システム1000は、ディスプレイ1100、スピーカ1110、及びその他の周辺装置1120を含む様々な出力装置に出力信号を提供することができる。様々な実施形態のディスプレイ1100は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、湾曲したディスプレイ、及び/又は折り畳み可能なディスプレイの1つ又は複数を含む。ディスプレイ1100は、テレビ、タブレット、ラップトップ、セル電話機(携帯電話機)、又はその他の装置用であってよい。また、ディスプレイ1100は、(例えば、スマートフォンにおけるように)その他のコンポーネントと統合することも可能であり、或いは、別個であってもよい(例えば、ラップトップ用の外部モニタ)。その他の周辺装置1120は、実施形態の様々な例において、スタンドアロンデジタルビデオディスク(又は、デジタルバーサタイルディスク)(両方の用語について、DVR)、ディスクプレーヤー、ステレオシステム、及び/又は照明システムの1つ又は複数を含む。様々な実施形態は、システム1000の出力に基づいて機能を提供する1つ又は複数の周辺装置1120を使用している。例えば、ディスクプレーヤーは、システム1000の出力を再生する機能を実行している。
【0101】
様々な実施形態において、制御信号は、ユーザー介入を伴って又は伴うことなしに装置間制御を可能にするAV.Link、消費者電子回路制御(CEC)、又はその他の通信プロトコルなどのシグナリングを使用することにより、システム1000とディスプレイ1100、スピーカ1110、又はその他の周辺装置1120の間において伝達されている。出力装置は、個々のインターフェイス1070、1080、及び1090を通じて専用の接続を介してシステム1000に通信自在に結合することができる。或いは、この代わりに、出力装置は、通信インターフェイス1050を介して通信チャネル1060を使用してシステム1000に接続することもできる。ディスプレイ1100及びスピーカ1110は、例えば、テレビなどの電子装置内において、システム1000のその他のコンポーネントと単一ユニット内において統合することができる。様々な実施形態において、ディスプレイインターフェイス1070は、例えば、タイミングコントローラ(T Con)チップなどのディスプレイドライバを含む。
【0102】
ディスプレイ1100及びスピーカ1110は、この代わりに、例えば、入力1130のRF部分が別個のセットトップボックスの一部分である場合には、その他のコンポーネントの1つ又は複数とは別個のものであってよい。ディスプレイ1100及びスピーカ1110が外部コンポーネントである様々な実施形態において、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む専用の出力接続を介して提供することができる。
【0103】
実施形態は、プロセッサ1010により、又はハードウェアにより、又はハードウェア及びソフトウェアの組合せにより、実装されたコンピュータソフトウェアによって実行することができる。非限定的な例として、実施形態は、1つ又は複数の統合された回路によって実装することができる。メモリ1020は、技術的環境に適する任意のタイプであることが可能であり、非限定的な例として、光メモリ装置、磁気メモリ装置、半導体に基づいたメモリ装置、固定されたメモリ、及び着脱自在のメモリなどの任意の適切なデータストレージ技術を使用して実装することができる。プロセッサ1010は、技術的環境に適した任意のタイプであることが可能であり、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、特殊目的コンピュータ、及びマルチコアアーキテクチャに基づいたプロセッサの1つ又は複数を包含しうる。
【0104】
様々な実装形態は、デコーディングを伴っている。本出願において使用されている「デコーディング」は、例えば、表示に適した最終出力を生成するべく受け取られたエンコーディング済みのシーケンスに対して実行されるプロセスのすべて又は一部分を包含しうる。様々な実施形態において、このようなプロセスは、例えば、エントロピーデコーディング、逆量子化、逆変換、及び差分デコーディングなどのデコーダによって通常実行されているプロセスの1つ又は複数を含む。更には、又はこの代わりに、様々な実施形態において、このようなプロセスは、本出願において記述されている様々な実装形態のデコーダによって実行されるプロセスをも含む。
【0105】
更なる例として、一実施形態においては、「デコーディング」は、エントロピーデコーディングのみを意味しており、別の実施形態においては、「デコーディング」は、差分デコーディングのみを意味しており、別の実施形態においては、「デコーディング」は、エントロピーデコーディング及び差分デコーディングの組合せを意味している。「デコーディングプロセス」というフレーズが、動作のサブセットを具体的に意味するべく意図されているのか、或いは、相対的に広いデコーディングプロセスを一般的に意味するべく意図されているのか、は、特定の記述のコンテキストに基づいて明らかとなり、当業者には、十分に理解されるものと考えられる。
【0106】
様々な実装形態は、エンコーディングを伴っている。「デコーディング」に関する上述の記述と同様に、本出願において使用されている「エンコーディング」は、例えば、エンコーディングされたビットストリームを生成するべく入力ビデオシーケンスに対して実行されるプロセスのすべて又は一部分を包含しうる。様々な実施形態において、このようなプロセスは、例えば、パーティション化、差分エンコーディング、変換、量子化、及びエントロピーエンコーディングなどのエンコーダによって通常実行されているプロセスの1つ又は複数を含む。更には、又はこの代わりに、様々な実施形態において、このようなプロセスは、本出願において記述されている様々な実装形態のエンコーダによって実行されるプロセスをも含む。
【0107】
更なる例として、一実施形態においては、「エンコーディング」は、エントロピーエンコーディングのみを意味しており、別の実施形態においては、「エンコーディング」は、差分エンコーディングのみを意味しており、別の実施形態においては、「エンコーディング」は、差分エンコーディング及びエントロピーエンコーディングの組合せを意味している。「エンコーディングプロセス」というフレーズが、具体的に動作のサブセットを意味するべく意図されているのか、或いは、相対的に広いエンコーディングプロセスを一般的に意味するべく意図されているのか、は、特定の記述のコンテキストに基づいて明らかとなり、当業者によって十分に理解されるものと考えられる。
【0108】
本明細書において使用されている構文要素は、記述的用語であることに留意されたい。従って、これらは、その他の構文要素名の使用を排除するものではない。
【0109】
図がフロー図として提示されている際には、これは、対応する装置のブロック図をも提供していることを理解されたい。また、同様に、図がブロック図として提示されている際には、これは、対応する方法/プロセスのフロー図をも提供していることを理解されたい。
【0110】
様々な実施形態は、パラメトリックモデル又はレート歪最適化を参照している場合がある。具体的には、エンコーディングプロセスにおいて、しばしば、演算複雑性の制約が付与された状態において、通常、レートと歪の間のバランス又はトレードオフが考慮されている。これは、レート歪最適化(RDO)メトリックを通じて、或いは、最小二乗平均(LMS)、絶対誤差の平均(MAE)、又はその他のこのような計測値を通じて、計測することができる。レート歪最適化は、通常、レート歪関数を極小化するものとして定式化され、これは、レート及び歪の重み付けされた合計である。レート歪最適化問題を解決するための異なる方式が存在している。例えば、方式は、コーディング及びデコーディングの後の再構築済みの信号のそのコーディング費用及び関係する歪の完全な評価を伴う、すべての検討されたモード又はコーディングパラメータ値を含むすべてのエンコーディング選択肢の集約的な試験に基づいたものであってよい。また、特に、再構築されたものではなく、予測又は予測残差信号に基づいた近似歪の演算に伴うエンコーディングの複雑さを低減するべく、相対的に高速な方式を使用することもできる。また、例えば、可能なエンコーディング選択肢のいくつかのみにおける近似歪又はその他のエンコーディング選択肢用の完全な歪を使用することにより、これら2つの方式の混合体を使用することもできる。その他の方式は、可能なエンコーディング選択肢のサブセットのみを評価している。更に一般的には、多くの方式は、最適化を実行するべく様々な技法の任意のものを利用しているが、最適化は、必ずしも、コーディング費用及び関係する歪の両方の完全な評価ではない。
【0111】
本明細書において記述されている実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。実装形態の単一の形態の文脈においてのみ記述されている(例えば、方法としてのみ記述されている)場合にも、記述されている特徴の実装形態は、その他の形態(例えば、装置又はプログラム)においても実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて実装することができる。例えば、方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラム可能なロジック装置を含む一般に処理装置を意味するプロセッサにおいて実装することができる。また、プロセッサは、例えば、コンピュータ、セル電話機、携帯型/パーソナルデジタルアシスタント(「PDA」)、及びエンドユーザーの間の情報の通信を促進するその他の装置などの通信装置を含む。
【0112】
「一実施形態(one embodiment)」又は「一実施形態(an embodiment)」又は「一実装形態(one implementation)」又は「一実装形態(an implementation)」のみならず、これらのその他の変形に対する参照は、実施形態との関連において記述されている特定の特徴、構造、特性、などが、少なくとも1つの実施形態において含まれていることを意味している。従って、本出願の全体を通じて様々な場所において出現する「一実施形態において」又は「一実施形態において」又は「一実装形態において」又は「一実装形態において」という句のみならず、任意のその他の変形は、必ずしも、すべてが同一の実施形態を参照しているものではない。
【0113】
これに加えて、本出願は、情報の様々な断片の「判定」を参照している場合がある。情報の判定は、例えば、情報の推定、情報の算出、情報の予測、又はメモリからの情報の取得の1つ又は複数を含みうる。
【0114】
更には、本出願は、情報の様々な断片に対する「アクセス」を参照している場合がある。情報にアクセスすることは、例えば、情報の受取り、(例えば、メモリから)情報の取得、情報の保存、情報の移動、情報の複写、情報の算出、情報の判定、情報の予測、又は情報の推定の1つ又は複数を含みうる。
【0115】
これに加えて、本出願は、情報の様々な断片の「受取り」を参照している場合がある。受け取ることは、「アクセス」することと同様に、広い用語となるべく意図されている。情報の受取りは、例えば、情報のアクセス又は(例えば、メモリからの)情報の取得の1つ又は複数を含みうる。更には、「受取り」は、通常、1つの又は別の方式により、例えば、情報の保存、情報の処理、情報の送信、情報の移動、情報の複写、情報の消去、情報の算出、情報の判定、情報の予測、又は情報の推定などの動作の際に伴っている。
【0116】
例えば、「A/B」、「A及び/又はB」、及び「A及びBの少なくとも1つ」のケースにおける「/」、「及び/又は」、及び「~の少なくとも1つ」の任意のものの使用は、第1の列挙された選択肢(A)のみの選択、又は第2の列挙された選択肢(B)のみの選択、或いは、両方の選択肢(A及びB)の選択を包含するべく意図されていることを理解されたい。更なる例として、「A、B、及び/又はC」及び「A、B、及びCの少なくとも1つ」のケースにおいて、このようなフレーズは、第1の列挙された選択肢(A)のみの選択、又は第2の列挙された選択肢(B)のみの選択、或いは、第3の列挙された選択肢(C)のみの選択、或いは、第1及び第2の列挙された選択肢(A及びB)のみの選択、或いは、第1及び第3の列挙された選択肢(A及びC)のみの選択、或いは、第2及び第3の列挙された選択肢(B及びC)のみの選択、或いは、すべての3つの選択肢(A及びB及びC)の選択を包含するべく意図されている。これは、当技術分野及び関係する技術分野における当業者には明らかなように、列挙されているものと同じ数の項目について拡張することができる。
【0117】
また、本明細書において使用される場合、「信号」という用語は、とりわけ、なにかを対応するデコーダに通知することを意味している。例えば、特定の実施形態において、エンコーダは、複数の変換、コーディングモード、又はフラグの特定の1つをシグナリングしている。この結果、一実施形態においては、同一の変換、パラメータ、又はモードは、エンコーダ側及びデコーダ側の両方において使用されている。従って、例えば、エンコーダは、デコーダが同一の特定のパラメータを使用しうるように、特定のパラメータをデコーダに送信することができる(明示的なシグナリング)。逆に、デコーダが既に特定のパラメータのみならず、その他のものをも有している場合には、シグナリングは、デコーダが特定のパラメータを認知し及び選択することを単純に許容するべく、送信を伴うことなしに使用することができる(黙示的なシグナリング)。任意の実際の機能の送信を回避することにより、ビットの節約が様々な実施形態において実現されている。シグナリングは、様々な方式で実現されうることを理解されたい。例えば、1つ又は複数の構文要素、フラグ、などが、様々な実施形態において、対応するデコーダに情報をシグナリングするべく使用されている。以上は、「信号」という用語の動詞の形態に関係している一方で、「信号」という用語は、名詞としても本明細書において使用されうる。
【0118】
当業者には明らかなように、実装形態は、例えば、保存又は送信されうる情報を搬送するべくフォーマッティングされた様々な信号を生成することができる。情報は、例えば、方法を実行するための命令又は記述されている実装形態の1つによって生成されたデータを含みうる。例えば、信号は、記述されている実施形態のビットストリームを搬送するべくフォーマッティングすることができる。このような信号は、例えば、(例えば、スペクトルの高周波数部分を使用する)電磁波として又はベースバンド信号としてフォーマッティングすることができる。フォーマッティングは、例えば、データストリームをエンコーディングすることと、エンコーディングされたデータストリームによって搬送波を変調することと、を含みうる。信号が搬送している情報は、例えば、アナログ又はデジタル情報であってよい。信号は、既知のように、様々な異なる有線又は無線リンク上において送信することができる。信号は、プロセッサ可読媒体上において保存することができる。
【0119】
本発明者らは、様々な請求項のカテゴリ及びタイプに跨って、いくつかの実施形態について記述している。これらの実施形態の特徴は、単独で又は任意の組合せにおいて提供することができる。更には、実施形態は、様々な請求項のカテゴリ及びタイプに跨って、単独で又は任意の組合せにおいて、以下の特徴、装置、又は態様の1つ又は複数を含みうる。
・イントラコーディングサブパーティションを有するイントラエンコーディング及びデコーディングを実行するためのプロセス又は装置
・複数の基準ラインを使用するイントラコーディングサブパーティションを有するイントラエンコーディング及びデコーディングを実行するためのプロセス又は装置
・イントラコーディングサブパーティション及び消失サンプル置換を有するイントラエンコーディング及びデコーディングを実行するためのプロセス又は装置
・イントラコーディングサブパーティション及び親ビデオブロックの上方の基準ピクセルのマッピングを有するイントラエンコーディング及びデコーディングを実行するためのプロセス又は装置
・イントラコーディングサブパーティション及び等しくないサブパーティションサイズを有するイントラエンコーディング及びデコーディングを実行するためのプロセス又は装置
・記述されている構文要素又はその変形の1つ又は複数を含むビットストリーム又は信号
・記述されている実施形態の任意のものに従って生成された情報を伝達する構文を含むビットストリーム又は信号
・記述されている実施形態の任意のものによる生成及び/又は送信及び/又は受信及び/又はデコーディング
・記述されている実施形態の任意のものによる方法、プロセス、装置、媒体、命令を保存する媒体、データを保存する媒体、又は信号
・デコーダがエンコーダによって使用されるものに対応する方式でコーディングモードを判定することを可能にするシグナリング構文要素内における挿入
・記述されている構文要素又はその変形の1つ又は複数を含むビットストリーム又は信号の生成及び/又は送信及び/又は受信及び/又はデコーディング
・記述されている実施形態の任意のものによる1つ又は複数の変換方法を実行するTV、セットトップボックス、セル電話機、タブレット、又はその他の電子装置
・記述されている実施形態の任意のものに従って変換方法の判定を実行する及び(例えば、モニタ、画面、又はその他のタイプのディスプレイを使用して)結果的に得られた画像を表示するTV、セットトップボックス、セル電話機、タブレット、又はその他の電子装置
・エンコーディングされた画像を含む信号を受信するべく、チャネルを選択、帯域制限、又は(例えば、チューナを使用して)チューニングする及び記述されている実施形態の任意のものに従って1つ又は複数の変換方法を実行するTV、セットトップボックス、セル電話機、タブレット、又はその他の電子装置
・エンコーディングされた画像を含む信号を(例えば、アンテナを使用して)無線で受け取る及び1つ又は複数の変換方法を実行するTV、セットトップボックス、セル電話機、タブレット、又はその他の電子装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
【国際調査報告】