IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオの特許一覧

特開2024-123256エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法
<>
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図1
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図2
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図3
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図4
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図5
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図6
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図7
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図8
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図9
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図10
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図11
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図12
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図13
  • 特開-エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024123256
(43)【公開日】2024-09-10
(54)【発明の名称】エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像パーティションのための複雑な処理を伴う符号化方法と復号化方法
(51)【国際特許分類】
   H04N 19/119 20140101AFI20240903BHJP
   H04N 19/11 20140101ALI20240903BHJP
   H04N 19/159 20140101ALI20240903BHJP
   H04N 19/174 20140101ALI20240903BHJP
   H04N 19/176 20140101ALI20240903BHJP
   H04N 19/436 20140101ALI20240903BHJP
   H04N 19/593 20140101ALI20240903BHJP
   H04N 19/70 20140101ALI20240903BHJP
【FI】
H04N19/119
H04N19/11
H04N19/159
H04N19/174
H04N19/176
H04N19/436
H04N19/593
H04N19/70
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2024103869
(22)【出願日】2024-06-27
(62)【分割の表示】P 2023119326の分割
【原出願日】2020-02-11
(31)【優先権主張番号】18248303.2
(32)【優先日】2018-12-28
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】スクーピン ローベルト
(72)【発明者】
【氏名】サンチェス デ ラ フエンテ ヤーゴ
(72)【発明者】
【氏名】ヘルゲ コルネリウス
(72)【発明者】
【氏名】シーアル トーマス
(72)【発明者】
【氏名】ズューリング カルステン
(72)【発明者】
【氏名】ウィーガント トーマス
(57)【要約】      (修正有)
【課題】VCL(ビデオコード化層)は、フラグメンテーション(断片化)および空間のパーティション化のための技術を含むビデオエンコーダが提供される。
【解決手段】それぞれがオリジナルの画像データを含むビデオの複数の画像を符号化するビデオエンコーダ(101)は、符号化済みビデオ信号を生成するために構成されたデータエンコーダ(110)を含む。データエンコーダ(110)は、符号化済み画像データに、ビデオの複数の画像を符号化する。ビデオエンコーダ(101)はさらに、複数の画像のそれぞれの符号化済み画像データを出力するために構成された出力インターフェイス(120)を含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
符号化済みビデオ信号を生成することによって、ビデオの複数の画像を符号化するためのビデオエンコーダ(101)であって、前記複数の画像のそれぞれは、オリジナルの画像データを含み、
前記ビデオエンコーダ(101)は、
符号化済み画像データを含む前記符号化済みビデオ信号を生成するために構成されたデータエンコーダ(110)と、前記データエンコーダは、前記符号化済み画像データに、前記ビデオの前記複数の画像を符号化するように構成され、
前記複数の画像の各々の前記符号化済み画像データを出力するために構成された出力インターフェイス(120)と、を含み、
前記複数の画像の各々の画像のために、前記データエンコーダ(110)は、前記画像の複数のコーディングツリーユニットを含む複数のタイルに前記画像をパーティション分割するように構成され、前記複数のコーディングツリーユニットのそれぞれのコーディングツリーユニットは、前記画像の複数のサンプルを含み、
前記複数の画像のそれぞれの画像について、前記画像の前記複数のコーディングツリーユニットのそれぞれのコーディングツリーユニットは、部分ユニットまたは完全ユニットのいずれかであり、仮に前記コーディングツリーユニットのサンプルの数が、予め決められたサンプルの数より小さいならば、前記コーディングツリーユニットは前記部分ユニットであり、仮に前記コーディングツリーユニットの前記サンプルの数が、前記予め決められたサンプルの数より小さくないならば、前記コーディングツリーユニットは前記完全ユニットであり、
前記データエンコーダ(110)は、前記複数の画像のそれぞれの画像が、前記画像の前記複数のコード化ツリーユニットの間に同じ第1の数の部分ユニットを含むように、前記複数の画像のそれぞれをパーティションするように構成され、
前記複数の画像のそれぞれの画像のために、前記データエンコーダ(110)は、前記画像の複数のタイルのどのような他のタイルのオリジナルの画像データからも独立して、前記画像の前記複数のタイルの各々の前記オリジナルの画像データを符号化するように構成されること、を特徴とする、ビデオエンコーダ(101)。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ビデオエンコード化とビデオデコード化、特に、エンコーダ、デコーダ、および、フレキシブルにサイズ化された画像データのための複雑な処理を伴う符号化方法と復号化方法に関する。
【背景技術】
【0002】
H.265/HEVC(HEVC=高能率ビデオ符号化)は、既に、エンコーダおよび/またはデコーダで、並列処理を高めるか、または可能にさえするためのツールを提供するビデオ符号器である。例えば、HEVCは、互いに独立して符号化されるタイルの配列の中へ、画像のサブ分割を支援する。連続的なCTUラインの処理において、ある最小のCTUオフセットが守られることが提供されるならば、HEVCによって支援される別の概念は、画像のCTU-列またはCTU-ラインが左から右に平行に、例えば縞状に処理されることに従うWPPに付随する(CTU=コード化ツリーユニット)。しかし、ビデオエンコーダおよび/またはビデオデコーダの並列処理機能をより一層効率的に支援するビデオ符号器を手近にもつことが好ましい。
【0003】
以下において、最新技術に従ってVCLパーティション化への入門が説明される(VCL=ビデオコード化層)。
【0004】
一般に、ビデオコード化において、画像サンプルのコード化プロセスは、より小さいパーティション(仕切り)を必要とする。サンプルは、予測または変換の符号化などの共同の処理のために、いくつかの矩形のエリアに分割される。従って、画像は、ビデオシーケンスのエンコード化の間、一定である特定のサイズのブロックにパーティション分割される。H.264/AVC規格において、16×16個のサンプルの固定サイズのブロック、いわゆるマクロブロックが使われる(AVC=高度ビデオコード化)。
【0005】
最新技術のHEVC規格(非特許文献1を参照)において、64×64個のサンプルの最大のサイズのコード化ツリーブロック(CTB)またはコード化ツリーユニット(CTU)がある。HEVCのより一層の説明において、そのような種類のブロックのために、より多くの共通項CTUが使われる。
【0006】
CTUは、ラスタ走査順に処理され、左上のCTUから始まり、画像の中のCTUをライン状に処理し、右下のCTUに降りる。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】[1] ISO/IEC, ITU-T. High efficiency video coding. ITU-T Recommendation H.265 | ISO/IEC 23008 10 (HEVC), edition 1, 2013; edition 2, 2014.
【発明の概要】
【発明が解決しようとする課題】
【0008】
コード化されたCTUデータは、スライスと呼ばれる一種のコンテナの中へ整理される。元来、以前のビデオコード化規格において、スライスは、画像の1つ以上の連続的なCTUを含むセグメントを意味する。スライスは、コード化されたデータのセグメントのために採用される。別の観点から、完全な画像は、また、1つの大きいセグメントとして定義でき、後に、歴史的に、スライスの用語はまだ用いられている。コード化された画像サンプル以外、スライスは、いわゆるスライスヘッダーの中へ置かれる、スライス自身のコード化プロセスに関連した追加の情報も含む。
【0009】
最新技術によると、VCL(ビデオコード化層)は、フラグメンテーション(断片化)および空間のパーティション化のための技術も含む。そのようなパーティション化は、例えば、並列化における負荷バランス、ネットワーク伝送におけるCTUサイズ整合、エラー緩和などを処理している間、様々な理由のためにビデオコード化において用いられる。
【0010】
それゆえに、この発明の目的は、ビデオエンコード化とビデオデコード化のための改善された概念を提供することである。
【課題を解決するための手段】
【0011】
この発明の目的は独立請求項の主なる事項により解決される。
【0012】
好ましい実施の形態は、従属請求項において提供される。
【発明の効果】
【0013】
この発明によれば、ビデオエンコード化とビデオデコード化のための改善された概念が得られる。
【図面の簡単な説明】
【0014】
以下において、この発明の実施の形態が、図面を参照して詳細に説明される。
【0015】
図1図1は、実施の形態に従うビデオエンコーダを示す。
図2図2は、実施の形態に従うビデオデコーダを示す。
図3図3は、実施の形態に従うシステムを示す。
図4図4は、タイル境界を生成する部分CTUを置き代えることによって影響さ れたCTUを例示する。
図5図5は、部分CTUからの画像補償ごとのルマ(luma)サンプルを示す 。
図6図6は、CTUグリッド整列不適合を示す。
図7図7は、グリッド不適合が影響したCTUの比率を示す。
図8図8は、2つのセットのタイル境界を示す。
図9図9は、現在の画像の中の部分CTUの後の、参照画像の中の対応するCT Uの列を示す。
図10図10は、ビデオエンコーダを示す。
図11図11は、ビデオデコーダを示す。
図12図12は、一方で、再構成された信号、すなわち、再構成された画像と、 他方で、データストリームにおいて信号で伝えられた予測残留信号および予測信号の 結合との間の関係を示す。
図13図13は、ラスタ走査順のスライスによる画像セグメント化を示す。
図14図14は、タイルによる画像パーティション化を示す。
【発明を実施するための形態】
【0016】
図面の以下の説明は、この発明の実施の形態が組み込まれているコード化フレーム作業のための一例を形成するために、ビデオのコード化画像のためのブロックに基づいた予測的な符号器のエンコーダとデコーダの説明の提供で始まる。それぞれのエンコーダおよびデコーダは、図10図12に関して説明される。以下において、図1図3および後続の図面で説明された実施の形態も、図10および図11のエンコーダとデコーダの下にあるコーディングフレーム作業に従って動作していないエンコーダとデコーダを形成するために用いられるけれども、この発明の概念の実施の形態の記載が、そのような概念が図10および図11のエンコーダとデコーダにそれぞれどのように組み込まれているかについての説明と共に提供される。
【0017】
図10は、ビデオエンコーダ、変換に基づいた残留コード化を例示的に使って、データストリーム14の中へ画像12を予測的にコード化するための装置を示す。装置、またはエンコーダは、符号10を使って示される。図11は、対応するビデオデコーダ20、すなわち、変換に基づいた残留デコード化を使って、データストリーム14から画像12’を予測的にデコードするように構成された装置20を示す。アポストロフィは、デコーダ20によって再構成されるような画像12’が、予測残留信号の量子化により導入されたコード化損失について、装置10によってオリジナルの符号化された画像12から派生することを示すために使用される。この応用の実施の形態は、この種類の予測残留コード化に限定されないけれども、図10および図11は、変換に基づいた予測残留コード化を例示的に使う。これは、以下で概説されるように、図10および図11について説明された他の詳細にも当てはまる。
【0018】
エンコーダ10は、予測残留信号を空間からスペクトルへの変換に従属させて、従って、得られた予測残留信号を、データストリーム14の中へ符号化するように構成される。同様に、デコーダ20は、データストリーム14から予測残留信号をデコードし、従って、得られた予測残留信号をスペクトルから空間への変換に従属させるように構成される。
【0019】
内部には、エンコーダ10は、オリジナルの信号から、すなわち画像12から予測信号26の派生を測定するように、予測残留信号24を生成する予測残留信号形成器22を含む。予測残留信号形成器22は、例えば、オリジナルの信号から、すなわち画像12から予測信号を取り出す減算器である。エンコーダ10は、エンコーダ10にも含まれる量子化器32によって、量子化に従属するスペクトル領域予測残留信号24’を得るために、予測残留信号24を空間からスペクトルへの変換に従属させている変換器28をさらに含む。従って、量子化された予測残留信号24’’はビットストリーム14にコード化される。この目的のために、エンコーダ10は、エントロピーが、データストリーム14に変換されて、量子化されるように予測残留信号をコード化する、エントロピーコーダ34を任意に含む。予測信号26は、データストリーム14の中へエンコードされ、かつ、データストリーム14からデコードされた予測残留信号24’’に基づいて、エンコーダ10の予測ステージ36によって生成される。この目的のために、予測ステージ36は、図10に示されるように、量子化損失を除いて信号24’に対応するスペクトル領域予測残留信号24’’’を得るために、予測残留信号24’’を逆量子化する逆量子化器38と、逆量子化器38に後続して、量子化損失を除いてオリジナルの予測残留信号24に対応する予測残留信号24’’’’を得るために、後者の予測残留信号24’’’を、逆変換すなわちスペクトルから空間への変換に従属させる逆変換器40とを内部的に含む。予測ステージ36の結合器42は、再構成された信号46、すなわちオリジナルの信号12の再構成を得るために、加算などによって予測信号26と予測残留信号24’’’’を再結合する。再構成された信号46は信号12’に対応する。予測ステージ36の予測モジュール44は、例えば空間予測、すなわちイントラ画像予測および/または時間的な予測、すなわちインター画像予測を使って、信号46に基づいて予測信号26を生成する。
【0020】
同様に、デコーダ20は、図11に示すように、予測ステージ36に対応する構成部品を内部に含み、予測ステージ36に対応する方法でインター接続される。特に、デコーダ20のエントロピーデコーダ50は、量子化されたスペクトル領域予測残留信号24’’をデータストリームからエントロピーデコードする。その上、逆量子化器52、逆変換器54、結合器56および予測モジュール58は、インター接続して、予測ステージ36のモジュールについて上で説明した方法でインター接続され、かつ、協働して、予測残留信号24’’に基づいて再構成された信号を回復する。その結果、図11に示すように、結合器56の出力が、再構成された信号、すなわち画像12’を生じる。
【0021】
上で特に説明しないけれども、エンコーダ10が、例えば、あるレートおよび歪みに関連した基準、すなわちコード化コストを最適化する方法で、いくつかの最適化計画などに従って、例えば、予測モード、および動作パラメータなどを含むいくつかのコード化パラメータを設定することは明らかである。例えば、エンコーダ10およびデコーダ20および対応するモジュール44,58は、それぞれイントラコード化モードやインターコード化モードなどの異なる予測モードを支援する。エンコーダおよびデコーダがこれらの予測モードのタイプの間で切り換わる粒状性は、コード化セグメントまたはコード化ブロックの中へ画像12,12’のサブ分割にそれぞれ対応する。これらのコード化セグメントのユニットにおいて、例えば、画像は、イントラコードされたブロックとインターコードされたブロックとにサブセグメントされる。イントラコードされたブロックは、以下により詳細に概説されるように、それぞれのブロックの既に符号化された/復号された近傍を、空間に基づいて予測される。いくつかのイントラコード化モードが存在し、それぞれのセグメントが、それぞれのイントラコード化セグメントの中へ、それぞれの方向のイントラコード化モードのために規定される、特定の方向に沿って近傍のサンプル値を外挿することによって満たされることに従う、方向のまたは角度のイントラコード化モードを含むそれぞれのイントラコードされたセグメントのために選択される。例えば、イントラコード化モードは、それぞれのイントラコードされたブロックのための予測が、DC値を、それぞれのイントラコードされたセグメント内の全てのサンプルへ割り当てることに従う、DCコード化モードなどの1つ以上の別のモード、および/または、それぞれのブロックの予測が、近傍のサンプルに基づいて二次元線形機能によって定義された平面のドライブ傾きとオフセットとを持つ、それぞれのイントラコードされたブロックのサンプルポジションの上の二次元線形機能によって説明されたサンプル値の空間の分配であるように近似され、または、決定されることに従う、平面のイントラコード化モードを含む。それと比較して、例えば、インターコードされたブロックは、時間的に予測される。インターコードされたブロックのために、動作ベクトルは、データストリーム内で、信号で伝えられる。動作ベクトルは、画像12が属するビデオの前にコードされた画像の一部分の空間の置換を指示する。前にコードされた/デコードされた画像は、それぞれのインターコードされたブロックのための予測信号を得るために、そこで抽出される。これは、データストリーム14によって構成される残留信号コード化に加えて、量子化されたスペクトル領域予測残留信号24’’を表すエントロピーコードされた変換係数レベルなど意味する。データストリーム14は、コード化モードを様々なブロックに割り当てるため、それらの中へ符号化済みのコーディングモードパラメータ、および、インターコードされたセグメントのための動作パラメータなどのいくつかのブロックのための予測パラメータ、および、セグメントの中へ画像12および画像12’のサブセグメントをそれぞれ制御して信号で伝えるためのパラメータなどの任意の別のパラメータを持つ。デコーダ20は、同じ予測モードをセグメントに割り当てるために、エンコーダがしたと同じ方法で画像をサブ分割するために、そして、同じ予測信号を結果として生じるように同じ予測を実行するために、これらのパラメータを用いる。
【0022】
図12は、一方で、再構成された信号、すなわち再構成された画像12’の間の関係を説明して、他方で、データストリーム14の中の信号としての予測残留信号24’’’’と予測信号26との結合を説明する。既に上で表示したように、結合は加算である。予測信号26は、図12において画像エリアのサブ分割として、斜線を使って図示的に指示されるイントラコードされたブロック、および、斜線無しで図示的に指示されるインターコードされたブロックの中へ示される。サブセグメントは、矩形ブロックまたは非矩形ブロックの列と行の中への画像エリアの規則的なサブ分割、または、変化するサイズの複数のリーフブロックの中へのツリールートブロックからの画像12のマルチツリーサブ分割のような幾つかのサブ分割である。その混合物は、図12に示される。図12において、画像エリアは、最初に、ツリールートブロックの列と行にサブ分割され、それから更に、1つ以上のリーフブロックの中へサブ分割化している再帰的なマルチツリーに従ってサブ分割される。
【0023】
また、データストリーム14は、イントラコードされたブロック80のために、そこへコードされたイントラコード化モードを持ち、いくつかの支援されたイントラコード化モードのうちの1つを、それぞれのイントラコードされたブロック80に割り当てる。インターコードされたブロック82のために、データストリーム14は、そこへコードされる1つ以上の動作パラメータを持つ。一般的に言って、インターコードされたブロック82は、時間的にコードされることに限定されない。代わりに、インターコードされたブロック82は、画像12が属するビデオの前にコードされた画像などの、現在の画像12自身を越える、前にコードされた部分から予測されたブロック、あるいは、別の表示の画像、あるいは、それぞれスケール可変のエンコーダとデコーダであるエンコーダとデコーダの場合の階層的に下の層でもある。
【0024】
図12の予測残留信号24’’’’は、ブロック84の中への画像エリアのサブセグメントとしても示される。これらのブロックは、コード化ブロック80,82から区別するために、変換ブロックと呼ばれる。効果において、図12は、エンコーダ10およびデコーダ20が、それぞれ、ブロックの中への画像12および画像12’の2つの異なるサブ分割、すなわち、コード化ブロック80,82への1つのサブ分割化および変換ブロック84への別のサブ分割を使うことを示す。両方のサブ分割は同じである。すなわち、それぞれのコード化ブロック80,82は、同時に変換ブロック84を形成する。しかし、図12は、例えば、変換ブロック84へのサブ分割が、コード化ブロック80,82へのサブ分割の拡張を形成する場合を示す。従って、2つのブロック80,82の間のどの境界も、2つのブロック84の間の境界をオーバーラップする。代わりに言うと、それぞれのブロック80,82は、変換ブロックのうちの1つに対応するか、または変換ブロック84の群れに対応するかのいずれかである。しかし、サブ分割は、また、変換ブロック84がブロック80,82の間のブロック境界を代わりに横切るように、互いに独立して決定または選択される。変換ブロック84へのサブ分割が関係する限り、同様なステートメントが、ブロック80,82へのサブ分割について前面に出されたそれらとして、すなわち、ブロック84が、(列および行への配置を持つまたは持たない)ブロックへの画像エリアの規則的なサブ分割の結果、または、画像エリアの再帰的なマルチツリーのサブ分割化の結果、または、それの結合、または、どのような他の種類のブロック類として当てはまる。余談であるが、ブロック80,82,84が、二次式、矩形またはどのような他の形でも限定されないことに注目される。
【0025】
図12は、予測信号26と予測残留信号24’’’’との結合が、再構成された信号12’を直接結果として生じる、ことをさらに説明する。しかし、1つ以上の予測信号26が、代わりの実施の形態に従って、画像12’へ結果として生じるように、予測残留信号24’’’’と結合することは注目するべきである。
【0026】
図12において、変換ブロック84は以下の意義をもつ。変換器28および逆変換器54は、これらの変換ブロック84のユニットの中で、それらの変換を実行する。例えば、多くの符号器は、すべての変換ブロック84のために、ある種類のDSTまたはDCTを使う。いくつかの符号器は、変換ブロック84のうちのいくつかのために、予測残留信号が空間領域の中で直接にコードされるように、変換を省略することを許す。しかし、以下に説明される実施の形態に従って、エンコーダ10およびデコーダ20は、それらがいくつかの変換を支援するような方法で構成される。例えば、エンコーダ10およびデコーダ20により支援された変換は、以下のものを含む。
【0027】
〇 DCT-II(または、DCT-III)、ここで、DCTは離散余弦変換を表す。
〇 DST-IV、ここで、DSTは離散的正弦変換を表す。
〇 DCT-IV
〇 DST-VII
〇 恒等変換(IT)
【0028】
もちろん、変換器28が、これらの変換の前の変換バージョンの全てを支援する一方、デコーダ20または逆変換器54は、その対応する回帰または逆バージョンを支援する。
【0029】
〇 逆DCT-II(または、逆DCT-III)
〇 逆DST-IV
〇 逆DCT-IV
〇 逆DST-VII
〇 恒等変換(IT)
【0030】
後続の説明は、変換が、エンコーダ10およびデコーダ20によって支援される、より多くの詳細を提供する。とにかく、支援された変換のセットが、1つのスペクトルから空間への変換、または、空間からスペクトルへの変換などの1つの変換を単に含むことに注目するべきである。
【0031】
既に上で概説したように、図10図12は、例として、さらに以下に説明される発明の概念が、現在の応用に従って、エンコーダとデコーダのための具体的な例を形成するために実行されることを示す。今までのところ、図10図11のエンコーダおよびデコーダは、それぞれ、ここ以下に説明されるエンコーダとデコーダの可能な実行を表す。しかし、図10図11は例に過ぎない。現在の応用の実施の形態に従うエンコーダは、以下のより多くの詳細に概説された概念を使って、図10のエンコーダなどと異なって、画像12のブロックに基づいた符号化を実行する。例えば、それはビデオエンコーダではなく、静止画像エンコーダである。それはインター予測を支援しない。あるいは、ブロック80の中へのサブ分割は、図12において例証されるより異なる方法で実行される。同様に、現在の応用の実施の形態に従うデコーダは、さらに以下で概説されたコード化概念を使って、データストリーム14から画像12’のブロックに基づいたデコード化を実行する。図10のエンコーダなどと異なって、画像12のブロックに基づいた符号化を実行する。例えば、それは図11のデコーダ20と異なり、それはビデオデコーダではなく、静止画像デコーダである。それはイントラ予測を支援しない。あるいは、それは、図12について説明されるより異なる方法で、画像12’をブロックの中へサブセグメントする。および/または、それは、例えば、変換領域でなく空間領域のデータストリーム14から予測残留を引き出す。
【0032】
スライスでパーティション化する画像が、今から簡単に説明される。
【0033】
H.263規格が開始すると、特定の走査順で、隣接するブロックを表しているデータのシーケンスが、スライスと呼ばれるグループの中へ組織される。一般に、画像の異なるスライスのCTUの間、例えば予測とエントロピー符号化についての従属性は禁止される。従って、画像内のそれぞれのスライスは独立して再構成される。
【0034】
図13は、ラスタ走査順のスライスによる画像セグメント化を示す。スライスのサイズは、CTU(コード化ツリーユニット)の数、および、図13に示されたスライスに属するそれぞれのコード化されたCTUのサイズによって決定される。図13は、50個のCTU、例えばCTU221、CTU224およびCTU251を含む。
【0035】
タイルでパーティション分割する画像は、図14に関連して今から簡単に説明される。図14は、50個のCTU、例えばCTU223、CTU227、およびCTU241を含む。
【0036】
概念は、H.264/AVCに追加されたフレキシブルなマクロブロックオーダリング(FMO)にまったく類似であるけれども、タイルは、HEVCにおいて導入された概念である。タイルの概念は、画像をいくつかの矩形の領域にセグメントすることを許す。
【0037】
従って、タイルは、図14に示されるように、指定された高さと幅によって、オリジナルの画像を、列と行の与えられた数にそれぞれセグメントすることの結果である。その結果として、HEVCビットストリーム内のタイルは、規則的なグリッドを形成する共通の境界を持つことを要求される。
【0038】
以下において、実施の形態に従う一般的なビデオエンコーダが図13において説明される。実施の形態に従う一般的なビデオデコーダが図2において説明される。そして、実施の形態に従う一般的なシステムが図3において説明される。
【0039】
図1は、実施の形態に従う一般的なビデオエンコーダ101を示す。
【0040】
ビデオエンコーダ101は、符号化済みビデオ信号を生成することによって、ビデオの複数の画像を符号化するように構成される。複数の画像のそれぞれは、オリジナルの画像データを含む。
【0041】
ビデオエンコーダ101は、符号化済み画像データを含む、符号化済みビデオ信号を生成するために構成されたデータエンコーダ110を含む。データエンコーダは、符号化済み画像データに、ビデオの複数の画像を符号化するように構成される。
【0042】
さらに、ビデオエンコーダ101は、複数の画像のそれぞれの符号化済み画像データを出力するために構成された出力インターフェイス120を含む。
【0043】
図2は、実施の形態に従う一般的なビデオデコーダ151を示す。
【0044】
ビデオデコーダ151は、ビデオの複数の画像を再構成するために、符号化済み画像データを含む符号化済みたビデオ信号を、復号するために構成される。
【0045】
ビデオデコーダ151は、符号化済みビデオ信号を受信するために構成された入力インターフェイス160を含む。
【0046】
さらに、ビデオデコーダは、符号化済み画像データを復号することによって、ビデオの複数の画像を再構成するために構成されたデータデコーダ170を含む。
【0047】
図3は、実施の形態に従う一般的なシステムを示す。
【0048】
システムは、図1のビデオエンコーダ101、および、図2のビデオデコーダ151を含む。
【0049】
ビデオエンコーダ101は、符号化済みビデオ信号を生成するように構成される。ビデオデコーダ151は、ビデオの画像を再構成するために、符号化済みビデオ信号を復号するように構成される。
【0050】
この発明の第1の面は、請求項1ないし請求項5において、請求項45ないし請求項49において、および、請求項89ないし請求項93において要求される。
【0051】
この発明の第2の面は、請求項6ないし請求項13において、請求項50ないし請求項57において、および、請求項94ないし請求項98において要求される。
【0052】
この発明の第3の面は、請求項14ないし請求項18において、請求項58ないし請求項62において、および、請求項99ないし請求項103において要求される。
【0053】
この発明の第4の面は、請求項19ないし請求項22において、請求項63ないし請求項66において、および、請求項104ないし請求項108において要求される。
【0054】
この発明の第5の面は、請求項24ないし請求項27において、請求項68ないし請求項71において、および、請求項109ないし請求項113において要求される。
【0055】
この発明の第6の面は、請求項28ないし請求項32において、請求項72ないし請求項76において、および、請求項114ないし請求項118において要求される。
【0056】
この発明の第7の面は、請求項33および請求項34において、請求項77および請求項78において、および、請求項119ないし請求項123において要求される。
【0057】
この発明の第8の面は、請求項35ないし請求項38において、請求項79ないし請求項82において、および、請求項124ないし請求項128において要求される。
【0058】
この発明の第9の面は、請求項40ないし請求項44において、請求項84ないし請求項88において、および、請求項129ないし請求項133において要求される。
【0059】
請求項23、請求項39、請求項67、および、請求項83は、例えば、この発明の異なる面のために使用される、特定の例を要求する。
【0060】
以下において、実施の形態に従って、フレキシブルにサイズ化された画像パーティションのために取り扱う複雑さの詳細が説明される。
【0061】
タイルは、HEVCにおいて、画像のためのサブセグメント構造として規定される。それらは、画像パラメータセット(PPS)において定義される。そこで、それらの次元が与えられる。タイルは、いま定義されたように、CTU(一般に64個のサンプル)の倍数であるサイズを持つ。画像の最後のタイルのみ、すなわち、右または底の境界でのタイルのみが、64個より少ない右および底の画像境界でのそれらのCTUを持ことを許される。
【0062】
しかし、そのような制限は、2,3の使用ケースを防止する。
【0063】
MCTSビットストリームのマージ:オリジナルの画像境界が、マージされた(1つにされた)ビットストリームの中の画像境界でないように、単一のビットストリーム内で一緒にマージされるビットストリームは、CTUのために選んだサイズの倍数であることを必要とする。
【0064】
適切な負荷バランス化、そこで、タイルは、予め決められたサイズ(CTUサイズ)の倍数で、必ずしもそうとは限らないで内容に順応する。
【0065】
さらに、JVET-多用途ビデオコード化によって開発された現在のビデオコード化規格は、CTUのより大きい値(最高は128個)を許す。それは、CTUの倍数ではないタイルを許すことをいっそう重要にする。要求された機能が必要であるかどうかに基づいて、部分CTUを定義することは、可能であるけれども、そのような場合のためのコード化効率に影響する。それでも、タイルが、決定されたサイズの完全な数のCTUを含むことを許すのではなく、タイルの最も右のCTUかつ底の境界のCTUが、より少ないことを許すことが望ましい。
【0066】
しかし、そのような機能が許されるとき、異なる面はデコード化プロセスに影響する。
【0067】
以下において、画像内の部分CTUの複雑さを制御することが説明される。
【0068】
特に、この発明の第1の面が、今から詳細に説明される。
【0069】
現在、全てのCTUは、同じサイズである。プロセッサは、予め決められたサイズの構成を復号するために最適である。可変のサイズが、デコーダのための複雑さ増加を課すこと、を許す。特に、CTUの数は、画像から画像へ変化することができる。
【0070】
現在の発明の第1の面は、そのような可変のサイズ化されたCTUが、それぞれのタイル内で許されるとき、制限が、可変のサイズ化されたCTUの数を、画像から画像へ一定に保持することを満たされること、を必要とすることである。
【0071】
第1の面において、制限が常に適用される。
【0072】
図4は、タイル境界を生成する部分CTUに置き代わることによって、影響されたCTUを示す。
【0073】
仮にタイルのサイズが、予め決められたCTUのサイズの倍数ではないならば、予め決められたCTUのサイズより小さい可変のサイズ化されたCTUが導入される。図4に示されるように、画像のそれぞれにおいて、同じ数のそのような可変のサイズ化されたCTUを持つことが、ビットストリーム一致の要件である。
【0074】
さらに、この特性は、num_partial_ctus_constant_flagを指示する、パラメータセットの中のフラグを使って、デコーダに信号で伝えられる。
【0075】
この発明の第2の面が、今から詳細に説明される。
【0076】
第2の面は、それらの複雑さの影響力において、タイル境界を生成する部分CTUを、規則的なタイル境界から区別する。デコーダが、時間ユニット毎に、復号されたペル(pel)の最大量のためにレベル制限をチェックするとき、それは部分CTUのための複雑さ因子を加算する。例えば、仮に可変のサイズ化されたCTUであることが、タイル境界によって、サイズにおいて制限されないならば、部分CTUは、その実際のサイズの1.5倍で、または、予め決められたCTUのサイズのペルの数でカウントされる。これは、画像のサイズ制限が部分CTUの存在によって影響される、ことを意味する。例えば、仮に全てのCTUが、同じサイズであるならば、デコーダのための画像制限は、1秒毎に50個のフレームで4096×2160個である。しかし、仮に、定義される全ての5×4個のタイルが、右および底の境界での部分CTU、すなわち20個の部分CTUを持つならば、制限は、同じフレームレートで4056×2128個である。
【0077】
図5は、部分CTUからの画像補償ごとのルマ(luma)サンプルを示す。特に、複雑さ順応画像エリアが、図5に示される。
【0078】
さらに、可変のサイズ化されたCTUのサイズに対する下限は、どの方向においても、1つのサンプルと予め決められたCTUサイズとの間のサイズをもつ小さい可変のCTUを恣意的に許す、ことを反対するように、参照画像の動作ベクトルまたは置換情報が、コード化プロセスにおいて、例えば16×16個のサンプルの粒状性を持って格納されることによって、粒状性とみなすことを課される。可変のサイズ化されたCTUは、2つのCTUが同じ動作ベクトル格納ユニットの範囲内に存在しないように、例えば動作ベクトル格納粒状性から指示されるか、または引き出されるべき、予め決められた最小のCTUサイズより小さいことを許されない。
【0079】
この発明の第3の面が、今から詳細に説明される。
【0080】
そのような別の独立した第3の面において、部分CTUの存在は、タイルの複雑さの信号化のために考慮される。例えば、HEVCは、タイルを含む空間のセグメントの複雑さを説明するVUIの中に、パラメータのmin_spatial_segmentation_idcを含む。現在、タイルに適用されるとき、それは、「(4*PicSizeInSamplesY)/(min_spatial_segmentation_idc+4)より多いルマサンプルを含むCVS(コード化されたビデオシーケンス)の中にタイルがない」ことを暗示する。さらに、この発明の一部分として、複雑さの信号化は、最大のタイルのサイズ、および/または、デフォルトCTUのサイズと部分CTUのサイズとの間の関係に従属する、部分CTUの与えられた数より多く含まないように、タイルのために制限する。代わりに、追加のパラメータが、画像において許された部分CTUの相対的な量を指示するVUIにおいて信号で伝えられる。
【0081】
以下において、実施の形態は、CTU境界が画像から画像へ変わることができることを説明する。
【0082】
特に、この発明の第4の面が、今から詳細に説明される。
【0083】
仮にタイルが、予め定義されたCTUサイズよりより小さい粒状性で終わる、それらの右/底の境界を持ち、後続のタイルが、予め定義されたサイズのCTUで始まるならば、タイルセットアップが画像から画像へ変わるとき、画像を横切るCTUの整列は、達成されないで、時間的な動作ベクトル予測を使うなど、ある予測的なコード化のために有害である。メモリ管理はより難しく、画像から画像への生成するCTUの境界の誤った整列の柔軟性を制限することが望ましい。
【0084】
第4の面は、部分CTUを生成するどのタイル境界でも、それが、同じビデオシーケンス内の異なる画像で、同じスプリット比率で、部分CTUを生成する、位置に動くことができるだけであることを強制するべきである。これは、図6に示されるように、初期の最後のCTUポジションおよび修正された最後のCTUポジションからの範囲によってカバーされなかったエリアの中の整列されたCTUを持つことを許す。
【0085】
図6は、CTUグリッド整列不適合を示す。
【0086】
この発明の第5の面が、今から詳細に説明される。
【0087】
第5の面において、制限は、図7に示されるように、グリッド不適合が、部分タイル境界を変更することを伴って画像の間に生じる、ブロックのレートのために適用される。この強制は、与えられたプロフィール/レベルのためのデフォルト方法の中で定義されるか、または、ビットストリームの中の構文要素、例えばnum_misaligned_ctus_per_pictureとして指示されるかいずれかである。図7は、グリッド不適合が影響したCTUの比率を示す。
【0088】
代わりに、部分(境界)CTUの数が同じ比率で一定のままである、ここに説明された強制は、タイル境界の指示が柔軟なままであるけれども、強制を果たす必要がある、簡素な強制指示、例えばmisalignment_constant_flagとして実施されるか、または、少ない柔軟な方法によって達成される。
【0089】
この発明の第6の面が、今から詳細に説明される。
【0090】
第6の面において、CTUの誤った整列は、完全に避けられる。2つのセットのタイル境界が定義される。第1のセットのタイル境界は、従来のタイル境界に対応する。
・エントロピー符号化リセット
・イントラ予測制限
・走査順変換
そして、さらに、第1のセットのタイルは、右および底のタイル境界で、部分CTUを生成することを許す。
【0091】
第2のセットのタイル境界は、右および/または底のタイル境界で、すなわち、前記タイル境界の左および/または上へ、部分CTUを生成するだけであり、エントロピー符号化リセットまたはイントラ予測または走査順の変換を暗示しない。従って、画像内の部分CTUの位置は、実際のタイルの構成が、時間を切り換えることを許される間、静的であり続けることができる(そして強制する)。
【0092】
図8は、2つのセットのタイル境界を示す。CVS内で、ポジションを変更するタイル境界は、新しい部分タイルを生成することを許されない。図8は、第1のセットのタイル境界が、時間瞬間T-1から時間瞬間Tへポジションを変更し、新しい第2のセットのタイル境界が、たとえ走査順およびエントロピー符号化およびイントラ予測に変化が起きても、時間瞬間T-1と同様な時間瞬間Tで、部分CTUのポジションを維持するように導入される、異なる時間瞬間の2つの画像に基づいた発明を示す。
【0093】
この発明の第7の面が、今から詳細に説明される。
【0094】
別の独立した実施の形態において、問題は、ラインバッファ要件において、複雑さの影響力を減らすように部分CTUの導入に取り組まれる。
【0095】
図9は、現在の画像の中の部分CTUの後の、参照画像の中の対応するCTUの列を示す。
【0096】
図9に示されるように、1つの画像の中の部分CTUの水平の列は、部分CTUの列なしで、参照画像についてCTUグリッドの誤った整列を導く。単一の列(現在のCTUの列)は、ATMVP(二者択一の時間動作ベクトル予測)などのツールのために、2つのCTUの列のCU(CU=コード化ユニット)にアクセスする。配列されたCTUの列は、しばしば、ハードウェア実行(ラインバッファとして参照)の中のコスト集約高速メモリにおいてキャッシュされるので、多数のCTUの列をこのキャッシュの中に保持することは、望ましくない。従って、画像を横切るCTUの列の整列を、タイル境界を生成する部分CTUの存在の中に維持するために、別の制限は、それらの上の部分CTUを生成する水平のタイル境界が、コード化されたビデオシーケンスの間、変わることを許さず、それゆえ静的であることである。
【0097】
以下において、実施の形態に従う、配列されたCTUからの予測子派生が説明される。
【0098】
特に、この発明の第8の面が、今から詳細に説明される。
【0099】
TMVP(時間動作ベクトル予測)およびATMVP派生は、現在、予め定義されたCTUのサイズに従属し、すなわち、画像の上の一定のCTUグリッドを使う。
【0100】
TMVPに対して、
仮に、yCb>>CtbLog2SizeYが、yColBr>>CtbLog2SizeYと等しいならば、yColBrは、pic_height_in_luma_samplesより少なく、xColBrは、pic_width_in_luma_samplesより少ない。
(すなわち、仮に参照画像の右底のCBが、同じCTUの列の中にあるならば、後に、それはラインバッファメモリーの中にキャッシュされる。)
【0101】
そして、右底に配列された予測子が取られる。さもなければ(仮に、参照画像の右底のCBが、同じCTUの列の中でNOTであるならば、後に、それはラインバッファの中でNOTである)、センターに配列された予測子が取られる。
【0102】
ATMVPに対して、ColPicの内側に配列されたサブブロックの位置(xColSb、yColSb)は次の通り引き出される。
xColSb=Clip3(xCtb、Min(CurPicWidthInSamplesY-1、xCtb+(1<<CtbLog2SizeY)+3)、xSb+(tempMv[0]>>4))
yColSb=Clip3(yCtb、Min(CurPicHeightInSamplesY-1、yCtb+(1<<CtbLog2SizeY)-1)、ySb+(tempMv[1]>>4))
【0103】
すなわち、配列されたサブブロックの座標は、同じCTUの列の内側へあるように、それぞれの次元において切り取られる。同じラインバッファの考慮が当てはまる。
【0104】
TMVPおよびATMVPの両方は、配列されたブロックおよびサブブロックの派生のために、コード化された画像の全てのサンプルを、コード化されたブロックに分割する、予め定義されたCTUのサイズCtbLog2SizeYを使う。
【0105】
部分CTUを生成することを許されるタイル境界のため、CTUグリッドは一定ではなく、画像から画像へ変化し、図9に示すように変化する数のCTUの列の間のオーバーラップを生成する。この発明のこの部分において、現在の画像のCTUグリッドは、バッファ管理および予測子アクセスを組織するために、基準のフレームの上に課される。すなわち、現在の局所の部分CTUの次元またはサイズは、(画像を横切る一定の最大のCTUサイズと対比されるように)使用された(配列された)参照画像の中の参照されたエリアを選択するために適用される。
【0106】
TMVPのために、この発明の1つの実施の形態は下記である。
【0107】
yTileStartおよびxTileStartは、タイル開始および配列されたブロックに対応して関連する現在のコード化ブロックのサンプルポジションに対応する、yCbInTileおよびxCbInTileによって現在のコード化ブロックを運営する与えられたタイルの左上のサンプルポジションに対応する。
【0108】
(違いは太い活字体で強調される):
yCbInTile=yCb-yTileStart
yColBrInTile=yColBr-yTileStart
CtbLog2HeightY(y)は、それぞれのCTUの列の高さを説明する。
仮に、yCbInTile>>CtbLog2HeightY(yCbInTile)が、yColBrInTile>>CtbLog2HeightY(yCbInTile)と等しいならば、yColBrは、pic_height_in_luma_samplesより少なく、xColBrは、pic_width_in_luma_samplesより少ない。
【0109】
そして、右底に配列された予測子が取られる。さもなければ、センターに配列された予測子が取られる。
【0110】
ATMVPのために、調整されたクリップ操作の形式の実施の形態は、次の通りである。
ColPicの内側に配列されたサブブロックの位置(xColSb、yColSb)は、次の通り引き出される。
xColSb=Clip3(xCtb、Min(CurPicWidthInSamplesY-1、xCtb+(1<<CtbLog2WidthY(xCtb))+3)、xSb+(tempMv[0]>>4))
yColSb=Clip3(yCtb、Min(CurPicHeightInSamplesY-1、yCtb+(1<<CtbLog2HeightY(yCtb))-1)、
ySb+(tempMv[1]>>4))
【0111】
以下において、サブ画像態様コード化ツール制限指示が説明される。
【0112】
特に、この発明の第9の面が、今から詳細に説明される。
【0113】
以前のビデオコード化規格において、サブ画像(例えば、スライスまたはタイル)態様コード化制限は、次の通り区別される。
I_SLICE-イントラコード化(通常、ランダムアクセスポイント)は、他の画像に対する基準を使わない。
P_SLICE-予測的なコード化。動作補償予測のための1つの参照画像リストから1つの画像を使いなさい。
B_SLICE-2つの参照画像リストを持つ双予測的なコード化。両方リストの中の画像から動作補償予測を結合することを許す。
【0114】
この文脈の中の用語のスライスまたはタイルは、交換可能である。すなわち、ビットストリームの中の連続的なCTUのグループは、単一のコード化された画像に属し、一緒にコード化されたエントロピーである。
【0115】
この違いは、2つのことを許す。すなわち、
-スライスまたはタイルのヘッダーの構成要素の分析化から、すぐ上のそれぞれのサブ画像の構成要素の分析化およびデコード化プロセスを制御すること、および
-例えばB_SLICESなどの計算的に複雑なタイプの使用を禁止することによって、そのようなタイプに基づいてプロファルすること。
【0116】
タイプ指示は、また、それぞれのタイプ、例えば、最も限定されたタイプであるI_SLICEタイプ、および、1つの参照画像を使って、インター予測を含むように制限を緩和するP_SLICEタイプ、および、提供順と異なる画像のビットストリーム順を許すことによって、時間的に先行および後続する画像の両方から基準を含むための別の制限を緩和するB_SLICEタイプと関連した制限の袋と解釈できる。
【0117】
以下の問題が生じる。
-I_SLICEタイプは、参照として、現在のコード化された画像を使う予測に基づいた、「動作」補償された、または、翻訳補償されたブロックのようなP_SLICEタイプである、「現在の画像の参照化」も含む。
-P_SLICEは、もう頻繁に使用されず、応用において、B_SLICEによって大抵置き代えられる。
-インター予測は、2つの参照フレームの使用を越えて発展する。
【0118】
現在の画像の参照化は、上を参照する通り、従来のイントラ予測と比較して、デコード化プロセスに追加の複雑さを課す。従来、イントラ予測は、例えば内挿を通じて予測されたブロックのサンプル値を生成するために、現在予測されたブロック、例えば直接近傍のサンプル、または、いわゆるマルチ参照ライン予測において、直接近傍のサンプルの少ない数(例えば3つ)のラインに直ぐ近くの、現在の画像内のサンプル値にだけ依存する。他方の現在の画像の参照化は、基準ブロックのサンプル値が、現在のブロックの位置にコピーされる、ビデオシーケンスのフレームの間のインター予測において、以前に使用されただけのメカニズムに依存する。この技術の中の予測子を生成するためにアクセスされたサンプルの量は、正規のイントラ予測よりずっと高い。そのために、予測子のサンプルは、比較されたずっと少ないアクセスされたサンプルから引き出されるだけでなく、適した動作ベクトルまたは置換情報を引き出すためのエンコーダ側での検索はずっと高い。さらに、参照画像は、参照のために、現在の画像の上における、これまでより大きい領域、すなわち再構成された領域の利用可能性をもたらすために、現在の画像のデコード化プロセスに沿ってアップデートされる必要がある。
【0119】
この発明の1つの実施の形態において、上記のタイプ区別を使う代わりに、実際の課されたツール制限が、(タイル)ヘッダーにおいて信号で伝えられる。
【0120】
1)フラグは、現在の画像より他に参照画像の使用が使われるかどうかを指示するように、使用される(イントラ/インタースイッチ)。
【0121】
2)フラグは、現在の画像の参照化の使用を指示するように使用される(現在のコード化された画像を使うインター予測)。これは、イントラ/インター選択に従属して信号で伝えられる。
【0122】
3)構文要素は、予測プロセスにおいて使われる、参照画像リストの数を指示するように、信号で伝えられる。現在の画像の参照化のみが使われる場合において、この構文要素は1に等しいと推定される。他の場合において、1の値は、以前にP_SLICEタイプであったものに適用される一方、2の値は、以前のB_SLICEタイプに適用される。追加の値は、例えば、マルチ仮説予測を指示するために使用される。
例示の構文は表1の通りである。
【0123】
【表1】
【0124】
1と等しいcurrent_picture_only_reference_flagは、参照として現在の画像を使うことのみが許される、ことを指示する。これは従来のI_SLICEタイプと同様である。
【0125】
1と等しいcurrent_picture_inter_reference_flagは、現在の画像がインター予測のために利用可能である、ことを指示する(「現在の画像の参照化」または「イントラブロックコピー」ツール)。
【0126】
num_ref_pic_lists_activeは、能動的な参照画像リストの数を指示する。
仮に、current_picture_only_reference_flagが1と等しく、
current_picture_inter_reference_flagが0と等しいならば、
num_ref_pic_lists_activeは、0に能動的である(そして、ビットストリームから除外される)。
仮に、current_picture_only_reference_flagが0と等しいならば、
1と等しいnum_ref_pic_lists_activeは、P_SLICEと同様なタイルタイプを指示し、
2と等しいnum_ref_pic_lists_activeは、B_SLICEと同様なタイルタイプを指示し、
2より大きいnum_ref_pic_lists_activeは、例えばマルチ仮説インター予測のために、より多くの参照画像リストの使用を指示するように使用される。
【0127】
装置の文脈の中で、いくつかの面が説明されたけれども、これらの面が、対応する方法の説明も表していることは明確である。ブロックまたはデバイスは、方法ステップまたは方法ステップの機能に対応する。相似して、方法ステップの文脈の中で説明された面も、対応する装置の対応するブロックまたはアイテムまたは機能の説明を表す。いくつかのまたは全ての方法ステップは、例えばマイクロプロセッサー、プログラム化可能なコンピュータまたは電子回路のような、ハードウェア装置(または、使うこと)によって実行される。いくつかの実施の形態において、最も重要な方法ステップのうちの1つ以上は、そのような装置によって実行される。
【0128】
特定の実現要求に従属することによって、この発明の実施の形態は、ハードウェアにおいて、または、ソフトウェアにおいて、または、少なくとも部分的にハードウェアにおいて、または、少なくとも部分的にソフトウェアにおいて実現できる。実現は、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協力して(または、協力する可能性がある)、それに格納された電子的に読み取り可能な制御信号を持つデジタルの格納媒体、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPRROM、EEPROM、またはフラッシュメモリを使って実行できる。従って、デジタルの格納媒体は、コンピュータが読み取り可能である。
【0129】
この発明に従ういくつかの実施の形態は、ここに説明された方法のうちの1つが実行されるように、プログラム化可能なコンピュータシステムと協力する可能性がある、電子的に読み取り可能な制御信号を持つデータキャリアを含む。
【0130】
一般に、この発明の実施の形態は、プログラムコードを持つコンピュータプログラム製品として実施できる。プログラムコードは、コンピュータプログラム製品がコンピュータ上を稼働するとき、方法のうちの1つを実行するために操作される。プログラムコードは、例えば、機械が読み取り可能なキャリアの上に格納される。
【0131】
他の実施の形態は、機械読み取り可能なキャリアに格納された、ここに説明された方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0132】
すなわち、この発明の方法の実施の形態は、従って、コンピュータプログラムがコンピュータ上を稼働するとき、ここに説明された方法のうちの1つを実行するためのプログラムコードを持つコンピュータプログラムである。
【0133】
この発明の方法の別の実施の形態は、従って、その上に記録された、ここに説明された方法のうちの1つを実行するためのコンピュータプログラムを含むデータキャリア(または、デジタルの格納媒体、または、コンピュータが読み取り可能な媒体)である。データキャリアまたはデジタルの格納媒体または記録された媒体は、一般に、有形および/または非一時的である。
【0134】
この発明の方法の別の実施の形態は、従って、ここに説明された方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたはシーケンスの信号である。データストリームまたはシーケンスの信号は、データ通信接続を経て、例えばインターネットを経て、転送されるように構成される。
【0135】
別の実施の形態は、ここに説明された方法のうちの1つを実行するように構成または適用された、処理手段、例えば、コンピュータまたはプログラム可能な論理デバイスを含む。
【0136】
別の実施の形態は、ここに説明された方法のうちの1つを実行するためのコンピュータプログラムを、その上にインストールしているコンピュータを含む。
【0137】
この発明に従う別の実施の形態は、ここに記述された方法のうちの1つを実行するためのコンピュータプログラムを、レシーバーに転送(例えば、電子的にまたは光学的に)するように構成された装置またはシステムを含む。レシーバーは、例えば、コンピュータ、モバイルデバイス、メモリデバイス、または同類である。装置またはシステムは、例えば、コンピュータプログラムをレシーバーに転送するためのファイルサーバーを含む。
【0138】
いくつかの実施の形態において、プログラム可能な論理デバイス(例えば、フィールドプログラム可能なゲートアレイ)は、ここに説明された方法の機能のうちのいくつかまたは全てを実行するために使用される。いくつかの実施の形態において、フィールドプログラム可能なゲートアレイは、ここに説明された方法のうちの1つを実行するために、マイクロプロセッサーと協力する。一般に、方法は、どのようなハードウェア装置によっても、好んで実行される。
【0139】
ここに説明された装置は、ハードウェア装置を使って、または、コンピュータを使って、または、ハードウェア装置とコンピュータとの結合を使って実施される。
【0140】
ここに説明された方法は、ハードウェア装置を使って、または、コンピュータを使って、または、ハードウェア装置とコンピュータとの結合を使って実行される。
【0141】
上記の説明された実施の形態は、単に、本発明の原則のために示される。ここに説明された配列および詳細の、部分修正と変形とが、他の当業者に明白であることは理解される。従って、ここの実施の形態の記述および説明の方法で提供された特定の詳細によってではなく、今にも起こりそうな特許の請求項の範囲のみによって制限されることが、意思である。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
【手続補正書】
【提出日】2024-07-23
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオデコード化のためのハードウェア装置であって、
他の画像でなく現在の画像のみに関して再構成されたサンプルに基づいてセグメントのブロックを予測するかどうかを示す第1のフラグを、前記現在の画像の前記セグメントに対してデータストリームからデコードし、
他の画像ではなく前記現在の画像のみに関して再構成されたサンプルに基づいて前記セグメントのブロックを予測することを示す前記第1のフラグに応じて、前記現在の画像に関して再構成されたサンプルの参照ブロックからサンプルをコピーすることによって前記セグメントの現在のブロックを予測するかどうかを示す第2のフラグを、前記データストリームからデコードし、
前記参照ブロックからサンプルをコピーすることによって前記現在のブロックを予測することを示す前記第2のフラグに応じて、前記参照ブロックからサンプルをコピーすることによって前記現在のブロックの予測を決定し、
前記現在のブロックの前記予測と前記データストリームからデコードされた予測残差に基づいて前記現在のブロックを再構成する、
ように構成されたハードウェア装置。
【請求項2】
前記セグメントは、1つ以上のコーディングツリーユニットで構成されていることを特徴とする請求項1に記載のハードウェア装置。
【請求項3】
ビデオデコード化のための方法であって、
他の画像でなく現在の画像のみに関して再構成されたサンプルに基づいてセグメントのブロックを予測するかどうかを示す第1のフラグを、前記現在の画像の前記セグメントに対してデータストリームからデコードするステップと、
他の画像ではなく前記現在の画像のみに関して再構成されたサンプルに基づいて前記セグメントのブロックを予測することを示す前記第1のフラグに応じて、前記現在の画像に関して再構成されたサンプルの参照ブロックからサンプルをコピーすることによって前記セグメントの現在のブロックを予測するかどうかを示す第2のフラグを前記データストリームからデコードするステップと、
前記参照ブロックからサンプルをコピーすることによって前記現在のブロックを予測することを示す前記第2のフラグに応じて、前記参照ブロックからサンプルをコピーすることによって前記現在のブロックの予測を決定するステップと、
前記現在のブロックの前記予測と前記データストリームからデコードされた予測残差に基づいて前記現在のブロックを再構成するステップと、
を含む方法。
【請求項4】
前記セグメントは、1つ以上のコーディングツリーユニットで構成されていることを特徴とする請求項3に記載の方法。
【請求項5】
記憶されたコンピュータプログラムを有する非一過性のデジタル記憶媒体であって、
前記コンピュータプログラムがコンピュータによって実行されると、前記コンピュータプログラムは、
他の画像でなく現在の画像のみに関して再構成されたサンプルに基づいてセグメントのブロックを予測するかどうかを示す第1のフラグを、前記現在の画像の前記セグメントに対してデータストリームからデコードするステップと、
他の画像ではなく前記現在の画像のみに関して再構成されたサンプルに基づいて前記セグメントのブロックを予測することを示す前記第1のフラグに応じて、前記現在の画像に関して再構成されたサンプルの参照ブロックからサンプルをコピーすることによって前記セグメントの現在のブロックを予測するかどうかを示す第2のフラグを前記データストリームからデコードするステップと、
前記参照ブロックからサンプルをコピーすることによって前記現在のブロックを予測することを示す前記第2のフラグに応じて、前記参照ブロックからサンプルをコピーすることによって前記現在のブロックの予測を決定するステップと、
前記現在のブロックの前記予測と前記データストリームからデコードされた予測残差に基づいて前記現在のブロックを再構成するステップと、
を実行することを特徴とする非一過性のデジタル記憶媒体。
【請求項6】
前記セグメントは、1つ以上のコーディングツリーユニットで構成されていることを特徴とする請求項5に記載の非一過性のデジタル記憶媒体。