(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-29
(45)【発行日】2024-08-06
(54)【発明の名称】画像境界処理を使用して画像を符号化および復号する装置および方法
(51)【国際特許分類】
H04N 19/119 20140101AFI20240730BHJP
H04N 19/167 20140101ALI20240730BHJP
H04N 19/176 20140101ALI20240730BHJP
H04N 19/46 20140101ALI20240730BHJP
【FI】
H04N19/119
H04N19/167
H04N19/176
H04N19/46
(21)【出願番号】P 2022182494
(22)【出願日】2022-11-15
(62)【分割の表示】P 2020552780の分割
【原出願日】2019-03-21
【審査請求日】2022-11-15
(32)【優先日】2018-03-29
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】500341779
【氏名又は名称】フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】ウィエコウスキ,アダム
(72)【発明者】
【氏名】ゲオルク,ワレリ
(72)【発明者】
【氏名】ヒンツ,トビアス
(72)【発明者】
【氏名】シュヴァルツ,ハイコ
(72)【発明者】
【氏名】マルペ,デトレフ
(72)【発明者】
【氏名】ウィーガント,トーマス
(72)【発明者】
【氏名】マ,ジャッキー
(72)【発明者】
【氏名】ブランデンブルク,イェンス
【審査官】田部井 和彦
(56)【参考文献】
【文献】国際公開第2018/177741(WO,A1)
【文献】特表2020-516156(JP,A)
【文献】国際公開第2019/077751(WO,A1)
【文献】米国特許出願公開第2016/0373766(US,A1)
【文献】MA, Jackie et al.,Quadtree plus binary tree with shifting,Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 10th Meeting:,JVET-J0035 (version 1),ITU-T,2018年04月03日,<URL: http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/10_San%20Diego/wg11/JVET-J0035-v1.zip>
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/119
H04N 19/167
H04N 19/176
H04N 19/46
(57)【特許請求の範囲】
【請求項1】
画像(12)のリーフブロックへの再帰的なマルチツリー分割による、データストリーム(14)への画像(12)のブロックベースの符号化
のための方法であって、
当該方法は、
所定のブロック(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)のx座標位置(x
b)と幅(w
b)との和がピクチャ幅(w
f)よりも大きいかどうかを判定することと、
前記所定のブロック(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)のy座標位置(y
b)と高さ(h
b)との和がピクチャ高さ(h
f)よりも大きいかどうかを判定することと、
に基づいて、前記画像(12)の境界を超えて延びる前記所定のブロック(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)について、利用可能な分割モードのセットを決定するステップと、
4分割、または、
前記所定のブロック(801a;802d)内の前記画像(12)の境界に平行であり、かつスプリット線(811;813)が前記画像(12)の前記境界に併置さ
れ、および
/または前記所定のブロック(801a;802d)の内側に中央に配置されているもののうちの少なくとも1つである、スプリット線(811;813)に沿って前記所定のブロック(801a;802d)を2つのサブブロック(802a、802b;803b、803d)に分割する、垂直方向の2分割または水平方向の2分割
であって、
前記垂直方向の2分割または水平方向の2分割が適用され、前記ブロックが前記画像(12)の前記境界を超えると判定される場合、前記分割は、分割の所定の最大数に達するまでカウントされない、垂直方向の2分割または水平方向の2分割、
のうちの少なくとも1つを、前記利用可能な分割モードのセットから選択するステップと、を含む、方法。
【請求項2】
前記所定のブロックの内側に位置する前記画像の前記境界が垂直であるとき、前記利用可能な分割モードのセットから、前記垂直方向の2分割を選択するステップをさらに備える、請求項1に記載の方法。
【請求項3】
前記所定のブロックの内側に位置する前記画像の前記境界が水平であるとき、前記利用可能な分割モードのセットから、前記水平方向の2分割を選択するステップをさらに備える、請求項1に記載の方法。
【請求項4】
前記所定のブロックが前記画像(12)の角を超えて延びる場合にのみ、前記利用可能な分割モードのセットから、前記4分割を選択するステップをさらに含む、請求項1に記載の方法。
【請求項5】
画像(12)のリーフブロックへの再帰的なマルチツリー分割による、データストリーム(14)からの画像(12)のブロックベースの復号
のための方法であって、
当該方法は、
所定のブロック(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)のx座標位置(xb)と幅(wb)との和がピクチャ幅(wf)よりも大きいかどうかを判定することと、
前記所定のブロック(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)のy座標位置(yb)と高さ(hb)との和がピクチャ高さ(hf)よりも大きいかどうかを判定することと、
に基づいて、前記画像(12)の境界を超えて延びる前記所定のブロック(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)について、利用可能な分割モードのセットを決定するステップと、
4分割、または、
前記所定のブロック(801a;802d)内の前記画像(12)の境界に平行であり、かつスプリット線(811;813)が前記画像(12)の前記境界に併置さ
れ、および
/または前記所定のブロック(801a;802d)の内側に中央に配置されているもののうちの少なくとも1つである、スプリット線(811;813)に沿って前記所定のブロック(801a;802d)を2つのサブブロック(802a、802b;803b、803d)に分割する、垂直方向の2分割または水平方向の2分割
であって、
前記垂直方向の2分割または水平方向の2分割が適用され、前記ブロックが前記画像(12)の前記境界を超えると判定される場合、前記分割は、分割の所定の最大数に達するまでカウントされない、垂直方向の2分割または水平方向の2分割、
のうちの少なくとも1つを、前記利用可能な分割モードのセットから選択するステップと、を含む、方法。
【請求項6】
前記所定のブロックの内側に位置する前記画像の前記境界が垂直であるとき、前記利用可能な分割モードのセットから、前記垂直方向の2分割を選択するステップをさらに備える、請求項5に記載の方法。
【請求項7】
前記所定のブロックの内側に位置する前記画像の前記境界が水平であるとき、前記利用可能な分割モードのセットから、前記水平方向の2分割を選択するステップをさらに備える、請求項5に記載の方法。
【請求項8】
前記所定のブロックが前記画像(12)の角を超えて延びる場合にのみ、前記利用可能な分割モードのセットから、前記4分割を選択するステップをさらに含む、請求項5に記載の方法。
【請求項9】
請求項1または5に記載の方法を実行するように構成された、装置(10)。
【請求項10】
コンピュータまたは信号プロセッサ上で実行されるとき、請求項1または5に記載の方法を実施するための、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像およびビデオの符号化に関する。本発明の実施形態は、特定サイズの入力画像およびビデオデータをより小さな要素(エンティティ)に分割する特定の方法に関する。特に、本発明の実施形態は、再帰的画像信号分割における画像境界処理に関する。
【背景技術】
【0002】
最新のビデオコーディングアプリケーションでは、特定サイズの入力ビデオ信号がより小さなチャンクに分割される[1]。この分割は、各レベルに関連付けられた特定の情報および記述を有する多数の構造で構成される。最先端のビデオコーデックH.265/HEVC[1]では、最も重要な細分割はマクロブロックへの細分割である。これらのマクロブロック、またはコーディングツリーユニット(CTU)は、符号化された画像上の固定グリッドにまたがる事前定義されたサイズ(32x32または64x64の輝度サンプルなど)の二次構造である。他の全ての分割レベルは、この固定の細分割を単位として定義される。例えば、スライスおよびタイルへのより粗い高レベル分割は、含まれるCTUを単位として定義される。
【0003】
H.265/HEVC[1]では、各CTUから開始して、クワッドツリー構造は、固定CTUをフレキシブルサブ構造に再帰的に分割する手段を提供するよう信号伝送される。各レベルでは、定義されたパラメータ範囲で、4つのサブブロックに分割するか、指定したレベルで符号化する必要があるブロックが推測または信号伝達される。このプロセスは、現在の高レベルパラメータで定義されているようにそれ以上の分割が不可能になるか、現在のレベルでそれ以上の分割を実行する必要がないことを示すフラグが読み取られるまで、再帰的に繰り返される。この場合、符号化ユニットの信号と、そのサブ構造の信号が読み取られる。
【0004】
クワッドツリー分割の信号は、時々、省略され、真または偽のいずれかとして推測される場合がある。最も注目すべきは、固定的な性質のため、CTUは必ずしもビデオ画像境界と整列しているとは限らない。この場合、クワッドツリー分割構造のCTUまたはサブブロックが画像境界に完全に含まれていなければ、分割フラグは明示的なシグナリングなしで正と推測される。分割後、サブブロックがビデオ画像境界の完全に外側にあれば、このブロックのそれ以上のシグナリングは読み取られない。
【0005】
H.265/HEVC[1]を超える機能を備えた将来のビデオ規格の開発では、クワッドツリー再帰分割構造がさまざまな分割構成によって拡張される[2]。ブロックが4つの二次サブパートに分割されていない場合、2分割が信号伝達されて、1/2の分割比を使用してこのブロックを2つの長方形ブロックに分割する必要があることを示す。この信号にはまた、分割を水平方向に適用すべきか垂直方向に適用すべきかについての情報も含まれる。このような長方形のブロックは、バイナリツリー分割シンタックスを使用して、より小さな二次または長方形のブロックにさらに再帰的に分割できる。この拡張された分割ツリーはQTBTと呼ばれる[2]。QTBTは、H.265/HEVC規格[1]とまったく同じように、暗黙的な4分割を使用して画像境界を処理する。QTBTでは、ブロックが画像境界を越えると、4分割が推測され、信号は読み取られない。
【0006】
特許文献5では、新しい分割方法である汎用2分割(Generalized Binary Splitting(GBS))について説明しており、これは、4分割を含まない場合もあるが、4分割と共に使用する場合もある。この方法では、2分割は、1/2以外の分割比で分割を実行するように信号伝達できる(QTBTでは、2分割は現在のブロックの中央で分割を実行する)。この分割は、以前の分割に関連するシンタックスを使用して信号伝達される場合もある(例えば、水平および垂直ではなく、垂直および平行)。
【0007】
しかしながら、従来の分割方法は、画像境界の処理においてかなり厳密である。上で説明したように、従来の分割方法では、画像境界で暗黙的な4分割を使用できる。すなわち、従来技術は、画像境界で完全に暗黙的な分割導出を使用している。そのような暗黙的な信号処理は、良好な信号処理効率を可能にする場合がある。しかしながら、これでは柔軟性が低くなる場合がある。
【発明の概要】
【発明が解決しようとする課題】
【0008】
したがって、本発明の目的は、既存の分割方法を拡張して、画像境界処理においてより柔軟にすると同時に、画像境界処理の信号処理のためのビット配分を縮小することである。
【課題を解決するための手段】
【0009】
本発明は、請求項1に記載の画像を符号化する装置と、請求項10に記載の画像を復号する装置と、請求項19に記載の画像を符号化する方法と、請求項20に記載の画像を復号する方法と、請求項21に記載のコンピュータプログラムと、を提供することによる解決策を提供する。
【0010】
第1の態様は、画像を符号化する装置に関する。装置は、再帰的なマルチツリー分割を使用して画像をリーフブロックに分割するように構成されている。すなわち、装置は、当該再帰的なマルチツリー分割を使用して画像をより小さなチャンクに分割するように構成されている。この小さなチャンクは、特定サイズのブロックであり得る。マルチツリーのステップを行うことにより、画像の分割は第1レベルのツリールートブロックから始まり、リーフブロックで終わる場合があり、該リーフブロックは、マルチツリーの最後ブロックであり、したがって、分割の最小の要素である。ツリールートブロックと分割されたリーフブロックとの間で、装置は、1つの分割ツリーレベルから1つまたは複数の後続の分割ツリーレベルに段階的に実行することができ、各ツリーレベルで、特定のツリーレベルの現在のブロックが2つ以上のより小さなブロックに分割される。例えば、HEVCでは、ツリールートブロックは、いわゆるマクロブロックまたはコーディングツリーユニット(CTU)と称され、リーフブロックは、いわゆるサブブロックまたはコーディングユニット(CU)と称される。したがって、CTUは、1つまたは複数のCUに分割することができ、リーフブロック、またはツリールートブロックとリーフブロックとの間のツリーレベルでの任意のブロックをサブブロックと呼ぶことができる。さらに、本開示では、ツリールートブロック、またはリーフブロック、またはツリールートブロックとリーフブロックとの間のツリーレベルでの任意のブロックを所定のブロックと呼ぶことができる。したがって、所定のブロックは、マルチツリー分割の所定のツリーレベルに対応し得る。装置は、ブロックベースのコード体系を利用することができ、すなわち、装置は、画像のリーフブロックへの分割を使用することによって、画像をデータストリームにブロックベースで符号化するように構成される。分割は、スプリットと呼ばれることもある。ツリールートブロックを分割し、より小さなリーフブロックとするには、特定の分割手順を使用して、ブロックをより小さなサブブロックに分割することができる。これらの分割手順は、分割モードと呼ばれることもあり、ツリーレベルごとに分割モードが異なる場合がある。さらに、所定のブロックは、所定のサイズを含み得る。所定のブロックを画像上にグリッドとして配置する場合、そのサイズのために、所定のブロックのいくつかが画像境界を越えて延びる場合がある。例えば、所定のブロックの第1の部分は、画像の内側に置かれ、一方、当該所定のブロックの第2の部分は、画像の外側に置かれることがある。したがって、画像境界は、所定のブロックと交差し得る。一般に、画像境界は、異なる位置で所定のブロックと交差し得る。例えば、画像の角が所定ブロックに含まれると、画像境界は、水平方向、垂直方向、またはその両方で所定のブロックと交差し得る。これらの状況を処理するために、本発明は以下の解決策を提供する。画像をリーフブロックに分割する一方で、装置は、従来技術によって使用される完全に暗黙的な分割導出と比較される分割モードの縮小されたセットを使用することによって、マルチツリー分割の所定のツリーレベルに対応し、かつ画像の境界を越えて延びる所定のブロックを分割するように構成される。本発明によれば、装置は、画像境界が当該所定のブロックと交差する上記の位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを少なくするように構成される。したがって、装置は、1つまたは複数の分割モードの縮小されたセットを得る。縮小されたセットは、分割モードの縮小されたセットで利用可能な分割モードの数を示すカーディナリティを含み得る。したがって、縮小されたセットのカーディナリティが1である場合、すなわち、縮小されたセットが1つの分割モードのみを含む場合、装置は、所定のブロックを分割するためのこの縮小されたセットの分割モードを適用するように構成される。縮小されたセットのカーディナリティが1より大きい場合、すなわち、縮小されたセットが2つ以上の異なる分割モードを含む場合、装置は、縮小されたセットのこれらの分割モードの1つを選択し、所定のブロックを分割するための分割モードの選択された1つを適用するように構成され、装置は、データストリームにおけるそれぞれの選択を信号伝達する。言い換えれば、本発明の装置は、現在の所定のブロックを分割するための分割モードの縮小されたセットを事前に選択することができる。当該事前選択は、画像境界に対するブロックの現在の位置に依存し得る。結果として、本発明の装置は、分割モードの事前に選択された縮小されたセットから好適な分割モードを選択するだけでよい場合がある。これにより、データストリームで選択された分割モードを信号伝達するビット配分が縮小される。これは、分割自体に関する情報を転送する必要がなく、縮小された分割セットが2つ以上の分割モードを含む場合、例えば、1つのビン(bin)で、残りの不確実性のみを信号伝達する必要があるためである。
【0011】
第2の態様は、画像を復号する装置に関する。装置は、再帰的なマルチツリー分割を使用して画像をリーフブロックに分割するように構成されている。装置はさらに、画像のリーフブロックへの分割を使用して、画像をデータストリームからブロックベースで復号するように構成される。装置は、画像をリーフブロックに分割する際に、マルチツリー分割の所定のツリーレベルに対応し、画像の境界を越えて延びる所定のブロックについて、境界が、1つまたは複数の分割モードの縮小されたセットを得るように所定のブロックと交差する位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを縮小するようにさらに構成される。縮小されたセットのカーディナリティが1である場合、装置は、所定のブロックを分割するための縮小されたセットの分割モードを適用するように構成され、縮小されたセットのカーディナリティが1より大きい場合、装置は、縮小されたセットの分割モードの1つを選択し、データストリームにおける信号伝達に従って、所定のブロックを分割するための分割モードの選択された1つを適用するように構成される。当該画像を復号する装置の利点に関しては、画像を符号化する装置の利点を説明する上記の一節を参照されたい。
【0012】
第3の態様は、画像を符号化する方法に関し、本方法は、再帰的なマルチツリー分割を使用して画像をリーフブロックに分割するステップを含む。本方法はさらに、画像のリーフブロックへの分割を使用して、画像をデータストリームにブロックベースで符号化するステップを含む。本方法は、画像をリーフブロックに分割する際に、マルチツリー分割の所定のツリーレベルに対応し、かつ画像の境界を越えて延びる所定のブロックについて、境界が、1つまたは複数の分割モードの縮小されたセットを得るように所定のブロックと交差する位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを縮小するステップをさらに含む。縮小されたセットのカーディナリティが1である場合、本方法は、所定のブロックを分割するための縮小されたセットの分割モードを適用するステップを含み、縮小されたセットのカーディナリティが1より大きい場合、本方法は、縮小されたセットの分割モードの1つを選択するステップと、所定のブロックを分割するための分割モードの選択された1つを適用するステップと、データストリームにおける選択を信号伝達するステップと、を含む。当該画像を符号化する方法の利点に関しては、画像を符号化する装置の利点を説明する上記の一節を参照されたい。
【0013】
第4の態様は、画像を復号する方法に関し、本方法は、再帰的なマルチツリー分割を使用して画像をリーフブロックに分割するステップを含む。本方法はさらに、画像のリーフブロックへの分割を使用して、画像をデータストリームからブロックベースで復号するステップを含む。本方法は、画像をリーフブロックに分割する際に、マルチツリー分割の所定のツリーレベルに対応し、かつ画像の境界を越えて延びる所定のブロックについて、境界が、1つまたは複数の分割モードの縮小されたセットを得るように所定のブロックと交差する位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを縮小するステップをさらに含む。縮小されたセットのカーディナリティが1である場合、本方法は、所定のブロックを分割するための縮小されたセットの分割モードを適用するステップをさらに含み、縮小されたセットのカーディナリティが1より大きい場合、本方法は、縮小されたセットの分割モードの1つを選択するステップと、データストリームにおける信号伝達に従って、所定のブロックを分割するための分割モードの選択された1つを適用するステップと、をさらに含む。当該画像を復号する方法の利点に関しては、画像を符号化する装置の利点を説明する上記の一節を参照されたい。
【0014】
第5の態様によれば、コンピュータプログラムが提供され、コンピュータプログラムの各々は、コンピュータまたは信号プロセッサ上で実行されるときに上記の方法を実装するように構成され、その結果、上記の方法は、コンピュータプログラムのうちの1つによって実装される。
【0015】
本発明の有利な態様は、独立請求項の主題である。従属請求項に定義されている本出願の好ましい実施形態は、図に関して以下に例示的に説明される。
【図面の簡単な説明】
【0016】
【
図1】本出願の実施形態によるイントラ予測概念を実装することができるエンコーダの例として画像を予測的にコード化する装置のブロック図を示す。
【
図2】本出願の実施形態によるイントラ予測概念を実装することができるデコーダの例として、
図1の装置に合う、画像を予測的に復号する装置のブロック図を示す。
【
図3】予測残差信号、予測信号、および再構成信号の間の関係の例を示す概略図を示しており、それぞれ、コーディングモード選択、変換選択、および変換性能の細分割の設定が可能であることを示す。
【
図4A】本概念によるエンコーダの実施形態を示す。
【
図5A】利用可能な分割モードのフルセットを含む完全に制限のない決定ツリーを示す。
【
図5B】本概念による分割モードの縮小されたセットを含む制限のある決定ツリーを示す。
【
図5C】利用可能な分割モードのフルセットを含むさらに完全に制限のない決定ツリーを示す。
【
図5D】本概念による分割モードの縮小されたセットを含む制限のある決定ツリーを示す。
【
図6】ブロックが画像境界を越えて延びるさまざまなケースの概略図を示す。
【
図8A】4分割のみを使用してマクロブロックをリーフブロックに分割する例を示す。
【
図8B】分割モードの縮小されたセットから選択された4分割、垂直方向の4分割、および水平方向の4分割を使用してマクロブロックをリーフブロックに分割する例を示す。
【
図9】本概念による画像を符号化する方法のブロック図を示す。
【
図10】本概念による画像を復号する方法のブロック図を示す。
【発明を実施するための形態】
【0017】
以下の説明では、等しいまたは同等の機能を有する、等しいまたは同等の1つまたは複数の要素は、等しいまたは同等の参照番号で示される。
【0018】
図の以下の説明は、本明細書で説明される概念の多数の例示的かつ非限定的な例および実施形態のいくつかを説明するだけであり得る。CTUは、マクロブロックの非限定的な例として説明され得、一方、CUは、サブブロックの非限定的な例として説明され得る。さらに、(例えば、長方形の)画像は、例えば、多数のタイルから構成されてもよく、各々が画像自体を表す。HEVC[1]では、このようなタイリングは、例えば、全方向性ビデオ用に、画像タイルの高レベル概念によって使用および処理される。このようなタイリングは、CTU解像度で利用できる。このような制限が緩和された場合、「符号化された画像」が多数のタイルで構成され、各々が独自の境界および独自のコンテンツを有する場合がある。その意味で、符号化された画像は、より多くの画像境界を含み得、各タイルが、独自の「画像データ」境界を有する独自の「画像データ」を構成し、本発明で説明されるのと同じ規則が適用され得る。したがって、本明細書で「画像境界」という用語が使用される場合、これは、例えば、1つまたは複数のタイルに属する「現在の画像データ境界」も含み得る。
【0019】
以下の図の説明は、実施形態を組み込むことができるコーディングフレームワークの例を形成するために、ビデオの画像を符号化するためのブロックベースの予測符号化のエンコーダおよびデコーダの説明の提示から始まる。エンコーダおよびデコーダについては、
図1~
図3で説明する。以下、本出願の概念の実施形態の説明は、そのような概念を
図1および
図2のエンコーダおよびデコーダにそれぞれどのように組み込むことができるかに関する説明と共に提示されるが、後続の
図4および以下で説明される実施形態を使用して、
図1および
図2のエンコーダおよびデコーダの基礎となるコーディングフレームワークに従って動作しないエンコーダおよびデコーダを形成することもできる。
【0020】
図1は、変換ベースの残差符号化を使用して、画像12をデータストリーム14に予測符号化する装置の一例を示す。符号化装置、またはエンコーダは、符号10で示される。
図2は、対応する復号装置、またはデコーダ20を示し、これはまた、変換ベースの残差復号を使用して、データストリーム14から画像12’を予測的に復号するように構成された装置であり、ここで、アポストロフィは、デコーダ20によって再構成された画像12’が、予測残差信号の量子化によってもたらされた符号化損失という観点で、装置10によって最初に符号化された画像12から逸脱し得ることを示すために使用されている。
図1および
図2は、変換ベースの予測残差符号化を例示的に使用するが、本出願の実施形態は、この種の予測残差符号化に限定されない。これは、以下に概説されるように、
図1および
図2に関して説明される他の詳細にも当てはまる。
【0021】
エンコーダ10は、予測残差信号を空間-スペクトル変換にかけ、こうして得られた予測残差信号をデータストリーム14に符号化するように構成され得る。同様に、デコーダ20は、データストリーム14からの予測残差信号を復号し、こうして得られた予測残差信号をスペクトル-空間変換にかけるように構成され得る。
【0022】
内部的に、エンコーダ10は、元の信号、すなわち画像12からの信号と予測信号26との偏差を測定するための予測残差24を生成する予測残差信号形成器22を含み得る。予測残差信号形成器22は、例えば、元の信号、すなわち画像12の信号から予測信号を減算する減算器であり得る。エンコーダ10は、予測残差信号24を空間-スペクトル変換し、スペクトル領域予測残差信号24’を取得する変換器28をさらに含み、スペクトル領域予測残差信号24’は、エンコーダ10に含まれる量子化器32によって量子化される。このように量子化された予測残差信号24’’は、ビットストリーム14に符号化される。この目的のために、エンコーダ10は、データストリーム14に変換および量子化される予測残差信号をエントロピー符号化するエントロピー符号化器34を任意選択により備えることができる。予測残差26は、データストリーム14に符号化され、またデータストリーム14から復号可能な予測残差信号24’’に基づいて、エンコーダ10の予測ステージ36によって生成される。この目的のために、予測ステージ36は、
図1に示されるように、量子化損失を除いて信号24’に対応するスペクトル領域予測残差信号24’’’を得るために予測残差信号24’’を逆量子化する逆量子化器38と、続いて、量子化損失を除いて元の予測残差信号24に対応する予測残差信号24’’’’を得るために、予測残差信号24’’’を逆変換、すなわちスペクトル-空間変換にかける逆変換器40と、を内部的に含み得る。次に、予測ステージ36の合成器42は、再構成信号46、すなわち元の信号12の再構成を得るために、予測信号26と予測残差信号24’’’’とを加算し、再合成する。再構成信号46は、信号12’に対応し得る。次に、予測ステージ36の予測モジュール44は、例えば、空間予測、すなわち、イントラ予測、および/または時間予測、すなわち、インター予測を使用することによって、信号46に基づいて予測信号26を生成する。
【0023】
同様に、
図2に示されるように、デコーダ20は、予測ステージ36に対応し、予測ステージ36に対応する方法で相互接続されるコンポーネントから内部的に構成されてもよい。特に、デコーダ20のエントロピー復号器50は、データストリームからの量子化されたスペクトル領域予測残差信号24’’をエントロピー復号することができ、その後、逆量子化器52、逆変換器54、合成器56、および予測モジュール58は、予測ステージ36のモジュールに関して上述した方法で相互接続および協働し、
図2に示されるように、合成器56の出力が再構成信号、すなわち画像12’をもたらすように、予測残差信号24’’に基づいて再構成信号を出力する。
【0024】
上記に具体的に記載されていないが、エンコーダ10が、例えば、あるレートや歪みに関連する基準、すなわち、符号化コストを最適化する方法などのいくつかの最適化スキームに従って、例えば、予測モード、モーションパラメータなどを含むいくつかの符号化パラメータを設定できることは容易に明らかである。例えば、エンコーダ10およびデコーダ20ならびに対応するモジュール44、58は、それぞれ、イントラ符号化モードおよびインター符号化モードなどの異なる予測モードをサポートすることができる。エンコーダおよびデコーダがこれらの予測モードタイプを切り替える粒度は、画像12および12’それぞれの符号化セグメントまたは符号化ブロックへの細分割に対応し得る。これらの符号化セグメントのユニットで、例えば、画像は、イントラ符号化されたブロックとインター符号化されたブロックとに細分割され得る。以下でより詳細に概説するように、イントラ符号化されたブロックは、それぞれのブロックの空間的で、既に符号化/復号された近傍に基づいて予測される。いくつかのイントラ符号化モードが存在し、方向または角度のイントラ符号化モードを含むそれぞれのイントラ符号化されたセグメントに対して選択され得、これにより、それぞれの方向のイントラ符号化モードに特有の特定の方向に沿って近傍のサンプル値を、それぞれのイントラ符号化されたセグメントに外挿することにより、それぞれのセグメントが満たされる。イントラ符号化モードは、例えば、DC符号化モード(これにより、それぞれのイントラ符号化されたブロックの予測がそれぞれのイントラ符号化されたセグメント内のすべてのサンプルにDC値を割り当てる)および/または平面イントラ符号化モード(これにより、隣接するサンプルに基づいて、2次元線形関数によって定義される平面の駆動の傾きとオフセットを用いて、それぞれのブロックの予測が、それぞれのイントラ符号化されたブロックのサンプル位置にわたる2次元線形関数によって記述されるサンプル値の空間分布であると近似または決定される)などの1つまたは複数のさらなるモードを含むことができる。それと比較して、インター符号化ブロックは、例えば、時間的に予測され得る。インター符号化ブロックの場合、動きベクトルはデータストリーム内で信号伝達され得、動きベクトルは、それぞれのインター符号化ブロックの予測信号を得るために、以前に符号化/復号された画像がサンプリングされる場所での、画像12が属するビデオの以前に符号化された画像の部分の空間変位を示す。これは、量子化されたスペクトル領域予測残差信号24’’を表すエントロピー符号化変換係数レベルなど、データストリーム14に含まれる残差信号符号化に加えて、データストリーム14は、符号化モードをさまざまなブロックに割り当てる符号化モードパラメータ、インター符号化セグメント用のモーションパラメータなどのブロックのいくつかのための予測パラメータ、ならびに画像12および12’の細分割をそれぞれセグメントに制御および信号伝達するパラメータなどの任意選択の追加パラメータに符号化されてもよいことを意味する。デコーダ20は、これらのパラメータを使用して、エンコーダが行ったのと同じ方法で画像を細分割し、同じ予測モードをセグメントに割り当て、同じ予測を実行して同じ予測信号を生成する。
【0025】
図3は、再構成画像12’の再構成信号と、データストリームで信号伝達される予測残差信号24’’’’と、予測信号26との組み合わせの関係を示す。上述したように、組み合わせは追加であり得る。予測信号26は、
図3において、ハッチングを使用して例示的に示されるイントラ符号化されたブロック、およびハッチングなしで例示的に示されるインター符号化ブロックへの画像領域の細分として示される。細分割は、ブロックの行および列への画像領域の通常の細分割などの任意の細分割、またはブロックへのクワッドツリー細分割などのさまざまなサイズのリーフブロックへの画像12のマルチツリー細分割であり得、それらの混合が
図3に示され、ここで、画像領域は、最初にツリールートブロックの行および列に細分割され、次に、再帰的なマルチツリー細分割に従ってさらに細分割される。この場合も、データストリーム14は、イントラ符号化されたブロック80のために、いくつかのサポートされたイントラ符号化モードのうちの1つをそれぞれのイントラコード化されたブロック80に割り当てるイントラ符号化モードを有し得る。さらなる詳細を以下で説明する。インター符号化ブロック82の場合、データストリーム14は、その中に符号化された1つまたは複数のモーションパラメータを有することができる。一般的に言えば、インター符号化ブロック82は、時間的符号化に限定されない。あるいは、インター符号化ブロック82は、画像12が属するビデオの以前に符号化された画像、または別のビューもしくはそれぞれスケーラブルなエンコーダおよびデコーダであるエンコーダ10およびデコーダ20の場合の階層的に下層の画像などの現在の画像12自体を超えて以前に符号化された部分から予測された任意のブロックであり得る。
図3の予測残差信号24’’’’はまた、ブロック84への画像領域の細分割として示される。これらのブロックは、符号化ブロック80および82と区別するために、変換ブロックと呼ばれる場合がある。事実上、
図3は、エンコーダ10およびデコーダ20を、それぞれ、画像12および画像12’の異なる細分割を使用してブロックにしている。すなわち、一方はそれぞれ符号化ブロック80および82への細分割、別の方は変換ブロック84への細分割に使用できることを示している。両方の細分割は同じである場合があり、すなわち、各符号化ブロック80および82は、同時に変換ブロック84を形成することができるが、
図3は、例えば、変換ブロック84への細分割が、符号化ブロック80、82への細分割の拡張を形成する場合を示し、これにより、ブロック80と82との2つのブロック間の任意の境界が2つのブロック84間の境界に重なるか、または代替的に言えば、各ブロック80、82は、変換ブロック84の1つと一致するか、または変換ブロック84のクラスターと一致する。しかしながら、細分割はまた、変換ブロック84がブロック80、82の間のブロック境界を交互に横切ることができるように、互いに独立して決定または選択され得る。したがって、変換ブロック84への細分割に関する限り、ブロック80、82への細分割に関して提起されたものと同様のステートメントが当てはまり、すなわち、ブロック84は、画像領域の行および列に配置されたブロックへの通常の細分割の結果、画像領域の再帰的なマルチツリー細分割の結果、またはそれらの組み合わせ、またはその他の種類のブロック化であり得る。余談であるが、ブロック80、82、および84は、二次、長方形、または任意の他の形状に限定されないことに留意されたい。
【0026】
図3は、予測信号26と予測残差信号24’’’’との組み合わせが、結果として直接再構成信号12’となることを示す。しかしながら、代替実施形態によれば、2つ以上の予測信号26を予測残差信号24’’’’と組み合わせて、結果として画像12’を得ることができることに留意されたい。
【0027】
図3では、変換ブロック84は、以下の意味を有するものとする。変換器28および逆変換器54は、これらの変換ブロック84のユニットでそれらの変換を実行する。例えば、多くのコーデックは、すべての変換ブロック84に、ある種のDSTまたはDCTを使用する。いくつかのコーデックは、変換をスキップすることを可能にするので、変換ブロック84のいくつかについて、予測残差信号は、空間領域で直接符号化される。しかしながら、以下に説明する実施形態によれば、エンコーダ10およびデコーダ20は、それらがいくつかの変換をサポートするように構成される。例えば、エンコーダ10およびデコーダ20によってサポートされる変換は、以下を含むことができる。
DCT-II(またはDCT-III)、DCTは離散コサイン変換の略
DST-IV、DSTは離散サイン変換の略
DCT-IV
DST-VII
恒等変換(IT)
【0028】
当然、変換器28はこれらの変換のすべての順方向変換バージョンをサポートするが、デコーダ20または逆変換器54はその対応する逆方向または逆バージョンをサポートするであろう。
逆DCT-II(または逆DCT-III)
逆DST-IV
逆DCT-IV
逆DST-VII
恒等変換(IT)
【0029】
以下の説明は、エンコーダ10およびデコーダ20によってサポートされ得る変換についてのさらなる詳細を提供する。いずれの場合でも、サポートされる変換のセットは、1つのスペクトル-空間または空間-スペクトル変換など、1つの変換のみを含む場合があることに留意されたい。
【0030】
既に上で概説したように、
図1~
図3は、本出願によるエンコーダ10およびデコーダ20の特定の例を形成するために、以下でさらに説明する概念を実装できる例として提示されている。これまでのところ、
図1および
図2のエンコーダ10およびデコーダ20は、それぞれ、本明細書で以下に説明するエンコーダおよびデコーダの可能な実装を表す。ただし、
図1および
図2は単なる例である。本出願の実施形態によるエンコーダは、後に詳述するように、
図1に示したエンコーダとは異なる概念を使用して画像12のブロックベースの符号化を実行することができる。例えば、ビデオエンコーダではないが、静止画エンコーダであり、またインター予測をサポートしていないが、ブロック80への細分割が
図3に例示されているのとは異なる方法で実行されている。さらにはこのエンコーダは、変換予測残差コーディングを使用せず、代わりに、例えば、空間領域で予測残差を直接符号化する。同様に、本出願の実施形態によるデコーダは、以下でさらに概説されるように、データストリーム14からの画像12’のブロックベースの復号を実行することができるが、例えば、
図2のデコーダ20とは異なる場合があり、ビデオデコーダでないが、静止画デコーダである。同じようにイントラ予測をサポートしていない、または同じように
図3に関して説明された方法とは異なる方法でブロックへの画像12’をブロックに細分割する、および/または同じように変換領域では、データストリーム14から予測残差を導出しないが、例えば空間領域では導出する。
【0031】
図4Aは、画像12をデータストリーム14に符号化する装置10の実施形態を示す。画像12は、ブロックに細分割され得るか、または例えば、HEVCベースのコーデックの場合、マクロブロックに細分割され得、CTU、101a、101b、…、101oとも呼ばれる。
【0032】
以下ではエンコーダ10とも呼ばれる装置10は、マクロブロック101a、101b、…、101oをより小さなサブブロック102a、102b、102c、102dに、そして最後にリーフブロック(リーフブロックは、まだ
図4Aに示されていないが、これについては後で
図8Aおよび
図8Bを参照して説明する)にさらに分割するように構成される。エンコーダ10は、再帰的なマルチツリー分割を使用して画像12をリーフブロックに分割するように構成されている。当該リーフブロックをさらに処理するために、エンコーダ10は、画像12をデータストリーム14にブロックベースで符号化するように、すなわち、リーフブロックを符号化することによって、構成される。
【0033】
画像12をデータストリーム14とするブロックベースの符号化は、データストリーム14内のそれぞれの信号を含み得、その信号は、とりわけ、データストリーム14への分割に関する指示、例えば、1つまたは複数の分割パラメータを示す指示、例えば、現在のブロックの分割に使用されている分割モードおよび分割比を含み得る。
【0034】
マルチツリー分割に関して、ブロックは分割ツリーに沿って分割することができ(例えば、
図5A~
図5D)、分割ツリーの各ノードは、画像内のそれぞれのブロックに属することができる。ブロックが分割されている場合、分割されたツリーは、分割レベルとも呼ばれる後続の分割レベルで後続のツリーノードに続くことができる。データストリーム14における上記の信号は、1つまたは複数の分割レベルで行うことができる。いくつかの例によれば、分割パラメータ(例えば、分割モード、分割比など)は、1つまたは複数の分割レベルでデータストリーム14中に信号伝達することができ、いくつかの他の例では、分割パラメータ(例えば、分割モード、分割比など)は、各分割レベルでデータストリーム14中に信号伝達することができる。さらなる例によれば、分割パラメータは、分割ツリーの分割レベルでデータストリーム14中に信号伝達することができ、当該分割レベルのツリーノードは、符号化される画像12の画像境界に置かれる1つまたは複数のブロックに属することができる。データストリーム14における上記の信号は、本明細書に記載される本発明の概念および対応する実施形態の各々に関連して使用され得る。
【0035】
図4Aに戻ると、マクロブロック101a、101b、…、101oは、画像12上の固定グリッドにまたがる所定のサイズの二次構造であることがわかる。この固定グリッドは画像12のサイズを超える可能性があるため、当該グリッドのマクロブロック101a、101b、…、101oのいくつかが画像12の境界を越える可能性があることが時々起こり得る。
図4Aでは、そのようなシナリオは、マクロブロック101e、101m、および101oによって例示的に示されている。
【0036】
例えば、マクロブロック101eに関して、マクロブロック101eの左上部分および左下部分は、画像12の内側に置かれ、一方、マクロブロック101eの右上部分および右下部分は、画像12の外側に置かれる。したがって、マクロブロック101eは、画像12の境界を越えて延び、これにより、画像12の当該境界が特定の位置、すなわち、マクロブロック101eの左上部分および左下部分が画像12の内側に置かれ、一方、マクロブロック101eの右上部分および右下部分が画像12の外側に置かれるような位置でマクロブロック101eと交差する。
【0037】
例えば、マクロブロック101oに関して、マクロブロック101oの左上部分のみが画像12の内側に置かれ、一方、マクロブロック101oの右上、右下、および左下の部分は、画像12の外側に置かれる。さらに、マクロブロック101mについては、マクロブロック101mの左上部分および右上部分が画像12の内側に置かれ、マクロブロック101mの左下部分および右下部分が画像12の外側に置かれる。したがって、画像12のそれぞれの境界は、異なる位置でそれぞれのマクロブロック101e、101m、101oと交差する。マクロブロックの位置、特に画像12の境界に対するマクロブロック101e、101m、101oの位置に関する詳細は、
図6を参照して本文のいくらか後で説明される。
【0038】
上記のように、マクロブロック101a、101b、…、101oは、より小さなサブブロックに分割され得、最後にリーフブロックに分割され得る。サブブロック102a、102b、102c、102dに関して、非限定的な例が示されている。サブブロック自体は、リーフブロックに到達するまで分割にかけられ得る。分割はスプリットとも呼ばれ、マクロブロックおよびサブブロックのそのようなスプリットは、異なる分割モードを使用することによって実行することができる。例としては、4分割、水平方向の2分割(バイスプリットとも呼ばれる)、垂直方向の2分割、水平方向の3分割(トリスプリットとも呼ばれる)、および垂直方向の3分割があり得る。スプリットシグナリングは、バイナリ決定ツリーを使用して実行することができ、当該スプリットシグナリングは、前述の方法でデータストリーム14に示され得る。
【0039】
このような決定ツリーの簡単な説明については、
図5A~
図5Dを参照すればよく、これらの図では、画像境界でのスプリットシグナリングと画像内のスプリットシグナリングとを比較している。
図5Aおよび
図5Cは、画像内のスプリットシグナリングに使用できる完全に制限のない決定ツリーを示し、
図5Bおよび
図5Dは、画像境界でのスプリットシグナリングに使用できる本概念による例示的な制限のある決定ツリーを示す。
【0040】
図5Aの完全に制限のない決定ツリーは、例えば、非特許文献2で説明されるようなクワッドツリープラスバイナリツリー(QTBT)構造に基づき得る利用可能な分割モードのセットとして本概念で使用され得る。QTBTスキームは、ブロックをより小さなブロックに分割するための利用可能な分割モードのセットを含み、利用可能な分割モードのセットは、4つの示された分割モード、すなわち、4分割、分割なし、垂直方向の分割、または水平方向の分割を含む。したがって、ブロックをより小さなブロックに分割するたびに、従来技術のエンコーダは、完全に制限のない決定ツリー、すなわち利用可能な分割モードの完全なセットを常に実行しなければならない場合がある。見てわかるように、決定ツリーで水平方向または垂直方向の分割(すなわち、リーフブロック)に到達するには、3つのビン(bins)を費やす必要がある。エンコーダはさらに、データストリームでそれぞれ選択された分割モードを信号伝達する必要がある。しかしながら、画像境界において、従来技術は、暗黙的な4分割を実行し、データストリーム内の関連する指示を信号伝達することを控えることができる。これにより、画像境界でのブロックの処理が非常に柔軟でなくなる。
【0041】
図5Cの完全に制限のない決定ツリーは、例えば、非特許文献2および非特許文献3で説明されるようなクワッドツリープラスバイナリツリー(QTBT)プラスマルチタイプツリー(MTT)構造に基づき得る利用可能な分割モードのセットとして本概念で使用され得る。QTBT+MTTスキームは、ブロックをより小さなブロックに分割するための利用可能な分割モードのセットを含み、利用可能な分割モードのセットは、6つの示された分割モード、すなわち、4分割、分割なし、垂直方向の2分割、垂直方向の3分割、水平方向の2分割、および水平方向の3分割を含む。したがって、ブロックをより小さなブロックに分割するたびに、従来技術のエンコーダは、完全に制限のない決定ツリー、すなわち利用可能な分割モードの完全なセットを常に実行しなければならない場合がある。この例では、決定ツリーで水平方向または垂直方向の分割(すなわち、リーフブロック)に到達するには、4つのビン(bins)を費やす必要がある。エンコーダはさらに、データストリームでそれぞれ選択された分割モードを信号伝達する必要がある。しかしながら、画像境界において、従来技術は、暗黙的な4分割を実行し、データストリーム内の関連する指示を信号伝達することを控えることができる。これにより、
図5Aと比較して、画像境界でのブロックの処理がさらに柔軟でなくなる。
【0042】
したがって、本発明によれば、エンコーダ10は、利用可能な分割モードのセットを縮小して、
図4Aに示される所定のブロック101e、101m、および101oを参照して以前に例示的に説明されたように、少なくとも画像境界に置かれる(すなわち、少なくとも部分的に画像12の内側にある)所定のブロック(マクロブロックまたはサブブロック)に対して、分割モードの縮小されたセットを提供するように構成される。
【0043】
図5Bおよび
図5Dに例示的に示されるように、前述の分割モードの縮小されたセットは、例えば、正確に2つの分割モードを含み得る。あるいは、分割モードの縮小されたセットは、3つ以上の分割モード、または正確に1つの分割モードを含み得る。
【0044】
例えば、分割モードの縮小されたセットは、4分割(
図7A)および垂直方向の分割を含み得る。垂直方向の分割は、例えば、垂直方向の2分割(
図7B)または垂直方向の3分割(
図7D)であり得る。
【0045】
追加的または代替的に、分割モードの縮小されたセットは、例えば、4分割および水平方向の分割を含み得る。水平方向の分割は、例えば、水平方向の2分割(
図7C)または水平方向の3分割(
図7E)であり得る。
【0046】
追加的または代替的に、分割モードの縮小されたセットは、例えば、垂直方向の分割および水平方向の分割を含み得る。水平方向の分割は、例えば、水平方向の2分割または水平方向の3分割であり得、垂直方向の分割は、例えば、垂直方向の2分割または垂直方向の3分割であり得る。
【0047】
追加的または代替的に、分割モードの縮小されたセットは、例えば、4分割のみを含み得る。
【0048】
追加的または代替的に、分割モードの縮小されたセットは、例えば、4分割が利用できない場合に、水平方向の(2または3)分割または垂直方向の(2または3)分割のいずれかを含み得る。
【0049】
追加的または代替的に、縮小された分割モードは、例えば、水平方向の分割または垂直方向の分割のいずれかであり得る正確に1つの所定の分割モードを含み得る。どの分割を選択するかは、それぞれの画像境界に対する所定のブロックの位置に依存し得、例えば、水平方向の分割は、画像下部の境界の場合に選択され得、一方、垂直方向のスプリットは、画像の右の境界の場合に選択され得る。水平方向の分割は、水平方向の2分割または水平方向の3分割であり得る。垂直方向の分割は、垂直方向の2分割または垂直方向の3分割であり得る。決定ツリーを見てわかるように、例えば、
図5Dでは、水平方向または垂直方向の分割の1つだけが縮小されたセットで利用可能であり得る。
【0050】
上記の各場合において、2分割のうちの1つまたは複数は、例えば、1/2の分割比を含み得る。
【0051】
より一般的な用語で要約すると、本明細書に記載の革新的な原理による縮小された分割セットは、以下のスプリット(分割)を含み得る。
(a)そのようなスプリットが存在する場合、適用されたときに、所与のブロックのさらなるサブ分割を妨げない制限のないスプリット。
(b)そのようなスプリットが存在する場合、画像境界に平行なエッジを設定するスプリット、および
i.そのようなスプリットが存在し、所与のブロックで許可されている場合、スプリットブロックの中央に位置するスプリット、または
ii.そのようなスプリットが存在し、所与のブロックで許可されている場合、画像境界に併置された分割エッジを設定するスプリット。
【0052】
QTBTに基づくが、非特許文献3および非特許文献4、ならびに上記の異なるスプリットの可能性を提供する他の分割スキーム:4分割、垂直方向の3分割、垂直方向の2分割(例えば、分割比が1/2)、水平方向の3分割、および水平方向の2分割(例えば、分割比が1/2)(
図7A~
図7E参照)に対しても有効である本発明の特定の非限定的な実施形態では、本明細書に記載の革新的な原理による縮小されたスプリットセットは、次のようになり得る。
・ 4分割(a)および垂直方向の2分割(例えば、分割比1/2)(b)-iまたは垂直方向の3分割(b)-ii
・ 4分割(a)および水平方向の2分割(例えば、分割比1/2)(b)-iまたは水平方向の3分割(b)-ii
・ 4分割(a)、または水平方向もしくは垂直方向の2分割もしくは3分割、例えば、分割比1/2(例えば、いくつかの制約のために4分割が利用不可であり得る場合)
【0053】
したがって、革新的な原理による分割モードの縮小されたセットは、画像境界でブロックを分割する分割モードの事前に選択されたものを含み得る。エンコーダ10は、画像境界でブロックを分割する分割モードの縮小されたセットに含まれる分割モードの1つを選択することができ、エンコーダ10は、データストリーム14において選択された分割モードを信号伝達することができる。したがって、本概念は、従来技術における暗黙的な4分割と比較した場合、画像境界でのブロックのシグナリングを拡張することができる。しかしながら、エンコーダ10は、データストリーム14の不確実性を信号伝達する必要があるだけであり得、これは、シグナリングの労力を無視できないレベルに保つ。しかしながら、本概念は、従来技術と比較して、画像境界でブロックを分割する際にはるかに高い柔軟性を提供する。この柔軟性の向上は、わずかに高いシグナリングの労力を補う、および/または上回る場合がある。
【0054】
図5Bは、2つの異なる分割モード、すなわち4分割および垂直方向の2分割を含む分割モードの縮小されたセットを例示的に示し得るが、縮小されたセットはまた、4分割および水平方向の2分割、または垂直方向の2分割および水平方向の2分割、または上記の任意の他の組み合わせを含み得る。一例によれば、分割モードの縮小されたセットは、少なくとも1つの分割モードを含み得る。さらなる例によれば、分割モードの縮小されたセットは、少なくとも2つの異なる分割モードを含み得る。さらなる例によれば、分割モードの縮小されたセットは、利用可能な分割モードのセットがこれらの2つの異なる分割モードより多くを含み得るとしても、正確に2つの異なる分割モードのみを含み得る。
【0055】
分割モードの縮小されたセットに含まれるべき分割モードの選択は、画像12の境界に対するそれぞれの所定のブロック101e、101m、101oの位置に依存し得、すなわち、画像12の境界が所定のブロック101e、101m、101oと交差する位置に依存する。
【0056】
言い換えれば、エンコーダ10は、画像12をリーフブロックに分割する際に、マルチツリー分割の所定のツリーレベルに対応し、画像12の境界を越えて延びる所定のブロック101e、101m、101oについて、画像12の境界が、1つまたは複数の分割モードの縮小されたセットを得るように所定のブロック101e、101m、101oと交差する位置に応じて、所定のブロック101e、101m、101oを分割するための利用可能な分割モードのセットを縮小するように構成される。
【0057】
本発明によれば、縮小されたセットのカーディナリティが1である場合、すなわち、分割モードの縮小されたセットが1つの分割モードのみを含み得る場合、エンコーダ10は、所定のブロック101e、101m、101oを分割するためのこの縮小されたセットの分割モードを適用するように構成される。
【0058】
しかしながら、縮小されたセットのカーディナリティが1より大きい場合、すなわち、分割モードの縮小されたセットが2つ以上の分割モードを含む場合、エンコーダ10は、縮小されたセットのこれらの分割モードの1つを選択し、所定のブロック101e、101m、101oを分割するための分割モードの選択された1つを適用するように構成される。さらに、エンコーダ10は、上で説明した方法で、データストリーム14内でそれぞれの選択、すなわち選択された分割モードを信号伝達するように構成される。例えば、エンコーダ10は、1ビットフラグを設定することによって選択を信号伝達することができる。しかしながら、上記のように、分割モードの既に縮小されたセットに含まれる分割モード間の不確実性のみが、データストリーム14で信号伝達されなければならない場合がある。
【0059】
上記のように、縮小されたセットのカーディナリティは、例えば、正確に1つまたは正確に2つであり得る。
【0060】
図4Bは、データストリーム14内の画像12を復号するために対応する装置20を示し、当該装置は、以下ではデコーダ20とも称す。
【0061】
デコーダ20は、再帰的なマルチツリー分割を使用して、画像12をリーフブロックに分割し、画像12のリーフブロックへの分割を使用して、データストリーム14から画像12をブロックベースで復号するように構成される。
【0062】
デコーダ20は、画像12をリーフブロックに分割する際に、マルチツリー分割の所定のツリーレベルに対応し、画像12の境界を越えて延びる所定のブロックについて、画像12の境界が、1つまたは複数の分割モードの縮小されたセットを得るように所定のブロックと交差する位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを縮小するようにさらに構成される。
【0063】
この場合も、縮小されたセットのカーディナリティが1である場合、すなわち、分割モードの縮小されたセットが1つの分割モードのみを含み得る場合、デコーダ20は、所定のブロックを分割するための縮小されたセットの分割モードを適用するように構成される。
【0064】
縮小されたセットのカーディナリティが1より大きい場合、すなわち、分割モードの縮小されたセットが2つ以上の分割モードを含む場合、デコーダ20は、縮小されたセットの分割モードの1つを選択し、データストリーム14における信号伝達に従って、所定のブロックを分割するための分割モードの選択された1つを適用するように構成される。すなわち、デコーダ20は、データストリーム14から信号を導出し、どの分割モードを分割に使用するかをデコーダ20に向けて示すことができる。この信号は、エンコーダ10によってデータストリームに以前に含められた可能性がある上記の1ビットフラグであり得る。
【0065】
したがって、本明細書に記載の概念は、境界処理の新しいメカニズムを提供する。これは、通常、特定のレベルで2つ以上の分割を許可するすべての再帰的な分割方法に適用できる場合がある。この場合も、本概念は、従来技術の暗黙的な分割と比較した場合、画像境界でのブロックの信号処理を拡張することができる。しかしながら、本概念は、従来技術と比較して、画像境界でブロックを分割する際にはるかに高い柔軟性を提供する。この柔軟性の向上は、本概念により、分割モードの縮小されたセットのわずかに高いシグナリングの労力を補う、および/または上回る場合がある。
【0066】
本概念の非限定的な例が、
図4Aと同様の分割された画像12を
図6に示す。しかしながら、
図6は、いくつかのさらなる詳細、すなわち、サイズw
f×h
f(幅×高さ)を有する画像12を示しており、この画像12は、ブロック、例えば、マクロブロック101a、101b、…、101o、より小さなサブブロック、および最後にリーフブロックに細分割される。3つの特定のマクロブロックが強調表示され、丸で囲まれた番号1、2、および3で番号が付けられる。これらの例示的な強調表示されたマクロブロックは、
図4に示した、前述のマクロブロック101e、101m、101oに対応し得る。さらに、リーフブロックについては、
図8Aおよび
図8Bを参照して、本文の後半で詳しく説明する。
【0067】
図6は、画像12を固定サイズの厳密なマクロブロック構造に分割することを示している(例えば、H.265/HEVC[1]でのCTU分割またはH.265/HEVC[2]を超える機能を備えた将来のビデオ規格)。この例では、ビデオ信号の解像度は、単一のマクロブロック101a、101b、…、101oのサイズの倍数に空間的に制限されない場合があると想定され得る。これらの前提条件が与えられている場合、マクロブロック行の最後のマクロブロックおよび/または最後のマクロブロック行のすべてのマクロブロックが、画像12の少なくとも1つの境界を越える場合があると推測され得る。このような場合、このマクロブロックのコーディングユニット(CU)、予測ユニット(PU)、および変換ユニット(TU)への低レベル分割、または任意の他のタイプのサブCTUレベル分割は、コード化された分割が画像12の境界の内側に置かれることを確実にする必要がある。本明細書に記載の概念は、ブロックを分割する縮小されたスプリットセットの定義を可能にすることができ、例えば、マクロブロック101mは、幅w
b、および高さh
bを有する位置x
b、y
bによって定義され、このブロックは、以下の6つのケースのうちの少なくとも1つでサイズw
f×h
fの画像12の境界を越える場合がある。
【0068】
C1:ブロック101eに対応、すなわち、ブロック101eの右上角は画像12に含まれず、左下角は画像12に含まれる(左上角は画像12の内側にある):
xb+wb>wf;yb+hb≦hf;xb≧0;yb≧0、
C2:ブロック101mに対応、すなわち、ブロック101mの右上角は画像12に含まれ、左下角は画像12に含まれない(左上角は画像12の内側にある):
xb+wb≦wf;yb+hb>hf;xb≧0;yb≧0、
C3:ブロック101oに対応、すなわち、右上角および左下角の両方は画像12に含まれない(左上角は画像12の内側にある):
xb+wb>wf;yb+hb>hf;xb≧0;yb≧0、
C4:ブロックの左上角は画像に含まれず、左下角は画像12に含まれず、右上角は画像12に含まれる:
xb<0;yb≧0;xb+wb>0(このケースは、ケース1と同等に処理され、個別に指定されない場合がある)、
C5:ブロックの左上角は画像12に含まれず、右上角は画像12に含まれず、左下角は画像12に含まれる:
xb≧0;yb<0;yb+hb>0(このケースは、ケース2と同等に処理され、個別に指定されない場合がある)、
C6:次のブロック角の1つだけが画像12に含まれる:右下、右上、または左下(このケースは、ケース3と同等に処理され、個別に指定されない)。
【0069】
ケースC1~C6のいずれもが特定の所定のブロックおよび画像12に当てはまらない場合、所定のブロックは画像12の境界の外側にあり得、本明細書に記載の概念にそれ以上関心がない場合がある。2つ以上のケースが同時に当てはまる場合があり、具体的には、ケースペアC1およびC4、C2およびC5、またはC3およびC6が同時に当てはまる場合がある。これらのケースペアはすべて同等に処理されるため、特定のコンステレーションを個別に処理する必要はない。
【0070】
これらのケースC1~C6のうちの少なくとも1つを処理するために、本概念は、実際に利用可能な分割モードのセットから選択された1つまたは複数の分割モードを含み得る分割モードの縮小されたセットを提供する。
【0071】
この実際に利用可能な分割モードのセットは、使用されるブロックベースの符号化スキームに応じて、エンコーダ10によって選択され得る。一例によれば、エンコーダ10は、
・画像境界に対する所定のブロックの場所から独立して、および/または
・所定のブロックが出現する先行するツリーレベルの分割モードのシーケンスに依存して、
所定のブロックの利用可能な分割モードのセットを決定するように構成されてもよい。
【0072】
同じことがデコーダ20にも当てはまる。一例によれば、デコーダ20は、
・ 画像境界に対する所定のブロックの場所から独立して、および/または
・ 所定のブロックが出現する先行するツリーレベルの分割モードのシーケンスに依存して、
所定のブロックの利用可能な分割モードのセットを決定するように構成されてもよい。
【0073】
この場合も、上記のケースC1~C6のうちの少なくとも1つを処理するために、本概念は、実際に利用可能な分割モードのセットから選択された1つまたは複数の分割モードを含み得る分割モードの縮小されたセットを提供する。
【0074】
例えば、縮小されたスプリットセットは、次のスプリットで構成されている場合がある。
(a)そのようなスプリットが存在する場合:適用されたときに、所与のブロックのさらなるスプリットに制限を課さない制限のないスプリット。
(b)ケースC1およびC2の場合、そのようなスプリットが存在する場合:画像12の境界に平行なエッジを設定するスプリット。
i.そのようなスプリットが存在し、所与のブロックで許可されている場合、スプリットブロックの中央に位置するスプリット。
ii.そのようなスプリットが存在し、所与のブロックで許可されている場合、画像12の境界に併置された分割エッジを設定するスプリット。
【0075】
言い換えれば、エンコーダ10は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、利用可能な分割モードのセットから、
・ 所定のツリーレベルに続く後続のツリーレベルの1つまたは複数の後続のスプリットに制限を課さない分割(例えば、上記のスプリット(a)参照)を含む第1の分割モード、および
・ 少なくとも1つのスプリット線に沿って所定のブロックを2つまたは3つのサブブロックに分割するスプリットを含む第2の分割モードのうちの少なくとも1つを選択するように構成されてもよく、
分割線は、所定のブロック内の境界の位置に平行であり、分割線が、所定のブロックの内側に中央に配置されているもの(例えば、上記のスプリット(b)-i参照)、および画像12の境界に併置されるもの(例えば、上記のスプリット(b)-ii参照)のうちの少なくとも1つである。
【0076】
同じことがデコーダ20にもそれぞれ当てはまる。すなわち、デコーダ20は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、利用可能な分割モードのセットから、
・ 所定のツリーレベルに続く後続のツリーレベルの1つまたは複数の後続のスプリットに制限を課さない分割(例えば、上記のスプリット(a)参照)を含む第1の分割モード、および
・ 少なくとも1つの分割線に沿って所定のブロックを2つまたは3つのサブブロックに分割するスプリットを含む第2の分割モードのうちの少なくとも1つを選択するように構成されてもよく、
分割線は、所定のブロック内の境界の位置に平行であり、分割線が、所定のブロックの内側に中央に配置されているもの(例えば、上記のスプリット(b)-i参照)、および画像12の境界に併置されるもの(例えば、上記のスプリット(b)-ii参照)のうちの少なくとも1つである。
【0077】
スプリット(b)-iiが指定したブロックに使用される分割方法で利用可能でない場合、スプリット(b)-iは縮小されたスプリットセットに含まれる場合がある。スプリット(b)-iは、一般的にスプリット(b)-iiよりも優先される場合がある。上記のように、少なくとも1つのスプリットが縮小されたスプリットセットに含まれ得る。
【0078】
一例によれば、スプリット(a)は4分割であり得、スプリット(b)-iは水平方向の2分割または垂直方向の2分割のうちの少なくとも1つであり得る。さらなる例によれば、非特許文献3および非特許文献4で説明されているように追加で導入されたスプリットの1つは、画像12の境界が分割されたブロックの1/4または3/4にある場合、(b)-iiに使用できる。特定の実装では、非特許文献3および/または非特許文献4で導入された追加のスプリットよりも、分割比が1/2の垂直方向または水平方向の分割が優先される場合がある。
【0079】
上記の分割は、
図7A~
図7Eに概略的に示される。
図7Aは、所定のブロック701(マクロブロックまたはサブブロック)が4つの等しい区分71a、71b、71c、71dに分割される4分割(4スプリット)を示す。
図7Bは、分割比1/2の垂直方向の2分割(2スプリット)を示し、所定のブロック702(マクロブロックまたはサブブロック)が2つの等しい垂直方向の区分72a、72bに分割される。
図7Cは、分割比1/2の水平方向の2分割を示し、所定のブロック703(マクロブロックまたはサブブロック)が2つの等しい水平方向の区分73a、73bに分割される。
図7Dは、非特許文献3に記載されているような垂直方向の3分割を示し、所定のブロック704(マクロブロックまたはサブブロック)が3つの垂直方向の区分74a、74b、74cに分割される。
図7Eは、非特許文献3に記載されているような水平方向の3分割を示し、所定のブロック705(マクロブロックまたはサブブロック)が3つの水平方向の区分75a、75b、75cに分割される。
【0080】
一例によれば、
図7Bに示されるような垂直方向の2分割は、画像12のそれぞれの境界がそれぞれの所定のブロック702と交差し、その結果、それぞれのブロック702の内側に置かれる画像12の境界もまた、垂直、すなわち、垂直方向のスプリット線に平行である場合に適用され得る。このような場合は、例えば、
図6に示すようにブロック101eに当てはまり得る。
【0081】
図7Cに示されるような水平方向の2分割は、画像12のそれぞれの境界がそれぞれの所定のブロック703と交差し、その結果、それぞれのブロック703の内側に置かれる画像12の境界もまた、水平、すなわち、水平方向のスプリット線に平行である場合に適用され得る。このような場合は、例えば、
図6に示されるようにブロック101mに当てはまり得る。
【0082】
一般化された2分割((Generalized Binary Splitting(GBS))を使用できるさらなる例によれば、一般化されたGBSツリーがクワッドツリー構造のサブツリーとして使用された場合、スプリット(a)は、分割比が1/2の垂直分割(GBSのデフォルトスプリットであり得る、ただし、分割ツリーがこれまでのところ制限されていない場合)または4分割である場合がある。垂直/平行セマンティクスに変換される可能性のある垂直方向および水平方向の分割は、スプリット(b)-iまたは(b)-iiとして使用できる(おそらく、それに応じて調整された分割修飾子(スプリットモディファイヤー)を使用)。この場合も、他のスプリットが画像12の境界に併置されたスプリットを提供する場合でも、修飾子1/2を使用した分割が優先される場合がある。
【0083】
QTBTに基づき得るが、非特許文献3および非特許文献4で説明されているスキーム、および次の3つのスプリット(4分割、分割比が1/2の垂直方向の分割、および分割比が1/2の水平方向の分割)の可能性を提供する任意の他の分割スキームにも有効であり得るさらなる例では、3つの例示的な縮小されたスプリットセット(RSS)は、
RSS1:4分割(a)および分割比が1/2の垂直方向のスプリット(b)-i、
RSS2:4分割(a)および分割比が1/2の水平方向のスプリット(b)-i、
RSS3:4分割(a)または分割比が1/2の垂直方向もしくは水平方向のスプリット(b)-iのいずれか、であってもよい。
【0084】
分割モードのこれらの例示的な縮小されたセット、すなわち、RSS1、RSS2、およびRSS3は、利用可能な分割モードのセットのサブセットの1つの非限定的な例であり得る。すなわち、分割モードの縮小されたセットは、利用可能な分割モードのセットで(所定のツリーレベルの所定のブロックに対して)利用可能である1つまたは複数の利用可能なスプリットを含み得る。利用可能な分割モードのセットに含まれるスプリットの数は、符号化スキームに応じて変化する場合があり、分割モードの縮小されたセットに含まれるスプリットの数は、画像12の境界に対するそれぞれの所定のブロック(つまり、現在のツリーレベルで分割される)の位置に応じて変化する場合がある。
【0085】
上記のように、エンコーダ10は、利用可能な分割モードのセットを決定することができる。すなわち、エンコーダ10は、どの分割モード(例えば、4分割、垂直方向の2分割、水平方向の2分割など)が利用可能な分割モードのセットに含まれるかを選択的に選択することができる。
【0086】
例えば、上記のブロックベースの符号化スキームは、4分割、少なくとも1つの水平方向の2分割(おそらく異なる修飾子を使用)、および少なくとも1つの垂直方向の2分割(おそらく異なる修飾子を使用)を含む分割モードの基本セットを含み得る。
【0087】
しかしながら、一部のスプリット、特に一部の2分割は制限的である場合がある。例えば、2分割が所定のブロックに適用された場合、4分割は後続のスプリットとして許可されない場合がある。言い換えれば、4分割は、以前のツリーレベルの先行するスプリットが制限的スプリットの1つ、特に制限的2分割の1つを含まない場合にのみ、特定のツリーレベルでのみ許可される場合がある。
【0088】
したがって、制限的スプリットの1つ、特に制限的2分割の1つが、所定のツリーレベルで所定のブロックに適用された場合、後続のスプリットは、上記のプリミティブセットのみを含み、4分割を含まない場合がある。
【0089】
したがって、一実施形態によれば、エンコーダ10は、
・ 所定のブロックが出現する先行するツリーレベルのすべての分割モードが2分割の制限されたセットではない場合、4分割、少なくとも1つの水平方向の2分割、および少なくとも1つの垂直方向の2分割を含む分割モードのプリミティブセットに等しくなり、
・ 所定のブロックが出現する先行するツリーレベルの分割モードが2分割の制限されたセットの1つである場合、分割モードのプリミティブセットから4分割を差し引いたものに等しくなるように、
利用可能な分割モードのセットを決定するように構成されてもよい。
【0090】
同じことがデコーダ20にも当てはまる。したがって、デコーダ20は、
・ 所定のブロックが出現する先行するツリーレベルのすべての分割モードが2分割の制限されたセットではない場合、4分割、少なくとも1つの水平方向の2分割、および少なくとも1つの垂直方向の2分割を含む分割モードのプリミティブセットに等しくなり、
所定のブロックが出現する先行するツリーレベルの分割モードが2分割の制限されたセットの1つである場合、分割モードのプリミティブセットから4分割を差し引いたものに等しくなるように、
利用可能な分割モードのセットを決定するように構成されてもよい。
【0091】
追加的または代替的に、分割モードの上記のプリミティブセットは、少なくとも1つの水平方向の3分割(おそらく異なる修飾子を使用)、および少なくとも1つの垂直方向の3分割(おそらく異なる修飾子を使用)を含み得る。
【0092】
上記のように、エンコーダ10は、分割モードの縮小されたセットを提供するために、利用可能な分割モードのセットを縮小することができる。したがって、エンコーダ10は、所定のブロックごとに、上記の利用可能な分割モードのセットから分割モードの縮小されたサブセット(すなわち、1つまたは複数の分割モード)を選択的に選択することができる。これらの選択的に選択された分割モードのみが、分割モードの縮小されたセットに含まれる場合がある。したがって、分割モードの縮小されたセットは、スプリット(a)による上記の4分割、およびスプリット(b)-iまたはスプリット(b)-iiによるスプリットの1つのうちの少なくとも1つを含み得る。
【0093】
したがって、一実施形態によれば、エンコーダ10は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、利用可能な分割モードのセットから、
・ 4分割(a)、および
・ スプリット線に沿って所定のブロック702、703を2つのサブブロック72a、72b、73a、73bに分割する2分割のうちの少なくとも1つを選択するように構成されてもよく、スプリット線は、所定のブロック702、703内の画像境界の位置に平行であり、かつスプリット線がスプリット(b)-iに従って所定のブロックの内側に中央に配置されているもの、およびスプリット(b)-iiに従って境界に併置されるもののうちの少なくとも1つ
である。
【0094】
この場合も、同じことがデコーダ20にも当てはまる。したがって、デコーダ20は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、利用可能な分割モードのセットから、
・ 4分割(a)、および
・ スプリット線に沿って所定のブロック702、703を2つのサブブロック72a、72b、73a、73bにスプリットする2分割のうちの少なくとも1つを選択するように構成されてもよく、スプリット線は、所定のブロック702、703内の画像境界の位置に平行であり、かつスプリット線がスプリット(b)-iに従って所定のブロックの内側に中央に配置されているもの、およびスプリット(b)-iiに従って境界に併置されるもののうちの少なくとも1つ
である。
【0095】
この場合も、スプリット(b)-iは2分割(おそらく異なる修飾子を使用するが、好ましくは分割比1/2を使用)を含み得、スプリット(b)-iiは2分割および/または3分割(おそらく異なる修飾子を使用)を含み得る。
【0096】
したがって、一実施形態によれば、エンコーダ10は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、利用可能な分割モードのセットから、
・ 4分割(a)、および
・ スプリット線に沿って所定のブロック704、705を3つのサブブロック74a、74b、74c、75a、75b、75cに分割する3分割のうちの少なくとも1つを選択するように構成されてもよく、スプリット線は、所定のブロック704、705内の画像境界の位置に平行であり、かつスプリット線がスプリット(b)-iiに従って境界に併置される。
【0097】
この場合も、同じことがデコーダ20にも当てはまる。したがって、デコーダ20は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、利用可能な分割モードのセットから、
・ 4分割(a)、および
・ スプリット線に沿って所定のブロック704、705を3つのサブブロック74a、74b、74c、75a、75b、75cに分割する3分割のうちの少なくとも1つを選択するように構成されてもよく、スプリット線は、所定のブロック704、705内の画像境界の位置に平行であり、かつスプリット線がスプリット(b)-iiに従って境界に併置される。
【0098】
図8Aおよび
図8Bは、本明細書に記載の概念を、画像境界処理と共にブロックベースの符号化スキームに適用する方法の例を示す。
【0099】
図8Aは、この例では、
図6に示されるようなマクロブロック101oに対応し得る所定のブロックの分割を示す。ブロック101oのハッチングされた部分は、画像12の右下角の位置を表す。この例は、4分割のみを適用することによる、マクロブロック101oのより小さなサブブロックへの分割を示している。
【0100】
それぞれのサブブロックに示される数字は、
図8Aに示されるように、マクロブロック101oのリーフブロック分割に到達するために適用する必要がある4分割の数を示し得る。第1の4分割は、マクロブロック101oを4つの等しいサブブロック801a、801b、801c、801dに分化する。見てわかるように、左側の2つのサブブロック801a、801dのみが、依然として画像12の境界を含み得る。右側の2つのサブブロック801b、801cは、画像12の外側に置かれ、画像12の境界をもはや含まない。それらは破棄され得る。
【0101】
第2の4分割は、左側の2つのサブブロック801a、801dを再び4つのより小さなサブブロックに分化する。見てわかるように、左側の2つのサブブロック802a、802b(第2の4分割に由来する)は、画像12の内側に置かれ、画像境界をもはや含まない。したがって、これらの2つのサブブロック802a、802bは、使用される分割方法に従って、制限のないスプリットセットを使用してさらに分割することができる。これらのブロックのさらなる分割は、本概念に関して本明細書でさらに詳細に説明されない場合がある。
【0102】
しかしながら、残りのサブブロック(第2の4分割から導出)は、すべてに画像境界が含まれている場合があるため、3回目の分割が必要である。当該第3の分割は、番号「3」で示されるリーフブロックにつながる。
【0103】
図8Bは、本明細書で説明されている縮小されたスプリットセットの概念を適用する代替の分割を示す。各サブブロックの数字は、
図8Bに示されるように、マクロブロック101oのリーフブロック分割に到達するために適用する必要がある4分割および非4分割(例えば、2分割)の数を示す。第1の数字は4分割の数を示し得、第2の数字は非4分割の数を示し得る。
【0104】
例えば、左上のリーフブロック802a(1,1)には、1つの4分割および1つの垂直方向の2分割が適用される。隣接する右のリーフブロック803a(1,2)には、1つの4分割および2つの垂直方向の2分割が適用される。隣接する下のリーフブロック803b(2,1)には、2つの4分割および1つの水平方向の2分割が適用される。画像12の右下角にあるリーフブロック803c(3,0)には、3つの4分割が適用され、非4分割は適用されなかった。
【0105】
図8Bでは、実線は4分割によって設定されたエッジ(スプリット線)を示し、破線は垂直方向の2分割によって設定されたエッジ(スプリット線)を示し、一点鎖線は水平方向の2分割によって設定されたエッジ(スプリット線)を示す。
【0106】
より詳細には、第1のツリーレベルでの第1のスプリットとして、4分割が適用され、その結果、4つの等しいサブブロック801a、801b、801c、801dがもたらされる。見てわかるように、左側の2つのサブブロック801a、801dのみが、依然として画像12の境界を含み得る。右側の2つのサブブロック801b、801cは、画像12の外側に置かれ、画像12の境界をもはや含まない。それらは破棄され得る。
【0107】
左上のサブブロック801aは、第2のツリーレベルでさらに分割され得る。サブブロック801aの分割のために、縮小されたスプリットセットを提供し得る。例えば、4分割および垂直方向の2分割のうちの少なくとも1つを含むか、または垂直方向の2分割のみを含む縮小されたスプリットセットを提供し得る。
図8Bに示される例では、サブブロック801aは、第2のツリーレベルで修飾子1/2を用いて垂直方向の2分割にかけられてもよく、スプリット線811は、ブロック801aの内側に中央に配置される。したがって、結果として、左上のサブブロック802aを設定することができる。
【0108】
本概念では、リーフブロックであるサブブロック802aに到達するために、1つの4分割および1つの垂直方向の2分割(したがって、2つのツリーレベルのみ)を適用する必要があるだけである。代わりに、
図8Aでは、
図8Bの1つのみのブロック802aと同じ画像12の領域をカバーするために、2つのブロック802a、802bが必要である。
【0109】
さらに、
図8Bの右隣接ブロック802bは、次に第3のツリーレベルでさらに分割される。サブブロック802bの分割のために、縮小されたスプリットセットを提供し得る。例えば、以前のスプリットは既に垂直方向の2分割であり、これにより、後続の4分割が許可されない場合があるため、少なくとも垂直方向の2分割を含む縮小されたスプリットセットを提供し得る。
図8Bに示される例では、サブブロック802bは、第3のツリーレベルで修飾子1/2を用いて垂直方向の2分割にかけられてもよく、スプリット線812は、ブロック802bの内側に中央に配置され、画像境界に併置される。したがって、左サブブロック803aは、結果として第3のツリーレベルで設定され得、当該左サブブロック803aは、リーフブロックであるが、それはまた、使用される分割方法でさらに分割され得る。
【0110】
本概念では、リーフブロックであるサブブロック803aに到達するために、1つの4分割および2つの垂直方向の2分割(したがって、3つのツリーレベルのみ)を適用する必要があるだけである。代わりに、
図8Aでは、
図8Bの1つのみのブロック803aと同じ画像12の領域をカバーするために、4つのブロックが必要である。しかしながら、エンコーダ10がそのように決定する場合、4分割が常に縮小されたスプリットセットから選択されるならば、
図8Aのように適用され得る。
【0111】
さらに、
図8Bの下隣接ブロック802dは、それぞれ第1および第2のツリーレベルでの2つの連続する4分割から派生し得、ブロック802dは、第3のツリーレベルでさらに分割され得る。サブブロック802dの分割のために、縮小されたスプリットセットを提供し得る。例えば、少なくとも4分割および水平方向の2分割を含む縮小されたスプリットセット、または水平方向の2分割のみを含む縮小されたスプリットセットを提供し得る。
図8Bに示される例では、サブブロック802dは、第3のツリーレベルで修飾子1/2を用いて水平方向の2分割にかけられてもよく、スプリット線813は、ブロック802dの内側に中央に配置され、画像境界に併置される。したがって、サブブロック803bは、結果として第3のツリーレベルで設定され得、ここで、当該サブブロック803bは、リーフブロックである。
【0112】
本概念では、リーフブロックであるサブブロック803bに到達するために、2つの4分割および1つの水平方向の2分割(したがって、3つのツリーレベルのみ)を適用する必要があるだけである。代わりに、
図8Aでは、
図8Bの1つのみのブロック803bと同じ画像12の領域をカバーする1つのみのために、2つのブロックが必要である。
【0113】
ブロック803cはまた、3つの連続する4分割から導出され得るリーフブロックであり得る。リーフブロック803cのこの例は、
図8Aに示される同じブロックの4分割と同一であり得る。画像12の角はリーフブロック803cにつながるブロックに含まれているので、シンタックスは分割モードの縮小されたセットでのみ4分割を提供することを可能にし得る。
【0114】
一例によれば、エンコーダ10は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、所定のブロックが画像12の角を越えて延びる場合にのみ、利用可能な分割モードのセットから、4分割を選択するように構成され得る。
【0115】
同じことがデコーダ20にも当てはまる。したがって、デコーダ20は、利用可能な分割モードのセットを1つまたは複数の分割モードの縮小されたセットに縮小するように、所定のブロックが画像12の角を越えて延びる場合にのみ、利用可能な分割モードのセットから、4分割を選択するように構成され得る。
【0116】
図8Bに示されるように、結果として得られるリーフブロック802a、803a、803b、803cは、画像12の境界を処理するために必要とされる最小の分割を表す。追加的または代替的に、結果として得られるリーフブロック802a、803a、803b、803cは、使用される分割方法の所与の制限内でさらに分割され得る。
【0117】
一般に、最後に少なくとも1つの有効なスプリットが含まれる場合、縮小されたスプリットセットにはさらに制限が課せられる場合がある。これらの制限は、
・ 指定されたブロックサイズの分割可能性(
図8Bを参照)、
・ 指定された深さの分割可能性、
であり得るが、これらに限定されない。
【0118】
後者の箇条書き「指定した深さでの分割可能性」は、次の例を使用して、また
図5Aおよび
図5Bを参照して簡単に説明する。
【0119】
最適な効率を確保するために、純粋に暗黙的な分割導出の代わりに一部のシグナリングが使用されるが、シグナリングする必要があるのは限られた情報のみである。特に、分割自体に関する情報を転送する必要はない。上記の画像境界のケースC1~C3(
図6を参照)では、分割が実行される。縮小されたスプリットセットに2つ以上の要素が含まれている場合は、残りの不確実性のみを信号伝達する必要がある。上記のQTBTに基づく特定の実施形態では、ケースC1(
図5Bを参照)およびC2について1つのバイナリ信号を転送する必要があり、また、C1は4分割および垂直方向の2分割を含む縮小されたスプリットセットを含み得、C2は4分割および水平方向の2分割を含む縮小されたスプリットセットを含み得、ならびにC3は4分割のみを含む縮小されたスプリットセットを含み得るので、ケースC3ではシグナリングは必要ない。
【0120】
本概念には、さらなるシンタックスの制限が適用される場合がある。例えば、分割によって追加の制限が発生した場合、分割されたブロックが画像境界と重なると、それらは完全にまたは部分的に破棄される場合がある。一例によれば、(4分割とは対照的に)後続の2分割の数が制限される場合がある(例えば、分割制限のあるツリーの一部である場合、当該分割がデフォルトの分割でない場合、または本方法がクワッドツリー構造を補完するように使用される場合)。
【0121】
縮小されたセットの一部として画像境界を越えて2分割が適用された場合、この制限の実施ではカウントされない場合がある。
【0122】
したがって、一例によれば、縮小されたセットからの2分割が適用され、連続する2分割の数が所定の最大数の連続する2分割に制限される場合、連続する2分割が画像境界を越えて適用される場合、エンコーダ10が、連続する2分割をカウントしないように構成されてもよい。
【0123】
同じことがデコーダ20にも当てはまる。したがって、縮小されたセットからの2分割が適用され、連続する2分割の数が所定の最大数の連続する2分割に制限される場合、連続する2分割が画像境界を越えて適用される場合、デコーダ20が、連続する2分割をカウントしないように構成されてもよい。
【0124】
他の制限、例えば、4分割以外のスプリットに続く4分割の禁止は、画像境界を越えても(例えば、クワッドツリー構造を補完するものとして使用される場合)、さらに強制される場合がある。
【0125】
図9は、本概念による画像12を符号化する方法のブロック図を示す。
【0126】
ブロック901では、再帰的なマルチツリー分割を使用して画像をリーフブロックに分割する。
【0127】
ブロック902では、画像のリーフブロックへの分割を使用して、画像をデータストリームにブロックベースで符号化する。
【0128】
ブロック903では、所定のブロックについて、画像の境界が所定のブロックと交差する位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを縮小して、1つまたは複数の分割モードの縮小されたセットが得る。
【0129】
縮小されたセットのカーディナリティが1(C=1)である場合、ブロック904に示すように、縮小されたセットの分割モードが、所定のブロックを分割するために適用される。
【0130】
縮小されたセットのカーディナリティが1より大きい場合、ブロック905に示すように、縮小されたセットの分割モードの1つが選択され、分割モードの選択された1つが所定のブロックを分割するために適用される。
【0131】
ブロック906では、選択、すなわち、分割モードの縮小されたセットからの分割モードの選択された1つは、データストリームにおいて信号伝達される。
【0132】
図10は、本概念による画像12を復号する方法のブロック図を示す。
【0133】
ブロック1001では、再帰的なマルチツリー分割を使用して画像をリーフブロックに分割する。
【0134】
ブロック1002では、画像のリーフブロックへの分割を使用して、画像をデータストリームからブロックベースで復号する。
【0135】
ブロック1003では、所定のブロックについて、画像の境界が所定のブロックと交差する位置に応じて、所定のブロックを分割するための利用可能な分割モードのセットを縮小して、1つまたは複数の分割モードの縮小されたセットを得る。
【0136】
縮小されたセットのカーディナリティが1(C=1)である場合、ブロック1004に示すように、縮小されたセットの分割モードが、所定のブロックを分割するために適用される。
【0137】
縮小されたセットのカーディナリティが1より大きい場合、ブロック1005に示すように、縮小されたセットの分割モードの1つが選択され、分割モードの選択された1つが所定のブロックを分割するために適用される。
【0138】
ブロック1006に示されるように、分割モードの縮小されたセットからの分割モードの1つの選択は、データストリームにおける信号伝達に基づく。
【0139】
図9および
図10のブロック図のブロックによってそれぞれ表される方法ステップはまた、示されるものとは異なる順序で実行することができる。
【0140】
いくつかの態様が装置の文脈で説明されたが、これらの態様は、対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部またはすべては、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(または使用して)実行することができる。いくつかの実施形態では、最も重要な方法ステップの1つまたは複数は、そのような装置によって実行することができる。
【0141】
特定の実装要件に応じて、本発明の実施形態は、ハードウェアで、もしくはソフトウェアで、または少なくとも部分的にハードウェアで、もしくは少なくとも部分的にソフトウェアで実装することができる。実装は、電子的に可読な制御信号が格納されているデジタル記憶媒体、例えば、フロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行でき、そこで、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または協働することができる)。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。
【0142】
本発明によるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に可読な制御信号を有するデータキャリアを含む。
【0143】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに本方法の1つを実行するように動作する。プログラムコードは、例えば、機械可読キャリアに格納されてもよい。
【0144】
他の実施形態は、機械可読キャリアに格納された、本明細書に記載の方法の1つを実行するコンピュータプログラムを含む。
【0145】
したがって、言い換えれば、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法の1つを実行するプログラムコードを有するコンピュータプログラムである。
【0146】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するコンピュータプログラムを含む(記録した)データキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、通常、有形および/または非一時的である。
【0147】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、インターネットなどのデータ通信接続を介して転送されるように構成されてもよい。
【0148】
さらなる実施形態は、本明細書に記載の方法の1つを実行するように構成または適合されたプロセス手段、例えば、コンピュータまたはプログラム可能なロジックデバイスを含む。
【0149】
さらなる実施形態は、本明細書に記載の方法の1つを実行するコンピュータプログラムがインストールされているコンピュータを含む。
【0150】
本発明によるさらなる実施形態は、本明細書に記載の方法の1つを実行するコンピュータプログラムを(例えば、電子的または光学的に)受信機に転送するように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含み得る。
【0151】
いくつかの実施形態では、プログラム可能なロジックデバイス(例えば、FPGA)を使用して、本明細書に記載の方法の機能の一部またはすべてを実行することができる。いくつかの実施形態では、FPGAは、本明細書に記載の方法の1つを実行するために、マイクロプロセッサと協働し得る。一般に、本方法は、好ましくは、任意のハードウェア装置によって実行される。
【0152】
本明細書に記載の装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組み合わせを使用して実装することができる。
【0153】
本明細書に記載の方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組み合わせを使用して実行することができる。
【0154】
上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載された配置および詳細の修正および変形は、当業者には明らかであろうことが理解される。したがって、特許請求の範囲によってのみ限定され、本明細書の実施形態の説明および説明として提示された特定の詳細によって限定されないことが意図されている。
【0155】
参考文献
[1]ITU-T and ISO/IEC.High efficiency video coding.ITU-T Recommendation H.265|ISO/IEC23008 10(HEVC)、edition1、2013;edition2、2014.
[2]J.Chen、E.Alshina、G.J.Sullivan、J-R.Ohm、J.Boyce、Algorithm Description of Joint Exploration Test Model 6(JEM 6)、JVET、doc.JVET-F1001、April 2017.
[3]X.Li、H.-C.Chuang、J.Chen、M.Karczewicz、L.Zhang、X.Zhao、A.Said、Multi-Type-Tree、JVET、doc.JVET-D0117、Oct.2016.
[4]F.Le Leannec、T.Poirier、F.Urban、Asymmetric Coding Units in QTBT、JVET、doc.JVET-D0064、Oct.2016.
[5]未公開欧州特許出願第17182209.1号