IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特開2024-116271ビデオ符号化における境界ブロックのパーティション分割
<>
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図1A
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図1B
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図2
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図3
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図4
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図5
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図6
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図7A
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図7B
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図8
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図9A
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図9B
  • 特開-ビデオ符号化における境界ブロックのパーティション分割 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024116271
(43)【公開日】2024-08-27
(54)【発明の名称】ビデオ符号化における境界ブロックのパーティション分割
(51)【国際特許分類】
   H04N 19/119 20140101AFI20240820BHJP
   H04N 19/176 20140101ALI20240820BHJP
   H04N 19/136 20140101ALI20240820BHJP
【FI】
H04N19/119
H04N19/176
H04N19/136
【審査請求】有
【請求項の数】14
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024092958
(22)【出願日】2024-06-07
(62)【分割の表示】P 2022196007の分割
【原出願日】2019-06-27
(31)【優先権主張番号】62/697,274
(32)【優先日】2018-07-12
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/818,996
(32)【優先日】2019-03-15
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ガオ,ハン
(72)【発明者】
【氏名】チェン,ジエンローァ
(72)【発明者】
【氏名】エセンリク,セミ
(72)【発明者】
【氏名】ジャオ,ジージエ
(72)【発明者】
【氏名】コトラ,アナンド・メハー
(57)【要約】      (修正有)
【課題】エンコード及びデコードのためのパーティション分割をする方法、復号化装置、符号化装置及び記憶媒体を提供する。
【解決手段】方法は、画像の現在のブロックが境界ブロックであるかどうか、及び現在のブロックのサイズが最小許容四分木リーフノードサイズよりも大きいかどうかを判定するステップと、現在のブロックが境界ブロックであり、且つ、現在のブロックのサイズが最小許容四分木リーフノードサイズ(MinQTSize)より大きくない場合に、現在のブロックに強制二分木(BT)パーティション分割を適用するステップと、画像の現在のブロックが境界ブロックであり、且つ、現在のブロックのサイズが最小許容四分木(QT)リーフノードサイズ(MinQTSize)以下であると判定するステップと、判定に応じて、現在のブロックに強制二分木(BT)パーティション分割を適用するステップと、を含む。
【選択図】図7A
【特許請求の範囲】
【請求項1】
パーティション分割方法であって、当該パーティション分割方法は、
最初にスライスをコーディングツリーユニット(CTUs)にパーティション分割するステップと、
画像の現在のブロックが境界ブロックであるかどうか、及び前記現在のブロックのサイズが最小許容四分木リーフノードサイズよりも大きいかどうかを判定するステップと、
前記現在のブロックが前記境界ブロックであり、且つ前記現在のブロックの前記サイズが前記最小許容四分木リーフノードサイズ(MinQTSize)より大きくない場合に、前記現在のブロックに強制二分木(BT)パーティション分割を適用するステップと、を含む、
パーティション分割方法。
【請求項2】
前記強制二分木パーティション分割は、前記現在のブロックが前記画像の下部境界に位置している場合に再帰的な水平方向の強制バイナリ・パーティション分割である、又は前記現在のブロックが前記画像の右側の境界に位置している場合に再帰的な垂直方向の強制境界パーティション分割である、請求項1に記載のパーティション分割方法。
【請求項3】
前記強制二分木パーティション分割は、リーフノードブロックが前記画像内に入るまで継続される、請求項1又は2のパーティション分割方法。
【請求項4】
前記強制二分木パーティション分割は、
前記現在のブロックのサブパーティションが前記画像の下部境界に位置するまで、前記現在のブロックを水平方向の強制境界パーティション分割によって再帰的にパーティション分割するステップと、
リーフノードが前記画像の右側の境界に完全に位置するまで、前記サブパーティションを垂直方向の強制境界パーティション分割によって再帰的にパーティション分割するステップと、を含む、請求項1乃至3のいずれか一項に記載のパーティション分割方法。
【請求項5】
前記強制二分木パーティション分割は、
前記現在のブロックのサブパーティションが下部境界に位置するまで、前記現在のブロックを垂直方向の強制境界パーティション分割によって再帰的にパーティション分割するステップと、
リーフノードが右側の境界に完全に位置するまで、前記サブパーティションを水平方向の強制境界パーティション分割によって再帰的にパーティション分割するステップと、を含む、請求項1乃至3のいずれか一項に記載のパーティション分割方法。
【請求項6】
前記境界ブロックは、完全に前記画像の内側になく、且つ完全に前記画像の外側にないブロックである、請求項1乃至5のいずれか一項に記載のパーティション分割方法。
【請求項7】
請求項1乃至6のいずれか一項に記載の前記パーティション分割方法に従ってブロックをパーティション分割することにより、前記ブロックを復号化する復号化方法。
【請求項8】
シーケンスパラメータセット(SPS)を介して前記最小許容四分木リーフノードサイズを受信するステップをさらに含む、請求項7に記載の復号化方法。
【請求項9】
請求項1乃至6のいずれか一項に記載の前記パーティション分割方法に従ってブロックをパーティション分割することにより、前記ブロックを符号化する符号化方法。
【請求項10】
シーケンスパラメータセット(SPS)を介して前記最小許容四分木リーフノードサイズを送信するステップをさらに含む、請求項9に記載の符号化方法。
【請求項11】
請求項1乃至6のいずれか一項に記載の前記パーティション分割方法に従ってブロックをパーティション分割することにより、前記ブロックを復号化するように構成された論理回路を含む復号化装置。
【請求項12】
前記論理回路は、シーケンスパラメータセット(SPS)を介して前記最小許容四分木リーフノードサイズを受信するようにさらに構成される、請求項11に記載の復号化装置。
【請求項13】
請求項1乃至6のいずれか一項に記載の前記パーティション分割方法に従ってブロックをパーティション分割することにより、前記ブロックを符号化するように構成された論理回路を含む符号化装置。
【請求項14】
命令を記憶するための非一時的な記憶媒体であって、前記命令がプロセッサによって実行されると、該プロセッサに請求項1乃至10のいずれか一項に記載の方法のいずれかを実行させる、
非一時的な記憶媒体。


【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、Futurewei Technologies, Inc.によって2018年7月12日に出願された、“A Video Encoder, A Video Decoder and Corresponding Methods”という表題の米国仮特許出願第62/697,274号及びFuturewei Technologies, Inc.によって2019年3月15日に出願された、“Boundary Block Partitioning in Video Coding”という表題の米国仮特許出願第62/818,996号に対して優先権を主張するものであり、これらの文献は参照により組み込まれる。
【0002】
本願の実施形態は、概して、ビデオ符号化の分野に関し、より具体的には、符号化ユニットの分割(splitting)及びパーティション分割(partitioning)に関する。
【背景技術】
【0003】
比較的短いビデオでも描写するために必要なビデオデータの量はかなりの量になる可能性があり、帯域幅容量が制限された通信ネットワークを介してデータをストリーミング又は通信する場合に問題が発生する可能性がある。こうして、ビデオデータは、現代の電気通信ネットワークを介して通信される前に通常圧縮される。ビデオが記憶装置に格納される場合に、メモリリソースが制限される可能性があるため、ビデオのサイズも問題になる可能性がある。ビデオ圧縮装置は、大抵の場合、ソースでソフトウェア及び/又はハードウェアを使用して送信又は保存の前にビデオデータを符号化し、それによりデジタルビデオ画像を表すために必要なデータの量を減らす。次に、圧縮したデータは、ビデオデータをデコードするビデオ解凍装置によって送信先で受信される。ネットワークリソースが限られており、且つより高いビデオ品質に対する要求が益々高まっているため、画質を殆ど又は全く犠牲にすることなく圧縮率を高める、改善した圧縮及び解凍技術が望まれている。
【発明の概要】
【0004】
本願(又は本開示)の実施形態は、エンコード及びデコードのための機器及び方法を提供する。
【0005】
第1の態様は、パーティション分割方法に関し、このパーティション分割方法は、画像の現在のブロックが境界ブロックであるかどうか、且つ現在のブロックのサイズが最小許容四分木リーフノードサイズよりも大きいかどうかを判定するステップと;現在のブロックが境界ブロックであり、且つ現在のブロックのサイズが最小許容四分木リーフノードサイズ(MinQTSize)より大きくない場合に、現在のブロックに強制二分木(BT)パーティション分割を適用するステップと;を含む。
【0006】
第1の態様自体による方法の第1の実施態様では、強制二分木パーティション分割は、現在のブロックが画像の下部境界に位置している場合に再帰的な水平方向の強制バイナリ・パーティション分割である、又は現在のブロックが画像の右側の境界に位置している場合に再帰的な垂直方向の強制境界パーティション分割である。
【0007】
第1の態様自体又は第1の態様の先行する任意の実施態様による方法の第2の実施態様では、強制二分木パーティション分割は、リーフノードブロックが画像内に入るまで継続される。
【0008】
第1の態様自体又は第1の態様の先行する任意の実施態様による方法の第3の実施態様では、強制バイナリ・パーティション分割は、現在のブロックのサブパーティションが画像の下部境界に配置されるまで、水平方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが画像の右側の境界に完全に配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0009】
第1の態様自体又は第1の態様の先行する任意の実施態様による方法の第4の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、垂直方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、水平方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0010】
第1の態様自体又は第1の態様の先行する任意の実施態様による方法の第5の実施態様では、方法は、非境界ブロックのパーティション分割を制御するために最小許容四分木リーフノードサイズを適用するステップをさらに含む。
【0011】
第1の態様自体又は第1の態様の先行する任意の実施態様による方法の第6の実施態様では、境界ブロックは、完全に画像の内側になく、且つ完全に画像の外側にないブロックである。
【0012】
第2の態様は、第1の態様自体又は第1の態様の先行する任意の実施態様に従ってブロックをパーティション分割することにより、ブロックをデコードするためのデコード化方法に関する。
【0013】
第2の態様自体による方法の第1の実施態様では、この方法は、シーケンスパラメータセット(SPS)を介して最小許容四分木リーフノードサイズを受信するステップをさらに含む。
【0014】
第3の態様は、第1の態様自体又は第1の態様の先行する任意の実施態様に従ってブロックをパーティション分割することにより、ブロックをエンコードするためのエンコード化方法に関する。
【0015】
第3の態様自体による方法の第1の実施態様では、この方法は、シーケンスパラメータセット(SPS)を介して最小許容四分木リーフノードサイズを送信するステップをさらに含む。
【0016】
第4の態様は、第1の態様自体又は第1の態様の先行する任意の実施態様のパーティション分割方法に従ってブロックをパーティション分割することにより、ブロックをデコードするように構成された論理回路を含むデコード化装置に関する。
【0017】
第4の態様自体によるデコード化装置の第1の実施態様では、論理回路は、シーケンスパラメータセット(SPS)を介して最小許容四分木リーフノードサイズを受信するようにさらに構成される。
【0018】
第5の態様は、第1の態様自体又は第1の態様の先行する任意の実施態様のパーティション分割方法に従ってブロックをパーティション分割することにより、ブロックをエンコードするように構成された論理回路を含むエンコード化装置に関する。
【0019】
第5の態様自体によるエンコード化装置の第1の実施態様では、論理回路は、シーケンスパラメータセット(SPS)を介して最小許容四分木リーフノードサイズを送信するようにさらに構成される。
【0020】
第6の態様は、命令を記憶するための非一時的な記憶媒体に関し、命令がプロセッサによって実行されると、プロセッサに、第1、第2、又は第3の態様自体のいずれか、或いは第1、第2、又は第3の態様の先行する任意の実施態様を実行させる。
【0021】
第7の態様は、方法に関し、この方法は、画像の現在のブロックが境界ブロックであり、且つ現在のブロックのサイズが最小許容四分木(QT)リーフノードサイズ(MinQTSize)以下であると判定を行うステップと;判定に応じて、現在のブロックに強制二分木(BT)パーティション分割を適用するステップと;を含む。
【0022】
第7の態様自体による方法の第1の実施態様では、現在のブロックは、画像の下部境界に位置しており、強制BTパーティション分割は、再帰的な水平方向の強制BTパーティション分割である。
【0023】
第7の態様自体又は第7の態様の先行する任意の実施態様による方法の第2の実施形態では、現在のブロックは、画像の右側の境界に位置しており、強制BTパーティション分割は、再帰的な垂直方向の強制BTパーティション分割である。
【0024】
第7の態様自体又は第7の態様の先行する任意の実施態様による方法の第3の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、水平方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0025】
第7の態様自体又は第7の態様の先行する任意の実施態様による方法の第4の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、垂直方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、水平方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0026】
第7の態様自体又は第7の態様の先行する任意の実施態様による方法の第5の実施態様では、この方法は、非境界ブロックのパーティション分割を制御するためにMinQTSizeを適用するステップをさらに含む。
【0027】
第7の態様自体又は第7の態様の先行する任意の実施態様による方法の第6の実施態様では、この方法は、シーケンスパラメータセット(SPS)を介してMinQTSizeを受信するステップをさらに含む。
【0028】
第7の態様自体又は第7の態様の先行する任意の実施態様による方法の第7の実施態様では、この方法は、シーケンスパラメータセット(SPS)を介してMinQTSizeを送信するステップをさらに含む。
【0029】
第8の態様は、機器に関し、この機器は、メモリと;メモリに結合されるプロセッサと;を含み、プロセッサは、画像の現在のブロックが境界ブロックであるかどうかを判定し;現在のブロックが境界ブロックである場合に、現在のブロックのサイズが最小許容四分木(QT)リーフノードサイズ(MinQTSize)より大きいかどうかを判定し;現在のブロックのサイズがMinQTSizeより大きくない場合に、現在のブロックに強制二分木(BT)パーティション分割を適用する;ように構成される。
【0030】
第8の態様自体による機器の第1の実施態様では、強制BTパーティション分割は、現在のブロックが画像の下部境界に位置している場合に再帰的な水平方向の強制BTパーティション分割である、又は現在のブロックが画像の右側の境界に位置している場合に再帰的な垂直方向の強制BTパーティション分割である。
【0031】
第8の態様自体又は第8の態様の先行する任意の実施態様による機器の第2の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、水平方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0032】
第8の態様自体又は第8の態様の先行する任意の実施態様による機器の第3の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、垂直方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、水平方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0033】
第8の態様自体又は第8の態様の先行する任意の実施態様による機器の第4の実施態様では、プロセッサは、非境界ブロックのパーティション分割を制御するためにMinQTSizeを適用するようにさらに構成される。
【0034】
第8の態様自体又は第8の態様の先行する任意の実施態様による機器の第5の実施態様では、機器は、プロセッサに結合され、且つシーケンスパラメータセット(SPS)を介してMinQTSizeを受信するように構成された受信機をさらに含む。
【0035】
第8の態様自体又は第8の態様の先行する任意の実施態様による機器の第6の実施態様では、機器は、プロセッサに結合され、且つシーケンスパラメータセット(SPS)を介してMinQTSizeを送信するように構成された送信機をさらに含む。
【0036】
第9の態様は、非一時的な媒体に記憶されたコンピュータ実行可能命令を含むコンピュータプログラム製品に関し、命令がプロセッサによって実行されると、機器に、画像の現在のブロックが境界ブロックであるかどうかを判定することと;現在のブロックが境界ブロックである場合に、現在のブロックのサイズが最小許容四分木(QT)リーフノードサイズ(MinQTSize)より大きいかどうかを判別することと;現在のブロックのサイズ0がMinQTSizeより大きくない場合に、現在のブロックに強制二分木(BT)パーティション分割を適用することと;を行わせる。
【0037】
第9の態様自体によるコンピュータプログラム製品の第1の実施態様では、強制BTパーティション分割は、現在のブロックが画像の下部境界に位置している場合に再帰的な水平方向の強制BTパーティション分割である、又は現在のブロックが画像の右側の境界に位置している場合に再帰的な垂直方向の強制BTパーティション分割である。
【0038】
第9の態様自体又は第9の態様の先行する任意の実施態様によるコンピュータプログラム製品の第2の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、水平方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0039】
第9の態様自体又は第9の態様の先行する任意の実施態様によるコンピュータプログラム製品の第3の実施態様では、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、垂直方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと;リーフノードが右側の境界に完全に配置されるまで、水平方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと;を含む。
【0040】
第9の態様自体又は第9の態様の先行する任意の実施態様によるコンピュータプログラム製品の第4の実施形態では、命令はさらに、機器に、非境界ブロックのパーティション分割を制御するためにMinQTSizeを適用させる。
【0041】
第9の態様自体又は第9の態様の先行する任意の実施態様によるコンピュータプログラム製品の第5の実施態様では、命令はさらに、機器に、シーケンスパラメータセット(SPS)を介してMinQTSizeを受信させる。
【0042】
第9の態様自体又は第9の態様の先行する任意の実施態様によるコンピュータプログラム製品の第6の実施態様では、命令はさらに、機器に、シーケンスパラメータセット(SPS)を介してMinQTSizeを送信させる。
【0043】
明確にするために、本明細書に開示される実施形態のいずれか1つを、他の実施形態のいずれか1つ又は複数と組み合わせて、本開示の範囲内で新しい実施形態を形成することができる。
【0044】
これら及び他の特徴は、添付の図面及び特許請求の範囲と併せて考慮される以下の詳細な説明からより明確に理解されるであろう。
【図面の簡単な説明】
【0045】
本開示のより完全な理解のために、添付の図面及び詳細な説明に関連して考慮される以下の簡単な説明が参照され、同様の参照符号は同様の部分を表す。
図1A】本開示の実施形態を実現することができる例示的な符号化システムを示すブロック図である。
図1B】本開示の実施形態を実現することができる別の例示的な符号化システムを示すブロック図である。
図2】本開示の実施形態を実現することができる例示的なビデオエンコーダを示すブロック図である。
図3】本開示の実施形態を実現することができるビデオデコーダの例を示すブロック図である。
図4】本開示の一実施形態によるネットワーク装置の概略図である。
図5】例示的な実施形態による図1Aの送信元装置12及び送信先装置14のいずれか又は両方を使用することができる機器の簡略化したブロック図である。
図6図6A図6FはVVCにおける様々なCU分割モードを示す図である。
図7A】HD(1920×1080)の下部境界CTU(128×128)強制QTパーティションを示す図である。
図7B】本開示の一実施形態による、HD(1920×1080)の下部境界CTU(128×128)強制BTパーティションを示す図である。
図8】例示的な境界規定を示す図である。
図9A】本開示の一実施形態による、コーナーケース強制QTBTパーティションの例を示す図である。
図9B】本開示の一実施形態による、コーナーにあるブロックに関する強制QTBTパーティションの例を示す図である。
図10】境界規定の実施形態を示す図である。
【発明を実施するための形態】
【0046】
最初に、1つ又は複数の実施形態の例示的な実施態様が以下に提供されるが、開示するシステム及び/又は方法は、現在知られているか又は存在するかにかかわらず、任意の数の技術を使用して実現できることを理解されたい。本開示は、本明細書で例示及び説明する例示的な設計及び実施態様を含む、以下で例示する例示的な実施態様、図面、及び技術に決して限定すべきではなく、それらの全範囲の同等物とともに添付の特許請求の範囲内で修正され得る。
【0047】
図1Aは、本開示の実施形態を実現することができる例示的な符号化システム10、例えばビデオ符号化システム10を示すブロック図である。符号化システム10は、予測技術、例えば双方向予測技術を利用することができる。図1Aに示されるように、符号化システム10は、(送信先(destination:宛先)装置14によって後でデコードされる)エンコード化ビデオデータを提供する送信元(source:ソース)装置12を含む。特に、送信元装置12は、ビデオデータを、コンピュータ可読媒体16を介して送信先装置14に提供することができる。送信元装置12及び送信先装置14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」電話、いわゆる「スマート」パッド等の電話ハンドセット、テレビ、カメラ、表示装置、デジタルメディアプレーヤー、ビデオゲームコンソール、又はビデオストリーミング装置等を含む、広範囲の装置を含むか、又はそれらのいずれかであり得る。場合によっては、送信元装置12及び送信先装置14は、無線通信のために装備され得る。
【0048】
送信先装置14は、コンピュータ可読媒体16を介してデコード化されるエンコード化ビデオデータを受信することができる。コンピュータ可読媒体16は、エンコード化ビデオデータを送信元装置12から送信先装置14に移動することができる任意のタイプの媒体又は装置を含むことができる。一例では、コンピュータ可読媒体16は、送信元装置12がエンコード化ビデオデータを送信先装置14にリアルタイムで直接送信するのを可能にする通信媒体を含み得る。エンコード化ビデオデータは、無線通信プロトコル等の通信規格に従って変調され、送信先装置14に送信され得る。通信媒体は、無線周波数(RF)スペクトル或いは1つ又は複数の物理的な伝送ライン等の任意の無線又は有線通信媒体を含み得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク等のパケットベースのネットワーク、又はインターネット等のグローバルネットワークの一部を形成することができる。通信媒体は、送信元装置12から送信先装置14への通信を容易にするのに有用であり得るルータ、スイッチ、基地局、又は他の任意の機器を含み得る。
【0049】
いくつかの例では、エンコード化データは、出力インターフェイス22から記憶装置に出力され得る。同様に、エンコード化データは、入力インターフェイス28によって記憶装置からアクセスされ得る。記憶装置は、ハードドライブ、Blu-ray(登録商標)ディスク、デジタルビデオディスク(DVD)、コンパクトディスク読取り専用メモリ(CD-ROM)、フラッシュメモリ、揮発性又は不揮発性メモリ、又はエンコード化ビデオデータを格納するための任意の他の適切なデジタルストレージメディア等の様々な分散又はローカルアクセスされるデータ記憶媒体のいずれかを含み得る。更なる例では、記憶装置は、送信元装置12によって生成されたエンコード化ビデオを記憶し得るファイルサーバ又は別の中間記憶装置に対応し得る。送信先装置14は、ストリーミング又はダウンロードを介して記憶装置から格納したビデオデータにアクセスすることができる。ファイルサーバは、エンコード化ビデオデータを格納し、そのエンコード化ビデオデータを送信先装置14に送信することができる任意のタイプのサーバであり得る。ファイルサーバの例には、(例えば、ウェブサイトのための)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、ネットワーク接続ストレージ(NAS)装置、又はローカルディスクドライブが含まれる。送信先装置14は、インターネット接続を含む任意の標準データ接続を介して、エンコード化ビデオデータにアクセスすることができる。これには、無線チャネル(例えば、Wi-Fi(登録商標)接続)、有線接続(例えば、デジタル加入者線(DSL)、ケーブルモデム等)、又はファイルサーバに格納したエンコード化ビデオデータへのアクセスに適した両方の組合せが含まれ得る。記憶装置からのエンコード化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、又はこれらの組合せであり得る。
【0050】
本開示の技術は、必ずしも無線用途又は設定に限定されない。この技術は、地上波テレビ放送、ケーブルテレビ送信、衛星テレビ送信、HTTPを介した動的適応ストリーミング(DASH)等のインターネットストリーミングビデオ送信、データ記憶媒体上にエンコード化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオのデコード化、又は他のアプリケーション等の様々なマルチメディアアプリケーションのいずれかをサポートするビデオ符号化に適用できる。いくつかの例では、符号化システム10は、ビデオストリーミング、ビデオ再生、ビデオ放送、及び/又はビデオ電話等のアプリケーションをサポートするために、一方向又は双方向のビデオ送信をサポートするように構成され得る。
【0051】
図1Aの例では、送信元装置12は、ビデオソース18、ビデオエンコーダ20、及び出力インターフェイス22を含む。送信先装置14は、入力インターフェイス28、ビデオデコーダ30、及び表示装置32を含む。本開示によれば、送信元装置12のビデオエンコーダ20及び/又は送信先装置14のビデオデコーダ30は、予測、例えば双方向予測のための技術を適用するように構成され得る。他の例では、送信元装置12及び送信先装置14は、他のコンポーネント又は構成を含み得る。例えば、送信元装置12は、外部カメラ等の外部ビデオソースからビデオデータを受信することができる。同様に、送信先装置14は、一体化された表示装置を含むのではなく、外部表示装置とインターフェイス接続することができる。
【0052】
図1Aの例示される符号化システム10は、単なる一例である。予測、例えば双方向予測のための技術は、任意のデジタルビデオエンコード化及び/又はデコード化装置によって実行され得る。本開示の技術は、一般に、ビデオ符号化装置によって実行されるが、技術は、典型的には「コーデック(CODEC)」と呼ばれるビデオエンコーダ/デコーダによっても実行され得る。さらに、本開示の技術は、ビデオプリプロセッサによっても実行され得る。ビデオエンコーダ及び/又はデコーダは、グラフィック処理装置(GPU)又は同様の装置であり得る。
【0053】
送信元装置12及び送信先装置14は、送信元装置12が送信先装置14に送信するために符号化ビデオデータを生成するそのような符号化装置の単なる例である。いくつかの例では、送信元装置12及び送信先装置14は、送信元装置12及び送信先装置14のそれぞれがビデオエンコード化及びデコード化コンポーネントを含むように、実質的に対称的な方法で動作し得る。こうして、符号化システム10は、例えばビデオストリーミング、ビデオ再生、ビデオ放送、又はビデオ電話のために、ビデオ装置12、14の間の一方向又は双方向のビデオ伝送をサポートし得る。
【0054】
送信元装置12のビデオソース18は、ビデオカメラ等のビデオ取込み装置、以前に取り込んだビデオを含むビデオアーカイブ、及び/又はビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェイスを含み得る。更なる代替として、ビデオソース18は、ソースビデオとして、又はライブビデオ、アーカイブビデオ、及びコンピュータで生成されたビデオの組合せとして、コンピュータグラフィックスベースのデータを生成することができる。
【0055】
場合によっては、ビデオソース18がビデオカメラである場合に、送信元装置12及び送信先装置14は、いわゆるカメラ付き携帯電話又はビデオ電話を形成し得る。しかしながら、上記のように、本開示で説明する技術は、一般にビデオ符号化に適用可能であり得、且つ無線及び/又は有線アプリケーションに適用され得る。いずれの場合にも、取り込んだ、事前に取り込んだ、又はコンピュータで生成されたビデオは、ビデオエンコーダ20によってエンコードされ得る。次に、エンコード化されたビデオ情報は、出力インターフェイス22によってコンピュータ可読媒体16に出力され得る。
【0056】
コンピュータ可読媒体16は、無線放送又は有線ネットワーク伝送等の一時的媒体を含み得るか、又はコンピュータ可読媒体16は、ハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Blu-ray(登録商標)ディスク、又は他のコンピュータ可読媒体等の非一時的な記憶媒体を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、送信元装置12からエンコード化ビデオデータを受信し、エンコード化ビデオデータを例えばネットワーク送信を介して送信先装置14に提供することができる。同様に、ディスクスタンピング設備等の媒体生産設備のコンピューティング装置は、送信元装置12からエンコード化ビデオデータを受信し、エンコード化ビデオデータを含むディスクを製造することができる。従って、コンピュータ可読媒体16は、様々な例において、様々な形態の1つ又は複数のコンピュータ可読媒体を含むと理解され得る。
【0057】
送信先装置14の入力インターフェイス28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって規定される構文情報を含み得、この構文情報はビデオデコーダ30によっても使用され、この構文情報には、ブロック及び他の符号化ユニット、例えば画像のグループ(GOP)の特性及び/又は処理を説明する構文要素が含まれる。表示装置32は、デコード化ビデオデータをユーザに表示し、ブラウン管(CRT)、液晶ディスプレイ(LDC)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、又は別のタイプの表示装置等の様々な表示装置のいずれかを含み得る。
【0058】
ビデオエンコーダ20及びビデオデコーダ30は、現在開発中の高効率ビデオ符号化(HEVC)規格等のビデオ符号化規格に従って動作することができ、HEVCテストモデル(HM)に準拠することができる。あるいはまた、ビデオエンコーダ20及びビデオデコーダ30は、国際電気通信連合電気通信標準化セクタ(ITU-T)H.264規格、あるいはモーションピクチャーエキスパートグループ(MPEG)-4、パート10、AVC(Advanced Video Coding)、H.265/HEVC、ITU-T及びMPEGによって現在開発中のVVC(Versatile Video Coding)ドラフト規格、又はそのような規格の拡張と呼ばれる他の専有又は業界標準に従って動作することができる。しかしながら、本開示の技術は、特定の符号化規格に限定されない。ビデオ符号化規格の他の例には、MPEG-2及びITU-T H.263が含まれる。図1Aには示されていないが、いくつかの態様では、ビデオエンコーダ20及びビデオデコーダ30は、それぞれオーディオエンコーダ及びデコーダと統合され得、且つ共通のデータストリーム又は個別のデータストリームでオーディオとビデオとの両方のエンコード化を処理するための適切なマルチプレクサ-デマルチプレクサ(MUX-DEMUX)ユニット又は他のハードウェア及びソフトウェアを含み得る。該当する場合に、MUX-DEMUXユニットは、ITU-T H.223マルチプレクサプロトコル又はユーザデータグラムプロトコル(UDP)等の他のプロトコルに準拠し得る。
【0059】
ビデオエンコーダ20及びビデオデコーダ30はそれぞれ、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートロジック、グラフィック処理装置(GPU)、プロセッサ(例えばプログラマブル、例えばソフトウェアプログラマブル)、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組合せ等の、様々な適切なエンコーダ又はデコーダ回路のいずれかとして、又は汎用論理回路又はコーダ回路として実現され得る。技術がソフトウェアで部分的に実現される場合に、装置は、ソフトウェアの命令を適切な非一時的なコンピュータ可読媒体に記憶し、1つ又は複数のプロセッサを使用してハードウェアで命令を実行して、本開示の技術を実行することができる。ビデオエンコーダ20及びビデオデコーダ30のそれぞれは、1つ又は複数のエンコーダ又はデコーダに含まれ得、それらエンコーダ又はデコーダのいずれかは、それぞれの装置内に組み合わされたエンコーダ/デコーダ(CODEC)の一部として統合され得る。ビデオエンコーダ20及び/又はビデオデコーダ30を含む装置は、集積回路、マイクロプロセッサ、及び/又は携帯電話等の無線通信装置を含み得る。
【0060】
図1Bは、例示的な実施形態による、図2のビデオエンコーダ20及び/又は図3のビデオデコーダ30を含む例示的なビデオ符号化システム40の例示的な図である。ビデオ符号化システム40は、この本願の技術を実現することができる。図示の実施態様では、ビデオ符号化システム40は、画像化装置41、ビデオエンコーダ20、ビデオデコーダ30(及び/又は処理装置46の論理回路47を介して実現されるビデオコーダ)、アンテナ42、1つ又は複数のプロセッサ43、1つ又は複数のメモリ又はメモリストア44、及び/又は表示装置45を含み得る。示されるように、画像化装置41、アンテナ42、処理装置46、論理回路47、ビデオエンコーダ20、ビデオデコーダ30、プロセッサ43、メモリストア44、及び/又は表示装置45は、互いに通信することができ得る。説明したように、図1Bは、ビデオエンコーダ20とビデオデコーダ30との両方を示しているが、ビデオ符号化システム40は、様々な例において、ビデオエンコーダ20のみ、又はビデオデコーダ30のみを含み得る。
【0061】
示されるように、いくつかの例では、ビデオ符号化システム40は、アンテナ42を含み得る。アンテナ42は、例えば、ビデオデータのエンコード化ビットストリームを送信又は受信するように構成され得る。さらに、いくつかの例では、ビデオ符号化システム40は、表示装置45を含み得る。
【0062】
表示装置45は、ビデオデータを提示するように構成され得る。示されるように、いくつかの例では、論理回路47は、処理装置46を介して実現され得る。処理装置46は、特定用途向け集積回路(ASIC)ロジック、グラフィックプロセッサ、又は汎用プロセッサ等を含み得る。ビデオ符号化システム40は、オプションのプロセッサ43も含み得、このプロセッサは、同様に、特定用途向け集積回路(ASIC)ロジック、グラフィックプロセッサ、又は汎用プロセッサ等を含み得る。いくつかの例では、論理回路47は、ハードウェア、又はビデオ符号化専用ハードウェア等を介して実現され得、プロセッサ43は、汎用ソフトウェア、又はオペレーティングシステム等によって実現され得る。さらに、メモリストア44は、揮発性メモリ(例えば、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)等)、又は不揮発性メモリ(例えば、フラッシュメモリ等)等の任意のタイプのメモリであり得る。非限定的な例では、メモリストア44は、キャッシュメモリによって実現され得る。いくつかの例では、論理回路47は、(例えば、画像バッファの実行のために)メモリストア44にアクセスすることができる。他の例では、論理回路47及び/又は処理装置46は、画像バッファ等の実行のためのメモリストア(例えば、キャッシュ等)を含み得る。
【0063】
グラフィック処理装置は、論理回路47を介して実行されるビデオエンコーダ20を含み、図2に関して説明するような様々なモジュール及び/又は本明細書で説明する任意の他のエンコーダシステム又はサブシステムを具体化することができる。論理回路47は、本明細書で議論する様々な動作を実行するように構成され得る。ビデオデコーダ30は、論理回路47を介して実行されるのと同様の方法で実現されて、図3のデコーダ30に関して説明するような様々なモジュール及び/又は本明細書で説明する任意の他のデコーダシステム又はサブシステムを具体化することができる。いくつかの例では、ビデオエンコーダ20及びビデオデコーダ30は、論理回路を介して実行され得、(例えば、処理装置46又はメモリストア44のいずれかを介した)画像バッファ、及び(例えば、処理装置46を介した)グラフィック処理装置(GPU)を含み得る。グラフィック処理装置は、画像バッファに通信可能に結合され得る。グラフィック処理装置は、論理回路47を介して実行されるビデオデコーダ30を含み、図3に関して説明するような様々なモジュール及び/又は本明細書で説明する任意の他のデコーダシステム又はサブシステムを具体化することができる。
【0064】
いくつかの例では、ビデオ符号化システム40のアンテナ42は、ビデオデータのエンコード化ビットストリームを受信するように構成され得る。議論されるように、エンコード化ビットストリームは、符号化パーティションに関連するデータ(例えば、変換係数又は量子化変換係数、(議論するような)オプションのインジケータ、及び/又は符号化パーティションを規定するデータ)等の本明細書で議論するような、ビデオフレームのエンコード化に関連するデータ、インジケータ、インデックス値、又はモード選択データ等を含み得る。ビデオ符号化システム40は、アンテナ42に結合され、且つエンコード化ビットストリームをデコードするように構成されたビデオデコーダ30も含み得る。表示装置45は、ビデオフレームを提示するように構成される。
【0065】
図2は、本願の技術を実施することができるビデオエンコーダ20の例を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラ符号化(intra-coding:ブロック内符号化)及びインター符号化(inter-coding:ブロック間符号化)を実行することができる。イントラ符号化は、空間的予測に依存して、所与のビデオフレーム又は画像内のビデオの空間的冗長性を低減又は除去する。インター符号化は、時間予測に依存して、ビデオシーケンスの隣接するフレーム又は画像内のビデオの時間的冗長性を低減又は除去する。イントラモード(Iモード)は、いくつかの空間ベースの符号化モードのいずれかを指し得る。単方向予測(Pモード)又は双方向予測(Bモード)等のインターモードは、いくつかの時間ベースの符号化モードのいずれかを指し得る。
【0066】
図2に示されるように、ビデオエンコーダ20は、エンコードされるビデオフレーム内の現在のビデオブロックを受信する。図2の例では、ビデオエンコーダ20は、モード選択ユニット40、参照フレームメモリ64、加算器(summer)50、変換処理装置52、量子化ユニット54、及びエントロピー符号化ユニット56を含む。モード選択ユニット40は、動き補償ユニット44、動き推定ユニット42、イントラ予測ユニット46、及びパーティションユニット48を含む。ビデオブロック再構成のために、ビデオエンコーダ20は、逆量子化ユニット58、逆変換ユニット60、及び加算器62も含む。ブロック境界をフィルタ処理して再構成したビデオからブロック性アーチファクトを除去するために、デブロッキング(deblocking)フィルタ(図2に示されない)も含まれ得る。必要に応じて(例えば、アクティブ化又は少しでも実施される場合に)、デブロッキングフィルタは加算器62の出力をフィルタ処理する。デブロッキングフィルタに加えて、追加のフィルタ(ループ内又はループ後)を使用してもよい。このようなフィルタは簡潔にするために示されていないが、必要に応じて、例えば、加算器50の出力を(ループ内フィルタとして)フィルタ処理することができる。
【0067】
エンコード化プロセス中に、ビデオエンコーダ20は、符号化されるビデオフレーム又はスライスを受信する。フレーム又はスライスは、複数のビデオブロックに分割され得る。動き推定ユニット42及び動き補償ユニット44は、1つ又は複数の参照フレーム内の1つ又は複数のブロックに対して受信したビデオブロックのインター予測(inter-predictive:ブロック間予測)符号化を実行して、時間的予測を提供する。あるいはまた、イントラ予測ユニット46は、符号化されるブロックと同じフレーム又はスライス内の1つ又は複数の隣接ブロックに対して受信したビデオブロックのイントラ予測(intra-predictive:ブロック内予測)符号化を実行して、空間的予測を提供することができる。ビデオエンコーダ20は、例えば、ビデオデータの各ブロックに対して適切な符号化モードを選択するために、複数の符号化パスを実行することができる。
【0068】
さらに、パーティションユニット48は、以前の符号化パス又はステップにおける以前のパーティション分割スキームの評価に基づいて、ビデオデータのブロックをサブブロック又はパーティションにパーティション分割することができる。例えば、パーティションユニット48は、最初にフレーム又はスライスを最大の符号化ユニット(LCU)にパーティション分割し、レート歪み解析(例えば、レート歪みの最適化)に基づいて、各LCUをサブ符号化ユニット(サブCU)にパーティション分割することができる。モード選択ユニット40は、LCUのサブCUへのパーティション分割を示す又は表す四分木データ構造をさらに生成することができる。四分木のリーフノードCUには、1つ又は複数の予測ユニット(PU)と1つ又は複数の変換ユニット(TU)とが含まれる場合がある。
【0069】
本開示は、例えば、HEVC又はVVCの文脈におけるCU、PU、又はTUのいずれか、又は他の規格(例えば、H.264/AVCのマクロブロック及びサブブロック)の文脈における同様のデータ構造を指すために、「ブロック」という用語を使用する。CUは、例えば、符号化ノード、PU、及び符号化ノードに関連するTUを含む。CUのサイズは、符号化ノードのサイズに対応し、例えば、形状が正方形である。CUのサイズは、8×8ピクセルから最大64×64ピクセル以上、例えば128×128ピクセルのツリーブロックのサイズまでの範囲であり得る。各CUには、1つ又は複数のPU及び1つ又は複数のTUを含めることができる。CUに関連する構文データは、例えば、CUを1つ又は複数のPUにパーティション分割することを記述し得る。パーティション分割モードは、CUがスキップ又はダイレクトモードでエンコードされているか、イントラ予測モードでエンコードされているか、又はインター予測モードでエンコードされているかによって異なる場合がある。PUは、形状が非正方形になるようにパーティション分割され得る。CUに関連する構文データはまた、例えば、四分木に従ってCUを1つ又は複数のTUにパーティション分割することを記述し得る。一実施形態では、CU、PU、又はTUは、形状が正方形又は非正方形(例えば、長方形)であり得る。
【0070】
モード選択ユニット40は、例えばエラー結果に基づいて、イントラ又はインターの符号化モードの1つを選択し、結果として生じるイントラ符号化又はインター符号化ブロックを加算器50に提供して残余ブロックデータを生成し、結果として生じるイントラ符号化又はインター符号化ブロックを加算器62に提供して参照フレームとして使用するためにエンコード化ブロックを再構成する。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、パーティション情報、及び/又は他のそのような構文情報等の構文要素を、エントロピー符号化ユニット56に提供する。
【0071】
動き推定ユニット42及び動き補償ユニット44は、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定ユニット42によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在のフレーム(又は他の符号化ユニット)内で符号化されている現在のブロックに対する、参照フレーム(又は他の符号化ユニット)内の予測ブロックに対する現在のビデオフレーム又は画像内のビデオブロックのPUの変位を示し得る。予測ブロックは、ピクセルの差に関して符号化されるブロックと厳密に一致すると分かったブロックであり、このピクセルの差は、絶対差の合計(SAD)、二乗の差の合計(SSD)、又は他のメトリック差によって決定される。いくつかの例では、ビデオエンコーダ20は、参照フレームメモリ64に格納された参照画像のサブ整数ピクセル位置の値を計算することができる。例えば、ビデオエンコーダ20は、参照画像の4分の1ピクセル位置、8分の1ピクセル位置、又は他の分数ピクセル位置の値を補間することができる。従って、動き推定ユニット42は、完全なピクセル位置及び分数のピクセル位置に対して動き検索を実行し、分数ピクセル精度で動きベクトルを出力することができる。
【0072】
動き推定ユニット42は、PUの位置を参照画像の予測ブロックの位置と比較することによって、インター符号化スライス内のビデオブロックのPUの動きベクトルを計算する。参照画像は、第1の参照画像リスト(リスト0)又は第2の参照画像リスト(リスト1)から選択することができ、これらリストはそれぞれ、参照フレームメモリ64に格納された1つ又は複数の参照画像を識別する。動き推定ユニット42は、計算した動きベクトルをエントロピー符号化ユニット56及び動き補償ユニット44に送信する。
【0073】
動き補償ユニット44によって実行される動き補償は、動き推定ユニット42によって決定された動きベクトルに基づいて、予測ブロックをフェッチ又は生成することを含み得る。再び、動き推定ユニット42及び動き補償ユニット44は、いくつかの例では、機能的に統合され得る。現在のビデオブロックのPUの動きベクトルを受信すると、動き補償ユニット44は、動きベクトルが指す予測ブロックを参照画像リストの1つで見つけることができる。加算器50は、符号化されている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を差し引くことによって残余ビデオブロックを形成し、以下で説明するようにピクセル差値を形成する。一般に、動き推定ユニット42は、輝度成分に対する動き推定を実行し、動き補償ユニット44は、彩度成分と輝度成分との両方の輝度成分に基づいて計算された動きベクトルを使用する。モード選択ユニット40は、ビデオスライスのビデオブロックをデコードする際にビデオデコーダ30によって使用されるために、ビデオブロック及びビデオスライスに関連する構文要素を生成することもできる。
【0074】
イントラ予測ユニット46は、上記のように、動き推定ユニット42及び動き補償ユニット44によって実行されるインター予測の代替として、現在のブロックをイントラ予測することができる。特に、イントラ予測ユニット46は、現在のブロックをエンコードするために使用するイントラ予測モードを決定することができる。いくつかの例では、イントラ予測ユニット46は、例えば、別個のエンコード化パス又はステップ中に、様々なイントラ予測モードを使用して現在のブロックをエンコードすることができ、及びイントラ予測ユニット46(又はいくつかの例ではモード選択ユニット40)は、テストしたモードから使用する適切なイントラ予測モードを選択できる。
【0075】
例えば、イントラ予測ユニット46は、テストした様々なイントラ予測モードのレート歪み解析を使用してレート歪み値を計算し、テストしたモードの中で最良のレート歪み特性を有するイントラ予測モードを選択することができる。レート歪み解析は、一般に、エンコード化ブロックと、エンコード化ブロックを生成するためにエンコードされた元のエンコードされていないブロックとの間の歪み(又はエラー)の量、及びエンコード化ブロックを生成するために使用されるビットレート(つまり、ビット数)を決定する。イントラ予測ユニット46は、様々なエンコード化ブロックの歪み及びレートから比率を計算して、どのイントラ予測モードがブロックに対して最良のレート歪み値を示すかを決定することができる。
【0076】
さらに、イントラ予測ユニット46は、深度モデリングモード(DMM)を使用して深度マップの深度ブロックを符号化するように構成され得る。モード選択ユニット40は、例えば、レート歪みの最適化(RDO)を使用して、利用可能なDMMモードがイントラ予測モード及び他のDMMモードよりも良好な符号化結果を生成するかどうかを判定することができる。深度マップに対応するテクスチャ画像のデータは、参照フレームメモリ64に格納され得る。動き推定ユニット42及び動き補償ユニット44は、深度マップの深度ブロックをインター予測するようにも構成され得る。
【0077】
ブロックのイントラ予測モード(例えば、従来のイントラ予測モード又はDMMモードの1つ)を選択した後に、イントラ予測ユニット46は、ブロックの選択したイントラ予測モードを示す情報をエントロピー符号化ユニット56に提供することができる。エントロピー符号化ユニット56は、選択したイントラ予測モードを示す情報をエンコードすることができる。ビデオエンコーダ20は、様々なブロックのコンテキストをエンコード化する規定、各コンテキストに使用する最も可能性の高いイントラ予測モード、イントラ予測モードインデックステーブル、及び変更されたイントラ予測モードインデックステーブルの指標を、(複数のイントラ予測モードインデックステーブル及び複数の修正されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)を含み得る)送信されたビットストリーム構成データに含めることができる。
【0078】
ビデオエンコーダ20は、符号化されている元のビデオブロックからモード選択ユニット40からの予測データを差し引くことによって、残余ビデオブロックを形成する。加算器50は、この減算演算を実行する1つ又は複数のコンポーネントを表す。
【0079】
変換処理装置52は、離散コサイン変換(DCT)又は概念的に類似した変換等の変換を残余ブロックに適用し、残余変換係数値を含むビデオブロックを生成する。変換処理装置52は、概念的にDCTと同様の他の変換を実行することができる。ウェーブレット変換、整数変換、サブバンド変換、又は他のタイプの変換も使用できる。
【0080】
変換処理装置52は、変換を残余ブロックに適用し、残余変換係数のブロックを生成する。変換は、残余情報をピクセル値ドメインから周波数ドメイン等の変換ドメインに変換することができる。変換処理装置52は、結果として生じる変換係数を量子化ユニット54に送信することができる。量子化ユニット54は、変換係数を量子化して、ビットレートをさらに低減する。量子化プロセスは、係数の一部又は全てに関連するビット深度を減らし得る。量子化の程度は、量子化パラメータを調整することによって変更することができる。いくつかの例では、次に、量子化ユニット54は、量子化した変換係数を含むマトリックスのスキャンを実行することができる。あるいはまた、エントロピーエンコード化ユニット56がスキャンを実行してもよい。
【0081】
量子化に続いて、エントロピー符号化ユニット56は、量子化した変換係数をエントロピー符号化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応可変長符号化(CAVLC)、コンテキスト適応バイナリ算術符号化(CABAC)、構文ベースのコンテキスト適応バイナリ算術符号化(SBAC)、確率区間パーティション分割エントロピー(PIPE)符号化、又は別のエントロピー符号化技術を実行することができる。コンテキストベースのエントロピー符号化の場合に、コンテキストは、隣接するブロックに基づき得る。エントロピー符号化ユニット56によるエントロピー符号化に続いて、エンコード化ビットストリームは、別の装置(例えば、ビデオデコーダ30)に送信されるか、又は後の送信又は検索のためにアーカイブされ得る。
【0082】
逆量子化ユニット58及び逆変換ユニット60は、それぞれ、逆量子化及び逆変換を適用して、例えば、後で参照ブロックとして使用するために、ピクセル領域内の残余ブロックを再構成する。動き補償ユニット44は、例えば参照フレームメモリ64のフレームのうちの1つの参照フレームから導出される予測(prediction)ブロック(予測(predictive)ブロックとも呼ばれる)、例えば、動きベクトル及び対応する参照ブロックに基づく動き補償予測ブロックを決定することができる。動き補償ユニット44は、1つ又は複数の補間フィルタを適用して、動きの推定又は補償に使用するために参照ブロックのサブ整数ピクセル値を計算することもできる。加算器62は、再構成した残余ブロックを動き補償ユニット44によって生成された(動き補償された)予測ブロックに追加して、参照フレームメモリ64に記憶するための再構成したビデオブロックを生成する。再構成したビデオブロックは、動き推定ユニット42及び動き補償ユニット44によって、後続のビデオフレーム内のブロックをインター符号化するための参照ブロックとして使用され得る。
【0083】
ビデオエンコーダ20の他の構造的変形を使用して、ビデオストリームをエンコードすることができる。例えば、非変換ベースのビデオエンコーダ20は、特定のブロック又はフレームについて、変換処理装置52なしで、残差信号を直接量子化することができる。別の実施態様では、エンコーダ20は、量子化ユニット54及び逆量子化ユニット58を単一のユニットに組み合わせることができる。
【0084】
図3は、この本願の技術を実施することができるビデオデコーダ30の例を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピーデコード化ユニット70、動き補償ユニット72、イントラ予測ユニット74、逆量子化ユニット76、逆変換ユニット78、参照フレームメモリ82、及び加算器80を含む。ビデオデコーダ30は、いくつかの例では、図2のビデオエンコーダ20に関して説明したエンコード化パス又は経路に概ね逆のデコード化パス又は経路を実行することができる。動き補償ユニット72は、エントロピーデコード化ユニット70から受信した動きベクトルに基づいて予測データを生成することができる一方、イントラ予測ユニット74は、エントロピーデコード化ユニット70から受信したイントラ予測モードインジケータに基づいて予測データを生成することができる。
【0085】
デコード化プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から生成されたエンコード化されたビデオスライスのビデオブロック及び関連する構文要素を表すエンコード化されたビデオビットストリームを受信する。ビデオデコーダ30のエントロピーデコード化ユニット70は、ビットストリームをエントロピーデコード化して、量子化係数、動きベクトル又はイントラ予測モードインジケータ、及び他の構文要素を生成する。エントロピーデコード化ユニット70は、動きベクトル及び他の構文要素を動き補償ユニット72に転送する。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルで構文要素を受信することができる。
【0086】
ビデオスライスがイントラ符号化(I)スライスとして符号化される場合に、イントラ予測ユニット74は、現在のフレーム又は画像の以前デコード化されたブロックからの信号化されたイントラ予測モード及びデータに基づいて、現在のビデオスライスのビデオブロックの予測データを生成し得る。ビデオフレームがインター符号化(すなわち、B、P、又はGPB)スライスとして符号化されると、動き補償ユニット72は、エントロピーデコード化ユニット70から受信した動きベクトル及び他の構文要素に基づいて、現在のビデオスライスのビデオブロックの予測ブロックを生成する。予測ブロックは、参照画像リストのうちの1つのリスト内の参照画像のうちの1つの画像から生成され得る。ビデオデコーダ30は、参照フレームメモリ82に格納された参照画像に基づくデフォルトの構成技術を使用して、参照フレームリスト、リスト0及びリスト1を構成することができる。
【0087】
動き補償ユニット72は、動きベクトル及び他の構文要素を解析することによって現在のビデオスライスのビデオブロックの予測情報を決定し、予測情報を使用して、デコードされている現在のビデオブロックの予測ブロックを生成する。例えば、動き補償ユニット72は、受信した構文要素のいくつかを使用して、ビデオスライスのビデオブロックを符号化するために使用される予測モード(例えば、イントラ予測又はインター予測)、インター予測スライスタイプ(例えば、Bスライス、Pスライス、又はGPBスライス)、スライスの1つ又は複数の参照画像リストの構成情報、スライスの各インターエンコード化ビデオブロックの動きベクトル、スライスの各インター符号化ビデオブロックのインター予測ステータス、及び他の情報を決定して、現在のビデオスライス内のビデオブロックをデコードする。
【0088】
動き補償ユニット72は、補間フィルタに基づいて補間を実行することもできる。動き補償ユニット72は、ビデオブロックのエンコード化中にビデオエンコーダ20によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算することができる。この場合に、動き補償ユニット72は、受信した構文要素からビデオエンコーダ20によって使用される補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成することができる。
【0089】
深度マップに対応するテクスチャ画像のデータが、参照フレームメモリ82に格納され得る。動き補償ユニット72は、深度マップの深度ブロックをインター予測するようにも構成され得る。
【0090】
図1Aに戻ると、ビデオ符号化システム10は、様々なビデオ符号化又は圧縮技術を実施するのに適している。インター予測、イントラ予測、ループフィルタ等のいくつかのビデオ圧縮技術が効果的であることが実証されている。従って、ビデオ圧縮技術は、H.264/AVC及びH.265/HEVC等の様々なビデオ符号化規格に採用されている。
【0091】
適応動きベクトル予測(AMVP)及びマージモード(MERGE)等の様々な符号化ツールを使用して、動きベクトル(MV)を予測し、インター予測効率、従って全体的なビデオ圧縮効率を高めることができる。
【0092】
上記のMVは、双方向予測(bi-prediction)で利用できる。双方向予測動作では、2つの予測ブロックが形成される。1つの予測ブロックは、リスト0のMV(本明細書ではMV0と呼ばれる)を使用して形成される。別の予測ブロックは、リスト1のMV(本明細書ではMV1と呼ばれる)を使用して形成される。次に、2つの予測ブロックは、単一の予測信号(例えば、予測(prediction)ブロック又は予測(predictor)ブロック)を形成するために組み合わされる(例えば、平均化される)。
【0093】
ビデオデコーダ30の他の変形を使用して、圧縮したビットストリームをデコードすることができる。例えば、デコーダ30は、ループフィルタ処理ユニットなしで出力ビデオストリームを生成することができる。例えば、非変換ベースのデコーダ30は、特定のブロック又はフレームについて、逆変換処理装置78なしで、残差信号を直接逆量子化することができる。別の実施態様では、ビデオデコーダ30は、逆量子化ユニット76及び逆変換処理装置78を単一のユニットに組み合わせることができる。
【0094】
図4は、本開示の一実施形態によるネットワーク装置400(例えば、符号化装置)の概略図である。ネットワーク装置400は、本明細書で説明し、開示する実施形態を実現するのに適している。一実施形態では、ネットワーク装置400は、図1A及び図3のビデオデコーダ30等のデコーダ、又は図1A及び図2のビデオエンコーダ20等のエンコーダであり得る。一実施形態では、ネットワーク装置400は、上記の図1A及び図3のビデオデコーダ30又は図1A及び図2のビデオエンコーダ20の1つ又は複数の構成要素であり得る。
【0095】
ネットワーク装置400は、データを受信するための入力ポート410及び受信機ユニット(Rx)420;データを処理するためのプロセッサ、論理ユニット、又は中央処理装置(CPU)430;データを送信するための送信機ユニット(Tx)440及び出力ポート450;データを格納するためのメモリ460を含む。ネットワーク装置400は、入力ポート410に結合した光/電気変換(OE)コンポーネント及び電気/光変換(EO)コンポーネント、受信機ユニット420、送信機ユニット440、及び光又は電気信号の入力又は出力ための出力ポート450も含み得る。
【0096】
プロセッサ430は、ハードウェア及びソフトウェアによって実行され得る。プロセッサ430は、1つ又は複数のCPUチップ、コア(例えば、マルチコアプロセッサとして)、FPGA、ASIC、及びDSPとして実現され得る。プロセッサ430は、入力ポート410、受信機ユニット420、送信機ユニット440、出力ポート450、及びメモリ460と通信している。プロセッサ430は、符号化モジュール470を含む。符号化モジュール470は、上記の開示した実施形態を実現する。例えば、符号化モジュール470は、様々な符号化操作を実行、処理、準備、又は提供する。従って、符号化モジュール470を含めることは、ネットワーク装置400の機能に実質的な改善を提供し、ネットワーク装置400の異なる状態への変換をもたらす。あるいはまた、符号化モジュール470は、メモリ460に格納され、プロセッサ430によって実行される命令として実現される。
【0097】
メモリ460は、1つ又は複数のディスク、テープドライブ、及びソリッドステートドライブを含み、オーバーフローデータ記憶装置として使用され、そのようなプログラムが実行のために選択されたときにプログラムを記憶し、プログラムの実行中に読み出される命令及びデータを記憶することができる。メモリ460は、揮発性及び/又は不揮発性であり得、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、三値連想メモリ(TCAM)、及び/又はスタティックランダムアクセスメモリ(SRAM)であり得る。
【0098】
図5は、例示的な実施形態による図1Aの送信元装置12及び送信先装置14のいずれか又は両方として使用することができる機器500の簡略化したブロック図である。機器500は、この本願の技術を実施することができる。機器500は、複数のコンピューティング装置を含むコンピューティングシステムの形態、又は単一のコンピューティング装置の形態、例えば、携帯電話、タブレットコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、及びデスクトップコンピュータ等であり得る。
【0099】
機器500内のプロセッサ502は、中央処理装置であり得る。あるいはまた、プロセッサ502は、現在存在する又は今後開発される情報を操作又は処理することができる任意の他のタイプの装置又は複数の装置であり得る。開示する実施態様は、示されるように単一のプロセッサ、例えばプロセッサ502で実施することができるが、速度及び効率の利点は、複数のプロセッサを使用して達成することができる。
【0100】
機器500内のメモリ504は、実施態様において、読取り専用メモリ(ROM)装置又はランダムアクセスメモリ(RAM)装置であり得る。他の任意の適切なタイプの記憶装置をメモリ504として使用してもよい。メモリ504は、バス512を使用してプロセッサ502によってアクセスされるコード及びデータ506を含むことができる。メモリ504は、オペレーティングシステム508及びアプリケーションプログラム510をさらに含むことができ、アプリケーションプログラム510は、プロセッサ502が本明細書で説明する方法を実行するのを可能にする少なくとも1つのプログラムを含む。例えば、アプリケーションプログラム510は、アプリケーション1~Nを含むことができ、アプリケーション1~Nは、本明細書で説明する方法を実行するビデオ符号化アプリケーションをさらに含む。機器500は、二次記憶装置514の形態で追加のメモリも含むことができ、この二次記憶装置514は、例えば、モバイルコンピューティング装置と共に使用されるメモリカードであり得る。ビデオ通信セッションがかなりの量の情報を含み得るので、それらセッションは、全体的又は部分的に二次記憶装置514に記憶され、処理のために必要に応じてメモリ504にロードされ得る。
【0101】
機器500は、ディスプレイ518等の1つ又は複数の出力装置も含むことができる。ディスプレイ518は、一例では、タッチ入力を感知するように動作可能なタッチ感知要素とディスプレイとを組み合わせたタッチ感知ディスプレイであり得る。ディスプレイ518は、バス512を介してプロセッサ502に結合することができる。ユーザが機器500をプログラム又は他の方法で使用するのを可能にする他の出力装置が、ディスプレイ518に加えて、又はその代替として提供され得る。出力装置がディスプレイである又はディスプレイを含む場合に、ディスプレイは、液晶ディスプレイ(LCD)、陰極線管(CRT)ディスプレイ、プラズマディスプレイ、又は有機LED(OLED)ディスプレイ等の発光ダイオード(LED)ディスプレイを含む様々な方法で実現することができる。
【0102】
機器500は、画像感知装置520、例えば、機器500を操作するユーザの画像等の画像を感知することができる現在存在する又は今後開発されるカメラ又は他の任意の画像感知装置を含むか、又はその画像感知装置と通信することもできる。画像感知装置520は、機器500を操作するユーザに向けられるように配置することができる。一例では、画像感知装置520の位置及び光軸は、視野が、ディスプレイ518に直接隣接し、そこからディスプレイ518が見える領域を含むように構成され得る。
【0103】
機器500は、音感知装置522、例えば、機器500の近くの音を感知することができる現在存在する又は今後開発されるマイクロフォン又は他の任意の音感知装置を含むか、又はその音感知装置と通信することもできる。音感知装置522は、機器500を操作するユーザに向けられるように配置することができ、且つユーザが機器500を操作している間にユーザによって行われる音、例えば、音声又は他の発話を受信するように構成することができる。
【0104】
図5が、機器500のプロセッサ502及びメモリ504を単一のユニットに統合することを示しているが、他の構成を利用することができる。プロセッサ502の動作は、直接或いはローカルエリア又は他のネットワークを介して結合することができる複数のマシン(各マシンは1つ又は複数のプロセッサを有する)に分散させることができる。メモリ504は、ネットワークベースのメモリ又は機器500の動作を実行する複数のマシンのメモリ等の複数のマシンに分散させることができる。ここでは単一のバスとして示されているが、機器500のバス512は複数のバスで構成することができる。さらに、二次記憶装置514は、機器500の他の構成要素に直接結合することができ、又はネットワークを介してアクセスすることができ、且つメモリカード等の単一の統合ユニット又は複数のメモリカード等の複数のユニットを含むことができる。こうして、機器500は、多種多様な構成で実現することができる。
【0105】
VVC(Versatile Video Coding)次世代規格は、JVET(Joint Video Exploration Team)として知られるパートナーシップで協力しているITU-T(International Telecommunications Union Telecommunication Standardization Sector)VCEG(Video Coding Experts Group)とISO/IEC(International Organization for Standardization/International Electrotechnical Commission)のMPEG(Moving Picture Experts Group)との標準化組織の最新の共同ビデオプロジェクトである。VVCでは、マルチタイプツリー(二次/三次/四次)ツリー(BT/TT/QT又は二分木/三分木/四分木)セグメント化構造は、複数のパーティションユニットタイプの概念を置き換えるか、置き換える可能性がある。すなわち、そのマルチタイプツリーは、サイズが最大変換長に対して大き過ぎるCUに必要な場合を除いて、CU、PU、及びTUの概念の分離を削除し、CUパーティション形状の柔軟性をサポートする[JVET-J1002]。
【0106】
図6A図6Fは、例として、VTMで現在使用されているパーティションモードを示す。図6Aは、CU又はCTU等のブロックの分割されていないブロック(分割なし)を示し、図6Bbは、その四次又は四分木(QT)パーティション分割を示し、図6Cは、その水平方向の二次又は二分木(BT)パーティション分割を示し、図6Dは、その垂直方向の二次又は二分木(BT)パーティション分割を示し、図6Eは、その水平方向の三次又は三分木(TT)パーティション分割を示し、図6Fは、その垂直方向の三次又は三分木(TT)分割を示す。実施形態は、図6A図6Fに示されるようなパーティションモードを実施するように構成され得る。
【0107】
実施形態では、以下のパラメータが、BT/TT/QT符号化ツリースキームのためのシーケンスパラメータセット(SPS)構文要素によって規定及び指定され得る:
CTUサイズ:四分木のルートノードサイズ;
MinQTSize:最小許容四分木リーフノードサイズ;
MaxBTTSize:最大許容二分木及び三分木ルートノードサイズ;
MaxBTTDepth:最大許容二分木及び三分木深度;及び
MinBTTSize:最小許容二分木及び三分木リーフノードサイズ。
【0108】
他の実施形態では、最小許容四分木リーフノードサイズ(MinQTSize)パラメータは、他のヘッダ又はセット、例えば、スライスヘッダ(SH)又は画像パラメータセット(PPS)にも含まれ得る。
【0109】
HEVC規格では、スライス/画像の境界にある符号化ツリーユニット(CTU)又は符号化ユニット(CU)は、リーフノードの右下のサンプルがスライス/画像の境界内に入るまで、四分木(QT)を使用して強制的に分割される。エンコーダとデコーダとの両方、例えばビデオエンコーダ20とビデオデコーダ30との両方が強制QTをいつ適用するかを知っているため、強制QTパーティション又はパーティション分割をビットストリームで通知する必要はない。強制パーティションの目的は、ビデオエンコーダ20/ビデオデコーダ30によって境界CTU/CUを可能にすることである。
【0110】
国際特許公開番号WO2016/090568は、QTBT(四分木及び二分木)構造を開示しており、VTM1.0でも、境界CTU/CU強制パーティション分割プロセスはHEVCから継承している。つまり、フレーム境界にあるCTU/CUは、現在のCU全体が画像境界内に入るまで、レート歪み(RD)最適化を考慮せずに、四分木(QT)構造によって強制的にパーティション分割される。これらの強制パーティションは、ビットストリームで通知されない。
【0111】
図7Aは、強制QTによってパーティション分割された高解像度(HD)(1920×1080ピクセル)の下部境界CTU(128×128)の強制パーティションの例を示す。図7では、HD画像は1920×1080ピクセルを有するか又はそのピクセルであり、CTUは128×128ピクセルを有するか又はそのピクセルである。
【0112】
サンディエゴ会議(2018年4月)のCE1(パーティション分割)のSubCE2(画像境界処理)[JVET-J1021]では、BT、TT、又はABT(非対称BT)を使用した画像境界処理の15のテストが提案された。例えば、JVET-K0280及びJVET-K0376では、境界は、図8に示されるように規定される。図8は、画像の境界を鎖線で示し、境界ケースの領域、すなわち下部境界ケース、コーナー境界ケース、及び右側の境界ケースの領域を直線で示す。下部境界は水平方向の強制BT又は強制QTでパーティション分割され得、右側の境界は垂直方向の強制BT又は強制QTでパーティション分割され得、コーナーケースは強制QTでのみ分割され得る。強制BT又は強制QTパーティション分割のいずれかを使用するかどうかの決定は、レート歪み最適化基準に基づいており、且つビットストリームで通知される。強制パーティション分割とは、ブロックをパーティション分割する必要があることを意味し、例えば強制パーティション分割は、図6Aに示されるように「分割なし」を使用して符号化され得ない境界ブロックに適用される。
【0113】
強制QT分割が強制境界パーティション分割で使用される場合に、MinQTSizeのパーティション分割制約は無視される。例えば、図9Aでは、SPSでMinQTSizeが32として通知された場合に、境界を強制QT方法と一致させるには、ブロックサイズ8×8に分割されたQTが必要になり、これは、MinQTSizeが32であるという制約を無視する。
【0114】
本開示の実施形態によれば、強制QTが画像境界パーティション分割に使用される場合に、強制QT分割は、例えばSPSで通知された分割制約に従い、例えば分割制約を無視しない。さらに強制分割が必要な場合には、強制BTのみが使用され、これは、組み合わせて強制QTBTと呼ばれることもある。本開示の実施形態では、例えば、パーティション制約MinQTSizeは、画像境界での強制QTパーティション分割に対して考慮され、強制BTパーティション分割のための追加のシグナリングは必要ない。実施形態はまた、通常の(非境界)ブロック及び境界ブロックのパーティション分割を調和させることを可能にする。例えば、従来の解決策では、2つの「MinQTSize」パラメータが必要であり、1つは通常のブロックのパーティション分割のためであり、もう1つは境界ブロックのパーティション分割のためである。実施形態は、通常のブロックのパーティション分割と境界ブロックのパーティション分割との両方に対して1つの共通の「MinQTSize」パラメータのみを必要とし、これは、例えば1つの「MinQTSize」パラメータを通知することにより、エンコーダとデコーダとの間で柔軟に設定することができる。さらに、実施形態は、例えば強制QTよりも少ないパーティションを必要とする。
【0115】
下部境界ケース及び右側の境界ケースの解決策
【0116】
下部境界ケース及び右側の境界ケースの場合に、ブロックサイズがMinQTSizeより大きい場合に、画像境界パーティション分割のパーティションモードは、例えばRDOに基づいて、強制BTパーティション分割と強制QTパーティション分割との間で選択できる。それ以外の場合に(つまり、ブロックサイズがMinQTSize以下の場合に)、強制BTパーティション分割のみが画像境界のパーティション分割に使用され、より具体的には、画像の下部境界にある境界ブロックの下部境界には、それぞれ水平方向の強制BTが使用され、画像の右側の境界にある境界ブロックの右側の境界には、それぞれ垂直方向の強制BTが使用される。
【0117】
強制BTパーティション分割は、現在のブロックのサブパーティションが画像の下部境界に配置されるまで、水平方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと、リーフノードが画像の右側の境界に完全に配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと、を含み得る。あるいはまた、強制BTパーティション分割は、現在のブロックのサブパーティションが下部境界に配置されるまで、垂直方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと、リーフノードが右側の境界に完全に配置されるまで、水平方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと、を含み得る。MinQTSizeは、非境界ブロックのパーティション分割を制御するためにも適用できる。
【0118】
例えば、図7Aに示されるケースでは、MinQTSizeが32であるか又は32に制限されているが、高さ又は幅が8サンプルの長方形(非正方形)ブロックのサイズが画像の境界と一致する必要がある場合に、強制BTパーティション分割が境界に位置する32×32のブロックをパーティション分割するために使用される。BTパーティションは、同じタイプの強制BTパーティション分割を使用してさらにパーティション分割でき、例えば、垂直方向の強制BTパーティション分割が適用されている場合には、さらに垂直方向の強制BTパーティション分割のみが適用され、水平方向の強制BTパーティション分割が適用されている場合には、さらに水平方向の強制BTパーティション分割のみが適用される。強制BTパーティション分割は、リーフノードが完全に画像内に入るまで継続される。
【0119】
図7Bは、本発明の一実施形態による、128×128サンプルのサイズを有する下部境界CTUの例示的なパーティション分割を示す。パーティション分割ツリーのルートブロック又はルートノードを形成する下部境界CTUは、より小さなパーティション、例えば正方形又は長方形のサイズの小さなブロックにパーティション分割される。これらの小さなパーティション又はブロックは、さらにより小さなパーティション又はブロックにさらにパーティション分割される場合がある。図7Bでは、CTUは、4つの正方形ブロック710、720、730、及び740にパーティション分割される第1の四分木であり、各ブロックのサイズが64×64サンプルである。これらのブロックのうち、ブロック710及び720は再び下部境界ブロックであるが、ブロック730及び740は画像の外側にあり(それぞれ画像の外側に位置する)、処理されない。
【0120】
ブロック710は、四分木パーティション分割を使用して、4つの正方形ブロック750、760、770、及び780にさらにパーティション分割され、各ブロックのサイズが32×32サンプルである。ブロック750及び760は画像の内側にあり、一方、ブロック770及び780は再び下部境界ブロックを形成する。ブロック770のサイズが、例えば32であるMinQTSizeよりも大きくないので、再帰的な水平方向の強制バイナリ(binary:二次、二分木)・パーティション分割は、リーフノードが完全に画像内にあるか又は完全に画像内に配置されるまで、例えば、リーフノードブロック772、32×16サンプルを有する長方形の非正方形ブロックが画像内に入るまで(1つの水平バイナリ・パーティション分割後)、又はリーフノードブロック774、画像の下部境界に位置し、且つ32×8サンプルを有する長方形の非正方形ブロックが画像内に入るまで(2つの水平バイナリ・パーティション分割後)、ブロック770に適用される。同じことがブロック780に当てはまる。
【0121】
本開示の実施形態は、画像の完全に内側に位置する通常のブロックのパーティション分割及び境界ブロックのパーティション分割を調和させることを可能にする。境界ブロックは、完全に画像の内側になく、完全に画像の外側にないブロックである。言い換えると、境界ブロックは、画像内にある部分と画像外にある部分とで構成されるブロックである。さらに、本開示の実施形態は、MinQTSize以下での強制BTパーティション分割を信号で伝える必要がないので、シグナリングを減らすことを可能にする。
【0122】
コーナーケースの解決策
【0123】
コーナーケースでは、いくつかのアプローチでは強制QT分割のみが許可され、MinQTSizeの制約も無視される。本開示の実施形態は、コーナーケースに対して2つの解決策を提供する。
【0124】
解決策1
【0125】
コーナーケースは、下部境界ケース又は右側の境界ケースと考えられる。図10は、境界規定の実施形態を示す。図10は、鎖線による画像の境界と直線の境界ケースの領域とを示す。示されるように、コーナーケースは下部境界ケースとして規定される。こうして、解決策は、上記の下部境界ケース及び右側の境界ケースについて説明したものと同じである。換言すると、最初に、ブロック又はパーティションが(垂直方向で)完全に画像内に入るまで、(下部境界ケースについて説明したように)水平方向のパーティション分割が適用され、次にリーフノードが(水平方向で)完全に画像内に入るまで、(右側の境界ケースについて説明したように)垂直方向のパーティション分割が適用される。
【0126】
解決策2
【0127】
境界ケースの規定はそのまま維持される。強制QTがMinQTSize(現在のブロックサイズがMinQTSize以下)によって制約されている場合には、水平方向の強制BTを使用して下部境界に一致させ、下部境界が一致する場合には、垂直方向の強制BTを使用して右側の境界に一致させる。
【0128】
例えば、画像のコーナーに位置するブロックに対する強制QTBTの実施形態を示す図9Aでは、MinQTSizeがコーナーケース強制QTパーティションに関して32であるか、又は32として制限される場合に、強制パーティションが終了するまで、32×32ブロックのパーティション後に、更なるBTパーティションが使用される。
【0129】
図9Bは、本発明の一実施形態による、画像のコーナーにおける又はコーナー内の境界CTUの例示的なパーティション分割の更なる詳細を示し、CTUは、128×128サンプルのサイズを有する。CTUは、最初に4つの正方形ブロックにパーティション分割される四分木であり、各ブロックのサイズが64×64サンプルである。これらのブロックのうち、左上のブロック910のみが境界ブロックであり、他の3つは、画像の外側(完全に外側)に位置し、それ以上処理されない。ブロック910は、四分木パーティション分割を使用して、4つの正方形のブロック920、930、940、及び950にさらにパーティション分割され、各ブロックのサイズが32×32サンプルである。ブロック920は画像の内側にあるが、ブロック930、940、及び950は再び境界ブロックを形成する。これらのブロック930、940、及び950のサイズが(32である)MinQTSizeよりも大きくないため、ブロック930、940、及び950に強制バイナリ・パーティション分割が適用される。
【0130】
ブロック930は、右側の境界に配置され、且つリーフノードが画像、例えば画像の右側の境界にあるブロック932内に入るまで(ここでは2つの垂直方向のバイナリ・パーティション分割の後)、再帰的な垂直方向の強制バイナリ・パーティション分割を使用してパーティション分割される。
【0131】
ブロック940は、下部境界に配置され、且つリーフノードが画像、例えば画像の右側の境界にあるブロック942内に入るまで(ここでは2つの水平方向のバイナリ・パーティション分割の後)、再帰的な水平方向の強制バイナリ・パーティション分割を使用してパーティション分割される。
【0132】
ブロック950は、コーナー境界に配置され、且つサブパーティション又はブロック(ここではブロック952)が画像の下部境界に配置されるまで(ここでは2つの水平方向のバイナリ・パーティションの後)、第1の再帰的な水平方向の強制バイナリ・パーティション分割を使用してパーティション分割され、次に、リーフノード又はブロック(例えば、ブロック954)が画像の右側の境界に配置されるまで(ここでは2つの垂直方向のバイナリ・パーティション分割の後)、又はそれぞれリーフノードが画像内に配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割する。
【0133】
上記のアプローチは、デコードとエンコードとの両方に適用できる。デコードの場合に、MinQTSizeはSPSを介して受信できる。エンコードの場合に、MinQTSizeはSPSを介して送信できる。実施形態は、図8又は図10に示されるような境界規定又は他の境界規定を使用することができる。
【0134】
本開示の更なる実施形態が、以下に提供される。次の段落で使用される番号付けは、必ずしも以前の段落で使用した番号付けに準拠する必要はないことに留意されたい。
実施形態1:
パーティション分割方法であって、このパーティション分割方法は、
画像の現在のブロックが境界ブロックであるかどうかを判定するステップと、
現在のブロックが境界ブロックである場合に、現在のブロックのサイズが最小許容四分木リーフノードサイズよりも大きいかどうかを判定するステップと、
現在のブロックのサイズが最小許容四分木リーフノードサイズより大きくない場合に、現在のブロックに強制二分木パーティション分割を適用するステップと、を含む。
実施形態2:
強制二分木パーティション分割は、現在のブロックが画像の下部境界に位置している場合に再帰的な水平方向の強制バイナリ・パーティション分割である、又は現在のブロックが画像の右側の境界に位置している場合に再帰的な垂直方向の強制境界バイナリ・パーティション分割である、実施形態1に記載のパーティション分割方法。
実施形態3:
強制バイナリ・パーティション分割は、
現在のブロックのサブパーティションが画像の下部境界に直接配置されるまで、水平方向の強制境界パーティション分割によって現在のブロックを再帰的にパーティション分割することと、
リーフノードが画像の右側の境界に完全に直接配置されるまで、垂直方向の強制境界パーティション分割によってサブパーティションを再帰的にパーティション分割することと、を含む、又はその逆を含む、実施形態1又は2に記載のパーティション分割方法。
実施形態4:
最小許容四分木リーフノードサイズは、非境界ブロックのパーティション分割を制御するためにも適用される最小許容四分木リーフノードサイズである、実施形態1乃至3のいずれかに記載のパーティション分割方法。
実施形態5:
実施形態1乃至4のいずれかに記載のパーティション分割方法に従ってブロックをパーティション分割することによりブロックをデコードするためのデコード化方法。
実施形態6:
最小許容四分木リーフノードサイズはSPSを介して受信される、実施形態5に記載のデコード化方法。
実施形態7:
実施形態1乃至4のいずれかに記載のパーティション分割方法に従ってブロックをパーティション分割することによってブロックをエンコードするためのエンコード化方法。
実施形態8:
最小許容四分木リーフノードサイズはSPSを介して送信される、実施形態7に記載のエンコード化方法。
実施形態9:
実施形態5又は6の方法のいずれか1つを実行するように構成された論理回路を含むデコード化装置。
実施形態10:
実施形態7又は8の方法のいずれか1つを実行するように構成された論理回路を含むエンコード化装置。
実施形態11:
命令を記憶するための非一時的な記憶媒体であって、命令がプロセッサによって実行されたときに、プロセッサに、実施形態1乃至8による方法のいずれかを実行させる。
【0135】
1つ又は複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実現され得る。ソフトウェアで実現される場合に、機能は、コンピュータ可読媒体上に1つ又は複数の命令又はコードとして格納又は送信され、ハードウェアベースの処理装置によって実行され得る。コンピュータ可読媒体は、データ記憶媒体等の有形媒体に対応するコンピュータ可読記憶媒体、又は、例えば通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、(1)非一時的である有形のコンピュータ可読記憶媒体、或いは(2)信号又は搬送波等の通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技術の実施のための命令、コード、又はデータ構造を検索するために、1つ又は複数のコンピュータ或いは1つ又は複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。
【0136】
限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、電気的に消去可能なプログラム可能な読取り専用メモリ(EEPROM)、CD-ROM、又は他の光ディスク記憶装置、磁気ディスク記憶装置、他の磁気記憶装置、フラッシュメモリを含むことができ、或いは命令又はデータ構造の形式で目的のプログラムコードを格納するために使用でき、且つコンピュータからアクセスできる他の媒体を含むことができる。また、あらゆる接続はコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者線(DSL)、又は赤外線、無線、マイクロ波等のワイヤレス技術を使用して、Webサイト、サーバ、又は他のリモートソースから送信される場合に、媒体の規定には、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、又は赤外線、無線、マイクロ波等のワイヤレス技術が含まれる。しかしながら、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時的な媒体を含まず、代わりに、非一時的な有形の記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(disk)及びディスク(disc)には、コンパクトディスク(CD)、レーザーディスク、光ディスク、デジタル多用途ディスク(DVD)、フロッピーディスク及びBlu-ray(登録商標)ディスクが含まれ、ディスク(disk)は通常データを磁気的に再生し、ディスク(disc)はレーザーを使用してデータを光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲に含める必要がある。
【0137】
命令は、1つ又は複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、又は他の同等の集積回路又はディスクリート論理回路等の1つ又は複数のプロセッサによって実行され得る。従って、本明細書で使用される「プロセッサ」という用語は、前述した構造のいずれか、又は本明細書で説明した技術の実施に適した他の任意の構造を指す場合がある。さらに、いくつかの態様では、本明細書で説明した機能は、エンコード及びデコードのために構成された、又は複合コーデックに組み込まれた専用のハードウェア及び/又はソフトウェアモジュール内で提供され得る。また、これらの技術は、1つ又は複数の回路又は論理要素に完全に実現することができる。
【0138】
本開示の技術は、無線ハンドセット、集積回路(IC)、又はICのセット(例えば、チップセット)を含む、多種多様な装置又は機器で実施され得る。開示した技術を実行するように構成された装置の機能的態様を強調するために、様々なコンポーネント、モジュール、又はユニットを本開示で説明したが、必ずしも異なるハードウェアユニットによる実現を必要としない。むしろ、上記のように、様々なユニットは、コーデックハードウェアユニットに組み合わされるか、又は適切なソフトウェア及び/又はファームウェアと組み合わせて、上記の1つ又は複数のプロセッサを含む相互運用ハードウェアユニットの集合によって提供され得る。
【0139】
機器は、メモリ要素と;メモリ要素に結合されたプロセッサ要素と;を含み、プロセッサ要素は、画像の現在のブロックが境界ブロックであるかどうかを判定し、現在のブロックが境界ブロックであるときに、現在のブロックのサイズが最小許容四分木(QT)リーフノードサイズ(MinQTSize)よりも大きいかどうかを判定し、現在のブロックのサイズがMinQTSizeより大きくない場合に、現在のブロックに強制二分木(BT)パーティション分割を適用する、ように構成される。
【0140】
本開示ではいくつかの実施形態を提供しているが、開示したシステム及び方法は、本開示の精神又は範囲から逸脱することなく、他の多くの特定の形態で具体化され得ることを理解されたい。本実施例は、例示的であり、限定的ではないと見なすべきであり、その意図は、本明細書に与えられた詳細に限定すべきではない。例えば、様々な要素又は構成要素を別のシステムに組み合わせたり統合したり、特定の機能を省略したり、実施しなかったりすることができる。
【0141】
さらに、離散的又は別個として様々な実施形態で説明及び図示した技術、システム、サブシステム、及び方法は、本開示の範囲から逸脱することなく、他のシステム、モジュール、技術、又は方法と組み合わせ又は統合することができる。結合又は直接結合又は互いに通信するものとして図示又は説明している他のアイテムは、電気的、機械的、又は他の方法で、何らかのインターフェイス、装置、又は中間コンポーネントを介して間接的に結合又は通信することができる。変更、置換、及び交代の他の例は、当業者によって確認可能であり、且つ本明細書に開示される精神及び範囲から逸脱することなく行うことができる。
【0142】
頭字語の規定及び用語集
HEVC 高効率ビデオ符号化(High-Efficiency Video Coding)
VVC 多用途ビデオ符号化(Versatile Video Coding)
VTM VVCテストモデル(VVC Test Model)
JEM 共同探査モデル(Joint Exploration Model)
CTU 符号化ツリーユニット(Coding Tree Unit)
CU 符号化ユニット(Coding Unit)
BT 二分木(Binary Tree)
TT 三分木(Ternary Tree)
QT 四分木又は四次木(Quad Tree or Quaternary Tree)
ABT 非対称BT(Asymmetric BT)
MMT マルチタイプツリー(Multi-type tree)
AMP 非対称パーティション(Asymmetric Partition)
SH スライスヘッダ(Slice Header)
SPS シーケンスパラメータセット(Sequence Parameter Set)
PPS 画像パラメータセット(Picture Parameter Set)
CE コア実験(Core Experiment)
SubCE サブコア実験(SubCore Experiment)(コア実験の一部)

図1A
図1B
図2
図3
図4
図5
図6
図7A
図7B
図8
図9A
図9B
図10
【外国語明細書】