(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-19
(45)【発行日】2025-03-28
(54)【発明の名称】ルマサンプル位置を参照してクロマブロックの予測モードを決定する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
(51)【国際特許分類】
H04N 19/11 20140101AFI20250321BHJP
H04N 19/186 20140101ALI20250321BHJP
H04N 19/176 20140101ALI20250321BHJP
H04N 19/159 20140101ALI20250321BHJP
H04N 19/593 20140101ALI20250321BHJP
【FI】
H04N19/11
H04N19/186
H04N19/176
H04N19/159
H04N19/593
(21)【出願番号】P 2023159990
(22)【出願日】2023-09-25
(62)【分割の表示】P 2022509156の分割
【原出願日】2020-08-14
【審査請求日】2023-09-25
(32)【優先日】2019-08-14
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100165191
【氏名又は名称】河合 章
(74)【代理人】
【識別番号】100114018
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100159259
【氏名又は名称】竹本 実
(72)【発明者】
【氏名】チャン ヒョン ムン
(72)【発明者】
【氏名】ホ チン
【審査官】白川 瑞樹
(56)【参考文献】
【文献】国際公開第2021/013053(WO,A1)
【文献】国際公開第2021/017923(WO,A1)
【文献】BROSS, Benjamin et al.,Versatile Video Coding (Draft 6),JVET-O2001 (version 14),ITU,2019年07月31日,pp.164-165,JVET-O2001-vE.docx
【文献】ZHANG, Kai et al.,Non-CE3: Fixed MPMs for MIP,JVET-O0255 (version 1),ITU,2019年06月26日,pp.1-8,JVET-O0255.docx
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
画像復号化装置によって行われる画像復号化方法であって、
画像を分割して現在クロマブロックを識別するステップと、
前記現在クロマブロック
に対応する第1ルマサンプル位置に行列ベースのイントラ予測モードが適用されるか
どうかを識別するステップと、
前記行列ベースのイントラ予測モードが適用されな
いことに基づいて、前記現在クロマブロック
に対応する第2ルマサンプル位置に所定の予測モードが適用されるか
どうかを識別するステップと、
前記所定の予測モードが適用されな
いことに基づいて、前記現在クロマブロックのイントラ予測モード候補を、前記現在クロマブロックに対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定するステップと、
前記イントラ予測モード候補と
付加情報に基づいて、前記現在クロマブロックのイントラ予測モードを決定するステップと、を含み、
前記
付加情報は、CCLM(c
ross component linear model)予測モードが適用されるか
どうかを指示する情報と、CCLMモードタイプを指示する情報と、前記現在クロマブロックに適用されるイントラ予測モードタイプを指示する情報とを含
み、
前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、同じである、画像復号化方法。
【請求項2】
前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの幅と高さのうちの少なくとも一つに基づいて決定される、請求項1に記載の画像復号化方法。
【請求項3】
前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいて決定される、請求項1に記載の画像復号化方法。
【請求項4】
前記第2ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの幅と高さのうちの少なくとも一つに基づいて決定される、請求項1に記載の画像復号化方法。
【請求項5】
前記第2ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいて決定される、請求項1に記載の画像復号化方法。
【請求項6】
前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの中心位置である、請求項
2に記載の画像復号化方法。
【請求項7】
前記第1ルマサンプル位置のx成分位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプルのx成分位置に前記ルマブロックの幅の半分を加えることにより決定され、
前記第1ルマサンプル位置のy成分位置は、前記現在クロマブロックに対応する
前記ルマブロックの
前記左上側サンプルのy成分位置に前記ルマブロックの高さの半分を加えることにより決定される、請求項
1に記載の画像復号化方法。
【請求項8】
前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいてそれぞれ決定される、請求項
1に記載の画像復号化方法。
【請求項9】
画像符号化装置によって行われる画像符号化方法であって、
画像を分割して現在クロマブロックを識別するステップと、
前記現在クロマブロック
に対応する第1ルマサンプル位置に行列ベースのイントラ予測モードが適用されるか
どうかを識別するステップと、
前記行列ベースのイントラ予測モードが適用されな
いことに基づいて、前記現在クロマブロック
に対応する第2ルマサンプル位置に所定の予測モードが適用されるか
どうかを識別するステップと、
前記所定の予測モードが適用されな
いことに基づいて、前記現在クロマブロックのイントラ予測モード候補を、前記現在クロマブロックに対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定するステップと、を含み、
前記イントラ予測モード候補と
付加情報に基づいて、前記現在クロマブロックのイントラ予測モードは決定され、
前記
付加情報は、CCLM(c
ross component linear model)予測モードが適用されるか
どうかを指示する情報と、CCLMモードタイプを指示する情報と、前記現在クロマブロックに適用されるイントラ予測モードタイプを指示する情報
とを含
み、
前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、同じである、画像符号化方法。
【請求項10】
ビットストリームを伝送する方法であっ
て、
画像を分割して現在クロマブロックを識別するステップと、
前記現在クロマブロックに対応する第1ルマサンプル位置に
行列ベースのイントラ予測モードが適用されるか
どうかを識別するステップと、
前記行列ベースのイントラ予測モードが適用されないことに基づいて、前記現在クロマブロック
に対応する第2ルマサンプル位置に所定の予測モードが適用されるか
どうかを識別するステップと、
前記所定の予測モードが適用されな
いことに基づいて、前記現在クロマブロックのイントラ予測モード候補を、前記現在クロマブロック
に対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定するステップと、
付加情報をエンコーディングして前記ビットストリームを生成するステップと、
前記ビットストリームを含むデータを伝送するステップと、を含み、
前記現在クロマブロックのイントラ予測モードは、前記イントラ予測モード候補と
前記付加情報に基づいて決定され、
前記
付加情報は、CCLM(c
ross component linear model)予測モードが適用されるか
どうかを指示する情報と、CCLMモードタイプを指示する情報と、前記現在クロマブロックに適用されるイントラ予測モードタイプを指示する情報
とを含
み、
前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、同じである、ビットストリームを伝送する方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像符号化/復号化方法及び装置に係り、より詳細には、クロマブロックのイントラ予測モードを決定する画像符号化/復号化方法、装置、及び本開示の画像符号化方法/装置によって生成されたビットストリームを伝送する方法に関する。
【背景技術】
【0002】
最近、高解像度、高品質の画像、例えばHD(High Definition)画像及びUHD(Ultra High Definition)画像への需要が多様な分野で増加している。画像データが高解像度、高品質になるほど、従来の画像データに比べて、伝送される情報量又はビット量が相対的に増加する。伝送される情報量又はビット量の増加は、伝送費用と保存費用の増加をもたらす。
【0003】
これにより、高解像度、高品質画像の情報を効果的に伝送又は保存し、再生するための高効率の画像圧縮技術が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示は、符号化/復号化効率が向上した画像符号化/復号化方法及び装置を提供することを目的とする。
【0005】
また、本開示は、より少ない数のルマサンプル位置を参照してクロマブロックの予測モードを決定することにより、符号化/復号化効率の向上を図る画像符号化/復号化方法及び装置を提供することを目的とする。
【0006】
また、本開示は、本開示による画像符号化方法又は装置によって生成されたビットストリームを伝送する方法を提供することを目的とする。
【0007】
また、本開示は、本開示による画像符号化方法又は装置によって生成されたビットストリームを保存した記録媒体を提供することを目的とする。
【0008】
また、本開示は、本開示による画像復号化装置によって受信され、復号化されて画像の復元に利用されるビットストリームを保存した記録媒体を提供することを目的とする。
【0009】
本開示で解決しようとする技術的課題は上述した技術的課題に制限されず、上述していない別の技術的課題は以降の記載から本開示の属する技術分野における通常の知識を有する者に明確に理解できるであろう。
【課題を解決するための手段】
【0010】
本開示の一態様による画像復号化装置によって行われる画像復号化方法は、画像を分割して現在クロマブロックを識別するステップと、前記現在クロマブロックと対応する第1ルマサンプル位置に行列ベースのイントラ予測モードが適用されるか否かを識別するステップと、前記行列ベースのイントラ予測モードが適用されなければ、前記現在クロマブロックと対応する第2ルマサンプル位置に所定の予測モードが適用されるか否かを識別するステップと、前記所定の予測モードが適用されなければ、前記現在クロマブロックのイントラ予測モード候補を前記現在クロマブロックと対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定するステップと、を含むことができる。前記所定の予測モードは、IBC(Intra Block Copy)モード又はパレットモードであり得る。
【0011】
前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの幅と高さのうちの少なくとも一つに基づいて決定されることができる。前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいて決定されることができる。前記第1ルマサンプル位置は、前記第3ルマサンプル位置と同じ位置であり得る。
【0012】
前記第2ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの幅と高さのうちの少なくとも一つに基づいて決定されることができる。前記第2ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいて決定されることができる。前記第2ルマサンプル位置は、前記第3ルマサンプル位置と同じ位置であり得る。
【0013】
又は、前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、互いに同一の位置であり得る。
【0014】
前記第1ルマサンプル位置は、前記現在クロマブロックに対応する前記ルマブロックの中心位置であり得る。前記第1ルマサンプル位置のx成分位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプルのx成分位置に前記ルマブロックの幅の半分を加えることにより決定され、前記第1ルマサンプル位置のy成分位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプルのy成分位置に前記ルマブロックの高さの半分を加えることにより決定されることができる。
【0015】
前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいてそれぞれ決定されることができる。
【0016】
また、本開示の一態様による画像復号化装置は、メモリ及び少なくとも一つのプロセッサを含み、前記少なくとも一つのプロセッサは、画像を分割して現在クロマブロックを識別し、前記現在クロマブロックと対応する第1ルマサンプル位置に行列ベースのイントラ予測モードが適用されるか否かを識別し、前記行列ベースのイントラ予測モードが適用されなければ、前記現在クロマブロックと対応する第2ルマサンプル位置に所定の予測モードが適用されるか否かを識別し、前記所定の予測モードが適用されなければ、前記現在クロマブロックのイントラ予測モード候補を前記現在クロマブロックと対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定することができる。
【0017】
また、本開示の一態様による画像符号化装置によって行われる画像符号化方法は、画像を分割して現在クロマブロックを識別するステップと、前記現在クロマブロックと対応する第1ルマサンプル位置に行列ベースのイントラ予測モードが適用されるか否かを識別するステップと、前記行列ベースのイントラ予測モードが適用されなければ、前記現在クロマブロックと対応する第2ルマサンプル位置に所定の予測モードが適用されるか否かを識別するステップと、前記所定の予測モードが適用されなければ、前記現在クロマブロックのイントラ予測モード候補を前記現在クロマブロックと対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定するステップと、を含むことができる。
【0018】
また、本開示の一態様による伝送方法は、本開示の画像符号化装置又は画像符号化方法によって生成されたビットストリームを伝送することができる。
【0019】
また、本開示の一態様によるコンピュータ可読記録媒体は、本開示の画像符号化方法又は画像符号化装置によって生成されたビットストリームを保存することができる。
【0020】
本開示について簡略に要約して上述した特徴は、後述する本開示の詳細な説明の例示的な態様に過ぎず、本開示の範囲を制限するものではない。
【発明の効果】
【0021】
本開示によれば、符号化/復号化効率が向上した画像符号化/復号化方法及び装置が提供されることができる。
【0022】
また、本開示によれば、より少ない数のルマサンプル位置を参照してクロマブロックの予測モードを決定することにより、符号化/復号化効率の向上を図る画像符号化/復号化方法及び装置が提供されることができる。
【0023】
また、本開示によれば、本開示による画像符号化方法又は装置によって生成されたビットストリームを伝送する方法が提供されることができる。
【0024】
また、本開示によれば、本開示による画像符号化方法又は装置によって生成されたビットストリームを保存した記録媒体が提供されることができる。
【0025】
また、本開示によれば、本開示による画像復号化装置によって受信され、復号化されて画像の復元に利用されるビットストリームを保存した記録媒体が提供されることができる。
【0026】
本開示で得られる効果は、上述した効果に限定されず、上述していない別の効果は、以降の記載から、本開示の属する技術分野における通常の知識を有する者に明確に理解できるだろう。
【図面の簡単な説明】
【0027】
【
図1】本開示による実施例が適用できるビデオコーディングシステムを概略的に示す図である。
【
図2】本開示による実施例が適用できる画像符号化装置を概略的に示す図である。
【
図3】本開示による実施例が適用できる画像復号化装置を概略的に示す図である。
【
図4】一実施例による画像の分割構造を示す図である。
【
図5】マルチタイプツリー構造によるブロックの分割タイプの一実施例を示す図である。
【
図6】本開示によるマルチタイプツリーを伴う四分木(quadtree with nested multi-type tree)構造におけるブロック分割情報のシグナリングメカニズムを例示する図である。
【
図7】CTUが多重CUに分割される一実施例を示す図である。
【
図8】冗長(redundant)分割パターンの一実施例を示す図である。
【
図9】一実施例によるクロマフォーマットによって決定されるルマサンプルとクロマサンプルの位置関係を示す図である。
【
図10】一実施例によるクロマフォーマットによって決定されるルマサンプルとクロマサンプルの位置関係を示す図である。
【
図11】一実施例によるクロマフォーマットによって決定されるルマサンプルとクロマサンプルの位置関係を示す図である。
【
図12】一実施例によるクロマフォーマットシグナリングのためのシンタックスを示す図である。
【
図13】一実施例によるクロマフォーマット分類表を示す図である。
【
図14】一実施例による方向性イントラ予測モードを説明するための図である。
【
図15】一実施例による方向性イントラ予測モードを説明するための図である。
【
図16】一実施例によるMIPモードを説明する参照図である。
【
図17】一実施例によるMIPモードを説明する参照図である。
【
図18】一実施例による水平スキャンと垂直スキャンの実施例を示す図である。
【
図19】一実施例によるクロマブロックのイントラ予測モード決定方法を示す図である。
【
図20】クロマイントラ予測モードを決定するための参照表を示す図である。
【
図21】クロマイントラ予測モードを決定するための参照表を示す図である。
【
図22】一実施例によるルマイントラ予測モード情報決定方法を説明するフローチャートである。
【
図23】一実施例によるルマイントラ予測モード情報決定方法を説明するフローチャートである。
【
図24】一実施例によるルマイントラ予測モード情報決定方法を説明するフローチャートである。
【
図25】一実施例によるルマイントラ予測モード情報決定方法を説明するフローチャートである。
【
図26】一実施例による符号化装置と復号化装置が一実施例による符号化及び復号化を行う方法を説明するフローチャートである。
【
図27】本開示の実施例が適用できるコンテンツストリーミングシステムを例示する図である。
【発明を実施するための形態】
【0028】
以下、添付図面を参照して、本開示の実施例について、本開示の属する技術分野における通常の知識を有する者が容易に実施し得るように詳細に説明する。しかし、本開示は、様々な異なる形態で実現でき、ここで説明する実施例に限定されない。
【0029】
本開示の実施例を説明するにあたり、公知の構成又は機能についての具体的な説明が本開示の要旨を不明確にするおそれがあると判断される場合には、それについての詳細な説明は省略する。そして、図面において、本開示についての説明と関係ない部分は省略し、同様の部分には同様の図面符号を付した。
【0030】
本開示において、ある構成要素が他の構成要素と「連結」、「結合」又は「接続」されているとするとき、これは、直接的な連結関係だけでなく、それらの間に別の構成要素が存在する間接的な連結関係も含むことができる。また、ある構成要素が他の構成要素を「含む」又は「有する」とするとき、これは、特に反対される記載がない限り、別の構成要素を排除するのではなく、別の構成要素をさらに含むことができることを意味する。
【0031】
本開示において、「第1」、「第2」などの用語は、一つの構成要素を他の構成要素から区別する目的のみで使用され、特に言及されない限り、構成要素間の順序又は重要度などを限定しない。したがって、本開示の範囲内において、一実施例の第1構成要素は、他の実施例で第2構成要素と呼んでもよく、これと同様に、一実施例の第2構成要素を、他の実施例で第1構成要素と呼んでもよい。
【0032】
本開示において、互いに区別される構成要素は、それぞれの特徴を明確に説明するためのものであり、構成要素が必ずしも分離されることを意味するものではない。つまり、複数の構成要素が統合されて一つのハードウェア又はソフトウェア単位で構成されてもよく、一つの構成要素が分散されて複数のハードウェア又はソフトウェア単位で構成されてもよい。よって、別に言及しなくても、このように統合された又は分散された実施例も本開示の範囲に含まれる。
【0033】
本開示において、さまざまな実施例で説明する構成要素が必ず必要不可欠な構成要素を意味するものではなく、一部は選択的な構成要素であり得る。したがって、一実施例で説明する構成要素の部分集合で構成される実施例も本開示の範囲に含まれる。また、様々な実施例で説明する構成要素にさらに他の構成要素を含む実施例も、本開示の範囲に含まれる。
【0034】
本開示は、画像の符号化及び復号化に関するものであって、本開示で使用される用語は、本開示で新たに定義されない限り、本開示の属する技術分野における通常の意味を持つことができる。
【0035】
本開示において、「ピクチャ(picture)」は、一般的に、特定の時間帯のいずれか一つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、ピクチャの一部を構成する符号化単位であって、一つのピクチャは、一つ以上のスライス/タイルで構成できる。また、スライス/タイルは、一つ以上のCTU(coding tree unit)を含むことができる。
【0036】
本開示において、「ピクセル(pixel)」又は「ペル(pel)」は、一つのピクチャ(又は画像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用できる。サンプルは、一般的に、ピクセル又はピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。
【0037】
本開示において、「ユニット(unit)」は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定の領域及び当該領域に関連する情報のうちの少なくとも一つを含むことができる。ユニットは、場合に応じて、「サンプルアレイ」、「ブロック(block)」又は「領域(area)」などの用語と混用して使用できる。一般な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(又はサンプルアレイ)又は変換係数(transform coefficient)のセット(又はアレイ)を含むことができる。
【0038】
本開示において、「現在ブロック」は、「現在コーディングブロック」、「現在コーティングユニット」、「符号化対象ブロック」、「復号化対象ブロック」又は「処理対象ブロック」のうちのいずれか一つを意味することができる。予測が行われる場合、「現在ブロック」は、「現在予測ブロック」又は「予測対象ブロック」を意味することができる。変換(逆変換)/量子化(逆量子化)が行われる場合、「現在ブロック」は「現在変換ブロック」又は「変換対象ブロック」を意味することができる。フィルタリングが行われる場合、「現在ブロック」は「フィルタリング対象ブロック」を意味することができる。
【0039】
また、本開示において、「現在ブロック」は、クロマブロックという明示的な記載がない限り、「現在ブロックのルマブロック」を意味することができる。「現在ブロックのクロマブロック」は、明示的に「クロマブロック」又は「現在クロマブロック」のようにクロマブロックという明示的な記載を含んで表現できる。
【0040】
本開示において、「/」と「、」は「及び/又は」と解釈されることができる。例えば、「A/B」と「A、B」は「A及び/又はB」と解釈されることができる。また、「A/B/C」と「A、B、C」は、「A、B及び/又はCのうちの少なくとも一つ」を意味することができる。
【0041】
本開示において、「又は」は「及び/又は」と解釈されることができる。例えば、「A又はB」は、1)「A」のみを意味するか、2)「B」のみを意味するか、3)「A及びB」を意味することができる。又は、本開示において、「又は」は、「追加的に又は代替的に(additionally or alternatively)」を意味することができる。
【0042】
ビデオコーディングシステムの概要
【0043】
図1は本開示によるビデオコーディングシステムを示す図である。
【0044】
一実施例によるビデオコーディングシステムは、符号化装置10及び復号化装置20を含むことができる。符号化装置10は、符号化されたビデオ(video)及び/又は画像(image)情報又はデータをファイル又はストリーミング形式でデジタル記憶媒体又はネットワークを介して復号化装置20へ伝達することができる。
【0045】
一実施例による符号化装置10は、ビデオソース生成部11、符号化部12及び伝送部13を含むことができる。一実施例による復号化装置20は、受信部21、復号化部22及びレンダリング部23を含むことができる。前記符号化部12は、ビデオ/画像符号化部と呼ばれることができ、前記復号化部22は、ビデオ/画像復号化部と呼ばれることができる。伝送部13は、符号化部12に含まれることができる。受信部21は、復号化部22に含まれることができる。レンダリング部23は、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイス又は外部コンポーネントとして構成されることもできる。
【0046】
ビデオソース生成部11は、ビデオ/画像のキャプチャ、合成又は生成過程などを介してビデオ/画像を取得することができる。ビデオソース生成部11は、ビデオ/画像キャプチャデバイス及び/又はビデオ/画像生成デバイスを含むことができる。ビデオ/画像キャプチャデバイスは、例えば、一つ以上のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含むことができる。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレット及びスマートフォンなどを含むことができ、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどを介して、仮想のビデオ/画像が生成されることができ、この場合、ビデオ/画像キャプチャ過程は、関連データが生成される過程に置き換えられることができる。
【0047】
符号化部12は、入力ビデオ/画像を符号化することができる。符号化部12は、圧縮及び符号化効率のために、予測、変換、量子化などの一連の手順を行うことができる。符号化部12は、符号化されたデータ(符号化されたビデオ/画像情報)をビットストリーム(bitstream)形式で出力することができる。
【0048】
伝送部13は、ビットストリーム形式で出力された、符号化されたビデオ/画像情報又はデータを、ファイル又はストリーミング形式でデジタル記憶媒体又はネットワークを介して復号化装置20の受信部21に伝達することができる。デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray(登録商標)、HDD、SSDなどのさまざまな記憶媒体を含むことができる。伝送部13は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介して伝送するためのエレメントを含むことができる。受信部21は、前記記憶媒体又はネットワークから前記ビットストリームを抽出/受信して復号化部22に伝達することができる。
【0049】
復号化部22は、符号化部12の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/画像を復号化することができる。
【0050】
レンダリング部23は、復号化されたビデオ/画像をレンダリングすることができる。レンダリングされたビデオ/画像は、ディスプレイ部を介して表示されることができる。
【0051】
画像符号化装置の概要
【0052】
図2は本開示による実施例が適用できる画像符号化装置を概略的に示す図である。
【0053】
図2に示されているように、画像符号化装置100は、画像分割部110、減算部115、変換部120、量子化部130、逆量子化部140、逆変換部150、加算部155、フィルタリング部160、メモリ170、インター予測部180、イントラ予測部185及びエントロピー符号化部190を含むことができる。インター予測部180及びイントラ予測部185は、合わせて「予測部」と呼ばれることができる。変換部120、量子化部130、逆量子化部140及び逆変換部150は、レジデュアル(residual)処理部に含まれることができる。レジデュアル処理部は減算部115をさらに含むこともできる。
【0054】
画像符号化装置100を構成する複数の構成部の全部又は少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、エンコーダ又はプロセッサ)で実現されることができる。また、メモリ170は、DPB(decoded picture buffer)を含むことができ、デジタル記憶媒体によって実現できる。
【0055】
画像分割部110は、画像符号化装置100に入力された入力画像(又は、ピクチャ、フレーム)を一つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)又は最大コーディングユニット(largest coding unit、LCU)をQT/BT/TT(Quad-tree/binary-tree/ternary-tree)構造によって再帰的に(recursively)分割することにより取得されることができる。例えば、一つのコーディングニットは、四分木構造、二分木構造及び/又は三分木構造に基づいて、下位(deeper)デプスの複数のコーディングユニットに分割されることができる。コーディングユニットの分割のために、四分木構造が先に適用され、二分木構造及び/又は三分木構造が後で適用されることができる。それ以上分割されない最終コーディングユニットを基に、本開示によるコーディング手順が行われることができる。最大コーディングユニットが最終コーディングユニットとして使用されることができ、最大コーディングユニットを分割して取得した下位デプスのコーディングユニットが最終コーディングユニットとして使用されることもできる。ここで、コーディング手順とは、後述する予測、変換及び/又は復元などの手順を含むことができる。他の例として、前記コーディング手順の処理ユニットは、予測ユニット(PU:Prediction Unit)又は変換ユニット(TU:Transform Unit)であることができる。前記予測ユニット及び前記変換ユニットは、それぞれ前記最終コーディングユニットから分割又はパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を誘導する単位、及び/又は変換係数からレジデュアル信号(residual signal)を誘導する単位であることができる。
【0056】
予測部(インター予測部180又はイントラ予測部185)は、処理対象ブロック(現在ブロック)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現在ブロック又はCU単位でイントラ予測が適用されるか、或いはインター予測が適用されるかを決定することができる。予測部は、現在ブロックの予測に関するさまざまな情報を生成してエントロピー符号化部190に伝達することができる。予測に関する情報は、エントロピー符号化部190で符号化されてビットストリーム形式で出力されることができる。
【0057】
イントラ予測部185は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。参照される前記サンプルは、イントラ予測モード及び/又はイントラ予測技法に従って、前記現在ブロックの周辺(neighbor)に位置することもでき、或いは離れて位置することもできる。イントラ予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。非方向性モードは、例えば、DCモード及びPlanarモードを含むことができる。方向性モードは、予測方向の細密な程度に応じて、例えば33個の方向性予測モード又は65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定に基づいてそれ以上又はそれ以下の個数の方向性予測モードが使用できる。イントラ予測部185は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
【0058】
インター予測部180は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合、周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と、参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。前記参照ブロックを含む参照ピクチャと、前記時間周辺ブロックを含む参照ピクチャとは、同一でもよく、互いに異なってもよい。前記時間周辺ブロックは、コロケート参照ブロック(collocated reference block)、コロケートCU(colCU)などの名前で呼ばれることができる。前記時間周辺ブロックを含む参照ピクチャは、コロケートピクチャ(collocated picture、colPic)と呼ばれることができる。例えば、インター予測部180は、周辺ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われることができ、例えばスキップモードとマージモードの場合に、インター予測部180は、周辺ブロックの動き情報を現在ブロックの動き情報として用いることができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が伝送されないことができる。動き情報予測(motion vector prediction、MVP)モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)及び動きベクトル予測子に対するインジケータ(indicator)を符号化することにより、現在ブロックの動きベクトルをシグナリングすることができる。動きベクトル差分は、現在ブロックの動きベクトルと動きベクトル予測子との差を意味することができる。
【0059】
予測部は、後述する様々な予測方法及び/又は予測技法に基づいて予測信号を生成することができる。例えば、予測部は、現在ブロックの予測のために、イントラ予測又はインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用することができる。現在ブロックの予測のためにイントラ予測とインター予測を同時に適用する予測方法は、CIIP(combined inter and intra prediction)と呼ばれることができる。また、予測部は、現在ブロックの予測のためにイントラブロックコピー(intra block copy、IBC)を行うこともできる。イントラブロックコピーは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。IBCは、現在ブロックから所定の距離だけ離れた位置の現在ピクチャ内の既に復元された参照ブロックを用いて現在ブロックを予測する方法である。IBCが適用される場合、現在ピクチャ内の参照ブロックの位置は前記所定の距離に該当するベクトル(ブロックベクトル)として符号化されることができる。IBCは、基本的に、現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出するという点において、インター予測と同様に行われることができる。すなわち、IBCは、本開示で説明されるインター予測技法のうちの少なくとも一つを用いることができる。
【0060】
予測部によって生成された予測信号は、復元信号を生成するために用いられるか、或いはレジデュアル信号を生成するために用いられることができる。減算部115は、入力画像信号(原本ブロック、原本サンプルアレイ)から、予測部から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算して、レジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成することができる。生成されたレジデュアル信号は、変換部120に伝送されることができる。
【0061】
変換部120は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、又はCNT(Conditionally Non-linear Transform)のうちの少なくとも一つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとするとき、このグラフから得られた変換を意味する。CNTは、以前に復元されたすべてのピクセル(all previously reconstructed pixel)を用いて予測信号を生成し、それに基づいて取得される変換を意味する。変換過程は、正方形の同じサイズを有するピクセルブロックに適用されることもでき、正方形ではない、可変サイズのブロックに適用されることもできる。
【0062】
量子化部130は、変換係数を量子化してエントロピー符号化部190に伝送することができる。エントロピー符号化部190は、量子化された信号(量子化された変換係数に関する情報)を符号化してビットストリーム形式で出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部130は、係数スキャン順序(scan order)に基づいて、ブロック形式の量子化された変換係数を1次元ベクトル形式で再整列することができ、前記1次元ベクトル形式の量子化された変換係数に基づいて、前記量子化された変換係数に関する情報を生成することもできる。
【0063】
エントロピー符号化部190は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などの様々な符号化方法を行うことができる。エントロピー符号化部190は、量子化された変換係数の他に、ビデオ/画像復元に必要な情報(例えば、シンタックス要素(syntax elements)の値など)を一緒に又は別々に符号化することもできる。符号化された情報(例えば、符号化されたビデオ/画像情報)は、ビットストリーム形式でNAL(network abstraction layer)ユニット単位で伝送又は保存されることができる。前記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。本開示で言及されたシグナリング情報、伝送される情報及び/又はシンタックス要素は、上述した符号化手順を介して符号化されて前記ビットストリームに含まれることができる。
【0064】
前記ビットストリームは、ネットワークを介して伝送されることができ、又はデジタル記憶媒体に保存されることができる。ここで、ネットワークは、放送網及び/又は通信網などを含むことができ、デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray(登録商標)、HDD、SSDなどのさまざまな記憶媒体を含むことができる。エントロピー符号化部190から出力された信号を伝送する伝送部(図示せず)及び/又は保存する保存部(図示せず)が画像符号化装置100の内/外部要素として備えられることができ、又は伝送部はエントロピー符号化部190の構成要素として備えられることもできる。
【0065】
量子化部130から出力された、量子化された変換係数は、レジデュアル信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部140及び逆変換部150を介して逆量子化及び逆変換を適用することにより、レジデュアル信号(レジデュアルブロック又はレジデュアルサンプル)を復元することができる。
【0066】
加算部155は、復元されたレジデュアル信号をインター予測部180又はイントラ予測部185から出力された予測信号に加えることにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155は、復元部又は復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
【0067】
フィルタリング部160は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部160は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ170、具体的にはメモリ170のDPBに保存することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部160は、各フィルタリング方法についての説明で後述するようにフィルタリングに関する様々な情報を生成してエントロピー符号化部190に伝達することができる。フィルタリングに関する情報は、エントロピー符号化部190で符号化されてビットストリーム形式で出力されることができる。
【0068】
メモリ170に伝送された、修正された復元ピクチャは、インター予測部180で参照ピクチャとして使用されることができる。画像符号化装置100は、これを介してインター予測が適用される場合、画像符号化装置100と画像復号化装置での予測ミスマッチを回避することができ、符号化効率も向上させることができる。
【0069】
メモリ170内のDPBは、インター予測部180での参照ピクチャとして使用するために、修正された復元ピクチャを保存することができる。メモリ170は、現在ピクチャ内の動き情報が導出された(又は符号化された)ブロックの動き情報及び/又は既に復元されたピクチャ内ブロックの動き情報を保存することができる。前記保存された動き情報は、空間周辺ブロックの動き情報又は時間周辺ブロックの動き情報として活用するために、インター予測部180に伝達されることができる。メモリ170は、現在ピクチャ内の復元されたブロックの復元サンプルを保存することができ、イントラ予測部185に伝達することができる。
【0070】
画像復号化装置の概要
【0071】
図3は本開示による実施例が適用できる画像復号化装置を概略的に示す図である。
【0072】
図3に示されているように、画像復号化装置200は、エントロピー復号化部210、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260及びイントラ予測部265を含んで構成できる。インター予測部260及びイントラ予測部265を合わせて「予測部」と呼ばれることができる。逆量子化部220、逆変換部230はレジデュアル処理部に含まれることができる。
【0073】
画像復号化装置200を構成する複数の構成部の全部又は少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、デコーダ又はプロセッサ)で実現されることができる。また、メモリ170は、DPBを含むことができ、デジタル記憶媒体によって実現できる。
【0074】
ビデオ/画像情報を含むビットストリームを受信した画像復号化装置200は、
図1の画像符号化装置100で行われたプロセスに対応するプロセスを実行して画像を復元することができる。例えば、画像復号化装置200は、画像符号化装置で適用された処理ユニットを用いて復号化を行うことができる。したがって、復号化の処理ユニットは、例えばコーディングユニットであることができる。コーディングユニットは、コーディングツリーユニット又は最大コーディングユニットを分割して取得できる。そして、画像復号化装置200を介して復号化及び出力された復元画像信号は、再生装置(図示せず)を介して再生できる。
【0075】
画像復号化装置200は、
図2の画像符号化装置から出力された信号をビットストリーム形式で受信することができる。受信された信号は、エントロピー復号化部210を介して復号化できる。例えば、エントロピー復号化部210は、前記ビットストリームをパーシングして画像復元(又はピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出することができる。前記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。画像復号化装置は、画像を復号化するために、前記パラメータセットに関する情報及び/又は前記一般制限情報をさらに用いることができる。本開示で言及されたシグナリング情報、受信される情報及び/又はシンタックス要素は、前記復号化手順を介して復号化されることにより、前記ビットストリームから取得されることができる。例えば、エントロピー復号化部210は、指数ゴロム符号化、CAVLC又はCABACなどのコーディング方法に基づいてビットストリーム内の情報を復号化し、画像復元に必要なシンタックス要素の値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳細には、CABACエントロピー復号化方法は、ビットストリームから各シンタックス要素に該当するビン(bin)を受信し、復号化対象シンタックス要素情報と周辺ブロック及び復号化対象ブロックの復号化情報、或いは以前ステップで復号化されたシンボル/ビンの情報を用いてコンテキスト(context)モデルを決定し、決定されたコンテキストモデルに基づいてビン(bin)の発生確率を予測してビンの算術復号化(arithmetic decoding)を行うことにより、各シンタックス要素の値に該当するシンボルを生成することができる。この時、CABACエントロピー復号化方法は、コンテキストモデルの決定後、次のシンボル/ビンのコンテキストモデルのために、復号化されたシンボル/ビンの情報を用いてコンテキストモデルを更新することができる。エントロピー復号化部210で復号化された情報のうち、予測に関する情報は、予測部(インター予測部260及びイントラ予測部265)に提供され、エントロピー復号化部210でエントロピー復号化が行われたレジデュアル値、すなわち量子化された変換係数及び関連パラメータ情報は、逆量子化部220に入力されることができる。また、エントロピー復号化部210で復号化された情報のうち、フィルタリングに関する情報は、フィルタリング部240に提供されることができる。一方、画像符号化装置から出力された信号を受信する受信部(図示せず)が画像復号化装置200の内/外部要素としてさらに備えられることができ、又は受信部はエントロピー復号化部210の構成要素として備えられることもできる。
【0076】
一方、本開示による画像復号化装置は、ビデオ/画像/ピクチャ復号化装置と呼ばれることができる。前記画像復号化装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)及び/又はサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)を含むこともできる。前記情報デコーダは、エントロピー復号化部210を含むことができ、前記サンプルデコーダは、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260及びイントラ予測部265のうちの少なくとも一つを含むことができる。
【0077】
逆量子化部220では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部220は、量子化された変換係数を2次元のブロック形式で再整列することができる。この場合、前記再整列は、画像符号化装置で行われた係数スキャン順序に基づいて行われることができる。逆量子化部220は、量子化パラメータ(例えば、量子化ステップサイズ情報)を用いて、量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得することができる。
【0078】
逆変換部230では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得することができる。
【0079】
予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピー復号化部210から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか或いはインター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モード(予測技法)を決定することができる。
【0080】
予測部が後述の様々な予測方法(技法)に基づいて予測信号を生成することができるのは、画像符号化装置100の予測部についての説明で述べたのと同様である。
【0081】
イントラ予測部265は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。イントラ予測部185についての説明は、イントラ予測部265に対しても同様に適用されることができる。
【0082】
インター予測部260は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。例えば、インター予測部260は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出することができる。様々な予測モード(技法)に基づいてインター予測が行われることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモード(技法)を指示する情報を含むことができる。
【0083】
加算部235は、取得されたレジデュアル信号を予測部(インター予測部260及び/又はイントラ予測部265を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155についての説明は、加算部235に対しても同様に適用されることができる。加算部235は、復元部又は復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
【0084】
フィルタリング部240は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部240は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ250、具体的にはメモリ250のDPBに保存することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。
【0085】
メモリ250のDPBに保存された(修正された)復元ピクチャは、インター予測部260で参照ピクチャとして使用されることができる。メモリ250は、現在ピクチャ内の動き情報が導出された(又は復号化された)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を保存することができる。前記保存された動き情報は、空間周辺ブロックの動き情報又は時間周辺ブロックの動き情報として活用するために、インター予測部260に伝達することができる。メモリ250は、現在ピクチャ内の復元されたブロックの復元サンプルを保存することができ、イントラ予測部265に伝達することができる。
【0086】
本明細書において、画像符号化装置100のフィルタリング部160、インター予測部180及びイントラ予測部185で説明された実施例は、それぞれ画像復号化装置200のフィルタリング部240、インター予測部260及びイントラ予測部265にも、同様に又は対応するように適用されることができる。
【0087】
画像分割の概要
【0088】
本開示によるビデオ/画像コーディング方法は、次の画像分割構造に基づいて行われることができる。具体的には、後述する予測、レジデュアル処理((逆)変換、(逆)量子化など)、シンタックス要素コーディング、フィルタリングなどの手順は、前記画像分割構造に基づいて導出されたCTU、CU(及び/又はTU、PU)に基づいて行われることができる。画像はブロック単位で分割されることができ、ブロック分割手順は上述した符号化装置の画像分割部110で行われることができる。分割関連情報は、エントロピー符号化部190で符号化されてビットストリーム形式で復号化装置に伝達できる。復号化装置のエントロピー復号化部210は、前記ビットストリームから取得した前記分割関連情報に基づいて、現在ピクチャのブロック分割構造を導出し、これに基づいて画像復号化のための一連の手順(例えば、予測、レジデュアル処理、ブロック/ピクチャ復元、インループフィルタリングなど)を行うことができる。
【0089】
ピクチャは、コーディングツリーユニット(coding tree units、CTUs)のシーケンスに分割されることができる。
図4はピクチャがCTUに分割される例を示す。CTUはコーディングツリーブロック(CTB)に対応することができる。或いは、CTUはルマサンプルのコーディングツリーブロックと、対応するクロマサンプルの二つのコーディングツリーブロックを含むことができる。例えば、三つのサンプルアレイを含むピクチャに対して、CTUは、ルマサンプルのN×Nブロックとクロマサンプルの二つの対応ブロックを含むことができる。
【0090】
CTU分割の概要
【0091】
前述したように、コーディングユニットは、コーディングツリーユニット(CTU)又は最大符号化ユニット(LCU)をQT/BT/TT(Quad-tree/binary-tree/ternary-tree)構造によって再帰的に分割することにより取得できる。例えば、CTUは、まず、四分木構造に分割されることができる。その後、四分木構造のリーフノードは、マルチタイプツリー構造によってさらに分割されることができる。
【0092】
四分木による分割は、現在CU(又はCTU)を4等分する分割を意味する。四分木による分割によって、現在CUは、同じ幅と同じ高さを有する4つのCUに分割されることができる。現在CUがそれ以上四分木構造に分割されない場合、現在CUは、四分木構造のリーフノードに該当する。四分木構造のリーフノードに該当するCUは、それ以上分割されず、前述した最終コーディングユニットとして使用できる。又は、四分木構造のリーフノードに該当するCUは、マルチタイプツリー構造によってさらに分割されることができる。
【0093】
図5はマルチタイプツリー構造によるブロックの分割タイプを示す図である。マルチタイプツリー構造による分割は、二分木構造による2つの分割と三分木構造による2つの分割を含むことができる。
【0094】
二分木構造による2つの分割は、垂直バイナリ分割(vertical binary splitting、SPLIT_BT_VER)と水平バイナリ分割(horizontal binary splitting、SPLIT_BT_HOR)を含むことができる。垂直バイナリ分割(SPLIT_BT_VER)は、現在CUを垂直方向に二等分する分割を意味する。
図4に示されているように、垂直バイナリ分割によって、現在CUの高さと同じ高さ及び現在CUの幅の半分の幅を有する2つのCUが生成されることができる。水平バイナリ分割(SPLIT_BT_HOR)は、現在CUを水平方向に二等分する分割を意味する。
図5に示されているように、水平バイナリ分割によって、現在CUの高さの半分の高さをもって現在CUの幅と同じ幅を有する2つのCUが生成されることができる。
【0095】
三分木構造による2つの分割は、垂直ターナリ分割(vertical ternary splitting、SPLIT_TT_VER)と水平ターナリ分割(horizontal ternary splitting、SPLIT_TT_HOR)を含むことができる。垂直ターナリ分割(SPLIT_TT_VER)は、現在CUを垂直方向に1:2:1の割合で分割する。
図5に示されているように、垂直ターナリ分割によって、現在CUの高さと同じ高さ及び現在CUの幅の1/4の幅を有する2つのCUと、現在CUの高さと同じ高さ及び現在CUの幅の半分の幅を有するCUが生成されることができる。水平ターナリ分割SPLIT_TT_HORは、現在CUを水平方向に1:2:1の割合で分割する。
図4に示されているように、水平ターナリ分割によって、現在CUの高さの1/4の高さ及び現在CUの幅と同じ幅を有する2つのCUと、現在CUの高さの半分の高さ及び現在CUの幅と同じ幅を有する1つのCUが生成されることができる。
【0096】
図6は本開示によるマルチタイプツリーを伴う四分木(quadtree with nested multi-type tree)構造でのブロック分割情報のシグナリングメカニズムを例示する図である。
【0097】
ここで、CTUは四分木のルート(root)ノードとして扱われ、CTUは四分木構造に初めて分割される。現在CU(CTU又は四分木のノード(QT_node))に対して四分木分割を行うか否かを指示する情報(例えば、qt_split_flag)がシグナリングされることができる。例えば、qt_split_flagが第1値(例えば、「1」)であれば、現在CUは四分木に分割されることができる。また、qt_split_flagが第2値(例えば、「0」)であれば、現在CUは、四分木に分割されず、四分木のリーフノード(QT_leaf_node)になる。各四分木のリーフノードは、以後、マルチタイプツリー構造にさらに分割されることができる。つまり、四分木のリーフノードは、マルチタイプツリーのノード(MTT_node)になることができる。マルチタイプツリー構造で、現在ノードがさらに分割されるかを指示するために、第1フラグ(a fist flag、例えば、mtt_split_cu_flag)がシグナリングされることができる。もし当該ノードがさらに分割される場合(例えば、第1フラグが1である場合)には、分割方向(splitting direction)を指示するために、第2フラグ(a second flag、例えば、mtt_split_cu_verticla_flag)がシグナリングされることができる。例えば、第2フラグが1である場合には、分割方向は垂直方向であり、第2フラグが0である場合には、分割方向は水平方向であることができる。その後、分割タイプがバイナリ分割タイプであるかターナリ分割タイプであるかを指示するために、第3フラグ(a third flag、例えば、mtt_split_cu_binary_flag)がシグナリングされることができる。例えば、第3フラグが1である場合には、分割タイプはバイナリ分割タイプであり、第3フラグが0である場合には、分割タイプはターナリ分割タイプであることができる。バイナリ分割又はターナリ分割によって取得されたマルチタイプツリーのノードは、マルチタイプツリー構造にさらにパーティショニングされることができる。しかし、マルチタイプツリーのノードは四分木構造にパーティショニングされることはできない。前記第1フラグが0である場合、マルチタイプツリーの該当ノードは、それ以上分割されず、マルチタイプツリーのリーフノード(MTT_leaf_node)になる。マルチタイプツリーのリーフノードに該当するCUは、前述した最終コーディングユニットとして使用できる。
【0098】
前述したmtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagに基づいて、CUのマルチタイプツリー分割モード(multi-type tree splitting mode、MttSplitMode)が表1のとおりに導出されることができる。以下の説明において、マルチトリー分割モードは、マルチツリー分割タイプ又は分割タイプと略称することができる。
【0099】
【0100】
図7は四分木の適用後にマルチタイプツリーが適用されることによりCTUが多重CUに分割される例を示す。
図7において、太いブロックエッジ(bold block edge)710は四分木分割を示し、残りのエッジ720はマルチタイプツリー分割を示す。CUは、コーディングロック(CB)に対応することができる。一実施例において、CUは、ルマサンプルのコーディングブロックと、ルマサンプルに対応するクロマサンプルの二つのコーディングブロックと、を含むことができる。クロマ成分(サンプル)CB又はTBサイズは、ピクチャ/画像のカラーフォーマット(クロマフォーマット、例えば、4:4:4、4:2:2、4:2:0など)による成分比に従ってルマ成分(サンプル)CB又はTBサイズに基づいて導出されることができる。カラーフォーマットが4:4:4である場合、クロマ成分CB/TBサイズは、ルマ成分CB/TBサイズと同一に設定されることができる。カラーフォーマットが4:2:2である場合、クロマ成分CB/TBの幅はルマ成分CB/TBの幅の半分に設定されることができ、クロマ成分CB/TBの高さはルマ成分CB/TBの高さに設定されることができる。カラーフォーマットが4:2:0である場合、クロマ成分CB/TBの幅はルマ成分CB/TBの幅の半分に設定されることができ、クロマ成分CB/TBの高さはルマ成分CB/TBの高さの半分に設定されることができる。
【0101】
一実施例において、ルマサンプル単位を基準にCTUのサイズが128であるとき、CUのサイズは、CTUと同じサイズである128×128から4×4までのサイズを持つことができる。一実施例において、4:2:0カラーフォーマット(又はクロマフォーマット)である場合、クロマCBサイズは64×64から2×2までのサイズを持つことができる。
【0102】
一方、一実施例において、CUサイズとTUサイズとが同じであることができる。又は、CU領域内に複数のTUが存在することもできる。TUサイズとは、一般的に、ルマ成分(サンプル)TB(Transform Block)サイズを示すことができる。
【0103】
前記TUサイズは、予め設定された値である最大許容TBサイズ(maxTbSize)に基づいて導出されることができる。例えば、前記CUサイズが前記maxTbSizeよりも大きい場合、前記CUから、前記maxTbSizeを持つ複数のTU(TB)が導出され、前記TU(TB)単位で変換/逆変換が行われることができる。例えば、最大許容ルマTBサイズは64×64であり、最大許容クロマTBサイズは32×32であることができる。もし前記ツリー構造によって分割されたCBの幅又は高さが最大変換幅又は高さよりも大きい場合、当該CBは、自動的に(又は暗黙的に)水平及び垂直方向のTBサイズの制限を満足するまで分割されることができる。
【0104】
また、例えばイントラ予測が適用される場合、イントラ予測モード/タイプは、前記CU(又はCB)単位で導出され、周辺参照サンプル導出及び予測サンプル生成手順は、TU(又はTB)単位で行われることができる。この場合、一つのCU(又はCB)領域内に一つ又は複数のTU(又はTB)が存在することができ、この場合、前記複数のTU(又はTB)は同じイントラ予測モード/タイプを共有することができる。
【0105】
一方、マルチタイプツリーを伴った四分木コーディングツリースキームのために、次のパラメータがSPSシンタックス要素として符号化装置から復号化装置にシグナリングされることができる。例えば、四分木のルートノードのサイズを示すパラメータであるCTUsize、四分木のリーフノードの最小許容サイズを示すパラメータであるMinQTSize、二分木のルートノードの最大許容サイズを示すパラメータであるMaxBTSize、三分木のルートノードの最大許容サイズを示すパラメータであるMaxTTSize、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さ(maximum allowed hierarchy depth)を示すパラメータであるMaxMttDepth、二分木の最小許容リーフノードサイズを示すパラメータであるMinBtSize、及び三分木の最小許容リーフノードサイズを示すパラメータであるMinTtSizeのうちの少なくとも一つがシグナリングされることができる。
【0106】
4:2:0クロマフォーマットを用いる一実施例において、CTUサイズは128×128ルマブロック及びルマブロックに対応する二つの64×64クロマブロックに設定されることができる。この場合、MinQTSizeは16×16に設定され、MaxBtSizeは128×128に設定され、MaxTtSzieは64×64に設定され、MinBtSize及びMinTtSizeは4×4に設定され、MaxMttDepthは4に設定されことができる。四分木パーティショニングは、CTUに適用されて四分木のリーフノードを生成することができる。四分木のリーフノードはリーフQTノードと呼ばれることができる。四分木のリーフノードは16×16サイズ(例えば、the MinQTSize)乃至128×128サイズ(例えば、the CTU size)を持つことができる。もしリーフQTノードが128×128である場合、さらに二分木/三分木に分割されないことができる。これは、この場合に分割されてもMaxBtsize及びMaxTtszie(例えば、64×64)を超過するためである。これ以外の場合、リーフQTノードは、マルチタイプツリーにさらに分割されることができる。よって、リーフQTノードは、マルチタイプツリーに対するルートノード(root node)であり、リーフQTノードは、マルチタイプツリーデプス(mttDepth)0値を持つことができる。もし、マルチタイプツリーデプスがMaxMttdepth(例えば、4)に到達した場合、それ以上の追加分割は考慮されないことができる。もし、マルチタイプツリーノードの幅がMinBtSizeと同じであり、2xMinTtSizeと同じかそれより小さい場合、それ以上の追加的な水平分割は考慮されないことができる。もし、マルチタイプツリーノードの高さがMinBtSizeと同じであり、2xMinTtSizeと同じかそれより小さい場合、それ以上の追加的な垂直分割は考慮されないことができる。このように分割が考慮されない場合、符号化装置は、分割情報のシグナリングを省略することができる。このような場合、復号化装置は、所定の値に分割情報を誘導することができる。
【0107】
一方、一つのCTUは、ルマサンプルのコーディングブロック(以下、「ルマブロック」という)と、これに対応するクロマサンプルの二つのコーディングブロック(以下、「クロマブロック」という)と、を含むことができる。前述したコーディングツリースキームは、現在CUのルマブロック及びクロマブロックに対して同様に適用されることもでき、個別的に(separate)適用されることもできる。具体的には、一つのCTU内のルマブロック及びクロマブロックが同じブロックツリー構造に分割されることができ、この場合のツリー構造は、シングルツリー(SINGLE_TREE)と表すことができる。又は、一つのCTU内のルマブロック及びクロマブロックは、個別ブロックツリー構造に分割されることができ、この場合のツリー構造は、デュアルツリー(DUAL_TREE)と表すことができる。つまり、CTUがデュアルツリーに分割される場合、ルマブロックに対するブロックツリー構造とクロマブロックに対するブロックツリー構造が別個に存在することができる。このとき、ルマブロックに対するブロックツリー構造は、デュアルツリールマ(DUAL_TREE_LUMA)と呼ばれることができ、クロマブロックに対するブロックツリー構造は、デュアルツリークロマ(DUAL_TREE_CHROMA)と呼ばれることができる。P及びBスライス/タイルグループに対して、一つのCTU内のルマブロック及びクロマブロックは、同じコーディングツリー構造を持つように制限されることができる。しかし、Iスライス/タイルグループに対して、ルマブロック及びクロマブロックは、互いに個別ブロックツリー構造を持つことができる。もし個別ブロックツリー構造が適用される場合、ルマCTB(Coding Tree Block)は、特定のコーディングツリー構造に基づいてCUに分割され、クロマCTBは、他のコーディングツリー構造に基づいてクロマCUに分割されることができる。すなわち、個別ブロックツリー構造が適用されるIスライス/タイルグループ内のCUは、ルマ成分のコーディングブロック又は2つのクロマ成分のコーディングブロックで構成され、P又はBスライス/タイルグループのCUは、三つのカラー成分(ルマ成分及び二つのクロマ成分)のブロックで構成され得ることを意味することができる。
【0108】
上記において、マルチタイプツリーを伴った四分木コーディングツリー構造について説明したが、CUが分割される構造はこれに限定されない。例えば、BT構造及びTT構造は、多数の分割ツリー(Multiple Partitioning Tree、MPT)構造に含まれる概念と解釈されることができ、CUはQT構造及びMPT構造によって分割されると解釈することができる。QT構造及びMPT構造によってCUが分割される一例において、QT構造のリーフノードが幾つかのブロックに分割されるかに関する情報を含むシンタックス要素(例えば、MPT_split_type)及びQT構造のリーフノードが垂直及び水平のうちのどの方向に分割されるかに関する情報を含むシンタックス要素(例えば、MPT_split_mode)がシグナリングされることにより、分割構造が決定されることができる。
【0109】
別の例において、CUは、QT構造、BT構造又はTT構造とは異なる方法で分割されることができる。つまり、QT構造によって下位デプスのCUが上位デプスのCUの1/4サイズに分割されるか、或いはBT構造によって下位デプスのCUが上位デプスのCUの1/2サイズに分割されるか、或いはTT構造によって下位デプスのCUが上位デプスのCUの1/4又は1/2サイズに分割されるのとは異なり、下位デプスのCUは、場合によって、上位デプスのCUの1/5、1/3、3/8、3/5、2/3又は5/8のサイズに分割されることができ、CUが分割される方法は、これに限定されない。
【0110】
このように、前記マルチタイプツリーを伴った四分木コーディングブロック構造は、非常に柔軟なブロック分割構造を提供することができる。一方、マルチタイプツリーに支援される分割タイプのために、場合によって、異なる分割パターンが潜在的に同一のコーディングブロック構造の結果を導出することができる。符号化装置と復号化装置は、このような冗長(redundant)分割パターンの発生を制限することにより、分割情報のデータ量を減らすことができる。
【0111】
例えば、
図8は二分木分割及び三分木分割で発生しうる冗長分割パターンを例示的に示す。
図8に示されているように、2ステップレベルの一方向に対する連続バイナリ分割810と820は、ターナリ分割後のセンターパーティションに対するバイナリ分割と同じコーディングブロック構造を持つ。このような場合、三分木分割のセンターブロック830、840に対する二分木分割は禁止できる。このような禁止は、すべてのピクチャのCUに対して適用できる。このような特定の分割が禁止される場合、対応するシンタックス要素のシグナリングは、このように禁止される場合を反映して修正でき、これにより、分割のためにシグナリングされるビット数を減らすことができる。例えば、
図8に示されている例のように、CUのセンターブロックに対する二分木分割が禁止される場合、分割がバイナリ分割であるかターナリ分割であるかを示すmtt_split_cu_binary_flagシンタックス要素はシグナリングされず、その値は0に復号化装置によって誘導されることができる。
【0112】
クロマフォーマットの概要
【0113】
以下、クロマフォーマットについて説明する。画像は、ルマ成分(例えば、Y)アレイと2つのクロマ成分(例えば、Cb、Cr)アレイを含む符号化データで符号化できる。例えば、符号化された画像の1つのピクセルは、ルマサンプルとクロマサンプルを含むことができる。ルマサンプルとクロマサンプルの構成フォーマットを示すためにクロマフォーマットが使用でき、クロマフォーマットはカラーフォーマットと呼ばれることもある。
【0114】
一実施例において、画像は、モノクロム(monochrome)、4:2:0、4:2:2、4:4:4などのさまざまなクロマフォーマットで符号化できる。モノクロムサンプリングでは、1つのサンプルアレイが存在することができ、前記サンプルアレイはルマアレイであることができる。4:2:0サンプリングでは、1つのルマサンプルアレイと2つのクロマサンプルアレイが存在することができ、2つのクロマアレイのそれぞれは、高さがルマアレイの半分であり、幅もルマアレイの半分であることができる。4:2:2サンプリングでは、1つのルマサンプルアレイと2つのクロマサンプルアレイが存在することができ、2つのクロマアレイのそれぞれは、ルマアレイと高さが同一であり、幅はルマアレイの半分であることができる。4:4:4サンプリングでは、1つのルマサンプルアレイと2つのクロマサンプルアレイが存在することができ、2つのクロマアレイのそれぞれは、ルマアレイとは高さと幅が同一であることができる。
【0115】
図9は4:2:0サンプリングによるルマサンプルとクロマサンプルの一実施例による相対位置を示す図である。
図10は4:2:2サンプリングによるルマサンプルとクロマサンプルの一実施例による相対位置を示す図である。
図11は4:4:4サンプリングによるルマサンプルとクロマサンプルの一実施例による相対位置を示す図である。
図9に示すように、4:2:0サンプリングの場合、クロマサンプルの位置は対応するルマサンプルの下端に位置することができる。
図10に示すように、4:2:2サンプリングの場合、クロマサンプルは対応するルマサンプルの位置にオーバーラップして位置することができる。
図11に示すように、4:4:4サンプリングの場合、ルマサンプルとクロマサンプルはいずれもオーバーラップした位置に位置することができる。
【0116】
符号化装置と復号化装置で使用されるクロマフォーマットは、予め定められることもできる。又は、符号化装置及び復号化装置で適応的に使用されるために、符号化装置から復号化装置へクロマフォーマットがシグナリングされることもできる。一実施例において、クロマフォーマットは、chroma_format_idc及びseparate_colour_plane_flagのうちの少なくとも一つに基づいてシグナリングされることができる。chroma_format_idc及びseparate_colour_plane_flagのうちの少なくとも一つは、DPS、VPS、SPS又はPPSなどの上位レベルシンタックスを介してシグナリングされることができる。例えば、chroma_format_idc及びseparate_colour_plane_flagは、
図12のようなSPSシンタックスに含まれることができる。
【0117】
一方、
図13はchroma_format_idc及びseparate_colour_plane_flagのシグナリングを活用したクロマフォーマット分類の一実施例を示す。chroma_format_idcは、符号化画像に適用されたクロマフォーマットを示す情報であることができる。separate_colour_plane_flagは、特定のクロマフォーマットにおいてカラーアレイが分離されて処理されるか否かを示すことができる。例えば、chroma_format_idcの第1値(例えば、0)は、モノクロムサンプリングを示すことができる。chroma_format_idcの第2値(例えば、1)は、4:2:0サンプリングを示すことができる。chroma_format_idcの第3値(例えば、2)は、4:2:2サンプリングを示すことができる。chroma_format_idcの第4値(例えば、3)は、4:4:4サンプリングを示すことができる。
【0118】
4:4:4サンプリングでは、separate_colour_plane_flagの値に基づいて次の内容が適用できる。separate_colour_plane_flagの値が第1値(例えば、0)である場合、2つのクロマアレイのそれぞれは、ルマアレイと同一の高さ及び同一の幅を有することができる。このような場合、クロマサンプルアレイのタイプを示すChromaArrayTypeの値は、chroma_format_idcと同一に設定できる。もしseparate_colour_plane_flagの値が第2値(例えば、1)である場合、ルマ、Cb及びCrサンプルアレイは、分離されて(separately)処理されることにより、それぞれモノクロムサンプリングされたピクチャと同様に処理されることができる。この時、ChromaArrayTypeは0に設定できる。
【0119】
イントラ予測モードの概要
【0120】
以下、イントラ予測モードについてより詳細に説明する。
図14は一実施例によるイントラ予測方向を示す図である。自然画像(natural video)で提示された任意のエッジ方向(edge direction)をキャプチャするために、
図14に示すように、イントラ予測モードは、2つの非方向性イントラ予測モードと65個の方向性イントラ予測モードとを含むことができる。前記非方向性イントラ予測モードは、Planarイントラ予測モード及びDCイントラ予測モードを含むことができ、前記方向性イントラ予測モードは、2~66番のイントラ予測モードを含むことができる。
【0121】
一方、前記イントラ予測モードは、上述したイントラ予測モードの他にも、クロマサンプルのためのCCLM(cross-component linear model)モードをさらに含むことができる。CCLMモードは、LMパラメータ導出のために左側サンプルを考慮するか、上側サンプルを考慮するか、両方を考慮するかによって、L_CCLM、T_CCLM、LT_CCLMに分けられることができ、クロマ成分に対してのみ適用されることができる。例えば、イントラ予測モードは、下記表に示すように、イントラ予測モード値に応じてインデックス化されることができる。
【0122】
【0123】
図15は他の一実施例によるイントラ予測方向を示す図である。ここで、破線方向は、正方形ではないブロックにのみ適用される広角モードを示す。
図15に示すように、自然画像(natural video)で提示された任意のエッジ方向(edge direction)をキャプチャするために、一実施例によるイントラ予測モードは、2つの非方向性イントラ予測モードと共に93個の方向性イントラ予測モードを含むことができる。非方向性イントラ予測モードは、Planar予測モード及びDC予測モードを含むことができる。方向性イントラ予測モードは、
図15に矢印で示すように、2番~80番と-1番~-14番からなるイントラ予測モードを含むことができる。前記Planar予測モードはINTRA_PLANARと表記でき、DC予測モードはINTRA_DCと表記できる。そして、方向性イントラ予測モードは、INTRA_ANGULAR-14乃至INTRA_ANGULAR-1及びINTRA_ANGULAR2乃至INTRA_ANGULAR80と表記できる。一方、前記イントラ予測タイプ(又は付加イントラ予測モードなど)は、上述したLIP、PDPC、MRL、ISP、MIPのうちの少なくとも一つを含むことができる。前記イントラ予測タイプはイントラ予測タイプ情報に基づいて指示でき、前記イントラ予測タイプ情報は様々な形態で実現できる。一例として、前記イントラ予測タイプ情報は、前記イントラ予測タイプのうちの1つを指示するイントラ予測タイプインデックス情報を含むことができる。他の例として、前記イントラ予測タイプ情報は、前記MRLが前記現在ブロックに適用されるか、及び適用される場合には何番目の参照サンプルラインが用いられるかを示す参照サンプルライン情報(例えば、intra_luma_ref_idx)、前記ISPが前記現在ブロックに適用されるかを示すISPフラグ情報(例えば、intra_subpartitions_mode_flag)、前記ISPが適用される場合にサブパーティションの分割タイプを指示するISPタイプ情報(例えば、intra_subpartitions_split_flag)、PDPCの適用有無を示すフラグ情報又はLIPの適用有無を示すフラグ情報、MIPの適用有無を示すMIPフラグ情報のうちの少なくとも一つを含むことができる。
【0124】
前記イントラ予測モード情報及び/又は前記イントラ予測タイプ情報は、本開示で説明したコーディング方法を介して符号化/復号化できる。例えば、前記イントラ予測モード情報及び/又は前記イントラ予測タイプ情報は、truncated(rice) binary codeに基づいてエントロピーコーディング(例えば、CABAC、CAVLC)を介して符号化/復号化できる。
【0125】
現在ブロックにイントラ予測が行われる場合、現在ブロックのルマ成分ブロック(ルマブロック)に対する予測及びクロマ成分ブロック(クロマブロック)に対する予測が行われることができ、この場合、クロマブロックに対するイントラ予測モードは、ルマブロックに対するイントラ予測モードとは個別に設定できる。
【0126】
例えば、クロマブロックに対するイントラ予測モードは、イントラクロマ予測モード情報に基づいて指示でき、前記イントラクロマ予測モード情報は、intra_chroma_pred_modeシンタックス要素の形態でシグナリングされることができる。一例として、前記イントラクロマ予測モード情報は、Planarモード、DCモード、垂直(vertical)モード、水平(horizontal)モード、DM(Derived Mode)、CCLMモードのうちのいずれか一つを指すことができる。ここで、前記Planarモードは0番イントラ予測モード、前記DCモードは1番イントラ予測モード、前記垂直モードは26番イントラ予測モード、前記水平モードは10番イントラ予測モードをそれぞれ示すことができる。DMはdirect modeと呼ばれることもある。CCLMはLMと呼ばれることもある。
【0127】
一方、DMとCCLMは、ルマブロックの情報を用いてクロマブロックを予測する従属的なイントラ予測モードである。前記DMは、前記ルマ成分に対するイントラ予測モードと同じイントラ予測モードが前記クロマ成分に対するイントラ予測モードとして適用されるモードを示すことができる。また、前記CCLMは、クロマブロックに対する予測ブロックを生成する過程でルマブロックの復元されたサンプルをサブサンプリングした後、サブサンプリングされたサンプルにCCLMパラメータα及びβを適用して導出されたサンプルを前記クロマブロックの予測サンプルとして使用するイントラ予測モードを示すことができる。
【0128】
MIPモードの概要
【0129】
行列ベースのイントラ予測モード(MIP、matrix based intra prediction)は、ALWIP(affine linear weighted intra prediction)モード、LWIP(linear weighted intra prediction)モード、又はMWIP(matrix weighted intra prediction)モードと呼ばれることもある。行列ベースの予測ではないイントラ予測モードを非行列ベースの予測モードと定義することができる。例えば、非行列ベースの予測モードは、非方向性イントラ予測及び方向性イントラ予測を指し示すことができる。以下では、非行列ベースの予測モードを指し示すための用語として、イントラ予測モード又は一般イントラ予測モードを混用して使用する。以下、行列ベースの予測をMIPモードと称して記述する。
【0130】
前記MIPモードが現在ブロックに対して適用される場合、i)アベレージング(averaging)ステップが行われた周辺参照サンプルを用いて、ii)マトリクスベクトル積(matrix-vector-multiplication)ステップを行い、iii)必要に応じて水平/垂直補間(interpolation)ステップをさらに行うことにより、前記現在ブロックに対する予測サンプルを導出することができる。
【0131】
アベレージングステップは、周辺サンプルの値を平均化することにより行われることができる。アベレージング手順は、
図16(a)に示すように、現在ブロックの幅と幅がピクセル単位で4であれば、各境界面の平均を取って上側2つと左側2つの合計4つのサンプルを生成することにより行われることができ、
図16(b)に示すように、現在ブロックの幅と幅がピクセル単位で4でなければ、各境界面の平均を取って上側4つ及び左側4つの合計8つのサンプルを生成することにより行われることができる。
【0132】
マトリクスベクトル積ステップは、平均化されたサンプルに対してマトリクスベクトルを掛けた後、オフセットベクトルを加えることにより行われることができ、その結果、オリジナルブロックのサブサンプリングされた画素セットに対する予測信号を生成することができる。マトリクスとオフセットベクトルのサイズは、現在ブロックの幅と幅に応じて決定されることができる。
【0133】
水平/垂直補間ステップは、サブサンプリングされた予測信号からオリジナルブロックサイズの予測信号を生成するステップである。
図17に示すように、サブサンプリングされた予測信号と周辺画素値を用いて垂直及び水平補間を行うことにより、オリジナルブロックサイズの予測信号を生成することができる。
図17は8×8ブロックに対してMIP予測が行われる一実施例を示す。8×8ブロックの場合、
図16(b)に示すように、合計8個の平均化されたサンプルが生成されることができる。8個の平均化されたサンプルにマトリクスベクトルが掛けられ、オフセットベクトルが加えられることにより、
図17(a)に示すように偶数座標位置に16個のサンプル値が生成されることができる。その後、
図17(b)に示すように、現在ブロックの上側サンプルの平均値を用いて垂直補間を行うことができる。その後、
図17(c)に示すように現在ブロックの左側サンプルを用いて水平補間を行うことができる。
【0134】
前記MIPモードのために使用されるイントラ予測モードは、上述したLIP、PDPC、MRL、ISPイントラ予測や、ノーマルイントラ予測で使用されるイントラ予測モードとは異なるように構成できる。前記MIPモードのためのイントラ予測モードは、MIP intra prediction mode、MIP prediction mode又はMIPモードと呼ばれることがある。例えば、前記MIPのためのイントラ予測モードに応じて、前記マトリクスベクトル積で使用されるマトリクス及びオフセットが異なるように設定されることができる。ここで、前記マトリクスは(MIP)重みマトリクスと呼ばれることがあり、前記オフセットは(MIP)オフセットベクトル又は(MIP)バイアス(bias)ベクトルと呼ばれることがある。
【0135】
前述したイントラ予測タイプ情報は、前記現在ブロックにMIPモードが適用されるか否かを示すMIPフラグ(例えば、intra_mip_flag)を含むことができる。intra_mip_flag[x0][y0]は、現在ブロックがMIPモードで予測されたかを示すことができる。例えば、intra_mip_flag[x0][y0]の第1値(例えば、0)は、現在ブロックがMIPモードで予測されなかったことを示すことができる。intra_mip_flag[x0][y0]の第2値(例えば、1)は、現在ブロックがMIPモードで予測されたことを示すことができる。
【0136】
intra_mip_flag[x0][y0]が第2値(例えば、1)を持つ場合、ビットストリームからMIPモードに対する情報がさらに取得できる。例えば、現在ブロックのMIPモードを示す情報であるintra_mip_mpm_flag[x0][y0]、intra_mip_mpm_idx[x0][y0]及びintra_mip_mpm_remainder[x0][y0]シンタックス要素がビットストリームからさらに取得できる。現在ブロックにMIP予測モードが適用される場合、MIPのためのMPMリストが構成でき、前記intra_mip_mpm_flagは、前記現在ブロックに対するMIPモードが前記MIPのためのMPMリスト内(又はMPM候補の中)に存在するか否かを示すことができる。前記intra_mip_mpm_idxは、前記現在ブロックに対するMIP予測モードが前記MIPのためのMPMリスト内に存在する場合(すなわち、intra_mip_mpm_flagの値が1である場合)、前記MPMリスト内の候補のうち、前記現在ブロックのMIP予測モードとして使用される候補のインデックスを指示することができる。intra_mip_mpm_remainderは、前記現在ブロックに対するMIP予測モードが前記MIPのためのMPMリスト内に存在しない場合(すなわち、intra_mip_mpm_flagの値が0である場合)、前記現在ブロックのMIP予測モードを示すことができ、全体MIP予測モードのうちのいずれか一つを示すか、全体MIP予測モードのうちで前記MIPのためのMPMリスト内の候補モードを除いた残りのモードのうちのいずれか一つのモードを前記現在ブロックのMIP予測モードとして指示することができる。
【0137】
一方、intra_mip_flag[x0][y0]が第1値(例えば、0)を持つ場合、ビットストリームからMIPに対する情報が取得されず、ビットストリームからMIP以外のイントラ予測情報が取得されることができる。一実施例において、一般イントラ予測のためのMPMリストが生成されるか否かを示すintra_luma_mpm_flag[x0][y0]がビットストリームから取得されることができる。
【0138】
現在ブロックにイントラ予測モードが適用される場合、そのためのMPMリストが構成でき、intra_luma_mpm_flagは、現在ブロックに対するイントラ予測モードが前記MPMリスト内に存在するか(又はMPM候補中に存在するか)否かを示すことができる。例えば、intra_luma_mpm_flagの第1値(例えば、0)は、現在ブロックに対するイントラ予測モードが前記MPMリスト内に存在しないことを示すことができる。intra_luma_mpm_flagの第2値(例えば、1)は、現在ブロックに対するイントラ予測モードが前記MPMリスト内に存在することを示すことができる。intra_luma_mpm_flag値が1である場合、前記intra_luma_not_planar_flagがビットストリームから取得できる。
【0139】
intra_luma_not_planar_flagは、前記現在ブロックのイントラ予測モードがplanarモードであるか否かを示すことができる。例えば、intra_luma_not_planar_flagの第1値(例えば、0)は、現在ブロックのイントラ予測モードがPlanarーモードであることを示すことができる。intra_luma_not_planar_flagの第2値(例えば、1)は、現在ブロックのイントラ予測モードがplanarモードではないことを示すことができる。
【0140】
intra_luma_mpm_idxは、前記intra_luma_not_planar_flagが「true」(すなわち、値1)である場合、パーシング及びコーディングされることができる。一実施例において、MPMリスト内には、Planarモードが常に候補として入ることができ、ただし、上述のようにintra_luma_not_planar_flagを先にシグナリングすることにより、MPMリストからPlanarモードを除外することができ、この場合、上述した様々なイントラ予測タイプ(一般イントラ予測、MRL、ISP、LIPなど)で単一化されたMPMリストを構成することができる。この場合、MPMリスト内の候補の数は5個に減少することができる。intra_luma_mpm_idxは、前記Planarモードが除外されたMPMリストに含まれている候補のうち、前記現在ブロックのイントラ予測モードとして使用される候補を指示することができる。
【0141】
一方、intra_luma_mpm_flagの値が0である場合、前記intra_luma_mpm_remainderがパーシング/コーディングされることができる。intra_luma_mpm_remainderは、全体イントラ予測モードのうちのいずれか一つのモードを前記現在ブロックのイントラ予測モードとして指示するか、或いは前記MPMリスト内の候補モードを除いた残りのモードのうちのいずれか一つのモードを前記現在ブロックのイントラ予測モードとして指示することができる。
【0142】
パレットモードの概要
【0143】
以下、パレットモード(Pallette mode、PLTモード)について説明する。一実施例による符号化装置は、パレットモードを用いて画像を符号化することができ、復号化装置は、これに対応する方法でパレットモードを用いて画像を復号化することができる。パレットモードは、パレット符号化モード、イントラパレットモード、イントラパレット符号化モードなどと呼ばれることができる。パレットモードは、イントラ符号化モードの一類型として見なすことができ、イントラ予測方法のうちのいずれか一つとして見なすこともできる。ただし、前述したスキップモードと同様に、当該ブロックに対する別途のレジデュアル値はシグナリングされないことができる。
【0144】
一実施例において、パレットモードは、相当量のテキストとグラフィックを含むコンピュータで生成された画像であるスクリーンコンテンツを符号化するにあたり、符号化効率を向上させるために使用できる。一般に、スクリーンコンテンツで生成された画像のローカル領域はシャープエッジで分離され、少ない数の色で表現される。このような特性を活用するために、パレットモードは、パレットテーブルのカラーエントリを指示するインデックスで一つのブロックに対するサンプルを表現することができる。
【0145】
パレットモードを適用するために、パレットテーブルに対する情報がシグナリングされることができる。一実施例において、パレットテーブルは、それぞれのカラーに対応するインデックス値を含むことができる。インデックス値をシグナリングするために、パレットインデックス予測情報がシグナリングされることができる。パレットインデックス予測情報は、パレットインデックスマップの少なくとも一部分のためのインデックス値を含むことができる。パレットインデックスマップは、ビデオデータのピクセルをパレットテーブルのカラーインデックスにマッピングすることができる。
【0146】
パレットインデックス予測情報は、run値情報を含むことができる。パレットインデックスマップのうちの少なくとも一部分に対して、run値情報は、run値をインデックス値に関連付ける情報であり得る。一つのrun値はエスケープカラーインデックスに関連付けられることができる。パレットインデックスマップは、パレットインデックス予測情報から生成できる。例えば、最後のインデックス値に基づいてパレットインデックス予測情報のインデックス値を調整するか否かを決定することにより、パレットインデックスマップのうちの少なくとも一部が生成されることができる。
【0147】
現在ピクチャにおける現在ブロックは、パレットインデックスマップに応じて符号化又は復元されることができる。パレットモードが適用される場合、現在符号化単位でのピクセル値は、代表カラー値の小さなセットで表現できる。このようなセットがパレットと命名できる。パレットカラーに近い値を持つピクセルに対して、パレットインデックスがシグナリングされることができる。パレットに属していない(外れた)値を持つピクセルに対して、当該ピクセルはエスケープ(escape)シンボルで表記され、量子化されたピクセル値が直接シグナリングされることができる。本明細書において、ピクセル又はピクセル値はサンプルで説明できる。
【0148】
パレットモードで符号化されたブロックを復号化するために、復号化装置は、パレットカラーとインデックスを復号化することができる。パレットカラーは、パレットテーブルとして記述でき、パレットテーブルコーディングツールを用いて符号化されていることができる。エスケープフラグがそれぞれの符号化単位に対してシグナリングされることができる。エスケープフラグは、現在符号化単位にエスケープシンボルが存在するか否かを示すことができる。もしエスケープシンボルが存在する場合、パレットテーブルが1単位(例えば、インデックス単位)増加し、最後のインデックスはエスケープモードと指定できる。一つの符号化単位に対する全てのピクセルのパレットインデックスは、パレットインデックスマップを構成することができ、パレットインデックスマップコーディングツールを用いて符号化できる。
【0149】
例えば、パレットテーブルを符号化するために、パレット予測子が維持できる。パレット予測子は、それぞれのスライス開始点で初期化できる。例えば、パレット予測子は0にリセットされることができる。パレット予測子のそれぞれのエントリに対して、現在パレットの部分であるか否かを示す再使用フラグがシグナリングされることができる。再使用フラグは、0値のランレングスコーディング(run-length coding)を用いてシグナリングされることができる。
【0150】
その後、新しいパレットエントリのための数字が0次指数ゴロムコードを用いてシグナリングされることができる。最終的に、新しいパレットエントリのためのコンポーネント値がシグナリングされることができる。現在符号化単位を符号化した後、パレット予測子が現在パレットを用いて更新でき、現在パレットで再使用されていない以前パレット予測子からのエントリが(許容された最大サイズに達するまで)新しいパレット予測子の最後に付加でき、これをパレットスタッフィング(palette stuffing)と呼ぶことができる。
【0151】
例えば、パレットインデックスマップを符号化するために、水平又は垂直スキャンを用いてインデックスが符号化できる。スキャン順序は、スキャン方向を示すパラメータpalette_transpose_flagを用いてビットストリームを介してシグナリングされることができる。例えば、現在符号化単位でのサンプルのためのインデックスをスキャンするために水平スキャンが適用される場合、palette_transpose_flagは第1値(例えば、0)を持つことができ、垂直スキャンが適用される場合、palette_transpose_flagは第2値(例えば、1)を持つことができる。
図18は一実施例による水平スキャン及び垂直スキャンの実施例を示す。
【0152】
また、一実施例において、パレットインデックスは、「INDEX」モード及び「COPY_ABOVE」モードを用いて符号化できる。水平スキャンが使用される場合、最上側行に対してパレットインデックスのモードがシグナリングされる場合、垂直スキャンが使用される場合において最左側列に対してパレットインデックスのモードがシグナリングされる場合、そして直前のモードが「COPY_ABOVE」である場合を除き、前記2つのモードは1つのフラグを用いてシグナリングされることができる。
【0153】
「INDEX」モードにおいて、パレットインデックスは明示的にシグナリングされることができる。「INDEX」モードと「COPY_ABOVE」モードに対して、同一のモードを用いて、符号化されたピクセルの数を示すrun値がシグナリングされることができる。
【0154】
インデックスマップのための符号化順序は、次のように設定されることができる。まず、符号化単位に対するインデックス値の数がシグナリングされることができる。これは、切り捨てられたバイナリコーディング(truncated binary coding)を使用する全体符号化単位に対する実際インデックス値のシグナリング以後に行われることができる。インデックスの数とインデックス値の両方がバイパスモードで符号化されることができる。これにより、インデックスに関連付けられたバイパスビンをグループ化することができる。その後、パレットモード(INDEX又はCOPY_ABOVE)及びrun値がインターリーブ方法でシグナリングされることができる。
【0155】
最後に、全体符号化単位に対するエスケープサンプルに対応するコンポーネントエスケープ値が互いにグループ化されることができ、バイパスモードで符号化されることができる。付加的なシンテックス要素であるlast_run_type_flagがインデックス値をシグナリングした後にシグナリングできる。インデックスの数と一緒にlast_run_type_flagを用いることにより、ブロックでの最後のrunに対応するrun値のシグナリングを省略することができる。
【0156】
一実施例において、ルマ成分とクロマ成分に対して独立的な符号化単位パーティショニングを行うデュアルツリータイプをIスライスに対して使用することができる。パレットモードは、ルマ成分及びクロマ成分にそれぞれ又は一緒に適用されることができる。デュアルツリーが適用されなければ、Y、Cb及びCr成分の全てにパレットモードが適用できる。
【0157】
IBC(Intra Block Copy)モードの概要
【0158】
IBC予測は、画像符号化装置/画像復号化装置の予測部で行われることができる。IBC予測は、簡単に「IBC」と呼ばれることができる。前記IBCは、例えばSCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。前記IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出するという点で、インター予測と同様に行われることができる。つまり、IBCは、本開示で説明されたインター予測技法のうちの少なくとも一つを用いることができる。例えば、IBCでは、前述した動き情報(動きベクトル)導出方法のうちの少なくとも一つを用いることができる。前記インター予測技法のうちの少なくとも一つは、前記IBC予測を考慮して一部修正されて用いられることもできる。前記IBCは、現在ピクチャを参照することができる。よって、CPR(current picture referencing)とも呼ばれることができる。
【0159】
IBCのために、画像符号化装置は、ブロックマッチングBMを行って現在ブロック(例えば、CU)に対する最適のブロックベクトル(又は動きベクトル)を導出することができる。前記導出されたブロックベクトル(又は動きベクトル)は、前述したインター予測での動き情報(動きベクトル)シグナリングと同様の方法を用いて、ビットストリームを介して画像復号化装置にシグナリングされることができる。画像復号化装置は、前記シグナリングされたブロックベクトル(動きベクトル)を介して、現在ピクチャ内で前記現在ブロックに対する参照ブロックを導出することができ、これにより前記現在ブロックに対する予測信号(予測されたブロック又は予測サンプル)を導出することができる。ここで、前記ブロックベクトル(又は動きベクトル)は、現在ブロックから現在ピクチャ内の既に復元された領域に位置する参照ブロックまでの変位(displacement)を示すことができる。よって、前記ブロックベクトル(又は動きベクトル)は、変位ベクトルと呼ばれることもできる。以下、IBCにおける前記動きベクトルは、前記ブロックベクトル又は前記変位ベクトルに対応することができる。現在ブロックの動きベクトルは、ルマ成分に対する動きベクトル(ルマ動きベクトル)又はクロマ成分に対する動きベクトル(クロマ動きベクトル)を含むことができる。例えば、IBCコーディングされたCUに対するルマ動きベクトルも、整数サンプル単位(すなわち、integer precision)であることができる。クロマ動きベクトルも、整数サンプル単位でクリッピング(clipped)できる。前述したように、IBCは、インター予測技法のうちの少なくとも一つを用いることができ、例えば、ルマ動きベクトルは、前述したマージモード又はMVPモードを用いて符号化/復号化されることができる。
【0160】
ルマIBCブロックに対してマージモードが適用される場合、ルマIBCブロックに対するマージ候補リストは、インターモードでのマージ候補リストと同様に構成されることができる。ただし、ルマIBCブロックの場合、マージ候補として、時間周辺ブロックは利用されなくてもよい。
【0161】
ルマIBCブロックに対してMVPモードが適用される場合、ルマIBCブロックに対するmvp候補リストは、インターモードでのmvp候補リストと同様に構成されることができる。ただし、ルマIBCブロックの場合、mvp候補として時間候補ブロックは利用されなくてもよい。
【0162】
IBCは、現在ピクチャ内の既に復元された領域から参照ブロックを導出する。このとき、メモリの消費と画像復号化装置の複雑度を減少させるために、現在ピクチャ内の既に復元された領域のうち、既に定義された領域(predefined area)のみが参照できる。前記既に定義された領域は、現在ブロックが含まれている現在CTUを含むことができる。このように、参照可能な復元領域を既に定義された領域に制限することにより、IBCモードは、ローカルオンチップメモリ(local on-chip memory)を用いてハードウェア的に実現できる。
【0163】
IBCを実行する画像符号化装置は、前記既に定義された領域を探索して、最も小さいRDコストを持つ参照ブロックを決定し、参照ブロックと現在ブロックの位置に基づいて動きベクトル(ブロックベクトル)を導出することができる。
【0164】
現在ブロックに対してIBCを適用するか否かは、CUレベルで、IBC実行情報としてシグナリングされることができる。現在ブロックの動きベクトルのシグナリング方法(IBC MVPモード又はIBCスキップ/マージモード)に関する情報がシグナリングされることができる。IBC実行情報は、現在ブロックの予測モードを決定するのに使用できる。よって、IBC実行情報は、現在ブロックの予測モードに関する情報に含まれることができる。
【0165】
IBCスキップ/マージモードの場合、マージ候補インデックスがシグナリングされてマージ候補リストに含まれているブロックベクトルのうち、現在ルマブロックの予測に使用されるブロックベクトルを指示するために使用できる。このとき、マージ候補リストは、IBCで符号化された周辺ブロックを含むことができる。マージ候補リストは、空間マージ候補を含むことができ、時間マージ候補は含まないように構成できる。また、マージ候補リストは、さらにHMVP(Histrory-based motion vector predictor)候補及び/又はペアワイズ(pairwise)候補を含むことができる。
【0166】
IBC MVPモードの場合、ブロックベクトル差分値が前述のインターモードの動きベクトル差分値と同様の方法で符号化できる。ブロックベクトル予測方法は、インターモードのMVPモードと同様に、2つの候補を予測子として含むmvp候補リストを構成して用いることができる。前記2つの候補のうちのいずれか一つは、左側周辺ブロックから誘導され、残りの一つは、上側周辺ブロックから誘導されることができる。このとき、左側又は上側周辺ブロックがIBCで符号化された場合にのみ、当該周辺ブロックから候補を誘導することができる。もし左側又は上側周辺ブロックが利用可能でない場合、例えば、IBCで符号化されていない場合、デフォルトブロックベクトルが予測子としてmvp候補リストに含まれることができる。また、2つのブロックベクトル予測子のうちのいずれか一つを指示するための情報(例えば、フラグ)が候補選択情報としてシグナリングされ、利用されるのは、インターモードのMVPモードと同様である。前記mvp候補リストは、デフォルトブロックベクトルとしてHMVP候補及び/又はゼロ動きベクトルを含むことができる。
【0167】
前記HMVP候補は、ヒストリベースのMVP候補と呼ばれることもあり、現在ブロックの符号化/復号化の以前に使用されたMVP候補、マージ候補又はブロックベクトル候補は、HMVP候補としてHMVPリストに保存されることができる。以後、現在ブロックのマージ候補リスト又はmvp候補リストが最大個数の候補を含まない場合、HMVPリストに保存された候補がHMVP候補として現在ブロックのマージ候補リスト又はmvp候補リストに追加されることができる。
【0168】
前記ペアワイズ(pairwise)候補は、現在ブロックのマージ候補リストに既に含まれている候補の中から、予め決められた順序に従って2つの候補を選択し、選択された2つの候補を平均することにより誘導される候補を意味する。
【0169】
クロマブロックに対するイントラ予測
【0170】
現在ブロックにイントラ予測が行われる場合、現在ブロックのルマ成分ブロック(ルマブロック)に対する予測及びクロマ成分ブロック(クロマブロック)に対する予測が行われることができ、この場合、クロマブロックに対するイントラ予測モードは、ルマブロックに対するイントラ予測モードとは個別に設定されることができる。
【0171】
クロマブロックに対するイントラ予測モードは、クロマブロックに対応するルマブロックのイントラ予測モードに基づいて決定されることができる。
図19は一実施例によるクロマブロックのイントラ予測モード決定方法を示す図である。
【0172】
図19を参照して、一実施例による符号化/復号化装置がクロマブロックのイントラ予測モードを決定する方法について説明する。以下、復号化装置について説明し、その説明は符号化装置にそのまま適用できる。
【0173】
以下の説明に従って、クロマブロックに対するイントラ予測モードIntraPredModeC[xCb][yCb]が誘導でき、本過程で下記のパラメータが使用できる。
【0174】
-現在ピクチャの左上側ルマサンプルの位置に対する現在クロマブロックの左上側サンプルの相対位置を示すルマサンプル座標(xCb,yCb)
【0175】
-ルマサンプル単位での現在コーディングブロックの幅を示すcbWidth
【0176】
-ルマサンプル単位での現在コーディングブロックの高さを示すcbHeight
【0177】
また、以下の説明は、現在クロマブロックを含む現在スライスがIスライスであり、ルマクロマデュアルツリー分割構造が適用される場合に使用できる。しかし、以下の説明は上記の例示に限定されない。例えば、現在スライスがIスライスであるか否かに拘らず、下記の説明が適用でき、さらには、デュアルツリー分割構造でない場合にも共通に下記の説明が適用できる。
【0178】
まず、復号化装置は、現在クロマブロックに対応するルマブロックの予測モードに基づいてルマイントラ予測モード情報(例えば、lumaIntraPredMode)を決定することができる(S1910)。本ステップについての詳細な説明は後述する。
【0179】
次に、復号化装置は、ルマイントラ予測モード情報と付加情報に基づいてクロマイントラ予測モード情報を決定することができる(S1920)。一実施例において、復号化装置は、ビットストリームから取得されたCCLM予測モードが適用されるか否かを示すcclm_mode_flagパラメータ、CCLM予測モードが適用される場合に適用されるCCLMモードタイプを示すcclm_mode_idxパラメータ、クロマサンプルに適用されるイントラ予測モード類型を示すintra_chroma_pred_modeパラメータ、及びルマイントラ予測モード情報(例えば、lumaIntraPredMode)と
図20の表に基づいてクロマイントラ予測モードを決定することができる。
【0180】
一例として、前記intra_chroma_pred_modeは、Planarモード、DCモード、垂直(vertical)モード、水平(horizontal)モード、DM(Derived Mode)、CCLM(Cross-component linear model)モードのうちのいずれか一つを指すことができる。ここで、前記Planarモードは0番イントラ予測モード、前記DCモードは1番イントラ予測モード、前記垂直モードは26番イントラ予測モード、前記水平モードは10番イントラ予測モードをそれぞれ示すことができる。DMはdirect modeと呼ばれることもある。CCLMはLM(linear model)と呼ばれることもある。CCLMモードはL_CCLM、T_CCLM、LT_CCLMのうちのいずれか一つを含むことができる。
【0181】
一方、DMとCCLMは、ルマブロックの情報を用いてクロマブロックを予測する従属的なイントラ予測モードである。DMは、現在クロマブロックに対応するルマブロックのイントラ予測モードと同一のイントラ予測モードが、前記クロマブロックに対するイントラ予測モードとして適用されるモードを示すことができる。DMモードでは、ルマイントラ予測モード情報が示すイントラ予測モードに、現在クロマブロックのイントラ予測モードが決定されることができる。
【0182】
また、前記CCLMは、クロマブロックに対する予測ブロックを生成する過程でルマブロックの復元されたサンプルをサブサンプリングした後、サブサンプリングされたサンプルにCCLMパラメータα及びβを適用して導出されたサンプルを前記クロマブロックの予測サンプルとして使用するイントラ予測モードを示すことができる。
【0183】
次に、復号化装置は、クロマフォーマットに基づいてクロマイントラ予測モードをマッピングすることができる(S1930)。一実施例による復号化装置は、クロマフォーマットが4:2:2である場合に限って(例えば、chroma_format_idcの値が2である場合)、
図20の表に従って決定されたクロマイントラ予測モードXを
図21の表に基づいて新しいクロマイントラ予測モードYにマッピングすることができる。例えば、
図20の表に従って決定されたクロマイントラ予測モードの値が16であれば、これは
図21のマッピング表に従ってクロマイントラ予測モード14にマッピングされることができる。
【0184】
ルマイントラ予測モード情報の決定
【0185】
以下、ルマイントラ予測モード情報(例えば、lumaIntraPredMode)を決定するステップS1910についてより詳細に説明する。
図22は復号化装置がルマイントラ予測モード情報を決定する方法を説明するフローチャートである。
【0186】
まず、復号化装置は、現在クロマブロックに対応するルマブロックにMIPモードが適用されるか否かを識別することができる(S2210)。現在クロマブロックに対応するルマブロックにMIPモードが適用される場合、復号化装置は、ルマイントラ予測モード情報の値をINTRA_PLANARモードに設定することができる(S2220)。
【0187】
一方、現在クロマブロックに対応するルマブロックにMIPモードが適用されない場合、復号化装置は、現在クロマブロックに対応するルマブロックにIBCモード又はPLTモードが適用されか否かを識別することができる(S2230)。
【0188】
現在クロマブロックに対応するルマブロックにIBCモード又はPLTモードが適用される場合、復号化装置は、ルマイントラ予測モード情報の値をINTRA_DCモードに設定することができる(S2240)。
【0189】
一方、現在クロマブロックに対応するルマブロックにIBCモード又はPLTモードが適用されない場合、復号化装置は、ルマイントラ予測モード情報の値を現在クロマブロックに対応するルマブロックのイントラ予測モードに設定することができる(S2250)。
【0190】
図22のようなルマイントラ予測モード情報の決定プロセスで、現在クロマブロックに対応するルマブロックを特定するために様々な方法が適用できる。前述したように、現在クロマサンプルの左上側サンプル位置は、現在ピクチャの左上側ルマサンプルの位置から離隔したルマサンプルの相対座標で表現できる。以下、このような背景下で、クロマブロックに対応するルマブロックを特定する方法について説明する。
【0191】
図23は現在クロマブロックに対応するルマブロックの予測モードを識別するために、ルマサンプル位置を参照する第1実施例を示す図である。以下、S2310乃至S2350ステップは、前述した
図22のS2210乃至S2250ステップに対応するので、相違点だけを説明する。
【0192】
図23の第1実施例において、現在クロマブロックの左上側サンプル位置に対応する第1ルマサンプル位置と、現在クロマブロックの左上側サンプル位置及び現在ルマブロックの幅と高さに基づいて決定される第2ルマサンプル位置と、が参照される。ここで、第1ルマサンプル位置は(xCb,yCb)であり得る。そして、第2ルマサンプル位置は(xCb+cbWidth/2,yCb+cbHeight/2)であり得る。
【0193】
より詳細に、S2310ステップで、現在クロマブロックに対応するルマブロックにMIPモードが適用されたかを識別するために、第1ルマサンプル位置が識別できる。より詳しくは、第1ルマサンプル位置で識別されるMIPモードの適用有無を示すパラメータintra_mip_flag[xCb][yCb]の値が1であるか否かが識別できる。intra_mip_flag[xCb][yCb]の第1値(例えば、1)は、[xCb][yCb]サンプル位置でMIPモードが適用されることを示すことができる。
【0194】
また、S2330ステップで、現在クロマブロックに対応するルマブロックにIBC又はパレットモードが適用されたかを識別するために、第1ルマサンプル位置が識別できる。より詳しくは、第1ルマサンプル位置で識別されるルマブロックの予測モードパラメータCuPredMode[0][xCb][yCb]の値がIBCモードを示す値(例えば、MODE_IBC)又はパレットモードを示す値(例えば、MODE_PLT)であるか否かが識別できる。
【0195】
また、S2350ステップで、ルマイントラ予測モード情報を現在クロマブロックに対応するルマブロックのイントラ予測モード情報に設定するために、第2ルマサンプル位置が識別できる。より詳しくは、第2ルマサンプル位置で識別されるルマイントラ予測モードを示すパラメータIntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]の値が識別できる。
【0196】
しかし、このような第1実施例の場合、現在クロマブロックのイントラ予測モードを決定するために、第1ルマサンプル位置と第2ルマサンプル位置の両方を考慮する。これにより、1つのルマサンプル位置のみを考慮すると、2つのサンプル位置を考慮する場合より符号化及び復号化複雑度を低減することができる。
【0197】
以下、1つのルマサンプル位置のみを考慮する第2実施例及び第3実施例について説明する。
図24及び
図25は、現在クロマブロックに対応するルマブロックの予測モードを識別するために、ルマサンプル位置を参照する第2実施例及び第3実施例を示す図である。以下、S2410乃至S2450ステップとS2510乃至S2550ステップは、前述した
図22のS2210乃至S2250ステップに対応するので、相違点だけを説明する。
【0198】
図24の第2実施例では、現在クロマブロックの左上側サンプル位置及び現在ルマブロックの幅と高さに基づいて決定される第2ルマサンプル位置が参照できる。ここで、第2ルマサンプル位置は、(xCb+cbWidth/2,yCb+cbHeight/2)であり得る。これにより、第2実施例では、現在クロマブロックに対応するルマブロックの中心位置(xCb+cbWidth/2,yCb+cbHeight/2)に対応するルマサンプルの予測値を識別することができる。一実施例において、ルマブロックが偶数個の列と行を持つ場合、中心位置はルマブロックの中央の4サンプルのうちの右下側サンプルの位置を示すことができる。
【0199】
より詳細に、S2410ステップで、現在クロマブロックに対応するルマブロックにMIPモードが適用されたかを識別するために、第2ルマサンプル位置が識別できる。より詳しくは、第2ルマサンプル位置で識別されるMIPモードの適用有無を示すパラメータintra_mip_flag[xCb+cbWidth/2][yCb+cbHeight/2]の値が1であるか否かが識別できる。
【0200】
また、S2430ステップで、現在クロマブロックに対応するルマブロックにIBC又はパレットモードが適用されたかを識別するために、第2ルマサンプル位置が識別できる。より詳しくは、第2ルマサンプル位置で識別されるルマブロックの予測モードパラメータCuPredMode[0][xCb+cbWidth/2][yCb+cbHeight/2]の値がIBCモードを示す値(例えば、MODE_IBC)又はパレットモードを示す値(例えば、MODE_PLT)であるか否かが識別できる。
【0201】
また、S2450ステップで、ルマイントラ予測モード情報を現在クロマブロックに対応するルマブロックのイントラモード情報に設定するために、第2ルマサンプル位置が識別できる。より詳しくは、第2ルマサンプル位置で識別されるルマイントラ予測モードを示すパラメータIntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]の値が識別できる。
【0202】
図25の第3実施例において、現在クロマブロックの左上側サンプル位置に対応する第1ルマサンプル位置が参照できる。ここで、第1ルマサンプル位置は(xCb,yCb)であり得る。これにより、第3実施例では、現在クロマブロックに対応するルマブロックの左上側サンプル位置(xCb,yCb)に対応するルマサンプルの予測値を識別することができる。一実施例において、ルマブロックが偶数個の列と行を持つ場合、
【0203】
より詳しくは、S2510ステップで、現在クロマブロックに対応するルマブロックにMIPモードが適用されたかを識別するために、第1ルマサンプル位置が識別できる。より詳細には、第1ルマサンプル位置で識別されるMIPモードの適用有無を示すパラメータintra_mip_flag[xCb][yCb]の値が1であるか否かが識別できる。
【0204】
また、S2530ステップで、現在クロマブロックに対応するルマブロックにIBC又はパレットモードが適用されたかを識別するために、第1ルマサンプル位置が識別できる。より詳しくは、第1ルマサンプル位置で識別されるルマブロックの予測モードパラメータCuPredMode[0][xCb][yCb]の値がIBCモードを示す値(例えば、MODE_IBC)又はパレットモードを示す値(例えば、MODE_PLT)であるか否かが識別できる。
【0205】
また、S2550ステップで、ルマイントラ予測モード情報を現在クロマブロックに対応するルマブロックのイントラ予測モード情報に設定するために、第1ルマサンプル位置が識別できる。より詳しくは、第1ルマサンプル位置で識別されるルマイントラ予測モードを示すパラメータIntraPredModeY[xCb][yCb]の値が識別できる。
【0206】
符号化及び復号化方法
【0207】
以下、前述した方法を用いて一実施例による符号化装置が符号化を行う方法と、復号化装置が復号化を行う方法について、
図26を参照して説明する。一実施例による符号化装置は、メモリと少なくとも一つのプロセッサとを含み、前記少なくとも一つのプロセッサによって以下の方法が行われることができる。また、一実施例による復号化装置は、メモリと少なくとも一つのプロセッサとを含み、前記少なくとも一つのプロセッサによって以下の方法が行われることができる。説明の便宜のために、以下では、復号化装置の動作を説明するが、以下の説明は、符号化装置においても同様に行われることができる。
【0208】
まず、復号化装置は、画像を分割して現在クロマブロックを識別することができる(S2610)。次に、復号化装置は、前記現在クロマブロックと対応する第1ルマサンプル位置に行列ベースのイントラ予測モードが適用されるか否かを識別することができる(S2620)。ここで、前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの幅と高さのうちの少なくとも一つに基づいて決定されることができる。例えば、前記第1ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいて決定されることができる。
【0209】
次に、復号化装置は、前記行列ベースのイントラ予測モードが適用されなければ、前記現在クロマブロックと対応する第2ルマサンプル位置に所定の予測モードが適用されるか否かを識別することができる(S2630)。ここで、第2ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの幅と高さのうちの少なくとも一つに基づいて決定されることができる。例えば、前記第2ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいて決定されることができる。
【0210】
次に、復号化装置は、前記所定の予測モードが適用されなければ、前記現在クロマブロックのイントラ予測モード候補を、前記現在クロマブロックと対応する第3ルマサンプル位置に適用されるイントラ予測モードに基づいて決定することができる(S2640)。ここで、前記所定の予測モードは、IBC(Intra Block Copy)モード又はパレットモードであり得る。
【0211】
一方、前記第1ルマサンプル位置は、前記第3ルマサンプル位置と同一の位置であり得る。又は、前記第2ルマサンプル位置は、前記第3ルマサンプル位置と同一の位置であり得る。又は、前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、互いに同一の位置であり得る。
【0212】
又は、前記第1ルマサンプル位置は、前記現在クロマブロックに対応する前記ルマブロックの中心位置であり得る。例えば、前記第1ルマサンプル位置のx成分位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプルのx成分位置に前記ルマブロックの幅の半分を加えることにより決定され、前記第1ルマサンプル位置のy成分位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプルのy成分位置に前記ルマブロックの高さの半分を加えることにより決定されることができる。
【0213】
又は、前記第1ルマサンプル位置、前記第2ルマサンプル位置及び前記第3ルマサンプル位置は、前記現在クロマブロックに対応するルマブロックの左上側サンプル位置、前記ルマブロックの幅及び前記ルマブロックの高さに基づいてそれぞれ決定されることができる。
【0214】
応用実施例
【0215】
本開示の例示的な方法は、説明の明確性のために動作のシリーズで表現されているが、これは、ステップが行われる順序を制限するためのものではなく、必要な場合には、それぞれのステップが同時に又は異なる順序で行われることもできる。本開示による方法を実現するために、例示するステップにさらに他のステップを含むか、一部のステップを除いて残りのステップを含むか、又は一部のステップを除いて追加の他のステップを含むこともできる。
【0216】
本開示において、所定の動作(ステップ)を行う画像符号化装置又は画像復号化装置は、当該動作(ステップ)の実行条件や状況を確認する動作(ステップ)を行うことができる。例えば、所定の条件が満足される場合、所定の動作を行うと記載された場合、画像符号化装置又は画像復号化装置は、前記所定の条件が満足されるか否かを確認する動作を行った後、前記所定の動作を行うことができる。
【0217】
本開示の様々な実施例は、すべての可能な組み合わせを羅列したものではなく、本開示の代表的な態様を説明するためのものであり、様々な実施例で説明する事項は、独立して適用されてもよく、2つ以上の組み合わせで適用されてもよい。
【0218】
また、本開示の様々な実施例は、ハードウェア、ファームウェア(firmware)、ソフトウェア、又はそれらの組み合わせなどによって実現できる。ハードウェアによる実現の場合、1つ又はそれ以上のASICs(Application Specific Integrated Circuits)、DSPs(Digital Signal Processors)、DSPDs(Digital Signal Processing Devices)、PLDs(Programmable Logic Devices)、FPGAs(Field Programmable Gate Arrays)、汎用プロセッサ(general processor)、コントローラ、マイクロコントローラ、マイクロプロセッサなどによって実現できる。
【0219】
また、本開示の実施例が適用された画像復号化装置及び画像符号化装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ会話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、画像電話ビデオ装置、及び医療用ビデオ装置などに含まれることができ、ビデオ信号又はデータ信号を処理するために使用できる。例えば、OTTビデオ(Over the top video)装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)などを含むことができる。
【0220】
図27は本開示の実施例が適用できるコンテンツストリーミングシステムを例示する図である。
【0221】
図27に示されているように、本開示の実施例が適用されたコンテンツストリーミングシステムは、大きく、符号化サーバ、ストリーミングサーバ、Webサーバ、メディアストレージ、ユーザ装置及びマルチメディア入力装置を含むことができる。
【0222】
前記符号化サーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに伝送する役割を果たす。他の例として、スマートフォン、カメラ、ビデオカメラなどのマルチメディア入力装置がビットストリームを直接生成する場合、前記符号化サーバは省略できる。
【0223】
前記ビットストリームは、本開示の実施例が適用された画像符号化方法及び/又は画像符号化装置によって生成でき、前記ストリーミングサーバは、前記ビットストリームを伝送又は受信する過程で一時的に前記ビットストリームを保存することができる。
【0224】
前記ストリーミングサーバは、Webサーバを介してユーザの要求に基づいてマルチメディアデータをユーザ装置に伝送し、前記Webサーバは、ユーザにどんなサービスがあるかを知らせる媒介体の役割を果たすことができる。ユーザが前記Webサーバに所望のサービスを要求すると、前記Webサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを伝送することができる。この時、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割を果たすことができる。
【0225】
前記ストリーミングサーバは、メディアストレージ及び/又は符号化サーバからコンテンツを受信することができる。例えば、前記符号化サーバからコンテンツを受信する場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間保存することができる。
【0226】
前記ユーザ装置の例としては、携帯電話、スマートフォン(smart phone)、ノートパソコン(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device)、例えば、スマートウォッチ(smartwatch)、スマートグラス(smart glass)、HMD(head mounted display)、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどがあり得る。
【0227】
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバから受信するデータは、分散処理されることができる。
【0228】
本開示の範囲は、様々な実施例の方法による動作が装置又はコンピュータ上で実行されるようにするソフトウェア又はマシン-実行可能なコマンド(例えば、オペレーティングシステム、アプリケーション、ファームウェア(firmware)、プログラムなど)、及びこのようなソフトウェア又はコマンドなどが保存されて装置又はコンピュータ上で実行できる非一時的なコンピュータ可読媒体(non-transitory computer-readable medium)を含む。
【産業上の利用可能性】
【0229】
本開示による実施例は、画像を符号化/復号化するために利用可能である。