(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-10
(54)【発明の名称】レイヤー識別子情報を含むSEIメッセージに基づく画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
(51)【国際特許分類】
H04N 19/70 20140101AFI20240403BHJP
H04N 19/30 20140101ALI20240403BHJP
【FI】
H04N19/70
H04N19/30
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023565261
(86)(22)【出願日】2022-04-22
(85)【翻訳文提出日】2023-11-15
(86)【国際出願番号】 KR2022005797
(87)【国際公開番号】W WO2022225369
(87)【国際公開日】2022-10-27
(32)【優先日】2021-04-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100165191
【氏名又は名称】河合 章
(74)【代理人】
【識別番号】100114018
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100159259
【氏名又は名称】竹本 実
(72)【発明者】
【氏名】ヘンドリー ヘンドリー
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA31
5C159RC11
(57)【要約】
画像符号化/復号化方法及び装置が提供される。本開示の一実施例によれば、画像復号化装置によって行われる画像復号化方法は、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームとして受信するステップと、前記受信されたSEIメッセージに基づいて前記一つ以上のレイヤーに対する情報を取得するステップと、前記取得された一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を復元するステップと、を含み、前記受信されたSEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。
【選択図】
図15
【特許請求の範囲】
【請求項1】
画像復号化装置によって行われる画像復号化方法であって、
ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームとして受信するステップと、
前記受信されたSEIメッセージに基づいて前記一つ以上のレイヤーに対する情報を取得するステップと、
前記取得された一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を復元するステップと、を含み、
前記受信されたSEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含む、画像復号化方法。
【請求項2】
前記レイヤー識別子情報は、前記ビットストリーム内の最大レイヤー数だけ取得される、請求項1に記載の画像復号化方法。
【請求項3】
前記ビットストリーム内の最大レイヤー数に関する情報は、前記SEIメッセージから取得される、請求項2に記載の画舫復号化方法。
【請求項4】
前記SEIメッセージは、前記ビットストリームに含まれた一つ以上のレイヤー以外のレイヤーに対する情報を含む、請求項1に記載の画像復号化方法。
【請求項5】
前記ビットストリーム内の最大レイヤー数は、前記ビットストリーム内の一つ以上のレイヤーの数に制限されない、請求項2に記載の画像復号化方法。
【請求項6】
前記ビットストリーム内の最大レイヤー数は、前記ビットストリーム内の一つ以上のレイヤーの数よりも小さい値を有しないように制限される、請求項2に記載の画像復号化方法。
【請求項7】
前記レイヤー識別子情報は、
ビュー識別子(view id)情報或いは補助識別子(auxiliary id)のそれぞれに対してシグナリングされる、請求項1に記載の画像復号化方法。
【請求項8】
前記レイヤー識別子情報は、
i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも大きい値を有するようにレイヤー識別子値の昇順で前記SEIメッセージに含まれる、請求項1に記載の画像復号化方法。
【請求項9】
前記レイヤー識別子情報は、
i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも小さい値を有するようにレイヤー識別子値の降順で前記SEIメッセージに含まれる、請求項1に記載の画像復号化方法。
【請求項10】
画像符号化装置によって行われる画像符号化方法であって、
ビットストリーム内の一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を符号化するステップと、
前記ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージを前記ビットストリームに符号化するステップと、を含み、
前記SEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含む、画像符号化方法。
【請求項11】
前記レイヤー識別子情報は、前記ビットストリーム内の最大レイヤー数だけ前記SEIメッセージに含まれる、請求項10に記載の画像符号化方法。
【請求項12】
前記ビットストリーム内の最大レイヤー数に関する情報は、前記SEIメッセージに含まれる、請求項10に記載の画像符号化方法。
【請求項13】
請求項10に記載の画像符号化装置によって生成されたビットストリームを伝送する方法。
【請求項14】
請求項10に記載の画像符号化方法によって生成されたビットストリームを保存する、非一時的コンピュータ可読記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像符号化/復号化方法及び装置に係り、より詳細には、ビットストリームに含まれた一つ以上のレイヤーに対するレイヤー識別子情報を含むSEI(supplemental enhancement information)メッセージに基づく画像符号化/復号化方法及び装置、並びに本開示の画像符号化方法/装置によって生成されたビットストリームを伝送する方法に関する。
【背景技術】
【0002】
最近、高解像度、高品質の画像、例えばHD(High Definition)画像及びUHD(Ultra High Definition)画像への需要が多様な分野で増加している。画像データが高解像度、高品質になるほど、従来の画像データに比べて、伝送される情報量又はビット量が相対的に増加する。伝送される情報量又はビット量の増加は、伝送費用と保存費用の増加をもたらす。
【0003】
これにより、高解像度、高品質画像の情報を効果的に伝送又は保存し、再生するための高効率の画像圧縮技術が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示は、符号化/復号化効率が向上した画像符号化/復号化方法及び装置を提供することを目的とする。
【0005】
また、本開示は、SEIメッセージのレイヤー識別子情報に基づいて画像復元を行う画像符号化/復号化方法及び装置を提供することを目的とする。
【0006】
また、本開示は、SEIメッセージに基づいて、ビットストリームに含まれた一つ以上のレイヤーに対する情報を取得して画像を符号化/復号化する方法及び装置を提供することを目的とする。
【0007】
また、本開示は、本開示による画像符号化方法又は装置によって生成されたビットストリームを伝送する方法を提供することを目的とする。
【0008】
また、本開示は、本開示による画像符号化方法又は装置によって生成されたビットストリームを保存した記録媒体を提供することを目的とする。
【0009】
また、本開示は、本開示による画像復号化装置によって受信され、復号化されて画像の復元に利用されるビットストリームを保存した記録媒体を提供することを目的とする。
【0010】
本開示で解決しようとする技術的課題は上述した技術的課題に制限されず、上述していない別の技術的課題は以降の記載から本開示の属する技術分野における通常の知識を有する者に明確に理解できるだろう。
【課題を解決するための手段】
【0011】
本開示の一実施例によれば、画像復号化装置によって行われる画像復号化方法は、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームとして受信するステップと、前記受信されたSEIメッセージに基づいて前記一つ以上のレイヤーに対する情報を取得するステップと、前記取得された一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を復元するステップと、を含み、前記受信されたSEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。
【0012】
本開示の一実施例によれば、前記レイヤー識別子情報は、前記ビットストリーム内の最大レイヤー数だけ取得されることができる。
【0013】
本開示の一実施例によれば、前記ビットストリーム内の最大レイヤー数に関する情報は、前記SEIメッセージから取得されることができる。
【0014】
本開示の一実施例によれば、前記SEIメッセージは、前記ビットストリームに含まれた一つ以上のレイヤー以外のレイヤーに対する情報を含むことができる。
【0015】
本開示の一実施例によれば、前記ビットストリーム内の最大レイヤー数は、前記ビットストリーム内の一つ以上のレイヤーの数に制限されないことができる。
【0016】
本開示の一実施例によれば、前記ビットストリーム内の最大レイヤー数は、前記ビットストリーム内の一つ以上のレイヤーの数よりも小さい値を有しないように制限されることができる。
【0017】
本開示の一実施例によれば、前記レイヤー識別子情報は、ビュー識別子(view id)情報又は補助識別子(auxiliary id)のそれぞれに対してシグナリングされることができる。
【0018】
本開示の一実施例によれば、前記レイヤー識別子情報は、i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも大きい値を有するようにレイヤー識別子値の昇順で前記SEIメッセージに含まれることができる。
【0019】
本開示の一実施例によれば、i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも小さい値を有するようにレイヤー識別子値の降順で前記SEIメッセージに含まれることができる。
【0020】
本開示の一実施例によれば、画像符号化装置によって行われる画像符号化方法は、ビットストリーム内の一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を符号化するステップと、前記ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージを前記ビットストリームに符号化するステップと、を含み、前記SEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。
【0021】
本開示の一実施例によれば、前記レイヤー識別子情報は、前記ビットストリーム内の最大レイヤー数だけ前記SEIメッセージに含まれることができる。
【0022】
本開示の一実施例によれば、前記ビットストリーム内の最大レイヤー数に関する情報は、前記SEIメッセージに含まれることができる。
【0023】
本開示の一実施例によれば、画像符号化装置或いは画像符号化方法によって生成されたビットストリームが伝送されることができる。
【0024】
本開示の一実施例によれば、画像符号化方法によって生成されたビットストリームは、コンピュータ可読媒体に保存又は記録されることができる。
【0025】
本開示について簡略に要約して上述した特徴は、後述する本開示の詳細な説明の例示的な態様に過ぎず、本開示の範囲を制限するものではない。
【発明の効果】
【0026】
本開示によれば、符号化/復号化効率が向上した画像符号化/復号化方法及び装置が提供されることができる。
【0027】
本開示によれば、一つ以上のレイヤーに対する情報を含むSEIメッセージに基づく画像符号化/復号化方法及び装置が提供されることができる。
【0028】
本開示によれば、一つ以上のレイヤーに対するレイヤー識別子情報を含む画像を符号化/復号化する方法及び装置が提供されることができる。
【0029】
本開示によれば、本開示による画像符号化方法又は装置によって生成されたビットストリームを伝送する方法が提供されることができる。
【0030】
また、本開示によれば、本開示による画像符号化方法又は装置によって生成されたビットストリームを保存した記録媒体が提供されることができる。
【0031】
また、本開示によれば、本開示による画像復号化装置によって受信され、復号化されて画像の復元に利用されるビットストリームを保存した記録媒体が提供されることができる。
【0032】
本開示で得られる効果は、上述した効果に限定されず、上述していない別の効果は、以降の記載から、本開示の属する技術分野における通常の知識を有する者に明確に理解できるだろう。
【図面の簡単な説明】
【0033】
【
図1】本開示による実施例が適用できるビデオコーディングシステムを概略的に示す図である。
【0034】
【
図2】本開示による実施例が適用できる画像符号化装置を概略的に示す図である。
【0035】
【
図3】本開示による実施例が適用できる画像復号化装置を概略的に示す図である。
【0036】
【0037】
【0038】
【
図6】本開示によるコーディング階層及び構造を概略的に示す図である。
【0039】
【
図7-14】本開示によるVPS内の多重レイヤー情報に関連するシンタックスを説明するための図である。
【0040】
【
図15】本開示の一実施例によるSDI SEIメッセージシンタックスを示す図である。
【0041】
【
図16】本開示の一実施例による画像復号化方法を示す図である。
【0042】
【
図17】本開示の一実施例による画像符号化方法を示す図である。
【0043】
【
図18】本開示の一実施例による画像符号化/復号化装置を示す図である。
【0044】
【
図19】本開示の実施例が適用できるコンテンツストリーミングシステムを例示した図である。
【発明を実施するための形態】
【0045】
本開示の一実施例によれば、画像復号化装置によって行われる画像復号化方法は、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームとして受信するステップと、前記受信されたSEIメッセージに基づいて前記一つ以上のレイヤーに対する情報を取得するステップと、前記取得された一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を復元するステップと、を含み、前記受信されたSEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。
【実施例】
【0046】
以下、添付図面を参照して、本開示の実施例について、本開示の属する技術分野における通常の知識を有する者が容易に実施し得るように詳細に説明する。しかし、本開示は、様々な異なる形態で実現でき、ここで説明する実施例に限定されない。
【0047】
本開示の実施例を説明するにあたり、公知の構成又は機能についての具体的な説明が本開示の要旨を不明確にするおそれがあると判断される場合には、それについての詳細な説明は省略する。そして、図面において、本開示についての説明と関係ない部分は省略し、同様の部分には同様の図面符号を付した。
【0048】
本開示において、ある構成要素が他の構成要素と「連結」、「結合」又は「接続」されているとするとき、これは、直接的な連結関係だけでなく、それらの間に別の構成要素が存在する間接的な連結関係も含むことができる。また、ある構成要素が他の構成要素を「含む」又は「有する」とするとき、これは、特に反対される記載がない限り、別の構成要素を排除するのではなく、別の構成要素をさらに含むことができることを意味する。
【0049】
本開示において、「第1」、「第2」などの用語は、一つの構成要素を他の構成要素から区別する目的のみで使用され、特に言及されない限り、構成要素間の順序又は重要度などを限定しない。したがって、本開示の範囲内において、一実施例の第1構成要素を他の実施例で第2構成要素と呼んでもよく、これと同様に、一実施例の第2構成要素を他の実施例で第1構成要素と呼んでもよい。
【0050】
本開示において、互いに区別される構成要素は、それぞれの特徴を明確に説明するためのものであり、構成要素が必ずしも分離されることを意味するものではない。つまり、複数の構成要素が統合されて一つのハードウェア又はソフトウェア単位で構成されてもよく、一つの構成要素が分散されて複数のハードウェア又はソフトウェア単位で構成されてもよい。よって、別に言及しなくても、このように統合された又は分散された実施例も本開示の範囲に含まれる。
【0051】
本開示において、さまざまな実施例で説明する構成要素が必ず必要不可欠な構成要素を意味するものではなく、一部は選択的な構成要素であり得る。したがって、一実施例で説明する構成要素の部分集合で構成される実施例も本開示の範囲に含まれる。また、様々な実施例で説明する構成要素にさらに他の構成要素を含む実施例も、本開示の範囲に含まれる。
【0052】
本開示は、画像の符号化及び復号化に関するものであって、本開示で使用される用語は、本開示で新たに定義されない限り、本開示の属する技術分野における通常の意味を持つことができる。
【0053】
本開示において、「ピクチャ(picture)」は、一般的に、特定の時間帯のいずれか一つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、ピクチャの一部を構成する符号化単位であって、一つのピクチャは、一つ以上のスライス/タイルで構成できる。また、スライス/タイルは、一つ以上のCTU(coding tree unit)を含むことができる。
【0054】
本開示において、「ピクセル(pixel)」又は「ペル(pel)」は、一つのピクチャ(又は画像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用できる。サンプルは、一般的に、ピクセル又はピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。
【0055】
本開示において、「ユニット(unit)」は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定の領域及び当該領域に関連する情報のうちの少なくとも一つを含むことができる。ユニットは、場合に応じて、「サンプルアレイ」、「ブロック(block)」又は「領域(area)」などの用語と混用して使用できる。一般な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(又はサンプルアレイ)又は変換係数(transform coefficient)のセット(又はアレイ)を含むことができる。
【0056】
本開示において、「現在ブロック」は、「現在コーディングブロック」、「現在コーディングユニット」、「符号化対象ブロック」、「復号化対象ブロック」又は「処理対象ブロック」のうちのいずれか一つを意味することができる。予測が行われる場合、「現在ブロック」は、「現在予測ブロック」又は「予測対象ブロック」を意味することができる。変換(逆変換)/量子化(逆量子化)が行われる場合、「現在ブロック」は「現在変換ブロック」又は「変換対象ブロック」を意味することができる。フィルタリングが行われる場合、「現在ブロック」は「フィルタリング対象ブロック」を意味することができる。
【0057】
また、本開示において、「現在ブロック」は、クロマブロックという明示的な記載がない限り、ルマ成分ブロックとクロマ成分ブロックを全て含むブロック又は「現在ブロックのルマブロック」を意味することができる。現在ブロックのクロマブロックは、明示的に「クロマブロック」又は「現在クロマブロック」のようにクロマブロックという明示的な記載を含んで表現できる。
【0058】
本開示において、「/」と「、」は「及び/又は」と解釈されることができる。例えば、「A/B」と「A、B」は「A及び/又はB」と解釈されることができる。また、「A/B/C」と「A、B、C」は、「A、B及び/又はCのうちの少なくとも一つ」を意味することができる。
【0059】
本開示において、「又は」は「及び/又は」と解釈されることができる。例えば、「A又はB」は、1)「A」のみを意味するか、2)「B」のみを意味するか、3)「A及びB」を意味することができる。又は、本開示において、「又は」は、「追加的に又は代替的に(additionally or alternatively)」を意味することができる。
【0060】
ビデオコーディングシステムの概要
【0061】
図1は、本開示によるビデオコーディングシステムを示す図である。
【0062】
一実施例によるビデオコーディングシステムは、符号化装置10及び復号化装置20を含むことができる。符号化装置10は、符号化されたビデオ(video)及び/又は画像(image)情報又はデータをファイル又はストリーミング形式でデジタル記憶媒体又はネットワークを介して復号化装置20へ伝達することができる。
【0063】
一実施例による符号化装置10は、ビデオソース生成部11、符号化部12及び伝送部13を含むことができる。一実施例による復号化装置20は、受信部21、復号化部22及びレンダリング部23を含むことができる。前記符号化部12は、ビデオ/画像符号化部と呼ばれることができ、前記復号化部22は、ビデオ/画像復号化部と呼ばれることができる。伝送部13は、符号化部12に含まれることができる。受信部21は、復号化部22に含まれることができる。レンダリング部23は、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイス又は外部コンポーネントとして構成されることもできる。
【0064】
ビデオソース生成部11は、ビデオ/画像のキャプチャ、合成又は生成過程などを介してビデオ/画像を取得することができる。ビデオソース生成部11は、ビデオ/画像キャプチャデバイス及び/又はビデオ/画像生成デバイスを含むことができる。ビデオ/画像キャプチャデバイスは、例えば、一つ以上のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含むことができる。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレット及びスマートフォンなどを含むことができ、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ/画像が生成されることができ、この場合、ビデオ/画像キャプチャ過程は、関連データが生成される過程に置き換えられることができる。
【0065】
符号化部12は、入力ビデオ/画像を符号化することができる。符号化部12は、圧縮及び符号化効率のために、予測、変換、量子化などの一連の手順を行うことができる。符号化部12は、符号化されたデータ(符号化されたビデオ/画像情報)をビットストリーム(bitstream)形式で出力することができる。
【0066】
伝送部13は、ビットストリーム形式で出力された、符号化されたビデオ/画像情報又はデータを、ファイル又はストリーミング形式でデジタル記憶媒体又はネットワークを介して復号化装置20の受信部21に伝達することができる。デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray、HDD、SSDなどのさまざまな記憶媒体を含むことができる。伝送部13は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介して伝送するためのエレメントを含むことができる。受信部21は、前記記憶媒体又はネットワークから前記ビットストリームを抽出/受信して復号化部22に伝達することができる。
【0067】
復号化部22は、符号化部12の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/画像を復号化することができる。
【0068】
レンダリング部23は、復号化されたビデオ/画像をレンダリングすることができる。レンダリングされたビデオ/画像は、ディスプレイ部を介して表示されることができる。
【0069】
画像符号化装置の概要
【0070】
図2は、本開示による実施例が適用できる画像符号化装置を概略的に示す図である。
【0071】
図2に示されているように、画像符号化装置100は、画像分割部110、減算部115、変換部120、量子化部130、逆量子化部140、逆変換部150、加算部155、フィルタリング部160、メモリ170、インター予測部180、イントラ予測部185及びエントロピー符号化部190を含むことができる。インター予測部180及びイントラ予測部185は、合わせて「予測部」と呼ばれることができる。変換部120、量子化部130、逆量子化部140及び逆変換部150は、レジデュアル(residual)処理部に含まれることができる。レジデュアル処理部は減算部115をさらに含むこともできる。
【0072】
画像符号化装置100を構成する複数の構成部の全部又は少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、エンコーダ又はプロセッサ)で実現されることができる。また、メモリ170は、DPB(decoded picture buffer)を含むことができ、デジタル記憶媒体によって実現できる。
【0073】
画像分割部110は、画像符号化装置100に入力された入力画像(又は、ピクチャ、フレーム)を一つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)又は最大コーディングユニット(largest coding unit、LCU)をQT/BT/TT(Quad-tree/binary-tree/ternary-tree)構造によって再帰的に(recursively)分割することにより取得されることができる。例えば、一つのコーディングニットは、四分木構造、二分木構造及び/又は三分木構造に基づいて、下位(deeper)デプスの複数のコーディングユニットに分割されることができる。コーディングユニットの分割のために、四分木構造が先に適用され、二分木構造及び/又は三分木構造が後で適用されることができる。それ以上分割されない最終コーディングユニットを基に、本開示によるコーディング手順が行われることができる。最大コーディングユニットが最終コーディングユニットとして使用されることができ、最大コーディングユニットを分割して取得した下位デプスのコーディングユニットが最終コーディングユニットとして使用されることもできる。ここで、コーディング手順とは、後述する予測、変換及び/又は復元などの手順を含むことができる。他の例として、前記コーディング手順の処理ユニットは、予測ユニット(PU:Prediction Unit)又は変換ユニット(TU:Transform Unit)であることができる。前記予測ユニット及び前記変換ユニットは、それぞれ前記最終コーディングユニットから分割又はパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を誘導する単位、及び/又は変換係数からレジデュアル信号(residual signal)を誘導する単位であることができる。
【0074】
予測部(インター予測部180又はイントラ予測部185)は、処理対象ブロック(現在ブロック)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現在ブロック又はCU単位でイントラ予測が適用されるか、或いはインター予測が適用されるかを決定することができる。予測部は、現在ブロックの予測に関するさまざまな情報を生成してエントロピー符号化部190に伝達することができる。予測に関する情報は、エントロピー符号化部190で符号化されてビットストリーム形式で出力されることができる。
【0075】
イントラ予測部185は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。参照される前記サンプルは、イントラ予測モード及び/又はイントラ予測技法に従って、前記現在ブロックの周辺(neighbor)に位置することもでき、或いは離れて位置することもできる。イントラ予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。非方向性モードは、例えば、DCモード及びプランナーモード(Planarモード)を含むことができる。方向性モードは、予測方向の細かい程度に応じて、例えば33個の方向性予測モード又は65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定に基づいてそれ以上又はそれ以下の個数の方向性予測モードが使用できる。イントラ予測部185は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
【0076】
インター予測部180は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合、周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と、参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。前記参照ブロックを含む参照ピクチャと、前記時間周辺ブロックを含む参照ピクチャとは、同一でもよく、互いに異なってもよい。前記時間周辺ブロックは、コロケート参照ブロック(collocated reference block)、コロケートCU(colCU)などの名前で呼ばれることができる。前記時間周辺ブロックを含む参照ピクチャは、コロケートピクチャ(collocated picture、colPic)と呼ばれることができる。例えば、インター予測部180は、周辺ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われることができ、例えばスキップモードとマージモードの場合に、インター予測部180は、周辺ブロックの動き情報を現在ブロックの動き情報として用いることができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が伝送されないことができる。動き情報予測(motion vector prediction、MVP)モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)及び動きベクトル予測子に対するインジケータ(indicator)を符号化することにより、現在ブロックの動きベクトルをシグナリングすることができる。動きベクトル差分は、現在ブロックの動きベクトルと動きベクトル予測子との差を意味することができる。
【0077】
予測部は、後述する様々な予測方法及び/又は予測技法に基づいて予測信号を生成することができる。例えば、予測部は、現在ブロックの予測のために、イントラ予測又はインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用することができる。現在ブロックの予測のためにイントラ予測とインター予測を同時に適用する予測方法は、CIIP(combined inter and intra prediction)と呼ばれることができる。また、予測部は、現在ブロックの予測のためにイントラブロックコピー(intra block copy、IBC)を行うこともできる。イントラブロックコピーは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。IBCは、現在ブロックから所定の距離だけ離れた位置の現在ピクチャ内の既に復元された参照ブロックを用いて現在ブロックを予測する方法である。IBCが適用される場合、現在ピクチャ内の参照ブロックの位置は、前記所定の距離に該当するベクトル(ブロックベクトル)として符号化されることができる。IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出するという点で、インター予測と同様に行われることができる。すなわち、IBCは、本開示で説明されるインター予測技法のうちの少なくとも1つを用いることができる。
【0078】
予測部によって生成された予測信号は、復元信号を生成するために用いられるか、或いはレジデュアル信号を生成するために用いられることができる。減算部115は、入力画像信号(原本ブロック、原本サンプルアレイ)から、予測部から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算して、レジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成することができる。生成されたレジデュアル信号は、変換部120に伝送されることができる。
【0079】
変換部120は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、又はCNT(Conditionally Non-linear Transform)のうちの少なくとも一つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとするとき、このグラフから得られた変換を意味する。CNTは、以前に復元されたすべてのピクセル(all previously reconstructed pixel)を用いて予測信号を生成し、それに基づいて取得される変換を意味する。変換過程は、正方形の同じサイズを有するピクセルブロックに適用されることもでき、正方形ではない、可変サイズのブロックに適用されることもできる。
【0080】
量子化部130は、変換係数を量子化してエントロピー符号化部190に伝送することができる。エントロピー符号化部190は、量子化された信号(量子化された変換係数に関する情報)を符号化してビットストリーム形式で出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部130は、係数スキャン順序(scan order)に基づいて、ブロック形式の量子化された変換係数を1次元ベクトル形式で再整列することができ、前記1次元ベクトル形式の量子化された変換係数に基づいて、前記量子化された変換係数に関する情報を生成することもできる。
【0081】
エントロピー符号化部190は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などの様々な符号化方法を行うことができる。エントロピー符号化部190は、量子化された変換係数の他に、ビデオ/画像復元に必要な情報(例えば、シンタックス要素(syntax elements)の値など)を一緒に又は別々に符号化することもできる。符号化された情報(例えば、符号化されたビデオ/画像情報)は、ビットストリーム形式でNAL(network abstraction layer)ユニット単位で伝送又は保存されることができる。前記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。本開示で言及されたシグナリング情報、伝送される情報及び/又はシンタックス要素は、上述した符号化手順を介して符号化されて前記ビットストリームに含まれることができる。
【0082】
前記ビットストリームは、ネットワークを介して伝送されることができ、又はデジタル記憶媒体に保存されることができる。ここで、ネットワークは、放送網及び/又は通信網などを含むことができ、デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray、HDD、SSDなどのさまざまな記憶媒体を含むことができる。エントロピー符号化部190から出力された信号を伝送する伝送部(図示せず)及び/又は保存する保存部(図示せず)が画像符号化装置100の内/外部要素として備えられることができ、又は伝送部はエントロピー符号化部190の構成要素として備えられることもできる。
【0083】
量子化部130から出力された、量子化された変換係数は、レジデュアル信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部140及び逆変換部150を介して逆量子化及び逆変換を適用することにより、レジデュアル信号(レジデュアルブロック又はレジデュアルサンプル)を復元することができる。
【0084】
加算部155は、復元されたレジデュアル信号をインター予測部180又はイントラ予測部185から出力された予測信号に加えることにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155は、復元部又は復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
【0085】
フィルタリング部160は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部160は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ170、具体的にはメモリ170のDPBに保存することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部160は、各フィルタリング方法についての説明で後述するようにフィルタリングに関する様々な情報を生成してエントロピー符号化部190に伝達することができる。フィルタリングに関する情報は、エントロピー符号化部190で符号化されてビットストリーム形式で出力されることができる。
【0086】
メモリ170に伝送された、修正された復元ピクチャは、インター予測部180で参照ピクチャとして使用されることができる。画像符号化装置100は、これを介してインター予測が適用される場合、画像符号化装置100と画像復号化装置での予測ミスマッチを回避することができ、符号化効率も向上させることができる。
【0087】
メモリ170内のDPBは、インター予測部180での参照ピクチャとして使用するために、修正された復元ピクチャを保存することができる。メモリ170は、現在ピクチャ内の動き情報が導出された(又は符号化された)ブロックの動き情報及び/又は既に復元されたピクチャ内ブロックの動き情報を保存することができる。前記保存された動き情報は、空間周辺ブロックの動き情報又は時間周辺ブロックの動き情報として活用するために、インター予測部180に伝達されることができる。メモリ170は、現在ピクチャ内の復元されたブロックの復元サンプルを保存することができ、イントラ予測部185に伝達することができる。
【0088】
画像復号化装置の概要
【0089】
図3は、本開示による実施例が適用できる画像復号化装置を概略的に示す図である。
【0090】
図3に示されているように、画像復号化装置200は、エントロピー復号化部210、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260及びイントラ予測部265を含んで構成できる。インター予測部260及びイントラ予測部265を合わせて「予測部」と呼ばれることができる。逆量子化部220、逆変換部230はレジデュアル処理部に含まれることができる。
【0091】
画像復号化装置200を構成する複数の構成部の全部又は少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、デコーダ又はプロセッサ)で実現されることができる。また、メモリ170は、DPBを含むことができ、デジタル記憶媒体によって実現できる。
【0092】
ビデオ/画像情報を含むビットストリームを受信した画像復号化装置200は、
図2の画像符号化装置100で行われたプロセスに対応するプロセスを実行して画像を復元することができる。例えば、画像復号化装置200は、画像符号化装置で適用された処理ユニットを用いて復号化を行うことができる。したがって、復号化の処理ユニットは、例えばコーディングユニットであることができる。コーディングユニットは、コーディングツリーユニット又は最大コーディングユニットを分割して取得できる。そして、画像復号化装置200を介して復号化及び出力された復元画像信号は、再生装置(図示せず)を介して再生できる。
【0093】
画像復号化装置200は、
図2の画像符号化装置から出力された信号をビットストリーム形式で受信することができる。受信された信号は、エントロピー復号化部210を介して復号化できる。例えば、エントロピー復号化部210は、前記ビットストリームをパーシングして画像復元(又はピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出することができる。前記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。画像復号化装置は、画像を復号化するために、前記パラメータセットに関する情報及び/又は前記一般制限情報をさらに用いることができる。本開示で言及されたシグナリング情報、受信される情報及び/又はシンタックス要素は、前記復号化手順を介して復号化されることにより、前記ビットストリームから取得されることができる。例えば、エントロピー復号化部210は、指数ゴロム符号化、CAVLC又はCABACなどのコーディング方法に基づいてビットストリーム内の情報を復号化し、画像復元に必要なシンタックス要素の値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳細には、CABACエントロピー復号化方法は、ビットストリームから各シンタックス要素に該当するビン(bin)を受信し、復号化対象シンタックス要素情報と周辺ブロック及び復号化対象ブロックの復号化情報、或いは以前ステップで復号化されたシンボル/ビンの情報を用いてコンテキスト(context)モデルを決定し、決定されたコンテキストモデルに基づいてビン(bin)の発生確率を予測してビンの算術復号化(arithmetic decoding)を行うことにより、各シンタックス要素の値に該当するシンボルを生成することができる。この時、CABACエントロピー復号化方法は、コンテキストモデルの決定後、次のシンボル/ビンのコンテキストモデルのために、復号化されたシンボル/ビンの情報を用いてコンテキストモデルを更新することができる。エントロピー復号化部210で復号化された情報のうち、予測に関する情報は、予測部(インター予測部260及びイントラ予測部265)に提供され、エントロピー復号化部210でエントロピー復号化が行われたレジデュアル値、すなわち量子化された変換係数及び関連パラメータ情報は、逆量子化部220に入力されることができる。また、エントロピー復号化部210で復号化された情報のうち、フィルタリングに関する情報は、フィルタリング部240に提供されることができる。一方、画像符号化装置から出力された信号を受信する受信部(図示せず)が画像復号化装置200の内/外部要素としてさらに備えられることができ、又は受信部はエントロピー復号化部210の構成要素として備えられることもできる。
【0094】
一方、本開示による画像復号化装置は、ビデオ/画像/ピクチャ復号化装置と呼ばれることができる。前記画像復号化装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)及び/又はサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)を含むこともできる。前記情報デコーダは、エントロピー復号化部210を含むことができ、前記サンプルデコーダは、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260及びイントラ予測部265のうちの少なくとも一つを含むことができる。
【0095】
逆量子化部220では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部220は、量子化された変換係数を2次元のブロック形式で再整列することができる。この場合、前記再整列は、画像符号化装置で行われた係数スキャン順序に基づいて行われることができる。逆量子化部220は、量子化パラメータ(例えば、量子化ステップサイズ情報)を用いて、量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得することができる。
【0096】
逆変換部230では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得することができる。
【0097】
予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピー復号化部210から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか或いはインター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モード(予測技法)を決定することができる。
【0098】
予測部が後述の様々な予測方法(技法)に基づいて予測信号を生成することができるのは、画像符号化装置100の予測部についての説明で述べたのと同様である。
【0099】
イントラ予測部265は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。イントラ予測部185についての説明は、イントラ予測部265に対しても同様に適用されることができる。
【0100】
インター予測部260は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。例えば、インター予測部260は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出することができる。様々な予測モード(技法)に基づいてインター予測が行われることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモード(技法)を指示する情報を含むことができる。
【0101】
加算部235は、取得されたレジデュアル信号を予測部(インター予測部260及び/又はイントラ予測部265を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用できる。加算部155についての説明は、加算部235に対しても同様に適用できる。加算部235は、復元部又は復元ブロック生成部と呼ばれることもある。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを介して次のピクチャのインター予測のために使用されることもできる。
【0102】
フィルタリング部240は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部240は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ250、具体的にはメモリ250のDPBに保存することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。
【0103】
メモリ250のDPBに保存された(修正された)復元ピクチャは、インター予測部260で参照ピクチャとして使用されることができる。メモリ250は、現在ピクチャ内の動き情報が導出された(又は復号化された)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を保存することができる。前記保存された動き情報は、空間周辺ブロックの動き情報又は時間周辺ブロックの動き情報として活用するために、インター予測部260に伝達することができる。メモリ250は、現在ピクチャ内の復元されたブロックの復元サンプルを保存することができ、イントラ予測部265に伝達することができる。
【0104】
本明細書において、画像符号化装置100のフィルタリング部160、インター予測部180及びイントラ予測部185で説明された実施例は、それぞれ画像復号化装置200のフィルタリング部240、インター予測部260及びイントラ予測部265にも、同様に又は対応するように適用されることができる。
【0105】
画像符号化/復号化手順の概要
【0106】
【0107】
画像/ビデオコーディングにおいて、画像/ビデオを構成するピクチャは、一連の復号化順序(decoding order)に従って符号化/復号化されることができる。復号化されたピクチャの出力順序(output order)に該当するピクチャ順序(picture order)は、前記復号化順序とは異なるように設定されることができる。これに基づいて、インター予測の際に、順方向予測だけでなく、逆方向予測も行うことができる。
【0108】
図4において、S401は、上述した復号化装置のエントロピー復号化部で行われることができ、S402は、予測部で行われることができ、S403は、レジデュアル処理部で行われることができ、S404は、加算部で行われることができ、S405は、フィルタリング部で行われることができる。S401は、本明細書で説明された情報復号化手順を含むことができ、S402は、本明細書で説明されたインター/イントラ予測手順を含むことができ、S403は、本明細書で説明されたレジデュアル処理手順を含むことができ、S404は、本明細書で説明されたブロック/ピクチャ復元手順を含むことができ、S405は、本明細書で説明されたインループフィルタリング手順を含むことができる。
【0109】
図4の復号化手順は、上述した説明で示されているように、概略的に、ビットストリームから(復号化による)画像/ビデオ情報取得手順(S401)、ピクチャ復元手順(S402~S404)、及び復元されたピクチャに対するインループフィルタリング手順(S405)を含むことができる。前記ピクチャ復元手順は、本明細書で説明されたインター/イントラ予測(S402)及びレジデュアル処理(S403、量子化された変換係数に対する逆量子化、逆変換)過程を経て取得した予測サンプル及びレジデュアルサンプルに基づいて行われることができる。前記ピクチャ復元手順によって生成された復元ピクチャに対するインループフィルタリング手順を介して、修正(modified)された復元ピクチャが生成されることができ、前記修正された復元ピクチャが、復号化されたピクチャとして出力されることができ、また、復号化装置の復号ピクチャバッファ又はメモリに保存されて以後ピクチャの復号化時にインター予測手順で参照ピクチャとして使用されることができる。場合によっては、前記インループフィルタリング手順は省略可能であり、この場合、前記復元ピクチャが復号化されたピクチャとして出力されることができ、また、復号化装置の復号ピクチャバッファ又はメモリに保存されて以後ピクチャの復号化時にインター予測手順で参照ピクチャとして使用されることができる。前記インループフィルタリング手順(S405)は、上述したように、デブロッキングフィルタリング手順、SAO(sample adaptive offset)手順、ALF(adaptive loop filter)手順、及び/又はバイラテラルフィルター(bi-lateral filter)手順などを含むことができ、その一部又は全部が省略可能である。また、前記デブロッキングフィルタリング手順、SAO(sample adaptive offset)手順、ALF(adaptive loop filter)手順、及びバイラテラルフィルター(bi-lateral filter)手順のうちの一つ又は一部が順次適用されることができ、或いはすべてが順次適用されることもできる。例えば、復元ピクチャに対してデブロッキングフィルタリング手順が適用された後、SAO手順が行われることができる。又は、例えば、復元ピクチャに対してデブロッキングフィルタリング手順が適用された後、ALF手順が行われることができる。これは、符号化装置においても同様に行われることができる。
【0110】
【0111】
図5において、S501は、上述した符号化装置の予測部で行われることができ、S502は、レジデュアル処理部で行われることができ、S503は、エントロピー符号化部190で行われることができる。S501は、本明細書で説明されたインター/イントラ予測手順を含むことができ、S502は、本明細書で説明されたレジデュアル処理手順を含むことができ、S503は、本明細書で説明された情報符号化手順を含むことができる。
【0112】
ピクチャ符号化手順は、上述した説明で示されているように、概略的にピクチャ復元のための情報(例えば、予測情報、レジデュアル情報、パーティショニング情報など)を符号化してビットストリーム形式で出力する手順だけでなく、現在ピクチャに対する復元ピクチャを生成する手順、及び復元ピクチャにインループフィルタリングを適用する手順(optional)を含むことができる。符号化装置は、逆量子化部及び逆変換部を介して、量子化された変換係数から(修正された)レジデュアルサンプルを導出することができ、S501の出力である予測サンプルと前記(修正された)レジデュアルサンプルに基づいて復元ピクチャを生成することができる。このように生成された復元ピクチャは、上述した復号化装置で生成した復元ピクチャと同一であり得る。前記復元ピクチャに対するインループフィルタリング手順を介して、修正された復元ピクチャが生成されることができ、これは、復号ピクチャバッファ又はメモリに保存されることができ、復号化装置での場合と同様に、以後ピクチャの符号化時にインター予測手順で参照ピクチャとして使用されることができる。上述したように、場合によって、前記インループフィルタリング手順の一部又は全部は省略可能である。前記インループフィルタリング手順が行われる場合、(インループ)フィルタリング関連情報(パラメータ)がエントロピー符号化部で符号化されてビットストリーム形式で出力されることができ、復号化装置は、前記フィルタリング関連情報に基づいて符号化装置と同様の方法でインループフィルタリング手順を行うことができる。
【0113】
このようなインループフィルタリング手順を介して、ブロッキングアーチファクト(artifact)及びリンギング(ringing)アーチファクトなど、画像/動画像コーディング時に発生するノイズを低減することができ、主観的/客観的ビジュアルクオリティを高めることができる。また、符号化装置と復号化装置の両方でインループフィルタリング手順を行うことにより、符号化装置と復号化装置は、同一の予測結果を導出することができ、ピクチャコーディングの信頼性を高め、ピクチャコーディングのために伝送されるべきデータ量を減らすことができる。
【0114】
上述したように、復号化装置だけでなく、符号化装置においてもピクチャ復元手順が行われることができる。各ブロック単位でイントラ予測/インター予測に基づいて復元ブロックが生成されることができ、復元ブロックを含む復元ピクチャが生成されることができる。現在ピクチャ/スライス/タイルグループがIピクチャ/スライス/タイルグループである場合、前記現在ピクチャ/スライス/タイルグループに含まれるブロックは、イントラ予測のみに基づいて復元されることができる。一方、現在ピクチャ/スライス/タイルグループがP又はBピクチャ/スライス/タイルグループである場合、前記現在ピクチャ/スライス/タイルグループに含まれるブロックは、イントラ予測又はインター予測に基づいて復元されることができる。この場合、現在ピクチャ/スライス/タイルグループ内の一部のブロックに対してはインター予測が適用され、残りの一部のブロックに対してはイントラ予測が適用されることもできる。ピクチャの色成分は、ルマ成分及びクロマ成分を含むことができ、本明細書で明示的に制限しなければ、本明細書で提案される方法及び実施例は、ルマ成分及びクロマ成分に適用できる。
【0115】
コーディング階層及び構造の概要
【0116】
図6は、コーディング階層及び構造を概略的に説明した図である。
【0117】
本明細書によるコーディングされたビデオ/画像は、例えば、後述するコーディング階層及び構造に従って処理できる。
【0118】
コーディングされた画像は、画像の復号化処理及びそれ自体を扱うVCL(video coding layer、ビデオコーディング階層)、符号化された情報を伝送し保存する下位システム、及びVCLと下位システムとの間に存在し、ネットワーク適応機能を担当するNAL(network abstraction layer、ネットワーク抽象階層)に区分されている。
【0119】
VCLでは、圧縮された画像データ(スライスデータ)を含むVCLデータを生成するか、或いは、ピクチャパラメータセット(Picture Parameter Set:PPS)、シーケンスパラメータセット(Sequence Parameter Set:SPS)、ビデオパラメータセット(Video Parameter Set:VPS)などの情報を含むパラメータセット又は画像の復号化過程に付加的に必要なSEI(Supplemental Enhancement Information)メッセージを生成することができる。
【0120】
NALでは、VCLで生成されたRBSP(Raw Byte Sequence Payload)にヘッダー情報(NALユニットヘッダー)を付加してNALユニットを生成することができる。このとき、RBSPは、VCLで生成されたスライスデータ、パラメータセット、SEIメッセージなどをいう。NALユニットヘッダーには、当該NALユニットに含まれるRBSPデータによって特定されるNALユニットタイプ情報を含むことができる。
【0121】
図示されているように、NALユニットは、VCLで生成されたRBSPによってVCL NALユニットとNon-VCL NALユニットに区分されることができる。VCL NALユニットは、画像に対する情報(スライスデータ)を含んでいるNALユニットを意味することができ、Non-VCL NALユニットは、画像を復号化するために必要な情報(パラメータセット又はSEIメッセージ)を含んでいるNALユニットを意味することができる。
【0122】
上述したVCL NALユニット、Non-VCL NALユニットは、下位システムのデータ規格に応じてヘッダー情報を付けてネットワークを介して伝送されることができる。例えば、NALユニットは、H.266/VVCファイルフォーマット、RTP(Real-time Transport Protocol)、TS(Transport Stream)などの所定の規格のデータ形式に変形して様々なネットワークを介して伝送されることができる。
【0123】
上述したように、NALユニットは、当該NALユニットに含まれるRBSPデータ構造(structure)に応じてNALユニットタイプが特定されることができ、このようなNALユニットタイプに対する情報は、NALユニットヘッダーに保存されてシグナリングされることができる。
【0124】
例えば、NALユニットが画像に対する情報(スライスデータ)を含むか否かによって、大きくVCL NALユニットタイプとNon-VCL NALユニットタイプに分類されることができる。VCL NALユニットタイプは、VCL NALユニットが含むピクチャの性質及び種類などによって分類されることができ、Non-VCL NALユニットタイプは、パラメータセットの種類などによって分類されることができる。
【0125】
次に、Non-VCL NALユニットタイプが含むパラメータセットの種類などによって特定されたNALユニットタイプの一例を羅列する。
【0126】
-APS(Adaptation Parameter Set) NAL unit:APSを含むNALユニットに対するタイプ
【0127】
-DPS(Decoding Parameter Set) NAL unit:DPSを含むNALユニットに対するタイプ
【0128】
-VPS(Video Parameter Set) NALユニット:VPSを含むNALユニットに対するタイプ
【0129】
-SPS(Sequence Parameter Set) NAL unit:SPSを含むNALユニットに対するタイプ
【0130】
-PPS(Picture Parameter Set) NALユニット:PPSを含むNALユニットに対するタイプ
【0131】
上述したNALユニットタイプは、NALユニットタイプのためのシンタックス情報を有し、前記シンタックス情報は、NALユニットヘッダーに保存されてシグナリングされることができる。例えば、前記シンタックス情報はnal_unit_typeであることができ、NALユニットタイプはnal_unit_typeの値で特定できる。
【0132】
前記スライスヘッダー(スライスヘッダーシンタックス)は、前記スライスに共通に適用可能な情報/パラメータを含むことができる。前記APS(APSシンタックス)又はPPS(PPSシンタックス)は、一つ以上のスライス又はピクチャに共通に適用可能な情報/パラメータを含むことができる。前記SPS(SPSシンタックス)は、一つ以上のシーケンスに共通に適用可能な情報/パラメータを含むことができる。前記VPS(VPSシンタックス)は、多重レイヤーに共通に適用可能な情報/パラメータを含むことができる。前記DPS(DPSシンタックス)は、ビデオ全般に共通に適用可能な情報/パラメータを含むことができる。前記DPSは、CVS(coded video sequence)のconcatenationに関する情報/パラメータを含むことができる。本明細書において、上位レベルシンタックス(High level syntax、HLS)とは、前記APSシンタックス、PPSシンタックス、SPSシンタックス、VPSシンタックス、DPSシンタックス、及びスライスヘッダーシンタックスのうちの少なくとも一つを含むことができる。
【0133】
本明細書において、符号化装置から復号化装置へ符号化されてビットストリーム形式でシグナリングされる画像/ビデオ情報は、ピクチャ内のパーティショニング関連情報、イントラ/インター予測情報、レジデュアル情報、インループフィルタリング情報などを含むだけでなく、前記スライスヘッダーに含まれた情報、前記APSに含まれた情報、前記PPSに含まれた情報、SPSに含まれた情報、及び/又はVPSに含まれた情報を含むことができる。
【0134】
VPS内の多重レイヤー(multilayer)情報のシグナリング
【0135】
以下、VPS内の多重レイヤー情報のシグナリングについて詳細に説明する。
【0136】
多重レイヤービットストリームに対して、レイヤー間の従属性のような、復号化できるレイヤーの利用可能な集合であるOLS(output layer set)、OLSに対するPTL(profile、Tier and Level)情報、DPB情報、HRD情報は、下記表のとおりにシグナリングされることができる。
【0137】
【表1-1】
【表1-2】
【表1-3】
【表1-4】
【0138】
VPS RBSPは、参照される前に、復号化プロセスで利用可能でなければならず、TemporalIdが0である少なくとも一つのAUに含まれるか或いは外部手段を介して提供される。
【0139】
CVS内の特定のvps_video_parameter_set_id値を有する全てのVPS NALユニットは、同じコンテンツを持たなければならない。
【0140】
前記表1において、vps_video_parameter_set_idは、他のシンタックス要素による参照のためにVPSに対する識別子を提供する。vps_video_parameter_set_idの値は、0よりも大きくなければならない。
【0141】
vps_max_layers_minus1+1は、VPSによって特定されるレイヤーの数を指定するが、これは、VPSを参照する各CVSで許容される最大レイヤー数である。
【0142】
vps_max_sublayers_minus1+1は、VPSによって特性されるレイヤーに存在しうる時間的サブレイヤーの最大数を指定する。vps_max_sublayers_minus1の値は、0~6の範囲内でなければならない。
【0143】
1であるvps_default_ptl_dpb_hrd_max_tid_flagは、シンタックス要素vps_ptl_max_tid[i]、vps_dpb_max_tid[i]、及びvps_ptl_max_tid[i]が存在せず、デフォルト値vps_max_sublayers_minus1と同一のものと推論されるように指定する。0であるvps_default_ptl_dpb_hrd_max_tid_flagは、シンタックス要素vps_ptl_max_tid[i]、vps_dpb_max_tid[i]、及びvps_ptl_max_tid[i]が存在することを指定する。これに対し、シンタックス要素が存在しない場合には、vps_default_ptl_dpb_hrd_max_tid_flagが1と推論される。
【0144】
1であるvps_all_independent_layers_flagは、VPSによって特定される全てのレイヤーが、インターレイヤー予測を用いずに独立してコーディングされることを指定する。0であるvps_all_independent_layers_flagは、VPSによって特定される1つ以上のレイヤーがインターレイヤー予測を使用することができることを指定する。シンタックス要素が存在しない場合には、vps_all_independent_layers_flagの値は1と推論される。
【0145】
vps_layer_id[i]は、i番目のレイヤーのnuh_layer_id値を指定する。M及びnが負ではない二つの整数であり、mがnより小さい場合には、vps_layer_id[m]の値はvps_layer_id[n]よりも小さくなければならない。
【0146】
1であるvps_independent_layer_flag[i]は、インデックスがiであるレイヤーがインターレイヤー予測を使用しないことを指定する。0であるvps_independent_layer_flag[i]は、インデックスがiであるレイヤーがインターレイヤー予測を使用することができ、jが0乃至i-1の範囲内であるシンタックス要素vps_direct_ref_layer_flag[i][j]がVPSに存在することを指定する。シンタックス要素が存在しない場合、vps_independent_layer_flag[i]の値は1と推論される。
【0147】
1であるvps_max_tid_ref_present_flag[i]は、シンタックス要素vps_max_tid_il_ref_pics_plus1[i][j]が存在することを指定する。0であるvps_max_tid_ref_present_flag[i]は、シンタックス要素vps_max_tid_il_ref_pics_plus1[i][j]が存在しないことを指定する。
【0148】
0であるvps_direct_ref_layer_flag[i][j]は、インデックスがjであるレイヤーが、インデックスがiであるレイヤーに対する直接参照レイヤーではないことを指定する。1であるvps_direct_ref_layer_flag[i][j]は、インデックスがjであるレイヤーが、インデックスがiであるレイヤーに対する直接参照レイヤーであることを指定する。vps_direct_ref_layer_flag[i][j]が0乃至vps_max_layers_minus1の範囲内であるi及びjに対して存在しない場合には、0と推論される。vps_independent_layer_flag[i]が0である場合、0乃至i-1の範囲内であるjに対して、vps_direct_ref_layer_flag[i][j]の値が1である少なくとも1つのjが存在しなければならない。
【0149】
変数NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]、及びLayerUsedAsRefLayerFlag[j]は、
図7のように誘導される。
【0150】
nuh_layer_idがvps_layer_id[i]と同じレイヤーのレイヤーインデックスを指定する変数GeneralLayerIdx[i]は、
図8のように誘導される。
【0151】
互いに異なる任意の値を有するが、両方とも0乃至vps_max_layers_minus1の範囲内であるi及びjに対して、dependencyFlag[i][j]が1であれば、i番目のレイヤーに適用されるtsps_chroma_format_idc及びsps_bitdepth_minus8の値が、j番目のレイヤーに適用されるsps_chroma_format_idc及びsps_bitdepth_minus8の値とそれぞれ同一でなければならない。これは、ビットストリーム整合性要求事項である。
【0152】
0であるvps_max_tid_il_ref_pics_plus1[i][j]は、ph_recovery_poc_cntが0であるGDRピクチャでも、IRAPピクチャでもないj番目のレイヤーのピクチャがi番目のレイヤーのピクチャ復号化のためのILRPとして使用されないことを指定する。0よりも大きいvps_max_tid_il_ref_pics_plus1[i][j]は、i番目のレイヤーのピクチャ復号化のために、vps_max_tid_il_ref_pics_plus1[i][j]-1よりも大きいTemporalIdを有するj番目のレイヤーの如何なるピクチャもILRPとして使用されないことを指定する。このシンタックス要素が存在しない場合、vps_max_tid_il_ref_pics_plus1[i][j]の値は、vps_max_sublayers_minus1+1と同一であると推論される。
【0153】
1であるvps_each_layer_is_an_ols_flagは、各OLSが一つのレイヤーのみを含み、VPSによって特定される各レイヤーは、単一包含レイヤーが唯一の出力レイヤーであるOLSであることを指定する。0であるvps_each_layer_is_an_ols_flagは、少なくとも一つのOLSが二つ以上のレイヤーを含むように指定する。vps_max_layers_minus1が0であれば、vps_each_layer_is_an_ols_flagの値は1と推論される。そうではなく、vps_all_independent_layers_flagが0であれば、vps_each_layer_is_an_ols_flagの値は0と推論される。
【0154】
0であるvps_ols_mode_idcは、VPSによって特定される総OLSの数がvps_max_layers_minus1+1と同一であり、i番目のOLSが0乃至iの範囲内であるレイヤーインデックスを有するレイヤーを含み、各OLSでOLSの最上位レイヤーが出力レイヤーであるように指定する。
【0155】
1であるvps_ols_mode_idcは、VPSによって特定されるOLSの総数がvps_max_layers_minus1+1と同一であり、i番目のOLSが0乃至iの範囲内であるレイヤーインデックスを有するレイヤーを含み、各OLSでOLSの全てのレイヤーが出力レイヤーであるように指定する。
【0156】
2であるvps_ols_mode_idcは、VPSによって特定されるOLSの総数が明示的にシグナリングされ、各OLSで出力レイヤーが明示的にシグナリングされ、他のレイヤーは、OLSの出力レイヤーの直接或いは間接参照レイヤーであるように指定する。
【0157】
vps_ols_mode_idcの値は、0乃至2の範囲内でなければならない。vps_ols_mode_idcの値が3であることは、ITU-T│ISO/IECの今後の使用のために保存されている。
【0158】
vps_all_independent_layers_flagが1であり且つvps_each_layer_is_an_ols_flagが0であれば、vps_ols_mode_idcの値は2と推論される。
【0159】
vps_num_output_layer_sets_minus1+1は、vps_ols_mode_idcが2であるとき、VPSによって特定される総OLSの数を指定する。
【0160】
変数olsModeIdcは、
図9のように誘導される。
【0161】
VPSによって特定されるOLSの総数を指定する変数TotalNumOlssは、
図10のように誘導される。
【0162】
1であるvps_ols_output_layer_flag[i][j]は、vps_layer_id[j]と同一のnuh_layer_idを有するレイヤーが、vps_ols_mode_idcが2であるとき、i番目のOLSの出力レイヤーであるように指定する。0であるvps_ols_output_layer_flag[i][j]は、vps_layer_id[j]と同一のnuh_layer_idを有するレイヤーが、vps_ols_mode_idcが2であるとき、i番目のOLSの出力レイヤーではないように指定する。
【0163】
i番目のOLSの出力レイヤーの数を指定する変数NumOutputLayersInOls[i]、i番目のOLSのj番目のレイヤーのサブレイヤーの数を指定する変数NumSubLayersInLayerInOLS[i][j]、i番目のOLSのj番目の出力レイヤーのnuh_layer_id値を指定する変数OutputLayerIdInOls[i][j]、及びk番目のレイヤーが少なくとも一つのOLSで出力レイヤーとして使用されるか否かを指定する変数LayerUsedAsOutputLayerFlag[k]は、
図11のように誘導される。
【0164】
0乃至vps_max_layers_minus1の範囲内である各値に対して、LayerUsedAsRefLayerFlag[i]及びLayerUsedAsOutputLayerFlag[i]の値の両方とも0であってはならない。言い換えれば、少なくとも一つのOLSの出力レイヤーでもなく、他のレイヤーの直接参照レイヤーでもないレイヤーは、存在することができない。
【0165】
各OLSにおいて、少なくとも1つのレイヤーは、出力レイヤーでなければならない。言い換えれば、0乃至TotalNumOlss-1の範囲内である任意の値に対して、NumOutputLayersInOls[i]の値は1以上でなければならない。
【0166】
i番目のOLSでレイヤーの数を指定する変数NumLayersInOls[i]、i番目のOLSのj番目のレイヤーのnuh_layer_id値を指定する変数LayerIdInOls[i][j]、多重レイヤーOLS(すなわち、2つ以上のレイヤーを含むOLS)の数を指定する変数NumMultiLayerOlss、及びNumLayersInOls[i]が0よりも大きいとき、i番目のOLSで多重レイヤーOLSのリストに対するインデックスを指定する変数MultiLayerOlsIdx[i]は、
図12のように誘導される。
【0167】
ノート1-0番目のOLSは、最下位(lowest)のレイヤー(すなわち、vps_layer_id[0]と同一のnuh_layer_idを有するレイヤー)のみを含み、0番目のOLSの場合に含まれたレイヤーのみが出力である。
【0168】
nuh_layer_idがLayerIdInOls[i][j]と同一のレイヤーのOLSレイヤーインデックスを指定する変数OlsLayerIdx[i][j]は、
図13のように誘導される。
【0169】
各OLSの最下位レイヤーは、独立したレイヤーでなければならない。言い換えれば、0乃至TotalNumOlss-1の範囲内であるそれぞれのiに対して、vps_independent_layer_flag[GeneralLayerIdx[LayerIdInOls[i][0]]]の値は1でなければならない。
【0170】
各レイヤーは、VPSによって指定される少なくとも一つのOLSに含まれなければならない。言い換えれば、0乃至vps_max_layers_minus1の範囲内であるkに対して、vps_layer_id[k]のうちの一つと同一のnuh_layer_idである特定のnuhLayerId値を有する各レイヤーで、i及びjの値に対するペア(pair)が少なくとも一つ存在しなければならない。ここで、iは0乃至TotalNumOlss-1の範囲内であり、jはNumLayersInOls[i]-1の範囲内なので、LayerIdInOls[i][j]の値はnuhLayerIdと同一になる。
【0171】
vps_num_ptls_minus1+1は、VPS内のprofile_tier_level()シンタックス構造の数を指定する。vps_num_ptls_minus1の値は、TotalNumOlssよりも小さくなければならない。この要素が存在しなければ、vps_num_ptls_minus1の値は0と推論される。
【0172】
1であるvps_pt_present_flag[i]は、profile、tier及び一般制約情報がVPSのi番目のprofile_tier_level()シンタックス構造に存在することを指定する。0であるvps_pt_present_flag[i]0は、profile、tier及び一般制約情報がVPSのi番目のprofile_tier_level()シンタックス構造に存在しないことを指定するvps_pt_present_flag[i]が0であれば、VPSのi番目のprofile_tier_level()シンタックス構造に対するprofile、tier及び一般制約情報は、VPSの(i-1)番目のprofile_tier_level()シンタックス構造のそれと同一であると推論される。
【0173】
vps_ptl_max_tid[i]は、レベル情報がVPSでi番目のprofile_tier_level()シンタックス構造に存在する最上位サブレイヤー表現のTemporalIdを指定する。vps_ptl_max_tid[i]の値は、0乃至vps_max_sublayers_minus1の範囲内でなければならない。この要素が存在しなければ、vps_ptl_max_tid[i]の値は、vps_max_sublayers_minus1と同一であると推論される。
【0174】
vps_ptl_alignment_zero_bitは、0と同一でなければならない。
【0175】
vps_ols_ptl_idx[i]は、i番目のOLSに適用されるprofile_tier_level()シンタックス構造の、VPS内のprofile_tier_level()シンタックス構造のリストに対するインデックスを指定する。この要素が存在する場合、vps_ols_ptl_idx[i]の値は、0乃至vps_num_ptls_minus1の範囲内でなければならない。
【0176】
この要素が存在しない場合、vps_ols_ptl_idx[i]の値は、次のように推論される。
【0177】
-vps_num_ptls_minus1が0であれば、vps_ols_ptl_idx[i]の値は、0と推論される。
【0178】
-そうでなければ、(vps_num_ptls_minus1が0よりも大きく、vps_num_ptls_minus1+1がTotalNumOlssと同一である)、vps_ols_ptl_idx[i]の値はiと推論される。
【0179】
NumLayersInOls[i]が1であれば、i番目のOLSに適用されるprofile_tier_level()シンタックス構造は、i番目のOLSのレイヤーが参照するSPS内にも存在する。NumLayersInOls[i]が1であれば、VPSとi番目のOLSに対するSPSでシグナリングされるprofile_tier_level()シンタックス構造が同一でなければならないことが、ビットストリーム整合性の要求事項である。
【0180】
VPSのprofile_tier_level()シンタックス構造のそれぞれは、0乃至TotalNumOlss-1の範囲内であるiに対する、少なくとも一つのvps_ols_ptl_idx[i]値として参照されなければならない。
【0181】
vps_num_dpb_params_minus1+1は、存在する場合、VPS内のdpb_parameters()シンタックス構造の数を指定する。vps_num_dpb_params_minus1の値は、0乃至NumMultiLayerOlss-1の範囲内でなければならない。
【0182】
VPSでdpb_parameters()シンタックス構造の数を指定する変数VpsNumDpbParamsは、
図14のように誘導される。
【0183】
vps_sublayer_dpb_params_present_flagは、VPSでdpb_parameters()シンタックス構造内のmax_dec_pic_buffering_minus1[]、max_num_reorder_pics[]、及びmax_latency_increase_plus1[]シンタックス要素の存在を制御するのに用いられる。この要素が存在しない場合、vps_sub_dpb_params_info_present_flagは0と推論される。
【0184】
vps_dpb_max_tid[i]は、DPRパラメータがVPSでi番目のdpb_parameters()シンタックス構造に存在しうる最上位サブレイヤー表現のTemporalIdを指定する。vps_dpb_max_tid[i]の値は、0乃至vps_max_sublayers_minus1の範囲内でなければならない。この要素が存在しない場合、vps_dpb_max_tid[i]の値は、vps_max_sublayers_minus1と同一のものと推論される。
【0185】
vps_ols_dpb_pic_width[i]は、i番目の多重レイヤーOLSに対する各ピクチャ保存バッファの幅をルマ(luma)サンプル単位で指定する。
【0186】
vps_ols_dpb_pic_height[i]は、i番目の多重レイヤーOLSに対する各ピクチャ保存バッファの高さをルマサンプル単位で指定する。
【0187】
vps_ols_dpb_chroma_format[i]は、i番目の多重レイヤーOLSに対するCVSでCLVSが参照する全てのSPSに対するsps_chroma_format_idcの最大許容値を指定する。
【0188】
vps_ols_dpb_bitdepth_minus8[i]は、i番目の多重レイヤーOLSに対するCVSでCLVSが参照する全てのSPSに対するsps_bitdepth_minus8の最大許容値を指定する。
【0189】
ノート2-i番目の多重レイヤーOLSを復号化する際に、デコーダは、vps_ols_dpb_pic_width[i]、vps_ols_dpb_pic_height[i]、vps_ols_dpb_chroma_format[i]、及びvps_ols_dpb_bitdepth_minus8[i]シンタックス要素の値に応じて、DPBに対して安全にメモリを割り当てることができる。
【0190】
vps_ols_dpb_params_idx[i]は、i番目の多重レイヤーOLSに適用されるdpb_parameters()シンタックス構造の、VPS内のdpb_parameters()シンタックス構造に対するインデックスを指定する。この要素が存在する場合、vps_ols_dpb_params_idx[i]の値は、0乃至VpsNumDebParams―1の範囲内でなければならない。
【0191】
vps_ols_dpb_params_idx[i]が存在しない場合、次のことが推論される:
【0192】
-VpsNumDpbParamsが1であれば、vps_ols_dpb_params_idx[i]の値は0と推論される。
【0193】
-そうでない場合、(VpsNumDpbParamsが1よりも大きく、NumMultiLayerOlssと同一である)、vps_ols_dpb_params_idx[i]の値はiと推論される。
【0194】
単一レイヤーOLSで、適用可能なdpb_parameters()シンタックス構造は、OLSのレイヤーで参照するSPSに存在する。
【0195】
VPS内のdpb_parameters()シンタックス構造のそれぞれは、0乃至NumMultiLayerOlss-1の範囲内であるiに対して、少なくとも1つのvps_ols_dpb_params_idx[i]値によって参照されなければならない。
【0196】
1であるvps_general_hrd_params_present_flagは、VPSがgeneral_hrd_parameters()シンタックス構造と他のHRDパラメータを含むと指定する。0であるvps_general_hrd_params_present_flagは、VPSがgeneral_hrd_parameters()のシンタックス構造或いは他のHRDパラメータを含まないと指定する。
【0197】
NumLayersInOls[i]が1であれば、i番目のOLSに適用されるgeneral_hrd_parameters()シンタックス構造とols_hrd_parameters()シンタックス構造は、i番目のOLSのレイヤーが参照するSPSに存在する。
【0198】
1であるvps_sublayer_cpb_params_present_flagは、VPSのi番目のOLS_hrd_parameters()シンタックス構造が0乃至vps_hrd_max_tid[i]の範囲内にあるTemporalIdを有するサブレイヤー表現のためのHRDパラメータを含むように指定する。0であるvps_sublayer_cpb_params_present_flagは、VPSのi番目のols_hrd_parameters()シンタックス構造がvps_hrd_max_tid[i]と同一のTemporalIdを有するサブレイヤー表現のみのためのHRDパラメータを含むように指定する。vps_max_sublayers_minus1が0であれば、vps_sublayer_cpb_params_present_flagの値は0と推論される。
【0199】
vps_sublayer_cpb_params_present_flagが0であれば、0乃至vps_hrd_max_tid[i]-1の範囲内にあるTemporalIdを有するサブレイヤー表現のためのHRDパラメータは、vps_hrd_max_tid[i]と同一のTemporalIdを有するサブレイヤー表現のためのHRDパラメータと同一であると推論される。
【0200】
ここには、fixed_pic_rate_general_flag[i]シンタックス要素から始まってsublayer_hrd_parameters(i)シンタックス構造の「if(general_vcl_hrd_params_present_flag)」条件の直下のsublayer_hrd_parameters(i)シンタックス構造までのHRDパラメータが含まれる。
【0201】
vps_num_ols_hrd_params_minus1+1は、vps_general_hrd_params_present_flagが1であるとき、VPS内に存在するols_hrd_parameters()シンタックス構造の数を指定する。vps_num_ols_hrd_params_minus1の値は、0乃至NumMultiLayerOlss-1の範囲内でなければならない。
【0202】
vps_hrd_max_tid[i]は、HRDパラメータがi番目のols_hrd_parameters()シンタックス構造に含まれる最上位サブレイヤー表現のTemporalIdを指定する。vps_hrd_max_tid[i]の値は、0乃至vps_max_sublayers_minus1の範囲内でなければならない。この要素が存在しない場合、vps_hrd_max_tid[i]の値はvps_max_sublayers_minus1と推論される。
【0203】
vps_ols_hrd_idx[i]は、i番目の多重レイヤーOLSに適用されるols_hrd_parameters()シンタックス構造の、VPSのols_hrd_parameters()シンタックス構造のリストに対するインデックスを指定する。vps_ols_hrd_idx[i]の値は、0乃至vps_num_ols_hrd_params_minus1の範囲内でなければならない。
【0204】
vps_ols_hrd_idx[i]が存在しない場合、次のように推論される:
【0205】
-vps_num_ols_hrd_params_minus1が0であれば、vps_ols_hrd_idx[i]の値は0と推論される。
【0206】
-そうでない場合、(vps_num_ols_hrd_params_minus1+1が1よりも大きく、is NumMultiLayerOlssと同一である)、vps_ols_hrd_idx[i]の値はiと推論される。
【0207】
単一レイヤーOLSの場合、適用可能なols_hrd_parameters()シンタックス構造は、OLSのレイヤーで参照するSPSに存在する。
【0208】
VPSのols_hrd_parameters()シンタックス構造のそれぞれは、1乃至NumMultiLayerOlss-1の範囲内であるiに対して少なくとも一つのvps_ols_hrd_idx[i]値として参照されなければならない。
【0209】
0であるvps_extension_flagは、vps_extension_data_flagシンタックス要素がVPS RBSPシンタックス構造内に存在しないと指定する。1であるvps_extension_flagは、VPS RBSPシンタックス構造内にvps_extension_data_flagシンタックス要素が存在することができると指定する。
【0210】
vps_extension_data_flagは、いずれの値でもよい。この要素の存在と値は、この仕様のこのバージョンに指定されたプロファイルに対するデコーダ適合性に影響を及ぼさない。この仕様のこのバージョンに従うデコーダは、全てのvps_extension_data_flagシンタックス要素を無視しなければならない。
【0211】
VPS及びSPS
【0212】
以下、VPS(video parameter set)及びSPS(sequence parameter set)のシグナリングについて説明する。
【0213】
VPSの存在は、単一レイヤービットストリームの場合に選択的である。VPSが存在しない場合、シンタックス要素sps_video_parameter_set_idの値は0であり、一部変数の値は、次の説明のように推論される。
【0214】
sps_video_parameter_set_idが0であれば、次のことが適用される:
【0215】
-SPSがVPSを参照せず、SPSを参照する各CLVSを復号化するとき、VPSが参照されない。
【0216】
-vps_max_layers_minus1の値は、0と推論される。
【0217】
-vps_max_sublayers_minus1の値は、6と推論される。
【0218】
-CVSは、一つのレイヤーのみを含まなければならない(すなわち、CVSの全てのVCL NALユニットは、同一のnuh_layer_id値を持たなければならない。)
【0219】
-GeneralLayerIdx[nuh_layer_id]の値は、0と推論される。
【0220】
-vps_independent_layer_flag[GernalLayerIdx[nuh_layer_id]]の値は、1と推論される。
【0221】
SEIメッセージの概要
【0222】
以下、下記表2を参照して、SDI(scalability dimension information)SEIメッセージシンタックスについて説明する。
【0223】
【0224】
以下、SDI(Scalability dimension information)SEIメッセージセマンティクスについて説明する。
【0225】
SDI(scalability dimension information)SEIメッセージは、bitstreamInScope(下記に定義される)の各レイヤーに対する拡張性次元情報(scalability dimension information)を提供するが、例えば、1)bitstreamInScopeがマルチビュー(multiview)ビットストリームである場合、各レイヤーのビューIDを、2)bitstreamInScope内の一つ以上のレイヤーによって伝達される補助情報(auxiliary information)(例えば、深さ或いはアルファ(alpha))が存在する場合、各レイヤーの補助IDを提供することができる。
【0226】
bitstreamInScopeは、復号化順序上、現在拡張性次元情報SEIメッセージを含むAUと後続する0個以上のAUで構成されたAUのシーケンスであり得る。この時、前記後続する0個以上のAUは、拡張性次元情報SEIメッセージを含む後続AUまで全ての後続AUを含むことができる。このとき、拡張性次元情報SEIメッセージを含む前記後続AUは含まれなくてもよい。
【0227】
sdi_max_layers_minus1+1は、bitstreamInScope内の最大レイヤー数を指示することができる。
【0228】
1であるsdi_multiview_info_flagは、bitstreamInScopeがマルチビュービットストリーム(multiview bitstream)であってもよく、sdi_view_id_val[]シンタックス要素がSDI(scalability dimension information)SEIメッセージ内に存在することを指示することができる。0であるsdi_multiview_flagは、bitstreamInScopeがマルチビュービットストリームではなく、sdi_view_id_val[]シンタックス要素は、SDI SEIメッセージ内に存在しないことを指示することができる。
【0229】
1であるsdi_auxiliary_info_flagは、bitstreamInScope内の一つ以上のレイヤーによって伝達される補助情報が存在することができ、sdi_aux_id[]シンタックス要素がSDI SEIメッセージ内に存在することを指示することができる。0であるsdi_auxiliary_info_flagは、bitstreamInScope内の一つ以上のレイヤーによって伝達される補助情報が存在せず、sdi_aux_id[]シンタックス要素がSDI SEIメッセージ内に存在しないことを指示することができる。
【0230】
sdi_view_id_lenは、sdi_view_id_val[i]シンタックス要素の長さをビットで特定することができる。
【0231】
sdi_view_id_val[i]は、bitstreamInScope内のi番目のレイヤーのビューIDを特定することができる。sdi_view_id_val[i]シンタックス要素の長さは、sdi_view_id_lenビットであり得る。この要素が存在しない場合、sdI_view_id_val[i]の値は0と推論されることができる。
【0232】
0であるsdi_aux_id[i]は、bitstreamInScope内 のi番目のレイヤーが補助ピクチャを含まないことを指示することができる。0よりも大きいsdi_aux_id[i]は、下記表3に指定されたように、bitstreamInScope内のi番目レイヤーの補助ピクチャの類型を指示することができる。
【0233】
補助ピクチャ類型に対するsdi_aux_id[i]マッピング
【0234】
【0235】
前記表3において、128乃至159の範囲内であるsdi_aux_idに関連する補助ピクチャの解析は、sdi_aux_id値ではない他の手段を介して指定されることができる。
【0236】
本開示によるビットストリームの場合、sdi_aux_id[i]は、0乃至2の範囲内であるか、或いは128乃至159の範囲内であり得る。本開示によれば、sdi_aux_id[i]の値が0乃至2の範囲内或いは128乃至159の範囲内であっても、デコーダは、0乃至255の範囲内でsdi_aux_id[i]の値を許容しなければならない。
【0237】
上述したように、SDI SEIメッセージは、当該ビットストリームに存在するレイヤーに対する追加的な情報を提供することができる。レイヤーに対する情報を提供するために、ビットストリーム内のレイヤーリストに対する繰り返し文(loop)を含むことができる。しかし、SDI SEIメッセージは、それぞれのインデックスiがどのレイヤーを参照するかに関する情報を含むものではない。即ち、SDI SEIメッセージのi番目のレイヤーと実際レイヤー自体との関係は、ビットストリームのVPSに存在するレイヤー情報によって定義されることができる。これは、VPSが変更されてもよく、VPSを変更するエンティティが前記SEIメッセージも共に変更される必要があることを認知することができないので、好ましくない結果を引き起こすことができる。
【0238】
これを解決するために、本開示においてレイヤー識別子情報を含むSEIメッセージを提案する。すなわち、本開示は、ビットストリーム内に含まれたレイヤーに対するレイヤー識別子情報を含むSEIメッセージに基づく画像符号化/復号化技術を提案する。これによれば、VPSに対するレイヤー識別子情報の従属性が除去されることで、コーディング効率性を向上させることができる
【0239】
本開示によれば、上述した問題点を解決するための構成として、下記の構成1乃至構成6が提供されることができる。下記構成1乃至構成6は、それぞれ独立して実現されてもよく、2つ以上の構成が組み合わされて実現されてもよい。
【0240】
構成1:拡張可能な次元情報(A Scalable Dimension Information、SDI)SEIメッセージは、関連したCVS或いはビットストリームに存在する実際レイヤー(actual layers)よりもさらに多くの数のレイヤーに対する拡張可能な次元情報を伝達することができる。
【0241】
構成2:sdi_max_layers_minus1の値は、対応するCVS或いはビットストリーム内のレイヤーの数に制限されないことができる。すなわち、ビットストリーム内のレイヤーの数よりもさらに大きいか、同じか、或いはさらに小さくてもよい。
【0242】
構成3:又は、sdi_max_layers_minus1+1の値は、対応するCVS或いはビットストリーム内の実際レイヤーの数よりも小さくなくてもよい。
【0243】
構成4:各ビュー識別子及び/又は補助識別子に対して、レイヤー識別子(layer id)情報をシグナリングすることができる。言い換えれば、SEIメッセージ内のレイヤーに対する繰り返し文(loop)を用いてレイヤー識別子情報をシグナリングすることができる。
【0244】
構成5:レイヤーに対する繰り返し文内のレイヤー識別子情報は、レイヤー識別子値の昇順で整列されるか、或いは昇順でシグナリングされることができる。
【0245】
構成6:又は、レイヤーに対する繰り返し文内のレイヤー識別子情報は、レイヤー識別子値の降順で整列されるか、或いは降順でシグナリングされることができる。
【0246】
以下、図面を参照して本発明の実施例を詳細に説明する。
【0247】
実施例1:SDI SEIメッセージシンタックス及びセマンティクス
【0248】
以下、
図15を参照して、本開示によるSDI SEIメッセージシンタックス及びセマンティクスに基づいて本開示の実施例を説明する
【0249】
一例として、SDI SEIメッセージは、ビットストリーム(例えば、bitstreamInScope(下記に定義される))内の各レイヤーに対する拡張性次元情報を含むことができる。例えば、SEIメッセージには、1)ビットストリームがマルチビュービットストリーム(multiview bitstream)である場合、各レイヤーのビュー識別子(view ID)情報が含まれることができ、2)ビットストリーム内の一つ以上のレイヤーが運搬する補助情報(auxiliary information(例えば、深さ(depth)或いはアルファ(alpha))が存在しうる場合、各レイヤーの補助識別子(auxiliary ID)が含まれることができる。
【0250】
一例として、ビットストリーム(例えば、bitstreamInScope)は、復号化順序で現在SDI SEIメッセージを含む一つ以上のAUで構成されたAUのシーケンスであり得る。ここで、SDI SEIメッセージを含む後続AUまで含まれるが、SEIメッセージを含まない全ての後続AUも含めて0個以上のAUがこれに後続することができる。
【0251】
一例として、sdi_max_layers_minus1に1を足した値は、ビットストリーム内の最大レイヤー数を示すことができる。sdi_multiview_info_flagが1であれば、これは、ビットストリームがマルチビュービットストリームであってよく、sdi_view_id_val[]シンタックス要素がSDI SEIメッセージ内に存在することを示すことができる。sdi_multiview_flagが0であれば、これは、ビットストリームがマルチビュービットストリームではなく、sdi_view_id_val[]シンタックス要素がSDI SEIメッセージ内に存在しないことを示すことができる。
【0252】
他の一例として、SDI SEIメッセージは、関連したCVS或いはビットストリームに存在する実際レイヤーよりもさらに多くのレイヤーに対する拡張可能な次元情報(scalable dimension information)を運搬することができる。すなわち、sdi_max_layers_minus1の値が当該CVS或いはビットストリーム内のレイヤーの数に制限されないことができる。すなわち、当該CVS或いはビットストリームのレイヤー数よりも小さいか、同じか、或いは大きくてもよい。又は、sdi_max_layers_minus1+1の値は、常に当該CVS或いはビットストリーム内のレイヤーの実際数よりも小さくなくてもよい。
【0253】
sdi_auxiliary_info_flagが1であれば、これは、ビットストリーム内の一つ以上のレイヤーによって伝達される補助情報が存在することができ、sdi_aux_id[]シンタックス要素は、SDI SEIメッセージ内に存在することを示すことができる。sdi_auxiliary_info_flagが0であれば、これは、ビットストリーム内の一つ以上のレイヤーによって伝達される補助情報は存在せず、sdi_aux_id[]シンタックス要素は、SDI SEIメッセージ内に存在しないことを示すことができる。
【0254】
sdi_view_id_lenは、sdi_view_id_val[i]シンタックス要素の長さをビットで表すことができる。
【0255】
sdi_layer_id[i]は、ビットストリーム(bitstreamInScope)内のi番目のレイヤーのレイヤー識別子(layer ID)に対する情報を示すことができる。i値は、0乃至sdi_max_layers_minus1-1内の値を有することができる。このとき、sdi_layer_id[i]の値は、sid_layer_id[i-1]よりも小さいように、降順で整列されることができる しかし、これに限定されず、昇順又は他の順序によって整列されてもよい。
【0256】
一例として、sdi_view_id_val[i]は、ビットストリーム内のi番目のレイヤーのレイヤー識別子情報を示すことができる。sdi_view_id_val[i]シンタックス要素の長さは、sdi_view_id_lenビットであり得る。この要素が存在しない場合、sdi_view_id_val[i]の値は0と見做されることができる。
【0257】
一例として、sdi_aux_id[i]が0であれば、これは、ビットストリーム内のi番目のレイヤーが補助ピクチャを含まないことを示すことができる。sdi_aux_id[i]が0より大きければ、これは、表4に指定されたように、ビットストリーム内のi番目のレイヤーの補助ピクチャの類型を示すことができる。表4は、次の通りである。
【0258】
補助ピクチャの類型に対するSdi_aux_id[i]マッピング
【0259】
【0260】
前記表に示すように、128乃至159の範囲内であるsdi_aux_idに関連する補助ピクチャ類型の解釈は、特定されなくてもよい。よって、補助ピクチャ類型は、sdi_aux_id値以外に他の手段を介して特定されてもよい。
【0261】
一例として、ビットストリーム整合性(bitstream conformance)のために、sdi_aux_id[i]は、0乃至2の範囲内でなければならない。或いは、128乃至159の範囲内に制限されることもできる。一例として、sdi_aux_id[i]の値が0乃至2の範囲内或いは128乃至159の範囲内に制限されるとしても、デコーダは、sdi_aux_id[i]の値が0乃至255の範囲内の値を持つことができるように許可しなければならない。
【0262】
他の一例として、各ビュー識別子(view id)及び/又は補助識別子(auxiliary id)に対して、レイヤー識別子(layer id)がシグナリングされてもよい。言い換えれば、SEIメッセージ内のレイヤーに対する繰り返し文でレイヤー識別子情報がシグナリングされることができる。このとき、レイヤーに対するレイヤー識別子情報は、レイヤー識別子情報の値に対して昇順で整列或いはシグナリングされてもよく、降順で整列或いはシグナリングされてもよい。
【0263】
前記実施例によれば、レイヤー識別子に関連するVPSに対する不要な従属性を除去してコーディング効率性を向上させることができる。
【0264】
実施例2:本開示による画像復号化方法
【0265】
以下、
図16を参照して、本開示の一実施例による画像復号化方法について説明する。
【0266】
図16の画像復号化方法は、画像復号化装置によって行われ得る。画像復号化装置は、まず、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームとして受信(S1601)することができ。以後、前記受信されたSEIメッセージに基づいて前記一つ以上のレイヤーに対する情報を取得(S1602)し、取得された一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を復元(S1603)することができる。
【0267】
このとき、前記SEIメッセージは、本開示によるSDI SEIメッセージであり得る。一例として、受信されたSEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。一例として、レイヤー識別子情報は、上述したsdi_layer_idを含むことができる。また、レイヤー識別子情報は、前記ビットストリーム内の最大レイヤー数だけ取得できる。ビットストリーム内の最大レイヤー数に関する情報はSEIメッセージから取得できる。すなわち、最大レイヤー数に関する情報はSEIメッセージに含まれることができる。一例として、SEIメッセージは、ビットストリームに含まれた一つ以上のレイヤー以外のレイヤーに対する情報を含むことができる。即ち、ビットストリームに含まれた実際のレイヤーよりもさらに多くの数のレイヤーに対する情報を含むこともできる。すなわち、ビットストリーム内の最大レイヤー数は、ビットストリーム内の一つ以上のレイヤーの数に制限されないことができる。他の一例として、ビットストリーム内の最大レイヤー数は、ビットストリーム内の一つ以上のレイヤーの数よりも小さい値を有しないように制限されるか、或いはビットストリーム内の一つ以上のレイヤーの数よりも小さくてもよい。一方、レイヤー識別子情報は、ビュー識別子(view id)情報或いは補助識別子(auxiliary id)のそれぞれに対してシグナリングされることができる。また、レイヤー識別子情報は、i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも大きい値を有するようにレイヤー識別子値の昇順でSEIメッセージに含まれるか、逆に、i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも小さい値を有するようにレイヤー識別子値の降順で前記SEIメッセージに含まれてもよい。
【0268】
一方、
図16は、本開示の一実施例に該当するので、一部ステップがさらに追加されるか、変更されるか、或いは削除されることができ、ステップの順序が変更されることができる。
【0269】
実施例3:本開示による画像符号化方法
【0270】
以下、
図17を参照して、本開示の一実施例による画像符号化方法について説明する。
【0271】
図17の画像符号化方法は、画像符号化装置によって行われ得る。画像符号化装置は、まず、一つ以上のレイヤーにチスル情報に基づいて画像を符号化(S1701)することができる。すなわち、ビットストリーム内の一つ以上のレイヤーに対する情報に基づいて前記ビットストリーム内の画像を符号化することができる。以後、一つ以上のレイヤーに対する情報を含むSEIメッセージを符号化(S1702)することができる。すなわち、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームに符号化することができる。
【0272】
このとき、前記SEIメッセージは、本開示によるSDI SEIメッセージであり得る。一例として、SEIメッセージは、ビットストリームに含まれた一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。一例として、レイヤー識別子情報は、上述したsdi_layer_idを含むことができる。また、レイヤー識別子情報は、ビットストリーム内の最大レイヤー数だけSEIメッセージに含まれることができる。ビットストリーム内の最大レイヤー数に関する情報もSEIメッセージに含まれることができる。即ち、最大レイヤー数に関する情報は、SEIメッセージに含まれることができる。一例として、SEIメッセージには、ビットストリームに含まれた一つ以上のレイヤー以外のレイヤーに対する情報がさらに含まれることができる。他の一例として、ビットストリーム内の最大レイヤー数は、ビットストリーム内の一つ以上のレイヤーの数よりも小さい値を有しないように制限されるか、ビットストリーム内の一つ以上のレイヤーの数よりも小さくてもよい。一方、レイヤー識別子情報は、ビュー識別子(view id)情報或いは補助識別子(auxiliary id)のそれぞれに対してビットストリームに含まれることができる。また、レイヤー識別子情報は、i番目のレイヤーのレイヤー識別子がi-1番目のレイヤーのレイヤー識別子よりも大きい値を有するようにレイヤー識別子値の昇順でSEIメッセージに含まれて符号化されてもよい。或いは、降順でSEIメッセージに含まれてもよい。
【0273】
一方、
図17は、本開示の一実施例に該当するので、一部ステップがさらに追加されるか、変更されるか、或いは削除されることができ、ステップの順序が変更されることができる。
【0274】
実施例4:本開示による画像符号化/復号化装置
【0275】
一実施例として、
図18の画像符号化/復号化装置1801は、データを保存するメモリ1802、及びメモリを制御するプロセッサ1803を含むことができ、プロセッサに基づいて上述した画像符号化/復号化を行うことができる。また、
図18の装置1801は、
図2乃至
図3の装置を簡略に表現した様子であり、上記で説明した機能を行うことができる。
【0276】
一実施例として、
図18の装置1801が画像復号化装置である場合、プロセッサ1803は、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームとして受信し、受信されたSEIメッセージに基づいて一つ以上のレイヤーに対する情報を取得し、取得された一つ以上のレイヤーに対する情報に基づいてビットストリーム内の画像を復元することができる。また、受信されたSEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。
【0277】
他の一実施例として、
図18の装置1801が画像符号化装置である場合、プロセッサ1803は、ビットストリーム内の一つ以上のレイヤーに対する情報に基づいてビットストリーム内の画像を符号化し、ビットストリームに含まれた一つ以上のレイヤーに対する情報を含むSEI(supplemental enhancement information)メッセージをビットストリームに符号化することができる 一方、SEIメッセージは、前記ビットストリームに含まれた前記一つ以上のレイヤーに対するレイヤー識別子情報を含むことができる。
【0278】
本開示による多様な実施例は、単独で又は他の実施例と組み合わされて使用できる。
【0279】
本開示の例示的な方法は、説明の明確性のために動作のシリーズで表現されているが、これは、ステップが行われる順序を制限するためのものではなく、必要な場合には、それぞれのステップが同時に又は異なる順序で行われることもできる。本開示による方法を実現するために、例示するステップにさらに他のステップを含むか、一部のステップを除いて残りのステップを含むか、或いは一部のステップを除いて追加の他のステップを含むこともできる。
【0280】
本開示において、所定の動作(ステップ)を行う画像符号化装置又は画像復号化装置は、当該動作(ステップ)の実行条件や状況を確認する動作(ステップ)を行うことができる。例えば、所定の条件が満足される場合、所定の動作を行うと記載された場合、画像符号化装置又は画像復号化装置は、前記所定の条件が満足されるか否かを確認する動作を行った後、前記所定の動作を行うことができる。
【0281】
本開示の様々な実施例は、すべての可能な組み合わせを羅列したものではなく、本開示の代表的な態様を説明するためのものであり、様々な実施例で説明する事項は、独立して適用されてもよく、2つ以上の組み合わせで適用されてもよい。
【0282】
また、本開示の様々な実施例は、ハードウェア、ファームウェア(firmware)、ソフトウェア、又はそれらの組み合わせなどによって実現できる。ハードウェアによる実現の場合、1つ又はそれ以上のASICs(Application Specific Integrated Circuits)、DSPs(Digital Signal Processors)、DSPDs(Digital Signal Processing Devices)、PLDs(Programmable Logic Devices)、FPGAs(Field Programmable Gate Arrays)、汎用プロセッサ(general processor)、コントローラ、マイクロコントローラ、マイクロプロセッサなどによって実現できる。
【0283】
また、本開示の実施例が適用された画像復号化装置及び画像符号化装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ会話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、画像電話ビデオ装置、及び医療用ビデオ装置などに含まれることができ、ビデオ信号又はデータ信号を処理するために使用できる。例えば、OTTビデオ(Over the top video)装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)などを含むことができる。
【0284】
図19は、本開示の実施例が適用できるコンテンツストリーミングシステムを例示する図である。
【0285】
図19に示すように、本開示の実施例が適用されたコンテンツストリーミングシステムは、大きく、符号化サーバ、ストリーミングサーバ、Webサーバ、メディアストレージ、ユーザ装置及びマルチメディア入力装置を含むことができる。
【0286】
前記符号化サーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに伝送する役割を果たす。他の例として、スマートフォン、カメラ、ビデオカメラなどのマルチメディア入力装置がビットストリームを直接生成する場合、前記サーバは省略できる。
【0287】
前記ビットストリームは、本開示の実施例が適用された画像符号化方法及び/又は画像符号化装置によって生成でき、前記ストリーミングサーバは、前記ビットストリームを伝送又は受信する過程で一時的に前記ビットストリームを保存することができる。
【0288】
前記ストリーミングサーバは、Webサーバを介してユーザの要求に基づいてマルチメディアデータをユーザ装置に伝送し、前記Webサーバは、ユーザにどんなサービスがあるかを知らせる媒介体の役割を果たすことができる。ユーザが前記Webサーバに所望のサービスを要求すると、前記Webサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを伝送することができる。この時、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割を果たすことができる。
【0289】
前記ストリーミングサーバは、メディアストレージ及び/又は符号化サーバからコンテンツを受信することができる。例えば、前記符号化サーバからコンテンツを受信する場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間保存することができる。
【0290】
前記ユーザ装置の例としては、携帯電話、スマートフォン(smart phone)、ノートパソコン(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device)、例えば、スマートウォッチ(smartwatch)、スマートグラス(smart glass)、HMD(head mounted display)、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどがあり得る。
【0291】
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバから受信するデータは、分散処理されることができる。
【0292】
本開示の範囲は、様々な実施例の方法による動作が装置又はコンピュータ上で実行されるようにするソフトウェア又はマシン-実行可能なコマンド(例えば、オペレーティングシステム、アプリケーション、ファームウェア(firmware)、プログラムなど)、及びこのようなソフトウェア又はコマンドなどが保存されて装置又はコンピュータ上で実行できる非一時的なコンピュータ可読媒体(non-transitory computer-readable medium)を含む。
【産業上の利用可能性】
【0293】
本開示による実施例は、画像を符号化/復号化することに利用可能である。
【国際調査報告】