(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024147568
(43)【公開日】2024-10-16
(54)【発明の名称】エンコーダ、デコーダ並びに対応する方法及び装置
(51)【国際特許分類】
H04N 19/30 20140101AFI20241008BHJP
H04N 19/70 20140101ALI20241008BHJP
【FI】
H04N19/30
H04N19/70
【審査請求】有
【請求項の数】14
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024099420
(22)【出願日】2024-06-20
(62)【分割の表示】P 2022540631の分割
【原出願日】2020-12-31
(31)【優先権主張番号】PCT/CN2019/130804
(32)【優先日】2019-12-31
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】PCT/CN2020/070153
(32)【優先日】2020-01-02
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】マ,シアン
(72)【発明者】
【氏名】ヤン,ハイタオ
(57)【要約】 (修正有)
【課題】エンコーダ、デコーダ並びに対応する方法を提供する。
【解決手段】復号方法は、コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップを含む。参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定する。方法はまた、参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するステップを含む。インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤである。方法はさらに、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤの予測ブロックを取得するステップを含む。前記i、j及びkは整数且つ0以上である。
【選択図】
図7
【特許請求の範囲】
【請求項1】
コーディングされたビデオビットストリームを復号するための方法であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、前記参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、ステップと、
前記参照レイヤシンタックスエレメントの値に基づいて前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるか否かを決定するステップであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、ステップと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するステップであり、前記インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることを含む、ステップと
を含む方法。
【請求項2】
前記インデックスkを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定する場合、前記インデックスjを有するレイヤは、前記インデックスiを有するレイヤの参照レイヤである、請求項1に記載の方法。
【請求項3】
コーディングされたビデオビットストリームを復号するための方法であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、前記参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、ステップと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するステップであり、前記インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定することを含む、ステップと
を含む方法。
【請求項4】
前記参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS)レベルのシンタックスエレメントであり、前記VPSは、前記インデックスjを有するレイヤ及び前記インデックスiを有するレイヤに適用される、請求項1乃至3のうちいずれか1項に記載の方法。
【請求項5】
前記クロマフォーマット関連のシンタックスエレメントは、シーケンスパラメータセット(SPS)レベルのシンタックスエレメントであり、前記SPSは、前記インデックスjを有するレイヤ又は前記インデックスiを有するレイヤに適用される、請求項1乃至3のうちいずれか1項に記載の方法。
【請求項6】
前記コーディングされたビデオビットストリームをパースすることにより、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントとを取得するステップであり、前記条件は、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む、請求項1乃至5のうちいずれか1項に記載の方法。
【請求項7】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであり、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値と同じでない場合、前記コーディングされたビデオビットストリームを復号するのを停止するステップを更に含む、請求項1又は2に記載の方法。
【請求項8】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤの前記ピクチャを予測するステップを更に含む、請求項1又は2に記載の方法。
【請求項9】
前記条件が満たされた場合、前記コーディングされたビデオビットストリームをパースすることにより前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントを取得せずに、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値であると決定するステップを更に含む、請求項1乃至8のうちいずれか1項に記載の方法。
【請求項10】
コーディングされたビデオビットストリームを復号するための方法であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、前記参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、ステップと、
前記参照レイヤシンタックスエレメントの値に基づいて前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるか否かを決定するステップであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、ステップと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するステップであり、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることを含む、ステップと
を含む方法。
【請求項11】
前記インデックスkを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定する場合、前記インデックスjを有するレイヤは、前記インデックスiを有するレイヤの参照レイヤである、請求項10に記載の方法。
【請求項12】
コーディングされたビデオビットストリームを復号するための方法であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、前記参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、ステップと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するステップであり、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定することを含む、ステップと
を含む方法。
【請求項13】
前記参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS)レベルのシンタックスエレメントであり、前記VPSは、前記インデックスjを有するレイヤ及び前記インデックスiを有するレイヤに適用される、請求項10乃至12のうちいずれか1項に記載の方法。
【請求項14】
前記ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS)レベルのシンタックスエレメントであり、前記SPSは、前記インデックスjを有するレイヤ又は前記インデックスiを有するレイヤに適用される、請求項10乃至12のうちいずれか1項に記載の方法。
【請求項15】
前記コーディングされたビデオビットストリームをパースすることにより、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントとを取得するステップであり、前記条件は、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む、請求項10乃至14のうちいずれか1項に記載の方法。
【請求項16】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであり、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じでない場合、前記コーディングされたビデオビットストリームを復号するのを停止するステップを更に含む、請求項10又は11に記載の方法。
【請求項17】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤの前記ピクチャを予測するステップを更に含む、請求項10又は11に記載の方法。
【請求項18】
前記条件が満たされた場合、前記コーディングされたビデオビットストリームをパースすることにより前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントを取得せずに、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値であると決定するステップを更に含む、請求項10乃至17のうちいずれか1項に記載の方法。
【請求項19】
前記ビット深度関連のシンタックスエレメントは、前記ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する、請求項10乃至18のうちいずれか1項に記載の方法。
【請求項20】
ビデオを符号化するための方法であって、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するステップであり、i及びjの双方は整数であり且つ0以上である、ステップと、
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤである場合、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、前記インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとを前記ビデオビットストリームに符号化するステップであり、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値と同じである、ステップと
を含む方法。
【請求項21】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの前記直接参照レイヤである場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するステップを更に含む、請求項20に記載の方法。
【請求項22】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤのピクチャを予測するステップを更に含む、請求項20に記載の方法。
【請求項23】
ビデオを符号化するための方法であって、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するステップであり、i及びjの双方は整数であり且つ0以上である、ステップと、
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤである場合、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとを前記ビデオビットストリームに符号化するステップであり、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じである、ステップと
を含む方法。
【請求項24】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの前記直接参照レイヤである場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するステップを更に含む、請求項23に記載の方法。
【請求項25】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤのピクチャを予測するステップを更に含む、請求項23に記載の方法。
【請求項26】
前記ビット深度関連のシンタックスエレメントは、前記ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する、請求項23乃至25のうちいずれか1項に記載の方法。
【請求項27】
コーディングされたビデオビットストリームを復号するための装置であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、前記参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、取得ユニットと、
前記参照レイヤシンタックスエレメントの値に基づいて前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるか否かを決定するように構成された決定ユニットであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、決定ユニットと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、前記インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることを含む、予測ユニットと
を含む装置。
【請求項28】
前記インデックスkを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定する場合、前記インデックスjを有するレイヤは、前記インデックスiを有するレイヤの参照レイヤである、請求項17に記載の装置。
【請求項29】
コーディングされたビデオビットストリームを復号するための装置であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、前記参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、取得ユニットと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、前記インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定することを含む、予測ユニットと
を含む装置。
【請求項30】
前記参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS)レベルのシンタックスエレメントであり、前記VPSは、前記インデックスjを有するレイヤ及び前記インデックスiを有するレイヤに適用される、請求項27乃至29のうちいずれか1項に記載の装置。
【請求項31】
前記クロマフォーマット関連のシンタックスエレメントは、シーケンスパラメータセット(SPS)レベルのシンタックスエレメントであり、前記SPSは、前記インデックスjを有するレイヤ又は前記インデックスiを有するレイヤに適用される、請求項27乃至29のうちいずれか1項に記載の装置。
【請求項32】
前記取得ユニットは、前記コーディングされたビデオビットストリームをパースすることにより、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントとを取得するように更に構成され、前記条件は、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値と同じであることを更に含む、請求項27乃至31のうちいずれか1項に記載の装置。
【請求項33】
停止ユニットを更に含み、
前記停止ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであり、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値と同じでない場合、前記コーディングされたビデオビットストリームを復号するのを停止するように構成される、請求項27又は28に記載の装置。
【請求項34】
前記取得ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤの前記ピクチャを予測するように更に構成される、請求項27又は28に記載の装置。
【請求項35】
前記決定ユニットは、前記条件が満たされた場合、前記コーディングされたビデオビットストリームをパースすることにより前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントを取得せずに、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値であると決定するように更に構成される、請求項27乃至34のうちいずれか1項に記載の装置。
【請求項36】
コーディングされたビデオビットストリームを復号するための装置であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、前記参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、取得ユニットと、
前記参照レイヤシンタックスエレメントの値に基づいて前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるか否かを決定するように構成された決定ユニットであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、決定ユニットと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることを含む、予測ユニットと
を含む装置。
【請求項37】
前記インデックスkを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定する場合、前記インデックスjを有するレイヤは、前記インデックスiを有するレイヤの参照レイヤである、請求項36に記載の装置。
【請求項38】
コーディングされたビデオビットストリームを復号するための装置であって、
前記コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、前記参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、取得ユニットと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定することを含む、予測ユニットと
を含む装置。
【請求項39】
前記参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS)レベルのシンタックスエレメントであり、前記VPSは、前記インデックスjを有するレイヤ及び前記インデックスiを有するレイヤに適用される、請求項36乃至38のうちいずれか1項に記載の装置。
【請求項40】
前記ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS)レベルのシンタックスエレメントであり、前記SPSは、前記インデックスjを有するレイヤ又は前記インデックスiを有するレイヤに適用される、請求項36乃至38のうちいずれか1項に記載の装置。
【請求項41】
前記取得ユニットは、前記コーディングされたビデオビットストリームをパースすることにより、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントとを取得するように更に構成され、前記条件は、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じであることを更に含む、請求項36乃至40のうちいずれか1項に記載の装置。
【請求項42】
停止ユニットを更に含み、
前記停止ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであり、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じでない場合、前記コーディングされたビデオビットストリームを復号するのを停止するように構成される、請求項36又は37に記載の装置。
【請求項43】
前記予測ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤの前記ピクチャを予測するように更に構成される、請求項36又は37に記載の装置。
【請求項44】
前記決定ユニットは、前記コーディングされたビデオビットストリームをパースすることにより前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントを取得せずに、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値であると決定するように更に構成される、請求項36乃至43のうちいずれか1項に記載の装置。
【請求項45】
前記ビット深度関連のシンタックスエレメントは、前記ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する、請求項36乃至44のうちいずれか1項に記載の装置。
【請求項46】
ビデオを符号化するための装置であって、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するように構成された決定ユニットであり、i及びjの双方は整数であり且つ0以上である、決定ユニットと、
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤである場合、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、前記インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとを前記ビデオビットストリームに符号化するように構成された符号化ユニットであり、前記インデックスiを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用される前記クロマフォーマット関連のシンタックスエレメントの値と同じである、符号化ユニットと
を含む装置。
【請求項47】
第1の予測ユニットを更に含み、
前記第1の予測ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの前記直接参照レイヤである場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するように構成される、請求項46に記載の装置。
【請求項48】
第2の予測ユニットを更に含み、
前記第1の予測ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤのピクチャを予測するように構成される、請求項46に記載の装置。
【請求項49】
ビデオを符号化するための装置であって、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するように構成された決定ユニットであり、i及びjの双方は整数であり且つ0以上である、決定ユニットと、
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤである場合、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとを前記ビデオビットストリームに符号化するように構成された符号化ユニットであり、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じである、符号化ユニットと
を含む装置。
【請求項50】
第1の予測ユニットを更に含み、
前記第1の予測ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの前記直接参照レイヤである場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤのピクチャを予測するように構成される、請求項49に記載の装置。
【請求項51】
第2の予測ユニットを更に含み、
前記第2の予測ユニットは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤのピクチャを予測するように構成される、請求項49に記載の装置。
【請求項52】
前記ビット深度関連のシンタックスエレメントは、前記ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する、請求項49乃至51のうちいずれか1項に記載の装置。
【請求項53】
請求項20乃至26のうちいずれか1項に記載の方法を実行するための処理回路を含むエンコーダ。
【請求項54】
請求項1乃至19のうちいずれか1項に記載の方法を実行するための処理回路を含むデコーダ。
【請求項55】
コンピュータ又はプロセッサ上で実行されたとき、請求項1乃至26のうちいずれか1項に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品。
【請求項56】
1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合され、前記プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体と
を含むデコーダであって、
前記プログラミングは、前記プロセッサにより実行されたとき、請求項1乃至19のうちいずれか1項に記載の方法を実行するように当該デコーダを構成する、デコーダ。
【請求項57】
1つ以上のプロセッサと、
前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体と
を含むエンコーダであって、
前記プログラミングは、前記プロセッサにより実行されたとき、請求項20乃至26のうちいずれか1項に記載の方法を実行するように当該エンコーダを構成する、エンコーダ。
【請求項58】
コンピュータデバイスにより実行されたとき、前記コンピュータデバイスに請求項1乃至26のうちいずれか1項に記載の方法を実行させるプログラムコードを搬送する非一時的なコンピュータ読み取り可能媒体。
【請求項59】
画像復号デバイスにより復号される符号化ビットストリームを含む非一時的な記憶媒体であって、
前記ビットストリームは、少なくとも1つのレイヤの符号化データを含み、前記ビットストリームは、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントとを更に含み、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるとき、前記インデックスiを有するレイヤの前記クロマフォーマット関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤの前記クロマフォーマット関連のシンタックスエレメントの値と同じであり、i及びjの双方は整数であり且つ0以上である、非一時的な記憶媒体。
【請求項60】
画像復号デバイスにより復号される符号化ビットストリームを含む非一時的な記憶媒体であって、
前記ビットストリームは、少なくとも1つのレイヤの符号化データを含み、前記ビットストリームは、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤのビット深度関連のシンタックスエレメントとを更に含み、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるとき、前記インデックスiを有するレイヤの前記ビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤの前記ビット深度関連のシンタックスエレメントの値と同じであり、i及びjの双方は整数であり且つ0以上である、非一時的な記憶媒体。
【請求項61】
前記ビット深度関連のシンタックスエレメントは、前記ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する、請求項60に記載の非一時的な記憶媒体。
【請求項62】
前記ビットストリームは、参照レイヤシンタックスエレメントを更に含み、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることは、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定することを含む、請求項59乃至61のうちいずれか1項に記載の非一時的な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願への相互参照]
本出願は、2019年12月31日に出願された国際出願第PCT/CN2019/130804号及び2020年1月2日に出願された国際出願第PCT/CN2020/070153号の優先権を主張し、これらの内容の全体を参照により援用する。
【0002】
[技術分野]
本出願(開示)の実施形態は、概してピクチャ処理の分野に関し、より詳細には、エンコーダ、デコーダ並びに対応する方法及び装置に関する。
【背景技術】
【0003】
ビデオコーディング(ビデオ符号化及び/又は復号)は、広範囲のデジタルビデオアプリケーション、例えば、放送デジタルテレビジョン(TV, television)、インターネット及び移動ネットワーク上のビデオ送信、ビデオチャットのようなリアルタイム会話アプリケーション、ビデオ会議、デジタルビデオディスク(DVD, digital video disc)及びブルーレイディスク、ビデオコンテンツ取得及び編集システム、並びにセキュリティアプリケーションのカムコーダにおいて使用される。
【0004】
比較的短いビデオですら描写するために必要なビデオデータの量は相当なものになる可能性があり、これは、データがストリーミングされるとき或いは限られた帯域幅容量を有する通信ネットワークを横切って通信されるときに、困難を生じることがある。したがって、ビデオデータは、一般的に、現代の電気通信ネットワークを横切って通信される前に圧縮される。メモリリソースが制限されることがあるので、ビデオが記憶デバイスに記憶されるとき、ビデオのサイズも問題になる可能性がある。ビデオ圧縮デバイスは、しばしば、送信又は記憶の前にビデオデータをコーディングするためにソースにおいてソフトウェア及び/又はハードウェアを使用し、それにより、デジタルビデオ画像を表すために必要なデータの量を減少させる。次いで、圧縮されたデータは、ビデオデータを復号するビデオ解凍デバイスにより宛先で受信される。限られたネットワークリソース及びより高いビデオ品質の更に高まる要求のため、ピクチャ品質にほとんど或いは全く犠牲を払わずに圧縮比を改善する、改善された圧縮及び解凍技術が望ましい。
【発明の概要】
【0005】
本出願の実施形態は、独立請求項に従って符号化及び復号するための装置及び方法を提供する。
【0006】
上記及び他の目的は、独立請求項の対象物により達成される。更なる実現形式は、従属請求項、詳細な説明及び図面から明らかである。
【0007】
特定の実施形態は、添付の独立請求項に概説されており、他の実施形態は従属請求項に概説されている。
【0008】
第1の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行される。当該方法は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、ステップと、
参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するステップであり、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、ステップと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するステップであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む、ステップと
を含む。
【0009】
第1の態様自体による方法の可能な実現形式では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0010】
第2の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行される。当該方法は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、ステップと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するステップであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む、ステップと
を含む。
【0011】
第1の態様のいずれか先行する実現方式若しくは第1の態様又は第2の態様自体による方法の可能な実現形式では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0012】
第1の態様のいずれか先行する実現方式若しくは第1の態様又は第2の態様自体による方法の可能な実現形式では、クロマフォーマット関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0013】
第1の態様のいずれか先行する実現方式若しくは第1の態様又は第2の態様のいずれか先行する実現方式若しくは第2の態様自体による方法の可能な実現形式では、
コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとを取得するステップであり、条件は、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む。
【0014】
第1の態様のいずれか先行する実現方式又は第1の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止するステップを更に含む。
【0015】
第1の態様のいずれか先行する実現方式又は第1の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するステップを更に含む。
【0016】
第1の態様のいずれか先行する実現方式若しくは第1の態様又は第2の態様のいずれか先行する実現方式若しくは第2の態様自体による方法の可能な実現形式では、
条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定するステップを更に含む。
【0017】
第3の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行される。当該方法は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、ステップと、
参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するステップであり、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、ステップと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するステップであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む、ステップと
を含む。
【0018】
第3の態様自体による方法の可能な実現形式では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0019】
第4の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行される。当該方法は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するステップであり、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、ステップと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するステップであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む、ステップと
を含む。
【0020】
第3の態様のいずれか先行する実現方式若しくは第1の態様又は第4の態様自体による方法の可能な実現形式では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0021】
第3の態様のいずれか先行する実現方式若しくは第1の態様又は第4の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0022】
第3の態様のいずれか先行する実現方式若しくは第3の態様又は第4の態様のいずれか先行する実現方式若しくは第4の態様自体による方法の可能な実現形式では、
コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとを取得するステップであり、条件は、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む。
【0023】
第3の態様のいずれか先行する実現方式又は第3の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止するステップを更に含む。
【0024】
第3の態様のいずれか先行する実現方式又は第3の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するステップを更に含む。
【0025】
第3の態様のいずれか先行する実現方式若しくは第3の態様又は第4の態様のいずれか先行する実現方式若しくは第4の態様自体による方法の可能な実現形式では、
条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値であると決定するステップを更に含む。
【0026】
第3の態様のいずれか先行する実現方式若しくは第3の態様又は第4の態様のいずれか先行する実現方式若しくは第4の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0027】
第5の態様によれば、本発明は、ビデオを符号化するための方法に関する。当該方法は、ビデオを符号化するための装置により実行される。当該方法は、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するステップであり、i及びjの双方は整数であり且つ0以上である、ステップと、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化するステップであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じである、ステップと
を含む。
【0028】
第5の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するステップを更に含む。
【0029】
第5の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するステップを更に含む。
【0030】
第6の態様によれば、本発明は、ビデオを符号化するための方法に関する。当該方法は、ビデオを符号化するための装置により実行される。当該方法は、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するステップであり、i及びjの双方は整数であり且つ0以上である、ステップと、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化するステップであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じである、ステップと
を含む。
【0031】
第6の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するステップを更に含む。
【0032】
第6の態様自体による方法の可能な実現形式では、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するステップを更に含む。
【0033】
第6の態様のいずれか先行する実現方式又は第6の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0034】
第7の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための装置に関する。当該装置は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、取得ユニットと、
参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するように構成された決定ユニットであり、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、決定ユニットと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む、予測ユニットと
を含む。
【0035】
第7の態様自体による方法の可能な実現形式では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0036】
第8の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための装置に関する。当該装置は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、取得ユニットと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む、予測ユニットと
を含む。
【0037】
第7の態様のいずれか先行する実現方式若しくは第7の態様又は第8の態様自体による方法の可能な実現形式では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0038】
第7の態様のいずれか先行する実現方式若しくは第7の態様又は第8の態様自体による方法の可能な実現形式では、クロマフォーマット関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0039】
第7の態様のいずれか先行する実現方式若しくは第7の態様又は第8の態様のいずれか先行する実現方式若しくは第8の態様自体による方法の可能な実現形式では、
取得ユニットは、コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとを取得するように更に構成され、条件は、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであることを更に含む。
【0040】
第7の態様のいずれか先行する実現方式又は第7の態様自体による方法の可能な実現形式では、停止ユニットを更に含み、
停止ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止するように構成される。
【0041】
第7の態様のいずれか先行する実現方式又は第7の態様自体による方法の可能な実現形式では、
取得ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するように更に構成される。
【0042】
第7の態様のいずれか先行する実現方式若しくは第7の態様又は第8の態様のいずれか先行する実現方式若しくは第8の態様自体による方法の可能な実現形式では、
決定ユニットは、条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定するように更に構成される。
【0043】
第9の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための装置に関する。当該装置は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、取得ユニットと、
参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するように構成された決定ユニットであり、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、決定ユニットと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む、予測ユニットと
を含む。
【0044】
第9の態様自体による方法の可能な実現形式では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0045】
第10の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための装置に関する。当該装置は、
コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成された取得ユニットであり、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である、取得ユニットと、
条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成された予測ユニットであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む、予測ユニットと
を含む。
【0046】
第9の態様のいずれか先行する実現方式若しくは第9の態様又は第10の態様自体による方法の可能な実現形式では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0047】
第9の態様のいずれか先行する実現方式若しくは第9の態様又は第10の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0048】
第9の態様のいずれか先行する実現方式若しくは第9の態様又は第10の態様のいずれか先行する実現方式若しくは第10の態様自体による方法の可能な実現形式では、
取得ユニットは、コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとを取得するように更に構成され、条件は、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであることを更に含む。
【0049】
第9の態様のいずれか先行する実現方式又は第9の態様自体による方法の可能な実現形式では、停止ユニットを更に含み、
停止ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止するように構成される。
【0050】
第9の態様のいずれか先行する実現方式又は第9の態様自体による方法の可能な実現形式では、
予測ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するように更に構成される。
【0051】
第9の態様のいずれか先行する実現方式若しくは第9の態様又は第10の態様のいずれか先行する実現方式若しくは第10の態様自体による方法の可能な実現形式では、
決定ユニットは、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値であると決定するように更に構成される。
【0052】
第9の態様のいずれか先行する実現方式若しくは第9の態様又は第10の態様のいずれか先行する実現方式若しくは第10の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0053】
第11の態様によれば、本発明は、ビデオを符号化するための装置に関する。当該装置は、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するように構成された決定ユニットであり、i及びjの双方は整数であり且つ0以上である、決定ユニットと、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化するように構成された符号化ユニットであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じである、符号化ユニットと
を含む。
【0054】
第11の態様自体による方法の可能な実現形式では、第1の予測ユニットを更に含み、
第1の予測ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成される。
【0055】
第11の態様自体による方法の可能な実現形式では、第2の予測ユニットを更に含み、
第1の予測ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するように構成される。
【0056】
第12の態様によれば、本発明は、ビデオを符号化するための装置に関する。当該装置は、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するように構成された決定ユニットであり、i及びjの双方は整数であり且つ0以上である、決定ユニットと、
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化するように構成された符号化ユニットであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じである、符号化ユニットと
を含む。
【0057】
第12の態様自体による方法の可能な実現形式では、第1の予測ユニットを更に含み、
第1の予測ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成される。
【0058】
第12の態様自体による方法の可能な実現形式では、第2の予測ユニットを更に含み、
第2の予測ユニットは、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するように構成される。
【0059】
第12の態様のいずれか先行する実現方式又は第12の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0060】
第13の態様によれば、本出願は、第5の態様又は第6の態様による方法を実行するための処理回路を含むエンコーダに関する。
【0061】
第14の態様によれば、本出願は、第1の態様、第2の態様、第3の態様又は第4の態様による方法を実行するための処理回路を含むデコーダに関する。
【0062】
第14の態様によれば、本出願は、コンピュータ又はプロセッサ上で実行されたとき、第1~第6の態様のいずれか1つによる方法を実行するためのプログラムコードを含むコンピュータプログラム製品に関する。
【0063】
第15の態様によれば、本出願は、1つ以上のプロセッサと、1つ以上のプロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体とを含むデコーダに関し、プログラミングは、プロセッサにより実行されたとき、第1の態様、第2の態様、第3の態様又は第4の態様による方法を実行するようにデコーダを構成する。
【0064】
第16の態様によれば、本出願は、1つ以上のプロセッサと、プロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体とを含むエンコーダに関し、プログラミングは、プロセッサにより実行されたとき、第5又は第6の態様による方法を実行するようにエンコーダを構成する。
【0065】
第17の態様によれば、本出願は、コンピュータデバイスにより実行されたとき、コンピュータデバイスに第1~第6の態様のいずれか1つの方法を実行させるプログラムコードを搬送する非一時的なコンピュータ読み取り可能媒体に関する。
【0066】
第18の態様によれば、本出願は、画像復号デバイスにより復号される符号化ビットストリームを含む非一時的な記憶媒体に関し、ビットストリームは、少なくとも1つのレイヤの符号化データを含み、ビットストリームは、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントとを更に含み、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるとき、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値と同じであり、i及びjの双方は整数であり且つ0以上である。
【0067】
第19の態様によれば、本出願は、画像復号デバイスにより復号される符号化ビットストリームを含む非一時的な記憶媒体に関し、ビットストリームは、少なくとも1つのレイヤの符号化データを含み、ビットストリームは、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤのビット深度関連のシンタックスエレメントとを更に含み、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるとき、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤのビット深度関連のシンタックスエレメントの値と同じであり、i及びjの双方は整数であり且つ0以上である。
【0068】
第19の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0069】
第18の態様又は第19の態様のいずれか先行する実現方式若しくは第19の態様自体による方法の可能な実現形式では、ビットストリームは、参照レイヤシンタックスエレメントを更に含み、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることは、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む。
【0070】
第20の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行され、当該方法は、最大許容レイヤ数を導出するために使用される第1のシンタックスエレメントをパースするステップと、第1の条件が満たされたとき、第3のシンタックスエレメントを指定する第2のシンタックスエレメントの値がコーディングされたビデオビットストリームに存在しないという条件で、現在のレイヤのピクチャを予測するステップであり、第1の条件は、最大許容レイヤ数が1であることを第1のシンタックスエレメントの値が指定することを含む。
【0071】
第20の態様自体による方法の可能な実現形式では、第1のシンタックスエレメントは、コーディングされたビデオビットストリームのVPSに含まれ、VPSを参照する各CVS内の最大許容レイヤ数を導出するために使用される。
【0072】
第20の態様のいずれか先行する実現方式又は第20の態様自体による方法の可能な実現形式では、第3のシンタックスエレメントを指定する第2のシンタックスエレメントの値がコーディングされたビデオビットストリームに存在しないという条件でのインデックスを有する現在のレイヤのピクチャを予測することは、第3のシンタックスエレメントを指定する第2のシンタックスエレメントの値がコーディングされたビデオビットストリームのSPSを参照するPHに存在しないという条件でのインデックスを有する現在のレイヤのピクチャを予測することを含み、第2のシンタックスエレメントはSPSに含まれる。
【0073】
第20の態様のいずれか先行する実現方式又は第20の態様自体による方法の可能な実現形式では、当該方法は、第1の条件が満たされたとき、第3のシンタックスエレメントを指定する第2のシンタックスエレメントの値の値がコーディングされたビデオビットストリームに存在しないと決定するステップを更に含む。
【0074】
第20の態様のいずれか先行する実現方式又は第20の態様自体による方法の可能な実現形式では、第3のシンタックスエレメントは、現在ピクチャのPOC MSB値のシンタックスエレメントがPHに存在するか否かを指定し、第3のシンタックスエレメントはPHに含まれる。
【0075】
第21の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行され、当該方法は、インデックスiを有するレイヤがレイヤ間予測を使用するか否かを指定する第1のシンタックスエレメントをパースするステップであり、iは整数であり且つiは0よりも大きい、ステップと、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを第1のシンタックスエレメントの値が指定することを含む第1の条件が満たされたとき、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値と同じであるという条件で、インデックスiを有するレイヤのピクチャを予測するステップであり、第1の条件のjは整数であり且つjは0よりも大きい、ステップとを含む。
【0076】
第21の態様自体による方法の可能な実現形式では、当該方法は、含む第1の条件が満たされたとき、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値が、インデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値と同じであると決定するステップを更に含む。
【0077】
第21の態様のいずれか先行する実現方式又は第21の態様自体による方法の可能な実現形式では、クロマフォーマット関連のシンタックスエレメントは、chroma_format_idc又はseparate_colour_plane_flagを含む。
【0078】
第22の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行され、当該方法は、インデックスiを有するレイヤがレイヤ間予測を使用するか否かを指定する第1のシンタックスエレメントをパースするステップであり、iは整数であり且つiは0よりも大きい、ステップと、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを第1のシンタックスエレメントの値が指定することを含む第1の条件が満たされたとき、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤのビット深度関連のシンタックスエレメントの値と同じであるという条件で、インデックスiを有するレイヤのピクチャを予測するステップであり、第1の条件のjは整数であり且つjは0よりも大きい、ステップとを含む。
【0079】
第22の態様自体による方法の可能な実現形式では、当該方法は、含む第1の条件が満たされたとき、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントの値が、インデックスjを有するレイヤのビット深度関連のシンタックスエレメントの値と同じであると決定するステップを更に含む。
【0080】
第22の態様のいずれか先行する実現方式又は第22の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、bit_depth_minus8を含む。
【0081】
第23の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行され、当該方法は、最大許容レイヤ数を導出するステップと、第1の条件が満たされたとき、第2のシンタックスエレメントを指定する第1のシンタックスエレメントの値がコーディングされたビデオビットストリームに存在しないという条件で、現在のレイヤのピクチャを予測するステップであり、第1の条件は、最大許容レイヤ数の値が1であることを含む、ステップを含む。
【0082】
第24の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行され、当該方法は、ビデオビットストリームのレイヤ数を取得するステップと、レイヤ数が1よりも大きいことを含む第1の条件が満たされたとき、クロマフォーマット関連のシンタックスエレメントの同じ値で、レイヤのピクチャを予測するステップとを含む。
【0083】
第24の態様自体による方法の可能な実現形式では、当該方法は、第1の条件が満たされたとき、レイヤのクロマフォーマット関連のシンタックスエレメントの値が同じであると決定するステップを更に含む。
【0084】
第24の態様のいずれか先行する実現方式又は第24の態様自体による方法の可能な実現形式では、クロマフォーマット関連のシンタックスエレメントは、chroma_format_idc又はseparate_colour_plane_flagを含む。
【0085】
第24の態様のいずれか先行する実現方式又は第24の態様自体による方法の可能な実現形式では、ビデオビットストリームのレイヤ数を取得することは、レイヤ数を取得するために、最大許容レイヤ数を導出するために使用されるシンタックスエレメント(例えば、vps_max_layers_minus1)をパースすることを含む。
【0086】
第25の態様によれば、本発明は、コーディングされたビデオビットストリームを復号するための方法に関し、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行され、当該方法は、ビデオビットストリームのレイヤ数を取得するステップと、レイヤ数が1よりも大きいことを含む第1の条件が満たされたとき、ビット深度関連のシンタックスエレメントの同じ値で、レイヤのピクチャを予測するステップとを含む。
【0087】
第25の態様自体による方法の可能な実現形式では、当該方法は、第1の条件が満たされたとき、レイヤのビット深度関連のシンタックスエレメントの値が同じであると決定するステップを更に含む。
【0088】
第25の態様のいずれか先行する実現方式又は第25の態様自体による方法の可能な実現形式では、ビット深度関連のシンタックスエレメントは、bit_depth_minus8を含む。
【0089】
第25の態様のいずれか先行する実現方式又は第25の態様自体による方法の可能な実現形式では、ビデオビットストリームのレイヤ数を取得することは、レイヤ数を取得するために、最大許容レイヤ数を導出するために使用されるシンタックスエレメント(例えば、vps_max_layers_minus1)をパースすることを含む。
【0090】
第26の態様によれば、本出願は、第21の態様~第25の態様による方法を実行するための処理回路を含むデコーダに関する。
【0091】
第27の態様によれば、本出願は、コンピュータ又はプロセッサ上で実行されたとき、第21の態様~第25の態様のいずれか1つによる方法を実行するためのプログラムコードを含むコンピュータプログラム製品に関する。
【0092】
第28の態様によれば、本出願は、1つ以上のプロセッサと、プロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体とを含むデコーダに関し、プログラミングは、プロセッサにより実行されたとき、第21の態様~第25の態様のいずれか1つによる方法を実行するようにデコーダを構成する。
【0093】
第29の態様によれば、本出願は、コンピュータデバイスにより実行されたとき、コンピュータデバイスに第21の態様~第25の態様のいずれか1つの方法を実行させるプログラムコードを搬送する非一時的なコンピュータ読み取り可能媒体に関する。
【0094】
1つ以上の実施形態の詳細は、添付の図面及び以下の説明に記載されている。他の特徴、目的及び利点は、明細書、図面及び特許請求の範囲から明らかになる。
【0095】
本出願の実施形態によれば、参照レイヤシンタックスエレメントは、コーディングされたビデオビットストリームをパースすることにより取得され、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上であり、参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上であり、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含み、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【図面の簡単な説明】
【0096】
以下に、本発明の実施形態について、添付の図及び図面を参照してより詳細に説明する。
【
図1A】本出願の実施形態を実現するように構成されたビデオコーディングシステムの例を示すブロック図である。
【
図1B】本出願の実施形態を実現するように構成されたビデオコーディングシステムの他の例を示すブロック図である。
【
図2】本出願の実施形態を実現するように構成されたビデオエンコーダの例を示すブロック図である。
【
図3】本出願の実施形態を実現するように構成されたビデオデコーダの例示的な構造を示すブロック図である。
【
図4】符号化装置又は復号装置の例を示すブロック図である。
【
図5】符号化装置又は復号装置の他の例を示すブロック図である。
【
図6】2つのレイヤを有するスケーラブルコーディングを示す例示的な図である。
【
図7】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートである。
【
図8】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートである。
【
図9】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートである。
【
図10】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートである。
【
図11】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートである。
【
図12】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートである。
【
図13】本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートである。
【
図14】本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートである。
【
図15】本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートである。
【
図16】本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートである。
【
図17】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図である。
【
図18】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図である。
【
図19】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図である。
【
図20】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図である。
【
図21】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図である。
【
図22】本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図である。
【
図23】本出願の実施形態によるビデオを符号化するための装置を示す構造図である。
【
図24】本出願の実施形態によるビデオを符号化するための装置を示す構造図である。
【
図25】本出願の実施形態によるビデオを符号化するための装置を示す構造図である。
【
図26】本出願の実施形態によるビデオを符号化するための装置を示す構造図である。
【
図27】コンテンツ配信サービスを実現するコンテンツ供給システム3100の例示的な構造を示すブロック図である。
【
図28】端末デバイスの例の構造を示すブロック図である。
【0097】
以下では、同一の参照符号は、他に明示的に指定されていない場合、同一の或いは少なくとも機能的に等価な特徴を示す。
【発明を実施するための形態】
【0098】
以下の説明では、本開示の一部を形成し、例示により本発明の実施形態の特定の態様又は本発明の実施形態が使用され得る特定の態様を示す、添付の図面に参照が行われる。本発明の実施形態は、他の態様で使用され、図面に示さない構造的又は論理的変更を含んでもよいことが理解される。したがって、以下の詳細な説明は、限定的な意味で考えられるべきでなく、本発明の範囲は、添付の特許請求の範囲により定義される。
【0099】
例えば、記載の方法に関連する開示はまた、方法を実行するように構成された対応するデバイス又はシステムにも当てはまってもよく、逆も同様であることが理解される。例えば、1つ又は複数の特定の方法のステップが記載される場合、対応するデバイスは、記載される1つ又は複数の方法のステップを実行するための1つ又は複数のユニット、例えば、機能ユニットを、このような1つ以上のユニットが明示的に記載されないか或いは図面に示されない場合でも含んでもよい(例えば、1つのユニットが1つ又は複数のステップを実行するか、或いは、複数のユニットが複数のステップのうち1つ以上をそれぞれ実行する)。他方、例えば、特定の装置が1つ又は複数のユニット、例えば、機能ユニットに基づいて記載される場合、対応する方法は、1つ又は複数のユニットの機能を実行するための1つのステップを、このような1つ又は複数のステップが明示的に記載されないか或いは図面に示されない場合でも含んでもよい(例えば、1つのステップが1つ又は複数のユニットの機能を実行するか、或いは、複数のステップが複数のユニットのうち1つ以上の機能をそれぞれ実行する)。さらに、ここに記載の様々な例示的な実施形態及び/又は態様の特徴は、特に断りのない限り、互いに結合されてもよいことが理解される。
【0100】
典型的には、ビデオコーディングは、ビデオ又はビデオシーケンスを形成するピクチャのシーケンスの処理を示す。「ピクチャ」という用語の代わりに、「フレーム」又は「画像」という用語がビデオコーディングの分野において同義語として使用されてもよい。ビデオコーディング(又は一般的にコーディング)は、ビデオ符号化及びビデオ復号の2つの部分を含む。ビデオ符号化は、ソース側で実行され、典型的には、(より効率的な記憶及び/又は送信のために)ビデオピクチャを表すために必要なデータの量を低減するように、(例えば、圧縮により)元のビデオピクチャを処理することを含む。ビデオ復号は、宛先側で実行され、典型的には、ビデオピクチャを再構成するために、エンコーダと比較して逆の処理を含む。ビデオピクチャ(又は一般的にピクチャ)の「コーディング」を参照する実施形態は、ビデオピクチャ又はそれぞれのビデオシーケンスの「符号化」又は「復号」に関連すると理解されるものとする。符号化部及び復号部の組み合わせはまた、コーデック(CODEC, Coding and Decoding)とも呼ばれる。
【0101】
可逆ビデオコーディングの場合、元のビデオピクチャは再構成でき、すなわち、再構成ビデオピクチャは、元のビデオピクチャと同じ品質を有する(記憶又は送信の間の送信損失又は他のデータ損失がないと仮定する)。非可逆ビデオコーディングの場合、ビデオピクチャを表すデータの量を低減するために、例えば、量子化による更なる圧縮が実行され、これは、デコーダで完全には再構成できず、すなわち、再構成ビデオピクチャの品質は、元のビデオピクチャの品質と比較して低いか或いは悪い。
【0102】
いくつかのビデオコーディング標準は、「非可逆ハイブリッドビデオコーデック」のグループに属する(すなわち、サンプルドメインにおける空間及び時間予測と、変換ドメインにおける量子化を適用するための2D変換コーディングとを組み合わせる)。ビデオシーケンスの各ピクチャは、典型的には、重複しないブロックのセットにパーティションされ、コーディングは、典型的には、ブロックレベルで実行される。言い換えると、エンコーダにおいて、例えば、空間(イントラピクチャ)予測及び/又は時間(インターピクチャ)予測を使用して予測ブロックを生成し、現在ブロック(現在処理されている/処理されるべきブロック)から予測ブロックを減算して残差ブロックを取得し、残差ブロックを変換して変換ドメインにおいて残差ブロックを量子化して送信されるべきデータの量を低減すること(圧縮)により、ビデオは典型的にはブロック(ビデオブロック)レベルで処理され、すなわち、符号化される。一方、デコーダにおいて、エンコーダと比較して逆の処理が符号化又は圧縮されたブロックに適用されて、表現のために現在ブロックを再構成する。さらに、エンコーダは、デコーダ処理ループを複製し、それにより、双方は後続のブロックを処理するために、すなわち、コーディングするために、同一の予測(例えば、イントラ及びインター予測)及び/又は再構成を生成する。
【0103】
以下に、ビデオコーディングシステム10、ビデオエンコーダ20及びビデオデコーダ30の実施形態について
図1~3に基づいて説明する。
【0104】
図1Aは、本出願の技術を利用し得る例示的なコーディングシステム10、例えばビデオコーディングシステム10(又は略してコーディングシステム10)を示す概略ブロック図である。ビデオコーディングシステム10のビデオエンコーダ20(又は略してエンコーダ20)及びビデオデコーダ30(又は略してデコーダ30)は、本願に記載の様々な例による技術を実行するように構成され得るデバイスの例を表す。
【0105】
図1Aに示すように、コーディングシステム10は、符号化ピクチャデータ21を、例えば、符号化ピクチャデータ13を復号するための宛先デバイス14に提供するように構成されたソースデバイス12を含む。
【0106】
ソースデバイス12は、エンコーダ20を含み、さらに、すなわち任意選択で、ピクチャソース16と、プリプロセッサ(又は前処理ユニット)18、例えばピクチャプリプロセッサ18と、通信インタフェース又は通信ユニット22とを含んでもよい。
【0107】
ピクチャソース16は、いずれかの種類のピクチャキャプチャデバイス、例えば、現実世界のピクチャをキャプチャするためのカメラ、及び/又はいずれかの種類のピクチャ生成デバイス、例えば、コンピュータアニメーションピクチャを生成するためのコンピュータグラフィックスプロセッサ、又は現実世界のピクチャ、コンピュータにより生成されたピクチャ(例えば、スクリーンコンテンツ、仮想現実(VR, virtual reality)ピクチャ)及び/又はこれらのいずれかの組み合わせ(例えば、拡張現実(AR, augmented reality)ピクチャ)を取得及び/又は提供するためのいずれかの種類の他のデバイスでもよく或いはこれを含んでもよい。ピクチャソースは、上記のピクチャのうちいずれかを記憶するいずれかの種類のメモリ又はストレージでもよい。
【0108】
プリプロセッサ18、及び前処理ユニット18により実行される処理と対照的に、ピクチャ又はピクチャデータ17はまた、未加工ピクチャ又は未加工ピクチャデータ17とも呼ばれてもよい。
【0109】
プリプロセッサ18は、(未加工)ピクチャデータ17を受信し、ピクチャデータ17に対して前処理を実行して、前処理されたピクチャ19又は前処理されたピクチャデータ19を取得するように構成される。プリプロセッサ18により実行される前処理は、例えば、トリミング、カラーフォーマット変換(例えば、RGBからYCbCrへ)、色補正又はノイズ除去を含んでもよい。前処理ユニット18は任意選択のコンポーネントでもよいことが理解できる。
【0110】
ビデオエンコーダ20は、前処理されたピクチャデータ19を受信し、符号化ピクチャデータ21を提供するように構成される(更なる詳細については、例えば、
図2に基づいて以下に説明する)。
【0111】
ソースデバイス12の通信インタフェース22は、符号化ピクチャデータ21を受信し、記憶又は直接の再構成のために、通信チャネル13上で符号化ピクチャデータ21(又はそのいずれかの更なる処理されたバージョン)を他のデバイス、例えば、宛先デバイス14又はいずれかの他のデバイスに送信するように構成されてもよい。
【0112】
宛先デバイス14は、デコーダ30(例えば、ビデオデコーダ30)を含み、さらに、すなわち任意選択で、通信インタフェース又は通信ユニット28と、ポストプロセッサ32(又は後処理ユニット32)と、ディスプレイデバイス34とを含んでもよい。
【0113】
宛先デバイス14の通信インタフェース28は、例えば、ソースデバイス12から直接に或いはいずれかの他のソース、例えば、記憶デバイス、例えば、符号化ピクチャデータ記憶デバイスから、符号化ピクチャデータ21(又はそのいずれかの更なる処理されたバージョン)を受信し、符号化ピクチャデータ21をデコーダ30に提供するように構成される。
【0114】
通信インタフェース22及び通信インタフェース28は、ソースデバイス12と宛先デバイス14との間の直接通信リンク、例えば、直接有線又は無線接続を介して、或いはいずれかの種類のネットワーク、例えば、有線若しくは無線ネットワーク又はこれらのいずれかの組み合わせ、又はいずれかの種類の私設及び公衆ネットワーク、又はこれらのいずれかの種類の組み合わせを介して、符号化ピクチャデータ21又は符号化データ13を送信又は受信するように構成されてもよい。
【0115】
通信インタフェース22は、例えば、符号化ピクチャデータ21を適切なフォーマット、例えばパケットにパッケージ化し、及び/又は通信リンク又は通信ネットワーク上での送信のために、いずれかの種類の送信符号化又は処理を使用して符号化ピクチャデータを処理するように構成されてもよい。
【0116】
通信インタフェース22の相手方を形成する通信インタフェース28は、例えば、送信データを受信し、いずれかの種類の対応する送信復号若しくは処理及び/又はパッケージ解除を使用して、送信データを処理して、符号化ピクチャデータ21を取得するように構成されてもよい。
【0117】
通信インタフェース22及び通信インタフェース28の双方は、
図1Aにおいてソースデバイス12から宛先デバイス14を指す通信チャネル13についての矢印により示されるような単方向通信インタフェースとして、或いは双方向通信インタフェースとして構成されてもよく、例えば、メッセージを送信及び受信するように、例えば、接続を設定して、通信リンク及び/又はデータ送信、例えば、符号化ピクチャデータ送信に関連するいずれかの他の情報を承認及び交換するように構成されてもよい。
【0118】
デコーダ30は、符号化ピクチャデータ21を受信し、復号ピクチャデータ31又は復号ピクチャ31を提供するように構成される(更なる詳細については、例えば、
図3又は
図5に基づいて以下に説明する)。
【0119】
宛先デバイス14のポストプロセッサ32は、復号ピクチャデータ31(再構成ピクチャデータとも呼ばれる)、例えば復号ピクチャ31を後処理して、後処理されたピクチャデータ33、例えば、後処理されたピクチャ33を取得するように構成される。後処理ユニット32により実行される後処理は、例えば、カラーフォーマット変換(例えば、YCbCrからRGBへ)、色補正、トリミング若しくは再サンプリング、又は例えば復号ピクチャデータ31を、例えば、ディスプレイデバイス34による表示のために準備するためのいずれかの他の処理を含んでもよい。
【0120】
宛先デバイス14のディスプレイデバイス34は、後処理されたピクチャデータ33を受信して、例えば、ユーザ又はビューアにピクチャを表示するように構成される。ディスプレイデバイス34は、再構成ピクチャを提示するいずれかの種類のディスプレイ、例えば、一体型若しくは外部ディスプレイ又はモニタでもよく或いはこれを含んでもよい。ディスプレイは、例えば、液晶ディスプレイ(LCD, liquid crystal display)、有機発光ダイオード(OLED, organic light emitting diode)ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロLEDディスプレイ、シリコン上液晶(LCoS, liquid crystal on silicon)、デジタル光プロセッサ(DLP, digital light processor)又はいずれかの種類の他のディスプレイでもよく或いはこれを含んでもよい。
【0121】
図1Aはソースデバイス12及び宛先デバイス14を別個のデバイスとして示すが、デバイスの実施形態はまた、双方又は双方の機能、ソースデバイス12又は対応する機能及び宛先デバイス14又は対応する機能を含んでもよい。このような実施形態では、ソースデバイス12又は対応する機能及び宛先デバイス14又は対応する機能は、同じハードウェア及び/又はソフトウェアを使用して或いは別個のハードウェア及び/又はソフトウェア又はこれらのいずれかの組み合わせにより実現されてもよい。
【0122】
説明に基づいて当業者に明らかなように、
図1Aに示すようなソースデバイス12及び/又は宛先デバイス14内の異なるユニット又は機能の存在及び(正確な)分割は、実際のデバイス及び用途に依存して変化してもよい。
【0123】
エンコーダ20(例えば、ビデオエンコーダ20)若しくはデコーダ30(例えば、ビデオデコーダ30)又はエンコーダ20及びデコーダ30の双方は、1つ以上のマイクロプロセッサ、デジタルシグナルプロセッサ(DSP, digital signal processor)、特定用途向け集積回路(ASIC, application-specific integrated circuit)、フィールドプログラマブルゲートアレイ(FPGA, field-programmable gate array)、ディスクリートロジック、ハードウェア、専用ビデオコーディング又はこれらのいずれかの組み合わせのような、
図1Bに示すような処理回路を介して実現されてもよい。エンコーダ20は、
図2のエンコーダ20及び/又はここに記載のいずれかの他のエンコーダシステム又はサブシステムに関して説明するように、様々なモジュールを具体化するように処理回路46を介して実現されてもよい。デコーダ30は、
図3のデコーダ30及び/又はここに記載のいずれかの他のデコーダシステム又はサブシステムに関して説明するように、様々なモジュールを具体化するように処理回路46を介して実現されてもよい。処理回路は、以下に説明するように、様々な動作を実行するように構成されてもよい。
図5に示すように、技術が部分的にソフトウェアで実現される場合、デバイスは、適切な非一時的なコンピュータ読み取り可能記憶媒体内にソフトウェアのための命令を記憶してもよく、本開示の技術を実行するために1つ以上のプロセッサを使用してハードウェアで命令を実行してもよい。ビデオエンコーダ20及びビデオデコーダ30のいずれかは、例えば、
図1Bに示すように、単一のデバイス内の結合されたエンコーダ/デコーダ(CODEC, encoder/decoder)の部分として統合されてもよい。
【0124】
ソースデバイス12及び宛先デバイス14は、いずれかの種類のハンドヘルド又は固定デバイス、例えば、ノートブック又はラップトップコンピュータ、携帯電話、スマートフォン、タブレット又はタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビ、ディスプレイデバイス、デジタルメディアプレイヤ、ビデオゲームコンソール、ビデオストリーミングデバイス(コンテンツサービスサーバ又はコンテンツ配信サーバ等)、放送受信機デバイス、放送送信機デバイス等を含む、広範なデバイスのうちいずれかを含んでもよく、いずれかの種類のオペレーティングシステムを使用してもよく或いは使用しなくてもよい。いくつかの場合、ソースデバイス12及び宛先デバイス14は、無線通信のために装備されてもよい。したがって、ソースデバイス12及び宛先デバイス14は無線通信デバイスでもよい。
【0125】
いくつかの場合、
図1Aに示すビデオコーディングシステム10は単に例であり、本願の技術は、必ずしも符号化デバイスと復号デバイスとの間にいずれかのデータ通信を含むとは限らないビデオコーディング設定(例えば、ビデオ符号化又はビデオ復号)に適用してもよい。他の例では、データはローカルメモリから取り出される、ネットワーク上でストリーミングされる、等である。ビデオ符号化デバイスは、データを符号化してメモリに記憶してもよく、及び/又はビデオ復号デバイスはデータをメモリから取り出して復号してもよい。いくつかの例では、符号化及び復号は、互いに通信しないが単にデータをメモリに符号化し及び/又はメモリからデータを取り出して復号するデバイスにより実行される。
【0126】
説明の便宜上、本発明の実施形態は、ここでは、例えば高効率ビデオコーディング(HEVC, High-Efficiency Video Coding)又はバーサタイルビデオコーディング(VVC, Versatile Video coding)のリファレンスソフトウェア、ITU-Tビデオコーディング専門家委員会(VCEG, Video Coding Experts Group)及びISO/IEC動画専門家委員会(MPEG, Motion Picture Experts Group)のビデオコーディングに関する共同作業部会(JCT-VC, Joint Collaboration Team on Video Coding)により開発された次世代ビデオコーディング標準を参照することにより記載される。当業者は、本発明の実施形態がHEVC又はVVCに限定されないことを理解する。
【0127】
エンコーダ及び符号化方法
図2は、本願の技術を実現するように構成された例示的なビデオエンコーダ20の概略ブロック図を示す。
図2の例では、ビデオエンコーダ20は、入力201(又は入力インタフェース201)と、残差計算ユニット204と、変換処理ユニット206と、量子化ユニット208と、逆量子化ユニット210と、逆変換処理ユニット212と、再構成ユニット214と、ループフィルタユニット220と、復号ピクチャバッファ(DPB, decoded picture buffer)230と、モード選択ユニット260と、エントロピー符号化ユニット270と、出力272(又は出力インタフェース272)とを含む。モード選択ユニット260は、インター予測ユニット244と、イントラ予測処理ユニット254と、パーティションユニット262とを含んでもよい。インター予測ユニット244は、動き推定ユニット及び動き補償ユニット(図示せず)を含んでもよい。
図2に示すようなビデオエンコーダ20はまた、ハイブリッドビデオエンコーダ又はハイブリッドビデオコーデックによるビデオエンコーダとも呼ばれてもよい。
【0128】
残差計算ユニット204、変換処理ユニット206、量子化ユニット208、モード選択ユニット260は、エンコーダ20の順方向信号経路を形成するものと呼ばれてもよい。一方で、逆量子化ユニット210、逆変換処理ユニット212、再構成ユニット214、バッファ216、ループフィルタ220、復号ピクチャバッファ(DPB, decoded picture buffer)230、インター予測ユニット244及びイントラ予測ユニット254は、ビデオエンコーダ20の逆方向信号経路を形成するものと呼ばれてもよく、ビデオエンコーダ20の逆方向信号経路はデコーダの信号経路に対応する(
図3におけるデコーダ30を参照する)。逆量子化ユニット210、逆変換処理ユニット212、再構成ユニット214、ループフィルタ220、復号ピクチャバッファ(DPB, decoded picture buffer)230、インター予測ユニット244及びイントラ予測ユニット254はまた、ビデオエンコーダ20の「内蔵デコーダ」を形成するものとも呼ばれる。
【0129】
ピクチャ及びピクチャパーティション(ピクチャ及びブロック)
エンコーダ20は、例えば、入力201を介して、ピクチャ17(又はピクチャデータ17)、例えば、ビデオ又はビデオシーケンスを形成するピクチャのシーケンスのピクチャを受信するように構成されてもよい。受信したピクチャ又はピクチャデータはまた、前処理ピクチャ19(前処理ピクチャデータ19)でもよい。簡潔にするために、以下の説明はピクチャ17を参照する。ピクチャ17はまた、(特に、ビデオコーディングにおいて、現在ピクチャを他のピクチャ、例えば、同じビデオシーケンス、すなわち、現在ピクチャも含むビデオシーケンスの前に符号化及び/又は復号されたピクチャと区別するために)現在ピクチャ又はコーディングされるべきピクチャとも呼ばれてもよい。
【0130】
(デジタル)ピクチャは、強度値を有するサンプルの2次元配列又は行列であるか或いはそれとして考えられることができる。配列内のサンプルはまた、ピクセル(ピクチャエレメントの短縮形)又はペル(pel)とも呼ばれてもよい。配列又はピクチャの水平及び垂直方向(又は軸)におけるサンプルの数は、ピクチャのサイズ及び/又は分解能を定義する。色の表現のために、典型的には3つの色成分が使用され、すなわち、ピクチャは、3つのサンプル配列として表されてもよく或いはこれらを含んでもよい。RBGフォーマット又は色空間では、ピクチャは、対応する赤、緑及び青のサンプル配列を含む。しかし、ビデオコーディングでは、各ピクセルは、典型的には、ルミナンス及びクロミナンスフォーマット又は色空間、例えば、Y(場合によっては代わりにLも使用される)により示されるルミナンス成分とCb及びCrにより示される2つのクロミナンス成分とを含むYCbCrで表される。ルミナンス(又は略してルマ)成分Yは、明るさ又はグレーレベル強度(例えば、グレースケールピクチャにおけるもの等)を表す。一方で、2つのクロミナンス(又は略してクロマ)成分Cb及びCrは、色度又は色情報成分を表す。したがって、YCbCrフォーマットのピクチャは、ルミナンスサンプル値(Y)のルミナンスサンプル配列と、クロミナンス値(Cb及びCr)の2つのクロミナンスサンプル配列とを含む。RGBフォーマットのピクチャは、YCbCrフォーマットに転換又は変換されてもよく、逆も同様であり、プロセスはまた、色変換又は転換としても知られる。ピクチャがモノクロである場合、ピクチャは、ルミナンスサンプル配列のみを含んでもよい。したがって、ピクチャは、例えば、モノクロフォーマットのルマサンプルの配列、又は4:2:0、4:2:2及び4:4:4カラーフォーマットのルマサンプルの配列及びクロマサンプルの2つの対応する配列でもよい。
【0131】
ビデオエンコーダ20の実施形態は、ピクチャ17を複数の(典型的には重複しない)ピクチャブロック203にパーティションするように構成されたピクチャパーティションユニット(
図2に図示せず)を含んでもよい。これらのブロックはまた、ルートブロック、マクロブロック(H.264/AVC)又はコーディングツリーブロック(CTB, coding tree block)又はコーディングツリーユニット(CTU, coding tree unit)(H.265/HEVC及びVVC)とも呼ばれてもよい。ピクチャパーティションユニットは、ビデオシーケンスの全てのピクチャ、及びブロックサイズを定義する対応するグリッドに同じブロックサイズを使用するように、或いは、ピクチャ又はピクチャのサブセット若しくはグループの間でブロックサイズを変更し、各ピクチャを対応するブロックにパーティションするように構成されてもよい。
【0132】
更なる実施形態では、ビデオエンコーダは、ピクチャ17のブロック203、例えば、ピクチャ17を形成する1つ、いくつか又は全てのブロックを直接受信するように構成されてもよい。ピクチャブロック203はまた、現在ピクチャブロック又はコーディングされるべきピクチャブロックとも呼ばれてもよい。
【0133】
ピクチャ17と同様に、ピクチャブロック203もまた、強度値(サンプル値)を有するサンプルの2次元配列又は行列であるか或いはそれとして考えられることができるが、ピクチャ17よりも小さい次元である。言い換えると、ブロック203は、例えば、1つのサンプル配列(例えば、モノクロピクチャ17の場合のルマ配列、又はカラーピクチャの場合のルマ若しくはクロマ配列)若しくは3つのサンプル配列(例えば、カラーピクチャ17の場合のルマ及び2つのクロマ配列)、又は適用されるカラーフォーマットに依存していずれかの他の数及び/又は種類の配列を含んでもよい。ブロック203の水平及び垂直方向(又は軸)におけるサンプルの数は、ブロック203のサイズを定義する。したがって、ブロックは、例えば、サンプルのM×N(M列×N行)配列、又は変換係数のM×N配列でもよい。
【0134】
図2に示すようなビデオエンコーダ20の実施形態は、ブロック毎にピクチャ17を符号化するように構成されてもよく、例えば、符号化及び予測がブロック203毎に実行される。
【0135】
図2に示すようなビデオエンコーダ20の実施形態は、スライス(ビデオスライスとも呼ばれる)を使用することによりピクチャをパーティション及び/又は符号化するように更に構成されてもよく、ピクチャは、(典型的には重複しない)1つ以上のスライスにパーティションされてもよく或いはこれを使用して符号化されてもよく、各スライスは、1つ以上のブロック(例えば、CTU)又は1つ以上のブロックのグループ(例えば、タイル(H.265/HEVC及びVVC)又はブリック(VVC))を含んでもよい。
【0136】
図2に示すようなビデオエンコーダ20の実施形態は、スライス/タイルグループ(ビデオタイルグループとも呼ばれる)及び/又はタイル(ビデオタイルとも呼ばれる)を使用することによりピクチャをパーティション及び/又は符号化するように更に構成されてもよく、ピクチャは、(典型的には重複しない)1つ以上のスライス/タイルグループにパーティションされてもよく或いはこれを使用して符号化されてもよく、各スライス/タイルグループは、例えば、1つ以上のブロック(例えば、CTU)又は1つ以上のタイルを含んでもよく、各タイルは、例えば、長方形形状でもよく、1つ以上のブロック(例えば、CTU)、例えば完全な或いは部分的なブロックを含んでもよい。
【0137】
残差計算
残差計算ユニット204は、ピクチャブロック203及び予測ブロック265(予測ブロック265に関する更なる詳細は以下に提供される)に基づいて、例えば、サンプル毎に(ピクセル毎に)ピクチャブロック203のサンプル値から予測ブロック265のサンプル値を減算して、サンプルドメインにおける残差ブロック205を取得することにより、残差ブロック205(残差205とも呼ばれる)を計算するように構成されてもよい。
【0138】
変換
変換処理ユニット206は、残差ブロック205のサンプル値に対して変換、例えば、離散コサイン変換(DCT, discrete cosine transform)又は離散サイン変換(DST, discrete sine transform)を適用して、変換ドメインにおける変換係数207を取得するように構成されてもよい。変換係数207はまた、変換残差係数とも呼ばれ、変換ドメインにおける残差ブロック205を表してもよい。
【0139】
変換処理ユニット206は、H.265/HEVCについて指定された変換のようなDCT/DSTの整数近似を適用するように構成されてもよい。直交DCT変換と比較して、このような整数近似は、典型的には、特定のファクタによりスケーリングされる。順変換及び逆変換により処理される残差ブロックのノルムを維持するために、更なるスケーリングファクタが変換プロセスの一部として適用される。スケーリングファクタは、典型的には、スケーリングファクタがシフト演算のために2の冪乗であること、変換係数のビット深度、精度と実現コストとの間のトレードオフ等のような特定の制約に基づいて選択される。特定のスケーリングファクタは、例えば、逆変換処理ユニット212による逆変換(及び例えば、ビデオデコーダ30における逆変換処理ユニット312による対応する逆変換)について指定され、例えば、エンコーダ20における変換処理ユニット206による順変換についての対応するスケーリングファクタが相応して指定されてもよい。
【0140】
ビデオエンコーダ20の実施形態(それぞれ、変換処理ユニット206)は、例えば、直接或いはエントロピー符号化ユニット270を介して符号化又は圧縮される、変換パラメータ、例えば、変換又は複数の変換のタイプを出力するように構成されてもよく、それにより、例えば、ビデオデコーダ30は、復号のために変換パラメータを受信して使用してもよい。
【0141】
量子化
量子化ユニット208は、例えば、スカラー量子化又はベクトル量子化を適用することにより、変換係数207を量子化して、量子化された係数209を取得するように構成されてもよい。量子化された係数209はまた、量子化された変換係数209又は量子化された残差係数209とも呼ばれてもよい。
【0142】
量子化プロセスは、変換係数207の一部又は全部に関連するビット深度を低減してもよい。例えば、nビットの変換係数は、量子化の間にmビットの変換係数に切り捨てられてもよく、nはmよりも大きい。量子化の程度は、量子化パラメータ(QP, quantization parameter)を調整することにより変更されてもよい。例えば、スカラー量子化では、より精細な或いはより粗い量子化を達成するために異なるスケーリングが適用されてもよい。より小さい量子化ステップサイズは、より精細な量子化に対応する。一方で、より大きい量子化ステップサイズは、より粗い量子化に対応する。適用可能な量子化ステップは、量子化パラメータ(QP, quantization parameter)により示されてもよい。量子化パラメータは、例えば、適用可能な量子化ステップサイズの所定のセットへのインデックスでもよい。例えば、小さい量子化パラメータは、精細な量子化(小さい量子化ステップサイズ)に対応してもよく、大きい量子化パラメータは、粗い量子化(大きい量子化ステップサイズ)に対応してもよく、逆も同様である。量子化は、量子化ステップサイズによる除算を含んでもよく、例えば、逆量子化ユニット210による対応するもの及び/又は逆の反量子化は、量子化ステップサイズによる乗算を含んでもよい。いくつかの標準、例えば、HEVCによる実施形態は、量子化ステップサイズを決定するために量子化パラメータを使用するように構成されてもよい。一般的に、量子化ステップサイズは、除算を含む式の固定点近似を使用して、量子化パラメータに基づいて計算されてもよい。量子化ステップサイズ及び量子化パラメータについての式の固定点近似において使用されるスケーリングのため、変更され得る残差ブロックのノルムを復元するために、量子化及び反量子化のための更なるスケーリングファクタが導入されてもよい。1つの例示的な実現方式では、逆変換及び反量子化のスケーリングは組み合わされてもよい。代替として、カスタマイズされた量子化テーブルが使用され、例えば、ビットストリームでエンコーダからデコーダにシグナリングされてもよい。量子化は非可逆動作であり、量子化ステップサイズの増加に伴い損失が増加する。
【0143】
ビデオエンコーダ20の実施形態(それぞれ、量子化ユニット208)は、例えば、直接或いはエントロピー符号化ユニット270を介して符号化される、量子化パラメータ(QP, quantization parameter)を出力するように構成されてもよく、それにより、例えば、ビデオデコーダ30は、復号のために量子化パラメータを受信して適用してもよい。
【0144】
逆量子化
逆量子化ユニット210は、例えば、量子化ユニット208と同じ量子化ステップサイズに基づいて或いはこれを使用して、量子化ユニット208により適用された量子化方式の逆を適用することにより、量子化された係数に対して量子化ユニット208の逆量子化を適用して、反量子化された係数211を取得するように構成される。反量子化された係数211はまた、反量子化された残差係数211とも呼ばれ、典型的には量子化による損失のため変換係数と同一でないが、変換係数207に対応してもよい。
【0145】
逆変換
逆変換処理ユニット212は、変換処理ユニット206により適用された変換の逆変換、例えば、逆離散コサイン変換(DCT, discrete cosine transform)若しくは逆離散サイン変換(DST, discrete sine transform)又は他の逆変換を適用して、サンプルドメインにおける再構成された残差ブロック213(又は対応する反量子化された係数213)を取得するように構成される。再構成された残差ブロック213はまた、変換ブロック213とも呼ばれてもよい。
【0146】
再構成
再構成ユニット214(例えば、加算器又は合計器214)は、変換ブロック213(すなわち、再構成された残差ブロック213)を予測ブロック265に加算して、例えば、再構成された残差ブロック213のサンプル値と予測ブロック265のサンプル値とをサンプル毎に加算することにより、サンプルドメインにおける再構成されたブロック215を取得するように構成される。
【0147】
フィルタリング
ループフィルタユニット220(又は略して「ループフィルタ」220)は、再構成されたブロック215をフィルタリングして、フィルタリングされたブロック221を取得するように、或いは一般的に、再構成されたサンプルをフィルタリングして、フィルタリングされたサンプル値を取得するように構成される。ループフィルタユニットは、例えば、ピクセル遷移を円滑化するように、或いは、ビデオ品質を改善するように構成される。ループフィルタユニット220は、デブロッキングフィルタ、サンプル適応オフセット(SAO, sample-adaptive offset)フィルタ又は1つ以上の他のフィルタ、例えば、適応ループフィルタ(ALF, adaptive loop filter)、ノイズ抑制フィルタ(NSF, noise suppression filter)又はこれらのいずれかの組み合わせのような1つ以上のループフィルタを含んでもよい。一例では、ループフィルタユニット220は、デブロッキングフィルタ、SAOフィルタ及びALFフィルタを含んでもよい。フィルタリングプロセスの順序は、デブロッキングフィルタ、SAO及びALFでもよい。他の例では、クロマスケーリングを伴うルママッピング(LMCS, luma mapping with chroma scaling)(すなわち、適応インループリシェーパ)と呼ばれるプロセスが追加される。このプロセスはデブロッキングの前に実行される。他の例では、デブロッキングフィルタプロセスはまた、内部サブブロックエッジ、例えば、アフィンサブブロックエッジ、ATMVPサブブロックエッジ、サブブロック変換(SBT, sub-block transform)エッジ及びイントラサブパーティション(ISP, intra sub-partition)エッジに適用されてもよい。ループフィルタユニット220はインループフィルタであるとして
図2に示されているが、他の構成では、ループフィルタユニット220はポストループフィルタとして実現されてもよい。フィルタリングされたブロック221はまた、フィルタリングされた再構成ブロック221とも呼ばれてもよい。
【0148】
ビデオエンコーダ20の実施形態(それぞれ、ループフィルタユニット220)は、例えば、直接或いはエントロピー符号化ユニット270を介して符号化される、ループフィルタパラメータ(SAOフィルタパラメータ又はALFフィルタパラメータ又はLMCSパラメータ等)を出力するように構成されてもよく、それにより、例えば、デコーダ30は、復号のために同じループフィルタパラメータ又はそれぞれのループフィルタを受信して適用してもよい。
【0149】
復号ピクチャバッファ
復号ピクチャバッファ(DPB, decoded picture buffer)230は、ビデオエンコーダ20によりビデオデータを符号化するために、参照ピクチャ又は一般的に参照ピクチャデータを記憶するメモリでもよい。DPB230は、シンクロナスDRAM(SDRAM, synchronous DRAM)を含むダイナミックランダムアクセスメモリ(DRAM, dynamic random access memory)、磁気抵抗RAM(MRAM, magnetoresistive RAM)、抵抗RAM(RRAM, resistive RAM)、又は他のタイプのメモリデバイスのような様々なメモリデバイスのうちいずれかにより形成されてもよい。復号ピクチャバッファ(DPB, decoded picture buffer)230は、1つ以上のフィルタリングされたブロック221を記憶するように構成されてもよい。復号ピクチャバッファ230は、同じ現在ピクチャ又は異なるピクチャ、例えば、前に再構成されたピクチャの他の前にフィルタリングされたブロック、例えば、前に再構成されてフィルタリングされたブロック221を記憶するように更に構成されてもよく、例えば、インター予測のために、完全な前に再構成された、すなわち、復号されたピクチャ(及び対応する参照ブロック及びサンプル)、及び/又は部分的に再構成された現在ピクチャ(及び対応する参照ブロック及びサンプル)を提供してもよい。復号ピクチャバッファ(DPB, decoded picture buffer)230はまた、1つ以上のフィルタリングされていない再構成ブロック215、又は一般的には、例えば、再構成されたブロック215がループフィルタユニット220によりフィルタリングされない場合には、フィルタリングされていない再構成サンプル、又は再構成されたブロック若しくはサンプルのいずれかの他の更に処理されたバージョンを記憶するように構成されてもよい。
【0150】
モード選択(パーティション及び予測)
モード選択ユニット260は、パーティションユニット262と、インター予測ユニット244と、イントラ予測ユニット254とを含み、元のピクチャデータ、例えば、元のブロック203(現在ピクチャ17の現在ブロック203)と、再構成ピクチャデータ、例えば、同じ(現在)ピクチャの及び/又は1つ又は複数の前に復号されたピクチャからの、例えば、復号ピクチャバッファ230又は他のバッファ(例えば、図示しないラインバッファ)からのフィルタリングされた及び/又はフィルタリングされていない再構成サンプル又はブロックとを受信又は取得するように構成される。再構成ピクチャデータは、予測ブロック265又は予測子265を取得するために、予測、例えば、インター予測又はイントラ予測のための参照ピクチャデータとして使用される。
【0151】
モード選択ユニット260は、現在のブロック予測モードについてのパーティション(パーティションしないことを含む)と、予測モード(例えば、イントラ又はインター予測モード)とを決定又は選択し、残差ブロック205の計算のため且つ再構成ブロック215の再構成のために使用される対応する予測ブロック265を生成するように構成されてもよい。
【0152】
モード選択ユニット260の実施形態は、最良の適合若しくは言い換えると最小残差(最小残差は送信又は記憶のためのより良い圧縮を意味する)又は最小シグナリングオーバヘッド(最小シグナリングオーバヘッドは送信又は記憶のためのより良い圧縮を意味する)を提供するか、或いは、双方を考慮するか或いはバランスさせるパーティション及び予測モードを(例えば、モード選択ユニット260によりサポートされるか或いは利用可能なものから)選択するように構成されてもよい。モード選択ユニット260は、レート歪み最適化(RDO, rate distortion optimization)に基づいて、パーティション及び予測モードを決定するように、すなわち、最小のレート歪みを提供する予測モードを選択するように構成されてもよい。この文脈における「最良」、「最小」、「最適」等のような用語は、必ずしも全体的な「最良」、「最小」、「最適」等を示すとは限らず、閾値を超えるか或いはそれよりも下である値のような終了若しくは選択基準、又は潜在的に「準最適選択」をもたらすが複雑さ及び処理時間を低減する他の制約の充足を示してもよい。
【0153】
言い換えると、パーティションユニット262は、ビデオシーケンスからのピクチャをコーディングツリーユニット(CTU, coding tree unit)のシーケンスにパーティションするように構成されてもよく、CTU203は、例えば、四分木パーティション(QT, quad-tree-partitioning)、二分木パーティション(BT, binary partitioning)若しくは三分木パーティション(TT, triple-tree-partitioning)又はこれらのいずれかの組み合わせを繰り返し使用して、より小さいブロックパーティション又はサブブロック(これも再びブロックを形成する)に更にパーティションされてもよく、例えば、ブロックパーティション又はサブブロックのそれぞれについて予測を実行し、モード選択は、パーティションされたブロック203のツリー構造の選択を含み、予測モードは、ブロックパーティション又はサブブロックのそれぞれに適用される。
【0154】
以下に、例示的なビデオエンコーダ20により実行される(例えば、パーティションユニット260による)パーティション及び(インター予測ユニット244及びイントラ予測ユニット254による)予測処理についてより詳細に説明する。
【0155】
パーティション
パーティションユニット262は、ビデオシーケンスからのピクチャをコーディングツリーユニット(CTU, coding tree unit)のシーケンスにパーティションするように構成されてもよく、パーティションユニット262は、コーディングツリーユニット(CTU, coding tree unit)203を、より小さいパーティション、例えば正方形又は長方形サイズのより小さいブロックにパーティション(又は分割)してもよい。3つのサンプル配列を有するピクチャについて、CTUは、ルマサンプルのN×Nブロックから、クロマサンプルの2つの対応するブロックと共に構成される。CTU内のルマブロックの最大許容サイズは、策定中のバーサタイルビデオコーディング(VVC, versatile video coding)では128×128と指定されているが、将来128×128でない値、例えば256×256と指定される可能性がある。ピクチャのCTUは、スライス/タイルグループ、タイル又はブリックとしてクラスタ化/グループ化されてもよい。タイルは、ピクチャの長方形領域をカバーし、タイルは、1つ以上のブリックに分割できる。ブリックは、タイル内の複数のCTU行から構成される。複数のブリックにパーティションされないタイルは、ブリックと呼ばれることができる。しかし、ブリックはタイルの真のサブセットであり、タイルとは呼ばれない。VVCでサポートされるタイルグループの2つのモード、すなわち、ラスタ走査スライス/タイルグループモード及び長方形スライスモードが存在する。ラスタ走査タイルグループモードでは、スライス/タイルグループは、ピクチャのタイルラスタ走査におけるタイルのシーケンスを含む。長方形スライスモードでは、スライスは、ピクチャの長方形領域をまとめて形成するピクチャの多数のブリックを含む。長方形スライス内のブリックは、スライスのブリックラスタ走査の順序になっている。これらのより小さいブロック(サブブロックとも呼ばれてもよい)は、一層小さいパーティションに更にパーティションされてもよい。これはまた、ツリーパーティション又は階層ツリーパーティションとも呼ばれ、例えば、ルートツリーレベル0(階層レベル0、深度0)におけるルートブロックは、再帰的にパーティションされ、例えば、次のより下のツリーレベルの2つ以上のブロック、例えば、ツリーレベル1(階層レベル1、深度1)におけるノードにパーティションされてもよく、これらのブロックは、例えば、終了基準が充足されたため、例えば、最大ツリー深度又は最小ブロックサイズに達したため、パーティションが終了するまで、再び、次のより下のツリーレベル、例えば、ツリーレベル2(階層レベル2、深度2)の2つ以上のブロックにパーティションされる、等でもよい。更にパーティションされないブロックはまた、ツリーのリーフブロック又はリーフノードとも呼ばれる。2つのパーティションへのパーティションを使用するツリーは、二分木(BT, binary-tree)と呼ばれ、3つのパーティションへのパーティションを使用するツリーは三分木(TT, ternary-tree)と呼ばれ、4つのパーティションへのパーティションを使用するツリーは四分木(QT, quad-tree)と呼ばれる。
【0156】
例えば、コーディングツリーユニット(CTU, coding tree unit)は、ルマサンプルのCTB、3つのサンプル配列を有するピクチャのクロマサンプルの2つの対応するCTB、又はモノクロピクチャ若しくは3つの別個の色平面及びサンプルをコーディングするために使用されるシンタックス構造を使用してコーディングされるピクチャのサンプルのCTBでもよく或いはこれを含んでもよい。対応して、コーディングツリーブロック(CTB, coding tree block)は、CTBへの成分の分割がパーティションであるような、何らかの値のNについてのサンプルのN×Nブロックでもよい。コーディングユニット(CU, coding unit)は、ルマサンプルのコーディングブロック、3つのサンプル配列を有するピクチャのクロマサンプルの2つの対応するコーディングブロック、又はモノクロピクチャ若しくは3つの別個の色平面及びサンプルをコーディングするために使用されるシンタックス構造を使用してコーディングされるピクチャのサンプルのコーディングブロックでもよく或いはこれを含んでもよい。対応して、コーディングブロック(CB, coding block)は、コーディングブロックへのCTBの分割がパーティションであるような、何らかの値のM及びNについてのサンプルのM×Nブロックでもよい。
【0157】
例えば、HEVCによる実施形態では、コーディングツリーユニット(CTU, coding tree unit)は、コーディングツリーとして示される四分木構造を使用することによりCUに分割されてもよい。インターピクチャ(時間)予測を使用してピクチャ領域をコーディングするか、イントラピクチャ(空間)予測を使用してピクチャ領域をコーディングするかの判断は、リーフCUレベルで行われる。各リーフCUは、PU分割タイプに従って、1つ、2つ又は4つのPUに更に分割できる。1つのPU内で、同じ予測プロセスが適用され、関連情報がPU毎にデコーダに送信される。PU分割タイプに基づいて予測プロセスを適用することにより残差ブロックを取得した後に、リーフCUは、CUについてのコーディングツリーと同様の他の四分木構造に従って、変換ユニット(TU, transform unit)にパーティションできる。
【0158】
例えば、バーサタイルビデオコーディング(VVC, Versatile Video Coding)と呼ばれる現在策定中の最新のビデオコーディング標準による実施形態では、二分割及び三分割セグメント化構造を使用する結合された四分木ネスト型マルチタイプツリーが、例えば、コーディングツリーユニットをパーティションするために使用される。コーディングツリーユニット内のコーディングツリー構造では、CUは正方形又は長方形形状のいずれかを有することができる。例えば、コーディングツリーユニット(CTU, coding tree unit)は、まず、四分木によりパーティションされる。次いで、四分木リーフノードは、マルチタイプツリー構造により更にパーティションできる。マルチタイプツリー構造には、4つの分割タイプ、すなわち、垂直二分割(SPLIT_BT_VER)、水平二分割(SPLIT_BT_HOR)、垂直三分割(SPLIT_TT_VER)及び水平三分割(SPLIT_TT_HOR)が存在する。マルチタイプツリーリーフノードは、コーディングユニット(CU, coding unit)と呼ばれ、CUが最大変換長にとって大きすぎない限り、このセグメント化は、更なるパーティションなしで予測及び変換処理に使用される。これは、ほとんどの場合、CU、PU及びTUがネスト型マルチタイプツリーのコーディングブロック構造を有する四分木において同じブロックサイズを有することを意味する。例外は、最大サポート変換長がCUの色成分の幅又は高さよりも小さいときに発生する。VVCは、ネスト型マルチタイプツリーのコーディングツリー構造を有する四分木におけるパーティション分割情報の独特のシグナリングメカニズムを策定している。当該シグナリングメカニズムでは、コーディングツリーユニット(CTU, coding tree unit)は四分木のルートとして扱われ、まず、四分木構造によりパーティションされる。次いで、各四分木リーフノード(それを許容するほど十分に大きいとき)は、マルチタイプツリー構造により更にパーティションされる。マルチタイプツリー構造では、第1のフラグ(mtt_split_cu_flag)は、ノードが更にパーティションされるか否かを示すためにシグナリングされ、ノードが更にパーティションされるとき、第2のフラグ(mtt_split_cu_vertical_flag)は、分割方向を示すためにシグナリングされ、次いで、第3のフラグ(mtt_split_cu_binary_flag)は、分割が二分割であるか三分割であるかを示すためにシグナリングされる。mtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagの値に基づいて、CUのマルチタイプツリー分割モード(MttSplitMode)は、所定のルール又はテーブルに基づいてデコーダにより導出できる。
図6に示すように、特定の設計、例えば、VVCハードウェアデコーダにおける64×64ルマブロック及び32×32クロマパイプライン設計では、ルマコーディングブロックの幅又は高さのいずれかが64よりも大きいとき、TT分割は禁止される。クロマコーディングブロックの幅又は高さのいずれかが32よりも大きいときも、TT分割は禁止される。パイプライン設計は、ピクチャを仮想パイプラインデータユニット(VPDU, Virtual pipeline data unit)に分割し、これらは、ピクチャ内の重複しないユニットとして定義される。ハードウェアデコーダでは、連続するVPDUが複数のパイプライン段により同時に処理される。VPDUサイズは、ほとんどのパイプライン段においてバッファサイズにほぼ比例するので、VPDUサイズを小さく保持することが重要である。ほとんどのハードウェアデコーダでは、VPDUサイズは最大変換ブロック(TB, transform block)サイズに設定できる。しかし、VVCでは、三分木(TT, ternary tree)及び二分木(BT, binary tree)パーティションはVPDUサイズの増加をもたらす可能性がある。
【0159】
さらに、ツリーノードブロックの一部が下側又は右側ピクチャ境界を超えるとき、ツリーノードブロックは、全てのコーディングされたCUの全てのサンプルがピクチャ境界内に位置するまで、強制的に分割される点に留意すべきである。
【0160】
一例として、イントラサブパーティション(ISP, Intra Sub-Partitions)ツールは、ブロックサイズに依存して、ルマイントラ予測ブロックを垂直又は水平に2つ又は4つのサブパーティションに分割してもよい。
【0161】
一例では、ビデオエンコーダ20のモード選択ユニット260は、ここに記載のパーティション技術のいずれかの組み合わせを実行するように構成されてもよい。
【0162】
上記のように、ビデオエンコーダ20は、(例えば、予め決定された)予測モードのセットから最良又は最適な予測モードを決定又は選択するように構成される。予測モードのセットは、例えば、イントラ予測モード及び/又はインター予測モードを含んでもよい。
【0163】
イントラ予測
イントラ予測モードのセットは、35個の異なるイントラ予測モード、例えば、DC(又は平均)モード及びプラナーモードのような非方向性モード、又は例えば、HEVCで定義されたような方向性モードを含んでもよく、或いは、67個の異なるイントラ予測モード、例えば、DC(又は平均)モード及びプラナーモードのような非方向性モード、又は例えば、VVCについて定義されたような方向性モードを含んでもよい。一例として、いくつかの従来の角度イントラ予測モードは、例えばVVCにおいて定義されたような非正方形ブロックのための広角イントラ予測モードに適応的に置き換えられる。他の例として、DC予測のための分割動作を回避するために、長辺のみが非正方形ブロックについての平均を計算するために使用される。そして、プラナーモードのイントラ予測の結果は、位置依存イントラ予測結合(PDPC, position dependent intra prediction combination)方法により更に修正されてもよい。
【0164】
イントラ予測ユニット254は、イントラ予測モードのセットのうち或るイントラ予測モードに従ってイントラ予測ブロック265を生成するために、同じ現在ピクチャの隣接ブロックの再構成されたサンプルを使用するように構成される。
【0165】
イントラ予測ユニット254(又は一般的にモード選択ユニット260)は、符号化ピクチャデータ21に含めるためにシンタックスエレメント226の形式で、イントラ予測パラメータ(又は一般的にブロックについて選択されたイントラ予測モードを示す情報)をエントロピー符号化ユニット270に出力するように更に構成され、それにより、例えば、ビデオデコーダ30は、復号のために予測パラメータを受信して使用してもよい。
【0166】
インター予測
インター予測モードのセット(又は可能なもの)は、利用可能な参照ピクチャ(すなわち、例えば、DBP230に記憶された、前の少なくとも部分的に復号されたピクチャ)及び他のインター予測パラメータ、例えば、最良の適合する参照ブロックを探索するために全体の参照ピクチャが使用されるか、参照ピクチャの部分のみ、例えば、現在ブロックの領域の周辺の探索ウィンドウ領域が使用されるか、及び/又は、例えば、ピクセル補間、例えばハーフ/セミペル、4分の1ペル及び/又は1/16ペル補間が適用されるか否かに依存する。
【0167】
上記の予測モードに加えて、スキップモード、直接モード及び/又は他のインター予測モードが適用されてもよい。
【0168】
例えば、拡張マージ予測では、このようなモードのマージ候補リストは、順に以下の5つのタイプの候補、すなわち、空間隣接CUからの空間MVP、同一位置のCUからの時間MVP、FIFOテーブルからの履歴ベースMVP、対の平均MVP及びゼロMVを含めることにより構成される。そして、マージモードのMVの精度を高めるために、バイラテラルマッチングベースのデコーダ側動きベクトル精緻化(DMVR, decoder-side motion vector refinement)が適用されてもよい。MVDを伴うマージモード(MMVD, Merge mode with MVD)は、動きベクトル差(MVD, motion vector difference)を伴うマージモードに由来する。MMVDモードがCUに使用されるか否かを指定するために、スキップフラグ及びマージフラグを送信した直後にMMVDフラグがシグナリングされる。そして、CUレベルの適応動きベクトル精度(AMVR, adaptive motion vector resolution)方式が適用されてもよい。AMVRは、CUのMVDが異なる精度でコーディングされることを可能にする。現在のCUについての予測モードに依存して、現在のCUのMVDが適応的に選択できる。CUがマージモードでコーディングされるとき、結合インター/イントラ予測(CIIP, combined inter/intra prediction)モードが現在のCUに適用されてもよい。CIIP予測を取得するために、インター及びイントラ予測信号の加重平均が実行される。アフィン動き補償予測では、ブロックのアフィン動き場は、2つの制御点(4パラメータ)又は3つの制御点動きベクトル(6パラメータ)の動き情報により記述される。サブブロックベースの時間動きベクトル予測(SbTMVP, sub-block-based temporal motion vector prediction)は、HEVCにおける時間動きベクトル予測(TMVP, temporal motion vector prediction)と同様であるが、現在のCU内のサブCUの動きベクトルを予測する。以前はBIOと呼ばれていた双方向オプティカルフロー(BDOF, bi-directional optical flow)は、特に乗算の数及び乗算器のサイズに関して非常に少ない計算量を必要とするより簡単なバージョンである。三角パーティションモードでは、このようなモードで、CUは、対角分割又は非対角分割のいずれかを使用して2つの三角形の形状のパーティションに均等に分割される。その上、双方向予測モードは、2つの予測信号の加重平均を可能にするために、単純平均を越えて拡張される。
【0169】
インター予測ユニット244は、動き推定(ME, motion estimation)ユニット及び動き補償(MC, motion compensation)ユニット(双方とも
図2に図示せず)を含んでもよい。動き推定ユニットは、動き推定のために、ピクチャブロック203(現在ピクチャ17の現在ブロック203)及び復号ピクチャ231、又は少なくとも1つ若しくは複数の前に再構成されたブロック、例えば、1つ若しくは複数の他の/異なる前の復号ピクチャ231の再構成されたブロックを受信又は取得するように構成されてもよい。例えば、ビデオシーケンスは、現在ピクチャ及び前の復号ピクチャ231を含んでもよく、或いは言い換えると、現在ピクチャ及び前の復号ピクチャ231は、ビデオシーケンスを形成するピクチャのシーケンスの一部でもよく或いはこれを形成してもよい。
【0170】
エンコーダ20は、例えば、複数の他のピクチャの同じ或いは異なるピクチャの複数の参照ブロックから参照ブロックを選択し、参照ピクチャ(又は参照ピクチャインデックス)及び/又は参照ブロックの位置(x,y座標)と現在ブロックの位置との間のオフセット(空間オフセット)を、インター予測パラメータとして動き推定ユニットに提供するように構成されてもよい。このオフセットはまた、動きベクトル(MV, motion vector)とも呼ばれる。
【0171】
動き補償ユニットは、インター予測パラメータを取得し、例えば、受信し、インター予測パラメータに基づいて或いはこれを使用してインター予測を実行して、インター予測ブロック265を取得するように構成される。動き補償ユニットにより実行される動き補償は、動き推定により決定された動き/ブロックベクトルに基づいて、予測ブロックをフェッチ又は生成し、場合によってはサブピクセル精度への補間を実行することを含んでもよい。補間フィルタリングは、既知のピクセルサンプルから更なるピクセルサンプルを生成してもよく、したがって、ピクチャブロックをコーディングするために使用され得る候補予測ブロックの数を潜在的に増加させる。現在ピクチャブロックのPUの動きベクトルを受信すると、動き補償ユニットは、参照ピクチャリストのうち1つの中で動きベクトルが指す予測ブロックを見つけてもよい。
【0172】
動き補償ユニットはまた、ビデオスライスのピクチャブロックを復号する際にビデオデコーダ30による使用のために、ブロック及びビデオスライスに関連するシンタックスエレメントを生成してもよい。スライス及びそれぞれのシンタックスエレメントに加えて或いはその代替として、タイルグループ及び/又はタイル及びそれぞれのシンタックスエレメントが生成又は使用されてもよい。
【0173】
エントロピーコーディング
エントロピー符号化ユニット270は、量子化された係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ及び/又は他のシンタックスエレメントに対して、例えば、エントロピー符号化アルゴリズム又は方式(例えば、可変長コーディング(VLC, variable length coding)方式、コンテキスト適応型VLC方式(CAVLC, context adaptive VLC, scheme)、算術コーディング方式、二値化、コンテキスト適応型バイナリ算術コーディング(CABAC, context adaptive binary arithmetic coding)、シンタックスベースのコンテキスト適応型バイナリ算術コーディング(SBAC, syntax-based context-adaptive binary arithmetic coding)、確率区間区分エントロピー(PIPE, probability interval partitioning entropy)コーディング又は他のエントロピー符号化方法若しくは技術)を適用するか或いは迂回して(非圧縮)、例えば、符号化ビットストリーム21の形式で出力272を介して出力できる符号化ピクチャデータ21を取得するように構成され、それにより、例えば、ビデオデコーダ30は、復号のためにパラメータを受信して使用してもよい。符号化ビットストリーム21は、ビデオデコーダ39に送信されてもよく、或いは、ビデオデコーダ30による後の送信又は取り出しのためにメモリに記憶されてもよい。
【0174】
ビデオエンコーダ20の他の構造的変形は、ビデオストリームを符号化するために使用できる。例えば、非変換ベースのエンコーダ20は、特定のブロック又はフレームについて、変換処理ユニット206なしに、残差信号を直接量子化できる。他の実現方式では、エンコーダ20は、単一のユニットに結合された量子化ユニット208及び逆量子化ユニット210を有することができる。
【0175】
デコーダ及び復号方法
図3は、本願の技術を実現するように構成されたビデオデコーダ30の例を示す。ビデオデコーダ30は、復号ピクチャ331を取得するために、例えば、エンコーダ20により符号化された符号化ピクチャデータ21(例えば、符号化ビットストリーム21)を受信するように構成される。符号化ピクチャデータ又はビットストリームは、符号化ピクチャデータを復号するための情報、例えば、符号化ビデオスライス(及び/又はタイルグループ又はタイル)のピクチャブロック及び関連するシンタックスエレメントを表すデータを含む。
【0176】
図3の例では、デコーダ30は、エントロピー復号ユニット304と、逆量子化ユニット310と、逆変換処理ユニット312と、再構成ユニット314(例えば、合計器314)と、ループフィルタ320と、復号ピクチャバッファ(DBP, decoded picture buffer)330と、モード適用ユニット360と、インター予測ユニット344と、イントラ予測ユニット354とを含む。インター予測ユニット344は、動き補償ユニットでもよく或いはこれを含んでもよい。ビデオデコーダ30は、いくつかの例では、
図2からビデオエンコーダ100に関して説明した符号化経路と一般的に逆の復号経路を実行してもよい。
【0177】
エンコーダ20に関して説明したように、逆量子化ユニット210、逆変換処理ユニット212、再構成ユニット214、ループフィルタ220、復号ピクチャバッファ(DPB, decoded picture buffer)230、インター予測ユニット344及びイントラ予測ユニット354はまた、ビデオエンコーダ20の「内蔵デコーダ」を形成するとも呼ばれてもよい。したがって、逆量子化ユニット310は逆量子化ユニット110と機能的に同一でもよく、逆変換処理ユニット312は逆変換処理ユニット212と機能的に同一でもよく、再構成ユニット314は再構成ユニット214と機能的に同一でもよく、ループフィルタ320はループフィルタ220と機能的に同一でもよく、復号ピクチャバッファ330は復号ピクチャバッファ230と機能的に同一でもよい。したがって、ビデオ20エンコーダのそれぞれのユニット及び機能について提供された説明は、対応して、ビデオデコーダ30のそれぞれのユニット及び機能に適用する。
【0178】
エントロピー復号
エントロピー復号ユニット304は、ビットストリーム21(又は一般的には符号化ピクチャデータ21)をパースし、例えば、符号化ピクチャデータ21に対してエントロピー復号を実行して、例えば、量子化された係数309及び/又は復号されたコーディングパラメータ(
図3に図示せず)、例えば、インター予測パラメータ(例えば、参照ピクチャインデックス及び動きベクトル)、イントラ予測パラメータ(例えば、イントラ予測モード又はインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ及び/又は他のシンタックスエレメントのうちいずれか又は全てを取得するように構成される。エントロピー復号ユニット304は、エンコーダ20のエントロピー符号化ユニット270に関して説明したような符号化方式に対応する復号アルゴリズム又は方式を適用するように構成されてもよい。エントロピー復号ユニット304は、インター予測パラメータ、イントラ予測パラメータ及び/又は他のシンタックスエレメントをモード適用ユニット360に提供し、他のパラメータをデコーダ30の他のユニットに提供するように更に構成されてもよい。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルのシンタックスエレメントを受信してもよい。スライス及びそれぞれのシンタックスエレメントに加えて或いはその代替として、タイルグループ及び/又はタイル及びそれぞれのシンタックスエレメントが受信及び/又は使用されてもよい。
【0179】
逆量子化
逆量子化ユニット310は、符号化ピクチャデータ21から(例えば、エントロピー復号ユニット304により例えばパース及び/又は復号することにより)量子化パラメータ(QP, quantization parameter)(又は一般的に逆量子化に関する情報)及び量子化された係数を受信し、量子化パラメータに基づいて、復号済みの量子化された係数309に対して逆量子化を適用して、変換係数311とも呼ばれてもよい反量子化された係数311を取得するように構成されてもよい。逆量子化プロセスは、量子化の程度、及び同様に適用されるべき逆量子化の程度を決定するために、ビデオスライス(又はタイル若しくはタイルグループ)内の各ビデオブロックについてビデオエンコーダ20により決定された量子化パラメータの使用を含んでもよい。
【0180】
逆変換
逆変換処理ユニット312は、変換係数311とも呼ばれる反量子化された係数311を受信し、サンプルドメインにおいて再構成された残差ブロック213を取得するために反量子化された係数311に変換を適用するように構成されてもよい。再構成された残差ブロック213はまた、変換ブロック313とも呼ばれてもよい。変換は、逆変換、例えば、逆DCT、逆DST、逆整数変換又は概念的に同様の逆変換プロセスでもよい。逆変換処理ユニット312は、符号化ピクチャデータ21から(例えば、エントロピー復号ユニット304により例えばパース及び/又は復号することにより)変換パラメータ又は対応する情報を受信して、反量子化された係数311に適用されるべき変換を決定するように更に構成されてもよい。
【0181】
再構成
再構成ユニット314(例えば、加算器又は合計器314)は、再構成された残差ブロック313を予測ブロック365に加算して、例えば、再構成された残差ブロック313のサンプル値と予測ブロック365のサンプル値とを加算することにより、サンプルドメインにおける再構成されたブロック315を取得するように構成されてもよい。
【0182】
フィルタリング
(コーディングループ内又はコーディングループの後のいずれかの)ループフィルタユニット320は、再構成されたブロック315をフィルタリングして、フィルタリングされたブロック321を取得するように、例えば、ピクセル遷移を円滑化するように或いはビデオ品質を改善するように構成される。ループフィルタユニット320は、デブロッキングフィルタ、サンプル適応オフセット(SAO, sample-adaptive offset)フィルタ又は1つ以上の他のフィルタ、例えば、適応ループフィルタ(ALF, adaptive loop filter)、ノイズ抑制フィルタ(NSF, noise suppression filter)又はこれらのいずれかの組み合わせのような1つ以上のループフィルタを含んでもよい。一例では、ループフィルタユニット220は、デブロッキングフィルタ、SAOフィルタ及びALFフィルタを含んでもよい。フィルタリングプロセスの順序は、デブロッキングフィルタ、SAO及びALFでもよい。他の例では、クロマスケーリングを伴うルママッピング(LMCS, luma mapping with chroma scaling)(すなわち、適応インループリシェーパ)と呼ばれるプロセスが追加される。このプロセスはデブロッキングの前に実行される。他の例では、デブロッキングフィルタプロセスはまた、内部サブブロックエッジ、例えば、アフィンサブブロックエッジ、ATMVPサブブロックエッジ、サブブロック変換(SBT, sub-block transform)エッジ及びイントラサブパーティション(ISP, intra sub-partition)エッジに適用されてもよい。ループフィルタユニット320はインループフィルタであるとして
図3に示されるが、他の構成では、ループフィルタユニット320はポストループフィルタとして実現されてもよい。
【0183】
復号ピクチャバッファ
ピクチャの復号ビデオブロック321は、次いで、他のピクチャのための後の動き補償のための参照ピクチャとして及び/又はそれぞれの表示の出力のために復号ピクチャ331を記憶する復号ピクチャバッファ330に記憶される。
【0184】
デコーダ30は、ユーザへの提示又は閲覧のために、例えば、出力332を介して復号ピクチャ331を出力するように構成される。
【0185】
予測
インター予測ユニット344は、インター予測ユニット244(特に、動き補償ユニット)と同一でもよく、イントラ予測ユニット354は、インター予測ユニット254と機能的に同一でもよく、パーティション及び/又は予測パラメータ又は符号化ピクチャデータ21から(例えば、エントロピー復号ユニット304により例えばパース及び/又は復号することにより)受信したそれぞれの情報に基づいて、分割又はパーティション判断及び予測を実行する。モード適用ユニット360は、再構成ピクチャ、ブロック又はそれぞれの(フィルタリングされた或いはフィルタリングされていない)サンプルに基づいて、ブロック毎に予測(イントラ又はインター予測)を実行して、予測ブロック365を取得するように構成されてもよい。
【0186】
ビデオスライスがイントラコーディングされた(I, intra-coded)スライスとしてコーディングされるとき、モード適用ユニット360のイントラ予測ユニット354は、シグナリングされたイントラ予測モード及び現在ピクチャの前に復号されたブロックからのデータに基づいて、現在ビデオスライスのピクチャブロックについて予測ブロック365を生成するように構成される。ビデオピクチャがインターコーディングされた(すなわち、B又はP)スライスとしてコーディングされるとき、モード適用ユニット360のインター予測ユニット344(例えば、動き補償ユニット)は、エントロピー復号ユニット304から受信した動きベクトル及び他のシンタックスエレメントに基づいて、現在ビデオスライスのビデオブロックについて予測ブロック365を生成するように構成される。インター予測では、予測ブロックは、参照ピクチャリストのうち1つの中の参照ピクチャのうち1つから生成されてもよい。ビデオデコーダ30は、DPB330に記憶された参照ピクチャに基づいて、デフォルト構成技術を使用して、参照フレームリスト、リスト0及びリスト1を構成してもよい。同じ又は同様のものが、スライス(例えば、ビデオスライス)に加えて或いはその代替として、タイルグループ(例えば、ビデオタイルグループ)及び/又はタイル(例えば、ビデオタイル)を使用する実施形態に或いはそれにより適用されてもよく、例えば、ビデオは、I、P又はBタイルグループ及び/又はタイルを使用してコーディングされてもよい。
【0187】
モード適用ユニット360は、動きベクトル又は関連情報及び他のシンタックスエレメントをパースすることにより、現在ビデオスライスのビデオブロックについて予測情報を決定するように構成され、復号されている現在ビデオブロックについて予測ブロックを生成するために予測情報を使用する。例えば、モード適用ユニット360は、受信したシンタックスエレメントのうちいくつかを使用して、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(例えば、イントラ又はインター予測)、インター予測スライスタイプ(例えば、Bスライス、Pスライス又はGPBスライス)、スライスの参照ピクチャリストのうち1つ以上についての構成情報、スライスの各インター符号化ビデオブロックの動きベクトル、スライスの各インターコーディングされたビデオブロックについてのインター予測状態、及び現在ビデオスライス内のビデオブロックを復号するための他の情報を決定する。同じ又は同様のことが、スライス(例えば、ビデオスライス)に加えて或いはその代替として、タイルグループ(例えば、ビデオタイルグループ)及び/又はタイル(例えば、ビデオタイル)を使用する実施形態に或いはそれにより適用されてもよく、例えば、ビデオは、I、P又はBタイルグループ及び/又はタイルを使用してコーディングされてもよい。
【0188】
図3に示すようなビデオデコーダ30の実施形態は、スライス(ビデオスライスとも呼ばれる)を使用することによりピクチャをパーティション及び/又は復号するように構成されてもよく、ピクチャは、(典型的には重複しない)1つ以上のスライスにパーティションされてもよく或いはこれを使用して復号されてもよく、各スライスは、1つ以上のブロック(例えば、CTU)又は1つ以上のブロックのグループ(例えば、タイル(H.265/HEVC及びVVC)又はブリック(VVC))を含んでもよい。
【0189】
図3に示すようなビデオデコーダ30の実施形態は、スライス/タイルグループ(ビデオタイルグループとも呼ばれる)及び/又はタイル(ビデオタイルとも呼ばれる)を使用することによりピクチャをパーティション及び/又は復号するように構成されてもよく、ピクチャは、(典型的には重複しない)1つ以上のスライス/タイルグループにパーティションされてもよく或いはこれを使用して復号されてもよく、各スライス/タイルグループは、例えば、1つ以上のブロック(例えば、CTU)又は1つ以上のタイルを含んでもよく、各タイルは、例えば長方形形状でもよく、1つ以上のブロック(例えば、CTU)、例えば完全な或いは部分的なブロックを含んでもよい。
【0190】
ビデオデコーダ30の他の変形は、符号化ピクチャデータ21を復号するために使用できる。例えば、デコーダ30は、ループフィルタユニット320なしに、出力ビデオストリームを生成できる。例えば、非変換ベースのデコーダ30は、特定のブロック又はフレームについて、逆変換処理ユニット312なしに、残差信号を直接逆量子化できる。他の実現方式では、ビデオデコーダ30は、単一のユニットに結合された逆量子化ユニット310及び逆変換処理ユニット312を有することができる。
【0191】
エンコーダ20及びデコーダ30において、現在のステップの処理結果は更に処理され、次いで次のステップに出力されてもよいことが理解されるべきである。例えば、補間フィルタリング、動きベクトル導出又はループフィルタリングの後に、クリップ又はシフトのような更なる動作が、補間フィルタリング、動きベクトル導出又はループフィルタリングの処理結果に対して実行されてもよい。
【0192】
更なる動作は、現在ブロックの導出された動きベクトル(アフィンモードの制御点動きベクトル、アフィン、プラナー、ATMVPモードにおけるサブブロック動きベクトル、時間動きベクトル等を含むが、これらに限定されない)に適用されてもよい点に留意すべきである。例えば、動きベクトルの値は、その表現ビットに従って所定の範囲に制約される。動きベクトルの表現ビットがbitDepthである場合、範囲は-2^(bitDepth-1)~2^(bitDepth-1)-1であり、「^」は累乗を意味する。例えば、bitDepthが16に等しく設定された場合、範囲は-32768~32767であり、bitDepthが18に等しく設定された場合、範囲は-131072~131071である。例えば、導出された動きベクトルの値(例えば、1つの8×8ブロック内の4つの4×4サブブロックのMV)は、4つの4×4サブブロックのMVの整数部分の間の最大差が、1ピクセルよりも多くない等のNピクセルよりも多くないように制約される。ここで、bitDepthに従って動きベクトルを制約するための2つの方法を提供する。
【0193】
図4は、本開示の実施形態によるビデオコーディングデバイス400の概略図である。ビデオコーディングデバイス400は、ここに説明するような開示の実施形態を実現するのに適する。実施形態では、ビデオコーディングデバイス400は、
図1Aのビデオデコーダ30のようなデコーダ又は
図1Aのビデオエンコーダ20のようなエンコーダでもよい。
【0194】
ビデオコーディングデバイス400は、データを受信するための入口ポート410(又は入力ポート410)及び受信機ユニット(Rx)420と、データを処理するためのプロセッサ、論理ユニット又は中央処理装置(CPU, central processing unit)430と、データを送信するための送信機ユニット(Tx)440及び出口ポート450(又は出力ポート450)と、データを記憶するためのメモリ460とを含む。ビデオコーディングデバイス400はまた、光若しくは電気信号の出口又は入口のための、入口ポート410、受信機ユニット420、送信機ユニット440及び出口ポート450に結合された光電気(OE, optical-to-electrical)コンポーネント及び電気光(EO, electrical-to-optical)コンポーネントを含んでもよい。
【0195】
プロセッサ430は、ハードウェア及びソフトウェアにより実現される。プロセッサ430は、1つ以上のCPUチップ、コア(例えば、マルチコアプロセッサ)、FPGA、ASIC及びDSPとして実現されてもよい。プロセッサ430は、入口ポート410、受信機ユニット420、送信機ユニット440、出口ポート450及びメモリ460と通信する。プロセッサ430は、コーディングモジュール470を含む。コーディングモジュール470は、上記に記載する開示の実施形態を実現する。例えば、コーディングモジュール470は、様々なコーディング動作を実現、処理、準備又は提供する。したがって、コーディングモジュール470に含まれるものは、ビデオコーディングデバイス400の機能に実質的な改善を提供し、異なる状態へのビデオコーディングデバイス400の変換をもたらす。代替として、コーディングモジュール470は、メモリ460に記憶されてプロセッサ430により実行される命令として実現される。
【0196】
メモリ460は、1つ以上のディスク、テープドライブ及びソリッドステートドライブを含んでもよく、プログラムが実行のために選択されるときこのようなプログラムを記憶するため且つプログラムの実行中に読み取られる命令及びデータを記憶するためのオーバフローデータ記憶デバイスとして使用されてもよい。メモリ460は、例えば、揮発性及び/又は不揮発性でもよく、読み取り専用メモリ(ROM, read-only memory)、ランダムアクセスメモリ(RAM, random access memory)、三値連想メモリ(TCAM, ternary content-addressable memory)及び/又はスタティックランダムアクセスメモリ(SRAM, static random-access memory)でもよい。
【0197】
図5は、例示的な実施形態による
図1からのソースデバイス12及び宛先デバイス14の一方又は双方として使用されてもよい装置500の簡略ブロック図である。
【0198】
装置500内のプロセッサ502は、中央処理装置とすることができる。代替として、プロセッサ502は、現在存在するか或いは今後開発される、情報を操作又は処理できるいずれかの他のタイプのデバイス又は複数のデバイスとすることができる。開示の実現方式は図示のように単一のプロセッサ、例えばプロセッサ502で実施できるが、速度及び効率における利点は、1つよりも多くのプロセッサを使用して達成できる。
【0199】
装置500内のメモリ504は、実現方式では、読み取り専用メモリ(ROM, read only memory)デバイス又はランダムアクセスメモリ(RAM, random access memory)デバイスとすることができる。いずれかの他の適切なタイプの記憶デバイスが、メモリ504として使用できる。メモリ504は、バス512を使用してプロセッサ502によりアクセスされるコード及びデータ506を含むことができる。メモリ504は、オペレーティングシステム508及びアプリケーションプログラム510を更に含むことができ、アプリケーションプログラム510は、プロセッサ502がここに記載の方法を実行することを可能にする少なくとも1つのプログラムを含む。例えば、アプリケーションプログラム510は、ここに記載の方法を実行するビデオコーディングアプリケーションを更に含むアプリケーション1~Nを含むことができる。
【0200】
装置500はまた、ディスプレイ518のような1つ以上の出力デバイスを含むことができる。ディスプレイ518は、一例では、タッチ入力を感知するよう動作可能なタッチセンシティブ素子とディスプレイを結合したタッチセンシティブディスプレイでもよい。ディスプレイ518は、バス512を介してプロセッサ502に結合できる。
【0201】
ここでは単一のバスとして示されるが、装置500のバス512は複数のバスで構成できる。さらに、2次ストレージ514は、装置500の他のコンポーネントに直接結合でき、或いは、ネットワークを介してアクセスでき、メモリカードのような単一の統合ユニット又は複数のメモリカードのような複数のユニットを含むことができる。したがって、装置500は、広範な構成で実現できる。
【0202】
スケーラブルコーディング
スケーラブルコーディングは、品質スケーラブル(PSNRスケーラブル)、空間スケーラブル等を含む。例えば、
図6に示すように、シーケンスは低空間分解能バージョンにダウンサンプリングできる。低空間分解能バージョン及び元の空間分解能(高空間分解能)バージョンの双方が符号化される。そして、一般的に、低空間分解能が最初にコーディングされ、これは、後にコーディングされる高空間分解能のための参照に使用される。
【0203】
レイヤの情報(数、依存関係、出力)を記述するために、以下のように定義されたVPS(Video Parameter Set)が存在する。
【表1】
【0204】
VPS RBSPは、参照される前に復号プロセスに利用可能になり、0に等しいTemporalIdを有する少なくとも1つのAUに含まれるか、或いは、外部手段を通じて提供されるものとする。
【0205】
CVS内のvps_video_parameter_set_idの特定の値を有する全てのVPS NALユニットは、同じ内容を有するものとする。
【0206】
vps_video_parameter_set_idは、他のシンタックスエレメントによる参照のためのVPSの識別子を提供する。vps_video_parameter_set_idの値は0よりも大きいものとする。
【0207】
vps_max_layers_minus1に1を加えたものは、VPSを参照する各CVS内の最大許容レイヤ数を指定する。
【0208】
vps_max_sublayers_minus1に1を加えたものは、VPSを参照する各CVS内のレイヤに存在し得る時間サブレイヤの最大数を指定する。vps_max_sublayers_minus1の値は0以上6以下の範囲にあるものとする。
【0209】
1に等しいvps_all_layers_same_num_sublayers_flagは、VPSを参照する各CVS内の全てのレイヤについて、時間サブレイヤ数が同じであることを指定する。0に等しいvps_all_layers_same_num_sublayers_flagは、VPSを参照する各CVS内のレイヤが同じ数の時間サブレイヤを有してもよく或いは有さなくてもよいことを指定する。存在しないとき、vps_all_layers_same_num_sublayers_flagの値は1に等しいと推定される。
【0210】
1に等しいvps_all_independent_layers_flagは、CVS内の全てのレイヤがレイヤ間予測を使用せずに独立にコーディングされることを指定する。0に等しいvps_all_independent_layers_flagは、CVS内のレイヤのうち1つ以上がレイヤ間予測を使用してもよいことを指定する。存在しないとき、vps_all_independent_layers_flagの値は1に等しいと推定される。
【0211】
vps_layer_id[i]は、第iのレイヤのnuh_layer_id値を指定する。m及びnのいずれか2つの非負の整数値について、mがn未満であるとき、vps_layer_id[m]の値はvps_layer_id[n]未満であるものとする。
【0212】
1に等しいvps_independent_layer_flag[i]は、インデックスiを有するレイヤがレイヤ間予測を使用しないことを指定する。0に等しいvps_independent_layer_flag[i]は、インデックスiを有するレイヤがレイヤ間予測を使用してもよく、0以上i-1の範囲内のjについて、シンタックスエレメントvps_direct_ref_layer_flag[i][j]がVPSに存在することを指定する。存在しないとき、vps_independent_layer_flag[i]の値は1に等しいと推定される。
【0213】
0に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを指定する。1に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。0以上vps_max_layers_minus1以下の範囲内のi及びjについて、vps_direct_ref_layer_flag[i][j]が存在しないとき、これは0に等しいと推定される。vps_independent_layer_flag[i]が0に等しいとき、vps_direct_ref_layer_flag[i][j]が1に等しいような、0以上i-1以下の範囲内のjの少なくとも1つの値が存在するものとする。
【0214】
変数NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]及びLayerUsedAsRefLayerFlag[j]は以下のように導出される。
【数1】
【0215】
vps_layer_id[i]に等しいnuh_layer_idを有するレイヤのレイヤインデックスを指定する変数GeneralLayerIdx[i]は以下のように導出される。
【数2】
【0216】
1に等しいeach_layer_is_an_ols_flag equalは、各OLSが1つのレイヤのみを含み、VPSを参照するCVS内の各レイヤ自体がOLSであり、単一の含まれるレイヤが出力レイヤのみであることを指定する。0に等しいeach_layer_is_an_ols_flagは、OLSが1つよりも多くのレイヤを含んでもよいことである。vps_max_layers_minus1が0に等しい場合、each_layer_is_an_ols_flagの値は1に等しいと推定される。そうでなく、vps_all_independent_layers_flagが0に等しいとき、each_layer_is_an_ols_flagの値は0に等しいと推定される。
【0217】
0に等しいols_mode_idcは、VPSにより指定されたOLSの総数がvps_max_layers_minus1+1に等しく、第iのOLSが0以上i以下のレイヤインデックスを有するレイヤを含み、各OLSについてOLS内の最高のレイヤのみが出力されることを指定する。
【0218】
1に等しいols_mode_idcは、VPSにより指定されたOLSの総数がvps_max_layers_minus1+1に等しく、第iのOLSが0以上i以下のレイヤインデックスを有するレイヤを含み、各OLSについてOLS内の全てのレイヤが出力されることを指定する。
【0219】
2に等しいols_mode_idcは、VPSにより指定されたOLSの総数が明示的にシグナリングされ、各OLSについて出力レイヤが明示的にシグナリングされ、他のレイヤがOLSの出力レイヤの直接又は間接参照レイヤであるレイヤであることを指定する。
【0220】
ols_mode_idcの値は0以上2以下の範囲にあるものとする。ols_mode_idcの値3は、ITU-T|ISO/IECによる将来の使用のために確保される。
【0221】
vps_all_independent_layers_flagが1に等しく、each_layer_is_an_ols_flagが0に等しいとき、ols_mode_idcの値は2に等しいと推定される。
【0222】
num_output_layer_sets_minus1に1を加えたものは、ols_mode_idcが2に等しいとき、VPSにより指定されるOLSの総数を指定する。
【0223】
VPSにより指定されたOLSの総数を指定する変数TotalNumOlssは以下のように導出される。
【数3】
【0224】
1に等しいols_output_layer_flag[i][j]は、ols_mode_idcが2に等しいとき、vps_layer_id[j]に等しいnuh_layer_idを有するレイヤが第iのOLSの出力レイヤであることを指定する。0に等しいols_output_layer_flag[i][j]は、ols_mode_idcが2に等しいとき、vps_layer_id[j]に等しいnuh_layer_idを有するレイヤが第iのOLSの出力レイヤでないことを指定する。
【0225】
第iのOLS内の出力レイヤ数を指定する変数NumOutputLayersInOls[i]、及び第iのOLS内の第jの出力レイヤのnuh_layer_id値を指定する変数OutputLayerIdInOls[i][j]は以下のように導出される。
【数4】
【0226】
各OLSについて、出力レイヤである少なくとも1つのレイヤが存在するものとする。言い換えると、0以上TotalNumOlss-1以下の範囲内のiのいずれかの値について、NumOutputLayersInOls[i]の値は1以上であるものとする。
【0227】
第iのOLS内のレイヤ数を指定する変数NumLayersInOls[i]、及び第iのOLS内の第jのレイヤのnuh_layer_id値を指定する変数LayerIdInOls[i][j]は以下のように導出される。
【数5】
注1-第0のOLSは最下位レイヤ(すなわち、vps_layer_id[0]に等しいnuh_layer_idを有するレイヤ)のみを含み、第0のOLSについて、含まれるレイヤのみが出力される。
【0228】
LayerIdInOls[i][j]に等しいnuh_layer_idを有するレイヤのOLSレイヤインデックスを指定する変数OlsLayeIdx[i][j]は以下のように導出される。
【数6】
【0229】
各OLS内の最下位レイヤは独立レイヤであるものとする。言い換えると、0以上TotalNumOlss-1以下の範囲内の各iについて、vps_independent_layer_flag[GeneralLayerIdx[LayerIdInOls[i][0]]]の値は1に等しいものとする。
【0230】
各レイヤは、VPSにより指定された少なくとも1つのOLSに含まれるものとする。言い換えると、LayerIdInOls[i][j]の値がnuhLayerIdに等しくなるように、0以上vps_max_layers_minus1以下の範囲内のkについてのvps_layer_id[k]の1つに等しいnuh_layer_idの特定の値nuhLayerIdを有する各レイヤについて、i及びjの値の少なくとも1つの対が存在するものとし、iは0以上TotalNumOlss-1以下の範囲にあり、jはNumLayersInOls[i]-1以下の範囲にある。
【0231】
vps_num_ptlsは、VPS内のprofile_tier_level()シンタックス構造の数を指定する。
【0232】
1に等しいpt_present_flag[i]は、プロファイル、層及び一般制約情報がVPS内の第iのprofile_tier_level()シンタックス構造に存在することを指定する。0に等しいpt_present_flag[i]は、プロファイル、層及び一般制約情報がVPS内の第iのprofile_tier_level()シンタックス構造に存在しないことを指定する。pt_present_flag[0]の値は1に等しいと推定される。pt_present_flag[i]が0に等しいとき、VPS内の第iのprofile_tier_level()シンタックス構造についてのプロファイル、層及び一般制約情報は、VPS内の第(i-1)のprofile_tier_level()シンタックス構造についてのものと同じであると推定される。
【0233】
ptl_max_temporal_id[i]は、レベル情報がVPS内の第iのprofile_tier_level()シンタックス構造に存在する、最高のサブレイヤ表現のTemporalIdを指定する。ptl_max_temporal_id[i]の値は0以上vps_max_sublayers_minus1以下の範囲にあるものとする。vps_max_sublayers_minus1が0に等しいとき、ptl_max_temporal_id[i]の値は0に等しいと推定される。vps_max_sublayers_minus1が0よりも大きく、vps_all_layers_same_num_sublayers_flagが1に等しいとき、ptl_max_temporal_id[i]の値はvps_max_sublayers_minus1に等しいと推定される。
【0234】
vps_ptl_byte_alignment_zero_bitは0に等しいものとする。
【0235】
ols_ptl_idx[i]は、numLayersInOls[i]が1よりも大きいとき、第iのOLSに適用するprofile_tier_level()シンタックス構造の、VPS内のprofile_tier_level()シンタックス構造のリストへのインデックスを指定する。存在するとき、ols_ptl_idx[i]の値は0以上vps_num_ptls-1以下の範囲にあるものとする。
【0236】
NumLayersInOls[i]が1に等しいとき、第iのOLSに適用するprofile_tier_level()シンタックス構造は、第iのOLS内のレイヤにより参照されるSPSに存在する。
【0237】
vps_num_dpb_paramsは、VPS内のdpb_parameters() シンタックス構造の数を指定する。vps_num_dpb_paramsの値は0以上16以下の範囲にあるものとする。存在しないとき、vps_num_dpb_paramsの値は0に等しいと推定される。
【0238】
1に等しいsame_dpb_size_output_or_nonoutput_flagは、layer_nonoutput_dpb_params_idx[i]シンタックスエレメントがVPSに存在しないことを指定する。0に等しいsame_dpb_size_output_or_nonoutput_flagは、layer_nonoutput_dpb_params_idx[i]シンタックスエレメントがVPSに存在してもよく或いは存在しなくてもよいことを指定する。
【0239】
vps_sublayer_dpb_params_present_flagは、VPS内のdpb_parameters()シンタックス構造内のmax_dec_pic_buffering_minus1[]、max_num_reorder_pics[]及びmax_latency_increase_plus1[]シンタックスエレメントの存在を制御するために使用される。存在しないとき、vps_sub_dpb_params_info_present_flagは0に等しいと推定される。
【0240】
1に等しいdpb_size_only_flag[i]は、max_num_reorder_pics[]及びmax_latency_increase_plus1[]シンタックスエレメントがVPS内の第iのdpb_parameters()シンタックス構造に存在しないことを指定する。0に等しいdpb_size_only_flag[i]は、max_num_reorder_pics[]及びmax_latency_increase_plus1[]シンタックスエレメントがVPS内の第iのdpb_parameters()シンタックス構造に存在してもよいことを指定する。
【0241】
dpb_max_temporal_id[i]は、DPBパラメータがVPS内の第iのdpb_parameters()シンタックス構造に存在し得る、最高のサブレイヤ表現のTemporalIdを指定する。dpb_max_temporal_id[i]の値は0以上vps_max_sublayers_minus1以下の範囲にあるものとする。vps_max_sublayers_minus1が0に等しいとき、dpb_max_temporal_id[i]の値は0に等しいと推定される。vps_max_sublayers_minus1が0よりも大きく、vps_all_layers_same_num_sublayers_flagが1に等しいとき、dpb_max_temporal_id[i]の値はvps_max_sublayers_minus1に等しいと推定される。
【0242】
layer_output_dpb_params_idx[i]は、OLS内の出力レイヤであるとき、第i。のレイヤに適用するdpb_parameters()シンタックス構造の、VPS内のdpb_parameters()シンタックス構造のリストへのインデックスを指定する。存在するとき、layer_output_dpb_params_idx[i]の値は0以上vps_num_dpb_params-1以下の範囲にあるものとする。
【0243】
vps_independent_layer_flag[i]が1に等しい場合、出力レイヤであるとき、第iのレイヤに適用するdpb_parameters()シンタックス構造は、レイヤにより参照されるSPSに存在するdpb_parameters()シンタックス構造である。
【0244】
そうでない場合(vps_independent_layer_flag[i]が0に等しい場合)、以下が当てはまる。
-vps_num_dpb_paramsが1に等しいとき、layer_output_dpb_params_idx[i]の値は0に等しいと推定される。
-layer_output_dpb_params_idx[i]の値が、dpb_size_only_flag[layer_output_dpb_params_idx[i]]が0に等しくなるようなものとすることが、ビットストリーム適合性の要件である。
【0245】
layer_nonoutput_dpb_params_idx[i]は、OLS内の非出力レイヤであるとき、第iのレイヤに適用するdpb_parameters()シンタックス構造の、VPS内のdpb_parameters()シンタックス構造のリストへのインデックスを指定する。存在するとき、layer_nonoutput_dpb_params_idx[i]の値は0以上vps_num_dpb_params-1以下の範囲にあるものとする。
【0246】
same_dpb_size_output_or_nonoutput_flagが1に等しい場合、以下が当てはまる。
-vps_independent_layer_flag[i]が1に等しい場合、非出力レイヤであるとき、第iのレイヤに適用する dpb_parameters()シンタックス構造は、レイヤにより参照されるSPSに存在するdpb_parameters()シンタックス構造である。
-そうでない場合(vps_independent_layer_flag[i]が0に等しい場合)、layer_nonoutput_dpb_params_idx[i]の値はlayer_output_dpb_params_idx[i]に等しいと推定される。
【0247】
そうでない場合(same_dpb_size_output_or_nonoutput_flagが0に等しい場合)、vps_num_dpb_paramsが1に等しいとき、layer_output_dpb_params_idx[i]の値は0に等しいと推定される。
【0248】
1に等しいvps_general_hrd_params_present_flagは、シンタックス構造general_hrd_parameters()及び他のHRDパラメータがVPS RBSPシンタックス構造に存在することを指定する。0に等しいvps_general_hrd_params_present_flagは、シンタックス構造general_hrd_parameters()及び他のHRDパラメータがVPS RBSPシンタックス構造に存在しないことを指定する。
【0249】
1に等しいvps_sublayer_cpb_params_present_flagは、VPS内の第iのols_hrd_parameters()シンタックス構造が0以上hrd_max_tid[i]以下の範囲内のTemporalIdを有するサブレイヤ表現についてのHRDパラメータを含むことを指定する。0に等しいvps_sublayer_cpb_params_present_flagは、VPS内の第iのols_hrd_parameters()シンタックス構造がhrd_max_tid[i]に等しいTemporalIdのみを有するサブレイヤ表現についてのHRDパラメータを含むことを指定する。vps_max_sublayers_minus1が0に等しいとき、vps_sublayer_cpb_params_present_flagの値は0に等しいと推定される。
【0250】
vps_sublayer_cpb_params_present_flagが0に等しいとき、0以上hrd_max_tid[i]-1以下の範囲内のTemporalIdを有するサブレイヤ表現についてのHRDパラメータは、hrd_max_tid[i]に等しいTemporalIdを有するサブレイヤ表現についてのものと同じであると推定される。これらは、fixed_pic_rate_general_flag[i]シンタックスエレメントから始まり、ols_hrd_parametersシンタックス構造内の「if(general_vcl_hrd_params_present_flag)」の条件の直下のsublayer_hrd_parameters(i)シンタックス構造までのHRDパラメータを含む。
【0251】
num_ols_hrd_params_minus1に1を加えたものは、general_hrd_parameters()シンタックス構造に存在するols_hrd_parameters()シンタックス構造の数を指定する。num_ols_hrd_params_minus1の値は0以上63以下の範囲にあるものとする。TotalNumOlssが1に等しいとき、num_ols_hrd_params_minus1の値は0に等しいと推定される。
【0252】
hrd_max_tid[i]は、HRDパラメータが第iのols_hrd_parameters()シンタックス構造に含まれる、最高のサブレイヤ表現のTemporalIdを指定する。hrd_max_tid[i]の値は0以上vps_max_sublayers_minus1以下の範囲にあるものとする。vps_max_sublayers_minus1が0に等しいとき、hrd_max_tid[i]の値は0に等しいと推定される。vps_max_sublayers_minus1が0よりも大きく、vps_all_layers_same_num_sublayers_flagが1に等しいとき、hrd_max_tid[i]の値はvps_max_sublayers_minus1に等しいと推定される。
【0253】
ols_hrd_idx[i]は、第iのOLSに適用するols_hrd_parameters()シンタックス構造のインデックスを指定する。ols_hrd_idx[i]の値は0以上num_ols_hrd_params_minus1以下の範囲にあるものとする。存在しないとき、ols_hrd_idx[i]の値は0に等しいと推定される。
【0254】
0に等しいvps_extension_flagは、vps_extension_data_flagシンタックスエレメントがVPS RBSPシンタックス構造に存在しないことを指定する。1に等しいvps_extension_flagは、vps_extension_data_flagシンタックスエレメントがVPS RBSPシンタックス構造に存在することを指定する。
【0255】
vps_extension_data_flagは、任意の値を有してもよい。その存在及び値は、この仕様のこのバージョンで指定されるプロファイルへのデコーダ適合性に影響しない。この仕様のこのバージョンに準拠するデコーダは、全てのvps_extension_data_flagシンタックスエレメントを無視するものとする。
【0256】
DPB管理及び参照ピクチャマーキング
復号プロセスにおいてこれらの参照ピクチャを管理するために、後続のピクチャの復号のための参照使用のために、復号ピクチャは、復号ピクチャバッファ(DPB, decoding picture buffer)に保持する必要がある。これらのピクチャを示すために、これらのピクチャオーダーカウント(POC, picture order count)情報は、直接又は間接にスライスヘッダでシグナリングする必要がある。一般的には、2つの参照ピクチャリスト、すなわち、list0及びlist1が存在する。また、リスト内のピクチャをシグナリングするために、参照ピクチャインデックスもまた含まれる必要がある。一方向予測では、参照ピクチャは1つの参照ピクチャリストからフェッチされ、双方向予測では、参照ピクチャは2つの参照ピクチャリストからフェッチされる。
【0257】
全ての参照ピクチャはDPBに記憶される。DPB内の全てのピクチャは、「長期参照に使用」、「短期参照に使用」又は「参照に未使用」としてマーキングされ、3つの状態について1つのみである。ピクチャが「参照に未使用」としてマーキングされると、これは、もはや参照に使用されない。また、出力のために記憶する必要がない場合、これは、DPBから除去できる。参照ピクチャの状態は、スライスヘッダでシグナリングでき、或いは、スライスヘッダ情報から導出できる。
【0258】
RPL(reference picture list)法と呼ばれる新たな参照ピクチャ管理方法が提案された。RPLは、現在のコーディングピクチャのための全体の参照ピクチャセット又は複数のセットを提案し、参照ピクチャセット内の参照ピクチャは、現在ピクチャ又は将来(後の或いは後続の)ピクチャの復号に使用される。したがって、RPLはDPB内のピクチャ情報を反映しており、参照ピクチャが現在ピクチャのための参照に使用されていない場合であっても、後続のピクチャのための参照に使用される場合、RPLに記憶する必要がある。
【0259】
ピクチャが再構成された後に、これはDPBに記憶され、デフォルトで「短期参照に使用」としてマーキングされる。DPB管理動作は、スライスヘッダ内のRPL情報をパースした後に開始する。
【0260】
参照ピクチャリスト構成
参照ピクチャ情報は、スライスヘッダを介してシグナリングできる。また、シーケンスパラメータセット(SPS, Sequence parameters set)にいくつかのRPL候補が存在してもよく、この場合、スライスヘッダは、全体のRPLシンタックス構造をシグナリングせずに、必要なRPL情報を取得するためのRPLインデックスを含んでもよい。或いは、全体のRPLシンタックス構造は、スライスヘッダでシグナリングできる。
【0261】
RPL法の紹介
RPLシグナリングのコストビットを節約するために、SPS内にいくつかのRPL候補が存在してもよい。ピクチャは、SPSからそのRPL情報を取得するために、RPLインデックス(ref_pic_list_idx[i])を使用できる。RPL候補は、以下のようにシグナリングされる。
【表2】
【0262】
意味は以下の通りである。
【0263】
1に等しいrpl1_same_as_rpl0_flagは、シンタックス構造num_ref_pic_lists_in_sps[1]及びref_pic_list_struct(1, rplsIdx)が存在しないことを指定し、以下が当てはまる。
-num_ref_pic_lists_in_sps[1]の値はnum_ref_pic_lists_in_sps[0]の値と等しいと推定される。
-ref_pic_list_struct(1,rplsIdx)内の各シンタックスエレメントの値は、0からnum_ref_pic_lists_in_sps[0]-1の範囲のrplsIdxについて、ref_pic_list_struct(0, rplsIdx)内の対応するシンタックスエレメントの値に等しいと推定される。
【0264】
num_ref_pic_lists_in_sps[i]は、SPSに含まれる、iに等しいlistIdx を有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造の数を指定する。num_ref_pic_lists_in_sps[i]の値は0以上64以下の範囲にあるものとする。
【0265】
SPSからのRPLインデックスに基づいてRPL情報を取得する以外に、RPL情報はスライスヘッダでシグナリングできる。
【表3】
【0266】
1に等しいref_pic_list_sps_flag[i]は、現在スライスの参照ピクチャリストiがSPS内のiに等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造の1つに基づいて導出されることを指定する。0に等しいref_pic_list_sps_flag[i]は、現在スライスの参照ピクチャリストiが現在ピクチャのスライスヘッダに直接含まれる、iに等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造に基づいて導出されることを指定する。
【0267】
ref_pic_list_sps_flag[i]が存在しないとき、以下が当てはまる。
-num_ref_pic_lists_in_sps[i]が0に等しい場合、ref_pic_list_sps_flag[i]の値は0に等しいと推定される。
-そうでなく(num_ref_pic_lists_in_sps[i] が0よりも大きく)、rpl1_idx_present_flagが0に等しい場合、ref_pic_list_sps_flag[1]の値はref_pic_list_sps_flag[0]に等しいと推定される。
-そうでない場合、ref_pic_list_sps_flag[i]の値はpps_ref_pic_list_sps_idc[i]-1に等しいと推定される。
【0268】
ref_pic_list_idx[i]は、現在ピクチャの参照ピクチャリストiの導出に使用される、iに等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造の、SPSに含まれる、iに等しいlistIdxを有するref_pic_list_struct(listIdx,
rplsIdx)シンタックス構造のリストへのインデックスを指定する。シンタックスエレメントref_pic_list_idx[i]は、Ceil(Log2(num_ref_pic_lists_in_sps[i]))ビットにより表される。存在しないとき、ref_pic_list_idx[i]の値は0に等しいと推定される。ref_pic_list_idx[i]の値は0以上num_ref_pic_lists_in_sps[i]-1以下の範囲にあるものとする。ref_pic_list_sps_flag[i]が1 に等しく、num_ref_pic_lists_in_sps[i]が0に等しいとき、ref_pic_list_idx[i]の値は0に等しいと推定される。ref_pic_list_sps_flag[i]が1に等しく、rpl1_idx_present_flagが 0に等しいとき、ref_pic_list_idx[1]の値はref_pic_list_idx[0]に等しいと推定される。
【0269】
変数RplsIdx[i]は以下のように導出される。
【数7】
【0270】
slice_poc_lsb_lt[i][j]は、第iの参照ピクチャリスト内の第jのLTRPエントリのピクチャオーダーカウントのモジュロMaxPicOrderCntLsbの値を指定する。slice_poc_lsb_lt[i][j]シンタックスエレメントの長さはlog2_max_pic_order_cnt_lsb_minus4+4ビットである。
【0271】
変数PocLsbLt[i][j]は以下のように導出される。
【数8】
【0272】
1に等しいdelta_poc_msb_present_flag[i][j]は、delta_poc_msb_cycle_lt[i][j]が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i][j]は、delta_poc_msb_cycle_lt[i][j]が存在しないことを指定する。
【0273】
prevTid0Picを、現在ピクチャと同じnuh_layer_idを有し、0に等しいTemporalIdを有し、RASL又はRADLピクチャでない復号順で前のピクチャとする。setOfPrevPocValsを以下で構成されるセットとする。
-prevTid0PicのPicOrderCntVal、
-prevTid0PicのRefPicList[0]又はRefPicList[1]内のエントリにより参照され、現在ピクチャと同じnuh_layer_idを有する各ピクチャのPicOrderCntVal、
-復号順でprevTid0Picに後続し、現在ピクチャと同じnuh_layer_idを有し、復号順で現在ピクチャに先行する各ピクチャのPicOrderCntVal。
【0274】
値モジュロMaxPicOrderCntLsbがPocLsbLt[i][j]に等しい1つよりも多くの値がsetOfPrevPocValsに存在するとき、delta_poc_msb_present_flag[i][j]の値は1に等しいものとする。
【0275】
delta_poc_msb_cycle_lt[i][j]は、以下のように変数FullPocLt[i][j]の値を指定する。
【数9】
【0276】
delta_poc_msb_cycle_lt[i][j]の値は0以上2(32-log2_max_pic_order_cnt_lsb_minus4-4)以下の範囲にあるものとする。存在しないとき、delta_poc_msb_cycle_lt[i][j]の値は0に等しいと推定される。
【0277】
RPLのシンタックス構造は以下の通りである。
【表4】
【0278】
num_ref_entries[listIdx][rplsIdx]は、ref_pic_list_struct(listIdx, rplsIdx)シンタックス構造内のエントリの数を指定する。num_ref_entries[listIdx][rplsidx]の値は0以上sps_max_dec_pic_buffering_minus1+14以下の範囲にあるものとする。
【0279】
0に等しいltrp_in_slice_header_flag[listIdx][rplsIdx]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のLTRPエントリのPOC LSBがref_pic_list_struct(listIdx,rplsIdx)シンタックス構造に存在することを指定する。1に等しいltrp_in_slice_header_flag[listIdx][rplsIdx]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のLTRPエントリのPOC LSBがref_pic_list_struct(listIdx,rplsIdx)シンタックス構造に存在しないことを指定する。
【0280】
1に等しいinter_layer_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内の第iのエントリがILRPエントリであることを指定する。0に等しいinter_layer_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内の第iのエントリがILRPエントリでないことを指定する。存在しないとき、inter_layer_ref_pic_flag[listIdx][rplsIdx][i]値は0に等しいと推定される。
【0281】
1に等しいst_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内の第iのエントリがSTRPエントリであることを指定する。0に等しいst_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内の第iのエントリがLTRPエントリであることを指定する。inter_layer_ref_pic_flag[listIdx][rplsIdx][i]が0に等しく、st_ref_pic_flag[listIdx][rplsIdx][i]が存在しないとき、st_ref_pic_flag[listIdx][rplsIdx][i]の値は1に等しいと推定される。
【0282】
変数NumLtrpEntries[listIdx][rplsIdx]は以下のように導出される。
【数10】
【0283】
abs_delta_poc_st[listIdx][rplsIdx][i]は、以下のように変数AbsDeltaPocSt[listIdx][rplsIdx][i]の値を指定する。
【数11】
【0284】
abs_delta_poc_st[listIdx][rplsIdx][i]の値は0以上215-1以下の範囲にあるものとする。
【0285】
1に等しいstrp_entry_entry_sign_flag[listIdx][rplsIdx][i]は、シンタックス構造ref_pic_list_struct(listIdx,rplsIdx)内の第iのエントリが0以上の値を有することを指定する。0に等しいstrp_entry_sign_flag[listIdx][rplsIdx][i]は、シンタックス構造ref_pic_list_struct(listIdx,rplsIdx)内の第iのエントリが0未満の値を有することを指定する。存在しないとき、strp_entry_sign_flag[listIdx][rplsIdx][i]の値は1に等しいと推定される。
【0286】
リストDeltaPocValSt[listIdx][rplsIdx]は以下のように導出される。
【数12】
【0287】
rpls_poc_lsb_lt[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内の第iのエントリにより参照されるピクチャのピクチャオーダーカウントのモジュロMaxPicOrderCntLsbの値を指定する。rpls_poc_lsb_lt[listIdx][rplsIdx][i]シンタックスエレメントの長さはlog2_max_pic_order_cnt_lsb_minus4+4ビットである。
【0288】
RPL構造のいくつかの一般的な説明
リスト毎にRPL構造が存在する。まず、num_ref_entries[listIdx][rplsIdx]は、リスト内の参照ピクチャの数を示すためにシグナリングされる。ltrp_in_slice_header_flag[listIdx][rplsIdx]は、LSB(Least Significant Byte)情報がスライスヘッダでシグナリングされるか否かを示すために使用される。現在の参照ピクチャがレイヤ間参照ピクチャでない場合、st_ref_pic_flag[listIdx][rplsIdx][i]は、それが長期参照ピクチャであるか否かを示す。これが短期参照ピクチャである場合、POC情報(abs_delta_poc_st及びstrp_entry_sign_flag)がシグナリングされる。ltrp_in_slice_header_flag[listIdx][rplsIdx]がゼロである場合、rpls_poc_lsb_lt[listIdx][rplsIdx][j++]は、現在の参照ピクチャのLSB情報を導出するために使用される。MSB(Most Significant Bit)は、直接導出でき、或いは、スライスヘッダ内の情報(delta_poc_msb_present_flag[i][j]及びdelta_poc_msb_cycle_lt[i][j])に基づいて導出できる。
【0289】
参照ピクチャリスト構成のための復号プロセス
このプロセスは、非IDRピクチャの各スライスについて、復号プロセスの開始時に呼び出される。
【0290】
参照ピクチャは、参照インデックスを通じて扱われる。参照インデックスは、参照ピクチャリストへのインデックスである。Iスライスを復号するとき、参照ピクチャリストはスライスデータの復号において使用されない。Pスライスを復号するとき、参照ピクチャリスト0(すなわち、RefPicList[0])のみが、スライスデータの復号において使用される。Bスライスを復号するとき、参照ピクチャリスト0及び参照ピクチャリスト1(すなわち、RefPicList[1])の双方が、スライスデータの復号において使用される。
【0291】
非IDRピクチャの各スライスについての復号プロセスの開始時に、参照ピクチャリストRefPicList[0]及びRefPicList[1]が導出される。参照ピクチャリストは、8.3.3節に指定のように参照ピクチャのマーキングにおいて或いはスライスデータの復号において使用される。
注1-ピクチャの最初のスライスでない非IDRピクチャのIスライスについて、RefPicList[0]及びRefPicList[1]は、ビットストリーム適合性検査の目的で導出されてもよいが、これらの導出は、現在ピクチャ又は復号順で現在ピクチャに後続するピクチャの復号に必要ではない。ピクチャの最初のスライスでないPスライスについて、RefPicList[1]は、ビットストリーム適合性検査の目的で導出されてもよいが、この導出は現在ピクチャ又は復号順で現在ピクチャに後続するピクチャの復号に必要ではない。
【0292】
参照ピクチャリストRefPicList[0]及びRefPicList[1]、参照ピクチャスケーリング比RefPicScale[i][j][0]及びRefPicScale[i][j][1]、並びに参照ピクチャスケーリングフラグRefPicIsScaled[0]及びRefPicIsScaled[1]は以下のように構成される。
【数13】
【0293】
0又は1に等しい各iについて、RefPicList[i]内の最初のNumRefIdxActive[i]エントリはRefPicList[i]内のアクティブエントリと呼ばれ、RefPicList[i]内の他のエントリはRefPicList[i]内の非アクティブエントリと呼ばれる。
注2-特定のピクチャがRefPicList[0]内のエントリ及びRefPicList[1]のエントリの双方により参照されることが可能である。特定のピクチャがRefPicList[0]内の1つよりも多くのエントリ又はRefPicList[1]内の1つよりも多くのエントリにより参照されることも可能である。
注3-RefPicList[0]内のアクティブエントリ及びRefPicList[1]内のアクティブエントリは、現在ピクチャ及び復号順で現在ピクチャに後続する1つ以上のピクチャのインター予測に使用され得る全ての参照ピクチャをまとめて参照する。RefPicList[0]内の非アクティブエントリ及びRefPicList[1]内の非アクティブエントリは、現在ピクチャのインター予測には使用されないが、復号順で現在ピクチャに後続する1つ以上のピクチャのためのインター予測において使用され得る全ての参照ピクチャをまとめて参照する。
注4-対応するピクチャがDPBに存在しないので、RefPicList[0]又はRefPicList[1]に、「参照ピクチャなし」に等しい1つ以上のエントリが存在してもよい。「参照ピクチャなし」に等しいRefPicList[0]又はRefPicList[0]内の各非アクティブエントリは無視されるべきである。「参照ピクチャなし」に等しいRefPicList[0]又はRefPicList[1]内の各アクティブエントリについて、意図しないピクチャロスが推定されるべきである。
【0294】
以下の制約が当てはまるのはビットストリーム適合性の要件である。
-0又は1に等しい各iについて、num_ref_entries[i][RplsIdx[i]]はNumRefIdxActive[i]未満ではないものとする。
-RefPicList[0]又はRefPicList[1]内の各アクティブエントリにより参照されるピクチャは、DPBに存在するものとし、現在ピクチャのTemporalId以下のTemporalIdを有するものとする。
-RefPicList[0]又はRefPicList[1]内の各エントリにより参照されるピクチャは、現在ピクチャではないものとし、0に等しいnon_reference_picture_flagを有するものとする。
-ピクチャのスライスのRefPicList[0]又はRefPicList[1]内のSTRPエントリと、同じスライス又は同じピクチャの異なるスライスのRefPicList[0]又はRefPicList[1]内のLTRPエントリとは、同じピクチャを参照しないものとする。
-現在ピクチャのPicOrderCntValとエントリにより参照されるピクチャのPicOrderCntValとの差が224以上であるRefPicList[0]又はRefPicList[1]内のLTRPエントリは存在しないものとする。
-setOfRefPicsを、現在ピクチャと同じnuh_layer_idを有するRefPicList[0]内の全てのエントリと、現在ピクチャと同じnuh_layer_idを有するRefPicList[1]内の全てのエントリとにより参照される一意のピクチャのセットとする。setOfRefPics内のピクチャ数はMaxDecPicBuffMinus1以下であるものとし、setOfRefPicsはピクチャの全てのスライスについて同じであるものとする。
-現在ピクチャがSTSAピクチャであるとき、現在ピクチャのTemporalIdと等しいTemporalIdを有するRefPicList[0]又はRefPicList[1]内のアクティブエントリは存在しないものとする。
-現在ピクチャが、復号順に現在ピクチャのTemporalIdに等しいTemporalIdを有するSTSAピクチャに後続するピクチャであるとき、復号順にSTSAピクチャに先行するRefPicList[0]又はRefPicList[1]内のアクティブエントリとして含まれる現在ピクチャのTemporalIdに等しいTemporalIdを有するピクチャは存在しないものとする。
-現在ピクチャがCRAピクチャであるとき、復号順でいずれかの先行するIRAPピクチャ(存在する場合)に出力順又は復号順で先行するRefPicList[0]又はRefPicList[1]内のエントリにより参照されるピクチャは存在しないものとする。
-現在ピクチャがトレーリングピクチャ(trailing picture)であるとき、現在ピクチャに関連するIRAPピクチャについて利用不可能な参照ピクチャを生成するために復号プロセスにより生成されたRefPicList[0]又はRefPicList[1]内のアクティブエントリにより参照されるピクチャは存在しないものとする。
-現在ピクチャが、復号順及び出力順の双方で、存在する場合には同じIRAPピクチャに関連する1つ以上のリーディングピクチャ(leading picture)に後続するトレーリングピクチャであるとき、現在ピクチャに関連するIRAPピクチャについて利用不可能な参照ピクチャを生成するために復号プロセスにより生成されたRefPicList[0]又はRefPicList[1]内のエントリにより参照されるピクチャは存在しないものとする。
-現在ピクチャが回復点ピクチャ又は出力順に回復点ピクチャに後続するピクチャであるとき、回復点ピクチャのGDRピクチャについて利用不可能な参照ピクチャを生成するために復号プロセスにより生成されたピクチャを含むRefPicList[0]又はRefPicList[1]内のエントリは存在しないものとする。
-現在ピクチャがトレーリングピクチャであるとき、出力順又は復号順で関連するIRAPピクチャに先行するRefPicList[0]又はRefPicList[1]内のアクティブエントリにより参照されるピクチャは存在しないものとする。
-現在ピクチャが、復号順及び出力順の双方で、存在する場合には同じIRAPピクチャに関連する1つ以上のリーディングピクチャに後続するトレーリングピクチャであるとき、出力順又は復号順で関連するIRAPピクチャに先行するRefPicList[0]又はRefPicList[1]内のエントリにより参照されるピクチャは存在しないものとする。
-現在ピクチャがRADLピクチャであるとき、以下のいずれかであるRefPicList[0]又はRefPicList[1]内のアクティブエントリは存在しないものとする。
・RASLピクチャ
・利用不可能な参照ピクチャを生成するために復号プロセスにより生成されたピクチャ
・復号順で関連するIRAPピクチャに先行するピクチャ
-現在ピクチャのスライスのRefPicList[0]又はRefPicList[1]内の各ILRPエントリにより参照されるピクチャは、現在ピクチャと同じAUにあるものとする。
-現在ピクチャのスライスのRefPicList[0]又はRefPicList[1]内の各ILRPエントリにより参照されるピクチャは、DPBに存在するものとし、現在ピクチャのnuh_layer_idよりも小さいnuh_layer_idを有するものとする。
-スライスのRefPicList[0]又はRefPicList[1]内の各ILRPエントリは、アクティブエントリであるものとする。
【0295】
RPLが構成された後に、マーキングプロセスは以下の通りである。
【0296】
参照ピクチャマーキングのための復号プロセス
このプロセスは、8.3.2節に指定のように、スライスヘッダの復号及びスライスについての参照ピクチャリスト構成のための復号プロセスの後であるが、スライスデータの復号の前に、ピクチャ毎に1回呼び出される。このプロセスは、DPB内の1つ以上の参照ピクチャが「参照に未使用」又は「長期参照に使用」としてマーキングされることを生じてもよい。
【0297】
DPB内の復号ピクチャは、「参照に未使用」、「短期参照に使用」又は「長期参照に使用」としてマーキングできるが、復号プロセスの動作中のいずれか所与の時点において、これらの3つのうち1つのみである。これらのマーキングのうち1つをピクチャに割り当てることは、適用可能なとき、これらのマーキングのうち他のものを暗黙的に除去する。ピクチャが「参照に使用」としてマーキングされるものと呼ばれるとき、これは、「短期参照に使用」又は「長期参照に使用」としてマーキングされるピクチャを併せて示す(しかし、双方ではない)。
【0298】
STRP及びILRPは、これらのnuh_layer_id及びPicOrderCntVal値により識別される。LTRPは、これらのnuh_layer_id値及びこれらのPicOrderCntVal値のLog2(MaxLtPicOrderCntLsb)LSBにより識別される。
【0299】
現在ピクチャがCLVSSピクチャである場合、現在ピクチャと同じnuh_layer_idを有するDPB内の現在の全ての参照ピクチャ(存在する場合)は、「参照に未使用」としてマーキングされる。
【0300】
そうでない場合、以下が当てはまる。
-RefPicList[0]又はRefPicList[1]内の各LTRPエントリについて、参照されるピクチャが現在ピクチャと同じnuh_layer_idを有するSTRPであるとき、当該ピクチャは「長期参照に使用」としてマーキングされる。
-RefPicList[0]又はRefPicList[1]内のいずれかのエントリにより参照されないDPB内の現在ピクチャと同じnuh_layer_idを有する各参照ピクチャは、「参照に未使用」としてマーキングされる。
-RefPicList[0]又はRefPicList[1]内の各ILRPエントリについて、参照されるピクチャは「長期参照に使用」としてマーキングされる。
【0301】
レイヤの間で非同期IRAPピクチャを有することが許容される。この設計をサポートするために、以下のPOC設計で、AU内のIRAP及び非IRAPピクチャを混合する。
【0302】
独立レイヤでは、POC MSBサイクルシグナリングを使用する。SPSには、ピクチャヘッダがph_poc_msb_cycle_present_flag及びSPS内の長さを有するか否かを制御するフラグが存在する。ph_poc_msb_cycle_present_flagが1に等しいとき、u(v)コーディングされたPOC MSBサイクルは、ピクチャヘッダでシグナリングされる。POC MSBサイクルが存在するとき、ピクチャのPOC MSBはpoc_msb_cycle*MaxPicOrderCntLsbに設定される。
【0303】
従属レイヤでは、現在のレイヤの参照レイヤに同じAU内のピクチャpicAが存在する場合、POCは、piAのPOCに等しいものとして導出され、POC LSB値は、レイヤ間で整列される必要がある。そうでない場合、現在のPOC導出プロセスが適用される。
【表5】
【0304】
bit_depth_minus8は、以下のように、ルマ及びクロマ配列のサンプルのビット深度BitDepthと、ルマ及びクロマ量子化パラメータ範囲オフセットの値QpBdOffsetとを指定する。
【数14】
bit_depth_minus8は0以上8以下の範囲にあるものとする。
【0305】
sps_decoding_parameter_set_idは、0よりも大きいとき、SPSにより参照されるDPSについてのdps_decoding_parameter_set_idの値を指定する。sps_decoding_parameter_set_idが0に等しいとき、SPSはDPSを参照せず、SPSを参照して各CLVSを復号するとき、DPSは参照されない。sps_decoding_parameter_set_idの値は、ビットストリーム内のコーディングされたピクチャにより参照される全てのSPSにおいて同じであるものとする。
【0306】
sps_video_parameter_set_idは、0よりも大きいとき、SPSにより参照されるVPSについてのvps_video_parameter_set_idの値を指定する。
【0307】
sps_video_parameter_set_idが0に等しいとき、以下が当てはまる。
-SPSはVPSを参照しない。
-SPSを参照して各CLVSを復号するとき、VPSは参照されない。
-vps_max_layers_minus1の値は0に等しいと推定される。
-CVSは、1つのレイヤのみを含むものとする(すなわち、CVS内の全てのVCL NALユニットは、nuh_layer_idと同じ値を有するものとする)。
-GeneralLayerIdx[nuh_layer_id]の値は0に等しいと推定される。
-vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]の値は1に等しいと推定される。
【0308】
vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]が1に等しいとき、特定のnuh_layer_id値nuhLayerIdを有するCLVSにより参照されるSPSは、nuhLayerIdに等しいnuh_layer_idを有するものとする。
【0309】
chroma_format_idcは、6.2節に指定のように、ルマサンプリングに対するクロマサンプリングを指定する。
【0310】
1に等しいseparate_colour_plane_flagは、4:4:4クロマフォーマットの3つの色成分が別々にコーディングされることを指定する。0に等しいseparate_colour_plane_flagは、色成分が別々にコーディングされないことを指定する。separate_colour_plane_flagが存在しないとき、これは0に等しいと推定される。separate_colour_plane_flagが1に等しいとき、コーディングされたピクチャは3つの別々の成分で構成され、これらのそれぞれは1つの色面(Y、Cb又はCr)のコーディングされたサンプルで構成され、モノクロコーディングシンタックスを使用する。この場合、各色平面は特定のcolour_plane_id値に関連する。
注1-異なるcolour_plane_id値を有する色平面の間の復号プロセスに依存関係は存在しない。例えば、colour_plane_idの1つの値を有するモノクロピクチャの復号プロセスは、インター予測のためにcolour_plane_idの異なる値を有するモノクロピクチャからのデータを使用しない。
【0311】
separate_colour_plane_flagの値に依存して、変数ChromaArrayTypeの値は以下のように割り当てられる。
-separate_colour_plane_flagが0に等しい場合、ChromaArrayTypeはchroma_format_idcに等しく設定される。
-そうでない場合(separate_colour_plane_flagが1に等しい場合)、ChromaArrayTypeは0に等しく設定される。
【0312】
chroma_format_idc及びseparate_colour_plane_flagの意味は、クロマフォーマットを示すために使用される。
【表6】
【0313】
1に等しいsps_poc_msb_flagは、ph_poc_msb_cycle_present_flagシンタックスエレメントがSPSを参照するPHに存在することを指定する。0に等しいsps_poc_msb_flagは、ph_poc_msb_cycle_present_flagシンタックスエレメントがSPSを参照するPHに存在しないことを指定する。
【0314】
poc_msb_len_minus1に1を加えたものは、SPSを参照するPHに存在するとき、poc_msb_valシンタックスエレメントの長さをビット単位で指定する。poc_msb_len_minus1の値は0以上32-log2_max_pic_order_cnt_lsb_minus4-5以下の範囲にあるものとする。
【表7】
【0315】
1に等しいph_poc_msb_present_flagは、シンタックスエレメントpoc_msb_valがPHに存在することを指定する。0に等しいph_poc_msb_present_flagは、シンタックスエレメントpoc_msb_valがPHに存在しないことを指定する。vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]が0に等しく、現在のレイヤの参照レイヤに現在のAU内のピクチャが存在するとき、ph_poc_msb_present_flagの値は0に等しいものとする。
【0316】
poc_msb_valは、現在ピクチャのPOC MSB値を指定する。シンタックスエレメントpoc_msb_valの長さは、poc_msb_len_minus1+1ビットである。
【0317】
以下は、現在ピクチャのPOC(picture order count)の導出である。
【0318】
ピクチャオーダーカウントについての復号プロセス
このプロセスの出力は、現在ピクチャのピクチャオーダーカウントであるPicOrderCntValである。
【0319】
それぞれのコーディングされたピクチャは、PicOrderCntValとして示されるピクチャオーダーカウント変数に関連する。
【0320】
vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]が0に等しく、現在のレイヤの参照レイヤに現在のAU内のピクチャpicAが存在する場合、PicOrderCntValはpicAのPicOrderCntValに等しくなるように導出され、slice_pic_order_cnt_lsbの値は、現在のAUの全てのVCL NALユニットにおいて同じであるものとする。そうでない場合、現在ピクチャのPicOrderCntValは、以下に指定のように導出される。
【0321】
ph_poc_msb_present_flagが0に等しく、現在ピクチャがCLVSSピクチャでないとき、変数prevPicOrderCntLsb及びprevPicOrderCntMsbは以下のように導出される。
-prevTid0Picを、現在のピクチャのnuh_layer_idに等しいnuh_layer_id及び0に等しいTemporalIdを有し且つRASL又はRADLピクチャでない復号順の前のピクチャとする。
-変数prevPicOrderCntLsbは、prevTid0Picのslice_pic_order_cnt_lsbに等しく設定される。
-変数prevPicOrderCntMsbは、prevTid0PicのPicOrderCntMsbに等しく設定される。
【0322】
現在ピクチャの変数PicOrderCntMsbは以下のように導出される。
-ph_poc_msb_present_flagが1に等しい場合、PicOrderCntMsbはpoc_msb_val*MaxPicOrderCntLsbに等しく設定される。
-そうでなく(ph_poc_msb_present_flagが0に等しく)、現在ピクチャがCLVSSピクチャである場合、PicOrderCntMsbは0に等しく設定される。
-そうでない場合、PicOrderCntMsbは以下のように導出される。
【数15】
【0323】
PicOrderCntValは以下のように導出される。
【数16】
注1-poc_msb_valが存在しない全てのCLVSSピクチャは、これらのピクチャについてPicOrderCntMsbが0に等しく設定されるので、slice_pic_order_cnt_lsbに等しいPicOrderCntValを有する。
PicOrderCntValの値は-2
31以上2
31-1以下の範囲にあるものとする。
1つのCVSにおいて、nuh_layer_idの同じ値を有するいずれか2つのコーディングされたピクチャについてのPicOrderCntVal値は同じでないものとする。
いずれか特定のAU内の全てのピクチャは、PicOrderCntValの同じ値を有するものとする。
関数PicOrderCnt(picX)は以下のように指定される。
【数17】
関数DiffPicOrderCnt(picA,picB)は以下のように指定される。
【数18】
ビットストリームは、-2
15以上2
15-1以下の範囲にない、復号プロセスにおいて使用されるDiffPicOrderCnt(picA,picB)の値を生じるデータを含まないものとする。
注2-Xを現在ピクチャとし、Y及びZを同じCVS内の他の2つのピクチャとすると、DiffPicOrderCnt(X,Y)及びDiffPicOrderCnt(X,Z)の双方が正であるか或いは双方が負であるとき、Y及びZは、Xからの同じ出力順の方向にあると考えられる。
【0324】
sps_poc_msb_flagの制約
フラグsps_poc_msb_flagは、フラグph_poc_msb_cycle_present_flagがピクチャヘッダにおいて提示されるか否かを制御するために使用される。一方、AU内の混合のIRAP及び非IRAPピクチャは、マルチレイヤシナリオにおいて有効にしさえすればよい。したがって、シングルレイヤのコーディングシナリオにおいてph_poc_msb_cycle_present_flagを提示する必要はない。したがって、sps_poc_msb_flagの値は、シングルレイヤのコーディングシナリオにおいて0になるように制約できる。
【0325】
1.2 chroma_format_idc、separate_colour_plane_flag、bit_depth_minus8の制約
現在の動き補償プロセスはレイヤ間予測において使用できるが、異なるレイヤが異なるフォーマット(chroma_format_idc、separate_colour_plane_flag、bit_depth_minus8等)を有するとき、これは使用できない。
【0326】
sps_poc_msb_flagの値がマルチレイヤのコーディングシナリオにおいて0に等しいものとするように制約することが提案される。
【0327】
現在のレイヤ内の現在ピクチャ及び参照レイヤ内の参照ピクチャが同じフォーマットを有するときにのみ、レイヤ間予測が使用できるように制約することが提案される。
【0328】
フラグsps_poc_msb_flagは、フラグph_poc_msb_cycle_present_flagがピクチャヘッダにおいて提示されるか否かを制御するために使用される。一方、AU内の混合のIRAP及び非IRAPピクチャは、マルチレイヤシナリオにおいて有効にしさえすればよい。したがって、シングルレイヤのコーディングシナリオにおいてph_poc_msb_cycle_present_flagを提示する必要はない。したがって、sps_poc_msb_flagの値は、シングルレイヤのコーディングシナリオにおいて0になるように制約できる。
【0329】
第1の実施形態[sps_poc_msb_flagの制約]
sps_poc_msb_flagの意味は以下のように変更できる。
1に等しいsps_poc_msb_flagは、ph_poc_msb_cycle_present_flagシンタックスエレメントがSPSを参照するPHに存在することを指定する。0に等しいsps_poc_msb_flagは、ph_poc_msb_cycle_present_flagシンタックスエレメントがSPSを参照するPHに存在しないことを指定する。vps_max_layers_minus1が0に等しいとき、sps_poc_msb_flagの値は0に等しいものとする。
【0330】
第2の実施形態[フォーマットの制約]
以下の制約が仕様において追加される必要がある。
0に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを指定する。1に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。0以上vps_max_layers_minus1以下の範囲内のi及びjについて、vps_direct_ref_layer_flag[i][j]が存在しないとき、これは0に等しいと推定される。vps_independent_layer_flag[i]が0に等しいとき、vps_direct_ref_layer_flag[i][j]が1に等しいような、0以上i-1以下の範囲内のjの少なくとも1つの値が存在するものとする。
変数NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]及びLayerUsedAsRefLayerFlag[j]は以下のように導出される。
【数19】
vps_layer_id[i]に等しいnuh_layer_idを有するレイヤのレイヤインデックスを指定する変数GeneralLayerIdx[i]は以下のように導出される。
【数20】
【0331】
制約オプションA:
現在のレイヤが従属レイヤである場合、現在のレイヤ内のビデオは、参照レイヤ内のビデオと同じchroma_format_idcを有するものとする。
また、レイヤ間予測は、現在のレイヤ内のビデオが参照レイヤ内のビデオと同じchroma_format_idcを有するものとするときにのみ使用できると言える。
【0332】
制約オプションB:
現在のレイヤが従属レイヤである場合、現在のレイヤ内のビデオは、参照レイヤ内のビデオと同じseparate_colour_plane_flagを有するものとする。
また、レイヤ間予測は、現在のレイヤ内のビデオが参照レイヤ内のビデオと同じseparate_colour_plane_flagを有するものとするときにのみ使用できると言える。
【0333】
制約オプションC:
現在のレイヤが従属レイヤである場合、現在のレイヤ内のビデオは、参照レイヤ内のビデオと同じbit_depth_minus8を有するものとする。
また、レイヤ間予測は、現在のレイヤ内のビデオが参照レイヤ内のビデオと同じbit_depth_minus8を有するものとするときにのみ使用できると言える。
【0334】
オプションA、B、Cは組み合わせられることができる。
【0335】
例えば、オプションA+B:
現在のレイヤが従属レイヤである場合、現在のレイヤ内のビデオは、参照レイヤ内のビデオと同じchroma_format_idc、separate_colour_plane_flagを有するものとする。
また、レイヤ間予測は、現在のレイヤ内のビデオが参照レイヤ内のビデオと同じchroma_format_idc、separate_colour_plane_flagを有するものとするときにのみ使用できると言える。
【0336】
例えば、オプションA+B+C:
現在のレイヤが従属レイヤである場合、現在のレイヤ内のビデオは、参照レイヤ内のビデオと同じchroma_format_idc、separate_colour_plane_flag、bit_depth_minus8を有するものとする。
また、レイヤ間予測は、現在のレイヤ内のビデオが参照レイヤ内のビデオと同じchroma_format_idc、separate_colour_plane_flag、bit_depth_minus8を有するものとするときにのみ使用できると言える。
【0337】
第3の実施形態[フォーマットの制約]
制約はまた、他の方法においても追加できる。
8 復号プロセス
8.1 一般的な復号プロセス
8.1.1 一般
このプロセスへの入力はビットストリームBitstreamToDecodeである。このプロセスの出力は、復号ピクチャのリストである。
復号プロセスは、指定のプロファイル及びレベルに適合する全てのデコーダが、そのプロファイル及びレベルに適合するビットストリームについてそのプロファイルに関連する復号プロセスを呼び出すとき、数値的に同じクロップされた復号出力ピクチャを生成するように指定される。ここに記載のプロセスにより生成されたものと同じクロップされた復号出力ピクチャを生成するいずれかの復号プロセス(指定の正しい出力順又は出力タイミングを有する)は、この仕様の復号プロセス要件に適合する。
ビットストリーム内の各IRAP AUについて、以下が当てはまる。
-AUが復号順でビットストリーム内の最初のAUであるか、各ピクチャがIDRピクチャであるか、或いは、各ピクチャが復号順でEOS NALユニットに後続するレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定される。
-そうでなく、この仕様に指定されていない何らかの外部手段が変数HandleCraAsCvsStartFlagをAUについての値に設定するために利用可能である場合、HandleCraAsCvsStartFlagは外部手段により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleCraAsCvsStartFlagに等しく設定される。
-そうでない場合、HandleCraAsCvsStartFlag及びNoIncorrectPicOutputFlagは双方とも0に等しく設定される。
ビットストリーム内の各GDR AUについて、以下が当てはまる。
-AUが復号順でビットストリーム内の最初のAUであるか、或いは、各ピクチャが復号順でEOS NALユニットに後続するレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定される。
-そうでなく、この仕様に指定されていない何らかの外部手段が変数HandleGdrAsCvsStartFlagをAUについての値に設定するために利用可能である場合、HandleGdrAsCvsStartFlagは外部手段により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleGdrAsCvsStartFlagに等しく設定される。
-そうでない場合、HandleGdrAsCvsStartFlag及びNoIncorrectPicOutputFlagは、双方とも0に等しく設定される。
注-IRAPピクチャ及びGDRピクチャの双方について、上記の動作はビットストリーム内のCVSの識別に必要である。
復号されるべきターゲットOLSのOLSインデックスを識別する変数TargetOlsIdxと、復号されるべき最高の時間サブレイヤを識別する変数Htidとは、この仕様で指定されていない何らかの外部手段により設定される。ビットストリームBitstreamToDecodeは、ターゲットOLSに含まれるレイヤ以外のレイヤを含まず、Htidよりも大きいTemporalIdを有するNALユニットを含まない。
8.1.2節は、復号順に、BitstreamToDecode内のそれぞれのコーディングされたピクチャについて繰り返し呼び出される。
【0338】
オプションA:
BitstreamToDecodeが1つよりも多くのレイヤを含むとき、各レイヤの以下のプロパティは同じであるものとする。
-chroma_format_idc
-separate_colour_plane_flag
【0339】
オプションB:
BitstreamToDecodeが1つよりも多くのレイヤを含むとき、各レイヤの以下のプロパティは同じであるものとする。
-bit_depth_minus8
【0340】
オプションC=オプションA+オプションB
BitstreamToDecodeが1つよりも多くのレイヤを含むとき、各レイヤの以下のプロパティは同じであるものとする。
-chroma_format_idc
-separate_colour_plane_flag
-bit_depth_minus8
【0341】
(1)POC導出の設計をクリーンアップするためのシングルレイヤのコーディングシナリオのとき、sps_poc_msb_flagの値が0に等しいものとすることを制約する。
(2)レイヤ間予測の現在のレイヤ及び参照レイヤのフォーマットを制約し、設計を簡単にする。
【0342】
図7は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートであり、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行されてもよく、
図7に示すように、コーディングされたビデオビットストリームを復号するための方法は、以下のステップ701~703を含んでもよい。
【0343】
S701 コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得し、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である。
【0344】
具体的には、レイヤはピクチャシーケンスであり、ピクチャシーケンス内のピクチャは、同じレイヤ識別子又はレイヤインデックスを共有する。
【0345】
具体的には、コーディングされたビデオビットストリームを復号するための装置(例えば、
図3に示すデコーダ)は、ビットストリーム21(又は一般的に符号化ピクチャデータ21)をパースし、例えば、符号化ピクチャデータ21へのエントロピー復号を実行し、例えば、量子化係数309及び/又は復号コーディングパラメータ(
図3に図示せず)、例えば、インター予測パラメータ(例えば、参照ピクチャインデックス及び動きベクトル)、イントラ予測パラメータ(例えば、イントラ予測モード又はインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、参照レイヤシンタックスエレメント、クロマフォーマット関連のシンタックスエレメント、ビット深度関連のシンタックスエレメント及び/又は他のシンタックスエレメントの全て又はいずれかを取得するように構成される。エントロピー復号ユニット304は、エンコーダ20のエントロピー符号化ユニット270に関して記載したような符号化方式に対応する復号アルゴリズム又は方式を適用するように構成されてもよい。エントロピー復号ユニット304は、インター予測パラメータ、イントラ予測パラメータ及び/又は他のシンタックスエレメントをモード適用ユニット360に提供し、他のパラメータをデコーダ30の他のユニットに提供するように更に構成されてもよい。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルでシンタックスエレメントを受信してもよい。スライス及びそれぞれのシンタックスエレメントに加えて或いはその代替として、タイルグループ及び/又はタイル及びそれぞれのシンタックスエレメントが受信及び/又は使用されてもよい。
【0346】
実施形態では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0347】
実施形態では、参照レイヤシンタックスエレメントは、上記のVPSテーブル内のシンタックスエレメントvps_direct_ref_layer_flag[i][j]でもよい。
【0348】
0に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを指定する。1に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。0以上vps_max_layers_minus1以下の範囲内のi及びjについて、vps_direct_ref_layer_flag[i][j]が存在しないとき、これは0に等しいと推定される。vps_independent_layer_flag[i]が0に等しいとき、vps_direct_ref_layer_flag[i][j]が1に等しいような、0以上i-1以下の範囲内のjの少なくとも1つの値が存在するものとする。
【0349】
変数NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]及びLayerUsedAsRefLayerFlag[j]は以下のように導出される。
【数21】
【0350】
具体的には、1に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。
【0351】
S702 参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である。
【0352】
実施形態では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0353】
具体的には、参照レイヤに関して、2つの種類のシナリオが存在し、1つは、インデックスAを有するレイヤがインデックスBを有するレイヤの直接参照レイヤであることであり、他のものは、インデックスCを有するレイヤがインデックスBを有するレイヤの参照レイヤであり、インデックスAを有するレイヤがインデックスCを有するレイヤの参照レイヤであり、インデックスAを有するレイヤがインデクスBを有するレイヤの直接参照レイヤでないとき、インデックスAを有するレイヤがインデックスBを有するレイヤの間接参照レイヤであることである。参照レイヤは直接参照レイヤ又は間接参照レイヤを含む。また、インデックスAを有するレイヤがインデックスBを有するレイヤの直接参照レイヤであることは、インデックスAを有するレイヤがインデックスBを有するレイヤ内のピクチャの少なくとも1つの参照ピクチャを含むことを意味する。ステップS702において、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0354】
S703 条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む。
【0355】
具体的には、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤである場合、インデックスiを有するレイヤのピクチャは、インデックスjを有するレイヤに基づいて予測でき、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じである。
【0356】
具体的には、コーディングされたビデオビットストリームを復号するための装置(例えば、
図3に示すデコーダ30)は、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャにインター予測を使用し、エントロピー復号ユニット304から受信した動きベクトル及び他のシンタックスエレメントに基づいて現在のビデオスライスのビデオブロックについて予測ブロック365を生成するように構成される。インター予測について、予測ブロックは、参照ピクチャリストのうち1つの中の参照ピクチャのうち1つから生成されてもよい。ビデオデコーダ30は、DPB330に記憶された参照ピクチャに基づいて、デフォルト構成技術を使用して参照フレームリスト、すなわち、リスト0及びリスト1を構成してもよい。同じこと又は同様のことが、スライス(例えば、ビデオスライス)に加えて或いはその代替として、タイルグループ(例えば、ビデオタイルグループ)及び/又はタイル(例えば、ビデオタイル)に適用されてもよく、これらを使用する実施形態により適用されてもよく、例えば、ビデオは、I、P又はBタイルグループ及び/又はタイルを使用してコーディングされてもよい。
【0357】
具体的には、レイヤ間予測は、インデックスjを有するレイヤからの参照ピクチャに基づいて、インデックスiを有するレイヤのピクチャについてインター予測を使用することを示す。
【0358】
実施形態では、クロマフォーマット関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0359】
具体的には、SPSはピクチャシーケンスに適用され、レイヤはピクチャシーケンスであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0360】
実施形態では、クロマフォーマット関連のシンタックスエレメントは、上記のSPSテーブル内のシンタックスエレメントchroma_format_idcでもよい。
【0361】
chroma_format_idcは、6.2節に指定のようにルマサンプリングに対するクロマサンプリングを指定する。
【0362】
chroma_format_idc及びseparate_colour_plane_flagの意味は、クロマフォーマットを示すために使用される。
【表8】
【0363】
本出願の実施形態によれば、参照レイヤシンタックスエレメントは、コーディングされたビデオビットストリームをパースすることにより取得され、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上であり、参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上であり、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含み、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0364】
図8は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートであり、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行されてもよく、
図8に示すように、コーディングされたビデオビットストリームを復号するための方法は、以下のステップ801~803を含んでもよい。
【0365】
S801 コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得し、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である。
【0366】
S802 条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む。
【0367】
インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは参照レイヤでもよく、すなわち、インデックスjを有するレイヤは、インデックスjを有するレイヤの間接参照レイヤでもよく参照レイヤでもよい点に留意すべきである。
【0368】
本出願の実施形態によれば、参照レイヤシンタックスエレメントは、コーディングされたビデオビットストリームをパースすることにより取得され、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上であり、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含み、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0369】
図7及び8に示す実施形態に基づいて、コーディングされたビデオビットストリームを復号するための方法は、
コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとを取得するステップであり、条件は、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む。
【0370】
具体的には、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであるとき、インデックスiを有するレイヤのピクチャは、インデックスjを有するレイヤのみに基づいて予測できる。
【0371】
図9は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートであり、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行されてもよく、
図9に示すように、
図7に示す方法に基づいて、コーディングされたビデオビットストリームを復号するための方法は、以下のステップ901~906を含んでもよい。
【0372】
S901 コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得し、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である。
【0373】
S902 参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である。
【0374】
S903 条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む。
【0375】
S904 インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止する。
【0376】
S905 インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0377】
具体的には、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでなく、インデックスkを有するレイヤが全てのレイヤをトラバースすることにより見つけられず、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであり、インデックスjを有するレイヤがインデックスkを有するレイヤの参照レイヤであるとき、インデックスjを有するレイヤはインデックスiを有するレイヤの参照レイヤでないと決定される。
【0378】
実施形態では、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでない場合、インデックスjを有するレイヤがインデックスiを有するレイヤの間接参照レイヤであるか否かを決定し、インデックスjを有するレイヤがインデックスiを有するレイヤの間接参照レイヤである場合、インデックスjを有するレイヤを使用してインデックスiを有するレイヤのピクチャを予測し、インデックスjを有するレイヤがインデックスiを有するレイヤの間接参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0379】
インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであり、インデックスjを有するレイヤが全てのレイヤをトラバースすることによりインデックスkを有するレイヤの参照レイヤであるとき、インデックスjを有するレイヤはインデックスiを有するレイヤの間接レイヤであると決定される。
【0380】
S906 条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定する。
【0381】
具体的には、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるとき、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定される。
【0382】
本出願の実施形態によれば、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止し、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測し、条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定し、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0383】
図10は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートであり、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行されてもよく、
図10に示すように、コーディングされたビデオビットストリームを復号するための方法は、以下のステップ1001~1003を含んでもよい。
【0384】
S1001 コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得し、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である。
【0385】
実施形態では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0386】
S1002 参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である。
【0387】
実施形態では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0388】
S1003 条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む。
【0389】
実施形態では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0390】
実施形態では、ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0391】
実施形態では、ビット深度関連のシンタックスエレメントは、上記のSPSテーブル内のシンタックスエレメントbit_depth_minus8でもよい。
【0392】
bit_depth_minus8は、以下のように、ルマ及びクロマ配列のサンプルのビット深度BitDepthと、ルマ及びクロマ量子化パラメータ範囲オフセットの値QpBdOffsetとを指定する。
【数22】
bit_depth_minus8は0以上8以下の範囲にあるものとする。
【0393】
この実施形態の原理は、
図7に示す実施形態と同様であり、簡潔にするためにここでは説明しない。
【0394】
本出願の実施形態によれば、参照レイヤシンタックスエレメントは、コーディングされたビデオビットストリームをパースすることにより取得され、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上であり、参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上であり、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含み、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0395】
図11は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートであり、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行されてもよく、
図11に示すように、コーディングされたビデオビットストリームを復号するための方法は、以下のステップ1101~1102を含んでもよい。
【0396】
S1101 コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得し、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である。
【0397】
S1102 条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む。
【0398】
この実施形態の原理は、
図8に示す実施形態と同様であり、簡潔にするためにここでは説明しない。
【0399】
本出願の実施形態によれば、参照レイヤシンタックスエレメントは、コーディングされたビデオビットストリームをパースすることにより取得され、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上であり、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含み、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0400】
図10及び11に示す実施形態に基づいて、コーディングされたビデオビットストリームを復号するための方法は、
コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとを取得するステップであり、条件は、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む。
【0401】
図12は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための方法を示す概略フローチャートであり、当該方法は、コーディングされたビデオビットストリームを復号するための装置により実行されてもよく、
図12に示すように、
図10に示す方法に基づいて、コーディングされたビデオビットストリームを復号するための方法は、以下のステップ1201~1206を含んでもよい。
【0402】
S1201 コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得し、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である。
【0403】
S1202 参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定し、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である。
【0404】
S1203 条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む。
【0405】
S1204 インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止する。
【0406】
S1205 インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0407】
S1206 条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値であると決定する。
【0408】
この実施形態の原理は、
図9に示す実施形態と同様であり、簡潔にするためにここでは説明しない。
【0409】
本出願の実施形態によれば、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止し、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測し、条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値であると決定し、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0410】
図13は、本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートであり、当該方法は、ビデオを符号化するための装置により実行されてもよく、
図13に示すように、ビデオを符号化するための方法は、以下のステップ1301~1302を含んでもよい。
【0411】
S1301 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定し、i及びjの双方は整数であり且つ0以上である。
【0412】
ビデオを符号化するための装置(例えば、
図2に示すエンコーダ20)は、例えば、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定し、複数の他のピクチャの同じ或いは異なるピクチャの複数の参照ブロックから参照ブロックを選択し、参照ピクチャ(又は参照ピクチャインデックス)及び/又は参照ブロックの位置(x、y座標)と現在のブロックの位置との間のオフセット(空間オフセット)を、動き推定ユニットへのインター予測パラメータとして提供するように構成されてもよい。
【0413】
S1302 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じである。
【0414】
実施形態では、参照レイヤシンタックスエレメントは、上記のVPSテーブル内のシンタックスエレメントvps_direct_ref_layer_flag[i][j]でもよい。
【0415】
0に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを指定する。1に等しいvps_direct_ref_layer_flag[i][j]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。0以上vps_max_layers_minus1以下の範囲内のi及びjについて、vps_direct_ref_layer_flag[i][j]が存在しないとき、これは0に等しいと推定される。vps_independent_layer_flag[i]が0に等しいとき、vps_direct_ref_layer_flag[i][j]が1に等しいような、0以上i-1以下の範囲内のjの少なくとも1つの値が存在するものとする。
【0416】
変数NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]及びLayerUsedAsRefLayerFlag[j]は以下のように導出される。
【数23】
【0417】
実施形態では、クロマフォーマット関連のシンタックスエレメントは、上記のSPSテーブル内のシンタックスエレメントchroma_format_idcでもよい。
【0418】
chroma_format_idcは、6.2節に指定のように、ルマサンプリングに対するクロマサンプリングを指定する。
【0419】
chroma_format_idc及びseparate_colour_plane_flagの意味は、クロマフォーマットを示すために使用される。
【表9】
【0420】
具体的には、ビデオを符号化するための装置(例えば、
図2におけるエンコーダ20)は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化し、量子化係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ及び/又は他のシンタックスエレメントに対して、例えば、エントロピー符号化アルゴリズム又は方式(例えば、可変長コーディング(VLC, variable length coding)方式、コンテキスト適応型VLC方式(CAVLC, context adaptive VLC scheme)、算術コーディング方式、二値化、コンテキスト適応型バイナリ算術演算コーディング(CABAC, context adaptive binary arithmetic coding)、シンタックスベースのコンテキスト適応型バイナリ算術コーディング(SBAC, syntax based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE, probability interval partitioning entropy)コーディング又は他のエントロピー符号化方法若しくは技術)を適用するか或いは迂回(非圧縮)して、例えば、符号化ビットストリーム21の形式で出力272を介して出力できる符号化ピクチャデータ21を取得するように構成され、それにより、符号化ビットストリームを復号するための装置(例えば、
図3に示すビデオデコーダ30)は、復号のためにパラメータを受信して使用してもよい。符号化ビットストリーム21は、ビデオデコーダ30に送信されてもよく、或いは、後の送信又はビデオデコーダ30による取り出しのためにメモリに記憶されてもよい。
【0421】
本発明の実施形態によれば、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かが決定され、i及びjの双方は整数であり且つ0以上であり、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0422】
図14は、本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートであり、当該方法は、ビデオを符号化するための装置により実行されてもよく、
図14に示すように、
図13に示す方法に基づいて、ビデオを符号化するための方法は、以下のステップ1401~1404を含んでもよい。
【0423】
S1401 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定し、i及びjの双方は整数であり且つ0以上である。
【0424】
S1402 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じである。
【0425】
S1403 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測する。
【0426】
インター予測モードのセット(又は可能なもの)は、利用可能な参照ピクチャ(すなわち、前に少なくとも部分的に復号されたピクチャ、例えば、DBPに記憶されたもの)及び他のインター予測パラメータ、例えば、全体の参照ピクチャ又は参照ピクチャの一部のみ、例えば、現在のブロックの領域の周辺の探索ウィンドウ領域が、最も良く一致する参照ブロックを探索するために使用されるか否か、及び/又は、例えば、ピクセル補間、例えば、ハーフ/セミペル、1/4ペル及び/又は1/16ペル補間が適用されるか否かに依存する。
【0427】
S1404 インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0428】
実施形態では、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでない場合、インデックスjを有するレイヤがインデックスiを有するレイヤの間接参照レイヤであるか否かを決定し、インデックスjを有するレイヤがインデックスiを有するレイヤの間接参照レイヤである場合、インデックスjを有するレイヤを使用してインデックスiを有するレイヤのピクチャを予測し、インデックスjを有するレイヤがインデックスiを有するレイヤの間接参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0429】
本発明の実施形態によれば、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かが決定され、i及びjの双方は整数であり且つ0以上であり、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0430】
図15は、本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートであり、当該方法は、ビデオを符号化するための装置により実行されてもよく、
図15に示すように、ビデオを符号化するための方法は、以下のステップ1501~1502を含んでもよい。
【0431】
S1501 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定し、i及びjの双方は整数であり且つ0以上である。
【0432】
S1502 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じである。
【0433】
実施形態では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0434】
実施形態では、ビット深度関連のシンタックスエレメントは、上記のSPSテーブル内のシンタックスエレメントbit_depth_minus8でもよい。
【0435】
bit_depth_minus8は、以下のように、ルマ及びクロマ配列のサンプルのビット深度BitDepthと、ルマ及びクロマ量子化パラメータ範囲オフセットの値QpBdOffsetとを指定する。
【数24】
bit_depth_minus8は0以上8以下の範囲にあるものとする。
【0436】
この実施形態の原理は、
図13に示す実施形態と同様であり、簡潔にするためにここでは説明しない。
【0437】
本出願の実施形態によれば、実施形態では、ビット深度関連のシンタックスエレメントは、上記のSPSテーブル内のシンタックスエレメントbit_depth_minus8でもよい。
【0438】
bit_depth_minus8は、以下のように、ルマ及びクロマ配列のサンプルのビット深度BitDepthと、ルマ及びクロマ量子化パラメータ範囲オフセットの値QpBdOffsetとを指定する。
【数25】
bit_depth_minus8は0以上8以下の範囲にあるものとする。
【0439】
この実施形態の原理は、
図7に示す実施形態と同様であり、簡潔にするためにここでは説明しない。
【0440】
本発明の実施形態によれば、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かが決定され、i及びjの双方は整数であり且つ0以上であり、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にし、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0441】
図16は、本出願の実施形態によるビデオを符号化するための方法を示す概略フローチャートであり、当該方法は、ビデオを符号化するための装置により実行されてもよく、
図16に示すように、
図15に示す方法に基づいて、ビデオを符号化するための方法は、以下のステップ1601~1604を含んでもよい。
【0442】
S1601 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定し、i及びjの双方は整数であり且つ0以上である。
【0443】
S1602 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じである。
【0444】
S1603 インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測する。
【0445】
S1604 インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0446】
本発明の実施形態によれば、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かが決定され、i及びjの双方は整数であり且つ0以上であり、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測し、レイヤ間予測のための現在のレイヤ及び参照レイヤのフォーマットの制約が達成され、それにより設計を簡単にする。
【0447】
図17は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図であり、
図17に示すように、コーディングされたビデオビットストリームを復号するための装置は、取得ユニット1701、決定ユニット1702及び予測ユニット1703を含んでもよい。
【0448】
取得ユニット1701は、コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成され、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である。
【0449】
決定ユニット1702は、参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するように構成され、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である。
【0450】
予測ユニット1703は、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成され、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む。
【0451】
実施形態では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0452】
実施形態では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0453】
実施形態では、クロマフォーマット関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0454】
取得ユニット1701は、
図3におけるデコーダ30のエントロピー復号ユニット304でもよく或いはこれに含まれてもよく、決定ユニット1702は、
図3におけるデコーダ30のモード適用ユニット360でもよく或いはこれに含まれてもよく、予測ユニット1703は、
図3におけるデコーダ30のインター予測ユニット344でもよく或いはこれに含まれてもよい。
【0455】
取得ユニット1701、決定ユニット1702及び予測ユニット1703は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0456】
この実施形態におけるコーディングされたビデオビットストリームを復号するための装置は、
図7における方法を実行するように構成されてもよく、
図7に示す方法に関連するコーディングされたビデオビットストリームを復号するための装置はまた、
図17に示すコーディングされたビデオビットストリームを復号するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0457】
図18は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図であり、
図18に示すように、コーディングされたビデオビットストリームを復号するための装置は、取得ユニット1801及び予測ユニット1802を含んでもよい。
【0458】
取得ユニット1801は、コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成され、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である。
【0459】
予測ユニット1802は、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成され、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む。
【0460】
取得ユニット1801は、
図3におけるデコーダ30のエントロピー復号ユニット304でもよく或いはこれに含まれてもよく、予測ユニット1802は、
図3におけるデコーダ30のインター予測ユニット344でもよく或いはこれに含まれてもよい。
【0461】
取得ユニット1801及び予測ユニット1802は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0462】
この実施形態におけるコーディングされたビデオビットストリームを復号するための装置は、
図8における方法を実行するように構成されてもよく、
図8に示す方法に関連するコーディングされたビデオビットストリームを復号するための装置はまた、
図18に示すコーディングされたビデオビットストリームを復号するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0463】
図17及び18に示す実施形態に基づいて、取得ユニット1701又は取得ユニット1801は、コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとを取得するように更に構成され、条件は、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じであることを更に含む。
【0464】
図19は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図であり、
図19に示すように、
図17に示す装置に基づいて、コーディングされたビデオビットストリームを復号するための装置は、取得ユニット1701、決定ユニット1702、予測ユニット1703及び停止ユニット1704を含んでもよい。
【0465】
停止ユニット1704は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止するように構成される。
【0466】
予測ユニット1703は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するように更に構成される。
【0467】
決定ユニット1702は、条件が満たされた場合、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定するように更に構成される。
【0468】
この実施形態における停止ユニット1704は、
図3におけるデコーダ30のエントロピー復号ユニット304でもよく或いはこれに含まれてもよい。
【0469】
取得ユニット1701、決定ユニット1702、予測ユニット1703及び停止ユニット1704は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0470】
この実施形態におけるコーディングされたビデオビットストリームを復号するための装置は、
図9における方法を実行するように構成されてもよく、
図9に示す方法に関連するコーディングされたビデオビットストリームを復号するための装置はまた、
図19に示すコーディングされたビデオビットストリームを復号するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0471】
図20は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図であり、
図20に示すように、コーディングされたビデオビットストリームを復号するための装置は、取得ユニット2001、決定ユニット2002及び予測ユニット2003を含んでもよい。
【0472】
取得ユニット2001は、コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成され、参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である。
【0473】
決定ユニット2002は、参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するように構成され、インデックスjを有するレイヤは、インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である。
【0474】
予測ユニット2003は、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成され、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることを含む。
【0475】
実施形態では、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定する場合、インデックスjを有するレイヤは、インデックスiを有するレイヤの参照レイヤである。
【0476】
実施形態では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0477】
実施形態では、参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS, video parameter set)レベルのシンタックスエレメントであり、VPSは、インデックスjを有するレイヤ及びインデックスiを有するレイヤに適用される。
【0478】
実施形態では、ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS, sequence parameter set)レベルのシンタックスエレメントであり、SPSは、インデックスjを有するレイヤ又はインデックスiを有するレイヤに適用される。
【0479】
取得ユニット2001は、
図3におけるデコーダ30のエントロピー復号ユニット304でもよく或いはこれに含まれてもよく、決定ユニット2002は、
図3におけるデコーダ30のモード適用ユニット360でもよく或いはこれに含まれてもよく、予測ユニット2003は、
図3におけるデコーダ30のインター予測ユニット344でもよく或いはこれに含まれてもよい。
【0480】
取得ユニット2001、決定ユニット2002及び予測ユニット2003は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0481】
この実施形態におけるコーディングされたビデオビットストリームを復号するための装置は、
図10における方法を実行するように構成されてもよく、
図10に示す方法に関連するコーディングされたビデオビットストリームを復号するための装置はまた、
図20に示すコーディングされたビデオビットストリームを復号するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0482】
図21は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図であり、
図21に示すように、コーディングされたビデオビットストリームを復号するための装置は、取得ユニット2101及び予測ユニット2102を含んでもよい。
【0483】
取得ユニット2101は、コーディングされたビデオビットストリームをパースすることにより、参照レイヤシンタックスエレメントを取得するように構成され、参照レイヤシンタックスエレメントの値は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びjの双方は整数であり且つ0以上である。
【0484】
予測ユニット2102は、条件が満たされた場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成され、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、条件は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む。
【0485】
取得ユニット2101は、
図3におけるデコーダ30のエントロピー復号ユニット304でもよく或いはこれに含まれてもよく、予測ユニット2102は、
図3におけるデコーダ30のインター予測ユニット344でもよく或いはこれに含まれてもよい。
【0486】
取得ユニット2101及び予測ユニット2102は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0487】
この実施形態におけるコーディングされたビデオビットストリームを復号するための装置は、
図11における方法を実行するように構成されてもよく、
図11に示す方法に関連するコーディングされたビデオビットストリームを復号するための装置はまた、
図21に示すコーディングされたビデオビットストリームを復号するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0488】
図20及び21に示す実施形態に基づいて、取得ユニット2001又は取得ユニット2101は、コーディングされたビデオビットストリームをパースすることにより、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとを取得するように更に構成され、条件は、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであることを更に含む。
【0489】
図22は、本出願の実施形態によるコーディングされたビデオビットストリームを復号するための装置を示す構造図であり、
図22に示すように、
図20に示す装置に基づいて、コーディングされたビデオビットストリームを復号するための装置は、取得ユニット2001、決定ユニット2002、予測ユニット2003及び停止ユニット2004を含んでもよい。
【0490】
停止ユニット2004は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであり、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じでない場合、コーディングされたビデオビットストリームを復号するのを停止するように構成される。
【0491】
予測ユニット2003は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測するように更に構成される。
【0492】
決定ユニット2002は、コーディングされたビデオビットストリームをパースすることによりインデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントを取得せずに、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値がインデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値であると決定するように更に構成される。
【0493】
この実施形態における停止ユニット2004は、
図3におけるデコーダ30のエントロピー復号ユニット304でもよく或いはこれに含まれてもよい。
【0494】
取得ユニット2001、決定ユニット2002、予測ユニット2003及び停止ユニット2004は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0495】
この実施形態におけるコーディングされたビデオビットストリームを復号するための装置は、
図12における方法を実行するように構成されてもよく、
図12に示す方法に関連するコーディングされたビデオビットストリームを復号するための装置はまた、
図22に示すコーディングされたビデオビットストリームを復号するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0496】
図7~12における方法を実行するための装置又は
図17~22におけるコーディングされたビデオビットストリームを復号するための装置は、
図1Aにおける宛先デバイス14、
図1Bにおけるビデオデコーダ30、
図3におけるデコーダ30、
図4におけるビデオコーディングデバイス400又は
図5における装置500でもよく或いはこれに含まれてもよい点に留意すべきである。
【0497】
図23は、本出願の実施形態によるビデオを符号化するための装置を示す構造図であり、
図23に示すように、ビデオを符号化するための装置は、決定ユニット2301及び符号化ユニット2302を含んでもよい。
【0498】
決定ユニット2301は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するように構成され、i及びjの双方は整数であり且つ0以上である。
【0499】
符号化ユニット2302は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントとをビデオビットストリームに符号化するように構成され、インデックスiを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるクロマフォーマット関連のシンタックスエレメントの値と同じである。
【0500】
決定ユニット2301は、
図2におけるデコーダ20のモード選択ユニット260でもよく或いはこれに含まれてもよく、符号化ユニット2302は、
図2におけるエンコーダ20のエントロピー符号化ユニット270でもよく或いはこれに含まれてもよい。
【0501】
決定ユニット2301及び符号化ユニット2302は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0502】
この実施形態におけるビデオを符号化するための装置は、
図13における方法を実行するように構成されてもよく、
図13に示す方法に関連するビデオを符号化するための装置はまた、
図23に示すビデオを符号化するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0503】
図24は、本出願の実施形態によるビデオを符号化するための装置を示す構造図であり、
図24に示すように、
図23に示す装置に基づいて、ビデオを符号化するための装置は、第1の予測ユニット2303及び第2の予測ユニット2304を更に含んでもよい。
【0504】
第1の予測ユニット2303は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成される。
【0505】
第2の予測ユニット2304は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0506】
第1の予測ユニット2303及び第2の予測ユニット2304は、
図2におけるデコーダ20のインター予測ユニット244でもよく或いはこれに含まれてもよい。
【0507】
決定ユニット2301、符号化ユニット2302、第1の予測ユニット2303及び第2の予測ユニット2304は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0508】
この実施形態におけるビデオを符号化するための装置は、
図14における方法を実行するように構成されてもよく、
図14に示す方法に関連するビデオを符号化するための装置はまた、
図24に示すビデオを符号化するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0509】
図25は、本出願の実施形態によるビデオを符号化するための装置を示す構造図であり、
図25に示すように、ビデオを符号化するための装置は、決定ユニット2501及び符号化ユニット2502を含んでもよい。
【0510】
決定ユニット2301は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するように構成され、i及びjの双方は整数であり且つ0以上である。
【0511】
符号化ユニット2502は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する値を有する参照レイヤシンタックスエレメントをビデオビットストリームに符号化し、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントとをビデオビットストリームに符号化するように構成され、インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じである。
【0512】
実施形態では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0513】
決定ユニット2501は、
図2におけるデコーダ20のモード選択ユニット260でもよく或いはこれに含まれてもよく、符号化ユニット2502は、
図2におけるエンコーダ20のエントロピー符号化ユニット270でもよく或いはこれに含まれてもよい。
【0514】
決定ユニット2501及び符号化ユニット2502は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0515】
この実施形態におけるビデオを符号化するための装置は、
図15における方法を実行するように構成されてもよく、
図15に示す方法に関連するビデオを符号化するための装置はまた、
図25に示すビデオを符号化するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0516】
図26は、本出願の実施形態によるビデオを符号化するための装置を示す構造図であり、
図26に示すように、
図25に示す装置に基づいて、ビデオを符号化するための装置は、第1の予測ユニット2503及び第2の予測ユニット2504を更に含んでもよい。
【0517】
第1の予測ユニット2503は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤである場合、インデックスjを有するレイヤに基づいてインデックスiを有するレイヤのピクチャを予測するように構成される。
【0518】
第2の予測ユニット2504は、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤでない場合、インデックスjを有するレイヤを使用せずにインデックスiを有するレイヤのピクチャを予測する。
【0519】
第1の予測ユニット2503及び第2の予測ユニット2504は、
図2におけるデコーダ20のインター予測ユニット244でもよく或いはこれに含まれてもよい。
【0520】
決定ユニット2501、符号化ユニット2502、第1の予測ユニット2503及び第2の予測ユニット2504は、ソフトウェアモジュール又はハードウェア回路でもよい点に留意すべきである。
【0521】
この実施形態におけるビデオを符号化するための装置は、
図16における方法を実行するように構成されてもよく、
図16に示す方法に関連するビデオを符号化するための装置はまた、
図26に示すビデオを符号化するための装置と同じように構成されてもよく、これは、簡潔にするためにここでは再び説明しない。
【0522】
図13~16における方法を実行するための装置又は
図23~26におけるビデオを符号化するための装置は、
図1Aにおけるソースデバイス12、
図1Bにおけるビデオエンコーダ20、
図2におけるエンコーダ20、
図4におけるビデオコーディングデバイス400又は
図5における装置500でもよく或いはこれに含まれてもよい点に留意すべきである。
【0523】
本出願は、
図13~16に示す本出願の実施形態のいずれか1つによる方法を実行するための処理回路を含むエンコーダを更に提供する。
【0524】
この実施形態におけるエンコーダは、
図1Aにおけるソースデバイス12、
図1Bにおけるビデオエンコーダ20、
図2におけるエンコーダ20、
図4におけるビデオコーディングデバイス400又は
図5における装置500でもよく或いはこれに含まれてもよい点に留意すべきである。
【0525】
本出願は、
図7~12に示す本出願の実施形態のいずれか1つによる方法を実行するための処理回路を含むデコーダを更に提供する。
【0526】
この実施形態におけるデコーダは、
図1Aにおける宛先デバイス14、
図1Bにおけるビデオデコーダ30、
図3におけるデコーダ30、
図4におけるビデオコーディングデバイス400又は
図5における装置500でもよく或いはこれに含まれてもよい点に留意すべきである。
【0527】
本出願は、コンピュータ又はプロセッサ上で実行されたとき、
図7~16に示す本出願の実施形態のいずれか1つによる方法を実行するためのプログラムコードを含むコンピュータプログラム製品を更に提供する。
【0528】
本出願はデコーダを更に提供し、デコーダは、1つ以上のプロセッサと、1つ以上のプロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体とを含み、プログラミングは、プロセッサにより実行されたとき、
図7~
図12に示す本出願の実施形態のいずれか1つによる方法を実行するようにデコーダを構成する。
【0529】
この実施形態におけるデコーダは、
図1Aにおける宛先デバイス14、
図1Bにおけるビデオデコーダ30、
図3におけるデコーダ30、
図4におけるビデオコーディングデバイス400又は
図5における装置500でもよく或いはこれに含まれてもよい点に留意すべきである。
【0530】
本出願はエンコーダを更に提供し、エンコーダは、1つ以上のプロセッサと、1つ以上のプロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体とを含み、プログラミングは、プロセッサにより実行されたとき、
図13~
図16に示す本出願の実施形態のいずれか1つによる方法を実行するようにエンコーダを構成する。
【0531】
この実施形態におけるエンコーダは、
図1Aにおけるソースデバイス12、
図1Bにおけるビデオエンコーダ20、
図2におけるエンコーダ20、
図4におけるビデオコーディングデバイス400又は
図5における装置500でもよく或いはこれに含まれてもよい点に留意すべきである。
【0532】
本出願は、コンピュータデバイスにより実行されたとき、コンピュータデバイスに本発明の実施形態のいずれか1つの方法を実行させるプログラムコードを搬送する非一時的なコンピュータ読み取り可能媒体を更に提供する。
【0533】
本出願は、ピクチャ復号デバイスにより復号される符号化ビットストリームを含む非一時的な記憶媒体を更に提供し、ビットストリームは、少なくとも1つのレイヤの符号化データを含み、ビットストリームは、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントと、インデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントとを更に含み、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるとき、インデックスiを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値は、インデックスjを有するレイヤのクロマフォーマット関連のシンタックスエレメントの値と同じであり、i及びjの双方は整数であり且つ0以上である。
【0534】
本出願は、ピクチャ復号デバイスにより復号される符号化ビットストリームを含む非一時的な記憶媒体を更に提供し、ビットストリームは、少なくとも1つのレイヤの符号化データを含み、ビットストリームは、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントと、インデックスjを有するレイヤのビット深度関連のシンタックスエレメントとを更に含み、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるとき、インデックスiを有するレイヤのビット深度関連のシンタックスエレメントの値は、インデックスjを有するレイヤのビット深度関連のシンタックスエレメントの値と同じであり、i及びjの双方は整数であり且つ0以上である。
【0535】
実施形態では、ビット深度関連のシンタックスエレメントは、ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する。
【0536】
実施形態では、ビットストリームは、参照レイヤシンタックスエレメントを更に含み、インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであることは、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを参照レイヤシンタックスエレメントの値が指定することを含む。
【0537】
以下は、上記の実施形態に示す符号化方法及び復号方法並びにこれられを使用するシステムの適用の例である。
【0538】
図27は、コンテンツ配信サービスを実現するためのコンテンツ供給システム3100を示すブロック図である。このコンテンツ供給システム3100は、キャプチャデバイス3102、端末デバイス3106を含み、任意選択でディスプレイ3126を含む。キャプチャデバイス3102は、通信リンク3104上で端末デバイス3106と通信する。通信リンクは、上記の通信チャネル13を含んでもよい。通信リンク3104は、WIFI、イーサネット、ケーブル、無線(3G/4G/5G)、USB又はこれらのいずれかの種類の組み合わせ等を含むが、これらに限定されない。
【0539】
キャプチャデバイス3102は、データを生成し、上記の実施形態に示すような符号化方法によりデータを符号化してもよい。代替として、キャプチャデバイス3102は、データをストリーミングサーバ(図面に図示せず)に配信してもよく、サーバは、データを符号化し、符号化データを端末デバイス3106に送信する。キャプチャデバイス3102は、カメラ、スマートフォン若しくはパッド、コンピュータ若しくはラップトップ、ビデオ会議システム、PDA、車載デバイス又はこれらのうちいずれかの組み合わせ等を含むが、これらに限定されない。例えば、キャプチャデバイス3102は、上記のようなソースデバイス12を含んでもよい。データがビデオを含むとき、キャプチャデバイス3102に含まれるビデオエンコーダ20は、実際に、ビデオ符号化処理を実行してもよい。データがオーディオ(すなわち、音声)を含むとき、キャプチャデバイス3102に含まれるオーディオエンコーダは、実際に、オーディオ符号化処理を実行してもよい。いくつかの実際のシナリオでは、キャプチャデバイス3102は、符号化ビデオ及びオーディオデータを、これらを一緒に多重化することにより配信する。他の実際のシナリオでは、例えば、ビデオ会議システムにおいて、符号化オーディオデータ及び符号化ビデオデータは多重化されない。キャプチャデバイス3102は、符号化オーディオデータ及び符号化ビデオデータを端末デバイス3106に別個に配信する。
【0540】
コンテンツ供給システム3100では、端末デバイス310は、符号化データを受信して再生する。端末デバイス3106は、上記の符号化データを復号できるスマートフォン若しくはパッド3108、コンピュータ若しくはラップトップ3110、ネットワークビデオレコーダ(NVR, network video recorder)/デジタルビデオレコーダ(DVR, digital video recorder)3112、TV3114、セットトップボックス(STB, set top box)3116、ビデオ会議システム3118、ビデオ監視システム3120、パーソナルデジタルアシスタント(PDA, personal digital assistant)3122、車載デバイス3124又はこれらのうちいずれかの組合せ等のような、データ受信及び復元能力を有するデバイスでもよい。例えば、端末デバイス3106は、上記のような宛先デバイス14を含んでもよい。符号化データがビデオを含むとき、端末デバイスに含まれるビデオデコーダ30は、ビデオ復号を実行するように優先される。符号化データがオーディオを含むとき、端末デバイスに含まれるオーディオデコーダは、オーディオ復号処理を実行するように優先される。
【0541】
自身のディスプレイを有する端末デバイス、例えば、スマートフォン若しくはパッド3108、コンピュータ若しくはラップトップ3110、ネットワークビデオレコーダ(NVR, network video recorder)/デジタルビデオデコーダ(DVR, digital video recorder)3112、TV3114、パーソナルデジタルアシスタント(PDA, personal digital assistant)3122又は車載デバイス3124では、端末デバイスは、復号データを自身のディスプレイに供給できる。ディスプレイを備えない端末デバイス、例えば、STB3116、ビデオ会議システム3118又はビデオ監視システム3120では、外部ディスプレイ3126が、復号データを受信して表示するために自身に接触される。
【0542】
このシステム内の各デバイスが符号化又は復号を実行するとき、上記の実施形態において示すように、ピクチャ符号化デバイス又はピクチャ復号デバイスが使用できる。
【0543】
図28は、端末デバイス3106の例の構造を示す図である。端末デバイス3106がキャプチャデバイス3102からストリームを受信した後に、プロトコル処理ユニット3202は、ストリームの送信プロトコルを分析する。プロトコルは、リアルタイムストリーミングプロトコル(RTSP, Real Time Streaming Protocol)、ハイパーテキスト転送プロトコル(HTTP, Hyper Text Transfer Protocol)、HTTPライブストリーミングプロトコル(HLS, HTTP Live streaming protocol)、MPEG-DASH、リアルタイムトランスポートプロトコル(RTP, Real-time Transport protocol)、リアルタイムメッセージングプロトコル(RTMP, Real Time Messaging Protocol)又はいずれかの種類のこれらの組み合わせ等を含むが、これらに限定されない。
【0544】
プロトコル処理ユニット3202がストリームを処理した後に、ストリームファイルが生成される。ファイルは、逆多重化ユニット3204に出力される。逆多重化ユニット3204は、多重化データを符号化オーディオデータ及び符号化ビデオデータに分離できる。上記のように、いくつかの実際のシナリオでは、例えば、ビデオ会議システムにおいて、符号化オーディオデータ及び符号化ビデオデータは多重化されない。この状況では、符号化データは、逆多重化ユニット3204を通過せずにビデオデコーダ3206及びオーディオデコーダ3208に送信される。
【0545】
逆多重化処理を介して、ビデオエレメンタリストリーム(ES, elementary stream)、オーディオES及び任意選択のサブタイトルが生成される。上記の実施形態において説明したようなビデオデコーダ30を含むビデオデコーダ3206は、上記の実施形態において示すような復号方法によりビデオESを復号して、ビデオフレームを生成し、このデータを同期ユニット3212に供給する。オーディオデコーダ3208は、オーディオESを復号してオーディオフレームを生成し、このデータを同期ユニット3212に供給する。代替として、ビデオフレームは、同期ユニット3212に供給する前に、バッファ(
図28に図示せず)に記憶してもよい。同様に、オーディオフレームは、同期ユニット3212に供給する前に、バッファ(
図28に図示せず)に記憶してもよい。
【0546】
同期ユニット3212は、ビデオフレーム及びオーディオフレームを同期させ、ビデオ/オーディオをビデオ/オーディオディスプレイ3214に供給する。例えば、同期ユニット3212は、ビデオ及びオーディオ情報の提示を同期させる。情報は、コーディングされたオーディオ及び視覚データの提示に関するタイムスタンプと、データストリーム自身の配信に関するタイムスタンプとを使用してシンタックス内にコーディングしてもよい。
【0547】
サブタイトルがストリームに含まれる場合、サブタイトルデコーダ3210は、サブタイトルを復号し、これをビデオフレーム及びオーディオフレームと同期させ、ビデオ/オーディオ/サブタイトルをビデオ/オーディオ/サブタイトルディスプレイ3216に供給する。
【0548】
本発明は、上記のシステムに限定されず、上記の実施形態におけるピクチャ符号化デバイス又はピクチャ復号デバイスのいずれかは、他のシステム、例えば車両システムに組み込まれることができる。
【0549】
コンテンツ供給システム3100及び端末デバイス3106の双方は、上記の
図7~16における方法を実行するように構成される点に留意すべきである。
【0550】
数学演算子
本願で使用される数学演算子は、Cプログラミング言語で使用されるものと同様である。しかし、整数除算及び算術シフト演算の結果は、より正確に定義され、指数計算及び実数値の除算のような更なる演算子が定義される。番号付け及び計数規則は、一般的に0から始まり、例えば、「第1」は0番目と等価であり、「第2」は1番目と等価である、等である。
【0551】
論理演算子
以下の論理演算子は以下のように定義される。
【表10】
【0552】
論理演算子
以下の論理演算子は以下のように定義される。
x&&y x及びyのブール論理「積」
x||y x及びyのブール論理「和」
! ブール論理「否定」
x?y:z xが真である場合又は0に等しくない場合、yの値に評価され、そうでない場合、zの値に評価される
【0553】
関係演算子
以下の関係演算子は以下のように定義される。
> よりも大きい
>= 以上
< 未満
<= 以下
== 等しい
!= 等しくない
関係演算子が値「na」(not applicable)を割り当てられたシンタックスエレメント又は変数に適用されるとき、値「na」は、シンタックスエレメント又は変数の個別の値として扱われる。値「na」は、いずれかの他の値に等しくないと考えられる。
【0554】
ビット演算子
以下のビット演算子は以下のように定義される。
& ビット毎の「積」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。他の引数よりも少ないビットを含む二値の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することにより拡張される。
| ビット毎の「和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。他の引数よりも少ないビットを含む二値の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することにより拡張される。
^ ビット毎の「排他和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。他の引数よりも少ないビットを含む二値の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することにより拡張される。
x>>y y個の二進数字によるxの2の補数整数表現の算術右シフト。この関数は、yの非負整数値についてのみ定義される。右シフトの結果としての最上位ビット(MSB, most significant bit)にシフトされたビットは、シフト演算前のxのMSBに等しい値を有する。
x<<y y個の二進数字によるxの2の補数整数表現の算術左シフト。この関数は、yの非負整数値についてのみ定義される。左シフトの結果としての最下位ビット(LSB, least significant bit)にシフトされたビットは、0に等しい値を有する。
【0555】
代入演算子
以下の代入演算子は以下のように定義される。
= 代入演算子
++ インクリメント。すなわち、x++はx=x+1に等しい。配列インデックスにおいて使用されるとき、インクリメント演算の前の変数の値に評価される。
-- デクリメント。すなわち、x--はx=x-1に等しい。配列インデックスにおいて使用されるとき、デクリメント演算の前の変数の値に評価される。
+= 指定された量だけのインクリメント。すなわちx+=3はx=x+3に等しく、x+=(-3)はx=x+(-3)に等しい。
-= 指定された量だけのデクリメント。すなわちx-=3はx=x-3に等しく、x-=(-3)はx=x-(-3)に等しい。
【0556】
範囲表記
以下の表記が値の範囲を指定するために使用される。
x=y..z xはy以上z以下の整数値をとり、x、y及びzは整数であり、zはyよりも大きい。
【0557】
数学関数
以下の数学関数が定義される。
【数26】
Asin(x) 三角法の逆正弦関数。-1.0以上1.0以下の範囲にある引数xに対して演算し、ラジアンの単位の-π÷2以上π÷2以下の範囲の出力値を有する。
Atan(x) 三角法の逆正接関数。引数xに対して演算し、ラジアンの単位の-π÷2以上π÷2以下の範囲の出力値を有する。
【数27】
Ceil(x) x以上の最小の整数。
Clip1
Y(x)=Clip3(0,(1<<BitDepth
Y)-1,x)
Clip1
C(x)=Clip3(0,(1<<BitDepth
C)-1,x)
【数28】
Cos(x) ラジアンの単位の引数xに対して演算する三角法の余弦関数。
Floor(x) x以下の最大の整数。
【数29】
Ln(x) xの自然対数(eを底とする対数であり、eは自然対数の底の定数2.718281828...である)。
Log2(x) xの2を底とする対数。
Log10(x) xの10を底とする対数。
【数30】
【数31】
Round(x)=Sign(x)*Floor(Abs(x)+0.5)
【数32】
Sin(x) ラジアンの単位の引数xに対して演算する三角法の正弦関数。
Sqrt(x)=√x
Swap(x,y)=(y,x)
Tan(x) ラジアンの単位の引数xに対して演算する三角法の正接関数。
【0558】
演算優先順位
式の優先順位が括弧の使用により明示的に示されないとき、以下の規則が当てはまる。
-より高い優先度の演算は、より低い優先度のいずれかの演算の前に評価される。
-同じ優先度の演算は、左から右に順次評価される。
【0559】
以下の表は、最高から最低までの演算の優先度を指定し、表におけるより高い位置は、より高い優先度を示す。
【0560】
Cプログラミング言語でも使用される演算子については、本明細書で使用される優先順位は、Cプログラミング言語で使用される優先順位と同じである。
【表11】
【0561】
論理演算のテキスト記述
テキストにおいて、以下の形式:
if(条件0)
ステートメント0
else(条件1)
ステートメント1
...
else /*残りの条件に関する参考注記*/
ステートメントn
で数学的に記述されるような論理演算のステートメントは、以下の方式で記述されてもよい。
...以下の通り/...以下が当てはまる:
-条件0である場合、ステートメント0
-そうでなく、条件1である場合、ステートメント1
-...
-そうでない場合(残りの条件に関する参考注記)、ステートメントn
テキストにおけるそれぞれの「…である場合…、そうでなく、…である場合…、そうでない場合…」のステートメントは、「…である場合」が直後に続く「…以下の通り」又は「…以下が当てはまる」で導入される。「…である場合…、そうでなく、…である場合…、そうでない場合…」の最後の条件は、常に「そうでない場合、…」である。交互に配置される「…である場合…、そうでなく、…である場合…、そうでない場合…」のステートメントは、「そうでない場合、…」で終わる「…以下の通り」又は「…以下が当てはまる」に一致させることにより識別できる。
【0562】
テキストにおいて、以下の形式:
if(条件0a&&条件0b)
ステートメント0
else if(条件1a||条件1b)
ステートメント1
...
else
ステートメントn
で数学的に記述されるような論理演算のステートメントは、以下の方式で記述されてもよい。
...以下の通り/...以下が当てはまる:
-以下の条件の全てが真である場合、ステートメント0:
-条件0a
-条件0b
-そうでなく、以下の条件のうち1つ以上が真である場合、ステートメント1:
-条件1a
-条件1b
-…
-そうでない場合、ステートメントn
【0563】
テキストにおいて、以下の形式:
if(条件0)
ステートメント0
if(条件1)
ステートメント1
で数学的に記述されるような論理演算のステートメントは、以下の方式で記述されてもよい。
条件0であるとき、ステートメント0
条件1であるとき、ステートメント1
【0564】
本発明の実施形態について、主にビデオコーディングに基づいて説明したが、コーディングシステム10、エンコーダ20及びデコーダ30(及び対応してシステム10)の実施形態、並びにここに記載の他の実施形態はまた、静止画ピクチャ処理又はコーディング、すなわち、ビデオコーディングにおけるような、いずれかの前の或いは又は連続するピクチャと独立した個々のピクチャの処理又はコーディングについて構成されてもよい点に留意すべきである。一般的に、ピクチャ処理コーディングが単一のピクチャ17に限定される場合、インター予測ユニット244(エンコーダ)及び344(デコーダ)のみが利用可能でなくてもよい。ビデオエンコーダ20及びビデオデコーダ30の全ての他の機能(ツール又は技術とも呼ばれる)は、静止画ピクチャ処理、例えば、残差計算204/304、変換206、量子化208、逆量子化210/310、(逆)変換212/312、パーティション262/362、イントラ予測254/354、及び/又はループフィルタリング220、320、並びにエントロピーコーディング270及びエントロピー復号304に同等に使用されてもよい。
【0565】
例えば、エンコーダ20及びデコーダ30の実施形態、並びに、例えば、エンコーダ20及びデコーダ30に関してここに記載した機能は、ハードウェア、ソフトウェア、ファームウェア又はこれらのいずれかの組み合わせで実現されてもよい。ソフトウェアで実現される場合、機能は、1つ以上の命令又はコードとしてコンピュータ読み取り可能媒体に記憶され或いは通信媒体上で送信され、ハードウェアベースの処理ユニットにより実行されてもよい。コンピュータ読み取り可能媒体は、データ記憶媒体のような有形媒体に対応するコンピュータ読み取り可能記憶媒体、又は例えば、通信プロトコルに従って或る場所から他の場所へのコンピュータプログラムの転送を容易にするいずれかの媒体を含む通信媒体を含んでもよい。このように、コンピュータ読み取り可能媒体は、一般的に、(1)非一時的である有形コンピュータ読み取り可能記憶媒体、又は(2)信号若しくは搬送波のような通信媒体に対応してもよい。データ記憶媒体は、本開示に記載の技術の実現のために命令、コード及び/又はデータ構造を取り出すために、1つ以上のコンピュータ又は1つ以上のプロセッサによりアクセスできるいずれかの利用可能な媒体でもよい。コンピュータプログラム製品は、コンピュータ読み取り可能媒体を含んでもよい。
【0566】
限定ではなく例として、このようなコンピュータ読み取り可能記憶媒体は、RAM、ROM、EEPROM、CD-ROM若しくは他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気記憶デバイス、フラッシュメモリ、又は命令若しくはデータ構造の形式で所望のプログラムコードを記憶するために使用でき且つコンピュータによりアクセスできるいずれかの他の媒体を含むことができる。また、いずれかの接続は、適切にコンピュータ読み取り可能媒体と呼ばれる。例えば、命令が、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線(DSL, digital subscriber line)、又は赤外線、無線及びマイクロ波のような無線技術を使用してウェブサイト、サーバ又は他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、又は赤外線、無線及びマイクロ波のような無線技術は、媒体の定義に含まれる。しかし、コンピュータ読み取り可能記憶媒体及びデータ記憶媒体は、接続、搬送波、信号又は他の一時的な媒体を含まないが、代わりに非一時的な有形記憶媒体を対象とすることが理解されるべきである。ディスク(disk)及びディクス(disc)は、ここで使用されるとき、コンパクトディスク(CD, compact disc)、レーザディスク、光ディスク、デジタル多用途ディスク(DVD, digital versatile disc)、フロッピーディスク及びブルーレイディスクを含み、ディスク(disk)は通常ではデータを磁気的に再生し、ディスク(disc)はデータをレーザで光学的に再生する。上記の組み合わせも、コンピュータ読み取り可能媒体の範囲に含まれるべきである。
【0567】
命令は、1つ以上のデジタルシグナルプロセッサ(DSP, digital signal processor)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC, application specific integrated circuit)、フィールドプログラマブルロジックアレイ(FPGA, field programmable logic array)又は他の等価な集積若しくは個別論理回路のような1つ以上のプロセッサにより実行されてもよい。したがって、「プロセッサ」という用語は、ここで使用されるとき、上記の構造のうちいずれか又はここに記載の技術の実現方式に適したいずれかの他の構造を示してもよい。さらに、いくつかの態様では、ここに記載の機能は、符号化及び復号のために構成された専用のハードウェア及び/又はソフトウェアモジュール内に提供されてもよく或いは結合されたコーデックに組み込まれてもよい。また、技術は、1つ以上の回路又は論理素子に完全に実現されてもよい。
【0568】
本開示の技術は、無線ハンドセット、集積回路(IC, integrated circuit)又はICのセット(例えば、チップセット)を含む広範なデバイス又は装置に実現されてもよい。様々なコンポーネント、モジュール又はユニットは、開示の技術を実行するように構成されたデバイスの機能的側面を強調するように本開示において記載されているが、異なるハードウェアユニットによる実現を必ずしも必要としない。むしろ、上記のように、様々なユニットは、適切なソフトウェア及び/又はファームウェアと組み合わせて、コーデックハードウェアユニットに結合されてもよく、或いは、上記のような1つ以上のプロセッサを含む相互運用ハードウェアユニットの集合により提供されてもよい。
【手続補正書】
【提出日】2024-07-18
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コーディングされたビデオビットストリームを復号するための方法であって、
前記コーディングされたビデオビットストリームをパースすることにより、量子化された係数及び参照レイヤシンタックスエレメントを取得するステップであり、前記参照レイヤシンタックスエレメントの値は、インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを指定し、i及びkの双方は整数であり且つ0以上である、ステップと、
前記参照レイヤシンタックスエレメントの値に基づいてインデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであるか否かを決定するステップであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、ステップと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤの予測ブロックを取得するステップであり、前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値は、前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの値と同じであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることを含む、ステップと、
前記量子化された係数に基づいて、再構成された残差ブロックを取得するステップと、
前記再構成された残差ブロック及び前記予測ブロックに基づいて、再構成されたブロックを取得するステップと
を含む方法。
【請求項2】
前記インデックスkを有するレイヤが前記インデックスiを有するレイヤの直接参照レイヤであることを前記参照レイヤシンタックスエレメントの値が指定する場合、前記インデックスjを有するレイヤは、前記インデックスiを有するレイヤの参照レイヤである、請求項1に記載の方法。
【請求項3】
前記参照レイヤシンタックスエレメントは、ビデオパラメータセット(VPS)レベルのシンタックスエレメントであり、前記VPSは、前記インデックスjを有するレイヤ及び前記インデックスiを有するレイヤに適用される、請求項1又は2に記載の方法。
【請求項4】
前記ビット深度関連のシンタックスエレメントは、シーケンスパラメータセット(SPS)レベルのシンタックスエレメントであり、前記SPSは、前記インデックスjを有するレイヤ又は前記インデックスiを有するレイヤに適用される、請求項1乃至3のうちいずれか1項に記載の方法。
【請求項5】
前記コーディングされたビデオビットストリームをパースすることにより、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントと、前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントとを取得するステップであり、前記条件は、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じであることを更に含む、ステップを更に含む、請求項1乃至4のうちいずれか1項に記載の方法。
【請求項6】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであり、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値と同じでない場合、前記コーディングされたビデオビットストリームを復号するのを停止するステップを更に含む、請求項1又は2に記載の方法。
【請求項7】
前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤでない場合、前記インデックスjを有するレイヤを使用せずに前記インデックスiを有するレイヤのピクチャを予測するステップを更に含む、請求項1又は2に記載の方法。
【請求項8】
前記条件が満たされた場合、前記コーディングされたビデオビットストリームをパースすることにより前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントを取得せずに、前記インデックスiを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値が前記インデックスjを有するレイヤに適用される前記ビット深度関連のシンタックスエレメントの値であると決定するステップを更に含む、請求項1乃至7のうちいずれか1項に記載の方法。
【請求項9】
前記ビット深度関連のシンタックスエレメントは、前記ビット深度関連のシンタックスエレメントが適用されるレイヤ内のピクチャのルマ及びクロマサンプルのビット深度を指定する、請求項1乃至8のうちいずれか1項に記載の方法。
【請求項10】
ビデオを符号化するための方法であって、
インデックスkを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであるか否かを決定するステップであり、i及びkの双方は整数であり且つ0以上である、ステップと、
前記決定するステップの決定結果に応じて、前記インデックスkを有するレイヤが前記インデックスiを有するレイヤの前記直接参照レイヤであるか否かを示す参照レイヤシンタックスエレメントの値を取得するステップと、
インデックスjを有するレイヤがインデックスiを有するレイヤの参照レイヤであるか否かを決定するステップであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、jは整数であり且つ0以上である、ステップと、
条件が満たされた場合、前記インデックスjを有するレイヤに基づいて前記インデックスiを有するレイヤの予測ブロックを取得するステップであり、前記条件は、前記インデックスjを有するレイヤが前記インデックスiを有するレイヤの参照レイヤであることを含む、ステップと、
前記インデックスiを有するレイヤに適用されるビット深度関連のシンタックスエレメントの第1の値を取得するステップと、
前記インデックスjを有するレイヤに適用されるビット深度関連のシンタックスエレメントの第2の値を取得するステップであり、前記インデックスjを有するレイヤは、前記インデックスkを有するレイヤの参照レイヤであり、前記第1の値は前記第2の値と同じである、ステップと、
前記インデックスiを有するレイヤの前記予測ブロックに基づいて前記インデックスiを有するレイヤの量子化された係数を取得するステップと、
前記参照レイヤシンタックスエレメントの前記値、前記インデックスiを有するレイヤの前記量子化された係数、前記第1の値及び前記第2の値をビデオビットストリームに符号化するステップと
を含む方法。
【請求項11】
請求項10に記載の方法を実行するための処理回路を含むエンコーダ。
【請求項12】
請求項1乃至9のうちいずれか1項に記載の方法を実行するための処理回路を含むデコーダ。
【請求項13】
1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合され、前記プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体と
を含むデコーダであって、
前記プログラミングは、前記プロセッサにより実行されたとき、請求項1乃至9のうちいずれか1項に記載の方法を実行するように当該デコーダを構成する、デコーダ。
【請求項14】
エンコーダであって、
1つ以上のプロセッサと、
前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体であり、前記プログラミングは、前記プロセッサにより実行されたとき、請求項10に記載の方法を実行するように当該エンコーダを構成する、非一時的なコンピュータ読み取り可能記憶媒体と、
前記参照レイヤシンタックスエレメントの前記値、前記インデックスiを有するレイヤの前記量子化された係数、前記第1の値及び前記第2の値を含む前記ビデオビットストリームを記憶するように構成されたストレージと
を含むエンコーダ。
【外国語明細書】