(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-05
(54)【発明の名称】ドリフトを抑制するビデオ符号化の概念
(51)【国際特許分類】
H04N 19/70 20140101AFI20240227BHJP
H04N 19/50 20140101ALI20240227BHJP
【FI】
H04N19/70
H04N19/50
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023545334
(86)(22)【出願日】2022-02-26
(85)【翻訳文提出日】2023-09-26
(86)【国際出願番号】 EP2022054900
(87)【国際公開番号】W WO2022180261
(87)【国際公開日】2022-09-01
(32)【優先日】2021-02-26
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】スクピン ロベルト
(72)【発明者】
【氏名】バートニク クリスチャン
(72)【発明者】
【氏名】ヴィツコフスキー アダム
(72)【発明者】
【氏名】サンチェス デ ラ フエンテ ヤゴ
(72)【発明者】
【氏名】ヘルゲ コーネリアス
(72)【発明者】
【氏名】ブロス ベンヤミン
(72)【発明者】
【氏名】ツェル トーマス
(72)【発明者】
【氏名】ウィーガンド トーマス
(72)【発明者】
【氏名】マーペ デトレフ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LB05
5C159MA04
5C159MA05
5C159MA14
5C159MA21
5C159MA33
5C159MC11
5C159ME01
5C159NN11
5C159NN21
5C159PP16
5C159RC11
5C159RC12
5C159UA02
5C159UA05
5C159UA16
5C159UA33
(57)【要約】
データストリームからビデオをデコードするビデオデコーダが、ビデオのピクチャのシーケンスに対して有効であり、ピクチャのシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーションをデータストリームからデコードするように構成される。
【選択図】なし
【特許請求の範囲】
【請求項1】
データストリームからビデオをデコードするためのビデオデコーダであって、
前記ビデオのピクチャのシーケンスに対して有効であり、前記ピクチャのシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーションを前記データストリームからデコードするように構成される、前記ビデオデコーダ。
【請求項2】
前記1つ以上の符号化ツールの所定のセットが、
クロスコンポーネント線形モデルベースの予測ツール(100)、及び/または
デコーダ側動きベクトルリファインメントツール(400)、を含む、請求項1に記載のビデオデコーダ。
【請求項3】
前記インディケーションは、補足拡張情報メッセージに含まれる、請求項1から2のいずれかに記載のビデオデコーダ。
【請求項4】
前記インディケーションは、前記ピクチャのシーケンス内の前記RASLピクチャの前記符号化に関して、前記1つ以上の符号化ツールの所定のセットの全ての符号化ツールの除外を集合的に示す1ビットを含む、請求項1から3のいずれかに記載のビデオデコーダ。
【請求項5】
前記デコーダは、参照ピクチャのリサンプリングをサポートするように構成されており、前記参照ピクチャのリサンプリングに従って、インター予測ブロックの参照ピクチャが、参照ピクチャと、前記インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記サンプルリサンプリングの対象となる、請求項1から4のいずれかに記載のビデオデコーダ。
【請求項6】
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化され、この符号化ツールが、デコード順序で、同じピクチャが関連するCRAピクチャに先行する参照ピクチャを有することを示す、及び/または
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能する前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、最上位の時間レイヤに属さない、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、請求項1から5のいずれかに記載のビデオデコーダ。
【請求項7】
前記インディケーションは、前記ピクチャのシーケンス内の前記RASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示し、
前記1つ以上の符号化ツールの所定のセットのうちからの1つ以上の符号化ツールの第1のサブセットについて、第1の特性が適用される全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットのうちから前記1つ以上の符号化ツールの第1のサブセットを除外する前記方法で符号化されるようにし、
前記1つ以上の符号化ツールの所定のセットのうちからの1つ以上の符号化ツールの第2のサブセットについて、第2の特性が適用される全てのRASLピクチャ、または全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットのうちから前記1つ以上の符号化ツールの第2のサブセットを除外する前記方法で符号化されるようにし、前記第1のサブセットと前記第2のサブセットとが互いに素である、請求項1から6のいずれかに記載のビデオデコーダ。
【請求項8】
ビデオをデータストリームにエンコードするためのビデオエンコーダであって、
前記ビデオのピクチャのシーケンスに対して有効であり、前記ピクチャのシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーションを前記データストリームにエンコードするように構成される、ビデオエンコーダ。
【請求項9】
前記1つ以上の符号化ツールの所定のセットが、
クロスコンポーネント線形モデルベースの予測ツール(100)、及び/または
デコーダ側動きベクトルリファインメントツール(400)、を含む、請求項8に記載のビデオエンコーダ。
【請求項10】
前記インディケーションは、補足拡張情報メッセージに含まれる、請求項8から9のいずれかに記載のビデオエンコーダ。
【請求項11】
前記インディケーションは、前記ピクチャのシーケンス内の前記RASLピクチャの前記符号化に関して、前記1つ以上の符号化ツールの所定のセットの全ての符号化ツールの除外を集合的に示す1ビットを含む、請求項8から10のいずれかに記載のビデオエンコーダ。
【請求項12】
前記エンコーダは、参照ピクチャのリサンプリングをサポートするように構成されており、前記参照ピクチャのリサンプリングに従って、インター予測ブロックの参照ピクチャが、参照ピクチャと、前記インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記サンプルリサンプリングの対象となる、請求項8から11のいずれかに記載のビデオエンコーダ。
【請求項13】
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化され、この符号化ツールが、デコード順序で、同じピクチャが関連するCRAピクチャに先行する参照ピクチャを有することを示す、及び/または
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能する前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャのシーケンス内の全てのRASLピクチャが、最上位の時間レイヤに属さない、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、請求項8から12のいずれかに記載のビデオエンコーダ。
【請求項14】
ビデオがエンコードされているデータストリームであって、
前記ビデオのピクチャのシーケンスに対して有効であり、前記ピクチャのシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーションを含む、データストリーム。
【請求項15】
請求項8から13のいずれかに記載のエンコーダによって生成される、請求項14に記載のデータストリーム。
【発明の詳細な説明】
【技術分野】
【0001】
詳細な説明
本出願は、ビデオ符号化、及びドリフトを抑えるのに適した概念に関する。
【0002】
符号化ビデオのHTTPストリーミングは、過去10年間でビデオ配信の重要な経路になってきており、今日ではOTTサービスプロバイダにより公衆インターネットを介して何億人ものユーザに行き渡らせることが可能である。ダイナミックアダプティブストリーミングオーバHTTP(DASH)[1]などの標準プロトコルは、サーバがメディアを時間的にセグメント化された形式で様々なビットレートで提供することにより、サービスプロバイダがメディアをクライアントにストリーミングすることを可能にする。そして、クライアントデバイスは、動的かつ適応的な方法で、利用可能なネットワーク帯域幅とそのデコード機能とに従い、特定のセグメントの提供されたバリアントの中から選択することにより、連続セグメントをダウンロードして連続再生することができる。実際には、コンテンツは、最適化されたビットレートラダーによって生成される複数のいわゆる表現として提供され、これには、特定のビットレートに対する知覚品質と、それによってユーザエクスペリエンスとを最適化するために、多くの場合、複数の解像度と忠実度とが含まれる[2]。各セグメントは、通常、いわゆるクローズドピクチャ群(GOP)符号化構造[2]を使用して、以前のセグメントに依存することなく符号化されるので、ダウンロードされパケット化解除されたセグメントデータは、適合するビットストリームに連結され、デコーダに供給される。このようなクローズドGOP構造とは対照的に、いわゆるオープンGOP符号化構造を使用するセグメントは、符号化効率に有利な前のセグメントのピクチャからのインター予測を使用するいくつかのピクチャを含む。前のセグメントからのインター予測を使用するピクチャは、提示順序で最初に来るため、セグメントにランダムにアクセスする場合、再生の問題や視覚的なアーチファクトを発生させることなく出力からスキップすることができるが、連続再生中に解像度の切り替えが発生すると、そのような非シームレスな切り替えでこれらのピクチャがスキップされるので、問題が発生する。純粋なビットレートの切り替えでも、セグメントが切り替えのために適切にエンコードされていない場合、一部のピクチャがドロップし、または重大な視覚的アーチファクトが発生することがある。
【0003】
AVC[4]やHEVC[5]などの普及した旧世代のコーデックは、異なる解像度の参照ピクチャを使用するために必要な参照ピクチャリサンプリング(RPR)機能を提供しない。したがって、そのようなオープンGOP構造で解像度の切り替えが行われると、その解像度の切り替え後に、前のセグメントからの参照ピクチャが必要な解像度で利用できないため、セグメントの一部のピクチャを正しくデコードすることができず、その結果、ドロップされたピクチャからのセグメント切り替え時に非一定のフレームレートでの再生が行われることになる。[6]では、著者らは、HEVCデコードプロセスに標準的な変更を採用すること、またはRPR機能を提供するあまり普及していないスケーラブルなHEVC拡張機能(SHVC)を使用することにより、オープンGOP解像度切り替えの問題を克服するアプローチを提示している。ただし、利用可能なソリューションでは、これまでのところ、HTTPストリーミングでのオープンGOP符号化の実質的な採用は可能になっていない。
【0004】
最近完成したバーサタイルビデオ符号化(VVC)規格[7]のバージョン1は、ITU-Tのビデオ符号化エキスパートグループとムービングピクチャエキスパートグループの別名でも知られるISO/IECの分科委員会29との共同作業から生まれた最新のビデオ符号化規格である。VVCは、前世代のコーデックと比較して大幅に向上した符号化効率を提供するだけでなく[8]、RPRなどの初期のMain 10プロファイルに多くのアプリケーション主導型の機能をも含む。VVCの開発中、RPRは主に、低遅延符号化構造[9]を使用する対話型シナリオのコンテキストで研究され、そこでは、レイテンシ及びバッファサイズに関する現実の要件により、解像度切り替えのためのイントラ符号化されたピクチャの挿入の実現可能性に対して厳しい制限が設定された。
【0005】
ただし、VVCのRPRは、ストリーミングドメインのビデオエンコードにおける符号化効率に大きな利益をもたらすこともある。
【0006】
VVCなどのコーデックを使用したHTTPストリーミングでオープンGOP解像度切り替えを使用できるようにするコンセプトが手元にあると有利である。その場合、上記で概説した問題は、RPRに関してだけでなく、例えば、異なるSNRと関係があるセグメントを連結してビデオビットストリームを形成するときにも発生する。
【発明の開示】
【発明が解決しようとする課題】
【0007】
したがって、本発明の目的は、例えば、異なるビデオビットストリーム表現間の切り替えの下でのセグメントからなるビデオビットストリームの形成によって引き起こされるドリフトによるビデオ品質への悪影響をより効果的に抑制することを可能にするビデオ符号化概念を提供することである。
【課題を解決するための手段】
【0008】
本願の独立請求項の主題によってこの目的が達成される。
【0009】
本発明の第1の態様による実施形態は、データストリームからビデオをデコードするためのビデオデコーダであって、ビデオのピクチャシーケンスに対して有効であり、ピクチャシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーション(例えば、gci_rasl_pictures_tool_constraint_flag)をビデオデコーダがデータストリームからデコードするように構成される、ビデオデコーダを提供する。例えば、このインディケーションは、異なる空間解像度及び/または異なるSNRで符号化されたビデオの、別々に符号化されたオープンGOPバージョンを連結することによるオープンGOP切り替えが、RASLピクチャに過大なドリフトを引き起こさないことをデコーダが認識しているようにする、一種の約束として機能し得る。さらなる実施形態は、ビデオをデータストリームにエンコードするためのビデオエンコーダであって、ビデオエンコーダが、インディケーションをデータストリームにエンコードするように構成される、ビデオエンコーダを提供する。例えば、RASLピクチャは、ピクチャシーケンスのイントラ符号化ピクチャ(例えばCRA)にデコード順では続くが、提示順ではそれに先行するピクチャを示し、このピクチャは、デコード順でイントラ符号化ピクチャに先行する参照ピクチャを使用することができる。例えば、先行するピクチャは、前のピクチャシーケンスに属していてもよく、例えば、イントラ符号化されたピクチャは、符号化順序でシーケンスの最初のピクチャであってもよい。デコード順序でイントラ符号化されたピクチャに先行するピクチャへの参照が原因で、前のイントラ符号化ピクチャを含むビデオの前セグメントに対して、イントラ符号化されたピクチャで解像度を切り替えるときに、上記のドリフトアーチファクトまたは他の種類のアーチファクトが発生する可能性がある。データストリームにおける上記のインディケーションをシグナリングすることで、前のピクチャシーケンスと比較したピクチャシーケンスでの解像度切り替えが、RASLピクチャ内で過大なドリフトを伴わないことをデコーダに保証することができる。したがって、デコーダは、そのインディケーションに基づいて、解像度の切り替えが好ましいか否かを決定することができる。
【0010】
本発明によるさらなる実施形態は、データストリームからビデオをデコードするためのビデオデコーダであって、ビデオデコーダが、データストリームから、ビデオのピクチャシーケンスのピクチャごとに、それぞれのピクチャについてグローバルに、またはスライスごとに、それぞれのピクチャが1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうかを示すインディケーションを(例えば、sps_extra_ph_bit_present_flag及びph_extra_bitを使用して、またはgci_rasl_pictures_tool_contraint_flagを使用して)デコードすることであって、所定のセットが、(例えば、RASLピクチャでの潜在的なドリフトが十分に低いことを確認できる一種のピクチャに関する指標として)クロスコンポーネント線形モデルベースの予測ツールを含む、デコードすること、を行うように構成されている、ビデオデコーダを提供する。さらなる実施形態は、ビデオをデータストリームにエンコードするためのビデオエンコーダであって、ビデオエンコーダが、インディケーションをデータストリームにエンコードするように構成される、ビデオエンコーダを提供する。
【0011】
本出願の有利な態様は、従属請求項の主題である。本願の好ましい実施形態が、図に関して以下に説明される。
【図面の簡単な説明】
【0012】
【
図3】実施形態によるブロックベースの残差符号化方式を示す。
【
図4】実施形態による2つのセグメントを含むビデオデータストリームを示す。
【
図5】実施形態によるオプティカルフローツールの動作方式を示す。
【
図6】実施形態による符号化ツールの適用方式を示す。
【
図7】実施形態による時間的動きベクトル予測ツールの動作方式を示す。
【
図8】実施形態によるデコーダ側動きベクトルリファインメントツールの動作方式を示す。
【
図9】実施形態によるクロスコンポーネント 線形モデルツールの動作方式を示す。
【
図10】実施形態による輝度マッピング及び彩度スケーリングツールの動作方式を示す。
【
図11】実施形態による輝度マッピング及び彩度スケーリングツールの別の動作方式を示す。
【
図12】オープンGOPシナリオにおける予測誤差の例を示す。
【発明を実施するための形態】
【0013】
以下の図面の説明は、本発明の実施形態が組み込まれ得る符号化フレームワークの一例を形成するために、ビデオのピクチャを符号化するためのブロックベースの予測コーデックのエンコーダ及びデコーダの説明の提示から開始する。それぞれのエンコーダ及びデコーダについて、
図1~
図3を参照して説明する。以下に、本発明の概念の実施形態の説明を、そのような概念が
図1及び
図2のエンコーダ及びデコーダにそれぞれどのように組み込まれ得るかに関する説明と共に提示するが、
図4及びそれ以降に説明する実施形態はまた、
図1及び
図2のエンコーダ及びデコーダの基礎となる符号化フレームワークに従って動作しないエンコーダ及びデコーダを形成するためにも使用され得る。
【0014】
図1は、例示的に変換ベースの残差符号化を使用して、ピクチャA12をデータストリームA14中に予測符号化するための装置を示す。装置、またはエンコーダは、参照記号A10を使用して示される。
図2は、対応するデコーダA20、すなわち、装置A20を示し、この装置もまた、変換ベースの残差デコードを使用して、ピクチャA12’をデータストリームA14から予測デコードするように構成され、アポストロフィは、デコーダA20によって再構築されたピクチャA12’が予測残差信号の量子化によって導入された符号化損失の観点から装置A10によって最初にエンコードされたピクチャA12から逸脱することを示すために使用されている。
図1及び
図2は、変換ベースの予測残差符号化を例示的に使用するが、本出願の実施形態は、この種の予測残差符号化に限定されない。これは、以降に概説されるように、
図1及び
図2に関して説明される他の詳細にも当てはまる。
【0015】
エンコーダA10は、予測残差信号を空間からスペクトルへの変換にかけ、この予測残差信号をデータストリームA14中にエンコード化することで、その中でこの予測残差信号が取得されるように構成される。同様に、デコーダA20は、予測残差信号をデータストリームA14からデコードし、この予測残差信号をスペクトルから空間への変換にかけることで、この予測残差信号が取得されるように構成される。
【0016】
内部では、エンコーダA10は、予測残差信号形成器A22を含み得、この予測残差信号形成器は、元の信号、すなわちピクチャA12から予測信号A26の逸脱を測定するために予測残差A24を生成する。予測残差信号形成器A22は、すなわち、減算器であってもよく、この減算器は、元の信号、例えばピクチャA12から予測信号を減算する。つぎに、エンコーダA10は、変換器A28をさらに含み、この変換器が予測残差信号A24を空間からスペクトルへの変換にかけることで、スペクトル領域予測残差信号A24’を取得する。つぎに、このスペクトル領域予測残差信号は、量子化器A32による量子化にかけられたうえ、エンコーダA10によって含まれる。したがって、量子化された予測残差信号A24’’は、ビットストリームA14中に符号化される。この目的を達成するために、エンコーダA10は、エントロピコーダA34を任意選択で含み得、このエントロピコーダは、変換され量子化された予測残差信号をデータストリームA14中にエントロピ符号化する。予測信号A26は、データストリームA14にエンコードされ、データストリームA14からデコード可能な予測残差信号A24’’に基づいて、エンコーダA10の予測ステージA36によって生成される。この目的を達成するためには、予測ステージA36は、内部に、
図1に示されるように、量子化損失を除き信号A24’に対応するスペクトル領域予測残差信号A24’’’を得るために、予測残差信号A24’’を逆量子化する逆量子化器A38と、その後に、後者の予測残差信号A24’’’を逆変換、すなわちスペクトルから空間への変換にかけ、量子化損失を除き元の予測残差信号A24に対応する予測残差信号A24’’’’を得る逆変換器A40とを含み得る。つぎに、予測ステージA36の合成器A42は、加算などによって、予測信号A26及び予測残差信号A24’’’’を再合成し、再構築された信号46、すなわち元の信号A12の再構築を得る。再構築された信号A46は、信号A12’に対応し得る。次いで、予測ステージA36の予測モジュールA44は、信号A46に基づいて、例えば空間予測、すなわちピクチャ内予測、及び/または時間予測、すなわちピクチャ間予測を使用することによって、予測信号A26を生成する。
【0017】
同様に、デコーダA20は、
図2に示されるように、予測ステージA36に対応し、予測ステージに対応する方法で相互接続される、コンポーネントから内部に構成され得る。特に、デコーダA20のエントロピデコーダA50は、量子化されたスペクトル領域予測残差信号A24’’をデータストリームからエントロピデコードし得、その後で、逆量子化器A52、逆変換器A54、合成器A56及び予測モジュールA58が、予測ステージA36のモジュールに関して上記のように、相互接続され、協働して、予測残差信号A24’’に基づいて再構築された信号を回復させる結果、
図2に示されるように、合成器A56の出力が、再構築された信号、すなわちピクチャA12’になる。
【0018】
具体的に上述されていないが、エンコーダA10が、例えば、符号化コストなどのいくつかのレート及び歪み関連基準を最適化する方法など、いくつかの最適化方式に従って、すなわち、予測モード、動きパラメータなどを含むいくつかの符号化パラメータを設定し得ることが容易に明らかになる。例えば、エンコーダA10及びデコーダA20、ならびに対応するモジュールA44、A58はそれぞれ、イントラ符号化モード及びインター符号化モードなどの異なる予測モードをサポートすることができる。エンコーダ及びデコーダがそれらの予測モードタイプ間で切り替える粒度は、それぞれピクチャA12及びA12’の符号化セグメントまたは符号化ブロックへの細分化に対応し得る。これらの符号化セグメントのユニットでは、例えば、ピクチャは、イントラ符号化されたブロック、及びインター符号化されたブロックに細分化され得る。イントラ符号化されたブロックは、以下により詳細に概説されるように、それぞれのブロックの空間の、既に符号化された/デコードされた近傍に基づいて予測される。いくつかのイントラ符号化モードは、それぞれのイントラ符号化されたセグメントに対して、存在し得、選択され得、指向性または角度イントラ符号化モードを含み得、これらのモードに従って、それぞれのセグメントは、それぞれの指向性イントラ符号化モードに特異的な特定の方向に沿った近傍のサンプル値を、それぞれのイントラ符号化されたセグメント中に外挿することによって埋められる。これらのイントラ符号化モードは、例えば、DC符号化モードであって、このモードに従ってそれぞれのイントラ符号化されたブロックの予測がDC値を、それぞれのイントラ符号化されたセグメント内の全てのサンプルに割り当てるDC符号化モード、及び/または平面イントラ符号化モードであって、このモードに従ってそれぞれのブロックの予測が、近傍サンプルに基づいた二次元線形関数によって定義される平面の傾き及びオフセットの駆動を伴う、それぞれのイントラ符号化されたブロックのサンプル位置にわたる二次元線形関数によって記述されるサンプル値の空間分布であるように近似され、その空間分布であると決定される、平面イントラ符号化モードなどの1つ以上のさらなるモードも含み得る。それらと比較して、インター符号化されたブロックは、例えばテンポラルに、予測され得る。インター符号化されたブロックの場合、動きベクトルは、データストリーム内にシグナリングされ得、動きベクトルは、ピクチャA12が属するビデオの以前に符号化されたピクチャの部分の空間変位を示し、そこでは、以前に符号化された/デコードされたピクチャは、それぞれのインター符号化されたブロックの予測信号を取得するためにサンプリングされる。これは、量子化されたスペクトル領域予測残差信号A24’’を表すエントロピ符号化された変換係数レベルなど、データストリームA14に含まれる残差信号符号化に加えて、データストリームA14が、符号化モードを様々なブロックに割り当てるための符号化モードパラメータ、インター符号化されたセグメントの動きパラメータなど、一部のブロックの予測パラメータ、ならびにピクチャA12及びA12’のセグメントへのそれぞれの分割を制御してシグナリングするためのパラメータなど、任意選択のさらなるパラメータをデータストリームA14中に符号化し得ることを意味する。デコーダA20は、これらのパラメータを使用して、エンコーダが行った方法と同じようにしてピクチャを細分化し、同じ予測モードをセグメントに割り当て、同じ予測を実行し、それによって同じ予測信号をもたらす。
【0019】
図3は、一方では再構築された信号、すなわち、再構築されたピクチャA12’と、他方では、データストリームA14内でシグナリングされた予測残差信号A24’’’’、及び予測信号A26の組み合わせとの間の関係を示す。既に上記に示されるように、この組み合わせは、加算であり得る。予測信号A26は、
図3では、ハッチングを使用して例示的に示されるイントラ符号化されたブロック、及びハッチングされていない例示的に示されるインター符号化されたブロックへのピクチャ領域の細分化として示される。細分化は、正方形ブロックまたは非正方形ブロックの行及び列へのピクチャ領域の規則的な細分化、または四分木細分化など、ツリールートブロックから複数のリーフブロックへのピクチャA12のマルチツリー細分化など、任意の細分化であってよい。
図3には、これらの組み合わせが示されており、ピクチャ領域は、まず、ツリールートブロックの行及び列に細分化され、それらが次に、再帰的なマルチツリー細分化に従って、1つ以上のリーフブロックにさらに細分化される。
【0020】
この場合も、データストリームA14は、イントラ符号化されたブロックA80のためにその中に符号化されたイントラ符号化モードを有し得ることで、いくつかのサポートされたイントラ符号化モードのうちの1つは、それぞれのイントラ符号化されたブロックA80に割り当てられる。インター符号化されたブロックA82の場合、データストリームA14は、その中に符号化された1つ以上の動きパラメータを有し得る。概して、インター符号化されたブロックA82は、テンポラルに符号化されるように制限されない。あるいは、インター符号化ブロックA82は、ピクチャA12が属するビデオの以前に符号化されたピクチャ、あるいは別のビューのピクチャ、またはエンコーダ及びデコーダがそれぞれスケーラブルなエンコーダ及びデコーダである場合の階層的に下位のレイヤのピクチャなど、現在のピクチャA12自体を超えて以前に符号化された部分から予測される任意のブロックであってもよい。
【0021】
図3では、予測残差信号A24’’’’もまた、ピクチャ領域のブロックA84への細分化として示される。これらのブロックは、同じものを符号化ブロックA80及びA82から区別するために変換ブロックと称されてもよい。実際には、
図3は、エンコーダA10及びデコーダA20がピクチャA12及びピクチャA12’のそれぞれのブロックへの2つの異なる細分化、すなわち1つがそれぞれの符号化ブロックA80及びA82への細分化、及びもう1つが変換ブロックA84への細分化を使用し得ることを示す。両方の細分化は、同じもの、すなわちそれぞれ符号化ブロックA80及びA82でもよく、同時に変換ブロックA84を形成し得るが、
図3は、例えば、変換ブロックA84への細分化が符号化ブロックA80、A82への細分化の拡張を形成する場合を示すため、ブロックA80及びA82の2つのブロック間の任意の境界が2つのブロックA84間の境界に重なる、または別の言い方をすれば、各ブロックA80、A82のいずれかが変換ブロックA84のうちの1つと合致する、もしくは変換ブロックA84のクラスタと合致する。ただし、これらの細分化もまた、変換ブロックA84がブロックA80とブロックA82との間のブロック境界を交互に交差し得るように互いから独立して決定され得る、または選択され得る。したがって、変換ブロックA84への細分化が関係する限り、ブロックA80、A82への細分化に関してあげられたものと同様のステートメントは、真であり、すなわち、ブロックA84は、ピクチャ領域のブロックへの通常の細分化の結果(ロウ及びカラムへの配置の有無にかかわらず)、ピクチャ領域の再帰的マルチツリー細分化の結果、またはそれらの組み合わせもしくは任意の他の種類のブロック結果であり得る。余談であるが、ブロックA80、A82及びA84が四角形、矩形または任意の他の形状のものであることに限定されないことに留意する。
【0022】
さらに、
図3は、予測信号A26及び予測残差信号A24’’’’の組み合わせが再構築された信号A12’を直接もたらすことを示す。ただし、代替の実施形態による、1つより多い予測信号A26が予測残差信号A24’’’’と組み合わせられ得ることで、ピクチャA12’になり得ることに留意されたい。
【0023】
図3では、変換ブロックA84は、以下の有意性を有するものとする。変換器A28及び逆変換器A54は、それらの変換をそれらの変換ブロックA84の単位で実行する。例えば、多くのコーデックは、全ての変換ブロックA84のある種のDSTまたはDCTを使用する。いくつかのコーデックは、変換をスキップすることを可能にするため、いくつかの変換ブロックA84には、予測残差信号は、空間領域で直接符号化される。ただし、下記の実施形態によれば、エンコーダA10及びデコーダA20は、いくつかの変換をサポートするような方法で構成される。例えば、エンコーダA10及びデコーダA20によってサポートされる変換は、
o DCT-II(またはDCT-III)(DCTは離散コサイン変換を表す)、
o DST-IV(DSTは離散サイン変換を表す)、
o DCT-IV、
o DST-VII、
o 恒等変換(IT)、
をサポートする。
【0024】
当然、変換器A28は、それらの変換の順方向変換バージョンの全てをサポートするが、デコーダA20または逆変換器A54は、それらの対応する逆方向または逆バージョン、
o 逆DCT-II(または逆DCT-III)、
o 逆DST-IV、
o 逆DCT-IV、
o 逆DST-VII、
o 恒等変換(IT)、
をサポートする。
【0025】
その後の説明では、変換がエンコーダA10及びデコーダA20によってサポートされ得る、さらなる詳細が提供される。いずれの場合も、1つのスペクトルから空間への、または空間からスペクトルへの変換など、1つの変換のみを、サポートされた変換セットが含み得ることに留意されたい。
【0026】
既に上記で概説されるように、
図1から
図3は、以下にさらに説明される本発明の概念が本出願によるエンコーダ及びデコーダの具体的な例を形成するために実装され得る、一例として提示されている。これまでのところ、
図1及び
図2のそれぞれのエンコーダ及びデコーダは、本明細書では下記のエンコーダ及びデコーダの可能な実装を表し得る。ただし、
図1及び
図2は単なる例である。ただし、本出願の実施形態によるエンコーダは、以下により詳細に概説される概念を使用して、例えば、ブロックA80への細分化が
図3に例示されている方法とは異なる方法で実行されるという点などで、
図1のエンコーダとは異なる、ピクチャA12のブロックベースの符号化を実行し得る。同様に、本出願の実施形態によるデコーダは、データストリームA14からのピクチャA12’のブロックベースのデコードを、以下でさらに概説される符号化概念を使用して実行し得るが、例えば、同じものがイントラ予測をサポートしないという点、または
図3に関して説明される方法とは異なる方法で同じものがピクチャA12’をブロックに細分化するという点、及び/または同じものが例えば変換領域ではなく空間領域でデータストリームA14から予測残差を導出するという点で
図2のデコーダA20とは異なり得る。
【0027】
論じたように、
図1から
図3は、後で概説する本願の実施形態の基礎となり得るビデオコーデックの大まかな概要を提供することを単に意図している。例えば、VVCは、
図1及び
図2のビデオデコーダ及びビデオエンコーダが適合し得るビデオコーデックの一例である。
【0028】
以下の説明は次のように構成される。予備的に、ビデオコーデック環境の例としてVVCが使用される。この例に基づいて、以下の説明では、オープンGOP符号化構造の一般的な符号化効率への影響と、セグメントスイッチでのピクチャ品質への影響とを調査した実験について報告する。繰り返しになるが、後で説明する実施形態はVVCに限定されず、これらの実施形態に関して論じた符号化ツールもVVCに関して論じたものに限定されないが、これらの実験とその結果の提示とは、後述する実施形態に導かれる動機を提供する。さらに、以降の説明では、GOP符号化構造とセグメント化との概要を提供し、次いで、オープンGOP解像度切り替えなどのオープンGOP切り替えを可能にし、切り替えに伴うドリフトを効果的に抑制する制約付きエンコードを提示する。その後、VVCに関する考察から明らかになる本願のいくつかの実施形態が提示される。
【0029】
以下に、VVCビットストリーム内の構造とストリーミングのためのメディアセグメンテーションとの概要を示す。メディアセグメントは通常、イントラ符号化ツールのみを使用して、イントラランダムアクセスポイント(IRAP)ピクチャと合わせられている。IRAPピクチャは、符号化されたビデオビットストリームに頻繁に現れて、シークまたは早送りなどの機能を可能にするだけでなく、アダプティブHTTPストリーミングの切り替えポイントとしても機能し得る。ビデオオンデマンド(VoD)ストリーミングのシステムは通常、セグメントをIRAPピクチャ期間に合わせる。つまり、IRAPピクチャは通常セグメントの開始位置に配置され、所望のセグメント期間によりIRAPピクチャ間の時間的距離が決まる。ただし、全てのメディアセグメントにIRAPピクチャが含まれているわけではないユースケース、例えば非常に低遅延のストリーミング、もあるため、IRAPピクチャを待つ必要がなく、小さなセグメントを送信できるようにし、結果としてコンテンツ生成側での遅延を減らすことができる。セグメントサイズは、ターゲット適用に応じて長さが異なる場合がある。例えば、VoDサービスでは、プレーヤがより大きなバッファ(例えば30秒)を構築して、最大数秒(例えば5秒)のセグメントサイズが合理的な設計選択となり得るスループットの変動を埋め合わせすることができる[3]。ただし、より厳格なエンドツーエンドの遅延を必要とするライブサービスでは、クライアント側でそのような大きなバッファを使用することができないため、より頻繁な切り替えポイントと1秒以下の短いセグメントとが必要になる。
【0030】
2つのIRAPピクチャ間のピクチャは、通常、AVC[10]で導入されたように、このような構造が、符号化効率に大きな利点をもたらすので、デコード遅延要件が許す限り、提示前の並べ替えを伴う双方向予測階層GOP構造でエンコードされる。GOPの階層構造は、時間的スケーラビリティのために使用することができ、この場合、所与のレイヤまでの全てのピクチャのデコードが所与のフレームレートに対応し、対応する時間ID(Tid)値が、
図1に示すように、8ピクチャのGOPサイズに対して、各ピクチャに割り当てられる。GOPは、デコード順で最初のTid0ピクチャから次のTid0ピクチャまでの、しかし次のTid0ピクチャを含まない、全てのピクチャとして定義できる。通常、セグメントには、IRAP期間とGOPサイズとに応じて1つ以上のGOP構造が含まれる。HEVCでは、デコードピクチャバッファ(DBP)内の参照ピクチャスロットの量により、通常の16ピクチャのGOPサイズが可能であったが、VVCではDPB容量が増加し、最大32ピクチャの階層GOPサイズが可能になった。
【0031】
デコード順ではIRAPピクチャに続くが、提示順ではIRAPピクチャの前にあるピクチャがHEVCに導入され、リーディングピクチャと呼ばれる。さらに、これらは、ランダムアクセススキップリーディング(RASL)とランダムアクセスデコード可能リーディング(RADL)とに区別され得る。RADLピクチャはデコード順序でIRAPピクチャ以降の参照ピクチャのみを使用できるが、RASLピクチャはさらにIRAPに先行する参照ピクチャを使用することができる。即時ランダムアクセス(IDR)タイプのIRAPピクチャは、DBPをリセットし、いわゆるクローズドGOP構造につながるRADLピクチャであるリーディングピクチャのみを持つことができる。さらに、一方で、クリーンランダムアクセス(CRA)タイプのIRAPピクチャはDPBをリセットしない。したがって、デコード順序でCRAより前から再構成されたピクチャは、将来のピクチャ、つまり、いわゆるオープンGOP符号化構造を可能にするRASLピクチャの参照として利用可能である。RASLピクチャは、RADLピクチャと比較して符号化効率が向上するが、参照ピクチャが利用できない場合、例えば、前のセグメントをデコードせずにセグメントの先頭で関連するIRAPでのランダムアクセス中に、デコード不能になる可能性がある。VVCの高レベルシンタックスのより詳細な概要については、[11]で見つけることができる。
【0032】
例えば、
図4は、異なる解像度を有する2つの連続するセグメントの連結からのビデオデータストリームの形成を示しており、第2のセグメントが、第1のセグメントからの参照ピクチャを有するオープンGOP符号化構造を採用する。特に、参照される参照ピクチャは、
図4で矢印が出ている長方形である。矢印自体は予測の相互依存関係を示している。つまり、矢印は参照ピクチャから参照しているピクチャに向けられている。各ピクチャは、特定の時間ID Tidに関連付けられており、図に示すように、符号化順序はピクチャの出力/提示順序から外れている。図に示すように、出力順序ランク9から15のピクチャは、直接的または間接的に、それらが属するピクチャ自体のセグメントであるセグメント1のCRAピクチャと、前のセグメントであるセグメント0に由来するピクチャ、主に出力順序ランク8のピクチャを参照するRASLピクチャである。例えば、ビデオのセグメントは、例えば、1つのGOPを含み得るピクチャシーケンスとも呼ばれ得る。
【0033】
RASLピクチャの参照ピクチャが前のセグメントに位置し、ストリーミングクライアントがそのような前のセグメントの後に表現を切り替える場合、クライアントデコーダは、エンコーダ側と比較して参照ピクチャの少なくとも一部の異なるバリアントを使用してRASLピクチャをデコードすることになる。このような状況は、コンテンツが適切に生成されない場合、ビットストリームの不適合、または再構成されたRASLピクチャの重大な不一致を引き起こす可能性があり、このドリフトは、関連するCRAピクチャを除く、CRAピクチャまでの全てのRASLピクチャに伝播する可能性がある。以下では、セグメント切り替え時のビットストリーム適合性を維持し、切り替え時の視覚品質に悪影響を及ぼす可能性のある望ましくないドリフトを回避しながら、オープンGOP構造を使用することを可能にする適切なコンテンツの生成について説明する。
【0034】
VVCの多数のインター予測ツールは、オープンGOP切り替えが実行されたときにドリフトを引き起こす様々な可能性を示し、同時にツールの使用は適合性の制約によって制限される。次に、オープンGOP解像度切り替え時のVVCにおけるインター予測ツールのドリフトの可能性を分析し、VVC適合性を確保しながら、オープンGOP解像度切り替えの深刻なアーチファクトを克服する制約付きエンコード方法を本明細書で提案する。
【0035】
VVC符号化ツールのドリフトの可能性に関しては、VVCの符号化ツールの最初のセットは、サンプル間予測、例えば、VVCの多くの以前のバージョンから知られている通常のブロックベースの並進動き補償サンプル予測、またはアフィン動き補償をエミュレートするために、予測ブロックを個別に動き補償されたより小さなサブブロックに分解するアフィン動き補償(AMC)と呼ばれるVVCで新たに導入されたインター予測モードに分類することができる[12]。AMCのオプションコンポーネントとしてのオプティカルフローによる予測リファインメント(PROF)または双方向オプティカルフロー(BDOF)は、サンプルごとのインター予測をエミュレートするために、オプティカルフローに基づく方法に依存して予測サンプルを変更する、VVCにさらに新たに導入されたインター予測ツールである。このようなサンプル間予測ツールを使用して、異なる表現が再構成の参照として使用される場合、再構成されたピクチャの視覚的品質は、上記の表現の視覚的品質に傾き、元の表現の視覚的品質から遠ざかることになる。ただし、このようなサンプル間予測は、視覚的に邪魔するアーチファクトを引き起こす可能性が比較的低く、むしろ、第1の視覚的品質の予測ソースサンプルが第2の視覚的品質の残差情報を通じて徐々に更新されるため、RASLピクチャの所与のシーケンスにおける緩やかな品質遷移をもたらす。
【0036】
例えば、
図5は、オプティカルフローツール300とその機能とを示す。ピクチャ12内のインター予測ブロック10cが示されている。インター予測ブロック10cは、動きベクトル302に関連付けられている。すなわち、動きベクトル302は、インター予測ブロック10cのデータストリーム内でシグナリングされる。動きベクトル302は、インター予測ブロック10cの並進インター予測信号を生成するために参照ピクチャ304がサンプリング/コピーされることになっているインター予測ブロック10cの並進変位を示す。オプティカルフロー300がインター予測ブロック10cに使用される場合、オプティカルフローツール300は、オプティカルフローベースの分析によって並進インター予測信号を改善する。より正確には、単に動きベクトル302に従って変位したブロック10cのフットプリントで参照ピクチャ304をサンプリングするのではなく、オプティカルフローツール300は、インター予測ブロック10cのインター予測信号を決定するために、すなわち、インター予測信号を決定するように、領域306内の勾配を検査することによって、参照ピクチャ304内のピクチャ10cのフットプリントよりもわずかに大きな領域、すなわち領域306を使用する。換言すれば、ブロック10cのインター予測信号の各サンプルは、オプティカルフローツール300を使用することによって、場合によっては動きベクトル302に従って変位されたブロック10cのサンプルが参照ピクチャ304内のサブペル位置に位置する場合の補間フィルタリングに加えて、勾配に敏感なFIRフィルタリングを使用することによって、決定される。
【0037】
図5は、単に1つの参照ピクチャと1つの動きベクトルとを示しているにすぎないが、オプティカルフローツールは、ピクチャ12が両方の参照ピクチャとインター予測ブロック10cを含むピクチャとの間にある、2つの参照ピクチャと2つの動きベクトルとに関してオプティカルフロー解析を実行することもできることに留意されたい。
【0038】
後で、本願の実施形態を説明する際、オプティカルフローツール300は、ドリフトを避けるために符号化から除外される符号化ツールの一例を形成する可能性がある。したがって、以下に説明するいくつかの実施形態によれば、ビデオデコーダ及び/またはビデオエンコーダは、そのようなオプティカルフローツールをサポートする。
図1及び
図2がビデオデコーダ及びエンコーダの可能な実装を示すように、
図5によるオプティカルフローツールをサポートする
図1及び
図2によるビデオデコーダ及びエンコーダは、本出願の実施形態の例示的な基礎を表すことができる。いずれにせよ、オプティカルフローツール300をインター予測ブロック10cに適用するか否かをデコーダ側とエンコーダ側とでそれぞれどのように決定するかについては、異なる可能性が存在する。例えば、オプティカルフローツール300は、本質的に適用される符号化ツールであってもよい。例えば、オプティカルフローツールがブロック10cに適用されるか否かは、オプティカルフローツール以外のさらなる符号化ツールに関連して、ブロック10cのデータストリームでシグナリングされる1つ以上の符号化オプションに依存する可能性がある。さらに代替的に、オプティカルフローツール300は、オプティカルフローツール300がブロック10cに適用されるか否かの決定がブロック10cのサイズに依存して行われる、本質的に適用される符号化ツールであってもよい。当然のことながら、両方の依存関係が適用される可能性がある。さらに代替的に、オプティカルフローツール300は、オプティカルフローツール300がブロック10cに適用されるか否かを排他的にシグナリングするシンタックス要素がデータストリームに符号化されることを意味する、明示的に適用される符号化ツールであってもよい。言い換えれば、このシンタックス要素はブロック10cに固有である。このシンタックス要素は、ツール350の非適用と適用とを単に切り替えることができるという意味でのフラグまたはバイナリ値ではない可能性があることに留意されたい。むしろ、シンタックス要素は、そのm個の状態のうちの1つが、例えば、ツール350の適用に関連付けられる、m-aryシンタックス要素であってもよい。あるいは、シンタックス要素は、そのm個の状態のうちの1つが、例えば、ツール350の非適用に関連付けられる、m-aryシンタックス要素であってもよい。
【0039】
続いて説明する実施形態では、エンコーダは、オプティカルフローツール300などの特定の符号化ツールをRASLピクチャの符号化から除外することをデコーダにシグナリングする。後で説明するこのシグナル伝達は、特定のピクチャのブロックまたはピクチャのスライスに対するこれらの符号化ツールの可用性の実際の制御として機能する必要はない。むしろ、以下にさらに説明する実施形態で提示されるこのシグナル伝達またはインディケーションは、むしろ、以下にさらに説明するこれらの特定の符号化ツール(または単に1つの符号化ツール)が、RASLピクチャなどの特定のピクチャのエンコードから除外されているという、エンコーダからデコーダへの一種の追加的なシグナル伝達または約束として機能する可能性がある。後者の場合、後で説明するインディケーションまたはシグナル伝達は、特定の符号化ツールが特定のピクチャまたはピクチャスライス内のピクチャブロックへの適用に利用できないように、特定の符号化ツールを非アクティブ化するデータストリーム内の構成シグナリングに対して冗長であるか、またはこれに加えて行われる。エンコーダは、構成シグナリングと、該当する場合はブロックベースのツール適用に関連付けられたシンタックス要素とを設定することによって与えられる保証に従う。つまり、例えばツール(複数可)がRASLピクチャで使用されないようにする。したがって、オプティカルフローツールは、ブロック10cなどのインター予測ブロックへの適用に関して、データストリーム内の構成データによってピクチャまたはスライスの単位で非アクティブ化可能な非アクティブ化符号化ツールであってもよい。例えば、そのような構成シグナリングは、スライスヘッダまたはピクチャヘッダによって構成され得る。したがって、オプティカルフローツール300が特定のインター予測ブロック10cに適用されるか否かは、構成シグナリングに基づいて決定され、単に構成シグナリングが、インター予測ブロック10cがその一部であるピクチャ12(またはピクチャ12のスライス)について、オプティカルフローツール300がアクティブ化されている、すなわち利用可能であることを示す場合、上記のその適用に関する明示的なシグナル伝達または固有の決定が行われる。
【0040】
後者の状況は、特定の符号化ツールを適用するかしないかを決定する一般的な可能性が、本明細書で説明する符号化ツールについてと同様であるため、
図6に再度示されている。したがって、
図6は、現在符号化されているピクチャ12と、ピクチャ12の一部であるブロック10とを示している。ピクチャブロック10は、単に例示的に示されており、実際には、ピクチャ12が分割される単なる1つのピクチャブロックである。ブロック10が属するブロックレベルは、例えば、イントラ/インター予測モードの決定が行われるブロックに対応する可能性があるが、後者のブロックより小さいブロックなど、他の可能性も同様に存在する。ピクチャ12をブロック10などのブロックに分割する可能な例は、
図3に関して説明している。代表的な符号化ツール350を
図6に示す。この符号化ツールが実際にブロック10に適用されるかどうかは、以下の状況によって制御され得る。適用は、矢印352で示されるブロックのサイズ、及び/または、ブロック10がイントラブロックモードを使用して符号化されるかインターブロックモードを使用して符号化されるかなど、所定のブロック10のデータストリーム内でシグナリングされる符号化オプションに依存する可能性がある。後者の依存関係が、
図6に矢印354で示されている。ブロックサイズ依存性の代わりに、あるいは追加的に、対応する再帰的マルチツリーベースの分割ツリーのブロックアスペクト比またはツリー分割レベルへの依存性が適用されてもよい。符号化オプションは、ブロックがイントラ符号化されること、ブロックがインター符号化されること、ブロックが双予測されること、ブロックが等間隔で対向配置された参照ピクチャと双予測されることなどのうちの1つ以上に関連し得る。情報エンティティ、つまりブロックサイズ/アスペクト比/分割レベルと符号化オプションとの両方は、データストリーム内でシグナリングされ、つまり、ピクチャ12のブロック10を含むブロックへの分割に関する分割情報によるブロックサイズ/アスペクト比/分割レベルと、例えばブロック10に特化した符号化オプションとの両方でシグナリングされる。暗黙的なブロックレベルの決定に依存する代わりに、シンタックス要素353の形式の明示的なシグナリングを使用して、ブロック10に関するツール350の適用を制御してもよい。シンタックス要素はブロック10に固有であり、ツール350のツール決定に関して固有になる。この適用決定356は、ブロックレベルで行われるが、より大きなレベルでは、適用決定はさらに、ピクチャ12全体、またはピクチャ12がデータストリームに符号化されるブロック符号化順序に沿ってピクチャ12が細分化されるスライスに関してなど、より大きなレベルで行われるアクティベーション決定358に依存することがある。アクティベーション決定358は、ブロック10が属するスライスのスライスヘッダ内の設定、またはピクチャ12のピクチャヘッダ内の設定、もしくはピクチャパラメータセットなどのピクチャ12に関連付けられたパラメータセット内の設定などの、前述の構成シグナリングによって制御され得る。決定356及び358の全てが適用されるわけではない。それらのいずれも適用されない可能性があるが、以下に説明するインディケーションは、ある種の約束または冗長なシグナリングとして、特定のスライス、ピクチャ、またはRASLピクチャに対する特定の符号化ツール350のアクティブ化または非アクティブ化を示すだけでなく、構成シグナリングのようにも作用する。
【0041】
したがって、
図6の符号化ツール350は、
図5のオプティカルフローツール300であってもよいが、
図6では、以下でさらに説明するエンコーダ制約決定の対象となる符号化ツールのいずれかを代表的に示している。
【0042】
VVCの第2の符号化ツールセットは、ピクチャのシンタックスまたはサンプルから、シンタックス(すなわちモデルパラメータ)予測に使用される。以前のバージョンと同様に、VVCでは、時間的動きベクトル予測(TMVP)[13]を介して、いわゆるコロケートされた参照ピクチャからの時間MV候補を使用して、ブロックベースで動きベクトル(MV)予測が可能になる。この機能は、VVCにおいて、コロケートされた参照ピクチャ内の対応する動き情報を見つける際に、変位ステップを追加する、サブブロックベースのより細かい粒度のTMVPバリアント(SBTMVP)を導入することによって拡張された。
【0043】
図7は、時間的動きベクトル予測ツール500を示す。このツール500は、
図6の符号化ツール350の別の例であり、エンコーダ制約インディケーションに関して以下でさらに説明する符号化ツールのさらなる例である。時間的動きベクトル予測ツールは、参照ピクチャ502内のブロック506に関連付けられた動きベクトル510に基づいて、ピクチャ12のインター予測ブロック10cの動きベクトル508を予測するためのものである。ツール500は、参照ピクチャ502内の同じ位置にあるブロックの動きベクトルを予測子508として使用することができるが、
図7の例によれば、ツール500は最初に、ブロック10cについて、空間予測動きベクトルなどの変位ベクトル504を導出し、この変位ベクトル504を使用して、参照ピクチャ502内で「同じ位置にあるブロック506」の位置を特定し、次いで、この同じ位置にあるブロック506の動きベクトル510が、時間的予測動きベクトル候補508に使用される。さらに、
図7は、ツール500が、ブロック10cのためのデータストリームにおいてシグナリングされたインデックスを使用することなどにより、1つの動きベクトル予測子が最終的に選択されるブロック10cのための動きベクトル候補リスト512への挿入のためにのみ、時間的予測動きベクトル508を決定するように動作可能であり得ることを示す。あるいは、リスト512は、リスト512内の動きベクトル候補の特定の順序につながる特定の方法で解釈され、最も高いランクを有するものがインター予測ブロック10cでの使用のために単純に最終的に選択される(chosen)/選択される(selected)。
【0044】
図6の動きベクトル予測ツールは、マージの意味での時間的動きベクトル予測のケースをカバーするのにも十分に広いと理解されるものとすることに留意されたい。すなわち、同じ位置にあるブロックから、動きベクトル予測子を参照ピクチャインデックスなどの他の動き予測設定と共に一括して提供する。
【0045】
図6に関して説明した全てのオプションは、ツール500が実際にブロック10cに適用されるか否かを決定するために、ツール500に利用可能である。より正確には、ツール500は、
図6の符号化ツール350の一例であってもよく、その場合、シンタックス要素353の形式の明示的なシグナリングが、ブロック10に関するツール500の適用を制御するために使用され得る。すなわち、ブロック10cのデータストリームでシグナリングされたインデックスが、リスト512からTMVP候補508を選択するか否かを制御する。選択されない場合、ツール500はブロック10cに関して無効なままであり、これは、ブロック10cに対してツール500が適用されないと解釈される。しかしながら、決定358を介したより高いレベルでの構成シグナリングは、ツール500をよりグローバルに非アクティブ化するために使用されることがあり、その結果、ツール500が非アクティブ化されるようにシグナリングされる領域(ピクチャまたはスライス)内に存在するブロックに対して、リスト512が、いずれにせよ、TMVP候補508を除外するようにして解釈され、リストインデックスがもはや前述のブロックレベルの決定制御として機能しないことになる。エンコーダは、本明細書で教示されるように、RASLピクチャのドリフトを回避するためにデコーダに与えられた約束に従うために、どちらの方法を使用するかを決定することができる。
【0046】
前述の第2のセットのさらなるツールは、サンプルからシンタックスへの予測ツールとして特徴付けることができる。VVCで導入されたまったく新しいインター予測ツールは、デコーダ側動きベクトルリファインメント(DMVR)であり、これは、現在のピクチャに対して時間的に等しい反対の距離を持つ2つの参照ピクチャのミラーリング特性に基づいて、双方向予測におけるMVの精度を精密化する。
【0047】
図8は、デコーダ側の動きベクトルリファインメントツール400を示す。ピクチャ12のインター予測ブロック10dに適用される場合、ツール400は、このブロック10dを参照ピクチャ404からインター予測するために、このブロック10dのデータストリーム内の符号化/シグナリングされた動きベクトル402を、最良一致検索を使用することによるこの動きベクトル402のリファインメントによって改善する。最良一致検索は、1/16ペル解像度など、デコーダ及びエンコーダによってサポートされる最高の解像度で実行され得る。シグナリングされた動きベクトルは、解像度が低い場合があり、DMVRツールによって最終的に決定されたリファインメントされた動きベクトルを「実質的に」示す役割を単に果たすものにすぎない。最良一致検索を実行するために、参照ピクチャと何を照合する必要があるかに関しては、様々な可能性が存在する。1つの可能性は、インター予測ブロック10dに隣接する既にデコード化された部分を使用することである。この部分は、シグナリングされた動きベクトル及びその周囲の動きベクトル候補を使用して動きベクトル変位を受け、最もよく一致した候補がリファインメントされた動きベクトルとして選択される。あるいは、ブロック10dが双方向予測ブロックであり、ツール400によってリファインメントされることになるシグナリングされた動きベクトルのペアが存在する可能性もある。すなわち、インター予測ブロック10dが双方向予測ブロックであった場合である。提示順序で参照ピクチャの間にピクチャ12が存在する可能性があり、つまり、参照ピクチャが時間的にピクチャ12の前後に配置される可能性がある。任意選択で、2つの参照ピクチャはピクチャ12から時間的に等間隔に配置される。ツール400は、この場合専用でもよい。すなわち、ツール400は、ブロック10dが、現在のピクチャ10から等間隔に配置され、その間にピクチャ10を有する参照ピクチャに基づいて双予測されることを示すブロック符号化オプションに応じて、本質的にブロックレベルでアクティブ化されることになる。その場合、一方がベクトル402であるシグナリングされた動きベクトルの対は、シグナリングされた動きベクトルの対を含む動きベクトル対候補の間で最良一致検索を実行することによってリファインメントされる。最良一致検索は、例えば、動きベクトルペア候補と呼ばれる部分でサンプリングされた参照ピクチャ間の類似性をテストすることによって実行することができる。動きベクトルのペアの候補は、ある参照ピクチャに対する一方の動きベクトル候補が、この参照ピクチャに対する対応する信号動きベクトルから、他の参照ピクチャに対する他の動きベクトル候補が、この他の参照ピクチャに対する他の信号動きベクトルから逸脱するのとは逆に逸脱するものに限定され得る。類似性を得るには、SADまたはSSDを使用できる。次に、最もよく一致する動きベクトルのペア候補が、信号動きベクトルの置換406として使用される。すなわち、参照ピクチャ404のベクトル402が406に置き換えられ、他の参照ピクチャの他の信号ベクトルが動きベクトルペア候補の他のベクトルに置き換えられる。他の可能性も同様に存在するはずである。例えば、二重予測ブロック10dの両方のシグナリングされた動きベクトルは、シグナリングされた動きベクトル及びその周囲の2つのシグナリングされた動きベクトルにおける2つの参照ピクチャ内のサンプリングされたパッチの平均の最良一致検索を実行することによって、個別にリファインメントされ得る。
【0048】
MVRツール400をブロック10dに適用するかどうかの決定に関しては、
図6に関して説明した全ての代替案を適用することができる。すなわち、MVRツール400は符号化ツール350であってもよい。
【0049】
VVCのさらに新しいツールは、クロスコンポーネント線形モデル(CCLM)である。これにより、線形モデルを使用して、それぞれの輝度コンポーネントからブロックの彩度コンポーネントをイントラ予測できるようになる。モデルパラメータが、再構成された輝度サンプル値から導出される。線形モデルは、サブサンプリングされた輝度サンプルrec’Lを、次の手段によって彩度予測に変換する。
P(i,j)=a・rec’L(i,j)+b
ここで、パラメータaとbとは、隣接する輝度サンプルと彩度サンプルとから、次のように導出される。XlとXsとは、それぞれ最大の2つの隣接サンプルの平均と最小の2つの隣接サンプルの平均とを表し、YlとYsとは、それぞれ対応する彩度サンプルペアの平均を表す。パラメータは次のように導出される。
a=(Yl-Ys)/(Xl-Xs)
b=Ys-a・Xs
パラメータ導出プロセスは、隣接するサンプル値の極値のみを考慮するため、隣接するブロックに単一サンプルのドリフト外れ値がある場合でも、このプロセスでは広範囲のドリフトが発生する傾向がある。また、線形モデルのため、aが大きい場合、輝度ドリフトが増幅される可能性がある。隣接する全てのサンプル値を考慮する他のイントラ予測モードの場合、ドリフト伝播はあまり目立たず、線形に増幅することができない。この固有の不安定性のため、HTTPアダプティブストリーミングでのオープンGOP切り替えなど、制約されたドリフトが許容されるアプリケーションにこのモードを適用する場合は、特別な注意が必要である。これに加えて、説明されているアプリケーションのコンテキストでは、ドリフトはRASLフレーム、つまり動き予測フレームでのみ発生する可能性があるためである。エンコーダがCCLM、つまりイントラ予測モードの使用を決定した場合、これは通常、適切な動き補償予測子の欠如が原因であり、時間的アクティビティが高い領域を意味する。このような領域では、オープンGOP切り替えの予想される再構成ドリフトが大きくなり、議論された不安定性の影響にさらに寄与することが予想される。
【0050】
図9は、クロスコンポーネント線形モデルツール100の動作モードを概略的に示す。ツール100が適用されるブロック10aが示されている。このブロック10aの輝度コンポーネントは、任意のタイプの予測120を使用し、予測信号と輝度の残差信号とを組み合わせる中で、データストリームからの残差信号をデコードすること122によって再構成される。ツール100の目的は、再構成された輝度コンポーネント124に基づいて彩度コンポーネント(複数可)を予測することである。これは、線形モデルまたは線形マッピング106を使用して行われる。この線形マッピング106は、ブロック10aの各サンプル126について、サンプル126の再構成された輝度コンポーネントに基づいてサンプル126の彩度コンポーネントをサンプルごとに予測するために、スカラー線形関数を使用する。スカラー線形関数の線形パラメータ、すなわち上記a及びbは、ブロック10aの近傍112における既に再構成されたサンプルの輝度コンポーネント及び彩度コンポーネントの統計の分析によって、ブロック10aに対してブロック全体にわたって決定される。特に、ツール100によって実行される統計分析124は、
図9の128に示されており、各コンポーネントについて、近傍112の再構成サンプル内で発生する外部輝度値及び彩度値を決定することができる。例えば、2つの最大の輝度値の平均と、2つの最小の輝度値の平均とが使用される場合がある。予測すべき彩度コンポーネントについても同じことが行われる。結果として生じる4つの平均値に基づいて、近傍112内の輝度値の範囲及び彩度値の範囲の尺度が決定され、それらの間の比が線形マッピング106のスカラー線形関数の傾きとして使用される。輝度の最小値の平均-傾き×彩度の最小値の平均は、スカラー線形関数の切片を決定するために使用される。このように実行されるパラメータ導出108は、スカラー線形関数を生成し、再構成された輝度コンポーネント124の各輝度サンプルは、ブロック10a内の対応する彩度サンプル値を予測するために使用され、それによって、ブロック10aの彩度コンポーネント間予測信号が生成される。
図9には示されていないが、可能性として、データストリームは、彩度コンポーネントC
1及び/またはC
2の彩度コンポーネント間予測信号を補正するために、符号化された彩度残差信号を有してもよい。
【0051】
繰り返しになるが、ツール100は、
図6の符号化ツール350の別の例である。換言すれば、符号化ツールがピクチャのブロック10aに適用されるかどうかは、
図6に関して説明したオプションのいずれかに従って決定され得る。注目すべきことに、VVCは、ツール100をピクチャ全体にわたり、または少なくともスライス全体にわたり非アクティブ化するためのいかなる手段も提供しないが、後述する実施形態によれば、そのようなシグナル伝達が提案され、それによって、まさにツール100によって引き起こされる有害なドリフトを回避する。より正確には、ツール100は、ブロック10に関するツール100の適用を制御するためにシンタックス要素353の形式の明示的なシグナリングが使用される、
図6の符号化ツール350の一例であってもよい。シンタックス要素は、例えば、ブロック10のツール100のオンまたはオフに切り替えるフラグにすることができる。後の実施形態に関して説明する符号化制約インディケーションの議論に関しては、2つの可能性が存在する。つまり、それは、特定のピクチャ12に関する全てのシンタックス要素353がツール100の非適用を示すという事実を受け取り手、すなわちデコーダに通知することのみができ、それはまた、代替的に、データストリームがそのピクチャ12内のブロック10に関するシンタックス要素353を伝達しない結果として、ピクチャ12に関してツール100を非アクティブ化する構成シグナリングとして作用することができる。例えば、VVCを例にとると、ピクチャまたはスライスの粒度でツール100を非アクティブ化するための構成シグナリングは存在しない。VVCでは、そのような構成シグナリングは、ピクチャシーケンスに対するツール100のアクティブ化を制御するためにのみ存在する。したがって、RASLを考慮した非アクティブ化は実現不可能である。
【0052】
さらに新しいツールがVVCのループフィルタリングステージに導入され、これは輝度マッピング及び彩度スケーリング(LMCS)と呼ばれる。このツールでは、
図10に示すように、輝度サンプルから導出したパラメータを使用して彩度サンプル値がスケーリングされる。
【0053】
ここでも、彩度から輝度への依存関係が存在するが、CCLMの場合ほど顕著ではない。プロセスの彩度スケーリング部分では、変換及び逆量子化された彩度残差が、隣接する仮想パイプラインデータユニット(VPDU)の輝度サンプルから導出されたモデルパラメータに従ってスケーリングされる。CCLMは、パイプライン遅延の削減を目的として、隣接するVPDUのサンプルに依存する。ただし、LMCSでは、隣接する全ての輝度サンプルが考慮され、VPDUの隣接するサンプルのドリフト外れ値を平均化することができる。また、モデルパラメータは、残差信号をスケーリングするために使用される。残差信号はドリフトを集約するものではなく、直接シグナリングされる。これらの理由により、ツールがドリフトを増幅する可能性ははるかに低くなるが、ドリフトを制御するアプリケーションでのエンコード時には、依然として考慮する必要がある。
【0054】
LMCSツール200の動作モードを
図11に示す。ここでの考え方は、提示輝度トーンスケール210ではなく、符号化輝度トーンスケール208において、所定のピクチャ12に対して輝度コンポーネント予測202及び輝度コンポーネント残差デコード204を実行するように輝度ツールマッピング212を実行することである。より正確には、再構成された輝度値は、特定のビット深度の線形スケールでピクチャ12の再構成信号の輝度コンポーネントを表すことができるが、輝度トーンマッピング212は、ピクチャに関しての線形トーンマッピング関数または何らかの他のトーンマッピング関数などの特定のトーンマッピング関数を使用して、このスケール210をコーディングスケール208にマッピングすることができる。トーンマッピング関数は、ピクチャ12のピクチャパラメータセットなどのデータストリームでシグナリングされる場合がある。機能はエンコーダによって適切に決定される。したがって、ピクチャ12のブロック10bについてのインター予測202によって得られたインター予測信号は、符号化スケール208で残差信号204と結合される前に、輝度トーンマッピング212を受けて、ピクチャ12の再構成された輝度コンポーネントが得られる。イントラ予測ブロックの場合、インター予測206が使用される。イントラ予測は、符号化スケール208ドメイン内で実行される。ツール200のさらなる目標は、輝度トーンマッピング212に従って彩度コンポーネントの量子化誤差を制御することである。すなわち、彩度コンポーネントの量子化誤差は、ブロックごとに個別に制御され、輝度トーンマッピング212によって輝度コンポーネントの影響に適応される。この目的のために、ピクチャブロック10bの近傍222内のピクチャ12の再構成された輝度コンポーネントの符号化輝度トーンスケールバージョンの平均220から、ピクチャ12のブロック10bに対して、彩度残差スケールファクタ216が決定される。データストリームからピクチャブロック10bについてデコードされた彩度残差信号224は、このように決定された彩度残差スケールファクタ216に従ってスケーリング226され、このスケールは、ピクチャブロック10bの補正228及びイントラ彩度予測信号230に使用される。イントラ彩度予測信号230は、輝度コンポーネントと比較して、同じ予測ツールまたはそのサブセットを使用することができる。平均220を決定するために近傍222を使用することによって、ブロック10bの輝度コンポーネント及び彩度コンポーネントは、直列ではなく並列に再構成されることができる。次に、ピクチャ12の再構成された輝度コンポーネント及び彩度コンポーネントは、逆輝度トーンマッピング240を受けて、ピクチャ12の再構成された最終結果が得られるとともに、次に符号化/デコードすべきピクチャの基礎が得られて、すなわち、その後この符号化/デコードされたピクチャの参照ピクチャとして機能する。
【0055】
符号化ツール200に関しては、前の図に関して説明した他の符号化ツールに関して行われたのと同じ注記が有効である。すなわち、符号化ツール200は、
図6の符号化ツール350の例であり、または
図6に関して説明した特定のブロックに対するこの符号化ツールの適用を決定するためのオプションが使用され得る。一例として、ブロック単位の決定356は、符号化ツール300に関して省略されてもよいが、構成シグナリングを使用して、ピクチャごとに、またはスライスごとに適用を制御することができる。
【0056】
シンタックス間及びサンプル間予測ツールによる予測MVの誤差は、これらの誤って予測されたMVを空間的または時間的MV候補として使用する後続のサンプル間予測ツールで深刻なアーチファクトを引き起こす可能性が比較的高い。このことは、オープンGOP切り替えで最も目立つアーチファクトを示す(SB)TMVPに特に有効である。また、不正な動きベクトルの誤差が後続のピクチャに大きく伝播する可能性があるため、DMVRにも有効である。また一方、再構成されたサンプル値から導出されるパラメータに基づいて実行される他の予測モデル、例えばCCLM及び/またはLMCSにも、同じことが当てはまる。
図12は、通常のオープンGOP符号化で32ピクチャのGOPサイズを使用したRASLピクチャの視覚的及び客観的品質に対する一般的なシンタックスまたはパラメータの予測誤差の影響を示している。RASLピクチャは、再構成されたピクチャの輝度コンポーネント及び彩度コンポーネントにおいて、著しいアーチファクトを受けていることが明らかである。
【0057】
オープンGOP切り替えにおける第3の問題は、アダプティブループフィルタ(ALF)のフィルタ係数、彩度スケーリング付き輝度マッピング(LMCS)のパラメータ、及び量子化スケーリングリストが保持されているVVCでの適応パラメータセット(APS)の使用から生じる可能性がある。RASLピクチャは、デコード順でそれぞれのCRAよりも前に送信されたAPSを指す場合があり、これらは、連続デコード中に利用可能であるが、この場合、関連するRASLピクチャがドロップされるため、CRAピクチャでのランダムアクセス時には利用できない。したがって、オープンGOP解像度の切り替えにより、誤差耐性のないデコーダをクラッシュさせる欠落したAPSへの参照を引き起こし、または識別子の値が偶然一致した間違ったAPSのパラメータを使用した場合に視覚的なアーチファクトを発生させる可能性がある。シンタックス予測ツールと同様に、この問題は、完全なデコーダ障害に至るまで、視覚的な障害を引き起こす可能性が高い。
【0058】
オープンGOP解像度切り替えを実行するときに、上記の問題を回避するために、以下で説明する3つの柱で構成される制約付きVVCエンコード方法を使用することができる。
【0059】
第一に、CRAに関連付けられたRASLピクチャは、デコード順序でCRAに先行するピクチャが、シンタックス間予測、つまり(SB)TMVPを実行するための併置参照ピクチャとして選択されないように制約される。これにより、エンコーダ側とまったく同じ参照ピクチャと動き情報とが使用され、以前のセグメントピクチャによる不正確なソースの動き情報によるシンタックス予測誤差が防止される。可能な実装では、デコード順序で最初のRASLピクチャは、その関連するCRAピクチャのみを併置参照ピクチャとして使用するように制限され、当然ゼロ動きベクトルのみをホストするが、その後のRASLピクチャは、デコード順の最初のRASLピクチャとそれに続くピクチャとの非ゼロ時間MV候補にアクセスできる。サンプルからシンタックスへの予測ツールに関しては、関連するCRAにデコード順で先行するアクティブな参照ピクチャを持つ全てのRASLピクチャに対してDMVRが無効化される。別の代替案では、参照ピクチャに関係なく、全てのRASLピクチャに対してDMVRが無効化され、さらなる代替案では、後続のピクチャのための併置された参照ピクチャとして機能するRASLピクチャに対してのみDMVRが無効化され、さらに別の代替案では、DMVRは、最上位の時間レイヤであるため参照として使用されないRASLピクチャを除く全てのRASLピクチャに対して無効化される。そのため、他のRASLピクチャのエンコーダ側サンプル、またはドリフトの影響を受けたサンプルとは異なる、以前のセグメントからの参照ピクチャの誤ったサンプル値が、サンプルからシンタックスへの予測で誤差を引き起こすことはない。
【0060】
セグメント切り替え後のVVC適合性を確保するには、関連するCRAに先行する参照ピクチャを持つ全てのRASLピクチャに対してさらなるツールを制限する必要がある。つまり、オプティカルフロー関連ツールBDOF及びPROFの使用が無効になる。あるいは、簡単にするために、全てのRASLピクチャに対してBDOFとPROFとを無効にすることもできる。さらに、ビデオ内の独立して符号化されたサブピクチャのVVCの新機能は、例えば360度ビューポート依存のビデオストリーミングに役立つが、RPRを使用するには無効にする必要がある。上記のツール制約は全て、RPRを有効にするためにVVC仕様で定義された適合制約の一部でもある。VVCでのRPRの使用に関連する適合性制約を超えて、再構成されたサンプルからのパラメータ予測を使用する予測技術も顕著なアーチファクトを引き起こす可能性があるため、さらなるツール制約が必要になる。したがって、現在のVVCシンタックスでは、シーケンス単位での無効化のみが許可されており、全体の符号化効率が大幅に低下するため、発明者らの実装ではエンコーダ側の検索アルゴリズムのブロック単位の制約によってCCLMが無効になる。これにより、エンコーダ側でドリフトを確実に回避することが効果的に可能になるが、低レベルの解析を徹底的に行わなければ、デコーダ側でドリフトを簡単に確認することはできない。また、ツールは有効になっているが使用されていないため、不要なビット(つまり、cclm_mode_flagまたはcclm_mode_idxなどのCCLM使用のための符号化ユニットレベルのフラグ)が、ツールを使用しないというエンコードの決定を知らせるために送信されている。
【0061】
第二に、オープンGOP符号化構造、つまりデコード順序でCRAピクチャの後にそれに関連するRASLピクチャが続く場合も、全てのピクチャに必要なAPSがセグメント内に存在する必要がある。オープンGOPストリームにランダムアクセスする場合、そのような制約は必要なく、RASLピクチャは、デコード順序において、関連するCRAピクチャの前にビットストリームで伝送されるAPSを参照することができることに留意されたい。このようなCRAピクチャでランダムアクセスする場合、RASLピクチャはドロップされるため、この参照は問題にならない。また、切り替えが実行されない場合、そのようなAPSは連続デコードで利用可能である。ただし、これらのAPSは、オープンGOP切り替えを伴うストリーミングでは利用できない場合があるため、参照されないようにする必要がある。発明者らの実装では、ALF、LMCS、及び量子化スケーリングリストに関連する処理は、クローズドGOP符号化構造と同様の方法でリセットされる。
【0062】
第三に、VVC高レベルシンタックスの観点から、ビットストリームラダー内のバリアントの個別のエンコードは、デコーダ側でのオープンGOP切り替えのターゲットを念頭に置いて、協調して行われる必要がある。したがって、セグメントの切り替えによってSPSの変更による新しい符号化レイヤビデオシーケンスの開始がトリガされないように、全てのセグメントバリアントのシーケンスパラメータセット(SPS)が調整される必要がある。例えば、適切に調整すると、SPSは、ビットストリームラダー内の最大解像度、マッチングブロックサイズ及び彩度フォーマット、適切なマッチングレベルインジケータ、及びデコーダ側でRPRの使用を可能にする適切な構成を備えたgci_no_res_change_in_clvs_constraint_flag、sps_ref_pic_resampling_enabled_flag及びsps_res_change_in_clvs_allowed_flagなどの関連制約フラグを示すはずである。指定された最大解像度またはレベルに必要な機能よりも低い機能を備えたデバイスには、システムメカニズムを通じて調整されたSPSを使用する必要がある。
【0063】
VVCのRPRは、上記のツール制約の説明から明らかなように、その実装と実行時の複雑さとを抑制するために、制約されるように設計されている。この複雑性の考慮における重要な側面は、RPR使用時にスケーリングされた参照サンプルにアクセスする際のメモリ帯域幅が許容範囲内であり、RPRを使用しない場合よりも大幅に高くならないことである。VVCでの符号化されたピクチャには、2つのピクチャ間のスケーリング係数を決定するために使用される、いわゆるスケーリングウィンドウが付属する。RPRのメモリ帯域幅要件に限界を設定するために、RPRを使用するピクチャのスケーリングウィンドウとその参照ピクチャのスケーリングウィンドウとの関係が、最大で8倍のアップスケーリングと2倍のダウンスケーリングとを可能にするように制限されている。言い換えれば、各スケーリングウィンドウがその表現のピクチャサイズにマッチしていると仮定すると、8倍のピクチャサイズを持つ表現に切り替えるときに、RPRを使用することが許可される。ただし、ダウン切り替えでは、ピクチャサイズが各次元で半分以上減少する場合にのみRPRを使用できる。
【0064】
通常、アダプティブストリーミングシナリオでは、アップ切り替えがプログレッシブ方式で実行される。つまり、解像度または品質を徐々に上げていく。ただし、ダウン切り替えに関しては、プレーヤのバッファが不足しているときに、プレーヤがバッファアンダーランを避けるために最低品質に切り替えることが発生する可能性がある。このことは、ダウン切り替えが、漸進的に起こらない可能性が高いことを意味する。VVCにおけるRPRのこの制限を軽減する1つの方法は、クローズドGOP構造で最低品質の表現をエンコードして、このような非プログレッシブダウン切り替えイベント中にピクチャサイズが半分未満に減少した場合のフォールバックとして機能できるようにすることである。
【0065】
以下では、上述の符号化ツール100、200、300、400、及び500の1つ、複数、または全てをサポートするデコーダ及びエンコーダに関する実施形態について説明する。次に説明するデコーダ及びエンコーダは、
図1及び
図2に準拠した方法で実装することができる。ツール100、200、300、400、及び500は、主にデコーダ側に関して上記で説明されているが、対応するツールの説明がエンコーダ側に容易に移行可能であることは明らかであり、エンコーダがデータストリームから情報をデコードするのではなく、データストリームに関連情報を挿入する点が異なる。サポートされる各符号化ツールは1つの符号化ツール350を表す。ブロックベースで明示的シンタックス要素制御353を使用する符号化ツールには、エンコーダがブロックベースでシンタックス要素をエンコードし、デコーダがそれをデータストリームからデコードすることが含まれる。符号化ツール100は、この明示的なブロックベースのシンタックス要素を使用する唯一のものである可能性がある。他の符号化ツール200、300、400、及び500は、ツールを完全に非アクティブ化するためのピクチャベースまたはスライスベースの構成シグナリングと共に、固有のブロックベースの適用決定356を使用することができる。
【0066】
続いて説明する実施形態は、上記の1つ以上の符号化ツールのセットの使用に関する特定の符号化制約が遵守されているか否かをデコーダに示すインディケーションまたはシグナリングに関する。エンコーダは、データストリーム内でこのインディケーションを通知し、対応するエンコード制約に従うことで、それに応じてエンコードを制限する。デコーダは、そのインディケーションを使用し、それをセグメント切り替えの場合のドリフト制限の保証または指示として解釈する。代替の実施形態によれば、以下で説明するインディケーション/シグナリングを使用して、1つ以上の符号化ツールを実際に非アクティブ化することもできる。例えば、VVCでは、これまでのところ、ピクチャまたはスライスベースでツール100を非アクティブ化することはできなかった。以下に説明するインディケーション/シグナリングは、約束機能に加えて、特定のピクチャ/スライスに関してツール100を非アクティブ化するように、構成シグナリングの機能を引き受けることができる。ブロックベースの決定356のためのブロックベースのシンタックス要素は、その後、省略され、データストリームへの符号化及びデータストリームからのデコードが行われない可能性がある。
【0067】
続いて、提示された制約のシグナリングを使用してオープンGOP解像度切り替えを可能にする組み合わせが提示される。つまり、特定の符号化ツールがRASLピクチャではアクティブではないため、ストリーム切り替えを実行するときにCRAのRASLピクチャを許容可能なドリフトでデコードできるということである。最先端技術では、TMVP、SBTMVP、BDOF、PROF、DMVRなど、提示された方法の一部である一部のツールでそのようなインディケーションが可能であるが、提示された方法には、サンプルからシンタックスへの予測ツール、つまりCCLM及び/またはLMCSによる深刻なアーチファクトを回避するために必要な、注目すべき追加の制約がある。したがって、エンコーダは、そのようなツールが特定のピクチャ、つまりCRAのRASLピクチャに対してアクティブでないことをビットストリーム内で示すことができる必要がある。
【0068】
VVCは、下位互換性のある方法でビットフラグをピクチャヘッダ(PH)及びスライスヘッダ(SH)のシンタックスに追加する拡張メカニズムを備えている。この目的のために、それぞれのSPSは、PHまたはSHのシンタックスでそのような目的のための追加ビットの数を示す。これらは、シンタックスを読み取るときに解析する必要があり、この追加ビットをフラグまたは変数値に割り当てるために導出が使用される。次の表は、それぞれのセマンティクスを伴うそれぞれのSPS及びPHシンタックスを示している。SHのシンタックスとセマンティクスとは、PHのシンタックスとセマンティクスとに似ている。
【表1】
sps_extra_ph_bit_present_flag[i]が1に等しいことは、i番目の追加ビットがSPSを参照するPHシンタックス構造内に存在することを指定する。sps_extra_ph_bit_present_flag[i]が0に等しいことは、i番目の追加ビットがSPSを参照するPHシンタックス構造内に存在しないことを指定する。
【0069】
変数NumExtraPhBitsは次のように導出される。
NumExtraPhBits=0
for(i=0;i<(sps_num_extra_ph_bytes*8);i++)
if(sps_extra_ph_bit_present_flag[i]) (1)
NumExtraPhBits++
【表2】
ph_extra_bit[i]には任意の値を指定できる。本明細書の本バージョンに準拠するデコーダは、ph_extra_bit[i]の存在と値とを無視するものとする。その値は、本明細書の本バージョンで指定されているデコードプロセスには影響しない。
【0070】
認識していないデコーダは少なくとも正しくビットストリームを解析し、正しくデコードできるが、追加ビットの意味を認識しているデコーダは、追加ビットのインディケーションをさらに解釈し、それに応じて動作することができる。例えば、提示された方法による制約が満たされていて、深刻なドリフトなしでストリーム切り替えが可能であることをクライアントにアドバイスすることができる。同様に、ファイル形式パッケージャ、HTTPストリーミングサーバ、さらにはRTPストリーミングサーバでも、ビットストリーム切り替えを使用する方法でコンテンツをパッケージ化し、提供し、提供する際に、このビットストリームインディケーションを考慮に入れることができる。
【0071】
本発明の実施形態は、以下のように、RASLピクチャまたは関連するCRAピクチャのPHまたはSHシンタックスの追加ビット内で提示された方法のインディケーションを搬送することである。SPSセマンティクスでは、指定の追加ビットフラグは、提示された方法を示すPH/SH追加ビットフラグの存在を示すものとして、sps_extra_ph_bit_present_flag[i]のインデックスiを通じて識別される。例えば、PH内の最初の追加ビットの存在は、次のように、最初のSPS PH追加バイトの最初のSPS PH追加ビット(i=0)によって識別することができる。
【0072】
変数ConstraintMethodFlagPresentFlagの値は、sps_extra_ph_bit_present_flag[0]に等しく設定される。インデックス0が使用されているが、代わりに別のインデックスを使用することもできることに留意されたい。つまり、sps_extra_ph_bit_present_flag[i]の中のビットが、使用されるツールに関してRASLピクチャが制約されるという意味を持つように選択される。
【0073】
PHセマンティクスでは、提示された制約方法のフレーバを示すそれぞれの変数が次のように導出される。
【0074】
変数ConstrainedRASLFlagEnabledFlag/ConstrainedCRAFlagEnabledFlagの値は、(ConstraintMethodFlagPresentFlag&&ph_extra_bit[0])に等しく設定される。インデックス0が使用されているが、sps_extra_ph_bit_present_flag[i]で示される値と、RASLピクチャph_extra_bit[j]の制約にどのインデックスが使用されるかとに応じて、PH内の追加フラグのj番目のフラグが、制約がRASLピクチャに適用されているか否かを示すことに留意されたい。
【0075】
代替1(RASLピクチャでシグナリングを搬送):ConstrainedRASLFlagEnabledFlagが1に等しい場合、現在のピクチャはCCLMを使用せずにエンコードされる。PH/SH制御フラグと、BDOF、DMVR、PROF、(SB)TMVP、及びLMCSのシーケンスレベル制約フラグとは、すでにVVCバージョン1にあるが、CCLMはピクチャまたはスライススコープの制御フラグを欠落している。
【0076】
代替案2(関連付けられたCRAピクチャでシグナリングを搬送):ConstrainedCRAFlagEnabledFlagが1に等しい場合、現在のピクチャに関連付けられたRASLピクチャは、TOOLSETを使用せずにエンコードされる。ここでTOOLSETは、CCLM及び/またはLMCS及び/またはBDOF及び/またはPROF及び/またはDMVR及び/またはRASLピクチャを指し、現在のピクチャ(すなわち、CRAピクチャ)に先行する(sb)TMVPのための併置ピクチャを少しも使用しない。
【0077】
上記と同様の代替実施形態は、RASLまたはCRAピクチャのスライスに対するSHシグナリングのために構築することができる。
【0078】
別の代替実施形態では、上記の制約は、DCI、VPS、またはSPSのいずれかに以下のような同じ意味を持つ一般的な制約フラグ(例えば、一般的なgci_rasl_pictures_tool_constraint_flagまたはgci_cra_pictures_tool_constraint_flag)を追加することによって、CVS、CLVS及び/またはビットストリームのプロパティ/制約として示される。
【0079】
代替1に対応:gci_rasl_pictures_tool_constraint_flagが1に等しい場合、OlsInScope内の全てのRASLピクチャのConstrainedRASLFlagEnabledFlagが1に等しいことを指定する。gci_rasl_pictures_tool_constraint_flagが0に等しい場合は、そのような制約は課されない。
【0080】
代替2に対応:gci_cra_pictures_tool_constraint_flagが1に等しい場合、OlsInScope内の全てのCRAピクチャのConstrainedCRAFlagEnabledFlagが1に等しいことを指定する。gci_cra_pictures_tool_constraint_flagが0に等しい場合は、そのような制約は課されない。
【0081】
つまり、そのような一般制約フラグが設定されている場合、CVS、CLVS、及び/またはビットストリーム内のCRAに関連付けられた全てのRASLピクチャは、TOOLSETを使用せずにエンコードされる。ここで、TOOLSETは、CCLM及び/またはLMCS及び/またはBDOF及び/またはPROF及び/またはDMVR及び/またはRASLピクチャを指し、現在のピクチャ(つまり、CRAピクチャ)に先行する(sb)TMVPのための併置ピクチャを少しも使用しない。
【0082】
別の代替実施形態では、上記の制約はPPS拡張シンタックスで示される。CRAに関連付けられたRASLピクチャは、上記の制約がアクティブであることを示すPPSを参照することができるが、ビットストリームの他のピクチャは、上記の制約を示さないPPSを参照する。
【0083】
別の代替実施形態では、上記の制約シグナリングは、CRAピクチャ、または関連するRASLピクチャ、またはピクチャの符号化レイヤビデオシーケンス全体のいずれかで、SEIメッセージを通じて実行される。
【0084】
別の代替実施形態では、上記の制約シグナリングは、符号化ユニットレベルで、条件付きでCCLMフラグを送信するために使用される。
【0085】
別の代替実施形態では、上記の制約シグナリングは、CRAに関連付けられた全てのRASLピクチャに適用されるのではなく、許容可能なドリフト及び発生する符号化効率ペナルティを考慮して、実際のツールに応じてRASLピクチャのサブセットに限定される。
【0086】
-DMVR:(上記の説明文と同じ):DMVRは、デコード順序で関連するCRAよりも前にアクティブな参照ピクチャがある全てのRASLピクチャに対して無効となる。現在のピクチャは、その参照ピクチャリスト(RPL)内に(実際に予測に使用される)アクティブな参照ピクチャと、現在のピクチャのサンプルまたはシンタックスを予測するために使用されないが、(デコード順序において)後続のピクチャであり、したがって、デコード済みピクチャバッファ(DPB)から削除される準備ができていない非アクティブな参照ピクチャとを有することができることに留意されたい。別の代替案では、参照ピクチャに関係なく、全てのRASLピクチャに対してDMVRが無効化され、さらなる代替案では、後続のピクチャのための併置された参照ピクチャとして機能するRASLピクチャに対してのみDMVRが無効化され、さらに別の代替案では、DMVRは、最上位の時間レイヤに属さないRASLピクチャに対しては無効になる。代替案は組み合わせてもよい。
【0087】
-BDOF&PROF:全てのRASLピクチャに対して無効にされるか、またはデコード順序で関連するCRAよりも前にアクティブな参照ピクチャがあるRASLピクチャに対してのみで無効にされる。
【0088】
実施形態によれば、このインディケーションはSEIメッセージの形式で、データストリーム内でシグナリングされる。上述したように、SEIメッセージは、ピクチャシーケンス、例えば、符号化されたビデオシーケンス、CVSの全てのピクチャに対して有効であり得る。例えば、SEIメッセージは、シーケンス内でシグナリングされてもよい。したがって、デコーダは、SEIメッセージの存在、またはSEIメッセージ内のインディケーションから、シーケンスの全てのRASLピクチャが、所定の符号化ツールのセットを除外する方法で符号化されていると推測することができる。例えば、本実施形態によれば、符号化ツールのセットは、少なくともクロスコンポーネント線形モデルベースの予測ツール100、及びデコーダ側動きベクトルリファインメントツール400を含む。
【0089】
以下では、上記の発明のさらなる実施形態について説明する。
D1.1. データストリームからビデオをデコードするためのビデオデコーダであって、
前記ビデオのピクチャシーケンスに対して有効であり、前記ピクチャシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーション(例えば、gci_rasl_pictures_tool_constraint_flag)を(例えば、異なる空間解像度及び/または異なるSNRで符号化された前記ビデオの、別々に符号化されたオープンGOPバージョンを連結することによるオープンGOP切り替えが、RASLピクチャに過大なドリフトを引き起こさないことを前記デコーダが認識しているようにする、一種の約束として)前記データストリームからデコードするように構成される、前記ビデオデコーダ。
【0090】
D1.2. 前記1つ以上の符号化ツールのセットが、
クロスコンポーネント線形モデルベースの予測ツール(100)を含む、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0091】
D1.3. 前記クロスコンポーネント線形モデルベースの予測ツールに従って、
ピクチャブロック(10a)の彩度コンポーネント(102)は、そのパラメータが前記ピクチャブロックの既にデコードされた近傍(112)における極値の輝度値及び彩度値(110)から決定される(108)線形モデル(106)を使用して、前記ピクチャブロック(10a)の輝度コンポーネント(104)から予測される、実施形態D1.2に記載のビデオデコーダ。
【0092】
D1.4. 前記1つ以上の符号化ツールのセットが、
輝度トーンマッピング及び彩度残差スケーリング予測ツール(200)を含む、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0093】
D1.5. 前記輝度トーンマッピング及び彩度残差スケーリング予測ツールに従って、
所定のピクチャ(12)に対する輝度コンポーネント予測(202)(例えば、インター予測)及び輝度コンポーネント残差デコード(204)が、符号化輝度トーンスケール(208)で実行され、その上で、提示輝度トーンスケール(210)が輝度トーンマッピング(212)によってマッピングされて、所定のピクチャの再構成された輝度コンポーネントの符号化輝度トーンスケールバージョン(214)を取得し、
前記所定のピクチャのピクチャブロック(10b)のための彩度残差スケールファクタ(216)が、前記ピクチャーブロックの近傍(222)内の所定のピクチャの前記再構成された輝度コンポーネントの前記符号化輝度トーンスケールバージョンの平均(220)から決定され、
前記データストリームから前記ピクチャブロックについてデコードされた彩度残差信号(224)が、前記彩度残差スケールファクタに従ってスケーリングされ(226)、前記ピクチャブロックのイントラ彩度予測信号(230)を補正する(228)ために使用される、実施形態D1.4に記載のビデオデコーダ。
【0094】
D1.6. 前記1つ以上の符号化ツールのセットが、
オプティカルフローツール(300)を含む、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0095】
D1.7. 前記オプティカルフローツールが、
オプティカルフローベースの分析によって、所定のインター予測ブロック(10c)の並進インター予測信号を改善するためのものである、実施形態D1.6に記載のビデオデコーダ。
【0096】
D1.8. 前記1つ以上の符号化ツールのセットが、
デコーダ側動きベクトルリファインメントツール(400)を含む、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0097】
D1.9. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルにおける及びその周囲の動きベクトル候補の間で最良一致検索を実行することによって、前記シグナリングされた動きベクトルを改善することにより、参照ピクチャ(404)から所定のインター予測ブロック(10d)をインター予測するために、前記データストリーム内で符号化された前記シグナリングされた動きベクトル(402)を改善するためのものである、実施形態D1.8に記載のビデオデコーダ。
【0098】
D1.9a. 前記デコーダ側動きベクトルリファインメントツールは、
前記参照ピクチャに関して、前記インター予測ブロックの既にデコードされた近傍を使用して、前記最良一致検索を実行するように構成される、実施形態D1.9に記載のビデオデコーダ。
【0099】
D1.9b. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルのペアを含む、及びその周囲の動きベクトルのペア候補の間で最良一致検索を実行することにより、所定のインター双方向予測ブロック(10d)の[提示順序で]時間的に前後に位置する参照ピクチャ(404)のペアから、参照ピクチャ(404)のペアから前記所定のインター双方向予測ブロック(10d)をインター予測するために、データストリーム内で符号化された前記シグナリングされた動きベクトル(402)のペアをリファインメントするように構成される、実施形態D1.8に記載のビデオデコーダ。
【0100】
D1.10. 前記1つ以上の符号化ツールのセットが、
時間的動きベクトル予測ツール(500)を含む、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0101】
D1.11. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、以前にデコードされたピクチャ(502)から動きベクトル候補をリクルートすることを含む、実施形態D1.10に記載のビデオデコーダ。
【0102】
D1.12. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、動きベクトル予測子(504)によって指し示された、前記以前にデコードされたピクチャのブロック(506)から動きベクトル候補をリクルートすることを含む、実施形態D1.11に記載のビデオデコーダ。
【0103】
D1.13. 前記動きベクトル予測子が、時間的動きベクトル予測子を含む、実施形態D1.12に記載のビデオデコーダ。
【0104】
D1.14. 前記インディケーションは、
前記データストリームのデコーダ機能情報セクション、及び
前記データストリームのビデオまたはシーケンスパラメータセット、及び
補足的な拡張情報メッセージ、のうちの1つに含まれる、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0105】
D1.15. 前記インディケーションは、前記ピクチャシーケンス内の前記RASLピクチャの前記符号化に関して、前記1つ以上の符号化ツールの所定のセットの全ての符号化ツールの除外を集合的に示す1ビットを含む、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0106】
D1.16. 前記デコーダは、参照ピクチャのリサンプリングをサポートするように構成されている、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0107】
D1.17. 前記参照ピクチャのリサンプリングに従って、インター予測ブロックの参照ピクチャは、参照ピクチャと、前記インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記サンプルリサンプリングの対象となる、実施形態D1.16に記載のビデオデコーダ。
【0108】
D1.18. 前記1つ以上の符号化ツールのセット[例えば、200、300、400、500]が、
1つ以上の第1の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのデータストリーム内でシグナリングされる1つ以上の符号化オプションに応じて適用され、前記それぞれのさらなる符号化ツール以外のさらなる符号化ツールに関連する、前記第1の本質的に適用される符号化ツール、及び/または
1つ以上の第2の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのサイズに応じて適用される、前記第2の本質的に適用される符号化ツール、を含む、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0109】
D1.19. 前記1つ以上の符号化ツールのセット[例えば、100、500]が、
1つ以上の明示的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックに対する前記それぞれの符号化ツールの前記適用を排他的にシグナリングするために前記データストリームに符号化されたシンタックス要素に応じて、前記所定のブロックに適用される、前記符号化ツール、を含む、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0110】
D1.20. 前記デコーダは、前記RASLピクチャ内のブロック、及び前記RASLピクチャ以外のピクチャのブロックの前記データストリームから、前記シンタックス要素をデコードするように構成される、実施形態D1.19に記載のビデオデコーダ。
【0111】
D1.21. 前記デコーダは、RASLピクチャのみを除くピクチャ内のブロックの前記データストリームから前記シンタックス要素をデコードするように構成されている(例えば、これにより、RASLピクチャ内のビットが節約される)、実施形態D1.19に記載のビデオデコーダ。
【0112】
D1.22. 前記デコーダは、イントラ予測ブロックデコードモード及びインター予測ブロックデコードモードをサポートするように構成される、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0113】
D1.23. 前記ピクチャシーケンスが
1つのCRAピクチャから始まり、1つのCRAピクチャを含み、符号化順序でCRAピクチャの直前のピクチャまでのピクチャで構成され、CRAピクチャの直前のピクチャで終了し、または
符号化順序で連続しており、複数のCRAを含むピクチャで構成されている、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0114】
D1.24. 前記1つ以上の符号化ツールのセットが、
1つ以上の非アクティブ化可能な符号化ツールであって、そのそれぞれが、ピクチャブロックへの適用に関して、前記データストリーム内の構成シグナリングによってピクチャまたはスライスの単位で非アクティブ化できる、前記1つ以上の非アクティブ化可能な符号化ツールを含む、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0115】
D1.25. オープンGOP切り替えが耐久可能なドリフトをもたらすかどうかを確認するために前記インディケーションを使用するように構成された、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0116】
D1.25a. オープンGOP切り替えがサンプル不一致を引き起こすが、シンタックス及びパラメータ設定を保存するかどうかを確認するために前記インディケーションを使用するように構成された、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0117】
D1.26. 前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化され、この符号化ツールが、デコード順序で、同じピクチャが関連するCRAピクチャに先行する参照ピクチャを有することを示す、及び/または
前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能する前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、最上位の時間レイヤに属さない、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0118】
D1.27. 前記インディケーションは、前記ピクチャシーケンス内の前記RASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示し、
前記1つ以上の符号化ツールの所定のセットのうちからの1つ以上の符号化ツールの第1のサブセットについて、第1の特性が適用される全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットのうちから前記1つ以上の符号化ツールの第1のサブセットを除外する前記方法で符号化されるようにし、
前記1つ以上の符号化ツールの所定のセットのうちからの1つ以上の符号化ツールの第2のサブセットについて、第2の特性が適用される全てのRASLピクチャ、または全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットのうちから前記1つ以上の符号化ツールの第2のサブセットを除外する前記方法で符号化されるようにし、前記第1のサブセットと前記第2のサブセットとが互いに素である、先行実施形態D1.#のいずれかに記載のビデオデコーダ。
【0119】
D1.28. 前記第1の特性及び/または前記第2の特性は、
デコード順で、それが関連付けられているCRAピクチャに先行する参照ピクチャを有するもの、
後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能するもの、及び
最上位の時間レイヤに属していないもの、から選択される、実施形態D1.27に記載のビデオデコーダ。
【0120】
D1.29. 前記第1のサブセットは、デコーダ側動きベクトルリファインメントツール及び時間的動きベクトル予測ツールのうちの1つ以上を含む、実施形態D1.27以降に記載のビデオデコーダ。
【0121】
D1.30. 前記第1の特性は、
デコード順で、それが関連付けられているCRAピクチャに先行する参照ピクチャを有するもの、
後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能するもの、及び
最上位の時間レイヤに属していないもの、から選択される、実施形態D1.29に記載のビデオデコーダ。
【0122】
D2.1. データストリームからビデオをデコードするためのビデオデコーダであって、
前記データストリームから、前記ビデオのピクチャシーケンスのピクチャごとに、前記それぞれのピクチャについてグローバルに、またはスライスごとに、前記それぞれのピクチャが1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうかを示すインディケーションを(例えば、sps_extra_ph_bit_present_flag及びph_extra_bitを使用して、またはgci_rasl_pictures_tool_contraint_flagを使用して)デコードすることであって、前記所定のセットが、(例えば、RASLピクチャでの潜在的なドリフトが十分に低いことを確認できる一種のピクチャに関する指標として)クロスコンポーネント線形モデルベースの予測ツールを含む、前記デコードすること、を行うように構成されている、前記ビデオデコーダ。
【0123】
D2.2. 前記デコーダは、イントラ予測ブロックデコードモード及びインター予測ブロックデコードモードをサポートするように構成される、先行実施形態D2.#のいずれかに記載のビデオデコーダ。
【0124】
D2.3. 前記クロスコンポーネント線形モデルベースの予測ツールに従って、
ピクチャブロックの彩度コンポーネントは、そのパラメータが前記ピクチャブロックの既にデコードされた近傍における極値の輝度値及び彩度値から決定される線形モデルを使用して、前記ピクチャブロックの輝度コンポーネントから予測される、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0125】
D2.4. 前記1つ以上の符号化ツールのセットが、さらに、
輝度トーンマッピング及び彩度残差スケーリング予測ツールを含む、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0126】
D2.5. 前記輝度トーンマッピング及び彩度残差スケーリング予測ツールに従って、
所定のピクチャに対する輝度コンポーネント予測及び輝度コンポーネント残差デコードが、符号化輝度トーンスケールで実行され、その上で、提示輝度トーンスケールが輝度トーンマッピングによってマッピングされて、所定のピクチャの再構成された輝度コンポーネントの符号化輝度トーンスケールバージョンを取得し、
前記所定のピクチャのピクチャブロックのための彩度残差スケールファクタが、前記ピクチャーブロックの近傍内の所定のピクチャの前記再構成された輝度コンポーネントの前記符号化輝度トーンスケールバージョンの平均から決定され、
前記データストリームから前記ピクチャブロックについてデコードされた彩度残差信号が、前記彩度残差スケールファクタに従ってスケーリングされ、前記ピクチャブロックのイントラ彩度予測信号を補正するために使用される、実施形態D2.4に記載のビデオデコーダ。
【0127】
D2.6. 前記1つ以上の符号化ツールのセットが、さらに、
オプティカルフローツールを含む、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0128】
D2.7. 前記オプティカルフローツールが、
オプティカルフローベースの分析によって、所定のインター予測ブロックの並進インター予測信号を改善するためのものである、実施形態D2.6に記載のビデオデコーダ。
【0129】
D2.8. 前記1つ以上の符号化ツールのセットが、さらに、
デコーダ側動きベクトルリファインメントツールを含む、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0130】
D2.9. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルにおける及びその周囲の動きベクトル候補の間で最良一致検索を実行することによって、前記シグナリングされた動きベクトルを改善することにより、参照ピクチャ(404)から所定のインター予測ブロック(10d)をインター予測するために、前記データストリーム内で符号化された前記シグナリングされた動きベクトル(402)を改善するためのものである、実施形態D2.8に記載のビデオデコーダ。
【0131】
D2.9a. 前記デコーダ側動きベクトルリファインメントツールは、
前記参照ピクチャに関して、前記インター予測ブロックの既にデコードされた近傍を使用して、前記最良一致検索を実行するように構成される、実施形態D2.9に記載のビデオデコーダ。
【0132】
D2.9b. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルのペアを含む、及びその周囲の動きベクトルのペア候補の間で最良一致検索を実行することにより、所定のインター双方向予測ブロック(10d)の時間的に前後に位置する参照ピクチャ(404)のペアから、参照ピクチャ(404)のペアから前記所定のインター双方向予測ブロック(10d)をインター予測するために、データストリーム内で符号化された前記シグナリングされた動きベクトル(402)のペアをリファインメントするように構成される、実施形態D2.8に記載のビデオデコーダ。
【0133】
D2.10. 前記1つ以上の符号化ツールのセットが、さらに、
時間的動きベクトル予測ツールを含む、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0134】
D2.11. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、以前にデコードされたピクチャから動きベクトル候補をリクルートすることを含む、実施形態D2.10に記載のビデオデコーダ。
【0135】
D2.12. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、動きベクトル予測子によって指し示された、前記以前にデコードされたピクチャのブロックから動きベクトル候補をリクルートすることを含む、実施形態D2.11に記載のビデオデコーダ。
【0136】
D2.13. 前記動きベクトル予測子が、時間的動きベクトル予測子を含む、実施形態D2.12に記載のビデオデコーダ。
【0137】
D2.14. 前記インディケーションは、
前記ピクチャシーケンスの前記ピクチャによって参照される1つ以上のピクチャパラメータセット、
前記ピクチャシーケンスの前記ピクチャのピクチャヘッダ、及び
前記ピクチャシーケンスの前記ピクチャのスライスのスライスヘッダ、のうちの1つに含まれる、いずれかの先行実施形態D1.#に記載のビデオデコーダ。
【0138】
D2.15. 前記インディケーションは、
前記ピクチャシーケンスの前記ピクチャによって参照されるピクチャパラメータセットであって、前記ピクチャパラメータセットが、少なくとも1つの第1のピクチャパラメータセットを参照するピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されることを示す、前記少なくとも1つの第1のピクチャパラメータセットと、少なくとも1つの第2のピクチャパラメータセットを参照するピクチャが、前記1つ以上の符号化ツールの所定のセットを潜在的に使用する方法で符号化されることを示す、前記少なくとも1つの第2のピクチャパラメータセットとを含む、前記ピクチャパラメータセット、または
前記ピクチャシーケンスの前記ピクチャによって参照されるピクチャパラメータセットであって、前記ピクチャパラメータセットが、少なくとも1つの第1のピクチャパラメータセットを参照するピクチャに関連付けられたRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されることを示す、前記少なくとも1つの第1のピクチャパラメータセットと、少なくとも1つの第2のピクチャパラメータセットを参照するピクチャに関連付けられたRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを潜在的に使用する方法で符号化されることを示す、前記少なくとも1つの第2のピクチャパラメータセットとを含む、前記ピクチャパラメータセット、に含まれる、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0139】
D2.16. 前記インディケーションは、前記ピクチャパラメータセットの拡張シンタックス部分内のシンタックス要素[例えば、sps_extra_ph_bit_present_flag及びph_extra_bitを使用する]を含む、実施形態D2.15に記載のビデオデコーダ。
【0140】
D2.17. 前記ピクチャパラメータセットの前記拡張シンタックス部分の長さは、前記データストリームのシーケンスまたはビデオパラメータセット内に示される、実施形態D2.16に記載のビデオデコーダ。
【0141】
D2.18. 前記インディケーションは、
前記ピクチャシーケンスの前記ピクチャのピクチャヘッダ、及び/または
前記ピクチャシーケンスの前記ピクチャのスライスのスライスヘッダ、のうちの1つに含まれ、
前記拡張部分の長さ[例えば、NumExtraPhBits]が、前記データストリームのピクチャ、またはシーケンス、またはビデオパラメータセット内に示される、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0142】
D2.18a. 前記シンタックス要素は、
前記シンタックス要素が属するピクチャ(例えば、前記ピクチャヘッダまたはスライスヘッダが関連するピクチャ)が、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうか、または
前記シンタックス要素が属するピクチャに関連付けられたRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうか、を示す、実施形態D2.18のビデオデコーダ。
【0143】
D2.19. 前記デコーダは、参照ピクチャのリサンプリングをサポートするように構成されている、いずれかの先行実施形態D2.#に記載のビデオデコーダ。
【0144】
D2.22. 前記参照ピクチャのリサンプリングに従って、インター予測ブロックの参照ピクチャは、参照ピクチャと、前記インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記サンプルリサンプリングの対象となる、実施形態D2.19に記載のビデオデコーダ。
【0145】
D2.23. 前記1つ以上の符号化ツールのセット(例えば、200、300、400、500)が、
1つ以上の第1の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのデータストリーム内でシグナリングされる1つ以上の符号化オプションに応じて適用され、前記それぞれのさらなる符号化ツール以外のさらなる符号化ツールに関連する、前記第1の本質的に適用される符号化ツール、及び/または
1つ以上の第2の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのサイズに応じて適用される、前記第2の本質的に適用される符号化ツール、を含む、先行実施形態D2.#のいずれかに記載のビデオデコーダ。
【0146】
D2.24. 前記1つ以上の符号化ツールのセット(例えば、100、500)が、
1つ以上の明示的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックに対する前記それぞれの符号化ツールの前記適用を排他的にシグナリングするために前記データストリームに符号化されたシンタックス要素に応じて、前記所定のブロックに適用される、前記符号化ツール、を含む、先行実施形態D2.#のいずれかに記載のビデオデコーダ。
【0147】
D2.25. 前記デコーダは、前記1つ以上の符号化ツールの所定のセットがエンコードから除外されるようにシグナリングされているピクチャまたはスライス内のブロック、及び前記1つ以上の符号化ツールの所定のセットがエンコードから除外されるようにシグナリングされていないピクチャまたはスライス内のブロック、の前記データストリームから前記シンタックス要素をデコードするように構成されている、実施形態D2.24に記載のビデオデコーダ。
【0148】
D2.26. 前記デコーダは、前記1つ以上の符号化ツールの所定のセットがエンコードから除外されるようにシグナリングされているピクチャまたはスライス内のブロックのみの前記データストリームから前記シンタックス要素をデコードするように構成される、実施形態D2.24に記載のビデオデコーダ。
【0149】
D2.27. 前記クロスコンポーネント線形モデルベースの予測ツールが、明示的に適用される前記1つ以上の符号化ツールに属する、先行実施形態D2.24以降のいずれかに記載のビデオデコーダ。
【0150】
D2.28. 前記シンタックス要素は、前記1つ以上の符号化ツールの所定のセットの全ての符号化ツールの前記除外を集合的に示す1ビットである、先行実施形態D2.16以降のいずれかに記載のビデオデコーダ。
【0151】
D2.29. 前記1つ以上の符号化ツールのセットが、
1つ以上の非アクティブ化可能な符号化ツールであって、そのそれぞれが、ピクチャブロックへの適用に関して、前記データストリーム内の構成シグナリングによってピクチャまたはスライスの単位で非アクティブ化できる、前記1つ以上の非アクティブ化可能な符号化ツールを含む、先行実施形態D2.#のいずれかに記載のビデオデコーダ。
【0152】
D2.30. オープンGOP切り替えが耐久可能なドリフトをもたらすかどうかを確認するために前記インディケーションを使用するように構成された、先行実施形態D2.#のいずれかに記載のビデオデコーダ。
【0153】
D2.30a. オープンGOP切り替えがサンプル不一致を引き起こすが、シンタックス及びパラメータ設定を保存するかどうかを確認するために前記インディケーションを使用するように構成された、先行実施形態D2.#のいずれかに記載のビデオデコーダ。
【0154】
E1.1. ビデオをデータストリームにエンコードするためのビデオエンコーダであって、
前記ビデオのピクチャのシーケンスに対して有効であり、前記ピクチャのシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示すインディケーション(例えば、gci_rasl_pictures_tool_constraint_flag)を(例えば、異なる空間解像度及び/または異なるSNRで符号化された前記ビデオの、別々に符号化されたオープンGOPバージョンを連結することによるオープンGOP切り替えが、RASLピクチャに過大なドリフトを引き起こさないことを前記エンコーダが認識しているようにする、一種の約束として)前記データストリームにエンコードするように構成される、前記ビデオエンコーダ。
【0155】
E1.2. 前記1つ以上の符号化ツールのセットが、
クロスコンポーネント線形モデルベースの予測ツール(100)を含む、いずれかの先行実施形態E1.#に記載のビデオデコーダ。
【0156】
E1.3. 前記クロスコンポーネント線形モデルベースの予測ツールに従って、
ピクチャブロック(10a)の彩度コンポーネント(102)は、そのパラメータが前記ピクチャブロックの既にエンコードされた近傍(112)における極値の輝度値及び彩度値(110)から決定される(108)線形モデル(106)を使用して、前記ピクチャブロック(10a)の輝度コンポーネント(104)から予測される、実施形態E1.2に記載のビデオエンコーダ。
【0157】
E1.4. 前記1つ以上の符号化ツールのセットが、
輝度トーンマッピング及び彩度残差スケーリング予測ツール(200)を含む、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0158】
E1.5. 前記輝度トーンマッピング及び彩度残差スケーリング予測ツールに従って、
所定のピクチャ(12)に対する輝度コンポーネント予測(202)(例えば、インター予測)及び輝度コンポーネント残差エンコード(204)が、符号化輝度トーンスケール(208)で実行され、その上で、提示輝度トーンスケール(210)が輝度トーンマッピング(212)によってマッピングされて、所定のピクチャの再構成された輝度コンポーネントの符号化輝度トーンスケールバージョン(214)を取得し、
前記所定のピクチャのピクチャブロック(10b)のための彩度残差スケールファクタ(216)が、前記ピクチャーブロックの近傍(222)内の所定のピクチャの前記再構成された輝度コンポーネントの前記符号化輝度トーンスケールバージョンの平均(220)から決定され、
前記ピクチャブロックについて前記データストリームにエンコードされた彩度残差信号(224)が、前記彩度残差スケールファクタに従ってスケーリングされ(226)、前記ピクチャブロックのイントラ彩度予測信号(230)を補正する(228)ために使用される、実施形態E1.4に記載のビデオエンコーダ。
【0159】
E1.6. 前記1つ以上の符号化ツールのセットが、
オプティカルフローツール(300)を含む、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0160】
E1.7. 前記オプティカルフローツールが、
オプティカルフローベースの分析によって、所定のインター予測ブロック(10c)の並進インター予測信号を改善するためのものである、実施形態E1.6に記載のビデオエンコーダ。
【0161】
E1.8. 前記1つ以上の符号化ツールのセットが、
デコーダ側動きベクトルリファインメントツール(400)を含む、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0162】
E1.9. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルにおける及びその周囲の動きベクトル候補の間で最良一致検索を実行することによって、前記シグナリングされた動きベクトルを改善することにより、参照ピクチャ(404)から所定のインター予測ブロック(10d)をインター予測するために、前記データストリーム内で符号化された前記シグナリングされた動きベクトル(402)を改善するためのものである、実施形態E1.8に記載のビデオエンコーダ。
【0163】
E1.9a. 前記デコーダ側動きベクトルリファインメントツールは、
前記参照ピクチャに関して、前記インター予測ブロックの既にデコードされた近傍を使用して、前記最良一致検索を実行するように構成される、実施形態E1.9に記載のビデオエンコーダ。
【0164】
E1.9b. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルのペアを含む、及びその周囲の動きベクトルのペア候補の間で最良一致検索を実行することにより、所定のインター双方向予測ブロック(10d)の時間的に前後に位置する参照ピクチャ(404)のペアから、参照ピクチャ(404)のペアから前記所定のインター双方向予測ブロック(10d)をインター予測するために、データストリーム内で符号化された前記シグナリングされた動きベクトル(402)のペアをリファインメントするように構成される、実施形態E1.8に記載のビデオエンコーダ。
【0165】
E1.10. 前記1つ以上の符号化ツールのセットが、
時間的動きベクトル予測ツール(500)を含む、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0166】
E1.11. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、以前にエンコードされたピクチャ(502)から動きベクトル候補をリクルートすることを含む、実施形態E1.10に記載のビデオエンコーダ。
【0167】
E1.12. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、動きベクトル予測子(504)によって指し示された、前記以前にエンコードされたピクチャのブロック(506)から動きベクトル候補をリクルートすることを含む、実施形態E1.11に記載のビデオエンコーダ。
【0168】
E1.13. 前記動きベクトル予測子が、時間的動きベクトル予測子を含む、実施形態E1.12に記載のビデオエンコーダ。
【0169】
E1.14. 前記インディケーションは、
前記データストリームのデコーダ機能情報セクション、及び
前記データストリームのビデオまたはシーケンスパラメータセット、及び
補足的な拡張情報メッセージ、のうちの1つに含まれる、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0170】
E1.15. 前記インディケーションは、前記ピクチャシーケンス内の前記RASLピクチャの前記符号化に関して、前記1つ以上の符号化ツールの所定のセットの全ての符号化ツールの除外を集合的に示す1ビットを含む、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0171】
E1.16. 前記エンコーダは、参照ピクチャのリサンプリングをサポートするように構成されている、いずれかの先行実施形態E1.#に記載のビデオエンコーダ。
【0172】
E1.17. 前記参照ピクチャのリサンプリングに従って、インター予測ブロックの参照ピクチャは、参照ピクチャと、前記インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記サンプルリサンプリングの対象となる、実施形態E1.16に記載のビデオエンコーダ。
【0173】
E1.18. 前記1つ以上の符号化ツールのセット(例えば、200、300、400、500)が、
1つ以上の第1の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのデータストリーム内でシグナリングされる1つ以上の符号化オプションに応じて適用され、前記それぞれのさらなる符号化ツール以外のさらなる符号化ツールに関連する、前記第1の本質的に適用される符号化ツール、及び/または
1つ以上の第2の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのサイズに応じて適用される、前記第2の本質的に適用される符号化ツール、を含む、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0174】
E1.19. 前記1つ以上の符号化ツールのセット(例えば、100)が、
1つ以上の明示的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックに対する前記それぞれの符号化ツールの前記適用を排他的にシグナリングするために前記データストリームに符号化されたシンタックス要素に応じて、前記所定のブロックに適用される、前記符号化ツール、を含む、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0175】
E1.20. 前記エンコーダは、前記RASLピクチャ内のブロック、及び前記RASLピクチャ以外のピクチャのブロックの前記データストリームに、前記シンタックス要素をエンコードするように構成される、実施形態E1.19に記載のビデオエンコーダ。
【0176】
E1.21. 前記エンコーダは、RASLピクチャのみを除くピクチャ内のブロックの前記データストリームに前記シンタックス要素をエンコードするように構成されている(例えば、これにより、RASLピクチャ内のビットが節約される)、実施形態E1.19に記載のビデオエンコーダ。
【0177】
E1.22. 前記エンコーダは、イントラ予測ブロックエンコードモード及びインター予測ブロックエンコードモードをサポートするように構成される、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0178】
E1.23. 前記ピクチャシーケンスが
1つのCRAピクチャから始まり、1つのCRAピクチャを含み、符号化順序でCRAピクチャの直前のピクチャまでのピクチャで構成され、CRAピクチャの直前のピクチャで終了し、または
符号化順序で連続しており、複数のCRAを含むピクチャで構成されている、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0179】
E1.24. 前記1つ以上の符号化ツールのセットが、
1つ以上の非アクティブ化可能な符号化ツールであって、そのそれぞれが、ピクチャブロックへの適用に関して、前記データストリーム内の構成シグナリングによってピクチャまたはスライスの単位で非アクティブ化できる、前記1つ以上の非アクティブ化可能な符号化ツールを含む、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0180】
E1.25. 前記ビデオを前記データストリームにエンコードする際のエンコード制約としての前記インディケーションに従うように構成される、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0181】
E1.26. 前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化され、この符号化ツールが、デコード順序で、同じピクチャが関連するCRAピクチャに先行する参照ピクチャを有することを示す、及び/または
前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能する前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、及び/または
前記インディケーションは、前記ピクチャシーケンス内の全てのRASLピクチャが、最上位の時間レイヤに属さない、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示す、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0182】
E1.27. 前記インディケーションは、前記ピクチャシーケンス内の前記RASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する前記方法で符号化されていることを示し、
前記1つ以上の符号化ツールの所定のセットのうちからの1つ以上の符号化ツールの第1のサブセットについて、第1の特性が適用される全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットのうちから前記1つ以上の符号化ツールの第1のサブセットを除外する前記方法で符号化されるようにし、
前記1つ以上の符号化ツールの所定のセットのうちからの1つ以上の符号化ツールの第2のサブセットについて、第2の特性が適用される全てのRASLピクチャ、または全てのRASLピクチャが、前記1つ以上の符号化ツールの所定のセットのうちから前記1つ以上の符号化ツールの第2のサブセットを除外する前記方法で符号化されるようにし、前記第1のサブセットと前記第2のサブセットとが互いに素である、先行実施形態E1.#のいずれかに記載のビデオエンコーダ。
【0183】
E1.28. 前記第1の特性及び/または前記第2の特性は、
デコード順で、それが関連付けられているCRAピクチャに先行する参照ピクチャを有するもの、
後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能するもの、及び
最上位の時間レイヤに属していないもの、から選択される、実施形態E1.27に記載のビデオエンコーダ。
【0184】
E1.29. 前記第1のサブセットは、デコーダ側動きベクトルリファインメントツール及び時間的動きベクトル予測ツールのうちの1つ以上を含む、実施形態E1.27以降に記載のビデオエンコーダ。
【0185】
E1.30. 前記第1の特性は、
デコード順で、それが関連付けられているCRAピクチャに先行する参照ピクチャを有するもの、
後続のピクチャの時間的動きベクトル予測参照ピクチャとして機能するもの、及び
最上位の時間レイヤに属していないもの、から選択される、実施形態E1.29に記載のビデオエンコーダ。
【0186】
E2.1. ビデオをデータストリームにエンコードするためのビデオエンコーダであって、
前記ビデオのピクチャシーケンスのピクチャごとに、前記それぞれのピクチャについてグローバルに、またはスライスごとに、前記それぞれのピクチャが1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうかを示すインディケーションを(例えば、sps_extra_ph_bit_present_flag及びph_extra_bitを使用して、またはgci_rasl_pictures_tool_contraint_flagを使用して)前記データストリームにエンコードすることであって、前記所定のセットが、(例えば、RASLピクチャでの潜在的なドリフトが十分に低いことを確認できる一種のピクチャに関する指標として)クロスコンポーネント線形モデルベースの予測ツールを含む、前記エンコードすること、を行うように構成されている、前記ビデオエンコーダ。
【0187】
E2.2. 前記エンコーダは、イントラ予測ブロックエンコードモード及びインター予測ブロックエンコードモードをサポートするように構成される、先行実施形態E2.#のいずれかに記載のビデオエンコーダ。
【0188】
E2.3. 前記クロスコンポーネント線形モデルベースの予測ツールに従って、
ピクチャブロックの彩度コンポーネントは、そのパラメータが前記ピクチャブロックの既にエンコードされた近傍における極値の輝度値及び彩度値から決定される線形モデルを使用して、前記ピクチャブロックの輝度コンポーネントから予測される、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0189】
E2.4. 前記1つ以上の符号化ツールのセットが、さらに、
輝度トーンマッピング及び彩度残差スケーリング予測ツールを含む、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0190】
E2.5. 前記輝度トーンマッピング及び彩度残差スケーリング予測ツールに従って、
所定のピクチャに対する輝度コンポーネント予測及び輝度コンポーネント残差エンコードが、符号化輝度トーンスケールで実行され、その上で、提示輝度トーンスケールが輝度トーンマッピングによってマッピングされて、所定のピクチャの再構成された輝度コンポーネントの符号化輝度トーンスケールバージョンを取得し、
前記所定のピクチャのピクチャブロックのための彩度残差スケールファクタが、前記ピクチャーブロックの近傍内の所定のピクチャの前記再構成された輝度コンポーネントの前記符号化輝度トーンスケールバージョンの平均から決定され、
前記データストリームから前記ピクチャブロックについてエンコードされた彩度残差信号が、前記彩度残差スケールファクタに従ってスケーリングされ、前記ピクチャブロックのイントラ彩度予測信号を補正するために使用される、実施形態E2.4に記載のビデオエンコーダ。
【0191】
E2.6. 前記1つ以上の符号化ツールのセットが、さらに、
オプティカルフローツールを含む、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0192】
E2.7. 前記オプティカルフローツールが、
オプティカルフローベースの分析によって、所定のインター予測ブロックの並進インター予測信号を改善するためのものである、実施形態E2.6に記載のビデオエンコーダ。
【0193】
E2.8. 前記1つ以上の符号化ツールのセットが、さらに、
デコーダ側動きベクトルリファインメントツールを含む、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0194】
E2.9. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルにおける及びその周囲の動きベクトル候補の間で最良一致検索を実行することによって、前記シグナリングされた動きベクトルを改善することにより、参照ピクチャ(404)から所定のインター予測ブロック(10d)をインター予測するために、前記データストリーム内で符号化された前記シグナリングされた動きベクトル(402)を改善するためのものである、実施形態E2.8に記載のビデオエンコーダ。
【0195】
E2.9a. 前記デコーダ側動きベクトルリファインメントツールは、
前記参照ピクチャに関して、前記インター予測ブロックの既にデコードされた近傍を使用して、前記最良一致検索を実行するように構成される、実施形態E2.9に記載のビデオエンコーダ。
【0196】
E2.9b. 前記デコーダ側動きベクトルリファインメントツールは、
シグナリングされた動きベクトルのペアを含む、及びその周囲の動きベクトルのペア候補の間で最良一致検索を実行することにより、所定のインター双方向予測ブロック(10d)の時間的に前後に位置する参照ピクチャ(404)のペアから、参照ピクチャ(404)のペアから前記所定のインター双方向予測ブロック(10d)をインター予測するために、データストリーム内で符号化された前記シグナリングされた動きベクトル(402)のペアをリファインメントするように構成される、実施形態E2.8に記載のビデオエンコーダ。
【0197】
E2.10. 前記1つ以上の符号化ツールのセットが、さらに、
時間的動きベクトル予測ツールを含む、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0198】
E2.11. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、以前にエンコードされたピクチャから動きベクトル候補をリクルートすることを含む、実施形態E2.10に記載のビデオエンコーダ。
【0199】
E2.12. 前記時間的動きベクトル予測ツールによる、インター予測ブロックの動きベクトル候補リスト形成が、動きベクトル予測子によって指し示された、前記以前にエンコードされたピクチャのブロックから動きベクトル候補をリクルートすることを含む、実施形態E2.11に記載のビデオエンコーダ。
【0200】
E2.13. 前記動きベクトル予測子が、時間的動きベクトル予測子を含む、実施形態E2.12に記載のビデオエンコーダ。
【0201】
E2.14. 前記インディケーションは、
前記ピクチャシーケンスの前記ピクチャによって参照される1つ以上のピクチャパラメータセット、
前記ピクチャシーケンスの前記ピクチャのピクチャヘッダ、及び
前記ピクチャシーケンスの前記ピクチャのスライスのスライスヘッダ、のうちの1つに含まれる、いずれかの先行実施形態D1.#に記載のビデオエンコーダ。
【0202】
E2.15. 前記インディケーションは、
前記ピクチャシーケンスの前記ピクチャによって参照されるピクチャパラメータセットであって、前記ピクチャパラメータセットが、少なくとも1つの第1のピクチャパラメータセットを参照するピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されることを示す、前記少なくとも1つの第1のピクチャパラメータセットと、少なくとも1つの第2のピクチャパラメータセットを参照するピクチャが、前記1つ以上の符号化ツールの所定のセットを潜在的に使用する方法で符号化されることを示す、前記少なくとも1つの第2のピクチャパラメータセットとを含む、前記ピクチャパラメータセット、または
前記ピクチャシーケンスの前記ピクチャによって参照されるピクチャパラメータセットであって、前記ピクチャパラメータセットが、少なくとも1つの第1のピクチャパラメータセットを参照するピクチャに関連付けられたRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されることを示す、前記少なくとも1つの第1のピクチャパラメータセットと、少なくとも1つの第2のピクチャパラメータセットを参照するピクチャに関連付けられたRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを潜在的に使用する方法で符号化されることを示す、前記少なくとも1つの第2のピクチャパラメータセットとを含む、前記ピクチャパラメータセット、に含まれる、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0203】
E2.16. 前記インディケーションは、前記ピクチャパラメータセットの拡張シンタックス部分内のシンタックス要素(例えば、sps_extra_ph_bit_present_flag及びph_extra_bitを使用する)を含む、実施形態E2.15に記載のビデオエンコーダ。
【0204】
E2.17. 前記ピクチャパラメータセットの前記拡張シンタックス部分の長さは、前記データストリームのシーケンスまたはビデオパラメータセット内に示される、実施形態E2.16に記載のビデオエンコーダ。
【0205】
E2.18. 前記インディケーションは、
前記ピクチャシーケンスの前記ピクチャのピクチャヘッダ、及び/または
前記ピクチャシーケンスの前記ピクチャのスライスのスライスヘッダ、のうちの1つに含まれ、
前記拡張部分の長さ(例えば、NumExtraPhBits)が、前記データストリームのピクチャ、またはシーケンス、またはビデオパラメータセット内に示される、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0206】
E2.18a. 前記シンタックス要素は、
前記シンタックス要素が属するピクチャ(例えば、前記ピクチャヘッダまたはスライスヘッダが関連するピクチャ)が、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうか、または
前記シンタックス要素が属するピクチャに関連付けられたRASLピクチャが、前記1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうか、を示す、実施形態E2.18のビデオエンコーダ。
【0207】
E2.19. 前記エンコーダは、参照ピクチャのリサンプリングをサポートするように構成されている、いずれかの先行実施形態E2.#に記載のビデオエンコーダ。
【0208】
E2.22. 前記参照ピクチャのリサンプリングに従って、インター予測ブロックの参照ピクチャは、参照ピクチャと、前記インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記サンプルリサンプリングの対象となる、実施形態E2.19に記載のビデオエンコーダ。
【0209】
E2.23. 前記1つ以上の符号化ツールのセット(例えば、200、300、400、500)が、
1つ以上の第1の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのデータストリーム内でシグナリングされる1つ以上の符号化オプションに応じて適用され、前記それぞれのさらなる符号化ツール以外のさらなる符号化ツールに関連する、前記第1の本質的に適用される符号化ツール、及び/または
1つ以上の第2の本質的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックのサイズに応じて適用される、前記第2の本質的に適用される符号化ツール、を含む、先行実施形態E2.#のいずれかに記載のビデオエンコーダ。
【0210】
E2.24. 前記1つ以上の符号化ツールのセットが、
1つ以上の明示的に適用される符号化ツールであって、そのそれぞれが所定のブロックに対して、前記所定のブロックに対する前記それぞれの符号化ツールの前記適用を排他的にシグナリングするために前記データストリームに符号化されたシンタックス要素に応じて、前記所定のブロックに適用される、前記符号化ツール、を含む、先行実施形態E2.#のいずれかに記載のビデオエンコーダ。
【0211】
E2.25. 前記エンコーダは、前記1つ以上の符号化ツールの所定のセットがエンコードから除外されるようにシグナリングされているピクチャまたはスライス内のブロック、及び前記1つ以上の符号化ツールの所定のセットがエンコードから除外されるようにシグナリングされていないピクチャまたはスライス内のブロック、の前記データストリームに前記シンタックス要素をエンコードするように構成されている、実施形態E2.24に記載のビデオエンコーダ。
【0212】
E2.26. 前記エンコーダは、前記1つ以上の符号化ツールの所定のセットがエンコードから除外されるようにシグナリングされているピクチャまたはスライス内のブロックのみの前記データストリームに前記シンタックス要素をエンコードするように構成される、実施形態E2.24に記載のビデオエンコーダ。
【0213】
E2.27. 前記クロスコンポーネント線形モデルベースの予測ツールが、明示的に適用される前記1つ以上の符号化ツールに属する、先行実施形態E2.24以降のいずれかに記載のビデオエンコーダ。
【0214】
E2.28. 前記シンタックス要素は、前記1つ以上の符号化ツールの所定のセットの全ての符号化ツールの前記除外を集合的に示す1ビットである、先行実施形態E2.16以降のいずれかに記載のビデオエンコーダ。
【0215】
E2.29. 前記1つ以上の符号化ツールのセットが、
1つ以上の非アクティブ化可能な符号化ツールであって、そのそれぞれが、ピクチャブロックへの適用に関して、前記データストリーム内の構成シグナリングによってピクチャまたはスライスの単位で非アクティブ化できる、前記1つ以上の非アクティブ化可能な符号化ツールを含む、先行実施形態E2.#のいずれかに記載のビデオエンコーダ。
【0216】
E2.30. 前記ビデオを前記データストリームにエンコードする際のエンコード制約としての前記インディケーションに従うように構成される、先行実施形態E2.#のいずれかに記載のビデオエンコーダ。
【0217】
B1.1. ビデオがエンコードされているデータストリームであって、
前記ビデオのピクチャのシーケンスに対して有効であり、前記ピクチャのシーケンス内のRASLピクチャが、1つ以上の符号化ツールの所定のセットを除外する方法で符号化されていることを示す(例えば、異なる空間解像度及び/または異なるSNRで符号化された前記ビデオの、別々に符号化されたオープンGOPバージョンを連結することによるオープンGOP切り替えが、RASLピクチャに過大なドリフトを引き起こさないことをエンコーダが認識しているようにする、一種の約束としての)インディケーション(例えば、gci_rasl_pictures_tool_constraint_flag)、を含む、前記データストリーム。
【0218】
B1.2. 実施形態E1.#のいずれかによるエンコーダによって生成される、実施形態B1.1に記載のデータストリーム。
【0219】
B2.1. ビデオがエンコードされているデータストリームであって、
前記ビデオのピクチャシーケンスのピクチャごとに、前記それぞれのピクチャについてグローバルに、またはスライスごとに、前記それぞれのピクチャが1つ以上の符号化ツールの所定のセットを除外する方法で符号化されているかどうかを示すインディケーション(例えば、sps_extra_ph_bit_present_flag及びph_extra_bitを使用して、またはgci_rasl_pictures_tool_contraint_flagを使用する)であって、前記所定のセットが、(例えば、RASLピクチャでの潜在的なドリフトが十分に低いことを確認できる一種のピクチャに関する指標として)クロスコンポーネント線形モデルベースの予測ツールを含む、前記インディケーション、を含む、前記データストリーム。
【0220】
B2.2. 実施形態E2.#のいずれかによるエンコーダによって生成される、実施形態B2.1に記載のデータストリーム。
【0221】
M. 上記のデコーダ及びエンコーダのいずれかによって実行される方法。
【0222】
P. コンピュータ上でプログラムが実行されたときに、実施形態Mに記載の方法を実行するためのプログラムコードを有する、前記コンピュータプログラム。
【0223】
いくつかの態様が装置の観点で説明されているが、これらの態様が対応する方法の説明も表すことが明らかであり、ブロックまたはデバイスは方法ステップ、または方法ステップの特徴に対応する。同様に、方法ステップの観点で説明された態様もまた、対応するブロックもしくは項目、または対応する装置の特徴の説明を表す。いくつかの、またはすべての方法ステップは、例えば、マイクロプロセッサ、プログラマブルコンピュータまたは電子回路などのハードウェア装置によって(またはそれを使用して)実行され得る。いくつかの実施形態では、ほとんどの重要な方法ステップのうちの1つ以上は、そのような装置によって実行されてもよい。
【0224】
発明のデータストリームは、デジタル記憶媒体に記憶されてもよく、またはインターネットなどの無線伝送媒体または有線伝送媒体などの伝送媒体上で伝送されてもよい。
【0225】
特定の実装要件に応じて、発明の実施形態は、ハードウェアまたはソフトウェアにおいて実装されてもよい。実装態様は、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(または、協働することが可能な)、そこに記憶された電子可読制御信号を有する、デジタル記憶媒体、例えば、フロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行されてもよい。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。
【0226】
本発明による、いくつかの実施形態は、電子的に可読な制御信号を有するデータキャリアを含み、これらの制御信号がプログラム可能なコンピュータシステムと協働することができることで、本明細書に記載の方法のうちの1つが実行される。
【0227】
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装され得、このプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行するときに方法のうちの1つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリアに格納され得る。
【0228】
他の実施形態は、本明細書に記載の方法のうちの1つを実行し、機械可読キャリアに格納される、コンピュータプログラムを含む。
【0229】
換言すれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行するときに、本明細書に記載の方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0230】
したがって、発明の方法の更なる実施形態は、そこに記録された、本明細書で説明される方法の1つを実行するためのコンピュータプログラムを含むデータキャリア(または、デジタル記憶媒体またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は典型的には、有形であり、及び/または非一時的である。
【0231】
したがって、発明の方法の更なる実施形態は、本明細書で説明される方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは信号シーケンスは、例えば、インターネットを介してなど、データ通信接続を介して転送されるように構成され得る。
【0232】
さらなる実施形態は、例えば、本明細書に記載の方法のうちの1つを実行するように構成される、または適合されるコンピュータ、またはプログラマブルロジックデバイスなどの処理手段を含む。
【0233】
さらなる実施形態は、コンピュータを含み、その上には、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされている。
【0234】
本発明による、さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを受信器に転送する(例えば、電子的に、または光学的に)ように構成される、装置またはシステムを含む。受信器は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってよい。装置またはシステムは、例えば、コンピュータプログラムを受信器に転送するためのファイルサーバを含み得る。
【0235】
いくつかの実施形態では、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)は、本明細書に記載の方法の機能の一部または全てを実行するために使用され得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法のうちの1つを実行するためにマイクロプロセッサと協働し得る。概して、方法は、いずれかのハードウェア装置によって好ましくは実行される。
【0236】
本明細書で説明される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置及びコンピュータの組み合わせを使用して実装されてもよい。
【0237】
本明細書で説明される装置、または本明細書で説明される装置のいずれかの構成要素は、ハードウェア及び/またはソフトウェアにおいて少なくとも部分的に実装されてもよい。
【0238】
本明細書で説明される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置及びコンピュータの組み合わせを使用して実行されてもよい。
【0239】
本明細書で説明される方法、または本明細書で説明される装置のいずれかの構成要素は、ハードウェア及び/またはソフトウェアにおいて少なくとも部分的に実装されてもよい。
【0240】
上記説明された実施形態は、本発明の原理の例示にすぎない。本明細書に記載の構成及び詳細の修正形態及び変形形態が当業者には明らかであろうことが理解される。したがって、本明細書の実施形態の記述及び説明として提示された具体的な詳細によってではなく、差し迫る特許請求の範囲によってのみ限定されることが意図される。
【0241】
参考文献
[1] ISO/IEC JTC 1, Information technology - Dynamic adaptive streaming over HTTP (DASH) - Part 1: Media presentation description and segment formats, ISO/IEC 23009-1, 2012 (and subsequent editions).
[2] J. De Cock, Z. Li, M. Manohara, A. Aaron. “Complexity-based consistent-quality encoding in the cloud.” 2016 IEEE International Conference on Image Processing (ICIP). IEEE, 2016
[3] DASH Industry Forum Implementation Guidelines. [Online]. Available: https://dashif.org/guidelines/
[4] ITU-T and ISO/IEC JTC 1, Advanced Video Coding for generic audio-visual services, Rec. ITU-T H.264 and ISO/IEC 14496-10 (AVC), May 2003 (and subsequent editions).
[5] ITU-T and ISO/IEC JTC 1, “High Efficiency Video Coding,” Rec. ITU-T H.265 and ISO/IEC 23008-2 (HEVC), April 2013 (and subsequent editions).
[6] Y. Yan, M. Hannuksela, and H. Li. “Seamless switching of H. 265/HEVC-coded dash representations with open GOP prediction structure.” 2015 IEEE International Conference on Image Processing (ICIP). IEEE, 2015.
[7] ITU-T and ISO/IEC JTC 1, “Versatile video coding”, Rec. ITU-T H.266 and ISO/IEC 23090-3 (VVC), August 2020.
[8] V. Baroncini and M. Wien, “VVC verification test report for UHD SDR video content”, doc. JVET-T2020 of ITU-T/ISO/IEC Joint Video Experts Team (JVET), 21th meeting: October 2020.
[9] D. Luo, V. Seregin, W. Wan. “Description of Core Experiment 1 (CE1): Reference picture resampling filters“, doc. JVET-Q2021 of ITU-T/ISO/IEC Joint Video Experts Team (JVET), 15th meeting: July 2019
[10] H. Schwarz, D. Marpe, and T. Wiegand, “Analysis of hierarchical B pictures and MCTF”, ICME 2006, IEEE International Conference on Multimedia and Expo, Toronto, Ontario, Canada, July 2006.
[11] Y.-K. Wang et al., “The High-Level Syntax of the Versatile Video Coding (VVC) Standard” IEEE Trans. Circuits Syst. Video Technol., in press
[12] H. Yang et al., “Subblock based Motion Derivation and Inter-Prediction Refinement in Versatile Video Coding Standard”, IEEE Trans. Circuits Syst. Video Technol., in press
[13] W.-J. Chien et al., “Motion Vector Coding and Block Merging in Versatile Video Coding Standard”, IEEE Trans. Circuits Syst. Video Technol., in press
【手続補正書】
【提出日】2023-09-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ
符号化の方法であって、
ピクチャのシーケンス内の
すべてのランダムアクセススキップリーディング(RASL
)ピクチャ
の符号化が、1つ以上の符号化ツールの所定のセットを除外する方法で
制約されていることを示す
補足強化情報(SEI)メッセージをデータストリームに符号化することを備え、前
記所定のセットが、
クロスコンポーネント線形モデルベースの予測ツール(100)、及
び
デコーダ側動きベクトルリファインメントツール(400)、を含
み、
前記ピクチャのシーケンスは、少なくとも1つのランダムアクセススキップリーディング(RASL)ピクチャと、前記少なくとも1つのRASLピクチャに関連付けられたクリーンランダムアクセス(CRA)ピクチャと、を備える、
方法。
【請求項2】
前記SEIメッセージは、前記少なくとも1つのRASLピクチャの動きベクトルの時間的動きベクトル予測(TMVP)またはサブブロックの時間的動きベクトル予測(sbTMVP)に対して使用されるコロケートされた参照ピクチャが、デコード順序において前記RASLピクチャに関連付けられた前記CRAピクチャに先行しないように、前記少なくとも1つのRASLピクチャの符号化が制約されることをさらに示す、請求項1に記載の方法。
【請求項3】
参照ピクチャのリサンプリングを実行することであって、参照ピクチャと、インター予測ブロックのインター予測信号を提供するために前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、前記参照ピクチャのリサンプリングによって、前記インター予測ブロックの参照ピクチャがリサンプルされる、リサンプリングを実行することをさらに備える、
請求項1または2のいずれかに記載の方法。
【請求項4】
請求項1または2のいずれかに記載の方法を実行するように構成された少なくとも1つのプロセッサを備える、ビデオエンコーダ。
【請求項5】
コンピュータによって実行されたときに、請求項1または2のいずれかに記載の方法を実行するための、コンピュータプログラムを格納した非一時的デジタル記憶媒体。
【請求項6】
ビデオ復号の方法であって、
ピクチャのシーケンス内のすべてのランダムアクセススキップリーディング(RASL) ピクチャの符号化が、1つ以上の符号化ツールの所定のセットを除外する方法で制約されていることを示す補足強化情報(SEI)メッセージをデータストリームから復号することを備え、
前記所定のセットが、
クロスコンポーネント線形モデルベースの予測ツール(100)、及び
デコーダ側動きベクトルリファインメントツール(400)、を含み、
前記ピクチャのシーケンスは、少なくとも1つのランダムアクセススキップリーディング(RASL)ピクチャと、前記少なくとも1つのRASLピクチャに関連付けられたクリーンランダムアクセス(CRA)ピクチャと、を備える、方法。
【請求項7】
前記SEIメッセージは、前記少なくとも1つのRASLピクチャの動きベクトルの時間的動きベクトル予測 (TMVP)またはサブブロックの時間的動きベクトル予測 (sbTMVP)に対して使用されるコロケートされた参照ピクチャが、デコード順序において前記RASLピクチャに関連付けられた前記CRAピクチャに先行しないように、前記少なくとも1つのRASLピクチャの符号化が制約されることをさらに示す、請求項6に記載の方法。
【請求項8】
参照ピクチャのリサンプリングを実行することであって、参照ピクチャと
、インター予測ブロックのインター予測信号を提供するため
に前記インター予測ブロックが含まれるピクチャとの間のスケーリングウィンドウサイズの逸脱またはサンプル解像度の逸脱を埋めるために、
前記参照ピクチャのリサンプリングによって、前記インター予測ブロックの参照ピクチャがリサンプルされる、リサンプリングを実行することをさらに備える、
請求項
6から
7のいずれかに記載の
方法。
【請求項9】
請求項6または7のいずれかに記載の方法を実行するように構成された少なくとも1つのプロセッサを備える、ビデオデコーダ。
【請求項10】
コンピュータによって実行されたときに、請求項6または7のいずれかに記載の方法を実行するための、コンピュータプログラムを格納した非一時的デジタル記憶媒体。
【国際調査報告】