(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023179709
(43)【公開日】2023-12-19
(54)【発明の名称】成分間線形モデルパラメータの計算の堅牢性を強化するためのエンコーダ、デコーダ、および方法
(51)【国際特許分類】
H04N 19/11 20140101AFI20231212BHJP
H04N 19/136 20140101ALI20231212BHJP
H04N 19/176 20140101ALI20231212BHJP
H04N 19/186 20140101ALI20231212BHJP
【FI】
H04N19/11
H04N19/136
H04N19/176
H04N19/186
【審査請求】未請求
【請求項の数】17
【出願形態】OL
(21)【出願番号】P 2023178322
(22)【出願日】2023-10-16
(62)【分割の表示】P 2021532159の分割
【原出願日】2019-12-06
(31)【優先権主張番号】18211107.0
(32)【優先日】2018-12-07
(33)【優先権主張国・地域又は機関】EP
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Blu-ray
(71)【出願人】
【識別番号】500341779
【氏名又は名称】フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】クリスティアン・ヘルムリッヒ
(72)【発明者】
【氏名】ハイコ・シュヴァルツ
(72)【発明者】
【氏名】デトレフ・マルペ
(72)【発明者】
【氏名】トーマス・ヴィーガンド
(57)【要約】 (修正有)
【課題】成分間線形モデルパラメータの計算の堅牢性を強化するためのデコーダ/エンコーダを提供する。
【解決手段】デコーダは、ルマ-クロマサンプルの第1のペア(A、A’)およびルマ-クロマサンプルの第2のペア(B、B’)を通る一次関数を有する直線(43)を適合させ、ルマ-クロマサンプルの第1のペア(A、A’)は、近傍のルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、ルマ-クロマサンプルの第2のペア(B、B’)は、近傍のルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定され、ルマサンプルおよび一次関数を使用してクロマサンプルを予測する、ことによっての現在のブロックを復号するように構成されている。
【選択図】
図5
【特許請求の範囲】
【請求項1】
ピクチャ(12’)のピクチャデータのブロックベース復号のためのデコーダ(20)であって、前記デコーダ(20)は、
現在のブロック(80、82、84)の近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定し、前記ルマサンプルの第1のセットは前記ルマサンプルの第2のセットよりも小さいルマ値を有し、
ルマ-クロマサンプルの第1のペア(A、A’)およびルマ-クロマサンプルの第2のペア(B、B’)を通る一次関数を有する直線(43)を適合させ、前記ルマ-クロマサンプルの第1のペア(A、A’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、前記ルマ-クロマサンプルの第2のペア(B、B’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定され、
前記現在のブロック(80、82、84)のルマサンプルおよび前記一次関数を使用して前記現在のブロック(80、82、84)のクロマサンプルを予測する
ことによって前記ピクチャ(12’)の前記現在のブロック(80、82、84)を復号するように構成されている、デコーダ(20)。
【請求項2】
イントラ予測および/またはインター予測によって前記現在のブロック(80、82、84)の前記ルマサンプルを再構築するように構成されている、
請求項1に記載のデコーダ(20)。
【請求項3】
データストリーム(14)から前記現在のブロック(80、82、84)のルマサンプル残差を復号し、
予測されたルマサンプルを取得するためにイントラ予測および/またはインター予測によって前記現在のブロック(80、82、84)の前記ルマサンプルを再構築し、前記ルマサンプル残差を使用して前記予測されたルマサンプルを補正する
ように構成されている、請求項1または2に記載のデコーダ(20)。
【請求項4】
前記現在のブロック(80、82、84)の前記近傍でn>1個の最小ルマ値を見つけることによって前記ルマサンプルの第1のセットを決定し、および/または
前記現在のブロック(80、82、84)の前記近傍でn>1個の最大ルマ値を見つけることによって前記ルマサンプルの第2のセットを決定する
ように構成されている、請求項1から3のいずれか一項に記載のデコーダ(20)。
【請求項5】
前記現在のブロック(80、82、84)の前記近傍でn=2個の最小ルマ値を見つけることによって前記ルマサンプルの第1のセットを決定し、および/または
前記現在のブロック(80、82、84)の前記近傍でn=2個の最大ルマ値を見つけることによって前記ルマサンプルの第2のセットを決定する
ように構成されている、請求項1から3のいずれか一項に記載のデコーダ(20)。
【請求項6】
前記直線(43)が、前記直線(43)の一次関数を導出するために前記ルマ-クロマサンプルの第1のペア(A、A’)の平均(53)および前記ルマ-クロマサンプルの第2のペア(B、B’)の平均(54)を通って延在するように、直線(43)を適合させる
ように構成されている、請求項1から5のいずれか一項に記載のデコーダ(20)。
【請求項7】
前記一次関数は式y=α・x+βによって与えられ、αは前記直線(43)の勾配を表す第1の成分間線形モデルパラメータであり、βは前記直線(43)のオフセットを表す第2の成分間線形モデルパラメータであり、
前記デコーダ(20)は、
前記一次関数を使用して、前記現在のブロック(80、82、84)の1つ以上のルマサンプルxのために前記現在のブロック(80、82、84)の1つ以上の対応するクロマサンプルyを予測する
ようにさらに構成されている、請求項1から6のいずれか一項に記載のデコーダ(20)。
【請求項8】
ピクチャ(12)のピクチャデータのデータストリーム(14)へのブロックベース符号化のためのエンコーダ(10)であって、前記エンコーダ(10)は、
現在のブロック(80、82、84)の近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定し、前記ルマサンプルの第1のセットは前記ルマサンプルの第2のセットよりも小さいルマ値を有し、
ルマ-クロマサンプルの第1のペア(A、A’)およびルマ-クロマサンプルの第2のペア(B、B’)を通る一次関数を有する直線(43)を適合させ、前記ルマ-クロマサンプルの第1のペア(A、A’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、前記ルマ-クロマサンプルの第2のペア(B、B’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定され、
前記現在のブロック(80、82、84)のルマサンプルおよび前記一次関数を使用して前記現在のブロック(80、82、84)のクロマサンプルを予測する
ことによって前記ピクチャ(12)の前記現在のブロック(80、82、84)を符号化するように構成されている、エンコーダ(10)。
【請求項9】
前記現在のブロック(80、82、84)の前記ルマサンプルが予測されたルマサンプルを取得するためにイントラ予測および/またはインター予測によって再構築可能となるように、前記現在のブロック(80、82、84)のルマサンプル残差を前記データストリーム(14)に符号化し、前記予測されたルマサンプルは、前記ルマサンプル残差を使用して補正可能である
ように構成されている、請求項8に記載のエンコーダ(10)。
【請求項10】
前記現在のブロック(80、82、84)の前記近傍でn>1個の最小ルマ値を見つけることによって前記ルマサンプルの第1のセットを決定し、および/または
前記現在のブロック(80、82、84)の前記近傍でn>1個の最大ルマ値を見つけることによって前記ルマサンプルの第2のセットを決定する
ように構成されている、請求項8または9に記載のエンコーダ(10)。
【請求項11】
前記現在のブロック(80、82、84)の前記近傍でn=2個の最小ルマ値を見つけることによって前記ルマサンプルの第1のセットを決定し、および/または
前記現在のブロック(80、82、84)の前記近傍でn=2個の最大ルマ値を見つけることによって前記ルマサンプルの第2のセットを決定する
ように構成されている、請求項8または9に記載のエンコーダ(10)。
【請求項12】
前記直線(43)が、前記直線(43)の一次関数を導出するために前記ルマ-クロマサンプルの第1のペア(A、A’)の平均(53)および前記ルマ-クロマサンプルの第2のペア(B、B’)の平均(54)を通って延在するように、直線(43)を適合させる
ように構成されている、請求項8から11のいずれか一項に記載のエンコーダ(10)。
【請求項13】
前記一次関数は式y=α・x+βによって与えられ、αは前記直線(43)の勾配を表す第1の成分間線形モデルパラメータであり、βは前記直線(43)のオフセットを表す第2の成分間線形モデルパラメータであり、
前記エンコーダ(10)は、
前記一次関数を使用して、前記現在のブロック(80、82、84)の1つ以上のルマサンプルxのために前記現在のブロック(80、82、84)の1つ以上の対応するクロマサンプルyを予測する
ようにさらに構成されている、請求項8から12のいずれか一項に記載のエンコーダ(10)。
【請求項14】
ピクチャ(12’)のピクチャデータのブロックベース復号の方法であって、前記ピクチャ(12’)の現在のブロック(80、82、84)を復号するステップは、
現在のブロック(80、82、84)の近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定するステップであって、前記ルマサンプルの第1のセットは前記ルマサンプルの第2のセットよりも小さいルマ値を有する、ステップと、
ルマ-クロマサンプルの第1のペア(A、A’)およびルマ-クロマサンプルの第2のペア(B、B’)を通る一次関数を有する直線(43)を適合させるステップであって、前記ルマ-クロマサンプルの第1のペア(A、A’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、前記ルマ-クロマサンプルの第2のペア(B、B’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される、ステップと、
前記現在のブロック(80、82、84)のルマサンプルおよび前記一次関数を使用して前記現在のブロックのクロマサンプルを予測するステップと
を含む方法。
【請求項15】
ピクチャ(12)のピクチャデータのブロックベース符号化の方法であって、前記ピクチャ(12)の現在のブロック(80、82、84)を符号化するステップは、
現在のブロック(80、82、84)の近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定するステップであって、前記ルマサンプルの第1のセットは前記ルマサンプルの第2のセットよりも小さいルマ値を有する、ステップと、
ルマ-クロマサンプルの第1のペア(A、A’)およびルマ-クロマサンプルの第2のペア(B、B’)を通る一次関数を有する直線(43)を適合させるステップであって、前記ルマ-クロマサンプルの第1のペア(A、A’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、前記ルマ-クロマサンプルの第2のペア(B、B’)は、前記現在のブロック(80、82、84)の前記近傍の前記ルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される、ステップと、
前記現在のブロック(80、82、84)のルマサンプルおよび前記一次関数を使用して前記現在のブロック(80、82、84)のクロマサンプルを予測するステップと
を含む方法。
【請求項16】
コンピュータ上で実行されると、請求項14または15に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムが記憶された、コンピュータ可読デジタル記憶媒体。
【請求項17】
請求項15に記載の方法によって取得されたデータストリーム(14)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、いずれも成分間線形モデルパラメータの計算の堅牢性を強化するための発明的特徴を含む、ピクチャのピクチャデータのブロックベース復号のためのデコーダ、およびブロックベース符号化のためのエンコーダに関する。さらなる実施形態は、前記発明的特徴を利用するピクチャのピクチャデータのブロックベース復号およびブロックベース符号化のための対応する方法、ならびにコンピュータ上で実行されると、ブロックベース復号およびブロックベース符号化のための前記方法のうちの少なくとも1つを実行するためのプログラムコードを有するコンピュータプログラムが記憶された、コンピュータ可読デジタル記憶媒体に関する。いくつかの実施形態は、線適合アルゴリズムの分野、具体的には成分間線形モデル(CCLM)予測の分野に存在し得る。
【背景技術】
【0002】
成分間線形モデル(CCLM)予測は、複数の信号チャネル(ここでは、輝度/ルマおよび彩度/クロマピクチャ平面)の符号化において統計的冗長性を利用できるようにする符号化ツールである。従来、CCLM予測器パラメータαおよびβは、
図8に示されるように、直線y=α・x+βによってデータ点(ここでは、ルマ-クロマサンプル値のペア)[x,y]の最小二乗平均(LMS)近似を試みる線形回帰法を介して導出される。
【0003】
画像およびビデオ符号化の場合、このようなアプローチは、既に符号化された(1つまたは複数の)ルマサンプル値xからクロマサンプル値yを予測するために使用することができ、こうして多くの入力シーケンス[1]、[2]に対する符号化効率の改善を実現する。線形回帰ベースの線適合アルゴリズムの計算の複雑さは、特にピクチャ符号化において非常に高いので、簡略化された線適合が[2](以下ではJVET-L0191とも呼ばれる)で最近提案され、その後VVCドラフト仕様[3]に採用された。
【0004】
[2]によれば、全ての利用可能なルマ-クロマサンプルペアから直線を決定する代わりに、この提案は、最小ルマ値を有する1つのデータ点Aと最大ルマ値を有する1つのデータ点Bとの間にのみ線を適合させる。これにより、アルゴリズムに必要な演算(特に乗算)の数を削減し、CCLM法の主要な演算として局所的なルマ最小値および最大値の探索を残す。なお、(CU内のクロマサンプルごとに実行されるため)中程度および大きいCUでのモデル計算よりも多くの演算を使用する実際のCCLM予測は、簡略化の影響を受けないことに留意されたい。
【0005】
JVET-L0191によれば、簡略化されたCCLM計算は、約80行のソースコードを節約し、ランダムアクセスおよび低遅延B構成における復号実行時間を数パーセント削減する。残念ながら、UHDコンテンツ(クラスA)での最大約1%の彩度符号化効率の損失も報告されており[2]、これは統計的外れ値に対する簡略化されたCCLM適合アルゴリズムの感受性の上昇に起因している可能性があり、ルマ-クロマ点の残りのセットに対する極値(最小値Aおよび最大値B)の強い変動は、LMSベースのCCLMよりもはるかに不正確な線適合をもたらす可能性が高い。実際、このようなシナリオは、JVET-L0191から得られた
図8に示されており、実線はデータとあまり適合していない-すなわち、AとBとの間のほぼ全ての残りのルマ-クロマペアは、適合線の下になっている。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、線形モデルパラメータの計算の堅牢性を改善することであり、前記改善された計算は、彩度符号化効率の損失が低減されるように、統計的外れ値に対する感受性が低下する。
【課題を解決するための手段】
【0007】
本発明によれば、この目的は、請求項1に記載のデコーダ、請求項8に記載のエンコーダ、請求項14に記載の復号の方法、請求項15に記載の符号化の方法、および請求項16に記載のコンピュータ可読記憶媒体を用いて達成される。
【0008】
第1の実施形態は、ピクチャのピクチャデータのブロックベース復号のためのデコーダに関する。デコーダは、一次関数を使用して現在のブロックのルマサンプルに対する現在のブロックのクロマサンプルを予測することによって、ピクチャの現在のブロックを復号するように構成されている。前記一次関数は、近傍、たとえば隣接ブロックに基づいて決定され得る。具体的には、前記一次関数は、前記近傍のルマ-クロマサンプルのペアに基づいて決定され得る。このようなルマ-クロマサンプルのペアは、ルマサンプルと、対応する、たとえば共位置にある、クロマサンプルとを含み得る。より一般的には、前記ペアは、少なくとも1つのルマサンプルと、対応する、たとえば共位置にある、クロマサンプルとを供えてもよく、これはダウンサンプリングされたクロマ表現の場合であり、2つ(4:2:2ダウンサンプリング)または4つ(4:2:0ダウンサンプリング)の共位置にあるルマサンプルに1つのクロマサンプルのみが利用可能であり得る。言い換えると、クロマダウンサンプリングされた入力の場合にルマ-クロマサンプルのペアを取得するために、ルマ-クロマサンプルの前記ペアを形成している間に暗黙的な中間ルマダウンサンプリングが実行されるので、結果的なペアは、簡潔にするために、1つのみの(暗黙的にダウンサンプリングされた)ルマサンプルと、1つの対応する、たとえば共位置にある(明示的にダウンサンプリングされた)クロマサンプルとを含む。[1]参照。近傍のルマ-クロマサンプルのペアを取得するために、デコーダは、現在のブロックの前記近傍の、ルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定するように構成されている。ルマサンプルの第1のセットおよびルマサンプルの第2のセットは各々、複数の、たとえば2つ以上のルマサンプルを含み得る。ルマサンプルの第1のセットに含まれるルマサンプルは、ルマサンプルの第2のセットに含まれるルマサンプルよりも小さいルマ値を含む。言い換えると、ルマサンプルの第1のセットは複数の小さい値のルマサンプルを含むことができ、ルマサンプルの第2のセットは複数の大きい値のルマサンプルを含むことができる。前記近傍のルマサンプルおよび対応するクロマサンプルは、前記近傍にルマ-クロマサンプルのペアを共に形成し得る。ルマサンプルの第1のセットは複数の小さい値のルマサンプルを含み得るので、小さいルマ値を有するルマ-クロマサンプルの対応する複数のペアが利用可能であり得、これらのペアは、ルマ-クロマサンプルの第1のペアとも呼ばれ得る。同様に、ルマサンプルの第2のセットは複数の高い値のルマサンプルを含み得るので、高いルマ値を有するルマ-クロマサンプルの対応する複数のペアが利用可能であり得、これらのペアは、ルマ-クロマサンプルの第2のペアとも呼ばれ得る。言い換えると、ルマ-クロマサンプルの複数の第1のペアおよびルマ-クロマサンプルの複数の第2のペアが利用可能であり得、ルマ-クロマサンプルの第1のペアは、ルマ-クロマサンプルの第2のペアに含まれるルマサンプルよりも小さいルマ値を有するルマサンプルを含む。要約すると、ルマ-クロマサンプルの第1のペアは、現在のブロックの前記近傍のルマサンプルの第1のセットおよび第1の対応する(たとえば共位置にある)クロマサンプルに基づいて決定されてもよく、ルマ-クロマサンプルの第2のペアは、現在のブロックの前記近傍のルマサンプルの第2のセットおよび第2の対応する(たとえば共位置にある)クロマサンプルに基づいて決定されてもよい。本発明の原理によれば、デコーダは、直線適合アルゴリズムに従って、ルマ-クロマサンプルの第1のペアを通る(たとえば少なくとも2つの第1のペアを通る)、およびルマ-クロマサンプルの第2のペア(たとえば少なくとも2つの第2のペア)を通る一次関数を有する直線を適合させるように構成されている。直線自体は、必ずしもルマ-クロマサンプルの複数の第1および第2のペアに接触する必要はない。より一般的な用語で言えば、これはむしろ点群を通る線を適合させると理解されてもよく、ルマ-クロマサンプルの第1および第2のペアは、前記点群内の点を表す。したがって、ルマ-クロマサンプルの複数のペアを通る直線を適合させることは、前記直線の一次関数を計算することと同義に理解することができ、前記計算は、ルマ-クロマサンプルの前記第1のペアおよび第2のペアに基づいている。デコーダは、現在のブロックの現在のルマサンプルに対する現在のブロック内の現在のクロマサンプルの予測のために、現在のブロックの近傍に集められたこの一次関数を使用するように構成されている。本発明の概念は、一次関数を計算するために、ルマ-クロマサンプルの第1のペアのうちの2つ以上のペア、およびルマ-クロマサンプルの第2のペアのうちの2つ以上のペアを使用するので、本発明の原理にしたがって適合する直線は、統計的外れ値に対して低下した感受性を有する。
【0009】
第2の実施形態は、ピクチャのピクチャデータのデータストリームへのブロックベース符号化のためのエンコーダに関し、エンコーダは、現在のブロックの近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定することによってピクチャの現在のブロックを符号化するように構成されており、ルマサンプルの第1のセットは、ルマサンプルの第2のセットよりも小さいルマ値を有する。エンコーダは、ルマ-クロマサンプルの第1のペアおよびルマ-クロマサンプルの第2のペアを通る一次関数を有する直線に適合するようにさらに構成されてもよく、ルマ-クロマサンプルの第1のペアは、現在のブロックの前記近傍のルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、ルマ-クロマサンプルの第2のペアは、現在のブロックの前記近傍のルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される。エンコーダは、現在のブロックのルマサンプルおよび前記一次関数を使用して現在のブロックのクロマサンプルを予測するように、さらに構成され得る。繰り返しを回避するために、本発明のエンコーダの利点に関する上記のデコーダの説明を参照されたい。
【0010】
第3の実施形態は、ピクチャのピクチャデータのブロックベース復号のための方法に関し、ピクチャの現在のブロックを復号するステップは、現在のブロックの近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定するステップを含み、ルマサンプルの第1のセットは、ルマサンプルの第2のセットよりも小さいルマ値を有する。方法は、ルマ-クロマサンプルの第1のペアおよびルマ-クロマサンプルの第2のペアを通る一次関数を有する直線を適合させるさらなるステップを含み、ルマ-クロマサンプルの第1のペアは、現在のブロックの前記近傍のルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、ルマ-クロマサンプルの第2のペアは、現在のブロックの前記近傍のルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される。方法は、現在のブロックのルマサンプルおよび前記一次関数を使用して現在のブロックのクロマサンプルを予測するステップをさらに含む。繰り返しを回避するために、本発明の復号方法の利点に関する上記のデコーダの説明を参照されたい。
【0011】
第4の実施形態は、ピクチャのピクチャデータのブロックベース符号化のための方法に関し、ピクチャの現在のブロックを符号化するステップは、現在のブロックの近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定するステップを含み、ルマサンプルの第1のセットは、ルマサンプルの第2のセットよりも小さいルマ値を有する。方法は、ルマ-クロマサンプルの第1のペアおよびルマ-クロマサンプルの第2のペアを通る一次関数を有する直線を適合させるさらなるステップを含み、ルマ-クロマサンプルの第1のペアは、現在のブロックの前記近傍のルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、ルマ-クロマサンプルの第2のペアは、現在のブロックの前記近傍のルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される。方法は、現在のブロックのルマサンプルおよび前記一次関数を使用して現在のブロックのクロマサンプルを予測するさらなるステップを含む。繰り返しを回避するために、本発明の符号化方法の利点に関する上記のデコーダの説明を参照されたい。
【0012】
第5の実施形態によれば、コンピュータプログラムが提供され、コンピュータプログラムの各々は、上記の方法がコンピュータプログラムのうちの1つによって実装されるように、コンピュータまたは信号プロセッサ上で実行されると、上記の方法のうちの1つを実装するように構成されている。
【0013】
以下では、下記の図面を参照して、本発明の実施形態がより詳細に記載される。
【図面の簡単な説明】
【0014】
【
図1】本出願の実施形態によるイントラ予測概念が実装され得るエンコーダの一例としての、ピクチャを予測的に符号化するための装置の概略ブロック図を示す。
【
図2】本出願の実施形態によるイントラ予測概念が実装され得るデコーダの一例としての、
図1の装置に適合する、ピクチャを予測的に復号するための装置の概略ブロック図を示す。
【
図3】符号化モード選択、変換選択、および変換性能のための細分化を設定する可能性をそれぞれ示すように、予測残差信号、予測信号、および再構築信号の間の関係の一例を示す概略図を示す。
【
図4】実施形態による、適合する直線のためにエンコーダおよび/またはデコーダによって潜在的に使用され得るルマ-クロマサンプルの複数の第1および第2のペアの一例を示す。
【
図5】一実施形態による、適合する直線のために、ルマ-クロマサンプルの2つのみの第1のペアおよびルマ-クロマサンプルの2つのみの第2のペアを使用する一例を示す。
【
図6】一実施形態によるブロックベース復号のための方法の概略ブロック図を示す。
【
図7】一実施形態によるブロックベース符号化のための方法の概略ブロック図を示す。
【
図8】[2]から取られ、従来技術によるルマ-クロマサンプルの1つのみの第1のペアおよびルマ-クロマサンプルの1つのみの第2のペアを使用する簡略化された成分間線形モデル(CCLM)予測方法を示す。
【発明を実施するための形態】
【0015】
同一または同等の機能を有する同一または同等の1つまたは複数の要素は、以下の説明において、同一または同等の参照番号で示される。
【0016】
ブロック図によって示され、前記ブロック図を参照して記載される方法ステップはまた、図示および/または記載される順序とは異なる順序で実行されてもよい。さらに、デバイスの特定の特長に関する方法ステップは、前記デバイスの前記特徴と置き換え可能であり、その逆も同様である。
【0017】
以下の図面の説明は、本発明の実施形態が組み込まれ得る符号化フレームワークの例を形成するために、ビデオのピクチャを符号化するためのブロックベースの予測コーデックのエンコーダおよびデコーダの説明の提示から始まる。それぞれのエンコーダおよびデコーダは、
図1から
図3を参照して説明される。以下では、本発明の概念の実施形態の説明は、それぞれこのような概念がどのようにして
図1および
図2のエンコーダおよびデコーダに組み込まれ得るかの説明と共に提示されるが、後続の
図4以下で説明される実施形態は、
図1および
図2のエンコーダおよびデコーダの基礎となる符号化フレームワークによって動作しないエンコーダおよびデコーダを形成するためにも使用され得る。
【0018】
図1は、変換ベースの残差符号化を例示的に使用して、ピクチャ12をデータストリーム14に予測的に符号化するための装置を示す。装置、またはエンコーダは、参照符号10を使用して示される。
図2は、対応するデコーダ20、すなわち、やはり変換ベースの残差復号を使用して、データストリーム14からピクチャ12’を予測的に復号するための装置20を示し、アポストロフィは、デコーダ20によって再構築されたピクチャ12’が、予測残差信号の量子化によって導入される符号化損失に関して装置10によって元々符号化されたピクチャ12から逸脱していることを示すために使用されている。
図1および
図2は、変換ベースの予測残差符号化を例示的に使用するが、本出願の実施形態は、この種の予測残差符号化に限定されない。これは、後に概説されるように、
図1および
図2に関して説明される他の詳細にも該当する。
【0019】
エンコーダ10は、予測残差信号に空間スペクトル変換を受けさせ、こうして得られた予測残差信号をデータストリーム14に符号化するように、構成されている。同様に、デコーダ20は、データストリーム14から予測残差信号を復号し、こうして得られた予測残差信号にスペクトル空間変換を受けさせるように、構成されている。
【0020】
内部的には、エンコーダ10は、元の信号、すなわちピクチャ12からの予測信号26の逸脱を測定するように、予測残差24を生成する予測残差信号形成器22を含み得る。予測残差信号形成器22は、たとえば、元の信号、すなわちピクチャ12から予測信号を減算する減算器であってもよい。次いでエンコーダ10は、やはりエンコーダ10に含まれる、量子化器32による量子化を後に受けるスペクトル領域予測残差信号24’を取得するために、予測残差信号24に空間スペクトル変換を受けさせる変換器28をさらに含む。こうして量子化された予測残差信号24’’は、ビットストリーム14に符号化される。この目的のために、エンコーダ10は、データストリーム14に変換および量子化された予測残差信号をエントロピー符号化するエントロピーコーダ34を、任意選択的に含んでもよい。予測信号26は、データストリーム14に符号化され、そこから復号可能な予測残差信号24’’に基づいて、エンコーダ10の予測段36によって生成される。この目的のために、予測段36は、
図1に示されるように、量子化損失を除いて信号24’に対応するスペクトル領域予測残差信号24’’’を取得するように予測残差信号24’’を逆量子化する逆量子化器38と、続いて量子化損失を除いて元の予測残差信号24に対応する予測残差信号24’’’’を取得するために逆変換、すなわちスペクトル空間変換を後者の予測残差信号24’’’に受けさせる逆変換器40とを、内部に含み得る。次いで予測段36の結合器42は、再構築信号46、すなわち元の信号12の再構築を取得するように、予測信号26および予測残差信号24’’’’を、加算などによって再結合する。再構築信号46は、信号12’に対応し得る。次いで予測段36の予測モジュール44は、たとえば空間予測、すなわちイントラピクチャ予測、および/または時間予測、すなわちインターピクチャ予測を指標して、信号46に基づいて予測信号26を生成する。
【0021】
同様に、
図2に示されるように、デコーダ20は、予測段36に対応し、これに対応するように相互接続された構成要素で、内部的に構成され得る。具体的には、デコーダ20のエントロピーデコーダ50は、データストリームから量子化されたスペクトル領域予測残差信号24’’をエントロピー復号してもよく、その際に、予測段36のモジュールに対して上記の方法で相互接続されて協働する逆量子化器52、逆変換器54、結合器56、および予測モジュール58は、
図2に示されるように、結合器56の出力が再構築信号、すなわちピクチャ12’をもたらすように、予測残差信号24’’に基づいて再構築信号を回復する。
【0022】
上記では具体的に記載されないが、エンコーダ10が、たとえば、何らかのレートおよび歪み関連基準、すなわち符号化コストを最適化するような方法で、何らかの最適化スキームにしたがって、たとえば予測モード、動きパラメータなどを含むいくつかの符号化パラメータを設定し得ることは、容易に明らかである。たとえば、エンコーダ10およびデコーダ20ならびに対応するモジュール44、58はそれぞれ、イントラ符号化モードおよびインター符号化モードなどの異なる予測モードをサポートし得る。エンコーダおよびデコーダがこれらの予測モードタイプの間で切り換える粒度は、それぞれ符号化セグメントまたは符号化ブロックへのピクチャ12および12’の細分化に対応し得る。これらの符号化セグメントの単位で、たとえば、ピクチャは、イントラ符号化されているブロックおよびインター符号化されているブロックに細分化され得る。イントラ符号化されたブロックは、以下により詳細に概説されるように、それぞれのブロックの空間的に既に符号化/復号された近傍に基づいて予測される。指向性または角度イントラ符号化モードを含むいくつかのイントラ符号化モードが存在してもよく、これらはそれぞれのイントラ符号化されたセグメントに対して選択されてもよく、これらのモードにしたがって、それぞれのセグメントは、それぞれの指向性イントラ符号化モードに固有の特定の方向に沿って近傍のサンプル値をそれぞれのイントラ符号化されたセグメントに外挿することによって満たされる。イントラ符号化モードは、たとえば、それにしたがってそれぞれのイントラ符号化されたブロックの予測はそれぞれのイントラ符号化されたセグメント内の全てのサンプルにDC値を割り当てるDC符号化モード、および/またはそれにしたがってそれぞれのブロックの予測が、隣接サンプルに基づいて二次元一次関数によって画定された平面の駆動傾斜およびオフセットを有するそれぞれのイントラ符号化されたブロックのサンプル位置にわたって二次元一次関数によって記述されるサンプル値の空間的分布に近似する、または空間的分布になるように決定される、平面イントラ符号化モードなどの、1つ以上のさらなるモードを備えてもよい。これと比較して、インター符号化されたブロックは、たとえば、時間的に予測され得る。インター符号化されたブロックでは、動きベクトルはデータストリーム内でシグナリングされてもよく、動きベクトルは、ピクチャ12が属するビデオの以前に符号化されたピクチャの部分の空間変位を示し、そこで以前に符号化/復号されたピクチャは、それぞれのインター符号化されたブロックの予測信号を取得するためにサンプリングされる。これは、量子化されたスペクトル領域予測残差信号24’’を表すエントロピー符号化された変換係数レベルなどのデータストリーム14に含まれる残差信号符号化に加えて、データストリーム14が、符号化モードを様々なブロックに割り当てるための符号化モードパラメータ、インター符号化されたセグメントのための動きパラメータなどのブロックのいくつかのための予測パラメータ、およびピクチャ12および12’のセグメントへのそれぞれの細分化を制御およびシグナリングするためのパラメータなどの任意選択的なさらなるパラメータを符号化したものであり得ることを意味する。デコーダ20は、エンコーダが行ったのと同じ方法でピクチャを細分化し、同じ予測モードをセグメントに割り当て、同じ予測信号をもたらすために同じ予測を実行するために、これらのパラメータを使用する。
【0023】
図3は、一方では再構築信号、すなわち再構築されたピクチャ12’間の関係、および他方では、データストリーム14でシグナリングされた予測残差信号24’’’’と予測信号26との組合せを示す。既に上述されたように、組合せは加算であってもよい。予測信号26は、ハッチングを使用して例示的に示されているイントラ符号化されたブロック、およびハッチングされずに例示的に示されているインター符号化されたブロックへの、ピクチャ領域の細分化として
図3に示されている。細分化は、正方形ブロックまたは非正方形ブロックの行および列へのピクチャ領域の規則的な細分化、または四分木細分化などのようなツリールートブロックから様々なサイズの複数のリーフブロックへのピクチャ12のマルチツリー細分化など、いずれの細分化であってもよく、その混合は
図3に示されており、ピクチャ領域が最初にツリールートブロックの行および列に細分化され、次いで再帰的マルチツリー細分化にしたがって1つ以上のリーフブロックにさらに細分化される。
【0024】
ここでも、データストリーム14は、イントラ符号化されたブロック80のために符号化されたイントラ符号化モードを有してもよく、これはいくつかのサポートされたイントラ符号化モードのうちの1つをそれぞれのイントラ符号化されたブロック80に割り当てる。インター符号化されたブロック82のために、データストリーム14は、符号化された1つ以上の動きパラメータを有してもよい。一般的に言えば、インター符号化されたブロック82は、時間的に符号化されることに限定されない。あるいは、インター符号化されたブロック82は、現在のピクチャ12自体を超えて以前符号化された部分から予測されるいずれのブロックでもよく、たとえば、ピクチャ12が属するビデオの以前符号化されたピクチャ、もしくはエンコーダおよびデコーダがそれぞれスケーラブルなエンコーダおよびデコーダである場合、別のビューまたは階層的に下位のレイヤのピクチャなどである。
【0025】
図3の予測残差信号24’’’’もまた、ブロック84へのピクチャ領域の細分化として示されている。これらのブロックは、符号化ブロック80および82と区別するために、変換ブロックと呼ばれる場合がある。実際には、
図3は、エンコーダ10およびデコーダ20が、それぞれのブロックへのピクチャ12およびピクチャ12’の2つの異なる細分化、すなわち一方では符号化ブロック80および82にそれぞれ細分化することと、他方では変換ブロック84への細分化を使用し得ることが、示されている。両方の細分化は同じであってもよく、すなわち各符号化ブロック80および82は同時に変換ブロック84を形成してもよいが、
図3は、たとえば、ブロック80および82の2つのブロック間のいずれの境界も2つのブロック84の間の境界と重ならないように、変換ブロック84への細分化が符号化ブロック80、82への細分化の拡張を形成する場合を示しており、言い換えると、各ブロック80、82は、変換ブロック84のうちの1つと一致するか、または変換ブロック84のクラスタと一致する。しかしながら、細分化はまた、変換ブロック84があるいはブロック80、82の間のブロック境界を超えられるように、互いに独立して決定または選択されてもよい。したがって、変換ブロック84への細分化に関する限り、ブロック80、82への細分化に関して提示されたものと類似の記述が真であり、すなわちブロック84は、(行および列への配置の有無にかかわらず)ブロックへのピクチャ領域の規則的な細分化の結果、ピクチャ領域への再帰的マルチツリー細分化の結果、またはこれらの組合せ、もしくはその他いずれかの種類のブロック化であり得る。単なる余談として、ブロック80、82、および84は、二次的形状、長方形、またはその他いずれかの形状であるように限定されないことに留意されたい。
【0026】
図3は、予測信号26と予測残差信号24’’’’との組合せが再構築信号12’を直接もたらすことを、さらに示している。しかしながら、代替実施形態によれば、ピクチャ12’をもたらすために2つ以上の予測信号26が予測残差信号24’’’’と組み合わせられてもよいことに留意すべきである。
【0027】
図3では、変換ブロック84は、以下の重要性を有するものとする。変換器28および逆変換器54は、これらの変換ブロック84を単位としてその変換を実行する。たとえば、多くのコーデックは、全ての変換ブロック84に対して何らかの種類のDSTまたはDCTを使用する。いくつかのコーデックは、変換ブロック84のいくつかについて、予測残差信号が空間領域内で直接符号化されるように、変換をスキップできるようにする。しかしながら、後述される実施形態によれば、エンコーダ10およびデコーダ20は、いくつかの変換をサポートするように構成されている。たとえば、エンコーダ10およびデコーダ20によってサポートされる変換は、以下を含むことができる。
○ DCT-II(またはDCT-III)、ここでDCTは離散コサイン変換を表す
○ DST-IV、ここでDSTは離散サイン変換を表す
○ DCT-IV
○ DST-VII
○ 恒等変換(IT)
当然ながら、変換器28はこれらの変換の順変換バージョンの全てをサポートするが、デコーダ20または逆変換器54は、これらの対応する後方または逆バージョンをサポートする。
○ 逆DCT-II(または逆DCT-III)
○ 逆DST-IV
○ 逆DCT-IV
○ 逆DST-VII
○ 恒等変換(IT)
【0028】
以下の説明は、どの変換がエンコーダ10およびデコーダ20によってサポートされ得るかについてさらなる詳細を提供する。いずれの場合も、サポートされる変換のセットは、1つのスペクトル空間変換または空間スペクトル変換など、1つのみの変換を含み得ることに留意すべきである。
【0029】
上記で既に概説されたように、
図1から
図3は、さらに後述される本発明の概念が、本出願によるエンコーダおよびデコーダの具体例を形成するために実装され得る例として、提示されている。その限りにおいて、
図1および
図2のエンコーダおよびデコーダはそれぞれ、本明細書で後述されるエンコーダおよびデコーダの可能な実装を表すことができる。しかしながら、
図1および
図2は単なる例である。しかしながら、本出願の実施形態によるエンコーダは、以下でより詳細に概説される概念を使用して、たとえば、ビデオエンコーダではなく静止ピクチャエンコーダである点、またはブロック80への細分化が
図3に例示されるものとは異なる方法で実行される点などで、
図1のエンコーダとは異なる、ピクチャ12のブロックベース符号化を実行し得る。同様に、本出願の実施形態によるデコーダは、以下でさらに概説される符号化概念を使用してデータストリーム14からのピクチャ12’のブロックベース復号を実行し得るが、たとえば、ビデオデコーダではなく静止ピクチャでコーダである点、イントラ予測をサポートしない点、または
図3に関して説明されたものとは異なる方法でピクチャ12’をブロックに細分する点、および/または、たとえば変換領域ではなく空間領域内のデータストリーム14から予測残差を導出する点で、
図2のデコーダ20とは異なってもよい。
【0030】
以下では、ブロックベース符号化のためのエンコーダ10およびブロックベース復号のためのデコーダ20の実施形態が、本明細書に記載される本発明の原理をどのように利用するかを例示的に説明するために、いくつかの例および実施形態が論じられる。具体的には、現在のブロックにおいて、本発明の原理を使用して、すなわち隣接ブロックのルマ-クロマサンプルによって取得可能な一次関数を使用して、既に符号化された(1つまたは複数の)ルマサンプル値からクロマサンプル値を予測する方法が記載される。デコーダ20の例が以下に記載され得るが、これはエンコーダ10の対応する例にも有効である。
【0031】
図4は、現在のブロックの近傍に集められたルマ-クロマサンプルのペアの累積の散布図を示す。前記近傍は、現在のブロックの直接的な付近にある隣接ブロック、または現在のブロックのより遠い付近にある、すなわち1つ以上のブロックを間に挟んだ隣接ブロックであってもよい。
【0032】
最初に、エンコーダ10および/またはデコーダ20がルマ-クロマサンプルの上述のペアを取得し得る方法について説明する。このために、エンコーダ10および/またはデコーダ20は、現在のブロックの前記近傍のルマサンプルの第1のセットを決定し、前記近傍のルマサンプルの第2のセットを決定するように、構成され得る。前記第1のセットは、異なるルマ値を有する複数の、たとえば少なくとも2つのルマサンプルを含み得る。前記第2のセットもまた、異なるルマ値を有する複数の、たとえば少なくとも2つのルマサンプルを含み得る。しかしながら、第1のセットに含まれるルマサンプルは、それぞれのルマ値によって第2のセットに含まれるルマサンプルとは区別され得る。具体的には、第1のセットに含まれるルマサンプルは、第2のセットに含まれるルマサンプルよりも小さいルマ値を有することができる。
【0033】
1つ以上のクロマサンプルは、それぞれ第1のセットまたは第2のセットのルマサンプルとリンクされてもよい。したがって、ルマ-クロマサンプルのそれぞれの数のペアは、ルマサンプルを対応するクロマサンプルとリンクさせることにより、エンコーダ10および/またはデコーダ20によって取得可能であり得る。次いで、これらのルマ-クロマサンプルのペアは、それぞれのルマ値に基づいて分類され得る。
【0034】
たとえば、ルマサンプルの第1のセットのルマサンプル(すなわち、より小さいルマ値を有するもの)を含むルマ-クロマサンプルのペアは、ルマ-クロマサンプルの第1のペアとして分類され得る。同様に、ルマサンプルの第2のセットのルマサンプル(すなわち、より大きいルマ値を有するもの)を含むルマ-クロマサンプルのペアは、ルマ-クロマサンプルの第2のペアとして分類され得る。
【0035】
図4は、略楕円41によって象徴的に囲まれたルマ-クロマサンプルの複数の第1のペア、ならびに略楕円42によって象徴的に囲まれたルマ-クロマサンプルの複数の第2のペアを示す。この非限定的な例では、ルマ-クロマサンプルの3つの第1のペアA、A’、A’’およびルマ-クロマサンプルの3つの第2のペアB、B’、B’’が、後の線適合ステップのためにエンコーダ10および/またはデコーダ20によって決定され得る。
【0036】
ここでも、ルマ-クロマサンプルの第1のペアA、A’、A’’のルマ値は、ルマ-クロマサンプルの第2のペアB、B’、B’’のルマ値よりも小さい。これは、x軸がルマ-クロマサンプルのペアのそれぞれのルマ値を表し、y軸がルマ-クロマサンプルのそれぞれのペアの対応するクロマ値を表すので、図示される散布図に見ることができる。したがって、ルマ-クロマサンプルの各ペアA、A’、A’’、B、B’、B’’は、ルマサンプル値および対応するクロマサンプル値を含む。
【0037】
エンコーダ10および/またはデコーダ20は、
図4に示される散布図を通る直線43に適合するように、さらに構成され得る。基本的に、前記図示された散布図は、点群と比較可能であり、ルマ-クロマサンプルの第1および第2のペアA、A’、A’’、B、B’、B’’の各々が前記点群内の点に対応し得る。
【0038】
エンコーダ10および/またはデコーダ20は、ルマ-クロマサンプルの例示的に選択された3つの第1のペアA、A’、A’’を通り、ルマ-クロマサンプルの例示的に選択された3つの第2のペアB、B’、B’’を通る、前記直線43に適合し得る。たとえば、エンコーダ10および/またはデコーダ20は、前記点群を通る直線43に適合するための直線適合アルゴリズムの計算根拠として、ルマ-クロマサンプルの3つの第1のペアA、A’、A’’およびルマ-クロマサンプルの3つの第2のペアB、B’、B’’を使用し得る。
【0039】
図からわかるように、直線43は、必ずしもルマ-クロマサンプルの第1および/または第2のペアA、A’、A’’、B、B’、B’’のうちの1つ以上と接触する必要も、これらを通って延在する必要もない。代わりに、ルマ-クロマサンプルの第1および/または第2のペアA、A’、A’’、B、B’、B’’を通る直線43に適合することは、むしろ、適合アルゴリズム自体が、図示されるような直線43の一次関数をもたらすルマ-クロマサンプルの選択された数の第1および/または第2のペアA、A’、A’’、B、B’、B’’に基づくという意味で理解されるべきである。
【0040】
図4に示される直線43は、論じられた直線適合アルゴリズムを可視化するための、かなり概略的な構造として理解されるべきである。前記直線適合から導出され得る1つの重要な情報は、直線43の一次関数である。一次関数は、以下の指揮によって与えられてもよい。
y=α・x+β
ここで、αは前記直線43の勾配を表す第1の成分間線形モデルパラメータであり、βは前記直線43のオフセットを表す第2の成分間線形モデルパラメータである。
【0041】
本発明によれば、エンコーダ10および/またはデコーダ20は、上記で説明されたように、前記現在のブロックの近傍から決定された一次関数によって、現在のブロックの現在のルマサンプルxのために現在のブロックの対応するクロマサンプルyを予測するように構成されている。
【0042】
一実施形態によれば、デコーダ20は、イントラ予測、および/またはインター予測によって、現在のブロックのルマサンプルを再構築するように構成され得る。またさらなる実施形態によれば、デコーダ20は、データストリーム14から現在のブロックのルマサンプル残差を復号し、予測されたルマサンプルを取得するためにイントラ予測および/またはインター予測によって現在のブロックのルマサンプルを再構築するように構成されてもよく、ルマサンプル残差を使用して前記予測されたルマサンプルを補正する。
【0043】
したがって、一実施形態は、現在のブロックのルマサンプルが予測されたルマサンプルを取得するためにイントラ予測および/またはインター予測によって再構築可能となるように、現在のブロックのルマサンプル残差をデータストリーム14に符号化するように構成されたそれぞれのエンコーダ10を提供し、前記予測されたルマサンプルは、ルマサンプル残差を使用して補正可能である。
【0044】
上記の例では、ルマ-クロマサンプルの3つの第1のペアA、A’、A’’およびルマ-クロマサンプルの3つの第2のペアB、B’、B’’が、ルマ-クロマサンプルの少なくともこれら3つの第1および第2のペアA、A’、A’’、B、B’、B’’を通る直線43を適合させるための適合アルゴリズムの根拠として例示的に使用された。しかしながら、本発明の原理では、ルマ-クロマサンプルの例示的に記載された3つの第1および第2のペアA、A’、A’’、B、B’、B’’よりも多くが使用されてもよい。追加的または代替的に、本発明の原理では、ルマ-クロマサンプルの2つのみの第1および第2のペアA、A’、B、B’が使用されてもよい。しかしながら、ルマ-クロマサンプルの少なくとも2つの第1のペアA、A’およびルマ-クロマサンプルの少なくとも2つの第2のペアB、B’は、本発明の原理にしたがって使用されるべきである。
【0045】
これは、ルマ-クロマサンプルの1つのみの第1のペアAおよびルマ-クロマサンプルの1つのみの第2のペアBが使用されるJVET-L0191に対する、重要な差別化の特徴である。
【0046】
たとえば、エンコーダ10および/またはデコーダ20は、最小ルマ値を有するこれら2つ以上の第1のルマ-クロマサンプルA、A’、A’’を選択するように構成されてもよい。したがって、エンコーダ10および/またはデコーダ20は、現在のブロックの近傍でn>1個の最小ルマ値を見つけることによって、ルマサンプルの第1のセットを決定するように構成され得る。対応するクロマ値と共に、最小ルマ値を有するルマ-クロマサンプルのこれらn>1個の第1のペアA、A’、A’’が、エンコーダ10および/またはデコーダ20によってルマ-クロマサンプルの複数41の第1のペアから選択され得る。
【0047】
追加的または代替的に、エンコーダ10および/またはデコーダ20は、最大ルマ値を有するこれら2つ以上の第2のルマ-クロマサンプルB、B’、B’’を選択するように構成されてもよい。したがって、エンコーダ10および/またはデコーダ20は、現在のブロックの近傍でn>1個の最大ルマ値を見つけることによって、ルマサンプルの第2のセットを決定するように構成され得る。対応するクロマ値と共に、最小ルマ値を有するルマ-クロマサンプルのこれらn>1個の第2のペアB、B’、B’’が、エンコーダ10および/またはデコーダ20によってルマ-クロマサンプルの複数42の第2のペアから選択され得る。
【0048】
上述のように、最小ルマ値を有するルマ-クロマサンプルの少なくとも2つ、およびいくつかの例示的な実施形態によればちょうど2つの第1のペアA、A’が、ルマ-クロマサンプルの複数41の第1のペアから選択され得る。さらに、最大ルマ値を有するルマ-クロマサンプルの少なくとも2つ、およびいくつかの例示的な実施形態によればちょうど2つの第2のペアB、B’が、ルマ-クロマサンプルの複数42の第2のペアから選択され得る。
【0049】
このような実施形態によれば、エンコーダ10および/またはデコーダ20は、現在のブロックの前記近傍でn=2個の最小ルマ値を見つけることによってルマサンプルの第1のセットを決定し、および/または現在のブロックの前記近傍でn=2個の最大ルマ値を見つけることによってルマサンプルの第2のセットを決定するように、構成され得る。対応するクロマ値をリンクさせることにより、エンコーダ10および/またはデコーダ20は、最小ルマ値を有するルマ-クロマサンプルのn=2個の第1のペアA、A’、ならびに最大ルマ値を有するルマ-クロマサンプルのn=2個の第2のペアB、B’を取得することができる。
【0050】
ここで、
図4を参照して先に論じられたものと類似の点群を示す
図5を参照して、対応する例について論じる。したがって、
図4との相違点が記載される。
【0051】
図5に示される例では、最小ルマ値を有するルマ-クロマサンプルのこれら2つの第1のペアA、A’および最大ルマ値を有するルマ-クロマサンプルのこれら2つの第2のペアB、B’は、ルマ-クロマサンプルの前記第1および第2のペアA、A’、B、B’を通る直線43を適合させるために、エンコーダ10および/またはデコーダ20によって選択される。
【0052】
図からわかるように、第1の仮直線51は、最小ルマ値を有するルマ-クロマサンプルの第1のペアAおよび最大ルマ値を有するルマ-クロマサンプルの第2のペアBを使用して適合され得る。第2の仮直線52は、2番目に小さいルマ値を有するルマ-クロマサンプルの第1のペアA’および2番目に大きいルマ値を有するルマ-クロマサンプルの第2のペアB’を使用して適合され得る。
【0053】
最小および2番目に小さいルマ値を有するルマ-クロマサンプルの2つの第1のペアA、A’の平均53、ならびに最大および2番目に大きいルマ値を有するルマ-クロマサンプルの2つの第2のペアB、B’の平均54は、ルマ-クロマサンプルの第1および第2のペアA、A’、B、B’を通る直線43を適合させるため、すなわち一次関数y=α・x+βを導出するために、決定され得る。
【0054】
したがって、一実施形態によれば、エンコーダ10および/またはデコーダ20は、前記直線43が、前記直線43の一次関数を導出するために、ルマ-クロマサンプルの第1のペアA、A’の平均53およびルマ-クロマサンプルの第2のペアB、B’の平均54を通って延在するように、直線43を適合させるように構成され得る。
【0055】
言い換えると、(JVET-L0191で行われるように)最小ルマ値Aおよび最大ルマ値Bのみならず、
図5に示されるように、2番目に小さいルマ値A’および2番目に大きいルマ値B’も探索することが提案される。すると、直線43は、AおよびA’でのデータ点の平均53とBおよびB’でのデータ点の平均54との間で適合され、一般に従来技術と比較して優れたデータ適合につながる
図5の直線をもたらすことができる。複雑さが異なる平均化の2つの変形A、A’およびB、B’を指定することができる。
1.正確な整数平均化:(A+A’+1)>>1,(B+B’+1)>>1、ここで「>>」はビットごとの右シフトであり、
2.不正確な整数平均化:(A+A’)>>1,(B+B’)>>1、正確な変形に対して4つの「+1」を省略。
両方の変形は、算術平均の固定小数点整数実現を表し、幾何平均などの他の形態の平均化も可能であるが、ここでは検討しない。
【0056】
図5に明確に見られるように、直線43は、上方の第1の仮直線51のみによって表される、先の提案の場合よりも、点群内に、すなわちルマ-クロマサンプルの複数の第1および第2のペアに、はるかによく適合される。エンコーダ10および/またはデコーダ20は、ルマサンプル残差を符号化/復号し得るが、先の提案にしたがって上方の第1の仮直線51から予測された予測残差55は、本発明の概念にしたがって適合された直線43から予測された予測残差56よりも著しく大きくなり得ることがわかる。したがって、本明細書に記載される発明概念は、先の概念のCCLMの不正確さを著しく打ち消すことができる。
【0057】
表1は、以前に採用されたCCLMバージョンと比較して、本明細書に記載される修正されたCCLM計算によって消費されたアルゴリズム演算を要約したものである。2つ以上の極端なルマ値A’、B’の探索のため、比較の数が倍増することがわかる。なお、提案された2つの変形のいずれかによって必要とされる演算の数は、VTM2[1]で採用された初期CCLMのものよりもはるかに少ないことに留意されたい。
【0058】
提案された変更によるコーデック実行時間の増加を伴わない著しい符号化効率の増加の存在を検証するために、シーケンス[5][6]のSDRカテゴリ共通試験条件(Common Test Conditions:CTC)セットに対するBjontegaard delta(BD)PSNR利得を測定した。デフォルト構成のVTMソフトウェアバージョン3が使用される[4]。
【表1】
【0059】
表2は、上述の平均化の変形1(正確な整数平均化)のBD-PSNR結果を列挙し、表3は、平均化の変形2(不正確な整数平均化)のBD-PSNR値を含む。なお、以下に留意されたい。
・ 両方の変形は、非常によく似た全体的なBD-PSNR性能をもたらし、
・ 両方のクロマチャネルで一貫したBD-PSNR利得に到達し、
・ いずれの変形でも著しい実行時間の増加は観察されない。
これは、本明細書に記載される両方の提案が、必要に応じて、CCLM予測ツールのアルゴリズムの複雑さに対してわずかな影響で、彩度符号化効率をおよそ0.4%増加させることに成功したことを示している。
【表2】
【0060】
【0061】
要約すると、L0191に記載される簡略化された成分間線形モデル(CCLM)予測器に対する修正の2つの変形が、本明細書に記載されている。提案された低複雑性の変更は、CCLMにおける直線適合アルゴリズムを安定化し、こうしてクロマチャネル内で0.3~0.4%のBD-PSNR利得を生み出す。同時に、CCLM計算のアルゴリズムの複雑さは、VTM2[1]で以前採用されたCCLM設計のもののたった半分(または大きいCUではさらに少ない)のままである。
【0062】
具体的には、JVET-L0191は、多用途ビデオ符号化(VVC)規格における成分間線形モデル(CCLM)予測器のための簡略化されたパラメータ計算を記載している。この簡略化によれば、CCLMパラメータαおよびβは、以前使用された複数のルマおよびクロマサンプルからのより複雑な線形回帰とは対照的に、サンプル値の最大および最小ルマ-クロマペアの間の直線適合によって、導出することができる。結果として、CCLMツールのアルゴリズムの複雑さは、符号化効率をあまり失わずに低減される。
【0063】
本発明は、2つの極端なサンプル値の間の簡略化された線適合が統計的外れ値の影響をかなり受けやすいという証拠を提供し、たとえば以下のように、CCLM法に対するいくつかの修正を提案する。
1.正確な平均化を用いて、(最大値のみと最小値のみの代わりに)最大の2つのルマサンプルB、B’の平均54と最小の2つのルマサンプルA、A’の平均53との間で直線43を適合させ、
2.いくつかの加算を省略する不正確な平均化(除算の前に1のオフセットがない)を用いて、最大の2つのルマサンプルB、B’の平均54と最小の2つのルマサンプルA、A’の平均53との間で直線43を適合させる。
【0064】
変形2は、変形1と同じBD-PSNR利得を生み出し得るが、CCLM符号化されたCUごとに4つの加算が少なくて済む。
【0065】
しかしながら、両方の修正は、VTMエンコーダおよびデコーダの複雑さに対して無視できる程度の影響を及ぼし(エンコーダ実行時間100%、デコーダ実行時間99~101%)、報告によれば、彩度チャネルの各々において約0.3~0.4%の符号化効率利得を提供する(全イントラアクセスおよびランダムアクセスの両方のCbおよびCr BD-PSNR利得)。
【0066】
図6は、ピクチャのピクチャデータのブロックベース復号の方法の一実施形態の概略ブロック図を示し、ピクチャの現在のブロックを復号するステップは、少なくとも以下のステップを含む。
【0067】
ブロック601において、現在のブロックの近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットが決定され、ルマサンプルの第1のセットは、ルマサンプルの第2のセットよりも小さいルマ値を有する。
【0068】
ブロック602において、一次関数を有する直線43は、ルマ-クロマサンプルの第1のペアA、A’およびルマ-クロマサンプルの第2のペアB、B’を通って適合され、ルマ-クロマサンプルの第1のペアA、A’は、現在のブロックの前記近傍のルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、ルマ-クロマサンプルの第2のペアB、B’は、現在のブロックの前記近傍のルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される。
【0069】
ブロック603において、現在のブロックのクロマサンプルは、上述のように、現在のブロックのルマサンプル、および現在のブロックの近傍から決定された前記一次関数を使用して予測される。
【0070】
図7は、ピクチャのピクチャデータのブロックベース符号化の方法の一実施形態の概略ブロック図を示し、ピクチャの現在のブロックを符号化するステップは、少なくとも以下のステップを含む。
【0071】
ブロック701において、現在のブロックの近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットが決定され、ルマサンプルの第1のセットは、ルマサンプルの第2のセットよりも小さいルマ値を有する。
【0072】
ブロック702において、一次関数を有する直線43は、ルマ-クロマサンプルの第1のペアA、A’およびルマ-クロマサンプルの第2のペアB、B’を通って適合され、ルマ-クロマサンプルの第1のペアA、A’は、現在のブロックの前記近傍のルマサンプルの第1のセットおよび第1の対応するクロマサンプルに基づいて決定され、ルマ-クロマサンプルの第2のペアB、B’は、現在のブロックの前記近傍のルマサンプルの第2のセットおよび第2の対応するクロマサンプルに基づいて決定される。
【0073】
ブロック703において、現在のブロックのクロマサンプルは、上述のように、現在のブロックのルマサンプル、および現在のブロックの近傍から決定された前記一次関数を使用して予測される。
【0074】
論じられたように、デコーダ20およびエンコーダ10の両方は、現在のブロック80、82、84の近傍のルマサンプルの第1のセットおよびルマサンプルの第2のセットを決定し得る。前記近傍は、前記現在のブロックに直セル隣接するルマサンプルの(1つまたは複数の)行または(1つまたは複数の)列、好ましくは(画像またはビデオ圧縮において)サンプルの上隣接業またはサンプルの左隣接列であり得る。しかしながら、ルマサンプルの前記第1のセットおよびルマサンプルの前記第2のセットを決定する際に、必ずしも全ての利用可能な隣接するルマサンプルが考慮される必要はない。言い換えると、この目的のために、全ての利用可能な隣接するルマサンプルのサブセットを形成すれば十分であり得る。具体的には、本発明は、4つの隣接ルマサンプルのみが考慮されるときも適用可能なままであり、この場合、ルマサンプルの第1のセットは、4つの考慮される値のうちn=2個のより小さいルマ値を含んでもよく、ルマサンプルの第2のセットは、結果的に、4つの考慮される値のうちn=2個のより大きいルマ値を含んでもよい。
【0075】
現在のブロックの近傍のこれら4つの隣接ルマサンプルの選択は任意であってもよいが、好ましくは、4つの隣接ルマサンプルは、現在のブロックの空間的な上および/または左の境界に沿って等距離(またはほぼ等距離)で選択されてもよい。また、ルマサンプルの第1のセットおよびルマサンプルの第2のセットの決定のための前記4つの隣接ルマサンプルの選択は、サンプルの上の隣接行および/またはサンプルの左の隣接列の存在にしたがって適応され得る。より具体的には、上の垂直に隣接するものが利用できない場合(たとえば、上部ピクチャ境界において)、4つの隣接ルマサンプルが全てルマサンプルの左の隣接列から選択されてもよく、その一方で、左の水平に隣接するものが利用できない場合(たとえば、左ピクチャ境界において)、4つの隣接ルマサンプルが全てルマサンプルの上の隣接行から選択されてもよい。しかしながら、上および左の両方の隣接するものが利用可能な場合には(デフォルトの場合のように、たとえば圧縮されるピクチャの中心で)、2つのルマサンプルが上の隣接サンプル行から選択されてもよく、もう2つのルマサンプルが左の隣接サンプル列から選択されてもよい。最後に、ピクチャがダウンサンプリングされたクロマフォーマット(たとえば、4:2:0)で記憶されている場合、隣接ルマサンプルもまた、ルマサンプルの第1および第2のセットが決定される(たとえば4つの)隣接ルマサンプルの選択の前に、前記クロマフォーマットにしたがってダウンサンプリングされてもよいことに留意すべきである。
【0076】
なお、現在のブロックの前記近傍は通常、現在のピクチャの以前復号および再構築された部分、たとえばブロック(空間的近傍)または別の以前復号および再構築されたピクチャ(時間的近傍)を表すことに留意されたい。しかしながら、エンコーダ側では、以前復号および再構築されたピクチャ領域の代わりに、元の入力ピクチャ領域もまた、現在のブロックの前記近傍のソースとして使用され得ることは、明らかである。また、本発明の方法が、任意の成分間予測、たとえばRGB色符号化の赤色成分からの緑色または青色の予測にも等しく適用可能であることは、当業者に取って容易に明らかである。
【0077】
また、ルマ-クロマサンプルの第1/第2のペアの前記セットが(少なくとも部分的に)重なってもよいことに留意すべきである。これは特に、現在のブロックの符号化再構築済みルマ近傍が、全て同じ値を有するサンプルからなる場合である。次いで、ルマ-クロマサンプルの第1および第2のペアの両方が、同一の値を保持し得る。しかしながら、「自然な」画像コンテンツに対する「通常」動作の間、これは滅多に該当しない。
【0078】
いくつかの態様が装置の文脈で説明されてきたが、これらの態様が、ブロックまたはデバイスが方法ステップまたは方法ステップの特徴に対応する、対応する方法の説明も表すことは、明らかである。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。
【0079】
方法ステップの一部または全ては、たとえばマイクロプロセッサ、プログラマブルコンピュータ、または電子回路などのハードウェア装置によって(またはこれを使用して)実行され得る。いくつかの実施形態では、最も重要な方法ステップのうちの1つ以上がこのような装置によって実行されてもよい。
【0080】
特定の実装要件に応じて、本発明の実施形態は、ハードウェア内またはソフトウェア内で、または少なくとも部分的にハードウェア内で、または少なくとも部分的にソフトウェア内で、実装することができる。実装は、電子的に読み取り可能な制御信号を記憶したデジタル記憶媒体、たとえばフロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行することができ、これらはそれぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(または協働可能である)。したがって、デジタル記憶媒体はコンピュータ可読であり得る。
【0081】
本発明によるいくつかの実施形態は、本明細書に記載される方法のうちの1つが実行されるように、プログラマブルコンピュータシステムと協働することが可能な、電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0082】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されると、方法のうちの1つを実行するように動作する。プログラムコードは、たとえば機械可読キャリア上に記憶され得る。
【0083】
他の実施形態は、機械可読キャリア上に記憶された、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0084】
したがって、言い換えると、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行されると、本明細書に記載される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0085】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムが記録された、データキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録媒体は、典型的には有形および/または非一時的である。
【0086】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、たとえば、データ通信接続を介して、たとえばインターネットを介して転送されるように構成されてもよい。
【0087】
さらなる実施形態は、本明細書に記載される方法のうちの1つを実行するように構成または適合された処理手段、たとえばコンピュータ、またはプログラマブル論理デバイスを含む。
【0088】
さらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0089】
本発明によるさらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムを受信機に(たとえば電子的または光学的に)転送するように構成された装置またはシステムを含む。受信機は、たとえば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置またはシステムは、たとえば、コンピュータプログラムを受信機に転送するためのファイルサーバを含み得る。
【0090】
いくつかの実施形態では、本明細書に記載される方法の機能の一部または全てを実行するために、プログラマブル論理デバイス(たとえばフィールドプログラマブルゲートアレイ)が使用されてもよい。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載される方法のうちの1つを実行するために、マイクロプロセッサと協働することができる。一般に、方法は、好ましくは任意のハードウェア装置によって実行される。
【0091】
本明細書に記載される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータの組合せを使用して、実装され得る。
【0092】
本明細書に記載される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータの組合せを使用して、実行され得る。
【0093】
本開示は例示的な実施形態を参照して説明されてきたが、この説明は限定的な意味で解釈されることを意図していない。例示的な実施形態の様々な修正および組合せ、ならびに本開示の他の実施形態は、説明を参照すれば当業者に取って明らかとなるだろう。したがって、添付請求項は、このようなあらゆる修正または実施形態を包含することが意図される。