(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-06
(54)【発明の名称】画像符号化モードを決定するための方法
(51)【国際特許分類】
H04N 19/103 20140101AFI20240228BHJP
H04N 19/136 20140101ALI20240228BHJP
H04N 19/182 20140101ALI20240228BHJP
【FI】
H04N19/103
H04N19/136
H04N19/182
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023550088
(86)(22)【出願日】2022-02-15
(85)【翻訳文提出日】2023-08-24
(86)【国際出願番号】 FR2022050274
(87)【国際公開番号】W WO2022175626
(87)【国際公開日】2022-08-25
(32)【優先日】2021-02-19
(33)【優先権主張国・地域又は機関】FR
(81)【指定国・地域】
(71)【出願人】
【識別番号】591034154
【氏名又は名称】オランジュ
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ピエリック・フィリップ
(72)【発明者】
【氏名】テオ・ラデュネ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159ME01
5C159TA17
5C159TB10
5C159TC02
5C159TC11
5C159UA02
5C159UA05
(57)【要約】
本発明は、少なくとも1つの現在のピクセルセットの符号化又は復号化のために、少なくとも2つの符号化又は復号化モードから、少なくとも1つの符号化(MCc)又は復号化(MDc)モードを決定するための方法に関する。そのような決定は、少なくとも1つの符号化又は復号化モードが、少なくとも1つの参照ピクセルセット(BR0)の解析(P1)から決定される(P2)ことを特徴とする。
【特許請求の範囲】
【請求項1】
少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード(MC
c)及び復号化モード(MD
c)のそれぞれを決定するための方法であって、前記少なくとも1つの符号化モード及び復号化モードのそれぞれが、既に復号化済みの参照画像に属する少なくとも1つの参照ピクセルセット(BR
0)の解析(P1)に基づいて決定される(P2)ことを特徴とする、方法。
【請求項2】
少なくとも1つの参照ピクセルセット(BR
0;BR
0、BR
1)の前記解析が、前記少なくとも1つの参照ピクセルセットの動き推定又はフィルタリングを実施する、請求項1に記載の決定方法。
【請求項3】
前記動き推定が、オプティカルフロー動き推定である、請求項2に記載の決定方法。
【請求項4】
前記少なくとも2つのモードの中からの単一のモードが、前記現在のピクセルセットの少なくとも1つのピクセルに対して決定され、1つ又は他のモードの前記決定が、前記セットの前記少なくとも1つのピクセルから少なくとも1つの他のピクセルまで様々である、請求項1に記載の決定方法。
【請求項5】
前記少なくとも2つのモードが、前記現在のピクセルセットの少なくとも1つのピクセルに対して組合せで決定される、請求項1に記載の決定方法。
【請求項6】
前記少なくとも1つのモードの前記決定が、前記現在のピクセルセットと少なくとも1つの参照ピクセルセットとの共同解析から得られる修正パラメータ(U’
q)によって修正される、請求項1~5のいずれか一項に記載の決定方法。
【請求項7】
少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するためのデバイス(DEMOD1;DEMOD2)であって、少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するように構成されたプロセッサを含む、デバイスにおいて、
前記少なくとも1つの符号化モード及び復号化モードのそれぞれが、既に復号化済みの参照画像に属する少なくとも1つの参照ピクセルセットの解析に基づいて決定されることを特徴とする、デバイス。
【請求項8】
ニューラルネットワーク(DEMOD2)を使用することを特徴とする、請求項7に記載の決定デバイス。
【請求項9】
コンピュータ上で実行された際に、請求項1~6のいずれか一項に記載の決定方法を実施するためのプログラムコード命令を含む、コンピュータプログラム。
【請求項10】
請求項9に記載のコンピュータプログラムの命令を含む、コンピュータ可読情報媒体。
【請求項11】
符号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを符号化するための方法であって、前記現在のピクセルセットが、少なくとも1つの符号化モードの決定に基づいて符号化される(C1~C4;C’1~C’15)、方法において、
前記少なくとも1つの符号化モードが、請求項1~6のいずれか一項に記載の決定方法に従って決定されることを特徴とする、方法。
【請求項12】
少なくとも1つの現在のピクセルセットを符号化するためのデバイス(COD1;COD2;COD3)であって、少なくとも1つの符号化モードの決定に基づいて前記現在のピクセルセットを符号化するように構成されたプロセッサを含む、符号化するためのデバイスにおいて、
前記符号化するためのデバイスが、請求項7又は請求項8に記載の少なくとも1つの符号化モードを決定するためのデバイスを含むことを特徴とする、デバイス。
【請求項13】
復号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを復号化するための方法であって、前記現在のピクセルセットが、少なくとも1つの復号化モードの決定に基づいて復号化される(D1~D5;D’1~D’9)、方法において、
前記少なくとも1つの復号化モードが、請求項1~6のいずれか一項に記載の決定方法に従って決定されることを特徴とする、方法。
【請求項14】
少なくとも1つの現在のピクセルセットを復号化するためのデバイス(DEC1;DEC2;DEC3)であって、少なくとも1つの復号化モードの決定に基づいて前記現在のピクセルセットを復号化するように構成されたプロセッサを含む、復号化するためのデバイスにおいて、
請求項7又は請求項8に記載の少なくとも1つの復号化モードを決定するためのデバイスを含むことを特徴とする、デバイス。
【請求項15】
コンピュータ上で実行されると請求項11に記載の符号化方法又は請求項13に記載の復号化方法を実施するためのプログラムコード命令を含む、コンピュータプログラム。
【請求項16】
請求項15に記載のコンピュータプログラムの命令を含む、コンピュータ可読情報媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的には画像処理の分野に関し、具体的にはディジタル画像及び一連のディジタル画像の符号化及び復号化に関する。
【0002】
ディジタル画像の符号化/復号化は特に、以下のものを含む少なくとも1つの映像系列から画像へ適用される:
- 同一カメラからの及び時間的連続な画像(2D符号化/復号化)、
- 様々な視野において配向された様々なカメラからの画像(3D符号化/復号化)、
- 対応テクスチャ及び深さ成分(3D符号化/復号化)、
- 等々。
【0003】
本発明は、2D又は3D画像の符号化/復号化に同様に適用される。
【0004】
本発明は、限定しないが特に、現在のAVC、HEVC及びVVC映像エンコーダ並びにそれらの拡張版(MVC、3D-AVC、MV-HEVC、3D-HEVCなど)において実施される映像符号化及び対応復号化へ適用され得る。
【背景技術】
【0005】
現在の映像エンコーダ(MPEG、AVC、HEVC、VVC、AV1など)は、映像系列のブロック的表現を使用する。画像は、再帰的に再び分割されることができるブロックへ分割される。次に、例えば、イントラ、インター、スキップ、マージモードなどの特定の符号化モードを使用して、各ブロックが符号化される。いくつかの画像は、他の過去又は将来の画像を参照することなく、例えば、イントラ符号化モード、IBC(「イントラブロックコピー」)符号化モードなどの符号化モードを使用して符号化される。他の画像は、当業者に周知の動き補償を使用して、1つ又は複数の符号化済みの/復号化済みの参照画像に関して符号化される。この時間符号化モードは、インター符号化モードと呼ばれる。
【0006】
オリジナルのブロックが予測によって減少したものに相当する残差ブロック(予測残差とも呼ばれる)は、各ブロックに対して符号化される。スキップ符号化モードの事例では、残差ブロックはゼロである。
【0007】
符号化予定の考慮中のブロックの場合、このブロックに対する複数のイントラ、インター、スキップ、マージなどの符号化モードは、最良の符号化モード(すなわち、例えば、データレート/歪みコストなどの既定の符号化性能基準に従って、考慮中のブロックの符号化を最適化するもの)を選択することを目的としてエンコーダ側で競合し、それらの符号化性能基準は、すなわち、オリジナルの画像と符号化された後にデコーダによって復号化される画像との間の歪みの尺度の比較、及び復号化命令の送信に必要なデータレートであり、さらには効率/複雑性における妥協でさえあるが、それらは当業者に周知の基準である。エンコーダは、デコーダがオリジナルのブロックを再構築できるように、最適な符号化モードに関連する符号化情報をデコーダに送信することに対する責任を有する。そのような情報は、ストリームにおいて、典型的にはバイナリ表現の形式で送信される。
【0008】
例えばピクセル間の位置の観点から、選択される符号化モードが正確であるほど残差のデータレートは低くなる。その一方で、より多くの情報(具体的には、形状の輪郭における)を送信する必要がある。
【0009】
復号化は、ストリームから読み取られた後に復号化される符号化情報に基づいて、また、デコーダ側で既に利用可能な(すなわち、前もって復号化されている)要素に基づいて、デコーダ側で行われる。
【0010】
既に利用可能なこれらの要素は、具体的には、
- 現在復号化されている画像の要素(例えば、イントラ又はIBC復号化モードが参照される)、
- 他の以前に復号化された画像からの要素(インター復号化モードが参照される)
である。
【0011】
これらの2つのタイプのイントラ及びインター符号化モードは、VVC規格(「次世代映像符号化」)に従って組み合わせることができる。CIIP(「インター予測とイントラ予測の組合せ」)を参照されたい。
【0012】
これらの予測技法によれば、エンコーダは、実行する最適なモードタイプをデコーダに信号伝達しなければならない。この情報は、各ブロックに対して搬送される。それにより、大量の情報がストリームに挿入されるおそれがあり、これは、データレートを制限するために最小化すべきものである。その結果、多くの詳細を含みテクスチャ感の高い画像において特に、精度が不足し得る。
【0013】
この精度の不足により、所定のデータレートに対して再構築された画像の品質が制限される。
【発明の概要】
【発明が解決しようとする課題】
【0014】
本発明の目的の1つは、現在のピクセルセットの符号化のために決定された符号化モードに関連する情報の信号伝達のコストの低減を支持して、先行技術からの符号化モードの決定を改善することによって、前述の先行技術の欠点を補うことである。
【課題を解決するための手段】
【0015】
この目的のため、本発明の対象の1つは、少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するための方法に関する。そのような決定方法は、上記少なくとも1つの符号化モード及び復号化モードのそれぞれが、少なくとも1つの参照ピクセルセットの解析に基づいて決定されることを特徴とする。
【0016】
本発明による、少なくとも1つの符号化モード(及び復号化モードのそれぞれ)を決定するためのそのような方法は、有利には、少なくとも2つの可能な符号化モード(及び復号化モードのそれぞれ)の中から、現在のピクセルセットの各ピクセルに適用するための1つ及び/又は複数の符号化モード(及び復号化モードのそれぞれ)を決定するために、1つ又は複数の参照ピクセルセット(言い換えれば、現在のピクセルセットの符号化又は復号化の時点で既に復号化済みの1つ又は複数のピクセルセット)にのみ依拠することを可能にする。この又はこれらの参照ピクセルセットは現在のピクセルセットの符号化(及び復号化のそれぞれ)の時点で利用可能であるため、この/これらの参照ピクセルセットの精度は、先行技術におけるブロック単位で動作するエンコーダ(及びデコーダのそれぞれ)とは異なり、各ピクセル位置に対して完全に分かっている。それにより、ブロックごとの符号化性能基準の演算に基づくものである先行技術で実施されるものより直接的であり、空間的に正確であることを理由に、現在のピクセルセットの各ピクセルに適用するための1つ又は複数の符号化(及び復号化のそれぞれ)モードの決定が改善される。
【0017】
従って、現在のピクセルセットに適用するための符号化(及び復号化のそれぞれ)モードは、より正確であり、画像の局所的なプロパティに、より良好に適応する。
【0018】
これにより、再構築された画像の品質が改善される。
【0019】
特定の一実施形態によれば、少なくとも2つのモードの中からの単一の符号化モード及び復号化モードのそれぞれは、現在のピクセルセットの少なくとも1つのピクセルに対して決定され、1つ又は他のモードの決定は、上記セットの上記少なくとも1つのピクセルから少なくとも1つの他のピクセルまで様々である。
【0020】
そのような実施形態は、有利には、高いピクセル精度で、先行技術からの符号化又は復号化モード(例えば、イントラ、スキップ、インターなど)の再利用を可能にする。
【0021】
別の特定の実施形態によれば、少なくとも2つの符号化モード及び復号化モードのそれぞれは、現在のピクセルセットの少なくとも1つのピクセルに対して組合せで決定される。
【0022】
そのような実施形態は、有利には、全く同じピクセルの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード(スキップ、イントラ、インターなど)(及び復号化モードのそれぞれ)を組み合わせられるようにすることが可能である。また、この実施形態は、ブロック効果のような不連続性を生み出すことなく、1つの符号化モード及び復号化モードのそれぞれから他のモードに徐々に変更できるようにすることも可能である。
【0023】
さらなる別の特定の実施形態によれば、上記少なくとも1つの符号化モード及び復号化モードのそれぞれの決定は、現在のピクセルセットの解析から得られる修正パラメータによって修正される。
【0024】
そのような実施形態は、有利には、1つ又は複数の参照ピクセルセットにおいて存在しなかった/予想できなかった要素を現在のピクセルセットが含む際は、上記少なくとも1つの符号化又は復号化モードの決定に補正を適用できるようにすることが可能である。
【0025】
様々な前述の実施形態又は実装形態の特徴は、互いに独立して又は組み合わせて、上記で定義される決定方法に追加することができる。
【0026】
また、本発明は、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するためのデバイスであって、少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するように構成されたプロセッサを含む、デバイスにも関する。
【0027】
そのような決定デバイスは、上記少なくとも1つの符号化モード及び復号化モードのそれぞれが、少なくとも1つの参照ピクセルセットの解析に基づいて決定されることを特徴とする。
【0028】
特定の一実施形態では、決定デバイスは、ニューラルネットワークである。
【0029】
ニューラルネットワークの使用により、有利には、上記少なくとも1つの符号化モード及び復号化モードのそれぞれの決定の精度を最適化することが可能になる。
【0030】
そのような決定デバイスは、具体的には、前述の決定方法を実施することができる。
【0031】
また、本発明は、符号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを符号化するための方法であって、現在のピクセルセットが、少なくとも1つの符号化モードの決定に基づいて符号化される、方法にも関する。
【0032】
そのような符号化方法は、上記少なくとも1つの符号化モードが、本発明による前述の決定方法に従って決定されることを特徴とする。
【0033】
そのような符号化方法は、現在のピクセルセットを符号化するために使用される1つ及び/又は複数の符号化モードを示す1つ又は複数のインデックスの符号化を必要としないという点で、有利である。これは、現在のピクセルセットに対するこの又はこれらのモードインデックスをエンコーダがデコーダに送信する必要はないことを意味し、それにより、符号化モードの精選に関連して、画像の再構築におけるより良い品質を支持して、エンコーダとデコーダとの間で送信される情報の信号伝達のコストを低減することができる。
【0034】
また、本発明は、少なくとも1つの現在のピクセルセットを符号化するための符号化デバイス又はエンコーダであって、少なくとも1つの符号化モードの決定に基づいて現在のピクセルセットを符号化するように構成されたプロセッサを含む、符号化デバイス又はエンコーダにも関する。
【0035】
そのような符号化デバイスは、本発明による、少なくとも1つの符号化モードを決定するための前述のデバイスを含むことを特徴とする。
【0036】
そのような符号化デバイスは、具体的には、本発明による前述の符号化方法を実施することができる。
【0037】
また、本発明は、復号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを復号化するための方法であって、現在のピクセルセットが、少なくとも1つの復号化モードの決定に基づいて復号化される、方法にも関する。
【0038】
そのような復号化方法は、上記少なくとも1つの復号化モードが、本発明による前述の決定方法に従って決定されることを特徴とする。
【0039】
そのような復号化方法の利点は、デコーダが、エンコーダから受信するデータ信号から特定の情報を読み取る必要なく、現在のピクセルセットを復号化するための少なくとも1つの復号化モードの決定が、1つ又は複数の利用可能な参照ピクセルセットに基づいて、デコーダによって自律的に実施されるという事実にある。
【0040】
また、本発明は、少なくとも1つの現在のピクセルセットを復号化するための復号化デバイス又はデコーダであって、少なくとも1つの復号化モードの決定に基づいて現在のピクセルセットを復号化するように構成されたプロセッサを含む、復号化デバイス又はデコーダにも関する。
【0041】
そのような復号化デバイスは、本発明による、少なくとも1つの復号化モードを決定するための前述のデバイスを含むことを特徴とする。
【0042】
そのような復号化デバイスは、具体的には、本発明による前述の復号化方法を実施することができる。
【0043】
また、本発明は、命令を含むコンピュータプログラムであって、上記プログラムが、プロセッサによって実行されると、上記で説明される特定の実施形態のいずれか1つに従って、本発明による決定方法及び同様に本発明による決定方法を組み込む符号化又は復号化方法を実施するための、コンピュータプログラムにも関する。
【0044】
そのような命令は、前述の決定方法を実施する決定デバイス、前述の符号化方法を実施するエンコーダ、前述の復号化方法を実施するデコーダの非一時的な記憶媒体に永続的に格納することができる。
【0045】
このプログラムは、任意のプログラミング言語を使用し得、ソースコード、オブジェクトコード、又はソースコードとオブジェクトコードとの間の中間コードの形式(部分的コンパイル形式など)、又は任意の他の望ましい形式のものであり得る。
【0046】
本発明はまた、上述のコンピュータプログラムの命令を含むコンピュータ可読記録媒体又は情報媒体を標的とする。
【0047】
記録媒体は、プログラムを格納することができる任意のエンティティ又はデバイスであり得る。例えば、媒体は、ROM(例えばCD-ROM、DVD-ROM、合成DNA(デオキシリボ核酸)など、又は超小形電子回路ROM)などの格納手段、そうでなければ磁気記録手段(例えばUSBキー、ハードディスク)を含み得る。
【0048】
さらに、記録媒体は、電気ケーブル又は光ケーブルを介し、又は無線により、又は他の手段により運ばれ得る電気信号又は光信号などの送信可能媒体であり得る。本発明によるプログラムは特に、インターネットなどのネットワークからダウンロードされ得る。
【0049】
代替的に、記録媒体は、プログラムが取り込まれる集積回路であり得、集積回路は、本発明による上述の決定方法、符号化方法、又は復号化方法を実行する又はその実行において使用されるように設計される。
【0050】
他の特徴及び利点は、図示例及び非限定的例並びに添付図面として与えられる本発明の特定実施形態を読むことから明白になる。
【図面の簡単な説明】
【0051】
【
図1】本発明による、少なくとも1つの符号化又は復号化モードを決定するための方法の主なステップを示す。
【
図2A】本発明の第1の特定の実施形態における、
図1の決定方法で解析される参照ピクセルセットのタイプの1つを示す。
【
図2B】本発明の第2の特定の実施形態における、
図1の決定方法で解析される参照ピクセルセットの別のタイプを示す。
【
図3A】第1の実施形態における、
図1の決定方法を実施する決定デバイスを示す。
【
図3B】第2の実施形態における、
図1の決定方法を実施する決定デバイスを示す。
【
図4】
図3Bの決定デバイスを訓練するための方法を概略的に示す。
【
図5A】2つの基準ピクセルセットに対する現在のピクセルセットの予測版の第1の例示的変位を示す。
【
図5B】2つの基準ピクセルセットに対する現在のピクセルセットの予測版の第2の例示的変位を示す。
【
図5C】2つの基準ピクセルセットに対する現在のピクセルセットの予測版の第3の例示的変位を示す。
【
図5D】本発明の一特定実施形態における
図5Aの変位のタイプの場合に実施される動き補償を示す。
【
図5E】本発明の特定の一実施形態における、
図5Dの動き補償の終了時に実施される、少なくとも1つの符号化モード及び復号化モードのそれぞれの決定を示す。
【
図6】
図3Aの決定デバイスによって実施される決定方法の特定のステップをさらに詳細に示す。
【
図7】本発明の特定の一実施形態における、
図1の少なくとも1つの符号化モードを決定するための方法を実施する画像符号化方法の主なステップを示す。
【
図8A】第1の実施形態における、
図7の符号化方法を実施するエンコーダを示す。
【
図8B】第2の実施形態における、
図7の符号化方法を実施するエンコーダを示す。
【
図9】本発明の特定の一実施形態における、
図1の少なくとも1つの復号化モードを決定するための方法を実施する画像復号化方法の主なステップを示す。
【
図10A】第1の実施形態における
図9の復号化方法を実施するデコーダを示す。
【
図10B】第2の実施形態における
図9の復号化方法を実施するデコーダを示す。
【
図11】本発明の一特定実施形態における、
図1の符号化モードを決定するための方法の修正を実施する画像符号化方法の工程を示す。
【
図12】本発明の一特定実施形態における
図11の符号化方法を実施するエンコーダを示す。
【
図13】本発明の一特定実施形態における、
図1の復号化モードを決定するための方法の修正を実施する画像復号化方法の工程を示す。
【
図14】本発明の一特定実施形態における
図13の復号化方法を実施するデコーダを示す。
【発明を実施するための形態】
【0052】
少なくとも1つの符号化又は復号化モードを決定するための方法の例示的な実装形態
発明の一般原理
少なくとも1つの符号化又は復号化モードを決定するための方法
以下では、2D又は3D画像の符号化及び復号化のそれぞれを視野に入れて、少なくとも1つの符号化又は復号化モードを決定するための方法の説明を提供し、上記決定方法は、例えば、AVC、HEVC、VVC規格及びそれらの拡張版(MVC、3D-AVC、MV-HEVC、3D-HEVCなど)又は同様のものに準拠するものなど、いかなるタイプの映像エンコーダ又はデコーダにおいても実施することができる(例えば、畳み込みニューラルネットワーク(又はCNN)など)。
【0053】
図1を参照すると、本発明による、少なくとも1つの符号化又は復号化モードを決定するための方法は、少なくとも1つの参照ピクセルセットBR
0を使用するが、参照ピクセルセットBR
0とは、すなわち、既に符号化済み及び復号化済みであり、従って、N個のピクセルp
1、p
2、…、p
N(N≧1)を含む現在のピクセルセットB
cの符号化及び復号化のそれぞれを行うために使用することを意図する上記少なくとも1つの符号化又は復号化モードを決定する時点で利用可能なものである。
【0054】
本発明の意味の範囲内では、現在のピクセルセットBcは、
- オリジナルの現在の画像、
- オリジナルの現在の画像の部分又は領域、
- 標準化されたAVC、HEVC又はVVCエンコーダにおいて行われているものに沿ってこの画像のパーティション化から得られる現在の画像のブロック
を意味するものとして理解される。
【0055】
本発明によれば、
図2Aに示されるように、参照ピクセルセットBR
0は、現在のピクセルセットB
cを含む現在の画像I
iに属し得る。この事例では、現在のピクセルセットB
cに対する少なくとも1つの符号化モードMC
c(及び復号化モードMD
cのそれぞれ)は、この参照ピクセルセットBR
0に関して決定される。
【0056】
当然ながら、上記少なくとも1つの符号化モードMCc(及び復号化モードMDcのそれぞれ)は、現在の画像Iiに属する参照ピクセルセットBR0に関して及び1つ又は複数の他の参照ピクセルセットに関して決定することができる。
【0057】
本発明によれば、
図2Bに示されるように、参照ピクセルセットBR
0は、現在の画像I
iに時間的に先行するか又はそれに続く、既に符号化済みの及び復号化済みの参照画像に属し得る。この事例では、現在のピクセルセットB
cに対する符号化モードMC
c(及び復号化モードMD
cのそれぞれ)は、参照ピクセルセットBR
0に関して決定される。示される例では、現在のピクセルセットB
cに対する符号化モードMC
c(及び復号化モードMD
cのそれぞれ)は、参照ピクセルセットBR
0に関して演算することができ、参照ピクセルセットBR
0は、例えば、直前の画像IR
i-1に属するが、当然ながら、例えば、画像IR
i+1、又は、符号化順番において現在の画像I
iに先行する他の参照画像(すなわち、現在の画像I
iの前の既に符号化済みの及び復号化済みの画像)など、別の参照画像に属することも可能である。示される例では、現在のピクセルセットB
cに対する符号化モードMC
c(及び復号化モードMD
cのそれぞれ)は、現在の画像I
iに先行する参照画像に位置する参照ピクセルセットBR
0に関して及び現在の画像I
iに続く参照画像に位置する少なくとも1つの他の参照ピクセルセットBR
1に関して演算することもできる。示される例では、参照ピクセルセットBR
0は、参照画像IR
i-2に位置し、参照ピクセルセットBR
1は、参照画像IR
i+1に位置する。参照画像に位置する参照ピクセルセットに関する少なくとも1つの符号化又は復号化モードのそのような決定のさらなる文脈では、
図2Bに示されるように、現在のピクセルセットB
cに対する符号化モードMC
c(及び復号化モードMD
cのそれぞれ)は、2つの参照ピクセルセットBR
0、BR
1に関して演算することができ、その各々は、現在の画像I
iに先行する参照画像に位置する。示される例では、参照ピクセルセットBR
0は、参照画像IR
i-2に位置し、参照ピクセルセットBR
1は、参照画像IR
i-1に位置する。
【0058】
当然ながら、現在のピクセルセットBcに対する上記少なくとも1つの現在の符号化モードMCc(及び復号化モードMDcのそれぞれ)を演算するために、参照ピクセルセットBR0及びBR1と共に、1つ又は複数の他の参照ピクセルセットを使用することができる。
【0059】
図1を再び参照すると、本発明によるそのような決定方法は、以下を含む。
【0060】
P1では、現在のピクセルセットBcの少なくとも1つの現在のピクセルpc(1≦c≦N)に対して、上記少なくとも1つの参照ピクセルセットBR0が解析される。そのようなステップは、具体的には、BR0の位置、ある参照画像から別の参照画像へのBR0の変位、BR0の変位の間にオクルージョン領域が生じるかどうかなどを解析することを含む。
【0061】
P2では、BR0の解析に基づいて、考慮中の少なくとも2つの符号化モードMC1、MC2及び復号化モードMD1、MD2のそれぞれの中から、符号化モードMCc及び復号化モードMDcのそれぞれが選択される。
【0062】
モードMC1及びMD1のそれぞれは、例えば、インターモードである。モードMC2及びMD2のそれぞれは、例えば、イントラモードである。その代替として、モードMC1及びMD1のそれぞれは、例えば、インターモードであり、モードMC2及びMD2のそれぞれは、例えば、スキップモードである。
【0063】
ステップP2の終了時には、符号化モードMCc及び復号化モードMDcのそれぞれが上記少なくとも1つの現在のピクセルpcに対して決定される。
【0064】
次に、現在のピクセルセットBcのN個のピクセルの各々に対して、P1~P2のステップが繰り返される。
【0065】
当然ながら、たった今説明した決定方法において、2つを超える符号化モード及び復号化モードのそれぞれを考慮することができる。例えば、決定の間、以下の3つの符号化又は復号化モードを考慮することができる:
- モードMC1/MD1はインターである、
- モードMC2/MD2はイントラである、
- モードMC3/MD3はスキップである。
【0066】
ステップP2の変形形態として、上記少なくとも1つの現在のピクセルpcの符号化/復号化を行うために、少なくとも2つの符号化/復号化モードを組合せで決定することができる。例えば、Bcの符号化/復号化を行うために、モードMC1/MD1=インターとMC2/MD2=イントラの組合せを決定することができる。別の例によれば、Bcの符号化/復号化を行うために、モードMC1/MD1=インターとMC3/MD3=スキップの組合せを決定することができる。
【0067】
少なくとも1つの符号化又は復号化モードを決定するためのデバイスの例示的な実装形態
図3Aは、本発明の第1の実施形態による、
図1に示される決定方法の実施に適した少なくとも1つの符号化又は復号化モードを決定するためのデバイスDMOD1を示す。
【0068】
この第1の実施形態によると、決定方法により行われる行為はコンピュータプログラム命令により実施される。この目的を達成するために、予測デバイスDMOD1は、コンピュータの従来のアーキテクチャを有し、特にメモリMEM_DM1と、例えばプロセッサPROC_DM1を備えメモリMEM_DM1内に格納されたコンピュータプログラムPG_DM1により駆動される処理ユニットUT_DM1とを含む。コンピュータプログラムPG_DM1は、プロセッサPROC_DM1により実行されると上述のような決定方法の行為を実施するための命令を含む。
【0069】
初期化時に、コンピュータプログラムPG_DM1のコード命令は例えば、プロセッサPROC_DM1により実行される前にRAMメモリ(示されない)内へロードされる。処理ユニットUT_DM1のプロセッサPROC_DM1は、特に上に説明された決定方法の行為をコンピュータプログラムPG_DM1の命令に従って実施する。
【0070】
決定デバイスは、入力E_DM1において、1つ又は複数の参照ピクセルセットBR0、BR1などを受信し、利用可能な様々な符号化モードMC1、MC2及び復号化モードMD1、MD2のそれぞれを評価し、出力S_DM1において、現在のピクセルセットBcの符号化又は復号化のそれぞれにおいて使用するために、符号化モードMCc又は復号化モードMDcを伝達する。
【0071】
図3Bは、本発明の第2の実施形態による、
図1に示される決定方法の実施に適した少なくとも1つの符号化又は復号化モードを決定するためのデバイスDMOD2を示す。
【0072】
この第2の実施形態によれば、決定デバイスDMOD2は、例えば、畳み込みニューラルネットワーク、多層パーセプトロン、LSTM(「長・短期記憶」)など、RNC1として示されるニューラルネットワークであり、現在のピクセルセットB
cの各ピクセルに対する符号化モードMC
c又は復号化モードMD
cを出力側で伝達するために、入力側で受信した1つ又は複数の参照ピクセルセットBR
0、BR
1などから、
図1の決定方法のP1-P2のステップを共同で実施する。
【0073】
それ自体が知られている方法では、畳み込みニューラルネットワークRNC1は、一連の層のフィルタリング、非線形性及びスケーリング動作を行う。使用される各フィルタが畳み込みカーネルによってパラメータ化され、非線形性がパラメータ化される(ReLU、leaky ReLU、GDN(「一般化分割正規化」)など)。ニューラルネットワークRNC1は、例えば、D.Sun,et al.,“PWC-Net:CNNs for Optical Flow Using Pyramid,Warping,and Cost Volume”CVPR 2018という文献において説明されるタイプのものである。
【0074】
この事例では、ニューラルネットワークRNC1は、
図4に示される方法で訓練することができる。
【0075】
この目的のため、ニューラルネットワークRNC1は、
- 場合により、BR0、BR1などから現在符号化されている又は復号化されている現在のピクセルセットBcへのそれぞれの動きを補間して予測ピクセルセットBPcを得るために、1つ又は複数の変位ベクトルV0、V1などを推定すること
- 少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、符号化モードMCc及び復号化モードMDcのそれぞれを推定すること
を狙いとして訓練することができる。
【0076】
符号化モードMCc及び復号化モードMDcのそれぞれは、少なくとも2つの値0又は1を取り、それは、例えば、
- インターモードとスキップモード、
- イントラモードとスキップモード、
- インターモードとイントラモード、
- その他
のそれぞれを表す。
【0077】
予備段階では、ネットワークRNC1は、
図1からの動作P1-P2を行うために訓練される。例えば、ネットワークRNC1は、符号化予定の現在のピクセルセットB
cと、選択された少なくとも1つの符号化モードMC
c(及び復号化モードMD
cのそれぞれ)を適用した後に得られるピクセルセットBS
cとの間の二乗平均平方根誤差を最小化するために訓練され、それは、
- スキップモードに等しい動き補償を通じて得られた現在の予測ピクセルセットBP
c、
- 並びに、現在の予測ピクセルセットBP
c及びB
cの現在のピクセルの値と現在の予測ピクセルセットBP
cのピクセルの値との差の残差信号特性(この残差信号は、量子化パラメータQPによって量子化され、次に、符号化される)を使用して得られたか又は得られなかった、再構築された現在のピクセルセットBD
c
から行われるものである。
【0078】
ネットワークRNC1は、訓練段階の間に、現在のピクセルセットBcと共に多数の関連の参照ピクセルセットBR0、BR1などを提示することによって、次に、符号化モードMCc(及び復号化モードMDcのそれぞれ)の選択に応じて、Bcのピクセルと結果BScのピクセルとの間の平均二乗誤差を最小化するために、例えば、勾配降下アルゴリズムを使用して、ネットワークの重みを変更することによって、訓練される。
【0079】
この予備訓練段階の終了時には、ネットワークRNC1は、固定され、モード決定デバイスDMOD2における使用に適したものになっている。
【0080】
決定デバイスDEMOD1によって実施される、少なくとも1つの符号化/復号化モードを決定するための方法の実施形態
ここでは、
図6及び
図5A~
図5Eを参照して、
図3Aの決定デバイスDEMOD1において現在のピクセルセットに対する少なくとも1つの符号化又は復号化モードが決定される一実施形態の説明を提供する。
【0081】
示される例では、少なくとも1つの符号化又は復号化モードを決定するために、2つの参照ピクセルセットBR0及びBR1が考慮される。
【0082】
この目的を達成するために、
図6に示すように、少なくとも1つの基準ピクセルセットの解析P1は以下のことを含む:
P10において、BR
0とBR
1との間の動き推定が計算される。このような工程は従来の動き探索工程(例えば変位ベクトルの推定など)を介し行われる。
【0083】
図5A~5Cは、この工程P10中に遭遇され得る2つの基準ピクセルセットBR
0,BR
1に対する現在のピクセルセットB
cの予測版BP
cの3つの異なる例示的変位をそれぞれ示す。
図5A~
図5Cの例では、基準ピクセルセットBR
0とBR
1との間の要素E(円により象徴化される)の変位は動きベクトルの場により表される。単純化のために、単一ベクトル(
図5A~
図5CではV
01で表され、点線で示される)が、示された例ではBR
0からBR
1への要素Eの動きを説明するために示される(画像の他の部分に関する動きは零であると考えられる)。しかし、例えばオプティカルフロー動き推定の場合のように基準ピクセルセットBR
0~BR
1を表すピクセルの数と同数の動きベクトルが存在するということは言うまでもない。
図5A~
図5Cに示さない別の例によると、BR
1からBR
0への(反対方向)動きを説明するベクトルV
10が計算される可能性がある。
【0084】
P10、P11(
図6)において取得されたベクトルV
01又はV
10は、BR
0とBR
1に対し予測される現在のピクセルセットB
cの変位を推定することを含む。この推定は
図5A~
図5Cに示され、ここでは、要素Eの変位は、現在のピクセルセットB
cが配置された時刻であるBR、BR
1が配置された時刻の以外の時刻に推定される。V
01又はV
10の計算に関し同じ記法を使用することにより:
- 単一ベクトルV
0(BR
0からB
cの予測位置への動きを説明する)がベクトルV
01から計算される、
- BR
1からB
cの予測位置への動きを説明する単一ベクトルV
1がベクトルV
01から計算される。
【0085】
現在のピクセルセットB
cがBR
0とBR
1との間の時間的中間に配置される、
図5Aの例では、現時点における要素Eの変位は、BR
0とBR
1との間の変位の1/2(すなわちベクトルV
01又はV
10の1/2)に対応すると推定される。このような変位構成は、例えば
図2Bと同じ表記法(BR
0が基準画像IR
i-1に属し、BR
1は基準画像IR
i+1に属する)を採用する場合に遭遇される。
【0086】
現在のピクセルセットB
cがBR
1よりBR
0に時間的により近くに配置される、
図5Bの例では、現時点における要素Eの変位はBR
0とBR
1との間の変位の1/2より短いと推定される。例えば、BR
0が基準画像IR
i-1に属し、BR
1が基準画像IR
i+2に属すれば、現時点における要素Eの変位はBR
0とBR
1との間の変位の1/3(すなわちベクトルV
01又はV
10の1/3)に対応すると推定される。
【0087】
現在のピクセルセットB
cが時間的にBR
0(基準画像IR
i-2に属する)に、次にBR
1(基準画像IR
i-2に属する)の後に配置される、
図5Cの例では、現時点における要素Eの変位はBR
0とBR
1との間の変位の2倍(すなわちベクトルV
01又はV
10の2倍)と推定される。
【0088】
図6及び
図5Dを参照すると、P12において、BR
0及びBR
1はそれぞれ、B
cの2つの予測版(BRC
0及びBRC
1で表される)をそれぞれ生成するためにベクトルV
0、V
1を使用することにより動き補償される。
【0089】
図5Dにおける図解により、ベクトルV
0、V
1は、現時点における要素Eの変位がBR
0とBR
1との間の変位の1/2(すなわちベクトルV
01又はV
10の1/2)に対応すると推定される例えば
図5Aに示される動き構成に従って取得されたと考えられる。
【0090】
図5Dは以下のことを示す:
- 要素Eの補間された位置がベクトルV
0によるBR
0の要素Eの動き補償から生じるピクセルセットERC
0を含む右動き補償されたピクセルセットBRC
0、及び
- 要素Eの補間された位置がベクトルV
1によるBR
1の要素Eの動き補償から生じるピクセルセットERC
1を含む左動き補償されたピクセルセットBRC
1。
【0091】
対照的に、ERC
0の部分Z
0及びERC
1の部分Z
1は、BR
0の要素E及びBR
1の要素Eの背後に配置される未知コンテンツに対応するので未定義である。しかし、
図5Dに見られ得るように、部分Z
0はERC
1内に定義され、部分Z
1はERC
0内に定義される。
【0092】
図6及び
図5Eを参照すると、現在のピクセルセットB
cの各ピクセルに対する少なくとも2つの符号化モードMC
1、MC
2又は復号化モードMD
1、MD
2のうちの1つの選択P2の説明が提供されている。
図5Eは、現在のピクセルセットB
cの予測位置を示し、その予測位置は、要素Eの予測位置及び未定義部分Z
0、Z
1を示す。
【0093】
Z0及びZ1の位置(x,y)に位置するピクセルが未知であることにより、それらは、P20において、第1の符号化モードMC1(x,y)=インター及び復号化モードMD1(x,y)=インターのそれぞれと関連付けられる。
【0094】
要素Eの予測位置(x,y)及びバックグラウンドAP(ハッチングによって表される)の予測位置(x,y)に位置するピクセルは、これらのピクセルが参照ピクセルセットBR0、BR1の各々において要素Eのピクセル及びバックグラウンドAPのピクセルとコヒーレントであるという点で、既知である。このため、P20では、これらのピクセルは、例えば、第2の符号化モードMC2(x,y)=スキップ及び復号化モードMD2(x,y)=スキップのそれぞれと関連付けられる。
【0095】
P21では、第1の符号化モードMC1(x,y)=インター及び復号化モードMD1(x,y)=インターのそれぞれは、任意の値(例えば、1)を取り、第2の符号化モードMC2(x,y)=スキップ及び復号化モードMD2(x,y)=スキップのそれぞれは、MC1(x,y)/MD1(x,y)のものとは異なる任意の値(例えば、0)を取る。
【0096】
ステップP21の終了時には、符号化モードMCc及び復号化モードMDcのそれぞれが決定され、現在のピクセルセットBcの考慮中のピクセルに応じて、2つの異なる値0又は1を取る。
【0097】
変形形態として、
- Z0及びZ1の位置に位置するピクセルは、P20において、第1の符号化モードMC1(x,y)=イントラ及び復号化モードMD1(x,y)=イントラのそれぞれと関連付けられ、
- 要素Eの予測位置に位置するピクセルは、P20において、第2の符号化モードMC2(x,y)=インター及び復号化モードMD2(x,y)=インターのそれぞれと関連付けられ、
- バックグラウンドAPに位置するピクセルは、P20において、第3の符号化モードMC3(x,y)=スキップ及び復号化モードMD3(x,y)=スキップのそれぞれと関連付けられる。
【0098】
P21では、
- 第1の符号化モードMC1(x,y)=イントラ及び復号化モードMD1(x,y)=イントラのそれぞれは、任意の値(例えば、1)を取り、
- 第2の符号化モードMC2(x,y)=インター及び復号化モードMD2(x,y)=インターのそれぞれは、MC1(x,y)/MD1(x,y)とは異なる任意の値(例えば、0)を取り、
- 第3の符号化モードMC3(x,y)=スキップ及び復号化モードMD3(x,y)=スキップのそれぞれは、MC1(x,y)/MD1(x,y)ともMC2(x,y)/MD2(x,y)とも異なる任意の値(例えば、2)を取る。
【0099】
ステップP21の終了時には、符号化モードMCc及び復号化モードMDcのそれぞれが決定され、現在のピクセルセットBcの考慮中のピクセルに応じて、3つの異なる値0、1又は2を取る。
【0100】
画像符号化方法
一般原理
以下では、
図7を参照して、
図1を参照して説明した少なくとも1つの符号化モードMC
cの決定を実施する画像符号化方法の説明を提供する。
【0101】
そのような符号化方法は、以下を含む。
【0102】
C1では、
図1に示されるそのP1-P2のステップにおける、少なくとも1つの符号化モードMC
cの決定が実施され、現在のピクセルセットB
cのN個のピクセルの各々に対する現在の符号化モードMC
cが生成される。
【0103】
C2では、どの符号化モードがBcのどのサブピクセルセットSE1、SE2、SE3などと関連付けられているかを決定するために、テストが行われる。
【0104】
C20では、Bcの符号化のために符号化モードMCc=イントラが決定されたかどうかを決定するために、テストが行われる。
【0105】
応答が肯定(
図7のY)の場合は、C30において、サブピクセルセットSE
1がイントラモードで符号化される。このステップの終了時には、従来方式で、使用されるイントラモードのインデックスが付けられて、残差ピクセルの符号化済みのサブセットSER
1
codが生成される。
【0106】
応答が否定(
図7のN)の場合は、C21において、B
cの符号化のために符号化モードMC
c=インターが決定されたかどうかを決定するために、テストが行われる。
【0107】
応答が肯定(
図7のY)の場合は、C31において、サブピクセルセットSE
2がインターモードで符号化される。このステップの終了時には、インターモードでのこの符号化の間に使用された動きベクトルV
2
codと共に、残差ピクセルの符号化済みのサブセットSER
2
codが生成される。
【0108】
応答が否定(
図7のN)の場合は、C22において、B
cの符号化のために符号化モードMC
c=スキップが決定されたかどうかを決定するために、テストが行われる。
【0109】
応答が肯定(
図7のY)の場合は、C32において、サブピクセルセットSE
3がスキップモードで符号化される。このステップの終了時には、符号化済みの動きベクトルV
3
codが生成される。このモードに対し、残差の演算及び符号化は行われない。第1の実施形態では、V
3
cod=V
2
codである。第2の実施形態では、V
3
cod≠V
2
codである。
【0110】
応答が否定(
図7のN)の場合は、B
cのピクセルのすべてに符号化モードMC
cが割り当てられるまで、B
cの符号化のために別の符号化モードMC
cが決定されたかどうかに関する決定が続く。
【0111】
C4では、デコーダに送信できるように、符号化済みの動きベクトルV2
cod及びV3
codが、又は、V3
cod=V2
codの事例では、V3
codのみが、残差ピクセルの符号化済みのサブセットSER1
cod及びSER2
codからのデータと共に、トランスポートストリームFに書き込まれるが、デコーダについては、後の説明において説明する。書き込まれるこれらのデータは、Bc
codとして示される符号化済みの現在のピクセルセットBcに相当する。
【0112】
本発明によれば、そのような1つ又は複数の符号化モードは、有利には、符号化も、デコーダへの送信も行われない。
【0113】
サブピクセルセットSE1(SE2及びSE3のそれぞれ)は、Bcの少なくとも1つのピクセル、Bcのピクセルの少なくとも1つの領域又はBc全体に相当し得る。
【0114】
実施されるイントラ、インター及び/又はスキップ符号化動作は、従来方式であり、AVC、HEVC、VVC符号化又は同様のものに準拠する。
【0115】
たった今説明した符号化は、当然ながら、言及した3つの異なる符号化モード又は2つのみの異なる符号化モードの中から、ましてや、3つ以上の異なる符号化モードの中からでさえ、単一の符号化モードをBcに適用することができる。
【0116】
エンコーダ例示的実装形態
図8Aは、本発明の第1の実施形態による
図7に示す符号化方法を実施するために好適なエンコーダCOD1を示す。エンコーダCOD1は決定デバイスDEMOD1を含む。
【0117】
この第1の実施形態によると、符号化方法により行われる行為はコンピュータプログラム命令により実施される。そのために、符号化デバイスCOD1はコンピュータの従来のアーキテクチャを有しており、特に、メモリMEM_C1と、例えばプロセッサPROC_C1を備えた処理ユニットUT_C1であってメモリMEM_C1内に格納されたプログラムPG_C1をコンピュータにより駆動される処理ユニットUT_C1とを含む。コンピュータプログラムPG_C1は、プログラムがプロセッサPROC_C1により実行されると上述の符号化方法の行為を実施するための命令を含む。
【0118】
初期化時に、コンピュータプログラムPG_C1のコード命令は例えば、プロセッサPROC_C1により実行される前にRAMメモリ(示されない)内へロードされる。処理ユニットUT_C1のプロセッサPROC_C1は特に、上に説明された符号化方法の行為をコンピュータプログラムPG_C1の命令に従って実施する。
【0119】
エンコーダCOD1は、現在のピクセルセットBcを入力E_C1において受信し、好適な通信インターフェース(示されない)を使用することによりデコーダへ送信されるトランスポートストリームFを出力S_C1において送出する。
【0120】
図8Bは、本発明の第2の実施形態による、
図7に示される符号化方法の実施に適したエンコーダCOD2を示す。エンコーダCOD2は、前述の決定デバイスDEMOD2を含み、その次に、決定デバイスDEMOD2によって決定された1つ及び/又は複数の符号化モードMC
cと併せて現在のピクセルセットB
cを符号化する畳み込みニューラルネットワークRNC2を含む。そのようなネットワークRNC2は、例えば、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020という文献において説明されるタイプのものである。
【0121】
画像復号化方法
一般原理
以下では、
図9を参照して、
図1を参照して説明されるような少なくとも1つの復号化モードMD
cの決定を実施する画像復号化方法の説明を提供する。
【0122】
そのような復号化方法は、
図7の画像符号化に対応する画像復号化を実施する。具体的には、上記少なくとも1つの復号化モードMD
cの決定は別として、復号化方法は、AVC、HEVC、VVC復号化又は同様のものに準拠する従来の復号化ステップを実施する。
【0123】
復号化方法は、以下を含む。
【0124】
D1では、受信されたトランスポートストリームFから、従来方式で、B
cと関連付けられた符号化済みのデータが抽出され、データは、示される例では、
- 残差ピクセルの符号化済みのサブセットSER
1
cod及びそのイントラモードインデックス(実施されたのが
図7のイントラ符号化C30である場合)
- 残差ピクセルの符号化済みのサブセットSER
2
cod、及び、場合により、V
2
cod≠V
3
codの事例では、符号化済みの動きベクトルV
2
cod(実施されたのが
図7のインター符号化C31である場合)
- 符号化済みの動きベクトルV
3
cod(実施されたのが
図7のスキップ符号化C32である場合)
である。
【0125】
これらのデータは、符号化済みの現在のピクセルセットBc
codに相当する。
【0126】
D2では、
図1に示されるそのP1-P2のステップにおける、少なくとも1つの復号化モードMD
cの決定が実施され、符号化済みの現在のピクセルセットB
c
codのN個のピクセルの各々に対する現在の復号化モードMD
cが生成される。
【0127】
D3では、どの復号化モードがBcのどの符号化済みのサブピクセルセットSE1
cod、SE2
cod、SE3
codなどと関連付けられているかを決定するために、テストが行われる。
【0128】
D30では、Bc
codの復号化のために復号化モードMDc=イントラが決定されたかどうかを決定するために、テストが行われる。
【0129】
応答が肯定(
図9のY)の場合は、D40において、サブピクセルセットSE
1がイントラモードで復号化される。このステップの終了時には、復号化済みのサブピクセルセットSE
1
decが生成される。
【0130】
応答が否定(
図9のN)の場合は、D31において、B
c
codの復号化のために復号化モードMD
c=インターが決定されたかどうかを決定するために、テストが行われる。
【0131】
応答が肯定(
図9のY)の場合は、D41において、V
2
cod≠V
3
codの場合は、V
2
codの復号化から得られる動きベクトルV
2
decを使用して、及び、V
2
cod=V
3
codの場合は、V
3
codの復号化から得られる動きベクトルV
3
decを使用して、サブピクセルセットSE
2がインターモードで復号化される。このステップの終了時には、復号化済みのサブピクセルセットSE
2
decが生成される。
【0132】
応答が否定(
図9のN)の場合は、D32において、B
c
codの復号化のために復号化モードMD
c=スキップが決定されたかどうかを決定するために、テストが行われる。
【0133】
応答が肯定(
図9のY)の場合は、D42において、サブピクセルセットSE
3がスキップモードで復号化される。このステップの終了時には、復号化済みの動きベクトルV
3
decを使用して復号化済みのサブピクセルセットSE
3
decが生成される。
【0134】
応答が否定(
図9のN)の場合は、B
cの符号化済みのピクセルのすべてに復号化モードMD
cが割り当てられるまで、B
cの復号化のために別の復号化モードMD
cが決定されたかどうかに関する決定が続く。
【0135】
D5では、復号化済みのサブピクセルセットSE1
dec、SE2
dec、SE3
decが連結される。ステップD5の終了時には、再構築された現在のピクセルセットBc
decが生成される。
【0136】
本発明によれば、そのような1つ又は複数の復号化モードは、有利には、デコーダ側で自律的に決定される。
【0137】
実施されるイントラ、インター及び/又はスキップ復号化動作は、従来方式であり、AVC、HEVC、VVC符号化又は同様のものに準拠する。
【0138】
今説明した復号化は、当然ながら、言及した3つの異なる復号化モード又は2つのみの異なる復号化モードの中から、ましてや、3つ以上の異なる復号化モードの中からでさえ、単一の復号化モードを考慮中の符号化済みのピクセルセット(ここでは、Bc
cod)に適用することができる。1つ又は複数の復号化モードの適用は、考慮中の1つの符号化済みのピクセルセットから別の符号化済みのピクセルセットまで様々である。
【0139】
それ自体が知られている方法では、再構築された現在のピクセルセットBc
decは、場合により、当業者に周知のループフィルタによるフィルタリングが行われ得る。
【0140】
デコーダ例示的実装形態
図10Aは、本発明の第1の実施形態による
図9に示す復号化方法を実施するために好適なデコーダDEC1を示す。デコーダDEC1は決定デバイスDEMOD1を含む。
【0141】
この第1の実施形態によると、復号化方法により行われる行為はコンピュータプログラム命令により実施される。この目的を達成するために、デコーダDEC1は、コンピュータの従来のアーキテクチャを有しており、特に、メモリMEM_D1と、例えばプロセッサPROD_D1を備えた処理ユニットUT_D1であってメモリMEM_D1内に格納されたプログラムPG_D1をコンピュータにより駆動される処理ユニットUT_D1とを含む。コンピュータプログラムPG_D1は、プログラムがプロセッサPROC_D1により実行されると上述の復号化方法の行為を実施するための命令を含む。
【0142】
初期化時に、コンピュータプログラムPG_D1のコード命令は例えば、プロセッサPROC_D1により実行される前にRAMメモリ(示されない)内へロードされ得る。処理ユニットUT_D1のプロセッサPROC_D1は特に、
図9に関連して上に説明された復号化方法の行為をコンピュータプログラムPG_D1の命令に従って実施する。
【0143】
デコーダDEC1は、
図8AのエンコーダCOD1により送信されたトランスポートストリームFを入力E_D1において受信し、現在の復号化されたピクセルセットB
c
decを出力S_D1において送出する。
【0144】
図10Bは、本発明の第2の実施形態による、
図9に示される復号化方法の実施に適したデコーダDEC2を示す。デコーダDEC2は、前述の決定デバイスDEMOD2を含み、その次に、例えば、決定デバイスDEMOD2によって生成された復号化モードMD
cと併せて現在の符号化済みのピクセルセットB
c
codを復号化する畳み込みニューラルネットワークRNC3を含む。そのようなネットワークRNC3は、例えば、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020という文献において説明されるタイプのものである。
【0145】
少なくとも1つの符号化又は復号化モードを決定するための方法の変形形態
ここでは、
図11及び
図12を参照して、
図1に示されるような少なくとも1つの符号化モードを決定するための方法の一変形形態の説明を提供する。そのような変形形態は、エンコーダCOD3において実施される。
【0146】
そのような変形形態は、得られた符号化又は復号化モードの精度/品質が十分ではない際における、
図1の少なくとも1つの符号化又は復号化モードの決定の改善を目的とする。
【0147】
この目的を達成するために、エンコーダ側では、
図11に示すように、C’1において、前記少なくとも1つの基準ピクセルセットBR
0は現在のピクセルセットB
cと共に解析される。例えば、2つの基準ピクセルセットBR
0及びBR
1がB
cと共に解析される。示された例では、BR
0は、時間的にB
cの前に配置され、BR
1は時間的にB
cの後に配置される。
【0148】
図12に示すように、解析C’1は、非特許文献Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020に説明されるように、2つの基準ピクセルセットBR
0及びBR
1から並びに現在のピクセルセットB
cから、一定数の層(例えば畳み込みフィルタ(CNN)を実施する層など)、続いて非線形及び間引きを実施する層を介した変換を生成する畳み込みニューラルネットワークRNC4を使用することにより実施される。
【0149】
工程C’1の終わりに、一組の潜在的変数が信号U’の形式で取得される。
【0150】
信号U’は、量子化器QUANT1(例えば量子化パラメータにより制御される一様な又はベクトル量子化器)によりC’2において量子化される。次に、量子化信号U’qが取得される。
【0151】
C’3において、量子化信号U’qは、判断された統計量共にエントロピエンコーダCE1(例えば算術型の)を使用することにより符号化される。この統計量は例えば、統計の確率によりパラメータ化される(例えばラプラス則の分散及び平均(σ,μ)をモデル化することにより、又はそうでなければ、BalleによりICLR 2018会議において開示された非特許文献“Variational image compression with a scale hyperprior”におけるようにhyperpriorを考慮することにより)。次に、符号化された量子化信号U’q
codが取得される。
【0152】
C’4において、符号化された量子化信号U’
q
codは、デコーダDEC3(
図14に示す)へ送信されるトランスポートストリームF’に書き込まれる。
【0153】
示される例では、符号化済みの量子化された信号U’
q
codに含まれるデータは、
図1を参照して上記で説明されるように決定されるような符号化モードMC
cと関連付けられた情報を表す。ここで説明される実施形態では、MC
cは、スキップ符号化モードの使用を示すために、0に設定され、インター符号化モードの使用を示すために、1に設定される。
【0154】
この目的のため、ネットワークRNC4は、MCcの0と1との間の値の重み付けの連続性を提供するために訓練されている。
【0155】
符号化の間、エンコーダCOD3は、C’10において、参照ピクセルセットBR0、BR1及び動きベクトルV0、V1を使用する動き補償を実行することによって、符号化予定のピクセルセットBcを予測する。ベクトルV0、V1は、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020において説明されるような「MOFNEt」ニューラルネットワークから導き出すことができる。これにより、BPc(x,y)と呼ばれるBcの予測が得られる。予測C’10は、ニューラルネットワークRNC41を使用して実施される。
【0156】
C’11では、
図12に示される乗算器MU1を使用して、B
c及びBP
c(x,y)に0と1との間のモード値M
c(x,y)がピクセル単位で乗じられる。この動作の終了時には、C’12において、ニューラルネットワークRNC42を通過した後のこれらの2つの重み付け入力を表す信号U”が得られる。C’13では、量子化器QUANT2によって信号U”が量子化され、量子化された信号U”
qが生成される。次に、量子化された信号U”
qは、C’14において、エントロピエンコーダCE2によって符号化され、符号化済みの量子化された信号U”
q
codが生成される。ステップC’13及びC’14は、符号化済みの量子化された信号U”
q
codを生成するために、前述の参考文献によるニューラルネットワークに基づいてエンコーダにおいて実施される。
【0157】
C’15では、符号化済みの量子化された信号U”
q
codがトランスポートストリームF”に書き込まれ、
図14に示されるようなデコーダDEC3に送信される。
【0158】
次に、デコーダDEC3において実施される
図1に示す復号化モードを決定するための方法の一変形形態の説明が
図13及び
図14を参照して与えられる。
【0159】
この目的を達成するために、デコーダ側では、
図13に示すように、D’1において、少なくとも1つの基準ピクセルセットBR
0が解析される(示された例では2組の基準ピクセルBR
0及びBR
1)。このような解析はニューラルネットワークRNC1を使用することにより
図1の工程P1において行われるものと同一である。この工程の終わりに、V
0、V
1など及びMD
cなどを表す潜在空間Uが取得される。
【0160】
ストリームF’の受信に続いて、D’2において、エントロピー復号化が、
図12のエントロピエンコーダCE1に対応するエントロピデコーダDE1を使用することにより、(同じ判断された統計量(ラプラス法の分散及び平均(σ、μ)のモデル化など)を有する)符号化された量子化信号U’
q
codに対して行われる。復号化された量子化信号U’
qはこの操作の終わりに取得される。
【0161】
D’3において、復号化された量子化信号U’
qは、
図14のニューラルネットワークRNC1により取得された潜在空間Uであって基準ピクセルセットBR
0及びBR
1だけの解析を表す潜在空間Uと連結される。
【0162】
次に、ニューラルネットワークRNC1は、D’4において、再構築のために符号化済みの現在のピクセルセットB
c
codに適用される復号化モードMD
cの0と1の連続性の値と共に、動き情報V
0、V
1などを推定するために、
図1のステップP2と同じ方法で、様々な層を通じて、この連結を処理する。
【0163】
ここで説明される実施形態では、
図11の符号化方法で決定及び使用された符号化モードMC
cに従って、MD
cは、スキップ復号化モードの使用を示すために、0に設定され、インター復号化モードの使用を示すために、1に設定される。
【0164】
前述のタイプのニューラルネットワークRNC5は、現在のピクセルセットを再構築して、再構築されたピクセルセットBc
decを生成するために、入力側でこの情報を受信する。そのようなネットワークRNC5は、例えば、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020という文献において説明されるタイプのものである。この目的のため、ニューラルネットワークRNC5は、ニューラルネットワークRNC50を含み、ニューラルネットワークRNC50は、D’5において、ネットワークRNC1によって伝達される動き情報V0、V1などから及び参照ピクセルセットBR0、BR1などから現在の予測ピクセルセットBPc(x,y)を演算する。
【0165】
D’6では、
図14に示される乗算器MU2において、BP
c(x,y)に(1-MD
c(x,y))がピクセルごとに乗じられる。この動作の終了時には、復号化モードMD
c=スキップで復号化されたB
cのピクセルを表す信号SIG
1が得られる。
【0166】
D’7では、
図14に示される乗算器MU3において、BP
c(x,y)にMD
c(x,y)がピクセルごとに乗じられる。
【0167】
続けて
図13及び
図14を参照すると、ニューラルネットワークRNC5は、ニューラルネットワークRNC51も含み、ニューラルネットワークRNC51は、C’14においてエンコーダCOD3によって生成されたフローF”(
図11及び
図12を参照)の受信に続いて、D’8において、
図12のエンコーダCOD3によって実施されるような符号化モードMC
cによって重み付けされた予測から生じたピクセル残差に相当する符号化済みの量子化された信号U”
q
codをエントロピー復号化する。そのような復号化は、D’7で実施された乗算の結果を使用する。
【0168】
ステップD’8の終了時には、復号化モードMDc=インターで復号化されたBcのピクセルを表す信号SIG2が生成される。
【0169】
D’9では、加算器ADにおいて、信号SIG1と信号SIG2が加えられ、Bc全体の再構築されたピクセルを含む再構築された現在のピクセルセットBc
decが生成される。
【0170】
従って、MDc(x,y)がゼロに近い場合は、予測BPc(x,y)が優勢である。
【0171】
それに対して、MDc(x,y)が1に近い場合は、BPc(x,y)に加えて搬送された差信号SIG2を使用して、再構築された信号Bc
decが形成される。
【0172】
図3A以降を参照して上記で開示されている実施形態では、少なくとも1つの符号化モードを決定するための方法において、2つの参照ピクセルセットBR
0、BR
1が使用される。
【0173】
これらの実施形態は、3つ以上の参照ピクセルセットに拡大することができる。この目的のため、
図3Bを参照して説明されるニューラルネットワークRNC1は、符号化モードMC
c又は復号化モードMD
cを得るために、3つの参照ピクセルセットBR
0、BR
1、BR
2又はそれ以上から訓練される。
【符号の説明】
【0174】
BR0、BR1、BR2 参照ピクセルセット
V0、V1 変位ベクトル
【国際調査報告】