IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オランジュの特許一覧

特表2024-510094画像符号化モードを決定するための方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-06
(54)【発明の名称】画像符号化モードを決定するための方法
(51)【国際特許分類】
   H04N 19/103 20140101AFI20240228BHJP
   H04N 19/136 20140101ALI20240228BHJP
   H04N 19/182 20140101ALI20240228BHJP
【FI】
H04N19/103
H04N19/136
H04N19/182
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023550088
(86)(22)【出願日】2022-02-15
(85)【翻訳文提出日】2023-08-24
(86)【国際出願番号】 FR2022050274
(87)【国際公開番号】W WO2022175626
(87)【国際公開日】2022-08-25
(31)【優先権主張番号】2101633
(32)【優先日】2021-02-19
(33)【優先権主張国・地域又は機関】FR
(81)【指定国・地域】
(71)【出願人】
【識別番号】591034154
【氏名又は名称】オランジュ
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ピエリック・フィリップ
(72)【発明者】
【氏名】テオ・ラデュネ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159ME01
5C159TA17
5C159TB10
5C159TC02
5C159TC11
5C159UA02
5C159UA05
(57)【要約】
本発明は、少なくとも1つの現在のピクセルセットの符号化又は復号化のために、少なくとも2つの符号化又は復号化モードから、少なくとも1つの符号化(MC)又は復号化(MD)モードを決定するための方法に関する。そのような決定は、少なくとも1つの符号化又は復号化モードが、少なくとも1つの参照ピクセルセット(BR)の解析(P1)から決定される(P2)ことを特徴とする。
【特許請求の範囲】
【請求項1】
少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード(MC)及び復号化モード(MD)のそれぞれを決定するための方法であって、前記少なくとも1つの符号化モード及び復号化モードのそれぞれが、既に復号化済みの参照画像に属する少なくとも1つの参照ピクセルセット(BR)の解析(P1)に基づいて決定される(P2)ことを特徴とする、方法。
【請求項2】
少なくとも1つの参照ピクセルセット(BR;BR、BR)の前記解析が、前記少なくとも1つの参照ピクセルセットの動き推定又はフィルタリングを実施する、請求項1に記載の決定方法。
【請求項3】
前記動き推定が、オプティカルフロー動き推定である、請求項2に記載の決定方法。
【請求項4】
前記少なくとも2つのモードの中からの単一のモードが、前記現在のピクセルセットの少なくとも1つのピクセルに対して決定され、1つ又は他のモードの前記決定が、前記セットの前記少なくとも1つのピクセルから少なくとも1つの他のピクセルまで様々である、請求項1に記載の決定方法。
【請求項5】
前記少なくとも2つのモードが、前記現在のピクセルセットの少なくとも1つのピクセルに対して組合せで決定される、請求項1に記載の決定方法。
【請求項6】
前記少なくとも1つのモードの前記決定が、前記現在のピクセルセットと少なくとも1つの参照ピクセルセットとの共同解析から得られる修正パラメータ(U’)によって修正される、請求項1~5のいずれか一項に記載の決定方法。
【請求項7】
少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するためのデバイス(DEMOD1;DEMOD2)であって、少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するように構成されたプロセッサを含む、デバイスにおいて、
前記少なくとも1つの符号化モード及び復号化モードのそれぞれが、既に復号化済みの参照画像に属する少なくとも1つの参照ピクセルセットの解析に基づいて決定されることを特徴とする、デバイス。
【請求項8】
ニューラルネットワーク(DEMOD2)を使用することを特徴とする、請求項7に記載の決定デバイス。
【請求項9】
コンピュータ上で実行された際に、請求項1~6のいずれか一項に記載の決定方法を実施するためのプログラムコード命令を含む、コンピュータプログラム。
【請求項10】
請求項9に記載のコンピュータプログラムの命令を含む、コンピュータ可読情報媒体。
【請求項11】
符号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを符号化するための方法であって、前記現在のピクセルセットが、少なくとも1つの符号化モードの決定に基づいて符号化される(C1~C4;C’1~C’15)、方法において、
前記少なくとも1つの符号化モードが、請求項1~6のいずれか一項に記載の決定方法に従って決定されることを特徴とする、方法。
【請求項12】
少なくとも1つの現在のピクセルセットを符号化するためのデバイス(COD1;COD2;COD3)であって、少なくとも1つの符号化モードの決定に基づいて前記現在のピクセルセットを符号化するように構成されたプロセッサを含む、符号化するためのデバイスにおいて、
前記符号化するためのデバイスが、請求項7又は請求項8に記載の少なくとも1つの符号化モードを決定するためのデバイスを含むことを特徴とする、デバイス。
【請求項13】
復号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを復号化するための方法であって、前記現在のピクセルセットが、少なくとも1つの復号化モードの決定に基づいて復号化される(D1~D5;D’1~D’9)、方法において、
前記少なくとも1つの復号化モードが、請求項1~6のいずれか一項に記載の決定方法に従って決定されることを特徴とする、方法。
【請求項14】
少なくとも1つの現在のピクセルセットを復号化するためのデバイス(DEC1;DEC2;DEC3)であって、少なくとも1つの復号化モードの決定に基づいて前記現在のピクセルセットを復号化するように構成されたプロセッサを含む、復号化するためのデバイスにおいて、
請求項7又は請求項8に記載の少なくとも1つの復号化モードを決定するためのデバイスを含むことを特徴とする、デバイス。
【請求項15】
コンピュータ上で実行されると請求項11に記載の符号化方法又は請求項13に記載の復号化方法を実施するためのプログラムコード命令を含む、コンピュータプログラム。
【請求項16】
請求項15に記載のコンピュータプログラムの命令を含む、コンピュータ可読情報媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的には画像処理の分野に関し、具体的にはディジタル画像及び一連のディジタル画像の符号化及び復号化に関する。
【0002】
ディジタル画像の符号化/復号化は特に、以下のものを含む少なくとも1つの映像系列から画像へ適用される:
- 同一カメラからの及び時間的連続な画像(2D符号化/復号化)、
- 様々な視野において配向された様々なカメラからの画像(3D符号化/復号化)、
- 対応テクスチャ及び深さ成分(3D符号化/復号化)、
- 等々。
【0003】
本発明は、2D又は3D画像の符号化/復号化に同様に適用される。
【0004】
本発明は、限定しないが特に、現在のAVC、HEVC及びVVC映像エンコーダ並びにそれらの拡張版(MVC、3D-AVC、MV-HEVC、3D-HEVCなど)において実施される映像符号化及び対応復号化へ適用され得る。
【背景技術】
【0005】
現在の映像エンコーダ(MPEG、AVC、HEVC、VVC、AV1など)は、映像系列のブロック的表現を使用する。画像は、再帰的に再び分割されることができるブロックへ分割される。次に、例えば、イントラ、インター、スキップ、マージモードなどの特定の符号化モードを使用して、各ブロックが符号化される。いくつかの画像は、他の過去又は将来の画像を参照することなく、例えば、イントラ符号化モード、IBC(「イントラブロックコピー」)符号化モードなどの符号化モードを使用して符号化される。他の画像は、当業者に周知の動き補償を使用して、1つ又は複数の符号化済みの/復号化済みの参照画像に関して符号化される。この時間符号化モードは、インター符号化モードと呼ばれる。
【0006】
オリジナルのブロックが予測によって減少したものに相当する残差ブロック(予測残差とも呼ばれる)は、各ブロックに対して符号化される。スキップ符号化モードの事例では、残差ブロックはゼロである。
【0007】
符号化予定の考慮中のブロックの場合、このブロックに対する複数のイントラ、インター、スキップ、マージなどの符号化モードは、最良の符号化モード(すなわち、例えば、データレート/歪みコストなどの既定の符号化性能基準に従って、考慮中のブロックの符号化を最適化するもの)を選択することを目的としてエンコーダ側で競合し、それらの符号化性能基準は、すなわち、オリジナルの画像と符号化された後にデコーダによって復号化される画像との間の歪みの尺度の比較、及び復号化命令の送信に必要なデータレートであり、さらには効率/複雑性における妥協でさえあるが、それらは当業者に周知の基準である。エンコーダは、デコーダがオリジナルのブロックを再構築できるように、最適な符号化モードに関連する符号化情報をデコーダに送信することに対する責任を有する。そのような情報は、ストリームにおいて、典型的にはバイナリ表現の形式で送信される。
【0008】
例えばピクセル間の位置の観点から、選択される符号化モードが正確であるほど残差のデータレートは低くなる。その一方で、より多くの情報(具体的には、形状の輪郭における)を送信する必要がある。
【0009】
復号化は、ストリームから読み取られた後に復号化される符号化情報に基づいて、また、デコーダ側で既に利用可能な(すなわち、前もって復号化されている)要素に基づいて、デコーダ側で行われる。
【0010】
既に利用可能なこれらの要素は、具体的には、
- 現在復号化されている画像の要素(例えば、イントラ又はIBC復号化モードが参照される)、
- 他の以前に復号化された画像からの要素(インター復号化モードが参照される)
である。
【0011】
これらの2つのタイプのイントラ及びインター符号化モードは、VVC規格(「次世代映像符号化」)に従って組み合わせることができる。CIIP(「インター予測とイントラ予測の組合せ」)を参照されたい。
【0012】
これらの予測技法によれば、エンコーダは、実行する最適なモードタイプをデコーダに信号伝達しなければならない。この情報は、各ブロックに対して搬送される。それにより、大量の情報がストリームに挿入されるおそれがあり、これは、データレートを制限するために最小化すべきものである。その結果、多くの詳細を含みテクスチャ感の高い画像において特に、精度が不足し得る。
【0013】
この精度の不足により、所定のデータレートに対して再構築された画像の品質が制限される。
【発明の概要】
【発明が解決しようとする課題】
【0014】
本発明の目的の1つは、現在のピクセルセットの符号化のために決定された符号化モードに関連する情報の信号伝達のコストの低減を支持して、先行技術からの符号化モードの決定を改善することによって、前述の先行技術の欠点を補うことである。
【課題を解決するための手段】
【0015】
この目的のため、本発明の対象の1つは、少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するための方法に関する。そのような決定方法は、上記少なくとも1つの符号化モード及び復号化モードのそれぞれが、少なくとも1つの参照ピクセルセットの解析に基づいて決定されることを特徴とする。
【0016】
本発明による、少なくとも1つの符号化モード(及び復号化モードのそれぞれ)を決定するためのそのような方法は、有利には、少なくとも2つの可能な符号化モード(及び復号化モードのそれぞれ)の中から、現在のピクセルセットの各ピクセルに適用するための1つ及び/又は複数の符号化モード(及び復号化モードのそれぞれ)を決定するために、1つ又は複数の参照ピクセルセット(言い換えれば、現在のピクセルセットの符号化又は復号化の時点で既に復号化済みの1つ又は複数のピクセルセット)にのみ依拠することを可能にする。この又はこれらの参照ピクセルセットは現在のピクセルセットの符号化(及び復号化のそれぞれ)の時点で利用可能であるため、この/これらの参照ピクセルセットの精度は、先行技術におけるブロック単位で動作するエンコーダ(及びデコーダのそれぞれ)とは異なり、各ピクセル位置に対して完全に分かっている。それにより、ブロックごとの符号化性能基準の演算に基づくものである先行技術で実施されるものより直接的であり、空間的に正確であることを理由に、現在のピクセルセットの各ピクセルに適用するための1つ又は複数の符号化(及び復号化のそれぞれ)モードの決定が改善される。
【0017】
従って、現在のピクセルセットに適用するための符号化(及び復号化のそれぞれ)モードは、より正確であり、画像の局所的なプロパティに、より良好に適応する。
【0018】
これにより、再構築された画像の品質が改善される。
【0019】
特定の一実施形態によれば、少なくとも2つのモードの中からの単一の符号化モード及び復号化モードのそれぞれは、現在のピクセルセットの少なくとも1つのピクセルに対して決定され、1つ又は他のモードの決定は、上記セットの上記少なくとも1つのピクセルから少なくとも1つの他のピクセルまで様々である。
【0020】
そのような実施形態は、有利には、高いピクセル精度で、先行技術からの符号化又は復号化モード(例えば、イントラ、スキップ、インターなど)の再利用を可能にする。
【0021】
別の特定の実施形態によれば、少なくとも2つの符号化モード及び復号化モードのそれぞれは、現在のピクセルセットの少なくとも1つのピクセルに対して組合せで決定される。
【0022】
そのような実施形態は、有利には、全く同じピクセルの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード(スキップ、イントラ、インターなど)(及び復号化モードのそれぞれ)を組み合わせられるようにすることが可能である。また、この実施形態は、ブロック効果のような不連続性を生み出すことなく、1つの符号化モード及び復号化モードのそれぞれから他のモードに徐々に変更できるようにすることも可能である。
【0023】
さらなる別の特定の実施形態によれば、上記少なくとも1つの符号化モード及び復号化モードのそれぞれの決定は、現在のピクセルセットの解析から得られる修正パラメータによって修正される。
【0024】
そのような実施形態は、有利には、1つ又は複数の参照ピクセルセットにおいて存在しなかった/予想できなかった要素を現在のピクセルセットが含む際は、上記少なくとも1つの符号化又は復号化モードの決定に補正を適用できるようにすることが可能である。
【0025】
様々な前述の実施形態又は実装形態の特徴は、互いに独立して又は組み合わせて、上記で定義される決定方法に追加することができる。
【0026】
また、本発明は、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するためのデバイスであって、少なくとも1つの現在のピクセルセットの符号化及び復号化のそれぞれのために、少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、少なくとも1つの符号化モード及び復号化モードのそれぞれを決定するように構成されたプロセッサを含む、デバイスにも関する。
【0027】
そのような決定デバイスは、上記少なくとも1つの符号化モード及び復号化モードのそれぞれが、少なくとも1つの参照ピクセルセットの解析に基づいて決定されることを特徴とする。
【0028】
特定の一実施形態では、決定デバイスは、ニューラルネットワークである。
【0029】
ニューラルネットワークの使用により、有利には、上記少なくとも1つの符号化モード及び復号化モードのそれぞれの決定の精度を最適化することが可能になる。
【0030】
そのような決定デバイスは、具体的には、前述の決定方法を実施することができる。
【0031】
また、本発明は、符号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを符号化するための方法であって、現在のピクセルセットが、少なくとも1つの符号化モードの決定に基づいて符号化される、方法にも関する。
【0032】
そのような符号化方法は、上記少なくとも1つの符号化モードが、本発明による前述の決定方法に従って決定されることを特徴とする。
【0033】
そのような符号化方法は、現在のピクセルセットを符号化するために使用される1つ及び/又は複数の符号化モードを示す1つ又は複数のインデックスの符号化を必要としないという点で、有利である。これは、現在のピクセルセットに対するこの又はこれらのモードインデックスをエンコーダがデコーダに送信する必要はないことを意味し、それにより、符号化モードの精選に関連して、画像の再構築におけるより良い品質を支持して、エンコーダとデコーダとの間で送信される情報の信号伝達のコストを低減することができる。
【0034】
また、本発明は、少なくとも1つの現在のピクセルセットを符号化するための符号化デバイス又はエンコーダであって、少なくとも1つの符号化モードの決定に基づいて現在のピクセルセットを符号化するように構成されたプロセッサを含む、符号化デバイス又はエンコーダにも関する。
【0035】
そのような符号化デバイスは、本発明による、少なくとも1つの符号化モードを決定するための前述のデバイスを含むことを特徴とする。
【0036】
そのような符号化デバイスは、具体的には、本発明による前述の符号化方法を実施することができる。
【0037】
また、本発明は、復号化デバイスによって実施される、少なくとも1つの現在のピクセルセットを復号化するための方法であって、現在のピクセルセットが、少なくとも1つの復号化モードの決定に基づいて復号化される、方法にも関する。
【0038】
そのような復号化方法は、上記少なくとも1つの復号化モードが、本発明による前述の決定方法に従って決定されることを特徴とする。
【0039】
そのような復号化方法の利点は、デコーダが、エンコーダから受信するデータ信号から特定の情報を読み取る必要なく、現在のピクセルセットを復号化するための少なくとも1つの復号化モードの決定が、1つ又は複数の利用可能な参照ピクセルセットに基づいて、デコーダによって自律的に実施されるという事実にある。
【0040】
また、本発明は、少なくとも1つの現在のピクセルセットを復号化するための復号化デバイス又はデコーダであって、少なくとも1つの復号化モードの決定に基づいて現在のピクセルセットを復号化するように構成されたプロセッサを含む、復号化デバイス又はデコーダにも関する。
【0041】
そのような復号化デバイスは、本発明による、少なくとも1つの復号化モードを決定するための前述のデバイスを含むことを特徴とする。
【0042】
そのような復号化デバイスは、具体的には、本発明による前述の復号化方法を実施することができる。
【0043】
また、本発明は、命令を含むコンピュータプログラムであって、上記プログラムが、プロセッサによって実行されると、上記で説明される特定の実施形態のいずれか1つに従って、本発明による決定方法及び同様に本発明による決定方法を組み込む符号化又は復号化方法を実施するための、コンピュータプログラムにも関する。
【0044】
そのような命令は、前述の決定方法を実施する決定デバイス、前述の符号化方法を実施するエンコーダ、前述の復号化方法を実施するデコーダの非一時的な記憶媒体に永続的に格納することができる。
【0045】
このプログラムは、任意のプログラミング言語を使用し得、ソースコード、オブジェクトコード、又はソースコードとオブジェクトコードとの間の中間コードの形式(部分的コンパイル形式など)、又は任意の他の望ましい形式のものであり得る。
【0046】
本発明はまた、上述のコンピュータプログラムの命令を含むコンピュータ可読記録媒体又は情報媒体を標的とする。
【0047】
記録媒体は、プログラムを格納することができる任意のエンティティ又はデバイスであり得る。例えば、媒体は、ROM(例えばCD-ROM、DVD-ROM、合成DNA(デオキシリボ核酸)など、又は超小形電子回路ROM)などの格納手段、そうでなければ磁気記録手段(例えばUSBキー、ハードディスク)を含み得る。
【0048】
さらに、記録媒体は、電気ケーブル又は光ケーブルを介し、又は無線により、又は他の手段により運ばれ得る電気信号又は光信号などの送信可能媒体であり得る。本発明によるプログラムは特に、インターネットなどのネットワークからダウンロードされ得る。
【0049】
代替的に、記録媒体は、プログラムが取り込まれる集積回路であり得、集積回路は、本発明による上述の決定方法、符号化方法、又は復号化方法を実行する又はその実行において使用されるように設計される。
【0050】
他の特徴及び利点は、図示例及び非限定的例並びに添付図面として与えられる本発明の特定実施形態を読むことから明白になる。
【図面の簡単な説明】
【0051】
図1】本発明による、少なくとも1つの符号化又は復号化モードを決定するための方法の主なステップを示す。
図2A】本発明の第1の特定の実施形態における、図1の決定方法で解析される参照ピクセルセットのタイプの1つを示す。
図2B】本発明の第2の特定の実施形態における、図1の決定方法で解析される参照ピクセルセットの別のタイプを示す。
図3A】第1の実施形態における、図1の決定方法を実施する決定デバイスを示す。
図3B】第2の実施形態における、図1の決定方法を実施する決定デバイスを示す。
図4図3Bの決定デバイスを訓練するための方法を概略的に示す。
図5A】2つの基準ピクセルセットに対する現在のピクセルセットの予測版の第1の例示的変位を示す。
図5B】2つの基準ピクセルセットに対する現在のピクセルセットの予測版の第2の例示的変位を示す。
図5C】2つの基準ピクセルセットに対する現在のピクセルセットの予測版の第3の例示的変位を示す。
図5D】本発明の一特定実施形態における図5Aの変位のタイプの場合に実施される動き補償を示す。
図5E】本発明の特定の一実施形態における、図5Dの動き補償の終了時に実施される、少なくとも1つの符号化モード及び復号化モードのそれぞれの決定を示す。
図6図3Aの決定デバイスによって実施される決定方法の特定のステップをさらに詳細に示す。
図7】本発明の特定の一実施形態における、図1の少なくとも1つの符号化モードを決定するための方法を実施する画像符号化方法の主なステップを示す。
図8A】第1の実施形態における、図7の符号化方法を実施するエンコーダを示す。
図8B】第2の実施形態における、図7の符号化方法を実施するエンコーダを示す。
図9】本発明の特定の一実施形態における、図1の少なくとも1つの復号化モードを決定するための方法を実施する画像復号化方法の主なステップを示す。
図10A】第1の実施形態における図9の復号化方法を実施するデコーダを示す。
図10B】第2の実施形態における図9の復号化方法を実施するデコーダを示す。
図11】本発明の一特定実施形態における、図1の符号化モードを決定するための方法の修正を実施する画像符号化方法の工程を示す。
図12】本発明の一特定実施形態における図11の符号化方法を実施するエンコーダを示す。
図13】本発明の一特定実施形態における、図1の復号化モードを決定するための方法の修正を実施する画像復号化方法の工程を示す。
図14】本発明の一特定実施形態における図13の復号化方法を実施するデコーダを示す。
【発明を実施するための形態】
【0052】
少なくとも1つの符号化又は復号化モードを決定するための方法の例示的な実装形態
発明の一般原理
少なくとも1つの符号化又は復号化モードを決定するための方法
以下では、2D又は3D画像の符号化及び復号化のそれぞれを視野に入れて、少なくとも1つの符号化又は復号化モードを決定するための方法の説明を提供し、上記決定方法は、例えば、AVC、HEVC、VVC規格及びそれらの拡張版(MVC、3D-AVC、MV-HEVC、3D-HEVCなど)又は同様のものに準拠するものなど、いかなるタイプの映像エンコーダ又はデコーダにおいても実施することができる(例えば、畳み込みニューラルネットワーク(又はCNN)など)。
【0053】
図1を参照すると、本発明による、少なくとも1つの符号化又は復号化モードを決定するための方法は、少なくとも1つの参照ピクセルセットBRを使用するが、参照ピクセルセットBRとは、すなわち、既に符号化済み及び復号化済みであり、従って、N個のピクセルp、p、…、p(N≧1)を含む現在のピクセルセットBの符号化及び復号化のそれぞれを行うために使用することを意図する上記少なくとも1つの符号化又は復号化モードを決定する時点で利用可能なものである。
【0054】
本発明の意味の範囲内では、現在のピクセルセットBは、
- オリジナルの現在の画像、
- オリジナルの現在の画像の部分又は領域、
- 標準化されたAVC、HEVC又はVVCエンコーダにおいて行われているものに沿ってこの画像のパーティション化から得られる現在の画像のブロック
を意味するものとして理解される。
【0055】
本発明によれば、図2Aに示されるように、参照ピクセルセットBRは、現在のピクセルセットBを含む現在の画像Iに属し得る。この事例では、現在のピクセルセットBに対する少なくとも1つの符号化モードMC(及び復号化モードMDのそれぞれ)は、この参照ピクセルセットBRに関して決定される。
【0056】
当然ながら、上記少なくとも1つの符号化モードMC(及び復号化モードMDのそれぞれ)は、現在の画像Iに属する参照ピクセルセットBRに関して及び1つ又は複数の他の参照ピクセルセットに関して決定することができる。
【0057】
本発明によれば、図2Bに示されるように、参照ピクセルセットBRは、現在の画像Iに時間的に先行するか又はそれに続く、既に符号化済みの及び復号化済みの参照画像に属し得る。この事例では、現在のピクセルセットBに対する符号化モードMC(及び復号化モードMDのそれぞれ)は、参照ピクセルセットBRに関して決定される。示される例では、現在のピクセルセットBに対する符号化モードMC(及び復号化モードMDのそれぞれ)は、参照ピクセルセットBRに関して演算することができ、参照ピクセルセットBRは、例えば、直前の画像IRi-1に属するが、当然ながら、例えば、画像IRi+1、又は、符号化順番において現在の画像Iに先行する他の参照画像(すなわち、現在の画像Iの前の既に符号化済みの及び復号化済みの画像)など、別の参照画像に属することも可能である。示される例では、現在のピクセルセットBに対する符号化モードMC(及び復号化モードMDのそれぞれ)は、現在の画像Iに先行する参照画像に位置する参照ピクセルセットBRに関して及び現在の画像Iに続く参照画像に位置する少なくとも1つの他の参照ピクセルセットBRに関して演算することもできる。示される例では、参照ピクセルセットBRは、参照画像IRi-2に位置し、参照ピクセルセットBRは、参照画像IRi+1に位置する。参照画像に位置する参照ピクセルセットに関する少なくとも1つの符号化又は復号化モードのそのような決定のさらなる文脈では、図2Bに示されるように、現在のピクセルセットBに対する符号化モードMC(及び復号化モードMDのそれぞれ)は、2つの参照ピクセルセットBR、BRに関して演算することができ、その各々は、現在の画像Iに先行する参照画像に位置する。示される例では、参照ピクセルセットBRは、参照画像IRi-2に位置し、参照ピクセルセットBRは、参照画像IRi-1に位置する。
【0058】
当然ながら、現在のピクセルセットBに対する上記少なくとも1つの現在の符号化モードMC(及び復号化モードMDのそれぞれ)を演算するために、参照ピクセルセットBR及びBRと共に、1つ又は複数の他の参照ピクセルセットを使用することができる。
【0059】
図1を再び参照すると、本発明によるそのような決定方法は、以下を含む。
【0060】
P1では、現在のピクセルセットBの少なくとも1つの現在のピクセルp(1≦c≦N)に対して、上記少なくとも1つの参照ピクセルセットBRが解析される。そのようなステップは、具体的には、BRの位置、ある参照画像から別の参照画像へのBRの変位、BRの変位の間にオクルージョン領域が生じるかどうかなどを解析することを含む。
【0061】
P2では、BRの解析に基づいて、考慮中の少なくとも2つの符号化モードMC、MC及び復号化モードMD、MDのそれぞれの中から、符号化モードMC及び復号化モードMDのそれぞれが選択される。
【0062】
モードMC及びMDのそれぞれは、例えば、インターモードである。モードMC及びMDのそれぞれは、例えば、イントラモードである。その代替として、モードMC及びMDのそれぞれは、例えば、インターモードであり、モードMC及びMDのそれぞれは、例えば、スキップモードである。
【0063】
ステップP2の終了時には、符号化モードMC及び復号化モードMDのそれぞれが上記少なくとも1つの現在のピクセルpに対して決定される。
【0064】
次に、現在のピクセルセットBのN個のピクセルの各々に対して、P1~P2のステップが繰り返される。
【0065】
当然ながら、たった今説明した決定方法において、2つを超える符号化モード及び復号化モードのそれぞれを考慮することができる。例えば、決定の間、以下の3つの符号化又は復号化モードを考慮することができる:
- モードMC/MDはインターである、
- モードMC/MDはイントラである、
- モードMC/MDはスキップである。
【0066】
ステップP2の変形形態として、上記少なくとも1つの現在のピクセルpの符号化/復号化を行うために、少なくとも2つの符号化/復号化モードを組合せで決定することができる。例えば、Bの符号化/復号化を行うために、モードMC/MD=インターとMC/MD=イントラの組合せを決定することができる。別の例によれば、Bの符号化/復号化を行うために、モードMC/MD=インターとMC/MD=スキップの組合せを決定することができる。
【0067】
少なくとも1つの符号化又は復号化モードを決定するためのデバイスの例示的な実装形態
図3Aは、本発明の第1の実施形態による、図1に示される決定方法の実施に適した少なくとも1つの符号化又は復号化モードを決定するためのデバイスDMOD1を示す。
【0068】
この第1の実施形態によると、決定方法により行われる行為はコンピュータプログラム命令により実施される。この目的を達成するために、予測デバイスDMOD1は、コンピュータの従来のアーキテクチャを有し、特にメモリMEM_DM1と、例えばプロセッサPROC_DM1を備えメモリMEM_DM1内に格納されたコンピュータプログラムPG_DM1により駆動される処理ユニットUT_DM1とを含む。コンピュータプログラムPG_DM1は、プロセッサPROC_DM1により実行されると上述のような決定方法の行為を実施するための命令を含む。
【0069】
初期化時に、コンピュータプログラムPG_DM1のコード命令は例えば、プロセッサPROC_DM1により実行される前にRAMメモリ(示されない)内へロードされる。処理ユニットUT_DM1のプロセッサPROC_DM1は、特に上に説明された決定方法の行為をコンピュータプログラムPG_DM1の命令に従って実施する。
【0070】
決定デバイスは、入力E_DM1において、1つ又は複数の参照ピクセルセットBR、BRなどを受信し、利用可能な様々な符号化モードMC、MC及び復号化モードMD、MDのそれぞれを評価し、出力S_DM1において、現在のピクセルセットBの符号化又は復号化のそれぞれにおいて使用するために、符号化モードMC又は復号化モードMDを伝達する。
【0071】
図3Bは、本発明の第2の実施形態による、図1に示される決定方法の実施に適した少なくとも1つの符号化又は復号化モードを決定するためのデバイスDMOD2を示す。
【0072】
この第2の実施形態によれば、決定デバイスDMOD2は、例えば、畳み込みニューラルネットワーク、多層パーセプトロン、LSTM(「長・短期記憶」)など、RNC1として示されるニューラルネットワークであり、現在のピクセルセットBの各ピクセルに対する符号化モードMC又は復号化モードMDを出力側で伝達するために、入力側で受信した1つ又は複数の参照ピクセルセットBR、BRなどから、図1の決定方法のP1-P2のステップを共同で実施する。
【0073】
それ自体が知られている方法では、畳み込みニューラルネットワークRNC1は、一連の層のフィルタリング、非線形性及びスケーリング動作を行う。使用される各フィルタが畳み込みカーネルによってパラメータ化され、非線形性がパラメータ化される(ReLU、leaky ReLU、GDN(「一般化分割正規化」)など)。ニューラルネットワークRNC1は、例えば、D.Sun,et al.,“PWC-Net:CNNs for Optical Flow Using Pyramid,Warping,and Cost Volume”CVPR 2018という文献において説明されるタイプのものである。
【0074】
この事例では、ニューラルネットワークRNC1は、図4に示される方法で訓練することができる。
【0075】
この目的のため、ニューラルネットワークRNC1は、
- 場合により、BR、BRなどから現在符号化されている又は復号化されている現在のピクセルセットBへのそれぞれの動きを補間して予測ピクセルセットBPを得るために、1つ又は複数の変位ベクトルV、Vなどを推定すること
- 少なくとも2つの符号化モード及び復号化モードのそれぞれの中から、符号化モードMC及び復号化モードMDのそれぞれを推定すること
を狙いとして訓練することができる。
【0076】
符号化モードMC及び復号化モードMDのそれぞれは、少なくとも2つの値0又は1を取り、それは、例えば、
- インターモードとスキップモード、
- イントラモードとスキップモード、
- インターモードとイントラモード、
- その他
のそれぞれを表す。
【0077】
予備段階では、ネットワークRNC1は、図1からの動作P1-P2を行うために訓練される。例えば、ネットワークRNC1は、符号化予定の現在のピクセルセットBと、選択された少なくとも1つの符号化モードMC(及び復号化モードMDのそれぞれ)を適用した後に得られるピクセルセットBSとの間の二乗平均平方根誤差を最小化するために訓練され、それは、
- スキップモードに等しい動き補償を通じて得られた現在の予測ピクセルセットBP
- 並びに、現在の予測ピクセルセットBP及びBの現在のピクセルの値と現在の予測ピクセルセットBPのピクセルの値との差の残差信号特性(この残差信号は、量子化パラメータQPによって量子化され、次に、符号化される)を使用して得られたか又は得られなかった、再構築された現在のピクセルセットBD
から行われるものである。
【0078】
ネットワークRNC1は、訓練段階の間に、現在のピクセルセットBと共に多数の関連の参照ピクセルセットBR、BRなどを提示することによって、次に、符号化モードMC(及び復号化モードMDのそれぞれ)の選択に応じて、Bのピクセルと結果BSのピクセルとの間の平均二乗誤差を最小化するために、例えば、勾配降下アルゴリズムを使用して、ネットワークの重みを変更することによって、訓練される。
【0079】
この予備訓練段階の終了時には、ネットワークRNC1は、固定され、モード決定デバイスDMOD2における使用に適したものになっている。
【0080】
決定デバイスDEMOD1によって実施される、少なくとも1つの符号化/復号化モードを決定するための方法の実施形態
ここでは、図6及び図5A図5Eを参照して、図3Aの決定デバイスDEMOD1において現在のピクセルセットに対する少なくとも1つの符号化又は復号化モードが決定される一実施形態の説明を提供する。
【0081】
示される例では、少なくとも1つの符号化又は復号化モードを決定するために、2つの参照ピクセルセットBR及びBRが考慮される。
【0082】
この目的を達成するために、図6に示すように、少なくとも1つの基準ピクセルセットの解析P1は以下のことを含む:
P10において、BRとBRとの間の動き推定が計算される。このような工程は従来の動き探索工程(例えば変位ベクトルの推定など)を介し行われる。
【0083】
図5A~5Cは、この工程P10中に遭遇され得る2つの基準ピクセルセットBR,BRに対する現在のピクセルセットBの予測版BPの3つの異なる例示的変位をそれぞれ示す。図5A図5Cの例では、基準ピクセルセットBRとBRとの間の要素E(円により象徴化される)の変位は動きベクトルの場により表される。単純化のために、単一ベクトル(図5A図5CではV01で表され、点線で示される)が、示された例ではBRからBRへの要素Eの動きを説明するために示される(画像の他の部分に関する動きは零であると考えられる)。しかし、例えばオプティカルフロー動き推定の場合のように基準ピクセルセットBR~BRを表すピクセルの数と同数の動きベクトルが存在するということは言うまでもない。図5A図5Cに示さない別の例によると、BRからBRへの(反対方向)動きを説明するベクトルV10が計算される可能性がある。
【0084】
P10、P11(図6)において取得されたベクトルV01又はV10は、BRとBRに対し予測される現在のピクセルセットBの変位を推定することを含む。この推定は図5A図5Cに示され、ここでは、要素Eの変位は、現在のピクセルセットBが配置された時刻であるBR、BRが配置された時刻の以外の時刻に推定される。V01又はV10の計算に関し同じ記法を使用することにより:
- 単一ベクトルV(BRからBの予測位置への動きを説明する)がベクトルV01から計算される、
- BRからBの予測位置への動きを説明する単一ベクトルVがベクトルV01から計算される。
【0085】
現在のピクセルセットBがBRとBRとの間の時間的中間に配置される、図5Aの例では、現時点における要素Eの変位は、BRとBRとの間の変位の1/2(すなわちベクトルV01又はV10の1/2)に対応すると推定される。このような変位構成は、例えば図2Bと同じ表記法(BRが基準画像IRi-1に属し、BRは基準画像IRi+1に属する)を採用する場合に遭遇される。
【0086】
現在のピクセルセットBがBRよりBRに時間的により近くに配置される、図5Bの例では、現時点における要素Eの変位はBRとBRとの間の変位の1/2より短いと推定される。例えば、BRが基準画像IRi-1に属し、BRが基準画像IRi+2に属すれば、現時点における要素Eの変位はBRとBRとの間の変位の1/3(すなわちベクトルV01又はV10の1/3)に対応すると推定される。
【0087】
現在のピクセルセットBが時間的にBR(基準画像IRi-2に属する)に、次にBR(基準画像IRi-2に属する)の後に配置される、図5Cの例では、現時点における要素Eの変位はBRとBRとの間の変位の2倍(すなわちベクトルV01又はV10の2倍)と推定される。
【0088】
図6及び図5Dを参照すると、P12において、BR及びBRはそれぞれ、Bの2つの予測版(BRC及びBRCで表される)をそれぞれ生成するためにベクトルV、Vを使用することにより動き補償される。
【0089】
図5Dにおける図解により、ベクトルV、Vは、現時点における要素Eの変位がBRとBRとの間の変位の1/2(すなわちベクトルV01又はV10の1/2)に対応すると推定される例えば図5Aに示される動き構成に従って取得されたと考えられる。
【0090】
図5Dは以下のことを示す:
- 要素Eの補間された位置がベクトルVによるBRの要素Eの動き補償から生じるピクセルセットERCを含む右動き補償されたピクセルセットBRC、及び
- 要素Eの補間された位置がベクトルVによるBRの要素Eの動き補償から生じるピクセルセットERCを含む左動き補償されたピクセルセットBRC
【0091】
対照的に、ERCの部分Z及びERCの部分Zは、BRの要素E及びBRの要素Eの背後に配置される未知コンテンツに対応するので未定義である。しかし、図5Dに見られ得るように、部分ZはERC内に定義され、部分ZはERC内に定義される。
【0092】
図6及び図5Eを参照すると、現在のピクセルセットBの各ピクセルに対する少なくとも2つの符号化モードMC、MC又は復号化モードMD、MDのうちの1つの選択P2の説明が提供されている。図5Eは、現在のピクセルセットBの予測位置を示し、その予測位置は、要素Eの予測位置及び未定義部分Z、Zを示す。
【0093】
及びZの位置(x,y)に位置するピクセルが未知であることにより、それらは、P20において、第1の符号化モードMC(x,y)=インター及び復号化モードMD(x,y)=インターのそれぞれと関連付けられる。
【0094】
要素Eの予測位置(x,y)及びバックグラウンドAP(ハッチングによって表される)の予測位置(x,y)に位置するピクセルは、これらのピクセルが参照ピクセルセットBR、BRの各々において要素Eのピクセル及びバックグラウンドAPのピクセルとコヒーレントであるという点で、既知である。このため、P20では、これらのピクセルは、例えば、第2の符号化モードMC(x,y)=スキップ及び復号化モードMD(x,y)=スキップのそれぞれと関連付けられる。
【0095】
P21では、第1の符号化モードMC(x,y)=インター及び復号化モードMD(x,y)=インターのそれぞれは、任意の値(例えば、1)を取り、第2の符号化モードMC(x,y)=スキップ及び復号化モードMD(x,y)=スキップのそれぞれは、MC(x,y)/MD(x,y)のものとは異なる任意の値(例えば、0)を取る。
【0096】
ステップP21の終了時には、符号化モードMC及び復号化モードMDのそれぞれが決定され、現在のピクセルセットBの考慮中のピクセルに応じて、2つの異なる値0又は1を取る。
【0097】
変形形態として、
- Z及びZの位置に位置するピクセルは、P20において、第1の符号化モードMC(x,y)=イントラ及び復号化モードMD(x,y)=イントラのそれぞれと関連付けられ、
- 要素Eの予測位置に位置するピクセルは、P20において、第2の符号化モードMC(x,y)=インター及び復号化モードMD(x,y)=インターのそれぞれと関連付けられ、
- バックグラウンドAPに位置するピクセルは、P20において、第3の符号化モードMC(x,y)=スキップ及び復号化モードMD(x,y)=スキップのそれぞれと関連付けられる。
【0098】
P21では、
- 第1の符号化モードMC(x,y)=イントラ及び復号化モードMD(x,y)=イントラのそれぞれは、任意の値(例えば、1)を取り、
- 第2の符号化モードMC(x,y)=インター及び復号化モードMD(x,y)=インターのそれぞれは、MC(x,y)/MD(x,y)とは異なる任意の値(例えば、0)を取り、
- 第3の符号化モードMC(x,y)=スキップ及び復号化モードMD(x,y)=スキップのそれぞれは、MC(x,y)/MD(x,y)ともMC(x,y)/MD(x,y)とも異なる任意の値(例えば、2)を取る。
【0099】
ステップP21の終了時には、符号化モードMC及び復号化モードMDのそれぞれが決定され、現在のピクセルセットBの考慮中のピクセルに応じて、3つの異なる値0、1又は2を取る。
【0100】
画像符号化方法
一般原理
以下では、図7を参照して、図1を参照して説明した少なくとも1つの符号化モードMCの決定を実施する画像符号化方法の説明を提供する。
【0101】
そのような符号化方法は、以下を含む。
【0102】
C1では、図1に示されるそのP1-P2のステップにおける、少なくとも1つの符号化モードMCの決定が実施され、現在のピクセルセットBのN個のピクセルの各々に対する現在の符号化モードMCが生成される。
【0103】
C2では、どの符号化モードがBのどのサブピクセルセットSE、SE、SEなどと関連付けられているかを決定するために、テストが行われる。
【0104】
C20では、Bの符号化のために符号化モードMC=イントラが決定されたかどうかを決定するために、テストが行われる。
【0105】
応答が肯定(図7のY)の場合は、C30において、サブピクセルセットSEがイントラモードで符号化される。このステップの終了時には、従来方式で、使用されるイントラモードのインデックスが付けられて、残差ピクセルの符号化済みのサブセットSER codが生成される。
【0106】
応答が否定(図7のN)の場合は、C21において、Bの符号化のために符号化モードMC=インターが決定されたかどうかを決定するために、テストが行われる。
【0107】
応答が肯定(図7のY)の場合は、C31において、サブピクセルセットSEがインターモードで符号化される。このステップの終了時には、インターモードでのこの符号化の間に使用された動きベクトルV codと共に、残差ピクセルの符号化済みのサブセットSER codが生成される。
【0108】
応答が否定(図7のN)の場合は、C22において、Bの符号化のために符号化モードMC=スキップが決定されたかどうかを決定するために、テストが行われる。
【0109】
応答が肯定(図7のY)の場合は、C32において、サブピクセルセットSEがスキップモードで符号化される。このステップの終了時には、符号化済みの動きベクトルV codが生成される。このモードに対し、残差の演算及び符号化は行われない。第1の実施形態では、V cod=V codである。第2の実施形態では、V cod≠V codである。
【0110】
応答が否定(図7のN)の場合は、Bのピクセルのすべてに符号化モードMCが割り当てられるまで、Bの符号化のために別の符号化モードMCが決定されたかどうかに関する決定が続く。
【0111】
C4では、デコーダに送信できるように、符号化済みの動きベクトルV cod及びV codが、又は、V cod=V codの事例では、V codのみが、残差ピクセルの符号化済みのサブセットSER cod及びSER codからのデータと共に、トランスポートストリームFに書き込まれるが、デコーダについては、後の説明において説明する。書き込まれるこれらのデータは、B codとして示される符号化済みの現在のピクセルセットBに相当する。
【0112】
本発明によれば、そのような1つ又は複数の符号化モードは、有利には、符号化も、デコーダへの送信も行われない。
【0113】
サブピクセルセットSE(SE及びSEのそれぞれ)は、Bの少なくとも1つのピクセル、Bのピクセルの少なくとも1つの領域又はB全体に相当し得る。
【0114】
実施されるイントラ、インター及び/又はスキップ符号化動作は、従来方式であり、AVC、HEVC、VVC符号化又は同様のものに準拠する。
【0115】
たった今説明した符号化は、当然ながら、言及した3つの異なる符号化モード又は2つのみの異なる符号化モードの中から、ましてや、3つ以上の異なる符号化モードの中からでさえ、単一の符号化モードをBに適用することができる。
【0116】
エンコーダ例示的実装形態
図8Aは、本発明の第1の実施形態による図7に示す符号化方法を実施するために好適なエンコーダCOD1を示す。エンコーダCOD1は決定デバイスDEMOD1を含む。
【0117】
この第1の実施形態によると、符号化方法により行われる行為はコンピュータプログラム命令により実施される。そのために、符号化デバイスCOD1はコンピュータの従来のアーキテクチャを有しており、特に、メモリMEM_C1と、例えばプロセッサPROC_C1を備えた処理ユニットUT_C1であってメモリMEM_C1内に格納されたプログラムPG_C1をコンピュータにより駆動される処理ユニットUT_C1とを含む。コンピュータプログラムPG_C1は、プログラムがプロセッサPROC_C1により実行されると上述の符号化方法の行為を実施するための命令を含む。
【0118】
初期化時に、コンピュータプログラムPG_C1のコード命令は例えば、プロセッサPROC_C1により実行される前にRAMメモリ(示されない)内へロードされる。処理ユニットUT_C1のプロセッサPROC_C1は特に、上に説明された符号化方法の行為をコンピュータプログラムPG_C1の命令に従って実施する。
【0119】
エンコーダCOD1は、現在のピクセルセットBを入力E_C1において受信し、好適な通信インターフェース(示されない)を使用することによりデコーダへ送信されるトランスポートストリームFを出力S_C1において送出する。
【0120】
図8Bは、本発明の第2の実施形態による、図7に示される符号化方法の実施に適したエンコーダCOD2を示す。エンコーダCOD2は、前述の決定デバイスDEMOD2を含み、その次に、決定デバイスDEMOD2によって決定された1つ及び/又は複数の符号化モードMCと併せて現在のピクセルセットBを符号化する畳み込みニューラルネットワークRNC2を含む。そのようなネットワークRNC2は、例えば、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020という文献において説明されるタイプのものである。
【0121】
画像復号化方法
一般原理
以下では、図9を参照して、図1を参照して説明されるような少なくとも1つの復号化モードMDの決定を実施する画像復号化方法の説明を提供する。
【0122】
そのような復号化方法は、図7の画像符号化に対応する画像復号化を実施する。具体的には、上記少なくとも1つの復号化モードMDの決定は別として、復号化方法は、AVC、HEVC、VVC復号化又は同様のものに準拠する従来の復号化ステップを実施する。
【0123】
復号化方法は、以下を含む。
【0124】
D1では、受信されたトランスポートストリームFから、従来方式で、Bと関連付けられた符号化済みのデータが抽出され、データは、示される例では、
- 残差ピクセルの符号化済みのサブセットSER cod及びそのイントラモードインデックス(実施されたのが図7のイントラ符号化C30である場合)
- 残差ピクセルの符号化済みのサブセットSER cod、及び、場合により、V cod≠V codの事例では、符号化済みの動きベクトルV cod(実施されたのが図7のインター符号化C31である場合)
- 符号化済みの動きベクトルV cod(実施されたのが図7のスキップ符号化C32である場合)
である。
【0125】
これらのデータは、符号化済みの現在のピクセルセットB codに相当する。
【0126】
D2では、図1に示されるそのP1-P2のステップにおける、少なくとも1つの復号化モードMDの決定が実施され、符号化済みの現在のピクセルセットB codのN個のピクセルの各々に対する現在の復号化モードMDが生成される。
【0127】
D3では、どの復号化モードがBのどの符号化済みのサブピクセルセットSE cod、SE cod、SE codなどと関連付けられているかを決定するために、テストが行われる。
【0128】
D30では、B codの復号化のために復号化モードMD=イントラが決定されたかどうかを決定するために、テストが行われる。
【0129】
応答が肯定(図9のY)の場合は、D40において、サブピクセルセットSEがイントラモードで復号化される。このステップの終了時には、復号化済みのサブピクセルセットSE decが生成される。
【0130】
応答が否定(図9のN)の場合は、D31において、B codの復号化のために復号化モードMD=インターが決定されたかどうかを決定するために、テストが行われる。
【0131】
応答が肯定(図9のY)の場合は、D41において、V cod≠V codの場合は、V codの復号化から得られる動きベクトルV decを使用して、及び、V cod=V codの場合は、V codの復号化から得られる動きベクトルV decを使用して、サブピクセルセットSEがインターモードで復号化される。このステップの終了時には、復号化済みのサブピクセルセットSE decが生成される。
【0132】
応答が否定(図9のN)の場合は、D32において、B codの復号化のために復号化モードMD=スキップが決定されたかどうかを決定するために、テストが行われる。
【0133】
応答が肯定(図9のY)の場合は、D42において、サブピクセルセットSEがスキップモードで復号化される。このステップの終了時には、復号化済みの動きベクトルV decを使用して復号化済みのサブピクセルセットSE decが生成される。
【0134】
応答が否定(図9のN)の場合は、Bの符号化済みのピクセルのすべてに復号化モードMDが割り当てられるまで、Bの復号化のために別の復号化モードMDが決定されたかどうかに関する決定が続く。
【0135】
D5では、復号化済みのサブピクセルセットSE dec、SE dec、SE decが連結される。ステップD5の終了時には、再構築された現在のピクセルセットB decが生成される。
【0136】
本発明によれば、そのような1つ又は複数の復号化モードは、有利には、デコーダ側で自律的に決定される。
【0137】
実施されるイントラ、インター及び/又はスキップ復号化動作は、従来方式であり、AVC、HEVC、VVC符号化又は同様のものに準拠する。
【0138】
今説明した復号化は、当然ながら、言及した3つの異なる復号化モード又は2つのみの異なる復号化モードの中から、ましてや、3つ以上の異なる復号化モードの中からでさえ、単一の復号化モードを考慮中の符号化済みのピクセルセット(ここでは、B cod)に適用することができる。1つ又は複数の復号化モードの適用は、考慮中の1つの符号化済みのピクセルセットから別の符号化済みのピクセルセットまで様々である。
【0139】
それ自体が知られている方法では、再構築された現在のピクセルセットB decは、場合により、当業者に周知のループフィルタによるフィルタリングが行われ得る。
【0140】
デコーダ例示的実装形態
図10Aは、本発明の第1の実施形態による図9に示す復号化方法を実施するために好適なデコーダDEC1を示す。デコーダDEC1は決定デバイスDEMOD1を含む。
【0141】
この第1の実施形態によると、復号化方法により行われる行為はコンピュータプログラム命令により実施される。この目的を達成するために、デコーダDEC1は、コンピュータの従来のアーキテクチャを有しており、特に、メモリMEM_D1と、例えばプロセッサPROD_D1を備えた処理ユニットUT_D1であってメモリMEM_D1内に格納されたプログラムPG_D1をコンピュータにより駆動される処理ユニットUT_D1とを含む。コンピュータプログラムPG_D1は、プログラムがプロセッサPROC_D1により実行されると上述の復号化方法の行為を実施するための命令を含む。
【0142】
初期化時に、コンピュータプログラムPG_D1のコード命令は例えば、プロセッサPROC_D1により実行される前にRAMメモリ(示されない)内へロードされ得る。処理ユニットUT_D1のプロセッサPROC_D1は特に、図9に関連して上に説明された復号化方法の行為をコンピュータプログラムPG_D1の命令に従って実施する。
【0143】
デコーダDEC1は、図8AのエンコーダCOD1により送信されたトランスポートストリームFを入力E_D1において受信し、現在の復号化されたピクセルセットB decを出力S_D1において送出する。
【0144】
図10Bは、本発明の第2の実施形態による、図9に示される復号化方法の実施に適したデコーダDEC2を示す。デコーダDEC2は、前述の決定デバイスDEMOD2を含み、その次に、例えば、決定デバイスDEMOD2によって生成された復号化モードMDと併せて現在の符号化済みのピクセルセットB codを復号化する畳み込みニューラルネットワークRNC3を含む。そのようなネットワークRNC3は、例えば、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020という文献において説明されるタイプのものである。
【0145】
少なくとも1つの符号化又は復号化モードを決定するための方法の変形形態
ここでは、図11及び図12を参照して、図1に示されるような少なくとも1つの符号化モードを決定するための方法の一変形形態の説明を提供する。そのような変形形態は、エンコーダCOD3において実施される。
【0146】
そのような変形形態は、得られた符号化又は復号化モードの精度/品質が十分ではない際における、図1の少なくとも1つの符号化又は復号化モードの決定の改善を目的とする。
【0147】
この目的を達成するために、エンコーダ側では、図11に示すように、C’1において、前記少なくとも1つの基準ピクセルセットBRは現在のピクセルセットBと共に解析される。例えば、2つの基準ピクセルセットBR及びBRがBと共に解析される。示された例では、BRは、時間的にBの前に配置され、BRは時間的にBの後に配置される。
【0148】
図12に示すように、解析C’1は、非特許文献Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020に説明されるように、2つの基準ピクセルセットBR及びBRから並びに現在のピクセルセットBから、一定数の層(例えば畳み込みフィルタ(CNN)を実施する層など)、続いて非線形及び間引きを実施する層を介した変換を生成する畳み込みニューラルネットワークRNC4を使用することにより実施される。
【0149】
工程C’1の終わりに、一組の潜在的変数が信号U’の形式で取得される。
【0150】
信号U’は、量子化器QUANT1(例えば量子化パラメータにより制御される一様な又はベクトル量子化器)によりC’2において量子化される。次に、量子化信号U’が取得される。
【0151】
C’3において、量子化信号U’は、判断された統計量共にエントロピエンコーダCE1(例えば算術型の)を使用することにより符号化される。この統計量は例えば、統計の確率によりパラメータ化される(例えばラプラス則の分散及び平均(σ,μ)をモデル化することにより、又はそうでなければ、BalleによりICLR 2018会議において開示された非特許文献“Variational image compression with a scale hyperprior”におけるようにhyperpriorを考慮することにより)。次に、符号化された量子化信号U’ codが取得される。
【0152】
C’4において、符号化された量子化信号U’ codは、デコーダDEC3(図14に示す)へ送信されるトランスポートストリームF’に書き込まれる。
【0153】
示される例では、符号化済みの量子化された信号U’ codに含まれるデータは、図1を参照して上記で説明されるように決定されるような符号化モードMCと関連付けられた情報を表す。ここで説明される実施形態では、MCは、スキップ符号化モードの使用を示すために、0に設定され、インター符号化モードの使用を示すために、1に設定される。
【0154】
この目的のため、ネットワークRNC4は、MCの0と1との間の値の重み付けの連続性を提供するために訓練されている。
【0155】
符号化の間、エンコーダCOD3は、C’10において、参照ピクセルセットBR、BR及び動きベクトルV、Vを使用する動き補償を実行することによって、符号化予定のピクセルセットBを予測する。ベクトルV、Vは、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020において説明されるような「MOFNEt」ニューラルネットワークから導き出すことができる。これにより、BP(x,y)と呼ばれるBの予測が得られる。予測C’10は、ニューラルネットワークRNC41を使用して実施される。
【0156】
C’11では、図12に示される乗算器MU1を使用して、B及びBP(x,y)に0と1との間のモード値M(x,y)がピクセル単位で乗じられる。この動作の終了時には、C’12において、ニューラルネットワークRNC42を通過した後のこれらの2つの重み付け入力を表す信号U”が得られる。C’13では、量子化器QUANT2によって信号U”が量子化され、量子化された信号U”が生成される。次に、量子化された信号U”は、C’14において、エントロピエンコーダCE2によって符号化され、符号化済みの量子化された信号U” codが生成される。ステップC’13及びC’14は、符号化済みの量子化された信号U” codを生成するために、前述の参考文献によるニューラルネットワークに基づいてエンコーダにおいて実施される。
【0157】
C’15では、符号化済みの量子化された信号U” codがトランスポートストリームF”に書き込まれ、図14に示されるようなデコーダDEC3に送信される。
【0158】
次に、デコーダDEC3において実施される図1に示す復号化モードを決定するための方法の一変形形態の説明が図13及び図14を参照して与えられる。
【0159】
この目的を達成するために、デコーダ側では、図13に示すように、D’1において、少なくとも1つの基準ピクセルセットBRが解析される(示された例では2組の基準ピクセルBR及びBR)。このような解析はニューラルネットワークRNC1を使用することにより図1の工程P1において行われるものと同一である。この工程の終わりに、V、Vなど及びMDなどを表す潜在空間Uが取得される。
【0160】
ストリームF’の受信に続いて、D’2において、エントロピー復号化が、図12のエントロピエンコーダCE1に対応するエントロピデコーダDE1を使用することにより、(同じ判断された統計量(ラプラス法の分散及び平均(σ、μ)のモデル化など)を有する)符号化された量子化信号U’ codに対して行われる。復号化された量子化信号U’はこの操作の終わりに取得される。
【0161】
D’3において、復号化された量子化信号U’は、図14のニューラルネットワークRNC1により取得された潜在空間Uであって基準ピクセルセットBR及びBRだけの解析を表す潜在空間Uと連結される。
【0162】
次に、ニューラルネットワークRNC1は、D’4において、再構築のために符号化済みの現在のピクセルセットB codに適用される復号化モードMDの0と1の連続性の値と共に、動き情報V、Vなどを推定するために、図1のステップP2と同じ方法で、様々な層を通じて、この連結を処理する。
【0163】
ここで説明される実施形態では、図11の符号化方法で決定及び使用された符号化モードMCに従って、MDは、スキップ復号化モードの使用を示すために、0に設定され、インター復号化モードの使用を示すために、1に設定される。
【0164】
前述のタイプのニューラルネットワークRNC5は、現在のピクセルセットを再構築して、再構築されたピクセルセットB decを生成するために、入力側でこの情報を受信する。そのようなネットワークRNC5は、例えば、Ladune“Optical Flow and Mode Selection for Learning-based Video Coding”,IEEE MMSP 2020という文献において説明されるタイプのものである。この目的のため、ニューラルネットワークRNC5は、ニューラルネットワークRNC50を含み、ニューラルネットワークRNC50は、D’5において、ネットワークRNC1によって伝達される動き情報V、Vなどから及び参照ピクセルセットBR、BRなどから現在の予測ピクセルセットBP(x,y)を演算する。
【0165】
D’6では、図14に示される乗算器MU2において、BP(x,y)に(1-MD(x,y))がピクセルごとに乗じられる。この動作の終了時には、復号化モードMD=スキップで復号化されたBのピクセルを表す信号SIGが得られる。
【0166】
D’7では、図14に示される乗算器MU3において、BP(x,y)にMD(x,y)がピクセルごとに乗じられる。
【0167】
続けて図13及び図14を参照すると、ニューラルネットワークRNC5は、ニューラルネットワークRNC51も含み、ニューラルネットワークRNC51は、C’14においてエンコーダCOD3によって生成されたフローF”(図11及び図12を参照)の受信に続いて、D’8において、図12のエンコーダCOD3によって実施されるような符号化モードMCによって重み付けされた予測から生じたピクセル残差に相当する符号化済みの量子化された信号U” codをエントロピー復号化する。そのような復号化は、D’7で実施された乗算の結果を使用する。
【0168】
ステップD’8の終了時には、復号化モードMD=インターで復号化されたBのピクセルを表す信号SIGが生成される。
【0169】
D’9では、加算器ADにおいて、信号SIG1と信号SIG2が加えられ、B全体の再構築されたピクセルを含む再構築された現在のピクセルセットB decが生成される。
【0170】
従って、MD(x,y)がゼロに近い場合は、予測BP(x,y)が優勢である。
【0171】
それに対して、MD(x,y)が1に近い場合は、BP(x,y)に加えて搬送された差信号SIGを使用して、再構築された信号B decが形成される。
【0172】
図3A以降を参照して上記で開示されている実施形態では、少なくとも1つの符号化モードを決定するための方法において、2つの参照ピクセルセットBR、BRが使用される。
【0173】
これらの実施形態は、3つ以上の参照ピクセルセットに拡大することができる。この目的のため、図3Bを参照して説明されるニューラルネットワークRNC1は、符号化モードMC又は復号化モードMDを得るために、3つの参照ピクセルセットBR、BR、BR又はそれ以上から訓練される。
【符号の説明】
【0174】
BR、BR、BR 参照ピクセルセット
、V 変位ベクトル
図1
図2A
図2B
図3A
図3B
図4
図5A
図5B
図5C
図5D
図5E
図6
図7
図8A
図8B
図9
図10A
図10B
図11
図12
図13
図14
【国際調査報告】