IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グァンドン オッポ モバイル テレコミュニケーションズ コーポレーション リミテッドの特許一覧

特表2022-526107フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体
<>
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図1
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図2
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図3
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図4
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図5
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図6A
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図6B
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図7
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図8
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図9
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図10
  • 特表-フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-05-23
(54)【発明の名称】フィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体
(51)【国際特許分類】
   H04N 19/117 20140101AFI20220516BHJP
   H04N 19/85 20140101ALI20220516BHJP
   H04N 19/186 20140101ALI20220516BHJP
【FI】
H04N19/117
H04N19/85
H04N19/186
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021556289
(86)(22)【出願日】2019-09-05
(85)【翻訳文提出日】2021-09-16
(86)【国際出願番号】 CN2019104499
(87)【国際公開番号】W WO2020192020
(87)【国際公開日】2020-10-01
(31)【優先権主張番号】62/822,951
(32)【優先日】2019-03-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】516227559
【氏名又は名称】オッポ広東移動通信有限公司
【氏名又は名称原語表記】GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., LTD.
【住所又は居所原語表記】No. 18 Haibin Road,Wusha, Chang’an,Dongguan, Guangdong 523860 China
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100152205
【弁理士】
【氏名又は名称】吉田 昌司
(74)【代理人】
【識別番号】100137523
【弁理士】
【氏名又は名称】出口 智也
(74)【代理人】
【識別番号】100096921
【弁理士】
【氏名又は名称】吉元 弘
(72)【発明者】
【氏名】マー、イェンチュオ
(72)【発明者】
【氏名】ワン、シューアイ
(72)【発明者】
【氏名】フオ、チュンイェン
(72)【発明者】
【氏名】チャン、ウェイ
(72)【発明者】
【氏名】ワン、ミンツォー
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159KK03
5C159LA00
5C159LB05
5C159LC09
5C159MA04
5C159MA05
5C159MA21
5C159MC11
5C159ME01
5C159ME11
5C159PP16
5C159TA68
5C159TB08
5C159TC11
5C159TC26
5C159TC28
5C159UA11
5C159UA16
(57)【要約】
本願の実施例はフィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体を開示し、該方法は、フィルタリング対象画素情報を取得することと、少なくとも1種類の辺情報を取得することと、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得することと、を含む。本願の実施例は更にフィルタリング装置、エンコーダ及びコンピュータ記憶媒体を提供する。
【特許請求の範囲】
【請求項1】
フィルタリング方法であって、
フィルタリング対象画素情報を取得することと、
少なくとも1種類の辺情報を取得することと、
前記フィルタリング対象画素情報の少なくとも2種類の成分及び前記少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得することと、を含む、フィルタリング方法。
【請求項2】
前記フィルタリング対象画素情報の少なくとも2種類の成分及び前記少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得することは、
それぞれ前記少なくとも2種類の成分のうちの各成分を処理して、処理後の少なくとも2種類の成分を取得することと、
前記少なくとも1種類の辺情報及び前記処理後の少なくとも2種類の成分に基づいて融合処理して、前記フィルタリング対象画素情報の融合情報を取得することと、
前記融合情報を処理して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得することと、を含む、請求項1に記載の方法。
【請求項3】
それぞれ前記少なくとも2種類の成分のうちの各成分を処理して、処理後の少なくとも2種類の成分を取得することは、
それぞれ前記少なくとも2種類の成分のうちの各成分に対して成分処理を行って、前記処理後の少なくとも2種類の成分を取得することを含む、請求項2に記載の方法。
【請求項4】
各成分に対応する第1辺情報を取得した場合、それに対応して、それぞれ前記少なくとも2種類の成分のうちの各成分を処理して、処理後の少なくとも2種類の成分を取得することは、
それぞれ前記少なくとも2種類の成分のうちの各成分及び各成分に対応する第1辺情報を融合処理して、前記処理後の少なくとも2種類の成分を取得することを含み、
前記第1辺情報は少なくともブロック分割情報及び/又は量子化パラメータ情報を含む、請求項2に記載の方法。
【請求項5】
前記少なくとも1種類の辺情報及び前記処理後の少なくとも2種類の成分に基づいて融合処理して、前記フィルタリング対象画素情報の融合情報を取得することは、
前記処理後の少なくとも2種類の成分及び各成分に対応する第1辺情報を融合処理して、前記フィルタリング対象画素情報の融合情報を取得することを含む、請求項4に記載の方法。
【請求項6】
前記融合情報を処理して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得することは、
前記融合情報に対して連携処理及び分岐処理を行って、前記少なくとも2種類の成分のうちの少なくとも1種類の成分に対応する残差情報を取得することと、
前記少なくとも2種類の成分のうちの少なくとも1種類の成分と前記少なくとも1種類の成分に対応する残差情報を加算演算して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得することと、を含む、請求項2に記載の方法。
【請求項7】
各成分に対応する第2辺情報を取得した場合、それに対応して、それぞれ前記少なくとも2種類の成分のうちの各成分を処理して、処理後の少なくとも2種類の成分を取得することは、
それぞれ前記少なくとも2種類の成分のうちの各成分及び各成分に対応する第2辺情報を融合処理して、前記処理後の少なくとも2種類の成分を取得することを含み、
前記第2辺情報は前記第1辺情報と異なる、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記少なくとも1種類の辺情報及び前記処理後の少なくとも2種類の成分に基づいて融合処理して、前記フィルタリング対象画素情報の融合情報を取得することは、
前記処理後の少なくとも2種類の成分及び各成分に対応する第2辺情報を融合処理して、前記フィルタリング対象画素情報の融合情報を取得することを含む、請求項7に記載の方法。
【請求項9】
前記ニューラルネットワークの構造は少なくとも1つの連携処理段階及び1つの独立処理段階を含み、
前記連携処理段階において、すべての成分が一緒に処理され、
前記独立処理段階において、各成分が前記ニューラルネットワークの1つの独立した分岐において処理される、請求項1に記載の方法。
【請求項10】
フィルタリング装置であって、
フィルタリング対象画素情報を取得するように構成される第1取得モジュールと、
少なくとも1種類の辺情報を取得するように構成される第2取得モジュールと、
前記フィルタリング対象画素情報の少なくとも2種類の成分及び前記少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得するように構成される決定モジュールと、を備える、フィルタリング装置。
【請求項11】
エンコーダであって、
プロセッサと、前記プロセッサの実行可能命令が記憶される記憶媒体とを備え、前記記憶媒体が通信バスを介して操作の実行前記プロセッサに頼り、前記命令が前記プロセッサにより実行されるとき、上記請求項1~9のいずれか1項に記載のフィルタリング方法が実行される、エンコーダ。
【請求項12】
コンピュータ記憶媒体であって、
実行可能命令が記憶され、前記実行可能命令が1つ又は複数のプロセッサにより実行されるとき、前記プロセッサは前記請求項1~9のいずれか1項に記載のフィルタリング方法を実行する、コンピュータ記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願の実施例はビデオ画像処理技術分野に関し、特にフィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体に関する。
【背景技術】
【0002】
ビデオコーデックシステムにおいて、多くのビデオ符号化で採用されるのはブロック状符号化ユニット(CU、Coding Unit)に基づく混合符号化フレームワークであり、隣接するCUが異なる符号化パラメータ、例えば異なる変換過程、異なる量子化パラメータ(QP、Quantization Parameter)、異なる予測方式、異なる参照画像フレーム等を用い、且つ各CUに導入された誤差の大きさ及びその分布特性が互いに独立し、隣接するCU境界の不連続性によりブロッキング効果が発生するため、再構成画像の主観的及び客観的品質が影響され、ひいては後続の符号化/復号化の予測精度が影響される。
【0003】
そこで、符号化/復号化過程において、前処理フィルタはオリジナル画像を前処理することに用いられ、ビデオ解像度を低減することに用いられ、符号化して表示する必要のあるビデオ解像度がオリジナルビデオの解像度より低いため、より少ないビットで表示することができ、それにより全体の符号化効率を向上させることができ、後処理フィルタはインループフィルタリング後のビデオを処理して、ビデオを出力し、ビデオ解像度を向上させることに用いられる。前処理フィルタ及び後処理フィルタについては、現在、ニューラルネットワークに基づくフィルタは複数の基本ユニットで構成される場合が多く、ニューラルネットワークの入力はシングル入力又はマルチ入力であり、即ち、入力は1つの画像成分又は複数の画像成分であり、即ち従来の畳み込みニューラルネットワークの複雑性はより高く、且つ現在の畳み込みニューラルネットワーク(CNN、Convolutional Neural Network)フィルタは関連情報を十分に総合利用していないため、再構成画像の品質の向上が制限されてしまう。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本願の実施例はフィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体を提供し、ニューラルネットワークに基づくフィルタリング方法の複雑性を低減することができ、再構成画像の画像品質の向上に役立つ。
【課題を解決するための手段】
【0005】
本願の実施例の技術案は以下のように実現されることができる。
【0006】
第1態様では、本願の実施例はフィルタリング方法を提供し、前記方法は、
フィルタリング対象画素情報を取得することと、
少なくとも1種類の辺情報を取得することと、
前記フィルタリング対象画素情報の少なくとも2種類の成分及び前記少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得することと、を含む。
【0007】
第2態様では、本願の実施例はフィルタリング装置を提供し、前記フィルタリング装置は、
フィルタリング対象画素情報を取得するように構成される第1取得モジュールと、
少なくとも1種類の辺情報を取得するように構成される第2取得モジュールと、
前記フィルタリング対象画素情報の少なくとも2種類の成分及び前記少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、前記フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得するように構成される決定モジュールと、を備える。
【0008】
第3態様では、本願の実施例はエンコーダを提供し、前記エンコーダは、
プロセッサと、前記プロセッサの実行可能命令が記憶される記憶媒体とを備え、前記記憶媒体が通信バスを介して操作の実行前記プロセッサに頼り、前記命令が前記プロセッサにより実行されるとき、上記1つ又は複数の実施例に記載のフィルタリング方法が実行される。
【0009】
第4態様では、本願の実施例はコンピュータ記憶媒体を提供し、実行可能命令がそれに記憶され、前記実行可能命令が1つ又は複数のプロセッサにより実行されるとき、前記プロセッサは上記1つ又は複数の実施例に記載のフィルタリング方法を実行する。
【発明の効果】
【0010】
本願の実施例はフィルタリング方法、装置、エンコーダ及びコンピュータ記憶媒体を提供し、まず、フィルタリング装置はフィルタリング対象画素情報を取得し、少なくとも1種類の辺情報を取得し、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得する。即ち、本願の実施例では、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報を取得し、ニューラルネットワークに基づくフィルタに入力して処理し、フィルタリング過程において、少なくとも1種類の成分の辺情報を融合することにより、フィルタリング後の画素情報を取得する。そうすると、複数の種類の成分の間の関係を十分に利用するだけではなく、少なくとも2種類の成分に対して完全なネットワークフォワード計算を複数回行う必要があるという問題も効果的に回避し、ひいては計算複雑性を低減し、符号化率を節約し、符号化/復号化過程において前処理フィルタリング後に取得した画像及び後処理フィルタリング後に取得した画像の品質を向上させ、それにより再構成画像の品質を向上させる。
【図面の簡単な説明】
【0011】
図1図1は従来の符号化ブロック図の構造模式図である。
図2図2は従来の復号化ブロック図の構造模式図である。
図3図3は本願の実施例に係る選択可能なフィルタリング方法の模式的なフローチャートである。
図4図4は本願の実施例に係るブロック分割行列の構造模式図である。
図5図5は本願の実施例に係る従来のCNNフィルタの構造模式図である。
図6A図6Aは本願の実施例に係る他の従来のCNNフィルタの構造模式図である。
図6B図6Bは本願の実施例に係る更に他の従来のCNNフィルタの構成構造模式図である。
図7図7は本願の実施例に係る選択可能なフィルタリングフレームワークの構造模式図である。
図8図8は本願の実施例に係る他の選択可能なフィルタリングフレームワークの構造模式図である。
図9図9は本願の実施例に係る更に他の選択可能なフィルタリングフレームワークの構造模式図である。
図10図10は本願の実施例に係る選択可能なフィルタリング装置の構造模式図である。
図11図11は本願の実施例に係る選択可能なエンコーダの構造模式図である。
【発明を実施するための形態】
【0012】
本願の実施例の特徴及び技術的内容をより詳しく理解するために、以下に図面を参照しながら本願の実施例の実現を詳しく説明し、添付の図面は参照・説明のためのものに過ぎず、本願の実施例を限定するためのものではない。
【0013】
ビデオコーデックシステムにおいて、符号化対象ビデオはオリジナル画像フレームを含み、オリジナル画像フレームにオリジナル画像が含まれ、該オリジナル画像に対して様々な処理、例えば予測、変換、量子化、再構成及びフィルタリング等が行われ、これらの処理過程において、処理済みビデオ画像はオリジナル画像に対して画素値が既にオフセットされた可能性があり、それにより視覚障害又は虚像が生じてしまう。また、多くのビデオコーデックシステムで採用されるブロック状CUに基づく混合符号化フレームワークにおいて、隣接する符号化ブロックが異なる符号化パラメータ(例えば、異なる変換過程、異なるQP、異なる予測方式、異なる参照画像フレーム等)を用いるため、各符号化ブロックによる誤差の大きさ及びその分布特性の相互独立、隣接する符号化ブロックの境界の不連続性によってブロッキング効果が発生する。これらの歪みは再構成画像ブロックの主観的及び客観的品質に影響し、再構成画像ブロックが後続の符号化画素の参照画像とされれば、後続の符号化/復号化の予測精度にも影響し、更にビデオビットストリームにおけるビットのサイズに影響する。従って、再構成画像の主観的及び客観的品質を向上させるように、ビデオコーデックシステムに前処理フィルタ及び後処理フィルタが追加される場合が多い。
【0014】
図1は従来の符号化ブロック図の構造模式図である。図1に示すように、該従来の符号化ブロック図10は、変換及び量子化ユニット101、逆変換及び逆量子化ユニット102、予測ユニット103、インループフィルタリングユニット104、並びにエントロピー符号化ユニット105等の部材を含んでもよく、予測ユニット103は更にイントラ予測ユニット1031及びインター予測ユニット1032を含む。入力されたオリジナル画像については、初期分割によって符号化ツリーユニット(CTU、Coding Tree Unit)を取得することができ、1つのCTUに対して引き続きコンテンツ適応分割を行えば、CUを取得することができ、CUは一般的に1つ又は複数の符号化ブロック(CB、Coding Block)を含む。符号化ブロックに対してイントラ予測ユニット1031によるイントラ予測又はインター予測ユニット1032によるインター予測を行って、残差情報を取得することができる。該残差情報について変換及び量子化ユニット101によって該符号化ブロックに対して変換することは、残差情報を画素フィールドから変換フィールドに変換することと、ビットレートを更に減少させるために、取得された変換係数を量子化することと、を含む。予測モードを決定した後、予測ユニット103は更に、選択されたイントラ予測データ又はインター予測データをエントロピー符号化ユニット105に提供することに用いられる。また、逆変換及び逆量子化ユニット102は該符号化ブロックの再構築に使用され、画素フィールドにおいて残差ブロックを再構築し、該再構築された残差ブロックはインループフィルタリングユニット104によってブロッキング効果アーティファクトを除去し、次に、再構築された参照画像を生成するために、該再構築された残差ブロックを復号画像キャッシュユニットに追加する。エントロピー符号化ユニット105は様々な符号化パラメータ及び量子化後の変換係数を符号化することに用いられ、例えば、エントロピー符号化ユニット105はヘッダー情報符号化及びコンテキストベースの適応2値算術符号化(CABAC、Context-based Adaptive Binary Arithmatic Coding)アルゴリズムを用い、決定された予測モードを示す符号化情報を符号化して、対応のビットストリームを出力することに用いられてもよい。
【0015】
図1における従来の符号化ブロック図10において、インループフィルタリングユニット104はループフィルタであり、ループ内フィルタ(In-Loop Filter)とも称され、デブロッキングフィルタ(DBF、De-Blocking Filter)、サンプル適応オフセット(SAO、Sample Adaptive Offset)フィルタ及び適応ループフィルタ(ALF、Adaptive Loop Filter)等を含んでもよい。
【0016】
図1における従来の符号化ブロック図10において、前処理フィルタリングユニット106は入力されたオリジナルビデオフレームを受信して、オリジナルビデオフレームにおけるオリジナル画像フレームに対して前処理フィルタリングを行うことに用いられ、それによりビデオの解像度を低減し、後処理フィルタリングユニット107はインループフィルタリング後のビデオフレームを受信して、インループフィルタリング後のビデオフレームに対して後処理フィルタリングを行うことに用いられ、それによりビデオの解像度を向上させる。そうすると、ビデオの符号化/復号化過程において比較的に少ないビットで再構成ビデオフレームを取得することができ、それにより全体の符号化/復号化の効率を向上させることができる。ところが、現在、前処理フィルタ及び後処理フィルタのいずれでも採用されるニューラルネットワークの入力はシングル入力又はマルチ入力であり、即ち、1つの画像成分又は複数の画像成分を入力して、即ち従来の畳み込みニューラルネットワークの複雑性は比較的に高く、且つ現在のCNNフィルタは関連情報を十分に総合利用していないため、再構成画像の品質の向上が制限されてしまう。
【0017】
図1における符号化ブロック図に類似し、図2は従来の復号化ブロック図の構造模式図である。図2に示すように、該従来の復号化ブロック図20は、エントロピー符号化ユニット201、逆量子化及び逆変換ユニット202、予測ユニット203、インループフィルタリングユニット204、並びに後処理フィルタリングユニット205等の部材を含んでもよく、予測ユニット203は更にイントラ予測ユニット2031及びインター予測ユニット2032を含む。なお、ビデオ復号化過程はビデオ符号化過程と逆の過程であり、ビデオ復号化過程において取得された後処理フィルタリング後の画像を再構成ビデオフレームとして決定する。図2から分かるように、復号化過程においては符号化過程における前処理フィルタリングユニットに関わらない。
【0018】
本願の実施例はフィルタリング方法を提供し、該方法はフィルタリング装置に適用され、該フィルタリング装置はエンコーダの前処理フィルタ及び後処理フィルタに設置されてもよく、デコーダの後処理フィルタに設置されてもよく、ここで本願の実施例は具体的に限定しない。
【0019】
図3は本願の実施例に係る選択可能なフィルタリング方法の模式的なフローチャートである。図3に示すように、該フィルタリング方法は、
フィルタリング対象画素情報を取得するS301と、
少なくとも1種類の辺情報を取得するS302と、
フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得するS303と、を含んでもよい。
【0020】
上記フィルタリング対象画素情報とは画素値で示されるフィルタリング対象画像ブロックを指し、且つ該フィルタリング対象画像ブロックは3種類の画像成分を含み、上記少なくとも2種類の成分は3種類の画像成分のうちのいずれか2種類の画像成分又は3種類の画像成分であってもよく、画像成分は第1画像成分、第2画像成分及び第3画像成分を含んでもよい。本願の実施例は第1画像成分で輝度成分を示し、第2画像成分で第1色度成分を示し、第3画像成分で第2色度成分を示す場合を例として説明する。
【0021】
上記少なくとも1種類の辺情報は第1種類の画像成分に対応する辺情報、第2種類の画像成分に対応する辺情報、第3種類の画像成分の辺情報のうちの少なくとも1種類の辺情報であってもよい。
【0022】
なお、オリジナル画像フレームはCTUに分割されることができ、又はCTUによりCUに分割され、即ち、本願の実施例のブロック分割情報とはCTU分割情報を指してもよく、CU分割情報を指してもよい。そうすると、本願の実施例のフィルタリング方法はCUレベルの前処理フィルタリング又は後処理フィルタリングに適用できるだけではなく、CTUレベルの前処理フィルタリング又は後処理フィルタリングにも適用でき、本願の実施例は具体的に限定しない。
【0023】
フィルタリング対象画素情報は画素値で示される符号化対象ビデオにおけるオリジナル画像ブロックであり、又は、フィルタリング対象画素情報は画素値で示される符号化対象ビデオがビデオ符号化過程においてインループフィルタリング処理された後に取得した画像ブロックである。
【0024】
なお、符号化対象ビデオにおけるオリジナル画像に対してビデオ符号化を行う過程において、オリジナル画像に対してビデオ符号化処理を行うときには、CU分割、予測、変換及び量子化等の処理を行い、且つ、後続の符号化対象画像に対してビデオ符号化を行うための参照画像を取得するために、更に逆変換及び逆量子化、再構成並びにフィルタリング等の処理を行ってもよい。即ち、フィルタリング対象画素情報はエンコーダに入力されたばかりのオリジナル画像における画像ブロックであってもよく、これは前処理フィルタに適用される場合であり、インループフィルタリング処理後に取得したばかりの画像ブロックであってもよく、これは後処理フィルタに適用される場合であり、このようにして、フィルタリング対象画素情報を取得する。
【0025】
即ち、フィルタリング対象画素情報を取得した後、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報を取得することができる。
【0026】
なお、ビデオ画像において、一般的に第1画像成分、第2画像成分及び第3画像成分でオリジナル画像又はフィルタリング対象画像を示す。輝度-色度成分表示方法において、この3つの画像成分はそれぞれ1つの輝度成分、1つの青色色度(色差)成分及び1つの赤色色度(色差)成分であり、具体的に、輝度成分は一般的に符号Yで示され、青色色度成分は一般的に符号Cbで示されるが、Uで示されてもよく、赤色色度成分は一般的に符号Crで示されるが、Vで示されてもよい。
【0027】
本願の実施例では、少なくとも1種類の成分は第1画像成分、第2画像成分及び第3画像成分のうちの1種類又は複数の種類を示すが、少なくとも2種類の成分は第1画像成分、第2画像成分及び第3画像成分であってもよく、第1画像成分及び第2画像成分であってもよく、第1画像成分及び第3画像成分であってもよく、ひいては第2画像成分及び第3画像成分であってもよく、本願の実施例はいずれも具体的に限定しない。
【0028】
次世代のビデオ符号化標準(VVC、Versatile Video Coding)において、その対応のテストモデルはVVCテストモデル(VTM、VVC Test Model)である。VTMでテストを実施するとき、現在の標準テストシーケンスはYUVが4:2:0のフォーマットであることを用い、該フォーマットの符号化対象ビデオにおける各フレーム画像はいずれも3種類の成分、即ち1つの輝度成分Y並びに2つの色度成分U及びVで構成されてもよい。符号化対象ビデオにおけるオリジナル画像の高さがHであり、幅がWであると仮定すれば、第1画像成分に対応するサイズ情報はH×Wであり、第2画像成分又は第3画像成分に対応するサイズ情報はいずれも
【数1】
である。尚、本願の実施例はYUVが4:2:0のフォーマットであることを例として説明するが、本願の実施例のフィルタリング方法は他のサンプリングフォーマットにも適用できる。
【0029】
YUVが4:2:0のフォーマットであることを例として、第1画像成分と第2画像成分又は第3画像成分のサイズ情報が異なるため、第1画像成分及び/又は第2画像成分及び/又は第3画像成分をニューラルネットワークに基づくフィルタに一括で入力するために、この3種類の成分をサンプリング又は再構成処理する必要がある。それにより3種類の成分の空きフィールドサイズ情報を同じにする。
【0030】
いくつかの実施例では、高解像度の画像成分に対して画素再配列処理(ダウンサンプリング処理と称されてもよい)を行ってもよく、それにより3種類の成分の空きフィールドサイズ情報を同じにする。具体的に、S302の前に、更にフィルタリング対象画素情報の少なくとも2種類の成分に対して、高解像度の画像成分を選択して、高解像度の画像成分に対して画素再配列処理を行ってもよい。
【0031】
なお、オリジナル画像に含まれる3種類の成分について他の処理を行う前に、この3種類の成分はオリジナル画像成分である。第1画像成分が輝度成分、第2画像成分が第1色度成分、第3画像成分が第2色度成分である場合、高解像度の画像成分は第1画像成分であり、このとき、第1画像成分に対して画素再配列処理を行う必要がある。
【0032】
例示的に、2×2サイズのオリジナル画像を例として、それを4つのチャネルに変換し、即ち2×2×1のテンソルを1×1×4のテンソルに配列し、そうすると、オリジナル画像の第1画像成分のサイズ情報がH×Wである場合、フィルタリングする前に画素再配列処理によってそれを
【数2】
に変換することができる。第2画像成分及び第3画像成分のサイズ情報がいずれも
【数3】
であるため、3つの画像成分の空きフィールドサイズ情報を同じにすることができる。その後、画素再配列処理後の3つの画像成分をマージした後、
【数4】
に変換して前処理フィルタ又は後処理フィルタに入力する。
【0033】
いくつかの実施例では、更に低解像度の画像成分に対してアップサンプリング処理を行ってもよく、それにより3種類の成分の空きフィールドサイズ情報を同じにする。具体的に、フィルタリング対象画素情報の少なくとも2種類の成分に対して、低解像度の成分を選択して、低解像度の成分に対してアップサンプリング処理を行ってもよい。
【0034】
なお、高解像度の成分に対してサイズ情報の画素再配列処理(即ち、下向き調整)を行うことができる以外に、本願の実施例では、低解像度の成分に対してアップサンプリング処理(即ち、上向き調整)を行ってもよい。また、低解像度の成分に対して、アップサンプリング処理を行うことができるだけではなく、デコンボリューション処理を行うこともでき、ひいては超解像度処理等を行うこともできる。それらは処理効果が同じであり、本願の実施例は具体的に限定しない。
【0035】
更に、オリジナル画像に含まれる3種類の成分について他の処理を行う前に、この3種類の成分はオリジナル画像成分である。第1画像成分が輝度成分、第2画像成分が第1色度成分、第3画像成分が第2色度成分である場合、低解像度の画像成分は第2画像成分又は第3画像成分であり、このとき、第2画像成分又は第3画像成分に対してアップサンプリング処理を行う必要がある。
【0036】
例示的に、オリジナル画像の第2画像成分及び第3画像成分のサイズ情報がいずれも
【数5】
である場合、フィルタリングする前にアップサンプリング処理によってそれをH×Wに変換することができる。第1画像成分のサイズ情報がH×Wであるため、これで3つの画像成分の空きフィールドサイズ情報を同じにすることができ、そしてアップサンプリング処理後の第2画像成分及びアップサンプリング処理後の第3画像成分は第1画像成分の解像度と一致することになる。
【0037】
辺情報はフィルタリングを補助することに用いられてもよく、フィルタリング品質を向上させる。辺情報はブロック分割情報(例えば、CU分割情報及び/又はCTU分割情報)であってもよく、量子化パラメータ情報であってもよく、ひいては動きベクトル(MV、Motion Vector)情報、予測方向情報等であってもよい。これらの情報は独立して辺情報とされてもよく、任意に組み合わせて辺情報とされてもよく、例えば、ブロック分割情報が独立して辺情報とされ、又は、ブロック分割情報と量子化パラメータ情報が共同で辺情報とされ、又は、ブロック分割情報とMV情報が共同で辺情報とされる等のケースがあり、本願の実施例は具体的に限定しない。
【0038】
そうすると、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報を取得した後、少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して処理し、ここで、該処理は成分処理、融合処理、連携処理及び分岐処理等の処理方式を含んでもよく、本願の実施例は具体的に限定しない。
【0039】
ここに至ると、取得されたフィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報を入力値としてニューラルネットワークに基づくフィルタに入力すれば、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得することができる。
【0040】
ニューラルネットワークの構造は少なくとも1つの連携処理段階及び1つの独立処理段階を含み、連携処理段階においては、すべての成分が一緒に処理され、独立処理段階においては、各成分がニューラルネットワークの1つの独立した分岐において処理される。
【0041】
フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得するために、選択可能な実施例では、S303は、
それぞれ少なくとも2種類の成分のうちの各成分を処理して、処理後の少なくとも2種類の成分を取得するS3031と、
少なくとも1種類の辺情報及び処理後の少なくとも2種類の成分に基づいて融合処理して、フィルタリング対象画素情報の融合情報を取得するS3032と、
融合情報を処理して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得するS3033と、を含んでもよい。
【0042】
S3031において、該処理過程は分岐段階として見なされてもよく、それぞれ少なくとも2種類の成分を取得することに用いられ、融合情報は少なくとも、少なくとも2種類の成分を融合して取得した情報を含み、S3032については、該処理過程はマージ段階として見なされてもよく、少なくとも2種類の成分を融合することに用いられる。そうすると、本願の実施例はカスケード処理構造を用い、入力された複数の種類の成分を融合処理することにより、複数の種類の成分の間の関係を十分に利用するだけではなく、この複数の種類の成分に対して完全なネットワークフォワード計算を複数回行う必要があるという問題も効果的に回避し、これにより計算複雑性を低減し、符号化率を節約する。最後に、融合情報を処理して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得する。そうすると、融合情報によって更にフィルタリングを補助することができ、符号化/復号化過程におけるビデオ再構成画像の主観的及び客観的品質を向上させる。
【0043】
処理後の少なくとも2種類の成分を取得するために、選択可能な実施例では、S3031は、
それぞれ少なくとも2種類の成分のうちの各成分に対して成分処理を行って、処理後の少なくとも2種類の成分を取得することを含んでもよい。
【0044】
ここで、オリジナル画像ブロックのオリジナル画像成分YUVを取得し、Y、U及びVをそれぞれ処理して、フィルタリング対象画像ブロックのYUVを取得し、即ち、フィルタリング対象画像ブロックの少なくとも2種類の成分がYU、又はYV、又はUVであってもよいことが得られる。
【0045】
処理後の少なくとも2種類の成分を取得するために、選択可能な実施例では、各成分に対応する第1辺情報を取得した場合、それに対応して、S3031は、
それぞれ少なくとも2種類の成分のうちの各成分及び各成分に対応する第1辺情報を融合処理して、処理後の少なくとも2種類の成分を取得することを含んでもよく、
第1辺情報は少なくともブロック分割情報及び/又は量子化パラメータ情報を含む。
【0046】
理解されるように、第1辺情報はフィルタリングを補助し、フィルタリング品質を向上させることに用いられてもよい。第1辺情報はブロック分割情報(例えば、CU分割情報及び/又はCTU分割情報)であってもよく、量子化パラメータ情報であってもよく、ひいては動きベクトル(MV、Motion Vector)情報、予測方向情報等であってもよい。これらの情報は独立して第1辺情報とされてもよく、任意に組み合わせて第1辺情報とされてもよく、例えば、ブロック分割情報が独立して第1辺情報とされ、又は、ブロック分割情報と量子化パラメータ情報が共同で第1辺情報とされ、又は、ブロック分割情報とMV情報が共同で第1辺情報等とされる等のケースがあり、本願の実施例は具体的に限定しない。
【0047】
なお、S3031は第1分岐段階として見なされてもよい。そうすると、フィルタリング対象画素情報の少なくとも2種類の成分に対して、それぞれ成分処理(例えば、深層学習)を行うことができ、それにより処理後の少なくとも2種類の成分を取得することができる。また、更に各成分に対応する第1辺情報を対応の成分に追加することができ、それにより処理後の少なくとも2種類の成分を取得する。即ち、第1分岐段階において、第1辺情報を融合してもよく、第1辺情報を融合しなくてもよく、本願の実施例は具体的に限定しない。
【0048】
更に、いくつかの実施例では、CU分割情報をフィルタリング対象画素情報の各成分に対応するブロック分割情報とすることができ、CU分割情報に対して、CU境界に対応する各画素点位置で第1値を充填し、他の画素点位置で第2値を充填して、CU分割情報に対応する第1行列を取得し、第1値と第2値は異なり、第1行列をフィルタリング対象画素情報の各成分に対応するブロック分割情報とする。
【0049】
なお、第1値は予め設定された数値、アルファベット等であってもよく、第2値も予め設定された数値、アルファベット等であってもよく、第1値と第2値は異なり、例えば、第1値は2に設定されてもよく、第2値は1に設定されてもよいが、本願の実施例は具体的に限定しない。
【0050】
本願の実施例では、CU分割情報を第1辺情報としてフィルタリング対象画素情報のフィルタリング処理を補助することができる。即ち、符号化対象ビデオにおけるオリジナル画像に対してビデオ符号化を行う過程において、CU分割情報を十分に利用して、フィルタリング対象画素情報の少なくとも2種類の成分と融合した後にフィルタリングするように指導することができる。
【0051】
具体的に、CU分割情報を1つの符号化ユニットマップ(CUmap、Coding Unit Map)に変換し、且つ2次元行列、即ちCUmap行列、即ち本願の実施例の第1行列で示す。即ち、オリジナル画像の第1画像成分を例とし、それを複数のCUに分割することができ、各CU境界に対応する各画素点位置において第1値で充填し、他の画素点位置において第2値で充填し、そうすると、CU分割情報を示す第1行列を構築することができる。例示的に、図4は本願の実施例に係るブロック分割行列の構造模式図である。図4に示すように、該図が1つのCTUを示す場合、該CTUを9つのCUに分割することができる。第1値が2に設定され、第2値が1に設定されると仮定すれば、各CU境界に対応する各画素点位置において2で充填し、他の画素点位置において1で充填し、即ち、2で充填される画素点位置でCUの境界を示し、それによりCU分割情報、即ちフィルタリング対象画素情報の第1画像成分に対応する第1辺情報を決定することができる。
【0052】
更に、第1画像成分が輝度成分であり、第2画像成分と第3画像成分がいずれも色度成分である場合、第1画像成分のCU分割情報と第2画像成分又は第3画像成分のCU分割情報とは異なる可能性がある。従って、第1画像成分のCU分割情報と第2画像成分又は第3画像成分のCU分割情報とが異なる場合、それぞれフィルタリング対象画素情報の第1画像成分に対応するCU分割情報とフィルタリング対象画素情報の第2画像成分又は第3画像成分に対応するCU分割情報とを決定する必要があり、次に、それを第1辺情報として対応の第1画像成分又は第2画像成分又は第3画像成分に融合する。第1画像成分のCU分割情報と第2画像成分又は第3画像成分のCU分割情報とが同じである場合、第1画像成分又は第2画像成分又は第3画像成分のCU分割情報のみを決定してもよく、次に、決定されたCU分割情報を第1辺情報として対応の第1画像成分又は第2画像成分又は第3画像成分に融合する。そうすると、後に取得される少なくとも2種類の新しい成分を容易に融合することができ、それによってフィルタリング対象画素情報に対して前処理フィルタリング又は後処理フィルタリングを行うことができる。
【0053】
いくつかの実施例では、それぞれ各成分に対応する第1辺情報を決定することは、符号化対象ビデオにおけるオリジナル画像に基づいて、それぞれオリジナル画像ブロックの少なくとも2種類の成分のうちの各成分に対応する量子化パラメータを取得し、量子化パラメータをフィルタリング対象画素情報の各成分に対応する量子化パラメータ情報とすることであってもよい。
【0054】
更に、いくつかの実施例では、量子化パラメータをフィルタリング対象画素情報の各成分に対応する量子化パラメータ情報とすることは、それぞれオリジナル画像の各成分のサイズと同じ第2行列を構築し、第2行列における各画素点位置にいずれもオリジナル画像の各成分に対応する量子化パラメータの正規化値が充填され、第2行列をフィルタリング対象画素情報の各成分に対応する量子化パラメータ情報とすることであってもよい。
【0055】
なお、異なる量子化パラメータに対応するフィルタリング対象画素情報は、その歪み度が異なる。量子化パラメータ情報が融合されれば、フィルタリングネットワークは訓練過程においていかなる量子化パラメータを処理する機能を適応的に有することができる。
【0056】
本願の実施例では、更に量子化パラメータ情報を第1辺情報としてフィルタリング対象画像ブロックのフィルタリング処理を補助することができる。即ち、符号化対象ビデオにおけるオリジナル画像に対してビデオ符号化を行う過程において、量子化パラメータ情報を十分に利用して、それをフィルタリング対象画素情報の少なくとも2種類の成分と融合した後にフィルタリングするように指導することができる。量子化パラメータ情報は正規化処理を行ってもよく、量子化パラメータ情報は非正規化処理(例えば、分類処理、区間分割処理等)を行ってもよい。以下、量子化パラメータの正規化処理を例として詳しく説明する。
【0057】
具体的に、量子化パラメータ情報を、量子化パラメータ情報を示す第2行列に変換する。即ち、オリジナル画像の第1画像成分を例とし、オリジナル画像の第1画像成分のサイズと同じ行列を構築し、該行列における各画素点位置にいずれもオリジナル画像の第1画像成分に対応する量子化パラメータの正規化値が充填され、量子化パラメータの正規化値はQPmax(x,y)で示され、即ち、
【数6】
式(1)において、QPはオリジナル画像の第1画像成分に対応する量子化パラメータ値を示し、xはオリジナル画像の第1画像成分における各画素点位置の横座標値を示し、yはオリジナル画像の第1画像成分における各画素点位置の縦座標値を示し、QPmaxは量子化パラメータの最大値を示し、一般的に、QPmaxの値は51であるが、QPmaxは他の値、例えば29、31等であってもよく、本願の実施例は具体的に限定しない。
【0058】
処理後の少なくとも2種類の成分を取得するために、選択可能な実施例では、各成分に対応する第2辺情報を取得した場合、それに対応して、S3031は、
それぞれ少なくとも2種類の成分のうちの各成分及び各成分に対応する第2辺情報を融合処理して、処理後の少なくとも2種類の成分を取得することを含んでもよく、
第2辺情報は第1辺情報と異なる。
【0059】
フィルタリング対象画素情報の融合情報を取得するために、選択可能な実施例では、S3032は、
処理後の少なくとも2種類の成分及び各成分に対応する第1辺情報を融合処理して、フィルタリング対象画素情報の融合情報を取得することを含んでもよい。
【0060】
フィルタリング対象画素情報の融合情報を取得するために、選択可能な実施例では、S3032は、
処理後の少なくとも2種類の成分及び各成分に対応する第2辺情報を融合処理して、フィルタリング対象画素情報の融合情報を取得することを含んでもよい。
【0061】
なお、第1辺情報であるかそれとも第2辺情報であるかにかかわらず、いずれもフィルタリングを補助し、フィルタリング品質を向上させることに用いられてもよい。第1辺情報及び第2辺情報はブロック分割情報、量子化パラメータ情報、MV情報及び予測方向情報等のうちの1種類又は複数の種類であってもよく、即ち、第1辺情報がブロック分割情報である場合、第2辺情報は量子化パラメータ情報であってもよく、又は、第1辺情報が量子化パラメータ情報である場合、第2辺情報はブロック分割情報であってもよく、又は、第1辺情報がブロック分割情報及び量子化パラメータ情報である場合、第2辺情報はMV情報であってもよく、又は、第1辺情報がブロック分割情報である場合、第2辺情報は量子化パラメータ情報及びMV情報であってもよく、本願の実施例は具体的に限定しない。
【0062】
更に、第1辺情報と第2辺情報の融合段階は同じであってもよく、異なってもよい。第1分岐段階はそれぞれフィルタリング対象画素情報の少なくとも2種類の成分を取得することに対応する処理段階を示すことに用いられ、マージ段階はフィルタリング対象画素情報の融合情報を決定することに対応する処理段階を示すことに用いられ、第2分岐段階は融合処理後にそれぞれ各成分の残差情報を決定することに対応する処理段階を示すことに用いられると仮定する。この場合、第1辺情報の融合段階は第1分岐段階、マージ段階又は第2分岐段階のうちのいずれか1つであってもよく、第2辺情報の融合段階も第1分岐段階、マージ段階又は第2分岐段階のうちのいずれか1つであってもよく、即ち、第1辺情報の融合段階は第1分岐段階であってもよく、第2辺情報の融合段階はマージ段階であってもよく、又は、第1辺情報の融合段階はマージ段階であってもよく、第2辺情報の融合段階は第1分岐段階であってもよく、又は、第1辺情報の融合段階は第2分岐段階であってもよく、第2辺情報の融合段階はマージ段階であってもよく、又は、第1辺情報の融合段階は第1分岐段階であってもよく、第2辺情報の融合段階は第2分岐段階であってもよく、又は、第1辺情報の融合段階は第1分岐段階であってもよく、第2辺情報の融合段階も第1分岐段階であってもよく、又は、第1辺情報の融合段階はマージ段階であってもよく、第2辺情報の融合段階もマージ段階であってもよく、本願の実施例は具体的に限定しない。
【0063】
フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得するために、選択可能な実施例では、S3033は、
融合情報に対して連携処理及び分岐処理を行って、少なくとも2種類の成分のうちの少なくとも1種類の成分に対応する残差情報を取得することと、
少なくとも2種類の成分のうちの少なくとも1種類の成分と少なくとも1種類の成分に対応する残差情報を加算演算して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得することと、を含んでもよい。
【0064】
なお、本願の実施例の前処理フィルタリング又は後処理フィルタリングに採用されるのは複数段階のカスケード処理構造、例えば分岐-マージ-分岐処理構造、分岐-マージ処理構造、又はマージ-分岐処理構造等であり、本願の実施例は具体的に限定しない。
【0065】
具体的に、まずそれぞれフィルタリング対象画素情報の少なくとも2種類の成分を取得する必要があり、即ち第1分岐段階の必要があり、次に、少なくとも2種類の成分を融合する必要があり、即ちマージ段階の必要があり、そうすると、すべての情報が融合処理された後、複数の種類の成分、例えば第1画像成分、第2画像成分及び第3画像成分を同時に出力する必要がある場合、融合情報に対して連携処理を行うことにより、それぞれ第1画像成分に対応する残差情報、第2画像成分に対応する残差情報及び第3画像成分に対応する残差情報を取得し、次に、第1画像成分と第1画像成分に対応する残差情報を加算演算し、第2画像成分と第2画像成分に対応する残差情報を加算演算し、第3画像成分と第3画像成分に対応する残差情報を加算演算して、それぞれフィルタリング対象画素情報をフィルタリングした後の第1画像成分、フィルタリング対象画素情報をフィルタリングした後の第2画像成分及びフィルタリング対象画素情報をフィルタリングした後の第3画像成分を取得し、該処理過程は即ち第2分岐段階であり、そうすると、この前処理フィルタリング又は後処理フィルタリング過程全体は分岐-マージ-分岐処理構造を用いる。
まずフィルタリング対象画素情報の少なくとも2種類の成分を取得する必要があり、即ち第1分岐段階の必要があり、次に、少なくとも2種類の成分を融合する必要があり、即ちマージ段階の必要があり、そうすると、すべての情報が融合処理された後、1種類の成分のみ、例えば第1画像成分を出力する必要がある場合、融合情報に対して連携処理を行うことにより、第1画像成分に対応する残差情報を取得し、次に、第1画像成分と第1画像成分に対応する残差情報を加算演算して、フィルタリング対象画素情報をフィルタリングした後の第1画像成分を取得し、該処理過程に第2分岐段階が存在せず、そうすると、この前処理フィルタリング又は後処理フィルタリング過程全体は分岐-マージ処理構造を用いる。
【0066】
また、それぞれフィルタリング対象画素情報の少なくとも2種類の成分を取得する必要がなく、即ち第1分岐段階の必要がなければ、直接にフィルタリング対象画素情報の少なくとも2種類の成分を融合処理してもよく、即ち直接にマージ段階に入る。すべての情報が融合処理された後、複数の種類の成分を同時に出力する必要があるため、第2分岐段階が更に存在する必要があり、そうすると、この前処理フィルタリング又は後処理フィルタリング過程全体はマージ-分岐処理構造を用いる。
【0067】
更に、本願の実施例の前処理フィルタリング又は後処理フィルタリングは更に多くのカスケード処理構造、例えば分岐-マージ-分岐-マージ-分岐処理構造等を用いてもよい。これらのカスケード処理構造については、本願の実施例は代表的なカスケード構造、例えば分岐-マージ-分岐処理構造を用いてもよく、代表的なカスケード構造より少ないカスケード処理構造、例えば分岐-マージ処理構造又はマージ-分岐処理構造等を用いてもよく、ひいては代表的なカスケード構造より多いカスケード処理構造、例えば分岐-マージ-分岐-マージ-分岐処理構造等を用いてもよく、本願の実施例は具体的に限定しない。
【0068】
前処理フィルタ又は後処理フィルタは畳み込みニューラルネットワークフィルタを含んでもよい。
【0069】
なお、前処理フィルタ又は後処理フィルタは畳み込みニューラルネットワークフィルタであってもよく、深層学習により構築される他のフィルタであってもよく、本願の実施例は具体的に限定しない。ここで、畳み込みニューラルネットワークフィルタは、CNNフィルタとも称され、畳み込み計算を含んで深層構造を有するフィードフォワードニューラルネットワークであり、深層学習の代表的なアルゴリズムの1つである。CNNフィルタの入力層は多次元データ、例えば符号化対象ビデオにおけるオリジナル画像の3つの画像成分(Y/U/V)チャネルを処理することができる。
【0070】
図5は本願の実施例に係る従来のCNNフィルタの構造模式図である。図5に示すように、該従来のCNNフィルタ50は前世代のビデオ符号化標準H.265/高効率ビデオ符号化(HEVC、High Efficiency Video Coding)に基づいて改善されたものであり、2層の畳み込みネットワーク構造を含み、デブロッキングフィルタ及びサンプル適応オフセットフィルタを代替することができる。フィルタリング対象画像(Finで示される)を従来のCNNフィルタ50の入力層に入力した後、第1層の畳み込みネットワークF(畳み込みカーネルのサイズが3×3であり、64枚の特徴マップを含むと仮定する)及び第2層の畳み込みネットワークF(畳み込みカーネルのサイズが5×5であり、32枚の特徴マップを含むと仮定する)を通過した後、1つの残差情報Fを取得し、次に、フィルタリング対象画像Finと残差情報Fを加算演算して、最終的に該従来のCNNフィルタ50が出力したフィルタリング後の画像(Foutで示される)を取得する。該畳み込みネットワーク構造は残差ニューラルネットワークとも称され、フィルタリング対象画像に対応する残差情報を出力することに用いられる。該従来のCNNフィルタ60において、それぞれフィルタリング対象画像の3つの画像成分を独立して処理するが、同じフィルタリングネットワーク及びフィルタリングネットワークの関連パラメータを共有する。
【0071】
図6Aは本願の実施例に係る他の従来のCNNフィルタの構造模式図であり、図6Bは本願の実施例に係るまた更に他の従来のCNNフィルタの構造模式図である。図6A及び図6Bに示すように、該従来のCNNフィルタ60は2つのフィルタリングネットワークを使用し、図6Aに示されるフィルタリングネットワークは第1画像成分を出力することのみに用いられ、図6Bに示されるフィルタリングネットワークは第2画像成分又は第3画像成分を出力することのみに用いられる。符号化対象ビデオにおけるオリジナル画像の高さがHであり、幅がWであると仮定すれば、第1画像成分に対応するサイズ情報はH×Wであり、第1画像成分に対して画素再配列処理を行って、
【数7】
に変換することができる。第2画像成分又は第3画像成分に対応するサイズ情報がいずれも
【数8】
であるため、この3つの画像成分をマージすると、
【数9】
に変換して従来のCNNフィルタ60に入力する。図6Aに示されるフィルタリングネットワークによれば、入力層ネットワークはフィルタリング対象画像Fin(畳み込みカーネルのサイズがN×Nであり、チャネル数が6であると仮定する)を受信した後、第1層の畳み込みネットワークF1-Y(畳み込みカーネルのサイズがL1×L1であり、畳み込みカーネルの数がMであり、チャネル数が6であると仮定する)及び第2層の畳み込みネットワークF2-Y(畳み込みカーネルのサイズがL2×L2であり、畳み込みカーネルの数が4であり、チャネル数がMであると仮定する)を通過した後、1つの残差情報F3-Y(畳み込みカーネルのサイズがN×Nであり、チャネル数が4であると仮定する)を取得し、次に、入力されたフィルタリング対象画像Finと残差情報F3-Yを加算演算して、最終的に従来のCNNフィルタ60が出力したフィルタリング後の第1画像成分(Fout-Yで示される)を取得する。図6Bに示されるフィルタリングネットワークによれば、入力層ネットワークはフィルタリング対象画像Fin(畳み込みカーネルのサイズがN×Nであり、チャネル数が6であると仮定する)を受信した後、第1層の畳み込みネットワークF1-U(畳み込みカーネルのサイズがL1×L1であり、畳み込みカーネルの数がMであり、チャネル数が6であると仮定する)及び第2層の畳み込みネットワークF2-U(畳み込みカーネルのサイズがL2×L2であり、畳み込みカーネルの数が2であり、チャネル数がMであると仮定する)を通過した後、1つの残差情報F3-U(畳み込みカーネルのサイズがN×Nであり、チャネル数が2であると仮定する)を取得し、次に、入力されたフィルタリング対象画像Finと残差情報F3-Uを加算演算して、最終的に従来のCNNフィルタ60が出力したフィルタリング後の第2画像成分又はフィルタリング後の第3画像成分(Fout-Uで示される)を取得する。
【0072】
図5に示される従来のCNNフィルタ50、又は図6A及び図6Bに示される従来のCNNフィルタ60については、異なる画像成分の間の関係を考慮していないため、各画像成分を独立して処理することは合理的ではない。また、入力側においてブロック分割情報、QP情報等の符号化パラメータを十分に利用していない。しかし、再構成画像の歪みは主にブロッキング効果によるものであるが、ブロッキング効果の境界情報はCU分割情報によって決定されるものであり、即ち、CNNフィルタにおけるフィルタリングネットワークは境界領域に重点を置いて注目すべきである。また、量子化パラメータ情報をフィルタリングネットワークに融合することはその汎化性を向上させることにも役立ち、いかなる品質の歪み画像もフィルタリングすることができる。従って、本願の実施例に係るフィルタリング方法は、CNNフィルタリング構造の設定が合理的であり、同じフィルタリングネットワークが複数の画像成分を同時に受信することができるだけではなく、この複数の画像成分の間の関係を十分に考慮して、フィルタリング処理後にこれらの画像成分の強化画像を同時に出力することもできる。また、該フィルタリング方法は更にブロック分割情報及び/又はQP情報等の符号化パラメータを符号化情報として融合してフィルタリングを補助することができ、それによりフィルタリング品質を向上させる。
【0073】
なお、本願の実施例のS3031は、具体的に、フィルタリング対象画素情報の第1画像成分、第2画像成分及び第3画像成分に対してそれぞれ各成分に対応する辺情報(例えば、第1辺情報又は第2辺情報)を決定し、融合処理後に3つの画像成分を取得することであってもよく、フィルタリング対象画素情報の第1画像成分及び第2画像成分に対してそれぞれ各成分に対応する辺情報を決定し、融合処理後に2つの画像成分を取得することであってもよく、フィルタリング対象画素情報の第1画像成分及び第3画像成分に対してそれぞれ各成分に対応する辺情報を決定し、融合処理後に2つの成分を取得することであってもよく、ひいては、フィルタリング対象画素情報の第2画像成分及び第3画像成分に対してそれぞれ各成分に対応する辺情報を決定し、融合処理後に2つの新しい成分を取得することであってもよく、本願の実施例は具体的に限定しない。
【0074】
更に、フィルタリング対象画素情報の融合情報については、少なくとも2種類の成分が直接融合されて取得したものであってもよく、少なくとも2種類の成分及び対応の辺情報(例えば、第1辺情報又は第2辺情報)が一緒に融合されて取得したものであってもよく、本願の実施例は具体的に限定しない。
【0075】
融合情報は少なくとも2種類の成分が直接融合されて取得したものであれば、融合情報を取得するようにフィルタリング対象画素情報の第1画像成分、第2画像成分及び第3画像成分を融合することであってもよく、融合情報を取得するようにフィルタリング対象画素情報の第1画像成分及び第2画像成分を融合することであってもよく、融合情報を取得するようにフィルタリング対象画素情報の第1画像成分及び第3画像成分を融合することであってもよく、ひいては、融合情報を取得するようにフィルタリング対象画素情報の第2画像成分及び第3画像成分を融合することであってもよい。
【0076】
融合情報は少なくとも2種類の成分及び対応の辺情報(例えば、第1辺情報又は第2辺情報)が一緒に融合されて取得したものであれば、融合情報を取得するようにフィルタリング対象画素情報の第1画像成分、第2画像成分及び第3画像成分を辺情報と融合することであってもよく、融合情報を取得するようにフィルタリング対象画素情報の第1画像成分、第2画像成分を辺情報と融合することであってもよく、融合情報を取得するようにフィルタリング対象画素情報の第1画像成分、第3画像成分を辺情報と融合することであってもよく、ひいては、融合情報を取得するようにフィルタリング対象画素情報の第2画像成分、第3画像成分を辺情報と融合することであってもよい。具体的に、「少なくとも2種類の成分及び対応の符号化情報(例えば、第1辺情報又は第2辺情報)が一緒に融合されて取得する」は、まずフィルタリング対象画素情報の少なくとも2種類の成分を融合し、次に、辺情報と融合することであってもよく、まずそれぞれフィルタリング対象画素情報の少なくとも2種類の成分のうちの各成分と対応の辺情報を融合処理し、次に、処理後の少なくとも2種類の成分を融合することであってもよく、即ち、融合処理の具体的な方式については、本願の実施例は具体的に限定しない。
【0077】
また、本願の実施例のS303は、具体的に、フィルタリング対象画素情報の複数の種類の成分(例えば、第1画像成分、第2画像成分及び第3画像成分)及び辺情報(例えば、第1辺情報又は第2辺情報)をフィルタに融合・入力した後、フィルタリング対象画素情報をフィルタリングした後の第1画像成分、又はフィルタリング後の第2画像成分、又はフィルタリング後の第3画像成分のみを出力してもよく、フィルタリング対象画素情報をフィルタリングした後の第1画像成分及びフィルタリング後の第2画像成分、又はフィルタリング後の第2画像成分及びフィルタリング後の第3画像成分、又はフィルタリング後の第1画像成分及びフィルタリング後の第3画像成分、ひいては、フィルタリング対象画素情報をフィルタリングした後の第1画像成分、フィルタリング後の第2画像成分及びフィルタリング後の第3画像成分を出力してもよく、本願の実施例は具体的に限定しない。
【0078】
フィルタリング対象画素情報の3種類の成分をニューラルネットワークに基づくフィルタに同時に入力し、且つ分岐-マージ-分岐のカスケード処理構造を用いる場合を例として、図7は本願の実施例に係る選択可能なフィルタリングフレームワークの構造模式図である。図7に示すように、該フィルタリングフレームワーク70は、フィルタリング対象画素情報の3種類の成分(それぞれY、U、Vで示される)701、第1分岐ユニット702、第1辺情報703、Y画像成分第1処理ユニット704、U画像成分第1処理ユニット705、V画像成分第1処理ユニット706、第2辺情報707、入力融合ユニット708、連携処理ユニット709、第2分岐ユニット710、Y画像成分第2処理ユニット711、U画像成分第2処理ユニット712、V画像成分第2処理ユニット713、第1加算器714、第2加算器715、第3加算器716、及びフィルタリング後の3つの画像成分(それぞれOut_Y、Out_U、Out_Vで示される)717を含んでもよい。具体的に、フィルタリング対象画像ブロックの3つの画像成分701は第1分岐ユニット702を通過した後、3チャネルの信号、即ちY画像成分、U画像成分及びV画像成分に分割され、第1チャネルのY画像成分及び対応の第1辺情報703はY画像成分第1処理ユニット704に入り、第2チャネルのU画像成分及び対応の第1辺情報703はU画像成分第1処理ユニット705に入り、第3チャネルのV画像成分及び対応の第1辺情報703はV画像成分第1処理ユニット706に入り、そうすると、3チャネルの新しい画像成分が出力される。入力融合ユニット708はこの3チャネルの新しい画像成分及び第2辺情報707を融合し、次に連携処理ユニット709に入力することに用いられ、連携処理ユニット709は複数層の畳み込みフィルタリングネットワークを含み、入力された情報に対して畳み込み計算を行うことに用いられる。具体的な畳み込み計算過程は関連の技術案に類似するため、連携処理ユニット709の具体的な実行ステップについて説明しない。連携処理ユニット709を通過した後、改めて3チャネルの信号に分割するように第2分岐ユニット710に入り、次に、この3チャネルの信号をそれぞれY画像成分第2処理ユニット711、U画像成分第2処理ユニット712及びV画像成分第2処理ユニット713に入力し、それにより順にY画像成分の残差情報、U画像成分の残差情報及びV画像成分の残差情報を取得することができる。フィルタリング対象画像ブロックの3つの画像成分701のうちのY画像成分と取得されたY画像成分の残差情報を一緒に第1加算器714に入力すれば、第1加算器714の出力はフィルタリング後のY画像成分(Out_Yで示される)であり、フィルタリング対象画像の3つの画像成分701のうちのU画像成分と取得されたU画像成分の残差情報を一緒に第2加算器715に入力すれば、第2加算器715の出力はフィルタリング後のU画像成分(Out_Uで示される)であり、フィルタリング対象画像ブロックの3つの画像成分701のうちのV画像成分と取得されたV画像成分の残差情報を一緒に第3加算器716に入力すれば、第3加算器716の出力はフィルタリング後のV画像成分(Out_Vで示される)である。ここで、成分の出力については、フィルタリング後のY画像成分のみを出力する必要がある場合、フィルタリングフレームワーク70は第2分岐ユニット710、第2加算器715及び第3加算器716を含まなくてもよく、フィルタリング後のU画像成分のみを出力する必要がある場合、フィルタリングフレームワーク70は第2分岐ユニット710、第1加算器714及び第3加算器716を含まなくてもよく、フィルタリング後のY画像成分及びフィルタリング後のU画像成分を出力する必要がある場合、フィルタリングフレームワーク70は第3加算器716を含まなくてもよく、本願の実施例は具体的に限定しない。
【0079】
フィルタリング対象画素情報の2種類の成分をニューラルネットワークに基づくフィルタに同時に入力し、且つ分岐-マージのカスケード処理構造を用いる場合を例として、図8は本願の実施例に係る他の選択可能なフィルタリングフレームワークの構造模式図である。図8に示すように、該フィルタリングフレームワーク80は、フィルタリング対象画素情報の2種類の成分(それぞれYとUで示される)801、第1分岐ユニット702、第1辺情報703、Y画像成分第1処理ユニット704、U画像成分第1処理ユニット705、入力融合ユニット708、連携処理ユニット709、Y画像成分第2処理ユニット711、第1加算器714、及びフィルタリング後の1つの画像成分(Out_Yで示される)802を含んでもよい。具体的に、フィルタリング対象画像ブロックの2つの画像成分801は第1分岐ユニット702を通過した後、2チャネルの信号、即ちY画像成分及びU画像成分に分割され、第1チャネルのY画像成分及び対応の第1辺情報703はY画像成分第1処理ユニット704に入り、第2チャネルのU画像成分及び対応の第1辺情報703はU画像成分第1処理ユニット705に入り、そうすると、2チャネルの新しい画像成分が出力される。入力融合ユニット708はこの2チャネルの新しい画像成分を融合し、次に連携処理ユニット709に入力することに用いられ、連携処理ユニット709を通過した後、単一の画像成分(即ち、フィルタリング後のY画像成分)のみを出力する必要があるため、第2分岐ユニット710に入る必要がなく、直接にY画像成分第2処理ユニット711に入力してもよく、次に、Y画像成分の残差情報を取得し、フィルタリング対象画像ブロックの2つの画像成分801のうちのY画像成分と取得されたY画像成分の残差情報を一緒に第1加算器714に入力し、第1加算器714の出力はフィルタリング後のY画像成分(Out_Yで示される)である。
【0080】
なお、Y画像成分及びU画像成分又はV画像成分のサイズ情報は異なってもよいため、図7に示されるフィルタリングフレームワーク70又は図8に示されるフィルタリングフレームワーク80において、アップサンプリング処理を行うように、更にU画像成分第1処理ユニット705及びV画像成分第1処理ユニット706の前にアップサンプリングユニット(又は、デコンボリューションユニット又は超解像ユニット)を追加してもよく、それによりアップサンプリング処理後のU画像成分又はアップサンプリング処理後のV画像成分はY画像成分の解像度に一致するように維持し、後続に前処理フィルタリング及び後処理フィルタリングを行うことに役立つ。また、図7に示されるフィルタリングフレームワーク70を例として、本願の実施例の前処理フィルタ及び後処理フィルタは少なくとも入力融合ユニット708、連携処理ユニット709、第1加算器714、第2加算器715及び第3加算器716を備えてもよいが、第1分岐ユニット702、Y画像成分第1処理ユニット704、U画像成分第1処理ユニット705、V画像成分第1処理ユニット706等を備えてもよく、ひいては、第2分岐ユニット710、Y画像成分第2処理ユニット711、U画像成分第2処理ユニット712、V画像成分第2処理ユニット713等を備えてもよく、本願の実施例は具体的に限定しない。
【0081】
また、本願の実施例に係るフィルタリング方法は分岐-マージ-分岐処理構造、例えば図7に示されるフィルタリングフレームワーク70を用いてもよく、より少ない分岐-マージ処理構造、例えば図8に示されるフィルタリングフレームワーク80を用いてもよく、より少ないマージ-分岐処理構造を用いてもよく、ひいては、より少ないマージ-分岐処理構造又はより多い分岐-マージ-分岐-マージ-分岐処理構造を用いてもよく、本願の実施例は具体的に限定しない。
【0082】
更に、第1辺情報と第2辺情報はすべてフィルタリング処理、例えば図7に示されるフィルタリングフレームワーク70に参加してもよく、第1辺情報と第2辺情報はフィルタリング処理、例えば図8に示されるフィルタリングフレームワーク80に選択的に参加してもよく、第2辺情報はフィルタリング処理に参加しない。本願の実施例では、第1辺情報と第2辺情報がすべてフィルタリング処理に参加することであってもよく、第1辺情報がフィルタリング処理に参加しないことであってもよく、第2辺情報がフィルタリング処理に参加しないことであってもよく、ひいては、第1辺情報と第2辺情報がいずれもフィルタリング処理に参加しないことであってもよく、本願の実施例は具体的に限定しない。
【0083】
更に、第1辺情報及び第2辺情報の融合段階は同じであってもよく、異なってもよく、即ち、第1辺情報と第2辺情報は同一段階においてフィルタリング処理に参加してもよく、異なる段階においてフィルタリング処理に参加してもよく、本願の実施例は具体的に限定しない。例えば、依然として図7に示されるフィルタリングフレームワーク70を例として、第1辺情報703と第2辺情報707はいずれも第1分岐ユニット702に対応する段階においてフィルタリング処理に参加してもよく、又は、第1辺情報703と第2辺情報707はいずれも入力融合ユニット708に対応する段階においてフィルタリング処理に参加してもよく、又は、第1辺情報703と第2辺情報707はいずれも第2分岐ユニット710に対応する段階においてフィルタリング処理に参加してもよく、又は、第1辺情報703は第1分岐ユニット702に対応する段階においてフィルタリング処理に参加し、第2辺情報707は入力融合ユニット708に対応する段階においてフィルタリング処理に参加し、又は、第1辺情報703は第1分岐ユニット702に対応する段階の前にフィルタリング処理に参加し、第2辺情報707は入力融合ユニット708に対応する段階においてフィルタリング処理に参加し、又は、第1辺情報703は第1分岐ユニット702に対応する段階の前にフィルタリング処理に参加し、第2辺情報707は第2分岐ユニット710に対応する段階においてフィルタリング処理に参加し、又は、第1辺情報703は入力融合ユニット708に対応する段階においてフィルタリング処理に参加し、第2辺情報707は第2分岐ユニット710に対応する段階においてフィルタリング処理に参加し、即ち、第1辺情報703と第2辺情報707はカスケード処理構造において融合段階を柔軟に選択してもよく、本願の実施例は具体的に限定しない。
【0084】
図7に示されるフィルタリングフレームワーク70を例として、それは深層学習ネットワーク(例えば、CNN)を用いてフィルタリングを行い、従来のCNNフィルタとの相違点は、本願の実施例のフィルタはカスケード処理構造を用い、フィルタリング対象画素情報の3種類の成分をフィルタリングネットワークに同時に入力することができ、且つ他の符号化に関連する辺情報(例えば、ブロック分割情報、量子化パラメータ情報、MV情報等の符号化パラメータ)が融合され、そしてこれらの辺情報が同一段階又は異なる段階においてフィルタリングネットワークに融合されることができる、ということにある。そうすると、3種類の成分の間の関係を十分に利用するだけではなく、他の符号化に関連する符号化情報も使用してフィルタリングを補助し、フィルタリング品質を向上させる。また、3種類の成分を同時に処理することによって、更にこの3種類の成分に対して完全なネットワークフォワード計算を3回行う必要があるという問題を効果的に回避し、これにより計算複雑性を低減し、符号化率を節約する。
【0085】
図9は本願の実施例に係るまた更に他の選択可能なフィルタリングフレームワークの構造模式図である。図9に示すように、該フィルタリングフレームワーク90は、フィルタリング対象画素情報の3種類の成分(それぞれY、U、Vで示される)901、第1辺情報902、Y画像成分第1処理ユニット903、U画像成分第1処理ユニット904、V画像成分第1処理ユニット905、第2辺情報906、融合ユニット907、連携処理ユニット908、分岐ユニット909、Y画像成分第2処理ユニット910、U画像成分第2処理ユニット911、V画像成分第2処理ユニット912、第1加算器913、第2加算器914、第3加算器915、及びフィルタリング後の3つの画像成分(それぞれOut_Y、Out_U、Out_Vで示される)916を含んでもよい。具体的に、フィルタリング対象画素情報の3種類の成分901は成分処理を経て、3チャネルの信号、即ちY画像成分、U画像成分及びV画像成分に分割され、第1チャネルのY画像成分及び対応の第1辺情報902はY画像成分第1処理ユニット903に入り、第2チャネルのU画像成分及び対応の第1辺情報703はU画像成分第1処理ユニット904に入り、第3チャネルのV画像成分及び対応の第1辺情報902はV画像成分第1処理ユニット905に入り、そうすると、3チャネルの新しい画像成分が出力される。融合ユニット907はこの3チャネルの新しい画像成分及び第2辺情報906を融合し、次に連携処理ユニット908に入力することに用いられ、連携処理ユニット908は複数層の畳み込みフィルタリングネットワークを含み、入力された情報に対して畳み込み計算を行うことに用いられる。具体的な畳み込み計算過程は関連の技術案に類似するため、連携処理ユニット908の具体的な実行ステップについて説明しない。連携処理ユニット908を通過した後、改めて3チャネルの信号に分割するように分岐ユニット909に入り、次に、この3チャネルの信号をそれぞれY画像成分第2処理ユニット910、U画像成分第2処理ユニット911及びV画像成分第2処理ユニット912に入力し、それにより順にY画像成分の残差情報、U画像成分の残差情報及びV画像成分の残差情報を取得することができる。フィルタリング対象画素情報の3種類の成分901のうちのY画像成分と取得されたY画像成分の残差情報を一緒に第1加算器913に入力し、第1加算器913の出力はフィルタリング後のY画像成分(Out_Yで示される)であり、フィルタリング対象画素情報の3種類の成分901のうちのU画像成分と取得されたU画像成分の残差情報を一緒に第2加算器914に入力し、第2加算器914の出力はフィルタリング後のU画像成分(Out_Uで示される)であり、フィルタリング対象画素情報の3種類の成分901のうちのV画像成分と取得されたV画像成分の残差情報を一緒に第3加算器915に入力し、第3加算器915の出力はフィルタリング後のV画像成分(Out_Vで示される)である。ここで、成分の出力については、フィルタリング後のY画像成分のみを出力する必要がある場合、フィルタリングフレームワーク90は分岐ユニット909、第2加算器914及び第3加算器915を含まなくてもよく、フィルタリング後のU画像成分のみを出力する必要がある場合、フィルタリングフレームワーク90は分岐ユニット909、第1加算器913及び第3加算器915を含まなくてもよく、フィルタリング後のY画像成分及びフィルタリング後のU画像成分を出力する必要がある場合、フィルタリングフレームワーク90は第3加算器915を含まなくてもよく、本願の実施例は具体的に限定しない。
【0086】
本願の実施例に係るニューラルネットワークアーキテクチャは各成分及び辺情報を合理的且つ効果的に利用することができ、より高い符号化性能を得ることができる。
【0087】
本願の実施例はフィルタリング方法を提供し、まず、フィルタリング装置はフィルタリング対象画素情報を取得し、少なくとも1種類の辺情報を取得し、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得する。即ち、本願の実施例では、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報を取得し、ニューラルネットワークに基づくフィルタに入力して処理し、フィルタリング過程において、少なくとも1種類の成分の辺情報を融合することにより、フィルタリング後の画素情報を取得する。そうすると、複数の種類の成分の間の関係を十分に利用するだけではなく、少なくとも2種類の成分に対して完全なネットワークフォワード計算を複数回行う必要があるという問題も効果的に回避し、ひいては計算複雑性を低減し、符号化率を節約し、符号化/復号化過程において前処理フィルタリング後に取得した画像及び後処理フィルタリング後に取得した画像の品質を向上させ、それにより再構成画像の品質を向上させる。
【0088】
同じ発明構想に基づいて、図10は本願の実施例に係る選択可能なフィルタリング装置の構造模式図である。図10に示すように、該フィルタリング装置は第1取得モジュール101、第2取得モジュール102及び決定モジュール103を備えてもよく、
第1取得モジュール101は、フィルタリング対象画素情報を取得するように構成され、
第2取得モジュール102は、少なくとも1種類の辺情報を取得するように構成され、
決定モジュール103は、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得するように構成される。
【0089】
上記解決手段では、決定モジュール103は、
それぞれ少なくとも2種類の成分のうちの各成分を処理して、処理後の少なくとも2種類の成分を取得するように構成される第1処理サブモジュールと、
少なくとも1種類の辺情報及び処理後の少なくとも2種類の成分に基づいて融合処理して、フィルタリング対象画素情報の融合情報を取得するように構成される融合サブモジュールと、
融合情報を処理して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得するように構成される第2処理サブモジュールと、を備えてもよい。
【0090】
上記解決手段では、第1処理サブモジュールは具体的に、
それぞれ少なくとも2種類の成分のうちの各成分に対して成分処理を行って、処理後の少なくとも2種類の成分を取得するように構成されてもよい。
【0091】
上記解決手段では、各成分に対応する第1辺情報を取得した場合、それに対応して、第1処理サブモジュールは具体的に、
それぞれ少なくとも2種類の成分のうちの各成分及び各成分に対応する第1辺情報を融合処理して、処理後の少なくとも2種類の成分を取得するように構成されてもよく、
第1辺情報は少なくともブロック分割情報及び/又は量子化パラメータ情報を含む。
【0092】
上記解決手段では、融合サブモジュールは具体的に、
処理後の少なくとも2種類の成分及び各成分に対応する第1辺情報を融合処理して、フィルタリング対象画素情報の融合情報を取得するように構成されてもよい。
【0093】
上記解決手段では、第2処理サブモジュールは具体的に、
融合情報に対して連携処理及び分岐処理を行って、少なくとも2種類の成分のうちの少なくとも1種類の成分に対応する残差情報を取得し、
少なくとも2種類の成分のうちの少なくとも1種類の成分と少なくとも1種類の成分に対応する残差情報を加算演算して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を取得するように構成されてもよい。
【0094】
上記解決手段では、各成分に対応する第2辺情報を取得した場合、それに対応して、第1処理サブモジュールは具体的に、
それぞれ少なくとも2種類の成分のうちの各成分及び各成分に対応する第2辺情報を融合処理して、処理後の少なくとも2種類の成分を取得するように構成されてもよく、
第2辺情報は第1辺情報と異なる。
【0095】
上記解決手段では、融合サブモジュールは具体的に、
処理後の少なくとも2種類の成分及び各成分に対応する第2辺情報を融合処理して、フィルタリング対象画素情報の融合情報を取得するように構成されてもよい。
【0096】
上記解決手段では、ニューラルネットワークの構造は少なくとも1つの連携処理段階及び1つの独立処理段階を含み、連携処理段階において、すべての成分が一緒に処理され、独立処理段階において、各成分がニューラルネットワークの1つの独立した分岐において処理される。
【0097】
理解されるように、本実施例では、「ユニット」は一部の回路、一部のプロセッサ、一部のプログラム又はソフトウェア等であってもよく、当然ながら、モジュールであってもよく、モジュール化されていないものであってもよい。且つ、本実施例の各構成部分は1つの処理ユニットに統合されてもよく、各ユニットは独立して物理的に存在してもよく、2つ以上のユニットが1つのユニットに統合されてもよい。上記統合されたユニットはハードウェアの形式で実現されてもよく、ソフトウェア機能モジュールの形式で実現されてもよい。
【0098】
前記統合されたユニットはソフトウェア機能モジュールの形式で実現され、独立した製品として販売又は使用されるときは、1つのコンピュータ可読記憶媒体に記憶されてもよい。このような理解に基づいて、本実施例の技術案の本質的又は従来技術に貢献する部分、又は該技術案の全部又は一部はソフトウェア製品の形式で具現されてもよい。該コンピュータソフトウェア製品は、1台のコンピュータ装置(パーソナルコンピュータ、サーバ又はネットワーク装置等であってもよい)又はprocessor(プロセッサ)に本実施例に記載の方法の全部又は一部のステップを実行させるための若干の命令を含む1つの記憶媒体に記憶される。そして、上記記憶媒体はUSBメモリ、ポータブルハードディスク、読み出し専用メモリ(ROM、Read Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク又は光ディスク等のプログラムコードを記憶できる様々な媒体を含む。
【0099】
図11は本願の実施例に係る選択可能なエンコーダの構造模式図である。図11に示すように、本願の実施例はエンコーダ1100を提供し、
プロセッサ1101と、プロセッサ1101実行可能命令が記憶される記憶媒体1102とを備え、記憶媒体1102は通信バス1103を介してプロセッサ1101による操作の実行に頼り、命令がプロセッサ1101により実行されるとき、上記実施例のフィルタリング方法が実行される。
【0100】
なお、実際の応用では、端末の各コンポーネントは通信バス1103によって一体に結合される。理解されるように、通信バス1103はこれらのコンポーネント間の接続通信を実現することに用いられる。通信バス1103はデータバスのほか、更に電源バス、制御バス及び状態信号バスを含む。しかしながら、明確に説明するために、図11では、様々なバスはいずれも通信バス1103と記される。
【0101】
本願の実施例はコンピュータ記憶媒体を提供し、実行可能命令がそれに記憶され、前記実行可能命令が1つ又は複数のプロセッサにより実行されるとき、前記プロセッサは上記1つ又は複数の実施例に記載のフィルタリング方法を実行する。
【0102】
理解されるように、本願の実施例では、メモリは揮発性メモリ又は不揮発性メモリであってもよく、又は、揮発性メモリ及び不揮発性メモリの両方を含んでもよい。不揮発性メモリは読み出し専用メモリ(ROM、Read-Only Memory)、プログラム可能読み出し専用メモリ(PROM、Programmable ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM、Erasable PROM)、電気的消去可能プログラム可能読み出し専用メモリ(EEPROM、Electrically EPROM)又はフラッシュメモリであってもよい。揮発性メモリは外部キャッシュメモリとして使用されるランダムアクセスメモリ(RAM、Random Access Memory)であってもよい。例示的な説明であって制限的ではないが、多くの形式のRAM、例えばスタティックランダムアクセスメモリ(SRAM、Static RAM)、ダイナミックランダムアクセスメモリ(DRAM、Dynamic RAM)、シンクロナスダイナミックランダムアクセスメモリ(SDRAM、Synchronous DRAM)、ダブルデータレートシンクロナスダイナミックランダムアクセスメモリ(DDRSDRAM、Double Data Rate SDRAM)、拡張型シンクロナスダイナミックランダムアクセスメモリ(ESDRAM、Enhanced SDRAM)、シンクリンクダイナミックランダムアクセスメモリ(SLDRAM、Synchlink DRAM)及びダイレクトラムバスランダムアクセスメモリ(DRRAM、Direct Rambus RAM)が利用可能である。本明細書に説明されるシステム及び方法のメモリはこれらのメモリ及び任意の他の適切なタイプのメモリを含むが、それらに限らないように意図されるものである。
【0103】
プロセッサは信号処理機能を有する集積回路チップでありうる。実現過程において、上記方法の各ステップはプロセッサにおけるハードウェアの集積論理回路又はソフトウェア形式の命令で行われてもよい。上記プロセッサは汎用プロセッサ、デジタルシグナルプロセッサ(DSP、Digital Signal Processor)、特定用途向け集積回路(ASIC、Application Specific Integrated Circuit)、フィールドプログラマブルゲートアレイ(FPGA、Field Programmable Gate Array)又は他のプログラマブルロジックデバイス、個別ゲート又はトランジスタロジックデバイス、個別ハードウェアコンポーネントであってもよい。本願の実施例に開示される各方法、ステップ及び論理ブロックを実現又は実行することができる。汎用プロセッサはマイクロプロセッサであってもよく、又は該プロセッサはいかなる通常のプロセッサ等であってもよい。本願の実施例に開示される方法のステップはハードウェア復号プロセッサで遂行し、又は復号プロセッサにおけるハードウェア及びソフトウェアモジュールの組み合わせで遂行するように直接具現されてもよい。ソフトウェアモジュールはランダムアクセスメモリ、フラッシュメモリ、読み出し専用メモリ、プログラム可能読み出し専用メモリ又は電気消去可能プログラム可能メモリ、レジスタ等の本分野で成熟している記憶媒体に位置してもよい。該記憶媒体はメモリに位置し、プロセッサはメモリにおける情報を読み取り、そのハードウェアと組み合わせて上記方法のステップを行う。
【0104】
理解されるように、本明細書に説明されるこれらの実施例はハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード又はそれらの組み合わせで実現されてもよい。ハードウェアによる実現については、処理ユニットは1つ又は複数の特定用途向け集積回路(ASIC、Application Specific Integrated Circuits)、デジタルシグナルプロセッサ(DSP、Digital Signal Processor)、デジタル信号処理装置(DSPD、DSP Device)、プログラマブルロジックデバイス(PLD、Programmable Logic Device)、フィールドプログラマブルゲートアレイ(FPGA、Field-Programmable Gate Array)、汎用プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、本願に記載の機能を実行するための他の電子ユニット又はそれらの組み合わせにおいて実現されてもよい。
【0105】
ソフトウェアによる実現については、本明細書に記載の機能モジュール(例えば、過程、関数等)を実行することにより本明細書に記載の技術を実現することができる。ソフトウェアコードはメモリに記憶されてもよく、且つプロセッサにより実行される。メモリはプロセッサにおいて実現されてもよく、又はプロセッサの外部で実現されてもよい。
【0106】
なお、本明細書では、用語「含む」又はそのいかなる変形は非排他的包含を網羅することが意図され、それにより、一連の要素を含む過程、方法、物品又は装置はそれらの要素を含むだけではなく、明確に列挙しない他の要素も含み、又はこのような過程、方法、物品又は装置固有の要素も含む。特に制限しない限り、語句「〇〇を含む」により限定される要素は、該要素を含む過程、方法、物品又は装置には他の同じ要素が更に存在することを排除しない。
【0107】
上記本願の実施例の番号は説明のためのものに過ぎず、実施例の優劣を代表しない。
【0108】
上記実施形態の説明によれば、当業者であれば明確に理解できるように、上記実施例の方法はソフトウェア+必須な汎用ハードウェアプラットフォームの方式で実現されてもよく、当然ながら、ハードウェアで実現されてもよいが、多くの場合には前者は好適な実施形態である。このような理解に基づいて、本願の技術案の本質的又は従来技術に貢献する部分はソフトウェア製品の形式で具現されてもよく、該コンピュータソフトウェア製品は、1台の端末(携帯電話、コンピュータ、サーバ又はネットワーク装置等であってもよい)に本願の各実施例に記載の方法を実行させるための若干の命令を含む1つの記憶媒体(例えば、ROM/RAM、磁気ディスク、光ディスク)に記憶される。
【0109】
以上は図面を参照しながら本願の実施例を説明したが、本願は上記具体的な実施形態に制限されず、上記具体的な実施形態は模式的なものに過ぎず、制限的なものではない。当業者であれば、本願の示唆に基づいて、本願の主旨及び特許請求の範囲から逸脱することなく、更に多くの変形を行うことができ、それらはいずれも本願の保護範囲内に含まれる。
【産業上の利用可能性】
【0110】
本願の実施例では、まず、フィルタリング装置はフィルタリング対象画素情報を取得し、少なくとも1種類の辺情報を取得し、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報をニューラルネットワークに基づくフィルタに入力して、フィルタリング対象画素情報をフィルタリングした後の少なくとも1種類の成分を出力して取得する。即ち、本願の実施例では、フィルタリング対象画素情報の少なくとも2種類の成分及び少なくとも1種類の辺情報を取得し、ニューラルネットワークに基づくフィルタに入力して処理し、フィルタリング過程において、少なくとも1種類の成分の辺情報を融合することにより、フィルタリング後の画素情報を取得する。そうすると、複数の種類の成分の間の関係を十分に利用するだけではなく、少なくとも2種類の成分に対して完全なネットワークフォワード計算を複数回行う必要があるという問題も効果的に回避し、ひいては計算複雑性を低減し、符号化率を節約し、符号化/復号化過程において前処理フィルタリング後に取得した画像及び後処理フィルタリング後に取得した画像の品質を向上させ、それにより再構成画像の品質を向上させる。
図1
図2
図3
図4
図5
図6A
図6B
図7
図8
図9
図10
図11
【国際調査報告】