(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-14
(45)【発行日】2023-09-25
(54)【発明の名称】ループフィルタリング方法、装置およびコンピュータ記憶媒体
(51)【国際特許分類】
H04N 19/82 20140101AFI20230915BHJP
H04N 19/86 20140101ALI20230915BHJP
【FI】
H04N19/82
H04N19/86
(21)【出願番号】P 2021552876
(86)(22)【出願日】2019-03-07
(86)【国際出願番号】 CN2019077371
(87)【国際公開番号】W WO2020177133
(87)【国際公開日】2020-09-10
【審査請求日】2022-02-08
(73)【特許権者】
【識別番号】516227559
【氏名又は名称】オッポ広東移動通信有限公司
【氏名又は名称原語表記】GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., LTD.
【住所又は居所原語表記】No. 18 Haibin Road,Wusha, Chang’an,Dongguan, Guangdong 523860 China
(74)【代理人】
【識別番号】100091487
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100152205
【氏名又は名称】吉田 昌司
(74)【代理人】
【識別番号】100137523
【氏名又は名称】出口 智也
(72)【発明者】
【氏名】ワン、シューアイ
(72)【発明者】
【氏名】ワン、ミンツォー
(72)【発明者】
【氏名】マー、イェンチュオ
(72)【発明者】
【氏名】フオ、チュンイェン
(72)【発明者】
【氏名】ヤン、フーチョン
【審査官】田中 純一
(56)【参考文献】
【文献】国際公開第2019/031410(WO,A1)
【文献】米国特許出願公開第2020/0213587(US,A1)
【文献】欧州特許出願公開第3451670(EP,A1)
【文献】Jihong Kang, et.al.,Multi-modal/multi-scale convolutional neural network based in-loop filter design for next generation video codec,2017 IEEE International Conference on Image Processing (ICIP),2017年09月20日,pp.26-30
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00 - 19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
ループフィルタリング方法であって、
フィルタリングされる画像を取得することであって、前記フィルタリングされる画像は、符号化されるビデオ内の原画像を符号化するプロセスで生成されたものである、ことと、
前記フィルタリングされる画像に対応する補助情報を決定することであって、前記補助情報は、少なくともブロック分割情報を含む、ことと、
前記フィルタリングされる画像の融合情報を決定することであって、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分
および対応する補助情報を融合することによって得られる、ことと、
前記融合情報に基づいて、前記フィルタリングされる画像のループフィルタリング出力を取得すること
であって、前記ループフィルタリング出力は、少なくとも1つの画像成分を含む、ことと、を含
み、
前記フィルタリングされる画像に対応する補助情報を決定することは、
符号化されるビデオ内の原画像に対応する量子化パラメータを取得することと、
前記量子化パラメータに基づいて、前記フィルタリングされる画像に対応する量子化パラメータ情報を決定することと、を含む、前記ループフィルタリング方法。
【請求項2】
前記フィルタリングされる画像を取得することは、
符号化されるビデオ内の原画像に対してビデオ符号化処理を実行し、生成された再構成画像を前記フィルタリングされる画像として使用することを含む、
請求項1に記載のループフィルタリング方法。
【請求項3】
符号化されるビデオ内の原画像に対してビデオ符号化処理を実行して再構成画像を生成し、前記再構成画像に対してプリセットフィルタリング処理を実行し、プリセットフィルタリング処理後の前記再構成画像を前記フィルタリングされる画像として使用する、
請求項2に記載のループフィルタリング方法。
【請求項4】
メモリ及びプロセッサを含む、ループフィルタリング装置であって、
前記メモリは、プロセッサで実行可能なコンピュータプログラムを記憶するように構成され、
前記プロセッサは、
フィルタリングされる画像を取得し、前記フィルタリングされる画像は、符号化されるビデオ内の原画像を符号化するプロセスで生成されたものであり、
前記フィルタリングされる画像に対応する補助情報を決定し、前記補助情報は、少なくともブロック分割情報を含み、
前記フィルタリングされる画像の融合情報を決定し、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分
および対応する補助情報を融合することによって得られ、
前記融合情報に基づいて、前記フィルタリングされる画像のループフィルタリング出力を取得するように構成され、前記ループフィルタリング出力は、少なくとも1つの画像成分を含
み、
前記プロセッサはさらに、符号化されるビデオ内の原画像に対応する量子化パラメータを取得し、前記量子化パラメータに基づいて、前記フィルタリングされる画像に対応する量子化パラメータ情報を決定するように構成される、前記ループフィルタリング装置。
【請求項5】
前記プロセッサは、具体的に、符号化されるビデオ内の原画像に対してビデオ符号化処理を実行し、生成された再構成画像を前記フィルタリングされる画像として使用するように構成される、
請求項4に記載のループフィルタリング装置。
【請求項6】
前記プロセッサは、さらに、符号化されるビデオ内の原画像に対してビデオ符号化処理を実行して、再構成画像を生成し、前記再構成画像に対してプリセットフィルタリング処理を実行し、プリセットフィルタリング処理後の前記再構成画像を前記フィルタリングされる画像として使用するように構成される、
請求項5に記載のループフィルタリング装置。
【請求項7】
ループフィルタリング方法であって、
ビットストリームを復号化して、フィルタリングされる画像を決定することと、
前記フィルタリングされる画像に対応する補助情報を決定することであって、前記補助情報は、少なくともブロック分割情報を含む、ことと、
フィルタリングされる画像の融合情報を決定することであって、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分
および対応する補助情報を融合することによって得られる、ことと、
前記融合情報に基づいて、前記フィルタリングされる画像のループフィルタリング出力を取得すること
であって、前記ループフィルタリング出力は、少なくとも1つの画像成分を含む、ことと、を含
み、
前記フィルタリングされる画像に対応する量子化パラメータ情報を決定することは、
量子化パラメータを取得することと、
前記量子化パラメータに基づいて、前記フィルタリングされる画像に対応する量子化パラメータ情報を決定することと、を含む、前記ループフィルタリング方法。
【請求項8】
前記ビットストリームを復号化して、フィルタリングされる画像を決定することは、
前記ビットストリームを復号化して、前記フィルタリングされる画像として再構成画像を決定することを含む、
請求項7に記載のループフィルタリング方法。
【請求項9】
前記ビットストリームを復号化して、前記再構成画像を生成し、前記再構成画像に対してプリセットフィルタリング処理を実行し、プリセットフィルタリング処理後の前記再構成画像を前記フィルタリングされる画像として決定する、
請求項8に記載のループフィルタリング方法。
【請求項10】
メモリ及びプロセッサを含む、ループフィルタリング装置であって、
前記メモリは、プロセッサで実行可能なコンピュータプログラムを記憶するように構成され、
前記プロセッサは、前記コンピュータプログラムを実行することにより、
請求項7~9のいずれか一項に記載の方法を実現するように構成される、前記ループフィルタリング装置。
【発明の詳細な説明】
【技術分野】
【0001】
本願実施例は、画像処理技術分野に関し、特に、ループフィルタリング方法、装置およびコンピュータ記憶媒体に関する。
【背景技術】
【0002】
ビデオ符号化・復号化システムにでは、ブロックコーディングユニット(CU:Coding Unit)ベースのハイブリッド符号化フレームワークが主にビデオ符号化に採用されている。隣接するCUは、異なる変換プロセス、異なる量子化パラメータ(QP:Quantization Parameter)、異なる予測方式、異なる参照画像フレームなどの異なる符号化パラメータを採用し、各CUによって導入される誤差の大きさとその分布特性は相互に独立しているため、隣接するCUの境界の不連続性によってブロッキング効果が生成され、それにより、再構成された画像の主観的及び客観的な品質、さらには、後続の符号化・復号化の予測精度に影響を及ぼす。
【0003】
したがって、符号化・復号化プロセスにおいて、再構成された画像の主観的および客観的品質を向上させるために、ループフィルタが採用されている。従来のループフィルタ、例えば、デブロッキングフィルタ(DBF:De-Blocking Filter)、サンプル適応オフセット(SAO:Sample Adaptive Offset)フィルタ、適応ループフィルタ(ALF:Adaptive Loop Filter)は、通常、歪み画像の特徴を手動で要約し、フィルタ構造の設計とフィルタ係数の構成は手動で実装される。これらの手動設計に依存するフィルタは、最適なフィルタにうまく適合せず、適応能力とフィルタリング効果が低く、符号化・復号化側の一貫性を確保するために、ローカル統計情報に依存するフィルタ関連パラメータをビットストリームに書き込む必要があり、これにより、コーディングのビット数が増加する。
【0004】
深層学習の急速な発展に伴い、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を介して、再構成された画像に対してフィルタリング処理を実行して、画像の歪みを除去することが業界で提案され、これは、従来のループフィルタと比較して、主観的及び客観的な品質を明らかに向上させる。しかしながら、現在のCNNフィルタは、関連情報を完全かつ包括的に利用していないため、再構成された画像の主観的及び客観的な品質の向上には限界がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本願実施例は、ブロック分割情報および/またはQP情報などの符号化パラメータを補助情報として、入力される複数の画像成分と融合することにより、複数の画像成分間の関係を十分に利用するだけでなく、計算の複雑さを軽減し、符号化ビットレートを節約する同時に、さらに、ビデオの符号化・復号化プロセスで再構成された画像の主観的及び客観的な品質を向上させる、ループフィルタリング方法、装置およびコンピュータ記憶媒体を提供する。
【課題を解決するための手段】
【0006】
本願実施例の技術的解決策は、以下のように実現されることができる。
【0007】
第1態様によれば、本願実施例は、ループフィルタリング方法を提供し、前記方法は、
フィルタリングされる画像を取得することであって、ここで、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記符号化されるビデオは、原画像フレームを含み、前記原画像フレームは、前記原画像を含む、ことと、
前記フィルタリングされる画像の融合情報を決定することであって、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものである、ことと、
前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得することと、を含む。
【0008】
第2態様によれば、本願実施例は、ループフィルタリング装置を提供し、前記ループフィルタリング装置は、取得ユニット、決定ユニットおよびフィルタリングユニットを備え、ここで、
前記取得ユニットは、フィルタリングされる画像を取得するように構成され、ここで、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記符号化されるビデオは、原画像フレームを含み、前記原画像フレームは、前記原画像を含み、
前記決定ユニットは、前記フィルタリングされる画像の融合情報を決定するように構成され、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものであり、
前記フィルタリングユニットは、前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得するように構成される。
【0009】
第3態様によれば、本願実施例は、ループフィルタリング装置を提供し、前記ループフィルタリング装置は、メモリとプロセッサとを備え、ここで、
前記メモリは、前記プロセッサで実行可能なコンピュータプログラムを記憶するように構成され、
前記プロセッサは、前記コンピュータプログラムを実行することにより、第1態様に記載の方法のステップを実行するように構成される。
【0010】
第4態様によれば、本願実施例は、ループフィルタリングの実現プログラムが記憶されているコンピュータ記憶媒体を提供し、前記ループフィルタリングの実現プログラムが、少なくとも1つのプロセッサによって実行されるときに、第1態様に記載の方法のステップを実現する。
【発明の効果】
【0011】
本願実施例によるループフィルタリング方法、装置およびコンピュータ記憶媒体によれば、まず、フィルタリングされる画像を取得し、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものである。その後、前記フィルタリングされる画像の融合情報を決定し、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものである。最後に、前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得する。、このようにして、ブロック分割情報および/またはQP情報などの符号化パラメータを補助情報として、入力される複数の画像成分と融合することにより、複数の画像成分間の関係を十分に利用するだけでなく、これらの複数の画像成分に対して実行すべき複数回の完全なネットワークフォワード計算を効果的に回避し、さらに、計算の複雑さを軽減し、符号化ビットレートを節約する。さらに、ブロック分割情報および/またはQP情報などの補助情報を融合することにより、フィルタリングをさらに支援することができ、ビデオの符号化・復号化プロセスで再構成された画像の主観的及び客観的な品質を向上させる。
【図面の簡単な説明】
【0012】
【
図1】関連する技術的解決策による従来の符号化ブロック図の構成の例示的な構造図である。
【
図2】本願実施例による、改良型符号化ブロック図の構成の例示的な構造図である。
【
図3】本願実施例によるループフィルタリング方法の例示的なフローチャートである。
【
図4】本願実施例によるブロック分割行列の例示的な構造図である。
【
図5】本願実施例による従来のCNNフィルタの構成の例示的な構造図である。
【
図6A】本願実施例による別の従来のCNNフィルタの構成の例示的な構造図である。
【
図6B】本願実施例による別の従来のCNNフィルタの構成の例示的な構造図である。
【
図7】本願実施例によるループフィルタリングフレームワークの構成の例示的な構造図である。
【
図8】本願実施例による別のループフィルタリングフレームワークの構成の例示的な構造図である。
【
図9】本願実施例によるループフィルタリング装置の構成の例示的な構造図である。
【
図10】本願実施例によるループフィルタリング装置の具体的なハードウェアの例示的な構造図である。
【発明を実施するための形態】
【0013】
本願実施例の特徴および技術的内容をより詳細に理解するために、以下、図面を参照して本願実施例の具現を詳細に説明し、添付の図面は、参照のみを目的とし、本願実施例を限定することを意図するものではない。
【0014】
ビデオ符号化・復号化システムにおいて、符号化されるビデオは、原画像フレームを含み、原画像フレームには、原画像が含まれ、当該原画像に対して、予測、変換、量子化、再構成、およびフィルタリングなどの複数のタイプの処理を実行し、これらの処理プロセスにおいて、処理されたビデオ画像は、原画像に対してピクセル値がオフセットされている可能性があり、視覚障害またはアーティファクトが発生する可能性がある。さらに、ほどんどのビデオ符号化・復号化システムに採用されているブロックCUベースのハイブリッドコーディングフレームワークでは、隣接する符号化ブロックに、異なる符号化パラメータ(例えば、異なる変換プロセス、異なるQP、異なる予測方式、異なる参照画像フレームなど)が採用されており、各符号化ブロックによって導入される誤差の大きさとその分布特性は相互に独立しているため、隣接する符号化ブロックの境界の不連続性によってブロッキング効果が生成される。これらの歪みは、再構成された画像の主観的及び客観的な品質に影響を与えるだけでなく、再構成された画像が後続の符号化ピクセルの参照画像として使用される場合、後続の符号化・復号化の予測精度にも影響を与え、さらに、ビデオビットストリームのビット数に影響を与える可能性がある。したがって、常に、ループフィルタ(In-Loop Filter)は通常、再構成された画像の主観的及び客観的な品質を向上させるために、ビデオ符号化・復号化システムに追加される。
【0015】
図1は、関連する技術的解決策による従来の符号化ブロック図の構成の例示的な構造図を示す。
図1に示されるように、当該従来の符号化ブロック
図10は、変換および量子化ユニット101、逆変換および逆量子化ユニット102、予測ユニット103、フィルタリングユニット104、およびエントロピコーディングユニット105などのコンポーネントを備えることができる。ここで、予測ユニット103は、さらに、イントラ予測ユニット1031およびインター予測ユニット1032を備える。入力される原画像について、コーディングツリーユニット(CTU:Coding Tree Unit)は、事前分割によって取得することができ、1つのCTUに対して、コンテンツ適応分割を実行し続けて、CUを取得することができる。CUは、通常、1つまたは複数の符号化ブロック(CB:Coding Block)を含む。符号化ブロックに対して、イントラ予測ユニット1031によって実行されるイントラ予測、またはインター予測ユニット1032によって実行されるインター予測を実行して、残差情報を取得することができる。ビットレートをさらに低減するために、当該残差情報を変換および量子化ユニット101を介して変換する(残差情報をピクセルドメインから変換ドメインに変換し、取得された変換係数を量子化することを含む)。予測モードを決定した後、予測ユニット103は、さらに、選択されたイントラ予測データまたはインター予測データをエントロピコーディングユニット105に提供するように構成される。されに、逆変換および逆量子化ユニット102は、当該符号化ブロックを再構築するように構成され、すなわち、ピクセルドメインで残差ブロックを再構築するように構成される。当該再構築された残差ブロックの、ブロッキング効果を有するアーチファクトは、フィルタリングユニット104によって除去され、その後、当該再構築された残差ブロックを復号化画像キャッシュユニットに追加して、当該再構築された参照画像を生成する。エントロピコーディングユニット105は、様々な符号化パラメータおよび量子化された変換係数を符号化するように構成され、例えば、エントロピコーディングユニット105は、ヘッダ情報符号化およびコンテキスト適応型バイナリ算術符号化(CABAC:Context-based Adaptive B
inary Arithmatic Coding)アルゴリズムを採用することができ、決定された予測モードを示す符号化情報を符号化し、対応するビットストリームを出力するように構成されることができる。
【0016】
図1に示される従来の符号化ブロック
図10について、フィルタリングユニット104は、インループフィルタ(In-Loop Filter)とも呼ばれるループフィルタであり、デブロッキングフィルタ(DBF;De-Blocking Filter)1041、サンプル適応オフセット(SAO:Sample Adaptive Offset)フィルタ1042、および適応ループフィルタ(ALF:Adaptive Loop Filter)1043などを含み得る。ここで、デブロッキングフィルタ1041は、デブロッキングフィルタリングを実現するように構成され、次世代のビデオ符号化規格H.266/バーサタイルビデオ符号化(VVC:Versatile Video Coding)では、原画像内のすべての符号化ブロックの境界について、まず、境界の両側の符号化パラメータに従って、境界強度を決定し、計算されたブロック境界のテクスチャ値に従って、デブロッキングを実行するか否かのフィルタリング決定を行う。最後に、境界強度とフィルタリング決定に従って、符号化ブロック境界の両側のピクセル情報に対して補正処理を実行する。VVCにおいて、デブロッキングフィルタリングが実行された後、高周波交流係数の量子化歪みを低減するために、SAO技術、即ち、サンプル適応オフセットフィルタ1042が導入され、さらに、ピークのピクセルに負の値を加算し、谷のピクセルに正の値を加算することにより、ピクセルドメインから補正処理を実行する。VVCでは、デブロッキングフィルタリングおよびサンプル適応オフセットフィルタリングが実行された後、さらに、適応ループフィルタ1043を使用してフィルタリング処理を実行する必要があり、適応ループフィルタリングの場合、平均二乗最適フィルタは、原画像のピクセル値および歪み画像のピクセル値に基づいて計算される。しかし、これらのフィルタ(例えば、デブロッキングフィルタ1041、サンプル適応オフセットフィルタ1042および適応ループフィルタ1043など)には、正確な手動設計と大量の判断決定が必要であり、さらに、符号化側と復号化側の間の一貫性を確保するために、符号化側によって、ローカル統計情報に依存するフィルタ関連パラメータ(例えば、フィルタリング係数および当該フィルタを選択するか否かを示すフラグ(Flag)値など)を、
ビットストリームに書き込む必要があるため、コーディングビット数が増加する。同時に、実際の最適化ターゲットの複雑な関数に対して、手動で設計されたフィルタの適合度はそれほど高くなく、フィルタリング効果を強化する必要がある。
【0017】
本願実施例は、ループフィルタリング方法を提供し、当該方法は、改良型符号化ブロック図に適用され、
図1に示される従来の符号化ブロック
図10と比較すると、主な違いは、関連する技術的解決策において、デブロッキングフィルタ1041、サンプル適応オフセットフィルタ1042および適応ループフィルタ1043などの代わりに改良型ループフィルタが採用されていることである。本願実施例において、当該改良型ループフィルタは、畳み込みニューラルネットワーク(CNN:Convolutional Neural Networks)フィルタであってもよいし、深層学習によって構築された他のフィルタであってもよく、本願実施例では、特に限定されない。
【0018】
畳み込みニューラルネットワークフィルタを例にとると、
図2を参照すると、本願実施例による改良型符号化ブロック
図20の構成の例示的な構造図を示す。
図2に示されるように、従来の符号化ブロック
図10と比較して、改良型符号化ブロック
図20のフィルタリングユニット104は、CNNフィルタ201を含む。当該CNNフィルタ201は、
図1のデブロッキングフィルタ1041、SAOフィルタ1042および適応ループフィルタ1043を完全に置き換えることができ、
図1のデブロッキングフィルタ1041、SAOフィルタ1042および適応ループフィルタ1043のいずれか1つまたは2つを部分的に置き換えることもでき、また、
図1のデブロッキングフィルタ1041、SAOフィルタ1042および適応ループフィルタ1043のいずれか1つまたは複数と組み合わせて使用することもできる。また、留意されたいこととして、
図1または
図2に示される各コンポーネント、例えば、変換および量子化ユニット101、逆変換および逆量子化ユニット102、予測ユニット103、フィルタリングユニット104、エントロピコーディングユニット105またはCNNフィルタ201などについて、これらのコンポーネントは、仮想モジュールであってもよいし、ハードウェアモジュールであってもよい。さらに、当業者なら自明であるが、これらのユニットは、符号化ブロック図を限定することを意図しておらず、符号化ブロック図は、図に示されるものよりも多いまたは少ないコンポーネントを含み得るか、またはいくつかのコンポーネントが組み合わされるか、または異なるコンポーネント配置を採用することができる。
【0019】
本願実施例において、CNNフィルタ201は、フィルタリングネットワークトレーニング後に、符号化側および復号化側に直接展開することができ、このような場合、フィルタ関連パラメータを伝送する必要はない。当該CNNフィルタ201は、ブロック分割情報および/またはQP情報などの補助情報を、入力される複数の画像成分と融合することもでき、このようにして、複数の画像成分間の関係を十分に利用するだけでなく、計算の複雑さを軽減し、符号化ビットレートを節約する同時に、さらに、ビデオの符号化・復号化プロセスで再構成された画像の主観的及び客観的な品質を向上させる。
【0020】
本願実施例のループフィルタリング方法は、符号化システムだけでなく、復号化システムにも適用できることに留意されたい。一般に、符号化ビットレートを節約する同時に、復号化システムの正しい復号化処理を確実にするために、本願実施例のループフィルタは、符号化システムと復号化システムの両方に展開される必要がある。以下、符号化システムへの適用を例として詳細に説明する。
【0021】
図3を参照すると、本願実施例によるループフィルタリング方法の例示的なフローチャートを示し、当該方法は、以下のステップを含み得る。
【0022】
ステップS301において、フィルタリングされる画像を取得し、ここで、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記符号化されるビデオは、原画像フレームを含み、前記原画像フレームは、前記原画像を含む。
【0023】
ステップS302において、前記フィルタリングされる画像の融合情報を決定し、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものである。
【0024】
S303において、前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング前記フィルタリングされる画像の少なくとも1つの画像成分を取得する。
【0025】
留意されたいこととして、原画像は、CTUに分割されることができ、またはCTUはCUに分割されることができ、つまり、本願実施例におけるブロック分割情報は、CTU分割情報を指すが、またはCU分割情報を指すこともできる。したがって、本願実施例のループフィルタリング方法は、CUレベルのループフィルタリングだけでなく、CTUレベルのループフィルタリングにも適用されることができ、本願実施例は、これに対して特に限定しない。
【0026】
本願実施例において、フィルタリングされる画像を取得し、ここで、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記符号化されるビデオは、原画像フレームを含み、前記原画像フレームは、前記原画像を含み、前記フィルタリングされる画像の融合情報を決定し、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものである。このようにして、複数の画像成分間の関係を十分に利用するだけでなく、これらの複数の画像成分に対して実行すべき複数回の完全なネットワークフォワード計算を効果的に回避し、さらに、計算の複雑さを減らし、符号化ビットレートを節約する。最後に、融合情報に基づいて、フィルタリングされる画像に対してループフィルタリング処理を実行して、前記フィルタリングされる画像フィルタリングされた少なくとも1つの画像成分を取得する。融合情報にブロック分割情報および/またはQP情報などの補助情報を融入することにより、フィルタリングをさらに支援することができ、ビデオの符号化・復号化プロセスで再構成された画像の主観的及び客観的な品質を向上させる。
【0027】
いくつかの実施例において、画像成分は、第1画像成分、第2画像成分および第3画像成分を含み、ここで、前記第1画像成分は、輝度成分を表し、前記第2画像成分は、第1色度成分を表し、前記第3画像成分は、第2色度成分を表す。
【0028】
ビデオ画像では、通常、第1画像成分、第2画像成分および第3画像成分を使用して、原画像またはフィルタリングされる画像を表すことに留意されたい。ここで、輝度-色度成分表現法では、この3つの画像成分は、それぞれ、1つの輝度成分、1つの青彩(色差)成分および1つの赤彩(色差)成分であり、具体的に、輝度成分は、通常、符号Yで表され、青彩成分は、通常、符号Cb又はUで表され、赤彩成分は、通常、符号Cr又はVで表示される。本願実施例において、第1画像成分は、輝度成分Yであり得、第2画像成分は、青彩成分Uであり得、第3画像成分は、赤彩成分Vであり得るが、本願実施例では、特に限定されない。ここで、少なくとも1つの画像成分は、第1画像成分、第2画像成分、および第3画像成分のうちの1つまたは複数を表し、少なくとも2つの画像成分は、第1画像成分、第2画像成分および第3画像成分であってもよいし、第1画像成分および第2画像成分であってもよいし、第1画像成分および第3画像成分であってもよいし、第2画像成分および第3画像成分であってもよく、本願実施例では、特に限定されない。
【0029】
【0030】
4:2:0フォーマットのYUVを例にとると、第1画像成分のサイズ情報は、第2画像成分または第3画像成分とは異なるため、第1画像成分および/または第2画像成分および/または第3画像成分を一度に改良型ループフィルタに入力するために、3つの画像成分の空間領域サイズ情報が同じになるように、この3つの画像成分をサンプリングまたは再結合する必要がある。
【0031】
いくつかの実施例において、3つの画像成分の空間領域サイズ情報が同じになるように、高解像度の画像成分に対してピクセル再配列処理(ダウンサンプリング処理とも呼ばれる)を実行することができる。具体的には、前記フィルタリングされる画像の少なくとも2つの画像成分を前記補助情報と融合する前に、前記方法は、
前記フィルタリングされる画像の少なくとも2つの画像成分から、高解像度の画像成分を選択することと、
前記高解像度の画像成分に対して、ピクセル再配列処理を実行することと、をさらに含む。
【0032】
【0033】
いくつかの実施例において、3つの画像成分の空間領域サイズ情報を同じにするために、低解像度の画像成分に対してアップサンプリング処理を実行することもできる。具体的には、前記フィルタリングされる画像の少なくとも2つの画像成分を前記補助情報と融合する前に、前記方法は、
前記フィルタリングされる画像の少なくとも2つの画像成分から低解像度の画像成分を選択することと、
前記低解像度の画像成分に対してアップサンプリング処理を実行することと、をさらに含む。
【0034】
高解像度の画像成分に対してサイズ情報に基づくピクセル再配列処理(即ち、下方調整)を実行することに加えて、本願実施例では、低解像度の画像成分に対してアップサンプリング処理(即ち、上方調整)も実行することができることに留意されたい。さらに、低解像度の画像成分については、アップサンプリング処理だけでなく、逆畳み込み処理を実行することもでき、さらに、超解像度処理を実行することもでき、この3つのタイプの処理で同じ効果が得られ、本願実施例では、特に限定されない。
【0035】
【0036】
いくつかの実施例において、前記フィルタリングされる画像を取得することは、
符号化されるビデオ内の原画像に対してビデオ符号化処理を実行して生成された再構成画像を、前記フィルタリングされる画像として使用すること、または、
符号化されるビデオ内の原画像に対してビデオ符号化処理を実行して再構成画像を生成し、前記再構成画像に対してプリセットフィルタリング処理を実行し、プリセットフィルタリング処理後の画像を前記フィルタリングされる画像として使用することを含む。
【0037】
改良型符号化ブロック
図20に基づいて、符号化されるビデオ内の原画像に対してビデオ符号化を実行するプロセスにおいて、原画像に対してビデオ符号化処理を実行する場合、当該原画像に対してCU分割、予測、変換および量子化などの処理を実行することができ、後続の符号化される画像のビデオ符号化のための参照画像を取得するために、逆変換および逆量子化、再構成およびフィルタリングなどの処理も実行することができることに留意されたい。したがって、本願実施例におけるフィルタリングされる画像は、ビデオ符号化プロセスでの再構成によって生成された再構成画像であってもよいし、再確立画像に対して他のプリセットフィルタリング方法(例えば、デブロッキングフィルタリング方法)を使用して、プリセットフィルタリングを実行することによって得られた画像であってもよく、本願実施例では、特に限定されない。
【0038】
いくつかの実施例において、前記フィルタリングされる画像の融合情報を決定する前に、前記ループフィルタリング方法は、
前記フィルタリングされる画像に対応する補助情報を決定することをさらに含み、ここで、前記補助情報は、少なくともブロック分割情報および/または量子化パラメータ情報を含む。
【0039】
補助情報は、フィルタリング品質を向上させるためにフィルタリングを支援するために使用されることが理解できる。本願実施例において、補助情報は、ブロック分割情報(例えば、CU分割情報および/またはCTU分割情報)であってもよいし、量子化パラメータ情報であってもよいし、動きベクトル(MV:Motion Vector)情報、予測方向情報などであってもよい。これらの情報は、独立して補助情報として使用することができ、補助情報として自由に組み合わせることもできる。例えば、ブロック分割情報を独立して補助情報として使用することも、ブロック分割情報および量子化パラメータ情報を補助情報として使用することも、ブロック分割情報およびMV情報を補助情報として使用することもでき、本願実施例では、特に限定されない。
【0040】
また、原画像をCTUに分割することも、CTUをCUに分割することもできるため、本願実施例のループフィルタリング方法は、CUレベルのループフィルタリング(この場合、ブロック分割情報はCU分割情報である)だけでなく、CTUレベルのループフィルタリング(この場合、ブロック分割情報はCTU分割情報である)にも適用されることができ、本願実施例では、特に限定されないことを理解されたい。以下では、CU分割情報をブロック分割情報として使用することを例として説明する。
【0041】
いくつかの実施例において、前記フィルタリングされる画像に対応する補助情報を決定することは、
符号化されるビデオ内の原画像に対してCU分割を実行して、CU分割情報を取得し、前記CU分割情報を前記フィルタリングされる画像に対応するブロック分割情報として使用することを含む。
【0042】
さらに、いくつかの実施例において、前記CU分割情報を前記フィルタリングされる画像に対応するブロック分割情報として使用することは、
前記CU分割情報について、CU境界に対応する各画素点位置を第1値で埋め、他の画素点位置を第2値で埋めることによって、前記CU分割情報に対応する第1行列を取得することであって、ここで、前記第1値は前記第2値とは異なる、ことと、
前記第1行列を前記フィルタリングされる画像に対応するブロック分割情報として使用することと、を含む。
【0043】
第1値は、事前に設定された数値、アルファベットなどであり得、第2値も、事前に設定された数値、アルファベットなどであり得、第1値は、第2値とは異なることに留意されたい。例えば、第1値を2に設定し、第2値を1に設定することができるが、本願実施例では、特に限定されない。
【0044】
本願実施例において、CU分割情報は、フィルタリングされる画像のフィルタリング処理を支援するための補助情報として使用されることができる。つまり、符号化されるビデオ内の原画像のビデオ符号化プロセスにおいて、CU分割情報は、十分に利用され、フィルタリングをガイドするためにフィルタリングされる画像の少なくとも2つの画像成分と融合されることができる。
【0045】
具体的には、CU分割情報は、二次元行列、即ち、CUmap行列、即ち、本願実施例における第1行列で表されるコーディングユニットマップ(CUmap:Coding Unit Map)に変換されることができる。つまり、原画像を複数のCUに分割することができる。各CUの境界に対応する各画素点位置を第1値で埋め、他の画素点位置を第2値で埋めることによって、CU分割情報を反映する第1行列を構築することができる。例示的に、
図4を参照すると、本願実施例によるブロック分割行列の例示的な構造図を示す。
図4に示されたように、当該図が1つのCTUを示す場合、当該CTUを9つのCUに分割することができ、第1値を2に設定し、第2値を1に設定すると、各CUの境界に対応する各画素点位置を2で埋め、他の画素点位置を1で埋める。つまり、2で埋められた画素点位置を使用してCUの境界を表し、これにより、CU分割情報、即ち、フィルタリングされる画像に対応する補助情報を決定することができる。
【0046】
いくつかの実施例において、前記フィルタリングされる画像に対応する補助情報を決定することは、
符号化されるビデオ内の原画像に対応する量子化パラメータを取得し、前記量子化パラメータを前記フィルタリングされる画像に対応する量子化パラメータ情報として使用することを含む。
【0047】
さらに、いくつかの実施例において、前記量子化パラメータを前記フィルタリングされる画像に対応する量子化パラメータ情報として使用することは、
前記原画像と同じサイズの第2行列を確立することであって、ここで、前記第2行列の各画素点位置はすべて、前記原画像に対応する量子化パラメータの正規化値で埋められる、ことと、
前記第2行列を前記フィルタリングされる画像に対応する量子化パラメータ情報として使用することと、を含む。
【0048】
異なる量子化パラメータに対応するフィルタリングされる画像は、その歪み程度も異なることに留意されたい。量子化パラメータ情報を融合すると、フィルタリングネットワークは、トレーニングプロセスで任意の量子化パラメータを処理する能力を適応的に備えることができる。
【0049】
本願実施例において、量子化パラメータ情報はまた、フィルタリングされる画像のフィルタリング処理を支援するための補助情報として使用されることができる。つまり、符号化されるビデオ内の原画像のビデオ符号化プロセスにおいて、量子化パラメータ情報は、十分に利用され、フィルタリングをガイドするためにフィルタリングされる画像の少なくとも2つの画像成分と融合されることができる。ここで、量子化パラメータ情報に対して正規化処理を実行することができ、又は量子化パラメータ情報に対して非正規化処理(例えば、分類処理、間隔分割処理など)を実行することもでき、以下では、量子化パラメータに対して正規化処理を実行することを例として詳細に説明する。
【0050】
【0051】
【0052】
いくつかの実施例において、改良型ループフィルタは、畳み込みニューラルネットワークフィルタを含み得る。
【0053】
改良型ループフィルタは、フィルタリングされる画像に対するループフィルタリング処理を実現するように構成されることに留意されたい。ここで、改良型ループフィルタは、畳み込みニューラルネットワークフィルタであってもよいし、深層学習によって構築された他のフィルタであってもよく、本願実施例では、特に限定されない。ここで、畳み込みニューラルネットワークフィルタは、CNNフィルタとも呼ばれ、それは、畳み込み計算を含み、且つ、深層構造を持つフィードフォワードニューラルネットワークであり、深層学習の代表的なアルゴリズムの1つである。CNNフィルタの入力層は、符号化されるビデオ内の原画像の3つの画像成分(Y/U/V)チャネルなどの多次元データを処理することができる。
【0054】
【0055】
【0056】
図5に示される従来のCNNフィルタ50または
図6Aおよび
図6Bに示される従来のCNNフィルタ60の場合、異なる画像成分間の関係は考慮されておらず、各画像成分を独立して処理することはそれほど合理的ではない。さらに、入力側では、ブロック分割情報やQP情報などの符号化パラメータが十分に利用されていないが、再構成画像の歪みは主にブロッキング効果によるものであり、ブロッキング効果の境界情報は、CU分割情報によって决定されたものである。したがって、CNNフィルタのフィルタリングネットワークは、境界領域に焦点を合わせる必要がある。さらに、量子化パラメータ情報をフィルタリングネットワークに融入することは、その一般化能力を向上させることに役立ち、フィルタリングネットワークが任意の品質の歪み画像をフィルタリングすることを可能にすることができる。したがって、本願実施例によるループフィルタリング方法によれば、CNNフィルタリング構造の設定が合理的であって、同じフィルタリングネットワークが複数の画像成分を同時に受信できるだけでなく、複数の画像成分間の関係も十分に考慮されており、フィルタリング処理後に、これらの画像成分の強調された画像をさらに同時に出力することができる。さらに、当該ループフィルタリング方法によれば、ブロック分割情報および/またはQP情報などの符号化パラメータを補助情報として融合させてフィルタリングを支援することもできるため、フィルタリング品質を向上させることができる。
【0057】
いくつかの実施例において、前記フィルタリングされる画像の融合情報を決定することは、
前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報に対して融合処理を実行して、前記フィルタリングされる画像の融合情報を取得することを含む。
【0058】
本願実施例における融合情報について、フィルタリングされる画像の第1画像成分、第2画像成分および第3画像成分を補助情報と融合して、融合情報を取得することができ、又はフィルタリングされる画像の第1画像成分、第2画像成分を補助情報と融合して、融合情報を取得することができ、又はフィルタリングされる画像の第1画像成分及び第3画像成分を補助情報と融合して、融合情報を取得することができ、又はフィルタリングされる画像の第2画像成分及び第3画像成分を補助情報と融合して、融合情報を取得することができ、本願実施例では、特に限定されないことに留意されたい。さらに、「前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報に対して融合処理を実行」することは、まず、フィルタリングされる画像の少なくとも2つの画像成分を融合し、次に、融合された画像成分と補助情報を融合することであり得、又は、まず、フィルタリングされる画像の少なくとも2つの画像成分の各画像成分と、対応する補助情報をそれぞれ融合し、次に、処理された少なくとも2つの画像成分を融合することであり得る。つまり、本願実施例では、融合処理の具体的な方式を特に限定しないことに留意されたい。
【0059】
さらに、本願実施例における「前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得する」ことは、具体的には、フィルタリングされる画像の複数の画像成分(例えば、第1画像成分、第2画像成分および第3画像成分)と補助情報を融合して、フィルタリングネットワークに入力した後、フィルタリング後のフィルタリングされる画像の第1画像成分、またはフィルタリング後の第2画像成分、またはフィルタリング後の第3画像成分のみを出力することであり得るか、又はフィルタリング後のフィルタリングされる画像の第1画像成分およびフィルタリング後の第2画像成分を出力することであり得るか、又はフィルタリング後の第2画像成分およびフィルタリング後の第3画像成分を出力することであり得るか、又はフィルタリング後の第1画像成分およびフィルタリング後の第3画像成分を出力することであり得るか、又はフィルタリング後のフィルタリングされる画像の第1画像成分、フィルタリング後の第2画像成分、およびフィルタリング後の第3画像成分を出力することであり得、本願実施例では、特に限定されない。
【0060】
フィルタリングされる画像の3つの画像成分をフィルタリングネットワークに同時に入力することを例にとると、
図7を参照すると、本願実施例によるループフィルタリングフレームワーク70の構成の例示的な構造図を示す。
図7に示されるように、当該ループフィルタリングフレームワーク70は、フィルタリングされる画像の3つの画像成分(それぞれ、Y、U、Vで表される)701、補助情報702、入力融合ユニット703、共同処理ユニット704、第1加算器705、第2加算器706、第3加算器707および3つのフィルタリングされた画像成分(それぞれ、Out_Y、Out_U、Out_Vで表される)708を含み得る。ここで、入力融合ユニット703、共同処理ユニット704、第1加算器705、第2加算器706、および第3加算器707は、本願実施例における改良型ループフィルタを形成する。入力融合ユニット703は、フィルタリングされる画像の3つの画像成分701と、補助情報702とを融合して、共同処理ユニット704に入力するように構成される。共同処理ユニット704は、複数層の畳み込みフィルタリングネットワークを含み得、入力情報に対して畳み込み計算を実行するように構成される。具体的な畳み込み計算プロセスは、関連する技術的解決策に類似しているため、共同処理ユニット704によって実行される具体的なステップは説明されない。共同処理ユニット704の処理後、画像成分Yの残差情報、画像成分Uの残差情報、および画像成分Vの残差情報をそれぞれ取得することができる。フィルタリングされる画像の3つの画像成分701のうちの画像成分Yと、取得された画像成分Yの残差情報を第1加算器705に一緒に入力する場合、第1加算器705の出力は、フィルタリングされたY画像成分(Out_Yで表される)であり得る。フィルタリングされる画像の3つの画像成分701のうちの画像成分Uと、取得された画像成分Uの残差情報を第2加算器706に一緒に入力する場合、第2加算器706の出力は、フィルタリングされた画像成分U(Out_Uで表される)である。フィルタリングされる画像の3つの画像成分701のうちの画像成分Vと、取得された画像成分Vの残差情報を第3加算器707に一緒に入力する場合、第3加算器707の出力は、フィルタリングされた画像成分V(Out_Vで表される)であ
る。ここで、出力される成分について、フィルタリングされた画像成分Yのみを出力する必要がある場合、ループフィルタリングフレームワーク70は、第2加算器706および第3加算器707を含まなくてもよい。フィルタリングされた画像成分Uのみを出力する必要がある場合、ループフィルタリングフレームワーク70は、第1加算器705および第3加算器707を含まなくてもよい。フィルタリングされた画像成分Yおよびフィルタリングされた画像成分Uを出力する必要がある場合、ループフィルタリングフレームワーク70は、第3加算器707を含まなくてもよく、本願実施例では、特に限定されない。
【0061】
フィルタリングされる画像の2つの画像成分をフィルタリングネットワークに同時に入力することを例にとると、
図8を参照すると、本願実施例による別のループフィルタリングフレームワーク80の構成の例示的な構造図を示す。
図8に示されるように、ループフィルタリングフレームワーク80は、フィルタリングされる画像の2つの画像成分(それぞれ、YおよびUで表される)801、補助情報702、入力融合ユニット703、共同処理ユニット704、第1加算器705、第2加算器706、および2つのフィルタリングされた画像成分(それぞれ、Out_YおよびOut_Uで表される)802を含む。
図7に示されるループフィルタリングフレームワーク70との違いは、当該ループフィルタリングフレームワーク80が、フィルタリングされる画像の2つの画像成分801と補助情報702をすべて融合して、共同処理ユニット704に入力することである。共同処理ユニット704の処理後、画像成分Yの残差情報および画像成分Uの残差情報をそれぞれ取得することができる。フィルタリングされる画像の2つの画像成分801のうちの画像成分Yと、取得された画像成分Yの残差情報を第1加算器705に一緒に入力する場合、第1加算器705の出力は、フィルタリングされた画像成分Y(Out_Yで表される)であり、フィルタリングされる画像の2つの画像成分801のうちの画像成分Uと、取得された画像成分Uの残差情報を第2加算器706に一緒に入力する場合、第2加算器706の出力は、フィルタリングされた画像成分U(Out_Uで表される)である。ここで、出力される成分について、フィルタリングされた画像成分Yのみを出力する必要がある場合、ループフィルタリングフレームワーク70は、第2加算器706を含まなくてもよい。フィルタリングされた画像成分Uのみを出力する必要がある場合、ループフィルタリングフレームワーク70は、第1加算器705を含まなくてもよく、本願実施例では、特に限定されない。注意されるべきように、一度に、フィルタリングされる画像のシングル画像成分のみのフィルタリング処理を考慮する場合、関連する技術的解決策における従来のCNNフィルタのフィルタリング処理方法のように、複数の画像成分間の融合を考慮する必要はなく、本願実施例では、詳細は省略されている。
【0062】
図7に示されるループフィルタリングフレームワーク70を例にとると、深層学習ネットワーク(CNNなど)を採用してループフィルタリングを実行する。従来のCNNフィルタとの違いは、本願実施例における改良型ループフィルタは、フィルタリングされる画像の3つの画像成分をフィルタリングネットワークに同時に入力することができ、さらに、符号化に関する他の補助情報(例えば、ブロック分割情報、量子化パラメータ情報、MV情報などの符号化パラメータ)を融合し、これらのすべての情報を融合して、一度にフィルタリングネットワークに入力することである。このようにして、3つの画像成分間の関係を十分に利用するだけでなく、符号化に関する他の補助情報も使用してフィルタリングを支援することにより、フィルタリング品質を向上させる。さらに、3つの画像成分を同時に処理することで、この3つの画像成分に対して、3回の完全なネットワークフォワード計算を実行する必要があるという問題も効果的に解決し、さらに、計算の複雑さを低減し、符号化ビットレートを節約する。例えば、VTM3.0に基づき、関連する技術的解決策と比較すると、ある実験テスト中に、本願実施例によるループフィルタリング方法は、同じ程度の復元されたビデオ品質を前提として、画像成分Yについて6.4%のビットレート低減、画像成分Uについて9.8%のビットレート低減、および画像成分Vについて11.6%のビットレート低減を同時に実現できることが実験的試験において見出されており、これにより、符号化ビットレートを節約することができる。
【0063】
上記の実施例によるループフィルタリング方法によれば、フィルタリングされる画像を取得し、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記フィルタリングされる画像の融合情報を決定し、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものであり、前記融合情報に基づいて、フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得する。このようにして、ブロック分割情報および/またはQP情報などの符号化パラメータを補助情報として、入力される複数の画像成分と融合することにより、複数の画像成分間の関係を十分に利用するだけでなく、計算の複雑さを軽減し、符号化ビットレートを節約する同時に、さらに、ビデオの符号化・復号化プロセスで再構成された画像の主観的及び客観的な品質を向上させる。
【0064】
上記の実施例と同じ発明構想に基づいて、
図9を参照すると、本願実施例によるループフィルタリング装置90の構成の例示的な構造図を示す。当該ループフィルタリング装置90は、取得ユニット901、決定ユニット902、およびフィルタリングユニット903を備えることができ、ここで、
前記取得ユニット901は、フィルタリングされる画像を取得するように構成され、ここで、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記符号化されるビデオは、原画像フレームを含み、前記原画像フレームは、前記原画像を含み、
前記決定ユニット902は、前記フィルタリングされる画像の融合情報を決定するように構成され、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものであり、
前記フィルタリングユニット903は、前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得するように構成される。
【0065】
上記の解決策では、前記取得ユニット901は、具体的に、符号化されるビデオ内の原画像に対してビデオ符号化処理を実行し、生成された再構成画像を前記フィルタリングされる画像として使用するように構成されるか、または、
前記取得ユニット901は、具体的に、符号化されるビデオ内の原画像に対してビデオ符号化処理を実行して、再構成画像を生成し、前記再構成画像に対してプリセットフィルタリング処理を実行し、プリセットフィルタリング処理後の画像を前記フィルタリングされる画像として使用するように構成される。
【0066】
上記の解決策では、前記決定ユニット902は、さらに、前記フィルタリングされる画像に対応する補助情報を決定するように構成され、ここで、前記補助情報は、少なくともブロック分割情報および/または量子化パラメータ情報を含む。
【0067】
上記の解決策では、
図9を参照すると、前記ループフィルタリング装置90は、さらに、分割ユニット904を備え、前記分割ユニット904は、符号化されるビデオ内の原画像に対してCU分割を実行して、CU分割情報を取得し、前記CU分割情報を前記フィルタリングされる画像に対応するブロック分割情報として使用するように構成される。
【0068】
上記の解決策では、前記決定ユニット902は、具体的に、前記CU分割情報について、CU境界に対応する各画素点位置を第1値で埋め、他の画素点位置を第2値で埋めることによって、前記CU分割情報に対応する第1行列を取得し、前記第1行列を前記フィルタリングされる画像に対応するブロック分割情報として使用するように構成され、ここで、前記第1値は前記第2値とは異なる。
【0069】
上記の解決策では、前記取得ユニット901は、さらに、符号化されるビデオ内の原画像に対応する量子化パラメータを取得し、前記量子化パラメータを前記フィルタリングされる画像に対応する量子化パラメータ情報として使用するように構成される。
【0070】
上記の解決策では、前記決定ユニット902は、具体的に、前記原画像と同じサイズの第2行列を確立し、前記第2行列を前記フィルタリングされる画像に対応する量子化パラメータ情報として使用するように構成され、ここで、前記第2行列の各画素点位置はすべて、前記原画像に対応する量子化パラメータの正規化値で埋められる。
【0071】
上記の解決策では、
図9を参照すると、前記ループフィルタリング装置90は、さらに、融合ユニット905を備え、前記融合ユニット905は、前記フィルタリングされる画像の少なくとも2つの画像成分及び対応する補助情報に対して融合処理を実行して、前記フィルタリングされる画像の融合情報を取得するように構成される。
【0072】
上記の技術案において、
図9を参照すると、前記ループフィルタリング装置90は、さらに、サンプリングユニット906を備え、前記サンプリングユニット906は、前記フィルタリングされる画像の少なくとも2つの画像成分から低解像度の画像成分を選択し、前記低解像度の画像成分に対して、アップサンプリング処理を実行するように構成される。
【0073】
本実施例において、「ユニット」は、回路の一部、プロセッサの一部、プログラムまたはソフトウェアの一部等であってもよく、もちろん、モジュール式であってもよいし、または非モジュール式であってもよいことを理解されたい。さらに、本実施例における各構成部分は、1つの処理ユニットに統合されてもよく、各ユニットが物理的に別個に存在してもよく、2つ以上のユニットが1つのユニットに統合されてもよい。前述した統合ユニットは、ハードウェアの形で実現することができ、ソフトウェア機能モジュールの形で実現することもできる。
【0074】
前記統合されたユニットが、ソフトウェア機能モジュールの形で実装され、独立した製品として販売または使用されていない場合、1つのコンピュータ可読記憶媒体に記憶することができる、このような理解に基づいて、本実施例の技術的解決策は、本質でまたは先行技術に対して貢献のある部分または当該技術の解決策の全部または一部は、ソフトウェア製品の形で具現されることができ、当該コンピュータソフトウェア製品は、1つの記憶媒体に記憶されて、1つのコンピュータデバイス(パーソナルコンピュータ、サーバ、またはネットワークデバイスなどであリ得る)またはプロセッサ(processor)が本実施例に記載の方法のステップの全部または一部を実行させるために、いくつかの命令を含む。前述した記憶媒体は、Uディスク、モバイルハードディスク、読み取り専用メモリ(ROM:Read Only Memory)、ランダムアクセスメモリ(RAM:Random Access Memory)、磁気ディスクまたは光ディスク等のプログラムコードを記憶することができる様々な媒体を含む。
【0075】
したがって、本実施例は、ループフィルタリングの実現プログラムが記憶されているコンピュータ記憶媒体を提供し、前記ループフィルタリングの実現プログラムが、少なくとも1つのプロセッサによって実行されるときに、上記の実施例における方法のステップを実現する。
【0076】
上記のループフィルタリング装置90の構成およびコンピュータ記憶媒体に基づいて、
図10を参照すると、本願実施例によるループフィルタリング装置90の具体的なハードウェアの構造の例を示し、これは、ネットワークインターフェース1001、メモリ1002およびプロセッサ1003を含み得る。各コンポーネントは、バスシステム1004を介して一緒に結合される。理解できることとして、バスシステム1004は、これらのコンポーネント間の接続通信を具現するために使用される。データバスに加えて、バスシステム1004は、電力バス、制御バスおよびステータス信号バスを含む。しかしながら、説明を明確にするために、
図10では様々なバスをバスシステム1004として表記されている。ここで、ネットワークインターフェース1001は、別の外部ネットワーク要素と情報を送受信するプロセスにおいて信号を送受信するように構成され、
メモリ1002は、プロセッサ1003で実行可能なコンピュータプログラムを記憶するように構成され、
プロセッサ1003は、前記コンピュータプログラムを実行することにより、以下のステップを実行するように構成され、前記ステップは、
フィルタリングされる画像を取得することであって、ここで、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものであり、前記符号化されるビデオは、原画像フレームを含み、前記原画像フレームは、前記原画像を含む、ことと、
前記フィルタリングされる画像の融合情報を決定することであって、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と対応する補助情報を融合して得られたものである、ことと、
前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得することと、を含む。
【0077】
本願実施例におけるメモリ1002は、揮発性メモリまたは不揮発性メモリであり得、または揮発性および不揮発性メモリの両方を含み得ることを理解されたい。ここで、不揮発性メモリは、読み取り専用メモリ(ROM:Read-Only Memory)、プログラム可能な読み取り専用メモリ(PROM:Programmable ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM:Erasable PROM)、電気的に消去可能なプログラマブル読み取り専用メモリ(EEPROM:Electrically EPROM)、またはフラッシュメモリであり得る。揮発性メモリは、外部キャッシュとして使用される、ランダムアクセスメモリ(RAM:Random Access Memory)であり得る。例示的であるが限定的な説明ではないが、例えば、スタティックランダムアクセスメモリ(SRAM:Static RAM)、ダイナミックランダムアクセスメモリ(DRAM:Dynamic RAM)、同期ダイナミックランダムアクセスメモリ(SDRAM:Synchronous DRAM)、ダブルデータレートの同期ダイナミックランダムアクセスメモリ(DDRSDRAM:Double Data Rate SDRAM)、強化された同期ダイナミックランダムアクセスメモリ(ESDRAM:Enhanced SDRAM)、ダイナミックランダムアクセスメモリの同期接続(SLDRAM:Synchlink DRAM)およびダイレクトメモリバスランダムアクセスメモリ(DRRAM:Direct Rambus RAM)など様々な形のRAMを使用することができる。本明細書によって説明されるシステムおよび方法のメモリ1002は、これらおよび任意の他の適切なタイプのメモリを含むがこれに限定されないことを意図する。
【0078】
プロセッサ1003は、信号の処理能力を有する集積回路チップであり得る。実現プロセスにおいて、上記の方法の各ステップは、プロセッサ1003内のハードウェアの集積論理回路またはソフトウェアの形の命令によって完了できる。上記のプロセッサ1003は、汎用プロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)、フィールドプログラマブルゲートアレイ(FPGA:Field Programmable Gate Array)、または他のプログラマブルロジックデバイス、ディスクリートゲート、またはトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなどであってもよい。本願実施例で開示された各方法、ステップおよび論理ブロック図を実現または実行できる。汎用プロセッサは、マイクロプロセッサであり得、または当該プロセッサは、任意の従来のプロセッサなどであり得る。本願実施例で開示される方法のステップは、ハードウェア復号化プロセッサによって直接実行されてもよいし、復号化プロセッサ内のハードウェアとソフトウェアモジュールの組み合わせによって実行されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラマブル読み取り専用メモリ、または電気的に消去可能なプログラマブルメモリ、レジスタなどの従来の記憶媒体に配置されることができる。当該記憶媒体は、メモリ1003に配置され、プロセッサ1003は、メモリ1002内の情報を読み取り、そのハードウェアと組み合わせて前記方法のステップを完了する。
【0079】
本明細書に記載のこれらの実施例は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコードまたはそれらの組み合わせで実現されることができることを理解することができる。ハードウェアの実現に対して、処理ユニットは、1つの或複数の特定用途向け集積回路(ASIC:Application Specific Integrated Circuits)、デジタル信号プロセッシング(DSP:Digital Signal Processing)、デジタル信号処理機器(DSPD:DSP Device)、プログラマブルロジックデバイス(PLD:Programmable Logic Device)、フィールドプログラマブルゲートアレイ(FPGA:Field-Programmable Gate Array)、汎用プロセッサ、コントローラ、マイクロコントローラ、本願に記載の機能を実行するように構成される他の電子ユニットまたはその組み合わせに実現される。
【0080】
ソフトウェアを用いた実行の場合、本明細書に記載の機能を実行するモジュール(プロセス、関数など)を介して、本明細書に記載の技術を実現することができる。ソフトウェアコードは、メモリに記憶され、プロセッサによって実行されることができる。メモリは、プロセッサ内またはプロセッサ外に実装することができる。
【0081】
例示的に、別の実施例として、プロセッサ1003は、さらに、前記コンピュータプログラムを実行することにより、上記の実施例における方法のステップを実行するように構成される。
【0082】
本願実施例で説明された技術的解決は、競合することなく、任意に組み合わせることができることに留意されたい。
【0083】
上記は、本願の具体的な実施形態に過ぎず、本願の保護範囲はこれに限定されない。当業者は、本願で開示された技術的範囲内で容易に想到し得る変更または置換は、すべて本願の保護範囲に含まれるべきである。したがって、本願の保護範囲は、特許請求の保護範囲に従うものとする。
【産業上の利用可能性】
【0084】
本願実施例では、まず、フィルタリングされる画像を取得し、前記フィルタリングされる画像は、符号化されるビデオ内の原画像のビデオ符号化プロセスで生成されたものである。その後、前記フィルタリングされる画像の融合情報を決定し、ここで、前記融合情報は、前記フィルタリングされる画像の少なくとも2つの画像成分と、対応する補助情報を融合して得られたものである。、最後に、前記融合情報に基づいて、前記フィルタリングされる画像に対してループフィルタリング処理を実行して、フィルタリング後の前記フィルタリングされる画像の少なくとも1つの画像成分を取得する。このようにして、ブロック分割情報および/またはQP情報などの符号化パラメータを補助情報として、入力される複数の画像成分と融合することにより、複数の画像成分間の関係を十分に利用するだけでなく、これらの複数の画像成分に対して実行すべき複数回の完全なネットワークフォワード計算を効果的に回避し、さらに、計算の複雑さを軽減し、符号化ビットレートを節約する。さらに、ブロック分割情報および/またはQP情報などの補助情報を融合することにより、フィルタリングをさらに支援することができ、ビデオの符号化・復号化プロセスで再構成された画像の主観的及び客観的な品質を向上させる。