IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ホアウェイ・テクノロジーズ・カンパニー・リミテッドの特許一覧

特開2024-137955品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法
<>
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図1
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図2
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図3
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図4
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図5
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図6
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図7
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図8
  • 特開-品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024137955
(43)【公開日】2024-10-07
(54)【発明の名称】品質最適化デブロッキングを実行するためのイメージ処理デバイス及び方法
(51)【国際特許分類】
   H04N 19/117 20140101AFI20240927BHJP
   H04N 19/167 20140101ALI20240927BHJP
   H04N 19/182 20140101ALI20240927BHJP
   H04N 19/86 20140101ALI20240927BHJP
【FI】
H04N19/117
H04N19/167
H04N19/182
H04N19/86
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024101985
(22)【出願日】2024-06-25
(62)【分割の表示】P 2023136385の分割
【原出願日】2019-09-24
(31)【優先権主張番号】62/735,712
(32)【優先日】2018-09-24
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】504161984
【氏名又は名称】ホアウェイ・テクノロジーズ・カンパニー・リミテッド
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133569
【弁理士】
【氏名又は名称】野村 進
(72)【発明者】
【氏名】コトラ、アナンド メハー
(72)【発明者】
【氏名】エセンリク、セミ
(72)【発明者】
【氏名】ワン、ビャオ
(72)【発明者】
【氏名】ガオ、ハン
(72)【発明者】
【氏名】ツァオ、ツィジェ
(72)【発明者】
【氏名】チェン、ジアンレ
(57)【要約】
【課題】ブロック符号でエンコードされたイメージの第1のブロックと第2のブロックとの間のブロックエッジをデブロッキングするための、イメージエンコーダ及び/又はイメージデコーダにおける使用のためのイメージ処理デバイス(501)を提供する。
【解決手段】イメージ処理デバイス(501)は、ブロックエッジをフィルタリングするためのフィルタ(502)を備え、ブロックエッジからのデブロッキング範囲であって、ブロックエッジに垂直となるデブロッキング範囲内のフィルタリング対象の画素の少なくともいくつかに対して、画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定し、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定し、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られるように構成される。
【選択図】図9
【特許請求の範囲】
【請求項1】
ブロック符号でエンコードされたイメージの第1のブロック(401)と第2のブロック(402)との間のブロックエッジ(403、800)をデブロッキングするための、イメージエンコーダ(600)及び/又はイメージデコーダ(700)における使用のためのイメージ処理デバイス(501、601、701)であって、イメージ処理デバイス(501、601、701)は、ブロックエッジ(403、800)をフィルタリングするためのフィルタ(502、602、702)を備え、ブロックエッジ(403、800)からのデブロッキング範囲内のフィルタリング対象の少なくとも1つの画素に対して、
画素の元の画素値からフィルタリングされる画素値を決定し、
ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定し、
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られる
ように構成される、イメージ処理デバイス(501、601、701)。
【請求項2】
クリッピング値は、元の画素値とデブロッキングされた画素値との間で最大限許容される変化量である、請求項1に記載のイメージ処理デバイス(501、601、701)。
【請求項3】
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られることは、
フィルタリングされる画素値とデブロッキングされた画素値との間の差の絶対値が画素のクリッピング値を越えない場合、デブロッキングされた画素値をフィルタリングされる画素値に設定することと、
フィルタリングされる画素値が、元の画素値プラスクリッピング値を超える場合、デブロッキングされた画素値を、元の画素値プラス画素のクリッピング値に設定することと、
フィルタリングされる画素値が、元の画素値マイナスクリッピング値より小さい場合、デブロッキングされた画素値を、元の画素値マイナス画素のクリッピング値に設定することと
を有する、請求項1又は2に記載のイメージ処理デバイス(501、601、701)。
【請求項4】
フィルタ(502、602、702)は、関数又はルックアップテーブルを用いることにより、ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定するように適合される、請求項1から3のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)。
【請求項5】
フィルタ(502、602、702)は、ブロックエッジ(403、800)からの画素の距離を拡大しつつ単調に減少する関数を用いることにより、ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定するように適合される、請求項1から3のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)。
【請求項6】
関数は指数関数である、請求項5に記載のイメージ処理デバイス(501、601、701)。
【請求項7】
関数は、tc’=tc+(tc>>i)であり、tc’はクリッピング値であり、tcは一定値であり、iは、ブロックエッジ(403、800)からの画素の距離であり、>>は、右シフトを示す、請求項6に記載のイメージ処理デバイス(501、601、701)。
【請求項8】
関数は線形関数である、請求項5に記載のイメージ処理デバイス(501、601、701)。
【請求項9】
関数はtc’=tc+(tc-(i*x)であり、tc’はクリッピング値であり、tcは一定値であり、iは、ブロックエッジ(403、800)からの画素の距離であり、xは一定値である、請求項8に記載のイメージ処理デバイス(501、601、701)。
【請求項10】
フィルタ(502、602、702)は、ブロックエッジ(403、800)からのデブロッキング範囲内のフィルタリング対象の各画素に対して、
画素の元の画素値からフィルタリングされる画素値を決定し、ブロックエッジ(403、800)から画素の距離に依存する画素のクリッピング値を決定し、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られるように適合される、請求項1から9のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)。
【請求項11】
フィルタ(502、602、702)は、垂直方向のブロックエッジ(403、800)の場合、決定画素列の数がブロックエッジ(403、800)を囲むブロック内の画素列の数より小さいということに基づいて、及び、水平方向のブロックエッジ(403、800)の場合、決定画像行の数がブロックエッジ(403、800)を囲むブロック内の画素行の数より小さいということに基づいて、ブロックエッジ(403、800)がフィルタリングされる必要があるかどうかを決定することであって、フィルタ(502、602、702)は、ブロックエッジ(403、800)からのデブロッキング範囲内の決定画素行又は決定画素列にはないフィルタリング対象の各画素に対して、デブロッキング範囲がブロックエッジ(403、800)に対して垂直となるように適合される、決定することと、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定することと、
ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定することと、
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果として、デブロッキングされた画素値が得られることと
を行うように適合され、
フィルタ(502、602、702)は、ブロックエッジ(403、800)からのデブロッキング範囲であって、ブロックエッジ(403、800)に対して垂直となるデブロッキング範囲内の決定画素行又は決定画素列にあるフィルタリング対象の各画素に対して、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定することと、
一定のクリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果として、デブロッキングされた画素値が得られることと
を行うように適合される、請求項1から9のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)。
【請求項12】
フィルタ(502、602、702)は、少なくとも2個、又は、少なくとも3個、又は、少なくとも4個、又は、少なくとも5個、又は、少なくとも6個、又は、少なくとも7個、又は、少なくとも8個、又は、少なくとも9個、又は、少なくとも10個、又は、少なくとも11個、又は、少なくとも12個、又は、少なくとも13個、又は、少なくとも14個、又は、少なくとも15個、又は、少なくとも16個の画素のフィルタタップ長を有する、請求項1から11のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)。
【請求項13】
請求項1から12のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)を備える、イメージをエンコードするためのエンコーダ。
【請求項14】
請求項1から12のうちのいずれか一項に記載のイメージ処理デバイス(501、601、701)を備える、イメージをデコードするためのデコーダ。
【請求項15】
ブロック符号でエンコードされたイメージの第1のブロックと第2のブロックとの間のブロックエッジ(403、800)をデブロッキングするためのデブロッキング方法であって、方法は、ブロックエッジ(403、800)からのデブロッキング範囲であって、ブロックエッジ(403、800)に対して垂直となるデブロッキング範囲内のフィルタリング対象となる少なくとも1つの画素に対して、
画素の元の画素値からフィルタリングされる画素値を決定する段階(1000)と、
ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定する段階(1001)と、
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られる段階(1002)と
を備える方法。
【請求項16】
請求項15に記載のデブロッキング方法を備える、イメージをエンコードするためのエンコーディング方法。
【請求項17】
請求項15に記載のデブロッキング方法を備える、イメージをデコードするためのデコーディング方法。
【請求項18】
コンピュータプログラムがコンピュータ上で動作する場合、請求項15から17のうちのいずれか一項に記載の方法を実行するためのプログラムコードを備えるコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、画像処理の分野、例えば、静止画像及び/又はビデオ画像符号化に関する。特に、本開示は、デブロッキングフィルタの改善に言及する。
【背景技術】
【0002】
本開示の実施形態は、画像処理の分野、例えば、静止画像及び/又はビデオ画像符号化に関する。特に、本開示は、デブロッキングフィルタの改善に言及する。
【0003】
H.264/AVC及びHEVCなどのビデオ符号化スキームは、ブロックベースのハイブリッドビデオ符号化の成功原理に沿って設計されている。この原理を用いて、画像は、まずブロックに区分化され、次に、各ブロックがイントラ画像又はインター画像予測を用いることにより予測される。これらのブロックは、隣接ブロックから相対的に符号化され、同程度の類似性を有する元の信号に近似する。符号化されたブロックのみが元の信号に近似するので、近似間の差が、予測における不連続性を引き起こし、ブロック境界を変えてしまうかもしれない。これらの不連続性は、デブロッキングフィルタにより弱められる。HEVCは、最大サイズの64×64画素の符号化ツリーユニット(CTU)の概念を有するH.264/AVCのマクロブロック構造に代わるものである。CTUは、8×8画素の最小サイズまで細分され得るより小さい符号化ユニット(CU)への四分木分解スキームへとさらに区分化され得る。HEVCはまた、予測ブロック(PB)及び変換ブロック(TB)の概念を導入する。
【0004】
HEVCでは、2つのフィルタ、すなわち、普通のフィルタ及び強力なフィルタがデブロッキングフィルタにおいて規定される。普通のフィルタは、エッジの両側に対して多くても2つのサンプルを修正する。強力な方は、閾値と比較して、エッジに沿って3つの追加のサンプルをフィルタリングする。これらのチェックのすべてが正しい場合、強力なフィルタが適用される。強力なフィルタは、エッジに沿うサンプルに対してより集中的な平滑化効果を有し、エッジの両側に対して多くても3つのサンプルを修正できる。
【0005】
ITU-T VCEG(Q6/16)及びISO/IEC MPEG (JTC1/SC29/WG11)は、次世代ビデオコーデック、すなわち、多目的ビデオ符号化(VVC)を検討している。この新しいビデオコーデック規格は、(スクリーンコンテンツ符号化及び高ダイナミックレンジ符号化のための、その現在の拡張及び短期的な拡張を含む)現在のHEVC規格の圧縮能力を大幅に上回る圧縮能力を目標としている。当該グループは、映像符号化共同研究チーム(JVET)として知られる共同コラボレーションの取り組みにおいて、この調査活動を一緒に作業して、この分野におけるそれらの専門家により提案される圧縮技術設計を評価する。
【0006】
VVCテストモデル(VTM)は、HEVCの性能を超える将来の進化型ビデオ符号化技術として、ITU-T VCEG及びISO/IEC MPEGの映像符号化共同研究チーム(JVET)により協調したテストモデル研究下にある特徴を説明する。VTM2.0において現在用いられているデブロッキングフィルタはHEVCと同じである。
【0007】
しかしながら、今のところ、デブロッキングは、特にブロックエッジのすぐそばにはない領域の過度な平滑化又はぼかしの原因となることが多い。これは、準最適な低デブロッキング品質の原因となっている。
【発明の概要】
【0008】
上述した課題を考慮して、本開示は、従来のデブロッキングフィルタリングを改善することを目標とする。本開示は、最適化された品質でデブロッキングフィルタリングを実行できるイメージ処理デバイスを提供することを目的とする。さらに、デブロッキングは効率的かつ正確となるはずである。
【0009】
本開示の実施形態は、独立請求項の特徴、及び、従属請求項の特徴による実施形態のさらに有利な実装により規定される。
【0010】
本開示の第1実施形態によれば、ブロック符号でエンコードされたイメージの第1符号化ブロックと第2符号化ブロックとの間のブロックエッジをデブロッキングするための、イメージエンコーダ及び/又はイメージデコーダにおける使用のためのイメージ処理デバイスが提供される。イメージ処理デバイスは、ブロックエッジをフィルタリングするためのフィルタを備え、ブロックエッジからのデブロッキング範囲であって、ブロックエッジに対して垂直となるデブロッキング範囲内のフィルタリング対象の画素の少なくともいくつかに対して、画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定し、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定し、クリッピング値を用いてフィルタリングされる画素値をクリッピングし、結果としてデブロッキングされた画素値が得られるように構成される。これは、過度な平滑化又はぼかしの影響を減らし、デブロッキングの品質を大きく改善する。イメージ処理デバイスは、本開示において説明される演算を実行するための処理回路であってよい。処理回路は、ハードウェア及びソフトウェアを有してよい。処理回路は、例えば、1つ又は複数のプロセッサと、1つ又は複数のプロセッサによる実行のためのプログラムコードを運ぶ不揮発性メモリとを有してよい。1つ又は複数のプロセッサにより実行される場合、プログラムコードは、イメージ処理デバイスに、それぞれの演算を実行するように指示する。
【0011】
有利なことに、クリッピング値は、元の画素値とデブロッキングされた画素値との間で最大限許容される変化量である。これは、過度な平滑化又はぼかしをさらに制限する。
【0012】
さらに有利なことに、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られることは、フィルタリングされる画素値とデブロッキングされた画素値との間の差の絶対値が画素のクリッピング値を越えない場合、デブロッキングされた画素値をフィルタリングされる画素値に設定することと、フィルタリングされる画素値が元の画素値プラスクリッピング値を超える場合、デブロッキングされた画素値を元の画素値プラス画素のクリッピング値に設定することと、フィルタリングされる画素値が元の画素値マイナスクリッピング値より小さい場合、デブロッキングされた画素値を元の画素値マイナス画素のクリッピング値に設定することとを有する。これは、デブロッキング品質をさらに高める。
【0013】
有利なことに、フィルタは、関数又はルックアップテーブルを用いることにより、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定するように適合される。これは、クリッピング値の非常に正確な設定を可能にし、これにより、デブロッキング品質をさらにもっと向上させることを可能にする。
【0014】
さらに有利なことに、フィルタは、ブロックエッジからの画素の距離を拡大しつつ単調に減少する関数を用いることにより、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定するように適合される。これは、ブロックエッジからの距離を拡大しつつ過度な平滑化又はぼかしの影響を大幅に減らし、これにより、デブロッキング品質を高めている。
【0015】
有利なことに、関数は指数関数である。これは、特に高いデブロッキング品質をもたらす。
【0016】
好ましくは、関数は以下のとおりである。
tc’=tc+(tc>>i)
tc’はクリッピング値である。
tcは一定値である。
iは、ブロックエッジ(403、800)からの画素の距離である。
>>は、右シフトを示す。これは、指数関数の単純な計算を可能にする。
【0017】
用いられ得る別の代替的な指数関数は、以下のとおりである。
tc’=((2*tc)>>i)
tc’はクリッピング値である。
tcは一定値である。
iは、ブロックエッジ(403、800)からの画素の距離である。
>>は、右シフトを示す。これは、指数関数の単純な計算を可能にする。
【0018】
代替的に、関数は線形関数である。これは、同時に計算の複雑性を最小限にとどめつつ、デブロッキング品質の向上を可能にする。
【0019】
有利なことに、関数は、以下のとおりである。
tc’=tc+(tc-(i*x)
tc’はクリッピング値である。
tcは一定値である。
iは、ブロックエッジ(403、800)からの画素の距離である。
xは一定値である。これは、線形関数のとりわけ単純な計算を可能にする。
【0020】
好ましくは、フィルタは、ブロックエッジからのデブロッキング範囲であって、ブロックエッジに対して垂直となるデブロッキング範囲内のフィルタリング対象の各画素に対して、画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定し、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定し、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られるように適合される。フィルタリング対象の各画素に対して同じ計算を用いることにより、とりわけ単純な実装が実現される。
【0021】
代替的に、フィルタは、垂直方向のブロックエッジの場合、決定画素列の数がブロックエッジを囲むブロック内の画素列の数より少ないということに基づいて、及び、水平方向のブロックエッジの場合、決定画像行の数がブロックエッジを囲むブロック内の画素行の数より少ないということに基づいて、ブロックエッジがフィルタリングされる必要があるかどうかを決定するように適合される。フィルタは、次に、ブロックエッジからのデブロッキング範囲であって、ブロックエッジに対して垂直となるデブロッキング範囲内の決定画素行又は決定画素列にはないフィルタリング対象の各画素に対して、画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定し、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定し、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られるように適合される。フィルタは、さらに、ブロックエッジからのデブロッキング範囲であって、ブロックエッジに対して垂直であるデブロッキング範囲内の決定画素行又は決定画素列にあるフィルタリング対象の各画素に対して、画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタの画素値を決定し、一定のクリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果として、デブロッキングされた画素値が得られるように適合される。これは、同時に、決定行又は列にはない画素値が、範囲に依存するクリッピング値を用いてフィルタリングされる一方、決定行又は列内の画素が、固定のクリッピング値を用いてフィルタリングされることを意味する。これは、さらに、増大した計算の複雑性を犠牲にして、デブロッキング品質を高める。
【0022】
有利なことに、フィルタは、1個、又は、少なくとも2個、又は、少なくとも3個、又は、少なくとも4個、又は、少なくとも5個、又は、少なくとも6個、又は、少なくとも7個、又は、少なくとも8個、又は、少なくとも9個、又は、少なくとも10個、又は、少なくとも11個、又は、少なくとも12個、又は、少なくとも13個、又は、少なくとも14個、又は、少なくとも15個、又は、少なくとも16個の画素のフィルタタップ長を有する。これは、多種多様な様々なフィルタ設計への本開示の適用を可能にする。
【0023】
本開示の第2態様によれば、本開示の第1態様に係るイメージ処理デバイスを備える、イメージをエンコードするためのエンコーダが提供される。
【0024】
本開示の第3態様によれば、本開示の第1態様に係るイメージ処理デバイスを備える、イメージをデコードするためのデコーダが提供される。
【0025】
本開示の第4態様によれば、ブロック符号でエンコードされたイメージの第1符号化ブロックと第2符号化ブロックとの間のブロックエッジをデブロッキングするためのデブロッキング方法が提供される。方法は、ブロックエッジからのデブロッキング範囲であって、ブロックエッジに対して垂直となるデブロッキング範囲内のフィルタリング対象の画素の少なくともいくつかに対して、画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定する段階と、ブロックエッジからの画素の距離に依存する画素のクリッピング値を決定する段階と、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られる段階とを備える。これは、過度な平滑化又はぼかしの影響を減らし、デブロッキングの品質を大きく改善する。
【0026】
本開示の第5態様によれば、本開示の第4態様のデブロッキング方法を備える、イメージをエンコードするためのエンコーディング方法が提供される。
【0027】
本開示の第6態様によれば、本開示の第4態様に係るデブロッキング方法を備える、イメージをデコードするためのデコーディング方法が提供される。
【0028】
最後に、本開示の第7態様によれば、コンピュータプログラムがコンピュータ上で動作する場合、本開示の第4態様、第5態様又は第6態様に係る方法を実行するためのプログラムコードを有するコンピュータプログラムが提供される。
【0029】
1つ又は複数の実施形態の詳細は、以下の添付の図面及び説明において説明される。他の特徴、目的及び利点は、説明、図面及び特許請求の範囲から明らかとなる。
【0030】
本開示の以下の実施形態では、添付の図及び図面を参照してより詳細に説明される。
【図面の簡単な説明】
【0031】
図1】本開示の実施形態を実施するように構成されるビデオエンコーダの例を示すブロック図である。
図2】本開示の実施形態を実施するように構成されるビデオデコーダの例示的な構造を示すブロック図である。
図3】本開示の実施形態を実施するように構成されるビデオ符号化システムの例を示すブロック図である。
図4】2つの例示的な符号化ブロックを示す。
図5】本開示の第1態様に係る本発明のイメージ処理デバイスの実施形態を示す。
図6】本開示の第2態様に係る本発明のエンコーダの実施形態を示す。
図7】本開示の第3態様に係る本発明のデコーダの実施形態を示す。
図8】デブロッキングフィルタリング前の画素値に従う例示的なブロックエッジを示す。
図9】本開示の第4態様に係るイメージ処理方法の実施形態のフロー図を示す。
【発明を実施するための形態】
【0032】
以下では、同一の参照符号は、同一又は少なくとも機能的に同等の特徴を指す。一部において、同じ要素を指す異なる参照符号が、異なる図において用いられている。
【0033】
まず、図1図3に従うイメージ符号化の一般的な概念を明らかにする。図4及び図8に従って、従来のデブロッキングフィルタのデメリットが示される。図5図7に関して、本発明の装置の異なる実施形態の構成及び機能が示され、説明される。最後に、図9に関して、本発明の方法の実施形態が示され、説明される。異なる図において、同様の要素及び参照番号が部分的に省略されている。
【0034】
以下の説明では、添付の図に対する参照が行われ、本開示の一部を形成し、図示する目的で本開示の実施形態の具体的態様又は本開示の実施形態が用いられ得る具体的態様を示す。本開示の実施形態が、他の態様において用いられてよく、図に示されていない構造的又は論理的な変更を有することが理解される。したがって、以下の詳細な説明は、限定的な意味で考慮されるものではなく、本開示の範囲は、添付の特許請求の範囲により規定される。
【0035】
例えば、説明される方法に関連する開示は、方法を実行するように構成される対応するデバイス又はシステムにも当てはまってもよく、逆もまた同様であることが理解される。例えば、1つ又は複数の特定の方法の段階が説明される場合、対応するデバイスは、たとえ、そのような1つ又は複数のユニットが図において明確に説明又は示されていない場合であっても、説明される1つ又は複数の方法の段階を実行する1つ又は複数のユニット、例えば、機能ユニット(例えば、1つ又は複数の段階を実行する1つのユニット、又は、それぞれが複数の段階のうちの1つを又は複数を実行する複数のユニット)を含んでよい。一方、例えば、特定の装置が1つ又は複数のユニット、例えば、機能ユニットに基づいて説明される場合、対応する方法は、たとえ、1つ又は複数の段階が図において明確に説明又は示されていない場合であっても、1つ又は複数のユニットの機能を実行する1つの段階(例えば、1つ又は複数のユニットの機能を実行する1つの段階、又は、それぞれが複数のユニットの1つ又は複数の機能を実行する複数の段階)を含んでよい。さらに、特に断りのない限り、様々な例示的な実施形態の特徴及び/又は本明細書において説明される態様は、互いに組み合わせられてよいことが理解される。
【0036】
ビデオ符号化は、典型的には、ビデオ又はビデオシーケンスを形成する一連の画像の処理を指す。画像という用語の代わりに、ビデオ符号化の分野における同義語として、フレーム又はイメージという用語が用いられてよい。ビデオ符号化は、ビデオエンコーディング及びビデオデコーディングの2つの部分を有する。ビデオエンコーディングは、元のビデオ画像を(例えば、圧縮により)処理して、典型的には、ビデオ画像を表現すために(より効率的な格納及び/又は伝送のために)必要とされるデータ量を減らすことを有するソース側で実行される。ビデオデコーディングは、宛先側で実行され、典型的には、ビデオ画像を再構築するためにエンコーダと比較して逆の処理を有する。ビデオ画像(又は、後で説明されるような一般的な画像)の「符号化」に言及する実施形態は、ビデオ画像の「エンコード」及び「デコード」の両方に関連することが理解されるものとする。エンコード部分及びデコード部分の組み合わせは、コーデック(符号化及びデコード)とも称される。
【0037】
可逆ビデオ符号化の場合、元のビデオ画像は、再構築されることができ、すなわち、再構築されたビデオ画像は、(格納又は伝送中に伝送損失又は他のデータ損失がないと仮定して)元のビデオ画像と同じ品質を有する。不可逆ビデオ符号化の場合、ビデオ画像を表現すデータ量を減らすために、例えば、量子化によるさらなる圧縮が実行され、デコーダにおいて完全に再構築されることができず、すなわち、元のビデオ画像の品質と比較して、再構築されたビデオ画像の品質は低い又は悪い。
【0038】
H.261以降のいくつかのビデオ符号化規格は、「不可逆ハイブリッドビデオコーデック」のグループに属する(すなわち、サンプル領域における空間及び時間予測と、変換領域における量子化を適用するための2D変換符号化とを組み合わせている)。ビデオシーケンスの各画像は、典型的には、非重複ブロックのセットに区分化され、符号化は、典型的には、ブロックレベルで実行される。つまり、エンコーダでは、ビデオは典型的には、例えば、予測ブロックを生成するために空間(イントラ画像)予測及び時間(インター画像)予測を用いて、現在のブロック(現在処理中/処理予定のブロック)から予測ブロックを減算して残差ブロックを取得し、残差ブロックを変換し、変換領域における残差ブロックを量子化して、伝送されるデータ量を減らす(圧縮)ことにより、ブロック(ビデオブロック)レベルで処理され、すなわち、エンコードされ、一方、デコーダでは、エンコーダと比較して逆の処理が、表示のために現在のブロックを再構築するためにエンコード又は圧縮されたブロックに対して適用される。さらに、エンコーダは、両方が同一の予測(例えば、イントラ及びインター予測)及び/又は後続のブロックを処理、すなわち、符号化するための再構築を生成するように、デコーダ処理ループを繰り返す。
【0039】
ビデオ画像処理(動画像処理とも称される)及び静止画像処理(処理という用語は符号化を含む)は、より多くの概念及び技術又はツールを共有し、以下では、用語「画像」は、必ずというわけではないが、ビデオ画像と静止画像と間の不必要な繰り返し及び区別を避けるために、(上記で説明したような)ビデオシーケンスのビデオ画像及び/又は静止画像を指すために用いられる。静止画像(又は、静止イメージ)のみを指す説明の場合、用語「静止画像」が用いられるものとする。
【0040】
エンコーダ100の以下の実施形態では、本開示の実施形態を図4図9に基づいてより詳細に説明する前に、デコーダ200及び符号化システム300が図1から図3に基づいて説明される。
【0041】
図3は、符号化システム300、例えば、画像符号化システム300の実施形態を示す概念的又は概略的なブロック図であり、符号化システム300は、エンコードされたデータ330、例えば、エンコードされた画像330を、例えば、エンコードされたデータ330をデコードするための宛先デバイス320に提供するように構成されるソースデバイス310を備える。
【0042】
ソースデバイス310は、エンコーダ100又はエンコーディングユニット100を有し、追加的に、すなわち、任意選択的に、画像ソース312と、前処理ユニット314、例えば、画像前処理ユニット314と、通信インタフェース又は通信ユニット318とを有してよい。
【0043】
画像ソース312は、例えば、現実世界の画像を撮像するための任意の種類の画像撮像デバイス、及び/又は、任意の種類の画像生成デバイス、例えば、コンピュータアニメーション画像を生成するためのコンピュータグラフィックスプロセッサ、又は、現実世界の画像、コンピュータアニメーション画像(例えば、スクリーンコンテンツ、仮想現実(VR)画像)及び/又はこれらの任意の組み合わせ(例えば、拡張現実(AR)画像)を取得及び/又は提供するための任意の種類のデバイスを備えてよい、又は、それらであってよい。以下では、これらの種類の画像のすべて及び任意の他の種類の画像は、特に説明しない限り「画像」又は「イメージ」と称され、一方、「ビデオ画像」及び「静止画像」をカバーする用語「画像」に関する以前の説明は、明示的に異なって特定されない限り依然として当てはまる。
【0044】
(デジタル)画像は、強度値を有するサンプルの2次元アレイ又はマトリクスとみなされる、又は、みなされ得る。アレイ内のサンプルは、画素(画像要素の省略形)又はペルとも称され得る。アレイ又は画像の水平及び垂直方向(又は、軸)におけるサンプルの数は、画像のサイズ及び/又は解像度を規定する。色の表現に関して、典型的には、3つの色成分が使用され、すなわち、画像は、3つのサンプルアレイが表現され得る、又は、それらを含んでよい。RGB形式又は色空間において、画像は、対応する赤、緑及び青のサンプルアレイを有する。しかしながら、ビデオ符号化において、各画素は、典型的には、輝度/クロミナンス形式又は色空間、例えば、Y(場合によってはまた、Lが代わりに用いられる)で示される輝度成分と、Cb及びCrにより示される2つのクロミナンス成分とを含むYCbCrで表現される。輝度(又は、簡潔に、ルマ)成分Yは、明度又はグレーレベルの強度(例えば、グレースケール画像のような)を表す一方、2つのクロミナンス(又は、簡潔に、クロマ)成分Cb及びCrは、色度又は色情報成分を表す。適宜、YCbCr形式における画像は、輝度サンプル値(Y)の輝度サンプルアレイと、クロミナンス値(Cb及びCr)の2つのクロミナンスサンプルアレイとを有する。RGB形式における画像は、YCbCr形式に転換又は変換されてよく、逆もまた同様であり、当該処理は、色変換又は転換としても知られている。画像が単色である場合、画像は、輝度サンプルアレイのみを有し得る。
【0045】
画像ソース312は、例えば、画像を撮像するためのカメラ、以前に撮像又は生成された画像を有する又は格納するメモリ、例えば、画像メモリ、及び/又は、画像を取得又は受信するための任意の種類のインタフェース(内部又は外部)であってよい。カメラは、例えば、ソースデバイスに統合されたローカル又は統合カメラであってよく、メモリは、例えば、ソースデバイスに統合されたローカル又は統合メモリであってよい。インタフェースは、例えば、外部のビデオソース、例えば、カメラのような外部の画像撮像デバイス、外部のメモリ、又は、外部の画像生成デバイス、例えば、外部のコンピュータグラフィックスプロセッサ、コンピュータ又はサーバから画像を受信する外部のインタフェースであってよい。インタフェースは、任意の種類のインタフェース、例えば、任意の独自の又は標準化されたインタフェースプロトコルに従う有線又は無線インタフェース、光インタフェースとすることができる。画像データ312を取得するためのインタフェースは、通信インタフェース318と同じインタフェース又はその一部であってよい。
【0046】
前処理ユニット314と、前処理ユニット314により実行される処理との区別において、画像又は画像データ313は、未加工画像又は未加工画像データ313とも称され得る。
【0047】
前処理ユニット314は、(未加工)画像データ313を受信し、画像データ313に対する前処理を実行して、前処理された画像315又は前処理された画像データ315を取得するように構成される。前処理ユニット314により実行される前処理は、例えば、トリミング、(例えば、RGBからYCbCrへの)色フォーマット変換、色補正又はノイズ除去を有してよい。
【0048】
エンコーダ100は、前処理された画像データ315を受信し、エンコードされた画像データ171を提供するように構成される(さらなる詳細は、例えば、図1に基づいて説明される)。
【0049】
ソースデバイス310の通信インタフェース318は、エンコードされた画像データ171を受信し、それを別のデバイス、例えば、宛先デバイス320又は格納又は直接的な再構築のための任意の他のデバイスに直接伝送し、又は、エンコードされたデータ330を格納し、及び/又は、エンコードされたデータ330を別のデバイス、例えば、宛先デバイス320に、又は、デコード又は格納するための任意の他のデバイスに伝送する前に、それぞれに対してエンコードされた画像データ171を処理するように構成されてよい。
【0050】
宛先デバイス320は、デコーダ200又はデコーデイングユニット200を有し、追加的に、すなわち、任意選択的に、通信インタフェース又は通信ユニット322と、後処理ユニット326と、ディスプレイデバイス328とを有してよい。
【0051】
宛先デバイス320の通信インタフェース322は、エンコードされた画像データ171又はエンコードされたデータ330を、例えば、ソースデバイス310から直接、又は、任意の他のソース、例えば、メモリ、例えば、エンコードされた画像データメモリから受信するように構成される。
【0052】
通信インタフェース318及び通信インタフェース322はそれぞれ、ソースデバイス310と宛先デバイス320との間のダイレクト通信リンク、例えば、ダイレクト有線又は無線通信を介して、又は、任意の種類のネットワーク、例えば、有線又は無線ネットワーク又はこれらの任意の組み合わせ、又は、任意の種類のプライベート及び公衆ネットワーク、又は、それらの任意の組み合わせを介して、エンコードされた画像データ171又はエンコードされたデータ330を伝送し、受信するように構成されてよい。
【0053】
通信インタフェース318は、通信リンク又は通信ネットワークを介した伝送のために、例えば、エンコードされた画像データ171を適切なフォーマット、例えば、パケットにパッケージ化するように構成されてよく、さらに、データ損失保護及びデータ損失回復を有してよい。
【0054】
通信インタフェース318の片割れを形成する通信インタフェース322は、例えば、エンコードされたデータ330をデパッケージ化して、エンコードされた画像データ171を取得するように構成されてよく、さらに、例えば、エラー隠蔽を含むデータ損失保護及びデータ損失回復を実行するように構成されてよい。
【0055】
ソースデバイス310から宛先デバイス320に向いている図3のエンコードされた画像データ330に関する矢印により示されるように、通信インタフェース318及び通信インタフェース322は両方とも、単方向通信インタフェース又は双方向通信インタフェースとして構成されてよい、又は、例えば、メッセージを送信及び受信して、例えば、接続をセットアップし、画像データを含む失われた又は遅延しているデータを確認及び/又は再送信し、通信リンク及び/又はデータ伝送、例えば、エンコードされた画像データ伝送に関連する任意の他の情報を交換するように構成されてよい。
【0056】
デコーダ200は、エンコードされた画像データ171を受信し、デコードされた画像データ231又はデコードされた画像231を提供するように構成される(さらなる詳細は、例えば、図2に基づいて説明される)。
【0057】
宛先デバイス320のポストプロセッサ326は、デコードされた画像データ231、例えば、デコードされた画像231を後処理して、後処理された画像データ327、例えば、後処理された画像327を取得するように構成される。後処理ユニット326により実行される後処理は、例えば、(例えば、YCbCrからRGBへの)色フォーマット変換、色補正、トリミング又は再サンプリング、又は、例えば、ディスプレイデバイス328による表示のために、例えば、デコードされた画像データ231を準備するための任意の他の処理を有してよい。
【0058】
宛先デバイス320のディスプレイデバイス328は、例えば、ユーザ又は視聴者に画像を表示するために、後処理された画像データ327を受信するように構成される。ディスプレイデバイス328は、再構築された画像を表現するための任意の種類のディスプレイ、例えば、統合された又は外部のディスプレイ又はモニタであってよい、又は、それらを有してよい。ディスプレイは、例えば、ブラウン管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、任意の種類の他のディスプレイ...プロジェクタ、ホログラム(3D)...を有してよい。
【0059】
図3は、ソースデバイス310及び宛先デバイス320を別個のデバイスとして示しているが、デバイスの実施形態はまた、両方又は両方の機能、ソースデバイス310又は対応する機能、及び、宛先デバイス320又は対応する機能を有してよい。そのような実施形態において、ソースデバイス310又は対応する機能、及び、宛先デバイス320又は対応する機能は、同じハードウェア及び/又はソフトウェアを用いて、又は、別個のハードウェア及び/又はソフトウェア、又は、これらの任意の組み合わせにより実装されてよい。
【0060】
説明に基づいて当業者に対して明らかとなるように、図3に示されるようなソースデバイス310及び/又は宛先デバイス320内の異なるユニットの機能又は機能の存在及び(厳密な)分割は、実際のデバイス及びアプリケーションに応じて変わり得る。
【0061】
したがって、図3に示されるようなソースデバイス310及び宛先デバイス320は、本開示の例示的な実施形態に過ぎず、本開示の実施形態は、図3に示されるものに限定されるものではない。
【0062】
ソースデバイス310及び宛先デバイス320は、任意の種類のハンドヘルド又は固定デバイス、例えば、ノートブック又はラップトップコンピュータ、携帯電話、スマートフォン、タブレット又はタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイス又はブロードキャスト受信デバイスなど(また、例えば、大規模な専門的なエンコード/デコードのためのサーバ及びワークステーション、例えば、ネットワークエンティティ)を含む広範囲のデバイスのうちのいずれかを有してよく、任意の種類のオペレーティングシステムを用いても用いなくてもよい。
【0063】
図1は、エンコーダ100、例えば、画像エンコーダ100の実施形態の概略的/概念的なブロック図を示し、入力102、残差計算ユニット104、変換ユニット106、量子化ユニット108、逆量子化ユニット110及び逆変換ユニット112、再構築ユニット114、バッファ116、ループフィルタ120、デコードされた画像バッファ(DPB)130、予測ユニット160[インター推定ユニット142、インター予測ユニット144、イントラ推定ユニット152、イントラ予測ユニット154]、モード選択ユニット162、エントロピーエンコーディングユニット170及び出力172を備える。図1に示されるようなビデオエンコーダ100は、ハイブリッドビデオエンコーダ、又は、ハイブリッドビデオコーデックに係るビデオエンコーダとも称され得る。
【0064】
例えば、残差計算ユニット104、変換ユニット106、量子化ユニット108及びエントロピーエンコーディングユニット170は、エンコーダ100の順方向の信号経路を形成し、一方、例えば、逆量子化ユニット110、逆変換ユニット112、再構築ユニット114、バッファ116、ループフィルタ120、デコードされた画像バッファ(DPB)130、インター予測ユニット144及びイントラ予測ユニット154は、エンコーダの逆方向の信号経路を形成し、エンコーダの逆方向の信号経路は、デコーダの信号経路に対応する(図2におけるデコーダ200を参照)。
【0065】
エンコーダは、例えば、入力102により、画像101又は画像101の画像ブロック103、例えば、ビデオ又はビデオシーケンスを形成する一連の画像のうちの画像を受信するように構成される。画像ブロック103は、現在の画像ブロック又は符号化対象の画像ブロックとも称されてよく、(特に、現在の画像を他の画像、例えば、同じビデオシーケンス、すなわち、現在の画像も有するビデオシーケンスの以前にエンコード及び/又はデコードされた画像、から区別するビデオ符号化において)画像101は、現在の画像又は符号化される画像とも称され得る。
【0066】
エンコーダ100の実施形態は、例えば、画像区分化ユニットとも称されてよく、画像103を、複数のブロック、例えば、ブロック103のようなブロックに、典型的、複数の非重複ブロックに区分化するように構成される区分化ユニット(図1には示されていない)を備えてよい。区分化ユニットは、ビデオシーケンスのすべての画像に対する同じブロックサイズと、ブロックサイズを規定する対応するグリッドとを用いる、又は、画像間、又は、画像のサブセット又はグループ間のブロックサイズを変更し、各画像を対応するブロックに区分化するように構成されてよい。
【0067】
画像101のように、ブロック103もまた、画像101より小さい寸法のものであるが、強度値(サンプル値)を有するサンプルの2次元アレイ又はマトリクスとみなされる、又は、みなされ得る。つまり、ブロック103は、例えば、適用される色フォーマットに応じて、1つのサンプルアレイ(例えば、単色画像101の場合、ルマアレイ)、又は、3つのサンプルアレイ(例えば、カラー画像101の場合、ルマ及び2つのクロマアレイ)、又は、任意の他の数及び/又は種類のアレイを有してよい。ブロック103の水平及び垂直方向(又は、軸)におけるサンプルの数は、ブロック103のサイズを規定する。
【0068】
図1に示されるようなエンコーダ100は、ブロックごとに画像101をエンコードするように構成され、例えば、エンコード及び予測がブロック103ごとに実行される。
【0069】
残差計算ユニット104は、画像ブロック103及び予測ブロック165に基づいて、例えば、画像ブロック103のサンプル値から予測ブロック165のサンプル値を減算して、サンプルごとに(画素ごとに)、サンプル領域内の残差ブロック105を取得することにより、残差ブロック105を算出するように構成される(予測ブロック165に関するさらなる詳細は後で提供される)。
【0070】
変換ユニット106は、残差ブロック105のサンプル値に対して変換、例えば、空間周波数変換又は線形空間変換、例えば、離散コサイン変換(DCT)又は離散サイン変換(DST)を適用して、変換領域における変換された係数107を取得するように構成される。変換された係数107は、変換された残差係数とも称され、変換領域における残差ブロック105を表してよい。
【0071】
変換ユニット106は、HEVC/H.265に規定されているコア変換などのDCT/DSTの整数近似を適用するように構成されてよい。正規直交DCT変換と比較して、そのような整数近似は、典型的には、一定の係数によりスケーリングされる。順変換及び逆変換により処理された残差ブロックのノルムを保つために、変換処理の一部として、追加のスケーリング係数が適用される。スケーリング係数は、典型的には、シフト演算のための2の累乗であるスケーリング係数、変換された係数のビット深度、精度と実装コストとの間のトレードオフなどのような一定の制約に基づいて選択される。特定のスケーリング係数は、デコーダ200における、例えば、逆変換ユニット212による、例えば、逆変換(及び、例えば、エンコーダ100における逆変換ユニット112による対応する逆変換)に対して規定され、エンコーダ100における、例えば、変換ユニット106による順変換に対する対応するスケーリング係数が適宜規定されてよい。
【0072】
量子化ユニット108は、例えば、スカラー量子化又はベクトル量子化により、変換された係数107を量子化して、量子化係数109を取得するように構成される。量子化係数109は、量子化された残差係数109とも称され得る。例えば、スカラー量子化について、異なるスケーリングは、より細かい又はより粗い量子化を実現するために適用されてよい。量子化ステップサイズが小さければ小さいほど、より細かい量子化に対応し、量子化ステップサイズが大きければ大きいほど、より粗い量子化に対応する。適用可能な量子化ステップサイズは、量子化パラメータ(QP)により示されてよい。量子化パラメータは、例えば、適用可能な量子化ステップサイズの予め定義されたセットに対するインデックスであってよい。例えば、小さい量子化パラメータは、細かい量子化(小さい量子化ステップサイズ)に対応してよく、大きい量子化パラメータは、粗い量子化(大きい量子化ステップサイズ)に対応してよく、又は、逆もまた同様である。量子化は、量子化ステップサイズでの除算を含んでよく、例えば、逆量子化110による対応する又は逆の逆量子化は、量子化ステップサイズでの乗算を含んでよい。
【0073】
HEVCに係る実施形態は、量子化パラメータを用いて、量子化ステップサイズを決定するように構成されてよい。一般に、量子化ステップサイズは、除算を含む式の不動点近似を用いた量子化パラメータに基づいて計算されてよい。追加のスケーリング係数は、残差ブロックのノルムを復元するために、量子化及び逆量子化に対して導入されてよく、量子化ステップサイズ及び量子化パラメータに対する式の不動点近似において用いられるスケーリングにより修正され得る。1つの例示的な実装において、逆変換及び逆量子化のスケーリングは、組み合わせられ得る。代替的に、カスタマイズされた量子化テーブルが用いられてよく、例えば、ビットストリームにおいてエンコーダからデコーダへシグナリングされてよい。量子化は不可逆演算であり、量子化ステップサイズが大きくなるにつれて、損失が大きくなる。
【0074】
エンコーダ100(又は、それぞれの量子化ユニット108)の実施形態は、デコーダ200が、対応する逆量子化を受信及び適用し得るように、例えば、対応する量子化パラメータを用いて量子化スキーム及び量子化ステップサイズを出力するように構成されてよい。エンコーダ100(又は、量子化ユニット108)の実施形態は、例えば、直接的に、又は、エントロピーエンコーディングユニット170又は任意の他のエントロピー符号化ユニットを介してエントロピーエンコードされた量子化スキーム及び量子化ステップサイズを出力するように構成されてよい。
【0075】
逆量子化ユニット110は、量子化係数に対して量子化ユニット108の逆量子化を適用して、例えば、量子化ユニット108と同じ量子化ステップサイズに基づいて又はこれを用いて、量子化ユニット108により適用される量子化スキームの逆を適用することにより、逆量子化係数111を取得するように構成される。逆量子化係数111は、逆量子化された残差係数111とも称されてよく、典型的には、量子化による損失に起因して変換された係数と同一ではないが、変換された係数108に対応する。
【0076】
逆変換ユニット112は、変換ユニット106により適用される変換の逆変換、例えば、逆離散コサイン変換(DCT)又は逆離散サイン変換(DST)を適用して、サンプル領域における逆変換したブロック113を取得するように構成される。逆変換したブロック113は、逆変換された逆量子化ブロック113又は逆変換された残差ブロック113とも称され得る。
【0077】
再構築ユニット114は、逆変換したブロック113と予測ブロック165とを組み合わせて、例えば、デコードされた残差ブロック113のサンプル値及び予測ブロック165のサンプル値をサンプルごとに加えることにより、サンプル領域における再構築したブロック115を取得するように構成される。
【0078】
バッファユニット116(又は、簡潔に、「バッファ」116)、例えば、ラインバッファ116は、例えば、イントラ推定及び/又はイントラ予測のために、再構築したブロック及びそれぞれのサンプル値をバッファ又は格納するように構成される。さらなる実施形態において、エンコーダは、任意の種類の推定及び/又は予測のために、バッファユニット116に格納されているフィルタリングされていない再構築したブロック及び/又はそれぞれのサンプル値を用いるように構成されてよい。
【0079】
エンコーダ100の実施形態は、例えば、バッファユニット116が、イントラ推定152及び/又はイントラ予測154のための再構築したブロック115を格納するためだけでなく、ループフィルタユニット120(図1には示されていない)のために用いられるように、及び/又は、例えば、バッファユニット116及びデコードされた画像バッファユニット130が1つのバッファを形成するように、構成されてよい。さらなる実施形態は、イントラ推定152及び/又はイントラ予測154に対する入力又は基礎として、フィルタリングされたブロック121、及び/又は、デコードされた画像バッファ130からのブロック又はサンプル(図1には両方とも示されていない)を用いるように構成されてよい。
【0080】
ループフィルタユニット120(又は、簡潔に、「ループフィルタ」120)は、例えば、デブロッキングサンプル適応オフセット(SAO)フィルタ又は他のフィルタ、例えば、鮮明化又は平滑化フィルタ又は協調フィルタを適用することにより、再構築したブロック115をフィルタリングして、フィルタリングされたブロック121を取得するように構成される。フィルタリングされたブロック121は、フィルタリングされた再構築したブロック121とも称され得る。ループフィルタ120は、以下では、デブロッキングフィルタとも称される。
【0081】
ループフィルタユニット120の実施形態は、フィルタ分析ユニット及び実際のフィルタユニット(図1には示されていない)を有してよく、フィルタ分析ユニットは、実際のフィルタのためのループフィルタパラメータを決定するように構成される。フィルタ分析ユニットは、固定の予め決定されたフィルタリングパラメータを実際のループフィルタに適用し、予め決定されたフィルタリングパラメータのセットからフィルタリングパラメータを適応的に選択する、又は、実際のループフィルタのためのフィルタリングパラメータを適応的に算出するように構成されてよい。
【0082】
ループフィルタユニット120の実施形態は、1つ又は複数のフィルタ(ループフィルタ/コンポーネント/サブフィルタ)、例えば、直列又は並列又はそれらの任意の組み合わせで接続される、例えば、異なる種類又はタイプのフィルタのうちの1つ又は複数を有してよく、フィルタのそれぞれは、例えば、前の段落で説明されたようなそれぞれのループフィルタパラメータを決定するために、個々に又は複数のフィルタのうちの他のフィルタと共同でフィルタ分析ユニットを有してよい(図1には示されていない)。
【0083】
エンコーダ100(それぞれのループフィルタユニット120)の実施形態は、例えば、直接的に、又は、エントロピーエンコーディングユニット170又は任意の他のエントロピー符号化ユニットを介してエントロピーエンコードされたループフィルタパラメータを出力するように構成されてよく、その結果、例えば、デコーダ200は、デコードのための同じループフィルタパラメータを受信及び適用し得る。
【0084】
デコードされた画像バッファ(DPB)130は、フィルタリングされるブロック121を受信及び格納するように構成される。デコードされた画像バッファ130は、さらに、同じ現在の画像の、又は、異なる画像、例えば、以前に再構築された画像の、他の以前にフィルタリングされたブロック、例えば、以前に再構築及びフィルタリングされたブロック121を格納するように構成されてよく、例えば、インター推定及び/又はインター推定のために、完全に以前に再構築された、すなわち、デコードされた画像(及び、対応する参照ブロック及びサンプル)、及び/又は、部分的に再構築された現在の画像(及び、対応する参照ブロック及びサンプル)を提供してよい。
【0085】
本開示のさらなる実施形態は、任意の種類の推定又は予測、例えば、イントラ及びインター推定及び予測のために、デコードされた画像バッファ130の以前にフィルタリングされたブロックと、対応するフィルタリングされたサンプル値とを用いるように構成されてもよい。
【0086】
ブロック予測ユニット160とも称される予測ユニット160は、画像ブロック103(現在の画像101の現在の画像ブロック103)と、デコード又は少なくとも再構築された画像データ、例えば、同じ(現在の)画像の参照サンプルとをバッファ116から、及び/又は、1つ又は複数の以前にデコードされた画像のうちのデコードされた画像データ231をデコードされた画像バッファ130から受信又は取得して、予測のためにそのようなデータを処理する、すなわち、インター予測されたブロック145又はイントラ予測されたブロック155であり得る予測ブロック165を提供するように構成される。
【0087】
モード選択ユニット162は、予測モード(例えば、イントラ又はインター予測モード)、及び/又は、残差ブロック105の計算ため、及び、再構築されるブロック115の再構築のための予測ブロック165として用いられる対応する予測ブロック145又は155を選択するように構成されてよい。
【0088】
モード選択ユニット162の実施形態は、予測モードを(例えば、予測ユニット160によりサポートされるものから)選択するように構成されてよく、ベストマッチ、又は、すなわち最小残差(最小残差は、伝送又は格納に対する圧縮率が高いことを意味する)、又は、最小のシグナリングオーバヘッド(最小のシグナリングオーバヘッドは、伝送又は格納に対する圧縮率が高いことを意味する)を提供する、又は、両方を考慮又はそのバランスを取る。モード選択ユニット162は、レート歪み最適化(RDO)に基づいて予測モードを決定する、すなわち、最小のレート歪み最適化を提供する、又は、関連するレート歪みが予測モード選択基準を少なくとも満たす予測モードを選択するように構成されてよい。
【0089】
以下では、例示的なエンコーダ100により実行される予測処理(例えば、予測ユニット160)及びモード選択(例えば、モード選択ユニット162による)がより詳細に説明される。
【0090】
上記で説明したように、エンコーダ100は、(予め決定された)予測モードのセットから最良の又は最適な予測モードを決定又は選択するように構成される。予測モードのセットは、例えば、イントラ予測モード及び/又はインター予測モードを有してよい。
【0091】
イントラ予測モードのセットは、例えば、H.264に規定されているような、32個の異なるイントラ予測モード、例えば、DC(又は、平均)モード及びプラーナモードのような無指向性モード、又は、指向性モードを有してよい、又は、例えば、H.265に規定されているような、65個の異なるイントラ予測モード、例えば、DC(又は、平均)モード及びプラーナモードのような無指向性モード、又は、指向性モードを有してよい。
【0092】
インター予測モードのセット(又は、可能のある)は、例えば、参照画像全体又は一部のみか、例えば、参照画像の現在のブロックのエリアの周りにある検索ウィンドウエリアが、最も一致する参照ブロックを検索するために用いられるか否か、及び/又は、例えば、画素補間が適用されるか否か、例えば、1/2/セミペル及び/又は1/4ペル補間かどうかは、利用可能な参照画像(すなわち、例えば、DBP230に格納されている以前の少なくとも部分的にデコードされた画像)及び他のインター予測パラメータに依存する。
【0093】
上記の予測モードに加えて、スキップモード及び/又はダイレクトモードが適用されてよい。
【0094】
予測ユニット160は、さらに、例えば、四分木区分化(QT)、二分木区分化(BT)、三分木区分化(TT)又はこれらの任意の組み合わせを繰り返し用いて、ブロック103をより小さいブロック区分又はサブブロックに区分化し、例えば、ブロック区分又はサブブロックのそれぞれに対して予測を実行するように構成されてよく、モード選択は、区分化されたブロック103の木構造、及び、ブロック区分又はサブブロックのそれぞれに適用される予測モードの選択を有する。
【0095】
インター画像推定ユニット142とも称されるインター推定ユニット142は、インター推定(又は、「インター画像推定」)のために、画像ブロック103(現在の画像101の現在の画像ブロック103)及びデコードされた画像231、又は、少なくとも1つ又は複数の以前に再構築したブロック、例えば、1つ又は複数の他の/異なる以前にデコードされた画像231のうちの再構築したブロックを受信又は取得するように構成される。例えば、ビデオシーケンスは、現在の画像及び以前にデコードされた画像231を有してよく、つまり、現在の画像及び以前にデコードされた画像231は、ビデオシーケンスを形成する一連の画像の一部であってよい、又は、一連の画像を形成してよい。
【0096】
エンコーダ100は、例えば、複数の他の画像の同じ又は異なる画像の複数の参照ブロックから参照ブロックを選択し、参照画像(又は、参照画像インデックス、...)、及び/又は、参照ブロックの位置(x、y座標)と現在のブロックの位置との間のオフセット(空間オフセット)をインター推定パラメータ143としてインター予測ユニット144に提供するように構成されてよい。このオフセットは、動きベクトル(MV)とも呼ばれる。インター推定は、動き推定(ME)とも称され、インター予測は、動き予測(MP)とも称される。
【0097】
インター予測ユニット144は、インター予測パラメータ143を取得、例えば、受信し、インター予測パラメータ143に基づいて、又は、これを用いてインター予測を実行して、インター予測ブロック145を取得するように構成される。
【0098】
図1は、インター符号化に関する2つの別個のユニット(又は、段階)、つまり、インター推定142及びインター予測144を示すが、例えば、現在の最良のインター予測モード及びそれぞれのインター予測ブロックを格納しつつ、可能なインター予測モードのすべての可能な又は予め決定されたサブセットを繰り返しテストして、インター予測144を別のときに実行することなく現在の最良のインター予測モード及びそれぞれのインター予測ブロックを(最終的な)インター予測パラメータ143及びインター予測ブロック145として用いることにより、インター予測ブロック、すなわち、いわゆる「ある種の」インター予測144)を算出することを、一方(インター推定)が要求する/有する際に、両方の機能が実行されてよい。
【0099】
イントラ推定ユニット152は、画像ブロック103(現在の画像ブロック)、及び、イントラ推定のための同じ画像の1つ又は複数の以前に再構築したブロック、例えば、再構築された隣接ブロックを取得、例えば、受信するように構成される。エンコーダ100は、例えば、複数の(予め決定された)イントラ予測モードからイントラ予測モードを選択し、それをイントラ推定パラメータ153としてイントラ予測ユニット154に提供するように構成されてよい。
【0100】
エンコーダ100の実施形態は、最適化基準、例えば、最小残差(例えば、現在の画像ブロック103に最も類似する予測ブロック155を提供するイントラ予測モード)又は最小のレート歪みに基づいて、イントラ予測モードを選択するように構成されてよい。
【0101】
イントラ予測ユニット154は、イントラ予測パラメータ153、例えば、選択されたイントラ予測モード153に基づいて、イントラ予測ブロック155を決定するように構成される。
【0102】
図1は、イントラ符号化に関する2つの別個のユニット(又は、段階)、つまり、イントラ推定152及びイントラ予測154を示すが、例えば、現在の最良のイントラ予測モード及びそれぞれのイントラ予測ブロックを格納しつつ、可能なイントラ予測モードのすべての可能な又は予め決定されたサブセットを繰り返しテストして、イントラ予測154を別のときに実行することなく現在の最良のイントラ予測モード及びそれぞれのイントラ予測ブロックを(最終的な)イントラ予測パラメータ153及びイントラ予測ブロック155として用いることにより、イントラ予測ブロック、すなわち、いわゆる「ある種の」イントラ予測154)を算出することを、一方(イントラ推定)が要求する/有する際に、両方の機能が実行されてよい。
【0103】
エントロピーエンコーディングユニット170は、量子化された残差係数109、インター予測パラメータ143、イントラ予測パラメータ153、及び/又は、ループフィルタパラメータに対して、エントロピーエンコーディングアルゴリズム又はスキーム(例えば、可変長符号化(VLC)スキーム、コンテキスト適応型VLCスキーム(CALVC)、算術符号化スキーム、コンテキスト適応型バイナリ算術符号化(CABAC))を個々に又は共同で(又は、いずれでもなく)適用して、例えば、エンコードされたビットストリーム171の形式で、出力172により出力されることができるエンコードされた画像データ171を取得するように構成される。
【0104】
図2は、例えば、エンコーダ100によりエンコードされる、エンコードされた画像データ(例えば、エンコードされたビットストリーム)171を受信して、デコードされた画像231を取得するように構成される例示的なビデオデコーダ200を示す。
【0105】
デコーダ200は、入力202と、エントロピーデコードユニット204と、逆量子化ユニット210と、逆変換ユニット212と、再構築ユニット214と、バッファ216と、ループフィルタ220と、デコードされた画像バッファ230と、予測ユニット260と、インター予測ユニット244と、イントラ予測ユニット254と、モード選択ユニット260と、出力232とを備える。
【0106】
エントロピーデコードユニット204は、エンコードされた画像データ171に対してエントロピーデコードを実行して、例えば、量子化係数209及び/又はデコードされた符号化パラメータ(図2には示されていない)、例えば、(デコードされた)インター予測パラメータ143、イントラ予測パラメータ153及び/又はループフィルタパラメータのいずれか又はすべてを取得するように構成される。
【0107】
デコーダ200の実施形態では、逆量子化ユニット210、逆変換ユニット212、再構築ユニット214、バッファ216、ループフィルタ220、デコードされた画像バッファ230、予測ユニット260及びモード選択ユニット260は、エンコーダ100(及び、それぞれの機能ユニット)の逆の処理を実行して、エンコードされた画像データ171をデコードするように構成される。
【0108】
特に、逆量子化ユニット210は、機能において逆量子化ユニット110と同一であってよく、逆変換ユニット212は、機能において逆変換ユニット112と同一であってよく、再構築ユニット214は、機能において再構築ユニット114と同一であってよく、バッファ216は、機能においてバッファ116と同一であってよく、ループフィルタ220は、機能においてループフィルタ220と同一であってよく(実際のループフィルタに関して、ループフィルタ220は、典型的には、元のイメージ101又はブロック103に基づいてフィルタリングパラメータを決定するフィルタ分析ユニットを有していないが、例えば、エントロピーデコードユニット204からエンコードするために用いられるフィルタリングパラメータを(明示的に又は暗黙的に)受信又は取得するので)、デコードされた画像バッファ230は、機能においてデコードされた画像バッファ130と同一であってよい。
【0109】
予測ユニット260は、インター予測ユニット244及びインター予測ユニット254を有してよく、インター予測ユニット144は、機能においてインター予測ユニット144と同一であってよく、インター予測ユニット154は、機能においてイントラ予測ユニット154と同一であってよい。予測ユニット260及びモード選択ユニット262は、典型的には、(元のイメージ101に関してこれ以上の情報を用いることなく)エンコードされたデータ171のみから、ブロック予測を実行し、及び/又は、予測されたブロック265を取得し、予測パラメータ143又は153、及び/又は、選択された予測モードに関する情報を、例えば、エントロピーデコードユニット204から(明示的に又は暗黙的に)受信又は取得するように構成される。
【0110】
デコーダ200は、ユーザへの提示又は視聴のために、例えば、出力232を介してデコードされた画像230を出力するように構成される。
【0111】
本開示の実施形態は、ビデオ符号化に基づいて主に説明されてきたが、エンコーダ100及びデコーダ200(及び、対応して、システム300)の実施形態は、静止画像処理又は符号化、すなわち、ビデオ符号化にあるような任意の前述した又は連続的な画像とは関係のない個別の画像の処理又は符号化のために構成されてもよいことに留意されたい。一般的に、画像処理符号化が単一の画像101に限定される場合、インター推定142、インター予測144、242のみが利用可能ではない。ほとんどの場合、必ずしもビデオエンコーダ100及びビデオデコーダ200の他のすべての機能(ツール又は技術とも称される)、例えば、区分化、変換(スケーリング)106、量子化108、逆量子化110、逆変換112、イントラ推定142、イントラ予測154、254、及び/又は、ループフィルタリング120、220、及び、エントロピー符号化170及びエントロピーデコード204が、静止画像に対して等しく用いられるわけではないかもしれない。
【0112】
本開示は、図1及び図2においてループフィルタとも称されるデブロッキングフィルタの仕組みに言及する。
【0113】
図4には、ブロックエッジ403により分けられる2つの例示的な符号化ブロック401、402が示されている。符号化ブロック401、402は、画素列402-407及び画素行408-415を有する。ここでは特に、ブロックエッジは、垂直方向のブロックエッジである。この例では、ブロックは、4×4画素のサイズを有する。しかしながら、実施の際、他のブロックサイズが使用され得る。
【0114】
ブロック境界の各セグメントに対して、デブロッキング決定が別個に行われる。
【0115】
HEVCにおける強力なデブロッキングフィルタは、エリアを平滑化するために適用され、ブロックアーチファクトがより見やすくなる。フィルタリングモードは、ブロック境界から3つのサンプルを修正し、強力なローパスフィルタリングを有効にする。各サンプルに対して、クリッピング演算がさらに実行される。クリッピング演算を実行するための理由は、フィルタリング決定において評価されていなかったラインに対する過度のフィルタリングがないことを確認するために、フィルタリングの量を制限するからである。図4に示されるように、画素列405及び406は、フィルタリングするか、フィルタリングしないかの決定において用いられていない。これは、計算の複雑性の理由で行われる。ここでは、決定画素列404及び407のみが、実行対象のフィルタリングを決定するために用いられる。
【0116】
以下では、デブロッキングされた画素値を決定するための関数が示される。
【数1】
【0117】
P0’、P1’、P2’は、元の画素値P0、P1及びP2にそれぞれ対応するフィルタリングされる画素値である。ここで、図4に示されるように、第2インデックスは省略されている。
【0118】
記号「>>」は、右シフトを示す。右シフトは2yの除算に対応し、yは右シフトの量である。例えば、関数7.17において、「>>3」は、23で除算した値=8を示す。
【0119】
修正されたサンプル値は、次に、[Pi-2tc,Pi+2tc]の範囲に対してクリッピングされ、Piは画素iの画素値であり、tcは一定値である。tcは、例えば、テーブルへのインデックスとして平均量子化パラメータQPを用いるテーブルから導出され得る。通常、QP値が高くなればなるほど、tc値が大きくなる。
【0120】
図8は、ブロックエッジ800における典型的なブロッキングアーチファクトを示す。サンプルP0及びQ0は、最大の歪みを有し、ブロックエッジからさらに離れるサンプル、例えば、サンプルP3及びQ3は、歪みが少ない傾向にあることが容易に分かり得る。
【0121】
画素値のすべてが同じクリッピング範囲[Pi-2tc,Pi+2tc]にクリッピングされるので、ブロック境界から遠く離れている画素値、例えば、P3及びQ3はまた、同じクリッピング範囲を用いており、したがって、画素値P0及びQ0と同じ範囲内で修正されることを可能にする。この一定のクリッピング範囲は、結果的に、境界から遠く離れるサンプルも大幅に修正されることになるため、結果的に、過度な平滑化又はぼかし、又は、場合により、意味のあるイメージコンテンツの損失を伴う依然として正しくないデブロッキングフィルタリングをもたらす。
【0122】
すべての画素値に対して固定のクリッピング範囲を用いる代わりに、本開示によれば、クリッピング範囲が適応可能になっている。特に、クリッピング範囲は、ブロックエッジからのそれぞれの画素の距離から適応可能になっている。
【0123】
有利なことに、ルックアップテーブル又は関数は、フィルタリングされる画素値がクリッピングされることにより、クリッピング値を決定するために用いられる。好ましくは、そのような関数は、エッジからの画素の距離に基づいて単調に減少する関数である。エッジ/境界からのサンプルの距離が大きくなればなるほど、画素に対して規定されるクリッピング値が小さくなる。したがって、ブロックエッジから遠く離れている画素値は、より小さいクリッピング値を有することを可能にすることで、ブロックエッジに近い画素値と比較して、クリッピング後により小さい偏差を有することを可能にする。このように、フィルタリングの量が制御されるので、過度な平滑化又はぼかしが防止される。
【0124】
有利なことに、指数関数は、クリッピング値を決定するために用いられる。クリッピング値は、次に、以下のように決定され得る。
tc’=tc+(tc>>i)
tc’はクリッピング値である。
tcは一定値である。
iは、ブロックエッジからの画素の距離である。
>>は、右シフトを示す。
【0125】
これは、結果として、デブロッキングされた画素値のクリッピングのための以下の式が得られる。
P’a,b=(Pa,b-(tc+(tc>>i))、
Pa,b+(tc+(tc>>i)))。
ここで、
P’a,bは、画素a、bのデブロッキングされた画素値である。
aは画素行の整数インデックスである。
bは画素列の整数インデックスである。
Pa,bは画素a、bの元の画素値である。
iは、ブロックエッジからの画素の整数距離である。
【0126】
例えば、P0、0及びQ0、0の場合、iの値が0である(距離が0である)ので、クリッピングは、式7.17-7.19に沿う説明と同じ状態を保つ。クリッピング値がtc’=tc+(tc>>0)=2tcに設定され、結果として、P’0,0=(P0,0-2tc),P0,0+2tc))が得られる。
【0127】
例えば、P’1,0の場合、クリッピングは、tc’=tc+(tc>>1)=tc+tc/2=1.5tcに低下し、結果として、P’1,0=(P1,0-1.5tc)、P1,0+1.5tc))が得られる。
【0128】
例えば、P’2,0の場合、クリッピングは、tc’=tc+(tc>>2)=tc+tc/4=1.25tcに低下し、結果として、P’2,0=(P2,0-1.25tc),P2,0+1.25tc))が得られる。
【0129】
分かり得るように、サンプル距離iがブロックエッジから大きくなるにつれて、クリッピング値が次第に低下する。
【0130】
用いられ得る別の代替的な指数関数は、以下のとおりである。
tc’=((2*tc)>>i)
tc’はクリッピング値である。
tcは一定値である。
iは、ブロックエッジからの画素の距離である。
>>は、右シフトを示す。
【0131】
これは、結果として、デブロッキングされた画素値のクリッピングのための以下の式が得られる。
P’a,b=(Pa,b-((2*tc)>>i))
Pa,b+((2*tc)>>i)))。
ここで、
P’a,bは、画素a、bのデブロッキングされた画素値である。
aは画素行の整数インデックスである。
bは画素列の整数インデックスである。
Pa,bは画素a、bの元の画素値である。
iは、ブロックエッジからの画素の整数距離である。
【0132】
しかしながら、指数関数の計算は、結果として、大幅な計算の複雑性をもたらす。代替的な実施形態では、線形関数が用いられ得る。この場合、クリッピング値は、以下のように設定される。
tc’=tc+(tc-(i*x)
tc’はクリッピング値である。
tcは一定値である。
iは、ブロックエッジからの画素の距離である。
xは一定値である。
【0133】
これは、結果として、クリッピングされるデブロッキングされた画素値が得られる。
P’a,b=
(Pa,b-(tc+(tc-(i*x)),Pa,b+(tc+(tc-(i*x)))
ここで、
P’a,bは、画素a、bのデブロッキングされた画素値である。
aは画素行の整数インデックスである。
bは画素列の整数インデックスである。
Pa,bは画素a、bの元の画素値である。
iは、ブロックエッジからの画素の整数距離である。
xは一定の整数値である。
【0134】
有利なことに、xは、デブロッキング処理において用いられる平均量子化パラメータQPによって決まる。一般的に、QP値が増加するにつれて、xの値は増加する。また、xの値は、8ビットのビデオ及び10ビットのビデオに対して別個に導出され得る。
【0135】
例として、10ビットのビデオに対するxの値は、以下のように設定することができる。
【表1】
【表2】
【表3】
【表4】
【0136】
例として、37の平均QP値の場合、xの値が2であるので、画素値は、以下のように修正される。
【0137】
例えば、P0、0の場合、iの値が0である(距離が0である)ので、クリッピングは、式7.17-7.19に沿う説明と同じ状態を保つ。クリッピング値がtc’=tc+(tc-(0*2)=2tcに設定され、結果として、P’0,0=(P0,0-(tc+(tc-(0*2))、P0,0+(tc+(tc-(0*2)))が得られる。
【0138】
例えば、P’1,0の場合、クリッピングは、tc’=tc+(tc-(1*2)=2tc-2に低下し、結果として、P’1,0=(P1,0-2tc-2),P1,0+2tc-2))が得られる。
【0139】
例えば、P’2,0の場合、クリッピングは、tc’=tc+(tc-2*2)=tc+(tc-4)=2tc-4に低下し、結果として、P’2,0=(P2,0-(2tc-4)),P2,0+(2tc-4))が得られる。
【0140】
さらに有利な実施形態において、距離に依存するクリッピングの使用は、前に示したように、図4に示されるような非決定画素列及び非決定画素行に限定されている。前に説明したように、ブロックエッジのフィルタリングが実行されるかどうかを決定するために、決定画素列(垂直方向のブロックエッジ)又は決定画素行(水平方向のブロックエッジ)からの画素の数が用いられる。しかしながら、計算の複雑性を省くために、ブロック内のすべての画素列/行がこの決定を基礎として用いられているわけではない。しかしながら、範囲に依存するクリッピングは、非決定画素列/行でのみ実行され、決定画素列/行である画素列/行では実行されない。決定画素列/行では、一定値を用いる従来のクリッピングが実行される。
【0141】
図5には、本開示の第1態様の実施形態が示されている。特に、ここでは、フィルタ502を備えるイメージ処理デバイス501が示されている。フィルタ502は、上記に示されるデブロッキングフィルタリングを実行するように適合される。
【0142】
図6には、本開示の第2態様の実施形態が示されている。特に、ここでは、イメージ処理デバイス601を備え、さらに、フィルタ602を備えるエンコーダ600が示されている。上記に示されるように、フィルタ602は、デブロッキングフィルタリングを実行する。
【0143】
図7には、本開示の第3態様の実施形態が示されている。特に、ここでは、イメージ処理デバイス701を備え、次に、フィルタ702を備えるデコーダ700が示されている。上記に示されるように、フィルタ702は、デブロッキングフィルタリングを実行する。
【0144】
最後に、図9には、本開示の第5態様の実施形態がフロー図で示されている。第1段階1000において、ブロックエッジからのデブロッキング範囲内のフィルタリング対象の画素の少なくともいくつかに対して、画素の元の画素値及び少なくとも1つのさらなる画素値から、フィルタリングされる画素値が決定される。第2段階1001において、ブロックエッジからの画素の距離に依存して、画素のクリッピング値が決定される。最後の第3段階1002において、クリッピング値を用いて、フィルタリングされる画素値がクリッピングされ、結果として、デブロッキングされた画素値が得られる。
【0145】
上記からどのようにデブロッキングフィルタリングが実行されるかに関する詳細がまた、本開示の第4態様に係る方法に適用可能であることが指摘される。
【0146】
本開示は、実施形態に、特に、上記に示される符号化ブロックサイズ及びフィルタタップ長に限定されるものではないことに留意することが重要である。本開示は、任意の符号化ブロックサイズ及び任意のフィルタタップ長に適用され得る。
【0147】
[頭文字の定義]
CTU/CTB-符号化ツリーユニット/符号化ツリーブロック
CU/CB-符号化ユニット/符号化ブロック
PU/PB-予測ユニット/予測ブロック
TU/TB-変換ユニット/変換ブロック
HEVC-高効率ビデオ符号化
【0148】
[参照番号のリスト]
図1
100 エンコーダ
103 画像ブロック
102 入力(例えば、入力ポート、入力インタフェース)
104 残差計算[ユニット又は段階]
105 残差ブロック
106 変換(例えば、スケーリングを追加的に備える)[ユニット又は段階]
107 変換係数
108 量子化[ユニット又は段階]
109 量子化係数
110 逆量子化[ユニット又は段階]
111 逆量子化係数
112 逆変換(例えば、スケーリングを追加的に備える)[ユニット又は段階]
113 逆変換したブロック
114 再構築[ユニット又は段階]
115 再構築したブロック
116 (ライン)バッファ[ユニット又は段階]
117 参照サンプル
120 ループフィルタ[ユニット又は段階]
121 フィルタリングされるブロック
130 デコードされた画像バッファ(DPB)[ユニット又は段階]
142 インター推定(又は、インター画像推定)[ユニット又は段階]
143 インター推定パラメータ(例えば、参照画像/参照画像インデックス、動きベクトル/オフセット)
144 インター予測(又は、インター画像予測)[ユニット又は段階]
145 インター予測ブロック
152 イントラ推定(又は、イントラ画像推定)[ユニット又は段階]
153 イントラ予測パラメータ(例えば、イントラ予測モード)
154 イントラ予測(イントラフレーム/画像予測)[ユニット又は段階]
155 イントラ予測ブロック
162 モード選択[ユニット又は段階]
165 予測ブロック(インター予測ブロック145又はイントラ予測ブロック155のいずれか)
170 エントロピーエンコード[ユニット又は段階]
171 エンコードされた画像データ(例えば、ビットストリーム)
172 出力(出力ポート、出力インタフェース)
231 デコードされた画像
図2
200 デコーダ
171 エンコードされた画像データ(例えば、ビットストリーム)
202 入力(ポート/インタフェース)
254 エントロピーデコード
209 量子化係数
210 逆量子化
211 逆量子化係数
212 逆変換(スケーリング)
213 逆変換したブロック
214 再構築(ユニット)
215 再構築したブロック
216 (ライン)バッファ
217 参照サンプル
220 ループフィルタ(インループフィルタ)
221 フィルタリングされるブロック
230 デコードされた画像バッファ(DPB)
231 デコードされた画像
232 出力(ポート/インタフェース)
244 インター予測(インターフレーム/画像予測)
245 インター予測ブロック
254 イントラ予測(イントラフレーム/画像予測)
255 イントラ予測ブロック
260 モード選択
265 予測ブロック(インター予測ブロック245又はイントラ予測ブロック255)
図3
300 符号化システム
310 ソースデバイス
312 画像ソース
313 (未加工)画像データ
314 プリプロセッサ/前処理ユニット
315 前処理された画像データ
318 通信ユニット/インタフェース
320 宛先デバイス
322 通信ユニット/インタフェース
326 ポストプロセッサ/後処理ユニット
327 後処理された画像データ
328 ディスプレイデバイス/ユニット
330 伝送され/受信され/通信された(エンコードされた)画像データ
図4
401 符号化ブロック
402 符号化ブロック
403 ブロックエッジ
404 画素列
405 画素列
406 画素列
407 画素列
408 画素行
409 画素行
410 画素行
411 画素行
412 画素行
413 画素行
414 画素行
415 画素行
図5
501 イメージ処理デバイス
502 フィルタ
図6
600 エンコーダ
601 イメージ処理デバイス
602 フィルタ
図7
700 デコーダ
701 イメージ処理デバイス
702 フィルタ
図8
800 ブロックエッジ
図9
1000 第1段階
1001 第2段階
1002 第3段階
【0149】
本開示の追加の詳細は、付属書Aに提示される。
【0150】
いくつかの実施形態が本開示において提供されてきたが、開示されるシステム及び方法は、本開示の趣旨又は範囲から逸脱することなく、多くの他の特定の形式で具現化されてよいことを理解されたい。本例は、例示的なものであって、限定的なものではないとみなされるべきであり、その意図は、本明細書において与えられた詳細に限定されるべきではない。例えば、様々な要素又はコンポーネントが、別のシステムに組み合わせられ、又は、統合されてよく、又は、一定の特徴が省略されても、実装されなくてもよい。
【0151】
さらに、様々な実施形態において、別個に又は分離して説明及び示された技術、システム、サブシステム及び方法は、本開示の範囲から逸脱することなく、他のシステム、モジュール、技術又は方法と組み合わせられ、又は、統合されてよい。互いに連結される、互いに直接連結される、又は互いに通信するものとして示され論じられた他の要素が、電気的であれ、機械的であれ、又は別の方法であれ、何らかのインタフェース、デバイス、又は中間コンポーネントを介して間接的に連結されても、通信してもよい。変更、置換及び代替の他の例が当業者によって確認可能であり、本明細書で開示される趣旨及び範囲から逸脱することなく行われ得る。以下に与えられるものは、特定の実施形態をリスト化したものである。丸括弧内の参照番号は、限定なものとしてではなく、例示的なものとして解釈されるべきである。
実施形態1
ブロック符号でエンコードされたイメージの第1符号化ブロック(401)と第2符号化ブロック(402)との間のブロックエッジ(403、800)をデブロッキングするための、イメージエンコーダ(600)及び/又はイメージデコーダ(700)における使用のためのイメージ処理デバイス(501、601、701)であって、イメージ処理デバイス(501、601、701)は、ブロックエッジ(403、800)をフィルタリングするためのフィルタ(502、602、702)を備え、ブロックエッジ(403、800)からのデブロッキング範囲であってブロックエッジ(403、800)に対して垂直となるデブロッキング範囲内のフィルタリング対象の画素の少なくともいくつかに対して、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定し、
ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定し、
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られる
ように構成される。
実施形態2
クリッピング値は、元の画素値とデブロッキングされた画素値との間で最大限許容される変化量である、実施形態1のイメージ処理デバイス(501、601、701)。
実施形態3
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られることは、
フィルタリングされる画素値とデブロッキングされた画素値との間の差の絶対値が画素のクリッピング値を越えない場合、デブロッキングされた画素値をフィルタリングされる画素値に設定することと、
フィルタリングされる画素値が、元の画素値プラスクリッピング値を超える場合、デブロッキングされた画素値を、元の画素値プラス画素のクリッピング値に設定することと、
フィルタリングされる画素値が、元の画素値マイナスクリッピング値より小さい場合、デブロッキングされた画素値を、元の画素値マイナス画素のクリッピング値に設定することと
を有する、実施形態1又は2のイメージ処理デバイス(501、601、701)。
実施形態4
フィルタ(502、602、702)は、関数又はルックアップテーブルを用いることにより、ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定するように適合される、実施形態1から3のうちのいずれかのイメージ処理デバイス(501、601、701)。
実施形態5
フィルタ(502、602、702)は、ブロックエッジ(403、800)からの画素の距離を拡大しつつ単調に減少する関数を用いることにより、ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定するように適合される、実施形態1から3のうちのいずれかのイメージ処理デバイス(501、601、701)。
実施形態6
関数は指数関数である、実施形態5のイメージ処理デバイス(501、601、701)。
実施形態7
関数は、tc’=tc+(tc>>i)であり、tc’はクリッピング値であり、tcは一定値であり、iは、ブロックエッジ(403、800)からの画素の距離であり、>>は、右シフトを示す、実施形態6のイメージ処理デバイス(501、601、701)。
実施形態8
関数は線形関数である、実施形態5のイメージ処理デバイス(501、601、701)。
実施形態9
関数はtc’=tc+(tc-(i*x)であり、tc’はクリッピング値であり、tcは一定値であり、iは、ブロックエッジ(403、800)からの画素の距離であり、xは一定値である、実施形態8のイメージ処理デバイス(501、601、701)。
実施形態10
実施形態1から9のうちのいずれかのイメージ処理デバイス(501、601、701)であって、フィルタ(502、602、702)は、ブロックエッジ(403、800)からのデブロッキング範囲であって、ブロックエッジ(403、800)に対して垂直となるデブロッキング範囲内のフィルタリング対象の各画素に対して、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定し、ブロックエッジ(403、800)から画素の距離に依存する画素のクリッピング値を決定し、クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られるように適合される。
実施形態11
フィルタ(502、602、702)は、垂直方向のブロックエッジ(403、800)の場合、決定画素列の数がブロックエッジ(403、800)を囲むブロック内の画素列の数より小さいということに基づいて、及び、水平方向のブロックエッジ(403、800)の場合、決定画像行の数がブロックエッジ(403、800)を囲むブロック内の画素行の数より小さいということに基づいて、ブロックエッジ(403、800)がフィルタリングされる必要があるかどうかを決定することであって、フィルタ(502、602、702)は、ブロックエッジ(403、800)からのデブロッキング範囲内の決定画素行又は決定画素列にはないフィルタリング対象の各画素に対して、デブロッキング範囲がブロックエッジ(403、800)に対して垂直となるように適合される、決定することと、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定することと、
ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定することと、
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果として、デブロッキングされた画素値が得られることと
を行うように適合され、
フィルタ(502、602、702)は、ブロックエッジ(403、800)からのデブロッキング範囲であって、ブロックエッジ(403、800)に対して垂直となるデブロッキング範囲内の決定画素行又は決定画素列にあるフィルタリング対象の各画素に対して、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定することと、
一定のクリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果として、デブロッキングされた画素値が得られることと
を行うように適合される、実施形態1から9のうちのいずれかのイメージ処理デバイス(501、601、701)。
実施形態12
フィルタ(502、602、702)は、1個、又は、少なくとも2個、又は、少なくとも3個、又は、少なくとも4個、又は、少なくとも5個、又は、少なくとも6個、又は、少なくとも7個、又は、少なくとも8個、又は、少なくとも9個、又は、少なくとも10個、又は、少なくとも11個、又は、少なくとも12個、又は、少なくとも13個、又は、少なくとも14個、又は、少なくとも15個、又は、少なくとも16個の画素のフィルタタップ長を有する、実施形態1から11のうちのいずれかのイメージ処理デバイス(501、601、701)。
実施形態13
実施形態1から12のうちのいずれかのイメージ処理デバイス(501、601、701)を備える、イメージをエンコードするためのエンコーダ。
実施形態14
実施形態1から12のうちのいずれかのイメージ処理デバイス(501、601、701)を備える、イメージをデコードするためのデコーダ。
実施形態15
ブロック符号でエンコードされたイメージの第1符号化ブロックと第2符号化ブロックとの間のブロックエッジ(403、800)をデブロッキングするためのデブロッキング方法であって、方法は、ブロックエッジ(403、800)からのデブロッキング範囲であって、ブロックエッジ(403、800)に対して垂直となるデブロッキング範囲内のフィルタリング対象となる画素の少なくともいくつかに対して、
画素の元の画素値及び少なくとも1つのさらなる画素値からフィルタリングされる画素値を決定する段階(1000)と、
ブロックエッジ(403、800)からの画素の距離に依存する画素のクリッピング値を決定する段階(1001)と、
クリッピング値を用いてフィルタリングされる画素値をクリッピングして、結果としてデブロッキングされた画素値が得られる(1002)と
を備える方法。
実施形態16
実施形態15のデブロッキング方法を備える、イメージをエンコードするためのエンコーディング方法。
実施形態17
実施形態15のデブロッキング方法を備える、イメージをデコードするためのデコーディング方法。
実施形態18
コンピュータプログラムがコンピュータ上で動作する場合、実施形態15から17のうちのいずれかに係る方法を実行するためのプログラムコードを備えるコンピュータプログラム製品。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【手続補正書】
【提出日】2024-07-25
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
イメージの第1のブロックと第2のブロックとの間のブロックエッジをデブロッキングするための、イメージエンコーダ及び/又はイメージデコーダにおける使用のためのイメージ処理デバイスであって、前記イメージ処理デバイスは、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに連結され、前記少なくとも1つのプロセッサによる実行のためのプログラミング命令を記憶する1つ又は複数のメモリと
を含み、前記プログラミング命令は、前記イメージ処理デバイスに、
第1の画素、第2の画素、及び第3の画素の元の画素値からフィルタリングされた画素値を生成することであって、前記第2の画素及び前記第3の画素は同じ決定画素列にあり、前記第1の画素は非決定画素列にある、前記生成することと、
一定のクリッピング値を用いて前記第2の画素及び前記第3の画素の前記フィルタリングされた画素値をクリッピングすることと、
前記ブロックエッジからの前記第1の画素の距離に依存するクリッピング値を用いて前記第1の画素の前記フィルタリングされた画素値をクリッピングすることと、
を行わせる、イメージ処理デバイス。
【請求項2】
前記ブロックエッジからの前記第2の画素の距離は、前記ブロックエッジからの前記第3の画素の距離とは異なる、請求項1に記載のイメージ処理デバイス。
【請求項3】
前記ブロックエッジからの前記第1の画素の距離に依存するクリッピング値を用いて前記第1の画素の前記フィルタリングされた画素値をクリッピングすることは、
関数又はルックアップテーブルを用いて前記クリッピング値を取得することを含む、請求項1に記載のイメージ処理デバイス。
【請求項4】
前記第1の画素の前記クリッピング値は、前記ブロックエッジからの前記第1の画素の前記距離の単調に減少する関数である、請求項1に記載のイメージ処理デバイス。
【請求項5】
前記第1の画素、前記第2の画素、及び前記第3の画素は、前記ブロックエッジからのデブロッキング範囲内にあり、前記デブロッキング範囲は、前記ブロックエッジに対して垂直であるラインにおける画素の数を含む、請求項1に記載のイメージ処理デバイス。
【請求項6】
前記少なくとも1つのプロセッサは、さらに、前記プログラミング命令を実行して、
前記第1の画素の前記元の第1の画素値および少なくとも1つのさらなる画素値から前記フィルタリングされた第1の画素値を決定する、請求項1に記載のイメージ処理デバイス。
【請求項7】
前記決定画素列は、実行対象のフィルタリングを決定するために使用される、請求項1に記載のイメージ処理デバイス。
【請求項8】
イメージの第1のブロックと第2のブロックとの間のブロックエッジをデブロッキングするためのデブロッキング方法であって、
第1の画素、第2の画素、及び第3の画素の元の画素値からフィルタリングされた画素値を生成するステップであって、前記第2の画素及び前記第3の画素は同じ決定画素列にあり、前記第1の画素は非決定画素列にある、ステップと、
一定のクリッピング値を用いて前記第2の画素及び前記第3の画素の前記フィルタリングされた画素値をクリッピングするステップと、
前記ブロックエッジからの前記第1の画素の距離に依存するクリッピング値を用いて前記第1の画素の前記フィルタリングされた画素値をクリッピングするステップと、
を含む、方法。
【請求項9】
前記ブロックエッジからの前記第2の画素の距離は、前記ブロックエッジからの前記第3の画素の距離とは異なる、請求項8に記載の方法。
【請求項10】
前記ブロックエッジからの前記第1の画素の距離に依存するクリッピング値を用いて前記第1の画素の前記フィルタリングされた画素値をクリッピングするステップは、
関数又はルックアップテーブルを用いて前記クリッピング値を取得するステップを含む、請求項8に記載の方法。
【請求項11】
前記第1の画素の前記クリッピング値は、前記ブロックエッジからの前記第1の画素の前記距離の単調に減少する関数である、請求項8に記載の方法。
【請求項12】
前記第1の画素、前記第2の画素、及び前記第3の画素は、前記ブロックエッジからのデブロッキング範囲内にあり、前記デブロッキング範囲は、前記ブロックエッジに対して垂直であるラインにおける画素の数を含む、請求項8に記載の方法。
【請求項13】
前記少なくとも1つのプロセッサは、さらに、前記命令を実行して、
前記第1の画素の前記元の第1の画素値および少なくとも1つのさらなる画素値から前記フィルタリングされた第1の画素値を決定する、請求項8に記載の方法。
【請求項14】
前記決定画素列は、実行対象のフィルタリングを決定するために使用される、請求項8に記載の方法。
【請求項15】
エンコードされたデータを伝送するためのネットワークデバイスであって、前記エンコードされたデータは、エンコーダに、
第1の画素、第2の画素、及び第3の画素の元の画素値からフィルタリングされた画素値を生成することであって、前記第2の画素及び前記第3の画素は同じ決定画素列にあり、前記第1の画素は非決定画素列にある、前記生成することと、
一定のクリッピング値を用いて前記第2の画素及び前記第3の画素の前記フィルタリングされた画素値をクリッピングすることと、
前記ブロックエッジからの前記第1の画素の距離に依存するクリッピング値を用いて前記第1の画素の前記フィルタリングされた画素値をクリッピングすることと、
を行わせるための特定の情報を含む、ネットワークデバイス。
【請求項16】
前記ブロックエッジからの前記第2の画素の距離は、前記ブロックエッジからの前記第3の画素の距離とは異なる、請求項15に記載のネットワークデバイス。
【請求項17】
前記ブロックエッジからの前記第1の画素の距離に依存するクリッピング値を用いて前記第1の画素の前記フィルタリングされた画素値をクリッピングすることは、
関数又はルックアップテーブルを用いて前記クリッピング値を取得することを含む、請求項15に記載のネットワークデバイス。
【請求項18】
前記第1の画素の前記クリッピング値は、前記ブロックエッジからの前記第1の画素の前記距離の単調に減少する関数である、請求項15に記載のネットワークデバイス。
【請求項19】
前記第1の画素、前記第2の画素、及び前記第3の画素は、前記ブロックエッジからのデブロッキング範囲内にあり、前記デブロッキング範囲は、前記ブロックエッジに対して垂直であるラインにおける画素の数を含む、請求項15に記載のネットワークデバイス。
【請求項20】
前記決定画素列は、実行対象のフィルタリングを決定するために使用される、請求項15に記載のネットワークデバイス。
【外国語明細書】