IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特許7085009マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置
<>
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図1
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図2
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図3
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図4
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図5
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図6
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図7
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図8
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図9
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図10
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図11
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図12
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図13
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図14
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図15
  • 特許-マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-07
(45)【発行日】2022-06-15
(54)【発明の名称】マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置
(51)【国際特許分類】
   H04N 19/91 20140101AFI20220608BHJP
   H04N 19/467 20140101ALI20220608BHJP
   H04N 19/48 20140101ALI20220608BHJP
【FI】
H04N19/91
H04N19/467
H04N19/48
【請求項の数】 36
(21)【出願番号】P 2020546391
(86)(22)【出願日】2018-03-07
(65)【公表番号】
(43)【公表日】2021-07-01
(86)【国際出願番号】 RU2018000141
(87)【国際公開番号】W WO2019172797
(87)【国際公開日】2019-09-12
【審査請求日】2020-09-09
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】フィリーポフ,アレクセイ コンスタンチノヴィッチ
(72)【発明者】
【氏名】カラブトフ,アレクサンドル アレクサンドロヴィッチ
(72)【発明者】
【氏名】ルフィツスキー,ヴァシーリィ アレクセーヴィッチ
【審査官】坂東 大五郎
(56)【参考文献】
【文献】特表2014-534764(JP,A)
【文献】Kimihiko Kazui et al.,Description of video coding technology proposal by FUJITSU, Joint Collaborative Team on Video Coding (JCT-VC),2010年04月15日,[JCTVC-A115] (version 1)
【文献】Gordon CLARE et al.,Sign Data Hiding,Joint Collaborative Team on Video Coding (JCT-VC),2011年11月24日,[JCTVC-G271] (version 3)
【文献】Felix Henry et al.,Residual Coefficient Sign Prediction,Joint Video Exploration Team (JVET),2016年10月20日,[JVET-D0031] (version 4)
【文献】Xiang Yu et al.,Multiple Sign Bits Hiding,Joint Collaborative Team on Video Coding (JCT-VC),2012年02月10日,[JCTVC-H0481] (version 3)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
信号の変換係数の組の符号を符号化する装置であって、
前記変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、前記変換係数の組の中で最大の絶対値を有する所定の数M個の変換係数を降順で含む順序付きリストであるように決定することを有する残差符号予測サブプロシージャを実行し、
前記変換係数の組の中から、前記リストに含まれる前記第1の複数の変換係数に属さない最低周波数の非ゼロの変換係数を、前記リストに含まれていない更なる変換係数として選択し、
前記残差符号予測サブプロシージャを実行した後で、前記変換係数の組の中の変換係数値の所定の関数の結果において前記更なる変換係数の符号を埋め込むことを有する符号ビット隠蔽を実行し
前記リスト内の変換係数の符号を推定するための推定プロシージャを実行し、
前記第1の複数の変換係数の夫々について、当該変換係数の符号が前記リスト内の変換係数のうちの対応する1つの推定された符号と一致するか否かを示すバイナリ値を決定し、バイナリ値のシーケンスを取得し、
エントロピー符号化技術を用いて、前記第1の複数の変換係数について得られた前記バイナリ値のシーケンスを符号化する
よう構成される処理回路を有する装置。
【請求項2】
前記リスト内の変換係数の符号を推定するための前記推定プロシージャは、
前記第1の複数の変換係数の符号の各仮説的組み合わせについて、空間領域において前記変換係数の組に対応する画像のブロックの境界ピクセルを再構成することと、
前記仮説的組み合わせの夫々について、前記再構成されたピクセルと隣接ブロックのピクセルとの間のブロック境界にわたるピクセル値の平滑度を示す所定の空間領域関数を評価することと、
前記所定の空間領域関数が最大の平滑度を示す仮説的組み合わせを前記変換係数の推定された符号として選択することと
を含む、
請求項1に記載の装置。
【請求項3】
前記リスト内の変換係数の符号を推定するための前記推定プロシージャは、
前記変換係数の組に対応する現在の画像ブロックに隣接する隣接ピクセルと、前記画像ブロックの予測信号に基づき計算される前記隣接ピクセルの予測との間の差に直交変換を適用することによって得られる変換された差、逆量子化された前記変換係数の組と比較するコスト関数に基づいて、前記符号を推定することを含む、
請求項1に記載の装置。
【請求項4】
前記処理回路は、前記組の中の第2の複数の変換係数の符号を、所定のエントロピー符号化プロシージャによって符号化するよう更に構成され、
前記第2の複数の変換係数は、前記リストに含まれる前記第1の複数の変換係数に属さずかつ前記選択された更なる変換係数とは異なる残り全ての非ゼロの変換係数を含む、
請求項1乃至のうちいずれか一項に記載の装置。
【請求項5】
前記リストは、2つのサブリストを含み、該サブリストは、第1サブリストが、閾値よりも大きい絶対値を有する変換係数を含み、第2サブリストが、前記閾値以下の絶対値を有する変換係数を含むように、前記閾値によって互いから分けられる、
請求項1乃至のうちいずれか一項に記載の装置。
【請求項6】
前記2つのサブリストの変換係数について決定される前記推定された符号との一致を示す前記バイナリ値のシーケンスは、夫々、エントロピー符号化の異なるコンテキストにより符号化される、
請求項に記載の装置。
【請求項7】
前記所定の関数の結果は、第1の符号値が第1の結果値に対応し、第2の符号値が第2の結果値に対応するように、2つの異なる値を仮定してよく、前記更なる変換係数の符号を埋め込むことは、
前記組の中の変換係数の前記所定の関数が、前記更なる変換係数の符号に対応する結果値を有するかどうかを判定することと、
前記所定の関数が前記更なる変換係数の符号に対応する前記結果値を有さない場合に、前記組の中の変換係数の前記所定の関数が前記更なる変換係数の符号に対応する前記結果値を有するように、前記組の中の変換係数の中の1つの値を変更することと
を含む、
請求項1乃至のうちいずれか一項に記載の装置。
【請求項8】
前記処理回路は、レート歪みコスト関数又は係数変更によって引き起こされる歪み若しくは当該係数の量子化レベルを反映する変更推定関数を最小にするように、変更されるべき前記変換係数の中の前記1つと、前記変更とを決定するよう更に構成される、
請求項に記載の装置。
【請求項9】
前記リストは、前記リスト内の変換係数の絶対値の閾値によって互いから分けられる2つのサブリストを含み、
前記処理回路は、前記サブリストにわたる前記第1の複数の変換係数の分布に変化をもたらすことになる変更を許さないように、変換係数の値の変更に対して制約を課すよう更に構成される、
請求項又はに記載の装置。
【請求項10】
記制約は、変更をされた値が当該変更をされていない値とは別のサブリストに属するように当該変更により前記閾値をまたぐことになる場合に、変換係数の値の当該変更を許さないことである、
請求項に記載の装置。
【請求項11】
前記変換係数は、量子化された変換係数である、
請求項1乃至10のうちいずれか一項に記載の装置。
【請求項12】
前記所定の関数は、2を法として量子化後の絶対変換係数値の和である、
請求項1乃至11のうちいずれか一項に記載の装置。
【請求項13】
前記処理回路は、
前記変換係数の組の中から、前記リストに含まれる前記第1の複数の変換係数に属さない最低周波数の非ゼロの変換係数を、前記リストに含まれない複数N個の更なる変換係数として選択し、
前記変換係数の組の中の変換係数値の所定の関数の結果において前記更なる変換係数の符号を埋め込む
よう構成される、
請求項1乃至11のうちいずれか一項に記載の装置。
【請求項14】
前記所定の関数は、2を法として量子化後の絶対変換係数値の和である、
請求項13に記載の装置。
【請求項15】
前記処理回路は、
変換ユニットの変換係数を変換係数の複数の組に分割し、
前記変換係数の複数の組の夫々について、請求項1乃至14のうちいずれか一項に記載の処理を実行する
よう構成される、
請求項1乃至14のうちいずれか一項に記載の装置。
【請求項16】
前記変換ユニットは、画像信号を変換することによって得られる変換係数の2次元ブロックであり、
前記処理回路は、前記変換ユニットを、前記変換係数の複数の組として複数の2次元ブロックに分割するよう構成される、
請求項15に記載の装置。
【請求項17】
前記変換ユニットは、画像信号を変換することによって得られる変換係数の2次元ブロックであり、
前記処理回路は、予め定義された順序に従って前記変換ユニットの変換係数を走査し、該走査された変換係数を前記変換係数の複数の組として複数の1次元チャンクに分割するよう構成される、
請求項15に記載の装置。
【請求項18】
信号の変換係数の組の符号を復号する装置であって、
第1の複数のバイナリ値のエントロピー符号化されたシーケンスを復号し、
前記変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、前記変換係数の組の中で最大の絶対値を有する所定の数M個の変換係数を降順で含む順序付きリストであるように決定することを有する残差符号予測サブプロシージャを実行し、
前記変換係数の組の中から、前記リストに含まれる前記第1の複数の変換係数に属さない最低周波数の非ゼロの変換係数を、前記リストに含まれていない更なる変換係数として選択し、
前記残差符号予測サブプロシージャを実行した後で、前記変換係数の組の中の変換係数値の所定の関数を計算することによって前記更なる変換係数の符号を決定することを有する隠蔽符号読み出しを実行し、
前記リスト内の変換係数の符号を推定するための推定プロシージャを実行し、
前記第1の複数の変換係数の符号を得るように、前記第1の複数のバイナリ値の前記復号されたシーケンスによって前記推定された符号を補正する
よう構成される処理回路を有する装置。
【請求項19】
前記リスト内の変換係数の符号を推定するための前記推定プロシージャは、
前記第1の複数の変換係数の符号の各仮説的組み合わせについて、空間領域において前記変換係数の組に対応する画像のブロックの境界ピクセルを再構成することと、
前記仮説的組み合わせの夫々について、前記再構成されたピクセルと隣接ブロックのピクセルとの間のブロック境界にわたるピクセル値の平滑度を示す所定の空間領域関数を評価することと、
前記所定の空間領域関数が最大の平滑度を示す仮説的組み合わせを前記変換係数の推定された符号として選択することと
を含む、
請求項18に記載の装置。
【請求項20】
前記リスト内の変換係数の符号を推定するための前記推定プロシージャは、
前記変換係数の組に対応する現在の画像ブロックに隣接する隣接ピクセルと、前記画像ブロックの予測信号に基づき計算される前記隣接ピクセルの予測との間の差に直交変換を適用することによって得られる変換された差、逆量子化された前記変換係数の組と比較するコスト関数に基づいて、前記符号を推定することを含む、
請求項18に記載の装置。
【請求項21】
前記復号されたバイナリ値は、前記リストの中の各変換係数について、当該変換係数の符号が当該変換係数の推定された符号と一致するか否かを示す、
請求項18又は20のいずれかに記載の装置。
【請求項22】
前記リストは、2つのサブリストを含み、該サブリストは、第1サブリストが、閾値よりも大きい絶対値を有する変換係数を含み、第2サブリストが、前記閾値以下の絶対値を有する変換係数を含むように、前記閾値によって互いから分けられ、
前記第1の複数のバイナリ値の前記シーケンスは、エントロピー符号化の異なるコンテキストにより夫々符号化されている2つのサブシーケンスを含む、
請求項18乃至21のうちいずれか一項に記載の装置。
【請求項23】
前記所定の関数の計算の結果は、2つの異なる値を仮定してよく、
前記更なる変換係数の符号は、前記結果が第1の値である場合には第1の符号値であり、前記結果が第2の値である場合には第2の符号値であるとの規則に従って決定される、
請求項18乃至22のうちいずれか一項に記載の装置。
【請求項24】
前記変換係数は、量子化された変換係数である、
請求項18乃至23のうちいずれか一項に記載の装置。
【請求項25】
前記所定の関数は、2を法として量子化後の絶対変換係数値の和である、
請求項18乃至24のうちいずれか一項に記載の装置。
【請求項26】
前記処理回路は、
前記変換係数の組の中から、前記リストに含まれる前記第1の複数の変換係数に属さない最低周波数の非ゼロの変換係数を、前記リストに含まれない複数N個の更なる変換係数として選択し、
前記変換係数の組の中の変換係数値の所定の関数を計算することによって、前記更なる変換係数の符号を決定する
よう構成される、
請求項18乃至25のうちいずれか一項に記載の装置。
【請求項27】
前記所定の関数は、2を法として量子化後の絶対変換係数値の和である、
請求項26に記載の装置。
【請求項28】
前記処理回路は、
変換ユニットの変換係数を変換係数の複数の組に分割し、
前記変換係数の複数の組の夫々について、請求項18乃至27のうちいずれか一項に記載の処理を実行する
よう構成される、
請求項18乃至27のうちいずれか一項に記載の装置。
【請求項29】
前記変換ユニットは、画像信号を変換することによって得られる変換係数の2次元ブロックであり、
前記処理回路は、前記変換ユニットを、前記変換係数の複数の組として複数の2次元ブロックに分割するよう構成される、
請求項28に記載の装置。
【請求項30】
前記変換ユニットは、画像信号を変換することによって得られる変換係数の2次元ブロックであり、
前記処理回路は、予め定義された順序に従って前記変換ユニットの変換係数を走査し、該走査された変換係数を前記変換係数の複数の組として複数の1次元チャンクに分割するよう構成される、
請求項28に記載の装置。
【請求項31】
信号の変換係数の組の符号を符号化する方法であって、
前記変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、前記変換係数の組の中で最大の絶対値を有する所定の数M個の変換係数を降順で含む順序付きリストであるように決定することを有する残差符号予測サブプロシージャを実行するステップと、
前記変換係数の組の中から、前記リストに含まれる前記第1の複数の変換係数に属さない最低周波数の非ゼロの変換係数を、前記リストに含まれていない更なる変換係数として選択するステップと、
前記残差符号予測サブプロシージャを実行した後で、前記変換係数の組の中の変換係数値の所定の関数の結果において前記更なる変換係数の符号を埋め込むことを有する符号ビット隠蔽を実行するステップと、
前記リスト内の変換係数の符号を推定するための推定プロシージャを実行するステップと、
前記第1の複数の変換係数の夫々について、当該変換係数の符号が前記リスト内の変換係数のうちの対応する1つの推定された符号と一致するか否かを示すバイナリ値を決定し、バイナリ値のシーケンスを取得するステップと、
エントロピー符号化技術を用いて、前記第1の複数の変換係数について得られた前記バイナリ値のシーケンスを符号化するステップと
を有する方法。
【請求項32】
信号の変換係数の組の符号を復号する方法であって、
第1の複数のバイナリ値のエントロピー符号化されたシーケンスを復号するステップと、
前記変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、前記変換係数の組の中で最大の絶対値を有する所定の数M個の変換係数を降順で含む順序付きリストであるように決定することを有する残差符号予測サブプロシージャを実行するステップと、
前記変換係数の組の中から、前記リストに含まれる前記第1の複数の変換係数に属さない最低周波数の非ゼロの変換係数を、前記リストに含まれていない更なる変換係数として選択するステップと、
前記残差符号予測サブプロシージャを実行した後で、前記変換係数の組の中の変換係数値の所定の関数を計算することによって前記更なる変換係数の符号を決定することを有する隠蔽符号読み出しを実行するステップと、
前記リスト内の変換係数の符号を推定するための推定プロシージャを実行するステップと、
前記第1の複数の変換係数の符号を得るように、前記第1の複数のバイナリ値の前記復号されたシーケンスによって前記推定された符号を補正するステップと
を有する方法。
【請求項33】
プロセッサによって実行される場合に、該プロセッサを含むコンピュータシステムに、請求項31に記載の方法のステップの全部を実行させるプログラム。
【請求項34】
請求項33に記載のプログラムを記憶しているコンピュータ可読媒体。
【請求項35】
プロセッサによって実行される場合に、該プロセッサを含むコンピュータシステムに、請求項32に記載の方法のステップの全部を実行させるプログラム。
【請求項36】
請求項35に記載のプログラムを記憶しているコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、ピクチャ処理の分野、例えば、静止ピクチャ及び/又はビデオピクチャコーディングに関係がある。マルチ符号ビット隠蔽及び残差符号予測を和合する新しい方法及び装置が研究される。
【背景技術】
【0002】
ビデオコーディング(ビデオ符号化及び復号化)は、広範囲のデジタルビデオ用途、例えば、ブロードキャストデジタルTV、インターネット及びモバイルネットワーク上のビデオ伝送、ビデオチャットや会議などの実時間の会議用途、DVD及びブルーレイディスク、ビデオコンテンツ取得及び編集システム、並びに、セキュリティ用途のカムコーダ、において使用されている。
【0003】
1990年のH.261標準におけるブロックに基づいたハイブリッドビデオコーディングアプローチの開発以来、新しいビデオコーディング技術及びツールが開発され、新しいビデオコーディング標準の基礎を形成してきた。ビデオコーディング標準のほとんどの目標の1つが、ピクチャ品質を犠牲にせずに、その前身と比較して、ビットレート低減を達成することである。更なるビデオコーディング標準には、MPEG-1ビデオ、MPEG-2ビデオ、ITU-T H.262/MPEG-2、ITU-T H.263、ITU-T H.264/MPEG-4、Part10、Advanced Video Coding(AVC)、ITU-T H.265、High Efficiency Video Coding(HEVC)、並びに拡張、例えば、それらの標準のスケーラビリティ及び/又は3次元(3D)拡張がある。
【0004】
以下で更に詳細に記載されるように、いくつかの画像及びビデオコーデックは、量子化された変換係数を符号化する。非ゼロの変換係数は符号を付され、すなわち、絶対値及びプラス又はマイナスのどちらか一方の符号から成る。1つの係数の符号は、正又は負のどちらか一方の符号を示す1ビットを必要とする。言い換えれば、符号ビット値“0”は、正符号を示してよく、一方、符号ビット値“1”は、負符号を示してよく、あるいは、その逆も同様である。
【0005】
非特許文献1では、符号データ隠蔽(SDH)として知られている技術が、それをH.265/HEVC作業ドラフトに採用するために提案されている。この寄与の後ろにある基本的な考えは、次のとおりである。最初のPFSCと最後のPLSCとの間にある係数の数が閾値Dthrよりも多いという条件:

LSC-PFSC≧Dthr

を満足する各TU(変換ユニット)について、最初の非ゼロ係数の符号ビットは、全ての非ゼロ係数の和のパリティに埋め込まれる。4つのデータタイプに従って、4つの閾値が送出される(表1を参照)。4×4から32×32の様々なサイズを有する全てのTUについて、1つの符号ビットがTUごとに隠される(非特許文献2)。
【表1】
【0006】
最終的に、マルチ符号ビット隠蔽(Multiple SBH,MSBH)として知られているSDH技術の改良が、H.265/HEVC標準のために採用された。実際に、4×4よりも大きいサイズを有するTUは、複数の符号ビットを埋め込まれ得る。具体的に、大きいTUの係数は、係数グループ(CG)としても知られている4×4の係数グループによって符号化されるということで、この提案は、図1に示されるように、夫々の4×4係数グループに符号ビット隠蔽技術を適用する。符号が“+”である場合には、量子化された変換係数の絶対値のパリティは、偶数を保たれるべきである。そうでなければ、パリティは奇数を保たれるべきである。そのようなものとして、係数の個数についての単一の閾値が、最初に、各ピクチャについて定義される(非特許文献2)(そのデフォルト値はDthr=4である)。H.265/HEVC標準の最終バージョンでは、この閾値は不変である。
【0007】
図1は、第1CGが参照番号420によって表されている4×4サイズの16個の係数グループに分けられている16×16個の係数のサイズを有するより大きいTU410を示す。図1は、各CGについて、所定の走査順序において最初の非ゼロの量子化された変換係数及び最後の非ゼロの量子化された変換係数を示す。対角矢印は、図1における係数の走査順序を示す。この例では、走査順序は、上から下に対角である。なお、符号ビット隠蔽は、異なる走査順序によっても働き得ることが知られる。そのような場合に、最初及び最後の非ゼロ係数の位置は、走査順序に対応して変わり得る。走査順序は、様々な方法で予め決定されてよいことが知られる。例えば、それは、ビットストリーム内で標準において規定されているか又はビットストリーム内で走査を定義することによって設定することができる可能な予め定義された走査の1つを信号により伝えることによって、操作において予め定義されるか、又は設定可能であり得る。
【0008】
従来のアプローチに従って、以下では、(走査順序において)最初の非ゼロ係数の符号が、全ての非ゼロ係数(符号なし)の和のパリティに埋め込まれる(符号化される)、と考えられる。なお、一般に、他の非ゼロ係数の符号がこのようにして伝播されてもよい。特定のCGについて、最初の非ゼロ係数の符号が正である場合には、量子化された変換係数の絶対値のパリティは、偶数であるべきである。そうでなければ(最初の非ゼロ係数の符号が負である場合には)、パリティは奇数であるべきである。従って、符号器での符号ビットデータ隠蔽は、1つのCGについて次のステップを含む:
a)符号ビット隠蔽を適用する条件がそのCGについて満たされているかどうかをチェックする。
b)CG内の最初の非ゼロ係数及びその符号を決定する。
c)CG内の全ての絶対係数値の和のパリティを計算する。
d)決定された符号を埋め込む:計算されたパリティが決定された符号に対応する場合には、係数値の変更は不要である。そうでなければ、パリティが決定された符号に対応するように、CG内の係数の1つの値は、それを1だけ増やす又は減らすことによって変更される。
【0009】
上記のステップは、TU内の全てのCGについて繰り返される。
【0010】
相応して、復号器では、次のステップが1つのCGについて行われる:
a)ビットストリームから、CGの符号なし係数値をパースする。
b)ビットストリームから取り出された条件及び/又は情報(例えば、SBHが許可されているかどうかを示すフラグ)に基づいて、符号データ隠蔽が適用されたか否かを判定する。
c)CG内の最初の非ゼロ係数を決定する。
d)CG内の全ての絶対係数値の和のパリティを計算する。
e)パリティが第1の値(偶数又は奇数)を有する場合に、最初の非ゼロ係数の符号を、第1の値に対応する各々の第1の極性(正又は負)にセットする。
【0011】
上記のステップは、単なる例である。パリティは、和に適用されるモジュロ2として計算されてよく、これは、和のバイナリ表現の最下位ビットを取ることに対応する。一般に、全ての係数の和のパリティとは異なる関数が、その結果に、CG内の各々の1つ以上の係数の1つ以上の符号を埋め込むために適用されてもよいことが知られる。例えば、2つの符号を隠すために、全ての係数の絶対値の和に適用されるモジュロ4演算が適用されてよい。モジュロ4演算の夫々の可能な結果(4つの可能な結果0、1、2、3がある)は、第1及び第2の符号の1つの組み合わせ(例えば、++、+-、-+、--)を割り当てられる。
【0012】
上記の符号器側のステップd)は、CGの係数の関数への1つ以上の符号の埋め込みを定義する。一般に、係数の変更が、埋め込まれるべき符号にパリティを一致させるために必要である場合に、そのような変更されたCGから再構成される画像信号には、いくらかの歪みが現れる可能性がある。従って、それは、値を変更されるべき係数が、歪みを最小限にすること又はレート歪み関数を最適化することに基づいて選択される場合に、有益である。同じことは、1よりも多い符号が符号化される場合に当てはまる。そのような場合に、1つ以上の係数値は、符号を埋め込むために変更されてよい。
【0013】
本開示は、CGに基づくマルチ符号ビット隠蔽に適用可能であるが、同様に、TUを更にCGに分割せずに、直接にTUに適用されてもよい。
【0014】
上述されたように、CGは、変換領域における変換係数を同じサイズ(図1に示されるような4×4の係数)のグループに空間的に分けることによって、得られる。言い換えれば、CGへのTUの分割は、空間充填曲線により変換係数を走査すること(所定の走査順序)によって変換係数をシリアライズすることに先んずる。
【0015】
TUをグループに分ける代替方法は、最初に係数を走査し、次いで、シリアライズされた係数をグループに分割することであり、グループは、それら2つの定義を区別するために、ここでは係数チャンク(CC)と呼ばれる。この分離メカニズムは図2に示されている。
【0016】
特に、図2は、係数の8×8ブロック(TU)を示す。それらは、それらを所定の順序で、例えば、この場合には、ジグザグ走査順序で走査することによって、シリアライズされる。走査後、係数は、図2の下に示されるように、シーケンスにおいて与えられる。次いで、シーケンスは、係数のチャンクCC#0、CC#1、・・・、最後のCCに分けられる。
【0017】
チャンクは、先にCGについて示されたのと同様に処理されてよい。各チャンクについて、SBHがそのCCについて適用されるべきか否かを判定するために、1つ以上の条件が評価される。SBHが適用されるべきである場合には、最初の非ゼロの係数の符号をCC内の複数又は全ての係数の関数に埋め込む。
【0018】
H.265/HEVC標準のリファレンス実装であって、QT(Quad-Tree)に基づくパーティショニングがインター予測ブロックのための非対称パーティショニングと組み合わせて使用されているHM(HEVC Reference Model)フレームワークと対照的に、4分木及び2分木の両方に基づきQTBTとして知られている新しいパーティショニング技術が、JEM-3.0ソフトウェアのために提案された。QTBT(Quad-Tree Binary Tree)パーティショニングは、正方形だけでなく長方形のブロックも提供することができる。当然、符号器側でのいくらかのシグナリングオーバーヘッド及び増大した計算複雑性は、HEVC/H.265標準で使用される従来の4分木に基づいたパーティショニングと比較して、QTBTパーティショニングの代償である。それでもなお、QTBTに基づいたパーティショニングは、より良いセグメンテーション特性を備えており、従って、従来の4分木パーティショニングよりも著しく高いコーディング効率を示す(非特許文献5)。とにかく、パーティショニングメカニズムのこれらの変更は、残差コーディング全般及び特にSBHに影響を与える可能性がある。
【0019】
「残差符号予測(RSP)」として知られており、もともと非特許文献3で提案されている他の関連技術は、隣接ブロック内のピクセルからブロックの符号を推定し、CABAC(Context-Adaptive Binary Arithmetic Coding)によって、推定された符号と実際の符号との間の差(0:同じ、1:同じでない)を符号化する。符号が適切に推定される場合に、差は‘0’である傾向があり、コーディング効率はCABACによって改善され得る。概念は図3で説明される。
【0020】
一般に、現在のブロックの境界及び隣接ブロックの境界にあるピクセルの間には高い相関がある。提案されている技術は、この特性を用いて、現在のブロックのDCT(Discrete Cosine Transform)係数の符号を予測する。
【0021】
現在のブロックにN個の非ゼロ係数がある場合に、それらの符号の可能な組み合わせの数は2である。提案されている技術は、符号の各組み合わせを用いて、現在のブロックの上境界及び左境界にある再構成されたピクセルを、隣接ブロックから外挿されたピクセルと比較する。二乗誤差を最小限にする符号の組み合わせが、推定された符号として定義される。より具体的には、技術は、変換係数の組(例えば、係数グループ)の中の全ての非ゼロ(すなわち、有意味な)係数に適用されるわけではなく、本開示を通じて「リスト」とも呼ばれる変換係数のサブセットにだけ適用されてよい。例えば、続く図4で示されるように、リストは、降順でソートされる場合に、大きさにおいて(総数N個のうちの)最初のM個の係数から形成されてよい。リストを準備するためのこのような規則は、符号が推定される係数が大きさ(絶対値)において大きければ大きいほど、適用される推定方法がより良い結果をもたらす傾向があるという事実を反映する。
【0022】
当業者に理解されるように、このようにして推定された符号は、必ずしも正確ではない。すなわち、図4に示されるように、実際の(元の)符号と推定された符号との間には違いがある場合がある。図4では、リスト内のM=6個の符号のうちの1つ(4番目)が、誤って推定されている(1ではなく-1)。その理由は、外挿によって得られるピクセル値が一般的に不完全であり、よって、正確なもの以外の符号の他の組み合わせが最小二乗誤差をもたらす可能性があるからである。
【0023】
図4は、従来のH.264/AVC符号コーディングと非特許文献3で提案されている方法との比較を示す。
【0024】
非特許文献3からの技術のステップが図4に示されており、表2に与えられる。
【表2】
【0025】
同様の技術は、非特許文献4で記載されている。非特許文献4は、前の計算の結果を再利用することによって仮説的コストの冗長計算を除くことを提案する「Hypothesis Border Reconstructions」の章を含むことが知られる。なお、高速符号推定の方法は、非特許文献3で既に開示されている。
【0026】
非特許文献4及び非特許文献3で開示されている技術の間の違いの1つは、符号推定が、非特許文献3では、L2ノルム(sum of squared differences,SSD)を用いて行われ、一方、非特許文献4はL1ノルム(sum of absolute differences)を使用する点にある。
【0027】
コスト値を導出するために使用されるピクセルは、隣接ブロックから選択される(図5を参照)。
【0028】
空間領域において、コスト関数は:
【数1】
として定義される(非特許文献4)。ここで、N及びMは、ブロックの高さ及び幅である。
【0029】
米国特許出願公開第2017/01424444(A1)号には、符号推定に関する更なる詳細が含まれている。
【0030】
更に、米国特許出願公開第2017/01424444(A1)号では、予測された符号を符号化する異なる方法が提案されている(表2のステップ3)。非特許文献4とともに提案されているリファレンスソフトウェアでは、この改良は、予測された符号の2つのリストの導入によって実施される(表2のステップ1の改良)。これら2つのリストに属する予測された符号は、異なるCABACコンテキストにより符号化される。次の規則が、それらのリストにポピュレートするために規定される:
・第1のリストは、予め定義された閾値Tよりも大きい大きさを有する係数の符号をポピュレートされる。第1のリスト内の符号の総数は、予め定義された値Mによって制限される。
・第1のリスト内の符号の数nがMに満たない場合に、第2のリストはポピュレートされている。第2のリスト内の符号の総数は(M-n)によって制限され、それにより、両方のリスト内の符号の総数はMを超えない。第2のリストにポピュレートする係数は、ラスタ順序においてそれらの位置によってソートされ、大きさはTよりも大きいべきではない。
【0031】
符号を符号化するコンテキストは、それが第1又は第2のリストに属するかどうかに関して決定される(表2のステップ3の違い)。
【0032】
RSP及びSBHは両方とも、EP(equally probable)モードにおいて従来どおりエントロピー符号化される変換係数符号によって引き起こされるレートを低減することを目指した2つの技術である。すなわち、各バイナリ状態(プラス/マイナス)の可能性は、50%に近いと考えられる。その結果、各ビンは、出力ビットストリームにおいて1ビットを必要とする。RSP及びSBHは、符号ビットをスクイーズするための異なるメカニズムを利用するが、RSP及びSBHを残りの符号に適用する厳密な順序を定義することによってそれら2つの技術を和合することが必要である。非特許文献4で提案されている、SBH及びRSPを和合するメカニズムは、図6に示される。その技術では、RSPは、RSPリストとして、図6に表されている2つのリストを使用する:
・HPリストは、閾値よりも大きさが大きい量子化された変換係数の位置を含むリストであり、従って、それらの符号は、上側確率により正確に予測され得る;
・LPリストは、閾値よりも低い大きさを有するような量子化された変換係数の位置を含むリストであり、従って、それらの符号は、下側確率により正確に予測され得る。
【0033】
図6から分かるように、SBHは、RSPの前に行われる。これは、閾値よりも大きさが大きい量子化された変換係数の符号をSBHが隠し、従って、それらの符号が上側確率により正確に予測される場合に、RSPのコーディング効率に悪影響を及ぼす可能性がある。故に、SBH(SDH又はMSBH)及びRSP技術を和合する既知のメカニズムの主な問題は、それらが、HPリストからの量子化された変換係数をSBHのために選択すること又は変更することによって、正確な符号予測の可能性を低めることがある点である。よって、それは、RSP技術のコーディング効率を下げる。
【0034】
本発明は、コーディング効率に対する上記の悪影響を回避し、それによって圧縮性能を改善しながら、SBH及びRSPを和合する改善された概念を提供することを目的とする。
【発明の概要】
【0035】
本発明の実施形態は、独立請求項の特徴によって定義され、実施形態の更なる有利な実施は、従属請求項の特徴によって定義される。
【0036】
本発明の第1の態様に従って、信号の変換係数の組の符号を符号化する装置が提供される。装置は、変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、第1の所定の規則に従って決定し、変換係数の組の中から、リストに含まれていない更なる変換係数を、第2の所定の規則に従って選択するよう構成される処理回路を有する。処理回路は、変換係数の組の中の変換係数値の所定の関数の結果において更なる変換係数の符号を埋め込み、リスト内の変換係数の符号を推定するための推定プロシージャを実行するよう更に構成される。更には、処理回路は、第1の複数の変換係数の夫々について、変換係数の符号が前記変換係数の推定された符号と一致するか否かを示すバイナリ値を決定し、エントロピー符号化技術を用いて、第1の複数の変換係数について得られたバイナリ値のシーケンスを符号化するよう構成される。
【0037】
本発明の第2の態様に従って、信号の変換係数の組の符号を復号する装置が提供される。装置は、第1の複数のバイナリ値のエントロピー符号化されたシーケンスを復号するよう構成される処理回路を有する。処理回路は、変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、第1の所定の規則に従って決定し、変換係数の組の中から、リストに含まれていない更なる変換係数を、第2の所定の規則に従って選択するよう更に構成される。更には、処理回路は、変換係数の組の中の変換係数値の所定の関数を計算することによって、更なる変換係数の符号を決定し、リスト内の変換係数の符号を推定するための推定プロシージャを実行し、第1の複数の変換係数の符号を得るように、第1の複数のバイナリ値の復号されたシーケンスによって、推定された符号を補正するよう構成される。
【0038】
本発明の第3の態様に従って、信号の変換係数の組の符号を符号化する方法が提供される。方法は、変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、第1の所定の規則に従って決定するステップと、変換係数の組の中から、リストに含まれていない更なる変換係数を、第2の所定の規則に従って選択するステップと、変換係数の組の中の変換係数値の所定の関数の結果において更なる変換係数の符号を埋め込むステップと、リスト内の変換係数の符号を推定するための推定プロシージャを実行するステップと、第1の複数の変換係数の夫々について、変換係数の符号が前記変換係数の推定された符号と一致するか否かを示すバイナリ値を決定するステップと、エントロピー符号化技術を用いて、第1の複数の変換係数について得られたバイナリ値のシーケンスを符号化するステップとを有する。
【0039】
本発明の第4の態様に従って、信号の変換係数の組の符号を復号する方法が提供される。方法は、第1の複数のバイナリ値のエントロピー符号化されたシーケンスを復号するステップと、変換係数の組の中の第1の複数の変換係数を含む変換係数のリストを、第1の所定の規則に従って決定するステップと、変換係数の組の中から、リストに含まれていない更なる変換係数を、第2の所定の規則に従って選択するステップと、変換係数の組の中の変換係数値の所定の関数を計算することによって、更なる変換係数の符号を決定するステップと、リスト内の変換係数の符号を推定するための推定プロシージャを実行するステップと、第1の複数の変換係数の符号を得るように、第1の複数のバイナリ値の復号されたシーケンスによって、推定された符号を補正するステップとを有する。
【0040】
本開示に従って、信号は、特に、例えば、ビデオ信号又は画像信号を意味する。信号は、オーディオ信号も含んでよい。処理回路は、ソフトウェア及び/又はハードウェアの如何なる組み合わせによっても実施され得る。変換係数の組は、特に、係数グループ又は係数チャンクである。
【0041】
RSPプロシージャを2つのサブプロシージャ、すなわち、第1サブプロシージャにおける1つ以上のRSPリストの準備、及び第2サブプロシージャにおいてRSP技術に関連した他の動作を行うこと、に分けることは、本発明の特有のアプローチである。SBHは、それらのサブプロシージャの間で行われる。それによって、SBHを適用するための係数は、例えば、デフォルトで係数グループ(CG)又は係数チャンク(CC)の最初の有意味な量子化された変換係数をとるのではなく、1つ以上のRSPリストに含まれないように慎重に選択され得る。
【0042】
実施形態に従って、推定プロシージャは、ピクセル領域(空間領域)で行われる。推定プロシージャは、第1の複数の変換係数の符号の各仮説的組み合わせについて、空間領域において変換係数の組に対応する画像のブロックの境界ピクセルを再構成することと、仮説的組み合わせの夫々について、再構成されたピクセルと隣接ブロックのピクセルとの間のブロック境界にわたるピクセル値の平滑度を示す所定の空間領域関数を評価することと、所定の空間領域関数が最大の平滑度を示す仮説的組み合わせを変換係数の推定された符号として選択することとを含む。所定の空間領域関数(コスト関数)は、特に、現在のブロック及び隣接ブロックの境界に沿って隣接するピクセルのピクセル値間の絶対差の和を使用する関数、例えば、上記の式(1)で定義された関数である。代替的に、ピクセル値の平滑度を示す他の関数、例えば、sum of differencesの代わりにsum of squared differencesを使用する関数、が同様に可能である。
【0043】
代替の実施形態に従って、推定プロシージャは、変換領域(周波数領域)で行われる。推定プロシージャは、変換係数の組に対応する現在の画像ブロックに隣接する隣接ピクセルと、画像ブロックの予測信号に基づき計算される隣接ピクセルの予測との間の変換された差を含むコスト関数に基づいて、符号を推定することを含む。
【0044】
具体的に、コスト関数は、変換された画像ブロックに隣接する隣接ピクセルと、画像ブロックの予測信号に基づいて計算された隣接ピクセルの予測との間の二乗変換された差の和を含む。そのようなコスト関数の例は、以下で与えられる(式(2))。
【0045】
実施形態に従って、第2の所定の規則は、リストに属さない最低周波数の非ゼロの変換係数を更なる変換係数として選択する、と定義する。
【0046】
実施形態に従って、処理回路は、組の中の第2の複数の変換係数の符号を、所定のエントロピー符号化プロシージャによって符号化するよう更に構成され、第2の複数の変換係数は、リストに含まれる第1の複数に属さず、かつ、選択された更なる変換係数とは異なる残り全ての非ゼロの変換係数を含む。
【0047】
実施形態に従って、リストは、2つのサブリストを含む。サブリストは、第1サブリストが、閾値よりも大きい絶対値を有する変換係数を含み、第2サブリストが、閾値以下の絶対値を有する変換係数を含むように、閾値によって互いから分けられる。
【0048】
更に、2つのサブリストの変換係数について決定される推定された符号との一致を示すバイナリ値のシーケンスは、夫々、エントロピー符号化の異なるコンテンツにより符号化される。背景技術の項で述べられたように、第1のサブリスト(HPリスト)内の上側に大きい(閾値を上回る)変換係数は、第2のサブリスト(LPリスト)内の閾値を下回る大きさを有する係数よりも、推定プロシージャによる符号の正確な予測のより高い確率を有している。これは、異なる符号コンテキストによって考慮される。
【0049】
実施形態に従って、所定の関数の結果は、第1の符号値が第1の結果値に対応し、第2の符号値が第2の結果値に対応するように、2つの異なる値を仮定してよい。その場合に、更なる変換係数の符号を埋め込むことは、変換係数の所定の関数が、更なる変換係数の符号に対応する結果値を有するかどうかを判定することを含む。符号化装置の処理回路は、従って、所定の関数が変更前に更なる変換係数の符号に対応する結果を有さない場合に、変更後の変換係数の所定の関数が更なる変換係数の符号に対応する結果を有するように、変換係数の中の1つの値を変更するよう更に構成される。
【0050】
更に、変換係数の1つが変更され、変更は、レート歪みコスト関数を最小限にするように行われる。例えば、所定の関数の結果が、組の中の変換係数の量子化後の絶対係数値の和のパリティである場合に、和に含まれる係数の中の任意の1つを+1だけ又は-1だけ変更することによって所望の結果を達成すれば十分である。従って、レート歪みコスト関数を考えることによって、最適な選択がなされ得る。
【0051】
代替的に、又は更には、変更推定関数が考慮され得る。これは、係数変更によって導入される歪みが最低限である場合に、あるいは、代替的に、係数の量子化レベルが最も高い場合に、最小限にされる。
【0052】
また、実施形態に従って、リストは、サブリストを含み、処理回路は、サブリストにわたる第1の複数の変換係数の分布に変化をもたらすことになる変更を許さないように、変換係数の値の変更に対して制約を課すよう更に構成される。すなわち、本発明に従って、リストに含まれる係数(より具体的には、係数グループ又はチャンク内のそれらの位置)は、符号の埋め込み(SBH)を実行する前に選択されるので、サブリスト内の係数(の位置)は、復号器側で適切に復号されるように、変更されるべきではない。
【0053】
より具体的には、絶対値の閾値によって互いから分けられる2つのサブリストがある場合に、制約は、変更をされた値が変更をされていない値とは別のサブリストに属するように変更により閾値をまたぐことになる場合に変換係数の値の変更を許さないために、定義されてよい。
【0054】
実施形態に従って、変換係数は、量子化された変換係数である。
【0055】
実施形態に従って、第1の所定の規則は、所定の数M個の変換係数の順序付きリストとして変換係数のリストを定義する。より具体的には、第1の所定の規則は、変換係数のリストにおいて、降順で、変換係数の組の中で最大の絶対値を有するM個の変換係数を含む、と更に定義する。
【0056】
実施形態に従って、所定の関数は、2を法とする量子化後の絶対変換係数値の和、すなわち、量子化後の絶対変換係数値の和のパリティである。
【0057】
代替的に、所定の関数の値において複数の変換係数の符号を隠すことも可能である。より具体的には、符号係数について上述されたのと同じように、N個の係数の符号は、N個の係数にわたって符号プラス及びマイナスを分布させる2個の異なる可能性に対応する2個の異なる値を考えることができる所定の関数によって、隠され得る。
【0058】
具体的に、実施形態に従って、処理回路は、変換係数の組の中から、リストに含まれない複数N個の更なる変換係数を、第2の所定の規則に従って選択し、変換係数の組の中の変換係数値の所定の関数の結果において更なる変換係数の符号を埋め込むよう構成される。より具体的には、所定の関数は、2を法として量子化後の絶対変換係数値の和であってよい。
【0059】
複数の変換係数の符号の埋め込み(隠すこと)を用いる実施形態において、符号の正確な組み合わせに対応する所望の関数値を得るために変更が必要である場合に、単一の係数のみ+1又は-1だけ変えることでは不十分であることがある。むしろ、単一の係数を±(2-1)の最大値までの量だけ変えるか、あるいは、代替的に、最大2-1個の係数を±1だけ変えるか、のどちらか(あるいは、それらの可能性の組み合わせ)が必要であり得る。従って、複数のRSPサブリストの場合に変更に適用される制約は、複数の係数にSBHを適用する場合に必要な変更を加えて適用されるべきである。
【0060】
実施形態に従って、処理回路は、変換ユニットの変換係数を変換係数の複数の組に分割し、変換係数の複数の組の夫々について、本発明の第1の態様又は第2の態様に従う処理を実行するよう構成される。
【0061】
より具体的には、実施形態に従って、変換ユニットは、画像信号を変換することによって得られる変換係数の2次元ブロックであり、処理回路は、変換ユニットを、変換係数の複数の組として複数の2次元ブロックに分割するよう構成される。非限定的な例として、変換ユニットは、例えば、16×16又は8×8ブロックであってよい。その場合に、変換係数の組は、例えば、8×8又は4×4ブロックであってよい。
【0062】
代替の実施形態に従って、変換ユニットは、画像信号を変換することによって得られる変換係数の2次元ブロックであり、処理回路は、予め定義された順序に従って変換ユニットの変換係数を走査し、走査された変換係数を変換係数の複数の組として複数の1次元チャンクに分割するよう構成される。
【0063】
実施形態に従って、本発明の第2の態様に従う復号されたバイナリ値は、リストの中の各変換係数について、変換係数の符号が変換係数の推定された符号と一致するか否かを示す。言い換えれば、バイナリ値は、推定プロシージャに従う係数の推定された符号と正確な符号との間の差を示す。推定は、特に、リストに含まれる上側に大きい変換係数について、ほとんどエラーがないと期待されるので、バイナリ値のシーケンスは、値“1”(不正確に推定された符号)よりもずっと頻繁に値“0”(差なし、すなわち、推定は正確であった)を有する。バイナリ値のシーケンスは、従って、上述されたように、EP(equal probability)を有する符号値自体よりも、エントロピー符号化(特に、CABAC符号化)によって効率的に符号化され得る。
【0064】
実施形態に従って、所定の関数の計算の結果は、2つの異なる値を仮定してよく、更なる変換係数の符号は、結果が第1の値である場合には第1の符号値であり、結果が第2の値である場合には第2の符号値であるとの規則に従って決定される。例えば、2つの異なる値は、計算結果のパリティ(偶数又は奇数)に対応してよい。
【0065】
1つ以上の実施形態の詳細が、添付の図面及び以下の説明において示される。他の特徴、目的、及び利点は、本明細書、図面、及び特許請求の範囲から明らかだろう。
【0066】
本発明の以下の実施形態では、添付の図面を参照して更に詳細に記載される。
【図面の簡単な説明】
【0067】
図1】JCT-VCによってHEVC/H.265標準に採用されるマルチ符号ビット隠蔽を示す図である。
図2】CCへのTUの分離を説明する図である。
図3】ピクセル領域でのコスト関数による符号推定の先行技術プロシージャの概要を与える。
図4図3の技術と従来の符号コーディングとの比較を説明する。
図5】既知の技術に従ってコスト値を導出するために使用されるピクセルの例を表す。
図6】RSP及びSBHの和合の先行技術プロシージャを説明する。
図7】本発明の実施形態を実装するよう構成されるビデオコーディングシステムの例を示すブロック図である。
図8】ビデオ符号器の例を示すブロック図である。
図9】ビデオ復号器の構造例を示すブロック図である。
図10】本発明の実施形態に従って符号予測及び隠蔽プロセスが和合された符号器及び復号器のデータフローを表す。
図11】本発明の実施形態に従うSBH及び予測リスト生成の和合の例を与える。
図12】RDの意味で最良の係数変更の決定を説明する。
図13】最良の係数変更を決定するための代替の概念を説明する。
図14】本発明の実施形態に従う代替の周波数領域符号推定概念を説明する。
図15】符号器側での本発明の実施例の概要を与える。
図16】復号器側での本発明の実施例の概要を与える。
【発明を実施するための形態】
【0068】
図面において、同じ参照符号は、同一の、又は少なくとも機能的に同等の特徴を参照する。
【0069】
以下の説明では、添付の図面が参照される。添付の図面は本開示の部分を形成し、本発明の実施形態の具体的な態様、又は本発明の実施形態が使用され得る具体的な態様を例として示す。本発明の実施形態は、他の態様で使用されてもよく、図示されていない構造的又は論理的な変更を有することが理解される。以下の詳細な説明は、従って、限定の意味で取られるべきではなく、本発明の範囲は、添付の特許請求の範囲によって定義される。
【0070】
例えば、記載される方法に関連した開示は、方法を実行するよう構成された対応するデバイス又はシステムにも当てはまり、その逆も同様であることが理解される。例えば、1又は複数の特定の方法ステップが記載される場合に、記載される1又は複数の方法ステップを実行するよう、対応するデバイスは1又は複数のユニット、例えば、機能ユニット(例えば、1又は複数のステップを実行する1つのユニット、あるいは、複数のステップの中の1つ以上を夫々実行する複数のユニット)を、たとえそのような1つ以上のユニットが明示的に記載又は図示されていないとしても、含んでよい。他方で、例えば、特定の装置が1又は複数のユニット、例えば、機能ユニットに基づいて記載される場合に、対応する方法は、1又は複数のユニットの機能を実行する1つのステップ(例えば、1又は複数のユニットの機能を実行する1つのステップ、あるいは、複数のユニットの中の1つ以上の機能を夫々実行する複数のステップ)を、たとえそのような1又は複数のステップが明示的に記載又は図示されていないとしても、含んでよい。更に、ここで記載される様々な例となる実施形態及び/又は態様の特徴は、特段別なふうに述べられない限りは、互いと組み合わされてよいことが理解される。
【0071】
ビデオコーディングは、通常、ビデオ又はビデオシーケンスを形成するピクチャのシーケンスの処理を指す。ピクチャとの語の代わりに、フレーム又は画像との語が、ビデオコーディングの分野では同義語として使用されることがある。ビデオコーディングは、2つの部分、ビデオ符号化及びビデオ復号化を有する。ビデオ符号化は、ソース側で行われ、通常は、(より効率的な記憶及び/又は伝送のために、)ビデオピクチャを表すために必要とされるデータの量を減らすよう原ビデオピクチャを(例えば、圧縮によって)処理することを有する。ビデオ復号化は、あて先側で行われ、通常は、ビデオピクチャを再構成するよう符号器側と比較して逆の処理を有する。ビデオピクチャ(又は、後述されるように、ピクチャ全般)の“コーディング”に言及する実施形態は、ビデオピクチャの“符号化”及び“復号化”の両方に関係があると理解されるべきである。符号化部分及び復号化部分の組み合わせは、CODEC(Coding and DECoding)とも呼ばれる。
【0072】
可逆ビデオコーディングの場合に、原ビデオピクチャは再構成され得る。すなわち、再構成されたビデオピクチャは、(記憶又は伝送中の伝送損失又は他のデータ損失はないとして)原ビデオピクチャと同じ品質を有する。不可逆ビデオコーディングの場合に、例えば、量子化による、更なる圧縮が、ビデオピクチャを表すデータの量を減らすために実行され、ビデオピクチャは、復号器で完全には再構成され得ない。すなわち、再構成されたビデオピクチャの品質は、原ビデオピクチャと比較して低い又は悪い。
【0073】
H.261以降のいくつかのビデオコーディング標準は、“不可逆ハイブリッドビデオコーデック”のグループに属する(すなわち、サンプル領域における空間及び時間予測と、変換領域において量子化を適用する2D変換コーディングとを組み合わせる)。ビデオシーケンスの各ピクチャは、通常は、重なり合わないブロックの組にパーティショニングされ、コーディングは、通常は、ブロックレベルで行われる。言い換えれば、符号器では、ビデオは、通常は、例えば、空間(イントラピクチャ)予測及び時間(インターピクチャ)予測を使用して予測ブロックを生成し、予測ブロックを現在のブロック(現在処理されている/処理されるべきであるブロック)から減じて残差ブロックを取得し、残差ブロックを変換し、変換領域において残差ブロックを量子化して、伝送されるべきデータの量を減らすことによって、ブロック(ビデオブロック)レベルで処理、すなわち、符号化される。一方、復号器では、符号器と比較して逆の処理が、表現のために現在のブロックを再構成するために、符号化又は圧縮されたブロックに適用される。更に、符号器は、復号器処理ループを再現し、それにより、両方ともが、その後のブロックの処理、すなわち、コーディングのために、同じ予測(例えば、イントラ及びインター予測)及び/又は再構成を生成する。
【0074】
ビデオピクチャ処理(動画処理とも呼ばれる)及び静止ピクチャ処理(処理との語はコーディングを含む)は、多くの概念及び技術又はツールを共有するということで、以下で、「ピクチャ」又は「画像」との語及び「ピクチャデータ」又は「画像データ」との同等の語は、必要でない場合には、ビデオピクチャと静止ピクチャとの間の区別及び不必要な繰り返しを回避するよう、ビデオシーケンス(上記を参照)のビデオピクチャ及び/又は静止ピクチャに言及するために使用される。記載が静止ピクチャ(又は静止画)にのみ言及する場合には、「静止ピクチャ」との語が使用されるべきである。
【0075】
以下では、符号器100、復号器200、及びコーディングシステム300の実施形態が、(図10から図16に基づいて更に詳細に本発明の実施形態について記載する前に)図7から図9に基づいて記載される。
【0076】
図7は、コーディングシステム300、例えば、ピクチャコーディングシステム300の実施形態を説明する概念又は概略ブロック図であり、コーディングシステム300は、符号化されたデータ330、例えば、符号化されたピクチャ300を、例えば、符号化されたデータ330を復号するあて先デバイス320へ供給するよう構成されたソースデバイス310を有する。
【0077】
ソースデバイス310は、符号器100又は符号化ユニット100を有し、更には、すなわち、任意に、ピクチャソース312、前処理ユニット314、例えば、ピクチャ前処理ユニット314、及び通信インターフェース又は通信ユニット318を有してもよい。
【0078】
ピクチャソース312は、例えば、現実世界のピクチャを捕捉するあらゆる種類のピクチャ捕捉デバイス、及び/又はあらゆる種類のピクチャ生成デバイス、例えば、コンピュータアニメーション化されたピクチャを生成するコンピュータグラフィクスプロセッサ、あるいは、現実世界のピクチャ、コンピュータアニメーション化されたピクチャ(例えば、画面コンテンツ、仮想現実(VR)ピクチャ)、及び/又はそれらの任意の組み合わせ(例えば、拡張現実(AR)ピクチャ)を取得及び/又は供給するあらゆる種類のデバイスを有しても、又はそのようなデバイスであってもよい。以下で、全てのそのような種類のピクチャ又は画像及びあらゆる他の種類のピクチャ又は画像は、特段別なふうに述べられない限りは、「ピクチャ」、「画像」又は「ピクチャデータ」又は「画像データ」と呼ばれ、一方、「ビデオピクチャ」及び「静止ピクチャ」をカバーする「ピクチャ」又は「画像」との語に関する先の説明は、明示的に別なふうに述べられない限りは、依然として当てはまる。
【0079】
(デジタル)ピクチャは、強度値を有するサンプルの2次元アレイ又はマトリクスであるか、又はそのようなものとしてみなされ得る。アレイ内のサンプルは、ピクセル(ピクチャ要素の略語)又はペルとも呼ばれることがある。アレイ又はピクチャの水平及び垂直方向(又は軸)におけるサンプルの数は、ピクチャのサイズ及び/又は解像度を定義する。色の表現のために、通常は3つの色成分が用いられる。すなわち、ピクチャは、3つのサンプルアレイを含むか、あるいは、表現され得る。RGBフォーマット又は色空間では、ピクチャは、対応する赤、緑及び青のサンプルアレイを有する。しかし、ビデオコーディングでは、各ピクセルは、通常、ルミナンス/クロミナンスフォーマット又は色空間、例えば、Y(時々Lも代わりに使用される)によって示されるルミナンス成分と、Cb及びCrによって示される2つのクロミナンス成分とを有するYCbCrで表される。ルミナンス(又は略してルーマ)成分Yは、輝度又はグレーレベル強度(例えば、グレースケールピクチャと同様)を表し、一方、2つのクロミナンス(又は略してクロマ)成分Cb及びCrは、色度又は色情報成分を表す。従って、YCbCrフォーマットにおけるピクチャは、ルミナンスサンプル値(Y)のルミナンスサンプルアレイと、クロミナンス値(Cb及びCr)の2つのクロミナンスサンプルアレイとを有する。RGBフォーマットにおけるピクチャは、YCbCrフォーマットに変換又は変形されてよく、その逆も同様であり、プロセスは、色変更又は変換としても知られる。ピクチャがモノクロである場合には、ピクチャは、ルミナンスサンプルアレイしか有さなくてよい。
【0080】
ピクチャソース312は、例えば、ピクチャを捕捉するカメラ、前に捕捉又は生成されたピクチャを有するか又は記憶しているメモリ、例えば、ピクチャメモリ、及び/又はピクチャを取得又は受信するあらゆる種類のインターフェース(内部若しくは外部)であってよい。カメラは、例えば、ソースデバイスに組み込まれたローカル又は内蔵のカメラであってよく、メモリは、ローカル又は内蔵のメモリであって、例えば、ソースデバイスに組み込まれてよい。インターフェースは、例えば、外部のビデオソース、例えば、カメラのような外部のピクチャ捕捉デバイス、外部メモリ、又は外部のピクチャ生成デバイス、例えば、外部のコンピュータグラフィクスプロセッサ、コンピュータ若しくはサーバからピクチャを受け取る外部インターフェースであってよい。インターフェースは、あらゆる専用の又は標準化されたインターフェースプロトコルに従うあらゆる種類のインターフェース、例えば、有線若しくは無線インターフェースや、光インターフェースであることができる。ピクチャデータ313を取得するインターフェースは、通信インターフェース318と同じインターフェースであっても、あるいは、その部分であってもよい。
【0081】
各デバイス内のユニット間のインターフェースは、ケーブル接続、USBインターフェースを含み、ソースデバイス310とあて先デバイス320との間の通信インターフェース318及び322は、ケーブル接続、USBインターフェース、無線インターフェースを含む。
【0082】
前処理ユニット314及び前処理ユニット314によって実行される処理と区別して、ピクチャ又はピクチャデータ313は、ローピクチャ又はローピクチャデータ313とも呼ばれることがある。
【0083】
前処理ユニット314は、(ロー)ピクチャデータ313を受け取り、ピクチャデータ313に対して前処理を実行して、前処理されたピクチャ315又は前処理されたピクチャデータ315を取得するよう構成される。前処理ユニット314によって実行される前処理は、例えば、トリミング、色フォーマット変換(例えば、RGBからYCbCr)、色補正、又はノイズ除去を有してよい。
【0084】
符号器100は、前処理されたピクチャデータ315を受け取り、符号化されたピクチャデータ171を供給するよう構成される(更なる詳細は、例えば、図8に基づいて、記載される)。
【0085】
ソースデバイス310の通信インターフェース318は、符号化されたピクチャデータ171を受け取り、それを他のデバイス、例えば、あて先デバイス320又はあらゆる他のデバイスへ、記憶又は直接再構成のために、直接送るよう、あるいは、符号化されたデータ330を記憶すること及び/又は符号化されたデータ330を他のデバイス、例えば、あて先デバイス320若しくはあらゆる他のデバイスへ復号化若しくは記憶のために送信することの前に、符号化されたピクチャデータ171を処理するよう構成されてよい。
【0086】
あて先デバイス320は、復号器200又は復号化ユニット200を有し、更には、すなわち、任意に、通信インターフェース又は通信ユニット322、後処理ユニット326、及び表示デバイス328を有してもよい。
【0087】
あて先デバイス320の通信インターフェース322は、符号化されたピクチャデータ171又は符号化されたデータ330を、ソースデバイス310から直接に、又はあらゆる他のソース、例えば、メモリ、例えば、符号化ピクチャデータメモリから受け取るよう構成される。
【0088】
通信インターフェース318及び通信インターフェース322は、ソースデバイス310とあて先デバイス320との間の直接通信リンク、例えば、光接続を含む直接の有線又は無線接続を介して、あるいは、あらゆる種類のネットワーク、例えば、有線若しくは無線ネットワーク又はそれらの任意の組み合わせ、又はあらゆる種類のプライベート及びパブリックネットワーク、又はあらゆる種類のそれらの組み合わせを介して、符号化されたピクチャデータ171又は符号化されたデータ330を伝送するよう夫々構成されてよい。
【0089】
通信インターフェース318は、例えば、通信リンク又は通信ネットワークを介して伝送のために、符号化されたピクチャデータ171を適切なフォーマット、例えば、パケットにパッケージ化するよう構成されてよく、データ損失保護を更に有してもよい。
【0090】
通信インターフェース318の相対物を形成する通信インターフェース322は、例えば、符号化されたピクチャデータ171を取得するよう、符号化されたデータ330のパッケージ化を解除するよう構成されてよく、更には、データ損失保護及び例えばエラー隠蔽を含むデータ損失回復を実行するよう構成されてもよい。
【0091】
通信インターフェース318及び通信インターフェース322は両方とも、ソースデバイス310からあて先デバイス320へ向かう図7中の符号化されたピクチャデータ330のための矢印によって示されるような一方向の通信インターフェース、又は双方向の通信インターフェースとして構成されてよく、例えば、メッセージを送信及び受信して、例えば、接続をセットアップし、ピクチャデータを含む失われた若しくは破壊されたデータを承認及び/又は再送し、通信リンク及び/又はデータ伝送、例えば、符号化ピクチャデータ伝送に関するあらゆる他の情報を交換するよう構成されてよい。
【0092】
復号器200は、符号化されたピクチャデータ171を受け取り、復号されたデータ231又は復号されたピクチャ231を供給するよう構成される(更なる詳細は、例えば、図9に基づいて、記載される)。
【0093】
あて先デバイス320のポストプロセッサ326は、復号されたピクチャデータ231、例えば、復号されたピクチャ231を後処理して、後処理されたピクチャデータ327、例えば、後処理されたピクチャ327を取得するよう構成される。後処理ユニット326によって実行される後処理は、例えば、色フォーマット変換(例えば、YCbCrからRGB)、色補正、トリミング、若しくは再サンプリング、又は例えば、復号されたピクチャ231を、例えば、表示デバイス328による表示のために、準備するためのあらゆる他の処理を有してよい。
【0094】
あて先デバイス320の表示デバイス328は、ピクチャを、例えば、ユーザ又はビューアーに、表示するために、後処理されたピクチャデータ327を受け取るよう構成される。表示デバイス328は、再構成されたピクチャを表現するあらゆる種類のディスプレイ、例えば、内蔵された又は外付けのディスプレイ又はモニタであっても、あるいは、それを有してもよい。ディスプレイは、例えば、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、又はあらゆる種類の他のディスプレイ、例えば、プロジェクタ、ホログラフィックディスプレイ、ホログラムを生成する装置などを有してよい。
【0095】
図7は、ソースデバイス310及びあて先デバイス320を別々のデバイスとして表すが、デバイスの実施形態は、両方を、あるいは、両方の機能、ソースデバイス310又は対応する機能とあて先デバイス320又は対応する機能とを有してもよい。そのような実施形態では、ソースデバイス310又は対応する機能及びあて先デバイス320又は対応する機能は、同じハードウェア及び/又はソフトウェアを用いて、あるいは、別個のハードウェア及び/又はソフトウェア、又はそれらの任意の組み合わせによって、実施されてよい。
【0096】
記載に基づき当業者に明らかなように、図7に示されるソースデバイス310及び/又はあて先デバイス320内の異なる機能又は異なるユニットの機能の存在及び(正確な)分割は、実際のデバイス及び用途に応じて様々であり得る。
【0097】
以下で、コーディングシステム300、ソースデバイス310、及び/又はあて先デバイス320の2、3の非限定的な例が与えられる。
【0098】
スマートフォン、タブレット又はディスプレイ付き手持ちカメラなどの様々な電子製品が、コーディングシステム300の例としてみなされ得る。それらは、表示デバイス328を含み、それらの大部分は、内蔵のカメラ、すなわち、ピクチャソース312も含む。内蔵のカメラによって撮られたピクチャデータは処理及び表示される。処理は、内部でピクチャデータを符号化及び復号することを含んでよい。その上、符号化されたピクチャデータは、内蔵のメモリに記憶されてよい。
【0099】
代替的に、そのような電子製品は、インターネット又は外部カメラなどの外部ソースからピクチャデータを受け取るために、あるいは、符号化されたピクチャデータを外部ディスプレイ又は記憶ユニットへ送るために、有線又は無線インターフェースを有してもよい。
【0100】
他方で、セットトップボックスは、内蔵カメラ又はディスプレイを有さないが、外部表示デバイスでの表示のために、受け取られたピクチャデータのピクチャ処理を実行する。そのようなセットトップボックスは、例えば、チップセットによって具現されてよい。
【0101】
代替的に、セットトップボックスに類似したデバイスは、内蔵ディスプレイを備えたTVセットなどの表示デバイスに含まれてもよい。
【0102】
内蔵ディスプレイを有さない監視カメラは、更なる例を構成する。それらは、外部表示デバイス又は外部記憶デバイスへの捕捉及び符号化されたピクチャデータの伝送のためのインターフェースを備えたソースデバイスに相当する。
【0103】
対照的に、例えば、AR又はVRに使用されるスマートグラス又は3Dグラスなどのデバイスは、あて先デバイス320に相当する。それらは、符号化されたピクチャデータを受け取り、それらを表示する。
【0104】
従って、図7に示されるソースデバイス310及びあて先デバイス320は、本発明の実施形態の単なる例であり、本発明の実施形態は、図7に示されるものに制限されない。
【0105】
ソースデバイス310及びあて先デバイス320は、あらゆる種類の手持ち式又は固定式デバイス、例えば、ノートブック又はラップトップコンピュータ、携帯電話機、スマートフォン、タブレット又はタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビ受像機、表示デバイス、デジタルメディアプレーヤー、ビデオゲーム機、ビデオストリーミングデバイス、ブロードキャストレシーバデバイス、などを含む広範なデバイスの中のいずれかを有してよい。大規模の専門的な符号化及び復号化のために、ソースデバイス310及び/又はあて先デバイス320は、大きなネットワークに含まれ得るサーバ及びワークステーションを更に有してよい。これらのデバイスは、あらゆる種類のオペレーティングシステムを使用してよく、あるいは、使用しなくてもよい。
【0106】
[符号器及び符号化方法]
図8は、符号器100、例えば、ピクチャ符号器100の実施形態の概略/概念ブロック図を示す。符号器100は、入力部102、残差計算ユニット104、変換ユニット106、量子化ユニット108、逆量子化ユニット110、及び逆変換ユニット112と、再構成ユニット114と、バッファ116と、ループフィルタ120と、復号ピクチャバッファ(DPB)130と、インター推定ユニット142、インター予測ユニット144、イントラ推定ユニット152、イントラ予測ユニット154、及びモード選択ユニット162を含む予測ユニット160と、エントロピー符号化ユニット170と、出力部172とを有する。図8に示されるビデオ符号器100は、ハイブリッドビデオコーデックに従うビデオ符号器又はハイブリッドビデオ符号器とも呼ばれ得る。各ユニットは、非一時的なメモリに記憶されているコードをプロセッサによって実行することによってその処理ステップを実行するために、プロセッサ及び非一時的なメモリから成ってよい。
【0107】
例えば、残差計算ユニット104、変換ユニット106、量子化ユニット108及びエントロピー符号化ユニット170は、符号器100の順方向の信号パスを形成し、一方、例えば、逆量子化ユニット110、逆変換ユニット112、再構成ユニット114、バッファ116、ループフィルタ120、復号ピクチャバッファ(DPB)130、インター予測ユニット144、及びイントラ予測ユニット154は、符号器の後ろ向きの信号パスを形成し、符号器の後ろ向きの信号パスは、同じ再構成及び予測のための逆処理を提供する復号器の信号パス(図9の復号器200を参照)に対応する。
【0108】
符号器は、例えば、入力部102によって、ピクチャ101又はピクチャ101のピクチャブロック103、例えば、ビデオ又はビデオシーケンスを形成するピクチャのシーケンスの中のピクチャを受け取るよう構成される。ピクチャブロック103は、現在のピクチャブロック又はコーディングされるべきピクチャブロックとも呼ばれることがあり、ピクチャ101は、現在のピクチャ又はコーディングされるべきピクチャと呼ばれることがある(特に、ビデオコーディングでは、現在のピクチャを他のピクチャ、例えば、同じビデオシーケンス、すなわち、現在のピクチャも含むビデオシーケンスの前に符号化及び/又は復号されたピクチャと区別するため)。
【0109】
符号器100の実施形態は、ピクチャ101を複数のブロック、例えば、ブロック103のようなブロックに、通常は、複数の重なり合わないブロックに分割するよう構成された、例えばピクチャパーティショニングユニットとも呼ばれ得るパーティショニングユニット(図8に図示せず)を有してよい。パーティショニングユニットは、ビデオシーケンスの全てのピクチャのための同じブロックサイズと、ブロックサイズを定義する対応するグリッドとを使用するよう、あるいは、ピクチャ又はピクチャのサブセット若しくはグループの間でブロックサイズを変え、各ピクチャを対応するブロックに分割するよう、構成されてよい。
【0110】
複数のブロックの中の各ブロックは、正方形寸法、又はより一般的な長方形寸法を有してよい。非長方形形状のピクチャエリアであるブロックは現れ得ない。
【0111】
ピクチャ101のように、ブロック103はやはり、ピクチャ101よりも寸法が小さいが、強度値(サンプル値)を有するサンプルの2次元のアレイ又はマトリクスであるか、あるいは、そのようなものとしてみなされ得る。言い換えれば、ブロック103は、適用される色フォーマットに応じて、例えば、1つのサンプルアレイ(例えば、モノクロピクチャ101の場合にルーマアレイ)、又は3つのサンプルアレイ(例えば、カラーピクチャ101の場合にルーマ及び2つのクロマアレイ)、又はあらゆる他の数及び/又は種類のアレイを有してよい。ブロック103の水平及び垂直方向(又は軸)におけるサンプルの数は、ブロック103のサイズを定義する。
【0112】
図8に示される符号器100は、ブロックごとにピクチャ101を符号化するよう構成され、例えば、符号化及び予測は、ブロック103ごとに実行される。
【0113】
残差計算ユニット104は、例えば、サンプル領域において残差ブロック105を得るようサンプルごとに(ピクセルごとに)予測ブロック165のサンプル値をピクチャブロック103のサンプル値から減じることによって、ピクチャブロック103及び予測ブロック165(予測ブロック165に関する更なる詳細は後で与えられる)に基づいて残差ブロック105を計算するよう構成される。
【0114】
変換ユニット106は、変換された係数107を変換領域において得るために、残差ブロック105のサンプル値に対して変換、例えば、空間周波数変換又は線形空間変換、例えば、離散コサイン変換(DCT)又は離散サイン変換(DST)を適用するよう構成される。変換された係数107は、変換された残差係数とも呼ばれ、変換領域において残差ブロック105を表し得る。
【0115】
変換ユニット106は、HEVC/H.265について規定されているコア変換のような、DCT/DSTの整数近似を適用するよう構成されてよい。正規直交DCT変換と比較して、そのような整数近似は、通常、特定の係数によってスケーリングされる。順方向及び逆変換によって処理される残差ブロックのノルムを保つために、更なるスケーリング係数が変換プロセスの部分として適用される。スケーリング係数は、シフト演算、変換された係数のビットデプス、精度と実施コストとの間のトレードオフ、などのために、2の冪であるスケーリング係数のような特定の制約に基づいて、通常は選択される。特定のスケーリング係数は、例えば、復号器200での、例えば、逆変換ユニット212による、逆変換(及び符号器100での、例えば、逆変換ユニット112による、対応する逆変換)のために規定され、符号器100での、例えば、変換ユニット106による、順方向変換のための対応するスケーリング係数は、然るべく規定され得る。
【0116】
量子化ユニット108は、量子化された係数109を得るように、例えば、スカラー量子化又はベクトル量子化を適用することによって、変換された係数107を量子化するよう構成される。量子化された係数109は、量子化された残差係数109とも呼ばれ得る。例えば、スカラー量子化の場合に、異なるスケーリングが、より細かい又はより粗い量子化を達成するよう適用されてよい。より小さい量子化ステップサイズは、より細かい量子化に対応し、一方、より大きい量子化ステップサイズは、より粗い量子化に対応する。適用可能な量子化ステップサイズは、量子化パラメータ(QP)によって示され得る。量子化パラメータは、例えば、適用可能な量子化ステップサイズの予め定義された組へのインデックスであってよい。例えば、小さい量子化パラメータは、精細な量子化(小さい量子化ステップサイズ)に対応してよく、大きい量子化パラメータは、粗い量子化(大きい量子化ステップサイズ)に対応してよい。量子化は、量子化ステップサイズによる除算を含んでよく、例えば、逆量子化ユニット110による対応する又は逆の逆量子化は、量子化ステップサイズによる乗算を含んでよい。HEVC(High-Efficiency Video Coding)に従う実施形態は、量子化ステップサイズを決定するために量子化パラメータを使用するよう構成されてよい。一般に、量子化ステップサイズは、除算を含む式の固定点近似を用いて量子化パラメータに基づいて計算され得る。更なるスケーリング係数は、量子化ステップサイズ及び量子化パラメータのための式の固定点近似において使用されるスケーリングのために変更されることになる残差ブロックのノルムを回復するように量子化及び逆量子化のために導入されてよい。1つの実施例では、逆変換及び逆量子化のスケーリングは結合されてよい。代替的に、カスタマイズされた量子化テーブルが使用され、符号器から復号器へ、例えば、ビットストリームにおいて、伝えられてもよい。量子化は不可逆演算であり、損失は、量子化ステップサイズを大きくするにつれて増大する。
【0117】
符号器100(又は量子化ユニット108)の実施形態は、例えば、対応する量子化パラメータによって、量子化スキーム及び量子化ステップサイズを含む量子化設定を出力するよう構成されてよく、それにより、復号器200は、パラメータを受け取って、対応する逆量子化を適用し得る。符号器100(又は量子化ユニット108)の実施形態は、量子化スキーム及び量子化ステップサイズを、例えば、直接に、又はエントロピー符号化ユニット170若しくは何らかの他のエントロピー符号化ユニットを介してエントロピー符号化して、出力するよう構成されてもよい。
【0118】
逆量子化ユニット110は、例えば、量子化ユニット108と同じ量子化ステップサイズに基づいて又はそれを用いて、量子化ユニット108によって適用された量子化スキームの逆を適用することによって、量子化された係数に対して量子化ユニット108の逆量子化を適用して、逆量子化された係数111を取得するよう構成される。逆量子化された係数111は、逆量子化された残差係数111とも呼ばれ、通常は、量子化による損失により、変換された係数と同じではないが、変換された係数107に対応し得る。
【0119】
逆変換ユニット112は、変換ユニット106によって適用された変換の逆変換、例えば、逆離散コサイン変換(DCT)又は逆離散サイン変換(DST)を適用して、逆変換されたブロック113をサンプル領域において取得するよう構成される。逆変換されたブロック113は、逆変換された逆量子化されたブロック113又は逆変換された残差ブロック113とも呼ばれ得る。
【0120】
再構成ユニット114は、例えば、復号された残差ブロック113のサンプル値と予測ブロック165のサンプル値とをサンプルごとに加算することによって、逆変換されたブロック113及び予測ブロック165を結合して、再構成されたブロック115をサンプル領域において取得するよう構成される。
【0121】
バッファユニット116(又は略して「バッファ」116)、例えば、ラインバッファ116は、例えば、イントラ推定及び/又はイントラ予測のために、再構成されたブロック及び各々のサンプル値をバッファリング又は格納するよう構成される。
【0122】
符号器100の実施形態は、例えば、バッファユニット116が、再構成されたブロック115をイントラ推定152及び/又はイントラ予測154のために格納するためだけでなく、ループフィルタユニット120のためにも使用されるように、かつ/あるいは、例えば、バッファユニット116及び復号ピクチャバッファユニット130が1つのバッファを形成するように、構成されてよい。更なる実施形態は、イントラ推定152及び/又はイントラ予測154のための入力又は基礎として、復号ピクチャバッファ130からのブロック若しくはサンプル及び/又はフィルタ処理されたブロック121(図8にはいずれも図示せず)を使用するよう構成されてよい。
【0123】
ループフィルタユニット120(又は略して「ループフィルタ」120)は、例えば、デブロッキングサンプル適応オフセット(SAO)フィルタ又は他のフィルタ、例えば、鮮鋭化若しくは平滑化フィルタ又は協調フィルタを適用することによって、フィルタ処理されたブロック121を取得するように、再構成されたブロック115にフィルタをかけるよう構成される。フィルタ処理されたブロック121は、フィルタ処理された再構成されたブロック121とも呼ばれ得る。
【0124】
ループフィルタユニット120の実施形態は、フィルタ解析ユニット及び実際のフィルタユニットを有してよく、フィルタ解析ユニットは、実際のフィルタのためのループフィルタパラメータを決定するよう構成される。フィルタ解析ユニットは、固定の、予め決定されたフィルタパラメータを実際のループフィルタに適用するか、所定のフィルタパラメータの組からフィルタパラメータを適応的に選択するか、あるいは、実際のループフィルタのためのフィルタパラメータを適応的に計算するよう構成されてよい。
【0125】
ループフィルタユニット120の実施形態は、1又は複数のフィルタ(例えば、ループフィルタコンポーネント及び/又はサブフィルタ)、例えば、直列に若しくは並列に接続された又はそれらの任意の組み合わせにおける異なる種類又はタイプのフィルタの1つ以上を有してよく(図8に図示せず)、フィルタの夫々は、個別的に又は複数のフィルタの他のフィルタとともにまとまって、例えば、前の段落で記載されるように、各々のループフィルタパラメータを決定するフィルタ解析ユニットを有してよい。
【0126】
符号器100(又はループフィルタユニット120)の実施形態は、ループフィルタパラメータを、例えば、直接に、又はエントロピー符号化ユニット170若しくは何らかの他のエントロピー符号化ユニットを介してエントロピー符号化して、出力するよう構成されてよく、それにより、復号器200は、パラメータを受け取って、復号のために同じループフィルタパラメータを適用し得る。
【0127】
復号ピクチャバッファ(DPB)130は、フィルタ処理されたブロック121を受け取り格納するよう構成される。復号ピクチャバッファ130は、同じ現在のピクチャの又は異なるピクチャ、例えば、前に再構成されたピクチャの他の前にフィルタ処理されたブロック、例えば、前に再構成及びフィルタ処理されたブロック121を格納するよう更に構成されてよく、例えば、イントラ推定及び/又はインター予測のために、完全な、前に再構成された、すなわち、復号されたピクチャ(並びに対応する参照ブロック及びサンプル)及び/又は部分的に再構成された現在のピクチャ(並びに対応する参照ブロック及びサンプル)を供給してよい。
【0128】
本発明の更なる実施形態はまた、あらゆる種類の推定又は予測、例えば、イントラ推定及び予測並びにインター推定及び予測のために、復号ピクチャバッファ130の前のフィルタ処理されたブロック及び対応するフィルタ処理されたサンプル値を使用するよう構成されてもよい。
【0129】
ブロック予測ユニット160とも呼ばれる予測ユニット160は、ピクチャブロック103(現在のピクチャ101の現在のピクチャブロック103)及び復号又は少なくとも再構成されたピクチャデータ、例えば、バッファ116からの同じ(現在の)ピクチャの参照サンプル及び/又は復号ピクチャバッファ130からの1つ以上の前に復号されたピクチャの中の復号されたピクチャデータ231を受け取り又は取得するよう、かつ、そのようなデータを予測のために、すなわち、予測ブロック165を供給するために処理するよう構成される。予測ブロック165は、インター予測されたブロック145又はイントラ予測されたブロック155であってよい。
【0130】
モード選択ユニット162は、残差ブロック105の計算のために及び再構成されたブロック115の再構成のために、予測モード(例えば、イントラ若しくはインター予測モード)及び/又は予測ブロック165として使用されるべき対応する予測ブロック145若しくは155を選択するよう構成されてよい。
【0131】
モード選択ユニット162の実施形態は、最良の一致、すなわち、言い換えれば、最小限の残差(最小限の残差は、伝送又は記憶のための最良の圧縮を意味する)、又は最小限のシグナリングオーバーヘッド(最小限のシグナリングオーバーヘッドは、伝送又は記憶のための最良の圧縮を意味する)をもたらすか、あるいは、両方を考慮し又はバランスを取る予測モードを(例えば、予測ユニット160によってサポートされるものの中から)選択するよう構成されてよい。モード選択ユニット162は、レート歪み最適化(RDO)に基づいて予測モードを決定し、すなわち、最小限のレート歪みをもたらす予測モード、又はどの関連するレート歪みが少なくとも予測モード選択基準を満たすかを選択するよう構成されてよい。
【0132】
以下では、例となる符号器100によって実行される予測処理(例えば、予測ユニット160)及びモード選択(例えば、モード選択ユニット162による)が、更に詳細に説明される。
【0133】
上述されたように、符号器100は、(所定の)予測モードの組から最良又は最適な予測モードを決定又は選択するよう構成される。予測モードの組は、例えば、イントラ予測モード及び/又はインター予測モードを有してよい。
【0134】
イントラ予測モードの組は、32個の異なるイントラ予測モード、例えば、DC(又は平均)モード及びプラナーモードのような非指向性モード、又は例えば、H.264で定義されるような、指向性モードを有してよく、あるいは、65個の異なるイントラ予測モード、例えば、DC(又は平均)モード及びプラナーモードのような非指向性モード、又は、例えば、H.265で定義されるような、指向性モードを有してよい。
【0135】
(可能な)インター予測モードの組は、利用可能な参照ピクチャ(すなわち、例えば、DPB230に記憶されている、前に少なくとも部分的に復号されたピクチャ)及び他のインター予測パラメータ、例えば、参照ピクチャ全体又は一部分のみ、例えば、参照ピクチャの、現在のブロックのエリアの周りの探索ウィンドウウェリア、が、最も良く一致する参照ブロックを探すために使用されるかどうか、及び/又は例えば、ピクセル補間、例えば、半/準ペル及び/又は4分の1ペル補間が適用されるか否か、に依存する。
【0136】
上記の予測モードに加えて、スキップモード及び/又はダイレクトモードが適用されてもよい。
【0137】
予測ユニット160は、例えば、4分木パーティショニング(QT)、2分木パーティショニング(BT)、若しくは3分木パーティショニング(TT)、又はそれらの任意の組み合わせを繰り返し用いて、ブロック103をより小さいブロックパーティション又はサブブロックに分割するよう更に構成されてよく、モード選択は、分割されたブロック103の木構造とブロックパーティション又はサブブロックの夫々に適用される予測モードとの選択を有する。
【0138】
インターピクチャ推定ユニット142とも呼ばれるインター推定ユニット142は、ピクチャブロック103(現在のピクチャ101の現在のピクチャブロック103)及び復号されたピクチャ213、又は少なくとも1つ若しくは複数の前に再構成されたブロック、例えば、1以上の他の/異なる前に復号されたピクチャ231の再構成されたブロックを、例えば、インター推定(又は「インターピクチャ推定」)のために、受け取るか又は取得するよう構成される。例えば、ビデオシーケンスは、現在のピクチャ及び前に復号されたピクチャ231を有してよく、すなわち、言い換えれば、現在のピクチャ及び前に復号されたピクチャ231は、ビデオシーケンスを形成するピクチャのシーケンスの部分であるか、又はピクチャのシーケンスを形成し得る。
【0139】
符号器100は、例えば、複数の他のピクチャの同じ又は異なるピクチャの複数の参照ブロックから参照ブロックを選択(取得/決定)し、参照ピクチャ(若しくは参照ピクチャインデックスなど)及び/又は参照ブロックの位置(x、y座標)と現在のブロックの位置との間のオフセット(空間オフセット)をインター推定パラメータ143としてインター予測ユニット144へ供給するよう構成されてよい。このオフセットは、運動ベクトル(MV)とも呼ばれる。インター推定は、動き推定(ME)とも呼ばれ、インター予測は、動き予測(MP)とも呼ばれる。
【0140】
インター予測ユニット144は、インター予測パラメータ143を取得し、例えば、受け取り、インター予測パラメータ143に基づいて又はそれを用いてインター予測を実行してインター予測ブロック145を取得するよう構成される。
【0141】
図8は、インターコーディングのための2つの異なるユニット(又はステップ)、すなわち、インター推定142及びインター予測144を示すが、両方の機能は、例えば、現在最良のインター予測モード及び各々のインター予測ブロックを記憶しながら繰り返し、可能なインター予測モードの全ての可能な又は所定のサブセットを試験し、現在最良のインター予測モード及び各々のインター予測ブロックを、別なときにインター予測144を実行せずに(最終の)インター予測パラメータ143及びインター予測ブロック145として使用することによって、1つとして実行されてよい(インター推定は、通常は、ある/そのインター予測ブロック、すなわち、その又は“一種”のインター予測144を計算することを必要とする/有する)。
【0142】
イントラ推定ユニット152は、イントラ推定のためにピクチャブロック103(現在のピクチャブロック)及び同じピクチャの1以上の前に再構成されたブロック、例えば、再構成された隣接ブロックを取得する、例えば、受け取るよう構成される。符号器100は、例えば、複数のイントラ予測モードからイントラ予測モードを選択(取得/決定)し、それをイントラ推定パラメータ153としてイントラ予測ユニット154へ供給するよう構成されてよい。
【0143】
符号器100の実施形態は、最適な基準、例えば、最小限の残差(例えば、現在のピクチャブロック103に最も類似した予測ブロック155を供給するイントラ予測モード)又は最小限のレート歪みに基づいてイントラ予測モードを選択するよう構成されてよい。
【0144】
イントラ予測ユニット154は、イントラ予測パラメータ153、例えば、選択されたイントラ予測モード153に基づいて、イントラ予測ブロック155を決定するよう構成される。
【0145】
図8は、イントラコーディングのための2つの異なるユニット(又はステップ)、すなわち、イントラ推定152及びイントラ予測154を示すが、両方の機能は、例えば、現在最良のイントラ予測モード及び各々のイントラ予測ブロックを記憶しながら繰り返し、可能なイントラ予測モードの全ての可能な又は所定のサブセットを試験し、現在最良のイントラ予測モード及び各々のイントラ予測ブロックを、別なときにイントラ予測154を実行せずに(最終の)イントラ予測パラメータ153及びイントラ予測ブロック155として使用することによって、1つとして実行されてよい(イントラ推定は、通常は、イントラ予測ブロック、すなわち、その又は“一種”のイントラ予測154を計算することを必要とする/有する)。
【0146】
エントロピー符号化ユニット170は、エントロピー符号化アルゴリズム又はスキーム(例えば、可変長符号化(VLC)スキーム、コンテキスト適応VLCスキーム(CALVC)、算術符号化スキーム、コンテキスト適応バイナリ算術符号化(CABAC))を、量子化された残差係数109、インター予測パラメータ143、イントラ予測パラメータ153、及び/又はループフィルタパラメータに対して個別的に又はまとめて適用して(又は全くなしで)、出力部172によって出力され得る符号化されたピクチャデータ171を、符号化されたビットストリーム171の形で取得するよう構成される。
【0147】
[復号器及び復号化方法]
図9は、復号されたピクチャ231を取得するよう、例えば、符号器100によって符号化された、符号化されたピクチャデータ(例えば、符号化されたビットストリーム)171を受け取るよう構成されたビデオ復号器200を例示する。
【0148】
復号器200は、入力部202と、エントロピー復号化ユニット204と、逆量子化ユニット210と、逆変換ユニット212と、再構成ユニット214と、バッファ216と、ループフィルタ220と、復号ピクチャバッファ230と、インター予測ユニット244、イントラ予測ユニット254、及びモード選択ユニット262を含む予測ユニット260と、出力部232とを有する。
【0149】
エントロピー復号化ユニット204は、例えば、量子化された係数209及び/又は復号された符号化パラメータ(図9に図示せず)、例えば、インター予測パラメータ143、イントラ予測パラメータ153、及び/又はループフィルタパラメータの(復号された)いずれか又は全てを取得するために、符号化されたピクチャデータ171に対してエントロピー復号化を実行するよう構成される。
【0150】
復号器200の実施形態において、逆量子化ユニット210、逆変換ユニット212、再構成ユニット214、バッファ216、ループフィルタ220、復号ピクチャバッファ230、予測ユニット260及びモード選択ユニット262は、符号化されたピクチャデータ171を復号するために、符号器100(及び各々の機能ユニット)の逆処理を実行するよう構成される。
【0151】
特に、逆量子化ユニット210は、逆量子化ユニット110と機能が同じであってよく、逆変換ユニット212は、逆変換ユニット112と機能が同じであってよく、再構成ユニット214は、再構成ユニット114と機能が同じであってよく、バッファ216は、バッファ116と機能が同じであってよく、ループフィルタ220は、(ループフィルタ220が原画像101又はブロック103に基づきフィルタパラメータを決定するフィルタ解析ユニットを通常は有さず、符号化のために使用されるフィルタパラメータを、例えば、エントロピー復号化ユニット204から、(明示的又は暗黙的に)受信又は取得しということで、実際のループフィルタに関して)ループフィルタ120と機能が同じであってよく、復号ピクチャバッファ230は、復号ピクチャバッファ130と機能が同じであってよい。
【0152】
予測ユニット260は、インター予測ユニット244及びイントラ予測ユニット254を有してよく、インター予測ユニット244は、インター予測ユニット144と機能が同じであってよく、イントラ予測ユニット254は、イントラ予測ユニット154と機能が同じであってよい。予測ユニット260及びモード選択ユニット262は、通常は、ブロック予測を実行し、かつ/あるいは、符号化されたデータ171のみから、予測されたブロック265を取得するよう、かつ、予測パラメータ143若しくは153及び/又は選択された予測モードに関する情報を、例えば、エントロピー復号化ユニット204から(明示的又は暗黙的に)受信又は取得するよう構成される。
【0153】
復号器200は、復号されたピクチャ231をユーザの提示又はビューイングのために、例えば、出力部232を介して出力するよう構成される。
【0154】
再び図7を参照すると、復号器200から出力された復号されたピクチャ231は、ポストプロセッサ326に後処理されてよい。結果として得られる後処理されたピクチャ327は、内部又は外部表示デバイス328へ伝送され、表示されてよい。
【0155】
[実施形態の更なる詳細]
以下では、本発明の例となる実施形態の更なる詳細が、図10から図16を参照して記載される。
【0156】
本開示によって提案される符号ビット隠蔽(SBH)及び残差符号予測(RSP)技術の特有の和合は、RSPプロシージャを、RSPリスト(少なくとも1つのリスト、具体的な実施形態では、2以上のリスト)を準備することと、RSP技術に関連した他の動作を実行すること、特に、符号推定を実行し、推定された符号と原符号との間の差を取得及び符号化すること、の2つのサブプロシージャに分割することを有する。これら2つのサブプロシージャの間でSBHが実行される。特に、SBHが適用されるべき係数は、このようにしてもはや統計的に選択されず(例えば、所定の走査順序における最初の非ゼロ変換係数)、選択は、RSP技術によってまだ予測されていない、すなわち、1以上のRSPリスト係数にない係数が選択されるように行われる。
【0157】
これは、RSPリストからの量子化された変換係数の許された変更に制約を課すことによって、SBHプロシージャの更なる符号器側の改良を必要とする。
【0158】
本発明は、符号器側及び復号器側で符号予測及び隠蔽プロセスを和合する規範的(すなわち、少なくとも復号器に、特に、復号器及び符号器の両方に適用可能な)改善及び非規範的(すなわち、符号器のみに適用可能な)改善の両方を提案する。この場合に、規範的改善は、符号化及び復号化の両方のプロセスに導入される。実施形態では、更なる非規範的な改良が、符号器側から受信された信号をパース及び復号することを復号器側に適切に可能にするために、符号器側で必要である。当然、本発明に従う復号器は、本発明に従う符号器によって符号化されている如何なる信号も復号することができるべきである。
【0159】
符号器側及び復号器側の両方でSBH及びRSPを和合し適用する改良されたプロシージャの処理フローが、図10に表されている。
【0160】
符号器側で、最初のステップ(S10)は、1つ以上のRSPリスト、すなわち、符号が推定(予測)されるべきである係数のリストを準備することである。この例では、これは、RSPリストのサブリストの例としてHPリスト及びLPリストを含む。以下の説明では、簡単のために、それらは「RSPリスト」とも示される。LPリスト及びHPリストは、RSP技術の一般説明に関連して上述されている。これらのリストは、リストの全体サイズ(M)を定義し、大きさ及びそれらの(例えば、ラスタ順序での)走査によって順序付けられた最初のM個の係数のパースされた大きさ値を閾値化することによって、再構成される。
【0161】
次のステップ(S12)は、隠される(埋め込まれる)べき符号を有する係数の位置がもはや走査順序内の最初の非ゼロ係数の位置として定義されないという点で、従来のアプローチと相違している。係数がRSPリストに属する場合に、その符号は、それが既に、圧縮を強化された符号化及びシグナリングプロシージャ(RSP技術)を受けているので、隠蔽のために選択されるべきではない。さもなければ、同じデータが同時に2つの異なる技術を用いて、すなわち、冗長的な方法で、符号化されることになる。本発明の実施形態に従って、係数が、リストにない最低周波数の(有意味な)1つであるようSBHメカニズムにより埋め込まれかつ回復される係数の位置を選択する、ことが提案される。言い換えれば、RSPリストに属する係数に対応する位置は、この選択プロセスから除かれる。
【0162】
従来の場合と同様に、符号器側で、SBH技術は、係数の所与の組(CC又はCG)について、隠されている符号の値が、この組に適用されているチェック関数(所定の関数)の値に対応することを保証すべきである。量子化された残差信号のこの特性は、量子化プロセス中に、通常は、量子化された変換係数の大きさを変えることによって、達成される。
【0163】
特に、係数がRSPリスト(HPリスト及びLPリスト)に属する場合に、次いで、その大きさの変更は、HPとLPとの間の閾値をまたがない場合にのみ許される。そうでなければ、異なるコンテキストが、2つのサブリストについて、推定された符号と実際の符号との間の符号差をコーディングすることにおいて適用されるので、復号器は、推定された符号と正確な符号との間の受信された符号化された差値を正確に復号することができなくなる。この制約は、ステップS14で、選択された符号の隠蔽プロセスを実行するときに、考慮される。
【0164】
続くステップS16で、実際のRSPプロシージャ(符号推定及び差の符号化)が実行される。これは、上記の導入部で記載された既知の方法のいずれかによって、あるいは、代替的に、図14を参照して以下で記載されるもののような他の適切な方法によって、行われ得る。
【0165】
復号器側で、最初の2つのステップは符号化プロセスと一致する。最初に、ステップS20で、RSPリストが準備される。特に、これは、上述されたように、前もってセットされたサイズ(M)と、大きさに従って降順で係数を順序付けることとに基づいて、行われ得る。符号器側及び復号器側の両方で、他の適切なメカニズムも可能である。
【0166】
続くステップS22で、有意味な、量子化された変換係数が、SBHメカニズムに従って、所定の関数の値に基づいてその符号を回復するために選択される。係数は、符号器側と同じく、RSPリスト(HP又はLPリスト)に含まれないように選択される。特に、係数は、符号器側と同じ規則、例えば、リストにない最低周波数の1つ、に基づいて選択される。
【0167】
符号復号化プロセスの最後のステップで、SBHが適用される係数の符号を決定すること(S24)と、推定された符号と原符号との間の差値を復号すること、符号推定プロシージャを実行すること、及び推定された符号を、復号された差値に基づいて補正することを含むRSPプロシージャを実行すること(S26)とが、従来の様態で実行される。
【0168】
図11は、ステップS10及びS12並びにステップS20及びS22で夫々実行される符号隠蔽と符号予測との間の和合の例となるケースを表す。
【0169】
図の左上部分は、量子化された変換係数の組、この場合には、4×4係数グループを示す。係数グループは、逆量子化され、閾値が、回復された(すなわち、逆量子化された)係数に対して、T=300の閾値により適用される。所与の場合に、RSPリスト内の係数の全数は、M=5と定義される。従って、300の閾値よりも大きい大きさを有している、768、512、及び-512の係数値に対応する係数部分は、HPサブリストに属する。その結果、LPサブリストにポピュレートするために5-3=2個の係数が残っている。より具体的には、256の大きさを夫々有している残り3つの有意味な係数の中から、2つのみがLPサブリストに含まれる。RSPリストに含まれない大きさ256の残りの係数(この例では、係数グループの唯一の残りの有意味な係数)は、このようにして、SBHによる隠蔽のために選択される。原則として、閾値化は、量子化された係数によっても実行され得るが、回復された係数の領域においてそれを実行することは、ブロックサイズ及び量子化パラメータに依存しないという利点がある。
【0170】
パリティチェックは、係数の変更がこの例では不要であることを明らかにする。すなわち、量子化された変換係数の絶対値の和は、3+1+2+1+1+2=10、すなわち、偶数値である。これは、隠蔽のために選択される係数の符号(+)に対応する。
【0171】
図12は、(必要な場合に、隠されるべき正確な符号に対応するように、所定の関数の所望の値を取得するための)最良の係数変更の決定の従来例について記載する。簡単のために、隠されるべき単一の係数の場合が、量子化後の変換係数の和のパリティ値を計算することによって、考えられている。すなわち、必要な変更は、係数の単一の任意の1つを+1又は-1のどちらか一方によって変更することによって、達成され得る。
【0172】
例によって、原ブロックと予測されたブロックとの間の差として取得される残差信号(RES)は、(一般に、DCT又はDSTなどの直交変換を用いて)変換される。結果として得られる変換係数は、更に、予め定義された量子化パラメータ値により量子化される。量子化プロシージャは、種々の方法で実行され得る。しかし、最も一般的な1つは、レート歪み最適化による量子化(RDOQ)である。それは、量子化誤差だけでなく、結果として得られる量子化された信号を符号化するために必要とされるビットの数も最小限にするために、CABAC統計量を使用する。量子化パラメータは、最もRDにとって有利な係数変更を決定するためにRDOQによって使用される。チェック関数が、ここで考えられているように、パリティチェック関数である場合に、所望のチェック関数値は、チェック関数が適用される係数の組に属する係数の1つの大きさを増大又は低減させることによって、常に達成され得る。
【0173】
符号器側でのSBH技術は、量子化された変換係数QRにより作動し、RDOQと同様の技術を使用して、最もRDにとって有利な係数変更を決定する。チェック関数がパリティチェック関数である場合について、所望のチェック関数値は、チェック関数が適用される係数の組に属する係数の1つの大きさを増大又は低減させることによって、常に達成され得る。
【0174】
図12に示される例となる実施では、チェック関数が適用される係数位置の夫々について、コスト値が計算される:増大のコスト(COST-1)及び低減のコスト(COST+1)。結果は互いに比較され、最小コスト値を有する修正の位置及び方向が選択される。このようにして、記載される例では、最低の変更コストが、量子化された変換係数の大きさの変更の位置及び方向(posbest)を決定する。
【0175】
上述されたように、量子化された変換係数のいくつかの変更、例えば、符号が復号器側で回復される位置の変更をもたらすもの、は禁止される。そのような制約は、先に詳細に論じられている。
【0176】
制約を鑑みて、最小コスト値をもたらす変更(修正の位置及び方向)が制約によって禁止され、従って、選択され得ない状況があり得る。これを鑑みて変更を選択するために適用される簡単な規則は、二番目の最小コスト値(又は、より一般的に、制約によって禁止されない最小コスト値)を有する変更を選択することである。
【0177】
しかし、上記のアプローチは本発明の枠組み内で適用され得るが、コーディングプロセスにおける符号隠蔽及び符号予測技術の存在の枠組み内では、コストにのみ基づく最適化が次善になることが分かる。実際に、多くの係数は、コスト関数が通常は正確に計算されず推定されるだけであるから、変更の近似コストを有している。
【0178】
従って、本発明は、符号器側で係数の大きさを変えるために代替のアプローチを適用することを提案する。これは、図13を参照して以下で記載される。
【0179】
最初のステップ(S130)で、個々の係数変更のためのRDコスト計算が実行される。これは、図12を参照して上述された様態で実施され得る。
【0180】
図13の第2のステップ(S132)は、最良の(最小限の)コスト値に近いRDコスト値をもたらす変更(変更は、係数の位置及び変更方向によって定義される)のリストpos_listCMCを準備することから成る。コストが十分に近いかどうかを定義する基準は、

|COST-COSTREST|≦ε

と定義されるべきであり、εは、予め定義された値である。
【0181】
次いで、このようにして生成されたリストが1よりも多い要素を有しているかどうかが判定される(S134)。単一の要素(すなわち、コスト値COSTRESTに対応する)しかない場合には、次いで、対応する位置及び変更方向が、従来の方法で、最適な偏光として選択される(S136)。
【0182】
しかし、リストが1よりも多い要素を有する、すなわち、最良の(最小限の)コスト値に近いコストを有する複数の可能な変更(位置及び変更方向)がある場合には、他の基準が更に、変更推定関数(MEF)を考えることによって、考慮に入れられる。その場合に、変更posbestは、変更推定関数のより小さい値をもたらす他の位置及び変更方向によって置換されてよい。より具体的には、リストの各員について(S135)、変更推定関数は計算され(S137)、変更推定関数の最小値を有する1つが、(新しい)最適な偏光(posbest)として選択される。
【0183】
実施形態に従って、MEFは、係数変更によって導入される歪みであるよう定義される。レート変化は、RSPプロシージャの制度に影響を及ぼさないが、歪みは影響を及ぼす。従って、MEFにおいてレート変化値を使用することは回避される。
【0184】
他の実施形態は、係数の量子化レベルであるようMEFを定義する。符号が予測される係数の数を最大限にするために、最も大きい大きさを有している係数が、pos_listCMCリストから選択される。
【0185】
以下では、図14を参照して、代替のアプローチが、周波数領域(変換領域)において符号推定プロシージャを実行することについて記載される。図3を参照して上述されたピクセル領域での推定プロシージャの従来の方法との主な相違は、図14図3と比較することによって明らかになる。特に:
・符号推定が変換領域において実行され、
・現在のブロックを再構成し、その境界ピクセルを隣接ブロックの対応するピクセルから減じることに代えて、予測信号が隣接ブロックエリアに伝搬される。
【0186】
簡単のために、隣接ブロックのただ1つの列のみが、図14では考えられている。提案される発明が適用される枠組みに応じて、上の行、右の列、又は下の行も使用されてよい。
【0187】
コスト関数(1)は、モジュラスの代わりに二乗を使用するよう再定義される:
【数2】
ここで、N及びMは、ブロックの高さ及び幅である。
【0188】
再構成されたブロックは、予測及び残差部分から成る:

i,j=Pi,j+Ri,j

ここで、Pi,jは予測であり、Ri,jは残差である。
【0189】
この場合に、(1a)内の構成要素は再配置され得る(背景技術の項を参照):
【数3】
=[2Xn,-1 -Xn,-2 -Pn,0]、V=[2Z-1,m -Z-2,m -P0,m]、Q=Rn,0及びO=R0,mを表すとする。パーセヴァルの等式に従って、この関数は、変換領域(1D)において書き直され得る:
【数4】
ここで、t=Trans1D(T)、q=Trans1D(Q)、v=Trans1D(V)、o=Trans1D(O)であり、Trans1D()は一次元の直交変換である。
【0190】
結果として、コスト関数は計算され得、従って、量子化された変換係数の符号は、変換領域において推定され得る。
【0191】
図14から明らかなように、図3を参照して上述された従来アプローチと同じく、(予測された変換された差信号と計算された逆量子化された残差変換係数qとの間の比較の一種に対応する)コスト関数の各々の計算は、符号の組に関する2個の仮説の夫々について実行され、コスト関数を最小限にする仮説が、符号の組の推定としてとられる(ここで、Mは、符号が図中で予測されるべきである変換係数の個数である)。特に、隣接ブロックとのブロックAの境界にある列qに対応するブロックAの逆量子化された残差係数は、変換された差列Bcolと比較される。変換された差列Bcol(tに対応)は、伝搬された予測信号を、ピクセル領域において、差信号を含む隣接ブロック列から減じることによって、かつ、差信号を変換された差に変換することによって、取得される。変換は、空間領域への変換、例えば、DFT、FFT、DCT若しくはDST又はそれらの整数バージョンのような、如何なる直交又は近直交変換でもある。
【0192】
、oとrn,m=Trans2D(Rn,m)との間の関係を決定するために、Rn,mとrn,mとの間の関係を一般式で書くとする:
【数5】
ここで、W n,k-変換コア、例として、DCT2について、それは
【数6】
である。
【数7】
及びrn,mの場合に、同様の関係がある。
【0193】
変換領域における計算は、t及びvの全ての利用可能な係数がコスト関数を計算するために使用されるわけではないので、計算的により容易である。代わりに、方法は、特定の行及び特定の列に属するいくつかの係数のみを使用する。この行及び列は、符号が予測されている係数の位置の対応するインデックスである。コスト関数(2)を最小限にする符号の組は、生成され、推定結果とされる。符号予測誤差はエントロピー符号化される。結果として得られるビットは、従来の符号符号化の結果と組み合わされ、ビットストリームに埋め込まれる。
【0194】
符号器側での本発明の例となる実施は、図15に表されている。図15に顕されている本発明に従う例となる符号器は、符号予測(すなわち、符号推定)モジュール(ステップ又はユニット)122を更に含むことによって、図8の従来の符号器と相違する。量子化された変換係数109に基づいて、モジュールは、符号予測誤差123をエントロピー符号化ユニット170へ出力する。
【0195】
エントロピー符号化ユニット170自体は、2つの改良によって、図8のエントロピー符号化ユニット170と相違する。第1に、符号推定の結果、すなわち、符号予測誤差が、(量子化された)変換係数の変換ユニット内の所与の位置の組(リストに含まれる第1の複数の係数)について符号値の代わりに符号化される。第2に、符号推定の結果を符号化するために適用される新しいコーディングコンテキストが導入される。
【0196】
更に、図15の本発明の実施形態と図8の従来の符号器との間には、量子化モジュール18においても違いがある。すなわち、上述されたように、量子化プロシージャは、必要に応じて係数を変更することによって、チェック関数(所定の関数)の所望の特性が、係数の符号を隠すように満たされることを確かにすべきである。
【0197】
復号器側での本発明の例となる実施形態は、図16に表されている。表されている復号器も、新しい符号予測モジュール122を備える。符号予測モジュール122は、符号器側で使用されるのと同じであり、変換係数の組内の第1の複数の変換係数のリストによって定義される位置にある量子化された変換係数の符号のいくつかを推定する。
【0198】
更に、図16の本発明の例となる実施形態と図9の従来例との間にはエントロピー復号モジュール204において違いがある。本発明に従って、パーシングプロセス(エントロピー復号化)中に、符号予測誤差信号123のみが回復される。パーシング依存性は導入されない。すなわち、実際の符号値及び位置は、パーシングプロセスが完了した後に、具体的には、逆量子化プロセス210と並行して、予測誤差信号123から回復され得る。
【0199】
上記の図15及び図16では、図8及び図9の例と比較して追加の又は変更されたモジュール(ステップ又はユニット)は、明るい影をつけて示されている。
【0200】
上述された本発明の詳細な説明をまとめると、主な違いは次のとおりである:
RSPプロシージャは、2つのサブプロシージャ“RSPリストの準備”及び“RSP技術に関連した他の動作の実行”に分けられ、SBHは、それらのサブプロシージャの間で実行される。このような変更はSBH及びRSPリストの両方に影響を及ぼす。
【0201】
更に、変更によって係数位置分布に如何なる変化(特にサブリスト間で閾値をまたぐこと)もあってはならないいくつかのRSPリスト(サブリスト)がある場合に、RSPリストからの量子化された変換係数の許された変化に制約を課すことによって、符号器側でSBHプロシージャは改良される。
【0202】
従って、本発明は、次の態様において有利であることができる:
圧縮性能は、RSP及びSBH技術を和合することにより高められ得る。
【0203】
提案される方法によって引き起こされるハードウェア計算複雑性は、符号器側及び復号器側の両方で小さい。
【0204】
本発明は、HMソフトウェア及びVPXビデオコーデックファミリー並びに最新であるJEM(Joint Exploration Model)ソフトウェア及びVPX/AV1ビデオコーデックファミリー、更には次世代のビデオ符号化フレームワークと互換性があるハイブリッドビデオコーディングパラダイムにおける多くの潜在的な用途で使用され得る。
【0205】
本発明は、広範なSBH及びRSP技術に適用可能である。
【0206】
要約すると、本発明は、ビデオコーディングにおいて符号ビット隠蔽(SBH)及び残差符号予測(RFP)の両方の技術を和合する改善された装置及び方法に関係がある。コーディング効率を改善するために、SBHが適用される係数を選択する前に、RSPが適用されるべきである変換係数のリストが準備される。それによって、RSPリストは、最も高い符号化効率が期待され得る様態でポピュレートされ得る。続いて、SBHを適用するための1つ以上の係数が、リストに含まれないように選択される。
【0207】
本明細書は、ピクチャ(フレーム)に関して説明しているが、インターレースピクチャ信号の場合には、フィールドがピクチャとして取って代わる点に留意されたい。
【0208】
本発明は、ビデオコーディングに基づいて主に記載されてきたが、符号器100及び復号器200(及び相応してシステム300)の実施形態も、静止ピクチャ処理又はコーディング、すなわち、ビデオコーディングで見られるような如何なる先行又は連続ピクチャからも独立した個々のピクチャの処理又はコーディングのために構成されてもよい点が留意されるべきである。
【0209】
実施形態及び記載が語「メモリ」に言及するとき、語「メモリ」は、明示的に別なふうに述べられない限りは、磁気ディスク、光ディスク、ソリッド・ステート・ドライブ(SSD)、リード・オンリー・メモリ(Read-Only Memory,ROM)、ランダム・アクセス・メモリ(Random Access Memory,RAM)、USBフラッシュドライブ、又はあらゆる他の適切な種類のメモリと理解されるべきでありかつ/あるいはそれらを有するべきである。
【0210】
実施形態及び記載が語「ネットワーク」に言及するとき、語「ネットワーク」は、明示的に別なふうに述べられない限りは、ローカル・エリア・ネットワーク(LAN)、無線LAN(WLAN)、ワイド・エリア・ネットワーク(WAN)、イーサネット、インターネット、モバイルネットワークなどのようなあらゆる種類の無線又は有線ネットワークと理解されるべきでありかつ/あるいはそれらを有するべきである。
【0211】
当業者であれば、様々な図(方法及び装置)の「ブロック」(「ユニット」又は「モジュール」)は、(ハードウェア又はソフトウェアにおける必然的に個々の「ユニット」よりむしろ)本発明の実施形態の機能を表現又は記載し、よって、装置の実施形態及び方法の実施形態(ユニット=ステップ)の機能又は特徴を同様に記載する。
【0212】
「ユニット」の用語は、符号器/復号器の実施形態の機能の実例のために単に使用され、本開示を制限する意図はない。
【0213】
本願で提供されるいくつかの実施形態では、開示されるシステム、装置、及び方法は他の様態で実施されてもよいことが理解されるべきである。例えば、記載される装置の実施形態は、単なる例である。例えば、ユニット分割は、単に、論理的な機能分割であり、実際の実施では他の分割であってもよい。例えば、複数のユニット又はコンポーネントは、他のシステムに結合又は一体化されてよく、あるいは、いくつかの特徴は、無視されても又は実行されなくてもよい。その上、表示又は議論されている相互結合又は直接的な結合若しくは通信接続は、いくつかのインターフェースを使用することによって実施されてもよい。装置又はユニット間の間接的な結合又は通信接続は、電子的な、機械的な、又は他の携帯で実施されてもよい。
【0214】
別個の部分として記載されるユニットは、物理的に分離していてもいなくてもよく、ユニットとして表示されている部分は、物理的なユニットであってもなくてもよく、一箇所に位置しても、あるいは、複数のネットワークユニットに分布してもよい。ユニットの一部又は全部は、実施形態の解決法の目的を達成するために、実際のニーズに従って選択されてよい。
【0215】
更に、本発明の実施形態における機能ユニットは、1つの処理ユニットに一体化されてよく、あるいは、ユニットの夫々は、物理的に単独で存在してよく、あるいは、2つ以上のユニットは1つのユニットに一体化される。
【0216】
本発明の実施形態は、ここで記載されている方法及び/又はプロセスのいずれかを実行するよう構成された処理回路を有する装置、例えば、符号器及び/又は復号器を更に有してよい。
【0217】
符号器100及び/又は復号器200の実施形態は、ハードウェア、ファームウェア、ソフトウェア又はそれらの任意の組み合わせとして実施されてよい。例えば、符号器/符号化又は復号器/復号化の機能は、ファームウェア又はソフトウェアの有無によらず処理回路、例えば、プロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向け集積回路(ASIC)などによって実行されてよい。
【0218】
符号器100(及び対応する符号化方法100)及び/又は復号器200(及び対応する復号化方法200)の機能は、コンピュータ可読媒体に記憶されているプログラム命令によって実施されてもよい。プログラム命令は、実行される場合に、処理回路、コンピュータ、プロセッサなどに、符号化及び/又は復号化方法のステップを実行させる。コンピュータ可読媒体は、ブルーレイディスク、DVD、CD、USB(フラッシュ)ドライブ、ハードディスク、ネットワークを介して利用可能なサーバストレージなどのような、プログラムが記憶されている非一時的な記憶媒体を含む如何なる媒体でもあることができる。
【0219】
本発明の実施形態は、コンピュータで実行されるときに、ここで記載されている方法のいずれかを実行するプログラムコードを有するコンピュータプログラムを有するか、又はそのようなコンピュータプログラムである。
【0220】
本発明の実施形態は、プロセッサによって実行されるときに、コンピュータシステムに、ここで記載されている方法のいずれかを実行させるプログラムコードを有するコンピュータ可読媒体を有するか、又はそのようなコンピュータ可読媒体である。
【0221】
本発明の実施形態は、ここで記載されている方法のいずれかを実行するチップセットを有するか、又はそのようなチップセットである。
【符号の説明】
【0222】
100 符号器
101 ピクチャ
102,202 入力部(例えば、入力ポート、入力インターフェース)
103 ピクチャブロック
104 残差計算[ユニット又はステップ]
105 残差ブロック
106 変換(例えば、スケーリングを更に有する)[ユニット又はステップ]
107 変換された係数
108 量子化[ユニット又はステップ]
109,209 量子化された係数
110,210 逆量子化[ユニット又はステップ]
111,211 逆量子化された係数
112,212 逆変換(例えば、スケーリングを更に有する)[ユニット又はステップ]
113,213 逆変換されたブロック
114,214 再構成[ユニット又はステップ]
115,215 再構成されたブロック
116,216 (ライン)バッファ[ユニット又はステップ]
117,217 参照サンプル
120,220 ループフィルタ[ユニット又はステップ]
121,221 フィルタ処理されたブロック
122 符号予測[ユニット又はステップ]
130,230 復号ピクチャバッファ(DPB)[ユニット又はステップ]
142 インター推定(又はインターピクチャ推定)[ユニット又はステップ]
143 インター推定パラメータ(例えば、参照ピクチャ/参照ピクチャインデックス、運動ベクトル/オフセット)
144,244 インター予測(又はインターピクチャ予測)[ユニット又はステップ]
145 インター予測ブロック
152 イントラ推定(又はイントラピクチャ推定)[ユニット又はステップ]
153 イントラ予測パラメータ(例えば、イントラ予測モード)
154,254 イントラ予測(イントラフレーム/ピクチャ予測)[ユニット又はステップ]
155 イントラ予測ブロック
160,260 予測[ユニット又はステップ]
162,262 モード選択[ユニット又はステップ]
165,265 予測ブロック(例えば、インター予測ブロック145又はイントラ予測ブロック155のどちらか一方)
170 エントロピー符号化(ユニット又はステップ)
171 符号化されたピクチャデータ(例えば、ビットストリーム)
172 出力部(出力ポート、出力インターフェース)
200 復号器
204 エントロピー復号化
231 復号されたピクチャ
300 コーディングシステム
310 ソースデバイス
312 ピクチャソース
313 (ロー)ピクチャデータ
314 プリプロセッサ/前処理ユニット
315 前処理されたピクチャデータ
318 通信ユニット/インターフェース
320 あて先デバイス
322 通信ユニット/インターフェース
326 ポストプロセッサ/後処理ユニット
327 後処理されたピクチャデータ
328 表示デバイス/ユニット
330 送信/受信/通信(符号化)されたピクチャデータ
410 変換ユニット
420 係数ブロック
【先行技術文献】
【非特許文献】
【0223】
【文献】G. Clare, F. Henry, and J. Jung,“Sign Data Hiding”,Contribution JCTVC-G0271 to the 7th JCT-VC meeting,Geneva, Switzerland,November 2011
【文献】X. Yu, J. Wang, D. He, G. Martin-Cocher, and S. Campbell,“Multiple Sign Bits Hiding”,Contribution JCTVC-H0481 to the 8th JCT-VC meeting,San Jose, USA,February 2012
【文献】K. Kazui et al.,“Video coding technology proposal by Fujitsu”, Contribution JCTVC-A115 to the 1st JCT-VC meeting, Dresden, Germany, April 2010
【文献】F. Henry, G. Clare,“Residual sign prediction”,Contribution JVET-D0031 to the 4th JVET meeting,Chengdu, China,October 2016
【文献】Han Huang, Kai Zhang, Yu-Wen Huang, and Shawmin Lei,“EE2.1: Quadtree plus binary tree structure integration with JEM tools”,Contribution JVET-C0024 to the 3rd JVET meeting,Geneva, Switzerland,May 2016
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16