特開2018-82453(P2018-82453A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 寰發股▲ふん▼有限公司の特許一覧

特開2018-82453ビデオ符号化のサンプル適応オフセット処理の方法
<>
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000016
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000017
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000018
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000019
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000020
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000021
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000022
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000023
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000024
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000025
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000026
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000027
  • 特開2018082453-ビデオ符号化のサンプル適応オフセット処理の方法 図000028
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2018-82453(P2018-82453A)
(43)【公開日】2018年5月24日
(54)【発明の名称】ビデオ符号化のサンプル適応オフセット処理の方法
(51)【国際特許分類】
   H04N 19/82 20140101AFI20180420BHJP
   H04N 19/70 20140101ALI20180420BHJP
【FI】
   H04N19/82
   H04N19/70
【審査請求】有
【請求項の数】8
【出願形態】OL
【全頁数】17
(21)【出願番号】特願2017-246468(P2017-246468)
(22)【出願日】2017年12月22日
(62)【分割の表示】特願2016-526429(P2016-526429)の分割
【原出願日】2014年7月15日
(31)【優先権主張番号】61/846,130
(32)【優先日】2013年7月15日
(33)【優先権主張国】US
(71)【出願人】
【識別番号】516251901
【氏名又は名称】寰發股▲ふん▼有限公司
【氏名又は名称原語表記】HFI Innovation Inc.
(74)【代理人】
【識別番号】110001494
【氏名又は名称】前田・鈴木国際特許業務法人
(72)【発明者】
【氏名】シャン, シン−タ
(72)【発明者】
【氏名】ファン, ユ−ウェン
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA21
5C159MC11
5C159ME00
5C159NN01
5C159RB09
5C159UA02
5C159UA05
5C159UA16
5C159UA33
(57)【要約】      (修正有)
【課題】ビデオ符号化のサンプル適応オフセット(ASO)処理の方法を提供する。
【解決手段】再構成ピクチャのデータを受信し、再構成画素のEO分類インデックス又はBO開始バンド位置を決定し、第1、第2カラーコンポーネントの第1、第2SAO−ビット−シフト値を生成し、SAO−オフセットサイン、SAO−オフセット絶対値、第1、第2SAO−ビット−シフト値に従いSAO−オフセット値を決定し、再構成画素が第1カラーコンポーネントに対応するか第2カラーコンポーネントに対応するかに応じて、第1、第2SAO−ビット−シフト値をSAO−オフセット絶対値に左方移動させることによる結果によりSAO−オフセットサインを増加させることによりSAO−オフセット値を生成し、EO分類インデックス又はBO開始バンド位置に関連するSAO−オフセット値を現在の再構成画素に加えることにより現在の再構成画素を補償する。
【選択図】図11
【特許請求の範囲】
【請求項1】
ビデオ符号化システムSAO(sample-adaptive offset)処理の方法であって、前記方法は、
再構成ピクチャに関連する入力データを受信する工程と、
前記現在の再構成画素、および、隣接再構成画素に基づいて、現在の再構成画素のEO分類インデックス、または、BO開始バンド位置を決定する工程と、
第1のカラーコンポーネントに関連する第1のSAO−ビット−シフト値、および、第2のカラーコンポーネントに関連する第2のSAO−ビット−シフト値を生成する工程であって、前記第1のSAO−ビット−シフト値および前記第2のSAO−ビット−シフト値の各々は、ビットストリームの異なるレベルにおける少なくとも2つの構文要素に対応する工程と、
SAO−オフセットサイン、SAO−オフセット絶対値、前記第1のSAO−ビット−シフト値、および、前記第2のSAO−ビット−シフト値にしたがって、前記現在の再構成画素の前記EO分類インデックス、または、前記BO開始バンド位置に関連するSAO−オフセット値を決定する工程と、
前記現在の再構成画素が前記第1のカラーコンポーネントに対応するとき、前記SAO−オフセット値は、前記第1のSAO−ビット−シフト値を、前記SAO−オフセット絶対値に左方移動させることによる結果により、前記SAO−オフセットサインを増加させることにより生成される工程と、
前記現在の再構成画素が前記第2のカラーコンポーネントに対応するとき、前記SAO−オフセット値は、前記第2のSAO−ビット−シフト値を、前記SAO−オフセット絶対値に左方移動させることによる結果により、前記SAO−オフセットサインを増加させることにより生成される工程と、
前記現在の再構成画素が前記第1のカラーコンポーネントに対応するか、あるいは、前記第2のカラーコンポーネントに対応するかに従って、前記EO分類インデックス、または、前記BO開始バンド位置に関連する前記SAO−オフセット値を、前記現在の再構成画素に加えることにより、前記現在の再構成画素を補償する工程と、を有することを特徴とする方法。
【請求項2】
前記第1のSAO−ビット−シフト値は、前記ビットストリームの第1のレベルにおける第1の構文要素に対応し、前記第2のSAO−ビット−シフト値は、前記ビットストリームの前記第1のレベルにおける第2の構文要素に対応し、前期第1の構文要素と前記第2の構文要素は異なることを特徴とする請求項1に記載の方法。
【請求項3】
前記第1の構文要素の値の範囲は、ビデオデータの画素深さによって決まることを特徴とする請求項2に記載の方法。
【請求項4】
前記第2の構文要素の値の範囲は、ビデオデータの画素深さによって決まることを特徴とする請求項2に記載の方法。
【請求項5】
ビデオ符号化システムSAO(sample-adaptive offset)処理の装置であって、前記装置は、
再構成ピクチャに関連する入力データを受信する処理、
前記現在の再構成画素、および、隣接再構成画素に基づいて、現在の再構成画素のEO分類インデックス、または、BO開始バンド位置を決定する処理、
第1のカラーコンポーネントに関連する第1のSAO−ビット−シフト値、および、第2のカラーコンポーネントに関連する第2のSAO−ビット−シフト値を生成する処理であって、前記第1のSAO−ビット−シフト値および前記第2のSAO−ビット−シフト値の各々は、ビットストリームの異なるレベルにおける少なくとも2つの構文要素に対応する処理、
SAO−オフセットサイン、SAO−オフセット絶対値、前記第1のSAO−ビット−シフト値、および、前記第2のSAO−ビット−シフト値にしたがって、前記現在の再構成画素の前記EO分類インデックス、または、前記BO開始バンド位置に関連するSAO−オフセット値を決定する処理、
前記現在の再構成画素が前記第1のカラーコンポーネントに対応するとき、前記SAO−オフセット値は、前記第1のSAO−ビット−シフト値を、前記SAO−オフセット絶対値に左方移動させることによる結果により、前記SAO−オフセットサインを増加させることにより生成される処理、
前記現在の再構成画素が前記第2のカラーコンポーネントに対応するとき、前記SAO−オフセット値は、前記第2のSAO−ビット−シフト値を、前記SAO−オフセット絶対値に左方移動させることによる結果により、前記SAO−オフセットサインを増加させることにより生成される処理、および
前記現在の再構成画素が前記第1のカラーコンポーネントに対応するか、あるいは、前記第2のカラーコンポーネントに対応するかに従って、前記EO分類インデックス、または、前記BO開始バンド位置に関連する前記SAO−オフセット値を、前記現在の再構成画素に加えることにより、前記現在の再構成画素を補償する処理、
のために構成された1またはそれ以上の回路を有することを特徴とする装置。
【請求項6】
前記第1のSAO−ビット−シフト値は、前記ビットストリームの第1のレベルにおける第1の構文要素に対応し、前記第2のSAO−ビット−シフト値は、前記ビットストリームの前記第1のレベルにおける第2の構文要素に対応し、前期第1の構文要素と前記第2の構文要素は異なることを特徴とする請求項5に記載の装置。
【請求項7】
前記第1の構文要素の値の範囲は、ビデオデータの画素深さによって決まることを特徴とする請求項6に記載の装置。
【請求項8】
前記第2の構文要素の値の範囲は、ビデオデータの画素深さによって決まることを特徴とする請求項6に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
この出願は、2013年7月15日に出願された“Method and Apparatus for Image and Video Coding with Modified Sample-Adaptive Offset Processing”と題された米国仮出願番号61/846130から、優先権を主張するものであり、その内容は引用によって本願に援用される。
【0002】
本発明は、サンプル適応オフセット(SAO)処理に関するものである。特に、本発明は、SAO処理のパフォーマンスを改善する修正されたSAO処理に関するものである。
【背景技術】
【0003】
動き推定は、ビデオシーケンスにおいて、時間冗長性を有効に活かす効果的なインターフレーム符号化技術である。動き補償インターフレーム符号化は、すでに幅広く、各種国際ビデオ符号化標準に用いられている。各種符号化標準に採用される動き測定は、通常、ブロックベースの技術で、動き情報、たとえば、符号化モードと動きベクトルは、各マクロブロック、または、類似のブロック設定に対して決定される。このほか、イントラ符号化も適応的に適用され、ピクチャは、その他のピクチャの参照なしに処理される。インター予測、または、イントラ予測の剰余は、通常、さらに、変換、量子化、および、エントロピー符号化により処理されて、圧縮ビデオビットストリームを生成する。符号化処理の期間、符号化アーチファクト(符号化歪み)が、特に、量子化プロセスにおいて導入される。符号化アーチファクトを軽減するため、最新の符号化システムにおいては、追加処理が、再構成されたビデオに適用されて、ピクチャ品質を向上させている。追加処理は、しばしば、ループ内操作で構成されるので、エンコーダー、および、デコーダーは、同一リファレンス画像を生成して、システム性能の改善を達成する。高効率ビデオコーディング(HEVC)は、映像符号化国際標準のHEVC標準化の共同チーム(JCT−VC)で発展される新世代国際ビデオ符号化標準である。
【0004】
図1は、適応インター/イントラ予測を用いた高効率ビデオコーディングシステム(HEVC)に基づいたビデオエンコーダーのシステムブロック図である。このシステムにおいて、ピクチャは、複数の非重複の最大符号化ユニット、符号化ツリーブロック(CTB)に分割される。インター予測において、動き推定(ME)/動き補正(MC、112)は、その他のピクチャ、または、ピクチャからのビデオデータに基づいて、予測データを提供するのに用いられる。スイッチ114は、イントラ予測110からイントラ予測データ、または、ME/MC112からインター予測データを選択する。選択された予測データ(136)は、加算器116に供給されて入力ビデオデータから取り除かれ、剰余とも称される予測誤差を形成する。その後、予測誤差は、変換(T)118、次に、量子化(Q)120により処理される。その後、変換、および、量子化された剰余が、エントロピーエンコーダー122により符号化されて、圧縮ビデオデータに対応するビデオビットストリームを形成する。その後、変換係数に関連するビットストリーム変換係数は、サイド情報、たとえば、動き、モード、および、イメージ領域に関連するその他の情報とともにパックされる。サイド情報は、さらに、エントロピー符号化により、必要なバンド幅を減少させる。したがって、図1に示されるように、サイド情報に関連するデータがエントロピーエンコーダー122に提供される。インター予測モードが用いられるとき、リファレンス画像、または、ピクチャは、終端のエンコーダーで再構築なれなければならない。よって、変換、および、量子化された剰余は、逆量子化(IQ)124と逆変換(IT)126により処理されて、剰余をリカバーする。その後、剰余は、再構成(REC)128で、予測データ136を加えて、ビデオデータを再構成する。再構成のビデオデータは、リファレンス画像バッファ134中に保存されると共に、別のフレームの予測に用いられる。
【0005】
図1に示されるように、入ってくるビデオデータは、符号化システムで、一連の処理を受ける。REC128からの再構成のビデオデータは、一連の処理によって、各種障害に見舞われる。したがって、再構成のビデオデータがリファレンス画像バッファ134に保存される前、各種ループ内処理が再構成のビデオデータに適用され、ビデオ品質を改善する。発展中の高効率ビデオコーディング(HEVC)標準化において、非ブロック化フィルター(DF)130、および、サンプル適応オフセット(SAO)131が発展して、ピクチャ品質を向上させている。インループフィルタ情報が、ビットストリーム中に組み込まれて、デコーダーが、必要な情報を適切にリカバーすることができる。よって、SAOからのインループフィルタ情報がエントロピーエンコーダー122に提供されて、ビットストリーム中に組み込まれる。
【0006】
現在のHEVC標準化は、各カラーコンポーネントの8ビット、または、10ビットに等しい画素深さを有する4:0:0と4:2:0ピクチャサンプリングフォーマットだけをサポートすることができる。しかし、HEVCの範囲拡張が開発されて、高い忠実度レベル、たとえば、UHDTV(Ultra-High Definition Television)で、ビデオ符号化アプリケーションが現れた。拡張されたHEVC標準化は、YUV4:2:2,YUV4:4:4とRGB4:4:4ピクチャフォーマットをさらにサポートすることが期待され、且つ、画素深さは、さらに、各カラーコンポーネントの12ビットと16ビットをサポートすることができる。
【0007】
HEVC標準化において、サンプル適応オフセット(SAO)処理が用いられて、再構成ピクチャの歪みを減少させる。非ブロック化フィルタリング(DF)後、SAO処理が実行され、且つ、それは、非ブロック解除フィルタリング(NDFs)操作の一部である。図2は、非ブロック化フィルター(DF)とSAOを含むHEVC−ベースデコーダーのシステムブロック図である。エンコーダーは、また、ローカルデコーダーを含んで、ビデオデータを再構成するので、いくつかのデコーダーコンポーネントも、エンコーダー中で用いられる。デコーダーにおいて、エントロピーデコーダー222が、剰余、動き情報に関連する符号化された構文要素、および、その他の制御データを構文解析、および、リカバーするのに用いられる。スイッチ214は、イントラ予測、または、インター予測を選択すると共に、選択された予測データは、リカバーされた剰余と結合される再構成(REC)228に供給される。圧縮されたビデオデータで、エントロピー復号が実行される以外に、エントロピー復号222は、サイド情報のエントロピー復号に対して責任を負い、サイド情報を各自ブロックに提供する。たとえば、イントラモード情報がイントラ予測210に提供され、インターモード情報が動き補正212に提供され、サンプル適応オフセット情報がSAO232に提供され、剰余が逆量子化224に提供される。剰余は、IQ224、IT226、および、後続の再構成プロセスにより処理されて、ビデオデータを再構成する。再び、図2に示されるように、REC228からの再構成のビデオデータは、IQ224とIT226を含む一連の処理を受け、且つ、激しいシフトが発生する。再構成のビデオデータは、さらに、非ブロック化フィルター(DF)230、および、サンプル適応オフセット(SAO)232により処理される。
【0008】
SAOのコンセプトは、それらの隣接画素値にしたがって、再構成画素をカテゴリに分類する。各カテゴリーは、その後、ビットストリームで符号化されたオフセット値が割り当てられ、各カテゴリーで、オフセットを再構成画素に加えることにより、再構成信号の歪みが減少する。HEVC標準化において、SAOツールは、二種の画素分類方法:バンドオフセット(BO)とエッジオフセット(EO)をサポートする。
【0009】
BOにおいて、図3に示されるように、画素大きさを量子化することにより、再構成画素が複数のバンドに分類される。その後、オフセット値が各バンドに生成されて、バンド中の再構成画素の歪みを減少させる。開始バンド位置により識別される一群のオフセットが選択されると共に、ビットストリームで符号化される。各カラーコンポーネント(luma またはchroma)において、SAOアルゴリズムは、一ピクチャを非重複領域に分割することができ、各領域は、B0(開始バンド位置を有する)、4個のEOタイプ(クラス)、および、非処理(OFF)の中から1つのSAOタイプを選択することができる。SAO分割はCTB境界と配列されて、CTB−ベース処理を促す。一ピクチャ中のオフセット値の総数は、領域分割と各領域により選択されるSAOタイプの数量に基づく。
【0010】
図4に示されるように、EOにおいて、EOタイプにより識別される方向に沿って、現在の画素とその隣接画素を比較することにより、再構成画素がカテゴリーに分類される。表1は、HEVCによるEO画素分類の決定をリストし、“c”は、分類された現在の画素を表す。現在の画素“c”の既存のHEVC標準化によるカテゴリーインデックス,cat_idxは以下により決定される:
【0011】
【数1】
【0012】
【数2】
【0013】
式中、“c1”と“c-1”は、図4に示される所定のEOタイプに対応する隣接画素である。異なる配向の隣接画素の選択による4個のEOタイプが図4でも示される。オフセット値が、各カテゴリー中の全画素に生成される。カテゴリーに対応する4個のオフセット値インデックス1から4は、それぞれ、HEVCで、一符号化ツリーブロック(CTB)に符号化される。
【0014】
【表1】
【0015】
EO分類のカテゴリーは、3個の連続サンプルに関連する物理的意味を有する。図5に示されるように、3個の隣接画素の状況が対応するカテゴリに示される。たとえば、カテゴリー1は谷に対応し、カテゴリー4は山に対応する。
【0016】
HEVCにおいて、ピクチャは、複数の非重複符号化ツリーユニット(CTU)に分割され、各CTUは、複数のCTBから構成され、各CTBはカラーコンポーネントに対応する。各CTBは非処理(SAO−OFF)を選択する、または、SAOタイプ、または、クラスのひとつを適用することができる(すなわち、開始バンド位置インデックスを有するBO、0度EO、90度EO、135度EO、および、45度EO)。サイド情報をさらに減少させるため、図6に示されるマージ構文を用いることにより、現在のCTBのSAOパラメータは、その上、または、左CTBのそれらを再利用することができる。SAO構文は、sao_merge_left_flag,sao_merge_up_flag,sao_type_idx_luma,sao_type_idx_chroma,sao_eo_class_luma,sao_eo_class_chroma,sao_band_position,sao_offset_absとsao_offset_signから構成される。構文sao_merge_left_flagは、現在のCTBが、左CTBのパラメータを再利用することを示す。構文sao_merge_up_flagは、現在のCTBが、上CTBのパラメータを再利用することを示す。構文sao_type_idxは、選択されたSAOタイプ(すなわち、それぞれ、lumaコンポーネントとchromaコンポーネントのsao_type_idx_lumaとsao_type_idx_chroma)を表す。構文sao_eo_class_lumaとsao_eo_class_chromaは、それぞれ、lumaとchromaに選択されたEOタイプを表す。構文sao_band_positionは、選択されたバンドの開始バンド位置を表す。cIdxは、3個のカラーコンポーネントのひとつを表す。さらに、SAO処理は、別々に、ビデオデータの異なるカラーコンポーネントに適用される。カラーコンポーネントは、(Y,Cb,Cr)、(Y,U,V)または(R,G,B)に対応する。
【0017】
構文sao_offset_absはオフセット大きさを表し、構文sao_offset_signはオフセットサインを表す。オフセット値SaoOffsetValは以下にしたがって決定される:
【0018】
【数3】
【0019】
式中、bitDepthは、ロウ画素の各コンポーネントに用いられるビットの数量で、sao_offset_signが1であるとき、offsetSignは−1に等しく、そうでなければ、1に等しい。以下により与えられたパラメータを有するトランケーティドライス(TR)二進化プロセスを用いて、既存のHEVC標準化にしたがって、構文sao_offset_absがエントロピー符号化される
【0020】
【数4】
【0021】
Riceパラメータにより、cRiceParamは0に等しい。トランケーティドライスコードは、ビデオ符号化の分野で広く知られている。TRコードは、トランケーテッドユーナリ(TU)コードにより表されるプレフィックス部分、および、固定長のコード名により表される切り捨てられない残りの部分を有する。
【0022】
図7は、現在のCTUが、左、または、上CTUと合併しないときのCTUレベルのSAO情報の符号化プロセスを示す図である。注意すべきことは、EOクラスとバンド位置は、一種のサブクラス、または、サブタイプで、SAOタイプ情報を記述することである。
【0023】
図7に示されるように、ステップ710において、SAOタイプ決定が行われる。それが、EOタイプである場合、符号なしのlumaオフセット(712)とlumaEOクラス(714)は、ビットストリームで符号化される。SAOタイプがBOである場合、符号つきのlumaオフセット(716)とlumaバンド位置(718)は、ビットストリームで符号化される。SAOタイプがオフである場合、その他のSAO情報はシグナリングされず、ステップ720に進む。クロマコンポーネンツの類似するSAO情報は以下である。クロマコンポーネンツがEOを選択する場合、符号なしのCbオフセット(722)、彩度EOクラス(724)、および、符号なしのCrオフセット(726)がシグナリングされる。クロマコンポーネンツがBOを選択する場合、符号つきのCbオフセット(732)、Cbバンド位置(734)、符号つきのCrオフセット(736)、および、Cbバンド位置(738)がシグナリングされる。SAOタイプは、クロマコンポーネンツのためにオフで、シグナリングされるその他のSAO情報はなく、プロセスはステップ740に進む。
【0024】
既存のHEVC標準化におけるSAOプロセスは、適応的に、局部的に強いオフセットを補償することにより、パフォーマンスを改善することができ、可能ならいつでも、パフォーマンスをさらに改善し、効率的ターゲット全体を達成することが望まれる。
【発明の概要】
【発明が解決しようとする課題】
【0025】
ビデオ符号化システムにおける再構成ピクチャのパフォーマンスを改善する修正されたSAO(sample-adaptive offset)の方法を提供することを目的とする。
【課題を解決するための手段】
【0026】
ビデオ符号化システムにおける再構成ピクチャのパフォーマンスを改善する修正されたSAO(sample-adaptive offset)の方法を提供する。一実施態様において、SAO−サインスレショルドが導入されて、現在の再構成画素と隣接再構成画素間の差異のサインを決定する。負のSAO−サインスレショルドより大きく、正のSAO−サインスレショルドより小さい差分値の範囲が割り当てられて、0のサイン値を有する。二個のSAOサインが、現在の再構成画素と二個の対応する隣接再構成画素間の二個の差に決定される。その後、現在の再構成画素のEO分類インデックスは、二個のSAOサインに基づいて決定される。その後、現在の再構成画素がSAO補償される。現在の再構成画素、および、二個の対応する隣接再構成画素は、水平方向、垂直方向、45度斜めの方向、または、135度斜めの方向で、3個の連続画素に対応する。SAO−サインスレショルドに対応する構文要素は、ビットストリーム、たとえば、スライスヘッダーでシグナリングされる。SAO−サインスレショルドは、レート歪み最適化(RDO)工程にしたがって、ビデオ符号化システムのエンコーダー側で決定される。
【0027】
別の実施態様において、現在の再構成画素のEO分類インデックス、または、BO開始バンド位置に関連するSAO−オフセット値は、SAO−オフセットサイン、SAO−オフセット絶対値、および、SAO−ビット−シフト値にしたがって決定され、SAO−オフセット値は、SAO−ビット−シフト値を、SAO−オフセット絶対値に左方移動させることによる結果により、SAO−オフセットサインを増加させることにより生成される。現在の再構成画素に関連する量子化パラメータ(QP)が第一スレショルドより小さく、且つ、第一スレショルドがビデオデータのビット深度に基づくとき、SAO−ビット−シフト値は0に設定される。SAO−ビット−シフト値に対応する構文要素は、ビットストリーム、たとえば、スライスヘッダーでシグナリングされる。
【0028】
さらにその他の実施態様において、SAO−オフセット絶対値は、トランケーティドライス(TR)コードにより符号化され、最大TR値が構文要素により示される。別々の最大TR値は、ビデオ符号化システムのビデオデータの異なるカラーコンポーネントに用いられる。最大TR値の構文要素は、ビットストリームのピクチャレベル、または、スライスレベルでシグナリングされる。最大TR値は、レート歪み最適化(RDO)工程にしたがって、ビデオ符号化システムのエンコーダー側で決定される。
【0029】
上記の個別の修正SAO処理も結合できる。
【図面の簡単な説明】
【0030】
図1図1は、サンプル適応オフセット(SAO)処理を組み込んだ高効率ビデオコーディング(HEVC)標準に基づいたビデオ符号化システムのブロック図である。
図2図2は、サンプル適応オフセット(SAO)処理を組み込んだ高効率ビデオコーディング(HEVC)標準に基づいたビデオ復号システムのブロック図である。
図3図3は、高効率ビデオコーディング(HEVC)標準により用いられるバンドオフセット(BO)による、強度を複数のバンドに分割することによるサンプル適応オフセット(SAO)処理を示す図である。
図4図4は、高効率ビデオコーディング(HEVC)標準により用いられる0度、90度、135度と45度に対応する4個のエッジオフセット(EO)タイプを示す図である。
図5図5は、各種EOカテゴリーに対応する隣接画素特徴を示す図である。
図6図6は、隣接ブロックとシェアされるSAO情報で、現在のCTU(coding tree unit)は、左、または、上CTUのSAOパラメータを再利用することができることを示す図である。
図7図7は、現在のCTUが、左、または、上CTUと合併しないとき、符号化プロセスがCTU−レベルのSAO情報を送信することを示す図である。
図8図8は、本発明の一実施態様による配列レベルで、SAOビットシフトフラグを組み込む構文設計を示す図である。
図9図9は、本発明の一実施態様によるルマとクロマコンポーネンツのSAOビットシフト値をスライスヘッダーに組み込む構文設計を示す図である。
図10図10は、本発明の一実施態様による配列レベルで、ルマとクロマコンポーネンツのSAOビットシフト値を組み込む構文設計を示す図である。
図11図11は、本発明の一実施態様によるSAO−サインスレショルドを組み込んだ修正SAO処理のフローチャートである。
図12図12は、本発明の一実施態様による修正SAO処理を組み込んだ修正SAO修理のフローチャートで、SAO−オフセット値は、SAO−ビット−シフト値を、SAO−オフセット絶対値に左方移動させることによる結果により、SAO−オフセットサインを増加させることにより生成される。
図13図13は、本発明の一実施態様による修正SAO処理を組み込んだ修正SAO処理のフローチャートで、SAO−オフセット絶対値はトランケーティドライス(TR)コードにより符号化され、最大TR値は構文要素により示される。
【発明を実施するための形態】
【0031】
既存の高効率ビデオコーディング(HEVC)標準におけるSAO処理のパフォーマンスを改善するため、修正SAO処理が開示される。新しい構文要素の導入により、修正SAO処理は修正処理を含む。
【0032】
本発明による一実施態様において、修正されたSAOサイン決定が導入される。等式(1)と(2)に示されるように、既存のHEVC標準化によるSAOサインは、現在のサンプル(c)と隣接サンプル(c1またはc-1)間の基本的差異のサインである。よって、ゼロ値の基本的差異だけが、0値が割り当てられるその対応するsao_signを有する。本発明の実施態様は、SAO−サインスレショルドsao_sign_threを導入することにより、0値が割り当てられる基本的差異のデータ範囲を拡大する。本発明の実施態様による基本的差異のSAOサインは、以下の等式にしたがって決定される:
【0033】
【数5】
【0034】
可変saoSignThreは、構文要素sao_sign_threにより特定される。
【0035】
したがって、saoSignThreより大きく、saoSignThreより小さい値を有する基本的差異は、0値が割り当てられるsao_signを有する。同時に、sao_sign値1と−1に関連するデータ範囲が減少する。構文要素sao_sign_threが、EOタイプの画素分類の修正SAO処理中に用いられる。適切なsao_sign_thre値が、一シーケンス、ピクチャ、スライス、または、その他のピクチャユニットに選択されて、パフォーマンス改善を達成する。たとえば、エンコーダーは、レート歪み工程を用いて、最高のパフォーマンスを達成するsao_sign_thre値を決定する。修正SAO処理にしたがった現在の画素“c”のカテゴリーインデックスcat_idxは、HEVC標準化と同じ方式で決定され、すなわち:
【0036】
【数6】
【0037】
別の実施態様において、既存のHEVC標準化のSAO処理の第二修正が関係して、SAOオフセット値SaoOffsetValを表す。構文要素sao_bit_shiftが、修正SAO処理に用いられて、以下のように、オフセット値SaoOffsetValを表す:
【0038】
【数7】
【0039】
可変saoBITShiftは、構文要素sao_bit_shiftにより特定される。一方、既存のHEVC標準化により、SaoOffsetValを得る左方移動操作の値は(bitDepth-Min(bitDepth,10)である。新しい構文要素sao_bit_shiftと一緒に、SAOオフセット値を得る修正されたSAO操作は、パフォーマンス改善、特に、高サンプルビット深度の改善を助けることができる。SAO処理に対するこの第二修正は、エッジオフセット(EO)、バンドオフセット(BO)、または、両方に適用される。
【0040】
本発明の一実施態様によるsao_bit_shiftをシグナリングするサンプル構文設計が、図8図9で示される。図8において、SAO有効フラグsample_adaptive_offset_enabled_flagにより示されるように、SAOが有効であるとき、SAOビットシフトフラグadaptive_sao_bit_shift_active_flagが、シーケンスパラメータセットRBSP(raw byte sequence payload)構文に組み込まれる。関連する構文要素は、図8中で、参照符号810により示される。SAOビットシフトフラグが1の値を有する場合、それは、sao_luma_bit_shiftとsao_chroma_bit_shiftが、スライスセグメントヘッダー中に提示されることを意味する。SAOビットシフトフラグが0値を有する場合、それは、sao_luma_bit_shiftとsao_chroma_bit_shiftが、スライスセグメントヘッダー中に提示されないことを意味する。提示されない場合、SAOビットシフトフラグの値は0であると推定される。構文要素sao_luma_bit_shiftは、サンプルのSAOオフセット値を生成するのに用いられるパラメータを特定する。一実施態様において、sao_luma_bit_shiftの値は、0からBITDepthY-6を含めた範囲にある。提示されない場合、sao_luma_bit_shiftの値は、bitDepthY - Min(bitDepthY,10)であると推定される。構文要素sao_chroma_bit_shiftは、chromaサンプルのSAOオフセット値を生成するのに用いられるパラメータを特定する。sao_chroma_bit_shiftの値は、0からBITDepthC-6を含めた範囲にある。提示されない場合、sao_chroma_bit_shiftの値は、bitDepthC -Min(bitDepth C,10)であると推定される。図9において、サンプル構文設計を説明し、参照符号910に示されるように、スライスセグメントヘッダー中にsao_luma_bit_shiftとsao_chroma_bit_shiftを組み込む。
【0041】
図10は、本発明の一実施態様を組み込んだその他のサンプル構文設計を示す図で、参照符号1010により示されるように、sao_luma_bit_shiftとsao_chroma_bit_shiftは、ピクチャパラメータセットRBSP中に組み込まれる。SAOビットシフトも、ビデオビットストリームのその他の位置、たとえば、配列レベルに組み込まれる。
【0042】
HEVC標準化において、絶対的オフセット値は、等式(4)と0に設定されるRiceパラメータ(cRiceParam)セットにしたがって、最大可能値(cMax)セットを有するトランケーティドライス(TR)コードを用いて符号化される。本発明の一実施態様による修正SAO処理は、新しい構文要素sao_offset_maxを用いて、最大オフセット値(cMax)を直接示す。特定されるcMaxとcRiceParamは以下で示され、構文要素sao_offset_absは、トランケーティドライス(TR)二進化プロセスを用いて、エントロピー符号化される。
【0043】
cMax = saoOffsetMax, and cRiceParam = 0
可変saoOffsetMaxは、構文要素sao_offset_maxにより特定される。
【0044】
現在の再構成画素に関連する量子化パラメータ(QP)がスレショルドより小さいとき、SAO−ビット−シフト値は0に設定される。たとえば、スレショルドは、ビデオデータのビット深度に基づき、小さいスレショルドは大きいビット深度に用いられる。
【0045】
修正SAO処理による本発明の一実施態様を組み込んだビデオ符号化システムのパフォーマンスは、それぞれ、各種符号化段(主、高、および、超高段)で、全イントラ、ランダムアクセス、および、低遅延Bピクチャ符号化設定の表2−4に示されるHTM−10.0に基づいて、従来のシステムパフォーマンスと比較される。BDレート差は、個別のビデオコンポーネント(Y,UとV)に示される。BDレートの負の値は、本発明がよいパフォーマンスを有することを示す。表2−4に示されるように、本発明の一実施態様を組み込んだ個別のコンポーネント(Y,UとV)のBDレートは、0.1%から1.6%に減少する。
【0046】
【表2】
【0047】
【表3】
【0048】
【表4】
【0049】
sao_luma_bit_shiftとsao_chroma_bit_shiftを用いた本発明の一実施態様を組み込んだ16ビットと12ビットで、高ビット深度を有するビデオ符号化システムのパフォーマンスが、それぞれ、全イントラ、および、低遅延符号化設定の表5と表6で示されるように、HTM−10.0に基づいた従来のパフォーマンスと比較される。パフォーマンス比較は、第一カラムでリストされた異なる組のテストデータに基づく。表5に示されるように、本発明の一実施態様を組み込んだ個別のコンポーネント(Y/G,Cb/BとCr/R)のBDレートは、全イントラ設定において、従来のHEVCとほぼ同じである。しかし、表6に示されるように、本発明の一実施態様を組み込んだ個別のコンポーネント(Y/G,Cb/BとCr/R)のBDレートは、低遅延Bピクチャ設定において、0.1%から3.3%減少する。
【0050】
【表5】
【0051】
【表6】
【0052】
図11は、本発明の一実施態様によるSAOサインスレショルドを用いたSAO処理のフローチャートである。ステップ110において、システムは、再構成ピクチャに関連する入力データを受信する。再構成ピクチャは、メモリから回収されるか、または、プロセッサから受信される。ステップ1120において、現在の再構成画素と第一隣接再構成画素間の第一差異、および、現在の再構成画素と第二隣接再構成画素間の第二差異が決定される。ステップ1130に示されるように、第一差異とSAO−サインスレショルドに基づく第一SAOサインが決定され、第一差異が、SAO−サインスレショルド以上である場合、第一SAOサインは1に等しい、および、第一差異が、負のSAO−サインスレショルド以下である、第一SAOサインはー1に等しい、および、第一差異の絶対値が、SAO−サインスレショルドより小さい場合、第一SAOサインは0に等しい。第二差異に基づいた第二SAOサインとSAO−サインスレショルドが、ステップ1140において決定され、第二差異が、SAO−サインスレショルド以上である場合、第二SAOサインは1に等しい;第二差異が、負のSAO−サインスレショルド以下である場合、第二SAOサインはー1に等しい、および、第二差異の絶対値が、SAO−サインスレショルドより小さい場合、第二SAOサインは0に等しい。ステップ1150に示されるように、第一SAOサインと第二SAOサインにしたがって、現在の再構成画素のEO分類インデックスが決定される。その後、ステップ1116において、EO分類インデックスに関連するSAO−オフセット値を、現在の再構成画素に加えることにより、現在の再構成画素が補償される(ステップ1160)。
【0053】
図12は、本発明の一実施態様による修正SAO処理を組み込んだ修正SAO処理のフローチャートで、SAO−オフセット値は、SAO−ビット−シフト値を、SAO−オフセット絶対値に左方移動させることによる結果により、SAO−オフセットサインを増加させることにより生成される。再構成ピクチャに関連する入力データがステップ1210で受信される。ステップ1220において、現在の再構成画素のBOのEO分類インデックス、または、開始バンド位置は、現在の再構成画素、および、隣接再構成画素に基づいて決定される。ステップ1230において、SAO−オフセットサイン、SAO−オフセット絶対値、および、SAO−ビット−シフト値にしたがって、現在の再構成画素のEO分類インデックス、または、BO開始バンド位置に関連するSAO−オフセット値が決定される。SAO−オフセット値は、SAO−ビット−シフト値を、SAO−オフセット絶対値に左方移動させることによる結果により、SAO−オフセットサインを増加させることにより生成される。その後、ステップ1240に示されるように、EO分類インデックス、または、BO開始バンド位置に関連するSAO−オフセット値を、現在の再構成画素に加えることにより、現在の再構成画素が補償される。
【0054】
図13は、本発明の一実施態様による修正SAO処理を組み込んだ修正SAO処理のフローチャートであり、SAO−オフセット絶対値は、トランケーティドライス(TR)コードにより符号化され、最大TR値は構文要素により表される。ステップ1310において、再構成ピクチャに関連する入力データが受信される。ステップ1320において、EO分類インデックスに関連するSAO−オフセット値が決定され、各SAO−オフセット値の絶対値は、トランケーティドライス(TR)コードにより符号化され、最大TR値は構文要素により示される。ステップ1330に示されるように、現在の再構成画素、および、隣接再構成画素に基づいて、現在の再構成画素の現在のEO分類インデックスが決定される。その後、ステップ1340に示されるように、EO分類インデックスに関連するSAO−オフセット値を、現在の再構成画素に加えることにより、現在の再構成画素が補償される。
【0055】
上述のフローチャートは、本発明による修正SAO処理の例を説明することが目的である。当業者は、精神と領域を脱しない範囲内で、本発明の各ステップを修正、ステップを再アレンジ、ステップを分割、または、ステップを組み合わせて、本発明を実行することができる。
【0056】
上の記述が提示されて、当業者が、特定のアプリケーションとその要求の文脈で提供されるように、本発明を実施できるようにする。当業者なら、上記実施態様に対する各種修正が理解でき、ここで定義される一般定義は、その他の実施態様に適用される。よって、本発明は、示される特定の実施態様や記述に限定されるものではなく、原理と新規特徴と一致する幅広い領域が認められる。上述の詳細な記述において、各種特定の詳細が説明されて、本発明の十分な理解を提供する。それでもなお、当業者なら、本発明が実行できることが理解できる。
【0057】
上記の本発明の実施態様は、各種ハードウェア、ソフトウェアコード、または、それらの組み合わせで実行される。たとえば、本発明の一実施態様は、ビデオ圧縮チップに整合される回路、または、ビデオ圧縮ソフトウェア中に整合されるプログラムコードで、記述される処理を実行する。本発明の一実施態様は、また、デジタルシグナルプロセッサ(DSP)で実行されるプログラムコードで、記述される処理を実行する。本発明は、さらに、コンピュータプロセッサ、デジタルシグナルプロセッサ、マイクロプロセッサ、または、フィールドプログラマブルゲートアレイ(FPGA)により実行される複数の機能を含む。これらのプロセッサは、本発明により具体化される特定の方法を定義する機械可読ソフトウェアコード、または、ファームウェアコードを実行することにより、本発明による特定のタスクを実行するように設定される。ソフトウェアコード、または、ファームウェアコードは、異なるプログラミング言語と異なるフォーマットやスタイルで開発される。ソフトウェアコードは、さらに、異なる標的プラットフォームにコンパイルされる。しかし、本発明によるソフトウェアコードの異なる符号化フォーマット、スタイル、および、言語、および、コードを設定して、タスクを実行するその他の手段は、本発明の精神と領域を脱しない。
【0058】
本発明では好ましい実施例を前述の通り開示したが、これらは決して本発明に限定するものではなく、当該技術を熟知する者なら誰でも、本発明の精神と領域を脱しない範囲内で各種の変動や潤色を加えることができ、従って本発明の保護範囲は、特許請求の範囲で指定した内容を基準とする。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13