IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ビゴ テクノロジー ピーティーイー. リミテッドの特許一覧

<>
  • 特表-動画予測符号化の方法および装置 図1
  • 特表-動画予測符号化の方法および装置 図2
  • 特表-動画予測符号化の方法および装置 図3
  • 特表-動画予測符号化の方法および装置 図4
  • 特表-動画予測符号化の方法および装置 図5
  • 特表-動画予測符号化の方法および装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-17
(54)【発明の名称】動画予測符号化の方法および装置
(51)【国際特許分類】
   H04N 19/107 20140101AFI20240110BHJP
【FI】
H04N19/107
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023535762
(86)(22)【出願日】2021-12-03
(85)【翻訳文提出日】2023-06-12
(86)【国際出願番号】 CN2021135248
(87)【国際公開番号】W WO2022121787
(87)【国際公開日】2022-06-16
(31)【優先権主張番号】202011461361.8
(32)【優先日】2020-12-11
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】320010240
【氏名又は名称】ビゴ テクノロジー ピーティーイー. リミテッド
【住所又は居所原語表記】30 PASIR PANJANG ROAD,#15-31A,MAPLETREE BUSINESS CITY,SINGAPORE 117440
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】崔 同兵
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159TA18
5C159TB08
5C159TC08
5C159TC19
(57)【要約】
動画予測符号化の方法および装置を開示する。前記方法は、フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含むことと、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することと、を含む。
【特許請求の範囲】
【請求項1】
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含むことと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することと、
を含む、
動画予測符号化の方法。
【請求項2】
前記段階最適モードのコストは、段階最適モードのアダマール変換後差分絶対値合計SATDコストを含み、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
前記予測ユニットに対してフレーム内予測モードのSATD粗選択決定を行うことにより、最適なフレーム内予測モードのSATDコストを確定することと、
前記予測ユニットのサイズに基づいて、前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断することと、
を含む、
請求項1に記載の方法。
【請求項3】
前記予測ユニットのサイズは、NxNであり、前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断することは、
最初の4x4サイズの予測ユニットが変換スキップモードを採用するか否かを判断することと、
判断結果及び前記段階最適モードのSATDコストに基づいてモードコスト閾値を確定することと、
前記最適なフレーム内予測モードのSATDコストが前記モードコスト閾値より大きいと確定することに応答して、前記フレーム内予測モードの後続フローをスキップすることと、
を含み、
ここで、Nは正の整数である、
請求項2に記載の方法。
【請求項4】
前記判断結果及び前記段階最適モードのSATDコストに基づいてモードコスト閾値を確定することは、
最初の4x4サイズの予測ユニットが変換スキップモードを採用すると確定することに応答して、前記モードコスト閾値を、前記段階最適モードのSATDコストと第1の調整係数との積として確定することと、
最初の4x4サイズの予測ユニットが変換スキップモードを採用しないと確定することに応答して、前記モードコスト閾値を、前記段階最適モードのSATDコストと第2の調整係数との積として確定し、前記第2の調整係数は、前記第1の調整係数より小さいことと、
を含む、
請求項3に記載の方法。
【請求項5】
前記予測ユニットのサイズが2Nx2Nであり、前記実行されたモードが符号化ユニット再帰モードを含むと確定することに応答して、前記実行済みモード情報が、現在の符号化ユニットに対応する符号化サブブロックがフレーム内予測サブブロックである比率を含むと確定し、ここで、前記フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックであり、
前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断することは、
前記最適なフレーム内予測モードのSATDコストが前記段階最適モードのSATDコストより大きく、且つ前記比率がプリセット比率閾値より小さいと確定することに応答して、前記フレーム内予測モードの後続フローをスキップすることを含み、
ここで、Nは正の整数である、
請求項2に記載の方法。
【請求項6】
前記段階最適モードのコストは、段階最適モードのレート歪み最適化RDOコストを含み、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
前記実行されたモードが符号化ユニット再帰モードを含むか否かを判断することと、
判断結果を参照し、前記段階最適モードと前記段階最適モードのRDOコストのうちの少なくとも1つに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することと、
を含む、
請求項1に記載の方法。
【請求項7】
前記実行されたモードが符号化ユニット再帰モードを含むと確定することに応答して、前記実行済みモード情報は、現在の符号化ユニットに対応する符号化サブブロックのRDOコスト総和、現在の符号化ユニットが全ゼロブロックであるか否かを示すための第1のフラグ情報、及び現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在するか否かを示すための第2のフラグ情報のうちの少なくとも1つをさらに含み、前記フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックであり、
前記判断結果を参照し、前記段階最適モードと前記段階最適モードのRDOコストのうちの少なくとも1つに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
以下の条件の少なくとも1つを満たすと確定することに応答して、前記決定プロセスのフレーム内予測モードをスキップすることを含み、前記条件は、以下の通りであり、即ち、
前記RDOコスト総和は、前記段階最適モードのRDOコストより大きく、
前記第1のフラグ情報は、現在の符号化ユニットが全ゼロブロックであることを示し、
前記第2のフラグ情報は、現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在しないことを示す、
請求項6に記載の方法。
【請求項8】
前記実行されたモードが符号化ユニット再帰モードを含まないと確定することに応答して、前記判断結果を参照し、前記段階最適モードと前記段階最適モードのRDOコストのうちの少なくとも1つに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
前記段階最適モードがスキップSKIPモードであると確定することに応答して、フレーム内予測モードをスキップすることを含む、
請求項6に記載の方法。
【請求項9】
前記段階最適モードのコストは、段階最適モードのSATDコストをさらに含み、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することの後、
前記決定プロセスのフレーム内予測モードをスキップしないという判断結果に基づいて、現在の符号化ユニットに対して2Nx2Nのフレーム内符号化を行い、2Nx2Nフレーム内SATDコストを得ることと、
前記2Nx2Nフレーム内SATDコストが前記段階最適モードのSATDコストより大きいと確定することに応答して、NxNのフレーム内予測モードをスキップすることと、
をさらに含む、
請求項6から8のいずれか1項に記載の方法。
【請求項10】
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定するように構成され、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む実行済みモード情報確定モジュールと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断するように構成されるフレーム内予測モードスキップ判定モジュールと、
を含む、
動画予測符号化の装置。
【請求項11】
メモリ、プロセッサ、およびメモリに記憶され且つプロセッサ上で実行可能なコンピュータプログラムを含み、前記プロセッサが前記プログラムを実行する際に、請求項1から9のいずれか1項に記載の方法を実現する電子デバイス。
【請求項12】
コンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサによって実行される際に、請求項1から9のいずれか1項に記載の方法を実現するコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、2020年12月11日に中国特許庁に提出された出願番号202011461361.8の中国特許出願の優先権を主張し、その全ての内容は参照により本発明に援用する。
【0002】
本発明の実施例は、動画符号化技術に関し、例えば動画予測符号化の方法及び装置に関するものである。
【背景技術】
【0003】
高効率動画符号化(High Efficiency Video Coding、HEVC)は、最新世代の動画符号化規格であり、H.264に比べてHEVCの圧縮効率を2倍に高めることができる。HEVCは、圧縮率の向上を実現するために多くの複雑な技術を採用し、具体的には、(1)、HEVCは、4分木のブロック分割方法を採用し、各ブロックは符号化ユニット(Coding Unit、CU)と呼ばれ、CUは最大64x64になり、各CUは4つのサブCUに再帰的に分割されることができ、CUは最小8x8になり、したがって、HEVCのブロック分割方式はH.264よりも柔軟性があり、ブロックの種類が多い。(2)、HEVCは、各CUに対してより多くの予測モードを試すことができ、予測モードのそれぞれは1つの予測ユニット(Prediction Unit、PU)に対応し、予測モードには、フレーム間予測モード(Merge&Skip_2Nx2N、Inter_2Nx2N、Inter_2NxN、Inter_Nx2N、Inter_2NxnU、Inter_2NxnD、Inter_nLx2N、Inter_nRx2N、Inter_NxNなどを含む)とフレーム内予測モード(Intra_2Nx2N、Intra_NxNを含む)の2種類がある。Iフレームは、フレーム内予測モードのみを使用でき、P、Bフレームは、すべての予測モードを使用できる。HEVCが各モードの符号化コストを計算し、その中から符号化コストが最も小さい予測モードを選ぶことで、より高い圧縮効果を達成することができる。
【0004】
HEVCのP、Bフレームにおいて、フレーム内予測モードも非常に重要な予測モードである。動きのシーケンスについて、動きが新しいシーンの出現と古いシーンの消失を伴うため、各フレームには、他のフレームでは合致するブロックを見つけることができない符号化ユニットが含まれ、このような符号化ユニットについて、フレーム内予測を用いた予測効果がフレーム間予測より顕著に優れている可能性がある。しかし、全体的に見ると、ほとんどの符号化ユニットが時間領域上の隣接フレームで合致するブロックを見つけることができるので、P、Bフレームにおいてフレーム内予測による選定の割合が相対的に低い。
【0005】
HEVCのフレーム内予測モードは、H264よりも大幅に改善され、HEVCが33個の方向予測モードと2個の非方向予測モード(Planarと直接(Direct Current、DC)モード)をサポートし、H264では8個の方向予測モードしかないため、HEVCのIntraがH264よりもはるかに複雑であり、予測モードごとにレート歪みコスト(RD cost)計算を行う必要があり、このようなモード決定のプロセスについて、計算は複雑であり、時間オーバーヘッドは非常に大きい。したがって、不要なレート歪み最適化(Rate-Distortion Optimation、RDO)モード選択を減らすことができれば、エンコーダのリソースオーバーヘッドを大幅に削減することができ、さらに符号化速度を向上させ、符号化コストを削減することができる。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明では、関連技術におけるフレーム間符号化プロセスにおいてフレーム内予測モードを行うことによって、符号化率の消費が高く、符号化効率が低く、符号化コストが高い場合を回避するために、動画予測符号化の方法及び装置を提供する。
【0007】
第1の側面において、本発明の実施例は、
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含むことと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することと、
を含む、
動画予測符号化の方法に関する。
【0008】
第2の側面において、本発明の実施例は、
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定するように構成され、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む実行済みモード情報確定モジュールと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断するように構成されるフレーム内予測モードスキップ判定モジュールと、
を含む、
動画予測符号化の装置に関する。
【0009】
第3の側面において、本発明の実施例は、メモリ、プロセッサ、およびメモリに記憶され且つプロセッサ上で実行可能なコンピュータプログラムを含み、前記プロセッサが前記プログラムを実行する際に、上記の方法を実現する電子デバイスに関する。
【0010】
第4の側面において、本発明の実施例は、コンピュータプログラムが記憶され、当該プログラムがプロセッサによって実行される際に、上記の方法を実現するコンピュータ可読記憶媒体に関する。
【図面の簡単な説明】
【0011】
図1】本発明の一実施例による動画予測符号化の方法実施例のフローチャートである。
図2】本発明の一実施例によるフレーム間PUモードの決定プロセスの概略図である。
図3】本発明の一実施例によるIntraモードスキップ判定のフローチャートである。
図4】本発明の一実施例による別のIntraモードスキップ判定のフローチャートである。
図5】本発明の一実施例による動画予測符号化の装置実施例の構造ブロック図である。
図6】本発明の一実施例による電子デバイスの構造概略図である。
【発明を実施するための形態】
【0012】
以下、図面および実施例を参照して本発明をさらに詳細に説明する。本明細書に記載された具体的な実施例は、本発明を限定するものではなく、本発明を説明するためにのみ使用されることが理解される。なお、説明を容易にするために、図面には、構成全体ではなく、本発明に関連する部分のみが示されている。
【0013】
図1は、本発明の一実施例による動画予測符号化の方法実施例のフローチャートであり、本実施例は、動画符号化における予測符号化の段階に適用することができ、予測符号化とは、符号化された1つまたは複数のサンプル値を用いて、あるモデルまたは方法に基づいて、現在のサンプル値を予測し、サンプルの真の値と予測値との差に対して符号化を行うことを意味し、元の画素値ではなく予測後の残差に対して変換、量子化、エントロピー符号化を行うことにより、符号化効率を大幅に向上させることができる。予測符号化は、フレーム内予測Intraモードとフレーム間予測Interモードを含み得て、Iフレームは、Intraモードのみを使用でき、P、Bフレームは、すべての予測モードを使用できる。
【0014】
HEVCのP、Bフレームにおいて、Intraモードも非常に重要な予測モードであり、Intraモードは、動画空間冗長性を除去するために、主に動画空間領域画素の相関を利用し、符号化された画素を使用して現在の画素を予測する。HEVCでは輝度成分のフレーム内符号化は4x4、8x8、16x16、32x32、64x64の5種類のPUがあり、ここで、各サイズのPUは35種類の予測モード、即ちDC、Planar及び33種類の角度モードに対応し、色度成分は5種類の予測モード、即ちDC、Planar、水平、垂直、輝度成分に対応する予測モードがある。予測モードごとにRD cost計算を行う必要があり、このようなモード決定のプロセスについて、計算は複雑であり、時間オーバーヘッドは非常に大きい。フレーム内PU高速アルゴリズムにより不要なRDOモード選択を減らすことができれば、エンコーダのリソースオーバーヘッドを大幅に削減することができ、さらに符号化速度を向上させ、符号化コストを削減することができる。
【0015】
これに基づいて、本実施例では、フレーム間符号化を行う際に、フレーム内モードを迅速に処理することができる。エンコーダのフレーム間符号化プロセスにおけるフレーム内モード決定の複雑さを簡略化することにより、エンコーダの圧縮速度を向上させることができ、エンコーダの圧縮速度を向上させた後、トランスコードサービスのスループットを高めることができ、さらにサーバリソースを節約し、トランスコードコストを削減することができる。
【0016】
なお、本実施例で言及した方法は、ブロックに準拠する任意の混合符号化アーキテクチャに適用することができ、HEVC符号化標準を満たすエンコーダはすべて適用することができ、その他の例えばAVS1、H.264、VP8、VP9、AVS2、AVS3、AV1、VVCなどの標準を満たすエンコーダは、調整後に直接に使用されることもできる。本実施例で言及したエンコーダは、トランスコードサービスだけでなく、モバイル側のリアルタイム符号化サービスにも適用できる。
【0017】
本実施例は、以下のステップを含み得る。
【0018】
ステップ110では、フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む。
【0019】
ステップ120では、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断する。
【0020】
一例示的な実施例では、図2を参照すると、フレーム間PUモードの決定プロセスの概略図を示し、フレーム間PUモードの決定プロセスは、以下のプロセスを含み得る。
【0021】
まず、2Nx2NレベルのMERGE/SKIPモードを行い、再帰条件を満たす場合、CU再帰モードを実行し、再帰完了後、現在のブロックサイズCUに戻り、フレーム内予測Intraモードを実行し続け、Intra完了後、2Nx2Nのフレーム間モードを実行し(前方向探索、後方向探索をそれぞれ行って最適なマッチングブロックを選出する)、その後、2NxNのBIDIRを実行し(双方向探索のみを行って最適なマッチングブロックを得る)、その後、2NxNおよびNx2Nモードタイプを実行し続ける。1種類のモードが終わるたびに1回のモード判定が行われ、段階最適モードtempBestModeが得られる。ここで、Nは正の整数である。
【0022】
Nx2Nを実行した後、
tempBestMode == 2NxNの場合、2NxnU、2NxnDを実行し続け、比較して最終的な最適モードBestModeを得る。
tempBestMode == Nx2Nの場合、nLx2N、nRx2Nを実行し続け、比較して最終的な最適モードBestModeを得る。
tempBestMode!= 2NxN && tempBestMode!= Nx2Nの場合、2NxnU、2NxnD、nLx2N、nRx2Nを実行し続け、比較して最終的な最適モードBestModeを得る。
【0023】
なお、現在のブロックがCU再帰を行なった場合、BestModeのコストと再帰コストを比較して、CU再帰分割を行うか否かを決定する。
【0024】
また、2NxN、Nx2N、2NxnU、2NxnD、nLx2N、nRx2Nなどのモードは2つのPUを含み、各PUは、最適なマッチングブロックを得るために、いずれもMERGE/SKIP、前後方向探索、双方向探索を行う必要がある。
【0025】
本実施例では、上記の決定プロセスに対して、現在のPUに対してフレーム間予測モードの最適モード決定を行う際に、すでに実行されたモードに基づいて、対応する実行済みモード情報を取得し、当該実行済みモード情報に基づいて、上記決定プロセスにおけるフレーム内予測Intraモードをスキップするか否かを判断することができる。
【0026】
例示的には、実行済みモード情報は、段階最適モード及び当該段階最適モードのコストを含み得る。本実施例では、異なる実行済みモード情報に基づいて、異なる方法でIntraモードをスキップするか否かを判断する。
【0027】
一例示的な実施シーンでは、Intraモードをスキップすることは、Intraをスキップするプロセスの一部であってもよく、即ち、Intraモードを実行する場合、IntraができるだけRDOをしないようにIntraの内部決定に介入し、Intraモードの複雑さを低減して、符号化時間を節約する。Intraモードをスキップするか否かを確定するために、現在のPUのフレーム間符号化PU情報に基づいて、フレーム内高速モードの決定を直接に行うことができ、追加の計算量がなく、コストパフォーマンスが高い。
【0028】
一実施形態では、段階最適モードのコストは、段階最適モードのSATDコストを含み得て、図3に示されたように、ステップ120は、以下のサブステップを含み得る。
【0029】
サブステップS11では、前記予測ユニットに対してフレーム内予測モードのSATD粗選択決定を行うことにより、最適なフレーム内予測モードのSATDコストを確定する。
【0030】
一実施形態では、フレーム内予測モードを実行する場合、低複雑度のアダマール変換後差分絶対値合計(Sum of Absolute Transformed Difference、SATD)コストを使用して、使用可能なすべてのフレーム内予測モードからSATDコストが最も低い予測モードを最適なフレーム内予測モードとして選択することができる。
【0031】
サブステップS12では、前記予測ユニットのサイズに基づいて、前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断する。
【0032】
当該ステップでは、段階最適モードのSATDコストInterSATDCost及び最適なフレーム内予測モードのSATDコストRModeSATDCostを得た後、異なるサイズのPUに基づいて、Intraモードの後続フローをスキップするか否かを判断することができる。
【0033】
ここで、異なるサイズのPUは、2Nx2NのPUおよびNxNのPUを含み得て、2Nx2Nは64x64、32x32、16x16、8x8ブロック分割サイズのPUであり、NxNは4x4ブロック分割サイズのPUである。
【0034】
一実施例では、現在のPUのサイズがNxNである場合、サブステップS12は、以下のサブステップを含み得る。
【0035】
サブステップS121では、最初の4x4サイズの予測ユニットが変換スキップモードを採用するか否かを判断する。
【0036】
当該実施例では、現在のPUのサイズがNxNであり、NxNが比較的特殊なIntra符号化モードであると、8x8のブロック分割PUである場合、4つの4x4のPUに分割してそれぞれIntra符号化し続けることができる。一方、4x4のPU符号化には、変換スキップモード(Transform skip 、TSKIP)という特殊な符号化モードがある。
【0037】
変換スキップモードは、HEVCで導入された技術であり、その使用範囲は、フレーム内またはフレーム間の4x4ブロックであり、シーン変換が遅い動画シーケンスに顕著な効果があり、圧縮効率を高めることができる。分割して得られた4つの4x4のPUの変換スキップモードの間には一定の相関があるため、本実施例では最初の4x4のPUの変換スキップモードを用いて判断することができ、即ち最初の4x4サイズのPUに対応する変換ユニット(Transform Unit、TU)が変換スキップモードを採用して、Intraモードで実行されていない後続フローをスキップするか否かを決定することを判断する。
【0038】
サブステップS122では、判断結果及び前記段階最適モードのSATDコストに基づいてモードコスト閾値を確定する。
【0039】
一実施形態では、最初の4x4サイズのPUが変換スキップモードを採用する場合、モードコスト閾値を、段階最適モードのSATDコストと第1の調整係数との積として確定し、最初の4x4サイズのPUが変換スキップモードを採用しない場合、モードコスト閾値を、段階最適モードのSATDコストと第2の調整係数との積として確定し、ここで、第2の調整係数は、第1の調整係数より小さい。つまり、以下の式でモードコスト閾値を確定することができる。
SATDCostThreshold = firstTskip ? InterSATDCost * a1 : InterSATDCost* b1
【0040】
ここで、SATDCostThresholdは、モードコスト閾値であり、firstTskip?は、最初の4x4サイズのPUが変換スキップモードを採用するか否かの判断であり(即ち最初の4x4 PUがTSKIPブロックであるかどうか)、InterSATDCostは、段階最適モードのSATDコストであり、a1は第1の調整係数であり、b1は第2の調整係数である。
【0041】
firstTskipが1である場合、最初の4x4 PUがTSKIPブロックであることを示し、SATDCostThreshold= InterSATDCost * a1になり、firstTskipが0である場合、最初の4x4 PUがTSKIPブロックではないことを示し、SATDCostThreshold= InterSATDCost* b1になる。
【0042】
なお、TSKIPが符号化效率にプラスの影響を与えるため、もし第1のブロック4x4 PUがTSKIPであれば、後のブロックがTSKIPである確率が比較的高いので、モードコスト閾値を高くし、スキップを回避することができる。したがって、a1>b1を設定することができ、もちろん、実際のニーズに応じてa1、b1の具体的な大きさを設定することができ、例えば、a1を0.5に設定し、b1を0.3に設定することができる。
【0043】
サブステップS123では、前記最適なフレーム内予測モードのSATDコストが前記モードコスト閾値より大きい場合、前記フレーム内予測モードの後続フローをスキップする。
【0044】
モードコスト閾値が確定された後、最適なフレーム内予測モードのSATDコストと当該モードコスト閾値を比較し、最適なフレーム内予測モードのSATDコストがモードコスト閾値より大きい場合、フレーム内符号化を採用するためのコストが大きいことを示し、Intraモードの方が符号化率を無駄にしているので、Intraモードの後続フローをスキップすることができる。
【0045】
一実施形態では、調整係数を参照して判断条件を設定し、調整係数の設定により異なる加速ニーズを実現することができ、例えば、以下のような条件判定でIntraモードの後続フローをスキップするか否かを確定することができる。
if (RModeSATDCost * c > d * SATDCostThreshold )
skipIntra =true
【0046】
即ち、RModeSATDCost * cがd * SATDCostThresholdより大きい場合、Intraモードを実行するための符号化コストが大きいことを示し、Intraモードの後続フローをスキップすることができ、ここで、c、dは調整係数であり、実際のニーズに応じて設定することができ、例えば、c、dを1に設定することができる。
【0047】
別の実施例では、現在のPUのサイズが2Nx2Nである場合、その符号化再帰の状況を参照して、Intraモードの後続フローをスキップするか否かを判断することができる。図2に示されたように、実行されたモードがCU再帰モードを含む場合、実行済みモード情報は、現在のCUに対応する符号化サブブロックがフレーム内予測サブブロックである比率をさらに含み得て、ここで、フレーム内予測サブブロックは、決定された段階最適モードがフレーム内予測モードであるサブブロックである。例えば、現在のCUによって分割された4つのCUサブブロックに対して、ここで、この4つのCUサブブロックのうち予測された最適モードがIntraモードであるサブブロック(即ちIntraサブブロック)の数が1つである場合、比率が1/4になり、この4つのCUサブブロックのうち予測された最適モードがIntraモードであるサブブロックの数が2つである場合、比率が2/4になる。
【0048】
一例では、現在のPUのサイズが2Nx2Nである場合、サブステップS12は、以下のサブステップを含み得る。
【0049】
前記最適なフレーム内予測モードのSATDコストが前記段階最適モードのSATDコストより大きく、且つ前記比率がプリセット比率閾値より小さい場合、前記フレーム内予測モードの後続フローをスキップする。
【0050】
例えば、以下の式でIntraモードの後続フローをスキップするか否かを判断することができる。
if(RModeSATDCost * e > f * InterSATDCost && Ra < g)
skipIntra =true
【0051】
ここで、Raは、現在のCUに対応するCUサブブロックがIntraサブブロックである比率であり、e、f及びgはそれぞれ調整係数であり、実際のニーズに応じて設定することができ、例えば、e、f及びgをそれぞれ1、1及び0.75に設定することができる。
【0052】
上記の式に対して、RModeSATDCost * e > f * InterSATDCostの場合、フレーム内予測符号化を採用するためのコストが大きいことを示し、CUサブブロックのRaが低く、例えばg未満である場合、対応するCUにおいて最適モードがIntraモードである確率も低く、したがって、予測時間を節約し、符号化効率を向上させるために、Intraモードの後続フローを直接にスキップして、Intraモードの実行を早期に終了させることができる。
【0053】
他の実施例では、サブステップS11及びサブステップS12に基づいてIntraモードの後続フローをスキップしないと判定する場合、Intraの後続フローを実行し続けることができ、例えば、SATD粗選択によって選択された候補予測モードとMPM(Most Possible Mode、最も可能なモード)で候補予測モードセットを構成することができ、ここで、MPMは、隣接するPUのフレーム内予測モードから算出され、隣接するPUは、それぞれ上ブロック、左ブロック及び左上ブロックである。
【0054】
別の例示的な実施シーンでは、Intraモードをスキップすることは、Intraをスキップするプロセス全体であってもよく、符号化時間を節約するためにIntraを直接にしない。フレーム間最適モードの決定プロセスでは、段階最適モードの情報を直接に用いてIntraモードをスキップするか否かを判断することができ、段階最適モードは内容に応じて可変で、適応調整可能であり、ロバスト性が強い。
【0055】
一実施例では、段階最適モードのコストは、段階最適モードのRDOコストを含み得て、図4に示されたように、ステップ120は、以下のサブステップを含み得る。
【0056】
サブステップS21では、前記実行されたモードが符号化ユニット再帰モードを含むか否かを判断する。
【0057】
サブステップS22では、判断結果を参照し、前記段階最適モードおよび/または前記段階最適モードのRDOコストに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断する。
【0058】
一実施形態では、実行されたモードがCU再帰モードを含む場合、実行済みモード情報は、次のような情報の1つまたは組み合わせを含んでもよく、即ち、現在の符号化ユニットに対応する符号化サブブロックのRDOコスト総和、現在の符号化ユニットが全ゼロブロックであるか否かを示すための第1のフラグ情報、現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在するか否かを示すための第2のフラグ情報である。当該フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックである。サブステップS22は、以下のサブステップを含み得る。
【0059】
以下の条件の1つまたは組み合わせを満たす場合、決定プロセスのIntraモードをスキップする。
【0060】
条件1として、前記RDOコスト総和は、前記段階最適モードのRDOコストより大きい。
【0061】
実行されたモードがすべてRDOをしたモードなので、モードの実行が完了した後、対応するRDO情報(即ち実行済みモード情報)が得られる。
【0062】
CU再帰モードを実行した後、各CUサブブロックのRDOコストが得られ、全てのCUサブブロックのRDOコストの総和を計算することにより、RDOコスト総和(即ち再帰コスト)を得ることができる。RDOコスト総和が段階最適モードのRDOコストより大きい場合、再帰コストが段階の最適なコストより大きいことを示し、CU再帰分割を行わなくてもよく、これにより、符号化率が節約される。一方、Intraモードが符号化率を比較的に消費するので、RDOコスト総和が段階最適モードのRDOコストより大きいと判定した場合、Intraモードをスキップすることで符号化率を節約することができる。
【0063】
条件2として、前記第1のフラグ情報は、現在の符号化ユニットが全ゼロブロックであることを示す。
【0064】
当該条件では、第1のフラグ情報が、現在のブロックが全ゼロブロックであることを示す場合、全ゼロブロックによって消費された符号化率が比較的に低く、Intraモードが比較的に符号化率を消費し、両者が矛盾し、全ゼロブロックにおける最適モードがIntraモードである確率も低いため、現在のブロックが全ゼロブロックであると判定した場合、Intraモードをスキップすることができる。
【0065】
条件3として、前記第2のフラグ情報は、現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在しないことを示す。
【0066】
当該条件では、サブブロックにIntraサブブロックが存在しない(即ちサブブロックに予測された最適モードがIntraモードであるサブブロックが存在しない)場合、現在のブロックの最適モードがIntraモードである確率も低いので、サブブロックにIntraサブブロックが存在しないと判定した場合、Intraモードを直接にスキップすることができる。
【0067】
他の実施形態では、判定の精度を高め、損失lossを低減するために、上記の3つの条件を組み合わせて判定を行うことができ、例えば、条件1と条件2を組み合わせ、条件1と条件2を同時に満たす場合、Intraモードをスキップし、以下の条件判断式に示すようになる。
【数1】
【0068】
ここで、
【数2】
は、CUサブブロックのRDOコストを示し、
【数3】
は、サブブロックのRDOコスト総和を示す。BestModeRdCostは、段階最適モードのRDOコストであり、BestMode->CBFは、第1のフラグ情報を示し、現在のブロックの符号化の後に全ゼロブロックであるかどうかを示し、splitIntraは、第2のフラグ情報を示し、サブブロックにIntraブロックが存在するかどうかを示し、a2とb2はそれぞれ調整係数であり、実際のニーズに応じて調整することができ、例えば、a2とb2はデフォルトで1に設定できる。
【0069】
上記の条件判断式では、「
【数4】
」が同時に成立し、即ち現在のブロックが全ゼロブロックであり、且つRDOコスト総和が段階最適モードのRDOコストより大きい場合、Intraモードをスキップする。または、サブブロックにIntraブロックが存在しない場合でも、Intraモードをスキップする。
【0070】
別の実施形態では、実行されたモードがCU再帰モードを含まない場合、サブステップS22は、以下のサブステップを含み得る。
【0071】
前記段階最適モードがスキップSKIPモードである場合、フレーム内予測モードをスキップする。
【0072】
当該実施例では、SKIPモードが比較的に符号化率を節約し、Intraモードが比較的に符号化率を消費するので、符号化率を節約するために、実行されたモードに基づいて段階最適モードがSKIPモードであると確定する場合、Intraモードを直接にスキップすることができる。
【0073】
他の実施例では、上記のサブステップS21及びサブステップS22を経てもIntraモードをスキップできない場合、本実施例は以下のステップをさらに含み得る。
【0074】
現在の符号化ユニットに対して2Nx2Nのフレーム内符号化を行い、2Nx2Nフレーム内SATDコストを得て、前記2Nx2Nフレーム内SATDコストが前記段階最適モードのSATDコストより大きい場合、NxNのフレーム内予測モードをスキップする。
【0075】
当該実施例では、上記のサブステップS21及びサブステップS22を経てもIntraモードをスキップできない場合、まず現在のCUに対して2Nx2NのIntra符号化を行い、2Nx2N Intra SATDコストを得て、次に2Nx2N IntraSATDコストと段階最適モードのSATDコストを比較して、NxNのIntraモードをスキップするか否かを判断する。
【0076】
例えば、以下の判断式でNxNのIntraモードをスキップするか否かを判断する。
if( a3* Intra2Nx2NSATDCost > b3 * BestModeSATDCost )
skipIntraNxN =true
【0077】
ここで、Intra2Nx2NSATDCostは、2Nx2N Intra SATDコストであり、BestModeSATDCostは、段階最適モードのSATDコストであり、a3とb3はそれぞれ調整係数であり、実際のニーズに応じて設定することができ、例えば、a3とb3を10と11に設定できる。
【0078】
本実施例では、フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定することができ、当該実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む。そして、取得した実行済みモード情報に基づいて、当該決定プロセスのフレーム内予測モードをスキップするか否かを判断することで、Intraモードの消費を低減し、エンコーダのリソースオーバーヘッドを大幅に削減することができ、さらに符号化速度を向上させ、符号化コストを削減することができる。本実施例におけるIntraモードをスキップするという判定により、エンコーダ圧縮率が0.2%損失する条件下で、符号化速度を15%向上させることができる。オンライントランスコードアプリケーションの観点から、わずかな画質損失でサーバのコンピューティングリソースを15%節約し、さらにトランスコードコストを削減することができる。
【0079】
図5は、本発明の一実施例による動画予測符号化の装置実施例の構造ブロック図であり、以下のモジュールを含み得る。
【0080】
実行済みモード情報確定モジュール510は、フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む。
【0081】
フレーム内予測モードスキップ判定モジュール520は、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断する。
【0082】
一実施形態では、前記段階最適モードのコストは、段階最適モードのSATDコストを含み、前記フレーム内予測モードスキップ判定モジュール520は、以下のサブモジュールを含み得る。
【0083】
SATD粗選択サブモジュールは、前記予測ユニットに対してフレーム内予測モードのSATD粗選択決定を行うことにより、最適なフレーム内予測モードのSATDコストを確定する。
【0084】
第1のIntraモードスキップ判断サブモジュールは、前記予測ユニットのサイズに基づいて、前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断する。
【0085】
一実施形態では、前記予測ユニットのサイズは、NxNであり、ここで、Nは正の整数である、前記第1のIntraモードスキップ判断サブモジュールは、
最初の4x4サイズの予測ユニットが変換スキップモードを採用するか否かを判断し、
判断結果及び前記段階最適モードのSATDコストに基づいてモードコスト閾値を確定し、
前記最適なフレーム内予測モードのSATDコストが前記モードコスト閾値より大きい場合、前記フレーム内予測モードの後続フローをスキップする。
【0086】
一実施形態では、前記第1のIntraモードスキップ判断サブモジュールは、
最初の4x4サイズの予測ユニットが変換スキップモードを採用する場合、前記モードコスト閾値を、前記段階最適モードのSATDコストと第1の調整係数との積として確定し、
最初の4x4サイズの予測ユニットが変換スキップモードを採用しない場合、前記モードコスト閾値を、前記段階最適モードのSATDコストと第2の調整係数との積として確定し、前記第2の調整係数は、前記第1の調整係数より小さい。
【0087】
別の実施形態では、前記予測ユニットのサイズが2Nx2Nであり、前記実行されたモードが符号化ユニット再帰モードを含む場合、前記実行済みモード情報は、現在の符号化ユニットに対応する符号化サブブロックがフレーム内予測サブブロックである比率を含み、前記フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックである。
【0088】
前記第1のIntraモードスキップ判断サブモジュールは、
前記最適なフレーム内予測モードのSATDコストが前記段階最適モードのSATDコストより大きく、且つ前記比率がプリセット比率閾値より小さい場合、前記フレーム内予測モードの後続フローをスキップする。
【0089】
一実施形態では、前記段階最適モードのコストは、段階最適モードのRDOコストを含み、前記フレーム内予測モードスキップ判定モジュール520は、以下のサブモジュールを含み得る。
【0090】
再帰判断サブモジュールは、前記実行されたモードが符号化ユニット再帰モードを含むか否かを判断する。
【0091】
第2のIntraモードスキップ判断サブモジュールは、判断結果を参照し、前記段階最適モードおよび/または前記段階最適モードのRDOコストに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断する。
【0092】
一実施形態では、前記実行されたモードが符号化ユニット再帰モードを含む場合、前記実行済みモード情報は、以下の1つまたは組み合わせをさらに含み、即ち、現在の符号化ユニットに対応する符号化サブブロックのRDOコスト総和、現在の符号化ユニットが全ゼロブロックであるか否かを示すための第1のフラグ情報、現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在するか否かを示すための第2のフラグ情報である。前記フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックである。
【0093】
前記第2のIntraモードスキップ判断サブモジュールは、
以下の条件の1つまたは組み合わせを満たす場合、前記決定プロセスのフレーム内予測モードをスキップし、前記条件は、以下の通りであり、即ち、
前記RDOコスト総和は、前記段階最適モードのRDOコストより大きく、
前記第1のフラグ情報は、現在の符号化ユニットが全ゼロブロックであることを示し、
前記第2のフラグ情報は、現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在しないことを示す。
【0094】
一実施形態では、前記実行されたモードが符号化ユニット再帰モードを含まない場合、前記第2のIntraモードスキップ判断サブモジュールは、
前記段階最適モードがスキップSKIPモードである場合、フレーム内予測モードをスキップする。
【0095】
一実施形態では、前記段階最適モードのコストは、段階最適モードのSATDコストをさらに含み、前記装置は、
前記決定プロセスのフレーム内予測モードをスキップしないと判定した場合、現在の符号化ユニットに対して2Nx2Nのフレーム内符号化を行い、2Nx2Nフレーム内SATDコストを得る2Nx2Nフレーム内符号化モジュールと、
前記2Nx2Nフレーム内SATDコストが前記段階最適モードのSATDコストより大きい場合、NxNのフレーム内予測モードをスキップするNxN Intraモードスキップ判定モジュールと、
をさらに含む。
【0096】
なお、本発明の実施例による上記動画予測符号化の装置は、本発明の実施例による動画予測符号化の方法を実行でき、方法の実行に応じた機能モジュールと有益効果を備えている。
【0097】
図6は、本発明の一実施例による電子デバイスの構造概略図であり、図6に示されたように、当該電子デバイス、プロセッサ610、メモリ620、入力装置630及び出力装置640を含む。電子デバイスにおいて、プロセッサ610の数は、1つ以上であってもよく、図6では1つのプロセッサ610を例にする。電子デバイスにおけるプロセッサ610、メモリ620、入力装置630及び出力装置640は、バスまたは他の方法で接続されることができ、図6ではバスで接続することを例にする。
【0098】
メモリ620は、コンピュータ可読記憶媒体として、本発明の実施例における方法に対応するプログラム命令/モジュールのようなソフトウェアプログラム、コンピュータ実行可能プログラムおよびモジュールを記憶することができる。プロセッサ610は、メモリ620に記憶されたソフトウェアプログラム、命令、およびモジュールを実行することにより、電子デバイスの様々な機能アプリケーションおよびデータ処理を実行し、即ち上記の方法を実現する。
【0099】
メモリ620は、主にプログラム記憶領域とデータ記憶領域とを含むことができ、ここで、プログラム記憶領域は、
オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができ、データ記憶領域は、端末の使用に応じて作成されたデータなどを記憶することができる。また、メモリ620は、高速ランダムアクセスメモリを含むことができ、例えば少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の不揮発性固体記憶装置などの不揮発性メモリを含むことができる。いくつかの例では、メモリ620は、プロセッサ610に対して遠隔的に配置されたメモリを含むことができ、これらの遠隔メモリは、ネットワークを介して電子デバイスに接続されることができる。上記ネットワークの例としては、インターネット、企業内イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組み合わせが挙げられるが、これらに限定されない。
【0100】
入力装置630は、入力された数字または文字情報を受信し、電子デバイスのユーザ設定および機能制御に関係するキー信号入力を生成することができる。出力装置640は、ディスプレイなどの表示デバイスを含むことができる。
【0101】
本発明の実施例では、コンピュータ実行可能命令を含む記憶媒体をさらに提供し、前記コンピュータ実行可能命令は、サーバのプロセッサによって実行される際に、本発明のいずれかの実施例における方法を実行する。
【0102】
実施形態に関する上記の説明から、当業者は、ソフトウェアおよび必要な汎用ハードウェアによって本発明を実現することができ、もちろんハードウェアによっても実現することができることを明確に理解するだろう。このような理解に基づいて、本発明の技術案は本質的に、あるいは関連技術に寄与する部分をソフトウェア製品の形で具現することができ、当該コンピュータソフトウェア製品は、コンピュータのフロッピーディスク、読み取り専用メモリ(Read-Only Memory, ROM)、ランダムアクセスメモリ(Random Access Memory, RAM)、フラッシュメモリ(FLASH)、ハードディスク、または光ディスクなどのコンピュータ可読記憶媒体に記憶されることができ、1台のコンピュータ装置(パーソナルコンピュータ、サーバ、またはネットワーク装置などであってもよい)に本発明の複数の実施例に記載された方法を実行させるためのいくつかの命令を含む。コンピュータ可読記憶媒体は、非一時的コンピュータ可読記憶媒体であってもよい。
【0103】
なお、上記装置の実施例において、含まれる複数のユニット及びモジュールは、単に機能論理に従って区分されたものであるが、上述した区分に限定されるものではなく、対応する機能を実現できればよい。また、複数の機能ユニットの具体的な名称も、相互の区別を容易にするためのものであり、本発明の保護範囲を限定するためのものではない。
【符号の説明】
【0104】
510 実行済みモード情報確定モジュール
520 フレーム内予測モードスキップ判定モジュール
610 プロセッサ
620 メモリ
630 入力装置
640 出力装置
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2023-06-12
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正の内容】
【0007】
第1の側面において、本発明の実施例は、
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含むことと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断し、ここで、前記決定プロセスのフレーム内予測モードをスキップすることは、前記フレーム内予測モードをスキップするプロセスの一部と、前記フレーム内予測モードをスキップするプロセス全体とを含むことと、
を含む、
動画予測符号化の方法に関する。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】
第2の側面において、本発明の実施例は、
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定するように構成され、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む実行済みモード情報確定モジュールと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断するように構成され、ここで、前記決定プロセスのフレーム内予測モードをスキップすることは、前記フレーム内予測モードをスキップするプロセスの一部と、前記フレーム内予測モードをスキップするプロセス全体とを含むフレーム内予測モードスキップ判定モジュールと、
を含む、
動画予測符号化の装置に関する。
【手続補正3】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定し、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含むことと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断し、ここで、前記決定プロセスのフレーム内予測モードをスキップすることは、前記フレーム内予測モードをスキップするプロセスの一部と、前記フレーム内予測モードをスキップするプロセス全体とを含むことと、
を含む、
動画予測符号化の方法。
【請求項2】
前記段階最適モードのコストは、段階最適モードのアダマール変換後差分絶対値合計SATDコストを含み、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
前記予測ユニットに対してフレーム内予測モードのSATD粗選択決定を行うことにより、最適なフレーム内予測モードのSATDコストを確定することと、
前記予測ユニットのサイズに基づいて、前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断することと、
を含む、
請求項1に記載の方法。
【請求項3】
前記予測ユニットのサイズは、NxNであり、前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断することは、
最初の4x4サイズの予測ユニットが変換スキップモードを採用するか否かを判断することと、
判断結果及び前記段階最適モードのSATDコストに基づいてモードコスト閾値を確定することと、
前記最適なフレーム内予測モードのSATDコストが前記モードコスト閾値より大きいと確定することに応答して、前記フレーム内予測モードの後続フローをスキップすることと、
を含み、
ここで、Nは正の整数である、
請求項2に記載の方法。
【請求項4】
前記判断結果及び前記段階最適モードのSATDコストに基づいてモードコスト閾値を確定することは、
最初の4x4サイズの予測ユニットが変換スキップモードを採用すると確定することに応答して、前記モードコスト閾値を、前記段階最適モードのSATDコストと第1の調整係数との積として確定することと、
最初の4x4サイズの予測ユニットが変換スキップモードを採用しないと確定することに応答して、前記モードコスト閾値を、前記段階最適モードのSATDコストと第2の調整係数との積として確定し、前記第2の調整係数は、前記第1の調整係数より小さいことと、
を含む、
請求項3に記載の方法。
【請求項5】
前記予測ユニットのサイズが2Nx2Nであり、前記実行されたモードが符号化ユニット再帰モードを含むと確定することに応答して、前記実行済みモード情報が、現在の符号化ユニットに対応する符号化サブブロックがフレーム内予測サブブロックである比率を含むと確定し、ここで、前記フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックであり、
前記段階最適モードのSATDコスト及び前記最適なフレーム内予測モードのSATDコストを参照して、前記フレーム内予測モードの後続フローをスキップするか否かを判断することは、
前記最適なフレーム内予測モードのSATDコストが前記段階最適モードのSATDコストより大きく、且つ前記比率がプリセット比率閾値より小さいと確定することに応答して、前記フレーム内予測モードの後続フローをスキップすることを含み、
ここで、Nは正の整数である、
請求項2に記載の方法。
【請求項6】
前記段階最適モードのコストは、段階最適モードのレート歪み最適化RDOコストを含み、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
前記実行されたモードが符号化ユニット再帰モードを含むか否かを判断することと、
判断結果を参照し、前記段階最適モードと前記段階最適モードのRDOコストのうちの少なくとも1つに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することと、
を含む、
請求項1に記載の方法。
【請求項7】
前記実行されたモードが符号化ユニット再帰モードを含むと確定することに応答して、前記実行済みモード情報は、現在の符号化ユニットに対応する符号化サブブロックのRDOコスト総和、現在の符号化ユニットが全ゼロブロックであるか否かを示すための第1のフラグ情報、及び現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在するか否かを示すための第2のフラグ情報のうちの少なくとも1つをさらに含み、前記フレーム内予測サブブロックは、予測された最適モードがフレーム内予測モードであるサブブロックであり、
前記判断結果を参照し、前記段階最適モードと前記段階最適モードのRDOコストのうちの少なくとも1つに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
以下の条件の少なくとも1つを満たすと確定することに応答して、前記決定プロセスのフレーム内予測モードをスキップすることを含み、前記条件は、以下の通りであり、即ち、
前記RDOコスト総和は、前記段階最適モードのRDOコストより大きく、
前記第1のフラグ情報は、現在の符号化ユニットが全ゼロブロックであることを示し、
前記第2のフラグ情報は、現在の符号化ユニットに対応する符号化サブブロックにフレーム内予測サブブロックが存在しないことを示す、
請求項6に記載の方法。
【請求項8】
前記実行されたモードが符号化ユニット再帰モードを含まないと確定することに応答して、前記判断結果を参照し、前記段階最適モードと前記段階最適モードのRDOコストのうちの少なくとも1つに基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することは、
前記段階最適モードがスキップSKIPモードであると確定することに応答して、フレーム内予測モードをスキップすることを含む、
請求項6に記載の方法。
【請求項9】
前記段階最適モードのコストは、段階最適モードのSATDコストをさらに含み、前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断することの後、
前記決定プロセスのフレーム内予測モードをスキップしないという判断結果に基づいて、現在の符号化ユニットに対して2Nx2Nのフレーム内符号化を行い、2Nx2Nフレーム内SATDコストを得ることと、
前記2Nx2Nフレーム内SATDコストが前記段階最適モードのSATDコストより大きいと確定することに応答して、NxNのフレーム内予測モードをスキップすることと、
をさらに含む、
請求項6から8のいずれか1項に記載の方法。
【請求項10】
フレーム間予測の際に、現在の予測ユニットの最適モードを決定する決定プロセスで、実行されたモードに基づいて実行済みモード情報を確定するように構成され、前記実行済みモード情報は、段階最適モード及び前記段階最適モードのコストを含む実行済みモード情報確定モジュールと、
前記実行済みモード情報に基づいて、前記決定プロセスのフレーム内予測モードをスキップするか否かを判断するように構成され、ここで、前記決定プロセスのフレーム内予測モードをスキップすることは、前記フレーム内予測モードをスキップするプロセスの一部と、前記フレーム内予測モードをスキップするプロセス全体とを含むフレーム内予測モードスキップ判定モジュールと、
を含む、
動画予測符号化の装置。
【請求項11】
メモリ、プロセッサ、およびメモリに記憶され且つプロセッサ上で実行可能なコンピュータプログラムを含み、前記プロセッサが前記プログラムを実行する際に、請求項1から9のいずれか1項に記載の方法を実現する電子デバイス。
【請求項12】
コンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサによって実行される際に、請求項1から9のいずれか1項に記載の方法を実現するコンピュータ可読記憶媒体。
【国際調査報告】