IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7269989画像コーディング処理方法、装置、機器及び媒体
<>
  • 特許-画像コーディング処理方法、装置、機器及び媒体 図1
  • 特許-画像コーディング処理方法、装置、機器及び媒体 図2
  • 特許-画像コーディング処理方法、装置、機器及び媒体 図3
  • 特許-画像コーディング処理方法、装置、機器及び媒体 図4
  • 特許-画像コーディング処理方法、装置、機器及び媒体 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-26
(45)【発行日】2023-05-09
(54)【発明の名称】画像コーディング処理方法、装置、機器及び媒体
(51)【国際特許分類】
   H04N 19/11 20140101AFI20230427BHJP
   H04N 19/149 20140101ALI20230427BHJP
   H04N 19/176 20140101ALI20230427BHJP
【FI】
H04N19/11
H04N19/149
H04N19/176
【請求項の数】 23
(21)【出願番号】P 2021095871
(22)【出願日】2021-06-08
(65)【公開番号】P2021153313
(43)【公開日】2021-09-30
【審査請求日】2021-06-08
(31)【優先権主張番号】202010620842.2
(32)【優先日】2020-06-30
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際弁理士法人
(72)【発明者】
【氏名】ジャン ジョウジョウ
(72)【発明者】
【氏名】ディン ウェンポン
【審査官】清山 昂平
(56)【参考文献】
【文献】韓国登録特許第10-1724212(KR,B1)
【文献】特開2018-050195(JP,A)
【文献】米国特許出願公開第2020/0404302(US,A1)
【文献】中国特許出願公開第104618726(CN,A)
【文献】中国特許出願公開第106899850(CN,A)
【文献】韓国公開特許第10-2015-0095253(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00-19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
画像コーディング処理方法であって、
画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定するステップであって、前記粗選択予測モードのセットには前記現在のコーディングブロックの一番可能なモードのサブセットが含まれるステップと、
前記粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、前記一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定するステップであって、前記モードコストは、絶対変換差分和(SATD)コストであるステップと、
前記第1予測モードと前記第2予測モードのモードコストが異なる場合、前記粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って候補モードのサブセットを決定するステップと、
前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するステップと、
前記ターゲット予測モードを使用して前記現在のコーディングブロックをコーディングするステップと、を含み、
前記粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って前記候補モードのサブセットを決定するステップが、
前記粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードのタイプが予め設定されたモード条件を満たす場合、前記予め設定された数の予測モードを使用して前記候補モードのサブセットを決定するステップを含み、
前記予め設定されたモード条件は、前記予め設定された数の予測モードにおいて、最初の2つの予測モードのタイプが角度モードに属し、残りの予測モードのタイプのうちの少なくとも1つが直流モードまたは平面モードに属することを含む、
ことを特徴とする画像コーディング処理方法。
【請求項2】
前記第1予測モードと前記第2予測モードのモードコストが同じである場合、前記一番可能なモードのサブセットを前記候補モードのサブセットとするステップをさらに含む、
ことを特徴とする請求項1に記載の画像コーディング処理方法。
【請求項3】
前記予め設定された数の予測モードを使用して前記候補モードのサブセットを決定するステップは、
前記予め設定された数の予測モードにおける最初の2つの予測モード、及び前記粗選択予測モードのセットにおけるモードタイプが直流モード及び平面モードに属する予測モードを、前記候補モードのサブセットとして構成するステップを含む、
ことを特徴とする請求項に記載の画像コーディング処理方法。
【請求項4】
前記粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って前記候補モードのサブセットを決定するステップは、
粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードタイプが前記予め設定されたモード条件を満たさない場合、前記予め設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定するステップをさらに含む、
ことを特徴とする請求項に記載の画像コーディング処理方法。
【請求項5】
前記粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たさない場合、前記予め設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定するステップは、
前記予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが角度モードに属し、残りの予測モードタイプに直流モード及び平面モードが存在しない場合、前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定するステップ、
または、
前記予め設定された数の予測モードにおいて、最初の2つの予測モードタイプのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合、前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定するステップ、
または、
前記予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定するステップを含む、
ことを特徴とする請求項に記載の画像コーディング処理方法。
【請求項6】
前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定するステップは、
前記予め設定された数の予測モードにおける最初の設定された数の予測モードと前記一番可能なモードのサブセットとの間の重複モードを決定するステップと、
前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットから重複モードを除去し、残りのモードを前記候補モードサブセットとして構成するステップと、を含む、
ことを特徴とする請求項に記載の画像コーディング処理方法。
【請求項7】
前記最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、前記設定された数の値が、前記最初の2つの予測モードタイプが角度モードに属する場合の値より小さく、または、前記最初の2つの予測モードタイプのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合の値より小さい、
ことを特徴とする請求項に記載の画像コーディング処理方法。
【請求項8】
前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するステップは、
前記候補モードのサブセットにおける予測モードのレート歪みコストを計算するステップと、
レート歪みコストに基づいて、前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するステップと、を含む、
ことを特徴とする請求項1に記載の画像コーディング処理方法。
【請求項9】
前記画像コーディングプロセスにおいて前記現在のコーディングブロックの粗選択予測モードのセットを決定するステップは、
ターゲットコーディング規格に基づいて、画像コーディングプロセスにおいて前記現在のコーディングブロックの少なくとも1つのフレーム内予測モードを決定するステップと、
前記フレーム内予測モードのモードコストを計算し、前記モードコストに基づいて、前記少なくとも1つのフレーム内予測モードから代替モードのサブセットを決定するステップと、
前記現在のコーディングブロックの隣接ブロックのターゲット予測モードに基づいて、前記現在のコーディングブロックの前記一番可能なモードのサブセットを決定するステップと、
前記代替モードのサブセット及び前記一番可能なモードのサブセットを前記現在のコーディングブロックの粗選択予測モードのセットとするステップと、を含む、
ことを特徴とする請求項1に記載の画像コーディング処理方法。
【請求項10】
前記一番可能なモードのサブセットには前記現在のコーディングブロックに隣接する上方コーディングブロック及び左側コーディングブロックのターゲット予測モードを含む、
ことを特徴とする請求項1またはに記載の画像コーディング処理方法。
【請求項11】
画像コーディング処理装置であって、
画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定するための粗選択予測モードのセット決定モジュールであって、前記粗選択予測モードのセットには前記現在のコーディングブロックの一番可能なモードのサブセットが含まれる粗選択予測モードのセット決定モジュールと、
前記粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、前記一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定するためのモード選別モジュールであって、前記モードコストは、絶対変換差分和(SATD)コストであるモード選別モジュールと、
前記第1予測モードと前記第2予測モードのモードコストが異なる場合、前記粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って、候補モードのサブセットを決定するための候補モードのサブセット決定モジュールと、
前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するためのターゲット予測モード決定モジュールと、
前記ターゲット予測モードを使用して前記現在のコーディングブロックをコーディングするためのコーディング処理モジュールと、を含み、
前記候補モードのサブセット決定モジュールが、第1サブセット決定ユニットを含み、
前記第1サブセット決定ユニットが、前記第1予測モードと前記第2予測モードのモードコストが異なり、かつ粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードのタイプが予め設定されたモード条件を満たす場合、前記予め設定された数の予測モードを使用して、前記候補モードのサブセットを決定し、
前記予め設定されたモード条件は、前記予め設定された数の予測モードにおいて、最初の2つの予測モードのタイプが角度モードに属し、残りの予測モードのタイプのうちの少なくとも1つが直流モードまたは平面モードに属することを含む、
ことを特徴とする画像コーディング処理装置。
【請求項12】
前記候補モードのサブセット決定モジュールは、さらに、
前記第1予測モードと前記第2予測モードのモードコストが同じである場合、前記一番可能なモードのサブセットを前記候補モードのサブセットとする、
ことを特徴とする請求項11に記載の画像コーディング処理装置。
【請求項13】
前記第1サブセット決定ユニットは、
前記第1予測モードと前記第2予測モードのモードコストが異なり、かつ前記粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たす場合、前記予め設定された数の予測モードにおける最初の2つの予測モード及び前記粗選択予測モードのセットにおけるモードタイプが直流モード及び平面モードに属する予測モードを、前記候補モードのサブセットとして構成する、
ことを特徴とする請求項11記載の画像コーディング処理装置。
【請求項14】
前記候補モードのサブセット決定モジュールは、第2サブセット決定ユニットをさらに含み、
前記第2サブセット決定ユニットは、前記第1予測モードと前記第2予測モードのモードコストが異なり、かつ前記粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たさない場合、前記予め設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定する、
ことを特徴とする請求項11記載の画像コーディング処理装置。
【請求項15】
前記第2サブセット決定ユニットは、
前記第1予測モードと前記第2予測モードのモードコストが異なり、かつ前記予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが角度モードに属し、残りの予測モードタイプに直流モード及び平面モードが存在しない場合、前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定し、
または
前記第1予測モードと前記第2予測モードのモードコストが異なり、かつ前記予め設定された数の予測モードにおいて、最初の2つの予測モードタイプのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合、前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定し、
または
前記第1予測モードと前記第2予測モードのモードコストが異なり、かつ前記予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットを使用して、前記候補モードのサブセットを決定する、
ことを特徴とする請求項14記載の画像コーディング処理装置。
【請求項16】
前記第2サブセット決定ユニットは、
前記予め設定された数の予測モードにおける最初の設定された数の予測モードと前記一番可能なモードのサブセットとの間の重複モードを決定するための重複モード決定サブユニットと、
前記予め設定された数の予測モードにおける最初の設定された数の予測モード及び前記一番可能なモードのサブセットから重複モードを除去し、残りのモードを前記候補モードサブセットとして構成するための重複モード除去サブユニットと、を含む、
ことを特徴とする請求項15記載の画像コーディング処理装置。
【請求項17】
前記最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、前記設定された数の値が、前記最初の2つの予測モードタイプが角度モードに属する場合の数より小さく、または、前記最初の2つの予測モードタイプのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合の数より小さい、
ことを特徴とする請求項15記載の画像コーディング処理装置。
【請求項18】
前記ターゲット予測モード決定モジュールは、
前記候補モードのサブセットにおける予測モードのレート歪みコストを計算するためのレート歪みコスト計算ユニットと、
前記レート歪みコストに基づいて、前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するためのターゲット予測モード決定ユニットと、を含む、
ことを特徴とする請求項11記載の画像コーディング処理装置。
【請求項19】
前記粗選択予測モードのセット決定モジュールは、
ターゲットコーディング規格に基づいて、画像コーディングプロセスにおいて前記現在のコーディングブロックの少なくとも1つのフレーム内予測モードを決定するためのフレーム内予測モード決定ユニットと、
前記フレーム内予測モードのモードコストを計算し、前記モードコストに基づいて、前記少なくとも1つのフレーム内予測モードから代替モードのサブセットを決定するための代替モードのサブセット決定ユニットと、
前記現在のコーディングブロックの隣接ブロックのターゲット予測モードに基づいて、前記現在のコーディングブロックの前記一番可能なモードのサブセットを決定するための一番可能なモードサブセット決定ユニットと、
前記代替モードのサブセット及び前記一番可能なモードのサブセットを前記現在のコーディングブロックの粗選択予測モードのセットとして決定するための粗選択予測モードのセット決定ユニットと、を含む、
ことを特徴とする請求項11記載の画像コーディング処理装置。
【請求項20】
前記一番可能なモードのサブセットには前記現在のコーディングブロックに隣接する上方コーディングブロック及び左側コーディングブロックのターゲット予測モードが含まれる、
ことを特徴とする請求項11または19に記載の画像コーディング処理装置。
【請求項21】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが請求項1~10のいずれかに記載の画像コーディング処理方法を実行できるように、前記少なくとも1つのプロセッサによって実行される、
ことを特徴とする電子機器。
【請求項22】
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~10のいずれかに記載の画像コーディング処理方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項23】
コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータに請求項1~10のいずれかに記載の画像コーディング処理方法を実行させる、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願の実施例は、コンピュータ技術に関し、具体的にクラウドコンピューティングおよび画像処理技術に関し、特に画像コーディング処理方法、装置、機器及び媒体に関する。
【背景技術】
【0002】
HEVC(High Efficiency Video Coding、高効率ビデオコーディング)は、次世代のビデオコーディング圧縮規格である。前世代のH.264/AVC規格と比較すると、同じビデオが同じ解像度で、HEVC規格を採用するとほぼ50%のコードレートを節約でき、より幅広い応用見通しを有する。
【0003】
H246規格では、ビデオフレーム内の予測には9種類の予測モードのみが含まれるが、HEVC規格では35種類の予測モードが含まれ、具体的には33種類の角度モードと、1種類の直流モード(DC mode)と、1種類の平面モード(Planer mode)と、が含まれる。これにより、ビデオコーディングプロセスにおいて、HEVC規格は、より細かい予測粒度を実現し、より高い圧縮効率を達成できるが、過剰なフレーム内の予測モードが、フレーム内コーディングの計算量を大幅に増加させ、コーディング処理効率がより低くなることにつながる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本出願の実施例は、画像コーディング処理方法、装置、機器及び媒体を提供し、画像コーディング処理プロセスにおいてコーディング予測モードに対する選択を最適化し、画像コーディングの計算量を減少させ、コーディング効率を向上させる。
【課題を解決するための手段】
【0005】
本出願の実施例の一態様によれば、画像コーディング処理方法を提供し、
画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定するステップであって、ここで、前記粗選択予測モードのセットには前記現在のコーディングブロックの一番可能なモードのサブセットが含まれるステップと、 前記粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、前記一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定するステップと、
前記第1予測モードと前記第2予測モードのモードコストが異なる場合、前記粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って、候補モードのサブセットを決定するステップと、
前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するステップと、
前記ターゲット予測モードを使用して前記現在のコーディングブロックをコーディングするステップと、を含む。
【0006】
本出願の実施例の別の態様によれば、画像コーディング処理装置を提供し、
画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定するための粗選択予測モードのセット決定モジュールであって、ここで、前記粗選択予測モードのセットには前記現在のコーディングブロックの一番可能なモードのサブセットが含まれる粗選択予測モードのセット決定モジュールと、
粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定するためのモード選別モジュールと、
前記第1予測モードと前記第2予測モードのモードコストが異なる場合、前記粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って候補モードのサブセットを決定するための候補モードのサブセット決定モジュールと、
前記候補モードのサブセットから前記現在のコーディングブロックのターゲット予測モードを決定するためのターゲット予測モード決定モジュールと、
前記ターゲット予測モードを使用して前記現在のコーディングブロックをコーディングするためのコーディング処理モジュールと、を含む。
【0007】
本出願の実施例の別の態様によれば、電子機器を提供し、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが本出願の実施例のいずれかの画像コーディング処理方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
【0008】
本出願の実施例の別の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本出願の実施例のいずれかの画像コーディング処理方法を実行させる。
本出願の実施例の別の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムは、コンピュータに本出願の実施例のいずれかの画像コーディング処理方法を実行させる。
【発明の効果】
【0009】
本出願の実施例の技術案によれば、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定し、第1予測モードと第2予測モードのモードコストが同じであるか否かを決定し、第1予測モードと第2予測モードのモードコストが異なる場合、粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って候補モードのサブセットを決定し、現在のコーディングブロックをコーディングするために候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定することにより、画像コーディング処理プロセスにおいてコーディング予測モードに対する選択を最適化し、画像コーディングの計算量を減少させ、コーディング効率を向上させる。
【0010】
なお、本部分に記載されたコンテンツは、本出願の実施例の肝心または重要な特徴を限定することを意図するものではなく、本出願の範囲を限定することを意図するものでもない。本出願の他の特徴は、以下の説明によって容易に理解されやすくなる。
【図面の簡単な説明】
【0011】
図面は、本技術案をよりよく理解するために使用されており、本出願を限定するものではない。
図1】本出願の実施例により開示される画像コーディング処理方法のフローチャートである。
図2】本出願の実施例により開示される別の画像コーディング処理方法のフローチャートである。
図3】本出願の実施例により開示される1つターゲット予測モードの選択の概略フローチャートである。
図4】本出願の実施例により開示される画像コーディング処理装置の概略構成図である。
図5】本出願の実施例により開示される電子機器のブロック図である。
【発明を実施するための形態】
【0012】
以下、図面と組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔するために、以下の説明では、周知の機能及び構造の説明を省略する。
【0013】
図1は本出願の実施例により開示される画像コーディング処理方法のフローチャートであり、本出願の実施例は、画像をコーディングする場合に適用することができ、特にビデオフレーム内コーディングの場合に適用し、具体的には、例えば、HEVCコーディング規格を採用して画像をコーディングする。本出願の実施形態により開示される方法は、コーディング処理装置によって実行でき、当該装置は、ソフトウェアおよび/またはハードウェア使用して実現でき、計算能力を有する任意の電子機器、例えば端末、サーバなどに統合することができる。
【0014】
本出願の実施例において、コーディング対象の画像は、画像シーケンスにおける任意の画像であってもよく、具体的に、コーディング対象のビデオにおける任意のフレーム画像を指すことができる。各画像は画像サイズに従って複数のコーディングブロックに分割でき、各コーディングブロックのサイズは柔軟に設定されてもよく、本出願の実施例では具体的に限定されなく、各コーディングブロックが同じコーディング処理プロセスを経る。本出願の実施例は、即ち、現在のコーディングブロックに対して説明する。
【0015】
図1に示すように、本出願の実施例により開示される画像コーディング処理方法は、以下のステップを含むことができる。
【0016】
ステップ101において、画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定し、ここで、粗選択予測モードのセットには現在のコーディングブロックの一番可能なモードのサブセットが含まれる。
【0017】
ここで、粗選択予測モードのセットとは、ラフモード選択策略(RMD、Rough Mode Decision)によって得られた予測モードのセットを指し、ターゲット予測モードを決定するプロセスにおいてコーディング計算に参加する予測モードの数を初歩的に減少するのに役立つ。一番可能なモード(Most Probable Mode、MPM mode)のサブセットは現在のコーディングブロックの隣接コーディングブロックのターゲット予測モードに基づいて決定されるモードのセットである。現在のコーディングブロックの隣接コーディングブロックは、上方コーディングブロックと、左側コーディングブロックと、左上コーディングブロックとのうちの少なくとも1種類を含むことができる。通常、好ましい例として、一番可能なモードのサブセットには現在のコーディングブロックに隣接する上方コーディングブロック及び左側コーディングブロックのターゲット予測モードが含まれることができ、これにより、現在のコーディングブロックのターゲット予測モードに対する決定の正確性を確保することができ、かつ、現在のコーディングブロックのターゲット予測モードを選択するプロセスにおいて、その隣接コーディングブロックがすでにターゲット予測モードを使用してコーディングを完了した。
【0018】
選択可能に、画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定するステップは、
ターゲットコーディング規格に基づいて、画像コーディングプロセスにおいて現在のコーディングブロックの少なくとも1つのフレーム内予測モードを決定するステップであって、即ち、異なるコーディング規格に対して、当該コーディング規格によって提供されるフレーム内予測モードは異なり、例えば、HEVCコーディング規格に対して、35種類の予測モードが提供され、ビデオコーディングに対して、フレーム内予測はビデオ空間領域の関連性を使用して、同じフレーム画像における隣接するコーディングされた解像度を使用して現在の解像度を予測して、ビデオ時間領域の冗長性を効果的に除去する目的を達成するステップと、
フレーム内予測モードのモードコストを計算し、モードコストに基づいて、少なくとも1つのフレーム内予測モードから代替モードのサブセットを決定するステップであって、当該モードコストは、フレーム内予測モードに対して初歩的に認識する測定要素であり、具体的には、SATD(Sum of Absoute Transformed Difference)コスト(satd_cost)を指すことができ、SATDコストは、ビデオ残差信号の大きさの測定規格であり、即ち、残差がアダマール変換された後の係数に対して絶対値を合計し、具体的には、モードコストがコスト閾値より小さい予め設定された数のフレーム内予測モードを代替モードのサブセットとして決定できるステップと、
現在のコーディングブロックの隣接ブロックのターゲット予測モードに基づいて、現在のコーディングブロックの一番可能なモードのサブセットを決定するステップであって、現在のコーディングブロックの隣接コーディングブロックは、上方コーディングブロックと、左側コーディングブロックと、左上コーディングブロックとのうちの少なくとも1種類を含むことができるステップと、
代替モードのサブセット及び一番可能なモードのサブセットを現在のコーディングブロックの粗選択予測モードのセットとするステップと、を含む。
【0019】
ステップ102において、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定する。
【0020】
第1閾値及び第2閾値の値は実際の状況に応じて柔軟に決定されてもよく、具体的な値が限定されなく、粗選択予測モードのセット及び一番可能なモードのサブセットにおけるモードコストが小さく、かつ現在のモードの選択ニーズに合致する予測モードを決定することを意図し、好ましくは、第1予測モードと第2予測モードは、それぞれ、粗選択予測モードのセット及び一番可能なモードのサブセットにおけるモードコストが最も小さい予測モードを指す。また、モードコストに従って、粗選択予測モードのセット及び一番可能なモードのサブセットにおけるモードをそれぞれソートすることにより、第1予測モード及び第2予測モードを決定しても良い。「第1」及び「第2」は、何の順序にも限定されなく、用語を区別する役割のみを果たす。
【0021】
ステップ103において、第1予測モードと第2予測モードのモードコストが異なる場合、粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って候補モードのサブセットを決定する。
【0022】
具体的には、第1予測モードと第2予測モードのモードコストが異なる場合、粗選択予測モードのセット及び一番可能なモードのサブセットにおけるモードコストが小さく、かつ現在のモードの選択ニーズに合致する予測モードが同じモードに属しないことを意味し、例えば、モードコストが最も小さい予測モードが異なる場合、粗選択予測モードのセットにおけるモードコストのソート結果及びモードタイプに従って、粗選択予測モードのセットから候補モードのサブセットを決定し、例えば、モードコストが小さく、モードタイプが直流モードおよび平面モードに属する予測モードを好ましく選択して、候補モードのサブセットを構成しても良い。候補モードのサブセットにおけるモードの数は適応的に設定されてもよく、例えば、画像コーディングの計算量を効果的に制御するために、候補モードのサブセットにおけるモードの数を、4以下に設定することが好ましい。
【0023】
選択可能に、本出願の実施例により開示される方法は、第1予測モードと第2予測モードのモードコストが同じである場合、一番可能なモードのサブセットを候補モードのサブセットとするステップをさらに含むことができる。第1予測モードと第2予測モードのモードコストが同じであることは、粗選択予測モードのセット及び一番可能性なモードのサブセットにおけるモードコストがより小さく、かつ現在のモードの選択ニーズに合致する予測モードが同じモードに属する可能性があることを意味し、例えば、モードコストが最も小さい予測モードが同じモードに属する可能性がある場合、直接に一番可能なモードのサブセットを候補モードのサブセットとして、現在のコーディングブロックのターゲット予測モードを決定しても良い。統計法則によれば、一番可能なモードのサブセットにおける予測モードを現在のコーディングブロックの一番好ましい予測モードとする確率が非常に高いため、第1予測モードと第2予測モードのモードコストが同じである場合、一番可能なモードのサブセットから現在のコーディングブロックのターゲット予測モードを直接に決定することにより、ターゲット予測モードを決定するプロセスにおいてコーディング計算に参加する予測モードの数を効果的に減少させ、計算量を減少させ、コーディング効率を向上させることができる。
【0024】
ステップ104において、候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定する。
【0025】
候補モードのサブセットが決定された後、より正確なモード選択条件を使用して、ターゲット予測モードを選別することができる。当該モード選択条件は、画像コーディング処理分野における予測モード測定要素およびモード選択ニーズに応じて定められることができ、例えば、モード選択条件は、モードのレート歪み(RDO、Rate Distortion Optimized)コスト(rdo_cost)に基づいてモード選択を行うと定義されることができる。レート歪み最適化策略は、レート歪み理論に基づいて提案されたコスト関数案であり、RDOの主なアイデアは、コスト関数を計算する際に、コードレートと歪みとの両方の制約を考慮し、低歪みを保証すると同時に低コードレート率を保証することにより、画像シーケンスやビデオストリームの伝送に有利になることである。したがって、レート歪みコストに基づいて、候補モードのサブセットから決定されたターゲット予測モードの正確性を確保し、理想化されたコーディング処理結果の保証に役立つ。
【0026】
例示的に、候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定するステップは、候補モードのサブセットにおける予測モードのレート歪みコストを計算するステップと、レート歪みコストに基づいて、候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定するステップであって、例えば、レート歪みコストが最も小さい予測モードをターゲット予測モードとして選択するステップと、を含む。レート歪みコストに関する具体的な計算実現は、既存の計算案を参照してもよく、本出願の実施例は具体的には限定しない。
【0027】
なお、候補モードのサブセットからターゲット予測モードを決定するプロセスは通常、コーディング処理プロセスにおいて、計算量が大きい環節であり、例えば、RDOコストの計算プロセスが複雑であり、本出願の実施例は、合理的な候補モードのサブセットの選択ロジックを設定することにより、候補モードのサブセットにおけるモードの数の合理性を確保するため、後続にコーディング計算に参加する予測モードの数を著しく減少させ、コーディングの計算量を効果的に減少させることができる。
【0028】
ステップ105において、ターゲット予測モードを使用して現在のコーディングブロックをコーディングする。
【0029】
現在のコーディングブロックのターゲット予測モードが決定された後、具体的なコーディング処理の実現については、既存案を参照しても良い。
【0030】
本出願の実施例の技術案によれば、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定し、第1予測モードと第2予測モードのモードコストが同じであるか否かを決定し、異なる場合、粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って候補モードのサブセットを決定し、現在のコーディングブロックをコーディングするために候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定することにより、画像コーディング処理プロセスにおいてコーディング予測モードに対する選択を最適化し、新しいモード選択ロジックを提出し、ターゲット予測モードを決定するプロセスにおいてコーディング計算に参加する予測モードの数を効果的に減少させ、画像コーディングの計算量を減少させ、画像コーディングプロセスにおいて計算リソースに対する占有を減少させ、コーディング効率を向上させ、既存案においてコーディング計算に参加する予測モードの数が多いため、コーディング効率が低いという問題を解決する。
【0031】
図2は本出願の実施例により開示される別の画像コーディング処理方法のフローチャートであり、上記実施形態技術案に基づいてさらに最適化及び拡張し、上記実施形態各選択可能な実施形態と組み合わせることができる。図2に示すように、当該方法は、以下のステップS201~ステップS207を含むことができる。
【0032】
ステップ201において、画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定し、ここで、前記粗選択予測モードのセットには現在のコーディングブロックの一番可能なモードのサブセットが含まれる。
【0033】
ステップ202において、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定する。
【0034】
ステップ203において、第1予測モードと第2予測モードのモードコストが同じである場合、一番可能なモードのサブセットを候補モードのサブセットとする。
【0035】
統計法則によれば、一番可能なモードのサブセットにおける予測モードを現在のコーディングブロックの一番好ましい予測モードとする確率は非常に高いため、第1予測モードと第2予測モードのモードコストが同じである場合、一番可能なモードのサブセットから現在のコーディングブロックのターゲット予測モードを直接に決定することにより、ターゲット予測モードを決定するプロセスにおいてコーディング計算に参加する予測モードの数を効果的に減少させ、計算量を減少させ、コーディング効率を向上させることができる。
【0036】
ステップ204において、第1予測モードと第2予測モードのモードコストが異なり、かつ粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たす場合、予め設定された数の予測モードを使用して候補モードのサブセットを決定する。
【0037】
ここで、予め設定されたモード条件は、当該予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが角度モードに属し、かつ残りの予測モードタイプのうちの少なくとも1つが直流モードまたは平面モードに属することを含む。予め設定された数の値はモードの選択ニーズに応じて決定されることができる。
【0038】
粗選択予測モードのセットにおけるモードコストの昇順ソート結果(即ちモードコストが小さいから大きいまでソートされる)に従って、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たす場合、当該予め設定された数の予測モードを候補モードのサブセットとして構成してもよく、当該予め設定された数の予測モードにおける最初の2つの角度モード及び含まれる直流モードおよび/または平面モードを候補モードのサブセットとして構成しても良い。さらに、当該予め設定された数の予測モードに直流モードと平面モードとのうちの一方のモードタイプのみが含まれる場合、選択予測モードのセットの残りのモードから直流モードと平面モードとのうちの他方のモードを決定することにより、最初の2つの角度モード及び当該予め設定された数の予測モードに含まれる直流モードと平面モードとのうちの一方のモードと組み合わせて、候補モードのサブセットとして構成することができる。即ち、当該予め設定された数の予測モードを使用して、候補モードのサブセットを決定するステップは、当該予め設定された数の予測モードにおける最初の2つの予測モード、及び粗選択予測モードのセットにおけるモードタイプが直流モード及び平面モードに属する予測モードを候補モードのサブセットとして構成するステップであって、候補モードのサブセットには4つの予測モードが含まれるステップを含むことができる。本出願の実施例において、候補モードのサブセットにおけるモードの数を効果的に制御するために、当該予め設定された数は4であることが好ましい。
【0039】
候補モードのサブセットにおけるモードの数を合理的に制御することにより、後続にコーディング計算に参加する予測モードの数を多すぎず、計算量を増加させないだけでなく、後続にコーディングピューティングに参加する予測モードの数を少なさすぎず、ターゲット予測モードの決定の正確性が保証できないことをさせない。
【0040】
本出願の実施例において、直流モード及び平面モードが、現在のコーディングブロックが平坦領域に属するか否かをより良く反映できることを考慮するため、直流モード及び平面モードに対応するモードコストが小さい場合、例えば、SATDコスト値が小さい場合、直流モード及び平面モードで現在のコーディングブロックをコーディングして得られたコーディング結果が望ましいと考えられるため、候補モードのサブセットにおけるモードとして好ましく選択される。
【0041】
ステップ205において、第1予測モードと第2予測モードのモードコストが異なり、かつ粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って最初の予め設定された数の予測モードタイプが予め設定されたモード条件に満たさない場合、予め設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定する。
【0042】
即ち、予め設定されたモード条件における任意の条件ブランチが満たされない場合、候補モードのサブセットを決定するプロセスにおいて、予め設定された数の予測モードには一番可能なモードのサブセットの予測モードが含まれているか否かを総合的に考慮する必要があり、候補モードのサブセットの決定の合理性を確保する。具体的には、予め設定された数の予測モードおよび一番可能なモードのサブセットを候補モードのサブセットとして直接に構成してもよく、予め設定された数の予測モードにおける最初の2つまたは最初の3つの予測モードを一番可能なモードのサブセットと組み合わせて、候補モードのサブセットとして構成してもよい。
【0043】
ステップ206において、候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定する。
【0044】
ステップ207において、ターゲット予測モードを使用して現在のコーディングブロックをコーディングする。
【0045】
本出願の実施例の技術案によれば、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定し、第1予測モードと第2予測モードのモードコストが同じであるか否かを判断し、判断結果に基づいて、どのように候補モードのサブセットを決定するかを決定し、かつ、第1予測モードと第2予測モードのモードコストが異なる場合に対して、粗選択予測モードのセットにおけるモードコストの昇順ソート結果における最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たすか否かを判断し、判断結果に基づいてどのように候補モードのサブセットを決定するかを決定し、即ち、本出願の実施例は、新しいモード選択ロジックを提出し、状況次第、候補モードのサブセットを合理的に決定する効果を実現し、候補モードのサブセットの数を効果的に制御し、ターゲット予測モードを決定するプロセスにおいてコーディング計算に参加する予測モードの数を効果的に減少させ、画像コーディングの計算量を減少させ、画像コーディングプロセスにおいて計算リソースに対する占有を減少させ、コーディング効率を向上させ、既存案においてコーディング計算に参加する予測モードの数が多いため、コーディング効率が低いという問題を解決する。
【0046】
上記技術案に基づいて、さらに、粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たさない場合、予め設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定するステップは、
予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが角度モードに属し、残りの予測モードタイプには直流モード及び平面モードが存在しない場合、予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定するステップ、
または
予め設定された数の予測モードにおいて、最初の2つの予測モードタイプには一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合、予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定するステップ、
または、
予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定するステップ、を含む。
【0047】
上記3つの状況に対して、設定された数の値を同じでも、異なっても良い。好ましくは、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、設定された数の値が、最初の2つの予測モードタイプが角度モードに属する場合の値より小さく、または、最初の2つのモードタイプにおける一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合の値より小さいことにより、候補モードのサブセットにおけるモードの数の減少に役立つ。例えば、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、候補モードのサブセットを決定するプロセスにおいて、設定された数Mの値は2であってもよく。即ち、予め設定された数の予測モードにおける最初の2つの直流モード及び平面モード、及び一番可能なモードのサブセットを考慮し、最初の2つの予測モードタイプが角度モードに属する場合、設定された数Mの値は3であってもよく、即ち、予め設定された数の予測モードにおける最初の3つの予測モード、及び一番可能なモードのサブセットを考慮することにより、候補モードのサブセットにおけるモードの数に対する合理的な制御を実現できる。
【0048】
さらに、当該予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定するステップは、
予め設定された数の予測モードにおける最初の設定された数の予測モードと一番可能なモードのサブセットとの間の重複モードを決定するステップと、
予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットから、重複モードを除去し、残りのモードを候補モードサブセットとして構成するステップと、を含む。
【0049】
モード重複除去処理により、ターゲット予測モードを決定するプロセスにおいて、繰り返しのコーディング計算を減少させ、計算リソースを節約し、コーディング効率を向上させるのにも役立つ。
【0050】
図3は本出願の実施例により開示されるターゲット予測モードの選択の概略フローチャートであり、具体的にはHEVCコーディング規格に対して、本出願の実施例に対して例示的に説明し、本出願の実施例の具体的な限定と理解されるべきではない。図3に示すように、ターゲット予測モードの選択フローは、以下のステップS301~ステップS312を含むことができる。
【0051】
ステップ301において、モード選択プロセスを開始する。
【0052】
ステップ302において、35種類の予測モードのモードコストを計算する。
【0053】
ここで、モードコストはSATDのコストを指すことができる。
【0054】
ステップ303において、モードコストが予め設定された閾値より小さいN種類のモードを選択し、一番可能なモード(MPM)のサブセットと組み合わせて、粗選択予測モード(RMD)のセットとして構成する。
【0055】
ここで、予め設定された閾値は適応性的に設定でき、本出願の実施例はこれを限定しない。Nは任意の整数である。選択可能に、一番可能なモードのサブセットには現在のコーディングブロックに隣接する上方コーディングブロック及び左側コーディングブロックのターゲット予測モードが含まれることができ、この場合、一番可能なモードのサブセットには多くとも2つの予測モードが含まれる。
【0056】
ステップ304において、粗選択予測モードのセット及び一番可能なモードのサブセットにおける予測モードに対して、モードコストに従って昇順でソートして、RMD配列及びMPM配列を取得する。
【0057】
具体的には、RMD配列はRMD[ ]として表されても良く、MPM配列はMPM[ ]として表されても良く、各配列要素が1つのモードコスト値に対応する。
【0058】
ステップ305において、RMD[0]とMPM[0]が同じであるか否か。
【0059】
即ち、粗選択予測モードのセットのモードコストの最小値と一番可能なモードのサブセットのモードコストの最小値が同じであるか否かを決定する。同じである場合、操作S309に移行し、異なる場合、操作S306に移行する。
【0060】
ステップ306において、RMD[0]及びRMD[1]に対応するモードタイプが直流モード及び平面モードに属するか否か。
【0061】
即ち、粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の2つの予測モードタイプが直流モード及び平面モードに属するか否かを決定する。そうである場合、即ち、最初の2つの予測モードタイプには直流モード及び平面モードのみがある場合、操作S309に移行し、そうではない場合、即ち、最初の2つの予測モードのうちの少なくとも1つのモードタイプが角度モードである場合、操作S307に移行する。
【0062】
S307において、RMD[0]及びRMD[1]に対応するモードタイプが角度モードに属し、RMD[2]及びRMD[3]に対応するモードタイプには直流または平面モードが存在するか否か。
【0063】
粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の2つの予測モードタイプが角度モードに属し、かつ第3及び第4の予測モードのうちの少なくとも1つのモードタイプが直流モードまたは平面モードである場合、操作S308に移行する。
【0064】
粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の2つの予測モードのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合、操作S309に移行し、粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の2つの予測モードタイプが角度モードに属し、第3及び第4の予測モードには直流モード及び平面モードが存在しない場合、操作S309に移行する。
【0065】
S308において、M=4であり、RMD[2]を平面モードに対応するモードコストに代入し、RMD[3]を直流モードに対応するモードコストに代入する。
【0066】
配列要素と予測モードとの間に対応関係が存在しているため、モードコストの強制代入調整により、平面モード及び直流モードのソート結果の最初の4つに調整することを確保することができ、代入調整前のRMD[0]及びRMD[1]に対応する予測モードと代入調整されたRMD[2]及びRMD[3]に対応する予測モードとを候補モードのサブセットにおけるモードとして決定する。候補モードのサブセットに含まれるモードの数は4つである。
【0067】
本出願の実施例において、直流モード及び平面モードが、現在のコーディングブロックが平坦領域に属するか否かをより良く反映できることを考慮するため、直流モード及び平面モードに対応するモードコストが小さい場合、例えば、SATDコスト値が小さい場合、直流モード及び平面モードで現在のコーディングブロックをコーディング処理して得られたコーディング結果が望ましいと考えられるため、候補モードのサブセットにおけるモードとして好ましく選択される。
【0068】
S309において、重複しないMPMモードと組み合わせて、候補モードのサブセットを決定する。
【0069】
操作S305から操作S309に移行する場合、M=1であり、一番可能なモードのサブセットにおけるモードコストが最も小さい予測モードが候補モードのサブセットにおける1つのモードになることを意味するとともに、一番可能なモードのサブセットに当該モードコストが最も小さい予測モードとは異なるモードがあるか否かを決定し、ある場合、候補モードのサブセットにおけるモードとして一括して決定し、即ち、このとき一番可能なモードのサブセットは候補モードのサブセットである。
【0070】
操作S306から操作S309に移行する場合、M=2であり、RMD[0]及びRMD[1]に対応する直流モード及び平面モードが候補モードのサブセットにおける2つのモードになることを意味するとともに、一番可能なモードのサブセットにおけるこの2つの予測モードとは異なるモードと組み合わせて、候補モードのサブセットとして構成し、このとき、候補モードのサブセットに含まれるモードの数は4つを超えない。
【0071】
操作S307から操作S309に移行する場合、M=3であり、RMD[0]、RMD[1]及びRMD[2]に対応する予測モードが候補モードのサブセットにおける3つのモードになることを意味するとともに、一番可能なモードのサブセットにおけるこの3つの予測モードとは異なるモードと組み合わせて、候補モードのサブセットとして構成し、このとき、候補モードのサブセットに含まれるモードの数は5つを超えない。
【0072】
ステップ310において、候補モードのサブセットにおける予測モードのレート歪みコストを計算する。
【0073】
ステップ311において、レート歪みコストの最小の予測モードをターゲット予測モードとして選択する。
【0074】
ステップ312、終了。
【0075】
本出願の実施例の技術案によれば、コーディング処理プロセスにおいてコーディング予測モードの選択を最適化し、HEVCエンコーダにおけるフレーム内予測モードを選択する際のRDOコストに関する冗長計算を節約し、コーディング処理効率を向上させる。
【0076】
図4は本出願の実施例により開示される画像コーディング処理装置の概略構成図であり、本出願の実施例は、画像に対してコーディングする場合に適用することができ、当該装置はソフトウェアおよび/またはハードウェアで実現でき、計算能力を有する任意の電子機器、例えば端末、サーバなどに統合することができる。
【0077】
図4に示すように、本出願の実施例により開示される画像コーディング処理装置400は、粗選択予測モードのセット決定モジュール401と、モード選別モジュール402と、候補モードのサブセット決定モジュール403と、ターゲット予測モード決定モジュール404と、コーディング処理モジュール405と、を含むことができる。
【0078】
粗選択予測モードのセット決定モジュール401は、画像コーディングプロセスにおいて現在のコーディングブロックの粗選択予測モードのセットを決定することに用いられ、ここで、粗選択予測モードのセットには現在のコーディングブロックの一番可能なモードのサブセットが含まれる。
【0079】
モード選別モジュール402は、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定することに用いられる。
【0080】
候補モードのサブセット決定モジュール403は、第1予測モードと第2予測モードのモードコストが異なる場合、粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って、候補モードのサブセットを決定することに用いられる。
【0081】
ターゲット予測モード決定モジュール404は、候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定することに用いられる。
【0082】
コーディング処理モジュール405は、ターゲット予測モードを使用して現在のコーディングブロックをコーディングすることに用いられる。
【0083】
選択可能に、候補モードのサブセット決定モジュール403は、
第1予測モードと第2予測モードのモードコストが同じである場合、一番可能なモードのサブセットを候補モードのサブセットとすることにさらに用いられる。
【0084】
選択可能に、候補モードのサブセット決定モジュール403は、第1サブセット決定ユニットを含み、
第1サブセット決定ユニットは、第1予測モードと第2予測モードのモードコストが異なり、かつ粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たす場合、予め設定された数の予測モードを使用して候補モードのサブセットを決定することに用いられ、
ここで、予め設定されたモード条件は、予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが角度モードに属し、残りの予測モードタイプのうちの少なくとも1つが直流モードまたは平面モードに属することを含む。
【0085】
選択可能に、第1サブセット決定ユニットは、具体的には、
第1予測モードと第2予測モードのモードコストが異なり、かつ粗選択予測モードのセットにおけるモードコストの昇順ソート結果に基づいて、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たす場合、予め設定された数の予測モードにおける最初の2つの予測モード及び粗選択予測モードのセットにおけるモードタイプが直流モード及び平面モードに属する予測モードを候補モードのサブセットとして構成する。
【0086】
選択可能に、候補モードのサブセット決定モジュール403は、第2サブセット決定ユニットをさらに含み、
第2サブセット決定ユニットは、第1予測モードと第2予測モードのモードコストが異なり、かつ粗選択予測モードのセットにおけるモードコストの昇順ソート結果に従って、最初の予め設定された数の予測モードタイプが予め設定されたモード条件を満たさない場合、予め設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定することに用いられる。
【0087】
選択可能に、第2サブセット決定ユニットは、具体的には、
第1予測モードと第2予測モードのモードコストが異なり、かつ予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが角度モードに属し、残りの予測モードタイプに直流モード及び平面モードが存在しない場合、予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定し、
または、
第1予測モードと第2予測モードのモードコストが異なり、かつ予め設定された数の予測モードにおいて、最初の2つの予測モードタイプのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合、予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定し、
または、
第1予測モードと第2予測モードのモードコストが異なり、かつ予め設定された数の予測モードにおいて、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、予め設定された数の予測モードにおける最初の設定された数の予測モード及び一番可能なモードのサブセットを使用して、候補モードのサブセットを決定する。
【0088】
選択可能に、第2サブセット決定ユニットは、
予め設定された数の予測モードにおいて、最初の設定された数の予測モードと一番可能なモードのサブセットとの間の重複モードを決定するための重複モード決定サブユニットと、
予め設定された数の予測モードにおいて、最初の設定された数の予測モード及び一番可能なモードのサブセットから重複モードを除去し、残りのモードを候補モードのサブセットとして構成するための重複モード除去サブユニットと、を含む。
【0089】
選択可能に、最初の2つの予測モードタイプが直流モード及び平面モードに属する場合、設定された数の値が、前記最初の2つの予測モードタイプが角度モードに属する場合の値より小さく、または、最初の2つの予測モードタイプのうちの一方のモードタイプが角度モードであり、他方のモードタイプが直流モードまたは平面モードである場合の値より小さい。
【0090】
選択可能に、ターゲット予測モード決定モジュール404は、
候補モードのサブセットにおける予測モードのレート歪みコストを計算するためのレート歪みコスト計算ユニットと、
レート歪みコストに基づいて、候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定するためのターゲット予測モード決定ユニットと、を含む。
【0091】
選択可能に、粗選択予測モードのセット決定モジュール401は、
ターゲットコーディング規格に基づいて、画像コーディングプロセスにおいて現在のコーディングブロックの少なくとも1つのフレーム内予測モードを決定するためのフレーム内予測モード決定ユニットと、
フレーム内予測モードのモードコストを計算し、モードコストに基づいて、少なくとも1つのフレーム内予測モードから代替モードのサブセットを決定するための代替モードのサブセット決定ユニットと、
現在のコーディングブロックの隣接ブロックのターゲット予測モードに基づいて、現在のコーディングブロックの一番可能なモードのサブセットを決定するための一番可能なモードサブセット決定ユニットと、
代替モードのサブセット及び一番可能なモードのサブセットを現在のコーディングブロックの粗選択予測モードのセットとして決定するための粗選択予測モードのセット決定ユニットと、を含む。
【0092】
選択可能に、一番可能なモードのサブセットには現在のコーディングブロックに隣接する上方コーディングブロック及び左側コーディングブロックのターゲット予測モードが含まれる。
【0093】
本出願の実施例により開示される画像コーディング処理装置400は、本出願の実施例により開示される任意の画像コーディング処理方法を実行でき、方法を実行することに対応する機能モジュール及び有益な効果を備える。本出願の装置の実施例において詳細に説明されてない内容は、本出願の任意の方法の実施例の説明を参照することができる。
【0094】
本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
本出願の実施例によれば、本出願は、コンピュータプログラムを提供し、コンピュータプログラムは、コンピュータに本出願によって提供される画像コーディング処理方法を実行させる。
【0095】
図5に示すように、図5は本出願の実施例に係る画像コーディング処理方法を実現するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図していない。
【0096】
図5に示すように、当該電子機器は、1つ又は複数のプロセッサ501と、メモリ502と、高速インターフェースと低速インターフェースを含む、各コンポーネントを接続するインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に応じて他の方式で取り付けることができる。プロセッサは、外部入力/出力装置(インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行可能な命令を処理することができる。他の実施形態では、必要であれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各機器は、部分的な必要な操作(例えば、サーバアレイ、1グループのブレードサーバ、又はマルチプロセッサシステムとする)を提供する。図5では、1つのプロセッサ501を例とする。
【0097】
メモリ502は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。その中、前記メモリには、少なくとも1つのプロセッサが本出願により提供される画像コーディング処理方法を実行できるように、少なくとも1つのプロセッサによって実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本出願により提供される画像コーディング処理方法を実行させるためのコンピュータ命令が記憶されている。
【0098】
メモリ502は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例における画像コーディング処理方法に対応するプログラム命令/モジュール、例えば、図4に示す粗選択予測モードのセット決定モジュール401、モード選別モジュール402、候補モードのサブセット決定モジュール403、ターゲット予測モードの決定モジュール404、及びコーディング処理モジュール405のような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶する。プロセッサ501は、メモリ502に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記方法の実施例における画像コーディング処理方法を実現する。
【0099】
メモリ502は、ストレージプログラム領域とストレージデータ領域とを含むことができ、ここで、ストレージプログラム領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、ストレージデータ領域は、電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ502は、高速ランダム存取メモリを含むことができ、非一時的なメモリをさらに含むことができ、例えば、少なくとも1つのディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ502は、プロセッサ501に対して遠隔に設置されたメモリを含むことができ、これらの遠隔メモリは、ネットワークを介して電子機器に接続されることができる。上記のネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定しない。
【0100】
本出願の実施例の画像コーディング処理方法を実現するための電子機器は、入力装置503と出力装置504とをさらに含むことができる。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方式を介して接続することができ、図5では、バスを介して接続することを例とする。
【0101】
入力装置503は、入力された数字又は文字情報を受信し、電子機器のユーザ設置及び機能制御に関するキー信号入力を発生することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置504は、ディスプレイデバイス、補助照明デバイス(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定しない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。
【0102】
本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施され、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
【0103】
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することができる。本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0104】
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形態(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
【0105】
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバー)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
【0106】
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。
【0107】
本出願の実施例の技術案によれば、粗選択予測モードのセットにおけるモードコストが第1閾値より小さい第1予測モードを決定し、一番可能なモードのサブセットにおけるモードコストが第2閾値より小さい第2予測モードを決定し、第1予測モードと第2予測モードのモードコストが同じか否かを決定し、第1予測モードと第2予測モードのモードコストが異なる場合、粗選択予測モードのセットにおけるモードコストのソート結果およびモードタイプに従って候補モードのサブセットを決定し、現在のコーディングブロックをコーディングするために候補モードのサブセットから現在のコーディングブロックのターゲット予測モードを決定することにより、画像コーディング処理プロセスにおいてコーディング予測モードに対する選択を最適化し、画像コーディングの計算量を減少させ、コーディング効率を向上させることができる。
【0108】
なお、上記に示される様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
【0109】
上記具体的な実施形態は、本出願に対する保護範囲を制限するものではない。当業者は、設計要求と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本出願の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれなければならない。
図1
図2
図3
図4
図5