特表2025-501391 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッドの特許一覧

特表2025-501391ビデオ・コーディングのためのクロスコンポーネント予測のための方法および装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
2C
2D
2E
3
4
5
6
7
8
9A-9B
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2025-01-17

(54)【発明の名称】ビデオ・コーディングのためのクロスコンポーネント予測のための方法および装置

(51)【国際特許分類】

H04N 19/117 20140101AFI20250109BHJP

H04N 19/136 20140101ALI20250109BHJP

H04N 19/176 20140101ALI20250109BHJP

H04N 19/593 20140101ALI20250109BHJP

【ＦＩ】

H04N19/117

H04N19/136

H04N19/176

H04N19/593

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2024541757

(86)(22)【出願日】2023-01-09

(85)【翻訳文提出日】2024-07-10

(86)【国際出願番号】 US2023010395

(87)【国際公開番号】W WO2023133312

(87)【国際公開日】2023-07-13

(31)【優先権主張番号】63/298,159

(32)【優先日】2022-01-10

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】521248394

【氏名又は名称】ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッド

【氏名又は名称原語表記】ＢＥＩＪＩＮＧＤＡＪＩＡＩＮＴＥＲＮＥＴＩＮＦＯＲＭＡＴＩＯＮＴＥＣＨＮＯＬＯＧＹＣＯ．，ＬＴＤ．

(74)【代理人】

【識別番号】100120031

【弁理士】

【氏名又は名称】宮嶋学

(74)【代理人】

【識別番号】100107582

【弁理士】

【氏名又は名称】関根毅

(74)【代理人】

【識別番号】100217940

【弁理士】

【氏名又は名称】三並大悟

(72)【発明者】

【氏名】クオ、チョー－ウェイ

(72)【発明者】

【氏名】シウ、シャオユー

(72)【発明者】

【氏名】ヤン、ニン

(72)【発明者】

【氏名】チュー、ホン－チェン

(72)【発明者】

【氏名】チェン、イー－ウェン

(72)【発明者】

【氏名】チェン、ウェイ

(72)【発明者】

【氏名】カオ、ハン

(72)【発明者】

【氏名】ワン、シャンリン

(72)【発明者】

【氏名】ユイ、ビン

【テーマコード（参考）】

5C159

【Ｆターム（参考）】

5C159MA04

5C159MA21

5C159MC11

5C159ME01

5C159PP15

5C159PP16

5C159RC11

5C159TA31

5C159TB08

5C159TC42

5C159TD16

5C159UA02

5C159UA05

(57)【要約】

本開示は、ビデオ・データを復号するための方法を提供する。本方法は、ビットストリームからビデオ・ブロックを取得することと、多重線形回帰（ＭＬＲ）モデルを導出するための領域を決定することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを取得することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを使用して、ＭＬＲモデルを導出することと、ビデオ・ブロックにおけるクロマ・サンプルの各々を、ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測することと、予測されたクロマ・サンプルを使用して、復号されたビデオ・ブロックを取得することとを含む。

【特許請求の範囲】

【請求項1】

ビデオ・データを復号するための方法であって、
ビットストリームからビデオ・ブロックを取得することと、
多重線形回帰（ＭＬＲ）モデルを導出するための領域を決定することと、
前記領域におけるルーマ・サンプル値とクロマ・サンプル値とを取得することと、
前記領域における前記ルーマ・サンプル値と前記クロマ・サンプル値とを使用して、前記ＭＬＲモデルを導出することと、
前記ビデオ・ブロックにおけるクロマ・サンプルの各々を、前記ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測することと、
前記予測されたクロマ・サンプルを使用して、復号されたビデオ・ブロックを取得することと
を含む、方法。

【請求項2】

前記ＭＬＲモデルが、少なくとも２つの係数α_ｉ（ｉ＝０・・・Ｎ－１、Ｎがフィルタ・タップの数である）と１つのオフセットβとを備える、請求項１に記載の方法。

【請求項3】

前記領域が、前記ビデオ・ブロックに隣接する再構成されたクロマ・サンプルおよび対応するルーマ・サンプルの左の１つもしくは複数の列および／または上の１つもしくは複数の行を含む、請求項１に記載の方法。

【請求項4】

前記領域におけるルーマ・サンプル値とクロマ・サンプル値とを前記取得することが、
前記再構成されたクロマ・サンプルおよび対応するルーマ・サンプルの値を、変更なしに、直接使用すること
を含む、請求項３に記載の方法。

【請求項5】

前記領域における前記ルーマ・サンプル値と前記クロマ・サンプル値とを使用して、前記ＭＬＲモデルを前記導出することが、
６つのルーマ・サンプルと１つのオフセットとを使用して１つのクロマ・サンプルを予測するために、６つの係数α_ｉ（ｉ＝０・・・５）と１つのオフセットβとをもつＭＬＲモデルを導出すること
を含む、請求項１に記載の方法。

【請求項6】

前記領域における前記ルーマ・サンプル値と前記クロマ・サンプル値とを使用して、前記ＭＬＲモデルを前記導出することが、
擬似逆行列計算と正規方程式とを使用して前記ＭＬＲモデルを導出すること
を含む、請求項１に記載の方法。

【請求項7】

前記ビデオ・ブロックにおけるクロマ・サンプルの各々を前記予測することが、
再構成された対応するルーマ・サンプルの値を、変更なしに、直接使用すること
を含む、請求項１に記載の方法。

【請求項8】

ビデオ・データを符号化するための方法であって、
ビデオ・フレームからビデオ・ブロックを取得することと、
多重線形回帰（ＭＬＲ）モデルを導出するための領域を決定することと、
前記領域におけるルーマ・サンプル値とクロマ・サンプル値とを取得することと、
前記領域における前記ルーマ・サンプル値と前記クロマ・サンプル値とを使用して、前記ＭＬＲモデルを導出することと、
前記ビデオ・ブロックにおけるクロマ・サンプルの各々を、前記ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測することと、
前記予測されたクロマ・サンプルを使用して、符号化されたビデオ・ブロックを取得することと
を含む、方法。

【請求項9】

前記ＭＬＲモデルが、少なくとも２つの係数α_ｉ（ｉ＝０・・・Ｎ－１、Ｎがフィルタ・タップの数である）と１つのオフセットβとを備える、請求項８に記載の方法。

【請求項10】

前記領域が、前記ビデオ・ブロックに隣接する再構成されたクロマ・サンプルおよび対応するルーマ・サンプルの左の１つもしくは複数の列および／または上の１つもしくは複数の行を含む、請求項８に記載の方法。

【請求項11】

前記領域におけるルーマ・サンプル値とクロマ・サンプル値とを前記取得することが、
前記再構成されたクロマ・サンプルおよび対応するルーマ・サンプルの値を、変更なしに、直接使用すること
を含む、請求項１０に記載の方法。

【請求項12】

【請求項13】

前記領域における前記ルーマ・サンプル値と前記クロマ・サンプル値とを使用して、前記ＭＬＲモデルを前記導出することが、
擬似逆行列計算と正規方程式とを使用して前記ＭＬＲモデルを導出すること
を含む、請求項８に記載の方法。

【請求項14】

前記ビデオ・ブロックにおけるクロマ・サンプルの各々を前記予測することが、
再構成された対応するルーマ・サンプルの値を、変更なしに、直接使用すること
を含む、請求項８に記載の方法。

【請求項15】

１つまたは複数のプロセッサと、
コンピュータ実行可能命令を記憶する１つまたは複数のストレージ・デバイスであって、前記コンピュータ実行可能命令は、実行されたとき、前記１つまたは複数のプロセッサに、請求項１から１４のいずれか一項に記載の方法の動作を実施させる、ストレージ・デバイスと、
を備えるコンピュータ・システム。

【請求項16】

コンピュータ実行可能命令を記憶するコンピュータ・プログラム製品であって、前記コンピュータ実行可能命令は、実行されたとき、１つまたは複数のプロセッサに、請求項１から１４のいずれか一項に記載の方法の動作を実施させる、コンピュータ・プログラム製品。

【請求項17】

コンピュータ実行可能命令を記憶するコンピュータ可読媒体であって、前記コンピュータ実行可能命令は、実行されたとき、１つまたは複数のプロセッサに、ビットストリームを受信することと、前記ビットストリームに基づいて、請求項１から７のいずれか一項に記載の方法の動作を実施することとを行わせる、コンピュータ可読媒体。

【請求項18】

コンピュータ実行可能命令を記憶するコンピュータ可読媒体であって、前記コンピュータ実行可能命令は、実行されたとき、１つまたは複数のプロセッサに、請求項８から１４のいずれか一項に記載の方法の動作を実施することと、予測されたクロマ・サンプルに関連する符号化されたビデオ情報を含むビットストリームを送信することとを行わせる、コンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本開示の態様は、一般に、ビデオ・コーディングおよび圧縮に関し、より詳細には、クロスコンポーネント予測技術のための方法および装置に関する。

【背景技術】

【0002】

ビデオ・データを圧縮するために、様々なビデオ・コーディング技法が使用され得る。ビデオ・コーディングは、１つまたは複数のビデオ・コーディング規格に従って実施される。たとえば、ビデオ・コーディング規格は、多用途ビデオ・コーディング（ＶＶＣ）、高効率ビデオ・コーディング（Ｈ．２６５／ＨＥＶＣ）、アドバンスト・ビデオ・コーディング（Ｈ．２６４／ＡＶＣ）、ムービング・ピクチャ・エキスパート・グループ（ＭＰＥＧ）コーディングなどを含む。ビデオ・コーディングは、一般に、ビデオ画像またはシーケンスに存在する冗長性を活用する予測方法（たとえば、インター予測、イントラ予測など）を利用する。ビデオ・コーディング技法の重要な目的は、ビデオ品質に対する劣化を回避するかまたは最小限に抑えながら、ビデオ・データを、より低いビット・レートを使用する形式に圧縮することである。

【0003】

クロスコンポーネント冗長性を低減するために、クロスコンポーネント線形モデル（ＣＣＬＭ：ｃｒｏｓｓ－ｃｏｍｐｏｎｅｎｔｌｉｎｅａｒｍｏｄｅｌ）予測モードが一般的にビデオ・コーディング規格において使用され、これについて、クロマ・サンプルが、同じＣＵの再構成されたルーマ・サンプルに基づいて予測される。既存のＣＣＬＭまたはマルチモデルＬＭ（ＭＭＬＭ：Ｍｕｌｔｉ－ｍｏｄｅｌＬＭ）予測モードでは、ルーマ・サンプルが分類された１つまたは複数のサンプル・グループに従って、１つまたは複数の線形予測モデルが予測のために使用される。既存のＣＣＬＭまたはＭＭＬＭ予測モードにおける分類は、一般に、ルーマＤＣ値を考慮し得、これは、コーディング効率をさらに改善することができる他の態様における潜在的余地を残す。

【発明の概要】

【0004】

以下は、本開示による１つまたは複数の態様の簡略化された概要を、そのような態様の基本的理解を提供するために提示する。この概要は、すべての企図された態様の広範な概観ではなく、すべての態様の主要なまたは重要な要素を識別するものでも、いずれかのまたはすべての態様の範囲を定めるものでもない。その唯一の目的は、後で提示されるより詳細な説明の前置きとして、１つまたは複数の態様のいくつかの概念を簡略化された形式で提示することである。

【0005】

一実施形態によれば、ビデオ・データを復号するための方法を提供する。本方法は、ビットストリームからビデオ・ブロックを取得することと、多重線形回帰（ＭＬＲ）モデルを導出するための領域を決定することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを取得することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを使用して、ＭＬＲモデルを導出することと、ビデオ・ブロックにおけるクロマ・サンプルの各々を、ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測することと、予測されたクロマ・サンプルを使用して、復号されたビデオ・ブロックを取得することとを含む。

【0006】

一実施形態によれば、ビデオ・データを符号化するための方法を提供する。本方法は、ビデオ・フレームからビデオ・ブロックを取得することと、多重線形回帰（ＭＬＲ）モデルを導出するための領域を決定することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを取得することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを使用して、ＭＬＲモデルを導出することと、ビデオ・ブロックにおけるクロマ・サンプルの各々を、ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測することと、予測されたクロマ・サンプルを使用して、符号化されたビデオ・ブロックを取得することとを含む。

【0007】

一実施形態によれば、１つまたは複数のプロセッサと、コンピュータ実行可能命令を記憶する１つまたは複数のストレージ・デバイスとを備えるコンピュータ・システムであって、コンピュータ実行可能命令は、実行されたとき、１つまたは複数のプロセッサに、ビットストリームからビデオ・ブロックを取得することと、多重線形回帰（ＭＬＲ）モデルを導出するための領域を決定することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを取得することと、領域におけるルーマ・サンプル値とクロマ・サンプル値とを使用して、ＭＬＲモデルを導出することと、ビデオ・ブロックにおけるクロマ・サンプルの各々を、ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測することと、予測されたクロマ・サンプルを使用して、復号されたビデオ・ブロックを取得することとを含む動作を実施させる、コンピュータ・システムを提供する。

【0008】

提案される多重線形回帰（ＭＬＲ）モデルを使用することによって、予測されるべき、コロケートされたルーマ・サンプル、隣接するルーマ・サンプル、およびクロマ・サンプルの間のサンプル間（ｉｎｔｅｒ－ｓａｍｐｌｅ）相関がキャプチャされて、予測精度をさらに改善し得る。本開示の他の利点は、以下の説明から明らかになろう。

【0009】

開示される態様を例示するためにおよび限定しないように提供される添付の図面とともに、開示される態様が以下で説明される。

【図面の簡単な説明】

【0010】

【図1】図１は、一般的なブロックベースのハイブリッド・ビデオ符号化システムのブロック図である。

【図2】図２Ａ～図２Ｅは、４分区分と、水平２分区分と、垂直２分区分と、水平３分区分と、垂直３分区分とを含む、５つの分割タイプを示す図である。

【図3】図３は、ブロックベースのビデオ・デコーダの概略ブロック図である。

【図4】図４は、ＣＣＬＭモードに関与する、左および上のサンプルと、現在のブロックのサンプルとのロケーションの一例を示す図である。

【図5】図５は、しきい値（Ｔｈｒｅｓｈｏｌｄ）の値に基づいて、隣接するサンプルを２つのグループに分類する一例を示す図である。

【図6】図６は、ニー・ポイントに基づいて、隣接するサンプルを２つのグループに分類する一例を示す図である。

【図7】図７は、本開示の１つまたは複数の態様による、ビデオ・データを復号するための方法のワークフローを示す図である。

【図8】図８は、本開示の１つまたは複数の態様による、ビデオ・データを符号化するための方法のワークフローを示す図である。

【図9】図９Ａおよび図９Ｂは、クロマ・サンプルと１つまたは複数のルーマ・サンプルとの間の相関についての概略図である。

【図10】図１０は、本開示の１つまたは複数の態様による、多重線形回帰（ＭＬＲ）モデルにおいて６タップが使用される一例を示す図である。

【図11】図１１は、本開示の１つまたは複数の態様による、ビデオ・データを符号化するための方法のワークフローを示す図である。

【図12】図１２は、本開示の１つまたは複数の態様による、ビデオ・データを復号するための方法のワークフローを示す図である。

【図13】図１３は、本開示の１つまたは複数の態様による、例示的なコンピューティング・システムを示す図である。

【発明を実施するための形態】

【0011】

次に、いくつかの例示的な実装形態を参照しながら、本開示が論じられる。これらの実装形態は、本開示の範囲に対する限定を示唆するのではなく、当業者が、本開示の実施形態をより良く理解し、したがって実装することを可能にするために論じられるにすぎないことを理解されたい。

【0012】

ＶＶＣ規格の第１のバージョンが、２０２０年７月に確定され、これは、前の世代のビデオ・コーディング規格ＨＥＶＣと比較して、約５０％のビットレート節約または等価な知覚品質を与える。ＶＶＣ規格は、それの前身よりも有意なコーディング改善を提供するが、追加のコーディング・ツールにより、優れたコーディング効率が達成され得るという証拠がある。最近、ＩＴＵ－ＴＶＥＣＧおよびＩＳＯ／ＩＥＣＭＰＥＧのコラボレーション下でのジョイント・ビデオ探索チーム（ＪＶＥＴ：ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ）が、ＶＶＣに勝るコーディング効率の実質的な拡張を可能にすることができる先進技術の探索を開始した。２０２１年４月に、拡張圧縮モデル（ＥＣＭ：ＥｎｈａｎｃｅｄＣｏｍｐｒｅｓｓｉｏｎＭｏｄｅｌ）と呼ばれる、あるソフトウェア・コードベースが、将来のビデオ・コーディング探索作業のために確立された。ＥＣＭ参照ソフトウェアは、ＶＶＣのためにＪＶＥＴによって開発されたＶＶＣテスト・モデル（ＶＴＭ：ＶＶＣＴｅｓｔＭｏｄｅｌ）に基づいており、いくつかの既存のモジュール（たとえば、イントラ／インター予測、変換、ループ内フィルタなど）がさらに拡張および／または改善された。将来、ＶＶＣ規格を越えたいかなる新しいコーディング・ツールも、ＥＣＭプラットフォームに組み込まれ、ＪＶＥＴ共通テスト条件（ＣＴＣ：ｃｏｍｍｏｎｔｅｓｔｃｏｎｄｉｔｉｏｎ）を使用してテストされる必要がある。

【0013】

すべての先行するビデオ・コーディング規格と同様に、ＥＣＭは、ブロックベースのハイブリッド・ビデオ・コーディング・フレームワーク上に構築される。図１は、一般的なブロックベースのハイブリッド・ビデオ符号化システムのブロック図を示す。入力ビデオ信号が、ブロックごとに処理される（コーディング・ユニット（ＣＵ）と呼ばれる）。ＥＣＭ－１．０では、ＣＵは、最高１２８×１２８ピクセルであり得る。しかしながら、ＶＶＣと同じく、１つのコーディング・ツリー・ユニット（ＣＴＵ）が、４分木／２分木／３分木に基づいて、変動するローカル特性に適応するようにＣＵに分割される。マルチタイプ木構造では、１つのＣＴＵが、最初に、４分木構造によって区分される。次いで、各４分木リーフ・ノードが、２分木および３分木構造によってさらに区分され得る。図２Ａ、図２Ｂ、図２Ｃ、図２Ｄおよび図２Ｅに示されているように、５つの分割タイプ、４分区分と、垂直２分区分と、水平２分区分と、垂直拡張４分区分と、水平拡張４分区分とがある。図１では、空間予測および／または時間予測が実施され得る。空間予測（または「イントラ予測」）は、同じビデオ・ピクチャ／スライスにおけるすでにコーディングされた隣接するブロックのサンプル（これは参照サンプルと呼ばれる）からのピクセルを使用して、現在のビデオ・ブロックを予測する。空間予測は、ビデオ信号に固有の空間冗長性を低減する。時間予測（「インター予測」または「動き補償予測」とも呼ばれる）は、すでにコーディングされたビデオ・ピクチャからの再構成されたピクセルを使用して、現在のビデオ・ブロックを予測する。時間予測は、ビデオ信号に固有の時間冗長性を低減する。所与のＣＵについての時間予測信号が、通常、現在のＣＵとそれの時間参照との間の動きの量および方向を示す１つまたは複数の動きベクトル（ＭＶ）によってシグナリングされる。また、複数の参照ピクチャがサポートされる場合、１つの参照ピクチャ・インデックスがさらに送られ、これは、参照ピクチャ・ストア中のどの参照ピクチャから時間予測信号が来るかを識別するために使用される。空間および／または時間予測の後に、エンコーダにおけるモード判断ブロックが、たとえば、レートひずみ最適化方法に基づいて、最良の予測モードを選定する。次いで、予測ブロックが現在のビデオ・ブロックから減算され、予測残差が、変換を使用して無相関化され、量子化される。量子化された残差係数は、再構成された残差を形成するために逆量子化および逆変換され、再構成された残差は、次いで、ＣＵの再構成された信号を形成するために予測ブロックに加算される。再構成されたＣＵが参照ピクチャ・ストアに入れられ、将来のビデオ・ブロックをコーディングするために使用される前に、デブロッキング・フィルタ、サンプル適応オフセット（ＳＡＯ）、および適応ループ内フィルタ（ＡＬＦ）など、さらなるループ内フィルタ処理が、再構成されたＣＵに適用される。出力ビデオ・ビットストリームを形成するために、コーディング・モード（インターまたはイントラ）と、予測モード情報と、動き情報と、量子化された残差係数とがすべて、エントロピー・コーディング・ユニットに送られて、ビットストリームを形成するためにさらに圧縮およびパックされる。

【0014】

図３は、ブロックベースのビデオ・デコーダの概略ブロック図を示す。ビデオ・ビットストリームが、最初に、エントロピー復号ユニットにおいてエントロピー復号される。コーディング・モードおよび予測情報が、（イントラ・コーディングされる場合）空間予測ユニット、または（インター・コーディングされる場合）時間予測ユニットのいずれかに送られて、予測ブロックを形成する。残差変換係数が、逆量子化ユニットおよび逆変換ユニットに送られて、残差ブロックを再構成する。次いで、予測ブロックと残差ブロックとが合算される。再構成されたブロックはさらに、それが参照ピクチャ・ストアに記憶される前に、ループ内フィルタ処理を通り得る。次いで、参照ピクチャ・ストア中の再構成されたビデオが、ディスプレイ・デバイスを駆動するために送出され、また、将来のビデオ・ブロックを予測するために使用される。

【0015】

クロスコンポーネント冗長性を低減するために、クロスコンポーネント線形モデル（ＣＣＬＭ）予測モードがＶＶＣにおいて使用され、これについて、クロマ・サンプルが、以下のような線形モデルを使用することによって、同じＣＵの再構成されたルーマ・サンプルに基づいて予測される。
ｐｒｅｄ_Ｃ（ｉ，ｊ）＝α・ｒｅｃ_Ｌ’（ｉ，ｊ）＋β （１）

【0016】

ここで、ｐｒｅｄ_Ｃ（ｉ，ｊ）は、ＣＵにおける予測されたクロマ・サンプルを表し、ｒｅｃ_Ｌ’（ｉ，ｊ）は、再構成されたルーマ・サンプルｒｅｃ_Ｌ（ｉ，ｊ）に対してダウンサンプリングを実施することによって取得された、同じＣＵのダウンサンプリングされた再構成されたルーマ・サンプルを表し、αおよびβは、隣接するルーマ・クロマ・サンプル・ペアと呼ばれることがある、多くとも４つの隣接するクロマ・サンプルとそれらの対応するダウンサンプリングされたルーマ・サンプルとから導出された線形モデル・パラメータである。現在のクロマ・ブロックがＷ×Ｈのサイズを有すると仮定すると、Ｗ’およびＨ’が、以下のように取得される。

【0017】

ＬＭモードが適用されるとき、Ｗ’＝Ｗ、Ｈ’＝Ｈ。

【0018】

ＬＭ－Ａモードが適用されるとき、Ｗ’＝Ｗ＋Ｈ。

【0019】

ＬＭ－Ｌモードが適用されるとき、Ｈ’＝Ｈ＋Ｗ。

【0020】

ここで、ＬＭモードでは、線形モデル係数を計算するためにＣＵの上のサンプルと左のサンプルとが一緒に使用され、ＬＭ＿Ａモードでは、線形モデル係数を計算するためにＣＵの上のサンプルのみが使用され、ＬＭ＿Ｌモードでは、線形モデル係数を計算するためにＣＵの左のサンプルのみが使用される。

【0021】

クロマ・ブロックの上の隣接するサンプルのロケーションが、Ｓ［０，－１］．．．Ｓ［Ｗ’－１，－１］として示され、クロマ・ブロックの左の隣接するサンプルのロケーションが、Ｓ［－１，０］．．．Ｓ［－１，Ｈ’－１］として示される場合、４つの隣接するクロマ・サンプルの位置が、以下のように選択される。
－ＬＭモードが適用され、上の隣接するサンプルと左の隣接するサンプルの両方が利用可能であるとき、Ｓ［Ｗ’／４，－１］、Ｓ［３＊Ｗ’／４，－１］、Ｓ［－１，Ｈ’／４］、Ｓ［－１，３＊Ｈ’／４］が、４つの隣接するクロマ・サンプルの位置として選択される。
－ＬＭ－Ａモードが適用されるか、または上の隣接するサンプルのみが利用可能であるとき、Ｓ［Ｗ’／８，－１］、Ｓ［３＊Ｗ’／８，－１］、Ｓ［５＊Ｗ’／８，－１］、Ｓ［７＊Ｗ’／８，－１］が、４つの隣接するクロマ・サンプルの位置として選択される。
－ＬＭ－Ｌモードが適用されるか、または左の隣接するサンプルのみが利用可能であるとき、Ｓ［－１，Ｈ’／８］、Ｓ［－１，３＊Ｈ’／８］、Ｓ［－１，５＊Ｈ’／８］、Ｓ［－１，７＊Ｈ’／８］が、４つの隣接するクロマ・サンプルの位置として選択される。

【0022】

選択されたロケーションに対応する４つの隣接するルーマ・サンプルが、ダウンサンプリング動作によって取得され、取得された４つの隣接するルーマ・サンプルは、２つのより大きい値、すなわちｘ^０ _Ａおよびｘ^１ _Ａと、２つのより小さい値、すなわちｘ^０ _Ｂおよびｘ^１ _Ｂとを見つけるために４回比較される。２つのより大きい値および２つのより小さい値に対応するクロマ・サンプル値は、それぞれｙ^０ _Ａ、ｙ^１ _Ａ、ｙ^０ _Ｂおよびｙ^１ _Ｂとして示される。次いで、Ｘ_ａ、Ｘ_ｂ、Ｙ_ａおよびＹ_ｂが、次のように導出される。
Ｘ_ａ＝（ｘ^０ _Ａ＋ｘ^１ _Ａ＋１）＞＞１、
Ｘ_ｂ＝（ｘ^０ _Ｂ＋ｘ^１ _Ｂ＋１）＞＞１、
Ｙ_ａ＝（ｙ^０ _Ａ＋ｙ^１ _Ａ＋１）＞＞１、
Ｙ_ｂ＝（ｙ^０ _Ｂ＋ｙ^１ _Ｂ＋１）＞＞１
（２）

【0023】

最後に、線形モデル・パラメータαおよびβが、以下の式に従って取得される。

【数1】

【0024】

図４は、ＣＵにおけるＮ×Ｎクロマ・ブロックの左および上のサンプルのロケーションと、ＣＵにおける２Ｎ×２Ｎルーマ・ブロックの左および上のサンプルのロケーションとを含む、ＣＣＬＭモードに関与する、左および上のサンプルと、現在のブロックのサンプルとのロケーションの一例を示す。

【0025】

パラメータαを計算するための除算演算が、ルックアップ表により実装される。表を記憶するために必要とされるメモリを低減するために、ｄｉｆｆ値（最大値と最小値との間の差）およびパラメータαが、指数表記によって表される。たとえば、ｄｉｆｆは、４ビット有効部分と指数とを用いて近似される。したがって、１／ｄｉｆｆについての表が、以下のように、仮数の１６個の値について１６個の要素に低減される。
ＤｉｖＴａｂｌｅ［］＝｛０，７，６，５，５，４，４，３，３，２，２，１，１，１，１，０｝（５）

【0026】

これは、計算の複雑さを低減することと、必要とされる表を記憶するために必要とされるメモリ・サイズを低減することとの両方の利益を有することになる。

【0027】

上のテンプレートおよび左のテンプレートは、線形モデル係数を計算するために一緒に使用され得るほかに、それらは、ＬＭ＿ＡモードおよびＬＭ＿Ｌモードと呼ばれる他の２つのＬＭのモードにおいても代替的に使用され得る。

【0028】

ＬＭ＿Ｔモードでは、線形モデル係数を計算するために上のテンプレートのみが使用される。より多くのサンプルを得るために、上のテンプレートは、（Ｗ＋Ｈ）個のサンプルに拡張される。ＬＭ＿Ｌモードでは、線形モデル係数を計算するために左のテンプレートのみが使用される。より多くのサンプルを得るために、左のテンプレートは、（Ｈ＋Ｗ）個のサンプルに拡張される。

【0029】

ＬＭ＿ＬＴモードでは、線形モデル係数を計算するために左および上のテンプレートが使用される。

【0030】

４：２：０ビデオ・シーケンスについてのクロマ・サンプル・ロケーションを整合させるために、２つのタイプのダウンサンプリング・フィルタがルーマ・サンプルに適用されて、水平方向と垂直方向の両方において２対１ダウンサンプリング比を達成する。ダウンサンプリング・フィルタの選択が、ＳＰＳレベル・フラグによって指定される。２つのダウンサンプリング・フィルタは以下の通りであり、それらは、それぞれ、「タイプ－０」コンテンツおよび「タイプ－２」コンテンツに対応する。

【数2】

【0031】

上側基準線がＣＴＵ境界にあるとき、ダウンサンプリングされたルーマ・サンプルを作るために、１つのルーマ線（イントラ予測における一般的なライン・バッファ）のみが使用されることに留意されたい。

【0032】

このパラメータ算出は、復号プロセスの一部として実施され、単にエンコーダ検索動作としてのものではない。その結果、αおよびβ値をデコーダに伝達するために、シンタックスが使用されない。

【0033】

クロマ・イントラ・モード・コーディングの場合、合計８つのイントラ・モードが、クロマ・イントラ・モード・コーディングについて可能にされる。それらのモードは、５つの旧来のイントラ・モードと、３つのクロスコンポーネント線形モデル・モード（ＣＣＬＭ、ＬＭ＿Ａ、およびＬＭ＿Ｌ）とを含む。クロマ・モード・シグナリングおよび導出プロセスが、表１に示されている。クロマ・モード・コーディングは、対応するルーマ・ブロックのイントラ予測モードに直接依存する。ルーマ成分およびクロマ成分についての別個のブロック区分構造がＩ個のスライスにおいて有効にされるので、１つのクロマ・ブロックが複数のルーマ・ブロックに対応し得る。したがって、クロマＤＭモードの場合、現在のクロマ・ブロックの中心位置をカバーする、対応するルーマ・ブロックのイントラ予測モードが、直接継承される。

【表1】

【0034】

表２に示されているように、ｓｐｓ＿ｃｃｌｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値にかかわらず、単一の２値化表が使用される。

【表2】

【0035】

表２では、第１のビンは、それが通常モード（０）であるのかＬＭモード（１）であるのかを示す。それがＬＭモードである場合、次のビンは、それがＬＭ＿ＣＨＲＯＭＡ（０）であるか否かを示す。それがＬＭ＿ＣＨＲＯＭＡでない場合、次の１つのビンは、それがＬＭ＿Ｌ（０）であるのかＬＭ＿Ａ（１）であるのかを示す。この場合、ｓｐｓ＿ｃｃｌｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０であるとき、対応するｉｎｔｒａ＿ｃｈｒｏｍａ＿ｐｒｅｄ＿ｍｏｄｅについての２値化表の第１のビンは、エントロピー・コーディングより前に廃棄され得る。または、言い換えれば、第１のビンは、０であると推論され、したがってコーディングされない。この単一の２値化表は、ｓｐｓ＿ｃｃｌｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しい場合と１に等しい場合の両方について使用される。表２２中の最初の２つのビンは、それ自体のコンテキスト・モデルでコンテキストコーディング（ｃｏｎｔｅｘｔｃｏｄｅ）され、残りのビンはバイパス・コーディングされる。

【0036】

さらに、デュアル・ツリーにおけるルーマ・クロマ・レイテンシを低減するために、６４×６４ルーマ・コーディング・ツリー・ノードが、非分割（ＮｏｔＳｐｌｉｔ）（また、ＩＳＰが６４×６４ＣＵについて使用されない）またはＱＴにより区分されるとき、３２×３２／３２×１６クロマ・コーディング・ツリー・ノードにおけるクロマＣＵは、以下のようにしてＣＣＬＭを使用することを可能にされる。

【0037】

３２×３２クロマ・ノードが、非分割または区分ＱＴ分割である場合、３２×３２ノードにおけるすべてのクロマＣＵが、ＣＣＬＭを使用することができる。

【0038】

３２×３２クロマ・ノードが水平ＢＴで区分され、３２×１６子ノードが分割しないかまたは垂直ＢＴ分割を使用する場合、３２×１６クロマ・ノードにおけるすべてのクロマＣＵが、ＣＣＬＭを使用することができる。

【0039】

すべての他のルーマおよびクロマ・コーディング・ツリー分割条件では、ＣＣＬＭは、クロマＣＵについて可能にされない。

【0040】

ＥＣＭ展開中に、αおよびβの簡略化された導出（ｍｉｎ－ｍａｘ近似（ｍｉｎ－ｍａｘａｐｐｒｏｘｉｍａｔｉｏｎ））が除去される。代わりに、モデル・パラメータαおよびβを導出するための、ダウンサンプリングされたルーマ・サンプルの因果的再構成されたデータと、因果的クロマ・サンプルとの間の線形最小２乗解である。

【数3】

【0041】

ここで、Ｒｅｃ_Ｃ（ｉ）およびＲｅｃ’_Ｌ（ｉ）は、ターゲット・ブロックの周りの、再構成されたクロマ・サンプルと、ダウンサンプリングされたルーマ・サンプルとを示し、Ｉは、隣接するデータの合計サンプル数を示す。

【0042】

ＥＣＭ－１．０では、マルチモデルＬＭ（ＭＭＬＭ）予測モードが提案され、これについて、クロマ・サンプルが、以下のように２つの線形モデルを使用することによって、同じＣＵの再構成されたルーマ・サンプルに基づいて予測される。

【数4】

【0043】

ここで、ｐｒｅｄ_Ｃ（ｉ，ｊ）は、ＣＵにおける予測されたクロマ・サンプルを表し、ｒｅｃ_Ｌ’（ｉ，ｊ）は、同じＣＵのダウンサンプリングされた再構成されたルーマ・サンプルを表す。しきい値（Ｔｈｒｅｓｈｏｌｄ）は、隣接する再構成されたルーマ・サンプルの平均値として計算される。図５は、しきい値の値に基づいて、隣接するサンプルを２つのグループに分類する一例を示す。各グループについて、ｉがそれぞれ１および２に等しい、パラメータα_ｉおよびβ_ｉが、グループ内の最小ルーマ・サンプルＡ（Ｘ_Ａ，Ｙ_Ａ）および最大ルーマ・サンプルＢ（Ｘ_Ｂ，Ｙ_Ｂ）である、２つのサンプルからのルーマ値とクロマ値との間の直線関係から導出される。ここで、Ｘ_Ａ、Ｙ_Ａは、サンプルＡについてのｘ座標（すなわち、ルーマ値）値およびｙ座標（すなわち、クロマ値）値であり、Ｘ_Ｂ、Ｙ_Ｂは、サンプルＢについてのｘ座標値およびｙ座標値である。線形モデル・パラメータαおよびβが、以下の式に従って取得される。

【数5】

【0044】

そのような方法は、ｍｉｎ－ｍａｘ法（ｍｉｎ－ｍａｘｍｅｔｈｏｄ）とも呼ばれる。上記の式中の除算は、乗算およびシフトによって回避され、置き換えられ得る。

【0045】

正方形形状をもつコーディング・ブロックの場合、上記の２つの式が、直接適用される。非正方形コーディング・ブロックの場合、より長い境界の隣接するサンプルが、より短い境界の場合と同じ数のサンプルを有するように、最初にサブサンプリングされる。

【0046】

上のテンプレートおよび左のテンプレートが、線形モデル係数を計算するために一緒に使用されるシナリオのほかに、それら２つのテンプレートは、ＭＭＬＭ＿Ａモード、およびＭＭＬＭ＿Ｌモードと呼ばれる他の２つのＭＭＬＭモードにおいても代替的に使用され得る。

【0047】

ＭＭＬＭ＿Ａモードでは、線形モデル係数を計算するために、上のテンプレート中のピクセル・サンプルのみが使用される。より多くのサンプルを得るために、上のテンプレートは、（Ｗ＋Ｗ）のサイズに拡張される。ＭＭＬＭ＿Ｌモードでは、線形モデル係数を計算するために、左のテンプレート中のピクセル・サンプルのみが使用される。より多くのサンプルを得るために、左のテンプレートは、（Ｈ＋Ｈ）のサイズに拡張される。

【0048】

上側基準線がＣＴＵ境界にあるとき、ダウンサンプリングされたルーマ・サンプルを作るために、（イントラ予測のためにライン・バッファに記憶される）１つのルーマ行のみが使用されることに留意されたい。

【0049】

クロマ・イントラ・モード・コーディングの場合、合計１１個のイントラ・モードが、クロマ・イントラ・モード・コーディングについて可能にされる。それらのモードは、５つの旧来のイントラ・モードと、６つのクロスコンポーネント線形モデル・モード（ＣＣＬＭ、ＬＭ＿Ａ、ＬＭ＿Ｌ、ＭＭＬＭ、ＭＭＬＭ＿ＡおよびＭＭＬＭ＿Ｌ）とを含む。クロマ・モード・シグナリングおよび導出プロセスが、表に示されている。クロマ・モード・コーディングは、対応するルーマ・ブロックのイントラ予測モードに直接依存する。ルーマ成分およびクロマ成分についての別個のブロック区分構造がＩ個のスライスにおいて有効にされるので、１つのクロマ・ブロックが複数のルーマ・ブロックに対応し得る。したがって、クロマＤＭモードの場合、現在のクロマ・ブロックの中心位置をカバーする対応するルーマ・ブロックのイントラ予測モードが、直接継承される。

【0050】

【表3】

【0051】

また、ＭＭＬＭモードおよびＬＭモードが、適応様式で一緒に使用され得る。ＭＭＬＭの場合、２つの線形モデルは、以下の通りである。

【数6】

【0052】

ここで、ｐｒｅｄ_Ｃ（ｉ，ｊ）は、ＣＵにおける予測されたクロマ・サンプルを表し、ｒｅｃ_Ｌ’（ｉ，ｊ）は、同じＣＵのダウンサンプリングされた再構成されたルーマ・サンプルを表す。しきい値（Ｔｈｒｅｓｈｏｌｄ）は、単に、ルーマ平均値およびクロマ平均値に基づいて、それらの最小値および最大値とともに、決定され得る。図６は、矢印によって示されているニー・ポイントＴに基づいて、隣接するサンプルを２つのグループに分類する一例を示す。線形モデル・パラメータα_１およびβ_１が、最小ルーマ・サンプルＡ（Ｘ_Ａ，Ｙ_Ａ）およびしきい値（Ｘ_Ｔ，Ｙ_Ｔ）である、２つのサンプルからのルーマ値とクロマ値との間の直線関係から導出される。線形モデル・パラメータα_２およびβ_２が、最大ルーマ・サンプルＢ（Ｘ_Ｂ，Ｙ_Ｂ）およびしきい値（Ｘ_Ｔ，Ｙ_Ｔ）である、２つのサンプルからのルーマ値とクロマ値との間の直線関係から導出される。ここで、Ｘ_Ａ、Ｙ_Ａは、サンプルＡについてのｘ座標（すなわち、ルーマ値）値およびｙ座標（すなわち、クロマ値）値であり、Ｘ_Ｂ、Ｙ_Ｂは、サンプルＢについてのｘ座標値およびｙ座標値である。ｉがそれぞれ１および２に等しい、各グループについての線形モデル・パラメータα_ｉおよびβ_ｉは、以下の式に従って取得される。

【数7】

【0053】

正方形形状をもつコーディング・ブロックの場合、上記の式が、直接適用される。非正方形コーディング・ブロックの場合、より長い境界の隣接するサンプルが、より短い境界の場合と同じ数のサンプルを有するように、最初にサブサンプリングされる。

【0054】

上のテンプレートおよび左のテンプレートが、線形モデル係数を決定するために一緒に使用されるシナリオのほかに、それら２つのテンプレートは、それぞれＭＭＬＭ＿Ａモード、およびＭＭＬＭ＿Ｌモードと呼ばれる他の２つのＭＭＬＭモードにおいても代替的に使用され得る。

【0055】

【0056】

【0057】

クロマ・イントラ・モード・コーディングの場合、ＬＭモード（ＣＣＬＭ、ＬＭ＿Ａ、およびＬＭ＿Ｌ）またはマルチモデルＬＭモード（ＭＭＬＭ、ＭＭＬＭ＿Ａ、およびＭＭＬＭ＿Ｌ）を選択するために使用される条件チェックがある。条件チェックは以下の通りである。

【数8】

【0058】

ここで、ＢｌｋＳｉｚｅＴｈｒｅｓ_ＬＭは、ＬＭモード（ＬＭｍｏｄｅ）の最も小さいブロック・サイズを表し、ＢｌｋＳｉｚｅＴｈｒｅｓ_ＭＭｐｒｅｄ_Ｃ（ｉ，ｊ）は、ＭＭＬＭモード（ＭＭＬＭｍｏｄｅ）の最も小さいブロック・サイズを表す。シンボルｄは、所定のしきい値を表す。一例では、ｄは０の値をとり得る。別の例では、ｄは８の値をとり得る。

【0059】

クロマ・イントラ・モード・コーディングの場合、合計８つのイントラ・モードが、クロマ・イントラ・モード・コーディングについて可能にされる。それらのモードは、５つの旧来のイントラ・モードと、３つのクロスコンポーネント線形モデル・モードとを含む。クロマ・モード・シグナリングおよび導出プロセスが、表１表に示されている。所与のＣＵについて、それが線形モデル・モード下でコーディングされる場合、それが従来の単一モデルＬＭモードであるのかＭＭＬＭモードであるのかが、上記の条件チェックに基づいて決定されることは、注目に値する。表３に示されている場合とは異なり、シグナリングされるべき別個のＭＭＬＭモードがない。クロマ・モード・コーディングは、対応するルーマ・ブロックのイントラ予測モードに直接依存する。ルーマ成分およびクロマ成分についての別個のブロック区分構造がＩ個のスライスにおいて有効にされるので、１つのクロマ・ブロックが複数のルーマ・ブロックに対応し得る。したがって、クロマＤＭモードの場合、現在のクロマ・ブロックの中心位置をカバーする、対応するルーマ・ブロックのイントラ予測モードが、直接継承される。

【0060】

既存のＣＣＬＭ設計またはＭＭＬＭ設計では、隣接する再構成されたルーマ・クロマ・サンプル・ペアが、しきい値の値に基づいて、１つまたは複数のサンプル・グループに分類され、これは、ルーマＤＣ値のみを考慮する。すなわち、ルーマ・クロマ・サンプル・ペアは、ルーマ・サンプルの強さのみを考慮することによって分類される。しかしながら、ルーマ成分は、通常、豊富なテクスチャを保存し、現在のルーマ・サンプルは、隣接するルーマ・サンプルと大いに相関され得、そのようなサンプル間相関（ＡＣ相関）は、ルーマ・クロマ・サンプル・ペアの分類に利益を与え得、追加のコーディング効率をもたらすことができる。

【0061】

さらに、図９Ａに示されているように、ＣＣＬＭは、所与のクロマ・サンプルが、対応するルーマ・サンプル（小数ルーマ・サンプル位置としてとられ得る、Ｌ０．５）のみに相関すると仮定し、所与のクロマ・サンプルを予測するために、通常の最小２乗（ＯＬＳ：ｏｒｄｉｎａｒｙｌｅａｓｔｓｑｕａｒｅｓ）推定による単純線形回帰（ＳＬＲ：ｓｉｍｐｌｅｌｉｎｅａｒｒｅｇｒｅｓｓｉｏｎ）が使用される。しかしながら、図９Ｂに示されているように、あるビデオ・コンテンツでは、１つのクロマ・サンプルが複数のルーマ・サンプルに同時に相関し得（ＡＣ相関またはＤＣ相関）、したがって、多重線形回帰（ＭＬＲ）モデルが、さらに、予測精度を改善し得る。

【0062】

本開示の焦点は、ルーマ・エッジまたはＡＣ情報を考慮する分類器を導入することによって、ルーマ成分およびクロマ成分のコーディング効率を改善することである。既存の帯域分類されたＭＭＬＭのほかに、本開示は、例示的な提案される分類器を提供する。異なるサンプル・グループについての線形予測モデルを生成するプロセスは、（たとえば、最小２乗法、または簡略化されたｍｉｎ－ｍａｘ法などを介した）ＣＣＬＭまたはＭＭＬＭと同様であり得るが、分類のために異なるメトリックをもつ。

【0063】

本開示の焦点はまた、予測精度をさらに改善するために、フィルタ・ベースの線形モデル（ＦＬＭ）を導出することである。

【0064】

本開示の一態様では、第１の分類器が、（たとえば、隣接するルーマ・クロマ・サンプル・ペアの）隣接するルーマ・サンプル、および／または予測されるべきクロマ・サンプルに対応するルーマ・サンプルを分類するために使用され得る。クロマ・サンプルに対応するルーマ・サンプルは、４：２：０ビデオ・シーケンスについての対応するクロマ・サンプルのロケーションを整合させるために、ダウンサンプリング動作によって取得され得る。たとえば、クロマ・サンプルに対応するルーマ・サンプルは、（たとえば、クロマ・サンプルの周りに位置する）クロマ・サンプルに対応する２つ以上の（たとえば、４つの）再構成されたルーマ・サンプルに対して、ダウンサンプリング動作を実施することによって取得され得る。代替的に、ルーマ・サンプルは、たとえば、４：４：４ビデオ・シーケンスの場合、再構成されたルーマ・サンプルから直接取得され得る。代替的に、ルーマ・サンプルは、対応するクロマ・サンプルについてのそれぞれのコロケートされた位置にある再構成されたルーマ・サンプルの各々から取得され得る。たとえば、分類されるべきルーマ・サンプルが、クロマ・サンプルについてのコロケートされた位置と見なされ得る、４つの再構成されたルーマ・サンプルの左上位置にある、クロマ・サンプルに対応する４つの再構成されたルーマ・サンプルのうちの１つから取得され得る。第１の分類器は、ルーマ・サンプルを、それらのエッジ強度に従って分類し得る。たとえば、エッジ強度を計算するために、１つの方向（たとえば、０度、４５度、または９０度など）が選択され得る。方向は、現在のサンプルと、その方向に沿った隣接するサンプル（たとえば、４５度の場合、現在のサンプルの右上に位置する隣接するサンプル）とによって形成され得る。エッジ強度は、現在のサンプルからネイバー・サンプルを減算することによって計算され得る。エッジ強度は、Ｍ－１個のしきい値によってＭ個のセグメントのうちの１つに量子化され得、第１の分類器は、現在のサンプルを分類するためにＭ個のクラスを使用し得る。代替または追加として、Ｎ個の方向が、現在のサンプルと、Ｎ個の方向に沿ったＮ個の隣接するサンプルとによって形成され得る。Ｎ個のエッジ強度は、それぞれ、現在のサンプルからＮ個の隣接するサンプルを減算することによって計算され得る。同様に、Ｎ個のエッジ強度の各々が、Ｍ－１個のしきい値によってＭ個のセグメントのうちの１つに量子化され得る場合、第１の分類器は、現在のサンプルを分類するために、Ｍ^Ｎ個のクラスを使用し得る。

【0065】

本開示の別の態様では、ローカル・パターンに従って分類するために、第２の分類器が使用され得る。たとえば、現在のルーマ・サンプルＹ０が、それの隣接するＮ個のルーマ・サンプルＹｉと比較され得る。Ｙ０の値がＹｉの値よりも大きい場合、スコアが１だけ加算され得、他の場合、スコアは１だけ低減され得る。スコアは、Ｋ個のクラスを形成するために量子化され得る。第２の分類器は、現在のサンプルをＫ個のクラスのうちの１つに分類し得る。たとえば、隣接するルーマ・サンプルは、現在のルーマ・サンプルの上、左、右、および下に位置する、すなわち、対角ネイバーなしの、４つのネイバーから取得され得る。

【0066】

本開示の１つまたは複数の態様では、複数の第１の分類器、第２の分類器、または第１もしくは第２の分類器もしくは本明細書で説明される他の分類器の異なるインスタンスが、組み合わせられ得る。たとえば、第１の分類器は、既存のＭＭＬＭしきい値ベースの分類器と組み合わせられ得る。別の例では、第１の分類器のインスタンスＡが、第１の分類器の別のインスタンスＢと組み合わせられ得、ここで、インスタンスＡおよびインスタンスＢは、異なる方向を採用する（たとえば、それぞれ、垂直方向および水平方向を採用する）。

【0067】

ＶＶＣ規格における既存のＣＣＬＭ設計が、本明細書における基本的ＣＣＬＭ方法として使用されるが、本開示で説明される提案されるクロスコンポーネント方法が、同様の設計趣旨をもつ他の予測コーディング・ツールにも適用され得ることが、当業者によって諒解されよう。たとえば、ＡＶ１規格におけるルーマからのクロマ（ＣｆＬ：ｃｈｒｏｍａｆｒｏｍｌｕｍａ）について、提案される方法はまた、ルーマ／クロマ・サンプル・ペアを複数のサンプル・グループに分けることによって適用され得る。

【0068】

Ｙ／Ｃｂ／Ｃｒが、ビデオ・コーディング・エリアにおいてＹ／Ｕ／Ｖとしても示され得ることが、当業者によって諒解されよう。ビデオ・データがＲＧＢフォーマットのものである場合、提案される方法はまた、たとえば、単に、ＹＵＶ表記をＧＢＲにマッピングすることによって適用され得る。

【0069】

図７は、本開示の１つまたは複数の態様による、ビデオ・データを復号するための方法７００のワークフローを示す。方法７００は、本明細書で説明される分類器のうちのいずれか１つ、またはそれらの任意の組合せを使用し得、（たとえば、図３の）ビデオ・デコーダによって使用され得る。ステップ７１０において、ビデオ・データのビデオ・ブロック（たとえば、ＣＵ）が、ビットストリームから取得され得る。たとえば、ビデオ・データのルーマ・サンプルの符号化されたブロックが受信され得る。ルーマ・サンプルの符号化されたブロックは、再構成されたルーマ・サンプルを取得するために復号され得る。ステップ７２０において、ルーマ・サンプルは、ルーマ・サンプルのエッジ情報に基づいて、複数のサンプル・グループのうちの１つに分類され得る。ルーマ・サンプルは、ビデオ・ブロックの予測されるべきクロマ・サンプルに対応し得、再構成されたルーマ・サンプルのうちの１つまたは複数から取得され得る。たとえば、ルーマ・サンプルを取得するために、ダウンサンプリング動作が、再構成されたルーマ・サンプルに対して実施されることも実施されないこともある。たとえば、分類は、本明細書で説明される分類器のうちの１つ、またはそれらの任意の組合せを使用することによって実施され得る。ステップ７３０において、クロマ・サンプルは、分類されたサンプル・グループに対応する複数の線形予測モデルのうちの１つを、ルーマ・サンプルに適用することによって予測され得る。

【0070】

一実施形態では、ルーマ・サンプルを複数のサンプル・グループのうちの１つに分類することは、さらに、ルーマ・サンプルの強さ値に基づき得る（たとえば、既存のＭＭＬＭしきい値ベースの分類器と組み合わせられる）。

【0071】

一実施形態では、複数のサンプル・グループの各々は、複数の線形予測モデルのうちの異なる線形予測モデルに対応し得る。

【0072】

一実施形態では、エッジ情報は、ルーマ・サンプルのエッジの方向と強度とを含み得る。

【0073】

一実施形態では、ルーマ・サンプルを複数のサンプル・グループのうちの１つに分類することは、ルーマ・サンプルについての１つの方向に沿ったエッジの強度、またはルーマ・サンプルについての異なる方向に沿ったエッジの複数の強度に基づいて、ルーマ・サンプルを複数のサンプル・グループのうちの１つに分類することを含み得る。

【0074】

一実施形態では、方法７００は、隣接するルーマ・サンプルのエッジ情報に基づいて、ビデオ・ブロックの周りの隣接するルーマ・サンプルを、複数のサンプル・グループに分類することを含み得る。複数の線形予測モデルの各々は、たとえば、最小２乗法、または簡略化されたｍｉｎ－ｍａｘ法などを通して、その線形予測モデルに対応するサンプル・グループに分類された隣接するルーマ・サンプルと、そのサンプル・グループに分類された隣接するルーマ・サンプルに対応する隣接するクロマ・サンプルと（たとえば、その中のルーマ・サンプルが、その線形予測モデルに対応するサンプル・グループに分類された、隣接するルーマ・クロマ・サンプル・ペア）から導出され得る。

【0075】

本開示の１つまたは複数の態様による、ビデオ・データを符号化するための方法８００のワークフローを示す。方法８００は、本明細書で説明される分類器のうちのいずれか１つ、またはそれらの任意の組合せを使用し得、（たとえば、図１の）ビデオ・エンコーダによって使用され得る。ステップ８１０において、ビデオ・データのビデオ・ブロックが、ビデオ・フレームから取得され得る。たとえば、ルーマ・サンプルの符号化されたブロックを取得するために、ビデオ・データのルーマ・サンプルのブロックが符号化され得る。ルーマ・サンプルの符号化されたブロックは、再構成されたルーマ・サンプルを取得するために復号され得る。ステップ８２０において、クロマ・サンプルに対応するルーマ・サンプルが、ルーマ・サンプルのエッジ情報に基づいて、複数のサンプル・グループのうちの１つに分類され得、ルーマ・サンプルは、再構成されたルーマ・サンプルのうちの１つまたは複数から取得される。ステップ８３０において、クロマ・サンプルは、分類されたサンプル・グループに対応する複数の線形予測モデルのうちの１つを、ルーマ・サンプルに適用することによって予測され得る。

【0076】

本開示の１つまたは複数の態様では、予測されるべきクロマ・サンプルについて、そのクロマ・サンプルを予測するために、再構成されたコロケートされたおよび隣接するルーマ・サンプルが使用されて、コロケートされたルーマ・サンプル、隣接するルーマ・サンプル、およびクロマ・サンプルの間のサンプル間相関をキャプチャし得る。再構成されたルーマ・サンプルは、予測されたクロマ・サンプルを生成するために、線形重み付けされ、１つの「オフセット」と組み合わせられる（Ｃ：予測されたクロマ・サンプル、Ｌ_ｉ：ｉ番目の再構成されたコロケートされたまたは隣接するルーマ・サンプル、α_ｉ：フィルタ係数、β：オフセット、Ｎ：フィルタ・タップ）。線形重み付けされた＋オフセットの値は、予測されたクロマ・サンプルを直接形成し（ビデオ・コンテンツに従って、適応的にロー・パス、ハイ・パスであり得る）、それは、次いで、再構成されたクロマ・サンプルを形成するために残差だけ加算されることに留意されたい。

【数9】

【0077】

所与のＣＵについて、ＦＬＭパラメータ（α_ｉ、β）を導出またはトレーニングするために、上および左の再構成されたルーマ・サンプルおよびクロマ・サンプルが使用され得る。ＣＣＬＭと同様に、α_ｉおよびβが、ＯＬＳを介して導出され得る。上および左のトレーニング・サンプルが収集され、１つの擬似逆行列が、エンコーダ側とデコーダ側の両方において計算されて、パラメータを導出し、そのパラメータは、次いで、所与のＣＵにおいてクロマ・サンプルを予測するために使用される。Ｎが、ルーマ・サンプルに適用されるフィルタ・タップの数を示し、Ｍが、パラメータをトレーニングするために使用される合計の上および左の再構成されたルーマ・サンプルおよびクロマ・サンプル・ペアを示し、

【数10】

が、ｉ番目のサンプル・ペアとｊ番目のフィルタ・タップとをもつルーマ・サンプルを示し、Ｃ^ｉが、ｉ番目のサンプル・ペアをもつクロマ・サンプルを示すものとし、以下の式は、擬似逆行列Ａ^＋と、また、パラメータとの導出を示す。図１０は、Ｎが６（６タップ）であり、Ｍが８であり、パラメータを導出またはトレーニングするために、上の２行および左の３列のルーマ・サンプルと、上の１行および左の１列のクロマ・サンプルとが使用される、一例を示す。

【数11】

【0078】

オフセットβなしにα_ｉのみによってクロマ・サンプルを予測することができ、これが、提案される方法のサブセットであり得ることに留意されたい。

【0079】

ＶＶＣ規格における既存のＣＣＬＭ設計が、以下の説明における基本的ＣＣＬＭ方法として使用されるが、ビデオ・コーディングの当業者には、本開示で説明される提案されるクロスコンポーネント方法が、同様の設計趣旨をもつ他の予測コーディング・ツールにも適用され得ることに留意されたい。たとえば、ＡＶ１規格におけるルーマからのクロマ（ＣｆＬ）について、提案されるＦＬＭはまた、ＭＬＲモデルに対する複数のルーマ・サンプルを含むことによって適用され得る。

【0080】

Ｙ／Ｃｂ／Ｃｒが、ビデオ・コーディング・エリアにおいてＹ／Ｕ／Ｖとしても示され得ることに留意されたい。

【0081】

ビデオがＲＧＢフォーマットである場合、提案されるＦＬＭはまた、たとえば、単に、以下の段落においてＹＵＶ表記をＧＢＲにマッピングすることによって適用され得ることに留意されたい。

【0082】

本開示の図は、本開示で言及されるすべての例と組み合わせられ得ることに留意されたい。

【0083】

図１１は、本開示の１つまたは複数の態様による、ビデオ・データを符号化するための方法１１００のワークフローを示す。ステップ１１１０において、ビデオ・ブロック（たとえば、ルーマ・ブロックおよび／またはクロマ・ブロックを備えるＣＵ）が、ビデオ・フレームから取得され得る。ステップ１１２０において、多重線形回帰（ＭＬＲ）モデルを導出するために使用される領域が、決定され得る。たとえば、領域は、クロマ・ブロックおよびそれのコロケートされたルーマ・ブロックに隣接する再構成されたクロマ・サンプルおよびルーマ・サンプルの左の１つもしくは複数の列および／または上の１つもしくは複数の行を含み、たとえば、図１０に示されているように、コロケートされたルーマ・ブロックに隣接する再構成されたルーマ・サンプルの左の３列および上の２行と、クロマ・ブロックに隣接する左の１列および上の１行とを含み得る。

【0084】

ステップ１１３０において、領域におけるルーマ・サンプル値とクロマ・サンプル値とが取得され得る。たとえば、領域における再構成されたルーマ・サンプルおよびクロマ・サンプルの値は、ダウンサンプリングなどの変更なしに、ダイレクトされ使用され得る。

【0085】

ステップ１１４０において、領域におけるルーマ・サンプル値とクロマ・サンプル値とを使用して、ＭＬＲモデルが導出され得る。ＭＬＲモデルは、少なくとも２つの係数α_ｉ（ｉ＝０・・・Ｎ－１、Ｎがフィルタ・タップの数である）と１つのオフセットβとを備え得る。たとえば、１つのクロマ・サンプルを予測するために６つのルーマ・サンプルと１つのオフセットとを使用するために、６つの係数α_ｉ（すなわち、フィルタ・タップの数が６であり、ｉ＝０・・・５）と１つのオフセットβとをもつＭＬＲモデルが導出され得る。ＭＬＲモデルの導出は、擬似逆行列計算と正規方程式（ｎｏｒｍａｌｅｑｕａｔｉｏｎ）とを含み得、スカラーβを導出するために、Ａ^＋における最右列が１に設定されなければならない。

【0086】

ステップ１１５０において、ビデオ・ブロックにおけるクロマ・サンプルの各々が、ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測され得る。各クロマ・サンプル（たとえば、図１０に示されているクロマ・サンプル０’）についての対応するルーマ・サンプルが、そのクロマ・サンプルについてのコロケートされたルーマ・サンプル（たとえば、図１０に示されているルーマ・サンプル０’、１’、２’、３’、４’および５’）を含み得る。たとえば、再構成されたコロケートされたルーマ・サンプルの値は、ダウンサンプリングなどの変更なしに、ダイレクトされ使用され得る。

【0087】

ステップ１１６０において、予測されたクロマ・サンプルを使用して、符号化されたビデオ・ブロックが取得され得る。たとえば、符号化されたビデオ・ブロックは、送信するためにまたは記憶のためにビットストリーム中に含まれ得る。

【0088】

図１２は、本開示の１つまたは複数の態様による、ビデオ・データを復号するための方法１２００のワークフローを示す。方法１２００は、方法１１００と同様であり得、方法１２００のプロセスまたはステップは、方法１１００のプロセスまたはステップに対応し得る。ステップ１２１０において、ビデオ・ブロック（たとえば、ＣＵ）が、ビットストリームから取得され得る。ステップ１２２０において、多重線形回帰（ＭＬＲ）モデルを導出するために使用される領域が、決定され得る。ステップ１２３０において、領域におけるルーマ・サンプル値とクロマ・サンプル値とが取得され得る。ステップ１２４０において、領域におけるルーマ・サンプル値とクロマ・サンプル値とを使用して、ＭＬＲモデルが導出され得る。ステップ１２５０において、ビデオ・ブロックにおけるクロマ・サンプルの各々が、ＭＬＲモデルをそのクロマ・サンプルについての対応するルーマ・サンプルに適用することによって、予測され得る。ステップ１２６０において、予測されたクロマ・サンプルを使用して、復号されたビデオ・ブロックが取得され得る。

【0089】

図１３は、本開示の１つまたは複数の態様による、例示的なコンピューティング・システム１３００を示す。コンピューティング・システム１３００は、少なくとも１つのプロセッサ１３１０を備え得る。コンピューティング・システム１３００は、少なくとも１つのストレージ・デバイス１３２０をさらに備え得る。ストレージ・デバイス１３２０は、実行されたとき、プロセッサ１３１０に、図７～図８、および図１１～図１２を参照しながら上記で説明された方法７００、８００、１１００および１２００のステップを実施させる、コンピュータ実行可能命令を記憶し得る。プロセッサ１３１０は、汎用プロセッサであり得るか、または、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携した１つもしくは複数のマイクロプロセッサ、もしくは任意の他のそのような構成としても実装され得る。ストレージ・デバイス１３２０は、入力データ、出力データ、プロセッサ１３１０によって生成されたデータ、および／またはプロセッサ１３１０によって実行される命令を記憶し得る。

【0090】

ストレージ・デバイス１３２０は、実行されたとき、プロセッサ１３１０に、図１～図１２に関連して説明された本開示の実施形態によるいずれかの動作を実施させる、コンピュータ実行可能命令を記憶し得ることを諒解されたい。

【0091】

本開示の実施形態は、非一時的コンピュータ可読媒体などのコンピュータ可読媒体において具現され得る。非一時的コンピュータ可読媒体は、実行されたとき、１つまたは複数のプロセッサに、図１～図１２に関連して説明された本開示の実施形態によるいずれかの動作を実施させる、命令を備え得る。たとえば、命令は、実行されたとき、１つまたは複数のプロセッサに、上記で説明された、ビットストリームを受信することと、復号動作を実施することとを行わせ得る。別の例では、命令は、実行されたとき、１つまたは複数のプロセッサに、上記で説明された、符号化動作を実施することと、予測されたクロマ・サンプルに関連する符号化されたビデオ情報を含むビットストリームを送信することとを行わせ得る。

【0092】

上記で説明された方法におけるすべての動作は例にすぎず、本開示は、その方法におけるいかなる動作、またはこれらの動作のシーケンス順序に限定されず、同じまたは同様の概念のもとですべての他の等価物をカバーするべきであることを諒解されたい。

【0093】

また、上記で説明された方法におけるすべてのモジュールが、様々な手法において実装され得ることを諒解されたい。これらのモジュールは、ハードウェア、ソフトウェア、またはそれらの組合せとして実装され得る。その上、これらのモジュールのいずれも、さらに、機能的にサブモジュールに分けられるかまたは一緒に組み合わせられ得る。

【0094】

前の説明は、当業者が、本明細書で説明される様々な態様を実践することを可能にするために提供される。これらの態様への様々な変更は当業者に容易に明らかとなり、本明細書で定義される一般原理は他の態様に適用され得る。したがって、特許請求の範囲は、本明細書で示される態様に限定されるものではない。当業者に知られているかまたは当業者に後で知られることになる、本開示全体にわたって説明される様々な態様の要素に対するすべての構造的および機能的等価物は、参照により本明細書に明確に組み込まれ、特許請求の範囲によって包含されるものとする。

【図1】

【図2A】

【図2B】

【図2C】

【図2D】

【図2E】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9A-9B】

【図10】

【図11】

【図12】

【図13】

【手続補正書】

【提出日】2024-07-11

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

【請求項5】

【請求項6】

【請求項7】

【請求項8】

【請求項9】

【請求項10】

【請求項11】

【請求項12】

【請求項13】

【請求項14】

【請求項15】

【請求項16】

コンピュータ実行可能命令を含むコンピュータ・プログラム製品であって、前記コンピュータ実行可能命令は、実行されたとき、１つまたは複数のプロセッサに、請求項１から１４のいずれか一項に記載の方法の動作を実施させる、コンピュータ・プログラム製品。

【請求項17】

コンピュータ実行可能命令を記憶するコンピュータ可読媒体であって、前記コンピュータ実行可能命令は、実行されたとき、１つまたは複数のプロセッサに、請求項１から１４のいずれか一項に記載の方法の動作を実施することを行わせる、コンピュータ可読媒体。

【請求項18】

請求項１から７のいずれか一項に記載の方法によって復号されるビットストリーム、または請求項８から１４のいずれか一項に記載の方法によって生成されるビットストリームを記憶するための方法。

【請求項19】

ビットストリームを受信するための方法であって、前記ビットストリームは、請求項１から７のいずれか一項に記載の方法によって復号される、方法。

【請求項20】

ビットストリームを送信するための方法であって、前記ビットストリームは、請求項８から１４のいずれか一項に記載の方法によって生成される、方法。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】００３５

【補正方法】変更

【補正の内容】

【0035】

表２では、第１のビンは、それが通常モード（０）であるのかＬＭモード（１）であるのかを示す。それがＬＭモードである場合、次のビンは、それがＬＭ＿ＣＨＲＯＭＡ（０）であるか否かを示す。それがＬＭ＿ＣＨＲＯＭＡでない場合、次の１つのビンは、それがＬＭ＿Ｌ（０）であるのかＬＭ＿Ａ（１）であるのかを示す。この場合、ｓｐｓ＿ｃｃｌｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０であるとき、対応するｉｎｔｒａ＿ｃｈｒｏｍａ＿ｐｒｅｄ＿ｍｏｄｅについての２値化表の第１のビンは、エントロピー・コーディングより前に廃棄され得る。または、言い換えれば、第１のビンは、０であると推論され、したがってコーディングされない。この単一の２値化表は、ｓｐｓ＿ｃｃｌｍ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しい場合と１に等しい場合の両方について使用される。表２中の最初の２つのビンは、それ自体のコンテキスト・モデルでコンテキストコーディング（ｃｏｎｔｅｘｔｃｏｄｅ）され、残りのビンはバイパス・コーディングされる。

【手続補正3】

【補正対象書類名】明細書

【補正対象項目名】００５１

【補正方法】変更

【補正の内容】

【0051】

また、ＭＭＬＭモードおよびＬＭモードが、適応様式で一緒に使用され得る。ＭＭＬＭの場合、２つの線形モデルは、以下の通りである。

【数6】

【手続補正4】

【補正対象書類名】明細書

【補正対象項目名】００５７

【補正方法】変更

【補正の内容】

【0057】

【数8】

【手続補正5】

【補正対象書類名】明細書

【補正対象項目名】００５８

【補正方法】変更

【補正の内容】

【0058】

ここで、ＢｌｋＳｉｚｅＴｈｒｅｓ_ＬＭは、ＬＭモード（ＬＭｍｏｄｅ）の最も小さいブロック・サイズを表し、ＢｌｋＳｉｚｅＴｈｒｅｓ _ＭＭは、ＭＭＬＭモード（ＭＭＬＭｍｏｄｅ）の最も小さいブロック・サイズを表す。シンボルｄは、所定のしきい値を表す。一例では、ｄは０の値をとり得る。別の例では、ｄは８の値をとり得る。

【手続補正6】

【補正対象書類名】明細書

【補正対象項目名】００７５

【補正方法】変更

【補正の内容】

【0075】

図８は、本開示の１つまたは複数の態様による、ビデオ・データを符号化するための方法８００のワークフローを示す。方法８００は、本明細書で説明される分類器のうちのいずれか１つ、またはそれらの任意の組合せを使用し得、（たとえば、図１の）ビデオ・エンコーダによって使用され得る。ステップ８１０において、ビデオ・データのビデオ・ブロックが、ビデオ・フレームから取得され得る。たとえば、ルーマ・サンプルの符号化されたブロックを取得するために、ビデオ・データのルーマ・サンプルのブロックが符号化され得る。ルーマ・サンプルの符号化されたブロックは、再構成されたルーマ・サンプルを取得するために復号され得る。ステップ８２０において、クロマ・サンプルに対応するルーマ・サンプルが、ルーマ・サンプルのエッジ情報に基づいて、複数のサンプル・グループのうちの１つに分類され得、ルーマ・サンプルは、再構成されたルーマ・サンプルのうちの１つまたは複数から取得される。ステップ８３０において、クロマ・サンプルは、分類されたサンプル・グループに対応する複数の線形予測モデルのうちの１つを、ルーマ・サンプルに適用することによって予測され得る。

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版