IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テンセント・アメリカ・エルエルシーの特許一覧

特表2022-552659クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム
<>
  • 特表-クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム 図1
  • 特表-クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム 図2
  • 特表-クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム 図3
  • 特表-クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム 図4
  • 特表-クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム 図5
  • 特表-クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-19
(54)【発明の名称】クロマイントラ予測モードのシグナリング方法、コンピュータシステム、およびプログラム
(51)【国際特許分類】
   H04N 19/13 20140101AFI20221212BHJP
   H04N 19/157 20140101ALI20221212BHJP
   H04N 19/176 20140101ALI20221212BHJP
   H04N 19/186 20140101ALI20221212BHJP
   H04N 19/593 20140101ALI20221212BHJP
   H04N 19/46 20140101ALI20221212BHJP
【FI】
H04N19/13
H04N19/157
H04N19/176
H04N19/186
H04N19/593
H04N19/46
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022522362
(86)(22)【出願日】2020-11-09
(85)【翻訳文提出日】2022-04-13
(86)【国際出願番号】 US2020059706
(87)【国際公開番号】W WO2021236148
(87)【国際公開日】2021-11-25
(31)【優先権主張番号】63/026,495
(32)【優先日】2020-05-18
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/061,854
(32)【優先日】2020-10-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.SMALLTALK
(71)【出願人】
【識別番号】520353802
【氏名又は名称】テンセント・アメリカ・エルエルシー
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【弁理士】
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】リャン・ジャオ
(72)【発明者】
【氏名】シン・ジャオ
(72)【発明者】
【氏名】シャン・リュウ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159ME11
5C159PP16
5C159RC12
5C159TA59
5C159TB08
5C159TC26
5C159TC31
5C159TC41
5C159TC42
5C159UA02
5C159UA05
(57)【要約】
ビデオデータをエンコーディングまたはデコーディングするための方法、コンピュータプログラム、およびコンピュータシステムが提供される。クロマ成分およびルマ成分を含むビデオデータが受信される。クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストが、事前定義された位置にある1つまたは複数のコロケートされたルマブロックに基づいて識別される。識別されたコンテキストに基づいてビデオデータがデコーディングされる。
【特許請求の範囲】
【請求項1】
プロセッサによって実行可能な、ビデオコーディングの方法であって、
クロマ成分およびルマ成分を含むビデオデータを受信するステップと、
1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて、クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストを識別するステップと、
前記識別されたコンテキストに基づいて前記ビデオデータをデコーディングするステップと
を含む、方法。
【請求項2】
前記1つまたは複数の事前定義された位置は、現在のクロマブロックの中間位置および左上隅の中からの1つまたは複数を含む、請求項1に記載の方法。
【請求項3】
前記現在のクロマブロックの前記中間位置は、クロマブロックの前記左上隅であってもよい、請求項2に記載の方法。
【請求項4】
1つまたは複数の事前定義されたサンプル位置を識別するステップと、
前記コロケートされたルマブロックを予測するための前記複数のサンプル位置に関連付けられたイントラ予測モードを識別するステップと、
前記識別されたイントラ予測モードの中から、予測モードに基づいて前記コンテキスト値を導出するステップと
をさらに含む、請求項1に記載の方法。
【請求項5】
前記識別された予測モードの中から最も頻繁に使用される予測モードは、前記コンテキスト値を導出するために使用される、請求項4に記載の方法。
【請求項6】
前記事前定義されたサンプル位置は、1つまたは複数の隅サンプルおよび中央サンプルを含む、請求項4に記載の方法。
【請求項7】
前記事前定義されたサンプル位置は、4つの隅サンプルを含む、請求項4に記載の方法。
【請求項8】
前記イントラ予測モードを、イントラ予測モードによって予測されていない1つまたは複数の事前定義された位置にある前記コロケートされたルマブロックに基づいて、およびイントラ予測モードによって予測されている前記現在のクロマコーディングブロックに基づいて、1つまたは複数の事前定義されたイントラ予測モードにマッピングするステップをさらに含む、請求項1に記載の方法。
【請求項9】
デフォルトのイントラ予測モードは、ブロック内コピーまたはパレットモードによってコーディングされている前記コロケートされたルマブロックに基づいて、前記クロマイントラ予測モードをエントロピーコーディングするための前記コンテキストを導出するために使用される、請求項8に記載の方法。
【請求項10】
前記デフォルトのイントラ予測モードは、DC、SMOOTH、SMOOTH-H、SMOOTH-V、およびPaeth予測モードの中からの1つまたは複数を含む、請求項9に記載の方法。
【請求項11】
前記クロマイントラ予測モードをシグナリングすることに基づいて、前記現在のクロマモードがルマからのクロマであるかどうかを示すためにフラグがシグナリングされる、請求項1に記載の方法。
【請求項12】
対応するルマモードは前記フラグをシグナリングするための前記コンテキストを導出するために使用される、請求項11に記載の方法。
【請求項13】
ルマコード化ブロックに対して許容されるすべての公称イントラ予測角度は、クロマコード化ブロックに対して許容され、シグナリングされる、請求項1に記載の方法。
【請求項14】
公称角度に対するデルタ角度のサブセットのみがクロマイントラコード化ブロックに対して許容され、シグナリングされる、請求項13に記載の方法。
【請求項15】
すべての無指向性モードはクロマイントラコード化ブロックに対して許容され、シグナリングされる、請求項14に記載の方法。
【請求項16】
前記コロケートされたルマイントラ予測モードに対応するデルタ角度のみが前記クロマコード化ブロックに対して許容され、シグナリングされる、請求項14に記載の方法。
【請求項17】
無指向性モードと一緒に前記公称角度をシグナリングするステップと、
前記現在のモードは指向性モードであり、コロケートされたルマ公称モードに等しいことに基づいて、前記公称角度に対するデルタ角度のインデックスを示すために第2のフラグをシグナリングするステップと
をさらに含む、請求項16に記載の方法。
【請求項18】
クロマコード化ブロックのために前記許容されるすべてのイントラ予測モードは一緒にシグナリングされる、請求項16に記載の方法。
【請求項19】
ビデオデータをデコーディングするためのコンピュータシステムであって、前記コンピュータシステムは、
コンピュータプログラムコードを格納するように構成された1つまたは複数のコンピュータ可読非一時的記憶媒体と、
前記コンピュータプログラムコードにアクセスし、前記コンピュータプログラムコードによって命令されたように動作するよう構成された1つまたは複数のコンピュータプロセッサであって、前記コンピュータプログラムコードは、
前記1つまたは複数のコンピュータプロセッサに、ルマ成分およびクロマ成分を含むビデオデータを受信させるように構成されたコードを受信するステップと、
前記1つまたは複数のコンピュータプロセッサに、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて、クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストを識別させるように構成されたコードを識別するステップと、
前記1つまたは複数のコンピュータプロセッサに、前記識別されたコンテキストに基づいて前記ビデオデータをデコーディングさせるように構成されたデコーディングコードと
を含む、1つまたは複数のコンピュータプロセッサと
を備える、コンピュータシステム。
【請求項20】
ビデオデータをデコーディングするためのコンピュータプログラムを格納した非一時的コンピュータ可読媒体であって、前記コンピュータプログラムは、1つまたは複数のコンピュータプロセッサに、
ルマ成分およびクロマ成分を含むビデオデータを受信し、
1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて、クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストを識別し、
前記識別されたコンテキストに基づいて前記ビデオデータをデコーディングするようにさせるように構成される、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年5月18日に出願された米国仮特許出願第63/026,495号、および2020年10月2日に出願された米国特許出願第17/061,854号の優先権を主張し、その全体が本明細書に組み込まれる。
【0002】
本開示は、一般に、データ処理の分野に関し、より詳細には、ビデオエンコーディングおよび/またはデコーディングに関する。
【背景技術】
【0003】
AOMedia Video 1(AV1)は、インターネットを介したビデオ伝送のために設計されたオープンビデオコーディングフォーマットである。VP9の後継として、2015年に設立されたコンソーシアム、Alliance for Open Media(AOMedia)によって開発され、これは、半導体企業、ビデオオンデマンドプロバイダ、ビデオコンテンツプロデューサ、ソフトウェア開発企業、およびウェブブラウザベンダを含む。AV1プロジェクトの構成要素の多くは、アライアンスのメンバによる以前の研究努力から調達された。個人の貢献者は、数年前に実験的な技術プラットフォームを開始した、すなわちXiphの/MozillaのDaalaは2010年にコードを既に公開しており、Googleの実験的なVP9進化プロジェクトVP10は2014年9月12日に発表され、CiscoのThorは2015年8月11日に公開された。VP9のコードベースに基づいて構築され、AV1は追加の技術を組み込んでおり、そのいくつかはこれらの実験的なフォーマットで開発された。AV1基準コーデックの第1のバージョン0.1.0は、2016年4月7日に公開された。アライアンスは、参照用のソフトウェアベースのエンコーダおよびデコーダと共に、2018年3月28日にAV1ビットストリーム仕様のリリースを発表した。2018年6月25日に、仕様の有効なバージョン1.0.0がリリースされた。2019年1月8日に、本仕様のErrata 1を伴う有効なバージョン1.0.0がリリースされた。AV1ビットストリーム仕様は、基準ビデオコーデックを含む。
【発明の概要】
【課題を解決するための手段】
【0004】
実施形態は、ビデオデータをエンコーディングおよび/またはデコーディングするための方法、システム、およびコンピュータ可読媒体に関する。一態様によれば、ビデオデータをエンコーディングおよび/またはデコーディングするための方法が提供される。本方法は、クロマ成分を含むビデオデータを受信するステップを含み得、ルマ成分が受信される。クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストが、事前定義された位置にある1つまたは複数の倍数のコロケートされたルマブロックに基づいて識別される。識別されたコンテキストに基づいてビデオデータがデコーディングされる。
【0005】
他の態様によれば、ビデオデータをエンコーディングおよび/またはデコーディングするためのコンピュータシステムが提供される。コンピュータシステムは、1つまたは複数のプロセッサと、1つまたは複数のコンピュータ可読メモリと、1つまたは複数のコンピュータ可読有形記憶デバイスと、1つまたは複数のメモリの少なくとも1つを介して1つまたは複数のプロセッサの少なくとも1つによって実行するために1つまたは複数の記憶デバイスの少なくとも1つに格納されたプログラム命令と、を含み得、それによってコンピュータシステムは方法を実行することができる。本方法は、クロマ成分を含むビデオデータを受信するステップを含み得、ルマ成分が受信される。クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストが、事前定義された位置にある1つまたは複数の倍数のコロケートされたルマブロックに基づいて識別される。識別されたコンテキストに基づいてビデオデータがデコーディングされる。
【0006】
さらに他の態様によれば、ビデオデータをエンコーディングおよび/またはデコーディングするためのコンピュータ可読媒体が提供される。コンピュータ可読媒体は、1つまたは複数のコンピュータ可読記憶デバイスと、1つまたは複数の有形記憶デバイスの少なくとも1つに格納されたプログラム命令と、を含み得、プログラム命令はプロセッサによって実行可能である。プログラム命令は、それに応じてクロマ成分を含むビデオデータを受信することを含み得る方法を実行するためにプロセッサによって実行可能であり、ルマ成分が受信される。クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストが、事前定義された位置にある1つまたは複数の倍数のコロケートされたルマブロックに基づいて識別される。識別されたコンテキストに基づいてビデオデータがデコーディングされる。
【0007】
これらおよび他の目的、特徴および利点は、添付の図面に関連して読まれるべき例示的な実施形態の以下の詳細な説明から明らかになるであろう。例示は詳細な説明と併せて当業者の理解を容易にする際の明確さのためのものであるため、図面の様々な特徴は正確な縮尺ではない。図面は次の通りである。
【図面の簡単な説明】
【0008】
図1】少なくとも1つの実施形態によるネットワーク化されたコンピュータ環境を示す図である。
図2】少なくとも1つの実施形態による、ビデオデータのクロマ成分およびルマ成分のコーディングツリー構造の図である。
図3】少なくとも1つの実施形態による、ビデオデータをコーディングするプログラムによって実行されるステップを示す動作フローチャートである。
図4】少なくとも1つの実施形態による、図1に図示されるコンピュータおよびサーバの内部構成要素および外部構成要素のブロック図である。
図5】少なくとも1つの実施形態による、図1に図示されるコンピュータシステムを含む例示的なクラウドコンピューティング環境のブロック図である。
図6】少なくとも1つの実施形態による、図5の例示的なクラウドコンピューティング環境の機能層のブロック図である。
【発明を実施するための形態】
【0009】
特許請求される構造および方法の詳細な実施形態が本明細書に開示されているが、開示された実施形態は、様々な形態で具現化され得る特許請求された構造および方法の単なる例示であることが理解され得る。これらの構造および方法は、しかしながら、多くの異なる形態で具体化され得、本明細書に記載される例示的な実施形態に限定されると解釈されるべきではない。むしろ、これらの例示的な実施形態は、本開示が詳細かつ完全であり、当業者にその範囲を十分に伝えるために提供されている。この説明では、提示された実施形態を不必要に不明瞭にすることを避けるために、周知の特徴および技術の詳細は省略される場合がある。
【0010】
実施形態は、一般に、データ処理の分野、より詳細にはビデオエンコーディングおよびデコーディングに関する。以下に説明する例示的な実施形態は、とりわけ、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに関連付けられたコンテキストに基づいてビデオデータをエンコーディングおよび/またはデコーディングするためのシステム、方法、およびコンピュータプログラムを提供する。したがって、いくつかの実施形態は、クロマイントラ予測モードのための改善されたシグナリングを使用してエンコーディングおよびデコーディング効率を改善することによって計算分野を改善する能力を有する。
【0011】
前述したように、AOMedia Video 1(AV1)は、インターネットを介したビデオ伝送のために設計されたオープンビデオコーディングフォーマットである。これは、半導体企業、ビデオオンデマンドプロバイダ、ビデオコンテンツプロデューサ、ソフトウェア開発企業、およびウェブブラウザベンダを含み2015年に設立されたコンソーシアム、Alliance for Open Media(AOMedia)によって、VP9の後継として開発された。AV1プロジェクトの構成要素の多くは、アライアンスのメンバによる以前の研究努力から調達された。個人の貢献者が、何年も前に実験的な技術プラットフォームを開始した。すなわちXiphの/MozillaのDaalaは2010年にコードを既に公開しており、Googleの実験的なVP9進化プロジェクトVP10は2014年9月12日に発表され、CiscoのThorは2015年8月11日に公開された。VP9のコードベース上に構築され、AV1は追加の技術を組み込んでおり、そのいくつかはこれらの実験的なフォーマットで開発された。AV1基準コーデックの第1のバージョン0.1.0は、2016年4月7日に公開された。アライアンスは、参照用のソフトウェアベースのエンコーダおよびデコーダと共に、2018年3月28日にAV1ビットストリーム仕様のリリースを発表した。2018年6月25日に、仕様の有効なバージョン1.0.0がリリースされた。2019年1月8日に、本仕様のErrata 1を伴う有効なバージョン1.0.0がリリースされた。AV1ビットストリーム仕様は、基準ビデオコーデックを含む。
【0012】
AV1では、半分離分割(SDP: semi decoupled partitioning)が使用され得る。しかしながら、SDPでは、1つのスーパーブロックのルマブロックおよびクロマブロックは異なるパーティションを有することができ、1つのクロマブロックの領域は複数のルマコーディングブロックをカバーし得、対応するルマモードを特定するためにクロマブロックの左上位置を常に使用することは最適ではない場合がある。加えて、1つのスーパーブロックのルマブロックおよびクロマブロックが異なるパーティションを有するとき、CfLモードはベストモードとして選択されるより高い見込みを有しているが、この特性はクロマモードシグナリング方法では十分に活用されない。さらに、クロマイントラ予測モードをシグナリングするとき、現在のスーパーブロック内のルマモードはすべて利用可能である。しかし、これは、クロマイントラ予測モードをシグナリングするためのより良いコードワードを設計するために利用されない。したがって、クロマイントラ予測モードのための改善されたシグナリングのために、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて、クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストを識別することが有利であり得る。
【0013】
様々な実施形態による方法、装置(システム)、およびコンピュータ可読媒体のフローチャート図および/またはブロック図を参照して、態様を本明細書で説明する。フローチャート図および/またはブロック図の各ブロック、ならびにフローチャート図および/またはブロック図のブロックの組み合わせは、コンピュータ可読プログラム命令によって実施され得ることが理解されよう。
【0014】
ここで図1を参照すると、コーディングツリー構造タイプに基づいてビデオデータをエンコーディングおよび/またはデコーディングするためのビデオコーディングシステム100(以下「システム」)を示すネットワークコンピュータ環境の機能ブロック図である。図1は、一実装形態の例示のみを提供し、異なる実施形態が実装され得る環境に関する限定を意味しないことを理解されたい。図示した環境に対する多くの修正は、設計および実装要件に基づいて行われ得る。
【0015】
システム100は、コンピュータ102およびサーバコンピュータ114を含み得る。コンピュータ102は、通信ネットワーク110(以下「ネットワーク」)を介してサーバコンピュータ114と通信し得る。コンピュータ102は、プロセッサ104と、データ記憶デバイス106に格納され、ユーザとインターフェースし、サーバコンピュータ114と通信することが可能なソフトウェアプログラム108と、を含み得る。図4を参照して以下で説明するように、コンピュータ102は、それぞれ内部構成要素800Aおよび外部構成要素900Aを含み得、サーバコンピュータ114は、それぞれ内部構成要素800Bおよび外部構成要素900Bを含み得る。コンピュータ102は、例えば、モバイルデバイス、電話、携帯情報端末、ネットブック、ラップトップコンピュータ、タブレットコンピュータ、デスクトップコンピュータ、またはプログラムを実行し、ネットワークにアクセスし、データベースにアクセスすることができる任意のタイプのコンピューティングデバイスであってもよい。
【0016】
サーバコンピュータ114はまた、図6および図7に関して以下に説明するように、サービスとしてのソフトウェア(SaaS)、サービスとしてのプラットフォーム(PaaS)、またはサービスとしてのインフラストラクチャ(laaS)などのクラウドコンピューティングサービスモデルで動作してもよい。サーバコンピュータ114はまた、プライベートクラウド、コミュニティクラウド、パブリッククラウド、またはハイブリッドクラウドなどのクラウドコンピューティング展開モデルに配置されてもよい。
【0017】
ビデオデータをエンコーディングするために使用され得るサーバコンピュータ114は、データベース112と対話し得るビデオコーディングプログラム116(以下「プログラム」)を実行することが可能である。ビデオコーディングプログラム方法は、図3に関して以下により詳細に説明される。一実施形態では、コンピュータ102は、ユーザインターフェースを含む入力デバイスとして動作し得、プログラム116は、主にサーバコンピュータ114上で実行し得る。一代替的な実施形態では、プログラム116は、主に1つまたは複数のコンピュータ102上で実行し得、サーバコンピュータ114は、プログラム116によって使用されるデータの処理および格納に使用され得る。プログラム116は、スタンドアロンプログラムであってもよく、またはより大きなビデオコーディングプログラムに統合されてもよいことに留意されたい。
【0018】
しかしながら、プログラム116の処理は、場合によっては、コンピュータ102とサーバコンピュータ114の間で任意の比率で共有されてもよいことに留意されたい。他の実施形態では、プログラム116は、複数のコンピュータ、サーバコンピュータ、またはコンピュータとサーバコンピュータとの何らかの組み合わせ、例えば、ネットワーク110を介して単一のサーバコンピュータ114と通信する複数のコンピュータ102上で動作し得る。他の実施形態では、例えば、プログラム116は、ネットワーク110を介して複数のクライアントコンピュータと通信する複数のサーバコンピュータ114上で動作し得る。あるいは、プログラムは、ネットワークを介してサーバおよび複数のクライアントコンピュータと通信するネットワークサーバ上で動作してもよい。
【0019】
ネットワーク110は、有線接続、無線接続、光ファイバ接続、またはそれらの何らかの組み合わせを含み得る。一般に、ネットワーク110は、コンピュータ102とサーバコンピュータ114との間の通信をサポートする接続およびプロトコルの任意の組み合わせとすることができる。ネットワーク110は、例えば、ローカルエリアネットワーク(LAN)、インターネットなどのワイドエリアネットワーク(WAN)、公衆交換電話網(PSTN)などの電気通信ネットワーク、無線ネットワーク、公衆交換網、衛星ネットワーク、セルラーネットワーク(例えば、第5世代(5G)ネットワーク、ロングタームエボリューション(LTE)ネットワーク、第3世代(3G)ネットワーク、符号分割多元接続(CDMA)ネットワークなど)、公衆陸上移動網(PLMN)、メトロポリタンエリアネットワーク(MAN)、プライベートネットワーク、アドホックネットワーク、イントラネット、光ファイバベースのネットワークなど、および/またはこれらのもしくは他のタイプのネットワークの組み合わせなどの様々なタイプのネットワークを含み得る。
【0020】
図1に示すデバイスおよびネットワークの数および配置は、一例として提供されている。実際には、追加のデバイスおよび/またはネットワーク、より少ないデバイスおよび/またはネットワーク、異なるデバイスおよび/またはネットワーク、あるいは図1に示すものとは異なる配置のデバイスおよび/またはネットワークが存在してもよい。さらに、図1に示す2つ以上のデバイスは、単一のデバイス内に実装されてもよく、または図1に示す単一のデバイスは、複数の分散型デバイスとして実装されてもよい。追加的または代替的に、システム100のデバイスのセット(例えば、1つまたは複数のデバイス)が、システム100のデバイスの他のセットによって実行されるものとして説明されている1つまたは複数の機能を実行してもよい。
【0021】
ここで図2を参照すると、ビデオデータの一例示的なコーディングツリー構造のブロック図200が図示されている。コーディングツリー構造は、ルマ成分202およびクロマ成分204を含み得る。
【0022】
半分離分割(SDP)スキーム(すなわち、クロマ成分のための半分離ツリー(SST: semi separate tree)またはフレキシブルブロック分離)が使用され得る。SDPによれば、あるスーパーブロック(SB)のルマ成分202およびクロマ成分204は、同じまたは異なるブロック分割を有し得、これは、ルマコード化ブロックサイズまたはルマツリー深度に依存し得る。ルマブロックエリアサイズが1つの閾値T1より大きいか、またはルマブロックのコーディングツリー分割深度が1つの閾値T2以下であるときには、クロマブロックは、ルマと同じコーディングツリー構造を使用し得る。そうでない場合、ブロックエリアサイズがT1以下であるか、またはルマ分割深度がT2より大きいとき、対応するクロマブロックは、ルマ成分を伴う異なるコーディングブロック分割を有することができ、これは、クロマ成分のためのフレキシブルブロック分割と呼ばれ得る。T1は、128または256、などの正の整数であってよい。T2は、1または2、などの正の整数であってよい。
【0023】
1つまたは複数の実施形態によれば、SDPが適用され得、1つのクロマコーディングブロックが複数のルマコーディングブロックに関連付けられ得るとき、クロマイントラ予測モードをエントロピーコーディングするために使用されるコンテキストは、1つまたは複数の事前定義された位置に位置する対応するルマブロックに依存し得る。一実施形態では、1つまたは複数の事前定義された位置は、現在のクロマブロックの中間位置および/または左上隅を含み得る。一実施形態では、現在のクロマブロックの中間位置は、現在のクロマブロックの左上隅であってもよい。
【0024】
一実施形態では、現在のクロマブロックの中間位置および左上隅の両方が、対応するルマブロックを特定するために使用され得るときには、これらの2つのルマモードは、コンテキスト選択を実行する前に量子化され得る。一実施形態では、ルマモードは、コンテキスト選択プロセスを実行する前に2つの値に量子化されてもよく、これは指向性モードまたは無指向性モードであってもよい。
【0025】
他の実施形態では、無指向性モードは単一の値に量子化されてもよく、指向性モードはそれらの角度に応じてより小さいセットに量子化されてもよい。一例では、指向性モードは4つの値に量子化されてもよく、0は現在のモードの角度が90度未満であり得ることを意味し、1は現在のモードの角度が90度から135度であり得ることを意味し、2は現在のモードの角度が135度から180度であり得ることを意味し、3は現在のモードの角度が180度より大きくなり得ることを意味する。
【0026】
一実施形態では、コンテキストは、コロケートされたルマブロックのサンプルの大部分を予測するために使用され得るイントラ予測モードとして導出され得る。
【0027】
一実施形態では、複数のサンプル位置が事前定義され得、コロケートされたルマブロックを予測するためのこれらの位置に関連付けられイントラ予測モードが識別され得、次に、これらの識別された予測モードの1つを使用してコンテキスト値が導出され得る。一例では、識別された予測モードの中で最も頻繁に使用され得る予測モードを使用して、コンテキスト値が導出され得る。第2の例では、事前定義されたサンプル位置は、4つの隅サンプルおよび中央/中間サンプルを含む。第3の例では、事前定義されたサンプル位置は4つの隅サンプルを含む。第4の例では、事前定義されたサンプル位置は、4つの隅サンプルの2つの選択された位置と、1つの中央/中間サンプルとを含む。第5の例では、事前定義されたサンプル位置は、4つの隅サンプルの3つの選択された位置と、1つの中央/中間サンプルとを含む。
【0028】
一実施形態では、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックがイントラ予測モードによって予測されない可能性があり、現在のクロマコーディングブロックがイントラ予測モードによって予測され得る場合には、コロケートされた1つまたは複数のルマブロックの予測モードは、1つまたは複数の事前定義されたイントラ予測モードにマッピングされ得る。一例では、コロケートされたルマブロックがIBCまたはパレットモードによってコーディングされ得るときには、デフォルトのイントラ予測モードを使用して、クロマイントラ予測モードをエントロピーコーディングするためのコンテキストを導出し得る。前記デフォルトのイントラ予測モードは、DC、SMOOTH、SMOOTH-H、SMOOTH-V、またはPaeth予測モードを含むが、これらに限定されない。
【0029】
1つまたは複数の実施形態によれば、クロマイントラ予測モードをシグナリングするとき、現在のクロマモードがCfLモードであり得るかどうかを示すために、1つのフラグ、すなわちCfLフラグが最初にシグナリングされ得る。一実施形態では、近傍ブロックのクロマイントラ予測モードを使用して、CfLフラグをシグナリングするためのコンテキストを導出し得る。一例では、近傍のクロマモードのいずれもCfLモードでない可能性であるとき、第1のコンテキストを使用し得る。そうでない場合、第2のコンテキストが使用され得る。他の例では、近傍のクロマモードのいずれもCfLモードでない可能性であるとき、第1のコンテキストを使用し得る。そうではない場合、近傍のクロマモードの1つがCfLモードであり得るとき、第2のコンテキストを使用し得る。そうでない場合、第3のコンテキストが使用され得る。
【0030】
一実施形態では、対応するルマモードを使用して、CfLフラグをシグナリングするためのコンテキストを導出し得る。一実施形態では、対応するルマモードの座標は、現在のクロマブロックの中間位置および左上隅に位置し得る。他の実施形態では、対応するルマモードが指向性モードであり得るとき、第1のコンテキストが使用され得る。そうでない場合、第2のコンテキストが使用され得る。他の実施形態では、CfLフラグのコンテキストを決定するために2つの対応するルマモードが採用され得るとき、3つのコンテキストが使用され得る。両方の対応するルマモードが無指向性モードであり得るとき、第1のコンテキストが使用され得る。そうではない場合、対応するルマモードの1つが無指向性モードであり得るとき、第2のコンテキストが使用され得る。そうでない場合、第3のコンテキストが使用され得る。
【0031】
1つまたは複数の実施形態によれば、クロマイントラ予測モードをシグナリングするために、現在のピクチャ/スライス/タイル内の以前にエンコーディングされたルマモードを含む、1つのリストが構築され得る。最も高い出現率のN個のルマモードのみが許容され、現在のクロマブロックについてシグナリングされてもよく、Nは正の整数であってもよい。一実施形態では、Nは2の累乗であり得る。一実施形態では、現在のスーパーブロック行内の以前にエンコーディングされたルマモードのみを使用することができる。一実施形態では、SDPが有効にされ得るとき、現在のスーパーブロック内の以前にエンコーディングされたルマモードのみが使用され得る。
【0032】
1つまたは複数の実施形態によれば、ルマコード化ブロックについて許容されるすべての公称イントラ予測角度もまたクロマコード化ブロックに対して許容され、シグナリングされ得るのに対し、公称角度に対するデルタ角度のサブセットのみがクロマイントラコード化ブロックに対して許容され、シグナリングされ得る。一実施形態では、DC、SMOOTH、SMOOTH-H、SMOOTH-Vモードなどのすべての無指向性モードがクロマイントラコード化ブロックに対して許容され、シグナリングされ得る。一実施形態では、コロケートされたルマイントラ予測モードに対するデルタ角度のみがクロマコード化ブロックに対して許容され、シグナリングされ得る。一実施形態では、公称角度は、最初に無指向性モードと一緒にシグナリングされてもよい。その後、現在のモードが指向性モードであり得、コロケートされたルマ公称モードに等しい場合、第2のフラグは、公称角度に対するデルタ角度のインデックスを示すようにシグナリングされ得る。他の実施形態では、クロマコード化ブロックに対して許容されたすべてのイントラ予測モードが一緒にシグナリングされ得る。
【0033】
ここで図3を参照すると、ビデオデータをエンコーディングおよび/またはデコーディングするための方法300のステップを示す動作フローチャートが図示されている。いくつかの実装形態では、図3の1つまたは複数のプロセスブロックは、コンピュータ102(図1)およびサーバコンピュータ114(図1)によって実行されてもよい。いくつかの実装形態では、図3の1つまたは複数のプロセスブロックは、コンピュータ102およびサーバコンピュータ114とは別個のまたはコンピュータ102およびサーバコンピュータ114を含む、他のデバイスまたはデバイスのグループによって実行され得る。
【0034】
302において、方法300は、クロマ成分およびルマ成分を含むビデオデータを受信するステップを含む。
【0035】
304において、方法300は、クロマイントラ予測モードをエントロピーコーディングのための1つまたは複数のコンテキストを、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて識別するステップを含む。
【0036】
306において、方法300は、識別されたコンテキストに基づいてビデオデータをデコーディングするステップを含む。
【0037】
図3は、一実装形態の例示のみを提供し、異なる実施形態がどのように実施され得るかに関する限定を意味しないことが理解されよう。図示した環境に対する多くの修正は、設計および実装要件に基づいて行われ得る。
【0038】
図4は、一例示的な実施形態による、図1に図示するコンピュータの内部構成要素および外部構成要素のブロック図400である。図4は、一実装形態の例示のみを提供し、異なる実施形態が実施され得る環境に関する限定を意味しないことを理解されたい。図示した環境に対する多くの修正は、設計および実装要件に基づいて行われ得る。
【0039】
コンピュータ102(図1)およびサーバコンピュータ114(図1)は、図4に示す内部構成要素800A、800Bおよび外部構成要素900A、900Bのそれぞれのセットを含み得る。内部構成要素800のセットの各々は、1つまたは複数のプロセッサ820と、1つまたは複数のバス826上の1つもしくは複数のコンピュータ可読RAM 822および1つもしくは複数のコンピュータ可読ROM 824と、1つまたは複数のオペレーティングシステム828と、1つまたは複数のコンピュータ可読有形記憶デバイス830と、を含む。
【0040】
プロセッサ820は、ハードウェア、ファームウェア、またはハードウェアとソフトウェアとの組み合わせで実装される。プロセッサ820は、中央処理装置(CPU)、グラフィック処理装置(GPU)、加速処理装置(APU)、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、または他のタイプの処理構成要素である。いくつかの実装形態では、プロセッサ820は、機能を実行するようにプログラムすることができる1つまたは複数のプロセッサを含む。バス826は、内部構成要素800A、800B間の通信を可能にする構成要素を含む。
【0041】
サーバコンピュータ114(図1)上の1つまたは複数のオペレーティングシステム828、ソフトウェアプログラム108(図1)、ならびにビデオコーディングプログラム116(図1)は、それぞれのRAM 822(通常はキャッシュメモリを含む)の1つまたは複数を介してそれぞれのプロセッサ820の1つまたは複数によって実行されるために、それぞれのコンピュータ可読有形記憶デバイス830の1つまたは複数に格納される。図4に示す実施形態では、コンピュータ可読有形記憶デバイス830の各々は、内蔵ハードドライブの磁気ディスク記憶デバイスである。あるいは、コンピュータ可読有形記憶デバイス830の各々は、ROM 824、EPROM、フラッシュメモリ、光ディスク、光磁気ディスク、ソリッドステートディスク、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)、フロッピーディスク、カートリッジ、磁気テープ、および/またはコンピュータプログラムおよびデジタル情報を格納することができる他のタイプの非一時的なコンピュータ可読有形記憶デバイスなどの半導体記憶デバイスである。
【0042】
内部構成要素800A、Bの各セットはまた、CD-ROM、DVD、メモリスティック、磁気テープ、磁気ディスク、光ディスク、または半導体記憶デバイスなどの1つまたは複数のポータブルコンピュータ可読有形記憶デバイス936に対して読み取りおよび書き込みするためのR/Wドライブまたはインターフェース832を含む。ソフトウェアプログラム108(図1)およびビデオコーディングプログラム116(図1)などのソフトウェアプログラムは、それぞれのポータブルコンピュータ可読有形記憶デバイス936の1つまたは複数に格納され、それぞれのR/Wドライブまたはインターフェース832を介して読み取られ、それぞれのハードドライブ830にロードされ得る。
【0043】
内部構成要素800A、Bの各セットはまた、TCP/IPアダプタカード、無線Wi-Fiインターフェースカード、あるいは3G、4G、もしくは5G無線インターフェースカードまたは他の有線もしくは無線通信リンクなどのネットワークアダプタまたはインターフェース836を含む。サーバコンピュータ114(図1)上のソフトウェアプログラム108(図1)およびビデオコーディングプログラム116(図1)は、ネットワーク(例えば、インターネット、ローカルエリアネットワーク、または他の広域ネットワーク)およびそれぞれのネットワークアダプタまたはインターフェース836を介して外部コンピュータからコンピュータ102(図1)およびサーバコンピュータ114にダウンロードすることができる。ネットワークアダプタまたはインターフェース836から、サーバコンピュータ114上のソフトウェアプログラム108およびビデオコーディングプログラム116が、それぞれのハードドライブ830にロードされる。ネットワークは、銅線、光ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータおよび/またはエッジサーバを含み得る。
【0044】
外部構成要素900A、900Bのセットの各々は、コンピュータディスプレイモニタ920、キーボード930、およびコンピュータマウス934を含むことができる。外部構成要素900A、900Bはまた、タッチスクリーン、仮想キーボード、タッチパッド、ポインティングデバイス、および他のヒューマンインターフェースデバイスを含むことができる。内部構成要素800A、800Bのセットの各々はまた、コンピュータディスプレイモニタ920、キーボード930、およびコンピュータマウス934にインターフェースするためのデバイスドライバ840を含む。デバイスドライバ840、R/Wドライブまたはインターフェース832ならびにネットワークアダプタまたはインターフェース836は、(記憶デバイス830および/またはROM 824に格納された)ハードウェアおよびソフトウェアを含む。
【0045】
本開示はクラウドコンピューティングに関する詳細な説明を含むが、本明細書に列挙された教示の実装形態はクラウドコンピューティング環境に限定されないことを事前に理解されたい。むしろ、いくつかの実施形態は、現在知られているまたは後に開発される任意の他のタイプのコンピューティング環境と併せて実施することができる。
【0046】
クラウドコンピューティングは、最小限の管理労力またはサービスのプロバイダとの対話で迅速にプロビジョニングおよびリリースすることができる構成可能コンピューティングリソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス)の共有プールへの便利なオンデマンドネットワークアクセスを可能にするためのサービス配信のモデルである。このクラウドモデルは、少なくとも5つの特性、少なくとも3つのサービスモデル、および少なくとも4つの展開モデルを含み得る。
【0047】
特性は以下の通りである。
オンデマンドセルフサービス:クラウド消費者は、サービスのプロバイダとの人的な対話を必要とせずに、必要に応じて自動的に、サーバ時間やネットワークストレージなどのコンピューティング機能を一方的にプロビジョニングすることができる。
広範なネットワークアクセス:機能は、ネットワークを介して利用可能であり、異種のシンまたはシックなクライアントプラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による使用を促進する標準的な機構を介してアクセスされる。
リソースプーリング:プロバイダのコンピューティングリソースは、マルチテナントモデルを使用して複数の消費者にサービスを提供するためにプールされ、異なる物理リソースおよび仮想リソースは、需要に応じて動的に割り当ておよび再割り当てされる。消費者は、一般に、提供されたリソースの正確な位置に対する制御または知識を有していないが、より高い抽象化レベル(例えば、国、州、またはデータセンター)で位置を指定することができるという点で、位置独立性の感覚がある。
迅速な弾力性:機能は、迅速にスケールアウトするために迅速かつ弾力的に、場合によっては自動的にプロビジョニングし、迅速にスケールインするために迅速にリリースすることができる。消費者には、プロビジョニングに利用可能な機能は多くの場合、無制限であるように見え、いつでも任意の量で購入することができる。
測定されたサービス:クラウドシステムは、サービスのタイプ(例えば、ストレージ、処理、帯域幅、およびアクティブユーザアカウント)に適したある抽象化レベルで計量能力を活用することによって、リソース使用を自動的に制御および最適化する。リソース使用は、利用されるサービスのプロバイダおよび消費者の両方に透明性を提供するように監視、制御、および報告され得る。
【0048】
サービスモデルは以下の通りである。
サービスとしてのソフトウェア(SaaS):消費者に提供される機能は、クラウドインフラストラクチャ上で動作するプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブブラウザ(例えば、ウェブベースの電子メール)などのシンクライアントインターフェースを介して様々なクライアントデバイスからアクセス可能である。消費者は、限られたユーザ固有のアプリケーション構成設定を除いて、ネットワーク、サーバ、オペレーティングシステム、ストレージ、または個々のアプリケーション機能さえも含む基盤となるクラウドインフラストラクチャを管理または制御しない。
サービスとしてのプラットフォーム(PaaS):消費者に提供される機能は、プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、消費者が作成または取得したアプリケーションをクラウドインフラストラクチャ上に展開することである。消費者は、ネットワーク、サーバ、オペレーティングシステム、またはストレージを含む基盤となるクラウドインフラストラクチャを管理または制御しないが、展開されたアプリケーションおよび場合によってはアプリケーションホスティング環境構成を制御する。
サービスとしてのインフラストラクチャ(laaS):消費者に提供される機能は、処理、ストレージ、ネットワーク、および他の基本的なコンピューティングリソースをプロビジョニングすることであり、消費者は、オペレーティングシステムおよびアプリケーションを含むことができる任意のソフトウェアを展開および実行することができる。消費者は、基盤となるクラウドインフラストラクチャを管理も制御もしないが、オペレーティングシステム、ストレージ、展開されたアプリケーション、および場合によっては選択ネットワーキング構成要素(例えば、ホストファイアウォール)の限定された制御を制御する。
【0049】
展開モデルは以下の通りである。
プライベートクラウド:クラウドインフラストラクチャは、組織のためにのみ動作する。これは、組織または第三者によって管理されてもよく、オンプレミスまたはオフプレミスで存在してもよい。
コミュニティクラウド:クラウドインフラストラクチャは、いくつかの組織によって共有され、共有された関心事項(例えば、ミッション、セキュリティ要件、ポリシー、およびコンプライアンスの考慮事項)を有する特定のコミュニティをサポートする。これは、組織または第三者によって管理されてもよく、オンプレミスまたはオフプレミスで存在してもよい。
パブリッククラウド:クラウドインフラストラクチャは、一般の人々または大規模な業界グループに提供され、クラウドサービスを販売する組織によって所有される。
ハイブリッドクラウド:クラウドインフラストラクチャは、独自のエンティティのままであるが、データおよびアプリケーションの可搬性(例えば、クラウド間の負荷分散のためのクラウドバースト)を可能にする標準化されたまたは独自の技術によって互いに結び付けられた2つ以上のクラウド(私的、共同体、または公的)の構成である。
【0050】
クラウドコンピューティング環境は、無国籍、低結合、モジュール性、およびセマンティック相互運用性に焦点を合わせたサービス指向である。クラウドコンピューティングの中心には、相互接続されたノードのネットワークを含むインフラストラクチャがある。
【0051】
図5を参照すると、例示的なクラウドコンピューティング環境500が図示されている。図示するように、クラウドコンピューティング環境500は、例えば、携帯情報端末(PDA)または携帯電話54A、デスクトップコンピュータ54B、ラップトップコンピュータ54C、および/または自動車コンピュータシステム54Nなどの、クラウド消費者によって使用されるローカルコンピューティングデバイスが通信し得る1つまたは複数のクラウドコンピューティングノード10を含む。クラウドコンピューティングノード10は、互いに通信し得る。それらは、上述のプライベートクラウド、コミュニティクラウド、パブリッククラウド、ハイブリッドクラウド、またはそれらの組み合わせなどの1つもしくは複数のネットワークにおいて、物理的または仮想的にグループ化(図示せず)されてもよい。これにより、クラウドコンピューティング環境600は、クラウド消費者がローカルコンピューティングデバイス上のリソースを維持する必要がないサービスとして、インフラストラクチャ、プラットフォーム、および/またはソフトウェアを提供することができる。図5に示すコンピューティングデバイス54A~54Nの種類は例示のみを意図しており、クラウドコンピューティングノード10およびクラウドコンピューティング環境500は、任意のタイプのネットワークおよび/または(例えば、ウェブブラウザを使用して)ネットワークアドレス指定可能な接続を介して任意のタイプのコンピュータ化されたデバイスと通信することができることが理解される。
【0052】
図6を参照すると、クラウドコンピューティング環境500(図5)によって提供される機能抽象化層600のセットが示されている。図6に示す構成要素、層、および機能は例示のみを意図しており、実施形態はこれらに限定されないことを事前に理解されたい。図示するように、以下の層および対応する機能が提供される。
【0053】
ハードウェアおよびソフトウェア層60は、ハードウェアおよびソフトウェア構成要素を含む。ハードウェア構成要素の例は、メインフレーム61、RISC(縮小命令セットコンピュータ)アーキテクチャベースのサーバ62、サーバ63、ブレードサーバ64、記憶デバイス65、ならびにネットワークおよびネットワーク構成要素66を含む。いくつかの実施形態では、ソフトウェア構成要素は、ネットワークアプリケーションサーバソフトウェア67およびデータベースソフトウェア68を含む。
【0054】
仮想化層70は、仮想エンティティの以下の例が提供され得る抽象化層を提供する、すなわち、仮想サーバ71、仮想ストレージ72、仮想プライベートネットワークを含む仮想ネットワーク73、仮想アプリケーションおよびオペレーティングシステム74、ならびに仮想クライアント75である。
【0055】
一例では、管理層80は、以下に説明する機能を提供し得る。リソースプロビジョニング81は、クラウドコンピューティング環境内でタスクを実行するために利用されるコンピューティングリソースおよび他のリソースの動的な調達を提供する。計測および価格設定82は、リソースがクラウドコンピューティング環境内で利用されるときのコスト追跡、およびこれらのリソースの消費に対する請求または請求書発行を提供する。一例では、これらのリソースは、アプリケーションソフトウェアライセンスを含み得る。セキュリティは、クラウド消費者およびタスクのための識別検証、ならびにデータおよび他のリソースのための保護を提供する。ユーザポータル83は、消費者およびシステム管理者にクラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理84は、必要なサービスレベルが満たされるようにクラウドコンピューティングリソースの割り当ておよび管理を提供する。サービスレベル合意(SLA)の計画および履行85は、その将来の要件がSLAに従って予想されるクラウドコンピューティングリソースの事前配置および調達を提供する。
【0056】
ワークロード層90は、クラウドコンピューティング環境を利用し得る機能の例を提供する。この層から提供され得るワークロードおよび機能の例は、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想教室教育配信93、データ解析処理94、取引処理95、ならびにビデオコーディング96を含む。ビデオコーディング96は、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに関連付けられたコンテキストに基づいてビデオデータをエンコーディングおよび/またはデコーディングし得る。
【0057】
いくつかの実施形態は、任意の可能な技術的詳細レベルの統合におけるシステム、方法、および/またはコンピュータ可読媒体に関し得る。コンピュータ可読媒体は、プロセッサに動作を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読非一時的記憶媒体を含み得る。
【0058】
コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持および格納することができる有形のデバイスであり得る。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、またはこれらの任意の適切な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラム可能読み出し専用メモリ(EPROMまたはフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、命令が記録されたパンチカードまたは溝内の隆起構造などの機械的にエンコーディングされたデバイス、ならびに上記の任意の適切な組み合わせを含む。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体(例えば、光ファイバケーブルを通過する光パルス)を介して伝搬する電磁波、またはワイヤを介して伝送される電気信号などの一時的な信号自体であると解釈されるべきではない。
【0059】
本明細書に記載されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティングデバイス/処理デバイスに、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワークおよび/もしくは無線ネットワークを介して外部コンピュータもしくは外部記憶デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータおよび/またはエッジサーバを含み得る。各コンピューティング/処理デバイスのネットワークアダプタカードまたはネットワークインターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体に格納するためにコンピュータ可読プログラム命令を転送する。
【0060】
動作を実行するためのコンピュータ可読プログラムコード/命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路の構成データ、あるいはSmalltalk、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは同様のプログラミング言語などの手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかであってもよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンドアロンソフトウェアパッケージとして、部分的にユーザのコンピュータ上で、部分的にリモートコンピュータ上で、または完全にリモートコンピュータもしくはサーバ上で実行し得る。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、または外部コンピュータに(例えば、インターネットサービスプロバイダを使用してインターネットを介して)接続されてもよい。いくつかの実施形態では、例えば、プログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)、またはプログラマブルロジックアレイ(PLA)を含む電子回路は、態様または動作を実行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることによってコンピュータ可読プログラム命令を実行し得る。
【0061】
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートおよび/またはブロック図の1つまたは複数のブロックで指定された機能/動作を実施するための手段を作成するように、機械を製造するために、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてもよい。これらのコンピュータ可読プログラム命令はまた、コンピュータ、プログラム可能なデータ処理装置、および/または他のデバイスに特定の方法で機能するように指示することができるコンピュータ可読記憶媒体に格納されてもよく、その結果、格納された命令を有するコンピュータ可読記憶媒体は、フローチャートおよび/またはブロック図の1つまたは複数のブロックで指定された機能/動作の態様を実施する命令を含む製品を含む。
【0062】
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能な装置、または他のデバイス上で実行される命令がフローチャートおよび/またはブロック図の1つまたは複数のブロックで指定された機能/動作を実施するように、コンピュータ、他のプログラム可能な装置、または他のデバイス上で一連の動作ステップを実行させてコンピュータ実施プロセスを生成するために、コンピュータ、他のプログラム可能な装置、または他のデバイス上にロードされてもよい。
【0063】
図のフローチャートおよびブロック図は、様々な実施形態によるシステム、方法、およびコンピュータ可読媒体の可能な実装形態のアーキテクチャ、機能、および動作を示す。これに関して、フローチャートまたはブロック図の各ブロックは、指定された論理機能を実装するための1つまたは複数の実行可能命令を含む、モジュール、セグメント、または命令の一部を表し得る。方法、コンピュータシステム、およびコンピュータ可読媒体は、図に図示すものよりも、さらなるブロック、より少ないブロック、異なるブロック、または異なる配置のブロックを含んでもよい。いくつかの代替的な実装形態では、ブロックに記載された機能は、図に記載された順序とは異なる順序で行われてもよい。例えば、連続して示されている2つのブロックは、実際には、同時にもしくは実質的に同時に実行されてもよく、またはブロックは、関連する機能に応じて、時には逆の順序で実行されてもよい。また、ブロック図および/またはフローチャート図の各ブロック、ならびにブロック図および/またはフローチャート図のブロックの組み合わせは、指定された機能または動作を実行するか、専用ハードウェアとコンピュータ命令との組み合わせを実行する、専用ハードウェアベースのシステムによって実装され得ることにも留意されたい。
【0064】
本明細書に記載のシステムおよび/または方法は、ハードウェア、ファームウェア、またはハードウェアとソフトウェアとの組み合わせの異なる形態で実装されてもよいことは明らかであろう。これらのシステムおよび/または方法を実装するために使用される実際の専用の制御ハードウェアまたはソフトウェアコードは、実装形態を限定するものではない。したがって、システムおよび/または方法の動作および挙動は、特定のソフトウェアコードを参照することなく本明細書に記載されており、ソフトウェアおよびハードウェアは、本明細書の記載に基づいてシステムおよび/または方法を実装するように設計され得ることが理解される。
【0065】
本明細書で使用される要素、動作、または命令は、そのように明示的に記載されていない限り、重要または必須であると解釈されるべきではない。また、本明細書で使用される場合、冠詞「a」および「an」は、1つまたは複数の項目を含むことを意図しており、「1つまたは複数」と互換的に使用され得る。さらに、本明細書で使用される場合、「セット」という用語は、1つまたは複数の項目(例えば、関連項目、無関係な項目、関連項目と無関係な項目との組み合わせなど)を含むことを意図しており、「1つまたは複数」と互換的に使用され得る。1つの項目のみが意図される場合、「1つ」という用語または同様の用語が使用される。また、本明細書で使用される場合、「有する(has)」、「有する(have)」、「有する(having)」などの用語は、オープンエンド用語であることを意図している。さらに、「に基づいて」という語句は、特に明記しない限り、「少なくとも部分的に、基づいて」を意味することを意図している。
【0066】
様々な態様および実施形態の説明は、例示の目的で提示されているが、網羅的であること、または開示された実施形態に限定されることを意図するものではない。特徴の組み合わせが特許請求の範囲に記載され、および/または本明細書に開示されているが、これらの組み合わせは、可能な実装形態の開示を限定することを意図するものではない。実際、これらの特徴の多くは、特許請求の範囲に具体的に記載されていない、および/または明細書に開示されていない方法で組み合わされてもよい。以下に列挙される各従属請求項は1つの請求項のみに直接依存してもよいが、可能な実装形態の開示は、各従属請求項を請求項セットの他のすべての請求項と組み合わせて含む。記載された実施形態の範囲から逸脱することなく、多くの修正および変形が当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の用途または市場で見られる技術に対する技術的改善を最もよく説明するために、または当業者が本明細書に開示する実施形態を理解することを可能にするために選択された。
【符号の説明】
【0067】
10 クラウドコンピューティングノード
54A コンピューティングデバイス(携帯電話)
54B コンピューティングデバイス(デスクトップコンピュータ)
54C コンピューティングデバイス(ラップトップコンピュータ)
54N コンピューティングデバイス(自動車コンピュータシステム)
60 ハードウェアおよびソフトウェア層
61 メインフレーム
62 RISC(縮小命令セットコンピュータ)アーキテクチャベースのサーバ
63 サーバ
64 ブレードサーバ
65 記憶デバイス
66 ネットワークおよびネットワーク構成要素
67 ネットワークアプリケーションサーバソフトウェア
68 データベースソフトウェア
70 仮想化層
71 仮想サーバ
72 仮想ストレージ
73 仮想プライベートネットワークを含む仮想ネットワーク
74 仮想アプリケーションおよびオペレーティングシステム
75 仮想クライアント
80 管理層
81 リソースプロビジョニング
82 計測および価格設定
83 ユーザポータル
84 サービスレベル管理
85 サービスレベル合意(SLA)の計画および履行
90 ワークロード層
91 マッピングおよびナビゲーション
92 ソフトウェア開発およびライフサイクル管理
93 仮想教室教育配信
94 データ解析処理
95 取引処理
96 ビデオコーディング
100 ビデオコーディングシステム
102 コンピュータ
104 プロセッサ
106 データ記憶デバイス
108 ソフトウェアプログラム
110 通信ネットワーク
112 データベース
114 サーバコンピュータ
116 ビデオコーディングプログラム
200 コーディングツリー構造のブロック図
202 ルマ成分
204 クロマ成分
400 内部構成要素および外部構成要素のブロック図
500 クラウドコンピューティング環境
600 機能抽象化層
800A、800B 内部構成要素
820 プロセッサ
822 RAM
824 ROM
826 バス
828 オペレーティングシステム
830 有形記憶デバイス、ハードドライブ
832 R/Wドライブまたはインターフェース
836 ネットワークアダプタまたはインターフェース
840 デバイスドライバ
900A、900B 外部構成要素
920 コンピュータディスプレイモニタ
930 キーボード
934 コンピュータマウス
936 ポータブルコンピュータ可読有形記憶デバイス
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2022-04-13
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
プロセッサによって実行可能な、ビデオコーディングの方法であって、
クロマ成分およびルマ成分を含むビデオデータを受信するステップと、
1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて、クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストを識別するステップと、
前記識別されたコンテキストに基づいて前記ビデオデータをデコーディングするステップと
を含む、方法。
【請求項2】
前記1つまたは複数の事前定義された位置は、現在のクロマブロックの中間位置および左上隅の中からの1つまたは複数を含む、請求項1に記載の方法。
【請求項3】
前記現在のクロマブロックの前記中間位置は、クロマブロックの前記左上隅であってもよい、請求項2に記載の方法。
【請求項4】
1つまたは複数の事前定義されたサンプル位置を識別するステップと、
前記コロケートされたルマブロックを予測するための前記複数のサンプル位置に関連付けられたイントラ予測モードを識別するステップと、
前記識別されたイントラ予測モードの中から、予測モードに基づいて前記コンテキスト値を導出するステップと
をさらに含む、請求項1に記載の方法。
【請求項5】
前記識別された予測モードの中から最も頻繁に使用される予測モードは、前記コンテキスト値を導出するために使用される、請求項4に記載の方法。
【請求項6】
前記事前定義されたサンプル位置は、1つまたは複数の隅サンプルおよび中央サンプルを含む、請求項4に記載の方法。
【請求項7】
前記事前定義されたサンプル位置は、4つの隅サンプルを含む、請求項4に記載の方法。
【請求項8】
前記イントラ予測モードを、イントラ予測モードによって予測されていない1つまたは複数の事前定義された位置にある前記コロケートされたルマブロックに基づいて、およびイントラ予測モードによって予測されている前記現在のクロマコーディングブロックに基づいて、1つまたは複数の事前定義されたイントラ予測モードにマッピングするステップをさらに含む、請求項1に記載の方法。
【請求項9】
デフォルトのイントラ予測モードは、ブロック内コピーまたはパレットモードによってコーディングされている前記コロケートされたルマブロックに基づいて、前記クロマイントラ予測モードをエントロピーコーディングするための前記コンテキストを導出するために使用される、請求項8に記載の方法。
【請求項10】
前記デフォルトのイントラ予測モードは、DC、SMOOTH、SMOOTH-H、SMOOTH-V、およびPaeth予測モードの中からの1つまたは複数を含む、請求項9に記載の方法。
【請求項11】
前記クロマイントラ予測モードをシグナリングすることに基づいて、前記現在のクロマモードがルマからのクロマであるかどうかを示すためにフラグがシグナリングされる、請求項1に記載の方法。
【請求項12】
対応するルマモードは前記フラグをシグナリングするための前記コンテキストを導出するために使用される、請求項11に記載の方法。
【請求項13】
ルマコード化ブロックに対して許容されるすべての公称イントラ予測角度は、クロマコード化ブロックに対して許容され、シグナリングされる、請求項1に記載の方法。
【請求項14】
公称角度に対するデルタ角度のサブセットのみがクロマイントラコード化ブロックに対して許容され、シグナリングされる、請求項13に記載の方法。
【請求項15】
すべての無指向性モードはクロマイントラコード化ブロックに対して許容され、シグナリングされる、請求項14に記載の方法。
【請求項16】
前記コロケートされたルマイントラ予測モードに対応するデルタ角度のみが前記クロマコード化ブロックに対して許容され、シグナリングされる、請求項14に記載の方法。
【請求項17】
無指向性モードと一緒に前記公称角度をシグナリングするステップと、
前記現在のモードは指向性モードであり、コロケートされたルマ公称モードに等しいことに基づいて、前記公称角度に対するデルタ角度のインデックスを示すために第2のフラグをシグナリングするステップと
をさらに含む、請求項16に記載の方法。
【請求項18】
クロマコード化ブロックのために前記許容されるすべてのイントラ予測モードは一緒にシグナリングされる、請求項16に記載の方法。
【請求項19】
ルマモードリストに基づいて、前記クロマイントラ予測モードをシグナリングするステップをさらに含み、前記ルマモードリストは、現在のスーパーブロック内の最も高い出現率の以前にエンコードされたルマモードを含む、請求項1に記載の方法。
【請求項20】
ビデオデータをデコーディングするためのコンピュータシステムであって、前記コンピュータシステムは、
コンピュータプログラムコードを格納するように構成された1つまたは複数のコンピュータ可読非一時的記憶媒体と、
前記コンピュータプログラムコードにアクセスし、前記コンピュータプログラムコードによって命令されたように動作するよう構成された1つまたは複数のコンピュータプロセッサであって、前記コンピュータプログラムコードは、
前記1つまたは複数のコンピュータプロセッサに、ルマ成分およびクロマ成分を含むビデオデータを受信させるように構成されたコードを受信するステップと、
前記1つまたは複数のコンピュータプロセッサに、1つまたは複数の事前定義された位置にあるコロケートされたルマブロックに基づいて、クロマイントラ予測モードをエントロピーコーディングするための1つまたは複数のコンテキストを識別させるように構成されたコードを識別するステップと、
前記1つまたは複数のコンピュータプロセッサに、前記識別されたコンテキストに基づいて前記ビデオデータをデコーディングさせるように構成されたデコーディングコードと
を含む、1つまたは複数のコンピュータプロセッサと
を備える、コンピュータシステム。
【請求項21】
1つまたは複数のコンピュータプロセッサに、請求項1~19のいずれか一項に記載の方法を実行させるためのコンピュータプログラム。
【国際調査報告】