【文献】
Jianle Chen Qualcomm,SHVC Test Model 2 (SHM 2)[online], JCTVC-M JCTVC-M1007_v1,インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M1007-v1.zip>,P.1,2,4,25,27,28
【文献】
Jianle Chen Qualcomm,SHVC Workding Draft 2[online], JCTVC-M JCTVC-M1008_v1,インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M1008-v1.zip>,P.32-40
(58)【調査した分野】(Int.Cl.,DB名)
前記装置は、コンピュータと、ノートブックと、ラップトップと、コンピュータと、タブレットコンピュータと、セットトップボックスと、電話ハンドセットと、スマートフォンと、スマートパッドと、テレビジョンと、カメラと、ディスプレイデバイスと、デジタルメディアプレーヤと、ビデオゲームコンソールと、車内コンピュータとのうちの1つまたは複数なるグループから選択されるデバイスを備える、
請求項1に記載の装置。
【発明を実施するための形態】
【0023】
[0033]本明細書で説明するいくつかの実施形態は、HEVC(高効率ビデオコーディング)など、アドバンストビデオコーデックのコンテキストにおけるスケーラブルビデオコーディングのためのレイヤ間予測に関する。より詳細には、本開示は、HEVCのスケーラブルビデオコーディング(SVC)拡張におけるレイヤ間予測の性能の改善のためのシステムおよび方法に関する。
【0024】
[0034]以下の説明では、いくつかの実施形態に関係するH.264/AVC技法について説明し、HEVC規格および関係する技法についても説明する。いくつかの実施形態について、HEVCおよび/またはH.264規格のコンテキストにおいて本明細書で説明するが、本明細書で開示するシステムおよび方法が任意の好適なビデオコーディング規格に適用可能であり得ることを、当業者は諒解されよう。たとえば、本明細書で開示する実施形態は、以下の規格、すなわち、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、およびそれのスケーラブルビデオコーディング(SVC)拡張とマルチビュービデオコーディング(MVC)拡張とを含む、(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264のうちの1つまたは複数に適用可能であり得る。
【0025】
[0035]HEVCは、概して、多くの点で、前のビデオコーディング規格のフレームワークに従う。HEVCにおける予測のユニットは、いくつかの前のビデオコーディング規格におけるユニット(たとえば、マクロブロック)とは異なる。事実上、マクロブロックの概念は、いくつかの前のビデオコーディング規格において理解されているように、HEVC中に存在しない。マクロブロックは、考えられる利益の中でも、高いフレキシビリティを与え得る、4分木方式に基づく階層構造と置き換えられ得る。たとえば、HEVC方式内で、3つのタイプのブロック、コーディングユニット(CU)、予測ユニット(PU:Prediction Unit)、および変換ユニット(TU:Transform Unit)が定義される。CUは領域スプリッティングの基本ユニットを指し得る。CUはマクロブロックの概念に類似すると見なされ得るが、それは、最大サイズを制限せず、コンテンツ適応性を改善するために4つの等しいサイズのCUへの再帰的スプリッティングを可能にし得る。PUはインター/イントラ予測の基本ユニットと見なされ得、それは、不規則な画像パターンを効果的にコーディングするために、単一のPU中に複数の任意の形状区分を含んでいることがある。TUは変換の基本ユニットと見なされ得る。それは、PUとは無関係に定義され得るが、それのサイズは、TUが属するCUに制限され得る。3つの異なる概念へのブロック構造のこの分離は、各々がそれの役割に従って最適化されることを可能にし得、それによりコーディング効率が改善され得る。
【0026】
[0036]単に説明の目的で、本明細書で開示するいくつかの実施形態について、ただ2つのレイヤ(たとえば、ベースレイヤなどの下位レイヤ、およびエンハンスメントレイヤなどの上位レイヤ)を含む例を用いて説明する。そのような例は、複数のベースレイヤおよび/またはエンハンスメントレイヤを含む構成に適用可能であり得ることを理解されたい。さらに、説明を簡単にするために、以下の開示は、いくつかの実施形態に関して「フレーム」または「ブロック」という用語を含む。ただし、これらの用語は限定的なものではない。たとえば、以下で説明する技法は、ブロック(たとえば、CU、PU、TU、マクロブロックなど)、スライス、フレームなど、任意の好適なビデオユニットとともに使用され得る。
ビデオコーディング規格
【0027】
[0037]ビデオ画像、TV画像、静止画像、あるいはビデオレコーダまたはコンピュータによって生成された画像など、デジタル画像は、水平ラインおよび垂直ラインで構成されたピクセルまたはサンプルからなり得る。単一の画像中のピクセルの数は一般に数万個である。各ピクセルは、一般に、ルミナンス情報とクロミナンス情報とを含んでいる。圧縮なしに、画像符号化器から画像復号器に搬送されるべき情報の量は、リアルタイム画像送信を不可能にするほど非常に大きい。送信されるべき情報の量を低減するために、JPEG、MPEGおよびH.263規格など、いくつかの異なる圧縮方法が開発された。
【0028】
[0038]ビデオコーディング規格は、ITU−T H.261と、ISO/IEC MPEG−1 Visualと、ITU−T H.262またはISO/IEC MPEG−2 Visualと、ITU−T H.263と、ISO/IEC MPEG−4 Visualと、それのスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)拡張を含む(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264とを含む。
【0029】
[0039]さらに、新しいビデオコーディング規格、すなわち、高効率ビデオコーディング(HEVC)が、ITU−Tビデオコーディングエキスパートグループ(VCEG:Video Coding Experts Group)とISO/IECモーションピクチャエキスパートグループ(MPEG:Motion Picture Experts Group)とのジョイントコラボレーションチームオンビデオコーディング(JCT−VC:Joint Collaboration Team on Video Coding)によって開発されている。HEVCドラフト10についての完全引用は、文書JCTVC−L1003、Brossら、「High Efficiency Video Coding (HEVC) Text Specification Draft 10」、ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11のジョイントコラボレーティブチームオンビデオコーディング(JCT−VC:Joint Collaborative Team on Video Coding)、第12回会合:ジュネーブ、スイス、2013年1月14日〜2013年1月23日である。HEVCのマルチビュー拡張、すなわち、MV−HEVC、およびSHVCと称されるHEVCのスケーラブル拡張も、それぞれJCT−3V(ITU−T/ISO/IECジョイントコラボレーティブチームオン3Dビデオコーディング拡張開発)およびJCT−VCによって開発されている。
【0030】
[0040]添付の図面を参照しながら新規のシステム、装置、および方法の様々な態様について以下でより十分に説明する。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示する任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるために与えるものである。本明細書の教示に基づいて、本開示の範囲は、本開示の他の態様とは無関係に実装されるにせよ、本開示の他の態様と組み合わせて実装されるにせよ、本明細書で開示する新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載される態様をいくつ使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、本明細書に記載する本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。本明細書で開示するどの態様も請求項の1つまたは複数の要素によって実施され得ることを理解されたい。
【0031】
[0041]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好適な態様のいくつかの利益および利点について説明するが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能であるものとし、それらのいくつかを例として、図および好適な態様についての以下の説明において示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。
【0032】
[0042]添付の図面は例を示している。添付の図面中の参照番号によって示される要素は、以下の説明における同様の参照番号によって示される要素に対応する。本開示では、序数語(たとえば、「第1の」、「第2の」、「第3の」など)で始まる名前を有する要素は、必ずしもそれらの要素が特定の順序を有することを暗示するとは限らない。むしろ、そのような序数語は、同じまたは同様のタイプの異なる要素を指すために使用されるにすぎない。
ビデオコーディングシステム
【0033】
[0043]
図1Aは、本開示で説明する態様による技法を利用し得る例示的なビデオコーディングシステム10を示すブロック図である。本明細書で使用し説明する「ビデオコーダ」という用語は、総称的にビデオ符号化器とビデオ復号器の両方を指す。本開示では、「ビデオコーディング」または「コーディング」という用語は、ビデオ符号化とビデオ復号とを総称的に指すことがある。
【0034】
[0044]
図1Aに示されているように、ビデオコーディングシステム10は、宛先モジュール14によって後で復号されるべき符号化ビデオデータを生成するソースモジュール12を含む。
図1Aの例では、ソースモジュール12と宛先モジュール14とは別々のデバイス上にあり、詳細には、ソースモジュール12はソースデバイスの一部であり、宛先モジュール14は宛先デバイスの一部である。ただし、ソースモジュール12および宛先モジュール14は、
図1Bの例に示されているように、同じデバイス上にあるかまたはそれの一部であり得ることに留意されたい。
【0035】
[0045]もう一度
図1Aを参照すると、ソースモジュール12および宛先モジュール14は、デスクトップコンピュータ、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースモジュール12および宛先モジュール14はワイヤレス通信のために装備され得る。
【0036】
[0046]宛先モジュール14は、リンク16を介して、復号されるべき符号化ビデオデータを受信し得る。リンク16は、ソースモジュール12から宛先モジュール14に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。
図1Aの例では、リンク16は、ソースモジュール12が符号化ビデオデータをリアルタイムで宛先モジュール14に直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先モジュール14に送信され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースモジュール12から宛先モジュール14への通信を可能にするために有用であり得る任意の他の機器を含み得る。
【0037】
[0047]代替的に、符号化データは出力インターフェース22からオプションのストレージデバイス31に出力され得る。同様に、符号化データは入力インターフェース28によってストレージデバイス31からアクセスされ得る。ストレージデバイス31は、ハードドライブ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス31は、ソースモジュール12によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先モジュール14は、ストリーミングまたはダウンロードを介してストレージデバイス31から記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先モジュール14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバとしては、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブがある。宛先モジュール14は、インターネット接続を含む任意の標準データ接続を通して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、またはその両方の組合せを含み得る。ストレージデバイス31からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはその両方の組合せであり得る。
【0038】
[0048]本開示の技法はワイヤレス適用例または設定に限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信(たとえば、動的適応ストリーミングオーバーHTTP(DASH:dynamic adaptive streaming over HTTP)など)、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、ビデオコーディングシステム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、一方向または二方向ビデオ送信をサポートするように構成され得る。
【0039】
[0049]
図1Aの例では、ソースモジュール12は、ビデオソース18と、ビデオ符号化器20と、出力インターフェース22とを含む。場合によっては、出力インターフェース22は変調器/復調器(モデム)および/または送信機を含み得る。ソースモジュール12において、ビデオソース18は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースモジュール12および宛先モジュール14は、
図1Bの例に示されているように、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。
【0040】
[0050]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオ符号化器20によって符号化され得る。符号化されたビデオデータは、ソースモジュール12の出力インターフェース22を介して宛先モジュール14に直接送信され得る。符号化されたビデオデータはまた(または代替的に)、復号および/または再生のための宛先モジュール14または他のデバイスによる後のアクセスのためにストレージデバイス31上に記憶され得る。
【0041】
[0051]
図1Aの例では、宛先モジュール14は、入力インターフェース28と、ビデオ復号器30と、ディスプレイデバイス32とを含む。場合によっては、入力インターフェース28は受信機および/またはモデムを含み得る。宛先モジュール14の入力インターフェース28は、リンク16を介して符号化ビデオデータを受信し得る。リンク16を介して通信された、またはストレージデバイス31上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオ復号器30などのビデオ復号器が使用するための、ビデオ符号化器20によって生成された様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信された、記憶媒体上に記憶された、またはファイルサーバ上に記憶された符号化ビデオデータに含まれ得る。
【0042】
[0052]ディスプレイデバイス32は、宛先モジュール14と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先モジュール14は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先モジュール14はディスプレイデバイスであり得る。概して、ディスプレイデバイス32は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
【0043】
[0053]関係する態様では、
図1Bは例示的なビデオ符号化および復号システム10’を示し、ここにおいて、ソースモジュール12および宛先モジュール14はデバイスまたはユーザデバイス11上にあるかまたはそれの一部である。デバイス11は、「スマート」フォンなどの電話ハンドセットであり得る。デバイス11は、ソースモジュール12および宛先モジュール14と動作可能に通信しているオプションのコントローラ/プロセッサモジュール13を含み得る。
図1Bのシステム10’は、ビデオ符号化器20と出力インターフェース22との間のビデオ処理ユニット21をさらに含み得る。いくつかの実装形態では、
図1Bに示されているように、ビデオ処理ユニット21は別個のユニットであるが、他の実装形態では、ビデオ処理ユニット21は、ビデオ符号化器20および/またはプロセッサ/コントローラモジュール13の一部分として実装され得る。システム10’はまた、ビデオシーケンス中の当該のオブジェクトを追跡することができるオプションの追跡器29を含み得る。追跡されるべき興味のオブジェクトは、本開示の1つまたは複数の態様に関して説明する技法によってセグメント化され得る。関係する態様では、トラッキングは、単独でまたは追跡器29とともに、ディスプレイデバイス32によって実行され得る。
図1Bのシステム10’およびそれの構成要素は、場合によっては
図1Aのシステム10およびそれの構成要素と同様である。
【0044】
[0054]ビデオ符号化器20およびビデオ復号器30は、現在開発中の高効率ビデオコーディング(HEVC)規格など、ビデオ圧縮規格に従って動作し得、HEVCテストモデル(HM)に準拠し得る。代替的に、ビデオ符号化器20およびビデオ復号器30は、代替的にMPEG−4,Part10,アドバンストビデオコーディング(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としてはMPEG−2およびITU−T H.263がある。
【0045】
[0055]
図1Aおよび
図1Bの例には示されていないが、ビデオ符号化器20およびビデオ復号器30は、それぞれオーディオ符号化器および復号器と統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、いくつかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
【0046】
[0056]ビデオ符号化器20およびビデオ復号器30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適な符号化器回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、ソフトウェアのための命令を好適な非一時的コンピュータ可読媒体に記憶し、本開示の技法を実行するために1つまたは複数のプロセッサを使用してハードウェアでその命令を実行し得る。ビデオ符号化器20およびビデオ復号器30の各々は1つまたは複数の符号化器または復号器中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合符号化器/復号器(コーデック)の一部として統合され得る。
ビデオコーディングプロセス
【0047】
[0057]上記で手短に述べたように、ビデオ符号化器20はビデオデータを符号化する。ビデオデータは1つまたは複数のピクチャを備え得る。ピクチャの各々は、ビデオの一部を形成する静止画像である。いくつかの事例では、ピクチャはビデオ「フレーム」と呼ばれることがある。ビデオ符号化器20がビデオデータを符号化するとき、ビデオ符号化器20はビットストリームを生成し得る。ビットストリームは、ビデオデータのコード化表現を形成するビットのシーケンスを含み得る。ビットストリームはコード化ピクチャと関連データとを含み得る。コード化ピクチャはピクチャのコード化表現である。
【0048】
[0058]ビットストリームを生成するために、ビデオ符号化器20は、ビデオデータ中の各ピクチャに対して符号化演算を実行し得る。ビデオ符号化器20がピクチャに対して符号化演算を実行するとき、ビデオ符号化器20は、一連のコード化ピクチャと関連データとを生成し得る。関連データは、ビデオパラメータセット(VPS:video parameter set)と、シーケンスパラメータセットと、ピクチャパラメータセットと、適応パラメータセットと、他のシンタックス構造とを含み得る。シーケンスパラメータセット(SPS:sequence parameter set)は、ピクチャの0個以上のシーケンスに適用可能なパラメータを含んでいることがある。ピクチャパラメータセット(PPS:picture parameter set)は、0個以上のピクチャに適用可能なパラメータを含み得る。適応パラメータセット(APS:adaptation parameter set)は、0個以上のピクチャに適用可能なパラメータを含み得る。APS中のパラメータは、PPS中のパラメータよりも変化する可能性が高いパラメータであり得る。
【0049】
[0059]コード化ピクチャを生成するために、ビデオ符号化器20は、ピクチャを等しいサイズのビデオブロックに区分し得る。ビデオブロックはサンプルの2次元アレイであり得る。ビデオブロックの各々はツリーブロックに関連付けられる。いくつかの事例では、ツリーブロックは、最大コーディングユニット(LCU)と呼ばれることがある。HEVCのツリーブロックは、H.264/AVCなど、以前の規格のマクロブロックに広い意味で類似し得る。しかしながら、ツリーブロックは、必ずしも特定のサイズに限定されるとは限らず、1つまたは複数のコーディングユニット(CU)を含み得る。ビデオ符号化器20は、4分木区分(quadtree partitioning)を使用して、ツリーブロックのビデオブロックを、CUに関連付けられたビデオブロックに区分し得、したがって「ツリーブロック」という名前がある。
【0050】
[0060]いくつかの例では、ビデオ符号化器20はピクチャを複数のスライスに区分し得る。スライスの各々は整数個のCUを含み得る。いくつかの事例では、スライスは整数個のツリーブロックを備える。他の事例では、スライスの境界はツリーブロック内にあり得る。
【0051】
[0061]ピクチャに対して符号化演算を実行することの一部として、ビデオ符号化器20は、ピクチャの各スライスに対して符号化演算を実行し得る。ビデオ符号化器20がスライスに対して符号化演算を実行するとき、ビデオ符号化器20は、スライスに関連付けられた符号化データを生成し得る。スライスに関連付けられた符号化データは「コード化スライス」と呼ばれることがある。
【0052】
[0062]コード化スライスを生成するために、ビデオ符号化器20は、スライス中の各ツリーブロックに対して符号化演算を実行し得る。ビデオ符号化器20がツリーブロックに対して符号化演算を実行するとき、ビデオ符号化器20はコード化ツリーブロックを生成し得る。コード化ツリーブロックは、ツリーブロックの符号化バージョンを表すデータを備え得る。
【0053】
[0063]ビデオ符号化器20がコード化スライスを生成するとき、ビデオ符号化器20は、ラスタスキャン順序(raster scan order)に従って、スライス中のツリーブロックに対して符号化演算を実行し得る(たとえば、そのツリーブロックを符号化し得る)。たとえば、ビデオ符号化器20は、スライス中のツリーブロックの一番上の行にわたって左から右に進み、次いでツリーブロックの次の下の行にわたって左から右に進み、以下同様に進む順序で、ビデオ符号化器20がスライス中のツリーブロックの各々を符号化するまで、スライスのツリーブロックを符号化し得る。
【0054】
[0064]ラスタスキャン順序に従ってツリーブロックを符号化した結果として、所与のツリーブロックの上および左のツリーブロックは符号化されていることがあるが、所与のツリーブロックの下および右のツリーブロックはまだ符号化されていない。したがって、ビデオ符号化器20は、所与のツリーブロックを符号化するとき、所与のツリーブロックの上および左のツリーブロックを符号化することによって生成された情報にアクセスすることが可能であり得る。しかしながら、ビデオ符号化器20は、所与のツリーブロックを符号化するとき、所与のツリーブロックの下および右のツリーブロックを符号化することによって生成された情報にアクセスすることができないことがある。
【0055】
[0065]コード化ツリーブロックを生成するために、ビデオ符号化器20は、ツリーブロックのビデオブロックに対して4分木区分を再帰的に実行して、ビデオブロックを徐々により小さいビデオブロックに分割し得る。より小さいビデオブロックの各々は異なるCUに関連付けられ得る。たとえば、ビデオ符号化器20は、ツリーブロックのビデオブロックを4つの等しいサイズのサブブロックに区分し、サブブロックのうちの1つまたは複数を、4つの等しいサイズのサブサブブロックに区分し得、以下同様である。区分されたCUは、それのビデオブロックが、他のCUに関連付けられたビデオブロックに区分された、CUであり得る。区分されていないCUは、それのビデオブロックが、他のCUに関連付けられたビデオブロックに区分されていない、CUであり得る。
【0056】
[0066]ビットストリーム中の1つまたは複数のシンタックス要素は、ビデオ符号化器20がツリーブロックのビデオブロックを区分し得る最大の回数を示し得る。CUのビデオブロックは形状が正方形であり得る。CUのビデオブロックのサイズ(たとえば、CUのサイズ)は、8×8ピクセルから、最大64×64以上のピクセルをもつツリーブロックのビデオブロックのサイズ(たとえば、ツリーブロックのサイズ)までに及び得る。
【0057】
[0067]ビデオ符号化器20は、zスキャン順序に従って、ツリーブロックの各CUに対して符号化演算を実行し得る(たとえば、各CUを符号化し得る)。言い換えれば、ビデオ符号化器20は、左上のCUと、右上のCUと、左下のCUと、次いで右下のCUとを、その順序で符号化し得る。ビデオ符号化器20が、区分されたCUに対して符号化演算を実行するとき、ビデオ符号化器20は、zスキャン順序に従って、区分されたCUのビデオブロックのサブブロックに関連付けられたCUを符号化し得る。言い換えれば、ビデオ符号化器20は、左上のサブブロックに関連付けられたCUと、右上のサブブロックに関連付けられたCUと、左下のサブブロックに関連付けられたCUと、次いで右下のサブブロックに関連付けられたCUとを、その順序で符号化し得る。
【0058】
[0068]zスキャン順序に従ってツリーブロックのCUを符号化した結果として、所与のCUの上、左上、右上、左、および左下のCUは符号化されていることがある。所与のCUの下および右のCUはまだ符号化されていない。したがって、ビデオ符号化器20は、所与のCUを符号化するとき、所与のCUに近隣するいくつかのCUを符号化することによって生成された情報にアクセスすることが可能であり得る。しかしながら、ビデオ符号化器20は、所与のCUを符号化するとき、所与のCUに近隣する他のCUを符号化することによって生成された情報にアクセスすることができないことがある。
【0059】
[0069]ビデオ符号化器20が、区分されていないCUを符号化するとき、ビデオ符号化器20は、CUのために1つまたは複数の予測ユニット(PU)を生成し得る。CUのPUの各々は、CUのビデオブロック内の異なるビデオブロックに関連付けられ得る。ビデオ符号化器20は、CUの各PUのための予測ビデオブロックを生成し得る。PUの予測ビデオブロックはサンプルのブロックであり得る。ビデオ符号化器20は、イントラ予測またはインター予測を使用して、PUのための予測ビデオブロックを生成し得る。
【0060】
[0070]ビデオ符号化器20がイントラ予測を使用してPUの予測ビデオブロックを生成するとき、ビデオ符号化器20は、PUに関連付けられたピクチャの復号サンプルに基づいて、PUの予測ビデオブロックを生成し得る。ビデオ符号化器20がイントラ予測を使用してCUのPUの予測ビデオブロックを生成する場合、CUはイントラ予測されたCUである。ビデオ符号化器20がインター予測を使用してPUの予測ビデオブロックを生成するとき、ビデオ符号化器20は、PUに関連付けられたピクチャ以外の1つまたは複数のピクチャの復号サンプルに基づいて、PUの予測ビデオブロックを生成し得る。ビデオ符号化器20がインター予測を使用してCUのPUの予測ビデオブロックを生成する場合、CUはインター予測されたCUである。
【0061】
[0071]さらに、ビデオ符号化器20がインター予測を使用してPUのための予測ビデオブロックを生成するとき、ビデオ符号化器20はPUの動き情報を生成し得る。PUの動き情報は、PUの1つまたは複数の参照ブロックを示し得る。PUの各参照ブロックは参照ピクチャ内のビデオブロックであり得る。参照ピクチャはPUに関連付けられたピクチャ以外のピクチャであり得る。いくつかの事例では、PUの参照ブロックはPUの「参照サンプル」と呼ばれることもある。ビデオ符号化器20は、PUの参照ブロックに基づいて、PUのための予測ビデオブロックを生成し得る。
【0062】
[0072]ビデオ符号化器20がCUの1つまたは複数のPUのための予測ビデオブロックを生成した後、ビデオ符号化器20は、CUのPUのための予測ビデオブロックに基づいて、CUの残差データを生成し得る。CUの残差データは、CUのPUのための予測ビデオブロック中のサンプルと、CUの元のビデオブロック中のサンプルとの間の差を示し得る。
【0063】
[0073]さらに、区分されていないCUに対して符号化演算を実行することの一部として、ビデオ符号化器20は、CUの残差データに対して再帰的な4分木区分を実行して、CUの残差データを、CUの変換ユニット(TU)に関連付けられた残差データの1つまたは複数のブロック(たとえば、残差ビデオブロック)に区分し得る。CUの各TUは異なる残差ビデオブロックに関連付けられ得る。
【0064】
[0074]ビデオ符号化器20は、TUに関連付けられた変換係数ブロック(たとえば、変換係数のブロック)を生成するために、TUに関連付けられた残差ビデオブロックに1つまたは複数の変換を適用し得る。概念的に、変換係数ブロックは変換係数の2次元(2D)行列であり得る。
【0065】
[0075]変換係数ブロックを生成した後、ビデオ符号化器20は、変換係数ブロックに対して量子化プロセスを実行し得る。量子化は、概して、変換係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を実現する処理を指す。量子化プロセスは、変換係数の一部または全部に関連付けられたビット深度を低減し得る。たとえば、量子化中にnビットの変換係数がmビットの変換係数に切り捨てられることがあり、ここで、nはmよりも大きい。
【0066】
[0076]ビデオ符号化器20は、各CUを量子化パラメータ(QP:quantization parameter)値に関連付け得る。CUに関連付けられたQP値は、ビデオ符号化器20が、CUに関連付けられた変換係数ブロックをどのように量子化するかを決定し得る。ビデオ符号化器20は、CUに関連付けられたQP値を調整することによって、CUに関連付けられた変換係数ブロックに適用される量子化の程度を調整し得る。
【0067】
[0077]ビデオ符号化器20が変換係数ブロックを量子化した後、ビデオ符号化器20は、量子化された変換係数ブロック中で変換係数を表すシンタックス要素のセットを生成し得る。ビデオ符号化器20は、これらのシンタックス要素のうちのいくつかに、コンテキスト適応型バイナリ算術コーディング(CABAC:Context Adaptive Binary Arithmetic Coding)演算などのエントロピー符号化演算を適用し得る。コンテンツ適応型可変長コーディング(CAVLC:content adaptive variable length coding)、確率間隔区分エントロピー(PIPE:probability interval partitioning entropy)コーディング、または他のバイナリ算術コーディングなど、他のエントロピーコーディング技法も使用され得る。
【0068】
[0078]ビデオ符号化器20によって生成されるビットストリームは、一連のネットワークアブストラクションレイヤ(NAL:Network Abstraction Layer)ユニットを含み得る。NALユニットの各々は、NALユニット中のデータのタイプの指示と、データを含んでいるバイトとを含んでいるシンタックス構造であり得る。たとえば、NALユニットは、ビデオパラメータセット、シーケンスパラメータセット、ピクチャパラメータセット、コード化スライス、補足エンハンスメント情報(SEI:supplemental enhancement information)、アクセスユニット区切り文字、フィラーデータ、または別のタイプのデータを表すデータを含み得る。NALユニット中のデータは様々なシンタックス構造を含み得る。
【0069】
[0079]ビデオ復号器30は、ビデオ符号化器20によって生成されたビットストリームを受信し得る。ビットストリームは、ビデオ符号化器20によって符号化されたビデオデータのコード化表現を含み得る。ビデオ復号器30がビットストリームを受信するとき、ビデオ復号器30は、ビットストリームに対してパース演算を実行し得る。ビデオ復号器30がパース演算を実行するとき、ビデオ復号器30は、ビットストリームからシンタックス要素を抽出し得る。ビデオ復号器30は、ビットストリームから抽出されたシンタックス要素に基づいて、ビデオデータのピクチャを再構成し得る。シンタックス要素に基づいてビデオデータを再構成するためのプロセスは、一般に、シンタックス要素を生成するためにビデオ符号化器20によって実行されるプロセスとは逆であり得る。
【0070】
[0080]ビデオ復号器30がCUに関連付けられたシンタックス要素を抽出した後、ビデオ復号器30は、シンタックス要素に基づいて、CUのPUのための予測ビデオブロックを生成し得る。さらに、ビデオ復号器30は、CUのTUに関連付けられた変換係数ブロックを逆量子化し得る。ビデオ復号器30は、変換係数ブロックに対して逆変換を実行して、CUのTUに関連付けられた残差ビデオブロックを再構成し得る。予測ビデオブロックを生成し、残差ビデオブロックを再構成した後、ビデオ復号器30は、予測ビデオブロックと残差ビデオブロックとに基づいて、CUのビデオブロックを再構成し得る。このようにして、ビデオ復号器30は、ビットストリーム中のシンタックス要素に基づいて、CUのビデオブロックを再構成し得る。
ビデオ符号化器
【0071】
[0081]
図2Aは、本開示で説明する態様による技法を実装し得るビデオ符号化器の一例を示すブロック図である。ビデオ符号化器20は、HEVCの場合など、ビデオフレームの単一のレイヤを処理するように構成され得る。さらに、ビデオ符号化器20は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、予測処理ユニット100は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。別の実施形態では、ビデオ符号化器20は、本開示で説明する技法のいずれかまたはすべてを実行するように構成されたオプションのレイヤ間予測ユニット128を含む。他の実施形態では、レイヤ間予測は予測処理ユニット100(たとえば、インター予測ユニット121および/またはイントラ予測ユニット126)によって実行され得、その場合、レイヤ間予測ユニット128は省略され得る。ただし、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオ符号化器20の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ(図示せず)が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。
【0072】
[0082]説明の目的で、本開示では、HEVCコーディングのコンテキストにおいてビデオ符号化器20について説明する。しかしながら、本開示の技法は、他のコーディング規格または方法にも適用可能であり得る。
図2Aに示された例はシングルレイヤコーデックのためのものである。しかしながら、
図2Bに関してさらに説明するように、ビデオ符号化器20の一部または全部はマルチレイヤコーデックの処理のために複製され得る。
【0073】
[0083]ビデオ符号化器20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間冗長性を低減または除去するために空間予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間冗長性を低減または除去するために時間予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。
【0074】
[0084]
図2Aの例では、ビデオ符号化器20は複数の機能構成要素を含む。ビデオ符号化器20の機能構成要素は、予測処理ユニット100と、残差生成ユニット102と、変換処理ユニット104と、量子化ユニット106と、逆量子化ユニット108と、逆変換ユニット110と、再構成ユニット112と、フィルタユニット113と、復号ピクチャバッファ114と、エントロピー符号化ユニット116とを含む。予測処理ユニット100は、インター予測ユニット121と、動き推定ユニット122と、動き補償ユニット124と、イントラ予測ユニット126と、レイヤ間予測ユニット128とを含む。他の例では、ビデオ符号化器20は、より多数の、より少数の、または異なる機能構成要素を含み得る。さらに、動き推定ユニット122と動き補償ユニット124とは、高度に統合され得るが、
図2Aの例では、説明の目的で別々に表されている。
【0075】
[0085]ビデオ符号化器20はビデオデータを受信し得る。ビデオ符号化器20は、様々なソースからビデオデータを受信し得る。たとえば、ビデオ符号化器20は、(たとえば、
図1Aまたは
図1Bに示された)ビデオソース18、または別のソースからビデオデータを受信し得る。ビデオデータは一連のピクチャを表し得る。ビデオデータを符号化するために、ビデオ符号化器20は、ピクチャの各々に対して符号化演算を実行し得る。ピクチャに対して符号化演算を実行することの一部として、ビデオ符号化器20は、ピクチャの各スライスに対して符号化演算を実行し得る。スライスに対して符号化演算を実行することの一部として、ビデオ符号化器20は、スライス中のツリーブロックに対して符号化演算を実行し得る。
【0076】
[0086]ツリーブロックに対して符号化演算を実行することの一部として、予測処理ユニット100は、ツリーブロックのビデオブロックに対して4分木区分を実行して、ビデオブロックを徐々により小さいビデオブロックに分割し得る。より小さいビデオブロックの各々は、異なるCUに関連付けられ得る。たとえば、予測処理ユニット100は、ツリーブロックのビデオブロックを4つの等しいサイズのサブブロックに区分し、サブブロックの1つまたは複数を、4つの等しいサイズのサブサブブロックに区分し得、以下同様である。
【0077】
[0087]CUに関連付けられたビデオブロックのサイズは、8×8サンプルから、最大64×64以上のサンプルをもつツリーブロックのサイズまでに及び得る。本開示では、「N×N(NxN)」および「N×N(N by N)」は、垂直寸法および水平寸法に関するビデオブロックのサンプル寸法、たとえば、16×16(16x16)サンプルまたは16×16(16 by 16)サンプルを指すために互換的に使用され得る。概して、16×16ビデオブロックは、垂直方向に16個のサンプルを有し(y=16)、水平方向に16個のサンプルを有する(x=16)。同様に、N×Nブロックは、概して、垂直方向にN個のサンプルを有し、水平方向にN個のサンプルを有し、ここで、Nは非負整数値を表す。
【0078】
[0088]さらに、ツリーブロックに対して符号化演算を実行することの一部として、予測処理ユニット100は、ツリーブロック用の階層的な4分木データ構造を生成し得る。たとえば、ツリーブロックは、4分木データ構造のルートノードに対応し得る。予測処理ユニット100が、ツリーブロックのビデオブロックを4つのサブブロックに区分する場合、ルートノードは、4分木データ構造中に4つの子ノードを有する。子ノードの各々は、サブブロックのうちの1つに関連付けられたCUに対応する。予測処理ユニット100が、サブブロックのうちの1つを4つのサブサブブロックに区分する場合、サブブロックに関連付けられたCUに対応するノードは、サブサブブロックのうちの1つに関連付けられたCUに各々が対応する、4つの子ノードを有し得る。
【0079】
[0089]4分木データ構造の各ノードは、対応するツリーブロックまたはCUのシンタックスデータ(たとえば、シンタックス要素)を含み得る。たとえば、4分木の中のノードは、そのノードに対応するCUのビデオブロックが4つのサブブロックに区分される(たとえば、スプリットされる)かどうかを示すスプリットフラグを含み得る。CUのためのシンタックス要素は、再帰的に定義され得、CUのビデオブロックがサブブロックにスプリットされるかどうかに依存し得る。それのビデオブロックが区分されていないCUは、4分木データ構造におけるリーフノードに対応し得る。コード化ツリーブロックは、対応するツリーブロック用の4分木データ構造に基づくデータを含み得る。
【0080】
[0090]ビデオ符号化器20は、ツリーブロックの区分されていない各CUに対して符号化演算を実行し得る。ビデオ符号化器20が、区分されていないCUに対して符号化演算を実行するとき、ビデオ符号化器20は、区分されていないCUの符号化表現を表すデータを生成する。
【0081】
[0091]CUに対して符号化演算を実行することの一部として、予測処理ユニット100は、CUの1つまたは複数のPUの中で、CUのビデオブロックを区分し得る。ビデオ符号化器20およびビデオ復号器30は、様々なPUサイズをサポートし得る。特定のCUのサイズが2N×2Nであると仮定すると、ビデオ符号化器20およびビデオ復号器30は、2N×2NまたはN×NのPUサイズと、2N×2N、2N×N、N×2N、N×N、2N×nU、nL×2N、nR×2N、または同様の対称PUサイズでのインター予測とをサポートし得る。ビデオ符号化器20およびビデオ復号器30は、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズに対する非対称区分をもサポートし得る。いくつかの例では、予測処理ユニット100は、CUのビデオブロックの辺に直角に接触しない境界に沿って、CUのPUの間でCUのビデオブロックを区分するように、幾何学的な区分を実行し得る。
【0082】
[0092]インター予測ユニット121はCUの各PUに対してインター予測を実行し得る。インター予測は時間圧縮を実現し得る。PUに対してインター予測を実行するために、動き推定ユニット122はPUの動き情報を生成し得る。動き補償ユニット124は、動き情報と、CUに関連付けられたピクチャ以外のピクチャ(たとえば、参照ピクチャ)の復号サンプルとに基づくPUのための予測ビデオブロックを生成し得る。本開示では、動き補償ユニット124によって生成された予測ビデオブロックは、インター予測ビデオブロックと呼ばれることがある。
【0083】
[0093]スライスは、Iスライス、Pスライス、またはBスライスであり得る。動き推定ユニット122および動き補償ユニット124は、PUがIスライス中にあるか、Pスライス中にあるか、Bスライス中にあるかに応じて、CUのPUに対して異なる演算を実行し得る。Iスライス中では、すべてのPUがイントラ予測される。したがって、PUがIスライス中にある場合、動き推定ユニット122および動き補償ユニット124は、PUに対してインター予測を実行しない。
【0084】
[0094]PUがPスライス中にある場合、PUを含んでいるピクチャは、「リスト0」と呼ばれる参照ピクチャのリストに関連付けられる。リスト0中の参照ピクチャの各々は、他のピクチャのインター予測に使用され得るサンプルを含んでいる。動き推定ユニット122が、Pスライス中のPUに関して動き推定演算を実行するとき、動き推定ユニット122は、PUのための参照ブロックについて、リスト0中の参照ピクチャを探索し得る。PUの参照ブロックは、PUのビデオブロック中のサンプルに最も密接に対応するサンプルのセット、たとえば、サンプルのブロックであり得る。動き推定ユニット122は、様々なメトリクスを使用して、参照ピクチャ中のサンプルのセットがどの程度密接にPUのビデオブロック中のサンプルに対応するかを決定し得る。たとえば、動き推定ユニット122は、絶対差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって、参照ピクチャ中のサンプルのセットがどの程度密接にPUのビデオブロック中のサンプルに対応するかを決定し得る。
【0085】
[0095]Pスライス中のPUの参照ブロックを識別した後、動き推定ユニット122は、参照ブロックを含んでいる、リスト0中の参照ピクチャを示す参照インデックスと、PUと参照ブロックとの間の空間変位を示す動きベクトルとを生成し得る。様々な例において、動き推定ユニット122は動きベクトルを異なる精度に生成し得る。たとえば、動き推定ユニット122は、1/4サンプル精度、1/8サンプル精度、または他の分数のサンプル精度で動きベクトルを生成し得る。分数のサンプル精度の場合、参照ブロック値は、参照ピクチャ中の整数位置のサンプル値から補間され得る。動き推定ユニット122は、PUの動き情報として、参照インデックスと動きベクトルとを出力し得る。動き補償ユニット124は、PUの動き情報によって識別された参照ブロックに基づいて、PUの予測ビデオブロックを生成し得る。
【0086】
[0096]PUがBスライス中にある場合、PUを含んでいるピクチャは、「リスト0」および「リスト1」と呼ばれる参照ピクチャの2つのリストに関連付けられ得る。いくつかの例では、Bスライスを含んでいるピクチャは、リスト0とリスト1の組合せである、リストの組合せに関連付けられ得る。
【0087】
[0097]さらに、PUがBスライス中にある場合、動き推定ユニット122は、PUについての単方向予測または双方向予測を実行し得る。動き推定ユニット122が、PUについての単方向予測を実行するとき、動き推定ユニット122は、PUのための参照ブロックについて、リスト0またはリスト1の参照ピクチャを探索し得る。動き推定ユニット122は、次いで、参照ブロックを含んでいる、リスト0またはリスト1中の参照ピクチャを示す参照インデックスと、PUと参照ブロックとの間の空間変位を示す動きベクトルとを生成し得る。動き推定ユニット122は、PUの動き情報として、参照インデックスと、予測方向インジケータと、動きベクトルとを出力し得る。予測方向インジケータは、参照インデックスが、リスト0中の参照ピクチャを示すか、リスト1中の参照ピクチャを示すかを示し得る。動き補償ユニット124は、PUの動き情報によって示された参照ブロックに基づいて、PUの予測ビデオブロックを生成し得る。
【0088】
[0098]動き推定ユニット122が、PUについての双方向予測を実行するとき、動き推定ユニット122は、PUのための参照ブロックについて、リスト0中の参照ピクチャを探索し得、また、PUのための別の参照ブロックについて、リスト1中の参照ピクチャを探索し得る。動き推定ユニット122は、次いで、参照ブロックを含んでいる、リスト0およびリスト1中の参照ピクチャを示す参照インデックスと、参照ブロックとPUの間の空間変位を示す動きベクトルとを生成し得る。動き推定ユニット122は、PUの動き情報としてPUの参照インデックスと動きベクトルとを出力し得る。動き補償ユニット124は、PUの動き情報によって示された参照ブロックに基づいて、PUの予測ビデオブロックを生成し得る。
【0089】
[0099]いくつかの例では、動き推定ユニット122は、PUの動き情報のフルセットをエントロピー符号化ユニット116に出力しない。そうではなく、動き推定ユニット122は、別のPUの動き情報を参照して、PUの動き情報をシグナリングし得る。たとえば、動き推定ユニット122は、PUの動き情報が、近隣PUの動き情報と十分に類似していると決定し得る。この例では、動き推定ユニット122は、PUに関連付けられたシンタックス構造において、PUが近隣PUと同じ動き情報を有することをビデオ復号器30に示す値を示し得る。別の例では、動き推定ユニット122は、PUに関連付けられたシンタックス構造において、近隣PUと動きベクトル差分(MVD:motion vector difference)とを識別し得る。動きベクトル差分は、PUの動きベクトルと、示される近隣PUの動きベクトルとの間の差分を示す。ビデオ復号器30は、示される近隣PUの動きベクトルと、動きベクトル差分とを使用して、PUの動きベクトルを決定し得る。第2のPUの動き情報をシグナリングするときに第1のPUの動き情報を参照することによって、ビデオ符号化器20は、より少数のビットを使用して、第2のPUの動き情報をシグナリングすることが可能であり得る。
【0090】
[00100]
図5〜
図8に関して以下でさらに説明するように、予測処理ユニット100は、
図5〜
図8に示されている方法を実行することによってPU(または他の参照レイヤブロックおよび/またはエンハンスメントレイヤブロックまたはビデオユニット)をコーディング(たとえば、符号化または復号)するように構成され得る。たとえば、(たとえば、動き推定ユニット122および/または動き補償ユニット124を介した)インター予測ユニット121、イントラ予測ユニット126、またはレイヤ間予測ユニット128は、一緒にまたは別々に、
図5〜
図8に示されている方法を実行するように構成され得る。
【0091】
[00101]CUに対して符号化演算を実行することの一部として、イントラ予測ユニット126は、CUのPUに対してイントラ予測を実行し得る。イントラ予測は空間圧縮を実現し得る。イントラ予測ユニット126がPUに対してイントラ予測を実行するとき、イントラ予測ユニット126は、同じピクチャ中の他のPUの復号サンプルに基づいて、PUの予測データを生成し得る。PUの予測データは、予測ビデオブロックと様々なシンタックス要素とを含み得る。イントラ予測ユニット126は、Iスライス、Pスライス、およびBスライス中のPUに対してイントラ予測を実行し得る。
【0092】
[00102]PUに対してイントラ予測を実行するために、イントラ予測ユニット126は、複数のイントラ予測モードを使用して、PUの予測データの複数のセットを生成し得る。イントラ予測ユニット126が、イントラ予測モードを使用してPUの予測データのセットを生成するとき、イントラ予測ユニット126は、イントラ予測モードに関連付けられた方向および/または勾配で、近隣PUのビデオブロックからPUのビデオブロックにわたって、サンプルを延ばし得る。近隣PUは、PU、CU、およびツリーブロックについて左から右、上から下の符号化順序を仮定すると、PUの上、右上、左上、または左にあり得る。イントラ予測ユニット126は、PUのサイズに応じて、様々な数のイントラ予測モード、たとえば、33個の方向性イントラ予測モードを使用し得る。
【0093】
[00103]予測処理ユニット100は、PUについての、動き補償ユニット124によって生成された予測データ、またはPUについての、イントラ予測ユニット126によって生成された予測データの中から、PUの予測データを選択し得る。いくつかの例では、予測処理ユニット100は、予測データのセットのレート/ひずみメトリックに基づいて、PUのための予測データを選択する。
【0094】
[00104]予測処理ユニット100が、イントラ予測ユニット126によって生成された予測データを選択する場合、予測処理ユニット100は、PUの予測データを生成するために使用されたイントラ予測モード、たとえば、選択されたイントラ予測モードをシグナリングし得る。予測処理ユニット100は、選択されたイントラ予測モードを様々な方法でシグナリングし得る。たとえば、選択されたイントラ予測モードは、近隣PUのイントラ予測モードと同じであることがあり得る。言い換えれば、近隣PUのイントラ予測モードは現在PUに対して最確モードであり得る。したがって、予測処理ユニット100は、選択されたイントラ予測モードが近隣PUのイントラ予測モードと同じであることを示すための、シンタックス要素を生成し得る。
【0095】
[00105]上記で説明したように、ビデオ符号化器20はレイヤ間予測ユニット128を含み得る。レイヤ間予測ユニット128は、SVCにおいて利用可能である1つまたは複数の異なるレイヤ(たとえば、ベースレイヤまたは参照レイヤ)を使用して現在ブロック(たとえば、EL中の現在ブロック)を予測するように構成される。そのような予測はレイヤ間予測と呼ばれることがある。レイヤ間予測ユニット128は、レイヤ間冗長性を低減するために予測方法を利用し、それによって、コーディング効率を改善し、計算リソース要件を低減する。レイヤ間予測のいくつかの例としては、レイヤ間イントラ予測、レイヤ間動き予測、およびレイヤ間残差予測がある。レイヤ間イントラ予測は、ベースレイヤ中のコロケートされたブロックの再構成を使用してエンハンスメントレイヤ中の現在ブロックを予測する。レイヤ間動き予測は、ベースレイヤの動き情報を使用してエンハンスメントレイヤ中の動作を予測する。レイヤ間残差予測は、ベースレイヤの残差を使用してエンハンスメントレイヤの残差を予測する。レイヤ間予測方式の各々について、より詳細に以下で説明する。
【0096】
[00106]予測処理ユニット100がCUのPUの予測データを選択した後、残差生成ユニット102は、CUのビデオブロックからCUのPUの予測ビデオブロックを差し引くこと(たとえば、マイナス符号によって示される)によって、CUの残差データを生成し得る。CUの残差データは、CUのビデオブロック中のサンプルの異なるサンプル成分に対応する、2D残差ビデオブロックを含み得る。たとえば、残差データは、CUのPUの予測ビデオブロック中のサンプルのルミナンス成分と、CUの元のビデオブロック中のサンプルのルミナンス成分との間の差分に対応する、残差ビデオブロックを含み得る。さらに、CUの残差データは、CUのPUの予測ビデオブロック中のサンプルのクロミナンス成分と、CUの元のビデオブロック中のサンプルのクロミナンス成分との間の差分に対応する、残差ビデオブロックを含み得る。
【0097】
[00107]予測処理ユニット100は、4分木区分を実行して、CUの残差ビデオブロックをサブブロックに区分し得る。各分割されていない残差ビデオブロックは、CUの異なるTUに関連付けられ得る。CUのTUに関連付けられた残差ビデオブロックのサイズおよび位置は、CUのPUに関連付けられたビデオブロックのサイズおよび位置に基づくことも基づかないこともある。「残差4分木」(RQT:residual quad tree)として知られる4分木構造は、残差ビデオブロックの各々に関連付けられたノードを含み得る。CUのTUはRQTのリーフノードに対応し得る。
【0098】
[00108]変換処理ユニット104は、TUに関連付けられた残差ビデオブロックに1つまたは複数の変換を適用することによって、CUの各TUのための1つまたは複数の変換係数ブロックを生成し得る。変換係数ブロックの各々は、変換係数の2D行列であり得る。変換処理ユニット104は、TUに関連付けられた残差ビデオブロックに様々な変換を適用し得る。たとえば、変換処理ユニット104は、離散コサイン変換(DCT)、方向性変換、または概念的に同様の変換を、TUに関連付けられた残差ビデオブロックに適用し得る。
【0099】
[00109]変換処理ユニット104が、TUに関連付けられた変換係数ブロックを生成した後、量子化ユニット106は、変換係数ブロック中の変換係数を量子化し得る。量子化ユニット106は、CUに関連付けられたQP値に基づいて、CUのTUに関連付けられた変換係数ブロックを量子化し得る。
【0100】
[00110]ビデオ符号化器20は、様々な方法でQP値をCUに関連付け得る。たとえば、ビデオ符号化器20は、CUに関連付けられたツリーブロックに対してレートひずみ分析を実行し得る。レートひずみ分析では、ビデオ符号化器20は、ツリーブロックに対して符号化演算を複数回実行することによって、ツリーブロックの複数のコード化表現を生成し得る。ビデオ符号化器20がツリーブロックの異なる符号化表現を生成するとき、ビデオ符号化器20は、異なるQP値をCUに関連付け得る。ビデオ符号化器20は、最小のビットレートおよびひずみメトリックを有するツリーブロックのコード化表現で所与のQP値がCUに関連付けられるとき、所与のQP値がCUに関連付けられることをシグナリングし得る。
【0101】
[00111]逆量子化ユニット108および逆変換ユニット110は、それぞれ、変換係数ブロックに逆量子化と逆変換とを適用して、変換係数ブロックから残差ビデオブロックを再構成し得る。再構成ユニット112は、再構成された残差ビデオブロックを、予測処理ユニット100によって生成された1つまたは複数の予測ビデオブロックからの対応するサンプルに追加して、TUに関連付けられた再構成されたビデオブロックを生成し得る。このようにCUの各TUのためのビデオブロックを再構成することによって、ビデオ符号化器20は、CUのビデオブロックを再構成し得る。
【0102】
[00112]再構成ユニット112がCUのビデオブロックを再構成した後、フィルタユニット113は、CUに関連付けられたビデオブロックにおけるブロッキングアーティファクトを低減するためにデブロッキング演算を実行し得る。1つまたは複数のデブロッキング演算を実行した後、フィルタユニット113は、復号ピクチャバッファ114にCUの再構成されたビデオブロックを記憶し得る。動き推定ユニット122および動き補償ユニット124は、再構成されたビデオブロックを含んでいる参照ピクチャを使用して、後続ピクチャのPUに対してインター予測を実行し得る。さらに、イントラ予測ユニット126は、復号ピクチャバッファ114中の再構成されたビデオブロックを使用して、CUと同じピクチャの中の他のPUに対してイントラ予測を実行し得る。
【0103】
[00113]エントロピー符号化ユニット116は、ビデオ符号化器20の他の機能構成要素からデータを受信し得る。たとえば、エントロピー符号化ユニット116は、量子化ユニット106から変換係数ブロックを受信し得、予測処理ユニット100からシンタックス要素を受信し得る。エントロピー符号化ユニット116がデータを受信するとき、エントロピー符号化ユニット116は、1つまたは複数のエントロピー符号化演算を実行して、エントロピー符号化されたデータを生成し得る。たとえば、ビデオ符号化器20は、コンテキスト適応型可変長コーディング(CAVLC)演算、CABAC演算、変数ツー変数(V2V:variable-to-variable)レングスコーディング演算、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)演算、確率間隔区分エントロピー(PIPE)コーディング演算、または別のタイプのエントロピー符号化演算をデータに対して実行し得る。エントロピー符号化ユニット116は、エントロピー符号化されたデータを含むビットストリームを出力し得る。
【0104】
[00114]データに対してエントロピー符号化演算を実行することの一部として、エントロピー符号化ユニット116は、コンテキストモデルを選択し得る。エントロピー符号化ユニット116がCABAC演算を実行している場合、コンテキストモデルは、特定の値を有する特定のビンの確率の推定値を示し得る。CABACのコンテキストでは、「ビン」という用語は、シンタックス要素の2値化されたバージョンのビットを指すために使用される。
マルチレイヤビデオ符号化器
【0105】
[00115]
図2Bは、本開示で説明する態様による技法を実装し得るマルチレイヤビデオ符号化器23の一例を示すブロック図である。ビデオ符号化器23は、SHVCおよびマルチビューコーディングの場合など、マルチレイヤビデオフレームを処理するように構成され得る。さらに、ビデオ符号化器23は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。
【0106】
[00116]ビデオ符号化器23はビデオ符号化器20Aとビデオ符号化器20Bとを含み、それらの各々はビデオ符号化器20として構成され得、ビデオ符号化器20に関して上記で説明した機能を実行し得る。さらに、参照番号の再利用によって示されるように、ビデオ符号化器20Aおよび20Bは、ビデオ符号化器20としてシステムとサブシステムとのうちの少なくともいくつかを含み得る。ビデオ符号化器23は、2つのビデオ符号化器20Aおよび20Bを含むものとして示されているが、ビデオ符号化器23は、そのようなものとして限定されず、任意の数のビデオ符号化器20レイヤを含み得る。いくつかの実施形態では、ビデオ符号化器23はアクセスユニット中の各ピクチャまたはフレームについてビデオ符号化器20を含み得る。たとえば、5つのピクチャを含むアクセスユニットは、5つの符号化器レイヤを含むビデオ符号化器によって処理または符号化され得る。いくつかの実施形態では、ビデオ符号化器23は、アクセスユニット中のフレームよりも多くの符号化器レイヤを含み得る。いくつかのそのような場合では、ビデオ符号化器レイヤのいくつかは、いくつかのアクセスユニットを処理するときに非アクティブであり得る。
【0107】
[00117]ビデオ符号化器20Aおよび20Bに加えて、ビデオ符号化器23は再サンプリングユニット90を含み得る。再サンプリングユニット90は、場合によっては、たとえば、エンハンスメントレイヤを作成するために、受信されたビデオフレームのベースレイヤをアップサンプリングし得る。再サンプリングユニット90は、フレームの受信されたベースレイヤに関連付けられた特定の情報をアップサンプリングするが、他の情報をアップサンプリングしないことがある。たとえば、再サンプリングユニット90は、ベースレイヤの空間サイズまたはピクセルの数をアップサンプリングし得るが、スライスの数またはピクチャ順序カウントは一定のままであり得る。場合によっては、再サンプリングユニット90は、受信されたビデオを処理しないことがあるか、および/またはオプションであり得る。たとえば、場合によっては、予測処理ユニット100がアップサンプリングを実行し得る。いくつかの実施形態では、再サンプリングユニット90は、レイヤをアップサンプリングすることと、スライス境界ルールおよび/またはラスタスキャンルールのセットに準拠するために1つまたは複数のスライスを再編成、再定義、修正、または調整することとを行うように構成される。アクセスユニット中のベースレイヤまたは下位レイヤをアップサンプリングするものとして主に説明したが、場合によっては、再サンプリングユニット90はレイヤをダウンサンプリングし得る。たとえば、ビデオのストリーミング中に帯域幅が減少した場合、フレームは、アップサンプリングされるのではなく、ダウンサンプリングされ得る。
【0108】
[00118]再サンプリングユニット90は、下位レイヤ符号化器(たとえば、ビデオ符号化器20A)の復号ピクチャバッファ114からピクチャまたはフレーム(またはピクチャに関連付けられたピクチャ情報)を受信し、ピクチャ(または受信されたピクチャ情報)をアップサンプリングするように構成され得る。このアップサンプリングされたピクチャは、次いで、下位レイヤ符号化器と同じアクセスユニット中のピクチャを符号化するように構成された上位レイヤ符号化器(たとえば、ビデオ符号化器20B)の予測処理ユニット100に与えられ得る。ある場合には、上位レイヤ符号化器は、下位レイヤ符号化器から削除された1つのレイヤである。他の場合には、
図2Bのレイヤ0ビデオ符号化器とレイヤ1符号化器との間に1つまたは複数の上位レイヤ符号化器があり得る。
【0109】
[00119]場合によっては、再サンプリングユニット90は省略またはバイパスされ得る。そのような場合、ビデオ符号化器20Aの復号ピクチャバッファ114からのピクチャは、直接、または少なくとも再サンプリングユニット90に与えられることなしに、ビデオ符号化器20Bの予測処理ユニット100に与えられ得る。たとえば、ビデオ符号化器20Bに与えられたビデオデータと、ビデオ符号化器20Aの復号ピクチャバッファ114からの参照ピクチャとが同じサイズまたは解像度である場合、参照ピクチャは、再サンプリングなしにビデオ符号化器20Bに与えられ得る。
【0110】
[00120]いくつかの実施形態では、ビデオ符号化器23は、ビデオ符号化器20Aにビデオデータを与える前に、ダウンサンプリングユニット94を使用して下位レイヤ符号化器に与えられるべきビデオデータをダウンサンプリングする。代替的に、ダウンサンプリングユニット94は、ビデオデータをアップサンプリングまたはダウンサンプリングすることが可能な再サンプリングユニット90であり得る。また他の実施形態では、ダウンサンプリングユニット94は省略され得る。
【0111】
[00121]
図2Bに示されているように、ビデオ符号化器23は、マルチプレクサ98、またはmuxをさらに含み得る。mux98は、ビデオ符号化器23から合成ビットストリームを出力することができる。合成ビットストリームは、ビデオ符号化器20Aおよび20Bの各々からビットストリームを取ることと、所与の時間において出力されるビットストリームを交替することとによって、作成され得る。場合によっては、2つの(または、3つ以上のビデオ符号化器レイヤの場合には、より多くの)ビットストリームからのビットが一度に1ビットずつ交替され得るが、多くの場合、ビットストリームは別様に合成され得る。たとえば、出力ビットストリームは、選択されたビットストリームを一度に1ブロックずつ交替することによって作成され得る。別の例では、出力ビットストリームは、ビデオ符号化器20Aおよび20Bの各々から非1:1比のブロックを出力することによって作成され得る。たとえば、ビデオ符号化器20Aから出力された各ブロックについて、2つのブロックがビデオ符号化器20Bから出力され得る。いくつかの実施形態では、mux98からの出力ストリームはプリプログラムされ得る。他の実施形態では、mux98は、ソースモジュール12を含むソースデバイス上のプロセッサからなど、ビデオ符号化器23の外部のシステムから受信された制御信号に基づいて、ビデオ符号化器20A、20Bからのビットストリームを合成し得る。制御信号は、ビデオソース18からのビデオの解像度またはビットレートに基づいて、リンク16の帯域幅に基づいて、ユーザに関連付けられたサブスクリプション(たとえば、有料サブスクリプション対無料サブスクリプション)に基づいて、またはビデオ符号化器23から望まれる解像度出力を決定するための他のファクタに基づいて生成され得る。
ビデオ復号器
【0112】
[00122]
図3Aは、本開示で説明する態様による技法を実装し得るビデオ復号器の一例を示すブロック図である。ビデオ復号器30は、HEVCの場合など、ビデオフレームの単一のレイヤを処理するように構成され得る。さらに、ビデオ復号器30は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、動き補償ユニット162および/またはイントラ予測ユニット164は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。一実施形態では、ビデオ復号器30は、場合によっては、本開示で説明する技法のいずれかまたはすべてを実行するように構成されたレイヤ間予測ユニット166を含み得る。他の実施形態では、レイヤ間予測は予測処理ユニット152(たとえば、動き補償ユニット162および/またはイントラ予測ユニット164)によって実行され得、その場合、レイヤ間予測ユニット166は省略され得る。ただし、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオ復号器30の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ(図示せず)が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。
【0113】
[00123]説明の目的で、本開示では、HEVCコーディングのコンテキストにおいてビデオ復号器30について説明する。しかしながら、本開示の技法は、他のコーディング規格または方法にも適用可能であり得る。
図3Aに示された例はシングルレイヤコーデックのためのものである。しかしながら、
図3Bに関してさらに説明するように、ビデオ復号器30の一部または全部はマルチレイヤコーデックの処理のために複製され得る。
【0114】
[00124]
図3Aの例では、ビデオ復号器30は複数の機能構成要素を含む。ビデオ復号器30の機能構成要素は、エントロピー復号ユニット150と、予測処理ユニット152と、逆量子化ユニット154と、逆変換ユニット156と、再構成ユニット158と、フィルタユニット159と、復号ピクチャバッファ160とを含む。予測処理ユニット152は、動き補償ユニット162と、イントラ予測ユニット164と、レイヤ間予測ユニット166とを含む。いくつかの例では、ビデオ復号器30は、
図2Aのビデオ符号化器20に関して説明された符号化経路とは全般に逆の復号経路を実行し得る。他の例では、ビデオ復号器30は、より多数の、より少数の、または異なる機能構成要素を含み得る。
【0115】
[00125]ビデオ復号器30は、符号化ビデオデータを備えるビットストリームを受信し得る。ビットストリームは複数のシンタックス要素を含み得る。ビデオ復号器30がビットストリームを受信したとき、エントロピー復号ユニット150は、ビットストリームに対してパース演算を実行し得る。ビットストリームに対してパース演算を実行した結果として、エントロピー復号ユニット150は、ビットストリームからシンタックス要素を抽出し得る。パース演算を実行することの一部として、エントロピー復号ユニット150は、ビットストリーム中のエントロピー符号化されたシンタックス要素をエントロピー復号し得る。予測処理ユニット152、逆量子化ユニット154、逆変換ユニット156、再構成ユニット158、およびフィルタユニット159は、ビットストリームから抽出されたシンタックス要素に基づいて、復号ビデオデータを生成する再構成演算を実行し得る。
【0116】
[00126]上記で説明したように、ビットストリームは、一連のNALユニットを備え得る。ビットストリームのNALユニットは、ビデオパラメータセット、シーケンスパラメータセットNALユニット、ピクチャパラメータセットNALユニット、SEI NALユニットなどを含み得る。ビットストリームに対してパース演算を実行することの一部として、エントロピー復号ユニット150は、シーケンスパラメータセットNALユニットからのシーケンスパラメータセット、ピクチャパラメータセットNALユニットからのピクチャパラメータセット、SEI NALユニットからのSEIデータなどを抽出しエントロピー復号する、パース演算を実行し得る。
【0117】
[00127]さらに、ビットストリームのNALユニットはコード化スライスNALユニットを含み得る。ビットストリームに対してパース演算を実行することの一部として、エントロピー復号ユニット150は、コード化スライスNALユニットからコード化スライスを抽出しエントロピー復号する、パース演算を実行し得る。コーディングされたスライスの各々は、スライスヘッダとスライスデータとを含み得る。スライスヘッダは、スライスに関するシンタックス要素を含んでいることがある。スライスヘッダ中のシンタックス要素は、スライスを含んでいるピクチャに関連付けられたピクチャパラメータセットを識別するシンタックス要素を含み得る。エントロピー復号ユニット150は、コード化されたスライスヘッダ中のシンタックス要素に対して、CABAC復号演算などのエントロピー復号演算を実行して、スライスヘッダを再構成し得る。
【0118】
[00128]コード化スライスのNALユニットからスライスデータを抽出することの一部として、エントロピー復号ユニット150は、スライスデータ中のコード化CUからシンタックス要素を抽出するパース演算を実行し得る。抽出されたシンタックス要素は、変換係数ブロックに関連付けられたシンタックス要素を含み得る。エントロピー復号ユニット150は、次いで、シンタックス要素のうちのいくつかに対してCABAC復号演算を実行し得る。
【0119】
[00129]エントロピー復号ユニット150が区分されていないCUに対してパース演算を実行した後、ビデオ復号器30は、区分されていないCUに対して再構成演算を実行し得る。区分されていないCUに対して再構成演算を実行するために、ビデオ復号器30はCUの各TUに対して再構成演算を実行し得る。CUの各TUについて再構成演算を実行することによって、ビデオ復号器30は、CUに関連付けられた残差ビデオブロックを再構成し得る。
【0120】
[00130]TUに対して再構成演算を実行することの一部として、逆量子化ユニット154は、TUに関連付けられた変換係数ブロックを逆量子化(inverse quantize)、たとえば、逆量子化(de-quantize)し得る。逆量子化ユニット154は、HEVC用に提案された、またはH.264復号規格によって定義された逆量子化プロセスと同様の方式で、変換係数ブロックを逆量子化し得る。逆量子化ユニット154は、量子化の程度を決定し、同様に、逆量子化ユニット154が適用すべき逆量子化の程度を決定するために、変換係数ブロックのCUのためにビデオ符号化器20によって計算される量子化パラメータQPを使用し得る。
【0121】
[00131]逆量子化ユニット154が変換係数ブロックを逆量子化した後、逆変換ユニット156は、変換係数ブロックに関連付けられたTUのための残差ビデオブロックを生成し得る。逆変換ユニット156は、TUのための残差ビデオブロックを生成するために、変換係数ブロックに逆変換を適用し得る。たとえば、逆変換ユニット156は、変換係数ブロックに、逆DCT、逆整数変換、逆カルーネンレーベ変換(KLT:Karhunen-Loeve transform)、逆回転変換、逆方向変換、または別の逆変換を適用し得る。いくつかの例では、逆変換ユニット156は、ビデオ符号化器20からのシグナリングに基づいて、変換係数ブロックに適用すべき逆変換を決定し得る。そのような例では、逆変換ユニット156は、変換係数ブロックに関連付けられたツリーブロックの4分木のルートノードにおいてシグナリングされた変換に基づいて、逆変換を決定し得る。他の例では、逆変換ユニット156は、ブロックサイズ、コーディングモードなど、1つまたは複数のコーディング特性から逆変換を推論し得る。いくつかの例では、逆変換ユニット156はカスケード逆変換を適用し得る。
【0122】
[00132]いくつかの例では、動き補償ユニット162は、補間フィルタに基づく補間を実行することによって、PUの予測ビデオブロックを改良し得る。サブサンプル精度をもつ動き補償のために使用されるべき補間フィルタのための識別子が、シンタックス要素中に含まれ得る。動き補償ユニット162は、PUの予測ビデオブロックの生成中にビデオ符号化器20によって使用された同じ補間フィルタを使用して、参照ブロックのサブ整数サンプルについての補間値を計算し得る。動き補償ユニット162は、受信されたシンタックス情報に従って、ビデオ符号化器20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ビデオブロックを生成し得る。
【0123】
[00133]
図5〜
図8に関して以下でさらに説明するように、予測処理ユニット152は、
図5〜
図8に示されている方法を実行することによってPU(または他の参照レイヤブロックおよび/またはエンハンスメントレイヤブロックまたはビデオユニット)をコーディング(たとえば、符号化または復号)し得る。たとえば、動き補償ユニット162、イントラ予測ユニット164、またはレイヤ間予測ユニット166は、一緒にまたは別々に、
図5〜
図8に示されている方法を実行するように構成され得る。
【0124】
[00134]PUが、イントラ予測を使用して符号化される場合、イントラ予測ユニット164は、PUのための予測ビデオブロックを生成するためにイントラ予測を実行し得る。たとえば、イントラ予測ユニット164は、ビットストリーム中のシンタックス要素に基づいて、PUのためのイントラ予測モードを決定し得る。ビットストリームは、PUのイントラ予測モードを決定するためにイントラ予測ユニット164が使用し得るシンタックス要素を含み得る。
【0125】
[00135]いくつかの事例では、シンタックス要素は、イントラ予測ユニット164が別のPUのイントラ予測モードを使用して現在PUのイントラ予測モードを決定すべきであることを示し得る。たとえば、現在PUのイントラ予測モードは近隣PUのイントラ予測モードと同じであることがあり得る。言い換えれば、近隣PUのイントラ予測モードは、現在PUに対して最確モードであり得る。したがって、この例では、ビットストリームは、PUのイントラ予測モードが近隣PUのイントラ予測モードと同じであることを示す、小さいシンタックス要素を含み得る。イントラ予測ユニット164は、次いで、イントラ予測モードを使用して、空間的に近隣するPUのビデオブロックに基づいて、PUの予測データ(たとえば、予測サンプル)を生成し得る。
【0126】
[00136]上記で説明したように、ビデオ復号器30もレイヤ間予測ユニット166を含み得る。レイヤ間予測ユニット166は、SVCにおいて利用可能である1つまたは複数の異なるレイヤ(たとえば、ベースレイヤまたは参照レイヤ)を使用して現在ブロック(たとえば、EL中の現在ブロック)を予測するように構成される。そのような予測はレイヤ間予測と呼ばれることがある。レイヤ間予測ユニット166は、レイヤ間冗長性を低減するために予測方法を利用し、それによって、コーディング効率を改善し、計算リソース要件を低減する。レイヤ間予測のいくつかの例としては、レイヤ間イントラ予測、レイヤ間動き予測、およびレイヤ間残差予測がある。レイヤ間イントラ予測は、ベースレイヤ中のコロケートされたブロックの再構成を使用してエンハンスメントレイヤ中の現在ブロックを予測する。レイヤ間動き予測は、ベースレイヤの動き情報を使用してエンハンスメントレイヤ中の動作を予測する。レイヤ間残差予測は、ベースレイヤの残差を使用してエンハンスメントレイヤの残差を予測する。レイヤ間予測方式の各々について、より詳細に以下で説明する。
【0127】
[00137]再構成ユニット158は、適用可能なとき、CUのTUに関連付けられた残差ビデオブロックとCUのPUの予測ビデオブロックとを使用して、たとえば、イントラ予測データまたはインター予測データのいずれかを使用して、CUのビデオブロックを再構成し得る。したがって、ビデオ復号器30は、ビットストリーム中のシンタックス要素に基づいて、予測ビデオブロックと残差ビデオブロックとを生成し得、予測ビデオブロックと残差ビデオブロックとに基づいて、ビデオブロックを生成し得る。
【0128】
[00138]再構成ユニット158がCUのビデオブロックを再構成した後、フィルタユニット159は、CUに関連付けられたブロッキングアーティファクトを低減するためにデブロッキング演算を実行し得る。フィルタユニット159が、CUに関連付けられたブロッキングアーティファクトを低減するためにデブロッキング演算を実行した後、ビデオ復号器30はCUのビデオブロックを復号ピクチャバッファ160に記憶し得る。復号ピクチャバッファ160は、後続の動き補償、イントラ予測、および
図1Aまたは
図1Bのディスプレイデバイス32などのディスプレイデバイス上での提示のために、参照ピクチャを与え得る。たとえば、ビデオ復号器30は、復号ピクチャバッファ160中のビデオブロックに基づいて、他のCUのPUに対してイントラ予測演算またはインター予測演算を実行し得る。
マルチレイヤ復号器
【0129】
[00139]
図3Bは、本開示で説明する態様による技法を実装し得るマルチレイヤビデオ復号器33の一例を示すブロック図である。ビデオ復号器33は、SHVCおよびマルチビューコーディングの場合など、マルチレイヤビデオフレームを処理するように構成され得る。さらに、ビデオ復号器33は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。
【0130】
[00140]ビデオ復号器33はビデオ復号器30Aとビデオ復号器30Bとを含み、それらの各々はビデオ復号器30として構成され得、ビデオ復号器30に関して上記で説明した機能を実行し得る。さらに、参照番号の再利用によって示されるように、ビデオ復号器30Aおよび30Bは、ビデオ復号器30としてシステムとサブシステムとのうちの少なくともいくつかを含み得る。ビデオ復号器33は、2つのビデオ復号器30Aおよび30Bを含むものとして示されているが、ビデオ復号器33は、そのようなものとして限定されず、任意の数のビデオ復号器30レイヤを含み得る。いくつかの実施形態では、ビデオ復号器33はアクセスユニット中の各ピクチャまたはフレームについてビデオ復号器30を含み得る。たとえば、5つのピクチャを含むアクセスユニットは、5つの復号器レイヤを含むビデオ復号器によって処理または復号され得る。いくつかの実施形態では、ビデオ復号器33は、アクセスユニット中のフレームよりも多くの復号器レイヤを含み得る。いくつかのそのような場合では、ビデオ復号器レイヤのいくつかは、いくつかのアクセスユニットを処理するときに非アクティブであり得る。
【0131】
[00141]ビデオ復号器30Aおよび30Bに加えて、ビデオ復号器33はアップサンプリングユニット92を含み得る。いくつかの実施形態では、アップサンプリングユニット92は、フレームまたはアクセスユニットのための参照ピクチャリストに追加されるべきエンハンストレイヤを作成するために、受信されたビデオフレームのベースレイヤをアップサンプリングし得る。このエンハンストレイヤは復号ピクチャバッファ160に記憶され得る。いくつかの実施形態では、アップサンプリングユニット92は、
図2Aの再サンプリングユニット90に関して説明した実施形態の一部または全部を含むことができる。いくつかの実施形態では、アップサンプリングユニット92は、レイヤをアップサンプリングすることと、スライス境界ルールおよび/またはラスタスキャンルールのセットに準拠するために1つまたは複数のスライスを再編成、再定義、修正、または調整することとを行うように構成される。場合によっては、アップサンプリングユニット92は、受信されたビデオフレームのレイヤをアップサンプリングおよび/またはダウンサンプリングするように構成された再サンプリングユニットであり得る。
【0132】
[00142]アップサンプリングユニット92は、下位レイヤ復号器(たとえば、ビデオ復号器30A)の復号ピクチャバッファ160からピクチャまたはフレーム(またはピクチャに関連付けられたピクチャ情報)を受信し、ピクチャ(または受信されたピクチャ情報)をアップサンプリングするように構成され得る。このアップサンプリングされたピクチャは、次いで、下位レイヤ復号器と同じアクセスユニット中のピクチャを復号するように構成された上位レイヤ復号器(たとえば、ビデオ復号器30B)の予測処理ユニット152に与えられ得る。ある場合には、上位レイヤ復号器は、下位レイヤ復号器から削除された1つのレイヤである。他の場合には、
図3Bのレイヤ0ビデオ復号器とレイヤ1復号器との間に1つまたは複数の上位レイヤ復号器があり得る。
【0133】
[00143]場合によっては、アップサンプリングユニット92は省略またはバイパスされ得る。そのような場合、ビデオ復号器30Aの復号ピクチャバッファ160からのピクチャは、直接、または少なくともアップサンプリングユニット92に与えられることなしに、ビデオ復号器30Bの予測処理ユニット152に与えられ得る。たとえば、ビデオ復号器30Bに与えられたビデオデータと、ビデオ復号器30Aの復号ピクチャバッファ160からの参照ピクチャとが同じサイズまたは解像度である場合、参照ピクチャは、アップサンプリングなしにビデオ復号器30Bに与えられ得る。さらに、いくつかの実施形態では、アップサンプリングユニット92は、ビデオ復号器30Aの復号ピクチャバッファ160から受信された参照ピクチャをアップサンプリングまたはダウンサンプリングするように構成された再サンプリングユニット90であり得る。
【0134】
[00144]
図3Bに示されているように、ビデオ復号器33は、デマルチプレクサ99、またはdemuxをさらに含み得る。demux99は符号化ビデオビットストリームを複数のビットストリームにスプリットすることができ、demux99によって出力された各ビットストリームは異なるビデオ復号器30Aおよび30Bに与えられる。複数のビットストリームは、ビットストリームを受信することによって作成され得、ビデオ復号器30Aおよび30Bの各々は、所与の時間においてビットストリームの一部分を受信する。場合によっては、demux99において受信されるビットストリームからのビットは、ビデオ復号器の各々(たとえば、
図3Bの例ではビデオ復号器30Aおよび30B)の間で一度に1ビットずつ交替され得るが、多くの場合、ビットストリームは別様に分割される。たとえば、ビットストリームは、一度に1ブロックずつビットストリームを受信するビデオ復号器を交替することによって分割され得る。別の例では、ビットストリームは、非1:1比のブロックによって、ビデオ復号器30Aおよび30Bの各々に分割され得る。たとえば、ビデオ復号器30Aに与えられる各ブロックについて、2つのブロックがビデオ復号器30Bに与えられ得る。いくつかの実施形態では、demux99によるビットストリームの分割はプリプログラムされ得る。他の実施形態では、demux99は、宛先モジュール14を含む宛先デバイス上のプロセッサからなど、ビデオ復号器33の外部のシステムから受信された制御信号に基づいてビットストリームを分割し得る。制御信号は、入力インターフェース28からのビデオの解像度またはビットレートに基づいて、リンク16の帯域幅に基づいて、ユーザに関連付けられたサブスクリプション(たとえば、有料サブスクリプション対無料サブスクリプション)に基づいて、またはビデオ復号器33によって取得可能な解像度を決定するための他のファクタに基づいて生成され得る。
HLS専用HEVCベーススケーラブルビデオコーディング
【0135】
[00145]いくつかの実装形態(たとえば、HEVCのスケーラブル拡張)では、高レベルシンタックス(HLS:high-level syntax)専用ビデオコーディングが望まれることがある。たとえば、HLS専用ビデオコーディングは、ブロックレベルまたはコーディングユニットレベル変更がそのような実装形態に導入されないことを意味し得る。IntraBLなどのコーディングモードは、そのようなコーディングモードがHEVCフレームワークのブロックレベル変更を伴い得るので、そのような実装形態とともに使用され得ない。たとえば、IntraBLは、コーディングされているエンハンスメントレイヤ中の現在ブロックに関してコロケートされた参照レイヤ中のブロックのテクスチャ情報に直接アクセスすることを伴う。
【0136】
[00146]しかしながら、HLS専用ビデオコーディングは、(たとえば、再サンプリングなどの何らかの適用可能な処理の後に)参照レイヤピクチャを取り、それをエンハンスメントレイヤピクチャの参照ピクチャリストに挿入することによって達成され得る。この場合、参照ピクチャリストに挿入された参照ピクチャは、単にエンハンスメントレイヤ中の別のピクチャとして扱われ得、HEVCフレームワークのブロックレベル変更を必要とすることなしにインター予測のために使用され得る。参照レイヤとエンハンスメントレイヤとが同じ空間解像度を有する場合、http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/ 4_Incheon/wg11/ JCT3V-D1004-v3.zipにおいて入手可能である「MV-HEVC Working Draft 4(JCT3V-D1004)」に記載されている手法が使用され得る。そのような手法では、エンハンスメントレイヤの参照ピクチャリストに挿入されたピクチャは、追加のブロックレベル処理なしに、TMVP導出のために、コロケートされたピクチャ(たとえば、動き情報がそれから導出される同じレイヤ中のピクチャ)として使用され得る。
インター予測およびTMVP
【0137】
[00147]インター予測では、エンハンスメントレイヤ(EL)ピクチャ中の現在ブロックは、同じレイヤ中の時間的に近隣するピクチャの動き情報を使用して予測され得る。たとえば、時間動きベクトル予測子(TMVP:temporal motion vector predictor)は、コロケートされたピクチャ(たとえば、同じレイヤ中の時間的に近隣するピクチャ)中のコロケートされたブロック(現在ピクチャ中の現在ブロックとして、時間的に近隣するピクチャ中の同じ位置にあるブロック)から導出され、EL中の現在ブロックの動きベクトル(MV)候補リストに追加され得る。
【0138】
[00148]TMVPの使用はコーディング効率を改善し得る。たとえば、TMVPは、現在コーディングされているブロック(たとえば、現在ブロック)の動きベクトルのための予測子として使用され得、現在ブロックの動きベクトル全体をコーディングする代わりに、現在ブロックの動きベクトルとTMVPとの間の動きベクトル差分(MVD)がコーディングされ得る。
空間スケーラビリティ
【0139】
[00149]空間スケーラビリティの場合、ELピクチャは、参照レイヤ(RL)ピクチャとは異なる空間解像度を有する。たとえば、ELとRLとの間の空間アスペクト比は、1.5、2.0、または他の比であり得る。この場合、RLピクチャは、http://phenix.int-evry.fr/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M1008-v3.zipにおいて入手可能である「SHVC Working Draft 2」に記載されているように、再サンプリングされたRLピクチャをEL参照リストに挿入する前に、再サンプリングされたRLピクチャがELピクチャの空間解像度に一致するように再サンプリングされ得る。
【0140】
[00150]テクスチャ予測と動き予測の両方を有効化するために、RLピクチャに関連付けられたピクセル情報と非ピクセル情報(シンタックス、モードおよびモードパラメータ)の両方が再サンプリングされ得る。たとえば、TMVPの使用が可能にされ得るように、予測モードと、動きベクトル、参照インデックス、インター方向などの動き情報とが再サンプリングされ得る。上述のブロックレベル情報に加えて、TMVP導出プロセスは、ピクチャタイプおよびそれの参照ピクチャリスト情報など、コロケートされたピクチャ(たとえば、ELの参照ピクチャリスト中に挿入された再サンプリングされたRLピクチャ)の高レベル情報をも使用し得る。
レイヤ間参照ピクチャ(ILRP)を生成すること
【0141】
[00151]
図4Aおよび
図4Bに、参照レイヤピクチャを使用してレイヤ間参照ピクチャを生成する例示的な方法を示す。上記で説明したように、いくつかの実装形態では、生成されたレイヤ間参照ピクチャは、エンハンスメントレイヤの参照ピクチャリストに追加され、エンハンスメントレイヤピクチャをコーディングするために使用される。
図4Aは、いくつかのスライス404Aおよび404Bを含む、参照レイヤピクチャ402を示している。
図4Aの例には2つのスライスのみが示されているが、スライスの数は、そのように制限されず、何らかの任意の数であり得る。
図4Aに示されているように、2つのスライス404Aと404Bとの間の分割はスライス境界406によって識別される。スライス境界406は、参照レイヤピクチャ402をコーディングユニットに分割するグリッド線と比較したスライス境界406の増加した太さによってグリッド線と区別される。
【0142】
[00152]スライスの各々は、スライス固有情報および/またはスライスに固有のシンタックス情報に関連付けられ得る。このスライス情報は、各スライス404Aおよび404Bのためのスライスヘッダ中に含まれ得るか、あるいは、マッピングテーブルまたは他のデータ構造を介してなど、他の場所に記憶され、スライスに関連付けられ得る。スライス情報は、ピクチャ順序カウント(POC:picture order count)値、色平面、スライス中の第1のコーディングツリーブロックのアドレス、参照ピクチャリスト情報など、スライスに関連付けられ得る任意のタイプの情報を含み得る。このスライス情報はHEVC規格によって定義され得る。しかしながら、スライス情報は、そのように制限されず、他の規格ベース情報、および/または特定の規格に関連付けられることも関連付けられないこともある特定用途向け情報を含み得る。
【0143】
[00153]参照レイヤピクチャ402は、グリッド線によって示されているようにいくつかのコーディングユニット408またはコーディングツリーブロック(CTB:coding tree block)に分割され得る。コーディングユニットは様々なピクセルサイズであり得る。たとえば、コーディングユニットは16×16ピクセルまたは64×64ピクセルであり得る。場合によっては、コーディングユニットは最大コーディングユニット(LCU)と呼ばれることがある。スライス404Aおよび404BはいくつかのLCUを含み得る。図示された例では、スライス404Aは5つのLCUを含み、スライス404Bは11個のLCUを含む。参照レイヤピクチャ402の各ブロックまたはCTBは同等にサイズ決定されるものとして示されているが、いくつかの実施形態では、レイヤ402のCTBはサイズが異なり得る。参照レイヤピクチャ402が
図4Aに示されているが、参照レイヤピクチャ402は、任意のベースレイヤピクチャ、または他のレイヤからのピクチャであり得る。
【0144】
[00154]
図4Bは、参照レイヤピクチャ402の再サンプリングされたバージョンである再サンプリングされた参照レイヤピクチャ412を示している。再サンプリングされた参照レイヤピクチャ412はレイヤ間参照ピクチャ412と呼ばれることもある。再サンプリングされた参照レイヤピクチャ412は、エンハンスメントレイヤ(または参照レイヤよりも高い解像度を有する他のレイヤ)の参照ピクチャリスト中に含まれ得るピクチャを表し得る。この再サンプリングされた参照レイヤピクチャ412は、場合によっては、エンハンスメントレイヤピクチャをコーディング(たとえば、符号化または復号)するために使用され得る。
図4Bに示されているように、再サンプリングされた参照レイヤピクチャ412は、2×による参照レイヤピクチャ402のアップサンプリング、またはダイアディック(dyadic)アップサンプリングを表す。
図4Bの例では、再サンプリングされた参照レイヤピクチャ412は、参照レイヤピクチャ402のものと同じサイズを有するコーディングユニット418を備えるが、再サンプリングされた参照レイヤピクチャ412は、参照レイヤピクチャ402の4倍の数のコーディングユニット418を備える。他の実施形態では、アップサンプリングはスケーリングを含み得る。たとえば、再サンプリングされた参照レイヤピクチャ412内の各コーディングユニットは、2×アップサンプリングが適用されたとき、長さおよび幅が参照レイヤピクチャ402中の各コーディングユニットの2倍になり得る。他の場合には、再サンプリングされた参照レイヤピクチャ412の各コーディングユニットは参照レイヤピクチャ402中のコーディングユニットと同じサイズであり得る。ある場合には、アップサンプリングは、整数スケール(たとえば、2×、3×、5×など)などの特定のスケールに制限される。他の場合には、アップサンプリングは、無制限であり得、非整数ベースアップサンプリング(たとえば、1.5×、3.3×など)を含み得る。さらに、本明細書の実施形態は、アップサンプリングを使用して主に説明されているが、いくつかの実施形態はダウンサンプリング(たとえば、0.5×)を含み得る。
【0145】
[00155]
図4Bに示されているように、再サンプリングされた参照レイヤピクチャ412は単一のスライス414を含む。本明細書で説明するように、スライス414のスライス情報は、スライス404A、スライス404B、またはその両方から導出され得る。一実施形態では、別のスライスからスライス情報を「導出」するプロセスは、そのスライスのスライス情報をコピーオーバーすることを備える。たとえば、スライス414はスライス404Aと同じスライス情報を有し得る。別の例では、スライス414はスライス404Bと同じスライス情報を有し得る。また別の例では、スライス404は、スライス404Aから導出された一部の情報と、スライス404Bから導出された他の情報とを有し得る。再サンプリングされた参照レイヤピクチャ412は1つのスライス414を有するので、
図4Bに示されたスライス境界はない。上記で説明したように、再サンプリングされた参照レイヤピクチャ412は、1つのスライスを有し、スライス境界を有しないので、複数のスライスのビットストリーム適合を保証するための追加の処理(たとえば、ラスタスキャン順序処理)を実行する必要はなくなる。
レイヤ間参照ピクチャ中に含まれるデータ
【0146】
[00156]たとえば、いくつかの実施形態では、空間スケーラビリティの場合、HLS専用HEVC−SVCにおいて低レベル(たとえば、ブロックレベル)プロセス変更を伴わない、レイヤ間参照ピクチャ(たとえば、ELのインター予測のために使用される、RLピクチャに基づいて生成された参照ピクチャ)を生成すること、すなわち、(A)RLピクチャのYUVデータをアップサンプリングし、(B)RLピクチャの動きパラメータ(たとえば、動きベクトルおよび参照インデックス)をアップサンプリングし、(C)RLピクチャの高レベル(たとえば、ピクチャまたはスライスレベル)情報を導出する。たとえば、生成されたレイヤ間参照ピクチャ(ILRP)は、RLピクチャから導出された以下のデータを含み得る。(A)ELピクチャと同じ空間解像度を有するアップサンプリングされたテクスチャピクチャ、(B)各基本ユニット(たとえば、コーディングユニットまたは予測ユニット)のための動きパラメータ、および(C)高レベル(たとえば、ピクチャまたはスライスレベル)情報。
【0147】
[00157]生成されたレイヤ間参照ピクチャの高レベル情報(たとえば、上記の項目(C))は、ピクチャPOC値と、スライスパーティションパターンと、スライスタイプと、参照ピクチャリスト情報と、TMVP導出プロセスにおいて使用され得る他の高レベル情報とを含み得る。参照ピクチャリスト情報は、各参照ピクチャリスト中の参照ピクチャ数、すべての参照ピクチャの参照ピクチャタイプ(たとえば、短期または長期)、すべての参照ピクチャの参照ピクチャPOC値を含み得る。いくつかの実装形態では、参照ピクチャリスト情報は、(1)参照ピクチャリスト0中の参照ピクチャの数、(2)参照ピクチャリスト0の各参照ピクチャインデックスに対応する参照ピクチャ(たとえば、0の参照インデックスに関連付けられた参照ピクチャ、1の参照インデックスに関連付けられた参照ピクチャなど)、(3)参照ピクチャリスト1中の参照ピクチャの数、および/または(4)参照ピクチャリスト1の各参照ピクチャインデックスに対応する参照ピクチャのうちのいずれかを含み得る。生成されたレイヤ間参照ピクチャの一部の高レベル情報はRLピクチャのそれから単にコピーオーバーされ得る。代替的に、生成されたレイヤ間参照ピクチャの一部の高レベル情報は、あらかじめ定義された値に設定され得る。ピクチャPOC値などのピクチャレベル情報では、関係するBLピクチャから直接コピーされ得る。しかしながら、スライスタイプおよび参照リストピクチャ情報など、一部の他の情報は、個々のスライスに関連付けられる(たとえば、各スライスは、それ自体のスライスタイプと参照ピクチャリストとを含んでいる)。生成されたレイヤ間参照ピクチャのそのような情報はスライスレベルで導出される必要があろう。
【0148】
[00158]いくつかの実装形態では、複数のスライスの場合にレイヤ間参照ピクチャの高レベル情報を生成するときに、再サンプリングされたRLピクチャのスライス境界および/またはスライス定義を修正することは、対応するRLピクチャ中のスライスセグメンテーションに基づいて行われる。たとえば、対応するRLピクチャが複数のスライスにどのように分割されるかと、スライス境界がどこに位置するかとに応じて、ある場合には、得られた再サンプリングされたRLピクチャが、適用され得る規格および制約に適合するように、再サンプリングされたRLピクチャのスライス境界を修正することが望ましい。
【0149】
[00159]MV−HEVC(マルチビュー)または信号対雑音比(SNR)スケーラブルSVCの場合、生成された参照ピクチャは、(たとえば、空間再サンプリングが実行されない場合)ベースレイヤ/ベースビューピクチャと同じスライスパターンを有することができるので、生成された参照ピクチャのスライス情報は、対応する参照レイヤまたは参照ビューピクチャから直接コピーされ得る。一方、空間スケーラビリティの場合、スライスパーティションパターン導出は、最初に、対応するRLピクチャのスライスパーティションパターンを再サンプリングすることと、次いで、得られた参照ピクチャが任意の適用可能な規格または制約(たとえば、スライスがラスタスキャン順序で連続LCUのセットを含んでいなければならないなど、HEVCスライスパーティションルール)に適合するように、スライスパーティションパターンを調整することとによって行われ得る。
単一スライスILRP
【0150】
[00160]いくつかの実施形態では、参照レイヤピクチャが、レイヤ間参照ピクチャを生成するためにスケーラビリティ比に基づいて再サンプリングされるとき、参照レイヤピクチャがその中で定義された複数のスライスを有する場合でも、再サンプリングされた参照レイヤピクチャのために単一のスライスが生成される。たとえば、再サンプリングされた参照レイヤピクチャ中のすべてのコーディングツリーブロック(CTB)は単一のスライスに関連付けられる。再サンプリングされた参照レイヤピクチャの単一のスライスのスライス情報は、参照レイヤピクチャの1つまたは複数のスライスのスライス情報を使用して生成される。たとえば、再サンプリングされた参照レイヤピクチャの単一のスライスのスライス情報は、参照レイヤピクチャのスライスのうちの1つのスライス情報に等しく設定される。一実施形態では、スライス情報はスライスタイプと参照ピクチャリストとを含む。しかしながら、スライス情報は、本明細書で説明するものに限定されず、スライスレベルで(たとえば、スライスヘッダ中で)シグナリングまたは受信され得る任意のパラメータまたは変数を含み得る。
異なる参照ピクチャリストを有するスライス
【0151】
[00161]参照レイヤピクチャが複数のスライス(たとえば、スライス#1およびスライス#2)を有し、それらが異なる参照ピクチャリストを有する場合、問題があり得る。たとえば、参照レイヤピクチャが再サンプリングされ、再サンプリングされた参照レイヤピクチャのために単一のスライスが生成され、単一のスライスのスライス情報が、参照レイヤピクチャのスライス#1のスライス情報に基づいて生成された場合、再サンプリングされた参照レイヤピクチャの単一のスライスの参照ピクチャリストは参照レイヤピクチャのスライス#2の参照ピクチャリストとは異なるので、参照レイヤピクチャのスライス#2に対応する再サンプリングされた参照レイヤピクチャ中のブロックは、もはや有効でない参照インデックス(たとえば、参照ピクチャリスト中のピクチャを識別するために使用される値)を有することがある。この例では、再サンプリングされた参照レイヤピクチャの参照ピクチャリストは、スライス#2の参照ピクチャリストとは異なる、参照レイヤピクチャのスライス#1のそれと同じであろう。
【0152】
[00162]一例では、スライス#1は3つの参照ピクチャを有し、スライス#2は5つの参照ピクチャを有し、再サンプリングされた参照レイヤピクチャの単一のスライスのスライス情報はスライス#1のスライス情報から導出される(たとえば、単一のスライスの参照ピクチャリストはスライス#1の参照ピクチャリストと同じである)。しかしながら、単一のスライスの参照ピクチャリストが3つの参照ピクチャを有するにもかかわらず、スライス#2に対応する再サンプリングされた参照レイヤピクチャのいくつかのブロックは3または4の参照インデックス値を有し得る。
【0153】
[00163]上記で説明したように、生成されたレイヤ間参照ピクチャの高レベル情報(たとえば、スライスパーティションパターンおよび各スライスに関連付けられた他の情報)を生成または導出するプロセスは極めて複雑であり得る。本出願の様々な実施形態は、(たとえば、再サンプリングされたレイヤ間参照ピクチャのために複数のスライスを生成することを控えること、または再サンプリングされたレイヤ間参照ピクチャのために単一のスライスを生成することによって)スライスレベル情報を生成または導出するための簡略化されたプロセスを提供し得る。
アプローチ#1:レイヤ間動き予測を制限すること
【0154】
[00164]参照レイヤピクチャのスライスが異なるスライス情報(たとえば、参照ピクチャリスト)を有するときに起こる問題の1つの解決策は、レイヤ間動き予測を、参照レイヤピクチャの複数のスライスが同等の参照ピクチャリストを有する場合に制限することである。たとえば、再サンプリングされた参照レイヤピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されるとき、参照レイヤピクチャ中のすべてのスライスが同等の参照ピクチャリスト0と同等の参照ピクチャ1とを有しない限り、レイヤ間動き予測は無効化される。さらに、この制限はまた、本出願において後で説明するように、信号対雑音比(SNR)スケーラビリティの場合に、または特に、エンハンスメントレイヤと参照レイヤとで異なるCTBサイズをもつSNRスケーラビリティの場合に適用され得る。
【0155】
[00165]
図5は、本開示の一実施形態による、ビデオ情報をコーディングするための方法500を示すフローチャートである。
図5に示されたステップは、符号化器(たとえば、
図2Aまたは
図2Bに示されているビデオ符号化器)または本明細書で説明する別の構成要素によって実行され得る。便宜上、方法500について、たとえば、ビデオ符号化器であり得る、コーダによって実行されるものとして説明する。
【0156】
[00166]方法500はブロック501において開始する。ブロック505において、コーダは、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定する。一実施形態では、スライス情報は、対応するスライスに関連付けられた参照ピクチャリストを含む。コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有すると決定した場合、コーダは、ブロック510においてレイヤ間動き予測を有効化する。たとえば、「有効化」という用語は、それの本来の意味に加えて、レイヤ間動き予測が、コーダによって、現在ブロックまたは現在ピクチャをコーディングするためのコーディングオプションの1つとして考慮されることを可能にすることを意味することができる。別の例では、「有効化」という用語は、単に、レイヤ間動き予測の使用を制限(または無効化)することを控えることを意味することができ、必ずしも、現在ブロックまたは現在ピクチャがレイヤ間動き予測を使用してコーディングされることを意味するとは限らない。それは、コーダが、レイヤ間動き予測が現在ブロックまたは現在ピクチャをコーディングする所望の方法であると決定した場合、コーダがそのようにし得ることを単に意味することがある。
【0157】
[00167]一方、コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有すると決定した場合、コーダは、ブロック515においてレイヤ間動き予測を無効化する。レイヤ間動き予測を、参照レイヤピクチャのスライスが同等のスライス情報(たとえば、スライスタイプ、参照ピクチャリストなど)を有する状況に制限することによって、単一スライスレイヤ間参照ピクチャの生成はよりスムーズに実装され得、レイヤ間参照ピクチャ中の複数のスライスを管理することに関連付けられた計算複雑さが低減されるかまたはなくされ得る。方法500はブロック520において終了する。
【0158】
[00168]上記で説明したように、
図2Aのビデオ符号化器20または
図2Bのビデオ符号化器23の1つまたは複数の構成要素(たとえば、レイヤ間予測ユニット128)は、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定すること、およびレイヤ間動き予測を有効化/無効化することなど、本開示で説明する技法のいずれかを実装するために使用され得る。
【0159】
[00169]
図6は、本開示の別の実施形態による、ビデオ情報をコーディングするための方法600を示すフローチャートである。
図6の例では
図5の制限と同様の制限が適用されるが、この例では、レイヤ間動き予測がコーダによって実際に実行される。
図6に示された1つまたは複数のステップは、符号化器(たとえば、
図2Aまたは
図2Bに示されているビデオ符号化器)、復号器(たとえば、
図3Aまたは
図3Bに示されているビデオ復号器)、または任意の他の構成要素によって実行され得る。便宜上、方法700について、符号化器、復号器、または別の構成要素であり得る、コーダによって実行されるものとして説明する。
【0160】
[00170]方法600はブロック601において開始する。ブロック605において、コーダは、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定する。一実施形態では、スライス情報は、対応するスライスに関連付けられた参照ピクチャリストを含む。コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有すると決定した場合、コーダは、ブロック610において、参照レイヤピクチャをアップサンプリングすることによって、単一のスライスを有するレイヤ間参照ピクチャを生成する。ブロック615において、コーダは、レイヤ間参照ピクチャのスライス情報を参照レイヤピクチャのスライスのうちの1つのスライス情報に等しく設定する。たとえば、参照レイヤピクチャの第1のスライスのスライス情報がレイヤ間参照ピクチャの単一のスライスにコピーオーバーされる。ブロック620において、コーダは、エンハンスメントレイヤピクチャ(たとえば、コーディングされているエンハンスメントレイヤ中の現在ピクチャ)の少なくとも一部分をコーディング(たとえば、符号化または復号)するためにレイヤ間参照ピクチャを使用する。たとえば、上記で説明したように、エンハンスメントレイヤ中の現在ブロックに関してコロケートされたレイヤ間参照レイヤ中のブロック(たとえば、参照レイヤピクチャの再サンプリングされたバージョン)に関連付けられた動き情報が時間動きベクトル予測子(TMVP)として使用され得る。一方、コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有しないと決定した場合、方法600はブロック620において終了する。
【0161】
[00171]上記で説明したように、
図2Aのビデオ符号化器20、
図2Bのビデオ符号化器23、
図3Aのビデオ復号器30、または
図3Bのビデオ復号器33の1つまたは複数の構成要素(たとえば、レイヤ間予測ユニット128および/またはレイヤ間予測ユニット166)は、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定すること、レイヤ間参照ピクチャを生成すること、再サンプリングされた参照レイヤピクチャ中の単一のスライスのスライス情報を参照レイヤピクチャ中のスライスのうちの1つに等しく設定すること、およびエンハンスメントレイヤをコーディングするために、生成されたレイヤ間参照ピクチャを使用することなど、本開示で説明する技法のいずれかを実装するために使用され得る。
アプローチ#2:スライス情報の修正
【0162】
[00172]代替的に、一実施形態では、インデックス値が範囲外になることを防ぐために、参照インデックス値が、−1から再サンプリングされた参照レイヤピクチャの参照ピクチャリストの最大参照インデックス値までの範囲にクリッピングされ得る。一実施形態では、−1の値は、この特定の参照方向(たとえば、リスト0またはリスト1)に予測がないことを示す。たとえば、単予測ブロックは、両方ではなく単一の方向を指す動きベクトルを有する。したがって、2つの参照ピクチャリストがある場合、2つの方向のうちの1つのための参照インデックスは、単予測ブロックでは−1であり得る。
【0163】
[00173]別の実施形態では、再サンプリングされた参照レイヤピクチャを生成した後、再サンプリングされた参照レイヤピクチャの単一のスライスのそれとは異なる参照ピクチャリストを有する参照レイヤピクチャのスライスに対応するブロックの参照インデックス値が、それらが正しい参照ピクチャを識別するように修正される。たとえば、スライス#1の参照ピクチャリストは[ピクチャ#1,ピクチャ#2]であり得、スライス#2の参照ピクチャリストは[ピクチャ#2,ピクチャ#1]であり得る。そのような場合、2つのスライスの参照ピクチャリストは異なる。しかしながら、再サンプリングされた参照レイヤピクチャの単一のスライスの参照ピクチャリストを、たとえば、スライス#1の参照ピクチャリストに設定した後、参照レイヤピクチャのスライス#2に対応するブロックについて、単一スライス生成に起因する不正確さを補正するために、0の参照インデックス値が1に変更され得、1の参照インデックス値が0に変更され得る。
【0164】
[00174]また別の実施形態では、参照ピクチャリストの変更は、それらのブロックの動きベクトルが、参照インデックス値と新しい参照ピクチャリストとによって識別される新しい参照ピクチャの関連部分を指すように、動きベクトルを時間的にスケーリングすることによって対処される。一例では、動きベクトルは、現在ピクチャと元の参照ピクチャとの間の時間距離と、現在ピクチャと新しい参照ピクチャとの間の時間距離とに基づいて決定されるファクタによってスケーリングされ得る。別の例では、動きベクトルは、参照ピクチャのピクチャ順序カウント(POC)値に基づいてスケーリングされ得る。
【0165】
[00175]
図7および
図8に関して、参照レイヤピクチャのスライスが同等のスライス情報を有しない場合に実行され得る例示的なコーディング方法について説明する。
図7は、本開示の一実施形態による、ビデオ情報をコーディングするための方法700を示すフローチャートである。
図7に示された1つまたは複数のステップは、符号化器(たとえば、
図2Aまたは
図2Bに示されているビデオ符号化器)、復号器(たとえば、
図3Aまたは
図3Bに示されているビデオ復号器)、または任意の他の構成要素によって実行され得る。便宜上、方法700について、符号化器、復号器、または別の構成要素であり得る、コーダによって実行されるものとして説明する。
【0166】
[00176]方法700はブロック701において開始する。ブロック705において、コーダは、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定する。一実施形態では、スライス情報は、対応するスライスに関連付けられた参照ピクチャリストを含む。コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有すると決定した場合、コーダは、ブロック710において、参照レイヤピクチャをアップサンプリングすることによって、単一のスライスを有するレイヤ間参照ピクチャを生成する。ブロック715において、コーダは、レイヤ間参照ピクチャのスライス情報を、最長参照ピクチャリストを有する、参照レイヤピクチャのスライスのうちの1つのスライス情報に等しく設定する。たとえば、スライス情報は参照ピクチャリスト情報を含み得、参照レイヤピクチャの第1のスライスが、5の長さ(たとえば、5つのピクチャ)を有する参照ピクチャリストに関連付けられ、参照レイヤピクチャの第2のスライスが、7の長さ(たとえば、7つのピクチャ)を有する参照ピクチャリストに関連付けられ、第2のスライスのスライス情報がレイヤ間参照ピクチャの単一のスライスにコピーオーバーされ得る。ブロック720において、コーダは、エンハンスメントレイヤピクチャ(たとえば、コーディングされているエンハンスメントレイヤ中の現在ピクチャ)の少なくとも一部分をコーディング(たとえば、符号化または復号)するためにレイヤ間参照ピクチャを使用する。たとえば、上記で説明したように、エンハンスメントレイヤ中の現在ブロックに関してコロケートされたレイヤ間参照レイヤ中のブロック(たとえば、参照レイヤピクチャの再サンプリングされたバージョン)に関連付けられた動き情報が時間動きベクトル予測子(TMVP)使用され得る。一方、コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有しないと決定した場合、方法700はブロック720において終了する。
【0167】
[00177]上記で説明したように、
図2Aのビデオ符号化器20、
図2Bのビデオ符号化器23、
図3Aのビデオ復号器30、または
図3Bのビデオ復号器33の1つまたは複数の構成要素(たとえば、レイヤ間予測ユニット128および/またはレイヤ間予測ユニット166)は、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定すること、レイヤ間参照ピクチャを生成すること、再サンプリングされた参照レイヤピクチャ中の単一のスライスのスライス情報を、より長い参照ピクチャリストを有する、参照レイヤピクチャ中のスライスのうちの1つに等しく設定すること、およびエンハンスメントレイヤをコーディングするために、生成されたレイヤ間参照ピクチャを使用することなど、本開示で説明する技法のいずれかを実装するために使用され得る。
【0168】
[00178]
図8は、本開示の別の実施形態による、ビデオ情報をコーディングするための方法800を示すフローチャートである。
図7の例は、ビットストリーム制約適合レイヤ間参照レイヤを提供することを目的とするが、
図8の例は、そこから得られるコーディング効率をさらに改善することを目的とする。
図8に示された1つまたは複数のステップは、符号化器(たとえば、
図2Aまたは
図2Bに示されているビデオ符号化器)、復号器(たとえば、
図3Aまたは
図3Bに示されているビデオ復号器)、または任意の他の構成要素によって実行され得る。便宜上、方法700について、符号化器、復号器、または別の構成要素であり得る、コーダによって実行されるものとして説明する。
【0169】
[00179]方法800はブロック801において開始する。ブロック805において、コーダは、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定する。一実施形態では、スライス情報は、対応するスライスに関連付けられた参照ピクチャリストを含む。コーダが、参照レイヤピクチャのスライスが同等のスライス情報を有すると決定した場合、コーダは、ブロック810において、参照レイヤピクチャをアップサンプリングすることによって、単一のスライスを有するレイヤ間参照ピクチャを生成する。ブロック815において、コーダは、レイヤ間参照ピクチャのスライス情報を参照レイヤピクチャのスライスのうちの1つのスライス情報に等しく設定する。たとえば、参照レイヤピクチャの第1のスライスのスライス情報がレイヤ間参照ピクチャの単一のスライスにコピーオーバーされる。ブロック820において、コーダは、参照ピクチャの選択されないスライスに対応するレイヤ間参照ピクチャの一部分に関連付けられた動き情報中の不正確さを補正するために、動き情報を修正する。たとえば、この例では、レイヤ間参照レイヤの単一のスライスのスライス情報が参照レイヤピクチャの第1のスライスからコピーオーバーされたので、参照ピクチャレイヤ中の他のスライスに対応するレイヤ間参照ピクチャの一部分は修正プロセスを受け得る。本明細書で説明するように、修正プロセスは、そのような一部分中で使用される参照インデックスが参照ピクチャリスト中の正しい参照ピクチャに対応するように、そのような一部分中の動きベクトルを時間的にスケーリングするか、または参照インデックスを再マッピングすることを含み得る。
【0170】
[00180]レイヤ間動き予測を、参照レイヤピクチャのスライスが同等のスライス情報(たとえば、スライスタイプ、参照ピクチャリストなど)を有する状況に制限することによって、単一スライスレイヤ間参照ピクチャの生成はよりスムーズに実装され得、レイヤ間参照ピクチャ中の複数のスライスを管理することに関連付けられた計算複雑さが低減されるかまたはなくされ得る。方法800はブロック820において終了する。
【0171】
[00181]上記で説明したように、
図2Aのビデオ符号化器20、
図2Bのビデオ符号化器23、
図3Aのビデオ復号器30、または
図3Bのビデオ復号器33の1つまたは複数の構成要素(たとえば、レイヤ間予測ユニット128および/またはレイヤ間予測ユニット166)は、参照レイヤピクチャのスライスが同等のスライス情報を有するかどうかを決定すること、レイヤ間参照ピクチャを生成すること、再サンプリングされた参照レイヤピクチャ中の単一のスライスのスライス情報を、より長い参照ピクチャリストを有する、参照レイヤピクチャ中のスライスのうちの1つに等しく設定すること、レイヤ間参照ピクチャに関連付けられた動き情報を修正すること、およびエンハンスメントレイヤをコーディングするために、生成されたレイヤ間参照ピクチャを使用することなど、本開示で説明する技法のいずれかを実装するために使用され得る。
スライスレベル情報導出
【0172】
[00182]一実施形態では、(レイヤ間参照ピクチャとも呼ばれる)再サンプリングされた参照レイヤピクチャのすべてのコーディングツリーブロック(CTB)は、再サンプリングされた参照レイヤピクチャのために生成された単一のスライスに関連付けられる。単一のスライスのスライス情報は、対応する参照レイヤピクチャ中のいずれかのスライスから導出され得る。一実施形態では、生成されたスライスのスライスタイプおよび参照ピクチャリスト情報は、参照レイヤピクチャ中の特定のスライスのものに等しく設定される。たとえば、特定のスライスは参照レイヤピクチャ中の第1のスライスであり得る。以下のテキストは、この方法の詳細な実装形態としてSHVCワーキングドラフトにおいて使用され得る。
【0173】
[00183]rsSliceのslice_type、num_ref_idx_l0_active_minus1およびnum_ref_idx_l1_active_minus1は、それぞれrlPicの第1のスライスのslice_type、num_ref_idx_l0_active_minus1およびnum_ref_idx_l1_active_minus1の値に等しく設定される。rsSliceがPスライスまたはBスライスであるとき、両端値を含む、0からrsSliceのnum_ref_idx_l0_active_minus1までの範囲内にiがある場合、rsSliceの参照ピクチャリスト0中のインデックスiをもつ参照ピクチャは、rlPicの第1のスライスの参照ピクチャリスト0中のインデックスiをもつ参照ピクチャに等しく設定される。rsSliceがBスライスであるとき、両端値を含む、0からrsSliceのnum_ref_idx_l1_active_minus1までの範囲内にiがある場合、rsSliceの参照ピクチャリスト1中のインデックスiをもつ参照ピクチャは、rlPicの第1のスライスの参照ピクチャリスト1中のインデックスiをもつ参照ピクチャに等しく設定される。
【0174】
[00184]ここで、rsPicは再サンプリングされたレイヤ間参照であり、rsSliceはrsPicのスライスであり、rlPicは、対応する参照レイヤピクチャである。
代替実施形態
【0175】
[00185]他の実施形態では、単一スライスレイヤ間参照レイヤの生成は、対応する参照レイヤピクチャのすべてのスライスが同等のスライス情報(たとえば、参照ピクチャリスト)を有するとは限らない場合でも、依然として実行され得る。そのような実施形態では、たとえば、単一のスライスのスライスタイプは以下のように導出され得る。(1)対応する参照レイヤピクチャ中に少なくとも1つのBスライスがある場合、再サンプリングされた参照レイヤピクチャの生成されたスライスのスライスタイプはBスライスに等しく設定され、(2)参照レイヤピクチャ中にBスライスがない場合、および対応する参照レイヤピクチャ中に少なくとも1つのPスライスがある場合、再サンプリングされた参照レイヤピクチャの生成されたスライスのスライスタイプはPスライスに等しく設定され、(3)対応する参照レイヤピクチャ中にBスライスもPスライスも存在しない場合、再サンプリングされた参照レイヤピクチャの生成されたスライスのスライスタイプはIスライスに等しく設定される。
【0176】
[00186]また、そのような実施形態では、参照ピクチャリスト情報は以下のように導出され得る。(1)再サンプリングされた参照レイヤピクチャの生成されたスライスの、参照ピクチャリスト中の参照ピクチャの数を示すnum_ref_idx_l0_active_minus1が、対応する参照レイヤピクチャ中のすべてのスライスのうちの、num_ref_idx_l0_active_minus1の最大値を有するスライスのそれに等しく設定され、生成されたスライスの参照ピクチャリスト0が、num_ref_idx_l0_active_minus1の最大値を有する同じスライスのそれに等しく設定される。たとえば、復号ピクチャバッファが5つのピクチャを有し得、スライス#1がそれの参照ピクチャリスト中に2つの参照ピクチャを有し得、スライス#2がそれの参照ピクチャリスト中に4つの参照ピクチャを有し得る。その場合、スライス#2のnum_ref_idx_l0_active_minus1がより大きく、したがって、再サンプリングされた参照レイヤピクチャのために生成された単一のスライスの参照ピクチャリストは、参照レイヤピクチャのスライス#2の参照ピクチャリストに等しく設定される。
【0177】
[00187]複数のスライスがnum_ref_idx_l0_active_minus1の同じ値を有する場合、再サンプリングされた参照レイヤピクチャの生成されたスライスの参照ピクチャリスト0は、num_ref_idx_l0_active_minus1の最大値を有するすべてのスライスのうちの、最も小さいslice_segment_addressをもつスライスのそれに等しく設定される。(2)再サンプリングされた参照レイヤピクチャの生成されたスライスのnum_ref_idx_l1_active_minus1が、対応する参照レイヤピクチャ中のすべてのスライスのうちの、num_ref_idx_l1_active_minus1の最大値を有するスライスのそれに等しく設定され、再サンプリングされた参照レイヤピクチャの生成されたスライスの参照ピクチャリスト1が、num_ref_idx_l1_active_minus1の最大値を有する同じスライスのそれに等しく設定される。複数のスライスがnum_ref_idx_l1_active_minus1の同じ値を有する場合、生成されたスライスの参照ピクチャリスト1は、num_ref_idx_l1_active_minus1の最大値を有するすべてのスライスのうちの、最も小さいslice_segment_addressをもつスライスのそれに等しく設定される。
規範符号化器制約
【0178】
[00188]上記で説明したように、いくつかの実装形態では、レイヤ間参照ピクチャのスライスのスライスタイプおよび参照ピクチャリストが、現在レイヤ(たとえば、エンハンスメントレイヤ)中のブロックのためのTMVPを導出するときに使用される。したがって、対応する参照レイヤピクチャ中のすべてのスライスのスライスタイプおよび参照ピクチャリストが同等である場合、それらのスライスのスライス情報が同等であるので、再サンプリングされた参照レイヤピクチャのために単一のスライスが生成され得、単一のスライスのスライス情報が、対応する参照レイヤ中のスライスのいずれかから導出され得る。
【0179】
[00189]したがって、再サンプリングされた参照レイヤピクチャからTMVPを導出するときに、参照レイヤピクチャ中のスライスのスライス情報を互いに同等にすることが望ましいことがある。したがって、一実施形態では、コロケートされたピクチャを識別するために使用されるcollocated_ref_idxシンタックス要素に制限が課され得る。たとえば、再サンプリングされたレイヤ間参照ピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されるとき、対応する参照レイヤピクチャ中のすべてのスライスが、同等のスライスタイプと、同等の参照ピクチャリスト0と、同等の参照ピクチャリスト1とを有するものとする。それらの条件のいずれかが満たされない場合、制限は、そのようなレイヤ間参照ピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されないことを規定し得る。
【0180】
[00190]別の実施形態では、制限は、TMVP導出について、対応する参照レイヤピクチャ中のすべてのスライスが同等の参照ピクチャリスト0と(存在する場合)同等の参照ピクチャリスト1とを有するものとすることであり得る。この例では、スライスタイプはスライスの間で異なり得、再サンプリングされた参照レイヤピクチャの単一のスライスのスライスタイプは上記で説明したように決定され得る。これらの条件が満たされない場合、制限は、そのようなレイヤ間参照ピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されないことを規定し得る。
信号対雑音比(SNR)スケーラビリティ
【0181】
[00191]SNRスケーラビリティの場合、参照レイヤのピクチャフォーマット情報とエンハンスメントレイヤのピクチャフォーマット情報とは同等であり得、したがって、ピクチャ再サンプリングプロセスは必要でないことがあるか、または実行されないことがある。そのような場合、再構成または復号された参照レイヤピクチャがエンハンスメントレイヤの参照ピクチャとして直接使用され得る。参照レイヤピクチャのCTBサイズとエンハンスメントレイヤピクチャのCTBサイズとが異なり、参照レイヤピクチャが複数のスライスを有するとき、レイヤ間参照ピクチャのスライスパーティション境界はCTB境界と一致しないことがある。したがって、再構成または復号された参照レイヤピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されるとき、同様の問題が起こり得る。したがって、いくつかの実施形態では、レイヤ間動き予測が有効化される(または実行されることを可能にされる)前に、参照レイヤピクチャの複数のスライスの間で同等のスライス情報を必要とする制限が、SNRスケーラビリティの場合にも適用される。
【0182】
[00192]上記で説明したように、(再サンプリングされたまたは再サンプリングされない)レイヤ間参照ピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されるとき、対応する参照レイヤピクチャ中のすべてのスライスは、同等のスライスタイプと、同等の参照ピクチャリスト0と、同等の参照ピクチャリスト1とを有するものとするという制限が、コロケートされたピクチャを識別するために使用されるcollocated_ref_idxシンタックス要素に課され得る。これらの条件が満たされない場合、制限は、そのようなレイヤ間参照ピクチャが、TMVP導出のために、コロケートされたピクチャとして使用されないことを規定し得る。別の実施形態では、SNRスケーラビリティの場合、参照レイヤピクチャ中に複数のスライスがあり、複数のスライスのスライスタイプまたは参照ピクチャリストが同等でなく、エンハンスメントレイヤのCTBサイズと参照レイヤのCTBサイズとが異なるときのみ、制限が適用される。また別の実施形態では、SNRスケーラビリティの場合、参照レイヤピクチャ中に複数のスライスがあり、複数のスライスのスライスタイプまたは参照ピクチャリストが同等でなく、参照レイヤのCTBサイズがエンハンスメントレイヤのそれよりも小さいときのみ、制限が適用される。
他の考慮事項
【0183】
[00193]本明細書で開示する情報および信号は、多種多様な技術および技法のいずれかを使用して表され得る。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。
【0184】
[00194]本明細書で開示する実施形態に関して説明した様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップについて、上記では概してそれらの機能に関して説明した。そのような機能をハードウェアとして実装するか、ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の判定は、本発明の範囲からの逸脱を生じるものと解釈されるべきではない。
【0185】
[00195]本明細書で説明した技法は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセットおよび他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなど、様々なデバイスのいずれかにおいて実装され得る。モジュールまたは構成要素として説明した特徴は、集積論理デバイスに一緒に、または個別であるが相互運用可能な論理デバイスとして別々に実装され得る。ソフトウェアで実装した場合、本技法は、実行されたとき、上記で説明した方法のうちの1つまたは複数を実行する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージング材料を含むことがあるコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期型ダイナミックランダムアクセスメモリ(SDRAM)などのランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、フラッシュメモリ、磁気または光学データ記憶媒体など、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波など、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および/または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。
【0186】
[00196]プログラムコードは、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、または他の等価の集積回路またはディスクリート論理回路など、1つまたは複数のプロセッサを含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示で説明する技法のいずれかを実行するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、上記の構造の任意の組合せ、または本明細書で説明した技法の実装に好適な他の構造または装置のいずれかを指す。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のソフトウェアモジュールまたはハードウェアモジュール内に提供されるか、あるいは複合ビデオ符号化器/復号器(コーデック)に組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素において完全に実装され得る。
【0187】
[00197]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するために構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。
【0188】
[00198]本発明の様々な実施形態について説明した。これらおよび他の実施形態は以下
の特許請求の範囲内に入る。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオ情報をコーディングするように構成される装置であって、前記装置は、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶するように構成されるメモリ、前記参照レイヤは、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤは、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記メモリと通信しているプロセッサと
を備え、前記プロセッサは、
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記ILRPの前記単一のスライスのスライス情報を前記第1のスライスのスライス情報に等しく設定することと、
前記ELピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
を行うように構成される、装置。
[C2]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C1に記載の装置。
[C3]
前記単一のスライスの前記スライス情報は、前記単一のスライスのスライスタイプと前記単一のスライスの参照ピクチャリスト情報とを備える、
C1に記載の装置。
[C4]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C3に記載の装置。
[C5]
前記装置は、符号化器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を符号化するようにさらに構成される、
C1に記載の装置。
[C6]
前記装置は、復号器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を復号するようにさらに構成される、
C1に記載の装置。
[C7]
前記装置は、コンピュータと、ノートブックと、ラップトップと、コンピュータと、タブレットコンピュータと、セットトップボックスと、電話ハンドセットと、スマートフォンと、スマートパッドと、テレビジョンと、カメラと、ディスプレイデバイスと、デジタルメディアプレーヤと、ビデオゲームコンソールと、車内コンピュータとのうちの1つまたは複数なるグループから選択されるデバイスを備える、
C1に記載の装置。
[C8]
ビデオ情報をコーディングする方法であって、前記方法は、
第1のスライスと第2のスライスとを有する参照レイヤ中の参照レイヤ(RL)ピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記ILRPの前記単一のスライスのスライス情報を前記第1のスライスのスライス情報に等しく設定することと、
エンハンスメントレイヤ中のエンハンスメントレイヤ(EL)ピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
を備える、方法。
[C9]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C8に記載の方法。
[C10]
前記単一のスライスの前記スライス情報は、前記単一のスライスのスライスタイプと前記単一のスライスの参照ピクチャリスト情報とを備える、
C8に記載の方法。
[C11]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C10に記載の方法。
[C12]
実行されたとき、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶すること、前記参照レイヤは、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤが、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記ILRPの前記単一のスライスのスライス情報を前記第1のスライスのスライス情報に等しく設定することと、
前記ELピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
を備えるプロセスを装置に実行させるコードを備える、非一時的コンピュータ可読媒体。
[C13]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C12に記載のコンピュータ可読媒体。
[C14]
ビデオ情報をコーディングするように構成されるビデオコーディングデバイスであって、前記ビデオコーディングデバイスは、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶するための手段、前記参照レイヤは、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤは、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成するための手段、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記ILRPの前記単一のスライスのスライス情報を前記第1のスライスのスライス情報に等しく設定することと、
前記ELピクチャの少なくとも一部分をコーディングするために前記ILRPを使用するための手段と
を備える、ビデオコーディングデバイス。
[C15]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C14に記載のビデオコーディングデバイス。
[C16]
ビデオ情報をコーディングするように構成される装置であって、前記装置は、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶するように構成されるメモリ、前記参照レイヤは、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤが、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記メモリと通信しているプロセッサと
を備え、前記プロセッサは、
前記第1のスライスの第1のスライス情報と前記第2のスライスの第2のスライス情報とが同等であるかどうかを決定することと、
前記第1のスライス情報と前記第2のスライス情報とが同等であると決定したことに応答して、エンハンスメントレイヤ(EL)ピクチャの少なくとも一部分をコーディングするためのレイヤ間動き予測を有効化することと
を行うように構成される、装置。
[C17]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C16に記載の装置。
[C18]
前記第1のスライス情報は、前記第1のスライスのスライスタイプと前記第1のスライスの参照ピクチャリスト情報とを備え、前記第2のスライス情報は、前記第2のスライスのスライスタイプと前記第2のスライスの参照ピクチャリスト情報とを備える、
C16に記載の装置。
[C19]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C18に記載の装置。
[C20]
前記プロセッサは、
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成することと、前記ILRPが、それに関連付けられた単一のスライスを有する、
前記単一のスライスの第3のスライス情報を前記第1および第2のスライス情報のうちの1つに等しく設定することと、
前記ELピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
を行うようにさらに構成される、C16に記載の装置。
[C21]
前記装置は、符号化器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を符号化するようにさらに構成される、
C16に記載の装置。
[C22]
前記装置は、復号器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を復号するようにさらに構成される、
C16に記載の装置。
[C23]
前記装置は、コンピュータと、ノートブックと、ラップトップと、コンピュータと、タブレットコンピュータと、セットトップボックスと、電話ハンドセットと、スマートフォンと、スマートパッドと、テレビジョンと、カメラと、ディスプレイデバイスと、デジタルメディアプレーヤと、ビデオゲームコンソールと、車内コンピュータとのうちの1つまたは複数なるグループから選択されるデバイスを備える、
C16に記載の装置。
[C24]
ビデオ情報をコーディングする方法であって、前記方法は、
参照レイヤ(RL)ピクチャの第1のスライスの第1のスライス情報と前記RLピクチャの第2のスライスの第2のスライス情報とが同等であるかどうかを決定することと、
前記第1のスライス情報と前記第2のスライス情報とが同等であると決定したことに応答して、エンハンスメントレイヤ(EL)ピクチャの少なくとも一部分をコーディングするためのレイヤ間動き予測を有効化することと
を備える、方法。
[C25]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C24に記載の方法。
[C26]
前記第1のスライス情報は、前記第1のスライスのスライスタイプと前記第1のスライスの参照ピクチャリスト情報とを備え、前記第2のスライス情報は、前記第2のスライスのスライスタイプと前記第2のスライスの参照ピクチャリスト情報とを備える、
C24に記載の方法。
[C27]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C26に記載の方法。
[C28]
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPが、それに関連付けられた単一のスライスを有する、と、
前記単一のスライスの第3のスライス情報を前記第1および第2のスライス情報のうちの1つに等しく設定することと、
前記ELピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
をさらに備える、C24に記載の方法。
[C29]
ビデオ情報をコーディングするように構成される装置であって、前記装置は、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶するように構成されるメモリ、前記参照レイヤは、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤは、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記メモリと通信しているプロセッサと
を備え、前記プロセッサは、
前記第1のスライスの第1のスライス情報と前記第2のスライスの第2のスライス情報とが同等であるかどうかを決定することと、
前記第1のスライス情報と前記第2のスライス情報とが同等でないと決定したことに応答して、前記ELピクチャをコーディングするためのレイヤ間動き予測を無効化することと
を行うように構成される、装置。
[C30]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C29に記載の装置。
[C31]
前記第1のスライス情報は、前記第1のスライスのスライスタイプと前記第1のスライスの参照ピクチャリスト情報とを備え、前記第2のスライス情報は、前記第2のスライスのスライスタイプと前記第2のスライスの参照ピクチャリスト情報とを備える、
C29に記載の装置。
[C32]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C31に記載の装置。
[C33]
前記装置は、符号化器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を符号化するようにさらに構成される、
C29に記載の装置。
[C34]
前記装置は、復号器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を復号するようにさらに構成される、
C29に記載の装置。
[C35]
前記装置は、コンピュータと、ノートブックと、ラップトップと、コンピュータと、タブレットコンピュータと、セットトップボックスと、電話ハンドセットと、スマートフォンと、スマートパッドと、テレビジョンと、カメラと、ディスプレイデバイスと、デジタルメディアプレーヤと、ビデオゲームコンソールと、車内コンピュータとのうちの1つまたは複数なるグループから選択されるデバイスを備える、
C29に記載の装置。
[C36]
ビデオ情報をコーディングする方法であって、前記方法は、
参照レイヤ(RL)ピクチャの第1のスライスの第1のスライス情報と前記RLピクチャの第2のスライスの第2のスライス情報とが同等であるかどうかを決定することと、
前記第1のスライス情報と前記第2のスライス情報とが同等でないと決定したことに応答して、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャをコーディングするためのレイヤ間動き予測を無効化することと
を備える、方法。
[C37]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C36に記載の方法。
[C38]
前記第1のスライス情報は、前記第1のスライスのスライスタイプと前記第1のスライスの参照ピクチャリスト情報とを備え、前記第2のスライス情報は、前記第2のスライスのスライスタイプと前記第2のスライスの参照ピクチャリスト情報とを備える、
C36に記載の方法。
[C39]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C38に記載の方法。
[C40]
ビデオ情報をコーディングするように構成される装置であって、前記装置は、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶するように構成されるメモリ、前記参照レイヤが、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤが、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記メモリと通信しているプロセッサと
を備え、前記プロセッサは、
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPが、それに関連付けられた単一のスライスを有する、と、
前記第1のスライスのスライスタイプと前記第2のスライスのスライスタイプとが異なるかどうかを決定することと、
前記第1のスライスの前記スライスタイプと前記第2のスライスの前記スライスタイプとが異なると決定したことに応答して、
前記第1および第2のスライスのうちの少なくとも1つがBスライスである場合、前記ILRPの前記単一のスライスのスライスタイプをBスライスに等しく設定することと、
前記第1および第2のスライスのうちの少なくとも1つがPスライスであり、前記第1および第2のスライスのいずれもBスライスでない場合、前記ILRPの前記単一のスライスの前記スライスタイプをPスライスに等しく設定することと、
前記第1および第2のスライスが両方ともIスライスである場合、前記ILRPの前記単一のスライスの前記スライスタイプをIスライスに等しく設定することと
を行うように構成される、装置。
[C41]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C40に記載の装置。
[C42]
前記装置は、符号化器を備え、前記プロセッサは、ビデオビットストリーム中で前記ビデオ情報を符号化するようにさらに構成される、
C40に記載の装置。
[C43]
前記装置は、復号器を備え、前記プロセッサが、ビデオビットストリーム中で前記ビデオ情報を復号するようにさらに構成される、
C40に記載の装置。
[C44]
前記装置は、コンピュータと、ノートブックと、ラップトップと、コンピュータと、タブレットコンピュータと、セットトップボックスと、電話ハンドセットと、スマートフォンと、スマートパッドと、テレビジョンと、カメラと、ディスプレイデバイスと、デジタルメディアプレーヤと、ビデオゲームコンソールと、車内コンピュータとのうちの1つまたは複数なるグループから選択されるデバイスを備える、
C40に記載の装置。
[C45]
ビデオ情報をコーディングする方法であって、前記方法は、
第1のスライスと第2のスライスとを有する参照レイヤ中の参照レイヤ(RL)ピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記第1のスライスのスライスタイプと前記第2のスライスのスライスタイプとが異なるかどうかを決定することと、
前記第1のスライスの前記スライスタイプと前記第2のスライスの前記スライスタイプとが異なると決定したことに応答して、
前記第1および第2のスライスのうちの少なくとも1つがBスライスである場合、前記ILRPの前記単一のスライスのスライスタイプをBスライスに等しく設定することと、
前記第1および第2のスライスのうちの少なくとも1つがPスライスであり、前記第1および第2のスライスのいずれもBスライスでない場合、前記ILRPの前記単一のスライスの前記スライスタイプをPスライスに等しく設定することと、
前記第1および第2のスライスが両方ともIスライスである場合、前記ILRPの前記単一のスライスの前記スライスタイプをIスライスに等しく設定することと
を備える、方法。
[C46]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C45に記載の方法。
[C47]
ビデオ情報をコーディングするように構成される装置であって、前記装置は、
参照レイヤとエンハンスメントレイヤとに関連付けられたビデオ情報を記憶するように構成されるメモリ、前記参照レイヤは、第1のスライスと第2のスライスとを有する参照レイヤ(RL)ピクチャを備え、前記エンハンスメントレイヤは、前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャを備える、と、
前記メモリと通信しているプロセッサと
を備え、前記プロセッサは、
前記RLピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記ILRPの前記単一のスライスのスライス情報を前記第1のスライスのスライス情報に等しく設定することと、
前記RLピクチャの前記第2のスライスに対応する前記ILRPの一部分に関連付けられた動き情報中の不正確さを補正するために、前記動き情報を修正することと、
前記ELピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
を行うように構成される、装置。
[C48]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C47に記載の装置。
[C49]
前記単一のスライスの前記スライス情報は、前記単一のスライスのスライスタイプと前記単一のスライスの参照ピクチャリスト情報とを備える、
C47に記載の装置。
[C50]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C49に記載の装置。
[C51]
前記動き情報は、第1の動きベクトルと第1の参照インデックスとを含み、前記動き情報を修正することは、前記RLピクチャの前記第1のスライスに関連付けられた第1の参照ピクチャリスト中の、前記第1の参照インデックスに等しい参照インデックスを有する第1の参照ピクチャと、前記RLピクチャの前記第2のスライスに関連付けられた第2の参照ピクチャリスト中の、前記第1の参照インデックスに等しい参照インデックスを有する第2の参照ピクチャとに少なくとも部分的に基づいて、前記第1の動きベクトルを時間的にスケーリングすることを備える、
C47に記載の装置。
[C52]
前記動き情報は、動きベクトルと参照インデックスとを含み、前記動き情報を修正することは、修正された参照インデックスが、前記RLピクチャの前記第2のスライスに関連付けられた参照ピクチャリスト中の、前記修正された参照インデックスに等しい参照インデックスを有する参照ピクチャを識別するように、前記参照インデックスを修正することを備える、
C47に記載の装置。
[C53]
前記装置は、符号化器を備え、前記プロセッサが、ビデオビットストリーム中で前記ビデオ情報を符号化するようにさらに構成される、
C47に記載の装置。
[C54]
前記装置は、復号器を備え、前記プロセッサが、ビデオビットストリーム中で前記ビデオ情報を復号するようにさらに構成される、
C47に記載の装置。
[C55]
前記装置は、コンピュータと、ノートブックと、ラップトップと、コンピュータと、タブレットコンピュータと、セットトップボックスと、電話ハンドセットと、スマートフォンと、スマートパッドと、テレビジョンと、カメラと、ディスプレイデバイスと、デジタルメディアプレーヤと、ビデオゲームコンソールと、車内コンピュータとのうちの1つまたは複数なるグループから選択されるデバイスを備える、
C47に記載の装置。
[C56]
ビデオ情報をコーディングする方法であって、前記方法は、
第1のスライスと第2のスライスとを有する参照レイヤ中の参照レイヤ(RL)ピクチャをアップサンプリングすることによってレイヤ間参照ピクチャ(ILRP)を生成すること、前記ILRPは、それに関連付けられた単一のスライスを有する、と、
前記ILRPの前記単一のスライスのスライス情報を前記第1のスライスのスライス情報に等しく設定することと、
前記RLピクチャの前記第2のスライスに対応する前記ILRPの一部分に関連付けられた動き情報中の不正確さを補正するために、前記動き情報を修正することと、
前記RLピクチャに対応するエンハンスメントレイヤ(EL)ピクチャの少なくとも一部分をコーディングするために前記ILRPを使用することと
を備える、方法。
[C57]
前記ELピクチャと前記RLピクチャとは、同じアクセスユニット中にある、
C56に記載の方法。
[C58]
前記単一のスライスの前記スライス情報は、前記単一のスライスのスライスタイプと前記単一のスライスの参照ピクチャリスト情報とを備える、
C56に記載の方法。
[C59]
参照ピクチャリスト情報は、
参照ピクチャリスト0中の参照ピクチャの第1の数と、
前記参照ピクチャリスト0中の前記参照ピクチャと参照ピクチャインデックスの第1のセットとの間の第1の関連付けと、
参照ピクチャリスト1中の参照ピクチャの第2の数と、
前記参照ピクチャリスト1中の前記参照ピクチャと参照ピクチャインデックスの第2のセットとの間の第2の関連付けと
を備える、C58に記載の方法。
[C60]
前記動き情報は、第1の動きベクトルと第1の参照インデックスとを含み、前記動き情報を修正することは、前記RLピクチャの前記第1のスライスに関連付けられた第1の参照ピクチャリスト中の、前記第1の参照インデックスに等しい参照インデックスを有する第1の参照ピクチャと、前記RLピクチャの前記第2のスライスに関連付けられた第2の参照ピクチャリスト中の、前記第1の参照インデックスに等しい参照インデックスを有する第2の参照ピクチャとに少なくとも部分的に基づいて、前記第1の動きベクトルを時間的にスケーリングすることを備える、
C56に記載の方法。
[C61]
前記動き情報は、動きベクトルと参照インデックスとを含み、前記動き情報を修正することは、修正された参照インデックスが、前記RLピクチャの前記第2のスライスに関連付けられた参照ピクチャリスト中の、前記修正された参照インデックスに等しい参照インデックスを有する参照ピクチャを識別するように、前記参照インデックスを修正することを備える、
C56に記載の方法。