特許7635341 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特許7635341映像コーディングにおける参照ピクチャリサンプリングに対する双方向オプティカルフロー（ＢＩＯ）コーディングツールの取扱い

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-02-14

(45)【発行日】2025-02-25

(54)【発明の名称】映像コーディングにおける参照ピクチャリサンプリングに対する双方向オプティカルフロー（ＢＩＯ）コーディングツールの取扱い

(51)【国際特許分類】

H04N 19/109 20140101AFI20250217BHJP

H04N 19/157 20140101ALI20250217BHJP

H04N 19/174 20140101ALI20250217BHJP

H04N 19/176 20140101ALI20250217BHJP

H04N 19/70 20140101ALI20250217BHJP

【ＦＩ】

H04N19/109

H04N19/157

H04N19/174

H04N19/176

H04N19/70

【請求項の数】 30

【外国語出願】

(21)【出願番号】P 2023191422

(22)【出願日】2023-11-09

(62)【分割の表示】P 2021568304の分割

【原出願日】2020-05-14

(65)【公開番号】P2024012555

(43)【公開日】2024-01-30

【審査請求日】2023-11-27

(31)【優先権主張番号】62/848,409

(32)【優先日】2019-05-15

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】503433420

【氏名又は名称】華為技術有限公司

【氏名又は名称原語表記】ＨＵＡＷＥＩＴＥＣＨＮＯＬＯＧＩＥＳＣＯ．，ＬＴＤ．

【住所又は居所原語表記】ＨｕａｗｅｉＡｄｍｉｎｉｓｔｒａｔｉｏｎＢｕｉｌｄｉｎｇ，Ｂａｎｔｉａｎ，ＬｏｎｇｇａｎｇＤｉｓｔｒｉｃｔ，Ｓｈｅｎｚｈｅｎ，Ｇｕａｎｇｄｏｎｇ５１８１２９，Ｐ．Ｒ．Ｃｈｉｎａ

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】チェン，ジエンローァ

(72)【発明者】

【氏名】ヘンドリー，フヌ

(72)【発明者】

【氏名】ワーン，イエ－クイ

【審査官】田中純一

(56)【参考文献】

【文献】特表２０２２－５３１９６５（ＪＰ，Ａ）

【文献】特表２０１８－５３６３２０（ＪＰ，Ａ）

【文献】米国特許出願公開第２０２２／０２６４０８６（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ７／１２

Ｈ０４Ｎ１９／００－１９／９８

ＩＥＥＥＸｐｌｏｒｅ

(57)【特許請求の範囲】

【請求項1】

ビデオデコーダによって実装される、映像ビットストリームを復号する方法であって、
前記映像ビットストリームから復号すべき現在ピクチャに対応する符号化データを有するビットストリームを受信することと、
前記現在ピクチャを複数のスライスにパーティショニングすることと、
各スライスを複数のブロックにパーティショニングすることと、
前記映像ビットストリームからsps_bdof_enabled_flagを復号することであり、０に等しいsps_bdof_enabled_flagは、双方向オプティカルフロー（ＢＤＯＦ）インター予測が無効にされることを規定し、１に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦインター予測が有効にされることを規定する、復号することと、
復号している現在ピクチャの解像度が、前記現在ピクチャに関連する参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定することであり、前記現在ピクチャに対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされている、決定することと、
以下の条件の全てが真であるとき、すなわち、前記現在ピクチャの前記解像度が前記参照ピクチャの各々の前記解像度と同じであると決定され、且つmerge_subblock_flagが存在しないとき、前記現在ピクチャの現在ブロックに対して前記ＢＤＯＦを有効にすることと、
前記現在ピクチャの前記解像度が前記参照ピクチャのうちのいずれかの前記解像度と異なると決定されたとき、前記現在ピクチャの前記現在ブロックに対して前記ＢＤＯＦを無効にすることと、
前記映像ビットストリームから前記現在ブロックを復号することと、
を有する方法。

【請求項2】

前記ＢＤＯＦを有効にすることは、ＢＤＯＦフラグを第１の値に設定することを有し、前記ＢＤＯＦを無効にすることは、前記ＢＤＯＦフラグを第２の値に設定することを有する、請求項１に記載の方法。

【請求項3】

双方向インター予測モードに従って、前記参照ピクチャリストに基づいて、前記現在ピクチャに対する前記参照ピクチャを生成すること、を更に有する請求項１乃至２のいずれか一項に記載の方法。

【請求項4】

複数のピクチャ内のブロックに対して、各ピクチャの前記解像度が前記ピクチャに関連する参照ピクチャの前記解像度と異なるのか、それとも同じであるのかに応じて、前記ＢＤＯＦを選択的に有効にする及び無効にすること、を更に有する請求項１乃至３のいずれか一項に記載の方法。

【請求項5】

前記ＢＤＯＦが無効にされるとき、前記現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）を有効にすること、を更に有する請求項１乃至４のいずれか一項に記載の方法。

【請求項6】

前記現在ピクチャの前記解像度は、前記映像ビットストリームのパラメータセット内に配され、前記現在ブロックは、前記現在ピクチャのスライスから取得される、請求項１乃至５のいずれか一項に記載の方法。

【請求項7】

前記現在ブロックを用いて生成された画像を、エレクトロニクス装置のディスプレイ上に表示すること、を更に有する請求項１乃至６のいずれか一項に記載の方法。

【請求項8】

ビデオエンコーダによって実装される、映像ビットストリームを符号化する方法であって、
符号化すべき現在ピクチャを取得することと、
前記現在ピクチャを複数のスライスにパーティショニングすることと、
各スライスを複数のブロックにパーティショニングすることと、
符号化している現在ピクチャの解像度が、前記現在ピクチャに関連する参照ピクチャリストにおいて特定される参照ピクチャの解像度と同じであるかを決定することであり、前記現在ピクチャに対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされている、決定することと、
以下の条件の全てが真であるとき、すなわち、前記現在ピクチャの前記解像度が前記参照ピクチャの各々の前記解像度と同じであると決定され、且つmerge_subblock_flagが存在しないとき、前記現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にすることと、
前記現在ピクチャの前記解像度が前記参照ピクチャのうちのいずれかの前記解像度と異なると決定されたとき、前記現在ピクチャの前記現在ブロックに対して前記ＢＤＯＦを無効にすることと、
sps_bdof_enabled_flagを前記映像ビットストリームに符号化することであり、０に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦが無効にされることを規定し、１に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦが有効にされることを規定する、符号化することと、
前記現在ブロックを前記映像ビットストリームに符号化することと、
を有する方法。

【請求項9】

当該方法は更に、
前記参照ピクチャに基づいて前記現在ピクチャに関する動きベクトルを決定することと、
前記動きベクトルに基づいて前記現在ピクチャを符号化することと、
を有する、請求項８に記載の方法。

【請求項10】

前記ＢＤＯＦを有効にすることは、ＢＤＯＦフラグを第１の値に設定することを有し、前記ＢＤＯＦを無効にすることは、前記ＢＤＯＦフラグを第２の値に設定することを有する、請求項８乃至９のいずれか一項に記載の方法。

【請求項11】

双方向インター予測モードに従って、参照ピクチャリストに基づいて、前記現在ピクチャに対する前記参照ピクチャを生成すること、を更に有する請求項８乃至１０のいずれか一項に記載の方法。

【請求項12】

複数のピクチャ内のブロックに対して、各ピクチャの前記解像度が前記ピクチャに関連する参照ピクチャの前記解像度と異なるのか、それとも同じであるのかに応じて、前記ＢＤＯＦを選択的に有効にする及び無効にすること、を更に有する請求項８乃至１１のいずれか一項に記載の方法。

【請求項13】

前記ＢＤＯＦが無効にされるときであっても、前記現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）を有効にすること、を更に有する請求項８乃至１２のいずれか一項に記載の方法。

【請求項14】

前記現在ブロックを含む前記映像ビットストリームをビデオデコーダに向けて送信すること、を更に有する請求項８乃至請求項１３のいずれか一項に記載の方法。

【請求項15】

復号装置であって、
コーディングされた映像ビットストリームを受信するように構成された受信器と、
前記受信器に結合されたメモリであり、命令を格納したメモリと、
前記メモリに結合されたプロセッサであり、前記命令を実行して当該復号装置に、
前記映像ビットストリームから復号すべき現在ピクチャに対応する符号化データを有するビットストリームを受信させ、
前記現在ピクチャを複数のスライスにパーティショニングさせ、
各スライスを複数のブロックにパーティショニングさせ、
前記映像ビットストリームからsps_bdof_enabled_flagを復号させ、０に等しいsps_bdof_enabled_flagは、双方向オプティカルフロー（ＢＤＯＦ）インター予測が無効にされることを規定し、１に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦインター予測が有効にされることを規定し、
復号している現在ピクチャの解像度が、前記現在ピクチャに関連する参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定させ、前記現在ピクチャに対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされており、
以下の条件の全てが真であるとき、すなわち、前記現在ピクチャの前記解像度が前記参照ピクチャの各々の前記解像度と同じであると決定され、且つmerge_subblock_flagが存在しないとき、前記現在ピクチャの現在ブロックに対して前記ＢＤＯＦを有効にさせ、
前記現在ピクチャの前記解像度が前記参照ピクチャのうちのいずれかの前記解像度と異なると決定されたとき、前記現在ピクチャの前記現在ブロックに対して前記ＢＤＯＦを無効にさせ、
前記映像ビットストリームから前記現在ブロックを復号させる、
ように構成されたプロセッサと、
を有する復号装置。

【請求項16】

前記ＢＤＯＦが無効にされるとき、前記現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされる、請求項１５に記載の復号装置。

【請求項17】

前記現在ブロックに基づいて生成された画像を表示するように構成されたディスプレイ、を更に有する請求項１５乃至１６のいずれか一項に記載の復号装置。

【請求項18】

符号化装置であって、
命令を格納したメモリと、
前記メモリに結合されたプロセッサであり、前記命令を実装して当該符号化装置に、
符号化すべき現在ピクチャを取得させ、
前記現在ピクチャを複数のスライスにパーティショニングさせ、
各スライスを複数のブロックにパーティショニングさせ、
符号化している現在ピクチャの解像度が、前記現在ピクチャに関連する参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定させ、前記現在ピクチャに対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされており、
以下の条件の全てが真であるとき、すなわち、前記現在ピクチャの前記解像度が前記参照ピクチャの各々の前記解像度と同じであると決定され、且つmerge_subblock_flagが存在しないとき、前記現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にさせ、
前記現在ピクチャの前記解像度が前記参照ピクチャのうちのいずれかの前記解像度と異なると決定されたとき、前記現在ピクチャの前記現在ブロックに対して前記ＢＤＯＦを無効にさせ、
sps_bdof_enabled_flagを映像ビットストリームに符号化させ、０に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦが無効にされることを規定し、１に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦが有効にされることを規定し、
前記現在ブロックを前記映像ビットストリームに符号化させる、
ように構成されたプロセッサと、
前記プロセッサに結合された送信器であり、前記現在ブロックを含む映像ビットストリームをビデオデコーダに向けて送信するように構成された送信器と、
を有する符号化装置。

【請求項19】

前記ＢＤＯＦが無効にされるときであっても、前記現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされる、請求項１８に記載の符号化装置。

【請求項20】

前記送信器が前記映像ビットストリームを前記ビデオデコーダに向けて送信することに先立って、前記メモリが前記映像ビットストリームを格納する、請求項１８乃至１９のいずれか一項に記載の符号化装置。

【請求項21】

復号するビットストリームを受信するように構成された受信器と、
前記受信器に結合された送信器であり、復号された画像をディスプレイに送信するように構成された送信器と、
前記受信器又は前記送信器のうちの少なくとも一方に結合されたメモリであり、命令を格納するように構成されたメモリと、
前記メモリに結合されたプロセッサであり、前記メモリに格納された前記命令を実行して、請求項１乃至７のいずれか一項に記載の方法を実行するように構成されたプロセッサと、
を有するコーディング装置。

【請求項22】

画像を表示するように構成されたディスプレイ、を更に有する請求項２１に記載のコーディング装置。

【請求項23】

ビットストリームに符号化するピクチャを受信するように構成された受信器と、
前記受信器に結合された送信器であり、前記ビットストリームをデコーダに送信するように構成された送信器と、
前記受信器又は前記送信器のうちの少なくとも一方に結合されたメモリであり、命令を格納するように構成されたメモリと、
前記メモリに結合されたプロセッサであり、前記メモリに格納された前記命令を実行して、請求項８乃至１４のいずれか一項に記載の方法を実行するように構成されたプロセッサと、
を有するコーディング装置。

【請求項24】

エンコーダと、
前記エンコーダと通信するデコーダと、
を有し、前記エンコーダが、請求項１８乃至２０のいずれか一項に記載の符号化装置を含み、前記デコーダが、請求項１５乃至１７のいずれか一項に記載の復号装置を含む、
システム。

【請求項25】

復号するビットストリームを受信するように構成された受信手段と、
前記受信手段に結合された送信手段であり、復号された画像を表示手段に送信するように構成された送信手段と、
前記受信手段又は前記送信手段のうちの少なくとも一方に結合されたストレージ手段であり、命令を格納するように構成されたストレージ手段と、
前記ストレージ手段に結合されたプロセッシング手段であり、前記ストレージ手段に格納された前記命令を実行して、請求項１乃至７のいずれか一項に記載の方法を実行するように構成されたプロセッシング手段と、
を有するコーディングのための手段。

【請求項26】

ビットストリームに符号化するピクチャを受信するように構成された受信手段と、
前記受信手段に結合された送信手段であり、前記ビットストリームを復号手段に送信するように構成された送信手段と、
前記受信手段又は前記送信手段のうちの少なくとも一方に結合されたストレージ手段であり、命令を格納するように構成されたストレージ手段と、
前記ストレージ手段に結合されたプロセッシング手段であり、前記ストレージ手段に格納された前記命令を実行して、請求項８乃至１４のいずれか一項に記載の方法を実行するように構成されたプロセッシング手段と、
を有するコーディングのための手段。

【請求項27】

請求項１乃至１４のいずれか一項に記載の方法を実行するプロセッシング回路を有するコーダ。

【請求項28】

プロセッサによって実行されることが可能なコンピュータプログラムを格納したコンピュータ読み取り可能記憶媒体であって、前記コンピュータプログラムが前記プロセッサによって実行されるとき、前記プロセッサが請求項１乃至１４のいずれか一項に記載の方法を実行する、コンピュータ読み取り可能記憶媒体。

【請求項29】

プロセッサによって実装される、映像ビットストリームを格納する方法であって、
符号化している現在ピクチャの解像度が、前記現在ピクチャに関連する参照ピクチャリストにおいて特定される参照ピクチャの解像度と同じであるかを決定することであり、前記現在ピクチャに対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされている、決定することと、
以下の条件の全てが真であるとき、すなわち、前記現在ピクチャの前記解像度が前記参照ピクチャの各々の前記解像度と同じであると決定され、且つmerge_subblock_flagが存在しないとき、前記現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にすることと、
前記現在ピクチャの前記解像度が前記参照ピクチャのうちのいずれかの前記解像度と異なると決定されたとき、前記現在ピクチャの前記現在ブロックに対して前記ＢＤＯＦを無効にすることと、
sps_bdof_enabled_flagを前記映像ビットストリームに符号化することであり、０に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦが無効にされることを規定し、１に等しいsps_bdof_enabled_flagは、前記ＢＤＯＦが有効にされることを規定する、符号化することと、
前記現在ブロックを前記映像ビットストリームに符号化することと、
前記映像ビットストリームを記憶媒体に格納することと、
を有する方法。

【請求項30】

コンピュータ又はプロセッサ上で実行されるときに請求項１乃至１４のいずれか一項に記載の方法を実行するためのプログラムコードを有するプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

この特許出願は、Jianle Chenらにより２０１９年５月１５日に出願された、“Handling of Bi-Directional Optical Flow (BIO) Coding Tool for Reference Picture Resampling in Video Coding”と題された米国仮特許出願第６２／８４８，４０９号の利益を主張するものであり、それをここに援用する。

【0002】

概して、この開示は、映像コーディングにおいて双方向オプティカルフロー（bi-direction optical flow；ＢＤＯＦ）をサポートするための技術を記述する。より具体的には、この開示は、参照ピクチャリサンプリングに対してＢＤＯＦを可能にするが、現在ピクチャと参照ピクチャの空間解像度が異なるときにブロック又はサンプルに対してＢＤＯＦが無効にされることを許す。

【背景技術】

【0003】

比較的短い映像であってもそれを描写するために必要とされる映像データの量はかなりになり得るものであり、それが、限られた帯域幅容量を持つ通信ネットワークを介してデータをストリーミングする又はその他の方法で通信するときに困難をもたらし得る。従って、映像データは一般に、今日の遠隔通信ネットワークを介して通信される前に圧縮される。映像のサイズはまた、メモリリソースが限られ得るために、映像がストレージ装置に格納されるときにも問題となり得る。映像圧縮装置は、しばしば、伝送又は記憶に先立って、ソースにてソフトウェア及び／又はハードウェアを用いて映像データをコーディングし、それにより、デジタル映像画像を表すのに必要なデータの量を減少させる。そして、圧縮されたデータが、送り先で、映像データを復号する映像解凍装置によって受信される。限られたネットワークリソースと、増加の一途をたどるいっそう高い映像品質の要求とに伴い、画質の犠牲を殆ど乃至は全く伴わずに圧縮比を向上させる改良された圧縮及び解凍技術が望ましい。

【発明の概要】

【0004】

第１の態様は、ビデオデコーダによって実装される、コーディングされた映像ビットストリームを復号する方法に関する。当該方法は、ビデオデコーダにより、復号している現在ピクチャの解像度が、現在ピクチャに関連する参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定することと、現在ピクチャの解像度が参照ピクチャの各々の解像度と同じであると決定されたとき、ビデオデコーダにより、現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にすることと、現在ピクチャの解像度が参照ピクチャのうちのいずれかの解像度と異なると決定されたとき、ビデオデコーダにより、現在ピクチャの現在ブロックに対してＢＤＯＦを無効にすることと、現在ブロックに対してＢＤＯＦが有効にされるとき、ビデオデコーダにより、ＢＤＯＦを用いて現在ブロックに対応する動きベクトルを精緻化することと、を含む。

【0005】

当該方法は、参照ピクチャリサンプリング（ＲＰＲ）が有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にする技術を提供する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、プロセッサ、メモリ、及び／又はネットワークリソースの使用が、エンコーダ及びデコーダの双方で削減され得る。従って、映像コーディングにおけるコーダ／デコーダ（“コーデック”としても知られる）が、現行コーデックに対して改善される。実際問題として、改善された映像コーディングプロセスは、映像が送信され、受信され、及び／又は見られるときに、ユーザにより良いユーザ体験を提供する。

【0006】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ＢＤＯＦを有効にすることが、ＢＤＯＦフラグを第１の値に設定することを有し、ＢＤＯＦを無効にすることが、ＢＤＯＦフラグを第２の値に設定することを有する、ことを提供する。

【0007】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、双方向インター予測モードに従って、参照ピクチャリストに基づいて、現在ピクチャに対する参照ピクチャを生成すること、を提供する。

【0008】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、複数のピクチャ内のブロックに対して、各ピクチャの解像度がピクチャに関連する参照ピクチャの解像度と異なるのか、それとも同じであるのかに応じて、ＢＤＯＦを選択的に有効にする及び無効にすること、を提供する。

【0009】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ＢＤＯＦが無効にされるとき、現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）を有効にすること、を提供する。

【0010】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、現在ピクチャの解像度が、コーディングされた映像ビットストリームのパラメータセット内に配され、現在ブロックが、現在ピクチャのスライスから取得される、ことを提供する。

【0011】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、現在ブロックを用いて生成された画像を、エレクトロニクス装置のディスプレイ上に表示すること、を提供する。

【0012】

第２の態様は、ビデオエンコーダによって実装される、映像ビットストリームを符号化する方法に関する。当該方法は、ビデオエンコーダにより、符号化している現在ピクチャの解像度が、現在ピクチャに関連する参照ピクチャリストにおいて特定される参照ピクチャの解像度と同じであるかを決定することと、現在ピクチャの解像度が参照ピクチャの各々の解像度と同じであると決定されたとき、ビデオエンコーダにより、現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にすることと、現在ピクチャの解像度が参照ピクチャのうちのいずれかの解像度と異なると決定されたとき、ビデオエンコーダにより、現在ピクチャの現在ブロックに対してＢＤＯＦを無効にすることと、現在ブロックに対してＢＤＯＦが有効にされるとき、ビデオエンコーダにより、ＢＤＯＦを用いて現在ブロックに対応する動きベクトルを精緻化することと、を含む。

【0013】

【0014】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ビデオエンコーダにより、参照ピクチャに基づいて現在ピクチャに関する動きベクトルを決定することと、ビデオエンコーダにより、動きベクトルに基づいて現在ピクチャを符号化することと、ビデオエンコーダにより、仮説的リファレンスデコーダを用いて現在ピクチャを復号することと、を提供する。

【0015】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ＢＤＯＦを有効にすることは、ＢＤＯＦフラグを第１の値に設定することを有し、ＢＤＯＦを無効にすることは、ＢＤＯＦフラグを第２の値に設定することを有する、ことを提供する。

【0016】

【0017】

【0018】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ＢＤＯＦが無効にされるときであっても、現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）を有効にすること、を提供する。

【0019】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、現在ブロックを含む映像ビットストリームをビデオデコーダに向けて送信すること、を提供する。

【0020】

第３の態様は復号装置に関する。当該復号装置は、コーディングされた映像ビットストリームを受信するように構成された受信器と、受信器に結合されたメモリであり、命令を格納したメモリと、メモリに結合されたプロセッサであり、命令を実行して当該復号装置に、復号している現在ピクチャの解像度が、現在ブロックに関連する参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定させ、現在ピクチャの解像度が参照ピクチャの各々の解像度と同じであると決定されたとき、現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にさせ、現在ピクチャの解像度が参照ピクチャのうちのいずれかの解像度と異なると決定されたとき、現在ピクチャの現在ブロックに対してＢＤＯＦを無効にさせ、現在ブロックに対してＢＤＯＦが有効にされるとき、現在ブロックに対応する動きベクトルを精緻化させる、ように構成されたプロセッサと、を含む。

【0021】

当該復号装置は、参照ピクチャリサンプリング（reference picture resampling；ＲＰＲ）が有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にする技術を提供する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、プロセッサ、メモリ、及び／又はネットワークリソースの使用が、エンコーダ及びデコーダの双方で削減され得る。従って、映像コーディングにおけるコーダ／デコーダ（“コーデック”としても知られる）が、現行コーデックに対して改善される。実際問題として、改善された映像コーディングプロセスは、映像が送信され、受信され、及び／又は見られるときに、ユーザにより良いユーザ体験を提供する。

【0022】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ＢＤＯＦが無効にされるとき、現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされる、ことを提供する。

【0023】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、現在ブロックに基づいて生成された画像を表示するように構成されたディスプレイ、を提供する。

【0024】

第４の態様は符号化装置に関する。当該符号化装置は、命令を格納したメモリと、メモリに結合されたプロセッサであり、命令を実装して当該符号化装置に、符号化している現在ピクチャの解像度が、現在ピクチャに関連する参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定させ、現在ピクチャの解像度が参照ピクチャの各々の解像度と同じであると決定されたとき、現在ピクチャの現在ブロックに対して双方向オプティカルフロー（ＢＤＯＦ）を有効にさせ、現在ピクチャの解像度が参照ピクチャのうちのいずれかの解像度と異なると決定されたとき、現在ピクチャの現在ブロックに対してＢＤＯＦを無効にさせ、現在ブロックに対してＢＤＯＦが有効にされるとき、現在ブロックに対応する動きベクトルを精緻化させる、ように構成されたプロセッサと、プロセッサに結合された送信器であり、現在ブロックを含む映像ビットストリームをビデオデコーダに向けて送信するように構成された送信器と、を含む。

【0025】

当該符号化装置は、参照ピクチャリサンプリング（ＲＰＲ）が有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にする技術を提供する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、プロセッサ、メモリ、及び／又はネットワークリソースの使用が、エンコーダ及びデコーダの双方で削減され得る。従って、映像コーディングにおけるコーダ／デコーダ（“コーデック”としても知られる）が、現行コーデックに対して改善される。実際問題として、改善された映像コーディングプロセスは、映像が送信され、受信され、及び／又は見られるときに、ユーザにより良いユーザ体験を提供する。

【0026】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、ＢＤＯＦが無効にされるときであっても、現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）が有効にされる、ことを提供する。

【0027】

オプションで、前述の態様のいずれかにおいて、その態様の他の一実装は、送信器がビットストリームをビデオデコーダに向けて送信することに先立って、メモリが映像ビットストリームを格納する、ことを提供する。

【0028】

第５の態様はコーディング装置に関する。当該コーディング装置は、符号化するピクチャを受信するように、又は復号するビットストリームを受信するように構成された受信器と、受信器に結合された送信器であり、ビットストリームをデコーダに送信するように、又は復号された画像をディスプレイに送信するように構成された送信器と、受信器又は送信器のうちの少なくとも一方に結合されたメモリであり、命令を格納するように構成されたメモリと、メモリに結合されたプロセッサであり、メモリに格納された命令を実行して、ここに開示される方法のうちのいずれかを実行するように構成されたプロセッサと、を含む。

【0029】

当該コーディング装置は、参照ピクチャリサンプリング（ＲＰＲ）が有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にする技術を提供する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、プロセッサ、メモリ、及び／又はネットワークリソースの使用が、エンコーダ及びデコーダの双方で削減され得る。従って、映像コーディングにおけるコーダ／デコーダ（“コーデック”としても知られる）が、現行コーデックに対して改善される。実際問題として、改善された映像コーディングプロセスは、映像が送信され、受信され、及び／又は見られるときに、ユーザにより良いユーザ体験を提供する。

【0030】

第６の態様はシステムに関する。当該システムは、エンコーダと、エンコーダと通信するデコーダと、を含み、エンコーダ又はデコーダが、ここに開示される復号装置、符号化装置、又はコーディング装置を含む。

【0031】

当該システムは、参照ピクチャリサンプリング（ＲＰＲ）が有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にする技術を提供する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、プロセッサ、メモリ、及び／又はネットワークリソースの使用が、エンコーダ及びデコーダの双方で削減され得る。従って、映像コーディングにおけるコーダ／デコーダ（“コーデック”としても知られる）が、現行コーデックに対して改善される。実際問題として、改善された映像コーディングプロセスは、映像が送信され、受信され、及び／又は見られるときに、ユーザにより良いユーザ体験を提供する。

【図面の簡単な説明】

【0032】

この開示のいっそう完全なる理解のため、同様の部分を同様の参照符号が表す添付図面及び詳細説明に関連して、ここで以下の簡単な説明を参照しておく。

【図1】映像コーディング技術を利用し得るコーディングシステムの一例を示すブロック図である。

【図2】映像コーディング技術を実装し得るビデオエンコーダの一例を示すブロック図である。

【図3】映像コーディング技術を実装し得るビデオデコーダの一例を示すブロック図である。

【図4】復号順及び提示順での、リーディングピクチャ及びトレーリングピクチャに対するＩＲＡＰピクチャの関係を表したものである。

【図5】空間スケーラビリティのための多層コーディングの一例を示している。

【図6】片方向インター予測の一例を示す概略図である。

【図7】双方向インター予測の一例を示す概略図である。

【図8】映像ビットストリームを示している。

【図9】ピクチャに対するパーティショニング技術を示している。

【図10】コーディングされた映像ビットストリームを復号する方法の一実施形態である。

【図11】コーディングされた映像ビットストリームを符号化する方法の一実施形態である。

【図12】映像コーディング装置の概略図である。

【図13】コーディングのための手段の一実施形態の概略図である。

【発明を実施するための形態】

【0033】

最初に理解されるべきことには、１つ以上の実施形態の例示的な実装が以下にて提示されるが、開示されるシステム及び／又は方法は、現に知られている又は存在しているのであろうとなかろうと、幾つもの技術を用いて実装され得る。この開示は決して、ここに図示して記述される例示的な設計及び実装を含めて、以下に例示される例示的な実装、図及び技術に限定されるべきものでなく、添付の請求項の範囲及びそれらの完全なる均等範囲の中で変更され得るものである。

【0034】

ここで使用されるとき、解像度は、映像ファイル内のピクセルの数を記述する。すなわち、解像度は、ピクセル単位で測定される投影画像の幅及び高さである。例えば、映像は、１２８０（水平ピクセル）×７２０（垂直ピクセル）の解像度を持ち得る。これは通常、単純に１２８０×７２０と書かれ、あるいは７２０ｐと略される。ＢＤＯＦは、予測ブロックについて動き又は動きベクトルを精緻化するのに使用されるプロセス、アルゴリズム、又はコーディングツールである。ＢＤＯＦは、２つの参照ピクチャ間の差の勾配に基づいて、サブコーディングユニットに対して動きベクトルを見つけることを可能にする。ＲＰＲ機能は、解像度が変わる位置におけるピクチャのイントラコーディングの必要なしに、ビットストリームの途中で、コーディングされたピクチャの空間解像度を変化させる能力である。

【0035】

図１は、ここに記載される映像コーディング技術を利用し得るコーディングシステム１０の一例を示すブロック図である。図１に示すように、コーディングシステム１０は、後の時点でデスティネーション装置１４によって復号されることになる符号化された映像データを提供するソース装置１２を含む。特に、ソース装置１２は、コンピュータ読み取り可能媒体１６を介して、映像データをデスティネーション装置１４に提供し得る。ソース装置１２及びデスティネーション装置１４は、デスクトップコンピュータ、ノートブック（例えば、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、例えば所謂“スマート”フォンなどの電話機、所謂“スマート”パッド、テレビジョン、カメラ、ディスプレイ装置、デジタルメディアプレーヤ、ビデオゲーム機、ビデオストリーミング装置、又はこれらに類するものを含め、広範囲の装置のうちのいずれかを有し得る。一部の例において、ソース装置１２及びデスティネーション装置１４は、無線通信のために備えられ得る。

【0036】

デスティネーション装置１４は、コンピュータ読み取り可能媒体１６を介して、復号すべき符号化された映像データを受信し得る。コンピュータ読み取り可能媒体１６は、符号化された映像データをソース装置１２からデスティネーション装置１４に移動させることができる任意のタイプの媒体又は装置を有し得る。一例において、コンピュータ読み取り可能媒体１６は、符号化された映像データをソース装置１２が直接的にデスティネーション装置１４にリアルタイムで送信することを可能にする通信媒体を有し得る。符号化された映像データは、例えば無線通信プロトコルなどの通信標準に従って変調されてデスティネーション装置１４に送信され得る。通信媒体は、例えば無線周波数（ＲＦ）スペクトル又は１つ以上の物理的伝送線路などの任意の無線又は有線通信媒体を有し得る。通信媒体は、例えば、ローカルエリアネットワーク、ワイドエリアネットワーク、又は例えばインターネットなどのグローバルネットワークなどの、パケットベースのネットワークの一部を形成してもよい。通信媒体は、ルータ、スイッチ、基地局、又はソース装置１２からデスティネーション装置１４への通信を容易にするのに有用な任意の他の機器を含み得る。

【0037】

一部の例において、符号化されたデータが、出力インタフェース２２からストレージ装置に出力され得る。同様に、符号化されたデータは、入力インタフェースによってストレージ装置からアクセスされ得る。ストレージ装置は、例えばハードドライブ、Ｂｌｕ－ｒａｙディスク、デジタルビデオディスク（ＤＶＤ）、コンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、フラッシュメモリ、揮発性若しくは不揮発性メモリ、又は符号化された映像データを格納するのに好適な任意の他のデジタルストレージ媒体などの、多様な分散された又はローカルにアクセスされるデータストレージ媒体のうちのいずれかを含み得る。更なる一例において、ストレージ装置は、ソース装置１２によって生成された符号化された映像を格納し得るファイルサーバ又は他の中間ストレージ装置に相当してもよい。デスティネーション装置１４は、ストリーミング又はダウンロードを介して、ストレージ装置からの格納された映像データにアクセスし得る。ファイルサーバは、符号化された映像データを格納すること及びその符号化された映像データをデスティネーション装置１４に送信することが可能な任意のタイプのサーバとし得る。ファイルサーバ例は、ウェブサーバ（例えば、ウェブサイト用）、ファイル転送プロトコル（ＦＴＰ）サーバ、ネットワーク接続ストレージ（ＮＡＳ）装置、又はローカルディスクドライブを含む。デスティネーション装置１４は、インターネット接続を含め、任意の標準データ接続を介して、符号化された映像データにアクセスし得る。これは、無線チャネル（例えば、Ｗｉ－Ｆｉ接続）、有線接続（例えば、デジタル加入者回線（ＤＳＬ）、ケーブルモデムなど）、又はファイルサーバに格納された符号化された映像データにアクセスするのに適した両方の組み合わせを含み得る。ストレージ装置からの符号化された映像データの伝送は、ストリーミング伝送、ダウンロード伝送、又はこれらの組み合わせとし得る。

【0038】

この開示の技術は必ずしも無線用途又は設定に限定されるものではない。当該技術は、例えば無線（over-the-air）テレビジョン放送、ケーブルテレビジョン伝送、衛星テレビジョン伝送、ダイナミックアダプティブストリーミング・オーバ・ＨＴＴＰ（ＤＡＳＨ）などのインターネットストリーミング映像伝送、データストレージ媒体上に符号化されたデジタル映像、データストレージ媒体に格納されたデジタル映像の復号、又は他の用途などの、多様なマルチメディア用途のうちのいずれかをサポートして映像コーディングに適用され得る。一部の例において、コーディングシステム１０は、例えばビデオストリーミング、ビデオ再生、ビデオ放送、及び／又はビデオ電話などの用途をサポートするために、一方向又は二方向の映像伝送をサポートするように構成され得る。

【0039】

図１の例において、ソース装置１２は、映像ソース１８、ビデオエンコーダ２０、及び出力インタフェース２２を含んでいる。デスティネーション装置１４は、入力インタフェース２８、ビデオデコーダ３０、及び表示装置３２を含んでいる。この開示によれば、ソース装置１２のビデオエンコーダ２０及び／又はデスティネーション装置１４のビデオデコーダ３０が、映像コーディングのための当該技術を適用するように構成され得る。他の例において、ソース装置及びデスティネーション装置は、他のコンポーネント又は構成を含んでもよい。例えば、ソース装置１２は、例えば外付けカメラなどの外部映像ソースから映像データを受信してもよい。同様に、デスティネーション装置１４は、一体化された表示装置を含むのではなく、外付け表示装置とインタフェースをとってもよい。

【0040】

図１の図示したコーディングシステム１０は単に一例に過ぎない。映像コーディングのための技術は、任意のデジタル映像符号化及び／又は復号装置によって実行され得る。この開示の技術は、一般に、映像コーディング装置によって実行されるが、当該技術はまた、典型的に“ＣＯＤＥＣ”と呼ばれるビデオエンコーダ／デコーダによって実行されてもよい。さらに、この開示の技術はまた、ビデオプリプロセッサによって実行されてもよい。ビデオエンコーダ及び／又はデコーダは、グラフィックス処理ユニット（ＧＰＵ）又は類似のデバイスとし得る。

【0041】

ソース装置１２及びデスティネーション装置１４は、単に、ソース装置１２がデスティネーション装置１４への送信のためにコーディングされた映像データを生成するそのようなコーディング装置の例に過ぎない。一部の例において、ソース装置１２及びデスティネーション装置１４は、ソース装置及びデスティネーション装置１２、１４の各々が映像符号化及び復号コンポーネントを含むように、実質的に対称的な方式で動作し得る。従って、コーディングシステム１０は、例えばビデオストリーミング、ビデオ再生、ビデオ放送、又はビデオ電話のために、映像装置１２、１４間での一方向又は二方向の映像伝送をサポートし得る。

【0042】

ソース装置１２の映像ソース１８は、例えばビデオカメラなどの映像キャプチャ装置、以前にキャプチャされた映像を収容する映像アーカイブ、及び／又は映像コンテンツプロバイダから映像を受信する映像フィードインタフェースを含み得る。更なる代わりのものとして、映像ソース１８は、ソース映像としてのコンピュータグラフィックスベースのデータ、又はライブ映像、アーカイブ映像、及びコンピュータ生成された映像の組み合わせを生成し得る。

【0043】

一部のケースにおいて、映像ソース１８がビデオカメラであるとき、ソース装置１２及びデスティネーション装置１４は、所謂カメラフォン又はビデオフォンを形成し得る。しかしながら、上述のように、この開示に記載される技術は、一般に映像コーディングに適用可能であり、無線及び／又は有線用途に適用され得る。各ケースにおいて、キャプチャされた、予めキャプチャされた、又はコンピュータ生成された映像が、ビデオエンコーダ２０によって符号化され得る。そして、符号化された映像情報が、出力インタフェース２２によってコンピュータ読み取り可能媒体１６に出力され得る。

【0044】

コンピュータ読み取り可能媒体１６は、例えば無線ブロードキャスト又は有線ネットワーク伝送などの一時的媒体、又は例えばハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Ｂｌｕ－ｒａｙディスク、又は他のコンピュータ読み取り可能媒体などの記憶媒体（すなわち、非一時的記憶媒体）を含み得る。一部の例において、ネットワークサーバ（図示せず）が、ソース装置１２から符号化された映像データを受信し、該符号化された映像データを、例えばネットワーク伝送を介して、デスティネーション装置１４に提供し得る。同様に、例えばディスクスタンピング設備などの媒体生産設備のコンピューティング装置が、ソース装置１２から符号化された映像データを受信し、該符号化されたビデオデータを含むディスクを生産し得る。従って、コンピュータ読み取り可能媒体１６は、様々な例において、様々な形態の１つ以上のコンピュータ読み取り可能媒体を含むように理解され得る。

【0045】

デスティネーション装置１４の入力インタフェース２８が、コンピュータ読み取り可能媒体１６から情報を受信する。コンピュータ読み取り可能媒体１６の情報は、ビデオエンコーダ２０によって定義された構文情報を含むことができ、この構文情報はまた、ビデオデコーダ３０にも使用されるものであり、ブロック及び／又は例えばグループ・オブ・ピクチャ（ＧＯＰ）といった他のコーディングユニットの特徴及び／又は処理を記述する構文要素を含む。表示装置３２は、復号された映像データをユーザに対して表示するものであり、例えば陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、又は他のタイプの表示装置などの、多様な表示装置のうちのいずれかを含み得る。

【0046】

ビデオエンコーダ２０及びビデオデコーダ３０は、現在開発中のハイエフィシェンシビデオコーディング（ＨＥＶＣ）標準などの映像コーディング標準に従って動作し得るとともに、ＨＥＶＣテストモデル（ＨＭ）に準拠し得る。代わりに、ビデオエンコーダ２０及びビデオデコーダ３０は、例えばムービングピクチャエキスパートグループ（ＭＰＥＧ）－４パート１０とも別称される国際電気通信連合標準化部門（ＩＴＵ－Ｔ）Ｈ．２６４標準、アドバンストビデオコーディング（ＡＶＣ）、Ｈ．２６５／ＨＥＶＣ、又はこのような標準の拡張などの、他の独占所有権標準又は産業標準に従って動作してもよい。しかしながら、この開示の技術は、如何なる特定のコーディング標準にも限定されるものではない。映像コーディング標準の他の例は、ＭＰＥＧ－２及びＩＴＵ－ＴＨ．２６３を含む。図１には示していないが、一部の態様において、ビデオエンコーダ２０及びビデオデコーダ３０は各々、オーディオエンコーダ及びデコーダと一体化されてもよく、共通のデータストリーム又は別々のデータストリームでのオーディオ及び映像の両方の符号化を取り扱うのに適したマルチプレクサ－デマルチプレクサ（ＭＵＸ－ＤＥＭＵＸ）ユニット、又は他のハードウェア及びソフトウェアを含んでもよい。該当する場合、ＭＵＸ－ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、又は例えばユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

【0047】

ビデオエンコーダ２０及びビデオデコーダ３０は各々、例えば、１つ以上のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェア、又はこれらの任意の組み合わせなどの、多様な好適エンコーダ回路のうちのいずれかとして実装され得る。当該技術が部分的にソフトウェアで実装される場合、装置が、好適な非一時的コンピュータ読み取り可能媒体に該ソフトウェアの命令を格納し、それらの命令を、１つ以上のプロセッサを用いてハードウェアにて実行することで、この開示の技術を実行し得る。ビデオエンコーダ２０及びビデオデコーダ３０は各々、１つ以上のエンコーダ又はデコーダに含められることができ、それらはいずれも、それぞれの装置内の結合されたエンコーダ／デコーダ（ＣＯＤＥＣ）の部分として一体化されてもよい。ビデオエンコーダ２０及び／又はビデオデコーダ３０を含む装置は、集積回路、マイクロプロセッサ、及び／又は例えば携帯電話などの無線通信装置を有し得る。

【0048】

図２は、映像コーディング技術を実装し得るビデオエンコーダ２０の一例を示すブロック図である。ビデオエンコーダ２０は、映像スライス内の映像ブロックのイントラコーディング及びインターコーディングを実行し得る。イントラコーディングは、所与の映像フレーム又はピクチャ内の映像における空間的冗長性を低減又は除去するために空間予測を当てにする。インターコーディングは、映像シーケンスの隣接するフレーム又はピクチャ内の映像における時間的冗長性を低減又は除去するために時間予測を当てにする。イントラモード（Ｉモード）は、幾つかの空間ベースのコーディングモードのうちのいずれかを指し得る。例えば片方向（uni-directional）（片予測（uni prediction））予測としても知られる）（Ｐモード）又は双予測（bi-prediction）（bi predictionとしても知られる）（Ｂモード）などのインターモードは、幾つかの時間ベースのコーディングモードのうちのいずれかを指し得る。

【0049】

図２に示すように、ビデオエンコーダ２０は、符号化すべき映像フレーム内の現在映像ブロックを受信する。図２の例において、ビデオエンコーダ２０は、モード選択ユニット４０、参照フレームメモリ６４、加算器５０、変換処理ユニット５２、量子化ユニット５４、及びエントロピーコーディングユニット５６を含んでいる。代わって、モード選択ユニット４０は、動き補償ユニット４４、動き推定ユニット４２、イントラ予測（intra-prediction）（intra predictionとしても知られる）ユニット４６、及びパーティションユニット４８を含んでいる。映像ブロック再構成のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８、逆変換ユニット６０、及び加算器６２を含んでいる。再構成映像からブロック状アーチファクトを除去するためにブロック境界をフィルタリングするデブロッキングフィルタ（図２には示さず）も含められ得る。望ましい場合に、デブロッキングフィルタは典型的に、加算器６２の出力をフィルタリングする。また、デブロッキングフィルタに加えて、更なるフィルタ（インループ又はポストループ）も使用され得る。このようなフィルタは、簡略化のために示していないが、望ましい場合に、（インループフィルタとして）加算器５０の出力をフィルタリングし得る。

【0050】

符号化プロセスにおいて、ビデオエンコーダ２０は、コーディングすべき映像フレーム又はスライスを受信する。フレーム又はスライスは、複数の映像ブロックに分割され得る。動き推定ユニット４２及び動き補償ユニット４４が、時間予測を提供するために、１つ以上の参照フレーム内の１つ以上のブロックに対する受信した映像ブロックのインター予測コーディングを実行する。代わりに、イントラ予測ユニット４６が、空間予測を提供するために、コーディングすべきブロックと同じフレーム又はスライス内の１つ以上の隣接ブロックに対する受信した映像ブロックのイントラ予測コーディングを実行してもよい。ビデオエンコーダ２０は、例えば映像データの各ブロックに対して適切なコーディングモードを選択するために、複数のコーディングパスを実行し得る。

【0051】

さらに、パーティションユニット４８は、先行するコーディングパスにおける先行パーティショニング方式の評価に基づいて、映像データのブロックをサブブロックにパーティショニングし得る。例えば、パーティションユニット４８は、最初に、フレーム又はスライスを最大コーディングユニット（ＬＣＵ）にパーティショニングし、該ＬＣＵの各々をレート歪み解析（例えば、レート歪み最適化）に基づいてサブコーディングユニットにパーティショニングし得る。モード選択ユニット４０は更に、ＬＣＵをサブＣＵへのパーティショニングを指し示す四分木データ構造を作成し得る。四分木のリーフノードＣＵは、１つ以上の予測ユニット（ＰＵ）及び１つ以上の変換ユニット（ＴＵ）を含み得る。

【0052】

本開示は、用語“ブロック”を、ＨＥＶＣの文脈におけるＣＵ、ＰＵ、又はＴＵのいずれか、又は他の標準の文脈における類似のデータ構造（例えば、Ｈ．２６４／ＡＶＣにおけるマクロブロック及びそのサブブロック）を指すように使用する。ＣＵは、コーディングノード、ＰＵ、及び、コーディングノードに関連するＴＵを含む。ＣＵの大きさはコーディングノードの大きさに対応し、正方形の形状である。ＣＵの大きさは、８×８ピクセルから、６４×６４ピクセル以上を最大としてツリーブロックの大きさまでの範囲とし得る。各ＣＵは、１つ以上のＰＵ及び１つ以上のＴＵを含み得る。ＣＵに関連する構文データが、例えば、１つ以上のＰＵへのＣＵのパーティショニングを記述し得る。パーティショニングモードは、ＣＵがスキップ若しくはダイレクトモード符号化されるのか、イントラ予測モード符号化されるのか、それともインター予測（inter-prediction）（inter predictionとしても知られる）モード符号化されるのかで異なり得る。ＰＵは、非正方形の形状にパーティショニングされてもよい。ＣＵに関連する構文データはまた、例えば、四分木に従った１つ以上のＴＵへのＣＵのパーティショニングを記述し得る。ＴＵは、正方形又は非正方形（例えば、長方形）の形状とすることができる。

【0053】

モード選択ユニット４０は、例えば誤差結果に基づいて、イントラ又はインターの、コーディングモードの１つを選択することができ、得られたイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成する加算器５０と、参照フレームとして使用するための符号化ブロックを再構成する加算器６２とに提供し得る。モード選択ユニット４０はまた、例えば動きベクトル、イントラモードインジケータ、パーティション情報、及び他のこのような構文情報などの構文要素を、エントロピーコーディングユニット５６に提供する。

【0054】

動き推定ユニット４２及び動き補償ユニット４４は、高度に集積され得るが、概念上の目的で別々に図示されている。動き推定ユニット４２によって実行される動き推定は、映像ブロックに関する動きを推定するものである動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在フレーム内のコーディングされている現在ブロック（又は他のコーディングされるユニット）に対する参照フレーム内の予測ブロック（又は他のコーディングされるユニット）に対する現在映像フレーム又はピクチャ内の映像ブロックのＰＵの変位を指し示し得る。予測ブロックは、絶対差の和（ＳＡＤ）、二乗差の和（ＳＳＤ）、又は他の差分メトリックによって決定され得るものであるピクセル差に関して、コーディングされるブロックによく一致することが見出されたブロックである。一部の例において、ビデオエンコーダ２０は、参照フレームメモリ６４に格納された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。例えば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、又は他の分数ピクセル位置の値を補間し得る。従って、動き推定ユニット４２は、フルピクセル位置及び分数ピクセル位置に対する動き探索を実行し、分数ピクセル精度を有する動きベクトルを出力し得る。

【0055】

動き推定ユニット４２は、インターコーディングされるスライス内の映像ブロックのＰＵに関する動きベクトルを、該ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって計算する。参照ピクチャは、それらの各々が参照フレームメモリ６４に格納された１つ以上の参照ピクチャを特定するものである第１参照ピクチャリスト（Ｌｉｓｔ０）又は第２参照ピクチャリスト（Ｌｉｓｔ１）から選択され得る。動き推定ユニット４２は、計算した動きベクトルを、エントロピー符号化ユニット５６及び動き補償ユニット４４に送る。

【0056】

動き補償ユニット４４によって実行される動き補償は、動き推定ユニット４２によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することを含み得る。繰り返しとなるが、一部の例において、動き推定ユニット４２及び動き補償ユニット４４は機能的に集積され得る。現在映像ブロックのＰＵに関する動きベクトルを受信して、動き補償ユニット４４は、参照ピクチャリストの一方内で動きベクトルが指す予測ブロックを位置特定し得る。加算器５０が、後述するように、コーディングされている現在映像ブロックのピクセル値から予測ブロックのピクセル値を減算することによって残差映像ブロックを形成して、ピクセル差の値を形成する。一般に、動き推定ユニット４２はルマ成分に対して動き推定を実行し、動き補償ユニット４４は、ルマ成分に基づいて計算された動きベクトルをクロマ成分及びルマ成分の双方に使用する。モード選択ユニット４０はまた、映像ブロック及び映像スライスに関連する構文要素を、映像スライスの映像ブロックを復号する際のビデオデコーダ３０による使用のために生成し得る。

【0057】

イントラ予測ユニット４６は、上述したように、動き推定ユニット４２及び動き補償ユニット４４によって実行されるインター予測の代わりとして、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット４６は、現在ブロックを符号化するのに使用するイントラ予測モードを決定し得る。一部の例において、イントラ予測ユニット４６は、例えば、別々の符号化パスの間に、様々なイントラ予測モードを用いて現在ブロックを符号化することができ、イントラ予測ユニット４６（又は、一部の例において、モード選択ユニット４０）は、テストされたモードから、使用するのに適切なイントラ予測モードを選択し得る。

【0058】

例えば、イントラ予測ユニット４６は、様々なテストされたイントラ予測モードについてレート歪み解析を用いてレート歪み値を計算し、それらテストされたモードの中で最良のレート歪み特性を持つイントラ予測モードを選択し得る。レート歪み解析は、一般に、符号化ブロックと、符号化されて該符号化ブロックを生成した元の符号化されていないブロックとの間の歪み（又は誤差）の量と、該符号化ブロックを生成するのに使用されたビットレート（すなわち、ビットの数）とを決定する。イントラ予測ユニット４６は、様々な符号化ブロックについての歪み及びレートから比を計算し、そのブロックに対してどのイントラ予測モードが最良のレート歪み値を示すのかを決定する。

【0059】

加えて、イントラ予測ユニット４６は、深さモデリングモード（depth modeling mode；ＤＭＭ）を使用して深さマップの深さブロックをコーディングするように構成され得る。モード選択ユニット４０は、利用可能なＤＭＭモードが、イントラ予測モード及び他のＤＭＭモードよりも良好なコーディング結果を生み出すかを、例えばレート歪み最適化（ＲＤＯ）を用いて決定し得る。深さマップに対応するテクスチャ画像のデータは、参照フレームメモリ６４に格納され得る。動き推定ユニット４２及び動き補償ユニット４４はまた、深さマップの深さブロックをインター予測するように構成されることもできる。

【0060】

ブロックに対するイントラ予測モード（例えば、従来からのイントラ予測モード、又はＤＭＭモードのうちの１つ）を選択した後、イントラ予測ユニット４６は、該ブロックに対して選択されたイントラ予測モードを指し示す情報をエントロピーコーディングユニット５６に提供し得る。エントロピーコーディングユニット５６は、選択されたイントラ予測モードを指し示す情報を符号化し得る。ビデオエンコーダ２０は、送信するビットストリームにコンフィギュレーションデータを含めることができ、該コンフィギュレーションデータは、複数のイントラ予測モードインデックステーブル及び複数の変更イントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）、様々なブロックに対する符号化コンテキストの定義、並びに、それらコンテキストの各々に使用される最も可能性の高いイントラ予測モード、イントラ予測モードインデックステーブル、及び変更イントラ予測モードインデックステーブルを含み得る。

【0061】

ビデオエンコーダ２０は、モード選択ユニット４０からの予測データを、コーディングしている元の映像ブロックから減算することによって、残差映像ブロックを形成する。加算器５０が、この減算演算を実行する１つ以上のコンポーネントを表す。

【0062】

変換処理ユニット５２は、例えば離散コサイン変換（ＤＣＴ）又は概念的に類似した変換などの変換を残差ブロックに適用して、残差変換係数値を有する映像ブロックを生成する。変換処理ユニット５２は、概念的にＤＣＴに類似した他の変換を実行してもよい。ウェーブレット変換、整数変換、サブバンド変換、又は他のタイプの変換も使用され得る。

【0063】

変換処理ユニット５２は、変換を残差ブロックに適用して、残差変換係数のブロックを生成する。該変換は、残差情報をピクセル値ドメインから例えば周波数ドメインなどの変換ドメインに変換し得る。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。量子化ユニット５４は、ビットレートを更に低下させるために変換係数を量子化する。量子化プロセスは、係数の一部又は全てに関連するビット深度を低減させ得る。量子化の程度は、量子化パラメータを調節することによって変更され得る。一部の例において、量子化ユニット５４は、次いで、量子化された変換係数を含む行列の走査を行い得る。代わりに、エントロピー符号化ユニット５６が走査を行ってもよい。

【0064】

量子化に続いて、エントロピーコーディングユニット５６が、量子化された変換係数をエントロピーコーディングする。例えば、エントロピーコーディングユニット５６は、コンテキスト適応可変長コーディング（context adaptive variable length coding；ＣＡＶＬＣ）、コンテキスト適応バイナリ算術コーディング（context adaptive binary arithmetic coding；ＣＡＢＡＣ）、構文スベースコンテキスト適応バイナリ算術コーディング（syntax-based context-adaptive binary arithmetic coding；ＳＢＡＣ）、確率インターバルパーティショニングエントロピー（probability interval partitioning entropy；ＰＩＰＥ）コーディング、又は他のエントロピーコーディング技術）を実行し得る。コンテキストベースのエントロピーコーディングの場合、コンテキストは隣接ブロックに基づき得る。エントロピーコーディングユニット５６によるエントロピーコーディングに続いて、符号化されたビットストリームが、別の装置（例えば、ビデオでデコーダ３０）に送信されたり、あるいは後の伝送又は取り出しのためにアーカイブされたりし得る。

【0065】

逆量子化ユニット５８及び逆変換ユニット６０は、それぞれ、逆量子化及び逆変換を適用して、例えば参照ブロックとしての後の使用のために、ピクセルドメインの残差ブロックを再構成する。動き補償ユニット４４が、参照フレームメモリ６４のフレームのうちの１つの予測ブロックに残差ブロックを加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構成残差ブロックに１つ以上の補間フィルタを適用して、動き推定に使用されるサブ整数ピクセル値を計算し得る。加算器６２が、再構成残差ブロックを、動き補償ユニット４４によって生成された動き補償された予測ブロックに加算して、参照フレームメモリ６４に記憶される再構成映像ブロックを生成する。再構成映像ブロックは、後続映像フレーム内のブロックをインターコーディングするための参照ブロックとして動き推定ユニット４２及び動き補償ユニット４４によって使用され得る。

【0066】

図３は、映像コーディング技術を実装し得るビデオデコーダ３０の一例を示すブロック図である。図３の例において、ビデオデコーダ３０は、エントロピー復号ユニット７０、動き補償ユニット７２、イントラ予測ユニット７４、逆量子化ユニット７６、逆変換ユニット７８、参照フレームメモリ８２、及び加算器８０を含んでいる。ビデオデコーダ３０は、一部の例において、ビデオエンコーダ２０（図２）に関して説明した符号化パスに対して概して逆の復号パスを実行し得る。動き補償ユニット７２は、エントロピー復号ユニット７０から受け取った動きベクトルに基づいて予測データを生成することができ、イントラ予測ユニット７４は、エントロピー復号ユニット７０から受け取ったイントラ予測モードインジケータに基づいて予測データを生成することができる。

【0067】

復号プロセスにおいて、ビデオデコーダ３０は、ビデオエンコーダ２０からの符号化映像スライスの映像ブロック及び関連する構文要素を表す符号化映像ビットストリームを受信する。ビデオデコーダ３０のエントロピー復号ユニット７０は、ビットストリームをエントロピー復号して、量子化された係数と、動きベクトル又はイントラ予測モードインジケータと、他の構文要素とを生成する。エントロピー復号ユニット７０は、動きベクトル及び他の構文要素を動き補償ユニット７２に転送する。ビデオデコーダ３０は、映像スライスレベル及び／又は映像ブロックレベルで構文要素を受信し得る。

【0068】

映像スライスがイントラコーディングされた（Ｉ）スライスとしてコーディングされるとき、イントラ予測ユニット７４は、シグナリングされたイントラ予測モードと、現在フレーム又はピクチャの先行復号ブロックからのデータとに基づいて、現在映像スライスの映像ブロックについての予測データを生成し得る。映像フレームが、インターコーディングされた（例えば、Ｂ、Ｐ、又はＧＰＢ）スライスとしてコーディングされるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信した動きベクトル及び他の構文要素に基づいて、現在映像スライスの映像ブロックについての予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、参照フレームメモリ８２に格納された参照ピクチャに基づいて、デフォルトの構築技術を使用して、Ｌｉｓｔ０及びＬｉｓｔ１なる参照フレームリストを構築し得る。

【0069】

動き補償ユニット７２は、動きベクトルと他の構文要素とを構文解析することによって、現在映像スライスの映像ブロックについての予測情報を決定し、該予測情報を使用して、復号している現在映像ブロックについての予測ブロックを生成する。例えば、動き補償ユニット７２は、受け取った構文要素の一部を用いて、映像スライスの映像ブロックをコーディングするのに使用された予測モード（例えば、イントラ予測又はインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）、スライスに関する参照ピクチャリストのうちの１つ以上の構築情報、スライスの各インター符号化映像ブロックについての動きベクトル、スライスの各インターコーディングされた映像ブロックについてのインター予測ステータス、及び現在映像スライス内の映像ブロックを復号するための他の情報を決定する。

【0070】

動き補償ユニット７２はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット７２は、映像ブロックの符号化においてビデオエンコーダ２０によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルに対する補間値を計算し得る。このケースにおいて、動き補償ユニット７２は、受け取った構文要素から、ビデオエンコーダ２０によって使用された補間フィルタを決定し、該補間フィルタを用いて予測ブロックを生成し得る。

【0071】

深さマップに対応するテクスチャ画像についてのデータは、参照フレームメモリ８２に格納され得る。動き補償ユニット７２はまた、深さマップの深さブロックをインター予測するように構成され得る。

【0072】

一実施形態において、ビデオデコーダ３０は、ユーザインタフェース（ＵＩ）８４を含む。ユーザインタフェース８４は、ビデオデコーダ３０のユーザ（例えば、ネットワーク管理者）からの入力を受信するように構成される。ユーザインタフェース８４を介して、ユーザは、ビデオデコーダ３０についての設定を管理又は変更することができる。例えば、ユーザは、ユーザ嗜好に従ってビデオデコーダ３０のコンフィギュレーション及び／又は動作を制御するために、パラメータ（例えば、フラグ）に関する値を入力する又はその他の方法で提供することができる。ユーザインタフェース８４は、例えば、グラフィカルアイコン、ドロップダウンメニュー、及びチェックボックスなどを介してユーザがビデオデコーダ３０とインタラクトすることを可能にするグラフィカルユーザインタフェース（ＧＵＩ）とし得る。一部のケースにおいて、ユーザインタフェース８４は、ユーザからの情報を、キーボード、マウス、又は他の周辺装置を介して受信し得る。一実施形態において、ユーザは、ビデオデコーダ３０からはリモートに置かれたスマートフォン、タブレット装置、及びパーソナルコンピュータなどを介して、ユーザインタフェース８４にアクセスすることができる。ここで使用されるとき、ユーザインタフェース８４は、外部入力又は外部手段として参照されてもよい。

【0073】

以上を念頭に置いて、映像圧縮技術は、映像シーケンスに内在する冗長性を低減又は除去するために、空間（イントラピクチャ）予測及び／又は時間（インターピクチャ）予測を実行する。ブロックベースの映像コーディングでは、映像スライス（すなわち、映像ピクチャ、又は映像ピクチャの一部）が、ツリーブロック、コーディングツリーブロック（ＣＴＢ）、コーディングツリーユニット（ＣＴＵ）、コーディングユニット（ＣＵ）及び／又はコーディングノードとも称され得るものである複数の映像ブロックにパーティショニングされ得る。ピクチャのイントラコーディングされる（Ｉ）スライス内の映像ブロックは、同じピクチャ内の隣接ブロック内の参照サンプルに対する空間予測を用いて符号化される。ピクチャのインターコーディングされる（Ｐ又はＢ）スライス内の映像ブロックは、同じピクチャ内の隣接ブロック内の参照サンプルに対する空間予測、又は他の参照ピクチャ内の参照サンプルに対する時間予測を使用し得る。ピクチャはフレームと称されることがあり、参照ピクチャは参照フレームと称されることがある。

【0074】

空間予測又は時間予測は、コーディングすべきブロックについての予測ブロックをもたらす。残差データは、コーディングすべき元のブロックと予測ブロックとの間のピクセル差を表す。インターコーディングされるブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルに従って符号化され、残差データが、コーディングされるブロックと予測ブロックとの間の差を示す。イントラコーディングされるブロックは、イントラコーディングモードと残差データとに従って符号化される。更なる圧縮のために、残差データがピクセルドメインから変換ドメインに変換されて、次いで量子化され得るものである残差変換係数をもたらし得る。当初は二次元アレイに配列されている量子化された変換係数が、変換係数の一次元ベクトルを生成するために走査され、そして、よりいっそうの圧縮を達成するためにエントロピーコーディングが適用され得る。

【0075】

画像及び映像圧縮は急速な成長を経て、様々なコーディング標準につながってきた。そのような映像コーディング標準は、ＩＴＵ－ＴＨ．２６１、国際標準化機構／国際電気標準会議（ＩＳＯ／ＩＥＣ）ＭＰＥＧ－１パート２、ＩＴＵ－ＴＨ．２６２又はＩＳＯ／ＩＥＣＭＰＥＧ－２パート２、ＩＴＵ－ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ－４パート２、ＩＴＵ－ＴＨ．２６４又はＩＳＯ／ＩＥＣＭＰＥＧ－４パート１０としても知られるアドバンストビデオコーディング（ＡＶＣ）、及びＩＴＵ－ＴＨ．２６５又はＭＰＥＧ－Ｈパート２としても知られるハイエフィシェンシビデオコーディング（ＨＥＶＣ）を含む。ＡＶＣは、例えばスケーラブルビデオコーディング（ＳＶＣ）、マルチビュービデオコーディング（ＭＶＣ）及びマルチビュービデオコーディング・プラス・デプス（ＭＶＣ＋Ｄ）、及び３ＤＡＶＣ（３Ｄ－ＡＶＣ）などの拡張を含む。ＨＥＶＣは、例えばスケーラブルＨＥＶＣ（ＳＨＶＣ）、マルチビューＨＥＶＣ（ＭＶ－ＨＥＶＣ）及び３ＤＨＥＶＣ（３Ｄ－ＨＥＶＣ）などの拡張を含む。

【0076】

また、ＩＴＵ－ＴとＩＳＯ／ＩＥＣとのジョイントビデオエキスパートチーム（ＪＶＥＴ）によって開発中のバーサタイルビデオコーディング（ＶＶＣ）という名の新たな映像コーディング標準も存在する。ＶＶＣ標準は幾つか作業原案を有するが、特に、Ｂ．Ｂｒｏｓｓ、Ｊ．Ｃｈｅｎ、及びＳ．Ｌｉｕの“ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ５）”、ＪＶＥＴ－Ｎ１００１－ｖ３、第１３回ＪＶＥＴミーティング、２０１９年３月２７日（ＶＶＣドラフト５）という、ＶＶＣの１つの作業原案（ＷＤ）をその全体にてここに援用する。

【0077】

ここに開示される技術の説明は、ＩＴＵ－ＴとＩＳＯ／ＩＥＣとのジョイントビデオエキスパートチーム（ＪＶＥＴ）によって開発中の映像コーディング標準であるバーサタイルビデオコーディング（ＶＶＣ）に基づいている。しかしながら、当該技術は他のビデオコーデック仕様にも適用される。

【0078】

図４は、復号順４０８及び提示順４１０での、リーディングピクチャ４０４及びトレーリングピクチャ４０６に対するイントラランダムアクセスポイント（intra random access point；ＩＲＡＰ）ピクチャ４０２の関係を表したもの４００である。一実施形態において、ＩＲＡＰピクチャ４０２は、クリーンランダムアクセス（clean random access；ＣＲＡ）ピクチャと称され、あるいはランダムアクセスデコーダブル（random access decodable；ＲＡＤＬ）ピクチャを有する即時デコーダリフレッシュ（instantaneous decoder refresh；ＩＤＲ）ピクチャと称される。ＨＥＶＣでは、ＩＤＲピクチャ、ＣＲＡピクチャ、及びブロークンリンクアクセス（Broken Link Access；ＢＬＡ）ピクチャは全て、ＩＲＡＰピクチャ４０２とみなされる。ＶＶＣでは、２０１８年１０月の第１２回ＪＶＥＴミーティングにおいて、ＩＤＲピクチャ及びＣＲＡピクチャの両方をＩＲＡＰピクチャとして持つことが合意された。一実施形態では、ブロークンリンクアクセス（ＢＬＡ）ピクチャ及び段階的デコーダリフレッシュ（Gradual Decoder Refresh；ＧＤＲ）ピクチャも、ＩＲＡＰピクチャであるとみなされてもよい。コーディングされた映像シーケンスの復号プロセスは、常にＩＲＡＰにて始まる。

【0079】

図４に示すように、リーディングピクチャ４０４（例えば、ピクチャ２及び３）は、復号順４０８ではＩＲＡＰピクチャ４０２の後ろであるが、提示順４１０ではＩＲＡＰピクチャ４０２に先行する。トレーリングピクチャ４０６は、復号順４０８においてと提示順４１０においての両方で、ＩＲＡＰピクチャ４０２の後ろである。図４には２つのリーディングピクチャ４０４と１つのトレーリングピクチャ４０６とを示しているが、当業者が理解することには、実際の適用においては復号順４０８及び提示順４１０で、より多数又は少数のリーディングピクチャ４０４及び／又はトレーリングピクチャ４０６が存在し得る。

【0080】

図４におけるリーディングピクチャ４０４は、ランダムアクセススキップリーディング（random access skipped leading；ＲＡＳＬ）とＲＡＤＬとである２つのタイプに分割されている。復号がＩＲＡＰピクチャ４０２（例えば、ピクチャ１）で始まるとき、ＲＡＤＬピクチャ（例えば、ピクチャ３）は適切に復号されることができるが、ＲＡＳＬピクチャ（例えば、ピクチャ２）は適切に復号されることができない。従って、ＲＡＳＬピクチャは破棄される。ＲＡＤＬピクチャとＲＡＳＬピクチャとの区別に照らして、効率的で適切なコーディングのためには、ＩＲＡＰピクチャ４０２に関連するリーディングピクチャ４０４のタイプがＲＡＤＬ又はＲＡＳＬのいずれかとして特定されるべきである。ＨＥＶＣでは、ＲＡＳＬピクチャ及びＲＡＤＬピクチャが存在するとき、同じＩＲＡＰピクチャ４０２に関連するＲＡＳＬピクチャ及びＲＡＤＬピクチャについて、提示順４１０でＲＡＳＬピクチャがＲＡＤＬピクチャに先行することとするという制約がある。

【0081】

ＩＲＡＰピクチャ４０２は、以下の２つの重要な機能／利益を提供する。第１に、ＩＲＡＰピクチャ４０２の存在は、復号プロセスがそのピクチャから始まることができることを指し示す。この機能は、ＩＲＡＰピクチャ４０２がその位置に存在する限り、復号プロセスが、必ずしもビットストリームの始まりではなく、ビットストリーム内のその位置にて始まるというランダムアクセス性を可能にする。第２に、ＩＲＡＰピクチャ４０２の存在は、ＲＡＳＬピクチャを除いて、ＩＲＡＰピクチャ４０２にて始まるコーディングされるピクチャが、先行ピクチャへの如何なる参照もなしにコーディングされるように、復号プロセスをリフレッシュする。ビットストリーム内にＩＲＡＰピクチャ４０２が存在することは、従って、ＩＲＡＰピクチャ４０２に先立ってコーディングされるピクチャの復号中に発生し得るエラーが、ＩＲＡＰピクチャ４０２及び復号順４０８でＩＲＡＰピクチャ４０２の後ろにあるピクチャに伝播することを止めることになる。

【0082】

ＩＲＡＰピクチャ４０２は重要な機能を提供する一方で、圧縮効率に対する不利益を伴う。ＩＲＡＰピクチャ４０２の存在はビットレートのサージを引き起こす。圧縮効率に対するこの不利益は２つの理由による。第１に、ＩＲＡＰピクチャ４０２はイントラ予測ピクチャであるので、該ピクチャそれ自体が、インター予測ピクチャである他のピクチャ（例えば、リーディングピクチャ４０４、トレーリングピクチャ４０６）と比較して、表現するのに比較的多くのビットを必要とする。第２に、ＩＲＡＰピクチャ４０２の存在は時間予測を途切れさせるため（これは、デコーダが復号プロセスをリフレッシュすることになり、これのための復号プロセスの動作の１つが復号ピクチャバッファ（ＤＰＢ）内の先行参照ピクチャを除去するものであるからである）、ＩＲＡＰピクチャ４０２は、復号順４０８でＩＲＡＰピクチャ４０２の後にあるピクチャのコーディングをあまり効率的でないものにさせる（すなわち、表現するのにいっそう多くのビットを必要とする）。何故なら、それらのピクチャが有する、それらのインター予測コーディングのための参照ピクチャが、少なくなるからである。

【0083】

ＩＲＡＰピクチャ４０２とみなされるピクチャタイプの中で、ＨＥＶＣにおけるＩＤＲピクチャは、他のピクチャタイプと比較して異なるシグナリング及び導出を有する。相違点のうち一部は以下の通りである。

【0084】

ＩＤＲピクチャのピクチャオーダカウント（ＰＯＣ）値のシグナリング及び導出では、ＰＯＣの最上位ビット（ＭＳＢ）部分は、先行するキーピクチャから導出されず、単純に０に等しく設定される。

【0085】

参照ピクチャ管理に必要な情報をシグナリングすることに関し、ＩＤＲピクチャのスライスヘッダは、参照ピクチャ管理を補助するためにシグナリングされる必要のある情報を含まない。他のピクチャタイプ（すなわち、ＣＲＡ、トレーリング、時間サブレイヤアクセス（temporal sub-layer access；ＴＳＡ）など）の場合、参照ピクチャマーキングプロセス（すなわち、参照のために使用と参照のために不使用とのいずれかで、復号ピクチャバッファ（decoded picture buffer；ＤＰＢ）内の参照ピクチャのステータスを決定するプロセス）のために、例えば後述する参照ピクチャセット（reference picture set；ＲＰＳ）又は他の形態の同様の情報（例えば、参照ピクチャリスト）などの情報が必要とされる。しかし、ＩＤＲピクチャの場合、そのような情報はシグナリングされる必要がない。何故なら、ＩＤＲの存在が、復号プロセスが単純に、ＤＰＢ内の全ての参照ピクチャを、参照のために不使用としてマークするものであることを指し示すからである。

【0086】

ＨＥＶＣ及びＶＶＣでは、ＩＲＡＰピクチャ４０２及びリーディングピクチャ４０４は各々、単一のネットワーク抽象化層（network abstraction layer；ＮＡＬ）ユニット内に含まれ得る。ＮＡＬユニットのセットがアクセスユニットと呼ばれることがある。ＩＲＡＰピクチャ４０２とリーディングピクチャ４０４は、それらがシステムレベルアプリケーションによって容易に識別されることができるように、異なるＮＡＬユニットタイプを与えられる。例えば、ビデオスプライサは、特に、非ＩＲＡＰピクチャからＩＲＡＰピクチャ４０２を識別するため、及び、ＲＡＳＬピクチャ及びＲＡＤＬピクチャを決定することを含めて、トレーリングピクチャ４０６からリーディングピクチャ４０４を特定するために、コーディングされたビットストリーム内の構文要素のあまりにも多くの詳細を理解する必要なく、コーディングされたピクチャタイプを理解する必要がある。トレーリングピクチャ４０６は、ＩＲＡＰピクチャ４０２に関連付けられ且つ提示順４１０でＩＲＡＰピクチャ４０２の後にあるピクチャである。あるピクチャが、復号順４０８で特定のＩＲＡＰピクチャ４０２の後にあり且つ復号順４０８でいずれか他のＩＲＡＰピクチャ４０２に先行することがある。これに対し、ＩＲＡＰピクチャ４０２及びリーディングピクチャ４０４にそれら自身のＮＡＬユニットタイプを与えることがこのような適用を助ける。

【0087】

ＨＥＶＣでは、ＩＲＡＰピクチャ向けのＮＡＬユニットタイプは以下を含む：
リーディングピクチャを伴うＢＬＡ（ＢＬＡ＿Ｗ＿ＬＰ）：復号順で１つ以上のリーディングピクチャに続かれ得るブロークンリンクアクセス（ＢＬＡ）ピクチャのＮＡＬユニット；
ＲＡＤＬを伴うＢＬＡ（ＢＬＡ＿Ｗ＿ＲＡＤＬ）：復号順で１つ以上のＲＡＤＬピクチャに続かれ得るがＲＡＳＬピクチャには続かれないＢＬＡピクチャのＮＡＬユニット；
リーディングピクチャを伴わないＢＬＡ（ＢＬＡ＿Ｎ＿ＬＰ）：復号順でリーディングピクチャに続かれないＢＬＡピクチャのＮＡＬユニット；
ＲＡＤＬを伴うＩＤＲ（ＩＤＲ＿Ｗ＿ＲＡＤＬ）：復号順で１つ以上のＲＡＤＬピクチャに続かれ得るがＲＡＳＬピクチャには続かれないＩＤＲピクチャのＮＡＬユニット；
リーディングピクチャを伴わないＩＤＲ（ＩＤＲ＿Ｎ＿ＬＰ）：復号順でリーディングピクチャに続かれないＩＤＲピクチャのＮＡＬユニット；
ＣＲＡ：リーディングピクチャ（すなわち、ＲＡＳＬピクチャ若しくはＲＡＤＬピクチャのいずれか、又は両方）に続かれ得るクリーンランダムアクセス（ＣＲＡ）ピクチャのＮＡＬユニット；
ＲＡＤＬ：ＲＡＤＬピクチャのＮＡＬユニット；
ＲＡＳＬ：ＲＡＳＬピクチャのＮＡＬユニット。

【0088】

ＶＶＣでは、ＩＲＡＰピクチャ４０２及びリーディングピクチャ４０４向けのＮＡＬユニットタイプは以下の通りである：
ＲＡＤＬを伴うＩＤＲ（ＩＤＲ＿Ｗ＿ＲＡＤＬ）：復号順で１つ以上のＲＡＤＬピクチャに続かれ得るがＲＡＳＬピクチャには続かれないＩＤＲピクチャのＮＡＬユニット；
リーディングピクチャを伴わないＩＤＲ（ＩＤＲ＿Ｎ＿ＬＰ）：復号順でリーディングピクチャに続かれないＩＤＲピクチャのＮＡＬユニット；
ＣＲＡ：リーディングピクチャ（すなわち、ＲＡＳＬピクチャ若しくはＲＡＤＬピクチャのいずれか、又は両方）に続かれ得るクリーンランダムアクセス（ＣＲＡ）ピクチャのＮＡＬユニット；
ＲＡＤＬ：ＲＡＤＬピクチャのＮＡＬユニット；
ＲＡＳＬ：ＲＡＳＬピクチャのＮＡＬユニット。

【0089】

参照ピクチャリサンプリング（ＲＰＲ）機能は、解像度変化位置にあるピクチャのイントラコーディングの必要なしに、ビットストリームの途中で、コーディングされるピクチャの空間解像度を変更する能力である。これを可能にするには、ピクチャが、インター予測目的で、空間解像度が現在ピクチャのそれとは異なる１つ以上の参照ピクチャを参照することができる必要がある。従って、そのような参照ピクチャ又はその一部のリサンプリングが、現在ピクチャの符号化及び復号のために必要とされる。それ故に、ＲＰＲという名称である。この機能は、適応解像度変更（adaptive resolution change；ＡＲＣ）又は他の名称で呼ばれることもある。以下を含めて、ＲＰＲ機能の恩恵を受けるユースケース又は適用シナリオが存在する。

【0090】

ビデオ電話及び会議におけるレート適応。これは、変化するネットワーク状態に対して、コーディングされる映像を適応させるためのものである。ネットワーク状態が悪化して、利用可能な帯域幅が小さくなるとき、エンコーダは、より低解像度のピクチャを符号化することによって、それに適応し得る。

【0091】

マルチパーティビデオ会議におけるアクティブスピーカ変化。マルチパーティビデオ会議では、アクティブスピーカに対する映像サイズが、残りの会議参加者に対する映像サイズよりも大きい又は広いことが一般的である。アクティブスピーカが変わるとき、各参加者に対するピクチャ解像度も調節される必要があり得る。ＡＲＣ機能を持つことの必要性は、アクティブスピーカが変わることが頻繁に発生する場合にいっそう重要になる。

【0092】

ストリーミングにおける高速スタート。ストリーミングアプリケーションでは、ピクチャを表示し始める前に、アプリケーションが、ある一定長さの復号ピクチャに至るまでバッファリングするのが一般的である。より低い解像度でビットストリームを始めることは、アプリケーションが、より速く表示を開始するのに十分なピクチャをバッファ内に持つことを可能にする。

【0093】

ストリーミングにおける適応ストリームスイッチング。ダイナミックアダプティブストリーミング・オーバ・ＨＴＴＰ（ＤＡＳＨ）仕様は、＠ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄという名称の機能を含んでいる。この機能は、例えばＨＥＶＣにおける関連ＲＡＳＬピクチャを伴うＣＲＡピクチャといった、復号不可能なリーディングピクチャを有するオープンＧＯＰランダムアクセスポイントで、異なる表現間での切り換えを可能にする。同じ映像の２つの異なる表現が異なるビットレートを持つが、空間分解能は同じで、それらが同じ値の＠ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄを持つとき、関連ＲＡＳＬピクチャを伴うＣＲＡピクチャにて２つの表現間の切り換えを行うことができ、切り換え位置のＣＲＡピクチャに伴うＲＡＳＬピクチャを許容可能な品質で復号することができ、それ故にシームレスな切り換えを可能にする。ＡＲＣを用いることで、＠ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄ機能はまた、異なる空間解像度を持つＤＡＳＨ表現間での切り換えにも使用できる。

【0094】

例えばピクチャ解像度のリスト、ＤＰＢ内の参照ピクチャのリサンプリングの何らかの制約などのシグナリングなど、様々な方法が、ＲＰＲ／ＡＲＣをサポートするための基本的な技術を支援する。また、ジュネーブでの第１４回ＪＶＥＴミーティングにおいて、ＲＰＲをサポートするためにＶＶＣに適用されるべき制約を提案する幾つかの寄稿があった。提案された制約は、以下を含む。

【0095】

現在ピクチャが当該現在ピクチャとは異なる解像度を持つ参照ピクチャを参照するとき、当該現在ピクチャ内のブロックのコーディングに対して、一部のツールは無効にされるものとする。それらツールは以下を含む。

【0096】

時間動きベクトル予測（temporal motion vector prediction；ＴＭＶＰ）及びアドバンストＴＭＶＰ（ＡＴＭＶＰ）。これは、ＪＶＥＴ－Ｎ０１１８によって提案されたものである。

【0097】

デコーダ側動きベクトル精緻化（decoder side motion vector refinement；ＤＭＶＲ）。これは、ＪＶＥＴ－Ｎ０２７９によって提案されたものである。

【0098】

双方向オプティカルフロー（bi-directional optical flow；ＢＩＯ）。これは、ＪＶＥＴ－Ｎ０２７９によって提案されたものである。

【0099】

現在ピクチャとは異なる解像度を持つ参照ピクチャからのブロックの双予測は許可されない。これは、ＪＶＥＴ－Ｎ０１１８によって提案されたものである。

【0100】

動きの補償に関し、サンプルフィルタリングは１回だけ適用することとし、すなわち、より微細なペル解像度（例えば、１／４ペル解像度）に達するためにリサンプリング及び補間が必要とされる場合に、これら２つのフィルタを組み合わせて１回だけ適用する必要がある。これは、ＪＶＥＴ－Ｎ０１１８によって提案されたものである。

【0101】

映像コーディングにおけるスケーラビリティは、通常、マルチレイヤコーディング技術を使用することによってサポートされる。マルチレイヤビットストリームは、ベースレイヤ（ＢＬ）及び１つ以上のエンハンスメントレイヤ（ＥＬ）を含む。スケーラビリティの例は、空間スケーラビリティ、品質／信号対雑音（ＳＮＲ）スケーラビリティ、マルチビュースケーラビリティなどを含む。マルチレイヤコーディング技術が使用されるとき、ピクチャ又はその一部は、（１）参照ピクチャを使用せずに、すなわち、イントラ予測を用いて、（２）同じレイヤ内にある参照ピクチャを参照することによって、すなわち、インター予測を用いて、又は（３）（１つ以上の）他のレイヤ内にある参照ピクチャを参照することによって、すなわち、インターレイヤ予測を用いて、コーディングされ得る。現在ピクチャのインターレイヤ予測に用いられる参照ピクチャは、インターレイヤ参照ピクチャ（ＩＬＲＰ）と呼ばれる。

【0102】

図５は、空間スケーラビリティ５００のためのマルチレイヤコーディングの一例を示している。レイヤＮ内のピクチャ５０２は、レイヤＮ＋１内のピクチャ５０４とは異なる解像度（例えば、より低い解像度）を持つ。一実施形態において、レイヤＮがベース層であるとみなされ、レイヤＮ＋１が上述のエンハンスメントレイヤであるとみなされる。レイヤＮ内のピクチャ５０２、及びレイヤＮ＋１内のピクチャ５０４は、（実線の矢印によって示すように）インター予測を用いてコーディングされ得る。ピクチャ５０２はまた、（破線の矢印によって示すように）インターレイヤ予測を用いてコーディングされてもよい。

【0103】

ＲＰＲの文脈において、参照ピクチャは、より下位のレイヤから参照ピクチャを選択することによって、又はインターレイヤ予測を用いて、より下位のレイヤの参照ピクチャに基づいて、より上位のレイヤの参照ピクチャを生成することによって、のいずれかでリサンプリングされ得る。

【0104】

以前のＨ．２６ｘ映像コーディングファミリは、シングルレイヤコーディング向けの（１つ以上の）プロファイルとは別の（１つ以上の）プロファイルにて、スケーラビリティのサポートを提供してきた。スケーラブルビデオコーディング（ＳＶＣ）は、空間、時間及び品質スケーラビリティのサポートを提供するＡＶＣ／Ｈ．２６４のスケーラブル拡張である。ＳＶＣでは、ＥＬピクチャ内の各マクロブロック（ＭＢ）内で、当該ＥＬＭＢが下位レイヤからのコロケートブロックを用いて予測されるかを指し示すフラグがシグナリングされる。コロケートブロックからの予測は、テクスチャ、動きベクトル、及び／又はコーディングモードを含み得る。ＳＶＣの実装は、それらの設計において、変更なしのＨ．２６４／ＡＶＣ実装をそのまま再利用することができない。ＳＶＣＥＬマクロブロック構文及び復号プロセスは、Ｈ．２６４／ＡＶＣ構文及び復号プロセスとは異なる。

【0105】

スケーラブルＨＥＶＣ（ＳＨＶＣ）は、空間及び品質スケーラビリティのサポートを提供するＨＥＶＣ／Ｈ．２６５標準の拡張であり、マルチビューＨＥＶＣ（ＭＶ－ＨＥＶＣ）は、マルチビュースケーラビリティのサポートを提供するＨＥＶＣ／Ｈ．２６５の拡張であり、３ＤＨＥＶＣ（３Ｄ－ＨＥＶＣ）は、ＭＶ－ＨＥＶＣよりも高度で効率的な三次元（３Ｄ）映像コーディングのサポートを提供するＨＥＶＣ／Ｈ．２６４の拡張である。なお、時間スケーラビリティはシングルレイヤＨＥＶＣコーデックの不可分な部分として含められている。ＨＥＶＣのマルチレイヤ拡張の設計は、インターレイヤ予測に使用される復号ピクチャは、同一のアクセスユニット（ＡＵ）のみに由来して長期参照ピクチャ（ＬＴＲＰ）として扱われ、且つ現在レイヤ内の他の時間参照ピクチャと共に（１つ以上の）参照ピクチャリストにおける参照インデックスを割り当てられる、という考えを採用している。インターレイヤ予測（ＩＬＰ）は、（１つ以上の）参照ピクチャリスト内の（１つ以上の）インターレイヤ参照ピクチャを参照するための参照インデックスの値を設定することによって、予測ユニット（ＰＵ）レベルで達成される。

【0106】

特に、参照ピクチャリサンプリング機能及び空間スケーラビリティ機能はどちらも、参照ピクチャ又はその一部のリサンプリングを必要とする。参照ピクチャリサンプリングは、ピクチャレベル又はコーディングブロックレベルのいずれかで実現されることができる。しかしながら、ＲＰＲをコーディング機能として参照するとき、それはシングルレイヤコーディング向けの機能である。そうであっても、シングルレイヤコーディングのＲＰＲ機能と、マルチレイヤコーディング向けの空間スケーラビリティ機能との両方に、同じリサンプリングフィルタを使用することは可能であり、また、コーデック設計の観点からは好ましいものでさえある。

【0107】

ＪＶＥＴ－Ｎ０２７９は、ＲＰＲに対してＢＩＯを無効にすることを提案した。より正確には、それが提案したのは、ＲＰＲが有効にされるとき、コーディングされる映像シーケンス（ＣＶＳ）全体に対してＢＩＯ（ＢＤＯＦとしても知られる）の使用を無効にするというものである。分かることには、ＲＰＲ機能が有効にされるときであっても、現在ピクチャは、多くの場合に、異なる解像度を持つ参照ピクチャを参照しない。従って、ＣＶＳ全体に対してＢＩＯを無効にすることは、コーディング効率を不必要に制限して損ね得る。

【0108】

ここに開示されるのは、ＲＰＲが有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にする技術である。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、プロセッサ、メモリ、及び／又はネットワークリソースの使用が、エンコーダ及びデコーダの双方で削減され得る。従って、映像コーディングにおけるコーダ／デコーダ（“コーデック”としても知られる）が、現行コーデックに対して改善される。実際問題として、改善された映像コーディングプロセスは、映像が送信され、受信され、及び／又は見られるときに、ユーザにより良いユーザ体験を提供する。

【0109】

図６は、片方向インター予測６００の一例を示す概略図である。片方向インター予測６００は、ピクチャをパーティショニングするときに作り出される符号化及び／又は復号ブロックに対する動きベクトルを決定するために使用されることができる。

【0110】

片方向インター予測６００は、現在フレーム６１０内の現在ブロック６１１を予測するために、参照ブロック６３１を有する参照フレーム６３０を使用する。参照フレーム６３０は、図示のように、時間的に現在フレーム６１０の後に（例えば、後続の参照フレームとして）位置し得るが、一部の例において、時間的に現在フレーム６１０の前に（例えば、先行する参照フレームとして）位置することもできる。現在フレーム６１０は、ある特定の時点に符号化／復号されているフレーム／ピクチャの例である。現在フレーム６１０は、現在ブロック６１１内に、参照フレーム６３０の参照ブロック６３１内のオブジェクトと一致するオブジェクトを含む。参照フレーム６３０は、現在フレーム６１０を符号化するための基準として使用されるフレームであり、参照ブロック６３１は、現在フレーム６１０の現在ブロック６１１にも含まれるオブジェクトを含んだ参照フレーム６３０内のブロックである。

【0111】

現在ブロック６１１は、コーディングプロセスにおける特定の時点に符号化／復号されている任意のコーディングユニットである。現在ブロック６１１は、パーティショニングされたブロックの全体であってもよいし、あるいは、アフィンインター予測モードを使用するときのサブブロックであってもよい。現在フレーム６１０は、いくらかの時間距離（ＴＤ）６３３だけ参照フレーム６３０から離隔している。ＴＤ６３３は、映像シーケンスにおける現在フレーム６１０と参照フレーム６３０との間の時間の量を示し、フレーム単位で測定され得る。現在ブロック６１１に対する予測情報は、参照フレーム６３０及び／又は参照ブロック６３１を、これらのフレーム間の方向及び時間距離を指し示す参照インデックスによって参照し得る。ＴＤ６３３によって表される期間を通じて、現在ブロック６１１内のオブジェクトは、現在フレーム６１０内の位置から参照フレーム６３０内の別の位置（例えば、参照ブロック６３１の位置）に移動する。例えば、オブジェクトは、経時的なオブジェクトの移動の方向である動き軌跡６１３に沿って移動し得る。動きベクトル６３５が、ＴＤ６３３を通じての動き軌跡６１３に沿ったオブジェクトの移動の方向及び大きさを記述する。従って、符号化された動きベクトル６３５と、参照ブロック６３１と、現在ブロック６１１と参照ブロック６３１との間の差を含む残差とで、現在ブロック６１１を再構成するとともに現在フレーム６１０内で現在ブロック６１１を位置決めするのに十分な情報を提供する。

【0112】

図７は、双方向インター予測７００の一例を示す概略図である。双方向インター予測７００は、ピクチャをパーティショニングするときに作り出される符号化及び／又は復号ブロックに対する動きベクトルを決定するために使用されることができる。

【0113】

双方向インター予測７００は、片方向インター予測６００と同様であるが、現在フレーム７１０内の現在ブロック７１１を予測するために一対の参照フレームを使用する。従って、現在フレーム７１０及び現在ブロック７１１は、それぞれ、現在フレーム６１０及び現在ブロック６１１と実質的に同様である。現在フレーム７１０は、時間的に、映像シーケンス内で現在フレーム７１０の前に現れる先行参照フレーム７２０と、映像シーケンス内で現在フレーム７１０の後に現れる後続参照フレーム７３０との間に位置する。先行参照フレーム７２０及び後続参照フレーム７３０は、他の点では参照フレーム６３０と実質的に同様である。

【0114】

現在ブロック７１１は、先行参照フレーム７２０内の先行参照ブロック７２１と、後続参照フレーム７３０内の後続参照ブロック７３１とに一致している。このような一致は、映像シーケンスの過程において、オブジェクトが、先行参照ブロック７２１での位置から、動き軌跡７１３に沿って、現在ブロック７１１を介して、後続参照ブロック７３１での位置まで移動することを指し示す。現在フレーム７１０は、いくらかの先行時間距離（ＴＤ０）７２３だけ先行参照フレーム７２０から離隔するとともに、いくらかの後続時間距離（ＴＤ１）７３３だけ後続参照フレーム７３０から離隔している。ＴＤ０７２３は、映像シーケンスにおける先行参照フレーム７２０と現在フレーム７１０との間の時間の量をフレーム単位で示す。ＴＤ１７３３は、映像シーケンスにおける現在フレーム７１０と後続参照フレーム７３０との間の時間の量をフレーム単位で示す。従って、オブジェクトは、ＴＤ０７２３によって示される期間を通じて、動き軌跡７１３に沿って、先行参照ブロック７２１から現在ブロック７１１まで移動する。物体はまた、ＴＤ１７３３によって示される期間を通じて、動き軌跡７１３に沿って、現在ブロック７１１から後続参照ブロック７３１まで移動する。現在ブロック７１１に対する予測情報は、先行参照フレーム７２０及び／又は先行参照ブロック７２１並びに後続参照フレーム７３０及び／又は後続参照ブロック７３１を、これらのフレーム間の方向及び時間距離を指し示す一対の参照インデックスによって参照し得る。

【0115】

先行動きベクトル（ＭＶ０）７２５は、（例えば、先行参照フレーム７２０と現在フレーム７１０との間の）ＴＤ０７２３を通じての動き軌跡７１３に沿ったオブジェクトの移動の方向及び大きさを記述する。後続動きベクトル（ＭＶ１）７３５は、（例えば、現在フレーム７１０と後続参照フレーム７３０との間の）ＴＤ１７３３を通じての動き軌跡７１３に沿ったオブジェクトの移動の方向及び大きさを記述する。従って、双方向インター予測７００において、現在ブロック７１１は、先行参照ブロック７２１及び／又は後続参照ブロック７３１、ＭＶ０７２５、及びＭＶ１７３５を使用することによってコーディング及び再構成されることができる。

【0116】

一実施形態において、インター予測及び／又は双方向インター予測は、ブロック毎に基づいてではなく、サンプル毎（例えば、ピクセル毎）に基づいて実行され得る。すなわち、現在ブロック７１１内の各サンプルに対して、先行参照ブロック７２１及び／又は後続参照ブロック７３１内の各サンプルを指す動きベクトルを決定することができる。そのような実施形態では、図７に示した動きベクトル７２５及び動きベクトル７３５は、現在ブロック７１１、先行参照ブロック７２１、及び後続参照ブロック７３１内の複数のサンプルに対応する複数の動きベクトルを表す。

【0117】

マージモード及びアドバンスト動きベクトル予測（ＡＭＶＰ）モードのどちらでも、候補リスト決定パターンによって定義された順序で候補動きベクトルを候補リストに追加することによって、候補リストが生成される。そのような候補動きベクトルは、片方向インター予測６００、双方向インター予測７００、又はこれらの組み合わせに従った動きベクトルを含み得る。具体的には、隣接ブロックに対して、それらのブロックが符号化されるときに動きベクトルが生成される。そのような動きベクトルが現在ブロック向けの候補リストに追加され、そして、該候補リストから、現在ブロックに対する動きベクトルが選択される。そして、動きベクトルは、候補リスト内の選択された動きベクトルのインデックスとしてシグナリングされることができる。デコーダは、エンコーダと同じプロセスを用いて候補リストを構築することができ、シグナリングされたインデックスに基づいて候補リストから選択された動きベクトルを決定することができる。従って、候補動きベクトルは、このような隣接ブロックが符号化されるときにどのアプローチが用いられたかに応じて、片方向インター予測６００及び／又は双方向インター予測７００に従って生成された動きベクトルを含む。

【0118】

図８は、映像ビットストリーム８００を示している。ここで使用されるとき、映像ビットストリーム８００は、コーディングされた映像ビットストリーム、ビットストリーム、又はこれらの変形としても参照され得る。図８に示すように、ビットストリーム８００は、シーケンスパラメータセット（ＳＰＳ）８０２、ピクチャパラメータセット（ＰＰＳ）８０４、スライスヘッダ８０６、及び画像データ８０８を含む。

【0119】

ＳＰＳ８０２は、一連のピクチャ（sequence of pictures；ＳＯＰ）内の全てのピクチャに共通のデータを含む。対照的に、ＰＰＳ８０４は、ピクチャ全体に共通のデータを含む。スライスヘッダ８０６は、例えば、スライスタイプ、及び参照ピクチャのうちのどれが使用されることになるかなど、現在スライスについての情報を含む。ＳＰＳ８０２及びＰＰＳ８０４は、概してパラメータセットと称されることがある。ＳＰＳ８０２、ＰＰＳ８０４、及びスライスヘッダ８０６は、ネットワーク抽象化層（ＮＡＬ）ユニットのタイプである。ＮＡＬユニットは、従うデータのタイプ（例えば、コーディングされた映像データ）のインジケーションを含む構文構造体である。ＮＡＬユニットは、映像コーディングレイヤ（ＶＣＬ）と非ＶＣＬＮＡＬユニットとに分類される。ＶＣＬＮＡＬユニットは、映像ピクチャ内のサンプルの値を表すデータを含み、非ＶＣＬＮＡＬユニットは、例えばパラメータセット（多数のＶＣＬＮＡＬユニットに適用することができる重要なヘッダデータ）及び補足強化情報（映像ピクチャ内のサンプルの値を復号するのに必要ではないが、復号映像信号の有用性を高め得るタイミング情報及びその他の補足データ）などの、何らかの関連する追加情報を含む。当業者が理解することには、実際の用途において、ビットストリーム８００は他のパラメータ及び情報を含み得る。

【0120】

図８の画像データ８０８は、符号化又は復号されている画像又は映像に関連するデータを有する。画像データ８０８は、単にビットストリーム８００内で搬送されるペイロード又はデータとして参照されてもよい。一実施形態において、画像データ８０８は、複数のピクチャ８１０を含むＣＶＳ８１４（又はＣＬＶＳ）を有する。ＣＶＳ８１４は、映像ビットストリーム８００内の全てのコーディングされたレイヤ映像シーケンス（coded layer video sequence；ＣＬＶＳ）についての、コーディングされた映像シーケンスである。特に、映像ビットストリーム８００が単一のレイヤを含むときには、ＣＶＳとＣＬＶＳは同じである。ＣＶＳとＣＬＶＳは、映像ビットストリーム８００が複数のレイヤを含むときにのみ異なる。

【0121】

図８に示すように、各ピクチャ８１０のスライスは、それ自身のＶＣＬＮＡＬユニット８１２の中に含まれ得る。ＣＶＳ８１４内のＶＣＬＮＡＬユニット８１２のセットをアクセスユニットと称することがある。

【0122】

図９は、ピクチャ９１０に対するパーティショニング技術９００を示している。ピクチャ９１０は、図８のピクチャ８１０のいずれとも同様とし得る。図示のように、ピクチャ９１０は、複数のスライス９１２にパーティショニングされ得る。スライスは、同一フレーム内のいずれの他の領域とも別々に符号化される、フレーム（例えば、ピクチャ）の空間的に異なる領域である。図９には３つのスライス９１２を示しているが、実際の適用では、より多数又は少数のスライスが使用され得る。各スライス９１２は、複数のブロック９１４にパーティショニングされ得る。図９のブロック９１４は、図７の現在ブロック７１１、先行参照ブロック７２１、及び後続参照ブロック７３１と同様とし得る。ブロック９１４はＣＵを表すことがある。図９には４つのブロック９１４を示しているが、実際の適用では、より多数又は少数のブロックが使用され得る。

【0123】

各ブロック９１４は、複数のサンプル９１６（例えば、ピクセル）にパーティショニングされ得る。一実施形態において、各ブロック９１４のサイズはルマサンプルで測定される。図９には１６個のサンプル９１６を示しているが、実際の適用では、より多数又は少数のサンプルが使用され得る。

【0124】

図１０は、ビデオデコーダ（例えば、ビデオデコーダ３０）によって実装される、コーディングされた映像ビットストリームを復号する方法１０００の一実施形態である。方法１０００は、復号されるビットストリームがビデオエンコーダ（例えば、ビデオエンコーダ２０）から直接的又は間接的に受信された後に実行され得る。方法１０００は、ＲＰＲが有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にすることによって、復号プロセスを改善する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、実際問題として、コーデックの性能が改善され、それが、より良いユーザ体験につながる。

【0125】

ブロック１００２にて、ビデオデコーダは、復号している現在ピクチャの解像度が、参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定する。一実施形態において、ビデオデコーダは、コーディングされた映像ビットストリーム（例えば、ビットストリーム８００）を受信する。コーディングされた映像ビットストリームは、参照ピクチャリストを含み、現在ピクチャの解像度を指し示し、且つ双方向インター予測モードを指し示す。一実施形態において、参照ピクチャリスト構造が参照ピクチャリストを含む。一実施形態において、参照ピクチャリストは、双方向インター予測のために使用される。一実施形態において、現在ピクチャの解像度は、コーディングされた映像ビットストリームのパラメータセット内に配される。一実施形態において、参照ピクチャの解像度は、現在ピクチャに基づいて導出され、現在のピクチャの解像度に基づいて推定され、ビットストリームから構文解析され、あるいは他の方法で取得される。一実施形態において、現在ピクチャに対する参照ピクチャは、双方向インター予測モードに従って、参照ピクチャリストに基づいて生成される。

【0126】

ブロック１００４にて、現在ピクチャの解像度が参照ピクチャの各々の解像度と同じであると決定されたとき、ビデオデコーダは、現在ピクチャの現在ブロックに対してＢＤＯＦを有効にする。一実施形態において、ビデオデコーダは、ＢＤＯＦフラグを第１の値（例えば、真、１など）に設定することによってＢＤＯＦを有効にする。一実施形態において、ＢＤＯＦが有効にされるときであっても、ＢＤＯＦはオプションのプロセスである。すなわち、ＢＤＯＦが有効にされるときであっても、ＢＤＯＦを実行する必要があるというわけではない。

【0127】

ブロック１００６にて、現在ピクチャの解像度が参照ピクチャのうちのいずれかの解像度と異なるとき、ビデオデコーダは、現在ピクチャの現在ブロックに対してＢＤＯＦを無効にする。一実施形態において、ビデオデコーダは、ＢＤＯＦフラグを第２の値（例えば、偽、０）に設定することによってＢＤＯＦを無効にする。

【0128】

ブロック１００８にて、ＢＤＯＦフラグが第１の値に設定されたとき、ビデオデコーダは、現在ブロックに対応する動きベクトルを精緻化する。一実施形態において、方法１０００は更に、現在ピクチャ内の他のブロックに対して、現在ピクチャの解像度が参照ピクチャの解像度と異なるのか、それとも同じであるのかに応じて、ＢＤＯＦを選択的に有効にする及び無効にすることを有する。

【0129】

一実施形態において、当該方法は更に、ＢＤＯＦが無効にされるときであっても、現在ピクチャを含むコーディングされた映像シーケンス（ＣＶＳ）全体に対して参照ピクチャリサンプリング（ＲＰＲ）を有効にすることを有する。

【0130】

一実施形態において、現在ブロックは、現在ピクチャのスライスから取得される。一実施形態において、現在ピクチャは複数のスライスを有し、現在ブロックは、該複数のスライスからのスライスから取得される。

【0131】

一実施形態において、現在ピクチャに基づいて生成された画像が、エレクトロニクス装置（例えば、スマートフォン、タブレット、ラップトップ、パーソナルコンピュータなど）のユーザに対して表示される。

【0132】

図１１は、ビデオエンコーダ（例えば、ビデオエンコーダ２０）によって実装される、映像ビットストリームを符号化する方法１１００の一実施形態である。方法９００は、（例えば、ビデオからの）ピクチャを映像ビットストリームへと符号化し、そして、ビデオデコーダ（例えば、ビデオデコーダ３０）に向けて送信されるときに実行され得る。方法１１００は、ＲＰＲが有効にされるときにＣＶＳ全体に対してＢＤＯＦを無効にしなければならないことに代えて、現在ピクチャの空間解像度が参照ピクチャの空間解像度と異なるときにＢＤＯＦが選択的に無効にされることを可能にすることによって、符号化プロセスを改善する。斯くしてＢＤＯＦを選択的に無効にする能力を持つことにより、コーディング効率が改善され得る。従って、実際問題として、コーデックの性能が改善され、それが、より良いユーザ体験につながる。

【0133】

ブロック１１０２にて、ビデオエンコーダは、符号化している現在ピクチャの解像度が、参照ピクチャリストによって特定される参照ピクチャの解像度と同じであるかを決定する。一実施形態において、参照ピクチャリスト構造が参照ピクチャリストを含む。一実施形態において、参照ピクチャリストは、双方向インター予測のために使用される。一実施形態において、現在ピクチャの解像度は、映像ビットストリームのパラメータセット内に符号化される。一実施形態において、現在ピクチャに対する参照ピクチャは、双方向インター予測モードに従って、参照ピクチャリストに基づいて生成される。

【0134】

ブロック１１０４にて、現在ピクチャの解像度が参照ピクチャの各々の解像度と同じであると決定されたとき、ビデオエンコーダは、現在ピクチャの現在ブロックに対してＢＤＯＦを有効にする。一実施形態において、ビデオエンコーダは、ＢＤＯＦフラグを第１の値（例えば、真、１など）に設定することによってＢＤＯＦを有効にする。一実施形態において、ＢＤＯＦが有効にされるときであっても、ＢＤＯＦはオプションのプロセスである。すなわち、ＢＤＯＦが有効にされるときであっても、ＢＤＯＦを実行する必要があるというわけではない。

【0135】

一実施形態において、当該方法は、参照ピクチャに基づいて現在ピクチャに関する動きベクトルを決定することと、動きベクトルに基づいて現在ピクチャを符号化することと、仮説的リファレンスデコーダ（hypothetical reference decoder；ＨＲＤ）を用いて前記現在ピクチャを復号することと、を含む。

【0136】

ブロック１１０６にて、現在ピクチャの解像度が参照ピクチャのうちのいずれかの解像度と異なるとき、ビデオエンコーダは、現在ピクチャの現在ブロックに対してＢＤＯＦを無効にする。一実施形態において、ビデオエンコーダは、ＢＤＯＦフラグを第２の値（例えば、偽、０）に設定することによってＢＤＯＦを無効にする。

【0137】

ブロック１１０８にて、ＢＤＯＦフラグが第１の値に設定されたとき、ビデオエンコーダは、現在ブロックに対応する動きベクトルを精緻化する。一実施形態において、方法１１００は更に、現在ピクチャ内の他のブロックに対して、現在ピクチャの解像度が参照ピクチャの解像度と異なるのか、それとも同じであるのかに応じて、ＢＤＯＦを選択的に有効にする及び無効にすることを有する。

【0138】

【0139】

【0140】

一実施形態において、ビデオエンコーダは、現在ブロックを含む映像ビットストリームを生成し、該映像ビットストリームをビデオデコーダに向けて送信する。一実施形態において、ビデオエンコーダは、ビデオデコーダに向けた伝送のために映像ビットストリームを格納する。

【0141】

一実施形態において、映像ビットストリームを復号する方法が開示される。映像ビットストリームは、少なくとも１つのピクチャを有する。各ピクチャが複数のスライスを有する。複数のスライスの各スライスが、複数のコーディングブロック及び複数の参照ピクチャリストを有する。複数の参照ピクチャリストの各参照ピクチャリストが、スライス内のコーディングブロックのインター予測のために使用され得る複数の参照ピクチャを有する。

【0142】

当該方法は、パラメータセットを構文解析して、現在ピクチャの解像度情報を取得することと、現在ピクチャ内の現在スライスの２つの参照ピクチャリストを取得することと、現在スライス内の現在コーディングブロックを復号するための参照ピクチャを決定することと、参照ピクチャの解像度を決定することと、現在ピクチャ及び参照ピクチャの解像度に基づいて、現在コーディングブロックの復号に対して双方向オプティカルフロー（ＢＩＯ）が使用される又は有効にされるかを決定することと、現在コーディングブロックを復号することと、を含む。

【0143】

一実施形態において、当該方法は、現在ピクチャと参照ピクチャの解像度が相異なるときに、現在コーディングブロックの復号に対してＢＩＯが使用されない又は無効にされることを含む。

【0144】

一実施形態において、映像ビットストリームを復号する方法が開示される。映像ビットストリームは、少なくとも１つのピクチャを有する。各ピクチャが複数のスライスを有する。複数のスライスの各スライスに、複数の構文要素を含むヘッダが付随する。複数のスライスの各スライスが、複数のコーディングブロック及び複数の参照ピクチャリストを有する。複数の参照ピクチャリストの各参照ピクチャリストが、現在スライス内のコーディングブロックのインター予測のために使用され得る複数の参照ピクチャを有する。

【0145】

当該方法は、パラメータセットを構文解析して、現在のコーディングされた映像シーケンス内のピクチャの復号に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを規定するフラグを取得することと、現在ピクチャ内の現在スライスを取得することと、現在のコーディングされた映像シーケンス内のピクチャの復号に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを規定するフラグの値が、ＢＩＯが使用され得ることを規定するときに、現在スライスに付随するスライスヘッダを構文解析して、現在スライス内のコーディングブロックの復号にＢＩＯコーディングツールが使用され得るかを規定するフラグを取得することと、を含む。

【0146】

一実施形態において、現在スライス内の現在コーディングブロックの復号にＢＩＯコーディングツールが使用され得るかを規定するフラグの値が、現在スライスの復号に該コーディングツールは使用されることができないことを規定するとき、現在コーディングブロックの復号に対して、ＢＩＯコーディングツールは使用されない又は無効にされる。

【0147】

一実施形態において、存在しないとき、現在スライス内の現在コーディングブロックの復号にＢＩＯコーディングツールが使用され得るかを規定するフラグの値は、現在のコーディングされた映像シーケンス内のピクチャの復号に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを規定するフラグの値とあると推定される。

【0148】

一実施形態において、映像ビットストリームを符号化する方法が開示される。映像ビットストリームは、少なくとも１つのピクチャを有する。各ピクチャが複数のスライスを有する。複数のスライスの各スライスに、複数の構文要素を含むヘッダが付随する。複数のスライスの各スライスが、複数のコーディングブロック及び複数の参照ピクチャリストを有する。複数の参照ピクチャリストの各参照ピクチャリストが、現在スライス内のコーディングブロックのインター予測のために使用され得る複数の参照ピクチャを有する。

【0149】

当該方法は、現在のコーディングされた映像シーケンス内のピクチャの符号化に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを決定することと、パラメータセットを構文解析して、各ピクチャビットストリームの解像度情報を取得することと、現在ピクチャ内の現在スライスの２つの参照ピクチャリストを取得することと、現在スライスの参照ピクチャリストを構文解析して、現在スライスのコーディングブロックの復号に使用され得るアクティブ参照ピクチャを取得することと、以下の条件、すなわち、現在のコーディングされた映像シーケンス内のピクチャの符号化にＢＩＯコーディングツールは使用されることができないという条件、及び現在ピクチャの解像度と参照ピクチャのうちの少なくとも１つの解像度とが異なるという条件、のうち少なくとも１つが満たされる場合に、現在スライス内のコーディングブロックの符号化に対してＢＩＯコーディングツールは使用されることができないと制約することと、を含む。

【0150】

一実施形態において、映像ビットストリームを復号する方法が開示される。ビットストリームは、少なくとも１つのピクチャを有する。各ピクチャが複数のスライスを有する。複数のスライスの各スライスに、複数の構文要素を含むヘッダが付随する。複数のスライスの各スライスが、複数のコーディングブロック及び複数の参照ピクチャリストを有する。複数の参照ピクチャリストの各参照ピクチャリストが、現在スライス内のコーディングブロックのインター予測のために使用され得る複数の参照ピクチャを有する。

【0151】

当該方法は、パラメータセットを構文解析して、現在のコーディングされた映像シーケンス内のピクチャの復号に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを規定するフラグを取得することと、パラメータセットを構文解析して、ピクチャパラメータセット（ＰＰＳ）であるパラメータセットを参照するピクチャの復号に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを規定するフラグを取得することと、を含む。

【0152】

一実施形態において、ＰＰＳを参照するピクチャの復号にＢＩＯコーディングツール／技術が使用され得るかを規定するフラグの値が、該コーディングツールは使用されることができないことを規定するとき、現在コーディングブロックの復号に対して、ＢＩＯコーディングツールは使用されない又は無効にされる。

【0153】

【0154】

一実施形態において、当該方法は、現在のコーディングされる映像シーケンス内のピクチャの符号化に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを決定することと、現在ＰＰＳを参照するピクチャの符号化に双方向オプティカルフロー（ＢＩＯ）コーディングツール／技術が使用され得るかを決定することと、現在のコーディングされるシーケンス内のピクチャの符号化にＢＩＯコーディングツールは使用されることができないときに、現在ＰＰＳを参照するピクチャの符号化に対してＢＩＯコーディングツールは使用されることができないと制約することと、を含む。

【0155】

ここに開示される実施形態を実装するために、以下の構文及びセマンティクスが使用され得る。以下の説明は、最新のＶＶＣドラフト仕様である基本テキストと比較してのものである。換言すれば、違いのみを説明し、以下で言及されない基本テキスト内のテキストはそのまま適用される。基本テキストに対して追加するテキストは太字で示し、削除するテキストは斜字体で示す。

【0156】

参照ピクチャリスト構築プロセスを以下のように更新する。

【0157】

参照ピクチャリストＲｅｆＰｉｃＬｉｓｔ［０］とＲｅｆＰｉｃＬｉｓｔ［１］が以下のように構築される：
（外１）

【0158】

ＢＩＯが使用されるか否かを決定するフラグの導出。

【0159】

predSamplesL0_L、predSamplesL1_L、及びpredSamplesIntra_Lを、予測ルマサンプル値の(cbWidth)×(cbHeight)配列であるとするとともに、predSamplesL0_Cb、predSamplesL1_Cb、predSamplesL0_Cr、及びpredSamplesL1_Cr、predSamplesIntra_Cb、及びpredSamplesIntra_Crを、予測クロマサンプル値の(cbWidth/2)×(cbHeight/2)配列であるとする。
（外２）

【0160】

シーケンスパラメータセット構文及びセマンティクス。
（外３）

【0161】

０に等しいsps_bdof_enabled_flagは、双方向オプティカルフローインター予測が無効にされることを規定する。１に等しいsps_bdof_enabled_flagは、双方向オプティカルフローインター予測が有効にされることを規定する。

【0162】

スライスヘッダ構文及びセマンティクス。
（外４）

【0163】

（外５）

【0164】

ＢＩＯが使用されるか否かを決定するフラグの導出。

【0165】

predSamplesL0L、predSamplesL1L、及びpredSamplesIntraLを、予測ルマサンプル値の(cbWidth)×(cbHeight)配列であるとするとともに、predSamplesL0Cb、predSamplesL1Cb、predSamplesL0Cr、及びpredSamplesL1Cr、predSamplesIntraCb、及びpredSamplesIntraCrを、予測クロマサンプル値の(cbWidth/2)×(cbHeight/2)配列であるとする。
（外６）

【0166】

シーケンスパラメータセット構文及びセマンティクス。
（外７）

【0167】

【0168】

ピクチャパラメータセット構文及びセマンティクス。
（外８）

【0169】

（外９）

【0170】

（外１０）

【0171】

ＢＩＯが使用されるか否かを決定するフラグの導出。

【0172】

【0173】

図１２は、開示の一実施形態に従った映像コーディング装置１２００（例えば、ビデオエンコーダ２０又はビデオデコーダ３０）の概略図である。映像コーディング装置１２００は、ここに記載される開示実施形態を実装するのに適している。映像コーディング装置１２００は、データを受信するための入口ポート１２１０及び受信器ユニット（Ｒｘ）１２２０と、データを処理するプロセッサ、論理ユニット、又は中央演算処理ユニット（ＣＰＵ）１２３０と、データを送信するための送信器ユニット（Ｔｘ）１２４０及び出口ポート１２５０と、データを格納するためのメモリ１２６０とを含んでいる。映像コーディング装置１２００はまた、光信号又は電気信号の出口又は入口のために、入口ポート１２１０、受信器ユニット１２２０、送信器ユニット１２４０、及び出口ポート１２５０に結合された、光－電気（ＯＥ）コンポーネント及び電気－光（ＥＯ）コンポーネントを有し得る。

【0174】

プロセッサ１２３０は、ハードウェア及びソフトウェアによって実装される。プロセッサ１２３０は、１つ以上の、ＣＰＵチップ、コア（例えば、マルチコアプロセッサとして）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、及びデジタル信号プロセッサ（ＤＳＰ）として実装され得る。プロセッサ１２３０は、入口ポート１２１０、受信器ユニット１２２０、送信器ユニット１２４０、出口ポート１２５０、及びメモリ１２６０と連通している。プロセッサ１２３０は、コーディングモジュール１２７０を有する。コーディングモジュール１２７０は、上述の開示実施形態を実装する。例えば、コーディングモジュール１２７０は、様々なコーデック機能を実装し、処理し、準備し、又は提供する。コーディングモジュール１２７０を含むことは、それ故に、映像コーディング装置１２００の機能への実質的な改良を提供し、異なる状態への映像コーディング装置１２００の変換を実現する。あるいは、コーディングモジュール１２７０は、メモリ１２６０に格納されてプロセッサ１２３０によって実行される命令として実装される。

【0175】

映像コーディング装置１２００はまた、ユーザに及びからデータを通信するための入力及び／又は出力（Ｉ／Ｏ）装置１２８０を含み得る。Ｉ／Ｏ装置１２８０は、例えば映像データを表示するためのディスプレイ、オーディオデータを出力するためのスピーカなどの出力装置を含み得る。Ｉ／Ｏ装置１２８０はまた、例えばキーボード、マウス、トラックボールなどの入力装置、及び／又はそのような出力装置とインタラクトするための対応するインタフェースを含み得る。

【0176】

メモリ１２６０は、１つ以上のディスク、テープドライブ、及びソリッドステートドライブを有し、また、オーバーフローデータ記憶デバイスとして使用されて、プログラムが実行のために選択されるときにそのようなプログラムを格納するとともに、プログラム実行中に読み出される命令及びデータを格納し得る。メモリ１２６０は、揮発性及び／又は不揮発性とすることができ、読み出し専用メモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、三値連想メモリ（ternary content-addressable memory、ＴＣＡＭ）、及び／又はスタティックランダムアクセスメモリ（ＳＲＡＭ）とし得る。

【0177】

図１３は、コーディングのための手段１３００の一実施形態の概略図である。一実施形態において、コーディングのための手段１３００は、映像コーディング装置１３０２（例えば、ビデオエンコーダ２０又はビデオデコーダ３０）に実装される。映像コーディング装置１３０２は、受信手段１３０１を含んでいる。受信手段１３０１は、符号化すべきピクチャを受信するように、又は復号すべきビットストリームを受信するように構成される。映像コーディング装置１３０２は、受信手段１３０１に結合された送信手段１３０７を含んでいる。送信手段１３０７は、ビットストリームをデコーダに送信するように、又は復号画像を表示手段（例えば、Ｉ／Ｏ装置１２８０のうちの１つ）に送信するように構成される。

【0178】

映像コーディング装置１３０２は、ストレージ手段１３０３を含んでいる。ストレージ手段１３０３は、受信手段１３０１又は送信手段１３０７のうちの少なくとも一方に結合される。ストレージ手段１３０３は、命令を格納するように構成される。映像コーディング装置１３０２はまた、プロセッシング手段１３０５を含んでいる。プロセッシング手段１３０５は、ストレージ手段１３０３に結合される。プロセッシング手段１３０５は、ストレージ手段１３０３に格納された命令を実行して、ここに開示される方法を実行するように構成される。

【0179】

これまた理解されるべきことには、ここに記載された例示的な方法のステップは、必ずしも、記載された順序で実行される必要はなく、そのような方法のステップの順序は、単に例示的なものであると理解されるべきである。同様に、そのような方法に追加のステップが含められてもよく、また、本開示の様々な実施形態と一致する方法において、ある特定のステップが省略されたり組み合わされたりしてもよい。

【0180】

本開示にて幾つかの実施形態を提示したが、理解されるべきことには、開示されたシステム及び方法は、本開示の精神又は範囲を逸脱することなく、数多くのその他の具体的形態でも具現化され得るものである。ここでの例は、限定的なものではなく、例示的なものと見なされるべきであり、意図することは、ここに与えられた詳細事項に限定されるべきでないということである。例えば、これらの様々な要素又はコンポーネントは、他のシステムにおいて結合あるいは統合されてもよく、あるいは、特定の機構が省略されたり、実装されなかったりしてもよい。

【0181】

また、様々な実施形態において個別あるいは別個であるように記載及び図示された技術、システム、サブシステム及び方法が、本開示の範囲を逸脱することなく、他のシステム、モジュール、技術又は方法と結合あるいは統合され得る。互いに結合されたり、又は直接結合されたり、又は通信したりするとして示された又は説明された他のアイテムは、電気的であるか、機械的であるか、又は他の方法であるかにかかわらず、何らかのインタフェース、デバイス、又は中間コンポーネントを介して間接的に結合されたり、又は通信したりしてもよい。変形、代用及び改変のその他の例が、当業者によって解明可能であり、ここに開示された精神及び範囲を逸脱することなく為され得る。

【図1】