IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ホアウェイ・テクノロジーズ・カンパニー・リミテッドの特許一覧

特開2024-144440エンコーダ、デコーダ、および対応する方法
<>
  • 特開-エンコーダ、デコーダ、および対応する方法 図1
  • 特開-エンコーダ、デコーダ、および対応する方法 図2
  • 特開-エンコーダ、デコーダ、および対応する方法 図3
  • 特開-エンコーダ、デコーダ、および対応する方法 図4
  • 特開-エンコーダ、デコーダ、および対応する方法 図5
  • 特開-エンコーダ、デコーダ、および対応する方法 図6A
  • 特開-エンコーダ、デコーダ、および対応する方法 図6B
  • 特開-エンコーダ、デコーダ、および対応する方法 図6C
  • 特開-エンコーダ、デコーダ、および対応する方法 図7
  • 特開-エンコーダ、デコーダ、および対応する方法 図8
  • 特開-エンコーダ、デコーダ、および対応する方法 図9
  • 特開-エンコーダ、デコーダ、および対応する方法 図10
  • 特開-エンコーダ、デコーダ、および対応する方法 図11
  • 特開-エンコーダ、デコーダ、および対応する方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024144440
(43)【公開日】2024-10-11
(54)【発明の名称】エンコーダ、デコーダ、および対応する方法
(51)【国際特許分類】
   H04N 19/70 20140101AFI20241003BHJP
   H04N 19/52 20140101ALI20241003BHJP
【FI】
H04N19/70
H04N19/52
【審査請求】有
【請求項の数】10
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024114166
(22)【出願日】2024-07-17
(62)【分割の表示】P 2021559241の分割
【原出願日】2020-04-02
(31)【優先権主張番号】62/828,875
(32)【優先日】2019-04-03
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/864,958
(32)【優先日】2019-06-21
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】504161984
【氏名又は名称】ホアウェイ・テクノロジーズ・カンパニー・リミテッド
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133569
【弁理士】
【氏名又は名称】野村 進
(72)【発明者】
【氏名】フヌ・ヘンドリー
(72)【発明者】
【氏名】イェ-クイ・ワン
(57)【要約】
【課題】ビデオコーディング機構が開示される。
【解決手段】この機構は、フラグと、イントラランダムアクセスポイント(IRAP)ピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信することを含む。フラグが第1の値に設定されるとき、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にある。フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にある。IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャが、フラグに基づいて復号順序において復号される。
【選択図】図7
【特許請求の範囲】
【請求項1】
デコーダにおいて実施される方法であって、
前記デコーダの受信機によって、フラグと、イントラランダムアクセスポイント(IRAP)
ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数
のコーディングされたピクチャとを備える、ビットストリームを受信するステップと、
前記フラグが第1の値に設定されるとき、前記デコーダのプロセッサによって、前記IRA
Pピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチ
ャと関連付けられるすべての非先行ピクチャの前にあると決定するステップと、
前記フラグが第2の値に設定されるとき、前記プロセッサによって、非先行ピクチャが
、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にある
と決定するステップと、
前記フラグが前記第1の値に設定されるか前記第2の値に設定されるかに基づいて、前記
プロセッサによって、前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行
ピクチャ、および前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチャを復
号順序において復号するステップとを備える、方法。
【請求項2】
前記フラグが前記第2の値に設定されるとき、前記プロセッサによって、復号順序にお
いて前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされ
ないと決定するステップをさらに備える、請求項1に記載の方法。
【請求項3】
前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記S
PSから取得される、請求項1から2のいずれか一項に記載の方法。
【請求項4】
前記フラグがシーケンシャルフィールドフラグ(field_seq_flag)である、請求項1から3
のいずれか一項に記載の方法。
【請求項5】
コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記fi
eld_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表
すピクチャを含むとき、前記field_seq_flagが0に設定される、請求項1から4のいずれか
一項に記載の方法。
【請求項6】
前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前
にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項1から5のい
ずれか一項に記載の方法。
【請求項7】
前記IRAPピクチャおよび前記1つ以上の非先行ピクチャを復号するステップが、前記IRA
Pピクチャからの前記第1のフィールドと、前記最初の先行ピクチャの前にある前記非先行
ピクチャからの前記第2のフィールドとをインターレースして、単一のフレームを作成す
るステップを含む、請求項1から6のいずれか一項に記載の方法。
【請求項8】
エンコーダにおいて実施される方法であって、
前記エンコーダのプロセッサによって、イントラランダムアクセスポイント(IRAP)ピク
チャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のピ
クチャを備えるビデオシーケンスのためのコーディング順序を決定するステップと、
前記プロセッサによって、フラグをビットストリームへと符号化するステップであって
、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において
、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、前記フラ
グが第1の値に設定され、非先行ピクチャが、コーディング順序において、前記IRAPピク
チャと関連付けられる最初の先行ピクチャの前にあるとき、前記フラグが第2の値に設定
される、ステップと、
前記プロセッサによって、前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意
の先行ピクチャ、および前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチ
ャを、コーディング順序において前記ビットストリームへと符号化するステップと、
前記プロセッサに結合されたメモリによって、デコーダへの通信のために前記ビットス
トリームを記憶するステップとを備える、方法。
【請求項9】
前記フラグが前記第2の値に設定されるとき、コーディング順序において前記最初の先
行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされない、請求項8に
記載の方法。
【請求項10】
前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記S
PSへと符号化される、請求項8から9のいずれか一項に記載の方法。
【請求項11】
前記フラグがシーケンシャルフィールドフラグ(field_seq_flag)である、請求項8から1
0のいずれか一項に記載の方法。
【請求項12】
コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記fi
eld_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表
すピクチャを含むとき、前記field_seq_flagが0に設定される、請求項8から11のいずれか
一項に記載の方法。
【請求項13】
前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前
にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項8から12のい
ずれか一項に記載の方法。
【請求項14】
前記IRAPピクチャからの前記第1のフィールドおよび前記最初の先行ピクチャの前にあ
る前記非先行ピクチャからの前記第2のフィールドが、単一のインターレースビデオフレ
ームを表すビデオデータの交互の線を含む、請求項8から13のいずれか一項に記載の方法
【請求項15】
プロセッサと、前記プロセッサに結合される受信機と、前記プロセッサに結合されるメ
モリと、前記プロセッサに結合される送信機とを備え、前記プロセッサ、受信機、メモリ
、および送信機が、請求項1から14のいずれか一項に記載の方法を実行するように構成さ
れる、ビデオコーディングデバイス。
【請求項16】
ビデオコーディングデバイスにより使用するためのコンピュータプログラム製品を備え
る非一時的コンピュータ可読媒体であって、前記コンピュータプログラム製品が、プロセ
ッサによって実行されると、前記ビデオコーディングデバイスに請求項1から14のいずれ
か一項に記載の方法を実行させる、前記非一時的コンピュータ可読媒体に記憶されたコン
ピュータ実行可能命令を備える、非一時的コンピュータ可読媒体。
【請求項17】
フラグと、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャ
と関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャと
を備える、ビットストリームを受信するための受信手段と、
前記フラグが第1の値に設定されるとき、前記IRAPピクチャと関連付けられる任意の
先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行
ピクチャの前にあると決定し、
前記フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、前
記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定する
ための決定手段と、
前記フラグが前記第1の値に設定されるか前記第2の値に設定されるかに基づいて、前記
IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行ピクチャ、および前記IRAP
ピクチャと関連付けられる前記1つ以上の非先行ピクチャを復号順序において復号するた
めの復号手段と、
復号されたビデオシーケンスの一部として表示するために1つ以上の復号されたピクチ
ャを転送するための転送手段とを備える、デコーダ。
【請求項18】
前記デコーダがさらに、請求項1から7のいずれか一項に記載の方法を実行するように構
成される、請求項17に記載のデコーダ。
【請求項19】
イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付け
られる1つ以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのため
のコーディング順序を決定するための決定手段と、
フラグをビットストリームへと符号化することであって、前記IRAPピクチャと関連付
けられる任意の先行ピクチャが、コーディング順序において、前記IRAPピクチャと関連付
けられるすべての非先行ピクチャの前にあるとき、前記フラグが第1の値に設定され、非
先行ピクチャが、コーディング順序において、前記IRAPピクチャと関連付けられる最初の
先行ピクチャの前にあるとき、前記フラグが第2の値に設定される、符号化することと、
前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行ピクチャ、および
前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチャを、コーディング順序
において前記ビットストリームへと符号化することと
を行うための符号化手段と、
デコーダへの通信のために前記ビットストリームを記憶するための記憶手段とを備える
、エンコーダ。
【請求項20】
前記エンコーダがさらに、請求項8から14のいずれか一項に記載の方法を実行するよう
に構成される、請求項19に記載のエンコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本特許出願は、参照によって本明細書に組み込まれる、「Handling Intra Random Acce
ss Point And Leading Pictures In Video Coding」という表題のFNU Hendry他により201
9年4月3日に出願された米国仮特許出願第62/828,875号、および「Handling Intra Random
Access Point And Leading Pictures In Video Coding」という表題のFNU Hendry他によ
り2019年6月21日に出願された米国仮特許出願第62/864,958号の利益を主張する。
【0002】
本開示は一般にビデオコーディングに関し、詳細には、インターレースビデオコーディ
ングの文脈において先行ピクチャをコーディングすることに関する。
【背景技術】
【0003】
比較的短いビデオでもそれを描写するために必要なビデオデータの量はかなり多いこと
があり、これは、帯域幅容量が限られている通信ネットワークを介してデータがストリー
ミングまたは別様に通信されることになるときに、困難さをもたらし得る。したがって、
ビデオデータは一般に、現代の遠隔通信ネットワークを介して通信される前に圧縮される
。メモリリソースは限られていることがあるので、ビデオがストレージデバイスに記憶さ
れるときには、ビデオのサイズも問題であり得る。ビデオ圧縮デバイスはしばしば、ソー
スにおけるソフトウェアおよび/またはハードウェアを使用して、送信または記憶の前に
ビデオデータをコーディングし、それにより、デジタルビデオ画像を表現するために必要
とされるデータの量を減らす。圧縮されたデータは次いで、ビデオデータを復号するビデ
オ圧縮解除デバイスによってデスティネーションにおいて受信される。ネットワークリソ
ースが限られていること、およびより高いビデオ品質に対する要求が高まり続けているこ
とにより、画像品質をほとんどまたはまったく犠牲にせずに圧縮比を改善する、改善され
た圧縮および圧縮解除技法が望ましい。
【発明の概要】
【課題を解決するための手段】
【0004】
ある実施形態では、本開示は、デコーダにおいて実施される方法を含み、この方法は、
デコーダの受信機によって、フラグと、イントラランダムアクセスポイント(IRAP)ピクチ
ャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディ
ングされたピクチャとを備える、ビットストリームを受信するステップと、
フラグが第1の値に設定されるとき、プロセッサによって、IRAPピクチャと関連付けら
れる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての
非先行ピクチャの前にあると決定するステップと、フラグが第2の値に設定されるとき、
プロセッサによって、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けら
れる最初の先行ピクチャの前にあると決定するステップと、フラグが第1の値に設定され
るか第2の値に設定されるかに基づいて、プロセッサによって、IRAPピクチャ、IRAPピク
チャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以
上の非先行ピクチャを復号順序において復号するステップと、プロセッサによって、復号
されたビデオシーケンスの一部として表示するために1つ以上の復号されたピクチャを転
送するステップとを備える。
【0005】
バーサタイルビデオコーディング(VVC)ビデオシステムは、IRAPピクチャ、先行ピクチ
ャ、および非先行ピクチャを含むビットストリームを利用し得る。いくつかの例では、非
先行ピクチャは後端ピクチャとも呼ばれ得る。IRAPピクチャは、コーディングされたビデ
オシーケンスの始点として働くイントラ予測コーディングされたピクチャである。先行ピ
クチャは、提示順序においてIRAPピクチャの前にあるが、コーディング順序ではIRAPピク
チャの後にコーディングされるピクチャである。非先行ピクチャ/後端ピクチャは、提示
順序とコーディング順序の両方においてIRAPピクチャの後にあるピクチャである。一部の
ビデオコーディングシステムは、先行ピクチャが復号順序においてIRAPピクチャの直後に
あることと、すべての非先行ピクチャが先行ピクチャの後にあることとを要求する。イン
ターレースビデオコーディングは、ストリーミング帯域幅を増大させることなく知覚され
るフレームレートを上げる機構である。インターレースビデオコーディングでは、ビデオ
フレームは2つのフィールドに分割される。フレームの第1のフィールドのための水平線は
、第1の時間にキャプチャされて第1のピクチャにおいてコーディングされる。フレームの
第2のフィールドのための水平線は、第2の時間にキャプチャされて第1のピクチャのすぐ
隣の第2のピクチャにおいてコーディングされる。このようにして、得られるフレームは
、第1の時間における第1のピクチャからのスライスと第2における第2のピクチャからのス
ライスとを含み、これは動きの感覚を高める。VVCシステムは、インターレースビデオを
サポートするように設計されないことがある。たとえば、インターレースフレームは、機
能するためにIRAPピクチャおよび隣接するイントラ予測コーディングされたピクチャを利
用することがある。イントラ予測コーディングされたピクチャは、非先行/後端ピクチャ
であると見なされる。さらに、先行ピクチャが利用されるとき、先行ピクチャは、その隣
接するイントラ予測コーディングされたピクチャの後に位置決めされる。これは、先行ピ
クチャが復号順序においてIRAPピクチャの直後にある、およびすべての非先行ピクチャが
先行ピクチャの後にあるという、VVCの制約に違反する。この例は、先行ピクチャを利用
するVVCシステムにおいてイン
ターレースビデオコーディングを実施するために利用され得るフラグを含む。フラグが0
などの第1の値に設定されると、先行ピクチャがもしあれば、それは非先行ピクチャのす
べてに先行する。しかしながら、IRAPピクチャと任意の先行ピクチャとの間に単一の非先
行ピクチャが位置決めされることをデコーダに示すために、エンコーダはフラグを1など
の第2の値に設定することができる。ある例では、非先行ピクチャは先行ピクチャ間に位
置決めされなくてもよい。フラグは、シーケンスパラメータセット(SPS)に含まれてもよ
く、ピクチャのシーケンス全体に適用されてもよい。したがって、この例は、先行ピクチ
ャおよびインターレースビデオが同じビットストリームにおいて一緒に実装されることを
許容することによって、エンコーダおよび/またはデコーダの機能を高めるフラグを含む
。さらに、この例は、先行ピクチャおよびインターレースビデオが一緒に実装されること
を許容することによって、得られるビットストリームのコーディング効率を高める。した
がって、この例は、エンコーダおよび/またはデコーダにおける、プロセッサリソース、
メモリリソース、および/またはネットワークリソースの使用を減らし得る。
【0006】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグが第2
の値に設定されるとき、プロセッサによって、復号順序において最初の先行ピクチャと最
後の先行ピクチャとの間に先行ピクチャが位置決めされないと決定することをさらに備え
ることを規定する。
【0007】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、ビットストリ
ームがSPSを含み、フラグがSPSから取得されることを規定する。
【0008】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグがシー
ケンシャルフィールドフラグ(field_seq_flag)であることを規定する。
【0009】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、コーディング
されたビデオシーケンスがフィールドを表すピクチャを含むことを示すとき、field_seq_
flagが1に設定され、コーディングされたビデオシーケンスがフレームを表すピクチャを
含むことを示すとき、field_seq_flagが0に設定されることを規定する。
【0010】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャ
がフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャが
フレームの第2のフィールドを含むことを規定する。
【0011】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャ
および1つ以上の非先行ピクチャを復号することが、IRAPピクチャからの第1のフィールド
および最初の先行ピクチャの前にある非先行ピクチャからの第2のフィールドをインター
レースして単一のフレームを作成することを含むことを規定する。
【0012】
ある実施形態では、本開示は、エンコーダにおいて実施される方法を含み、方法は、エ
ンコーダのプロセッサによって、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ
以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのためのコーディ
ング順序を決定するステップと、プロセッサによって、フラグをビットストリームへと符
号化するステップであって、IRAPピクチャと関連付けられる任意の先行ピクチャがコーデ
ィング順序においてIRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると
き、フラグが第1の値に設定され、非先行ピクチャがコーディング順序においてIRAPピク
チャと関連付けられる最初の先行ピクチャの前にあるとき、フラグが第2の値に設定され
る、ステップと、プロセッサによって、IRAPピクチャ、IRAPピクチャと関連付けられる任
意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャをコ
ーディング順序においてビットストリームへと符号化するステップと、プロセッサに結合
されたメモリによって、デコーダへの通信のためにビットストリームを記憶するステップ
とを備える。
【0013】
VVCビデオシステムは、IRAPピクチャ、先行ピクチャ、および非先行ピクチャを含むビ
ットストリームを利用し得る。いくつかの例では、非先行ピクチャは後端ピクチャとも呼
ばれ得る。IRAPピクチャは、コーディングされたビデオシーケンスの始点として働くイン
トラ予測コーディングされたピクチャである。先行ピクチャは、提示順序においてIRAPピ
クチャの前にあるが、コーディング順序ではIRAPピクチャの後にコーディングされるピク
チャである。非先行ピクチャ/後端ピクチャは、提示順序とコーディング順序の両方にお
いてIRAPピクチャの後にあるピクチャである。一部のビデオコーディングシステムは、先
行ピクチャが復号順序においてIRAPピクチャの直後にあることと、すべての非先行ピクチ
ャが先行ピクチャの後にあることとを要求する。インターレースビデオコーディングは、
ストリーミング帯域幅を増大させることなく知覚されるフレームレートを上げる機構であ
る。インターレースビデオコーディングでは、ビデオフレームは2つのフィールドに分割
される。フレームの第1のフィールドのための水平線は、第1の時間にキャプチャされて第
1のピクチャにおいてコーディングされる。フレームの第2のフィールドのための水平線は
、第2の時間にキャプチャされて第1のピクチャのすぐ隣の第2のピクチャにおいてコーデ
ィングされる。このようにして、得られるフレームは、第1の時間における第1のピクチャ
からのスライスと第2における第2のピクチャからのスライスとを含み、これは動きの感覚
を高める。VVCシステムは、インターレースビデオをサポートするように設計されないこ
とがある。たとえば、インターレースフレームは、機能するためにIRAPピクチャおよび隣
接するイントラ予測コーディングされたピクチャを利用することがある。イントラ予測コ
ーディングされたピクチャは、非先行/後端ピクチャであると見なされる。さらに、先行
ピクチャが利用されるとき、先行ピクチャは、その隣接するイントラ予測コーディングさ
れたピクチャの後に位置決めされる。これは、先行ピクチャが復号順序においてIRAPピク
チャの直後にある、およびすべての非先行ピクチャが先行ピクチャの後にあるという、VV
Cの制約に違反する。この例は、先行ピクチャを利用するVVCシステムにおいてインターレ
ースビデオコーディングを実施
するために利用され得るフラグを含む。フラグが0などの第1の値に設定されるとき、先行
ピクチャがもしあれば、それは非先行ピクチャのすべての前にある。しかしながら、IRAP
ピクチャと任意の先行ピクチャとの間に単一の非先行ピクチャが位置決めされることをデ
コーダに示すために、エンコーダはフラグを1などの第2の値に設定することができる。あ
る例では、非先行ピクチャは先行ピクチャ間に位置決めされなくてもよい。フラグは、SP
Sに含まれてもよく、ピクチャのシーケンス全体に適用されてもよい。したがって、この
例は、先行ピクチャおよびインターレースビデオが同じビットストリームにおいて一緒に
実装されることを許容することによって、エンコーダおよび/またはデコーダの機能を高
めるフラグを含む。さらに、この例は、先行ピクチャおよびインターレースビデオが一緒
に実装されることを許容することによって、得られるビットストリームのコーディング効
率を高める。したがって、この例は、エンコーダおよび/またはデコーダにおける、プロ
セッサリソース、メモリリソース、および/またはネットワークリソースの使用を減らし
得る。
【0014】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグが第2
の値に設定されるとき、コーディング順序において最初の先行ピクチャと最後の先行ピク
チャとの間に先行ピクチャが位置決めされないことを規定する。
【0015】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、ビットストリ
ームがSPSを含み、フラグがSPSへと符号化されることを規定する。
【0016】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグがfiel
d_seq_flagであることを規定する。
【0017】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、コーディング
されたビデオシーケンスがフィールドを表すピクチャを含むことを示すとき、field_seq_
flagが1に設定され、コーディングされたビデオシーケンスがフレームを表すピクチャを
含むことを示すとき、field_seq_flagが0に設定されることを規定する。
【0018】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャ
がフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャが
フレームの第2のフィールドを含むことを規定する。
【0019】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャ
からの第1のフィールドおよび最初の先行ピクチャの前にある非先行ピクチャからの第2の
フィールドが、単一のインターレースビデオフレームを表すビデオデータの交互の線を含
むことを規定する。
【0020】
ある実施形態では、本開示は、プロセッサと、プロセッサに結合された受信機と、プロ
セッサに結合されたメモリと、プロセッサに結合された送信機とを備える、ビデオコーデ
ィングデバイスを含み、プロセッサ、受信機、メモリ、および送信機は、先行する態様の
いずれかの方法を実行するように構成される。
【0021】
ある実施形態では、本開示は、ビデオコーディングデバイスにより使用するためのコン
ピュータプログラム製品を備える非一時的コンピュータ可読媒体を含み、コンピュータプ
ログラム製品は、プロセッサによって実行されるとビデオコーディングデバイスに先行す
る態様のいずれかの方法を実行させる非一時的コンピュータ可読媒体に記憶されたコンピ
ュータ実行可能命令を備える。
【0022】
ある実施形態では、本開示は、フラグと、IRAPピクチャおよびIRAPピクチャと関連付け
られる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、
ビットストリームを受信するための受信手段と、フラグが第1の値に設定されるとき、IRA
Pピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと
関連付けられるすべての非先行ピクチャの前にあると決定し、フラグが第2の値に設定さ
れるとき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の
先行ピクチャの前にあると決定するための決定手段と、フラグが第1の値に設定されるか
第2の値に設定されるかに基づいて、IRAPピクチャ、IRAPピクチャと関連付けられる任意
の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを復号
順序において復号するための復号手段と、復号されたビデオシーケンスの一部として表示
するために1つ以上の復号されたピクチャを転送するための転送手段とを備える、デコー
ダを含む。
【0023】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、デコーダが先
行する態様のいずれかの方法を実行するようにさらに構成されることを規定する。
【0024】
ある実施形態では、本開示は、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ
以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのためのコーディ
ング順序を決定するための決定手段と、フラグをビットストリームへと符号化し、IRAPピ
クチャと関連付けられる任意の先行ピクチャが、コーディング順序において、IRAPピクチ
ャと関連付けられるすべての非先行ピクチャの前にあるとき、フラグが第1の値に設定さ
れ、ある非先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられる
最初の先行ピクチャの前にあるとき、フラグが第2の値に設定され、IRAPピクチャ、IRAP
ピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1
つ以上の非先行ピクチャをコーディング順序においてビットストリームへと符号化するた
めの符号化手段と、デコーダへの通信のためにビットストリームを記憶するための記憶手
段とを備える、エンコーダを含む。
【0025】
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、エンコーダが
先行する態様のいずれかの方法を実行するようにさらに構成されることを規定する。
【0026】
明確にするために、前述の実施形態のいずれか1つが、本開示の範囲内で新しい実施形
態を作成するために、他の前述の実施形態の任意の1つ以上と組み合わせられ得る。
【0027】
これらおよび他の特徴は、添付の図面および請求項と併せて、以下の詳細な説明からよ
り明確に理解されるであろう。
【0028】
本開示のより完全な理解のために、ここで、添付の図面および詳細な説明に関連して、
以下の簡単な説明への参照が行われ、同様の参照番号は同様の部分を表す。
【図面の簡単な説明】
【0029】
図1】ビデオ信号をコーディングする例示的な方法のフローチャートである。
図2】ビデオコーディングのための例示的な符号化および復号(コーデック)システムの概略図である。
図3】例示的なビデオエンコーダを示す概略図である。
図4】例示的なビデオデコーダを示す概略図である。
図5】先行ピクチャを伴う例示的なコーディングされたビデオシーケンスを示す概略図である。
図6A】インターレースビデオコーディングの例を集合的に示す概略図である。
図6B】インターレースビデオコーディングの例を集合的に示す概略図である。
図6C】インターレースビデオコーディングの例を集合的に示す概略図である。
図7】インターレースビデオコーディングと先行ピクチャの両方を利用する例示的なコーディングされたビデオシーケンスを示す概略図である。
図8】インターレースビデオコーディングと先行ピクチャの両方を含むように構成される例示的なビットストリームを示す概略図である。
図9】例示的なビデオコーディングデバイスの概略図である。
図10】インターレースビデオコーディングを伴うビデオシーケンスおよび先行ピクチャをビットストリームへと符号化する例示的な方法のフローチャートである。
図11】インターレースビデオコーディングを伴うビデオシーケンスおよび先行ピクチャをビットストリームから復号する例示的な方法のフローチャートである。
図12】インターレースビデオコーディングを伴うビデオシーケンスおよび先行ピクチャをビットストリームへとコーディングするための例示的なシステムの概略図である。
【発明を実施するための形態】
【0030】
1つ以上の実施形態の説明のための実装形態が以下で与えられるが、開示されるシステ
ムおよび/または方法は、現在知られているか、または存在しているかにかかわらず、任
意の数の技法を使用して実装され得ることを始めに理解されたい。本開示は、いかなる場
合でも、本明細書において例証され説明される例示的な設計および実装形態を含む、以下
で例証される説明のための実装形態、図、および技法に限定されるべきではなく、それら
の均等物の完全な範囲とともに添付の特許請求の範囲内で修正され得る。
【0031】
以下の用語は、本明細書において逆の文脈で使用されない限り、次のように定義される
。具体的には、以下の定義は、本開示をさらにわかりやすくすることが意図されている。
しかしながら、用語は異なる文脈では異なるように説明され得る。したがって、以下の定
義は、補足として見なされるべきであり、本明細書におけるそのような用語に対して与え
られる説明の他の定義を限定するものと見なされるべきではない。
【0032】
ビットストリームは、エンコーダとデコーダとの間の送信のために圧縮されるビデオデ
ータを含むシーケンスビットである。エンコーダは、ビデオデータをビットストリームへ
と圧縮するための符号化プロセスを利用するように構成されるデバイスである。デコーダ
は、表示のためにビットストリームからビデオデータを再構築するために復号プロセスを
利用するように構成されるデバイスである。フラグは、符号化の間にエンコーダによって
利用される機構をシグナリングするビットストリームへとコーディングされるビットまた
はビットのグループであるので、復号の間にデコーダによって利用されるべき機構がビッ
トストリームからビデオデータを正確に再構築することを示す。イントラ予測は、ピクチ
ャが他のピクチャを参照することなく再構築され得るように、それ自身を参照してピクチ
ャをコーディングする機構である。インター予測は、1つ以上の他のピクチャを参照する
ことによってピクチャをコーディングする機構である。イントラランダムアクセスポイン
ト(IRAP)ピクチャは、イントラ予測に従ってコーディングされ、コーディングされたビデ
オシーケンスのための始点として働く、ピクチャである。先行ピクチャは、コーディング
順序において関連するIRAPピクチャの後にコーディングされ、しかし出力順序において関
連するIRAPピクチャに先行する、ピクチャである。後端ピクチャとも呼ばれ得る非先行ピ
クチャは、コーディング順序と出力順序の両方においてIRAPピクチャの後にあるピクチャ
である。インターレースビデオコーディングは、第1のピクチャの中の第1の時間における
ビデオデータの第1のフィールドをコーディングし、第2のピクチャの中の第2の時間にお
けるビデオデータの第2のフィールドをコーディングし、向上したフレームレートの印象
を与えるために第1のフィールドおよび第2のフィールドを提示のために単一のフレームへ
と組み合わせる、ビデオコーディング機構である。フレームは、ビデオシーケンスの中の
対応する瞬間におけるユーザへの完全なまたは部分的な表示が意図される、完全な画像で
ある。ピクチャは、ピクチャがフレームのフィールドであるようなインターレースビデオ
に関する状況を除き、フレームである。パラメータセットは、コーディングされたビデオ
シーケンスの対応するセクションのための、フラグおよび他のパラメータなどのデータを
シグナリングする、ビットストリームの部分である。シーケンシャルフィールドフラグ(f
ield_seq_flag)は、インターレースビデオのために使用され、コーディング順序において
IRAPピクチャと先行ピクチャとの間に非先行ピクチャがいつ位置決めされるかをシグナリ
ングする、フラグである。
【0033】
以下の頭字語が本明細書において使用される。コーディングツリーブロック(CTB)、コ
ーディングツリーユニット(CTU)、コーディングユニット(CU)、コーディングされたビデ
オシーケンス(CVS)、ジョイントビデオエキスパーツチーム(JVET)、動き制約タイルセッ
ト(MCTS)、最大伝送単位(MTU)、ネットワーク抽象化レイヤ(NAL)、ピクチャ順序カウント
(POC)、ローバイトシーケンスペイロード(RBSP)、シーケンスパラメータセット(SPS)、お
よびワーキングドラフト(WD)。
【0034】
データの喪失を最小限にしながらビデオファイルのサイズを減らすために、多くのビデ
オ圧縮技法を利用することができる。たとえば、ビデオ圧縮技法は、空間(たとえば、イ
ントラピクチャ)予測および/または時間(たとえば、インターピクチャ)予測を実行して、
ビデオシーケンスにおけるデータ冗長性を低減または除去することを含み得る。ブロック
ベースのビデオコーディングのために、ビデオスライス(たとえば、ビデオピクチャまた
はビデオピクチャの一部)がビデオブロックへと区分されてもよく、これは、ツリーブロ
ック、コーディングツリーブロック(CTB)、コーディングツリーユニット(CTU)、コーディ
ングユニット(CU)、および/またはコーデイングノードとも呼ばれ得る。ピクチャのイン
トラコーディングされた(I)スライスの中のビデオブロックは、同じピクチャの中の近隣
ブロックの中の参照サンプルに関する空間予測を使用してコーディングされる。ピクチャ
のインターコーディングされた単方向予測(P)または双方向予測(B)スライスの中のビデオ
ブロックは、同じピクチャの近隣ブロックの中の参照サンプルに関する空間予測、または
他の参照ピクチャの中の参照サンプルに関する時間予測を利用することによってコーディ
ングされ得る。ピクチャはフレームおよび/または画像と呼ばれることがあり、参照ピク
チャは参照フレームおよび/または参照画像と呼ばれることがある。空間予測または時間
予測は、画像ブロックを表す予測ブロックをもたらす。残差データは、元の画像ブロック
と予測ブロックとの間のピクセル差分を表す。したがって、インターコーディングされた
ブロックは、予測ブロックを形成する参照サンプルのブロックを指し示す動きベクトルと
、コーディングされたブロックと予測ブロックとの間の差を示す残差データとに従って符
号化される。イントラコーディングされたブロックは、イントラコーディングモードおよ
び残差データに従って符号化される。さらなる圧縮のために、残差データはピクセル領域
から変換領域に転送され得る。これらは、量子化され得る残差変換係数をもたらす。量子
化された変換係数は最初に、二次元アレイに配列され得る。量子化された変換係数が、変
換係数の一次元ベクトルを生み出すために走査され得る。エントロピーコーディングは、
さらなる圧縮を達成するために適用され得る。そのようなビデオ圧縮技法は、以下でより
詳しく論じられる。
【0035】
符号化されたビデオが確実に正しく復号され得ることを確実にするために、対応するビ
デオコーディング規格に従って、ビデオが符号化され復号される。ビデオコーディング規
格は、国際電気通信連合(ITU)標準化部門(ITU-T)H.261、国際標準化機構/国際電気標準会
議(ISO/IEC)モーションピクチャエキスパーツグループ(MPEG)-1 Part 2、ITU-T H.262ま
たはISO/IEC MPEG-2 Part 2、ITU-T H.263、ISO/IEC MPEG-4 Part 2、ITU-T H.264または
ISO/IEC MPEG-4 Part 10としても知られているアドバンストビデオコーディング(AVC)、
およびITU-T H.265またはMPEG-H Part 2としても知られている高効率ビデオコーディング
(HEVC)を含む。AVCは、スケーラブルビデオコーディング(SVC)、マルチビュービデオコー
ディング(MVC)およびマルチビュービデオコーディングプラスデプス(MVC+D)、ならびに三
次元(3D)AVC(3D-AVC)などの拡張を含む。HEVCは、スケーラブルHEVC(SHVC)、マルチビュ
ーHEVC(MV-HEVC)、および3D HEVC(3D-HEVC)などの拡張を含む。ITU-TおよびISO/IECのジ
ョイントビデオエキスパーツチーム(JVET)は、バーサタイルビデオコーディング(VVC)と
呼ばれるビデオコーディング規格の開発を開始した。VVCはワーキングドラフト(WD)に含
まれており、これは、JVET-M1001-v7を含む。
【0036】
ビデオコーディングシステムは、IRAPピクチャおよび非IRAPピクチャを利用することに
よってビデオを符号化し得る。IRAPピクチャは、ビデオシーケンスのためのランダムアク
セスポイントとしての役割を果たす、インター予測に従ってコーディングされるピクチャ
である。イントラ予測では、ピクチャのブロックは、同じピクチャの中の他のブロックへ
の参照によってコーディングされる。これは、インター予測を利用する非IRAPピクチャと
は対照的である。インター予測では、現在のピクチャのブロックは、現在のピクチャと異
なる参照ピクチャの中の他のブロックへの参照によってコーディングされる。IRAPピクチ
ャは他のピクチャを参照せずにコーディングされるので、IRAPピクチャは、最初に他のピ
クチャを復号することなく復号され得る。したがって、デコーダは、任意のIRAPピクチャ
においてビデオシーケンスを復号することを始めることができる。対照的に、非IRAPピク
チャは他のピクチャを参照してコーディングされるので、デコーダは一般に、非IRAPピク
チャにおいてビデオシーケンスの復号を始めることができない。IRAPピクチャはまた、復
号ピクチャバッファ(DPB)をリフレッシュし得る。これは、IRAPピクチャがコーディング
されたビデオシーケンス(CVS)の始点であり、CVSの中のピクチャが以前のCVSの中のピク
チャを参照しないからである。したがって、IRAPピクチャは、インター予測関連のコーデ
ィングエラーを止めることもでき、それは、そのようなエラーはIRAPピクチャを通って広
がることができないからである。しかしながら、IRAPピクチャは、データサイズの観点か
ら、非IRAPピクチャよりはるかに大きい。したがって、ビデオシーケンスは一般に、コー
ディング効率と機能性のバランスをとるために、多数の非IRAPピクチャとともに、より少
数の散在するIRAPピクチャを含む。たとえば、60フレームのCVSは、1つのIRAPピクチャお
よび59個の非IRAPピクチャを含み得る。したがって、IRAPピクチャはビットストリームに
おける圧縮効率を下げる。さらに、ビットストリームにおけるIRAPピクチャの存在は、ビ
ットレートの急上昇を引き起こす。圧縮効率に対するこの不利益は、ピクチャを表現する
ためにインター予測よりはるかに多くのビットをイントラ予
測が利用するという事実により一部は引き起こされる。さらに、IRAPピクチャは、復号プ
ロセスをリフレッシュし、DPBから参照ピクチャを除去し得る。これは、IRAPピクチャの
後にあるピクチャをコーディングするときにインター予測のために利用可能な参照ピクチ
ャの数を減らすので、インター予測プロセスの効率を一時的に下げる。
【0037】
ビデオコーディングシステムは、先行ピクチャも利用し得る。先行ピクチャは、コーデ
ィング順序においてIRAPピクチャの後に位置し提示順序においてIRAPピクチャの前に位置
決めされるピクチャである。先行ピクチャは、対応するピクチャがIRAPピクチャから効率
的に予測され得るとき、その対応するピクチャがIRAPピクチャの前に提示されるべきであ
っても利用され得る。そのようなピクチャは、IRAPピクチャがインター予測のための参照
ピクチャとして利用されることを許容するために、コーディング順序においてIRAPピクチ
ャの後に位置決めされる。デコーダは次いで、異なる提示順序を作成するために、提示の
前に先行ピクチャとIRAPピクチャの順序を入れ替えることができる。先行ピクチャは、ラ
ンダムアクセススキップ先行(RASL)ピクチャおよびランダムアクセス復号先行(RADL)ピク
チャを含み得る。RASLピクチャはまた、IRAPピクチャの前にピクチャに依存することがあ
り、IRAPピクチャがランダムアクセスポイントとして使用されるときスキップされる。こ
れは、そのような他のピクチャが復号されず、したがってIRAPピクチャから復号が開始す
るときにそのような他の参照ピクチャとして利用可能ではないからである。RADLピクチャ
は、参照のためにIRAPピクチャまたはRADLピクチャとIRAPピクチャとの間の他のピクチャ
のみに依存する。したがって、RADLピクチャは、IRAPがランダムアクセスポイントとして
使用されるときでも復号される。これは、コーディングがIRAPピクチャにおいて開始する
ときでも、RADLピクチャが参照し得るあらゆるピクチャが復号されることが保証されるか
らである。ビデオコーディングシステムは、復号順序において参照するIRAPピクチャの直
後に先行ピクチャが位置決めされることを必要とし得る。次いで、あらゆる関連する後端
ピクチャが、復号順序において先行ピクチャの後にある。
【0038】
ビデオコーディングは、広範囲の機構を利用する。たとえば、インターレースコーディ
ングは、フレームを1つより多くのフィールドおよび1つより多くのピクチャにコーディン
グする。たとえば、フレームは、偶数フィールドと奇数フィールドに分割され得る。イン
ターレースフレームの偶数フィールドは、フレームの偶数番号の水平線からのサンプルを
含み、インターレースフレームの奇数フィールドは、フレームの奇数番号の水平線からの
サンプルを含む。ある特定の例として、奇数フィールドは、第1の時間においてキャプチ
ャされ、第1のピクチャに記憶され得る。奇数フィールドは次いで、第2の時間においてキ
ャプチャされ、第2のピクチャに記憶され得る。同じフレームへと2つのフィールドを含め
ることは、動きの感覚を高める。したがって、インターレースコーディングは、ビデオシ
ーケンスの帯域幅を増やすことなく、向上したフレームレートの印象を生み出す。インタ
ーレースコーディングは、標準化されたコーディングシステムによりネイティブでサポー
トされないことがある。しかしながら、インターレースコーディングは、ビットストリー
ムがインターレースコーディングされたビットストリームであることを示すためにビデオ
使用可能性情報(VUI)の中のシンタックス要素を利用することによって、何らかのシステ
ムにおいて管理され得る。そのようなシンタックス要素は、field_seq_flag、general_fr
ame_only_constraint_flagを含み得る。
【0039】
先行ピクチャを利用する標準化されたビデオコーディングシステムは、インターレース
ビデオコーディングをサポートするように構成されない。たとえば、VVCおよびHEVCは、
先行ピクチャがもしあればそれがIRAPピクチャの後にあることを要求するコーディング順
序を利用し得る。次いで、先行ピクチャの後には、非先行/後端ピクチャがある。そのよ
うな順序は、非先行ピクチャがIRAPピクチャと関連する先行ピクチャとの間に位置決めさ
れるのを防ぐ。しかしながら、インターレースビデオコーディングの文脈では、IRAPフレ
ームは、2つのピクチャの中の2つのフィールド間で分割される。第1のフィールドを伴う
第1のピクチャは、IRAPピクチャとしてコーディングされる。第2のフィールドを伴う第2
のピクチャは、IRAPピクチャの代わりに非先行/後端ピクチャとしてコーディングされ、
それは、第2のピクチャをランダムアクセスポイントとして使用できないからである。こ
れは、両方のピクチャが復号を開始するために必要とされ、したがって第1のピクチャを
スキップすることができないからである。IRAPフレームを構成する2つのピクチャは、効
率的なコーディングのために互いに隣り合って位置決めされるべきである。しかしながら
、第1のIRAPフィールドを伴うIRAPピクチャの隣に第2のIRAPフィールドを伴う非先行ピク
チャを位置決めすることは、VVCおよびHEVCのコーディング順序に違反する。これは、そ
のような位置決めがあらゆる先行ピクチャの前に非先行ピクチャを配置するからである。
【0040】
本明細書において開示されるのは、インターレースビデオを符号化するために先行ピク
チャを利用するビデオコーディングシステムを構成するための機構である。たとえば、先
行ピクチャを利用するVVCシステムへとインターレースビデオコーディングを実装するた
めに、フラグが利用され得る。フラグは、IRAPピクチャと任意の先行ピクチャとの間にい
つ非先行ピクチャが存在し得るかをデコーダにシグナリングするために利用され得る。デ
コーダは、フラグを読み取り、インターレースビデオコーディングをサポートするために
望まれるような順序を調整することができる。フラグが0などの第1の値に設定されるとき
、先行ピクチャがもしあれば、それは非先行ピクチャのすべての前にある。しかしながら
、エンコーダは、IRAPピクチャと任意の先行ピクチャとの間に単一の非先行ピクチャが位
置決めされることをデコーダに示すために、1などの第2の値にフラグを設定することがで
きる。ある例では、非先行ピクチャは、先行ピクチャ間に位置決めされないことがある。
たとえば、シーケンシャルフィールドフラグ(field_seq_flag)は、この目的で利用され得
る。このフラグは、シーケンスパラメータセット(SPS)に含まれてもよく、ピクチャのシ
ーケンス全体に適用されてもよい。インターレースビデオの文脈において、フレームは複
数のピクチャ(たとえば、2つ)を含み得ることに留意されたい。しかしながら、インター
レースビデオの文脈以外では、フレームは単一のピクチャを含むので、フレームという用
語およびピクチャという用語は交換可能に使用され得る。したがって、フレームおよびピ
クチャという用語の以下での使用は、インターレースコーディングの文脈で使用されない
限り、限定するものと見なされるべきではない。
【0041】
図1は、ビデオ信号をコーディングすることの例示的な動作方法100のフローチャートで
ある。具体的には、ビデオ信号はエンコーダにおいて符号化される。符号化プロセスは、
ビデオファイルサイズを減らすための様々な機構を利用することによってビデオ信号を圧
縮する。より小さいファイルサイズは、圧縮されたビデオファイルがユーザへ送信される
ことを可能にしながら、関連する帯域幅オーバーヘッドを減らす。デコーダは次いで、圧
縮されたビデオファイルを復号して、エンドユーザへの表示のために元のビデオ信号を再
構築する。復号プロセスは一般に、デコーダがビデオ信号を安定して再構築することを可
能にするために、符号化プロセスを鏡写しにしたものである。
【0042】
ステップ101において、ビデオ信号がエンコーダに入力される。たとえば、ビデオ信号
は、メモリに記憶された圧縮されていないビデオファイルであり得る。別の例として、ビ
デオファイルは、ビデオカメラなどのビデオキャプチャデバイスによって捉えられ、ビデ
オのライブストリーミングをサポートするために符号化され得る。ビデオファイルは、オ
ーディオ成分とビデオ成分の両方を含み得る。ビデオ成分は、順番に見られると視覚的な
動きの効果を与える一連の画像フレームを含む。フレームは、ルマ成分(またはルマサン
プル)と本明細書で呼ばれる光に関して表されるピクセル、およびクロマ成分(またはカラ
ーサンプル)と呼ばれる色に関して表現されるピクセルを含む。いくつかの例では、フレ
ームは、三次元視聴をサポートするために深度値も含み得る。
【0043】
ステップ103において、ビデオはブロックへと区分される。区分は、各フレームのピク
セルを、圧縮のために正方形および/または長方形のブロックへと再分割することを含む
。たとえば、高効率ビデオコーディング(HEVC)(H.265およびMPEG-H Part 2としても知ら
れている)では、フレームをまずコーディングツリーユニット(CTU)へと分割することがで
き、CTUはあらかじめ定められたサイズ(たとえば、64ピクセル対64ピクセル)のブロック
である。CTUはルマサンプルとクロマサンプルの両方を含む。コーディングツリーは、CTU
をブロックへと分割し、次いで、さらなる符号化をサポートする構成が達成されるまでブ
ロックを再帰的に再分割するために利用され得る。たとえば、フレームのルマ成分は、個
々のブロックが比較的一様な照明値を含むまで再分割され得る。さらに、フレームのクロ
マ成分は、個々のブロックが比較的一様な色値を含むまで再分割され得る。したがって、
区分機構はビデオフレームの内容に依存して変化する。
【0044】
ステップ105において、ステップ103において区分された画像ブロックを圧縮するために
様々な圧縮機構が利用される。たとえば、インター予測および/またはイントラ予測が利
用され得る。インター予測は、共通のシーンにおける物体が連続するフレームに出現する
傾向にあるという事実を利用するように設計される。したがって、参照フレームの中の物
体を描写するブロックは、隣接フレームにおいて繰り返し記述される必要はない。具体的
には、テーブルなどの物体は、複数のフレームにわたって一定の位置にとどまり得る。し
たがって、テーブルは一度記述され、隣接フレームは参照フレームを参照することができ
る。複数のフレームにわたって物体を照合するために、パターン照合機構が利用され得る
。さらに、動いている物体は、たとえば物体の動きまたはカメラの動きにより、複数のフ
レームにまたがって表現されることがある。特定の例として、ビデオは、複数のフレーム
にわたって画面上を動き回る自動車を示すことがある。動きベクトルは、そのような動き
を記述するために利用され得る。動きベクトルは、フレームにおける物体の座標から参照
フレームにおける物体の座標までのオフセットを与える二次元ベクトルである。したがっ
て、インター予測は、参照フレームの中の対応するブロックからのオフセットを示す動き
ベクトルのセットとして、現在のフレームの中の画像ブロックを符号化することができる
【0045】
イントラ予測は共通のフレームの中のブロックを符号化する。イントラ予測は、ルマ成
分およびクロマ成分がフレームにおいて密集する傾向があるという事実を利用する。たと
えば、木の一部における緑色の斑点は、同様の緑色の斑点の隣に位置決めされる傾向があ
る。イントラ予測は、複数の指向性予測モード(たとえば、HEVCでは33個)、平面モード、
および直流(DC)モードを利用する。指向性モードは、現在のブロックが対応する方向にお
ける近隣ブロックのサンプルと類似する/同じであることを示す。平面モードは、行/列(
たとえば、平面)に沿った一連のブロックが行の端にある近隣ブロックに基づいて補間さ
れ得ることを示す。平面モードは、実質的に、値を変化させることにより比較的一定の勾
配を利用することによって、行/列にわたる光/色の滑らかな遷移を示す。DCモードは、境
界平滑化のために利用され、指向性予測モードの角度方向と関連付けられるすべての近隣
ブロックのサンプルと関連付けられる平均値とブロックが同様/同じであることを示す。
したがって、イントラ予測ブロックは、実際の値の代わりに様々な関係予測モード値とし
て画像ブロックを表すことができる。さらに、インター予測ブロックは、実際の値の代わ
りに動きベクトル値として画像ブロックを表すことができる。いずれの場合でも、予測ブ
ロックは、いくつかの場合、画像ブロックを厳密に表現しないことがある。あらゆる差分
が残差ブロックに蓄積される。ファイルをさらに圧縮するために、残差ブロックに変換が
適用され得る。
【0046】
ステップ107において、様々なフィルタリング技法が適用され得る。HEVCでは、フィル
タはループ内フィルタリング方式に従って適用される。上で論じられたブロックベースの
予測は、デコーダにおけるブロック状画像の作成をもたらし得る。さらに、ブロックベー
スの予測方式は、ブロックを符号化し、次いで、参照ブロックとして後で使用するために
符号化されたブロックを再構築し得る。ループ内フィルタリング方式は、ノイズ抑制フィ
ルタ、デブロッキングフィルタ、適応ループフィルタ、およびサンプル適応オフセット(S
AO)フィルタをブロック/フレームに反復的に適用する。これらのフィルタは、符号化され
たファイルが正確に再構築され得るように、そのようなブロッキングアーティファクトを
軽減する。さらに、これらのフィルタは再構築された参照ブロックにおけるアーティファ
クトを軽減するので、アーティファクトは、再構築された参照ブロックに基づいて符号化
される後続のブロックにおいて追加のアーティファクトを生み出す可能性がより低くなる
【0047】
ビデオ信号が区分され、圧縮され、フィルタリングされると、ステップ109において、
得られるデータがビットストリームにおいて符号化される。ビットストリームは、上で論
じられたデータ、ならびにデコーダにおける適切なビデオ信号の再構築をサポートするた
めに望まれるあらゆるシグナリングデータを含む。たとえば、そのようなデータは、区分
データ、予測データ、残差ブロック、およびコーディング命令をデコーダに提供する様々
なフラグを含み得る。ビットストリームは、要求に応じたデコーダへの送信のためにメモ
リに記憶され得る。ビットストリームは、複数のデコーダへのブロードキャストおよび/
またはマルチキャストでもあり得る。ビットストリームの作成は反復的なプロセスである
。したがって、ステップ101、103、105、107、および109は、多数のフレームおよびブロ
ックにわたって連続的および/または同時に発生し得る。図1に示される順序は、明確にす
るために、かつ議論を簡単にするために提示されており、ビデオコーディングプロセスを
特定の順序に制限することは意図されていない。
【0048】
ステップ111において、デコーダが、ビットストリームを受信して復号プロセスを開始
する。具体的には、デコーダは、エントロピー復号方式を利用して、ビットストリームを
対応するシンタックスおよびビデオデータへと変換する。ステップ111において、デコー
ダが、ビットストリームからのシンタックスデータを利用して、フレームに対する区分を
決定する。この区分は、ステップ103におけるブロック区分の結果と一致しなければなら
ない。ステップ111において利用されるようなエントロピー符号化/復号がここで説明され
る。エンコーダは、入力画像における値の空間的な位置決めに基づいて、いくつかの可能
な選択肢からブロック区分方式を選択することなどの、圧縮プロセスの間に多くの選択を
行う。厳密な選択のシグナリングは、多数のビンを利用し得る。本明細書では、ビンは、
変数として扱われる二進値(たとえば、状況に応じて変化し得るビット値)である。エント
ロピーコーディングは、特定の事例に対して明らかに実行可能ではないあらゆる選択肢を
エンコーダが廃棄することを可能にし、許容可能な選択肢のセットを残す。次いで、各々
の許容可能な選択肢が符号語を割り当てられる。符号語の長さは、許容可能な選択肢の数
に基づく(たとえば、2つの選択肢に対しては1つのビン、3つから4つの選択肢に対しては2
つのビンなど)。エンコーダは次いで、選択された選択肢に対する符号語を符号化する。
この方式は符号語のサイズを減らし、それは、すべての可能な選択肢の大きい可能性のあ
るセットからの選択を一意に示すのではなく、許容可能な選択肢の小さいサブセットから
の選択を一意に示すのに望まれる程度の大きさに符号語がなるからである。デコーダは次
いで、許容可能な選択肢のセットをエンコーダと同様の方式で決定することによって、選
択を復号する。許容可能な選択肢のセットを決定することによって、デコーダは、符号語
を読み取り、エンコーダによって行われる選択を決定することができる。
【0049】
ステップ113において、デコーダがブロック復号を実行する。具体的には、デコーダは
、逆変換を利用して残差ブロックを生成する。次いで、デコーダは、残差ブロックおよび
対応する予測ブロックを利用して、区分に従って画像ブロックを再構築する。予測ブロッ
クは、ステップ105においてエンコーダで生成されたようなイントラ予測ブロックとイン
ター予測ブロックの両方を含み得る。再構築された画像ブロックは次いで、ステップ111
において決定された区分データに従って、再構築されたビデオ信号のフレームへと位置決
めされる。ステップ113に対するシンタックスはまた、上で論じられたようにエントロピ
ーコーディングを介してビットストリームにおいてシグナリングされ得る。
【0050】
ステップ115において、エンコーダにおいて、ステップ107と同様の方式で、再構築され
たビデオ信号のフレームに対してフィルタリングが実行される。たとえば、ノイズ抑制フ
ィルタ、デブロッキングフィルタ、適応ループフィルタ、およびSAOフィルタが、ブロッ
キングアーティファクトを取り除くためにフレームに適用され得る。フレームがフィルタ
リングされると、ビデオ信号は、エンドユーザによる視聴のために、ステップ117におい
てディスプレイに出力され得る。
【0051】
図2は、ビデオコーディングのための例示的なコーディングおよび復号(コーデック)シ
ステム200の概略図である。具体的には、コーデックシステム200は、動作方法100の実施
をサポートするための機能を提供する。コーデックシステム200は、エンコーダとデコー
ダの両方において利用されるコンポーネントを描写するために一般化されている。コーデ
ックシステム200は、動作方法100においてステップ101および103に関して論じられるよう
なビデオ信号を受信して区分し、これは区分されたビデオ信号201をもたらす。コーデッ
クシステム200は次いで、方法100のステップ105、107、および109に関して論じられたよ
うなエンコーダとして動作するとき、区分されたビデオ信号201をコーディングされたビ
ットストリームへと圧縮する。デコーダとして動作するとき、コーデックシステム200は
、動作方法100のステップ111、113、115、および117に関して論じられたようなビットス
トリームから出力ビデオ信号を生成する。コーデックシステム200は、汎用コーダ制御コ
ンポーネント211、変換スケーリングおよび量子化コンポーネント213、イントラピクチャ
推定コンポーネント215、イントラピクチャ予測コンポーネント217、動き補償コンポーネ
ント219、動き推定コンポーネント221、スケーリングおよび逆変換コンポーネント229、
フィルタ制御分析コンポーネント227、ループ内フィルタコンポーネント225、復号ピクチ
ャバッファコンポーネント223、ならびにヘッダフォーマッティングおよびコンテキスト
適応バイナリ算術コーディング(CABAC)コンポーネント231を含む。そのようなコンポーネ
ントは示されるように結合される。図2では、黒い線は符号化/復号されるべきデータの動
きを示し、破線は他のコンポーネントの動作を制御する制御データの動きを示す。コーデ
ックシステム200のコンポーネントは、すべてエンコーダの中に存在し得る。デコーダは
、コーデックシステム200のコンポーネントのサブセットを含み得る。たとえば、デコー
ダは、イントラピクチャ予測コンポーネント217、動き補償コンポーネント219、スケーリ
ングおよび逆変換コンポーネント229、ループ内フィルタコンポーネント225、ならびに復
号ピクチャバッファコンポーネント223を含み得る。これらのコンポーネントがここで説
明される。
【0052】
区分されたビデオ信号201は、コーディングツリーによってピクセルのブロックへと区
分された、キャプチャされたビデオシーケンスである。コーディングツリーは、様々な分
割モードを利用して、ピクセルのブロックをピクセルのより小さいブロックへと再分割す
る。これらのブロックは次いで、より小さいブロックへとさらに再分割され得る。ブロッ
クは、コーディングツリー上のノードと呼ばれ得る。より大きい親ノードは、より小さい
子ノードへと分割される。ノードが再分割される回数は、ノード/コーディングツリーの
深度と呼ばれる。いくつかの場合、分割されたブロックはコーディングユニット(CU)に含
まれ得る。たとえば、CUは、ルマブロック、赤差分クロマ(Cr)ブロック、および青差分ク
ロマ(Cb)ブロックを、CUに対する対応するシンタックス命令とともに含む、CTUの下位部
分であり得る。分割モードは、利用される分割モードに応じて形状が変化する2つ、3つ、
または4つの子ノードへとそれぞれノードを区分するために利用される、二分木(BT)、三
分木(TT)、および四分木(QT)を含み得る。区分されたビデオ信号201は、圧縮のために、
汎用コーダ制御コンポーネント211、変換スケーリングおよび量子化コンポーネント213、
イントラピクチャ推定コンポーネント215、フィルタ制御分析コンポーネント227、ならび
に動き推定コンポーネント221に転送される。
【0053】
汎用コーダ制御コンポーネント211は、適用形態の制約に従って、ビデオシーケンスの
画像のビットストリームへのコーディングに関する決定を行うように構成される。たとえ
ば、汎用コーダ制御コンポーネント211は、ビットレート/ビットストリームサイズ対再構
築品質の最適化を管理する。そのような決定は、記憶空間/帯域幅の利用可能性および画
像解像度の要求に基づいて行われ得る。汎用コーダ制御コンポーネント211はまた、バッ
ファのアンダーランおよびオーバーランの問題を軽減するために、送信速度を考慮してバ
ッファ利用率を管理する。これらの問題を管理するために、汎用コーダ制御コンポーネン
ト211は、他のコンポーネントによる区分、予測、およびフィルタリングを管理する。た
とえば、汎用コーダ制御コンポーネント211は、圧縮の複雑さを動的に上げて解像度を向
上させて帯域幅使用率を向上させ、または、圧縮の複雑さを下げて解像度および帯域幅使
用率を低下させ得る。したがって、汎用コーダ制御コンポーネント211は、コーデックシ
ステム200の他のコンポーネントを制御して、ビデオ信号再構築の品質とビットレートの
問題のバランスをとる。汎用コーダ制御コンポーネント211は、制御データを作成し、こ
れは他のコンポーネントの動作を制御する。制御データは、ヘッダフォーマッティングお
よびCABACコンポーネント231にも転送されて、デコーダにおける復号のためのパラメータ
をシグナリングするためにビットストリームにおいて符号化される。
【0054】
区分されたビデオ信号201はまた、インター予測のために動き推定コンポーネント221お
よび動き補償コンポーネント219に送信される。区分されたビデオ信号201のフレームまた
はスライスは、複数のビデオブロックへと分割され得る。動き推定コンポーネント221お
よび動き補償コンポーネント219は、1つ以上の参照フレームの中の1つ以上のブロックに
対して相対的な、受信されたビデオブロックのインター予測コーディングを実行して、時
間予測を行う。コーデックシステム200は、複数のコーディングパスを実行して、たとえ
ば、ビデオデータの各ブロックに対して適切なコーディングモードを選択し得る。
【0055】
動き推定コンポーネント221および動き補償コンポーネント219は、高度に統合され得る
が、概念上の目的で別々に示される。動き推定コンポーネント221によって実行される動
き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動
きベクトルは、たとえば、予測ブロックに対して相対的なコーディングされたオブジェク
トのずれを示し得る。予測ブロックは、ピクセル差分に関して、コーディングされるべき
ブロックによく一致することが見いだされるブロックである。予測ブロックは参照ブロッ
クとも呼ばれ得る。そのようなピクセル差分は、絶対値差分和(SAD)、平方差分和(SSD)、
または他の差分尺度によって決定され得る。HEVCは、CTU、コーディングツリーブロック(
CTB)、およびCUを含む、いくつかのコーディングされたオブジェクトを利用する。たとえ
ば、CTUをCTBへと分割することができ、次いで、CUに含めるためにCTBをCBへと分割する
ことができる。CUは、予測データを含む予測ユニット(PU)および/またはCUのための変換
された残差データを含む変換ユニット(TU)として符号化され得る。動き推定コンポーネン
ト221は、レート歪み最適化プロセスの一部としてレート歪み分析を使用することによっ
て、動きベクトル、PU、およびTUを生成する。たとえば、動き推定コンポーネント221は
、現在のブロック/フレームのための複数の参照ブロック、複数の動きベクトルなどを決
定してもよく、最良のレート歪み特性を有する参照ブロック、動きベクトルなどを選択し
てもよい。最良のレート歪み特性は、ビデオ再構築の品質(たとえば、圧縮によるデータ
喪失の量)とコーディング効率(たとえば、最終的な符号化のサイズ)のバランスをとる。
【0056】
いくつかの例では、コーデックシステム200は、復号ピクチャバッファコンポーネント2
23に記憶されている参照ピクチャのサブ整数ピクセル位置に対する値を計算し得る。たと
えば、ビデオコーデックシステム200は、4分の1ピクセル位置、8分の1ピクセル位置、ま
たは参照ピクチャの他の分数ピクセル位置の値を補間し得る。したがって、動き推定コン
ポーネント221は、整数ピクセル位置と分数ピクセル位置に対する動き探索を実行して、
分数ピクセル精度の動きベクトルを出力し得る。動き推定コンポーネント221は、PUの位
置を参照ピクチャの予測ブロックの位置と比較することによって、インターコーディング
されたスライスの中のビデオブロックのPUに対する動きベクトルを計算する。動き推定コ
ンポーネント221は、計算された動きベクトルを符号化のために動きデータとしてヘッダ
フォーマッティングおよびCABACコンポーネント231に出力し、動きを動き補償コンポーネ
ント219に出力する。
【0057】
動き補償コンポーネント219によって実行される動き補償は、動き推定コンポーネント2
21によって決定される動きベクトルに基づいて予測ブロックをフェッチまたは生成するこ
とを伴い得る。再び、動き推定コンポーネント221および動き補償コンポーネント219は、
いくつかの例では機能的に統合され得る。現在のビデオブロックのPUに対する動きベクト
ルを受信すると、動き補償コンポーネント219は、動きベクトルが指し示す予測ブロック
を位置特定し得る。残差ビデオブロックは次いで、コーディングされている現在のビデオ
ブロックのピクセル値から予測ブロックのピクセル値を差し引き、ピクセル差分値を形成
することによって形成される。一般に、動き推定コンポーネント221は、ルマ成分に対す
る動き推定を実行し、動き補償コンポーネント219は、クロマ成分とルマ成分の両方に対
して、ルマ成分に基づいて計算される動きベクトルを使用する。予測ブロックおよび残差
ブロックは、変換スケーリングおよび量子化コンポーネント213に転送される。
【0058】
区分されたビデオ信号201は、イントラピクチャ推定コンポーネント215およびイントラ
ピクチャ予測コンポーネント217にも送信される。動き推定コンポーネント221および動き
補償コンポーネント219のように、イントラピクチャ推定コンポーネント215およびイント
ラピクチャ予測コンポーネント217は高度に統合され得るが、概念上の目的で別々に示さ
れている。イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポ
ーネント217は、上で説明されたように、フレーム間で動き推定コンポーネント221と動き
補償コンポーネント219によって実行されるインター予測に対する代替として、現在のフ
レームの中のブロックに対して現在のブロックをイントラ予測する。具体的には、イント
ラピクチャ推定コンポーネント215は、現在のブロックを符号化するために使用すべきイ
ントラ予測モードを決定する。いくつかの例では、イントラピクチャ推定コンポーネント
215は、複数の試験されるイントラ予測モードから、現在のブロックを符号化するための
適切なイントラ予測モードを選択する。選択されたイントラ予測モードは次いで、符号化
のためにヘッダフォーマッティングおよびCABACコンポーネント231に転送される。
【0059】
たとえば、イントラピクチャ推定コンポーネント215は、様々な試験されたイントラ予
測モードに対するレート歪み分析を使用してレート歪み値を計算し、試験されたモードの
中で最良のレート歪み特性を有するイントラ予測モードを選択する。レート歪み分析は一
般に、符号化されたブロックと、符号化されたブロックを生み出すために符号化された元
の符号化されていないブロックとの間の歪み(またはエラー)の量、ならびに、符号化され
たブロックを生み出すために使用されるビットレート(たとえば、ビットの数)を決定する
。イントラピクチャ推定コンポーネント215は、どのイントラ予測モードがブロックに対
して最良のレート歪み値を示すかを決定するために、様々な符号化されたブロックに対す
る歪みおよびレートから比を計算する。加えて、イントラピクチャ推定コンポーネント21
5は、レート歪み最適化(RDO)に基づいて、深度モデリングモード(DMM)を使用して深度マ
ップの深度ブロックをコーディングするように構成され得る。
【0060】
イントラピクチャ予測コンポーネント217は、エンコーダ上で実装されるとき、イント
ラピクチャ推定コンポーネント215によって決定される選択されたイントラ予測モードに
基づいて予測ブロックから残差ブロックを生成し、または、デコーダ上で実装されるとき
、ビットストリームから残差ブロックを読み取り得る。残差ブロックは、行列として表さ
れる、予測ブロックと元のブロックとの間の値の差分を含む。残差ブロックは次いで、変
換スケーリングおよび量子化コンポーネント213に転送される。イントラピクチャ推定コ
ンポーネント215およびイントラピクチャ予測コンポーネント217は、ルマ成分とクロマ成
分の両方に対して動作し得る。
【0061】
変換スケーリングおよび量子化コンポーネント213は、残差ブロックをさらに圧縮する
ように構成される。変換スケーリングおよび量子化コンポーネント213は、離散コサイン
変換(DCT)、離散サイン変換(DST)、または概念的に同様の変換などの変換を残差ブロック
に適用し、残差変換係数値を備えるビデオブロックを生み出す。ウェーブレット変換、整
数変換、サブバンド変換、または他のタイプの変換も使用され得る。変換は、残差情報を
ピクセル値領域から周波数領域などの変換領域に変換し得る。変換スケーリングおよび量
子化コンポーネント213はまた、たとえば周波数に基づいて、変換された残差情報をスケ
ーリングするように構成される。そのようなスケーリングは、異なる周波数情報が異なる
粒度で量子化されるように、スケール係数を残差情報に適用することを伴い、これは、再
構築されたビデオの最終的な視覚的品質に影響し得る。変換スケーリングおよび量子化コ
ンポーネント213はまた、ビットレートをさらに低減するために変換係数を量子化するよ
うに構成される。量子化プロセスは、係数の一部またはすべてと関連付けられるビット深
度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得
る。いくつかの例では、変換スケーリングおよび量子化コンポーネント213は次いで、量
子化された変換係数を含む行列の走査を実行し得る。量子化された変換係数は、ヘッダフ
ォーマッティングおよびCABACコンポーネント231に転送されて、ビットストリームにおい
て符号化される。
【0062】
スケーリングおよび逆変換コンポーネント229は、動き推定をサポートするために、変
換スケーリングおよび量子化コンポーネント213の逆の動作を適用する。スケーリングお
よび逆変換コンポーネント229は、逆スケーリング、変換、および/または量子化を適用し
て、たとえば、別の現在のブロックに対する予測ブロックになり得る参照ブロックとして
後で使用するために、ピクセル領域において残差ブロックを再構築する。動き推定コンポ
ーネント221および/または動き補償コンポーネント219は、後のブロック/フレームの動き
推定において使用するために残差ブロックを対応する予測ブロックに加算し戻すことによ
って参照ブロックを計算し得る。スケーリング、量子化、および変換の間に生み出される
アーティファクトを軽減するために、再構築された参照ブロックにフィルタが適用される
。そのようなアーティファクトは、そうされなければ、後続のブロックが予測されるとき
に不正確な予測を引き起こす(およびさらなるアーティファクトを生み出す)ことがある。
【0063】
フィルタ制御分析コンポーネント227およびループ内フィルタコンポーネント225は、フ
ィルタを残差ブロックおよび/または再構築された画像ブロックに適用する。たとえば、
スケーリングおよび逆変換コンポーネント229からの変換された残差ブロックは、元の画
像ブロックを再構築するために、イントラピクチャ予測コンポーネント217および/または
動き補償コンポーネント219からの対応する予測ブロックと組み合わせられ得る。フィル
タは次いで、再構築された画像ブロックに適用され得る。いくつかの例では、フィルタは
代わりに、残差ブロックに適用され得る。図2の他のコンポーネントのように、フィルタ
制御分析コンポーネント227およびループ内フィルタコンポーネント225は高度に統合され
、一緒に実装され得るが、概念上の目的で別々に図示されている。再構築された参照ブロ
ックに適用されるフィルタは、特定の空間領域に適用され、そのようなフィルタがどのよ
うに適用されるかを調整するための複数のパラメータを含む。フィルタ制御分析コンポー
ネント227は、そのようなフィルタがどこで適用されるべきかを決定するために再構築さ
れた参照ブロックを分析し、対応するパラメータを設定する。そのようなデータは、符号
化のためにフィルタ制御データとしてヘッダフォーマッティングおよびCABACコンポーネ
ント231に転送される。ループ内フィルタコンポーネント225は、フィルタ制御データに基
づいてそのようなフィルタを適用する。フィルタは、デブロッキングフィルタ、ノイズ抑
制フィルタ、SAOフィルタ、および適応ループフィルタを含み得る。そのようなフィルタ
は、例に応じて、空間/ピクセル領域で(たとえば、再構築されたピクセルブロック上で)
、または周波数領域で適用され得る。
【0064】
エンコーダとして動作するとき、フィルタリングされた再構築された画像ブロック、残
差ブロック、および/または予測ブロックは、上で論じられたような動き推定において後
で使用するために、復号ピクチャバッファコンポーネント223に記憶される。デコーダと
して動作するとき、復号ピクチャバッファコンポーネント223は、出力ビデオ信号の一部
として、再構築されフィルタリングされたブロックを記憶してディスプレイに転送する。
復号ピクチャバッファコンポーネント223は、予測ブロック、残差ブロック、および/また
は再構築された画像ブロックを記憶することが可能な任意のメモリデバイスであり得る。
【0065】
ヘッダフォーマッティングおよびCABACコンポーネント231は、コーデックシステム200
の様々なコンポーネントからデータを受信し、デコーダへの送信のためにそのようなデー
タをコーディングされたビットストリームへと符号化する。具体的には、ヘッダフォーマ
ッティングおよびCABACコンポーネント231は、一般的な制御データおよびフィルタ制御デ
ータなどの制御データを符号化するために、様々なヘッダを生成する。さらに、イントラ
予測および動きデータ、ならびに量子化された変換係数データの形態の残差データを含む
予測データが、すべてビットストリームにおいて符号化される。最終的なビットストリー
ムは、元の区分されたビデオ信号201を再構築するためにデコーダによって望まれるすべ
ての情報を含む。そのような情報は、イントラ予測モードインデックステーブル(符号語
マッピングテーブルとも呼ばれる)、様々なブロックに対する符号化コンテキストの定義
、最も確率の高いイントラ予測モードの指示、区分情報の指示なども含み得る。そのよう
なデータは、エントロピーコーディングを利用することによって符号化され得る。たとえ
ば、情報は、コンテキスト適応可変長コーディング(CAVLC)、CABAC、シンタックスベース
コンテキスト適応バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コ
ーディング、または別のエントロピーコーディング技法を利用することによって符号化さ
れ得る。エントロピーコーディングに続いて、コーディングされたビットストリームは、
別のデバイス(たとえば、ビデオデコーダ)に送信されてもよく、または、より後の送信も
しくは取り出しのためにアーカイブされてもよい。
【0066】
図3は、例示的なビデオエンコーダ300を示すブロック図である。ビデオエンコーダ300
は、コーデックシステム200の符号化機能を実装するために、ならびに/または動作方法10
0のステップ101、103、105、107、および/もしくは109を実装するために利用され得る。
エンコーダ300は、入力ビデオ信号を区分し、区分されたビデオ信号201と実質的に同様で
ある区分されたビデオ信号301をもたらす。区分されたビデオ信号301は次いで圧縮されて
、エンコーダ300のコンポーネントによりビットストリームへと符号化される。
【0067】
具体的には、区分されたビデオ信号301は、イントラ予測のためにイントラピクチャ予
測コンポーネント317に転送される。イントラピクチャ予測コンポーネント317は、イント
ラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217と実質
的に同様であり得る。区分されたビデオ信号301はまた、復号ピクチャバッファコンポー
ネント323の中の参照ブロックに基づくインター予測のために動き補償コンポーネント321
に転送される。動き補償コンポーネント321は、動き推定コンポーネント221および動き補
償コンポーネント219と実質的に同様であり得る。イントラピクチャ予測コンポーネント3
17および動き補償コンポーネント321からの予測ブロックおよび残差ブロックは、残差ブ
ロックの変換および量子化のために変換および量子化コンポーネント313に転送される。
変換および量子化コンポーネント313は、変換スケーリングおよび量子化コンポーネント2
13と実質的に同様であり得る。変換され量子化された残差ブロックおよび対応する予測ブ
ロックは(関連する制御データとともに)、ビットストリームへのコーディングのためにエ
ントロピーコーディングコンポーネント331に転送される。エントロピーコーディングコ
ンポーネント331は、ヘッダフォーマッティングおよびCABACコンポーネント231と実質的
に同様であり得る。
【0068】
変換され量子化された残差ブロックおよび/または対応する予測ブロックは、動き補償
コンポーネント321により使用される参照ブロックへの再構築のために、変換および量子
化コンポーネント313から逆変換および量子化コンポーネント329にも転送される。逆変換
および量子化コンポーネント329は、スケーリングおよび逆変換コンポーネント229と実質
的に同様であり得る。ループ内フィルタコンポーネント325の中のループ内フィルタは、
例に応じて、残差ブロックおよび/または再構築された参照ブロックにも適用される。ル
ープ内フィルタコンポーネント325は、フィルタ制御分析コンポーネント227およびループ
内フィルタコンポーネント225と実質的に同様であり得る。ループ内フィルタコンポーネ
ント325は、ループ内フィルタコンポーネント225に関して論じられたような複数のフィル
タを含み得る。フィルタリングされたブロックは次いで、動き補償コンポーネント321に
より参照ブロックとして使用するために、復号ピクチャバッファコンポーネント323に記
憶される。復号ピクチャバッファコンポーネント323は、復号ピクチャバッファコンポー
ネント223と実質的に同様であり得る。
【0069】
図4は、例示的なビデオデコーダ400を示すブロック図である。ビデオデコーダ400は、
コーデックシステム200の復号機能を実装するために、ならびに/または動作方法100のス
テップ111、113、115、および/もしくは117を実施するために利用され得る。デコーダ400
は、たとえばエンコーダ300から、ビットストリームを受信し、エンドユーザに表示する
ために、再構築された出力ビデオ信号をビットストリームに基づいて生成する。
【0070】
ビットストリームは、エントロピー復号コンポーネント433によって受信される。エン
トロピー復号コンポーネント433は、CAVLC、CABAC、SBAC、PIPEコーディング、または他
のエントロピーコーディング技法などのエントロピー復号方式を実装するように構成され
る。たとえば、エントロピー復号コンポーネント433は、ビットストリームにおいて符号
語として符号化される追加のデータを解釈するためのコンテキストを提供するために、ヘ
ッダ情報を利用し得る。復号された情報は、一般的な制御データ、フィルタ制御データ、
区分情報、動き情報、予測データ、および残差ブロックからの量子化された変換係数など
の、ビデオ信号を復号するための任意の望まれる情報を含む。量子化された変換係数は、
残差ブロックへの再構築のために逆変換および量子化コンポーネント429に転送される。
逆変換および量子化コンポーネント429は、逆変換および量子化コンポーネント329と同様
であり得る。
【0071】
再構築された残差ブロックおよび/または予測ブロックは、イントラ予測動作に基づい
て、画像ブロックへの再構築のためにイントラピクチャ予測コンポーネント417に転送さ
れる。イントラピクチャ予測コンポーネント417は、イントラピクチャ推定コンポーネン
ト215およびイントラピクチャ予測コンポーネント217と同様であり得る。具体的には、イ
ントラピクチャ予測コンポーネント417は、フレームの中で参照ブロックを位置特定する
ために予測モードを利用し、残差ブロックを結果に適用してイントラ予測された画像ブロ
ックを再構築する。再構築されたイントラ予測された画像ブロックおよび/または残差ブ
ロックならびに対応するインター予測データは、ループ内フィルタコンポーネント425を
介して復号ピクチャバッファコンポーネント423に転送され、これらは、復号ピクチャバ
ッファコンポーネント223およびループ内フィルタコンポーネント225とそれぞれ実質的に
同様であり得る。ループ内フィルタコンポーネント425は、再構築された画像ブロック、
残差ブロック、および/または予測ブロックをフィルタリングし、そのような情報は復号
ピクチャバッファコンポーネント423に記憶される。復号ピクチャバッファコンポーネン
ト423からの再構築された画像ブロックは、インター予測のために動き補償コンポーネン
ト421に転送される。動き補償コンポーネント421は、動き推定コンポーネント221および/
または動き補償コンポーネント219と実質的に同様であり得る。具体的には、動き補償コ
ンポーネント421は、参照ブロックからの動きベクトルを利用して予測ブロックを生成し
、残差ブロックを結果に適用して画像ブロックを再構築する。得られる再構築されたブロ
ックはまた、ループ内フィルタコンポーネント425を介して復号ピクチャバッファコンポ
ーネント423に転送され得る。復号ピクチャバッファコンポーネント423は、追加の再構築
された画像ブロックを記憶し続け、これらは区分情報を介してフレームへと再構築され得
る。そのようなフレームは、シーケンスにも配置されてもよい。シーケンスは、再構築さ
れた出力ビデオ信号としてディスプレイに出力される。
【0072】
図5は、先行ピクチャを伴う例示的なCVS500を示す概略図である。たとえば、CVS500は
、方法100に係る、コーデックシステム200および/またはエンコーダ300などのエンコーダ
によって符号化され得る。さらに、CVS500は、コーデックシステム200および/またはデコ
ーダ400などのデコーダによって復号され得る。CVS500は、復号順序508でコーディングさ
れるピクチャを含む。復号順序508は、ピクチャがビットストリームにおいて位置決めさ
れる順序である。CVS500のピクチャは次いで、提示順序510で出力される。提示順序510は
、得られたビデオを適切に表示させるためにデコーダによってピクチャが表示されるべき
順序である。たとえば、CVS500のピクチャは、一般に提示順序510で位置決めされ得る。
しかしながら、たとえばインター予測をサポートするために類似したピクチャをより近く
に配置することによって、コーディング効率を高めるために、いくつかのピクチャが異な
る位置へと移動され得る。このようにそのようなピクチャを動かすと、復号順序508が得
られる。示される例では、ピクチャは、0から4まで復号順序508でインデックスをつけら
れる。提示順序510において、インデックス2およびインデックス3におけるピクチャは、
インデックス0におけるピクチャの前に移動されている。
【0073】
CVS500はIRAPピクチャ502を含む。IRAPピクチャ502は、CVS500のためのランダムアクセ
スポイントとして役割を果たす、イントラ予測に従ってコーディングされるピクチャであ
る。具体的には、IRAPピクチャ502のブロックは、IRAPピクチャ502の他のブロックへの参
照によってコーディングされる。IRAPピクチャ502は他のピクチャを参照せずにコーディ
ングされるので、いずれの他のピクチャも先に復号することなく、IRAPピクチャ502が復
号され得る。したがって、デコーダは、IRAPピクチャ502においてCVS500の復号を開始す
ることができる。さらに、IRAPピクチャ502により、DPBがリフレッシュされるようになり
得る。たとえば、IRAPピクチャ502の後に提示される大半のピクチャは、インター予測の
ためにIRAPピクチャ502の前のピクチャ(たとえば、ピクチャインデックス0)に依存しなく
てもよい。したがって、ピクチャバッファは、IRAPピクチャ502が復号されるとリフレッ
シュされ得る。これには、あらゆるインター予測関連のコーディングエラーを止める効果
があり、それは、そのようなエラーはIRAPピクチャ502を通って広がることができないか
らである。IRAPピクチャ502は、様々なタイプのピクチャを含み得る。たとえば、IRAPピ
クチャは、瞬時デコーダリフレッシュ(IDR)またはクリーンランダムアクセス(CRA)として
コーディングされ得る。IDRは、新しいCVS500を開始してピクチャバッファをリフレッシ
ュする、イントラコーディングされたピクチャである。CRAは、新しいCVS500を開始する
ことなく、またはピクチャバッファをリフレッシュすることなく、ランダムアクセスポイ
ントとして動作するイントラコーディングされたピクチャである。このようにして、CRA
と関連付けられる先行ピクチャ504はCRAの前のピクチャを参照することがあるが、IDRと
関連付けられる先行ピクチャ504はIDRの前のピクチャを参照しないことがある。
【0074】
CVS500は様々な非IRAPピクチャも含む。これらは、先行ピクチャ504および後端ピクチ
ャ506を含む。先行ピクチャ504は、復号順序508においてIRAPピクチャ502の後に位置決め
されるが、提示順序510においてIRAPピクチャ502の前に位置決めされるピクチャである。
後端ピクチャ506は、復号順序508と提示順序510の両方においてIRAPピクチャ502の後に位
置決めされる。先行ピクチャ504および後端ピクチャ506はともに、大半の場合、インター
予測に従ってコーディングされる。後端ピクチャ506は、IRAPピクチャ502またはIRAPピク
チャ502の後に位置決めされるピクチャを参照してコーディングされる。したがって、後
端ピクチャ506は、IRAPピクチャ502が復号されると常に復号されることが可能である。先
行ピクチャ504は、ランダムアクセススキップ先行(RASL)ピクチャおよびランダムアクセ
ス復号可能先行(RADL)ピクチャを含み得る。RASLピクチャは、IRAPピクチャ502の前のピ
クチャへの参照によってコーディングされるが、IRAPピクチャ502の後の位置においてコ
ーディングされる。RASLピクチャは以前のピクチャに依存するので、IRAPピクチャ502に
おいてデコーダが復号を開始するとき、RASLピクチャを復号することはできない。したが
って、RASLピクチャは、IRAPピクチャ502がランダムアクセスポイントとして使用される
とき、スキップされ、復号されない。しかしながら、デコーダがランダムアクセスポイン
トとして前のIRAPピクチャ(インデックス0より前にあり示されていない)を使用するとき
、RASLピクチャが復号されて表示される。RADLピクチャは、IRAPピクチャ502および/また
はIRAPピクチャ502の後のピクチャを参照してコーディングされるが、提示順序においてI
RAPピクチャ502の前に位置決めされる。RADLピクチャはIRAPピクチャ502の前のピクチャ
に依存しないので、IRAPピクチャ502がランダムアクセスポイントであるとき、RADLピク
チャを復号して表示することができる。
【0075】
図6A図6Cは、インターレースビデオコーディングの例を集合的に示す概略図である。
インターレースビデオコーディングは、図6Aおよび図6Bに示されるような第1のピクチャ6
01および第2のピクチャ602から、図6Cに示されるようなインターレースビデオフレーム60
0を生成する。たとえば、インターレースビデオコーディングは、インターレースビデオ
フレーム600を含むビデオを方法100の一部として符号化するとき、コーデックシステム20
0および/またはエンコーダ300などのエンコーダによって利用され得る。さらに、コーデ
ックシステム200および/またはデコーダ400などのデコーダは、インターレースビデオフ
レーム600を含むビデオを復号し得る。加えて、インターレースビデオフレーム600は、以
下で図7に関してより詳しく論じられるような、CVS500などのCVSに符号化され得る。
【0076】
インターレースビデオコーディングを実行するとき、図6Aに示されるように、第1のフ
ィールド610は第1の時間においてキャプチャされ、第1のピクチャ601へと符号化される。
第1のフィールド610は、ビデオデータの水平線を含む。具体的には、第1のフィールド610
の中のビデオデータの水平線は、第1のピクチャ601の左の境界から第1のピクチャ601の右
の境界に延びる。しかしながら、第1のフィールド610はビデオデータの行を交互に省略す
る。ある例示的な実装形態では、第1のフィールド610は、第1の時間においてビデオキャ
プチャデバイスによってキャプチャされたビデオデータの半分を含む。
【0077】
図6Bに示されるように、第2のフィールド612は、第2の時間においてキャプチャされ、
第2のピクチャ602へと符号化される。たとえば、第2の時間は、ビデオのためのフレーム
レートセットに基づいて設定される値だけ第1の時間の直後にあり得る。たとえば、15フ
レーム毎秒(FPS)というフレームレートで表示するように設定されるビデオでは、第2の時
間は第1の時間から15分の1秒後にあり得る。示されるように、第2のフィールド612は、第
1のピクチャ601の第1のフィールド610の水平線を補完するビデオデータの水平線を含む。
具体的には、第2のフィールド612の中のビデオデータの水平線は、第2のピクチャ602の左
の境界から第2のピクチャ602の右の境界に延びる。第2のフィールド612は、第1のフィー
ルド610によって省略される水平線を含む。加えて、第2のフィールド612は、第1のフィー
ルド610に含まれる水平線を省略する。
【0078】
第1のピクチャ601の第1のフィールド610および第2のピクチャ602の第2のフィールド612
は、図6Cに示されるようにインターレースビデオフレーム600としてデコーダにおいて表
示するために合成され得る。具体的には、インターレースビデオフレーム600は、第1の時
間においてキャプチャされた第1のピクチャ601の第1のフィールド610および第2の時間に
おいてキャプチャされた第2のピクチャ602の第2のフィールド612を含む。そのような合成
には、動きを強調および/または誇張する視覚的な効果がある。ビデオの一部として表示
されると、一連のインターレースビデオフレーム600は、追加のフレームを実際に符号化
する必要なく、向上したフレームレートでビデオが符号化されているかのような印象を生
み出す。このようにして、インターレースビデオフレーム600を利用するインターレース
ビデオコーディングは、ビデオデータサイズの増大を伴うことなく、ビデオの実効的なフ
レームレートを上げることができる。したがって、インターレースビデオコーディングは
、符号化されたビデオシーケンスのコーディング効率を向上させ得る。
【0079】
図7は、たとえばインターレースビデオフレーム600を作成するためのインターレースビ
デオコーディングと、先行ピクチャとの両方を利用する例示的なCVS700を示す概略図であ
る。CVS700は、かなりCVS500に似ているが、第1のピクチャ601および第2のピクチャ602な
どのフィールドを伴うピクチャを符号化しながら先行ピクチャを保持するように修正され
る。たとえば、CVS700は、方法100に係る、コーデックシステム200および/またはエンコ
ーダ300などのエンコーダによって符号化され得る。さらに、CVS700は、コーデックシス
テム200および/またはデコーダ400などのデコーダによって復号され得る。
【0080】
CVS700は、復号順序708および提示順序710を有し、これはそれぞれ、復号順序508およ
び提示順序510にかなり似た方式で動作する。CVS700はまた、IRAPピクチャ702、先行ピク
チャ704、および後端ピクチャ706を含み、これらは、IRAPピクチャ502、先行ピクチャ504
、および後端ピクチャ506に似ている。違いは、IRAPピクチャ702、先行ピクチャ704、お
よび後端ピクチャ706はすべて、図6A図6Cに関して説明されたように、第1のフィールド
610および第2のフィールド612とかなり似た方式でフィールドを利用することによってコ
ーディングされるということである。したがって、各フレームは2つのピクチャを含む。
したがって、CVS700はCVS500の2倍のピクチャを含む。しかしながら、CVS700は、CVS700
のピクチャが各々フレームの半分を省略するので、CVS500と概ね同じ量のデータを含む。
【0081】
CVS700についての問題は、イントラ予測コーディングされたデータの第1のフィールド
を含めることによってIRAPピクチャ702が符号化されるということである。次いで、イン
トラ予測コーディングされたデータの第2のフィールドが、非先行ピクチャ703に含まれる
。非先行ピクチャ703はIRAPピクチャ702ではなく、それは、デコーダが非先行ピクチャ70
3においてCVS700の復号を開始できないからである。これは、そうすることでIRAPピクチ
ャ702と関連付けられるフレームの半分を省略するからである。これは、VVCを利用するビ
デオコーディングシステムが復号順序708においてIRAPピクチャ702の直後に先行ピクチャ
704を位置決めするように制約され得るので、問題を生み出す。
【0082】
本開示は、CVS700がVVCシステムにより利用されることを許容する。具体的には、IRAP
ピクチャ702と先行ピクチャ704との間に単一の非先行ピクチャ703が位置決めされること
がいつ許容されるかを示すために、フラグがシグナリングされ得る。ビデオシステムはそ
れでも、非先行ピクチャ703および/または後端ピクチャ706が先行ピクチャ704間で位置決
めされるのを防ぐように制約され得る。したがって、このフラグは、復号順序708が、IRA
Pピクチャ702、単一の非先行ピクチャ703、任意の先行ピクチャ704(たとえば、先行ピク
チャ704は任意選択でありいくつかの例では省略され得る)、次いで1つ以上の後端ピクチ
ャ706を含むことを示し得る。したがって、このフラグは、CVS500を予期すべきであるか
、またはCVS700を予期すべきであるかをデコーダに示すことができる。いくつかの例では
、SPSの中のfield_seq_flagは、以下で論じられるような目的で利用され得る。
【0083】
図8は、インターレースビデオコーディングと先行ピクチャの両方を含むように構成さ
れる例示的なビットストリーム800を示す概略図である。たとえば、ビットストリーム800
は、方法100に係るコーデックシステム200および/またはデコーダ400によって復号するた
めの、コーデックシステム200および/またはエンコーダ300によって生成され得る。さら
に、ビットストリーム800は、CVS500および/または700を含み得る。したがって、ビット
ストリーム800は、インターレースビデオフレーム600を作成するために合成され得る第1
のピクチャ601および第2のピクチャ602を含み得る。さらに、ビットストリーム800は先行
ピクチャ504および/または704を含み得る。
【0084】
ビットストリーム800は、SPS810、複数のピクチャパラメータセット(PPS)811、複数の
スライスヘッダ815、および画像データ820を含む。SPS810は、ビットストリーム800に含
まれるコーディングされたビデオシーケンスの中のすべてのピクチャに共通のシーケンス
データを含む。そのようなデータは、ピクチャサイズ、ビット深度、コーディングツール
パラメータ、ビットレート制限などを含み得る。PPS811は、ピクチャ全体に適用されるパ
ラメータを含む。したがって、ビデオシーケンスの中の各ピクチャは、PPS811を参照し得
る。各ピクチャはPPS811を参照するが、いくつかの例では、単一のPPS811は複数のピクチ
ャのためのデータを含み得ることに留意されたい。たとえば、複数の類似するピクチャは
、類似するパラメータに従ってコーディングされ得る。そのような場合、単一のPPS811は
そのような類似するピクチャのためのデータを含み得る。PPS811は、対応するピクチャの
中のスライスに利用可能なコーディングツール、量子化パラメータ、オフセットなどを示
すことができる。スライスヘッダ815は、ピクチャの中の各スライスに固有のパラメータ
を含む。したがって、ビデオシーケンスの中のスライスごとに1つのスライスヘッダ815が
あり得る。スライスヘッダ815は、スライスタイプ情報、ピクチャ順序カウント(POC)、参
照ピクチャリスト、予測重み、タイルエントリポイント、デブロッキングパラメータなど
を含み得る。スライスヘッダ815はまた、いくつかの文脈ではタイルグループヘッダとも
呼ばれ得ることに留意されたい。
【0085】
画像データ820は、インター予測および/またはイントラ予測に従って符号化されるビデ
オデータ、ならびに対応する変換され量子化される残差データを含む。たとえば、ビデオ
シーケンスは複数のフレーム821を含む。フレーム821は、ビデオシーケンスの中の対応す
る瞬間におけるユーザへの完全なまたは部分的な表示を意図されている完全な画像である
。フレーム821は1つ以上のピクチャ823を含み得る。大半の文脈において、フレーム821は
単一のピクチャ823を含む。そのような場合、単一のアクセスユニット(AU)に含まれるピ
クチャ823画像/フレーム821。しかしながら、インターレースビデオの文脈では、ピクチ
ャ823は、第1のフィールド610または第2のフィールド612などの、AUに含まれる水平線の
フィールドである。したがって、フレーム821は、インターレースビデオコーディングを
利用するとき、2つのピクチャ823から生成され得る。ピクチャ823は1つ以上のスライス82
5を含む。スライス825は、単一のネットワーク抽象化レイヤ(NAL)ユニットに独占的に含
まれるピクチャ823の整数個の完全なタイルまたは整数個の連続する完全なコーディング
ツリーユニット(CTU)行(たとえば、タイル内の)として定義され得る。したがって、スラ
イス725はさらに、CTUおよび/またはコーディングツリーブロック(CTB)へと分割される。
CTU/CTBはさらに、コーディングツリーに基づいてコーディングブロックへと分割される
。コーディングブロックは次いで、予測機構に従って符号化/復号され得る。
【0086】
ビットストリーム800はfield_seq_flag827を含み得る。field_seq_flag827は、CVS500
に示されるように、IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング
順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、
第1の値に設定され得る。このフラグは、CVS700に示されるように、非先行ピクチャが、
コーディング順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあ
り、復号順序において最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが
位置決めされないとき、第2の値に設定され得る。この場合、IRAPピクチャはフレームの
第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャはフレームの第2
のフィールドを含む。示される例では、field_seq_flag827はSPS810に含まれ得る。具体
的な例として、field_seq_flag827は、フレーム821のフィールドを表すピクチャ823をコ
ーディングされたビデオシーケンスが含むことを示すとき、1に設定されてもよく、また
は、完全なフレーム821を各々表すピクチャ823をコーディングされたビデオシーケンスを
含むことを示すとき、0に設定されてもよい。したがって、デコーダは、field_seq_flag8
27を読み取り、IRAPピクチャおよび1つ以上の非先行ピクチャを復号することがIRAPピク
チャからの第1のフィールドと最初の先行ピクチャの前にある非先行ピクチャからの第2の
フィールドとをインターレースして単一のフレームを作成することをいつ含むべきである
かを決定することができる。したがって、field_seq_flag827は、先行ピクチャに関連し
てインターレースビデオコーディングが利用されることを可能にする。したがって、fiel
d_seq_flag827を利用することは、エンコーダおよび/またはデコーダの機能を高める。さ
らに、field_seq_flag827を利用することは、ビデオシーケンスをコーディングするため
に必要とされるデータの量を大きく増やすことなく実効的なフレームレートの向上を可能
にすることによって、ビットストリーム800のコーディング効率を上げ得る。したがって
、field_seq_flag827を利用することは、エンコーダおよび/またはデコーダにおける、プ
ロセッサ、メモリ、および/またはネットワーク送信リソースの使用量を減らし得る。
【0087】
ここで、上記の情報が本明細書において以下でより詳しく説明される。IRAPピクチャは
、様々な有益な機能を提供するが、圧縮効率に対する不利益を生み出す。IRAPピクチャの
存在は、ビットレートの急上昇を引き起こし得る。圧縮効率に対するこの不利益は、複数
の理由で引き起こされ得る。たとえば、IRAPピクチャはイントラ予測されたピクチャであ
るので、IRAPピクチャは、インター予測されたピクチャと比較して表現するためにより多
くのビットを必要とする。さらに、IRAPピクチャの存在は時間的な予測を壊し得る。これ
は、デコーダがIRAPピクチャを受信すると復号プロセスをリフレッシュし得るからであり
、これはDPBにおける以前の参照ピクチャの除去をもたらす。これにより、インター予測
コーディングを実行するときにより少数の参照ピクチャへのアクセスをそのようなが有す
るので、復号順序においてIRAPピクチャの後にあるピクチャのコーディングがより非効率
になり得る。
【0088】
IRAPピクチャとして使用されるピクチャタイプの中で、IDRピクチャは、他のピクチャ
タイプと比較して異なるシグナリングおよび導出を利用し得る。違いのいくつかは次の通
りである。IDRピクチャのPOC値をシグナリングおよび/または導出するとき、POCの最上位
ビット(MSB)部分は、以前のキーピクチャから導出されないことがある。代わりに、POCの
MSBは0に等しく設定され得る。さらに、IDRピクチャのスライスヘッダは、参照ピクチャ
管理を実行する際にデコーダを支援するための情報を含まないことがある。CRA、後端、
および時間サブレイヤアクセス(TSA)などの他のピクチャタイプに対して、参照ピクチャ
セット(RPS)または参照ピクチャリストなどの情報は、スライスヘッダに含まれ、参照ピ
クチャマーキングプロセスのために利用され得る。ピクチャマーキングプロセスは、参照
のために使用されるか、または参照のために使用されないかのいずれかであるものとして
、DPBの中の参照ピクチャのステータスを決定するために利用される。しかしながら、IDR
ピクチャに対して、そのような情報は、参照のために使用されないものとしてDPBの中の
すべての参照ピクチャを復号プロセスが単にマークすべきであることをIDRの存在が示す
ので、シグナリングされないことがある。
【0089】
加えて、先行ピクチャはIRAPと関連付けられ得る。先行ピクチャは、復号順序において
その関連するIRAPピクチャの後にあるが出力順序においてIRAPピクチャの前にあるピクチ
ャである。コーディング構成およびピクチャ参照構造に応じて、先行ピクチャはさらに2
つのタイプへと識別され得る。RASLピクチャとして知られているピクチャの第1のタイプ
は、関連するIRAPピクチャにおいて復号プロセスが開始するとき、正しく復号されないこ
とがある先行ピクチャである。このことは、復号順序においてIRAPピクチャの前にあるピ
クチャを参照してこれらの先行ピクチャがコーディングされるので、起こり得る。RADLピ
クチャとして知られているピクチャの第2のタイプは、復号プロセスが関連するIRAPピク
チャにおいて開始するときでも正しく復号されることになる先行ピクチャである。これは
、これらの先行ピクチャが、直接または間接的に、復号順序においてIRAPピクチャの前に
あるあらゆるピクチャを参照することなくコーディングされるので可能である。いくつか
のビデオコーディングシステムでは、IRAPピクチャと関連付けられるRASLピクチャは、出
力順序において同じIRAPピクチャと関連付けられるRADLピクチャの前にあるように制約さ
れる。
【0090】
IRAPピクチャおよび先行ピクチャは、それらがシステムレベルアプリケーションによっ
て容易に識別され得るように、所与の異なるNALユニットタイプであり得る。たとえば、
ビデオ接合器は、コーディングされたビットストリームの中の詳細なシンタックス要素を
考慮する必要なく、コーディングされたピクチャタイプを理解し得る。たとえば、接合は
、後端ピクチャからのRASLピクチャおよびRADLピクチャを決定することを含めて、非IRAP
ピクチャからのIRAPピクチャを識別し、先行ピクチャを識別することが必要であり得る。
後端ピクチャは、IRAPピクチャと関連付けられ、出力順序においてIRAPピクチャの後にあ
るピクチャである。現在のピクチャは、現在のピクチャが復号順序においてIRAPピクチャ
の後にあり、復号順序において任意の他のIRAPピクチャの前にあるとき、IRAPピクチャと
関連付けられる。したがって、IRAPピクチャおよび先行ピクチャに対応するNALユニット
タイプを提供することは、そのような適用例の機能性を支える。
【0091】
いくつかのビデオコーディングシステムでは、IRAPピクチャおよび先行ピクチャのため
のNALユニットタイプは、以下を含み得る。先行ピクチャを伴うブロークンリンクアクセ
ス(BLA)(BLA_W_LP)は、復号順序において1つ以上の先行ピクチャが後にあり得るBLAピク
チャのためのNALユニットである。RADLを伴うBLA(BLA_W_RADL)は、復号順序において1つ
以上のRADLピクチャが後にあり得るがRASLピクチャが後にないことがあるBLAピクチャの
ためのNALユニットである。先行ピクチャを伴わないBLA(BLA_N_LP)は、復号順序において
先行ピクチャが後にないBLAピクチャのNALユニットである。RADLを伴うIDR(IDR_W_RADL)
は、復号順序において1つ以上のRADLピクチャが後にあり得るがRASLピクチャが後にない
ことがあるIDRピクチャのNALユニットである。先行ピクチャを伴わないIDR(IDR_N_LP)は
、復号順序において先行ピクチャが後にないIDRピクチャのNALユニットである。CRAは、R
ASLピクチャおよび/またはRADLピクチャを含む先行ピクチャが後にあり得るCRAピクチャ
のNALユニットである。RADLはRADLピクチャのNALユニットである。RASLはRASLピクチャの
NALユニットである。
【0092】
他のビデオコーディングシステムは、IRAPおよび先行ピクチャのために以下のNALユニ
ットタイプを利用し得る。IDR_W_RADLは、復号順序において1つ以上のRADLピクチャが後
にあり得るがRASLピクチャが後にないことがある、IDRピクチャのNALユニットである。ID
R_N_LPは、復号順序において先行ピクチャが後にないIDRピクチャのNALユニットである。
CRAは、RASLピクチャおよび/またはRADLピクチャなどの先行ピクチャが後にあり得るCRA
ピクチャのNALユニットである。RADLはRADLピクチャのNALユニットである。RASLはRASLピ
クチャのNALユニットである。
【0093】
ビットストリーム適合のために、いくつかの制約が、たとえばHEVCおよび/またはVVCシ
ステムにおける先行ピクチャに適用され得る。そのような制約は次の通りである。復号順
序においてビットストリームの中の最初のピクチャ以外の各ピクチャは、復号順序におい
て前のIRAPピクチャと関連付けられると見なされ得る。ピクチャがIRAPピクチャの先行ピ
クチャであるとき、ピクチャはRADLまたはRASLピクチャであるものとする。ピクチャがIR
APピクチャの後端ピクチャであるとき、ピクチャはRADLピクチャまたはRASLピクチャでは
ないものとする。ピクチャがIRAPピクチャの先行ピクチャであるとき、ピクチャは、復号
順序において、同じIRAPピクチャと関連付けられるすべての後端ピクチャの前にあるもの
とする。RASLピクチャはIDRピクチャと関連付けられないものとする。RADLピクチャはIDR
_N_LPに等しいnal_unit_typeを有するIDRピクチャと関連付けられないものとする。IRAP
アクセスユニットの前のすべてのアクセスユニットを廃棄することによって、ランダムア
クセスがIRAPアクセスユニットの位置において実行され得ることに留意されたい。そのよ
うなランダムアクセスは、復号順序において、IRAPピクチャおよびすべての後続の非RASL
ピクチャを正しく復号することをもたらし得る。各パラメータセットが利用可能であると
仮定すると、そのようなパラメータセットがアクティブ化されるべきであるとき、ビット
ストリームの中で、またはユーザ入力などの外部の手段によってのいずれかで、そのよう
なランダムアクセスが実行され得る。さらに、復号順序においてIRAPピクチャの前にある
あらゆるピクチャが、出力順序においてIRAPピクチャの前にあり、出力順序においてIRAP
ピクチャと関連付けられる任意のRADLピクチャの前にあるものとする。CRAピクチャと関
連付けられる任意のRASLピクチャが、出力順序においてCRAピクチャと関連付けられる任
意のRADLピクチャの前にあるものとする。CRAピクチャと関連付けられる任意のRASLピク
チャは、出力順序において、復号順序でCRAピクチャの前にあるあらゆるIRAPピクチャの
後にあるものとする。
【0094】
したがって、上で説明されたような先行ピクチャに関するビットストリーム適合制約は
、インターレースビデオコーディング機構と競合し得る。競合は次の通りである。インタ
ーレースコーディングが使用されるとき、IRAPピクチャの2つのフィールドはともにIRAP
ピクチャとしてマークされない。代わりに、第1のフィールドだけがIRAPピクチャとして
マークされ、第2のフィールドが後端ピクチャとしてマークされる。ピクチャの第2のフィ
ールドを含むインターレース後端ピクチャは、復号順序においてインターレースIRAPピク
チャの直後にあるべきである。これは、インターレースIRAPピクチャおよびインターレー
ス後端ピクチャが完全なフレームをなすからである。先行ピクチャが復号順序においてIR
APピクチャの後にある場合、次いで、ピクチャがIRAPピクチャの先行ピクチャであるとき
、ピクチャは、復号順序において、同じIRAPピクチャと関連付けられるすべての後端ピク
チャより前にあるものとするということを述べる制約に違反する。上記の制約は、IRAPと
関連付けられる先行ピクチャがあるかどうか、およびすべての先行ピクチャが考慮された
かどうかを効率的に決定する際に、ビデオ接合器などの外部エンティティを助け得るので
、それらの制約を単純に取り除くことはできない。そのような外部エンティティは次のよ
うに動作し得る。IRAPピクチャから開始して、IRAPピクチャの直後のピクチャが後端ピク
チャである場合、外部エンティティは、IRAPピクチャと関連付けられる先行ピクチャはな
いと決定することができる。したがって、IRAPピクチャと関連付けられるすべての先行ピ
クチャを探すために、外部エンティティは、この制約に基づいて、復号順序においてIRAP
ピクチャの後にある最初の後端ピクチャを見つけ得る。上記の制約がなければ、外部エン
ティティは、IRAPピクチャと関連付けられるすべての先行ピクチャを見つけるために、次
のIRAPピクチャまで探すことが必要とされ得る。
【0095】
一般に、本開示は、IRAPピクチャと関連付けられる先行ピクチャを扱うための方法を説
明する。より具体的には、本開示は、IRAPピクチャと関連付けられる先行ピクチャを効率
的に探して特定しながら、インターレースビデオコンテンツの効率的なコーディングをサ
ポートするための方法を説明する。本技法の説明は、ITU-TおよびISO/IECのJVETによるVV
C規格に基づいて説明される。しかしながら、本技法は他のビデオコーデック規格にも適
用され得る。
【0096】
上で列挙された問題を解決するために、本開示は以下の態様を含み、これらは個別に、
または組み合わせて適用され得る。たとえば、IRAPピクチャと関連付けられる先行ピクチ
ャは、復号順序において間に非先行ピクチャを伴わずに連続して位置決めされ得る。さら
に、以下の制約は、IRAPピクチャおよび先行ピクチャのビットストリーム適合のために適
用される。picAおよびpicBをそれぞれ、IRAPピクチャと関連付けられる最初の先行ピクチ
ャおよび最後の先行ピクチャとする。そのような場合、復号順序においてそれぞれpicAの
後にありpicBの前にある、先行ピクチャではないピクチャはないものとする。
【0097】
以下の制約も適用され得る。field_seq_flagが0に等しく設定され、現在のピクチャがI
RAPピクチャと関連付けられる先行ピクチャである場合、現在のピクチャは、復号順序に
おいて、同じIRAPピクチャと関連付けられるすべての非先行ピクチャの前にある。そうで
はなく、field_seq_flagが1に等しく設定される場合、picAおよびpicBを、復号順序にお
いて、それぞれIRAPピクチャと関連付けられる最初の先行ピクチャおよび最後の先行ピク
チャとする。そのような場合、復号順序においてpicAより前に多くても1つの非先行ピク
チャしかないものとし、復号順序においてpicAの後にあり復号順序においてpicBより前に
ある非先行ピクチャはないものとする。
【0098】
以下の制約も適用され得る。general_frame_only_constraint_flagが1に等しく、現在
のピクチャがIRAPピクチャと関連付けられる先行ピクチャである場合、現在のピクチャは
、復号順序において、同じIRAPピクチャと関連付けられるすべての非先行ピクチャの前に
あるものとする。そうではなく、general_frame_only_constraint_flagが0に等しい場合
、picAおよびpicBをそれぞれ、復号順序において、IRAPピクチャと関連付けられる最初お
よび最後の先行ピクチャとする。そのような場合、復号順序においてpicAより前には多く
ても1つの非先行ピクチャしかないものとし、復号順序においてpicAより後にあり復号順
序においてpicBより前にある非先行ピクチャはないものとする。
【0099】
ある例では、IRAPピクチャのNALユニットタイプは、IRAPピクチャと関連付けられる先
行ピクチャが存在するかどうかを決定するために十分な情報を提供する。このために、以
下の方法が使用され得る。NALユニットタイプCRA_NUTは、先行ピクチャがCRAピクチャと
関連付けられることを示すためにCRA_W_LPで置き換えられ、および/または、先行ピクチ
ャがCRAピクチャと関連付けられないことを示すためにCRA_N_LPで置き換えられ得る。別
の例では、NALユニットタイプIDR_W_RADL、IDR_N_LP、およびCRA_NUTは、先行ピクチャが
IRAPピクチャと関連付けられることを示すためにIRAP_W_LPで置き換えられ、先行ピクチ
ャがIRAPピクチャと関連付けられないことを示すためにIRAP_N_LPで置き換えられ得る。
【0100】
ある例では、以下のことが、CRA_W_LP、CRA_N_LP、IDR_W_RADL、およびIDR_N_LPに当て
はまり得る。IDR_N_LPに等しいNalUnitTypeを有するIDRピクチャは、ビットストリームに
存在するいずれの先行ピクチャとも関連付けられない。IDR_W_RADLに等しいNalUnitType
を有するIDRピクチャは、ビットストリームに存在するRASLピクチャと関連付けられず、
ビットストリームの中のRADLピクチャと関連付けられ得る。CRA_N_LPに等しいNalUnitTyp
eを有するCRAピクチャは、ビットストリームに存在する先行ピクチャと関連付けられない
。CRA_W_LPに等しいNalUnitTypeを有するCRAピクチャは、ビットストリームの中の先行ピ
クチャと関連付けられ得る。
【0101】
ある例では、Stream Access Point(SAP)タイプへの上記のNALユニットタイプのマッピ
ングは次の通りである。IDR_N_LPおよびCRA_N_LPはSAPタイプ1と関連付けられ、IDR_W_RA
DLはSAPタイプ2と関連付けられ、CRA_W_LPはSAPタイプ3と関連付けられる。
【0102】
ある例では、以下のことがIRAP_W_LPおよびIRAP_N_LPに当てはまり得る。IRAP_N_LPに
等しいNalUnitTypeを有するIRAPピクチャは、ビットストリームに存在する先行ピクチャ
と有する関連付けられない。IRAP_W_LPに等しいNalUnitTypeを有するIRAPピクチャは、ビ
ットストリームの中の先行ピクチャと関連付けられ得る。
【0103】
ある例では、SAPタイプへの上記のNALユニットタイプのマッピングは次の通りである。
IRAP_N_LPはSAPタイプ1と関連付けられ、IRAP_W_LPはSAPタイプ3と関連付けられる。
【0104】
ある例では、IRAPと関連付けられる先行ピクチャが存在するかどうかを決定するために
、デバイスは、IRAPピクチャのNALユニットタイプを確認し得る。IRAPピクチャが、関連
する1つ以上の先行ピクチャと関連付けられ得るとき、以下のステップが、IRAPピクチャ
と関連付けられるすべての先行ピクチャを見つけるために使用され得る。デバイスはIRAP
ピクチャから開始し得る。復号順序においてIRAPピクチャの直後にあるピクチャが非先行
ピクチャである場合、ピクチャは無視され得る。IRAPピクチャの直後のそのような非先行
ピクチャの存在は、ビットストリームがインターレースビデオコーディングビットストリ
ームであることを示し得ることに留意されたい。次のピクチャは先行ピクチャであるもの
とする。プロセスは、最初の非先行ピクチャに遭遇するまで次のピクチャを確認すること
を続け得る。
【0105】
図9は、例示的なビデオコーディングデバイス900の概略図である。ビデオコーディング
デバイス900は、本明細書で説明されるような開示される例/実施形態を実装するのに適し
ている。ビデオコーディングデバイス900は、ネットワークを介してデータアップストリ
ームおよび/またはダウンストリームを通信するための送信機および/または受信機を含む
、ダウンストリームポート920、アップストリームポート950、および/またはトランシー
バユニット(Tx/Rx)910を備える。ビデオコーディングデバイス900はまた、データを処理
するための論理ユニットおよび/または中央処理装置(CPU)を含むプロセッサ930と、デー
タを記憶するためのメモリ932とを含む。ビデオコーディングデバイス900はまた、電気コ
ンポーネント、光-電気(OE)コンポーネント、電気-光(EO)コンポーネント、ならびに/ま
たは、電気通信ネットワーク、光通信ネットワーク、もしくはワイヤレス通信ネットワー
クを介したデータの通信のためにアップストリームポート950および/もしくはダウンスト
リームポート920に結合されるワイヤレス通信コンポーネントを備え得る。ビデオコーデ
ィングデバイス900はまた、ユーザとの間でデータを通信するための入力および/または出
力(I/O)デバイス960を含み得る。I/Oデバイス960は、ビデオデータを表示するためのディ
スプレイ、オーディオデータを出力するためのスピーカーなどの出力デバイスを含み得る
。I/Oデバイス960はまた、キーボード、マウス、トラックボールなどの入力デバイス、お
よび/または、そのような出力デバイスと対話するための対応するインターフェースを含
み得る。
【0106】
プロセッサ930はハードウェアおよびソフトウェアによって実装される。プロセッサ930
は、1つ以上のCPUチップ、コア(たとえば、マルチコアプロセッサとして)、フィールドプ
ログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、およびデジタルシグナ
ルプロセッサ(DSP)として実装され得る。プロセッサ930は、ダウンストリームポート920
、Tx/Rx910、アップストリームポート950、およびメモリ932と通信している。プロセッサ
930はコーディングモジュール914を備える。コーディングモジュール914は、CVS500、イ
ンターレースビデオフレーム600、CVS700、および/またはビットストリーム800を利用し
得る、方法100、1000、および1100などの、本明細書において説明される開示された実施
形態を実装する。コーディングモジュール914は、本明細書において説明される任意の他
の方法/機構も実装し得る。さらに、コーディングモジュール914は、コーデックシステム
200、エンコーダ300、および/またはデコーダ400を実装し得る。たとえば、コーディング
モジュール914は、IRAPピクチャと先行ピクチャのセットとの間に非先行ピクチャがいつ
位置決めされるかを示すためのフラグをSPSにおいて設定することができる。したがって
、コーディングモジュール914は、ビデオデータをコーディングするとき、追加の機能お
よび/またはコーディング効率をビデオコーディングデバイス900がもたらすようにする。
したがって、コーディングモジュール914は、ビデオコーディングデバイス900の機能を改
善し、ならびにビデオコーディングの技術に特有の問題に対処する。さらに、コーディン
グモジュール914は、異なる状態へのビデオコーディングデバイス900の変換を実施する。
代替的に、コーディングモジュール914は、メモリ932に記憶されプロセッサ930によって
実行される命令として(たとえば、非一時的媒体に記憶されるコンピュータプログラム製
品として)実装され得る。
【0107】
メモリ932は、ディスク、テープドライブ、ソリッドステートドライブ、読取り専用メ
モリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリ、三値連想メモリ(TCAM)、
スタティックランダムアクセスメモリ(SRAM)などの、1つ以上のメモリタイプを備える。
メモリ932は、実行のためにプログラムが選択されるときにそのようなプログラムを記憶
するために、およびプログラム実行の間に読み取られる命令とデータを記憶するために、
オーバーフローデータストレージデバイスとして使用され得る。
【0108】
図10は、インターレースビデオフレーム600などのインターレースビデオコーディング
を伴うCVS500および/または700などのビデオシーケンスと、先行ピクチャとを、ビットス
トリーム800などのビットストリームへと符号化する例示的な方法1000のフローチャート
である。方法1000は、方法100を実行するとき、コーデックシステム200、エンコーダ300
、および/またはビデオコーディングデバイス900などのエンコーダによって利用され得る
【0109】
方法1000は、エンコーダが、複数のピクチャを含むビデオシーケンスを受信し、たとえ
ばユーザ入力に基づいてそのビデオシーケンスをビットストリームへと符号化すると決定
するときに開始し得る。ステップ1001において、エンコーダが、ビデオシーケンスのため
のコーディング順序を決定する。ビデオシーケンスは、IRAPピクチャおよびIRAPピクチャ
と関連付けられる1つ以上の非先行ピクチャを含む、複数のピクチャを備える。ビデオシ
ーケンスはまた、先行ピクチャのうちの1つ以上(たとえば、グループ)を任意選択で含み
得る。
【0110】
ステップ1003において、エンコーダがフラグをビットストリームへと符号化することが
できる。フラグは、IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング
順序において、CVS500におけるようにIRAPピクチャと関連付けられるすべての非先行ピク
チャの前にあるとき、第1の値に設定され得る。これは、ビデオシーケンスがインターレ
ースビデオを含まないことを示す。フラグはまた、非先行ピクチャが、コーディング順序
において、CVS700におけるようにIRAPピクチャと関連付けられる最初の先行ピクチャの前
にあるとき、第2の値に設定され得る。フラグが第2の値に設定されるとき、ビットストリ
ームはまた、コーディング順序において最初の先行ピクチャと最後の先行ピクチャとの間
に先行ピクチャが位置決めされないように制約され得る。これは、ビデオシーケンスがイ
ンターレースビデオを含むことを示し得る。ある特定の例として、エンコーダはSPSをビ
ットストリームへと符号化することができ、フラグはSPSへと符号化され得る。いくつか
の例では、フラグはfield_seq_flagである。たとえば、field_seq_flagは、フィールドを
表すピクチャをコーディングされたビデオシーケンスが含むことを示すとき、1に設定さ
れ得る。さらに、field_seq_flagは、フレームを表すピクチャをコーディングされたビデ
オシーケンスが含むことを示すとき、0に設定され得る。したがって、インターレースビ
デオコーディングがビットストリームにおいて利用されることを示すために、フラグが設
定され得る。したがって、IRAPピクチャがフレームの第1のフィールドを含むとき、およ
び最初の先行ピクチャの前にある非先行ピクチャがフレームの第2のフィールドを含むと
き、フラグが設定され得る。たとえば、IRAPピクチャからの第1のフィールドおよび最初
の先行ピクチャの前にある非先行ピクチャからの第2のフィールドは、図6A図6Cに関し
て示されるように、単一のインターレースビデオフレームを表すビデオデータの交互の線
を含み得る。
【0111】
ステップ1005において、エンコーダが、IRAPピクチャ、IRAPピクチャと関連付けられる
任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを
、コーディング順序においてビットストリームへと符号化することができる。エンコーダ
は次いで、ステップ1007において、デコーダへの通信のためにビットストリームを記憶す
ることができる。
【0112】
図11は、インターレースビデオフレーム600などのインターレースビデオコーディング
を伴う、CVS500および/または700などのビデオシーケンスと、先行ピクチャとを、ビット
ストリーム800などのビットストリームから復号する、例示的な方法1100のフローチャー
トである。方法1100は、方法100を実行するとき、コーデックシステム200、デコーダ400
、および/またはビデオコーディングデバイス900などのデコーダによって利用され得る。
【0113】
方法1100は、たとえば方法1000の結果として、ビデオシーケンスを表現するコーディン
グされたデータのビットストリームの受信をデコーダが開始すると、開始し得る。ステッ
プ1101において、デコーダが、フラグと、IRAPピクチャおよびIRAPピクチャと関連付けら
れる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビ
ットストリームを受信する。ビデオシーケンスはまた、先行ピクチャのうちの1つ以上(た
とえば、グループ)を任意選択で含み得る。
【0114】
ステップ1103において、デコーダが、CVS500に示されるように、フラグが第1の値に設
定されるとき、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において
、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定することがで
きる。これは、ビデオシーケンスがインターレースビデオを含まないことを示す。ステッ
プ1105において、デコーダは、CVS700に示されるように、フラグが第2の値に設定される
とき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行
ピクチャの前にあると決定することができる。フラグが第2の値に設定されるとき、デコ
ーダはさらに、コーディング順序において最初の先行ピクチャと最後の先行ピクチャとの
間に先行ピクチャが位置決めされないと決定することができる。これは、ビデオシーケン
スがインターレースビデオを含むことを示し得る。ある特定の例として、ビットストリー
ムはSPSを含んでもよく、フラグはSPSから取得されうる。いくつかの例では、フラグはfi
eld_seq_flagである。たとえば、フィールドを表すピクチャをコーディングされたビデオ
シーケンスが含むことを示すとき、field_seq_flagは1に設定され得る。さらに、フレー
ムを表すピクチャをコーディングされたビデオシーケンスが含むことを示すとき、field_
seq_flagは0に設定され得る。したがって、インターレースビデオコーディングがビット
ストリームにおいて利用されることを示すために、フラグが設定され得る。したがって、
IRAPピクチャがフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先
行ピクチャがフレームの第2のフィールドを含むとき、フラグが設定され得る。
【0115】
ステップ1107において、デコーダが、フラグに基づいて、IRAPピクチャ、IRAPピクチャ
と関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の
非先行ピクチャを復号順序において復号する。たとえば、IRAPピクチャ、先行ピクチャ(
もしあれば)、および1つ以上の非先行ピクチャを復号することは、図6A図6Cに関して示
されるように単一のフレームを作成するために、IRAPピクチャからの第1のフィールドお
よび初期の先行ピクチャの前にある非先行ピクチャからの第2のフィールドをインターレ
ースすることを含み得る。ステップ1109において、デコーダが、復号されたビデオシーケ
ンスの一部として表示するために、ステップ1107の結果として1つ以上の復号されたピク
チャを転送し得る。
【0116】
図12は、インターレースビデオフレーム600などのインターレースビデオコーディング
を伴う、CVS500および/またはCVS700などのビデオシーケンスと、先行ピクチャとを、ビ
ットストリーム800などのビットストリームへとコーディングするための例示的なシステ
ム1200の概略図である。システム1200は、コーデックシステム200、エンコーダ300、デコ
ーダ400、および/またはビデオコーディングデバイス900などのエンコーダとデコーダに
よって実装され得る。さらに、システム1200は、方法100、1000、および/または1100を実
施するときに利用され得る。
【0117】
システム1200はビデオエンコーダ1202を含む。ビデオエンコーダ1202は、IRAPピクチャ
を含む複数のピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを
備えるビデオシーケンスのためのコーディング順序を決定するための決定モジュール1201
を備える。ビデオエンコーダ1202はさらに、フラグをビットストリームへと符号化するた
めの符号化モジュール1203を備え、IRAPピクチャと関連付けられる任意の先行ピクチャが
、コーディング順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの
前にあるとき、フラグは第1の値に設定され、非先行ピクチャが、コーディング順序にお
いて、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、フラグは第2
の値に設定される。符号化モジュール1203はさらに、IRAPピクチャ、IRAPピクチャと関連
付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行
ピクチャを、コーディング順序においてビットストリームへと符号化するためのものであ
る。ビデオエンコーダ1202はさらに、デコーダへの通信のためにビットストリームを記憶
するための記憶モジュール1205を備える。ビデオエンコーダ1202はさらに、ビットストリ
ームをビデオデコーダ1210に送信するための送信モジュール1207を備える。ビデオエンコ
ーダ1202はさらに、方法1000のステップのいずれをも実行するように構成され得る。
【0118】
システム1200はビデオデコーダ1210も含む。ビデオデコーダ1210は、フラグと、IRAPピ
クチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコー
ディングされたピクチャとを備える、ビットストリームを受信するための受信モジュール
1211を備える。ビデオデコーダ1210はさらに、フラグが第1の値に設定されるとき、IRAP
ピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関
連付けられるすべての非先行ピクチャの前にあると決定するための決定モジュール1213を
備える。決定モジュール1213はさらに、フラグが第2の値に設定されるとき、非先行ピク
チャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあ
ると決定するためのものである。ビデオデコーダ1210はさらに、フラグに基づいて復号順
序において、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、および
IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを復号するための復号モジュー
ル1215を備える。ビデオデコーダ1210はさらに、復号されたビデオシーケンスの一部とし
て表示するために1つ以上の復号されたピクチャを転送するための転送モジュール1217を
備える。ビデオデコーダ1210はさらに、方法1100のステップのいずれかを実行するように
構成され得る。
【0119】
第1のコンポーネントと第2のコンポーネントとの間の線、配線、または別の媒体を除き
、介在するコンポーネントがないとき、第1のコンポーネントは第2のコンポーネントに直
接結合される。第1のコンポーネントと第2のコンポーネントとの間に線、配線、または別
の媒体以外の介在するコンポーネントがあるとき、第1のコンポーネントは第2のコンポー
ネントに間接的に結合される。「結合される」という用語およびその変形は、直接結合さ
れることと間接的に結合されることの両方を含む。「約」という用語の使用は、別段述べ
られない限り、その後にある数字の±10%を含む範囲を意味する。
【0120】
本明細書に記載される例示的な方法のステップは、必ずしも説明された順序で実行され
ることは必要とされず、そのような方法のステップの順序は単に例示的であると理解され
るべきであることも理解されたい。同様に、追加のステップがそのような方法に含まれて
もよく、本開示の様々な実施形態に適合する方法で、いくつかのステップが省略または結
合されてもよい。
【0121】
いくつかの実施形態が本開示において提供されたが、開示されたシステムおよび方法は
、本開示の趣旨または範囲から逸脱することなく、多くの他の特定の形式で具現化され得
ることが理解され得る。本実施例は、限定するためのものではなく説明のためのものであ
ると見なされるべきであり、意図は本明細書で与えられる詳細に限定されないものとする
。たとえば、別のシステムでは様々な要素またはコンポーネントが結合もしくは統合され
てもよく、またはいくつかの特徴が省略され、もしくは実装されなくてもよい。
【0122】
加えて、様々な実施形態において個別のもの、または別々のものとして説明され図示さ
れる技法、システム、サブシステム、および方法は、本開示の範囲から逸脱することなく
、他のシステム、コンポーネント、技法、もしくは方法と合成または統合されてもよい。
変化、置換、および変更の他の例が当業者により確認可能であり、本明細書で開示される
趣旨および範囲から逸脱することなく行われ得る。
【符号の説明】
【0123】
200 コーデックシステム
201 区分されたビデオ信号
211 汎用コーダ制御コンポーネント
213 変換スケーリングおよび量子化コンポーネント
215 イントラピクチャ推定コンポーネント
217 イントラピクチャ予測コンポーネント
219 動き補償コンポーネント
221 動き推定コンポーネント
223 復号ピクチャバッファコンポーネント
225 ループ内フィルタコンポーネント
227 フィルタ制御分析コンポーネント
229 スケーリングおよび逆変換コンポーネント
231 ヘッダフォーマッティングおよびCABACコンポーネント
300 エンコーダ
301 区分されたビデオ信号
313 変換および量子化コンポーネント
317 イントラピクチャ予測コンポーネント
321 動き補償コンポーネント
323 復号ピクチャバッファコンポーネント
325 ループ内フィルタコンポーネント
329 逆変換および量子化コンポーネント
331 エントロピーコーディングコンポーネント
400 デコーダ
417 イントラピクチャ予測コンポーネント
421 動き補償コンポーネント
423 復号ピクチャバッファコンポーネント
425 ループ内フィルタコンポーネント
429 逆変換および量子化コンポーネント
433 エントロピー復号コンポーネント
500 CVS
502 IRAPピクチャ
504 先行ピクチャ
506 後端ピクチャ
508 復号順序
510 提示順序
600 インターレースビデオフレーム
601 第1のピクチャ
602 第2のピクチャ
610 第1のフィールド
612 第2のフィールド
700 CVS
702 IRAPピクチャ
703 非先行ピクチャ
704 先行ピクチャ
706 後端ピクチャ
708 復号順序
710 提示順序
725 スライス
810 SPS
811 ピクチャパラメータセット(PPS)
815 スライスヘッダ
820 画像データ
821 フレーム
823 ピクチャ
825 スライス
900 ビデオコーディングデバイス
910 トランシーバユニット(Tx/Rx)
914 コーディングモジュール
920 ダウンストリームポート
930 プロセッサ
932 メモリ
950 アップストリームポート
960 I/Oデバイス
1200 システム
1201 決定モジュール
1202 ビデオエンコーダ
1203 符号化モジュール
1205 記憶モジュール
1207 送信機
1210 ビデオデコーダ
1211 受信機、受信モジュール
1213 決定モジュール
1215 復号モジュール
1217 転送モジュール
図1
図2
図3
図4
図5
図6A
図6B
図6C
図7
図8
図9
図10
図11
図12
【手続補正書】
【提出日】2024-08-07
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】削除
【補正の内容】
【手続補正3】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオデータの符号化されたビットストリームを記憶するための方法であって、
前記ビットストリームを受信するステップであって、前記ビットストリームはシーケンシャルフィールドフラグ(field_seq_flag)と、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備え、前記フラグが0に設定されるとき、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあり、多くても1つの非先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあり、前記フラグが1に設定されるとき、復号順序において前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされず、コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記field_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表すピクチャを含むとき、前記field_seq_flagが0に設定される、ステップと、
ストレージ媒体に前記ビットストリームを記憶するステップとを備える、方法。
【請求項2】
前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記SPSから取得される、請求項1に記載の方法。
【請求項3】
前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項1に記載の方法。
【請求項4】
ビデオデータの符号化されたビットストリームを送信するための方法であって、
前記ビットストリームをストレージ媒体から取得するステップであって、前記ビットストリームはシーケンシャルフィールドフラグ(field_seq_flag)と、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備え、前記フラグが0に設定されるとき、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあり、多くても1つの非先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあり、前記フラグが1に設定されるとき、復号順序において前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされず、コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記field_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表すピクチャを含むとき、前記field_seq_flagが0に設定され、前記ビットストリームは前記ストレージ媒体に記憶されている、ステップと、
前記ビットストリームを送信するステップとを備える、方法。
【請求項5】
前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記SPSから取得される、請求項4に記載の方法。
【請求項6】
前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項5に記載の方法。
【請求項7】
ビットストリームを含む非一時的ストレージ媒体であって、コーディングされたビデオビットストリームはシーケンシャルフィールドフラグ(field_seq_flag)と、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備え、前記フラグが0に設定されるとき、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあり、多くても1つの非先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあり、前記フラグが1に設定されるとき、復号順序において前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされず、コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記field_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表すピクチャを含むとき、前記field_seq_flagが0に設定される、ストレージ媒体。
【請求項8】
前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記SPSから取得される、請求項7に記載のストレージ媒体。
【請求項9】
前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項8に記載のストレージ媒体。
【請求項10】
コンピュータで使用されるデータ構造であって、前記データ構造はコーディングされたビデオビットストリームを含み、前記コーディングされたビデオビットビットストリームはイントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャと、前記コンピュータにIRAPピクチャに関連付けられる先行ピクチャと前記非先行ピクチャの復号順序を決定させるシーケンシャルフィールドフラグ(field_seq_flag)とを備え、
前記field_seq_flagが0に設定されるとき、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあり、単一の非先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあり、前記field_seq_flagが1に設定されるとき、復号順序において前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされず、コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記field_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表すピクチャを含むとき、前記field_seq_flagが0に設定される、データ構造。
【外国語明細書】