特許7457791 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7457791ビデオの符号化及び復号のための高レベルシンタックス

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-03-19

(45)【発行日】2024-03-28

(54)【発明の名称】ビデオの符号化及び復号のための高レベルシンタックス

(51)【国際特許分類】

H04N 19/70 20140101AFI20240321BHJP

H04N 19/107 20140101ALI20240321BHJP

H04N 19/174 20140101ALI20240321BHJP

H04N 19/119 20140101ALI20240321BHJP

H04N 19/159 20140101ALI20240321BHJP

【ＦＩ】

H04N19/70

H04N19/107

H04N19/174

H04N19/119

H04N19/159

【請求項の数】 15

(21)【出願番号】P 2022508941

(86)(22)【出願日】2020-12-18

(65)【公表番号】

(43)【公表日】2023-02-08

(86)【国際出願番号】 EP2020087248

(87)【国際公開番号】W WO2021123326

(87)【国際公開日】2021-06-24

【審査請求日】2022-06-14

(31)【優先権主張番号】1919033.9

(32)【優先日】2019-12-20

(33)【優先権主張国・地域又は機関】GB

(73)【特許権者】

【識別番号】000001007

【氏名又は名称】キヤノン株式会社

(74)【代理人】

【識別番号】110003281

【氏名又は名称】弁理士法人大塚国際特許事務所

(72)【発明者】

【氏名】ラロシュ，ギローム

(72)【発明者】

【氏名】ウエドラオゴ，ナエル

(72)【発明者】

【氏名】オンノ，パトリス

【審査官】田部井和彦

(56)【参考文献】

【文献】特開２０１５－０８０００２（ＪＰ，Ａ）

【文献】国際公開第２０１４／００２３７５（ＷＯ，Ａ１）

【文献】国際公開第２０２１／１２７３６５（ＷＯ，Ａ１）

【文献】特表２０２２－５２５９６１（ＪＰ，Ａ）

【文献】Benjamin Bross et al.，Versatile Video Coding (Draft 6) [online]，JVET-O2001-vE（JVET-P0120_SpecText.docx）, [2023年10月19日検索]，インターネット＜URL: https://jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0120-v1.zip＞，2019年09月25日，pp.19,33-35,43-46,50-55,107-110,120-121,125-134

【文献】Hendry et al.，AHG17: On Access Unit Delimiter and Picture Header [online]，JVET-P0120-v1，インターネット＜URL: https://jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0120-v1.zip＞，2019年09月25日，(JVET-P0120_v1.docx)

【文献】Ye-Kui Wang et al.，The High-Level Syntax of the Versatile Video Coding (VVC) Standard [online]，IEEE Transactions on Circuits and Systems for Video Technology (Volume: 31 ,Issue: 10 ,October 2021)，2021年04月05日，pp.3779-3800，インターネット＜URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9395142＞，DOI: 10.1109/TCSVT.2021.3070860

【文献】Benjamin Bross et al.，Versatile Video Coding (Draft 6) [online]，JVET-O2001-vE，インターネット＜URL: https://jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0120-v1.zip＞，2019年09月25日，p.44-46,p.108-110，JVET-P0120_SpecText.docx

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１９／７０

Ｈ０４Ｎ１９／１０７

Ｈ０４Ｎ１９／１７４

Ｈ０４Ｎ１９／１１９

Ｈ０４Ｎ１９／１５９

(57)【特許請求の範囲】

【請求項1】

ビットストリームからピクチャを復号する方法であって、前記ピクチャは１以上のスライスを有し、前記ビットストリームはピクチャヘッダとスライスヘッダと適応パラメータセットとを有し、
前記ピクチャヘッダにおけるフラグであってパーティショニングに関するフラグであるパーティションコンストレインツオーバーライドフラグ（ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ）の値が１であり、前記ピクチャヘッダにおける所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、パーティショニングに関連し且つイントラのために用いられるシンタックス要素を前記ピクチャヘッダから復号する工程と、
前記復号されたシンタックス要素を用いて前記１以上のスライスを復号する工程と、を有し、
前記所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、前記スライスヘッダからスライスの符号化タイプに対応する情報が復号されず、
前記所定のシンタックス要素の値に応じて、前記スライスヘッダから前記情報が復号されることが可能であり、
前記適応パラメータセットは、前記ビットストリームにおいて前記ピクチャヘッダより後に位置することが可能であり、且つ、適応ループフィルタに関する情報を含むことが可能である
ことを特徴とする方法。

【請求項2】

前記情報はｓｌｉｃｅ＿ｔｙｐｅであることを特徴とする請求項１に記載の方法。

【請求項3】

前記所定のシンタックス要素が前記ピクチャにおける全てのスライスがイントラを使用することを示す場合、インターで用いられる情報であるmvd_l1_zero_flagは前記ピクチャヘッダから復号されないことを特徴とする請求項１に記載の方法。

【請求項4】

前記パーティションコンストレインツオーバーライドフラグの値が０の場合、前記パーティショニングに関連し且つイントラのために用いられる前記シンタックス要素は前記ピクチャヘッダから復号されないことを特徴とする請求項１に記載の方法。

【請求項5】

前記ピクチャヘッダにおける前記所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、デルタQPに関し且つイントラのために用いられるシンタックス要素が前記ピクチャヘッダから復号可能であることを特徴とする請求項１に記載の方法。

【請求項6】

異なるスライスが同じ適応パラメータセットを使用することが可能であることを特徴とする請求項１に記載の方法。

【請求項7】

ピクチャをビットストリームに符号化する方法であって、前記ピクチャは１以上のスライスを有し、前記ビットストリームはピクチャヘッダとスライスヘッダと適応パラメータセットとを有し、
前記ピクチャにおける全てのスライスがイントラを使用することを示すことが可能な所定のシンタックス要素をピクチャヘッダに符号化する工程と、
前記ピクチャヘッダにおけるフラグであってパーティショニングに関するフラグであるパーティションコンストレインツオーバーライドフラグ（ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ）の値が１であり、前記所定のシンタックス要素が前記ピクチャにおける全てのスライスがイントラを使用することを示す場合、パーティショニングに関連し且つイントラのためのシンタックス要素を、前記ピクチャヘッダに符号化する工程と、
前記１以上のスライスを符号化する工程と、を有し、
前記所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、前記スライスヘッダにスライスの符号化タイプに対応する情報が符号化されず、
前記所定のシンタックス要素の値に応じて、前記スライスヘッダに前記情報が符号化されることが可能であり、
前記適応パラメータセットは、前記ビットストリームにおいて前記ピクチャヘッダより後に位置することが可能であり、且つ、適応ループフィルタに関する情報を含むことが可能である
ことを特徴とする方法。

【請求項8】

前記情報はｓｌｉｃｅ＿ｔｙｐｅであることを特徴とする請求項７に記載の方法。

【請求項9】

前記所定のシンタックス要素が前記ピクチャにおける全てのスライスがイントラを使用することを示す場合、インターで用いられる情報であるmvd_l1_zero_flagは前記ピクチャヘッダに符号化されないことを特徴とする請求項７に記載の方法。

【請求項10】

前記パーティションコンストレインツオーバーライドフラグの値が０の場合、前記パーティショニングに関連し且つイントラのために用いられる前記シンタックス要素は前記ピクチャヘッダから復号されないことを特徴とする請求項７に記載の方法。

【請求項11】

前記ピクチャヘッダにおける前記所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、デルタQPに関し且つイントラのために用いられるシンタックス要素が前記ピクチャヘッダから復号可能であることを特徴とする請求項７に記載の方法。

【請求項12】

異なるスライスが同じ適応パラメータセットを使用することが可能であることを特徴とする請求項７に記載の方法。

【請求項13】

ビットストリームからピクチャを復号する装置であって、前記ピクチャは１以上のスライスを有し、前記ビットストリームはピクチャヘッダとスライスヘッダと適応パラメータセットとを有し、
前記ピクチャヘッダにおけるフラグであってパーティショニングに関するフラグであるパーティションコンストレインツオーバーライドフラグ（ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ）の値が１であり、前記ピクチャヘッダにおける所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、パーティショニングに関連し且つイントラのために用いられるシンタックス要素を前記ピクチャヘッダから復号する手段と、
前記復号されたシンタックス要素を用いて前記１以上のスライスを復号する手段と、を有し、
前記所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、前記スライスヘッダからスライスの符号化タイプに対応する情報が復号されず、
前記所定のシンタックス要素の値に応じて、前記スライスヘッダから前記情報が復号されることが可能であり、
前記適応パラメータセットは、前記ビットストリームにおいて前記ピクチャヘッダより後に位置することが可能であり、且つ、適応ループフィルタに関する情報を含むことが可能である
ことを特徴とする装置。

【請求項14】

ピクチャをビットストリームに符号化する装置であって、前記ピクチャは１以上のスライスを有し、前記ビットストリームはピクチャヘッダとスライスヘッダと適応パラメータセットとを有し、
前記ピクチャにおける全てのスライスがイントラを使用することを示すことが可能な所定のシンタックス要素をピクチャヘッダに符号化する手段と、
前記ピクチャヘッダにおけるフラグであってパーティショニングに関するフラグであるパーティションコンストレインツオーバーライドフラグ（ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ）の値が１であり、前記所定のシンタックス要素が前記ピクチャにおける全てのスライスがイントラを使用することを示す場合、パーティショニングに関連し且つイントラのためのシンタックス要素を、前記ピクチャヘッダに符号化する手段と、
前記１以上のスライスを符号化する手段と、を有し、
前記所定のシンタックス要素が前記ピクチャの全てのスライスがイントラを使用することを示す場合、前記スライスヘッダにスライスの符号化タイプに対応する情報が符号化されず、
前記所定のシンタックス要素の値に応じて、前記スライスヘッダに前記情報が符号化されることが可能であり、
前記適応パラメータセットは、前記ビットストリームにおいて前記ピクチャヘッダより後に位置することが可能であり、且つ、適応ループフィルタに関する情報を含むことが可能である
ことを特徴とする装置。

【請求項15】

コンピュータを、請求項１乃至６のいずれか１項に記載の方法の各工程を実行させるためのコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明はビデオの符号化及び復号に関し、特に、ビデオの符号化及び復号に使用される高レベルシンタックスに関するものである。

【背景技術】

【0002】

最近、ＭＰＥＧとＩＴＵ－Ｔ Study Group １６のＶＣＥＧによって形成された共同チームであるＪｏｉｎｔＶｉｄｅｏＥｘｐａｒｔｓＴｅａｍ（ＪＶＥＴ）は、ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（ＶＶＣ）と呼ばれる新しいビデオ符号化規格の研究を開始した。ＶＶＣの目標は、既存のＨＥＶＣ標準（すなわち、典型的には以前の２倍）を超える圧縮性能の著しい改善を提供し、２０２０年に完了することである。主なターゲットアプリケーションおよびサービスは、３６０度および高ダイナミックレンジ（ＨＤＲ）ビデオ（これに限定されないが）を含む。総じて、ＪＶＥＴは、独立した試験所が実施した正式な主観的試験を用いて、３２団体からの応答を評価した。いくつかの提案は、ＨＥＶＣを使用する場合と比較して、典型的には４０％以上の圧縮効率ゲインを実証した。超高精細（ＵＨＤ）ビデオ試験材料について特に有効性を示した。したがって、圧縮効率の向上は、最終標準の目標とする５０％をはるかに超えることが予想される。

【発明の概要】

【発明が解決しようとする課題】

【0003】

ＪＶＥＴ探索モデル（ＪＥＭ）は、全てのＨＥＶＣツールを使用し、多数の新しいツールを導入した。これらの変更により、ビットストリームの構造、特にビットストリーム全体のビットレートに影響を与える可能性のある高レベルシンタックスの変更が必要になった。

【0004】

高レベルシンタックスの重要な変更の１つは、ビットストリームに“ピクチャヘッダ”を導入することである。ピクチャヘッダは、特定のピクチャ（またはフレーム）内の各スライスの復号に使用されるシンタックス要素（syntax elements）を指定するヘッダである。このように、ピクチャヘッダは、ビットストリーム内のスライスに関連するデータの前に配置され、スライスはそれぞれ独自の「スライスヘッダ」を持つ。この構造は、図６を参照して以下により詳細に説明される。

【0005】

第１６回会合の文書ＪＶＥＴ－Ｐ０２３９：ジュネーブ、ＣＨ、１－１１、２０１９年１０月、題名「ＡＨＧ１７：ピクチャヘッダ」は、ＶＶＣへの必須ピクチャヘッダの導入を提案し、これは、文書ＪＶＥＴ＿Ｐ２００１としてアップロードされる汎用ビデオ符号化（草稿７）として採用された。しかしながら、この構造体は全てのＶＶＣツールの使用において柔軟性を提供するが、特に低ビットレートインスタンスに対して、伝送のビットレートに影響を与えるビットストリームにおいて信号送信される構文要素の量の増加がある。

【0006】

したがって、前述の問題の少なくとも１つに対する解決策が望ましい。

【0007】

概して、本発明者らは、最近採用された高レベルシンタックスに組み込まれた柔軟性がめったに使用されず、したがって、ビットレートを不必要に増加させることに気付いた。特に、ほとんどのピクチャは１つのスライス符号化モード（例えば、インターまたはＩｎｔｒａ）を使用するスライスのみを含み、一方、高レベルシンタックスは、各ピクチャにおいて異なるタイプのスライスを可能にする。本発明は、ほとんどのピクチャが１つの符号化タイプのスライスのみを使用しているという事実を利用し、ビットレートを低減することができることに関する。

【0008】

単一のピクチャ内での複数の符号化タイプの柔軟性を再導入するオプション機能も考慮される。最近採用された高レベルシンタックスと比較して、ビットレートを低減するために、特定のシンタックス要素および／またはシンタックス要素の追加の制約が追加される。これらの「アドオン」特徴はビットレートを増加させるかもしれないが、めったに使用されないので、所与のビデオシーケンスの平均ビットレートは従来技術と比較して低減される。

【0009】

本発明は、ピクチャ全体が１つのスライスタイプ（Ｉ、Ｐ、Ｂ）のみを含むときに必要とされない、いくつかのピクチャヘッダパラメータの余分なシグナリングを回避するために、ピクチャヘッダシグナリングの修正を提案する。特に、インターおよびイントラのデルタＱＰシグナリングに関連するパラメータは、単一のパラメータにマージされる。パーティショニングパラメータのオーバーライドフラグは、インタースライス用とイントラスライス用の２つのオーバーライドフラグに変更される。さらに、インタースライスにおける動き情報パラメータに対してオーバライドフラグが追加される。これらの修正は、現行の設計と比較してほぼ同じ柔軟性を提供するが、それは符号化効率を増加させる。

【0010】

本発明の一態様では、デコーダは、ピクチャヘッダから１セットのシンタックス要素を復号するだけでよく、このシンタックス要素のセットは、ピクチャのためのスライス符号化モード（例えば、インターまたはＩＮＴＲＡ）によって定義される。あるいは、ピクチャヘッダ内のシンタックス要素は符号化モードに依存せず、マージされたシンタックス要素のセットを含む。このようにして、不必要なシンタックス要素がデコーダによってスキップされ得るため、ビットレートが低減される。

【0011】

本発明の１つの態様によれば、ビットストリームからビデオデータを復号する方法が提供される。ここで前記ビットストリームは１以上のスライスに対応するビデオデータを有し、ピクチャは１以上のスライスを有し、前記ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は、前記ピクチャにおける１以上のスライスが単一の符号化モードを使用しているかを判定することと、前記ピクチャヘッダから前記単一の符号化モードで使用されるシンタックス要素のセットを判定することと、前記判定されたシンタックス要素を用いて前記１以上のスライスを復号することを有する。

【0012】

オプションで、前記１以上のスライスの符号化モードを判定することは、前記ピクチャヘッダにおける少なくとも１つのシンタックス要素に依存する。
オプションで、前記単一の符号化モードは、インター又はイントラのうちの１つである。
オプションで、前記単一の符号化モードは、インターである。
オプションで、前記インター符号化モードは、インターＢ又はインターＰの一方である。
オプションで、前記単一の符号化モードで使用れるシンタックス要素の設置を判定することは、ピクチャヘッダにおける少なくとも１つのシンタックス要素を有効及び／又は無効にすることを含む。
オプションで、前記単一の符号化モードで使用されるシンタックス要素のセットを判定することは、スライスヘッダにおける少なくとも１つのシンタックス要素を有効及び／又は無効にすることを含む。
オプションで、ＡＵデリミタの値に基づき前記符号化モードを判定する。
オプションで、符号化モードを判定することは、１以上のオーバーライドフラグを復号することを有する。
オプションで、前記１以上のオーバーライドフラグは、インターモードが使用されるかどうかを示す第１のフラグ、及び、イントラモードが使用されるかどうかを示す第２のフラグを有する。

【0013】

本発明の態様において、ビットストリームからビデオデータを復号する方法が提供される。ここで前記ビットストリームは１以上のスライスに対応するビデオデータを有し、ピクチャは１以上のスライスを有し、前記ビデオビットストリームはピクチャヘッダを有する。そして、この方法は、前記ピクチャにおける１以上のスライスの符号化モードを判定することと、前記ピクチャヘッダから前記符号化モードで使用されるシンタックス要素のセットを判定することと、前記判定されたシンタックス要素を用いて前記１以上のスライスを復号することを有する。

【0014】

本発明の態様において、ビデオデータをビットストリームに符号化する方法が提供される。ここで前記ビットストリームは１以上のスライスに対応するビデオデータを有し、ピクチャは１以上のスライスを有し、前記ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は、前記ピクチャにおける前記少なくとも１つスライスでの単一の符号化モードを定義することと、前記単一の符号化モードで使用されるシンタックス要素のセットを、前記ピクチャヘッダ内に符号化することと、前記判定されたシンタックス要素を用いて前記１以上のスライスを符号化することを有する。

【0015】

本発明の態様において、ビデオデータをビットストリームに符号化する方法が提供される。ここで前記ビットストリームは１以上のスライスに対応するビデオデータを有し、ピクチャは１以上のスライスを有し、前記ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は、
前記ピクチャにおける前記１以上のスライスでの符号化モードを判定することと、前記符号化モードで使用されるシンタックス要素のセットを、前記ピクチャヘッダ内に判定することと、前記判定されたシンタックス要素を用いて前記１以上のスライスを符号化することを有する。

【0016】

オプションで、前記符号化モードはインターであって、前記ピクチャヘッダを符号化することは前記ピクチャヘッダ内にてインターシンタックス要素を符号化することを有する。
オプションで、前記符号化モードはイントラであって、前記ピクチャヘッダを符号化することは前記ピクチャヘッダ内にてイントラシンタックス要素を符号化することを有する。

【0017】

本発明の他の態様において、上記の対応の復号の方法に従って方法を実行することで、ビットストリームを復号するように適合したデコーダが提供される。
本発明の他の態様において、上記の対応の符号化の方法に従って方法を実行することで、ビットストリームを符号化するように適合したエンコーダが提供される。

【0018】

本発明の１つの態様によれば、ビットストリームからビデオデータを復号する方法が提供される。ここで前記ビットストリームは複数のスライスに対応するビデオデータを有し、前記ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は、少なくとも１つのスライスの符号化モードを判定することと、前記ピクチャヘッダから前記符号化モードで使用されるシンタックス要素のセットを判定することと、前記判定されたシンタックス要素を用いて前記少なくとも１つのスライスを復号することを有する。

【0019】

これにより、ビットレートの低減でき、全体としてより効率的な復号が可能になる。

【0020】

オプションで、少なくとも１つのスライスの符号化モードを決定することは、前記ピクチャヘッダ内のシンタックス要素に依存する。
オプションで、前記符号化モードは、インターまたはイントラのうちの１つである。
柔軟性のために、符号化モードは、インター、イントラ、またはインターとイントラんの組合せのうちの１つである。
さらなる柔軟性のために、インター符号化モードは、インターＢまたはインターＰのうちの１つである。
オプションで、前記符号化モードに特有のシンタックス要素のセットを判定することは、ピクチャヘッダ内の少なくとも１つのシンタックス要素を有効化および／または無効化することを含む。
オプションで、前記符号化モードに特有のシンタックス要素を判定することは、スライスヘッダ内の少なくとも１つのシンタックス要素を有効化および／または無効化することを含む。
オプションで、方法は、前記判定された符号化タイプに基づいてＡＵデリミタの値を推論することをさらに含む。オプションで、前記ＡＵデリミタの値の推論することは、ストリームが１つのレイヤのみを含むと判定された場合に実行される。

【0021】

本発明の別の態様によれば、ビットストリームからビデオデータを復号する方法が提供される。ここでビットストリームは複数のスライスに対応するビデオデータを含み、ビデオビットストリームはピクチャヘッダを含む。そして、前記方法は、ピクチャ内のすべてのスライスが同じ符号化モードを使用するかどうかを判定することと、前記判定が真である場合、前記ピクチャヘッダから前記シンタックス要素を使用してピクチャを復号することを有する。

【0022】

本発明の別の態様によれば、ビットストリームからビデオデータを復号する方法が提供される。ここでビットストリームは複数のスライスに対応するビデオデータを含み、前記ビデオビットストリームはピクチャヘッダを含む。そして、前記方法は、前記ピクチャヘッダから前記シンタックス要素を使用してピクチャを復号することを含み、すべてのシンタックス要素は、同じスライス符号化モードに対応する。

【0023】

これらの態様は、特に（多くのビデオシーケンスにおけるピクチャの大部分である）インタースライスのみを含むピクチャについて、ヘッダに関するレートを低減する。
オプションで、前記決定が真でない場合、前記ピクチャ内のイントラスライスのイントラ符号化パラメータは、前記ピクチャヘッダ内の対応するインターシンタックス要素から推論される。
オプションで、前記イントラシンタックス要素は、対応するインター値の値に制限される。
オプションで、前記方法は、従前のシンタックス要素の値に基づいて前記スライスのシンタックス要素を予測することをさらに含む。
オプションで、少なくとも１つのスライスの符号化モードを決定することは、ピクチャヘッダとは異なるヘッダのシンタックス要素に依存する。
一例では、ピクチャヘッダとは異なるヘッダは、シーケンスヘッダである。
別の例では、ピクチャヘッダとは異なる前記ヘッダは、ＡＵＤＮＡＬユニットである。
一例では、前記判定された符号化モードはインターである。別の例では、前記判定された符号化モードはイントラである。
オプションで、符号化モードを判定することは、１以上のオーバーライドフラグを復号することを含む。
オプションで、上記の１つ以上のオーバーライドフラグは、ピクチャヘッダーよりも上位レベルのヘッダーにある。

【0024】

本発明の別の態様によれば、ビットストリームからビデオデータを復号する方法が提供される。ここで、このビットストリームは複数のスライスに対応するビデオデータを有し、ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は１以上のオーバーライドフラグを復号することと、前記１以上のオーバーライドフラグに依存して前記ピクチャヘッダから、符号化された特定のシンタックス要素を復号することを有し、前記１以上のオーバーライドフラグは前記ピクチャヘッダよりも上位レベルのヘッダにある。

【0025】

この態様は、デフォルトのケースをオーバライドできる柔軟性を備えて、レート削減の利点を提供する。

【0026】

オプションで、前記高レベルヘッダはＳＰＳまたはＰＰＳである。
オプションで、前記方法は、符号化依存シンタックス要素の前にピクチャヘッダから２つのオーバーライドフラグを復号することをさらに含む。ここで第１のオーバーライドフラグは、インター要素がオーバーライドされることを示し、第２のオーバーライドフラグは、イントラ要素がオーバーライドされることを示す。
オプションで、前記判定された符号化モードに利用される前記シンタックス要素は、符号化モードに依存しない。

【0027】

本発明の別の態様によれば、ビットストリームからビデオデータを復号する方法が提供される。ここで、ビットストリームは複数のスライスに対応するビデオデータを含み、ビデオビットストリームはピクチャヘッダを含み、前記ピクチャヘッダは符号化モードに依存しないシンタックス要素のみを含み、前記シンタックス要素を使用して前記ピクチャ内の各スライスを復号する。

【0028】

この態様は、ピクチャヘッダ内の冗長シンタックス要素の個数を低減することによってレート低減を提供する。

【0029】

オプションで、前記方法は、更に、前記ピクチャヘッダとは異なるヘッダから、前記判定された符号化モードに固有のシンタックス要素を判定することを含む。
オプションで、前記ピクチャ・ヘッダとは異なる前記ヘッダは、スライスヘッダである。
柔軟性のために、インターおよびイントラシンタックス要素の両方が、前記スライスヘッダ内に提供されてもよい。
オプションで、前記方法は、更に、オーバーライドフラグを復号することを有し、前記オーバーライドフラグは、スライスヘッダから符号化固有のシンタックス要素を復号するか否かを判定する。
オプションで、前記スライスヘッダ内の前記シンタックス要素は、ピクチャヘッダ内の同等のシンタックス要素に制限された値を有する。
オプションで、前記方法は、更に、前記スライスヘッダ内の以前のシンタックス要素の値に基づいて、前記スライスヘッダ内の１以上のシンタックス要素を予測することを有する。

【0030】

本発明の別の態様によれば、ビデオデータをビットストリームに符号化する方法が提供される。ここでビットストリームは、複数のスライスに対応するビデオデータを有し、ビデオビットストリームはピクチャヘッダを有する。そして前記方法は、少なくとも１つのスライスのための符号化モードを定義することと、前記ピクチャヘッダから前記符号化モードのために使用されるシンタックス要素のセットを符号化することと、前記判定されたシンタックス要素を使用して前記少なくとも１つのスライスを符号化することを有する。

【0031】

本発明の別の態様によれば、ビデオデータをビットストリームに符号化する方法が提供される。ここで、ビットストリームは複数のスライスに対応するビデオデータを有し、１以上のスライスはピクチャを有し、前記ビデオビットストリームはピクチャヘッダを含む。そして前記方法は、前記ピクチャのための符号化モードを定義することと、シンタックス要素を前記ピクチャヘッダに符号化することとを有し、前記シンタックス要素の価値は、前記定義された符号化モードに依存する。

【0032】

本発明の別の態様によれば、ビデオデータをビットストリームに符号化する方法が提供される。ここで、ビットストリームは複数のスライスに対応するビデオデータを有し、１つまたは複数のスライスはピクチャを有し、前記ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は、前記ピクチャ内のすべてのスライスについて符号化モードを定義することと、前記定義された符号化モードに応じてシンタックス要素を用いて前記ピクチャヘッダを符号化することを有する。

【0033】

本発明の別の態様によれば、ビデオデータをビットストリームに符号化する方法が提供される。ここで、ビットストリームは複数のスライスに対応するビデオデータを有し、ビデオビットストリームはピクチャヘッダを有する。そして、前記方法は、前記ピクチャヘッダからの前記シンタックス要素を使用してピクチャを符号化することを有し、すべてのシンタックス要素は、同じスライスコーディングモードに対応する。

【0034】

オプションで、前記符号化モードはインターであり、前記ピクチャヘッダを符号化することは、ピクチャヘッダ内のインターシンタックス要素を符号化することを有する。
あるいは前記符号化モードはイントラであり、前記画像ヘッダを符号化することは前記画像ヘッダにおけるイントラシンタックス要素を符号化することを有する。
オプションで、前記方法は、更に、前記定義された符号化モードがイントラである場合、インターシンタックス要素をピクチャヘッダに符号化し、イントラシンタックス要素をスライスヘッダに符号化することとを有する。

【0035】

本発明の別の態様によれば、ビデオデータをビットストリームに符号化する方法が提供される。ここで、ビットストリームは複数のスライスに対応するビデオデータを有し、ビデオビットストリームはピクチャヘッダを有する。そして前記方法は、１以上のオーバーライドフラグを符号化することと、前記１以上のオーバーライドフラグに依存して、符号化特定のシンタックス要素を前記ピクチャヘッダに符号化することとを有し、前記１以上のオーバーライドフラグは、前記ピクチャヘッダよりも上位のヘッダにある。

【0036】

これらの符号化方法は上述したように、より効率的な復号を可能にする。場合によっては、より少ないシンタックス要素がそれぞれのヘッダに符号化され、及び／または、ビットストリームに冗長性が低いため、符号化の複雑さが少なくなる。

【0037】

本発明のさらに別の態様は、前述の復号方法および符号化方法をそれぞれ実行するように適合されたデコーダおよびエンコーダに関する

【0038】

本発明のさらに別の態様はコンピュータまたはプロセッサによって実行されるときに、前記コンピュータまたはプロセッサに、本発明の前述の方法態様のいずれか１つの方法を実行させるプログラムに関する。プログラムは、それ自体で提供されてもよく、またはキャリア媒体上で、キャリア媒体によって、またはキャリア媒体内で搬送されてもよい。キャリア媒体は、非一時的であってもよく、例えば、記憶媒体、特にコンピュータ可読記憶媒体であってもよい。搬送媒体はまた、一時的なもの、例えば、信号または他の伝送媒体であってもよい。信号は、インターネットを含む任意の適切なネットワークを介して送信されてもよい。

【0039】

本発明の更なる特徴は、他の独立請求項および従属請求項によって特徴付けられる。

【0040】

本発明の一態様における任意の特徴は、任意の適切な組み合わせで、本発明の他の態様に適用されてもよい。特に、方法の態様は、装置の態様に適用されてもよく、逆もまた同様である。

【0041】

さらに、ハードウェアで実施される特徴は、ソフトウェアで実施されてもよく、その逆も可能である。本明細書におけるソフトウェアおよびハードウェアの特徴へのいかなる参照も、それに応じて解釈されるべきである。

【0042】

本明細書に記載されるような如何なる装置特徴は、方法特徴として提供されてもよく、逆もまた同様である。本明細書で使用されるように、手段＋機能特徴は、適切にプログラムされたプロセッサおよび関連するメモリーのような、それらの対応する構成に関して代替的に表現されてもよい。

【0043】

また、本発明の任意の態様において説明され、定義された様々な特徴の特定の組合せは、独立して実装および／または供給および／または使用されることができることを理解されたい。

【図面の簡単な説明】

【0044】

ここで、例として、添付の図面を参照する：

【図1】ＨＥＶＣ及びＶＶＣで使用される符号化構造を説明するための図である。

【図2】本発明の１以上の実施形態を実施することができるデータ通信システムを概略的に示すブロック図である。

【図3】本発明の１以上の実施形態を実施することができる処理装置の構成要素を示すブロック図である。

【図4】本発明の実施形態による符号化方法のステップを示すフローチャートである。

【図5】本発明の実施形態による復号方法のステップを示すフローチャートである。

【図6】例示的な符号化システムＶＶＣにおけるビットストリームの構造を示す図である。

【図7】本発明の実施形態による、エンコーダまたはデコーダおよび通信ネットワークを備えるシステムを示す図である。

【図8】本発明の１以上の実施形態を実施するためのコンピューティングデバイスの概略ブロック図である。

【図9】ネットワークカメラシステムを示す図である。

【図10】スマートフォンを示す図である。

【発明を実施するための形態】

【0045】

図１は、高効率ビデオ符号化（ＨＥＶＣ）ビデオ規格で使用される符号化構造に関する。ビデオシーケンス１は、一連のデジタル画像ｉから構成される。このような各デジタル画像は、１つ以上のマトリックスによって表される。マトリクスの係数数は画素を表している。

【0046】

シーケンスの画像２は、スライス３に分割することができる。スライスは、場合によっては画像全体を構成することができる。これらのスライスは、オーバーラップしない符号化ツリーユニット（Coding Tree Units:ＣＴＵ）に分割される。符号化ツリーユニット（ＣＴＵ）は高効率ビデオ符号化（ＨＥＶＣ）ビデオ規格の基本的な処理ユニットであり、概念的には、いくつかの以前のビデオ規格で使用されたマクロブロックユニットに対応する。ＣＴＵは、時には最大符号化ユニット（Largest Coding Unit:ＬＣＵ）とも呼ばれる。ＣＴＵはルマ（luma:輝度）及びクロマ（chroma:色差)成分部分を有し、その構成要素部分の各々は、符号化ツリーブロック（ＣＴＢ）と呼ばれる。これらの異なる色成分は、図１には示されていない。

【0047】

ＣＴＵは一般に、６４画素×６４画素サイズである。各ＣＴＵは、四分木分解を使用して、より小さい可変サイズの符号化ユニット（ＣＵ）５に反復的に分割されてもよい。

【0048】

符号化ユニットは基本符号化要素（elementary coding element）であり、予測ユニット（Predicton unit:ＰＵ）と変換ユニット（Transform Unit:ＴＵ）と呼ばれる２種類のサブユニットから構成される。ＰＵまたはＴＵの最大サイズは、ＣＵサイズに等しい。予測ユニット(prediction unit)は、画素値の予測のためのＣＵの区分に対応する。６０６によって示されるように、４つの正方ＰＵへのパーティションと、２つの長方形ＰＵへの２つの異なるパーティションとを含む、ＰＵへのＣＵの様々な異なるパーティションが可能である。変換ユニット（transform unit）は、ＤＣＴを使用して空間変換を行う基本ユニットである。ＣＵは、クワッドツリー表現６０７に基づいてＴＵに分割することができる。

【0049】

各スライスは、１つのネットワーク抽象化レイヤ（Network Abstraction Lyer:ＮＡＬ）ユニットに埋め込まれる。さらに、ビデオシーケンスの符号化パラメータは、パラメータセットと呼ばれる専用ＮＡＬユニットに格納される。ＨＥＶＣおよびＨ．２６４／ＡＶＣでは、２種類のパラメータセットＮＡＬユニットが使用される：第１は、ビデオシーケンス全体の間に変更されないすべてのパラメータを収集するシーケンスパラメータセット(Sequence Parameter Ser:ＳＰＳ)ＮＡＬユニット。典型的には、それは符号化プロファイル、ビデオフレームのサイズ、及び他のパラメータをハンドリングする。第２は、ピクチャパラメータセット(Picture Parameter Set：ＰＰＳ)ＮＡＬユニットで、これはシーケンスの１つの画像（またはフレーム）から別の画像（またはフレーム）に変更することができるパラメータを含む。ＨＥＶＣは、ビットストリームの全体的な構造を記述するパラメータを含むビデオパラメータセット（Video Parameter Set:ＶＰＳ）ＮＡＬユニットも含まれている。ＶＰＳは、ＨＥＶＣで定義された新しいタイプのパラメータセットで、ビットストリームのすべてのレイヤに適用される。レイヤは、複数のテンポラルサブレイヤを含むことができ、すべてのバージョン１のビットストリームは１つのレイヤに制限される。ＨＥＶＣには拡張性とマルチビューのための特定のレイヤ拡張があり、これらは後方互換性のあるバージョン１基本レイヤを備えた複数のレイヤを可能にする。

【0050】

図２は、本発明の１以上の実施形態を実施することができるデータ通信システムを示している。データ通信システムは、データ通信ネットワーク２００を介して、データストリームのデータパケットを受信装置、この場合はクライアント端末２０２に送信するように動作可能な送信装置、この場合はサーバ２０１を含む。データ通信ネットワーク２００は、ワイドエリアネットワーク（ＷＡＮ）またはローカルエリアネットワーク（ＬＡＮ）であってもよい。このようなネットワークは、例えば、無線ネットワーク(Ｗｉｆｉ /８０２．１１ａまたはｂまたはｇ）、イーサネットネットワーク、インターネットネットワーク、またはいくつかの異なるネットワークから構成される混合ネットワークであってもよい。本発明の特定の実施形態では、データ通信システムは、サーバ２０１が同じデータコンテンツを複数のクライアントに送信するデジタルテレビ放送システムであってもよい。

【0051】

サーバ２０１によって提供されるデータストリーム２０４は、ビデオおよびオーディオデータを表すマルチメディアデータから構成されてもよい。オーディオおよびビデオデータストリームは、本発明のいくつかの実施形態では、それぞれマイクロフォンおよびカメラを使用してサーバ２０１によってキャプチャされ得る。いくつかの実施形態において、データストリームは、サーバ２０１上に記憶されてもよく、あるいは別のデータプロバイダからサーバ２０１によって受信されてもよく、あるいはサーバ２０１で生成されてもよい。サーバ２０１は、特に、エンコーダへの入力として提示されるデータのよりコンパクトな表現である送信のための圧縮ビットストリームを提供するために、ビデオストリームおよびオーディオストリームを符号化するためのエンコーダを備える。

【0052】

送信データの品質対送信データの量のより良好な比を得るために、ビデオデータの圧縮は例えば、ＨＥＶＣフォーマット又はＨ．２６４／ＡＶＣフォーマットに従ってもよい。

【0053】

クライアント２０２は、送信されたビットストリームを受信し、再構成されたビットストリームを復号して、ビデオ画像を表示装置上で再生し、音声データをスピーカにより再生する。

【0054】

図２の例ではストリーミングシナリオが考慮されているが、本発明のいくつかの実施形態では、エンコーダとデコーダとの間のデータ通信が例えば、光ディスクなどの媒体記憶装置を使用して実行され得ることが理解されよう。

【0055】

本発明の１以上の実施形態では、最終的な画像内のフィルタリングされたピクセルを提供するため、ビデオ画像は、画像の再構成された画素に適用するための補償オフセットを表すデータと共に送信される。

【0056】

図３は、本発明の少なくとも１つの実施形態を実施するように構成された処理装置３００を概略的に示している。処理装置３００は、マイクロコンピュータ、ワークステーション、またはライトポータブル装置などの装置とすることができる。装置３００は、通信バス３１３を有し、これは以下のものが接続されれいる：
- ＣＰＵで示されるマイクロプロセッサなどの中央演算処理装置３１１；
- 本発明を実施するためのコンピュータプログラムを記憶するためのＲＯＭと表記される読み出し専用メモリ３０６；
- ＲＡＭで示されるランダムアクセスメモリ３１２は、本発明の実施形態の方法の実行可能コード、ならびにデジタル画像のシーケンスを符号化する方法および／または本発明の実施形態によるビットストリームを復号する方法を実施するために必要な変数およびパラメータを記録するように適合されたレジスタを格納するための、ＲＡＭとして表記されるランダムアクセスメモリ；及び
- 処理されるデジタルデータが送受信される通信ネットワーク３０３に接続された通信インターフェース３０２

【0057】

また、オプションとして、装置３００は、以下の構成要素を含むこともできる：
- 本発明の１以上の実施形態の方法を実施するためのコンピュータプログラム、および本発明の１つ以上の実施形態の実施中に使用または生成されるデータを記憶する、ハードディスクなどのデータ記憶手段３０４；
- ディスク３０６からのデータの読取り、又はディスクへのデータを書き込むように構成されるディスクドライブ３０５；
- データを表示したり、ユーザとの間で、キーボード３１０の手段または他の任意のポインティング手段によって、グラフィカルインターフェースとして機能する画面３０９

【0058】

装置３００は例えば、デジタルカメラ３２０またはマイクロフォン３０８のような種々の周辺機器に接続され得、各周辺機器はマルチメディアデータを装置３００に供給するために、入力／出力カード（図示せず）に接続される。

【0059】

通信バスは、装置３００に含まれる、またはそれに接続された様々な要素間の通信および相互運用性を提供する。バスの表現に限定はなく、特に、中央演算装置は、直接的に、または装置３００の別の要素の手段によって、装置３００の任意の要素に命令を通信するように動作可能である。

【0060】

ディスク３０６は、例えば、コンパクトディスク（ＣＤ－ＲＯＭ）、書き換え可能又はそうではない、ＺＩＰディスクまたはメモリカードなどの任意の情報媒体で置き換えることができる。一般的に言えば、マイクロコンピュータまたはマイクロプロセッサによって読み取ることができる情報記憶手段によって置き換えることができ、装置に統合または非統合され、可能であれば、リムーバブルであり、実行がデジタル画像のシーケンスを符号化する方法および／または本発明によるビットストリームの復号方法を可能にする１つ以上のプログラムを記憶するように構成することができる。

【0061】

実行可能コードは、読み出し専用メモリ３０６、ハードディスク３０４、または先に説明したような例えばディスク３０６のようなリムーバブルデジタル媒体のいずれかに格納することができる。変形例によれば、プログラムの実行可能コードは、実行される前に、ハードディスク３０４のような装置３００の記憶手段の１つに記憶されるために、インターフェース３０２を介して、通信ネットワーク３０３の手段によって受信することができる。

【0062】

中央演算処理装置３１１は、前述の記憶手段の１つに記憶された命令で本発明によるプログラムまたはプログラムのソフトウェアコードの命令または部分の実行を制御し、指示するように構成されている。電源投入時に、例えばハードディスク３０４または読み出し専用メモリ３０６上の不揮発性メモリに記憶された１つのプログラムまたは複数のプログラムはランダムアクセスメモリ３１２に転送される。これには、１つのプログラムまたは複数のプログラムの実行可能コード、ならびに本発明を実施するために必要な変数およびパラメータを記憶するためのレジスタが含まれる。

【0063】

この実施形態における装置は、本発明を実施するためにソフトウェアを使用するプログラマブル装置である。しかしながら、代替的に、本発明はハードウェア（例えば、特定用途向け集積回路（ＡＳＩＣ）の形態）で実施されてもよい。

【0064】

図４は、本発明の少なくとも１以上の実施形態によるエンコーダのブロック図を示す。エンコーダは、接続されたモジュールによって表される。各モジュールは、例えば、デバイス３００のＣＰＵ３１１によって実行されるべきプログラム命令の形態、本発明の１以上の実施形態による画像シーケンスの画像を符号化する少なくとも１以上の実施形態を実施する方法の少なくとも１以上の対応するステップを実施するように適合される。

【0065】

ディジタル画像ｉ０～ｉｎ４０１のオリジナルシーケンスは、エンコーダ４００による入力として受信される。各デジタル画像は、画素として知られるサンプルのセットによって表される。

【0066】

ビットストリーム４１０は、符号化プロセスの実施後にエンコーダ４００によって出力される。ビットストリーム４１０は、複数の符号化ユニットまたはスライスを備える。各スライスは、スライスを符号化するために使用される符号化パラメータの符号化値を送信するためのスライスヘッダと、符号化されたビデオデータを有するスライス本体とを備える。

【0067】

入力デジタル画像ｉ０～ｉｎ４０１は、モジュール４０２によって、画素ブロックに分割される。ブロックは画像部分に対応し、可変サイズであってもよい（例えば、４×４、８×８、１６×１６、３２×３２、６４×６４、１２８×１２８画素、およびいくつかの矩形ブロックサイズも考慮することができる）。符号化モードは、各入力ブロックに対して選択される。２つのファミリの符号化モードが提供される。それは、空間予測符号化（イントラ予測）に基づく符号化モードと、時間予測に基づく符号化モード（インター符号化、マージ、ＳＫＩＰ）である。可能な符号化モードがテストされる。

【0068】

モジュール４０３は、イントラ予測処理を実施する。ここでは、符号化対象の所与のブロックが、その符号化対象のブロックの近傍の画素から計算された予測子によって予測される。イントラ符号化が選択された場合に、選択されたイントラ予測子の指示、および所与のブロックとその予測子との間の差は、残差を提供するために符号化される。

【0069】

時間予測は、動き推定モジュール４０４および動き補償モジュール４０５によって実施される。最初に、基準画像４１６のセットの中から基準画像が選択され、符号化対象の所与のブロックに最も近い領域で基準領域または画像部分とも呼ばれる基準画像の部分が、動き推定モジュール４０４によって選択される。次いで、動き補償モジュール４０５は、選択されたエリアを使用して、符号化対象のブロックを予測する。選択された基準領域との残差ブロックとも呼ばれる所与のブロックとの間の差は、動き補償モジュール４０５によって計算される。選択された基準領域は、動きベクトルによって示される。

【0070】

このように、両方の場合（空間予測および時間予測）、残差は、元のブロックから予測を減算することによって計算される。

【0071】

モジュール４０３によって実施されるＩＮＴＲＡ予測では、予測方向が符号化される。時間予測では、少なくとも１つの動きベクトルが符号化される。モジュール４０４、４０５、４１６、４１８、４１７によって実施されるインター予測では、そのような動きベクトルを識別するための少なくとも１つの動きベクトルまたはデータが時間予測のために符号化される。

【0072】

インター予測が選択された場合、動きベクトルおよび残差ブロックに関する情報が符号化される。ビットレートをさらに低減するために、動きが均一であると仮定すると、動きベクトルは、動きベクトル予測子に対する差によって符号化される。１組の動き情報予測子の動きベクトル予測子は、動きベクトル予測符号化モジュール４１７によって動きベクトルフィールド４１８から得られる。

【0073】

エンコーダ４００はさらに、レート歪み基準などの符号化コスト基準を適用することによって、符号化モードを選択するための選択モジュール４０６を備える。冗長性をさらに低減するために、変換モジュール４０７によって変換（ＤＣＴなど）を残差ブロックに適用し、得られた変換データを量子化モジュール４０８によって量子化し、エントロピー符号化モジュール４０９によってエントロピー符号化する。最後に、符号化された現在のブロックの符号化された残差ブロックが、ビットストリーム４１０に挿入される。

【0074】

また、エンコーダ４００は後続の画像の動き推定のための参照画像を生成するために、符号化された画像の復号を行う。これは、ビットストリームを受信するエンコーダ及びデコーダが同じ参照フレームを有することを可能にする。逆量子化モジュール４１１は量子化データの逆量子化を行い、続いて逆変換モジュール４１２による逆変換を行う。逆イントラ予測モジュール４１３は、予測情報を使用して、所与のブロックにどの予測子を使用するかを決定し、逆動き補償モジュール４１４は、モジュール４１２によって取得された残差を、参照画像４１６のセットから取得された参照領域に実際に加算する。

【0075】

次いで、モジュール４１５によってポストフィルタリングが適用されて、再構成された画素のフレームをフィルタリングする。本発明の実施形態では、補償オフセットが再構成画像の再構成画素の画素値に付加されるＳＡＯループフィルタが使用される。

【0076】

図５は、本発明の一実施形態による、エンコーダからデータを受信するために使用され得るデコーダ６０のブロック図を示す。デコーダは、接続されたモジュールによって表され、各モジュールは例えば、デバイス３００のＣＰＵ３１１によって実行されるプログラム命令の形成で、デコーダ６０によって実現される方法の対応するステップを実施するように構成される。

【0077】

デコーダ６０は、符号化ユニットを含むビットストリーム６１を受信し、各符号化ユニットは、符号化パラメータに関する情報を含むヘッダと、符号化されたビデオデータを含むボディとから構成される。ＶＶＣにおけるビットストリームの構造は、図６を参照して以下でより詳細に説明される。図４に関して説明されるように、符号化されたビデオデータはエントロピー符号化され、動きベクトル予測子のインデックスは、所与のブロックについて、所定のビット数で符号化される。受信された符号化ビデオデータは、モジュール６２によってエントロピー復号される。次いで、残差データはモジュール６３によって逆量子化され、次いで、画素値を得るためにモジュール６４によって逆変換が適用される。

【0078】

符号化モードを示すモードデータもエントロピー復号され、そのモードに基づいて、画像データの符号化ブロックに対してＩＮＴＲＡ型復号またはインター型復号が実行される。

【0079】

ＩＮＴＲＡモードの場合、ＩＮＴＲＡ予測子は、ビットストリームで指定されたイントラ予測モードに基づいてイントラ逆予測モジュール６５によって決定される。

【0080】

モードがＩＮＴＥＲである場合、エンコーダによって使用される参照領域を見つけるために、動き予測情報がビットストリームから抽出される。動き予測情報は、参照フレームインデックスと動きベクトル残差とから構成される。動きベクトル復号モジュール７０によって動きベクトルを得るため、動きベクトル予測子が動きベクトル残差に加えられる。

【0081】

動きベクトル復号モジュール７０は、動き予測によって符号化された現在のブロックごとに動きベクトル復号を適用する。動きベクトル予測子のインデックスが取得されると、現在のブロックについて、現在のブロックに関連する動きベクトルの実際の値が復号され、モジュール６６によって逆動き補償を適用するために使用され得る。復号された動きベクトルによって示される参照画像部分は、参照画像６８から抽出され、逆動き補償６６が適用される。動きベクトルフィールドデータ７１は、後続の復号動きベクトルの逆予測に使用するために、復号動きベクトルで更新される。

【0082】

最後に、復号されたブロックが得られる。ポストフィルタリングは、ポストフィルタリングモジュール６７によって適用される。復号されたビデオ信号６９は、最終的にデコーダ６０によって供給される。

【0083】

図６は、ＪＶＥＴ＿Ｐ２００１－ＶＥに記載されているように、例示的符号化システムＶＶＣにおけるビットストリームの構成を示す。

【0084】

ＶＶＣ符号化システムによるビットストリーム６１は、シンタックス要素と符号化データの順序付けられたシーケンスから構成される。シンタックス要素および符号化データは、ネットワーク抽象化レイヤ（ＮＡＬ）ユニット６０１～６０８に配置される。異なるＮＡＬユニット型がある。ネットワーク抽象化レイヤは、ＲＴＰ／ＩＰなどの、異なるプロトコルにビットストリームをカプセル化する機能を提供し、リアルタイムプロトコル／インターネットプロトコル、ＩＳＯベースメディアファイル形式などに対応する。ネットワーク抽象化レイヤは、パケット損失回復力のためのフレームワークも提供する。

【0085】

ＮＡＬユニットは、ビデオコーディングレイヤ(Video Coding Layer：ＶＣＬ)ＮＡＬユニットと非ＶＣＬＮＡＬユニットとに分割される。ＶＣＬＮＡＬユニットは、実際の符号化されたビデオデータを含む。非ＶＣＬＮＡＬユニットは追加情報を含む。この追加情報は、符号化されたビデオデータの復号に必要なパラメータ、または復号されたビデオデータの使い勝手を向上させることができる補足データである。ＮＡＬユニット６０６は、スライスに対応し、ビットストリームのＶＣＬＮＡＬユニットを構成する。

【0086】

異なるＮＡＬユニット６０１～６０５は、異なるパラメータセットに対応し、これらのＮＡＬユニットは非ＶＣＬＮＡＬユニットである。デコーダパラメータセット(ＤＰＳ)ＮＡＬユニット３０１は、所与の復号処理に対して一定であるパラメータを含む。ビデオパラメータセット(ＶＰＳ)ＮＡＬユニット６０２は、ビデオ全体、すなわちビットストリーム全体に対して定義されたパラメータを含む。ＤＰＳＮＡＬユニットは、ＶＰＳ内のパラメータよりも静的なパラメータを定義することができる。換言すれば、ＤＰＳのパラメータは、ＶＰＳのパラメータよりも頻繁には変化しない。

【0087】

シーケンスパラメータセット(ＳＰＳ)ＮＡＬユニット６０３は、ビデオシーケンスに対して定義されたパラメータを含む。特に、ＳＰＳＮＡＬユニットは、ビデオシーケンスのサブピクチャレイアウトおよび関連するパラメータを定義することができる。各サブピクチャに関連するパラメータは、サブピクチャに適用される符号化制約を指定する。特に、それは、サブピクチャ間の時間的予測が同じサブピクチャから来るデータに制限されることを示すフラグを含む。別のフラグは、サブピクチャ境界を横切るループフィルタを有効または無効にすることができる。

【0088】

ピクチャパラメータセット(ＰＰＳ)ＮＡＬユニット６０４、ＰＰＳは、ピクチャまたはピクチャのグループに対して定義されたパラメータを含む。適応パラメータセット(ＡＰＳ)ＮＡＬユニット６０５は、ループフィルタのためのパラメータを含み、典型的には、適応ループフィルタ（Adaptive Loop Filter:ＡＬＦ）または再成形器モデル(resharper model)（またはクロマスケーリングを有するルママッピング（Luma mapping with chroma scaling:ＬＭＣＳ）モデル）またはスライスレベルで使用されるスケーリング行列を含む。

【0089】

ＶＶＣの現在のバージョンで提案されているようなＰＰＳのシンタックスは、ルマサンプル内のピクチャのサイズ、及び、タイルおよびスライス内の各ピクチャの分割を指定するシンタックス要素を含む。

【0090】

ＰＰＳには、フレーム内のスライスの位置を決定できるようにするシンタックス要素が含まれている。サブピクチャはフレーム内で矩形領域を形成するので、パラメータセットＮＡＬユニットから、サブピクチャに属するスライスのセット、タイルの部分、またはタイルを決定することが可能である。ＡＰＳとしてのＰＰＳは、送信される同一のＰＰＳの量を制限するためのＩＤ機構を有する。

【0091】

ＰＰＳとピクチャヘッダ（Picture Header)との間の主な違いは、ＰＰＳが送信されることであり、ＰＰＳは一般に、ピクチャ毎に体系的に送信されるＰＨと比較して、ピクチャのグループについて送信される。したがって、ＰＨと比較してＰＰＳは、いくつかのピクチャに対して一定であり得るパラメータを含む。

【0092】

ビットストリームはまた、補助強化情報(Supplemental Enhancement Information：ＳＥＩ)ＮＡＬユニット（図６には示されていない）を含むことができる。ビットストリーム内でこれらのパラメータセットが発生する周期性は可変である。ビットストリーム全体に対して定義されたＶＰＳは、ビットストリーム内で１回のみ発生する可能性がある。反対に、スライスに対して定義されるＡＰＳは、各ピクチャ内の各スライスに対して１回発生し得る。実際には、異なるスライスが同じＡＰＳに依拠することができ、したがって、一般に、各ピクチャ内のスライスよりも少ないＡＰＳが存在する。特に、ＡＰＳは、ピクチャヘッダにおいて定義される。しかし、ＡＬＦＡＰＳは、スライスヘッダにおいて精緻化することができる。

【0093】

アクセスユニットデリミタ(Access Unit Delimiter:ＡＵＤ)ＮＡＬユニット６０７は、２つのアクセスユニットを分離する。アクセスユニットは、同じ復号タイムスタンプを有する１以上の符号化ピクチャを備えることができるＮＡＬユニットのセットである。このオプションのＮＡＬユニットは、現在のＶＶＣスペックの中でただ１つのシンタックス要素、ｐｉｃ＿ｔｙｐｅを含んでいる。このシンタックス要素は、ＡＵ内の符号化ピクチャのすべてのスライスのｓｌｉｃｅ＿ｔｙｐｅ値を示す。ｐｉｃ＿ｔｙｐｅが０に等しく設定される場合、ＡＵはイントラスライスのみを含む。１に等しい場合、それはＰおよびＩスライスを含む。２に等しい場合、以下のテーブル１に示すように、それはＢ、Ｐまたはイントラスライスを含む。

【0094】

テーブル１ｐｉｃ＿ｔｙｐｅの解釈

【0095】

ピクチャヘッダ
ＰＨＮＡＬユニット６０８は、１つの符号化ピクチャのスライスのセットに共通のパラメータをグループ化するピクチャヘッダＮＡＬユニットである。ピクチャは、ＡＦＬパラメータ、再形成器モデル、およびピクチャのスライスによって使用されるスケーリング行列を示すために、１つ以上のＡＰＳを参照することがある。

【0096】

ＶＣＬＮＡＬユニット６０６の各々はスライスを含む。スライスは、ピクチャ全体またはサブピクチャ、単一のタイル、または複数のタイル、またはタイルの一部に対応することができる。例えば、図６のスライスは、幾つかのタイル６２０を含む。スライスは、スライスヘッダ６１０と、符号化ブロック６４０として符号化された符号化画素データを含むＲＡＷバイトシーケンスペイロード（RAW Byte Sequence payload）ＲＢＳＰ６１１とから構成される。

【0097】

ピクチャヘッダは、各ピクチャの先頭で送信される。復号可能な関連するシンタックス要素は以下に関連する：
・このピクチャの使用法、参照フレームかどうか
・出力フレーム
・必要に応じてサブピクチャの使用法
・必要に応じて参照画像リスト
・必要に応じて色プレーン
・オーバライドフラグが有効な場合のパーティション更新
・必要に応じてデルタＱＰパラメータ
・必要に応じて動き情報パラメータ
・必要に応じてＡＬＦパラメータ
・必要に応じてＳＡＯパラメータ
・必要に応じて定量化パラメータ
・必要に応じてＬＭＣＳパラメータ
・必要に応じてスケーリングリストパラメータ
・必要に応じてピクチャヘッダ拡張

【0098】

これらすべてのパラメータの完全な説明は、ＪＶＥＴ＿Ｐ２００１－ＶＥに見ることができる。

【0099】

ピクチャヘッダのこの構造は、特定のピクチャで必要となる可能性があるすべてのツールを提供する際の柔軟性を提供する。このように、この構造は、ハードウェアデコーダにとって、しばしば重要な考慮事項であるピクチャを復号するための「最悪ケース」を本質的に定義する。しかしながら、この構造には、ビットレートの増加を引き起こす重大な冗長性がある。

【0100】

本発明によって対処される問題は、特定の符号化モードに関連するこのピクチャヘッダ内のパラメータのセットに関する。パラメータの特定のセットに対して、シンタックス要素のセットがインタースライスとイントラスライスの両方に対して送信される。これは、ピクチャ内の全てのスライスが同じタイプを有する場合にレートを増加させる。

【0101】

テーブル２は、ＪＶＥＴ＿Ｐ２００１－ＶＥの中で提供される定義を使用して、現在のピクチャヘッダ復号シンタックスの中のこれらのパラメタを示す。このテーブルでは、“．．．”は、この説明に関係のない構文要素を表す。

【0102】

テーブル２部分ピクチャヘッダ

【0103】

上記ヘッダの３つの特定のパラメータセットは、特定のケースでは冗長である可能性がある。これらの３つのセットについて、以下で順に考察する。
最初のパラメータセットは、パーティショニングに関連している。以下は、インタースライスのみに利用される：
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍｉｎ_ｑｔ_ｍｉｎ_ｃｂ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｅｒ_ｓｌｉｃｅ
そして、以下は、イントラスライスのみに利用される：
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｂｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｔｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｃｈｒｏｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ

【0104】

これらのパラメータは、イントラおよびクロマそれぞれについてインターピクチャについて説明したものと同等である。
テーブル２に定義されているように、クロマパラメータは、フラグｑｔｂｔｔ_ｄｕａｌ_ｔｒｅｅ_ｉｎｔｒａ_ｆｌａｇ(ＳＰＳレベル）が１に設定されている場合にのみ有効になる。
テーブル２に示すように、これらのパーティショニングパラメータ（Ｉｎｔｅｒ、Ｉｎｔｒａ、Ｃｈｒｏｍａ）は、ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇが有効で、ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇがＰｉｃｔｕｒｅヘッダにて１に設定されている場合にのみ更新される。
フラグｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇはＳＰＳ内で送信される。

【0105】

第２のパラメータのセットは、デルタＱＰパラメータに関連する。以下の２つのパラメータは、インタースライスにのみで必要である：
・ｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｅｒ＿ｓｌｉｃｅ
・ｐｉｃ_ｃｕ_ｃｈｒｏｍａ_ｑｐ_ｏｆｆｓｅｔ_ｓｕｂｄｉｖ_ｉｎｔｅｒ_ｓｌｉｃｅ
次の２つのイントラスライスのものである：
・ｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｒａ＿ｓｌｉｃｅ
・ｐｉｃ_ｃｕ_ｃｈｒｏｍａ_ｑｐ_ｏｆｆｓｅｔ_ｓｕｂｄｉｖ_ｉｎｔｒａ_ｓｌｉｃｅ

【0106】

ｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｅｒ＿ｓｌｉｃｅおよびｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｒａ＿ｓｌｉｃｅは、ＰＰＳにてｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に設定されている場合にのみ送信される。

【0107】

同様に、ｐｉｃ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｓｕｂｄｉｖ＿ｉｎｔｅｒ＿ｓｌｉｃｅおよびｐｉｃ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｓｕｂｄｉｖ＿ｉｎｔｒａ＿ｓｌｉｃｅは、ＰＰＳにてｐｐｓＳ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｌｉｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇが有効になっている場合にのみ復号される。

【0108】

第３のパラメータのセットは動きパラメータに関連し、インタースライスにおいてのみ使用される：
・ｐｉｃ_ｔｅｍｐｏｒａｌ_ｍｖｐ_ｅｎａｂｌｅｄ_ｆｌａｇ
・ｍｖｄ＿ｌ１＿ｚｅｒｏ＿ｆｌａｇ
・ｐｉｃ_ｓｉｘ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｍｅｒｇｅ_ｃａｎｄ
・ｐｉｃ_ｆｉｖｅ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｓｕｂｂｌｏｃｋ_ｍｅｒｇｅ_ｃａｎｄ
・ｐｉｃ_ｆｐｅｌ_ｍｍｖｄ_ｅｎａｂｌｅｄ_ｆｌａｇ
・ｐｉｃ_ｄｉｓａｂｌｅ_ｂｄｏｆ_ｆｌａｇ
・ｐｉｃ＿ｄｉｓａｂｌｅ＿ｄｍｖｒ＿ｆｌａｇ
・ｐｉｃ_ｄｉｓａｂｌｅ_ｐｒｏｆ_ｆｌａｇ
・ｐｉｃ_ｍａｘ_ｎｕｍ_ｍｅｒｇｅ_ｃａｎｄ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｔｒｉａｎｇｌｅ_ｃａｎｄ

【0109】

これらの各パラメータは、ＳＰＳまたはＰＰＳヘッダでシグナリングされた“有効フラグ”（enable flag）または“オーバーライドフラグ”(overriding flag）に基づいて復号できる（またはできない）。しかしながら、これらのパラメータの各々は、常に送信され、これはビットレートの増加につながる。

【0110】

このレートの増加は、符号化ピクチャがいくつかのパラメータが定義されるが、決して使用されないように、１つのタイプのスライス（イントラまたはインター）のみを使用する場合に特に顕著である。

【0111】

この問題を改善する第１の方法は、ピクチャヘッダ内で符号化タイプをシグナリングし、その符号化タイプに関連するシンタックス要素のみを復号することである。ほとんどのピクチャは、単一の符号化タイプ（例えば、インターまたはＩＮＴＲＡ）であり、したがって、これは、不必要なシンタックス要素としてビットレートを低減するための有効な方法を表す。

【0112】

ピクチャヘッダにて示されるピクチャタイプ
一般的な概念の一例では、ピクチャタイプシンタックス要素“ｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒ”がピクチャヘッダの先頭に送信される。

【0113】

このピクチャタイプは、次のように定義することができる：
・ピクチャタイプがＩ（または０）に等しく設定される場合、ピクチャのすべてのスライスは、同じスライスタイプ、イントラを有する。
・ピクチャタイプがＰ（または１）に等しく設定される場合、ピクチャのすべてのスライスは、同じスライスタイプ、インターＰ（Ｕｎｉ－ｐｒｅｄｉｃｔｉｏｎ）を有する。
・ピクチャタイプがＢ（または２）に等しく設定される場合、ピクチャのすべてのスライスは、同じスライスタイプ、インターＢ（Ｂｉ－ｐｒｅｄｉｃｔｉｏｎ）を有する。

【0114】

デコーダは、ｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒを指定するピクチャヘッダを受け取ると、ピクチャタイプに対応する符号化モードを最初に決定し、この符号化モードに関連する構文要素のみを復号する（または、異なる符号化モードにのみ関連するシンタックス要素を無視する）。

【0115】

一例では、ｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒは、ピクチャヘッダの特定の部分を復号するかどうかに条件を課すことによって、必要のない一部のシンタックス要素を有効および無効化に利用される。

【0116】

以下のテーブル３は、この条件付き復号を実装する１つの方法を示すピクチャヘッダの修正例を示している。注目すべき変更点が下線で示されている。このテーブルは、部分的なヘッダを表しており、明確さと簡潔さの理由から順序が変更されていることに注意されたい。潜在的に異なる順序で、より大きなヘッダは、実際により適切であり得る。

【0117】

テーブル３－条件付き復号を含むピクチャヘッダ

【0118】

"ｃｏｎｄｉｔｉｏｎｓ"は符号化タイプに関連し、特定のシンタックス要素の条件付き復号を可能にし、復号を必要としない要素はスキップされる。これにより、復号性能が向上する。

【0119】

条件(condition）の一例を以下に示す：
Condition1: picture_type_pic_header == P OR picture_type_pic_header == B
Condition2: picture_type_pic_header == I
Condition3: picture_type_pic_header == B

【0120】

Ｃｏｎｄｉｔｉｏｎ１がｆａｌｓｅ（偽）の場合、すべてのスライスはイントラであり、以下のシンタックス要素は復号されない：
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｅｒ＿ｓｌｉｃｅ
・ｐｉｃ_ｃｕ_ｃｈｒｏｍａ_ｑｐ_ｏｆｆｓｅｔ_ｓｕｂｄｉｖ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｔｅｍｐｏｒａｌ_ｍｖｐ_ｅｎａｂｌｅｄ_ｆｌａｇ
・ｍｖｄ＿ｌ１＿ｚｅｒｏ＿ｆｌａｇ
・ｐｉｃ_ｓｉｘ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｍｅｒｇｅ_ｃａｎｄ
・ｐｉｃ_ｆｉｖｅ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｓｕｂｂｌｏｃｋ_ｍｅｒｇｅ_ｃａｎｄ
・ｐｉｃ_ｆｐｅｌ_ｍｍｖｄ_ｅｎａｂｌｅｄ_ｆｌａｇ
・ｐｉｃ_ｄｉｓａｂｌｅ_ｂｄｏｆ_ｆｌａｇ
・ｐｉｃ＿ｄｉｓａｂｌｅ＿ｄｍｖｒ＿ｆｌａｇ
・ｐｉｃ_ｄｉｓａｂｌｅ_ｐｒｏｆ_ｆｌａｇ
・ｐｉｃ_ｍａｘ_ｎｕｍ_ｍｅｒｇｅ_ｃａｎｄ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｔｒｉａｎｇｌｅ_ｃａｎｄ

【0121】

Ｃｏｎｄｉｔｉｏｎ２がｆａｌｓｅの場合、すべてのスライスはインターであり、以下のシンタックス要素は復号されない：
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｂｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｔｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｃｈｒｏｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｒａ＿ｓｌｉｃｅ
・ｐｉｃ_ｃｕ_ｃｈｒｏｍａ_ｑｐ_ｏｆｆｓｅｔ_ｓｕｂｄｉｖ_ｉｎｔｒａ_ｓｌｉｃｅ

【0122】

Ｃｏｎｄｉｔｉｏｎ３がｆａｌｓｅの場合、すべてのスライスはＮＯＴＢピクチャであり、以下のシンタックス要素は復号されない：
・ｍｖｄ＿ｌ１＿ｚｅｒｏ＿ｆｌａｇ
・ｐｉｃ_ｄｉｓａｂｌｅ_ｂｄｏｆ_ｆｌａｇ
・ｐｉｃ＿ｄｉｓａｂｌｅ＿ｄｍｖｒ＿ｆｌａｇ
・ｐｉｃ_ｍａｘ_ｎｕｍ_ｍｅｒｇｅ_ｃａｎｄ_ｍｉｎｕｓ_ｍａｘ_ｎｕｍ_ｔｒｉａｎｇｌｅ_ｃａｎｄ

【0123】

したがって、Ｉ、Ｐ、またはＢピクチャの特定のシンタックス要素のみが、ピクチャヘッダから復号され、したがって、各ピクチャのレートが低減される。

【0124】

スライスヘッダのシンタックス要素の有効／無効化
一例では、ｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒは、不要な一部のシンタックス要素を有効または無効化に利用される。これは、テーブル４の修正されたピクチャヘッダに示されている。

【0125】

このテーブルでは、ｓｌｉｃｅ＿ｔｙｐｅは決して送信されない。そして、その値はシンタックス要素ｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒに置き換えられた。このフラグに基づいて、ピクチャがインタースライスのみを含み、イントラに対して送信されない場合、ｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇを送信することができる。同様に、テーブルｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｍｉｎｕｓ１[ｉ]は、イントラスライスを含むピクチャに対して復号されない。

【0126】

パラメータｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ及びｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｍｉｎｕｓ１[ｉ]は、両方とも、参照フレームの量に関連している。ｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇは、参照フレームの数を表すパラメータｎｕｍ＿ｒｅｆ＿ｉｄｘ＿ａｃｔｉｖｅ＿ｍｉｎｕｓ１[ｉ]を復号する必要があるかどうかを示す。

【0127】

同様に、ピクチャがイントラスライスを含む場合、ｃａｂａｃ＿ｉｎｉｔ＿ｆｌａｇは復号されない。このパラメータは、初期化ＣＡＢＡＣ文脈に関連する。

【0128】

ｃｏｌｌｏｃａｔｅｄ＿ｆｒｏｍ＿ｌ０＿ｆｌａｇ、ｃｏｌｌｏｃａｔｅｄ＿ｒｅｆ＿ｉｄｘは、ピクチャがイントラスライスを含む場合は復号されない。これらのパラメータは、時間的動き予測子のための配置された（collocated)参照フレームの選択に関連する。

【0129】

結局は、ピクチャがイントラスライスを含む場合、ｐｒｅｄ_ｗｅｉｇｈｔ_ｔａｂｌｅ()は復号されない。この実施形態の利点は、このスライスタイプの伝送に関連するレートが、現在の設計と比較して節約されることである。

【0130】

テーブル４ｐｉｃ_ｔｙｐｅ_ｐｉｃ_ｈｅａｄｅｒによる修正されたスライスヘッダ

【0131】

特に有利な一例では、上記の特徴を組み合わせることができる。この場合、ｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒを使用して、ピクチャヘッダに不要な一部のシンタックス要素を有効化および無効化でき、ｓｌｉｃｅ＿ｔｙｐｅがｓｌｉｃｅヘッダに指定されておらず、ｓｌｉｃｅヘッダの一部のシンタックス要素を復号するかどうかをｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄに置き換えられる。

【0132】

ピクチャヘッダ内のスライスタイプ制約
この特徴はｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒの代わりに、シンタックス要素“ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔ”がピクチャヘッダの先頭で送信される、上の例に対する修正を表す。このシンタックス要素は、ピクチャ内の各スライスで使用される符号化モードへの制約を示す。これはｐｉｃｔｕｒｅ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒとは異なる。これは、必ずしもすべてのスライスが同じであることが必須ではなく、より広い範囲の値を可能にするためである。

【0133】

ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔの値と対応する定義の例を以下に示す：
・０に等しいことは、ピクチャの全てのスライスがイントラであることを示す。
・１に等しいことは、ピクチャのすべてのスライスがインターであることを示す。
・２に等しいことは、ピクチャのスライスが異なるタイプを有し得ることを示す。
さらに２つの定義を追加することができる：
・３に等しいことは、ピクチャのすべてのスライスがインターＢであることを示す。
・４に等しいことは、ピクチャのすべてのスライスがインターＰであることを示す。

【0134】

１つの代替例は、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔ定義は次のように定義されることである：
・０に等しいことは、ピクチャのすべてのスライスが、１に等しいインターＢであることを示す。
・１に等しいことは、ピクチャのすべてのスライスがインターＰであることを示す。
・２に等しいことは、ピクチャの全てのスライスがイントラであることを示す。
・３に等しいことは、ピクチャのスライスが異なるタイプを有し得ることを示す。
・４に等しいことは、ピクチャのすべてのスライスがインターであることを示す。

【0135】

この例では、異なるピクチャタイプ制約が、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔをシグナリングするために必要とされる一般的なビット数を低減するために、ビデオシーケンスの最も確率の高い設定から最も確率の低い設定に順序付けられる。実際、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔは、単項コード(unary code)または単項ｍａｘ(unary max) またはＧｏｌｏｍｂ符号で符号化できる。したがって、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔ値をその確率に従って順序付けることが好ましい。

【0136】

上記のリストに組み込むことができるｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔの他の特性は、以下のとおりである：
－ピクチャは、インスタンスデコーダリフレッシュ（Instantaneous Decoder Refresh:ＩＤＲ）ピクチャである。
－ピクチャは、クリーンランダムアクセス（Clean Random Access:ＣＲＡ）ピクチャである。
－ピクチャは、ＧｒａｄｕａｌＤｅｃｏｄｉｎｇＲｅｆｒｅｓｈ（ＧＤＲ）ピクチャである。
－ピクチャは、非イントラランダムアクセスポイント（非ＩＲＡＰ）、非ＧＤＲピクチャであり、Ｉスライスのみを含む。
－ピクチャは非ＩＲＡＰ、非ＧＤＲピクチャであり、ＰスライスおよびＩスライスのみを含む。
－ピクチャは非ＩＲＡＰ、非ＧＤＲピクチャであり、Ｂスライス、Ｐスライス、および／またはＩスライスのいずれかを含む。

【0137】

そのような値は、ＩＲＡＰおよびＧＤＲピクチャがより関連性があるストリーミングアプリケーションに有用であり得る。実際、これらのピクチャは、例えば、シーケンスの最初のピクチャを変更したり、ライブアプリケーションのためのストリームを同期させたりするために使用することができるイントラランダムアクセスポイントを提供する。

【0138】

実際、ストリーミングアプリケーションでは、ネットワークパッケージロス（network package loss）のイベントにおける、ストリームを「リフレッシュ（refresh）」するために、少なくとも１つのイントラスライスが必要になる可能性が高くなる。単純な実施形態では、この参照が混合符号化タイプを有するピクチャを回避するためにピクチャワイドレベルで実行することができる。

【0139】

この例はｍ先の実施形態と同様のレート低減を提供するが、ピクチャヘッダを介して同じピクチャ内の異なるように符号化されたスライスを直接可能にすることによって、デコーダにおいてより大きな柔軟性を可能にする。

【0140】

ｐｉｃ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒに関する上記の例と同様に、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔは、不要な一部のシンタックス要素を有効化および無効化するために使用される。これは、以下のように、テーブル３の状況１、２、３に相当する：
Condition1: pic_slice_type_constraint != ０
Condition2: pic_slice_type_constraint == ０ OR pic_slice_type_constraint == ２
Condition3: pic_slice_type_constraint == ３ OR pic_slice_type_constraint == ２

【0141】

追加の改良を提供する追加の特徴として、スライスヘッダのスライスタイプは、現在の設計よりも少ないビットで推論および／または復号することができる。

【0142】

テーブル５に示すように、ｓｌｉｃｅ＿ｔｙｐｅは、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔが２に設定されている場合にのみ復号される。その場合、ｓｌｉｃｅ＿ｔｙｐｅはＩ、Ｐ、またはＢの３つの値のいずれかを持つことができる。ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔが１に設定されると、ｓｌｉｃｅ＿ｔｙｐｅは部分的に復号される。実際、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔのおかげで、スライスがインター(ＰまたはＢ）であるので、ｓｌｉｃｅ＿ｔｙｐｅがＰかＢかを知るために復号する必要があるのは１ビットだけである。
ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔが０に設定されている場合は、ｓｌｉｃｅ＿ｔｙｐｅがＩに等しいことが確認される。ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔが０に設定されている場合がｓｌｉｃｅ＿ｔｙｐｅがＢに等しいことが確認される。それ以外の場合がＰに等しく設定される。

【0143】

上記のテーブル３に示される例と比較して、ｓｌｉｃｅ＿ｔｙｐｅは除去されず、その復号が適応される。

【0144】

この機能の利点は、フレームのすべてのスライスがイントラである、またはすべてがインターの場合、ｓｌｉｃｅ＿ｔｙｐｅのレートを削減できることである。

【0145】

テーブル５ｐｉｃ_Ｓｌｉｃｅ_ｔｙｐｅ_ｃｏｎｓｔｒａｉｎｔによる修正されたスライスヘッダ

【0146】

さらなる修正のひとつでは、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔがピクチャヘッダにおいて不要ないくつかのシンタックス要素を有効化および無効化するために使用され、スライスヘッダのｓｌｉｃｅ＿ｔｙｐｅがｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔ値に基づいて完全または部分的に推論されることである。

【0147】

ＡＵデリミタＮＡＬユニットのピクチャタイプ“ｐｉｃ＿ｔｙｐｅ”は、ｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔの値に従って設定できる。したがって、ｐｉｃ＿ｔｙｐｅがＩに設定されると、このレイヤーのすべてのｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔは０に設定される。ｐｉｃ＿ｔｙｐｅを２（Ｐ、Ｉ）に設定すると、このレイヤーのすべてのｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔは０または３になる。さもなければ、このレイヤーのすべてのｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔは、任意の値を取ることができる（例えば、上で論じた５つの値の１つ）。

【0148】

ＡＵＮＵＬへの変更
上述の特徴を使用する場合、ストリームが１つのレイヤしかない場合には、復号されるＡＵデリミタＮＡＬユニットのシンタックス要素“ｐｉｃ＿ｔｙｐｅ”は復号する必要はない、又は、ＶＰＳまたはＳＰＳで送信されるフラグに依存して、その復号はオプションである。実際、そのような場合、同様の情報がピクチャヘッダに存在するように、このシンタックス要素を送信するのは冗長である。
この特徴は、レート低減に寄与する。

【0149】

オプションで、ＡＵデリミタＮＡＬユニットは、ストリームが１つのレイヤのみを含み、ピクチャヘッダ内の情報に基づいて推論される場合には復号されない。実際、その場合、ＡＵデリミタに含まれる情報は、ピクチャヘッダのシンタックス要素と冗長であるため、必要とされない。この特徴は、レート低減にさらに寄与する。

【0150】

復号されたシンタックス要素のセットを設定するＡＵＮＡＬｐｉｃ＿ｔｙｐｅ
１つの単純化された変形では、ＡＵＮＡＬユニットのｐｉｃ＿ｔｙｐｅがピクチャヘッダで復号されたシンタックス要素のセットを判定するために使用される。この変形例では、ピクチャヘッダに、ピクチャタイプまたはピクチャタイプ制約は設定されない。しかし、テーブル３に示される条件「condition1(条件1)、condition2(条件2)、condition3(条件3)」は、ＡＵＮＡＬユニットがシグナリングされるときのＡＵＮＡＬユニットのｐｉｃ＿ｔｙｐｅに基づいて決定される。したがって、ピクチャヘッダの復号は、ピクチャ内のスライスのスライス符号化モード（ｐｉｃ＿ｔｙｐｅ）を条件とし、スライス符号化モードは、ピクチャヘッダよりも高いレベルで決定される。

【0151】

“条件”は、この例ではｐｉｃ＿ｔｙｐｅの符号化タイプに関連し、前の実施形態に対して定義されたように、復号をスキップする必要のない要素をもつ特定のシンタックス要素の条件付き復号を可能にする。これにより、復号性能が向上する。

【0152】

条件の一例を以下に示す：
Ｃｏｎｄｉｔｉｏｎ１: pic_type == １ OR pic_type == ２
Ｃｏｎｄｉｔｉｏｎ２: pic_type == ０
Ｃｏｎｄｉｔｉｏｎ３: pic_type == ２
ＡＵＮＡＬユニットのｐｉｃ＿ｔｙｐｅがシグナリングされない場合、ＡＵＮＡＬユニットのｐｉｃ＿ｔｙｐｅは２に等しいと推定される。

【0153】

統合シンタックス要素(Merged syntax elements)
インター及びイントラモードの両方で使用される類似のシンタックス要素は、ピクチャヘッダ内の要素の冗長性を低減するため、および／または復号前の検証を必要とする条件の数を低減するために、マージされてもよい。一例では、ピクチャヘッダは、使用される符号化モードに依存しないシンタックス要素のみを含む。つまり、同じシンタックス要素をインターまたはイントラで使用できる。これは、ほとんどのピクチャに、１タイプの符号化モード（インターまたはイントラ）を必要とするスライスのみが含まれており、そのような２組のシンタックス要素は必要ないためである。

【0154】

したがって、イントラとインターのシンタックス要素をマージすると、特にピクチャ内のすべてのスライスのタイプ（Ｉ、Ｐ又はＢ）が同じ場合に、これらのシンタックス要素の冗長コードが回避される。ピクチャ内にインタースライスとイントラスライスの両方が存在する場合、柔軟性はより低いが、イントラスライスへの影響は符号化選択を適応させることによって補償することができる。

【0155】

“coding type”ラベルのみが異なるシンタックス要素は、マージに特に適している。

【0156】

上記と同じ設計に従う場合、以下のシンタックス要素は、以下のテーブル６に示すようにマージされてもよい：

【0157】

テーブル６マージされたシンタックス要素

【0158】

テーブル７は、このピクチャヘッダシンタックステーブルの単純化の例を示す。

【0159】

テーブル７マージされたシンタックス要素を持つピクチャヘッダ

【0160】

シンタックス要素の共通値
１つの代替方法では、パラメータの各ペアはまだ存在し、共通値はピクチャヘッダで復号され、イントラスライスの値はイントラ（スライスヘッダで定義）の場合は共通値に設定され、イントラスライスの値はイントラ（スライスヘッダで定義）の場合は共通値に設定され、インタスライスの値はインタ（インター）の場合は共通値に設定される。

【0161】

１つの追加の例では、少なくとも１つのフラグが、イントラスライスおよび／またはインタースライスが共通値を使用するかどうか、または上位レベル（ＳＰＳ、ＰＰＳ）で与えられる値を保持するかどうかを示す上位レベル（ＰＰＳ、ＳＰＳ）に存在する。これにより、柔軟性を高めることができる。

【0162】

追加の一例では、イントラ値がスライスヘッダ内の変数に応じてスライスレベルで更新することができる。

【0163】

たとえば、イントラのスライスヘッダのパラメータは次のようになる：
・ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｓｌｉｃｅ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｌｕｍａ
・ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｂｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｔｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｃｈｒｏｍａ
・ｓｌｉｃｅ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｓｌｉｃｅ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｓｌｉｃｅ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｓｌｉｃｅ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｒａ＿ｓｌｉｃｅ
・ｓｌｉｃｅ_ｃｕ_ｃｈｒｏｍａ_ｑｐ_ｏｆｆｓｅｔ_ｓｕｂｄｉｖ_ｉｎｔｒａ_ｓｌｉｃｅ

【0164】

最初の例と比較した場合の利点は、柔軟性の増加である。実際、この追加の特徴により、現在の設計と同じ柔軟性を得ることができる。そして、各スライスに対してこれらのパラメータを適応させることによって、より多くの柔軟性が得られる。

【0165】

ＰＰＳ／ＳＰＳでのフラグのオーバーライド
柔軟性を高めるために、イントラとインターの両方の値をスライスヘッダで送信できる。これらのパラメータは、スライスヘッダ内のこれらの構文要素に必要な追加レートを低減するために、ＰＰＳおよび／またはＳＰＳまたはピクチャヘッダで送信される１つ以上のオーバライドフラグに依存して、スライスヘッダ内でシグナリングできる（またはしない）ことができる。

【0166】

たとえば、ピクチャヘッダでパラメータｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｓｌｉｃｅが送信されると、オーバーライドフラグｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｃｂ＿ｓｌｉｃｅ＿Ｉｎｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇがデコードされ、スライス内のｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿Ｉｎｔｅｒ＿ｓｌｉｃｅ＿ｌｕｍａ値がインタースライスで更新されるかどうかが決定される。ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｓｌｉｃｅが復号されていない場合、このパラメータはインタースライスでは更新されず、ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｓｌｉｃｅ＿Ｉｎｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇは０に設定される。
同様に、イントラスライスに対して、オーバーライドフラグｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｓｌｉｃｅ＿Ｉｎｔｒａ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇを送信できる。

【0167】

オプションとして、パラメータがスライスヘッダで送信されるとき、それらの値は、ピクチャヘッダ上の均等なシンタックス要素値によって抑制（constrain）される。より正確には、これらの値が複雑さの増加を回避するために制限される。

【0168】

たとえば、ｓｌｉｃｅヘッダのｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａは、ピクチャヘッダで送信されるｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｓｌｉｃｅの値に制限される。より正確には、ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａは、ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｓｌｉｃｅより劣ることはない。この制限の影響は、スライスがピクチャヘッダに定義されたサイズよりも小さいブロックサイズを使用できないことである。

【0169】

この例の利点は、デコーダが各ピクチャに対してその複雑度パラメータを設定できることである。したがって、この複雑さは、新しいスライスごとに増加する必要はない。

【0170】

必要なビット数をさらに減らすために、スライスシンタックス要素がピクチャヘッダ値の均等なシンタックス要素によって抑制されるとき、その値は、符号化された最後の値によって予測される可能性がある。

【0171】

上記のシンタックス要素の「マージ」は、別個のシンタックス要素の全体的な数を減らすために、他の特徴と組み合わせることができることが理解されるべきである。例として、このような組み合わせでは、ピクチャヘッダが、常に復号される符号化モードに依存しないシンタックス要素（すなわち、“マージされたシンタックス要素”）、符号化タイプの指示（例えば、ｐｉｃ＿ｔｙｐｅ＿ｐｉｃ＿ｈｅａｄｅｒまたはｐｉｃ＿ｓｌｉｃｅ＿ｔｙｐｅ＿ｃｏｎｓｔｒａｉｎｔ）、そして、符号化タイプに基づいて条件付きで復号されるシンタックス要素を含む。

【0172】

インターパラメータのみの複製(duplication)
さらに別の例では、イントラスライスのみに関連するすべてのパラメータが、ピクチャヘッダから削除される。テーブル８はこの例を示す。現在のデザインと比較して、次のシンタックス要素はピクチャヘッダには存在しない：
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｂｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｔｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｃｈｒｏｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ＿ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｓｕｂｄｉｖ＿ｉｎｔｒａ＿ｓｌｉｃｅ
・ｐｉｃ_ｃｕ_ｃｈｒｏｍａ_ｑｐ_ｏｆｆｓｅｔ_ｓｕｂｄｉｖ_ｉｎｔｒａ_ｓｌｉｃｅ

【0173】

この例では、これらの省略されたシンタックス要素の値がＰＰＳおよび／またはＳＰＳで設定される。この例の利点は、ピクチャヘッダに関連するレートの低減である。実際、ビデオシーケンスでは、時間的相関が空間的相関よりも著しく高いので、イントラスライスよりも多くのインタースライスがある。したがって、ピクチャヘッダでは、最も使用されないシンタックスパラメータはイントラスライスのみに関連するものである。この影響は、インタースライスのレートが同じ画像領域及び品質に対するイントラスライスのレートよりも著しく低いので、インタースライスのみを含むピクチャに対して最大となる。

【0174】

テーブル８イントラシンタックス除去したピクチャヘッダ

【0175】

あるいは、シーケンスが（シーケンスヘッダまたはＳＰＳの中で署名されたように）イントラピクチャのみを含むとき、上記のイントラパラメータは、ピクチャヘッダの中で送信される。この実施形態の利点は、イントラパラメータを、このアダプテーションの影響がより重要であるべき完全なイントラシーケンスに適合できることである。

【0176】

同様に、シーケンスがイントラピクチャのみを含むとき、インターシンタックス要素の集合は送信されない。この利点は、使用されなかったインターパラメータに関連する追加のレートがないことである。

【0177】

追加の一実施形態では、スライスタイプがイントラであるとき、イントラシンタックス要素のセットがスライスヘッダ内で送信される。この実施形態の利点は、イントラを適合させることができるので、主な実施形態と比較してより大きな柔軟性があることである。さらに、レートへの影響は、より少ないイントラスライスがビデオにおいて送信されるので、イントラスライスのアダプテーションのためにより低くなる。

【0178】

要するに、ピクチャヘッダ、そのピクチャがこれらのモードの一つで符号化されたスライスのみを持つと決定されたとき、イントラ／インター要素を削除するように修正される。このようにして、ピクチャヘッダは、ピクチャ全体に使用される符号化モードに関連するシンタックス要素のみを含む。ピクチャの大部分では、これはインター符号化であり（インターピクチャはイントラよりも一般的であるため）、簡単にするために、このオプションはすべてのインスタンスで実施することができる。ピクチャが、異なる符号化モードのスライスを有する場合、そのスライス／ピクチャ全体のシンタックス要素は、異なるヘッダ（スライスヘッダなど）から決定できる。

【0179】

【0180】

複雑さを低減するために、パラメータがイントラスライスで送信されるとき、それらの値は、それらの均等なインターシンタックス要素の値によって制約され得る。より正確には、これらの値が複雑さの増加を回避するために制限される。

【0181】

たとえば、スライスヘッダのｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａは、ピクチャヘッダで送信されるｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｅｒ＿ｓｌｉｃｅの値に制限される。より正確には、現在のスライスにおける最小ＱＴサイズ（最小ブロックサイズを与える）の値が、ＰＨにおいて定義された最小ＱＴサイズ値よりも劣る(inferior)ことはない。したがって、ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａは、ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｅｒ＿ｓｌｉｃｅより劣ることはない。

【0182】

この特徴の利点は、デコーダが各ピクチャに対してその複雑なパラメータを設定できることであり、「最悪の場合」の複雑度がピクチャヘッダに設定されるので、新しいスライス毎にこの複雑度を増加させる必要がない。
この制約は、インターパラメーターをスライスヘッダで送信できる場合にも適用できる。

【0183】

符号化ビット数をさらに低減するために、スライスシンタックス要素が、ピクチャヘッダ内のその均等シンタックス要素インター値によって制約される場合、その値は、その均等シンタックス要素インター値によって予測され得る。たとえば、値をデコードでき、ｓｌｉｃｅ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａは、この値＋ｐｉｃ_ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｅｒ＿ｓｌｉｃｅと等しくなる。

【0184】

柔軟性を高めるために、スライスタイプがイントラの場合で、およびオーバーライドフラグがその使用をシグナルしたかどうかにかかわらず、イントラシンタックス要素のセットが、スライスヘッダで送信される。オーバライドフラグは、ＳＰＳまたはＰＰＳレベルでシグナルされる。更に、これらのパラメータのピクチャヘッダの現在のオーバライドフラグとして、スライスヘッダで追加のオーバライドフラグを送信することができる。

【0185】

イントラ／インターのフラグのオーバーライド
イントラまたはインタースライスに対してのみ定義されたピクチャヘッダシンタックス要素は、イントラおよびインターに特有の１以上のオーバライドフラグに依存し復号されてもよい（またはされない）。これにより、不必要なシンタックス要素の復号を回避しながら、柔軟性を高めることができる。テーブル９はこの特徴を示す。

【0186】

このテーブルでは、パーティショニングに関連するシンタックス要素がイントラとインターで別々にグループ化されている。ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ＳＰＳで復号された２つのシンタックス要素ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＿ｉｎｔｅｒ、及び、ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＿ｉｎｔｒａで置き換えられる。

【0187】

ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＿ｉｎｔｒａに基づいて、新しいフラグシンタックス要素ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ＿ｉｎｔｒａが復号され、それが１に設定されている場合、イントラの以下に示すパーティションシンタックス要素が復号されるか、他の制約に従って復号できる：
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｂｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｔｔ＿ｍｉｎ＿ｑｔ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｌｕｍａ
・ｐｉｃ＿ｌｏｇ２＿ｄｉｆｆ＿ｍｉｎ＿ｑｔ＿ｍｉｎ＿ｃｂ＿ｉｎｔｒａ＿ｓｌｉｃｅ＿ｃｈｒｏｍａ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｒａ_ｓｌｉｃｅ_ｃｈｒｏｍａ

【0188】

オーバライドフラグが０に設定されると、ＳＰＳで設定されたデフォルト値がこれらの値の設定に使用される。

【0189】

同様に、関連するオーバーライドフラグがＳＰＳで１に設定されている場合、ｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ＿ｉｎｔｅｒが復号される。このピクチャヘッダシンタックス要素がｔｒｕｅの場合、インターのパーティショニングシンタックス要素が使用される。
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍｉｎ_ｑｔ_ｍｉｎ_ｃｂ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｍａｘ_ｍｔｔ_ｈｉｅｒａｒｃｈｙ_ｄｅｐｔｈ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｂｔ_ｍｉｎ_ｑｔ_ｉｎｔｅｒ_ｓｌｉｃｅ
・ｐｉｃ_ｌｏｇ２_ｄｉｆｆ_ｍａｘ_ｔｔ_ｍｉｎ_ｑｔ_ｉｎｔｅｒ_ｓｌｉｃｅ

【0190】

オーバーライドフラグが０に設定されると、ＳＰＳで設定されたデフォルト値がこれらの値の設定に使用される。

【0191】

同様に、デルタＱＰに関連するシンタックス要素の場合、ｃｕ＿ＱＰ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、イントラ用とインター用の２つのフラグに分離される。ｃｕ＿ＱＰ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＿Ｉｎｔｒａ、ｃｕ＿ＱＰ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＿Ｉｎｔｅｒである。これらのフラグは、ＰＰＳまたはＳＰＳで送信され、ｎｏ＿ｑｐ＿ｄｅｌｔａ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇが０の場合にのみ送信される。

【0192】

ｐｐｓ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｌｉｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、イントラ用とインター用の２つのフラグに分離される。ｐｐｓ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｌｉｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇａｇ＿Ｉｎｔｒａと、ｐｐｓ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｌｉｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＿Ｉｎｔｅｒである。これらのフラグはＰＰＳで送信され、ｐｐｓ＿ｃｕ＿ｃｈｒｏｍａ＿ｑｐ＿ｏｆｆｓｅｔ＿ｌｉｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇを置き換える。

【0193】

動きパラメータに関連するピクチャヘッダシンタックス要素については、ｍｏｔｉｏｎ＿ｐａｒａｍｅｔｅｒｓ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇがＳＰＳで送信される。有効にすると、ｍｏｔｉｏｎ＿ｐａｒａｍｅｔｅｒｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇフラグが復号される。それがｔｒｕｅに等しい場合、これらのパラメータに関連するすべてのシンタックス要素が復号できる。それが偽に等しい場合、これらのパラメータは、それらの対応するＰＰＳまたはＳＰＳ値の値をとる。フラグの場合、値はＳＰＳまたはＰＰＳ値のみにすることができる。例として：
ｐｉｃ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝ｓｐｓ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ
ｍｖｄ＿ｌ１＿ｚｅｒｏ＿ｆｌａｇ＝！ｐｐｓ＿ｍｖｄ＿ｌ１＿ｚｅｒｏ＿ｉｄｃ
ｐｉｃ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝ｓｐｓ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ
ｐｉｃ＿ｄｉｓａｂｌｅ＿ｂｄｏｆ＿ｆｌａｇ＝ｓｐｓ＿ｂｄｏｆ＿ｐｉｃ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ
ｐｉｃ＿ｄｉｓａｂｌｅ＿ｄｍｖｒ＿ｆｌａｇ＝ｓｐｓ＿ｄｍｖｒ＿ｐｉｃ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ
ｐｉｃ＿ｄｉｓａｂｌｅ＿ｐｒｏｆ＿ｆｌａｇ＝ｓｐｓ＿ｐｒｏｆ＿ｐｉｃ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ

【0194】

１つの例では、少なくともデフォルト値をＳＰＳまたはＰＰＳヘッダで送信して、これらのデフォルト値の１つを定義することができる。

【0195】

非フラグ値の場合：たとえば、ＳＰＳまたはＰＰＳで設定された最大値を使用できる。例えば：
ｐｉｃ＿ｓｉｘ＿ｍｉｎｕｓ＿ｎｕｍ＿ｍａｘ＿ｍｅｒｇｅ＿ｃａｎｄとｐｉｃ＿ｍａｘ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄは、それぞれｐｐｓ＿ｓｉｘ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｐｌｕｓ１とｐｐｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄ＿ｐｌｕに依存できる。

【0196】

ＳＰＳレベルでは、ｐｉｃ＿ｆｉｖｅ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｓｕｂｂｌｏｃｋ＿ｍｅｒｇｅ＿ｃａｎｄの定義はないが、デフォルト値は、５－（ＳＰＳ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＆＆ｐｉｃ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）で設定できる。

【0197】

実施形態では、ＳＰＳおよび／またはＰＰＳ値は、このデフォルト値を固定するために送信される。
さらに、この値を設定するために、ＳＰＳまたはＰＰＳヘッダで１つの更なる実施形態固有のパラメータを送信できる。

【0198】

オーバーライドフラグを使用する利点は上述のものと同じであるが、指定されたオーバーライドフラグが真に設定されている場合、イントラパラメータを送信できるため、（フラグの送信とデコードを犠牲にして）より柔軟性がある。

【0199】

テーブル９オーバーライドフラグ付きピクチャヘッダ

【0200】

これらの新しいオーバライドフラグの位置は、修正できることに留意されたい。例えば、インターフラグをイントラフラグの上に移動することができる。これは、より多くのピクチャがインター符号化を使用するので、このフラグがより関連性があり得るので、有益であり得る。

【0201】

同様に、従前のフラグｐａｒｔｉｔｉｏｎ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇが保持され、インターもしくはイントラフラグがチェックすべきかをチェックすることができる。

【0202】

一実施形態では、これらの異なるシンタックス要素の前に２つのオーバーライドフラグが送信される。１つはインター要素がオーバーライドされるかどうかを指定し、１つはイントラ要素がオーバーライドされることを指定する。これらのオーバーライドフラグは、上位レベルでも同じ方法で定義されている可能性がある。先の実施形態と比較して、必要な追加のオーバーライドフラグは少なくなる。

【0203】

オーバーライドフラグとマージされたシンタックス要素
特に興味深い組み合わせは、オーバーライドフラグ（例えば、テーブル９）及びマージされたシンタックス要素（例えば、テーブル６）を使用の組み合わせである。さらに、パラメータのいくつかは、上述したようにピクチャヘッダから除去することができる（例えば、テーブル８）。

【0204】

たとえば、マージ可能なシンタックス要素はマージされる。ｃｕデルタＱＰパラメータは、イントラ及びインタールマに関連するパーティショニングフラグと同様、興味深い。そうでない場合、クロマパーティショニングパラメータが上述のように除去することができ、動きパラメータは１以上のオーバーライドフラグに応じて設定する（または設定しない）ことができる。テーブル１０は、そのような組み合わせの例を示す。

【0205】

テーブル１０特徴の組合せを含むピクチャヘッダ

【0206】

上記の特徴は、互いに組み合わせて提供されてもよいことを理解されたい。上述の特定の組み合わせと同様に、そうすることは、特定の実施に適した特定の利点、例えば、柔軟性の増加、または「最悪の場合」の例の指定を提供することができる。他の例では複雑性要件が（例えば）レート低減よりも高い優先度を有することができ、そのような特徴は個別に実装することができる。

【0207】

発明の実施
図７は、本発明の実施形態による、エンコーダ１５０またはデコーダ１００、および通信ネットワーク１９９のうちの少なくとも１つを備えるシステム１９１１９５を示す。一実施形態によれば、システム１９５は、例えば、デコーダ１００を含むユーザ端末のユーザインターフェースまたはデコーダ１００と通信可能なユーザ端末を介してデコーダ１００にアクセスできるユーザに、コンテンツ（例えば、ビデオ／オーディオコンテンツを表示／出力またはストリーミングするためのビデオおよびオーディオコンテンツ）を処理し提供するためのものである。このようなユーザ端末は、コンピュータ、携帯電話、タブレット、または（提供／ストリーミングされた）コンテンツをユーザに提供／表示することができる任意の他のタイプの装置であってもよい。システム１９５は通信ネットワーク１９９を介して（例えば、以前のビデオ／オーディオが表示／出力されている間に）ビットストリーム１０１を取得／受信する。一実施形態によれば、システム１９１はコンテンツを処理し、処理されたコンテンツ、例えば、後で表示／出力／ストリーミングするために処理されたビデオおよびオーディオコンテンツを記憶するためのものである。システム１９１は、エンコーダ１５０によって受信され処理された（本発明によるデブロッキングフィルタによるフィルタリングを含む）オリジナルの画像シーケンス１５１を含むコンテンツを取得／受信し、エンコーダ１５０は、通信ネットワーク１９１を介してデコーダ１００に通信されるビットストリーム１０１を生成する。次に、ビットストリーム１０１はいくつかの方法でデコーダ１００に通信され、例えば、エンコーダ１５０によって事前に生成され、ユーザが記憶装置からコンテンツ（すなわち、ビットストリームデータ）を要求するまで、通信ネットワーク１９９内の記憶装置（例えば、サーバまたはクラウドストレージ）にデータとして記憶装置に記憶され、その時点で、データが記憶装置からデコーダ１００に通信／ストリーミングされる。また、システム１９１はユーザに（例えば、ユーザ端末上に表示されるユーザインターフェースのためのデータを通信することによって）、記憶装置に記憶されたコンテンツのコンテンツ情報（例えば、コンテンツのタイトルや、コンテンツを識別、選択、要求するためのその他のメタ／記憶位置データ）を提供／ストリーミングし、要求されたコンテンツを記憶装置からユーザ端末に配信／ストリーミングできるように、コンテンツに対するユーザ要求を受信して処理するためのコンテンツ提供装置を備えてもよい。あるいは、エンコーダ１５０が、ユーザがコンテンツを要求するときに、ビットストリーム１０１を生成し、それをデコーダ１００に直接通信／ストリーミングする。次いで、デコーダ１００はビットストリーム１０１（または信号）を受信し、本発明によるデブロッキングフィルタでフィルタリングを実行してビデオ信号１０９および／またはオーディオ信号を取得／生成し、要求されたコンテンツをユーザに提供するために、これをユーザ端末が使用される。

【0208】

本発明による方法／プロセスの任意のステップまたは本明細書で説明される機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、ステップ／機能は、１つまたは複数の命令もしくはコードもしくはプログラム、またはコンピュータ可読媒体として格納または送信され、ＰＣ（“パーソナルコンピュータ”）、ＤＳＰ（“デジタル信号プロセッサ”）、回路、回路、プロセッサおよびメモリ、汎用マイクロプロセッサまたは中央演算処理装置、マイクロコントローラ、ＡＳＩＣ（“特定用途向け集積回路”）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の同等の集積または個別論理回路であり得る、プログラマブルコンピューティングマシンなどの１つまたは複数のハードウェアベースの処理ユニットによって実行され得る。したがって、本明細書で使用される“プロセッサ”という用語は、前述の構造のいずれか、または本明細書で説明される技法の実装に適した他の任意の構造を指すことがある。

【0209】

本発明の実施形態はワイヤレスハンドセット、集積回路（ＩＣ）、またはＪＣのセット（例えば、チップセット）を含む多種多様なデバイスまたは装置によって実現することもでき、本明細書では様々な構成要素、モジュール、またはユニットを、それらの実施形態を実行するように構成されたデバイス／装置の機能態様を示すために説明するが、必ずしも異なるハードウェアユニットによる実現を必要としない。むしろ、種々モジュール／ユニットは、コーデックハードウェアユニットで結合されてもよく、または適切なソフトウェア／ファームウェアと共に１つ以上のプロセッサを含む相互運用ハードウェアユニットの集合によって提供されてもよい。

【0210】

本発明の実施形態は上述の実施形態のうちの１つ以上のモジュール／ユニット／機能を実行するために記憶媒体に記録されたコンピュータ実行可能命令（例えば、１つ以上のプログラム）を読み出して実行し、及び／又は上述の実施形態のうちの１つ以上の機能を実行するための１つ以上の処理部又は回路を含むシステム又は装置のコンピュータによって、及び、例えば、上述の実施形態のうちの１つ以上の機能を実行するために記憶媒体からコンピュータ実行可能命令を読み出して実行し、及び／又は上述の実施形態のうちの１つ以上の機能を実行するために１つ以上の処理部又は回路を制御することによって、システム又は装置のコンピュータによって実行される方法によって実現することができる。コンピュータはコンピュータ実行可能命令を読み出して実行するために、別個のコンピュータまたは別個の処理ユニットのネットワークを含んでもよい。コンピュータ実行可能命令は例えば、ネットワークまたは実体のある記憶媒体を介して通信媒体のようなコンピュータ可読媒体からコンピュータに提供されてもよい。通信媒体は、信号／ビットストリーム／搬送波であってもよい。有形記憶媒体は例えば、ハードディスク、ランダムアクセスメモリ、リード・オンリー・メモリ、分散コンピューティング・システムの記憶装置、光ディスク（コンパクト・ディスク（ＣＤ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、またはBlu-ray Disc(BD)^TMなど）、フラッシュ・メモリ・デバイス、メモリ・カードなどの１つ以上を含み得る「非一時的なコンピュータ読み取り可能な記憶媒体」である。ステップ／機能のうちの少なくともいくつかは、マシーン、またはＦＰＧＡ（「フィールドプログラマブルゲートアレイ」）またはＡＳＩＣ（「特定用途向け集積回路」）などの専用構成要素によってハードウェアで実装することもできる。

【0211】

図８は、本発明の１つまたは複数の実施形態を実施するためのコンピューティングデバイス１３００の概略ブロック図である。コンピューティングデバイス１３００は、マイクロコンピュータ、ワークステーション、またはライトポータブルデバイスなどのデバイスとすることができる。コンピューティングデバイス１３００は、マイクロプロセッサなどの中央処理装置（ＣＰＵ）１３０１と、本発明の実施形態による画像の少なくとも一部を符号化または復号するための方法を実施するために必要な変数およびパラメータを記録するように適合されたレジスタだけでなく、本発明の実施形態の方法の実行可能コードを記憶するためのランダムアクセスメモリ（ＲＡＭ）１３０２と、ここで、このメモリ容量は例えば拡張ポートにオプションのＲＡＭを接続することで拡張できる；本発明の実施形態を実施するためのコンピュータプログラムを記憶するための読み出し専用メモリ（ＲＯＭ）１３０３と、処理対象のデジタルデータが送信または受信される通信ネットワークに接続されるネットワークインターフェース（ＮＥＴ）１３０４を有する。ネットワークインターフェース（ＮＥＴ）１３０４は、単一のネットワークインターフェースであってもよいし、異なるネットワークインターフェースのセット（例えば、有線および無線インターフェース、または異なる種類の有線または無線インターフェース）で構成されてもよい。データパケットは送信のためにネットワークインターフェースに書き込まれるか、またはＣＰＵ１３０１内で実行されるソフトウェアアプリケーションの制御の下で受信のためにネットワークインターフェースから読み出される。ユーザインターフェース（ＵＩ）１３０５はユーザからの入力を受信するため、またはユーザに情報を表示するために使用されてもよい。大容量記憶装置として、ハードディスク（ＨＤ）１３０６が設けられてもよい。入出力モジュール（ＩＯ）１３０７はビデオソースまたはディスプレイなどの外部装置との間でデータを送受信するために使用されてもよい。実行可能コードは、ＲＯＭ１３０３、ＨＤ１３０６、または例えばディスクのようなリムーバブルデジタル媒体のいずれかに格納することができる。変形例によれば、プログラムの実行可能コードは、実行される前に、ＨＤ１３０６などの通信装置１３００の記憶手段の１つに記憶されるために、ＮＥＴ１３０４を介して、通信ネットワークの手段によって受信することができる。ＣＰＵ１３０１は前述の記憶手段の１つに格納された本発明の実施形態によるプログラムまたはプログラム群のソフトウェアコードの命令または部分の実行を制御し、指示するように適合される。電源投入後、ＣＰＵ１３０１は例えば、プログラムＲＯＭ１３０３またはＨＤ１３０６からそれらの命令がロードされた後に、ソフトウェアアプリケーションに関するメインＲＡＭメモリ１３０２からの命令を実行することができる。このようなソフトウェアアプリケーションは、ＣＰＵ１３０１によって実行されると、本発明による方法のステップを実行させる。

【0212】

また、本発明の他の実施形態によれば、コンピュータ、携帯電話（セルラフォン）、テーブル、またはユーザにコンテンツを提供／表示することができる他の任意のタイプのデバイス（例えば、ディスプレイ装置）などのユーザ端末に、前述の実施形態によるデコーダが提供されることも理解される。さらに別の実施形態によれば、前述の実施形態によるエンコーダは、エンコーダがエンコードするためのコンテンツをキャプチャし、提供するカメラ、デジタルビデオカメラ、またはネットワークカメラ（例えば、閉回路テレビまたはビデオ監視カメラ）も備える撮像装置において提供される。２つのこのような例を、図９および１０を参照して以下に提供する。

【0213】

ネットワークカメラ
図９は、ネットワークカメラ２１０２及びクライアント装置２１０４を含むネットワークカメラシステム２１００を示す図である。

【0214】

ネットワークカメラ２１０２は、撮像部２１０６と、符号化部２１０８と、通信ユニット２１１０と、制御部２１１２とを有している。

【0215】

ネットワークカメラ２１０２とクライアント装置２１０４とは、ネットワーク２００を介して相互に通信可能に接続されている。

【0216】

撮像ユニット２１０６はレンズおよび画像センサ（例えば、電荷結合素子（ＣＣＤ）または相補型金属酸化膜半導体（ＣＭＯＳ））を含み、被写体の画像を撮像し、その画像に基づいて画像データを生成する。この画像は静止画像であってもよいし、ビデオ画像であってもよい。

【0217】

符号化部２１０８は、上述した符号化方法を用いて画像データを符号化する。

【0218】

ネットワークカメラ２１０２の通信ユニット２１１０は、符号化部２１０８で符号化された符号化画像データをクライアント装置２１０４に送信する。

【0219】

また、通信ユニット２１１０は、クライアント装置２１０４からのコマンドを受信する。コマンドは、符号化ユニット２１０８の符号化のためのパラメータを設定するコマンドを含む。

【0220】

制御部２１１２は、通信ユニット２１１０が受信したコマンドに従って、ネットワークカメラ２１０２内の各部を制御する。

【0221】

クライアント装置２１０４は、通信ユニット２１１４と、復号部２１１６と、制御部２１１８とを有する。

【0222】

クライアント装置２１０４の通信ユニット２１１４は、ネットワークカメラ２１０２にコマンドを送信する。

【0223】

また、クライアント装置２１０４の通信ユニット２１１４は、ネットワークカメラ２１０２から符号化画像データを受信する。

【0224】

復号部２１１６は、上述した復号方法を用いて符号化画像データを復号する。

【0225】

クライアント装置２１０４の制御部２１１８は、ユーザ操作や、通信ユニット２１１４が受信したコマンドに従って、クライアントユニット２１０４内の他の部を制御する。

【0226】

クライアント装置２１０４の制御部２１１８は、復号部２１１６で復号された画像を表示するように表示装置２１２０を制御する。

【0227】

また、クライアント装置２１０４の制御部２１１８は、符号化部２１０８の符号化のためのパラメータを含むネットワークカメラ２１０２のパラメータの値を指定するＧＵＩ(Graphical User Interface)を表示するように表示装置２１２０を制御する。

【0228】

また、クライアントユニット２１０４の制御部２１１８は、表示装置２１２０で表示されたＧＵＩに対するユーザ操作入力に応じて、クライアントユニット２１０４内の他の部を制御する。

【0229】

クライアント装置２１０４の制御部２１１９は、表示装置２１２０が表示するＧＵＩに対するユーザ操作入力に応じて、ネットワークカメラ２１０２のパラメータの値を指定するコマンドをネットワークカメラ２１０２に送信するように、クライアント装置２１０４の通信ユニット２１１４を制御する。

【0230】

スマートフォン
図１０は、スマートフォン２２００を示す図である。
スマートフォン２２００は、通信ユニット２２０２、復号部２２０４、制御部２２０６、表示部２２０８、画像記録装置２２１０及びセンサ２２１２を備える。

【0231】

通信ユニット２２０２は、ネットワーク２００を介して符号化画像データを受信する。復号部２２０４は、通信ユニット２２０２が受信した符号化画像データを復号する。
復号部２２０４は、上述した復号方法を用いて符号化画像データを復号する。

【0232】

制御部２２０６は、ユーザ操作や通信ユニット２２０２が受信したコマンドに応じて、スマートフォン２２００内の他の部を制御する。
例えば、制御部２２０６は、復号部２２０４により復号された画像を表示するように表示部２２０８を制御する。

【0233】

本発明を実施形態を参照して説明してきたが、本発明は開示された実施形態に限定されないことを理解されたい。添付の特許請求の範囲に定義されるように、本発明の範囲から逸脱することなく、様々な変更および修正を行うことができることは、当業者には理解されよう。本明細書（任意の添付の特許請求の範囲、要約書、および図面を含む）に開示された特徴のすべて、および／またはそのように開示された任意の方法またはプロセスのステップのすべては、そのような特徴および／またはステップの少なくともいくつかが相互に排他的である組合せを除いて、任意の組合せで組み合わせることができる。本明細書（任意の添付の特許請求の範囲、要約書、および図面を含む）に開示される各特徴は特に断らない限り、同じ、同等の、または同様の目的を果たす代替の特徴によって置き換えることができる。したがって、特に断らない限り、開示される各特徴は、同等または同様の機能の一般的なシリーズの一例にすぎない。

【0234】

また、上述の比較、判定、評価、選択、実行、実行、または考慮の任意の結果、例えば、符号化またはフィルタリングプロセス中に行われる選択はビットストリーム内のデータ、例えば、結果を示すフラグまたはデータに示されるか、またはそれらから決定可能／推論可能であり得、その結果、示されるか、または決定された／推論された結果は例えば、デコード処理中に、比較、判定、評価、選択、実行、実行、または考慮を実際に実行する代わりに、処理において使用され得ることが理解される。

【0235】

特許請求の範囲において、単語「有する」は他の要素又はステップを排除するものではなく、不定冠詞「ａ」又は「ａｎ」は複数を排除するものではない。異なる特徴が相互に異なる従属請求項に記載されているという単なる事実は、これらの特徴の組合せが有利に使用されることができないことを示すものではない。

【0236】

クレームに記載されている参照符号は例示のみを目的としたものであり、クレームの範囲に限定的な影響を及ぼさない。

【図1】