IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テンセント・アメリカ・エルエルシーの特許一覧

特表2022-524106ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム
<>
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図1
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図2
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図3
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図4
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図5
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図6
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図7
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図8
  • 特表-ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-04-27
(54)【発明の名称】ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム
(51)【国際特許分類】
   H04N 19/70 20140101AFI20220420BHJP
   H04N 19/96 20140101ALI20220420BHJP
【FI】
H04N19/70
H04N19/96
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021553106
(86)(22)【出願日】2020-09-23
(85)【翻訳文提出日】2021-09-07
(86)【国際出願番号】 US2020052198
(87)【国際公開番号】W WO2021061758
(87)【国際公開日】2021-04-01
(31)【優先権主張番号】62/907,344
(32)【優先日】2019-09-27
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/026,967
(32)【優先日】2020-09-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520353802
【氏名又は名称】テンセント・アメリカ・エルエルシー
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【弁理士】
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】ビョンドゥ・チェ
(72)【発明者】
【氏名】ステファン・ヴェンガー
(72)【発明者】
【氏名】シャン・リュウ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LC09
5C159MA04
5C159MA05
5C159MA21
5C159MC11
5C159ME01
5C159RB09
5C159RC12
5C159UA02
5C159UA05
5C159UA16
(57)【要約】
ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法は、少なくとも1つのプロセッサによって実行され、符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、符号化ピクチャのピクチャサイズおよび分割情報がSPSに含まれているかどうかを示すフラグを取得するステップと、取得されたフラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定するステップとを含む。本方法は、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSからピクチャサイズおよび分割情報を取得するステップと、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、VPSに含まれているピクチャサイズおよび分割情報を取得するステップとをさらに含む。
【特許請求の範囲】
【請求項1】
ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法であって、前記方法は、少なくとも1つのプロセッサによって実行され、前記方法は、
符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、前記符号化ピクチャの前記ピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示すフラグを取得するステップと、
前記取得されたフラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定するステップと、
前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得するステップと、
前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、前記VPSに含まれている前記ピクチャサイズおよび分割情報を取得するステップと
を含む、方法。
【請求項2】
前記SPSから、前記SPSに含まれている前記ピクチャサイズおよび分割情報の数を取得するステップと、
インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記取得された数以下であるかどうかを判定するステップと
をさらに含む、請求項1に記載の方法。
【請求項3】
前記インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記数以下であると決定されたことに基づいて、前記インデックスをインクリメントするステップと、
前記SPSから、追加のピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示す他のフラグを取得するステップであって、前記他のフラグは前記インクリメントされたインデックスに対応する、ステップと、
前記取得された他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定するステップと、
前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記追加のピクチャサイズおよび分割情報を取得するステップと、
前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、前記VPSから、前記VPSに含まれている前記追加のピクチャサイズおよび分割情報を取得するステップと
をさらに含む、請求項2に記載の方法。
【請求項4】
前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すインデックスを取得するステップと、
取得された前記インデックスに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得するステップと
をさらに含む、請求項1に記載の方法。
【請求項5】
前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されているかどうかを示す他のフラグを取得するステップと、
前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すかどうかを判定するステップと、
前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すと決定されたことに基づいて、前記PPSから前記更新されたピクチャサイズおよび分割情報を取得するステップと
をさらに含む、請求項1に記載の方法。
【請求項6】
前記更新されたピクチャサイズおよび分割情報は、更新された、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項5に記載の方法。
【請求項7】
前記ピクチャサイズおよび分割情報は、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項1に記載の方法。
【請求項8】
ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための装置であって、前記装置は、
コンピュータプログラムコードを記憶するように構成された少なくとも1つのメモリと、
前記少なくとも1つのメモリにアクセスし、前記コンピュータプログラムコードに従って動作するように構成された少なくとも1つのプロセッサと
を備え、前記コンピュータプログラムコードは、
前記少なくとも1つのプロセッサに、符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、前記符号化ピクチャの前記ピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示すフラグを取得させるように構成された第1の取得コードと、
前記少なくとも1つのプロセッサに、前記取得されたフラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定させるように構成された第1の判定コードと、
前記少なくとも1つのプロセッサに、前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得させるように構成された第2の取得コードと、
前記少なくとも1つのプロセッサに、前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、前記VPSに含まれている前記ピクチャサイズおよび分割情報を取得させるように構成された第3の取得コードと
を含む、装置。
【請求項9】
前記少なくとも1つのプロセッサに、前記SPSから、前記SPSに含まれている前記ピクチャサイズおよび分割情報の数を取得させるように構成された第4の取得コードと、
前記少なくとも1つのプロセッサに、インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記取得された数以下であるかどうかを判定させるように構成された第2の判定コードと
をさらに含む、請求項8に記載の装置。
【請求項10】
前記少なくとも1つのプロセッサに、前記インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記数以下であると決定されたことに基づいて、前記インデックスをインクリメントさせるように構成されたインクリメントコードをさらに含み、
前記第1の取得コードは、前記少なくとも1つのプロセッサに、前記SPSから、追加のピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示す他のフラグを取得させるようにさらに構成されており、前記他のフラグは、前記インクリメントされたインデックスに対応し、
前記第1の判定コードは、前記少なくとも1つのプロセッサに、前記取得された他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定させるようにさらに構成されており、
前記第2の取得コードは、前記少なくとも1つのプロセッサに、前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記追加のピクチャサイズおよび分割情報を取得させるようにさらに構成されており、
前記第3の取得コードは、前記少なくとも1つのプロセッサに、前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、前記VPSから、前記VPSに含まれている前記追加のピクチャサイズおよび分割情報を取得させるようにさらに構成されている、
請求項9に記載の装置。
【請求項11】
前記少なくとも1つのプロセッサに、前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すインデックスを取得させるように構成された第4の取得コードと、
前記少なくとも1つのプロセッサに、取得された前記インデックスに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得させるように構成された第5の取得コードと
をさらに含む、請求項8に記載の装置。
【請求項12】
前記少なくとも1つのプロセッサに、前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されているかどうかを示す他のフラグを取得させるように構成された第4の取得コードと、
前記少なくとも1つのプロセッサに、前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すかどうかを判定させるように構成された第2の判定コードと、
前記少なくとも1つのプロセッサに、前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すと決定されたことに基づいて、前記PPSから前記更新されたピクチャサイズおよび分割情報を取得させるように構成された第5の取得コードと
をさらに含む、請求項8に記載の装置。
【請求項13】
前記更新されたピクチャサイズおよび分割情報は、更新された、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項12に記載の装置。
【請求項14】
前記ピクチャサイズおよび分割情報は、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項8に記載の装置。
【請求項15】
命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令は、少なくとも1つのプロセッサに、
符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、前記符号化ピクチャの前記ピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示すフラグを取得させ、
前記取得されたフラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定させ、
前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得させ、
前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、前記VPSに含まれている前記ピクチャサイズおよび分割情報を取得させる、非一時的コンピュータ可読記憶媒体。
【請求項16】
前記命令はさらに、前記少なくとも1つのプロセッサに、
前記SPSから、前記SPSに含まれている前記ピクチャサイズおよび分割情報の数を取得させ、
インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記取得された数以下であるかどうかを判定させる、請求項15に記載の非一時的コンピュータ可読記憶媒体。
【請求項17】
前記命令はさらに、前記少なくとも1つのプロセッサに、
前記インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記数以下であると決定されたことに基づいて、前記インデックスをインクリメントさせ、
前記SPSから、追加のピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示す他のフラグを取得させ、前記他のフラグは前記インクリメントされたインデックスに対応し、
前記取得された他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定させ、
前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記追加のピクチャサイズおよび分割情報を取得させ、
前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、前記VPSから、前記VPSに含まれている前記追加のピクチャサイズおよび分割情報を取得させる、請求項16に記載の非一時的コンピュータ可読記憶媒体。
【請求項18】
前記命令はさらに、前記少なくとも1つのプロセッサに、
前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すインデックスを取得させ、
取得された前記インデックスに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得させる、請求項15に記載の非一時的コンピュータ可読記憶媒体。
【請求項19】
前記命令はさらに、前記少なくとも1つのプロセッサに、
前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されているかどうかを示す他のフラグを取得させ、
前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すかどうかを判定させ、
前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すと決定されたことに基づいて、前記PPSから前記更新されたピクチャサイズおよび分割情報を取得させる、請求項15に記載の非一時的コンピュータ可読記憶媒体。
【請求項20】
前記ピクチャサイズおよび分割情報は、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項15に記載の非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2019年9月27日に出願された米国仮特許出願第62/907,344号および2020年9月21日に出願された米国特許出願第17/026,967号に基づく優先権を主張し、それらの全体は本明細書に組み込まれる。
【0002】
実施形態と矛盾のない方法および装置は、ビデオコーディングに関し、より詳細には、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法および装置に関する。
【背景技術】
【0003】
ブロックベースのハイブリッドビデオコーディングでは、各ピクチャは、サンプルのブロックに分割され、ピクチャ内の複数のブロックは、独立して復号可能なエンティティとしてスライスを形成するように集約される。ブロックベースのビデオコーディングの場合、ピクチャは、いくつかのブロックに分割されえ、これらは、コーディングツリーユニット(CTU:coding tree unit)、コーディングユニット(CU:coding unit)、および/またはコーディングブロック(CB:coding block)とも呼ばれうる。
【0004】
図1は、高効率ビデオコーディング(HEVC:High Efficiency Video Coding)の分割構造の一例を示す。HEVCは、大小のコーディング、予測、および変換ブロックの柔軟な使用を可能にする4分木符号化ブロック分割構造を採用している。
【0005】
多用途ビデオコーディング(VVC:Versatile Video Coding)では、ピクチャサイズ、サブピクチャ分割情報、タイル分割情報、矩形スライス分割情報、および適合ウィンドウオフセット(conformance window offset)を指定するシンタックス要素のセットが、パラメータセット内で繰り返しシグナリングされる。
【発明の概要】
【課題を解決するための手段】
【0006】
実施形態によれば、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法は、少なくとも1つのプロセッサによって実行され、符号化ピクチャが参照するシーケンスパラメータセット(SPS:sequence parameter set)から、符号化ピクチャのピクチャサイズおよび分割情報がSPSに含まれているかどうかを示すフラグを取得するステップと、取得されたフラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定するステップとを含む。本方法は、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSからピクチャサイズおよび分割情報を取得するステップと、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS:video parameter set)から、VPSに含まれているピクチャサイズおよび分割情報を取得するステップとをさらに含む。
【0007】
ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための装置は、コンピュータプログラムコードを記憶するように構成された少なくとも1つのメモリと、少なくとも1つのメモリにアクセスし、コンピュータプログラムコードに従って動作するように構成された少なくとも1つのプロセッサとを含む。コンピュータプログラムコードは、少なくとも1つのプロセッサに、符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、符号化ピクチャのピクチャサイズおよび分割情報がSPSに含まれているかどうかを示すフラグを取得させるように構成された第1の取得コードと、少なくとも1つのプロセッサに、取得されたフラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定させるように構成された第1の判定コードとを含む。コンピュータプログラムコードは、少なくとも1つのプロセッサに、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSからピクチャサイズおよび分割情報を取得させるように構成された第2の取得コードと、少なくとも1つのプロセッサに、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、VPSに含まれているピクチャサイズおよび分割情報を取得させるように構成された第3の取得コードとをさらに含む。
【0008】
命令を記憶する非一時的コンピュータ可読記憶媒体であって、命令は、少なくとも1つのプロセッサに、符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、符号化ピクチャのピクチャサイズおよび分割情報がSPSに含まれているかどうかを示すフラグを取得させ、取得されたフラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定させる、非一時的コンピュータ可読記憶媒体。命令はさらに、少なくとも1つのプロセッサに、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSからピクチャサイズおよび分割情報を取得させ、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、VPSに含まれているピクチャサイズおよび分割情報を取得させる。
【図面の簡単な説明】
【0009】
図1】HEVCの分割構造の図である。
図2】実施形態による通信システムの簡略ブロック図である。
図3】実施形態による、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置の図である。
図4】実施形態によるビデオデコーダの機能ブロック図である。
図5】実施形態によるビデオエンコーダの機能ブロック図である。
図6】実施形態による、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法を示すフローチャートである。
図7】実施形態による、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法を示すフローチャートである。
図8】実施形態による、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための装置の簡略ブロック図である。
図9】実施形態を実装するのに適したコンピュータシステムの図である。
【発明を実施するための形態】
【0010】
図2は、実施形態による通信システム(200)の簡略ブロック図である。通信システム(200)は、ネットワーク(250)を介して相互接続される少なくとも2つの端末(210~220)を含みうる。データの一方向送信の場合、第1の端末(210)は、ネットワーク(250)を介して他方の端末(220)に送信するためにローカル位置でビデオデータを符号化しうる。第2の端末(220)は、ネットワーク(250)から他方の端末の符号化ビデオデータを受信し、符号化データを復号し、復元されたビデオデータを表示しうる。一方向のデータ送信は、メディアサービングアプリケーションなどにおいて一般的でありうる。
【0011】
図2は、例えばビデオ会議中に発生しうる符号化ビデオの双方向送信をサポートするために提供される第2の対の端末(230、240)を示す。データの双方向送信の場合、各端末(230、240)は、ネットワーク(250)を介して他方の端末に送信するためにローカル位置でキャプチャされたビデオデータを符号化しうる。各端末(230、240)はまた、他方の端末によって送信された符号化ビデオデータを受信し、符号化データを復号しえ、復元されたビデオデータをローカルディスプレイデバイスに表示しうる。
【0012】
図2では、端末(210~240)は、サーバ、パーソナルコンピュータ、およびスマートフォンとして示されているが、実施形態の原理はそのように限定されない。実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤ、および/または専用ビデオ会議機器に適用される。ネットワーク(250)は、例えば有線および/または無線通信ネットワークを含む、端末(210~240)間で符号化ビデオデータを伝送する任意の数のネットワークを表す。通信ネットワーク(250)は、回路交換チャネルおよび/またはパケット交換チャネルでデータを交換しうる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、および/またはインターネットを含む。ここでの検討の目的においては、ネットワーク(250)のアーキテクチャおよびトポロジは、本明細書で以下に説明されない限り、実施形態の動作にとって重要ではないことがある。
【0013】
図3は、実施形態による、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置の図である。開示されている主題は、例えばビデオ会議、デジタルTV、ならびにCD、DVD、およびメモリスティックなどを含むデジタル媒体への圧縮ビデオの記憶などを含む、他のビデオ対応用途にも等しく適用可能でありうる。
【0014】
ストリーミングシステムは、例えば非圧縮ビデオサンプルストリーム(302)を作成するビデオソース(301)、例えばデジタルカメラを含みうるキャプチャサブシステム(313)を含みうる。符号化ビデオビットストリームと比較して高いデータ量を強調するために太線として示されているそのサンプルストリーム(302)は、カメラ(301)に結合されたエンコーダ(303)によって処理されうる。エンコーダ(303)は、以下により詳細に説明するように、開示されている主題の態様を可能にするまたは実装するために、ハードウェア、ソフトウェア、またはそれらの組み合わせを含みうる。符号化ビデオビットストリーム(304)は、サンプルストリームと比較してより低いデータ量を強調するために細い線として示されており、将来の使用のためにストリーミングサーバ(305)に記憶されうる。1つ以上のストリーミングクライアント(306、308)は、符号化ビデオビットストリーム(304)のコピー(307、309)を検索するためにストリーミングサーバ(305)にアクセスしうる。クライアント(306)は、符号化ビデオビットストリームの入ってくるコピー(307)を復号し、ディスプレイ(312)または他のレンダリングデバイス(図示せず)上にレンダリングされうる出ていくビデオサンプルストリーム(311)を作成するビデオデコーダ(310)を含みうる。一部のストリーミングシステムでは、ビデオビットストリーム(304、307、309)は、特定のビデオコーディング/圧縮規格に従って符号化されうる。それらの規格の例は、ITU-T勧告H.265を含む。VVCとして非公式に知られているビデオコーディング規格が開発中である。開示されている主題は、VVCの文脈で使用されうる。
【0015】
図4は、実施形態によるビデオデコーダ(310)の機能ブロック図である。
【0016】
受信器(410)は、デコーダ(310)によって復号されるべき1つ以上のコーデックビデオシーケンスを受信しえ、同じまたは複数の実施形態において、一度に1つの符号化ビデオシーケンスを受信しえ、各符号化ビデオシーケンスの復号は、他の符号化ビデオシーケンスから独立している。符号化ビデオシーケンスは、符号化ビデオデータを記憶する記憶デバイスへのハードウェア/ソフトウェアリンクでありうるチャネル(412)から受信されうる。受信器(410)は、エンティティ(図示せず)を使用してそれぞれに転送されうる他のデータ、例えば、符号化された音声データおよび/または補助データストリームと共に符号化ビデオデータを受信しうる。受信器(410)は、符号化ビデオシーケンスを他のデータから分離しうる。ネットワークジッタに対抗するために、バッファメモリ(415)が、受信器(410)とエントロピーデコーダ/パーサ(420)(以下「パーサ」)との間に結合されうる。受信器(410)が十分な帯域幅および制御可能性の記憶/転送デバイスから、またはアイソクロナスネットワークからデータを受信する場合、バッファ(415)は必要とされないかもしれないか、または小さくてもよい。インターネットなどのベストエフォートパケットネットワークでの使用のために、バッファ(415)は必要とされる場合があり、比較的大きくされえ、好適には適応サイズにされうる。
【0017】
ビデオデコーダ(310)は、エントロピー符号化ビデオシーケンスからシンボル(421)を再構成するためのパーサ(420)を含みうる。これらのシンボルのカテゴリは、デコーダ(310)の動作を管理するために使用される情報、および場合によっては、図4に示されたように、デコーダの一体部分ではないがそれに結合されうるディスプレイ(312)などのレンダリングデバイスを制御するための情報を含む。レンダリングデバイスの制御情報は、補足拡張情報(SEI(Supplementary Enhancement Information)メッセージ)またはビデオユーザビリティ情報(VUI:Video Usability Information)パラメータセットフラグメント(図示せず)の形態でありうる。パーサ(420)は、受信した符号化ビデオシーケンスを解析/エントロピー復号しうる。符号化ビデオシーケンスの符号化は、ビデオコーディング技術または規格に従い、コンテキスト感度の有無にかかわらず可変長符号化、ハフマン符号化、および算術符号化などを含む、当業者に周知の原理に従いうる。パーサ(420)は、ビデオデコーダにおいて、グループに対応する少なくとも1つのパラメータに基づいて、符号化ビデオシーケンスから、画素のサブグループのうちの少なくとも1つに関するサブグループパラメータのセットを抽出しうる。サブグループは、グループオブピクチャ(GOP:Group of Picture)、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット(CU)、ブロック、変換ユニット(TU:Transform Unit)、および予測ユニット(PU:Prediction Unit)などを含みうる。エントロピーデコーダ/パーサはまた、符号化ビデオシーケンスから、変換係数、量子化器パラメータ(QP:quantizer parameter)値、および動きベクトルなどの情報を抽出しうる。
【0018】
パーサ(420)は、シンボル(421)を作成するために、バッファ(415)から受信したビデオシーケンスに対してエントロピー復号/解析動作を実行しうる。パーサ(420)は、符号化データを受信し、特定のシンボル(421)を選択的に復号しうる。さらに、パーサ(420)は、特定のシンボル(421)が動き補償予測ユニット(453)、スケーラ/逆変換ユニット(451)、イントラ予測ユニット(452)、またはループフィルタユニット(454)のいずれに提供されるべきかを判定しうる。
【0019】
シンボル(421)の再構成は、符号化ビデオピクチャまたはその一部(インターピクチャおよびイントラピクチャ、インターブロックおよびイントラブロックなど)のタイプならびに他の要因に応じて複数の異なるユニットを要しうる。どのユニットをどのように関与させるかは、パーサ(420)によって符号化ビデオシーケンスから解析されたサブグループ制御情報によって制御されうる。パーサ(420)と以下の複数のユニットとの間のそのようなサブグループ制御情報のフローは、明確にするために示されていない。
【0020】
既に述べた機能ブロックを超えて、デコーダ(310)は、以下に説明するように概念的にいくつかの機能ユニットに細分化されうる。商業的制約の下で動作する実際の実装では、これらのユニットの多くは互いに密接に相互作用し、少なくとも部分的に互いに一体化されうる。しかしながら、開示されている主題を説明する目的のためには、以下の機能ユニットへの概念的な細分化が適切である。
【0021】
第1のユニットはスケーラ/逆変換ユニット(451)である。スケーラ/逆変換ユニット(451)は、パーサ(420)からのシンボル(421)として、量子化変換係数と、どの変換を使用するか、ブロックサイズ、量子化係数、量子化スケーリング行列などを含む制御情報とを受信する。それは、アグリゲータ(455)に入力されうるサンプル値を含むブロックを出力しうる。
【0022】
場合によっては、スケーラ/逆変換(451)の出力サンプルは、イントラ符号化ブロック、すなわち、以前に再構成されたピクチャからの予測情報を使用しないが、現在のピクチャの以前に再構成された部分からの予測情報を使用しうるブロックに関連しうる。そのような予測情報は、イントラピクチャ予測ユニット(452)によって提供されうる。場合によっては、イントラピクチャ予測ユニット(452)は、現在の(部分的に再構成された)ピクチャ(456)からフェッチされた周囲の既に再構成された情報を使用して、再構成中のブロックと同じサイズおよび形状のブロックを生成する。アグリゲータ(455)は、場合によっては、サンプルごとに、イントラ予測ユニット(452)が生成した予測情報を、スケーラ/逆変換ユニット(451)によって提供される出力サンプル情報に追加する。
【0023】
他の場合には、スケーラ/逆変換ユニット(451)の出力サンプルは、インター符号化された、場合によっては動き補償されたブロックに関連しうる。そのような場合、動き補償予測ユニット(453)は、予測に使用されるサンプルをフェッチするために参照ピクチャメモリ(457)にアクセスしうる。ブロックに関連するシンボル(421)に従ってフェッチされたサンプルを動き補償した後、これらのサンプル(この場合、残差サンプルまたは残差信号と呼ばれる)は、出力サンプル情報を生成するために、アグリゲータ(455)によってスケーラ/逆変換ユニットの出力に追加されうる。動き補償ユニットが予測サンプルをフェッチする、参照ピクチャメモリ形式内のアドレスは、例えばX、Y、および参照ピクチャ成分を有しうるシンボル(421)の形式で動き補償ユニットに利用可能な動きベクトルによって制御されうる。動き補償はまた、サブサンプルの正確な動きベクトルが使用されているときに参照ピクチャメモリからフェッチされたサンプル値の補間、および動きベクトル予測メカニズムなどを含みうる。
【0024】
アグリゲータ(455)の出力サンプルは、ループフィルタユニット(454)で様々なループフィルタリング技術を受けうる。ビデオ圧縮技術は、符号化ビデオビットストリームに含まれる、パーサ(420)からのシンボル(421)としてループフィルタユニット(454)に利用可能なパラメータによって制御されるループ内フィルタ技術であって、さらに、符号化ピクチャまたは符号化ビデオシーケンスの(復号順で)以前の部分の復号中に取得されたメタ情報に応答しえ、以前に再構成され、ループフィルタリングされたサンプル値に応答しうるループ内フィルタ技術を含みうる。
【0025】
ループフィルタユニット(454)の出力は、レンダリングデバイス(312)に出力されうるとともに、将来のピクチャ間予測に使用するために参照ピクチャメモリ(456)に記憶されうるサンプルストリームでありうる。
【0026】
いくつかの符号化ピクチャは、完全に再構成されると、将来の予測のための参照ピクチャとして使用されうる。符号化ピクチャが完全に再構成され、符号化ピクチャが(例えば、パーサ(420)によって)参照ピクチャとして識別されると、現在の参照ピクチャ(456)は、参照ピクチャバッファ(457)の一部になりえ、新しい現在のピクチャメモリは、後続の符号化ピクチャの再構成を開始する前に再割り当てされうる。
【0027】
ビデオデコーダ(310)は、ITU-T Rec.H.265などの規格で文書化されるであろう所定のビデオ圧縮技術に従って復号動作を実行しうる。符号化ビデオシーケンスは、ビデオ圧縮技術文書または規格で、特にその中のプロファイル文書で指定される、ビデオ圧縮技術または規格のシンタックスに準拠するという意味で、使用されているビデオ圧縮技術または規格で指定されるシンタックスに準拠しうる。また、順守のために必要なのは、符号化ビデオシーケンスの複雑度がビデオ圧縮技術または規格のレベルによって定義される境界内にあることでありうる。場合によっては、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート(例えば毎秒メガサンプルで測定される)、および最大参照ピクチャサイズなどを制限する。レベルによって設定される制限は、場合によっては、仮想参照デコーダ(HRD:Hypothetical Reference Decoder)の仕様および符号化ビデオシーケンスでシグナリングされる、HRDバッファ管理のためのメタデータによってさらに制限されうる。
【0028】
実施形態では、受信器(410)は、符号化ビデオと共に追加(冗長)データを受信しうる。追加データは、符号化ビデオシーケンスの一部として含まれてもよい。追加データは、データを適切に復号するために、および/または元のビデオデータをより正確に再構成するために、ビデオデコーダ(310)によって使用されうる。追加データは、例えば、時間、空間、または信号対雑音比(SNR)拡張レイヤ、冗長スライス、冗長ピクチャ、および前方誤り訂正符号などの形態でありうる。
【0029】
図5は、実施形態によるビデオエンコーダ(303)の機能ブロック図である。
【0030】
エンコーダ(303)は、エンコーダ(303)によって符号化されるべきビデオ画像をキャプチャしうるビデオソース(301)(エンコーダの一部ではない)からビデオサンプルを受信しうる。
【0031】
ビデオソース(301)は、任意の適切なビット深度(例えば、8ビット、10ビット、12ビット、…)、任意の色空間(例えば、BT.601 Y CrCB、RGB、…)、および任意の適切なサンプリング構造(例えば、Y CrCb 4:2:0、Y CrCb 4:4:4)でありうるデジタルビデオサンプルストリームの形態で、エンコーダ(303)によって符号化されるべきソースビデオシーケンスを提供しうる。メディアサービングシステムでは、ビデオソース(301)は、予め用意されたビデオを記憶する記憶デバイスでありうる。ビデオ会議システムでは、ビデオソース(301)は、ビデオシーケンスとしてローカル画像情報をキャプチャするカメラでありうる。ビデオデータは、連続して見たときに動きを与える複数の個々のピクチャとして提供されうる。ピクチャ自体は、画素の空間アレイとして編成されえ、各画素は、使用中のサンプリング構造、色空間などに応じて1つ以上のサンプルを含みうる。当業者であれば、画素とサンプルとの関係を容易に理解しうる。以下の説明では、サンプルに着目する。
【0032】
実施形態によれば、エンコーダ(303)は、リアルタイムで、または用途によって必要とされる任意の他の時間的制約の下で、ソースビデオシーケンスのピクチャを符号化および圧縮して符号化ビデオシーケンス(543)にしうる。適切な符号化速度を実施することは、コントローラ(550)の1つの機能である。コントローラは、以下に説明するように他の機能ユニットを制御し、これらのユニットに機能的に結合される。この結合は、明確にするために示されていない。コントローラによって設定されるパラメータは、レート制御関連パラメータ(ピクチャスキップ、量子化器、レート歪み最適化技術のラムダ値、…)、ピクチャサイズ、グループオブピクチャ(GOP)レイアウト、および最大動きベクトル探索範囲などを含みうる。当業者であれば、特定のシステム設計に最適化されたビデオエンコーダ(303)に関連しうるため、コントローラ(550)の他の機能を容易に特定しうる。
【0033】
一部のビデオエンコーダは、当業者が「コーディング・ループ」として容易に認識するもので動作する。過度に簡略化された説明としては、コーディング・ループは、エンコーダ(530)(以下、「ソースコーダ」)の符号化部分(符号化されるべき入力ピクチャおよび参照ピクチャに基づいてシンボルを作成する役割を担う)と、(開示されている主題で考えられているビデオ圧縮技術では、シンボルと符号化ビデオビットストリームとの間の任意の圧縮が可逆的であるために)(リモート)デコーダも作成するサンプルデータを作成するためにシンボルを再構成する、エンコーダ(303)に組み込まれた(ローカル)デコーダ(533)とからなりうる。その再構成されたサンプルストリームは、参照ピクチャメモリ(534)に入力される。シンボルストリームの復号は、デコーダ位置(ローカルまたはリモート)とは無関係にビット正確な結果をもたらすため、参照ピクチャバッファの内容もローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えれば、エンコーダの予測部分は、復号中に予測を使用するときにデコーダが「参照する」のとまったく同じサンプル値を参照ピクチャサンプルとして「参照する」。参照ピクチャのシンクロニシティのこの基本原理(および例えばチャネル誤差のためにシンクロニシティを維持しえない場合に結果として生じるドリフト)は、当業者には周知である。
【0034】
「ローカル」デコーダ(533)の動作は、図4に関連して上記で既に詳細に説明した「リモート」デコーダ(310)の動作と同じでありうる。しかしながら、図4も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ(545)およびパーサ(420)によるシンボルの、符号化ビデオシーケンスへの符号化/符号化ビデオシーケンスからの復号が可逆的でありうるため、チャネル(412)、受信器(410)、バッファ(415)、およびパーサ(420)を含むデコーダ(310)のエントロピー復号部分は、ローカルデコーダ(533)では完全に実装されなくてもよい。
【0035】
この時点でなされうる観察は、デコーダ内に存在する解析/エントロピー復号を除くデコーダ技術が、対応するエンコーダ内にも実質的に同一の機能形態で必ず存在する必要があるということである。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため省略されうる。特定の領域においてのみ、より詳細な説明が必要とされ、以下に提供される。
【0036】
その動作の一部として、ソースコーダ(530)は、「参照フレーム」として指定された、ビデオシーケンスからの1つ以上の以前に符号化されたフレームを参照して入力フレームを予測的に符号化する動き補償予測符号化を実行しうる。このようにして、符号化エンジン(532)は、入力フレームの画素ブロックと、入力フレームに対する予測参照として選択されうる参照フレームの画素ブロックとの差を符号化する。
【0037】
ローカルビデオデコーダ(533)は、ソースコーダ(530)によって作成されたシンボルに基づいて、参照フレームとして指定されうるフレームの符号化ビデオデータを復号しうる。符号化エンジン(532)の動作は、好適には不可逆プロセスでありうる。符号化ビデオデータがビデオデコーダ(図4には示されていない)で復号されうるとき、再構成されたビデオシーケンスは、通常、いくらかの誤差を有するソースビデオシーケンスのレプリカでありうる。ローカルビデオデコーダ(533)は、参照フレームに対してビデオデコーダによって実行されうる復号プロセスを複製し、再構成された参照フレームを参照ピクチャキャッシュ(534)に記憶させうる。このようにして、エンコーダ(303)は、遠端ビデオデコーダによって(送信エラーなしで)取得される再構成された参照フレームと共通の内容を有する再構成された参照フレームのコピーをローカルに記憶しうる。
【0038】
予測器(535)は、符号化エンジン(532)のために予測検索を実行しうる。すなわち、符号化されるべき新しいフレームについて、予測器(535)は、新しいピクチャの適切な予測参照として機能しうるサンプルデータ(候補参照画素ブロックとして)、または参照ピクチャ動きベクトルおよびブロック形状などの特定のメタデータを求めて参照ピクチャメモリ(534)を検索しうる。予測器(535)は、適切な予測参照を見つけるために、サンプルブロック・画素ブロックごとに(on a sample block-by-pixel block basis)動作しうる。場合によっては、予測器(535)によって取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ(534)に記憶された複数の参照ピクチャから引き出された予測参照を有しうる。
【0039】
コントローラ(550)は、例えばビデオデータを符号化するために使用されるパラメータおよびサブグループパラメータの設定を含む、ビデオコーダ(530)の符号化動作を管理しうる。
【0040】
前述のすべての機能ユニットの出力は、エントロピーコーダ(545)でエントロピー符号化を受けうる。エントロピーコーダは、例えばハフマン符号化、可変長符号化、および算術符号化などのような、当業者に知られている技術に従ってシンボルを可逆圧縮することによって、様々な機能ユニットによって生成されたシンボルを符号化ビデオシーケンスに変換する。
【0041】
送信器(540)は、エントロピーコーダ(545)によって作成された符号化ビデオシーケンスをバッファリングして、符号化ビデオデータを記憶しうる記憶デバイスへのハードウェア/ソフトウェアリンクでありうる通信チャネル(560)を介した送信のためにそれを準備しうる。送信器(540)は、ビデオコーダ(530)からの符号化ビデオデータを、送信されるべき他のデータ、例えば、符号化された音声データおよび/または補助データストリーム(ソースは図示せず)とマージしうる。
【0042】
コントローラ(550)は、エンコーダ(303)の動作を管理しうる。符号化中、コントローラ(550)は、特定の符号化ピクチャタイプを各符号化ピクチャに割り当てえ、これは、それぞれのピクチャに適用されうる符号化技術に影響を及ぼしうる。例えば、ピクチャは、多くの場合、以下のフレームタイプのうちの1つとして割り当てられうる。
【0043】
イントラピクチャ(Iピクチャ)は、シーケンス内の他のフレームを予測のソースとして使用せずに符号化および復号されうるものでありうる。一部のビデオコーデックは、例えば独立したデコーダリフレッシュピクチャを含む、様々なタイプのイントラピクチャを容認する。当業者は、Iピクチャのこれらの変種ならびにそれらのそれぞれの用途および特徴を認識している。
【0044】
予測ピクチャ(Pピクチャ)は、各ブロックのサンプル値を予測するために最大で1つの動きベクトルおよび参照インデックスを使用するイントラ予測またはインター予測を使用して符号化および復号されうるものでありうる。
【0045】
双方向予測ピクチャ(Bピクチャ)は、各ブロックのサンプル値を予測するために最大で2つの動きベクトルおよび参照インデックスを使用するイントラ予測またはインター予測を使用して符号化および復号されうるものでありうる。同様に、複数予測ピクチャは、単一のブロックの再構成のために2つより多くの参照ピクチャおよび関連するメタデータを使用しうる。
【0046】
ソースピクチャは、一般に、複数のサンプルブロック(例えば、それぞれ4×4、8×8、4×8、または16×16サンプルのブロック)に空間的に細分化され、ブロックごとに符号化されうる。ブロックは、ブロックのそれぞれのピクチャに適用された符号化割り当てによって決定された他の(既に符号化された)ブロックを参照して予測的に符号化されうる。例えば、Iピクチャのブロックは、非予測的に符号化されてもよいし、またはそれらは、同じピクチャの既に符号化されたブロックを参照して予測的に符号化されてもよい(空間予測またはイントラ予測)。Pピクチャの画素ブロックは、以前に符号化された1つの参照ピクチャを参照して、非予測的に、空間予測によって、または時間予測によって符号化されうる。Bピクチャのブロックは、以前に符号化された1つまたは2つの参照ピクチャを参照して、非予測的に、空間予測によって、または時間予測によって符号化されうる。
【0047】
ビデオコーダ(303)は、ITU-T Rec.H.265などの所定のビデオコーディング技術または規格に従って符号化動作を行いうる。その動作において、ビデオコーダ(303)は、入力ビデオシーケンスの時間的および空間的冗長性を利用する予測符号化動作を含む様々な圧縮動作を行いうる。したがって、符号化ビデオデータは、使用されているビデオコーディング技術または規格によって指定されたシンタックスに準拠しうる。
【0048】
実施形態では、送信器(540)は、符号化ビデオと共に追加データを送信しうる。ビデオコーダ(530)は、符号化ビデオシーケンスの一部としてそのようなデータを含みうる。追加データは、時間/空間/SNR拡張レイヤ、冗長ピクチャおよびスライスなどの他の形態の冗長データ、補足拡張情報(SEI)メッセージ、ならびに視覚ユーザビリティ情報(VUI)パラメータセットフラグメントなどを含みうる。
【0049】
ピクチャサイズおよび分割情報のビット効率的なシグナリングおよび事前通知のために、本明細書で説明されている実施形態は、ピクチャサイズおよび分割情報の階層的なシグナリングメカニズムを含む。ビデオパラメータセット(VPS)では、ピクチャサイズおよび分割情報pic_size_partitioning_info()のすべての候補がリストされ、これらは、VPSを参照する符号化ビデオシーケンス(CVS:coded video sequence)の任意のレイヤに存在してもよい。シーケンスパラメータセット(SPS)では、インデックスが、リストされ、VPS内の候補と、ピクチャサイズおよび分割情報pic_size_partitioning_info()の追加の候補とを参照し、これらは、SPSを参照するピクチャパラメータセット(PPS:picture parameter set)内のインデックスによって参照されうる。PPSでは、インデックスが、シグナリングされ、PPSが参照する、SPSにリストされているピクチャサイズおよび分割情報pic_size_partitioning_info()を示す。必要ならば、ピクチャサイズおよび分割情報pic_size_partitioning_info()の一部が、PPSにおいて更新されうる。指定テキストは以下の通りである。
【0050】
VPSは、以下の表1に指定されている。
【0051】
【表1】
【0052】
vps_num_pic_size_partitioning_info_minus1 plus 1は、VPSにリストされているピクチャサイズおよび分割情報pic_size_partitioning_info()の数を指定する。
【0053】
SPSは、以下の表2に指定されている。
【0054】
【表2】
【0055】
sps_num_pic_size_partitioning_info_minus1 plus 1は、SPSにリストされているピクチャサイズおよび分割情報pic_size_partitioning_info()の数を指定する。
【0056】
0に等しいsps_additional_pic_size_partitioning_info_flag [i] は、インデックスsps_vps_pic_size_partitioning_info_idx[i]が存在することを指定する。1に等しいsps_additional_pic_size_partitioning_info_flag [i] は、VPSにリストされているピクチャサイズおよび分割情報pic_size_partitioning_info()を参照せずに、このSPSにリストされているi番目のピクチャサイズおよび分割情報pic_size_partitioning_info()が存在することを指定する。
【0057】
sps_vps_pic_size_partitioning_info_idx[i]は、このSPSにリストされているi番目のピクチャサイズおよび分割情報pic_size_partitioning_info()が、このSPSが参照するVPSにリストされているsps_vps_pic_size_partitioning_info_idx[ i ]番目のピクチャサイズおよび分割情報pic_size_partitioning_info()に等しいことを指定する。
【0058】
PPSは、以下の表3に指定されている。
【0059】
【表3】
【0060】
pps_sps_pic_size_partitioning_info_idxは、このPPSを参照する各符号化ピクチャのピクチャサイズおよび分割情報pic_size_partitioning_info()が、このPPSが参照するSPSにリストされているpps_sps_pic_size_partitioning_info_idx番目のピクチャサイズおよび分割情報pic_size_partitioning_info()に等しいことを指定する。
【0061】
1に等しいpps_pic_size_partitioning_info_update_flagは、ピクチャサイズおよび分割情報の更新pic_size_partitioning_update_info()がPPSに存在することを指定する。
【0062】
ピクチャサイズおよび分割情報pic_size_partitioning_info()は、以下の表4に指定されている。
【0063】
【表4】
【0064】
1に等しいconf_win_present_flagは、conf_win_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在することを指定する。0に等しいconf_win_present_flagは、conf_win_info()が、このピクチャサイズおよび分割情報pic_size_partitioning_info()に存在しないことを指定する。conf_win_info()は、適合ウィンドウオフセットを示す。
【0065】
1に等しいtile_brick_partitioning_present_flagは、tile_brick_partitioning_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在することを指定する。0に等しいtile_brick_partitioning_present_flagは、tile_brick_partitioning_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在しないことを指定する。tile_brick_partitioning_info()は、タイルブリック分割情報を示す。
【0066】
1に等しいrect_slice_partitioning_present_flagは、rect_slice_partitioning_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在することを指定する。0に等しいrect_slice_partitioning_present_flagは、rect_slice_partitioning_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在しないことを指定する。rect_slice_partitioning_info()は、矩形スライス分割情報を示す。
【0067】
1に等しいsubpic_partitioning_present_flagは、subpic_partitioning_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在することを指定する。0に等しいsubpic_partitioning_present_flagは、subpic_partitioning_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在しないことを指定する。subpic_partitioning_info()は、サブピクチャ分割情報を示す。
【0068】
1に等しいsubpic_conf_win_present_flagは、subpic_conf_win_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在することを指定する。0に等しいsubpic_conf_win_present_flagは、subpic_conf_win_info()がこのピクチャサイズおよび分割情報pic_size_partitioning_info()に存在しないことを指定する。subpic_conf_win_info()は、サブピクチャ適合ウィンドウオフセットを示す。
【0069】
pic_size_partitioning_update_info()は、ピクチャサイズおよび分割情報pic_size_partitioning_info()の更新を指定し、以下の表5に指定されている。
【0070】
【表5】
【0071】
1に等しいconf_win_update_flagは、現在のconf_win_info()が、このpic_size_partitioning_update_info()のconf_win_info()で更新されることを指定する。0に等しいconf_win_update_flagは、現在のconf_win_info()が更新されないことを示す。
【0072】
1に等しいtile_brick_partitioning_update_flagは、現在のtile_brick_partitioning_info()が、このpic_size_partitioning_update_info()のtile_brick_partitioning_info()で更新されることを指定する。0に等しいconf_win_update_flagは、現在のtile_brick_partitioning_info()が更新されないことを指定する。
【0073】
1に等しいrect_slice_partitioning_update_flagは、現在のrect_slice_partitioning_info()が、このpic_size_partitioning_update_info()のrect_slice_partitioning_info()で更新されることを指定する。0に等しいrect_slice_partitioning_update_flagは、現在のrect_slice_partitioning_info()が更新されないことを指定する。
【0074】
1に等しいsubpic_partitioning_update_flagは、現在のsubpic_partitioning_info()が、このpic_size_partitioning_update_info()のsubpic_partitioning_info()で更新されることを指定する。0に等しいsubpic_partitioning_update_flagは、現在のsubpic_partitioning_info()が更新されないことを指定する。
【0075】
1に等しいsubpic_conf_win_update_flagは、現在のsubpic_conf_win_info()が、このpic_size_partitioning_update_info()のsubpic_conf_win_info()で更新されることを指定する。0に等しいsubpic_conf_win_update_flagは、現在のsubpic_conf_win_info()が更新されないことを示す。
【0076】
取得されたピクチャサイズおよび分割情報pic_size_partitioning_info()は、例えばデコーダ(310)によって、符号化ピクチャを復号するために使用される。符号化ピクチャのピクチャサイズおよび分割情報は、例えばエンコーダ(303)によって、上記で説明したようにVPS、SPS、およびPPSでシグナリングされる。
【0077】
図6は、実施形態による、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法(600)を示すフローチャートである。一部の実施態様では、図6の1つ以上のプロセスブロックは、デコーダ(310)によって行わされうる。一部の実施態様では、図6の1つ以上のプロセスブロックは、デコーダ(310)とは別個のまたはデコーダ(310)を含む、エンコーダ(303)などの他のデバイスまたはデバイスのグループによって行われうる。
【0078】
図6を参照すると、第1のブロック(610)において、方法(600)は、符号化ピクチャが参照するSPSから、符号化ピクチャのピクチャサイズおよび分割情報がSPSに含まれているかどうかを示すフラグを取得するステップを含む。
【0079】
第2のブロック(620)において、方法(600)は、取得されたフラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定するステップを含む。
【0080】
第3のブロック(630)において、方法(600)は、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSからピクチャサイズおよび分割情報を取得するステップを含む。
【0081】
第4のブロック(640)において、方法(600)は、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、VPSから、VPSに含まれているピクチャサイズおよび分割情報を取得するステップを含む。
【0082】
方法(600)は、SPSから、SPSに含まれているピクチャサイズおよび分割情報の数を取得するステップと、インデックスが、SPSに含まれているピクチャサイズおよび分割情報の取得された数以下であるかどうかを判定するステップとをさらに含みうる。
【0083】
方法(600)は、インデックスが、SPSに含まれているピクチャサイズおよび分割情報の数以下であると決定されたことに基づいて、インデックスをインクリメントするステップと、SPSから、追加のピクチャサイズおよび分割情報がSPSに含まれているかどうかを示す他のフラグを取得するステップであって、他のフラグはインクリメントされたインデックスに対応する、ステップとをさらに含みうる。方法(600)は、取得された他のフラグが、追加のピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定するステップと、他のフラグが、追加のピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSから追加のピクチャサイズおよび分割情報を取得するステップと、他のフラグが、追加のピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、VPSから、VPSに含まれている追加のピクチャサイズおよび分割情報を取得するステップとをさらに含みうる。
【0084】
ピクチャサイズおよび分割情報は、符号化ピクチャの適合ウィンドウオフセット、符号化ピクチャのタイルブリック分割情報、符号化ピクチャの矩形スライス分割情報、符号化ピクチャのサブピクチャ分割情報、および符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含みうる。
【0085】
図6は、方法(600)の例示的なブロックを示すが、一部の実施態様では、方法(600)は、図6に示されているものと比べて追加のブロック、より少ないブロック、異なるブロック、または異なる配置のブロックを含んでもよい。さらにまたはあるいは、方法(600)の2つ以上のブロックが並行して行われてもよい。
【0086】
図7は、実施形態による、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法(700)を示すフローチャートである。一部の実施態様では、図7の1つ以上のプロセスブロックは、デコーダ(310)によって実行されうる。一部の実施態様では、図7の1つ以上のプロセスブロックは、エンコーダ(303)などの、デコーダ(310)とは別個のまたはデコーダ(310)を含む他のデバイスまたはデバイスのグループによって行われうる。
【0087】
図7を参照すると、第1のブロック(710)において、方法(700)は、符号化ピクチャが参照するPPSから、ピクチャサイズおよび分割情報がSPSに含まれていることを示すインデックスを取得するステップを含む。
【0088】
第2のブロック(720)において、方法(700)は、取得されたインデックスに基づいて、SPSからピクチャサイズおよび分割情報を取得するステップを含む。
【0089】
方法(700)は、符号化ピクチャが参照するピクチャパラメータセット(PPS)から、ピクチャサイズおよび分割情報がPPSにおいて更新されているかどうかを示す他のフラグを取得するステップと、取得された他のフラグが、ピクチャサイズおよび分割情報がPPSにおいて更新されていることを示すかどうかを判定するステップとをさらに含みうる。方法(700)は、取得された他のフラグが、ピクチャサイズおよび分割情報がPPSにおいて更新されていることを示すと決定されたことに基づいて、PPSから更新されたピクチャサイズおよび分割情報を取得するステップをさらに含みうる。
【0090】
更新されたピクチャサイズおよび分割情報は、更新された、符号化ピクチャの適合ウィンドウオフセット、符号化ピクチャのタイルブリック分割情報、符号化ピクチャの矩形スライス分割情報、符号化ピクチャのサブピクチャ分割情報、および符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含みうる。
【0091】
図7は、方法(700)の例示的なブロックを示すが、一部の実施態様では、方法(700)は、図7に示されているものと比べて追加のブロック、より少ないブロック、異なるブロック、または異なる配置のブロックを含んでもよい。さらにまたはあるいは、方法(700)の2つ以上のブロックが並行して行われてもよい。
【0092】
さらに、提案された方法は、処理回路(例えば、1つ以上のプロセッサまたは1つ以上の集積回路)によって実装されてもよい。一例では、1つ以上のプロセッサは、提案された方法のうちの1つ以上を行うために、非一時的コンピュータ可読媒体に記憶されたプログラムを実行する。
【0093】
図8は、実施形態による、ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための装置(800)の簡略ブロック図である。
【0094】
図8を参照すると、装置(800)は、第1の取得コード(810)、第1の判定コード(820)、第2の取得コード(830)、および第3の取得コード(840)を含む。
【0095】
第1の取得コード(810)は、少なくとも1つのプロセッサに、符号化ピクチャが参照するSPSから、符号化ピクチャのピクチャサイズおよび分割情報がSPSに含まれているかどうかを示すフラグを取得させるように構成される。
【0096】
第1の判定コード(820)は、少なくとも1つのプロセッサに、取得されたフラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定させるように構成される。
【0097】
第2の取得コード(830)は、少なくとも1つのプロセッサに、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSからピクチャサイズおよび分割情報を取得させるように構成される。
【0098】
第3の取得コード(840)は、少なくとも1つのプロセッサに、フラグが、ピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、VPSに含まれているピクチャサイズおよび分割情報を取得させるように構成される。
【0099】
装置(800)は、少なくとも1つのプロセッサに、SPSから、SPSに含まれているピクチャサイズおよび分割情報の数を取得させるように構成された第4の取得コード(850)と、少なくとも1つのプロセッサに、インデックスが、SPSに含まれているピクチャサイズおよび分割情報の取得された数以下であるかどうかを判定させるように構成された第2の判定コード(860)とをさらに含みうる。
【0100】
装置(800)は、少なくとも1つのプロセッサに、インデックスが、SPSに含まれているピクチャサイズおよび分割情報の数以下であると決定されたことに基づいて、インデックスをインクリメントさせるように構成されたインクリメントコード(870)をさらに含みうる。
【0101】
第1の取得コード(810)は、少なくとも1つのプロセッサに、SPSから、追加のピクチャサイズおよび分割情報がSPSに含まれているかどうかを示す他のフラグを取得させるようにさらに構成されえ、他のフラグは、インクリメントされたインデックスに対応する。
【0102】
第1の判定コード(820)は、少なくとも1つのプロセッサに、取得された他のフラグが、追加のピクチャサイズおよび分割情報がSPSに含まれていることを示すかどうかを判定させるようにさらに構成されうる。
【0103】
第2の取得コード(830)は、少なくとも1つのプロセッサに、他のフラグが、追加のピクチャサイズおよび分割情報がSPSに含まれていることを示すと決定されたことに基づいて、SPSから追加のピクチャサイズおよび分割情報を取得させるようにさらに構成されうる。
【0104】
第3の取得コード(840)は、少なくとも1つのプロセッサに、他のフラグが、追加のピクチャサイズおよび分割情報がSPSに含まれていないことを示すと決定されたことに基づいて、VPSから、VPSに含まれている追加のピクチャサイズおよび分割情報を取得させるようにさらに構成されうる。
【0105】
装置(800)は、少なくとも1つのプロセッサに、符号化ピクチャが参照するピクチャパラメータセット(PPS)から、ピクチャサイズおよび分割情報がSPSに含まれていることを示すインデックスを取得させるように構成された第4の取得コード(850)と、少なくとも1つのプロセッサに、取得されたインデックスに基づいて、SPSからピクチャサイズおよび分割情報を取得させるように構成された第5の取得コード(880)とをさらに含みうる。
【0106】
装置(800)は、少なくとも1つのプロセッサに、符号化ピクチャが参照するピクチャパラメータセット(PPS)から、ピクチャサイズおよび分割情報がPPSにおいて更新されているかどうかを示す他のフラグを取得させるように構成された第4の取得コード(850)と、少なくとも1つのプロセッサに、取得された他のフラグが、ピクチャサイズおよび分割情報がPPSにおいて更新されていることを示すかどうかを判定させるように構成された第2の判定コード(860)と、少なくとも1つのプロセッサに、取得された他のフラグが、ピクチャサイズおよび分割情報がPPSにおいて更新されていることを示すと決定されたことに基づいて、PPSから更新されたピクチャサイズおよび分割情報を取得させるように構成された第5の取得コード(880)とをさらに含みうる。
【0107】
更新されたピクチャサイズおよび分割情報は、更新された、符号化ピクチャの適合ウィンドウオフセット、符号化ピクチャのタイルブリック分割情報、符号化ピクチャの矩形スライス分割情報、符号化ピクチャのサブピクチャ分割情報、および符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含みうる。
【0108】
ピクチャサイズおよび分割情報は、符号化ピクチャの適合ウィンドウオフセット、符号化ピクチャのタイルブリック分割情報、符号化ピクチャの矩形スライス分割情報、符号化ピクチャのサブピクチャ分割情報、および符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含みうる。
【0109】
図9は、実施形態を実装するのに適したコンピュータシステム(900)の図である。
【0110】
コンピュータソフトウェアは、任意の適切なマシンコードまたはコンピュータ言語を使用してコード化されえ、それらは、コンピュータ中央処理装置(CPU:central processing unit)およびグラフィック処理装置(GPU:Graphics Processing Unit)などによって、解釈およびマイクロコード実行などを介してまたは直接実行されうる命令を含むコードを作成するためにアセンブル、コンパイル、またはリンクなどのメカニズムを受けうる。
【0111】
命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーミングデバイス、およびモノのインターネットデバイスなどを含む様々なタイプのコンピュータまたはそのコンポーネント上で実行されうる。
【0112】
コンピュータシステム(900)に関して図9に示されているコンポーネントは、本質的に例であり、実施形態を実装するコンピュータソフトウェアの使用または機能の範囲に関する制限を示唆することを意図していない。コンポーネントの構成は、コンピュータシステム(900)の実施形態に示されているコンポーネントのいずれか1つまたは組み合わせに関する依存性または要件を有すると解釈されるべきではない。
【0113】
コンピュータシステム(900)は、特定のヒューマンインターフェース入力デバイスを含みうる。そのようなヒューマンインターフェース入力デバイスは、例えば触覚入力(キーストローク、スワイプ、データグローブの動きなど)、音声入力(声、拍手など)、視覚入力(ジェスチャなど)、嗅覚入力(図示せず)を用いた1人以上の人間のユーザによる入力に応答しうる。ヒューマンインターフェースデバイスは、音声(会話、音楽、環境音など)、画像(スキャン画像、静止画像カメラから取得される写真画像など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)など、必ずしも人間による意識的な入力に直接関連しない特定の媒体をキャプチャするためにも使用されうる。
【0114】
入力ヒューマンインターフェースデバイスは、キーボード(901)、マウス(902)、トラックパッド(903)、タッチスクリーン(910)、データグローブ、ジョイスティック(905)、マイクロフォン(906)、スキャナ(907)、カメラ(908)(それぞれ示されているのは1つのみである)のうちの1種類以上を含みうる。
【0115】
コンピュータシステム(900)はまた、特定のヒューマンインターフェース出力デバイスを含みうる。そのようなヒューマンインターフェース出力デバイスは、例えば触覚出力、音、光、および匂い/味によって1人以上の人間のユーザの感覚を刺激しうる。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン(910)、データグローブ、またはジョイスティック(905)による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスも存在しうる)、音声出力デバイス(スピーカ(909)、ヘッドホン(図示せず)など)、視覚出力デバイス(陰極線管(CRT:cathode ray tube)スクリーン、液晶ディスプレイ(LCD:liquid-crystal display)スクリーン、プラズマスクリーン、有機発光ダイオード(OLED:organic light-emitting diode)スクリーン(それぞれタッチスクリーン入力機能を有するかまたは有さず、それぞれ触覚フィードバック機能を有するかまたは有さず、これらのうちのいくつかは、2次元視覚出力、または立体出力などの手段による3次元以上の出力を出力することができうる)を含むスクリーン(910)、仮想現実メガネ(図示せず)、ホログラフィックディスプレイ、およびスモークタンク(図示せず)など)、ならびにプリンタ(図示せず)を含みうる。グラフィックアダプタ(950)は、画像を生成してタッチスクリーン(910)に出力する。
【0116】
コンピュータシステム(900)はまた、CD/DVDなどの媒体(921)を伴うCD/DVD ROM/RW(920)を含む光学媒体、サムドライブ(922)、リムーバブルハードドライブまたはソリッドステートドライブ(923)、テープおよびフロッピーディスクなどのレガシー磁気媒体(図示せず)、ならびにセキュリティドングルなどの専用ROM/ASIC/PLDベースのデバイス(図示せず)など、人間がアクセス可能な記憶デバイスおよびそれらの関連媒体を含みうる。
【0117】
当業者はまた、本開示の主題に関連して使用される「コンピュータ可読媒体」という用語が、送信媒体、搬送波、または他の一時的信号を包含しないことを理解すべきである。
【0118】
コンピュータシステム(900)はまた、1つ以上の通信ネットワーク(955)へのインターフェースを含みうる。ネットワーク(955)は、例えば無線、有線、光ネットワークでありうる。ネットワーク(955)はさらに、ローカル、広域、メトロポリタン、車両および産業、リアルタイム、ならびに遅延耐性ネットワークなどでありうる。ネットワーク(955)の例は、イーサネット、無線LANなどのローカルエリアネットワーク、グローバル・システム・フォー・モバイル・コミュニケーションズ(GSM:global systems for mobile communications)、第3世代(3G)、第4世代(4G)、第5世代(5G)、およびロングタームエボリューション(LTE:Long-Term Evolution)などを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上波放送TVを含むTV有線または無線広域デジタルネットワーク、ならびにCANBusを含む車両および産業用などを含む。特定のネットワーク(955)は、一般に、特定の汎用データポートまたは周辺バス((949))(例えば、コンピュータシステム(900)のユニバーサルシリアルバス(USB:universal serial bus)ポートなど)に取り付けられた外部ネットワークインターフェースアダプタを必要とし、他は、一般に、以下に説明されるようにシステムバスへの取り付けによってコンピュータシステム(900)のコアに一体化される(例えば、PCコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース(954))。これらのネットワーク(955)のいずれかを使用して、コンピュータシステム(900)は他のエンティティと通信しうる。そのような通信は、例えば、ローカルエリアデジタルネットワークまたは広域デジタルネットワークを使用する他のコンピュータシステムに対して、単方向、受信のみ(例えば、放送TV)、単方向送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向でありうる。特定のプロトコルおよびプロトコルスタックは、上記で説明したように、それらのネットワーク(955)およびネットワークインターフェース(954)のそれぞれで使用されうる。
【0119】
前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶デバイス、およびネットワークインターフェース(954)は、コンピュータシステム(900)のコア(940)に取り付けられうる。
【0120】
コア(940)は、1つ以上の中央処理装置(CPU)(941)、グラフィック処理装置(GPU)(942)、フィールドプログラマブルゲートエリア(FPGA:Field Programmable Gate Area)(943)の形態の専用プログラマブル処理装置、および特定のタスク用のハードウェアアクセラレータ(944)などを含みうる。これらのデバイスは、読み出し専用メモリ(ROM:Read-only memory)(945)、ランダムアクセスメモリ(RAM:Random-access memory)(946)、内部の非ユーザアクセス可能ハードドライブおよびソリッドステートドライブ(SSD:solid-state drive)などの内部大容量ストレージ(947)と共に、システムバス(948)を介して接続されうる。一部のコンピュータシステムでは、システムバス(948)は、追加のCPUおよびGPUなどによる拡張を可能にするために、1つ以上の物理プラグの形態でアクセス可能でありうる。周辺デバイスは、コアのシステムバス(948)に直接取り付けられうるし、または周辺バス(949)を介して取り付けられうる。周辺バスのアーキテクチャは、周辺コンポーネント相互接続(PCI:peripheral component interconnect)およびUSBなどを含む。
【0121】
CPU(941)、GPU(942)、FPGA(943)、およびアクセラレータ(944)は、組み合わさって前述のコンピュータコードを構成しうる特定の命令を実行しうる。そのコンピュータコードは、ROM(945)またはRAM(946)に記憶されうる。一時データもまた、RAM(946)に記憶されえ、一方、永久データは、例えば内部大容量ストレージ(947)に記憶されうる。メモリデバイスのいずれかへの高速記憶および検索は、1つ以上のCPU(941)、GPU(942)、大容量ストレージ(947)、ROM(945)、およびRAM(946)などと密接に関連付けられうるキャッシュメモリの使用によって可能になりうる。
【0122】
コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードを有しうる。媒体およびコンピュータコードは、実施形態の目的のために特別に設計および構成されたものであってもよいし、またはそれらは、コンピュータソフトウェア技術の当業者に周知の利用可能な種類のものであってもよい。
【0123】
限定としてではなく、一例として、アーキテクチャ(900)、特にコア(940)を有するコンピュータシステムは、1つ以上の有形のコンピュータ可読媒体で具体化されたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、およびアクセラレータなどを含む)の結果として機能を提供しうる。そのようなコンピュータ可読媒体は、コア内部の大容量ストレージ(947)またはROM(945)などの、上述のようなユーザアクセス可能な大容量ストレージ、および非一時的な性質の、コア(940)の特定のストレージに関連付けられる媒体でありうる。様々な実施形態を実施するソフトウェアは、そのようなデバイスに記憶され、コア(940)によって実行されうる。コンピュータ可読媒体は、特定の必要性に応じて、1つ以上のメモリデバイスまたはチップを含みうる。ソフトウェアは、コア(940)、特にその中のプロセッサ(CPU、GPU、およびFPGAなどを含む)に、RAM(946)に記憶されたデータ構造を定義すること、およびソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を修正することを含む、本明細書で説明されている特定のプロセスまたは特定のプロセスの特定の部分を実行させうる。加えてまたは代替として、コンピュータシステムは、本明細書で説明されている特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりに、またはソフトウェアと共に動作しうる、回路内のハードワイヤード論理または他の方法で具体化された論理(例えば、アクセラレータ(944))の結果として機能を提供しうる。ソフトウェアへの言及は、適切な場合には、論理を包含しえ、逆もまた同様である。コンピュータ可読媒体への言及は、適切な場合には、実行のためのソフトウェアを記憶する回路(集積回路(IC:integrated circuit)など)、実行のための論理を具体化する回路、またはその両方を包含しうる。実施形態は、ハードウェアとソフトウェアとの任意の適切な組み合わせを包含する。
【0124】
本開示はいくつかの実施形態を説明してきたが、本開示の範囲内にある変更、置換、および様々な代替の均等物が存在する。したがって、当業者が、本明細書に明示的に図示または説明されていないが、本開示の原理を具体化し、したがってその精神および範囲内にある多数のシステムおよび方法を考案することができることが理解されよう。
【符号の説明】
【0125】
200 通信システム
210 端末
220 端末
230 端末
240 端末
250 ネットワーク
301 ビデオソース
302 非圧縮ビデオサンプルストリーム
303 エンコーダ
304 符号化ビデオビットストリーム
305 ストリーミングサーバ
306 ストリーミングクライアント
307 コピー
308 ストリーミングクライアント
309 コピー
310 ビデオデコーダ
311 発信ビデオサンプルストリーム
312 ディスプレイ
313 キャプチャサブシステム
410 受信器
412 チャネル
415 バッファメモリ
420 パーサ
421 シンボル
451 スケーラ/逆変換ユニット
452 イントラ予測ユニット
453 動き補償予測ユニット
454 ループフィルタユニット
455 アグリゲータ
456 参照ピクチャ
457 参照ピクチャバッファ
530 ソースコーダ
532 符号化エンジン
533 ローカルビデオデコーダ
534 参照ピクチャメモリ
535 予測器
540 送信器
543 符号化ビデオシーケンス
545 エントロピーコーダ
550 コントローラ
560 通信チャネル
800 装置
810 第1の取得コード
820 第1の判定コード
830 第2の取得コード
840 第3の取得コード
850 第4の取得コード
860 第2の判定コード
870 インクリメントコード
880 第5の取得コード
900 コンピュータシステム
901 キーボード
902 マウス
903 トラックパッド
905 ジョイスティック
906 マイクロフォン
907 スキャナ
908 カメラ
909 スピーカ
910 スクリーン
920 CD/DVD ROM/RW
921 媒体
922 サムドライブ
923 リムーバブルハードドライブまたはソリッドステートドライブ
940 コア
941 CPU
942 GPU
943 FPGA
944 アクセラレータ
945 ROM
946 RAM
947 大容量ストレージ
948 システムバス
949 汎用データポートまたは周辺バス
950 グラフィックアダプタ
954 ネットワークインターフェース
955 ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
【手続補正書】
【提出日】2021-09-07
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングの方法であって、前記方法は、少なくとも1つのプロセッサによって実行され、前記方法は、
符号化ピクチャが参照するシーケンスパラメータセット(SPS)から、前記符号化ピクチャの前記ピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示すフラグを取得するステップと、
前記取得されたフラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定するステップと、
前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得するステップと、
前記フラグが、前記ピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、ビデオパラメータセット(VPS)から、前記VPSに含まれている前記ピクチャサイズおよび分割情報を取得するステップと
を含む、方法。
【請求項2】
前記SPSから、前記SPSに含まれている前記ピクチャサイズおよび分割情報の数を取得するステップと、
インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記取得された数以下であるかどうかを判定するステップと
をさらに含む、請求項1に記載の方法。
【請求項3】
前記インデックスが、前記SPSに含まれている前記ピクチャサイズおよび分割情報の前記数以下であると決定されたことに基づいて、前記インデックスをインクリメントするステップと、
前記SPSから、追加のピクチャサイズおよび分割情報が前記SPSに含まれているかどうかを示す他のフラグを取得するステップであって、前記他のフラグは前記インクリメントされたインデックスに対応する、ステップと、
前記取得された他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すかどうかを判定するステップと、
前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていることを示すと決定されたことに基づいて、前記SPSから前記追加のピクチャサイズおよび分割情報を取得するステップと、
前記他のフラグが、前記追加のピクチャサイズおよび分割情報が前記SPSに含まれていないことを示すと決定されたことに基づいて、前記VPSから、前記VPSに含まれている前記追加のピクチャサイズおよび分割情報を取得するステップと
をさらに含む、請求項2に記載の方法。
【請求項4】
前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記SPSに含まれていることを示すインデックスを取得するステップと、
取得された前記インデックスに基づいて、前記SPSから前記ピクチャサイズおよび分割情報を取得するステップと
をさらに含む、請求項1に記載の方法。
【請求項5】
前記符号化ピクチャが参照するピクチャパラメータセット(PPS)から、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されているかどうかを示す他のフラグを取得するステップと、
前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すかどうかを判定するステップと、
前記取得された他のフラグが、前記ピクチャサイズおよび分割情報が前記PPSにおいて更新されていることを示すと決定されたことに基づいて、前記PPSから前記更新されたピクチャサイズおよび分割情報を取得するステップと
をさらに含む、請求項1から4のうちいずれか一項に記載の方法。
【請求項6】
前記更新されたピクチャサイズおよび分割情報は、更新された、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項5に記載の方法。
【請求項7】
前記ピクチャサイズおよび分割情報は、前記符号化ピクチャの適合ウィンドウオフセット、前記符号化ピクチャのタイルブリック分割情報、前記符号化ピクチャの矩形スライス分割情報、前記符号化ピクチャのサブピクチャ分割情報、および前記符号化ピクチャのサブピクチャ適合ウィンドウオフセットの任意の1つまたは任意の組み合わせを含む、請求項1に記載の方法。
【請求項8】
請求項1~7のうちいずれか一項に記載の方法を行うように構成された装置。
【請求項9】
コンピュータに、請求項1~7のうちいずれか一項に記載の方法を実行させるためのプログラム。
【国際調査報告】