(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-02-01
(54)【発明の名称】ネットワーク抽象化レイヤユニットヘッダ
(51)【国際特許分類】
H04N 19/70 20140101AFI20220125BHJP
【FI】
H04N19/70
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021532467
(86)(22)【出願日】2020-03-04
(85)【翻訳文提出日】2021-06-08
(86)【国際出願番号】 US2020020955
(87)【国際公開番号】W WO2020180966
(87)【国際公開日】2020-09-10
(32)【優先日】2019-03-06
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-07-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520353802
【氏名又は名称】テンセント・アメリカ・エルエルシー
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】ステファン・ヴェンガー
(72)【発明者】
【氏名】ビョンドゥ・チェ
(72)【発明者】
【氏名】シャン・リュウ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA21
5C159MA33
5C159MC11
5C159ME01
5C159PP04
5C159RC11
(57)【要約】
少なくとも1つのプロセッサが実行する、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する方法は、NALユニットヘッダに含まれる第1のシンタックス要素を復号するステップと、前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップと、NALユニットヘッダに含まれる第2のシンタックス要素を復号するステップと、前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて、前記NALユニットを再構築するステップと、前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、前記第2のシンタックス要素に基づいて、時間的識別子(TID)を決定し、決定された前記TIDに基づいて、前記NALユニットを再構築するステップと、を含む。
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサが実行する、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する方法であって、
NALユニットヘッダに含まれる、第1の固定長の2値符号化されたNALユニットシンタックス要素を含む第1のシンタックス要素を復号するステップと、
前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップと、
前記NALユニットヘッダに含まれる、第2の固定長の2値符号化されたNALユニットシンタックス要素を含む第2のシンタックス要素を復号するステップと、
前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて、前記NALユニットを再構築するステップと、
を含む方法。
【請求項2】
前記NALユニットクラスが前記第1のNALユニットクラスであることに基づいて、時間的識別子(TID)がゼロであると決定される、請求項1に記載の方法。
【請求項3】
前記第1のNALユニットクラスは、前記NALユニットに対応するパラメータセットが複数の時間的レイヤに関連することを示す、請求項1に記載の方法。
【請求項4】
前記パラメータセットは、デコーダパラメータセット、ビデオパラメータセット、およびシーケンスパラメータセットのうちの少なくとも1つを含む、請求項3に記載の方法。
【請求項5】
前記第1のNALユニットクラスは、前記NALユニットに対応するパラメータセットが単一の符号化ピクチャに関連することを示す、請求項1に記載の方法。
【請求項6】
前記パラメータセットは、ピクチャパラメータセット、スライスパラメータセット、適応パラメータセット、およびヘッダパラメータセットのうちの少なくとも1つを含む、請求項5に記載の方法。
【請求項7】
前記第1のNALユニットクラスは、前記NALユニットが非規範的データに関連することを示す、請求項1に記載の方法。
【請求項8】
前記非規範的データは、補助強化情報、フィラーデータ、およびピクチャデリミタデータを含む、請求項7に記載の方法。
【請求項9】
前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、
前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定された前記TIDに基づいて前記NALユニットを再構築するステップをさらに含む、請求項1に記載の方法。
【請求項10】
前記第1のシンタックス要素は、禁止されたゼロビットを含む、請求項1に記載の方法。
【請求項11】
ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する装置であって、
プログラムコードを記憶するように構成される少なくとも1つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードによって指示されたとおりに動作するように構成される少なくとも1つのプロセッサであって、前記プログラムコードは、
前記少なくとも1つのプロセッサに、NALユニットヘッダに含まれる、第1の固定長の2値符号化されたNALユニットシンタックス要素を含む第1のシンタックス要素を復号させるように構成される第1の復号コードと、
前記少なくとも1つのプロセッサに、前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定させるように構成される第1の決定コードと、
前記少なくとも1つのプロセッサに、前記NALユニットヘッダに含まれる、第2の固定長の2値符号化されたNALユニットシンタックス要素を含む第2のシンタックス要素を復号させるように構成される第2の復号コードと、
前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて前記NALユニットを再構築することを、少なくとも1つのプロセッサに実行させるように構成される第2の決定コードと、
前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定された前記TIDに基づいて前記NALユニットを再構築することを、前記少なくとも1つのプロセッサに実行させるように構成される第3の決定コードと、を含む、前記少なくとも1つのプロセッサと、
を備える装置。
【請求項12】
前記NALユニットクラスが前記第1のNALユニットクラスであることに基づいて、時間的識別子(TID)がゼロであると決定される、請求項11に記載の装置。
【請求項13】
前記第1のNALユニットクラスは、前記NALユニットに対応するパラメータセットが複数の時間的レイヤに関連することを示す、請求項11に記載の装置。
【請求項14】
前記パラメータセットは、デコーダパラメータセット、ビデオパラメータセット、およびシーケンスパラメータセットのうちの少なくとも1つを含む、請求項13に記載の装置。
【請求項15】
前記第1のNALユニットクラスは、前記NALユニットに対応するパラメータセットが単一の符号化ピクチャに関連することを示す、請求項11に記載の装置。
【請求項16】
前記パラメータセットは、ピクチャパラメータセット、スライスパラメータセット、適応パラメータセット、およびヘッダパラメータセットのうちの少なくとも1つを含む、請求項15に記載の装置。
【請求項17】
前記第1のNALユニットクラスは、前記NALユニットが非規範的データに関連することを示す、請求項11に記載の装置。
【請求項18】
前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、前記プログラムコードは、前記少なくとも1つのプロセッサに、前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定させ、決定された前記TIDに基づいて前記NALユニットを再構築させるように構成される第3の決定コードをさらに含む、請求項11に記載の装置。
【請求項19】
前記第1のシンタックス要素は、禁止されたゼロビットを含む、請求項11に記載の装置。
【請求項20】
命令を記憶する非一時的なコンピュータ読取可能な媒体であって、前記命令は、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する装置の1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、
NALユニットヘッダに含まれる第1のシンタックス要素を復号するステップと、
前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップと、
前記NALユニットヘッダに含まれる第2のシンタックス要素を復号するステップと、
前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて、前記NALユニットを再構築するステップと、を実行させる1つまたは複数の命令を含む、非一時的なコンピュータ読取可能な媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、35U.S.C.§119の下で、2019年3月6日に米国特許商標庁に出願された米国仮出願第62/814,661号、および2019年7月2日に米国特許商標庁に出願された米国出願第16/459,883号に基づく優先権を主張し、その内容を全て参照により本明細書に組み込むものとする。
【0002】
開示された主題は、ビデオ符号化および復号に関し、より具体的には、特定のビットが、時間的レイヤプロパティを持つネットワーク抽象化レイヤ(Network Abstraction Layer、NAL-)ユニットについては時間的IDに使用され、時間的レイヤプロパティを持たないNALユニットについては他の目的のために使用される、NALユニットヘッダの符号化に関するものである。
【背景技術】
【0003】
動き補償を伴うイントラピクチャ予測を使用するビデオ符号化および復号の例は、何十年も前から知られている。非圧縮デジタルビデオは一連のピクチャを含むことができ、各ピクチャは、例えば、1920×1080輝度サンプルと関連する彩度サンプルの空間寸法を持っている。この一連のピクチャは、例えば毎秒60ピクチャまたは60Hzの固定または可変ピクチャレート(非公式には「フレームレート」とも呼ばれる)を持つことができる。非圧縮ビデオには、顕著なビットレート要件がある。例えば、サンプルあたり8ビットでの1080p60 4:2:0ビデオ(60Hzフレームレートでの1920×1080輝度サンプル解像度)には、1.5Gbit/sに近い帯域幅が必要となる。このようなビデオを1時間使用するには、600GBytesを超えた記憶空間が必要である。
【0004】
ビデオ符号化および復号の1つの目的は、圧縮によって入力ビデオ信号の冗長性を減らすことであり得る。圧縮は、前述の帯域幅または記憶空間の要件を、場合によっては2桁以上削減するのに役立つ。可逆圧縮と非可逆圧縮の両方、およびそれらの組み合わせを使用することができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構築できる技法を指す。非可逆圧縮を使用する場合、再構築された信号は元の信号と同一ではない可能性があるが、元の信号と再構築された信号の間の歪みは、再構築された信号を意図されたアプリケーションに役立てる程度に小さい。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量はアプリケーションによって異なる。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビ発行アプリケーションのユーザよりも高い歪みを許容できる。達成可能な圧縮率は、受け入れ可能/許容可能な歪みが大きいほど、圧縮率が高くなることを反映することができる。
【0005】
ビデオエンコーダおよびデコーダには、例えば、動き補償、変換、量子化、およびエントロピー符号化を含むいくつかの幅広いカテゴリからの技術を利用することができる。
【0006】
ネットワーク抽象化レイヤの例は、ITU-T Rec.H.264に提出された。符号化ビデオビットストリームは、ネットワーク抽象化レイヤ(NAL-)ユニットと呼ばれる個々のユニットに分割されることができる。各NALユニットは、開始符号エミュレーション防止に順守することなく解釈できるヘッダを持つことができる(NALユニットの他の部分で順守する必要があり、実施および計算に多大なコストがかかる可能性がある)。H.264(101)のNALユニットヘッダは、
図1に示すように、固定長のコードワードのみを含むように設計された。nal_unit_type(102)の特定の値については、NALユニットヘッダ(103)に第2のオクテット、場合によっては第3のオクテットを追加することで、特定の拡張が可能であり、各オクテットに固定長のコードワードが含まれていた。メディアアウェアネットワーク要素(Media Aware Network Element、MANE)、MCU、ファイル書き換え装置などは、これらの固定長のコードワードを用いて、完全なトランスコードを行わずに、また、開始符号エミュレーション防止に制約されることなく、ビットストリームを効果的に調整することができる。
【0007】
H.265では、やや簡略化された設計が選択された。H.265のNALユニットヘッダ(104)は2オクテットの固定長であり、NALユニットタイプ(105)、空間/SNRレイヤID(106)、時間的レイヤID(107)が含まれていた。拡張メカニズムは存在しなかった。H.264の設計と比較して、この設計は、ヘッダが常に2オクテットの長さであったのに対し、H.264の設計では可変長であるが、多くの場合1オクテットの長さであったため、一定の符号化効率の損失があった。一方、スケーラブルおよびマルチビューの拡張機能のサポートは大幅に簡素化され、スケーラブル/マルチビューと非スケーラブル/マルチビューのレガシーエンコードの間にある程度の後方互換性を可能にした。
【発明の概要】
【課題を解決するための手段】
【0008】
一実施形態では、少なくとも1つのプロセッサが実行する、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する方法が提供され、この方法は、NALユニットヘッダに含まれる第1のシンタックス要素を復号するステップと、前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップと、前記NALユニットヘッダに含まれる第2のシンタックス要素を復号するステップと、前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて、前記NALユニットを再構築するステップと、前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定された前記TIDに基づいて前記NALユニットを再構築するステップと、を含む。
【0009】
一実施形態では、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する装置が提供され、この装置は、プログラムコードを記憶するように構成される少なくとも1つのメモリと、前記プログラムコードを読み取り、前記プログラムコードによって指示されたとおりに動作するように構成される少なくとも1つのプロセッサと、を備える。前記プログラムコードは、前記少なくとも1つのプロセッサに、NALユニットヘッダに含まれる第1のシンタックス要素を復号させるように構成される第1の復号コードと、前記少なくとも1つのプロセッサに、前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定させるように構成される第1の決定コードと、前記少なくとも1つのプロセッサに、前記NALユニットヘッダに含まれる第2のシンタックス要素を復号させるように構成される第2の復号コードと、前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて前記NALユニットを再構築することを、少なくとも1つのプロセッサに実行させるように構成される第2の決定コードと、前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定された前記TIDに基づいて前記NALユニットを再構築することを、前記少なくとも1つのプロセッサに実行させるように構成される第3の決定コードと、を含む。
【0010】
一実施形態では、命令を記憶する非一時的なコンピュータ読取可能な媒体が提供され、前記命令は、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する装置の1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、NALユニットヘッダに含まれる第1のシンタックス要素を復号するステップと、前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップと、前記NALユニットヘッダに含まれる第2のシンタックス要素を復号するステップと、前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて前記NALユニットを再構築するステップと、前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定された前記TIDに基づいて前記NALユニットを再構築するステップと、を実行させる1つまたは複数の命令を含む。
【0011】
開示された主題のさらなる特徴、本質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになるであろう。
【図面の簡単な説明】
【0012】
【
図1】H.264とH.265に準拠するNALユニットヘッダの模式図である。
【
図2】一実施形態による通信システムの概略ブロック図である。
【
図3】一実施形態による通信システムの概略ブロック図である。
【
図4】一実施形態によるデコーダの概略ブロック図である。
【
図5】一実施形態によるエンコーダの概略ブロック図である。
【
図6】一実施形態による、NALユニットタイプクラスを使用するNALユニットヘッダの概略図である。
【
図7】一実施形態による、ビデオ復号のためのネットワーク抽象化レイヤ(Network Abstraction Layer、NAL)ユニットを再構築するための処理の一例を示すフローチャートである。
【
図8】一実施形態によるコンピュータシステムの概略図である。
【発明を実施するための形態】
【0013】
本開示は、ビデオ符号化および復号に関し、より具体的には、特定のビットが、時間的レイヤプロパティを持つネットワーク抽象化レイヤ(Network Abstraction Layer、NAL-)ユニットについては時間的IDに使用され、時間的レイヤプロパティを持たないNALユニットについては他の目的のために使用される、NALユニットヘッダの符号化に関するものである。
【0014】
H.264 NALユニットヘッダは多くの場合、コンパクトであるが、特定のアプリケーションに実用されているかもしれない時間的スケーラビリティを含む特定のアプリケーションには不十分である。H.265 NALユニットヘッダは、時間的スケーラビリティを効果的にサポートするが、最低16ビットが必要であり、将来の拡張のために未割り当てのコードポイントは、たとえあるとしてもごくわずかである。一方、H.265 NALユニットヘッダのシンタックス要素には、暗黙的に拒否される特定の値の組み合わせがあり、不必要な低エントロピーにつながる。例えば、シーケンスパラメータセットなどの特定のパラメータセットは、定義上、すべての時間的レイヤに属するNALユニットから構成される符号化ビデオシーケンス全体に適用される。それでも、シーケンスパラメータセットのH.265 NALユニットヘッダは、任意のコンプライアントビットストリームでゼロでなければならない時間的IDフィールドのために3ビットが浪費される。これらのビットを再利用することで、符号化効率を高めることができる。
【0015】
図2は、本開示の一実施形態による通信システム(200)の概略ブロック図を示している。システム(200)は、ネットワーク(250)を介して相互接続された少なくとも2つの端末(210~220)を含み得る。データの単方向送信の場合、第1の端末(210)は、ネットワーク(250)を介して他方の端末(220)へ送信するために、ビデオデータをローカル位置で符号化することができる。第2の端末(220)は、ネットワーク(250)から他方の端末の符号化ビデオデータを受信し、符号化されたデータをデコードし、復元されたビデオデータを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。
【0016】
図2は、例えば、ビデオ会議中に発生し得る符号化されたビデオデータの双方向送信をサポートするために提供される第2の対の端末(230,240)を示している。データの双方向送信の場合、各端末(230,240)は、ネットワーク(250)を介して他方の端末へ送信するために、ローカル位置でキャプチャされたビデオデータを符号化することができる。各端末(230,240)は、他方の端末から送信された符号化ビデオデータを受信し、符号化されたデータをデコードし、復元されたビデオデータをローカル表示装置に表示することもできる。
【0017】
図2において、端末(210~240)は、サーバ、パーソナルコンピュータおよびスマートフォンとして示され得るが、しかし、本開示の原理はこれに制限されることはない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤー、及び/又は専用のビデオ会議機器における用途を見出す。ネットワーク(250)は、例えば有線及び/又は無線通信ネットワークを含む、端末(210~240)間で符号化ビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク(250)は、回線交換及び/又はパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又はインターネットを含む。本議論の目的のために、ネットワーク(250)のアーキテクチャおよびトポロジーは、以下で説明されない限り、本開示の動作にとって重要でないかもしれない。
【0018】
図3は、開示された主題の適用の例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示している。開示された主題は、例えば、ビデオ会議、デジタルTV、および、CD、DVD、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他のビデオ対応アプリケーションに等しく適用可能である。
【0019】
ストリーミングシステムは、例えば非圧縮のビデオサンプルストリーム(302)を作成するデジタルカメラなどのビデオソース(301)を含むことができるキャプチャサブシステム(313)を含み得る。エンコードされたビデオビットストリームと比較して高データ量を強調するために太線で示されたサンプルストリーム(302)は、カメラ(301)に結合されたエンコーダ(303)によって処理されることができる。エンコーダ(303)は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか或いは実施するためのハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。サンプルストリームと比較してより低いデータ量を強調するために細い線で示された、エンコードされたビデオビットストリーム(304)は、将来使うためにストリーミングサーバ(305)に記憶されることができる。1つ又は複数のストリーミングクライアント(306,308)は、ストリーミングサーバ(305)にアクセスして、エンコードされたビデオビットストリーム(304)のコピー(307,309)を検索することができる。クライアント(306)は、エンコードされたビデオビットストリームの入り方向コピー(307)をデコードし、ディスプレイ(312)または他のレンダリングデバイス(図示せず)でレンダリングできる出方向ビデオサンプルストリームストリーム(311)を作成するビデオデコーダ(310)を含むことができる。一部のストリーミングシステムにおいて、ビデオビットストリーム(304,307,309)は、特定のビデオ符号化/圧縮規格に従ってエンコードされることができる。これらの規格の例は、ITU-T勧告H.265を含む。非公式的にヴァーサトゥルビデオ符号化(Versatile Video Coding)またはVVCとして知られるビデオ符号化規格は、発展中である。開示された主題は、VVCの文脈に使用され得る。
【0020】
図4は、本開示の一実施形態によるビデオデコーダ(310)の機能ブロック図であってもよい。
【0021】
受信機(410)は、デコーダ(310)によってデコードされる1つ又は複数の符号化ビデオシーケンスを受信することができ、同じまたは別の実施形態では、一度に1つの符号化ビデオシーケンスを受信してもよく、各符号化ビデオシーケンスのデコードは、他の符号化ビデオシーケンスから独立している。符号化ビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア/ソフトウェアリンクであり得るチャネル(412)から受信されることができる。受信機(410)は、それぞれの使用エンティティ(図示せず)に転送され得る他のデータ、例えば、符号化オーディオデータ及び/又は補助データストリームとともに、エンコードされたビデオデータを受信し得る。受信機(410)は、符号化ビデオシーケンスを他のデータから分離することができる。ネットワークジッタを防止するために、バッファメモリ(415)は、受信機(410)とエントロピーデコーダ/パーサ(420)(以降、「パーサ」)との間に結合されてもよい。受信機(410)が、十分な帯域幅および可制御性を有する記憶/転送装置から、または等同期ネットワークからデータを受信する際に、バッファ(415)は必要とされないことがあり、または小さくされることがある。インターネットなどのベストエフォートパケットネットワークで使用するために、バッファ(415)が必要になる場合があり、バッファ(415)は、比較的大きいことがあり、有利には適応サイズであることができる。
【0022】
ビデオデコーダ(310)は、エントロピー符号化されたビデオシーケンスからシンボル(421)を再構築するパーサ(420)を含んでもよい。これらのシンボルのカテゴリは、デコーダ(310)の動作を管理するために使用される情報を含んで、デコーダの不可欠な部分ではないが、
図3に示されるようにデコーダに結合され得るディスプレイ(312)などのレンダリングデバイスを制御する情報を潜在的に含む。レンダリングデバイスのための制御情報は、補助強化情報(SEIメッセージ)またはビデオユーザビリティ情報(VUI)パラメータセットフラグメント(図示せず)の形態であってよい。パーサ(420)は、受信された符号化ビデオシーケンスを構文解析/エントロピーデコードすることができる。符号化ビデオシーケンスの符号化は、可変長符号化、ハフマン符号化、文脈感受性を有するもしくは有さない算術符号化などを含む、ビデオ符号化技術または規格に合わせることができ、当業者によく知られている原理に従うことができる。パーサ(420)は、グループに対応する少なくとも1つのパラメータに基づいて、符号化ビデオシーケンスからビデオデコーダ内の画素の少なくとも1つのサブグループのためのサブグループパラメータのセットを抽出することができる。サブグループは、ピクチャ群(GOP)、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット(CU)、ブロック、変換ユニット(TU)、予測ユニット(PU)などを含むことができる。エントロピーデコーダ/パーサは、符号化ビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報をも抽出することができる。
【0023】
パーサ(420)は、シンボル(421)を作成するために、バッファ(415)から受信されたビデオシーケンスに対してエントロピーデコード/構文解析動作を実行することができる。
【0024】
シンボル(421)の再構築は、符号化ビデオピクチャまたはその一部(例えば、インターおよびイントラピクチャ、インターおよびイントラブロック)のタイプ、および他の要因に応じて、複数の異なるユニットが関与することができる。どのユニットが、どのように関与するかは、パーサ(420)によって符号化ビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ(420)と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために図示せず。
【0025】
すでに述べた機能ブロックに加え、デコーダ310は、以下で説明されるようにいくつかの機能ユニットに概念的に細分されることができる。商業的な制約の下で実際の実施操作にあたっては、これらのユニットの多くは互いに密接に相互作用し、少なくとも一部は互いに統合することができる。しかしながら、開示された主題の説明の目的で、以下の機能ユニットへの概念的な細分は、適切に行われる。
【0026】
第1のユニットは、スケーラ/逆変換ユニット(451)である。スケーラ/逆変換ユニット(451)は、使用する変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報と、量子化された変換係数をシンボル(421)としてパーサ(420)から受信する。また、アグリゲータ(455)に入力可能なサンプル値を含むブロックを出力することができる。
【0027】
場合によっては、スケーラ/逆変換(451)の出力サンプルは、イントラ符号化ブロック、すなわち、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックに関係することがある。このような予測情報は、イントラピクチャ予測ユニット(452)によって提供されることができる。場合によっては、イントラピクチャ予測ユニット(452)は、現在の(部分的に再構築された)ピクチャ(458)から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックの同じサイズおよび形状のブロックを生成する。アグリゲータ(455)は、場合によっては、サンプルごとに、イントラ予測ユニット(452)が生成した予測情報を、スケーラ/逆変換ユニット(451)によって提供される出力サンプル情報に追加する。
【0028】
他の場合では、スケーラ/逆変換ユニット(451)の出力サンプルは、インター符号化された、潜在的に動き補償されたブロックに関係することがある。このような場合、動き補償予測ユニット(453)は、参照ピクチャメモリ(457)にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル(421)に従って動き補償した後、出力サンプル情報を生成するように、これらのサンプルは、アグリゲータ(455)によってスケーラ/逆変換ユニットの出力に追加されることができる(この場合、残差サンプルまたは残差信号と呼ばれる)。動き補償ユニットが予測サンプルを取り出す参照ピクチャメモリ内のアドレスは、例えば、X、Y、および参照ピクチャ成分を有し得るシンボル(421)の形態で動き補償ユニットに利用可能な動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトルが使用中であるときに参照ピクチャメモリから取り出されたサンプル値の補間、動きベクトル予測メカニズムなどを含むこともできる。
【0029】
アグリゲータ(455)の出力サンプルは、ループフィルタユニット(456)において様々なループフィルタリング技法を受けられる。ビデオ圧縮技術は、符号化されたビデオビットストリームに含まれる、パーサ(420)からのシンボル(421)としてループフィルタユニット(456)に利用可能とされたパラメータによって制御されることができ、それに、符号化ピクチャまたは符号化ビデオシーケンスの(デコード順で)前の部分のデコード中に取得されたメタ情報に応じるとともに、予め再構築されループフィルタリングされたサンプル値に応じることもできるループ内フィルタ技術を含むことができる。
【0030】
ループフィルタユニット(456)の出力は、レンダリングデバイス(312)へ出力されることができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリに記憶されることができるサンプルストリームであり得る。
【0031】
特定の符号化ピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用されることができる。一符号化ピクチャが完全に再構築され、該当符号化ピクチャが(例えば、パーサ(420)によって)参照ピクチャとして識別されると、現在参照ピクチャ(456)は、参照ピクチャバッファ(457)の一部になることができ、次の符号化ピクチャの再構築を開始する前に新しい現在ピクチャメモリを再割当てすることができる。
【0032】
ビデオデコーダ310は、ITU-T Rec.H.265などの規格で文書化され得る所定のビデオ圧縮技術に従ってデコード操作を実行することができる。符号化ビデオシーケンスは、ビデオ圧縮技術の文書または規格、具体的にはその中のプロファイル文書で指定されているように、ビデオ圧縮技術または規格のシンタックスに準拠しているという意味で、使用されているビデオ圧縮技術または規格によって指定されるシンタックスに準拠し得る。符号化ビデオシーケンスの複雑さがビデオ圧縮技術または規格のレベルで定義される範囲内にあることも、コンプライアンスに必要である。場合によっては、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート(例えば、1秒あたりのメガサンプルで測定される)、最大参照ピクチャサイズなどがレベルによって制限される。レベルによって設定された制限は、場合によっては、符号化ビデオシーケンスでシグナリングされたHRDバッファ管理のための仮想参照デコーダ(HRD)仕様およびメタデータによってさらに制限され得る。
【0033】
一実施形態では、受信機(410)は、エンコードされたビデオとともに追加の(冗長な)データを受信することができる。追加のデータは、符号化ビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、及び/又は、元のビデオデータをより正確に再構築するためにビデオデコーダ(310)によって使用され得る。追加のデータは、例えば、時間的、空間的、またはSNRエンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態にされることができる。
【0034】
図5は、本開示の一実施形態によるビデオエンコーダ(303)の機能ブロック図であってもよい。
【0035】
エンコーダ(303)は、エンコーダ(303)によって符号化されるビデオ画像をキャプチャし得るビデオソース(30l)(エンコーダの一部ではない)からビデオサンプルを受信することができる。
【0036】
ビデオソース(301)は、エンコーダ(303)によって符号化されるソースビデオシーケンスを、任意の適切なビット深度(例えば、8ビット、10ビット、12ビット、・・・)、任意の色空間(例えば、BT.601 Y CrCB、RGB、・・・)および任意の適切なサンプリング構造(例えば、Y CrCb 4:2:0、Y CrCb 4:4:4)であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース(301)は、予め準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース(30l)は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、順番に見られるときに動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて1つ又は複数のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明ではサンプルを中心に説明する。
【0037】
一実施形態によれば、エンコーダ(303)は、リアルタイムでまたはアプリケーションが要求する任意の他の時間制約の下でソースビデオシーケンスのピクチャを符号化し、符号化ビデオシーケンス(543)に圧縮することができる。適切な符号化速度を実施することは、コントローラ(550)の機能の1つである。コントローラは、以下で説明される他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。その結合は、分かりやすくするために描かれていない。コントローラによって設定されるパラメータは、レート制御関連パラメータ(ピクチャスキップ、量子化、レート歪み最適化技法のラムダ値、・・・)、ピクチャサイズ、ピクチャ群(GOP)レイアウト、最大動きベクトル検索範囲などを含むことができる。当業者は、特定のシステム設計に対して最適化されたビデオエンコーダ(303)に関連し得るので、コントローラ(550)の他の適切な機能を容易に特定することができる。
【0038】
ビデオエンコーダには、当業者が「符号化ループ」として容易に認識できる方法で動作するものがある。過度に簡略化した説明として、符号化ループは、エンコーダのエンコード部分(530)(以下、「ソースコーダ」)(符号化対象となる入力ピクチャおよび参照ピクチャに基づくシンボルの作成を担当する)、および、シンボルを再構築して、(リモート)デコーダも作成するサンプルデータを作成する(シンボルと符号化されたビデオビットストリーム間の如何なる圧縮は、開示された主題で考慮されるビデオ圧縮技術では可逆であるためである)エンコーダ(303)に埋め込まれた(ローカル)デコーダ(533)を含むことができる。再構築されたサンプルストリームは参照ピクチャメモリ(534)に入力される。シンボルストリームのデコードにより、デコーダの位置(ローカルまたはリモート)に関係なくビット正確な結果が得られるため、参照ピクチャバッファのコンテンツもローカルエンコーダとリモートエンコーダの間でビット正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコード中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性の該基本原理(および例えばチャネルエラーに起因して同期性を維持できない場合に生じるドリフト)は、当業者にはよく知られている。
【0039】
「ローカル」デコーダ(533)の動作は、前文で
図4に関連して既に詳細に説明された、「リモート」デコーダ(310)の動作と同様であり得る。しかしながら、
図4をも簡単に参照し、シンボルが使用可能であり、エントロピーコーダ(545)およびパーサ(420)による符号化ビデオシーケンスへのシンボルのエンコード/デコードは可逆であり得るので、チャネル(412)、受信機(410)、バッファ(415)、およびパーサ(420)を含むデコーダ(310)のエントロピーデコード部分は、ローカルデコーダ(533)では完全に実施されない場合がある。
【0040】
これで分かるように、デコーダに存在する構文解析/エントロピーデコード以外の如何なるデコーダ技術も、対応するエンコーダに実質的に同一の機能的形態で必ず存在する必要がある。このため、開示された主題は、デコーダの動作に焦点を合わせている。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため、省略できる。特定の領域でのみ、より詳細な説明が必要であり、以下に提供される。
【0041】
ソースコーダ(530)は、その動作の一部として、「参照フレーム」として指定されたビデオシーケンスからの1つ又は複数の予め符号化されたフレームを参照して入力フレームを予測的に符号化する動き補償予測符号化を実行してもよい。このようにして、符号化エンジン(532)は、入力フレームの画素ブロックと、入力フレームへの予測基準として選択され得る参照フレームの画素ブロックとの差異を符号化する。
【0042】
ローカルビデオデコーダ(533)は、ソースコーダ(530)で作成されたシンボルに基づいて、参照フレームとして指定され得るフレームの符号化ビデオデータをデコードすることができる。符号化エンジン(532)の動作は、有利にはロッシープロセスであり得る。符号化ビデオデータがビデオデコーダ(
図5に図示せず)でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ(533)は、ビデオデコーダによって参照フレームに対して実行され得るデコードプロセスを再現し、再構築された参照フレームを参照ピクチャキャッシュ(534)に記憶させることができる。このようにして、エンコーダ(303)は、遠端ビデオデコーダによって取得される再構築された参照フレームと共通するコンテンツ(送信エラー無し)を有する再構築された参照ピクチャのコピーをローカルに記憶し得る。
【0043】
予測器(535)は、符号化エンジン(532)の予測検索を実行することができる。つまり、符号化対象となる新しいフレームについて、予測器(535)は、(候補の参照画素ブロックとしての)サンプルデータ、または、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ(534)で検索することができる。予測器(535)は、適切な予測基準を見つけるために、サンプルブロック/画素ブロックごとに動作することができる。場合によっては、予測器(535)で取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ(534)に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。
【0044】
コントローラ(550)は、例えば、ビデオデータをエンコードするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ(530)の符号化動作を管理することができる。
【0045】
前述のすべての機能ユニットの出力は、エントロピーコーダ(545)においてエントロピー符号化を受けられる。エントロピーコーダは、様々な機能ユニットによって生成されたシンボルを、例えばハフマン符号化、可変長符号化、算術符号化などの当業者に知られている技術に従って可逆圧縮することにより、符号化ビデオシーケンスに変換する。
【0046】
送信機(540)は、エントロピーコーダ(545)によって作成された符号化ビデオシーケンスをバッファリングして、エンコードされたビデオデータを記憶する記憶装置へのハードウェア/ソフトウェアリンクであり得る通信チャネル(560)を介した送信に備えることができる。送信機(540)は、ビデオコーダ(530)からの符号化ビデオデータを、送信されるべき他のデータ、例えば、符号化オーディオデータ及び/又は補助データストリーム(ソースは図示せず)とマージすることができる。
【0047】
コントローラ(550)は、エンコーダ(303)の動作を管理し得る。符号化中、コントローラ(550)は、各符号化ピクチャに特定の符号化ピクチャタイプを割り当てることができ、これは、それぞれのピクチャに適用され得る符号化技法に影響を及ぼす可能性がある。例えば、ピクチャは多くの場合、次のフレームタイプのいずれかとして割り当てられてもよい。
【0048】
イントラピクチャ(Iピクチャ)は、シーケンス内の他のいかなるフレームを予測源として使用することなく、符号化および復号されることができるピクチャのことである。ビデオコーデックの中には、例えば、インディペンデントデコーダリフレッシュピクチャ(Independent Decoder Refresh Picture)を含む、異なるタイプのイントラピクチャを許容するものがある。当業者であれば、それらのIピクチャの変形およびそれぞれの用途および特徴を知っている。
【0049】
予測ピクチャ(Pピクチャ)は、各ブロックのサンプル値を予測するために、最大1つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化および復号されることができるピクチャのことである。
【0050】
双方向予測ピクチャ(Bピクチャ)は、各ブロックのサンプル値を予測するために、最大2つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化および復号されることができるピクチャのことである。同様に、多重予測ピクチャは、単一のブロックの再構築のために、2つを超えた参照ピクチャおよび関連メタデータを使用することができる。
【0051】
ソースピクチャは、一般に、複数のサンプルブロック(例えば、それぞれ、4×4、8×8、4×8、または16×16サンプルのブロック)に空間的に細分され、ブロック単位で符号化され得る。ブロックは、ブロックのそれぞれのピクチャに適用される符号化割り当てによって決定された他の(既に符号化された)ブロックを参照して予測的に符号化され得る。例えば、Iピクチャのブロックは、非予測的に符号化されてもよく、或いは、同じピクチャの既に符号化されたブロックを参照して予測的に符号化されてもよい(空間予測またはイントラ予測)。Pピクチャの画素ブロックは、予め符号化された1つの参照ピクチャを参照して、空間予測を介してまたは時間予測を介して非予測的に符号化され得る。Bピクチャのブロックは、予め符号化された1つまたは2つの参照ピクチャを参照して、空間予測を介してまたは時間予測を介して非予測的に符号化され得る。
【0052】
ビデオコーダ(303)は、ITU-T Rec.H.265などの予め設定されたビデオ符号化技術または規格に従って、符号化動作を行うことができる。動作中、ビデオコーダ(303)は、入力ビデオシーケンスの時間的および空間的冗長性を利用する予測符号化動作を含む、様々な圧縮動作を実行することができる。したがって、符号化ビデオデータは、使用されるビデオ符号化技術または規格によって指定されたシンタックスに準拠する場合がある。
【0053】
一実施形態では、送信機(540)は、エンコードされたビデオとともに追加のデータを送信することができる。ビデオコーダ(530)は、そのようなデータを符号化ビデオシーケンスの一部として含み得る。追加のデータは、時間的/空間的/SNRエンハンスメントレイヤ、冗長なピクチャやスライスなどの他の形態での冗長なデータ、補助強化情報(Supplementary Enhancement Information、SEI)メッセージ、ビデオユーザビリティ情報(Visual Usability Information、VUI)パラメータセットフラグメントなどを含み得る。
【0054】
以下では、ビデオコーデックの高レベルシンタックス、特にNALユニットヘッダ(NUH)の設計に焦点を当てて説明する。
【0055】
NUHは、複雑なシンタックスを扱うことが期待できるデコーダによって解釈されるだけでなく、MANE、ファイル書き換え装置など(以下、MANE)によっても解釈され得るため、その設計は、可変長符号(VLC)や算術符号化などの複雑なエントロピー符号化スキームを避けなければならないことがある。一方、シンタックス要素の条件付き存在または条件付き解釈を含むある程度の複雑さは、特にそれらのシンタックス要素で伝達される情報をNUHの外に移動してNALユニットペイロードに移動する必要がある場合、またはNUHを不必要に大きくする必要がある場合は、許容可能である。
【0056】
MANEによる処理のしやすさなど、様々な理由から、NUHはオクテット整列されており(これは、ビット単位の長さは8で割り切れることを意味する)、そうしないと、(レート歪み性能および計算の複雑さの点で)不要で高価なパディングが必要になる場合がある。また、MPEG-2トランスポートストリームチャンネルでビデオを伝送する際には、開始符号エミュレーション防止のために、最低でも1ビット(H.264およびH.265 NUHの両方でforbidden_zero_bitと呼ばれる)が必要になる場合がある。この仮定の下で、NALユニットヘッダの理論上の最小長は8ビットとなる。最も一般的なNALユニットタイプ(NUT)については、これらの8ビット内に収まるように設計すべきであるが、よりエキゾチックで頻度の低いNUT、または、例えばIピクチャとその派生ピクチャ或いは基本的に非圧縮形式で符号化されたピクチャなど、符号化されたピクチャタイプに対する割合としてのヘッダのオーバーヘッドが無視できるNUTについては、より多くのビットを必要とする場合がある。そのため、NALユニットヘッダのフィールドに必要なビット数を最小限に抑えることが重要になる場合がある。個々のフィールドの長さを短くすることができれば、それは有利になる場合がある。しかし、フィールドの長さが短くなると、フィールドで表現できる使用可能なコードポイントの数が少なくなることを意味する。
【0057】
H.265の発展中に、H.264のものと比較して多数の追加のNUTが確認された。さらに、H.265では、NALユニットヘッダの時間的スケーラビリティシグナリングが、H.265のメインプロフィールと呼ばれるベースラインプロフィールに提出され、現在、一般的に使用されることができる。VVCなどの将来のビデオ符号化規格では、NUTの数も時間的スケーラビリティの必要性もなくなることはないと予想できる。NUTに6ビット、forbidden_zero_bitに1ビット、時間的レイヤリング情報に3ビットを使用すると、1つは10ビットになるため、オクテット整列により、H.265では16ビットのNUHになる。同様の計算が、執筆時点でのVVCワーキングドラフトにも適用される。
【0058】
それでも、符号化効率の観点から、少なくとも、Pピクチャ/スライス/タイルグループ、Bピクチャ/スライス/タイルグループなどを含み得る後端のピクチャなどの最も一般的なNUTについては、時間的スケーラビリティシグナリングのオプションを維持しつつ、単一のオクテットのみのNUHを使用することが望ましいであろう。時間的IDに3ビット、forbidden_zero_bitに1ビットが必要であるとすると、NUTフィールドには4ビットしか利用できず、結果的に合計16個のNUTが可能となる。H.265も、VVCなどの将来のビデオ符号化規格も、16個以下のNUTを使用する可能性はない。
【0059】
開示された主題の実施形態は、設計により、すべての時間的レイヤに適用され得るか、または時間的レイヤリングとは概念的に独立しているそれらのNALユニットタイプのために、NUTの追加のデマルチプレックスポイントとして、時間的IDのために留保されたビットを条件付きで使用することによって、この要望を実現する。
【0060】
特定のNALユニットタイプは、時間的レイヤリングから独立していてもよい。多くの場合、H.265などの関連技術では、これらのNALユニットについて、時間的IDをゼロに設定することがビットストリーム・コンプライアンスの要件になっている。その他の場合、H.265などの関連技術は、デコーダに対して時間的IDの値を無視するように指示したり、このフィールドで許容される値について沈黙したりするが、これは同じ効果をもたらす可能性がある。
【0061】
それらの時間的IDにとらわれないNALユニットタイプの例は次の通りである。
【0062】
(1)おそらく過度に広範な特性として、多くのNAL NUTは時間的レイヤプロパティを持たないかもしれない。対照的に、多くのVCL NUTは時間的レイヤプロパティを持つかもしれない。
【0063】
(2)例えばデコーダパラメータセット、ビデオパラメータセット、およびシーケンスパラメータセットを含む特定のパラメータセットは、少なくとも符号化ビデオシーケンス(CVS)をその範囲として有し得る。CVSは、定義上、複数の時間的レイヤに属するNALユニットを含むことができる。したがって、そのようなパラメータセットは、時間的IDにとらわれない場合がある。
【0064】
(3)例えばピクチャパラメータセット、スライスパラメータセット、適応パラメータセット、ヘッダパラメータセットなどの「下位」パラメータセットは、単一の符号化ピクチャまたはその一部をその範囲として有してもよい。所与の符号化ピクチャは、定義された時間的レイヤを有してもよい。そのため、場合によっては、これらのパラメータセットのパラメータセットNALユニット内の時間的IDを使用して、タイプおよびパラメータセットIDは同じであるが、時間的レイヤが異なるパラメータセットを区別することが賢明であり得る。例えば、使用中の複数の時間的レイヤをカバーする、ピクチャパラメータセットIDが0である複数のピクチャパラメータセットを持つことが賢明であり得る。このような設計上の選択が賢明である理由は、パラメータセットIDの符号化が、場合によっては、(H.265で確立された規則に従って文書化された場合、ue(v)の記述子を持つ)スライス/タイル/タイルグループヘッダの可変長符号化フィールドであるためである。ue(v)のシンタックス要素は、値が大きくなるとサイズが急速に大きくなるが、NALユニットヘッダの時間的IDフィールドは3ビットに固定されている。また、所与のビットストリームには、ue(v)符号化されたパラメータセットIDを備えるスライス/タイル/タイルグループヘッダを含むNALユニットが、同じビットストリーム内のパラメータセットNALユニットよりも多く存在する可能性がある。
【0065】
一方、このような「下位」パラメータセットの時間的IDフィールドをデマルチプレックスポイントとして使用しない場合、NALユニットヘッダを8ビットから16ビットに拡張する必要があり、これは、わずかに長いue(v)で符号化されたパラメータセットIDのシンタックス要素よりもかなりコストがかかる可能性がある。そのため、「下位」パラメータセットであっても、時間的IDをデマルチプレックスポイントとして使用し、時間的レイヤに関連付けられた「下位」タイプの複数のパラメータセットを表すためにパラメータセットIDのより大きなナンバリングスペースに依存することが理にかなっていることがある。本稿執筆時点でのVVCドラフトはそれを認識し、ピクチャパラメータセット又は適応パラメータセットに時間的IDフィールドを使用していない。その結果、それらのパラメータセットのタイプは、時間的IDフィールドに使用されるビットによってデマルチプレクスされることもできる。
【0066】
(4)特定のNALユニットタイプは、特定のクラスのSEIメッセージや、フィラーデータ、ピクチャデリミタなどの他の非規範的データ、およびエンド・オブ・ストリーム・マーカなどの特定のマーカのために留保されることがある。それらのNALユニットが時間的IDを監視しない限り、これらのNALユニットはすべて単一のNALユニットタイプを共有し、時間的IDの値によって区別され得る。
【0067】
図6は、H.264のものとサイズが似ている、すなわち8ビットである一実施形態によるNUH(601)の例を示している。NUH(601)の例は、forbidden_zero_bit(602)、4ビットのNALUクラスのシンタックス要素(603)、および3ビットのTIDタイプのシンタックス要素(604)を含む。TIDタイプのシンタックス要素は、一実施形態によれば、特定のNALUクラスに対して、そのクラスのNALユニットタイプを区別するための追加のデマルチプレックスポイントとして、再利用することができる。例えば、以下でより詳細に説明されるように、例示的なNUH(605)においてNALクラスがIRAPクラス(606)に設定されている場合、NALユニットタイプをIDR_N_LPとして識別するためにTIDタイプビット(ここでは1であり、IDR-N-LP NALユニットを識別する)(607)の値の使用をトリガすることができる。
【0068】
多用途ビデオ符号化(Versatile Video Coding、VVC)は、ITU-T Rec.H.266としても公開される。JVET-M1001-v5として公開されているVVC Draft 4 version 5のワーキングドラフトを参照すると、VVC NALユニットヘッダが16ビットを占めていることが分かる(JVET-M1001-v5の27ページを参照)。具体的には、VVC NUHは、禁止されたゼロビット(forbidden zero bit)として1ビット、nal_unit_typeのために5ビット、時間的IDのために3ビットを使用し、7ビットを留保している。
【0069】
以下の表1および表2は、JVET-M1001-v5の表7-1に対応している。
【0070】
【0071】
【0072】
しかし、未指定/留保済みのビット/コードポイントおよび暗黙的拡張性を無視すると、この16ビットヘッダの全機能は、本開示事項に従って、以下の実施形態と同じまたは別の実施形態において、8ビットのNUHを使用して実施されることができる。
【0073】
示されているように、8ビットのNUHを使用すると、VVCにおいて現在定義されているNALユニットタイプの全機能(将来の拡張に関して完全な柔軟性である必要はない)を実施するために、8クラスのみが必要とされる。
【0074】
同じまたは別の実施形態では、他の割り当ても可能である。例えば、上記の「MARKER_Class」および「SEI_Class」としてリストされているものを、例えば以下の表3に示すように、1つのクラスに適切に組み合わせることができる。
【0075】
【0076】
表3の例では、4ビットのNALユニットクラスフィールドを介して有効化された使用可能な16個のコードポイントのうち、7個のみが使用される。
【0077】
特定の場合において、同じまたは別の実施形態において、「forbidden_zero_bit」を追加のデマルチプレクスポイントとして使用することができる。「forbidden_zero_bit」は、主にビットストリームがMPEG-2システム上で伝送される場合に、特定の限られた環境での開始符号エミュレーションを防ぐために、歴史的にNALユニットヘッダに含まれていた。おそらく、標準化団体がMPEG-2システム上で伝送される必要性を想定していないVVC技術やビットストリームが存在する可能性がある。これらの技術に関連するNALユニットは、1に設定されたforbidden_zero_bitをデマルチプレクスポイントとして使用している可能性がある。
【0078】
開始符号エミュレーション防止のために、forbidden_zero_bitが1に設定されている場合、NALユニットヘッダの8ビットの256個の可能な値のうち128個が、NALユニットタイプ、時間的IDなどの情報を示すために使用できることが理解されるだろう。特定の環境では、これらの128ビットの組み合わせ(1に等しいforbidden_zero_bitを持つ)のすべてではなく一部が、特定の開始符号のエミュレーションを防ぐために留保されることがある。例えば、「付録B」と呼ばれる開始符号エミュレーションを防ぐためには、NALユニットヘッダの第1のオクテットの値が0になることだけを避ける必要がある。MPEG-2パッケタイズドエレメンタリーストリーム(Packetized Elementary Stream、「PES-」)チャンネルの開始符号エミュレーションを防ぐためには、188から255までの値のみを避ける必要がある。他のシステム規格では、異なるが概念的に同等の制約がある。NALユニットクラスとTIDタイプの許容値を設定する際には、これらの制約を念頭に置くことで、開始符号エミュレーションが必要な場合でも、禁止されたゼロビットをデマルチプレクスポイントとして使用することができる。
【0079】
同じまたは別の実施形態では、所与のNALユニットクラスの値は、NALユニットヘッダ内の1つまたは複数の追加のオクテットの存在を示すものとして使用されることができる。そのような追加のオクテットは、あまり一般的に使用されないNALユニットの符号化オプションをさらに拡張するために使用されてもよい。
【0080】
図7は、中間候補を用いてマージ候補リストを生成するための処理700の一例のフローチャートである。いくつかの実施において、
図7の1つまたは複数の処理ブロックは、デコーダ310によって実行されてもよい。いくつかの実施において、
図7の1つまたは複数の処理ブロックは、エンコーダ303など、デコーダ310とは別の、またはデコーダ310を含む他のデバイスまたはデバイス群によって実行されてもよい。
【0081】
図7に示されるように、処理700は、NALユニットヘッダに含まれる第1のシンタックス要素および第2のシンタックス要素を復号するステップ(ブロック710)を含んでもよい。
【0082】
図7にさらに示されるように、処理700は、第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップ(ブロック720)を含んでもよい。
【0083】
図7にさらに示されるように、処理700は、NALユニットクラスが第1のNALユニットクラスであるか否かを決定するステップ(ブロック730)を含んでもよい。NALユニットクラスが第1のNALユニットクラスであれば、処理700はブロック740に進んでもよい。NALユニットクラスが第1のNALユニットクラスではなければ、処理700は、ブロック750に進んでもよい。
【0084】
図7にさらに示されるように、処理700は、NALユニットクラスが第1のNALユニットクラスであることに基づいて、NALユニットクラスと第2のシンタックス要素との組み合わせを用いて、NALユニットタイプの中からNALユニットタイプを決定し、決定されたNALユニットタイプに基づいてNALユニットを再構築するステップ(ブロック750)を含んでもよい。
【0085】
図7にさらに示されるように、処理700は、NALユニットクラスが第2のNALユニットクラスであるか否かを決定するステップ(ブロック750)を含んでもよい。NALユニットクラスが第2のNALユニットクラスであれば、処理700は、ブロック760に進んでもよい。
【0086】
図7にさらに示されるように、処理700は、NALユニットクラスが第2のNALユニットクラスであることに基づいて、第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定されたTIDに基づいてNALユニットを再構築するステップ(ブロック760)を含んでもよい。
【0087】
一実施形態において、NALユニットクラスが第1のNALユニットクラスであることに基づいて、TIDがゼロであると決定される。
【0088】
一実施形態において、第1のNALユニットクラスは、NALユニットに対応するパラメータセットが複数の時間的レイヤに関連することを示してもよい。
【0089】
一実施形態において、パラメータセットは、デコーダパラメータセット、ビデオパラメータセット、およびシーケンスパラメータセットのうちの少なくとも1つを含んでもよい。
【0090】
一実施形態において、第1のNALユニットクラスは、NALユニットに対応するパラメータセットが単一の符号化ピクチャに関連することを示してもよい。
【0091】
一実施形態において、パラメータセットは、ピクチャパラメータセット、スライスパラメータセット、適応パラメータセット、およびヘッダパラメータセットのうちの少なくとも1つを含んでもよい。
【0092】
一実施形態において、第1のNALユニットクラスは、NALユニットが非規範的データに関連することを示してもよい。
【0093】
一実施形態において、非規範的データは、補助強化情報、フィラーデータ、およびピクチャデリミタデータを含んでもよい。
【0094】
一実施形態において、第1のシンタックス要素は、第1の固定長の2値符号化されたNALユニットシンタックス要素を含んでもよく、第2のシンタックス要素は、第2の固定長の2値符号化されたNALユニットシンタックス要素を含んでもよい。
【0095】
一実施形態では、第1のシンタックス要素は、禁止されたゼロビットを含んでもよい。
【0096】
図7は処理700の例示的なブロックを示しているが、いくつかの実施では、処理700は、
図7に描かれているものよりも追加のブロック、少ないブロック、異なるブロック、または異なる配置のブロックを含んでもよい。さらに、または代わりに、処理700のブロックのうちの2つまたはそれより多くのブロックを並行して実行してもよい。
【0097】
さらに、提案された方法は、処理回路(例えば、1つまたは複数のプロセッサまたは1つまたは複数の集積回路)によって実施されてもよい。一例では、1つまたは複数のプロセッサは、非一時的なコンピュータ読取可能な媒体に記憶されているプログラムを実行して、提案された方法のうちの1つまたは複数を実行する。
【0098】
以上で説明されたネットワーク抽象化ユニットヘッダのための技法は、コンピュータ読取可能な命令を使用するコンピュータソフトウェアとして実施され、1つまたは複数のコンピュータ読取可能な媒体に物理的に記憶されることができる。例えば、
図8は、開示された主題のいくつかの実施形態を実施することに適したコンピュータシステム800を示す。
【0099】
コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、コンピュータ中央処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いて符号化されることができる。
【0100】
命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。
【0101】
コンピュータシステム800について、
図8に示されるコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム800の例示的な実施形態で示されるコンポーネントのうちのいずれか1つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。
【0102】
コンピュータシステム800は、いくつかのヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、オーディオ入力(音声、拍手など)、視覚入力(ジェスチャーなど)、嗅覚入力(図示せず)によって、1人以上のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ(音声、音楽、環境音など)、画像(走査画像、静止画像カメラから取得される写真画像など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)など、人間による意識的な入力に必ずしも直接関係しない特定のメディアをキャプチャすることにも使用できる。
【0103】
入力ヒューマンインターフェースデバイスは、キーボード801、マウス802、トラックパッド803、タッチスクリーン810、データグローブ1204、ジョイスティック805、マイクフォン806、スキャナ807、カメラ808(それぞれ1つのみ示されている)のうちの1つまたは複数を含み得る。
【0104】
コンピュータシステム800は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚/味覚を介して1人以上のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン810、データグローブ1204、またはジョイスティック805による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい)、オーディオ出力デバイス(スピーカ809、ヘッドホン(図示せず)など)、視覚出力デバイス(陰極線管(CRT)スクリーン、液晶ディスプレイ(LCD)スクリーン、プラズマスクリーン、有機発光ダイオード(OLED)スクリーンを含むスクリーン810(それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、2次元の視覚出力または3次元以上の出力を出力することができる)、仮想現実眼鏡(図示せず)、ホログラフィックディスプレおよびスモークタンク(図示せず)など)、およびプリンタ(図示せず)を含み得る。
【0105】
コンピュータシステム800は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、CD/DVDなどの媒体821付きのCD/DVD ROM/RW820を含む光学媒体、サムドライブ822、リムーバブルハードドライブまたはソリッドステートドライブ823、テープやフロッピーディスクなどの従来の磁気媒体(図示せず)、セキュリティドングルなどの専用のROM/ASIC/PLDベースのデバイス(図示せず)などをも含むことができる。
【0106】
ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するであろう。
【0107】
コンピュータシステム800は、1つまたは複数の通信ネットワークへのインターフェースをさらに含むことができる。ネットワークは、例えば、無線、有線、光学的であり得る。ネットワークは、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワークの例は、イーサネット、無線LANなどのローカルエリアネットワーク、グローバル・システム・フォー・モバイル・コミュニケーションズ(GSM)、第3世代(3G)、第4世代(4G)、第5世代(5G)、長期進化(LTE)などを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上放送TVを含むTV有線または無線広域デジタルネットワーク、CANBusを含む車両用や産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス849(例えば、コンピュータシステム800のユニバーサル・シリアル・バス(USB)ポートなど)に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは一般に、以下で説明するようにシステムバスに接続することにより、コンピュータシステム800のコアに統合される(例えば、PCコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース)。一例として、ネットワーク855は、ネットワークインターフェース854を用いて周辺バス849に接続されてもよい。これらのネットワークのいずれかを用いて、コンピュータシステム800は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ(例えば、放送TV)、単方向の送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワークおよびネットワークインターフェースのそれぞれで使用することができる。
【0108】
前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム800のコア840に接続されることができる。
【0109】
コア840は、1つまたは複数の中央処理装置(CPU)841、グラフィックスプロセッシングユニット(GPU)842、フィールドプログラマブルゲートエリア(FPGA)843の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ844などを含むことができる。これらのデバイスは、リードオンリーメモリ(ROM)845、ランダムアクセスメモリ846、非ユーザアクセス可能な内部ハードドライブ、ソリッドステートドライブ(SSD)などの内部大容量記憶装置847とともに、システムバス1248を介して接続されてもよい。一部のコンピュータシステムでは、システムバス1248は、1つまたは複数の物理プラグの形態でアクセスでき、追加のCPU、GPUなどによる拡張を可能にする。周辺機器は、コアのシステムバス1248に直接、または周辺バス849を介して接続されることができる。周辺バスのアーキテクチャは、ペリフェラルコンポーネントインターコネクト(PCI)、USBなどを含む。
【0110】
CPU841、GPU842、FPGA843、およびアクセラレータ844は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ROM845またはRAM846に記憶されることができる。推移データはRAM846にも記憶できるが、永続データは、例えば、内部大容量ストレージ847に記憶されることができる。1つまたは複数のCPU841、GPU842、大容量ストレージ847、ROM845、RAM846などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。
【0111】
コンピュータ読取可能な媒体は、様々なコンピュータ実施動作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。
【0112】
限定ではなく、一例として、アーキテクチャを有するコンピュータシステム800、特にコア840は、1つまたは複数の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ847またはROM845などの非一時的な性質を持つコア840の特定のストレージに関連付けられた媒体であり得る。本開示の様々な実施形態を実施するソフトウェアは、このようなデバイスに記憶され、コア840によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、1つまたは複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア840、具体的にはその中のプロセッサ(CPU、GPU、FPGAなどを含む)に、RAM846に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更する言を含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路(例えば、アクセラレータ844)に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路(集積回路(IC)など)、実行のためのロジックを具現化する回路、またはその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。
【0113】
本開示は一部の例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に図示せずか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されよう。
【符号の説明】
【0114】
210~240 端末
250 ネットワーク
301 ビデオソース
302 ビデオサンプルストリーム
303 エンコーダ
304 ビデオビットストリーム
305 ストリーミングサーバ
306,308 ストリーミングクライアント
307,309 コピー
310 ビデオデコーダ
311 出方向ビデオサンプルストリームストリーム
312 ディスプレイ
313 キャプチャサブシステム
410 受信機
412 チャネル
415 バッファメモリ
420 エントロピーデコーダ/パーサ
421 シンボル
451 スケーラ/逆変換ユニット
452 イントラピクチャ予測ユニット
453 動き補償予測ユニット
455 アグリゲータ
456 ループフィルタユニット
457 参照ピクチャメモリ、参照ピクチャバッファ
458 現在のピクチャ
530 ソースコーダ
532 符号化エンジン
533 デコーダ
534 参照ピクチャメモリ
535 予測器
540 送信機
543 符号化ビデオシーケンス
545 エントロピーコーダ
550 コントローラ
560 通信チャネル
【手続補正書】
【提出日】2021-06-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサが実行する、ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する方法であって、
NALユニットヘッダに含まれる、第1の固定長の2値符号化されたNALユニットシンタックス要素を含む第1のシンタックス要素を復号するステップと、
前記第1のシンタックス要素に基づいて、複数のNALユニットタイプを含むNALユニットクラスを決定するステップと、
前記NALユニットヘッダに含まれる、第2の固定長の2値符号化されたNALユニットシンタックス要素を含む第2のシンタックス要素を復号するステップと、
前記NALユニットクラスが第1のNALユニットクラスであることに基づいて、前記NALユニットクラスと前記第2のシンタックス要素との組み合わせを用いて、前記NALユニットタイプの中からNALユニットタイプを決定し、決定された前記NALユニットタイプに基づいて、前記NALユニットを再構築するステップと、
を含む方法。
【請求項2】
前記NALユニットクラスが前記第1のNALユニットクラスであることに基づいて、時間的識別子(TID)がゼロであると決定される、請求項1に記載の方法。
【請求項3】
前記第1のNALユニットクラスは、前記NALユニットに対応するパラメータセットが複数の時間的レイヤに関連することを示す、請求項1に記載の方法。
【請求項4】
前記パラメータセットは、デコーダパラメータセット、ビデオパラメータセット、およびシーケンスパラメータセットのうちの少なくとも1つを含む、請求項3に記載の方法。
【請求項5】
前記第1のNALユニットクラスは、前記NALユニットに対応するパラメータセットが単一の符号化ピクチャに関連することを示す、請求項1に記載の方法。
【請求項6】
前記パラメータセットは、ピクチャパラメータセット、スライスパラメータセット、適応パラメータセット、およびヘッダパラメータセットのうちの少なくとも1つを含む、請求項5に記載の方法。
【請求項7】
前記第1のNALユニットクラスは、前記NALユニットが非規範的データに関連することを示す、請求項1に記載の方法。
【請求項8】
前記非規範的データは、補助強化情報、フィラーデータ、およびピクチャデリミタデータを含む、請求項7に記載の方法。
【請求項9】
前記NALユニットクラスが第2のNALユニットクラスであることに基づいて、
前記第2のシンタックス要素に基づいて時間的識別子(TID)を決定し、決定された前記TIDに基づいて前記NALユニットを再構築するステップをさらに含む、請求項1に記載の方法。
【請求項10】
前記第1のシンタックス要素は、禁止されたゼロビットを含む、請求項1に記載の方法。
【請求項11】
ビデオ復号のためのネットワーク抽象化レイヤ(NAL)ユニットを再構築する装置であって、
プログラムコードを記憶するように構成される少なくとも1つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードによって指示されたとおりに
請求項1~10のいずれか1項に記載の方法を実行するように構成される少なくとも1つのプロセッ
サと、
を備える装置。
【請求項12】
1つまたは複数のプロセッサに、
請求項1~10のいずれか1項に記載の方法を実行させるコンピュータプログラム。
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正の内容】
【国際調査報告】