(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023099170
(43)【公開日】2023-07-11
(54)【発明の名称】ソースカラーボリューム情報メッセージング
(51)【国際特許分類】
H04N 19/70 20140101AFI20230704BHJP
【FI】
H04N19/70
【審査請求】有
【請求項の数】5
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023076028
(22)【出願日】2023-05-02
(62)【分割の表示】P 2022050292の分割
【原出願日】2017-10-03
(31)【優先権主張番号】62/404,302
(32)【優先日】2016-10-05
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/427,677
(32)【優先日】2016-11-29
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Blu-ray
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100101683
【弁理士】
【氏名又は名称】奥田 誠司
(74)【代理人】
【識別番号】100155000
【弁理士】
【氏名又は名称】喜多 修市
(74)【代理人】
【識別番号】100188813
【弁理士】
【氏名又は名称】川喜田 徹
(74)【代理人】
【識別番号】100202197
【弁理士】
【氏名又は名称】村瀬 成康
(72)【発明者】
【氏名】チェン,タオ
(72)【発明者】
【氏名】イン,ペン
(72)【発明者】
【氏名】ルー,タオラン
(72)【発明者】
【氏名】フサーク,ウォールター ジェイ.
(57)【要約】 (修正有)
【課題】補足的な付加情報(SEI)メッセージングを使用して、符号化ビットストリーム中のソースカラーボリューム情報を伝える方法および装置を提供する。
【解決手段】SEIメッセージングからソースカラーボリューム情報を抽出する方法は、符号化ビットストリーム中のソースカラーボリューム情報を示すメタデータメッセージを生成することを含む。メタデータは、少なくともソースデータ中の最小輝度値、最大輝度値および平均輝度値ならびにオプションのデータを含む。オプションのデータは、ソースデータの入力原色(例えば、赤色、緑色および青色)についてのカラーボリュームxおよびy色度座標、ならびにソースデータ中の最小輝度値、平均輝度値および最大輝度値に対応する原色についての色xおよびy色度座標を含む。方法はまた、各ピクチャにおいてアクティブ領域を通知するデータをメッセージングすることも含む。
【選択図】
図4
【特許請求の範囲】
【請求項1】
符号化ビットストリームを生成する方法であって、
1シーケンスのビデオ映像を受け取ることと、
1以上の前記ビデオ映像を符号化して圧縮ビデオ映像を生成することと、
前記圧縮ビデオ映像についてのソースカラーボリューム情報を示すメタデータメッセージを生成することと、
前記圧縮ビデオ映像および前記メタデータメッセージを含む出力映像ビットストリームを生成することを含み、
前記メタデータメッセージは、前記符号化ビットストリーム中の1以上の原色成分の正規化xおよびy色度座標、および、最小輝度値、最大輝度値および平均輝度値を含む輝度値パラメータを含み、
前記最小輝度値、前記最大輝度値および前記平均輝度値は、前記符号化ビットストリーム中の1つ以上の符号化ピクチャのアクティブ領域についてである、方法。
【請求項2】
前記正規化xおよびy色度座標は、ISO 11664-1において指定されるxおよびyのCIE 1931規定に従って、0.00002刻みで指定される、請求項1に記載の方法。
【請求項3】
前記メタデータメッセージは、補足的な付加情報(SEI)メッセージを含む、請求項1に記載の方法。
【請求項4】
1以上の非一時的な機械読み取り可能な媒体上に記憶された映像ビットストリームを備える装置であって、
前記映像ビットストリームは、圧縮フォーマットの1以上のビデオ映像を表すデータで特徴付けられ、前記圧縮フォーマットの前記1以上のビデオ映像を表す前記データの一部が、メタデータメッセージを含み、
前記メタデータメッセージは、
前記映像ビットストリーム中に、前記データのソースカラーボリューム情報の2次元色域を識別するための1以上の原色についての1セットのxおよびy色度座標が存在することを示すメッセージング変数と、
前記映像ビットストリーム中の前記データについての最小輝度変数、最大輝度変数および平均輝度変数と、を含み、
前記最小輝度変数、最大輝度変数および平均輝度変数は、前記映像ビットストリーム中の1つ以上のビデオ映像のアクティブ領域についてである、装置。
【請求項5】
前記メタデータメッセージは、補足的な付加情報(SEI)メッセージを含む、請求項4に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、2016年11月29日に出願された米国仮特許出願第62/427,677号および2016年10月5日に出願された米国仮特許出願第62/404,302号に基づく優先権を主張するものであり、その開示内容を全て本願に援用する。
技術
【0002】
本発明は、画像全般に関する。より詳細には、本発明のある実施形態は、ソースカラーボリューム情報を伝えることおよび処理することに関する。
【背景技術】
【0003】
背景
「動画像の符号化」のためのITU-T勧告H.265[1](HEVCとしても知られる)は、付録Dの「補足的な付加情報(Supplemental enhancement information)」(SEI)および付録Eの「ビデオ表示情報(Video usability information)」(VUI)において、補足的なSEIおよびVUI情報を符号化ビットストリームにおいて提供し、デコーダが復号サンプルをディスプレイにより良好にマッピングできるようにするための、シンタックスについて説明している。
【0004】
MPEG/ITU標準化処理とともに、映画テレビ技術者協会(SMPTE)はまた、ソース映像およびターゲットディスプレイの両方についてのカラーボリューム情報に関するメタデータを伝えることに関して多くの勧告を規定している。例えば、SMPTE ST 2094の一式の文書(例えば、[5]および[6])は、映像コンテンツのカラーボリューム変換において使用するためのメタデータを規定している。これらのメタデータは、シーン毎にまたはフレーム毎に変化し得る。例えば、そのようなメタデータは、デコーダがハイダイナミックレンジ(HDR)データおよび広色域(WCG)データを、ソース画像をマスタリングするために使用されるマスタリングディスプレイのカラーボリュームよりも小さいカラーボリュームを有するディスプレイ上に提示することを助け得る。
【0005】
本明細書において、用語「メタデータ」は、符号化ビットストリームの一部として送信され、そしてデコーダが復号画像を描画することを助ける、任意の補助情報に関する。そのようなメタデータは、本明細書にて記載されるような、カラー空間情報または色域情報、予測パラメータ、リファレンスディスプレイパラメータおよび補助信号パラメータを含み得るが、それらに限定されない。
【0006】
H.265の付録DおよびEは、多くのカラーボリュームに関連するメタデータに対応しているが、HDRコンテンツの最も効率的なディスプレイマネジメントに必要なメタデータのすべてに対応しているわけではない。2016年6月のジュネーブでの映像符号化会合の共同作業部会(JCT-VC)において、SEIまたはVUIメッセージングを使用してコンテンツカラーボリューム情報をどのように記述するかについて3つの提[2~4]が提出された。これらの提案の一部は、SMPTE ST.2094[5]の影響を受けたが、その範囲は非常に異なる。
【0007】
[2]において、映像コンテンツの実際の色分布を記述するコンテンツ-SEIメッセージが、2Dにおけるコンテンツ色域を通知(signal)するものとしてに提案されている。VUIにおいて、真のソース色域の代わりにコンテナ色域を示すために、変数c
olour_primariesが使用される[1]。[3]において、多原色表現(multiple primary expressions)および空間領域が、特定されたソース特性に関連づけられるものとして提案されている。[4]において、コンテンツカラーボリュームSEIメッセージが、コンテンツによって占められたカラーボリュームを示すものとして提案されている。これは、カラー座標の(x,y,Y)記述を使用し、かつ輝度Yのスライス(slice)を有し、各スライスにはポリゴンが関連づけられている。これらの提案には、以下のような多くの欠点がある。すなわち、大半のディスプレイ製造者にとってほとんど有用でない情報を提供すること、著しいオーバーヘッドを加え得ること、および要求する計算オーバーヘッドが大きすぎて生成し得ない場合があることである。既存の符号化および復号化方法を向上させるには、本発明者らの検討によれば、ソースカラーボリューム情報を生成し、そして伝えるための改善された技術が必要とされる。
【0008】
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、別途示唆のない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、別途示唆のない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
【図面の簡単な説明】
【0009】
図面の簡単な説明
同様の部材に同様の参照符号を付した添付図面の各図において、本発明のある実施形態を限定する事なく例示する。
【0010】
【
図1】
図1は、本発明のある実施形態による、映像配信パイプラインのための処理例を示す。
【
図2】
図2は、映像コンテナフォーマットについての、「最大」可能カラーボリュームプロットの例を示す。
【
図3A】
図3Aは、コンテナカラーボリューム内のソースコンテンツ色域の例を示す。
【
図3B】
図3Bは、特定の輝度(Y)値におけるコンテナカラーボリュームおよびソースカラーボリュームの2Dスライスの例を示す。
【
図3C】
図3Cは、特定の輝度(Y)値におけるコンテナカラーボリュームおよびソースカラーボリュームの2Dスライスの例を示す。
【
図4】
図4は、本発明の一実施形態による、ソースカラーボリューム情報をSEIメッセージングから抽出するための処理例を示す。
【発明を実施するための形態】
【0011】
実施形態例の説明
SEIメッセージングを使用してソースカラーボリューム情報を伝えるための手法を本明細書に記載する。以下の説明において、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明が実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
【0012】
概要
本明細書に記載する実施形態例は、SEIメッセージングを使用してソースカラーボリューム情報を伝えるための手法に関する。デコーダにおいて、SEIメッセージングを抽出するためのプロセッサは、入力ビットストリーム中にソースカラーボリューム情報が存
在することを識別するソースカラーボリューム識別メッセージング変数を受け取る。プロセッサは、第1のメッセージング変数をソースカラーボリューム情報の一部として受け取る。第1のメッセージング変数が第1の所定値と一致すれば、1以上の原色に関して、プロセッサは、入力ビットストリーム中のソースカラーボリューム情報に基づき、その1以上の原色についてのxおよびy色度座標を生成する。プロセッサは、入力ビットストリーム中のソースカラーボリューム情報に基づいて、最小輝度値、最大輝度値および平均輝度値を生成する。プロセッサは、第2のメッセージング変数をソースカラーボリューム情報の一部として受け取り、そして第2のメッセージング変数が第2の所定値と一致すれば、1以上の原色に関して、プロセッサは、ソースカラーボリューム情報に基づき、最小輝度値、最大輝度値および平均輝度値に対応する、その1以上の原色についてのxおよびy色度座標を生成する。
【0013】
ソースカラーボリュームメッセージングの例
図1は、映像キャプチャから映像コンテンツ表示までの種々の段階を示す、映像配信パイプライン(100)の処理例を示す。画像生成ブロック(105)を使用して、1シーケンスの映像フレーム(102)がキャプチャまたは生成される。映像フレーム(102)は、デジタル式に(例えば、デジタルカメラによって)キャプチャされるか、またはコンピュータによって(例えば、コンピュータアニメーションを使用して)生成され、映像データ(107)が提供される。あるいは、映像フレーム(102)は、フィルムカメラによってフィルム上にキャプチャされ得る。フィルムは、適切な編集(不図示)後、デジタルフォーマットに変換され、映像データ(107)が提供される。
【0014】
次いで、映像データ(107)は、ポストプロダクション編集のためのブロック(110)におけるプロセッサに与えられる。ポストプロダクション編集(110)は、映像制作者の作成意図に従って画像についての画質を強化するか、または特定の見え方を達成するために、画像の特定のエリアにおける色または明るさを調節または変更することを含む。これは、「カラータイミング」または「カラーグレーディング(grading)」と称されることがある。他の編集(例えば、シーン選択および順番付け、画像切り出し(cropping)、コンピュータ生成による視覚特殊効果の付加など)がブロック(110)において行われ、配信用の最終バージョン(112)の制作物が生み出され得る。ポストプロダクション編集(110)中に、映像イメージは、リファレンスディスプレイ(125)(それに対してスタジオが映像を最適化するので「ターゲットディスプレイ」とも称される)上で見られる。
【0015】
いくつかの実施形態において、例えば、SMPTE ST 2094-1[5]に規定されるように、または本発明において後で定義されるように、映像符号化(120)の前に、映像コンテンツが分析され、ソースカラーボリュームメタデータ(119)が抽出され得る。また、そのようなメタデータは、ダウンストリーム受信器が可能なうち最良の方法で復号データを描画できるように、ターゲットディスプレイ(例えば、リファレンスディスプレイ(125))の特性、およびカラー再マッピング情報を規定し得る。
【0016】
ポストプロダクション(110)およびソースカラーボリューム分析(115)の後、最終生成の映像データ(117)および関連メタデータ(119)は、適切なカラーフォーマット(例えば、4:2:0における10ビットYCbCr、ICtCpなど)で、テレビ受像機、セットトップボックス、映画館などの復号化および再生デバイスにダウンストリームを配信するための符号化ブロック(120)に配信され得る。いくつかの実施形態において、符号化ブロック(120)は、符号化ビットストリーム(122)を生成するために、音声エンコーダおよび映像エンコーダ(ATSC、DVB、DVD、Blu-Rayおよび他の配信フォーマットによって規定される音声および映像エンコーダなど)を含み得る。符号化ビットストリーム(122)は、シングルレイヤ映像符号化ビットス
トリームによって、またはマルチレイヤビットストリームによって表され得る。例えば、マルチレイヤビットストリームにおいて、信号(122)は、ベースレイヤ(例えば、SDRレイヤまたは10ビットHDR(HDR10)レイヤ)およびエンハンスメントレイヤを含み得る。エンハンスメントレイヤは、ベースレイヤと組み合わされたとき、ベースレイヤ単独の場合よりも高いダイナミックレンジを有するHDRビットストリーム(例えば、12ビットHDR信号)を生成する。また、エンコーダ(120)からの出力ビットストリームである信号(122)は、メタデータ(119)や、デコーダがHDR信号をより良好に再構成することを助けるための予測パラメータおよび他のデータなどの、更なる符号化関連メタデータを含み得る。
【0017】
受信器において、符号化ビットストリーム(122)は、復号ユニット(130)によって復号化され、復号信号(132)および関連メタデータ(119)が生成される。受信器(または対象)ディスプレイ(150)は、リファレンス(またはターゲット)ディスプレイ(125)の特性とは全く異なる特性を有し得る。例えば、限定しないが、リファレンスディスプレイ(125)は、1,000ニトディスプレイであり、受信器ディスプレイは、500ニトディスプレイであり得る。その場合、ディスプレイマネジメントモジュール(140)を用いて、ディスプレイマッピング化信号(142)を生成することにより、復号信号(132)のダイナミックレンジが受信器ディスプレイ(150)の特性にマッピングされ得る。本明細書において、用語「ディスプレイマネジメント」は、第1のダイナミックレンジ(例えば、1000ニト)の入力映像信号を第2のダイナミックレンジ(例えば、500ニト)のディスプレイにマッピングするために必要な処理(例えば、トーンマッピングおよび色域マッピング)を示す。ディスプレイマネジメントユニット(140)は、ディスプレイ(150)上の出力映像の品質を向上させるために、メタデータ(119)を考慮し得る。例えば、[7]に示されているように、ターゲット(またはリファレンス)ディスプレイ(例えば、125)の輝度範囲についての情報およびソースデータが受信器上で使用されることにより、映像コンテンツのダイナミックレンジが受信器ディスプレイ(例えば、150)により良好にマッピングされ得る。
【0018】
カラーボリューム情報
図2は、所定のコンテナフォーマット(例えば、BT.2020)(「コンテナカラーボリューム」とも称される)の、「最大」可能カラーボリュームの例を示す。そのようなボリュームは、2次元(2D)色域原色、白色点色度(例えば、D65)、最大輝度値(例えば、Lmax=4,000ニト)および最小輝度値(例えば、0.005ニト)によって構築され得る。そのようなプロットは、ソース映像コンテンツ内のすべての色についての最大可能カラーボリューム境界を示す。
【0019】
実際には、
図3Aにおけるより濃い「雲状部(cloud)」(305)または
図3Bおよび3Cにおけるより濃い領域(305)によって示されるように、特定のフレームについての、さらにはシーン全体内であってもよいが、ソースコンテンツ(例えば、112)のソースカラーボリュームは、最大可能カラーボリューム(310)よりも著しく小さいことがあり得る。実際のカラーボリューム(305)は、非常に不規則な形を有するので、各フレームまたはシーン全体についてそのようなソースカラーボリューム情報を送信することは、多くの情報を要する。例えば、ある実施形態において、複数の輝度値について(例えば、0.1、1、10などにおいて)、色域情報を通知し得る。次いで、問題となるのは、最も重要な輝度値がいくつあって、それらがどれであるのかということである。また、そのような情報に要する符号化ビットストリーム上のオーバーヘッドだけでなく、そのようなコンテンツをエンコーダ上で生成することの複雑性および/またはカラーボリューム情報をデコーダ上で再構成することの複雑性もまた考慮する必要がある。
【0020】
ソースコンテンツにおける最小輝度値および最大輝度値を伝えることは重要であるが、
本発明者らが理解するように、平均輝度(または中間点輝度)を伝えることもまた受信器にとって有用である。これら3つの値は、合わせて、ディスプレイマッピングのための妥当なトーン曲線を生成することに役立ち得る。本開示において、ソースカラーボリュームを記述するために以下のメタデータを通知することを提案する。すなわち、a)ソースによって占められた最大2D色域(例えば、ソースカラーボリューム)、b)ソースの最大輝度、最小輝度および平均輝度、ならびにc)オプションとして、これら3つの輝度値についてのスライスされた(2D)色域(例えば、
図3Bおよび3Cを参照)である。コンテナ原色およびソースコンテンツ原色の白色点が同じであるはずとされるので、そのような情報を再送信する理由はない。この情報は、例えば、フレーム単位またはシーン単位で、必要に応じて更新され得る。
図3Bおよび
図3Cは、特定の輝度(Y)値におけるソースカラーボリューム(305)およびコンテナカラーボリューム(310)の2Dスライスの例を示す。
図3Bにおいて、2Dスライスは、Y=84ニトにおける2Dスライスであり、かつ
図3Cにおいて、2Dスライスは、Y=246ニトにおける2Dスライスである。ソースカラーボリューム(305)を囲み、かつコンテナRGB空間内にある色度(rgb)三角形は、例示のためだけに与えている。エンコーダは、より小さいまたはより大きいそのような領域を規定し、そして受信器へ送信するように選択してもよい。
【0021】
表1は、H.265仕様書の用語およびシンタックスに従う、ある実施形態によるソースカラーボリュームSEIメッセージングの例を示す。原色の記述は、ISO 11664-1(また、ISO 11664-3およびCIE 15を参照)に規定される原色についてのCIE 1931(x,y)色度座標の規定に従っており、赤色、緑色および青色の原色を使用する。また、4ポリゴン、5ポリゴン、もしくは6ポリゴン、または他のポリゴンベースの原色表示などの他のタイプの原色を用いてもよい。ソースコンテンツ内の最大の実際の色域について、ある実施形態において、限定しないが、シンタックスは、H.265仕様書の、表E.3についてE.3.1節において規定されたcolour_primariesパラメータ(または変数)の規定と同様である。現在のソースコンテンツは、P3カラー空間に達し得るが、BT.2020/2010カラー(「DCI-P3」は、SMPTE EG 432-1およびSMPTE RP 431-2において規定される)に達するにはまだ時間がかかるであろうと考えられる。従って、ソース色域がP3以下であるか、またはBT.2020/2010原色に等しい場合には、表E.3が使用され得る。しかし、色域がP3よりも大きく、BT.2020/2010未満であるソースについては、色域の明示的な通知(explicit signalling)が必要とされるかもしれない。輝度値は、ニト(cd/m2)単位の絶対値を使用して指定される。あるいは、ビットを節約するために、輝度値もまた非線形表現を使用して(例えば、SMPTE ST 2084の逆EOTFに従って符号化された値として)符号化され得る。最大輝度値、最小輝度値および平均(中間)輝度値に対応する色域情報は、オプションとしておき、メタデータオーバーヘッドを所望に応じて低減するようなアプリケーションを可能にする。
【0022】
なお、好適な実施形態において、1)ソースカラーボリュームメタデータは、いかなるルマまたはクロマ前処理も行われる前の、元の形態のソースのカラーボリュームを記述すべきである。例えば、ソースカラーボリュームメタデータは、いかなるクロマサブサンプリング処理(例えば、4:4:4から4:2:0へ)またはビット深度変換処理(例えば、12bから10bへ)も行われる前の、ソースカラーボリュームを記述すべきである。なぜなら、クロマサブサンプリングまたはビット深度変換を行うと、カラーボリューム情報が変更されるからである。2)ソース色域は、典型的にはコンテナ原色と異なる。このことは、付録E(例えば、表E.3)において示されている。3)ソースカラーボリュームは、典型的には、マスタリングディスプレイカラーボリューム(マスタリングディスプレイカラーボリュームSEIメッセージによって示され得る)と異なる。
【0023】
ある実施形態例において、表1におけるパラメータ(または変数)および符号化セマンティックスは、以下のように説明され得る。
【0024】
source_colour_volume_idは、ソースカラーボリュームの目的を識別するために使用され得る識別番号を含む。source_colour_volume_idの値は、0以上232-2以下の範囲にある。アプリケーションの決定に従い、source_colour_volume_idの値として0~255および512~231-1が使用されてもよい。source_colour_volume_idの値の256以上511以下および231以上232-2以下は、ITU-T|ISO/IECによって将来の使用のために取っておかれる。デコーダは、256以上511以下の範囲または231以上232-2以下の範囲のsource_colour_volume_idの値を含む全ての色再マッピング情報SEIメッセージを無視し、かつビットストリームは、そのような値を含むことはない。
【0025】
source_colour_volume_cancel_flagは、1に等しいとき、ソースカラーボリュームSEIメッセージが、現在のレイヤに適用される出力順においていずれの先行の(previous)ソースカラーボリュームSEIメッセージについてもその持続をキャンセルすることを示す。source_colour_volume_cancel_flagが0に等しいとき、ソースカラーボリュームが続くことを示す。
【0026】
source_colour_volume_persistence_flagは、現在のレイヤについてソースカラーボリュームSEIメッセージの持続を指定する。source_colour_volume_persistence_flagが0に等しいとき、ソースカラーボリューム情報が現在のピクチャだけに適用されることを指定する。
【0027】
picAを現在のピクチャとする。source_colour_volume_persistence_flagは、1に等しいとき、以下の条件のいずれかが真となるまで、ソースカラーボリュームが現在のレイヤについて出力順で持続することを指定する。
-現在のレイヤの新たな符号化レイヤ映像シーケンス(CLVS)が開始する
-ビットストリームが終了する
-同じ値のsource_colour_volume_idを有し、かつ現在のレイヤに適用可能なソースカラーボリュームSEIメッセージを含むアクセスユニットにおける現在のレイヤ内のピクチャpicBであって、PicOrderCnt(picB)がPicOrderCnt(picA)よりも大きいような、ピクチャpicBが出力される。ここで、PicOrderCnt(picB)およびPicOrderCnt(picA)は、それぞれ、picBについてのピクチャ順序カウントのための復号処理の実施直後のpicBおよびpicAのPicOrderCnt値である。
【0028】
source_colour_primariesは、colour_primariesシンタックス要素についてE.3.1節に規定されるセマンティックスと同じセマンティックスを有する。ただし、E.3.1節のcolour_primariesがコンテナソース原色を通知し、かつsource_colour_primariesが、ソースコンテンツが実際に占める原色を通知することを除く。
source_colour_primariesの値が2に等しい場合、source_colour_primariesは、シンタックスのsource_primaries_x[c]およびsource_primaries_y[c]によって明示的に指定される。
【0029】
source_primaries_x[c]およびsource_primaries_y[c]は、ISO 11664-1(また、ISO 11664-3およびCIE
15を参照)において指定されるようなxおよびyのCIE 1931規定に従って、ソースコンテンツの原色成分cの正規化xおよびy色度座標を、それぞれ0.00002刻みで指定する。赤色、緑色および青色の原色を使用するソースコンテンツを記述する際において、0に等しい指標値cが緑色の原色に対応し、1に等しいcが青色の原色に対応し、かつ2に等しいcが赤色の原色に対応すべきであることが提唱される(また、付録Eおよび表E.3を参照)。source_primaries_x[c]およびsource_primaries_y[c]の値は、0以上50,000以下の範囲にある。
【0030】
max_source_luminance、min_source_luminanceおよびavg_source_luminanceは、0.0001カンデラ/m2(ニト)単位のソースの公称最大輝度、公称最小輝度および公称平均輝度をそれぞれ指定する。min_source_luminanceは、avg_source_luminance未満であり、かつavg_source_luminanceは、max_source_luminance未満である。
【0031】
luminance_colour_primaries_info_present_flagは、1に等しいとき、シンタックス要素のluminance_primaries_xおよびluminance_primaries_yが存在することを指定し、luminance_colour_primaries_info_present_flagが0に等しいとき、シンタックス要素のluminance_primaries_xおよびluminance_primaries_yが存在しないことを指定する。
【0032】
luminance_primaries_x[i][c]およびluminance_primaries_y[i][c]は、ISO 11664-1(また、ISO 11664-3およびCIE 15を参照)において指定されるようなxおよびyのCIE
1931規定に従って、ある公称輝度でのソースコンテンツの原色成分cの正規化xおよびy色度座標を、それぞれ0.00002刻みで指定する。ソースコンテンツ輝度を記述する際において、指標値0、1および2がmax_source_luminance、min_source_luminanceおよびavg_source_luminanceにそれぞれ対応する。赤色、緑色および青色の原色を使用するソースコンテンツを記述する際において、0に等しい指標値cが緑色の原色に対応し、1に等しいcが青色の原色に対応し、かつ2に等しいcが赤色の原色に対応すべきであることが提唱される(また、付録Eおよび表E.3を参照)。source_primaries_x[c]およびsource_primaries_y[c]の値は、0以上50,000以下の範囲にある。
【0033】
表1は、ソースカラーボリュームの有用な表現のための最小限の情報と考えられるものを示す。別の実施形態において、多原色(multiple primary)[3]または輝度(Y)の3つより多いスライス(各スライスにポリゴンが関連づけられる)の原色の記述などの更なる詳細を規定することとしてもよい。
【0034】
表1:ソースカラーボリュームSEIメッセージングシンタックスの例
【表1】
【0035】
図4は、ある実施形態による、SEIメッセージングを使用して、映像ソースについてカラーボリューム情報を抽出するための処理例を示す。第一に(405)、ソースカラーボリューム情報の識別番号(ID)を示す第1のSEIメッセージング変数(例えば、source_colour_volume_id)が存在するかどうかをデコーダが検出する。次いで、そのような変数が存在する場合、デコーダは、その値が許容範囲内にあるかどうかを調べ得る(ステップ407)。許容外の値であれば、処理は、終了する(ステップ409)。許容内の値であれば、ステップ(410)において、表1に示されるように、デコーダはまた、ビットストリームにわたって第1の変数が持続されることに関する更なるフラグを読み出し得る(例えば、source_colour_volume_cancel_flagおよびsource_colour_volume_persistence_flagについてのシンタックス要素を参照)。ステップ(412)において、第2のSEIメッセージングパラメータ(例えば、source_colour_primaries)を介して、デコーダは、ソースデータコンテンツが実際に占めるカラーボリュームをメタデータが明示的に規定しているかどうかを調べ得る。それが真であれば(例えば、source_colour_primaries=2)、ステップ(420)において、各原色(例えば、赤色、緑色および青色)について(x,y)色度座標が読み出され、真でなければ、ステップ(425)において、デコーダは、最小輝度値、最大輝度値および平均輝度値を抽出する。オプションとして、SEIメッセージングはまた、上記に規定した最小輝度値、中間輝度値および最大輝度値の原色に対応する(x,y)色度座標を規定し得る。ある実施形態において、これは、第3のパラメータ(例えば、luminance_colour_primaries_info_present_flag=1)によって示され得る。そのような情報が存在しなければ(ステップ430)
、処理は、終了し(409)、存在すれば(ステップ435)、デコーダは、最小輝度値、中間輝度値および最大輝度値の各々についての原色について(x,y)色度座標を抽出する。
【0036】
ソースカラーボリューム情報を抽出した後、デコーダはそのディスプレイマネジメント処理(例えば、140)中において、ソースカラーボリュームデータを使用し得る。一例において、ディスプレイマネジメントは、トーンマッピングおよび色域マッピングの2つのステップを含み得る。最小輝度値、中間輝度値および最大輝度値は、[6-7]に記載されるように、トーンマッピング曲線を生成するために使用され得る。最大RGB色域およびスライスされたRGB色域は、色域マッピングを行うために使用され得る。
【0037】
アクティブ領域の検討
いくつかの実施形態において、アクティブ領域をソースカラーボリュームに関するメタデータの一部として規定することは、利点を有し得る。例えば、映像がレターボックスフォーマットで符号化される場合、エンコーダおよびデコーダは、各映像フレームのルマおよびクロマ特性(例えば、最小輝度、最大輝度および平均輝度)を計算する際に黒いレターボックスエリアを含むべきでない。実験の結果によると、映像シーケンスにおけるフレームの「フレーミング」または「マッティング(matting)」(例えば、ピラーボックス化、ウィンドウボックス化およびレターボックス化)を考慮することによって、全体的な出力ピクチャ品質が著しく改善され得ることが示されてきた。レターボックス検出は、デコーダによって実装され、それによりアクティブピクチャ領域を規定する通知オーバーヘッドを低減し得るが、ある実施形態において、そのような通知は、明示的に通知されて、低計算複雑性のデコーダをサポートし得る。表2は、ある実施形態による、アクティブ領域通知をともなうソースカラーボリュームSEIメッセージングの例を示す。
【0038】
表2:アクティブ領域通知をともなうソースカラーボリュームSEIメッセージシンタックスの例
【表2】
【0039】
表2は、表1の上位集合(superset)であり、かつアクティブ領域を規定する2つの異なるセマンティックスを考慮する。
セマンティックス1。ある実施形態において、アクティブ領域は、コンフォーマンス・ウィンドウ・クロッピングおよび出力の前に、復号ピクチャに対して指定される。このとき、アクティブ領域パラメータは、以下のように解釈され得る。
【0040】
active_region_flagは、1に等しいとき、ソースカラーボリューム情報SEIメッセージにおいてアクティブ領域オフセットパラメータが次に続くことを示す。active_region_flagが0に等しいとき、アクティブ領域オフセットパラメータが存在しないことを示す。
【0041】
active_region_left_offset、active_region_right_offset、active_region_top_offsetおよびactive_region_bottom_offsetは、アクティブ矩形状領域を指定する。active_region_flagが0に等しい場合、active_
region_left_offset、active_region_right_offset、active_region_top_offsetおよびactive_region_bottom_offsetの値は、0に等しいと推定される。
【0042】
アクティブ領域は、SubWidthC*active_region_left_offsetからpic_width_in_luma_samples-SubWidthC*active_region_right_offset+1)までの水平ピクチャ座標およびSubHeightC*active_region_top_offset以上pic_height_in_luma_samples-(SubHeightC*active_region_bottom_offset+1)以下の垂直ピクチャ座標を用いて規定される。SubWidthC*(active_region_left_offset+active_region_right_offset)の値は、pic_width_in_luma_samples未満であり、かつSubHeightC*(active_region_top_offset+active_region_bottom_offset)の値は、pic_height_in_luma_samples未満である。
セマンティックス2。ある実施形態において、アクティブ領域オフセット値は、表示のための最終出力ピクチャに対して規定される。それ故に、コンフォーマンスウィンドウパラメータが考慮される必要がある。このとき、アクティブ領域パラメータは、以下のように解釈され得る。
【0043】
active_region_flagは、1に等しいとき、アクティブ領域オフセットパラメータがソースカラーボリューム情報SEIメッセージにおいて次に続くことを示す。active_region_flagが0に等しいとき、アクティブ領域オフセットパラメータが存在しないことを示す。
【0044】
active_region_left_offset、active_region_right_offset、active_region_top_offsetおよびactive_region_bottom_offsetは、アクティブ矩形状領域を指定する。active_region_flagが0に等しい場合、active_region_left_offset、active_region_right_offset、active_region_top_offsetおよびactive_region_bottom_offsetの値は、0に等しいと推定される。
【0045】
アクティブ領域は、active_region_left_offset+SubWidthC*conf_win_left_offsetからCtbSizeY*PicWidthInCtbsY-SubWidthC*conf_win_right_offset-active_region_right_offset-1までの水平ピクチャ座標およびactive_region_top_offset+SubHeightC*conf_win_top_offset以上CtbSizeY*PicHeightInCtbsY-SubHeightC*conf_win_bottom_offset-active_region_bottom_offset-1以下の垂直ピクチャ座標を用いて規定される。
【0046】
(active_region_left_offset+active_region_right_offset)の値は、CtbSizeY*PicWidthInCtbsY-SubWidthC*(conf_win_right_offset+conf_win_left_offset)未満であり、かつ(active_region_top_offset+active_region_bottom_offset)の値は、CtbSizeY*PicHeightInCtbsY-SubHeightC
*(conf_win_bottom_offset+conf_win_top_offset)未満である。
【0047】
以下に列挙された各文献は、その開示内容を全て本願に援用する。
参考文献
[1]Rec.ITU-T H.265,“Series H:Audiovisual and Multimedia systems,Infrastructure
of audiovisual services - Coding of moving video, High efficiency video coding,”ITU,Oct.2014.
[2]H.M. Oh et al.,“Content colour gamut SEI message”,JCTVC-X0040,May 2016,Geneva,CH.
[3]A.M. Tourapis,“Improvements to the Effective Colour Volume SEI”,JCTVC-X0052,May 2016,Geneva,CH.
[4]A.K. Ramasubramonian,“Content colour volume SEI message”,JCTVC-X0052,May 2016,Geneva,CH.
[5]SMPTE ST 2094-1:2016:“Dynamic Metadata for Color Volume Transform - Core Components,” SMPTE, May 18, 2016.
[6]SMPTE ST 2094-10:2016:“Dynamic Metadata for Color Volume Transform - Application #1,”SMPTE,May 18,2016.
[7]R. Atkins et al.,U.S.Patent Publication US2016/0005349,“Display management for high dynamic range video.”
【0048】
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のようなSEIメッセージングを使用してソースカラーボリューム情報を伝えることに関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の処理に関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
【0049】
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のようなSEIメッセージングを使用してソースカラーボリューム情報を伝えることに関する方法を実施し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータ読み取り可能な信号を格納する任意の非一時的媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
【0050】
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「
手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
【0051】
均等物、拡張物、代替物、その他
SEIメッセージングを使用してソースカラーボリューム情報を伝えることに関する実施形態例を上述した。この明細書中において、各実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
【外国語明細書】