【文献】
K. Minoo et al.,Description of the reshaper parameters derivation process in ETM reference software,Joint Collaborative Team on Video Coding (JCT-VC),2016年01月11日,[JCTVC-W0031] (version 1)
(58)【調査した分野】(Int.Cl.,DB名)
モバイル装置、通信装置、ゲーム装置、セットトップボックス、テレビセット、タブレット、ラップトップ、ディスプレイおよび復号チップからなる群から選択された請求項6に記載の電子装置。
モバイル装置、通信装置、ゲーム装置、タブレット、ラップトップ、静止画カメラ、ビデオカメラ、符号化チップ、静止画サーバ、およびビデオサーバからなる群から選択された請求項8に記載の電子装置。
【背景技術】
【0002】
2.背景技術
以下では、カラー画像は、画像(またはビデオ)の画素値に関係するすべての情報と例えば画像(またはビデオ)を視覚化および/または復号するためのディスプレイおよび/または任意の他の装置により使用され得るすべての情報とを規定する特定画像/ビデオフォーマットのいくつかの配列のサンプル(画素値)を含む。カラー画像は、第1の配列のサンプルの形状の少なくとも1つの成分(通常は、輝度(lumaまたはluminance)成分)と、少なくとも1つの他の配列のサンプルの形状の少なくとも1つの他の成分とを含む。または、等価的に、同情報はまた、伝統的三色RGB表現などの一組の配列のカラーサンプル(カラー成分)により表され得る。
【0003】
画素値はc個の値のベクトルにより表され、cは成分の数である。ベクトルの各値は、画素値の最大ダイナミックレンジを規定するビット数により表される。
【0004】
標準ダイナミックレンジ画像(SDR(Standard-Dynamic-Range)画像)は、その輝度値が2のべき乗(すなわちf値)で通常は測定される限定的ダイナミックレンジで表されるカラー画像である。SDR画像は、約10のf値(すなわち線形領域における最も明るい画素と最も暗い画素との比1000)のダイナミックレンジを有する。SDR画像は、ダイナミックレンジを低減するために例えばITU-R BT.709 OETF(Optico-Electrical-Transfer-Function)(Rec.ITU-R BT.709-5,April 2002)またはITU-R BT.2020 OETF(Rec.ITU-R BT.2020-1,June 2014)を使用することにより非線形領域では限定数(HDTV(ハイビジョンシステム)およびUHDTV(超高解像度テレビシステム)ではほとんどの場合8または10個)のビットで符号化される。この限定された非線形表現は、特に暗い輝度範囲および明るい輝度範囲における小さな信号変動の正しい描写を可能にしない。高ダイナミックレンジ画像(HDR画像)では、信号ダイナミックレンジははるかに高く(最大20のf値、最も明るい画素と最も暗い画素との間で100万の比)、新しい非線形表現が、その全範囲にわたって信号の高精度を維持するために必要である。HDR画像では、生データは通常、浮動小数点形式(成分毎に32ビットまたは16ビットのいずれか、すなわち浮動または半浮動)で表され、最も人気のあるフォーマットは、openEXR半浮動フォーマット(RGB成分当たり16ビット、すなわち48ビット/画素)である、または長い表現(典型的には少なくとも16ビット)を有する整数である。
【0005】
色域(color gamut)は1つの完全な組の色である。最も一般的な使用は、所与の色空間内などの所与の状況において、またはある出力装置により精確に表され得る一組の色を指す。
【0006】
色域は時に、
図8に示すようなCIE1931色空間色度図において提供されるRGB原色と白色点とにより定義される。
【0007】
所謂CIE1931色空間色度図では原色を定義することが一般的である。これは、輝度成分上で色を独立に定義する2次元図(x,y)である。次に、任意の色XYZが次式の変換のおかげでこの図内に投影される:
【数1】
【0008】
z=1−x−y成分も定義されるが、いかなる追加情報も担持しない。
【0009】
全域(gamut)は、その頂点が三原色RGBの一組の(x,y)座標である三角形によりこの図では定義される。白色点Wは、三角形に属する別の所与(x,y)点(通常三角形中心に近い)である。例えば、Wは三角形の中心として定義され得る。
【0010】
カラーボリュームは色空間と前記色空間内に表された値のダイナミックレンジとにより定義される。
【0011】
例えば、色域はUHDTVのRGB ITU−R勧告BT.2020色空間により定義される。より古い標準規格(ITU−R勧告BT.709)はHDTVのより小さな色域を定義する。SDRでは、ダイナミックレンジは、データが符号化されるカラーボリュームについて最大100nit(カンデラ/平方メートル)まで公式に定義される。但し、いくつかの表示技術はより明るい画素を示し得る。
【0012】
高ダイナミックレンジ画像(HDR画像)は、その輝度値がSDR画像のダイナミックレンジより高いHDRダイナミックレンジにより表されるカラー画像である。
【0013】
Danny Pascaleによる「A Review of RGB Color Spaces」により広範に説明されるように、全域の変更(すなわち三原色と白色点とを全域から別の全域へとマッピングする変換)は線形RGB色空間において3×3行列を使用することにより行われ得る。また、XYZからRGBへの空間の変更は3×3行列により行われる。結果として、色空間がRGBであろうとXYZであろうと、全域の変更は3×3行列により行われ得る。例えば、BT.2020線形RGBからBT.709 XYZへの全域変更は3×3行列により行われ得る。
【0014】
HDRダイナミックレンジは標準規格により未だ定義されていないが、最大数千nitまでのダイナミックレンジが期待され得る。例えば、HDRカラーボリュームはRGB BT.2020色空間により定義され、前記RGB色空間において表される値は0〜4000nitのダイナミックレンジに属する。HDRカラーボリュームの別の例はRGB BT.2020色空間により定義され、前記RGB色空間において表される値は0〜1000nitのダイナミックレンジに属する。
【0015】
画像(またはビデオ)を色等級付けすることは、画像(またはビデオ)の色を変更/強化する処理である。通常、画像を色等級付けすることは、カラーボリューム(色空間および/またはダイナミックレンジ)の変更または当該画像に対する色域の変更を含む。したがって、同じ画像の2つの異なる色等級付けバージョンは、その値が異なるカラーボリューム(または色域)において表される当該画像のバージョン、またはそれらの色のその少なくとも1つが異なる色等級に従って変更/強化された画像のバージョンである。これはユーザ相互作用を含み得る。
【0016】
例えば、映画製作において、画像およびビデオは、三色カメラを使用することにより3つの成分(赤、緑、および青)で構成されたRGB色値内へ捕捉される。RGB色値はセンサの三色特性(原色)に依存する。次に、捕捉された画像の第1の色等級付けバージョンが、劇場的描写を得るために取得される(特定劇場等級を使用して)。通常、捕捉画像の第1の色等級付けバージョンの値は、UHDTVのパラメータ値を定義するBT.2020などの標準化YUVフォーマットに従って表される。
【0017】
YUVフォーマットは典型的には、非線形関数(非線形成分R’G’B’を取得するために線形RGB成分へ所謂光学電子伝達関数(OETF:Optical Electronic Transfer Function))を適用し、次に3つの成分YUVを取得するために色変換(通常3×3行列)を取得非線形R’G’B’成分へ適用することにより行われる。第1の成分Yは輝度成分であり、2つの成分U、Vは色成分である。
【0018】
次に、カラリストは通常は撮影監督と協力して、芸術的意図を埋め込むためにいくつかの色値を微調整することにより、捕捉画像の第1の色等級付けバージョンの色値に対し制御を実行する。
【0019】
例えば標準規格HEVCなどの既知のMPEGビデオ符号器はHDR(高ダイナミックレンジ)ビデオと互換性が無い。さらに、多くのディスプレイ/端末はHDRビデオと互換性が無い。
【0020】
圧縮されたHDRビデオを多種多様のディスプレイ/端末へ分配するために、そして既知のビデオ符号化ツール(MPEGビデオ符号化標準規格などの)を使用することを可能にするために、HDRビデオは、SDRビデオからのHDRビデオの再構築を可能にするより限定されたダイナミックレンジと一組のパラメータとを有するHDRを表すSDRビデオとして分配される。このようなシステムでは、SDRビデオは、標準規格HEVC Main 10プロファイルなどの既知ツールを使用して圧縮される。
【0021】
符号化側では、HDRビデオは、最初にSDRビデオに分解され、このような分解は、HDRビデオを復号SDRビデオから復号器においてまたはディスプレイレベルにおいて再構築するのに好適な一組のパラメータを配送する。このような一組のパラメータは、典型的にはHEVC標準規格のSEI(Supplemental Enhancement Information)メッセージなどの任意選択シンタックスメッセージ内で圧縮SDRビデオと共へ符号化され得る。
図3は、HDR画像のHDR−to−SDR分解を描写する。HDR−to−SDR分解処理は、入力線光4:4:4 HDR画像をSDR互換バージョンへ(また4:4:4フォーマットで)変換することを目的とする。このような処理は、HDRおよびSDR画像のコンテナのマスタリング表示ピーク輝度、三原色、色域などのサイド情報を使用する。このようなサイド情報は画像またはビデオの特性から判断される。HDR−to−SDR分解処理は、高品質再構築HDR信号を保証する可逆処理を使用することにより入力HDR信号からSDR後方互換バージョンを生成する。
【0022】
工程E30では、入力HDR画像とその特性(サイド情報)から、マッピング変数が導出される。このようなマッピングパラメータ導出工程は、HDR画像の線光輝度値をSDR型輝度値へマッピングすることを可能にする輝度マッピング関数LUT
TM(ルックアップテーブル)を提供する。
【0023】
工程E31では、次に、輝度信号は、輝度マッピング変数を使用することにより、SDR輝度信号へマッピングされる。すなわち、入力HDR画像の画素毎に、輝度Lは、画素のHDR線光R、G、B値と、次のように輝度マッピング関数とから導出される:
【数2】
ここで、A=[A
1 A
2 A
3]
Tは従来の3×3R’G’B’−to−Y’CbCr変換行列(例えば色空間に応じてBT.2020またはBT.709)であり、A
1、A
2、A
3は1×3行列である。
【0024】
線光輝度Lは、輝度マッピング関数を使用することにより次式のようにSDR的輝度Y
pre0へマッピングされる:Y
pre0=LUT
TM(L)。
【0025】
工程E32では、SDR信号の色度成分を導出するための色のマッピングが適用される。色度成分U
pre0、V
pre0は以下のように構築される:
【0026】
平方根を使用する疑似ガンマ化(BT.709 OETFに近い)が画素のRGB値へ適用される。
【数3】
【0027】
次に、U
pre0およびV
pre0の値は次式のように導出される。
【数4】
【0028】
この工程は、入力HDR信号と比較される色相および彩度の変化である全域シフトを生じる。このような全域シフトは色域補正の工程E34により補正される。工程E34では、色度成分値は次式のように補正される:
【数5】
ここで、A
2、A
3は、R’G’B’−to−Y’CbCr変換行列の係数の第2および第3ラインからなり、b
0は前処理色補正LUT(ルックアップテーブルの)である。
【0029】
輝度成分は次式のように補正される:Y
pre1=Y
pre0−v×max(0,a×U
prel+b×V
prel)、ここで、aおよびbは所定パラメータであり、vは彩度を制御することを可能にする制御パラメータである。値Yが高ければ高いほど、画像はより少なく飽和される。HDR画像−to−SDR画像分解は、画素配列Y
pre1 U
pre1 V
pre1を有する出力SDR画像を生じる。
【0030】
HDR再構築処理はHDR−to−SDR分解処理の逆である。
図4はこのようなHDR再構築処理を示す。復号SDR画像は、それぞれが画像の輝度および色度成分に対応する3つの配列の画素SDR
y、SDR
Cb、SDR
crを含む。HDR再構築はSDR画像の画素毎に以下の工程を処理する。
【0031】
工程E40では、値U
post1およびV
post1は、SDR画像の画素(x,y)毎に次式のように導出される:
【数6】
ここで、midSampleValは所定シフト定数である。
【0032】
工程E41では、SDR画像の画素(x,y)の値Y
post1は次式のように導出される:
Y
post1=SDR
y[x][y]+v×max(0,a×U
post1+b×V
post1)
ここで、aおよびbは同じ所定パラメータであり、vは、分解処理におけるものと同様に、彩度を制御することを可能にする制御パラメータである。したがって、このようなパラメータは再構築モジュールへ知らされるべきである。このようなパラメータは、圧縮SDR画像と共に符号化されたHDRパラメータの一部であり得る、または復号器において予め定義される。
【0033】
このような工程は恐らく、レガシー信号範囲外となるのを回避する為のクリッピングが続き得る。
【0034】
工程E42では、色補正が行われる。工程E42では、U
post1およびV
post1は次式のように修正される:
【数7】
ここで、b
pは、前処理色補正LUT b
0に直接依存する後処理色補正LUTである。
【0035】
後処理色補正LUT b
pは次式により定められ得る:
【数8】
ここで、Kは一定値であり、LはL=invLU
TM[Y]から導出される線光輝度であり、invLUT
TMはLUT
TMの逆関数であり、YはSDR信号の輝度値である。
【0036】
工程E43では、画素のRGB(HDR
R,HDR
G,HDR
B)値が再構築される。工程E43では、値Tは次式のように導出される:
T=k0×U
post1×V
post1+kl×U
post1×U
post1+k2×V
post1×V
post1、ここで、k0、k1、k2はSDR色域に依存する所定値である。次に、S0は0へ初期化され、以下の条件文が適用される:
−T≦1であれば、S0は Sqrt(1−T)に設定される
−そうでなければ、U
post1およびV
post1は次式のように修正される:
【数9】
【0037】
値R1、G1、B1は次式のように導出される。
【数10】
ここで、Mγ’
CbCr−to−R’
G’
B’はY’CbCrからR’G’B’への従来の変換行列である。
【0038】
工程E44では、次に、HDR画像からのRGB値がSDR RGB値から再構築される。工程E44では、値R2、G2、B2は次式のようにR1、G1、B1から導出される:
【数11】
ここで、invLUTは、再構築モジュールへ送信された輝度マッピングパラメータから導出される逆ルックアップテーブルLUT
TMの平方根に対応する。
【0039】
そして出力サンプルHDR
R、HDR
G、HDR
Bは次式のようにR2、G2、B2から導出される:
【数12】
【0040】
出力HDR信号の範囲を制限するためにクリッピングが適用され得る。
【0041】
このような分解および再構築処理は式(式1)によりリンクされる前処理および後処理色補正関数b
0およびb
pを利用するということが分かる。
【0042】
高忠実度HDRビデオ信号を表すSDRビデオ信号を分配するために、前処理色補正b
0の計算は、RGB SDR信号およびRGB HDR信号間の再構築誤差の最小化により符号化側で行われる。このような最小化操作は、ビデオの画像毎に計算された彩度パラメータ(彩度スキュー)により制御され、導出SDR信号の彩度を制御することを可能にする。したがって、前処理色補正関数b
0としたがって後処理色補正関数b
pはHDRビデオの元のHDR画像に依存する。後処理色補正関数b
pの同じ導出処理は復号器側において適用され得ない。
【0043】
その代り、復号器側において、一組の所定デフォルトLUT b
p_default[k](k=1〜N)が使用される。例えば、1つのLUTがトリプル(コンテナ色域、コンテンツ色域、ピーク輝度)毎に定義される。前処理側では、調整関数f
adjは、LUT b
p_default[k]を実際のLUT b
pへ可能な限りマッピングするように、すなわち、b
p_cod[Y]=f
adj[Y]×b
P_defauit[k][Y] (式2)
がすべてのY値に関しb
p[Y]に可能な限り近くなるように構築され、ここで、b
pは式1を使用することにより前処理色補正関数b
0から導出される。
【0044】
符号化コストを制限するために、関数f
adjは区分線形モデル(PWL:piece-wise linear model)のピボット点を使用することによりモデル化される。これらのPWLピボット点だけが符号化される。後処理工程では、これらの点が復号され得、関数f
adjが構築され、b
p_cod LUTは、式2を適用することにより、デフォルトLUT b
p_default(符号化コンテンツ特性パラメータのおかげで識別される)とf
adjとから再構築される。
【0045】
LUT b
pは通常、関数A/Yに近い形状を有し、Aは定数であり、Yは
図9に示すように輝度値である。
図9は、正規化範囲のY値を有するLUT b
pの例を示す。このような形状は小さなY値については大きな傾斜に至る。したがって、Yの小さな値についてのf
adjの小さな誤差はb
pの大きな誤差に至り得、したがって復号HDR信号の質および忠実性再構築を劣化させる。
【0046】
したがって、圧縮された標準ダイナミックレンジ画像から再構築されたHDR画像の質を改善する必要性がある。
【発明の概要】
【課題を解決するための手段】
【0047】
3.概要
本原理の一態様によると、符号化ビットストリームから少なくとも1つの高ダイナミックレンジ画像を復号する方法が開示される。このような方法は:
−前記符号化ビットストリームから標準ダイナミックレンジ画像を復号する工程と、
−前記符号化ビットストリームから、調整関数f
adjを表すピボット点の集合を復号する工程と、
−所定色補正関数b
p_defaultを選択する工程と、
−調整された色補正関数b
adjを次式:1/b
adj[Y]=f
adj[Y]×(l/b
p_default[Y])、ここでYは輝度値である、より定める工程と、
−復号された標準ダイナミックレンジ画像と調整された色補正関数b
adjとから高ダイナミックレンジ画像を再構築する工程と、を含む。
【0048】
この原理によると、再構築された高ダイナミックレンジ画像上の再構築誤差が制限される。復号器において使用される後処理色補正関数b
adjは、所与の式を使用することにより実際の後処理色補正b
pから最後にモデル化される。1/b
adjの形状は、LUT 1/b
pの形状と同様に直線に近い(Y値の範囲全体にわたって一貫した傾斜を有する)。したがって、本原理は、Y値の全範囲に沿った誤差を、この範囲に沿ったより一貫した振幅でもってより良く制御できるようにする。
【0049】
本開示の別の態様は、少なくとも1つの高ダイナミックレンジ画像を符号化ビットストリームへ符号化する方法である。前記方法は、
−少なくとも1つの前処理色補正関数b
0を使用することにより前記高ダイナミックレンジ画像を標準ダイナミックレンジ画像に分解する工程と、
−前記前処理色補正関数b
0から後処理色補正関数b
pを定める工程と、
−所定色補正関数b
p_defaultを選択する工程と、
−前記所定色補正関数b
p_defaultを調整するために使用される調整関数f
adjを次式:1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値である、により定め、調整された色補正関数b
adjを提供する工程であって、前記調整関数f
adjを定める工程は1/b
pおよび1/b
adj間の誤差の最小化を実行することを含む工程と、
−前記定められた調整関数f
adjを表すピボット点の集合を前記符号化ビットストリームへ符号化する工程と、
−前記標準ダイナミックレンジ画像を前記符号化ビットストリームへ符号化する工程と、を含む。
【0050】
本開示の別の態様は、符号化ビットストリームから少なくとも1つの高ダイナミックレンジ画像を復号する装置である。前記復号装置は:
−前記符号化ビットストリームから標準ダイナミックレンジ画像を復号する手段と、
−前記符号化ビットストリームから、調整関数f
adjを表すピボット点の集合を復号する手段と、
−所定色補正関数b
p_defaultを選択する手段と、
−調整された色補正関数b
adjを次式:1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値である、により定める手段と、
−復号された標準ダイナミックレンジ画像および調整された色補正関数b
adjから高ダイナミックレンジ画像を再構築する手段と、を含む。
【0051】
本開示の別の態様は、少なくとも1つの高ダイナミックレンジ画像を符号化ビットストリームへ符号化する装置である。前記符号化装置は:
−前処理色補正関数b
0を使用することにより、前記高ダイナミックレンジ画像を標準ダイナミックレンジ画像に分解する手段と、
−前記前処理色補正関数b
0から後処理色補正関数b
pを定める手段と、
−所定色補正関数b
p_defaultを選択する手段と、
−前記所定色補正関数b
p_defaultを調整するために使用される調整関数f
adjを次式:1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値である、により定め、調整された色補正関数b
adjを提供する手段と、
1/b
pおよび1/b
adj間の誤差の最小化を実行することにより、
−前記定められた調整関数f
adjを表すピボット点の集合を前記符号化ビットストリームへ符号化する手段と、
−前記標準ダイナミックレンジ画像を前記符号化ビットストリームへ符号化する手段と、を含む。
【0052】
本開示の別の態様は、プロセッサにより実行されると本原理の任意の実施形態による方法を実行するためのソフトウェアコード命令を含むコンピュータプログラムである。
【0053】
本開示の別の態様は、少なくとも1つの符号化高ダイナミックレンジ画像を表すビットストリームである。このようなビットストリームは:
−前記高ダイナミックレンジ画像から取得された少なくとも1つの標準ダイナミックレンジ画像を表す符号化データと、
−所定色補正関数b
p_defaultを調整し、調整された色補正関数b
adjを提供するために使用される調整関数f
adjを表すピボット点の集合であって、前記調整された色補正関数b
adjは1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値であり、により定められ、前記調整された色補正関数b
adjは、前記復号された標準ダイナミックレンジ画像から前記高ダイナミックレンジ画像を再構築するために使用される、ピボット点の集合を表す符号化データと、を含む。
【0054】
構築するために使用される、ビットストリームを格納した非一時的プロセッサ可読媒体が開示される。ビットストリームは:
−前記高ダイナミックレンジ画像から取得された少なくとも1つの標準ダイナミックレンジ画像を表す符号化データと、
−所定色補正関数b
p_defaultを調整し、調整された色補正関数b
adjを提供するために使用される調整関数f
adjを表すピボット点の集合であって、前記調整された色補正関数b
adjは1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値である、により定められ、前記調整された色補正関数b
adjは、前記復号された標準ダイナミックレンジ画像から前記高ダイナミックレンジ画像を再構築するために使用される、ピボット点の集合を表す符号化データと、を含む。
【発明を実施するための形態】
【0056】
5.実施形態の説明
以下では、符号化/復号方法について、HEVC符号化ツールを使用して説明するが、本明細書で説明される符号化/復号方法は、SDR画像と、圧縮SDR画像からHDR画像を再構築するためのサイド情報としてのHDRパラメータとを符号化するために使用される符号化ツールとは無関係である。したがって、本明細書に開示される原理は、SDR画像およびサイド情報を符号化/復号するのに好適な任意の符号化ツールへ適用される。
【0057】
本実施形態の以下の説明では、関数fのLUT(ルックアップテーブル)が参照される場合、関数fにより行われる操作は、一組の輝度値の関数fの予め計算された値を含むLUTを使用することにより実施されるということを理解すべきである。以下では、関数fまたはLUT f(関数fより速い実施形態である)への参照は同じ関数を指す。
【0058】
図1は、本原理の一実施形態による、HDR画像を符号化ビットストリームへ符号化する例示的システムを示す。このような符号化システムは、圧縮HDRビデオを分配する一方で、同時に、より限定されたダイナミックレンジを有するHDRビデオを表す関連SDRビデオを分配するために使用され得る。このような符号化システムは、SDR後方互換HDR分配の解決策を提供する。
【0059】
本開示は、カラーHDR画像を符号化/復号することに関し説明されるが、一連の画像(ビデオ)の各カラー画像は以下に述べるように連続的符号化/復号されるので一連の画像(ビデオ)の符号化/復号まで拡張される。
【0060】
HDR画像は最初に、HDR−to−SDR分解のモジュールへ入力される。このようなモジュールは、HDR−to−SDR分解を実行し、入力HDR画像のダイナミックレンジの低減されたバージョンであるSDR画像を出力する。
【0061】
出力SDR画像は、色相と知覚された彩度とが保存されHDR画像に対するSDR画像の視覚品質が改善されるように、再整形されたバージョンの入力HDR画像である。HDR−to−SDR分解モジュールはまた、HDR画像再構築のためにさらに使用される一組のHDRパラメータを出力する。
【0062】
このような一組のHDRパラメータは、SDR輝度をHDR輝度に変換するための逆輝度マッピングテーブル(LUT)を導出することを可能にする少なくとも輝度マッピングパラメータを含む。
【0063】
SDR画像は次に、画像符号化を実行する符号化モジュールへ入力される。このような符号化モジュールは、例えば10ビット深さで表されたビデオおよび画像を符号化するのに好適なHEVC Main 10符号器であり得る。符号化モジュールは、SDR画像の圧縮バージョンを表す符号化ビットストリームを出力する。HDRパラメータはまた、符号化ビットストリームの一部分として符号化モジュールにより符号化される。一例として、このようなHDRパラメータはHEVC Main 10ビットストリームのSEIメッセージ(Supplemental Enhancement Informationメッセージ)において符号化され得る。
【0064】
次に、このような符号化ビットストリームは伝送ケーブル上で格納または送信され得る。
【0065】
本明細書において提示される符号化システムの方法工程については、
図5と共に本明細書において開示される様々な実施形態に従ってさらに説明される。
【0066】
図2は、本原理の一実施形態による、符号化ビットストリームからHDR画像を復号する例示的システムを示す。一例として、符号化ビットストリームはHEVC Main 10プロファイルに準拠する。
【0067】
このような符号化ビットストリームは、SDR画像を表す符号化データと、符号化ビットストリーム内で圧縮されたSDR画像の復号バージョンからHDR画像を再構築するのに好適なHDRパラメータを表す符号化データとを含む。
【0068】
このような符号化ビットストリームは、メモリ内に格納されてもよいし、伝送ケーブルから受信されてもよい。
【0069】
符号化ビットストリームは最初に、画像復号およびHDRパラメータ復号を実行する復号モジュールへ入力される。復号モジュールは例えば、HEVC Main 10プロファイル復号器に準拠した復号器であり得る。
【0070】
復号モジュールは復号SDR画像と一組のHDRパラメータとを出力する。復号SDR画像はレガシーSDR表示(SDR出力)により表示され得る。このようなSDR画像はエンドユーザにより自身のレガシーSDR表示から視ることが可能かもしれない。したがって、開示されたシステムは、任意のSDRレガシー表示と後方互換である。
【0071】
復号されたSDR画像およびHDRパラメータは次に,SDR−to−HDR再構築のためのモジュールへ入力される。このようなモジュールは、所与のHDRパラメータを使用することにより復号SDR画像からHDR画像を再構築する。次に、復号されたHDR画像は出力され、HDR互換ディスプレイ(HDR出力装置)により表示され得る。
【0072】
本明細書において提示される復号システムの復号方法工程はさらに、
図6と共に本明細書に開示される様々な実施形態に従って説明される。
【0073】
1.HDR画像を符号化ビットストリームへ符号化する:
図5は、本原理の一実施形態による、HDR画像を符号化ビットストリームへ符号化する例示的方法のブロック図を示す。
【0074】
工程E50では、HDR画像がSDR画像に分解される。このようなHDR−to−SDR分解は、
図3を参照して説明された分解処理と同様に行われる。分解処理は前処理色補正関数b
0を使用する。
【0075】
工程E51では、後処理色補正関数b
pは、上に説明した式1を使用することにより前記前処理色補正関数b
0から定められる。
【0076】
工程E52では、所定色補正関数b
p_defaultは、一組の所定色補正関数b
p_defauit[k]の中から選択される。このような関数b
p_defaultは、HDR画像のコンテンツ特性またはHDR画像が属するシーケンスのコンテンツ特性に従って選択される。このような所定色補正関数セットは復号器へ知らされる。
【0077】
工程E53では、調整関数f
adjが定められる。このような調整関数は、調整された色補正関数b
adjを提供するように前記所定色補正関数b
p_defaultを調整するために使用される。本原理と共に、調整関数f
adjは次式:
1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値である、に従って定義される。
【0078】
前記調整関数f
adjは、すべてのY値の1/b
pおよび1/b
adj間の誤差の最小化を実行することにより定められる。例えば、最小二乗法が、関数f
adjを推定するために使用される可能性がある。結果のf
adj関数は、符号化コストを制限するためにピボット点の集合(Y,f
adj[Y
i])、i=0から(N
pwi−1)である、により近似される区分線形関数である。
【0079】
最小2乗平均手法では、関数f
adjは、誤差
【数13】
が最小となるように計算され、ここで、Y
maxはYの最大可能値であり、f
adj[Y]は次式のように導出される:
f
adj[Y]=f
adj[Y
i]+(Y−Y
i)/(Y
i+1−Y)×(f
adj[Y
i+1]−f
adj[Y
i]) [Y
i,Y
i+l]のYは任意
【0080】
この最小化を実行するための可能な1つのアルゴリズムは以下のとおりである。
【0081】
区分線形関数f
adjがN
pwi=(Y
max−1)点により初期化され、各点(Y
i,f
adj[Y
i]),i=0から(Y
max−1)である、は次式のように定義される:Y
i=i
【数14】
【0083】
次に、N
pwiが目標数の点(典型的には6点)より大きい間、除去されると最小誤差Eを生成する点(Y
k,f
adj[Y
k])が識別され、f
adjを表すピボット点のリストから除去される。これは、残りのN
pwi個のピボット点の各1つを試験し、この点無しに生成された区分線形関数f
adjから生じる対応誤差E
kを計算することにより行われる。E
kが最小である点は、除去され、N
pwiが1だけ減じられる。上記処理は、N
pwiがピボット点の目標数に達するまで、繰り返される。
【0084】
工程E54では、このような組のピボット点は符号化ビットストリームへ符号化される。このようなピボット点の集合は例えば、
図1の符号化方式において説明したようなHRDパラメータの一部として符号化される。
【0085】
工程E55では、SDR画像もまた、
図1との関連で説明したように前記符号化ビットストリームへ符号化される。
【0086】
2.符号化ビットストリームからHDR画像を復号すること
図6は、本原理の一実施形態による、符号化ビットストリームからHDR画像を復号する例示的方法のブロック図を示す。
【0087】
工程E60では、SDR画像が前記符号化ビットストリームから復号される。
【0088】
工程E61では、ピボット点の集合が前記符号化ビットストリームから復号される。前記ピボット点の集合は調整関数f
adjを表す。
【0089】
工程E62では、所定色補正関数b
p_defaultが、一組の所定色補正関数b
p_defauit[k]の中から選択される。このような一組の所定色補正関数b
p_default[k]は、
図5に関連して符号器において定義されたものと同じである。このような関数b
p_defaultは、HDR画像のコンテンツ特性またはHDR画像が属するシーケンスのコンテンツ特性に従って選択される。このようなコンテンツ特性は、サイド情報として、または
図2との関連で説明されたHDRパラメータと共に、復号器へ送信される。
【0090】
工程E63では、調整された色補正関数b
adjが次式:1/b
adj[Y]=f
adj[Y]×(1/b
p_default[Y])、ここでYは輝度値である、に従って構築され、調整関数f
adjは復号されたピボット点の集合から再構築される。
【0091】
次に、工程E64では、HDR画像は、
図4を参照して説明された再構築処理と同じように、復号されたSDR画像と調整された色補正関数b
adjとから再構築される。
【0092】
図1〜
図6では、方法工程は機能ユニットであるモジュールにより行われ、このようなモジュールは識別可能物理的ユニットへ関連付けられてもされなくてもよい。例えば、これらのモジュールまたはそのうちのいくつかは、独自部品または回路と一緒にされても良いし、ソフトウェアの機能に寄与してもよい。反対に、いくつかのモジュールは場合によっては、別個の物理的エンティティで構成され得る。本開示に適合する装置は、純粋なハードウェアを使用することにより、例えばASIC(Application Specific Integrated Circuit:特定用途向け集積回路)、またはFPGA(Field-Programmable Gate Array:フィールドプログラマブルゲートアレイ)またはVLSI(Very Large Scale Integration:超大規模集積回路)などの専用ハードウェアを使用することにより、または装置内に埋め込まれたいくつかの集積電子部品により、またはハードウェアおよびソフトウェア部品の混合物によりの、いずれかで実装される。
【0093】
図7は、
図1〜6との関連で説明された方法を実施するように構成され得る装置70の例示的構造を表す。
【0094】
装置70は、データとアドレスバス71とを併せて結合される以下の要素を含む:
−例えばDSP(すなわちデジタル信号プロセッサ:Digital Signal Processor)であるマイクロプロセッサ72(またはCPU);
−ROM(すなわち読み取り専用メモリ)73;
−RAM(すなわちランダムアクセスメモリ)74;
−アプリケーションからのデータの送信および/または受信のためのI/Oインターフェース75;
−電池76。
【0095】
一変形態様によると、電池76は装置の外にある。
図7のこれらの要素のそれぞれは、当業者により周知であり、したがってさらに開示されない。上記メモリのそれぞれにおいて、本明細書で使用される用語「レジスタ」は、小容量(いくつかのビット)の領域、または非常に大きな領域(例えば、全プログラム、または大量の受信または復号されたデータ)に対応し得る。ROM73は少なくとも1つのプログラムおよびパラメータを含む。本開示による方法のアルゴリズムはROM73内に格納される。スイッチオンされると、CPU73は、RAM内のプログラムをアップロードし、対応命令を実行する。
【0096】
RAM74は、装置71のスイッチオン後にCPU72により実行されアップロードされるプログラムをレジスタ内に、入力データをレジスタ内に、本方法の様々な状態における中間データをレジスタ内に、および本方法の実行のために使用される他の変数をレジスタ内に含む。
【0097】
本明細書で説明される実装は、例えば方法または処理、装置、ソフトウェアプログラム、データストリーム、または信号で実施され得る。単一形式の実施の文脈においてだけ論述された(例えば、方法または装置として論述されただけ)としても、論述される特徴の実装は他の形式(例えばプログラム)で実装され得る。装置は例えば適切なハードウェア、ソフトウェアおよびファームウェアで実装され得る。本方法は例えば、処理装置全般(例えばコンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイスを含む)を指す例えばプロセッサなどの装置内に実装され得る。プロセッサはまた、例えばコンピュータ、セルラ電話、携帯/個人用デジタル補助装置(PDA:portable/personal digital assistant)、およびエンドユーザ間の情報の伝達を容易にする他の装置などの通信装置を含む。
【0098】
符号化または符号器の特定の実施形態によると、HDRカラー画像はソースから取得される。例えば、ソースは、
−ローカルメモリ(73または74)、例えばビデオメモリまたはRAM(すなわちランダムアクセスメモリ)、フラッシュメモリ、ROM(すなわち読み取り専用メモリ)、ハードディスク;
−記憶装置インターフェース、例えば大量記憶装置、RAM、フラッシュメモリ、ROM、光ディスクまたは磁気式補助装置とのインターフェース;
−通信インターフェース(75)、例えば有線インターフェース(例えばバスインターフェース、広域ネットワークインターフェース、ローカルエリアネットワークインターフェース)、または無線インターフェース(IEEE 802.11インターフェースまたはBluetooth(登録商標)インターフェースなど);および
−画像捕捉回路、(例えばCCD(すなわち電荷結合素子:Charge-Coupled Device)またはCMOS(すなわち相補金属酸化物半導体:Complementary Metal-Oxide-Semiconductor)などのセンサ)を含む組に属する。
【0099】
復号または復号器の異なる実施形態によると、HDR復号画像は送信先へ送信され;特に、送信先は、
−ローカルメモリ(73または74)、例えばビデオメモリまたはRAM(すなわちランダムアクセスメモリ)、フラッシュメモリ、ROM(すなわち読み取り専用メモリ)、ハードディスク;
−記憶装置インターフェース、例えば大量記憶装置、RAM、フラッシュメモリ、ROM、光ディスクまたは磁気式補助装置とのインターフェース;
−通信インターフェース(75)、例えば有線インターフェース(例えばバスインターフェース、広域ネットワークインターフェース、ローカルエリアネットワークインターフェース)、または無線インターフェース(IEEE 802.11インターフェースまたはBluetooth(登録商標)インターフェースなど);および
−ディスプレイを含む組に属する。
【0100】
符号化または符号器の様々な実施形態によると、符号化ビットストリームは送信先へ送信される。一例として、符号化ビットストリームは、ローカルまたはリモートメモリ(例えばビデオメモリ(74)、RAM(74)、ハードディスク(73))内に格納される。変形形態では、ビットストリームは記憶装置インターフェース(例えば大量記憶装置、フラッシュメモリ、ROM、光ディスクまたは磁気式補助装置とのインターフェース)へ送信される、および/または通信インターフェース(75)、例えばポイントツウポイントリンク、通信バス、ポイントツーマルチポイントリンク、または放送網へのインターフェース上で送信される。
【0101】
復号または復号器の様々な実施形態によると、ビットストリームはソースから取得される。例示的に、ビットストリームは、ローカルメモリ(例えばビデオメモリ(74)、RAM(74)、ROM(73)、フラッシュメモリ(73)、ハードディスク(73))から読み出される。変形形態では、ビットストリームは、記憶装置インターフェース(例えば大量記憶装置、RAM、ROM、フラッシュメモリ、光ディスク、または磁気式補助装置とのインターフェース)から受信される、および/または通信インターフェース(75)、例えばポイントツウポイントリンク、バス、ポイントツーマルチポイントリンク、または放送網へのインターフェース上で受信される。
【0102】
様々な実施形態によると、
図1または5との関連で説明された符号化方法を実施するように構成された装置70は、
−モバイル装置;
−通信装置;
−ゲーム装置;
−タブレット(またはタブレットコンピュータ);
−ラップトップ;
−静止画カメラ;
−ビデオカメラ;
−符号化チップ;
−静止画サーバ;および
−ビデオサーバ(例えば同報通信サーバ、ビデオオンディマンドサーバまたはウェブサーバ)を含む組に属する。
【0103】
様々な実施形態によると、
図2または6の関連で説明された復号方法を実施するように構成された装置70は、
−モバイル装置;
−通信装置;
−ゲーム装置;
−セットトップボックス;
−テレビセット;
−タブレット(またはタブレットコンピュータ);
−ラップトップ;
−ディスプレイおよび
−復号チップを含む組に属する。
【0104】
本明細書で説明された様々な処理および特徴の実施形態は様々な異なる装置またはアプリケーション内で具現化され得る。このような装置の例は、符号器、復号器、復号器からの出力を処理するポストプロセッサ、入力を符号器へ提供するプリプロセッサ、ビデオ符号器、ビデオ復号器、ビデオコーデック、ウェブサーバ、セットトップボックス、ラップトップ、パーソナルコンピュータ、セルラ電話、PDA、および画像を処理するための任意の他の装置、またはビデオまたは他の通信装置を含む。明らかなように、装置は可動であり、移動車両内にすら設置され得る。
【0105】
加えて、本方法は、プロセッサにより行われる命令により実施され得、このような命令(および/または実施により生成されたデータ値)はコンピュータ可読記憶媒体上に格納され得る。コンピュータ可読記憶媒体は、1つまたは複数のコンピュータ可読媒体内に具現化され、コンピュータにより実行可能であるその上に具現化されたコンピュータ可読プログラムコードを有するコンピュータ可読プログラム製品の形式を採り得る。本明細書で使用されるコンピュータ可読記憶媒体は、情報をその中に格納する固有能力とそれからの情報の検索を提供する固有能力とを与えられた非一時的記憶媒体と考えられる。コンピュータ可読記憶媒体は、例えば、限定しないが、電子的、磁気的、光学的、電磁気的、赤外線、または半導体システム、装置、またはデバイス、または上述のものの任意の好適な組合せであり得る。以下のものは、本原理が適用され得るコンピュータ可読記憶媒体のより具体的な例を提供する一方で、当業者により容易に理解されるように単に例示的であり、網羅的でないリストであるということを認識すべきである:携帯型コンピュータディスケット;ハードディスク;読み取り専用メモリ(ROM);消去可能プログラマブルROM(EPROMまたはフラッシュメモリ);ポータブルコンパクトディスク読み取り専用メモリ(CD−ROM);光学的記憶装置;磁気的格納装置;または上述したものの任意の好適な組合せ。
【0106】
命令はプロセッサ可読媒体上に有形に具現化されたアプリケーションプログラムを形成し得る。
【0107】
命令は、例えばハードウェア、ファームウェア、ソフトウェアまたはその組合せであり得る。命令は、例えばオペレーティングシステム、別個のアプリケーション、またはこれら2つの組合せたものの中に見出され得る。したがって、プロセッサは、例えば処理を行うように構成された装置と処理を行うための命令を有するプロセッサ可読媒体を含む装置(記憶装置などの)との両方として特徴付けられ得る。さらに、プロセッサ可読媒体は、命令に加えてまたはその代りに、実施により生成されたデータ値を格納し得る。
【0108】
当業者にとって明らかなように、実施は、例えば格納または送信され得る情報を担持するようにフォーマット化された様々な信号を生成し得る。情報は、例えば方法を実行するための命令または説明した実施の1つにより生成されたデータを含み得る。例えば、信号は、説明された実施形態のシンタックスを書き込むまたは読み出すための規則をデータとして担持するように、または説明された実施形態により書き込まれた実際のシンタックス値をデータとして担持するようにフォーマット化され得る。このような信号は、例えば電磁波として(例えば、スペクトルの高周波部分を使用して)フォーマット化されてもよいし、ベースバンド信号としてフォーマット化されてもよい。フォーマット化は例えば、データストリームを符号化することと、符号化データストリームにより搬送波を変調することとを含み得る。信号が担持する情報は例えばアナログまたはデジタル情報であり得る。信号は、知られているように様々な異なる有線または無線リンク上で送信され得る。信号はプロセッサ可読媒体上に格納され得る。
【0109】
多くの実施が説明された。それにもかかわらず、様々な修正がなされ得るということが理解される。例えば、様々な実施の要素は、他の実施を生成するために組み合わせられ、修正され、補完され、または除去され得る。加えて、当業者は「他の構造および処理が、開示されたものを置換し得る」ということと、「その結果の実施は、開示された実施と少なくともほぼ同じ結果を達成するために少なくともほぼ同じやり方で少なくともほぼ同じ機能を実行することになる」ということとを理解することになる。したがって、これらおよび他の実施は本出願により企図される。
上記実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
符号化ビットストリームから少なくとも1つの高ダイナミックレンジ画像を復号する方法であって、
−前記符号化ビットストリームから標準ダイナミックレンジ画像を復号することと、
−前記符号化ビットストリームから、調整関数fadjを表すピボット点の集合を復号することと、
−所定色補正関数bp_defaultを選択することと、
−調整された色補正関数badjを次式:1/badj[Y]=fadj[Y]×(1/bp_default[Y])、ここでYは輝度値である、により定めることと、
−前記復号された標準ダイナミックレンジ画像および前記調整された色補正関数badjから高ダイナミックレンジ画像を再構築することと、を含む方法。
(付記2)
少なくとも1つの高ダイナミックレンジ画像を符号化ビットストリームに符号化する方法であって、
−少なくとも1つの前処理色補正関数b0を使用することにより、前記高ダイナミックレンジ画像を標準ダイナミックレンジ画像に分解することと、
−前記前処理色補正関数b0から後処理色補正関数bpを定めることと、
−所定色補正関数bp_defaultを選択することと、
−前記所定色補正関数bp_defaultを調整するために使用される調整関数fadjを次式:1/badj[Y]=fadj[Y]×(1/bp_default[Y])、ここでYは輝度値である、により定め、調整された色補正関数badjを提供することであって、前記調整関数fadjを前記定めることは、1/bpと1/badj間の誤差の最小化を実行することを含む、ことと、
−前記定められた調整関数fadjを表すピボット点の集合を前記符号化ビットストリームに符号化することと、
−前記標準ダイナミックレンジ画像を前記符号化ビットストリームに符号化することと、を含む方法。
(付記3)
符号化ビットストリームから少なくとも1つの高ダイナミックレンジ画像を復号する装置であって、
−前記符号化ビットストリームから標準ダイナミックレンジ画像を復号し、
−前記符号化ビットストリームから、調整関数fadjを表すピボット点の集合を復号し、
−所定色補正関数bp_defaultを選択し、
−調整された色補正関数badjを次式:1/badj[Y]=fadj[Y]×(1/bp_default[Y])、ここでYは輝度値である、により定め、
−前記復号標準ダイナミックレンジ画像および前記調整された色補正関数badjから高ダイナミックレンジ画像を再構築する、ように構成された少なくとも1つのプロセッサを含む装置。
(付記4)
少なくとも1つの高ダイナミックレンジ画像を符号化ビットストリームに符号化する装置であって、
−前処理色補正関数b0を使用することにより、前記高ダイナミックレンジ画像を標準ダイナミックレンジ画像に分解し、
−前記前処理色補正関数b0から後処理色補正関数bpを定め、
−所定色補正関数bp_defaultを選択し、
−前記所定色補正関数bp_defaultを調整するために使用される調整関数fadjを次式:1/badj[Y]=fadj[Y]×(1/bp_default[Y])、ここでYは輝度値である、により定め、調整された色補正関数badjを提供し、
1/bpと1/badj間の誤差の最小化を実行することにより、
−前記定められた調整関数fadjを表すピボット点の集合を前記符号化ビットストリームに符号化し、
−前記標準ダイナミックレンジ画像を前記符号化ビットストリームに符号化する、ように構成された少なくとも1つのプロセッサを含む装置。
(付記5)
プロセッサにより実行されると付記1または2のいずれか一に記載の方法を実行するためのソフトウェアコード命令を含むコンピュータプログラム。
(付記6)
少なくとも1つの符号化高ダイナミックレンジ画像を表すビットストリームであって、
−前記高ダイナミックレンジ画像から取得された少なくとも1つの標準ダイナミックレンジ画像を表す符号化データと、
−所定色補正関数bp_defaultを調整し、調整された色補正関数badjを提供するために使用される調整関数fadjを表すピボット点の集合であって、前記調整された色補正関数badjは1/badj[Y]=fadj[Y]×(1/bp_default[Y])、ここでYは輝度値である、により定められ、前記調整された色補正関数badjは前記復号された標準ダイナミックレンジ画像から前記高ダイナミックレンジ画像を再構築するために使用される、ピボット点の集合を表す符号化データと、を含むビットストリーム。
(付記7)
付記3に記載の復号装置を内蔵する電子装置。
(付記8)
モバイル装置、通信装置、ゲーム装置、セットトップボックス、テレビセット、タブレット、ラップトップ、ディスプレイおよび復号チップからなる群から選択された付記7に記載の電子装置。
(付記9)
付記4に記載の符号化装置を内蔵する電子装置。
(付記10)
モバイル装置、通信装置、ゲーム装置、タブレット、ラップトップ、静止画カメラ、ビデオカメラ、符号化チップ、静止画サーバ、およびビデオサーバからなる群から選択された付記9に記載の電子装置。