【文献】
LIU Z,COMPUTERS AND MATHEMATICS WITH APPLICATIONS,英国,PERGAMON PRESS,2009年 6月 1日,V57 N11-12,P1829-1834
【文献】
PETER ZOLLIKER,IEEE TRANSACTIONS ON IMAGE PROCESSING,米国,IEEE SERVICE CENTER,2007年 3月 1日,V16 N3,P664-672
(58)【調査した分野】(Int.Cl.,DB名)
前記飽和調整関数を適用することが、前記第一の出力画像(112)の強度ピクセル値と、前記第二の出力画像(127)または前記第一のトーンマッピングされた画像(117)のいずれかの強度ピクセル値とに応答して決定されるスケーリング定数によって、前記第一の出力画像(112)の色成分をスケーリングすることを含む、請求項1記載の方法。
【発明を実施するための形態】
【0013】
向上ダイナミックレンジ(EDR)画像の効率的な表示管理(display management)(たとえばトーンおよび色域マッピング)が本稿に記載される。以下の記述では、本発明の十全な理解を提供するために、説明の目的で数多くの個別的詳細が記載される。しかしながら、本発明がそうした個別的詳細なしでも実施されうることは明白であろう。他方、本発明を無用に隠蔽し、かすませ、あるいは埋没させるのを避けるために、よく知られた構造および装置は網羅的な詳細さでは記述されない。
【0014】
〈概観〉
本稿に記載される例示的実施形態は、EDR画像の効率的な表示管理に関する。表示管理プロセッサが、参照ディスプレイとは異なるダイナミックレンジをもつ目標ディスプレイ上で表示されるべき、向上ダイナミックレンジをもつ入力画像を受領する。入力画像はまず入力色空間(たとえばRGB)から知覚的に補正されたIPT色空間(IPT-PQ)に変換される。非線形マッピング関数が、入力信号の強度を参照ダイナミックレンジから目標ダイナミックレンジにマッピングすることによって、第一のトーンマッピングされた信号を生成する。第一のトーンマッピングされた信号の強度(I)成分は、非鮮鋭マスキング(unsharp masking)を使って詳細を保存するために鮮鋭化され、色(PおよびT)成分の飽和が適切に調整されて、第二のトーンマッピングされた出力画像を生成する。第二のトーンマッピングされた出力画像に色域マッピング関数が適用されて、目標ディスプレイ上への表示のために好適な画像を生成してもよい。表示管理パイプラインは、個別に定義されたディスプレイ・モードに従って、表示される画像の強度および色成分を調整するよう適応されていてもよい。
【0015】
入力画像が、クロマ成分がルーマ成分より低い空間解像度にある色フォーマットで受領される場合には、例示的な諸実施形態では、表示管理プロセスは、並列に実行されうる二つの経路に分割されてもよい。一方の経路はすべての色成分に対して、ただし入力画像のクロマ成分の前記より低い解像度で作用するが、第二の経路はルミナンス関係のデータのみに対して、ただしルーマ成分のもとの(完全な)解像度において作用する。
【0016】
〈例示的な表示管理処理パイプライン〉
図1Aは、本発明のある実施形態に基づく、EDR画像(HDR画像とも称される)の表示管理のための例示的なプロセスを描いている。
図1Aに描かれるように、ビデオ・プロセッサ(たとえば、セットトップボックス、画像ディスプレイまたは他の好適な画像プロセッサ)はEDR画像(102)および任意的には関連するメタデータ(104および106)を受領する。EDR画像(102)は、EDRビデオ信号のような画像のシーケンスの、あるフレームの一部または完全なフレームを含んでいてもよい。本稿での用法では、用語「メタデータ」は、符号化されたビットストリームの一部として伝送され、デコードされた画像をレンダリングするためにデコーダを支援する任意の補助情報に関する。そのようなメタデータは、本稿に記載されるような、色空間または色域情報、参照ディスプレイ・パラメータおよび補助信号パラメータを含みうるが、これに限られない。
【0017】
受領されたEDR画像(102)は、RGB色フォーマットまたはYCbCr、XYZなどといった他のいかなる色空間にあってもよい。受領された画像は、目標ディスプレイ・モニタとは異なるダイナミックレンジおよび色域特性をもつこともありうる参照EDRモニタ上でカラーグレーディングされていることがありうる。本稿での用法では、用語「カラーグレーディング(color grading)」は、色アーチファクトを補正するおよび/またはディレクターの意図に合致するために画像またはビデオの色を調整するプロセスを表わす。
【0018】
EDR入力(102)は、プログラム制作の間に画像をカラーグレーディングするために使われたディスプレイに関係した源ディスプレイ・メタデータ(104)をも含んでいてもよい。たとえば、そのようなメタデータは、勧告ITU-R BT.1866(03/2011)によって定義された参照の電気光伝達関数(EOTF: electro-optical transfer function)を含んでいてもよい。EDR入力は、源もしくは参照ディスプレイの最大および最小輝度、データの最大、最小および平均中間トーンおよびカラーグレーディングの間の周辺光(ambient light)の強度といった、追加的な源ディスプレイおよびコンテンツ・メタデータ(106)を含んでいてもよい。たとえば、参照モニタについてのメタデータは、制作において使われた以下の例示的なパラメータを含んでいてもよい:
源モニタ最小輝度Smin=0.005ニト;
源モニタ最大輝度Smax=4000ニト;
周辺光Samb=10ニト;
ガンマSgamma=2.4;
色空間=DCI P3、白色点=D65。
【0019】
参照モニタについてのメタデータは、典型的には一度伝送されるだけでよい。しかしながら、ビデオ・データについてのメタデータはフレーム毎、シーン毎または変化があるたびに伝送されてもよい。源コンテンツに関係したメタデータがない場合、いくつかの実施形態では、そのようなデータは源ビデオ・コンテンツを解析することによって抽出されてもよい。
【0020】
〈IPT-PQ色空間〉
ある好ましい実施形態では、処理パイプラインは、IPT-PQ色空間と称されるものにおいて実行される。しかしながら、同様の処理段階は、RGB、YCbCr、XYZ、CIE-Labなどといった他の色空間で実行されてもよい。参照によってここにその全体において組み込まれる非特許文献1において記述されているIPT(エブナー論文と称する)は、人間の視覚系における錐体間の色差のモデルである。この意味で、IPTはYCbCrまたはCIE-Lab色空間のようなものであるが、いくつかの科学的研究において、これらの色空間より人間の視覚処理をよりよく模倣することが示されている。CIE-Labと同様に、IPTは、何らかの参照ルミナンスに対する規格化された空間である。ある実施形態では、規格化は目標ディスプレイの最大ルミナンスに基づく。
【0021】
本稿で使われるところの用語「PQ」は知覚的量子化(perceptual quantization)を指す。人間の視覚系は、増大する光レベルに対して、非常に非線形な仕方で応答する。人間の、刺激を見る能力は、刺激のルミナンス、刺激のサイズおよび刺激をなす空間周波数および刺激を見ている特定の瞬間に目が順応しているルミナンス・レベルによって影響される。ある好ましい実施形態では、知覚的量子化器関数は、線形の入力グレーレベルを、人間の視覚系におけるコントラスト感度閾値によりよくマッチするよう出力グレーレベルにマッピングする。PQマッピング関数の例は、2012年12月6日に出願されたJ.S.ミラーらによる「異なるディスプレイ機能を横断する知覚的ルミナンス非線形性ベースの画像データ交換」と題する、参照によってここにその全体において組み込まれるPCT出願第PCT/US2012/068212('212出願と称される)において記述されている。同出願では、固定した刺激サイズを与えられて、すべてのルミナンス・レベル(すなわち刺激レベル)について、そのルミナンス・レベルにおける最小の可視のコントラスト階差が、(HVSモデルに従って)最も敏感な順応レベルおよび最も敏感な空間周波数に従って選択される。物理的な陰極線管(CRT)装置の応答曲線を表わし、同時に人間の視覚系が応答する仕方と非常に大まかな類似性をもちうる伝統的なガンマ曲線に比べ、'212出願によって決定されるPQ曲線は、比較的単純な関数モデルを使って人間の視覚系の真の視覚的応答を模倣する。
【0022】
表1は、表示の点においてデジタル・ビデオ符号値を絶対的な線形ルミナンス・レベルに変換するための知覚的曲線EOTFの計算を記述している。絶対的な線形ルミナンスをデジタル符号値に変換するための逆OETF計算も含めてある。
【0023】
表1
例示的な式の定義:
D=知覚的曲線のデジタル符号値、SDIリーガルな符号なし整数、10または12ビット
b=デジタル信号表現における成分当たりのビット数、10または12
V=規格化された知覚的曲線の信号値、0≦V≦1
Y=規格化されたルミナンス値、0≦Y≦1
L=絶対的なルミナンス値、0≦L≦10,000cd/m
2
【0024】
【表1】
注:
1.演算子INTは0から0.4999…の範囲内の端数部分について0の値を返し、0.5から0.999…の範囲内の端数部分について+1の値を返す。すなわち、0.5より上の端数を切り上げる。
2.すべての定数は、丸めの心配を避けるため、12ビット有理数の厳密な倍数として定義される。
3.R、GまたはB信号成分は上記のY信号成分と同様に計算される。
【0025】
図2は、ある実施形態に基づく、色変換ステップ(110)についての例示的なプロセスをより詳細に示している。
図2に描かれるように、第一の色空間(たとえばRGB)にある入力EDR信号(102)が与えられたとき、色空間変換ステップはそれを、知覚的に補正されたIPT色空間(IPT-PQ)における信号(112)に変換する。この色変換は、次のステップを有していてもよい:
a)(ステップ210)入力信号(102)のピクセル値(たとえば0ないし4095)を0から1までの間のダイナミックレンジをもつピクセル値に規格化する。
【0026】
b)(ステップ215)(メタデータ(104)によって与えられる)EOTFを使って、符号値からルミナンスへの源ディスプレイの変換を逆にするまたは取り消す。たとえば、入力信号がガンマ符号化されていたら、このステップは逆ガンマ関数を適用する。入力信号が'212 PCT出願に従ってPQエンコードされていたら、このステップは逆PQ関数を適用する。実際上は、規格化ステップ(210)および逆非線形エンコード(215)は、あらかじめ計算された1Dのルックアップテーブル(LUT)を使って実行されてもよい。
【0027】
c)(ステップ220)ステップb)の出力をLMS色空間に変換する。
【0028】
d)(ステップ225)エブナー論文によれば、伝統的なLMSからIPTへの色空間変換は、LMSデータに第一の非線形パワー関数を適用し、次いで線形変換行列を適用することを含む。データをLMSからIPTに変換してからPQ関数を適用してIPT-PQドメインにすることもできるが、ある好ましい実施形態では、ステップ225において、LMSのIPTへの非線形エンコードのための伝統的なパワー関数は、PQ非線形エンコードによって置き換えられる。たとえば、非線形L、MおよびS値は、式(t2)におけるV信号と同じようにして計算され、ここで、Y信号は線形のL、MまたはS成分値(222)によって置き換えられる。いくつかの実施形態では、PQエンコードの規格化されたバージョンが使用されてもよく、ここでは、式(t3)のステップは省略されてもよく、出力PQ値の範囲は0から1までの間である。
【0029】
e)(ステップ230)標準的なLMSからIPTへの線形変換を使って、ステップ230は信号222のIPT色空間への変換を完了する。
【0030】
f)(ステップ235)いくつかの実施形態では、IPT-PQ出力232のI成分はまた、飽和色が同じルミナンス値をもつ白色より明るく見えるというヘルムホルツ‐コールラウシュ効果を考慮に入れるために調整されてもよい。値I
i、P
iおよびT
iによって表わされるIPT空間におけるピクセルを与えられて、CH
i=√(P
i2+T
i2)とすると、ある実施形態では、ステップ235の出力I'は
【数1】
と表わされてもよい。
【0031】
出力IPT-PQ信号(112)の範囲はI成分については0ないし1であり(0から10,000ニトまでの間のダイナミックレンジに対応)、PおよびT成分については−1から1までの間である。
【0032】
いくつかの実施形態では、完全な色変換パイプライン(たとえば110)は3D LUTを使って計算されてもよい。
【0033】
〈トーンマッピング〉
色変換ステップ(110)後、信号(112)の強度(I)は、目標ディスプレイの制約条件内に収まるようマッピングされる必要がある。
図3は、ある実施形態に基づいて計算された非線形マッピング関数(320)(たとえばステップ115)の例を描いている。目標ディスプレイは、EDRディスプレイまたはSDRディスプレイであってもよい。目標ディスプレイが入力(102)を処理する(たとえばカラーグレーディングする)ために使われた参照(または源)制作ディスプレイと同じ特性をもつ場合には、何の変換も必要とされない。そのような一対一の線形マッピングは、
図3では線形マッピング(310)によって示されている。しかしながら、目標ディスプレイが参照制作ディスプレイのダイナミックレンジより低いまたは高いダイナミックレンジをもつ場合には、処理ステップ(115)は入力信号のダイナミックレンジを目標ディスプレイのダイナミックレンジにマッピングする。
【0034】
図3において、境界(305−1)および(305−2)は入力信号(入力EDR)の最小および最大輝度レベルを描いているとする。また、(307−1)および(307−2)は目標ディスプレイの最小および最大輝度レベルを描いているとする。
【0035】
関数(320)によって描かれている入力から参照ディスプレイ・ダイナミックレンジへのマッピングを想定すると、非線形マッピング(たとえば320)の出力は、目標ディスプレイのダイナミックレンジ制約条件(たとえば307−1および307−2)内によりよく収まる。例示的な非線形マッピング関数は、ここに参照によりその全体において組み込まれる、A.Ballestadらの2012年3月15日に出願された「画像データ変換のための方法および装置」と題するPCT出願第PCT/US2012/029189号において記述されている。
【0036】
Ballestadの'189 PCT出願によれば、非線形マッピング(115)のための例示的な伝達関数は
【数2】
として表わされてもよい。ここで、C
1、C
2およびC
3は定数であり、Y
inは色チャネル(たとえばIチャネル)についての入力値であり、Y
outは色チャネルについての出力値であり、nおよびmはパラメータである。この伝達関数は、パラメータ表現したシグモイド・トーン曲線関数の例である。パラメータC
1、C
2およびC
3は、三つのアンカー点(たとえば325−1、325−2および325−3)の定義に基づいて決定され、これらのアンカー点は、典型的には入力メタデータ(106)から抽出される参照(または源)ディスプレイの輝度特性と、典型的には表示管理プロセスを実行するプロセッサにはすでに既知である目標ディスプレイの輝度特性とに基づいて定義される。
【0037】
ある例示的な実施形態では、ステップ(120)は式(2)のトーン曲線パラメータを次のようにして計算してもよい:
a)源から目標の比S2Tratioの計算
TminおよびTmaxが、PQエンコードで表わされる目標ディスプレイの最小および最大輝度を表わすとする。また、SminおよびSmaxが、やはりPQエンコードされる源ディスプレイの最小および最大輝度を表わすとする。すると、ある実施形態では、S2Tratioは次のように定義されてもよい。
【0038】
【数3】
一般性を失うことなく、いくつかの実施形態では、S2Tratioの値は、決して1より大きくないよう限られてもよい。すなわち、デコーダは、参照ディスプレイは常に少なくとも目標ディスプレイと同じくらい明るいと想定してもよい。S2Tratio=1であれば、ステップ(115)はスキップされてもよいことを注意しておく。
【0039】
一般性を失うことなく、入力シーケンスは、三つの変数によって特徴付けられるとする。該三つの変数はある例示的な実施形態では、変数Crush〔つぶれ〕、Clip〔クリップ〕およびMid〔中間〕によって表わされる。これらはそれぞれ、入力シーケンスの最低黒レベル、最高白レベルおよび平均グレーレベルを表わす。それらの値は、各フレーム、フレームの一部またはシーン内のフレームのシーケンスについて計算されることができる。これらのパラメータの値は、入力ビデオ・ストリームに基づいて計算されてもよいし、あるいは入力メタデータ(106)の一部であってもよい。ある実施形態では、これらのパラメータは、シーン毎に計算される。本稿での用法では、「シーン」または「ショット」は、同じ全体的な輝度特性を共有しうる一連の捕捉時に逐次的だった(sequential-in-capture)フレームを表わす。シーンの切れ目(scene cut)は手動で決定されてもよく、あるいは入力メタデータの一部であってもよい。たとえば、Cuts[]の配列がシーンの切れ目のフレーム番号を定義してもよい。あるいはまた、各フレーム中のパラメータが、そのフレームがシーンの切れ目の始まりを表わしているかどうかを定義してもよい。
【0040】
これらの値およびS2Tratioの値を与えられて、ある実施形態では、下記の中間トーン曲線調整パラメータを計算してもよい:
Slope=√(1/S2Tratio)は、中間トーン・コントラスト(mid-tones contrast)を表わす。これは、コントラストの見え方を保存するために、S2Tratio値に従って調整される。これは、中央のアンカー点(352−2)の近くでのマッピング曲線(320)への接線の傾きとして視覚化できる。
【0041】
Key=(Mid−Crush)/(Clip−Crush)は、「暗い」または「明るい」シーンの指標である。低いKeyの(暗い)シーンは、わずかにより明るくマッピングされてもよく、高いKeyの(明るい)シーンは、わずかにより暗くマッピングされてもよい。それぞれ暗い詳細および明るい詳細を保存するためである。
【0042】
Shift=Mid*(1−S2Tratio)*(2*Key)は、画像が暗くされる量を表わす。
【0043】
Rolloffは典型的には定数(たとえば1/3)であり、中間トーンとハイライト/陰との間の遷移の急峻さを表わす。より小さい値はより鋭い遷移を示し、「ソフト・クリッピング」の視覚的効果をもつことになる。
【0044】
Min=max(Crush−Shift,Tmin)、Max=min(Clip−Shift,Tmax)とすると、ある実施形態では、MATLABの記法を使って、式(2)の非線形マッピングのトーン曲線パラメータは表2に描かれるように計算されてもよい。
【0045】
【表2】
上記のC
1、C
2およびC
3パラメータを与えられると、ある実施形態では、強度マッピング・ステップ(115)の出力(117)(I
m)は次のように計算されてもよい。
【0046】
【数4】
ここで、I
oはEDR IPT-PQ信号(112)のI成分を表わす。
【0047】
〈I成分についてのマルチスケール詳細保存〉
式(4)のトーンマッピング演算子は典型的にはグローバル・トーンマッピング演算子と称される。同じ式がフレーム全体に適用されるからである。ある実施形態では、グローバル・トーンマッピングに、ローカル・コントラストを改善するマルチスケール・トーンマッピング演算子(125)が続いてもよい。そのようなローカル・トーンマッピング演算子の例がBallestadによって'189 PCT出願において記述されている。あるいはまた、別の実施形態では、強度マッピング・ステップ(115)の出力(117)には、ここに参照によって組み込まれる非特許文献2に記載されるような、非鮮鋭マスキング(unsharp masking)技法が続いてもよい。
【0048】
I
oは入力信号(112)の強度を表わし、I
mはトーンマッピングされた出力(117)の強度を表わすとする。すると、ある実施形態によれば、マルチスケール詳細保存ステップ(125)の出力I
S(127)の強度は、次のように表わされてもよい。
【0049】
【数5】
ここで、F(I,H)は画像IにカーネルHをもつ分離型フィルタを適用することを表わす。ある例示的な実施形態では、Hはσ=2の11×11のガウシアン・フィルタを有する。しかしながら、代替的なフィルタが適用されてもよい。いくつかの実施形態では、入力信号の特性に依存して、このステップはスキップされてもよい。
【0050】
いくつかの実施形態では、式(5)の詳細保存プロセスは、レターボックスおよび字幕を含む、高コントラストのエッジのまわりの潜在的なハローを低減するために追加的なエッジ検出フィルタを用いることによってさらに向上されてもよい。ある実施形態では、
【数6】
【数7】
がそれぞれカーネルH
Bをもつ低域通過フィルタ(LPF)およびカーネルH
Eをもつエッジ検出フィルタの出力を表わすとする。すると、範囲[0,1]内に制約されていてもよいI
E出力を与えられて、マルチスケール詳細保存ステップ(125)は次のように表わされてもよい。
【0051】
【数8】
式(5)と比較すると、強いエッジが検出されるときは常に、I
Sは、低域通過フィルタリングされた信号よりももとのトーンマッピングされた信号に近い。
【0052】
いくつかの実施形態では、次式のように、追加的な重みも適用されてもよい。
【0053】
【数9】
ここで、w
1およびw
2は実装依存の重みである。もう一つの実施形態では、定数aおよびエッジ検出閾値T
eを与えられて、マルチスケール保存ステップ(125)の出力は、次のように表わされてもよい。
【0054】
【数10】
たとえば、式(10)によれば、a=1について、エッジが検出されない場合、I
S出力は式(5)に従って決定される。しかしながら、強いエッジが検出される場合には、I
S=I
mである。
【0055】
ある実施形態では、LPFフィルタはガウシアン・フィルタであり、エッジ検出フィルタは、LPFフィルタの一階微分を取ることによって導出される係数をもつ分離型フィルタであってもよい。しかしながら、いかなるエッジ検出フィルタが適用されてもよい。分離型の低域通過およびエッジ検出フィルタを適用することによって、ある実施形態では、低域通過フィルタリング、水平方向におけるエッジ検出および垂直方向におけるエッジ検出の動作が並列して適用されて、これらのフィルタのそれぞれについて別個の回路を統合しうる(FPGAまたはカスタム集積回路におけるような)並列アーキテクチャを活用しうる。そのような例示的な実装は
図6に描かれている。ここで、
入力D0'はI
oに対応し;
入力D0''はI
mに対応し;
出力D0'''はI
Sに対応し;
Filter0は低域通過フィルタ(LPF)に対応し;
Filter1およびFilter2は水平方向および垂直方向のエッジ検出フィルタに対応し;
ABS()は絶対値関数を表わし;
MS_weight〔MS重み〕およびMS_edge_weight〔MSエッジ重み〕は範囲[0,1]内の調整可能なパラメータである(たとえばMS_weight=0.0、MS_edge_weight=1.0)。
【0056】
所与のビット深さNについて、max_valueは最大値2
N−1を表わすとする。dxおよびdyはエッジ・フィルタFilter1およびFilter2の出力を表わすとすると、ある実施形態では、alphaの値は次のように計算されてもよい。
【0057】
dx=dx÷max_value
dy=dy÷max_value
alpha=MAX(0,MIN(1,(ABS(dx)+ABS(dy))*ms_edge_weight+(ms_weight)))
すると、出力は次のように計算されてもよい。
【0058】
d0[x,y]=D0'[x,y]−d[x,y]*alpha−v[x,y]*(1.0−alpha)
D'''[x,y]=CLIP3(0,max_value,d0)
ここで、d[x,y]は差分画像I
o−I
mを表わし、v[x,y]はLPFの出力を表わし(たとえばI
B)、CLIP3(a,b,x)関数はxの値が下限値aおよび上限値bの間に制限されることを表わす。
【0059】
〈飽和調整〉
IPT信号では、PおよびTは単に強度Iに比べた色差の相対的な強度である。ステップ(115)および(125)がI色成分を修正したので、PおよびT色成分は色相および彩度〔飽和度〕を保存するよう調整される必要がある。そのようなプロセスの例(130)が
図4に描かれている。
【0060】
図4に描かれるように、カラフルさおよび飽和度をブーストするパラメータが、IPT-PQ空間におけるもとの信号(112)およびトーンマッピングされた出力(127)に基づいて計算されてもよい。これらのパラメータは、ピクセル毎のレベルで計算され、同じスケーラー(S)がPおよびTの色成分両方に適用される。ある例示的な実施形態では、カラフルさのブーストが線形マッピング関数
【数11】
を使って決定されるとする。ここで、k
1およびk
2は心理物理学的データに基づく定数である。たとえば、ある実施形態では、k
1=0.5、k
2=1.0である。式(6)において、CEDR(412)はステップ(410−1)の出力を表わし、CMapped(414)はステップ(410−2)の出力を表わす。すると、飽和調整スケーラー(422)は次のように決定されうる。
【0061】
【数12】
Sおよび信号(112)のもとのP
oおよびT
o色成分を与えられて、トーンマッピングされた出力の再飽和されたP
SおよびT
S(132)は次のように決定されうる。
【0062】
【数13】
いくつかの実施形態では、鮮鋭化された信号(127)(I
S)ではなくもとのトーンマッピングされた信号(117)(I
m)に基づいてカラフルさブーストCMappedを決定することが有益であることがある。その場合、次のようになる。
【0063】
【数14】
ある代替的な実施形態では、飽和調整ステップは、色変換ステップ(110)の一部であってもよい。ある例示的な実施形態では、式(1)によって描出されたヘルムホルツ・コールラウシュ効果についての補正(235)に続いて、次のクロマ・スケーリングを適用してもよい。
【0065】
〈色域マッパー3D LUT〉
トーンマッピングおよび飽和ブースト処理ステップの結果、目標ディスプレイ色域の外部の色になることがある。色域を調整するために、3D色域ルックアップテーブル(LUT)(140)が計算されて、ビデオ信号(132)に適用されてもよい。色域補正(135)の一部として、信号は別の色空間(たとえばRGB)に変換し戻されてもよく、ガンマ補正されて、目標ディスプレイ上での表示および/または他の後処理のための最終的なEDR信号(145)を生成してもよい。
【0066】
〈ルミナンスおよび色調整〉
ある種の実施形態では、ディレクターのもとの意図を表わすと考えられる値の外側にある入力信号のルミナンスまたはクロマ値を調整(たとえばブースト)することが望ましいことがある。たとえば、多くの消費者テレビジョンはそのようなピクチャー・モードを、特定のコンテンツについてのユーザーの経験を向上させるディスプレイ・パラメータの事前設定されたセットをもつ「鮮やか」、「スポーツ」または「映画」として組み込んでいる。ある実施形態では、ルミナンス・ブースト・パラメータは、中間トーン曲線調整パラメータ、たとえば先に論じたSlope、Shift、MinおよびShiftパラメータの関数として設定されてもよい。
【0067】
Slope
Pref=Shift
Pref=Min
Pref=Max
Pref=1が、ルミナンス・ブーストが必要とされないときのデフォルトのルミナンス・ブースト・パラメータを表わすとする。信号のブーストまたは変更が所望される場合には、それら四つのパラメータが調整されることができる。たとえば、限定なしに、ある実施形態では、それらの値は
Slope
Pref=0.8
Shift
Pref=0.005
Min
Pref=0.0001
Max
Pref=1.0
に設定されてもよい。すると、式(4)のトーン曲線パラメータ(120)を計算するために使われる対応するSlope、Shift、MinおよびShiftパラメータは次のように調整される。
【0068】
Slope=Slope*Slope
Pref
Shift=Shift*Shift
Pref
Min=Min*Min
Pref
Max=Max/Max
Pref
。
【0069】
Min、Max、SlopeおよびShiftへのこれらの調整の適用は、もとのマッピング範囲を変更する。したがって、マッピング範囲をもとのマッピング範囲(たとえば、ディスプレイおよびコンテンツ・メタデータ(106)から定義されるEDR最小/最大およびディスプレイ最小/最大)に戻すために、式(4)におけるI
mが計算された後に、次の式が実行される。
【0070】
【数16】
クロマも調整されてもよい。式(8)からのP
SおよびT
S出力が与えられて(たとえば信号(132))、(P
S,T
S)色成分は、標準的なユークリッドから極座標への変換を使って(chroma〔クロマ〕,hue〔色相〕)値に変換されてもよい。次いで、線形または非線形のマッピング関数を適用することによって、chroma(C
in)(飽和度、カラフルさ)値を調整することが可能である。そのようなマッピング関数の例は
図5に描かれている。
【0071】
限定することなく、
図5はクロマ・マッピング関数についての三つの例示的な実施形態を描いている。C
out=f(C
in)がクロマ調整入力‐出力関数を描いているとする。第一の実施形態(505)では、
C
out=C
in
であり、よって、クロマ調整は実行されない。第二の実施形態(510)では、
C
out=C
inγ
であり、γは定数である。最後に、第三の実施形態(515)では、chromaは、スプラインまたはシグモイド様入力出力関係によって記述される非線形関数の出力として表わされてもよい。
【0072】
いくつかの実施形態では、chromaマッピング関数はhue〔色相〕の関数として変調されてもよい。そのような実施形態では、ある種の色度(chromaticity)領域(たとえば空、芝生または肌トーン)は他とは異なる扱いをされてもよい。いくつかの実施形態では、chromaマッピング関数は強度(I)の関数としても変調されてもよい。いくつかの実施形態では、chroma値は、特殊効果(たとえばセピアまたは古い映画の感じ)のために脱飽和された画像を生成するために、低減されてもよい。
【0073】
クロマ調整後、変換された(chroma,hue)値は、標準的な極座標からユークリッドへの変換を使って、(P,T)値に変換し戻され、表示管理プロセスの残りが続けられる。いくつかの実施形態では、ルーマおよびクロマ調整は事前計算され、代替的には、表示管理パイプラインの他の3D LUTと組み合わされてもよい。
【0074】
ルミナンスおよびクロマ・パラメータを調整することは、目標ディスプレイの機能およびディスプレイ特性に強く依存する。いくつかの実施形態では、目標TVの製造業者およびモデルは、TVのEDID(Extended Display Identification Data[拡張ディスプレイ識別データ])のような補助情報を介して、セットトップボックスまたはディスプレイ・マネージャ(DM)プロセッサに利用可能であってもよい。この情報は、ローカルなまたはリモートのデータベースを(たとえばインターネットまたは他のアップリンク接続を介して)使ってディスプレイの機能を検索し、それにより目標ディスプレイのための事前計算された最適化されたブースト・パラメータを提供するために使われることができる。あるいはまた、個別的な情報が利用可能でない場合には、セットトップボックスはユーザーに、代替的なディスプレイ・モードの選択を提供し、ユーザーが最も好ましいモードを選択することを許容してもよい。
【0075】
いくつかの実施形態では、最適化された3D LUTが目標ディスプレイのためのEDR表示管理のために利用可能でない場合、セットトップボックス(STB)は本稿に記載される方法を適用して、STBにあらかじめ記憶されていてもよいパラメトリック関数の組と目標ディスプレイ・パラメータに基づいて新たなLUTを計算してもよい。新しいTVを接続する際、ユーザーは新しいLUTが計算されるまで数秒間待つことがあるが、結果は装置メモリに記憶されてのちに再利用されてもよい。
【0076】
〈サブサンプリングされた色をもつ信号についてのトーンマッピング〉
いくつかの実施形態では、EDR信号(102)はサブサンプリングされたクロマ・フォーマット(たとえばYCbCr4:2:0)で受領されることがある。さらに、出力EDR RGB信号(145)は、RGB 4:4:4とは異なるディスプレイ固有のフォーマット(たとえばYCbCr4:2:0)に変換される必要があることもある。100Aの表示管理プロセス(
図1A)はフル解像度の入力および出力に対する(たとえばRGBからIPT-PQステップ(110)前の信号(102)に対するまたはRGB信号(145)に対する)前処理または後処理色変換、色アップサンプリングまたはダウンサンプリングを受け入れるよう簡単に修正されうるが、表示管理動作のいくつかを低減解像度信号に対して実行することが計算上より効率的となることがある。そのような実施形態の例を次に論じる。
【0077】
図1Bは、本発明のある代替的な実施形態に基づくEDR画像の表示管理についての例示的なプロセス(100B)を描いている。限定することなく、ある例では、受領されたEDR信号(102)はYCbCr 4:2:0信号であり、所望される出力(160)はガンマ・エンコードされたEDR YCbCr 4:2:0信号であるとする。同様の処理は、YCbCr 4:2:2などのようなサブサンプリングされたクロマをもつ他の色フォーマットに適用されてもよい。
【0078】
100Bに描かれるように、入力(102)の処理は、二つの別個の経路に分割されてもよい。フル(ルーマ)解像度でのY成分(102Y)の処理と、クロマ解像度での(たとえば4:2:0信号についての前記解像度の1/4での)RGB信号(107)の処理である。色変換器(105)は入力Yをダウンサンプリングし、次いでダウンサンプリングされたYおよびもとのCbCr入力成分を、もとのクロマ解像度に等しい空間解像度をもつRGB(4:4:4)信号(107)に変換する。色変換器(110B)はフル解像度(102Y)信号を知覚的に量子化された(PQ)信号(112B)に変換する。先に論じたように、RGBからIPT-PQへの処理ステップ(100)(
図2参照)において、(102)の入力Y成分は、該Y成分にPQ関数を適用する前に、ガンマ線形化され、(たとえば(0,1)の範囲に)規格化されてもよい。
【0079】
新しい信号(107)および(112B)を与えられて、信号(107)についての処理は(100A)におけるように進行する。ただし、今ではマルチスケール詳細保存ステップ(125)は飽和および調整ステップ(130)後に適用される。信号(132)は今ではもとの信号(102)の解像度の1/4なので、追加的なアップサンプリング・ステップ(150)がガンマ・マッピング器(135)の出力をフル解像度信号(152)にアップサンプリングし、該フル解像度信号がマルチスケール詳細保存ステップ(125)のトーンマッピングされた入力(I
m)として使用される。信号(112B)はもとの信号I
oとして使用される(式(5)〜(10)参照)。色域マッピング・プロセス(135)は、(Y-PQ)CbCr(4:4:4)色空間における信号を直接生成してもよいことを注意しておく。出力EDR(160)はYCbCr(4:2:0)フォーマットであり、二つの信号を含む。色域マッピング器(135)によって計算されたクロマ成分(137-CbCr)と、ルーマ信号(157)である。ルーマ信号(157)は、マルチスケール詳細保存ステップ(127)の出力をガンマ補正する(155)ことによって生成されてもよい。PQデコードおよびガンマ・エンコード(155)は、目標ディスプレイ(図示せず)のEOTFパラメータ(152)(たとえばガンマ、MinおよびMax)を利用してもよい。
【0080】
図1Cは、さらにピクセル・パイプライン効率を改善し、メモリ要求を低減するためにマルチスケールおよびルーマ・ダウンサンプリング動作を並列化する代替的な実施形態を描いている。この例では、フル解像度(Y)パイプラインはフル解像度で動作するが、ピクセル当たりより少数の動作を必要とする。対照的に、RGB4:4:4パイプラインはピクセル当たりより多くの動作を有するが、もとのルーマ・ピクセル解像度の1/4で動作する。
図1Cは、並列ハードウェア実装によりなじみやすい。
【0081】
(100B)に比べ、(100C)は色変換器(110B)の出力(I
o 112B)に追加的な強度マッピング・ステップ(115B)を加えるが、(100B)におけアップサンプリング・プロセス(150)の必要性をなくす。強度マッピング・ステップ(115B)は、ステップ120において計算されたトーン曲線パラメータを使ってもよい。いくつかの実施形態(図示せず)では、強度マッピング(115B)への入力は、信号(112B)ではなく信号(102Y)であってもよい。
【0082】
〈例示的なコンピュータ・システム実装〉
本発明の実施形態は、コンピュータ・システム、電子回路およびコンポーネントにおいて構成されたシステム、マイクロコントローラ、フィールド・プログラム可能なゲート・アレイ(FPGA)または他の構成設定可能もしくはプログラム可能な論理デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)のような集積回路(IC)装置および/またはそのようなシステム、デバイスまたはコンポーネントの一つまたは複数を含む装置を用いて実装されてもよい。コンピュータおよび/またはICは、本稿に記載したような向上ダイナミックレンジをもつ画像の表示管理および表示に関係する命令を実行、制御または執行してもよい。コンピュータおよび/またはICは、本稿に記載したような表示管理プロセスに関係する多様なパラメータまたは値の任意のものを計算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェアおよびそれらのさまざまな組み合わせにおいて実装されうる。
【0083】
本発明のある種の実装は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータ・プロセッサを有する。たとえば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどにおける一つまたは複数のプロセッサが、該プロセッサにとってアクセス可能なプログラム・メモリ中のソフトウェア命令を実行することによって、上記に記載したようなEDR画像の表示管理に関係する方法を実装してもよい。本発明は、プログラム・プロダクトの形で提供されてもよい。プログラム・プロダクトは、データ・プロセッサによって実行されたときに該データ・プロセッサに本発明の方法を実行させる命令を含むコンピュータ可読信号のセットを担持する任意の非一時的な媒体を含みうる。本発明に基づくプログラム・プロダクトは、幅広い多様な形のいかなるものであってもよい。プログラム・プロダクトは、たとえば、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD-ROM、DVDを含む光データ記憶媒体、ROM、フラッシュRAMを含む電子データ記憶媒体などのような物理的な媒体であってもよい。プログラム・プロダクト上のコンピュータ可読信号は任意的に圧縮または暗号化されていてもよい。
【0084】
上記でコンポーネント(たとえば、ソフトウェア・モジュール、プロセッサ、組立体、装置、回路など)が言及されるとき、特に断わりのない限り、そのコンポーネントへの言及(「手段」への言及を含む)は、本発明の例示した実施例における機能を実行する開示される構造と構造的に等価ではないコンポーネントも含め、記載されるコンポーネントの機能を実行する(たとえば機能的に等価な)任意のコンポーネントをそのコンポーネントの等価物として含むと解釈されるべきである。
【0085】
〈等価物、拡張、代替その他〉
このように、EDR画像の効率的な表示管理に関係する例示的な実施形態が記載されている。以上の明細書では、本発明の諸実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。