(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-15
(54)【発明の名称】HDR画像の表示の最適化
(51)【国際特許分類】
H04N 19/85 20140101AFI20241108BHJP
H04N 19/186 20140101ALI20241108BHJP
【FI】
H04N19/85
H04N19/186
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024530478
(86)(22)【出願日】2022-11-14
(85)【翻訳文提出日】2024-05-22
(86)【国際出願番号】 EP2022081695
(87)【国際公開番号】W WO2023094187
(87)【国際公開日】2023-06-01
(32)【優先日】2021-11-26
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】590000248
【氏名又は名称】コーニンクレッカ フィリップス エヌ ヴェ
【氏名又は名称原語表記】Koninklijke Philips N.V.
【住所又は居所原語表記】High Tech Campus 52, 5656 AG Eindhoven,Netherlands
(74)【代理人】
【識別番号】110001690
【氏名又は名称】弁理士法人M&Sパートナーズ
(72)【発明者】
【氏名】ナイランド ルトガー
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LA02
5C159PP04
5C159RC11
5C159TA01
5C159TB04
(57)【要約】
1.実用的な様式でより優れて見る価値があるHDR画像を取得するために、出力ビデオの出力画像を取得するために入力ビデオの入力画像Im_Commを処理するための画像処理装置のいくつかの変形例が提案されており、入力画像は、第1の輝度ダイナミックレンジDR_1内に入る入力輝度Ln_in_pixを有するピクセルを有し、その第1の輝度ダイナミックレンジは、第1の最大輝度PL_V_HDRを有し、出力画像は、入力輝度から算出され得、第2の輝度ダイナミックレンジ内に入る出力輝度を有するピクセルを有し、その第2の輝度ダイナミックレンジは第2の最大輝度PL_V_MDRを有し、画像処理装置は、入力画像と、入力画像と関連付けられたメタデータとして符号化される参照輝度マッピング関数とを受信するように構成されたビデオデータ入力227を備え、参照輝度マッピング関数は、第1の参照画像の輝度と第2の参照画像の輝度との間の関係を特定し、第1の参照画像は入力画像であり、第2の参照画像は第2の参照最大輝度PL_V_SDRを有し、画像処理装置は、参照輝度マッピング関数F_Lに基づいて適合された輝度マッピング関数FL_DAを決定するように構成されたディスプレイ適合ユニット209を含み、ディスプレイ適合ユニットは、あらかじめ固定されたディスプレイ適合アルゴリズムを使用するものであり、そのアルゴリズムは、最大が1になるように正規化された入力輝度と最大が1になるように正規化された出力輝度との座標系において、斜線上の各ポイントに対して、あらかじめ固定された方向に配向された、斜線上で始まる線分に沿ってそれぞれのメトリックを特定し、各位置におけるそれぞれのメトリックは、座標系において、線分と、輝度関数F_Lの軌跡との間の交差ポイントに値1を与えることによって正規化され、決定することは、第2の最大輝度PL_V_MDRに対応する各それぞれのメトリック上の位置を特定し、それぞれのメトリック上の位置の集合は、適合された輝度マッピング関数FL_DAとして出力され、画像処理装置は、画像処理装置が処理を含み、処理が、ブースタ強度値BOを算出するように構成されたブースト決定回路700を含み、ブースト決定回路700が、適合された輝度マッピング関数FL_DAを入力輝度に適用することによって得られる中間的な輝度のヒストグラムhistを決定するように構成されたヒストグラム計算ユニット721と、ヒストグラムに基づいて平均的な明度の大きさABを算出するように構成された平均計算回路705と、平均的な明度の大きさABから第1の強度値PosBを算出するように構成された第1のコンバータユニット706と、ヒストグラムの少なくとも2つの構成可能上位ビン内のピクセルカウントの重み付けされた合計BDEを算出するように構成された第2の測定ユニット711と、重み付けされた合計BDEから第2の強度値NegBを算出するように構成された第2の変換ユニット712とを有し、増強決定回路は、第1の強度値PosBマイナス第2の強度値NegBに等しい値DVに基づいて、ブースタ強度値BOを決定し、画像処理装置がさらに調整された適合された輝度マッピング関数F_ALT_Bを計算するためにディスプレイ適合ユニットを使用するように構成されており、調整された適合された輝度マッピング関数が、メトリック上のブースタ強度値に等しい位置の軌跡を出力する設定のディスプレイ適合アルゴリズムを用いることによって、調整された適合された輝度マッピング関数F_ALT_Bとして、計算され、画像処理装置が出力輝度を取得するために、調整された適合された輝度マッピング関数F_ALT_Bを入力輝度に適用するように構成された色変換器208を含むことを特徴とする。
【特許請求の範囲】
【請求項1】
出力ビデオの出力画像を取得するために入力ビデオの入力画像を処理する方法であって、
前記入力画像は、第1の輝度ダイナミックレンジ内に入る入力輝度を有するピクセルを有し、前記第1の輝度ダイナミックレンジは、第1の最大輝度を有し、
前記出力画像は、前記入力輝度から算出され得、第2の輝度ダイナミックレンジ内に入る出力輝度を有するピクセルを有し、前記第2の輝度ダイナミックレンジは第2の最大輝度を有し、
参照輝度マッピング関数が、前記入力画像と関連付けられたメタデータとして受信され、
前記参照輝度マッピング関数は、第1の参照画像の輝度と第2の参照画像の輝度との間の関係を特定し、
前記第1の参照画像は前記入力画像であり、
前記第2の参照画像は第2の参照最大輝度を有し、
前記入力画像を処理することは、前記参照輝度マッピング関数に基づいて適合された輝度マッピング関数を決定することを含み、
前記輝度マッピング関数を決定することは、あらかじめ固定されたディスプレイ適合アルゴリズムを使用するものであり、前記あらかじめ固定されたディスプレイ適合アルゴリズムは、最大が1になるように正規化された前記入力輝度と最大が1になるように正規化された前記出力輝度との座標系において、斜線上の各ポイントに対して、あらかじめ固定された方向に配向された、前記斜線上で始まる線分に沿ってそれぞれのメトリックを特定し、
各位置における前記それぞれのメトリックは、前記座標系において、前記線分と、前記輝度関数の軌跡との間の交差ポイントに値1を与えることによって正規化され、
前記輝度マッピング関数を決定することは、前記第2の最大輝度に対応する各それぞれのメトリック上の位置を特定し、
前記それぞれのメトリック上の位置の集合は、前記適合された輝度マッピング関数として出力される、方法において、
前記方法は、前記入力画像を処理することが、
ブースタ強度値(BO)を算出するステップであって、前記ブースタ強度値を算出するステップが、
前記適合された輝度マッピング関数を前記入力輝度に適用することによって得られる中間的な輝度のヒストグラムを決定することと、
前記ヒストグラムに基づいて平均的な明度の大きさを算出することと、
前記平均的な明度の大きさから第1の強度値を算出することと、
前記ヒストグラムの少なくとも2つの構成可能上位ビン内のピクセルカウントの重み付けされた合計を算出することと、
前記重み付けされた合計から第2の強度値を算出することと、
前記第1の強度値マイナス前記第2の強度値に等しい値に基づいて、前記ブースタ強度値を決定することとを含む、
前記ブースタ強度値(BO)を算出するステップと、
調整された前記適合された輝度マッピング関数を計算するステップであって、
前記調整された適合された輝度マッピング関数が、メトリック上の前記ブースタ強度値に等しい位置の軌跡を出力する設定のディスプレイ適合アルゴリズムを用いることによって、前記調整された適合された輝度マッピング関数として、計算される、前記調整された適合された輝度マッピング関数を計算するステップと、
前記出力輝度を取得するために、前記調整された適合された輝度マッピング関数を前記入力輝度に適用するステップとを含むことを特徴とする、方法。
【請求項2】
2つの構成可能上位ビンのうちの1つが、中間的な輝度の前記ヒストグラム内に1%の最も明るいピクセルを含む、請求項1に記載の方法。
【請求項3】
前記ブースタ強度値が、ゼロと1との間で正規化された相対的なブースト値によって乗算されたカスタマイズ可能な乗数値として決定される、請求項1又は2に記載の方法。
【請求項4】
これまでに決定された制限されたブースタ強度値にともなう変化をそのまま保持するために、前記ブースタ強度値の算出が、一時的なフィルタリングを必要とする、請求項1から3のいずれか一項に記載の方法。
【請求項5】
一時的フィルタリングが非対称であり、より小さいブースタ強度値に、急速に変化し、より高いブースタ強度値に、よりゆっくりと変化する、請求項4に記載の方法。
【請求項6】
出力ビデオの出力画像を取得するために、入力ビデオの入力画像を処理するための画像処理装置であって、
前記入力画像は、第1の輝度ダイナミックレンジ内に入る入力輝度を有するピクセルを有し、前記第1の輝度ダイナミックレンジは、第1の最大輝度を有し、
前記出力画像は、前記入力輝度から算出され得、第2の輝度ダイナミックレンジ内に入る出力輝度を有するピクセルを有し、前記第2の輝度ダイナミックレンジは第2の最大輝度を有し、
前記画像処理装置は、前記入力画像と、前記入力画像に関連付けられたメタデータとして符号化される参照輝度マッピング関数とを受信するビデオデータ入力を備え、
前記参照輝度マッピング関数は、第1の参照画像の輝度と第2の参照画像の輝度との間の関係を特定し、
前記第1の参照画像は前記入力画像であり、
前記第2の参照画像は第2の参照最大輝度を有し、
前記画像処理装置は、前記参照輝度マッピング関数に基づいて適合された輝度マッピング関数を決定するディスプレイ適合ユニットを含み、
前記ディスプレイ適合ユニットは、あらかじめ固定されたディスプレイ適合アルゴリズムを使用し、前記あらかじめ固定されたディスプレイ適合アルゴリズムは、最大が1になるように正規化された前記入力輝度と最大が1になるように正規化された前記出力輝度との座標系において、斜線上の各ポイントに対して、あらかじめ固定された方向に配向された、前記斜線上で始まる線分に沿ってそれぞれのメトリックを特定し、
各位置における前記それぞれのメトリックは、前記座標系において、前記線分と、前記参照輝度マッピング関数の軌跡との間の交差ポイントに値1を与えることによって正規化され、
前記輝度マッピング関数を決定することは、前記第2の参照最大輝度に対応する各それぞれのメトリック上の位置を特定し、
前記それぞれのメトリック上の位置の集合は、前記適合された輝度マッピング関数として出力される、画像処理装置において、
前記画像処理装置は、ブースタ強度値を算出するブースト決定回路を含むプロセッサを有し、
前記ブースト決定回路が、
前記適合された輝度マッピング関数を前記入力輝度に適用することによって得られる中間的な輝度のヒストグラムを決定するヒストグラム計算ユニットと、
前記ヒストグラムに基づいて平均的な明度の大きさを算出する平均計算回路と、
前記平均的な明度の大きさから第1の強度値を算出する第1のコンバータユニットと、
前記ヒストグラムの少なくとも2つの構成可能上位ビン内のピクセルカウントの重み付けされた合計を算出する第2の測定ユニットと、
前記重み付けされた合計から第2の強度値を算出するように構成された第2の変換ユニットとを有し、
前記ブースト決定回路は、前記第1の強度値マイナス前記第2の強度値に等しい値に基づいて、前記ブースタ強度値を決定し、
前記画像処理装置は、さらに、
前記ディスプレイ適合ユニットを使用して、調整された適合された輝度マッピング関数を計算し、前記調整された適合された輝度マッピング関数が、前記調整された適合された輝度マッピング関数としてメトリック上の前記ブースタ強度値に等しい位置の軌跡を出力する設定の前記ディスプレイ適合アルゴリズムを用いることによって、計算され、
前記画像処理装置が、前記出力輝度を取得するために、前記調整された適合された輝度マッピング関数を前記入力輝度に適用する色変換器を含むことを特徴とする、画像処理装置。
【請求項7】
前記ブースト決定回路が、より少なくしか変動しないブースタ強度値を算出するように構成された一時フィルタを含む、請求項6に記載の画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特定のディスプレイのためのはっきりと見える画像を取得するために高ダイナミックレンジビデオの画像ピクセル輝度を適合させるための方法及び装置に関する。
【背景技術】
【0002】
過去数十年の間、(今日では低ダイナミックレンジ(LDR)又は標準ダイナミックレンジ(SDR)と呼ばれる)ビデオキャプチャリング、コーディング、及び表示の標準的な様式は、全ての種類の画像を(テレビ放送、ビデオ会議、ゲーミングなどにおいて)エンドカスタマーにもたらすためにかなり十分に行われてきた。
【0003】
システムは、表示出力の輝度ダイナミックレンジが典型的には100:1と1000:1との間にある状態で、相対的な明度を規定する(0%を最も暗い黒とし、100%を最も明るい白とした)ことに基づいた。このシステムは、十分に照明された(ほぼ均一に照明された)シーンの場合に機能し得るので、被写体の性質を、言い換えればそれら自体の明るさを、すなわち、それらが反射する光の量(+約4%~+約90%)を本質的に捕捉する。そのようなシーンでは、そのような捕捉は、脳が予想するはずであり目が見るはずであるものと似ている。
【0004】
創作側から、単に、シーンにおける平均的な光量に基づいてカメラアイリスのための値が設定され、各カメラセンサのピクセルが収集する光電子の充填の割合に基づいて被写体の照度が捕捉される場合、十分な画像がもたらされる。歴史的な理由で、その信号自体(正規化されたとき、0から1)は伝送されないが、その平方根が伝送される。PALのようなアナログ規格が、その信号を0mVと700mVとの間の電圧として表し、今日のデジタル規格がそれを255のレベルに量子化する、すなわち、ピクセルの相対的な明度を0以上255以下の値として伝達する。
【0005】
しかしながら、この手法にはいくつかの問題があった。現実世界のシーンは、そのような厳密に制御された様式で照明されない。最も暗いピクセルと最も明るいピクセルとの間の比に対して、一般にいまだに限界があるものの(何故なら、明るいエンティティは必然的により暗い領域をある程度照らすことになるため)、シーンにおいてかなり大きな輝度のダイナミックレンジがあり得る。例えば、屋内での照明レベルは、たとえ比較的大きな窓があっても屋外と比較して典型的には100分の1未満となるので、ダイナミックレンジは既に、照明比100×被写体反射率100、すなわち10,000:1となり、洞穴の壁の小さな亀裂は、より大きなダイナミックレンジをもたらすことになる。
【0006】
最近まで、ディスプレイは、100:1をはるかに上回るダイナミックレンジを、又は、100nitをはるかに上回る最大輝度とも呼ばれるピーク明度を表示する能力をとにかく有していなかったので、画像(つまり、表示される輝度となるもの)が作られるとき、はっきりと表示され得ない全てのシーン被写体の輝度は、典型的には最高の白(又は最も暗い黒)にクリップ留めされた。
【0007】
しかしながら数年前に、はるかに優れたディスプレイが出現した。例えば、LCDピクセルの位置の裏側に別個に制御可能なLEDを置くことによって、少なくとも理論的には、たとえ、LEDの光をどれだけの量それが伝送することができるかについてLCDピクセルが制限していたとしても、所望されるとおりに表示エリアを暗く又は明るくすることができる。したがって、今日では、最大輝度が2000nit以上、ダイナミックレンジが10,000:1以上のディスプレイを作ることができる。
【0008】
それにより、それらの画像を作ることに対処すれば、完全に新しい様式の(例えば、異なるように照明された環境の現実の視覚的印象を有する)画像表示ができるようになる。
【0009】
しかしながら、旧来の符号器Rec.709でさえも、作り出された画像においてコード化された輝度となる大きなレンジのコーディングは全くできないので、スタータのための、画像(いわゆる高ダイナミックレンジ(HDR)画像)をコーディングする、HDR画像を表現する、及びHDR画像をハンドリングする、新しい様式も必要となる。
【0010】
数年前、高ダイナミックレンジビデオのコーディングの斬新な技法が、とりわけ出願者によって導入された(例えば、WO2017157977参照)。
【0011】
ビデオのコーディングは、画像を描写するためにピクセル色コード(例えば、ピクセルごとに1つのルマ及び2つのクロマ)を作成することに関係する。このことは、HDR画像をどのように最適に表示するかを知ることとは時として異なる。例えば、最も単純な方法は、所望の輝度を例えば10ビットのルマコードに変換するために、単に、高度に非線形な光電気伝達関数OETFを利用し、逆もまた同様に、逆に形づくられた電子光学伝達関数EOTFを用いて、例えば、10ビットの電気ルマコードを、表示されるべき光学ピクセル輝度にマッピングすることによって、それらのビデオピクセルルマコードを、表示されるべき輝度になるように変換することができるが、しかし、より複雑なシステムにより、特に、画像のコーディングを、コード化された画像の特定の使用から切り離すことによって、いくつかの方向に逸脱する可能性がある。
【0012】
HDR画像を規定するための1つの新たな手法は、いわゆる対象物ディスプレイ(エンドユーザのいずれの実際のディスプレイとも混同されるべきではない)の配備されたダイナミックレンジ上にそれらを作成することである。その対象物ディスプレイの最大輝度PL_Vは、画像と一緒にメタデータで同時伝達されるが、それは、画像がそのレンジで作成されたことを表す。相対的な画像をカメラから直接ロードするのではなく、今では、何らかのマスタHDR画像において必要とされる輝度を精密に規定することができる。
【0013】
したがって、今では、例えば火球の爆発が、部屋の周辺ピクセル輝度と比較してどれだけ明るいはずであるかについて精密に答えることができる(SDRでは、典型的には、その火球に対して露出するアイリスを変化させ、すなわち、その結果、そのピクセルのうちの多くがレンジ0~100%に収まることになる)。
【0014】
したがって、最初のビデオクリエータは、例えば、このシーンの4000nitのPL_Vビデオを作成し得る。例えば2000nitのPL_Vビデオの場合と対照的なように、4000nitビデオを作成することは、典型的には、ビデオのどこかで、すなわちある瞬間の間、おおよそ4000nitのピクセル(すなわち、4000nitとしての表示を受け入れることが可能であるかぎり、理想的に表示されるべきピクセル)をコーディングするルマコードを有するピクセルを作成することになる。4000nitまで利用可能なレンジを有していることがわかっていて、例えば、ピクセルの量のそのサイズに関する、又は対象として含まれる画像エリアの割合に関する話の中で火球の衝撃を考慮に入れると、火球の最も明るいピクセルが3000nitになるものとし、映画におけるその後のレーザビームのために4000nitを取っておくように決定してもよい。
【0015】
同じ映画の同等の2000nitバージョンのメーカーは、全ての態様(火球の視覚的衝撃のみならず周囲ピクセルの輝度に対する関係性、及びその2000nit対象物ディスプレイの能力)のバランスをとるとき、例えば、火球の最も明るいポイントを1950nitに置く。これにより、入力画像の様々な特徴が規定され、次いでさらに、例えば、(実際の)表示最大輝度PL_Dが600nitである任意の特定のディスプレイが、画像被写体ピクセルの全ての輝度値を、その利用可能なダイナミックレンジにどのようにマッピングするかを考え出さなければならなくなる。
【0016】
しかし、画像を規定するこの新しい様式により、それらの画像を表示するより予測可能な様式を有効化することへの道が開かれる。十分なダイナミックレンジを有さないディスプレイは、実は、何らかの輝度ダウングレーディングを行う必要があり、しかし、画像のニーズに、又はより精密には、クリエータがそれらの再グレーディングニーズをどのように規定したかについて、敬意を払う様式でそうすることができる。SDR時代には、単に、単純な発見的手法を用いて画像を表示した、すなわち、画像における最も明るいピクセル(白、すなわち、ルマコード255)を最も明るく表示可能なピクセルにマッピングしたものだった。そのとき、200nitのPL_Dディスプレイ上では、画像は、100nitのディスプレイに対して2倍明るく見えたものだった。ディスプレイの最大輝度の比がそのように小さい場合、これは視聴者にもクリエータ(目及び脳が、違いのうちのいくらかを再度較正して取り除くので、単に、同じシーンの多少より美しい画像を有するだけしか、より明るくなく、より高価でないディスプレイを購入した人)にも受け入れ可能である。
【0017】
例えば、PL_Dが1000nit以上であるより明るいHDRディスプレイを有するとき、1000nitの白ピクセルを示すことが極端になりすぎるだけでなく、より重要なことには、HDR画像をコーディング及びハンドリングする、したがって現実の印象的なHDR画像を示す新たな技法を用いることによって、ディスプレイのそのレンジをより十分に使用することができる。
【0018】
図1を用いると、HDR画像間の差が厳密に何であるか(PL_Vの値がより高いにもかかわらず)のみならず、さらに、同等のより低いダイナミックレンジ画像、例えば、HDRマスタ画像に対応する100nitのPL_V SDR画像を作成するとき、そのような差がどのようにハンドリング(低減)され得るか、が解明される。
【0019】
この適用例におけるグレーディングは、例えば人間の色格付け部、若しくはオートメーションによって所望通りの輝度がピクセルにもたらされた際の活動又は得られた画像のどちらかを意味すると意図するものである(例えば、グレーディングが行われたマスタ画像において、火球は周囲ピクセルよりも4倍又は6倍ではなく5倍明るい)。人が画像に注目する、例えば画像を設計する場合、いくつかの画像被写体があることになり、人は、理想的にはそれらの被写体のピクセルに、さらに画像及びシーンの全体を所与として、その被写体にとって最適であるおよそ平均輝度の輝度拡散を与えることを欲する。例えば、人が、画像の最も明るいコード化可能ピクセルが1000nit(画像又はビデオの最大輝度PL_V)であるような利用可能な画像能力を有する場合、人間格付け部は、爆発をかなり迫力あるように見えるようにするために、800nitと1000nitとの間の爆発輝度値のピクセルを与えるように選択し、一方、別の映画メーカーは、例えば、その瞬間に適時画像の残りをあまり妨げすぎないように、爆発を500nit以下の明るさに選択する(勿論、技術は両方の状況をハンドリングできるべきであり、そうすれば両方の格付け部に対して、対象物ディスプレイのダイナミックレンジは安定した様式で規定されるはずである)。
【0020】
(すなわち、その関連する対象物ディスプレイの)HDR画像又はビデオの最大輝度はかなりばらつき、例えば、典型的な値は、例えば1000nit若しくは4000nit、又はさらに10,000nitであり、限界がない(人は一般に、PL_Vが少なくとも600nitであるとき、HDR画像を有していると言う)。
【0021】
HDRディスプレイは最大能力を、すなわち、(下位エンドHDRディスプレイで始めて)例えば、600nit若しくは1000nit、又は数字N×1000nitの最も高度に表示可能なピクセル輝度を、有する。
【0022】
ビデオクリエータは、一般に、それぞれの実現可能なエンドユーザディスプレイに対して最適なビデオを作成することはできない(すなわち、エンドユーザディスプレイの能力は、ビデオの最大輝度が、エンドコンシューマディスプレイの最大輝度を決して超えないだけでなく、利用可能なダイナミックレンジを十分使用させるために低くされない、ビデオによって最適に用いられる)。すなわち、SDR時代の「最大表示可能明度としてのディスプレイ最大画像明度」に似た属性を実装するものがあるが、もはやこれは偶然に電子的に実装されているのではなく、数学的に精密に定義可能な属性である(しかも、たった1つのピクセルだけに輝度4000nitを与えるように選択し、全ての他のシーン被写体に任意の所望のより低い輝度値でグレーディングを行うことができる)。
【0023】
次いで、(しばしばはるかに)より低い表示ピーク輝度PL_Dを有するディスプレイ上でピーク輝度PL_Vを含む画像をどのように最良に表示するかという2番目の疑問が発生するが、これは、本テキストではディスプレイ適合と呼ばれる(又はディスプレイ最適化と呼ばれることもある)。具体的には、任意ではない適合に対してこの用語が用いられることになるが、ディスプレイ最適化において、ピクセルルマの必要とされる再グレーディングに関する情報による下記の案内で示されるように、下記に説明されるディスプレイ最適化は、最も単純な技術的様式で、ビデオクリエータが少なくとも1つのルママッピング関数を作成し伝達することによって行われる。将来においても、例えば2000nitのPL_V画像よりも低い、作り出されたダイナミックレンジ画像を必要とするディスプレイがまだ存在することになる。理論的には、ディスプレイは、画像ピクセルの輝度が、それ自体の内部の発見的手法によって表示可能になるように、常に再グレーディングを行うことができ、すなわち、画像ピクセルの輝度をマッピングすることができ、但し、ビデオクリエータが、ピクセル輝度を決定するのに十分対処した場合、彼は、彼の画像が、PL_D値を低くするように適合されてどのように表示されるべきかをさらに示すことができることが有益であり、理想的にはディスプレイはこれらの技術的な要求に大いに従う。ディスプレイ製造者が、その任意のディスプレイ内部アルゴリズムに従って火球の再グレーディングを行った場合、それは、元々クリエータによって意図されたほど印象的には見えない。
【0024】
しかしながら、誰がディスプレイの管理をするのか、すなわち、全ての画像被写体がどれくらい明るく表示されるべきかについて最終的な決定権を有するのは誰なのかについて、いくらかの不安がある。ビデオのクリエータは様子を規定するので、それはビデオのクリエータであるべきであると言われ得る。しかしながら、エンドユーザもまた、例えば、それらが行うのと同等に明るくなるビデオを好まないと決定することもあり得る。最後に、ディスプレイ製造者がさらにこの問題に関して言いたいことによると、例えば、クリエータの奴隷にはならないが、競合相手のものよりわずかに優れたビデオ表示を作成することによって彼のディスプレイをポップアウトさせる。配備された新しいHDRコーディング及びハンドリング手法のフレームワークにおけるそのような可能なことを規定することにより、少なくとも、ディスプレイメーカーが、画像が何を想定していたのかに関して完全に無視した任意の処理を行いその結果、画像が最終的に様々なディスプレイ上でどのように見えるかについてもはや良い考えを誰も持たなくなるよりはむしろ、ビデオクリエータが、画像の最終的な様子に関して決定権を有する技術的な可能性をさらに有することが保証される。
【0025】
HDR画像を作成し符号化するのにともなうステップは、下記のように要約される。
a) 人は、(マスタHDR画像、すなわち、HDRシーンに対してグレーディングを行う第1の画像の)所望のピクセル絶対的輝度を規定しなければならず、この人にとって、PL_Vで終了する対象物ディスプレイのダイナミックレンジを規定する(これは画像のグレーディングと呼ばれ得る)
b) 典型的なビデオコーディングは、YCbCrピクセル色コーディングを使用するので、人はこれらの輝度を、例えば10ビットルマとして符号化する必要があり、これには、様々な可能なHDR電子光学伝達関数(EOTF)のうちの1つを選択する必要があり、その選択は典型的には、対象物ディスプレイのメタデータとしてさらに同時伝達される。
【0026】
これが、HDR画像自体の基本的な作成となる。それは、受信側で、例えばテレビディスプレイにおいて、暗号解除されたHDR画像に再構築され得る。
【0027】
しかしながら、専門家将来保証システムにおいて、ビデオクリエータはさらなるメタデータを追加することになる。
【0028】
これは、典型的には、少なくともルママッピング関数を規定すること(上記のa及びbに加えて構成要素c)、並びに、2次の参照グレーディングが、(典型的にはルママッピング関数として規定され、それら2つは、人がマスタHDRを規定するEOTF及び2次の画像のルマを規定するEOTFを知っているかどうかに数学的に関係する)輝度マッピングを適用することによって、例えば、500nitのPL_VのマスタHDR画像からどのように取得され得るか特定すること、を必要とする。
【0029】
有利には、人は第2の画像をSDR画像にさせるように欲する。次いで、人は、全ての画像被写体の輝度が、(人が典型的には遭遇する、すなわち実際に必要とする)最も極端なグレーディングに関して、(他の中間ダイナミックレンジのグレーディングにさせ得る相対位置間のうちの)どちらの相対位置を持つべきか知っていることを、保証するのみならず、さらに、人は、このSDR画像を、グレーディングのペアの代表として伝達されるべき画像として使用した場合、それは、旧来のディスプレイが、HDRビデオコーディングの知識もHDRビデオハンドリングの知識も必要とせずに、この受信されたSDR画像を直接表示することができる、逆適合性システムとして使用され得る。このSDR画像はPL_V_SDR=100nitを有するように規定され得、しかし伝統的に、それは、100%がSDRの白である無次元画像として解釈されることになる。
【0030】
手法の構成要素を説明するため、読者は
図1におけるいくつかの典型的な画像の少数の画像被写体に注目し得る。
【0031】
左側の輝度軸は、マスタHDR画像、すなわち、クリエータが作成して理想的には表示されているのを見たい「最良の画像」の輝度である。
【0032】
例えば、屋外のウェスターシーンImSCN1では、クリエータは、日光の下、焼けつくような被写体をレンダリングするために、増大されたダイナミックレンジを十分に利用したがる。彼は、500nitのそれらの被写体(例えば、カウボーイの白色ハット)にとって十分であるように最大限熟慮する(次いで、視聴者は、それが、例えば、屋内で行われたその映画の前の場面であり得る通常のLDRレンダリングよりも5倍明るく見えるので、日光に焼かれるシーンに遭遇することとなる)。勿論、1次のダイナミックレンジDR_1よりもはるかに小さい2次の輝度ダイナミックレンジDR_2を有する右側のSDR輝度レンジ上では、カウボーイハットの輝度は、0.1nitと100nitとの間の例えば18nitの都合のよい位置でマッピングされなければならない。全てのこれらの投影矢印の集合は、HDR画像(又は、すなわち、例えば、HDR輝度の同じSDR輝度へのクリップ留めを含まず、関数が逆にできる場合には、SDR対HDR)に基づいてSDR画像を規定するための輝度間マッピング関数を規定する。同じことが、夜間シーンImSCN2に対して、又は、日光に照らされた外部世界ImSCN3を人が洞穴を通して見ることができる開口部を備える当該洞穴に対して行われ得る。
【0033】
今、人が、例えば、800nitのPL_V_MDRで、例えば、800nitのPL_Dディスプレイを駆動する準備が整っている状態で、中間ダイナミックレンジ画像(MDR)を作成することを欲する場合、問題は、様々な被写体輝度がどこで終わることになるべきか、についてである。これは、どの被写体がどの種類のシーンにあるのかに依存するので、複雑な問題である可能性があり、人は、ビデオクリエータに従って、カウボーイのような任意の特有の被写体を様々な可能な位置に置くことを欲する(矢印FL_DA参照)、何故なら、そのようなダイナミックレンジ上では、人は、とりわけ、利用可能な3次のダイナミックレンジDR_3の程度に応じて異なるように様々な被写体輝度の再配置を、及び、それが1次のDR_1からどれだけずれるのかを熟慮するのみならず、画像コンテンツのタイプ(カウボーイのような平易なタイプの被写体には、例えば、爆発又は上空の雲などとは異なるニーズがある)に関しても熟慮する。
【0034】
しかしながら、人が、実際、理論的に完全ではないシステムと、いくつかの固定されたアルゴリズムによって3つの位置をリンクする、単に線を連続することによって象徴的に示されているあらかじめ設計された方法と、3次の輝度軸上の興味深い位置を見つけることとを用いることができることが想定され得る。但し、1次のHDR画像(マスタ画像とも呼ばれる)から2次のグレーディングへのディスプレイ適用は、単にルママッピング関数の適用が必要になるだけであり、ルママッピング関数は、色格付け部又は(例えばそのルマヒストグラムなどの、マスタHDR画像の様々な特性の解析に基づいて、平均的に優れたマッピングを規定することになる)自動グレーディングアルゴリズムによるこの再グレーディングに対して指定されたものであり、ディスプレイ適用を使用して、このルママッピング関数及び何らかのあらかじめ配備されたディスプレイ適用アルゴリズムに基づいて3次(MDR)画像を取得し、そのディスプレイ適用アルゴリズムは、初期の、例えば、HDR対SDRルママッピング関数をHDR対MDRルママッピング関数に変換することになる(
図4及び5とともに下記の解説参照)。
【0035】
構成要素bに関して、簡単なHDR符号器、HDR10符号器が市場に導入された。このHDR10ビデオ符号器は、SMPTE2084において規格化されたいわゆる知覚量子化器(PQ)関数をOETF(逆EOTF)として使用する。Rec.709OETFのように1000:1に限定される代わりに、このPQ OETFにより、(可能な程度に表示されるべき)多くのより多い輝度、すなわち、任意の実際のHDRビデオ生成に十分な1/10,000nitと10,000nitの間に対してルマを規定する(典型的には10ビット)ことが可能になる。
【0036】
読者があまりにも短絡的に、HDRをルマコード単語における大量のビットと混同すべきでないことに留意されたい。それは、アナログ-デジタルコンバータのビットの量のような線形システムには当てはまり、実際、ビットの量は、ダイナミックレンジが底2の対数として続く。しかしながら、コード割当関数は、たとえ所望されても理論的にはかなりの非線形形状を有し得るので、HDR画像はたったの10ビットのルマだけ(さらに色成分ごとに8ビットのHDR画像)を用いて規定され得、このことが、既に配備されたシステムの再利用性の利点につながった(例えば、ICは、ある特定のビット深さ又はビデオケーブルを有するなど)。
【0037】
ルマの算出の後、人は10ビットのピクセルルマ平面Y_codeを有し、それに対して、ピクセルごとに2つの基準色成分Cb及びCrが基準色ピクセル平面として追加される。この画像は、伝統的に、さらにこの先、技術的にSDR画像、例えば、圧縮されたMPEG-HEVCなどであった「かのように」取り扱われ得る。ビデオ圧縮器は現実には、ピクセルの色又は輝度について配慮する必要はない。しかしながら、HDRのPQ規定画像の測色法は勿論、Rec.709の測色法の下で規定されたような適切な色をもたらすことにはならないので、さらなる輝度又は色調マッピングが整っていてもよい。
【0038】
したがって、装置、例えばディスプレイ(又は実際はそのデコーダ)を受け入れるには、例えば漂白された色を有する画像ではなく、適切に見える画像を表示するために、典型的には、{Y,Cb,Cr}ピクセル色の適切な色解釈を行う必要がある。
【0039】
これは、典型的には、ビデオ画像のピクセル色成分行列に加えて、さらなる画像規定メタデータを同時伝達することによってハンドリングされるが、画像規定メタデータは、どのEOTFが使用されるかについて(それについて、PQ EOTF(又はOETF)が使用されたと、現在制限なしに想定するものとする)のインジケーションなどの画像コーディングと、HDR画像のPL_Vなどと関連付けられた対象物ディスプレイの最大輝度の値とを規定する。
【0040】
より洗練された将来保証HDR符号器は、さらなる画像規定メタデータ、例えばハンドリングメタデータ、例えば、PL_V=1000nitまでの最初の画像の正規化された輝度を、2次参照画像、例えばPL_V=100nitのSDR参照画像の正規化された輝度にどのようにマッピングする(又は言い換えれば、再グレーディングする)のかを指定する関数を含む(
図2でより詳細に説明されるように)。これらのマッピング関数は、洞穴の場面が、例えば、日光漂白された砂漠の場面とは異なる、SDR輝度への輝度再マッピングが必要となるはずなので、画像ごとに変化する。すなわち、人は、関連するメタデータにおいて、別個のグローバル輝度マッピング関数F_Lを(又は、入力及び出力ルマのEOTFを介してルママッピング関数として同等に具現化されたものを)、ビデオの各連続画像と関連付ける。
【0041】
図2は、全HDRビデオ通信システムを示している。それは、例えば、制限を意図せずに、規格ETSI TS103433(消費者電子機器(SL-HDR)における使用のための高性能単一レイヤ高ダイナミックレンジシステム)に記述されたHDRビデオ画像コーディングを使用する。送信側には、画像のソース201がある。例えばインターネット送達会社又は現実生活のブロードキャストから、オフラインで作り出されたビデオを有するかどうか次第で、これはハードディスクから、例えばテレビスタジオなどからのケーブル出力までにわたるものであり得る。
【0042】
いくつかのビデオ生成規則によると、例えば、人間の色格付け部によってカラーグレーディングが行われた、又はカメラ捕捉の、若しくは自動輝度再配布アルゴリズムなどによって、シェーディングが行われたバージョンの、マスタHDRビデオ(MAST_HDR)がもたらされる。
【0043】
これは、例えば、
図1の左側に示された5000nitのPL_Vビデオ、例えば、明るさ5000nit太陽光の西部映画となる。
【0044】
このマスタHDR画像から、HDR画像を実際に伝達するための通信画像が導出される。これは様々な様式で行われ得る。例えば、PQ EOTFを用いて10ビットのルマコードを計算することによって5000nitのHDR画像自体が伝送され得る。マスタHDRのグレーディングのために別のグレーディングがプロキシとしてさらにどのように伝送され得るかについて説明する。例えば、マスタHDR画像のSDR再グレーディングバージョンであるSDR通信画像Im_SDRを伝送する。厳密に増大する輝度、又は、ルママッピング関数F_Lが使用される場合、ルママッピング関数F_Lは可逆であるので、任意の受信器において、HDRマスタ画像は、逆関数をIm_SDRピクセルルマに適用することによって再構築され得る。一般に、人がさらに例えば彩度変化を行うことを欲することを考慮に入れると、画像ごとに最適化され得る色マッピング関数F_ctが存在することになる。マッピングの色処理は、色変換器202によって行われる。
【0045】
通信画像は本質的に単に任意の他の10ビット画像のように見え、特にSDR通信画像Im_SDRは本当のSDR画像であるので(それが、さらなる色最適化なしに直接旧来のLDRディスプレイ上に表示されるとき、それは十分見える絵を与えることになるという意味で)、この画像は、ビデオ圧縮器203で圧縮され得、ビデオ圧縮器203は、どの圧縮フォーマットが任意の通信媒体上に配備されているか(それは光ディスク、インターネット加入、地上デジタルテレビ、それとも、例えば監視若しくはセキュリティなどのための何らかの職業ビデオ通信システムであるかどうか)に応じて、例えば、HEVC若しくはVVCのようなMPEGアルゴリズム、又は、AVIなどのような何らかの他のビデオ符号器を適用して、圧縮されたHDR画像Im_CODを取得する。フォーマッタ204は、通信のために典型的な、例えばパケット化、周波数変調、(ハンドシェーキング)などのフォーマッティングを適用する。関数の形を設定するパラメータのような又は例えばLUTなどとしての関数の厳密な仕様のような様々な形態で、規定され得るマッピング関数は、固有データの様々な形態を伝達するために現存する機構があるので、容易に伝達され得、現存する機構では、人は単に、ある特定の例えば補足的強化情報(SEI)メッセージ(SEI(F_ct))が特有の様式で規定されたルママッピング関数を含む何らかのビデオ通信規格に同意するだけで、各適合受信者はそのSEIメッセージの理解の仕方を知るものである。
【0046】
したがって、読者は再び
図1を用いた説明と同じようなものを見て、将来保証HDRコーディングの2つの成分、すなわち、第1の技術的回路又は処理は、所望通りの画像(マスタ画像、より正確には通信画像)の比色定量仕様を含み、第2の回路又は処理は、特に、現存の通信技術に少なくとも公式に(必ずしも比色定量的にではなく)準拠する画像を生成するために、コーディング態様自体を含み、その結果、人は、特定の規定されたコーディング手法、利用可能な帯域幅のような条件などを有する現存の通信チャネル上でHDR画像を送ることができる。
【0047】
任意の受信拠点では、対応するビデオ信号アンフォーマッタ206は、必要なアンフォーマッティング方法を適用して圧縮されたビデオを、例えば圧縮されたHEVC画像(すなわちHEVC画像データ)、例えば、変調などのセットとして再取得する。
【0048】
ビデオ圧縮解除器207は、例えばHEVC圧縮解除を行って、ピクセル化された非圧縮画像Im_USDRのストリームを取得し、非圧縮画像Im_USDRは本例では、SDR画像であるが別のモードではHDR画像である。ビデオデータ入力227は、ビデオピクセルデータ及びメタデータを伝達するのに適した任意の媒体である。例えば、それは、HDMI(登録商標)のような外部ケーブル、及び装置内の内部データバス、ネットワークへの接続などである。ビデオ圧縮解除器はさらに、例えばSEIメッセージからの必要な輝度マッピング関数F_L、又は一般的な色変換関数F_ctを解凍することになる。
【0049】
画像及び関数は、SDR画像を任意の非SDRダイナミックレンジの(すなわち、100nitよりも高く、典型的には少なくとも数倍例えば5倍高いPL_Vの)画像に変換するように構成された(デコーダ)色変換器208に入力される。
【0050】
例えば受信器デコーダは、MAST_HDRからIm_LDRを作成するために、エンコーディング側で使用される色変換F_ctの逆色変換IF_ctを適用することによって、Im_USDRから、再構築されたHDR画像Im_RHDRを算出することによってマスタの5000nit画像の単純な再構築を行うことができる。
【0051】
次いで、この画像は、さらなるディスプレイ適用のために例えばディスプレイ210に送られて、接続された700nitのPL_Dエンドユーザディスプレイを最適に駆動するために例えば700nitのPL_V画像を取得し得るが、ディスプレイ適応画像Im_DA_MDRを作成することもまた、色変換器において、F_L関数の代わりに、算出された(例えばファームウェア内で、オフラインループで特定された)FL_DA関数を用いることによってデコーディング中に一度に行われ得る。そのような実施形態では、色変換器はさらに、あらかじめ焼かれた(又は構成された)ディスプレイ適合アルゴリズムを用いて、受信されたF_L関数に基づいてFL_DA関数を導出するために、ディスプレイ適合ユニット209を有する。
【0052】
最適化された例えば700nitディスプレイ適応画像Im_DA_MDRは、ビデオデコーダ220が例えばセットトップボックス若しくはコンピュータなどの中に含まれる場合、例えばディスプレイ210に送られる、デコーダが例えば携帯電話内にある場合、それはディスプレイパネルに送られる、又は、デコーダが例えば何らかのインターネット接続されたサーバなどの中にある場合、それは映画館のプロジェクタに伝達される。
【0053】
図3は、HDRデコーダ(又は、大部分は典型的には同じトポロジを有するが、逆関数を用い、典型的には
図3において点線で示される回路350としてのディスプレイ適合を含まない、エンコーダ)の、すなわち
図2、208に対応する色変換器300の内部処理のより詳細な有用な変形例をさらに説明するために示すものである。
【0054】
ピクセルの輝度、この例ではSDR画像ピクセルは、対応するルマY’SDRとして入力される(ダイナミックレンジを下げるための代替的な逆再グレーディングについてさらなる図を用いて説明することとする)。基準色とも呼ばれるクロマ成分Cb及びCrは、色変換器300の下側処理経路に入力される。
【0055】
ルマY’SDRは、輝度マッピング回路310によって、必要とされる出力輝度L’HDRに、例えば、マスタHDR再構築輝度又はいくつかの他のHDR画像輝度にマッピングされる。それは、メタデータ同時通信参照輝度マッピング関数F_L(t)を入力として使用するディスプレイ適合関数計算器350から取得される特定の画像及び例えば最大ディスプレイ輝度PL_Dに対して、好適な関数、例えばディスプレイ適合輝度マッピング関数FL_DA(t)を適用する。実施形態において、それ自体によって、いくつかの連続するサブ処理からなる上側処理トラック(回路310、しかし、本分野に対する現在の技術的寄与の説明のために、回路310は、現在変換されているビデオ画像の全てのピクセルに対して単一のルママッピング関数を適用すると想定され得る。
【0056】
ディスプレイ適合関数計算器350もまた、基準色を処理するのに適した関数を決定する。今のところ、単に、それぞれの可能な入力画像ピクセルルマY(すなわち、例えば、0~1023)に対する乗算係数mC[Y]のセットは、例えば色LUT301に記憶されると想定されることとなる。色彩の厳密な性質の処理は様々である。例えば、人が、入力ルマ(色LUTにおける対応する双曲線)によって基準色を最初に正規化し、次いで、出力ルマのために補正することによって、ピクセル彩度を一定に保つことを欲するが、任意の微分彩度処理もまた使用される。色調は、両方の基準色が同じ乗数で乗算されるので、典型的には維持されることとなる。
【0057】
現在色変換されて(輝度マッピングされて)いるピクセルのルマ値Yで、色LUT301をインデックス化するとき、必要とされる乗算係数mCはLUT出力としてもたらされる。乗算係数mCは乗算器302によって使用されて、それは、現在のピクセルの2つの基準色値で乗算され、すなわち色変換された出力基準色がもたらされる。
Cbo=mC*Cb
Cro=mC*Cr [等式1]
固定された色行列化プロセッサ303を介して、標準測色法計算を適用し、基準色は、明度欠落正規化非線形R’G’B’座標R’/L’、G’/L’、及びB’/L’に変換され得る。
【0058】
出力画像に対して適切な輝度を与えるR’G’B’座標は乗算器311によって得られ、乗算器311は、
R’_HDR=(R’/L’)*L’_HDR、
G’_HDR=(G’/L’)*L’_HDR、
B’_HDR=(B’/L’)*L’_HDR、 [等式2]
を計算し、
それらは色三重項R’G’B’_HDRに集約され得る。
【0059】
最後に、ディスプレイマッピング回路320による、ディスプレイにとって必要とされるフォーマットへのさらなるマッピングがある。これによりディスプレイ駆動色D_Cがもたらされ、それによりディスプレイによって所望される測色法の公式化(例えば、さらにHLG OEFTフォーマットも)が行われるだけでなく、このディスプレイマッピング回路320がいくつかの変形例で、そのディスプレイのために何らかの特定の色処理を行うように構成される。すなわち、それは、例えば、ピクセル輝度のうちのいくつかをさらに再マッピングする。
【0060】
創作側の格付け部が、決定している任意の可能なF_L関数のための対応するFL_DA関数を導出するためのいくつかの好適なディスプレイ適合アルゴリズムを説明するいくつかの例が、WO2016/091406又はETSI TS103433-2V1.1.1(2018-01)において教示される。
【0061】
ディスプレイ適合手法は
図4に、可能な正規化された入力輝度Ln_in、対、正規化された出力輝度Ln_outのプロット上のその動きを示すことによって集約されている(これらは、正規化された輝度、すなわちPL_V値と関連付けられたディスプレイの最大輝度による乗算により、実際の輝度に変換されることになる)。そのようなプロットがルマ-ルマプロットとして作成され得、知覚的に均一化されるルマが有利であることに留意されたい。例えば、本適用例の以下の等式は、そのような知覚的に均一化されるルマを導出するために使用される。
Y_P=v(L_in;PL_V_in)=log[1+(RHO-1)*power(L_in;p)]/log[RHO]、
ここで、RHOは、以下の等式による、入力最大輝度PL_V_inに依存する定数である。
RHO(PL_V_in)=1+32*power((PL_V_in/10,000);p)、pは、典型的には2.4に等しいように設定される定数である。 [等式3]
【0062】
水平軸を知覚によるルマに変換すると、入力輝度L_inには、
図4の正規化された輝度を入れることになり、PL_V_inは、5000nitのPL_VマスタHDR画像を2次参照グレーディングに変換していた場合、それらの輝度のための、すなわち5000nitのためのPL_Vとなる。縦軸上に必要とされる、0と1との間の知覚的に均一化されたルマの2次参照グレーディングが100nitのSDR画像である場合、均一化された出力ルマを算出するために等式3を用いるとき、値PL_V_in=100が用いられることになる。そのような等式の利点は、目が適切に各それぞれのレンジに対して異なる濃淡値を見たいと思うように、両軸が既に適切に均一化されていることであり、それによってマッピング関数が視覚的により適切に規定される。
【0063】
例えば700nitのMDR画像の最終ディスプレイ適合ルマを取得するために入力画像のルマに適用されるべき、そのようなディスプレイ適合アルゴリズム、すなわち、典型的にはビデオクリエータからの入力ルママッピングに基づいて最終のルママッピングを算出するためのアルゴリズムは、典型的には、以下の技術的特性を有する。
【0064】
入力ルママッピング関数F_Lは、識別情報変換と対比され得る。この識別情報変換は、入力画像をそれ自体にマッピングすることに対応し、すなわち、水平入力軸上には、例えば、輝度の5000nitスパン(すなわち、PL_V_in=5000)に対して知覚的に均一化されたルマを有することになり、縦軸上には、厳密に同じにスケーリングされ分割された知覚化されたルマのセットを有することになる。しかも識別情報変換は、ピクセルに対してブライトニングもダークニングも起こらないはずであることを意図しており、したがって、特定のピクセルに関する、水平軸上の、例えば0.6の入力値は、縦軸上の同じ値0.6への厳密なマッピングを行うことになる。したがってこの識別情報変換は幾何学的に、知覚的に均一化されたルマプロットにおいて45度の斜線の位置にくることになる。中間的なPL_Vの何らかの中間的なグレーディングへのマッピングにより、関数がスケーリングされることは理にかなっている。したがって、5000対700nitディスプレイ適合ルママッピング関数(FL_DA)は、典型的には、5000対100nit入力関数(F_L)と同じ形状を有し、すなわち同じ隆起部を有するが、斜線に、より近接して置かれている。
【0065】
「関数の扇」のこの「開放」は、公式に下記のように公式化される。
a)人は、計算されるべき任意のディスプレイ適合ルママッピング関数の中間的なポイントのロケーションを測位するために方向を規定し、すなわち、線分の端部ポイントを形成する、2次グレーディング、この例ではSDRグレーディングに対応する、関数F_L上の、入力画像ルマに対応する、斜線上の任意のポイント(pos)がその方向に沿った線分上にくることになる。
b)人は、2つの開始参照グレーディング(それらのうちの一方は、伝達され受信された画像であり、この例では、斜線識別情報マッピングに対応する、例えば、5000nitのPL_Vを有するマスタHDR画像であり、もう一方は、メタデータとして受信されたルママッピング関数を、例えば、PL_V=100nitの値を有する1次/マスタHDR画像ルマに適用することによって算出され得る2次グレーディング)のPL_V値に対応する端部ポイント同士の中間に、その線分上に、算出されるべき中間的な画像(すなわち、例えば、700nitに等しいPL_Vを有する、700nitのディスプレイに対するディスプレイ適合画像)の任意のPL_V値を配置するために、メトリックを規定する。いくつかの実施形態によると、方向は入力ルマの水平軸から時計回りに135度であり、他の実施形態では、反時計回りに90度であり、第1の部分的なルママッピング関数を計算するために第1の方向を、第2の部分的な関数のための第2の方向を使用するディスプレイ適合アルゴリズムがある。
【0066】
例えば、ビデオクリエータは、
図1を用いて説明したように2つの参照グレーディング間に輝度マッピング戦略を設計している。故に、任意の可能な、入力画像、例えば、マスタHDR画像におけるピクセルの正規化された輝度Ln_inでは、この正規化された入力輝度は、出力画像である第2の参照グレーディングの正規化された出力輝度Ln_outにマッピングされなければならない。全ての輝度のこの再グレーディングは何らかの関数F_Lに対応し、この関数F_Lは、人間の格付け部又はグレーディングオートメーションによって決まる多くの異なる形状を有し得、この関数の形状はダイナミックメタデータと同時伝達される。
【0067】
ここで問題は、例えば、例えば800nitのディスプレイが、グレーディング効果の50%を有すべきである(完全な100%は、マスタHDR画像の100nit PL_V SDR画像への再グレーディングである)ことを計算し得るメトリック上で、入力画像ルマをMDR画像ルマにマッピングするために、この単純なディスプレイ適合プロトコルにおいて、どの形状を、ディスプレイ適合マッピング関数FL_DAである導出されたF_L関数の2次バージョンが有するべきかについてである。一般に、メトリックを介して、全く再グレーディングなしと第2の参照画像への完全な再グレーディングとの間の任意のポイントが決定され得るが、これは、ピクセルの任意の可能な正規化された入力輝度(Ln_in_pix)に対するものである。もたらされるMDR輝度(又はルマ)は、ディスプレイ適合輝度L_P_nとして示され、そのロケーションは、勿論、入力正規化輝度にだけではなく、算出されるべきディスプレイ適合出力画像(PL_V_out)と関連付けられた最大輝度の値にも依存する。当業者は、一つが、正規化輝度表現の関数を代表し得るが、一つが、任意のOETFによって規定された、任意の正規化ルマ表現の関数を同等に代表し得ることを理解する。
【0068】
メトリックは、有利には、典型的には、本質的に対数表現であり、それは、例えば100nitと1000nitとの間の値が、100nitごとに線分上に均等な距離で広がっている代わりに、値が、それらを等しい距離の位置に割り当てる前に、非線形関数によって最初に変換されることを意図する。例えば、950nitディスプレイがPL_D=1000nit値に十分近接しており、その結果、PL_V=1000nit入力画像がほとんどどのような輝度マッピングも必要がないと決定され得、一方、150nit画像は、1000対100nitマッピングと比較して相対的に、マッピングにおけるより多くの変更が必要である。典型的には、コーディングエコシステムのクリエータ、又は、少なくとも、テレビディスプレイのような受信装置のクリエータは、全ての選択肢に対して固定値を選ぶことになる、例えば、彼は、メトリックpos=1-{log(1+[(PL_V-100)])/log(1+[(1000-100)])}[等式4]による90度の配向を使用することになる。
【0069】
対応するディスプレイ適合輝度マッピングFL_DAは、以下(
図4参照)のように決定され得る。全ての入力輝度、例えばLn_in_pixのうちの任意の1つを取り上げる。これは、(四角のように示された)正規化された輝度の入力軸及び出力軸に対して等しい角度を有する斜線上の開始位置に対応する。斜線に沿った各位置に対して、斜線上の各ポイントでのメトリックのスケーリングされたバージョン(スケーリングされたメトリックSM)を配置し、その結果、それは、斜線に対して直交になる(又は、入力軸から反時計回りに135度)斜線で始まり、その100%レベル、又は正規化pos=1、F_L曲線上のポイントで、すなわち、F_L曲線の直交スケーリングメトリックSMとの交点で終了する(五角形で示される)。(本例では、画像がそれのために計算されなければならないディスプレイのこのPL_D値のための)メトリックの50%レベルに、すなわち中程に、又は一般に、等式4の、若しくは、PL_DとPL_V_inとの間の任意のずれのための再グレーディングの必要とされるシビアリティを規定するための任意の類似の非線形等式の、数値を求めることによって得られる任意の正規化された位置に、ポイントを配置する。全てのLn_in値に対応する、斜線上の全てのポイントに対してこれを行うことによって、FL_DA曲線が得られ、それは、元々のものと類似に形づくられており、すなわち、同じ再グレーディングをされるが、すなわち、好適により下位の様式で最大輝度、再スケーリングされ/調整される。いまや、この関数は、任意の入力HDR輝度値Ln_inを所与とした、必要とされる対応する最適に再グレーディングされた/ディスプレイ適合された700nit PL_Vピクセル輝度を算出するように適用する準備が整っている。この関数FL_DAは、このディスプレイ適合ルママッピング関数を受信した後、現在処理されるビデオ画像の全ての動作中のピクセル上で比色定量変換を開始する直前に、輝度マッピング回路310によって適用されることになる。
【0070】
図5は、ディスプレイ適合の技術的構成要素を一般に公式に示している。
【0071】
例えば、テレビ又はセットトップボックスなどにおけるディスプレイ適合回路510は、設定プロセッサ511を含む。設定プロセッサ511は、その画像の動作中のピクセル色が処理されるようになる前に、画像の処理のための値を設定する。例えば、ディスプレイ最適化出力画像の最大輝度値PL_V_outは、接続されたディスプレイからそれにポーリングする(すなわち、ディスプレイは、その最大表示可能輝度PL_Dをセットトップボックスに伝達する)ことにより、セットトップボックス内に一旦設定されるか、又は回路がテレビ内にあるとき、これは、製造者などによって設定される。
【0072】
輝度マッピング関数F_Lは、いくつかの実施形態において、受信画像ごとに変動し(他の変形例では、それは多数の画像に対して固定される)、メタデータ情報の何らかのソース512から入力される(例えば、これは、SEIメッセージとしてブロードキャストされ、ブルーレイディスクなどのようなメモリのセクタから読み出される)。このデータにより、正規化されたメトリック(Sm1、Sm2など)の正規化された高さが確立され、その上のPL_D値の所望の位置が、メトリックの数学的等式から見出され得る。
【0073】
入力画像513が入力されると、連続したピクセル輝度(例えば、Ln_in_pix_33及びLn_in_pix_34、又はルマ)が、ディスプレイ適合を適用する色処理パイプラインを通じて動作し、Ln_out_pix_33などの対応する出力輝度がもたらされる。
【発明の概要】
【発明が解決しようとする課題】
【0074】
そのような固定のよく機能する関数ずれアルゴリズムを上記のディスプレイ適合アルゴリズムとしてあらかじめ確立することには、技術的な簡略化の利点がある(すなわち、例えば、斜線に沿った異なる位置に対してメトリックの等式を変更するための制御パラメータがない場合、わずかな人間格付け部入力が必要とされる)が、安定した再グレーディングを確立することにより、格付け部は、何が同様に、様々な消費者が所有する様々なエンドユーザディスプレイ上に表示されることになるのかについて予想することができるようになる。実際、ディスプレイ適合アルゴリズムは、画像における様々な被写体の明度再グレーディングのニーズを含むその特定の形状を維持するような様式で入力F_L関数に基づいて機能するので、彼の、マスタ画像のグレーディングされた様子により、マスタHDR画像の全ての輝度を十分に表示できないのは何なのかが、実に大きくディスプレイ上に明らかにされることが保証される。固定されたアルゴリズムの不利な点は勿論、いずれかの特定の好みにより、そのアルゴリズムが常に100%完全な画像を生み出すわけではないことであり、そのため、人は、それに対して改善することを願う。
【0075】
したがって、この配備された技術により、ビデオクリエータはHDR画像のビデオを規定することができ、さらに、これらのビデオ画像が、異なるダイナミックレンジを有する様々なディスプレイに対してどのように自動的に再グレーディングされるべきかを明記することができ、そして、彼は、ルママッピング関数の形状を、特に任意の特定の画像のニーズに適合させ得る、すなわち、入力の分布がそれぞれ、全ての画像被写体に対する輝度のダイナミックレンジに沿ってルマを出力する。しかしながら、発明者によると、この手法はまだ多少荒削りであることが問題であり、したがって、潜在的に、クリエータのグレーディングされた様子からわずかに外れることがあっても、特にこのフレームワークにおける又はその上での場合、ディスプレイ製造者及び/又は末端の視聴者がさらにいくらかの量の再グレーディングを実施し得ることが有利である。
【0076】
US20140368531は、比較的暗い画像が示されるべき場合に、LCDパネルの伝達性を増強するためのアルゴリズムを教示しており、したがって、そうしなければ、閉鎖されたピクセルによって消費され得るエネルギーを節約するためにバック照明が弱められ得る。電圧制御を介してこれを行う代わりに、US20140368531が教示するところによると、これが、画像処理操作がピクセルルマコードをより高い値に変更するときに行われ得、そして標準LDRディスプレイ電力関数のガンマ2.2を使用する。増強された伝達度関数は、どれが主に最も暗い色をより明るくなるように増強するのか、所望通り規定され得、より明るい色は大きく変化させられないままとなる。例えば、最も暗い色に対して、最大4倍のブーストが適用され得る(曲線の傾きがゼロで)。暗い画像に対してそのような強力なブーストが使用されるが、明るい画像に対してはそれほどでもない。最大ブーストと(増強がないことになる、すなわち、画像がそのまま残される明るい画像の場合)最小ブーストとの間を補間することによってブーストが迅速に実現され得る。すなわち、したがって、迅速に、それぞれのピクセルルマコード、例えば166に対して必要とされる(中間的な)出力を、2つの対応する出力値の補間として内挿する。補間の量、例えば25%、は、入力画像ヒストグラムの解析に依存する(例えば、8個のビンのうちの最も暗いビン内に、いくつのピクセルがあるか)。
【課題を解決するための手段】
【0077】
視覚的により優れて見える画像は、出力ビデオの出力画像を取得するために入力ビデオの入力画像(Im_Comm)を処理する方法によって取得され得、
入力画像は、第1の輝度ダイナミックレンジ(DR_1)内に入る入力輝度(Ln_in_pix)を有するピクセルを有し、その第1の輝度ダイナミックレンジは、第1の最大輝度(PL_V_HDR)を有し、
出力画像は、入力輝度から算出され得、第2の輝度ダイナミックレンジ内に入る出力輝度を有するピクセルを有し、その第2の輝度ダイナミックレンジは第2の最大輝度(PL_V_MDR)を有し
参照輝度マッピング関数(F_L)は、入力画像と関連付けられたメタデータとして受信され、
参照輝度マッピング関数は、第1の参照画像の輝度と第2の参照画像の輝度との間の関係を特定し、
第1の参照画像は入力画像であり、
第2の参照画像は第2の参照最大輝度(PL_V_SDR)を有し、
処理することは、参照輝度マッピング関数(F_L)に基づいて適合された輝度マッピング関数(FL_DA)を決定することを含み、
決定することは、あらかじめ固定されたディスプレイ適合アルゴリズムを使用し、そのアルゴリズムは、最大が1になるように正規化された入力輝度と最大が1になるように正規化された出力輝度との座標系において、斜線上の各ポイントに対して、あらかじめ固定された方向に配向された、斜線上で始まる線分に沿ってそれぞれのメトリックを特定し、
各位置におけるそれぞれのメトリックは、座標系において、線分と、輝度関数(F_L)の軌跡との間の交差ポイントに値1を与えることによって正規化され、
決定することは、第2の最大輝度(PL_V_MDR)に対応する各それぞれのメトリック上の位置を特定し、
それぞれのメトリック上の位置の集合は、適合された輝度マッピング関数(FL_DA)として出力されるものであり、
視覚的により優れて見える画像は、処理することが、ブースタ強度値(BO)を算出することを含んでおり、ブースタ強度値(BO)を算出することが、
-適合された輝度マッピング関数(FL_DA)を入力輝度に適用することによって得られる中間的な輝度のヒストグラム(hist)を決定することと、
-ヒストグラムに基づいて平均的な明度の大きさ(AB)を算出することと、
-平均的な明度の大きさ(AB)から第1の強度値(PosB)を算出することと、
-ヒストグラムの少なくとも2つの構成可能上位ビン内のピクセルカウントの重み付けされた合計(BDE)を算出することと、
-重み付けされた合計(BDE)から第2の強度値(NegB)を算出することと、
-第1の強度値(PosB)マイナス第2の強度値(NegB)に等しい値(DV)に基づいて、ブースタ強度値(BO)を決定することとを含み、
処理することがさらに、調整された適合された輝度マッピング関数が、メトリック上のブースタ強度値に等しい位置の軌跡を出力する設定のディスプレイ適合アルゴリズムを用いることによって、調整された適合された輝度マッピング関数(F_ALT_B)として、計算される、調整された適合された輝度マッピング関数(F_ALT_B)を計算することと、
出力輝度を取得するために、調整された適合された輝度マッピング関数(F_ALT_B)を入力輝度に適用することとを含む、ことを特徴とする。
【0078】
我々が輝度を考える場合、輝度の技術的概念の表現を意図していることに留意されたい。これは、読者がそれをいずれかの特有の表現に、特に正規化された物理的輝度に限定して読み取るべきではなく、典型的には、輝度がルマ表現で表現されることになることを意図するものである。例えば、等式3に従って心理視覚的に均一化されたルマのシステムとともに機能する実施形態は十分に機能するが、様々な要素(例えば、メトリック目盛り)が適切に設定された場合、他の表現もまた機能することになる。
【0079】
メトリックの等式が規定された時点で、その等式を計算することによって任意のPL_V_MDR値は、0と1との間のメトリックの何らかのロケーションに位置することになり、それは、どの入力画像が入ってきて、アップグレーディングが関与するかそれともダウングレーディングが関与するかに依存するものであり、典型的には、値、PL_V_HDR(例えば5000nit)及びPL_V_SDR(100nit)である。1つの関数F_Lを用いて説明する一方、いくつかの関数を連結して用いて1つの画像を変換する(興味のある読者は、参照によって組み入れられるETSI TS103433における有用な実施形態を見つけることができる)。ディスプレイ適合アルゴリズムは典型的には、ビデオ通信エコシステムごとに一旦固定設定されることになる。例えば、地上ATSCブロードキャスティングでは、規格によりアルゴリズムが選択される。インターネットサーバからの映画の並外れた供給者は、同じディスプレイ適合アルゴリズムを使用するか、又は似ているが異なるもの使用するように決定する。HDR画像の任意のPL_Vマスタリングでは、第2の参照画像は、100nitのSDR画像が、最も典型的には低品質の表示システムを生ずるための画像被写体ルマの優れた再分配を有するので、通常100nitのSDR画像である。PosB値及びPosN値は、競合的な様式で意図された再グレーディングを増大するニーズ及び危険性を示すための容易な様式である。あらかじめ固定されたディスプレイ適合アルゴリズムの再利用は、予測可能性と、元々の内容格付け部の画像に対する芸術的意図の大きな保持とを確実にする。エンドポイントエンティティ、例えばディスプレイ製造者がシステムを、彼が熱望することに合わせて仕立てることができる(例えば、意図されるグレーディングをよりアグレッシブに変化させ、しかし、例えば、圧縮性のダウングレーディングの強度から、何らかの望ましい、絵の側面を増強する)ように、例えば、変換関数を形づくるためにいくつかのパラメータが利用可能である。
【0080】
図6において、いくつかのビデオの画像のうちの少なくともいくつかに対して行われ得ることを、(誇張された様式で)概略的に見ることができる。PL_V=1000nitを有する入力HDR画像を、標準的な100nit(又はおそらく200nit)出力にマッピングすると仮定する。次いで、斜線は、正規化された輝度座標において、(例えば、伝統的なSDRディスプレイパラダイムによる、「画像においてコード化された最も明るいピクセルを、最も明るい表示可能色にマッピングする(白を表示する)」)固有の線形スケーリングが暗色化として導入するものを表す。全ての色は、それらが想定されるものと比較して10分の1に弱められる。それは、日光に照らされた雲若しくは我々の強く照明されたカウボーイのような既にかなり明るい被写体にとって、問題とはならない(か、又は、さらにかなりハンディな自動色調マッピングとなる)。例えば、元々500nitであると想定されるピクセルが、50nitで表示されることになる。これは、一方で、SDRディスプレイのより限定されたダイナミックレンジにおいて理にかなった値であるが、他方で、SDRにおいてでさえ立派に明るいので、十分に見る価値がある。より問題であるのは、比較的より暗い被写体である。入力レンジR_iでは、マスタ1000nit HDR画像の格付け部は、対照的なより明るいHDR被写体があることに対処もしつつ、より暗い被写体のグレーディングを注意深く行ってきたことになる。それらは、例えば、屋内の被写体であり、特に重要であるのは、あまりよく照明されていないシーンのエリア内の屋内被写体であることである。現実世界では(すなわち、輝度メータを使い測定を開始する場合)、屋内被写体は、例えば、画像ビューにおける窓を通じて見たとき、典型的には、屋外被写体よりも100倍暗い。PL_V=1000nitで終了するマスタHDRグレーディングにおいて、典型的には100:1の比は使用されないことになる。何故なら、一方で、それは、ダイナミックレンジの最良の使用にはならないからであり、他方では、それは、典型的な視聴者が見ることが期待されるものではない(現実のシーンを見るのではなく、彼のリビングルーム内での夕方の視聴中に小さな長方形を見る)からである。したがって、例えば、窓を通して見た外部ピクセルに10nitと1000nitとの間の値を、屋内ピクセルに0nitと100nitとの間の値を与えるマスタグレーディングでは、照明比10:1が使用される。
【0081】
それは、実際1000nit HDRディスプレイ上で示されると、かなり正確に見える。しかしながら、10倍にスケーリングを行うと、10nitで表示されると想定されるピクセルは、深い黒である1nitで表示されることになる。ディスプレイの前面ガラス上の反射など、視聴場所において周囲照明のさらなる影響があることを考慮に入れると、これらのより暗いエリアはめったに見る価値があるようにはならない。
【0082】
これが、格付け部が、ディスプレイ適合アルゴリズムと組み合わせて、輝度(又はルマ)マッピング関数FL_DAを作り出す理由であり、輝度(又はルマ)マッピング関数FL_DAは、例えば、特に、言及した屋内シーンのそれら屋内ピクセルについて、全てのピクセル輝度のかなり優れた再マッピングを与えることになる。マッピング曲線が、出力レンジR_oに対して相対的に入力レンジR_iを伸張し、出力レンジR_oがさらに、100倍することによって絶対輝度に転換されなければならないことが実際にわかる。しかしながら、いずれの場合でも、例において、利用可能なレンジのほぼ50%が使用され、それにより、より優れた視認性が保証される。
【0083】
しかしながら、状況によっては、人は、さらにより強力なブライトニングの再グレーディングを適用し、この例において、さらに大きい第2の出力レンジR_o2にわたって、最も暗い輝度を伸張させることを欲する。
【0084】
現存する再グレーディングフレームワークの上にこの可能性を構築することが重要である。さもなければ、このさらなるブライトニングを適用することを所望する第1のエンティティのうちの1つであるテレビメーカーは、そのメーカーのディスプレイブランドをより良く見せるようにするために、どのような輝度マッピングでも行い得る。そして、これにより、(全ての困難を通り抜けて、マスタグレーディング画像における所望の値に、全ての被写体輝度を配置することによって、特に印象的に見えるHDRシーン画像を作成し、及びさらに、より小さいダイナミックレンジに進むとき、この分布をどのようにわずかに変化させるかを指定する)ビデオクリエータの注視が破壊されるだけでなく、単純な予測できない様式のHDRの作成、コーディング、ハンドリング、及び表示のうちの1つが振り出しに戻される。実際、少なくとも一部のエンドユーザが、かなり強力な輝度再マッピング関数を適用し、クリエータによると、潜在的に凝りすぎた無味乾燥な様式で、彼らの画像を印象的にポップアウトさせることが予想され得る。しかしながら、これにはより悪い作用がある。簡略化のために、画像の最も暗い輝度に何が起こるかについて説明したが、レンジに沿った輝度は全て、画像内に信頼できる印象的なHDR効果を有するように適切に配置される必要があることになる(例えば、2つの隆起部間のより急な傾斜を参照のこと)。1つが、所望のディスプレイ適合曲線から強く逸脱した場合、1つが、画像を強力に悪化させて、印象的なHDR画像の代わりに、(より小さなダイナミックレンジ能力に適合するために幾分のスケールダウンでさえなく、しかし、単に無くなったか、又は少なくともひどく歪んだ)全ての良いHDR効果がなく、さらに、よりSDR画像に近くなる。出力画像は、派手に見え、好みによるが、顧客によってはさらに適切な程ばらつき得るが、完全には見えず、すなわち、マスタHDRビデオの格付け部によって作り出されたようには見えない。
【0085】
したがって、非クリエータ、例えばディスプレイ製造者の異なる好みに適した代替的なディスプレイ適合関数F_ALT_Bを、注意深く設計された技術的様式で作り出す必要がある。
【0086】
入力画像を処理する方法は、2つの構成可能な上位ビンのうちの1つが、中間的な輝度のヒストグラム(hist)内に1%の最も明るいピクセルを含むとき、そのことを利用する場合、有利である。このスーパービンはさらに、有利には、そのci乗数を0に等しく設定することによって、クリティカルでないとして無視され得る(下記参照)。
【0087】
入力画像を処理する方法は、ゼロと1との間で正規化された相対的なブースト値(RB)によって乗算されたカスタマイズ可能な乗数値(mf)として決定されたブースタ強度値(BO)を有する場合、有利である。これは、最終的に表示された画像の最初の外観の美しさの一般的な改善とのバランスをとりながら、実装者が元々のグレーディングのずれの量の通例の強度を設定するための容易なやり方である。
【0088】
フィルタリングされていない直接的変化と比較して、限定された又は低減されたこれまでに決定されたブースタ強度値にともなう変化をそのまま保持するために、入力画像を処理することが、一時的なフィルタリングの後行われるブースタ強度値の算出を有する場合、有利である。
【0089】
マイナスの差分からプラスの差分を異なるようにフィルタリングする非対称の一時的フィルタリングが使用される場合、(画像は、大きなブースティングに耐えられず、誤差を作り出し、より注意深い処置を直ちに必要とするので)より小さいブースタ強度値に急速に変化し、より高いブースタ強度値によりゆっくりと変化することが、有利である。
【0090】
手法は、出力ビデオの出力画像を取得するために、入力ビデオの入力画像(Im_Comm)を処理するための画像処理装置においてさらに具現化され得、
入力画像は、第1の輝度ダイナミックレンジ(DR_1)内に入る入力輝度(Ln_in_pix)を有するピクセルを有し、その第1の輝度ダイナミックレンジは、第1の最大輝度(PL_V_HDR)を有し、
出力画像は、入力輝度から算出され得、
第2の輝度ダイナミックレンジ内に入る出力輝度を有するピクセルを有し、その第2の輝度ダイナミックレンジは第2の最大輝度(PL_V_MDR)を有し、
画像処理装置は、入力画像と、入力画像と関連付けられたメタデータとして符号化される参照輝度マッピング関数(F_L)とを受信するように構成されたビデオデータ入力(227)を備えており、
参照輝度マッピング関数は、第1の参照画像の輝度と第2の参照画像の輝度との間の関係を特定し、
第1の参照画像は入力画像であり、
第2の参照画像は第2の参照最大輝度(PL_V_SDR)を有し、
画像処理装置は、参照輝度マッピング関数(F_L)に基づいて適合された輝度マッピング関数(FL_DA)を決定するように構成されたディスプレイ適合ユニット(209)を含み、
ディスプレイ適合ユニットは、あらかじめ固定されたディスプレイ適合アルゴリズムを使用し、そのアルゴリズムは、最大が1になるように正規化された入力輝度と最大が1になるように正規化された出力輝度との座標系において、斜線上の各ポイントに対して、あらかじめ固定された方向に配向された、斜線上で始まる線分に沿ってそれぞれのメトリックを特定し、
各位置におけるそれぞれのメトリックは、座標系において、線分と、輝度関数(F_L)の軌跡との間の交差ポイントに値1を与えることによって正規化され、
決定することは、第2の最大輝度(PL_V_MDR)に対応する各それぞれのメトリック上の位置を特定し、
それぞれのメトリック上の位置の集合は、適合された輝度マッピング関数(FL_DA)として出力されるものであり、
手法は、画像処理装置が処理を含み、処理が、ブースタ強度値(BO)を算出するように構成されたブースト決定回路(700)を含み、ブースト決定回路(700)が、
-適合された輝度マッピング関数(FL_DA)を入力輝度に適用することによって得られる中間的な輝度のヒストグラム(hist)を決定するように構成されたヒストグラム計算ユニット(721)と、
-ヒストグラムに基づいて平均的な明度の大きさ(AB)を算出するように構成された平均計算回路(705)と、
-平均的な明度の大きさ(AB)から第1の強度値(PosB)を算出するように構成された第1のコンバータユニット(706)と、
-ヒストグラムの少なくとも2つの構成可能上位ビン内のピクセルカウントの重み付けされた合計(BDE)を算出するように構成された第2の測定ユニット(711)と、
-重み付けされた合計(BDE)から第2の強度値(NegB)を算出するように構成された第2の変換ユニット(712)とを有し、
-ブースト決定回路は、第1の強度値(PosB)マイナス第2の強度値(NegB)に等しい値(DV)に基づいて、ブースタ強度値(BO)を決定するものであり、
画像処理装置がさらに
調整された適合された輝度マッピング関数(F_ALT_B)を計算するためにディスプレイ適合ユニットを使用するように構成されており、調整された適合された輝度マッピング関数が、メトリック上のブースタ強度値に等しい位置の軌跡を出力する設定のディスプレイ適合アルゴリズムを用いることによって、調整された適合された輝度マッピング関数(F_ALT_B)として、計算されるものであり、画像処理装置が
出力輝度を取得するために、調整された適合された輝度マッピング関数(F_ALT_B)を入力輝度に適用するように構成された色変換器(208)を含む、ことを特徴とする。
【0091】
画像処理装置は、ブースト決定回路(700)内に、より少なくしか変動しないブースタ強度値を算出するように構成された一時フィルタ(740)を含む。
【0092】
本発明による方法及び装置のこれらの及び他の態様は、添付図面を参照して、以後に記述される実装形態及び実施形態から明らかとなり、且つ以後に記述される実装形態及び実施形態を参照して説明されることとなり、添付図面は、より一般的な概念を例示する、単に、非限定的な特有の図解として役立ち、添付図面内の破線は、構成要素が任意選択であることを示すために使用され、破線でない構成要素は必ずしも必須ではない。破線はさらに、必須であるが物体の内部に隠されているように説明される、又は、例えば物体/領域の選択などの実体のないもののための、要素を示すために使用され得る。
【図面の簡単な説明】
【0093】
【
図1】いくつかの典型的な色変換を概略的に示す図であり、色変換は、人が最適に高ダイナミックレンジ画像を、対応する最適に色グレーディングが行われ同様に見えるより低いダイナミックレンジ画像に(第1及び第2のダイナミックレンジDr_1及びDR_2それぞれにおける差を考慮すると、所望通り及び実現可能に)、例えば100nitの最大輝度の標準ダイナミックレンジ画像にマッピングするときに行われるものであり、それが可逆の場合には、実際に、HDRシーンを符号化する受信されたSDR画像としてのSDR画像の、再構築された、そのシーンのHDR画像へのマッピングにさらに対応する。輝度は縦軸上の、最も暗い黒から最大輝度PL_Vまでのロケーションとして示される。輝度マッピング関数は、平均被写体輝度を、第1のダイナミックレンジ上のその輝度から第2のダイナミックレンジにマッピングする矢印によって象徴的に示されている(当業者は、例えば、1まで正規化された軸上で、これを伝統的な関数としてどのように同等に描くのかについて知っており、1まで正規化された軸は、それぞれの最大輝度で除することによって正規化される)。
【
図2】高ダイナミックレンジ画像、すなわち、典型的には少なくとも600nit又はそれ以上(典型的には1000nit以上)の輝度を有することができ、出願者が最近開発した、画像を符号化する技術の高レベル図の例を概略的に示す図であり、高ダイナミックレンジ画像は、実際HDR画像を、それ自体で、又は対応する輝度再グレーディングされたSDR画像プラスメタデータ符号化色変換関数として伝達され得、メタデータ符号化色変換関数は、受信されたSDR画像(複数可)をHDR画像(複数可)に変換するためのデコーダによって使用されるために、ピクセル色のための、少なくとも適切な決定された輝度マッピング関数(F_L)を含む。
【
図3】(非限定的な)好ましい実施形態として、画像デコーダの、特にピクセル色処理(変換)エンジンの内部の詳細を示す図である。
【
図4】参照輝度マッピング関数F_L、及び、最終ディスプレイ適合輝度マッピング関数FL_DAから得られる、グラフィカルな様式でディスプレイ適合がどのように機能するかを示す図であり、参照輝度マッピング関数F_Lは、2つの参照画像間の輝度再グレーディングのニーズを体系化し、最終ディスプレイ適合輝度マッピング関数FL_DAは、特定のディスプレイ能力(PL_D)のための、入力画像の最適のディスプレイ適合されたバージョンを計算するために使用される。
【
図5】本実施形態及び請求項の公式化において、それを構成要素としてより容易に理解するために、ディスプレイ適合の原理をより一般的に集約する図である。
【
図6】本洞察による、ディスプレイ適合のフレームワークにおける、さらなる再グレーディング実現可能事項をどのように簡潔に公式化し得るかを概略的に示す図である。
【
図7】本手法の、構築が現実的に容易である例示的な実施形態を、特にブースト決定回路(700)を概略的に示す図である。
【
図8】
図7のユニットにおける使用のための可能な変換関数の有用な変形例を示す図である。
【
図9】
図7のユニットにおける使用のための可能な変換関数の有用な変形例を示す図である。
【
図10】ブースタ強度値(BO)のより好適な値を作り出すための非対称の一時フィルタの一例を示す図である。
【発明を実施するための形態】
【0094】
図7は、現在の手法の十分に機能する実施形態と、ブースト決定回路700との態様を説明する。複雑な画像解析は、例えば、より安価な携帯電話内で行われるとき、より単純なICにおいては高価である。さらに、しばしば、画像は非常に複雑であるので、最初の洞察は比較的取得するのが容易であるが、画像に関するより詳細な洞察は、画像の知識がより深くなる前に、指数関数的により多くの解析計算を必要とする。尚、最終の比色定量変換を行う直前に、処理中の現在の画像に対して計算が行われるのが理想的であることに留意されたい。何故ならそのとき、必要となるのは、単なる1画像時間の遅延(すなわち、例えば、1秒の1/50)のみだからである。
【0095】
ICが、典型的には、行うことができることは、画像のヒストグラムを決定することである。例えば、128のビンのヒストグラムが1024のルマレベルで計算される場合、人は、およそ10ルマ単位の精度で、画像内のピクセルの量のカウントを有する。そのようなヒストグラムから、既に、多くの興味深い画像情報が、十分に機能するアルゴリズムを作成するために取得され得る。伝送された受信画像(Im_Comm)は、ビデオ創作側で作り出されたので、ダウングレーディング関数F_LによるマスタHDR自体であるこが、制限のない現在の説明で想定される。
【0096】
ICは、例えば、入力画像の固有のコーディングに対して、すなわち、入力画像がデコーダに一緒に入るコーディングに対して第1のヒストグラム計算ユニット720で第1のヒストグラム計算を行うと想定される(当業者は、他の様式でヒストグラムをどのように取得するのかについて理解できるので、意図的な限定をせずにこの解説を教示する)。これがPQルマドメインヒストグラムであると想定しよう。実際、我々は、ディスプレイ適合されたルマ(現在の改善を含まない、FL_DAによる参照ディスプレイ適合)のヒストグラムを有する必要がある。何故なら、それは、まだ完全に所望通りでないとしても、特定のディスプレイに対して最適化された画像であるので、それは、何に(半)自動改善が必要なのかを理解するために測定されることになるからである。このヒストグラム(hist)は、第2のヒストグラム計算ユニット721によって決定されることになる。このユニットは、実際には、ディスプレイ適合を全画像に適用してヒストグラムを計算する必要がない。それは、単に、関数FL_DAを、第1のヒストグラム計算ユニット720から得られたヒストグラム(hi)に適用し得る。当業者は、第1のドメイン、例えば、輝度ドメイン、又は、何らかのEOTFに従って規定された任意のルマドメインにおけるヒストグラムから第2のドメインにおけるヒストグラムがどのように導出され得るかについて理解する。例えば、最初にPQルマを、SMPTE2084の知覚量子化器EOTF EOTF_PQを適用することによって、正規化された輝度に変換することができ、その後、関数FL_DAを適用する。次いで、カウントは、異なるヒストグラムビンに移動することになる。好ましい実施形態では、我々の輝度表現は、したがってヒストグラムhisは、決定されるべき画像の最大をPL_V_inの値として用いて、すなわち、画像がディスプレイ適合された、例えば700nit又は1500nitなどであるはずであるMDRディスプレイのPL_D_MDRの値として用いて、上記の等式3に従って心理視覚的に均一化されたルマドメインにおいて表現されることとなる。
【0097】
ブライトニングプロモータユニット701は、ヒストグラムの何らかの平均値に基づいて、画像の明度の大きさ(AB)を算出する(平均計算回路705内で)。様々な同等の計算があり得るが、今は、それは、実践ではうまく機能する、知覚的に均一化されたルマドメインにおけるヒストグラムの平均であると想定される。
【0098】
この値は、強度値に変換され、強度値は理想的には0と1との間で正規化される。
【0099】
読者は、
図6を注視することによってこれがどのように機能するか参照し得る。教示されたように、HDR画像入力から始まる所望の様子にグレードインし、メトリック上で、0と1との間で必要とされる任意の程度までダウングレーディングされ得(読者は、例えば、受信されたSDR画像から始まるアップグレーディングが、斜線より下の凹曲線などで、他の方向にあるにもかかわらず同様に機能することを理解する)、1は最も極端な他の参照グレーディング(例えば、SDRグレーディング)を取得するための最高の再グレーディングである。ここで、さらに、必要とされたものより大きいものにグレードインするために、このメトリックが継続され得る。これは、理論的には、ビデオクリエータの最適なグレーディングではないが、例えば、ディスプレイ製造者が所望する有用なグレーディングのうちの少し多くを適用しており、少なくとも、この規定されたグレーディングに従うものである。進歩した実施形態はさらに、入力輝度レンジの一部のみにわたって、クリエータの参照再グレーディングを修正し得、例えば、下半分は、それのみが明るくなって、概ね同じまま又は変動がより少ないままとどまる上半分と調和するが、説明のためにより単純な実施形態にこだわる。
【0100】
したがって、メトリックをいくらか延長する(過度ではない、さもなければ、グレーディングが過度に歪む。しかし、最大値は、コーディングフレームワークの開発者によって実現され得る)ことによってこの追加の技術的オプションは数学的に公式化され得る。2.0のブースタ強度値(BO)である最大メトリック位置に進み得ると想定しよう。
【0101】
この値を、例えば、ディスプレイの製造者が、カスタマイズできる設定として印付けするのが有利である。適切な等式は、ブースト決定回路700から発生することになる好ましくはゼロと1との間にある相対的な増強値(RB)である値に対して固定された乗数を使用すべきである。
したがって、BO=mf*RB、但し1<mf<=VAL_Ph、[等式5]
VAL_PHは、例えば本出願者によって決定された最大値、例えば2.0である。
【0102】
したがって、読者は、あらかじめ選択されたディスプレイ適合アルゴリズムを適用するために、ここでは外側の1.0であるメトリック位置を用いて、メトリック位置が決定される必要があることを理解するが、この値は現在の画像の特性に基づいて、自動的に(又は、採用者、例えば携帯電話製造者が、例えばmfのようないくつかの制御パラメータを設定し得るという意味において、半自動的に)適切に決定されるべきである。
【0103】
これにより、画像ごとにもビデオ全てにおいても、いかなる望ましくない画像もアーチファクトももたらされるべきではない。
【0104】
平均的な明度の大きさABをプラスの強度値に変換するために、第1のコンバータユニット706が好適な変換関数を適用する。
【0105】
この関数は、HDRハンドリングフレームワーク全体の開発者、すなわち、例えば、本特許出願者によって設計されるが、彼は、少数の制御パラメータにより、特定のディスプレイ製造者が、彼ら自身の好みに合わせて微調整をできるようにしておく。
【0106】
この関数は、いつ人が再グレーディングを増強する、又は増強せずに、そうであったままにする(すなわち、F_ALT_BがFL_DAにとどまる)ように欲するかに関する要求と、どの強度に対して特定の画像が、自動アルゴリズムに従って強化されるべきかとを集約する。
【0107】
図8は、そのような第1の変換関数の有用な実施形態を示す。MxPUは、大きな画像セットにわたってあらかじめ規定された、それを越えて、ディスプレイ適合再グレーディングのブースティング(すなわち、ブースティングFL_DAがF_ALT_Bになる)が行われない典型的な値である。例えば、上位の10個のヒストグラムビン内に全てのピクセルがある場合、人は既にそのような明るい画像を有するので、ブースティングがほとんど意味をなさない。実際、
図8の実用的な例では、人は、既に制御ポイント2(Cp2)より上のブースティングを促すのを止める。これらの制御ポイントは(さらに第1の制御ポイントCp1も)、ディスプレイ製造者が、固定ブースタアルゴリズムの挙動を調整できるようにドラッグされ得るが、設計者は、それらを、例えば、Cp1に対してMxPUの25%、及びCp2に対して75%にプリセットする。したがって、ヒストグラムhistの平均値が実際に低い(第1の値ABV1より低い)場合、人は、最大ブースティングを行うように所望することとなり、すなわち、ディスプレイ製造者がmfを2に等しく設定している場合、1である値RBがブースト決定回路700から出力され、値BO=2が、ディスプレイ適合アルゴリズムで使用されて、F_ALT_Bを計算する。画像が既に少し、より明るい場合、人は、より小さいダウングレーディングを使用したがり、すなわち、ABV1より高く、第2の値ABV2まで、ブースティングの強度は下がることになるか、又は、(プラスの/促進する)第1の強度値(PosB)の正確な値になるようになる。
【0108】
それが、アルゴリズム(それはブースティングをオーバープロモートする)がこのように最適でない理由である。
【0109】
したがって、ブースト決定回路700は、ブースト低減決定回路710を含む。このユニットは、より明るい領域のレンダリングを保護する。
【0110】
それが最初にヒストグラムの大きさをさらに、第2の測定ユニット711において計算する。
【0111】
このユニットは、いくつかの(構成された)スーパービンを、すなわち、ヒストグラムhistのビンの集合を作成する。
【0112】
それは、例えば、2つのビン、ピクセルの上位1%及び上位5%を作成する。
【0113】
又は、それは、算出されたヒストグラムhistの上位2つのビンを上位スーパービンにグルーピングし、例えば、それより下位の4つのビンを第2のスーパービンにグルーピングするなど、する。
【0114】
例えば、4つのスーパービンの使用は、十分に機能する。
【0115】
次いで、適切に設定された係数を含むカウンティング等式が計算される。
【0116】
結果DBEは合計{ci*SB_i} [等式6]に等しい。
SB_iは、少なくとも2つのスーパービンのうちのスーパービンiに入るピクセルのカウントであり、ciは対応する係数である。係数は、例えば、最も明るいピクセルが画像に何らかのきらめき、例えば金属反射を与えるだけである、又は、例えば、人が、スポーツコンテンツ向けに、より強力であるが、比色定量的により正確でないレンダリングを欲する、例えば非常に暗い画像が予想される場合に、多少、まさしく最も明るいピクセルであると評価する値に設定され得る(したがって、平均的にはっきりと見える結果を与えるために、一般に、パラメータが一旦設定されることになるとはいえ、パラメータは、画像のタイプ、視聴されるテレビチャネル、専門家対消費者コンテンツなどのさらなる側面に対して変動され得る)。典型的には、最も高いスーパービンのためのci値は、ゼロに設定されることになり、それより下位の1つ又は複数のスーパービン内の画像コンテンツを測定し、次いで、最も高いスーパービンのサイズが、ピクセルのうちの最も明るい1%のピクセルを含むように設定される。等式にはクリッピングが存在するので、極端な値は0にクリップ留めされて、低減効果がなく、又は1、若しくはより正確には-1にクリップ留めされて、強力な低減となる。さらなる非線形性が、例えば、DBE=1の場合に存在し得、高い促進PosBの場合でもブーストはないことになるが、より単純な減算的なカウンティングが説明される。
【0117】
この値は、第2の変換ユニット712内で、例えば、
図9に示されるような変換関数を介して(マイナスの/低減する)第2の強度値(NegB)に変換される。異なる形状を調整するために、さらなる制御ポイント、第3の制御ポイントCp3、4番目の制御ポイントCp4があり得るが、例では、どのように、増加するDBE値が、増加する正規化されたNegB値に転換するかが示される。最後に、減算器730によってPosBからNegBが減じられて、使用されるべき、最終的な相対ブースト値RBが得られる。典型的には、アルゴリズムは、マイナスの値をゼロにクリップ留めすると決定し、ブーストがないか、又は1.0のメトリック位置になる。
【0118】
我々はビデオ処理を取り扱っているので、これまでのブースト値の値、又は1つ若しくは複数のこれまでのブースト値との差分に基づいて、相対的なブースト値をフィルタリングするために、一時フィルタ740を追加するのが有利である。そのとき、視覚的アーチファクトにつながり得る、一時的に連続したビデオ画像のブースト間のずれはそれほど大きくないことになる。このフィルタは、
図10に示されるように、必要とされる相対的ブーストの増加対減少を考慮して、典型的には非対称な性質を有することになる。
【0119】
以下のタイプの例示的なフィルタリングが説明のために使用される(当業者は、同等のフィルタが使用され得ることを理解する)。
【0120】
これまでの相対的ブースト値RB_tp(又は、いくつかの重み付けされたこれまでの相対的ブースト値RB_tpとの組み合わせ)との差分が算出される。
DEL_RB=DV-RB_tp;
保持されている重み(Blnd)が算出される。
Blnd=FF(DEL_PB)、但し、FFはフィルタリング関数形状である。
出力相対ブースト値が
RB=(1-Blnd)*DV+Blnd*RB_tp [等式7]
として算出される。
【0121】
本テキストで開示されたアルゴリズムの構成要素は、(完全に若しくは部分的に)実際にはハードウェア(例えば、用途特有のICの一部)として、又は専用のデジタル信号プロセッサ若しくは汎用プロセッサなどの上で動作しているソフトウェアとして実現される。
【0122】
当業者にとって、どの構成要素が、任意選択の改善であるのか、及び他の構成要素との組み合わせで実現され得るか、並びに、どのように、方法の(任意選択の)ステップが、それぞれの装置手段に対応するのかについて、並びに逆もまた同様であることが、我々のプレゼンテーションから理解可能であるはずである。本適用例における「装置」という単語は、その最も広い意味で使用され、すなわち、特定の目的の実現を可能にする手段のグループであり、したがって、例えば、IC(の小さな回路部分)若しくは、専用器械(ディスプレイを含む器械など)、又はネットワーク化されたシステムの一部などであり得る。「構成体」もまた、最も広い意味で使用されるように意図されており、したがって、それは、とりわけ単一の装置、装置の一部、協働装置(の一部)の集合を含む。
【0123】
コンピュータプログラム製品の明示的意味は、(中間言語及び最終的なプロセッサ言語への翻訳など、中間的な変換ステップを含む)一連のローディングステップの後、汎用又は専用プロセッサが、コマンドをプロセッサの中に入れること、及び発明の特徴的な機能のいずれかを実行することをできるようにするコマンドの集合の任意の物理的実現を包含すると理解されるべきである。特に、コンピュータプログラム製品は、例えば、ディスク若しくはテープなどの担体上のデータ、メモリ内に存在するデータ、ワイヤード若しくはワイヤレスネットワーク接続を介して移動するデータ、又は紙の上のプログラムコードとして実現される。プログラムコードは別にして、プログラムに必要とされる特徴的なデータもまた、コンピュータプログラム製品として具現化される。
【0124】
方法の運用に必要とされるステップのうちの、データ入力ステップ及びデータ出力ステップなどのいくつかは、コンピュータプログラム製品に記述される代わりに、プロセッサの機能内に既に存在する。
【0125】
上述の実施形態が本発明を限定するものではなく、むしろ例示していることに留意すべきである。当業者であれば、提示された例の、請求項の他の領域へのマッピングを容易に実現することができ、簡潔のために、全てのそれらのオプションに深く言及しなかった。特許請求の範囲内での組み合わせのような、本発明の要素の組み合わせは別にして、要素の他の組み合わせが可能である。要素の任意の組み合わせが、単一の専用要素において実現され得る。
【0126】
請求項における括弧間の任意の参照符号は、特許請求の範囲を限定することを意図するものではない。「備える」という単語は、請求項内に列挙されていない要素又は態様の存在を排除するものではない。単数形の要素は、複数のそのような要素の存在を排除するものではない。
【国際調査報告】