(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5747136
(24)【登録日】2015年5月15日
(45)【発行日】2015年7月8日
(54)【発明の名称】HDR画像のための画像処理
(51)【国際特許分類】
H04N 1/41 20060101AFI20150618BHJP
G06T 5/00 20060101ALI20150618BHJP
H04N 19/85 20140101ALI20150618BHJP
H04N 19/30 20140101ALI20150618BHJP
【FI】
H04N1/41 B
G06T5/00 700
H04N19/85
H04N19/30
【請求項の数】83
【全頁数】40
(21)【出願番号】特願2014-547579(P2014-547579)
(86)(22)【出願日】2013年7月31日
(65)【公表番号】特表2015-508589(P2015-508589A)
(43)【公表日】2015年3月19日
(86)【国際出願番号】US2013053036
(87)【国際公開番号】WO2014025588
(87)【国際公開日】20140213
【審査請求日】2014年6月11日
(31)【優先権主張番号】61/681,061
(32)【優先日】2012年8月8日
(33)【優先権主張国】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】シャフ,アンクール
(72)【発明者】
【氏名】ニナン,アジット
(72)【発明者】
【氏名】ジア,ウエンヒュイ
(72)【発明者】
【氏名】トング,ヒュイミング
(72)【発明者】
【氏名】ヤング,チアオリ
(72)【発明者】
【氏名】テン,アルカディ
(72)【発明者】
【氏名】ワング,ガヴェン
【審査官】
山内 裕史
(56)【参考文献】
【文献】
特開2009−200743(JP,A)
【文献】
特開2011−010108(JP,A)
【文献】
特開2012−029029(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/41
G06T 5/00
H04N 19/30
H04N 19/85
(57)【特許請求の範囲】
【請求項1】
集積回路(IC)デバイスによりHDR画像を符号化する方法であって、
前記HDR画像における対数ルミナンスピクセル値のヒストグラムを計算するステップと、
前記ヒストグラムに基づきトーンマッピングされた曲線を生成するステップと、
前記HDR画像における対数ルミナンスピクセル値と前記トーンマッピングされた曲線とに基づき、対数グローバルトーンマッピングされたルミナンス画像を計算するステップと、
前記対数グローバルトーンマッピングされたルミナンス画像に基づきダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像を計算するステップと、
前記HDR画像における対数ルミナンスピクセル値と前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像とに基づき対数レシオ画像を計算するステップと、
対数マルチスケールレシオ画像を生成するため、前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップと、
前記対数マルチスケールレシオ画像と前記HDR画像における対数ルミナンスピクセル値とに基づき第2対数トーンマッピングされた画像を生成するステップと、
前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像と前記第2対数トーンマッピングされた画像とに基づき出力トーンマッピングされた画像を生成するため、前記第2対数トーンマッピングされた画像を正規化するステップと、
前記入力HDR画像と前記出力トーンマッピングされた画像とに基づき第2レシオ画像を生成するステップと、
量子化された第2レシオ画像を生成するため、前記第2レシオ画像を量子化するステップと、
を有する方法。
【請求項2】
前記量子化された第2レシオ画像と前記出力トーンマッピングされた画像とは、JPEG−HDR画像を生成するため、エンコーダに提供される、請求項1記載の方法。
【請求項3】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングすることを含む、請求項1記載の方法。
【請求項4】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングすることを含む、請求項3記載の方法。
【請求項5】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングすることを含む、請求項4記載の方法。
【請求項6】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第3レベル重み付けされた対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項5記載の方法。
【請求項7】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項6記載の方法。
【請求項8】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算することを含む、請求項7記載の方法。
【請求項9】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項8記載の方法。
【請求項10】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算することを含む、請求項9記載の方法。
【請求項11】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングすることを含む、請求項10記載の方法。
【請求項12】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算することを含む、請求項11記載の方法。
【請求項13】
前記入力対数レシオ画像を係数Nによりダウンスケーリングすることは、前記係数Nにより前記対数画像の水平方向のピクセル解像度と垂直方向のピクセル解像度とを低減することを含む、請求項3記載の方法。
【請求項14】
前記正の整数は8に等しい、請求項3記載の方法。
【請求項15】
前記ダウンスケーリングステップのそれぞれの出力をローパスフィルタリングするステップを更に有する、請求項3記載の方法。
【請求項16】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、
第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングするステップと、
第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングするステップと、
第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングするステップと、
第3レベル重み付け対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングするステップと、
第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングするステップと、
第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算するステップと、
第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングするステップと、
第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算するステップと、
ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングするステップと、
前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算するステップと、
を有する、請求項1記載の方法。
【請求項17】
前記ダウンスケーリングするステップのそれぞれの出力をローパスフィルタリングするステップを更に有する、請求項16記載の方法。
【請求項18】
前記計算されたヒストグラムを正規化するステップを更に有する、請求項1記載の方法。
【請求項19】
前記ヒストグラムの正規化は、CLAHE(Contrast Limited Adaptive Histogram Equalization)を含む、請求項18記載の方法。
【請求項20】
前記ヒストグラムの正規化は、HCTN(Histogram CLAHE Tone−map Normalization)を含む、請求項19記載の方法。
【請求項21】
半導体ダイと、
前記半導体ダイに配置され、トーンマッピング手段を有するよう構造的に構成され、設定され、又はプログラムされるアクティブデバイスのアレイであって、前記トーンマッピング手段は、
入力HDR(High Dynamic Range)画像における対数ルミナンスピクセル値のヒストグラムを計算し、
前記ヒストグラムに基づきトーンマッピングされた曲線を生成し、
前記HDR画像における対数ルミナンスピクセル値と前記トーンマッピングされた曲線とに基づき、対数グローバルトーンマッピングされたルミナンス画像を計算し、
前記対数グローバルトーンマッピングされたルミナンス画像に基づきダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像を計算し、
前記HDR画像における対数ルミナンスピクセル値と前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像とに基づき対数レシオ画像を計算する、
よう機能する、アクティブデバイスのアレイと、
対数マルチスケールレシオ画像を生成するため、前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行し、
前記対数マルチスケールレシオ画像と前記HDR画像における対数ルミナンスピクセル値とに基づき第2対数トーンマッピングされた画像を生成し、
前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像と前記第2対数トーンマッピングされた画像とに基づき出力トーンマッピングされた画像を生成するため、前記第2対数トーンマッピングされた画像を正規化し、
前記入力HDR画像と前記出力トーンマッピングされた画像とに基づき第2レシオ画像を生成する、
よう機能するマルチスケールフィルタと、
量子化された第2レシオ画像を生成するため、前記第2レシオ画像を量子化する量子化手段と、
を有する集積回路(IC)デバイス。
【請求項22】
前記量子化された第2レシオ画像と前記出力トーンマッピングされた画像とは、JPEG−HDR画像を生成するため、エンコーダに提供される、請求項21記載のICデバイス。
【請求項23】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングすることを含む、請求項21記載のICデバイス。
【請求項24】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングすることを含む、請求項23記載のICデバイス。
【請求項25】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングすることを含む、請求項24記載のICデバイス。
【請求項26】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第3レベル重み付けされた対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項25記載のICデバイス。
【請求項27】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項26記載のICデバイス。
【請求項28】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算することを含む、請求項27記載のICデバイス。
【請求項29】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項28記載のICデバイス。
【請求項30】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算することを含む、請求項29記載のICデバイス。
【請求項31】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングすることを含む、請求項30記載のICデバイス。
【請求項32】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算することを含む、請求項31記載のICデバイス。
【請求項33】
前記入力対数レシオ画像を係数Nによりダウンスケーリングすることは、前記係数Nにより前記対数画像の水平方向のピクセル解像度と垂直方向のピクセル解像度とを低減することを含む、請求項23記載のICデバイス。
【請求項34】
前記正の整数は8に等しい、請求項23記載のICデバイス。
【請求項35】
前記ダウンスケーリングステップのそれぞれの出力をローパスフィルタリングすることを更に有する、請求項32記載のICデバイス。
【請求項36】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行することは更に、
第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングし、
第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングし、
第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングし、
第3レベル重み付け対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングし、
第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングし、
第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算し、
第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングし、
第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算し、
ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングし、
前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算する、
ことを有する、請求項21記載のICデバイス。
【請求項37】
前記ダウンスケーリングするステップのそれぞれの出力をローパスフィルタリングすることを更に有する、請求項36記載のICデバイス。
【請求項38】
前記計算されたヒストグラムを正規化することを更に有する、請求項21記載のICデバイス。
【請求項39】
前記ヒストグラムの正規化は、CLAHE(Contrast Limited Adaptive Histogram Equalization)、又はHCTN(Histogram CLAHE Tone−map Normalization)の1以上を含む、請求項38記載のICデバイス。
【請求項40】
当該ICデバイスは、
マイクロプロセッサ、
ASIC(Application Specific IC)、
デジタル信号プロセッサ(DSP)、
プログラマブルロジックデバイス(PLD)、
FPGA(Field Programmable Gate Array)、
マイクロコントローラ、
システム・オン・チップ(SOC)、
グラフィックプロセッサ、又は
カメラ制御IC、
の1以上を含む、請求項21記載のICデバイス。
【請求項41】
符号化された命令を格納する非一時的なプロセッサ可読記憶媒体であって、前記命令は、プロセッサ上で実行されると、HDR(High Dynamic Range)画像を符号化するための処理を実行又は制御するよう前記プロセッサを制御、プログラム又は構成し、
前記処理は、
前記HDR画像における対数ルミナンスピクセル値のヒストグラムを計算するステップと、
前記ヒストグラムに基づきトーンマッピングされた曲線を生成するステップと、
前記HDR画像における対数ルミナンスピクセル値と前記トーンマッピングされた曲線とに基づき、対数グローバルトーンマッピングされたルミナンス画像を計算するステップと、
前記対数グローバルトーンマッピングされたルミナンス画像に基づきダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像を計算するステップと、
前記HDR画像における対数ルミナンスピクセル値と前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像とに基づき対数レシオ画像を計算するステップと、
対数マルチスケールレシオ画像を生成するため、前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップと、
前記対数マルチスケールレシオ画像と前記HDR画像における対数ルミナンスピクセル値とに基づき第2対数トーンマッピングされた画像を生成するステップと、
前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像と前記第2対数トーンマッピングされた画像とに基づき出力トーンマッピングされた画像を生成するため、前記第2対数トーンマッピングされた画像を正規化するステップと、
前記入力HDR画像と前記出力トーンマッピングされた画像とに基づき第2レシオ画像を生成するステップと、
量子化された第2レシオ画像を生成するため、前記第2レシオ画像を量子化するステップと、
を有する記憶媒体。
【請求項42】
前記量子化された第2レシオ画像と前記出力トーンマッピングされた画像とは、JPEG−HDR画像を生成するため、エンコーダに提供される、請求項41記載の記憶媒体。
【請求項43】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングすることを含む、請求項41記載の記憶媒体。
【請求項44】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングすることを含む、請求項43記載の記憶媒体。
【請求項45】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングすることを含む、請求項44記載の記憶媒体。
【請求項46】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第3レベル重み付けされた対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項45記載の記憶媒体。
【請求項47】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項46記載の記憶媒体。
【請求項48】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算することを含む、請求項47記載の記憶媒体。
【請求項49】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングすることを含む、請求項48記載の記憶媒体。
【請求項50】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算することを含む、請求項49記載の記憶媒体。
【請求項51】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングすることを含む、請求項50記載の記憶媒体。
【請求項52】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算することを含む、請求項51記載の記憶媒体。
【請求項53】
前記入力対数レシオ画像を係数Nによりダウンスケーリングすることは、前記係数Nにより前記対数画像の水平方向のピクセル解像度と垂直方向のピクセル解像度とを低減することを含む、請求項43記載の記憶媒体。
【請求項54】
前記正の整数は8に等しい、請求項43記載の記憶媒体。
【請求項55】
前記ダウンスケーリングステップのそれぞれの出力をローパスフィルタリングするステップを更に有する、請求項52記載の記憶媒体。
【請求項56】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行するステップは更に、
第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングするステップと、
第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングするステップと、
第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングするステップと、
第3レベル重み付け対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングするステップと、
第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングするステップと、
第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算するステップと、
第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングするステップと、
第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算するステップと、
ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングするステップと、
前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算するステップと、
を有する、請求項41記載の記憶媒体。
【請求項57】
前記ダウンスケーリングするステップのそれぞれの出力をローパスフィルタリングするステップを更に有する、請求項56記載の記憶媒体。
【請求項58】
前記計算されたヒストグラムを正規化するステップを更に有する、請求項41記載の記憶媒体。
【請求項59】
前記ヒストグラムの正規化は、CLAHE(Contrast Limited Adaptive Histogram Equalization)を含む、請求項58記載の記憶媒体。
【請求項60】
前記ヒストグラムの正規化は、HCTN(Histogram CLAHE Tone−map Normalization)を含む、請求項59記載の記憶媒体。
【請求項61】
HDR画像を符号化するシステムであって、
前記HDR画像における対数ルミナンスピクセル値のヒストグラムを計算する手段と、
前記ヒストグラムに基づきトーンマッピングされた曲線を生成する手段と、
前記HDR画像における対数ルミナンスピクセル値と前記トーンマッピングされた曲線とに基づき、対数グローバルトーンマッピングされたルミナンス画像を計算する手段と、
前記対数グローバルトーンマッピングされたルミナンス画像に基づきダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像を計算する手段と、
前記HDR画像における対数ルミナンスピクセル値と前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像とに基づき対数レシオ画像を計算する手段と、
対数マルチスケールレシオ画像を生成するため、前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段と、
前記対数マルチスケールレシオ画像と前記HDR画像における対数ルミナンスピクセル値とに基づき第2対数トーンマッピングされた画像を生成する手段と、
前記ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像と前記第2対数トーンマッピングされた画像とに基づき出力トーンマッピングされた画像を生成するため、前記第2対数トーンマッピングされた画像を正規化する手段と、
前記入力HDR画像と前記出力トーンマッピングされた画像とに基づき第2レシオ画像を生成する手段と、
量子化された第2レシオ画像を生成するため、前記第2レシオ画像を量子化する手段と、
を有するシステム。
【請求項62】
前記量子化された第2レシオ画像と前記出力トーンマッピングされた画像とは、JPEG−HDR画像を生成するため、エンコーダに提供される、請求項61記載のシステム。
【請求項63】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングする手段を含む、請求項61記載のシステム。
【請求項64】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングする手段を含む、請求項63記載のシステム。
【請求項65】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングする手段を含む、請求項64記載のシステム。
【請求項66】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第3レベル重み付けされた対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングする手段を含む、請求項65記載のシステム。
【請求項67】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングする手段を含む、請求項66記載のシステム。
【請求項68】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算する手段を含む、請求項67記載のシステム。
【請求項69】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングする手段を含む、請求項68記載のシステム。
【請求項70】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算する手段を含む、請求項69記載のシステム。
【請求項71】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングする手段を含む、請求項70記載のシステム。
【請求項72】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算する手段を含む、請求項71記載のシステム。
【請求項73】
前記入力対数レシオ画像を係数Nによりダウンスケーリングする手段は、前記係数Nにより前記対数画像の水平方向のピクセル解像度と垂直方向のピクセル解像度とを低減する手段を含む、請求項61記載のシステム。
【請求項74】
前記正の整数は8に等しい、請求項73記載のシステム。
【請求項75】
前記ダウンスケーリング手段のそれぞれの出力をローパスフィルタリングする手段を更に有する、請求項73記載のシステム。
【請求項76】
前記対数レシオ画像についてマルチスケール解像度フィルタリングを実行する手段は更に、
第1レベルダウンスケーリングされた対数レシオ画像を生成するため、係数N(Nは正の整数)により前記対数レシオ画像をダウンスケーリングする手段と、
第2レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第1レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングする手段と、
第3レベルダウンスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルダウンスケーリングされた対数レシオ画像をダウンスケーリングする手段と、
第3レベル重み付け対数レシオ画像を生成するため、第3レベルスケール係数により前記第3レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングする手段と、
第2レベル重み付けされた対数レシオ画像を生成するため、第2レベルスケール係数により前記第2レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングする手段と、
第2レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第3レベル重み付けされた対数レシオ画像をアップスケーリングし、前記第2レベル重み付けされた対数レシオ画像を加算する手段と、
第1レベル重み付けされた対数レシオ画像を生成するため、第1レベルスケール係数により前記第1レベルダウンスケーリングされた対数レシオ画像のピクセル値をスケーリングする手段と、
第1レベルアップスケーリングされた対数レシオ画像を生成するため、前記係数Nにより前記第2レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記第1レベル重み付けされた対数レシオ画像を加算する手段と、
ゼロレベル重み付けされた対数レシオ画像を生成するため、ゼロレベルスケール係数により前記対数レシオ画像のピクセル値をスケーリングする手段と、
前記対数マルチスケールレシオ画像を生成するため、前記係数Nにより前記第1レベルアップスケーリングされた対数レシオ画像をアップスケーリングし、前記ゼロレベル重み付けされた対数レシオ画像を加算する手段と、
を有する、請求項61記載のシステム。
【請求項77】
前記ダウンスケーリングする手段のそれぞれの出力をローパスフィルタリングする手段を更に有する、請求項76記載のシステム。
【請求項78】
前記計算されたヒストグラムを正規化する手段を更に有する、請求項61記載のシステム。
【請求項79】
前記ヒストグラムの正規化手段は、CLAHE(Contrast Limited Adaptive Histogram Equalization)を実行する手段を含む、請求項78記載のシステム。
【請求項80】
前記ヒストグラムの正規化手段は、HCTN(Histogram CLAHE Tone−map Normalization)を実行する手段を含む、請求項79記載のシステム。
【請求項81】
当該システムは、集積回路(IC)デバイスに配置される、請求項61記載のシステム。
【請求項82】
当該ICデバイスが配置されたシステムは、システム・オン・チップ(SOC)からなる、請求項81記載のシステム。
【請求項83】
前記ICデバイスは、
マイクロプロセッサ、
ASIC(Application Specific IC)、
デジタル信号プロセッサ(DSP)、
プログラマブルロジックデバイス(PLD)、
FPGA(Field Programmable Gate Array)、
マイクロコントローラ、
システム・オン・チップ(SOC)、
グラフィックプロセッサ、又は
カメラ制御IC、
の1以上を含む、請求項81記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、参照することによりその全体がここに援用される、2012年8月8日に出願された米国仮特許出願第61/681,061号に対する優先権を主張する。
【0002】
本発明は、一般に画像処理に関する。より詳細には、本発明の実施例は、ハイダイナミックレンジ(HDR)を有する画像のための画像処理に関する。
【背景技術】
【0003】
現在又は従来のデジタル画像は、24ビットフォーマットに従う。これらの画像は、画像の各ピクセルについてルミナンス及びクロミナンスデータなどのカラーと輝度情報との双方を格納するため24ビットと同程度のビットを有する。このようなフォーマットは、従来の電子ディスプレイにより画像がレンダリング又は再生されることを可能にするのに十分な画像情報を保持し、出力参照規格であると考えられる。従来のディスプレイは、典型的には、3桁のダイナミックレンジ(DR)を有する。通常の肉眼は1:10,000までの又はそれ以上のコントラスト比を識別できるが、有意に高いダイナミックレンジを有する画像が知覚される可能性がある。
【0004】
現在の電子ディスプレイ技術の発展は、より高いダイナミックレンジによる画像レンダリング及び再生を可能にし、これは、従来のディスプレイのDRを大きく超過する。ハイダイナミックレンジ(HDR)画像は、出力参照規格に準拠した画像フォーマットより忠実に実世界のシーンを表現する。従って、HDR画像は、シーン参照(scene referred)とみなされるかもしれない。HDR画像とこれをレンダリング可能なディスプレイとに関して、より限定的なDRの従来画像及び他の画像及びディスプレイは、ここではローダイナミックレンジ(LDR)画像/ディスプレイと呼ばれる。
【0005】
本セクションにおいて説明されるアプローチは、追求可能なアプローチであるが、以前に想到又は追求されたアプローチである必要はない。従って、特段の断りがない場合、本セクションにおいて説明されるアプローチの何れも単に本セクションに含まれることによって従来技術として認められることが想定されるべきでない。同様に、1以上のアプローチに関して特定される問題は、特段の断りがない場合、本セクションに基づき従来技術において認識された者であると想定されるべきでない。
【図面の簡単な説明】
【0006】
本発明が、添付した図面により限定することなく具体例により説明され、同様の参照番号は同様の要素を参照する。
【
図1A】
図1Aは、本発明の実施例による一例となるローカルマルチスケールトーンマッピングシステムを示す。
【
図1B】
図1Bは、本発明の実施例による一例となる画像符号化処理を示す。
【
図2】
図2は、本発明の実施例による一例となるローカルマルチスケール画像処理方法を示す。
【
図3A】
図3Aは、本発明の実施例による一例となるHCTNブロックを示す。
【
図3B】
図3Bは、本発明の実施例による一例となる対応するマルチスケールフィルタリングを示す。
【
図4A】
図4Aは、本発明の実施例による一例となるマルチスケールフィルタブロックを示す。
【
図4B】
図4Bは、本発明の実施例による一例となる対応する一例となるマルチスケールフィルタリング実現形態を示す。
【
図4C】
図4Cは、本発明の実施例による一例となる方法を示す。
【
図5】
図5は、本発明の実施例による一例となるレシオ画像プロセッサを示す。
【
図6A】
図6Aは、本発明の実施例によるHDR画像のための一例となる符号化処理データフローを示す。
【
図6B】
図6Bは、本発明の実施例によるHDR画像のための一例となる符号化処理データフローを示す。
【
図7】
図7は、本発明の実施例によるHDR画像を表示するためのフュージョン・マージエクスポージャ処理を示す。
【
図8A】
図8Aは、本発明の実施例による広範な色域と複数のカラー空間とをサポートする一例となるJPEG−HDR符号化復号化処理を示す。
【
図8B】
図8Bは、本発明の実施例による広範な色域と複数のカラー空間とをサポートする一例となるJPEG−HDR符号化復号化処理を示す。
【発明を実施するための形態】
【0007】
HDR画像の画像処理に関する実施例がここで説明される。以下の説明では、説明のため、多数の具体的な詳細が本発明の完全な理解を提供するため与えられる。しかしながら、本発明がこれらの具体的な詳細なしに実現可能であることは明らかであろう。他の例では、本発明の態様を不必要に閉塞、曖昧又は難解にすることを回避するため、周知の構成及び装置は網羅的に詳細には説明されない。
[概略−HDR画像]
本概略は、発明の実施例のいくつかの態様の基本的説明を提供する。本概略は可能な実施例の態様の広範な又は網羅的なサマリでないことに留意すべきである。さらに、本概略は可能な実施例の特に重要な態様又は要素を特定するものとして理解されることを意図しておらず、一般に特定の可能な実施例又は本発明の範囲を限定するものとして理解されることを意図していないことに留意すべきである。本概略は、単に凝縮された簡略されたフォーマットによる可能な実施例に関連するいくつかのコンセプトしか提供せず、以下の実施例のより詳細な説明に対する単なる概念的な準備として理解されるべきである。
【0008】
本発明の実施例は、HDR画像の符号化に関する。HDR入力画像におけるログルミナンスは、ロググローバルトーンマッピングされたルミナンス画像が計算されると共に、トーンマップを生成するようヒストグラム化される。ロググローバルトーンマッピングされたルミナンス画像がダウンスケーリングされる。ログルミナンス及びロググローバルトーンマッピングされたルミナンス画像は、ログレシオ画像を生成する。ログレシオ画像をフィルタリングするマルチスケール解像度は、ログマルチスケールレシオ画像を生成する。ログマルチスケールレシオ画像及びログルミナンスは、第2ログトーンマッピングされた画像を生成し、ダウンスケーリングされたロググローバルトーンマッピングされたルミナンス画像及び正規化された画像に基づきトーンマッピングされた画像を出力するよう正規化される。HDR入力画像及び出力されるトーンマッピングされた画像は、量子化される第2レシオ画像を生成する。
【0009】
アクティブデバイス(トランジスタなど)のアレイが、半導体ダイに配置される。アクティブデバイスは、画像エンコーダとして機能するよう構成又は動作相互接続される。エンコーダは、HDR(High Dynamic Range)入力画像の各ピクセルから導出される複数のログルミナンス値をヒストグラム化するための第1トーンマッパを有する。第1トーンマッピング手段は、第1レシオ画像をダウンスケーリングし、それの各ピクセルを水平方向及び垂直方向に再帰的にローパス処理する。第1レシオ画像のサイズに依存して、第1レシオ画像は1、2又は3つのレベルに対して破棄及びフィルタリングされる。従って、対応するレシオ画像は、各レベルにおいてレンダリングされる。対応するレシオ画像のそれぞれは、ICデバイスから独立した(例えば、外部の)ストレージ(メモリなど)に書き込まれる。各レベルにおけるアンプは、デシメータが機能する各レベルに対応するスケーリングファクタにより対応するレシオ画像のそれぞれのフィルタリングされたピクセルを重み付けする。バイリニア補間手段は、前のレベルのそれぞれに次に後続するレベルに重み付けされた各レシオ画像をアップスケーリングする。各レベルにおける加算手段は、重み付けされたレシオ画像のそれぞれを次の前のレベルからの重み付けされたレシオ画像と加算する。第2トーンマッピング手段は、ベース画像とそれのトーンマッピングされたレシオ画像とをマッピングし、そのそれぞれはより低いダイナミックレンジの入力HDR画像に対応する。ベース画像とそれのベースレシオ画像とは量子化される。量子化されたベース画像とベースレシオ画像とは、JPEGフォーマットによる圧縮用のJPEGエンコーダなどに出力されてもよい。
【0010】
いくつかの現在の電子ディスプレイは、従来のディスプレイのDR能力を超える本質的にシーン参照されるHDR画像をレンダリングする。ディスプレイのDR能力に関して、“レンダリング”、“再生”、“復元”、“提示”、“生成”、“回復”及び“生成”という用語は、ここでは同義的及び/又は互換的に利用されてもよい。本発明の実施例は、従来のディスプレイと共に現在のディスプレイにより効果的に機能する。実施例は、対応可能な現在のディスプレイが実質的にそのフルコントラスト比及び後方互換性によちHDR画像をレンダリングすることを可能にし、従来及びLDRディスプレイデバイスが自らのより限定的なDR再生能力の範囲内で画像をレンダリングすることを可能にする。実施例は、LDRディスプレイと新たなHDRディスプレイ技術とに対するこのような後方互換性をサポートする。
【0011】
実施例は、画像に関する付加的な情報を提供する符号化されたメタデータと共に、トーンマッピングされたベース画像(画像の対応するHDRインスタンスより低いDRを有する画像のインスタンスなど)により本質的にHDR画像を表現する。付加的な情報は、画像強度関連(ルミナンス、ルマなど)データ及び/又はカラー関連(クロミナンス、クロマなど)データを有する。付加的データは、HDR画像インスタンスと対応するベース画像インスタンスとの間のDRの差分に関する。従って、相対的に限定的なDR再生能力を有する第1(例えば、従来の)ディスプレイは、トーンマッピングされた画像を利用して、既存の、確立された又は一般的な画像圧縮/解凍(codec)規格などに従って通常のDR画像を提示してもよい。
【0012】
実施例は、通常のDR画像が、ここに完全に提供されるかのように、全ての目的のためその全体が参照することにより援用されるthe Joint Photographic Experts Group of the International Telecommunication Union and the International Electrotechnical Commission,JPEG ISO/IEC10918−1 ITU−T Rec.T.81のJPEG規格に従って処理されることを可能にする。さらに、第2(例えば、現在の)HDR対応可能なディスプレイは、HDR画像を効果的に提示するための画像メタデータと共に、トーンマッピングされた画像を処理してもよい。一方では、トーンマッピングされた画像は、従来のディスプレイに通常のダイナミックレンジ画像を提示するのに利用される。他方、付加的なメタデータは、HDR画像を生成、復元又は提示するため、トーンマッピングされた画像と共に利用されてもよい(例えば、HDRディスプレイなどにより)。実施例は、トーンマッピングオペレータ(TMO)を用いて、HDR画像に基づきトーンマッピングされた画像インスタンスを生成する。
【0013】
Reinhardグローバルフォトグラフィックオペレータなどの各種TMOが、トーンマッピングされた画像を相対的に効率的に生成するのに利用されてもよい。計算コストが無関係、利用可能又は無視できる場合、バイラテラルフィルタが、相対的に高品質のトーンマッピングされた画像を生成するのに利用されてもよい。バイラテラルフィルタリングは、典型的にはより計算効率的なReinhardtオペレータが失う可能性のある明るいエリアなどの画像詳細を保存することに役立つ。さらに又は代わりに、ヒストグラム調整オペレータTMO及び/又は勾配ドメインオペレータTMOが利用されてもよい。
【0014】
実施例では、画像フォーマットは、非HDR画像と共に、HDR画像を良好かつ効率的にレンダリングする。実施例は、JPEGフォーマット及び/又は他の各種画像フォーマットと共に機能してもよい。例えば、実施例は、画像関連の分野において当業者が精通するMPEG、AVI、TIFF、BMP、GIF又は他の適切なフォーマットの1以上により機能するものであってもよい。実施例はJPEG−HDR画像フォーマットに従って機能し、それは、ここに完全に提供されたかのように、全ての目的のため参照することによりその全体が援用される、Ward,Greg and Simmons,Maryanne,“Subband Encoding of High Dynamic Range Imagery”,in First ACM Symposium on Applied Perception in Graphics and Visualization(APGV),pp.83−90(2004);Ward,Greg and Simmons,Maryanne,“JPEG−HDR:Backwards−Compatible,High Dynamic Range Extension to JPEG”,in Proceedings of the Thirteenth Color Imaging Conference,pp.283−290(2005);and E.Reinhard,G.Ward,et al.High Dynamic Range Imaging−Acquisition,Display and Image−Based Lighting,pp.105−108,Elsevier,MA(2010)に説明される。
【0015】
広範な画像レンダリング装置上に画像を表示するため、トーンマッピングオペレータ(TMO)は、入力HDR画像をトーンマッピング(TM)されたベース画像に処理する。TMベース画像は、入力画像に対するカラー変化(例えば、色相変化、カラークリッピング、芸術的様相など)を含むものであってもよい。いくつかの技術の下、TMベース画像は、入力HDR画像に等しいHDR画像を再構成するためのルミナンスレシオと共にダウンストリーム画像デコーダに提供される。しかしながら、ダウンストリーム画像デコーダは、TMベース画像及びグレイスケールルミナンスレシオに依拠して、再構成されたHDR画像におけるカラー変化を削除することができないであろう。この結果、カラー変化は、再構成されたHDR画像において顕著なままである。
【0016】
ここに説明される実施例のHDR画像エンコーダは、入力HDR画像及びTMベース画像に基づきルミナンスレシオだけでなくカラー残差値もまた生成する。ルミナンスレシオ及びカラー残差値は、HDR再構成データとして総称されてもよい。任意的に及び/又はさらに、ルミナンスレシオは、相対的に広範なルミナンス値をサポートするため、対数領域に変換される。任意的に及び/又はさらに、結果としての対数ルミナンスレシオ及びカラー残差値は量子化される。任意的に及び/又はさらに、量子化された対数レシオ及びカラー残差値は、残差画像に格納される。量子化された対数レシオ及びカラー残差値、又はいくつかの実施例では残差画像は、TMベース画像と共にダウンストリーム画像デコーダに提供される。任意的に及び/又はさらに、量子化された対数レシオ及びカラー残差値(レンジリミットなど)に関連するパラメータがまた、TMベース画像と共に提供される。
【0017】
ここに説明される実施例のTMOは、低い(黒の)又は高い(白の)ルミナンスレベルを有する個々のピクセルについてカラーチャネルにおいてカラークリッピングを自由に実行してもよい。また、ここに説明されるTMOは、各ピクセルにおける色相を維持することを要求されない。ここに説明される技術の下、ユーザは、画像コンテンツ(例えば、人間の姿、屋内画像、屋外シーン、夜間のビュー、日没など)又はアプリケーション(例えば、映画、ポスター、ウェディング写真、雑誌などにおいて使用される)に基づきTMOを自由に選択する。カラークリッピング又は変更は、画像の芸術的様相を作成するのに慎重かつ自由に利用されてもよい。HDR画像エンコーダ及びデコーダは、広範な可能なカラー変化を導入しうる異なるタイプの編集ソフトウェア及びカメラメーカーにより実行されるTMOをサポートする。ここに説明された技術の下、HDRエンコーダは、カラー残差値をHDRデコーダに提供する。次に、HDRデコーダは、カラー変更が再構成されたHDR画像に存在することを防ぐ(又は最小化)するため、カラー残差値を利用する。
【0018】
実施例は、ビットストリーム及び/又は画像ファイルを利用して、TMベース画像及びそれらの各自の対応するHDR再構成データを格納し、復号化及び/又はレンダリングのためダウンストリーム画像ビューワ又はデコーダに提供してもよい。実施例では、画像フォーマットは、各種編集ソフトウェアアプリケーション及び/又はカメラメーカーにより実装されうるTMOをサポートする。実施例は、例えば、標準的なJPEG画像フォーマットと、JPEG−HDRなどの拡張、エンハンス又は改良されたJPEG関連フォーマットを含む各種画像フォーマットにより機能してもよい。さらに、あるいは又は任意的に、実施例は、JPEG関連画像フォーマットと共に利用されてもよいものに関連して、1以上の実質的な態様、属性、オブジェクト、符号化仕様又はパフォーマンスパラメータが変更されるコーデック/規格に基づく又は一緒に利用される画像フォーマットを利用してもよい。実施例は、JPEG−HDR画像フォーマットを利用して、ルミナンスレシオ及びカラー残差値と共にTMベース画像の格納をサポートする。さらに、任意的に又はあるいは、画像ファイルに格納されているTMベース画像と残差画像との1以上が圧縮されてもよい。実施例では、画像データ圧縮が、JPEG規格に従って実行される。さらに、あるいは又は任意的には、実施例は、JPEG関連画像フォーマットにより利用可能なものに関連して、1以上の実質的な態様、属性、オブジェクト、符号化仕様又はパフォーマンスパラメータが変更される規格に従って圧縮を実行してもよい。
【0019】
JPEGフォーマットがLDR画像に限定されるとき、JPEG−HDRは、JPEGフォーマットに対する実質的に後方互換的なHDRの拡張を有する。JPEG−HDRは、新たなHDRディスプレイデバイス上へのHDR画像レンダリングと、HDR又は非HDRディスプレイデバイス上への非HDR(LDRなど)画像レンダリングとを同時にサポートする。JPEG−HDRは、JPEGにおいて規定されるような標準的な位置にトーンマッピングされた画像を格納し、非HDRディスプレイデバイスにより無視されうる新たな位置に付加的なメタデータを格納する。付加的なメタデータは、オリジナルHDR画像のHDRバージョンを生成/復元するため、トーンマッピングされた画像と共に利用されてもよい。
【0020】
実施例では、JPEG HDRエンコーダは、集積回路(IC)デバイスにより実現又は配置される。実施例では、ここに説明されるデバイス、回路及び/又は機構は、カメラや他の画像レンダリング及びレンダリング又はディスプレイシステム、セルラ無線電話、PDA(Personal Digital Assistant)、パーソナル、ポータブル若しくはコンシューマ電子デバイス(例えば、写真、計算、映画、音楽、情報、娯楽、音声用など)におけるコンポーネントから構成される。
【0021】
実施例は、そのコピーがAnnex Aとして(出願された)本明細書に付属され、全ての目的のためにここに援用される、Wenhui Jia,et alにより特許協力条約に従って2012年4月16日に出願された特許出願番号PCT/US2012/033795“ENCODING,DECODING,AND REPRESENTING HIGH DYNAMIC RANGE IMAGES、又はDolby Laboratoriesによる明細書”JPEG−HDR Encoder and Decoder Algorithm Specification“に記載されるような1以上の機能を実行してもよい。
【0022】
実施例は、参照することにより全ての目的のためにその全体がここに援用される、Gregory John WardによるPCTに従って2012年3月1日に出願された特許出願番号PCT/US2012/027267号“LOCAL MULTI−SCALE TONE MAPPING OPERATOR”に記載されるような1以上の機能を実行してもよい。
【0023】
ここに記載される好適な実施例と汎用的な原理及び特徴とに対する各種変更は、当業者に容易に明らかであろう。従って、本開示は、図示された実施例に限定されることを意図としておらず、ここに記載された原理及び特徴に整合した最も広範な範囲が与えられるべきである。
[一例となるJPEG HDRエンコーダ]
実施例では、JPEG HDRエンコーダは、通常はチップとして参照されるIC(Integrated Circuit)デバイスにより実現される。例えば、エンコーダは、ICデバイス内に配置されてもよい。ICデバイスは、ASIC(Application Specific IC)デバイス、デジタル信号プロセッサ(DSP)、FPGA(Field Programmable Gate Array)及び/又はグラフィックプロセッサとして実現されてもよい。ICデバイスは、マイクロプロセッサ、プログラマブルロジックデバイス(PLD)、FPGA又はマイクロコントローラなどの1以上の設定可能又はプログラム可能なデバイス又はASICを備えたシステム・オン・チップ(SOC)として実現されてもよい。
【0024】
ICデバイスは、半導体ダイ内に配置されるトランジスタなどのアクティブデバイスコンポーネントのアレイを有する。アクティブデバイスコンポーネントは、モジュール、レジスタ、キャッシュ、ロジックゲート、ロジック及び計算(算術/浮動小数点など)ユニットとして機能するか、又はJPEG HDR符号化に整合しうる他の処理を実行するようアレイ化、構成、設定及び/又はプログラムされる。アレイのアクティブコンポーネントは、アクティブデバイスコンポーネントとそれと共に形成される各種機能モジュールとの間の信号及びデータの電気的/電子的やりとりを可能にするためダイ内に配置されるトレース/ビアのネットワーク、アドレス/ワードラインの格子などの少なくとも部分的に導電性のルーティングファブリックにより相互接続される。アクティブコンポーネントは、ICデバイスの外部の信号、データ及び電源との電気的、電子的及び/又は通信接続を可能にする少なくとも部分的に導電性のインタフェースにより動作的にアドレス指定可能である(ルーティングファブリックのノード又は一部などを介し)。
【0025】
JPEG HDRエンコーダの実施例が、ASICにより実現されるものとしてここでは説明される。簡単化のため、ここで説明されるASICの実装はまた、設定可能及びプログラム可能なICの実装を表す。
図1Aは、本発明の実施例による一例となるJPEG HDRエンコーダ10を示す。
【0026】
エンコーダ10は、ASICにより実現される。エンコーダ10は、アドバンストハイパフォーマンスバス(AHB)インタフェースを介し入力画像を受信する。プレトーンマッピングPre_TMは、入力画像データをトーンマッピングに有用なフォーマットに変換する。PRE_TMは、4:2:2クロマサンプリングフォーマットから4:4:4フォーマットなどへのクロマアップサンプリングを実行する。PRE_TMは、画像入力のカラー空間(YCbCrなど)をRGBなどの三刺激カラー空間に変換する。Pre_TMは、RGB変換された画像に対してリバース(インバース)ガンマ(γ)訂正を実行する。
【0027】
エンコーダ10は、入力HDR画像からトーンマッピングされたベース画像を生成するトーンマッピング機能を実行する。エンコーダ10は、以下のテーブル1に示される一例となる入力フォーマットなどの各種フォーマットにより入力されるHDR画像を処理するよう実現されてもよい。
【0028】
【表1】
トーンマッピング機能は、contrast−limited adaptive histogram equalization(CLAHE)を利用して、入力HDR画像に対してトーンマップ正規化機能を実行するhistogram adjusted multi−scale tone mapping operator(HAMS−TMO)を有する。正規化機能は、入力画像に対するhistogram CLAHE tone map normalization(HCTN)により実現されてもよい。HAMS−TMO HCTNは、12ビットリニアRGBフォーマットにより正規化されたトーンマッピングされたベース画像を出力する。HAMS−TMO HCTNの実施例が以下に説明される(
図2及び3)。レシオ画像プロセッサRI_Procは、正規化されたトーンマッピングされたベース画像から1以上のレシオ画像を計算及び処理してもよい。
【0029】
HAMS−TMO HCTN処理によって、ポストトーンマッピングPost_TMは、正規化された12ビットRGB画像に対してガンマ訂正を復元し、これにより8ビットRBG画像を生成する。Post_TMは、トーンマッピングされたベース画像を圧縮用にJPEGエンコーダに送信する。Post_TMは、ガンマ再訂正された8ビット画像のRGBカラー空間をJPEG互換的なカラーフォーマットによるYCbCr画像(4:2:2又は4:2:0など)に変換する。例えば、Post_TMOは、ガンマ符号化(典型的には、ユーザにより規定されたルックアップテーブルを介し12ビットRGB入力が8ビット入力に変換される場合)、RGBからYCbCrカラー変換(3×3カラーマトリックス変換などを介し)、及びクロマカラー平面の適切なサブサンプリングを介した4:4:4から4:2:2又は4:2:0への変換を含むものであってもよい。エンコーダ10は、複数のポストトーンマッピングモジュールPost_TMサブブロックを有してもよい。例えば、エンコーダ10は、3つのPost_TMサブブロックにより実現されてもよい。
【0030】
図1Bは、本発明の実施例による一例となる画像符号化処理100を示す。実施例では、エンコーダ10は、入力HDR画像を受信又はアクセスすると、処理100に関して説明されたように機能する。ステップ101において、HDR入力画像のピクセルの対数(ログ)ルミナンス値に基づきヒストグラムが計算される。ステップ102において、トーンマップ曲線が計算されたヒストグラムに基づき生成される。ステップ103において、対数グローバルトーンマッピングされたルミナンス画像が、入力HDR画像の対数ルミナンスピクセル値及びトーンマップ曲線に基づき計算される。
【0031】
ステップ104において、対数グローバルトーンマッピングされたルミナンス画像は、ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像を計算するためダウンサンプリングされる(例えば、垂直方向及び水平方向に間引かれるなど)。ステップ105において、HDR入力画像のダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像及び対数ルミナンスピクセル値に基づき、対数レシオ画像が計算される。ステップ106において、マルチスケールフィルタリングが、対数マルチスケールレシオ画像を生成するため、対数レシオ画像に対して実行される。ステップ107において、第2対数トーンマッピングされた画像が、HDR入力画像の対数マルチスケールレシオ画像及び対数ルミナンスピクセル値に基づき生成される。
【0032】
ステップ108において、第2対数トーンマッピングされた画像は、ピクセル強度値のレンジを変更し、コントラスト伸張を実現するため正規化される。出力されたトーンマッピングされた画像が、それとダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像とに基づき生成される。ステップ109において、第2レシオ画像が、出力されるトーンマッピングされた画像及び入力HDR画像に基づき生成される。ステップ110において、第2レシオ画像が量子化される。ステップ111において、出力されるトーンマッピングされた画像及び量子化された第2レシオがJPEGエンコーダに出力される。一例となる処理100の各ステップにおいて、生成されたグローバルトーンマッピングされた画像及びレシオ画像が、エンコーダ10のインタフェースなどを介し外部メモリに対して読み書きされる。
【0033】
図2は、本発明の実施例による一例となるヒストグラム調整マルチスケールトーンマッピング手段200を示す。実施例は、ヒストグラム調整マルチスケールトーンマッピング手段200は、上述されたようなHAMS−TMO HCTN機能を実現する(
図1)。HAMS−TMO200は、三刺激(RGBなど)又は他の(YCbCrなど)カラー空間によるHDR画像を受信する。ルミナンスモジュール(201)は、入力HDR RGB画像に対して16ビットルミナンス値Yを計算する。対数ルミナンスモジュールLOG(202)は、ルミナンス値Yをリニアドメインから対数ドメインに変換する。LOGモジュール202は、ルミナンス値Yのベース2の対数“logY”への変換を実現する。
【0034】
16ビットリニアルミナンス値を変換すると、LOGモジュールは、結果としてのベース2の対数(log
2)値であるlogYをQ4.12データとして保存する(例えば、想定バイナリポイント前の4ビットとその後の12ビットなど)。例えば、対数は整数コンポーネントと小数コンポーネントとを有する。従って、実施例は、ベース2の対数log
2Yを実現するため、整数logYコンポーネントと小数logYコンポーネントを分離する。整数部分は、正規化における左シフト数に従って計算され、小数の8ビットは、以下のテーブル2の一例となる擬似コードに示されるように、ルックアップテーブルLUTにインデックス化される。
【0035】
【表2】
512個のビンを有するヒストグラムHIST(203)は、小数logYコンポーネントから構成される。小数ログルミナンス値は、16ビット整数値として扱われる。従って、ビン間のインターバルは、65536/512=128からなる。その後、HAMS−TMO200は、ヒストグラムに対してCLAHE調整を実行する。ダイナミックレンジは、例えば、以下のテーブル3Aに示される一例となる擬似コードなどに従ってヒストグラムから計算される。
【0036】
【表3A】
出力ダイナミックレンジ(ODR)は、5のベース2の値に変換される自然対数(ベースe)対数ドメインにおいてデフォルト値3.5により設定可能である。ヒストグラムクリッピングファクタ“cf”は、例えば、
cf=((odr*(bmax−bmin+1))<<12)/(drin)
などにより計算され、ヒストグラムは、以下のテーブル3Bに示される擬似コードなどに従って複数の繰り返しにより調整されてもよい。
【0037】
【表3B】
累積ヒストグラムは、調整されたヒストグラムから計算され、例えば、以下のテーブル3Cに示される擬似コードなどに従ってQ4.12データフォーマットの12ビット対数ドメインにマッピングされる。
【0038】
【表3C】
このようなCLAHEヒストグラム等価は、logY画像のグローバルトーンマッピングオペレータとして実現されるマッピング曲線を生成する。マッピング極性は512個のビンを有するため、リニア補間が、例えば、以下のテーブル3Dに示される擬似コードなどに従って512個のビンのそれぞれのルミナンス値に対して計算される。
【0039】
【表3D】
CLAHEマッピング出力は、Q4.12フォーマットのlogY画像(204)を有する。実施例では、HAMS−TMO200は、ヒストグラムCLAHE(contrast−limited adaptive histogram equalization)トーンマップ正規化機能を実行するブロックにより実現される。
【0040】
図3A及び3Bはそれぞれ、本発明の実施例による一例となるヒストグラムCLAHEトーンマップ正規化(HCTN)ブロック30と、対応する一例となるHCTN処理300のフローとを示す。HCTNブロック30は、2500万以上のピクセルの画像をサポートするよう実現されてもよい。三刺激値(RGBなど)又は他の(YCbCrなど)カラー空間による入力画像を受信すると、HCTN30は、それのルミナンス値Yを計算する(処理ステップ301)。ステップ302において、Y値は、HCTNブロック30に返される対応する対数値logYの計算用の共有ロジックに出力される。ステップ303において、logY値に基づきヒストグラムが計算され、テーブル“ht0”に格納される。全ての入力画像ピクセルを計数すると、CLAHEが、ステップ304において、ht0ヒストグラム値を正規化するため計算される。
【0041】
全ての入力画像ピクセルを計数すると、CLAHEが、ステップ304において、ht0ヒストグラム値を正規化するため計算される。ステップ305において、バッファされるlogY値が補間され、対数トーンマッピングされた画像logYtmが生成される。例えば、トーンマッピング曲線は、ヒストグラムの512個のビンに対して実現される。従って、リニア補間が、logYtmを実現するため、512個のビンのそれぞれにおけるルミナンス値に対して計算される。ステップ306において、対数レシオ画像logRIが、logRI=logYtm−logYの対数ドメインに対して実行される減算関数によりlogY値及びlogYtm画像から計算される。ステップ307において、logYヒストグラムがクリッピングされる。ステップ308において、マルチスケールフィルタリング後、トーンマッピングされたlogY値が、リニアルミナンス値Y’に正規化される。ステップ309において、任意的な曲線関数が、最終的なトーンマッピングされた画像を出力するため、リニアトーンマッピングされたY’値に対して適用されてもよい。
【0042】
図4A、4B及び4Cはそれぞれ、本発明の実施例による一例となるマルチスケールフィルタ(MSF)ブロック4000、対応する一例となるマルチスケールフィルタリング実現形態及び一例となる処理400を示す。HCTNブロック30(
図3A)と同様に、MSF4000は、2500万以上のピクセルの画像をサポートするよう実現されてもよい。MSF4000は、それの水平方向のサイズと垂直方向のサイズとに対して予め計算された係数(8など)によって入力対数レシオ画像IBIを間引きする。MSF4000は、7つなどの複数のタップに対して間引きされた画像を有する各ピクセルをローパスフィルタリングする。ローパスダウンスケーリングされた画像は、以前にダウンスケーリングされた予め計算された同一の係数などによって、以降にアップスケーリングされてもよい。
【0043】
MSF4000は、msn=floor(log
8min(width,height))+1=floor(log
2min(width,height)/3)+1の一例となる実現式に従って、入力におけるそれのオリジナルのサイズに基づき入力画像がスケーリングされるステージ数msnを予め計算する。MSF4000は、各サイズにおいてトータルで64の4つのステージのそれぞれに対して水平方向のサイズと垂直方向のサイズとに対して、8までの係数により入力対数レシオ画像IBIを間引きするよう実現されてもよい。
【0044】
従って、実施例では、
図4Bに示されるように、フィルタリング実現形態は4つのステージ40、41、42、43を有する。ステージ40〜43のそれぞれは、画像サイズが8
2=64の係数により低減され、MSF4000が64のトータルの係数により画像を間引きするように、8の係数によって垂直方向及び水平方向に画像を間引く。従って、各ステージにおいて、対数レシオ画像が8の係数によりダウンスケーリングされる。8の係数によるダウンスケーリングは、以下のテーブル4に示される擬似コードなどに従ってmsnレベル(ステージなど)のそれぞれにおいて繰り返される。
【0045】
【表4】
各ステージにおいて、7タップローパスフィルタリングが、間引きされた画像の各ピクセルに対して実行されてもよい。間引きされた各画像が第1空間方向に対応する水平方向においてまずフィルタリングされ、その後に、第1方向に関して空間的に垂直な垂直方向にフィルタリングされる実施例が実現される。各種のスケーリング画像が、ミラー拡張などのパディングなどによって、それらの境界において揃えられる。
【0046】
アンプは、各ステージにおいて加重係数“Alpha”をレシオ画像に適用する。ステージkのそれぞれについて(kはゼロからmsn−1までの整数(k=0,1,...,msn−1))、実施例は、A
k=2*(k+1)/(msn(msn+1))に従って加重係数Alpha(A)を計算する。当該ウェイトの合計は1である。加重係数が2*(msn−(k−1)+1)/msn*(msn+1)又は1/msnとして計算される実施例が実現されてもよい。
【0047】
アップスケーリングが、ダウンスケーリングされたフィルタリングされたレシオ画像に対して(msn−1)回実行される。重み付けされた対数レシオ画像が、各ステージにおいてアップスケーリングされた画像に加えられる。実施例は、例えば、画像の空間的なコーナーにおける4つのポイントなどを利用して前のステージの低解像度画像の補間(バイリニア補間など)と、アップサンプリングされたブロックを構成するため、それの水平方向のサイズ及び垂直方向のサイズに対する補間とによるアップスケーリングを実現する。
【0048】
ステージ401は、入力画像R
0をダウンスケーリング及びフィルタリングし、第1レシオ画像R
1をステージ402にわたす。同様に、ステージ402及びステージ403〜407のそれぞれは、各自の前のステージのそれぞれによりわたされたレシオ画像の順序的に以降のダウンスケーリングされたローパスレシオ画像を各自の次のステージにわたす。各ステージからの重み付けされたレシオ画像は、次のステージからのアップスケーリングされた画像との和がとられる。
【0049】
MSF4000は、レジスタインタフェースを介しオフボードメモリにコンフィギュレーションレジスタにより書き込まれるトーンマッピングされたルマ、ルミナンス又は他の強度関連のトーンマッピングされた値を生成する。
【0050】
実施例では、MSF4000及び/又は実現形態400は、一例となるマルチスケール解像度フィルタリング処理400の1以上のステップに従って機能する。一例となる処理400は
図4B及び
図4Cに示されるフローチャートを参照して後述される。処理400は、レベル41、42及び43のそれぞれに対して画像をプログレッシブにダウンスケーリングすることによって、対数レシオ画像R
0(
図1Bのステップ105において生成される)の処理を開始する。ダウンスケーリングの各レベルにおいて、画像は垂直方向及び水平方向においてプログレッシブに間引きされる。
【0051】
ステップ401において、対数レシオ画像R
0は、Nの係数によって垂直方向及び水平方向にダウンスケーリングされる。ここで、Nは8などの正の整数からなる。第1レベルダウンスケーリングされた対数レシオ画像R
1が生成される。第1レベルダウンスケーリングされた対数レシオ画像R
1は、その後、第2レベルダウンスケーリングされた対数レシオ画像R
2を生成するため、ステップ402において、係数Nにより間引きされる。第2レベルダウンスケーリングされた対数レシオ画像R
2は、その後に第3レベルダウンスケーリングされた対数レシオ画像R
3を生成するため、ステップ403において係数Nにより間引きされる。実施例では、各レベルのダウンスケーリングされた画像出力がローパスされる。実施例では、全てのレベルが利用される必要はない。
【0052】
ステップ404において、第3レベルダウンスケーリングされた対数レシオ画像R
3のピクセル値が、第3レベルの重み付けされたレシオ画像R
3’を生成するため、第3レベルスケール係数(Alpha[3]など)によりスケーリングされる。ステップ405において、第2レベルダウンスケーリングされた対数レシオ画像R
2のピクセル値は、第2レベルスケーリングされた重み付けされたレシオ画像R
2’を生成するため、第2レベルスケール係数(Alpha[2]など)によりスケーリングされる。ステップ406において、第3レベル重み付けされたレシオ画像R
3’が係数Nによりアップスケーリングされ、第2レベルアップスケーリングされた対数レシオ画像
【数1】
を生成するため、第2レベルスケーリングされた重み付けされたレシオ画像R
2’との和がとられる。
【0053】
ステップ407において、第1レベルダウンスケーリングされたレシオ画像R
1’が、第1レベル重み付けされた対数レシオ画像R
1’を生成するため、第1レベルスケール係数(Alpha[1]など)によりスケーリングされる。ステップ408において、第2レベルアップスケーリングされた対数レシオ画像
【数2】
が係数Nによりアップスケーリングされ、第1レベルアップスケーリングされた対数レシオ画像
【数3】
を生成するため、第2レベルスケーリングされた重み付けされたレシオ画像R
2’と和がとられる。ステップ409において、対数レシオ画像R
0は、ゼロレベル重み付けされた対数レシオ画像R
0’を生成するため、ゼロレベルスケーリング係数(Alpha[0]など)によりスケーリングされる。ステップ410において、第1レベルアップスケーリングされた対数レシオ画像
【数4】
が、係数Nによりアップスケーリングされ、対数マルチスケールレシオ画像
【数5】
を生成するため、ゼロレベルスケーリングされた重み付けされたレシオ画像R
0’との和がとられる。一例となる処理400のステップは任意的であってもよい。
【0054】
図5は、本発明の実施例による一例となるレシオ画像プロセッサ500を示す。実施例は、レシオ画像プロセッサ500によりRI_Proc(
図1)を実現する。レシオ画像プロセッサ500は、TMO200(
図2)から入力画像を受信する。ルミナンスレシオが、オリジナルのHDR入力画像からのルミナンス値Yと、トーンマッピングされた画像からのルミナンス値とから計算される。最大値及び最小値がピクチャ全体に対して計算され、対数ルミナンス値logY及び差分画像のCbCrクロミナンス値DiffCbCrを量子化するのに利用される。
【0055】
logY及びDiffCbCr値は、Advanced Microcontroller Bus Architecture Advanced eXtensible Interface(AXI)インタフェース又は同様に対応可能なインタフェースなどを介し外部メモリに保存/書き込まれる。外部に保存/格納された値は、タイムリに量子化するためAXIを介しリード/ロードされる。リアにフィードバックシフトレジスタ(LFSR)は、量子化中にlogYチャネルによりディザリングのため乱数値を生成する。RI_Proc500は、量子化されたDiffCbCr及びlogY値をJPEGエンコーダに出力し、JPEGエンコーダは、入力画像に対応するJPEGフォーマットにより画像を出力する。
【0056】
図6A及び6Bはそれぞれ、本発明の実施例による一例となる符号化処理60及びそれの一例となるデータフロータイムラインを示す。HDR入力ピクチャを受信すると(61)、ステップ62において、ヒストグラム及びダウンスケーリングされたLogY画像LogY1が生成される。ヒストグラムは正規化される。フロー600において、JPEG−HDRエンコーダ(
図1のエンコーダ100など)コアは、HDR入力画像全体を読み込む。エンコーダは、入力画像ピクセルのLogY値に基づきヒストグラムを生成し、ヒストグラムを等化し、LogY1をダウンスケーリングされた画像バッファBuff_Log1に書き込む。実施例では、ヒストグラムは、CLAHEを用いて等化される。
【0057】
ステップ63において、トーンマッピングにおいて利用される実際のピクセル単位のスケーリング係数を生成するマルチスケールフィルタリングが実行される。ステップ64において、ピクセル単位のスケーリング係数が各ピクセルに対して適用される。トーンマッピングされたベース画像は、8ビットガンマ符号化されたYCbCr4:2:2/4:2:0/4:4:4に変換され、外部メモリに圧縮されたベース画像を書き込むJPEGエンコーダに送信されてもよい。オリジナルのトーンマッピングされたRGBデータは、外部メモリにまた書き込まれる生の予め量子化されたレシオ画像を生成するのに処理される。ステップ65において、生のレシオ画像が外部メモリから読み出され、量子化される。量子化されたレシオ画像は、JPEGエンコーダに出力され(66)、圧縮されてもよい。
[一例となるHDR画像のための重み付けされたマルチリージョンベースエクスポージャ]
スマートフォン、コンピュータモニタなどの従来のローエンドコンシューマディスプレイデバイスは、JPEG−HDR画像のフルダイナミックレンジを表示することができないかもしれない。このような場合、ディスプレイは、典型的には、対応するHDR画像のトーンマッピングされたローダイナミックレンジ(LDR)バージョンを出力する。このトーンマッピングされた画像は、典型的には、ユーザからの入力なくカメラによって自動生成され、撮影者の意図をキャプチャしていない。
【0058】
いくつかの実施例では、ユーザは、タッチ画面、コンピュータマウス、スクロールバーなどのデバイスのユーザインタフェースを利用して、HDRピクチャをスクロールしてもよい。この場合、ユーザは、フルダイナミックレンジにより画像の一部を観察可能であってもよいが、画像の残りは暗すぎるか又は明るすぎて表示される可能性がある。しかしながら、ユーザは、画像の複数の部分の詳細を閲覧することを所望するかもしれない。従って、ユーザが関心領域に基づきHDR画像のエクスポージャを調整することを可能にすることが有用であろう。
【0059】
一実施例では、最終的なHDR画像のエクスポージャは、ユーザにより選択された2以上の関心領域を考慮してもよい。これらの領域は、画像をキャプチャする前(カメラ又は他のキャプチャリング装置などにより)又は画像のキャプチャ後(例えば、対応するLDR画像を表示するときなど)に選択されてもよい。タッチ画面インタフェース(iPhone又はiPadなど)によるいくつかの実施例では、これらの領域は、ユーザによりタッチされる1以上のピクセルを囲むほぼ同一のルミナンスのピクセルを表すものであってもよい。他の実施例では、ユーザは、コンピュータマウス、トラックボール、キーボードなどの他のインタフェースを用いてこれらの領域を選択してもよい。さらなる他の実施例では、これらの領域は、予め選択されたユーザの嗜好(顔、動物、テキストなど)に基づき自動的に選択されてもよい。
【0060】
一実施例では、第1タッチポイントを囲むエリアが、第1最適エクスポージャガンマに設定可能である(18%グレイなど)。次に、第2タッチポイントについて、第2の最適エクスポージャガンマが計算される。最終的な画像は、第1及び第2エクスポージャガンマにより重み付けされた最終的なエクスポージャガンマを用いて表示されてもよい。これは、結果のピクチャの残りを合成しながら、ディスプレイのダイナミックレンジ内に第1及び第2タッチポイントの双方をもたらす。3、4又はN個などの何れかの個数のタッチポイントが特定可能である。重み付け係数は、平均値、中間値、中央値、比例するウェイト、線形、非線型及び/又はキャップされた(最大値/最小値)ものに等しくすることができる。特定の実施例では、当該技術はユーザコマンド(アンドゥボタンなど)により取り消すことができる。
【0061】
図7に示されるように、他の実施例では、結果としてのピクチャがフュージョン・マージ処理を用いて生成可能である。この処理では、選択された各関心ポイントについて(710)、当該処理は、対応するエクスポーズされたLDR画像を生成する(720)。オリジナルのHDR画像から生成されるこのようなN個のエクスポージャ(又はLDR画像)が与えられると、実施例は、N個全てのエクスポージャを単一の出力画像に適切に合成することによって、合成画像を生成してもよい(730)。このような合成処理の一例は、ここに完全に与えられるかのように、参照することにより全体が援用される“Exposure Fusion”,by T.Mertens.et al.,15th Pacific Conference on Computer Graphics and Applications(Pacific Graphics,2007),at pp.382−390に記載される技術を用いて実現されてもよい。
[一例となる適応的レシオ画像量子化]
上述されたように、ルミナンスHDR画像(Y
h)及びそれのトーンマッピングされた表現(Y
t)が与えられると、レシオ画像Y
Rは、
【数6】
として表現されてもよい。レシオ画像のダイナミックレンジは、対数関数や平方根関数などの可逆関数を適用することによって圧縮されてもよい。従って、対数関数が適用される一実施例では、
【数7】
である。
【0062】
対数レシオ画像(log(Y
R))はまた、8ビットレシオ画像を生成するため、さらに量子化されてもよい。
【0063】
【数8】
高精度により表現されたピクセル値又はダイナミックレンジを有するオリジナルレシオ画像では(浮動小数点数などを用いて)、レシオ画像を8ビットピクセル値に量子化することは、逆量子化関数を適用する際に復元不可な丸め誤差を生成する。この誤差は、画像符号化の精度に影響を与え、JPEG−HDRフォーマットを用いて符号化可能な画像のダイナミックレンジを限定するものであってもよい。
【0064】
実施例では、対数関数は、任意の可逆関数Fにより置換される。Fが与えられると、量子化された8ビットレシオ画像は、
【数9】
として表現されてもよい。これは、デコーダが
【数10】
に従ってオリジナルのレシオ画像を復元することを可能にする。ここで、Y
R’は復元されたレシオ画像を示す。実施例では、最大値及び最小値F(Y
R)は、JPEGデコーダによりアクセス可能なメタデータとしてJPEG−HDR画像データに含まれる。
【0065】
実施例では、F関数は、M(Y
R’,Y
R)を最小化するように選択されてもよい。ここで、Mは、平均2乗誤差、SNR(Signal to Noise Ratio)又はPSNR(Peak Signal to Noise Ratio)などのある品質基準に従って、Y
R’とY
Rとの間の差分を測定する指標を示す。M(2つの画像の間のMSEなど)は、Fの最適化処理のための目的関数を表す。Fは、パラメータ関数とすることが可能であり、あるいは、ルックアップテーブル(LUT)を介し定義可能である。Mが与えられると、“A simple method for function minimization”,by J.A Nelder,John and R.Mead,Computer Journal,No.7,pp.308−313,1965に記載されるNelder−Mead法などの周知な最適化技術を適用して、Fを決定してもよい。
【0066】
実施例では、JPEG−HDRヘッダは、逆符号化関数F
−1を表す復号化LUTを含むものであってもよい。準拠するJPEG−HDRデコーダは、LUTを用いて受信したレシオ画像を8ビットデータからより高い精度の(浮動小数点など)Yチャネルデータに変換してもよい。LUTは、8ビットデータを浮動小数点値に直接マッピングする256個のエントリを有してもよい。
[一例となるヒストグラム等化ベース方法]
実施例は、ヒストグラムの等化又はコントラスト限定ヒストグラムの等化がF関数を導出するための処理を提供する点で、計算効率性に関する。ヒストグラムの等化は、任意の分布を有するソースルミナンスを、一様なヒストグラムを有するルミナンスに変換し、これによりレシオ画像がより効率的に符号化される。ヒストグラムの等化を利用する実施例では、Fは後述されるように計算されてもよい。
【0067】
a)Y
Rのヒストグラムhistを計算する。ヒストグラムは、単にピクセル値iがレシオ画像に出現するインスタンス数(hist
iなど)を示す。
【0068】
b)histの累積ヒストグラムc_histを計算する。例えば、累積ヒストグラムは、
【数11】
として計算されてもよい。
【0069】
c)c_histを正規化及びスケーリングすることによってFを決定する。例えば、
【数12】
である。ここで、変数scaleは、255などのFの最大値を決定する。
【0070】
上述されるように計算された符号化関数Fは、無限の微分係数又は傾きを有するエリアを有してもよく、このため、Fは一意的なマッピングを提供せず、逆関数F
−1は存在しない。Fの傾き又は微分係数を制限することは、実施例がFにより提供されるマッピングの一意性及びF
−1の存在を保証することを可能にする。
【0071】
ヒストグラム等化アプローチは、符号化精度をルミナンス値の出現頻度に比例させる。従って、より低い頻度で出現するルミナンス値はより大きな誤差により等化され、頻繁に出現するルミナンス値はより小さな誤差により等化される。
[JPEG−HDRにおける一例となるカスタム色域サポート]
典型的な単一の画像ファイルフォーマットは、ICC(International Color Consortium)又はWCS(Windows Color management System)プロファイルを用いて、レンダリングデバイス(ディスプレイなど)にカラー情報を通信してもよい。ICCプロファイル及びWCSプロファイルは、画像が特定のカラー空間にレンダリングされることを要求する。レンダリングの一部として、ターゲットカラー空間において表現できない全てのカラーは、表現可能なカラーに色域マッピングされるべきである。この色域マッピングの結果として、カラー情報の一部はレンダリングされた画像において消失される可能性がある。
【0072】
例えば、画像はハイエンドで広範な色域のカメラによりキャプチャされてもよく、あるいは、コンピュータグラフィック(CG)ソフトウェアを用いて生成されてもよい。その後、結果として得られる画像は、sRGBカラー空間にレンダリングされてもよい。sRGBカラー空間は最も一般的なカラー空間であり、オペレーティングシステム及びディスプレイデバイスの大部分によりサポートされる。しかしながら、sRGBカラー空間が相対的に小さな色域を有するとき、sRGBによりカバーされない全ての画像カラーは、sRGBカラーにマッピングされる必要がある。sRGB画像がその後にはるかに広範な色域を有する撮像デバイスに送信された場合、オリジナルのより広範な色域マッピングされたカラーを復元するための確実な方法はない。従って、色域マッピングは、非可逆的な情報の消失を生じさせ、サブ最適なカラー再生を生じさせる可能性がある。
【0073】
画像レンダリングの他の態様は、視聴状態の指定に関する。例えば、家庭とオフィスの視聴状態は、典型的には、カラーグレーディング又はカラーマッチング環境に用いられる視聴状態と異なる。ICCワークフローは正確な視聴状態(VC)を指定するため、ワークフローをフレキシブルでないものにする。WCSは、ある程度のVCフレキシビリティを可能にするが、画像がレンダリングされると、変更を逆転させることは実際的に不可能である。
【0074】
色域マッピングとVCとの双方は、画像がどのようにレンダリングされるかに関する仮定に基づきコンテンツ作成者が行うべきレンダリング決定セットを規定する。実生活では、可能性のある全ての利用ケース及び対象となる撮像デバイスと共に、全ての可能性のある目的のための最適なレンダリング決定を行うことは不可能である。
【0075】
実施例では、JPEG−HDRファイルフォーマットは、1つのセットはキャプチャデバイス又はオリジナルのHDRデータに関するものであり、他のセットはカラー化された画像を利用する対象となる従来のワークフローに関するものである2つの別個の色域関連メタデータセットを可能にする。従って、標準的な色域及びダイナミックレンジを有する従来の撮像デバイスは、カラーが正確な画像コンテンツを提供するため、従来のICC及びWCSワークフローに基づくデフォルトのレンダリングされた画像を依然として示すことが可能である。同時に、広範な色域、より高いダイナミックレンジ及び/又はジャストインタイムなレンダリングをサポートするデバイスはまた、視聴状態とデバイス特性との双方を考慮したダイナミックレンダリングのためオリジナルの画像データを復元することが可能であってもよい。例えば、アプリケーションは、オリジナルのシーンデータを復元し、対象となるディスプレイデバイスの特性及び現在の視聴状態に基づきこれをレンダリングする。従って、JPEG−HDRメタデータがより正確かつフレキシブルなジャストインタイムなレンダリングを可能にしながら、ベース画像は、既存のカラー管理ワークフローとの後方互換性を提供する。
【0076】
JPEG−HDR画像は、ベース画像(ベースラインJPEG画像など)とHDRメタデータ(レシオ画像及びカラー残差データなど)とを含む。ベース画像は、トーンマッピング及び色域マッピングされたレンダリングされた画像であり、典型的には、sRGBカラー空間にレンダリングされる。JPEGコンテナは、ベース画像のカラー空間を示すか、又は各種撮像デバイスに関する整合性のあるカラー再生を可能にするICC/WCSカラープロファイルを含むものであってもよい。
【0077】
HDRメタデータはまた、XYZプライマリなどのデバイスから独立した空間か、又は付属の第2のICC/WCSカラープロファイルの何れにカラー空間情報を含めてもよい。HDRメタデータカラー空間は、ベース画像のカラー空間とは異なるものであってもよい。メタデータの色域は、典型的には、ベース画像の色域より大きい。例えば、カメラのメタデータカラー空間は、典型的には、カメラセンサのカラー空間に一致する。CG画像について、メタデータカラー空間は、オリジナル画像に提示される全てのカラーを含むものであってもよい。従って、実施例は、プロファイルなどの2以上のカラー空間記述子を用いて、JPEG−HDRにおける広範な色域のエンハンスされたサポートを提供する。1つのプロファイルはベース画像の符号化カラー空間を規定し、第2プロファイルはHDRメタデータの符号化カラー空間を規定する。
【0078】
図8Aは、実施例によるデュアルカラー空間をサポートする符号化処理を示す。
図8Aに示されるように、カラー空間Bにおいてキャプチャされた入力HDR画像805は、カラー空間Bにおいてトーンマッピングされた画像815を生成するため、TMO処理810によりトーンマッピングされてもよい。画像815は、カラー空間Aにおいてベース画像825を生成するため、色域変換処理820によりさらに処理されてもよい。2つのカラー空間に関する情報を利用して、カラー空間Aからカラー空間Bに画像を変換するためのカラー変換T
ABを生成してもよい。変換T
ABは、カラー空間Bにおいてベース画像845を生成するため、カラー変換ステップ840においてベース画像825に適用されてもよい。
【0079】
オリジナルHDR画像805及びベース画像845を利用して、処理830は、本発明において上述された方法に従ってHDRメタデータ835を生成してもよい。最後に、画像825(カラー空間Aにおける)及びHDRメタデータ835(カラー空間Bにおける)は、JPEG−HDR画像を生成するため、符号化及び合成されてもよい(855)。JPEG−HDR画像855のファイルフォーマットは、2つのカラー空間に適したカラー記述子を含むものであってもよい。いくつかの実施例では、処理ステップ810,820は単一のステップに合成されてもよく、カラー空間BによるHDR画像(805)が与えられると、それはカラー空間Aによりトーンマッピングされた画像を出力する(825)。マトリックスTRC(Tone Reproduction Curve)などの加算的カラー空間を利用することは、色域マッピングとトーンマッピングとの双方がオリジナルなカラー空間(Bなど)において実行可能であるとき、符号化中にステップ810と820とを組み合わせることを可能にする。また、カラー空間の間のカラー変換は、より正確になり、より計算効率的になる。
【0080】
図8Bは、実施例によるデュアル色域をサポートする復号化処理を示す。
図8Bに示されるように、カラー空間Aによるベース画像とカラー空間BによるHDRメタデータとの2つのカラー空間によりデータを規定する入力JPEG−HDR画像が与えられると、ベースデコーダは、カラー空間A(sRGB)によるベース画像865を抽出する。画像865は、標準的なダイナミックレンジによる従来のディスプレイデバイスにベース画像を表示するのに利用されてもよい。
【0081】
2つのカラー空間に関する情報を利用して、カラー空間Aからカラー空間Bに画像を変換するためのカラー変換T
ABを生成してもよい。変換T
ABは、カラー空間Bによるベース画像875を生成するため、カラー変換ステップ870においてベース画像865に適用されてもよい。入力855が与えられると、メタデータ復号化処理890は、カラー空間BによるHDRメタデータ895を抽出する。最後に、HDRデコーダ880は、カラー空間BによるHDR画像885を生成するため、ベース画像875及びメタデータ895を合成してもよい。
【0082】
HDRメタデータが画像の可能性のある全てのカラーを含む広範なカラー空間にある場合、符号化された画像の値は常に正である。正の値は、符号化ステージ及び復号化ステージの間に画像を確認することを可能にする。すなわち、負の値が検出された場合、これらの値はゼロにされ、及び/又はエラーメッセージが発信されてもよい。ここに説明される方法はまた、従来のSDR画像より広範な色域を有する入力された標準的なダイナミックレンジ(SDR)画像の符号化に適用されてもよい。入力されたSDR画像(805など)について、TMO処理ステップ(810)は省略されてもよい。
【0083】
画像885は、特定の及び現在の視聴状態について対象となる撮像デバイスに以降においてレンダリングされてもよい。標準的なディスプレイであるHDRディスプレイ、広範な色域のディスプレイ及びプリンタが、対象となる撮像デバイスの具体例である。薄暗い自然色で塗装された部屋及び明るく黄色で塗装された部屋は、異なる視聴状態の具体例である。
【0084】
本発明の実施例は、HDR画像の符号化に関して説明される。HDR入力画像における対数ルミナンスはトーンマップを生成するためヒストグラム化されると共に、対数グローバルトーンマッピングされたルミナンス画像が計算される。対数グローバルトーンマッピングされたルミナンス画像はダウンスケーリングされる。対数ルミナンス及び対数グローバルトーンマッピングされたルミナンス画像は、対数レシオ画像を生成する。対数レシオ画像をフィルタリングするマルチスケール解像度は、対数マルチスケールレシオ画像を生成する。対数マルチスケールレシオ画像及び対数ルミナンスは、第2対数トーンマッピングされた画像を生成し、それは、ダウンスケーリングされた対数グローバルトーンマッピングされたルミナンス画像及び正規化された画像に基づきトーンマッピングされた画像を出力するため正規化される。HDR入力画像及び出力されるトーンマッピングされた画像は、量子化される第2レシオ画像を生成する。量子化されたベース画像及びベースレシオ画像は、例えば、JPEGフォーマットによる圧縮用のJPEGエンコーダなどに出力されてもよい。
[一例となるマルチスケールレシオ画像形成によるJPEG−HDR符号化]
実施例では、追加的な画像メタデータは、オリジナルのHDR画像から導出されるローカルマルチスケールグレイスケールレシオ画像を有する。実施例は、ここでの画像フォーマットにより発信された拡張YCC色域などの色域を利用して、トーンマッピングされた画像及びローカルマルチスケールグレイスケールレシオ画像から生成/復元されるようなオリジナルのHDR画像のHDRバージョンによる各ピクセルにおけるフル復元を可能にする。実施例では、ここに説明される技術は、オリジナルHDR画像のHDRバージョンによる各ピクセルにおけるフル復元を可能にするため、閾値(トーンマッピングされた画像のトータルのピクセル数の0.01%、0.1%、1%、2%など)以下のトーンマッピングされた画像における完全に黒のトーンマッピングされた値の個数を最小化する。
【0085】
ここでの技術では、所望されるルミナンス値の出力レンジを適合させるためにグローバルコントラストを圧縮し、人間の視覚に重要なローカルコントラストを失わせるグローバルトーンマッピング(TM)オペレータを利用する代わりに、ローカルマルチスケールトーンマッピング処理が、マッピング全体をそのままにしながら、グローバルTMオペレータにおいて危険となるローカルコントラストを向上させるトーンマッピングされた画像を生成するのに利用されてもよい。実施例では、ローカルマルチスケールTM処理は、グローバル曲線(ヒストグラム調整TM曲線など)を用いて、詳細を失うことなくルミナンス値をマッピングする。実施例では、ローカルマルチスケールTM処理が、処理における新たなアーチファクト(ハローなど)を生成/導入することなく、効率的に実行される。特定の実施例では、効率的な再帰的処理が、高い計算効率性によりここに説明されるようなローカルマルチスケール処理を実行するため実現される。特定の可能な実施例では、ローカルマルチスケール処理は、グローバルTMオペレータによるTM処理より30%長い時間しか費やさない。
【0086】
実施例では、入力HDR画像がロードされ、それのルミナンス値は対数ドメインに変換される。ヒストグラム調整TM曲線が計算され、グローバルレシオグレイスケール画像を決定するため、ルミナンス値に適用される。ここで用いられるレシオ画像は、一般にトーンマッピング前の画像(入力HDR画像又はそれの対数等価など)におけるルミナンス値と、トーンマッピング後の画像(トーンマッピングされた画像又はそれの対数等価など)におけるルミナンス値との間のレシオ値を有する画像を表す。実施例では、レシオ画像は、非対数ドメインにおける各ピクセル位置におけるトーンマッピング後の画像により除算されたトーンマッピング前の画像として論理的には表現されるか、又は対数ドメインにおける各ピクセル位置のトーンマッピング前の画像からトーンマッピング後の画像を差し引いたものとして等価的に表される。他の実施例では、レシオ画像は、非対数ドメインにおける各ピクセル位置においてトーンマッピング前の画像により除算されたトーンマッピング後の画像として論理的に表されるか、又は対数ドメインの各ピクセル位置におけるトーンマッピング後の画像からトーンマッピング前の画像を差し引いたものとして等価的に表される。これらの全ての実施例において、レシオ画像(ローカルマルチスケールTM画像など)とトーンマッピング前の画像(入力HDR画像など)が既知である場合、トーンマッピング前の画像(ローカルマルチスケールTM画像など)は、シンプルな代数演算(非対数ドメインにおける乗算/除算、対数ドメインにおける加算減算など)を介し取得されてもよいことに留意すべきである。
【0087】
実施例では、対数ドメインでは、ローカルマルチスケールレシオにマージされる他のレシオ画像を生成するのに利用されるグローバルレシオ画像は、16ビット整数値を用いて減算により効率的に計算される。実施例では、トーンマッピングされた画像における参照最大値が計算され、トーンマッピングされた画像が、少ないパーセンテージのピクセル以下しかサポートされている色域(拡張YCC色域など)の範囲外にならないように修正されてもよい。
【0088】
実施例では、対数ドメインでは、ローカルマルチスケールレシオにマージされる他のレシオ画像を生成するのに利用されるグローバルレシオ画像が、16ビット整数値を用いて減算により効率的に計算される。実施例では、トーンマッピングされた画像における参照最大値が計算され、トーンマッピングされた画像が、少ないパーセンテージのピクセル以下しかサポートされている色域(拡張YCC色域など)の範囲外にならないように修正されてもよい。
[均等、拡張、代替及びその他]
上記明細書では、本発明の実施例が実現形態毎に変化しうる多数の具体的な詳細を参照して説明された。従って、本発明が何であるか、また出願により本発明であると意図されているもの唯一及び排他的な指標は、以降の訂正を含む請求項の具体的な形式による本出願から発行された請求項のセットである。請求項に含まれる用語についてここで明示的に提供される定義は、請求項に用いられるような用語の意味を規定する。従って、請求項に明示的には記載されない限定、要素、性質、特徴、効果又は属性は、請求項の範囲を限定すべきでない。明細書及び図面は、限定的な意味でなく例示的なものとしてみなされるべきである。