IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社朋栄の特許一覧

特許7137185エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置
<>
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図1
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図2
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図3
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図4
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図5
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図6
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図7
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図8
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図9
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図10
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図11
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図12
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図13
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図14
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図15
  • 特許-エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-06
(45)【発行日】2022-09-14
(54)【発明の名称】エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置
(51)【国際特許分類】
   G06T 5/00 20060101AFI20220907BHJP
   H04N 1/407 20060101ALI20220907BHJP
   H04N 5/243 20060101ALI20220907BHJP
   H04N 5/235 20060101ALI20220907BHJP
【FI】
G06T5/00 740
G06T5/00 710
H04N1/407
H04N5/243
H04N5/235 500
【請求項の数】 9
(21)【出願番号】P 2018103273
(22)【出願日】2018-05-30
(65)【公開番号】P2019207603
(43)【公開日】2019-12-05
【審査請求日】2021-05-13
(73)【特許権者】
【識別番号】391040320
【氏名又は名称】株式会社朋栄
(74)【代理人】
【識別番号】100148851
【弁理士】
【氏名又は名称】鎌田 和弘
(72)【発明者】
【氏名】松永 力
(72)【発明者】
【氏名】趙 延軍
【審査官】梅本 章子
(56)【参考文献】
【文献】特開2014-176449(JP,A)
【文献】特開平11-341307(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00 -1/40
G06T 3/00 -5/50
H04N 1/40 -1/409
H04N 5/222-5/257
(57)【特許請求の範囲】
【請求項1】
HDR映像をSDR映像に変換するトーンマッピング処理において、
画面全体に対して一様なレベル変換を行うグローバルトーンマッピング関数を区分線形関数で表し、関数パラメータを変換結果のSDR映像のエッジ強度を最大化するように、入力HDR映像における画素値から自動的に計算するものとし、
変換後の前記SDR映像のエッジ強度を最大化するような区分線形関数によるトーンマッピングパラメータpは、次の目的関数Jを最小化するものとして得られる
【数1】
ことを特徴とするトーンマッピング処理方法。
【請求項2】
請求項1に記載のトーンマッピング処理方法において、
前記区分線形関数は、折れ線近似である
ことを特徴とするトーンマッピング処理方法。
【請求項3】
請求項2に記載のトーンマッピング処理方法において、
前記区分線形関数の入力区分点は、前記HDR映像における1フレーム中の最大輝度値レベルを再帰的に二分割して、最小区分点が、100%白レベルを1.0として正規化した輝度値に対して、0.01以下になるまで繰り返すことにより決定される
ことを特徴とするトーンマッピング処理方法。
【請求項4】
請求項2に記載のトーンマッピング処理方法において、
前記区分線形関数の入力区分点を、1フレーム内の入力HDR画素値における最大輝度値から再帰的に分割することによって決定する工程と、
トーンマッピングパラメータを、1フレーム内の入力HDR画素値によるエッジ強度を最大化するものを算出するか、または、
複数フレーム内における入力HDR画素値によるエッジ強度を最大化するものを算出するか、の工程と、
得られたトーンマッピングパラメータに対して時系列フィルタ処理を遂行する工程と、を有する
ことを特徴とするトーンマッピング処理方法。
【請求項5】
請求項1乃至請求項4のいずれか一項に記載のトーンマッピング処理方法において、
前記グローバルトーンマッピング関数の関数パラメータは,入力HDR画素値をトーンマッピング処理したSDR画素値のエッジ強度を累積加算することにより得られる連立方程式を解くことにより,閉形式解として計算されるものとする
ことを特徴とするトーンマッピング処理方法。
【請求項6】
請求項1乃至請求項5のいずれか一項に記載のトーンマッピング処理方法において、
入力される前記HDR映像における平均輝度値とエッジ強度を最大化するためのトレードオフを調整する正則化パラメータλ,μを、前記HDR映像のヒストグラム特徴量から予測する
ことを特徴とするトーンマッピング処理方法。
【請求項7】
請求項1乃至請求項6のいずれか一項に記載のトーンマッピング処理方法において、
前記HDR映像のみから自動的にトーンマッピング処理を行うためのパラメータを計算することにより、前記HDR映像と前記SDR映像の同時放送・配信のための卜ーンマッピング処理におけるマニュアル調整が不要である
ことを特徴とするトーンマッピング処理方法。
【請求項8】
請求項1乃至請求項7のいずれか一項に記載のトーンマッピング処理方法において、
前記関数パラメータは、連立方程式を解くことにより、閉形式解として得られるものである
ことを特徴とするトーンマッピング処理方法。
【請求項9】
請求項1乃至請求項8のいずれか一項に記載のトーンマッピング処理方法を遂行する
ことを特徴とするトーンマッピング処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、エッジ強度最大化によるトーンマッピング処理方法及びHDR映像変換装置に関する。
【背景技術】
【0002】
HDR画像をSDR画像に変換する処理は、トーンマッピング(Tone mapping、TM)と呼ばれて、グラフィックスの分野で多くの研究がなされており、様々な手法が提案されている。放送で用いることを考えると、画像全体に対して一様なレベル変換を行うグローバルTM処理が処理速度の観点からは優位である。カメラ内部でも、古くからダイナミックレンジの圧縮として、ニー(Knee)と呼ばれる処理が用いられている。
【0003】
ニー処理はニーポイントとニースロープ(ゲイン、あるいは圧縮率)による1次式で関数が決まる簡易な処理である。
【0004】
カメラにおける逆光補正のための長時間露光信号と短時間露光信号を合成した映像におけるニー処理として、フレーム内の合成信号の輝度値により、ニーポイントと圧縮率(ニースロープ)を制御する技術が特許文献1に開示されている。
【0005】
Blu-ray Disc(登録商標)に記録されているハイダイナミックレンジ対応コンテンツを、表示する受像機に合わせて、トーンマッピング処理するためのメタデータの各種要素、構造に関する内容が標準規格として、米国映画テレビ技術者協会(Society of Motion Picture and Television Engineers, SMPTE)により定められている。(例えば、非特許文献2)さらに、Applicationとして、4つのトーンマッピング処理方式が提案されている。(例えば、非特許文献3乃至非特許文献6)
【0006】
下記非特許文献2では、トーンマッピング処理としては、輝度値に対して、S字曲線(シグモイド曲線)により行われている。そして、フレーム中の最大・最小・平均輝度値の3パラメータからS字曲線を決定しているが、その後に続く、色調整、ディテール強調等のパラメータはいずれも主観的なマニュアル調整による。
【0007】
また、下記非特許文献3では、トーンマッピング処理として、いくつかの処理が行われているが、基本的には輝度値に対する処理であり、輝度値のシャドウ部(低輝度領域)、ハイライト部(高輝度領域)のゲイン調整、およびそれらを滑らかに接続する中間輝度領域からなるカーブを用いている。その後の微調整として、区分線形関数による方法も記述があるが、具体的な調整方法は見当たらない。
【0008】
また、下記非特許文献5では、HDR→SDR変換を、プリ/ポスト1DLUT(ルックアップテーブル)+3×3カラーマトリクス変換によりモデル化して、そのモデルパラメータをメタデータとしている。モデルパラメータは、予めマニュアルにより変換したSDR画像と元のHDR画像の間のユークリッド距離が最小となるように決定する。モデルの妥当性は、推定したパラメータによる変換結果のSDR画像と元のHDR画像の間のPSNR,SSIM、および△Eにより、実験的に評価している。パラメータの計算方法に関しては、非特許文献7に記載がなされている。
【0009】
また、非特許文献6では、トーンマッピング関数に、直線と4次ベジェ曲線(多項式関数)を接続したものを用いている。ベジェ曲線は少ない制御点により滑らかな曲線を実現できるものの、計算コストは高い。シーン中の最大輝度値からトーンマッピングパラメータを計算しているが、その根拠は明らかではない。
【0010】
さらに、非特許文献8では、画像の局所的な処理によるローカルトーンマッピング処理であるが、その前処理としての画面全体に対して一様なレベル変換を行うグローバルトーンマッピング関数には、有理式関数を用いている。
【先行技術文献】
【特許文献】
【0011】
【文献】特開2010-273239号公報
【非特許文献】
【0012】
【文献】E. Reinhard,G.Ward,S.Pattanaik,and P. Debevec,High Dynamic Range Imaging: Acquisition,Display,and Image-based Lighting,Amsterdam,Elsevier/Morgan Kaufmann,2005.
【文献】SMPTE ST 2094-1:2016, SMPTE STANDARD Dynamic Metadata for Color Volume Transform - Core Components,Approved May 18, 2016.
【文献】SMPTE ST 2094-10:2016, SMPTE STANDARD Dynamic Metadata for Color Volume Transform - Application #1, Approved May 18, 2016.
【文献】SMPTE ST 2094-20:2016, SMPTE STANDARD Dynamic Metadata for Color Volume Transform - Application #2, Approved July 6, 2016.
【文献】SMPTE ST 2094-30:2016, SMPTE STANDARD Dynamic Metadata for Color Volume Transform - Application #3, Approved July 6, 2016.
【文献】SMPTE ST 2094-40:2016, SMPTE STANDARD Dynamic Metadata for Color Volume Transform - Application #4, Approved August 24, 2016.
【文献】W. Redmann, P. Andrivon, P. Bordes and F. Urban, Reference-Based Color Volume Remapping, SMPTE 2015 Annual Technical Conference and Exhibition, Loews Hollywood Hotel, Hollywood, CA, 2015, pp. 1-14.
【文献】E. Reinhard, M. Stark, P. Shirley, and J. Ferwerda, Photographic tone reproduction for digital images, ACM Transactions on Graphics - Proceedings of ACM SIGGRAPH 2002, 21-3, pp. 267-276 (July 2002).
【発明の概要】
【発明が解決しようとする課題】
【0013】
HDR画像/映像における高輝度階調情報のすべてをSDR画像/映像で表現することは不可能である。しかしながら、ハードクリップ変換によるSDR変換画像/映像では、高輝度階調が失われてしまう。最大輝度値から決定されるスケール変換であるリニア変換では、すべての階調は保存されるものの、平均輝度値の低下により視認性が悪い。画像/映像内容に応じたマニュアルによる調整では、調整コストが掛かるだけでなく、変換結果の品質を一定に保つことも難しい。さらに、トーンマッピングを行うための様々な関数におけるパラメータの意味やその決定方法が明らかではない。SDR変換画像/映像における画質を定量的に評価する方法も明らかではない。
【課題を解決するための手段】
【0014】
区分線形関数により定義した卜ーンマッピング処理のためのパラメータを入力HDR画像の画素値のエッジ強度を計算することにより、自動的に決定される。パラメータはSDR変換画像における入力HDR画素のエッジ強度を最大化するものであり、連立方程式を解くことにより、閉形式解として得られる。画像全体の明るさを表す平均輝度値をできるだけ明るく、エッジ強度を最大化するためのトレードオフを調整するパラメータをHDR画像のヒストグラム特徴量から予測して用いる。
【発明の効果】
【0015】
本発明では、エッジ強度最大化卜ーンマッピング処理により、HDR画像/映像の持つ高輝度階調情報を失うことなく、SDR画像/映像に変換することができる。画像/映像のみから自動的にトーンマッピング処理を行うためのパラメータを計算することにより、HDR映像とSDR映像の同時放送・配信のための卜ーンマッピング処理(HDR→SDR変換処理)におけるマニュアル調整が不要となるのみならず、SDR変換画像/映像の品質も維持できる。
【図面の簡単な説明】
【0016】
図1】本実施形態のエッジ強度最大化トーンマッピング処理ブロック概念図である。
図2】区分線形関数によるグローバルTM処理を説明する図である。
図3】トーンマッピング処理全体ブロック図である。
図4】トーンマッピング処理(TM処理)のブロック図である。
図5】画面全体を一様にレベル変換するグローバルTM処理における従来トーンマッピング処理のブロック図である。
図6】リニア変換、ハードクリップ変換、ニー変換、ReinhardグローバルTMの一例を示す図である。
図7】エッジ強度最大化TM処理における正則化パラメータλ,μを決定するための事前の最適パラメータ学習のブロック図である。
図8】事前の正則化パラメータの最適パラメータ学習の結果を用いて、正則化パラメータをヒストグラム特徴から予測して、エッジ強度最大化TM処理するブロック図である。
図9】正則化パラメータλ,μの決定方法を説明する図である。
図10】正則化パラメータλ,μの決定方法を説明する図である。
図11】正則化パラメータλ,μの決定方法を説明する図である。
図12】正則化パラメータλ,μの決定方法を説明する図である。
図13】(a)は正則化パラメータλ,μの比率によるエッジ強度最大化TMのパラメータ計算結果を示す図であり、(b)はλ,μの大きさによるエッジ強度最大化TMのパラメータ計算結果を示す図であり、(c)は評価用HDR画像20枚のエッジ強度最大化TMのパラメータ計算結果を示す図であり、(d)はSDR変換画像における平均輝度値とエッジ強度相乗平均の平均・標準偏差を説明する図である。
図14】SDR変換画像例(1) 1段目段左から、HDR入力画像(The HDR Photographic Survey, http://rit-mcsl.org/fairchild//HDR.html)の擬似カラー表示[1]、各トーンマッピング関数、および各SDR変換画像における平均輝度値とエッジ強度相乗平均のグラフ。2段目左から、リニア変換、ハードクリップ変換、ReinhardグローバルTM[14,15]、エッジ強度最大化(λ=0.0033,μ=0.0067)によるSDR変換画像。3段目は、各変換によるSDR変換画像のエッジ強度画像であり、見易さのためにレベルを4倍している。
図15】SDR変換画像例(2) 1段目段左から、HDR入力画像(The HDR Photographic Survey, http://rit-mcsl.org/fairchild//HDR.html)の擬似カラー表示[1]、各トーンマッピング関数、および各SDR変換画像における平均輝度値とエッジ強度相乗平均のグラフ。2段目左から、リニア変換、ハードクリップ変換、ReinhardグローバルTM[14,15]、エッジ強度最大化(λ=0.37,μ=0.63)によるSDR変換画像。3段目は、各変換によるSDR変換画像のエッジ強度画像であり、見易さのためにレベルを4倍している。
図16】SDR変換画像例(3) 1段目段左から、HDR入力画像(The HDR Photographic Survey, http://rit-mcsl.org/fairchild//HDR.html)の擬似カラー表示[1]、各トーンマッピング関数、および各SDR変換画像における平均輝度値とエッジ強度相乗平均のグラフ。2段目左から、リニア変換、ハードクリップ変換、ReinhardグローバルTM[14,15]、エッジ強度最大化(λ=0.0003,μ=0.0007)によるSDR変換画像。3段目は、各変換によるSDR変換画像のエッジ強度画像であり、見易さのためにレベルを4倍している。
【発明を実施するための形態】
【0017】
本実施形態で開示する処理方法や装置は、ダイナミックレンジを拡大した映像(以下HDR映像と称する)を標準ダイナミックレンジ映像(以下SDR映像と称する)に変換するトーンマッピング処理(HDR→SDR変換処理)において、画面全体に対して一様なレベル変換を行うグローバルトーンマッピング関数を区分線形関数で表し、関数パラメータを変換結果のSDR映像のエッジ強度を最大化するように、入力HDR映像における画素値から自動的に計算する。変換結果のSDR映像における平均輝度値とエッジ強度のトレードオフを実現するものであり、入力HDR映像における高輝度値の階調が失われないことに特徴がある。
【0018】
本実施形態で説明する処理方法は、次のような特徴を有する。
・ダイナミックレンジを拡大したHDR映像を標準ダイナミックレンジSDR映像に変換する卜ーンマッピング処理(HDR→SDR変換処理)において、画面全体に対して一様なレベル変換を行うグローバルトーンマッピング関数を区分線形関数で表し、その関数パラメータを変換結果のSDR映像におけるエッジ強度を最大化するように、入力HDR映像における画素値から自動的に計算する。
・トーンマッピング関数パラメータは入力HDR画素値のエッジ強度を累積加算することにより得られる連立方程式を解くことにより、閉形式解として計算される。
・トーンマッピング関数パラメータを計算するための、入力HDR画像における平均輝度値とエッジ強度のトレードオフを調整する正則化パラメータを複数HDR画像から予め決定した結果と各HDR画像のヒストグラム特徴量から正則化パラメータを予測する式を計算する事前の最適パラメータ学習と入力HDR画像から抽出したヒストグラム特徴から正則化パラメータを予測計算して、エッジ強度最大化する卜ーンマッピング処理を遂行する。
【0019】
また、本実施形態で説明する処理方法は、次のような特徴的要素を有することが好ましい。
・HDR入力の全画素の対数輝度値の平均によりスケール変換されたHDR画素を区分線形関数により卜ーンマッピング(TM)処理する卜ーンマッピング処理部
・HDR入力をスケール変換するための対数輝度値平均計算部およびスケール変換部
・HDR入力の画素値のエッジ強度を計算するエッジ強度計算部
・HDR入力の画素値のエッジ強度の累積加算結果と平均対数輝度値、正則化パラメータによりSDR変換画像におけるエッジ強度を最大化する卜ーンマッピングパラメータを計算するTMパラメータ計算部
・正則化パラメータを事前の最適パラメータ学習により予測するための正則化パラメータ探索方法
・正則化パラメータを事前の最適パラメータ学習により予測するためのHDR画像からのヒストグラム特徴の抽出部
・複数のHDR画像における探索による正則化パラメータとヒストグラム特徴ベクトルから予測式を計算する最適パラメータ学習部
・HDR入力に対してエッジ強度最大化卜ーンマッピング処理を行うエッジ強度最大化TM処理部とHDR入力画像からヒストグラム特徴ベクトルを抽出するヒストグラム特徴抽出部とヒストグラム特徴ベクトルに対して正則化パラメータを予測計算する正則化パラメータ予測部
【0020】
また、本実施形態で説明する処理方法の実現方法としては、ベースバンドビデオ信号を処理するハードウェア装置により実現することも可能であるし、MXFファイルを処理するソフトウェアおよびそれを実行するコンピュータをベースとした装置により実現することも可能であるし、MXFファイルをベースバンドビデオ信号に変換、あるいは逆変換する装置を用いれば、いかなる構成による実現も可能である。カメラ映像を動画像圧縮したもの、あるいはMXFファイルをIP(インターネット・プロトコル)伝送して、クラウド上で処理を行うことも可能である。IP伝送された圧縮映像をベースバンドビデオ信号に復号して、エッジ強度最大化卜ーンマッピング処理を行った結果を再び圧縮してストリーム配信する等、様々なシステム形態への展開が考えられる。Blu-ray Discに記録されているハイダイナミックレンジ対応コンテンツを、表示する受像機に合わせて、トーンマッピング処理するために、映像のフレーム毎、シーン毎に計算したTMパラメータをメタデータとして埋め込むことも可能である。
【0021】
また、さらに好ましい形態としては、1フレーム内の入力HDR画素値によるエッジ強度のみならず、複数フレームにおける画素値によるエッジ強度からTMパラメータを計算することも可能であるし、1フレーム毎のTMパラメータの結果をフレーム間に渡って、時系列フィルタ処理を行うことも可能である。複数フレームヘの拡張、あるいはフレーム間の時系列フィルタ処理により、HDR映像のトーンマッピング処理がさらに安定化する効果が得られるものとなる。
【0022】
ここで、区分線形関数の入力区分点は、1フレーム内の入力HDR画素値における最大輝度値から再帰的に分割することによって決定することができる。一方、TMパラメータの計算においては、1フレーム内の画素値のみからエッジ強度を最大化するトーンマッピングパラメータを計算することに代えて、複数フレームにおける画素値を用いることもできる。例えば、3フレームの画素値を用いてトーンマッピングパラメータを計算する場合には、TMパラメータは3フレーム毎に得られることになる。より多くの画素値データを用いてトーンマッピングパラメータを算出することにより、パラメータの計算結果の信頼性の向上が期待される。
【0023】
そして、1フレーム毎にTMパラメータが計算されて得られる場合であっても、あるいは、複数フレーム毎にパラメータが計算されて得られる場合であっても、いずれかで得られたTMパラメータに対して、時系列フィルタ処理を掛けることができる。
【0024】
図1に示したエッジ強度最大化トーンマッピング処理ブロック図について以下に説明する。HDR画像/映像は、RGB色空間からxyY色空間へ変換して、輝度値Yのみ処理した結果をRGBに戻すことにより、SDR画像/映像に変換する。各グローバルTM処理は、全画素の平均対数輝度値がグレイレベルa(%)になるようにスケール変換した輝度値Yに対して行う。あるいは、全画素による対数輝度値の平均値と最大最小値からグレイレベルaを計算してもよい。
【0025】
輝度値に変換されたHDR入力Lwは、全画素の対数輝度値の平均を計算するとともに(対数輝度値平均計算)、注目画素に隣接する画素を用いて、水平垂直エッジ強度を計算して(エッジ強度計算)、その結果を累積加算していく。フレーム全体の画素のエッジ強度の累積加算結果と平均対数輝度値、最大輝度値から決定される入力区分点、正則化パラメータλ,μを用いて、トーンマッピング処理結果のSDR画像/映像におけるエッジ強度を最大化するトーンマッピングパラメータを計算する(TMパラメータ計算)。
【0026】
TMパラメータは、連立方程式を解く閉形式解として計算できる。入力区分点は、HDR画像における最大輝度値レベルを再帰的に2分割して、最小区分点が0.01以下になるまで繰り返すことにより決定する。図2は、区分線形関数によるグローバルTM処理を説明する図である。そのようにして計算されたTMパラメータを平均対数輝度値とグレイレベルaにより計算されるスケール係数によりスケール変換されたLに対して、トーンマッピング処理を行い(TM処理)、SDR出力Ldになる。スケール変換は次のように計算する。
【0027】
【数1】
【0028】
また、図3にトーンマッピング処理全体ブロック図を示す。HDR入力として、輝度色差YCbCr形式の映像を処理する場合には、HDR入力を輝度色差YCbCrからRGBに変換して(YCbCr→RGB変換)、RGB毎にEOTF(電気-光変換関数)によるレベル変換を行い、リニアRGBに変換する。リニアRGBをさらに、xyY色空間に変換して、輝度値Yのみをトーンマッピング処理する(スケール変換&TM処理)。トーンマッピング処理によりSDR変換された輝度値とxy値を再びRGB値に戻す(xyY→RGB変換)。SDR変換されたRGBをOETF(光-電気変換関数)によりレベル変換して、さらに輝度色差YCbCrに変換して(RGB→YCbCr変換)、SDR出力する。
【0029】
また、図4に、トーンマッピング処理(TM処理)のブロック図を示す。画素値のエッジ強度を最大化するように計算されたトーンマッピングパラメータ(TMパラメータ)は、入力区分点に対する出力区分点として与えられる。区分点間を直線で接続された区分線形関数により表される。スケール変換されたTM処理へのTM入力は、最大輝度値を再帰的に2分割することにより決定された入力区分点のいずれの区分点間隔に属するかを判別される(入力区分アドレス計算)。
【0030】
入力画素値の属する区分点間隔を示すアドレスをTMパラメータ計算結果を格納したゲインオフセットLUT(ルックアップテーブル)に入力する。ゲインオフセットLUTから出力されるTMパラメータ計算結果に基づく該当するゲイン・オフセット値によりTM入力画素はゲインオフセット補正されて(ゲインオフセット補正)、SDR変換されたTM出力になる。トーンマッピング処理(TM処理)は、エッジ強度最大化するように計算されたトーンマッピングパラメータ(TMパラメータ)による処理だけではなく、リニア変換、ハードクリップ変換、ニー変換等、様々なトーンマッピング処理を行う場合も同様である。
【0031】
また、図5に画面全体を一様にレベル変換するグローバルTM処理における従来トーンマッピング処理のブロック図を示す。比較のために、リニア変換、ハードクリップ変換、ニー変換等のトーンマッピング処理においても、全画素の対数輝度値の平均とグレイレベルによるスケール変換を行った輝度値に対してトーンマッピング処理を行うものとするが、図1のエッジ強度最大化トーンマッピング処理と比較して、画素値のエッジ強度を計算して、トーンマッピングパラメータ(TMパラメータ)を計算する処理は行っていないことに注意する。次に表1及び図6において、リニア変換、ハードクリップ変換、ニー変換、ReinhardグローバルTMの各式の表と各関数の一例をグラフ表示して説明する。
【0032】
【表1】
【0033】
図6は、リニア変換、ハードクリップ変換、ニー変換、ReinhardグローバルTMの一例を示す図である。横軸は入力輝度値Lであり、縦軸は出力輝度値Ldである。いずれも、画素値255を1.0とする正規化を行っている。入力区分点は、HDR画像における最大輝度値レベルを再帰的に2分割して、最小区分点が0.01以下になるまで繰り返すことにより決定した。ニー変換におけるニー関数のニーポイントP=0.9、ニースロープd=1、上限値a=1への到達点bを入力HDR画像の最大値qmax=12.992とした。ReinhardグローバルTM関数におけるLwhiteを入力HDR画像における最大値とした。
【0034】
また、図7は、エッジ強度最大化TM処理における正則化パラメータλ,μを決定するための事前の最適パラメータ学習のブロック図である。正則化パラメータλ,μは、SDR変換画像におけるエッジ強度を優先するリニア変換と平均輝度値を優先するハードクリップ変換のトレードオフを決めるものである。これを複数のHDR画像を学習用画像として、探索により決定した正則化パラメータと画像から抽出したヒストグラム特徴ベクトルにより、最適パラメータ学習として、λ,μを予測する式を生成する。
【0035】
正則化パラメータλ,μの探索による決定方法は図9乃至図12の正則化パラメータλ,μの決定方法に説明している。TMパラメータの計算結果がReinhardグローバルTMによる平均輝度値を越えず、かつ単調増加を満たす最小値となるように決定する。そのようにして決定したλ,μ値を画像から抽出したヒストグラム特徴ベクトルに対する予測式として計算する。予測式を計算するための予測器には、線形重回帰、多層パーセプトロン(ニューラルネットワーク)、サポートベクターマシン等を用いることができる。
【0036】
図8は、事前の正則化パラメータの最適パラメータ学習の結果を用いて、正則化パラメータをヒストグラム特徴から予測して、エッジ強度最大化TM処理するブロック図である。HDR入力からヒストグラム特徴を抽出して(ヒストグラム特徴抽出)、ヒストグラム特徴ベクトルhから正則化パラメータλ,μを予測計算して(正則化パラメータ予測)、エッジ強度最大化TM処理へ入力する。エッジ強度最大化TM処理は、HDR入力を処理して、SDR変換されたSDR出力を出力する。
【0037】
(エッジ強度最大化による最適トーンマッピングについて)
(Abstract)
【0038】
ハイダイナミックレンジ(HDR)画像をトーンマッピング(Tone Mapping,TM)処理した結果の標準ダイナミックレンジ(SDR)画像におけるエッジ強度を最大化するTMパラメータを計算する。SLT(Slice Transform)モデルにより定義されたグローバルTM処理を正則化により、エッジ強度を優先するリニア変換と平均輝度値を優先するハードクリップ変換のトレードオフとして、HDR入力画像から自動的に決定するものであり、解は最小二乗法により閉形式として得られる。
(1 はじめに)
【0039】
次世代テレビ放送としての4K/8K(スーパーハイビジョン(後述文献リスト[12]参照、以下同様)超高精細映像は、解像度だけではなく、広色域、高フレームレート、高ビット深度がITU-R勧告BT.2020(Recommendation ITU-R BT.2020-1, Parameter values for ultra-high definition television systems for production and international programme exchange (2014))として規定されている。映像の明るさを拡張するハイダイナミックレンジ(HDR)も、拡張された信号レベルを圧縮するための非線形の伝達関数がITU-R勧告BT.2100(Recommendation ITU-R BT.2 100,Image parameter values for high dynamic range television for use in production and international programme exchange (2016))として規定された。
【0040】
4K/8K放送におけるHDコンテンツのリパーパス(repurpose)のためには、解像度変換が必要になる。近年、超解像技術が盛んに研究されている[13]。その処理の多くは反復によるものであるが、松永は画像の局所的な時間空間方向による補間の重み付け平均とマルチスケール化した非線形エンハンサによる1パスビデオ超解像を提案した[9]。趙・松永[16]は1パスビデオ超解像処理をGPUにより高速化した。
【0041】
放送事業者は、現行地上デジタル放送はHDであっても、将来を見据えた4Kでのコンテンツ制作に取り組み始めている。4K・8K実用放送開始後も、HD放送を併存、継続していくことになると、4K/8K解像度・色域で収録した映像コンテンツを、逆にHD解像度・色域へ変換しなければならない。ここで問題となるのは色域の変換であり、より広範囲な色域を持つ4K/8Kコンテンツを、より狭い色域のHDコンテンツに変換しなければならない。色域の変換は、プリンタやディスプレイヘカラー表示するための色域(ガマット)マッピング(Gamut Mapping、GM)処理が、カラーマネジメント技術として研究されてきた[4,11]。
【0042】
松永[10]は、次世代テレビ放送4K/8K(スーパーハイビジョン)におけるBT.2020色空間から、現行地上デジタル放送におけるBT.709(Recommendation ITU-R BT.709-5,Parameter values for the HDTV standards for production and international programme exchange (04/2002))色空間へ色域の変換を行うために、均等色空間であるCIELAB表色系にて、色相毎に最大色差平均の最小化による色域マッピング値を計算した。そして、RGB表色系を入出力とする3次元ルックアップテーブル(3DLUT)補間[7]による計算精度を実験的に評価した。
【0043】
近年、さらに、映像の明るさを拡張するハイダイナミックレンジ(HDR)に注目が集まっている。HDR映像は100%を越える信号レベルを様々な非線形の伝達関数によりレベル変換したものを、圧縮・伝送し、これを受像機側で元の信号レベル(リニアRGB)に戻して高輝度表示するものである。最新のカメラでは、イメージセンサの進化により、これまでのダイナミックレンジを越えて撮像することが可能となっており、『表示装置の技術向上により、『黒』の表示輝度は変えず、表示装置の最大輝度(ピーク輝度)を増大すること(ダイナミックレンジを拡張すること)が可能となった」「再現範囲が広かった領域をハイライト再現に用い、新たな視聴体験を提供する」「現実に近いハイライト再現(鏡面反射や光沢の再現)、ハイライト部の白飛びなどの改善効果がある」とされている(総務省「情報通信審議会情報通信技術分科会ITU部会放送業務委員会(第19回)配付資料」,2015年9月2日開催。http://www.soumu.go.jp/main_sosiki/joho_tsusin/policyreports/joho_tsusin/docs_Broadcast/02ryutsu08_03000224.html)。そして、解像度、色域同様にHDR制作されたコンテンツのSDR映像への変換が必要とされている。
【0044】
HDR画像をSDR画像に変換する処理は、トーンマッピング(Tone Mapping、TM)と呼ばれて、グラフィックスの分野で多くの研究がなされており、様々な手法が提案されている[15]。
【0045】
放送で用いることを考えると、画像全体に対して一様なレベル変換を行うグローバルTM処理が処理速度の観点からは優位である。カメラ内部でも、古くからダイナミックレンジ圧縮として、ニー(Knee)と呼ばれる処理が用いられてきた(後述の(付録B)ご参照)。
【0046】
しかし、グローバルTM処理を行うにしても、そのレベル変換を行う関数はどのように決定すればよいのかについては、従来、様々な関数が提案されているものの、ある方法とある方法のどちらがよいかを客観的、定量的に評価する方法は知られていない。すなわち、従来の評価方法としては、主観的な評価によるものがあるが[8]、定量的に評価することは難しい。本書面は、それらの従来課題に答えるものであり、グローバルTM処理した結果のSDR画像におけるエッジ強度を最大化するTMパラメータをHDR入力画像から自動的に決定する。
【0047】
本書面の構成は、2章で、エッジ強度を最大化するためのトーンマッピングについて説明する。はじめに、SLT(Slice Transform)モデル[5]によるグローバルTM処理を定義して、その処理結果のSDR画像におけるエッジ強度による目的関数を決定する。そして、エッジ強度による目的関数を最小化するグローバルTMパラメータをHDR入力画像から計算する。計算の安定化のために、正則化項[2]を導入するが、これは、エッジ強度を優先するリニア変換によるトーンマッピングと平均輝度値を優先するハードクリップ変換によるトーンマッピングのトレードオフになる。最終的な目的関数をベクトル行列形式で書き直して、最小二乗法による閉形式の解を導出する。3章で画像シミュレーションを行う。リニア変換、ハードクリップ変換、ニー変換、ReinhardグローバルTM[14,15]、そして、エッジ強度最大化TMによるSDR変換画像の結果における平均輝度値とエッジ強度により比較する。また、4章で総括してまとめを記載する。
【0048】
(2 エッジ強度最大化によるトーンマッピング)
【0049】
【数2】
【0050】
TM処理結果のSDR画像におけるエッジ強度を最大化するようなTMパラメータpを計算する。入力区分点qは予め与えられているとする。したがって,次の目的関数Jを最小化する。
【0051】
【数3】
【0052】
【数4】
【0053】
(3 画像シミュレーション)
評価用HDR画像(The HDR Photographic Survey, http://rit-mcsl.org/fairchild//HDR.html及びCreating cinematic wide gamut HDR-video for the evaluation of tone mapping operators and HDR-displays[3],https://hdr-2014.hdm-stuttgart.de/)(OpenEXR(http://www.openexr.com/))20枚を、リニア変換、ハードクリップ変換、ニー変換、ReinhardグローバルTM[14,15]、エッジ強度最大化TMにより、SDR画像(8ビット,[0,255])に変換する。RGB表色系からxyY表色系へ変換して、輝度値Yのみ処理した結果をRGB値に戻す[15]。各グローバルTM処理は、対数輝度値の平均値と最大最小値から決定した係数[15]を修正した値によりスケール変換した輝度値Yに対して行う。ニー変換におけるニー関数,ReinhardグローバルTM処理を後述の(付録B,C)に示す。
【0054】
図13(a)は、評価用HDR画像の1枚(図14)の正則化パラメータλ,μ=10として、その比率を10:0~0:10まで変えたときのエッジ強度最大化TMパラメータpの計算結果を表示したものである。入力区分点qはHDR画像における最大輝度値レベルを再帰的に2分割して、最小区分点が0.01以下になるまで繰り返すことにより決定した。パラメータ計算に用いる画素は全画素に対して、水平1画素垂直1ラインおきにサンプリングした。比率を変えることにより、ハードクリップ変換からリニア変換まで変化している。
【0055】
また、図13(b)は、λ,μの比率を3.3:6.7に固定して、それぞれの大きさを33~3.3×10-4,67~6.7×10-4まで変えたときのpの計算結果を表示したものである。比率は、SDR変換画像における平均輝度値がReinhardグローバルTMによる平均輝度値を越えないように選んだ。λ,μの大きさにより、TM関数の形が微妙に変化しており、そのときのλ,μ値におけるエッジ強度を最大化するようにpが計算される。λ,μが大きくなるに従い、データとしての画素値のエッジ強度によらず、ハードクリップ変換とリニア変換を3.3:6.7で混合した結果(Mix)に近づく。λ,μが小さ過ぎると、正則化の効果が得られず、計算結果は不安定となり、大きく変動する。λ=0.0033,μ=0.0067としたときに、pの計算結果がReinhardグローバルTMによる平均輝度値を越えず、かつ単調増加を満たす最小値となった。最終的なTM関数によるSDR変換画像の結果は、図14に示す。その他の評価用HDR画像も同様にしてλ,μの値を決定する。
【0056】
図13(c)は、そのようにして決定したλ,μによる評価用HDR画像20枚のエッジ強度最大化TMパラメータpの計算結果を重ねて表示したものである(ただし、最大輝度値を1.0とする正規化をしている)。pの計算結果は変動しており、HDR入力画像に適応している。
【0057】
図13(d)は、トーンマッピング関数によるSDR変換画像における平均輝度値とLDR/HDRエッジ強度、エッジ強度相乗平均の平均・標準偏差の結果をグラフ表示したものである。HDR入力画像における入力区分点qによる最大2区間[qn-2,q]の画素値と同じ座標に対して計算したものをHDRエッジ強度、それ以外の面素値と同じ座標に対して計算したものをLDRエッジ強度として、それぞれ次のように計算する。
【0058】
【数5】
【0059】
ここで、N,NはそれぞれSDR変換画像におけるHDR/LDRエッジ強度を計算する画素数である。グラフの横軸が平均輝度値(Average Luminance)、縦軸がエッジ強度相乗平均(Edge Power Geometric Mean,
【0060】
【数6】
【0061】
)であり、エラーバーは各標準偏差を表す。[表2]にSDR変換画像における平均輝度値とエッジ強度、およびLDR/HDRエッジ強度の相乗平均の平均・標準偏差の結果を数値で示す。表中括弧内は標準偏差である。
【0062】
【表2】
【0063】
リニア変換はHDRエッジ強度が最大であるが、平均輝度値が低く、視認性が著しく悪い。ハードクリップ変換は最も明るく、視認性が良いものの、HDRエッジ強度が著しく低く、HDR画素はクリップにより階調が失われていることが明らかである。ニー変換、ReinhardグローバルTM(ニー変換におけるニー関数のニーポイントp=0.9,ニースロープd=1,上限値a=1への到達点bを入力HDR画像の最大値とした。ReinhardグローバルTM関数におけるLwhiteをHDR入力画像における最大値とした。それぞれ後述する(付録B,C)参照。)、エッジ強度最大化TMによる結果は、その中間様を示しているが、エッジ強度最大化TMによる結果が、SDR変換画像におけるHDRエッジ強度がリニア変換に次いで大きく、エッジ強度相乗平均が最大であり、HDR画素の階調が保存されていると期待される。
【0064】
図14図15図16は、SDR変換画像例である。それぞれ1段目左から、HDR入力画像を擬似カラー表示[1]したもの、各トーンマッピング関数、および各トーンマッピング関数によるエッジ強度のグラフである。2段目左から、リニア変換、ハードクリップ変換、ReinhardグローバルTM、エッジ強度最大化TMによるSDR変換画像の結果である。リニア変換による結果は全体に暗く、逆にハードクリップ変換による結果は明るい。ReinhardグローバルTMとエッジ強度最大化TMによる結果はその中間様であり、HDR画素の階調が保存されているが、エッジ強度最大化TMの方が、エッジ強度相乗平均が大きく、コントラストが強調されている。3段目は、各変換によるSDR変換画像のエッジ強度画像である。リニア変換による結果は明るさは暗いものの、エッジ情報としてはすべて保存されている。逆に、ハードクリップ変換による結果は明るいものの、HDR画素におけるエッジ情報はクリップにより失われている。
【0065】
(4 まとめ)
ハイダイナミックレンジ(HDR)画像をトーンマッピング(Tone Mapping,TM)処理した結果の標準ダイナミックレンジ(SDR)画像におけるエッジ強度を最大化するTMパラメータを計算した。SLT(Slice Transform)モデルにより定義されたグローバルTM処理を正則化により、エッジ強度を優先するリニア変換と平均輝度値を優先するハードクリップ変換のトレードオフとして、HDR入力画像から自動的に決定するものであり、解は最小二乗法により閉形式として得られる。リニア変換、ハードクリップ変換、ReinhardグローバルTMによるSDR変換画像における平均輝度値とエッジ強度により比較評価した。
【0066】
輝度値のスケール変換係数、正則化パラメータ等の超パラメータが存在している。これをTMパラメータp同様、画像自身から自動的に決定したい。正則化パラメータλ,μはReinhardグローバルTM関数を基準として、探索により決定している。これには、正則化パラメータの決定に用いられるベイズ推定[2]の適用が期待される。
今後の課題としては。
・ベイズ推定等による超パラメータの自動決定
・マルチコアCPU/GPU/FPGAによる実装とHDR映像のリアルタイム処理
が挙げられる。
【0067】
(参考文献リスト)下記各文献冒頭の[番号]は、本文中の文献[番号]に対応します。
[1]A. O. Akyuz, False color visualization for HDR images, Proceedings of First International Conference and SME Workshop on HDR imaging (HDRi2013),Porto,Portugal,pp.26-30 (April 2013).
[2]C. M. Bishop, Pattern Recognition and Machine Learning, Springer 2006.元田 浩(監訳),「パターン認識と機械学習(上・下)」丸善出版, 2012年4月.
[3]J. Froehlich, S. Grandinetti, B. Eberhardt, S. Walter, A. Schilling, and H. Brendel, Creating cinematic wide gamut HDR-video for the evaluation of tone mapping operators and HDR-displays, Proceedings of SPIE 9023, Digital Photography X, 90230X (March 7, 2014).
[4]画像電子学会編,「カラーマネジメント技術一拡張色空間とカラーアピアランス」,東京電機大学出版局, 2008年7月.
[5]Y. Hel-Or and D. Shaked, A discriminative approach for wavelet denoising, IEEE Transactions on Image Processing, 17-4 (April 2008), 443-457.
[6]金谷 健一,「これなら分かる最適化数学一基礎原理から計筧手法まで一」共立出版,2005年9月.
[7]H. R. Kang, Computational Color Technology, SPIE Publications, May 2006.
[8]P. Ledda, A. Chalmers, T. Troscianko, and H. Seetzen, Evaluation of tone mapping operators using a high dynamic range display, A CM Transactions on Graphics- Proceedings of ACM SIGGRAPH 2005, 24-3, pp. 640-648 (July 2005).
[9]松永 力,時間空間方向性補間とマルチスケール非線形工ンハンサによる1パスビデオ超解像,第20回画像センシングシンポジウム(SSII2014)講演論文集,横浜(パシフィコ横浜), 2014年6月.
[10]松永 力,広色域映像のための最適色域マッピング,第22回画像センシングシンポジウム(SSII2016)講演論文集,横浜(パシフィコ横浜), 2016年6月.
[11]J. Morovic, Color Gamut Mapping, John Wiley & Sons Ltd., August 2008.
[12]日本放送協会,「スーパーハイビジョン映像技術」特集号, NHK技研R&D, No. 137, 2013年1月.
[13]S. C. Park, M. K. Park, and M. G. Kang, Super-resolution image reconstruction: A technical overview, IEEE Signal Processing Magazine, 20-3 (May 2003), 21-36.
[14]E. Reinhard, M. Stark, P. Shirley, and J. Ferwerda, Photographic tone reproduction for digital images, ACM Transactions on Graphics - Proceedings of ACM SIGGRAPH 2002, 21-3, pp. 267-276 (July 2002).
[15]E. Reinhard, G. Ward, S. Pattanaik, and P. Debevec, High Dynamic Range Imaging: Acquisition, Display, and Image-based Lighting, Amsterdam, Elsevier/Morgan Kaufmann, 2005.
[16]趙 延軍,松永 力, MXFファイルに対応した1パスビデオ超解像アップ変換のGPUによる高速化, GPUテクノロジ・カンファレンス(GTC Japan 2014), 2014-8008,東京(東京ミッドタウンホール&カンファレンス), 2014年7月.
【0068】
(付録A、付録B、付録C)
【数7】
【0069】
上述の実施形態で説明した開示内容は、その具体的な説明実例に限定されるものではなく、本発明の技術思想の範囲内において、当業者の知り得る公知技術または周知技術を適宜適用してアレンジして利用することが可能である。
【産業上の利用可能性】
【0070】
本発明は、映像機器全般に適用可能であって、特にダイナミックレンジを拡大したHDR映像制作におけるダイナミックレンジ変換装置に好適である。また、受像機/映像再生機におけるHDR→SDR変換機能等にも好適である。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16