【文献】
Gary Baugh, Anil C. Kokaram, Francois Pitie,Advanced Video Debanding,Published in CVMP '14 2014,Signal Processing Media Applications Group,2014年11月,URL,http://www.mee.tcd.ie/~sigmedia/pmwiki/uploads/Main.Publications/BaughKP14.pdf
【文献】
齊藤 啓太 他,広ダイナミックレンジ圧縮における連続性補正・空間補正手法の検討,映像情報メディア学会誌,(社)映像情報メディア学会,2007年 3月 1日,第61巻 第3号,pp.325-331
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
(発明の概要1)
本発明では、HDR映像において発生しやすい擬似輪郭状の妨害である“カラーバンディング”を、簡易な画像処理により補正する方法を提案する。まず、注目画素の近傍ブロック領域中の輝度値の標準偏差からバンディング候補画素を検出する。バンディング候補画素の近傍ブロック画素を用いて、できるだけ似た色で、明るさが近い画素に対する重みを大きくして、輝度信号の重み付け平均を行うことにより、バンディングを除去する。
【0010】
次に、インターネット等から収集した複数の画像から生成した擬似カラーバンディング画像のバンディング特微量を抽出する。バンディング特微量に対して、原画像とデバンディング処理画像との間のカルバック・ライブラー情報量による目的関数を最小とする最適パラメータを予測するモデルを学習により決定する。
【0011】
より具体的には、ラスタスキャンにより近傍ブロック領域における画素を用いた局所処理により、カラーバンディングを除去する構造と、カラーバンディング候補画素の検出とカラーバンディング除去処理の構造と、最適パラメータを自動決定するために、インターネット検索画像を収集して、擬似カラーバンディング画像を生成し、原画像との間のカルバック・ライブラー情報量を最小化する最適パラメータを推定し、バンディング特微量と最適パラメータの組み合わせから重回帰分析とモデル選択により最適パラメータを予測する最適なモデルを決定する構造と、カラーバンディング除去の際に、バンディング特微量を抽出して、学習したモデルから最適パラメータを予測して、カラーデバンディング処理を行う構造と、を備える画像処理装置とする。
【0012】
また、バンディング候補画素の検出処理部と、バンディング候補画素を近傍ブロック領域における輝度値と色差値のレベル差による重みの積を最終的な重みとして、近傍ブロック領域における輝度値を重み付け平均するバンディング除去部と、インターネット検索画像から擬似カラーバンディング画像を生成する擬似カラーバンディング画像生成部と、擬似カラーバンディング画像からバンディングを除去するパラメータを最適に推定する最適パラメータ推定方法とする、さらには、バンディング特微量を抽出するバンディング特微量抽出部と、複数のインターネット画像からバンディング特微量と最適パラメータの組み合わせから最適なモデルを推定するモデル推定方法(学習方法)とし、抽出したバンディング特微量と学習したモデルパラメータを用いて最適なパラメータを予測する最適パラメータ予測部を備えるものとする。
【0013】
(発明の概要2)
実現方法としては、ベースバンドビデオ信号を処理するハードウェア装置により実現することも可能であるし、MXFファイルを処理するソフトウェアおよびそれを実行するコンピュータをベースとした装置により実現することも可能であるし、MXFファイルをベースバンドビデオ信号に変換、あるいは逆変換する装置を用いれば、いかなる構成による実現も可能である。
【0014】
カメラ映像を動画像圧縮したもの、あるいはMXFファイルをIP(インターネット・プロトコル)伝送して、クラウド上で処理を行うことも可能である。IP伝送された圧縮映像をベースバンドビデオ信号に復号して、カラーデバンディング処理を行った結果を再び圧縮してストリーム配信する等、様々なシステム形態が考えられる。
【0015】
バンディング特微量と最適パラメータの組み合わせから最適なモデルを推定するモデル推定方法(学習方法)としては、重回帰分析のみならず、主成分分析、非線形モデルの当てはめも考えられる。最適パラメータの学習に用いる画像には、バンディングが存在しない画像であれば、インターネット検索による画像のみならず、様々なメディアからの画像を用いてもよい。
【0016】
図1は、カラーデバンディング処理ブロック図である。
図1に示すように、カラーデバンディング処理の手順は、次のようになる.
【0017】
1、カラーRGB入力を輝度色差YC
BC
Rに変換する(RGB→YC
BC
R)。
2、変換したYの画素値の近傍ブロック領域における標準偏差を計算して、しきい値(Thresholdl)以下の画素をバンディング候補画素とする(Band Detect)。さらに、Yの画素値が別のしきい値(Threshold2)以上である条件を加える。このようにして得られたバンディング候補画素に対して、2値メジアンフィルタにより、マスク整形を行ったものをバンドマスク(Band Mask)とする。
【0018】
3、近傍ブロック領域におけるC
BC
R、およびYの画素値のレベル距離による重みを計算して(Weight Calc)、その重み(Weight)を用いて、Yを重み付け平均する(Weight Average)。ただし、バンドマスク(Band Mask)によるバンディング候補画素に対してのみ重み付け平均を行う。バンディング候補画素以外における重み付け平均の際に、近傍ブロック領域中のバンディング候補画素以外の画素の重みは0とする。
【0019】
4、このように重み付け平均されたY’とC
BC
RをRGBに変換して(YC
BC
R→RGB)、出力する。輝度色差YC
BC
R入出力の場合、入出力におけるRGBとYC
BC
R間の相互の変換は不要である。
【0020】
輝度値Yの重み付け平均は、色差信号C
BC
R、および輝度信号Yから計算した重み係数wを用いて、次のように計算する。
【0022】
重み係数wは、色差信号C=(C
B,C
R)
Tのレべル距離による重みw
rCと輝度信号Yのレベル距離による重みw
rYの積であり、それぞれガウス関数により次のように定義する。
【0024】
σ
rC,σ
rYはそれぞれ色差信号、輝度信号のレベル距離の許容範囲を調整するパラメータである。
【0025】
また、
図2は、カラーデバンディング処理の最適パラメータ学習のブロック図である。
図2に示すように、カラーバンディングを除去するデバンディング処理フィルタの最適パラメータを予測するための事前のパラメータ学習の手順は次のようになる。
1、インターネットにより画像検索を行い、適当な画像を複数ダウンロードする。
2、ダウンロードした画像を原画像として、擬似カラーバンディング画像を生成する。擬似カラーバンディング画像は、画像の輝度値Yを
【0027】
に変換したものを、s倍することにより生成する。ここで、sは任意の正数であり、
【0029】
は小数部を切り捨てる床関数である。
3、擬似カラーバンディング画像におけるバンディング候補領域から、バンディング特微量を検出する。
4、デバンディング処理パラメータは、原画像と擬似カラーバンディング画像をデバンディング処理した画像の間のバンディング候補画素の輝度値ヒストグラムから計算したカルバック・ライブラー情報量が最小となるように、滑降シンプレックス法(Nelder−Mead法)により最適化する。
5、上記、バンディング特微量と最適デバンディング処理パラメータの組み合わせに対して、重回帰分析を行い、変数選択(モデル選択)により最適デバンディング処理パラメータを予測する最適なモデルを決定する。
【0030】
図3は、最適パラメータ予測によるカラーデバンディング処理のブロック図である。
図3に示すように、学習用画像におけるバンディング特微量と最適パラメータの間の学習結果を用いて、カラーデバンディング処理を行う手順は、次のようになる。
1、バンディング画像からバンディング特微量を抽出する。
2、バンディング特微量に対して、学習結果を用いて最適パラメータを予測する。
3、予測された最適パラメータを用いて、デバンディング処理を行う。
なお、バンディング特微量の抽出方法、およびバンディング特微量に対する最適パラメータを予測するモデルを推定する重回帰分析と変数選択による学習方法に関しては、後述の論文を参照することにより当業者には理解できるものである。
【0031】
(詳細な説明:HDR映像のためのカラーデバンディング処理:インターネット検索画像を用いた最適パラメータ学習)
【0032】
(Abstract)
HDR映像において発生する擬似輪郭状の妨害である“カラーバンディング”を簡易な画像処理により補正する。注目画素の近傍ブロック領城中の輝度値とその標準偏差からバンディング候補画素を検出し、近傍ブロック領域の画素において、できるだけ似た色で、明るさが近い画素に対する重みを大きくして、輝度信号の重み付け平均を行うことにより、バンディングを除去する。
【0033】
デバンディング処理フィルタのパラメータを自動最適化するために、インターネットから収集した複数の画像から擬似カラーバンディング画像を生成するとともに、簡易な画像処理によりバンディング特微量を抽出する。擬似カラーバンディング画像に対して、原画像との間のカルバック・ライブラー情報量を最小化するデバンディング処理フィルタの最適パラメータを滑降シンプレックス法により推定し、バンディング特微量に対するデバンディング処理フィルタの最適パラメータを予測するための最適なモデルを重回帰分析と赤池情報量規準(AIC)による変数選択(モデル選択)により決定する。
【0034】
(1 はじめに)
次世代テレビ放送としての4Kの試験放送が2014年6月2日より、CS(Communication Satellite)、およびケーブルテレビにて開始された(次世代放送推進フォーラム(NexTV-F)、http://www.nextv-f.jP/)。8K(スーパーハイビジョン(参考文献[17])も含め、2018年(可能な限り早期に)の実用放送開始へ向けて加速している(総務省「4K・8Kロードマップに関するフォローアップ会合(第6回会合)配布資料」、平成27年7月、http://www.soumu.go.jp/main_sosiki/kenkyu/4k8kroadmap/02ryutsu11_03000046.html)。
【0035】
4K/8K超高精細映像は、解像度だけではなく、広色域、高フレームレート、高ビット深度がITU−R勧告BT.2020規格(Recommendation ITU-R BT.2020-1, Parameter values for ultra-high definition television systems for production and international programme exchange (2014))として規定されているが、近年、さらに、映像の明るさを拡張するハイダイナミックレンジ(HDR)に注目が集まっている。表示装置の技術向上により、「黒」の表示輝度は変えず、表示装置の最大輝度(ピーク輝度)を増大すること(ダイナミックレンジを拡張すること)が可能となってきた。再現範囲が広がった領域をハイライト再現に用いて、新たな視聴体験を提供する、現実に近いハイライト再現(鏡面反射や光沢の再現)が可能となる、ハイライト部の白飛びなどの改善効果がある、とされている(総務省「情報通信審議会 情報通信技術分科会ITU部会 放送業務委員会(第19回)配付資料」, 2015年9月2日開催。http://www.soumu.go.jp/main_sosiki/joho_tsusin/policyreports/joho_tsusin/docs_Broadcast/02ryutsu08_03000224.html)。
【0036】
最新のカメラでは、イメージセンサの進化により、これまでのダイナミックレンジを越えて撮像することが可能となっており、拡張された信号レベルを圧縮するための非線形の伝達関数を、各社が独自に提案している(S-Log: A new LUT for digital production mastering and interchange applications, https://pro.Sony.com/bbsccms/assets/files/mkt/cinema/solutions/slog_manual.pdf、V-Log/V-Gamut REFERENCE MANUAL, http://Pro-av.Panasonic.net/jp/varicam/common/pdf/VARICAM_V-Log_V-Gamut.pdf、 Canon-Log Cine Optoelectronic Transfer Function, http://learn.usa.canon.com/app/pdfs/white_papers/White_Paper_Clog_optoelectronic.pdf)。
【0037】
そのような伝達関数は、光−電気伝達関数(Opto−Electrical Transfer Function,OETF)、およびその逆関数としての電気−光伝達関数(Electro−Optical Transfer Function,EOTF)と呼ばれ、主に指数・対数関数により定義されている。
【0038】
ハイブリッドLogガンマ(HLG)(ARIB STD-B67 Version 1.0, Essential parameter values for the extended image dynamic range television (EIRTV) system for programme production (2015))と呼ばれるものは、NHK(日本放送協会)とBBC(英国放送協会)の共同で提案されている方式であり、そのOETFは、従来の標準ダイナミックレンジ(SDR)におけるカンマ補正関数と対数関数を組み合わせた非線形の伝達関数である[文献3、文献13]。 PQ (Perceptual Qunatizer)(SMPTE ST2084:2014, Dynamic range electro-optical transfer function of mastering reference displays (2014))と呼ばれるものは、4K(UHD)ブルーレイディスク
TM(登録商標)における標準HDR方式として採用されているものである(White Paper Blu-ray Disc
TM Read-Only Format, Coding constraints on HEVC video streams for BD-ROM Version 3.0, June 2015. http://www.blu-raydisc.com/Assets/Downloadablefile/BD-ROM-AV-WhitePaper_HEVC_150608a-clean.pdf)。
【0039】
図4は、ハイブリッドLogガンマ(Hybrid Log−Gamma)を、PQ(Perceptual Qunatizer)のOETFを標準ダイナミックレンジ(BT.709(Recommendation ITU-R BT.709-5, Parameter values for the HDTV standards for production and international programme exchange (2002))/BT.2020(Recommendation ITU-R BT.2020-1, Parameter values for ultra-high definition television systems for production and international programme exchange (2014)))のOETF(カンマ補正関数)とともに示す図である。
図4に示すように、ハイブリッドLogガンマ(Hybrid Log−Gamma)(SMPTE ST2084:2014, Dynamic range electro-optical transfer function of mastering reference displays (2014))[文献3、文献13]、 PQ (Perceptual Quantizer)(White Paper Blu-ray Disc
TM Read-Only Format, Coding constraints on HEVC video streams for BD-ROM Version 3.0, June 2015. http://www.blu-raydisc.com/Assets/Downloadablefile/BD-ROM-AV-WhitePaper_HEVC_150608a-clean.pdf)、標準ダイナミックレンジ(BT.709(Recommendation ITU-R BT.709-5, Parameter values for the HDTV standards for production and international programme exchange (2002))/BT.2020(Recommendation ITU-R BT.2020-1, Parameter values for ultra-high definition television systems for production and international programme exchange (2014)))の光−電気伝達関数(OETF)である。
図4に示すように、PQは、ハイブリッドLogガンマで表現可能な最大レベル入力12.0(1200%)で出力が1.0(100%)になるように調整している。標準ダイナミックレンジのOETF(ガンマ補正関数)は、1.0以上の出力を1.0にクリップしている。
【0040】
HDR映像は100%を越える信号レベルを様々な非線形のOETFによりレベル変換したものを、圧縮・伝送し、これを受像機側で元の信号レベル(リニアRGB)に戻して高輝度表示するものであるが、シーンによっては、擬似輪郭状の妨害が現れる。特に、空のような高輝度、かつ低コントラストで階調が滑らかに変化する領域に発生しやすい(例えば、空に縞状の模様が現れたように表示されてしまう)。
【0041】
そのような現象は、カラーバンディング(Color banding)として知られており、レベル変換を行うEOTF/OETFの計算処理に伴う演算誤差や、リニアRGBにおける色補正等の各種プロセス処理、そして、OETFによりレベル変換されたHDR映像の圧縮・伸長等が原因と考えられる。画像/映像圧縮における歪みのひとつの形態とも言えるだろう。
【0042】
Bhagavathyらは、マルチスケール解析に基づく確率的なディザリングによりカラーバンディングを抑制した[文献2]。水野らは、カラーバンディングを階調補間するために、2次元補間問題を1次元ポアソン方程式に帰着させて解いた[文献16]。Baughらは、RGB画素レベルにより領域分割したブロック中の画素数からバンディング領域を検出し、バンディング領域に対して、近傍ブロックからの距離に応じた重み付け平滑化によりカラーバンディングを除去した[文献1]。従来方法の多くは、反復を伴う最適化処理や画像全体を用いる大域的な処理であり、画素をラスクスキャンしながら行う局所的な処理ではない。
【0043】
本提案では、HDR映像において発生する擬似輪郭状の妨害であるカラーバンディングを簡易な画像処理により補正することを目的とする。具体的には、注目画素の近傍ブロック領城中の輝度値とその標準偏差からバンディング候補画素を検出する。標準偏差が小さいほど、画像内容は平坦に近く、カラーバンディングが発生する可能性がある。さらに、バンディングは高輝度値の領域に発生しやすい。そして、近傍ブロック領域の画素において、できるだけ似た色で、明るさが近い画素に対する重みを大きくして、輝度信号の重み付け平均を行うことにより、バンディングを除去する。
【0044】
問題は、そのようなデバンディング処理フィルタにおけるパラメータの決定方法である。画像処理においては、何らかの調整パラメータが存在するのが普通であり、調整パラメータをどのように決定するかは、それぞれの処理の内容や画像/映像内容によるとされて、主観評価による経験的な値が用いられている。本提案では、インターネット検索により収集した画像を用いた学習により、デバンディング処理フィルタの最適パラメータを自動的に決定することを試みる。インターネット検索画像を原画像として擬似カラーバンディング画像を生成し、バンディング特微量を抽出する。原画像と擬似カラーバンディング画像の間のカルバック・ライブラー情報量が最小となる最適パラメータを滑降シンプレックス法により推定し、バンディング特微量に対する最適パラメータを重回帰分析と変数選択(モデル選択)により決定する。
【0045】
画像から得られる特微量により画像内容を認識する試みが、2000年代に盛んに研究された[文献4]。SIFT特徴量[文献14]をサポートベクタマシン(Support Vector Machine,SVM)[文献21]により学習を行い判別する方法である。インターネットから得られる大量画像を用いて、画像復元を行う研究も行われた。Haysらは、類似シーン画像を用いて欠損画像の自動補完を行い[文献7]、Kevinらは、ホワイトバランス補正、コントラスト強調、そして、露光補正による画像修復を行った[文献11]。
【0046】
一方、近年一大ブームの様相を呈しているのが、何らかの画像特徴を用いるのではなく、画像をそのまま用いて学習を行う“深層学習(Deep Learning)”と呼ばれる方法である[文献12]。深層学習処理の本質は、畳み込みニューラルネットワークと呼ばれる“フィルタである。画像認識だけではなく、様々な画像処理にも用いられている[文献9、文献6、文献5、文献22]。松永は、超高精細映像におけるフォーカス補正を目的として、最小構成の畳み込みニューラルネットワークによるフォーカスずれ画像のデブラー復元性能を実験的に評価した[文献15]。
【0047】
本提案の構成は、2章でカラーデバンディング処理の手順について説明する。3章でデバンディング処理フィルタのパラメータを自動最適化するためのインターネット検索画像を用いた最適パラメータ学習について説明する。4章で画像シミュレーションにより、カラーバンディングのない画像から擬似的なカラーバンディング画像を生成して、カラーデバンディング処理を行う。カラーデバンディング処理画像をカルバック・ライブラー情報量により定量的に評価する。そして、インターネット検索画像を用いた最適パラメータ学習によるデバンディング処理の評価結果を示して、5章で纏める。
【0048】
(2 カラーデバンディング処理)
図1は、カラーデバンディング処理のブロック図である。カラーデバンディング処理の手順は、次のようになる。
1、カラーRGB入力を輝度色差YC
BC
Rに変換する(RGB→YC
BC
R)。
2、変換したYの画素値の近傍ブロック領域における標準偏差を計算して、しきい値(Threshold1)以下の画素をバンディング候補画素とする(Band Detect)。さらに、Yの画素値が別のしきい値(Threshold2)以上である条件を加える。そのようにして得られたバンディング候補画素に対して、2値メジアンフィルタにより、マスク整形を行ったものをバンドマスク(Band Mask)とする。
【0049】
3、近傍ブロック領域におけるC
BC
R、およびYの画素値のレベル距離による重みを計算して(Weight Calc.)、その重み(Weight)を用いて、Yを重み付け平均する(Weight Average)。ただし、バンドマスク(Band Mask)によるバンディング候補画素に対してのみ重み付け平均を行う。バンディング候補画素における重み付け平均の際に、近傍ブロック領城中のバンディング候補画素以外の画素の重みは0とする。
4、そのような重み付け平均されたY’とC
BC
RをRGBに変換して(YC
BC
R→RGB)、出力する。
【0050】
輝度値Yの重み付け平均は、色差信号C
BC
R、および輝度信号Yから計算した重み係数wを用いて、次のように計算する。
【0052】
重み係数wは、色差信号C=(C
B,C
R)
Tのレベル距離による重みw
rCと輝度信号Yのレベル距離による重みw
rYの積であり、それぞれガウス関数により次のように定義する。
【0054】
σ
rC,σ
rYはそれぞれ色差信号、輝度信号のレベル距離の許容範囲を調整するパラメータである。これは、輝度信号に対する領域選択的かつ画素値のレベル距離による重み”のみ”のバイラテラルフィルタ[文献20]である(Yaroslavskyフィルタ[文献23]として知られているものであり、バイラテラルフィルタにおける空間的な距離による重みをbox関数としたものに相当する。)。
【0055】
重み付け平均やバンドマスクのマスク整形のための2値メジアンフィルタに用いる近傍ブロック領域の画素を広範囲に得るために、飛び飛びに画素を取得するa trousアルゴリズム[文献8]を用いてもよい。
【0056】
(3 デバンディング処理パラメータの自動最適化)
カラーバンディングを除去するデバンディング処理フィルタの最適パラメータを予測するための事前の最適パラメータ学習の手順は次のようになる(
図5(a)参照)。ここで、
図5は、カラーデバンディング処理パラメータの自動最適化について説明する図であり、
図5(a)がカラーデバンディング処理の最適パラメータ学習のブロック図を示し、
図5(b)が最適パラメータ予測によるカラーデバンディング処理のブロック図を示すものである。
1、インターネットにより画像検索を行い、適当な画像を複数ダウンロードする。(この際、検索及びダウンロードによる画像取得は自動的に遂行するようにしてもよい)
2、ダウンロードした画像を原画像として擬似カラーバンディング画像を生成する。擬似カラーバンディング画像は、画像の輝度値Yを
【0058】
に変換したものを、s倍することにより生成する。ここで、sは任意の正数であり、
【0060】
は小数部を切り捨てる床関数である。
3、擬似カラーバンディング画像におけるバンディング候補画素領域からバンディング特微量を抽出する。
4、デバンディング処理パラメータを、原画像とデバンディング処理画像の間のバンディング候補画素の輝度値ヒストグラムから計算したカルバック・ライブラー情報量[文献19]が最小となるように、滑降シンプレックス法(Nelder−Mead法)[文献18]により推定する。
5、バンディング特微量と最適デバンディング処理パラメータの組み合わせに対して、重回帰分析を行い、赤池情報量規準(AIC)による変数選択(モデル選択)[文献19]により、最適デバンディング処理パラメータを予測するための最適なモデルを決定する。
【0061】
(3.1 バンディング特微量の抽出)
バンディング特徴量としては、バンディング候補画素領域Bにおける
・輝度値YのバンディングギャップBG
・輝度値Yのバンディングエッジ強度平均
【0063】
・1次元輝度値Yの標準偏差σ
Y
・2次元色差値C
BC
Rの分散共分散行列V[C
B,C
R]
が考えられる。パラメータ数は、それぞれ1,1,1,3であるから、6次元のベクトルになる(分散共分散行列は対称行列なので、V[C
B,C
R]のパラメータ数は3である)。2次元色差値C
BC
Rの分散共分散行列V[C
B,C
R]を固有値分解により標準形として[文献10]、その固有値λ
1,λ
2(λ
1≧λ
2)を用いるとすれば、5次元ベクトルになる。
【0064】
輝度値Yのバンディングギャップ特微量は、バンディング候補画素の輝度値ヒストグラムの最大頻度値から決定したしきい値によりヒストグラムを2値化する。そして、2値化輝度値ヒストグラムの、1値と1値の間の0値の個数による複数の間隔のメジアン値をバンディングギャップBGに相当する特微量とする。
【0065】
バンディングエッジ強度平均特微量は、バンディング候補画素領域Bにおけるエッジ強度の平均値
【0069】
ただし、Y(i,j)は画素座標(i,j)のバンディング候補画素領域Bにおける輝度値であり、γはエッジ強度値のゲイン定数である。
【0071】
を計算する際には、γeがしきい値T
γe以上の画素を用いる。したがって、Mはバンディング候補画素のうち、γeがT
γe以上の画素数である。
2次元色差値C=(C
B,C
R)
Tの分散共分散行列V[C]の(m,n)要素は、次のようになる。
【0073】
の解である[文献10]。
(3.2 デバンディング処理の最適パラメータ推定と重回帰分析)
デバンディング処理パラメータは、
・色差信号C
BC
Rのレベル距離を許容するパラメータσ
rC
・輝度信号Yのレベル距離を許容するパラメータσ
rY
の2つである。
デバンディング処理パラメータは、原画像とデバンディング処理画像の間のバンディング候補画素の輝度値ヒストグラムから計算したカルバック・ライブラー情報量[文献19]が最小になるように、滑降シンプレックス法(Nelder−Mead法)[文献18]により推定する。ただし、できるだけ小さいσ
rC,σ
rYを推定するために、最終的な目的関数Jを次のように定義する。
【0075】
ここで、第1項はカルバック・ライブラー情報量であり、バンディング候補画素領域Bにおける原画像の輝度値ヒストグラムP(Y)、デバンディング処理パラメータθによるデバンディング処理画像の輝度値ヒストグラムQ(Y;θ)から計算される。第2項は正則化項である。νは正則化パラメータであり、原画像と推定パラメータにおけるデバンディング処理画像の間の近さと推定パラメータの大きさに対するトレードオフを調整する。
【0076】
デバンディング処理におけるブロック領域は正方ブロックとして、そのブロックサイズは固定とする。したがって、バンディング特微量の5次元ベクトルからデバンディング処理の最適パラメータを決定する。
【0078】
式(10)(11)それぞれの部分モデルの当てはめも行い、赤池情報量規準(AIC)による変数選択(モデル選択)[文献19]により、デバンディング処理の最適パラメータを予測するための最適なモデルを決定する。
【0079】
実際のバンディング画像では、抽出したバンディング特微量に対して、式(10)(11)の最適モデルから予測される最適パラメータによりデバンディング処理を行う(
図5(b)参照)。
【0080】
(4 画像シミュレーション)
(4.1 デバンディング処理結果)
図6はカラーデバンディング処理の画像シミュレーションの一例について説明する図である。
図6(a)は、原画像(400×265画素サイズ)であり、
図6(b)は原画像から生成した擬似カラーバンディング画像である。原画像の輝度値を1/6倍して小数部を切り捨てしたものを6倍することにより生成した(輝度値スケールs=6)。
図6(c)は、擬似カラーバンディング画像の5×5ブロック領域における輝度値の標準偏差を画素毎に計算して、しきい値5以下、および輝度値100以上をカラーバンディング候補画素(白)としたバンディングマスク画像である。孤立画素が目立つため、2値メジアンフィルタ処理により、マスク整形したものが、
図6(d)である。ブロックサイズ7×7の2値メジアンフィルタの結果を、さらに、ブロックサイズ11×11の2値メジアンフィルタにより処理した。バンディングマスク画像(d)によるバンディング候補画素に対して、デバンディング処理した結果が
図6(e)である。デバンディング処理パラメータは、σ
rC=5,σ
rY=7,ブロックサイズ11×11(1画素飛び)として、デバンディング処理を行った。
図6(f)は、バンディング候補画素領域の輝度値ヒストグラムである。原画像(Original)とそれぞれ擬似カラーバンディング画像(Banding)、カラーデバンディング処理画像(Debanding)の結果である。ヒストグラムから計算した原画像に対するそれぞれのカルバック・ライブラー情報量は、1.788016から0.292420に減少しており、デバンディング処理画像の方が原画像に近づいている。
【0081】
(4.2 デバンディング処理の最適パラメータ学習結果)
カラーデバンディング処理フィルタの最適パラメータの学習には、バンディングが発生する可能性が高いと予想される階調が滑らかに変化している空を含む画像100枚をインターネットから検索して用いた。
図7にカラーデバンディング処理フィルタの最適パラメータの学習に用いた画像を示す(Flickr,http://www.flickr.com/,Commercial use &mods allowedの画像を用いた)。
【0082】
学習用画像毎に輝度値スケールs=5,6,7,8として、擬似カラーバンディング画像を生成し、そのデバンディング処理画像と原画像の間のカルバック・ライブラー情報量に基づく、式(9)の目的関数Jを最小とするデバンディング処理パラメータσ
rC,σ
rYを滑降シンプレックス法により推定した。滑降シンプレックス法は局所最適化により初期値依存性を示すため、初期値を変えて推定を行った結果のうち、J値が最小になるものを最終的な結果とした。最適化パラメータの初期値をそれぞれ区間{σ
rC|5≦σ
rC≦20},{σ
rY|5≦σ
rY≦20}の一様乱数、取り得るパラメータの最小値最大値をそれぞれ1、100として、各20回推定した。
【0083】
デバンディング候補画素は、5×5ブロック領域の輝度値の標準偏差5以下、画像上部40%領域における輝度値の平均、および標準偏差から決定したしきい値以上の画素を検出して、ブロックサイズ11×11の2値メジアンフィルタ処理を2回行うことによりマスク整形した。デバンディング処理におけるブロックサイズは、19×19(1画素飛び)に固定して、正則化パラメータを、ν=0.008として最適化を行った。
【0084】
そのようにして推定したデバンディング処理フィルタの最適パラメータと擬似カラーバンディング画像のバンディング特徴量
【0086】
に対して重回帰分析を行った。重回帰分析と変数選択(モデル選択)には、R言語(The R Project for Statistical Computing, http://www.r-project.org/)を用いた。デバンディング処理フィルタの最適パラメータの重回帰分析と変数選択(モデル選択)の結果を
図8に示す。
【0087】
表1は、カラーデバンディング処理フィルタの最適パラメータ学習による評価の結果である。カラーデバンディング処理フィルタの最適パラメータの学習に用いたものとは異なる評価用画像100枚によりカラーデバンディング処理を行った。評価用画像を原画像として生成した擬似カラーバンディング画像のバンディング特微量に対して、学習用画像による最適パラメータ学習の結果から評価用画像の最適パラメータを予測してデバンディング処理を行ったものと、滑降シンプレックス法により推定した最適パラメータによりデバンディング処理を行ったものである。それぞれ、原画像と擬似カラーバンディング画像、原画像とデバンディング処理画像の間のカルバック・ライブラー情報量の平均である(括弧内は標準偏差)。学習用画像による最適パラメータ学習の結果から最適パラメータを予測した場合でも、滑降シンプレックス法により推定した最適パラメータによるデバンディング処理結果の良い近似になっていることがわかる。
【0089】
図9は、最適パラメータ学習によるデバンディング処理画像例である。評価用画像のうちの1枚を原画像
図9(a)として生成した擬似カラーバンディング画像
図9(b)からバンディング特微量を抽出して、最適パラメータ学習の結果からデバンディング処理の最適パラメータを予測した。
【0090】
図9(c)は、バンディング候補画素領域における式(5)のエッジ強度γeを計算した結果を合成して表示している。エッジ強度ゲインγ=5.0として、γe値が10以上のエッジ強度の平均値
【0093】
図9(d)は、バンディング候補画素における輝度値Yのヒストグラム(Histo)、およびその2値化輝度値ヒストグラム(BinHisto)である。最大頻度値の40%をしきい値として2値化したヒストグラムの1値と1値の間の0値の複数間隔のメジアン値によるバンディングギャップBGは6であった。輝度値の標準偏差σ
Yは26.806264であり、色差値の分散共分散行列の固有値λ
1,λ
2は、それぞれ86.252465,1.037179であった。
【0094】
図9(e)及び
図9(f)は、それぞれ、最適パラメータ学習により予測した最適パラメータによるデバンディング処理画像、滑降シンプレックス法により推定した最適パラメータによるデバンディング処理画像である。最適パラメータ学習による予測パラメータは、(σ
rC,σ
rY)=(1.848697,9.340442)であり、滑降シンプレックス法による最適パラメータは、(σ
rC,σ
rY)=(2.215408,9.954125)であった。原画像との間のカルバック・ライブラー情報量は、それぞれ0.069092,0.057761であり、疑似カラーバンディング画像と原画像の間のカルバック・ライブラー情報量は、1.818045であった。
【0095】
(5 まとめ)
HDR映像において発生する擬似輪郭状の妨害である“カラーバンディング”を簡易な画像処理により補正した。具体的には、注目画素の近傍ブロック領城中の輝度値とその標準偏差からバンディング候補画素を検出した。そして、近傍ブロック領域の画素において、できるだけ似た色で、明るさが近い画素に対する重みを大きくして、輝度信号の重み付け平均を行うことにより、バンディングを除去した。
【0096】
デバンディング処理フィルタのパラメータを自動最適化するために、
・インターネットから収集した複数の画像から擬似カラーバンディング画像を生成するとともに、簡易な画像処理によりバンディング特微量を抽出した。
・擬似カラーバンディング画像に対して、原画像との間のカルバック・ライブラー情報量を最小化するデバンディング処理フィルタの最適パラメータを滑降シンプレックス法により推定した。
・バンディング特微量に対するデバンディング処理フィルタの最適パラメータを予測するための最適なモデルを重回帰分析と赤池情報量規準(AIC)による変数選択(モデル選択)により決定した。
【0097】
今後の課題としては、
・デバンディング処理フィルタのパラメータのみならず、ブロックサイズや最適化における正則化パラメータといったハイパーパラメータ、そして、バンディング候補画素領域を検出するための各種しきい値の自動最適化
・マルチコアCPU/GPU/FPGAによるHDR映像のリアルタイム処理の実現が挙げられる。深層学習によるデバンディング処理の実現可能性の探求も興味深いところである。
【0098】
(参考文献)
[1] G. Baugh, A. Kokaram, and F. Pitie, Advanced videodebanding, Proceedings of the 11th European Conference on Visual Media Production (CVMP'14), London, United Kingdom, (November 2014).
[2] S. Bhagavathy, J. Llach and J. Zhai, Multiscale probabilistic dithering for suppressing contour artifacts in digital images, IEEE Transactions on Image Processing, 18-9 (September 2009), 1936-1945.
[3] T. Borer and A. Cotton, A "display independent"high dynamic range television system, IBC2015 Conference, RAI, Amsterdam, the Netherlands, (September 2015).
[4] G. Csurka, C. Bray, C. Dance, and L. Fan, Visual categorization with bags of keypoints, Proceedings of ECCV Workshop on Statistical Learning in Computer Vision (SLCV), pp. 59-74 (2004).
[5] C. Dong, C.-C. Loy, K. He, and X. Tang, Learning a deep convolutional network for image superresolution, Proceedings of 13th European Conference on Computer Vision (ECCV2014), Part IV, Zurich,Switzerland, pp. 184-199 (September 2014).
[6] D. Eigen, D. Krishnan, and R. Fergus, Restoring an image taken through a window covered with dirt or rain, IEEE International Conference on Computer Vision (ICCV2013), Sydney, Australia, pp. 633-640(December 2013).
[7] J. Hays, and A. A. Efros, Scene completion using millions of photographs, ACM SIGGRAPH(SIGGRAPH'07), New York, NY, USA,Article 4 (August 2007).
[8] M. Holschneider, R. Kronland-Martinet, J. Morlet,and P. Tchamitchian, A real-time algorithm for signal analysis with the help of the wavelet transform, In Wavelets, Time-Frequency Methods and Phase Space,289-297, Springer-Verlag, 1989.
[9] V. Jain and H. S. Seung, Natural image denoising with convolutional networks, Proceedings of Advances in Neural Information Processing Systems 21(NIPS2008), pp. 769-776 (2008).
[10] 金谷健一, 「これなら分かる応用数学教室:最小二乗法からウェーブレットまで」, 共立出版, 2003 年6 月.
[11] D. Kevin, M. K. Johnson, K. Sunkavalli, W. Matusik, and H. Pfister, Image restoration using online photo collections, Proceedings IEEE 12th International Conference on Computer Vision (ICCV),Kyoto, Japan, pp. 2217-2224 (September - October 2009).
[12] A. Krizhevsky, I. Sutskever, and G. E. Hinton, ImageNet classification with deep convolutional neuralnetworks, Proceedings of Advances in Neural Information Processing Systems 25 (NIPS2012), pp. 1106-1114 (2012).
[13] Y. Kusakabe, Y. Ikeda, N. Shirai, K. Masaoka, T.Yamashita, Y. Nishida, T. Ikeda, and M. Sugawara,Extended image dynamic range system for UHDTV broadcasting, IBC2015 Conference, RAI, Amsterdam, the Netherlands, (September 2015).
[14] D. Lowe, Distinctive image features from scaleinvariant keypoints, International Journal of Computer Vision, 60-2 (January 2004), 91-110.
[15] 松永力, 超高精細映像のための畳み込みニューラルネットワークによるフォーカス補正, 第22 回画像センシングシンポジウム(SSII2016) 講演論文集, 横浜(パシフィコ横浜), 2016 年6 月.
[16] 水野暁, 五十嵐正樹, 池辺将之, ポアソン方程式を用いた画像の滑らかな階調復元, 映像情報メディア学会誌,67-8 (2013), J326-J333.
[17] 日本放送協会, 「スーパーハイビジョン映像技術」特集号, NHK 技研R&D, No. 137, 2013 年1 月.
[18] W. H. Press, S. A. Teukolsky, W. T. Vetterling, and B.P. Flannery, Numerical Recipes 3rd Edition: The Art of Scientific Computing, Cambridge University Press,September 2007.
[19] 坂元慶行, 石黒真木夫, 北川源四郎, 「情報量統計学」,共立出版, 1983 年.
[20] C. Tomasi and R. Manduchi, Bilateral filtering forgray and color images, Proceedings of the Sixth IEEE International Conference on Computer Vision (ICCV'98), Bombay, India, (January 1998).
[21] V. N. Vapnik, Statistical Learning Theory, Wiley,1998.
[22] L. Xu, J. S. Ren, C. Liu, and J. Jia, Deep convolutional neural network for image deconvolution, Proceedings of Advances in Neural Information Processing Systems 27 (NIPS2014), pp. 1790-1798 (2014).
[23] L. P. Yaroslavsky, Digital Picture Processing: An Introduction, Springer Verlag, 1985.