(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】情報処理装置、情報処理端末、方法、プログラム、およびモデル
(51)【国際特許分類】
H04N 1/46 20060101AFI20240910BHJP
H04N 1/60 20060101ALI20240910BHJP
G06T 1/00 20060101ALI20240910BHJP
H04N 25/10 20230101ALI20240910BHJP
【FI】
H04N1/46
H04N1/60
G06T1/00 510
H04N25/10
(21)【出願番号】P 2022511430
(86)(22)【出願日】2020-03-31
(86)【国際出願番号】 JP2020014971
(87)【国際公開番号】W WO2021199367
(87)【国際公開日】2021-10-07
【審査請求日】2023-03-02
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】荻原 康樹
【審査官】豊田 好一
(56)【参考文献】
【文献】Po-Tong WANG et al.,“Colorimetric Characterization of Color Image Sensors Based on Convolutional Neural Network Modeling”,Sensors and Materials,Vol. 31,No. 5,2019年05月16日,pp.1513 - 1522
【文献】Javier VAZQUEZ-CORRAL et al.,“Color Stabilization Along Time and Across Shots of the Same Scene, for One or Several Cameras of Unknown Specifications”,IEEE Transactions on Image Processing,Vol. 23,No. 10,2014年10月,pp.4564-4575
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/46
H04N 1/60
G06T 1/00
H04N 25/10
(57)【特許請求の範囲】
【請求項1】
第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得する取得部と、
前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う学習部と
を備えた、情報処理装置。
【請求項2】
前記第1の画像は、前記第1の3D-LUTのパラメータを変えて撮影され現像された複数の画像である、請求項1に記載の情報処理装置。
【請求項3】
前記第1の3D-LUTおよび前記第2の3D-LUTとは、RGB-LUT、またはYCbCr-LUTである、請求項1に記載の情報処理装置。
【請求項4】
前記色見本とは、カラーチャート、またはグレースケールチャートである、請求項1に記載の情報処理装置。
【請求項5】
第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得する取得部と、
第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する推定部と
を備えた、情報処理装置。
【請求項6】
前記色見本とは、カラーチャート、またはグレースケールチャートである、請求項5に記載の情報処理装置。
【請求項7】
前記第1の3D-LUTおよび前記第2の3D-LUTとは、RGB-LUT、またはYCbCr-LUTである、請求項5に記載の情報処理装置。
【請求項8】
前記取得部はさらに、第3のカメラ装置によって前記色見本を撮影し現像した第3の画像を取得し、
前記推定部はさらに、前記モデルに、前記第3の画像を入力することにより、前記第3の画像での前記色見本の色を前記第1のカメラ装置で再現するための第3の3D-LUTを推定し、
前記第2の3D-LUTと、前記第3の3D-LUTとの差分に基づいて、前記第3のカメラ装置の色表現に合わせるための前記第2のカメラ装置用の差分3D-LUTを生成する生成部をさらに備えた、請求項5に記載の情報処理装置。
【請求項9】
前記第2のカメラ装置、および前記第3のカメラ装置は、同一機種、または異機種である、請求項8に記載の情報処理装置。
【請求項10】
請求項5に記載の情報処理装置の前記推定部により推定された前記第2の3D-LUTを記憶した記憶部を備えた、情報処理端末。
【請求項11】
前記第2の3D-LUTの第1のパラメータの数は、前記情報処理端末の表示色数よりも少なく、
前記第1のパラメータから、前記第2の3D-LUTでは再現できない色を再現するための第2のパラメータを補完する補完部をさらに備えた、請求項10に記載の情報処理端末。
【請求項12】
情報処理装置が、
第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得し、
前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う
処理を実行する、方法。
【請求項13】
情報処理装置が、
第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得し、
第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する
処理を実行する、方法。
【請求項14】
情報処理装置に、
第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得し、
前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う
処理を実行させる、プログラム。
【請求項15】
情報処理装置に、
第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得し、
第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する
処理を実行させる、プログラム。
【請求項16】
第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルであって、
第2のカメラ装置によって前記色見本を撮影し現像した第2の画像が入力される入力層と、
前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを出力する出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と
を含み、
情報処理装置が、前記入力層に入力された前記第2の画像に応じて、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記第2の3D-LUTを前記出力層から出力する
ように
前記情報処理装置を機能させるためのモデル。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理端末、方法、プログラム、およびモデルに関する。
【背景技術】
【0002】
スマートフォンやタブレットPC(Personal Computer)などに搭載されるカメラ機能の高性能化により、カメラ機能に対しデジタル一眼カメラなどのカメラ技術を移植する動きが加速している。そのため、スマートフォンなどによって撮影された画像に対する色表現の要求も高くなっており、スマートフォンなどでも3Dルックアップテーブル(3D-LUT)のような高度な補正ブロックを搭載し、色補正する事は有効な手段である。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、3D-LUTを用いた色再現の設計の難易度は高く、膨大なパラメータ設定が必要である。特に、異なる機種間は当然ながら、同一機種間でもイメージセンサなどのばらつきによって撮影画像の色表現に違いが出てしまうため、3D-LUTパラメータ設定には非常に時間を要する。
【0005】
そこで、本開示では、3D-LUTをより容易に生成することができる情報処理装置、情報処理端末、方法、プログラム、およびモデルを提案する。
【課題を解決するための手段】
【0006】
本開示によれば、第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得する取得部と、前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う学習部とを備えた、情報処理装置が提供される。
【0007】
また、本開示によれば、第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得する取得部と、第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する推定部とを備えた、情報処理装置が提供される。
【0008】
また、本開示によれば、情報処理装置が、第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得し、前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う処理を実行する、方法が提供される。
【0009】
また、本開示によれば、情報処理装置が、第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得し、第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する処理を実行する、方法が提供される。
【0010】
また、本開示によれば、情報処理装置に、第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得し、前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う処理を実行させる、プログラムが提供される。
【0011】
また、本開示によれば、情報処理装置に、第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得し、第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する処理を実行させる、プログラムが提供される。
【0012】
また、本開示によれば、第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルであって、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像が入力される入力層と、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを出力する出力層と、前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素とを含み、情報処理装置が、前記入力層に入力された前記第2の画像に応じて、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記第2の3D-LUTを前記出力層から出力するように前記情報処理装置を機能させるためのモデルが提供される。
【図面の簡単な説明】
【0013】
【
図1】本実施形態に係る情報処理装置100の機能構成例を示すブロック図である。
【
図2】一般的なカメラ信号処理の一例を示す図である。
【
図3】本実施形態に係る色再現LUT推定モデルの学習の一例を示す図である。
【
図4】同実施形態に係る3D-LUTのパラメータ変更の一例を示す図である。
【
図5】同実施形態に係る色再現LUT推定モデルによる3D-LUTの推定の一例を示す図である。
【
図6】同実施形態に係る色再現LUT推定モデルの学習処理の流れを示すフローチャートである。
【
図7】同実施形態に係る色再現LUT推定モデルによる3D-LUTの推定処理の流れを示すフローチャートである。
【
図8】同実施形態に係る色再現LUT推定モデルを用いた同一機種間の色表現のばらつき補正の一例を示す図である。
【
図9】同実施形態に係る色再現LUT推定モデルを用いた異機種間の色表現整合の一例を示す図である。
【
図10】同実施形態に係る情報処理装置100のハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0014】
以下に、本実施形態について図面に基づいて詳細に説明する。なお、本明細書および図面において、実質的に同一の部位には、同一の符号を付することにより重複する説明を省略する。
【0015】
なお、説明は以下の順序で行うものとする。
1.実施形態
1.1.機能構成例
1.2.機能の詳細
1.3.機能の流れ
2.変形例
2.1.変形例1
2.2.変形例2
3.ハードウェア構成例
4.まとめ
【0016】
<1.実施形態>
<<1.1.機能構成例>>
まず、本実施形態に係る情報処理装置100の機能構成例について説明する。情報処理装置100は、スマートフォンやカメラなどのメーカーによって管理されるサーバ装置であってもよいし、据え置き端末やノートPCであってもよい。なお、情報処理装置100は、クラウドコンピューティングサービスを提供する企業によって管理されるクラウドサーバ装置であってもよい。また、情報処理装置100は1台のコンピュータで構成される必要はなく、複数台のコンピュータで構成される分散型コンピューティングシステムであってもよい。
【0017】
情報処理装置100は、第1のカメラ装置によって標準光源下で色見本を撮影した画像を現像した画像を入力データ、当該画像の現像に使用された3D-LUTを正解データとする教師データを学習して学習モデルを構築し、当該学習モデルを用いて、第2のカメラ装置によって色見本を撮影した別画像から、別画像での色見本の色を第1のカメラ装置で再現するための3D-LUTを推定することを特徴とする。なお、カメラ装置は、カメラ機能を搭載したスマートフォンなどであってもよいし、デジタルカメラなどカメラそのものであってもよい。
【0018】
図1は、本実施形態に係る情報処理装置100の機能構成例を示すブロック図である。
図1に示すように、本実施形態に係る情報処理装置100は、記憶部110、取得部120、学習部130、推定部140、生成部150、制御部170を備える。
【0019】
(記憶部110)
本実施形態に係る記憶部110は、各種プログラムやデータを一時的または恒常的に記憶するための記憶領域である。記憶部110には、情報処理装置100が各種機能を実行するためのプログラムやデータが記憶されてよい。具体的な一例として、記憶部110には、色見本を撮影した画像を現像した画像から当該画像の色を再現するための3D-LUTを推定するための学習モデル(色再現LUT推定モデル)や学習のための教師データ、各種設定などを管理するための管理データなどが記憶されてよい。もちろん、上記はあくまで一例であり、記憶部110に記憶されるデータの種別は特に限定されない。
【0020】
(取得部120)
本実施形態に係る取得部120は、色再現LUT推定モデルの学習フェーズでは、他のカメラ装置の色表現を再現させるカメラ装置(「第1のカメラ装置」に相当)によって色見本を撮影した画像を現像した画像(「第1の画像」に相当)、および当該画像の現像に使用された3D-LUTを取得する。また、取得部120は、色再現LUT推定モデルの認識(推定)フェーズでは、3D-LUTが推定されるカメラ装置(「第2のカメラ装置」に相当)によって色見本を撮影した画像を現像した画像(「第2の画像」に相当)を取得する。
【0021】
(学習部130)
本実施形態に係る学習部130は、取得部120によって取得された標準光源下で色見本を撮影した画像を現像した画像(「第1の画像」に相当)を入力データ、当該画像の現像に使用された3D-LUT(「第1の3D-LUT」に相当)を正解データとする教師データを学習して色再現LUT推定モデルを構築する。
【0022】
なお、本実施形態の色再現LUT推定モデルは、色見本を撮影した画像を現像した画像が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された画像に応じて、出力層以外の各層に属する各要素を第1要素として、第1要素と前記第1要素の重みとに基づく演算を行うことにより、色見本を撮影した画像を現像した画像の色を再現するための3D-LUTを出力層から出力するよう、情報処理装置100を機能させる。
【0023】
なお、本実施形態の学習モデルを生成する生成装置(例えば、サーバ装置などの情報処理装置100)は、いかなる学習アルゴリズムを用いて上述の学習モデルを生成してもよい。例えば、生成装置は、ニューラルネットワーク(NN:Neural Network)、サポートベクターマシン(SVM:Support Vector Machine)、強化学習などの学習アルゴリズムを用いて本実施形態の学習モデルを生成してもよい。一例として、生成装置がNNを用いて本実施形態の学習モデルを生成するとする。この場合、学習モデルは、1つ以上のニューロンを含む入力層と、1つ以上のニューロンを含む中間層と、1つ以上のニューロンを含む出力層とを有していてもよい。
【0024】
ここで、本実施形態に係る学習モデルが「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、学習モデルが含む第1要素は、x1やx2などといった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンとみなすことができる。各モデルを単純パーセプトロンとみなした場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードとみなすことができる。
【0025】
また、本実施形態に係る学習モデルがDNN(Deep Neural Network)など、1つまたは複数の中間層を有するNNで実現されるとする。この場合、学習モデルが含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。
【0026】
上述した回帰モデルやNNなど、任意の構造を有する学習モデルを用いて、色見本を撮影した画像を現像した画像の色を再現するための3D-LUTを算出する。より具体的には、学習モデルは、色見本を撮影した画像を現像した画像が入力された場合に、当該画像の色を再現するための3D-LUTを出力するように係数が設定される。本実施形態に係る学習モデルは、データの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。
【0027】
なお、上記例では、本実施形態に係る学習モデルが、色見本を撮影した画像を現像した画像が入力された場合に、当該画像の色を再現するための3D-LUTを出力するモデル(モデルAとする)である例を示した。しかしながら、本実施形態に係る学習モデルは、モデルAに対しデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、本実施形態に係る学習モデルは、色見本を撮影した画像を現像した画像を入力とし、モデルAが出力する当該画像の色を再現するための3D-LUTを出力とする学習モデル(モデルBとする)であってもよい。または、本実施形態に係る学習モデルは、色見本を撮影した画像を現像した画像を入力とし、モデルBが出力する当該画像の色を再現するための3D-LUTを出力とする学習モデルであってもよい。
【0028】
(推定部140)
本実施形態に係る推定部140は、第1のカメラ装置によって標準光源下で色見本を撮影した第1の画像を入力データ、第1の画像の現像に使用された第1の3D-LUTを正解データとして学習した色再現LUT推定モデルに、第2のカメラ装置によって色見本を撮影した第2の画像を入力することにより、第2の画像での色見本の色を第1のカメラ装置で再現するための第2の3D-LUTを推定する。
【0029】
(生成部150)
本実施形態に係る生成部150は、基準カメラ装置の3D-LUTと被調整カメラ装置の3D-LUTとの差分に基づいて、基準カメラ装置の色表現に合わせるための被調整カメラ装置用の差分3D-LUTを生成する。また、生成部150は、3D-LUTのパラメータを所定の条件で変更し、色再現LUT推定モデルのための教師データを生成する。
【0030】
(補完部160)
本実施形態に係る補完部160は、推定部140によって推定された3D-LUTのパラメータの数(例えば、33×33×33の約3万6千)がカメラ装置の表示色数(例えば、RGB各色8bitの約1677万色)よりも少なく再現できない色がある場合、推定された3D-LUTのパラメータから、再現できない色を再現するためのパラメータを補完する。補完方法は、例えば、テトラヘドラル補完や多項式近似、上述したDNNなどであってよい。
【0031】
(制御部170)
本実施形態に係る制御部170は、情報処理装置100全体を司る処理部であり、情報処理装置100が備える各構成を制御する。制御部170が有する機能の詳細については後述される。
【0032】
以上、本実施形態に係る情報処理装置100の機能構成例について説明した。なお、
図1を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理装置100の機能構成は係る例に限定されない。例えば、情報処理装置100は、必ずしも
図1に示す構成のすべてを備えなくてもよいし、学習モデルによる学習と推定を別々の装置で行う場合は、推定部140などの各構成を情報処理装置100とは異なる別の装置に備えることも可能である。本実施形態に係る情報処理装置100の機能構成は、仕様や運用に応じて柔軟に変形可能である。
【0033】
また、各構成要素の機能を、CPU(Central Proccessing Unit)などの演算装置がこれらの機能を実現する処理手順を記述した制御プログラムを記憶したROM(Read Only Memory)やRAM(Random Access Memory)などの記憶媒体から制御プログラムを読み出し、そのプログラムを解釈して実行することにより行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜利用する構成を変更することが可能である。また、情報処理装置100のハードウェア構成の一例については後述される。
【0034】
<<1.2.機能の詳細>>
次に、本実施形態に係る情報処理装置100が有する機能について詳細に説明する。本実施形態は、スマートフォンなどの第1のカメラ装置で撮影した色見本の画像と、その現像に使用された3D-LUTとで学習された色再現LUT推定モデルを用いて、第1のカメラ装置とは別の第2のカメラ装置で撮影された画像の色を第1のカメラ装置で再現するための3D-LUTを推定するために行われる。そのため、本実施形態に係る主な処理は色再現LUT推定モデルの学習フェーズと、推定フェーズとに分かれる。なお、両フェーズは、同一の装置で実行されてもよいし、別々の装置で実行されてもよい。
【0035】
まず、本実施形態について説明する前に、スマートフォンなどのカメラ装置で写真を撮影した際のカメラ信号処理について説明する。
図2は、一般的なカメラ信号処理の一例を示す図である。
図2は、カメラ機能を備えたスマートフォンなどである情報処理端末200によって実行される各種処理である。情報処理端末200は、デジタルカメラなどのカメラ装置であってもよい。
【0036】
情報処理端末200は、カメラレンズを通して入射した被写体の光をイメージセンサによってRAWデータ25に変換する。
図2の例では、RAWデータ25は色見本を撮影した画像データであり、べイヤー(Bayer)フィルタによってべイヤー配列に並べられた信号である。色見本は、マクベスチャートなどの複数の色を含むカラーチャートである。しかしながら、色見本は、マクベスチャート以外のより多くの色を含むチャートであってもよい。
【0037】
RAWデータ25は、線形性補正をはじめ、ノイズ除去や減光補正など各種補正処理を経て調整された後、デモザイクおよびカラーマトリクス処理によって、RGB信号であるフルカラー画像データに変換される。また、
図2の例では、RGB信号からさらにYUV(またはYCbCr)信号に変換され、現像画像データ30が出力される。
【0038】
ここで、RAWデータ25の色表現を調整するための3D-LUTを用いた変換処理は、一般的に、カラーマトリクス処理の後や、RGBからYUV信号への変換処理の後に挿入されられることが多い。どちらに挿入されるか、またはどちらにも挿入されるかは、情報処理端末200によって異なる。また、挿入する3D-LUTは情報処理端末200によって異なり、情報処理端末200ごとに生成する必要がある(ゼロから生成する必要はなくても、少なくとも3D-LUTのパラメータを調整するなどは必要である)。
【0039】
そのため、本実施形態では、色再現LUT推定モデルを用いて3D-LUTを推定(生成)する。次に、この色再現LUT推定モデルの学習フェーズについて説明する。
図3は、本実施形態に係る色再現LUT推定モデルの学習の一例を示す図である。
【0040】
標準光源装置10は、ブース状になっており、異なる場所で撮影する場合であっても、装置内に被写体を設置することで光源環境を統一することができる装置である。
図3に示すように、色見本20を標準光源装置10内に設置し、情報処理端末200によって色見本20が撮影される。そして、情報処理装置100は、情報処理端末200によって撮影された色見本20の現像画像210を入力データ、現像画像210の現像に使用された3D-LUT(厳密には、3D-LUTのパラメータなどを示す3D-LUTデータ220)を正解データとして、色再現LUT推定モデルの学習を行う。具体的には、例えば、3D-LUTのパラメータの初期状態は、入力された現像画像210の色を何も変更しないようなパラメータで、当該パラメータを所定の条件で変更しながら色見本20の撮影画像に対して現像処理を繰り返し行い、多数の教師データを生成することで色再現LUT推定モデルの学習を繰り返す。
【0041】
次に、教師データを生成するための3D-LUTのパラメータ変更について説明する。
図4は、本実施形態に係る3D-LUTのパラメータ変更の一例を示す図である。
図4に示すように、1つの3D-LUTデータ220-1のパラメータを変更して、複数の3D-LUTデータ220-2~220-n(nは任意の整数。)を生成する。なお、3D-LUTデータ220-1のパラメータの変更は、例えば、
図4に示すように、周囲の格子点をランダムに変更することによって行われる。このようにして生成された3D-LUTデータ220-2~220-nをそれぞれ用いて、情報処理端末200によって撮影された色見本20を現像し、現像された複数の画像を教師データとして取得する。
【0042】
次に、色再現LUT推定モデルの推定フェーズについて説明する。
図5は、本実施形態に係る色再現LUT推定モデルによる3D-LUTの推定の一例を示す図である。
図5の色再現LUT推定モデルは、
図3で説明した、情報処理端末200によって撮影され現像された現像画像210を入力データ、現像画像210の現像に使用された3D-LUTデータ220を正解データとして学習されたモデルである。
【0043】
図5に示すように、色見本20を標準光源装置10内に設置し、カメラ装置300によって色見本20が撮影される。次に、情報処理装置100は、カメラ装置300によって撮影された色見本20の現像画像310を、色再現LUT推定モデルに入力することで、3D-LUT(厳密には、3D-LUTデータ320)を推定する。
【0044】
推定される3D-LUTデータ320は、カメラ装置300によって撮影された現像画像310の色を、情報処理端末200で再現するための3D-LUT(データ)である。そのため、この3D-LUTデータ320を情報処理端末200の記憶部に記憶し適用することで、情報処理端末200で撮影された画像で、カメラ装置300によって撮影され現像された現像画像310の色を再現することができるようになる。
【0045】
<<1.3.機能の流れ>>
次に、
図6を用いて、色再現LUT推定モデルの学習処理の手順について説明する。
図6は、本実施形態に係る色再現LUT推定モデルの学習処理の流れを示すフローチャートである。
【0046】
図6に示すように、まず、他のカメラ装置の色表現を再現させるカメラ装置を用いて、標準光源下で色見本を撮影する(ステップS101)。ステップS101で撮影した撮影画像は、インターネットなどの各種通信網や通信ケーブルなどを介して情報処理装置100に送信される。
【0047】
次に、情報処理装置100の取得部120は、ステップS101で撮影し現像した現像画像、および当該現像画像の現像に使用した3D-LUTを取得する(ステップS102)。
【0048】
次に、情報処理装置100の学習部130は、ステップS102で取得した、現像画像を入力データ、3D-LUTを正解データとして、色再現LUT推定モデルの学習を行う(ステップS103)。ステップ103の後、本処理は終了するが、情報処理装置100の生成部150によって3D-LUTを所定の条件で変更し、変更された3D-LUTを使用してステップS101~ステップ103を実行することで、色再現LUT推定モデルの学習を繰り返し行う。これにより、他のカメラ装置で撮影され現像された色見本の画像を色再現LUT推定モデルに入力することで、他のカメラ装置の色表現を、学習に用いたカメラ装置で再現するための3D-LUTを推定することができる。
【0049】
次に、
図7を用いて、色再現LUT推定モデルによる3D-LUTの推定処理について説明する。
図7は、本実施形態に係る色再現LUT推定モデルによる3D-LUTの推定処理の流れを示すフローチャートである。
【0050】
図7に示すように、まず、色再現LUT推定モデルの学習に用いたカメラ装置に対して、色表現を再現する他のカメラ装置を用いて、標準光源下で色見本を撮影する(ステップS201)。ステップS201で撮影し現像した撮影画像も、インターネットなどを介して情報処理装置100に送信される。
【0051】
次に、情報処理装置100の取得部120は、ステップS201で撮影し現像した現像画像を取得する(ステップS202)。
【0052】
次に、情報処理装置100の推定部140は、ステップS202で取得した現像画像を色再現LUT推定モデルに入力し、3D-LUTを推定する(ステップS203)。ステップ203の後、本処理は終了するが、推定された3D-LUTを、色再現LUT推定モデルの学習に用いたカメラ装置の記憶部に記憶し適用することで、ステップS201で撮影画像を撮影した他のカメラ装置の色表現を再現させることができる。
【0053】
<2.変形例>
<<2.1.変形例1>>
また、色再現LUT推定モデルを用いて、カメラ装置間の色表現のばらつきを補正することもできる。カメラ装置を量産した場合、イメージセンサなどのばらつきによって同一の機種であっても、機種間で色表現に違いが出てしまう。そこで、量産されるカメラ装置の中から基準となる基準装置を決定し、他の装置の色表現を基準装置に合わせることで、同一機種間の色表現のばらつきを補正する。
【0054】
図8は、本実施形態に係る色再現LUT推定モデルを用いた同一機種間の色表現のばらつき補正の一例を示す図である。
図8は、基準となる基準カメラ装置400の色表現に合うように調整される被調整カメラ装置500の例を示している。ここで、基準カメラ装置400および被調整カメラ装置500は同一機種である。
【0055】
図8に示すように、基準カメラ装置400で標準光源装置10内に設置された色見本20を撮影する。そして、基準カメラ装置400で撮影され現像された現像画像410を色再現LUT推定モデルに入力することで、3D-LUTデータ420を推定する。同様に、被調整カメラ装置500で標準光源装置10内に設置された色見本20を撮影し、撮影され現像された現像画像510を色再現LUT推定モデルに入力することで、3D-LUTデータ520を推定する。
【0056】
次に、推定された3D-LUTデータ420と3D-LUTデータ520との対応するパラメータの差分によって、差分3D-LUTを生成する。この差分3D-LUTを被調整カメラ装置500の記憶部に記憶し適用することにより、被調整カメラ装置500の色表現を調整し、基準カメラ装置400の色表現に合わせることができる。以上の処理を、基準カメラ装置400と同一機種の量産されたカメラ装置の各々で行うことで、同一機種間の色表現のばらつきを補正することができる。
【0057】
<<2.2.変形例2>>
また、
図8で説明した補正処理を異なる機種のカメラ装置間で行うことにより、一方のカメラ装置で、他機種のカメラ装置の色表現を再現することができる。
図9は、本実施形態に係る色再現LUT推定モデルを用いた異機種間の色表現整合の一例を示す図である。
図9は、基準となる基準カメラ装置400の色表現に合うように調整される被調整カメラ装置600の例を示している。ここで、基準カメラ装置400と被調整カメラ装置600とは異なる機種である。
【0058】
図9の処理も、
図8同様、基準カメラ装置400および被調整カメラ装置600のそれぞれで、標準光源装置10内に設置された色見本20を撮影し、撮影され現像された現像画像410および610をそれぞれ色再現LUT推定モデルに入力することで、3D-LUTデータ420および620を推定する。
【0059】
そして、推定された3D-LUTデータ420と3D-LUTデータ620との差分3D-LUTを生成し、被調整カメラ装置600の記憶部に記憶し適用することにより、被調整カメラ装置600の色表現を調整し、異なる機種の基準カメラ装置400の色表現に合わせることができる。
【0060】
<3.ハードウェア構成例>
次に、本実施形態に係る情報処理装置100のハードウェア構成例について説明する。
図10は、本実施形態に係る情報処理装置100のハードウェア構成例を示すブロック図である。
図10を参照すると、情報処理装置100は、例えば、プロセッサ801と、ROM802と、RAM803と、ホストバス804と、ブリッジ805と、外部バス806と、インターフェース807と、入力装置808と、出力装置809と、ストレージ810と、ドライブ811と、接続ポート812と、通信装置813と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
【0061】
(プロセッサ801)
プロセッサ801は、例えば、演算処理装置または制御装置として機能し、ROM802、RAM803、ストレージ810、またはリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般またはその一部を制御する。
【0062】
(ROM802、RAM803)
ROM802は、プロセッサ801に読み込まれるプログラムや演算に用いるデータなどを格納する手段である。RAM803には、例えば、プロセッサ801に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータなどが一時的または永続的に格納される。
【0063】
(ホストバス804、ブリッジ805、外部バス806、インターフェース807)
プロセッサ801、ROM802、RAM803は、例えば、高速なデータ伝送が可能なホストバス804を介して相互に接続される。一方、ホストバス804は、例えば、ブリッジ805を介して比較的データ伝送速度が低速な外部バス806に接続される。また、外部バス806は、インターフェース807を介して種々の構成要素と接続される。
【0064】
(入力装置808)
入力装置808には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、およびレバーなどが用いられる。さらに、入力装置808としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置808には、マイクロフォンなどの音声入力装置が含まれる。
【0065】
(出力装置809)
出力装置809は、例えば、CRT(Cathode Ray Tube)、LCD、または有機ELなどのディスプレイ装置、スピーカ、ヘッドホンなどのオーディオ出力装置、プリンタ、携帯電話、またはファクシミリなど、取得した情報を利用者に対して視覚的または聴覚的に通知することが可能な装置である。また、本実施形態に係る出力装置809は、触覚刺激を出力することが可能な種々の振動デバイスを含む。
【0066】
(ストレージ810)
ストレージ810は、各種のデータを格納するための装置である。ストレージ810としては、例えば、ハードディスクドライブ(HDD)などの磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどが用いられる。
【0067】
(ドライブ811)
ドライブ811は、例えば、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体901に記録された情報を読み出し、またはリムーバブル記録媒体901に情報を書き込む装置である。
【0068】
(接続ポート812)
接続ポート812は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS-232Cポート、または光オーディオ端子などのような外部接続機器902を接続するためのポートである。
【0069】
(通信装置813)
通信装置813は、ネットワークに接続するための通信デバイスであり、例えば、有線または無線LAN、Bluetooth(登録商標)、またはWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、または各種通信用のモデムなどである。
【0070】
(リムーバブル記録媒体901)
リムーバブル記録媒体901は、例えば、DVDメディア、Blu-ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディアなどである。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、または電子機器などであってもよい。
【0071】
(外部接続機器902)
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、またはICレコーダなどである。
【0072】
なお、本実施形態に係る記憶部110は、ROM802やRAM803、ストレージ810によって実現される。また、プロセッサ801によって実現される本実施形態に係る制御部170が、取得部120、学習部130、推定部140、生成部150、補完部160を実現する各制御プログラムを、ROM802やRAM803などから読み出し実行する。
【0073】
<4.まとめ>
以上説明したように、第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得する取得部と、第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3D-LUTを正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する推定部とを備えた、情報処理装置が提供される。
【0074】
これにより、3D-LUTをより容易に生成することができる。
【0075】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0076】
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
【0077】
なお、本技術は以下のような構成も取ることができる。
(1)第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像しに使用された第1の3Dルックアップテーブル(3D-LUT)を取得する取得部と、
前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う学習部と
を備えた、情報処理装置。
(2)前記第1の画像は、前記第1の3D-LUTのパラメータを変えて撮影され現像された複数の画像である、前記(1)に記載の情報処理装置。
(3)前記第1の3D-LUTおよび前記第2の3D-LUTとは、RGB-LUT、またはYCbCr-LUTである、前記(1)または(2)に記載の情報処理装置。
(4)前記色見本とは、カラーチャート、またはグレースケールチャートである、前記(1)~(3)のいずれか1つに記載の情報処理装置。
(5)第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得する取得部と、
第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する推定部と
を備えた、情報処理装置。
(6)前記色見本とは、カラーチャート、またはグレースケールチャートである、前記(5)に記載の情報処理装置。
(7)前記第1の3D-LUTおよび前記第2の3D-LUTとは、RGB-LUT、またはYCbCr-LUTである、前記(5)または(6)に記載の情報処理装置。
(8)前記取得部はさらに、第3のカメラ装置によって前記色見本を撮影し現像した第3の画像を取得し、
前記推定部はさらに、前記モデルに、前記第3の画像を入力することにより、前記第3の画像での前記色見本の色を前記第1のカメラ装置で再現するための第3の3D-LUTを推定し、
前記第2の3D-LUTと、前記第3の3D-LUTとの差分に基づいて、前記第3のカメラ装置の色表現に合わせるための前記第2のカメラ装置用の差分3D-LUTを生成する生成部をさらに備えた、前記(5)~(7)のいずれか1つに記載の情報処理装置。
(9)前記第2のカメラ装置、および前記第3のカメラ装置は、同一機種、または異機種である、前記(8)に記載の情報処理装置。
(10)前記(5)~(9)のいずれか1つに記載の情報処理装置の前記推定部により推定された前記第2の3D-LUTを記憶した記憶部を備えた、情報処理端末。
(11)前記第2の3D-LUTの第1のパラメータの数は、前記情報処理端末の表示色数よりも少なく、
前記第1のパラメータから、前記第2の3D-LUTでは再現できない色を再現するための第2のパラメータを補完する補完部をさらに備えた、前記(10)に記載の情報処理端末。
(12)情報処理装置が、
第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得し、
前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う
処理を実行する、方法。
(13)情報処理装置が、
第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得し、
第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する
処理を実行する、方法。
(14)情報処理装置に、
第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像、および前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を取得し、
前記第1の画像を入力データ、前記第1の3D-LUTを正解データとして、第2のカメラ装置によって前記色見本を撮影し現像した第2の画像から、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを生成するモデルの学習を行う
処理を実行させる、プログラム。
(15)情報処理装置に、
第2のカメラ装置によって色見本を撮影し現像した第2の画像を取得し、
第1のカメラ装置によって標準光源下で前記色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルに、前記第2の画像を入力することにより、前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを推定する
処理を実行させる、プログラム。
(16)第1のカメラ装置によって標準光源下で色見本を撮影し現像した第1の画像を入力データ、前記第1の画像の現像に使用された第1の3Dルックアップテーブル(3D-LUT)を正解データとして学習したモデルであって、
第2のカメラ装置によって前記色見本を撮影し現像した第2の画像が入力される入力層と、
前記第2の画像での前記色見本の色を前記第1のカメラ装置で再現するための第2の3D-LUTを出力する出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と
を含み、
前記入力層に入力された前記第2の画像に応じて、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記第2の3D-LUTを前記出力層から出力する
ように情報処理装置を機能させるためのモデル。
【符号の説明】
【0078】
10 標準光源装置
20 色見本
25 RAWデータ
30 現像画像データ
100 情報処理装置
110 記憶部
120 取得部
130 学習部
140 推定部
150 生成部
160 補完部
170 制御部
200 情報処理端末
210、310、410、510、610 現像画像
220、320、420、520、620 3D-LUTデータ
300 カメラ装置
400 基準カメラ装置
500 被調整カメラ装置
600 被調整カメラ装置