IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 凸版印刷株式会社の特許一覧

特開2024-10804分光情報画像推定装置、分光情報画像推定方法及びプログラム
<>
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図1
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図2
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図3
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図4
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図5
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図6
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図7
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図8
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図9
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図10
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図11
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図12
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図13
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図14
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図15
  • 特開-分光情報画像推定装置、分光情報画像推定方法及びプログラム 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024010804
(43)【公開日】2024-01-25
(54)【発明の名称】分光情報画像推定装置、分光情報画像推定方法及びプログラム
(51)【国際特許分類】
   G06V 10/58 20220101AFI20240118BHJP
   G06T 7/00 20170101ALI20240118BHJP
   G01J 3/51 20060101ALI20240118BHJP
   G01J 3/02 20060101ALI20240118BHJP
【FI】
G06V10/58
G06T7/00 350B
G01J3/51
G01J3/02 C
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022112314
(22)【出願日】2022-07-13
(71)【出願人】
【識別番号】000003193
【氏名又は名称】TOPPANホールディングス株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100139686
【弁理士】
【氏名又は名称】鈴木 史朗
(74)【代理人】
【識別番号】100169764
【弁理士】
【氏名又は名称】清水 雄一郎
(74)【代理人】
【識別番号】100147267
【弁理士】
【氏名又は名称】大槻 真紀子
(72)【発明者】
【氏名】千葉 崇人
(72)【発明者】
【氏名】酒井 修二
(72)【発明者】
【氏名】渡邉 隆史
【テーマコード(参考)】
2G020
5L096
【Fターム(参考)】
2G020AA08
2G020CB55
2G020CC28
2G020CC63
2G020CD06
2G020CD12
2G020CD24
2G020CD36
2G020CD38
2G020DA13
2G020DA34
5L096AA02
5L096AA06
5L096CA02
5L096DA01
5L096DA02
5L096GA51
5L096HA11
5L096KA04
(57)【要約】
【課題】RGB画像(3バンドの画像、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の4バンド以上の分光情報画像(分光反射率画像、分光画像)を、容易に、かつより精度高く推定することが可能な分光情報画像推定装置を提供する。
【解決手段】本発明の分光情報画像推定装置は、被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定部と、前記第1分光反射率推定部によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定部と、を備える。
【選択図】図13
【特許請求の範囲】
【請求項1】
被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定部と、
前記第1分光反射率推定部によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定部と、
を備えることを特徴とする分光情報画像推定装置。
【請求項2】
前記第1分光反射率推定部は、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とを第1機械学習モデルに入力し、前記第1分光情報画像を推定する
ことを特徴とする請求項1に記載の分光情報画像推定装置。
【請求項3】
前記第2分光反射率推定部は、前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とを第2機械学習モデルに入力し、前記第2分光情報画像を推定し、
前記第2機械学習モデルは、入力された前記第1分光情報画像の分光情報と、前記撮像装置分光感度と、前記光源分光分布とに基づきRGB画像を生成し、入力されたRGB画像と生成したRGB画像との損失が小さくなるよう前記第2機械学習モデルのパラメータを繰り返し更新することで、前記第1分光情報画像を補正する、
ことを特徴とする請求項1に記載の分光情報画像推定装置。
【請求項4】
前記第2分光反射率推定部は、前記第2機械学習モデルの前記パラメータの初期値として、事前学習によって算出した値を設定する、
ことを特徴とする請求項3に記載の分光情報画像推定装置。
【請求項5】
前記第1機械学習モデルは、分光反射率が既知のRGB画像である教師画像と、前記教師画像を撮像した撮像装置の撮像分光感度と、前記教師画像を撮像した環境の光源分光分布とを教師データとし、前記教師画像の既知の分光情報と、前記第1機械学習モデルの推定する前記第1分光情報画像の分光情報との誤差から求めた値を損失とし、機械学習した学習済みモデルである、
ことを特徴とする請求項2に記載の分光情報画像推定装置。
【請求項6】
前記損失は、前記第1機械学習モデルの推定する前記第1分光情報画像の分光情報、前記教師画像を撮像した撮像装置の撮像分光感度、及び前記教師画像を撮像した環境の前記光源分光分布から生成されるRGB画像と、前記教師画像のRGB画像との誤差を含んでいる、
ことを特徴とする請求項5に記載の分光情報画像推定装置。
【請求項7】
前記損失は、推定される前記第1分光情報画像における隣接する波長間の分光反射率の差分を含んでいる、
ことを特徴とする請求項5に記載の分光情報画像推定装置。
【請求項8】
前記損失は、第1積分値と第2積分値との差から求める値を含み、
前記第1積分値は、前記教師画像の既知の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値であり、
前記第2積分値は、前記第1機械学習モデルによって推定された前記第1分光情報画像の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である、
ことを特徴とする請求項5に記載の分光情報画像推定装置。
【請求項9】
前記損失は、前記教師画像の既知の分光情報から算出されるLAB色空間の値と、前記第1機械学習モデルによって推定された前記第1分光情報画像の分光情報から算出されるLAB色空間の値に基づき算出される色差を含んでいる、
ことを特徴とする請求項5に記載の分光情報画像推定装置。
【請求項10】
前記損失は、推定される前記第2分光情報画像における隣接する波長間の分光反射率の差分を含んでいる、
ことを特徴とする請求項3に記載の分光情報画像推定装置。
【請求項11】
前記損失は、教師画像の既知の分光情報と、前記第2機械学習モデルの推定する前記第2分光情報画像の分光情報との誤差から求めた値を含んでいる、
ことを特徴とする請求項4に記載の分光情報画像推定装置。
【請求項12】
前記損失は、前記第2機械学習モデルの推定する前記第2分光情報画像の分光情報、前記教師画像を撮像した撮像装置の撮像分光感度、及び前記教師画像を撮像した環境の前記光源分光分布から生成されるRGB画像と、前記教師画像のRGB画像との誤差を含んでいる、
ことを特徴とする請求項11に記載の分光情報画像推定装置。
【請求項13】
前記損失は、推定される前記第2分光情報画像における隣接する波長間の分光反射率の差分を含んでいる、
ことを特徴とする請求項11に記載の分光情報画像推定装置。
【請求項14】
前記損失は、第1積分値と第3積分値との差から求める値を含み、
前記第1積分値は、前記教師画像の既知の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値であり、
前記第3積分値は、前記第2機械学習モデルによって推定された前記第2分光情報画像の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である、
ことを特徴とする請求項11に記載の分光情報画像推定装置。
【請求項15】
前記損失は、前記教師画像の既知の分光情報から算出されるLAB色空間の値と、前記第2機械学習モデルによって推定された前記第2分光情報画像の分光情報から算出されるLAB色空間の値に基づき算出される色差を含んでいる、
ことを特徴とする請求項11に記載の分光情報画像推定装置。
【請求項16】
複数の分光情報画像を含む分光情報画像データセット、複数の光源分光分布を含む光源分光分布データセット、及び複数の撮像装置分光感度を含む撮像装置分光感度データセットの各データセットから分光情報画像、光源分光分布、及び撮像装置分光感度をそれぞれ選択し、選択した分光情報画像、光源分光分布、及び撮像装置分光感度からRGB画像を教師画像として生成するデータ生成部と、
生成された前記教師画像を用いて、前記機械学習モデルを生成する機械学習モデル生成部と、
をさらに備える請求項2又は請求項4に記載の分光情報画像推定装置。
【請求項17】
前記データ生成部は、選択した分光情報画像、光源分光分布、及び撮像装置分光感度に対して任意の倍率を与えることで、前記教師画像を生成するための分光情報画像、光源分光分布、及び撮像装置分光感度を新しく生成する、
ことを特徴とする請求項16に記載の分光情報画像推定装置。
【請求項18】
前記光源分光分布データセットは、前記光源分光分布における含有比率が大きい分光成分を含み、
前記撮像装置分光感度データセットは、前記撮像装置分光感度における含有比率が大きい分光成分を含み、
前記データ生成部は、前記分光成分に対して所定の係数を乗算し、乗算結果を加算あるいは減算することで、前記教師画像を生成するための前記光源分光分布又は撮像装置分光感度を新しく生成する、
ことを特徴とする請求項16に記載の分光情報画像推定装置。
【請求項19】
第1分光反射率推定部が、被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定過程と、
第2分光反射率推定部が、前記第1分光反射率推定部によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定過程と、
を含むことを特徴とする分光情報画像推定方法。
【請求項20】
コンピュータを、
被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定手段と、
前記第1分光反射率推定手段によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定手段と、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、RGB画像から分光情報画像(分光画像)を推定する分光情報画像推定装置、分光情報画像推定方法及びプログラムに関する。
【背景技術】
【0002】
物体が撮像された画像や映像から、当該物体の解析や分析を行う際に、分光反射率が利用されている。
そのため、物体の測色値を高い精度で取得するため、撮影された画像から被写体の分光反射率を推定して色推定を行なうことが行われる。
この場合、マルチバンドカメラで物体を撮像して、撮像した画像からマルチバンド(4バンド以上、例えば31バンド)の分光反射率としての分光画像を取得している。
また、マルチバンドカメラにより撮像した画像から物体の分光反射率を推定する際には、このマルチバンドカメラの各バンドの分光感度特性、及び被写体の分光的な統計情報を用いて推定を行っている。
【0003】
しかし、マルチバンドカメラが高価なため、一般的に用いられている3バンドのデジタルカメラにより撮像した色成分R、色成分G及び色成分Bの3個の色のバンド(Rチャネル、Gチャネル及びBチャネルの各チャネル)の画像(以下、RGB画像)から、マルチバンドの分光情報を有する分光画像を推定することが行われている。
ここで、入力データをRGB画像とした機械学習モデル(CNN(Convolutional Neural Networks)、ディープラーニングなど)により、RGB画像における各画素の分光反射率の推定し、分光画像を推定結果として出力することが行われている(非特許文献1、非特許文献2を参照)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Jiaojiao Li, Chaoxiong Wu, Rui Song, Yunsong Li, Fei Liu, "Adaptive Weighted Attention Network with Camera Spectral Sensitivity Prior for Spectral Reconstruction from RGB Images", 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), June 2020
【非特許文献2】Zhan Shi, Chang Chen, Zhiwei Xiong, Dong Liu, Feng Wu, "HSCNN+: Advanced CNN-Based Hyperspectral Recovery from RGB Images", 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), June 2018
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記非特許文献1及び非特許文献2の各々は、高精度に物体の各々の分光特性を抽出することができるが、分光特性として分光反射率ではなく、分光放射輝度を推定している。
また、カメラ分光感度を固定して推定しているため、機械学習モデルの各々はそれぞれの撮像装置毎に作成する必要がある。
さらに、推定される分光情報が分光放射輝度であるため、撮像環境における光源の分光分布(以下、光源分光分布)が含まれた状態となっており、撮像環境の光源分光分布を用いて、分光放射輝度から分光反射率を推定する必要がある。
【0006】
このため、非特許文献1及び非特許文献2の各々の機械学習モデルでは、任意の撮像装置、かつ任意の撮像環境で撮像したRGB画像それぞれから、物体の分光反射率を簡易に求めることができない。
すなわち、非特許文献1及び非特許文献2の各々においては、対象となる撮像装置毎に、推定を行う撮像環境のそれぞれの機械学習モデルを生成する必要がある。
また、非特許文献1及び非特許文献2の各々においては、推定された分光放射輝度と光源分光分布とを用いて、物体の分光反射率を推定する処理を行う必要がある。
【0007】
本発明は、このような状況に鑑みてなされたもので、RGB画像(3バンドの画像、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の4バンド以上の分光情報画像(分光反射率画像、分光画像)を、容易に、かつより精度高く推定することが可能な分光情報画像推定装置、分光情報画像推定方法及びプログラムを提供する。
【課題を解決するための手段】
【0008】
上述した課題を解決するために、本発明の一態様に係る分光情報画像推定装置は、被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定部と、前記第1分光反射率推定部によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定部と、を備えることを特徴とする。
【0009】
本発明の一態様に係る分光情報画像推定方法は、第1分光反射率推定部が、被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定過程と、第2分光反射率推定部が、前記第1分光反射率推定部によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定過程と、を含むことを特徴とする。
【0010】
本発明の一態様に係るプログラムは、コンピュータを、被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定手段と、前記第1分光反射率推定手段によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定手段と、として機能させる。
【発明の効果】
【0011】
本発明によれば、RGB画像(3バンドの画像、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の4バンド以上の分光情報画像(分光反射率画像、分光画像)を、容易に、かつマルチバンドカメラで撮像した画像と同程度の精度で推定する分光情報画像推定装置、分光情報画像推定方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0012】
図1】RGB画像から分光反射率情報としての分光画像、あるいは、分光情報画像を出力する機械学習モデル(CNN(Convolutional Neural Network)、ニューラルネットワーク、ディープラーニングなど)の例を示す概念図である。
図2】第1の実施形態に係る分光情報画像推定装置の構成例を示すブロック図である。
図3】機械学習モデルを学習させるために用いる教師データのデータセットを有する教師データテーブルの構成例を示す図である。
図4】データ合成部12による教師データの合成について説明する概念図である。
図5】機械学習モデルに分光情報画像を推定させるために用いる撮像画像データのデータセットを有する撮像画像データテーブルの構成例を示す図である。
図6】分光情報画像データ記憶部19の分光情報画像データテーブルの構成例を示す図である。
図7】本実施形態に係る機械学習モデル生成部13による機械学習モデルの教師データによる学習処理の動作例を示すフローチャートである。
図8】本実施形態に係る分光反射率推定部14による学習済みの機械学習モデルを利用してRGB画像から分光情報画像を推定する処理の動作例を示すフローチャートである。
図9】機械学習モデル及び補正機械学習モデルの各々による、分光反射率の曲線を構成する基底関数の係数の推定を説明する概念図である。
図10】第2の実施形態における機械学習モデルの中間層に対して、撮像装置分光感度及び光源分光分布の各々のデータの入力を説明する概念図である。
図11】第3の実施形態における第1分光反射率推定部141が用いる機械学習モデルの構成例を説明する概念図である。
図12】第4の実施形態に係る分光情報画像推定装置の構成例を示すブロック図である。
図13】第5の実施形態に係る分光情報画像推定装置の構成例を示すブロック図である。
図14】第5の実施形態に係る機械学習モデル生成部13Bによる機械学習モデルの教師データによる学習処理の動作例を示すフローチャートである。
図15】第5の実施形態に係る分光反射率推定部14Bによる学習済みの機械学習モデルを利用してRGB画像から分光情報画像を推定する処理の動作例を示すフローチャートである。
図16】第5の実施形態に係る機械学習モデル生成部13Bによる補正機械学習モデルの教師データによる学習処理の動作例を示すフローチャートである。
【発明を実施するための形態】
【0013】
本発明においては、3バンドの波長である色成分R(Red)のRチャネル、色成分G(Green)のGチャネル、色成分B(Blue)のBチャネルからなる撮像画像であるRGB画像から、4バンド以上(後述する実施形態においては、一例として31バンド)の波長の分光情報画像(分光画像あるいは分光反射率画像)を推定して生成する。分光情報画像の推定は、例えば、機械学習モデルを用いて行われる。
RGB画像の各画素のRGB値(各色成分の階調度)は、画素の各々の分光反射率と、撮像画像を撮像した撮像装置の分光感度(以下、撮像装置分光感度)と、撮像画像を撮像した環境の光源の分光分布(以下、光源分光分布)とにより表される。
【0014】
図1は、RGB画像から分光反射率情報としての分光画像、あるいは、分光情報画像を出力する機械学習モデル(CNN(Convolutional Neural Network)、ニューラルネットワーク、ディープラーニングなど)の例を示す概念図である。
図1(a)は、光源分光分布と、対象物体の分光反射率と、撮像装置分光感度の各々の要素を波長(λ)ごとに乗算した乗算結果を、400nmから700nmの波長(λ)の積分値として求められることを示す式である。また、光源分光分布及び対象物体の分光反射率の各々からは、分光放射輝度が求められる。
この式から判るように、RGB画像と、光源分光分布と、撮像装置分光感度との各々を入力データのセットとして、被写体の分光反射率を推定する機械学習モデルを生成できる。
【0015】
図1(b)は、RGB画像から分光反射率情報としての分光画像、あるいは、分光情報画像を出力する機械学習モデルの例を示す概念図である。
機械学習モデル300は、例えば、RGB画像301、撮像装置分光感度302及び光源分光分布303の各々を入力データのセットとして、分光反射率の所定の波長(例えば、400nmから700nmの波長範囲における10nm刻みの波長、31バンド)の各々の分光画像305を出力する。
ここで、撮像装置分光感度302のグラフは、横軸が波長であり、縦軸が強度を示している。また、光源分光分布303のグラフは、横軸が波長であり、縦軸が強度を示している。
【0016】
<第1の実施形態>
以下、本発明の第1の実施形態について、図面を参照して説明する。
図2は、第1の実施形態に係る分光情報画像推定装置の構成例を示すブロック図である。図2に示す分光情報画像推定装置10は、例えば、PC(Personal Computer)、サーバ装置、量子コンピュータなどによって実現される。
図2において、分光情報画像推定装置10は、データ入力部11、データ合成部12、機械学習モデル生成部13、分光反射率推定部14、分光画像出力部15、教師画像データ記憶部16、撮像画像データ記憶部17、機械学習モデル記憶部18及び分光情報画像データ記憶部19の各々を備えている。
また、分光反射率推定部14は、第1分光反射率推定部141及び第2分光反射率推定部142の各々を備えている。
【0017】
データ入力部11は、外部装置から供給される教師画像データを入力し、当該教師画像データを教師画像データ記憶部16に対して書き込んで記憶させる。
図3は、機械学習モデルを学習させるために用いる教師画像データのデータセットを有する教師画像データテーブルの構成例を示す図である。
教師画像データテーブルは、レコード毎に、教師画像識別情報、RGB画像インデックス、光源分光分布インデックス、撮像装置分光感度インデックス及び分光反射率情報インデックスの各々の欄を備えている。
【0018】
教師画像識別情報は、教師画像(RGB画像であり、被写体の分光反射率が既知の画像データ)の各々を個々に識別する識別情報である。
RGB画像インデックスは、撮像画像であるRGB画像の画像データが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
RGB画像のデータは、RGB画像の画素毎の色成分R、色成分G及び色成分B(3バンド、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルからなる3チャネル)の各々の階調度(例えば、256階調)である(データ数3/画素)。
【0019】
光源分光分布インデックスは、撮像画像であるRGB画像を撮像した環境の光源の分光分布を示す光源分光分布のデータが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
光源分光分布は、例えば、400nmから700nmの波長範囲における10nm刻みの波長(31バンド)の各々の光強度の分布を示している(データ数31)。
【0020】
撮像装置分光感度インデックスは、撮像画像であるRGB画像を撮像した撮像装置の分光感度を示す撮像装置分光感度のデータが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
撮像装置分光感度は、例えば、色成分R、色成分G及び色成分Bの各々における、400nmから700nmの波長範囲における10nm刻みの波長(31バンド)の各々の光強度の分布を示している(データ数93(=3×31))。
【0021】
分光反射率情報インデックスは、撮像されたRGB画像の被写体の分光反射率の情報である分光反射率情報(既知の分光反射率情報)のデータが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
分光反射率情報は、例えば、RGB画像の画素毎に、400nmから700nmの波長範囲における10nm刻みの波長(31バンド)の各々の光強度の分布を示している(データ数31/画素)。
【0022】
図1に戻り、データ合成部12は、機械学習モデルに入力する入力データのデータセットを生成する。
すなわち、データ合成部12は、教師画像データを用いた機械学習モデルの学習を行う際、また学習済みの機械学習モデルを用いて分光情報画像の画像データを推定する際の各々において、RGB画像、光源分光分布及び撮像装置分光感度の各々のデータの調整及び合成を行う。
【0023】
入力データのデータセットとしては、上述したように、RGB画像のデータが3個、光源分光分布のデータが31個、撮像装置分光感度のデータが31×3=93個が画素毎に用いられる。
このため、データセットのデータ数としては、RGB画像が横方向(行)の画素数をW個とし、縦方向(列)の画素数をH個とした場合、(3+31+93)×W×H個となる。
ここで、データ合成部12は、データセットの各々のデータの合成処理、例えば結合(すなわち、連結)、和及び積などによる合成を行う。
【0024】
データ合成部12は、教師データの合成において、例えば、(3+31+93)×W×H個のデータを、W×H個の画素毎に配列させる。
図4は、データ合成部12による教師データの合成について説明する概念図である。
図4(a)は、W×H個の画素の各々の配列を示しており、各画素の色成分Rの階調度GR、色成分Gの階調度GG、色成分Bの階調度GBとして配列されている。
画素P1から画素Pn(n=W×H)が順次、直列に配列され、各画素の色成分R、色成分G、色成分Bも直列に配列されている。
【0025】
そして、データ合成部12は、合成における結合の処理として、図4(b)のように、撮像装置分光感度及び光源分光分布のデータを連結して結合する。
図4(b)は、データ合成部12における教師データの結合による合成を説明している。
ここで、データ合成部12は、例えば、各画素の配列において色成分Rの階調度(画素値)GR及び色成分Gの階調度GG間に、撮像装置分光感度の色成分Rの31バンドの各々のデータQRを直列に連結して挿入する。
【0026】
また、データ合成部12は、色成分Gの階調度GG及び色成分Bの階調度GBの間に、撮像装置分光感度の色成分Gの31バンドの各々のデータQGを直列に連結して挿入する。
そして、データ合成部12は、色成分Bの階調度GBの後ろに撮像装置分光感度の色成分Bの31バンドの各々のデータQBを直列に連結して挿入する。
【0027】
また、データ合成部12は、撮像装置分光感度の色成分Bの31バンドのデータQBの後ろに、光源分光分布の31バンドのデータSを直列に連結して挿入する。
ここで、撮像装置分光感度の色成分R、色成分G及び色成分Bと、光源分光分布との直列の配列が第1合成値となり、この第1合成値の各々が、図4(a)に示す画素の配列に挿入されたデータ列が図4(b)に示す第2合成値となる。
【0028】
データ合成部12は、上述した処理により、合成における結合を行い、第1分光反射率推定部141に対して出力する。
なお、データ合成部12は、合成の処理を行う際、RGB画像の画素値、撮像装置分光感度及び光源分光分布の各々のデータを、機械学習モデルの生成を行う際に教師画像データ記憶部16から読み出し、また分光情報画像の推定を行う際に撮像画像データ記憶部17から読み出し、読み出したデータの規格化を行う。
【0029】
また、データ合成部12は、合成における和の処理として、例えば、撮像装置分光感度の31バンドの波長の各々のデータに対し、光源分光分布の31バンドの同一の波長のそれぞれのデータを加算する(対応した波長のデータの和を取る)。
すなわち、データ合成部12は、撮像装置分光感度の色成分Rの31バンドの波長400のデータに対して、光源分光分布の31バンドの波長の400のデータを加算し、加算結果のデータの各々を波長のそれぞれの合成値とする。
【0030】
このように、データ合成部12は、撮像装置分光感度の色成分R、色成分G及び色成分Bの各々の31バンドのデータに対して、光源分光分布の31バンドのデータを和により合成する処理を行う(第1合成値の生成)。
そして、データ合成部12は、和を取ったデータを図4(b)に示すように、対応する画素の色成分R、色成分G及び色成分Bの各々の間に、対応する撮像装置分光感度の色成分が対応するように挿入して連結して合成する(第2合成値の生成)。
【0031】
また、データ合成部12は、合成における積の処理として、例えば、撮像装置分光感度の31バンドの波長の各々のデータに対し、光源分光分布の31バンドの同一の波長のそれぞれのデータを乗算する(対応した波長のデータの積を取る)。
すなわち、データ合成部12は、撮像装置分光感度の色成分Rの31バンドの波長400のデータに対して、光源分光分布の31バンドの波長の400のデータを乗算し、乗算結果のデータの各々を波長のそれぞれの合成値とする。
【0032】
このように、データ合成部12は、撮像装置分光感度の色成分R、色成分G及び色成分Bの各々の31バンドのデータに対して、光源分光分布の31バンドのデータを積により合成する処理を行う(第1合成値の生成)。
そして、データ合成部12は、積を取ったデータを図4(b)に示すように、対応する画素の色成分R、色成分G及び色成分Bの各々の間に、対応する撮像装置分光感度の色成分が対応するように挿入して連結して合成する(第2合成値の生成)。
【0033】
また、データ合成部12は、撮像装置分光感度及び光源分光分布の結合あるいは和または積の処理で生成した第1合成値の各々を、RGB画像の色成分R、色成分G、色成分Bのそれぞれに加算あるいは乗算して第2合成値を生成する構成としてもよい。
このとき、データ合成部12は、結合の処理により求めた第1合成値と、RGB画像の画素のデータとを結合あるいは和または積の処理により合成することにより第2合成値を求めても良い。
また、データ合成部12は、和の処理により求めた第1合成値と、RGB画像の画素のデータとを結合あるいは和または積の処理により合成することにより第2合成値を求めても良い。
また、データ合成部12は、積の処理により求めた第1合成値と、RGB画像の画素のデータとを結合あるいは和または積の処理により第2合成値を求めても良い。
【0034】
図1に戻り、機械学習モデル生成部13は、第2合成値である教師データを第1分光反射率推定部141に対して出力する。
第1分光反射率推定部141は、上記教師データを、機械学習モデルであるニューラルネットワークに対して入力させ、分光情報画像の推定処理を行う。
ここで、上記機械学習モデルは、RGB画像、撮像装置分光感度及び光源分光分布の各々から生成された教師データにより、RGB画像の画素の各々に対応して分光反射率を推定し、31バンドの分光情報画像を推定して出力する。
【0035】
そして、機械学習モデル生成部13は、教師画像データ記憶部16の教師画像データテーブルから、RGB画像における被写体の既知の分光反射率情報を読み出す。
図5は、機械学習モデルに分光情報画像を推定させるために用いる撮像画像データのデータセットを有する撮像画像データテーブルの構成例を示す図である。
撮像画像データテーブルは、レコード毎に、撮像画像識別情報、RGB画像インデックス、光源分光分布インデックス及び撮像装置分光感度インデックスの各々の欄を備えている。
【0036】
撮像画像識別情報は、撮像画像の各々を個々に識別する識別情報である。
RGB画像インデックスは、撮像画像であるRGB画像の画像データが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
RGB画像のデータは、RGB画像の画素毎の色成分R、色成分G及び色成分B(3バンド)の各々の階調度(例えば、256階調)である(データ数3/画素)。
【0037】
光源分光分布インデックスは、撮像画像であるRGB画像を撮像した環境の光源の分光分布を示す光源分光分布のデータが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
光源分光分布は、例えば、400nmから700nmの波長範囲における10nm刻みの波長(31バンド)の各々の光強度の分布を示している(データ数31)。
【0038】
撮像装置分光感度インデックスは、撮像画像であるRGB画像を撮像した撮像装置の分光感度を示す撮像装置分光感度のデータが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
撮像装置分光感度は、例えば、色成分R、色成分G及び色成分Bの各々における、400nmから700nmの波長範囲における10nm刻みの波長(31バンド)の各々の光強度の分布を示している(データ数93(=3×31))。
【0039】
図2に戻り、機械学習モデル生成部13は、機械学習モデルが推定した31バンドの分光情報画像の画素毎のデータと、既知の分光反射率情報のデータとの差分を分光誤差として求める。
また、機械学習モデル生成部13は、機械学習モデルが推定した分光反射率情報と、撮像装置分光感度と、光源分光分布とから、色成分R、色成分G及び色成分Bの階調度を求めて、推定RGB値とする。
【0040】
機械学習モデル生成部13は、分光情報画像の画素の各々の分光反射率(波長ごとの強度)から求めた推定RGB値(色成分R、色成分G及び色成分Bの階調度)と、分光反射率の推定に用いたRGB画像の各々の画素のRGB値との差分をRGB値誤差として求める。
そして、機械学習モデル生成部13は、上記分光誤差及びRGB値誤差の各々を、下記(1)式の損失関数に代入して、損失(損失値)Lを求める。
【0041】
【数1】
【0042】
上記(1)式の損失関数において、損失Lspectral及び損失LRGBの各々は、以下の(2)式に示すMSE(Mean Squared Error)損失、あるいは(3)式に示すMRAE(Mean Relative Absolute Error)損失で求められる損失(損失値)である。(1)式において、τは所定の定数である。
下記(2)式及び(3)式の各々において、xest (i)が推定値(推定された分光反射率、推定された分光反射率から求めた推定RGB値)でありxgt (i)が真値(既知の分光反射率、あるいはRGB値)である。また、iは画素の番号であり、RGB値においては、色成分R、色成分G及び色成分Bの各々で、それぞれ損失L、損失L、損失Lを求め、これらを加算して損失LRGB(=L+L+L)が求められる。
【0043】
【数2】
【0044】
【数3】
【0045】
また、物体の分光反射率は、一般的に隣接するバンド間で急峻に変化をしないため、平滑化項を(1)式に加えた以下の(4)式により、損失を求めてもよい。
(4)式における損失Lsmoothは、推定された分光反射率の隣接したバンド間の強度値の差分を規格化し、規格化したバンド間の差分を全て加算した数値である。
また、(4)式におけるτは所定の定数である。
【0046】
【数4】
【0047】
そして、機械学習モデル生成部13は、損失Lが予め設定した閾値である損失閾値(第1閾値)以下となるか否かを判定する。
機械学習モデル生成部13は、機械学習モデルであるニューラルネットワークにおける関数の係数(すなわち、ニューラルネットワークを構成する各層(特に中間層)における関数の入力、あるいは出力における重み係数)を調整し、再度、教師データを機械学習モデルに入力して、分光情報画像の推定を行う。
【0048】
そして、機械学習モデル生成部13は、機械学習モデルが推定する分光情報画像のデータと、既知の分光反射率情報のデータとの損失Lが損失閾値以下となるまで、機械学習モデルであるニューラルネットワークにおける関数の係数を調整して、機械学習モデルの学習を行う。
ここで、機械学習モデル生成部13は、(1)式あるいは(4)式により求まる損失Lが最小(最小値)となる、あるいは所定の閾値以下となる、または補正機械学習モデルに対する学習の処理の繰り返し回数が所定の回数に達するなど、所定の条件を満たすように学習させる。
また、機械学習モデル生成部13は、損失Lが損失閾値以下となった機械学習モデルを、学習済みの機械学習モデルとして機械学習モデル記憶部18に対して書き込んで記憶させる。
【0049】
データ合成部12は、任意の撮像装置及び任意の環境で撮像された撮像画像データであるRGB画像から、未知の分光情報画像を推定する場合、撮像画像データ記憶部17から、撮像装置の撮像装置分光感度、撮像した環境の光源分光分布、及び撮像画像の各々のデータを読み出し、第2合成値を生成して入力データとして第1分光反射率推定部141に出力する。
そして、第1分光反射率推定部141は、データ合成部12から供給される入力データを入力するとともに、機械学習モデル記憶部18から学習済みの機械学習モデルを読み込む。
【0050】
第1分光反射率推定部141は、読み込んだ学習済みの機械学習モデルに対して、データ合成部12から供給される入力データを入力する。
ここで、第1分光反射率推定部141は、学習済みの機械学習モデルが入力データにより推定した分光情報画像を一次分光情報画像として、第2分光反射率推定部142に対して出力する。
【0051】
第2分光反射率推定部142は、第1分光反射率推定部141の機械学習モデルと同様に、ニューラルネットワークの補正機械学習モデルを備えている。
補正機械学習モデルは、第1分光反射率推定部141から供給される一次分光情報画像を入力し、補正分光情報画像を推定して出力する。
そして、第2分光反射率推定部142は、上記一次分光情報画像に対応する撮像画像分光感度と光源分光分布とを用いて、補正分光情報画像から、RGB画像として再構成RGB画像を生成する。
【0052】
また、第2分光反射率推定部142は、第1分光反射率推定部141に入力されたRGB画像と、補正分光情報画像との各々の画素における色成分R、色成分G、色成分Bのそれぞれの階調度の差分を誤差として求める。
そして、第2分光反射率推定部142は、上記(2)式または(3)式からなる損失関数である関数LRGBからなる以下の(5)式に誤差を代入し、損失(損失値)Lを求める。(5)式におけるτは所定の定数である。
【0053】
【数5】
【0054】
分光画像出力部15は、第2分光反射率推定部142が生成した分光情報画像の画像データを、分光情報画像データ記憶部19に対して書き込んで記憶させる。
第2分光反射率推定部142は、(5)式により求まる損失Lが最小(最小値)となる、あるいは所定の閾値以下となる、または補正機械学習モデルに対する学習の処理の繰り返し回数が所定の回数に達するなど、所定の条件を満たすように学習させる。
ここで、第2分光反射率推定部142は、損失Lが所定の条件を満たした場合、その補正分光情報画像を最終的な分光情報画像として出力する。
【0055】
また、第2分光反射率推定部142は、上記(4)式と同様に、補正分光情報の各々の隣接したバンドの周波数における強度値の差分を誤差として、上記(2)式または(3)式からなる損失関数である関数Lspectralの項を含む以下の(6)式から求められる値を損失Lとし、所定の条件を満たした場合、その補正分光情報画像を最終的な分光情報画像として出力する構成としてもよい。
【0056】
【数6】
【0057】
図6は、分光情報画像データ記憶部19の分光情報画像データテーブルの構成例を示す図である。
分光情報画像データテーブルは、レコード毎に、撮像画像識別情報、RGB画像インデックス及び分光情報画像インデックスの各々の欄を備えている。
【0058】
撮像画像識別情報は、撮像画像の各々を個々に識別する識別情報であり、推定に用いたRGB画像の撮像画像識別情報と同一の情報である。
RGB画像インデックスは、撮像画像であるRGB画像の画像データが記憶されている、教師画像データ記憶部16における記憶領域を示すアドレスなどである。
RGB画像のデータは、RGB画像の画素毎の色成分R、色成分G及び色成分B(3バンド、すなわちRチャネル、Gチャネル及びBチャネルの各チャネル)の各々の階調度(例えば、256階調)である(データ数3/画素)。
【0059】
光源情報画像インデックスは、撮像画像であるRGB画像に対応する分光情報画像の画像データが記憶されている、分光情報画像データ記憶部19における記憶領域を示すアドレスなどである。
分光情報画像は、例えば、400nmから700nmの波長範囲における10nm刻みの波長(31バンド)の各々の光強度を、画像における画素の階調度としている。
このため、分光情報画像は、バンドの波長毎に一個の画像データがあり、31個の画像データからなる。
【0060】
図7は、本実施形態に係る機械学習モデル生成部13による機械学習モデルの教師データによる学習処理の動作例を示すフローチャートである。以下の説明においては、教師データがRGB画像、撮像装置分光感度及び光源分光分布と、当該RGB画像における被写体の既知の分光反射率との各々からなるデータセットである。
データセットにおいて、機械学習モデルへの入力データがRGB画像、撮像装置分光感度及び光源分光分布の各々であり、機械学習モデルの推定データが分光情報画像である。
以下の説明においては、データ入力部11が、機械学習モデルの学習に用いる教師画像データのデータセットを、予め教師画像データ記憶部16の教師画像データテーブルに予め書き込んでいる。
【0061】
ステップS101:
データ合成部12は、教師画像データ記憶部16の教師画像データテーブルから、教師画像、撮像装置分光感度及び光源分光分布の各々のデータを読み出す。
そして、データ合成部12は、撮像装置分光感度の色成分R、色成分G及び色成分Bと、光源分光分布との各々データを直列に配列して第1合成値を生成する。
【0062】
データ合成部12は、生成した第1合成値と、教師画像の画素の画素値とを、例えば図4(b)に示す配列として合成して、すべてのデータが直列に配列された第2合成値を生成し、機械学習モデル生成部13に対して出力する。
ここで、データ合成部12は、教師画像データ記憶部16の教師画像データテーブルに格納されている、複数の教師画像と、当該教師画像に対応する撮像装置分光感度及び光源分光分布とから、複数の教師画像の各々による複数の第2合成値それぞれを生成する。
これにより、機械学習モデル生成部13は、データ合成部12から供給される第2合成値としての教師データの各々を入力する。
【0063】
ステップS102:
機械学習モデル生成部13は、データ合成部12から供給される第2合成値としての教師データを、学習対象の機械学習モデルに対して並列に入力させる。
機械学習モデルは、教師データに対応して、一次分光情報画像(所定のバンド数、例えば31バンド)として分光情報画像を推定して出力する。
ここで、機械学習モデル生成部13は、教師画像データ記憶部16の教師画像データテーブルに格納されている、複数の教師画像と、当該教師画像に対応する撮像装置分光感度及び光源分光分布とから生成される複数の第2合成値を教師データとして、それぞれの一次分光情報画像の推定を行う。
【0064】
ステップS103:
機械学習モデル生成部13は、各RGB画像毎に、推定された一次分光情報画像と、RGB画像の既知の分光反射率との分光差分を求める。
また、機械学習モデル生成部13は、一次分光情報画像と、撮像装置分光感度と、光源分光分布から、再構成RGB画像を生成する。
そして、機械学習モデル生成部13は、再構成RGB画像及びRGB画像との色成分R、色成分G、色成分Gそれぞれの差分としてのRGB誤差を求める。
【0065】
ステップS104:
次に、機械学習モデル生成部13は、(2)式あるいは(3)式の損失関数に対して分光差分を代入し、損失Lspectralを求める。
機械学習モデル生成部13は、全ての教師画像において、当該教師画像の各々のバンドそれぞれにおける一次分光情報画像と、既知の分光反射率との分光差分から損失Lspectralを求める。
【0066】
また、機械学習モデル生成部13は、(2)式あるいは(3)式の損失関数に対してRGB誤差を代入し、損失LRGBを求める。
機械学習モデル生成部13は、全ての教師画像において、再構成RGB画像と、一次分光情報画像を求めたRGB画像とのRGB差分から損失LRGBを求める。
【0067】
機械学習モデル生成部13は、損失Lspectral及び損失LRGBの各々により、(1)式あるいは(4)式から、損失Lを求める。
ここで、機械学習モデル生成部13は、(4)式により損失Lを求める場合、一次分光情報画像から損失Lsmoothを求めて、(4)式に示すように、損失Lspectral、損失LRGB及び損失Lsmoothの各々を加算して損失Lを求める。
【0068】
ステップS105:
機械学習モデル生成部13は、損失Lを求める繰り返し回数が、予め設定されている所定の回数を超えたか否かの判定を行う。
このとき、機械学習モデル生成部13は、損失Lを求める繰り返し回数が所定の回数を超えた場合、処理をステップS106へ進める。
一方、機械学習モデル生成部13は、損失Lを求める繰り返し回数が所定の回数以下の場合、処理をステップS107へ進める。
【0069】
ステップS106:
機械学習モデル生成部13は、所定の回数を繰返して求めた機械学習モデルのなかから、損失Lが最小となる機械学習モデルを選択し、当該機械学習モデルを学習済みとして、機械学習モデル記憶部18に対して書き込んで記憶させる。
そして、機械学習モデル生成部13は、機械学習モデルの学習の処理、すなわち機械学習モデルの生成処理を終了する。
【0070】
ステップS107:
機械学習モデル生成部13は、機械学習モデルにおけるニューラルネットワークの関数の係数を調整する。
そして、機械学習モデル生成部13は、処理をステップS102に対して進め、再度の一次分光情報画像の推定を行う。
【0071】
図8は、本実施形態に係る分光反射率推定部14による学習済みの機械学習モデルを利用してRGB画像から分光情報画像を推定する処理の動作例を示すフローチャートである。
以下の説明においては、機械学習モデル記憶部18に学習済みの機械学習モデルが記憶されている。
【0072】
ステップS201:
データ入力部11は、RGB画像が、当該RGB画像を撮像した撮像装置の撮像装置分光感度、及び撮像した環境における光源の光源分光分布との撮像画像のデータを外部装置から読み込む。
そして、データ入力部11は、読み込んだRGB画像と、当該RGB画像に対応する撮像装置分光感度及び光源分光分布とのデータの各々を、撮像画像データ記憶部17の撮像画像テーブル(図5参照)に書き込んで記憶させる。
【0073】
ステップS202:
第1分光反射率推定部141は、機械学習モデル記憶部18から学習済みの機械学習モデルを読み出す。
また、第1分光反射率推定部141は、データ合成部12に対して、分光情報画像の推定対象の撮像画像識別情報を出力し、入力データの合成を依頼する。
【0074】
ステップS203:
データ合成部12は、撮像画像データ記憶部17の撮像画像データテーブルから、RGB画像、撮像装置分光感度及び光源分光分布の各々のデータを読み出す。
そして、データ合成部12は、撮像装置分光感度の色成分R、色成分G及び色成分Bと、光源分光分布との各々データを直列に配列して第1合成値を生成する。
第1分光反射率推定部141は、データ合成部12から供給される第2合成値としての教師データの各々を入力する。
【0075】
ステップS204:
第1分光反射率推定部141は、データ合成部12から供給される第2合成値としての入力データを、学習済みの機械学習モデルに対して並列に入力させる。
機械学習モデルは、教師データに対応して、一次分光情報画像(所定のバンド数、例えば31バンド)として分光情報画像を推定して出力する。
そして、第1分光反射率推定部141は、推定した一次分光情報画像を、第2分光反射率推定部142に対して出力する。
【0076】
ステップS205:
第2分光反射率推定部142は、第1分光反射率推定部141から供給される一次分光情報画像を入力する。
また、第2分光反射率推定部142は、上記一次分光情報画像を推定したRGB画像に対応した撮像装置分光感度及び光源分光分布の各々を、撮像画像データ記憶部17の撮像画像データテーブルから読み込む。
【0077】
そして、第2分光反射率推定部142は、一次分光情報画像を、補正機械学習モデルに対して入力する。
これにより、補正機械学習モデルは、入力される一次分光情報画像に対応して、補正分光情報画像を推定する。
【0078】
ステップS206:
第2分光反射率推定部142は、補正分光情報画像と、撮像装置分光感度及び光源分光分布の各々とにより、RGB画像として再構成RGB画像を生成する。
そして、第2分光反射率推定部142は、再構成RGB画像と推定に用いたRGB画像とから生成誤差(RGB誤差)を求める。
このとき、第2分光反射率推定部142は、(2)式あるいは(3)式により生成誤差により損失LRGBを求めて、(5)式に代入して損失Lを求める。
【0079】
ステップS207:
第2分光反射率推定部142は、損失Lを求める繰り返し回数が、予め設定されている所定の回数を超えたか否かの判定を行う。
このとき、第2分光反射率推定部142は、損失Lを求める繰り返し回数が、予め設定されている所定の回数を超えた場合、処理をステップS208へ進める。
一方、第2分光反射率推定部142は、損失Lを求める繰り返し回数が、予め設定されている所定の回数以下の場合、処理をステップS209へ進める。
【0080】
ステップS208:
第2分光反射率推定部142は、所定の回数を繰返して補正機械学習モデルが生成した補正分光情報画像において、損失Lが最小となる補正分光情報画像を分光画像情報とする。
そして、第2分光反射率推定部142は、分光情報画像のデータを、分光情報画像データ記憶部19の分光情報画像データテーブルに対して書き込んで記憶させる。
【0081】
ステップS209:
第2分光反射率推定部142は、補正機械学習モデルにおけるニューラルネットワークの関数の係数を調整する。
そして、第2分光反射率推定部142は、処理をステップS205へ進め、再度、係数を調整した補正機械学習モデルを用いて、一次分光情報画像による補正分光情報画像の推定を行う。
【0082】
上述したように、本実施形態は、RGB画像と、当該RGB画像を撮像した撮像装置の撮像装置分光感度と、RGB画像を撮像した環境の光源の光源分光分布との各々を入力データのデータセットとして、機械学習モデルによりRGB画像の被写体の分光情報を一次分光情報画像として推定し、一次分光情報画像から補正機械学習モデルにより補正分光情報画像を推定させ、当該補正分光情報画像から生成された再構成RGB画像と、一次分光情報画像の推定させたRGB画像とのRGB誤差から損失Lを求め、上述した所定の条件を満たすまで補正機械学習モデルの係数の調整を行い、調整後の補正機械学習モデルにより補正分光情報画像を再度推定させて分光情報画像を求め、すなわち機械学習モデル及び補正機械学習モデルの各々による2段階の推定を行い、分光情報画像を推定している。
この構成により、本実施形態によれば、機械学習モデルにより推定した一次分光情報画像を用いて、一次分光情報画像の推定に用いたRGB画像の色成分R、色成分G及び色成分Bの各々と、より近い再構成RGB画像を生成する補正分光情報画像を分光情報画像とするため、学習データの不足や機械学習モデルの特性から第1分光反射率推定部141による一次分光情報画像の推定精度がマルチバンドカメラを用いた場合に比較して低い場合においても、第2分光反射率推定部142が一次分光情報画像の補正を行うことで、RGB画像(3バンド、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の分光反射率を、容易に、かつマルチバンドカメラで撮像した画像と同程度の精度で推定することができる。
【0083】
また、上述した実施形態においては、データ合成部12がRGB画像を撮像した撮像装置分光感度と、撮像した環境の光源の光源分光分布とを合成して第1合成値としている。
しかしながら、データ合成部12が、第1合成値として、撮像装置分光感度あるいは光源分光分布のいずれかのみを用い、RGB画像のデータと合成して第2合成値を求める構成としてもよい。
この構成の場合、機械学習モデル生成部13が機械学習モデルを学習させる際にも、データ合成部12が教師画像と合成して第2合成値を作成する際、第1合成値として撮像装置分光感度あるいは光源分光分布のいずれかのみを用いる。
【0084】
また、上述した実施形態においては、機械学習モデル及び補正機械学習モデルの各々が、分光情報画像を推定するとして説明した。
しかしながら、機械学習モデル及び補正機械学習モデルの各々は、推定する分布情報として、分光情報画像ではなく、主成分分析などで求められた分光反射率の曲線を構成する基底関数の係数を推定する構成としてもよい。
【0085】
図9は、機械学習モデル及び補正機械学習モデルの各々による、分光反射率の曲線を構成する基底関数の係数の推定を説明する概念図である。
すなわち、主成分分析により抽出された、分光反射率の曲線(波長と強度との対応を示す曲線)を合成して表す基底関数b1から基底関数bnの各々に乗ずる係数r1から係数rnのそれぞれを推定する構成としてもよい。
この構成の場合、機械学習モデル生成部13は、機械学習モデルを学習させる際に、教師データのデータセットとして、分光反射率を出力とするのではなく、推定の出力として既知の係数r1から係数rnを用いる。
【0086】
そして、機械学習モデル生成部13は、推定された係数r1から係数rnの各々を基底関数b1から基底関数bnのそれぞれに乗じた後、基底関数b1から基底関数bnを合成して分光反射率の曲線を求めて、既知の分光反射率との分光誤差及びRGB画像におけるRGB誤差に基づき損失Lを求めて、上述した所定の条件を満たすまで学習を行う。
また、第1分光反射率推定部141は、学習済みの機械学習モデルにより、一次分光情報として係数r1から係数rnを第2分光反射率推定部142に対して出力する。
【0087】
これにより、補正機械学習モデルは、一次分光情報としての係数r1から係数rnを入力データとして、推定値として補正分光情報としての係数r1から係数rnを出力する。
第2分光反射率推定部142は、推定された係数r1から係数rnの各々を乗じた基底関数b1から基底関数bnのそれぞれを合成して分光反射率の曲線を求め、当該分光反射率により再構成RGB画像を求めて、当該再構成RGB画像と推定に用いたRGB画像とのRGB誤差に基づき損失Lを求めて、上述した所定の条件を満たした補正分光情報を分光情報として出力する。
【0088】
また、本実施形態において、RGB画像を撮像した撮像装置の撮像装置分光感度が既知で、撮像した環境の光源分光分布が不明である場合、光源分光分布を推定する機械学習モデルとして光源分光分布推定用機械学習モデルを生成する構成としてもよい。
この構成の場合、分光情報画像を推定する対象のRGB画像を撮像する際、分光反射率(色成分R、色成分G、色成分B)が既知のカラーチャートを被写体とともに撮像しておく。同様に、教師画像にもRGB画像を被写体とともに撮像しておく。
また、機械学習モデル生成部13は、光源分光分布推定用機械学習モデルを学習させる際、推定される出力データを光源分光分布とし、入力データを教師画像におけるカラーチャートの画像領域と、カラーチャートの既知の色成分R、色成分G及び色成分Bのデータと、撮像装置分光感度として、光源分光分布推定用機械学習モデルを学習させる。
【0089】
そして、第1分光反射率推定部141は、RGB画像から光源分光分布を推定する際、カラーチャートの画像領域と、カラーチャートの既知の色成分R、色成分G及び色成分Bのデータと、撮像装置分光感度とを、学習済みの光源分光分布機械学習モデルに対して合成の処理を行って入力し、光源分光分布を推定させる。
これにより、第1分光反射率推定部141は、RGB画像と、撮像装置分光感度と、推定した光源分光分布との各々のデータを合成して、学習済みの機械学習モデルに対して入力し、分光情報画像を推定する。
一例として、機械学習モデルを用いて光源分光分布の推定を行う手法を説明したが、光源分光分布の推定については、上述した機械学習モデルを用いる以外のどのような手法を用いてもよい。
【0090】
また、本実施形態において、RGB画像を撮像した環境の光源分光分布が既知で、撮像した撮像装置の撮像装置分光感度が不明である場合、撮像装置分光感度を推定する機械学習モデルとして撮像装置分光感度推定用機械学習モデルを生成する構成としてもよい。
この構成の場合、分光情報画像を推定する対象のRGB画像を撮像する際、分光反射率(色成分R、色成分G、色成分B)が既知のカラーチャートを被写体とともに撮像しておく。同様に、教師画像にもRGB画像を被写体とともに撮像しておく。
また、機械学習モデル生成部13は、撮像装置分光感度推定用機械学習モデルを学習させる際、推定される出力データを撮像装置分光感度とし、入力データを教師画像におけるカラーチャートの画像領域と、カラーチャートの既知の色成分R、色成分G及び色成分Bのデータと、光源分光分布として、撮像装置分光感度推定用機械学習モデルを学習させる。
【0091】
そして、第1分光反射率推定部141は、RGB画像から撮像装置分光感度を推定する際、カラーチャートの画像領域と、カラーチャートの既知の色成分R、色成分G及び色成分Bのデータと、光源分光分布とを、学習済みの撮像装置分光感度推定用機械学習モデルに対して合成の処理を行って入力し、撮像装置分光感度を推定させる。
これにより、第1分光反射率推定部141は、RGB画像と、光源分光分布と、推定した撮像装置分光感度との各々のデータを合成して、学習済みの機械学習モデルに対して入力し、分光情報画像を推定する。
一例として、機械学習モデルを用いて撮像装置分光感度の推定を行う手法を説明したが、撮像装置分光感度の推定については、上述した機械学習モデルを用いる以外のどのような手法を用いてもよい。
【0092】
<第2の実施形態>
以下、本発明の第2の実施形態について、図面を参照して説明する。
第2の実施形態に係る分光情報画像推定装置は、第1の実施形態と同様の構成である。
一方、第2の実施形態における機械学習モデルは、第1の実施形態と異なる構成をしている。
以下、第2の実施形態に係る分光情報画像推定装置が、第1の実施形態と異なる動作のみを説明し、重複する説明については適宜省略する。
【0093】
第1の実施形態における機械学習モデルは、入力データのデータセットとして、撮像装置分光感度及び光源分光分布の各々を入力層に対して入力する構成であった。
しかしながら、第2の実施形態における機械学習モデルは、入力データのデータセットとして、撮像装置分光感度及び光源分光分布の各々を中間層に対して入力する構成とされている。
図10は、本実施形態における機械学習モデルの中間層に対して、撮像装置分光感度及び光源分光分布の各々のデータの入力を説明する概念図である。
【0094】
図10において、データ合成部12は、撮像画像データ記憶部17を参照し、撮像画像データテーブルから、RGB画像、撮像装置分光感度及び光源分光分布の各々のデータを読み出す。
そして、データ合成部12は、RGB画像をそのままのデータ形式として、第1分光反射率推定部141に対して出力する。
これにより、第1分光反射率推定部141は、撮像画像データテーブルからRGB画像のデータを読み出し、当該RGB画像のデータを機械学習モデル300の入力層320へ入力する。
【0095】
また、データ合成部12は、撮像装置分光感度及び光源分光分布の各々のデータの連結、和及び積などによる合成を行い、第1合成値を生成する。
データ合成部12は、生成した第1合成値と、機械学習モデル300における複数の中間層350のいずれかの出力データとを連結、和及び積などの処理により合成して第3合成値を生成し、当該第3合成値を第1分光反射率推定部141に対して出力する。
【0096】
そして、第1分光反射率推定部141は、第1合成値と合成した出力データを出力した中間層350の次段の中間層350に対して、データ合成部12から供給された第3合成値を入力させる。
本実施形態においては、上記第1合成値と合成する出力データを出力する中間層を、いずれか一個の段の中間層とする構成としても良く、また複数段の中間層とする構成としてもよい。
【0097】
また、第1合成値を中間層の出力と合成を行う場合、第1合成値の次元数(データの次元数)を変換した後、次元数変換した中間層の出力と第1合成値とを合成する構成としてもよい。
この構成の場合、データ合成部12は、合成した第1合成値の次元を増加あるいは低減する次元変換用ニューラルネットワークを有している。
そして、データ合成部12は、上記次元変換用ニューラルネットワークを用いて、合成した第1合成値の次元数を変換した後、第1合成値を第1分光反射率推定部141に対して出力する。
【0098】
上述したように、本実施形態は、第1の実施形態と同様に、RGB画像と、当該RGB画像を撮像した撮像装置の撮像装置分光感度と、RGB画像を撮像した環境の光源の光源分光分布との各々を入力データのデータセットとして、機械学習モデルによりRGB画像の被写体の分光情報を一次分光情報画像として推定し、一次分光情報画像から補正機械学習モデルにより補正分光情報画像を推定させ、当該補正分光情報画像から生成された再構成RGB画像と、一次分光情報画像の推定させたRGB画像とのRGB誤差から損失Lを求め、上述した所定の条件を満たすまで補正機械学習モデルの係数の調整を行い、調整後の補正機械学習モデルにより補正分光情報画像を再度推定させて分光情報画像を求め、すなわち機械学習モデル及び補正機械学習モデルの各々による2段階の推定を行い、分光情報画像を推定している。
この構成により、本実施形態によれば、機械学習モデルにより推定した一次分光情報画像を用いて、一次分光情報画像の推定に用いたRGB画像の色成分R、色成分G及び色成分Bの各々と、より近い再構成RGB画像を生成する補正分光情報画像を分光情報画像とするため、学習データの不足や機械学習モデルの特性から第1分光反射率推定部141による一次分光情報画像の推定精度がマルチバンドカメラを用いた場合に比較して低い場合においても、第2分光反射率推定部142が一次分光情報画像の補正を行うことで、RGB画像(3バンド、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の分光反射率を、容易に、かつマルチバンドカメラで撮像した画像と同程度の精度で推定することができる。
【0099】
また、本実施形態によれば、中間層の出力に対して第1合成値を合成して第3合成値を生成して次段の中間層の入力とするため、RGB画像の特徴を抽出した中間層の出力と、撮像装置分光感度及び光源分光分布の各々とが合成されて上記第3合成値となるため、第1の実施形態に比較してより、一次分光情報画像がRGBの被写体の分光反射率に精度よく近似され、補正機械学習モデルの補正処理にかかる時間を低減させ、より早く分光情報画像を生成することができる。
【0100】
また、上述した実施形態においては、データ合成部12がRGB画像を撮像した撮像装置分光感度と、撮像した環境の光源の光源分光分布とを合成して第1合成値としている。
しかしながら、データ合成部12が、第1合成値として、撮像装置分光感度あるいは光源分光分布のいずれかのみを用い、入力としてRGB画像が入力された機械学習モデルの中間層の出力データと合成して第3合成値を求め、次段の中間層の入力とする構成としてもよい。
この構成の場合、機械学習モデル生成部13が機械学習モデルを学習させる際にも、データ合成部12が教師画像と合成して第3合成値を作成する際、第1合成値として撮像装置分光感度あるいは光源分光分布のいずれかのみを用いる。
【0101】
<第3の実施形態>
以下、本発明の第3の実施形態について、図面を参照して説明する。
第3の実施形態に係る分光情報画像推定装置は、第1の実施形態と同様の構成である。
一方、第3の実施形態における機械学習モデルは、第1の実施形態と異なる構成をしている。
以下、第3の実施形態に係る分光情報画像推定装置が、第1の実施形態と異なる動作のみを説明し、重複する説明については適宜省略する。
【0102】
図11は、本実施形態における第1分光反射率推定部141が用いる機械学習モデルの構成例を説明する概念図である。
図11において、本実施形態の機械学習モデルは、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々と、統合機械学習モデル110とを有している。
ここで、サブ機械学習モデル101は、RGB画像の画素における色成分R(撮像装置色成分Rデータ)と、撮像装置分光感度における色成分R(撮像装置色成分R感度データ)との各々のデータを入力し、色成分Rに関する推定出力をデータ合成部12に出力する。
【0103】
同様に、サブ機械学習モデル102は、撮像画像の画素における色成分G(撮像装置色成分Gデータ)と、撮像装置分光感度における色成分G(撮像装置色成分G感度データ)との各々のデータを入力し、色成分Gに関する推定出力をデータ合成部12に出力する。
サブ機械学習モデル102は、撮像画像の画素における色成分B(撮像装置色成分Bデータ)と、撮像装置分光感度における色成分B(撮像装置色成分B感度データ)との各々のデータを入力し、色成分Bに関する推定出力をデータ合成部12に出力する。
【0104】
データ合成部12は、撮像画像の画素における色成分R(撮像装置色成分Rデータ)と撮像装置分光感度における色成分R(撮像装置色成分R感度データ)との各々のデータを、連結、和及び積により合成して入力合成値SRを生成し、当該入力合成値SRを第1分光反射率推定部141に対して出力する。
そして、第1分光反射率推定部141は、データ合成部12から供給される入力合成値SRをサブ機械学習モデル101の入力層に対して入力する。
【0105】
また、データ合成部12は、撮像画像の画素における色成分G(撮像装置色成分Gデータ)と撮像装置分光感度における色成分G(撮像装置色成分G感度データ)との各々のデータを、連結、和及び積により合成して入力合成値SGを生成し、当該入力合成値SGを第1分光反射率推定部141に対して出力する。
そして、第1分光反射率推定部141は、データ合成部12から供給される入力合成値SGをサブ機械学習モデル102の入力層に対して入力する。
【0106】
同様に、データ合成部12は、撮像画像の画素における色成分B(撮像装置色成分Bデータ)と撮像装置分光感度における色成分B(撮像装置色成分B感度データ)との各々のデータを、連結、和及び積により合成して入力合成値SBを生成し、当該入力合成値SBを第1分光反射率推定部141に対して出力する。
そして、第1分光反射率推定部141は、データ合成部12から供給される入力合成値SBをサブ機械学習モデル103の入力層に対して入力する。
【0107】
また、データ合成部12は、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々の出力と、光源分光分布とを、連結、和及び積により合成して第4合成値を生成し、当該第4合成値を第1分光反射率推定部141に対して出力する。
このとき、データ合成部12は、次元変換用ニューラルネットワークを用いて、第4合成値の次元数を変換した後、この次元数を変換した第4合成値を第1分光反射率推定部141に対して出力する構成としてもよい。
そして、第1分光反射率推定部141は、統合機械学習モデル110から供給される第4合成値を統合機械学習モデル110に対して入力する。
これにより、統合機械学習モデル110は、第4合成値に対応して、分光情報画像を推定して出力する。
【0108】
また、本実施形態において、機械学習モデル生成部13は、機械学習モデルの学習を行う際、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103と、統合機械学習モデル110とのニューラルネットワークの関数の係数の調整を行う。
ここで、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々が、同一のニューラルネットワークの構成とされている。
このため、機械学習モデル生成部13は、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々において、同一のニューラルネットワークの関数の係数を同一の数値で調整していく。
【0109】
また、本実施形態において、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々において、撮像画像色成分(R,G,B)のデータ(成分データ)と撮像装置色成分感度(R,G,B)の感度データを、それぞれの入力層に入力するのではなく、第1分光反射率推定部141が撮像画像色成分のみを入力層に入力し、また、データ合成部12が中間層の出力データに対して撮像装置色成分感度の感度データを合成して、第1分光反射率推定部141が、出力データと感度データとが合成されたデータを、次段の中間層に入力する構成としてもよい。
このとき、データ合成部12は、次元変換用ニューラルネットワークを用いて、出力データと感度データとの合成されたデータ(合成データ)の次元数を変換した後、この次元数が変換された合成データを第1分光反射率推定部141に対して出力する構成としてもよい。
【0110】
また、本実施形態において、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々において、撮像画像色成分(R,G,B)のデータと撮像装置色成分感度(R,G,B)データを、それぞれの入力層に入力するのではなく、第1分光反射率推定部141が撮像画像色成分を入力層に入力し、また、データ合成部12が中間層の出力データに対して撮像画像色成分の成分データ及び撮像装置色成分感度の感度データの各々を合成して、第1分光反射率推定部141が、出力データと成分データと感度データとが合成されたデータを次段の中間層に入力する構成としてもよい。
このとき、データ合成部12は、次元変換用ニューラルネットワークを用いて、出力データと成分データ、感度データとの合成されたデータ(合成データ)の次元数を変換した後、この次元数が変換された合成データを第1分光反射率推定部141に対して出力する構成としてもよい。
【0111】
また、本実施形態において、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々において、撮像画像色成分(R,G,B)のデータと撮像装置色成分感度(R,G,B)データを、それぞれの入力層に入力するのではなく、第1分光反射率推定部141が撮像画像色成分のみを入力層に入力し、また、データ合成部12が中間層の出力データに対して撮像装置色成分感度の感度データ及び光源分光分布の分布データの各々を合成して、第1分光反射率推定部141が、出力データと感度データと分布データとが合成されたデータ(合成データとしての第5合成値)を次段の中間層に入力する構成としてもよい。
このとき、データ合成部12は、次元変換用ニューラルネットワークを用いて、出力データと感度データと分布データとの合成されたデータ(合成データ)の次元数を変換した後、この次元数が変換された合成データを第1分光反射率推定部141に対して出力する構成としてもよい。
【0112】
また、本実施形態において、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々に対して、撮像画像色成分(R,G,B)のデータと撮像装置色成分感度(R,G,B)データを入力層に入力するのではなく、撮像画像色成分(R,G,B)のデータと撮像装置色成分感度(R,G,B)データと光源分光分布のデータとを合成(連結、和及び積)して入力させる構成としてもよい。
このとき、データ合成部12は、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々の出力を合成して、第1分光反射率推定部141に出力する。
そして、第1分光反射率推定部141は、データ合成部12から供給されるデータを統合機械学習モデルの入力とする。
【0113】
また、本実施形態において、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々に対して、撮像画像色成分(R,G,B)のデータと撮像装置色成分感度(R,G,B)データの合成(連結、和及び積)した第1合成値を入力層に入力させるとともに、光源分光分布のデータを、サブ機械学習モデル101、サブ機械学習モデル102、サブ機械学習モデル103それぞれの中間層に対して入力させる構成としてもよい。
このとき、第1分光反射率推定部141は、データ合成部12から供給される光源分光分布のデータを、サブ機械学習モデル101、サブ機械学習モデル102及びサブ機械学習モデル103の各々の中間層に対して入力する。
【0114】
上述したように、本実施形態は、第1の実施形態と同様に、RGB画像と、当該RGB画像を撮像した撮像装置の撮像装置分光感度と、RGB画像を撮像した環境の光源の光源分光分布との各々を入力データのデータセットとして、機械学習モデルによりRGB画像の被写体の分光情報を一次分光情報画像として推定し、一次分光情報画像から補正機械学習モデルにより補正分光情報画像を推定させ、当該補正分光情報画像から生成された再構成RGB画像と、一次分光情報画像の推定させたRGB画像とのRGB誤差から損失Lを求め、上述した所定の条件を満たすまで補正機械学習モデルの係数の調整を行い、調整後の補正機械学習モデルにより補正分光情報画像を再度推定させて分光情報画像を求め、すなわち機械学習モデル及び補正機械学習モデルの各々による2段階の推定を行い、分光情報画像を推定している。
この構成により、本実施形態によれば、機械学習モデルにより推定した一次分光情報画像を用いて、一次分光情報画像の推定に用いたRGB画像の色成分R、色成分G及び色成分Bの各々と、より近い再構成RGB画像を生成する補正分光情報画像を分光情報画像とするため、学習データの不足や機械学習モデルの特性から第1分光反射率推定部141による一次分光情報画像の推定精度がマルチバンドカメラを用いた場合に比較して低い場合においても、第2分光反射率推定部142が一次分光情報画像の補正を行うことで、RGB画像(3バンド、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の分光反射率を、容易に、かつマルチバンドカメラで撮像した画像と同程度の精度で推定することができる。
【0115】
また、本実施形態によれば、RGB画像の色成分毎にサブ機械学習モデルを備えており、色成分R、色成分G及び色成分Bの各々に対する特徴抽出の処理が同様であることが考えられ、機械学習モデルの学習を行う際に、色成分毎のサブ機械学習モデルの各々におけるニューラルネットの同一の関数同士を、同一のタイミングで同一の数値に調整することにより、サブ機械学習モデルを使用せず全ての関数の各々の係数の調整を行う場合に比較して、機械学習モデルの学習をより早く収束させることができる。
【0116】
また、上述した実施形態においては、データ合成部12がRGB画像を撮像した撮像装置分光感度と、撮像した環境の光源の光源分光分布とを合成して第1合成値としている。
しかしながら、データ合成部12が、第1合成値として、撮像装置分光感度あるいは光源分光分布のいずれかのみを用い、入力としてRGB画像の色成分毎のデータが入力された、色成分毎の機械学習モデルの中間層の出力データと合成して第5合成値を求め、色成分毎の機械学習モデルの次段の中間層の入力とする構成としてもよい。
この構成の場合、機械学習モデル生成部13が機械学習モデルを学習させる際にも、データ合成部12が教師画像と合成して第5合成値を作成する際、第1合成値として撮像装置分光感度あるいは光源分光分布のいずれかのみを用いる。
【0117】
<第4の実施形態>
以下、本発明の第4の実施形態について、図面を参照して説明する。
図12は、第4の実施形態に係る分光情報画像推定装置の構成例を示すブロック図である。図12に示す分光情報画像推定装置10Aは、例えば、PC、サーバ装置、量子コンピュータなどによって実現される。
図12において、分光情報画像推定装置10Aは、データ入力部11、分光反射率推定部14A、分光画像出力部15、撮像画像データ記憶部17及び分光情報画像データ記憶部19の各々を備えている。
また、分光反射率推定部14Aは、第1分光反射率推定部141A及び第2分光反射率推定部142の各々を備えている。
なお、第1の実施形態と同様の構成については、同一の符号を付してある。以下では、上述した各実施形態と重複する説明については適宜省略する。
【0118】
第1分光反射率推定部141Aは、第1の実施形態における第1分光反射率推定部141と異なり、機械学習モデルを用いる分光反射率の推定は行わない。
第1分光反射率推定部141Aは、例えば、図9に示すように、分光反射率基底ベクトル(基底関数)を合成して分光反射率を推定する。
ここで、分光反射率基底ベクトルは、主成分分析を用いて複数の分光反射率データの集合である分光反射率データ群から、当該分光反射率データ群を表現するための分光反射率基底ベクトルとして、予め導出されている。
この主成分分析においては、分光反射率の実際の次元数よりも、少ない次元数の分光反射率基底ベクトルの組み合わせで、分光反射率を表現できるようになる。すなわち、分光反射率基底ベクトルを用いることにより、推定する対象である分光反射率の次元数を圧縮し、計算負荷を低減させる。
【0119】
すなわち、第1分光反射率推定部141Aは、以下の(7)式で示すように、複数の分光反射率基底ベクトルB=[b1,b2,…]Tの重み付け和で表し、この重み付けを行うため、分光反射率基底ベクトルの各々の重み係数r=[r1,r2,…]Tを求めることにより、分光反射スペクトルsを推定している。
ここで、分光反射率基底ベクトルは、例えば、セットとして撮像画像データ記憶部17に予め記憶されている。また、撮像画像データ記憶部17において、分光反射率基底ベクトルは、主成分分析における主成分得点の高い順に複数配列して記憶されており、所定の順までの分光反射率基底ベクトルを必要に応じた数を読み込んで用いる構成としても良い。
【0120】
図9は、すでに説明したが、分光反射率基底ベクトルを合成して分光反射率を表現することを示している。
図9に示すように、分光反射スペクトルsは、所定の物体の各々の分光反射率を用いた主成分分析で得られた分光反射率基底ベクトルb1からbnの各々に対して、それぞれ重み係数を乗算して、乗算結果を合成することで得られる。
すなわち、第1分光反射率推定部141Aは、必要な数の分光反射率基底ベクトルb1から分光反射率基底ベクトルbnを撮像画像データ記憶部17から読み出す。
そして、第1分光反射率推定部141Aは、抽出した分光反射率基底ベクトルb1から分光反射率基底ベクトルbnの各々の重み係数r1から重み係数rnのそれぞれを、基準多視点画像の各々の画素の画素値となる分光反射スペクトルsが得られるように推定し、推定結果から分光反射スペクトルsを求める(後述)。
【0121】
【数7】
【0122】
図12に戻り、第1分光反射率推定部141Aは、上記(7)式で表した分光反射スペクトルに対し、以下の(8)式を解くことにより、各重み係数rを推定する。
そして、第1分光反射率推定部141Aは、推定した重み係数rにより、(7)式により分光反射スペクトルsの推定を行う。ここで、分光反射スペクトルsiは、例えば、400nmから700nmの波長範囲を10nm刻みでサンプリングした31次元ベクトルとして表している。
【0123】
【数8】
【0124】
上記(8)式において、pm,kは、m番目の撮像画像のk番目のチャネルの画素値である。すなわち、pm,kにおいて、mは、フィルタ毎の撮像画像を示す番号である。また、kは、多視点画像における部分における色成分のチャネルを示している。例えば、部分が色成分R、G及びBの画素値で示されていれば、例えばチャネル(バンド)1が色成分R(Rチャネル)であり、チャネル2が色成分G(Gチャネル)であり、チャネル3が色成分B(Bチャネル)である。また、各フィルタの撮像画像から画素値を読み出す画素は、当該撮像画像の各々に対応する画素として、各フィルタの撮像画像それぞれの画像データから抽出する。
【0125】
また、(8)式において、行列Cm、kは、m番目のフィルタの撮像画像のk番目のチャネル(色成分の波長帯域)の分光感度を示している。このCm、kにおける要素cm,k(λ)は、m番目の撮像画像のk番目のチャネルにおける波長λの分光感度を示している。
また、光源の分光分布lは、すでに計測された分光分布データとして、撮像画像データ記憶部17の撮像画像データテーブルに書き込まれている。
第1分光反射率推定部141Aは、各フィルタの撮像画像が撮像された環境における光源の光源分光分布を撮像画像データ記憶部17の撮像画像データテーブルから読み出す。
【0126】
ここで、第1分光反射率推定部141Aは、各フィルタの撮像画像における撮像装置分光感度の数に対応して、撮像画像データ記憶部17から分光反射率基底ベクトルのセットを選択して読み出す構成としてもよい。
また、(8)式を解く際、分光反射率データを表すために用いる分光反射率基底ベクトル(主成分)の数(以下、分光反射率基底ベクトル数)nの上限は、例えば、撮像画像を撮像する分光感度グループの数(色彩変化フィルタによる分光感度の調整数など)に基づいて決定される。
【0127】
q個の分光感度グループにおける多視点画像を用いる場合、「n(分光反射率基底ベクトル数)=q(分光感度の種類の数、分光感度グループ数)×k(チャネルの数、以下チャネル数)」の関係式で決定される。すなわち、分光反射率データを示す分光反射率基底ベクトル数nが分光感度グループ数qのチャネル数k倍以下であれば、(8)式を解くことが可能である。
一例としては、分光感度の異なる3個(=Nc)の色彩変化フィルタを用い、チャネルがR、G及びBの3個である場合、基底ベクトルの上限は、9(=3×3)となる。
また、各色彩変化フィルタを用いた撮像画像の各々は、同一視点におけるm番目の視点画像として(8)式において用いるため、同一視点で撮像されている必要がある。
しかしながら、上述した複数の分光感度による分光反射率の推定ではなく、RGB画像から被写体の分光反射率を推定する手法であればいずれを用いてもよい。
【0128】
第1分光反射率推定部141Aは、求めた分光反射率の31バンドの分光情報画像を、一次分光情報画像として第2分光反射率推定部142へ出力する。
そして、第2分光反射率推定部142は、第1の実施形態で説明したように、第1分光反射率推定部141Aから供給される一次分光情報画像を補正機械学習モデルに入力する。
第2分光反射率推定部142は、出力される補正分光情報画像から再構成RGB画像を生成し、いずれかの色彩変化フィルタのRGB画像と比較して損失Lを求める。
【0129】
補正分光情報画像から再構成RGB画像を生成する際、第2分光反射率推定部142は、補正分光情報画像から比較するRGB画像を撮像したときの色彩変化フィルタによる撮像装置分光感度と、撮像した環境の光源分光分布を用いて、RGB画像を生成する。
そして、第2分光反射率推定部142は、損失Lが生成閾値以下となるまで、補正機械学習モデルのニューラルネットの関数の係数を調整する。
第2分光反射率推定部142は、損失Lが生成閾値以下となった場合、そのときの補正分光情報画像を分光情報画像として、分光画像出力部15に出力する。
分光画像出力部15は、第2分光反射率推定部142から供給される分光情報画像を、分光情報画像データ記憶部19に書き込んで記憶させる。
【0130】
上述したように、本実施形態は、所定の方法でRGB画像から撮像装置分光感度及び光源分光分布を用いて一次分光情報画像として推定し、当該一次分光情報画像から補正機械学習モデルにより補正分光情報画像を推定させ、当該補正分光情報画像から生成された再構成RGB画像と、一次分光情報画像の推定させたRGB画像とのRGB誤差から損失Lを求め、上述した所定の条件を満たすまで補正機械学習モデルの係数の調整を行い、調整後の補正機械学習モデルにより補正分光情報画像を再度推定させ、すなわち所定の方法でRGB画像から一次分光情報画像を推定させ、一次分光情報画像から補正機械学習モデルにより補正分光情報画像を推定する2段階の推定処理を行い、分光情報画像を推定している。
この構成により、本実施形態によれば、所定の推定方法により推定した一次分光情報画像を用いて、一次分光情報画像の推定に用いたRGB画像の色成分R、色成分G及び色成分Bの各々と、より近い再構成RGB画像を生成する補正分光情報画像を分光情報画像とするため、所定の推定方法の特性から第1分光反射率推定部141Aによる一次分光情報画像の推定精度がマルチバンドカメラを用いた場合に比較して低い場合においても、第2分光反射率推定部142が一次分光情報画像の補正を行うことで、RGB画像(3バンド、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の分光反射率を、容易に、かつマルチバンドカメラで撮像した画像と同程度の精度で推定することができる。
【0131】
<第5の実施形態>
以下、本発明の第5の実施形態について、図面を参照して説明する。
図13は、第5の実施形態に係る分光情報画像推定装置の構成例を示すブロック図である。図13に示す分光情報画像推定装置10Bは、例えば、PC、サーバ装置、量子コンピュータなどによって実現される。
図13において、分光情報画像推定装置10Bは、データ入力部11B、データ生成部20、機械学習モデル生成部13B、分光反射率推定部14B、分光画像出力部15、データセットデータ記憶部21、教師画像データ記憶部16B、撮像画像データ記憶部17、機械学習モデル記憶部18、及び分光情報画像データ記憶部19の各々を備えている。
また、分光反射率推定部14Bは、第1分光反射率推定部141B及び第2分光反射率推定部142Bの各々を備えている。
なお、第1の実施形態と同様の構成については、同一の符号を付してある。以下では、上述した各実施形態と重複する説明については適宜省略する。
【0132】
データ入力部11Bは、外部装置から供給されるデータセットを入力し、当該データセットをデータセットデータ記憶部21に対して書き込んで記憶させる。データセットには、例えば、分光情報画像データセット、光源分光分布データセット、及び撮像装置分光感度データセットが含まれる。分光情報画像データセットは、複数の分光情報画像を含むデータセットである。光源分光分布データセットは、複数の光源分光分布を含むデータセットであり、例えば照明ごとの分光分布又は太陽光の分光分布を示す光源分光分布を複数含んでいる。撮像装置分光感度データセットは、複数の撮像装置分光感度を含むデータセットであり、例えば撮像装置の機種ごとの分光感度を示す撮像装置分光感度を複数含んでいる。
【0133】
データ生成部20は、機械学習モデル(第1機械学習モデル)の学習に用いる教師データを生成する。例えば、データ生成部20は、データセットデータ記憶部21に記憶されている分光情報画像データセット、光源分光分布データセット、及び撮像装置分光感度データセットに基づき、教師データを生成する。具体的に、まず、データ生成部20は、データセットデータ記憶部21に記憶されている分光情報画像データセット、光源分光分布データセット、及び撮像装置分光感度データセットの各データセットから分光情報画像、光源分光分布、及び撮像装置分光感度をそれぞれランダムに選択する。選択後、データ生成部20は、選択した分光情報画像、光源分光分布、及び撮像装置分光感度からRGB画像を教師画像として生成する。生成後、データ生成部20は、生成したRGB画像と、当該RGB画像の生成に用いた撮像装置分光感度、光源分光分布、及び分光情報画像の分光反射率(即ちRGB画像における被写体の既知の分光反射率)とを1つの教師データとして、教師画像データ記憶部16Bに対して書き込んで記憶させる。
【0134】
なお、データ生成部20は、データセットデータ記憶部21に記憶されている各データセットから選択した分光情報画像、光源分光分布、及び撮像装置分光感度に対して、任意の倍率を与えること(スケーリング)によって、教師画像を生成するための分光情報画像、光源分光分布、及び撮像装置分光感度を新しく生成してもよい。
【0135】
また、データ生成部20は、教師データの基底ベクトルに基づき、教師データとして用いる光源分光分布又は撮像装置分光感度を新しく生成してもよい。この場合、データ生成部20は、光源分光分布データセット又は撮像装置分光感度データセットに含まれる分光成分に対して所定の係数を乗算し、乗算結果を加算あるいは減算することで、教師画像を生成するための光源分光分布又は撮像装置分光感度を新しく生成する。
なお、データセットデータ記憶部21の光源分光分布データセットには、光源分光分布における含有比率が大きい分光成分が予め書き込んで記憶される。また、データセットデータ記憶部21の撮像装置分光感度データセットには、撮像装置分光感度における含有比率が大きい分光成分が予め書き込んで記憶される。光源分光分布データセット又は撮像装置分光感度データセットに含まれる分光成分は、例えば、主成分分析により生成される。
【0136】
機械学習モデル生成部13Bは、データ生成部20によって生成された教師画像を含む教師データを用いて、機械学習モデルを生成する。なお、機械学習モデル生成部13Bは、第1の実施形態の機械学習モデル生成部13と同様に、教師データを用いて機械学習モデルに機械学習させ、損失Lが損失閾値以下となった機械学習モデルを、学習済みの機械学習モデルとして機械学習モデル記憶部18に対して書き込んで記憶させる。
【0137】
なお、機械学習モデル生成部13Bは、分光誤差から求めた値(分光損失)、RGB値誤差から求めた値(RGB損失)、平滑化項を考慮して求めた値(平滑化損失)以外の値を損失に含めてもよい。これにより、機械学習モデルの学習精度を高めることができる。分光損失は、例えば、教師画像の既知の分光情報(分光反射率)と、機械学習モデルの推定する分光情報画像(第1分光情報画像)の分光情報(分光反射率)との誤差から求めた値である。RGB損失は、例えば、機械学習モデルの推定した分光情報画像の分光情報、教師画像を撮像した撮像装置の撮像分光感度、及び教師画像を撮像した環境の光源分光分布から生成されるRGB画像(再構成RGB画像)と、教師画像のRGB画像との誤差である。平滑化損失は、例えば、機械学習モデルによって推定された分光情報画像における隣接する波長間の分光反射率の差分である。
【0138】
例えば、機械学習モデル生成部13Bは、第1積分値と第2積分値との差から求める値を損失に含めてもよい。第1積分値は、教師画像の既知の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である。第2積分値は、機械学習モデルによって推定された分光情報画像の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である。
また、機械学習モデル生成部13Bは、教師画像の既知の分光情報から算出されるLAB色空間の値と、機械学習モデルによって推定された分光情報画像の分光情報から算出されるLAB色空間の値に基づき算出される色差(色差損失)を損失に含めてもよい。
【0139】
なお、機械学習モデル生成部13Bは、機械学習モデルの生成において、少なくとも分光損失を含む損失を用いる。第5の実施形態では、例えば、機械学習モデル生成部13Bは、分光損失と、RGB損失と、平滑化損失とを重みづけ和した損失を用いる。
【0140】
データ生成部20は、任意の撮像装置及び任意の環境で撮像された撮像画像データであるRGB画像から、未知の分光情報画像を推定する場合、撮像画像データ記憶部17から読み出した撮像装置の撮像装置分光感度、撮像した環境の光源分光分布、及び撮像画像(RGB画像)を入力データとして第1分光反射率推定部141Bに出力する。
そして、第1分光反射率推定部141Bは、データ生成部20から供給される入力データを入力するとともに、機械学習モデル記憶部18から学習済みの機械学習モデルを読み込む。
【0141】
第1分光反射率推定部141Bは、被写体の撮像画像であるRGB画像と、撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、被写体の分光反射率を示す分光情報画像を推定する。具体的に、第1分光反射率推定部141Bは、機械学習モデル記憶部18から読み込んだ学習済みの機械学習モデルに対して、データ生成部20から供給されるRGB画像と、撮像装置分光感度と、光源分光分布とを機械学習モデルに入力し、分光情報画像を推定する。
ここで、第1分光反射率推定部141Bは、学習済みの機械学習モデルが入力データにより推定した分光情報画像を一次分光情報画像として、第2分光反射率推定部142に対して出力する。
【0142】
第2分光反射率推定部142Bは、第1分光反射率推定部141Bの機械学習モデルと同様に、ニューラルネットワークの補正機械学習モデル(第2機械学習モデル)を備えている。
第2分光反射率推定部142Bは、第1分光反射率推定部141Bに入力されたRGB画像(入力RGB画像)、撮像装置分光感度、及び光源分光分布と、第1分光反射率推定部141Bによって推定された一次分光情報画像とに基づき、当該一次分光情報画像を補正した補正分光情報画像(第2分光情報画像)を推定し、出力する。具体的に、第2分光反射率推定部142Bは、入力RGB画像と、撮像装置分光感度と、光源分光分布と、第1分光反射率推定部141Bから供給される一次分光情報画像とを補正機械学習モデルに入力し、補正分光情報画像を推定する。
補正機械学習モデルは、入力された一次分光情報画像の分光情報と、撮像装置分光感度と、光源分光分布とに基づきRGB画像を生成し、入力RGB画像と生成したRGB画像(再構成RGB画像)との損失が小さくなるよう補正機械学習モデルのパラメータを繰り返し更新することで、一次分光情報画像を補正する。当該損失は、入力RGB画像と再構成RGB画像とのRGB値誤差から求めた値(RGB損失)である。補正機械学習モデルのパラメータは、例えば、ニューラルネットワークの関数の係数である。なお、パラメータの初期値には、任意の値が設定される。
なお、補正機械学習モデルは、平滑化項を考慮して求めた値(平滑化損失)を損失に含めてもよい。これにより、補正機械学習モデルによる補正精度(推定精度)を高めることができる。平滑化損失は、例えば、補正機械学習モデルによって推定される補正分光情報画像における隣接する波長間の分光反射率の差分である。
【0143】
なお、第2分光反射率推定部142Bは、補正分光情報画像の推定(一次分光情報画像の補正)において、少なくともRGB損失を含む損失を用いる。第5の実施形態では、例えば、第2分光反射率推定部142Bは、RGB損失と平滑化損失とを重みづけ和した損失を用いる。
【0144】
図14は、第5の実施形態に係る機械学習モデル生成部13Bによる機械学習モデルの教師データによる学習処理の動作例を示すフローチャートである。
以下の説明においては、データ入力部11Bが、外部装置から供給される分光情報画像データセット、光源分光分布データセット、及び撮像装置分光感度データセットを含むデータセットをデータセットデータ記憶部21に対して予め書き込んでいる。
【0145】
ステップS301:
データ生成部20は、データセットを選択する。具体的に、データ生成部20は、データセットデータ記憶部21に記憶されている分光情報画像データセット、光源分光分布データセット、及び撮像装置分光感度データセットの各データセットから分光情報画像、光源分光分布、及び撮像装置分光感度をそれぞれランダムに選択する。
【0146】
ステップS302:
選択後、データ生成部20は、教師データを生成する。具体的に、データ生成部20は、選択した分光情報画像、光源分光分布、及び撮像装置分光感度からRGB画像を教師画像として生成する。生成後、データ生成部20は、生成したRGB画像と、当該RGB画像の生成に用いた撮像装置分光感度、光源分光分布、及び分光情報画像の分光反射率(即ちRGB画像における被写体の既知の分光反射率)とを1つの教師データとして、教師画像データ記憶部16Bに対して書き込んで記憶させる。
【0147】
ステップS303~ステップS309:
ステップS303~ステップS309は、第1の実施形態にて図7を参照して説明したステップS101~ステップS107とそれぞれ同様であり重複するため、説明を省略する。
【0148】
図15は、第5の実施形態に係る分光反射率推定部14Bによる学習済みの機械学習モデルを利用してRGB画像から分光情報画像を推定する処理の動作例を示すフローチャートである。
以下の説明においては、機械学習モデル記憶部18に学習済みの機械学習モデルが記憶されている。
【0149】
ステップS401:
データ入力部11Bは、撮像画像のデータ入力を行う。具体的に、データ入力部11Bは、入力となるRGB画像と、当該RGB画像を撮像した撮像装置の撮像装置分光感度と、撮像した環境における光源の光源分光分布とを含むデータを外部装置から読み込む。
そして、データ入力部11Bは、読み込んだRGB画像と、当該RGB画像に対応する撮像装置分光感度及び光源分光分布とのデータの各々を、撮像画像データ記憶部17の撮像画像テーブル(図5参照)に書き込んで記憶させる。
【0150】
ステップS402:
第1分光反射率推定部141Bは、機械学習モデル記憶部18から学習済みの機械学習モデルを読み出す。
【0151】
ステップS403:
第1分光反射率推定部141Bは、撮像画像データ記憶部17の撮像画像データテーブルから、RGB画像、撮像装置分光感度及び光源分光分布の各々のデータを読み出す。
【0152】
ステップS404:
第1分光反射率推定部141Bは、一次分光情報画像を推定する。具体的に、第1分光反射率推定部141Bは、読み出した入力データを、学習済みの機械学習モデルへ入力する。これにより、機械学習モデルは、入力データから分光情報画像を推定し、一次分光情報画像として第2分光反射率推定部142Bへ出力する。
【0153】
ステップS405:
第2分光反射率推定部142Bは、補正分光情報画像を推定する。具体的に、第2分光反射率推定部142Bは、第1分光反射率推定部141Bから供給される一次分光情報画像を補正機械学習モデルへ入力する。また、第2分光反射率推定部142Bは、一次分光情報画像を推定したRGB画像に対応した撮像装置分光感度及び光源分光分布の各々を撮像画像データ記憶部17の撮像画像データテーブルから読み込み、補正機械学習モデルへ入力する。これにより、補正機械学習モデルは、入力される一次分光情報画像を補正した補正分光情報画像を推定する。
【0154】
ステップS406:
第2分光反射率推定部142Bは、損失Lを算出する。具体的に、第2分光反射率推定部142Bは、補正分光情報画像と、撮像装置分光感度と、光源分光分布とからRGB画像(再構成RGB画像)を生成する。
そして、第2分光反射率推定部142Bは、再構成RGB画像と推定に用いた入力RGB画像とから誤差(RGB誤差)を求める。
このとき、第2分光反射率推定部142Bは、(2)式あるいは(3)式から誤差による損失LRGBを求め、(5)式に代入して損失Lを求める。
【0155】
ステップS407:
第2分光反射率推定部142Bは、損失Lを求める繰り返し回数が、予め設定されている所定の回数を超えたか否かの判定を行う。
このとき、第2分光反射率推定部142Bは、損失Lを求める繰り返し回数が、予め設定されている所定の回数を超えた場合、処理をステップS408へ進める。
一方、第2分光反射率推定部142Bは、損失Lを求める繰り返し回数が、予め設定されている所定の回数以下の場合、処理をステップS409へ進める。
【0156】
ステップS408:
第2分光反射率推定部142Bは、所定の回数を繰り返して補正機械学習モデルが生成した補正分光情報画像において、損失Lが最小となる補正分光情報画像を分光画像情報とする。
そして、第2分光反射率推定部142Bは、分光情報画像のデータを、分光情報画像データ記憶部19の分光情報画像データテーブルに対して書き込んで記憶させる。
【0157】
ステップS409:
第2分光反射率推定部142Bは、補正機械学習モデルにおけるニューラルネットワークの関数の係数(パラメータ)を調整する。
そして、第2分光反射率推定部142Bは、処理をステップS405へ進め、再度、係数を調整した補正機械学習モデルを用いて、一次分光情報画像を補正した補正分光情報画像の推定を行う。
【0158】
上述したように、第5の実施形態では、第1分光反射率推定部141Bが、被写体のRGB画像と、当該RGB画像を撮像した撮像装置の撮像装置分光感度と、RGB画像を撮像した環境の光源の光源分光分布とに基づき、RGB画像の被写体の分光情報(分光反射率)を一次分光情報画像として推定する。また、第2分光反射率推定部142Bが、一次分光情報画像と、入力RGB画像と、撮像装置分光感度と、光源分光分布とに基づき、一次分光情報画像を補正した補正分光情報画像を推定する。
この構成により、第5の本実施形態では、対象となる撮像装置毎に、推定を行う撮像環境のそれぞれの機械学習モデルを生成する必要がなくなり、また、分光放射輝度を推定してから分光反射率を推定する必要もなくなる。
また、この構成により、第5の本実施形態では、推定した一次分光情報画像を用いて、一次分光情報画像の推定に用いたRGB画像の色成分R、色成分G及び色成分Bの各々と、より近い再構成RGB画像を生成する補正分光情報画像を分光情報画像として推定する。このため、第2分光反射率推定部142Bが一次分光情報画像の補正を行うことによって、分光情報画像推定装置10Bは、RGB画像(3バンドの画像、すなわちRチャネル、Gチャネル及びBチャネルの各チャネルの画像)から、撮像されている物体の4バンド以上の分光情報画像(分光反射率画像、分光画像)を、容易に、かつより精度高く推定することを可能とする。
【0159】
なお、上述した第5の実施形態では、補正機械学習モデルのパラメータの初期値として任意の値が設定される例について説明したが、かかる例に限定されない。例えば、補正機械学習モデルのパラメータの初期値として、事前学習によって算出した値が設定されてもよい。この場合、任意の値を設定する場合と比較して、より精度高くパラメータの初期値を設定することができるため、補正分光情報画像の推定における補正機械学習モデルのパラメータを調整する回数を低減することができる。
【0160】
補正機械学習モデルの事前学習は、機械学習モデル生成部13B又は第2分光反射率推定部142Bによって行われる。補正機械学習モデルを事前学習させる場合の教師データは、例えば、機械学習モデルの学習時に機械学習モデルに入力された入力データ(入力RGB画像、撮像装置分光感度、光源分光分布)と、当該入力データに基づき機械学習モデル推定して出力した一次分光情報画像とである。
補正機械学習モデルの事前学習では、補正分光情報画像の推定時と同様に、入力RGB画像と生成したRGB画像(再構成RGB画像)との損失が小さくなるよう補正機械学習モデルのパラメータを繰り返し更新する。
【0161】
上述した第5の実施形態では、補正分光情報画像の推定時の損失にはRGB損失又は平滑化損失が含まれる例について説明したが、補正機械学習モデルの事前学習時の損失にはRGB損失と平滑化損失以外の損失が含まれてもよい。これにより、補正機械学習モデルの事前学習精度を高めることができる。なお、RGB損失は、補正機械学習モデルの推定する補正分光情報画像の分光情報、教師画像を撮像した撮像装置の撮像分光感度、及び教師画像を撮像した環境の前記光源分光分布から生成されるRGB画像(再構成RGB画像)と、教師画像のRGB画像(入力RGB画像)との誤差である。また、平滑化損失は、推定される補正分光情報画像における隣接する波長間の分光反射率の差分である。
【0162】
例えば、教師画像の既知の分光情報と、補正機械学習モデルの推定する補正分光情報画像の分光情報との誤差から求めた値(分光損失)が損失に含まれてもよい。
また、第1積分値と第3積分値との差から求める値が損失に含まれてもよい。第1積分値は、教師画像の既知の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である。第3積分値は、補正機械学習モデルによって推定された補正分光情報画像の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である。
また、教師画像の既知の分光情報から算出されるLAB色空間の値と、補正機械学習モデルによって推定された補正分光情報画像の分光情報から算出されるLAB色空間の値に基づき算出される色差(色差損失)が損失に含まれてもよい。
なお、補正機械学習モデルの事前学習においては、少なくとも分光損失を含む損失を用いる。
【0163】
図16は、第5の実施形態に係る機械学習モデル生成部13Bによる補正機械学習モデルの教師データによる学習処理の動作例を示すフローチャートである。
【0164】
ステップS501:
機械学習モデル生成部13Bは、一次分光情報画像を学習対象の補正機械学習モデルへ入力する。当該一次分光情報画像は、例えば、図14のステップS304にて推定された一次分光情報画像である。また、機械学習モデル生成部13Bは、一次分光情報画像の推定に用いられた入力RGB画像、撮像装置分光感度、及び光源分光分布も学習対象の補正機械学習モデルへ入力する。
【0165】
ステップS502:
機械学習モデルは、機械学習モデル生成部13Bに入力される一次分光情報画像、入力RGB画像、撮像装置分光感度、及び光源分光分布を教師データとして、補正分光情報画像を推定して出力する。
【0166】
ステップS503:
機械学習モデル生成部13Bは、一次分光情報画像毎に、推定された補正分光情報画像と、一次分光情報画像の既知の分光反射率との分光差分を求める。
【0167】
ステップS504:
次に、機械学習モデル生成部13Bは、損失Lを算出する。具体的に、機械学習モデル生成部13Bは、(2)式あるいは(3)式の損失関数に対して分光差分を代入し、損失Lspectralを求め、損失Lとする。
【0168】
ステップS505:
機械学習モデル生成部13Bは、損失Lを求める繰り返し回数が、予め設定されている所定の回数を超えたか否かの判定を行う。
このとき、機械学習モデル生成部13Bは、損失Lを求める繰り返し回数が所定の回数を超えた場合、処理をステップS506へ進める。
一方、機械学習モデル生成部13Bは、損失Lを求める繰り返し回数が所定の回数以下の場合、処理をステップS507へ進める。
【0169】
ステップS506:
機械学習モデル生成部13Bは、所定の回数を繰返して求めた補正機械学習モデルのなかから、損失Lが最小となる補正機械学習モデルを選択し、当該補正機械学習モデルを学習済みとして、機械学習モデル記憶部18に対して書き込んで記憶させる。
そして、機械学習モデル生成部13Bは、補正機械学習モデルの学習の処理、すなわち補正機械学習モデルの事前学習処理(生成処理)を終了する。
【0170】
ステップS507:
機械学習モデル生成部13Bは、補正機械学習モデルにおけるニューラルネットワークの関数の係数を調整する。
そして、機械学習モデル生成部13Bは、処理をステップS502に対して進め、再度の補正分光情報画像の推定を行う。
【0171】
以上、本発明の実施形態について説明した。なお、上述した各実施形態は、それぞれ単独で本発明の実施形態として適用されてもよいし、実施形態の全部又は一部を他の実施形態に組み合わせて本発明の実施形態として適用されてもよい。また、各実施形態の構成は、他の実施形態で説明した構成に代えて適用されてもよいし、他の実施形態で説明した構成に対して追加的に適用されてもよい。
【0172】
また、本発明における図2の分光情報画像推定装置10、図12の分光情報画像推定装置10A、図13の分光情報画像推定装置10Bのそれぞれの機能の一部又は全部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて実行することにより、RGB画像(撮像画像)から被写体の分光情報画像を推定する処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWW(World Wide Web)システムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc - Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM(Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
【0173】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0174】
以上、図面を参照して本発明の実施形態を詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0175】
なお、以下の各発明も本発明に含まれる。
【0176】
(発明1)
被写体の撮像画像であるRGB画像と、前記撮像画像を撮像した撮像装置の分光感度である撮像装置分光感度と、前記撮像画像を撮像した環境の光源の分光分布である光源分光分布とに基づき、前記被写体の分光反射率を示す第1分光情報画像を推定する第1分光反射率推定部と、
前記第1分光反射率推定部によって推定された前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とに基づき、前記第1分光情報画像を補正した第2分光情報画像を推定する第2分光反射率推定部と、
を備えることを特徴とする分光情報画像推定装置。
【0177】
(発明2)
前記第1分光反射率推定部は、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とを第1機械学習モデルに入力し、前記第1分光情報画像を推定する
ことを特徴とする発明1に記載の分光情報画像推定装置。
【0178】
(発明3)
前記第2分光反射率推定部は、前記第1分光情報画像と、前記RGB画像と、前記撮像装置分光感度と、前記光源分光分布とを第2機械学習モデルに入力し、前記第2分光情報画像を推定し、
前記第2機械学習モデルは、入力された前記第1分光情報画像の分光情報と、前記撮像装置分光感度と、前記光源分光分布とに基づきRGB画像を生成し、入力されたRGB画像と生成したRGB画像との損失が小さくなるよう前記第2機械学習モデルのパラメータを繰り返し更新することで、前記第1分光情報画像を補正する、
ことを特徴とする発明1又は発明2に記載の分光情報画像推定装置。
【0179】
(発明4)
前記第2分光反射率推定部は、前記第2機械学習モデルの前記パラメータの初期値として、事前学習によって算出した値を設定する、
ことを特徴とする発明1から発明3のいずれかに記載の分光情報画像推定装置。
【0180】
(発明5)
前記第1機械学習モデルは、分光反射率が既知のRGB画像である教師画像と、前記教師画像を撮像した撮像装置の撮像分光感度と、前記教師画像を撮像した環境の光源分光分布とを教師データとし、前記教師画像の既知の分光情報と、前記第1機械学習モデルの推定する前記第1分光情報画像の分光情報との誤差から求めた値を損失とし、機械学習した学習済みモデルである、
ことを特徴とする発明1から発明4のいずれかに記載の分光情報画像推定装置。
【0181】
(発明6)
前記損失は、前記第1機械学習モデルの推定する前記第1分光情報画像の分光情報、前記教師画像を撮像した撮像装置の撮像分光感度、及び前記教師画像を撮像した環境の前記光源分光分布から生成されるRGB画像と、前記教師画像のRGB画像との誤差を含んでいる、
ことを特徴とする発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0182】
(発明7)
前記損失は、推定される前記第1分光情報画像における隣接する波長間の分光反射率の差分を含んでいる、
ことを特徴とする発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0183】
(発明8)
前記損失は、第1積分値と第2積分値との差から求める値を含み、
前記第1積分値は、前記教師画像の既知の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値であり、
前記第2積分値は、前記第1機械学習モデルによって推定された前記第1分光情報画像の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である、
ことを特徴とする発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0184】
(発明9)
前記損失は、前記教師画像の既知の分光情報から算出されるLAB色空間の値と、前記第1機械学習モデルによって推定された前記第1分光情報画像の分光情報から算出されるLAB色空間の値に基づき算出される色差を含んでいる、
ことを特徴とする発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0185】
(発明10)
前記損失は、推定される前記第2分光情報画像における隣接する波長間の分光反射率の差分を含んでいる、
ことを特徴とする発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0186】
(発明11)
前記損失は、教師画像の既知の分光情報と、前記第2機械学習モデルの推定する前記第2分光情報画像の分光情報との誤差から求めた値を含んでいる、
ことを特徴とする発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0187】
(発明12)
前記損失は、前記第2機械学習モデルの推定する前記第2分光情報画像の分光情報、前記教師画像を撮像した撮像装置の撮像分光感度、及び前記教師画像を撮像した環境の前記光源分光分布から生成されるRGB画像と、前記教師画像のRGB画像との誤差を含んでいる、
ことを特徴とする発明11に記載の分光情報画像推定装置。
【0188】
(発明13)
前記損失は、推定される前記第2分光情報画像における隣接する波長間の分光反射率の差分を含んでいる、
ことを特徴とする発明11に記載の分光情報画像推定装置。
【0189】
(発明14)
前記損失は、第1積分値と第3積分値との差から求める値を含み、
前記第1積分値は、前記教師画像の既知の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値であり、
前記第3積分値は、前記第2機械学習モデルによって推定された前記第2分光情報画像の分光情報と、既知の任意の分光情報に基づき作成された光源分光分布との分光ごとの積の積分値である、
ことを特徴とする発明11に記載の分光情報画像推定装置。
【0190】
(発明15)
前記損失は、前記教師画像の既知の分光情報から算出されるLAB色空間の値と、前記第2機械学習モデルによって推定された前記第2分光情報画像の分光情報から算出されるLAB色空間の値に基づき算出される色差を含んでいる、
ことを特徴とする発明11に記載の分光情報画像推定装置。
【0191】
(発明16)
複数の分光情報画像を含む分光情報画像データセット、複数の光源分光分布を含む光源分光分布データセット、及び複数の撮像装置分光感度を含む撮像装置分光感度データセットの各データセットから分光情報画像、光源分光分布、及び撮像装置分光感度をそれぞれ選択し、選択した分光情報画像、光源分光分布、及び撮像装置分光感度からRGB画像を教師画像として生成するデータ生成部と、
生成された前記教師画像を用いて、前記機械学習モデルを生成する機械学習モデル生成部と、
をさらに備える発明1から発明5のいずれかに記載の分光情報画像推定装置。
【0192】
(発明17)
前記データ生成部は、選択した分光情報画像、光源分光分布、及び撮像装置分光感度に対して任意の倍率を与えることで、前記教師画像を生成するための分光情報画像、光源分光分布、及び撮像装置分光感度を新しく生成する、
ことを特徴とする発明16に記載の分光情報画像推定装置。
【0193】
(発明18)
前記光源分光分布データセットは、前記光源分光分布における含有比率が大きい分光成分を含み、
前記撮像装置分光感度データセットは、前記撮像装置分光感度における含有比率が大きい分光成分を含み、
前記データ生成部は、前記分光成分に対して所定の係数を乗算し、乗算結果を加算あるいは減算することで、前記教師画像を生成するための前記光源分光分布又は撮像装置分光感度を新しく生成する、
ことを特徴とする発明16に記載の分光情報画像推定装置。
【符号の説明】
【0194】
10,10A,10B…分光情報画像推定装置
11,11B…データ入力部
12…データ合成部
13,13B…機械学習モデル生成部
14,14A,14B…分光反射率推定部
15…分光画像出力部
16,16B…教師画像データ記憶部
17…撮像画像データ記憶部
18…機械学習モデル記憶部
19…分光情報画像データ記憶部
20…データ生成部
141,141A,141B…第1分光反射率推定部
142,142B…第2分光反射率推定部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16