IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特開2024-17409画像処理装置、撮像装置、画像処理方法、及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024017409
(43)【公開日】2024-02-08
(54)【発明の名称】画像処理装置、撮像装置、画像処理方法、及びプログラム
(51)【国際特許分類】
   G06T 5/50 20060101AFI20240201BHJP
   H04N 23/60 20230101ALI20240201BHJP
   G06T 1/40 20060101ALI20240201BHJP
   G02B 7/34 20210101ALI20240201BHJP
   G03B 13/36 20210101ALI20240201BHJP
【FI】
G06T5/50
H04N5/232 290
G06T1/40
G02B7/34
G03B13/36
【審査請求】未請求
【請求項の数】37
【出願形態】OL
(21)【出願番号】P 2022120029
(22)【出願日】2022-07-27
(71)【出願人】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】島田 智大
(72)【発明者】
【氏名】斎藤 太郎
(72)【発明者】
【氏名】田中 康一
【テーマコード(参考)】
2H011
2H151
5B057
5C122
【Fターム(参考)】
2H011BA23
2H151BA02
2H151CB29
2H151CE30
2H151CE34
5B057CA08
5B057CA12
5B057CA16
5B057CB08
5B057CB12
5B057CB16
5B057CE08
5B057DB02
5B057DB09
5B057DC30
5B057DC40
5C122EA12
5C122EA61
5C122FH09
5C122FH18
5C122GA34
5C122HA88
5C122HB01
(57)【要約】
【課題】合成対象とされる複数の画像の特性を活かした合成画像を得ることができる画像処理装置、撮像装置、画像処理方法、及びプログラムを提供する。
【解決手段】画像処理装置は、プロセッサを備える。プロセッサは、第1画像に対して第1AI処理が行われることによって得られた第2画像と、第1画像に対して、又は、第3画像に対して、第1AI処理が行われずに得られた第4画像とを取得し、第1画像及び/又は第3画像の指標に応じて第2画像と第4画像とを合成する。
【選択図】図8
【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
第1画像に対して第1AI処理が行われることによって得られた第2画像と、前記第1画像に対して、又は、第3画像に対して、前記第1AI処理が行われずに得られた第4画像とを取得し、
前記第1画像及び/又は前記第3画像の指標に応じて前記第2画像と前記第4画像とを合成する
画像処理装置。
【請求項2】
前記第3画像は、前記第1画像の内容が別の表現方法で表現された画像である
請求項1に記載の画像処理装置。
【請求項3】
前記第4画像は、被写体に対する距離の分布を示す画像である
請求項1又は請求項2に記載の画像処理装置。
【請求項4】
前記第2画像と前記第4画像は、前記指標に基づいて導出される信頼度に応じた割合で合成される
請求項1に記載の画像処理装置。
【請求項5】
前記信頼度は、非AI処理の処理結果から得られる
請求項4に記載の画像処理装置。
【請求項6】
前記非AI処理は、前記第1画像及び/又は前記第3画像に対して行われる
請求項5に記載の画像処理装置。
【請求項7】
前記信頼度は、学習済みモデルによって導出される
請求項4から請求項6の何れか一項に記載の画像処理装置。
【請求項8】
前記学習済みモデルは、信頼度ネットワークであり、
前記信頼度ネットワークは、前記信頼度を出力するニューラルネットワークである
請求項7に記載の画像処理装置。
【請求項9】
前記信頼度は、前記第1画像及び/又は前記第3画像に対して割り当てられた1つの値であり、
前記第2画像と前記第4画像とが前記信頼度に対応する1つの前記割合で合成される
請求項4から請求項8の何れか一項に記載の画像処理装置。
【請求項10】
前記信頼度は、前記第1画像に対する信頼可能な度合いを示す第1信頼度、及び/又は前記第3画像に対する信頼可能な度合いを示す第2信頼度を含む
請求項4から請求項9の何れか一項に記載の画像処理装置。
【請求項11】
前記第1信頼度は、複数の第1分割信頼度であり、
前記複数の第1分割信頼度は、前記第1画像内の複数の第1画像領域に対応しており、
前記第1分割信頼度は、対応する前記第1画像領域に対する信頼可能な度合いである
請求項10に記載の画像処理装置。
【請求項12】
前記複数の第1分割信頼度は、前記複数の第1画像領域に対して分布している
請求項11に記載の画像処理装置。
【請求項13】
前記第2画像と前記第4画像とが合成される場合、前記複数の第1分割信頼度と前記複数の第1画像領域との対応関係を表現した第1信頼度マップ内で前記第1分割信頼度が第1基準値を上回る前記第1画像領域に対応する前記第2画像内での画像領域は、前記第4画像内での対応する画像領域よりも高い割合で合成される
請求項11又は請求項12に記載の画像処理装置。
【請求項14】
前記第2画像と前記第4画像とが合成された合成画像内の第1特定画像領域には、前記第2画像内の画像領域は用いられずに、前記第4画像内の画像領域が用いられ、
前記第1特定画像領域に用いられる前記第4画像内の画像領域は、前記第1分割信頼度が前記第1基準値未満の値である第2基準値以下の前記第1画像領域に対応する領域である
請求項13に記載の画像処理装置。
【請求項15】
前記第2信頼度は、複数の第2分割信頼度であり、
前記複数の第2分割信頼度は、前記第3画像内の複数の第2画像領域に対応しており、
前記第2分割信頼度は、対応する前記第2画像領域に対する信頼可能な度合いである
請求項10から請求項14の何れか一項に記載の画像処理装置。
【請求項16】
前記複数の第2分割信頼度は、前記複数の第2画像領域に対して分布している
請求項15に記載の画像処理装置。
【請求項17】
前記第2画像と前記第4画像とが合成される場合、前記複数の第2分割信頼度と前記複数の第4画像領域との対応関係を表現した第2信頼度マップ内で前記第2分割信頼度が第3基準値を上回る前記第2画像領域に対応する前記第4画像内での画像領域は、前記第2画像内での対応する画像領域よりも高い割合で合成される
請求項15又は請求項16に記載の画像処理装置。
【請求項18】
前記第2画像と前記第4画像とが合成された合成画像内の第2特定画像領域には、前記第4画像内の画像領域は用いられずに、前記第2画像内の画像領域が用いられ、
前記第2特定画像領域に用いられる前記第2画像内の画像領域は、前記第2分割信頼度が前記第3基準値未満の値である第4基準値以下の前記第4画像領域に対応する領域である
請求項17に記載の画像処理装置。
【請求項19】
前記第4画像は、前記第1AI処理と同種の役割を担う非AI方式の処理が行われていない画像である
請求項1から請求項18の何れか一項に記載の画像処理装置。
【請求項20】
前記第2画像と前記第4画像との合成は、前記第2画像と前記第4画像との積和演算によって実現される
請求項1から請求項19の何れか一項に記載の画像処理装置。
【請求項21】
前記指標は、マップ化が可能な情報である
請求項1から請求項20の何れか一項に記載の画像処理装置。
【請求項22】
前記第2画像の次元と前記第4画像の次元とが異なっている場合に、前記第2画像と前記第4画像は、前記第2画像及び前記第4画像のうちの一方の次元を他方の次元に合わせてから合成される
請求項1から請求項21の何れか一項に記載の画像処理装置。
【請求項23】
前記一方の次元を前記他方の次元に合わせる処理として、正規化処理が行われ、
前記正規化処理は、前記第2画像内の複数の第3画像領域に対応する複数の第1代表値と前記第4画像内の複数の第4画像領域に対応する複数の第2代表値とに基づいて前記第2画像又は前記第4画像を正規化する処理であり、
前記複数の第3画像領域と前記複数の第4画像領域は、第1類似度を上回る度合いで互いに類似している
請求項22に記載の画像処理装置。
【請求項24】
前記一方の次元を前記他方の次元に合わせる処理として、正規化処理が行われ、
前記正規化処理は、前記第2画像内の単一の第5画像領域内の複数の第3代表値と、前記第4画像内の単一の第6画像領域内の複数の第4代表値とに基づいて前記第2画像又は前記第4画像を正規化する処理であり、
前記第5画像領域と前記第6画像領域は、第2類似度を上回る度合いで互いに類似している
請求項22に記載の画像処理装置。
【請求項25】
前記第1画像は、被写体が撮像されることにより得られた撮像画像であり、
前記第1AI処理は、撮像位置から前記被写体までの距離の分布を示す第1距離画像を生成する距離画像生成処理を含み、
前記第4画像は、前記被写体に対して測距が行われた結果の分布を示す第2距離画像である
請求項1から請求項24の何れか一項に記載の画像処理装置。
【請求項26】
前記指標は、前記撮像画像内のエッジ領域を含む
請求項25に記載の画像処理装置。
【請求項27】
前記第2画像と前記第4画像とが合成される場合、前記第2距離画像内の前記エッジ領域に対応する画像領域である第1エッジ対応領域は、前記第1距離画像内の前記エッジ領域に対応する画像領域である第2エッジ対応領域よりも大きな割合で合成される
請求項26に記載の画像処理装置。
【請求項28】
前記指標は、前記撮像画像内の非エッジ領域を含む
請求項25から請求項27の何れか一項に記載の画像処理装置。
【請求項29】
前記第2画像と前記第4画像とが合成される場合、前記第1距離画像内の前記非エッジ領域に対応する画像領域である第1非エッジ対応領域は、前記第2距離画像内の前記非エッジ領域に対応する画像領域である第2非エッジ対応領域よりも大きな割合で合成される
請求項28に記載の画像処理装置。
【請求項30】
前記第1画像は、環境現象と動体とを含む被写体が撮像されることによって得られた画像であり、
前記第4画像は、前記第1画像から前記環境現象の写り込みを低減する非AI方式の処理が行われることによって得られた画像であり、
前記指標は、前記第1画像に前記動体が写っているか否かを特定可能な情報を含み、
前記指標から前記第1画像に前記動体が写っていると特定され、かつ、前記第2画像と前記第4画像とが合成される場合、前記第2画像内の前記動体が写っている画像領域は、前記第4画像内の前記動体が写っている画像領域よりも大きな割合で合成される
請求項1から請求項29の何れか一項に画像処理装置。
【請求項31】
前記第1画像は、霞を含む被写体が撮像されることによって得られた画像であり、
前記第4画像は、前記第1画像から前記霞の写り込みを低減する非AI方式の処理が行われることによって得られた画像であり、
前記第2画像は、前記第1画像に対して前記第1AI処理が行われることによって前記第1画像から前記霞の写り込みが低減された画像であり、
前記指標は、前記第1画像内の前記霞が写っている画像領域である霞領域を特定可能な情報を含み、
前記第2画像と前記第4画像とが合成される場合、前記第4画像内の前記指標から特定される前記霞領域に対応する画像領域は、前記第2画像内の前記指標から特定される前記霞領域に対応する画像領域よりも大きな割合で合成される
請求項1から請求項30の何れか一項に記載の画像処理装置。
【請求項32】
前記第3画像は、撮像対象領域が撮像されることで得られた赤外光画像であり、
前記第4画像は、前記撮像対象領域内の温度の分布を示し、かつ、前記赤外光画像に基づく第1温度分布画像であり、
前記第2画像は、前記撮像対象領域内の温度の分布を示し、かつ、前記第1画像に対して前記第1AI処理が行われることによって得られた第2温度分布画像であり、
前記指標は、前記第2温度分布画像内において前記第1温度分布画像に写らない熱放射体を示す画像領域である第1領域と前記第1領域以外の画像領域である第2領域とを区別可能な情報を含み、
前記第2画像と前記第4画像とが合成される場合、
前記指標に従って、
前記第1温度分布画像内の前記第2領域に対応する画像領域は、前記第2領域よりも大きな割合で合成され、かつ、前記第1領域は、前記第1温度分布画像内の前記第1領域に対応する画像領域よりも大きな割合で合成される
請求項1から請求項31の何れか一項に記載の画像処理装置。
【請求項33】
前記第3画像は、被写体が撮像されることで得られたマルチスペクトル画像であり、
前記第4画像は、前記マルチスペクトル画像に基づく画像であり、
前記第2画像は、前記マルチスペクトル画像に対して前記第1AI処理が行われることによって得られた画像であり、
前記指標は、前記第2画像内において特定被写体を示す画像領域である特定被写体領域と前記特定被写体領域以外の画像領域である非特定被写体領域とを区別可能な情報を含み、
前記第2画像と前記第4画像とが合成される場合、
前記指標に従って、
前記第4画像内の前記非特定被写体領域に対応する画像領域は、前記非特定被写体領域よりも大きな割合で合成され、かつ、前記特定被写体領域は、前記第4画像内の前記特定被写体領域に対応する画像領域よりも大きな割合で合成される
請求項1から請求項32の何れか一項に記載の画像処理装置。
【請求項34】
プロセッサを備え、
前記プロセッサは、
第1画像に対して第1AI処理が行われることによって得られた第2画像と、第3画像に対して、前記第1AI処理が行われずに得られた第4画像とを取得し、
前記第3画像の指標に応じて前記第2画像と前記第4画像とを合成する
画像処理装置。
【請求項35】
請求項1から請求項34の何れか一項に記載の画像処理装置と、
イメージセンサと、を備え、
前記第1画像は、前記イメージセンサによって撮像されることによって得られる画像である
撮像装置。
【請求項36】
第1画像に対して第1AI処理が行われることによって得られた第2画像と、前記第1画像に対して、又は、第3画像に対して、前記第1AI処理が行われずに得られた第4画像とを取得すること、並びに、
前記第1画像及び/又は前記第3画像の指標に応じて前記第2画像と前記第4画像とを合成すること、を含む
画像処理方法。
【請求項37】
コンピュータに、
第1画像に対して第1AI処理が行われることによって得られた第2画像と、前記第1画像に対して、又は、第3画像に対して、前記第1AI処理が行われずに得られた第4画像とを取得すること、並びに、
前記第1画像及び/又は前記第3画像の指標に応じて前記第2画像と前記第4画像とを合成すること、を含む処理を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の技術は、画像処理装置、撮像装置、画像処理方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、入力層、出力層、及び入力層と出力層との間に設けられる中間層を有するニューラルネットワークを用いて、入力層に入力される入力画像に対して処理を行う処理部と、中間層に含まれる1以上のノードの少なくとも1つの内部パラメータであって、学習によって算出される内部パラメータを、学習の後に処理を行うとき、入力画像に関連するデータに基づいて調整する調整部と、を備える画像処理システムが開示されている。
【0003】
また、特許文献1に記載の画像処理システムにおいて、入力画像は、ノイズを含む画像であり、入力画像は、処理部が行う処理により、入力画像からノイズを除去、又は低減される。
【0004】
また、特許文献1に記載の画像処理システムにおいて、ニューラルネットワークは、第1のニューラルネットワークと、第2のニューラルネットワークと、入力画像を高周波成分画像と低周波成分画像とに分割し、高周波成分画像を第1のニューラルネットワークに入力する一方、低周波成分画像を第2のニューラルネットワークに入力する分割ユニットと、第1のニューラルネットワークから出力される第1の出力画像と、第2のニューラルネットワークから出力される第2の出力画像とを合成する合成ユニットと、を有し、調整部は、第1のニューラルネットワークの内部パラメータを入力画像に関連するデータに基づいて調整する一方、第2のニューラルネットワークの内部パラメータは調整しない。
【0005】
更に、特許文献1には、ニューラルネットワークを用いて、ノイズが低減された出力画像を入力画像から生成する処理部と、ニューラルネットワークの内部パラメータを、入力画像の撮像条件に応じて調整する調整部と、を備える画像処理システムが開示されている。
【0006】
特許文献2には、被検者の所定部位の医用画像である第1の画像を取得する取得部と、機械学習エンジンを含む高画質化エンジンを用いて、第1の画像から、第1の画像と比べて高画質化された第2の画像を生成する高画質化部と、第1の画像の少なくとも一部の領域に関する情報を用いて得た割合により第1の画像と第2画像とを合成して得た合成画像を表示部に表示させる表示制御部と、を備える医用画像処理装置が開示されている。
【0007】
特許文献3には、少なくとも1つの命令語を保存するメモリと、メモリと電気的に接続され、命令語を実行することで、入力イメージから入力イメージの品質を示すノイズマップを獲得し、入力イメージ及びノイズマップを複数のレイヤを含む学習ネットワークモデルに適用し、入力イメージの品質の改善された出力イメージを獲得するプロセッサと、を含み、プロセッサは、複数のレイヤのうち少なくとも一つの中間レイヤにノイズマップを提供し、学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び各サンプルイメージに対する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された学習済み人口知能モデルである電子装置が開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2018-206382号公報
【特許文献2】特開2020-166814号公報
【特許文献3】特開2020-184300号公報
【発明の概要】
【0009】
本開示の技術に係る一つの実施形態は、合成対象とされる複数の画像の特性を活かした合成画像を得ることができる画像処理装置、撮像装置、画像処理方法、及びプログラムを提供する。
【課題を解決するための手段】
【0010】
本開示の技術に係る第1の態様は、プロセッサを備え、プロセッサが、第1画像に対して第1AI処理が行われることによって得られた第2画像と、第1画像に対して、又は、第3画像に対して、第1AI処理が行われずに得られた第4画像とを取得し、第1画像及び/又は第3画像の指標に応じて第2画像と第4画像とを合成する画像処理装置である。
【0011】
本開示の技術に係る第2の態様は、第3画像が、第1画像の内容が別の表現方法で表現された画像である、第1の態様に係る画像処理装置である。
【0012】
本開示の技術に係る第3の態様は、第4画像が、被写体に対する距離の分布を示す画像である、第1の態様又は第2の態様に係る画像処理装置である。
【0013】
本開示の技術に係る第4の態様は、第2画像と第4画像が、指標に基づいて導出される信頼度に応じた割合で合成される、第1の態様に係る画像処理装置である。
【0014】
本開示の技術に係る第5の態様は、信頼度が、非AI処理の処理結果から得られる、第4の態様に係る画像処理装置である。
【0015】
本開示の技術に係る第6の態様は、非AI処理が、第1画像及び/又は第3画像に対して行われる、第5の態様に係る画像処理装置である。
【0016】
本開示の技術に係る第7の態様は、信頼度が、学習済みモデルによって導出される、第4の態様から第6の態様の何れか1つの態様に係る画像処理装置である。
【0017】
本開示の技術に係る第8の態様は、学習済みモデルが、信頼度ネットワークであり、信頼度ネットワークが、信頼度を出力するニューラルネットワークである、第7の態様に係る画像処理装置である。
【0018】
本開示の技術に係る第9の態様は、信頼度が、第1画像及び/又は第3画像に対して割り当てられた1つの値であり、第2画像と第4画像とが信頼度に対応する1つの割合で合成される、第4の態様から第8の態様の何れか1つの態様に係る画像処理装置である。
【0019】
本開示の技術に係る第10の態様は、信頼度が、第1画像に対する信頼可能な度合いを示す第1信頼度、及び/又は第3画像に対する信頼可能な度合いを示す第2信頼度を含む第4の態様から第9の態様の何れか1つの態様に係る画像処理装置である。
【0020】
本開示の技術に係る第11の態様は、第1信頼度が、複数の第1分割信頼度であり、複数の第1分割信頼度が、第1画像内の複数の第1画像領域に対応しており、第1分割信頼度が、対応する第1画像領域に対する信頼可能な度合いである、第10の態様に係る画像処理装置である。
【0021】
本開示の技術に係る第12の態様は、複数の第1分割信頼度が、複数の第1画像領域に対して分布している、第11の態様に係る画像処理装置である。
【0022】
本開示の技術に係る第13の態様は、第2画像と第4画像とが合成される場合、複数の第1分割信頼度と複数の第1画像領域との対応関係を表現した第1信頼度マップ内で第1分割信頼度が第1基準値を上回る第1画像領域に対応する第2画像内での画像領域が、第4画像内での対応する画像領域よりも高い割合で合成される、第11の態様又は第12の態様に係る画像処理装置である。
【0023】
本開示の技術に係る第14の態様は、第2画像と第4画像とが合成された合成画像内の第1特定画像領域には、第2画像内の画像領域は用いられずに、第4画像内の画像領域が用いられ、第1特定画像領域に用いられる第4画像内の画像領域が、第1分割信頼度が第1基準値未満の値である第2基準値以下の第1画像領域に対応する領域である、第13の態様に係る画像処理装置である。
【0024】
本開示の技術に係る第15の態様は、第2信頼度が、複数の第2分割信頼度であり、複数の第2分割信頼度が、第3画像内の複数の第2画像領域に対応しており、第2分割信頼度が、対応する第2画像領域に対する信頼可能な度合いである、第10の態様から第14の態様の何れか1つの態様に係る画像処理装置である。
【0025】
本開示の技術に係る第16の態様は、複数の第2分割信頼度が、複数の第2画像領域に対して分布している、第15の態様に係る画像処理装置である。
【0026】
本開示の技術に係る第17の態様は、第2画像と第4画像とが合成される場合、複数の第2分割信頼度と複数の第4画像領域との対応関係を表現した第2信頼度マップ内で第2分割信頼度が第3基準値を上回る第2画像領域に対応する第4画像内での画像領域が、第2画像内での対応する画像領域よりも高い割合で合成される、第15の態様又は第16の態様に係る画像処理装置である。
【0027】
本開示の技術に係る第18の態様は、第2画像と第4画像とが合成された合成画像内の第2特定画像領域には、第4画像内の画像領域は用いられずに、第2画像内の画像領域が用いられ、第2特定画像領域に用いられる第2画像内の画像領域が、第2分割信頼度が第3基準値未満の値である第4基準値以下の第4画像領域に対応する領域である、第17の態様に係る画像処理装置である。
【0028】
本開示の技術に係る第19の態様は、第4画像が、第1AI処理と同種の役割を担う非AI方式の処理が行われていない画像である、第1の態様から第18の態様の何れか1つの態様に係る画像処理装置である。
【0029】
本開示の技術に係る第20の態様は、第2画像と第4画像との合成が、第2画像と第4画像との積和演算によって実現される、第1の態様から第19の態様の何れか1つの態様に係る画像処理装置である。
【0030】
本開示の技術に係る第21の態様は、指標が、マップ化が可能な情報である、第1の態様から第20の態様の何れか1つの態様に係る画像処理装置である。
【0031】
本開示の技術に係る第22の態様は、第2画像の次元と第4画像の次元とが異なっている場合に、第2画像と第4画像が、第2画像及び第4画像のうちの一方の次元を他方の次元に合わせてから合成される、第1の態様から第21の態様の何れか1つの態様に係る画像処理装置である。
【0032】
本開示の技術に係る第23の態様は、一方の次元を他方の次元に合わせる処理として、正規化処理が行われ、正規化処理が、第2画像内の複数の第3画像領域に対応する複数の第1代表値と第4画像内の複数の第4画像領域に対応する複数の第2代表値とに基づいて第2画像又は第4画像を正規化する処理であり、複数の第3画像領域と複数の第4画像領域が、第1類似度を上回る度合いで互いに類似している、第22の態様に係る画像処理装置である。
【0033】
本開示の技術に係る第24の態様は、一方の次元を他方の次元に合わせる処理として、正規化処理が行われ、正規化処理が、第2画像内の単一の第5画像領域内の複数の第3代表値と、第4画像内の単一の第6画像領域内の複数の第4代表値とに基づいて第2画像又は第4画像を正規化する処理であり、第5画像領域と第6画像領域が、第2類似度を上回る度合いで互いに類似している、第22の態様に係る画像処理装置である。
【0034】
本開示の技術に係る第25の態様は、第1画像が、被写体が撮像されることにより得られた撮像画像であり、第1AI処理が、撮像位置から被写体までの距離の分布を示す第1距離画像を生成する距離画像生成処理を含み、第4画像が、被写体に対して測距が行われた結果の分布を示す第2距離画像である、第1の態様から第24の態様の何れか1つの態様に係る画像処理装置である。
【0035】
本開示の技術に係る第26の態様は、指標が、撮像画像内のエッジ領域を含む、第25の態様に係る画像処理装置である。
【0036】
本開示の技術に係る第27の態様は、第2画像と第4画像とが合成される場合、第2距離画像内のエッジ領域に対応する画像領域である第1エッジ対応領域が、第1距離画像内のエッジ領域に対応する画像領域である第2エッジ対応領域よりも大きな割合で合成される、第26の態様に係る画像処理装置である。
【0037】
本開示の技術に係る第28の態様は、指標が、撮像画像内の非エッジ領域を含む、第25の態様から第27の態様の何れか1つの態様に係る画像処理装置である。
【0038】
本開示の技術に係る第29の態様は、第2画像と第4画像とが合成される場合、第1距離画像内の非エッジ領域に対応する画像領域である第1非エッジ対応領域が、第2距離画像内の非エッジ領域に対応する画像領域である第2非エッジ対応領域よりも大きな割合で合成される、第28の態様に係る画像処理装置である。
【0039】
本開示の技術に係る第30の態様は、第1画像が、環境現象と動体とを含む被写体が撮像されることによって得られた画像であり、第4画像が、第1画像から環境現象の写り込みを低減する非AI方式の処理が行われることによって得られた画像であり、指標が、第1画像に動体が写っているか否かを特定可能な情報を含み、指標から第1画像に動体が写っていると特定され、かつ、第2画像と第4画像とが合成される場合、第2画像内の動体が写っている画像領域が、第4画像内の動体が写っている画像領域よりも大きな割合で合成される、第1の態様から第29の態様の何れか1つの態様に係る画像処理装置である。
【0040】
本開示の技術に係る第31の態様は、第1画像が、霞を含む被写体が撮像されることによって得られた画像であり、第4画像が、第1画像から霞の写り込みを低減する非AI方式の処理が行われることによって得られた画像であり、第2画像が、第1画像に対して第1AI処理が行われることによって第1画像から霞の写り込みが低減された画像であり、指標が、第1画像内の霞が写っている画像領域である霞領域を特定可能な情報を含み、第2画像と第4画像とが合成される場合、第4画像内の指標から特定される霞領域に対応する画像領域が、第2画像内の指標から特定される霞領域に対応する画像領域よりも大きな割合で合成される、第1の態様から第30の態様の何れか1つの態様に係る画像処理装置である。
【0041】
本開示の技術に係る第32の態様は、第3画像が、撮像対象領域が撮像されることで得られた赤外光画像であり、第4画像が、撮像対象領域内の温度の分布を示し、かつ、赤外光画像に基づく第1温度分布画像であり、第2画像が、撮像対象領域内の温度の分布を示し、かつ、第1画像に対して第1AI処理が行われることによって得られた第2温度分布画像であり、指標が、第2温度分布画像内において第1温度分布画像に写らない熱放射体を示す画像領域である第1領域と第1領域以外の画像領域である第2領域とを区別可能な情報を含み、第2画像と第4画像とが合成される場合、指標に従って、第1温度分布画像内の第2領域に対応する画像領域が、第2領域よりも大きな割合で合成され、かつ、第1領域は、第1温度分布画像内の第1領域に対応する画像領域よりも大きな割合で合成される、第1の態様から第31の態様の何れか1つの態様に係る画像処理装置である。
【0042】
本開示の技術に係る第33の態様は、第3画像が、被写体が撮像されることで得られたマルチスペクトル画像であり、第4画像が、マルチスペクトル画像に基づく画像であり、第2画像が、マルチスペクトル画像に対して第1AI処理が行われることによって得られた画像であり、指標が、第2画像内において特定被写体を示す画像領域である特定被写体領域と特定被写体領域以外の画像領域である非特定被写体領域とを区別可能な情報を含み、第2画像と第4画像とが合成される場合、指標に従って、第4画像内の非特定被写体領域に対応する画像領域が、非特定被写体領域よりも大きな割合で合成され、かつ、特定被写体領域は、第4画像内の特定被写体領域に対応する画像領域よりも大きな割合で合成される、第1の態様から第32の態様の何れか1つの態様に係る画像処理装置である。
【0043】
本開示の技術に係る第34の態様は、プロセッサを備え、プロセッサが、第1画像に対して第1AI処理が行われることによって得られた第2画像と、第3画像に対して、第1AI処理が行われずに得られた第4画像とを取得し、第3画像の指標に応じて第2画像と第4画像とを合成する画像処理装置である。
【0044】
本開示の技術に係る第35の態様は、第1の態様から第34の態様の何れか1つの態様に係る画像処理装置と、イメージセンサと、を備え、第1画像が、イメージセンサによって撮像されることによって得られる画像である、撮像装置である。
【0045】
本開示の技術に係る第36の態様は、第1画像に対して第1AI処理が行われることによって得られた第2画像と、第1画像に対して、又は、第3画像に対して、第1AI処理が行われずに得られた第4画像とを取得すること、並びに、第1画像及び/又は第3画像の指標に応じて第2画像と第4画像とを合成すること、を含む画像処理方法である。
【0046】
本開示の技術に係る第37の態様は、コンピュータに、第1画像に対して第1AI処理が行われることによって得られた第2画像と、第1画像に対して、又は、第3画像に対して、第1AI処理が行われずに得られた第4画像とを取得すること、並びに、第1画像及び/又は第3画像の指標に応じて第2画像と第4画像とを合成すること、を含む処理を実行させるためのプログラムである。
【図面の簡単な説明】
【0047】
図1】撮像装置の全体の構成の一例を示す概略構成図である。
図2】イメージセンサの光電変換素子を構成する画素群の配列例を示す概念図である。
図3】撮像装置の光学系及び電気系のハードウェア構成の一例を示す概略構成図である。
図4】画像処理エンジンの機能の一例を示すブロック図である。
図5】第1実施形態に係るAI方式処理部及び信頼度マップ生成部の処理内容の一例を示す概念図である。
図6】第1実施形態に係る非AI方式処理部の処理内容の一例を示す概念図である。
図7】第1実施形態に係る正規化処理部の処理内容の一例を示す概念図である。
図8】第1実施形態に係る割合付与部及び合成部の処理内容の一例を示す概念図である。
図9A】第1実施形態に係る画像合成処理の流れの一例を示すフローチャートである。
図9B図9Aに示すフローチャートの続きである。
図10】第2実施形態に係る正規化処理部の処理内容の一例を示す概念図である。
図11】第3実施形態に係る信頼度マップ生成部の処理内容の一例を示す概念図である。
図12】第3実施形態に係る信頼度マップ生成部の処理内容の変形例を示す概念図である。
図13】第4実施形態に係る信頼度マップ生成部の処理内容の一例を示す概念図である。
図14】第4実施形態に係る割合付与部の処理内容の一例を示す概念図である。
図15】第4実施形態に係る合成部の処理内容の一例を示す概念図である。
図16】第5実施形態に係る信頼度マップ生成部の処理内容の一例を示す概念図である。
図17】第5実施形態に係る割合付与部の処理内容の一例を示す概念図である。
図18】第5実施形態に係る合成部の処理内容の一例を示す概念図である。
図19】第6実施形態に係るAI方式処理部及び動体検出部の処理内容の一例を示す概念図である。
図20】第6実施形態に係る信頼度マップ生成部の処理内容の一例を示す概念図である。
図21】第6実施形態に係る非AI方式処理部の処理内容の一例を示す概念図である。
図22】第6実施形態に係る割合付与部及び合成部の処理内容の一例を示す概念図である。
図23】第7実施形態に係るAI方式処理部及び信頼度マップ生成部の処理内容の一例を示す概念図である。
図24】第7実施形態に係る非AI方式処理部の処理内容の一例を示す概念図である。
図25】第7実施形態に係る割合付与部及び合成部の処理内容の一例を示す概念図である。
図26】第8実施形態に係る撮像装置によって生成される赤外光画像及び可視光画像の一例を示す概念図である。
図27】第8実施形態に係る非AI方式処理部の処理内容の一例を示す概念図である。
図28】第8実施形態に係るAI方式処理部及び信頼度マップ生成部の処理内容の一例を示す概念図である。
図29】第8実施形態に係る割合付与部及び合成部の処理内容の一例を示す概念図である。
図30】第9実施形態に係る撮像装置によって生成されるマルチスペクトル画像の一例を示す概念図である。
図31】撮像システムの構成の一例を示す概念図である。
【発明を実施するための形態】
【0048】
以下、添付図面に従って本開示の技術に係る画像処理装置、撮像装置、画像処理方法、及びプログラムの実施形態の一例について説明する。
【0049】
先ず、以下の説明で使用される文言について説明する。
【0050】
CPUとは、“Central Processing Unit”の略称を指す。GPUとは、“Graphics Processing Unit”の略称を指す。TPUとは、“Tensor processing unit”の略称を指す。NVMとは、“Non-volatile memory”の略称を指す。RAMとは、“Random Access Memory”の略称を指す。ICとは、“Integrated Circuit”の略称を指す。ASICとは、“Application Specific Integrated Circuit”の略称を指す。PLDとは、“Programmable Logic Device”の略称を指す。FPGAとは、“Field-Programmable Gate Array”の略称を指す。SoCとは、“System-on-a-chip”の略称を指す。SSDとは、“Solid State Drive”の略称を指す。USBとは、“Universal Serial Bus”の略称を指す。HDDとは、“Hard Disk Drive”の略称を指す。EEPROMとは、“Electrically Erasable and Programmable Read Only Memory”の略称を指す。ELとは、“Electro-Luminescence”の略称を指す。I/Fとは、“Interface”の略称を指す。UIとは、“User Interface”の略称を指す。fpsとは、“frame per second”の略称を指す。MFとは、“Manual Focus”の略称を指す。AFとは、“Auto Focus”の略称を指す。CMOSとは、“Complementary Metal Oxide Semiconductor”の略称を指す。CCDとは、“Charge Coupled Device”の略称を指す。LANとは、“Local Area Network”の略称を指す。WANとは、“Wide Area Network”の略称を指す。AIとは、“Artificial Intelligence”の略称を指す。A/Dとは、“Analog/Digital”の略称を指す。FIRとは、“Finite Impulse Response”の略称を指す。IIRとは、“Infinite Impulse Response”の略称を指す。VAEとは、“Variational Auto-Encoder”の略称を指す。GANとは、“Generative Adversarial Network”の略称を指す。
【0051】
[第1実施形態]
一例として図1に示すように、撮像装置10は、被写体を撮像する装置であり、画像処理エンジン12、撮像装置本体16、及び交換レンズ18を備えている。撮像装置10は、本開示の技術に係る「撮像装置」の一例である。画像処理エンジン12は、本開示の技術に係る「画像処理装置」及び「コンピュータ」の一例である。
【0052】
画像処理エンジン12は、撮像装置本体16に内蔵されており、撮像装置10の全体を制御する。交換レンズ18は、撮像装置本体16に交換可能に装着される。交換レンズ18には、フォーカスリング18Aが設けられている。フォーカスリング18Aは、撮像装置10のユーザ(以下、単に「ユーザ」と称する)等が撮像装置10による被写体に対するピントの調整を手動で行う場合にユーザ等によって操作される。
【0053】
図1に示す例では、撮像装置10の一例として、レンズ交換式のデジタルカメラが示されている。但し、これは、あくまでも一例に過ぎず、レンズ固定式のデジタルカメラであってもよいし、スマートデバイス、ウェアラブル端末、細胞観察装置、眼科観察装置、内視鏡、又は外科顕微鏡等の各種の電子機器に搭載されるデジタルカメラであってもよい。
【0054】
撮像装置本体16には、イメージセンサ20が設けられている。イメージセンサ20は、本開示の技術に係る「イメージセンサ」の一例である。イメージセンサ20は、CMOSイメージセンサである。イメージセンサ20は、被写体を撮像することで、画像を示す画像データを生成して出力する。交換レンズ18が撮像装置本体16に装着された場合に、被写体を示す被写体光は、交換レンズ18を透過してイメージセンサ20に結像され、画像データがイメージセンサ20によって生成される。
【0055】
本第1実施形態では、イメージセンサ20としてCMOSイメージセンサを例示しているが、本開示の技術はこれに限定されず、例えば、イメージセンサ20がCCDイメージセンサ等の他種類のイメージセンサであっても本開示の技術は成立する。
【0056】
撮像装置本体16の上面には、レリーズボタン22及びダイヤル24が設けられている。ダイヤル24は、撮像系の動作モード及び再生系の動作モード等の設定の際に操作され、ダイヤル24が操作されることによって、撮像装置10では、動作モードとして、撮像モード、再生モード、及び設定モードが選択的に設定される。撮像モードは、撮像装置10に対して撮像を行わせる動作モードである。再生モードは、撮像モードで記録用の撮像が行われることによって得られた画像(例えば、静止画像及び/又は動画像)を再生する動作モードである。設定モードは、撮像に関連する制御で用いられる各種の設定値を設定する場合などに撮像装置10に対して設定する動作モードである。
【0057】
レリーズボタン22は、撮像準備指示部及び撮像指示部として機能し、撮像準備指示状態と撮像指示状態との2段階の押圧操作が検出可能である。撮像準備指示状態とは、例えば待機位置から中間位置(半押し位置)まで押下される状態を指し、撮像指示状態とは、中間位置を超えた最終押下位置(全押し位置)まで押下される状態を指す。なお、以下では、「待機位置から半押し位置まで押下される状態」を「半押し状態」といい、「待機位置から全押し位置まで押下される状態」を「全押し状態」という。撮像装置10の構成によっては、撮像準備指示状態とは、ユーザの指がレリーズボタン22に接触した状態であってもよく、撮像指示状態とは、操作するユーザの指がレリーズボタン22に接触した状態から離れた状態に移行した状態であってもよい。
【0058】
撮像装置本体16の背面には、指示キー26及びタッチパネル・ディスプレイ32が設けられている。
【0059】
タッチパネル・ディスプレイ32は、ディスプレイ28及びタッチパネル30(図3も参照)を備えている。ディスプレイ28の一例としては、ELディスプレイ(例えば、有機ELディスプレイ又は無機ELディスプレイ)が挙げられる。ディスプレイ28は、ELディスプレイではなく、液晶ディスプレイ等の他種類のディスプレイであってもよい。
【0060】
ディスプレイ28は、画像及び/又は文字情報等を表示する。ディスプレイ28は、撮像装置10が撮像モードの場合に、ライブビュー画像用の撮像、すなわち、連続的な撮像が行われることにより得られたライブビュー画像の表示に用いられる。ここで、「ライブビュー画像」とは、イメージセンサ20によって撮像されることにより得られた画像データに基づく表示用の動画像を指す。ライブビュー画像を得るために行われる撮像(以下、「ライブビュー画像用撮像」とも称する)は、例えば、60fpsのフレームレートに従って行われる。60fpsは、あくまでも一例に過ぎず、60fps未満のフレームレートであってもよいし、60fpsを超えるフレームレートであってもよい。
【0061】
ディスプレイ28は、撮像装置10に対してレリーズボタン22を介して静止画像用の撮像の指示が与えられた場合に、静止画像用の撮像が行われることで得られた静止画像の表示にも用いられる。また、ディスプレイ28は、撮像装置10が再生モードの場合の再生画像等の表示にも用いられる。更に、ディスプレイ28は、撮像装置10が設定モードの場合に、各種メニューを選択可能なメニュー画面の表示、及び、撮像に関連する制御で用いられる各種の設定値等を設定するための設定画面の表示にも用いられる。
【0062】
タッチパネル30は、透過型のタッチパネルであり、ディスプレイ28の表示領域の表面に重ねられている。タッチパネル30は、指又はスタイラスペン等の指示体による接触を検知することで、ユーザからの指示を受け付ける。なお、以下では、説明の便宜上、上述した「全押し状態」には、撮像開始用のソフトキーに対してユーザがタッチパネル30を介してオンした状態も含まれる。
【0063】
本第1実施形態では、タッチパネル・ディスプレイ32の一例として、タッチパネル30がディスプレイ28の表示領域の表面に重ねられているアウトセル型のタッチパネル・ディスプレイを挙げているが、これはあくまでも一例に過ぎない。例えば、タッチパネル・ディスプレイ32として、オンセル型又はインセル型のタッチパネル・ディスプレイを適用することも可能である。
【0064】
指示キー26は、各種の指示を受け付ける。ここで、「各種の指示」とは、例えば、メニュー画面の表示の指示、1つ又は複数のメニューの選択の指示、選択内容の確定の指示、選択内容の消去の指示、ズームイン、ズームアウト、及びコマ送り等の各種の指示等を指す。また、これらの指示はタッチパネル30によってされてもよい。
【0065】
一例として図2に示すように、イメージセンサ20は、光電変換素子72を備えている。光電変換素子72は、マトリクス状に配置された複数の感光画素を有する。感光画素は、フォトダイオードを有する物理的な画素であり、受光した光を光電変換し、受光量に応じた電気信号を出力する。
【0066】
光電変換素子72に含まれる各フォトダイオードには、カラーフィルタが既定のパターン配列(例えば、ベイヤ配列、GストライプR/G完全市松、X-Trans(登録商標)配列、又はハニカム配列等)で配置されている。カラーフィルタは、輝度信号を得るために最も寄与するG(緑色)波長域に対応するGフィルタ、R(赤色)波長域に対応するRフィルタ、及びB(青色)波長域に対応するBフィルタを含む。
【0067】
光電変換素子72は、位相差画素と、位相差画素とは異なる画素である非位相差画素Nとの2種類の感光画素を含む。位相差画素に対し、非位相差画素Nは、通常画素とも称される。光電変換素子72は、非位相差画素として、R画素、G画素、及びB画素の3種類の感光画素を有する。R画素、G画素、B画素、及び位相差画素は、行方向(例えば、水平方向)及び列方向(例えば、垂直方向)の各々に既定の周期性で規則的に配置されている。R画素は、Rフィルタが配置されたフォトダイオードに対応する画素であり、G画素及び位相差画素は、Gフィルタが配置されたフォトダイオードに対応する画素であり、B画素は、Bフィルタが配置されたフォトダイオードに対応する画素である。なお、以下では、説明の便宜上、R画素、G画素、及びB画素を区別して説明する必要がない場合、これらを「可視光画素」と称する。
【0068】
光電変換素子72の受光面72Aには、複数の位相差画素ライン72A1と複数の非位相差画素ライン72A2とが配列されている。位相差画素ライン72A1は、位相差画素を含む水平ラインである。具体的には、位相差画素ライン72A1は、位相差画素と非位相差画素Nとが混在している水平ラインである。非位相差画素ライン72A2は、複数の非位相差画素Nのみを含む水平ラインである。
【0069】
受光面72Aには、位相差画素ライン72A1と、既定ライン数分の非位相差画素ライン72A2とが列方向に沿って交互に配置されている。ここで言う「既定ライン数」とは、例えば、2ラインを指す。なお、ここでは、既定ライン数として、2ラインを例示しているが、本開示の技術はこれに限らず、既定ライン数は、3ライン以上の数ラインであってもよいし、十数ライン、数十ライン、又は数百ライン等であってもよい。
【0070】
位相差画素ライン72A1は、1行目から最終行にかけて列方向に2行飛ばしで配列されている。位相差画素ライン72A1の一部の画素が位相差画素である。具体的には、位相差画素ライン72A1は、位相差画素と非位相差画素Nとが周期的に配列された水平ラインである。位相差画素は、第1位相差画素Lと第2位相差画素Rとに大別される。位相差画素ライン72A1には、G画素として第1位相差画素Lと第2位相差画素Rとがライン方向に数画素間隔で交互に配置されている。
【0071】
第1位相差画素L及び第2位相差画素Rは、列方向で交互に現れるように配置されている。図2に示す例では、4列目において、1行目から列方向に沿って第1位相差画素L、第2位相差画素R、第1位相差画素L、及び第2位相差画素Rの順に配置されている。すなわち、第1位相差画素Lと第2位相差画素Rとが1行目から列方向に沿って交互に配置されている。また、図2に示す例では、10列目において、1行目から列方向に沿って第2位相差画素R、第1位相差画素L、第2位相差画素R、及び第1位相差画素Lの順に配置されている。すなわち、第2位相差画素Rと第1位相差画素Lとが1行目から列方向に沿って交互に配置されている。
【0072】
光電変換素子72は、2つの画素群に区分される。すなわち、光電変換素子72は、一般撮像系画素群72AG1及び測距系画素群72AG2を有する。一般撮像系画素群72AG1及び測距系画素群72AG2は、可視光を受光し、受光量に応じた電気信号を出力する。
【0073】
一般撮像系画素群72AG1は、複数の可視光画素による可視光画素群であり、可視光画像の生成に用いられる。測距系画素群72AG2は、2次元状に配置された複数の位相差画素による位相差画素群であり、測距に用いられる。なお、測距系画素群は、測距に用いることが可能な画素群であればよく、例えば、測距系画素群に用いられる画素は、デュアルピクセル又はクアッドピクセル等のように、複数のフォトダイオードを含む画素であってもよい。
【0074】
本第1実施形態において、測距とは、受光面72Aから被写体までの距離の測定を指す。測距は、レリーズボタン22及び/又はタッチパネル・ディスプレイ32等を介してユーザから与えられた指示に応じて実行される。
【0075】
一例として図3に示すように、光電変換素子72は、受光面72Aの中心と光軸OAとが一致するように撮像装置本体16内に配置されている。受光面72Aには、交換レンズ18を介して被写体光が結像される。
【0076】
交換レンズ18は、撮像レンズ40を備えている。撮像レンズ40は、対物レンズ40A、フォーカスレンズ40B、ズームレンズ40C、及び絞り40Dを有する。対物レンズ40A、フォーカスレンズ40B、ズームレンズ40C、及び絞り40Dは、被写体側(すなわち、物体側)から撮像装置本体16側(すなわち、像側)にかけて、光軸OAに沿って、対物レンズ40A、フォーカスレンズ40B、ズームレンズ40C、及び絞り40Dの順に配置されている。
【0077】
また、交換レンズ18は、制御装置36、第1アクチュエータ37、第2アクチュエータ38、及び第3アクチュエータ39を備えている。制御装置36は、撮像装置本体16からの指示に従って交換レンズ18の全体を制御する。制御装置36は、例えば、CPU、NVM、及びRAM等を含むコンピュータを有する装置である。制御装置36のNVMは、例えば、EEPROMである。また、制御装置36のRAMは、各種情報を一時的に記憶し、ワークメモリとして用いられる。制御装置36において、CPUは、NVMから必要なプログラムを読み出し、読み出した各種プログラムをRAM上で実行することで撮像レンズ40の全体を制御する。
【0078】
なお、ここでは、制御装置36の一例として、コンピュータを有する装置を挙げているが、これは、あくまでも一例に過ぎず、ASIC、FPGA、及び/又はPLDを含むデバイスを適用してもよい。また、制御装置36として、例えば、ハードウェア構成及びソフトウェア構成の組み合わせによって実現される装置を用いてよい。
【0079】
第1アクチュエータ37は、フォーカス用スライド機構(図示省略)及びフォーカス用モータ(図示省略)を備えている。フォーカス用スライド機構には、光軸OAに沿ってスライド可能にフォーカスレンズ40Bが取り付けられている。また、フォーカス用スライド機構にはフォーカス用モータが接続されており、フォーカス用スライド機構は、フォーカス用モータの動力を受けて作動することでフォーカスレンズ40Bを光軸OAに沿って移動させる。
【0080】
第2アクチュエータ38は、ズーム用スライド機構(図示省略)及びズーム用モータ(図示省略)を備えている。ズーム用スライド機構には、光軸OAに沿ってスライド可能にズームレンズ40Cが取り付けられている。また、ズーム用スライド機構にはズーム用モータが接続されており、ズーム用スライド機構は、ズーム用モータの動力を受けて作動することでズームレンズ40Cを光軸OAに沿って移動させる。
【0081】
第3アクチュエータ39は、動力伝達機構(図示省略)及び絞り用モータ(図示省略)を備えている。絞り40Dは、開口40D1を有しており、開口40D1の大きさが可変な絞りである。開口40D1は、例えば、複数枚の絞り羽根40D2によって形成されている。複数枚の絞り羽根40D2は、動力伝達機構に連結されている。また、動力伝達機構には絞り用モータが接続されており、動力伝達機構は、絞り用モータの動力を複数枚の絞り羽根40D2に伝達する。複数枚の絞り羽根40D2は、動力伝達機構から伝達される動力を受けて作動することで開口40D1の大きさを変化させる。絞り40Dは、開口40D1の大きさを変化させることで露出を調節する。
【0082】
フォーカス用モータ、ズーム用モータ、及び絞り用モータは、制御装置36に接続されており、制御装置36によってフォーカス用モータ、ズーム用モータ、及び絞り用モータの各駆動が制御される。なお、本第1実施形態では、フォーカス用モータ、ズーム用モータ、及び絞り用モータの一例として、ステッピングモータが採用されている。従って、フォーカス用モータ、ズーム用モータ、及び絞り用モータは、制御装置36からの命令によりパルス信号に同期して動作する。なお、ここでは、フォーカス用モータ、ズーム用モータ、及び絞り用モータが交換レンズ18に設けられている例が示されているが、これは、あくまでも一例に過ぎず、フォーカス用モータ、ズーム用モータ、及び絞り用モータのうちの少なくとも1つが撮像装置本体16に設けられていてもよい。なお、交換レンズ18の構成物及び/又は動作方法は、必要に応じて変更可能である。
【0083】
撮像装置10では、撮像モードの場合に、撮像装置本体16に対して与えられた指示に従ってMFモードとAFモードとが選択的に設定される。MFモードは、手動でピントを合わせる動作モードである。MFモードでは、例えば、ユーザによってフォーカスリング18A等が操作されることで、フォーカスリング18A等の操作量に応じた移動量でフォーカスレンズ40Bが光軸OAに沿って移動し、これによって焦点が調節される。
【0084】
AFモードでは、撮像装置本体16が被写体距離に応じた合焦位置の演算を行い、演算して得た合焦位置に向けてフォーカスレンズ40Bを移動させることで、焦点を調節する。ここで、合焦位置とは、ピントが合っている状態でのフォーカスレンズ40Bの光軸OA上での位置を指す。
【0085】
撮像装置本体16は、画像処理エンジン12、イメージセンサ20、システムコントローラ44、画像メモリ46、UI系デバイス48、外部I/F50、通信I/F52、光電変換素子ドライバ54、及び入出力インタフェース70を備えている。また、イメージセンサ20は、光電変換素子72、及びA/D変換器74を備えている。
【0086】
入出力インタフェース70には、画像処理エンジン12、画像メモリ46、UI系デバイス48、外部I/F50、光電変換素子ドライバ54、メカニカルシャッタドライバ56、及びA/D変換器74が接続されている。また、入出力インタフェース70には、交換レンズ18の制御装置36も接続されている。
【0087】
システムコントローラ44は、CPU(図示省略)、NVM(図示省略)、及びRAM(図示省略)を備えている。システムコントローラ44において、NVMには、非一時的記憶媒体であり、各種パラメータ及び各種プログラムが記憶されている。システムコントローラ44のNVMは、例えば、EEPROMである。但し、これは、あくまでも一例に過ぎず、EEPROMに代えて、又は、EEPROMと共に、HDD、及び/又はSSD等をシステムコントローラ44のNVMとして適用してもよい。また、システムコントローラ44のRAMは、各種情報を一時的に記憶し、ワークメモリとして用いられる。システムコントローラ44において、CPUは、NVMから必要なプログラムを読み出し、読み出した各種プログラムをRAM上で実行することで撮像装置10の全体を制御する。すなわち、図3に示す例では、画像処理エンジン12、画像メモリ46、UI系デバイス48、外部I/F50、通信I/F52、光電変換素子ドライバ54、及び制御装置36がシステムコントローラ44によって制御される。
【0088】
画像処理エンジン12は、システムコントローラ44の制御下で動作する。画像処理エンジン12は、プロセッサ62、NVM64、及びRAM66を備えている。ここで、プロセッサ62は、本開示の技術に係る「プロセッサ」の一例である。
【0089】
プロセッサ62、NVM64、及びRAM66は、バス68を介して接続されており、バス68は入出力インタフェース70に接続されている。なお、図3に示す例では、図示の都合上、バス68として1本のバスが図示されているが、複数本のバスであってもよい。バス68は、シリアルバスであってもよいし、データバス、アドレスバス、及びコントロールバス等を含むパラレルバスであってもよい。
【0090】
プロセッサ62は、CPU及びGPUを有しており、GPUは、CPUの制御下で動作し、主に画像処理の実行を担う。なお、プロセッサ62は、GPU機能を統合した1つ以上のCPUであってもよいし、GPU機能を統合していない1つ以上のCPUであってもよい。また、プロセッサ62には、マルチコアCPUが含まれていてもよいし、TPUが含まれていてもよい。
【0091】
NVM64は、非一時的記憶媒体であり、システムコントローラ44のNVMに記憶されている各種パラメータ及び各種プログラムとは異なる各種パラメータ及び各種プログラムを記憶している。NVM64は、例えば、EEPROMである。但し、これは、あくまでも一例に過ぎず、EEPROMに代えて、又は、EEPROMと共に、HDD、及び/又はSSD等をNVM64として適用してもよい。また、RAM66は、各種情報を一時的に記憶し、ワークメモリとして用いられる。
【0092】
プロセッサ62は、NVM64から必要なプログラムを読み出し、読み出したプログラムをRAM66上で実行する。プロセッサ62は、RAM66上で実行するプログラムに従って各種の画像処理を行う。
【0093】
光電変換素子72には、光電変換素子ドライバ54が接続されている。光電変換素子ドライバ54は、光電変換素子72によって行われる撮像のタイミングを規定する撮像タイミング信号を、プロセッサ62からの指示に従って光電変換素子72に供給する。光電変換素子72は、光電変換素子ドライバ54から供給された撮像タイミング信号に従って、リセット、露光、及び電気信号の出力を行う。撮像タイミング信号としては、例えば、垂直同期信号及び水平同期信号が挙げられる。
【0094】
交換レンズ18が撮像装置本体16に装着された場合、撮像レンズ40に入射された被写体光は、撮像レンズ40によって受光面72Aに結像される。光電変換素子72は、光電変換素子ドライバ54の制御下で、受光面72Aによって受光された被写体光を光電変換し、被写体光の光量に応じた電気信号を、被写体光を示すアナログ画像データとしてA/D変換器74に出力する。具体的には、A/D変換器74が、露光順次読み出し方式で、光電変換素子72から1フレーム単位で且つ水平ライン毎にアナログ画像データを読み出す。
【0095】
A/D変換器74は、アナログ画像データをデジタル化することで処理対象画像75Aを生成する。処理対象画像75Aは、撮像装置10によって撮像が行われることによって得られる。
【0096】
処理対象画像75Aは、撮像画像75A1及び位相差画像75A2を有する。撮像画像75A1は、被写体が一般撮像系画素群72AG1(図2参照)によって撮像されることで得られる。撮像画像75A1は、R画素、G画素、及びB画素が電子像としてモザイク状に配列された画像である。位相差画像75A2は、被写体が測距系画素群72AG2(図2参照)によって撮像されることで得られる画像であり、測距に用いられる。すなわち、位相差画像75A2は、撮像画像75A1の内容(例えば、撮像画像75A1に写っている被写体に関する情報)が別の表現方法(例えば、位相差を検出可能な表現方法)で表現された画像である。
【0097】
撮像画像75A1は、本開示の技術に係る「第1画像」及び「撮像画像」の一例であり、位相差画像75A2は、本開示の技術に係る「第3画像」の一例である。
【0098】
本第1実施形態において、一例として、画像処理エンジン12のプロセッサ62は、A/D変換器74から処理対象画像75Aを取得し、取得した処理対象画像75Aに対して各種の画像処理を行う。
【0099】
画像メモリ46には、処理済み画像75Bが記憶される。処理済み画像75Bは、処理対象画像75Aに対してプロセッサ62によって各種の画像処理が行われることによって得られた画像である。
【0100】
UI系デバイス48は、ディスプレイ28を備えており、プロセッサ62は、ディスプレイ28に対して各種情報を表示させる。また、UI系デバイス48は、受付デバイス76を備えている。受付デバイス76は、タッチパネル30及びハードキー部78を備えている。ハードキー部78は、指示キー26(図1参照)を含む複数のハードキーである。プロセッサ62は、タッチパネル30によって受け付けられた各種指示に従って動作する。なお、ここでは、ハードキー部78がUI系デバイス48に含まれているが、本開示の技術はこれに限定されず、例えば、ハードキー部78は、外部I/F50に接続されていてもよい。
【0101】
外部I/F50は、撮像装置10の外部に存在する装置(以下、「外部装置」とも称する)との間の各種情報の授受を司る。外部I/F50の一例としては、USBインタフェースが挙げられる。USBインタフェースには、スマートデバイス、パーソナル・コンピュータ、サーバ、USBメモリ、メモリカード、及び/又はプリンタ等の外部装置(図示省略)が直接的又は間接的に接続される。
【0102】
通信I/F52は、ネットワーク(図示省略)に接続されている。通信I/F52は、ネットワーク上のサーバ等の通信装置(図示省略)とシステムコントローラ44との間の情報の授受を司る。例えば、通信I/F52は、システムコントローラ44からの要求に応じた情報を、ネットワークを介して通信装置に送信する。また、通信I/F52は、通信装置から送信された情報を受信し、受信した情報を、入出力インタフェース70を介してシステムコントローラ44に出力する。
【0103】
一例として図4に示すように、撮像装置10のNVM64には、画像合成処理プログラム80が記憶されている。画像合成処理プログラム80は、本開示の技術に係る「プログラム」の一例である。
【0104】
撮像装置10のNVM64には、生成モデル82Aが記憶されている。生成モデル82Aの一例としては、学習済みの生成ネットワークが挙げられる。生成ネットワークの一例としては、GAN又はVAE等が挙げられる。プロセッサ62は、処理対象画像75A(図3参照)に対してAI方式の処理を行う。AI方式の処理の一例としては、生成モデル82Aを用いた処理が挙げられる。すなわち、AI方式の処理の一例としては、ニューラルネットワークを用いた処理が挙げられる。これに対し、非AI方式の処理とは、ニューラルネットワークを用いない処理を指す。以下では、説明の便宜上、生成モデル82Aを用いた処理については、生成モデル82Aが主体となって能動的に行う処理として説明する。すなわち、説明の便宜上、生成モデル82Aを、入力された情報に対して処理を行って処理結果を出力する機能と見立てて説明する。
【0105】
撮像装置10のNVM64には、デジタルフィルタ84Aが記憶されている。デジタルフィルタ84Aの一例としては、FIRフィルタが挙げられる。なお、FIRフィルタは、あくまでも一例に過ぎず、IIRフィルタ等の他のデジタルフィルタであってもよい。
【0106】
プロセッサ62は、NVM64から画像合成処理プログラム80を読み出し、読み出した画像合成処理プログラム80をRAM66上で実行する。プロセッサ62は、RAM66上で実行する画像合成処理プログラム80に従って画像合成処理(図9A及び図9B参照)を行う。画像合成処理は、プロセッサ62が画像合成処理プログラム80に従ってAI方式処理部62A1、信頼度マップ生成部62B1、非AI方式処理部62C1、正規化処理部62D1、割合付与部62E1、及び合成部62F1として動作することによって実現される。生成モデル82Aは、AI方式処理部62A1によって用いられ、デジタルフィルタ84Aは、非AI方式処理部62C1によって用いられる。
【0107】
一例として図5に示すように、AI方式処理部62A1及び信頼度マップ生成部62B1には、撮像画像75A1aが入力される。撮像画像75A1aは、図3に示す撮像画像75A1の一例である。撮像画像75A1aは、人物領域85A及び背景領域85Bを有する。人物領域85Aは、人物が写っている画像領域である。背景領域85Bは、背景が写っている画像領域である。背景領域85Bに写っている背景は、例えば、鉛直方向に立設した状態の壁面である。
【0108】
AI方式処理部62A1は、撮像画像75A1aに対して距離画像生成処理を行う。距離画像生成処理は、AI方式の処理である。図5に示す例では、距離画像生成処理の一例として、生成モデル82A1を用いた処理が示されている。生成モデル82A1は、図4に示す生成モデル82Aの一例である。AI方式処理部62A1によって行われる距離画像生成処理は、本開示の技術に係る「第1AI処理」及び「距離画像生成処理」の一例である。
【0109】
生成モデル82A1は、可視光画像を距離画像に変換する学習が既に行われた生成ネットワークである。本第1実施形態において、距離画像とは、可視光画像により示される被写体に対する距離の分布を示す画像を指す。距離画像において、距離の分布は、画素単位で表現される。また、距離画像において、距離の分布は、撮像位置から被写体までの距離の長短に応じた有彩色で表現される。例えば、撮像位置から被写体までの距離は、距離が長くなるほど長波長側の色で表現される。これにより、撮像位置から被写体までの距離が距離画像内の色から画素単位で特定可能となる。なお、距離の分布を有彩色で表現する方法は、あくまでも一例に過ぎず、距離の分布は、例えば、撮像位置から被写体までの距離が無彩色の濃淡で表現されてもよい。
【0110】
AI方式処理部62A1は、撮像画像75A1aに対して生成モデル82A1を用いた処理を行うことで第1距離画像86を生成する。すなわち、生成モデル82A1は、入力された撮像画像75A1aに基づいて第1距離画像86を生成して出力する。第1距離画像86は、撮像位置から被写体までの距離の分布を示す画像である。撮像位置から被写体までの距離とは、例えば、受光面72A(図2及び図3参照)の位置から被写体(例えば、人物領域85Aに写っている人物、及び背景領域85Bに写っている背景)までの距離の分布を示す画像を指す。受光面72Aの位置から被写体までの距離の分布は、例えば、撮像画像75A1a内の画素単位で表現される。第1距離画像86は、本開示の技術に係る「第2画像」の一例である。
【0111】
ところで、プロセッサ62は、図3に示す位相差画像75A2を用いることにより、撮像画像75A1aに写っているエッジ領域(例えば、ピントを合わせることが可能な模様及び/又は輪郭等がある部分)に対する測距を、非エッジ領域(すなわち、エッジ領域以外の領域)に対する測距よりも高精度に行うことが可能となる。よって、エッジ領域の存否は、位相差画像75A2を用いた測距の結果が信頼できるか否かを判断する上での重要な判断材料となる。つまり、撮像画像75A1a内のエッジ領域が存在する位置については、位相差画像75A2を用いた測距の結果を信頼した方が良く、撮像画像75A1a内の非エッジ領域の位置については、位相差画像75A2を用いた測距の結果を信頼しない方が良い、という判断を下すことが可能となる。
【0112】
そこで、信頼度マップ生成部62B1は、非AI方式の処理を行うことで、撮像画像75A1aに対する信頼度の撮像画像75A1a内での分布を示す信頼度マップ88Aを生成する。信頼度は、撮像画像75A1aに対する信頼可能な度合いを示している。また、本第1実施形態において、信頼度は、撮像画像75A1aに対して行われた非AI方式の処理の結果である。信頼度は、例えば、0.0以上1.0以下の数値内で規定される値であり、信頼度が大きい程、位相差画像75A2を用いた測距の結果を信頼することができる。例えば、撮像画像75A1aにエッジ領域(すなわち、位相差画像75A2を用いた測距に寄与するエッジ領域)が多く写っているほど、信頼度の値は大きくなる。撮像画像75A1aに対する信頼可能な度合いを示す信頼度は、本開示の技術に係る「第1画像に対する信頼可能な度合いを示す第1信頼度」の一例である。
【0113】
信頼度マップ生成部62B1は、撮像画像75A1aに対して、非AI方式の処理としてデジタルフィルタ84A1を用いた処理を行うことで信頼度マップ88Aを生成する。デジタルフィルタ84A1は、図4に示すデジタルフィルタ84Aの一例である。デジタルフィルタ84A1は、位相差画像75A2を用いた高精度な測距を実現可能な模様及び/又は輪郭等を示す高周波成分をエッジ領域88A1として検出するハイパスフィルタを有する。エッジ領域88A1は、撮像画像75A1a内のエッジ領域(すなわち、撮像画像75A1aからデジタルフィルタ84Aによって検出されたエッジ領域)である。信頼度マップ88Aには、エッジ領域88A1(すなわち、位相差画像75A2を用いた測距の結果を信頼できる要素)と、エッジ領域88A1以外の画像領域である非エッジ領域88A2とが含まれている。例えば、エッジ領域88A1は、撮像画像75A1aに対する信頼度が“1.0”の画像領域であり、非エッジ領域88A2は、撮像画像75A1aに対する信頼度が“0.0”の画像領域である。すなわち、エッジ領域88A1は、位相差画像75A2を用いた測距の結果を信頼した方が良い画像領域であり、非エッジ領域88A2は、位相差画像75A2を用いた測距の結果を信頼しない方が良い画像領域である。エッジ領域88A1及び非エッジ領域88A2は、本開示の技術に係る「指標」及び「マップ化が可能な情報」の一例である。
【0114】
一例として図6に示すように、非AI方式処理部62C1は、位相差画像75A2から第2距離画像89を生成する。第2距離画像89は、被写体に対する距離の分布を示す画像である。換言すると、第2距離画像89は、被写体(例えば、図5に示す人物領域85Aに写っている人物、及び図5に示す背景領域85Bに写っている背景)に対して測距(すなわち、位相差画像75A2を用いた測距)が行われた結果の分布を示す画像である。第2距離画像89は、本開示の技術に係る「第1画像に対して第1AI処理が行われずに得られた第4画像」の一例である。なお、位相差画像75A2から第2距離画像89を生成する方法は、公知なので、ここでの説明は省略する。
【0115】
ところで、本第1実施形態において、撮像画像75A1aを基に生成された第1距離画像86と、位相差画像75A2を基に生成された第2距離画像89は、互いの次元が異なっている。第1距離画像86と第2距離画像89との合成が行われる場合、第1距離画像86と第2距離画像89との合成に先立って、第1距離画像86及び第2距離画像89のうちの一方の次元を他方の次元に合わせることが好ましい。なぜならば、第1距離画像86と第2距離画像89とが次元を合わせた状態で合成された方が、第1距離画像86と第2距離画像89とが次元を合わさずに合成される場合に比べ、合成後の画像に対する信頼性が高くなるからである。
【0116】
そこで、一例として図7に示すように、正規化処理部62D1は、第2距離画像89の次元を第1距離画像86の次元に合わせる処理を行う。ここでは、第2距離画像89の次元を第1距離画像86の次元に合わせる処理を例示しているが、これは、あくまでも一例に過ぎず、第1距離画像86の次元を第2距離画像89の次元に合わせてもよい。
【0117】
第2距離画像89の次元を第1距離画像86の次元に合わせる処理の一例としては、正規化処理が挙げられる。正規化処理は、第1代表値90A1、第2代表値90B1、第3代表値92A1、及び第4代表値92B1に基づいて第2距離画像89を正規化する処理である。
【0118】
第1代表値90A1は、第1距離画像86内の画像領域90Aに対応する値である。第2代表値90B1は、第1距離画像86内の画像領域90Bに対応する値である。第3代表値92A1は、第2距離画像89内の画像領域92Aに対応する値である。第4代表値92B1は、第2距離画像89内の画像領域92Bに対応する値である。
【0119】
第1距離画像86内での画像領域90Aは、第2距離画像89内での画像領域92Aと対応関係にある。すなわち、第1距離画像86内での画像領域90Aの位置は、第2距離画像89内での画像領域92Aの位置と一致している。また、第1距離画像86と第2距離画像89との間で、画像領域90A及び画像領域92Aの互いの色の傾向(すなわち、撮像位置から被写体まで距離の傾向)が既定類似度を上回る度合いで類似している。既定類似度の一例としては、第2距離画像89の正規化を行う上で問題が生じないことが事前に確認された類似度の下限値が挙げられる。本第1実施形態では、画像領域90A及び画像領域92Aとして、第1距離画像86と第2距離画像89との間で互いの色の傾向が、既定類似度を上回り、かつ、最も高い類似度で類似している画像領域が適用されている。なお、ここでは、最も高い類似度で類似している画像領域を例示したが、既定類似度を上回る類似度であれば、第1距離画像86と第2距離画像89との間で2番目以降に高い類似度で類似している画像領域であってもよい。
【0120】
第1距離画像86内での画像領域90Bは、第2距離画像89内での画像領域92Bと対応関係にある。すなわち、第1距離画像86内での画像領域90Bの位置は、第2距離画像89内での画像領域92Bの位置と一致している。また、第1距離画像86と第2距離画像89との間で、画像領域90B及び画像領域92Bの互いの色の傾向(すなわち、撮像位置から被写体まで距離の傾向)で既定類似度を上回る度合いで類似している。本第1実施形態では、画像領域90B及び画像領域92Bとして、第1距離画像86と第2距離画像89との間で互いの色の傾向が、既定類似度を上回り、かつ、最も高い類似度で類似している画像領域が適用されている。なお、ここでは、最も高い類似度で類似している画像領域を例示したが、既定類似度を上回る類似度であれば、第1距離画像86と第2距離画像89との間で2番目以降に高い類似度で類似している画像領域であってもよい。
【0121】
第1代表値90A1の一例としては、画像領域90Aを構成する複数の画素(例えば、画像領域90A内の全画素、又は、画像領域90A内の指定された一部領域内の全画素)の画素値のうちの中央値が挙げられる。第2代表値90B1の一例としては、画像領域90Bを構成する複数の画素(例えば、画像領域90B内の全画素、又は、画像領域90B内の指定された一部領域内の全画素)の画素値のうちの中央値が挙げられる。第3代表値92A1の一例としては、画像領域92Aを構成する複数の画素(例えば、画像領域92A内の全画素、又は、画像領域92A内の指定された一部領域内の全画素)の画素値のうちの中央値が挙げられる。第4代表値92B1の一例としては、画像領域92Bを構成する複数の画素(例えば、画像領域92B内の全画素、又は、画像領域92B内の指定された一部領域内の全画素)の画素値のうちの中央値が挙げられる。なお、ここでは、中央値を例示したが、中央値は、あくまでも一例に過ぎず、中央値に代えて、平均値、最頻値、最大値、又は最小値等の統計値を適用してもよいし、画像領域90A、90B、92A及び92Bの各々の代表画素(例えば、中央の画素)の画素値を適用してもよい。
【0122】
ここで、第2距離画像89内の画素値を“l_B(x,y)”とし、第1代表値90A1を“l_A1”とし、第2代表値90B1を“l_A2”とし、第3代表値92A1を“l_B1”とし、第4代表値92B1を“l_B2”とし、正規化した画素値を“l_B1(x,y)”とした場合、“l_B1(x,y)”は以下の数式(1)によって規定される。正規化処理部62D1は、第2距離画像89内の各画素の画素値(すなわち、“l_B(x,y)”)を、数式(1)を用いて“l_B1(x,y)”に変換することで第2距離画像89を正規化する。
【0123】
l_B1(x,y)={l_B(x,y)-l_B1}*{(l_A2-l_A1)/(l_B2-l_B1)}+l_A1・・・・(1)
【0124】
図7に示す例において、画像領域90A及び90Bは、本開示の技術に係る「複数の第3画像領域」の一例であり、画像領域92A及び92Bは、本開示の技術に係る「複数の第4画像領域」の一例である。また、図7に示す例において、第1代表値90A1及び第2代表値90B1は、本開示の技術に係る「複数の第1代表値」の一例であり、第3代表値92A1及び第4代表値92B1は、本開示の技術に係る「複数の第2代表値」の一例である。既定類似度は、本開示の技術に係る「第1類似度」及び「第2類似度」の一例である。
【0125】
一例として図8に示すように、割合付与部62E1は、信頼度マップ生成部62B1によって生成された信頼度マップ88Aに基づいて割合94を導出する。割合94は、AI方式処理部62A1によって生成された第1距離画像86と正規化処理部62D1によって正規化された第2距離画像89とを画素単位で合成する場合に用いる割合である。すなわち、割合94は、第1距離画像86と第2距離画像89とを画素単位で互いにどの程度合成するかを定める値である。
【0126】
割合94は、第1割合94Aと第2割合94Bとに大別される。第1割合94Aは、AI方式処理部62A1によって生成された第1距離画像86に用いられ、第2割合94Bは、正規化処理部62D1によって正規化された第2距離画像89に用いられる。第1割合94A及び第2割合94Bは、信頼度マップ88A内のエッジ領域88A1と非エッジ領域88A2とについて導出される。第1割合94Aは、エッジ領域88A1と非エッジ領域88A2とで異なり、第2割合94Bも、エッジ領域88A1と非エッジ領域88A2とで異なる。
【0127】
エッジ領域88A1について導出される第2割合94Bは、エッジ領域88A1について導出される第1割合94Aよりも大きい。これは、第1距離画像86内のエッジ領域96Aと第2距離画像89内のエッジ領域96Bとが合成された場合、エッジ領域96Bがエッジ領域96Aよりも支配的に表現されることを意味する。なお、ここで、エッジ領域96Aとは、第1距離画像86内の全画像領域のうちの信頼度マップ88A内のエッジ領域88A1の位置に対応する画像領域を指す。また、ここで、エッジ領域96Bとは、第2距離画像89内の全画像領域のうちの信頼度マップ88A内のエッジ領域88A1の位置に対応する画像領域を指す。
【0128】
エッジ領域88A1についての第1割合94A及び第2割合94Bは、信頼度マップ88Aの内容に応じて導出される。例えば、本第1実施形態において、エッジ領域88A1についての第1割合94A及び第2割合94Bは、信頼度マップ88Aから特定されるエッジ領域88A1に応じて導出される。信頼度マップ88Aにおいて、エッジ領域88A1は、信頼度が“1.0”の画像領域である。これは、第1距離画像86内のエッジ領域96A(すなわち、第1距離画像86内の全画像領域のうち、信頼度マップ88A内のエッジ領域88A1の位置に対応する画像領域)よりも、第2距離画像89内のエッジ領域96B(すなわち、第2距離画像89内の全画像領域のうち、信頼度マップ88A内のエッジ領域88A1の位置に対応する画像領域)の方が信頼できることを意味する。そのため、図8に示す例では、エッジ領域88A1について導出される第1割合94Aとして、“0.0”が例示されており、エッジ領域88A1について導出される第2割合94Bとして、“1.0”が例示されている。
【0129】
一方、非エッジ領域88A2について導出される第1割合94Aは、非エッジ領域88A2について導出される第2割合94Bよりも大きい。これは、第1距離画像86内の非エッジ領域98Aと第2距離画像89内の非エッジ領域98Bとが合成された場合、非エッジ領域98Aが非エッジ領域98Bよりも支配的に表現されることを意味する。なお、ここで、非エッジ領域98Aとは、第1距離画像86内の全画像領域のうちの信頼度マップ88A内の非エッジ領域88A2の位置に対応する画像領域を指す。また、ここで、非エッジ領域98Bとは、第2距離画像89内の全画像領域のうちの信頼度マップ88A内の非エッジ領域88A2の位置に対応する画像領域を指す。
【0130】
非エッジ領域88A2についての第1割合94A及び第2割合94Bは、信頼度マップ88Aの内容に応じて導出される。例えば、本第1実施形態において、非エッジ領域88A2についての第1割合94A及び第2割合94Bは、信頼度マップ88Aから特定される非エッジ領域88A2に応じて導出される。信頼度マップ88Aにおいて、非エッジ領域88A2は、信頼度が“0.0”の画像領域である。これは、第2距離画像89内の非エッジ領域98Bよりも、第1距離画像86内の非エッジ領域98Aの方が信頼できることを意味する。そのため、図8に示す例では、非エッジ領域88A2について導出される第1割合94Aとして、“1.0”が例示されており、非エッジ領域88A2について導出される第2割合94Bとして、“0.0”が例示されている。
【0131】
割合付与部62E1は、エッジ領域88A1について導出した第1割合94A(ここでは、一例として、“0.0”)を第1距離画像86内のエッジ領域96Aに付与する。また、割合付与部62E1は、エッジ領域88A1について導出した第2割合94B(ここでは、一例として、“1.0”を第2距離画像89内のエッジ領域96Bに付与する。
【0132】
割合付与部62E1は、非エッジ領域88A2について導出した第1割合94A(ここでは、一例として、“1.0”)を第1距離画像86内の非エッジ領域98Aに付与する。また、割合付与部62E1は、非エッジ領域88A2について導出した第2割合94B(ここでは、一例として、“0.0”)を第2距離画像89内の非エッジ領域98Bに付与する。
【0133】
合成部62F1は、信頼度マップ88Aを構成するエッジ領域88A1及び非エッジ領域88A2に応じて第1距離画像86と第2距離画像89とを合成することで合成画像100Aを生成する。例えば、合成部62F1は、信頼度マップ88A内のエッジ領域88A1及び非エッジ領域88A2に基づいて導出された信頼度(例えば、エッジ領域88A1の信頼度及び非エッジ領域88A2の信頼度)に応じた割合94に従って第1距離画像86と第2距離画像89とを合成することで合成画像100Aを生成する。第1距離画像86と第2距離画像89との合成は、第1距離画像86と第2距離画像89との積和演算(例えば、第1距離画像86と第2距離画像89との間での同一の画素位置についての画素値の積和演算)の結果である。
【0134】
第1距離画像86と第2距離画像89との合成は、エッジ領域96Aと第2距離画像89内のエッジ領域96Bとの合成、及び、非エッジ領域98Aと第2距離画像89内の非エッジ領域98Bとの合成が行われることによって実現される。この場合、例えば、合成部62F1は、エッジ領域88A1について割合付与部62E1によって導出された第1割合94A及び第2割合94Bに従って、第1距離画像86内のエッジ領域96Aと第2距離画像89内のエッジ領域96Bとを合成する。また、合成部62F1は、非エッジ領域88A2について割合付与部62E1によって導出された第1割合94A及び第2割合94Bに従って、第1距離画像86内の非エッジ領域98Aと第2距離画像89内の非エッジ領域98Bとを合成する。
【0135】
エッジ領域88A1についての第2割合94Bは、エッジ領域88A1についての第1割合94Aよりも大きい。第1距離画像86と第2距離画像89とが合成される場合、エッジ領域88A1についての第2割合94Bは、第2距離画像89内のエッジ領域96Bに対して用いられ、エッジ領域88A1についての第1割合94Aは、第1距離画像86内のエッジ領域96Aに対して用いられる。従って、第1距離画像86と第2距離画像89とが合成される場合、第2距離画像89内のエッジ領域96Bは、第1距離画像86内のエッジ領域96Aよりも大きな割合で合成される。
【0136】
図8に示す例では、第1距離画像86内のエッジ領域96Aに付与された第1割合94Aがエッジ領域96Aの画素値に乗じられることによって得られた画素値と、第2距離画像89内のエッジ領域96Bに付与された第2割合94Bがエッジ領域96Bの画素値に乗じられることによって得られた画素値とが合成される。本第1実施形態では、エッジ領域96Bに付与された第2割合94Bが“1.0”であり、エッジ領域96Aに付与された第1割合94Aが“0.0”である。この場合、エッジ領域96Aの画素値に対して第1割合94Aとして“0.0”が乗じられ、エッジ領域96Bの画素値に対して第2割合94Bとして“1.0”が乗じられる。従って、合成画像100A内のエッジ領域100A1(すなわち、合成画像100A内の全画像領域のうちのエッジ領域96A及び96Bの位置に対応する画像領域)として、エッジ領域96Bが用いられる。
【0137】
非エッジ領域88A2についての第1割合94Aは、非エッジ領域88A2についての第2割合94Bよりも大きい。第1距離画像86と第2距離画像89とが合成される場合、非エッジ領域88A2についての第1割合94Aは、第1距離画像86内の非エッジ領域98Aに対して用いられ、非エッジ領域88A2についての第2割合94Bは、第2距離画像89内の非エッジ領域98Bに対して用いられる。従って、第1距離画像86と第2距離画像89とが合成される場合、第1距離画像86内の非エッジ領域98Aは、第2距離画像89内の非エッジ領域98Bよりも大きな割合で合成される。
【0138】
図8に示す例では、第1距離画像86内の非エッジ領域98Aに付与された第1割合94Aが非エッジ領域98Aの画素値に乗じられることによって得られた画素値と、第2距離画像89内の非エッジ領域98Bに付与された第2割合94Bが非エッジ領域98Bの画素値に乗じられることによって得られた画素値とが合成される。本第1実施形態では、非エッジ領域98Bに付与された第2割合94Bが“0.0”であり、非エッジ領域98Aに付与された第1割合94Aが“1.0”である。この場合、非エッジ領域98Aの画素値に対して第1割合94Aとして“1.0”が乗じられ、非エッジ領域98Bの画素値に対して第2割合94Bとして“0.0”が乗じられる。従って、合成画像100A内の非エッジ領域100A2(すなわち、合成画像100A内の全画像領域のうちの非エッジ領域98A及び98Bの位置に対応する画像領域)として、非エッジ領域98Aが用いられる。
【0139】
エッジ領域96Bは、本開示の技術に係る「第1エッジ対応領域」の一例である。エッジ領域96Aは、本開示の技術に係る「第2エッジ対応領域」の一例である。非エッジ領域98Aは、本開示の技術に係る「第1非エッジ対応領域」の一例である。非エッジ領域98Bは、本開示の技術に係る「第2非エッジ対応領域」の一例である。
【0140】
合成部62F1は、合成画像100Aに対して各種の画像処理(例えば、オフセット補正、ホワイトバランス補正、デモザイク処理、色補正、ガンマ補正、色空間変換、輝度処理、色差処理、及びリサイズ処理等の公知の画像処理)を行う。合成部62F1は、合成画像100Aに対して各種の画像処理を行って得た画像を処理済み画像75B(図3参照)として既定の出力先(例えば、図3に示す画像メモリ46)に出力する。
【0141】
次に、撮像装置10の作用について図9A及び図9Bを参照しながら説明する。図9A及び図9Bには、プロセッサ62によって実行される画像合成処理の流れの一例が示されている。図9A及び図9Bに示す画像合成処理の流れは、本開示の技術に係る「画像処理方法」の一例である。
【0142】
図9Aに示す画像合成処理では、先ず、ステップST10で、AI方式処理部62A1は、イメージセンサ20(図1図3参照)によって処理対象画像75Aが生成されたか否かを判定する。ステップST10において、イメージセンサ20によって処理対象画像75Aが生成されていない場合は、判定が否定されて、画像合成処理は、図9Bに示すステップST40へ移行する。ステップST10において、イメージセンサ20によって処理対象画像75Aが生成された場合は、判定が肯定されて、画像合成処理はステップST12へ移行する。
【0143】
ステップST12で、AI方式処理部62A1及び信頼度マップ生成部62B1は、処理対象画像75Aから撮像画像75A1a(図5参照)を取得する。ステップST12の処理が実行された後、画像合成処理はステップST14へ移行する。
【0144】
ステップST14で、AI方式処理部62A1は、ステップST12で取得した撮像画像75A1aを生成モデル82A1(図5参照)に入力する。ステップST14の処理が実行された後、画像合成処理はステップST16へ移行する。
【0145】
ステップST16で、AI方式処理部62A1は、ステップST14で撮像画像75A1aが生成モデル82A1に入力されることによって生成モデル82A1から出力された第1距離画像86(図5参照)を取得する。ステップST16の処理が実行された後、画像合成処理はステップST18へ移行する。
【0146】
ステップST18で、信頼度マップ生成部62B1は、ステップST12で取得した撮像画像75A1aを用いて信頼度マップ88Aを生成する(図5参照)。ステップST18の処理が実行された後、画像合成処理はステップST20へ移行する。
【0147】
ステップST20で、非AI方式処理部62C1は、処理対象画像75Aから位相差画像75A2(図6参照)を取得する。ステップST20の処理が実行された後、画像合成処理はステップST22へ移行する。
【0148】
ステップST22で、非AI方式処理部62C1は、ステップST20で取得した位相差画像75A2を用いて第2距離画像89(図6参照)を生成する。ステップST22の処理が実行された後、画像合成処理はステップST24へ移行する。
【0149】
ステップST24で、正規化処理部62D1は、第1距離画像86から画像領域90A及び90B(図7参照)を特定し、第2距離画像89から画像領域92A及び92B(図7参照)を特定する。ステップST24の処理が実行された後、画像合成処理はステップST26へ移行する。
【0150】
ステップST26で、正規化処理部62D1は、画像領域90Aから第1代表値90A1(図7参照)を取得し、画像領域90Bから第2代表値90B1(図7参照)を取得し、画像領域92Aから第3代表値92A1(図7参照)を取得し、画像領域92Bから第4代表値92B1を取得する。ステップST26の処理が実行された後、画像合成処理はステップST28へ移行する。
【0151】
ステップST28で、正規化処理部62D1は、ステップST26で取得した第1代表値90A1、第2代表値90B1、第3代表値92A1、及び第4代表値92B1を用いて第2距離画像89を正規化する(図7参照)。ステップST28の処理が実行された後、画像合成処理は、図9Bに示すステップST30へ移行する。
【0152】
図9Bに示すステップST30で、割合付与部62E1は、ステップST18で生成された信頼度マップ88Aを用いて第1割合94A及び第2割合94Bを導出する(図8参照)。ステップST30の処理が実行された後、画像合成処理はステップST32へ移行する。
【0153】
ステップST32で、割合付与部62E1は、ステップST30で導出した第1割合94Aを第1距離画像86に付与する(図8参照)。ステップST32の処理が実行された後、画像合成処理はステップST34へ移行する。
【0154】
ステップST34で、割合付与部62E1は、ステップST30で導出した第2割合94Bを第2距離画像89に付与する(図8参照)。ステップST34の処理が実行された後、画像合成処理はステップST36へ移行する。
【0155】
ステップST36で、合成部62F1は、第1距離画像86に付与されている第1割合94A及び第2距離画像89に付与されている第2割合94Bに応じて第1距離画像86と第2距離画像89とを合成することで合成画像100Aを生成する(図8参照)。ステップST36の処理が実行された後、画像合成処理はステップST38へ移行する。
【0156】
ステップST38で、合成部62F1は、合成画像100Aに対して各種の画像処理を行う。そして、合成部62F1は、合成画像100Aに対して各種の画像処理を行って得た画像を処理済み画像75Bとして既定の出力先に出力する。ステップST38の処理が実行された後、画像合成処理はステップST40へ移行する。
【0157】
ステップST40で、合成部62F1は、画像合成処理を終了する条件(以下、「終了条件」と称する)を満足したか否かを判定する。終了条件としては、画像合成処理を終了させる指示が受付デバイス76によって受け付けられた、との条件等が挙げられる。ステップST40において、終了条件を満足していない場合は、判定が否定されて、画像合成処理はステップST10へ移行する。ステップST40において、終了条件を満足した場合は、判定が肯定されて、画像合成処理が終了する。
【0158】
以上説明したように、本第1実施形態では、撮像画像75A1aに対して生成モデル82A1を用いた処理が行われることによって第1距離画像86が得られ、位相差画像75A2を用いた処理が行われることによって第2距離画像89が得られる。位相差画像75A2を用いた測距は、撮像画像75A1aに写っている非エッジ領域よりも、撮像画像75A1aに写っているエッジ領域に対して高精度に行われる。つまり、位相差画像75A2から得られる第2距離画像89内のエッジ領域96B(図8参照)に含まれる画素から特定される距離の精度は、第2距離画像89内の非エッジ領域98B(図8参照に)に含まれる画素から特定される距離の精度よりも高い。
【0159】
一方、生成モデル82A1は、撮像画像75A1aに含まれるエッジ領域をノイズ成分であると誤判定したり、ノイズ成分をエッジ領域であると誤判定したりすることがある。このような誤判定は、生成モデル82A1に対する学習量を多くしたり、生成モデル82A1の中間層数を増やしたりすることによって、少なくすることは可能であるが、コストの増大につながる。このようなコストをかけなくても、生成モデル82A1は、第1距離画像86内の非エッジ領域98A(図8参照)をエッジ領域96A(図8参照)よりも高精度に生成することができる。また、第1距離画像86内の非エッジ領域98Aの精度は、第2距離画像89内の非エッジ領域98Bの精度よりも高い。
【0160】
そこで、撮像装置10では、信頼度マップ88A内のエッジ領域88A1及び非エッジ領域88A2に応じて第1距離画像86と第2距離画像89とが合成される。これにより、合成対象とされる第1距離画像86及び第2距離画像89の特性を活かした合成画像100Aを得ることができる。つまり、第1距離画像86の長所(すなわち、非エッジ領域98A)で第2距離画像89の短所(すなわち、非エッジ領域98B)を補い、第2距離画像89の長所(すなわち、エッジ領域96B)で第1距離画像86の短所(すなわち、エッジ領域96A)を補うことができる。この結果、第1距離画像86又は第2距離画像89よりも、距離画像として高精度な合成画像100Aを得ることができる。
【0161】
本第1実施形態では、撮像画像75A1aに写っている被写体が位相差画像75A2で表現されており、位相差画像75A2から第2距離画像89が生成される。また、撮像画像75A1aから第1距離画像86が生成される。つまり、同一の被写体に対して、異なる方法で第1距離画像86及び第2距離画像89という2つの距離画像が生成される。従って、第1距離画像86を生成する方法の特性(例えば、非エッジ領域に対する距離の精度が高いという長所)と第2距離画像89を生成する方法の特性(例えば、エッジ領域に対する距離の精度が高いという長所)とを活かした合成画像100Aを得ることができる。
【0162】
本第1実施形態では、第1距離画像86と第2距離画像89とが、エッジ領域88A1及び非エッジ領域88A2に基づいて導出される信頼度に応じた割合94で合成される。従って、エッジ領域88A1及び非エッジ領域88A2に基づいて導出される信頼度を考慮せずに定めた割合で第1距離画像86と第2距離画像89とが合成される場合に比べ、距離画像として高精度な合成画像100Aを得ることができる。
【0163】
本第1実施形態では、撮像画像75A1aに対して非AI方式の処理が行われることによって信頼度マップ88Aが生成される。よって、AI方式で信頼度マップ88Aが生成される場合に比べ、簡素な構成で信頼度マップ88Aを得ることができる。
【0164】
本第1実施形態では、第1距離画像86と第2距離画像89との合成が第1距離画像86と第2距離画像89との積和演算によって実現される。よって、第1距離画像86と第2距離画像89とを容易に合成することができる。
【0165】
本第1実施形態では、撮像画像75A1a内のエッジ領域及び非エッジ領域が信頼度マップ88Aとして表現される。すなわち、撮像画像75A1a内のエッジ領域が、信頼度マップ88A内でエッジ領域88A1として表現され、撮像画像75A1a内の非エッジ領域が、信頼度マップ88A内で非エッジ領域88A2として表現される。従って、撮像画像75A1a内のエッジ領域及び非エッジ領域がマップ化されていない場合に比べ、信頼度の高い領域(すなわち、撮像画像75A1a内のエッジ領域)と信頼度の低い領域(すなわち、撮像画像75A1a内の非エッジ領域)とを容易に区別することができる。
【0166】
本第1実施形態では、第1距離画像86と第2距離画像89は、第2距離画像89の次元を第1距離画像86の次元に合わせてから合成される。従って、第1距離画像86の次元と第2距離画像89の次元とが異なった状態のまま第1距離画像86と第2距離画像89とが合成される場合に比べ、距離画像として高精度な合成画像100Aを得ることができる。
【0167】
本第1実施形態では、第1距離画像86内の画像領域90Aと第2距離画像89内の画像領域92Aとが既定類似度を上回る度合いで類似しており、第1距離画像86内の画像領域90Bと第2距離画像89内の画像領域92Bとが既定類似度を上回る度合いで類似している。そして、画像領域90Aから得られる第1代表値90A1、画像領域90Bから得られる第2代表値90B1、画像領域92Aから得られる第3代表値92A1、及び画像領域92Bから得られる第4代表値92B1に基づいて第2距離画像89が正規化される。これにより、第1距離画像86の次元と第2距離画像89の次元とを高精度に合わせることができる。
【0168】
なお、上記第1実施形態では、エッジ領域88A1の信頼度に対応する割合94と非エッジ領域88A2の信頼度に対応する割合94とに従って第1距離画像86と第2距離画像89とが合成される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、撮像画像75A1aに対して1つの信頼度が割り当てられ、1つの信頼度に対応する1つの割合で第1距離画像86と第2距離画像89とが合成されるようにしてもよい。撮像画像75A1aに対して割り当てられた1つの信頼度の一例としては、撮像画像75A1aに対してAI方式又は非AI方式の処理(例えば、被写体としての人物をAI方式又は非AI方式で検出する処理)が行われることによって得られた1つの信頼度(例えば、人物領域85Aに対する人物らしさを示す信頼度)が挙げられる。そして、1つの信頼度に応じた1つの割合が導出され、導出された1つの割合で第1距離画像86と第2距離画像89とが合成されるようにする。この場合、複数の信頼度を取得する処理、複数の信頼度から複数の割合を導出する処理、及び複数の割合を用いて第1距離画像86と第2距離画像89とを合成する処理が行われる場合に比べ、軽い処理負荷で第1距離画像86と第2距離画像89とを合成することができる。
【0169】
ここでは、撮像画像75A1aに対して割り当てられた1つの信頼度から導出された1つの割合で第1距離画像86と第2距離画像89とが合成される変形例を挙げたが、本開示の技術はこれに限定されない。例えば、位相差画像75A2に対して割り当てられる1つの信頼度から導出された1つの割合で第1距離画像86と第2距離画像89とが合成されるようにしてもよい。位相差画像75A2に対して割り当てられた1つの信頼度の一例としては、位相差画像75A2に対してAI方式又は非AI方式の処理(例えば、被写体としての人物にピントが合っているか否かをAI方式又は非AI方式で判定する処理)が行われることによって得られた1つの信頼度(例えば、ピントが合っているらしさを示す信頼度)が挙げられる。そして、この場合も、1つの信頼度に応じた1つの割合が導出され、導出された1つの割合で第1距離画像86と第2距離画像89とが合成されるようにする。これにより、複数の信頼度を取得する処理、複数の信頼度から複数の割合を導出する処理、及び複数の割合を用いて第1距離画像86と第2距離画像89とを合成する処理が行われる場合に比べ、軽い処理負荷で第1距離画像86と第2距離画像89とを合成することができる。
【0170】
上記第1実施形態では、AI方式処理部62A1で行われるAI方式の処理(すなわち、生成モデル82A1を用いた処理)と同種の役割を担う非AI方式の処理(すなわち、非AI方式処理部62C1による処理)が行われることによって生成された第2距離画像89が第1距離画像86に合成される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、第1距離画像86に合成される画像は、AI方式処理部62A1で行われるAI方式の処理と同種の役割を担う非AI方式の処理が行われていない画像であってもよい。
【0171】
AI方式処理部62A1で行われるAI方式の処理と同種の役割を担う非AI方式の処理が行われていない画像の一例としては、ピント位置特定画像が挙げられる。ピント位置特定画像は、ピントが合っている領域(以下、「合焦領域」と称する)を特定可能なマーク(例えば、枠)を含む画像である。例えば、合焦領域は、撮像画像75A1a又は位相差画像75A2に対してAI方式又は非AI方式の処理が行われることによって特定されるようにすればよい。第1距離画像86とピント位置特定画像(例えば、正規化されたピント位置特定画像)は、特定の割合(例えば、撮像画像75A1aに対して割り当てられた1つの信頼度に応じた1つの割合)で合成される。これにより、第1距離画像86と、距離画像とは異なる画像(ここでは、一例として、ピント位置特定画像)とを合成した画像を得ることができる。
【0172】
ここでは、第1距離画像86と合成される画像としてピント位置特定画像を例示したが、これは、あくまでも一例に過ぎず、第1距離画像86と合成される画像は、第1距離画像86と異なる種類の画像であればよい。第1距離画像86と異なる種類の画像としては、例えば、撮像画像75A1aが挙げられる。また、第1距離画像86と異なる種類の画像の他例としては、撮像画像75A1aの色、ダイナミックレンジ、輝度、及び/又はコントラスト等の各種の画質パラメータが調節されることによって得られた画像が挙げられる。なお、ピント位置特定画像、及び第1距離画像86と異なる種類の画像は、本開示の技術に係る「第4画像」及び「第1AI処理と同種の役割を担う非AI方式の処理が行われていない画像」の一例である。
【0173】
上記第1実施形態では、AI方式処理部62A1によって第1距離画像86が生成される形態例を挙げて説明したが、本開示の技術はこれに限定されず、AI方式処理部62A1によって距離画像とは異なる種類の画像が生成されるようにしてもよい。
【0174】
上記第1実施形態では、非AI方式処理部62C1によって第2距離画像89が生成される形態例を挙げて説明したが、本開示の技術はこれに限定されず、非AI方式処理部62C1によって距離画像とは異なる種類の画像が生成されるようにしてもよい。
【0175】
上記第1実施形態では、撮像画像75A1a内のエッジ領域及び非エッジ領域に応じて第1距離画像86と第2距離画像89とが合成される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、位相差画像75A2の指標(例えば、位相差)に応じて第1距離画像86と第2距離画像89とが合成されるようにしてもよい。例えば、位相差画像75A2の指標(例えば、位相差)に応じて定まる割合で第1距離画像86と第2距離画像89とが合成されるようにしてもよい。
【0176】
また、撮像画像75A1aの指標(例えば、エッジ領域及び非エッジ領域)及び位相差画像75A2の指標(例えば、位相差)に応じて第1距離画像86と第2距離画像89とが合成されるようにしてもよい。例えば、撮像画像75A1aの指標(例えば、エッジ領域及び非エッジ領域)及び位相差画像75A2の指標(例えば、位相差)に応じて定まる割合で第1距離画像86と第2距離画像89とが合成されるようにしてもよい。
【0177】
上記第1実施形態では、第2距離画像89が正規化される形態例を挙げて説明したが、本開示の技術はこれに限定されず、第2距離画像89が正規化されるのと同様の要領で第1距離画像86が正規化されるようにしてもよい。
【0178】
[第2実施形態]
上記第1実施形態では、正規化処理部62D1が、第1距離画像86内の画像領域90A及び90Bから第1代表値90A1及び第2代表値90B1を取得し、第2距離画像89内の画像領域92A及び92Bから第3代表値92A1及び第4代表値92B1を取得したが、本開示の技術はこれに限定されない。例えば、図10に示すように、正規化処理部62D1は、第1距離画像86内の画像領域90Bから第1最大値90B2及び第1最小値90B3を取得し、第2距離画像89内の画像領域92Bから第2最大値92B2及び第2最小値92B3を取得するようにしてもよい。
【0179】
ここで、第1最大値90B2は、画像領域90Bを構成する全画素の画素値のうちの最大値である。第1最小値90B3は、画像領域90Bを構成する全画素の画素値のうちの最小値である。第2最大値92B2は、画像領域92Bを構成する全画素の画素値のうちの最大値である。第2最小値92B3は、画像領域92Bを構成する全画素の画素値のうちの最小値である。
【0180】
画像領域90Bは、本開示の技術に係る「単一の第5画像領域」の一例である。画像領域92Bは、本開示の技術に係る「単一の第6画像領域」の一例である。第1最大値90B2及び第1最小値90B3は、本開示の技術に係る「複数の第3代表値」の一例である。第2最大値92B2及び第2最小値92B3は、本開示の技術に係る「複数の第4代表値」の一例である。
【0181】
正規化処理部62D1は、第1最大値90B2、第1最小値90B3、第2最大値92B2、及び第2最小値92B3に基づいて第2距離画像89を正規化する。
【0182】
ここで、第2距離画像89内の画素値を“l_B(x,y)”とし、第1最大値90B2を“l_Amax”とし、第1最小値90B3を“l_Amin”とし、第2最大値92B2を“l_Bmax”とし、第2最小値92B3を“l_Bmin”とし、正規化した画素値を“l_B1(x,y)”とした場合、“l_B1(x,y)”は以下の数式(2)によって規定される。正規化処理部62D1は、第2距離画像89内の各画素の画素値(すなわち、“l_B(x,y)”)を、数式(2)を用いて“l_B1(x,y)”に変換することで第2距離画像89を正規化する。
【0183】
l_B1(x,y)={l_B(x,y)-l_Bmin}*{(l_Amax-l_Amin)/(l_Bmax-l_Bmin)}+l_Amin・・・・・・(2)
【0184】
このように、本第2実施形態では、画像領域90Bから得られる第1最大値90B2及び第1最小値90B3、並びに、画像領域92Bから得られる第2最大値92B2及び第2最小値92B3に基づいて第2距離画像89が正規化される。これにより、図7に示す例のように1つの距離画像から複数の画像領域を特定する必要がないので、複数の画像領域を特定する必要がない分だけ、第2距離画像89を正規化するのに要する処理負荷を軽減することができる。
【0185】
なお、上記第2実施形態では、正規化処理部62D1が、第1距離画像86内の画像領域90Bから第1最大値90B2及び第1最小値90B3を取得し、第2距離画像89内の画像領域92Bから第2最大値92B2及び第2最小値92B3を取得する形態例を挙げたが、これは、あくまでも一例に過ぎない。例えば、正規化処理部62D1は、第1距離画像86内の画像領域90A(図7参照)を構成する全画素の画素値のうちの最大値及び最小値を取得し、第2距離画像89内の画像領域92A(図7参照)を構成する全画素の画素値のうちの最大値及び最小値を取得するようにしてもよい。
【0186】
つまり、第1距離画像86内の単一の画像領域から得られた最大値及び最小値と、第2距離画像89内の単一の画像領域から得られた最大値及び最小値とに基づいて第1距離画像86又は第2距離画像89が正規されるようにすればよい。なお、第1距離画像86内の単一の画像領域と第2距離画像89内の単一の画像領域は、図7に示す画像領域90Aと画像領域92Aとの関係と同様に、既定類似度を上回る度合いで互いに類似しており、かつ、第1距離画像86と第2距離画像89との間で互いの位置が対応しているという関係性を有する画像領域である。
【0187】
上記第2実施形態では、第1最大値90B2及び第1最小値90B3を例示したが、これは、あくまでも一例に過ぎず、第1最大値90B2及び第1最小値90B3に代えて他の値を用いてもよい。例えば、第1最大値90B2及び第1最小値90B3に代えて、画像領域90Bを構成する全画素の画素値のうちの最大値の次に大きな画素値と、画像領域90Bを構成する全画素の画素値のうちの最小値の次に小さな画素値とを用いてもよい。また、第1最大値90B2及び第1最小値90B3に代えて、画像領域90Bを構成する全画素の画素値のうちの最大値又は最小値と、画像領域90Bを構成する全画素の画素値のうちの中央値とを用いてもよい。なお、第1最大値90B2及び第1最小値90B3と同様に、第2最大値92B及び第2最小値92B3も、他の値に代えてもよい。
【0188】
[第3実施形態]
上記第1実施形態では、撮像画像75A1aに対して非AI方式の処理(すなわち、デジタルフィルタ84A1を用いた処理)が行われることによって信頼度が導出される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、撮像画像75A1aに対してAI方式の処理が行われることによって信頼度が導出されるようにしてもよい。
【0189】
この場合、例えば、一例として図11に示すように、上記第1実施形態で説明した信頼度マップ生成部62B1に代えて信頼度マップ生成部62B2が用いられる。信頼度マップ生成部62B2は、撮像画像75A1aに対して、学習済みの信頼度ネットワーク102Aを用いた処理を行うことで信頼度マップ88Bを生成する。信頼度ネットワーク102Aは、本開示の技術に係る「学習済みモデル」及び「ニューラルネットワーク」の一例である。
【0190】
信頼度ネットワーク102Aは、入力された撮像画像75A1aから非エッジ領域を検出し、エッジ領域よりも非エッジ領域に対して高い信頼度(例えば、非エッジ領域らしさを示す度合い)を付与するニューラルネットワークである。信頼度ネットワーク102Aは、例えば、物体を検出可能な畳み込みニューラルネットワークを含む学習済みの数理モデルである。
【0191】
信頼度ネットワーク102Aは、入力された撮像画像75A1aに基づいて、撮像画像75A1aに対応する信頼度マップ88Bを生成して出力する。信頼度マップ88Bは、例えば、畳み込みニューラルネットワークの中間層から得られる特徴量マップに基づいて生成されるマップである。信頼度マップ88Bは、非エッジ領域88B1とエッジ領域88B2とを含む。非エッジ領域88B1は、撮像画像75A1a内の非エッジ領域に対応しており、上記第1実施形態で説明した第1距離画像86を信頼できる要素である。エッジ領域88B2は、撮像画像75A1a内のエッジ領域に対応しており、上記第1実施形態で説明した第2距離画像89を信頼できる要素である。
【0192】
図11に示す例において、非エッジ領域88B1は、撮像画像75A1aに対する信頼度が“1.0”の画像領域であり、エッジ領域88B2は、撮像画像75A1aに対する信頼度が“0.0”の画像領域である。これは、非エッジ領域88B1が、非エッジ領域らしく、エッジ領域88B2が、非エッジ領域らしくないことを意味する。換言すると、非エッジ領域88B1は、第1距離画像86を信頼した方が良い画像領域であることを意味しており、エッジ領域88B2は、第1距離画像86を信頼しない方が良い画像領域(すなわち、第2距離画像89を信頼した方が良い画像領域)であることを意味している。
【0193】
そのため、非エッジ領域88B1についての第1割合94Aは、非エッジ領域88B1についての第2割合94Bよりも大きい。図11に示す例では、非エッジ領域88B1についての第1割合94Aが“1.0”であり、非エッジ領域88B1についての第2割合94Bが“0.0”である。一方、エッジ領域88B2についての第1割合94Aは、エッジ領域88B2についての第2割合94Bよりも小さい。図11に示す例では、エッジ領域88B2についての第1割合94Aが“0.0”であり、エッジ領域88B2についての第2割合94Bが“1.0”である。このようにして得られた第1割合94A及び第2割合94Bは、上記第1実施形態で説明した要領で、割合付与部62E1及び合成部62F1(図8参照)によって用いられる。よって、撮像画像75A1aに対して信頼度ネットワーク102Aを用いた処理が行われることによって得られる信頼度マップ88Bを用いても、上記各実施形態と同様の効果を得ることができる。
【0194】
なお、上記第3実施形態では、撮像画像75A1aに対してAI方式の処理が行われることによって信頼度マップ88Bが生成される形態例を挙げたが、第1距離画像86に対してAI方式の処理が行われることによって信頼度マップ88Bが生成されるようにしてもよい。
【0195】
この場合、例えば、図12に示すように、図11に示す信頼度マップ生成部62B2に代えて信頼度マップ生成部62B3が用いられる。信頼度マップ生成部62B3は、信頼度ネットワーク102Bを用いた処理を行う。信頼度ネットワーク102Bは、入力された距離画像から非エッジ領域を検出し、エッジ領域よりも非エッジ領域に対して高い信頼度(例えば、非エッジ領域らしさを示す度合い)を付与するニューラルネットワークである。信頼度ネットワーク102Bは、例えば、物体を検出可能な畳み込みニューラルネットワークを含む学習済みモデルである。
【0196】
信頼度マップ生成部62B3は、AI方式処理部62A1から第1距離画像86を取得し、取得した第1距離画像86を信頼度ネットワーク102Bに入力する。信頼度ネットワーク102Bは、入力された第1距離画像86に基づいて、第1距離画像86に対応する信頼度マップ88Bを生成する。
【0197】
[第4実施形態]
上記第3実施形態では、撮像画像75A1a内の画素毎の信頼度が導出されてマップ化される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、撮像画像75A1aが複数の画像領域に区分され、区分されて得られた画像領域毎に信頼度が導出されてマップ化されるようにしてもよい。
【0198】
この場合、例えば、図13に示すように、図11に示す信頼度マップ生成部62B2に代えて信頼度マップ生成部62B4が用いられる。信頼度マップ生成部62B4は、信頼度ネットワーク102Cを用いた処理を行う。
【0199】
撮像画像75A1aは、複数の区分領域104に分割されている。複数の区分領域104は、撮像画像75A1aが行列状に分割されることによって区分された画像領域である。図13に示す例では、区分領域104の一例として、複数の画素からなる矩形状の画像領域が示されている。複数の区分領域104は、本開示の技術に係る「複数の第1画像領域」の一例である。
【0200】
信頼度マップ生成部62B4は、撮像画像75A1aを信頼度ネットワーク102Cに入力する。信頼度ネットワーク102Cは、入力された撮像画像75A1aに基づいて信頼度マップ88Cを生成する。信頼度ネットワーク102Cは、図11に示す信頼度ネットワーク102Aに比べ、信頼度ネットワーク102Aが撮像画像75A1aの画素単位で信頼度を導出するのに対し、信頼度ネットワーク102Cが撮像画像75A1aの区分領域104毎に信頼度を導出する点が異なる。
【0201】
信頼度ネットワーク102Cは、区分領域104毎に、対応する区分領域104に対する信頼可能な度合いである信頼度(すなわち、非エッジ領域らしさを示す信頼度)を導出し、導出した信頼度をマップ化することで信頼度マップ88Cを生成して出力する。区分領域104毎に導出される信頼度は、本開示の技術に係る「第1分割信頼度」である。信頼度マップ88Cは、本開示の技術に係る「第1信頼度」及び「複数の第1分割信頼度」の一例である。
【0202】
信頼度マップ88Cは、複数の区分領域106に分割されている。信頼度マップ88C内での複数の区分領域106の位置は、撮像画像75A1a内での複数の区分領域104に対応している。信頼度マップ88Cには、導出された信頼度が分布している。すなわち、信頼度マップ88Cには、区分領域106毎に、導出された信頼度が割り当てられている。換言すると、信頼度マップ88Cは、導出された複数の信頼度と撮像画像75A1a内の複数の区分領域104との対応関係を表現したマップである。
【0203】
一例として図14に示すように、割合付与部62E2は、信頼度マップ88C内の区分領域106毎に第1割合94A及び第2割合94Bを導出する。図14に示す例では、信頼度が“0.0”の区分領域106については、第1割合94Aが“0.0”であり、第2割合94Bが“1.0”である。また、信頼度が“1.0”の区分領域106については、第1割合94Aが“1.0”であり、第2割合94Bが“0.0”である。また、信頼度が“0.6”の区分領域106については、第1割合94Aが“0.6”であり、第2割合94Bが“0.4”である。
【0204】
第1距離画像86は、複数の区分領域108に分割されている。第1距離画像86内での複数の区分領域108の位置は、信頼度マップ88C内での複数の区分領域106の位置に対応している。また、第2距離画像89(すなわち、正規化された第2距離画像89)は、複数の区分領域110に分割されている。第2距離画像89内での複数の区分領域110の位置は、信頼度マップ88C内での複数の区分領域106の位置に対応している。
【0205】
割合付与部62E2は、区分領域106毎に導出した第1割合94Aを、区分領域106に対応する区分領域108に付与する。また、割合付与部62E2は、区分領域106毎に導出した第2割合94Bを、区分領域106に対応する区分領域110に付与する。
【0206】
一例として図15に示すように、合成部62F2は、第1距離画像86と第2距離画像89とを、割合付与部62E2によって導出された第1割合94A及び第2割合94Bに応じて合成することで合成画像100Bを生成する。合成画像100Bは、複数の区分領域112に分割されている。合成画像100B内での複数の区分領域112の位置は、信頼度マップ88C内での複数の区分領域106(図13及び図14参照)の位置に対応している。
【0207】
合成画像100B内の画素値は、第1距離画像86内の画素値と第2距離画像89内の画素値との積和演算(すなわち、第1距離画像86と第2距離画像89との間での同一の画素位置についての画素値の積和演算)の結果である。すなわち、合成部62F2は、区分領域108内の第1画素値と区分領域110内の第2画素値とを加算することにより、区分領域108及び110に対応する区分領域112内の画素値を決定する。区分領域108内の第1画素値及び区分領域110内の第2画素値は、第1距離画像86と第2距離画像89との間での同一の画素位置についての画素値である。また、区分領域108内の第1画素値は、区分領域108内の画素値と区分領域108に対して付与された第1割合94Aとを乗じることで得た画素値である。区分領域110内の第2画素値は、区分領域110内の画素値と区分領域110に対して付与された第2割合94Bとを乗じることで得た画素値である。
【0208】
信頼度マップ88C内で信頼度が第1基準値を上回る区分領域104に対応する区分領域108は、第2距離画像89内での対応する区分領域110よりも高い割合で合成される。第1基準値の一例としては、“0.5”が挙げられる。また、信頼度マップ88C内で信頼度が第1基準値を上回る区分領域104に対応する区分領域108の一例としては、信頼度マップ88C内で信頼度が“1.0”又は“0.6”(図14参照)の区分領域104に対応する区分領域108が挙げられる。また、第2距離画像89内での対応する区分領域110よりも高い割合の一例としては、“1.0”又は“0.6”(図14参照)が挙げられる。
【0209】
ここで、区分領域108は、本開示の技術に係る「第1信頼度マップ内で第1分割信頼度が第1基準値を上回る第1画像領域に対応する第2画像内での画像領域」の一例である。また、第2距離画像89内での対応する区分領域110よりも高い割合は、本開示の技術に係る「第4画像内での対応する画像領域よりも高い割合」の一例である。
【0210】
合成画像100B内の一部領域には、第1距離画像86が用いられずに、第2距離画像89がそのまま用いられる。第2距離画像89がそのまま用いられる一部領域は、信頼度マップ88C内で信頼度が第1基準値未満の値である第2基準値(ここでは、一例として、“0.0”)以下の区分領域104に対応する区分領域110(ここでは、一例として、第2割合94Bとして“1.0”が付与されている区分領域110)である。ここで、合成画像100B内の一部領域(すなわち、第2距離画像89がそのまま用いられる一部領域)は、本開示の技術に係る「第1特定画像領域」の一例である。
【0211】
以上説明したように、本第4実施形態では、撮像画像75A1aが、複数の区分領域104に分割されており、区分領域104毎に、対応する区分領域104に対する信頼度が導出される。よって、撮像画像75A1aに対して1つの信頼度のみが割り当てられている場合に比べ、距離画像として高精度な合成画像100Bを得ることができる。
【0212】
本第4実施形態では、区分領域104毎に導出された信頼度が複数の区分領域104に対して分布している信頼度マップ88Cに従って第1距離画像86と第2距離画像89とが合成される。よって、画素単位で信頼度が分布しているマップに従って第1距離画像86と第2距離画像89とを合成する場合に比べ、第1距離画像86と第2距離画像89との合成に要する処理負荷を軽減することができる。また、撮像画像75A1aに対して1つの信頼度のみが割り当てられている場合に比べ、距離画像として高精度な合成画像100Bを得ることができる。
【0213】
本第4実施形態では、信頼度マップ88C内で信頼度が第1基準値を上回る区分領域104に対応する区分領域108が、第2距離画像89内での対応する区分領域110よりも高い割合で合成される。従って、信頼度マップ88C内で信頼度が第1基準値を上回る区分領域104に対応する区分領域108が、第2距離画像89内での対応する区分領域110よりも低い割合で合成される場合に比べ、距離画像として高精度な合成画像100Bを得ることができる。
【0214】
本第4実施形態では、信頼度マップ88C内で信頼度が第2基準値以下の区分領域104に対応する区分領域110が合成画像100B内の一部領域として用いられる。よって、信頼度マップ88C内で信頼度が第2基準値以下の区分領域104に対応する区分領域110と区分領域108とを合成した領域を合成画像100B内の一部領域として用いた場合に比べ、距離画像として高精度な合成画像100Bを得ることができる。
【0215】
[第5実施形態]
上記第4実施形態では、撮像画像75A1aに対してAI方式の処理が行われることによって撮像画像75A1aに対する信頼度が導出される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、位相差画像75A2に対してAI方式の処理が行われることによって位相差画像75A2に対する信頼度(すなわち、位相差画像75A2に対する信頼可能な度合い)が導出されるようにしてもよい。位相差画像75A2に対する信頼度は、本開示の技術に係る「第2信頼度」の一例である。
【0216】
一例として図16に示すように、位相差画像75A2は、複数の区分領域114に分割されており、区分領域114毎に信頼度が導出されてマップ化される。複数の区分領域114は、位相差画像75A2が行列状に分割されることによって区分された画像領域である。複数の区分領域114は、本開示の技術に係る「複数の第2画像領域」の一例である。
【0217】
本第5実施形態では、図13に示す信頼度マップ生成部62B4に代えて信頼度マップ生成部62B5が用いられる。信頼度マップ生成部62B5は、信頼度ネットワーク102Dを用いた処理を行う。
【0218】
信頼度マップ生成部62B5は、位相差画像75A2を信頼度ネットワーク102Dに入力する。信頼度ネットワーク102Dは、入力された位相差画像75A2に基づいて信頼度マップ88Dを生成する。信頼度ネットワーク102Dは、図13に示す信頼度ネットワーク102Cに比べ、信頼度ネットワーク102Cが撮像画像75A1aの区分領域104毎に信頼度を導出するのに対し、信頼度ネットワーク102Dが位相差画像75A2の区分領域114毎に信頼度を導出する点が異なる。
【0219】
信頼度ネットワーク102Dは、区分領域114毎に、対応する区分領域114に対する信頼可能な度合いである信頼度(すなわち、エッジ領域らしさを示す信頼度)を導出し、導出した信頼度をマップ化することで信頼度マップ88Dを生成して出力する。区分領域114毎に導出される信頼度は、本開示の技術に係る「第2分割信頼度」である。信頼度マップ88Dは、本開示の技術に係る「第2信頼度」及び「複数の第2分割信頼度」の一例である。
【0220】
信頼度マップ88Dは、複数の区分領域116に分割されている。信頼度マップ88D内での複数の区分領域116の位置は、位相差画像75A2内での複数の区分領域114に対応している。信頼度マップ88Dには、導出された信頼度が分布している。すなわち、信頼度マップ88Dには、区分領域116毎に、導出された信頼度が割り当てられている。換言すると、信頼度マップ88Dは、導出された複数の信頼度と位相差画像75A2内の複数の区分領域114との対応関係を表現したマップである。
【0221】
一例として図17に示すように、割合付与部62E3は、信頼度マップ88D内の区分領域116毎に第1割合94A及び第2割合94Bを導出する。図17に示す例では、信頼度が“0.0”の区分領域116については、第1割合94Aが“1.0”であり、第2割合94Bが“0.0”である。また、信頼度が“1.0”の区分領域116については、第1割合94Aが“0.0”であり、第2割合94Bが“1.0”である。また、信頼度が“0.6”の区分領域106については、第1割合94Aが“0.4”であり、第2割合94Bが“0.6”である。
【0222】
第1距離画像86内での複数の区分領域108の位置は、信頼度マップ88D内での複数の区分領域116の位置に対応している。また、第2距離画像89内での複数の区分領域110の位置は、信頼度マップ88D内での複数の区分領域116の位置に対応している。
【0223】
割合付与部62E3は、区分領域116毎に導出した第1割合94Aを、区分領域116に対応する区分領域108に付与する。また、割合付与部62E3は、区分領域116毎に導出した第2割合94Bを、区分領域116に対応する区分領域110に付与する。
【0224】
一例として図18に示すように、合成部62F3は、第1距離画像86と第2距離画像89とを、割合付与部62E3によって導出された第1割合94A及び第2割合94Bに応じて合成することで合成画像100Cを生成する。合成画像100Cは、複数の区分領域118に分割されている。合成画像100C内での複数の区分領域118の位置は、信頼度マップ88D内での複数の区分領域116(図16及び図17参照)の位置に対応している。
【0225】
合成画像100C内の画素値は、第1距離画像86内の画素値と第2距離画像89内の画素値との積和演算(すなわち、第1距離画像86と第2距離画像89との間での同一の画素位置についての画素値の積和演算)の結果である。すなわち、合成部62F3は、区分領域108内の第1画素値と区分領域110内の第2画素値とを加算することにより、区分領域108及び110に対応する区分領域118内の画素値を決定する。区分領域108内の第1画素値の意味、及び区分領域110内の第2画素値の意味については、上記第4実施形態で説明したので、ここでの説明は省略する。
【0226】
信頼度マップ88D内で信頼度が第3基準値を上回る区分領域114に対応する区分領域108は、第2距離画像89内での対応する区分領域110よりも高い割合で合成される。第3基準値の一例としては、“0.5”が挙げられる。また、信頼度マップ88D内で信頼度が第3基準値を上回る区分領域114に対応する区分領域108の一例としては、信頼度マップ88D内で信頼度が“1.0”又は“0.6”(図17参照)の区分領域114に対応する区分領域108が挙げられる。また、第2距離画像89内での対応する区分領域110よりも高い割合の一例としては、“1.0”又は“0.6”(図17参照)が挙げられる。
【0227】
ここで、区分領域118は、本開示の技術に係る「第2信頼度マップ内で第2分割信頼度が第3基準値を上回る第2画像領域に対応する第4画像内での画像領域」の一例である。また、第2距離画像89内での対応する区分領域110よりも高い割合は、本開示の技術に係る「第2画像内での対応する画像領域よりも高い割合」の一例である。
【0228】
合成画像100C内の一部領域には、第2距離画像89が用いられずに、第1距離画像86がそのまま用いられる。第1距離画像86がそのまま用いられる一部領域は、信頼度マップ88D内で信頼度が第3基準値未満の値である第4基準値(ここでは、一例として、“0.0”)以下の区分領域104に対応する区分領域108(ここでは、一例として、第1割合94Aとして“0.0”が付与されている区分領域108)である。ここで、合成画像100C内の一部領域(すなわち、第1距離画像86がそのまま用いられる一部領域)は、本開示の技術に係る「第2特定画像領域」の一例である。
【0229】
以上説明したように、本第5実施形態では、位相差画像75A2が、複数の区分領域114に分割されており、区分領域114毎に、対応する区分領域114に対する信頼度が導出される。よって、位相差画像75A2に対して1つの信頼度のみが割り当てられている場合に比べ、距離画像として高精度な合成画像100Cを得ることができる。
【0230】
本第5実施形態では、区分領域114毎に導出された信頼度が複数の区分領域114に対して分布している信頼度マップ88Dに従って第1距離画像86と第2距離画像89とが合成される。よって、画素単位で信頼度が分布しているマップに従って第1距離画像86と第2距離画像89とを合成する場合に比べ、第1距離画像86と第2距離画像89との合成に要する処理負荷を軽減することができる。また、位相差画像75A2に対して1つの信頼度のみが割り当てられている場合に比べ、距離画像として高精度な合成画像100Cを得ることができる。
【0231】
本第5実施形態では、信頼度マップ88D内で信頼度が第3基準値を上回る区分領域114に対応する区分領域108が、第2距離画像89内での対応する区分領域110よりも高い割合で合成される。従って、信頼度マップ88D内で信頼度が第3基準値を上回る区分領域114に対応する区分領域108が、第2距離画像89内での対応する区分領域110よりも低い割合で合成される場合に比べ、距離画像として高精度な合成画像100Cを得ることができる。
【0232】
本第5実施形態では、信頼度マップ88D内で信頼度が第4基準値以下の区分領域114に対応する区分領域110が合成画像100C内の一部領域として用いられる。よって、信頼度マップ88D内で信頼度が第4基準値以下の区分領域114に対応する区分領域110と区分領域108とを合成した領域を合成画像100C内の一部領域として用いた場合に比べ、距離画像として高精度な合成画像100Cを得ることができる。
【0233】
[第6実施形態]
上記各実施形態では、第1距離画像86と第2距離画像89との合成を例示したが、本第6実施形態では、陽炎と動体が写っている撮像画像75A1を用いた合成処理が行われることによって陽炎と動体が画質の及ぼす影響を低減した画像を生成する形態例について説明する。
【0234】
一例として図19図22に示すように、プロセッサ62は、画像合成処理プログラム121(図4参照)をRAM66上で実行することで、AI方式処理部62A2、信頼度マップ生成部62B6、非AI方式処理部62C2、正規化処理部62D2、割合付与部62E4、合成部62F4、及び動体検出部122として動作する。
【0235】
一例として図19に示すように、AI方式処理部62A2及び動体検出部122には、連写が行われることによって得られた複数の撮像画像75A1bが時系列で入力される。撮像画像75A1bは、図3に示す撮像画像75A1の一例である。撮像画像75A1bは、動体領域120A及び陽炎領域120Bを有する。撮像画像75A1bは、本開示の技術に係る「第1画像」及び「環境現象と動体とを含む被写体が撮像されることによって得られた画像」の一例である。
【0236】
動体領域120Aは、動体(図19に示す例では、動いている人物)が写っている画像領域である。撮像画像75A1bに写っている動体は、本開示の技術に係る「動体」の一例である。陽炎領域120Bは、陽炎が写っている画像領域である。撮像画像75A1bに写っている陽炎は、本開示の技術に係る「環境現象」の一例である。なお、ここでは、陽炎を例示しているが、これは、あくまでも一例に過ぎず、降雨、降雪、散乱、乱反射、光源(例えば、規則的又は不規則的に点滅する光源)に起因して色が変化する現象、光源及び撮像装置10のシャッタの特性に起因して明るさが周期的に変化する現象(例えば、フリッカ)、又はゴースト等の環境現象であってもよい。
【0237】
AI方式処理部62A2は、撮像画像75A1bに対してAI方式の処理を行うことで画像124を生成する。撮像画像75A1bに対するAI方式の処理とは、例えば、生成モデル82A2を用いた処理を指す。生成モデル82A2は、図4に示す生成モデル82Aの一例である。撮像画像75A1bに対するAI方式の処理は、本開示の技術に係る「第1AI処理」の一例である。生成モデル82A2は、画像に写っている陽炎を低減させる学習が既に行われた生成ネットワークである。画像124は、撮像画像75A1bに写っている陽炎が消去された画像である。ここでは、画像124として、撮像画像75A1bに写っている陽炎が消去された画像を例示しているが、これは、あくまでも一例に過ぎず、画像124は、陽炎が完全に消去されずに僅かに残存している画像であってもよく、画像124は、撮像画像75A1bよりも、陽炎の写り込みが低減された画像であればよい。
【0238】
動体検出部122は、動体領域120Aを検出する。動体領域120Aの検出方法の第1例としては、非AI方式の処理を用いた検出方法が挙げられる。動体領域120Aの検出方法の第2例としては、AI方式の処理を用いた検出方法が挙げられる。動体領域120Aの検出方法の第3例としては、非AI方式の処理を用いた検出方法とAI方式の処理を用いた検出方法とを組み合わせた検出方法が挙げられる。
【0239】
非AI方式の処理を用いた検出方法の一例としては、時系列上の複数の撮像画像75A1b間の差分に基づいて動体領域120Aを検出する方法が挙げられる。AI方式の処理を用いた検出方法の一例としては、単一の撮像画像75A1b又は時系列上の複数の撮像画像75A1bに対してAI方式の処理(例えば、畳み込みニューラルネットワークを用いた処理)を行うことで動体領域120Aを検出する方法が挙げられる。非AI方式の処理を用いた検出方法とAI方式の処理を用いた検出方法とを組み合わせた検出方法の一例としては、非AI方式の処理を用いた検出方法によって検出された画像領域とAI方式の処理を用いた検出方法によって検出された画像領域とで重複している画像領域を動体領域120Aとして検出する方法が挙げられる。
【0240】
動体検出部122は、動体領域120Aを検出した結果として、撮像画像75A1b内での動体領域120Aの位置を特定可能な位置特定情報126を生成して信頼度マップ生成部62B6に出力する。位置特定情報126は、例えば、動体領域120Aに外接する矩形枠126aの撮像画像75A1b内での位置を特定可能な複数の座標を含む情報である。なお、位置特定情報126は、本開示の技術に係る「指標」及び「第1画像に前記動体が写っているか否かを特定可能な情報」の一例である。
【0241】
信頼度マップ生成部62B6は、信頼度ネットワーク102Eを用いた処理を行う。信頼度マップ生成部62B6は、複数の撮像画像75A1bから得られた複数の位置特定情報126に基づいて信頼度マップ88Eを生成する。信頼度マップ88Eは、動体領域120Aに対する信頼度(すなわち、信頼可能な度合い)の分布を示すマップであり、撮像画像75A1bと同一のサイズで形成されている。信頼度マップ88Eは、第1領域88E1及び第2領域88E2を有する。第1領域88E1は、複数の位置特定情報126から特定される領域(すなわち、動体領域120Aに対応する領域)である。第2領域88E2は、第1領域88E1以外の残り領域(すなわち、動体領域120Aが存在しない領域)である。図20に示す例では、第1領域88E1の信頼度が“1.0”であり、第2領域88E2の信頼度は“0.0”である。
【0242】
なお、本第6実施形態では、動体検出部122が撮像画像75A1bから動体領域120Aを検出し、信頼度マップ生成部62B6が動体検出部122による検出結果に基づいて信頼度を導出する形態例を挙げているが、これは、あくまでも一例に過ぎない。例えば、信頼度ネットワーク102Eが、複数の撮像画像75A1bから動体領域120Aを検出し、検出結果に基づいて信頼度マップ88Eを生成するようにしてもよい。この場合、例えば、信頼度ネットワーク102Eは、動体領域120Aを検出可能な畳み込みニューラルネットワークであり、信頼度マップ88Eは、信頼度ネットワーク102Eの中間層から得られる特徴量マップに基づいて生成されるようにすればよい。
【0243】
一例として図21に示すように、非AI方式処理部62C2は、時系列上の複数の撮像画像75A1bに対して非AI方式の処理を行うことで画像128を生成する。画像128は、本開示の技術に係る「第4画像」及び「第1画像から前記環境現象の写り込みを低減する非AI方式の処理が行われることによって得られた画像」の一例である。
【0244】
時系列上の複数の撮像画像75A1bに対する非AI方式の処理の一例としては、時系列上の複数の撮像画像75A1bを平均化する処理が挙げられる。画像128は、撮像画像75A1bに写っている陽炎が消去された画像である。ここでは、画像128として、撮像画像75A1bに写っている陽炎が消去された画像を例示しているが、これは、あくまでも一例に過ぎず、画像128は、陽炎が完全に消去されずに僅かに残存している画像であってもよく、画像128は、撮像画像75A1bよりも、陽炎の写り込みが低減された画像であればよい。
【0245】
また、ここでは、時系列上の複数の撮像画像75A1bが平均化されることによって画像128が生成される形態例を挙げているが、これは、あくまでも一例に過ぎない。例えば、撮像画像75A1bに対してデジタルフィルタを用いた処理が行われることによって画像128(すなわち、撮像画像75A1bよりも、陽炎の写り込みが低減された画像)が生成されるようにしてもよい。
【0246】
非AI方式処理部62C2は、上記の要領で画像128を生成し、生成した画像128を正規化処理部62D2に出力する。正規化処理部62D2は、上記第1又は第2実施形態で説明した正規化処理と同様の要領で、画像128を正規化する。そして、このように正規化された画像128は、画像124(図19参照)と合成される。
【0247】
ところで、時系列上の複数の撮像画像75A1bに対して非AI方式の処理(例えば、平均化する処理)が行われることによって画像128が生成されると、画像128は、撮像画像75A1bよりも、陽炎が低減されるものの、動体領域120Aの残像が生じる。そのため、画像128そのものと画像124とが合成されると、合成されて得られた画像にも動体領域120Aの残像が生じる。
【0248】
そこで、本第6実施形態では、画像128と画像124との合成の前段階で、画像128内で動体領域120Aの残像が生じている残像領域130が信頼度マップ88Eに基づいて特定され、画像128と画像124との合成で、特定された残像領域130に代えて画像128内の動体領域120Aが用いられるようにしている。
【0249】
これを実現するために、例えば、図22に示すように、割合付与部62E4は、信頼度マップ88E内の第1領域88E1の信頼度に応じた第1割合94A及び第2割合94Bを導出し、信頼度マップ88E内の第2領域88E2の信頼度に応じた第1割合94A及び第2割合94Bを導出する。
【0250】
第1領域88E1の信頼度は“1.0”である。この場合、画像128と画像124との合成により、残像領域130に代えて画像128内の動体領域120Aが用いられるようにするために、第1領域88E1の信頼度に応じて導出される第1割合94Aとして“1.0”が用いられ、第1領域88E1の信頼度に応じて導出される第2割合94Bとして“0.0”が用いられる。
【0251】
一方、第2領域88E2の信頼度は“0.0”である。この場合、第2領域88E2の信頼度に応じて導出される第1割合94Aは“0.0”であり、第2領域88E2の信頼度に応じて導出される第2割合94Bは“1.0”である。なお、第2領域88E2の信頼度に応じて導出される第1割合94Aは0.0~1.0の範囲内で0.0よりも大きな値であってもよい。この場合の第2割合94Bの値としては、1.0から第1割合94Aの値を減じた値が用いられる。
【0252】
割合付与部62E4は、第1領域88E1の信頼度に応じて導出した第1割合94Aを、画像124内の全画像領域のうちの第1領域88E1に対応する画像領域に対して付与する。また、割合付与部62E4は、第1領域88E1の信頼度に応じて導出した第2割合94Bを、画像128内の全画像領域のうちの第1領域88E1に対応する画像領域に対して付与する。
【0253】
割合付与部62E4は、第2領域88E2の信頼度に応じて導出した第1割合94Aを、画像124内の全画像領域のうちの第2領域88E2に対応する画像領域に対して付与する。また、割合付与部62E4は、第2領域88E2の信頼度に応じて導出した第2割合94Bを、画像128内の全画像領域のうちの第2領域88E2に対応する画像領域に対して付与する。
【0254】
合成部62F4は、上記各実施形態と同様の要領で、画像124と画像128とを第1割合94A及び第2割合94Bで合成することにより、合成画像100Dを生成する。すなわち、画像124内の全画像領域のうちの残像領域130に対応する画像領域は、画像128内の全画像領域のうちの残像領域130に対応する画像領域よりも高い割合(ここでは、一例として、“1.0”)で合成される。また、画像128内の全画像領域のうちの残像領域130以外の領域に対応する画像領域は、画像124内の全画像領域のうちの残像領域130以外の領域に対応する画像領域よりも高い割合(ここでは、一例として、“1.0”)で合成される。これにより、画像128に写っている残像領域130を無視して定めた割合で画像124と画像128とを合成した場合に比べ、陽炎が低減され、かつ、動体の残像が少ない合成画像100Dを得ることができる。
【0255】
[第7実施形態]
上記第6実施形態では、画像内の陽炎の写り込みを低減する形態例を挙げて説明したが、本第7実施形態では、画像内の霞の写り込みを低減する形態例について説明する。
【0256】
一例として図23図25に示すように、プロセッサ62は、画像合成処理プログラム132(図4参照)をRAM66上で実行することで、AI方式処理部62A3、信頼度マップ生成部62B7、非AI方式処理部62C3、正規化処理部62D3、割合付与部62E5、及び合成部62F5として動作する。
【0257】
一例として図23に示すように、AI方式処理部62A3及び信頼度マップ生成部62B7には、撮像画像75A1cが入力される。撮像画像75A1cは、図3に示す撮像画像75A1の一例である。撮像画像75A1cは、非霞領域134A及び霞領域134Bを有する。撮像画像75A1cは、本開示の技術に係る「第1画像」及び「霞を含む被写体が撮像されることによって得られた画像」の一例である。なお、非霞領域134A及び霞領域134Bは、本開示の技術に係る「指標」及び「霞領域を特定可能な情報」の一例である。
【0258】
非霞領域134Aは、霞が写っていない画像領域(すなわち、霞領域134B以外の画像領域)である。霞領域134Bは、霞が写っている画像領域である。図23に示す例では、霞領域134Bに、人物が写っている人物領域135が含まれている。撮像画像75A1cに写っている霞は、本開示の技術に係る「霞」の一例である。霞領域134Bは、本開示の技術に係る「霞領域」の一例である。
【0259】
AI方式処理部62A3は、撮像画像75A1cに対してAI方式の処理を行うことで画像136を生成する。撮像画像75A1cに対するAI方式の処理とは、例えば、生成モデル82A3を用いた処理を指す。生成モデル82A3は、図4に示す生成モデル82Aの一例である。撮像画像75A1cに対するAI方式の処理は、本開示の技術に係る「第1AI処理」の一例である。生成モデル82A3は、画像に写っている霞を低減させる学習が既に行われた生成ネットワークである。画像136は、撮像画像75A1cに写っている霞が消去された画像である。ここでは、画像136として、撮像画像75A1cに写っている霞が消去された画像を例示しているが、これは、あくまでも一例に過ぎず、画像136は、霞が完全に消去されずに僅かに残存している画像であってもよく、画像136は、撮像画像75A1cよりも、霞の写り込みが低減された画像であればよい。なお、画像136は、本開示の技術に係る「第2画像」及び「第1画像に対して第1AI処理が行われることによって第1画像から霞の写り込みが低減された画像」の一例である。
【0260】
信頼度マップ生成部62B7は、信頼度ネットワーク102Fを用いた処理を行う。例えば、信頼度ネットワーク102Fは、入力された撮像画像75A1cに基づいて信頼度マップ88Fを生成する。信頼度ネットワーク102Fは、霞領域134Bを検出可能な畳み込みニューラルネットワークであり、信頼度マップ88Fは、信頼度ネットワーク102Fの中間層から得られる特徴量マップに基づいて生成される。
【0261】
信頼度マップ88Fは、霞領域134Bに対する信頼度(すなわち、信頼可能な度合い)の分布を示すマップであり、撮像画像75A1cと同一のサイズで形成されている。信頼度マップ88Fは、第1領域88F1及び第2領域88F2を有する。第1領域88F1は、霞領域134Bに対応する領域である。第2領域88F2は、非霞領域134Aに対応する領域である。図23に示す例では、第1領域88F1の信頼度が“1.0”であり、第2領域88F2の信頼度は“0.0”である。
【0262】
一例として図24に示すように、非AI方式処理部62C3は、撮像画像75A1cに対して非AI方式の処理を行うことで画像138を生成する。画像138は、本開示の技術に係る「第4画像」及び「第1画像から霞の写り込みを低減する非AI方式の処理が行われることによって得られた画像」の一例である。
【0263】
撮像画像75A1cに対する非AI方式の処理の一例としては、デジタルフィルタ84A2を用いた処理が挙げられる。画像138は、撮像画像75A1cよりも、霞の写り込みが低減された画像である。霞の写り込みが低減された画像の一例としては、撮像画像75A1c内の霞の写り込みが消去されずに僅かに残存している画像、又は、撮像画像75A1c内の霞の写り込みが消去された画像が挙げられる。
【0264】
非AI方式処理部62C3は、上記の要領で画像138を生成し、生成した画像138を正規化処理部62D3に出力する。正規化処理部62D3は、上記第1又は第2実施形態で説明した正規化処理と同様の要領で、画像138を正規化する。そして、このように正規化された画像138は、画像136(図23参照)と合成される。
【0265】
ところで、生成モデル82A3の性能は、撮像画像75A1cに写っているシーンによってばらつくことがある。そうすると、霞の写り込みの低減が不十分であったり、非霞領域134Aの一部が霞領域134Bであると誤判定されて削られてしまったりする虞がある。また、ユーザが霞の写り込みを僅かに残しておくことを望んでいるにも拘らず、霞の写り込みが完全に消去されてしまったりする虞もある。
【0266】
そこで、本第7実施形態では、画像136と画像138との合成の前段階で、撮像画像75A1c内の霞領域134Bが信頼度マップ88Fによって特定され、画像136と画像138との合成で、画像136内の霞領域134Bに代えて、画像138内の霞領域134Bが用いられるようにしている。
【0267】
これを実現するために、例えば、図25に示すように、割合付与部62E5は、信頼度マップ88F内の第1領域88F1の信頼度に応じた第1割合94A及び第2割合94Bを導出し、信頼度マップ88F内の第2領域88F2の信頼度に応じた第1割合94A及び第2割合94Bを導出する。
【0268】
第1領域88F1の信頼度は“1.0”である。この場合、画像136と画像138との合成により、画像136内の霞領域134Bに代えて、画像138内の霞領域134Bが用いられるようにするために、第1領域88F1の信頼度に応じて導出される第1割合94Aとして“1.0”が用いられ、第2領域88F2の信頼度に応じて導出される第2割合94Bとして“0.0”が用いられる。なお、第1領域88F1の信頼度に応じて導出される第1割合94Aは0.0~1.0の範囲内で0.5よりも大きな値であってもよい。この場合の第2割合94Bの値としては、1.0から第1割合94Aの値を減じた値が用いられる。
【0269】
一方、第2領域88F2の信頼度は“0.0”である。この場合、第2領域88F2の信頼度に応じて導出される第1割合94Aは“1.0”であり、第2領域88F2の信頼度に応じて導出される第2割合94Bは“0.0”である。
【0270】
割合付与部62E5は、第1領域88F1の信頼度に応じて導出した第1割合94Aを、画像136内の霞領域134Bに対して付与する。また、割合付与部62E5は、第1領域88F1の信頼度に応じて導出した第2割合94Bを、画像138内の霞領域134Bに対して付与する。
【0271】
割合付与部62E5は、第2領域88F2の信頼度に応じて導出した第1割合94Aを、画像136内の非霞領域134Aに対して付与する。また、割合付与部62E5は、第2領域88F2の信頼度に応じて導出した第2割合94Bを、画像138内の非霞領域134Aに対して付与する。
【0272】
合成部62F5は、上記各実施形態と同様の要領で、画像136と画像138とを第1割合94A及び第2割合94Bで合成することにより、合成画像100Eを生成する。すなわち、画像138内の霞領域134Bは、画像136内の霞領域134Bよりも高い割合(ここでは、一例として、“1.0”)で合成される。また、画像136内の非霞領域134Aは、画像138内の非霞領域134Aよりも高い割合(ここでは、一例として、“1.0”)で合成される。これにより、撮像画像75A1cよりも、霞の写り込みが低減された合成画像100Eを得ることができる。また、生成モデル82A3の性能が撮像画像75A1cに写っているシーンによってばらつくことに起因して、合成画像100Eにおいて霞の写り込みが低減される度合いが不安定になることを抑制することができる。
【0273】
なお、上記第7実施形態では、AI方式処理部62A3及び非AI方式処理部62C3に同一の撮像画像75A1cが入力される形態例を挙げたが、これは、あくまでも一例に過ぎない。例えば、連写が行われることによって得られた複数の撮像画像75A1cのうち、時間的に前後している一対の撮像画像75A1cのうちの一方の撮像画像75A1cがAI方式処理部62A3に入力され、他方の撮像画像75A1bが非AI方式処理部62C3に入力されるようにしてもよい。この場合、一方の撮像画像75A1cは、本開示の技術に係る「第1画像」の一例であり、他方の撮像画像75A1cは、本開示の技術に係る「第3画像」の一例である。
【0274】
[第8実施形態]
上記各実施形態では、可視光画像に基づいて生成された一対の画像が合成される形態例を挙げて説明したが、本第8実施形態では、赤外光画像と可視光画像に基づいて生成された画像とが合成される形態例について説明する。
【0275】
一例として図26に示すように、撮像装置10は、赤外光センサ140及び可視光センサ142を有する。可視光センサ142の一例としては、図1図3に示すイメージセンサ20が挙げられる。赤外光センサ140は、イメージセンサ20に組み込まれている。
【0276】
赤外光センサ140は、被写体144を撮像することにより赤外光画像146を生成する。被写体144は、本開示の技術に係る「撮像対象領域」の一例である。赤外光画像146は、本開示の技術に係る「第3画像」及び「赤外光画像」の一例である。可視光センサ142は、被写体144を撮像することにより可視光画像148を生成する。可視光画像148は、本開示の技術に係る「第1画像」の一例である。赤外光画像146及び可視光画像148は、図3に示す撮像画像75A1の一例である。
【0277】
被写体144の表面には、熱放射体144Aが付されている。熱放射体144Aは、熱放射が小さいために、赤外光画像146に写り込まないが、可視光画像148に写り込む。可視光画像148内の全画像領域は、熱放射体144Aを示す画像領域148Aと、画像領域148A以外の画像領域148Bとに区分される。
【0278】
画像領域148Aは、本開示の技術に係る「第2温度分布画像内において前記第1温度分布画像に写らない熱放射体を示す画像領域である第1領域」の一例である。画像領域148Bは、本開示の技術に係る「第1領域以外の画像領域である第2領域」の一例である。画像領域148A及び画像領域148Bは、本開示の技術に係る「指標」及び「第2温度分布画像内において第1温度分布画像に写らない熱放射体を示す画像領域である第1領域と熱放射体領域以外の画像領域である第2領域とを区別可能な情報」の一例である。
【0279】
一例として図27図29に示すように、プロセッサ62は、画像合成処理プログラム149(図4参照)をRAM66上で実行することで、AI方式処理部62A4、信頼度マップ生成部62B8、非AI方式処理部62C4、正規化処理部62D4、割合付与部62E6、及び合成部62F6として動作する。
【0280】
一例として図27に示すように、非AI方式処理部62C4は、赤外光画像146に対して非AI方式の処理を行うことで第1温度分布画像150を生成する。第1温度分布画像150は、本開示の技術に係る「第1温度分布画像」の一例である。第1温度分布画像150は、いわゆるサーモグラフィである。非AI方式処理部62C4は、赤外光画像146を分析することで被写体144の温度の分布を特定し、被写体144の温度の分布を有彩色で表現した画像を第1温度分布画像150として生成して正規化処理部62D4に出力する。なお、赤外光画像146に基づいて第1温度分布画像150を生成する方法は公知なので、ここでの説明は省略する。
【0281】
正規化処理部62D4は、上記第1又は第2実施形態で説明した正規化処理と同様の要領で、第1温度分布画像150を正規化する。
【0282】
一例として図28に示すように、AI方式処理部62A4及び信頼度マップ生成部62B8には、可視光画像148が入力される。
【0283】
AI方式処理部62A4は、可視光画像148に対してAI方式の処理を行うことで第2温度分布画像152を生成する。可視光画像148に対するAI方式の処理は、本開示の技術に係る「第1AI処理」の一例である。第2温度分布画像152は、本開示の技術に係る「第2温度分布画像」の一例である。可視光画像148に対するAI方式の処理とは、例えば、生成モデル82A4を用いた処理を指す。生成モデル82A4は、図4に示す生成モデル82Aの一例である。生成モデル82A4は、可視光が撮像されることで得られた画像から、被写体の温度の分布を有彩色で表現した画像(すなわち、サーモグラフィ)を生成する学習が既に行われた生成ネットワークである。
【0284】
第2温度分布画像152は、可視光画像148により示される被写体144及び熱放射体144A(図26参照)の温度の分布を有彩色で表現した画像(すなわち、サーモグラフィ)である。第2温度分布画像152内の全画像領域は、熱放射体144Aを示す画像領域152Aと画像領域152A以外の画像領域152Bとに区分される。第2温度分布画像152内での画像領域152Aの位置は、可視光画像148内での画像領域148Aの位置に対応している。
【0285】
信頼度マップ生成部62B8は、信頼度ネットワーク102Gを用いた処理を行う。例えば、信頼度ネットワーク102Gは、入力された可視光画像148に基づいて信頼度マップ88Gを生成する。信頼度ネットワーク102Gは、熱放射体144Aを示す画像を検出可能な畳み込みニューラルネットワークであり、信頼度マップ88Gは、信頼度ネットワーク102Gの中間層から得られる特徴量マップに基づいて生成される。
【0286】
信頼度マップ88Gは、画像領域148Aに対する信頼度(すなわち、信頼可能な度合い)の分布を示すマップであり、可視光画像148と同一のサイズで形成されている。信頼度マップ88Gは、第1領域88G1及び第2領域88G2を有する。第1領域88G1は、画像領域148Aに対応する領域である。第2領域88G2は、画像領域148Bに対応する領域である。図28に示す例では、第1領域88G1の信頼度が“1.0”であり、第2領域88G2の信頼度は“0.0”である。
【0287】
ところで、第1温度分布画像150には、熱放射体144Aを示す画像領域が含まれていない。そのため、ユーザは、第1温度分布画像150を視認しただけでは、被写体144に熱放射体144Aが付されていることを認識することができない。
【0288】
そこで、本第8実施形態では、ユーザに対して、被写体144に熱放射体144Aが付されていることを画像から視覚的に特定させるために、第1温度分布画像150と熱放射体144Aを示す画像領域152Aが含まれている第2温度分布画像152との合成が行われる。
【0289】
これを実現するために、例えば、図29に示すように、割合付与部62E6は、信頼度マップ88G内の第1領域88G1の信頼度に応じた第1割合94A及び第2割合94Bを導出し、信頼度マップ88G内の第2領域88G2の信頼度に応じた第1割合94A及び第2割合94Bを導出する。
【0290】
第1領域88G1の信頼度は“1.0”である。この場合、第1温度分布画像150と第2温度分布画像152との合成により、熱放射体144Aを示す画像領域152Aが可視化されるようにするために、第1領域88G1の信頼度に応じて導出される第1割合94Aとして“1.0”が用いられ、第1領域88G1の信頼度に応じて導出される第2割合94Bとして“0.0”が用いられる。
【0291】
ここでは、第1割合94Aとして“1.0”が用いられ、第2割合94Bとして“0.0”が用いられる形態例が挙げられているが、本開示の技術はこれに限定されない。例えば、第1割合94A及び第2割合94Bの各値は、第1温度分布画像150と第2温度分布画像152とが第1割合94A及び第2割合94Bに従って合成された場合に熱放射体144Aを示す画像領域152Aが可視化される値であればよい。
【0292】
一方、第2領域88G2の信頼度は“0.0”である。この場合、第2領域88G2の信頼度に応じて導出される第1割合94Aは“0.0”であり、第2領域88G2の信頼度に応じて導出される第2割合94Bは“1.0”である。
【0293】
割合付与部62E6は、第1領域88G1の信頼度に応じて導出した第1割合94Aを、第2温度分布画像152内の画像領域152Aに付与する。また、割合付与部62E6は、第1領域88G1の信頼度に応じて導出した第2割合94Bを、第1温度分布画像150内の全画像領域のうちの画像領域152Aに対応する画像領域に付与する。
【0294】
割合付与部62E6は、第2領域88G2の信頼度に応じて導出した第1割合94Aを、第2温度分布画像152内の画像領域152Bに付与する。また、割合付与部62E6は、第2領域88G2の信頼度に応じて導出した第2割合94Bを、第1温度分布画像150内の全画像領域のうちの画像領域152Bに対応する画像領域に付与する。
【0295】
合成部62F6は、上記各実施形態と同様の要領で、第1温度分布画像150と第2温度分布画像152とを第1割合94A及び第2割合94Bで合成することにより、合成画像100Fを生成する。すなわち、第2温度分布画像152内の画像領域152Aは、第1温度分布画像150内の全画像領域のうちの画像領域152Aに対応する画像領よりも高い割合(ここでは、一例として、“1.0”)で合成される。また、第1温度分布画像150内の全画像領域のうちの画像領域152Bに対応する画像領域は、第2温度分布画像152内の画像領域152Bよりも高い割合(ここでは、一例として、“1.0”)で合成される。これにより、合成画像100F内で熱放射体144Aを示す画像領域152Aが可視化されるので、ユーザは、合成画像100Fを通して、被写体144に熱放射体144Aが付されていることを把握することができる。
【0296】
[第9実施形態]
上記第8実施形態では、赤外光センサ140によって被写体144が撮像されることで赤外光画像146が生成され、可視光センサ142によって被写体144が撮像されることで可視光画像148が生成される形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、図30に示すように、撮像装置10がマルチスペクトルカメラとしても機能するように構成されており、撮像装置10によって被写体144が撮像されることによって、被写体144を示すマルチスペクトル画像154が生成されるようにしてもよい。
【0297】
マルチスペクトル画像154は、複数の波長帯に分離可能な画像である。図30に示す例では、マルチスペクトル画像154として、赤外光画像154Aと可視光画像154Bとを含む画像が示されている。可視光画像154B内の全画像領域は、画像領域154B1と画像領域154B2とに区分される。画像領域154B1は、上記第8実施形態で説明した画像領域148Aに相当する画像領域であり、画像領域154B2は、上記第8実施形態で説明した画像領域148Bに相当する画像領域である。
【0298】
本第9実施形態では、上記第8実施形態と同様の要領で、赤外光画像154Aに基づいて第1温度分布画像150(図27参照)が生成される。また、本第9実施形態では、上記第8実施形態と同様の要領で、可視光画像154Bに基づいて第2温度分布画像152(図28参照)が生成される。また、本第9実施形態では、上記第8実施形態と同様の要領で、可視光画像154Bに基づいて信頼度マップ88G(図28参照)が生成される。従って、撮像装置10がマルチスペクトルカメラとしても機能するように構成されており、撮像装置10によってマルチスペクトル画像154が生成された場合であっても、上記第8実施形態と同様の効果が得られる。
【0299】
なお、本第9実施形態において、マルチスペクトル画像154は、本開示の技術に係る「マルチスペクトル画像」の一例である。また、赤外光画像154Aに基づいて生成される第1温度分布画像150は、本開示の技術に係る「第4画像」及び「マルチスペクトル画像に基づく画像」の一例である。また、可視光画像154Bに基づいて生成される第2温度分布画像152は、本開示の技術に係る「第2画像」及び「マルチスペクトル画像に対して第1AI処理が行われることによって得られた画像」の一例である。また、画像領域154B1は、本開示の技術に係る「特定被写体領域」の一例である。また、画像領域154B2は、本開示の技術に係る「非特定被写体領域」の一例である。また、画像領域154B1及び画像領域154B2は、本開示の技術に係る「指標」及び「第2画像内において特定被写体を示す画像領域である特定被写体領域と特定被写体領域以外の画像領域である非特定被写体領域とを区別可能な情報」の一例である。また、図30に示す被写体144は、本開示の技術に係る「被写体」の一例である。また、図30に示す熱放射体144Aは、本開示の技術に係る「特定被写体」の一例である。
【0300】
[その他の変形例]
以下では、説明の便宜上、画像合成処理プログラム80、121、132及び149を区別して説明する必要がない場合、符号を付さずに「画像合成処理プログラム」と称する。また、以下では、説明の便宜上、合成画像100A~100Fを区別して説明する必要がない場合、合成画像100Aと称する。
【0301】
上記第1実施形態では、本開示の技術に係る「第3画像」の一例として位相差画像75A2を挙げ、上記第8実施形態では、本開示の技術に係る「第3画像」の一例として赤外光画像146を挙げたが、これらはあくまでも一例に過ぎない。本開示の技術に係る「第3画像」としては、例えば、次の8つの画像が挙げられる。
【0302】
1つ目の画像は、上述したAI方式の処理も上述した非AI方式の処理も行われていない画像(以下、「第1未処理画像」と称する)である。第1未処理画像の一例としては、RAWデータで表現される画像(例えば、可視光画像又は非可視光画像)が挙げられる。2つ目の画像は、第1未処理画像に対して非AI方式の処理が行われることによって得られた画像である。3つ目の画像は、第1未処理画像に対して、本開示の技術に係る「第1AI処理」の一例として挙げた処理とは異なるAI処理が行われることによって得られた画像である。4つ目の画像は、第1未処理画像に対して、本開示の技術に係る「第1AI処理」の一例として挙げた処理とは異なるAI処理が行われ、かつ、非AI処理が行われることによって得られた画像である。5つ目の画像は、第1未処理画像により示される被写体を第1未処理画像の表現方法(例えば、可視光画像を作る方法)とは異なる表現方法(例えば、位相差画像を作る方法)で表現した画像(以下「第2未処理画像」と称する)である。6つ目の画像は、第2未処理画像に対して非AI処理が行われることによって得られた画像(例えば、距離画像)である。7つ目の画像は、第2未処理画像に対して、本開示の技術に係る「第1AI処理」の一例として挙げた処理とは異なるAI処理が行われることによって得られた画像(例えば、距離画像)である。8つ目の画像は、第2未処理画像に対して、本開示の技術に係る「第1AI処理」の一例として挙げた処理とは異なるAI処理が行われ、かつ、非AI処理が行われることによって得られた画像(例えば、AI処理で距離画像が生成され、生成された距離画像に対してフィルタリング処理等の非AI処理が行われることによって得られた画像)である。
【0303】
上記各実施形態では、プロセッサ62が生成モデル82Aを用いた処理を行う形態例を挙げて説明したが、複数種類の生成モデル82Aが条件に応じてプロセッサ62によって使い分けられるようにしてもよい。例えば、撮像装置10によって撮像される撮像シーンに応じてプロセッサ62によって用いられる生成モデル82Aが切り替えられてもよい。また、プロセッサ62によって用いられる生成モデル82Aに応じて割合94が変更されるようにしてもよい。
【0304】
上記各実施形態では、撮像装置10に含まれる画像処理エンジン12のプロセッサ62によって画像合成処理が行われる形態例を挙げて説明したが、本開示の技術はこれに限定されず、画像合成処理を行うデバイスは、撮像装置10の外部に設けられていてもよい。この場合、一例として図31に示すように、撮像システム160を用いればよい。撮像システム160は、撮像装置10と外部装置162を備えている。外部装置162は、例えば、サーバである。サーバは、例えば、クラウドコンピューティングによって実現される。ここでは、クラウドコンピューティングを例示しているが、これは、あくまでも一例に過ぎず、例えば、サーバは、メインフレームによって実現されてもよいし、フォグコンピューティング、エッジコンピューティング、又はグリッドコンピューティング等のネットワークコンピューティングによって実現されてもよい。ここでは、外部装置162の一例として、サーバを挙げているが、これは、あくまでも一例に過ぎず、サーバに代えて、少なくとも1台のパーソナル・コンピュータ等を外部装置162として用いてもよい。
【0305】
外部装置162は、プロセッサ164、NVM166、RAM168、及び通信I/F170を備えており、プロセッサ164、NVM166、RAM168、及び通信I/F170は、バス172で接続されている。通信I/F170は、ネットワーク174を介して撮像装置10に接続されている。ネットワーク174は、例えば、インターネットである。なお、ネットワーク174は、インターネットに限らず、WAN、及び/又は、イントラネット等のLANであってもよい。
【0306】
NVM176には、画像合成処理プログラム、生成モデル82A、及びデジタルフィルタ84Aが記憶されている。プロセッサ164は、RAM166上で画像合成処理プログラムを実行する。プロセッサ164は、RAM166上で実行する画像合成処理プログラムに従って、上述した画像合成処理を行う。プロセッサ164は、画像合成処理を行う場合に、上記各実施形態で説明したように生成モデル82A及びデジタルフィルタ84Aを用いて処理対象画像75Aを処理する。処理対象画像75Aは、例えば、撮像装置10からネットワーク174を介して外部装置162に送信される。外部装置162の通信I/F170は、処理対象画像75Aを受信する。プロセッサ164は、通信I/F170によって受信された処理対象画像75Aに対して画像合成処理を行う。プロセッサ164は、画像合成処理を行うことで合成画像100を生成し、生成した合成画像100を撮像装置10に送信する。撮像装置10は、外部装置162から送信された合成画像100を通信I/F52(図2参照)で受信する。
【0307】
なお、図31に示す例において、外部装置162は、本開示の技術に係る「画像処理装置」及び「コンピュータ」の一例であり、プロセッサ164は、本開示の技術に係る「プロセッサ」の一例である。
【0308】
また、画像合成処理は、撮像装置10及び外部装置162を含む複数の装置によって分散して行われるようにしてもよい。
【0309】
上記各実施形態では、プロセッサ62を例示したが、プロセッサ62に代えて、又は、プロセッサ62と共に、他の少なくとも1つのCPU、少なくとも1つのGPU、及び/又は、少なくとも1つのTPUを用いるようにしてもよい。
【0310】
上記では、NVM64に画像合成処理プログラムが記憶されている形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、画像合成処理プログラムがSSD又はUSBメモリなどの可搬型の非一時的記憶媒体に記憶されていてもよい。非一時的記憶媒体に記憶されている画像合成処理プログラムは、撮像装置10の画像処理エンジン12にインストールされる。プロセッサ62は、画像合成処理プログラムに従って画像合成処理を実行する。
【0311】
また、ネットワークを介して撮像装置10に接続される他のコンピュータ又はサーバ装置等の記憶装置に画像合成処理プログラムを記憶させておき、撮像装置10の要求に応じて画像合成処理プログラムがダウンロードされ、画像処理エンジン12にインストールされるようにしてもよい。
【0312】
なお、撮像装置10に接続される他のコンピュータ又はサーバ装置等の記憶装置、又はNVM64に画像合成処理プログラムの全てを記憶させておく必要はなく、画像合成処理プログラムの一部を記憶させておいてもよい。
【0313】
また、図1及び図3に示す撮像装置10には画像処理エンジン12が内蔵されているが、本開示の技術はこれに限定されず、例えば、画像処理エンジン12が撮像装置10の外部に設けられるようにしてもよい。
【0314】
上記各実施形態では、画像処理エンジン12が例示されているが、本開示の技術はこれに限定されず、画像処理エンジン12に代えて、ASIC、FPGA、及び/又はPLDを含むデバイスを適用してもよい。また、画像処理エンジン12に代えて、ハードウェア構成及びソフトウェア構成の組み合わせを用いてもよい。
【0315】
上述した画像合成処理を実行するハードウェア資源としては、次に示す各種のプロセッサを用いることができる。プロセッサとしては、例えば、ソフトウェア、すなわち、プログラムを実行することで、画像合成処理を実行するハードウェア資源として機能する汎用的なプロセッサであるCPUが挙げられる。また、プロセッサとしては、例えば、FPGA、PLD、又はASICなどの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路が挙げられる。何れのプロセッサにもメモリが内蔵又は接続されており、何れのプロセッサもメモリを使用することで画像合成処理を実行する。
【0316】
画像合成処理を実行するハードウェア資源は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種または異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせ、又はCPUとFPGAとの組み合わせ)で構成されてもよい。また、画像合成処理を実行するハードウェア資源は1つのプロセッサであってもよい。
【0317】
1つのプロセッサで構成する例としては、第1に、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが、画像合成処理を実行するハードウェア資源として機能する形態がある。第2に、SoCなどに代表されるように、画像合成処理を実行する複数のハードウェア資源を含むシステム全体の機能を1つのICチップで実現するプロセッサを使用する形態がある。このように、画像合成処理は、ハードウェア資源として、上記各種のプロセッサの1つ以上を用いて実現される。
【0318】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路を用いることができる。また、上記の画像合成処理はあくまでも一例である。従って、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
【0319】
以上に示した記載内容及び図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、及び効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、及び効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容及び図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことは言うまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容及び図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。
【0320】
本明細書において、「A及び/又はB」は、「A及びBのうちの少なくとも1つ」と同義である。つまり、「A及び/又はB」は、Aだけであってもよいし、Bだけであってもよいし、A及びBの組み合わせであってもよい、という意味である。また、本明細書において、3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「A及び/又はB」と同様の考え方が適用される。
【0321】
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
【符号の説明】
【0322】
10 撮像装置
12 画像処理エンジン
16 撮像装置本体
18 交換レンズ
18A フォーカスリング
20 イメージセンサ
22 レリーズボタン
24 ダイヤル
26 指示キー
28 ディスプレイ
30 タッチパネル
32 タッチパネル・ディスプレイ
36 制御装置
37 第1アクチュエータ
38 第2アクチュエータ
39 第3アクチュエータ
40 撮像レンズ
40A 対物レンズ
40B フォーカスレンズ
40C ズームレンズ
40D 絞り
40D1 開口
40D2 絞り羽根
44 システムコントローラ
46 画像メモリ
48 UI系デバイス
50 外部I/F
52,170 通信I/F
54 光電変換素子ドライバ
62,144 プロセッサ
62A1~62A4 AI方式処理部
62B1~62B8 信頼度マップ生成部
62C1~62C4 非AI方式処理部
62D1~62D4 正規化処理部
62E1~62E6 割合付与部
62F1~62F6 合成部
64,166 NVM
66,168 RAM
68,172 バス
70 入出力インタフェース
72 光電変換素子
72A 受光面
72A1 位相差画素ライン
72AG1 一般撮像系画素群
72A2 非位相差画素ライン
72AG2 測距系画素群
74 A/D変換器
75A 処理対象画像
75A1,75A1a,75A1b,75A1c 撮像画像
75A2 位相差画像
75B 処理済み画像
76 受付デバイス
78 ハードキー部
80,122,132,149 画像合成処理プログラム
82A,82A1~82A4 生成モデル
84A,84A1,84A2 デジタルフィルタ
85A,135 人物領域
85B 背景領域
86 第1距離画像
88A~88G 信頼度マップ
88A1,88B2,96A,96B,100A1 エッジ領域
88A2,88B1,98A,98B,100A2 非エッジ領域
88E1,88F1,88G1 第1領域
88E2,88F2,88G2 第2領域
89 第2距離画像
90A,90B,92A,92B,148A,148B,152A,152B、154B1,154B2 画像領域
90A1 第1代表値
90B1 第2代表値
90B2 第1最大値
90B3 第1最小値
92A1 第3代表値
92B1 第4代表値
92B2 第2最大値
92B3 第2最小値
94 割合
94A 第1割合
94B 第2割合
100A~100F 合成画像
102A~102G 信頼度ネットワーク
104,106,108,110,112,114,116,118 区分領域
120A 動体領域
120B 陽炎領域
124,128、136,138 画像
126 位置特定情報
126A 矩形枠
130 残像領域
134A 非霞領域
134B 霞領域
140 赤外光センサ
142 可視光センサ
144 被写体
144A 熱放射体
146,154A 赤外光画像
148,154B 可視光画像
150 第1温度分布画像
152 第2温度分布画像
154 マルチスペクトル画像
154B1
160 撮像システム
162 外部装置
174 ネットワーク
L 第1位相差画素
N 非位相差画素
OA 光軸
R 第2位相差画素
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31