IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特開2024-175481画像処理装置、情報処理方法、及びプログラム
<>
  • 特開-画像処理装置、情報処理方法、及びプログラム 図1
  • 特開-画像処理装置、情報処理方法、及びプログラム 図2
  • 特開-画像処理装置、情報処理方法、及びプログラム 図3
  • 特開-画像処理装置、情報処理方法、及びプログラム 図4
  • 特開-画像処理装置、情報処理方法、及びプログラム 図5
  • 特開-画像処理装置、情報処理方法、及びプログラム 図6
  • 特開-画像処理装置、情報処理方法、及びプログラム 図7
  • 特開-画像処理装置、情報処理方法、及びプログラム 図8
  • 特開-画像処理装置、情報処理方法、及びプログラム 図9
  • 特開-画像処理装置、情報処理方法、及びプログラム 図10
  • 特開-画像処理装置、情報処理方法、及びプログラム 図11
  • 特開-画像処理装置、情報処理方法、及びプログラム 図12
  • 特開-画像処理装置、情報処理方法、及びプログラム 図13
  • 特開-画像処理装置、情報処理方法、及びプログラム 図14
  • 特開-画像処理装置、情報処理方法、及びプログラム 図15
  • 特開-画像処理装置、情報処理方法、及びプログラム 図16
  • 特開-画像処理装置、情報処理方法、及びプログラム 図17
  • 特開-画像処理装置、情報処理方法、及びプログラム 図18
  • 特開-画像処理装置、情報処理方法、及びプログラム 図19
  • 特開-画像処理装置、情報処理方法、及びプログラム 図20
  • 特開-画像処理装置、情報処理方法、及びプログラム 図21
  • 特開-画像処理装置、情報処理方法、及びプログラム 図22
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024175481
(43)【公開日】2024-12-18
(54)【発明の名称】画像処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
   G02B 7/28 20210101AFI20241211BHJP
   G02B 7/34 20210101ALI20241211BHJP
   G02B 7/36 20210101ALI20241211BHJP
   G03B 13/36 20210101ALI20241211BHJP
   G06T 5/70 20240101ALI20241211BHJP
【FI】
G02B7/28 N
G02B7/34
G02B7/36
G03B13/36
G06T5/00 705
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2023093306
(22)【出願日】2023-06-06
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】磯部 真吾
【テーマコード(参考)】
2H011
2H151
5B057
【Fターム(参考)】
2H011AA01
2H011BA23
2H011BA34
2H011BB04
2H151BA03
2H151BA47
2H151BA59
2H151BA66
2H151CB26
2H151CE07
2H151CE14
5B057CA08
5B057CA12
5B057CA16
5B057CE02
5B057CE06
5B057CH09
5B057DB02
5B057DB09
5B057DC06
5B057DC16
5B057DC40
(57)【要約】
【課題】低照度環境においてノイズが多い映像においてフォーカスを合わせるために有利な情報を提供する。
【解決手段】入力された第1の画像から、特定の空間周波数を有する領域を示すアテンションマップを生成する。第1の画像とアテンションマップとに基づいて、学習済みの機械学習モデルにより前記第1の画像からノイズが低減された第2の画像を出力する。第2の画像とアテンションマップとに基づいて、撮像装置の焦点の調節のための情報を生成する。
【選択図】図4
【特許請求の範囲】
【請求項1】
入力された第1の画像から、特定の空間周波数を有する領域を示すアテンションマップを生成する第1の生成手段と、
前記第1の画像と前記アテンションマップとに基づいて、学習済みの機械学習モデルにより前記第1の画像からノイズが低減された第2の画像を出力する出力手段と、
前記第2の画像と前記アテンションマップとに基づいて、撮像装置の焦点を調節するための情報を生成する第2の生成手段と、
を備えることを特徴とする、画像処理装置。
【請求項2】
前記第2の生成手段は、前記撮像装置の焦点を調節するための情報として、オートフォーカスにおける焦点検出を行う、前記第2の画像中の第1の部分領域を示す情報を生成することを特徴とする、請求項1に記載の画像処理装置。
【請求項3】
前記第1の画像から前記空間周波数に基づいて第2の部分領域を抽出する抽出手段をさらに備え、
前記第1の生成手段は、前記アテンションマップとして、前記第1の画像における前記第2の部分領域を示すマップを生成し、
前記第2の生成手段は、前記アテンションマップの前記第2の部分領域に基づいて前記第1の部分領域を示す情報を生成することを特徴とする、請求項2に記載の画像処理装置。
【請求項4】
前記第1の部分領域は、前記アテンションマップの前記第2の部分領域の重心位置を中心とする、所定の形状の領域であることを特徴とする、請求項3に記載の画像処理装置。
【請求項5】
前記第2の画像の前記第1の部分領域から、コントラスト方式によりオートフォーカスの焦点位置を決定する第1の決定手段をさらに備えることを特徴とする、請求項2に記載の画像処理装置。
【請求項6】
前記第2の画像の前記第1の部分領域から、位相差方式によりオートフォーカスの焦点位置を決定する第2の決定手段をさらに備えることを特徴とする、請求項2に記載の画像処理装置。
【請求項7】
前記第2の生成手段は、前記撮像装置による焦点調節に用いる情報として、マニュアルフォーカス操作中において第2の画像上に重畳表示する、前記第2の部分領域を示す画像を生成することを特徴とする、請求項3に記載の画像処理装置。
【請求項8】
前記第2の生成手段は、前記撮像装置による焦点調節に用いる情報として、合焦までのフォーカスレンズの移動量を示す情報を生成することを特徴とする、請求項6に記載の画像処理装置。
【請求項9】
前記第2の生成手段は、前記撮像装置の焦点の調節のための情報として、前記撮像装置が合焦しているか否かを示す情報を生成することを特徴とする、請求項6に記載の画像処理装置。
【請求項10】
第1の画像を撮像する撮像手段と、
前記第1の画像を入力として、特定の空間周波数を有する領域を示すアテンションマップを生成する第1の生成手段と、
前記第1の画像と前記アテンションマップとに基づいて学習済みの機械学習モデルにより、前記第1の画像からノイズが低減された第2の画像を出力する出力手段と、
前記第2の画像と前記アテンションマップとに基づいて、撮像における焦点を調節するための情報を生成する第2の生成手段と、
を備えることを特徴とする、撮像装置。
【請求項11】
前記撮像手段は、外部から入射した光束を二像に分岐させ、前記二像を焦点検出用にそれぞれ結像する画素構造を有し、
前記二像の位相差に基づいて撮像装置のオートフォーカス制御を行う制御部をさらに備えることを特徴とする、請求項10に記載の撮像装置。
【請求項12】
前記撮像手段による焦点位置の検出を行うセンサと、
前記センサの出力に応じて撮像装置のオートフォーカス制御を行う制御部と、
をさらに備えることを特徴とする、請求項10に記載の撮像装置。
【請求項13】
撮像における焦点調節に用いる情報を表示する表示手段をさらに備えることを特徴とする、請求項10に記載の撮像装置。
【請求項14】
前記表示手段は、撮像装置の外部装置において前記撮像における焦点の調節のための情報を表示させることをさらに特徴とする、請求項13に記載の撮像装置。
【請求項15】
入力された第1の画像から、特定の空間周波数を有する領域を示すアテンションマップを生成する処理と、
前記第1の画像と前記アテンションマップとに基づいて、学習済みの機械学習モデルにより、前記第1の画像からノイズが低減された第2の画像を出力する処理と、
前記第2の画像と前記アテンションマップとに基づいて、撮像装置の焦点の調節のための情報を生成する処理と、
を備えることを特徴とする、情報処理方法。
【請求項16】
コンピュータを、請求項1乃至9の何れか一項に記載の画像処理装置又は請求項10乃至14の何れか一項に記載の撮像装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
監視市場における超低照度環境では、ターゲットとする被写体の視認性の向上が求められており、カメラによる撮影時には非常に高いゲインが適用されることがある。例えば、鑑賞用途としての画質を犠牲にしてでも被写体の視認性を重視してゲインを高くする場合がある。また、このようなシーンでオートフォーカス(以下AF)を使用する場合には、焦点検出の評価値が通常の場合と比較して変動するため、焦点検出が難しくなるとされている。
【0003】
AFを行う方式としては、映像の高周波成分を焦点評価値とするコントラスト方式、又は撮像素子に入る光束を分岐して二像に結像し、二像の位相差からデフォーカス量を求めて焦点を評価する位相差方式が存在する。特許文献1では、焦点検出処理における前段処理でノイズ低減処理(以下NR)を実施する技術が開示されており、NR強度に応じた合焦判定閾値を調整することによりノイズがある被写体による合焦を行っている。また、特許文献2では過去所定フレームにおいて変化量が閾値以上となった回数の合計が閾値以上である場合にAF起動を指示することにより、ノイズ変動による影響を低減させAFとしての安定性を向上させる技術が開示されている。
【0004】
特許文献3では相関演算用に第一階層及び縦横縮小した第二階層の二像を用意し、ノイズが多い場合は第二階層の二像データで相関演算する像ズレ量算出装置が開示されている。また、特許文献4に記載の技術では、ノイズ量に応じて相関演算時に算出される信頼性判定の基準値を変更している。特許文献1及び2ではコントラスト方式によりAFが行われており、特許文献3及び4では位相差方式によりAFが行われている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008-292541号公報
【特許文献2】特開2022-11099号公報
【特許文献3】特許第6931306号公報
【特許文献4】特許第6758964号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、これらの特許文献に記載の技術では、ノイズが除去しきれず焦点評価値が通常時よりも変動してしまい、ボケによるAFの停止が生じる、又はそもそもAFが駆動しない場合があった。例えば、高ゲインかつノイズの多い画像に対しては、ノイズが除去しきれないことがある。
【0007】
本発明は、画像のノイズを低減しつつ、焦点を調節するために有利な情報を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の目的を達成するために、例えば、一実施形態に係る画像処理装置は以下の構成を備える。すなわち、第1の画像から、空間周波数に基づいて、アテンション機構による推論を行う機械学習モデルにより用いられるアテンションマップを生成する第1の生成手段と、前記第1の画像を入力として、前記アテンションマップに基づいて前記第1の画像からノイズを低減した画像を生成するよう学習済みの機械学習モデルにより、第1の画像からノイズを低減した第2の画像を出力する出力手段と、前記アテンションマップに基づいて、撮像装置による焦点調節に用いる情報を生成する第2の生成手段と、を備える。
【発明の効果】
【0009】
画像のノイズを低減しつつ、焦点を調節するために有利な情報を提供する。
【図面の簡単な説明】
【0010】
図1】実施形態1に係る画像処理装置のハードウェア構成の一例を示すブロック図。
図2】実施形態1に係る全体の処理の一例を示すフローチャート。
図3】実施形態1に係る初期化処理の一例を示すフローチャート。
図4】実施形態1に係るニューラルネットワークの説明を行うための図。
図5】実施形態1に係る撮像処理の一例を示すフローチャート。
図6】実施形態1に係るノイズリダクション処理の一例を示すフローチャート。
図7】実施形態1に係るアテンションマップ処理の一例を示すフローチャート。
図8】実施形態1に係る焦点検出処理の一例を示すフローチャート。
図9】実施形態1に係るコントラスト評価値による判定を説明するための図。
図10】実施形態1に係るAFの目標値設定処理の一例を示すフローチャート。
図11】実施形態1に係るMFアシスト画像重畳処理の一例を示すフローチャート。
図12】実施形態1に係るMF操作量設定処理の一例を示すフローチャート。
図13】実施形態1に係る映像の一例を示す図。
図14】実施形態2に係る画像処理装置のハードウェア構成の一例を示すブロック図。
図15】実施形態2に係る全体の処理の一例を示すフローチャート。
図16】実施形態2に係る撮像処理の一例を示すフローチャート。
図17】実施形態2に係るノイズリダクション処理の一例を示すフローチャート。
図18】実施形態2に係るアテンションマップ処理の一例を示すフローチャート。
図19】実施形態2に係る焦点検出処理の一例を示すフローチャート。
図20】実施形態2に係るAFの目標値設定処理の一例を示すフローチャート。
図21】実施形態2に係るMFアシスト画像重畳処理の一例を示すフローチャート。
図22】実施形態2に係るエッジマップの一例を示す図。
【発明を実施するための形態】
【0011】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0012】
[実施形態1]
本実施形態に係る画像処理装置は、例えば、ニューラルネットワーク(以下NN)を用いて、入力画像から所望の出力画像を推論し、推論された映像から高周波成分を用いて焦点評価しAFする画像処理において用いられる。NNの学習では、生徒画像とそれに対応する教師画像とを複数用意し、生徒画像の特徴分布を教師画像の特徴分布に近づけるなどの学習が行われて、重み又はバイアスなどのネットワークパラメータを最適化することが行われる。これにより、学習されていない入力画像に対しても精度よい推論が可能となる。
【0013】
本実施形態に係る画像処理装置は、前段処理として未知のノイズ入力画像に対する推論を行ってノイズが低減された推論画像を取得し、後段処理として推論画像に対して撮像装置の焦点の調節のための情報を生成する。とくに、後段処理においては、撮像装置によるAF処理を行う。
【0014】
図1は、本実施形態に係る、撮像機能を有する画像処理装置100のハードウェア構成の一例を示すブロック図である。本実施形態に係る画像処理装置100はレンズ内蔵型のデジタルビデオカメラであるものとして説明を行うが、後述する処理が可能であればこの構造に限定するわけではない。例えば画像処理装置100は、レンズ交換式のビデオカメラ、一眼レフカメラ、又はミラーレス一眼カメラなどのレンズ交換式の画像処理装置であってもよい。
【0015】
また、本実施形態に係る画像処理装置100は、撮像機能を有する撮像装置であるものとして説明を行うが、撮像機能を有さない、外部の撮像装置(不図示)と接続する画像処理装置であるものとしてもよい。その場合、画像処理装置100は、撮像を行う代わりに外部から画像を取得し、後述するメモリ140に格納するものとする。
【0016】
画像処理装置100は、画像の撮像を行う機能部として、レンズ100、レンズ制御部111、画像処理装置120、及び撮像制御部121を備える。画像処理装置100は、外部から入射した光束を、レンズ110を通して撮像素子120に結像させる。レンズ110は、不図示のズームレンズ群、フォーカスレンズ群、及びアイリス機構などによって構成されるレンズであり、レンズ制御部111によって制御される。また、画像処理装置100は、撮像素子120において露光する蓄積時間を変更可能であり、撮像素子120から読みだした撮影映像にゲインを適用することができる。撮像素子120のこれらの機能は、撮像制御部121によって制御される。
【0017】
また、画像処理装置100は、CPU130、メモリ140、操作入力部150、焦点検出部160、画像信号処理部170、映像出力部180、及び表示部190を備える。CPU130は、メモリ140に格納されているプログラム及び各種データに従った処理を実行する中央処理装置であり、後述する各種処理を実行可能である。CPU130は、バス131を通して撮像制御部121及びレンズ制御部111と接続され、レンズ110並びに撮像素子120をリアルタイム制御することができる。撮像素子120で露光された撮影映像は、バス131を経由してメモリ140に格納される。メモリ140は、ROM又はRAMなどのストレージであり、処理に必要なプログラム及びデータを格納する。
【0018】
操作入力部150は、不図示のフォーカスデマンド、ボリューム、及びスイッチなどを備え、ユーザの入力を取得する。操作入力部150は、ユーザの入力に応じて、レンズ110の操作の実行、又は撮像素子120の露光時間若しくはゲインなどの変更など、画像処理装置100の各種動作指示を行うことができる。操作入力部150により入力された操作信号はCPU130によって処理され、撮像制御部121又はレンズ制御部111で処理される命令や制御信号に変換される。
【0019】
焦点検出部160は、メモリ140に格納された撮影映像から焦点検出を行う。画像信号処理部170は、メモリ140に格納された映像の読み書きを行い、画像の現像処理、後述するNR処理、又は画像をユーザインタフェース(以下、UI)に表示するためのUI画像生成処理などを行い、映像を再びメモリ140へ格納する。
【0020】
映像出力部180は、画像信号処理部170によって処理されメモリ140に格納された映像を画像処理装置100外部へ出力する。映像出力部180から出力される出力映像信号は画像処理装置100が備える不図示のHDMI(登録商標)端子又はSDI端子により外部に出力される。表示部190は、画像処理装置100が備える不図示のパネル又はビューファインダーなどのディスプレイに各種表示を行う。本実施形態に係る表示部190は、例えば前述の出力映像信号により示される映像にUI画像を重畳して表示することができる。
【0021】
本実施形態に係る画像処理装置100のユーザは、表示部190の映像及びUI画像を見ながら、AF及びマニュアルフォーカス(以下MF)による被写体へのピント調節を行って撮像する。ユーザは、AFを行う際には前述の操作入力部150を用いたスイッチ操作によりAFを実行することができる。UI画像としては、後述するMFのためのアシスト画像(アシストUI)が表示される。
【0022】
なお、図1では、各機能部が機能ごとに構成要素として分けて示しされているが、これらは1つ又は複数のASIC若しくはプログラマブルロジックアレイ(PLA)等のハードウェアによって実現されてもよい。また本実施形態に係る画像処理装置100による処理は、CPU又はMPU等のプログラマブルプロセッサがソフトウェアを実行することにより実現されてもよい。
【0023】
次に、画像処理装置100のCPU130が行うAF処理の一例について、図2のフローチャートを参照して説明する。本実施形態においては、画像処理装置100に電源が投入されるとCPU130にメモリ140からコンピュータプログラムが読み出され、図2のS100から順番に処理が実行される。なお、図2のS190までの処理が実行されると再びS110からのループ処理が開始されることになるが、S110からS190までの処理は、処理対象として入力される映像の1フレームごとに行われるものとして説明する。
【0024】
S100でCPU130は、画像処理装置100の初期化処理を行う。S100のサブルーチンを図3に示す。S100に係る処理としては、一般的な撮像装置において行われる公知の初期設定処理を任意に採用することが可能であり、図3において示される処理は一例である。
【0025】
図3は、S100で行われる画像処理装置100の初期化処理の詳細を説明するための図である。S101でCPU130は、入出力の初期化処理を実行する。ここでは、CPU130は、画像処理装置100における入出力の準備のため、操作入力部150、映像出力部180、又は表示部190などの初期化を行う。S102でCPU130は、撮像の初期化処理を行う。ここでは、CPU130は、撮像素子120及び撮像制御部121の初期化を行い、撮像素子120が露光可能な状態にする。
【0026】
S103でCPU130は、レンズの初期化処理を行う。ここでは、CPU130は、レンズ110及びレンズ制御部111の初期化を行い、操作入力部150によるレンズ操作又は後述するAFによるレンズ制御処理を実行可能な状態にする。S104でCPU130は、NRの初期化処理を行う。ここでは、CPU130は、画像信号処理部170で実行されるNR処理を実行するための初期設定として、予め事前学習された学習済みNNのパラメータを読み出す。
【0027】
ここで、画像信号処理部170に読み出されるNNについて、図4を参照して説明する。図4は入力画像に対するNNの出力を説明するための図である。図4においては、NNとして畳み込みNN(以降、CNNとする)を用いる場合について説明を行うが、同様の処理が可能なのであればこれに限定されるわけではない。NNとしては、例えば、GAN(Generative Adversarial Network)などが用いられてもよく、スキップコネクションを有するNNが用いられてもよい。またNNは、RNN(Recurrent Neural Network)などのように再帰型であってもよい。
【0028】
図4において、入力画像201はNNに入力する画像又は後述の特徴マップを表す。演算202は畳み込み演算を表す。畳み込み行列203は、入力画像201に対して畳み込み演算を行うフィルタである。バイアス204は、入力画像201と畳み込み行列203との畳み込み演算202によって出力された結果に加算される値である。特徴マップ205は、バイアス204が加算された後の畳み込み演算結果である。図4に示す各ニューロン、中間層、及びチャネル数は一例であり、ニューロン、層の数、又はニューロン間の結合の数若しくは重みなどは、この例に限定されるものではない。また、図4に示したNNがFPGA又はASICなどに実装される際には、ニューロン間の結合若しくは重みが削減されてもよい。
【0029】
CNNでは、入力画像に対し、あるフィルタによって畳み込み演算を実行することで、入力画像の特徴マップが得られる。本実施形態においては、フィルタの大きさは任意に設定可能である。次の層では、前層の特徴マップに対し、別のフィルタによる畳み込み演算を実行することで、異なる特徴マップが得られる。また各層では、入力信号をフィルタと掛け合わせ、バイアスとの和が算出される。次いで、算出された値に対して活性化関数が適用されることにより、各ニューロンにおける出力信号が得られる。ここでは、各層における重み及びバイアスがNNパラメータと呼ばれ、学習ではその値(ネットワークパラメータ)を更新する処理が行われる。また活性化関数の例としては、例えばシグモイド関数又はReLU関数などを用いることが可能であるが、とくにこのように限定されるわけではない。本実施形態に係るCPU130は、例えば以下の式(1)に示すLeaky ReLU関数を活性化関数として用いることができる。なお、式(1)において、maxは、引数のうち最大値を出力する関数を表す。
f(x)=max(x,x×0.2) 式(1)
【0030】
このNNパラメータを得るための事前学習では、生徒画像として画像処理装置100及び撮像素子120のノイズ特性を有する画像を、教師画像として対応する生徒画像のノイズが無い画像を用いて、これらをペアにした学習を実施する。すなわち、ノイズ特性を有する生徒画像を入力としてノイズを有しない教師画像を出力できるよう学習を行い、NRを実現する。
【0031】
本実施形態に係る画像処理装置100は、撮像画像から、空間周波数に基づいて、アテンション層を用いたアテンション機構による推論を行うNNにより用いられるアテンションマップを生成する。次いで画像処理装置100は、撮像画像とアテンションマップとに基づいて画像からノイズが低減された画像を生成するよう学習済みのNNにより、入力画像からノイズが低減された推論画像を出力する。ここでは、空間周波数が高いと判定される高周波領域外の領域に着目するようにアテンションマップ(マスク)が生成され、高周波領域外の領域に対してNRによるノイズの低減率がより向上するようなNNの学習が行われている。以下においては、そのようなアテンション機構による推論を行うNNの例について説明を行うが、この構成は一例であり、公知のアテンション(注意機構)手法により、注目領域へのNRによるノイズの低減量を強化できるのであれば以下の構成に限定されるわけではない。アテンションマップとしては、例えば、撮像画像における特定の空間周波数を有する領域(高周波領域を除いた領域)を示すマップが生成される。換言すれば、所定の周波数よりも小さい空間周波数を有する領域を示すマップが生成される。
【0032】
前述の特徴マップ205は入力映像のノイズについての特徴を有するものであり、これに別の特徴マップ(アテンションマップ)を畳み込むことにより、ノイズに関する学習に加え、着目領域を設定した学習を行うことができる。例えば、入力画像201を、色ごとにチャンネルとして分けたものを入力画像301とし、中間層302を入力画像301をチャンネル方向に平均をとる層、中間層303を式(1)で複数回畳み込みを行う中間層とする。続いて、アテンション層304を、出力チャンネルが1となるように畳み込みを行う層とする。本実施形態に係るアテンション層304は、入力画像中の被写体の高周波成分を除くノイズ領域に特徴量が出現する中間層である。このアテンション層304を上述の特徴マップ205と一緒に畳み込むことで、入力画像201又は入力画像301のうち、空間周波数が高周波な領域を除いた領域に着目してNRを実行するNNを作成することができる。したがって、被写体の存在する領域を高周波領域として想定した上で高周波領域外に重点的にNRを行い、被写体外の領域のノイズの低減量を向上させることができる。また、高周波領域外に対して重点的をNR行っているため、NNを用いたNRの弊害である高周波領域の平坦化(ひいては画像のコントラストの低下)を防ぐことができる。なお、本実施形態に係るアテンション層304は本NN内に複数構成されるものとする。
【0033】
図3の説明に戻る。S105でCPU130は、画像信号処理部170による画像信号処理の初期化処理を行う。画像信号処理部170は、S104のNRの初期化処理に加え、ホワイトバランス処理又は現像処理などを行うための初期化処理を実施する。S106でCPU130は、後述する焦点検出処理で用いる合焦フラグを初期化(OFFに)する。S106を実行したあとはサブルーチンS100が終了し、処理は図2のS110へ進む。
【0034】
S110でCPU130は撮像処理を行う。S110のサブルーチンを図5に示す。S110に係る処理としては、一般的な撮像装置において行われる公知の撮像処理を任意に採用することが可能であり、図5において示される処理は一例である。
【0035】
S111でCPU130は、操作入力部150を介して入力された操作に応じて、レンズ制御部111を通じてレンズ110のアイリス制御を行う。S112でCPU130は、撮像制御部121を経由して撮像素子120から読み出された映像信号に適用するゲインの制御を行う。S113でCPU130は、撮像制御部121を通じて撮像素子120のシャッタ制御、すなわち露光制御を行う。S114でCPU130は、撮像素子120から映像信号を読み出し、読み出した映像信号を画像データとしてメモリ140に格納する。
【0036】
図13(a)及び(b)には、本実施形態に係る映像信号の例が示されている。図13(a)は、本実施形態に係る撮像環境として想定される低照度環境において、通常のカメラ設定に相当する低いゲインで撮像された画像を示している。図13(b)は、図13(a)のゲインよりも高いゲインによって映像信号の輝度が増幅された画像であり、ノイズを多く含んでいる。S114を実行した後はサブルーチンS110が終了し、処理は図2のS120へ進む。なお、図5に示す処理は一般的な撮像技術により可能であるため、詳細な説明は省略する。また、同様にゲイン制御を伴う撮像処理を行うのであれば、S110における撮像処理が異なる態様で行われてもよい。
【0037】
S120でCPU130はNR処理を行う。S120のサブルーチンを図6に示す。S121でCPU130は、S112にて撮像制御部121で制御されたゲインに応じた学習済みNNパラメータを設定する。ここでは、画像信号処理部170に読み出された前述のNNが、入力映像信号のゲイン値に応じて学習された適切なNNパラメータを有するように、NNパラメータの設定が行われる。
【0038】
S122でCPU130は、NNによる推論処理、すなわちNR処理を行うための入力画像を取得する。ここでは、CPU130は、入力画像をメモリ140から読み出すことにより取得する。S123でCPU130は、入力画像に対する推論処理を実行する。前述の通り、本実施形態に係る画像処理装置100が行う推論処理においては、NNによりノイズ低減された推論画像とアテンション層304とが得られ、それぞれメモリ140に格納される。図13(c)は、ノイズを多く含んだ図13(b)の画像を入力として、NNによる推論処理によりノイズが低減された画像を示している。
【0039】
S124でCPU130は、メモリ140に格納されているアテンション層304に相当する中間処理画像を読みだす。S125でCPU130は、メモリ140に格納されている推論画像をメモリ140から読み出し、サブルーチンS120を終了して処理を図2のS130に進める。
【0040】
S130でCPU130は、アテンションマップ処理を行う。本実施形態に係るアテンションマップ処理とは、本実施形態に係るNNに含まれる複数のアテンション層304により、高周波領域に特徴が出現している中間層を抽出する処理である。S130のサブルーチンを図7に示す。
【0041】
S131でCPU130は、複数のアテンション層304のうちある1層を処理対象とするためのインデックスiを0に初期化する。後続するS132からS138までの処理はループ処理であり、インデックスiに応じてアテンション層304が順に参照されていく。S132でCPU130は、アテンション層304をメモリ140から読み出す。CPU130は、S133にて読みだしたアテンション層304の画像に公知のヒストグラム処理を実施し、S134にて任意の閾値以上に分布があるか否かを判定する。S134で用いる閾値は、NNの事前学習時など事前にユーザによって予め設定が可能であり、ここでは高周波領域が存在するか否かの判定に用いられる値である。
【0042】
S134において任意の閾値以上に分布がある場合には、アテンション層304に高周波領域を含む特徴が出現していると判定して処理をS135へ進め、そうでなければ高周波領域の特徴が出現していないと判定して処理をS137へ進める。図13(d)はS134が偽(No)であった場合のアテンション層304であり、図13(e)はS134が真(Yes)であった場合のアテンション層304である。図13(e)の画像においては、被写体(ここでは人)のエッジ部分及び顔部分の輝度レベルが低く(暗く)、背景の輝度レベルが高く(明るく)なっている。本実施形態においては、輝度レベルが高い領域は背景と判断され、輝度レベルが低い領域は高周波領域を含む特徴が出現していると判断される。本実施形態に係る画像処理装置100は、高周波領域を含む特徴が出現していると判断された領域に対して、推論処理によるノイズの低減量を抑えることにより、NRにより推論画像がぼやけてしまうことを抑制することができる。また、高周波領域外の領域に着目してNRを行うことにより、そのような高周波領域外の領域におけるノイズの低減量を向上させ、低照度環境でのノイズの多い映像においてもフォーカス精度を向上させることができる。
【0043】
S135でCPU130は、処理対象のアテンション層304に対して輝度反転処理及び閾値処理を行い、高周波マップを取得する。ここでは、元々輝度が低い領域は高周波領域であるため、輝度反転処理により、高周波領域は輝度レベルが高い領域に、低周波領域(NRが強くかかる領域)は輝度レベルが低い領域に変換されたアテンション層304の画像が得られる。この輝度反転処理後の画像に所定の閾値処理を行うことにより、高周波マップとしての図13(f)を得る。本実施形態に係る高周波マップは、ノイズの多い画像の中から被写体の高周波成分が抽出された領域を示す画像となる。S136でCPU130は、S135で得られた高周波マップをメモリ140に格納する。
【0044】
S137でCPU130は、アテンション層304を参照するインデックスiをインクリメントする。S138でCPU130は、複数のアテンション層304をすべて処理対象としたか否かを判定し、すべてを処理対象としていない場合は処理をS132に戻し、すべて処理対象としている場合はサブルーチンS130を終了して処理を図2のS140へ進める。
【0045】
S140でCPU130は、操作入力部150への入力に基づいて、画像処理装置100がAF操作中であるか否かの判定を行う。ここでは、スイッチ操作によりAF操作のON/OFFが行われるものとする。AF操作中である場合には処理がS150へと進み、そうでない場合には処理はS170へ進む。
【0046】
本実施形態に係る画像処理装置100は、画像と、生成したアテンションマップとに基づいて、撮像の焦点の調節のための情報を生成する。例えば画像処理装置100は、AFを行う場合には、高周波マップに基づいて、撮像画像中のAFによる焦点検出を行う部分領域(焦点検出領域)を設定し、設定した焦点検出領域からAFを行うことができる。また例えば画像処理装置100は、MFを行う場合には、高周波マップに基づいて、NR後の推論画像に重畳することにより高周波部分を強調するアシスト画像を生成することができる。ここで、アシスト画像は、例えば高周波部分を示す領域に所定の着色を行った画像であるものとする。この所定の着色の色は任意に設定が可能であり、またアシスト画像の透明度も任意に設定が可能である。以下、そのような焦点の調節のための情報を用いたフォーカス処理について、AFに関してはS150~S160で、MFに関してはS170~S180で説明を行う。
【0047】
S150でCPU130は焦点検出処理を行う。S150のサブルーチンを図8に示す。本実施形態に係る画像処理装置100は、例えば、高周波マップの重心位置を中心とした所定の領域を焦点検出領域として設定することができる。高周波マップにおいては被写体であることが想定される領域が高周波領域で示されているため、このように焦点検出領域を設定することにより、AFを行う被写体を効率的に探索しAFの精度を向上させることができる。なお、以下においては焦点検出領域からのコントラスト方式によるAF処理について説明を行うが、これは一例であり、焦点検出領域におけるAFを行うことができるのであればこのような処理に限定するわけではない。
【0048】
S151でCPU130は、S136で格納した高周波マップの重心位置を検出する。S152でCPU130は、S150で検出した重心位置に基づいて設定される所定の領域を、焦点検出領域として設定する。ここでは、重心位置を中心とする所定の領域(例えば、円形又は矩形の領域)を焦点検出領域とする。この焦点検出領域のサイズは任意に設定が可能である。
【0049】
S153でCPU130は、設定された焦点検出領域に対応したS125で得た推論画像の高周波成分からコントラスト評価値を算出する。S154でCPU130は、算出したコントラスト評価値をフレーム方向で見て、公知のコントラスト方式による合焦の判定(山登り判定)を行う。以下、単に「評価値」と表現する場合、このようなコントラスト評価値を指すものとする。
【0050】
図9は、山登り判定における評価値の軌跡の例を示す図である。図9において、評価値V(k)は現在のフレームT(k)における評価値であり、評価値V(k-1)は1フレーム前(T(k-1))における評価値、評価値V(k-2)は2フレーム前(T(k-2))である。図9(a)のように、評価値が時間経過に対して上昇傾向にある場合は合焦に向かっていると判断できる。また、図9(b)のように、観測範囲(ここではT(k-2)~T(k))においてコントラスト値の頂点が(ここではT(k-1)において)得られた場合には、山登り判定により合焦が行われていると判定される。図9(c)のように評価値が時間経過に対して減少傾向にある場合は合焦から逆方向にフォーカスが動いていると判断できる。
【0051】
S154において合焦が行われている(山登りが生じた)と判定された場合には処理がS155へ進み、合焦フラグがONになる。次いでS156でCPU130は、山登りが生じた頂点であるフォーカス位置に戻るためにフォーカス方向を反転させるよう設定を行い、S150を終了して処理をS160へと進める。
【0052】
S154において合焦が行われていない(山登りが生じていない)と判定された場合には処理がS157に進み、合焦フラグがOFFとなる。S158でCPU130は、評価値が時間経過に対して減少傾向にあるか、例えば図9(c)で示したような状態であるか否かを判定する。減少傾向にある場合は、CPU130は、処理をS159へ進め、フォーカス方向を反転させるよう設定を行い、S150を終了して処理をS160へと進める。減少傾向にない場合には、CPU130は、S150を終了して処理をS160へと進める。
【0053】
S160でCPU130は、AFの目標値を設定する。ここでは、AFの目標値とは、AFにおけるフォーカスレンズの次の制御位置を示す値であるものとする。S160のサブルーチンを図10に示す。S161でCPU130は、設定されている合焦フラグがONかOFFかを判定し、ONである場合は処理をS162へ進め、OFFである場合は処理をS163に進める。S162でCPU130は、図9(b)で検出したV(k-1)に相当する評価値のピーク位置をAF目標位置すなわちフォーカスレンズの次の制御目標位置として設定し、S160を終了し処理をS190へと進める。
【0054】
S163でCPU130は、S153で検出した評価値が閾値αより大きいか否かを判定し、大きい場合には処理をS164へと進め、そうでない場合には処理をS165へと進める。ここで、αは任意の値として設定することができる。
【0055】
S164でCPU130は、AF目標位置をフォーカスステップ量Aと設定する。また、S165でCPU130は、AF目標位置をフォーカスステップ量Bと設定する。ここで、A及びBの値は任意に設定可能であるが、S164では評価値がαより大きいことから合焦位置に近いと判断される一方で、S165では逆に合焦位置から遠いと判断されることから、A<Bとなるように設定されるものとする。S164又はS165が終了した場合、S160は終了し、処理がS190へと進む。S190でCPU130は、設定されたAF目標位置へとフォーカスレンズの制御を行う。
【0056】
S140においてAF操作中でないと判定された場合の処理であるS170で、CPU130は、MFのアシスト画像の重畳処理を行う。S170のサブルーチンを図11に示す。
【0057】
S171でCPU130は、S136で格納した高周波マップをメモリ140から読み出す。S172でCPU130は、S125で格納した推論画像をメモリ140から読み出す。S173でCPU130は、S171で読み出した高周波マップをS172で読み出した推論画像に重畳する処理を画像信号処理部170により行い、重畳後の画像(重畳画像)を表示部190で表示する。なおこの重畳画像は、表示部190ではなく、映像出力部180と介して画像処理装置100外部に出力され、外部装置上で表示されてもよい。S173が終了するとS170の処理は終了し、処理がS180へと進む。
【0058】
図13(g)は高周波マップを推論画像に重畳した重畳画像の一例を示している。図13(g)においては、図13(c)の推論画像に図13(e)の高周波マップが重畳されたことで、被写体である人のエッジが強調され、ユーザがよりピント状況を把握しやすい画像が得られている。
【0059】
S180でCPU130は、MFの操作量を設定する。S180のサブルーチンを図12に示す。S181でCPU130は、操作入力部150であるフォーカスデマンドへのユーザによる操作量を取得する。S182でCPU130は、取得した操作量から現在フォーカスレンズ位置に対する差分量であるフォーカスステップ量Cを、次回のフォーカスレンズ制御目標位置(AF目標位置)として設定する。フォーカスステップ量Cは任意の値として設定可能であるが、ユーザのフォーカスデマンドの操作によりピントを合わせられるようにするために、フォーカスレンズを被写界深度よりも十分小さな単位量で制御できることが望ましい。また、フォーカスデマンドの操作量からフォーカスステップ量Cへ変換する際の敏感度は、単位時間あたりの操作量又は操作時間などによって設定が可能であるものとしてもよい。S182が終了すると図2のサブルーチンS180が終了し、処理がS190へと進み設定されたAF目標位置へとフォーカスレンズの制御が行われる。S190が実行されると処理はS110に戻り、ループ処理が繰り返し実行される。
【0060】
このような処理によれば、アテンション層を備える機械学習モデルによりノイズを低減した推論画像を出力することができる。また、アテンション層のアテンションマップに基づいて、撮像装置の焦点の調節のための情報を生成することができる。特にAFを行う場合には、NNにより推論された出力画像のうち、推論の過程で抽出されたアテンションマップに基づく高周波予測領域のコントラスト情報を用いることによって、低照度環境においてノイズが大きい画像であっても、コントラスト方式によるオートフォーカスを実行することができる。
【0061】
[実施形態2]
以下、実施形態2に係る画像処理装置101について説明を行う。実施形態1においては、画像処理装置100は、AF処理を行う際、コントラスト方式によるAFを行うものとして説明を行った。本実施形態に係る画像処理装置101は、実施形態1に係るNNと同様のNNを用いてNR処理を行った推論画像から、位相差方式のAF処理によりAFを行う。
【0062】
図14は、本実施形態に係る画像処理装置101のハードウェア構成の一例を示すブロック図である。本実施形態に係る画像処理装置101は、位相差センサ122を追加で有することを除き基本的に実施形態1のものと同様の構成を有し、同様の処理を行うことが可能である。以下、画像処理装置の実施形態1と異なる構成及び実行する処理について説明を行う。
【0063】
本実施形態に係る画像処理装置101は、撮像素子120がマイクロレンズを備え、外部から入射した光束を右目用と左目用との二像に分岐させ、光学的に所定の基線長となる位置に配置された右目用画素及び左目用画素に二像結像する画素構造を有する。この構造により、右目用画素及び左目用画素からの信号を、撮影映像信号として使用することができ、かつ、焦点検出用信号としても使用することができる。被写体に合焦している場合は二像が一致し、非合焦の場合は二像間でずれが生じる。本実施形態においては、このずれ量を計算する既知の相関演算によって位相差が算出され、AF処理が行われる。位相差方式のAF処理については、公知の技術により行うことが可能であり、詳細な説明は省略する。
【0064】
本実施形態に係る画像処理装置101は、レンズ110のズームレンズ及びアイリス、並びにフォーカスレンズの位置に基づくレンズ個別の敏感度演算や敏感度テーブルなどにより、現在のフォーカスレンズ位置に対する合焦位置までの差分であるデフォーカス量を求めることができる。このような二像結像した撮像素子120から得られる撮像信号としては、二像が加算された映像信号に加え、いずれか一方の片目の像が映像信号として出力されるものがある。画像処理装置101は、二像が加算された映像信号と片目の像の映像信号との差分を取ることにより焦点検出用にもう一方の映像信号を得ることができる。
【0065】
なお、画像処理装置101は、位相差方式による像信号が得られるものに加え、位相差センサ122など、撮像素子120とは別の焦点検出用センサを用いて各処理を実行することができる。位相差センサ122は、不図示の分岐光学系により、撮像素子120と光学的に等価な位置に配置される。画像処理装置101は、前述した二像結像可能な構成においても、位相差センサ122を用いる構成においても、二像に分岐した焦点検出用画素を用いた位相差方式のAFを行うものとして以下の説明を行う。
【0066】
次に、画像処理装置101のCPU130が行う処理について、図15のフローチャートを参照して説明する。図15に示す処理は、実施形態1の図2に示す処理と同様に開始可能であり、S100から順番に処理が実行される。なお、図15のS190までの処理が実行されると再びS210からのループ処理が開始されることになるが、S210からS190までの処理は、処理対象として入力される映像の1フレームごとに行われるものとして説明する。
【0067】
S100でCPU130は、実施形態1のS100と同様に画像処理装置101の初期化処理を行い、処理をS210へと進める。
【0068】
S210でCPU130は撮像処理を行う。S210のサブルーチンを図16に示す。S210に係る処理としては、一般的な撮像装置において行われる公知の撮像処理を任意に採用することが可能であり、図16において示される処理は一例である。図16に係る処理は、S114に続きさらにS215が行われることを除き図5の処理と同様に行われるため、重複する説明は省略する。
【0069】
S215でCPU130は、S114で読み出された映像信号から位相差演算用の二像を生成しメモリ140に格納する。S215実行後はサブルーチンS210は終了し、処理は図15のS220へ進む。
【0070】
S220でCPU130はNR処理を行う。S220のサブルーチンを図17に示す。図17に係る処理は、S125に続きさらにS226が行われることを除き図6の処理と同様に行われるため、重複する説明は省略する。なお、図17においては、S121~S226の処理が、各像の映像信号1つずつを対象としたループ処理として行われる。S226でCPU130は、二像の映像信号に対しそれぞれ推論画像を取得するため、各像の映像信号の推論を完了したか判定する。各像の映像信号の推論が完了している場合にはサブルーチンS220が終了して処理がS230に進み、そうでなければ、残りの映像信号の推論を実施するために処理がS121からループする。
【0071】
S230でCPU130は、アテンションマップ処理を行う。S230のサブルーチンを図18に示す。図18に係る処理は、S135~S136に代わりS235~S236が行われ、S138に続きS239が行われることを除き図7の処理と同様に行われるため、重複する説明は省略する。なお、図18においては、S131~S239の処理が、各像の映像信号1つずつを対象としたループ処理として行われる。
【0072】
S134において任意の閾値以上に分布がある場合には、アテンション層304に高周波領域を含む特徴が出現していると判定して処理をS235へ進め、そうでなければ高周波領域の特徴が出現していないと判定して処理をS137へ進める。S235でCPU130は、処理対象のアテンション層304に対して輝度反転及びエッジフィルタ処理を実行し、高周波マップを取得する。ここでは、元々輝度が低い領域は高周波領域であるため、輝度反転処理により、高周波領域は輝度レベルが高い領域に、低周波領域(NRが強くかかる領域)は輝度レベルが低い領域に変換されたアテンション層304の画像が得られる。さらにCPU130は、エッジを抽出するような既知のフィルタ演算処理をアテンション層304の画像に実行することによって、エッジマップとして図22に示すマップを得ることができる。
【0073】
実施形態1においては、高周波領域を得るための閾値処理により図13(f)の高周波マップが得られたが、本実施形態に係る図22のエッジマップは、繰り返しのパターン領域を高周波領域から除くためにエッジが抽出されている。一般的に位相差方式のAFでは相関演算時に繰り返しのパターンがあると偽合焦となるような相関量が演算されてしまう場合があるため、ここではエッジ領域のみを抽出することにより、そのような偽合焦の発生を抑制することができる。エッジ領域を抽出するための前述のエッジフィルタ処理に適用する係数やフィルタサイズは、相関演算に用いるウィンドウサイズに応じて、ユーザが所望の値に設定することが可能である。
【0074】
S235において、ノイズの多い画像の中から被写体のエッジ成分が抽出された領域を示す画像が得られる。S236でCPU130は、S235で得られたエッジマップをメモリ140に格納する。S137及びS138は実施例1と同様の処理を実行し、S138においてすべてのアテンション層304が処理対象とされたと判定された場合には処理がS239へと進む。図17と同様に、図18の処理においては二像の映像信号に対しそれぞれエッジマップが取得されるため、S239でCPU130は、各像の映像信号のエッジマップの取得を完了したかを判定する。完了している場合にはサブルーチンS230を終了して処理がS240に進み、そうでない場合には、残りの映像信号の推論を実施するためにS131から処理がループする。
【0075】
S250でCPU130は焦点検出処理を行う。S250のサブルーチンを図19に示す。なお、以下においては焦点検出領域からの位相差方式によるAF処理について説明を行うが、これは一例であり、焦点検出領域におけるAFを行うことができるのであればこのような処理に限定するわけではない。
【0076】
S251でCPU130は、エッジマップからエッジが存在する箇所を含む領域を焦点評価領域として設定する。S252でCPU130は、S251で設定した焦点評価領域において既知の相関演算により位相差量を算出する。S253でCPU130は、算出した位相差量及び敏感度演算により、現在のフォーカスレンズ位置からのデフォーカス量を算出する。S254でCPU130は、デフォーカス量の絶対値が所定の閾値βよりも小さいか否かを判定する。この閾値βは、閾値β以下となる条件が合焦中と判定できる量であり、被写界深度及びレンズ110の光学条件から定まる敏感度により異なるものとする。本実施形態に係る閾値βは例えば被写界深度の1/2となる量とすることができる。またCPU130は、デフォーカス量の符号により前ピンか後ピンかを判断することができる。
【0077】
デフォーカス量の絶対値が閾値βよりも小さい場合には、合焦であると判断して処理がS155へ進み、合焦フラグがONとなる。デフォーカス量の絶対値が閾値β以上である場合には、非合焦であると判断して処理がS157へ進み、合焦フラグがOFFとなる。S155又はS157の処理が完了すると図19のサブルーチンは終了し、処理はS140へと進む。
【0078】
S140でCPU130は、操作入力部150への入力に基づいて、画像処理装置100がAF操作中であるか否かの判定を行う。ここでは、スイッチ操作によりAF操作のON/OFFが行われるものとする。AF操作中である場合には処理がS260へと進み、そうでない場合には処理はS270へ進む。
【0079】
S260でCPU130は、AFの目標値を設定する。S260のサブルーチンを図20に示す。S161でCPU130は、図19のS155又はS157で設定された合焦フラグがONであるかを判定する。ONである場合は図20のサブルーチンは終了し、処理がS190へと進む。OFFである場合は処理がS262へと進む。S262でCPU130は、S253で算出されたデフォーカス量をフォーカス駆動量として設定し、図20のサブルーチンを終了して処理をS190へと進める。
【0080】
S270でCPU130は、MFアシストUI(アシスト画像)の表示を行う。S270のサブルーチンを図21に示す。S271でCPU130は、S253で算出されたデフォーカス量を取得する。S254で説明した通り、デフォーカス量は正負の値を取り、デフォーカス量の符号に基づいて現在のフォーカス位置が合焦位置よりも前ピンか後ピンかの判定を行うことができる。さらに、デフォーカス量の絶対値が大きければ大きいほど、合焦位置から遠い、すなわち大デフォーカス状態であることがわかる。
【0081】
S272でCPU130は、ユーザのMF操作を補助するためのアシスト画像を生成する。本実施形態に係るアシスト画像は、例えば、MF操作による合焦までのフォーカスレンズの移動量を示す情報を含んでいてもよい。そのようなアシスト画像については既知の表示形態により表示を行うことが可能であり、例えば合焦までの操作量を表示してもよく、合焦状態であることを〇又は±0などにより表示してもよい。また、アシスト画像として、前ピンの操作量を+、後ピンの操作量を-などの符号とともに表示して良い。また前ピンでかつ大デフォーカスの場合は++、後ピンで大デフォーカスの場合は--などの符号とともに操作量が表示されてもよい。
【0082】
S273でCPU130は、S272で生成したアシスト画像を撮影本線映像に重畳し、図14の表示部190へ表示する、又は映像出力部180から外部装置に出力する。S273の処理が終わると、図21のサブルーチンが終了し、処理はS180へと進む。S180~S190は実施形態1における処理と同様である。S190においては、S260で設定したフォーカス駆動量を用いてフォーカス駆動が行われる場合がある。
【0083】
このような処理によれば、NNにより推論された出力画像のうち、推論の過程で抽出されたアテンションマップに基づく高周波予測領域からエッジマップを抽出し、その位相差情報を用いることによって、低照度環境においてノイズが大きい画像であっても、位相差方式によるオートフォーカスを実行することができる。
【0084】
本明細書の開示は、以下の画像処理装置、情報処理方法、及びプログラムを含む。
【0085】
(項目1)
入力された第1の画像から、特定の空間周波数を有する領域を示すアテンションマップを生成する第1の生成手段と、
前記第1の画像と前記アテンションマップとに基づいて、学習済みの機械学習モデルにより前記第1の画像からノイズが低減された第2の画像を出力する出力手段と、
前記第2の画像と前記アテンションマップとに基づいて、撮像装置の焦点を調節するための情報を生成する第2の生成手段と、
を備えることを特徴とする、画像処理装置。
(項目2)
前記第2の生成手段は、前記撮像装置の焦点を調節するための情報として、オートフォーカスにおける焦点検出を行う、前記第2の画像中の第1の部分領域を示す情報を生成することを特徴とする、項目1に記載の画像処理装置。
(項目3)
前記第1の画像から前記空間周波数に基づいて第2の部分領域を抽出する抽出手段をさらに備え、
前記第1の生成手段は、前記アテンションマップとして、前記第1の画像における前記第2の部分領域を示すマップを生成し、
前記第2の生成手段は、前記アテンションマップの前記第2の部分領域に基づいて前記第1の部分領域を示す情報を生成することを特徴とする、項目2に記載の画像処理装置。
(項目4)
前記第1の部分領域は、前記アテンションマップの前記第2の部分領域の重心位置を中心とする、所定の形状の領域であることを特徴とする、項目3に記載の画像処理装置。
(項目5)
前記第2の画像の前記第1の部分領域から、コントラスト方式によりオートフォーカスの焦点位置を決定する第1の決定手段をさらに備えることを特徴とする、項目2又は3に記載の画像処理装置。
(項目6)
前記第2の画像の前記第1の部分領域から、位相差方式によりオートフォーカスの焦点位置を決定する第2の決定手段をさらに備えることを特徴とする、項目2又は3に記載の画像処理装置。
(項目7)
前記第2の生成手段は、前記撮像装置による焦点調節に用いる情報として、マニュアルフォーカス操作中において第2の画像上に重畳表示する、前記第2の部分領域を示す画像を生成することを特徴とする、項目3に記載の画像処理装置。
(項目8)
前記第2の生成手段は、前記撮像装置による焦点調節に用いる情報として、合焦までのフォーカスレンズの移動量を示す情報を生成することを特徴とする、項目1に記載の画像処理装置。
(項目9)
前記第2の生成手段は、前記撮像装置の焦点の調節のための情報として、前記撮像装置が合焦しているか否かを示す情報を生成することを特徴とする、項目1に記載の画像処理装置。
(項目10)
第1の画像を撮像する撮像手段と、
前記第1の画像を入力として、特定の空間周波数を有する領域を示すアテンションマップを生成する第1の生成手段と、
前記第1の画像と前記アテンションマップとに基づいて学習済みの機械学習モデルにより、前記第1の画像からノイズが低減された第2の画像を出力する出力手段と、
前記第2の画像と前記アテンションマップとに基づいて、撮像における焦点を調節するための情報を生成する第2の生成手段と、
を備えることを特徴とする、撮像装置。
(項目11)
前記撮像手段は、外部から入射した光束を二像に分岐させ、前記二像を焦点検出用にそれぞれ結像する画素構造を有し、
前記二像の位相差に基づいて撮像装置のオートフォーカス制御を行う制御部をさらに備えることを特徴とする、項目10に記載の撮像装置。
(項目12)
前記撮像手段による焦点位置の検出を行うセンサと、
前記センサの出力に応じて撮像装置のオートフォーカス制御を行う制御部と、
をさらに備えることを特徴とする、項目10に記載の撮像装置。
(項目13)
撮像における焦点調節に用いる情報を表示する表示手段をさらに備えることを特徴とする、項目10乃至12の何れか一項目に記載の撮像装置。
(項目14)
前記表示手段は、撮像装置の外部装置において前記撮像における焦点の調節のための情報を表示させることをさらに特徴とする、項目13に記載の撮像装置。
(項目15)
入力された第1の画像から、特定の空間周波数を有する領域を示すアテンションマップを生成する処理と、
前記第1の画像と前記アテンションマップとに基づいて、学習済みの機械学習モデルにより、前記第1の画像からノイズが低減された第2の画像を出力する処理と、
前記第2の画像と前記アテンションマップとに基づいて、撮像装置の焦点の調節のための情報を生成する処理と、
を備えることを特徴とする、情報処理方法。
(項目16)
コンピュータを、項目1乃至9の何れか一項目に記載の画像処理装置又は項目10乃至14の何れか一項目に記載の撮像装置の各手段として機能させるためのプログラム。
【0086】
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0087】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0088】
100:画像処理装置、110:レンズ、111:レンズ制御部、120:撮像素子、121:撮像制御部、130:CPU、140:メモリ、150:操作入力部、160:焦点検出部、170:画像信号処理部、180:映像出力部、190:表示部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22