(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025143757
(43)【公開日】2025-10-02
(54)【発明の名称】画像処理装置、及び画像処理システム
(51)【国際特許分類】
G06T 1/00 20060101AFI20250925BHJP
G06T 5/60 20240101ALI20250925BHJP
G06T 3/4015 20240101ALI20250925BHJP
【FI】
G06T1/00 510
G06T5/60
G06T3/4015
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2024043173
(22)【出願日】2024-03-19
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100090273
【弁理士】
【氏名又は名称】國分 孝悦
(72)【発明者】
【氏名】新家 健太
【テーマコード(参考)】
5B057
【Fターム(参考)】
5B057CA01
5B057CA08
5B057CA12
5B057CA16
5B057CB01
5B057CB08
5B057CB12
5B057CB16
5B057CC01
5B057CD07
5B057CE02
5B057CE16
5B057DB02
5B057DB06
5B057DB09
5B057DC40
(57)【要約】
【課題】学習用画像がデモザイク後のものであっても、デモザイクに起因する画質劣化が抑制された教師データを得る。
【解決手段】画像処理装置100は、カラー画像に対し、モザイク処理を施す第1の処理部11と、前記第1の処理部11で処理された画像に対し、第1のデモザイク処理を施す第2の処理部12と、を有し、前記第2の処理部12で処理された画像に基づいて、モデルの学習に用いる教師データを生成する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
カラー画像に対し、モザイク処理を施す第1の処理手段と、
前記第1の処理手段で処理された画像に対し、第1のデモザイク処理を施す第2の処理手段と、
前記第2の処理手段で処理された画像に基づいて、モデルの学習に用いる教師データを生成する第1の生成手段と、
を有することを特徴とする画像処理装置。
【請求項2】
前記モザイク処理は、所定の画素を間引くことで、所定のカラー配列からなる1チャネルの画像を生成する処理であることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記第1の生成手段は、前記第2の処理手段で処理された画像に対し、第1の画像処理を施し、
前記第1の処理手段は、前記カラー画像に対し、モザイク処理を施す前に、前記第1の画像処理を施した画像を前記第1の画像処理前の状態に変換する第2の画像処理を施すことを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記カラー画像は、デモザイク処理された画像であることを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記第1のデモザイク処理は、デモザイク処理に起因する画像劣化を抑制する処理であることを特徴とする請求項1に記載の画像処理装置。
【請求項6】
前記画像劣化は、偽色、モアレ、及びジッパーノイズのうちの少なくとも何れか1つを含むことを特徴とする請求項5に記載の画像処理装置。
【請求項7】
前記教師データを用いて前記モデルの学習を行う学習手段を更に有することを特徴とする請求項1に記載の画像処理装置。
【請求項8】
前記第1の処理手段で処理された画像に対し、前記第1のデモザイク処理とは異なる第2のデモザイク処理を施す第3の処理手段と、
前記第3の処理手段で処理された画像に基づいて、前記モデルの学習に用いる入力画像を生成する第2の生成手段と、
を更に有し、
前記学習手段は、前記入力画像と前記教師データを用いて前記モデルの学習を行うことを特徴とする請求項7に記載の画像処理装置。
【請求項9】
前記第1のデモザイク処理は、深層学習モデルを利用した処理であり、
前記第2のデモザイク処理は、ルールベースの処理であることを特徴とする請求項8に記載の画像処理装置。
【請求項10】
前記第1の生成手段は、前記第2の処理手段で処理された画像に対し、第1の画像処理を施し、
前記第2の生成手段は、前記第3の処理手段で処理された画像に対し、前記第1の画像処理を施し、
前記第1の処理手段は、前記カラー画像に対し、モザイク処理を施す前に、前記第1の画像処理を施した画像を前記第1の画像処理前の状態に変換する第2の画像処理を施すことを特徴とする請求項8に記載の画像処理装置。
【請求項11】
前記第3の処理手段は、前記第2のデモザイク処理を施す前に、前記第1の処理手段で処理された画像に対し、ノイズを付加することを特徴とする請求項8に記載の画像処理装置。
【請求項12】
請求項8に記載の画像処理装置を含む画像処理システムであって、
撮像素子により撮像を行ってモザイク画像を生成する撮像手段と、
前記モザイク画像に対し、前記第2のデモザイク処理と同一の処理を施す第4の処理手段と、
前記第4の処理手段で処理された画像と前記学習手段で学習済みの前記モデルを用いて推論を行う推論手段と、
を有することを特徴とする画像処理システム。
【請求項13】
前記第1のデモザイク処理は、深層学習モデルを利用した処理であり、
前記第2のデモザイク処理は、ルールベースの処理であることを特徴とする請求項12に記載の画像処理システム。
【請求項14】
前記第1の生成手段は、前記第2の処理手段で処理された画像に対し、第1の画像処理を施し、
前記第2の生成手段は、前記第3の処理手段で処理された画像に対し、前記第1の画像処理を施し、
前記第4の処理手段は、前記第2のデモザイク処理と同一の処理を施した画像に対し、前記第1の画像処理と同一の処理を施し、
前記第1の処理手段は、前記カラー画像に対し、モザイク処理を施す前に、前記第1の画像処理を施した画像を前記第1の画像処理前の状態に変換する第2の画像処理を施すことを特徴とする請求項12に記載の画像処理システム。
【請求項15】
カラー画像に対し、モザイク処理を施す第1の処理ステップと、
前記第1の処理ステップで処理された画像に対し、第1のデモザイク処理を施す第2の処理ステップと、
前記第2の処理ステップで処理された画像に基づいて、モデルの学習に用いる教師データを生成する第1の生成ステップと、
を含むことを特徴とする画像処理方法。
【請求項16】
コンピュータを、請求項1に記載の画像処理装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理に関する。
【背景技術】
【0002】
デジタルカメラ等の撮像装置が被写体から色情報を取得する方法として、撮像素子にカラーフィルタをかけ、画素位置によって取得する色を異ならせる単板式が用いられる。単板式では、撮像素子からのRAW画像をRGBの3チャンネルからなるカラー画像へ変換する処理をデモザイクと呼ぶ。デモザイクの課題として、偽色やモアレ、ジッパーノイズといった画質劣化の発生が挙げられる。非特許文献1には、深層学習を利用してデモザイク時の画像劣化を抑制する技術が記載されている。また、近年では深層学習を利用した高性能な画像処理技術が多く提案されている。特許文献1には、教師データ用の画像と、それに人工的にノイズを付与してからデジタルゲインをかけた画像をセットにした学習データを用いて、ノイズ低減を学習する技術が記載されている。このような深層学習を利用した技術では、一般に大量の学習用画像が必要とされる。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
【非特許文献1】M. Gharbi et al,“Deep joint demosaicking and denoising”,[online],[令和6年3月6日検索],<https://groups.csail.mit.edu/graphics/demosaicnet/data/demosaic.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0005】
学習用画像として撮像装置やインターネットを通じて収集された画像には、デモザイクに起因する画質劣化が含まれる。これを教師データとしてモデルの学習に用いると、当該モデルからの出力画像にはデモザイクに起因する画質劣化が含まれてしまう。しかしながら、非特許文献1を含めデモザイク時の画質劣化を抑制する技術では、デモザイク前の画像(RAW画像)を対象としている。一方で学習用画像として収集された画像は通常デモザイク後の画像であるため、非特許文献1を含めデモザイク時の画質劣化を抑制する技術を学習用画像に適用しても、デモザイクに起因する画質劣化が抑制された教師データを得ることはできない。
【0006】
そこで本発明は、学習用画像がデモザイク後のものであっても、デモザイクに起因する画質劣化が抑制された教師データを得ることを目的とする。
【課題を解決するための手段】
【0007】
本発明の画像処理装置は、カラー画像に対し、モザイク処理を施す第1の処理手段と、前記第1の処理手段で処理された画像に対し、第1のデモザイク処理を施す第2の処理手段と、前記第2の処理手段で処理された画像に基づいて、モデルの学習に用いる教師データを生成する第1の生成手段と、を有することを特徴とする。
【発明の効果】
【0008】
本発明によれば、学習用画像がデモザイク後のものであっても、デモザイクに起因する画質劣化が抑制された教師データを得ることができる。
【図面の簡単な説明】
【0009】
【
図3】画像処理装置の実行する処理を示すフローチャートである。
【
図4】画像処理システムの装置構成例を示す図である。
【
図5】システム内の各装置の機能構成例を示す図である。
【
図6A】画像処理システムの実行する処理を示すフローチャートである。
【
図6B】画像処理システムの実行する処理を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明に係る各実施形態を、図面を参照しながら説明する。
【0011】
[実施形態1]
本実施形態では、収集された学習用画像から教師データを生成する方法について説明する。学習用画像は、デモザイク後の画像である。学習用画像には、デモザイクに起因する画質劣化が含まれている。以下、学習用画像を、カラー画像という。本実施形態では、カラー画像に対してモザイク処理を施して生成されたモザイク画像に対し、高品質なデモザイク処理を施すことで、教師データを生成する。
【0012】
図1を用いて、本実施形態に係る画像処理装置の構成について説明する。
図1(a)は、画像処理装置100のハードウェア構成例を示す。画像処理装置100は、CPU101、GPU102、RAM103、ROM104、及びHDD105を有する。これら各部は、バス106を介して相互に接続されている。CPU(Central Processing Unit)101は、画像処理装置100の全体を制御する。CPU101は、CPU101と共にGPU(Graphics Processing Unit)102を用いて各種の処理を実行してもよい。CPU101がROM104等に記憶されたプログラムを読み出してRAM103に展開した上で実行することにより、後述するフローチャートの処理が実現する。RAM103は、揮発性メモリであり、画像や各種の処理の実行結果を一時的に記憶する。ROM104は、不揮発性メモリであり、プログラムや各種のデータを記憶する。HDD(ハードディスクドライブ)105は、書き換え可能な二次記憶装置であり、プログラム、モデルパラメータ、収集された学習用画像、生成された教師データなどを記憶する。
【0013】
図1(b)は、画像処理装置100の機能構成例を示す。画像処理装置100は、CPU101がROM104等に記憶されたプログラムを実行することにより、第1の処理部11、第2の処理部12、及び学習部13として機能する。
記憶部10は、収集された大量の学習用画像を記憶する。学習用画像は、RGBの3チャネルからなるカラー画像である。カラー画像の収集方法は、どのような方法でもよく、一般的なCMOSセンサを搭載した撮像装置を用いて収集してもよく、インターネットなどを通じて収集してもよい。なお、記憶部10としては、HDD105を用いてもよく、外部の記憶装置を用いても構わない。
【0014】
第1の処理部11は、記憶部10からカラー画像を取得し、取得したカラー画像にモザイク処理を施すことで、モザイク画像を生成する。本実施形態において、モザイク処理は、間引き処理である。具体的には、第1の処理部11は、カラー画像から所定の画素を間引くことで、RAW画像を模した所定のカラー配列からなる1チャネルの画像を生成する。
図2は、間引き処理に用いるカラー配列の例を示す。
図2に示すように、カラー配列としては、左上から右下にかけてR、G、G、Bが並んだ2×2のパターンを基本単位とするベイヤー配列が挙げられる。第1の処理部11は、モザイク画像を第2の処理部12に出力する。
【0015】
第2の処理部12は、第1の処理部11から出力されたモザイク画像に、高品質なデモザイク処理を施す。具体的には、第2の処理部12は、モザイク画像に対し、偽色やモアレ、ジッパーノイズといったデモザイクに起因する画質劣化の発生を抑制するための、高品質なデモザイク処理を施す。高品質なデモザイク処理には、深層学習モデルを利用する。例えば、非特許文献1に記載の技術を用いる。また、第2の処理部12は、高品質なデモザイク処理後の画像(以下、デモザイク画像という)に対し、所定の画像処理を施す。第2の処理部12は、デモザイク画像に所定の画像処理を施した画像を教師データとして、学習部13に出力する。
学習部13は、第2の処理部12から出力された教師データを用いて画像を出力するモデルの学習を行う。
【0016】
なお、第1の処理部11は、モザイク処理の前に、カラー画像に対して画像処理を施す。この画像処理は、第2の処理部12でデモザイク画像に対して所定の画像処理が施された画像を、当該所定の画像処理前の状態に変換する処理(以下、逆画像処理という)である。ここで、第2の処理部12でデモザイク画像に対して施される所定の画像処理は、第1の画像処理の例である。第1の処理部11でモザイク画像に対し施される逆画像処理は、第2の画像処理の例である。
【0017】
図3は、本実施形態に係る画像処理装置100の実行する処理を示すフローチャートである。以下、各ステップ(工程)は符号の前にSをつけて表す。
S301において、CPU101は、記憶部10からカラー画像を取得し、取得したカラー画像に対し逆画像処理を施す。
S302において、CPU101は、S301で逆画像処理が施されたカラー画像に対し、間引き処理を施して、モザイク画像を生成する。
S303において、CPU101は、S302で生成したモザイク画像に対し、前述の高品質なデモザイク処理を施して、デモザイク画像を生成する。
【0018】
S304において、CPU101は、S303で生成したデモザイク画像に対し、ガンマ補正、色変換、明るさ補正、コントラスト補正などの画像処理を施す。ここで、S301において施された逆画像処理は、本ステップで適用する画像処理に対して、厳密にもしくは近似的に逆写像の関係となるようにする。本ステップにおいて、CPU101が、例えば、画素値を2倍にする明るさ補正を実行し、続けて画素値を1/2.2乗するガンマ補正を実行するとする。この場合、S301では、CPU101は、まず画素値を2.2乗するデガンマ補正を実行し、続けて画素値を0.5倍にする明るさ補正を実行する。
以上のようにして、CPU101は、記憶部10に記憶されるカラー画像から、教師データを生成する。
CPU101は、記憶部10に記憶される大量のカラー画像に対し、S301~S304の処理を実行することで、大量の教師データを生成する。
【0019】
S305において、CPU101は、生成された大量の教師データを用いて、画像を出力するモデルの学習を実行する。学習は、デモザイクに起因する画質劣化の低減を目的としてもよく、他の主目的に付随してデモザイクに起因する画質劣化を抑制するものであってもよい。つまり、教師データを正解画像としてそのペアとされる入力画像は、教師データの元になったカラー画像そのものでもよく、当該カラー画像を加工した画像であってもよい。例えば、学習は入力画像のノイズ低減を主目的とする画像変換学習であってもよく、写実的な画像の生成を主目的とする画像生成学習であってもよい。その後本フローチャートの処理が終了する。
【0020】
以上のような本実施形態によれば、収集された学習用画像がデモザイク後のものであっても、学習用画像に対しモザイク処理と、高品質なデモザイク処理を施すことで、デモザイクに起因する画質劣化が抑制された教師データを生成することができる。このようにして生成された教師データを用いて、モデルの学習を実行することで、出力画像におけるデモザイクに起因する画像劣化の発生を抑制できる。
【0021】
[実施形態2]
本実施形態では、学習用画像を用いて、デモザイクに起因する画質劣化と、入力画像のノイズとを共に低減した画像を出力するモデルの学習を行い、その学習済みモデルで撮像画像の推論を行う方法について説明する。なお、実施形態1と重複する説明は省略する。
【0022】
図4は、本実施形態に係る画像処理システムの装置構成例を示す。
本実施形態に係る画像処理システムは、画像処理装置100と、撮像装置200と、推論装置300を含む。実施形態2の画像処理装置100のハードウェア構成は、実施形態1の画像処理装置100と同様であるため、説明を省略する。なお、本実施形態では、画像処理装置100と、撮像装置200と、推論装置300が、別々の装置として構成されているが、一部の装置又は全部の装置が、一体的に構成されていてもよい。
【0023】
撮像装置200は、CPU201、通信I/F部202、RAM203、ROM204、撮像素子206、及び光学系207を備える。これら各部は、バス205を介して相互に接続されている。CPU201は、撮像装置200の全体を制御する。CPU201がROM204等に記憶されたプログラムを読み出してRAM203に展開した上で実行することにより、後述する撮像装置200によるフローチャートの処理が実現する。RAM203は、画像や各種の処理の実行結果を一時的に記憶する。ROM204は、プログラムや各種のデータを記憶する。通信I/F部202は、外部装置との間で通信を行うためのインターフェースである。撮像装置200は、通信I/F部202を介して、推論装置300に対し撮像画像を送信する。撮像素子206は、光学系207を通過してきた光を画像信号に変換する。CPU201は、撮像素子206により変換された画像信号から、撮像画像を生成する。
【0024】
推論装置300は、CPU301、GPU302、RAM303、ROM304、HDD305、及び通信I/F部306を有する。これら各部は、バス307を介して相互に接続されている。CPU301は、推論装置300の全体を制御する。CPU301は、CPU301と共にGPU302を用いて各種の処理を実行してもよい。CPU301がROM304等に記憶されたプログラムを読み出してRAM303に展開した上で実行することにより、後述する推論装置300によるフローチャートの処理が実現する。RAM303は、画像や各種の処理の実行結果を一時的に記憶する。ROM304は、プログラムや各種のデータを記憶する。HDD305は、プログラム、画像処理装置100で学習済みのモデルのモデルパラメータ、撮像装置200から受信した撮像画像などを記憶する。通信I/F部306は、外部装置との間で通信を行うためのインターフェースである。CPU301は、通信I/F部306を介して、撮像装置200から撮像画像を受信する。
【0025】
図5は、画像処理システムの各装置の機能構成例を示す。画像処理装置100は、CPU101がROM104等に記憶されたプログラムを実行することにより、
図5に示す各機能部として機能する。撮像装置200は、CPU201がROM204等に記憶されたプログラムを実行することにより、
図5に示す各機能部として機能する。推論装置300は、CPU301がROM304等に記憶されたプログラムを実行することにより、
図5に示す各機能部として機能する。なお、
図5に示す画像処理装置100の各機能部のうち、実施形態1で説明したのと同様のものについては、同一の符号を付して説明を省略する。
【0026】
画像処理装置100は、記憶部10、第1の処理部11、第2の処理部12、学習部13、第3の処理部15、及び第1のモデル記憶部16を有する。記憶部10と第1のモデル記憶部16としては、HDD105を用いる。
第3の処理部15は、第1の処理部11で生成されたモザイク画像に対し、撮像装置200で発生するノイズを模した人工ノイズを付加する。人工ノイズの生成方法は、例えば特許文献1に記載の方法に則ればよい。
【0027】
また、第3の処理部15は、人工ノイズが付加されたモザイク画像に、軽量なデモザイク処理を施す。軽量なデモザイク処理は、第2の処理部12で実行される高品質なデモザイク処理に比べ、偽色やモアレ、ジッパーノイズといったデモザイクに起因する画質劣化が生じやすいという特徴を持つ。軽量なデモザイク処理は、例えばルールベースの処理としてもよい。ルールベースの処理としては、ルックアップテーブル(LUT)などを用いる。この場合、例えば、入力データと出力データとの関係を予めLUTとして作成し、装置のメモリに格納しておけばよい。第3の処理部15は、人工ノイズが付加されたモザイク画像に対し、LUTを参照して処理を行い、軽量なデモザイク処理後の画像として出力する。高品質なデモザイク処理は、第1のデモザイク処理の例である。軽量なデモザイク処理は、第2のデモザイク処理の例である。
また、第3の処理部15は、軽量なデモザイク処理後の画像に対し、ガンマ補正、色変換、明るさ補正、コントラスト補正などの所定の画像処理を施す。ここでの所定の画像処理は、第2の処理部12でデモザイク画像に対して施される所定の画像処理(第1の画像処理)と同じである。
第1のモデル記憶部16は、学習部13で学習された学習済みモデルのモデルパラメータを記憶する。
【0028】
撮像装置200は、撮像部20、第4の処理部21、及び送信部22を有する。
撮像部20は、光学系207を通過してきた光をCMOS等の撮像素子206で信号へ変換して画像として出力する。撮像部20から出力された画像は、RAW画像であり、モザイク画像である。
第4の処理部21は、撮像部20から出力された画像に、軽量なデモザイク処理を施す。第4の処理部21で実行される軽量なデモザイク処理は、第3の処理部15で実行される軽量なデモザイク処理と同一である。なお、ここでの同一は略同一を含む。また、第4の処理部21は、軽量なデモザイク処理後の画像に対し、ガンマ補正、色変換、明るさ補正、コントラスト補正などの所定の画像処理を施す。ここでの所定の画像処理は、第2の処理部12でデモザイク画像に対して施される所定の画像処理(第1の画像処理)と同一である。なお、ここでの同一は略同一を含む。第4の処理部21は、軽量なデモザイク処理後の画像に所定の画像処理を施した画像を、撮像画像として送信部22に出力する。
送信部22は、通信I/F部202を用いて、第4の処理部21から出力された撮像画像を推論装置300へ送信する。なお、送信部22は、SDIケーブル等を経由して送信してもよく、無線通信やインターネット通信を介して送信してもよい。
【0029】
推論装置300は、受信部31、推論部32、及び第2のモデル記憶部33を有する。
受信部31は、通信I/F部306を用いて、撮像装置200から送信された撮像画像を受信する。なお、受信部31は、SDIケーブル等を経由して受信してもよく、無線通信やインターネット通信を介して受信してもよい。
推論部32は、受信部31で受信した撮像画像を、第2のモデル記憶部33に記憶されるモデルパラメータによる学習済みモデルに入力することで、推論処理を実行する。
第2のモデル記憶部33は、画像処理装置100の学習部13で学習された学習済みモデルのモデルパラメータを記憶する。
【0030】
図6A及び
図6Bは、本実施形態に係る画像処理システムの実行する処理を示すフローチャートである。まず、
図6Aのフローチャートを用いて、画像処理装置100の実行する処理について説明する。
S601~S603の処理は、
図3のS301~S303と同様である。
S604において、CPU101は、S602で生成したモザイク画像に対し、人工ノイズを付加する。
S605において、CPU101は、S603で人工ノイズが付加された画像に対し、前述の軽量なデモザイク処理を施す。
S604~S605の処理は、S603と並行して実行される。
【0031】
S606の処理は、S304の処理と同様であるが、処理対象にS603の処理を適用した画像と、S604~S605の処理を適用した画像の両方が含まれる点が異なる。
S607の処理は、S305の処理とは、S603の処理を経由した画像を教師データとして学習する点は同様であるが、S604~S605の処理を経由した画像を入力画像とし、当該入力画像から教師データへの変換を学習する。S607の処理により、HDD105には、S607で学習された学習済みのモデルが記憶される。
S608において、HDD105に記憶された学習済みモデルが、推論装置300のHDD305へとコピーされる。コピーは、例えば外部の記憶装置を介して実行されてもよく、ネットワークを介して実行されてもよい。
以上で
図6Aのフローチャートの処理が終了する。
【0032】
次に、
図6Bのフローチャートを用いて、撮像装置200と推論装置300の実行する処理について説明する。S611~S614は、撮像装置200による処理である。
S611において、CPU201は、撮像素子206及び光学系207を用いて、撮像を行う。本ステップでは、モザイク画像が出力される。
S612において、CPU201は、S611で出力されたモザイク画像に対し、軽量なデモザイク処理を施す。ここで軽量なデモザイク処理は、S605の処理と同一である。
S613において、CPU201は、S612で軽量なモザイク処理が施された画像に対し、ガンマ補正、色変換、明るさ補正、コントラスト補正などの画像処理を施す。ここでの画像処理は、S606の処理と同一である。
S614において、CPU201は、S613で画像処理が施された画像を、撮像画像として推論装置300に送信する。
以上で
図6Bのフローチャートにおける、撮像装置200の処理が終了する。
【0033】
S615~S616は、推論装置300による処理である。
S615において、CPU301は、撮像装置200から撮像画像を受信する。
S616において、CPU301は、S608でコピーされた学習済みモデルをHDD305から読み出して、S615で受信した撮像画像を、読み出した学習済みモデルに入力することで推論処理を実行する。
以上で
図6Bのフローチャートにおける、推論装置300の処理が終了する。
【0034】
以上のような本実施形態によれば、デモザイクに起因する画質劣化を含むデモザイク後の学習用画像を用いて、該画質劣化と入力画像のノイズが共に低減された画像を生成する学習を行い、その学習済みモデルを用いて撮像画像を推論できる。
【0035】
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける一つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。上述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0036】
上述の各実施形態の開示は、以下の構成、方法及びプログラムを含む。
(構成1)
カラー画像に対し、モザイク処理を施す第1の処理手段と、
前記第1の処理手段で処理された画像に対し、第1のデモザイク処理を施す第2の処理手段と、
前記第2の処理手段で処理された画像に基づいて、モデルの学習に用いる教師データを生成する第1の生成手段と、
を有することを特徴とする画像処理装置。
(構成2)
前記モザイク処理は、所定の画素を間引くことで、所定のカラー配列からなる1チャネルの画像を生成する処理であることを特徴とする構成1に記載の画像処理装置。
(構成3)
前記第1の生成手段は、前記第2の処理手段で処理された画像に対し、第1の画像処理を施し、
前記第1の処理手段は、前記カラー画像に対し、モザイク処理を施す前に、前記第1の画像処理を施した画像を前記第1の画像処理前の状態に変換する第2の画像処理を施すことを特徴とする構成1または2に記載の画像処理装置。
(構成4)
前記カラー画像は、デモザイク処理された画像であることを特徴とする構成1~3の何れか1つに記載の画像処理装置。
(構成5)
前記第1のデモザイク処理は、デモザイク処理に起因する画像劣化を抑制する処理であることを特徴とする構成1~4の何れか1つに記載の画像処理装置。
(構成6)
前記画像劣化は、偽色、モアレ、及びジッパーノイズのうちの少なくとも何れか1つを含むことを特徴とする構成5に記載の画像処理装置。
(構成7)
前記教師データを用いて前記モデルの学習を行う学習手段を更に有することを特徴とする構成1~6の何れか1つに記載の画像処理装置。
(構成8)
前記第1の処理手段で処理された画像に対し、前記第1のデモザイク処理とは異なる第2のデモザイク処理を施す第3の処理手段と、
前記第3の処理手段で処理された画像に基づいて、前記モデルの学習に用いる入力画像を生成する第2の生成手段と、
を更に有し、
前記学習手段は、前記入力画像と前記教師データを用いて前記モデルの学習を行うことを特徴とする構成7に記載の画像処理装置。
(構成9)
前記第1のデモザイク処理は、深層学習モデルを利用した処理であり、
前記第2のデモザイク処理は、ルールベースの処理であることを特徴とする構成8に記載の画像処理装置。
(構成10)
前記第1の生成手段は、前記第2の処理手段で処理された画像に対し、第1の画像処理を施し、
前記第2の生成手段は、前記第3の処理手段で処理された画像に対し、前記第1の画像処理を施し、
前記第1の処理手段は、前記カラー画像に対し、モザイク処理を施す前に、前記第1の画像処理を施した画像を前記第1の画像処理前の状態に変換する第2の画像処理を施すことを特徴とする構成8または9に記載の画像処理装置。
(構成11)
前記第3の処理手段は、前記第2のデモザイク処理を施す前に、前記第1の処理手段で処理された画像に対し、ノイズを付加することを特徴とする構成8~10の何れか1つに記載の画像処理装置。
(構成12)
構成8~11の何れか1つに記載の画像処理装置を含む画像処理システムであって、
撮像素子により撮像を行ってモザイク画像を生成する撮像手段と、
前記モザイク画像に対し、前記第2のデモザイク処理と同一の処理を施す第4の処理手段と、
前記第4の処理手段で処理された画像と前記学習手段で学習済みの前記モデルを用いて推論を行う推論手段と、
を有することを特徴とする画像処理システム。
(構成13)
前記第1のデモザイク処理は、深層学習モデルを利用した処理であり、
前記第2のデモザイク処理は、ルールベースの処理であることを特徴とする構成12に記載の画像処理システム。
(構成14)
前記第1の生成手段は、前記第2の処理手段で処理された画像に対し、第1の画像処理を施し、
前記第2の生成手段は、前記第3の処理手段で処理された画像に対し、前記第1の画像処理を施し、
前記第4の処理手段は、前記第2のデモザイク処理と同一の処理を施した画像に対し、前記第1の画像処理と同一の処理を施し、
前記第1の処理手段は、前記カラー画像に対し、モザイク処理を施す前に、前記第1の画像処理を施した画像を前記第1の画像処理前の状態に変換する第2の画像処理を施すことを特徴とする構成12または13に記載の画像処理システム。
(方法)
カラー画像に対し、モザイク処理を施す第1の処理ステップと、
前記第1の処理ステップで処理された画像に対し、第1のデモザイク処理を施す第2の処理ステップと、
前記第2の処理ステップで処理された画像に基づいて、モデルの学習に用いる教師データを生成する第1の生成ステップと、
を含むことを特徴とする画像処理方法。
(プログラム)
コンピュータを、構成1~11の何れか1つに記載の画像処理装置として機能させるためのプログラム。
【符号の説明】
【0037】
100:画像処理装置、200:撮像装置、300:推論装置