【新規性喪失の例外の表示】特許法第30条第2項適用 (1)電気通信回線を通じて発表 ウェブサイトの掲載日 平成27年8月7日 ウェブサイトのアドレス https://www.gakkai−web.net/gakkai/eiss/program/program.html#OS4 http://www.gakkai−web.net/gakkai/eiss/program/abst/OS4−7.html (2)研究集会で発表 開載日 平成27年8月27日 研究集会名 平成27年 電気学会 電子・情報・システム部門大会 (3)刊行物に発表 発行者 一般社団法人電気学会電子・情報・システム部門大会委員会 発行日 平成27年8月26日 刊行物 平成27年 電気学会 電子・情報・システム部門大会講演論文集,第78頁 (4)刊行物に発表 発行者 一般社団法人電気学会電子・情報・システム部門大会委員会 発行日 平成27年8月26日 刊行物 平成27年 電気学会 電子・情報・システム部門大会講演論文集(CD−ROM),第675〜678頁
【文献】
橋本 明信 他,学習型超解像のための高能率な辞書,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2011年11月 4日,第111巻 第284号,pp.35-40
【文献】
土川 健斗 他,事例参照型超解像における幾何学模様の学習,FIT2013 第12回情報科学技術フォーラム,日本,一般社団法人情報処理学会 社団法人電子情報通信学会,2013年 8月20日,pp.317-318
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0018】
以下、図面を参照しつつ、本発明の一実施形態に係る画像処理装置、辞書データベース及び学習方法について説明する。
【0019】
<1.画像処理装置の構成>
図1に示す画像処理装置1は、本発明に係る画像処理装置の一実施形態である。画像処理装置1は、ハードウェアとしては、汎用のパーソナルコンピュータである。画像処理装置1には、CD−ROM、USBメモリ等のコンピュータが読み取り可能な記録媒体60等から画像処理プログラム2が提供され、インストールされている。本実施形態に係る画像処理プログラム2は、動画及び静止画に対する画像処理を支援するためのアプリケーションソフトウェアである。画像処理プログラム2は、画像処理装置1に後述する動作に含まれるステップを実行させる。
【0020】
画像処理装置1は、ディスプレイ10、入力部20、記憶部30及び制御部40を有する。これらの部10〜40は、互いにバス線やケーブル等の通信線5を介して接続されており、適宜、通信可能である。ディスプレイ10は、液晶ディスプレイ等から構成され、後述する画面等をユーザに対し表示する。入力部20は、マウスやキーボート、タッチパネル等から構成され、画像処理装置1に対するユーザからの操作を受け付ける。記憶部30は、ハードディスクやフラッシュメモリ等から構成される不揮発性の記憶領域である。制御部40は、CPU、ROM及びRAM等から構成される。
【0021】
画像処理プログラム2は、記憶部30内に格納されている。記憶部30内には、ソフトウェア管理領域50が確保されている。ソフトウェア管理領域50は、画像処理プログラム2が使用する領域である。ソフトウェア管理領域50内には、オリジナル画像領域51及び加工ファイル領域52が確保されている。各領域51,52の役割については、後述する。また、記憶部30内には、後述される辞書データベース31が構築されている。
【0022】
制御部40は、記憶部30内に格納されている画像処理プログラム2を読み出して実行することにより、仮想的に表示制御部41及び画像処理部42として動作する。表示制御部41は、ディスプレイ10上に表示される画面、ウィンドウ、ボタンその他の全ての要素の表示を制御する。画像処理部42は、様々な種類の画像処理を実行する。画像処理部42は、後述する超解像処理の実行中、仮想的に学習部42a、切出部42b、検索部42c及び復元部42dとして動作する。各部41,42,42a〜42dの動作の詳細は、後述する。
【0023】
<2.画像処理装置の動作>
制御部40は、ユーザが入力部20を介して所定の操作を行ったことを検出すると、画像処理プログラム2を起動する。画像処理プログラム2が起動されると、基本画面W1(
図2参照)がディスプレイ10上に表示される。
【0024】
<2−1.画像データの取込み>
基本画面W1は、オリジナル画像領域51への画像データの取込みの命令をユーザから受け付ける。オリジナル画像領域51へ取り込まれた画像データは、後述する再生処理及び画像処理の対象になる。制御部40は、静止画ファイル又は動画ファイルから、オリジナル画像領域51へ画像データを取り込む。なお、本明細書において、静止画ファイルとは、静止画形式のデータファイルであり、動画ファイルとは、動画形式のデータファイルである。
【0025】
静止画ファイルから画像データを取り込む場合、ユーザは、入力部20を操作することにより、1の静止画ファイルを指定するか、又は1のフォルダを指定する。前者の場合、制御部40は、その静止画ファイルの記憶部30内のアドレスパス及びファイル名をユーザに入力させる。後者の場合、制御部40は、そのフォルダの記憶部30内のアドレスパス及びフォルダ名をユーザに入力させる。その後、制御部40は、指定された静止画ファイル又は指定されたフォルダ内の全ての静止画ファイルを、オリジナル画像領域51に静止画ファイル群として保存する。なお、本明細書において、「群」という場合には、その要素数は複数とは限らず、1つであってもよい。
【0026】
一方、動画ファイルから画像データを取り込む場合、ユーザは、入力部20を操作することにより、1の動画ファイルの記憶部30内のアドレスパス及びファイル名を入力する。表示制御部41は、ユーザが動画ファイルを指定したことを検出すると、基本画面W1上に動画取込みウィンドウ(図示されない)を重ねて表示させる。動画取込みウィンドウは、指定された動画ファイルのタイムラインの全区間うち、任意の区間の選択をユーザから受け付ける。制御部40は、ユーザが入力部20を介して特定の区間を選択したことを検出すると、選択された区間に含まれるフレーム群に1対1で対応する静止画ファイル群を生成する。その後、制御部40は、この静止画ファイル群をオリジナル画像領域51に保存する。従って、本実施形態では、後述する再生処理及び画像処理の対象となる画像データは、動画ファイルではなく、静止画ファイルである。
【0027】
なお、制御部40は、オリジナル画像領域51へ取り込まれた静止画ファイル群が動画ファイルに由来するものではなく、静止画ファイルに由来するものであっても、静止画ファイル群をタイムラインに沿って配列されているものと認識する。配列は、ファイルの属性(ファイル名、作成日時、更新日時等)から自動的に判断される。
【0028】
<2−2.再生処理>
オリジナル画像領域51へ静止画ファイル群が取り込まれると、表示制御部41は、基本画面W1上に表示ウィンドウW2(
図3参照)を重ねて表示させる。表示ウィンドウW2は、オリジナル画像領域51へ取り込まれた静止画ファイル群のタイムラインの数だけ作成される。
【0029】
表示ウィンドウW2内には、まず、オリジナル画像領域51へ取り込まれた静止画ファイル群に含まれる1の静止画ファイル(例えば、タイムライン上で先頭のフレームに対応する静止画ファイル)が表示される。その後、後述するとおり、表示ウィンドウW2内に表示されるフレームは、ユーザの操作を受けて切り替わる。
【0030】
図3に示すとおり、基本画面W1上には、ウィンドウ選択プルダウンメニューT1、再生ボタンT2、コマ送りボタンT3、コマ戻しボタンT4及びタイムラインバーT5が配置されている。
【0031】
表示ウィンドウW2が複数存在する場合であっても、アクティブな表示ウィンドウW2は1つである。ウィンドウ選択プルダウンメニューT1は、どの表示ウィンドウW2をアクティブとするかの選択をユーザから受け付ける。以下、アクティブな表示ウィンドウW2に対応するタイムラインを、アクティブタイムラインと呼び、アクティブタイムラインに属するフレーム群を、アクティブフレーム群と呼ぶ。また、アクティブな表示ウィンドウW2内に現在表示されているフレームを、アクティブフレームと呼ぶ。
【0032】
表示制御部41は、アクティブな表示ウィンドウW2内で、アクティブフレーム群を動画として再生可能である。再生ボタンT2は、アクティブフレーム群の動画としての再生の命令をユーザから受け付ける。表示制御部41は、ユーザが入力部20を介して再生ボタンT2を押下したことを検出すると、アクティブな表示ウィンドウW2内に、アクティブフレーム群に含まれるフレームを、タイムラインに沿って順次コマ送りの形式で表示させる。なお、再生は、再生ボタンT2が押下された時点のアクティブフレームから開始する。また、再生ボタンT2は、再生の停止の命令をユーザから受け付ける。表示制御部41は、再生中にユーザが入力部20を介して再生ボタンT2を押下したことを検出すると、アクティブな表示ウィンドウW2内の表示を、その時点のアクティブフレームに固定する。
【0033】
コマ送りボタンT3、コマ戻しボタンT4はそれぞれ、アクティブフレームを、アクティブタイムラインに沿って1つ後、1つ前のフレームへ切り替える命令をユーザから受け付ける。
【0034】
タイムラインバーT5は、アクティブタイムラインを図式的に示すオブジェクトである。タイムラインバーT5は、そのバーが延びる方向に、アクティブフレーム群に含まれるフレーム数で等分に分割されている。タイムラインバーT5上の左からn番目の分割領域は、アクティブタイムライン上でn番目のフレームに対応する(nは、自然数)。
【0035】
図3に示すように、表示制御部41は、タイムラインバーT5上において、選択フレーム群に対応する分割領域A1と、非選択フレーム群に対応する分割領域A2とを、異なる表示形式で表示する。選択フレーム群とは、アクティブタイムライン上で現在選択されている区間に属するフレーム群である。非選択フレーム群とは、アクティブタイムライン上で現在選択されていない区間に属するフレーム群である。
【0036】
タイムラインバーT5は、アクティブタイムライン上の任意の区間の選択をユーザから受け付ける。このとき選択される区間は、連続区間であってもよいし、
図3に示すように、不連続区間であってもよい。具体的には、ユーザは、入力部20を介してタイムラインバーT5上の分割領域を操作することにより、アクティブフレーム群の中から、任意のフレームを任意の数だけ選択することができる。分割領域は、同時に複数選択が可能である。表示制御部41は、ユーザによりタイムラインバーT5上の分割領域が選択される度に、アクティブフレームを最新に選択された分割領域に対応するフレームに直ちに切り替える。画像処理部42は、選択フレーム群を後述される画像処理の対象として認識する。
【0037】
<2−3.画像処理>
画像処理部42は、選択フレーム群に対し、ノイズ除去、シャープネス、拡大/縮小、超解像、明るさ/コントラスト/彩度調整、文字/矢印/モザイクの付加などの複数の画像処理モジュールを実行可能である。画像処理モジュールは、画像処理プログラム2に組み込まれている。
【0038】
ユーザは、入力部20を介して基本画面W1を操作することにより、画像処理モジュールの中から任意のものを、任意の順番に、任意の回数だけ選択することが可能である。画像処理部42は、ユーザが画像処理モジュールを選択したことを検出する度に、その時点の選択フレーム群に対しその画像処理モジュールを実行する。また、選択フレーム群に対し画像処理モジュールを実行するとは、選択フレーム群に含まれる各フレームに対しその画像処理モジュールを実行することである。
【0039】
フレームに対し画像処理モジュールが1回、2回、3回,・・・と、順次実行されてゆくにつれて、そのフレームは、第1次、第2次、第3次,・・・と、順次加工されてゆく。第0次フレームは、オリジナル画像領域51に保存されている静止画ファイルに対応する。第(m+1)次フレームは、第m次フレームの静止画ファイルに対し画像処理モジュールを1回実行した後の静止画ファイルに対応する(mは、0以上の整数)。画像処理部42は、第1次以降のフレームに対応する静止画ファイルを順次生成し、これらの静止画ファイルを加工ファイル領域52内にそれぞれ別個に保存する。
【0040】
図4は、1のタイムラインに属する画像群が画像処理プログラム2によりどのように管理されるかを示す概念図である。
図4において、横軸のN軸は、タイムライン上のフレームの順番を示しており、縦軸のM軸は、加工の順番を示している。
図4のN−M空間内の座標(n,m)に対応する四角形は、画像I(n,m)を表している。画像I(n,m)は、タイムライン上でn番目のフレームの第m次の画像である(nは、自然数であり、mは、0以上の整数である)。
【0041】
制御部40は、各フレームについて、現在選択されている座標mの値をパラメータm
sとして管理する。オリジナル画像領域51へ静止画ファイル群が取り込まれた直後、座標m
sは、初期値0である。その後、画像処理モジュールが1回実行される度に、そのフレームの座標m
sは1ずつインクリメントされる。また、ユーザは、入力部20を介して所定の操作を行うことにより、任意のフレームの座標m
sを自在に変更することができる。なお、フレームに対し画像処理モジュールを実行するとは、そのフレームの第m
s次の画像に対し画像処理モジュールを実行することである。従って、座標m
sを変更することには、画像処理モジュールの実行の対象を変更するという意味がある。また、フレームを表示するとは、そのフレームの座標m
sの画像を表示することである。従って、座標m
sを変更することには、アクティブな表示ウィンドウW2内に表示される対象を変更するという意味もある。
【0042】
<3.超解像処理>
以下、画像処理プログラム2に実装されている画像処理の1つである、学習型の超解像処理について説明する。超解像処理とは、低画質の画像を高画質の画像に復元する処理である。
【0043】
学習型の超解像処理は、
図5に示すとおり、学習過程及び復元過程により実現される。学習過程は、復元過程に先立ち、復元過程で使用される辞書データベース31を学習により構築する過程である。復元過程は、辞書データベース31を使用して、低画質の画像を高画質の画像に復元する過程である。以下、学習過程及び復元過程について順に説明する。
【0044】
<3−1.学習過程>
図6は、学習過程の流れを示すフローチャートであり、
図7は、学習過程の流れを示す概念図である。
図6の処理は、基本画面W1上でユーザが所定の操作を行ったことが検出されたときに開始される。
【0045】
まず、ステップS1では、学習画像群が用意される。本実施形態では、学習画像群に含まれる学習画像は、全て図形画像である。しかしながら、他の実施形態では、学習画像群に図形画像以外の画像、例えば、風景や人物等の写真画像を含ませることも可能である。
【0046】
本実施形態に係る学習画像は、
図8に示すような単純な基本図形を表す図形画像であり、より具体的には、単一の円を表す画像である。本実施形態では、灰色の背景に対して円を黒色及び白色で描画した2種類の画像が用意される。また、白色円及び黒色円の各々に対し、大小様々なサイズ、本実施形態では24段階に円の半径を変化させた画像が用意される。また、色及びサイズの組み合わせの各パターンに対し、異なる太さ、本実施形態では6画素及び10画素の太さで線を描画した2種類の画像が用意される。
【0047】
また、本実施形態に係る学習画像は、非写真画像であり、学習部42aにより自動的に作成される。まず、学習部42aは、円と背景との境界部分で画素値が急峻に切り替わる、言い換えると、円部分及び背景部分で2種類の画素値しか持たない円画像を作成する。続いて、学習部42aは、作成された各円画像に対し、円と背景との境界部分において、アンチエイリアス処理を施す。これにより、境界部分において画素値が滑らかに変化し、円の輪郭が背景と融合する。さらに、学習部42aは、画像全体にσ=0.3のガウスぼかしを施す。なお、学習画像として、予めこのようなスムージング処理が施された画像が用意されるのは、復元対象となる画像には、被写体にフォーカスが合致していた場合でさえも、鋭い輪郭線を有する画像は余りないと考えられるためである。すなわち、学習画像にスムージング処理を施すことにより、学習画像に復元対象となる画像の性質を持たせることができる。従って、より高画質の画像を復元する観点からは、スムージング処理の施された学習画像を用いて学習することが好ましい。
【0048】
続くステップS2では、ステップS1で用意された各学習画像から劣化画像を生成する。具体的には、本実施形態では、学習部42aは、学習画像にσ=1.0のガウスぼかしを施す。続いて、所定の倍率、本実施形態では1/16の縮小率で学習画像を縮小し、その後、16倍の拡大率で元のサイズに戻す。このときの拡大縮小のアルゴリズムとしては、公知の様々なものを用いることができるが、本実施形態では、バイキュービック法が用いられる。
【0049】
続くステップS3では、学習部42aは、各劣化画像から多数の微小画像を切り出す。本実施形態では、この切り出しは、1画素ずつ左右に移動させたラスタスキャンによって実行される。以下、ここで切り出された微小画像を、劣化微小画像と呼ぶ。本実施形態に係る劣化微小画像のサイズは、9ピクセル×9ピクセルである。その後、学習部42aは、各劣化微小画像の画素値(輝度)を0〜1に正規化する(ステップS4)。本実施形態では、正規化は、以下の式に従って実行される。
【数1】
【0050】
ただし、LNorm
nは、劣化微小画像の正規化された画素値であり、Ldat
nは、劣化微小画像の画素値であり、LAveは、劣化微小画像の画素値の平均値であり、LContは、劣化微小画像のコントラスト値である。nは、画素番号である。コントラスト値LContは、以下の式に従って算出される。ただし、pixは、劣化微小画像のピクセル数である。
【数2】
【0051】
すなわち、ステップS4では、各劣化微小画像に対し、画素値の平均値LAve及びコントラスト値LContが算出される。そして、これらの値LAve,LContを用いて、数1の式に従って、各画素値の正規化が行われる。
【0052】
続くステップS5では、学習部42aは、ステップS3で切り出された各劣化微小画像のエッジ方向を決定する。具体的には、本実施形態では、プレウィットフィルターで輪郭の抽出を行い、当該輪郭の方向を16方向のエッジ方向のいずれかに分類する。
【0053】
続くステップS6では、学習部42aは、各学習画像から、当該学習画像に対応する劣化画像を減算した高解像成分画像を生成する。高解像成分画像は、学習画像に含まれる高周波成分、言い換えると、画像の緻密な成分を表す画像である。
【0054】
続くステップS7では、学習部42aは、各高解像成分画像から多数の微小画像を切り出す。本実施形態では、この切り出しは、1画素ずつ左右に移動させたラスタスキャンによって実行される。以下、ここで切り出された微小画像を、高解像度微小画像と呼ぶ。本実施形態に係る高解像度微小画像のサイズは、劣化微小画像の場合と同じく、9ピクセル×9ピクセルである。その後、学習部42aは、各高解像度微小画像の輝度を0〜1に正規化する(ステップS8)。本実施形態では、この正規化は、学習画像の同じ局所領域に由来する劣化微小画像のコントラスト値LContを用いて、以下の式に従って実行される。
【数3】
【0055】
ただし、HNorm
nは、高解像度微小画像の正規化された画素値であり、Hdif
nは、高解像度微小画像の画素値である。nは、画素番号である。
【0056】
続くステップS9では、学習部42aは、辞書データベース31に多数の微小画像の対を登録する。具体的には、ステップS8で正規化された高解像度微小画像(以下、第1微小画像という)と、ステップS4で正規化された劣化微小画像(以下、第2微小画像という)との対を生成し、辞書データベース31に記憶させる。対を成す第1微小画像及び第2微小画像は、同じ学習画像の同じ局所領域に由来する画像であり、第1微小画像は、高解像成分画像の微小画像であり、第2微小画像は、劣化画像の微小画像である。また、学習部42aは、微小画像の各対に、当該微小画像に対応する劣化微小画像に対しステップS5で特定されたエッジ方向を関連付けて登録する。なお、ステップS5でエッジ方向が抽出できなかった劣化微小画像に対応する対については、登録を省略し、エッジ方向が特定された劣化微小画像に対応する対のみ、登録を行う。以上により、学習過程が終了する。
【0057】
<3−2.復元過程>
次に、
図9及び
図10を参照しつつ、復元過程について説明する。
図9は、復元過程の流れを示すフローチャートであり、
図10は、復元過程の流れを示す概念図である。
図9の処理(以下、復元処理という)は、基本画面W1上でユーザが所定の操作を行ったことが検出されたときに開始される。復元処理を実行するための画像処理プログラムは、上述した画像処理モジュールの1つとして実装されている。
図9に示す処理は、1枚の画像に対する処理であるが、復元処理は、選択フレーム群に含まれる各フレームに対し実行される。
【0058】
復元対象となる画像(以下、対象画像という)は、低画質の画像である。一般に、画像が低画質化する理由は様々考えられ、例えば、被写体を捉えた画像領域のサイズが小さいことや、撮影時のフォーカスが合致していないことが考えられる。しかしながら、ここでの復元処理では、低画質化の理由を問わず、高画質の画像を復元することができる。
【0059】
まずステップS21では、復元部42dは、対象画像を拡大する。拡大率は、適宜設定することができ、ユーザからの入力を受け付けることもできるし、予め定めておくこともできる。このときの拡大のアルゴリズムとしては、公知の様々なものを用いることができるが、学習時と同様のアルゴリズムが用いられることが好ましいため、本実施形態では、バイキュービック法が用いられる。なお、ステップS2において様々なアルゴリズムで拡縮を行った学習データを用意することもできる。この場合、辞書データベース31内に、拡縮のアルゴリズムを示す情報を学習データに関連付けて格納しておくことができる。そして、復元時の拡大のアルゴリズムに応じて、復元に使用する学習データを選択することができる。
【0060】
続くステップS22では、切出部42bは、拡大された対象画像から多数の微小サイズのパッチ画像を切り出す。本実施形態では、この切り出しは、1画素ずつ左右に移動させたラスタスキャンによって実行される。また、本実施形態では、パッチ画像のサイズは、上述の微小画像と同じく、9ピクセル×9ピクセルである。
【0061】
続くステップS23では、復元部42dは、ステップS22で切り出された各パッチ画像のエッジ方向を決定する。このとき、本実施形態では、ステップS5と同じアルゴリズムが用いられる。すなわち、各パッチ画像は、16方向のエッジ方向のいずれかに分類される。
【0062】
続くステップS24では、検索部42cは、辞書データベース31内から、ステップS22で切り出された各パッチ画像に類似する第2微小画像を検索する。本実施形態では、効率的な検索のために、まず各パッチ画像に対し、ステップS23で特定されたエッジ方向と同じ方向に関連付けられている第2微小画像を抽出する。そして、抽出された全ての第2微小画像に対し、総当たりでパッチ画像との類似度を計算し、類似度の最も高い第2微小画像を特定する。なお、類似度の計算は様々なアルゴリズムで行うことができるが、本実施形態では、SSD(各画素値の差の二乗和)が用いられる。また、類似度の計算に当たり、パッチ画像は予め正規化される。正規化のアルゴリズムは、ステップS4と同じである。すなわち、正規化されたパッチ画像と、辞書データベース31に登録されている第2微小画像との類似度が計算される。
【0063】
続くステップS25では、復元部42dは、辞書データベース31を参照することにより、ステップS24で検索された各第2微小画像と対を成す第1微小画像を特定する。
【0064】
続くステップS26では、ステップS25で特定された各第1微小画像に対し、画像の復元を行う。これにより、ステップS22で切り出された各パッチ画像を復元した復元パッチ画像が生成される。具体的には、本実施形態では、この復元に、パッチ画像の画素値及びコントラスト値が用いられる。具体的には、以下の式に従って、復元パッチ画像が生成される。
【数4】
【0065】
ただし、Himg
nは、復元パッチ画像の画素値であり、H
nは、ステップS25で特定された第1微小画像の画素値である。QContは、パッチ画像のコントラスト値であり、Limg
nは、パッチ画像の画素値である。nは、画素番号である。コントラスト値の算出のアルゴリズムは、ステップS4と同じである。
【0066】
続くステップS27では、復元部42dは、ステップS26で生成された全ての復元パッチ画像を用いて、対象画像を復元した復元画像を生成する。具体的には、復元パッチ画像を、それぞれの位置情報に応じて画像平面内に貼り付ける。なお、本実施形態では、上述したとおり、パッチ画像はラスタスキャンにより切り出されている。そのため、復元パッチ画像を画像平面内に貼り付けたとき、画像平面内の各画素には複数の画像が張り付けられる。従って、本実施形態では、画像平面内の各画素に対応する複数の画素値が平均され、当該平均値が復元画像の画素値とされる。
【0067】
以上により、復元処理が終了する。復元画像は、表示制御部41により、表示ウィンドウW2内に表示される。これにより、ユーザは、高画質に復元された復元画像を確認することができる。
【0068】
<4.用途>
画像処理プログラム2は、多種多様な画像に対する画像処理を取り扱うことができ、例えば、警察等の機関が事件の捜査のために防犯カメラの監視映像を解析する場面で利用することができる。この場合、防犯カメラに小さく写り込んだ人物の顔や、自動車のナンバー等の像を超解像処理により高画質化し、確認することができる。
【0069】
<5.変形例>
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて、種々の変更が可能である。例えば、以下の変更が可能である。
【0070】
<5−1>
上記実施形態では、学習画像は円画像とされたが、楕円や多角形を表す図形画像とすることもできる。また、異なる種類の図形画像を組み合わせて、学習画像群を構成することもできる。
【0071】
<5−2>
上記実施形態では、学習過程は、ユーザが基本画面W1上で所定の操作を行ったときにより実行されるようになっていた。しかしながら、既に作成されている辞書データベース31が、画像処理プログラム2のインストール時に画像処理装置1にセットされるようにしてもよい。この場合、一般のユーザではなく、ソフトウェアの提供者が、学習過程に係る上記処理を別のコンピュータを用いて実行し、辞書データベース31を構築することになる。
【0072】
<5−3>
上記実施形態では、ステップS4,S8により、第1及び第2微小画像が正規化されているが、このような正規化を省略することもできる。ただし、上記正規化を行うことにより、辞書データベース31に登録しておくべき学習データの量を大きく低減することができる。なお、ステップS4,S8の正規化を省略した場合には、復元過程においてもステップS24の正規化は省略される。
【実施例】
【0073】
以下、本発明の実施例について説明する。ただし、本発明は、以下の実施例に限定されない。
【0074】
本発明者は、
図11に示すような29枚の評価画像を用意し、これらを劣化させて29枚の劣化評価画像を生成した。そして、これらの劣化評価画像に対し、後述する実施例1,2及び比較例に係る学習データを用いて、上記実施形態に係る学習型の超解像処理を施し、それぞれ29枚の復元画像を得た。なお、劣化評価画像は、ステップS2と同様の方法により生成した。
【0075】
<実施例1,2>
上記実施形態と同様の学習画像が用意された。具体的には、96枚の円画像(白黒2色×円の半径の段階24×線の太さ2種)が用意された。そして、これらの学習画像に対し上記実施形態に係る学習を行い、実施例1の学習データを得た。また、実施例1の学習画像の円にさらに強いグラデーションをつけ、かかる学習画像に対し上記実施形態に係る学習を行い、実施例2の学習データを得た。なお、
図12に示すように、線に強いグラデーションがついていない円画像の学習データが実施例1であり、強いグラデーションがついている円画像の学習データが実施例2である。
【0076】
<比較例>
一方、比較例に係る学習画像として、人物、動物、植物、自然風景、建物等の人工物を被写体とする計149枚の写真画像を用意した。そして、これらの写真画像に対し、上記実施形態に係る学習を行い、学習データを得た。なお、比較例に係る学習データのデータ量は、実施例1,2の場合と概ね同じであった。
【0077】
<検証>
実施例1の学習データを用いた復元画像と評価画像との間のピーク信号対雑音比(PSNR:Peak signal-to-noise ratio)を算出した。PSNRとは、2つの画像間の差を評価する際に用いられる指標であり、値が大きい程2つの画像が類似していることを表す。同様に、実施例2の学習データを用いた復元画像と評価画像との間のPSNRを算出するとともに、比較例の学習データを用いた復元画像と評価画像との間のPSNRを算出した。
【0078】
さらに、評価画像と復元画像との間のPSNRから、評価画像と劣化評価画像との間のPSNRを引いた値(以下、正規化PSNRという)を算出した。表1に、実施例1,2及び比較例に対する、29個の正規化PSNRの平均値、最大値、最小値及び標準偏差を示す。
【表1】
【0079】
表1に示すとおり、正規化PSNRの平均値、最大値及び最小値の全てにおいて、比較例よりも実施例1,2の方が値が大きくなった。すなわち、実施例1,2に係る学習データを用いた方が、より元の評価画像に類似する画像を復元できていることが分かる。また、正規化PSNRの標準偏差は、比較例よりも実施例1,2の方が値が小さくなった。すなわち、実施例1,2では、人物画像や風景画像といった評価画像の種類に応じてPSNRの値のばらつくことが少なく、安定した精度で画像を復元できていることが分かる。さらに、図形画像の線にグラデーションを付した場合には、平均的に見て、より元の復元画像に類似する画像を復元でき、画像の種類によらずより安定した精度で画像を復元できることが分かる。ただし、復元したい被写体が車両ナンバー等、図形的である場合には、実施例1の図形画像の方が優れている場合もある。
【0080】
また、
図13に、実施例2及び比較例に係る学習データを用いた場合の復元画像の例を示す。同図に示すように、見た目にも、比較例よりも実施例2の方が、少なくとも局所領域に注目したときにおいて、高画質に画像が復元されていることが分かる。特に、直線が明確に復元されているのが分かる。なお、実施例1,2に係る学習データは円画像に由来するが、微小画像においては、特にサイズの大きな円の線は直線的である。従って、円画像であっても、実施例1,2に係る学習データは直線の復元に適している。