(58)【調査した分野】(Int.Cl.,DB名)
前記学習手段は、前記複数の画像処理手段の全ての画像処理手段が学習済みとなった場合に学習を完了する、又は前記集団の前記最も多くの入力画像を有する分類ドメインの入力画像の分類ラベルが、前記学習させた単数若しくは複数の画像処理手段又はk番目の画像処理手段のいずれかのみになる場合、学習を完了する請求項1に記載の画像処理学習プログラム。
前記分類手段は、前記画像処理を行う対象となる画像に含まれる複数の部分領域を抽出し、複数の部分領域の特徴量を算出し、算出した特徴量の平均をとることで当該画像処理を行う対象となる画像を分類する請求項5に記載の画像処理プログラム。
前記情報処理装置の前記複数の画像処理手段は、前記サーバ装置が配信する画像処理を行う対象となる画像及び当該画像処理を行う対象となる画像に対応する目標画像とを用いて学習されたものである請求項8に記載の画像処理システム。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記した非特許文献1の画像処理学習プログラムによると、データセットを事前にクラスタリングするため学習の効率は向上するものの、クラスタリングは例えば画像の色や明暗等の特徴量に基づいて行われることもあるため、必ずしも超解像の精度の向上には結びつかない、という問題がある。
【0006】
従って、本発明の目的は、画像処理の学習に用いるデータセットをラベリング不要でクラスタリングするとともに、各分類ドメインに対する画像処理の精度が向上するよう画像処理の学習を行う画像処理学習プログラム及び当該プログラムにより学習された画像処理プログラム、並びに情報処理装置及び画像処理システムを提供することにある。
【課題を解決するための手段】
【0007】
本発明の一態様は、上記目的を達成するため、以下の画像処理学習プログラム、画像処理プログラム、情報処理装置及び画像処理システムを提供する。
【0008】
[1]コンピュータを、
単一の入力画像を画像処理して単一の出力画像を出力する複数の画像処理手段と、
複数の入力画像及び当該複数の入力画像に対応する目標画像を有する学習対象の集団に含まれる分類ドメインのうち最も多くの入力画像を有するk番目の分類ドメインを用いて単数若しくは複数の未学習の画像処理手段を当該分類ドメインに対応する学習済みのk番目の画像処理手段と略同一の精度まで学習させ、当該k番目の画像処理手段と、学習させた当該単数若しくは複数の画像処理手段とに前記k番目の分類ドメインが有する入力画像を入力し、当該学習させた単数若しくは複数の画像処理手段又は当該k番目の画像処理手段のうち出力する出力画像の目標画像に対する精度が高い画像処理手段の分類ラベルを入力した入力画像に付与するとともに、当該入力画像で当該学習させた単数若しくは複数の画像処理手段又は/及び当該k番目の画像処理手段を精度に基づいて学習させ
る学習手段として機能させるための画像処理学習プログラム。
[2]前記学習手段は、前記複数の画像処理手段の全ての画像処理手段が学習済みとなった場合に学習を完了する、又は前記集団の前記最も多くの入力画像を有する分類ドメインの入力画像の分類ラベルが、前記学習させた単数若しくは複数の画像処理手段又はk番目の画像処理手段のいずれかのみになる場合、学習を完了する前記[1]に記載の画像処理学習プログラム。
[3]コンピュータを、
入力される画像を前記分類ラベルのいずれかに分類する分類手段としてさらに機能させ、
前記学習手段は、前記集団の前記分類ラベルが付与された複数の入力画像を用いて前記分類手段を学習させる前記[1]又は[2]に記載の画像処理学習プログラム。
[4]コンピュータを、
単一の入力画像を画像処理して単一の出力画像を出力する複数の画像処理手段と、
複数の入力画像及び当該複数の入力画像に対応する目標画像を有する学習対象の集団から学習済みの前記画像処理手段に入力画像を入力した場合に、当該学習済みの画像処理手段が出力する出力画像の目標画像に対する精度が高くなる当該出力画像の数が最も多い画像処理手段を特定し、当該特定された画像処理手段の画像処理の精度が高くなる入力画像及び目標画像を用いて未学習の画像処理手段を学習させて学習済みとした後、前記学習対象の集団に含まれる入力画像を全ての学習済みの前記画像処理手段に入力し、出力画像の目標画像に対する精度が高くなる画像処理手段を当該入力画像及び当該目標画像を用いてそれぞれ学習させる学習手段として機能させるための画像処理学習プログラム。
[5]コンピュータを、
画像処理を行う対象となる画像を予め定めた複数のカテゴリのいずれかに分類し、分類結果のカテゴリに対応付けられた画像処理手段に入力する分類手段と、
前記[1]〜[4]のいずれかに記載の画像処理学習プログラムを実行することにより学習された複数の画像処理手段であって、前記分類手段から入力された前記画像処理を行う対象となる画像を画像処理する複数の画像処理手段として機能させるための画像処理プログラム。
[6]前記分類手段は、前記画像処理を行う対象となる画像に含まれる複数の部分領域を抽出し、複数の部分領域の特徴量を算出し、算出した特徴量の平均をとることで当該画像処理を行う対象となる画像を分類する前記[5]に記載の画像処理プログラム。
[7]単一の入力画像を画像処理して単一の出力画像を出力する複数の画像処理手段と、
複数の入力画像及び当該複数の入力画像に対応する目標画像を有する学習対象の集団に含まれる分類ドメインのうち最も多くの入力画像を有するk番目の分類ドメインを用いて単数若しくは複数の未学習の画像処理手段を当該分類ドメインに対応する学習済みのk番目の画像処理手段と略同一の精度まで学習させ、当該k番目の画像処理手段と、学習させた当該単数若しくは複数の画像処理手段とに前記k番目の分類ドメインが有する入力画像を入力し、当該学習させた単数若しくは複数の画像処理手段又は当該k番目の画像処理手段のうち出力する出力画像の目標画像に対する精度が高い画像処理手段の分類ラベルを入力した入力画像に付与するとともに、当該入力画像で当該学習させた単数若しくは複数の画像処理手段又は/及び当該k番目の画像処理手段を精度に基づいて学習させ
る学習手段とを有する情報処理装置。
[8]画像処理を行う対象となる画像を、ネットワークを介して配信するサーバ装置と、
前記画像処理を行う対象となる画像を前記サーバ装置から受信し、受信した当該画像処理を行う対象となる画像を予め定めた複数のカテゴリのいずれかに分類し、分類結果のカテゴリに対応付けられた画像処理手段に入力する分類手段と、請求項1〜4のいずれか1項に記載の画像処理学習プログラムを実行することにより学習された複数の画像処理手段であって、前記分類手段から入力された前記画像処理を行う対象となる画像を画像処理する複数の画像処理手段とを有する情報処理装置とを備える画像処理システム。
[9]前記情報処理装置の前記複数の画像処理手段は、前記サーバ装置が配信する画像処理を行う対象となる画像及び当該画像処理を行う対象となる画像に対応する目標画像とを用いて学習されたものである前記[8]に記載の画像処理システム。
【発明の効果】
【0009】
請求項1、4、7、8に係る発明によれば、分類ドメインに対する画像処理の精度が向上するよう画像処理の学習を行うことができる。
請求項2に係る発明によれば、複数の画像処理手段の全てが学習済みとなった場合に学習を完了する、又は集団の最も多くの入力画像を有する分類ドメインの入力画像の分類ラベルが、i番目又はk番目のいずれかのみになる場合、学習を完了することができる。
請求項3に係る発明によれば、画像処理の学習に用いるデータセットをラベリング不要でクラスタリングすることができる。
請求項5に係る発明によれば、画像処理を行う対象となる画像を予め定めた複数のカテゴリのいずれかに分類し、分類結果のカテゴリに対応付けられた画像処理手段で画像処理を行う対象となる画像を画像処理することができる。
請求項6に係る発明によれば、画像処理を行う対象となる画像に含まれる複数の部分領域を抽出し、複数の部分領域の特徴量を算出し、算出した特徴量の平均をとることで当該画像処理を行う対象となる画像を分類することができる。
請求項9に係る発明によれば、サーバ装置が配信する画像処理を行う対象となる画像に最適化された画像処理を行うことができる。
【発明を実施するための形態】
【0011】
[第1の実施の形態]
(画像処理システムの構成)
図1は、第1の実施の形態に係る画像処理システムの構成の一例を示す概略図である。
【0012】
この画像処理システムの一例としての超解像システム5は、情報処理装置としての端末1と、ウェブサーバ2とをネットワーク3によって互いに通信可能に接続することで構成される。
【0013】
端末1は、例えば、ノートPC(Personal Computer)やスマートフォン、タブレット端末等の携帯型の情報処理装置であって、本体内に情報を処理するための機能を有するCPU(Central Processing Unit)、GPU(Graphics Processing Unit)やフラッシュメモリ等の電子部品を備える。なお、端末1は、携帯型の情報処理装置に限らず据え置き型のPCであってもよい。
【0014】
ウェブサーバ2は、サーバ型の情報処理装置であり、端末1の要求に応じて動作するものであって、本体内に情報を処理するための機能を有するCPUやフラッシュメモリ等の電子部品を備える。
【0015】
ネットワーク3は、高速通信が可能な通信ネットワークであり、例えば、インターネットやLAN(Local Area Network)等の有線又は無線の通信網である。
【0016】
端末1は、一例として、ウェブページを閲覧するためウェブサーバ2に要求を送信する。ウェブサーバ2は要求に応じてウェブページに表示される配信用画像200を含むウェブページを構成するウェブページ情報20を端末1に送信する。端末1は、ウェブページ情報20及び配信用画像200を受信し、入力画像である配信用画像200をカテゴリに分類し、画像処理の一例として、当該カテゴリに適した超解像手段を用いて配信用画像200を高解像度化して(超解像して)ウェブページ情報20に基づいて表示画像130を表示部(13、
図2参照。)に表示する。なお、ここで超解像とは、単一の低解像度画像から単一の高解像度画像を復元する単画像超解像のことを言う(以降、同様。)。端末1は、複数のカテゴリにそれぞれ適した複数の超解像手段を有し、複数の超解像手段を使い分けることで単一の超解像手段で処理する場合に比べて超解像の精度を向上する。なお、配信用画像200は、表示画像130に比べて低解像度の画像情報であり、データ量の少ない情報である。また、複数の超解像手段は、後述する方法で学習され、学習段階で分類するための手段を学習するためのクラスタリングが行われる。
【0017】
(情報処理装置の構成)
図2は、第1の実施の形態に係る端末1の構成例を示すブロック図である。
【0018】
端末1は、CPU、GPU等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワーク3を介して外部と通信する通信部12と、LCD(Liquid Crystal Display)等から構成され、文字や画像を表示する表示部13と、表示部13上に配された接触操作可能なタッチパネルやキーボード、スイッチ等から構成され、利用者の操作を受け付ける操作部14と備える。
【0019】
制御部10は、後述するウェブブラウザプログラム110を実行することで、ウェブページ情報受信手段100、ウェブページ表示制御手段103等として機能する。また、後述する画像処理プログラムとしての超解像プログラム111を実行することで、画像分類手段101、複数の超解像手段102
0、102
1…等として機能する。また、後述する画像処理学習プログラムとしての超解像学習プログラム114を実行することで、画像分類手段101、複数の超解像手段102
0、102
1…等を学習するための学習手段104等として機能する。
【0020】
ウェブページ情報受信手段100は、通信部12を介してウェブサーバ2から配信用画像200を含むウェブページ情報20を受信して、記憶部11にウェブページ情報112として格納する。なお、ウェブページ情報112の記憶は一時的なものであってもよい。
【0021】
画像分類手段101は、ウェブページ情報受信手段100が受信した配信用画像200をカテゴリに分類し、複数の超解像手段102
0、102
1…のうち当該配信用画像200のカテゴリに適した超解像手段を選択する。なお、画像分類手段101は、例えば、CNN(Convolutional Neural Network)を学習したものであるが、ロジスティック回帰、サポートベクターマシン、決定木、ランダムフォレスト、SGD(Stochastic Gradient Descent)、カーネル密度推定、k近傍法、パーセプトロン等を学習したものであってもよい。
【0022】
画像処理手段としての複数の超解像手段102
0、102
1…は、それぞれ異なるカテゴリの画像の超解像に特化した超解像手段であり、画像分類手段101によって分類された入力画像としての配信用画像200を超解像し、出力画像としての高解像度の超解像画像情報113を生成して記憶部11に格納する。なお、超解像手段102
0、102
1…は、例えば、CNNを学習したものであるが、同等のアルゴリズムを学習したものであってもよい。
【0023】
ウェブページ表示制御手段103は、ウェブページ情報112に基づいて、配信用画像200の代わりに超解像画像情報113を用いてウェブページの表示画像130を表示部13に表示する。
【0024】
学習手段104は、画像分類手段101、複数の超解像手段102
0、102
1…を学習させる。学習方法の詳細は後述する。なお、学習手段104及び超解像学習プログラム114は、端末1に必須の構成ではなく、異なる装置で実行及び格納することが一般的であり、説明の便宜上構成に含めたものである。つまり、学習手段104及び超解像学習プログラム114は異なる装置で実行すればよく、異なる装置で学習した結果としての画像分類手段101、複数の超解像手段102
0、102
1…及び超解像プログラム111を端末1に備えていればよい。
【0025】
記憶部11は、制御部10を上述した各手段100、103として動作させるウェブブラウザプログラム110、制御部10を上述した各手段101、102
0、102
1…として動作させる超解像プログラム111、ウェブページ情報112、超解像画像情報113及び制御部10を上述した学習手段104として動作させる超解像学習プログラム114等を記憶する。
【0026】
(超解像システムの動作)
次に、本実施の形態の作用を、(1)超解像動作、(2)学習動作に分けて説明する。「(1)超解像動作」において、「(2)学習動作」によって学習済みの超解像プログラム111を実行し、配信用画像200を超解像する動作を説明する。また、「(2)学習動作」において、超解像学習プログラム114を実行することで、画像分類手段101、複数の超解像手段102
0、102
1…を学習させる動作を説明する。
【0027】
(1)超解像動作
図3は、端末1の超解像動作を説明するための概略図である。また、
図4は、端末1の超解像動作の一例を示すフローチャートである。
【0028】
まず、端末1のウェブページ情報受信手段100は、通信部12を介してウェブサーバ2から配信用画像200を含むウェブページ情報20を受信して、記憶部11にウェブページ情報112として格納する(S10)。
【0029】
次に、端末1の画像分類手段101は、ウェブページ情報受信手段100が受信したウェブページ情報20から配信用画像200を抽出する(S11)。
【0030】
次に、画像分類手段101は、抽出した配信用画像200から、複数のパッチ200
1、200
2、200
3…を部分領域として抽出する。画像分類手段101は、複数のパッチ200
1、200
2、200
3…をバッチ処理し、複数のパッチ200
1、200
2、200
3…のに対する出力を得る。画像分類手段101は、学習結果としての超解像プログラム111に基づいて動作し、複数のパッチ200
1、200
2、200
3…に対する出力を平均化して得られた値から当該配信用画像200をカテゴリに分類し(S12)、複数の超解像手段102
0、102
1…のうち、分類結果のカテゴリに対応した、当該配信用画像200の超解像に適した超解像手段102
1を選択する(S13)。
【0031】
次に、画像分類手段101が選択した超解像手段102
1は、配信用画像200を超解像し(S14)、高解像度の超解像画像情報113を生成して記憶部11に格納する。
【0032】
次に、端末1のウェブページ表示制御手段103は、ウェブページ情報112に基づいて、配信用画像200の代わりに超解像画像情報113を用いてウェブページの表示画像130を表示部13に表示する(S15)。
【0033】
(2)学習動作
図5A〜
図5Gは、第1の実施の形態の端末1の学習動作を説明するための概略図である。また、
図6は、第1の実施の形態の端末1の学習動作の一例を示すフローチャートである。
【0034】
まず、
図5Aに示すように、端末1の学習手段104は、未学習の0番目の超解像手段である超解像手段102
0で、学習対象である集団50全体に含まれる学習用低解像画像500l
0〜500l
7の全体を学習する(S20)。学習方法を以下に説明する。
【0035】
超解像手段102
0は、学習用低解像画像500l
0〜500l
7のj番目の学習用低解像画像500l
jを超解像し、超解像画像500sr
0jを得る。次に、学習手段104は、予め用意した学習用低解像画像500l
0〜500l
7より高解像度である目標画像としての元画像500h
0〜500h
7のj番目の元画像500h
jと比較し、差分を算出する。差分には、例えば、MSE(Mean Squared error)やMAE(Mean Absolute Error)等を用いるが、差分算出について学習済みのCNNを用いて算出してもよい。学習手段104は、当該差分をフィードバックして、当該差分が小さくなるように学習用低解像画像500l
0〜500l
7全体について超解像手段102
0を学習する。以降、当該差分が小さいことを超解像の「精度が良い」ということがある。
【0036】
次に、
図5Bに示すように、端末1の学習手段104は、未学習の1番目の超解像手段である超解像手段102
1で(S22)、集団50全体に含まれる分類ドメインのうち最も大きい分類ドメイン、つまり、
図5Bの場合はまだ分類されていないので、学習用低解像画像500l
0〜500l
7の全体を学習する(S23)。学習方法は以下に説明するように0番目の超解像手段の学習と同様である。
【0037】
超解像手段102
1は、学習用低解像画像500l
0〜500l
7のj番目の学習用低解像画像500l
jを超解像し、超解像画像500sr
1jを得る。次に、学習手段104は、予め用意した学習用低解像画像500l
0〜500l
7の高解像度の元画像500h
0〜500h
7のj番目の元画像500h
jと比較し、差分を算出する。学習手段104は、当該差分をフィードバックして、当該差分が小さくなるように学習用低解像画像500l
0〜500l
7全体について超解像手段102
1を学習する。
【0038】
なお、学習手段104は、学習済みの超解像手段102
0をコピーして超解像手段102
1とし、学習に要する時間や処理のコストを抑制してもよい。
【0039】
次に、
図5Cに示すように、端末1の学習手段104は、最も大きい分類ドメインに対応するk番目の超解像手段、つまり、
図5Cの場合はk=0番目の超解像手段である超解像手段102
0と、i=1番目の超解像手段である超解像手段102
1とで超解像を行い、超解像の精度に基づいて、最も大きい分類ドメインである集団50全体に含まれる学習用低解像画像500l
0〜500l
7の分類ラベルを付与し直して分類ドメインを分割する(S24)とともに、当該分類ラベルに基づいて精度の良い一方の超解像手段102
0又は超解像手段102
1を学習させる(S25)。分割方法及び学習方法の詳細を以下に説明する。
【0040】
超解像手段102
0及び超解像手段102
1は、学習用低解像画像500l
0〜500l
7のj番目の学習用低解像画像500l
jを超解像し、超解像画像500sr
0j及び超解像画像500sr
1jを得る。次に、学習手段104は、高解像度の元画像500h
jとそれぞれ比較し、それぞれ差分を算出する。学習手段104は、当該差分の小さい方の超解像画像500sr
0j又は超解像画像500sr
1jを出力した超解像手段102
0又は超解像手段102
1の分類ラベル(0又は1)を学習用低解像画像500l
jに付与して集団50をクラスタリングするとともに、j番目の学習用低解像画像500l
jについて差分が小さい方の超解像手段102
0又は超解像手段102
1についてフィードバックして学習させる。なお、学習手段104は、超解像手段102
0及び超解像手段102
1について差分が一致した場合、超解像手段102
0又は超解像手段102
1のいずれか一方を選択し分類ラベル(0又は1)を学習用低解像画像500l
jに付与して集団50をクラスタリングするとともに、j番目の学習用低解像画像500l
jについて選択した方の超解像手段102
0又は超解像手段102
1についてフィードバックして学習させる。また、フィードバックして学習させるのは必ずしも超解像手段102
0又は超解像手段102
1の一方である必要はなく、それぞれの精度に基づいて重み付けをして学習させるようにしてもよい。つまり、差分の小さい方の超解像手段102
0又は超解像手段102
1についてフィードバックして学習させる重み付けを大きくし、差分の大きい方の超解像手段102
0又は超解像手段102
1についてフィードバックして学習させる重み付けを小さくするようにしてもよい。
【0041】
上記クラスタリングの結果、
図5Dに示すように、集団50が超解像手段102
0のラベル0が付与された集団50
0と、超解像手段102
1のラベル1が付与された集団50
1とに分割される。また、超解像手段102
0及び超解像手段102
1は、学習の結果、それぞれ集団50
0及び集団50
1について他の超解像手段102
1及び超解像手段102
0で超解像する場合に比べて精度が良いように学習される、つまり、それぞれ集団50
0及び集団50
1について超解像の精度が最適化される。
【0042】
ドメインが分割されれば(S26;Yes)、次の未学習の超解像手段についてステップS23〜S25を実行する(S27;No、S28)。
【0043】
次に、
図5Eに示すように、端末1の学習手段104は、未学習の2番目の超解像手段である超解像手段102
2で(S22)、集団50全体に含まれる分類ドメインのうち最も大きい分類ドメイン、つまり、
図5Eの場合は集団50
0に含まれる学習用低解像画像500l
0〜500l
4の全体を学習する(S23)。なお、学習手段104は、学習済みの超解像手段102
0をコピーして超解像手段102
2とし、学習に要する時間や処理のコストを抑制してもよい。
【0044】
次に、
図5Fに示すように、端末1の学習手段104は、最も大きい分類ドメインに対応するk番目の超解像手段、つまり、
図5Fの場合はk=0番目の超解像手段である超解像手段102
0と、i=2番目の超解像手段である超解像手段102
2とで超解像を行い、超解像の精度に基づいて、最も大きい分類ドメインである集団50
0全体に含まれる学習用低解像画像500l
0〜500l
4の分類ラベルを付与し直して分類ドメインを分割する(S24)とともに、当該分類ラベルに基づいて一方の超解像手段102
0又は超解像手段102
2を学習させる(S25)。
【0045】
超解像手段102
0及び超解像手段102
2は、学習用低解像画像500l
0〜500l
4のj番目の学習用低解像画像500l
jを超解像し、超解像画像500sr
0j及び超解像画像500sr
2jを得る。次に、学習手段104は、高解像度の元画像500h
jとそれぞれ比較し、それぞれ差分を算出する。学習手段104は、当該差分の小さい方の超解像手段102
0又は超解像手段102
2の分類ラベル(0又は2)を学習用低解像画像500l
jに付与して集団50
0をクラスタリングするとともに、j番目の学習用低解像画像500l
jについて差分が小さい方の超解像手段102
0又は超解像手段102
2についてフィードバックして学習させる。また、フィードバックして学習させるのは必ずしも超解像手段102
0又は超解像手段102
2の一方である必要はなく、それぞれの精度に基づいて重み付けをして学習させるようにしてもよい。
【0046】
また、上記のように最も大きい分類ドメインに対応するk番目の超解像手段と、単一のi番目の超解像手段とで超解像を行い、超解像の精度に基づいて、最も大きい分類ドメインを分割するとともに、超解像の精度に基づいて超解像手段の学習を行うようにしたが、最も大きい分類ドメインに対応するk番目の超解像手段と、i番目、i+1番目、i+2番目…の複数の超解像手段とで超解像を行い、超解像の精度に基づいて、最も大きい分類ドメインを分割するとともに、超解像の精度に基づいて超解像手段の学習を行うようにしてもよい。
【0047】
上記クラスタリングの結果、
図5Gに示すように、集団50
0が超解像手段102
0のラベル0が付与された集団50
0と、超解像手段102
2のラベル2が付与された集団50
2とに分割される。また、超解像手段102
0、超解像手段102
1及び超解像手段102
2は、学習の結果、それぞれ集団50
0、集団50
1及び集団50
2について超解像の精度が最適化される。
【0048】
用意したすべての超解像手段についてステップS23〜S25を実行し終えたら(S27;Yes)、動作を終了する。また、用意したすべての超解像手段について上記動作を実行していない場合であっても、ドメインが分割されなくなったら(S26;No)、動作を終了して学習していない超解像手段を使用しないようにする。
【0049】
また、学習手段104は、上記ステップが全て終了してすべての超解像手段102
0、102
1…の学習が完了し、集団50の分類ドメインが分割されると、当該集団50の分類ラベルが付与された学習用低解像画像500l
jについて画像分類手段101を学習する。なお、画像分類手段101の学習は、
図3で示した場合と同様に、学習用低解像画像500l
jから複数のパッチを抽出してバッチ処理して学習してもよいし、学習用低解像画像500l
jを1つのパッチとしてそのまま処理して学習してもよい。
【0050】
(第1の実施の形態の効果)
上記した第1の実施の形態によれば、単画像超解像において、複数の超解像手段102
0、102
1…を学習させる際に、超解像の学習に用いるデータセット(集団50)のうち大きな分類ドメイン50
kに対応する超解像手段102
kと新たに学習する超解像手段102
iとを競合して学習させ、分類ドメイン50
kに含まれる画像の超解像の精度が良い超解像手段102
k又は102
iのラベルを付与してクラスタリングするとともに、精度が良い結果を出す超解像手段102
k又は102
iを当該画像で学習させて分割された分類ドメイン50
k及び50
iに最適化した超解像手段102
k及び102
iとするようにしたため、超解像の学習に用いるデータセット(集団50)を予めラベリングする必要なくクラスタリングが可能となり、各分類ドメイン50
k及び50
iの超解像手段102
k及び102
iの最適化を効率的に行うことができる。また、超解像手段の学習によりデータセットを自発的にクラスタリングすることができるため、ラベリング不要で画像分類手段101の学習のためのデータセットを用意でき、画像分類手段101を効率的に学習することができる。
【0051】
また、超解像手段102
0、102
1…を複数用意し、画像のカテゴリに合わせて特化させることで、全体として精度を向上することができるとともに、超解像手段102
0、102
1…それぞれを軽量なモデルにすることができる。また、端末1において学習済みの複数の超解像手段102
0、102
1…と画像分類手段101とを機能させることにより、配信用画像200の容量を減少させて、ネットワーク3の通信量を減少させることができる。
【0052】
[第2の実施の形態]
第2の実施の形態は、学習動作におけるクラスタリングにおいて分類ラベルを付与しない点で第1の実施の形態と異なる。なお、構成及び超解像動作については第1の実施の形態と同様であるため説明を省略する。
【0053】
(3)学習動作
図7A〜
図7Cは、第2の実施の形態の端末1の学習動作を説明するための概略図である。また、
図8は、第2の実施の形態の端末1の学習動作の一例を示すフローチャートである。
【0054】
まず、端末1の学習手段104は、未学習の0番目及び1番目の超解像手段である超解像手段102
0及び超解像手段102
1で、学習対象である集団50全体に含まれる学習用低解像画像500l
0〜500l
7の全体を学習する(S30)。なお、学習方法は、第1の実施の形態と同様であるため説明を省略する。
【0055】
次に、変数l=2とし(S31)、
図7A(a)に示すように、学習対象である集団50全体に含まれる学習用低解像画像500l
0〜500l
7の全体を、学習済みの超解像手段102
0及び超解像手段102
1に入力し、i番目の学習用低解像画像500l
iを超解像し、超解像画像500sr
0i及び500sr
1iを得る。次に、画像分類手段101は、予め用意した学習用低解像画像500l
0〜500l
7の高解像度の元画像500h
0〜500h
7のi番目の元画像500h
iと比較し、差分の小さい超解像手段、つまり精度の良い超解像手段を
図7A(b)に示すように精度情報101a
1として記録し、精度の最も良い画像数が最も多いモデルk特定する(S32)。
図7Aの場合はk=0である。なお、精度情報101a
1の記録は一時的な記憶であってもよい。この状態において、概念上は集団50が、超解像手段102
0が精度良く超解像する集団50
0と、超解像手段102
1が精度良く超解像する集団50
1とに分割されることとなる。
【0056】
次に、
図7B(a)に示すように、学習対象である集団50全体に含まれる学習用低解像画像500l
0〜500l
7の全体を、学習済みの超解像手段102
0及び超解像手段102
1に入力し、i番目の学習用低解像画像500l
iを超解像し、超解像画像500sr
0i及び500sr
1iを得る。次に、画像分類手段101は、予め用意した学習用低解像画像500l
0〜500l
7の高解像度の元画像500h
0〜500h
7のi番目の元画像500h
iと比較し、超解像画像500sr
0iとの差分が最も小さいi番目の学習用低解像画像500l
i及び元画像500h
iの学習セットを用いて未学習のl番目の超解像手段、つまり超解像手段102
lを学習させる(S33)。超解像手段102
lの学習は、超解像手段102
0と同程度の精度となるまで行うものとする。この状態において、
図7B(b)に示すように、概念上は集団50が、超解像手段102
0が精度良く超解像する集団50
0と、超解像手段102
1が精度良く超解像する集団50
1と、超解像手段102
2が精度良く超解像する集団50
2とに分割されることとなる。つまり、
図7A(b)の状態と比較して、超解像手段102
1が精度良く超解像する集団が2つに分割された状態となる。
【0057】
次に、
図7C(a)に示すように、学習対象である集団50全体に含まれる学習用低解像画像500l
0〜500l
7の全体を、学習済みの超解像手段102
0、超解像手段102
1及び超解像手段102
2に入力し、i番目の学習用低解像画像500l
iを超解像し、超解像画像500sr
0i、500sr
1i及び500sr
2iを得る。次に、画像分類手段101は、予め用意した学習用低解像画像500l
0〜500l
7の高解像度の元画像500h
0〜500h
7のi番目の元画像500h
iと比較し、最も差分の小さい超解像手段、つまり最も精度の良い超解像手段を、i番目の学習用低解像画像500l
i及び元画像500h
iの学習セットをフィードバックして学習する(S34)。
【0058】
この状態において、
図7C(b)に示すように、概念上は集団50が、超解像手段102
0が精度良く超解像する集団50
0と、超解像手段102
1が精度良く超解像する集団50
1と、超解像手段102
2が精度良く超解像する集団50
2とに分割されることとなる。なお、
図7B(b)の状態と比較して、必ずしも分割結果が一致しないのは、フィードバック学習を行った結果、超解像手段102
0、超解像手段102
1、超解像手段102
2に変化が生じたためである。
【0059】
また、
図7C(b)に示すように、画像分類手段101は、予め用意した学習用低解像画像500l
0〜500l
7の高解像度の元画像500h
0〜500h
7のi番目の元画像500h
iと比較し、差分の小さい超解像手段、つまり精度の良い超解像手段を精度情報101a
2として記録し、精度の最も良い画像数が最も多いモデルk特定する(S32)。
図7Cの場合はk=0又は1である。
【0060】
このようにステップS32〜S34をすべての未学習モデルについて実行する(S35、S36)。
【0061】
また、学習手段104は、上記ステップが全て終了してすべての超解像手段102
0、102
1…の学習が完了すると、最終的に得られた精度情報101a
lを用いて当該集団50について画像分類手段101を学習する。
【0062】
(第2の実施の形態の効果)
上記した第2の実施の形態によれば、単画像超解像において、複数の超解像手段102
0、102
1…を学習させる際に、精度の良い超解像手段をカウントするようにして、超解像の学習に用いるデータセット(集団50)のうち大きな分類ドメイン50
kに対応する超解像手段102
kと新たに学習する超解像手段102
iとを競合して学習させるようにしたため、超解像の学習に用いるデータセット(集団50)を予めラベリングする必要なく、かつ、学習途中におけるラベリングが不要で、クラスタリングが可能となり、超解像手段102
k及び102
iの最適化を効率的に行うことができる。
【0063】
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
【0064】
上記実施の形態では、ウェブサーバ2から配信用画像200を含むウェブページ情報20を、ネットワーク3を介して配信し、端末1で配信用画像200を超解像する例を説明したが、低解像画像を配信して端末1で超解像する構成であればよく、ウェブページ情報20に含めて配信する必要がないのはもちろんである。つまり、ウェブブラウザに限らず、端末1に含まれる任意のアプリケーションプログラムに画像分類手段101及び超解像手段102
0、102
1…を動作させるための超解像プログラム111を組み合わせることができる。
【0065】
なお、学習に用いる画像の集団50と、配信用画像200は、それぞれ異なるものであってもよいし、同一のものであってもよい。異なる場合は、集団50から一般的なモデルである超解像手段102
0、102
1…が作成可能である。また、同一のものである場合は、配信用画像200に最適な超解像手段102
0、102
1…が作成可能である。
【0066】
上記実施の形態では、画像処理の例として超解像を挙げて説明したが、その他の例として、画像のノイズ除去、ぼけの除去、鮮明化等の画像処理についての学習についても本願発明を適用可能であり、画像処理の内容については特に限定されない。また、当該学習方法を用いて学習された画像処理についても同様に画像処理の内容は超解像に限定されない。
【0067】
上記実施の形態では制御部10の各手段100〜104の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD‐ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
【課題】画像処理の学習に用いるデータセットをラベリング不要でクラスタリングするとともに、各分類ドメインに対する画像処理の精度が向上するよう画像処理の学習を行う画像処理学習プログラム及び当該プログラムにより学習された画像処理プログラム、並びに情報処理装置及び画像処理システムを提供する。