(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023126831
(43)【公開日】2023-09-12
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
   G06T  11/60        20060101AFI20230905BHJP        
   G06T   7/00        20170101ALI20230905BHJP        
【FI】
G06T11/60 100C 
G06T7/00 130 
G06T7/00 350B 
【審査請求】有
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023103153
(22)【出願日】2023-06-23
(62)【分割の表示】P 2023006661の分割
【原出願日】2021-11-05
(71)【出願人】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】110000154
【氏名又は名称】弁理士法人はるか国際特許事務所
(72)【発明者】
【氏名】中澤  満
(72)【発明者】
【氏名】シュテンガー  ビヨン
(57)【要約】      (修正有)
【課題】複数の画像に基づく高品質な合成画像の作成に寄与する情報処理装置、情報処理方法及び情報処理プログラム。
【解決手段】情報処理装置100は、複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像からテンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択部、テンプレートに含まれるM個の枠に選択されたM枚の画像を夫々配置して合成画像を作成する合成部及び選択したM枚の画像の夫々の単画像評価値の線形和である選択評価値と、合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を、作成した合成画像と対応付け決定する評価部を有する。評価部は、選択したM枚の画像の夫々の単画像評価値と、あらかじめ定められたM個の枠の夫々と対応する重み係数とに基づいて、選択評価値を決定し、重み係数は、テンプレートの種類毎に定められる。
【選択図】
図1 
【特許請求の範囲】
【請求項1】
  複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像から前記テンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択部と、
  前記テンプレートに含まれるM個の枠に選択された前記M枚の画像をそれぞれ配置して、合成画像を作成する合成部と、
  選択された前記M枚の画像のそれぞれの単画像評価値の線形和である選択評価値と、前記合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を前記作成された合成画像と対応付け決定する評価部と、
  を有し、
  前記評価部は、選択されたM枚の画像のそれぞれの単画像評価値と、前記あらかじめ定められたM個の枠のそれぞれと対応する重み係数とに基づいて、前記選択評価値を決定し、
  前記重み係数は、前記テンプレートの種類ごとに定められる、
  情報処理装置。
【請求項2】
  前記評価部は、選択された前記画像の枚数であるMに基づき前記選択評価値を規格化し、Mが異なる複数の前記合成画像のそれぞれの前記総合評価値を決定する、
  請求項1に記載の情報処理装置。
【請求項3】
  前記総合評価値は、選択された画像同士の類似性を示す類似性評価値の線形和をさらに含む、
  請求項1又は2に記載の情報処理装置。
【請求項4】
  前記評価部は、選択された前記画像の枚数であるMに基づき前記類似性評価値を規格化し、Mが異なる複数の前記合成画像のそれぞれの前記総合評価値を決定する、
  請求項3に記載の情報処理装置。
【請求項5】
  前記総合評価値Rewardは、次式により得られる、請求項4に記載の情報処理装置。
            
  ここで、λ
1、λ
2、λ
3は任意の重み係数、w
iはi番目の前記枠に対応する重み係数、I
iはi番目の画像、I
wholeは合成画像、Score(I)は画像Iの単画像評価値、Similarity(I
i,I
j)は画像I
iと画像I
jの近似度である。
 
【請求項6】
  前記合成画像は、前記M個の枠以外の部分に、あらかじめ配置された固定画像を含む、
  請求項1~5のいずれか1項に記載の情報処理装置。
【請求項7】
  前記評価部は、選択された画像または前記合成画像を機械学習モデルに入力することで、入力された当該画像または当該合成画像と対応する単画像評価値を取得する、
  請求項1~6のいずれか1項に記載の情報処理装置。
【請求項8】
  前記総合評価値に基づいて、少なくとも一の前記合成画像を選択する合成画像選択部と、
  をさらに有する請求項1~7のいずれか1項に記載の情報処理装置。
【請求項9】
  複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像から前記テンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択ステップと、
  前記テンプレートに含まれるM個の枠に選択された前記M枚の画像をそれぞれ配置して、合成画像を作成する合成ステップと、
  選択された前記M枚の画像のそれぞれの単画像評価値の線形和である選択評価値と、前記合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を前記作成された合成画像と対応付け決定する評価ステップと、
  をコンピュータに実行させる情報処理方法であって、
  前記評価ステップにおいて、選択されたM枚の画像のそれぞれの単画像評価値と、前記あらかじめ定められたM個の枠のそれぞれと対応する重み係数とに基づいて、前記選択評価値を決定し、
  前記重み係数は、前記テンプレートの種類ごとに定められる、
  情報処理方法。
【請求項10】
  コンピュータを、
  複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像から前記テンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択部と、
  前記テンプレートに含まれるM個の枠に選択された前記M枚の画像をそれぞれ配置して、合成画像を作成する合成部と、
  選択された前記M枚の画像のそれぞれの単画像評価値の線形和である選択評価値と、前記合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を前記作成された合成画像と対応付け決定する評価部と、
  を有し、
  前記評価部は、選択されたM枚の画像のそれぞれの単画像評価値と、前記あらかじめ定められたM個の枠のそれぞれと対応する重み係数とに基づいて、前記選択評価値を決定すし、
  前記重み係数は、前記テンプレートの種類ごとに定められる、
  情報処理装置として機能させる情報処理プログラム。
            
         
【発明の詳細な説明】
【技術分野】
【0001】
  本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
  複数の画像を含むコンテンツを提示し、あるいはかかるコンテンツに誘導する目的で、コンテンツ内の複数の画像を所定の配置、例えばタイル配置に並べた合成画像の需要がある。例えば、企業や店舗のwebページデザイン、観光地や旅行パッケージの広告ポスター、映画やゲームの紹介、電子商取引に係る商品の紹介バナーなどである。かかる合成画像の作成は、デザイナーが必要な数の画像を選び出し、これを所定の位置に配置することによりなされている。
【0003】
  しかしながら、かかる合成画像を逐一デザイナーが作成していては、数多くの合成画像を作成することはできず、又コストも問題となる。しかしながら、かかる合成画像を自動作成しようとしても、画像を何らかの基準で選択し、それらを単純に所定の位置に配置することによっては、品質要求を満足する合成画像を得ることは難しい。なぜなら、選択された個々の画像の品質がそれぞれ独立して鑑賞に耐えうるものであったとしても、それら画像を並べて配置した場合に、合成画像全体として見たときの色合いのバランスが崩れたり、近似した画像が含まれることにより、見る者に奇異な印象を与えたりすることが生じるため、合成画像が低品質なものとなり得るからである。
【0004】
  このように、複数の画像に基づいて、高品質な合成画像を得る技術はこれまでのところ、知られていない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
  本発明は、かかる事情に鑑みてなされたものであり、その目的は、複数の画像に基づく高品質な合成画像の作成に寄与することである。
【課題を解決するための手段】
【0006】
  上記課題を解決すべく本出願において開示される発明は種々の側面を有しており、それら側面の代表的なものの概要は以下のとおりである。
【0007】
  (1)複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像から前記テンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択部と、前記テンプレートに含まれるM個の枠に選択された前記M枚の画像をそれぞれ配置して、合成画像を作成する合成部と、選択された前記M枚の画像のそれぞれの単画像評価値の線形和である選択評価値と、前記合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を前記作成された合成画像と対応付け決定する評価部と、を有し、前記評価部は、選択されたM枚の画像のそれぞれの単画像評価値と、前記あらかじめ定められたM個の枠のそれぞれと対応する重み係数とに基づいて、前記選択評価値を決定し、前記重み係数は、前記テンプレートの種類ごとに定められる、情報処理装置。
【0008】
  (2)(1)において、前記評価部は、選択された前記画像の枚数であるMに基づき前記選択評価値を規格化し、Mが異なる複数の前記合成画像のそれぞれの前記総合評価値を決定する、情報処理装置。
【0009】
  (3)(1)又は(2)において、前記総合評価値は、選択された画像同士の類似性を示す類似性評価値の線形和をさらに含む、情報処理装置。
【0010】
  (4)(3)において、前記評価部は、選択された前記画像の枚数であるMに基づき前記類似性評価値を規格化し、Mが異なる複数の前記合成画像のそれぞれの前記総合評価値を決定する、情報処理装置。
【0011】
  (5)(4)において、前記総合評価値Rewardは、次式により得られる、情報処理装置。
               【数1】
ここで、λ
1、λ
2、λ
3は任意の重み係数、w
iはi番目の前記枠に対応する重み係数、I
iはi番目の画像、I
wholeは合成画像、Score(I)は画像Iの単画像評価値、Similarity(I
i,I
j)は画像I
iと画像I
jの近似度である。
 
【0012】
  (6)(1)~(5)のいずれかにおいて、前記合成画像は、前記M個の枠以外の部分に、あらかじめ配置された固定画像を含む、情報処理装置。
【0013】
  (7)(1)~(6)のいずれかにおいて、前記評価部は、選択された画像または前記合成画像を機械学習モデルに入力することで、入力された当該画像または当該合成画像と対応する単画像評価値を取得する、情報処理装置。
【0014】
  (8)(1)~(7)のいずれかにおいて、前記総合評価値に基づいて、少なくとも一の前記合成画像を選択する合成画像選択部と、をさらに有する情報処理装置。
【0015】
  (9)複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像から前記テンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択ステップと、前記テンプレートに含まれるM個の枠に選択された前記M枚の画像をそれぞれ配置して、合成画像を作成する合成ステップと、選択された前記M枚の画像のそれぞれの単画像評価値の線形和である選択評価値と、前記合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を前記作成された合成画像と対応付け決定する評価ステップと、をコンピュータに実行させる情報処理方法であって、前記評価ステップにおいて、選択されたM枚の画像のそれぞれの単画像評価値と、前記あらかじめ定められたM個の枠のそれぞれと対応する重み係数とに基づいて、前記選択評価値を決定し、前記重み係数は、前記テンプレートの種類ごとに定められる、情報処理方法。
【0016】
  (10)コンピュータを、複数種類のテンプレートから1のテンプレートを選択するとともに、N枚(N>1)の画像から前記テンプレート毎にあらかじめ定められるM枚(M≦N)の画像を選択する単画像選択部と、前記テンプレートに含まれるM個の枠に選択された前記M枚の画像をそれぞれ配置して、合成画像を作成する合成部と、選択された前記M枚の画像のそれぞれの単画像評価値の線形和である選択評価値と、前記合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値を前記作成された合成画像と対応付け決定する評価部と、を有し、前記評価部は、選択されたM枚の画像のそれぞれの単画像評価値と、前記あらかじめ定められたM個の枠のそれぞれと対応する重み係数とに基づいて、前記選択評価値を決定すし、前記重み係数は、前記テンプレートの種類ごとに定められる、情報処理装置として機能させる情報処理プログラム。
【図面の簡単な説明】
【0017】
            【
図1】本発明の第1の実施形態に係る情報処理装置の機能的な観念図である。
 
            【
図2】N枚の画像から、複数のMの値について合成画像が作成される様子を模式的に示す図である。
 
            【
図3】一般的なコンピュータの代表的な物理構成を示す構成図である。
 
            【
図4】本発明の第1の実施形態に係る単画像選択部の動作のフローの一例を示す図である。
 
            
            【
図6】本発明の第1の実施形態に係る合成部の動作のフローの一例を示す図である。
 
            
            【
図8】本発明の第1の実施形態に係る評価部の動作のフローの一例を示す図である。
 
            【
図9】本発明の第1の実施形態に係る合成画像選択部の動作のフローの一例を示す図である。
 
            【
図10】本発明の第2の実施形態に係る情報処理装置の機能的な観念図である。
 
          
【発明を実施するための形態】
【0018】
  図1は、本発明の第1の実施形態に係る情報処理装置100の機能的な観念図である。情報処理装置100は、同図に示された機能を適切な物理的手段、例えば、適切なコンピュータプログラムを実行するコンピュータ、によって実現することによって実現される。
 
【0019】
  情報処理装置100は、単画像選択部10、合成部20、評価部30及び合成画像選択部40を備えている。そして、情報処理装置100は、情報処理の対象となるN枚の画像
(N  images)を入力とし、合成画像(Combined  image)を出力するものである。ここで、N>1である。
【0020】
  ここで、情報処理装置100が行おうとする情報処理について簡潔に説明する。N枚の画像は所与の画像であり、例えば、画像ライブラリや、任意のコンテンツに含まれる画像群である。そして、情報処理装置100が行おうとすることは、このN枚の画像の中からM枚の画像を選び出し(M≦N)、これをあらかじめ定められたM個の枠に配置し、できる限り高品質な、すなわち、見る者を惹きつけ、肯定的な評価が得られる合成画像の作成に寄与することである。このとき、N枚の画像の中からM枚の画像を選び出す選び方と、選ばれたM枚の画像をそれぞれ、M個の枠のどの枠に配置するかにより、得られる合成画像は様々なものとなり、その評価も異なる。
【0021】
  したがって、情報処理装置100は、得られる合成画像の評価を人に頼ることなく、機械的に(すなわち、コンピュータによる情報処理により)行い、見る者を惹きつけ、肯定的な評価が得られると合理的に推定される合成画像の作成に寄与するように構成されている。
【0022】
  ここで、Mの値は必ずしも所与の一定値ではないことに注意すべきである。
図2は、N枚の画像から、複数のMの値について合成画像が作成される様子を模式的に示す図である。ここで、Mの値が4,6,9の3種を想定したものを示している。そして、Mの値に応じて作成される合成画像A乃至合成画像Cは、同図の右側に示すように、M=4の場合は、4枚の画像を縦横2×2のタイル状の枠に配置したもの、M=6の場合は、6枚の画像を縦横3×2のタイル状の枠に配置したもの、M=9の場合は、9枚の画像を3×3のタイル状の枠に配置したものとなっている。なお、ここで示したのは一例であり、Mの値の種類や枠の数はさらに大きくともよく、また、枠の配置も任意である。例えば、M=4の場合に、4枚の画像を縦横1×4のタイル状の枠に配置したものもあり得る。また、M=4の場合において、上で示した縦横2×2のタイル状の枠と縦横1×4のタイル状の枠の両方があってもよい。M=6,9等の場合も同様である。
 
【0023】
  この時、合成画像A乃至合成画像Cのいずれが最も観者を引き付けるものとなるかは、用意されたN枚の画像に依存し、一概にこれを定めることはできない。なぜならば、N枚の画像中には、互いに類似する画像も含まれうる(例えば、同一の料理や景色などを異なったアングルから撮影した写真画像など)と考えられるところ、例えば、N枚の画像を類似する画像のグループに分けたとして、そのグループ数が4であったならば、合成画像Aは互いに類似しない画像のみを用いて構成できるが、合成画像B及びCはどのようにしても類似する画像が含まれてしまうため、全体として冗長で魅力に乏しいものになってしまうだろう。あるいは、類似する画像のグループ数が多数、例えば9以上であったならば、合成画像Cはより多様な画像を提示できるのに対し、合成画像AやBは、N枚の画像が潜在的に有する魅力を十分に伝えることができないであろう。
【0024】
  同様のことが、Mの値を同じくし、枠の配置のみが異なる合成画像についてもいえるであろう。したがって、情報処理装置100は、異なるMや、異なる配置の枠を有する合成画像についても評価を行い、それらの中から最終的に、見る者を惹きつけ、肯定的な評価が得られると合理的に推定される合成画像を作成することができるものとされている。
【0025】
  情報処理装置100は、物理的には、一般的なコンピュータを用いて実現して良い。
図3はそのような一般的なコンピュータ1の代表的な物理構成を示す構成図である。
 
【0026】
  コンピュータ1は、CPU(Central  Processing  Unit)1a、RAM(Random  Access  Memory)1b、静的記憶装置1c、GC(Graphics  Controller)1d、入力デバイス1e及びI/O(Input/Output)1fがデータバス1gにより相互に電気信号のやり取りができるよう接続されている。ここで、静的記憶装置1cはHDD(Hard  Disk  Drive)やSSD(Solid  State  Drive)などの静的に情報を記録できる装置である。またGC1dからの信号はCRT(Cathode  Ray  Tube)やいわゆるフラットパネルディスプレイなどの、使用者が視覚的に画像を認識するモニタ1hに出力され、画像として表示される。入力デバイス1eはキーボードやマウス、タッチパネルなどの、ユーザが情報を入力するための機器であり、I/O1fはコンピュータ1が外部の機器と情報をやり取りするためのインタフェースである。CPU1aはコンピュータ1が必要とする情報処理の負荷に応じて、複数用意されて並列演算がなされるように構成されていてもよい。
【0027】
  コンピュータ1を情報処理装置100として機能させるための命令列を含む情報処理プログラムは、外部記憶装置1cにインストールされ、必要に応じてRAM1bに読みだされてCPU1aにより実行される。また、かかるプログラムは、適宜の光ディスク、光磁気ディスク、フラッシュメモリなどの適宜のコンピュータ可読情報記録媒体に記録されて提供されても、インターネットなどの情報通信回線を介して提供されてもよい。また、情報処理装置100を使用者が使用するためのインタフェースは、コンピュータ1自身にかかるインタフェースが実装され、使用者が直接コンピュータ1を操作するものであってもよいし、他のコンピュータ上でwebブラウザのような汎用のソフトウェアを用い、I/O1fを介してコンピュータ1から機能が提供される、いわゆるクラウドコンピューティングの方法によってもよく、さらに、コンピュータ1が他のコンピュータに対してAPI
(アプリケーションプログラミングインタフェース)を利用可能に提供することにより、他のコンピュータからの求めに応じてコンピュータ1が情報処理装置100として動作するものであってもよい。
【0028】
  図1において示した情報処理装置100の各構成は、コンピュータ1において、CPU1cが適宜の情報処理プログラムを実行し、また、RAM1b及び/又は静的記憶装置1cに適宜の記憶領域を割り当てることにより実現されてよい。
 
【0029】
  以下、情報処理装置100の各構成について簡明に説明する。単画像選択部10は、N枚の画像からM枚の画像を選択する。この時のMは、合成部20で選択された画像を合成して得られる合成画像の枠の数に等しい。本実施形態では、単画像選択部10は、N枚の画像からM枚の画像を選択する可能な組み合わせを抽出するものとなっている。したがって、単画像選択部10は、かかる組み合わせの数をk通りとすると、k組のM枚の画像(M  images)を出力するものとなっている。
【0030】
  図4は、本実施形態に係る単画像選択部10の動作のフローの一例を示す図である。ここでは、M個の枠を含む合成画像のテンプレートが複数種類あるものとし、Mの値はテンプレート毎に定まっている。
 
【0031】
  まず、ステップS101にて、単画像選択部10は変数xに初期値1を代入し、続くステップS102にて、x番目のテンプレートを選択する。x番目のテンプレートには、M個の枠が設定されているため、ステップS103にて、単画像選択部10は、同じ組み合わせが選ばれないように、N枚の画像から、M枚の画像を選択する。
【0032】
  ステップS104では、可能なすべての組み合わせのM枚の画像の組が選択されたか否かを判定する。まだ全ての組み合わせが選択されていなければ、ステップS103へと戻り、引き続きM枚の画像を選択する。既に全ての組み合わせが選択されている場合には、ステップS105へと進み、複数のテンプレートがすべて選択されたかを判定する。
【0033】
  まだ全てのテンプレートが選択されていなければ、ステップS106へとすすみ、変数xに1を加算してステップS102へと処理を戻す。既に全てのテンプレートが選択されている場合には、あり得る全てのMについて、可能なすべての組み合わせのM枚の画像の組が選択されたことになるから、処理を終了する。
【0034】
  なお、Mが等しい互いに異なるテンプレートが存在する場合、かかるテンプレートについて選択されるM枚の画像の組には違いがないから、すでに得られている結果を援用することにより、処理の負荷を低減するようにしてもよい。
【0035】
  図5は、テンプレートの種々の例を示す図である。(a)及び(b)は、画像の枠fとして、矩形の領域をタイル配置した例である。(a)に示したテンプレートには、縦3×横2の6個の枠fが、(b)に示したテンプレートには、縦3×横3の9個の枠fが配置されている(なお、符号fは代表して1つのみ示している)。また、(c)のテンプレートには、矩形の枠fが7個配置されているほか、枠f以外の部分に、あらかじめ配置された固定画像pが含まれている。したがって、(c)のテンプレートを用いて作成された合成画像には、M枚の選択された画像がM個の枠に配置されるとともに、固定画像pが含まれるものとなる。(d)のテンプレートには、形状やサイズも不同の、ここでは円又は楕円形状の枠fが3つ配置され、下部に固定画像pが配置されている。
 
【0036】
  このように、用意されるテンプレートにおいて、枠fの配置・数・形状およびサイズは任意であり、(a)及び(b)に示したような、矩形の枠fを規則正しくタイル配置したものに限定されない。また、テンプレートには、(c)及び(d)に示すように、任意の固定画像pを枠f以外の部分に配置することができるので、例えば、企業のロゴや商品名などの文字情報や、デザイン上要求される飾り枠やその他の画像を含む合成画像を作成することができ、そして、合成画像の品質は、固定画像pを含む全体として評価することができる。
【0037】
  図1に戻り、合成部20は、単画像選択部10からM枚の画像の組を受け取り、各テンプレートにおける、あらかじめ定められたM個の枠に選択されたM枚の画像をそれぞれ配置して、合成画像(Combined  Images)を作成する。この時、M個の枠にM枚の画像を配置する配列には、M!通りの順列があるから、M!通りの互いに異なる合成画像が作成されることとなる。なお、合成部20は、単画像選択部10から受け取ったM枚の画像の組とテンプレート上の各画像の配置との組み合わせを合成情報として決定してもよい。
 
【0038】
  図6は、本実施形態に係る合成部20の動作のフローの一例を示す図である。まず、ステップS201にて、合成部20は変数xに初期値1を代入し、続くステップS202にて、x番目のテンプレートを選択する。x番目のテンプレートには、M個の枠が設定されており、単画像選択部10により、M枚の画像の組がM!組だけ選択されている。そこで、これらの画像の組を順に選択するため、ステップS203にて、変数yに初期値1を代入し、続くステップS204にて、y番目のM枚の画像の組を選択する。
 
【0039】
  合成部20は、選択された画像の組について、ステップS205にて、M!通りの順列に従って、選択されたM枚の画像をM個の枠に配置し、M!枚の合成画像を作成する。続くステップS206では、選択されたx番目のテンプレートについて、全ての画像の組を選択したか否かを判定する。まだ全ての画像の組が選択されていなければ、ステップS207にてyに1を加算し、ステップS204へと戻り処理を繰り返す。
【0040】
  すでにすべての画像の組が選択されていれば、ステップS208へと進み、複数のテンプレートがすべて選択されたかを判定する。まだ全てのテンプレートが選択されていなければ、ステップS209へとすすみ、変数xに1を加算してステップS202へと処理を戻す。既に全てのテンプレートが選択されている場合には、あり得る全てのテンプレートについての全ての画像の組について、全ての順列に係る合成画像が作成されたことになるから、処理を終了する。
【0041】
  なお、本明細書では、画像を1枚の独立したものとみなして取り扱う場合に、かかる画像を「単画像」という場合がある。N枚の画像に含まれる個々の画像は「単画像」として取り扱われるほか、合成部20により作成された合成画像を、その元となった画像やテンプレートから離れて1枚の独立した画像として取り扱う場合には、合成画像は「単画像」として取り扱われることになる。
【0042】
  図1に戻り、評価部30は、合成部20から合成画像を受け取り、それぞれの合成画像について、単画像評価値の線形和である選択評価値と、合成画像の単画像評価値である合成評価値との線形和を少なくとも含む総合評価値(Reward)を、作成された合成画像と対応付け決定する。なお、評価部30は、合成部20から合成情報を受け取り、総合評価値を合成情報と対応付け決定してもよい。
 
【0043】
  ここで、単画像評価値とは、ある画像を単画像として見て評価した際に得られる評価値である。したがって、総合評価値に含まれる選択評価値とは、合成画像の合成元となったM枚の画像それぞれを単画像として見て評価して得られるM個の評価値の線形和を取ったものとの意味である。また、合成評価値とは、合成画像それ自体を1枚の単画像とみなして評価して得られる評価値のことである。
【0044】
  この結果、評価部30により、合成部20により作成された合成画像には、それぞれその評価として総合評価値が与えられることになる。その結果、この総合評価値に基づいて、より観者にとって魅力的な合成画像を決定することができるようになる。
【0045】
  そのためには、総合評価値が、合成画像を見る者にとっての魅力を合理的に反映するものとなっていなければならない。以降では、評価部30における総合評価値を決定する方法をより具体的に説明する。
【0046】
  本実施形態に係る評価部30では、総合評価値Rewardを次の数1により決定している。
【0047】
            【数1】
ここで、λ
1、λ
2、λ
3は任意の重み係数、w
iはi番目の枠に対応する重み係数、I
iはi番目の画像、I
wholeは合成画像、Score(I)は画像Iの単画像評価値、Similarity(I
i,I
j)は画像I
iと画像I
jの近似度である。
 
【0048】
  数1の右辺第1項は、選択評価値を示している。すなわち、選択されたM枚の画像に1~Mの番号を付けて区別し、i番目の画像Iiの単画像評価値Score(Ii)に任意の重み係数wiを乗じたものの和、すなわち線形和を選択評価値として用いている。重み係数λ1は、総合評価値Reward全体の中で選択評価値が占める重みを指定するものであり、1/Mは規格化係数である。
【0049】
  ここで、選択評価値は、画像Iiについての個々の単画像評価値Score(Ii)が高いほど、高い値を示す。すなわち、単画像としての評価の高い画像が多く選択されるほど、選択評価値は高いものとなる。一方で、規格化をしていなければ、選択評価値の大きさは、画像の選択枚数Mに依存してしまう。すなわち、より多くの画像を合成元として使用する合成画像ほど、選択評価値が大きくなってしまうことになる。
【0050】
  そこで、規格化係数を乗じることにより、選択評価値をMの値に依存しないものとしている。なお、規格化係数はMの関数であり、次の数2を満たすgとして与えられる。
【0051】
            【数2】
ここで、f(I)は画像Iに対して0でない評価値を与える任意の評価関数であり、aは0でない任意の実数である。
 
【0052】
  したがって、評価部30は、選択された画像の枚数であるMに基づき、選択評価値を規格化している。規格化係数gとしてa/Mは数2を満たしており、上で挙げた1/Mはa=1とした場合である。
【0053】
  また、重み係数wiは、テンプレートの枠ごとに定められている。すなわち、あるテンプレートにおいて、観者にとってより重要と考えられる位置の枠であるほど大きい値が、また相対的に重要でない一の枠であるほど小さい値が定められてよい。
【0054】
  図7は、重み係数w
iの設定例を示す図である。
図7中の(e)のテンプレートは、3×3のタイル配置された矩形の枠9個を含んでおり、それぞれの枠につけられた色が濃いものほど、重み係数w
iの値が大きいことを示している。このテンプレートは、得られた合成画像中の枠に配置された各画像を、観者が左上のものから順に右下に向かって見ていくと考えられる利用シーンを想定したものであり、図中の矢印の向きに従い、向かって左上の枠に近いものほど大きい重み係数w
iの値が与えられ、右下の枠に近いものほど小さい重み係数w
iの値が与えられている。
 
【0055】
  図7中の(f)のテンプレートも同じく、3×3のタイル配置された矩形の枠9個を含んでいる。このテンプレートでは、観者が合成画像を1個の画像として全体を見るような利用シーンを想定したものであり、観者の視線の中心となると考えられる中央の枠に大きい重み係数w
iの値が与えられ、周辺に配置された枠には相対的に小さい重み係数w
iの値が与えられている。
 
【0056】
  したがって、評価部30は、選択されたM枚の画像のそれぞれの単画像評価値Score(Ii)と、テンプレートにおいてあらかじめ定められたM個の枠のそれぞれと対応する重み係数wiとに基づいて、選択評価値を決定している。
【0057】
  数1の右辺第2項は、合成評価値を示している。すなわち、合成画像Iwholeを単画像として見たときの評価値Score(Iwhole)に、総合評価値Reward全体の中で選択評価値が占める重みを指定する重み係数λ2を乗じたものである。
【0058】
  合成評価値の意味は、合成画像を構成する個々の画像とは独立に、合成画像を単画像として見たときの観者に対する魅力を数値的に評価したものである。したがって、個々の画像の内容とは別に、合成画像全体としての色やディテールのバランスが優れたものほど合成評価値は高い値を示すものと考えられる。
【0059】
  ここで、画像Iに対する単画像評価値Score(I)を与える具体的な手法について説明する。単画像評価値は、所与の画像Iに対して、画像単体として見たときの魅力を合理的に与える手法であればどのようなものを用いてもよいが、ここでは、審美性評価値(Aesthetic  Value)と呼ばれるものと、CTR(Click  Through  Rate)予測値と呼ばれるもののいずれか、または両方を併用することにより単画像評価値を与える手法を説明する。
【0060】
  審美性評価値及び、CTR予測値は、いずれも、学習済みの機械学習モデルに画像Iを入力することにより得ることができる。審美性評価値を出力する機械学習モデルを得るための学習データは、研究用あるいは実用用として無償或いは有償でインターネット上に公開されているものが既に存在しているため、かかる学習データを用いて例えばCNN(畳み込みニューラルネットワーク)による機械学習モデルを訓練することにより、学習済みの機械学習モデルを容易に得ることができる。CTR予測値を出力する機械学習モデルについては、学習データとして、画像と当該画像について得られたCTRとの組を用いて、同様に、例えばCNNによる機械学習モデルを訓練することにより得ることができる。機械学習モデルをCTR予測値を出力するものとして訓練するための学習データは、例えばEC(電子商取引)サイトに用いられる各種の画像について、ユーザに表示された回数(インプレッション回数)に対する、ユーザが当該画像をクリック(選択)した回数の割合を計算して求めることにより入手可能である。
【0061】
  評価部30は、画像Iをそれぞれの機械学習モデルに入力することで、入力された画像I、ここでは選択された画像または合成画像、と対応する単画像評価値を取得することができる。本実施形態では、画像Iに対し得られる審美性評価値をScoreAesthetic(I)、CTR予測値をScoreCTR(I)との線形和により単画像評価値を得ている。すなわち、次の数3により単画像評価値Score(I)を得る。
【0062】
            【数3】
ここで、W
Aesthetic及びW
CTRは任意の重み係数である。
 
【0063】
  なお、単画像評価値Score(I)を得るにあたり、審美性評価値またはCTR予測値を単独で用いてもよいし、これ以外の評価値を使用してもよい。
【0064】
  数1の右辺第3項は、類似性評価値を示している。類似性評価値は、選択された画像同士の類似性を示す。本例では、選択されたM枚の画像に1~Mの番号を付けて区別した際に、このM枚の画像の中に互いに類似した画像が含まれるほどより高い値を示すものとなっている。
【0065】
  類似性評価値は、i番目の画像Iiとj番目の画像Ijとの類似性、すなわち近似の度合いを示す近似度Simiarity(Ii,Ij)の総和に、重み係数λ3と、規格化係数1/MC2を乗じたものである。ここで、重み係数λ3は、総合評価値Reward全体の中で類似性評価値が占める重みを指定するものである。
【0066】
  そのため、類似性評価値は、M枚の選択された画像の中に、互いに類似する画像の対が多く含まれるほど、また、その画像の対がより類似しているほど、高い値を示す。合成画像を作成する際に、互いに類似する画像が含まれていると、観者に対し冗長な印象を与えてしまうため、類似性評価値が高いほど、作成された合成画像の魅力は損なわれると考えられる。そのため、数1では、類似性評価値の符号は負となっており、類似性評価値の値が高いほど、総合評価値Rewardの値は小さくなる。
【0067】
  類似性評価値において近似度Simiarity(Ii,Ij)は、M枚の画像中から任意の2枚の画像を選択する組み合わせの数に等しいだけ求められる。その数は、MC2であるから、本例で用いた規格化係数はこの組み合わせの数の逆数であり、1/MC2となる。この規格化係数もまた、上述の数2を満足する。
【0068】
  ここで、画像Ii,Ij間における近似度Simiarity(Ii,Ij)を与える具体的な手法としては、既知の任意の画像処理技術において用いられる手法を用いてよく、そのような方法としては、CNN等のDNN(ディープニューラルネットワーク)その他の機械学習モデルを用いる手法、画像特徴量ベクトル間の距離を用いる手法、これらの方法の組み合わせ、等が例示される。本実施形態では、CNNに基づく機械学習モデルを用いて類似度を得ている。
【0069】
  数1に示されるように、総合評価値Rewardは、上で説明した選択評価値と、合成評価値と、類似性評価値の線形和となっている。各項の符号は、選択評価値と合成評価値が正、類似性評価値が負となるように線形結合されており、選択評価値と合成評価値が高い値を示すほど総合評価値Rewardは高い値を示し、類似性評価値が高い値を示すほど総合評価値Rewardは低い値を示すこととなる。すなわち、合成画像を構成するものとして選択された個々の画像の評価値が高いほど、また、合成画像全体を単画像として見た場合の評価値が高いほど総合評価値Rewardは高く評価され、合成画像を構成する画像の中に互いに類似する画像が含まれるほど、又その画像がより類似しているほど、総合評価値Rewardは低く評価されることになる。
【0070】
  このように総合評価値Rewardを設計することにより、得られた合成画像の観者に対する魅力を合理的かつ定量的に評価できる。なお、総合評価値Rewardを求める具体的な式は本実施形態に示したものと異なっていてもよい。例えば、合成画像に含まれる画像の部分集合を単画像として見た評価値を考慮してもよいし、類似性評価値はこれを考慮しないものとしてもよい。あるいは、類似性評価値において、より近い位置に配置された画像同士の近似度、例えば隣接する画像、の影響がより大きいものとなるように、適宜の重み付けをするなどしてもよい。
【0071】
  図8は、本実施形態に係る評価部30の動作のフローの一例を示す図である。まず、ステップS301にて、評価部30は変数xに初期値1を代入し、続くステップS302にて、x番目の合成画像を選択する。ステップS303では、数1に基づいて、選択されたx番目の合成画像の総合評価値Rewardを決定する。
 
【0072】
  続くステップS304では、全ての合成画像を選択したか否かを判定する。まだ全ての合成画像が選択されていなければ、ステップS305にてxに1を加算し、ステップS302へと戻り処理を繰り返す。既にすべての合成画像が選択されていれば、全ての合成画像について、総合評価値Rewardが決定されたことになるから、処理を終了する。
【0073】
  図1に戻り、合成部20により作成された合成画像には、評価部30により総合評価値Rewardが対応付けられて与えられる。合成画像選択部40は、総合評価値Rewardに基づいて、少なくとも一の合成画像を選択する。なお、合成画像選択部40は、総合評価値Rewardに基づいて、少なくとも一の合成情報を選択し、選択された合成情報に基づき合成画像を作成してもよい。
 
【0074】
  もっとも単純には、最も高い総合評価値Rewardを示す合成画像を選択すればよい。その他の動作としては、総合評価値Rewardの高い上位の任意の枚数、例えば10枚を示し、ユーザに選択させるようにすることもできる。
【0075】
  図9は、本実施形態に係る合成画像選択部40の動作のフローの一例を示す図である。本実施形態に係る合成画像選択部40は、単に最も高い総合評価値Rewardを示す合成画像を選択するものであるから、ステップS401にて、かかる合成画像を選択し、動作を終了すればよい。
 
【0076】
  なお、以上の説明では、説明の便宜上、
図1に示した各機能ブロックの動作が個別に完結するものとして説明した。すなわち、単画像選択部10の動作は単画像選択部10のみにて完結し、以下同じ要領で説明したが、この通りでなく、
図1の各機能ブロックの動作は逐次的に行われてもよい。例えば、単画像選択部10において、M枚の画像が1組選択されると、選択されたM枚の画像は直ちに合成部20に受け渡され、受け渡されたM枚の画像についての合成画像が作成されてよい。同様に、合成部20において1枚の合成画像が作成されると、作成された合成画像は直ちに評価部30に受け渡され、その総合評価値が決定されてよい。
 
【0077】
  以上説明した第1の実施形態に係る情報処理装置100では、与えられたN枚の画像に対して、可能なすべての組み合わせのM枚の画像を選択し、また、M枚の画像の組それぞれについて、テンプレートに画像を配置するすべての順列について合成画像を得てその総合評価値を決定している。この手法は、確実に、有り得る最大の総合評価値を有する合成画像を得ることができる点で優れているが、Nの数が増大すると、総合評価値を決定すべき合成画像の数が指数関数的に増大し、情報処理の計算負荷が重くなる欠点がある。
【0078】
  そこで、
図10に示す本発明の第2の実施形態に係る情報処理装置200では、より小さい計算負荷によって合理的に高い総合評価値を示す合成画像を選択することを企図している。なお、情報処理装置200において、第1の実施形態に係る情報処理100と共通の又は対応する構成には同符号を付し、以下では第1の実施形態に係る情報処理100と異なっている点のみを説明することとし、共通する点については第1の実施形態についてした説明を援用するものとする。
 
【0079】
  情報処理装置200では、有り得る全ての合成画像に対する総合評価値を決定することなく、特定のアルゴリズムを用い、一又は複数の既知の合成画像についての既知の総合評価値に基づいて、作成し評価すべき合成画像を逐次決定することにより、探索的に最も高い総合評価値を与える、又は最も高い総合評価値を与えると考えられる合成画像を発見するように構成されている。
【0080】
  すなわち、情報処理装置200の合成画像選択部40は、すでに得られている合成画像とその総合評価値に基づいて、単画像選択部10に次に選択すべきM枚の画像の組を指定し、また、合成部20について、次に選択すべき画像の配置の順列を指定するようになっている。これにより、最初は任意に選択された1又は複数のM枚の画像の組及びそのテンプレートに対する配置の順列による合成画像についての総合評価値を得、以降はそれに基づいて、より高い総合評価値を示す合成画像を探索していく。
【0081】
  そのような手法として、線形計画法におけるシンプレックス法、カーマーカーアルゴリズムといった各種のアルゴリズムや、ヒューリスティック探索における山登り法、最良優先探索、A*アルゴリズムといった各種のアルゴリズムを用いてよい。したがって、第2の実施形態に係る情報処理装置200は、所与の画像の枚数Nが多い場合や、画像配置の順列の数が多くなる、テンプレートあたりに含まれる枠の個数Mが多い場合に、合理的な計算時間及び計算負荷において、観者にとって魅力的な合成画像を得ようとする際に有用である。一方で、N,Mが比較的小さい値である場合には、第1の実施形態に係る情報処理装置100を用いると、最適な合成画像が得られることが保証される利点がある。