(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024083201
(43)【公開日】2024-06-20
(54)【発明の名称】新規な作風のデジタルデータの特定
(51)【国際特許分類】
G06T 1/00 20060101AFI20240613BHJP
【FI】
G06T1/00 500Z
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023062803
(22)【出願日】2023-04-07
(62)【分割の表示】P 2022197061の分割
【原出願日】2022-12-09
(71)【出願人】
【識別番号】516153775
【氏名又は名称】株式会社Creator’s NEXT
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】窪田 望
【テーマコード(参考)】
5B057
【Fターム(参考)】
5B057BA23
5B057CA01
5B057CA08
5B057CA12
5B057CA16
5B057CB01
5B057CB08
5B057CB12
5B057CB16
5B057DA12
5B057DA16
5B057DC05
5B057DC36
5B057DC40
(57)【要約】
【課題】新規な作風を有するデジタルデータを特定することを容易に行うことができる仕組みを提供する。
【解決手段】情報処理方法は、情報処理装置に含まれる1又は複数のプロセッサが、生成指示を受け付けること、複数のデジタルコンテンツにおけるN次元の各第1特徴データと、生成指示に応じて生成される1又は複数のN次元の第2特徴データとの類似度を用いて、各第2特徴データの中から、N次元の座標系内で疎な領域内の第3特徴データを特定すること、特定された第3特徴データに関する情報を出力すること、を実行する。
【選択図】
図9
【特許請求の範囲】
【請求項1】
情報処理装置に含まれる1又は複数のプロセッサが、
生成指示を受け付けること、
複数のデジタルコンテンツにおけるN次元の各第1特徴データと、前記生成指示に応じて生成される1又は複数のN次元の第2特徴データとの類似度を用いて、各第2特徴データの中から、前記N次元の座標系内で疎な領域内の第3特徴データを特定すること、
特定された前記第3特徴データに関する情報を出力すること、
を実行する情報処理方法。
【請求項2】
前記1又は複数のプロセッサが、
前記第3特徴データに基づいてデジタルコンテンツを生成することをさらに実行し、
前記出力することは、
前記生成されるデジタルコンテンツを出力することを含む、請求項1に記載の情報処理方法。
【請求項3】
前記デジタルコンテンツを生成することは、
デジタルコンテンツの生成を行う機械学習モデルを利用して前記第3特徴データから前記デジタルコンテンツを生成することを含む、請求項2に記載の情報処理方法。
【請求項4】
前記特定することは、
各時代のデジタルコンテンツの流行から将来のデジタルコンテンツの流行を予測する回帰問題を解く学習モデルであって、各時代に分類された複数のデジタルコンテンツから各時代の流行が学習された前記学習モデルを用いて、将来の流行を示すデジタルコンテンツの前記第3特徴データを特定することを含む、請求項1に記載の情報処理方法。
【請求項5】
情報処理装置に含まれる1又は複数のプロセッサに、
生成指示を受け付けること、
複数のデジタルコンテンツにおけるN次元の各第1特徴データと、前記生成指示に応じて生成される1又は複数のN次元の第2特徴データとの類似度を用いて、各第2特徴データの中から、前記N次元の座標系内で疎な領域内の第3特徴データを特定すること、
特定された前記第3特徴データに関する情報を出力すること、
を実行させる情報処理方法。
【請求項6】
1又は複数のプロセッサを含む情報処理装置であって、
前記1又は複数のプロセッサは、
生成指示を受け付けること、
複数のデジタルコンテンツにおけるN次元の各第1特徴データと、前記生成指示に応じて生成される1又は複数のN次元の第2特徴データとの類似度を用いて、各第2特徴データの中から、前記N次元の座標系内で疎な領域内の第3特徴データを特定すること、
特定された前記第3特徴データに関する情報を出力すること、
を実行する情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示技術は、新規な作風のデジタルデータの特定を行うことが可能な情報処理方法、プログラム及び情報処理装置に関する。
【背景技術】
【0002】
近年、キーワードを入力して画像を生成する画像生成AI(Artificial Intelligence)が知られている(例えば非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】"CompVis/stable-diffusion", [online], [令和4年11月7日検索],インターネット<URL: https://github.com/CompVis/stable-diffusion>
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来技術では、ユーザが作成したい画像のキーワードを入力して、これらのキーワードに適合する唯一無二の画像が生成されるが、従来の画像の作風(画家の特色や傾向)とは全く異なる新規な画像が生成されるわけではない。
【0005】
そこで、本開示技術の目的の1つは、新規な作風を有するデジタルデータを特定することを容易に行うことができる仕組みを提供する。
【課題を解決するための手段】
【0006】
本開示技術の一態様に係る情報処理方法は、情報処理装置に含まれる1又は複数のプロセッサが、生成指示を受け付けること、複数デジタルコンテンツにおけるN次元の各第1特徴データと、前記生成指示に応じて生成される1又は複数のN次元の第2特徴データとの類似度を用いて、各第2特徴データの中から、前記N次元の座標系内で疎な領域内の第3特徴データを特定すること、特定された前記第3特徴データに関する情報を出力すること、を実行する。
【発明の効果】
【0007】
本開示技術によれば、新規な作風を有するデジタルデータを特定することを容易に行うことができる仕組みを提供する。
【図面の簡単な説明】
【0008】
【
図1】実施形態に係るシステム構成の一例を示す図である。
【
図2】実施形態に係るサーバの情報処理装置の物理的構成の一例を示す図である。
【
図3】実施形態に係る情報処理装置の処理ブロックの一例を示す図である。
【
図4】3次元の座標空間に過去画像の特徴データがマッピングされた例を示す図である。
【
図5】任意の特徴データが3次元座標空間にマッピングされた例を示す図である。
【
図6】3次元座標空間における各第1特徴データの最外形を形成する例を示す図である。
【
図7】時代に応じて作風の流行を推定する例を示す図である。
【
図8】実施形態に係る画像生成の構成例を示す図である。
【
図9】実施形態に係る情報処理装置の処理の一例を示すフローチャートである。
【
図10】実施形態に係る画像生成処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0009】
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0010】
<システム構成>
図1は、実施形態に係るシステム構成の一例を示す図である。
図1に示すシステム1において、サーバ10と、情報処理装置20とが、ネットワークを介してデータ送受信可能なように接続される。情報処理装置20は、複数の装置がネットワークを介してサーバ10に接続されてもよい。
【0011】
サーバ10は、データを収集、分析可能な情報処理装置であり、1つ又は複数の情報処理装置から構成されてもよい。情報処理装置20は、例えばユーザが利用するパーソナルコンピュータ、スマートフォン、タブレット端末などの装置である。
【0012】
図1に示すシステム1は、例えば、サーバ10が、情報処理装置20から新規な作風の画像を生成する画像生成指示を受け付けると、様々な流派や年代の画像の特徴データにより生成される空間を用いて、これまで描かれたり生成されたりしていない作風の画像を特定する。具体例として、特徴データがマッピングされた空間内で疎な空間は、これまで存在しない作風の特徴データを含む空間を示すため、この疎な空間内から特徴データを特定すればよい。以下、本開示技術を構成する各装置の物理的構成について説明する。
【0013】
<ハードウェア構成>
図2は、実施形態に係るサーバの情報処理装置10の物理的構成の一例を示す図である。サーバ10は、演算部に相当する1又は複数のCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。
【0014】
実施形態では、情報処理装置10が一台の情報処理装置で構成される場合について説明するが、情報処理装置10は、複数のコンピュータ又は複数の演算部が組み合わされて実現されてもよい。また、
図2で示す構成は一例であり、情報処理装置10はこれら以外の構成を有してもよいし、これらの構成のうち一部を有さなくてもよい。
【0015】
CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、例えば、所定の生成指示を取得すると、これまでに存在しない新規な作風の特徴データを特定する処理を実行するプログラム(「本開示プログラム」とも称す。)を実行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを受け取り、データの演算結果を表示部10fに表示したり、RAM10bに格納したりする。
【0016】
RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記憶素子で構成されてよい。RAM10bは、CPU10aが実行するプログラム、様々な作風や年代の画像やこれらの画像の特徴データなどのデータを記憶してもよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶されていてもよいし、これらの一部が記憶されていなくてもよい。
【0017】
ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記憶素子で構成されてよい。ROM10cは、例えば生成プログラムや、書き換えが行われないデータを記憶してよい。
【0018】
通信部10dは、情報処理装置10を他の機器に接続するインターフェースである。通信部10dは、インターネット等の通信ネットワークに接続されてよい。
【0019】
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード及びタッチパネルを含んでよい。
【0020】
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成されてよい。表示部10fが演算結果を表示することは、XAI(eXplainable AI:説明可能なAI)に貢献し得る。表示部10fは、例えば、学習結果などを表示してもよい。
【0021】
本開示プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な非一時的な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。情報処理装置10では、CPU10aが特定プログラムを実行することにより、後述する
図3や
図9を用いて説明する様々な動作が実現され得る。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、情報処理装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えてもよい。また、情報処理装置10は、GPU(Graphical Processing Unit)やASIC(Application Specific Integrated Circuit)を備えてもよい。なお、情報処理装置20は、情報処理装置10と同様の構成を有してもよい。
【0022】
<処理構成例>
図3は、実施形態に係る情報処理装置10の処理ブロックの一例を示す図である。情報処理装置10は、受付部11、特定部12、出力部13、生成部14、及び記憶部15を備える。
図3に示す特定部12、生成部14は、例えばCPU10aなどにより実行されて実現され、受付部11及び出力部13は、例えば通信部10dなどにより実現され、記憶部15は、RAM10b及び/又はROM10cなどにより実現され得る。情報処理装置10は、量子コンピュータなどで構成されてもよい。
【0023】
受付部11は、所定の生成指示を受け付ける。例えば、受付部11は、ユーザ装置などの他の情報処理装置20から送信された画像生成指示を、通信部10dを介して受け付ける。画像生成指示は、特徴データ生成指示でもよい。
【0024】
特定部12は、複数の画像におけるN次元の各特徴データ(「第1特徴データ」ともいう。)と、取得された生成指示に応じて生成される1又は複数のN次元の特徴データ(「第2特徴データ」ともいう。)との距離を用いて、各第2特徴データの中から、N次元の座標系内の疎な領域内の特徴データ(「第3特徴データ」ともいう。)を特定する。N次元の座標系のデータは、例えば、各時代の多数の絵画などを撮影するなどしてデジタルデータ化し、デジタルデータ化した画像からN次元の特徴データが抽出され、N次元の特徴データがN次元の座標系にマッピングさることで生成されてもよい。N次元は、例えば、RGBなどの各成分、又は輝度、透明度などにより表され、座標系の各軸は所定範囲(例、0~255)で表されてもよい。
【0025】
ここで、過去の画像データの特徴データをマッピングした座標系において、疎な領域にある特徴データは、これまでにない作風の画像の特徴データであることを示している。疎な領域の探索方法について、例えば、特定部12は、乱数などを用いてランダムにN次元の第2特徴データを所定数になるまで生成し、ランダムに生成された第2特徴データと、座標系にマッピングされた多数の過去画像の各第1特徴データとを用いて平均二乗誤差(MSE:Mean Square Error)を算出する。次に、特定部12は、このMSEが一番大きい特徴データ、すなわち、過去画像の各第1特徴データから最も離れている第2特徴データを、疎な領域内の第3特徴データとして特定してもよい。MSEは、類似度の一例であり、その他の指標が用いられてもよい。
【0026】
また、過去画像の各第1特徴データがマッピングされた座標系をユーザに示すことにより、ユーザが座標系で指定した座標系内の点を示す第2特徴データが情報処理装置20から送信され、特定部12は、各第2特徴データを1又は複数の第2特徴データとしてもよい。また、特定部12は、情報処理装置20から送信された所定の特徴データを、疎な領域内の第3特徴データとして特定してもよい。
【0027】
出力部13は、特定部12により特定された第3特徴データに関する情報を出力する。例えば、出力部13は、特定された第3特徴データそのものを出力してもよいし、特定された第3特徴データに基づき生成された情報を出力してもよい。第3特徴データに基づき生成された情報は、例えば、この第3特徴データから生成された画像や、この第3特徴データを直接的又は間接的にユーザに通知する通知情報などを含む。
【0028】
以上の処理により、新規な作風を有する画像の第3特徴データを特定することを容易に行うことが可能になる。
【0029】
また、特定部12は、学習データに含まれる前記各第1特徴データに基づいて画像を分類する学習が行われた学習モデル(学習済みモデル)12aに、任意の第2特徴データを入力して、第3特徴データを特定することを含んでもよい。
【0030】
例えば、特定部12は、過去画像の第1特徴データを学習データとして分類問題(例、クラスタリング)を解く機械学習を行う。このとき、特定部12は、新たな任意の第2特徴データを学習モデル12aに入力し、各クラスタとの類似度が一番低い第2特徴データを第3特徴データとして特定してもよい。なお、特定部12は、外部装置から学習済みの学習モデル12aを取得してもよい。
【0031】
以上の処理により、新規な作風の画像の第3特徴データを探索することを容易に行うことができるようになる。
【0032】
また、特定部12は、N次元座標系内の各第1特徴データを包含する最外形を特定し、最外形内の疎な領域内の第2特徴データを第3特徴データとして特定することを含んでもよい。例えば、座標系内の中心から外側にある各第1特徴データを特定して連結し、最外形のポリゴンを生成してもよい。このとき、特定部12は、生成した最外形のポリゴン内にあって、最も疎な領域内にある第2特徴データ、例えば、過去画像の各第1特徴データから最も類似度が低い第2特徴データを第3特徴データとして特定してもよい。
【0033】
また、特定部12は、学習モデル12aを用いる場合は、最外形の外側にある第2特徴データに対してペナルティ項を設けて損失関数を定義することで、最外形の外側にある第2特徴データが第3特徴データとして特定されにくくしてもよい。
【0034】
以上の処理により、過去画像の作風に基づき形成される領域内での疎な領域を特定することが可能になり、これまで評価されてきた作風に基づき、これまでに存在しなかった作風の特徴データを特定することが可能になる。すなわち、人に受け入れられやすい作風の画像の特徴データを特定することが可能になる。また、最外形のポリゴンは、最外の境界を形成する各特徴データから形成されるだけではなく、境界の各特徴データから所定範囲内にある各点により形成されてもよい。
【0035】
また、特定部12は、M次元の第1特徴データを、M次元よりも小さいN次元の第1特徴データに圧縮することを含んでもよい。例えば、特定部12は、主成分分析(PCA:Principal Component Analysis)を用いて次元圧縮を行ってもよい。具体例として、特定部12は、RGBの各成分の256(M)を所定数(N)に圧縮したり、又は、RGB、輝度、色差、透明度などの各成分(M)を所定数(N)に圧縮したりする。
【0036】
以上の処理により、特定部12は、次元圧縮された座標系を用いて、任意の第1特徴データを次元圧縮することにより、類似度の算出を容易にすることが可能になり、処理負荷を軽減することができる。
【0037】
生成部14は、特定部12により特定された第3特徴データに基づいて画像を生成する。例えば、生成部14は、第3特徴データに基づいて、所定サイズの画像を生成する。このとき、生成部14は、生成された画像が、特定された第3特徴データを維持するようにして所定の方法により画像を生成する。
【0038】
このとき、出力部13は、生成部14により生成される画像を出力することを含んでもよい。出力部13は、画像生成要求を行った情報処理装置20に、生成された画像を出力してもよい。
【0039】
以上の処理により、新規な作風を示す第3特徴データから生成された画像をユーザに提供することが可能になる。
【0040】
また、生成部14は、画像生成を行う機械学習モデルを利用して探索された第3特徴データから画像を生成することを含んでもよい。例えば、生成部14は、公知の画像生成AIを利用して、第3特徴データを画像生成AIに入力することで画像を生成してもよい。
【0041】
例えば、生成部14は、公知のDiffusionモデル、Stable Diffusionモデル等を用いることで、画像の特徴データに基づく粗い画像から精緻な画像を生成してもよい。
【0042】
以上の処理により、画像生成を容易にすることが可能になり、第3特徴データを有する複数の画像を生成することを容易にすることができる。なお、画像生成AIにより生成された複数の画像をユーザに提示し、少なくとも1つの画像を選択してもらうことで、ユーザの好みを画像生成AIが学習してもよい。これにより、そのユーザの好みの画像を生成することが可能になる。
【0043】
また、特定部12は、各時代の画像の流行から将来の画像の流行を予測する回帰問題を解く学習モデル12aであって、各時代に分類された複数の画像から各時代の流行が学習された学習モデル12aを用いて、将来の流行を示す画像の第3特徴データを特定することを含んでもよい。例えば、特定部12は、画像の作風の流行を予測する学習モデル12aを用いることにより、将来人類に好まれる作風を予測し、予測された第3特徴データを特定する。また、特定部12は、各時代と、各時代に流行した画像の第1特徴データをパラメータとして、各時代を入力して流行を予測する関数を生成してもよい。
【0044】
また、特定部12は、何年先かを指定することで、指定された年に流行すると予測される作風の特徴データを特定してもよい。生成部14は、予測された特徴データに基づいて画像を生成してもよい。
【0045】
以上の処理により、将来流行すると予測される作風の特徴データを特定することが可能になる。例えば、10年後、20年後などの将来の所定年を指定することで、その指定年の流行の作風の特徴データを予測することが可能になる。
【0046】
また、生成部14は、特徴データに対して次元圧縮が行われている場合、次元を元に戻す処理を行ってから画像を生成してもよい。これにより、画像生成に用いるパラメータを増やすことができるため、生成される画像の精度を向上させることが可能になる。
【0047】
<適用例>
図4~7は、実施形態の適用例について説明する。
図4は、3次元の座標空間に過去画像の特徴データがマッピングされた例を示す図である。
図4に示す例において、過去画像の特徴データ(第1特徴データ)は点で表され、第1乃至3次元は、RGBの各成分に対応してもよい。
【0048】
図5は、任意の特徴データが3次元座標空間にマッピングされた例を示す図である。
図5に示す点A1乃至A8は、生成された任意の特徴データ(第2特徴データ)であり、*で表される。
【0049】
図5に示す例において、特定部12は、第2特徴データそれぞれと、各第1特徴データとの平均二乗誤差(類似度の一例)を求め、平均二乗誤差が一番大きい第2特徴データを第3特徴データとして特定する。
図5に示す例では、第2特徴データA1が、各第1特徴データから最も離れた第3特徴データとする。生成部14は、第2特徴データA1に基づいて画像を生成する。これにより、新規な作風の画像を生成することが可能になる。
【0050】
図6は、3次元座標空間における各第1特徴データの最外形を形成する例を示す図である。
図6に示す例では、最外形を点線の楕円形状で表すが、ポリゴン形状で表してもよい。
図6に示す例において、特定部12は、最外形の外側にある第2特徴データA1及びA8は、特定対象から除外する。この場合、特定部12は、最外形の内部にある第2特徴データの中から、各第1特徴データとの平均二乗誤差が一番大きい(類似度が一番小さい)第3特徴データを特定する。例えば、第2特徴データA5の平均二乗誤差が一番大きいとする。
【0051】
第2特徴データA5は、既存の作風により形成される領域の中で、最も疎な空間に存在する特徴データであり、これまでに存在しない作風の特徴データであることを表す。また、生成部14は、第2特徴データA5に基づいて画像を生成してもよい。これにより、既存の作風により形成される領域又は空間の中において、既存にはない作風の画像を自動で生成することができる。
【0052】
図7は、時代に応じて作風の流行を推定する例を示す図である。
図7に示す例では、第N年代の作風が密集した領域が特定され、古い年代から、各年代の作風の第1特徴データを推定する関数F1が求められる。例えば、特定部12は、関数F1として、各年代の第1特徴データの集合から求められる代表データを用いて、各年代の代表データを順に辿るように関数を算出する。関数F1は1次関数の直線でも、N次関数などの曲線でもよい。
【0053】
例えば、西洋美術の場合、以下の時代ごとに流行した画像の第1特徴データを用いることが可能である。
12世紀:ゴシック美術
15世紀末:北方ルネサンス美術
15世紀末から30年間ほど:盛期ルネサンス美術
17世紀:バロック美術
18世紀:ロココ美術
18世紀後半:新古典主義
19世紀前半:写実主義
19世紀後半:印象派
20世紀初頭:キュビズム
20世紀以降:21世紀美術
【0054】
関数F1は、年代を入力することで、その年代の流行の作風を推定する関数となる。関数F1は、各年代の第1特徴データを学習データとし、流行の特徴データを推定する回帰問題を解く機械学習モデルにより学習を行うことで算出されてもよい。
【0055】
以上の処理により、ある時代を特定することで、その時代の作風を表す第3特徴データを推定することが可能になる。また、生成部14は、推定された第3特徴データに基づいて画像を生成してもよい。これにより、年代を指定することで、その年代の流行を示す作風の画像を自動で生成することが可能になる。算出された関数(学習モデル)F1は、記憶部15に記憶され、外部の装置に出力されてもよい。なお、各年代の流行の作風は、地域ごとに設定されてもよい。例えば、特定部12は、西洋美術、日本美術、東洋美術などの各地域の各絵画の画像の作風から、各地域の流行の作風を推定する関数を求めてもよい。
【0056】
<画像生成の構成例>
ここで、生成部14が、GANs(Generative adversarial networks)と呼ばれる敵対的生成ネットワークの仕組みを用いて画像生成する場合について説明する。この場合、GANsの生成器(generator)として、第3特徴データに基づいて画像を生成する生成モデルが用いられ、識別器(discriminator)として、ユーザの好みの画像を学習した学習モデルが用いられる。例えば、識別器は、事前に複数の画像をユーザに提示し、ユーザが選択した1又は複数の好みの画像の特徴データを学習しておくとよい。
【0057】
図8は、実施形態に係る画像生成の構成例を示す図である。生成部14は、例えば、敵対的生成ネットワーク(GANs)を実行することにより所定の画像を生成する。具体例として、生成部14は、生成器142と識別器144とを含む敵対的生成ネットワーク(GANs)を用いて、画像(画像データ)を生成する。
【0058】
生成器142は、入力された第3特徴データとノイズ等を用いて画像を生成する。ノイズは乱数でもよい。例えば、生成器142は、GANsのいずれかの所定の構造を有するニューラルネットワークが用いられてもよい。生成器142は、生成した画像を識別器144に出力する。
【0059】
識別器144は、生成器142により生成された画像が、ユーザの好みに対応する画像であるか否かを推定する。識別器144は、学習し、推定されたユーザの好みが「肯定」を示す場合、画像に対して「真」と識別する。他方、識別器144は、学習し、推定されたユーザの好みが「否定」を示す場合、画像に対して「偽」と識別する。ユーザの好みを示す判定は、学習の結果が好みか否かの分類結果を示す場合は分類結果に基づいて判定し、学習の結果がユーザの好みの指標値を示す場合は閾値と指標値との比較に基づいて判定する。
【0060】
判定部146は、識別器144の識別結果が「偽」(好みではない)を示す場合、画像を生成し直すため、ノイズを変更するように生成器142に指示を行い、識別器144の識別結果が「真」(好み)を示す場合、その旨を出力部13に出力する。判定部146は、識別結果の内容にかかわらず、識別結果を出力部13に出力してもよい。
【0061】
生成部14は、識別器144による真贋の判別結果により、生成器142と識別器144とのパラメータを更新してもよい。例えば、生成部14は、識別器144が、ユーザの好みをより適切に推定できるように、誤差逆伝搬法(バックプロパゲーション)を用いて識別器144のパラメータを更新してもよい。また、生成部14は、識別器144が、生成器142によって生成された画像を真であると識別するように、誤差逆伝搬法を用いて生成器142のパラメータを更新してもよい。生成部14は、最終的に生成された画像を出力部13に出力する。
【0062】
また、出力部13は、最終的にユーザが好みと判定した画像を、ユーザに対して出力してもよい。以上の処理により、ユーザが好きそうな画像になるまで、画像を生成し直すことが可能になる。
【0063】
<動作例>
図9は、実施形態に係る情報処理装置10の処理の一例を示すフローチャートである。
図9に示す例では、所定の生成指示を受け付けてから特定された特徴データが出力されるまでの処理が含まれる。
【0064】
ステップS102において、受付部11は、画像生成指示を受け付ける。画像生成指示は、特徴データ生成指示でもよい。
【0065】
ステップS104において、特定部12は、複数の画像におけるN次元の各第1特徴データと、画像生成指示に応じて生成される1又は複数のN次元の第2特徴データとの距離を用いて、各第2特徴データの中から、N次元の座標系内で疎な領域内の第3特徴データを特定する。
【0066】
ステップS106において、出力部13は、特定部12により特定された第3特徴データに関する情報を出力する。
【0067】
ステップS108において、出力部13は、生成部14により、第3特徴データに基づく画像が生成された場合、この画像を出力してもよい。
【0068】
本実施形態によれば、新規な作風を有する画像を特定することを容易に行うことができる。
【0069】
図10は、実施形態に係る画像生成処理の一例を示すフローチャートである。
図10に示す処理は、ユーザ好みの画像になるまで、画像を生成し続ける例を示す。
【0070】
ステップS202において、生成器142は、所定の画像を生成する。
【0071】
ステップS204において、識別器144は、所定の画像を、ユーザの好みを学習した学習モデルに入力し、所定の画像に対するユーザの好みの識別結果を取得する。
【0072】
ステップS206において、判定部146は、識別結果が、ユーザの好みに関する所定条件を満たすか否かを判定する。例えば識別結果がユーザ好み(「真」)を示せば(ステップS206-YES)、処理はステップS210に進み、識別結果がユーザ好みではない(「偽」)を示せば(ステップS206-NO)、処理はステップS208に進む。
【0073】
ステップS208において、判定部146は、生成器142に画像を生成する指示を行う。その後、処理はステップS202に戻る。
【0074】
ステップS210で、出力部13は、生成された画像を出力する。
【0075】
以上の処理により、新規な作風の特徴データからユーザの好みの画像をより適切に生成可能にする仕組みを提供することができる。また、ユーザ好みの画像になるまで、画像を生成し直すことが可能になる。
【0076】
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
【0077】
<変形例>
上記実施形態では、新規な作風の画像を生成する場合について説明したが、同様に、新規な作風の音楽やメタバース空間などのデジタルコンテンツを生成することも可能である。上記実施形態の画像を所定のデジタルコンテンツに置き換えることにより、新規な作風のデジタルコンテンツを生成することが可能になる。
【符号の説明】
【0078】
10…情報処理装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…受付部、12…特定部、12a…学習モデル、13…出力部、14…生成部