特許7580441 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ヤフー株式会社の特許一覧

特許7580441情報処理装置、情報処理方法、及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-31

(45)【発行日】2024-11-11

(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム

(51)【国際特許分類】

G06T 7/00 20170101AFI20241101BHJP

G06F 16/58 20190101ALI20241101BHJP

【ＦＩ】

G06T7/00 350B

G06F16/58

【請求項の数】 15

(21)【出願番号】P 2022202512

(22)【出願日】2022-12-19

(65)【公開番号】P2024087603

(43)【公開日】2024-07-01

【審査請求日】2023-10-18

(73)【特許権者】

【識別番号】500257300

【氏名又は名称】ＬＩＮＥヤフー株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】土井賢治

【審査官】伊知地和之

(56)【参考文献】

【文献】中国特許出願公開第１１５１７０８２５（ＣＮ，Ａ）

【文献】中国特許出願公開第１１３２３９９６０（ＣＮ，Ａ）

【文献】中国特許出願公開第１１１０８０６０５（ＣＮ，Ａ）

【文献】からあげ，話題の画像生成ＡＩ「ＳｔａｂｌｅＤｉｆｆｕｓｉｏｎ」で遊ぶ！，日経Ｌｉｎｕｘ，日本，日経ＢＰ，2022年12月08日，第25巻第1号，pp.85～93

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｔ１／００－１／４０

Ｇ０６Ｔ３／００－５／９４

Ｇ０６Ｔ７／００－７／９０

Ｇ０６Ｖ１０／００－２０／９０

Ｇ０６Ｖ３０／４１８

Ｇ０６Ｖ４０／１６

Ｇ０６Ｖ４０／２０

ＣＳＤＢ（日本国特許庁）

(57)【特許請求の範囲】

【請求項1】

所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像と、前記学習用画像における前記所定の対象の特徴を示すラベルとを取得する取得部と、
前記取得部により取得された前記学習用グレースケール画像と前記ラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を前記学習用画像に近づけるように変換する拡散モデルを学習する学習部と、
前記学習部により学習された前記拡散モデルにより生成された変換後画像を用いた画像検索サービスをユーザに提供する提供部と、
を備えることを特徴とする情報処理装置。

【請求項2】

前記取得部は、
前記学習用画像における前記所定の対象の色、形状、雰囲気の少なくとも１つを含む前記特徴を示す前記ラベルを取得する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記取得部は、
前記学習用画像における前記所定の対象の色を示す前記ラベルを取得し、
前記学習部は、
前記一のノイズ画像を、前記ラベルが示す色の前記所定の対象を含む前記学習用画像に近づけるように変換する前記拡散モデルを学習する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項4】

前記取得部は、
前記一のノイズ画像を取得し、
前記学習部は、
前記取得部により取得された前記一のノイズ画像を前記学習用画像に近づけるように変換する前記拡散モデルを学習する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項5】

前記取得部は、
前記学習用画像にノイズを段階的に付与した複数の段階画像を取得し、
前記学習部は、
前記取得部により取得された前記複数の段階画像を用いて、前記拡散モデルを学習する
ことを特徴とする請求項４に記載の情報処理装置。

【請求項6】

前記学習部は、
前記複数の段階画像のうち一の段階画像からノイズを１段階除去した画像である前記段階画像を生成するように、前記拡散モデルを学習する
ことを特徴とする請求項５に記載の情報処理装置。

【請求項7】

前記取得部は、
第１段階画像と、前記第１段階画像に１段階ノイズが付与された第２段階画像とを含む前記複数の段階画像を取得し、
前記学習部は、
前記第２段階画像からノイズを１段階除去した前記第１段階画像を生成するように、前記拡散モデルを学習する
ことを特徴とする請求項５に記載の情報処理装置。

【請求項8】

前記取得部は、
前記第２段階画像に１段階ノイズが付与された第３段階画像を含む前記複数の段階画像を取得し、
前記学習部は、
前記第３段階画像からノイズを１段階除去した前記第２段階画像を生成するように、前記拡散モデルを学習する
ことを特徴とする請求項７に記載の情報処理装置。

【請求項9】

前記提供部は、
前記変換後画像を用いた画像検索の結果を前記ユーザが利用する端末装置に送信する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項10】

前記提供部は、
前記変換後画像に類似する類似画像を前記ユーザが利用する端末装置に送信する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項11】

前記取得部は、
前記ユーザから変換対象となる対象画像を取得し、
前記提供部は、
前記対象画像のグレースケール画像と前記拡散モデルとを用いて生成された前記変換後画像を用いたサービスを前記ユーザに提供する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項12】

前記取得部は、
前記ユーザから特徴を指定する指定情報を取得し、
前記提供部は、
前記指定情報を用いて生成された前記変換後画像を用いたサービスを前記ユーザに提供する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項13】

前記学習部により学習された前記拡散モデルを用いて、変換後画像を生成する処理部、
をさらに備えることを特徴とする請求項１に記載の情報処理装置。

【請求項14】

コンピュータが実行する情報処理方法であって、
所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像と、前記学習用画像における前記所定の対象の特徴を示すラベルとを取得する取得工程と、
前記取得工程により取得された前記学習用グレースケール画像と前記ラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を前記学習用画像に近づけるように変換する拡散モデルを学習する学習工程と、
前記学習工程により学習された前記拡散モデルにより生成された変換後画像を用いた画像検索サービスをユーザに提供する提供工程と、
を含むことを特徴とする情報処理方法。

【請求項15】

所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像と、前記学習用画像における前記所定の対象の特徴を示すラベルとを取得する取得手順と、
前記取得手順により取得された前記学習用グレースケール画像と前記ラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を前記学習用画像に近づけるように変換する拡散モデルを学習する学習手順と、
前記学習手順により学習された前記拡散モデルにより生成された変換後画像を用いた画像検索サービスをユーザに提供する提供手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

【背景技術】

【0002】

従来、画像の色に関する様々な種別の色属性情報を変換するための技術が提供されている。例えば、色変換前の画像と色変換後の画像の組を用いて色変換モデルを学習する技術が提供されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２１－１４９８２５号公報

【非特許文献】

【0004】

【文献】“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”， Jun-Yan Zhu, Taesung Park, Phillip Isola, and Alexei A. Efros＜インターネット＞https://junyanz.github.io/CycleGAN/（令和４年１２月５日検索）

【文献】“Denoising Diffusion Probabilistic Models”， Jonathan Ho, Ajay Jain, and Pieter Abbeel,＜インターネット＞https://arxiv.org/pdf/2006.11239.pdf（令和４年１２月５日検索）

【文献】“Palette: Image-to-Image Diffusion Models”， Chitwan Saharia, William Chan, Huiwen Chang, Chris A Lee, Jonathan Ho, Tim Salimans, David J Fleet, and Mohammad Norouzi,＜インターネット＞https://arxiv.org/pdf/2111.05826.pdf（令和４年１２月５日検索）

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、上記の従来技術には、改善の余地がある。例えば、色変換前の画像と色変換後の画像の組が必要となり、色変換前の画像と色変換後の画像の組が無い場合、その組に対応する色変換を行った画像を生成することが難しい。そのため、適切な画像生成を可能にすることが望まれている。

【0006】

本願は、上記に鑑みてなされたものであって、適切な画像生成を可能にする情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

本願に係る情報処理装置は、所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像と、前記学習用画像における前記所定の対象の特徴を示すラベルとを取得する取得部と、前記取得部により取得された前記学習用グレースケール画像と前記ラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を前記学習用画像に近づけるように変換する拡散モデルを学習する学習部と、を備えたことを特徴とする。

【発明の効果】

【0008】

実施形態の一態様によれば、適切な画像生成を可能にすることができるという効果を奏する。

【図面の簡単な説明】

【0009】

【図1】図１は、実施形態に係る情報処理の一例を示す図である。

【図2】図２は、実施形態に係る情報処理の他の一例を示す図である。

【図3】図３は、実施形態に係る情報処理システムの構成例を示す図である。

【図4】図４は、実施形態に係る情報処理装置の構成例を示す図である。

【図5】図５は、実施形態に係るモデル情報記憶部の一例を示す図である。

【図6】図６は、実施形態に係る情報処理の一例を示すフローチャートである。

【図7】図７は、実施形態に係る情報処理の一例を示すフローチャートである。

【図8】図８は、ハードウェア構成の一例を示す図である。

【発明を実施するための形態】

【0010】

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

【0011】

（実施形態）
〔１．情報処理〕
以下では、図１を用いて、実施形態に係る情報処理の一例について説明する。図１は、実施形態に係る情報処理の一例を示す図である。具体的には、図１は、実施形態に係るモデルの学習処理及び、モデルを用いた画像の生成処理を含む情報処理の一例を示す。図１では、情報処理装置１００（図３参照）がノイズ画像から画像を生成するための拡散モデルである拡散モデルＭ１（以下「モデルＭ１」ともいう）を学習（生成）し、生成したモデルＭ１を用いて画像を生成する場合を一例として説明する。なお、以下では、色等の特徴を変換する対象物を含むグレースケール画像を用いる場合を一例として説明するが、対象物を含む画像としてはグレースケール画像に限らず任意の画像が用いられてもよいが、この点については後述する。

【0012】

〔１－１．学習処理例〕
まず、図１を用いて、モデルＭ１の学習処理の一例について説明する。まず、モデルＭ１の学習処理に用いるデータ（学習用データ）について説明する。

【0013】

図１では、情報処理装置１００は、モデルＭ１の学習処理に用いるデータ（学習用データ）を取得する。例えば、情報処理装置１００は、モデルＭ１の学習用データを学習用データ記憶部１２１（図４参照）から取得する。なお、学習用データ記憶部１２１に学習用データが未登録の場合、情報処理装置１００は、情報提供装置５０（図３参照）等の外部装置に学習用データの提供を要求し、外部装置から受信したデータを学習用データとして学習用データ記憶部１２１に登録してもよい。

【0014】

図１では、モデルＭ１の学習処理に用いるデータの一例として、所定の画像にノイズが段階的に付与した複数の段階画像を含む画像群ＩＧ１を示す。情報処理装置１００は、図１に示す画像群ＩＧ１等を含む学習用データを用いてモデルＭ１を学習する。

【0015】

画像群ＩＧ１は、所定の対象が撮像された画像（学習用画像）である画像Ｐ１０を含む。画像Ｐ１０は、所定の対象としてパーカーが撮像された画像である。画像Ｐ１０は、ノイズの付与に関する段階が段階＃０である、すなわちノイズが付与されていない画像である。なお、図１では、図示の関係上、色（色彩）をハッチングで示すが、画像Ｐ１０に含まれるパーカーの色は青色である。

【0016】

また、画像群ＩＧ１は、画像Ｐ１０にノイズが付与された画像である画像Ｐ１１を含む。画像Ｐ１１は、画像Ｐ１０にノイズが１段階付された画像である。画像Ｐ１１は、ノイズの付与に関する段階が段階＃１である、すなわちノイズが１段階付与された画像である。例えば、画像Ｐ１１は、画像Ｐ１０にノイズを付与するノイズ付与処理（図１中の処理ＳＮ１）により生成される。

【0017】

また、画像群ＩＧ１は、画像Ｐ１１にノイズが付与された画像である画像Ｐ１２を含む。画像Ｐ１２は、画像Ｐ１１にノイズがさらに１段階付された画像である。画像Ｐ１２は、ノイズの付与に関する段階が段階＃２である、すなわちノイズが２段階付与された画像である。例えば、画像Ｐ１２は、画像Ｐ１１にノイズを付与するノイズ付与処理（図１中の処理ＳＮ２）により生成される。

【0018】

また、画像群ＩＧ１は、画像Ｐ１２にノイズが付与された画像である画像Ｐ１３を含む。例えば、画像Ｐ１２にノイズを付与するノイズ付与処理（図１中の処理ＳＮ３）によりノイズが３段階付与された段階＃３の画像（画像Ｐ１３）が生成される。なお、ノイズ繰り返しとなるため途中の処理の説明は省略する。

【0019】

また、画像群ＩＧ１は、ノイズがＫ－３段階付与された画像Ｐ１Ｋ－３にノイズが付与された画像である画像Ｐ１Ｋ－２を含む。なお、Ｋは例えば３０、１０００等の任意の数（値）である。例えば、画像Ｐ１Ｋ－３にノイズを付与するノイズ付与処理（図１中の処理ＳＮＫ－２）によりノイズがＫ－２段階付与された段階＃Ｋ－２の画像（画像Ｐ１Ｋ－２）が生成される。

【0020】

また、画像群ＩＧ１は、画像Ｐ１Ｋ－２にノイズが付与された画像である画像Ｐ１Ｋ－１を含む。画像Ｐ１Ｋ－１は、画像Ｐ１Ｋ－２にノイズがさらに１段階付された画像である。画像Ｐ１Ｋ－１は、ノイズの付与に関する段階が段階＃Ｋ－１である、すなわちノイズがＫ－１段階付与された画像である。例えば、画像Ｐ１Ｋ－１は、画像Ｐ１Ｋ－２にノイズを付与するノイズ付与処理（図１中の処理ＳＮＫ－１）により生成される。

【0021】

また、画像群ＩＧ１は、ノイズ画像である画像Ｐ１Ｋを含む。例えば、画像Ｐ１Ｋは、画像Ｐ１Ｋ－１にノイズがさらに１段階付された画像である。画像Ｐ１Ｋは、ノイズの付与に関する段階が段階＃Ｋである、すなわちノイズがＫ段階付与された画像である。例えば、画像Ｐ１Ｋは、画像Ｐ１Ｋ－１にノイズを付与するノイズ付与処理（図１中の処理ＳＮＫ）により生成される。図１中の処理ＳＮ１～処理ＳＮＫは、拡散モデルにおける拡散過程（forward process）に対応する処理である。

【0022】

例えば、画像群ＩＧ１中の各画像は、データにガウシアンノイズを付与して、実データから徐々に完全なガウシアンノイズに遷移させる処理（ノイズ付与処理）により生成されてもよい。例えば、Ｋが１０００の場合、１０００回のノイズ付与処理後に完全なノイズになるようにデータとノイズの割合を変えながら混ぜ合わせることにより、画像群ＩＧ１中の各画像が生成される。なお、Ｋが１０００の場合、すなわちノイズ付与処理の回数が１０００回である場合は一例に過ぎず、ノイズ付与処理の回数は３２回や１回等、１０００回よりも少ない回数であってもよいし、１０００回よりも多い回数であってもよい。また、画像群ＩＧ１中の各画像は、情報処理装置１００が生成してもよいし、情報提供装置５０等の外部装置が生成してもよい。

【0023】

このように、図１に示す画像群ＩＧ１は、画像Ｐ１０、Ｐ１１、Ｐ１２、…Ｐ１Ｋ－２、Ｐ１Ｋ－１、Ｐ１Ｋ等の複数の画像を含む。以下、上記した画像群ＩＧ１を用いて情報処理装置１００がモデルＭ１を学習する場合を一例として説明する。なお、上記は一例に過ぎず、画像群ＩＧ１に含まれる画像は任意の画像であってもよい。例えば、画像Ｐ１Ｋは、いわゆるホワイトノイズ等のノイズ画像であってもよい。

【0024】

ここから、学習処理例の詳細について説明する。図１では、情報処理装置１００は、画像群ＩＧ１等を用いてモデルＭ１を学習する学習処理を実行する（ステップＳ１）。情報処理装置１００は、ノイズを含む画像（ノイズ画像）を入力とし、一つ手前の過程、すなわちノイズ画像からノイズを１段階除去した画像を出力（予測）するようにモデルＭ１を学習する。例えば、情報処理装置１００は、ノイズ画像、ノイズ画像に対応する元の画像（ノイズが付与されていない状態の画像）をグレースケール化したグレースケール画像、及び元の画像に含まれる対象の色等の特徴を示すラベルを入力とするモデルＭ１を学習する。

【0025】

このように、情報処理装置１００は、一の段階のノイズ画像からノイズを１段階除去した画像を生成するように、モデルＭ１を学習する。図１では、情報処理装置１００は、画像Ｐ１０をグレースケール化したグレースケール画像（「学習用グレースケール画像」ともいう）と、画像Ｐ１０中のパーカーの色が青であることを示すラベル（「学習用ラベル」ともいう）とを用いて、モデルＭ１を学習する。このように、情報処理装置１００は、生成する画像に含ませる対象を示す情報（画像）、及び対象の特徴を示すラベルも入力として学習することで、条件付きの拡散モデルとしてモデルＭ１を学習することができる。

【0026】

例えば、情報処理装置１００は、画像Ｐ１Ｋ、学習用グレースケール画像（例えばグレースケール画像ＧＳ１）、及び学習用ラベルを入力として、画像Ｐ１Ｋ－１を出力するようにモデルＭ１を学習する学習処理（図１中の処理ＳＲ１）を実行する。このように、情報処理装置１００は、段階＃Ｋのノイズ画像である画像Ｐ１Ｋから、一つ手前の過程の段階＃Ｋ－１のノイズ画像である画像Ｐ１Ｋ－１を生成するようにモデルＭ１を学習する。

【0027】

また、情報処理装置１００は、段階＃Ｋ－１のノイズ画像である画像Ｐ１Ｋ－１、学習用グレースケール画像、及び学習用ラベルを入力として、段階＃Ｋ－２のノイズ画像である画像Ｐ１Ｋ－２を出力するようにモデルＭ１を学習する学習処理（図１中の処理ＳＲ２）を実行する。同様に、情報処理装置１００は、段階＃Ｋ－２のノイズ画像である画像Ｐ１Ｋ－２、学習用グレースケール画像、及び学習用ラベルを入力として、段階＃Ｋ－３のノイズ画像である画像Ｐ１Ｋ－３を出力するようにモデルＭ１を学習する学習処理（図１中の処理ＳＲ３）を実行する。なお、図１中の処理ＳＲ３から処理ＳＲＫ－２の間の処理は、上述した処理と同様に、ノイズ画像を入力として、そのノイズ画像のノイズ付与の１段階前の画像の出力するように学習するため、詳細な説明は省略する。

【0028】

情報処理装置１００は、段階＃３のノイズ画像である画像Ｐ１３、学習用グレースケール画像、及び学習用ラベルを入力として、段階＃２のノイズ画像である画像Ｐ１２を出力するようにモデルＭ１を学習する学習処理（図１中の処理ＳＲＫ－２）を実行する。情報処理装置１００は、段階＃２のノイズ画像である画像Ｐ１２、学習用グレースケール画像、及び学習用ラベルを入力として、段階＃１のノイズ画像である画像Ｐ１１を出力するようにモデルＭ１を学習する学習処理（図１中の処理ＳＲＫ－１）を実行する。

【0029】

そして、情報処理装置１００は、段階＃１のノイズ画像である画像Ｐ１１、学習用グレースケール画像、及び学習用ラベルを入力として、段階＃０、すなわちノイズが付与されていない画像である画像Ｐ１０を出力するようにモデルＭ１を学習する学習処理（図１中の処理ＳＲＫ）を実行する。図１中の処理ＳＲ１～処理ＳＲＫは、拡散モデルにおける生成過程（reverse process）に対応する処理である。図１では、情報処理装置１００は、画像Ｐ１０、Ｐ１１、Ｐ１２、…Ｐ１Ｋ－２、Ｐ１Ｋ－１、Ｐ１Ｋ等を含む画像群ＩＧ１を用いてモデルＭ１を学習する。

【0030】

このように、情報処理装置１００は、ノイズ画像を入力とし、徐々にノイズを除去していくことで、データを生成するモデルであるモデルＭ１を学習する。図１では、情報処理装置１００は、ノイズ画像、グレースケール画像、及びラベルを入力とし、徐々にノイズ画像からノイズを除去していくことで、グレースケール画像に含まれる対象物にラベルが示す特徴が反映されたデータ（「変換後画像」ともいう）を生成するモデルＭ１を学習する。

【0031】

図１では、情報処理装置１００は、徐々にノイズ画像からノイズを除去していくことで、グレースケール画像に含まれる対象物であるパーカーにラベルが示す色「青」が着色されるように変換後画像を生成するモデルＭ１を学習する。このように、情報処理装置１００は、グレースケール画像とラベルとに基づいて、ノイズ画像を学習用画像に近づけるように変換するモデルＭ１を学習する。

【0032】

なお、図１に示す画像群ＩＧ１を用いた学習処理はモデルＭ１の学習の一部であり、情報処理装置１００は、画像群ＩＧ１以外にも様々な画像群を含む学習用データを用いてモデルＭ１を学習する。例えば、情報処理装置１００は、対象物はパーカーに限らず、靴、鞄、帽子等の様々な取引対象が撮像された学習用画像を対象とする画像群を用いてモデルＭ１を学習する。例えば、情報処理装置１００は、色は青に限らず、赤、黄色、緑、紫等の様々な色の学習用画像を対象とする画像群を用いてモデルＭ１を学習する。また、上述した処理は一例に過ぎず、情報処理装置１００は、非特許文献２、３等に開示される拡散モデルに関する学習手法に基づいてモデルＭ１を学習してもよい。

【0033】

このように、情報処理装置１００は、所定の対象を含む学習用画像のグレースケール画像と、所定の対象の特徴を示すラベルに基づいて、ノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。これにより、情報処理装置１００は、画像中の所定の対象の特徴を変換するモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0034】

上述した例では、情報処理装置１００は、拡散モデルにグレースケール画像とともに、元の画像に含まれる商品等の対象の色のドメイン（赤、青等）をラベルとして入力して、拡散モデルを学習する。例えば、画像収集時に色別に画像を収集している場合、ラベルも既知であり、容易に学習用データを収集することができるため、情報処理装置１００は、容易に自己教師あり学習でモデルを学習することができる。

【0035】

〔１－２．生成処理例〕
次に、モデルＭ１を用いた画像の生成処理の一例を説明する。なお、図１では、説明のために変換後画像を生成する対象となる画像（「対象画像」ともいう）が画像Ｐ１０である場合を一例として説明するが、対象画像は、画像Ｐ１０に限らず、任意の画像であってもよい。例えば、情報処理装置１００は、画像Ｐ１０を対象画像とする指定をユーザから受け付ける。

【0036】

また、図１では、変換対象とする特徴（「対象特徴」ともいう）が色「緑」であることを示すラベルＬＢ１が用いられる場合を示すが、対象特徴は、緑に限らず、赤、茶色等の任意の色であってもよい。例えば、情報処理装置１００は、ラベルＬＢ１をユーザから受け付ける。

【0037】

まず、情報処理装置１００は、対象画像をグレースケール化する処理により対象画像のグレースケールを生成する（ステップＳ１１）。情報処理装置１００は、画像のグレースケール化に関する種々の技術を適宜用いて、画像のグレースケール化を実行する。図１では、情報処理装置１００は、画像Ｐ１０をグレースケール化する処理により画像Ｐ１０のグレースケール画像ＧＳ１を生成する。

【0038】

そして、情報処理装置１００は、ノイズ画像、グレースケール画像、及びラベルを入力として、変換後画像を生成する生成処理を実行する（ステップＳ１２）。例えば、ノイズ画像ＮＺ１は、画像Ｐ１Ｋと同じノイズ画像であってもよいし、異なるノイズ画像であってもよい。図１では、情報処理装置１００は、ノイズ画像ＮＺ１、グレースケール画像ＧＳ１、及びラベルＬＢ１を最初のモデルＭ１への入力情報ＩＮ１として、モデルＭ１を用いた画像の生成を繰り返すことにより、画像Ｐ２０を生成する。なお、図１では、図示の関係上、色（色彩）をハッチングで示すが、画像Ｐ２０に含まれるパーカーの色は緑色である。

【0039】

例えば、情報処理装置１００は、モデルＭ１への入力をＫ回繰り返すことにより、画像Ｐ２０を生成する。例えば、Ｋが１０００である場合、情報処理装置１００は、ノイズ画像ＮＺ１、グレースケール画像ＧＳ１、ラベルＬＢ１が入力されたモデルＭ１が出力した画像を入力として、モデルＭ１への入力を９９９回繰り返す。

【0040】

例えば、情報処理装置１００は、最初（１回目）の繰り返し処理では、ノイズ画像ＮＺ１、グレースケール画像ＧＳ１、及びラベルＬＢ１をモデルＭ１へ入力し、モデルＭ１から画像＃１を出力させる。そして、情報処理装置１００は、２回目の繰り返し処理では、画像＃１、グレースケール画像ＧＳ１、及びラベルＬＢ１をモデルＭ１へ入力し、モデルＭ１から画像＃２を出力させる。情報処理装置１００は、３回目の繰り返し処理では、画像＃２、グレースケール画像ＧＳ１、及びラベルＬＢ１をモデルＭ１へ入力し、モデルＭ１から画像＃３を出力させる。

【0041】

情報処理装置１００は、４～Ｋ－１回目の繰り返し処理でも同様に、画像＃３～＃Ｋ－２の各々、グレースケール画像ＧＳ１、及びラベルＬＢ１をモデルＭ１へ入力し、モデルＭ１から画像＃４～＃Ｋ－１の各々を出力させる。そして、情報処理装置１００は、Ｋ回目の繰り返し処理では、画像＃Ｋ－１、グレースケール画像ＧＳ１、及びラベルＬＢ１をモデルＭ１へ入力し、モデルＭ１から画像Ｐ２０を出力させる。

【0042】

これにより、情報処理装置１００は、徐々にノイズ画像からノイズを除去していくことで、グレースケール画像ＧＳ１に含まれる対象物に、ラベルＬＢ１が示す特徴が反映された画像Ｐ２０を生成する。図１では、情報処理装置１００は、モデルＭ１を用いて徐々にノイズ画像からノイズを除去していくことで、グレースケール画像ＧＳ１に含まれる対象物であるパーカーに、ラベルＬＢ１が示す色「緑」が着色された変換後画像である画像Ｐ２０を生成する。

【0043】

〔１－３．平坦化〕
上述した処理により所望の対象の所望の特徴を反映した画像を生成することができるが、さらに改善の余地がある。例えば、拡散モデル学習時に入力画像（学習用画像）をグレースケール変換のみ行った画像（グレースケール画像）を用いて学習した場合、色等の特徴を変換した場合、適切に特徴の変換が行われない場合がある。

【0044】

例えば、学習用画像がグレースケール化されたグレースケール画像の各画素の画素値の分布に偏りがある場合等においては、変換後画像を適切に生成する拡散モデルを学習することが難しい場合がある。例えば、グレースケール画像の各画素の複数種別の色属性情報のうち明度（例えば白から黒までの階調）に対応する画素値（例えば０から２５５までの値）の分布に偏りがある場合等においては、変換後画像を適切に生成する拡散モデルを学習することが難しい場合がある。

【0045】

そこで、情報処理装置１００は、学習用画像における所定の種別の色属性情報の分布を平坦化した画像（「平坦化後画像」ともいう）を生成し、生成した平坦化後画像を用いて、拡散モデルを学習する。この点について図２を用いて一例を説明する。なお、図１と同様の点については、同様の符号を付すこと等により適宜説明を省略する。

【0046】

例えば、情報処理装置１００は、学習用画像における明度の分布を平坦化したグレースケール画像を平坦化後画像として生成し、明度の分布が平坦化したグレースケール画像（「平坦化後グレースケール画像」ともいう）を用いて、拡散モデルを学習する。なお、明度は、平坦化の対象とする色属性情報の一例に過ぎず、平坦化の対象とする色属性情報は明度に限られないが、この点については後述する。

【0047】

図２中のヒストグラムＨＧ１は、平坦化処理を行っていない場合のグレースケール画像ＧＳ１での各画素の明度の分布を示すヒストグラムである。ヒストグラムＨＧ１は、平坦化処理前のヒストグラムに対応する。図２では白から黒への横方向のバー内のハッチングの濃淡で画素値の高低を示す。例えば、ヒストグラムＨＧ１の白（右端）が、グレースケール画像において画素が取り得る画素値（例えば明度）の最小値（例えば０等）に対応し、黒（左端）が、グレースケール画像において画素が取り得る画素値（例えば２５５等）の最大値に対応する。また、ヒストグラムＨＧ１の縦方向が各画素値を有する画素の数（個数）を示す。例えば、ヒストグラムＨＧ１の少（下端）が、対応する画素値を有する画素の数が０であることを示し、ヒストグラムＨＧ１の多（上端）に向かうにつれて対応する画素値を有する画素の数が多いことを示す。ヒストグラムＨＧ１中の波形が各画素値を有する画素の数を示す。図２では、グレースケール画像ＧＳ１に対応するヒストグラムＨＧ１は、一部の画素値（白と黒の中間付近の値）を有する画素の数（出現頻度）が多く、分布に偏りがあるヒストグラムである。

【0048】

また、図２中のヒストグラムＨＧ２は、平坦化処理を行った場合のグレースケール画像ＧＳ２での各画素の明度の分布を示すヒストグラムである。ヒストグラムＨＧ２は、平坦化処理後のヒストグラムに対応する。なお、ヒストグラムＨＧ２においてヒストグラムＨＧ１と同様の点については適宜説明を省略する。図２では、グレースケール画像ＧＳ２に対応するヒストグラムＨＧ２は、白から黒までの各画素値を有する画素の数の分布に偏りが無く、全体的に各画素値の個数が均一なヒストグラムである。

【0049】

ここでいう平坦化処理は、ヒストグラム平坦化の処理であり、所定の画素値のヒストグラムが全体的にたいら（均一）になるように濃度変換する処理である。例えば、平坦化処理は、画像中の各画素の複数種別の色属性情報のうち、所定の種別の色属性情報（所定の種別に対応する画素値等）のヒストグラムが全体的にたいらになるように濃度変換する処理である。ヒストグラム平坦化の処理については、種々の従来技術が採用可能であり詳細な説明は省略する。

【0050】

例えば、情報処理装置１００は、図１中の画像Ｐ１０からグレースケール画像を生成する際に、グレースケール化する処理（グレースケール変換処理）に加えて、平坦化処理を行うことにより画像Ｐ１０の平坦化後グレースケール画像であるグレースケール画像ＧＳ２を生成する。なお、情報処理装置１００は、グレースケール画像ＧＳ１を対象として平坦化処理を行うことにより、平坦化後グレースケール画像であるグレースケール画像ＧＳ２を生成してもよい。

【0051】

情報処理装置１００は、平坦化処理により生成した平坦化後グレースケール画像であるグレースケール画像ＧＳ２を用いて、拡散モデルを学習する。すなわち、情報処理装置１００は、平坦化後グレースケール画像であるグレースケール画像ＧＳ２をモデルＭ１への入力として用いて、拡散モデルを学習する。

【0052】

この場合、情報処理装置１００は、図１に示す学習処理において、学習用グレースケール画像として平坦化後グレースケール画像を用いて、モデルＭ１を学習する。例えば、情報処理装置１００は、図１に示す学習処理において、グレースケール画像ＧＳ２を学習用グレースケール画像として、モデルＭ１を学習する。なお、平坦化後グレースケール画像を用いた学習処理は、モデルＭ１に入力するグレースケール画像が平坦化後グレースケール画像となる点以外は、図１に示す学習処理と同様であるため、詳細な説明は省略する。

【0053】

このように、情報処理装置１００は、各画素に複数種別の色属性情報が対応付けられた学習用画像から、所定の種別の色属性情報である明度の分布を平坦化した平坦化後画像を生成する。そして、情報処理装置１００は、生成した平坦化後画像と、ラベルとに基づいて、ノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。これにより、情報処理装置１００は、所定の種別の色属性情報に偏りがない平坦化後画像を用いて適切にモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0054】

例えば、拡散モデルを学習する際に指定された色ラベルごとに入力されるグレースケール画像のヒストグラムの組み合わせに偏りがあり、拡散モデルがこの偏りも含めて学習した場合、色変換時に、青い画像をグレー化したものと白のラベルの組み合わせを入力すると、学習時のデータ分布との差異が大きく、うまく変換できない場合がある。

【0055】

そこで、情報処理装置１００は、モデルの学習時には、画像をグレースケール変換するだけでなく、ヒストグラム平坦化も合わせて実施した画像を入力画像とすることで、適切にモデルを学習することができる。例えば、情報処理装置１００により生成される拡散モデルは、グレースケール画像を着色するだけでなく、平坦化されたヒストグラムを指定された色に応じたヒストグラムへと変換することも併せて学習するようになる。これにより、情報処理装置１００は、着色時に元の画像とは異なる任意の色のラベルに差し替えた場合にもうまく着色が行われた変換後画像を生成することができる。

【0056】

なお、平坦化後グレースケール画像を用いる場合、モデルＭ１を用いた画像の生成処理時においては、情報処理装置１００は、対象画像の平坦化後グレースケール画像を用いて、変換後画像を生成してもよい。この場合、情報処理装置１００は、図１に示す生成処理のステップＳ１１において、グレースケール化する処理（グレースケール変換処理）に加えて、平坦化処理を行うにより画像Ｐ１０の平坦化後グレースケール画像であるグレースケール画像ＧＳ２を生成する。そして、情報処理装置１００は、平坦化後グレースケール画像を用いて、変換後画像を生成する。なお、平坦化後グレースケール画像を用いた生成処理は、モデルＭ１に入力するグレースケール画像が平坦化後グレースケール画像となる点以外は、図１に示す生成処理と同様であるため、詳細な説明は省略する。

【0057】

〔１－４．その他（限定解除、サービス等）〕
なお、上述した処理は一例に過ぎず、情報処理装置１００は、様々な情報を適宜用いて処理を行ってもよい。この点について以下例示を記載する。例えば、上述した例では、モデルＭ１へ入力する対象を含む画像（「対象撮像画像」ともいう）として、グレースケール画像が用いられる場合を示したが、対象撮像画像は、グレースケール画像に限らず、カラー画像等の任意の画像が用いられてもよい。

【0058】

また、上述した例では、色を変換対象とする場合を説明したが、情報処理装置１００は、画像に含まれる対象の色に限らず、対象の形状、雰囲気等の任意の対象を変換対象としてもよい。例えば、情報処理装置１００は、画像に含まれる対象の色、形状、雰囲気の少なくとも１つを変換対象とする。

【0059】

例えば、情報処理装置１００は、画像に含まれる対象の形状を変換対象とする場合、学習する拡散モデルへ入力するラベルとして、対象の形状を示すラベル（「形状ラベル」ともいう）を用いる。例えば、学習処理時において、情報処理装置１００は、画像に含まれる対象の形状が矩形である場合、その画像を用いた学習時のラベルとして、矩形を示す形状ラベルを用いる。

【0060】

また、例えば、生成処理時において、情報処理装置１００は、対象画像に含まれる対象の形状を円形にしたい場合、対象画像とともに円形を示す形状ラベルを拡散モデルに入力することにより、形状が変換された変換後画像を生成する。なお、上記は一例に過ぎず、情報処理装置１００は、変換対象に応じて適宜の情報を用いて拡散モデルを学習し、学習した拡散モデルを用いて変換後画像を生成する。

【0061】

例えば、上述した例では、複数種別の色属性情報のうち、明度を平坦化の対象とする場合を説明したが、情報処理装置１００は、明度に限らず、画像に関する任意の対象を平坦化の対象としてもよい。例えば、情報処理装置１００は、色相、彩度等を平坦化の対象としてもよい。

【0062】

また、情報処理装置１００は、画像の色の表現形式に応じた色属性情報を平坦化の対象としてもよい。例えば、情報処理装置１００は、画像の色の表現形式がＲＧＢ（赤、緑、青）である場合、画像の各画素に対応付けられたＲ（赤）に関する値、Ｇ（緑）に関する値、Ｂ（青）に関する値の少なくとも１つを平坦化の対象としてもよい。例えば、情報処理装置１００は、Ｇ（緑）に関する値を平坦化の対象とする場合、画像におけるＧ（緑）に関する画素値のヒストグラムが全体的にたいらになるように濃度変換する処理を実行する。

【0063】

また、例えば、情報処理装置１００は、画像の色の表現形式がＣＭＹＫ（シアン、マゼンタ、イエロー、ブラック（キー・プレート））である場合、画像の各画素に対応付けられたＣ（シアン）に関する値、Ｍ（マゼンタ）に関する値、Ｙ（イエロー）に関する値、Ｋ（ブラック）に関する値の少なくとも１つを平坦化の対象としてもよい。例えば、情報処理装置１００は、Ｋ（ブラック）に関する値を平坦化の対象とする場合、画像におけるＫ（ブラック）に関する画素値のヒストグラムが全体的にたいらになるように濃度変換する処理を実行する。

【0064】

また、情報処理装置１００は、生成した変換後画像を用いて、様々なサービスを提供してもよい。図１では、情報処理装置１００は、生成した変換後画像である画像Ｐ２０を用いたサービスを、対象画像である画像Ｐ１０を指定したユーザ（「指定元ユーザ」ともいう）に提供してもよい。情報処理装置１００は、画像Ｐ２０に類似する類似画像検索の検索結果を、指定元ユーザが利用する端末装置１０に送信する。

【0065】

情報処理装置１００は、指定元ユーザに検索サービスを提供してもよい。この場合、情報処理装置１００は、画像Ｐ２０を検索クエリとなる画像（「クエリ画像」ともいう）として受け付け、検索対象となる各種画像の中からクエリ画像（画像Ｐ２０）と類似する画像を検索する検索処理を実行し、検索結果を提供する。

【0066】

例えば、情報処理装置１００は、電子商店街（ＥＣサイト等）において出品された商品等の取引対象を含む画像（取引対象画像）のインデックスを用いて、画像Ｐ２０の類似画像の検索処理を実行し、画像Ｐ２０の類似画像の検索結果を提供する。情報処理装置１００は、画像Ｐ２０の類似画像の検索結果に関する情報を指定元ユーザに提供する。情報処理装置１００は、画像Ｐ２０の類似画像の検索結果を指定元ユーザが利用する端末装置１０に送信する。

【0067】

上述したように、情報処理装置１００は、所定の対象が撮影された学習画像のグレースケール画像と、所定の対象の特徴を示すラベルとに従って、ノイズ画像を学習画像に近づけるように変換する拡散モデルを学習する。例えば、情報処理装置１００は、学習画像にノイズを段階的に付与した複数の段階画像を生成し、段階画像からノイズを１段階除去した段階画像を生成するように、拡散モデルを学習する。また、例えば、情報処理装置１００は、ユーザから画像を取得し、取得した画像をグレースケール化して、入力された特徴で所望する対象が撮影された画像を生成し、生成した画像を用いて、所定の対象と類似する商品をＥＣ（電子商取引）サービス等で画像検索する。

【0068】

また、情報処理装置１００は、所定の対象が撮影された学習画像であって各画素に複数種別の色属性情報（色彩情報）が対応付けられた学習画像から、所定種別の色彩情報が示す示唆画像であって、当該所定種別の色彩情報の分布を平坦化した平坦化画像（示唆画像）を生成する。例えば、情報処理装置１００は、示唆画像と、所定の対象の特徴を示すラベルとに従って、ノイズ画像を学習画像に近づけるように変換する拡散モデルを学習する。例えば、情報処理装置１００は、白飛びした画像の平坦化と、通常の画像の平坦化とを学習したチャンネル推定モデルを生成してもよい。この場合、情報処理装置１００は、生成したチャンネル推定モデルで示唆画像を生成してもよい。

【0069】

上述したように、情報処理装置１００は、画像をグレースケール化した画像に含まれる対象に所望の色付けするように学習する。例えば、情報処理装置１００は、元の画像と元の画像にノイズを乗せたノイズ画像を準備して、ノイズ画像を元の画像に戻すように学習する。例えば、情報処理装置１００は、段階的にいろいろなノイズ画像を作成して学習し、ノイズに対して何度もモデルがノイズ除去することで、元の画像を再現することができる。

【0070】

また、情報処理装置１００は、拡散モデルの学習時に、元の画像を示す情報（各種のラベル、被写体の名称やどんなシーンであるか、被写体の色等）を入力して学習するようにする。情報処理装置１００は、様々な画像を学習用画像として、ノイズ画像と、学習用画像のグレースケール画像と、ラベルとを入力して何度もノイズ除去することで、ラベルが示す特徴をグレースケール画像に反映した画像を生成するようなモデルを学習することが成できる。

【0071】

上述したように、情報処理装置１００は、複数種別の色属性情報のうち所定の種別である１チャンネルを平坦化した平坦化画像と、学習用画像に対応するラベルとから、ノイズ画像を学習用画像に復元するようにモデルを学習する。例えば、情報処理装置１００は、通常画像から白飛び画像を生成し、生成した白飛び画像を用いて学習を行ってもよい。

【0072】

また、情報処理装置１００は、複数種別の色属性情報のうち所定の種別の色属性情報のヒストグラムの偏りに応じて、処理を切り替えてもよい。例えば、情報処理装置１００は、所定の種別の色属性情報のヒストグラムに所定の基準以上の偏りがある場合、ＳｔａｒＧＡＮ（Generative Adversarial Network）等のＧＡＮモデルを用いて変換後画像を生成してもよい。また、情報処理装置１００は、所定の種別の色属性情報のヒストグラムに所定の基準以上の偏りがない場合、拡散モデルを用いて変換後画像を生成してもよい。

【0073】

また、情報処理装置１００は、画像中の一部の領域（範囲）のみの特徴を変換した変換後画像を生成してもよい。この場合、情報処理装置１００は、画像中の一部の領域を指定する範囲指定情報も入力とするモデルを学習し、学習したモデルを用いて、一部の領域のみを変換の対象とした変換後画像を生成してもよい。例えば、情報処理装置１００は、画像中の一部の領域以外をマスクするマスク情報を入力とするモデルを学習し、学習したモデルを用いて、一部の領域のみを変換の対象とした変換後画像を生成してもよい。また、上述したラベルは、変換対象とする特徴を示す情報であれば、文字情報に限らず任意の情報であってもよい。例えば、ラベルは、雰囲気を示す画像、ヒストグラム、他の画像等の任意の画像であってもよい。

【0074】

〔２．情報処理システムの構成〕
次に、図３を用いて情報処理システム１の構成例について説明する。図３は、実施形態に係る情報処理システムの構成例を示す図である。図３に示すように、情報処理システム１は、情報処理装置１００と、情報提供装置５０と、端末装置１０とが含まれる。情報処理装置１００と、情報提供装置５０と、端末装置１０とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。なお、図３に示した情報処理システム１には、複数の情報処理装置１００、複数の情報提供装置５０、複数の端末装置１０が含まれてもよい。

【0075】

情報処理装置１００は、拡散モデル等のモデルを学習するコンピュータである。すなわち、情報処理装置１００は、学習処理を行う学習装置である。情報処理装置１００は、所定の対象が撮像された学習用画像がグレースケール化された学習用グレースケール画像と、学習用画像における所定の対象の特徴を示すラベルとに基づいて拡散モデルを学習する。例えば、情報処理装置１００は、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。

【0076】

また、情報処理装置１００は、各画素に複数種別の色属性情報が対応付けられた学習用画像から、所定の種別の色属性情報の分布を平坦化した平坦化後画像を生成する生成装置である。例えば、情報処理装置１００は、平坦化後画像と、学習用画像における所定の対象の特徴を示すラベルとに基づいて、一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。

【0077】

情報処理装置１００は、ユーザから変換対象となる対象画像の指定を受け付け、ユーザが指定した対象画像のグレースケール画像と拡散モデルとを用いて変換後画像を生成する。また、情報処理装置１００は、ユーザから変換後の特徴を指定する指定情報を受け付け、ユーザが指定した特徴が反映された変換後画像を生成する。情報処理装置１００は、生成した変換後画像を用いたサービスをユーザに提供する。情報処理装置１００は、変換後画像に類似する類似画像検索の検索結果を、ユーザが利用する端末装置１０に送信する。

【0078】

情報処理装置１００は、端末装置１０を利用するユーザに検索サービスを提供するコンピュータである。この場合、情報処理装置１００は、検索サービスを提供する検索サーバとしての機能を有する。例えば、情報処理装置１００は、変換後画像を検索クエリとなる画像（クエリ画像）として受け付けると、検索対象となる各種画像の中からクエリ画像（変換後画像）と類似する画像を検索する検索処理を実行し、検索結果を提供する。

【0079】

情報処理装置１００は、端末装置１０から変換対象となる対象画像及び特徴を指定する指定情報を受け付け、拡散モデルであるモデルＭ１を用いて、その対象画像に含まれる対象物に指定情報が示す特徴が反映された変換後画像を生成する。例えば、情報処理装置１００は、ノイズ画像、対象画像及びユーザが指定した色を示す指定情報をモデルＭ１への入力として、ノイズを除去する処理を繰り返すことにより、指定情報が示す色に対象画像に含まれる対象物が着色された変換後画像を生成する。

【0080】

情報処理装置１００は、変換後画像を基に検索処理を実行し、検索結果を提供する。例えば、情報処理装置１００は、検索対象となる商品等の取引対象を含む画像（取引対象画像）のインデックスを用いて、検索処理を実行し、検索結果を提供してもよい。例えば、情報処理装置１００は、電子商店街（ＥＣサイト等）において出品された取引対象の各々について、取引対象を示す画像として登録された取引対象画像を用いて検索処理を実行する。

【0081】

例えば、情報処理装置１００は、電子商店街において出品された取引対象の中から、取引対象画像がクエリ画像（変換後画像）と類似する取引対象を検索し、変換後画像がクエリ画像（変換後画像）と類似する取引対象の情報を、類似画像の検索結果として抽出する。なお、情報処理装置１００は、類似画像の検索が可能であれば、任意の画像検索に関する技術を適宜用いて画像検索の処理を行えばよく、画像検索についての詳細な説明は省略する。

【0082】

情報処理装置１００は、類似画像の検索結果に関する情報をユーザに提供する。情報処理装置１００は、類似画像の検索結果をユーザが利用する端末装置１０に送信する。例えば、情報処理装置１００は、検索結果として抽出した取引対象の変換後画像や価格、取引対象を販売する電子商店街の店舗の情報等を提供する。

【0083】

このように、情報処理装置１００は、クエリ画像となる変換後画像に、取引対象画像が類似する取引対象の情報を提供する。なお、情報処理装置１００は、変換後画像と取引対象画像との類似度に応じたランキングを生成し、生成したランキングを検索結果として提供してもよい。この場合、情報処理装置１００は、変換後画像と取引対象画像との類似度が高い方から順に高い順位を付与し、高い順位の取引対象から順に並べたランキングを示す一覧情報を生成し、生成した一覧情報を、類似画像の検索結果として、ユーザが利用する端末装置１０に送信してもよい。

【0084】

なお、上記は一例に過ぎず、ユーザに検索サービスを提供する装置は、情報処理装置１００に限らず、情報処理システム１に含まれる他の装置であってもよい。例えば、情報提供装置５０がユーザに検索サービスを提供してもよいし、情報処理システム１にはユーザに検索サービスを提供する検索サーバが含まれてもよい。

【0085】

情報提供装置５０は、モデルの学習に利用可能な情報（データ）を情報処理装置１００へ提供するサーバ装置である。例えば、情報提供装置５０は、モデルの学習への利用が許可されているデータを、学習用データとして情報処理装置１００へ送信する。例えば、情報提供装置５０は、インターネット上で公開データを公開し、情報処理装置１００等の外部装置からの要求に応じて、要求先の外部装置へ要求されたデータを送信する。例えば、情報提供装置５０は、情報処理装置１００からデータを要求する要求情報を受信し、要求情報の受信に応じて、情報処理装置１００へ要求情報に対応するデータを送信する。

【0086】

例えば、情報提供装置５０は、一の画像に段階的にノイズを付与した画像群と、その一の画像に含まれる対象物の特徴を示す特徴情報とを対応付けた情報を学習用データとして、情報処理装置１００へ送信する。例えば、情報提供装置５０は、ＥＣサイト等において取引される取引対象の取引対象画像に段階的にノイズが付与された複数の段階画像と、その取引対象の色等の特徴を示す特徴情報とを対応付けたデータを、学習用データとして情報処理装置１００へ送信する。

【0087】

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。なお、端末装置１０をユーザと表記する場合がある。すなわち、ユーザを端末装置１０と読み替えることもできる。

【0088】

端末装置１０は、ユーザによる操作を受け付ける。また、端末装置１０は、ユーザの操作に応じて、情報処理装置１００や情報提供装置５０に種々の情報を送信する。例えば、端末装置１０は、情報処理装置１００や情報提供装置５０に各種情報を要求する要求情報等を送信する。また、端末装置１０は、情報処理装置１００や情報提供装置５０から種々の情報を受信する。

【0089】

端末装置１０は、ユーザが指定した変換対象となる画像（対象画像）を情報処理装置１００へ送信する。端末装置１０は、ユーザが指定した特徴を示す情報（指定情報）を情報処理装置１００へ送信する。

【0090】

端末装置１０は、類似画像の検索結果を情報処理装置１００から受信する。例えば、端末装置１０は、検索結果として抽出した取引対象の変換後画像や価格、取引対象を販売する電子商店街の店舗の情報等を情報処理装置１００から受信する。

【0091】

端末装置１０は、クエリ画像となる変換後画像に、取引対象画像が類似する取引対象の情報を情報処理装置１００から受信する。端末装置１０は、変換後画像と取引対象画像との類似度に応じたランキングを情報処理装置１００から受信する。端末装置１０は、変換後画像と取引対象画像との類似度が高い方から順に高い順位を付与し、高い順位の取引対象から順に並べたランキングを示す一覧情報を、類似画像の検索結果として、情報処理装置１００から受信する。

【0092】

〔３．情報処理装置の構成〕
次に、図４を用いて、実施形態に係る情報処理装置１００の構成について説明する。図４は、実施形態に係る情報処理装置１００の構成例を示す図である。図４に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

【0093】

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、端末装置１０や情報提供装置５０との間で情報の送受信を行う。

【0094】

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図４に示すように、学習用データ記憶部１２１と、モデル情報記憶部１２２とを有する。

【0095】

（学習用データ記憶部１２１）
実施形態に係る学習用データ記憶部１２１は、学習に用いるデータに関する各種情報（学習用データ）を記憶する。学習用データ記憶部１２１は、モデルの生成に用いる教師データを記憶する。学習用データ記憶部１２１は、入力に用いるデータやそのデータに対応する正解情報（正解画像）といった情報を含む学習用データ情報を記憶する。

【0096】

学習用データ記憶部１２１は、入力に用いるノイズ画像、グレースケール画像、及びラベルの組み合わせと、その入力に対応する画像データ（正解画像）とが対応付けられた学習用データを記憶する。

【0097】

なお、学習用データ記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、学習用データ記憶部１２１は、入力データの種別を示す情報を各入力データに対応付けて記憶する。例えば、学習用データ記憶部１２１は、平坦化される対象となる色属性の種別を示す情報を各データに対応付けて記憶する。

【0098】

（モデル情報記憶部１２２）
実施形態に係るモデル情報記憶部１２２は、モデルに関する情報を記憶する。例えば、モデル情報記憶部１２２は、学習処理により学習（生成）された学習済みモデル（モデル）の情報（モデルデータ）を記憶する。図５は、実施形態に係るモデル情報記憶部の一例を示す図である。図５に示した例では、モデル情報記憶部１２２は、「モデルＩＤ」、「用途」、「モデルデータ」といった項目が含まれる。

【0099】

「モデルＩＤ」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図５では「モデルデータ」に「ＭＤＴ１」といった概念的な情報が格納される例を示したが、実際には、モデルの構成（ネットワーク構成）の情報やパラメータに関する情報等、そのモデルを構成する種々の情報が含まれる。例えば、「モデルデータ」には、ネットワークの各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。

【0100】

図５では、モデルＩＤ「Ｍ１」により識別されるモデル（モデルＭ１）は、用途が「画像生成」であり、例えば、モデルＭ１は、対象物が撮像された画像中の対象物の色を変換したり、着色を行ったりするために用いられるモデルであることを示す。また、モデルＭ１のモデルデータは、モデルデータＭＤＴ１であることを示す。

【0101】

なお、モデル情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。なお、モデルＭ１等のモデルは、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定されるものであってもよい。モデルＭ１等のモデルは、プログラムであってもよい。

【0102】

（制御部１３０）
図４の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（学習プログラムや生成プログラム等の情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

【0103】

図４に示すように、制御部１３０は、取得部１３１と、生成部１３２と、学習部１３３と、処理部１３４と、提供部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図４に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

【0104】

（取得部１３１）
取得部１３１は、各種情報を取得する。取得部１３１は、端末装置１０や情報提供装置５０等の外部の情報処理装置から各種情報を取得する。取得部１３１は、学習用データ記憶部１２１やモデル情報記憶部１２２等に示す各種情報を、外部の情報処理装置から受信してもよい。

【0105】

取得部１３１は、記憶部１２０から各種情報を取得する。取得部１３１は、学習用データ記憶部１２１やモデル情報記憶部１２２等から各種情報を取得する。取得部１３１は、外部装置から各種情報を受信する。

【0106】

取得部１３１は、ユーザが利用する端末装置１０から各種情報を受信する。例えば、取得部１３１は、端末装置１０から色変換の対象となる対象物を含むグレースケール画像を受信する。例えば、取得部１３１は、端末装置１０からユーザが指定したグレースケール画像を受信する。例えば、取得部１３１は、端末装置１０から端末装置１０を利用するユーザが指定する特徴を示す特徴情報を受信する。

【0107】

取得部１３１は、情報提供装置５０から各種情報を受信する。例えば、取得部１３１は、情報提供装置５０から学習に用いる情報を受信する。例えば、取得部１３１は、情報提供装置５０からモデルＭ１の学習に用いる学習用データを受信する。

【0108】

取得部１３１は、所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像を取得する。取得部１３１は、学習用画像における所定の対象の特徴を示すラベルを取得する。取得部１３１は、学習用画像における所定の対象の色、形状、雰囲気の少なくとも１つを含む特徴を示すラベルを取得する。取得部１３１は、学習用画像における所定の対象の色を示すラベルを取得する。

【0109】

取得部１３１は、一のノイズ画像を取得する。取得部１３１は、学習用画像にノイズを段階的に付与した複数の段階画像を取得する。取得部１３１は、第１段階画像と、第１段階画像に１段階ノイズが付与された第２段階画像とを含む複数の段階画像を取得する。取得部１３１は、第２段階画像に１段階ノイズが付与された第３段階画像を含む複数の段階画像を取得する。

【0110】

取得部１３１は、ユーザから変換対象となる対象画像を取得する。取得部１３１は、ユーザから特徴を指定する指定情報を取得する。

【0111】

（生成部１３２）
生成部１３２は、種々の情報を推定する生成処理を実行する。例えば、生成部１３２は、取得部１３１により取得された各種情報に基づいて、生成処理を実行する。生成部１３２は、記憶部１２０に記憶された各種情報に基づいて、生成処理を実行する。生成部１３２は、外部の情報処理装置から受信された各種情報に基づいて、生成処理を実行する。生成部１３２は、学習部１３３により学習されたモデルに基づいて、生成処理を実行する。生成部１３２は、処理部１３４により決定された情報に基づいて、生成処理を実行する。

【0112】

生成部１３２は、所定の対象が撮像された画像である学習用画像であって各画素に複数種別の色属性情報が対応付けられた学習用画像から、所定の種別の色属性情報の分布を平坦化した平坦化後画像を生成する。生成部１３２は、複数種別の色属性情報のうち明度の分布を平坦化したグレースケール画像を平坦化後画像として生成する。

【0113】

（学習部１３３）
学習部１３３は、各種情報を学習する。学習部１３３は、学習処理により各種モデルを生成する。例えば、学習部１３３は、学習用データ記憶部１２１等に記憶された情報に基づいて、学習処理を行う。学習部１３３は、学習用データ記憶部１２１等に記憶された情報に基づいて種々のモデルを生成する。例えば、学習部１３３は、学習用データ記憶部１２１に記憶された学習データを用いて、モデルＭ１を学習する。

【0114】

学習部１３３は、取得部１３１により取得された学習用グレースケール画像とラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。学習部１３３は、生成部１３２により生成された平坦化後画像と、学習用画像における所定の対象の特徴を示すラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。

【0115】

学習部１３３は、一のノイズ画像を、ラベルが示す色の所定の対象を含む学習用画像に近づけるように変換する拡散モデルを学習する。学習部１３３は、取得部１３１により取得された一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。

【0116】

学習部１３３は、取得部１３１により取得された複数の段階画像を用いて、拡散モデルを学習する。学習部１３３は、複数の段階画像のうち一の段階画像からノイズを１段階除去した画像である段階画像を生成するように、拡散モデルを学習する。学習部１３３は、第２段階画像からノイズを１段階除去した第１段階画像を生成するように、拡散モデルを学習する。学習部１３３は、第３段階画像からノイズを１段階除去した第２段階画像を生成するように、拡散モデルを学習する。

【0117】

例えば、学習部１３３は、取得部１３１により取得された各種情報に基づいて、学習処理を実行する。例えば、学習部１３３は、生成部１３２により生成された情報に基づいて、モデルを学習する。学習部１３３は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、学習処理を実行する。学習部１３３は、モデル情報記憶部１２２に記憶された情報に基づいて、学習処理を実行する。学習部１３３は、学習により生成したモデルをモデル情報記憶部１２２に格納する。

【0118】

学習部１３３は、学習処理を行う。学習部１３３は、各種学習を行う。学習部１３３は、取得部１３１により取得された情報に基づいて、各種情報を学習する。学習部１３３は、モデルを学習（生成）する。学習部１３３は、モデル等の各種情報を学習する。学習部１３３は、学習によりモデルを生成する。学習部１３３は、種々の機械学習に関する技術を用いて、モデルを学習する。例えば、学習部１３３は、モデル（ネットワーク）のパラメータを学習する。学習部１３３は、種々の機械学習に関する技術を用いて、モデルを学習する。

【0119】

学習部１３３は、モデルＭ１等の各種の学習モデルを生成する。学習部１３３は、ネットワークのパラメータを学習する。例えば、学習部１３３は、モデルＭ１等の各種の学習モデルのネットワークのパラメータを学習する。学習部１３３は、モデル情報記憶部１２２に記憶された学習用データを用いて、学習処理を行うことにより、モデルＭ１等の各種の学習モデルを生成する。例えば、学習部１３３は、画像の生成に用いられるモデルを生成する。学習部１３３は、モデルＭ１等の各種の学習モデルのネットワークのパラメータを学習することにより、モデルＭ１等の各種の学習モデルを生成する。

【0120】

学習部１３３は、モデル情報記憶部１２２に記憶された学習用データ（教師データ）に基づいて、学習処理を行う。学習部１３３は、モデル情報記憶部１２２に記憶された学習用データを用いて、学習処理を行うことにより、モデルＭ１等の各種の学習モデルを生成する。

【0121】

例えば、学習部１３３は、モデルＭ１が出力する画像が、モデルＭ１に入力した入力情報に対応付けられた正解情報（望ましい生成結果を示す情報）に近づくように、バックプロパゲーション（誤差逆伝播法）等の手法により学習処理を行う。例えば、学習部１３３は、ノイズ画像を含む入力情報が入力されたモデルＭ１が出力する画像が、入力されたノイズ画像のノイズが１段階除去された画像（正解情報）に近づくように学習処理を行う。

【0122】

例えば、学習部１３３は、学習処理によりノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を調整する。このように、学習部１３３は、モデルＭ１における出力と、入力に対応する正解情報との誤差が少なくなるようにパラメータ（接続係数）を補正するバックプロパゲーション等の処理によりモデルＭ１を学習する。例えば、学習部１３３は、所定の損失（ロス）関数を最小化するようにバックプロパゲーション等の処理を行うことによりモデルＭ１を生成する。これにより、学習部１３３は、モデルＭ１のパラメータを学習する学習処理を行うことができる。

【0123】

なお、モデルの学習手法については、上述した手法に限定されるものではなく、任意の公知技術が適用可能である。なお、各モデルの生成は、機械学習に関する種々の従来技術を適宜用いて行われてもよい。例えば、モデルの生成は、ＳＶＭ（Support Vector Machine）等の教師あり学習の機械学習に関する技術を用いて行われてもよい。また、例えば、モデルの生成は、教師なし学習の機械学習に関する技術を用いて行われてもよい。例えば、モデルの生成は、深層学習（ディープラーニング）の技術を用いて行われてもよい。例えば、モデルの生成は、ＤＮＮ（Deep Neural Network）やＲＮＮ（Recurrent Neural Network）やＣＮＮ（Convolutional Neural Network）等の種々のディープラーニングの技術を適宜用いて行われてもよい。なお、上記モデルの生成に関する記載は例示であり、モデルの生成は、取得可能な情報等に応じて適宜選択された学習手法により行われてもよい。すなわち、学習部１３３は、学習用データに含まれる入力情報が入力された場合に、正解情報に対応する情報を出力するようにモデルＭ１を学習可能であれば、どのような手法によりモデルＭ１の生成を行ってもよい。

【0124】

上記のように、学習部１３３による学習の手法は特に限定されないが、例えば、データ（入力情報）とその正解情報（出力情報）とを紐づけた学習用データを用意し、その学習用データを多層ニューラルネットワークに基づいた計算モデルに入力して学習してもよい。また、例えばＣＮＮ、３Ｄ－ＣＮＮ等のＤＮＮに基づく手法が用いられてもよい。具体的には、学習部１３３による学習の手法は、Ｕ－ｎｅｔに基づく手法が用いられてもよい。学習部１３３は、音声等のような時系列データを対象とする場合、再帰型ニューラルネットワーク（ＲＮＮ）やＲＮＮを拡張したＬＳＴＭ（Long Short-Term Memory units）に基づく手法を用いてもよい。

【0125】

（処理部１３４）
処理部１３４は、各種情報を処理する。処理部１３４は、記憶部１２０に記憶された情報に基づいて、情報処理を行う。処理部１３４は、推論処理を行う推論部として機能する。処理部１３４は、モデル情報記憶部１２２に記憶されたモデルを用いて、推論処理を行う。例えば、学習部１３３は、生成部１３２により生成された情報に基づいて、推論処理を行う。

【0126】

処理部１３４は、学習部１３３により学習されたモデルＭ１を用いて推論を行う。処理部１３４は、拡散モデルであるモデルＭ１を用いて推論を行う。処理部１３４は、ノイズ画像、グレースケール画像、及びラベルを入力情報としてモデルＭ１に入力することにより、グレースケール画像中の対象にラベルに対応する色が付された画像を生成する推論処理を行う。処理部１３４は、学習部１３３により学習された拡散モデルを用いて、変換後画像を生成する。

【0127】

（提供部１３５）
提供部１３５は、各種情報を提供する。例えば、提供部１３５は、端末装置１０や情報提供装置５０に各種情報を提供する。提供部１３５は、端末装置１０や情報提供装置５０に各種情報を送信する。提供部１３５は、取得部１３１により取得された各種情報に基づいて、種々の情報を提供する。提供部１３５は、生成部１３２により生成された各種情報に基づいて、種々の情報を提供する。

【0128】

提供部１３５は、学習部１３３により学習された各種情報に基づいて、種々の情報を提供する。提供部１３５は、学習部１３３により学習されたモデルに基づいて、種々の情報を提供する。提供部１３５は、処理部１３４により処理された各種情報に基づいて、種々の情報を提供する。例えば、提供部１３５は、情報を端末装置１０に送信する。

【0129】

提供部１３５は、学習部１３３により学習された拡散モデルを用いたサービスを提供する。提供部１３５は、拡散モデルにより生成された変換後画像を用いたサービスをユーザに提供する。提供部１３５は、変換後画像を用いた画像検索サービスをユーザに提供する。

【0130】

提供部１３５は、変換後画像を用いた画像検索の結果をユーザが利用する端末装置１０に送信する。提供部１３５は、変換後画像に類似する類似画像をユーザが利用する端末装置１０に送信する。提供部１３５は、対象画像のグレースケール画像と拡散モデルとを用いて生成された変換後画像を用いたサービスをユーザに提供する。提供部１３５は、指定情報を用いて生成された変換後画像を用いたサービスをユーザに提供する。

【0131】

〔４．情報処理のフロー〕
次に、図６及び図７を用いて、情報処理装置１００による情報処理のフローについて説明する。図６及び図７は、実施形態に係る情報処理の一例を示すフローチャートである。

【0132】

まず、図６に示す処理例について説明する。図６に示すように、情報処理装置１００は、所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像と、学習用画像における所定の対象の特徴を示すラベルとを取得する（ステップＳ１０１）。

【0133】

情報処理装置１００は、学習用グレースケール画像とラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する（ステップＳ１０２）。

【0134】

次に、図７に示す処理例について説明する。図７に示すように、情報処理装置１００は、所定の対象が撮像された画像である学習用画像であって各画素に複数種別の色属性情報が対応付けられた学習用画像から、所定の種別の色属性情報の分布を平坦化した平坦化後画像を生成する（ステップＳ２０１）。

【0135】

情報処理装置１００は、平坦化後画像と、学習用画像における所定の対象の特徴を示すラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する（ステップＳ２０２）。

【0136】

〔５．効果〕
上述してきたように、実施形態に係る情報処理装置１００は、取得部１３１と、学習部１３３とを有する。取得部１３１は、所定の対象が撮像された画像である学習用画像がグレースケール化された学習用グレースケール画像と、学習用画像における所定の対象の特徴を示すラベルとを取得する。学習部１３３は、取得部１３１により取得された学習用グレースケール画像とラベルとに基づいて、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。

【0137】

このように、実施形態に係る情報処理装置１００は、所定の対象が撮像された学習用画像がグレースケール化された学習用グレースケール画像と、学習用画像における所定の対象の特徴を示すラベルに基づいて、ノイズが含まれる画像である一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習することで、画像中の所定の対象の特徴を変換するモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0138】

また、実施形態に係る情報処理装置１００において、取得部１３１は、学習用画像における所定の対象の色、形状、雰囲気の少なくとも１つを含む特徴を示すラベルを取得する。

【0139】

このように、実施形態に係る情報処理装置１００は、学習用画像における所定の対象の色、形状、雰囲気の少なくとも１つを含む特徴を示すラベルを取得することで、画像中の所定の対象の色、形状、雰囲気等を変換するモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0140】

また、実施形態に係る情報処理装置１００において、取得部１３１は、学習用画像における所定の対象の色を示すラベルを取得する。学習部１３３は、一のノイズ画像を、ラベルが示す色の所定の対象を含む学習用画像に近づけるように変換する拡散モデルを学習する。

【0141】

このように、実施形態に係る情報処理装置１００は、学習用画像における所定の対象の色を示すラベルを取得することで、画像中の所定の対象の色を変換するモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0142】

また、実施形態に係る情報処理装置１００において、取得部１３１は、一のノイズ画像を取得する。学習部１３３は、取得部１３１により取得された一のノイズ画像を学習用画像に近づけるように変換する拡散モデルを学習する。

【0143】

このように、実施形態に係る情報処理装置１００は、一のノイズ画像を取得し、取得した一のノイズ画像を用いて拡散モデルを学習することで、適切にモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0144】

また、実施形態に係る情報処理装置１００において、取得部１３１は、学習用画像にノイズを段階的に付与した複数の段階画像を取得する。学習部１３３は、取得部１３１により取得された複数の段階画像を用いて、拡散モデルを学習する。

【0145】

このように、実施形態に係る情報処理装置１００は、学習用画像にノイズを段階的に付与した複数の段階画像を用いて拡散モデルを学習することで、適切にモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0146】

また、実施形態に係る情報処理装置１００において、学習部１３３は、複数の段階画像のうち一の段階画像からノイズを１段階除去した画像である段階画像を生成するように、拡散モデルを学習する。

【0147】

このように、実施形態に係る情報処理装置１００は、複数の段階画像のうち一の段階画像からノイズを１段階除去した画像である段階画像を生成するように、拡散モデルを学習することで、適切にモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0148】

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１段階画像と、第１段階画像に１段階ノイズが付与された第２段階画像とを含む複数の段階画像を取得する。学習部１３３は、第２段階画像からノイズを１段階除去した第１段階画像を生成するように、拡散モデルを学習する。

【0149】

このように、実施形態に係る情報処理装置１００は、第１段階画像に１段階ノイズが付与された第２段階画像からノイズを１段階除去した第１段階画像を生成するように、拡散モデルを学習することで、適切にモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0150】

また、実施形態に係る情報処理装置１００において、取得部１３１は、第２段階画像に１段階ノイズが付与された第３段階画像を含む複数の段階画像を取得する。学習部１３３は、第３段階画像からノイズを１段階除去した第２段階画像を生成するように、拡散モデルを学習する。

【0151】

このように、実施形態に係る情報処理装置１００は、第２段階画像に１段階ノイズが付与された第３段階画像からノイズを１段階除去した第２段階画像を生成するように、拡散モデルを学習することで、適切にモデルを学習することができる。したがって、情報処理装置１００は、適切な画像生成を可能にすることができる。

【0152】

また、実施形態に係る情報処理装置１００は、提供部１３５を有する。提供部１３５は、学習部１３３により学習された拡散モデルを用いたサービスを提供する。

【0153】

このように、実施形態に係る情報処理装置１００は、拡散モデルを用いたサービスを提供することにより、適切なサービス提供を行うことができる。

【0154】

また、実施形態に係る情報処理装置１００において、提供部１３５は、拡散モデルにより生成された変換後画像を用いたサービスをユーザに提供する。

【0155】

このように、実施形態に係る情報処理装置１００は、拡散モデルにより生成された変換後画像を用いたサービスをユーザに提供することにより、適切なサービスをユーザに提供することができる。

【0156】

また、実施形態に係る情報処理装置１００において、提供部１３５は、変換後画像を用いた画像検索サービスをユーザに提供する。

【0157】

このように、実施形態に係る情報処理装置１００は、変換後画像を用いた画像検索サービスをユーザに提供することにより、適切な検索サービスをユーザに提供することができる。

【0158】

また、実施形態に係る情報処理装置１００において、提供部１３５は、変換後画像を用いた画像検索の結果をユーザが利用する端末装置１０に送信する。

【0159】

このように、実施形態に係る情報処理装置１００は、変換後画像を用いた画像検索の結果をユーザが利用する端末装置１０に送信することにより、適切な検索結果をユーザに提供することができる。

【0160】

また、実施形態に係る情報処理装置１００において、提供部１３５は、変換後画像に類似する類似画像をユーザが利用する端末装置１０に送信する。

【0161】

このように、実施形態に係る情報処理装置１００は、変換後画像に類似する類似画像をユーザが利用する端末装置１０に送信することにより、適切な類似画像の検索結果をユーザに提供することができる。

【0162】

また、実施形態に係る情報処理装置１００において、取得部１３１は、ユーザから変換対象となる対象画像を取得する。提供部１３５は、対象画像のグレースケール画像と拡散モデルとを用いて生成された変換後画像を用いたサービスをユーザに提供する。

【0163】

このように、実施形態に係る情報処理装置１００は、ユーザから変換対象となる対象画像を取得し、取得した対象画像のグレースケール画像と拡散モデルとを用いて生成された変換後画像を用いたサービスをユーザに提供することにより、適切なサービスをユーザに提供することができる。

【0164】

また、実施形態に係る情報処理装置１００において、取得部１３１は、ユーザから特徴を指定する指定情報を取得する。提供部１３５は、指定情報を用いて生成された変換後画像を用いたサービスをユーザに提供する。

【0165】

このように、実施形態に係る情報処理装置１００は、ユーザから特徴を指定する指定情報を取得し、取得した指定情報を用いて生成された変換後画像を用いたサービスをユーザに提供することにより、適切なサービスをユーザに提供することができる。

【0166】

また、実施形態に係る情報処理装置１００は、処理部１３４を有する。処理部１３４は、学習部１３３により学習された拡散モデルを用いて、変換後画像を生成する。

【0167】

このように、実施形態に係る情報処理装置１００は、拡散モデルを用いて、変換後画像を生成することにより、適切な画像生成を行うことができる。

【0168】

〔６．ハードウェア構成〕
また、上述した実施形態に係る情報処理装置１００や端末装置１０は、例えば図８に示すような構成のコンピュータ１０００によって実現される。以下、情報処理装置１００を例に挙げて説明する。図８は、ハードウェア構成の一例を示す図である。コンピュータ１０００は、出力装置１０１０、入力装置１０２０と接続され、演算装置１０３０、一次記憶装置１０４０、二次記憶装置１０５０、出力Ｉ／Ｆ（Interface）１０６０、入力Ｉ／Ｆ１０７０、ネットワークＩ／Ｆ１０８０がバス１０９０により接続された形態を有する。

【0169】

演算装置１０３０は、一次記憶装置１０４０や二次記憶装置１０５０に格納されたプログラムや入力装置１０２０から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置１０３０は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等により実現される。

【0170】

一次記憶装置１０４０は、ＲＡＭ（Random Access Memory）等、演算装置１０３０が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置１０５０は、演算装置１０３０が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ＲＯＭ（Read Only Memory）、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等により実現される。二次記憶装置１０５０は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置１０５０は、ＵＳＢメモリやＳＤ（Secure Digital）メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置１０５０は、クラウドストレージ（オンラインストレージ）やＮＡＳ（Network Attached Storage）、ファイルサーバ等であってもよい。

【0171】

出力Ｉ／Ｆ１０６０は、ディスプレイ、プロジェクタ、及びプリンタ等といった各種の情報を出力する出力装置１０１０に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、ＵＳＢ（Universal Serial Bus）やＤＶＩ（Digital Visual Interface）、ＨＤＭＩ（登録商標）（High Definition Multimedia Interface）といった規格のコネクタにより実現される。また、入力Ｉ／Ｆ１０７０は、マウス、キーボード、キーパッド、ボタン、及びスキャナ等といった各種の入力装置１０２０から情報を受信するためのインターフェイスであり、例えば、ＵＳＢ等により実現される。

【0172】

また、出力Ｉ／Ｆ１０６０及び入力Ｉ／Ｆ１０７０はそれぞれ出力装置１０１０及び入力装置１０２０と無線で接続してもよい。すなわち、出力装置１０１０及び入力装置１０２０は、ワイヤレス機器であってもよい。

【0173】

また、出力装置１０１０及び入力装置１０２０は、タッチパネルのように一体化していてもよい。この場合、出力Ｉ／Ｆ１０６０及び入力Ｉ／Ｆ１０７０も、入出力Ｉ／Ｆとして一体化していてもよい。

【0174】

なお、入力装置１０２０は、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。

【0175】

ネットワークＩ／Ｆ１０８０は、ネットワークＮを介して他の機器からデータを受信して演算装置１０３０へ送り、また、ネットワークＮを介して演算装置１０３０が生成したデータを他の機器へ送信する。

【0176】

演算装置１０３０は、出力Ｉ／Ｆ１０６０や入力Ｉ／Ｆ１０７０を介して、出力装置１０１０や入力装置１０２０の制御を行う。例えば、演算装置１０３０は、入力装置１０２０や二次記憶装置１０５０からプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行する。

【0177】

例えば、コンピュータ１０００が情報処理装置１００として機能する場合、コンピュータ１０００の演算装置１０３０は、一次記憶装置１０４０上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。また、コンピュータ１０００の演算装置１０３０は、ネットワークＩ／Ｆ１０８０を介して他の機器から取得したプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ１０００の演算装置１０３０は、ネットワークＩ／Ｆ１０８０を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。

【0178】

〔７．その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

【0179】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

【0180】

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0181】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

【符号の説明】

【0182】

１情報処理システム
１００情報処理装置
１２１学習用データ記憶部
１２２モデル情報記憶部
１３０制御部
１３１取得部
１３２生成部
１３３学習部
１３４処理部
１３５提供部
１０端末装置
５０情報提供装置
Ｎネットワーク

【図1】