IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 窪田 望の特許一覧

特開2023-126068人工知能により生成される画像のベクター画像化
<>
  • 特開-人工知能により生成される画像のベクター画像化 図1
  • 特開-人工知能により生成される画像のベクター画像化 図2
  • 特開-人工知能により生成される画像のベクター画像化 図3
  • 特開-人工知能により生成される画像のベクター画像化 図4
  • 特開-人工知能により生成される画像のベクター画像化 図5
  • 特開-人工知能により生成される画像のベクター画像化 図6
  • 特開-人工知能により生成される画像のベクター画像化 図7
  • 特開-人工知能により生成される画像のベクター画像化 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023126068
(43)【公開日】2023-09-07
(54)【発明の名称】人工知能により生成される画像のベクター画像化
(51)【国際特許分類】
   G06T 1/40 20060101AFI20230831BHJP
   G06N 20/00 20190101ALI20230831BHJP
【FI】
G06T1/40
G06N20/00
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022057575
(22)【出願日】2022-03-30
(62)【分割の表示】P 2022029232の分割
【原出願日】2022-02-28
(71)【出願人】
【識別番号】520040304
【氏名又は名称】窪田 望
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】窪田 望
【テーマコード(参考)】
5B057
【Fターム(参考)】
5B057CA16
5B057CB17
5B057CC01
5B057CE01
5B057CG09
(57)【要約】
【課題】人工知能等により生成される画像であっても、画質の劣化を防ぎつつサイズ変更
を可能にする。
【解決手段】プロセッサを有する情報処理装置により実行される情報処理方法であって、
プロセッサは、生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の
第1画像を生成すること、第1画像をベクター形式の第2画像に変換すること、第2画像
がラスター形式に変換された第3画像、又は第2画像を識別器に入力し、識別結果を取得
すること、識別結果が真であれば、又は識別結果が識別器による第1画像の識別結果と同
じであれば、第2画像を記憶部に記憶すること、を実行する。
【選択図】図6
【特許請求の範囲】
【請求項1】
プロセッサを有する情報処理装置により実行される情報処理方法であって、
前記プロセッサは、
生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生
成すること、
前記第1画像をベクター形式の第2画像に変換すること、
前記第2画像がラスター形式に変換された第3画像、又は前記第2画像を前記識別器に
入力し、識別結果を取得すること、
前記識別結果が真であれば、又は前記識別結果が前記識別器による前記第1画像の識別
結果と同じであれば、前記第2画像を記憶部に記憶すること、
を実行する情報処理方法。
【請求項2】
前記識別器に前記第3画像が入力される場合、前記識別器は、モデルに寄らないメタ学
習(Model-Agnostic Meta-Learning)を実行することを含む、請求項1に記載の情報処理
方法。
【請求項3】
前記プロセッサは、
前記識別結果が偽である場合、又は前記第1画像が前記識別器に入力されたときの識別
結果と異なる場合、前記生成器にノイズを与えて新たな画像を生成するよう指示すること

をさらに実行する、請求項1又は2に記載の情報処理方法。
【請求項4】
前記指示することは、
前記第1画像から前記第2画像への変換アルゴリズムに応じて、前記ノイズを変更する
ことを含む、請求項3に記載の情報処理方法。
【請求項5】
前記プロセッサは、
前記識別結果が偽である場合、ベクター形式の画像を生成する他の生成器に新たな画像
を生成するよう指示すること、
前記他の生成器は、生成したベクター形式の画像を前記識別器に入力すること、
をさらに実行する、請求項2に記載の情報処理方法。
【請求項6】
前記記憶部に記憶された前記第2画像は、仮想空間上で利用される、請求項1又は2に
記載の情報処理方法。
【請求項7】
プロセッサを有する情報処理装置であって、
前記プロセッサは、
生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生
成すること、
前記第1画像をベクター形式の第2画像に変換すること、
前記第2画像がラスター形式に変換された第3画像、又は前記第2画像を前記識別器に
入力し、識別結果を取得すること、
前記識別結果が真であれば、又は前記識別結果が前記識別器による前記第1画像の識別
結果と同じであれば、前記第2画像を記憶部に記憶すること、
を実行する情報処理装置。
【請求項8】
情報処理装置に含まれるプロセッサに、
生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生
成すること、
前記第1画像をベクター形式の第2画像に変換すること、
前記第2画像がラスター形式に変換された第3画像、又は前記第2画像を前記識別器に
入力し、識別結果を取得すること、
前記識別結果が真であれば、又は前記識別結果が前記識別器による前記第1画像の識別
結果と同じであれば、前記第2画像を記憶部に記憶すること、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人工知能により生成される画像をベクター画像化する情報処理方法、情報処
理装置及びプログラムに関する。
【背景技術】
【0002】
従来、敵対的生成ネットワーク(GANs:Generative Adversarial Networks)を利
用して高品質の画像が生成されることが知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-3423号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
人口知能(AI:Artificial Intelligence)を利用して画像が生成される場合、敵対
的生成ネットワーク(GAN)を用いて画像が生成されるケースが多い。GANsにより
生成される画像は高品質ではあるが、ラスター形式の画像であることがほとんどであるた
め、画像サイズの変更には適していない。例えば、高解像度のラスター画像であっても、
大幅に拡大をすると、どうしても曲線などの部分にぼやけが生じ、画質が劣化してしまう
【0005】
そこで、本発明は、人工知能(AI)等により生成される画像であっても、画質の劣化
を防ぎつつサイズ変更を可能にする情報処理方法、情報処理装置、及びプログラムを提供
する。
【課題を解決するための手段】
【0006】
本発明の一態様に係る情報処理方法は、プロセッサを有する情報処理装置により実行さ
れる情報処理方法であって、前記プロセッサは、生成器と識別器とを含む敵対的生成ネッ
トワークを用いてラスター形式の第1画像を生成すること、前記第1画像をベクター形式
の第2画像に変換すること、前記第2画像がラスター形式に変換された第3画像、又は前
記第2画像を前記識別器に入力し、識別結果を取得すること、前記識別結果が真であれば
、又は前記識別結果が前記識別器による前記第1画像の識別結果と同じであれば、前記第
2画像を記憶部に記憶すること、を実行する。
【発明の効果】
【0007】
本発明によれば、人工知能(AI)等により生成される画像であっても、画質の劣化を
防ぎつつサイズ変更を可能にする。
【図面の簡単な説明】
【0008】
図1】実施形態に係るシステム構成の一例を示す図である。
図2】実施形態に係る情報処理装置の物理的構成の一例を示す図である。
図3】実施形態に係る情報処理装置の処理ブロックの一例を示す図である。
図4】実施例1に係る保存画像の一例を示す図である。
図5】実施例1に係る画像変換アルゴリズムに対応付けられるノイズの一例を示す図である。
図6】実施例1に係る情報処理装置の処理例を示すフローチャートである。
図7】実施例2に係る情報処理装置の処理ブロックの一例を示す図である。
図8】実施例2に係る情報処理装置の処理例を示すフローチャートである。
【発明を実施するための形態】
【0009】
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一
の符号を付したものは、同一又は同様の構成を有する。
【0010】
<システム構成>
図1は、実施形態に係るシステム構成の一例を示す図である。図1に示す例では、サー
バ10と、各情報処理装置20A、20B、20C、20Dとが、ネットワークを介して
データ送受信可能なように接続される。情報処理装置を個別に区別しない場合は情報処理
装置20とも表記する。
【0011】
サーバ10は、データを収集、分析可能な情報処理装置であり、1つ又は複数の情報処
理装置から構成されてもよい。情報処理装置20は、スマートフォン、パーソナルコンピ
ュータ、タブレット端末、サーバ、コネクティッドカーなど、機械学習を実行可能な情報
処理装置である。なお、情報処理装置20は、脳波をセンシングする侵襲型又は非侵襲型
の電極に直接的又は間接的に接続されており、脳波データを解析、送受信可能な装置でも
よい。
【0012】
図1に示すシステムでは、サーバ10は、例えばGANsにより画像を生成し、生成し
た画像をラスター形式(フォーマット)に変換してベクター形式の画像を記憶する。この
とき、単にGANsにより生成されたラスター形式の画像をベクター形式に変換するので
はなく、ラスター形式の画像をベクター形式の画像に変換する際の変換誤差が考慮される
。すなわち、ラスター形式からベクター形式への変換誤差があることを考慮したうえで、
ベクター形式の画像がディスプレイ等に表示される際に、元のラスター形式の画像の表示
とほぼ同一の表示となるようなベクター形式の画像が保存される。
【0013】
サーバ10は、各情報処理装置20からの所定画像のリクエストに応じて、GANsを
用いて所定画像を生成し、生成された所定画像に基づいて、上述したベクター形式の所定
画像を生成し、このベクター形式の所定画像を、リクエストした情報処理装置20に送信
したりしてもよい。
【0014】
各情報処理装置20は、条件等を指定して所定画像を生成するリクエストをサーバ10
に送信する。また、各情報処理装置20は、サーバ10からベクター形式の所定画像を受
信し、仮想空間上で所定画像を表示してもよい。
【0015】
これにより、AIにより生成されたラスター形式の所定画像は、変換誤差を考慮して、
ラスター画像と同一視可能なベクター形式に変換されているため、この所定画像に対して
サイズの変更がなされても、画質の劣化を防ぐことができる。例えば、AIにより生成さ
れた画像が仮想空間上(例えばメタバース上)で販売される場合、サイズが変更されても
画質劣化がない画像の販売が可能になる。
【0016】
<ハードウェア構成>
図2は、実施形態に係る情報処理装置10の物理的構成の一例を示す図である。情報処
理装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部
に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read o
nly Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。
これらの各構成は、バスを介して相互にデータ送受信可能に接続される。
【0017】
本実施形態では、情報処理装置10が一台のコンピュータで構成される場合について説
明するが、情報処理装置10は、複数のコンピュータ又は複数の演算部が組み合わされて
実現されてもよい。また、図1で示す構成は一例であり、情報処理装置10はこれら以外
の構成を有してもよいし、これらの構成のうち一部を有さなくてもよい。
【0018】
CPU10aは、プロセッサの一例であり、RAM10b又はROM10cに記憶され
たプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10
aは、例えば、所定の学習モデルを用いて学習を行うプログラム(学習プログラム)を実
行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを
受け取り、データの演算結果を表示部10fに表示したり、RAM10bに格納したりす
る。
【0019】
RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記
憶素子で構成されてよい。RAM10bは、CPU10aが実行するプログラム、各学習
モデル、各学習モデルのパラメータに関するデータ、学習に使用するデータなどを記憶し
てもよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶
されていてもよいし、これらの一部が記憶されていなくてもよい。
【0020】
ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記
憶素子で構成されてよい。ROM10cは、例えば学習プログラムや、書き換えが行われ
ないデータを記憶してよい。
【0021】
通信部10dは、情報処理装置10を他の機器に接続するインターフェースである。通
信部10dは、インターネット等の通信ネットワークに接続されてよい。
【0022】
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボー
ド及びタッチパネルを含んでよい。
【0023】
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば
、LCD(Liquid Crystal Display)により構成されてよい。表示部10fが演算結果を
表示することは、XAI(eXplainable AI:説明可能なAI)に貢献し得る。表示部10
fは、例えば、学習結果や、学習に関連するデータを表示してもよい。
【0024】
学習プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可
能な非一時的な記録媒体に記憶されて提供されてもよいし、通信部10dにより接続され
る通信ネットワークを介して提供されてもよい。情報処理装置10では、1又は複数のC
PU10aがプログラムを実行することにより、後述する様々な動作が実現される。なお
、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば
、情報処理装置10は、CPU10aとRAM10bやROM10cが一体化したLSI
(Large-Scale Integration)を備えていてもよい。また、情報処理装置10は、GPU
(Graphical Processing Unit)やASIC(Application Specific Integrated Circuit
)を備えていてもよい。
【0025】
なお、情報処理装置20の構成は、図2に示す情報処理装置10の構成と同様であるた
め、その説明を省略する。また、情報処理装置10と情報処理装置20とは、データ処理
を行う基本的な構成であるCPU10aやRAM10b等を有していればよく、入力部1
0eや表示部10fは設けられなくてもよい。また、入力部10eや表示部10fは、外
部からインターフェースを用いて接続されてもよい。
【0026】
<処理構成>
図3は、実施形態に係る情報処理装置(サーバ装置)10の処理ブロックの一例を示す
図である。情報処理装置10は、取得部102、画像生成部104、データベース(DB
)110、第1画像変換部112、第2画像変換部114、判定部116、記憶部118
、出力部120を備える。情報処理装置20は、量子コンピュータなどで構成されてもよ
い。
【0027】
取得部102及び出力部120は、例えば図2に示す通信部10dにより実現されうる
。画像生成部104、第1画像変換部112、第2画像変換部114、及び判定部116
は、例えば図2に示すCPU10aにより実現されうる。DB110は、例えば図2に示
すROM10c及び/又はRAM10bにより実現されうる。記憶部118は、例えば図
2に示すRAM10b及び/又はROM10cにより実現されうる。
【0028】
取得部102は、画像生成リクエストを取得する。画像生成リクエストは、各情報処理
装置20から送信されたリクエストでもよいし、情報処理装置10を管理するユーザの操
作に応じて取得されたリクエストでもよい。例えば、画像生成リクエストは、画像データ
と画像生成の条件又は画像生成のためのテキストなどであり、GANsにより画像を生成
するために入力されるデータでもよい。取得部102は、画像生成リクエストの取得に応
じて、画像生成部104に画像を生成するよう命令する。
【0029】
画像生成部104は、例えば、敵対的生成ネットワーク(GANs)を実行することに
より所定の画像を生成する。具体例として、画像生成部104は、生成器106と識別器
108とを含む敵対的生成ネットワーク(GANs)を用いてラスター形式の第1画像を
生成する。例えば、GANsは、以下の手法のいずれかを用いることが可能である。
(1)pix2pix
条件画像と画像のペアから画像同士の関係を学習することで、1枚の画像から学習したペ
アの画像関係を補完した画像が生成される。
(2)CycleGAN
2組の画像を使い、一方の画像から他方の画像を生成し、他方の画像から一方の画像に戻
した時に(サイクルした時に)精度が高くなるように学習させる。
(3)CGAN((Conditional GAN)
条件付きGANと呼ばれ、生成器と識別器に画像データに加えて追加の情報を与えること
で、条件付けができるように訓練を行う。
(4)DCGAN(Deep Convolutional GAN)
DCGANは広い意味でCGANの一種であり、オリジナルGANとの大きな違いは、生
成器(generator)と識別器(Discriminator)それぞれのネットワークに全結合層ではな
く、畳み込み層と転置畳み込み層を使用し、画像が生成される。
(5)PGGAN(Progressive Growing GAN)
PGGANとDCGANとは異なり、段階的に学習データの解像度を上げて行き、これに
合わせて生成器と識別器のネットワークもその対象構造を保ったまま層を追加して解像度
を上げていくことで、画像が生成される。
(6)BigGAN
生成器に直行正規化を用い、最大で512x512ピクセルの高解像度画像を条件付きで
生成するモデルを用いて、画像が生成される。
(7)StyleGAN
低解像度の学習から初めて、モデルに徐々に高い解像度に対応した層を加えながら学習を
進めるprogressive growingを用いることで、画像が生成される。
(8)StackGAN
GANを多段構成にすることによって、最初のステージのGANで大枠をとらえた低解像
度な画像が生成され、以降のステージのGANでより高解像度な画像が生成される。
(9)AttnGAN
画像のキャプションのようなテキストによる描写の個々の単語に注意を払うことにより、
画像のさまざまなサブ領域で詳細を合成することが、画像が生成される。
上述した手法はGANsの一例であり、その他のGANsの手法が用いられてもよい。
【0030】
画像生成部104は、所定のGANsを実行することで、画像生成リクエストに応じた
画像を生成する。例えば、画像生成部104は、ノイズを発生させて、ノイズを生成器1
06に入力する。生成器106は、入力されたノイズ、又は画像生成リクエストに含まれ
るデータを用いて画像を生成する。ノイズは乱数でもよい。例えば、生成器106は、上
述したGANsのいずれかの所定の構造を有するニューラルネットワークが用いられても
よい。
【0031】
識別器108は、生成器106により生成されたラスター形式の第1画像、及び/又は
DB110に記憶されている正解画像を取得する。識別器108は、入力画像が生成器1
06により生成された画像であるか、正解画像であるかを判別する。例えば、識別器10
8は、上述したGANsのうち、生成器106に対応する所定の構造を有するニューラル
ネットワークが用いられてもよい。なお、正解画像は、必ずしもDB110に記憶された
ものである必要はなく、画像生成リクエストにより指定された条件を満たす画像であって
もよい。
【0032】
画像生成部104は、識別器108による真贋の判別結果により、生成器106と識別
器108とのパラメータを更新する。例えば、画像生成部104は、識別器108が入力
画像の真贋を正しく判別するように、誤差逆伝搬法(バックプロパゲーション)を用いて
識別器108のパラメータを更新する。また、画像生成部104は、識別器108が、生
成器106によって生成された画像を正解画像であると判別するように、誤差逆伝搬法を
用いて生成器106のパラメータを更新する。画像生成部104は、最終的に生成された
画像を第1画像変換部112に出力する。
【0033】
第1画像変換部112は、画像生成部104により生成された最終的な画像(第1画像
)を取得し、ベクター形式の画像(第2画像)に変換する。第1画像変換部112は、ラ
スター形式からベクター形式への変換手法について、公知のいずれかの手法を用いればよ
い。例えば、ラスター形式からベクター形式への変換ツールは、Vectorizer.
io、Vector Magic、Autotracer.org、Convertio
、pngtosvg.comなどがある。第1画像変換部112は、ベクター形式の第2
画像を第2画像変換部114又は識別器108に出力する。
【0034】
第2画像変換部114は、第1画像変換部112により生成されたベクター形式の第2
画像をラスター形式の画像(第3画像)に変換する。例えば、第2画像変換部114は、
ベクター形式の画像をディスプレイに表示する処理を実行し、画像が表示される状態から
ラスター形式に変換してもよい。また、SVG(Scalable Vector Graphics)形式の第2
画像であれば、ブラウザによりディスプレイに表示可能であり、ディスプレイに表示され
る形態の画像がラスター形式の第3画像に変換されてもよい。第2画像変換部114は、
ベクター形式の変換手法について、公知のいずれかの手法を用いればよい。例えば、ベク
ター形式からラスター形式への変換ツールは、svgtopng.com、Adobe
Photoshop Expressなどがある。第2画像変換部114は、ラスター形
式の第3画像を識別器108に出力する。
【0035】
識別器108は、第1画像変換部112により出力されたベクター形式の第2画像、又
は、第2画像変換部114により出力されたラスター形式の第3画像を入力し、識別結果
を取得する。
【0036】
識別器108に第3画像が入力される場合、識別器108は、モデルに寄らないメタ学
習(Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks:https://a
rxiv.org/abs/1703.03400)を実行してもよい。識別器108は、データ形式が異なるデ
ータでも分類学習を行うことが可能なメタ学習を行うことで、ラスター形式の画像と、ベ
クター形式の画像とを同じ学習モデルを用いて真贋の分類を行うことが可能になる。
【0037】
判定部116は、識別器108により出力された第2画像又は第3画像の識別結果と、
第2画像の元となる第1画像の識別結果とを取得し、両者の識別結果が同じであるか否か
を判定する。例えば、第1画像の識別結果は、正解画像と同じであり、すなわち真(Tr
ue)と識別されていることが想定される。よって、判定部116は、識別器108によ
り出力された第2画像又は第3画像の識別結果が真(正解画像と同じ)であるか否かを判
定してもよい。判定部116は、判定結果が肯定である場合、ベクター形式の第2画像を
記憶するよう記憶部118に指示する。
【0038】
記憶部118は、判定部116により肯定判定された第2画像を記憶する。肯定判定と
は、識別器108により出力された第2画像又は第3画像の識別結果が真(正解画像と同
じ)であると判定されること、又は、識別器108により出力された第2画像又は第3画
像の識別結果と、第1画像の識別結果とが同じであると判定されることである。
【0039】
なお、識別器108は、真贋判定する際に、DB110に登録された正解画像や、画像
生成リクエストにより特定される所定画像を真として識別するが、第2画像又は第3画像
が入力される場合は、第1画像を真として真贋を識別してもよい。
【0040】
出力部120は、画像生成リクエストを送信した情報処理装置20に対し、記憶部11
8に記憶されたベクター形式の第2画像を出力してもよい。また、出力部120は、第2
画像に対する取得リクエストを送信した情報処理装置20に出力してもよい。
【0041】
以上の処理により、AIにより生成されたラスター形式の所定画像は、変換誤差を考慮
してベクター形式に変換されているため、この所定画像に対してサイズが変更されても、
画質の劣化を防ぐことができる。例えば、AIにより生成された画像が仮想空間上(例え
ばメタバース上)で販売される場合、サイズ変更しても画質劣化がない画像の販売が可能
になる。
【0042】
ここで、ラスター画像からベクター画像への変換誤差により、真贋判定において偽(F
alse)と判断された場合、又は変換前後において識別器108の識別結果が異なる結
果となる場合に、表示される際の画像を考慮したベクター形式の画像が生成されるとよい
。このとき、ベクター形式の画像の更新について、ラスター形式の画像を用いてベクター
形式の画像を更新する実施例1と、ベクター形式の画像を直接更新する実施例2とがあり
、以下に説明する。
【0043】
[実施例1]
実施例1では、上述したとおり、ラスター形式の画像を用いてベクター形式の画像を更
新するが、画像生成部104のGANsを利用して新たな第1画像を生成する(更新する
)。図3に示すブロック構成は、実施例1に係るブロック構成に対応する。
【0044】
実施例1における判定部116は、第2画像又は第3画像の識別結果が偽(False
)となる場合、又は、第2画像又は第3画像の識別結果と第1画像が前記識別器に入力さ
れたときの識別結果とが異なる場合、生成器106にノイズを与えて新たな画像を生成す
るよう指示する。
【0045】
生成器106は、ノイズを用いて画像を生成し、識別器108は、生成器106に生成
された画像に対して真贋の識別を行う。ここで真と判断された画像(更新された第1画像
)が第1画像変換部112に出力され、更新された第1画像は第2画像に変換される。そ
して、第2画像、又は、第2画像が変換された第3画像が識別器108に入力され、この
識別結果が判定部116に出力される。判定部116において、識別器108の結果が真
と判定されるまで、画像生成、真贋識別、変換、判定の処理が繰り返される。最終的に、
判定部116により肯定判定された場合のベクター形式の第2画像が記憶部118に記憶
される。
【0046】
これにより、変換誤差を考慮して、表示された場合に識別器108に真と判定されるよ
うなベクター形式の画像を保存することが可能になる。これにより、拡大縮小時に画質が
劣化せず、画像生成AIにより生成された画像の画質を保つことが可能になる。
【0047】
また、判定部116は、生成器106に画像生成の指示を行うとき、ラスター形式の第
1画像からベクター形式の第2画像への変換アルゴリズムに応じてノイズを変更すること
を含んでもよい。例えば、情報処理装置10は、ラスター形式からベクター形式への変換
アルゴリズムとノイズとの関係について学習モデルを用いて学習し、どのノイズを与えれ
ば、早く収束するかを把握しておくとよい。このとき、判定部116は、変換アルゴリズ
ムごとにノイズを対応づけた情報を保持し、この情報を用いて、第1画像変換部112が
利用した変換アリゴリズムに対応するノイズを選択して生成器106に出力するようにし
てもよい。
【0048】
これにより、判定部116により肯定判定されるまでの収束速度を早くし、情報処理装
置10の処理効率を向上させることが可能になる。
【0049】
<データ例>
図4は、実施例1に係る保存画像の一例を示す図である。図4に示す例では、記憶部1
18に記憶された画像の例を示す。例えば、ベクター形式の画像には画像IDが付与され
、画像ID「0001」には、「Img01」としてベクター形式のデータが対応付けら
れる。ベクター形式のデータは、例えば、コントロールポイントである複数の点の数値、
この点から数式によって導き出される曲線などである。
【0050】
図5は、実施例1に係る画像変換アルゴリズムに対応付けられるノイズの一例を示す図
である。図5に示す情報は、例えば判定部116により保持される。例えば、ラスター形
式の「PNG」からベクター形式の「SVG」に変換する変換アルゴリズムの場合、ノイ
ズ「N01」が対応付けられている。図5に示す変換アルゴリズムとノイズとの関係は、
学習モデルを用いて学習されててもよい。
【0051】
<処理例>
図6は、実施例1に係る情報処理装置10の処理例を示すフローチャートである。ステ
ップS102において、画像生成部104は、生成器106と識別器108とを含む敵対
的生成ネットワークを用いてラスター形式の第1画像を生成する。
【0052】
ステップS104において、第1画像変換部112は、画像生成部104により生成さ
れた第1画像をベクター形式の第2画像に変換する。このとき、画像生成部104は、最
終的に生成された(識別器108により真と判断された)第1画像を第1画像変換部11
2に出力するとよい。
【0053】
ステップS106において、第1画像変換部112は、変換した第2画像を識別器10
8に入力し、又は第2画像変換部114は、第2画像をラスター形式の第3画像に変換し
、変換した第3画像を識別器108に入力する。識別器108は、第2画像又は第3画像
に対する真贋の識別を行い、識別結果を取得する。
【0054】
ステップS108において、判定部116は、第2画像又は第3画像の識別結果が真で
あるか、又はこの識別結果が識別器108による第2画像の元となる第1画像の識別結果
と同じであるかを判定する。ステップS108の判定結果が肯定であれば、処理はステッ
プS110に進み、ステップS108の判定結果が否定であれば、ステップS102に戻
り、第1画像が画像生成部104により更新される。
【0055】
ステップS110において、記憶部118は、判定部116の結果が肯定である場合、
肯定判定されたときのベクター形式の第2画像を記憶する。
【0056】
以上の処理により、敵対的生成ネットワーク(GANs)を用いて真と判断された第1
画像に対して、ベクター形式への変換誤差を考慮して、同じGANsを用いて画像を更新
することが可能になり、ベクター形式の画像として保存することが可能になる。最終的に
判定部116により肯定されたベクター形式の第2画像は、この第2画像が表示されると
きに、識別器108で真と判断されたラスター形式の画像と品質が変わらず、サイズ変換
時にも画質が劣化しない。
【0057】
[実施例2]
実施例2では、上述したとおり、ベクター形式の画像を直接更新するが、例えば、ベク
ター形式の画像を生成できるDeepSVG(https://proceedings.neurips.cc/paper/2
020/file/bcf9d6bd14a2095866ce8c950b702341-Paper.pdf)の生成モデルを用いてベクタ
ー形式の画像を更新する。なお、ベクター形式の画像を生成するモデルであればいずれの
モデルが利用されてもよい。
【0058】
図7は、実施例2に係る情報処理装置10の処理ブロックの一例を示す図である。図3
に示す処理ブロックと同様の処理を行うものは同じ符号を付す。図7に示す第2画像生成
部202は、ベクター形式の画像を生成可能な生成モデル(例えばDeepSVG)を用
いてベクター形式の画像を生成する第2生成器204と識別器206とを含む第2敵対的
生成ネットワークを構成する。ここで、ラスター形式の画像を生成する敵対的生成ネット
ワークは、第1画像生成部104と表記する。
【0059】
判定部208は、第1画像変換部112により変換された第2画像の識別器206によ
る識別結果が真でない場合、第2生成器204に対し、ベクター形式の画像を生成するよ
う指示する。
【0060】
第2生成器204は、生成モデルを用いて生成したベクター画像を識別器206に入力
する。ここで、第2画像生成部202は、第2生成器204と識別器206とを有する敵
対的生成ネットワークを用いて、高品質なベクター画像を生成する。ここで、識別器20
6は、ベクター形式の画像を用いて真贋判断を行うため、上述したようなメタ学習を実行
する学習モデルを有する。
【0061】
判定部208は、第2画像生成部202の識別器206による識別結果を取得し、識別
結果が偽であれば、第2生成器204に画像生成を指示し、識別結果が真であれば、ベク
ター形式の第2画像を記憶部118に記憶するために出力する。
【0062】
以上の処理により、ベクター形式の画像を生成する第2生成器204と、ベクター形式
の画像で真贋の識別を行う識別器206とを用いて新たな敵対的生成ネットワークを構成
することにより、ベクター形式の画像のまま処理を実行することが可能になる。これによ
り、ラスター形式からベクター形式の画像への変換処理を削減することができる。情報処
理装置10の処理負荷を減らすことが可能になる。
【0063】
<処理例>
図8は、実施例2に係る情報処理装置10の処理例を示すフローチャートである。実施
例2に係る処理について、図6に示すステップS102からステップS106までは同様
の処理であるため処理を省略する。図8では、ステップS108以降の処理を記載する。
【0064】
ステップS108において、判定部208は、第2画像又は第3画像の識別結果が真で
あるか、又はこの識別結果が識別器206による第2画像の元となる第1画像の識別結果
と同じであるかを判定する。ステップS108の判定結果が肯定であれば、処理はステッ
プS206に進み、ステップS108の判定結果が否定であれば、ステップS202に進
む。
【0065】
ステップS202において、第2生成器204は、ベクター形式の画像を生成する生成
モデルを用いて、新たな第2画像を生成する(更新する)。
【0066】
ステップS204において、判定部208は、更新された第2画像の識別結果が真であ
るかを判定する。ステップS204の判定結果が肯定であれば、処理はステップS206
に進み、ステップS204の判定結果が否定であれば、ステップS202に戻る。
【0067】
ステップS206において、記憶部118は、判定部208の結果が肯定である場合、
肯定判定されたときのベクター形式の第2画像を記憶する。
【0068】
以上の処理により、ベクター形式の画像を生成する第2生成器204と、ベクター形式
の画像で真贋の識別を行う識別器206とを用いて新たな敵対的生成ネットワークを構成
することにより、ベクター形式の画像のまま処理を実行することが可能になる。これによ
り、ラスター形式からベクター形式の画像への変換処理を削減することができる。情報処
理装置10の処理負荷を減らすことが可能になる。実施例2において、第1画生成部10
4以外で生成されたラスター形式の画像を真の画像として、第1画像変換部112と第2
画像生成部202と判定部208とを用いて、上述されたベクター形式の画像を生成して
もよい。
【0069】
また、上述したとおり、実施例1又は実施例2の記憶部118に記憶された第2画像は
、仮想空間上で利用されてもよい。ラスター形式の画像はラスター画像、ベクター形式の
画像はベクター画像と称されてもよい。
【0070】
以上、実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解
釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状
及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。ま
た、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能であ
る。
【符号の説明】
【0071】
10、20…情報処理装置、10a…CPU、10b…RAM、10c…ROM、10d
…通信部、10e…入力部、10f…表示部、102…取得部、104…画像生成部(第
1画像生成部)、106…生成器(第1生成器)、108…識別器、110…DB、11
2…第1画像変換部、114…第2画像変換部、116…判定部、118…記憶部、12
0…出力部、202…第2画像生成部、204…第2生成器、206…識別器、208…
判定部
図1
図2
図3
図4
図5
図6
図7
図8