IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社Ristの特許一覧

特許7457879データ生成方法、プログラム、データ生成装置、及び学習済みモデル
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-19
(45)【発行日】2024-03-28
(54)【発明の名称】データ生成方法、プログラム、データ生成装置、及び学習済みモデル
(51)【国際特許分類】
   G06T 19/00 20110101AFI20240321BHJP
【FI】
G06T19/00 A
【請求項の数】 9
(21)【出願番号】P 2023547777
(86)(22)【出願日】2023-03-16
(86)【国際出願番号】 JP2023010274
【審査請求日】2023-08-08
【早期審査対象出願】
(73)【特許権者】
【識別番号】517051371
【氏名又は名称】株式会社Rist
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】藤田 亮
(72)【発明者】
【氏名】堀川 由人
【審査官】佐野 潤一
(56)【参考文献】
【文献】中国特許出願公開第112184873(CN,A)
【文献】特開2002-133440(JP,A)
【文献】米国特許第07250945(US,B1)
【文献】横井 茂樹 ,コンピュータグラフィックス[II],電子情報通信学会誌 第76巻 第5号,日本,社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS,1993年05月25日,第76巻,第5号,529-537
(58)【調査した分野】(Int.Cl.,DB名)
G06T 15/00-19/00
G09G 5/00
H04N 13/00
H04N 17/00
(57)【特許請求の範囲】
【請求項1】
コンピュータが、
3次元フラクタルの形状と、3次元空間に配置された前記3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、前記3次元フラクタルがレンダリングされた画像を生成することと、
前記3次元フラクタルの前記形状及び前記レンダリングパラメータを識別するラベル情報を生成することと、
前記ラベル情報と前記画像との複数の組を、前記画像の入力に対して、前記ラベル情報を出力する学習モデルの機械学習に用いられるデータセットとして記録することと、を含む、データ生成方法。
【請求項2】
請求項1に記載のデータ生成方法であって、
前記レンダリングパラメータは、前記3次元フラクタルの表面におけるテクスチャを設定するための物体テクスチャ情報を含む、データ生成方法。
【請求項3】
請求項2に記載のデータ生成方法であって、
前記物体テクスチャ情報は、前記3次元フラクタルの色を設定するための情報を含む、データ生成方法。
【請求項4】
請求項1に記載のデータ生成方法であって、
前記レンダリングパラメータは、前記3次元空間における前記3次元フラクタルに対する視点を設定するための視点情報を含む、データ生成方法。
【請求項5】
請求項1に記載のデータ生成方法であって、
前記レンダリングパラメータは、前記3次元空間に配置される光源を設定するための光源情報を含む、データ生成方法。
【請求項6】
請求項1に記載のデータ生成方法であって、
前記コンピュータが、前記3次元フラクタルの形状を設定する物体パラメータに基づいて前記3次元フラクタルの前記形状を生成すること、をさらに含む、データ生成方法。
【請求項7】
コンピュータに、
3次元フラクタルの形状と、3次元空間に配置された前記3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、前記3次元フラクタルがレンダリングされた画像を生成することと、
前記3次元フラクタルの形状及び前記レンダリングパラメータを識別するラベル情報を生成することと、
前記ラベル情報と前記画像との複数の組を、前記画像の入力に対して、前記ラベル情報を出力する学習モデルの機械学習に用いられるデータセットとして記録することと、を実行させる、プログラム。
【請求項8】
3次元フラクタルの形状と、3次元空間に配置された前記3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、前記3次元フラクタルがレンダリングされた画像を生成する画像生成部と、
前記3次元フラクタルの形状及び前記レンダリングパラメータを識別する識別するラベル情報を生成するラベル情報生成部と、
前記ラベル情報と前記画像との複数の組を、前記画像の入力に対して、前記ラベル情報を出力する学習モデルの機械学習に用いられるデータセットとして記録するデータ記録部と、を備える、データ生成装置。
【請求項9】
第1の3次元フラクタルがレンダリングされた第1画像を入力とし、前記第1の3次元フラクタルの形状及び前記第1の3次元フラクタルの3次元空間に配置された前記第1の3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータを識別する第1のラベル情報を出力とする教師データを用いて学習され、
第2の3次元フラクタルがレンダリングされた第2画像の入力に対し、前記第2の3次元フラクタルの形状及び前記第2の3次元フラクタルの前記3次元空間に配置された前記第2の3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータを識別する第2のラベル情報を出力するよう、コンピュータを機能させる学習済みモデル。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ生成方法、プログラム、データ生成装置、及び学習済みモデルに関する。
【背景技術】
【0002】
機械学習を利用した画像分類が様々な用途で用いられている。画像分類のための学習済みモデルは、例えば、画像と画像に対して付与されるラベルとがセットになった学習データに基づいて構築される。用途に応じた画像分類のための学習済みモデルは、例えば、既存の学習済みモデルであるベースモデルを用いて転移学習やファインチューニングを行うことによって生成される。
【0003】
ベースモデルは、例えば、画像と画像に付与されたラベルとの組を多数有する大規模画像データセット(ImageNet等)を用いて学習された学習済みモデルである。ImageNetは公開されたオープンなデータセットであるが、インターネットから無作為に集められた画像であり、例えば、それらの画像について著作権や肖像権などの懸念がある。
【0004】
非特許文献1には、インターネットから収集した画像ではなく、画像分類のための学習済みモデルを学習させるための画像を、数式に基づいて生成する手法が開示されている。
【先行技術文献】
【非特許文献】
【0005】
【文献】R. Yamada et al., MV-FractalDB: Formula-driven Supervised Learning for Multi-view Image Recognition, “2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)”, 2021, pp. 2076-2083
【発明の概要】
【発明が解決しようとする課題】
【0006】
非特許文献1に記載の手法では、数式に基づいて生成された3次元フラクタルを様々な視点から見た場合の画像が生成される。結果として生成される画像は、例えば、3次元フラクタルの凹凸や立体感を含むものではないため、転移学習の際の入力となる現実世界における撮影画像との差異が大きくなってしまう。したがって、生成された画像を転移学習のベースモデル生成のためのデータセットとして利用するにあたって、現実世界における撮影画像の分類に必要な特徴量の抽出が難しく、ベースモデルの精度については向上の余地がある。
【0007】
そこで、本発明は、画像分類のための転移学習に適した学習済みモデルの精度を向上させることを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様に係るデータ生成方法は、コンピュータが、3次元フラクタルの形状と、3次元空間に配置された3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、3次元フラクタルがレンダリングされた画像を生成することと、3次元フラクタルの形状及びレンダリングパラメータを識別するラベル情報を生成することと、ラベル情報と画像との組をデータとして記録することと、を含む。
【0009】
この態様によれば、3次元空間に配置された3次元フラクタルにおける仮想的な光の反射がレンダリングパラメータとして設定されて、3次元フラクタルがレンダリングされた画像が生成される。光の反射をレンダリング時に設定することで、3次元フラクタルを含む画像が、現実世界における画像により近い状態を示すようにできる。これにより、画像の分類に必要な特徴量をより抽出可能であり、ベースモデルの精度を向上させることが可能なデータが生成される。
【0010】
上記態様において、レンダリングパラメータは、3次元フラクタルの表面におけるテクスチャを設定するための物体テクスチャ情報を含んでもよい。テクスチャ情報を含めてレンダリングすることで、物体表面のテクスチャの情報を有する画像の分類に用い得る3次元フラクタルの画像が生成可能となる。
【0011】
上記態様において、物体テクスチャ情報は、3次元フラクタルの色を設定するための情報を含んでもよい。モデルの色の情報を含めてレンダリングすることで、色の情報を有する画像の分類に用い得る3次元フラクタルの画像が生成可能となる。
【0012】
上記態様において、レンダリングパラメータは、3次元空間における3次元フラクタルに対する視点を設定するための視点情報を含んでもよい。視点を設定可能とすることで、3次元フラクタルを含む画像が、現実世界における画像により近い状態を示すようにできる。
【0013】
上記態様において、レンダリングパラメータは、3次元空間に配置される光源を設定するための光源情報を含んでもよい。光源を設定可能とすることで、3次元フラクタルを含む画像が、現実世界における画像により近い状態を示すようにできる。
【0014】
上記態様において、データ生成方法は、コンピュータが、3次元フラクタルの形状を設定する物体パラメータに基づいて3次元フラクタルの形状を生成すること、をさらに含んでもよい。この態様によれば、物体パラメータを設定することで、コンピュータが様々な形状を生成することが可能となる。よって、3次元フラクタルを含む画像のバリエーションを増やすことが可能となり、画像の分類に必要な特徴量をより抽出可能にできる。
【0015】
本発明の他の態様に係るプログラムは、コンピュータに、3次元フラクタルの形状と、3次元空間に配置された3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、3次元フラクタルがレンダリングされた画像を生成することと、3次元フラクタルの形状及びレンダリングパラメータを識別するラベル情報を生成することと、を実行させる。
【0016】
本発明の他の態様に係るデータ生成装置は、3次元フラクタルの形状と、3次元空間に配置された3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、3次元フラクタルがレンダリングされた画像を生成する画像生成部と、3次元フラクタルの形状及びレンダリングパラメータを識別するラベル情報を生成するラベル情報生成部と、ラベル情報と画像との組をデータとして記録するデータ記録部と、を備える。
【0017】
本発明の他の態様に係る学習済みモデルは、第1の3次元フラクタルがレンダリングされた第1の画像を入力とし、第1の3次元フラクタルの形状及び第1の3次元フラクタルのレンダリングパラメータを識別する第1のラベル情報を出力とする教師データを用いて学習され、第2の3次元フラクタルがレンダリングされた第2の画像の入力に対し、第2の3次元フラクタルの形状及び第2の3次元フラクタルのレンダリングパラメータを識別する第2のラベル情報を出力するよう、コンピュータを機能させる。
【発明の効果】
【0018】
本発明によれば、画像分類のための転移学習に適した学習済みモデルの精度を向上させることができる。
【図面の簡単な説明】
【0019】
図1】本実施形態に係るデータ生成装置の構成を示すブロック図である。
図2】本実施形態に係るデータ生成装置のハードウェア構成を示すブロック図である。
図3】本実施形態に係るデータ生成処理のフローチャートである。
図4】本実施形態に係るパラメータリストの一例である。
図5A】本実施形態に係る複数の画像の一例である。
図5B】本実施形態に係る複数の画像の一例である。
図5C】本実施形態に係る複数の画像の一例である。
図6A】本実施形態に係る複数の画像の他の一例である。
図6B】本実施形態に係る複数の画像の他の一例である。
図6C】本実施形態に係る複数の画像の他の一例である。
図7A】本実施形態に係る複数の画像の他の一例である。
図7B】本実施形態に係る複数の画像の他の一例である。
図7C】本実施形態に係る複数の画像の他の一例である。
図8A】本実施形態に係る複数の画像の他の一例である。
図8B】本実施形態に係る複数の画像の他の一例である。
図8C】本実施形態に係る複数の画像の他の一例である。
図9】本実施形態に係る生成されたデータの一例である。
図10】本実施形態に係るベースモデル生成処理のフローチャートである。
【発明を実施するための形態】
【0020】
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0021】
図1には、本実施形態に係るデータ生成装置101のブロック図が示される。データ生成装置101は、表示部1011、記憶部1012、設定取得部1013、形状生成部1014、画像生成部1015、ラベル情報生成部1016、及びデータ記録部1017を有する。データ生成装置101の各部は後述のハードウェア構成を有するコンピュータ等の情報処理装置において、記憶装置に記憶されたプログラムがプロセッサによって実行されることにより実現することができる。
【0022】
表示部1011は、データ生成装置101のディスプレイである。記憶部1012は、データ生成装置101での処理に用いられる各種の情報を記憶する。また、記憶部1012には、データ生成装置101によって生成されたデータが記憶される。
【0023】
設定取得部1013は、3次元フラクタルの形状を設定するための物体パラメータ及び3次元フラクタルのレンダリングの条件を設定するためのレンダリングパラメータを取得する。設定取得部1013は、例えば、データ生成装置101によって多数生成され、記憶部1012に記憶されている物体パラメータ及びレンダリングパラメータを取得する。
【0024】
物体パラメータは、3次元空間に配置された3次元フラクタルの位置及び姿勢、3次元フラクタルの種類、フラクタルの計算における反復回数、及びフラクタルのパラメータを含む。レンダリングパラメータは、3次元空間に配置された3次元フラクタルにおける仮想的な光の反射を設定するパラメータである。
【0025】
形状生成部1014は、物体パラメータに基づいて、3次元フラクタルの形状を生成する。形状生成部1014は、例えば、マンデルブロ集合に基づいて生成される3次元フラクタルであるマンデルバルブ(Mandelbulb)を生成する。
【0026】
形状生成部1014は、例えば、マンデルバルブの生成に用いられるパラメータを物体パラメータとして取得する。また、形状生成部1014は、物体パラメータに基づいて生成された3次元空間の点を形状として生成する。
【0027】
なお、本実施形態では、データ生成装置101が3次元フラクタルの形状を生成することとして説明するが、形状は必ずしもデータ生成装置101によって生成される必要はない。例えば、データ生成装置101とは異なる情報処理装置が物体パラメータに基づいて3次元フラクタルの形状を生成し、データ生成装置101は予め生成された形状を取得するようにしてもよい。
【0028】
画像生成部1015は、形状とレンダリングパラメータとに基づいて、3次元フラクタルを3次元空間においてレンダリングし、レンダリングされた3次元フラクタルの画像を生成する。
【0029】
レンダリングパラメータは、例えば、3次元フラクタルの色を設定するためのモデル色情報、3次元フラクタルの表面におけるテクスチャを設定するための物体テクスチャ情報、3次元空間における3次元フラクタルに対する視点(カメラ位置)を設定するための視点情報、及び3次元空間に配置される光源を設定するための光源情報の少なくとも1つを含む情報である。
【0030】
ラベル情報生成部1016は、3次元フラクタルの形状及びレンダリングパラメータを識別するラベル情報を生成する。ラベル情報とは、例えば、物体パラメータとレンダリングパラメータとの組であり、個々の画像を識別可能とする情報である。あるいは、ラベル情報は、例えば、形状とレンダリングパラメータとの組であってもよい。なお、ラベル情報は、物体パラメータとレンダリングパラメータとの組に対して、1対1対応で設けられなくともよい。例えば、異なる視点でレンダリングされた共通の3次元フラクタルに対して同じラベル情報が付与されるようにしてもよい。あるいは、例えば、異なるテクスチャに基づいてレンダリングされた共通の3次元フラクタルに対して同じラベル情報が付与されるようにしてもよい。
【0031】
データ記録部1017は、ラベル情報生成部1016が生成したラベル情報を画像生成部1015が生成した画像に対応付けて、記憶部1012に記録する。
【0032】
図2を参照してデータ生成装置101のハードウェア構成の一例について説明する。データ生成装置101は、CPU(Central Processing Unit)、GPU(Graphical Processing Unit)等のプロセッサ201、メモリ、HDD(Hard Disk Drive)及び/又はSSD(Solid State Drive)等の記憶装置202、有線又は無線通信を行う通信IF(Interface)203、入力操作を受け付ける入力デバイス204、及び情報の出力を行う出力デバイス205を有する。プロセッサ201,記憶装置202、通信IF203、入力デバイス204、及び出力デバイス205はデータ生成装置101においてデータのやり取りが可能なように接続されている。入力デバイス204は、例えば、キーボード、タッチパネル、又はマウス等である。出力デバイス205は、例えば、ディスプレイである。
【0033】
表示部1011は、データ生成装置101が備える出力デバイス205を用いて実現することができる。記憶部1012は、データ生成装置101が備える記憶装置202を用いて実現することができる。設定取得部1013、形状生成部1014、画像生成部1015、ラベル情報生成部1016、及びデータ記録部1017はデータ生成装置101のプロセッサ201が、記憶装置202に記憶されたプログラムを実行することにより実現することができる。また、当該プログラムは、記憶媒体に格納することができる。当該プログラムを格納した記憶媒体は、コンピュータ読み取り可能な非一時的な記憶媒体(Non-transitory computer readable medium)であってもよい。非一時的な記憶媒体は特に限定されないが、例えば、HDD、SSD、USBメモリ等の記憶媒体であってもよい。
【0034】
図3から図9を参照して、データ生成装置101における処理について説明する。図3にはデータ生成装置101における処理のフローチャートが示される。
【0035】
ステップS301において、設定取得部1013は、データ生成装置101を操作するユーザから物体パラメータを取得する。物体パラメータは、複数の物体パラメータが一括して取得されてもよい。
【0036】
ステップS302において、設定取得部1013は、ユーザからレンダリングパラメータを取得する。レンダリングパラメータは、複数のレンダリングパラメータが一括して取得されてもよい。
【0037】
ステップS303において、設定取得部1013は、パラメータリストを生成し、記憶部1012に記憶する。図4には、パラメータリストの一例が示される。
【0038】
パラメータリストは、「物体パラメータ」、「レンダリングパラメータ」の項目を有する。そして、「レンダリングパラメータ」は、例えば、「物体テクスチャ」、「背景テクスチャ」、「視点」、「光源」、「描画設定」の項目を有する。
【0039】
「物体テクスチャ」の項目には、例えば、3次元フラクタルの材質に応じた、3次元フラクタルのテクスチャ(質感)を示す情報が設定される。また、「物体テクスチャ」の項目に記憶される情報は、3次元フラクタルの色(例えば表面の色)を示す情報を含んでいてもよい。「物体テクスチャ」に設定された情報に応じて、3次元フラクタルにおける光の反射状態等が変化する。
【0040】
「背景テクスチャ」の項目には、例えば、3次元空間における3次元フラクタル以外の部分である背景部分の材質に応じた、背景部分の質感を示す情報が設定される。また、「背景テクスチャ」の項目に記憶される情報は、背景部分の色を示す情報を含んでいてもよい。「背景テクスチャ」に設定された情報に応じて、環境光や背景色等が変化する。
【0041】
「視点」の項目には、3次元空間に配置された3次元フラクタルを画像化する場合に、3次元空間に配置された3次元フラクタルに対する視点(カメラ位置)を設定するために、視点情報が設定される。視点情報は、例えば、3次元空間に配置されるカメラの画角、カメラの位置、及びカメラの姿勢等を含む。視点を設定可能とすることで、同じ3次元フラクタルに基づく画像であっても、データの特徴量を異ならせることが可能となる。
【0042】
「光源」の項目には、3次元空間に配置される光源を設定するために、光源情報が設定される。光源情報は例えば、3次元空間における光源の位置、光源の種類、光源の強さなどを示す情報である。光源を設定可能とすることで、同じ3次元フラクタルに基づく画像であっても、データの特徴量を異ならせることが可能となる。
【0043】
「描画設定」の項目には、生成される画像のサイズや、画像の精度を示す情報が含まれる。ここで、画像の精度とは、細部まで無限に描画が可能である3次元フラクタルにおいて、どの程度の細かさまで3次元フラクタルを描画するかを設定するための情報である。
【0044】
パラメータリストでは、各パラメータは固定値、ある範囲内の離散値、ある範囲内の連続値として設定される。例えば、画像のサイズは固定値で設定される。また、例えば、「物体パラメータ」におけるフラクタルの種類、フラクタルのパラメータは、ある範囲内の離散値(あるいは連続値)の一つとして設定される。また、例えば、カメラの位置や光源の位置は、ある範囲内の連続値の一つとして設定される。設定取得部1013は、パラメータリストを生成するとき、所定の範囲内の離散値又は連続値をランダムに設定するためのシードに基づいて、ランダムな値を設定してもよい。
【0045】
図4の例では、物体パラメータ「XXX1」に対して、複数のレンダリングパラメータが設定される。また、物体パラメータ「XXX2」に対しても複数のレンダリングパラメータが設定される。このようにデータ生成装置101では、異なる物体パラメータに応じて異なる形状及び形状を有する3次元フラクタルを、異なるレンダリングパラメータに基づいてレンダリングすることで、数式に基づく大規模なデータセットの生成が可能となる。
【0046】
なお、データ生成装置101が形状を生成せず、他の情報処理装置から形状を取得する場合、物体パラメータに代えて、取得された形状をパラメータリストに設定してもよい。
【0047】
ステップS304において、形状生成部1014は、パラメータリストを参照し、ある物体パラメータに基づいて、3次元フラクタルの形状を生成する。なお、データ生成装置101が形状を生成せず、他の情報処理装置から形状を取得する場合、ステップS304の処理はスキップされる。
【0048】
ステップS305において、画像生成部1015は、レンダリングパラメータに基づいて、3次元フラクタルをレンダリングし、3次元フラクタルを含む画像を生成する。
【0049】
図5A図5B図5Cには、ある物体パラメータに基づく形状と、それぞれ異なるレンダリングパラメータとに基づいて生成された画像I11,I12,I13がそれぞれ示される。画像I11,I12,I13は、共通の3次元フラクタルF1が異なる光源位置にある光源から照射された状況がレンダリングされて生成された画像である。例えば、矢印A1,A2,A3で示される箇所は、異なる光の反射の仕方をしていることがわかる。このように、データ生成装置101は、共通の3次元フラクタルから、異なる特徴を有する画像を生成可能である。
【0050】
図6A図6B図6Cのそれぞれには、図5A図5B図5Cの場合とは異なる物体パラメータに基づく形状と、それぞれ異なるレンダリングパラメータとに基づいて生成された画像21,22,23がそれぞれ示される。画像I21,I22,I23は、共通の3次元フラクタルF2が異なる光源位置にある光源から照射された状況がレンダリングされて生成された画像である。図7A図7B図7Cにも、ある物体パラメータに基づく形状と、それぞれ異なるレンダリングパラメータとに基づいて生成された画像I31,I32,I33がそれぞれ示される。画像I31,I32,I33は、共通の3次元フラクタルF3が異なる光源位置にある光源から照射された状況がレンダリングされて生成された画像である。
【0051】
図8A図8B図8Cには、図5の場合と共通の物体パラメータに基づく形状と、それぞれ異なるレンダリングパラメータとに基づいて生成された画像I41,I42,I43がそれぞれ示される。画像I41,I42,I43は、図5に示した3次元フラクタルF1が異なる光源位置にある光源から照射された状況がレンダリングされ、かつ3次元フラクタルF1の一部がズームされて生成された画像である。図8A図8B図8Cにおいても、各図の矢印A4,A5,A6で示される箇所は、異なる照らされ方をしていることがわかる。
【0052】
周期的な構造を有する特徴のある3次元フラクタルを用いることで、3次元フラクタルの一部を拡大した場合であっても、細部の構造の差異に基づいて生じる光の反射の状態の差異が識別し得る画像が生成される。これにより、データ生成装置101は、共通の3次元フラクタルから、異なる特徴を有する画像を生成可能である。よって、データ生成装置101は、より小さな差異を特徴量として抽出可能な画像を生成可能となり、データ生成装置101によって生成された画像を用いて学習された学習モデルの精度がより向上する。
【0053】
ステップS306において、ラベル情報生成部1016は、3次元フラクタルの形状及びレンダリングパラメータを識別するラベル情報を生成する。ラベル情報生成部1016は、例えば、画像の生成に用いられた物体パラメータとレンダリングパラメータとに基づいてラベル情報を生成する。
【0054】
ステップS307において、データ記録部1017は、ラベル情報を画像に対応付けて記憶部1012に記録する。図9には、データ記録部1017が記録したデータセットの一例が示される。
【0055】
データセットは「データID」、「画像」、及び「ラベル情報」の項目を有する。「データID」の項目には各データを識別する情報が記憶される。「画像」の項目には、画像生成部1015が生成した各画像が記憶される。「ラベル情報」の項目には、ラベル情報生成部1016が生成したラベル情報が記憶される。例えば、「データID」が「ID101」のデータは、図5の画像11と画像11の生成に用いた物体パラメータ「XXX」及びレンダリングパラメータ「YYY1」に基づくラベル情報とが対応付けられたデータである。
【0056】
ステップS308において、データ記録部1017は、パラメータリストの全てのパラメータに基づいてラベル情報と画像の組を記録し終えたか否かを判断する。ステップS308で否定判断されると、異なるレンダリングパラメータ又は異なる物体パラメータに基づいて、ステップS304からS307までの処理が繰り返され、画像が記録される。ステップS308において肯定判断されると、データ生成装置101による処理は終了する。
【0057】
図10を参照して、データ生成装置101によって生成されたデータセットを用いた学習済みモデルの生成について説明する。学習済みモデルの生成は任意の情報処理装置を用いて行うことができる。
【0058】
ステップS1001において、情報処理装置は、データ生成装置101によって生成されたデータセットを参照する。ステップS1002において、情報処理装置は、データセットにおける各画像の入力に対して、正解のラベル情報を出力するように機械学習を行う。ステップS1003において、情報処理装置は、学習済みベースモデルを例えば情報処理装置の記憶部に記憶する。これにより、データ生成装置101が生成したデータセットを用いることでより多くの特徴量に基づいて学習され、転移学習に適したベースモデルが生成される。
【0059】
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
【符号の説明】
【0060】
101…データ生成装置、1011…表示部、1012…記憶部、1013…設定取得部、1014…形状生成部、1015…画像生成部、1016…ラベル情報生成部、1017…データ記録部
【要約】
画像分類のための転移学習に適した学習済みモデルの精度を向上させる。コンピュータが、3次元フラクタルの形状と、3次元空間に配置された3次元フラクタルにおける仮想的な光の反射を設定するレンダリングパラメータとに基づいて、3次元フラクタルがレンダリングされた画像を生成することと、3次元フラクタルの形状及びレンダリングパラメータを識別するラベル情報を生成することと、ラベル情報と画像との組をデータとして記録することと、を含む、データ生成方法。
図1
図2
図3
図4
図5A
図5B
図5C
図6A
図6B
図6C
図7A
図7B
図7C
図8A
図8B
図8C
図9
図10