(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-21
(45)【発行日】2023-05-01
(54)【発明の名称】学習済みモデル生成装置、プログラム及び学習済みモデル生成システム
(51)【国際特許分類】
G06T 7/00 20170101AFI20230424BHJP
G06N 20/00 20190101ALI20230424BHJP
【FI】
G06T7/00 350B
G06N20/00 130
(21)【出願番号】P 2019065335
(22)【出願日】2019-03-29
【審査請求日】2022-02-25
(73)【特許権者】
【識別番号】507291969
【氏名又は名称】三井情報株式会社
(74)【代理人】
【識別番号】100112335
【氏名又は名称】藤本 英介
(74)【代理人】
【識別番号】100101144
【氏名又は名称】神田 正義
(74)【代理人】
【識別番号】100101694
【氏名又は名称】宮尾 明茂
(74)【代理人】
【識別番号】100124774
【氏名又は名称】馬場 信幸
(74)【代理人】
【識別番号】100209842
【氏名又は名称】中村 俊一
(72)【発明者】
【氏名】青木 賢太郎
(72)【発明者】
【氏名】澤勢 一史
(72)【発明者】
【氏名】山田 薫
【審査官】新井 則和
(56)【参考文献】
【文献】特開2019-023858(JP,A)
【文献】特開2018-163554(JP,A)
【文献】国際公開第2011/086889(WO,A1)
【文献】国際公開第2016/157499(WO,A1)
【文献】国際公開第2019/021456(WO,A1)
【文献】特開2018-124939(JP,A)
【文献】特開2018-169690(JP,A)
【文献】特開2015-207105(JP,A)
【文献】特開2014-199559(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
3Dデータに基づいて疑似画像データを生成する画像データ生成部と、
3Dデータ
に含まれる3Dモデルデータと、パラメータとから疑似画像データの位置の座標を示すアノテーションデータを生成するアノテーションデータ生成部と、
前記疑似画像データと、前記アノテーションデータとを含む学習用データを生成する学習用データ生成部と、
前記学習用データを用いて入力用データから出力用データを推論するための学習済みモデルを生成する学習済みモデル生成部と、
を備えたことを特徴とする学習済みモデル生成装置。
【請求項2】
前記
疑似画像データの位置を示す座標は、2次元の座標又は3次元の座標であることを特徴とする請求項1に記載の学習済みモデル生成装置。
【請求項3】
前記疑似画像データを生成するとき及び前記アノテーションデータを生成するときに、前記パラメータを決定するパラメータ決定部を更に備えることを特徴とする請求項2に記載の学習済みモデル生成装置。
【請求項4】
実画像データを取得する取得部を更に備え、
前記アノテーションデータ生成部は、前記実画像データに基づいてアノテーションデータを生成し、
前記学習用データ生成部は、更に実画像データと、前記アノテーションデータとを含む学習用データを生成する、
ことを特徴とする請求項1から3の何れか一項に記載の学習済みモデル生成装置。
【請求項5】
コンピュータに、
3Dデータに基づいて疑似画像データを生成する画像データ生成機能と、
3Dデータ
に含まれる3Dモデルデータと、パラメータとから疑似画像データの位置の座標を示すアノテーションデータを生成するアノテーションデータ生成機能と、
前記疑似画像データと、前記アノテーションデータとを含む学習用データを生成する学習用データ生成機能と、
前記学習用データを用いて入力用データから出力用データを推論するための学習済みモデルを生成する学習済みモデル生成機能と、
を実現させるためのプログラム。
【請求項6】
3Dデータに基づいて疑似画像データを生成する画像データ生成手段と、
3Dデータ
に含まれる3Dモデルデータと、パラメータとから疑似画像データの位置の座標を示すアノテーションデータを生成するアノテーションデータ生成手段と、
前記疑似画像データと、前記アノテーションデータとを含む学習用データを生成する学習用データ生成手段と、
前記学習用データを用いて入力用データから出力用データを推論するための学習済みモデルを生成する学習済みモデル生成手段と、
を備えたことを特徴とする学習済みモデル生成システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習済みモデル生成装置等に関する。
【背景技術】
【0002】
従来から、機械学習において、学習済みモデルを生成するためには、学習対象となるデータと、学習対象となるデータに対する正解データ(アノテーションデータ)とを含む学習用データ(教師データ、訓練データ)を学習モデルに投入する必要があった。
【0003】
例えば、学習用画像データに正解データを付加することで学習済みモデルを生成する発明(例えば、特許文献1参照)や、サンプル画像と、正解データとを与えることにより学習済みモデルを生成したりする発明(例えば、特許文献2参照)が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-5640号公報
【文献】特開2010-211468号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来は、学習済みモデルを生成するためには、学習用データを利用者が準備する必要があった。学習済みモデルの精度を上げるためには、学習対象となるデータを利用者は大量に準備する必要があった。
【0006】
また、学習対象のデータを準備したとしても、学習対象のデータにアノテーションを利用者が与える作業が必要であった。学習対象のデータが膨大になれば、アノテーションを与える作業量も多くなってしまうという問題点があった。
【0007】
本開示は、3Dモデルに基づいた学習対象のデータを用いることにより、適切な学習済みモデルを生成可能な学習済みモデル生成装置等を提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示の一態様に係る学習済みモデル生成装置は、3Dデータに基づいて疑似画像データを生成する画像データ生成部と、3Dデータに基づいてアノテーションデータを生成するアノテーションデータ生成部と、前記疑似画像データと、前記アノテーションデータとを含む学習用データを生成する学習用データ生成部と、前記学習用データを用いて入力用データから出力用データを推論するための学習済みモデルを生成する学習済みモデル生成部と、を備えている。
【0009】
本開示の一態様に係るプログラムは、コンピュータに、3Dデータに基づいて疑似画像データを生成する画像データ生成機能と、3Dデータに基づいてアノテーションデータを生成するアノテーションデータ生成機能と、前記疑似画像データと、前記アノテーションデータとを含む学習用データを生成する学習用データ生成機能と、前記学習用データを用いて入力用データから出力用データを推論するための学習済みモデルを生成する学習済みモデル生成機能と、を実現させる。
【0010】
本開示の一態様に係る学習済みモデル生成システムは、3Dデータに基づいて疑似画像データを生成する画像データ生成手段と、3Dデータに基づいてアノテーションデータを生成するアノテーションデータ生成手段と、前記疑似画像データと、前記アノテーションデータとを含む学習用データを生成する学習用データ生成手段と、前記学習用データを用いて入力用データから出力用データを推論するための学習済みモデルを生成する学習済みモデル生成手段と、を備えている。
【発明の効果】
【0011】
本開示によれば、3Dモデルに基づいた学習対象となるデータを用いることにより、多くの人手をかけず、短時間で、適切な学習済みモデルを生成することができる。
【図面の簡単な説明】
【0012】
【
図1】本実施形態におけるシステム全体を説明するための図である。
【
図2】本実施形態における3Dデータ、疑似画像データ、アノテーションデータとの概要を説明するための図である。
【
図3】本実施形態における学習済みモデル生成装置の機能構成を説明するための図である。
【
図4】本実施形態における学習済みモデルを生成する処理を説明するための動作フロー図である。
【
図5】本実施形態における動作例を説明するための図である。
【
図6】本実施形態における対象物推論装置の概要を説明するための図である。
【
図7】本実施形態の変形例を説明するための図である。
【発明を実施するための形態】
【0013】
以下、図面を参照して本発明を実施するための一実施形態について説明する。なお、以下の実施形態は、本発明を説明するための一例であり、特許請求の範囲に記載した発明の技術的範囲が、以下の記載に限定されるものではない。
【0014】
[1.システム構成]
図1は、学習済みモデル生成装置を含むシステムAを説明するための図である。システムAの概要を、以下説明する。システムAは、学習済みモデル生成装置1と、対象物推論装置3とを含んでいる。
【0015】
まず、学習済みモデル生成装置1の動作の概要について説明する。利用者やシステムは、学習用データの構造を決定する(10)。学習済みモデル(20)として、どのようなモデルを生成するかが利用者又はシステムにより決定される。
【0016】
素材データ(12)は、学習対象となる画像データ(疑似画像データ)を生成するための素材となるデータである。本実施形態では、素材として3Dデータを使用する。3Dデータは、例えば、少なくとも3Dモデルデータを含んでおり、パラメータ、素材の画像データを1又は複数含まれる。
【0017】
3Dモデルデータは、対象物の3Dモデルを生成するためのデータである。例えば、ある座標空間上の座標として、対象物の頂点や、特徴点の座標により構成されている。また、パラメータは、3Dモデルから対象物を生成するときに利用される。例えば、パラメータとしては、対象物の角度、傾き、倍率、色、材質、基準となる座標空間のデータ等が利用可能である。素材の画像データは、対象物のテクスチャ画像(例えば、木目調の画像や、金属の材質を示す画像、結晶の種類に応じた画像等)や、背景画像(例えば、対象物が水中にある場合や、景色の中にある場合等、それらの背景となる画像)等の種々の画像が利用可能である。
【0018】
すなわち、3Dデータは、3Dモデルデータを少なくとも含み、更にパラメータを含むことが可能である。また、上述したように素材の画像データは、3Dデータに含まれてもよいし、3Dデータとは別に用意されてもよい。また、3Dデータに必要な情報について、これらのデータに限定されるものではなく、当業者が容易に想到できるものが更に含まれてもよい。
【0019】
学習済みモデル生成装置1は、学習用データ生成処理(14)を実行することで、素材データ(12)から、利用者又はシステムにより決定された学習データの構造に対応する学習用データ(16)を生成する。学習用データには、画像データ(疑似画像データ)と、正解データであるアノテーションデータとが含まれている。
【0020】
本実施形態における画像データ(疑似画像データ)は、静止画像データだけでなく、アニメーションデータや動画像データをも含む概念である。
【0021】
また、本実施形態におけるアノテーションデータとは、画像データ(実画像データや疑似画像データ)において、その画像データに含まれる対象物の位置を示す座標や、対象物の種類(分類のための番号および名前など)である。
【0022】
例えば、3Dデータに基づいて生成された対象物の相対的な座標が、学習で必要な空間上の座標に変換され、アノテーションデータとなる。
【0023】
また、学習済みモデル生成装置1は、学習用データ生成処理として、画像データを生成する画像データ生成処理と、アノテーションデータを生成するアノテーションデータ生成処理とを実行する。
【0024】
学習済みモデル生成装置1は、画像データ生成処理を実行し、例えば素材データ(12)に含まれている3Dモデルデータや、画像データを利用して疑似画像データを生成する。また、学習済みモデル生成装置1は、アノテーションデータ生成処理を実行し、3Dモデルデータを利用して、疑似画像データに対するアノテーションデータを生成する。
【0025】
図2は、学習用データ生成処理において生成される疑似画像データと、アノテーションデータとを説明するための図である。例として、本図を参照して、結晶の画像を含む疑似画像データを生成する場合について説明する。
【0026】
図2(a)は、結晶1つ分の疑似画像データを模式的に示した図である。学習済みモデル生成装置1は、画像データ生成処理を実行し、3Dデータ(3Dモデルデータ)に基づいて疑似画像データを生成する。また、学習済みモデル生成装置1は、画像データ生成処理において、疑似画像データに対して、更に素材データ(12)に含まれている画像データに基づくテクスチャデータを付加してもよい。また、学習済みモデル生成装置1は、画像データ生成処理において、疑似画像データを生成するときに、パラメータによって大きさ、回転、方向等を随時決定してもよい。
【0027】
学習済みモデル生成装置1は、アノテーション生成処理を実行し、疑似画像データに対するアノテーションデータを生成する。アノテーションデータは、3Dモデルデータ、パラメータから生成される結晶を対象物とした場合、疑似画像データに含まれる結晶の画像の位置とすることができる。例えば、
図2(a)の結晶は、疑似画像データにおいて(x1,y1)-(x2,y2)の位置に存在することを算出することが可能である。
【0028】
すなわち、3Dモデルデータは、
図2(a)で示される対象物の頂点座標(直方体の場合は少なくとも3点の3次元の座標、その他の立体形状であれば各頂点の3次元の座標)を示している。これを、疑似画像データが含まれる2次元の座標や、3次元の座標として座標変換されたものがアノテーションデータとなる。
【0029】
これにより、アノテーション生成処理において、例えば
図2(b)の疑似画像データに含まれている結晶の位置を示すアノテーションデータを随時生成することが可能となる。例えば、学習済みモデル生成装置1は、アノテーション生成処理は、疑似画像データP10、P12、P14等のアノテーションデータを、3Dモデルデータ、パラメータから生成する。
【0030】
学習用のAIプログラム(18)は、学習用データ(16)を利用することで学習済みモデル(20)を生成する。ここで、学習用データから、学習済みモデルを生成する方法としては、公知である何れかの機械学習の手法を利用することとする。例えば、機械学習の手法としては、ディープラーニングを活用したクラシフィケーション、セグメンテーション、オブジェクトデテクション、キーポイントデテクションなどといった手法を用いることができる。
【0031】
学習済みモデル生成装置1で生成された学習済みモデル(20)は、何れかの装置で利用することができる。なお、本実施形態の学習済みモデルは、人工知能ソフトウエアの一部であるプログラムモジュールとして利用されてもよい。
【0032】
対象物推論装置3は、入力データから、学習済みモデルを利用することで、入力データを推論した出力データを出力する装置である。例えば、対象物推論装置3では、学習済みモデル生成装置1で生成された学習済みモデル(20)を利用している。
【0033】
具体的には、AIプログラム(30)は、入力された入力データ(画像データや、メタデータ等)を認識したり、推論したりする場合に学習済みモデル(20)を利用する。これにより、AIプログラム(30)は、認識した結果データ(34)を出力する(出力データとして出力する)ことができる。
【0034】
本実施形態によれば、学習用データ(16)を効率的に生成することにより、より適切な学習済みモデル(20)を生成することができる。以下、本実施形態における処理を説明する。
【0035】
[2.機能構成]
学習済みモデル生成装置1の機能構成について
図3を参照して説明する。
【0036】
制御部100は、学習済みモデル生成装置1の全体を制御する。制御部100は、記憶部120に記憶されている各種プログラムを読み出して実行することにより各種機能を実現しており、1又は複数の演算装置(例えば、CPU(Central Processing Unit))により構成されている。
【0037】
また、制御部100は、記憶部120に記憶されているプログラムを実行することにより、以下の機能部として動作する。
【0038】
また、制御部100は、学習用データを生成する学習用データ生成部110と、学習済みモデルを生成する学習済みモデル生成部102の機能を実現する。
【0039】
学習用データ生成部110は、疑似画像データと、アノテーションデータとに基づいた学習用データを生成する。
【0040】
画像データ生成部112は、画像データ生成処理を実行する。画像データ生成部112は、学習対象となる疑似画像データを3Dモデルデータ記憶領域122に記憶されている3Dモデルデータに基づき、必要に応じてパラメータを参照して生成する。
【0041】
また、画像データ生成部112は、疑似画像データを生成するとき、更にパラメータ記憶領域124に記憶されているパラメータを利用してもよい。
【0042】
また、画像データ生成部112は、疑似画像データを生成するとき、更に画像データ記憶領域126に記憶されているテクスチャ画像データや、背景画像データを利用してもよい。
【0043】
具体的には、画像データ生成部112は、質感や、材質等といった属性を疑似画像データ与えるときに、テクスチャ画像データを利用する。
【0044】
また、画像データ生成部112は、3Dモデルが人間等の場合に、人間の後ろに写っている山や湖といった実画像データを背景画像データとして利用し、疑似画像データを生成してもよい。
【0045】
アノテーションデータ生成部114は、アノテーションデータ生成処理を実行する。アノテーションデータ生成部114は、疑似画像データの3Dモデルデータや、パラメータに基づいてアノテーションデータを生成する。
【0046】
アノテーションデータ生成部114は、3Dモデルデータに基づいて、疑似画像データに含まれる対象物の位置を求めることができ、当該位置がアノテーションデータとなる。また、アノテーションデータ生成部114は、3Dモデルデータからパラメータを参照して生成された疑似画像データに基づき、アノテーションデータを生成することもできる。
【0047】
パラメータ決定部116は、画像データ生成部112が疑似画像データを生成するときに利用するパラメータを決定する。例えば、3Dモデルデータに基づいて、回転、拡大、縮小、反転といった画像処理を施した疑似画像データが生成されるようにパラメータを決定する。また、パラメータ決定部116は、同じ3Dモデルデータであっても、複数回実行することにより、異なるパラメータを決定する。これにより、画像データ生成部112は、異なる疑似画像データを生成することができる。また、アノテーションデータ生成部114も同様に、異なるアノテーションデータを生成することができる。
【0048】
パラメータ決定部116は、利用者がパラメータを任意に決定してもよいし、所定の処理に基づいて決定されてもよい。例えば、一定値毎にパラメータを変えたり、乱数を利用したりしてもよい。
【0049】
学習済みモデル生成部102は、学習用データから学習済みモデルを生成する。学習済みモデル生成部102は、生成した学習モデルを学習済みモデル記憶領域130に記憶する。
【0050】
ここで、本実施形態における学習済みモデルを生成する処理とは、学習用データに基づいて新たに学習済みモデルを生成する処理だけでなく、学習済みモデル記憶領域130に記憶されている学習済みモデルを更新する処理を含むものである。
【0051】
記憶部120は、学習済みモデル生成装置1の動作に必要な各種プログラムや、各種データが記憶されている機能部である。記憶部120は、例えば、半導体メモリであるSSD(Solid State Drive)や、HDD(Hard Disk Drive)等により構成されている。
【0052】
3Dモデルデータ記憶領域122は、対象物を含む疑似画像データを生成するための3Dモデルのデータ(3Dモデルデータ)を記憶している。また、パラメータ記憶領域124は、3Dモデルデータに対応するパラメータを記憶している。パラメータ記憶領域124に記憶されるパラメータは、パラメータ決定部116において利用され、新たに決定されたパラメータを記憶する。また、パラメータ記憶領域124が記憶するパラメータは、3Dモデルデータに対応して予めパラメータを記憶してもよいし、3Dモデルデータを読み込んだときにパラメータを記憶してもよい。
【0053】
画像データ記憶領域126は、画像データを記憶する。例えば、画像データ記憶領域126は、疑似画像データ、テクスチャ画像データ、背景画像データといった種々の画像データを記憶することができる。
【0054】
アノテーションデータ記憶領域128は、疑似画像データに対応するアノテーションデータが記憶される。具体的には、アノテーションデータ生成部114から出力されたアノテーションデータが記憶される。
【0055】
この画像データ記憶領域126に記憶されている疑似画像データと、アノテーションデータ記憶領域128に記憶されているアノテーションデータと含んだ情報が、学習用データとなる。
【0056】
学習済みモデル記憶領域130は、学習済みモデル生成部102から出力された学習済みモデルを記憶する。学習済みモデル記憶領域130は、学習済みモデルが1又は複数記憶されている。
【0057】
なお、上述した記憶部120に記憶されるデータ、情報は、学習済みモデル生成装置1に接続された外部の記憶装置、記憶媒体に記憶されてもよいし、通信部160を介して接続されるNAS(Network Attached Storage)や、クラウドサーバ上の記憶領域に記憶されてもよい。
【0058】
入力部140は、利用者からの操作指示の入力を受け付け、出力部150は利用者に書く指示を出力する。例えば、入力部140は、キーボードやマウスである。また、出力部150は、表示装置(例えば、液晶ディスプレイ等)である。
【0059】
また、入力部140、出力部150を一体としてタッチパネルとして構成してもよい。また、入力部140、出力部150は、通常インタフェースとして実装されていればよく、例えば、USB(Universal Serial Bus)に外部の装置を接続することで実現可能である。
【0060】
通信部160は、外部の装置や、サーバ等と通信を行う。例えば、ネットワークインタフェースにより、LAN(Local Area Network)に接続し、他の装置等と通信を行う。また、それ以外にも、無線LANや、LTE(Long Term Evolution)/5G通信により実現してもよい。
【0061】
また、通信部160は、他にもカメラ装置から画像データを受信したりするインタフェースであってもよい。この場合は、USBやHDMI(登録商標)(High-Definition Multimedia Interface)等のインタフェースで実現される。
【0062】
また、入力部140、出力部150、通信部160は、必要に応じて1又は複数実装すればよく、実装していなくてもよい。
【0063】
また、クラウド上に設けられた記憶領域に、記憶部120に記憶している各データ、プログラムを記憶することで、ネットワークを経由して、本実施形態の処理を実行する構成、システムとしてもよい。この場合、必要に応じて端末装置からデータ(例えば、3Dモデルデータ、画像データ、パラメータ等)を受信し、学習用データ生成部110、学習済みモデル生成部120がクラウド上で実行されてもよい。
【0064】
また、一部の機能はハードウェアで実現されてもよいし、ソフトウエアで実現されてもよい。学習済みモデル生成装置1は、上述した構成以外にも必要な機能を更に備えていてもよい。
【0065】
[3.処理の流れ]
本実施形態における制御部100(学習済みモデル生成部102)が実行する処理について、
図4を参照して説明する。
【0066】
画像データ生成部112は、3Dモデルデータ記憶領域122から、3Dモデルデータを入力する(ステップS102)。ここで、テクスチャ画像データや、背景画像データ等がある場合、画像データ生成部112は、当該画像データを画像データ記憶領域126から併せて入力する。
【0067】
つづいて、パラメータ決定部116は、パラメータを決定する(ステップS104)。パラメータ決定部116は、3Dモデルデータに対応したパラメータを決定するが、予め決められたパラメータを利用してもよい。なお、3Dモデルデータのみから疑似画像データを生成する場合、パラメータについて利用しなくてもよい。
【0068】
なお、画像データ生成部112は、パラメータの扱い(利用方法)については、上述した以外にも他の方法が考えられる。以下、画像データ生成部112におけるパラメータの利用方法について説明する。
【0069】
(1)記憶されているパラメータを利用する
画像データ生成部112は、ステップS102において、3Dモデルデータと併せてパラメータを入力する。この場合、パラメータ記憶領域124には、3Dモデルデータに対応するパラメータが記憶されている。パラメータ記憶領域124に記憶されているパラメータを、画像データ生成部112は、ステップS104において随時読み込んで利用する。
【0070】
(2)初期パラメータを利用する
画像データ生成部112は、ステップS102において、3Dモデルデータと併せてパラメータを入力する。この場合、パラメータ記憶領域124には、3Dモデルデータに対応するパラメータが記憶されている(初期状態)。また、パラメータ決定部116は、初期状態のパラメータに基づいて、新たなパラメータをステップS104で決定する。画像データ生成部112は、2回目以降は、パラメータ決定部116で決定したパラメータを利用する。なお、パラメータ決定部116は、途中で予め記憶されているパラメータを途中で利用してもよい。
【0071】
つづいて、画像データ生成部112は、3Dモデルデータと、決定されたパラメータに基づいて画像データ(疑似画像データ)を生成する(ステップS106)。このとき、テクスチャ画像データや背景画像データ等の素材の画像データがある場合は、画像データ生成部112は、当該素材の画像データも利用する。画像データ生成部112は、生成した疑似画像データを、画像データ記憶領域126に記憶する。なお、上述したようにパラメータを利用しない場合は、3Dモデルデータや、3Dモデルデータと素材の画像データとから疑似画像データを生成する。
【0072】
つづいて、アノテーションデータ生成部114は、アノテーションデータ生成処理を実行することにより、3Dデータに基づいてアノテーションデータを生成する(ステップS108)。アノテーションデータ生成部114は、生成したアノテーションデータをアノテーションデータ記憶領域128に記憶する。
【0073】
つづいて、制御部100(学習用データ生成部110)は、疑似画像データと、アノテーションデータとに基づき、学習用データを生成する(ステップS110)。
【0074】
学習済みモデル生成部102は、学習用データに基づいて学習済みモデルを生成する(ステップS112)。学習済みモデル生成部102は、学習済みモデルを学習済みモデル記憶領域130に記憶する。また、学習済みモデル生成部102は、既に学習済みモデル記憶領域130に学習済みモデルが存在する場合には、更新する処理を行ってもよい。
【0075】
ここで、更に異なるパラメータを利用して学習済みモデルを生成する場合、学習済みモデル生成部102は、ステップS104から処理を繰り返し実行する(ステップS114;Yes→ステップS104)。このとき、パラメータ決定部116は、パラメータをランダムに決定してもよいし、一定量ずつずらして決定してもよい。例えば、パラメータ決定部116は、パラメータの一つとして回転角度を90度ずつずらすようにパラメータを決定してもよい。
【0076】
ここで、学習済みモデル生成部102は、疑似画像データに基づく学習用データのみで学習済みモデルを生成(更新)しているが、実画像の画像データ(実画像データ)に基づいて学習済みモデルを更新してもよい。
【0077】
実画像データによる学習用データを生成する場合(ステップS116;Yes)、例えば、制御部100は、通信部160から実画像データを受信し、画像データ記憶領域126に記憶する。この画像データ記憶領域126が記憶している実画像データを処理に利用する。
【0078】
つづいて、アノテーションデータ生成部114は、実画像データに対応するアノテーションデータを作成する(ステップS120)。ここのアノテーションデータは、例えば利用者が実画像データを確認し、アノテーションデータを生成してもよい。また、別の画像認識機能を利用し、アノテーションデータを生成してもよい。
【0079】
そして、制御部100(学習用データ生成部110)は、ステップS118で入力された実画像データと、ステップS120で作成されたアノテーションデータとに基づき、学習用データを生成する(ステップS122)。
【0080】
学習済みモデル生成部102は、ステップS122で生成した学習用データを利用して学習済みモデル生成処理を実行する(ステップS130)。当該処理により、既にステップS112で生成された学習済みモデルが更新されることになる。
【0081】
このように、
図4の処理が実行されることにより、疑似画像データに基づく学習済みモデルが生成される。更に、実画像データに基づく学習済みデータが生成されることにより、より精度の高い学習済みモデルが生成されることとなる。
【0082】
図5は、学習用データの画像を示す図である。例えば、従来であれば
図5(a)の画像から、作業者が手動でアノテーションを付加する必要があった。
【0083】
しかし、本実施形態によれば、個別の疑似画像データのアノテーションは自動的に算出されている。したがって、
図5(b)に示すように、作業者が手動でアノテーションを付加することなく、自動的にアノテーションデータが生成されることとなる。
【0084】
なお、生成された学習済みモデルを利用した対象物推論処理を実行することができる。
図6は、対象物推論処理の一例を示す図である。対象物推論処理は、例えば対象物推論装置3のAIプログラム30に含まれる処理である。
【0085】
入力部1000は、入力データを入力する。入力データとしては、例えば画像データ(入力画像データ)を入力する。つづいて、推論部1100は、学習済みモデル生成部102で生成した学習済みモデル1200とAIプログラム30を利用して、入力画像データから、対象物が入力画像データのどの位置に含まれているかの推論を行う。つづいて、出力部1300は、推論の結果として、対象物が含まれている領域を示すデータや、対象物の種別を出力データとしてする。なお、推論部1100は、画像データに対する対象物によって、対応する学習済みモデル1200とAIプログラム30を使用する。
【0086】
例えば、対象物が人物であれば、推論部1100は画像データに写り込んだ人物について学習した学習済みモデルを用いて、入力部1000に入力された入力画像データについて推論を行う。また、対象物が結晶であれば、入力画像データに含まれている結晶の数、大きさについて推論を行うことができる。このようにして、本実施形態を適用した学習済みモデルを利用することにより、対象物を適切に決定することができる。
【0087】
[4.他の実施形態]
上述した実施形態とは別に、学習済みモデル生成装置、対象物推論装置等をサーバで実現してもよい。
図8は、サーバクライアントのモデルを利用したシステムBについて説明する図である。
【0088】
例えば、サーバ50は、1又は複数のサーバにより構成されている。サーバ50は、上述した学習済みモデル生成処理(例えば、
図4)を実行することができる。
【0089】
端末装置60は、ネットワークNWを介してサーバ装置50に接続する。例えば、学習済みモデル生成処理を、ASP(Application Service Provider)/SaaS(Software as a Service)等のように提供してもよい。例えば、端末装置60はWebブラウザや、専用アプリケーションを利用してサーバ装置50に接続し、学習済みモデル生成処理を実行する。
【0090】
このとき、サーバ装置50は、素材データ12を端末装置60から受信して学習済みモデル20を生成して端末装置60に返してもよい。また、サーバ装置50は、学習済みモデル生成処理で使用する学習用データ16を生成し、端末装置60に返してもよい。この場合、端末装置60は、受信した学習用データ16を利用して学習済みモデルを生成する。すなわち、学習済み生成モデル生成処理は、サーバ装置50と、端末装置60とで実行される。
【0091】
また、携帯端末装置70は、ネットワークNWを介してサーバ装置50に接続する。例えば、サーバ装置50において、対象物推論処理が実行されることで、携帯端末装置70は、カメラで撮影した画像に含まれる対象物の推論を行うことができる。
【0092】
このように、本明細書に記載されている処理、データについては、技術的に矛盾のない範囲で分散して記憶したり、分散して処理したりすることが可能である。すなわち、説明の都合上、学習済みモデル生成装置、対象物推論装置として説明しているが、必ずしも1つの装置で構成されることに限定されるものではない。
【0093】
また、学習用データ生成部110や、学習済みモデル生成部102が実行する処理を含む各処理は、アプリケーションで提供されてもよい。例えば、サーバに限られず、市販のコンピュータ(情報処理装置)や、携帯型端末装置(タブレット等)にインストールし、実行することで、学習済みモデル生成装置、対象物推論装置として機能することとなる。
【0094】
[5.変形例]
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も特許請求の範囲に含まれる。
【0095】
上述した実施形態において、疑似画像データとして結晶の画像データを一例として説明したが、他の画像データであってもよい。
【0096】
例えば、
図7は、3Dデータとして動物のデータを示している。この場合、制御部100(学習用データ生成部110)は、動物の3Dデータとして3Dモデルデータ及びパラメータから疑似画像データを生成する。
【0097】
また、制御部100は、動物の3Dデータとして3Dモデルデータ及びパラメータに対応する座標をそれぞれ算出する。そして、制御部100(アノテーションデータ生成部114)は、算出した座標が含まれるように、アノテーションデータを生成する。これにより、制御部100(学習用データ生成部110)は、疑似画像データ及びアノテーションデータから、学習用データを生成することができる。このように、疑似画像データとしては、その他にも、人、自動車、建物といった種々のデータを利用できる。
【0098】
また、上述した実施形態においては、疑似画像データを画像データ記憶領域126に記憶しているが、そのまま学習済みモデル生成部102が利用してもよい。すなわち、疑似画像データは、一時的に記憶部120に記憶されたり、処理の実行時に、その都度生成されたりしてもよい。
【0099】
また、上述した実施形態において、学習済みモデル生成装置1はサーバ装置等の単体の装置として説明しているが、必要に応じてネットワークに接続されたサーバ装置や、相互に接続された装置に機能を分散させてもよい。3Dモデルを入力し、学習済みモデルが出力される学習済みモデル生成システムとして、実現されればよい。
【0100】
また、実施形態において各装置で動作するプログラムは、上述した実施形態の機能を実現するように、CPU等の演算装置を制御するプログラム(コンピュータを機能させるプログラム)である。そして、これら装置で取り扱われる情報は、その処理時に一時的に一時記憶装置(例えば、RAM)に蓄積され、その後、ケーブルを介しての接続やネットワークを介しての接続などに関わらず、各種ROMやHDD、SSDの記憶装置に格納され、必要に応じてCPUによって読み出し、修正・書き込みが行なわれる。
【0101】
また、市場に流通させる場合には、可搬型の記録媒体にプログラムを格納して流通させたり、インターネット等のネットワークを介して接続されたサーバコンピュータに転送したりすることができる。この場合、サーバコンピュータの記憶装置も本発明に含まれるのは勿論である。
【符号の説明】
【0102】
100 制御部
102 学習済みモデル生成部
110 学習用データ生成部
112 画像データ生成部
114 アノテーションデータ生成部
116 パラメータ決定部
120 記憶部
122 3Dモデルデータ記憶領域
124 パラメータ記憶領域
126 画像データ記憶領域
128 アノテーションデータ記憶領域
130 学習済みモデル記憶領域