(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-11-25
(45)【発行日】2022-12-05
(54)【発明の名称】人工知能基盤検出モデルに対する学習データを生成するための方法、システムおよび記録媒体
(51)【国際特許分類】
G06T 7/00 20170101AFI20221128BHJP
G06T 19/00 20110101ALI20221128BHJP
G06T 17/00 20060101ALI20221128BHJP
【FI】
G06T7/00 350Z
G06T19/00 A
G06T17/00
(21)【出願番号】P 2021147451
(22)【出願日】2021-09-10
【審査請求日】2021-09-10
(31)【優先権主張番号】10-2021-0086129
(32)【優先日】2021-06-30
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】521400774
【氏名又は名称】エアリス カンパニー,リミテッド
(74)【代理人】
【識別番号】110000338
【氏名又は名称】特許業務法人HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】キム,ジョン ミ
【審査官】山田 辰美
(56)【参考文献】
【文献】特開2002-261625(JP,A)
【文献】特表2012-533331(JP,A)
【文献】米国特許出願公開第2004/026457(US,A1)
【文献】特開2019-12334(JP,A)
【文献】特開2021-12595(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
G06T 19/00
G06T 17/00
(57)【特許請求の範囲】
【請求項1】
人工知能基盤検出モデルに対する学習データを生成するための方法であって、
隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルをそれぞれ生成し、前記隠匿対象客体の3Dモデルと前記隠匿道具客体の3Dモデルが組み合わせられ得るようにする段階、
前記隠匿対象客体3Dモデルと前記隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する段階、および
検出の対象となる検出対象客体を実際に撮影した検出対象イメージで現れ得る変形または歪みを参照して前記生成される2Dイメージを加工する段階を含む、方法。
【請求項2】
前記変形または前記歪みは、前記検出対象客体を撮影する撮影装置と前記検出対象客体の間の位置関係により発生する変形または歪みを含む、請求項1に記載の方法。
【請求項3】
前記組み合わせ3Dモデルは、互いに独立的に生成される前記隠匿対象客体の3Dモデルおよび前記隠匿道具客体の3Dモデルが少なくとも一つの様相により組み合わせられることによって生成される、請求項1又は2に記載の方法。
【請求項4】
前記隠匿道具客体の3Dモデルと組み合わせられる前記隠匿対象客体の3Dモデルの大きさ、形状および位置のうち少なくとも一つが変更され得る、請求項3に記載の方法。
【請求項5】
前記加工段階で、前記歪みまたは変形が前記2Dイメージに含まれるようにする方向に前記2Dイメージを加工する、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記加工段階で、前記隠匿対象客体の3Dモデルおよび前記隠匿道具客体の3Dモデルを生成するために使われる撮影装置と前記検出対象客体を撮影する撮影装置の間の差異点を参照して前記2Dイメージを加工する、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記加工段階で、前記検出対象客体を撮影する撮影装置の仕様情報および識別情報のうち少なくとも一つを参照して前記2Dイメージを加工する、請求項1~6のいずれか一項に記載の方法。
【請求項8】
請求項1~7のいずれか一項に記載された方法を実行するためのコンピュータプログラムを記録する、非一過性のコンピュータ読み取り可能記録媒体。
【請求項9】
人工知能基盤検出モデルに対する学習データを生成するためのシステムであって、
隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルをそれぞれ生成し、前記隠匿対象客体の3Dモデルと前記隠匿道具客体の3Dモデルが組み合わせられ得るようにする3Dモデル管理部、
前記隠匿対象客体3Dモデルと前記隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する学習データ生成部、および
検出の対象となる検出対象客体を実際に撮影した検出対象イメージで現れ得る変形または歪みを参照して前記生成される2Dイメージを加工する学習データ加工部を含む、システム。
【請求項10】
前記変形または前記歪みは、前記検出対象客体を撮影する撮影装置と前記検出対象客体の間の位置関係により発生する変形または歪みを含む、請求項9に記載のシステム。
【請求項11】
前記組み合わせ3Dモデルは、互いに独立的に生成される前記隠匿対象客体の3Dモデルおよび前記隠匿道具客体の3Dモデルが少なくとも一つの様相により組み合わせられることによって生成される、請求項9又は10に記載のシステム。
【請求項12】
前記隠匿道具客体の3Dモデルと組み合わせられる前記隠匿対象客体の3Dモデルの大きさ、形状および位置のうち少なくとも一つが変更され得る、請求項11に記載のシステム。
【請求項13】
前記学習データ加工部は、前記歪みまたは変形が前記2Dイメージに含まれるようにする方向に前記2Dイメージを加工する、請求項9~12のいずれか一項に記載のシステム。
【請求項14】
前記学習データ加工部は、前記隠匿対象客体の3Dモデルおよび前記隠匿道具客体の3Dモデルを生成するために使われる撮影装置と前記検出対象客体を撮影する撮影装置の間の差異点を参照して前記2Dイメージを加工する、請求項9~13のいずれか一項に記載のシステム。
【請求項15】
前記学習データ加工部は、前記検出対象客体を撮影する撮影装置の仕様情報および識別情報のうち少なくとも一つを参照して前記2Dイメージを加工する、請求項9~14のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は人工知能基盤検出モデルに対する学習データを生成するための方法、システムおよび記録媒体に関する。
【背景技術】
【0002】
最近、マシンラーニング、ディープラーニングなどの人工知能関連技術に関する研究が活発となるにつれて、人工知能を利用してイメージから特定の客体を検出する技術が多く紹介されている。
【0003】
セキュリティ検索分野においても、このような人工知能に基づいた技術を利用して隠匿対象客体(例えば、刃物、瓶、銃器など)を検出しようとする試みがなされているが、前記のような従来技術をはじめとしてこれまで紹介された技術は人工知能の学習用映像データを一々撮影して製作するため、時間と費用が過度に多く所要するという限界がある。例えば、書類カバンに拳銃を隠匿した学習用映像を作るとする時、書類カバンに実際の拳銃を入れて撮影しなければならないが、この時、拳銃の角度を一々手作業で調整することは時間と費用の側面で非常に非効率的である。また、人工知能基盤検出モデルの性能は学習データの多様性と量により変わるため、検出モデルの性能を高めるために多様な姿を含んでいる学習データを大量で確保することが必要である。
【0004】
そこで、本発明者(ら)は、隠匿対象客体の多様な姿を含んでいる大量の学習データを効果的に生成する技術を提案するところである。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は前述した従来技術の問題点をすべて解決することをその目的とする。
【0006】
また、本発明は、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルをそれぞれ生成し、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルが組み合わせられ得るようにする段階、隠匿対象客体3Dモデルと隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する段階、および検出の対象となる検出対象客体を撮影した検出対象イメージで現れ得る変形または歪みを参照して2Dイメージを加工する段階を含む方法およびシステムを提供することを他の目的とする。
【0007】
また、本発明は、隠匿対象客体の多様な姿を含んでいる大量の学習データを効果的に生成することをさらに他の目的とする。
【0008】
また、本発明は、学習データの多様性と量を増やすことによって人工知能基盤検出モデルの性能を高めることをさらに他の目的とする。
【課題を解決するための手段】
【0009】
前記目的を達成するための本発明の代表的な構成は次の通りである。
【0010】
本発明の一態様によると、人工知能基盤検出モデルに対する学習データを生成するための方法であって、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルをそれぞれ生成し、前記隠匿対象客体の3Dモデルと前記隠匿道具客体の3Dモデルが組み合わせられ得るようにする段階、前記隠匿対象客体3Dモデルと前記隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する段階、および検出の対象となる検出対象客体を実際に撮影した検出対象イメージで現れ得る変形または歪みを参照して前記生成される2Dイメージを加工する段階を含む方法が提供される。
【0011】
本発明の他の態様によると、人工知能基盤検出モデルに対する学習データを生成するためのシステムであって、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルをそれぞれ生成し、前記隠匿対象客体の3Dモデルと前記隠匿道具客体の3Dモデルが組み合わせられるようにする3Dモデル管理部、前記隠匿対象客体3Dモデルと前記隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する学習データ生成部、および検出の対象となる検出対象客体を実際に撮影した検出対象イメージで現れ得る変形または歪みを参照して前記生成される2Dイメージを加工する学習データ加工部を含むシステムが提供される。
【0012】
この他にも、本発明を具現するための他の方法、他のシステムおよび前記方法を実行するためのコンピュータプログラムを記録する非一過性のコンピュータ読み取り可能な記録媒体がさらに提供される。
【発明の効果】
【0013】
本発明によると、隠匿対象客体の多様な姿を含んでいる大量の学習データを効果的に生成することができる。
【0014】
また、本発明によると、学習データの多様性と量を増やすことによって人工知能基盤検出モデルの性能を高めることができる。
【図面の簡単な説明】
【0015】
【
図1】本発明の一実施例に係る人工知能基盤検出モデルに対する学習データ生成システムの内部構成を詳細に図示する図面である。
【
図2】本発明の一実施例により生成される隠匿道具客体の3Dモデルを例示的に示す図面である。
【
図3】本発明の一実施例により生成される隠匿対象客体の3Dモデルを例示的に示す図面である。
【
図4】本発明の一実施例により隠匿道具客体の3Dモデルおよび隠匿対象客体の3Dモデルを組み合わせる(または合成)ことによって生成される組み合わせ3Dモデルを例示的に示す図面である。
【
図5】本発明の一実施例により組み合わせ3Dモデルから捉えられた2Dイメージを例示的に示す図面である。
【発明を実施するための形態】
【0016】
後述する本発明に対する詳細な説明は、本発明が実施され得る特定の実施例を例示として図示する添付図面を参照する。このような実施例は当業者が本発明を充分に実施できるように詳細に説明される。本発明の多様な実施例は互いに異なるが、互いに排他的である必要はないことが理解されるべきである。例えば、本明細書に記載されている特定の形状、構造および特性は、本発明の精神と範囲を逸脱することなく一実施例から他の実施例に変更されて具現され得る。また、それぞれの実施例内の個別の構成要素の位置または配置も、本発明の精神と範囲を逸脱することなく変更され得ることが理解されるべきである。したがって、後述する詳細な説明は限定的な意味として行われるものではなく、本発明の範囲は特許請求の範囲の請求項が請求する範囲およびそれと均等なすべての範囲を包括するものと理解されるべきである。図面で類似する参照符号は多様な側面に亘って同一または類似する構成要素を示す。
【0017】
以下では、本発明が属する技術分野で通常の知識を有する者が本発明を容易に実施できるようにするために、本発明の多様な好ましい実施例に関して添付された図面を参照して詳細に説明することにする。
【0018】
(学習データ生成システムの構成)
以下では、本発明を具現するために重要な機能を遂行する学習データ生成システム100の内部構成と各構成要素の機能について詳察することにする。
【0019】
図1は、本発明の一実施例に係る学習データ生成システム100の内部構成を詳細に図示する図面である。
【0020】
図1に図示された通り、本発明の一実施例に係る学習データ生成システム100は、3Dモデル管理部110、学習データ生成部120、学習データ加工部130、通信部140および制御部150を含んで構成され得る。本発明の一実施例によると、3Dモデル管理部110、学習データ生成部120、学習データ加工部130、通信部140および制御部150は、そのうち少なくとも一部が外部のシステム(図示されず)と通信するプログラムモジュールであり得る。このようなプログラムモジュールは運営システム、アプリケーションモジュールまたはその他のプログラムモジュールの形態で学習データ生成システム100に含まれ得、物理的には多様な公知の記憶装置に保存され得る。また、このようなプログラムモジュールは学習データ生成システム100と通信可能な遠隔記憶装置に保存されてもよい。一方、このようなプログラムモジュールは、本発明により後述する特定の業務を遂行したり特定の抽象データ類型を実行するルーチン、サブルーチン、プログラム、客体、コンポーネント、データ構造などを包括するが、これに制限されはしない。
【0021】
一方、学習データ生成システム100について前記のように説明されたが、このような説明は例示的なものであり、学習データ生成システム100の構成要素または機能のうち少なくとも一部が必要に応じて外部システム(図示されず)内で実現されたり外部システム内に含まれてもよいことは当業者に自明である。
【0022】
まず、本発明の一実施例に係る3Dモデル管理部110は、隠匿対象客体(刃物、麻薬、爆弾など)の3Dモデルと隠匿道具客体(靴、カバンなど)の3Dモデルをそれぞれ生成する機能を遂行することができる。例えば、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルは、隠匿対象客体と隠匿道具客体をそれぞれ所定の撮影装置で撮影した結果として生成され得、このような撮影装置として3D CT撮影装置が利用され得る。引き続き、例えば、3D CT撮影装置で撮影した結果として生成される3Dモデルは、隠匿対象客体または隠匿道具客体の内部構造および外部構造に関する視覚的な情報を含むことができる。
【0023】
図2は、本発明の一実施例により生成される隠匿道具客体の3Dモデルを例示的に示す図面である。
【0024】
図3は、本発明の一実施例により生成される隠匿対象客体の3Dモデルを例示的に示す図面である。
【0025】
図2および
図3を参照すると、隠匿対象客体として直六面体状の隠匿物体を3D CT撮影することによって隠匿対象客体に対する3Dモデル210が生成され得、隠匿道具客体として靴を3D CT撮影することによって隠匿道具客体に対する3Dモデル220が生成され得る。
【0026】
また、本発明の一実施例に係る3Dモデル管理部110は、前記のように生成される隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルが、少なくとも一つの様相により互いに組み合わせまたは合成されるようにすることができる。
【0027】
具体的には、本発明の一実施例によると、3Dモデル管理部110は使用者が3Dモデルの組み合わせまたは合成ができるように支援する使用者インタフェースを提供することができる。例えば、使用者は隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルを操作しながら、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルを多様な様相で組み合わせまたは合成して見ることができる。他の例を挙げると、使用者は隠匿道具客体の3Dモデルと組み合わせられる隠匿対象客体の3Dモデルの大きさ、形状および位置のうち少なくとも一つを変更することができる。さらに他の例を挙げると、使用者は隠匿道具客体の3Dモデルと隠匿対象客体の3Dモデルを組み合わせまたは合成するにおいて、両者の位置関係(方向、角度等)を多様に変更することができる。
【0028】
図4は、本発明の一実施例により隠匿道具客体の3Dモデルおよび隠匿対象客体の3Dモデルを組み合わせる(または合成)ことによって生成される組み合わせ3Dモデルを例示的に示す図面である。
【0029】
図4を参照すると、隠匿対象客体の3Dモデル210が隠匿道具客体である靴の3Dモデル220の足指側(
図4の(a))とかかと側(
図4の(b))にそれぞれ隠された姿を有した組み合わせ3Dモデルが生成され得る。
【0030】
ただし、本発明の一実施例に係る3Dモデル生成および組み合わせに関する構成は前述したものに限定されず、本発明の目的を達成できる範囲内で多様に変更され得る。一方、3Dモデルを生成するために使われる撮影装置にはCT撮影装置を含むことができるが、CT撮影装置ではない他の撮影装置を使ってもよい。
【0031】
次に、本発明の一実施例に係る学習データ生成部120は、隠匿対象客体3Dモデルと隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する機能を遂行することができる。
【0032】
具体的には、2Dイメージは隠匿道具客体の3Dモデルおよび隠匿対象客体の3Dモデルが組み合わせられた組み合わせ3Dモデルを透視した姿が含まれたイメージであり得、捕捉方向により2Dイメージに含まれた姿が変わり得る。例えば、本発明の一実施例に係る2Dイメージは、後述するX-RAY撮影方式と同一にシミュレーションされた仮想の撮影方式によって捉えられたイメージであり得る。
【0033】
一方、本発明の一実施例によると、前記2Dイメージは解像度の低下またはRGB変換のような別途の歪み過程を経ていない二種類の出力エネルギーの16bit Grey Scaleの形態で収集され得る。
【0034】
図5は、本発明の一実施例により組み合わせ3Dモデルから捉えられた2Dイメージを例示的に示す図面である。
【0035】
図5を参照すると、隠匿物体が隠された靴に関する多様な姿の組み合わせ3Dモデルに対して2D透視イメージを捉えることによって、隠匿物体が隠された靴に関する学習データを生成することができる。
【0036】
次に、本発明の一実施例に係る学習データ加工部130は、検出の対象となる検出対象客体を実際に撮影した検出対象イメージで現れ得る変形または歪みを参照して、前記で生成される2Dイメージを加工することができる。本発明の一実施例によると、前記変形または歪みは放射状に射出される検出対象撮影装置の特性上、検出対象客体と検出対象撮影装置の位置関係または距離によりその撮影されたイメージで現れ得る変形または歪みを含むことができる。このような変形または歪みにより、同一の物品であっても撮影されたイメージでは異なる姿で現れ得る。
【0037】
具体的には、本発明の一実施例に係る学習データ加工部130は、前記のように検出対象客体を実際に撮影した少なくとも一つの検出対象イメージから検出される歪みまたは変形が2Dイメージに含まれるようにする方向に2Dイメージを加工することができる。
【0038】
例えば、本発明の一実施例に係る学習データ加工部130は、検出対象イメージ内での検出対象客体の位置、検出対象客体を撮影する装置と検出対象客体間の位置関係、検出対象客体を撮影する装置の仕様情報、検出対象イメージに現れる変形または歪みに関するデータに基づいて学習される別個の人工知能基盤予測モデルを利用して、3Dモデルから捉えられた2Dイメージで現れ得る変形または歪みを予測することができ、このように予測される変形または歪みを該当2Dイメージに付加することによって、2Dイメージを加工することができる。
【0039】
一方、本発明の一実施例に係る学習データ加工部130は、隠匿対象客体の3Dモデルおよび隠匿道具客体の3Dモデルを生成するために使われる撮影装置(例えば、3D CT撮影装置)と検出対象客体を実際に撮影する撮影装置(例えば、X-RAY撮影装置)の間の差異点を参照して2Dイメージを加工することができる。
【0040】
具体的には、本発明の一実施例によると、隠匿対象客体および隠匿道具客体に対する撮影装置はCT撮影装置であってもよく、検出対象客体に対する撮影装置はX-RAY装置であってもよい。CT撮影装置はCTスキャナーを利用したコンピュータ断層撮影法でエックス線や超音波を多様な角度から人体に投影し、これをコンピュータで再構成して客体の内部断面の姿を画像として処理する反面、X-RAY撮影装置はX-RAYが客体を透過しながら減衰する程度を測定して客体の内部構造を映像化する装置である。したがって、両撮影装置で使われる電磁波の種類が異なり得、撮影技法と撮影結果物において差異点が発生し得、このような差異点は2Dイメージ加工段階で参照され得る。
【0041】
例えば、本発明の一実施例に係る学習データ加工部130は、隠匿対象客体の3Dモデルおよび隠匿道具客体の3Dモデルを生成するために使われる撮影装置に関するデータ、検出対象客体を実際に撮影する撮影装置に関するデータ、3Dモデルから捉えられた2Dイメージと検出対象イメージの間の差に関するデータに基づいて学習される別個の人工知能基盤決定モデルを利用して、3Dモデルから捉えられた2Dイメージに付加されなければならない視覚的効果を決定することができ、このように決定される視覚的効果を該当2Dイメージに付加することによって、2Dイメージを加工することができる。
【0042】
また、本発明の一実施例に係る学習データ加工部130は、検出対象客体を撮影する撮影装置の仕様情報および識別情報のうち少なくとも一つを参照して2Dイメージを加工することができる。
【0043】
例えば、本発明の一実施例に係る学習データ加工部130は、隠匿対象客体の3Dモデルおよび隠匿道具客体の3Dモデルを生成するために使われる撮影装置の仕様情報および識別情報に関するデータ、3Dモデルから捉えられた2Dイメージと検出対象イメージの間の差に関するデータに基づいて学習される別個の人工知能基盤決定モデルを利用して、3Dモデルから捉えられた2Dイメージに付加されなければならない視覚的効果を決定することができ、このように決定される視覚的効果を該当2Dイメージに付加することによって、2Dイメージを加工することができる。
【0044】
一方、本発明の一実施例によると、前記のように生成および加工される2Dイメージは人工知能基盤検出モデルの学習データとして利用され得る。
【0045】
具体的には、本発明の一実施例によると、人工知能基盤検出モデルは少なくとも一つの隠匿対象客体または隠匿道具客体の姿を含んでいる2Dイメージ(すなわち、学習データ)に基づいて、隠匿対象客体に関する2Dイメージから隠匿対象客体を検出するように学習され得る。
【0046】
次に、本発明の一実施例に係る通信部140は、3Dモデル管理部110、学習データ生成部120および学習データ加工部130からの/へのデータの送受信を可能にする機能を遂行することができる。
【0047】
最後に、本発明の一実施例に係る制御部150は、3Dモデル管理部110、学習データ生成部120、学習データ加工部130および通信部140間のデータの流れを制御する機能を遂行することができる。すなわち、本発明に係る制御部150は、学習データ生成システム100の外部からの/へのデータの流れまたは学習データ生成システム100の各構成要素間のデータの流れを制御することによって、3Dモデル管理部110、学習データ生成部120、学習データ加工部130および通信部140でそれぞれ固有の機能を遂行するように制御することができる。
【0048】
一方、本発明の一実施例に係る人工知能基盤検出モデルの学習データ生成および加工方法は前述したものに限定されず、本発明の目的を達成できる範囲内で多様に変更され得る。
【0049】
以上で説明された本発明に係る実施例は、多様なコンピュータ構成要素を通じて実行され得るプログラム命令語の形態で具現されてコンピュータ読み取り可能な記録媒体に記録され得る。前記コンピュータ読み取り可能な記録媒体は、プログラム命令語、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記コンピュータ読み取り可能な記録媒体に記録されるプログラム命令語は、本発明のために特別に設計されて構成されたものであるか、コンピュータソフトウェア分野の当業者に公知になっている使用可能なものであり得る。コンピュータ読み取り可能な記録媒体の例には、ハードディスク、フロッピー(登録商標)ディスクおよび磁気テープのような磁気媒体、CD-ROMおよびDVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical medium)、およびROM、RAM、フラッシュメモリなどのような、プログラム命令語を保存し実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるような機械語コードだけでなく、インタープリタなどを使ってコンピュータによって実行され得る高級言語コードも含まれる。ハードウェア装置は本発明に係る処理を遂行するために一つ以上のソフトウェアモジュールに変更され得、その逆も同じである。
【0050】
以上、本発明が具体的な構成要素などのような特定事項と限定された実施例および図面によって説明されたが、これは本発明のより全般的な理解を助けるために提供されたものに過ぎず、本発明は前記実施例に限定されるものではなく、本発明が属する技術分野で通常の知識を有する者であればこのような記載から多様な修正と変更を試みることができる。
【0051】
したがって、本発明の思想は前記説明された実施例に限定されて定められてはならず、後述する特許請求の範囲だけでなく、その特許請求の範囲と均等なまたはこれから等価的に変更されたすべての範囲は本発明の思想の範疇に属するものと言える。
【符号の説明】
【0052】
100:学習データ生成システム
110:3Dモデル管理部
120:学習データ生成部
130:学習データ加工部
140:通信部
150:制御部
210:撮影装置
220:隠匿道具客体
230:隠匿対象客体
【要約】
【課題】人工知能基盤検出モデルに対する学習データを生成するための方法、システムおよび記録媒体を提供する。
【解決手段】本発明の一態様によると、人工知能基盤検出モデルに対する学習データを生成するための方法であって、隠匿対象客体の3Dモデルと隠匿道具客体の3Dモデルをそれぞれ生成し、前記隠匿対象客体の3Dモデルと前記隠匿道具客体の3Dモデルが組み合わせられ得るようにする段階、前記隠匿対象客体3Dモデルと前記隠匿道具客体3Dモデルが組み合わせられた組み合わせ3Dモデルを、少なくとも一つの方向で捉えることによって2Dイメージを生成する段階、および検出の対象となる検出対象客体を実際に撮影した検出対象イメージで現れ得る変形または歪みを参照して前記生成される2Dイメージを加工する段階を含む方法が提供される。
【選択図】
図1