IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱重工メカトロシステムズ株式会社の特許一覧

特許7611315学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法
<>
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図1
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図2
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図3
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図4
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図5
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図6
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図7
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図8
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図9
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図10
  • 特許-学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-12-25
(45)【発行日】2025-01-09
(54)【発明の名称】学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20241226BHJP
【FI】
G06T7/00 350B
【請求項の数】 6
(21)【出願番号】P 2023127926
(22)【出願日】2023-08-04
【審査請求日】2024-09-03
【早期審査対象出願】
(73)【特許権者】
【識別番号】309036221
【氏名又は名称】三菱重工機械システム株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】西森 稔晃
(72)【発明者】
【氏名】家永 健吾
(72)【発明者】
【氏名】宅原 雅人
【審査官】山田 辰美
(56)【参考文献】
【文献】特開2023-006539(JP,A)
【文献】特開2022-067858(JP,A)
【文献】特開2023-058758(JP,A)
【文献】特開2022-091270(JP,A)
【文献】国際公開第2018/179338(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
(57)【特許請求の範囲】
【請求項1】
晴天時の昼間に車両から撮影装置によって撮影した画像であって他の車両、歩行者、信号及び標識の少なくとも1つの対象部分を含む基準画像に対して、前記晴天時の昼間とは異なる気象条件及び日照条件を示す外乱画像を用いて外乱を付加するように変換して変換画像を生成する変換ステップと、
前記変換画像と前記変換画像において前記対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、前記変換対象部分の情報として前記基準画像における前記対象部分の情報を用いる対応ステップと
を含む学習用画像生成方法。
【請求項2】
前記変換画像は、識別性が閾値よりも低い画像であり、
前記基準画像は、前記識別性が閾値よりも高い画像である
請求項1に記載の学習用画像生成方法。
【請求項3】
前記基準画像における前記対象部分の位置及び範囲を特定する特定ステップを更に含み、
前記対応ステップでは、前記特定ステップで特定された前記対象部分の位置及び範囲を前記対象部分の情報として前記変換画像と対応付ける
請求項1に記載の学習用画像生成方法。
【請求項4】
晴天時の昼間に車両から撮影装置によって撮影した画像であって他の車両、歩行者、信号及び標識の少なくとも1つの対象部分を含む基準画像に対して、前記晴天時の昼間とは異なる気象条件及び日照条件を示す外乱画像を用いて外乱を付加するように変換して変換画像を生成する生成部と、
前記変換画像と前記変換画像において前記対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、前記変換対象部分の情報として前記基準画像における前記対象部分の情報を用いる対応部と
を備える学習用画像生成装置。
【請求項5】
晴天時の昼間に車両から撮影装置によって撮影した画像であって他の車両、歩行者、信号及び標識の少なくとも1つの対象部分を含む基準画像に対して、前記晴天時の昼間とは異なる気象条件及び日照条件を示す外乱画像を用いて外乱を付加するように変換して変換画像を生成する変換処理と、
前記変換画像と前記変換画像において前記対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、前記変換対象部分の情報として前記基準画像における前記対象部分の情報を用いる対応処理と
をコンピュータに実行させる学習用画像生成プログラム。
【請求項6】
請求項1から請求項のいずれか一項に記載の学習用画像生成方法により学習用画像を生成する学習用画像生成ステップと、
生成した前記学習用画像を学習モデルに学習させる学習ステップと
を含む学習モデル生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法に関する。
【背景技術】
【0002】
画像に含まれる対象部分を抽出する学習モデルを生成する場合、画像と対象部分とを対応付けた学習用画像が大量に必要となる。学習用画像を生成する技術としては、例えば特許文献1に記載の技術等が知られている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第7164008号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のような学習用画像を生成する場合、画像と対象部分との対応付けを高精度に行うことが求められる。
【0005】
本開示は、上記に鑑みてなされたものであり、画像に含まれる対象部分を抽出する学習モデルを生成するための学習用画像として、画像と対象部分との対応付けの精度が高い学習用画像を生成することが可能な学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示に係る学習用画像生成方法は、対象部分を含む基準画像を識別性が低下するように変換して変換画像を生成する変換ステップと、前記変換画像と前記変換画像において前記対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、前記変換対象部分の情報として前記基準画像における前記対象部分の情報を用いる対応ステップとを含む。
【0007】
本開示に係る学習用画像生成プログラムは、対象部分を含む基準画像を識別性が低下するように変換して変換画像を生成する変換処理と、前記変換画像と前記変換画像において前記対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、前記変換対象部分の情報として前記基準画像における前記対象部分の情報を用いる対応処理とをコンピュータに実行させる。
【0008】
本開示に係る学習用画像生成装置は、対象部分を含む基準画像を識別性が低下するように変換して変換画像を生成する生成部と、前記変換画像と前記変換画像において前記対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、前記変換対象部分の情報として前記基準画像における前記対象部分の情報を用いる対応部とを備える。
【0009】
本開示に係る学習モデル生成方法は、上記の学習用画像生成方法により学習用画像を生成する学習用画像生成ステップと、生成した前記学習用画像を学習モデルに学習させる学習ステップとを含む。
【発明の効果】
【0010】
本開示によれば、画像に含まれる対象部分を抽出する学習モデルを生成するための学習用画像として、画像と対象部分との対応付けの精度が高い学習用画像を生成することができる。
【図面の簡単な説明】
【0011】
図1図1は、本実施形態に係る学習用画像生成装置の一例を示す機能ブロック図である。
図2図2は、基準画像の一例を模式的に示す図である。
図3図3は、変換画像の一例を模式的に示す図である。
図4図4は、学習用画像の一例を模式的に示す図である。
図5図5は、本実施形態に係る学習用画像生成方法の一例を示すフローチャートである。
図6図6は、学習用画像に基づいて学習モデルを生成する場合の一例を模式的に示す図である。
図7図7は、本実施形態に係る学習モデル生成方法の一例を示すフローチャートである。
図8図8は、学習モデルの動作の一例を模式的に示す図である。
図9図9は、学習モデルに撮影画像を入力した場合において、出力される対象部分の正解率の一例を示すグラフである。
図10図10は、基準画像の他の例を示す図である。
図11図11は、基準画像の他の例を示す図である。
【発明を実施するための形態】
【0012】
以下、本開示に係る学習用画像生成方法、学習用画像生成装置、学習用画像生成プログラム及び学習モデル生成方法の実施形態を図面に基づいて説明する。なお、この実施形態によりこの発明が限定されるものではない。また、下記実施形態における構成要素には、当業者が置換可能かつ容易なもの、あるいは実質的に同一のものが含まれる。
【0013】
図1は、本実施形態に係る学習用画像生成装置の一例を示す機能ブロック図である。図1に示すように、学習用画像生成装置100は、入出力部10と、処理部20と、記憶部30とを含む。
【0014】
入出力部10は、外部機器からの信号を入力し、外部機器へ信号を出力する入出力インターフェースである。入出力部10は、撮影装置等の外部機器から、後述する基準画像が入力される。入力された基準画像は、例えば記憶部30に記憶することができる。また、入出力部10は、上記の基準画像、後述する変換画像及び学習用画像を出力することができる。
【0015】
処理部20は、各種の情報処理を行う。処理部20は、CPU(Central Processing Unit)等のプロセッサと、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリとを含む。処理部20は、変換部21と、対応部22とを有する。
【0016】
変換部21は、対象部分を含む基準画像を識別性が低下するように変換して変換画像を生成する。変換部21は、生成した変換画像を記憶部30に記憶することができる。対象部分は、基準画像の一部である。対象部分としては、例えば基準画像における所定の物体を含む部分等が含まれる。
【0017】
基準画像は、例えば撮影装置によって撮影された画像を用いることができる。なお、本実施形態において、画像は、撮影装置によって撮影された画像に限定されず、例えばLiDARセンサ等の光測距センサにより測定された光測距データ、RADARセンサ等の電波測距センサにより測定された電波測距データ等、他の種類のセンサで取得されたデータであってもよい。この場合、光測距データ、電波測距データ等の各データは、画素が2次元状に配列された画像と同様に、測定値が2次元状に配列されたデータとして、すなわち画像と同等のデータとして用いることができる。以下の説明では、このように2次元状に配列した光測距データ、電波測距データ等の各データについても、「画像」に含むものとして説明する。
【0018】
基準画像としては、例えば識別性が閾値よりも高い画像を用いることができる。基準画像は、晴天時の昼間等、外乱が最も少なくなる条件で検出した画像を用いることができる。外乱としては、例えば降雨、降雪、霧等の気象条件、明け方、夕方、夜間、逆光等の日照条件等の天候条件が挙げられる。
【0019】
本実施形態において、識別性は、例えば撮影装置によって撮影された基準画像の場合、当該基準画像の視認性とすることができる。視認性については、例えば基準画像の輝度及び明度の少なくとも一方のコントラスト等で示すことができる。また、光測距データ、電波測距データ等の各データの場合、識別性は、測定値のS/N比等で示すことができる。
【0020】
本実施形態において、基準画像としては、識別性(輝度及び明度の少なくとも一方のコントラスト)が閾値よりも高い又は閾値以上である画像とすることができる。また、変換画像は、識別性が閾値よりも低い画像とすることができる。この場合、変換部21は、識別性が閾値よりも高い基準画像を当該識別性が閾値よりも低くなるように変換して変換画像を生成する。変換画像は、識別性が上記の閾値よりも低い画像とすることができる。
【0021】
変換部21は、基準画像に例えば外乱を付加することで識別性を低下させることができる。変換部21は、例えば降雨、降雪、霧等の各気象条件を示す画像、明け方、夕方、夜間、逆光等の各日照条件を示す画像等の外乱画像を用いて基準画像を変換することができる。
【0022】
変換部21は、例えばニューラルネットワークによる学習によって変換画像を生成することができる。この場合、変換部21は、例えば、基準画像と外乱画像とが入力された場合、敵対的生成ネットワーク(GAN:Generative Adversarial Networks)と呼ばれる技術、又はサイクル敵対的生成ネットワーク(Cycle GAN)と呼ばれる技術を用いて、変換画像を生成することができる。また、変換部21は、拡散モデル(Diffusion Model)と呼ばれる技術を用いて、変換画像を生成することができる。
【0023】
図2は、基準画像の一例を模式的に示す図である。図2に示す基準画像IM1は、晴天時の昼間において、走行状態の車両から前方を撮影した画像である。基準画像IM1には、自車両の前方を走行する先行車両A1の画像が含まれている。基準画像IM1は、当該先行車両A1の画像を含む部分が対象部分P1として特定された状態である。対象部分P1を特定する場合、例えば作業者が基準画像IM1を見て先行車両A1を識別し、識別した範囲を手作業で対象部分P1とすることができる。なお、基準画像IM1に対して画像処理を行うことで対象部分P1を特定してもよい。なお、対象部分P1としては、先行車両A1に限られず、例えば歩行者、信号、標識、バイク、自転車等の他の物体又は人であってもよい。
【0024】
図3は、変換画像の一例を模式的に示す図である。図3に示す変換画像IM2は、基準画像IM1に外乱を付加して識別性を低下させた画像である。変換画像IM2には、自車両の前方を走行する先行車両A2の画像が含まれている。変換画像IM2は、基準画像IM1と画素数が同一とすることができる。この場合、変換画像IM2における先行車両A2の位置及び範囲は、基準画像IM1における先行車両A1の位置及び範囲と同一となる。
【0025】
対応部22は、変換画像に基づいて学習用画像を生成する。対応部22は、生成した学習用画像を記憶部30に記憶することができる。学習用画像は、変換画像と、基準画像における対象部分の情報とを、学習モデルに学習させる対応関係として対応付けたデータである。すなわち、学習用画像は、変換画像において基準画像の対象部分に対応する部分である変換対象部分の情報として、基準画像における対象部分の情報を用いて対応付けを行ったデータである。基準画像と変換画像との2次元の画素配列が同一である場合、基準画像において対象部分を構成する各画素の2次元座標と、変換画像において変換対象部分を構成する各画素の2次元座標とが同一となる。この場合、対応部22は、特定された対象部分の位置及び範囲を対象部分の情報として変換画像と対応付けることができる。
【0026】
図4は、学習用画像の一例を模式的に示す図である。図4に示す学習用画像IM3は、変換画像IM2と、基準画像における対象部分P1の情報とが学習モデルに学習させる対応関係として対応付けられている。変換画像IM2における変換対象部分P2の位置及び範囲は、基準画像IM1における対象部分P1の位置及び範囲と同一である。本実施形態では、基準画像IM1と変換画像IM2との2次元の画素配列が同一であるため、対応部22は、基準画像IM1において対象部分P1を構成する各画素の2次元座標と、変換画像IM2において変換対象部分P2を構成する各画素の2次元座標とが同一となるように対象部分P1の情報を設定することができる。
【0027】
対応部22により生成される学習用画像IM3は、視認性の低い変換画像IM2において対象部分P1の情報が対応付けられたデータである。例えば、作業者が変換画像IM2を見て先行車両A2を識別し、識別した範囲を手作業で変換対象部分P2とする場合、視認性の低い変換画像IM2から先行車両A2を十分に識別できず、見落としてしまう可能性がある。このため、変換画像IM2と変換対象部分P2との対応付けの精度が十分でない学習用画像IM3が生成される可能性がある。これに対して、本実施形態では、変換画像IM2よりも視認性の高い基準画像IM1に基づいて対象部分P1の情報を特定し、当該対象部分P1の情報を変換対象部分P2の情報として変換画像IM2に対応付けた学習用画像IM3を生成するため、変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0028】
記憶部30は、各種プログラム、データ等の情報を記憶する。記憶部30は、HDD(Hard Disk Drive)、SSD(Solid State Drive)等のストレージを含む。記憶部30は、入出力部10より入力された基準画像を記憶することができる。記憶部30は、変換部21で生成された変換画像、対応部22で生成された学習用画像をそれぞれ記憶することができる。
【0029】
記憶部30は、例えば、対象部分を含む基準画像を識別性が低下するように変換して変換画像を生成する変換処理と、変換画像と変換画像において対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、変換対象部分の情報として基準画像における対象部分の情報を用いる対応処理とをコンピュータに実行させる学習用画像生成プログラムを記憶する。
【0030】
学習用画像生成装置100では、処理部20においてプロセッサが各種プログラムを読み出してメモリに展開することで、上記各部の機能に対応した情報処理を実行する。各種プログラムとしては、例えば記憶部30に記憶されたプログラム、外部の記録媒体に記録されたプログラム等が挙げられる。学習用画像生成装置100は、各種の情報処理を実行する情報処理装置(コンピュータ)として機能する。なお、学習用画像生成装置100とは異なる他の情報処理装置が各種プログラムを実行してもよいし、学習用画像生成装置100と他の情報処理装置とが協働して各種プログラムを実行してもよい。
【0031】
図5は、本実施形態に係る学習用画像生成方法の一例を示すフローチャートである。図5に示すように、本実施形態に係る学習用画像生成方法は、特定ステップS10と、変換ステップS20と、対応ステップS30とを含む。
【0032】
特定ステップS10は、基準画像IM1における対象部分P1の位置及び範囲を対象部分P1の情報として特定する。特定ステップS10では、例えば作業者が基準画像IM1を見て先行車両A1を識別し、識別した範囲を手作業で対象部分P1とすることができる。なお、基準画像IM1に対して画像処理を行うことで対象部分P1を特定してもよい。
【0033】
変換ステップS20は、対象部分P1を含む基準画像IM1を識別性が低下するように変換して変換画像IM2を生成する。
【0034】
対応ステップS30は、変換画像IM2と基準画像IM1における対象部分P1の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像IM3を生成する。
【0035】
上記のように生成した学習用画像IM3を学習させることにより、学習モデルを生成することができる。図6は、学習用画像IM3に基づいて学習モデルを生成する場合の一例を模式的に示す図である。なお、図6に示す学習処理装置200は、CPU等のプロセッサ(不図示)と、ROM、RAM等のメモリ(不図示)と、HDD、SSD等のストレージ(不図示)と、入出力インターフェース(不図示)とを含むコンピュータである。学習処理装置200には、学習用画像IM3に基づいて学習モデルを生成するためのプログラム、データ等が記憶される。
【0036】
図6に示す学習処理装置200は、上記のように生成された学習用画像IM3が入力された場合、入力された学習用画像IM3を機械学習により学習して、学習モデルMを生成する。学習処理装置200は、生成した学習モデルMをストレージに記憶させることができる。
【0037】
図7は、本実施形態に係る学習モデル生成方法の一例を示すフローチャートである。図7に示すように、本実施形態に係る学習モデル生成方法は、学習用画像生成ステップS110と、学習ステップS120とを含む。
【0038】
学習用画像生成ステップS110は、学習用画像IM3を生成するステップであり、上記した変換ステップS20及び対応ステップS30(図5参照)を少なくとも含み、特定ステップS10(図5参照)を含んでもよい。
【0039】
学習ステップS120では、生成した学習用画像IM3を学習処理装置200に入力し、学習処理装置200が学習用画像IM3を学習する。これにより、学習モデルMを生成することができる。なお、学習ステップS120では、基準画像IM1と対象部分P1とを対応付けた学習用画像を学習処理装置200に入力し、学習処理装置200が当該学習用画像を学習してもよい。
【0040】
図8は、学習モデルMの動作の一例を模式的に示す図である。図8では、対象物A4を含む撮影画像IM4を推論処理装置300に入力する場合について説明する。撮影画像IM4は、走行状態の車両から前方を撮影した画像である。また、撮影画像IM4は、晴天ではなく、かつ昼間でもない状態であり、例えば降雨、降雪、霧等の各気象条件が発生した状態、明け方、夕方、夜間、逆光等の各日照条件が発生した状態で撮影した画像である。したがって、撮影画像IM4は、基準画像IM1に比べて識別性(視認性)が低い画像である。
【0041】
推論処理装置300には、当該撮影画像IM4と、上記のように生成された学習モデルMとを入力する。推論処理装置300は、視認性の低い変換画像IM2と基準画像IM1の対応部分P1の情報との対応関係の学習結果に基づいて、入力された撮影画像IM4における対象部分P4、すなわち、撮影画像IM4に含まれる対象物A4が含まれる部分を特定し、特定結果を出力する。
【0042】
なお、学習モデルMを生成する際に、基準画像IM1と対象部分P1とを対応付けた学習用画像を学習させた場合、撮影画像として、晴天かつ昼間に撮影した画像を学習処理装置200に入力することができる。この場合、推論処理装置300には、撮影画像及び学習モデルMが入力される。推論処理装置300は、視認性の高い基準画像IM1と当該基準画像IM1内の対象部分P1との対応関係の学習結果に基づいて、入力された撮影画像における対象部分を特定し、特定結果を出力することができる。
【0043】
図9は、推論処理装置300に撮影画像及び学習モデルMを入力した場合において、出力される対象部分の正解率の一例を示すグラフである。図9において、縦軸が正解率の高さを示している。また、横軸の「全画像」は、入力される全ての撮影画像についての結果を示している。また、「視認性高」は、入力される撮影画像のうち視認性が閾値よりも高い画像についての結果を示している。また、「視認性低」は、入力される撮影画像のうち視認性が閾値よりも低い画像についての結果を示している。
【0044】
図9において、「基準画像のみ」の折れ線グラフは、基準画像IM1のみを用いて学習モデルMを生成した場合の正解率を示す。また、「変換画像使用」の折れ線グラフは、基準画像IM1と学習用画像IM3とを用いて学習モデルMを生成した場合の正解率を示す。
【0045】
学習用画像IM3を用いて学習モデルMを生成することにより、視認性が閾値よりも低い画像(変換画像IM2)と対象部分(変換対象部分P2)との対応関係の学習精度が向上するため、図9に示すように、視認性が閾値よりも低い撮影画像を入力した場合の正解率が高くなる。
【0046】
また、視認性が閾値よりも低い画像の学習精度が向上するため、学習モデルMの総合的な学習精度が向上する。このため、図9に示すように、視認性が閾値よりも低い撮影画像だけではなく、視認性が閾値よりも高い撮影画像を入力した場合についても、正解率が高くなる。
【0047】
なお、上記実施形態では、対象部分の情報が例えば基準画像における所定の物体を含む部分の情報である場合を例に挙げて説明したが、この場合に限定されない。図10及び図11は、基準画像の他の例を示す図である。
【0048】
図10は、セグメンテーションと呼ばれる手法により認識される画像IM11の一例を模式的に示している。図10に示す画像IM11は、構造物等の外郭線等により区画される領域を表したものである。図10に示す画像IM11では、例えば区画された領域を含むそれぞれの部分、区画された領域同士の境界を含む部分、等のように画像IM11内の各領域を設定して対象部分の情報を特定することができる。
【0049】
図11は、デプスと呼ばれる手法により認識される画像IM12の一例を模式的に示している。図11に示す画像IM12は、3次元方向の奥行を濃淡により表したものである。画像IM12においては、例えば奥行きが同一の領域、奥行きの変化の割合が所定以下の領域、奥行きの変化の割合が所定以上の領域、等のように奥行に対応した領域を設定して対象部分の情報を特定することができる。
【0050】
以上のように、本開示の第1態様に係る学習用画像生成方法は、対象部分P1を含む基準画像IM1を識別性が低下するように変換して変換画像IM2を生成する変換ステップS20と、変換画像IM2と変換画像IM2において対象部分P1に対応する変換対象部分P2の情報とを、学習モデルMに学習させる対応関係として対応付けた学習用画像IM3を生成するものであり、変換対象部分P2の情報として基準画像IM1における対象部分P1の情報を用いる変換対象部分対応ステップS30とを含む。
【0051】
この構成によれば、変換画像IM2と変換対象部分P2の情報とを対応付ける際、変換対象部分P2の情報として、当該変換画像IM2よりも視認性の高い基準画像IM1における対象部分P1の情報を用いるため、変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0052】
本開示の第2態様に係る学習用画像生成方法は、第1態様において、変換画像IM2は、識別性が閾値よりも低い画像であり、基準画像IM1は、識別性が閾値よりも高い画像である。
【0053】
この構成によれば、変換画像IM2が閾値よりも識別性の低い画像であり、基準画像IM1が閾値よりも識別性の高い画像であるため、識別性の高い基準画像IM1において特定される対象部分P1の情報を、識別性の低い変換画像IM2に対応させることができるため、変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0054】
本開示の第3態様に係る学習用画像生成方法は、第1態様又は第2態様において、変換ステップS20では、基準画像IM1に外乱を付加することで識別性を低下させる。
【0055】
この構成によれば、基準画像IM1に外乱を付加して識別性を低下させた変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0056】
本開示の第4態様に係る学習用画像生成方法は、第1態様から第3態様のいずれかにおいて、基準画像IM1における対象部分P1の位置及び範囲を特定する特定ステップS10を更に含み、対応ステップS30では、特定ステップS10で特定された対象部分P1の位置及び範囲を対象部分P1の情報として変換画像IM2と対応付ける。
【0057】
この構成によれば、対象部分P1の位置及び範囲を変換対象部分P2の位置及び範囲として変換画像IM2と対応付けるため、対象部分P1と変換対象部分P2との対応付けを高精度に行うことができる。
【0058】
本開示の第5態様に係る学習用画像生成方法は、第1態様から第4態様のいずれかにおいて、基準画像IM1は、撮影装置によって撮影された画像である。
【0059】
この構成によれば、撮影装置によって撮影された基準画像IM1を変換した変換画像IM2について、変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0060】
本開示の第6態様に係る学習用画像生成装置100は、対象部分P1を含む基準画像IM1を識別性が低下するように変換して変換画像IM2を生成する変換部21と、変換画像IM2と変換画像IM2において対象部分P1に対応する変換対象部分P2の情報とを、学習モデルMに学習させる対応関係として対応付けた学習用画像IM3を生成するものであり、変換対象部分P2の情報として基準画像IM1における対象部分P1の情報を用いる対応部22とを備える。
【0061】
この構成によれば、変換画像IM2と変換対象部分P2の情報とを対応付ける際、変換対象部分P2の情報として、当該変換画像IM2よりも視認性の高い基準画像IM1における対象部分P1の情報を用いるため、変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0062】
本開示の第7態様に係る学習用画像生成プログラムは、対象部分P1を含む基準画像IM1を識別性が低下するように変換して変換画像IM2を生成する変換処理と、変換画像IM2と変換画像IM2において対象部分P1に対応する変換対象部分P2の情報とを、学習モデルMに学習させる対応関係として対応付けた学習用画像IM3を生成するものであり、変換対象部分P2の情報として基準画像IM1における対象部分P1の情報を用いる対応処理とをコンピュータに実行させる。
【0063】
この構成によれば、変換画像IM2と変換対象部分P2の情報とを対応付ける際、変換対象部分P2の情報として、当該変換画像IM2よりも視認性の高い基準画像IM1における対象部分P1の情報を用いるため、変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を生成することができる。
【0064】
本開示の第8態様に係る学習モデル生成方法は、第1態様から第6態様のいずれかの学習用画像生成方法により学習用画像IM3を生成する学習用画像IM3生成ステップと、生成した学習用画像IM3を学習モデルMに学習させる学習ステップとを含む。
【0065】
この構成によれば、変換画像IM2と変換対象部分P2との対応付けの精度が高い学習用画像IM3を用いて学習することにより、入力される画像に含まれる対象領域を高精度に推定可能な学習モデルMを得ることができる。
【符号の説明】
【0066】
10 入出力部
20 処理部
21 変換部
22 対応部
30 記憶部
100 学習用画像生成装置
200 学習処理装置
A1,A2 先行車両
A4 対象物
IM1 基準画像
IM2 変換画像
IM3 学習用画像
IM4 撮影画像
IM11,IM12 画像
M 学習モデル
P1,P4 対象部分
P2 変換対象部分
【要約】
【課題】画像に含まれる対象部分を抽出する学習モデルを生成するための学習用画像として、画像と対象部分との対応付けの精度が高い学習用画像を生成する。
【解決手段】学習用画像生成方法は、対象部分を含む基準画像を識別性が低下するように変換して変換画像を生成する変換ステップと、変換画像と変換画像において対象部分に対応する変換対象部分の情報とを、学習モデルに学習させる対応関係として対応付けた学習用画像を生成するものであり、変換対象部分の情報として基準画像における対象部分の情報を用いる対応ステップとを含む。
【選択図】図5
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11