【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 1. 集会(会議)による発表 集会名:コンピュータービジョンについてのヨーロッパ会議(イーシーシーブイ)2018 開催日:2018年9月12日 開催場所:ドイツ、ミュンヘン 2. 電気通信回線を通じての発表 掲載年月日:2018年10月5日 掲載アドレス: https://link.springer.com/book/10.1007/978−3−030−01240−3
【解決手段】画像生成装置の学習方法は、複数回の反復を含み、各反復は、実画像を第1の生成部に入力するステップS101と、画像変換部によって画像を生成するステップS102と、生成画像を識別部に入力するステップS103と、識別部から損失値を取得するステップS104と、画像分割部によって分割画像を生成するステップS105と、分割画像に対応した分割損失値を取得するステップS106と、生成画像を第2の生成部に入力するステップS107と、第2の生成部によって再構成画像を生成するステップS108と、再構成画像及び実画像に対応した再構成損失値を取得するステップS109と、を含む。
前記第1の路面特徴と前記第2の路面特徴とは、舗装材料の種類が互いに異なるか、または、異なった天候状況、及び時間帯のうちいずれか、または、これらの組み合わせにおいて異なる特徴を有する路面である、請求項1に記載の画像生成装置の学習方法。
【発明を実施するための形態】
【0009】
本開示は、画像生成装置の学習方法を提供する。学習された画像生成装置は、深層学習モデル(Deep Learning Model)による訓練画像(Training Images)を拡張するために用いられる。この深層学習モデルは、道路検知のための画像認識(Image Recognition)に適用することができる。
【0010】
このような訓練画像においては、深層学習モデルの性能を向上させるために、通常、多数の目標ラベルデータ(Target Labeling Data)が必要とされる。目標ラベルの種類としては、例えば、道路のラインマーク標示がある。ラインマークには、レーン線、停止線、側線等がある。目標ラベル(例えばラインマークの標示)付きの複数の訓練画像を学習させることで、深層学習モデルにより高い精度で容易に車線を検知できるようになる。更に、深層学習モデルの性能を向上させるためには、より一層多くの訓練画像を用いてもよい。
【0011】
本開示の一実施形態によれば、訓練画像を拡張するための画像生成装置は、敵対的訓練技術に基づいて学習を行ってもよい。画像生成装置の学習においては、画像生成装置は、最初の目標ラベル付き訓練画像が入力されると、同じシーンの別の種類の路面特徴(舗装材料、車線の種類、他の路面特徴等)を有する別の訓練画像を生成する。この生成された訓練画像も目標ラベルを有し、その位置は最初に入力された訓練画像の位置に対応した位置にある。本明細書において、「…の位置は…に対応した位置にある」、または他の同様の表現は、一般に2つの訓練画像間の「目標ラベル」のカテゴリとして分類されるピクセルが、同じ位置のピクセルであることを意味する。
【0012】
簡単に言えば、学習された画像生成装置においては、生成された訓練画像における目標ラベルの位置は、変化しないままである。すなわち、生成された訓練画像における目標ラベルの位置は、最初の訓練画像における目標ラベルの位置に対応する。これにより、同じシーン下で異なる路面特徴を有する複数の訓練画像を取得することができ、これらの訓練画像のうち、目標ラベルの位置は変化しないので、目標ラベルを再度ラベル付けする必要はない。これにより、同じシーンの下で異なる路面特徴を有する訓練画像の量を乗算することができる。
【0013】
図1は、本開示の一実施形態に係る生成装置学習システム100のブロック図である。一実施形態では、生成装置学習システム100は、
図1の上部に示すように、第1の生成部110の学習システムを含む。第1の生成部110の学習システムは、第1の生成部110、第2の生成部120、及び第1の識別部130を含む。第1の生成部110、第2の生成部120、及び第1の識別部130のうちの少なくとも1つは、CPU等の処理に集約することができる。例えば、第1の生成部110、第2の生成部120、及び第1の識別部130のうちの少なくとも1つは、ソフトウェア、ファームウェア、又は回路アーキテクチャであってもよい。
【0014】
第1の生成部110は、第1の路面特徴GF1を有する画像から第2の路面特徴GF2を有する別の画像を生成するために用いられる。一方、第2の生成部120は、第2の路面特徴GF2を有する画像から第1の路面特徴GF1を有する別の画像を生成するために使用されてもよい。
【0015】
第1の路面特徴GF1と第2の路面特徴GF2は、一実施例として、互いに舗装材料の種類が異なるものであってもよい。舗装材料の種類には、アスファルト舗装、セメント舗装、及びラインマークを施すことが可能な他の舗装等がある。具体例として、第1の路面特徴GF1は、アスファルト舗装であり、第2の路面特徴GF2は、セメント舗装であってもよい。他の実施例として、第1の路面特徴GF1と第2の路面特徴GF2は、天候及び時間帯、あるいはこれらの組み合わせによって異なるものであってもよい。天候及び時間帯には、日中、夜間、晴れ、雨、霧、及びこれらの組み合わせがあり、これらの状況下によって、路面の特徴は異なるものとなる。具体例として、第1の路面特徴GF1は、朝のアスファルト舗装の路面特徴を有する。第2の路面特徴GF2は、夕方のセメント舗装の特徴を有する。また、他の実施形態としては、第1の路面特徴GF1と第2の路面特徴GF2は、互いにラインマークの種類が異なるものであってもよい。ラインマークの種類には、二重実線の黄線、一重実線の黄線、鎖線の黄線、二重実線の白線、鎖線の白線、一重実線の赤線等がある。例えば、第1の路面特徴GF1は、二重実線の黄線であり、第2の路面特徴GF2は、鎖線の黄線であってもよい。以上の実施形態は、単に例示の目的で用いられ、本開示は上記の実施形態に限定されて解釈されないものとする。
【0016】
第1の生成部110の学習が完了した後、目標ラベル及び第1の路面特徴GF1を有する最初の訓練画像を第1の生成部110に入力することができる。第1の生成部110は、最初の訓練画像の第1の路面特徴GF1を第2の路面特徴GF2に変換し、別の訓練画像を生成することができる。生成された訓練画像はまた、目標ラベルを有し、その位置は、入力された最初の訓練画像の位置に対応する。まず、第1の生成部110の学習方法について以下に説明する。
【0017】
図2は、本開示の一実施形態に係る識別学習システム200のブロック図である。
図3は、一実施形態に係る画像生成装置の学習方法を示すフローチャートである。
図4Aは、本開示の一実施形態に係る第1の実画像GT1の概略図である。
図4Bは、本開示の一実施形態に係る第1の生成画像FK1の概略図である。
図4Cは、本開示の一実施形態に係る第1の分割画像SM1の概略図である。
【0018】
図1及び
図4Aを参照して、
図3を更に参照する。第1の生成部110の学習中に、複数回の反復が実行される。反復の回数(処理される画像の数)は、プロセッサのメモリサイズに依存してもよく、本明細書では特に限定されない。ステップS101〜S109は、予め設定された反復が終了するまで、各反復に対して繰り返される。各反復において、第1の損失値(ステップS104)、第1の分割損失値(ステップS106)、及び第1の再構成損失値(ステップS109)を取得する。
【0019】
まず、ステップS101に示すように、各反復において、第1の実画像GT1を第1の生成部110に入力する。ここで、第1の実画像GT1は、実際に道路上で撮影された画像であり、車両に搭載されたイメージセンサ(例えば、ドライブレコーダ)によって撮影されてもよい。第1の実画像GT1は、第1の路面特徴GF1を有する。更に、異なる反復において、異なる第1の実画像GT1を入力してもよいが、これらの第1の実画像GT1はすべて第1の路面特徴GF1を有する。本実施形態では、
図4Aに示すように、第1の路面特徴GF1として、二重実線の黄線が例示されている。
【0020】
図1及び
図4Bを参照して、
図3を更に参照する。ステップS102において、第1の生成画像FK1を生成し、第1の路面特徴GF1を第2の路面特徴GF2に変換するために、第1の生成部110の第1の画像変換部111によって、第1の実画像GT1への第1の画像変換処理を実行する。一実施形態では、
図4Bに示すように、第2の路面特徴GF2として、鎖線の黄線が例示されている。
【0021】
ステップS103では、第1の生成画像FK1を第1の識別部130に入力する。その後、ステップS104において、第1の識別部130からの第1の生成画像FK1に対応した第1の損失値を取得する。一実施形態では、第1の損失値は、式(1)に示す関数として表される。
【数1】
【0022】
式(1)において、Xは、第1の路面特徴GF1(二重実線の黄線)を有する画像(第1の実画像GT1)を示す。Yは、第2の路面特徴GF2(一点破線)を有する画像(生成画像FK1)を示す。G
x,tは、第1の生成部110の第1の画像変換部111を示す。第1の画像変換部111は、画像X(第1の実画像GT1)に対して、第1の画像変換処理T1を実行する役割を果たす。
【0023】
第1の識別部130の学習は、また、第1の生成部110の学習の複数回の反復中に対話式に実行されることに留意されたい。
図2の識別学習システム200の上部に示すように、第1の生成画像FK1及び第2の実画像GT2は、第1の識別部130に入力される。第1の生成画像FK1及び第2の実画像GT2は、いずれも第2の路面特徴GF2(鎖線の黄線)を有しており、第1の生成画像FK1が第1の生成部110から生成された画像であり、第2の実画像GT2が実際に道路上で撮影された画像である点が異なる。第1の識別部130の学習は、1つの破線の黄線を有する第1の生成画像FK1と、実際の1つの破線の黄線を有する第2の実画像GT2との間に差があるかどうかを判定することを目的とする。入力画像が第2の実画像GT2である場合、第1の識別部130が、1に近い結果(すなわちD
Y)を出力することが望まれる。入力画像が第1の生成画像FK1である場合、第1の識別部130が、0に近い結果(すなわちD
Y(G
x,t(x)))を出力することが望ましい。したがって、第1の識別部130の学習のためには、式(1)を最大にすることが望ましい。
【0024】
一方、第1の生成部110の第1の画像変換部111については、第1の識別部130の出力結果(すなわちD
Y(G
x,t(x)))が、1に近いことが望まれる。したがって、第1の生成部110の第1の画像変換部111では、複数回の反復の後、式(1)の後の部分ができるだけ小さい値となることが望まれる。第1の生成部110の第1の画像変換部111と、第1の識別部130とは互いに対比され、これら第1の画像変換部111及び第1の識別部130に要求される最適化目標は、以下の式(2)に示される。
【数2】
【0025】
また、ステップS104において、第1の生成画像FK1と第2の実画像GT2との差分を比較することにより、式(1)に従って第1の識別部130から第1の損失値を求めてもよい。複数回の反復の後、複数の第1の損失値が取得されてもよい。最後に、式(2)が最適化目標となるように、第1の生成部110のネットワークパラメータを更新する(ステップS122)。
【0026】
図1及び
図4Cを参照して、
図3を更に参照する。ステップS105において、第1の分割画像SM1が生成するために、第1の生成部110の第1の画像分割部112によって、第1の実画像GT1に対して、第1の画像分割処理S1を実行する。
【0027】
その後、ステップS106において、第1の分割画像SM1に対応した第1の分割損失値を取得する。
【0028】
一実施形態では、第1の分割損失値は、式(3)に示す関数として表される。
【数3】
【0029】
式(3)において、G
X,sは、第1の生成部110の第1の画像分割部112を示す。第1の画像分割部112は、画像X(第1の実画像GT1)に対して、第1の画像分割処理S1を実行する役割を果たす。Y
Sは、第1の実画像GT1のための画像分割の地表データを示す。
【0030】
更に、ステップS106において、第1の分割画像SM1を、第1の実画像GT1に対する画像分割の地表データと比較することにより、第1の分割損失値を取得する。すなわち、第1の分割損失値は、第1の実画像GT1についての第1の分割画像SM1と画像分割の地表データとの間の差を表すことができる。画像が、第1の生成部110の第1の画像分割部112によって、より良好に分割されるほど、損失値はますます小さくなる。例えば、
図4Cに示されるように、第1の画像分割部112が理想的なモデルであると仮定すると、第1の画像分割処理S1の後、第1の分割画像SM1は、ラインマークLと運転可能領域FSとに分割されてもよい。複数回の反復の後、複数の第1の分割損失値を得ることができる。最後に、第1の分割損失値を最小化することが、第1の生成部110のネットワークパラメータを更新する目標となる(ステップS122)。
【0031】
図1及び
図4Bを参照して、
図3を更に参照する。ステップS107では、第1の生成画像FK1が第2の生成部120に入力される。
【0032】
次に、ステップS108において、第2の生成部120によって、第1の生成画像FK1に対して第2の画像変換処理T2が実行され、第1の再構成画像FK3が生成され、第2の路面特徴GF2が第1の路面特徴GF1に変換される。
【0033】
その後、ステップS109において、第1の再構成画像FK3及び第1の実画像GT1に対応した第1の再構成損失値を取得する。
【0034】
一実施形態では、第1の再構成損失値は、以下の式(4)に示す関数として表される。
【数4】
【0035】
式(4)において、G
y,tは、第2の生成部120のうち、画像Y(第2の路面特徴GF2を有する画像、ここでは第1の生成画像FK1)に対して、第2の画像変換処理T2を実行する部分を示す。
【0036】
更に、ステップS109において、第1の再構成画像FK3と第1の実画像GT1とを比較することによって、第1の再構成損失値を取得する。すなわち、第1の再構成損失値は、第1の再構成画像FK3と第1の実画像GT1との比較結果を表す。第1の再構成画像FK3(すなわち、G
y,t(G
x,t(x)))と第1の実画像GT1との間の差が非常に小さい場合、第1の生成画像FK1と第1の実画像GT1との間の差を制限することができる。複数回の反復の後、複数の第1の再構成損失値を得ることができる。最後に、第1の再構成損失値を最小化することが、第1の生成部110及び第2の生成部120のネットワークパラメータ(Network Parameters)を更新する目標となる(ステップS122)。
【0037】
次に、
図3を参照すると、ステップS110に示すように、すべての反復が実行されたか否かを判定する。すべての反復が実行されていない場合、ステップS101〜S109を反復する。すべての反復が実行された場合、ステップS121を実行する。
【0038】
ステップS121では、第1の画像変換部111と第1の画像分割部112との間のネットワーク重み(Network Weights)の差を比較することにより、第1の類似性損失値を取得する。
【0039】
本実施形態では、第1の類似性損失値は、式(5)に示す関数として表される。
【数5】
【0040】
式(5)において、ω
x,tは、第1の生成部110の第1の画像変換部111のネットワーク重みベクトルである。ω
x,sは、第1の生成部110の第1の画像分割部112のネットワーク重みベクトルである。
【0041】
更に、ステップS121において、第1の画像変換部111と第1の画像分割部112との間の類似性は、第1の生成部110の第1の画像変換部111と第1の生成部110の第1の画像分割部112との間のネットワーク重みの差を比較することにより取得される。いわゆる「類似性」は、2つの分岐間の重みベクトルのコサイン類似度として表される。2つの重みベクトルω
x,tとω
x,sとが非常に類似している場合(すなわち、2つの分岐間のネットワーク重みをできる限り一致するように、2つの重みベクトルの間の角度を小さくしている場合)、損失値をより小さくできる。これにより、第1の画像分割部112は、第1の画像変換処理T1の間、第1の画像変換部111を導いて、画像内のターゲット構造をできるだけ多く維持することができる。本開示は、生成された訓練画像における目標ラベルの位置が最初の訓練画像における目標ラベルの位置に対応するように、画像における目標ラベルの位置を変化させないように維持することを目的とする。
【0042】
次に、ステップS122において、第1の生成部110及び第2の生成部120のネットワークパラメータが、第1の損失値(ステップS104)、第1の分割損失値(ステップS106)、第1の再構成損失値(ステップS109)、及びすべての反復において得られた第1の類似性損失値(ステップS121)に応じて更新され、その後、画像生成装置の学習が1回だけ終了する。他の実施形態では、
図3に示されるようなステップは、画像生成装置の学習を終了するために、何度も(例えば、数千または数万回)実行されてもよい。したがって、第1の生成部110の第1の画像変換部111は、画像生成部として使用することができる。第1の画像変換部111は、第1の路面特徴GF1を有する最初の訓練画像から、第2の路面特徴GF2を有する別の訓練画像を生成するように適合される。また、変換前後の2つの訓練画像における目標ラベルの位置は対応している。
【0043】
例えば、
図5A及び
図5Bを参照するように、上述した第1の生成部110の学習後に、最初の訓練画像Ti_1を第1の生成部110に入力する。最初の訓練画像Ti1は、目標ラベル(例えば、ラインマークLLのラベル)と、第1の路面特徴GF1(例えば、二重実線の黄線)とを有する。第1の生成部110の第1の画像変換部111は、最初の訓練画像Ti_1の第1の路面特徴GF1を第2の路面特徴GF2(例えば、鎖線の黄線)に変換し、生成された訓練画像Ti_2を生成することができる。学習された第1の画像変換部111と学習された第1の画像分割部112との間のネットワーク重みは、十分に近似されるものである。このため、最初の訓練画像Ti_1に対して実行される第1の画像変換処理T1の間に、第1の画像変換部111は、第1の画像分割部112による作用を受ける。これにより、生成された訓練画像Ti_2内のラインマークLLのラベルの位置を最初の訓練画像Ti_1内のラベルの位置に一致させることができ、ラインマークLLのラベルの位置は画像変換の前後で変化しない。
【0044】
図1を参照すると、別の実施形態では、生成装置学習システム100は、第1の生成部110の学習システムを含み、第2の生成部120の学習システムを更に含む。第2の生成部120の学習システムは、第2の生成部120、第1の生成部110、及び第2の識別部140を含む。第2の生成部120、第1の生成部110、及び第2の識別部140のうちの少なくとも1つは、CPU等の処理に統合することができる。例えば、第2の生成部120、第1の生成部110、及び第2の識別部140の少なくとも一つは、ソフトウェア、ファームウェア、又は回路アーキテクチャであってもよい。ここで、第2の生成部120は、第2の画像変換部121を含む。
【0045】
図6A及び
図6Bは、本開示の別の実施形態に係る画像生成装置の学習方法を示すフローチャートである。別の本実施形態では、画像を生成するための第2の生成部120の能力を確実にするために、第1の生成部110(
図6AのステップS101〜S110に示される)の学習に加えて、第2の生成部120(
図6BのステップS111〜S114及びS117〜S120に示される)の学習も、同様に行う。第1の生成部110及び第2の生成部120の学習が完了した後、第1の生成部110の第1の画像変換部111を画像生成装置として使用することができる。
【0046】
図6AのステップS101〜S110は、
図3のステップS101〜S110と同じであり、ここでは説明を繰り返さない。以下、第2の生成部120の学習方法について、更に説明する。
【0047】
図7Aは、本開示の別の実施形態に係る第2の実画像GT2の概略図である。
図7Bは、本開示の別の実施形態に係る第2の生成画像FK2の概略図である。
【0048】
図1及び
図7Aを参照して、
図6Bを更に参照する。第2の生成部120の学習の間、複数回の反復を実行する。反復の回数は、プロセッサのメモリサイズに依存することができ、本明細書では特に限定されない。ステップS111〜S114及びS117〜S119は、予め設定された反復を終了するまで、各反復に対して繰り返される。各反復において、第2の損失値(ステップS114)、及び第2の再構成損失値(ステップS119)を取得する。
【0049】
ステップS111に示すように、各反復において、第2の実画像GT2が第2の生成部120に入力される。第2の実画像GT2は、第2の路面特徴GF2を有する。更に、異なる反復において、異なる第2の実画像GT2が入力されてもよいが、これらの第2の実画像GT2はすべて第2の路面特徴GF2を有する。本実施形態では、
図7Aに示すように、第2の路面特徴GF2として、鎖線の黄線が例示されている。
【0050】
図1及び
図7Bを参照して、
図6Bを更に参照する。ステップS112では、第2の生成部120の第2の画像変換部121によって、第2の実画像GT2に対して第2の画像変換処理T2を実行することにより、第2の生成画像FK2を生成し、第2の路面特徴GF2を第1の路面特徴GF1に変換する。本実施形態では、
図7Bに示すように、第1の路面特徴GF1として、二重実線の黄線が例示されている。
【0051】
ステップS113では、第2の生成画像FK2を第2の識別部140に入力する。その後、ステップS114では、第2の識別部140から第2の生成画像FK2に対応した第2の損失値を取得する。
【0052】
第2の損失値を取得する方法は、第1の損失値と同様であり、ここでは繰り返さない。更に、第2の識別部140の学習も、第2の生成部120を学習させる複数回の反復中に実行される。
図2の識別学習システム200の下部に示すように、第2の生成画像FK2及び第1の実画像GT1は、第2の識別部140に入力される。第2の生成画像FK2及び第1の実画像GT1は、ともに第1の路面特徴GF1(二重実線の黄線)を有しており、第2の生成画像FK2が第2の生成部120から生成された画像であり、第1の実画像GT1が実際に道路上で撮影された画像である点が異なる。第2の識別部140の学習は、二重実線の黄線を有する第2の生成画像FK2と、二重実線の黄線を有する第1の実画像GT1との間に差があるかどうかを判定することを目的とする。
【0053】
図1及び
図7Bを参照して、
図6Bを更に参照する。ステップS117では、第2の生成画像FK2を第1の生成部110に入力する。
【0054】
次に、ステップS118において、第1の生成部110の第1の画像変換部111によって、第2の生成画像FK2に対して第1の画像変換処理が実行され、第2の再構成画像FK4が生成され、第1の路面特徴GF1が第2の路面特徴GF2に変換される。
【0055】
その後、ステップS119では、第2の再構成画像FK4及び第2の実画像GT2に対応した第2の再構成損失値を取得する。
【0056】
第2の再構成損失値を得る方法は、第1の再構成損失値と同様であり、ここでは説明を繰り返さない。
【0057】
次に、ステップS120に示すように、予め設定された反復が終了したか否かを判定する。そうでない場合、ステップS111〜S114及びS117〜S119を繰り返す。予め設定された反復が終了すると、
図6Aの「A」に進む。
【0058】
図6Aを参照すると、「A」はステップS110に続く。すなわち、ステップS121が実行される。
【0059】
図3のステップS121と同様に、第1の画像変換部111と第1の画像分割部112の間のネットワーク重みの差を比較することにより、第1の類似性損失値を取得する。ここでは、再び説明を繰り返さない。
【0060】
その後、ステップS222が実行される。ステップS222において、各ステップにて取得された、第1の損失値(ステップS104)、第1の分割損失値(ステップS106)、第1の再構成損失値(ステップS109)、第2の損失値(ステップS144)、第2の再構成損失値(ステップS119)及び第1の類似性損失値ステップ(S121)に応じて、第1の生成部110と第2の生成部120との間のネットワークパラメータを更新する。以上により、画像生成装置の学習を一度で終了する。他の実施形態では、
図6A及び
図6Bに示されるような各ステップを、複数回(例えば、数千回または数万回)実行した後に、画像生成装置の学習を終了するようにしてもよい。このように、第1の生成部110の第1の画像変換部111は、画像生成装置として用いられる。第1の画像変換部111は、第1の路面特徴GF1を有する最初の訓練画像から、第2の路面特徴GF2を有する別の訓練画像を生成するように適合される。また、変換前後の2つの訓練画像における目標ラベルの位置は対応している。
【0061】
図1を参照すると、更に別の実施形態では、生成装置学習システム100は、第1の生成部110の学習システムと、第2の生成部120の学習システムとを含む。第2の生成部120は、第2の画像分割部122を更に含む。
【0062】
図8A及び
図8Bは、本開示の更に別の実施形態に係る画像生成装置を学習方法を示すフローチャートである。更に別の実施形態では、第1の生成部110(
図8AのステップS101〜S110参照)の学習に加えて、第2の生成部120(
図8BのステップS111〜S120参照)の学習も、同様に行われる。第1の生成部110及び第2の生成部120の学習が完了した後、第1の生成部110の第1の画像変換部111を画像生成装置として使用することができるだけでなく、第2の生成部120の第2の画像変換部121が、別の画像生成装置として用いられてもよい。
【0063】
図8AのステップS101〜S110は、
図3のステップS101〜S110と同じであり、
図8BのステップS111〜S114及びS117〜S119は、
図6BのステップS111〜S114及びS117〜S119と同じであり、ここでは説明を繰り返さない。
【0064】
図9は、本開示の更に別の実施形態による第2の分割画像SM2の概略図である。
図1及び
図9、更に
図8Bを参照する。第2の生成部120の学習は、ステップS115及びステップS116を更に含む。
【0065】
ステップS115において、第2の生成部120の第2の画像分割部122によって、第2の実画像GT2に対して、第2の分割画像SM2を生成する第2の画像分割処理S2を実行する。
【0066】
その後、ステップS116において、第2の分割画像SM2に対応した、第2の分割損失値を取得する。
【0067】
第2の分割損失値を取得する方法は、第1の分割損失値の取得方法と同様であり、ここでは再び説明を繰り返さない。
図9に示されるように、第2の画像分割部122が理想的なモデルであると仮定すると、第2の画像分割処理S2の後、第2の分割画像SM2は、ラインマークLと運転可能領域FSとに分割されてもよい。
【0068】
すべての反復が行われるとすると、
図8Aの「B」に進む(
図8Bを参照)。すなわち、ステップS321を実行する(
図8A参照)。
【0069】
ステップS321において、第1の画像変換部111と第1の画像分割部112との間のネットワーク重みの差が比較することにより、第1の類似性損失値を取得する。更に、第2の画像変換部121及び第2の画像分割部122のネットワーク重みの差を比較することにより、第2の類似性損失値を取得する。
【0070】
第2の類似性損失値を取得する方法は、第1の類似性損失値の取得方法と同様であり、ここでは再び説明を繰り返さない。
【0071】
次に、ステップS322において、前記反復の全てのステップにおいて取得した、第1の損失値(ステップS104)、第1の分割損失値(ステップS106)、第1の再構成損失値(ステップS109)、第2の損失値(ステップS144)、第2の分割損失値(ステップS116)、第2の再構成損失値(ステップS119)、第1の類似性損失値ステップS321)、及び第2の類似性損失値(ステップS321)に応じて、第1の生成部110と第2の生成部120との間のネットワークパラメータを更新することにより、画像生成装置の学習を一度で終了させる。他の実施例では、
図8A及び
図8Bに示すステップを、数多く(例えば、数千回や数万回)実行してもよい。したがって、第1の生成部110の第1の画像変換部111を画像生成装置として使用することができ、第2の生成部120の第2の画像変換部121を別の画像生成装置として使用することもできる。第1の画像変換部111は、第1の路面特徴GF1を有する最初の訓練画像から、第2の路面特徴GF2を有する別の訓練画像を生成するように適合され、変換前後の2つの訓練画像における目標ラベルの位置は、互いに対応する。更に、第2の画像変換部121は、第2の路面特徴GF2を有する最初の訓練画像から、第1の路面特徴GF1を有する別の訓練画像を生成するように適合され、変換の前後の2つの訓練画像における目標ラベルの位置は、互いに対応する。
【0072】
例えば、
図5A、
図5B、
図10A、及び
図10Bを参照すると、上述したような第1の生成部110及び第2の生成部120の学習の後、最初の訓練画像Ti_1(
図5A)を第1の生成部110に入力することができる。最初の訓練画像Ti_1は、目標ラベル(例えば、ラインマークLLの標示)と、第1の路面特徴GF1(例えば、二重実線の黄線)とを有する。第1の生成部110の第1の画像変換部111は、最初の訓練画像Ti_1の第1の路面特徴GF1を第2の路面特徴GF2(例えば、鎖線の黄線)に変換し、生成された訓練画像Ti_2を生成できる。
【0073】
一方、最初の訓練画像Ti_3(
図10A)も第2の生成部120に入力される。最初の訓練画像Ti_3は、目標ラベル(例えば、ラインマークLLの標示)と、第2の路面特徴GF2(例えば、鎖線の黄線)とを有する。第2の生成部120の第2の画像変換部121は、最初の訓練画像Ti_3の第2の路面特徴GF2を第1の路面特徴GF1(例えば、二重実線の黄線)に変換し、生成された訓練画像Ti_4を生成できる。
【0074】
学習後の第1の生成部110及び第2の生成部120について、第1の画像変換部111と、第1の生成部110の第1の画像分割部112との間のネットワーク重みは、十分に類似しており、第2の生成部120の第2の画像変換部121及び第2の画像分割部122のネットワーク重みは十分に類似しているので、最初の訓練画像Ti_1への第1の画像変換処理T1中に、前記第1の画像変換部111は前記第1の画像分割部112から影響を受け、最初の訓練画像Ti_3への第2の画像変換処理T2中に、前記第2の画像変換部121は前記第2の画像分割部122から影響を受け得る。したがって、生成された訓練画像Ti_2、Ti_4内のラインマークLLのラベルの位置は、最初の訓練画像Ti_1、Ti_3内のラベルの位置に対応することができ、ラインマークLLのラベルの位置は、画像変換の前後で変化しないことができる。
【0075】
開示された実施形態に対して様々な修正及び変形を行うことができることは、当業者には明らかである。明細書及び実施例は、例示的なものとしてのみ考慮されることが意図されており、開示の真の範囲は、以下の特許請求の範囲及びそれらの均等物によって示されることが意図されている。