(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023146041
(43)【公開日】2023-10-12
(54)【発明の名称】機械学習システム
(51)【国際特許分類】
G06V 10/774 20220101AFI20231004BHJP
G06T 19/00 20110101ALI20231004BHJP
G06T 7/00 20170101ALI20231004BHJP
【FI】
G06V10/774
G06T19/00 A
G06T7/00 350B
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022053024
(22)【出願日】2022-03-29
(11)【特許番号】
(45)【特許公報発行日】2022-09-21
(71)【出願人】
【識別番号】513087677
【氏名又は名称】PCIソリューションズ株式会社
(74)【代理人】
【識別番号】110000800
【氏名又は名称】デロイトトーマツ弁理士法人
(72)【発明者】
【氏名】澤戸 寛明
(72)【発明者】
【氏名】古賀 淳也
(72)【発明者】
【氏名】島山 求
【テーマコード(参考)】
5B050
5L096
【Fターム(参考)】
5B050AA03
5B050BA09
5B050CA01
5B050EA26
5B050FA05
5L096CA18
5L096EA03
5L096EA35
5L096FA09
5L096FA66
5L096FA69
5L096HA11
5L096KA04
5L096KA15
(57)【要約】 (修正有)
【課題】3次元仮想空間を利用して多数の学習用データを容易に作成する機械学習システムを提供する。
【解決手段】機械学習システム1は、3次元仮想空間・生成描画手段10、AI認識対象物・情報生成描画手段20、3次元仮想空間・シーン生成描画手段30、機械学習用データ生成手段40、AIモデル機械学習手段50及び機械学習済みモデル実行手段60を備える。AI認識対象物・情報生成描画手段20は、3次元仮想空間における認識対象物の特徴点の3次元空間情報を生成するAI認識対象物特徴点・3次元空間情報生成機能と、3次元空間情報を参照し、3次元仮想空間の指定された位置にAI認識対象物の3次元空間情報(マーカ)を配置、描画するマーカ配置・描画機能と、AI認識対象物の2次元画像上の位置情報(ランドマーク)を生成するAI認識対象物特徴点・2次元画像位置情報生成機能を有している。
【選択図】
図1
【特許請求の範囲】
【請求項1】
3次元CGにより、物体を3次元仮想空間に生成して描画する3次元仮想空間・生成描画手段と、
3次元CGにより、前記3次元仮想空間にAIモデルの認識対象物に関する情報を生成して描画するAI認識対象物・情報生成描画手段と、
3次元CGにより、前記3次元仮想空間と前記認識対象物の少なくとも一方の設定を変更することで様々なシーンを生成して描画する3次元仮想空間・シーン生成描画手段と、
前記3次元仮想空間・シーン生成描画手段で生成された前記認識対象物を含むCG画像と、前記AI認識対象物・情報生成描画手段で生成された前記認識対象物に関する情報から前記AIモデルの機械学習に必要な学習用データを生成する機械学習用データ生成手段と、
前記機械学習用データ生成手段によって生成された前記学習用データを用いて、前記AIモデルの学習を行うAIモデル機械学習手段と、
前記AIモデル機械学習手段によって学習された学習済みモデルを用いて、前記AIモデルによる処理を実行するAI機械学習済みモデル実行手段と、を備え、
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間における前記認識対象物の特徴点の3次元空間情報を生成する3次元空間情報生成機能と、
前記3次元空間情報を参照し、前記3次元仮想空間の指定された位置に前記認識対象物の3次元空間情報を配置、描画する3次元空間情報配置描画機能と、
前記3次元空間情報配置描画機能によって描画された前記認識対象物の2次元画像上の位置情報を生成する2次元画像位置情報生成機能と、
を有することを特徴とする機械学習システム。
【請求項2】
前記2次元画像位置情報生成機能は、
前記3次元仮想空間の指定された位置に単色のテクスチャ画像を有する平面であるランドマークを配置して前記ランドマークを第1色で描画し、前記ランドマーク以外の部分を前記第1色とは異なる第2色で描画するランドマーク・背景単色描画機能と、
前記ランドマーク・背景単色描画機能によって描画された画像から、画像処理により前記第1色で描画された領域を抽出する指定色領域抽出機能と、
前記指定色領域抽出機能によって抽出された領域の輪郭と重心座標を取得する指定色領域重心座標取得機能と、で構成される、請求項1に記載の機械学習システム。
【請求項3】
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間内の一領域を参照して、前記一領域内を区画する複数の特徴点の3次元空間情報を生成し、
前記3次元空間情報を参照して、前記3次元仮想空間の指定された位置に、前記認識対象物のテクスチャ画像を有するマーカ及び単色のテクスチャ画像を有する平面であるランドマークを配置、描画する、請求項1又は2に記載の機械学習システム。
【請求項4】
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間内の一領域を参照して、前記一領域の一方向の中心線を決定し、前記中心線上の前記3次元仮想空間の原点から指定距離だけ離れた前記中心線上の複数の特徴点の3次元空間情報を生成し、
前記3次元空間情報を参照して、前記3次元仮想空間の指定された位置に単色のテクスチャ画像を有する平面であるランドマークを配置、描画する、請求項1又は2に記載の機械学習システム。
【請求項5】
前記AI機械学習済みモデル実行手段は、
前記マーカを認識することにより前記特徴点の2次元画像上の位置を推定し、前記特徴点同士を結んで前記2次元画像上の境界線を形成する、請求項3に記載の機械学習システム。
【請求項6】
前記AI機械学習済みモデル実行手段は、
前記3次元仮想空間内の一領域を認識し、前記一領域内において前記原点から指定距離だけ離れた前記複数の特徴点の2次元画像上の位置を推定する、請求項4に記載の機械学習システム。
【請求項7】
前記AI機械学習済みモデル実行手段は、
前記複数の特徴点から構成される補完曲線を生成し、前記補完曲線から前記一領域内における前記特徴点の間の距離を推定する、請求項6に記載の機械学習システム。
【請求項8】
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間内の一領域を参照して、前記一領域の一方向の中心線を決定し、前記中心線上の前記3次元仮想空間の原点から指定距離だけ離れた前記中心線上の複数の第1特徴点と、前記原点から最も近い前記第1特徴点に対して前記中心線と直交する方向に配置された複数の第2特徴点と、前記原点から最も遠い前記第1特徴点に対して前記中心線と直交する方向に配置された複数の第3特徴点との3次元空間情報を生成し、
前記3次元空間情報を参照して、前記3次元仮想空間の指定された位置に単色のテクスチャ画像を有する平面であるランドマークを配置、描画する、請求項1又は2に記載の機械学習システム。
【請求項9】
前記AI認識対象物・情報生成描画手段は、前記原点から最も遠い前記第1特徴点と前記第3特徴点とを囲む領域を切り取って拡大した拡大画像を生成し、
前記AI機械学習済みモデル実行手段は、前記拡大画像を用いて前記AIモデルによる処理を実行する、請求項8に記載の機械学習システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習用のデータを作成する機械学習システムに関する。
【背景技術】
【0002】
従来、距離センサ等を用いて道路上を走行する車両の接近、離反を認識することができる認識装置が知られている。具体的には、カメラやライダー装置を利用して実空間上でデータ収集を行う。さらに、このデータに基づいて機械学習用データを作成して教師データとしてAIモデルに与え、機械学習をさせる。
【0003】
例えば、特許文献1の車両システムは、カメラと、レーダ装置と、ライダーと、物体認識装置と、通信装置と、HMI(Human Machine Interface)と、車両センサと、ナビゲーション装置と、MPU(Map Positioning Unit)と、運転操作子と、自動運転制御装置と、走行駆動力出力装置と、ブレーキ装置と、ステアリング装置を備えている。
【0004】
自動運転制御装置の認識部(第1制御部)は、物体認識装置から取得したカメラ画像を第1学習済みモデルに入力し、車両の周辺にある物体の位置及び速度、加速度等の状態や、車両が走行している車線(走行車線)を示す第1結果を取得する。また、認識部は、物体認識装置から取得したライダー画像を第2学習済みモデルに入力し、車両の周辺にある物体の位置及び速度、加速度等の状態や車線を示す第2結果を取得する。
【0005】
認識部は、第1結果と第2結果とをセンサフュージョン処理することで、車両の周辺にある物体の位置及び速度、加速度等の状態や車線を認識することができる(特許文献1/段落0018,0046、
図8)。
【0006】
また、特許文献2(ウェブサイト)は、1台のフロントカメラから得たデータを機械学習に用いる技術が開示されている。ディープニューラルネットワークは、レーダとライダーのデータをディープラーニングの教師情報として用いることにより、物体までの距離を予測するトレーニングを行う。レーダとライダーから送信された信号を直接反映することで、道路のトポロジーに関わらず物体までの厳密な距離情報を得ることができる。
【先行技術文献】
【特許文献】
【0007】
【非特許文献】
【0008】
【非特許文献1】距離の予測:予測精度を向上させるシステムの開発(NVIDIA,2019.7.11) [令和4年3月28日検索],インターネット<URL:https://blogs.nvidia.co.jp/2019/07/11/drive-labs-distance-to-object-detection/>
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、特許文献1,2の方法は、ライダー装置や距離センサが高価であるため、システム全体のコストが高くなるという問題がある。さらに、実空間上で学習用データの元となるデータを数多く収集する必要があるため、手間、時間がかかっていた。
【0010】
本発明は、このような事情に鑑みてなされたものであり、3次元仮想空間を利用して機械学習システムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上記目的を達成するため、本発明の機械学習システムは、
3次元CGにより、物体を3次元仮想空間に生成して描画する3次元仮想空間・生成描画手段と、3次元CGにより、前記3次元仮想空間にAIモデルの認識対象物に関する情報を生成して描画するAI認識対象物・情報生成描画手段と、3次元CGにより、前記3次元仮想空間と前記認識対象物の少なくとも一方の設定を変更することで様々なシーンを生成して描画する3次元仮想空間・シーン生成描画手段と、前記3次元仮想空間・シーン生成描画手段で生成された前記認識対象物を含むCG画像と、前記AI認識対象物・情報生成描画手段で生成された前記認識対象物に関する情報から前記AIモデルの機械学習に必要な学習用データを生成する機械学習用データ生成手段と、前記機械学習用データ生成手段によって生成された前記学習用データを用いて、前記AIモデルの学習を行うAIモデル機械学習手段と、前記AIモデル機械学習手段によって学習された学習済みモデルを用いて、前記AIモデルによる処理を実行するAI機械学習済みモデル実行手段と、を備え、
前記AI認識対象物・情報生成描画手段は、前記3次元仮想空間における前記認識対象物の特徴点の3次元空間情報を生成する3次元空間情報生成機能と、前記3次元空間情報を参照し、前記3次元仮想空間の指定された位置に前記認識対象物の3次元空間情報を配置、描画する3次元空間情報配置描画機能と、前記3次元空間情報配置描画機能によって描画された前記認識対象物の2次元画像上の位置情報を生成する2次元画像位置情報生成機能と、を有することを特徴とする。
【0012】
本発明の機械学習システムは、3次元仮想空間・生成描画手段と、AI認識対象物・情報生成描画手段と、3次元仮想空間・シーン生成描画手段と、機械学習用データ生成手段と、AIモデル機械学習手段と、AI機械学習済みモデル実行手段を備えている。
【0013】
AI認識対象物・情報生成描画手段は、3次元空間情報生成機能により、3次元仮想空間において認識対象物の特徴点の3次元空間情報を生成する。次に、3次元空間情報配置描画機能により、3次元仮想空間の指定された位置に認識対象物の3次元空間情報を配置、描画する。3次元空間情報が配置された3次元仮想空間のCG画像は、学習用データ(画像データ)として用いられる。
【0014】
次に、AI認識対象物・情報生成描画手段は、2次元画像位置情報生成機能により、3次元空間情報配置描画機能によって描画された認識対象物の2次元画像上の位置情報を生成する。この位置情報は、学習用データ(教師数値データ)として用いられる。
【0015】
AIモデル機械学習手段は、上記処理により生成された多数の学習用データ(画像データと教師数値データの組合せ)を用いてAIモデルを学習させる。そして、AI機械学習済みモデル実行手段は、学習によって得られた学習済みモデルを用いて、AIモデルによる処理を実行する。この機械学習システムは、上記の一連の処理を3次元仮想空間上で実行可能であるため、多数の学習用データを容易に作成することができる
【図面の簡単な説明】
【0016】
【
図1】第1実施形態に係る機械学習システムの全体構成図である。
【
図2】3次元仮想空間(道路、背景等)の透視変換画像を示す図である。
【
図3】テクスチャ平面の3次元仮想空間への配置を説明する図である。
【
図4】
図2の3次元仮想空間上の特徴点の座標を示す図である。
【
図5】
図4の特徴点の位置にマーカを配置した図である。
【
図6】
図4の特徴点の位置にランドマークを配置した図である。
【
図7】
図6の各ランドマークの重心座標を示す図である。
【
図8】機械学習システムによるAIモデルの実行結果を示す図である。
【
図9】移動体を認識する他のAIモデルの実行結果を示す図である。
【
図10】第2実施形態に係る3次元仮想空間(道路)の透視変換画像を示す図である。
【
図11】
図10の3次元仮想空間上の特徴点の座標を示す図である。
【
図12】
図11の特徴点の位置にランドマークを配置した図である。
【
図13】3次元仮想空間上の距離情報の利用例を説明する図である。
【
図14】移動体を認識する他のAIモデルの実行結果を示す図である。
【
図15】補完曲線(パラメトリック関数)を説明する図である。
【
図16】第3実施形態に係る3次元仮想空間上の特徴点の座標を示す図である。
【
図17】
図16の特徴点の位置にランドマークを配置した図である。
【
図18】3次元仮想空間上の仮想走行レーンの例を示す図である。
【
図19】AIモデルによる道路の縁端領域に存在する移動体の認識を説明する図である。
【
図20】AIモデルによる3次元仮想グリッドを用いた移動体の認識を説明する図である。
【発明を実施するための形態】
【0017】
以下では、本発明の好ましい実施形態について説明するが、これらを適宜改変し、組合せてもよい。以下の説明及び添付図面において、実質的に同一又は等価な部分には同一の参照符号を付して説明する。
【0018】
[第1実施形態]
図1は、本発明の第1実施形態に係る機械学習システムの全体構成を示している。
図1において、白矢印は画像情報の流れを示し、黒矢印はAIモデルの機械学習の際、教師データ(正解情報)となる数値情報の流れを示している。以下では、適宜
図2~
図9を参照して説明を補足する。
【0019】
図1に示すように、機械学習システム1は、3次元仮想空間・生成描画手段10と、AI認識対象物・情報生成描画手段20と、3次元仮想空間・シーン生成描画手段30と、機械学習用データ生成手段40と、AIモデル機械学習手段50と、機械学習済みモデル実行手段60とを備えている。
【0020】
[3次元仮想空間・生成描画手段10]
3次元仮想空間・生成描画手段10は、3次元CG(Computer Graphics)により3次元仮想空間に物体を生成し、描画する。ここでいう「物体」とは、道路、車両、車線、ガードレール、道路標識、背景(山、建物、木々等)のことをいう。
【0021】
図2は、3次元仮想空間のある視点をカメラで撮像したときの透視変換画像(CG画像)を示している。透視変換画像は3次元仮想空間・生成描画手段10により作成され、3次元仮想空間上には直線状の道路の他、背景としての草原や山々等が描画されている。
【0022】
3次元仮想空間を生成するため、例えば、3次元CGの標準ソフトウェアである“OpenGL(登録商標)”を使用する。“OpenGL”は、テクスチャ画像を四角形ポリゴンにマッピングしたテクスチャ平面を生成する。さらに、“OpenGL”は、3次元仮想空間上において、生成したテクスチャ平面を任意の位置に配置し、移動、回転、拡大縮小等を行うことができる。なお、このような3次元仮想空間を生成する手段は他にも様々なものがあるため、上述のテクスチャ平面を配置する手法に限られるものではない。
【0023】
具体例は後述するが、“OpenGL”によりテクスチャ画像(パイロン)を作成し、パイロンを四角形ポリゴンにマッピングしてテクスチャ平面を生成する。例えば、
図3に示すようなテクスチャ平面M(以下、マーカという)を、3次元仮想空間の任意の位置に配置することができる。
【0024】
[AI認識対象物・情報生成描画手段20]
AI認識対象物・情報生成描画手段20は、3次元CGにより3次元仮想空間にAIモデルの認識対象物に関する情報を生成し、描画する。ここで、
図1に示すように、AI認識対象物・情報生成描画手段20は、(1)AI認識対象物特徴点・3次元空間情報生成機能と、(2)マーカ配置・描画機能と、(3)AI認識対象物特徴点・2次元画像位置情報生成機能を有している。
【0025】
AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・3次元空間情報生成機能(本発明の「3次元空間情報生成機能」)により、3次元仮想空間の情報を参照して、AI認識対象物の特徴点の3次元空間情報(位置、距離等)を生成する。本実施形態において、この3次元空間情報は、
図4に示すような道路上の座標P1(x1,y1,z1)、P2(x2,y2,z2)、P3(x3,y3,z3)、・・・である。
【0026】
また、AI認識対象物・情報生成描画手段20は、マーカ配置・描画機能(本発明の「3次元空間情報配置描画機能」)により、AI認識対象物の特徴点の3次元空間情報を参照して、3次元仮想空間の指定された位置にマーカを生成し、描画する。
【0027】
図5は、AI認識対象物・情報生成描画手段20のマーカ配置・描画機能により、
図3の道路上の座標P1~P3(
図5参照)に対応する位置にマーカを配置した様子を示している。ここでは、3個のパイロンを20m間隔で直線状に配置している。最も手前側及び最も奥側のパイロンは道路上の境界線を形成する特徴点として、また、中央のパイロンは特徴点間を補完する位置に配置されたものとして、それぞれ描画される。
【0028】
図5のCG画像は、AIモデル学習用の「画像データ」を構成する。パイロンの個数、間隔は
図4の態様に限られず、任意の位置に配置することができる。
【0029】
次に、AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・2次元画像位置情報生成機能(本発明の「2次元画像位置情報生成機能」)により、AI認識対象物の特徴点の2次元画像上の位置情報を生成する。具体的には、マーカ配置・描画機能によって描画されたマーカの2次元画像上の座標(P1,P2)にテクスチャ平面L(以下、ランドマークという)を生成し、描画する。
【0030】
また、AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・2次元画像位置情報生成機能の中に、(A)特徴点を示すマーカのテクスチャ画像を単色(例えば、黄色)とし、それ以外の背景を別の単色(例えば、黒色)で描画する「ランドマーク・背景単色描画機能」と、(B)ランドマーク・背景単色描画機能によって描画された画像から2次元画像処理技術によってマーカに設定した単色で塗りつぶされた領域を抽出する「指定色領域抽出機能」と、(C)抽出された各領域の輪郭を取得し、さらに重心座標を算出する「指定色領域重心座標取得機能」を備えている(
図1参照)。
【0031】
上記処理は、例えば“OpenCV”といった汎用的な2次元画像処理ソフトパッケージで提供される機能を利用して実行する。“OpenCV”は、領域の抽出や重心座標の算出等の作業を行うことができる。
【0032】
図6は、AI認識対象物・情報生成描画手段20のAI認識対象物特徴点・2次元画像位置情報生成機能(ランドマーク・背景単色描画機能)により、3次元仮想空間上の特徴点(座標P1,P2)の位置に、それぞれ大、小のランドマークL(斜線の正方形)を配置した様子を示している。
【0033】
また、
図7は、AI認識対象物特徴点・2次元画像位置情報生成機能(指定色領域抽出機能及び指定色領域重心座標取得機能)により、
図6のランドマークLの重心座標P1(w1,h1)、P2(w2,h2)を決定した様子を示している。このように、AI認識対象物・情報生成描画手段20は、認識対象物の3次元仮想空間上の位置情報を2次元画像上の位置情報に変換することができる。座標P1,P2の座標情報(認識対象物情報)は、AIモデル学習用の「教師数値データ」を構成する。
【0034】
[3次元仮想空間・シーン生成描画手段30]
3次元仮想空間・シーン生成描画手段30は、3次元CGにより、3次元仮想空間や認識対象物の設定(位置、形状、角度、テクスチャ画像等)を変更することで様々なシーンを生成して描画する。3次元仮想空間・シーン生成描画手段30により、機械学習用データのバリエーションを増加させることができる。
【0035】
なお、AI認識対象物・情報生成描画手段20で作成された認識対象物情報と、3次元仮想空間・シーン生成描画手段30で作成されたCG画像とは、詳細を後述する機械学習用データ生成手段40に送信される。
【0036】
[機械学習用データ生成手段40]
機械学習用データ生成手段40は、3次元仮想空間・シーン生成描画手段30で生成された認識対象物を含む「画像データ」と、AI認識対象物・情報生成描画手段20で生成された認識対象物の「教師数値データ」とからAIモデルの機械学習に必要な機械学習用データを生成する。
【0037】
3次元仮想空間上では、道路(幅、勾配、車線数)やその周辺の様子(背景、障害物、天候)を容易に変更可能であるため、実空間上と比較してバリエーションに富んだ機械学習用データを作成することができる。そのため、後述するAIモデル機械学習手段50は、機械学習の機会を多く得ることができる。
【0038】
[AIモデル機械学習手段50]
AIモデル機械学習手段50は、機械学習用データ生成手段40によって生成された機械学習用データ(「画像データ」と、それに紐付けされた特徴点の「教師数値データ」)を用いて、AIモデルに機械学習をさせる。機械学習用データ生成手段40により多くのパターンの機械学習用データが作成され、機械学習に利用される。
【0039】
本実施形態では、機械学習の1つである畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いて、入力された機械学習用データに対して畳み込み演算を実行し、その特徴量を抽出する。
【0040】
AIモデルの生成、学習は、市販のプラットフォームを利用して実行することができる。プラットフォームの1つとして、例えば“Keras”がある。“Keras”は、AIモデルを定義すると共に、市場に提供されているAIモデル(例えば、
図1に示す“VGG16”)を拡張することができる。
【0041】
具体的には、
図1に示すように、VGG16モデルにインプットレイヤを追加し、入力データとして画像データ(256×256、RGB3バイト)と教師数値データを与えて機械学習をさせる。これにより、VGG16モデルにアウトプットレイヤ(Dense)が追加され、出力データとして座標P1(x1,y1)、P2(x2,y2)の4変数(x1,y1,x2,y2)が得られる。
【0042】
[機械学習済みモデル実行手段60]
機械学習済みモデル実行手段60は、AIモデル機械学習手段50によって学習された学習済みモデルを用いて、AIモデルを実行する。この実行の結果、入力データからパイロンの列を認識することができる。
【0043】
図8は、機械学習済みモデル実行手段60によるAIモデルの実行結果を示している。図示するように、機械学習済みモデル実行手段60は、入力データの最も手前側に位置するパイロンを認識して座標P1を取得すると共に、最も奥側に位置するパイロンを認識して座標P2を取得する。
【0044】
座標P2は道路遠方に配置されているため、始点となる座標P1と終点となる座標P2とを結んだエリア境界線が得られる。このように、機械学習システム1は、複数のマーカを認識することで特徴点の2次元画像上の位置を推定し、特徴点同士を結んで2次元画像上における境界線を生成することができる。
【0045】
また、
図9の下段に示すように、移動体を認識可能な別のAIモデル(AI Model B)を実行することにより、画像データを解析して移動体(車両V)と、その位置を認識することができる。このようなAIモデルとして、例えば、Intel社の“OpenVINO(登録商標)”を用いることができる。
【0046】
図9(下段右)は、車両Vの2次元画像上の位置情報を示している。機械学習システム1は、座標P1,P2を結ぶ直線と車両Vが交わる否かを判定することができる。この技術を応用することにより、機械学習システム1は、侵入規制エリアに侵入してくる移動体の判別等を行うことができる。
【0047】
[第2実施形態]
次に、
図10~
図15を参照して、本発明の第2実施形態に係る機械学習システムについて説明する。なお、システムの全体構成は第1実施形態と同じであるが、AI認識対象物・情報生成描画手段20の機能が一部異なる。
【0048】
まず、AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・3次元空間情報生成機能により、3次元仮想空間の情報を参照して、AI認識対象物の特徴点の3次元空間情報(位置、距離等)を生成する。3次元仮想空間の道路を参照し、3次元仮想空間の原点から指定された距離にある、道路中心線上の複数の点の座標を生成する。
【0049】
図10は、3次元仮想空間のある視点をカメラで撮像したときの透視変換画像(CG画像)を示している。道路上の4点P1~P4は、3次元仮想空間の特徴点である。
図10に示す透視変換画像は、AIモデル学習用の「画像データ」を構成する。
【0050】
次に、AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・2次元画像位置情報生成機能により、AI認識対象物(道路)の特徴点の2次元画像上の位置情報を生成する。
図11に示すように、各特徴点は道路の中心線上にある。その座標の数値は、例えばP1(0,25,0)、P2(0,50,0)、P3(0,100,0)、P4(0,200,0)である。
【0051】
次に、
図12に示すように、AI認識対象物特徴点・2次元画像位置情報生成機能によって、AI認識対象物の特徴点の3次元空間情報を参照し、3次元仮想空間の指定した位置(座標P1~P4)に単色のテクスチャ画像(例えば、黄色)を有するランドマークを生成し、描画する。
【0052】
さらに、AI認識対象物特徴点・2次元画像位置情報生成機能は、描画されたランドマークの単色の領域を抽出し、当該領域の輪郭と重心座標を求めることにより、4つの座標P1(w1,h1)、P2(w2,h2)、P3(w3,h3),P4(w4,h4)を決定する。座標P1~P4の情報(認識対象物情報)は、AIモデル学習用の「教師数値データ」を構成する。
【0053】
機械学習システム1は、ここでの「画像データ」と、それに紐付けされた特徴点の「教師数値データ」とを用いて、AIモデルに機械学習をさせる。
図13に示すように、機械学習システム1は3次元仮想空間内の道路の領域を認識し、原点から指定距離だけ離れた複数の点(距離推定ポイント)の2次元画像上の位置を推定することができる。
【0054】
図14の下段に示すように、移動体を認識可能な別のAIモデル(AI Model B)を実行することにより、画像データを解析して移動体(車両V)と、その位置を認識することができる。これにより、
図14(下段右)に示すように、車両Vの2次元画像上の距離情報が得られる。このように、機械学習システム1は、道路上を走行する移動体が原点からどの程度離れているかの情報を取得する装置に用いることができる。
【0055】
また、機械学習システム1は、3次元仮想空間の原点から指定距離だけ離れた複数の特徴点から構成される補完曲線を生成し、補完曲線から道路上の特徴点の間の距離を推定することもできる。
【0056】
図15に示すように、距離情報から補完曲線を取得する。
図15において、横軸を原点からの距離D、縦軸を画像中の高さHとすると、補完曲線はD=F(H)のパラメトリック関数で与えられる。すなわち、高さhを与えれば、距離dの情報が得ることができるので、道路上を走行する車両の原点からの距離レベルを推定することができる。
【0057】
[第3実施形態]
次に、
図16~
図20を参照して、本発明の第3実施形態に係る機械学習システムについて説明する。ここでも、システムの全体構成は第1実施形態と同じであるが、AI認識対象物・情報生成描画手段20の機能が一部異なる。
【0058】
まず、AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・3次元空間情報生成機能により、3次元仮想空間の情報を参照して、AI認識対象物の特徴点の3次元空間情報(位置、距離等)を生成する。3次元仮想空間の道路を参照し、3次元仮想空間の複数の点の座標を生成する。
図10に示したような透視変換画像(CG画像)は、AIモデル学習用の「画像データ」を構成する。
【0059】
次に、AI認識対象物・情報生成描画手段20は、AI認識対象物特徴点・2次元画像位置情報生成機能により、AI認識対象物の特徴点の2次元画像上の位置情報を生成する。3次元仮想空間(道路)上の特徴点の座標として、
図16に示す座標P1~P8の8点を生成する。
【0060】
座標P1~P8は、道路の中心線上の後方距離にある4点(P1~P4)(本発明の「第1特徴点」)と、最も手前側の特徴点P1の左右方向(中心線に直交する方向)にある2点(P5,P6)(本発明の「第2特徴点」)と、最も奥側の特徴点P4の左右方向にある2点(P7,P8)(本発明の「第3特徴点」)で構成される。
【0061】
なお、道路の中心線上の4点(P1~P4)による距離レベルの推定は、第2実施形態の態様と同じである。詳細は後述するが、これらの座標情報から道路上に走行レーンを区画する3次元仮想グリッドを生成することができる。
【0062】
次に、
図17に示すように、AI認識対象物特徴点・2次元画像位置情報生成機能によって、AI認識対象物の特徴点の3次元空間情報を参照し、3次元仮想空間の指定した位置(P1~P8)に単色のテクスチャ画像(例えば、黄色)を有するランドマークを生成し、描画する。
【0063】
さらに、AI認識対象物特徴点・2次元画像位置情報生成機能は、描画されたランドマークの単色の領域を抽出し、当該領域の輪郭と重心座標を求めることにより、4つの座標P1(w1,h1)、P2(w2,h2)、P3(w3,h3),P4(w4,h4)、P5(w5,h5)、P6(w6,h6)、P7(w7,h7),P8(w8,h8)を決定する。座標P1~P8の情報(認識対象物情報)は、AIモデル学習用の「教師数値データ」を構成する。
【0064】
機械学習システム1は、ここでの「画像データ」と、それに紐付けされた特徴点の「教師数値データ」とを用いて、AIモデルに機械学習をさせる。
図18に示すように、機械学習システム1は、道路の中心線を基準とした5つの仮想走行レーンC0(自車レーン),R1(右レーン1),R2(右レーン2),L1(左レーン1),L2(左レーン2)を設定することができる。
【0065】
図中のD1~D4は、原点からの距離レベルを意味しているので、3次元仮想空間(道路)内の境界線で分割される3次元仮想グリッド(ここでは、20個のグリッド)が生成される。
【0066】
また、移動体を認識可能な別のAIモデルは、画像データを解析して移動体と、その位置を認識することができる。これにより、車両の2次元画像上の距離の情報が得られる。このように、機械学習システム1は、車両が存在するグリッドによって、道路上を走行する移動体がどのレーンにどの距離レベルで存在するかを検知する装置に用いることができる。
【0067】
さらに、その移動体の加速度やグリッド間の移動をモニタすることで、おおよその移動ベクトルが推定される。機械学習システム1は、移動体の動き(追い越し、追い抜き等)を検知する装置に用いることができる。
【0068】
上述の3次元仮想グリッドを、カメラで撮像した画像の道路の縁端領域の推定に利用してもよい。機械学習システム1は道路上の距離レベルを認識可能であるため、AI認識対象物・情報生成描画手段20は、例えば距離レベルD4の座標を囲んだ領域(
図18の領域R)を切り取って、新たなCG画像を取得することができる。
【0069】
図19に示す領域Rは道路の縁端領域であり、その内部に移動体(車両V)が存在している。AIモデルは、移動体が道路遠方に存在する場合、移動体が画像全体に対してかなり小さく、周辺領域にノイズも多いため、高精度での認識が困難であった。
【0070】
この点、機械学習システム1(AI認識対象物・情報生成描画手段20)は、
図20に示すように、領域Rを切り取って拡大画像を生成する。そして、AIモデルに入力して、機械学習済みモデル実行手段60が移動体の認識処理を実行する。拡大画像では、車両Vが画像全体に対して大きく、ノイズ要素も削減されるため、移動体の認識精度を高めることができる。
【0071】
本発明は上記実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様で実施することが可能である。上記実施形態の説明の中で、3次元CGのソフトウェアやAIモデルのプラットフォームの一例を示したが、他のソフトウェア、プラットフォームで代替してもよく、機械学習用データの作成は可能である。
【0072】
また、第1実施形態のマーカの数、第1~第3実施形態のランドマークの数や色彩は一例であって、これに限定されるものではない。例えば、第3実施形態においては、ランドマーク(特徴点)の数を変更することによりグリッド数を変化させ、認識可能な仮想走行レーンの数を増減させることができる。
【符号の説明】
【0073】
1…機械学習システム、10…3次元仮想空間・生成描画手段、20…AI認識対象物・情報生成描画手段、30…3次元仮想空間・シーン生成描画手段、40…機械学習用データ生成手段、50…AIモデル機械学習手段、60…機械学習済みモデル実行手段、L,M…テクスチャ平面、V…車両。
【手続補正書】
【提出日】2022-06-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
3次元CGにより、物体を3次元仮想空間に生成して描画する3次元仮想空間・生成描画手段と、
3次元CGにより、前記3次元仮想空間にAIモデルの認識対象物に関する情報を生成して描画するAI認識対象物・情報生成描画手段と、
3次元CGにより、前記3次元仮想空間と前記認識対象物の少なくとも一方の設定を変更することで様々なシーンを生成して描画する3次元仮想空間・シーン生成描画手段と、
前記3次元仮想空間・シーン生成描画手段で生成された前記認識対象物を含むCG画像と、前記AI認識対象物・情報生成描画手段で生成された前記認識対象物に関する情報から前記AIモデルの機械学習に必要な学習用データを生成する機械学習用データ生成手段と、
前記機械学習用データ生成手段によって生成された前記学習用データを用いて、前記AIモデルの学習を行うAIモデル機械学習手段と、
前記AIモデル機械学習手段によって学習された学習済みモデルを用いて、前記AIモデルによる処理を実行するAI機械学習済みモデル実行手段と、を備え、
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間における前記認識対象物の特徴点の3次元空間情報を生成する3次元空間情報生成機能と、
前記3次元空間情報を参照し、前記3次元仮想空間の指定された位置に前記認識対象物の3次元空間情報を配置、描画する3次元空間情報配置描画機能と、
前記3次元空間情報配置描画機能によって描画された前記認識対象物の2次元画像上の位置情報を生成する2次元画像位置情報生成機能と、
を有し、
前記3次元仮想空間内の一領域を参照して、前記一領域内を区画する複数の特徴点の3次元空間情報を生成し、
前記3次元空間情報を参照して、前記3次元仮想空間の指定された位置に、前記認識対象物のテクスチャ画像を有するマーカ及び単色のテクスチャ画像を有する平面であるランドマークを配置、描画することを特徴とする機械学習システム。
【請求項2】
3次元CGにより、物体を3次元仮想空間に生成して描画する3次元仮想空間・生成描画手段と、
3次元CGにより、前記3次元仮想空間にAIモデルの認識対象物に関する情報を生成して描画するAI認識対象物・情報生成描画手段と、
3次元CGにより、前記3次元仮想空間と前記認識対象物の少なくとも一方の設定を変更することで様々なシーンを生成して描画する3次元仮想空間・シーン生成描画手段と、
前記3次元仮想空間・シーン生成描画手段で生成された前記認識対象物を含むCG画像と、前記AI認識対象物・情報生成描画手段で生成された前記認識対象物に関する情報から前記AIモデルの機械学習に必要な学習用データを生成する機械学習用データ生成手段と、
前記機械学習用データ生成手段によって生成された前記学習用データを用いて、前記AIモデルの学習を行うAIモデル機械学習手段と、
前記AIモデル機械学習手段によって学習された学習済みモデルを用いて、前記AIモデルによる処理を実行するAI機械学習済みモデル実行手段と、を備え、
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間における前記認識対象物の特徴点の3次元空間情報を生成する3次元空間情報生成機能と、
前記3次元空間情報を参照し、前記3次元仮想空間の指定された位置に前記認識対象物の3次元空間情報を配置、描画する3次元空間情報配置描画機能と、
前記3次元空間情報配置描画機能によって描画された前記認識対象物の2次元画像上の位置情報を生成する2次元画像位置情報生成機能と、
を有し、
前記3次元仮想空間内の一領域を参照して、前記一領域の一方向の中心線を決定し、前記中心線上の前記3次元仮想空間の原点から指定距離だけ離れた前記中心線上の複数の特徴点の3次元空間情報を生成し、
前記3次元空間情報を参照して、前記3次元仮想空間の指定された位置に単色のテクスチャ画像を有する平面であるランドマークを配置、描画することを特徴とする機械学習システム。
【請求項3】
前記2次元画像位置情報生成機能は、
前記3次元仮想空間の指定された位置に前記ランドマークを配置して前記ランドマークを第1色で描画し、前記ランドマーク以外の部分を前記第1色とは異なる第2色で描画するランドマーク・背景単色描画機能と、
前記ランドマーク・背景単色描画機能によって描画された画像から、画像処理により前記第1色で描画された領域を抽出する指定色領域抽出機能と、
前記指定色領域抽出機能によって抽出された領域の輪郭と重心座標を取得する指定色領域重心座標取得機能と、で構成される、請求項1又は2に記載の機械学習システム。
【請求項4】
前記AI機械学習済みモデル実行手段は、
前記マーカを認識することにより前記特徴点の2次元画像上の位置を推定し、前記特徴点同士を結んで前記2次元画像上の境界線を形成する、請求項1に記載の機械学習システム。
【請求項5】
前記AI機械学習済みモデル実行手段は、
前記3次元仮想空間内の一領域を認識し、前記一領域内において前記原点から指定距離だけ離れた前記複数の特徴点の2次元画像上の位置を推定する、請求項2に記載の機械学習システム。
【請求項6】
前記AI機械学習済みモデル実行手段は、
前記複数の特徴点から構成される補完曲線を生成し、前記補完曲線から前記一領域内における前記特徴点の間の距離を推定する、請求項5に記載の機械学習システム。
【請求項7】
前記AI認識対象物・情報生成描画手段は、
前記3次元仮想空間内の一領域を参照して、前記一領域の一方向の中心線を決定し、前記中心線上の前記3次元仮想空間の原点から指定距離だけ離れた前記中心線上の複数の第1特徴点と、前記原点から最も近い前記第1特徴点に対して前記中心線と直交する方向に配置された複数の第2特徴点と、前記原点から最も遠い前記第1特徴点に対して前記中心線と直交する方向に配置された複数の第3特徴点との3次元空間情報を生成し、
前記3次元空間情報を参照して、前記3次元仮想空間の指定された位置に単色のテクスチャ画像を有する平面であるランドマークを配置、描画する、請求項2に記載の機械学習システム。
【請求項8】
前記AI認識対象物・情報生成描画手段は、前記原点から最も遠い前記第1特徴点と前記第3特徴点とを囲む領域を切り取って拡大した拡大画像を生成し、
前記AI機械学習済みモデル実行手段は、前記拡大画像を用いて前記AIモデルによる処理を実行する、請求項7に記載の機械学習システム。