【国等の委託研究の成果に係る記載事項】(出願人による申告)平成28年度、国立研究開発法人新エネルギー・産業技術総合開発機構「IoT社会の実現に向けたIoT推進部実施事業の周辺技術・関連課題における小規模研究開発/荷物受取における車両停車位置検出技術の研究開発」に係る委託研究、産業技術力強化法第19条の適用を受ける特許出願
(58)【調査した分野】(Int.Cl.,DB名)
前記判定するステップは、前記受け付けた撮影画像に関連付けられている撮影時の地理的な位置に少なくとも基づいて、前記受け付けた撮影画像に含まれる道路上の停車場所に対応する地理的な位置を特定することを含む、
請求項1ないし4何れかのシステム。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら、本発明の実施形態について説明する。
【0012】
図1は、本発明の一実施形態に係る停車場所判定システム10の構成を概略的に示す構成図である。システム10は、一般的なコンピュータとして構成されており、
図1に示すように、CPU(コンピュータプロセッサ)11と、メインメモリ12と、ユーザI/F13と、通信I/F14と、ストレージ(記憶装置)15とを備え、これらの各構成要素が図示しないバス等を介して電気的に接続されている。
【0013】
CPU11は、ストレージ15等に記憶されている様々なプログラムをメインメモリ12に読み込んで、当該プログラムに含まれる各種の命令を実行する。メインメモリ12は、例えば、DRAM等によって構成される。
【0014】
ユーザI/F13は、ユーザとの間で情報をやり取りするための各種の入出力装置である。ユーザI/F13は、例えば、キーボード、ポインティングデバイス(例えば、マウス、タッチパネル等)等の情報入力装置、マイクロフォン等の音声入力装置、カメラ等の画像入力装置を含む。また、ユーザI/F13は、ディスプレイ等の画像出力装置(表示装置)、スピーカー等の音声出力装置を含む。
【0015】
通信I/F14は、ネットワークアダプタ等のハードウェア、各種の通信用ソフトウェア、及びこれらの組み合わせとして実装され、有線又は無線の通信を実現できるように構成されている。
【0016】
ストレージ15は、例えば磁気ディスク又はフラッシュメモリ等によって構成される。ストレージ15は、オペレーティングシステムを含む様々なプログラム及び各種データ等を記憶する。本実施形態において、ストレージ15には、画像に含まれる車両の停車場所の判定に用いられる学習済みモデル152が格納されている。
【0017】
本実施形態において、システム10は、それぞれが上述したハードウェア構成を有する複数の装置を用いて構成され得る。また、システム10は、画像処理に特化したプロセッサであるGPUを備えるように構成され得る。
【0018】
次に、本実施形態の停車場所判定システム10が有する機能について説明する。
図1に示すように、システム10のCPU11は、画像の解析に関する処理を実行する画像解析部112、及び、当該画像解析部112による画像の解析結果に少なくとも基づいて当該画像に含まれる停車場所を判定する処理を実行する停車場所判定部114として機能するように構成されている。これらの機能は、CPU11が、メインメモリ12等のハードウェア、並びに、ストレージ15等に記憶されている各種プログラムやデータ等と協働して動作することによって実現され、例えば、メインメモリ12に読み込まれたプログラムに含まれる命令を実行することによって実現される。
【0019】
画像解析部112は、受け付けた撮影画像を、学習済みモデル152を用いて解析するように構成されており、具体的には、当該撮影画像を学習済みモデル152に入力し、当該学習済みモデル152から出力される情報を取得するように構成されている。
【0020】
停車場所判定部114は、学習済みモデル152から出力される情報に少なくとも基づいて、撮影画像に含まれる道路上の停車場所を判定するように構成されている。
【0021】
本実施形態において、学習済みモデル152は、画像が入力されると、当該画像に含まれる道路上の適切な停車場所に対応する画像上の位置を特定する位置特定情報を出力するように構成されている。こうした学習済みモデル152は、適切な停車場所に対応する画像上の位置を特定する位置特定情報がそれぞれに関連付けられている複数の学習用画像を学習データ(正解データ)とする機械学習によって生成される。学習済みモデル152は、例えば、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)として構成される。
【0022】
このように、本実施形態における停車場所判定システム10は、停車場所に対応する位置特定情報がそれぞれに関連付けられている複数の学習用画像を学習データとする機械学習によって生成される学習済みモデル152に撮影画像を入力し、当該学習済みモデル152から出力される位置特定情報に少なくとも基づいて、撮影画像に含まれる道路上の停車場所を判定するように構成されている。従って、適切な停車場所に対応する位置特定情報が関連付けられている学習用画像を準備して学習済みモデル152を生成することにより、システム10は、撮影画像に含まれる適切な停車場所を判定することができる。
【0023】
本実施形態において、停車場所に対応する画像上の位置を特定する位置特定情報は、様々な形式の情報を含み、例えば、ヒートマップ情報(2次元配列の形式を有する情報)を含む。ここでのヒートマップは、画像上の各位置(画素)における適切な停車場所である度合い(尤度)を複数段階で表現したものである。ヒートマップは、「confidence map」と呼ばれることもある。こうした構成は、ヒートマップを活用した停車場所の判定を可能とする。
【0024】
また、停車場所判定部114は、受け付けた撮影画像に含まれる道路上の停車場所を、当該撮影画像上の点、線分、又は領域として判定するように構成され得る。停車場所が撮影画像上の線分として判定される場合において、位置特定情報は、停車場所に対応する線分の一方の端点の画像上の位置を特定する第1の情報(例えば、第1のヒートマップ情報)と、停車場所に対応する線分の他方の端点の画像上の位置を特定する第2の情報(例えば、第2のヒートマップ情報)とを含むように構成される。こうした構成は、停車場所に対応する線分の始点の判定と終点の判定とを別々に行うことを可能とし、この結果、各判定に要する処理の簡易化を促進し得る。各判定に要する処理の簡易化は、例えば、1つの撮影画像に含まれる複数の停車場所(線分)を判定する場合において有効である。
【0025】
また、停車場所判定部114は、受け付けた撮影画像に関連付けられている撮影時の地理的な位置(例えば、緯度及び経度等)に少なくとも基づいて、当該受け付けた撮影画像に含まれる道路上の停車場所に対応する地理的な位置(例えば、地図上の位置、又は、緯度及び経度等)を特定するように構成され得る。こうした構成は、判定した撮影画像における停車場所を、実際の地理的な位置に変換することを可能とし、例えば、判定した撮影画像における停車場所を電子地図上に反映することを可能とする。
【0026】
次に、このような機能を有する本実施形態の停車場所判定システム10の具体例について説明する。当該具体例におけるシステム10は、撮影画像に含まれる車両の適切な停車場所を判定し、当該判定した停車場所を、自動運転車両を用いた物品の配送サービスにおいて利用される電子地図に反映する(マッピングする)ように構成されている。
【0027】
図2は、この例における学習済みモデル152を説明するための図である。この例の学習済みモデル152は、図示するように、学習データ20を用いた機械学習によって生成され、撮影画像が入力されると、当該撮影画像に対応するヒートマップ情報を出力する。当該ヒートマップ情報は、入力された撮影画像に含まれる道路上の適切な停車場所に対応する画像上の位置を特定する情報であり、2次元配列の形式を有する。
【0028】
学習データ20は、走行中の車両から撮影された多数の学習用画像を含む。学習用画像は、例えば、車両の前方を撮影するように設けられたカメラ(例えば、ドライブレコーダが有するカメラ)を介して当該車両の走行中に撮影された動画を、所定のフレームレート(例えば、1FPS)で分解することによって得られる複数の静止画である。学習用画像には、当該画像に含まれる道路上の適切な停車場所に対応する画像上の位置を特定するヒートマップ情報が関連付けられている。
【0029】
ここで、学習用画像に関連付けられるヒートマップ情報を生成する方法について説明する。この例において、学習用画像に関連付けられるヒートマップ情報を生成する際には、まず、作業者が、個別の学習用画像を目視で確認し、当該画像に含まれる適切な停車場所に対応する部分を特定する。適切な停車場所は、例えば、物品の積み降ろしに適した場所であり、戸建住宅の玄関/駐車場の前、及び、集合住宅のエントランス/駐車場の前等が挙げられる。
【0030】
図3は、この例における学習用画像25を例示する。当該画像25における線分LSは、作業者によって特定された停車場所に対応する部分である。このように、この例では、停車場所は画像上の線分として特定され、典型的には、車道と歩道(又は私有地)との間の境界に沿った線分として特定される。
図3の例では、線分LSは、戸建住宅の玄関の前において、車道と私有地との間の境界に沿うように特定されている。
【0031】
こうした作業者による学習用画像に対する停車場所の特定(停車場所のアノテーション)は、例えば、パーソナルコンピュータ、タブレット端末、スマートフォン等の様々な情報端末を用いて行われ得る。例えば、こうした情報端末において学習用画像が表示されると、作業者は、マウス又はタッチパネル等を用いて、表示されている画像における停車場所を線分として特定する。例えば、作業者は、当該線分の始点及び終点の位置を画像上で順に指定することによって、当該線分を特定することができる。
【0032】
なお、この例では、機械学習の効果を高めることを意図して、1つの学習用画像に対して設定する停車場所は最大で1つとしており、また、停車場所は、画像に含まれる道路の左側のみを対象としており、右側は対象としていない。しかしながら、本実施形態の他の例においては、1つの学習用画像に対して設定する停車場所の数は2以上でも良く、また、停車場所は、道路の右側に位置していても良い。
【0033】
こうして学習用画像に対して停車場所が特定されると、当該停車場所(線分)の画像上の位置に基づいて、ヒートマップ情報が生成される。
図4は、
図3に例示した学習用画像に基づいて生成されるヒートマップ情報に対応するヒートマップ画像を例示する。
図4(A)は、
図3の画像25上の線分LSの始点SPに対応するヒートマップ画像であり、
図4(B)は、同じく線分LSの終点EPに対応するヒートマップ画像である。このように、この例では、線分LSの始点SPに対応する第1のヒートマップ情報と、線分LSの終点EPに対応する第2のヒートマップ情報とが別々に生成される。
【0034】
図4に例示するヒートマップ画像は、画像上の各位置(画素)の色が、適切な停車場所である度合いが大きくなるに従って白色から黒色に近づくように構成されている。また、各ヒートマップ情報は、始点SP/終点EPに対応する位置を頂点(平均値)とし、所定の標準偏差を有する2次元正規分布に対応するように生成される。こうしたヒートマップ情報の生成に関する処理は、学習用画像に対する停車場所の特定のために用いられる上記情報端末、或いは、システム10又は他のシステム/装置上で実行され得る。
【0035】
このように2つのヒートマップ情報がそれぞれに関連付けられている多数の学習用画像が準備される。そして、当該多数の学習用画像を学習データとする機械学習によって、学習済みモデル152が生成される。学習済みモデル152の生成(機械学習)に関する処理は、上記情報端末、或いは、システム10又は他のシステム/装置上で実行され得る。
【0036】
ここで、この例の学習済みモデル152は、畳み込みニューラルネットワークとして構成されており、例えば、畳み込みニューラルネットワークを用いた人物の姿勢推定(pose estimation)におけるパーツ検出の技術は、この例における停車場所に対応する線分の端点の検出に適用される。
【0037】
このように生成された学習済みモデル152を用いて、システム10は、撮影画像に含まれる適切な停車場所を判定する。そして、判定した停車場所に関する情報は、配送サービス用の電子地図に反映される。停車場所の判定の対象となる撮影画像は、学習用画像と同様に、例えば、車両の前方を撮影するように設けられたカメラ(例えば、ドライブレコーダが有するカメラ)を介して当該車両の走行中に撮影された動画を、所定のフレームレート(例えば、1FPS)で分解することによって得られる複数の静止画である。例えば、配送サービスの提供エリアに含まれる全ての道路を対象として撮影画像が準備される。
【0038】
図5は、システム10によって実行される撮影画像毎の処理を例示するフロー図である。システム10は、まず、図示するように、撮影画像を学習済みモデル152に入力し、当該学習済みモデル152から出力されるヒートマップ情報を取得する(ステップS100)。学習済みモデル152から出力されるヒートマップ情報は、停車場所に対応する線分の始点に対応する第1のヒートマップ情報と、同じく線分の終点に対応する第2のヒートマップ情報である。例えば、
図6に例示するように、撮影画像30が学習済みモデル152に入力されると、2つのヒートマップ画像32、34に対応するヒートマップ情報が出力される。第1のヒートマップ画像32は、停車場所に対応する線分の始点に対応し、第2のヒートマップ画像34は、停車場所に対応する線分の終点に対応する。
【0039】
続いて、システム10は、第1のヒートマップ情報におけるピーク(頂点)の有無を判定し、ピークが存在する場合には(ステップS105においてYES)、当該ピークのヒートマップ画像上の位置であるピーク座標を特定する(ステップS110)。一方、第1のヒートマップ情報におけるピークが存在しない場合は(ステップS105においてNO)、撮影画像において停車場所に対応する線分の始点が認識されない場合であるから、そのまま処理を終了する。
【0040】
そして、同様に、システム10は、第2のヒートマップ情報におけるピークの有無を判定し、ピークが存在する場合には(ステップS120においてYES)、当該ピークのピーク座標を特定する(ステップS130)。一方、第2のヒートマップ情報におけるピークが存在しない場合は(ステップS120においてNO)、撮影画像において停車場所に対応する線分の終点が認識されない場合であるから、そのまま処理を終了する。このように、第1及び第2のヒートマップ情報の少なくとも一方においてピークが存在しない場合、対応する撮影画像における停車場所の判定はスキップされる。
【0041】
一方、第1及び第2のヒートマップ情報の両方にピークが存在する場合、システム10は、2つのピーク座標を結ぶ線分に対応する停車場所を電子地図に反映する(ステップS140)。具体的には、2つのピーク座標と、撮影画像に関連付けられている撮影時における緯度及び経度、並びに、撮影時におけるカメラ(車両の進行方向)の方位とに基づいて、2つのピーク座標を結ぶ線分の電子地図上における位置を特定し、特定した位置に停車場所に関する情報を追加する。電子地図に関するデータは、例えば、システム10のストレージ15等に格納される。
【0042】
図7は、
図6に例示した撮影画像30に含まれる停車場所が電子地図上に反映される方法を説明するための図である。
図7の上側に示すように、撮影画像30における停車場所は、線分LSとして特定されている。当該線分LSは、
図6に例示した2つのヒートマップ画像32、34の各々のピーク座標を始点及び終点としている。また、撮影画像30には、その撮影時における緯度及び経度、並びに、方位が関連付けられている。これらの情報に基づいて、停車場所(線分LS)の電子地図上における位置(始点及び終点それぞれの緯度及び経度)が特定され、
図7の下側に示すように、地図内の道路上に停車場所PLが設定される。
【0043】
ここで、
図7の下側に例示した地図内に示した星型のマーク(当該マークは電子地図に反映されない。)は、撮影画像30の撮影時におけるカメラ(車両)の位置を示している。当該カメラの位置と停車場所PL(線分の始点/終点)との間の距離は、撮影画像30における線分LSの位置に基づいて算出される。このように、この例では、撮影画像に含まれる停車場所が画像上の線分として判定されるから、当該停車場所の電子地図上の位置(地理的な位置)を精度よく特定することができる。
【0044】
このように、
図5に例示したフロー図に対応する処理が複数の撮影画像の各々に対して実行されると、各撮影画像に含まれる停車場所が電子地図に反映される。当該電子地図は、自動運転車両の車両制御等において利用される。
【0045】
上述した例では、撮影画像に含まれる停車場所が線分として特定されるようにしたが、当該停車場所が画像上の点又は領域として特定されるようにしてもよい。停車場所を画像上の点として特定する場合には、学習用画像/撮影画像に対応するヒートマップ情報は1つとなる。また、停車場所を画像上の領域として特定する場合には、例えば、全層畳み込みネットワーク(Fully Convolution Network:FCN)を用いたセマンティック・セグメンテーションの技術を適用することも可能である。
【0046】
上述した例では、撮影画像に含まれる停車場所が電子地図に反映されるようにしたが、走行中の自動運転車両において進行方向の画像を撮影し、当該撮影画像に含まれる適切な停車場所をリアルタイムで判定するようにしても良い。
【0047】
上述した例では、車両の前方(進行方向)を撮影した画像を用いたが、これに代えて、又は、これに加えて、車両の側方(例えば、左側)を撮影した画像を用いても良い。
【0048】
上述した例において、学習済みモデル152を定期的に評価し、評価指標が所定の閾値以下である場合に学習済みモデル152を更新(更なる機械学習を実行)するようにしても良い。評価指標は、例えば、精度を含み、当該精度は、学習済みモデル152を用いて判定される始点及び終点(第1及び第2のヒートマップ情報における2つのピーク座標)の正解率である。例えば、判定された始点及び終点が、正解から所定の範囲内(例えば、画像上で30ピクセル内)であれば正解と見做される。
【0049】
以上説明した本実施形態に係る停車場所判定システム10は、停車場所に対応する位置特定情報(例えば、ヒートマップ情報)がそれぞれに関連付けられている複数の学習用画像を学習データとする機械学習によって生成される学習済みモデル152に撮影画像を入力し、当該学習済みモデル152から出力される位置特定情報に少なくとも基づいて、撮影画像に含まれる道路上の停車場所を判定するように構成されている。従って、適切な停車場所に対応する位置特定情報が関連付けられている学習用画像を準備して学習済みモデル152を生成することにより、システム10は、撮影画像に含まれる適切な停車場所を判定することができる。このように、本発明の実施形態は、車両の適切な停車場所の判定を支援する。
【0050】
本明細書で説明された処理及び手順は、明示的に説明されたもの以外にも、ソフトウェア、ハードウェアまたはこれらの任意の組み合わせによって実現される。例えば、本明細書で説明される処理及び手順は、集積回路、揮発性メモリ、不揮発性メモリ、磁気ディスク等の媒体に、当該処理及び手順に相当するロジックを実装することによって実現される。また、本明細書で説明された処理及び手順は、当該処理・手順に相当するコンピュータプログラムとして実装し、各種のコンピュータに実行させることが可能である。
【0051】
本明細書中で説明された処理及び手順が単一の装置、ソフトウェア、コンポーネント、モジュールによって実行される旨が説明されたとしても、そのような処理または手順は複数の装置、複数のソフトウェア、複数のコンポーネント、及び/又は複数のモジュールによって実行され得る。また、本明細書において説明されたソフトウェアおよびハードウェアの要素は、それらをより少ない構成要素に統合して、またはより多い構成要素に分解することによって実現することも可能である。
【0052】
本明細書において、発明の構成要素が単数もしくは複数のいずれか一方として説明された場合、又は、単数もしくは複数のいずれとも限定せずに説明された場合であっても、文脈上別に解すべき場合を除き、当該構成要素は単数又は複数のいずれであってもよい。