(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023034917
(43)【公開日】2023-03-13
(54)【発明の名称】対象物を検出するシステム及び対象物を検出する方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20230306BHJP
G06T 7/60 20170101ALI20230306BHJP
B61L 23/00 20060101ALI20230306BHJP
【FI】
G06T7/00 650Z
G06T7/60 200J
B61L23/00 A
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021141404
(22)【出願日】2021-08-31
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】廣木 桂一
(72)【発明者】
【氏名】小田 篤史
【テーマコード(参考)】
5H161
5L096
【Fターム(参考)】
5H161AA01
5H161MM05
5H161MM12
5H161NN10
5H161PP06
5H161PP07
5H161PP11
5L096AA06
5L096BA08
5L096CA02
5L096CA22
5L096DA02
5L096DA03
5L096EA03
5L096EA35
5L096FA02
5L096FA03
5L096FA64
5L096FA69
5L096HA08
(57)【要約】 (修正有)
【課題】高速、高精度に画像内の対象物を検出するシステムを提供する。
【解決手段】建築限界内障害物検出システム10において、補助記憶装置113は、軌道上を移動する移動体から撮像された画像を取得する画像取得部101と、軌道を画像において検出する軌道検出部103と、画像において選択されている基準縦座標値における軌道の幅を決定し、軌道の幅及び係数に基づいて、画像における関心領域のサイズを決定し、選択された縦座標値及び検出された軌道に基づいて、関心領域の画像における位置座標を決定するROI処理部106と、決定された位置座標での関心領域において、対象物検出処理を実行する障害物検出部107と、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
画像内の対象物を検出するシステムであって、
1以上の記憶装置と、
1以上の演算装置と、を含み、
前記1以上の記憶装置は係数を格納し、
前記1以上の演算装置は、
軌道上を移動する移動体から撮像された画像を取得し、
前記軌道を前記画像において検出し、
前記画像において選択されている基準縦座標値における前記軌道の幅を決定し、
前記軌道の幅及び前記係数に基づいて、前記画像における関心領域のサイズを決定し、
前記選択された縦座標値及び検出された前記軌道に基づいて、前記関心領域の前記画像における位置座標を決定し、
決定された前記位置座標での関心領域において、対象物検出処理を実行する、システム。
【請求項2】
請求項1に記載のシステムであって、
前記1以上の演算装置は、
前記選択された縦座標値に基づいて前記関心領域の縦座標値を決定し、
前記検出された軌道に基づいて、対象物を検出すべき検出領域を決定し、
前記検出領域と前記関心領域との位置関係に基づいて、前記関心領域の横座標値を決定する、システム。
【請求項3】
請求項2に記載のシステムであって、
前記検出領域は、前記画像において上下に延びる2本の境界線で画定され、
前記1以上の演算装置は、
前記2本の境界線と前記関心領域との2つの下側交点おける最上位置が、前記画像において最も下の位置となるように、前記関心領域の横座標値を決定する、システム。
【請求項4】
請求項2に記載のシステムであって、
前記検出領域は、前記画像において上下に延びる2本の境界線で画定され、
前記関心領域は、前記横座標の軸に平行な2辺と前記縦座標の軸に平行な2辺で構成された矩形であり、
前記2本の境界線と前記関心領域の下側交点の双方が前記関心領域の下側辺上に位置する、前記関心領域の横座標値が存在する場合、前記1以上の演算装置は、当該横座標値を、前記対象物検出処理を行うための前記関心領域の横座標値と決定する、システム。
【請求項5】
請求項2に記載のシステムであって、
前記検出領域は、前記画像において上下に延びる2本の境界線で画定され、
前記関心領域は、前記横座標の軸に平行な2辺と前記縦座標の軸に平行な2辺で構成され、
前記1以上の演算装置は、前記2本の境界線と前記関心領域の下側交点が、前記関心領域の左側辺及び右側辺のそれぞれの上に位置する、前記関心領域の横座標値が存在する場合、前記下側交点の縦座標位置が同一となるように、前記対象物検出処理を行うための前記関心領域の横座標値を決定する、システム。
【請求項6】
請求項2に記載のシステムであって、
前記検出領域は、前記画像において上下に延びる2本の境界線で画定され、
前記関心領域は、前記横座標の軸に平行な2辺と前記縦座標の軸に平行な2辺で構成され、
前記1以上の演算装置は、前記2本の境界線の一方と前記関心領域との下側交点が前記関心領域の右側辺又は左側辺上に位置し、かつ、前記2本の境界線の他方と前記関心領域との下側交点が前記関心領域の下側辺上の位置する、前記関心領域の横座標値が存在する場合、前記2本の境界線の前記一方と前記関心領域の上側交点が、前記2本の境界線の前記一方の下側交点と反対側で、記関心領域の上側角と一致するように、前記対象物検出処理を行うための前記関心領域の横座標値を決定する、システム。
【請求項7】
請求項1に記載のシステムであって、
前記関心領域の幅は、前記軌道の幅の定数倍である、システム。
【請求項8】
請求項1に記載のシステムであって、
前記1以上の演算装置は、
ユーザに指定された検出条件に基づいて前記係数を決定して前記1以上の記憶装置に格納し、
前記検出条件は、前記対象物の種類、検出精度、軌道幅、及び周囲環境、の少なくとも一つを含む、システム。
【請求項9】
請求項2に記載のシステムであって、
前記検出領域は、前記画像において上下に延びる2本の境界線で画定され、
前記1以上の演算装置は、前記対象物検出処理を実行した前記関心領域と前記2本の境界線の2つの下側交点の最上位置に基づいて、次の関心領域のための前記基準縦座標値を選択する、システム。
【請求項10】
請求項9に記載のシステムであって、
前記関心領域は、前記横座標の軸に平行な2辺と前記縦座標の軸に平行な2辺で構成され、
前記対象物検出処理を実行した前記関心領域と前記2本の境界線の2つの下側交点の最上位置の縦座標値が、前記次の関心領域のための前記基準縦座標値であり、
前記基準縦座標値が、前記次の関心領域の上側辺の縦座標値である、システム。
【請求項11】
画像内の対象物を検出する方法であって、
軌道上を移動する移動体から撮像された画像を取得し、
前記軌道を前記画像において検出し、
前記画像において選択されている基準縦座標値における前記軌道の幅を決定し、
前記軌道の幅及び指定された係数に基づいて、前記画像における関心領域のサイズを決定し、
前記選択された縦座標値及び検出された前記軌道に基づいて、前記関心領域の前記画像における位置座標を決定し、
決定された前記位置座標での関心領域において、対象物検出処理を実行する、ことを含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像内で対象物を検出する技術に関する。
【背景技術】
【0002】
鉄道輸送事業におけるコスト低減およびサービス向上の手段として,鉄道のドライバレス運行が注目されている。鉄道事業者にとって運転士の人件費や育成にかかるコストは大きく、ドライバレス化による運転士コスト低減への鉄道事業者の期待は高い。また、サービス面では運転士の割当制約がなくなるため、運行の自由度が向上するとともに高頻度な運行による利用者の利便性の向上も期待できる。
【0003】
ドライバレス運行は,地下鉄や高架を走行する新交通においては既に実現しているものの、踏切などが存在する路線や作業員が存在する車両基地内の路線など、人が立ち入る可能性がある路線における実用例は無い。ドライバレス運行を実現するためには人や車両など軌道に立ち入る可能性がある障害物を検出する手段が必要である.特に障害物を検出してから減速、停止するために遠距離の障害物を高速、高精度に検出する必要がある。
【0004】
本発明ではカメラと画像処理によって障害物検出を行うことを考える。画像処理によって物体を認識、検出する技術として、近年深層学習によって急速に精度が高まった一般物体認識技術がある。ただし一般物体認識技術では画像内でのピクセル数が少ない物体の検出精度は低下する傾向がある。
【0005】
特許文献1では、軌道の周辺に監視領域を設定し、ステレオカメラで撮影することで障害物を検出しようとしている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
一般物体認識技術では画像内のピクセル数が少ない物体は検出しづらい。リアルタイム処理を行う上での計算コストの制限により、一般物体認識技術において入力画像サイズは608x608、416x416など、一定の大きさに制限される。よって高解像度の画像を撮影しても一般物体認識技術に入力する際には縮小されてしまう。
【0008】
縮小されると遠距離の障害物などピクセル数が少ない物体は検出しづらくなる。ピクセル数が少ない物体を検出するためには、画像内の特定領域をROI(Region Of Interest:関心領域)として設定し、ROIのみを処理対象とする対策が考えられる。ただしROIの外側は処理対象から外れるので、障害物検出の目的を達成するためには適切にROIの座標と大きさを選択する必要がある。
【0009】
従来の障害物検出手法では、監視する必要がある領域を定義してROIを限定しているが、領域が大きい場合や、領域が複数あって画像中の広範囲に分布している場合には、広い画角で撮影する必要があり、その結果として対象物が小さく映ってしまい、検知に失敗する可能性がある。
【課題を解決するための手段】
【0010】
本発明の一態様は、画像内の対象物を検出するシステムであって、1以上の記憶装置と、1以上の演算装置と、を含み、前記1以上の記憶装置は係数を格納し、前記1以上の演算装置は、軌道上を移動する移動体から撮像された画像を取得し、前記軌道を前記画像において検出し、前記画像において選択されている基準縦座標値における前記軌道の幅を決定し、前記軌道の幅及び前記係数に基づいて、前記画像における関心領域のサイズを決定し、前記選択された縦座標値及び検出された前記軌道に基づいて、前記関心領域の前記画像における位置座標を決定し、決定された前記位置座標での関心領域において、対象物検出処理を実行する。
【発明の効果】
【0011】
本発明の一態様によれば、高速、高精度に対象物を検出できる。本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、上記した以外の、課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
【0012】
【
図1】建築限界内障害物検出システムの構成例を模式的に示す。
【
図4A】検出対象物の係数テーブルの構成例を模式的に示す。
【
図4B】障害物検出モデルと検出精度の係数テーブルの構成例を模式的に示す。
【
図4C】軌道幅の係数テーブルの構成例を模式的に示す。
【
図4D】天候及び時間帯の係数テーブルの構成例を模式的に示す。
【
図5】建築限界内障害物検出システムの処理例のフローである。
【
図7】入力画像における軌道とROIとの関係の第1のパターンの例を示す。
【
図8】入力画像における軌道とROIとの関係の第2のパターンの例を示す。
【
図9】入力画像における軌道とROIとの関係の第3のパターンの例を示す。
【
図10】入力画像に対して決定された複数のROIの例である。
【発明を実施するための形態】
【0013】
以下、図面を用いて、いくつかの実施形態を説明する。なお、以下の実施形態においては便宜上その必要があるときは、複数のセクション又は実施形態に分割して説明するが、特に明示した場合を除き、それらはお互い無関係なものではなく、一方は他方の一部又は全部の変形例、詳細、補足説明などの関係にある。各実施形態は、個別に実施しても良いが、組合せて実施しても良い。
【0014】
また、以下の実施形態において、要素の数など(個数、数値、量、範囲などを含む)に言及する場合、特に明示した場合及び原理的に明らかに特定の数に限定される場合などを除き、その特定の数に限定されるものではなく、特定の数以上でも以下でも良いものとする。
【0015】
さらに、以下の実施形態において、その構成要素(要素ステップなどを含む)は、特に明示した場合及び原理的に明らかに必須であると考えられる場合などを除き、必ずしも必須のものではないことは言うまでもない。
【0016】
同様に、以下の実施形態において、構成要素などの形状、位置関係等に言及するときは、特に明示した場合や原理的に明らかにそうでないと考えられる場合などを除き、実質的にその形状などに近似又は類似するものなどを含むものとする。このことは数値及び範囲についても同様である。
【0017】
また、以下の説明では、「xxxテーブル」といった表現で説明することがあるが、当該情報は、どのような構造のデータでも良い。また、以下の説明において、各表の構成は一例であり、1つの表は、2以上の表に分割されても良いし、2以上のテーブルの全部又は一部が1つのテーブルであっても良い。また、以下の説明では、「xxx部」の表現にて機能を説明することがあるが、当該機能は、1以上のコンピュータプログラムが実行されることで実現されてもよい。
【0018】
本明細書の一実施形態にかかる物体検出システムは、規定幅の軌道を移動する移動体から撮像された画像において、物体を検出する。当該システムは、例えば、レールからなる軌道上を走行する鉄道車両や、所定幅のレーンである軌道上を移動する搬送ロボット等で障害物の検出のために使用することができる。当該システムは、軌道上を走行する移動体の運転支援や自動運転等に利用することができる。以下においては、レール上を移動する鉄道車両において障害物を検出するシステムの例が具体的に説明される。
【0019】
鉄道車両の自動運転又は運転支援においては、建築限界内の障害物を検出することが求められる。本明細書の一実施形態では、鉄道車両に取り付けられた前方を監視する1台のカメラによって撮影された画像を受け取り、軌道を中心とした建築限界内の障害物を検出する障害物検出システムを説明する。
【0020】
建築限界は、鉄道車両が走行する軌道に対して、建造物や樹木等を設置することが禁止されている領域を画定する、寸法上の限度である。建築限界は、鉄道車両が進行する軌道の中心を中心とする、一定幅L[m]の領域である。つまり、軌道の両側が検出対象である。幅Lの数値は、一定の軌道幅R[m]に対して、予め決められている。
【0021】
入力画像内のピクセル数が少ない物体を検出するため、障害検出システムは、画像内の特定領域をROI(Region Of Interest:関心領域)として設定し、ROIのみを処理対象とする。以下に説明する例において、ROIは、画像内の縦軸に平行な2辺と横軸に平行な2辺で構成された、正方形であるとする。ROIは他の形状、例えば、長方形であってもよい。
【0022】
ROIの外側は処理対象から外れる。そのため、障害物検出システムは、鉄道車両の前方監視カメラで撮影された入力画像を用いて障害物検出を行うにあたり、障害物を適切に検出するために要求される検出条件に基づいて、ROIを設定する。これにより、検出精度、検出範囲、処理速度等のバランスが適切となるROIを設定することができる。
【0023】
実世界において、軌道幅及び建築限界幅は一定である。ここで、本明細書では画像の左上の角を原点とし、縦方向をv座標(縦座標)、横方向をu座標(横座標)とする。画像内のv座標が同じ地点では、実世界での長さと画像上の長さの比率(縮尺)が変わらないと考えることができる。
【0024】
この条件において、本発明の一実施形態に係る障害物検出システムは、画像内の軌道幅及び所定の係数に基づき、ROIを決定する。この係数をROI係数と呼ぶ。これにより、必要な検出精度を満たしかつ計算コストを抑えるために十分な大きさのROIを得ることができる。
【0025】
例えば、ROI係数は、検出に必要な対象物の画像内でのピクセル数、実世界上での検出対象物の大きさ、物体認識プログラムの入力画像サイズ、及び実世界上での軌道幅に基づく。本明細書の一実施形態において、ROIの幅は、軌道幅R[m]の係数倍と決定される。
【0026】
図1は、本明細書の一実施形態に係る建築限界内障害物検出システムの構成例を模式的に示すブロック図である。建築限界内障害物検出システム10は、演算性能を有する演算装置111と、演算装置111が実行するプログラム及び処理対象データを格納する記憶領域を与える主記憶装置112と、を含む。演算装置111は、例えば、1又は複数のコアを含むCPUやGPUであり、主記憶装置112は、例えば、揮発性記憶領域を含むDRAMである。
【0027】
建築限界内障害物検出システム10は、さらに、他の計算機装置、外部記憶装置、カメラ、マイク、各種センサ等の外部装置とデータ通信をおこなう通信インターフェース(IF)116と、HDD(Hard Disk Drive)やフラッシュメモリなどを利用した不揮発記憶領域を与える補助記憶装置113と、を含む。
【0028】
また、建築限界内障害物検出システム10は、ユーザからの操作を受け付ける入力装置114と、各プロセスでの出力結果をユーザに提示する出力装置115と、を含む。入力装置114は、例えば、キーボードやマウスを含み、出力装置115は、例えば、建築限界内障害物検出システム10による検出結果を表示するディスプレイ、アラートを発報するスピーカ等を含む。建築限界内障害物検出システム10のこれら構成要素は、内部バス117を介して通信可能である。
【0029】
図1において、補助記憶装置113は、建築限界内障害物検出システム10による検出処理を実現する各種プログラム、検出処理において参照される情報、及び処理の実行結果を格納する。
図1において、補助記憶装置113は、画像取得部101、検出条件判定部102、軌道検出部103、建築限界領域判定部104、ROI処理部106、障害物検出部107、結果出力部108の各種プログラムを格納している。さらに、補助記憶装置113は、障害検出に必要な情報を含む管理情報データベース(DB)120を格納している。
【0030】
演算装置111が実行するプログラム及び処理対象のデータは、補助記憶装置113から主記憶装置112にロードされる。演算装置111は、上記プログラムそれぞれに従って、それらに対応する機能部として動作することができる。
【0031】
画像取得部101は、通信インターフェース116を介して受信された監視カメラからの画像を受け取る。本明細書の一実施形態において、入力画像は、鉄道車両の進行方向を撮影した軌道を含む画像である。
図2は入力画像の例を模式的に示す。入力画像20は、鉄道車両から前方に延びる軌道25を含む。軌道25は、周囲の木々の中を延びている。軌道25は、左側レール26と右側レール27とを含み、これらが軌道25の幅を画定する。入力画像20画像の左上の角を原点とし、縦方向をv座標、横方向をu座標とする。
【0032】
図1に戻って、検出条件判定部102は、ROI係数を求めるための検出条件を判定する。検出条件は、対象物の種類(人、車など)、物体認識プログラムの入力画像サイズ(608x608、416x416など)、必要な検出精度(99%検出する必要があるか、90%でよいかなど)、天候、昼夜、といった変数である。
【0033】
一部又は全ての検出条件は、入力装置114を介してユーザにより指定され、管理情報データベース120に格納されていてよい。検出条件判定部102は、少なくとも一部の条件を、入力画像や外部のセンサからの情報を解析することで判定してもよい。
【0034】
軌道検出部103は、入力画像の中から当該の鉄道車両が進行する軌道を検出し、軌道の座標、例えば、左右のレールの座標や軌道の中心座標を出力する。建築限界領域判定部104は、軌道検出部103が検出した軌道の座標から、入力画像内での建築限界を判定し出力する。建築限界内の領域を、建築限界領域と呼ぶ。建築限界領域は、対象物を検出すべき検出領域であり、両側の建築限界を示す2本の境界線で画定される。
【0035】
ROI処理部106は、検出条件判定部102による検出条件、軌道検出部103による軌道検出結果、及び建築限界領域判定部104による建築限界領域に基づいて、複数個のROIを決定し、出力する。障害物検出部107は、それぞれのROIに含まれる画像を入力として、障害物検出処理を行う。結果出力部108は、障害物検出部107による障害物検出結果を、出力装置115によって出力する。
【0036】
建築限界内障害物検出システム10は、物理的な計算機システム(一つ以上の物理的な計算機)でもよいし、クラウド基盤のような計算リソース群(複数の計算リソース)上に構築されたシステムでもよい。建築限界内障害物検出システム10は、スマートフォンやタブレットなどの携帯機器でもよい。計算機システムあるいは計算リソース群は、1以上のインターフェース装置、1以上の記憶装置(例えば、主記憶装置及び補助記憶装置を含む)、及び、1以上の演算装置を含む。
【0037】
プログラムが演算装置によって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び/またはインターフェース装置等を用いながら行われるため、機能は演算装置の少なくとも一部とされてもよい。機能を主語として説明された処理は、演算装置あるいはそのプロセッサを有するシステムが行う処理としてもよい。
【0038】
プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機または計算機が読み取り可能な記憶媒体(例えば計算機読み取り可能な非一過性記憶媒体)であってもよい。各機能の説明は一例であり、複数の機能が一つの機能にまとめられたり、一つの機能が複数の機能に分割されたりしてもよい。
【0039】
図3は、ROI処理部106の構成を模式的に示すブロック図。画像入力部301は、画像取得部101によって取得された監視カメラの画像を入力として受け取る。軌道検出結果入力部302は、軌道検出部103によって検出された軌道の左右のレールの座標を入力として受け取る。検出条件入力部303は、検出条件判定部102から検出条件を入力として受け取る。
【0040】
ROI係数決定部304は、入力された検出条件及び管理情報データベース120に格納されている情報に基づいて、ROI係数を決定する。建築限界領域入力部305は、建築限界領域判定部104から画像内の建築限界領域を取得する。ROI決定部306は、軌道検出結果、建築限界領域、及びROI係数に基づいて、複数のROIを決定する。ROI出力部307は、決定したROIを出力する。
【0041】
本明細書の一実施形態において、ROI係数は、以下の観点に基づき決定することができる。検出対象を検出するためには画像内で高さp[pixel]が必要であり、実世界での検出対象の統計的に平均の高さがP[m]であるとする。また、実世界における軌道幅がR[m]であり、ある地点での画像内での軌道の幅w[pixel]とする。さらに、物体検出モデル(プログラム)へ入力される画像サイズの1辺の長さが、i[pixel]であるとする。ROIの画像データは、拡大又は縮小されて1辺の長さがiの画像に規格化されて物体検出モデルへ入力される。
【0042】
対象物を検出可能な最大のROI幅は、例えば、以下の式で求めることができる。
ROI幅=(iPw/pR)[pixel]
i、R、p、Pは既知であるので、画像内のある地点で対象物を検出可能なROI幅の最大値は、同じ地点での軌道の幅w[pixel]の(iP/pR)倍となる。この係数(iP/pR)が、ROI係数であり、ROI幅はこの値以下であることが求められる。
【0043】
検出対象物の実世界における平均的高さPは、検出対象物により決定される。また、軌道幅Rは、鉄道車両が走行する軌道により決定される。物体検出モデルへの入力画像の1辺の長さiは、物体検出モデルの仕様により決定される。
【0044】
物体検出のために要求される高さpは、物体検出モデルに対する要求検出精度や入力画像の鮮明度に依存し得る。入力画像の鮮明度は、周囲環境、例えば天候や時間帯により変化し得る。ROI幅を小さくすることは、物体検出モデルに入力される画像における検出対象物の高さを大きくすることを意味する。
【0045】
本明細書の一実施形態は、ROI係数を決定するために、検出条件とROI係数を決定するための係数を管理情報データベース120内に保持する。以下において、管理情報データベース120に含まれる、検出条件とROI係数を関連付けるための情報を説明する。
【0046】
図4Aは、検出対象物の係数テーブル410の構成例を示す。検出対象物の係数テーブル410は、検出対象物とROI係数を算出するための係数とを関連づける。検出対象物の係数テーブル410は、検出対象物欄411と係数欄412を含む。ユーザは、入力装置114を介して、検出対象物欄411が示す検出対象物における1又は複数の検出対象物を指定することができる。複数の検出対象物が指定されている場合、最も小さい係数が、ROI係数の算出のために選択される。
【0047】
図4Bは、障害物検出モデルと検出精度の係数テーブル420の構成例を示す。障害物検出モデルと検出精度の係数テーブル420は、障害物の検出モデル(検出プログラム)に対して要求される必要検出精度と係数との関係を管理する。障害物検出モデルと検出精度の係数テーブル420は、検出モデル欄421、必要検出精度欄422、及び係数欄423を含む。
【0048】
検出モデル欄421は、障害物検出モデルの種類を示す。必要検出精度欄422は、障害物検出に要求される精度の最低値を示す。係数欄423は、検出モデル及び必要検出精度の組み合わせに対する係数を示す。係数は、ROI係数の算出に使用される。本例において、ROI係数の算出で必要な障害物検出モデルへの入力画像サイズの情報は、係数欄423の係数に含まれている。例えば、必要精度が95%以上である場合、係数は検出モデルへ入力される画像サイズと一致する。障害物検出モデル及び必要検出精度は、例えば、入力装置114を介してユーザにより指定され、管理情報データベース120に格納される。
【0049】
図4Cは、軌道幅の係数テーブル430の構成例を示す。軌道幅の係数テーブル430は、軌道幅と係数との関係を管理する。軌道幅の係数テーブル430は、軌道幅欄431及び係数欄432を含む。軌道幅は、例えば、入力装置114を介してユーザにより指定され、管理情報データベース120に格納される。
【0050】
図4Dは、天候及び時間帯の係数テーブル440の構成例を示す。天候及び時間帯の係数テーブル440は、障害物検出時の天候及び時間帯と係数との関係を管理する。天候及び時間帯の係数テーブル440は、天候欄441、時間帯欄442、及び係数欄443を含む。天候欄441は、晴れや雨といった天候を示し、時間帯欄442は、昼や夜間といった時間帯を示す。なお、天候欄や時間帯欄は、他の方法で、天候や時間帯を示してもよい。係数欄423は、天候及び時間帯の組み合わせに対する係数を示す。
【0051】
天候及び時間帯は、例えば、運行開始前に入力装置114を介してユーザにより指定され、管理情報データベース120に格納されてもよい。検出条件判定部102は、センサや外部システムからの情報に基づき、天候及び時間帯を決定してもよい。例えば、検出条件判定部102は、外部の気象情報システムや気象センサを使用して天候を判定することができる。検出条件判定部102は、タイマや照度センサを使用して時間帯を判定できる。
【0052】
上述のように、本明細書の一実施形態において、検出条件は、検出対象物、必要検出精度、実世界における軌道幅、天候、時間帯等を含むことができる。ROI係数決定部304は、検出条件(検出対象物、検出モデル、必要検出精度、軌道幅、天候、時間帯)をキーとして、テーブル410、420、430及び440から係数を取得する。ROI係数決定部304は、取得した全ての係数と検出条件によらない定数を積算することによって、ROI係数を算出する。
【0053】
なお、
図4Aから4Dに示す条件の一部の条件が省略され、又は、他の条件が追加されてもよい。例えば、障害物検出モデルと検出精度の係数テーブル420及び天候及び時間帯の係数テーブル440が省略されてもよい。
【0054】
次に、建築限界内障害物検出システム10の動作を説明する。
図5は、建築限界内障害物検出システム10の動作のフローチャートを示す。ステップ501において、画像取得部101は、外部のカメラから、入力画像を受け取る。
【0055】
ステップ502において、軌道検出部103は、入力画像内の軌道を検出する。軌道の検出は画像処理で行ってもよいし、GPSや地図データから入力画像内の軌道の座標を算出してもよい。軌道は、鉄道車両の先端から延びているため、障害物等と比較して用意に検出することが可能である。軌道の座標は、例えば、左右レール間の中心線を示す。上述のように、入力画像の左上の角を原点とし、縦方向をv座標、横方向をu座標とする。軌道の座標は、中心線の各点のu座標及びv座標を示す。例えば、画像の上から下にv座標の値が増加し、左から右にu座標の値が増加する。
【0056】
さらに、建築限界領域判定部104は、建築限界を決定する。建築限界は2本の建築限界線で構成され、建築限界線で確定される領域が建築限界領域である。建築限界領域は軌道のu座標を中心として、軌道幅の定数倍の幅を持つ領域である。実世界での建築限界の幅をL[m]、実世界での軌道の幅をR[m]とする場合、定数はL/Rである。Lの値は予め設定され、例えば、管理情報データベース120に格納されている。
【0057】
次に、ステップ503において、検出条件判定部102が前述の方法により検出条件を判定する。上記例において、検出条件判定部102は、検出対象物、物体検出モデル、必要検出精度、軌道幅、天候及び時間帯を決定する。
【0058】
ステップ505において、ROI処理部106は、ステップ502における軌道及び建築限界領域の検出結果、並びに、ステップ503において判定された検出条件に基づいて、必要十分な数、大きさのROIを決定する。ステップ505におけるROI処理部106の処理の詳細は後述する。
【0059】
ステップ506において、障害物検出部107は、全てのROIに対して障害物検出処理を行う。障害物が検出された場合(507:YES)、フローはステップ508に進む。ステップ508において、結果出力部108は、障害物検出アラートを発報する。結果出力部108は、運転手に対するヒューマンインタフェースを操作可能である場合、運転手に対して警告を行ってもよいし、鉄道車両の運転制御装置と接続されている場合に車両の減速処理を行ってもよい。
【0060】
ステップ508の後、フローはステップ509に進む。ステップ506において障害物が検出されなかった場合(507:NO)、フローは、ステップ509にすすむ。ステップ509において、画像取得部101は、次に処理するべき入力画像があるか判定する。次に処理するべき入力画像がある場合(509:YES)、フローはステップ501に戻り、次の入力画像が受け取られる。次に処理するべき入力画像がない場合(509:NO)、本処理は終了する。
【0061】
以下において、ステップ505で行われるROI処理部106の処理の詳細を説明する。
図6は、ステップ505のROI処理部106による処理のフローチャートを示す。ステップ601において、画像入力部301は、入力画像を受け取る。入力画像は、例えば、
図2に示すような画像である。
【0062】
ステップ602において、軌道検出結果入力部302は、軌道検出部103から軌道検出結果を受け取る。さらに、建築限界領域入力部305は、建築限界領域判定部104から、建築限界領域の情報を受け取る。ステップ603において、検出条件入力部303は、検出条件判定部102から、検出条件を受け取る。
【0063】
ステップ604でROI係数決定部304は、ROI係数を決定する。具体的には、ROI係数決定部304は、検出条件入力部303から取得した検出条件に応じて、検出対象物の係数テーブル410、障害物検出モデルと検出精度の係数テーブル420、軌道幅の係数テーブル430及び天候及び時間帯の係数テーブル440から、係数を取得する。ROI係数決定部304は、取得した係数及び所定の定数の積を、ROI係数として算出する。
【0064】
ステップ605において、ROI決定部306は、入力画像における検出開始地点のv座標v1を決定する。v1は、監視対象となる地点において、車両から最も遠い地点のv座標である。つまり、画像における最も上の監視対象地点であり、監視対象地点のv座標の内の最小値である。v1の決定方法の一例は、検出された軌道の座標(軌道中心線の座標)において、車両から最も遠い地点をv1とする。他の例は、鉄道車両の走行速度から算出された制動距離に基づきv1を決定してもよい。ここで変数kに1が代入される。
【0065】
ステップ606において、ROI決定部306は、画面内でのv座標vkの地点での軌道の幅wkにROI係数をかけることで、第k番目のROIであるROIkの幅rkを決定する。上述のように、ROIは正方形であるとする。ROIkの上辺のv座標は、vkである。vkは、ROIkの基準縦座標値である。
【0066】
次に、ステップ607において、ROI決定部306は、ROIkが建築限界領域をカバーできなくなる地点(位置)、つまり、建築限界領域が、ROIkから最初に外れる地点を探す。その地点のv座標をvk+1とする。
【0067】
ROIkが建築限界領域をカバーできなくなる、3パターンの態様が存在する。また、第4のパターンとして、そのような地点がない場合、つまり、ROIkが画像内の建築限界領域の最も手前の端をカバーする場合がある。ROI決定部306は、ROIkと画像内の軌道との関係から、上記4パターンのいずれのパターンがROIkに当てはまるか判定する。
【0068】
建築限界領域がROIkから外れる地点は、ROIkの形状及び位置に依存する。上述のように、ROIkの1辺の長さrk及び上側辺のv座標vkは、既に決定されており、ROIkのu座標が未定である。ROIkの最終的なu座標は、後述するステップ608で決定される。ROI決定部306は、ROIkのu座標を調整して、上記いずれのパターンに該当するか判定する。
【0069】
図7は、ROI
kが建築限界領域をカバーできなくなる、第1のパターンを模式的に示す。第1パターンにおいて、2本の建築限界線の双方が、ROI
kの上側辺及び下側辺と交差する。
【0070】
図7に示す入力画像において、手前から前方に軌道210が延びている。つまり、入力画像の下側から上側に軌道210が延びている。
図7においてu座標が左から右に増加し、v座標は上から下に増加する。
【0071】
図7は、連続する二つのROIを示し、先のROI
kと次のROI
k+1を示す。第1のパターンにおいて、軌道210の2本の建築限界線220A、220Bは、それぞれ、ROI
kの上側辺と下側辺と交差している。ROI
kの上側辺における軌道210の中心C
kは、座標(u
k,v
k)を有している。
【0072】
ROIkの上側辺、つまりv座標vkにおいて、軌道210は幅wkを有し、建築限界領域は幅lkを有している。ROIkは、幅rkを有している。軌道210及建築限界領域の幅は、u軸に沿った長さである。上述のように、lk=(L/R)wkの関係が成立する。
【0073】
建築限界線220A、220BのROIkとの二つの下側交点は、共に、ROIkの下側辺に存在する。そのため、ROIkが建築限界領域をカバーできなくなる地点のv座標は、ROIkの下側辺のv座標である。ROIkが建築限界領域をカバーできなくなる地点のv座標が、次のROIk+1の上側辺のv座標vk+1である。
【0074】
つまり、次のROIk+1の上側辺のv座標vk+1は、ROIkの下側辺のv座標(vk+rk)と一致する。ROIk+1の上側辺と軌道210の中心線との交点Ck+1は、座標(uk+1,vk+1)を有している。
【0075】
ROIk+1の上側辺、つまりv座標vk+1において、軌道210は幅wk+1を有し、建築限界領域は幅lk+1を有している。ROIk+1は幅rk+1を有している。lk+1=(L/R)wk+1の関係が成立する。
【0076】
第1のパターンにおいて、2本の建築限界線とROIkの下側交点の双方がROIkの下側辺上に存在する、ROIkの横座標値が存在する。この横座標値を、対象物検出処理を行うためのROIkの横座標値とすることができる。
【0077】
図8は、ROI
kが建築限界領域をカバーできなくなる、第2のパターンを模式的に示す。第2のパターンにおいて、左側建築限界線は、ROI
kの上側辺及び左側辺と交差する。右側建築限界線は、ROI
kの上側辺及び右側辺と交差する。
【0078】
図8の例において、軌道210の左側建築限界線220Aは、ROI
kの上側辺と左側辺と交差している。軌道210の右側建築限界線220Bは、ROI
kの上側辺と右側辺と交差している。
【0079】
ROIkの上側辺における軌道210の中心Ckは、座標(uk,vk)を有している。ROIkの上側辺、つまりv座標vkにおいて、軌道210は幅wkを有し、建築限界領域は幅lkを有している。ROIkは、幅rkを有している。軌道210及建築限界領域の幅は、u軸に沿った長さである。lk=(L/R)wkの関係が成立する。
【0080】
建築限界線220AとROI
kとの下側交点は、ROI
kの左側辺上にあり、建築限界線220BとROI
kとの下側交点は、ROI
kの右側辺上にある。
図8の例において、これら下側交点のv座標は同一である。そのため、ROI
kが建築限界領域をカバーできなくなる地点のv座標は、建築限界線220A、220BとROI
kの下側交点のv座標である。
【0081】
ROIkが建築限界領域をカバーできなくなる地点のv座標が、次のROIk+1の上側辺のv座標vk+1である。つまり、次のROIk+1の上側辺のv座標vk+1は、これら下側交点のv座標と一致する。ROIk+1の上側辺と軌道210の中心線との交点Ck+1は、座標(uk+1,vk+1)を有している。
【0082】
ROIk+1の上側辺、つまりv座標vk+1において、軌道210は幅wk+1を有し、建築限界領域は幅lk+1を有している。ROIk+1は幅rk+1を有している。lk+1=(L/R)wk+1の関係が成立する。建築限界領域の幅lk+1は、ROIk+1の幅rk+1と同一である。つまり、建築限界領域の幅lk+1とROIk+1の幅rk+1と同一となる位置が、ROIkが建築限界領域をカバーできなくなる地点の位置である。
【0083】
第2のパターンにおいて、2本の建築限界線とROIkの下側交点が、ROIkの左側辺及び右側辺のそれぞれの上に位置する、ROIkの横座標値が存在する。下側交点の縦座標位置が同一となるように、対象物検出処理を行うためのROIkの横座標値を決定できる。
【0084】
図9は、ROI
kが建築限界領域をカバーできなくなる、第3のパターンを模式的に示す。第3のパターンにおいて、左側建築限界線又は右側建築限界線の一方は、ROI
kの上側辺及び左側辺又は右側辺と交差する。左側建築限界線又は右側建築限界線の他方は、ROI
kの上側辺及び下側辺と交差する。
【0085】
図9の例において、軌道210が大きくカーブしている。軌道210の左側建築限界線220Aは、ROI
kの上側辺と左側辺と交差している。軌道210の右側建築限界線220Bは、ROI
kの上側辺と下側辺と交差している。
【0086】
ROIkの上側辺における軌道210の中心Ckは、座標(uk,vk)を有している。ROIkの上側辺、つまりv座標vkにおいて、軌道210は幅wkを有し、建築限界領域は幅lkを有している。ROIkは、幅rkを有している。軌道210及建築限界領域の幅は、u軸に沿った長さである。lk=(L/R)wkの関係が成立する。
【0087】
建築限界線220AとROIkとの下側交点は、ROIkの左側辺上にあり、建築限界線220BとROIkとの下側交点は、ROIkの下側辺上にある。2本の建築限界線の下側交点の内、より上側、つまりより遠い交点の位置が、ROIkが建築限界領域をカバーできなくなる地点の位置である。
【0088】
ROIkが建築限界領域をカバーできなくなる地点のv座標が、次のROIk+1の上側辺のv座標vk+1である。つまり、次のROIk+1の上側辺のv座標vk+1は、2本の建築限界線の下側交点の内、より上側、つまりより遠い交点のv座標である。この点は、第1及び第2のパターンにおいて同様である。
【0089】
ROIk+1の上側辺と軌道210の中心線との交点Ck+1は、座標(uk+1,vk+1)を有している。ROIk+1の上側辺、つまりv座標vk+1において、軌道210は幅wk+1を有し、建築限界領域は幅lk+1を有している。ROIk+1は幅rk+1を有している。lk+1=(L/R)wk+1の関係が成立する。
【0090】
上述のように、第3のパターンにおいて、軌道210の中心線のu座標が大きく変化している。ROIkが建築限界領域をカバーできなくなる位置は、建築限界領域の幅に対して、ROIkの幅rkが足りなくなる地点、すなわち(|uk+1-uk|+(lk+lk+1)/2)=rkとなる地点である。
【0091】
第3のパターンにおいて、2本の建築限界線の一方とROIkとの下側交点がROIkの右側辺又は左側辺上に位置し、かつ、2本の建築限界線の他方とROIkとの下側交点がROIkの下側辺上に位置する、ROIkの横座標値が存在する。2本の建築限界線の一方とROIkの上側交点が、2本の建築限界線の一方の下側交点と反対側で、ROIkの上側角と一致するように、対象物検出処理を行うためのROIkの横座標値を決定できる。
【0092】
図7から9を参照して説明したように、建築限界領域は、2本の建築限界線220A、220Bで画定される。ROI決定部306は、各建築限界線とROI
kとの二つ交点の内、より近い、つまりv座標が大きい交点を選択する。さらに、ROI決定部306は、2本の建築限界線の選択した交点の内、より遠い交点を、ROI
kが建築限界領域をカバーできなくなる地点と決定する。つまり、2本の建築限界線とROIとの2つの下側交点おける最上位置が、画像において最も下の位置となるように、ROIの横座標値が決定される。
【0093】
第4のパターンは、ROIkが画面下端に到達し、ROI1~ROIkによって入力画像内の建築限界領域の全域がカバーされている場合である。
【0094】
上記例においてに、軌道の幅を測定するv座標vkが、ROIkの上端のv座標値として使用されている。v座標vkは、ROIkの基準縦座標値である。他の例において、ROIkの上端のv座標値が、vkから異なる、例えば、vkより上であってもよい。
【0095】
図6に戻って、上述のように、ステップ607において、ROI決定部306は、ROI
kが建築限界領域をカバーできなくなる地点を特定し、そのパターンを判定する。次に、ステップ608において、ROI決定部306は、ROI
kの中心u座標を決定する。ROI決定部306は、ROI
kが建築限界領域をカバーできなくなるパターンに応じて、ROI
kの中心u座標を決定することができる。
【0096】
第1のパターンの場合、ROI決定部306は、ROI
kの上側辺(v座標v
k)での軌道の中心のu座標と、下側辺(v座標v
k+1)での軌道の中心のu座標との、平均値を、ROI
kの中心のu座標と決定する。これにより、ROI
kは、v座標v
kからv座標v
k+1までの建築限界領域の全領域を確実に含むことができる。
図7のROI
kは、この条件を満たす。
【0097】
第2のパターンの場合、2本建築限界線とROI
kの左右側辺との交点のv座標が同一となるように、ROI
kの中心のu座標が決定される。ROI
kの中心のu座標とv座標v
k+1における軌道の中心のu座標は一致する。これにより、ROI
kは、v座標v
kからv座標v
k+1までの建築限界領域の全領域を含むことができる。
図8のROI
kは、この条件を満たす。
【0098】
第3のパターンの場合、ROI決定部306は、(u
k+l
k/2-r
k/2(u
k>u
k+1のとき))、又は、(u
k-l
k/2+r
k/2(u
k<u
k+1のとき))を、ROI
kの中心のu座標と決定してよい。これにより、ROI
kは、v座標v
kからv座標v
k+1までの建築限界領域の全領域を含むことができる。建築限界線の一方は、ROI
kの上側角と交差する。
図9のROI
kは、この条件を満たす。
【0099】
第4のパターンの場合、ROI決定部306は、v座標vkでの軌道の中心のu座標を、ROIkの中心のu座標と決定する。これにより、ROIkは、画像内の建築限界領域の全領域を含むことができる。
【0100】
なお、各パターンにおけるROIkのu座標値は、上記方法と異なる方法で決定されてもよい。例えば、全てのパターンにおいて、v座標vkでの軌道の中心のu座標を、ROIkの中心のu座標と決定してもよい。
【0101】
次に、ステップ610において、ROI決定部306は、ROI
kが建築限界領域をカバーできなくなる地点(v座標v
k+1)が検出されたか判定する。ROI
kが建築限界領域をカバーできなくなる地点が存在しない、つまり、第4のパターンの場合(610:NO)、フローは、ステップ612に進む。ROI出力部307は、全てのROIを出力する。これにより、
図5におけるステップ505のROI決定処理が完了する。
【0102】
ROIkが建築限界領域をカバーできなくなる地点が検出された場合、つまり、第1、第2又は第3のパターンの場合(610:YES)、ステップ611において、ROI決定部306はkに1を加えてる。その後、フローは、ステップ606に戻り、v座標vkの新たな位置において、次のROIを決定する。
【0103】
以上の手順によって、遠近の範囲にわたり、入力画像における建築限界領域が、1以上のROIでカバーされる。一つの入力画像に対して複数のROIが定義される場合、各ROIの中において、検出条件で定められた必要検出精度で対象物を検出することができる。
【0104】
図10は、一つの入力画像に対して形成された複数のROIの例を示す。
図10において、入力画像20に対して、三つのROIが形成され、三つのROIによって、入力画像20における全建築限界領域がカバーされている。三つのROIは、ROI
1、ROI
2、ROI
3である。ROI
1及びROI
2は、
図8を参照して説明した第2のパターンのROIであり、ROI
3は第4のパターンのROIである。各のROIは、その領域内で対象物を検出できる検出限界を示す。
【0105】
上述のように、ROI決定部306は、最初のROIであるROI1のv座標v1及びROI係数を決定する。ROI係数とv座標v1における軌道幅から、ROI1の1辺の長さが決定される。ROI1の上側辺、つまりv座標v1において、軌道210は幅w1を有し、建築限界領域は幅l1を有している。ROI1は、幅r1を有している。
【0106】
ROI決定部306は、ROI
1のu座標を必要に応じて調整して、ROI
1と建築限界との関係を判定する。ROI
1と軌道210との関係は第2のパターンである。
図10において、軌道210の左側建築限界線220Aは、ROI
1の上側辺と左側辺と交差している。軌道210の右側建築限界線220Bは、ROI
1の上側辺と右側辺と交差している。
【0107】
建築限界線220AとROI1との交点と、建築限界線220BとROI1との下側交点とは、同一のv座標を有するように、ROI1の中心のu座標は決定される。ROI1が建築限界領域をカバーできなくなる地点のv座標は、建築限界線220A、220BとROIkの下側交点のv座標v2である。
【0108】
ROI決定部306は、v座標v2において、次のROI2を形成する処理を行う。ROI2の形成は、上記ROI1の形成と同様である。ROI2の上側辺、つまりv座標v2において、軌道210は幅w2を有し、建築限界領域は幅l2を有している。ROI2は、幅r2を有している。建築限界線220A、220Bは、v座標v3において、ROI2の左右側辺と交差している。
【0109】
最後に、ROI3が、v座標v3において形成される。v座標v3において、軌道210は幅w3を有し、建築限界領域は幅l3を有している。ROI3は、幅r3を有している。ROI3と建築限界領域との関係は第4のパターンである。ROI3の中心のu座標は、v座標v3における軌道210の中心のu座標と一致するように決定される。
【0110】
なお、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0111】
また、上記の各構成・機能・処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード等の記録媒体に置くことができる。
【0112】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0113】
10 建築限界内障害物検出システム
101 画像取得部
102 検出条件判定部
103 軌道検出部
104 建築限界領域判定部
106 ROI処理部
107 障害物検出部
108 結果出力部
120 管理情報データベース
111 演算装置
112 主記憶装置
113 補助記憶装置
114 入力装置
115 出力装置
116 通信インターフェース
301 画像入力部
302 軌道検出結果入力部
303 検出条件入力部
304 ROI係数決定部
205 建築限界領域入力部
306 ROI決定部
307 ROI出力部