(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023105835
(43)【公開日】2023-08-01
(54)【発明の名称】環境地図生成装置、環境地図生成方法およびプログラム
(51)【国際特許分類】
G06T 7/70 20170101AFI20230725BHJP
G06T 7/00 20170101ALI20230725BHJP
【FI】
G06T7/70 Z
G06T7/00 350B
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022006804
(22)【出願日】2022-01-20
(11)【特許番号】
(45)【特許公報発行日】2023-04-07
(71)【出願人】
【識別番号】591036457
【氏名又は名称】三菱電機エンジニアリング株式会社
(74)【代理人】
【識別番号】110003166
【氏名又は名称】弁理士法人山王内外特許事務所
(72)【発明者】
【氏名】西田 大輔
(72)【発明者】
【氏名】平 謙二
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096AA09
5L096CA04
5L096CA05
5L096DA02
5L096FA09
5L096FA62
5L096FA66
5L096FA67
5L096FA69
5L096HA11
5L096KA04
(57)【要約】
【課題】 環境地図の生成に用いられる3次元点群データが不要に削減されることを防止できる、環境地図生成装置、環境地図生成方法およびプログラムを提供する。
【解決手段】 環境地図生成装置(1)は、LiDAR(2)が計測した対象空間の3次元点群データおよびカメラ(3)が撮像した対象空間の映像データを取得するデータ取得部(11)と、3次元点群データから、対象空間内の物体の特徴点データを抽出する特徴点抽出部(13)と、LiDAR(2)の位置および姿勢を推定する位置姿勢推定部(14)と、3次元点群データと、LiDAR(2)の位置および姿勢の推定結果に基づいて、対象空間の環境地図を生成する環境地図生成部(15)と、映像データに映る可動物体が動いているか否かを判定する物体検出部(16)と、環境地図データの生成に用いられる3次元点群データの中から、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去するデータ除去部(17)と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
センサが対象領域を計測して得られた3次元点の集合である3次元点群データと、撮像装置が前記対象領域を撮像した映像データとを取得するデータ取得部と、
前記3次元点群データから、前記対象領域内に存在する物体の特徴点データを抽出する特徴点抽出部と、
前記特徴点データを用いて前記センサの位置および姿勢を推定する位置姿勢推定部と、
前記3次元点群データと、前記センサの位置および姿勢の推定結果とに基づいて、前記対象領域の環境地図データを生成する環境地図生成部と、
前記映像データに映る物体の中から、動くことが可能な物体である可動物体を検出し、検出した前記可動物体が動いているか否かを判定する物体検出部と、
前記環境地図データの生成に用いられる前記3次元点群データの中から、動いていないと判定された前記可動物体の前記3次元点群データを除去せず、動いていると判定された前記可動物体の前記3次元点群データを除去するデータ除去部と、を備えた
ことを特徴とする環境地図生成装置。
【請求項2】
前記データ除去部は、動いていないと判定された前記可動物体を、生成された前記環境地図データから除去する
ことを特徴とする請求項1に記載の環境地図生成装置。
【請求項3】
前記3次元点群データを構成する3次元点と前記映像データを構成するフレーム画像における画素との対応関係を特定し、3次元点に色情報を付加した前記3次元点群データを生成する色情報付加部を備えた
ことを特徴とする請求項1または請求項2に記載の環境地図生成装置。
【請求項4】
前記物体検出部は、前記映像データが入力されると、前記映像データを構成するフレーム画像に前記可動物体が映っているか否かを推論する学習済みモデルを用いて、前記可動物体を検出する物体推論部と、前記映像データを構成するフレーム画像に映る前記可動物体の画像領域を特定し、特定した前記可動物体の画像領域に基づいて当該可動物体が動いているか否かを判定する物体領域特定部と、を備えた
ことを特徴とする請求項1から請求項3のいずれか1項に記載の環境地図生成装置。
【請求項5】
前記物体検出部は、前記映像データに映る物体の中から除去対象物体をさらに検出し、
前記データ除去部は、前記環境地図データの生成に用いられる前記3次元点群データの中から、前記除去対象物体の前記3次元点群データを除去する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の環境地図生成装置。
【請求項6】
データ取得部、特徴点抽出部、位置姿勢推定部、物体検出部、環境地図生成部、およびデータ除去部を備えた環境地図生成装置の環境地図生成方法であって、
前記データ取得部が、センサが対象領域を計測した3次元点の集合である3次元点群データと、撮像装置が前記対象領域を撮像した映像データとを取得するステップと、
前記特徴点抽出部が、前記3次元点群データから、前記対象領域内に存在する物体の特徴点データを抽出するステップと、
前記位置姿勢推定部が、前記特徴点データを用いて前記センサの位置および姿勢を推定するステップと、
前記環境地図生成部が、前記3次元点群データと、前記センサの位置および姿勢の推定結果とに基づいて、前記対象領域の環境地図データを生成するステップと、
前記物体検出部が、前記映像データに映る物体の中から、動くことが可能な物体である可動物体を検出し、検出した前記可動物体が動いているか否かを判定するステップと、
前記データ除去部が、前記環境地図データの生成に用いられる前記3次元点群データの中から、動いていないと判定された前記可動物体の前記3次元点群データを除去せず、動いていると判定された前記可動物体の前記3次元点群データを除去するステップと、を備えた
ことを特徴とする環境地図生成方法。
【請求項7】
コンピュータを、請求項1から請求項5のいずれか1項に記載の環境地図生成装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、環境地図生成装置、環境地図生成方法およびプログラムに関する。
【背景技術】
【0002】
現実空間に対応する3次元の環境地図を生成するための従来の技術として、SLAM(Simultaneous Localization And Mapping)が知られている。SLAMは、自己位置の推定と3次元環境地図の生成とを同時に行う技術である。SLAMのうち、Visual SLAMは、映像を用いて、自己位置の推定と3次元環境地図の生成を行うものである。このVisual SLAMを、単にSLAMということもある。
【0003】
Visual SLAMにおいては、カメラが周辺空間の映像を連続的に撮像し、3次元計測センサが周辺空間を連続的に計測して、周辺空間の映像と、周辺空間の3次元点の座標である3次元点群データが取得される。映像を構成する各フレーム画像における画素とこれに対応する3次元点とが対応付けられ、3次元点に対し、対応する画素の色情報が付加される。そして、色情報が付加された3次元点群データを用いて、自己位置(3次元計測センサ等の位置)の推定と、3次元の環境地図データの生成とが行われる。
【0004】
また、3次元計測センサには、例えば、3次元のLiDAR(Light Detection And Ranging)が用いられる。3次元のLiDARは、レーザ光を用いて対象点の3次元座標を計測するレーザセンサである。
【0005】
SLAMでは、周辺空間にあるランドマーク(陸標)を目印として、自己位置(LiDARの位置)の推定が行われる。LiDARによる周辺空間の3次元計測では、周辺空間内を移動している物体がランドマークとして誤認識される場合がある。この場合、ランドマークと誤認識された物体が移動することにより、本来、一定の位置にあるランドマークが移動したように認識され、自己位置を推定できずに喪失する可能性がある。また、自己位置を推定できたとしても、フレーム画像間の画素と3次元点との対応付けに誤差が生じて3次元環境地図の精度が低下する。
【0006】
上記不具合に対し、例えば、特許文献1には、LiDARが計測した3次元距離画像であるポイントクラウドから、歩行者、車両等の動的な交通参加者の計測データを除去し、残ったポイントクラウドのデータを用いて、SLAMを実行する方法が記載されている。動的な交通参加者は、ランドマークと誤って認識される虞があるので、その計測データをポイントクラウドから除去することで、動的な交通参加者に起因した不具合の発生を低減できる。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1に記載される従来の技術は、予め定められた動的な交通参加者の3次元点群データを除去する。このため、動的な交通参加者といった可動物体であるが、計測中に動いておらず、ランドマークとされても環境地図の精度に影響を与えないものであっても、その3次元点群データが除去される。この場合、環境地図データの生成に用いられる3次元点群データが過剰に削減されるので、環境地図の精度が低下するという課題があった。
【0009】
本開示は、上記課題を解決するものであり、環境地図データの生成に用いられる3次元点群データが過剰に削減されることを防止できる、環境地図生成装置、環境地図生成方法およびプログラムを得ることを目的とする。
【課題を解決するための手段】
【0010】
本開示に係る環境地図生成装置は、センサが対象領域を計測した3次元点の集合である3次元点群データおよび撮像装置が対象領域を撮像した映像データを取得するデータ取得部と、3次元点群データから、対象領域内に存在する物体の特徴点データを抽出する特徴点抽出部と、3次元点群データを用いてセンサの位置および姿勢を推定する位置姿勢推定部と、特徴点データとセンサの位置および姿勢の推定結果とに基づいて、対象領域の環境地図データを生成する環境地図生成部と、映像データに映る物体の中から、動くことが可能な物体である可動物体を検出し、検出した可動物体が動いているか否かを判定する物体検出部と、環境地図データの生成に用いられる3次元点群データの中から、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去するデータ除去部と、を備える。
【発明の効果】
【0011】
本開示によれば、映像データに映る物体の中から、動くことが可能な物体である可動物体を検出し、検出した可動物体が動いているか否かを判定して、環境地図データの生成に用いられる3次元点群データの中から、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去する。
これにより、本開示に係る環境地図生成装置は、環境地図の生成に用いられる3次元点群データが過剰に削減されることを防止できる。
【図面の簡単な説明】
【0012】
【
図1】実施の形態1に係る環境地図生成装置の構成を示すブロック図である。
【
図3】フレーム画像から可動物体を検出する処理の概要を示す概要図である。
【
図4】可動物体が動いているか否かの判定処理の概要を示す概要図である。
【
図6】一部の土を運び出した盛り土の環境地図を示す画面図である。
【
図7】実施の形態1に係る環境地図生成方法を示すフローチャートである。
【
図8】
図8Aおよび
図8Bは実施の形態1に係る環境地図生成装置の機能を実現するハードウェア構成を示すブロック図である。
【発明を実施するための形態】
【0013】
実施の形態1.
図1は、実施の形態1に係る環境地図生成装置1の構成を示すブロック図である。
図1において、環境地図生成装置1は、LiDAR2が対象領域を計測して得られた3次元点群データとカメラ3が対象領域を撮像した映像データを取得し、3次元点群データおよび映像データを用いて、対象領域について3次元の環境地図データを生成する。例えば、環境地図生成装置1は、計測作業者が携帯可能であり、LiDAR2およびカメラ3を備えた端末に搭載される。また、環境地図生成装置1は、LiDAR2およびカメラ3とは別に設けられ、LiDAR2およびカメラ3と有線または無線で通信可能な装置であってもよい。
【0014】
LiDAR2は、予め定められた計測周期(例えば、100ミリ秒ごと)で対象領域に照射したレーザパルスの反射光を受光して距離を計測し、計測した距離で特定される3次元点の集合である、3次元点群データを検出するセンサである。LiDAR2は、移動体に搭載される。移動体は、例えば、対象領域の周辺を移動可能な車両、対象領域の上空を移動可能な飛行物体または作業者が携帯して移動可能な端末が挙げられる。移動体が移動しながら、LiDAR2が対象領域を計測する。LiDAR2は、対象領域内に存在する物体までの距離を3次元点の深度として計測し、3次元点の集合である3次元点群データを出力する。
【0015】
カメラ3は、対象領域を撮像して、映像データを得る撮像装置である。カメラ3は、単眼カメラであってもよいが、ステレオカメラであってもよい。対象領域の映像データは、例えば、一定のフレームレート(例えば、20fps)で撮像された複数のフレーム画像から構成される。フレーム画像はRGB画像データであり、各画素は色情報を有する。
【0016】
また、カメラ3の撮像視野は、LiDAR2の計測範囲と同等であることが望ましい。例えば、カメラ3は、上記移動体にLiDAR2とともに搭載され、LiDAR2が周囲360度の計測を行うセンサである場合、カメラ3も周囲360度の撮像が行えるものが使用される。また、カメラ3は、一台に限らず、複数のカメラ3を用いてLiDAR2の計測範囲と同等の撮像視野を実現してもよい。
【0017】
また、LiDAR2とカメラ3の位置関係は、予め実施したキャリブレーションされて相関がとれている。例えば、移動体にLiDAR2およびカメラ3が搭載され、当該移動体が対象領域の周辺を移動しながら、LiDAR2による計測およびカメラ3による撮像が行われる場合、LiDAR2が計測する3次元点群データは、カメラ3が撮像する映像のフレームごとに同期がとれている。
【0018】
データ取得部11は、LiDAR2が対象領域を計測した3次元点の集合である3次元点群データと、カメラ3が対象領域を撮像した映像データとを取得する。例えば、データ取得部11は、LiDAR2およびカメラ3との間で、有線または無線の通信により接続されている。データ取得部11は、LiDAR2が予め定められた計測周期で対象領域を計測して得られた3次元点群データと、LiDAR2の計測に伴いカメラ3によって撮像された対象領域の映像データを取得し、取得したデータを色情報付加部12に出力する。
【0019】
色情報付加部12は、3次元点群データを構成する3次元点と、映像データを構成するフレーム画像における画素との対応関係を特定して、3次元点に対応する画素の色情報を付加した3次元点群データを生成する。例えば、LiDAR2とカメラ3との位置関係はキャリブレーションされているので、3次元点群データは、映像データのフレームごとに同期がとれている。この位置関係に基づいて、色情報付加部12は、3次元点群データにおける3次元点の位置とこれに対応する画素の位置とを特定し、3次元点に対応する画素の色情報を付加する。
【0020】
なお、3次元点群データにおける3次元点の深度情報のみを用いて、環境地図データを生成する場合、3次元点に色情報を付与する必要はない。この場合、環境地図生成装置1は、色情報付加部12は備えていなくてもよい。すなわち、データ取得部11が取得した3次元点群データはそのまま特徴点抽出部13に出力され、3次元点群データから特徴点の抽出が行われる。
【0021】
特徴点抽出部13は、対象領域内に存在する物体の特徴点データを、3次元点群データから抽出する。特徴点データは、対象領域内に存在する物体の表面、凹凸またはエッジといった視覚的に他の部分と区別でき、特徴があるとみなせる点(特徴点)に対応する3次元点データである。例えば、特徴点抽出部13は、映像データを構成するフレーム画像に映る物体の特徴点を抽出し、抽出した特徴点の画素に対応する3次元点データを、3次元点群データに含まれる複数の3次元点データから、特徴点データとして抽出する。
【0022】
位置姿勢推定部14は、特徴点抽出部13が抽出した特徴点データを用いて、移動体に搭載または携帯されて移動するLiDAR2の位置および姿勢を推定する。例えば、位置姿勢推定部14は、特徴点データを用いて、対象領域におけるランドマークを認識する。ランドマークは、対象領域で位置が固定されて、地理上の目印となる地物である。
【0023】
位置姿勢推定部14は、ランドマークの位置を、例えば、ランドマークの中心座標で表して、特徴点データから複数のランドマークの位置に対応する距離データを特定する。位置姿勢推定部14は、SLAM技術を用い、時刻t-1に得られたランドマークとの距離データおよび移動体の進行方向に基づいて、時刻tにおけるLiDAR2の位置および姿勢を推定する。LiDAR2の姿勢は、例えば、移動体の進行方向に対する方位角および仰角である。LiDAR2の位置および姿勢の推定結果を示すオドメトリ情報は、環境地図生成部15に出力される。
【0024】
環境地図生成部15は、3次元点群データと、LiDAR2の位置および姿勢の推定結果を示すオドメトリ情報とに基づいて、対象領域の環境地図データを生成する。環境地図データは、3次元点群データにより構成された3次元地図を示すデータである。環境地図のそれぞれの3次元点には、色情報が付加されている。例えば、環境地図生成部15は、時刻t-1におけるLiDAR2の位置および姿勢に応じた環境地図データを生成し、時刻tにおけるLiDAR2の位置および姿勢に応じた環境地図データを生成する。
【0025】
物体検出部16が、映像データに映る物体の中から可動物体を検出し、検出した可動物体が動いているか否かを判定する。可動物体は、動くことが可能な物体であり、例えば、対象領域内に存在する、歩行者、車両等である。また、車両には、建設機械も含まれる。例えば、物体検出部16は、映像データを構成するフレーム画像ごとにパターン認識等の画像解析を行うことにより、フレーム画像から可動物体を検出する。
なお、可動物体は、環境地図の利用分野ごとに決定してもよい。例えば、環境地図を土木作業の管理に利用する場合、可動物体としては、歩行者である作業員、移動可能な作業機械、運搬を行う車両等が挙げられる。
【0026】
物体検出部16は、フレーム画像に映る可動物体の位置が経時的に変化していた場合、可動物体が動いていると判定する。例えば、物体検出部16は、予め定められた判定期間に連続した複数のフレーム画像間で継続して可動物体の位置が変化した場合、あるいは、フレーム画像間における可動物体の位置の変化が予め定められた閾値を超える頻度で発生した場合、可動物体が動いていると判定する。また、物体検出部16は、予め定められた判定期間に連続した複数のフレーム画像間での可動物体の位置の変化が断続して発生した場合、あるいは、フレーム画像間における可動物体の位置の変化が上記閾値以下の頻度で発生した場合に、可動物体が動いていないと判定する。
【0027】
LiDAR2による対象領域の計測において、LiDAR2を搭載する移動体は、対象領域の周辺を移動している。可動物体が動いている場合、LiDAR2の位置および姿勢は時々刻々と変化し、LiDAR2に対する可動物体の位置も時々刻々と変化している。このため、物体検出部16は、動いている可動物体のみに対応する3次元点群データを正確に判別するのは困難である。
【0028】
物体検出部16は、例えば、映像データを構成するフレーム画像から、可動物体を含む画像領域を特定し、特定した画像領域に対応する3次元点群データを、可動物体に対応する3次元点群データとして判別する。すなわち、可動物体が含まれる画像領域に対応する大まかな範囲に含まれる3次元点群データが、動いていると判定された可動物体に対応する3次元点群データであると判別される。物体検出部16は、判別した3次元点群データと、これに対応する可動物体が動いているか否かを示す判定結果とを、物体検出情報としてデータ除去部17に出力する。
【0029】
データ除去部17は、環境地図生成部15が環境地図データの生成に用いる3次元点群データから、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去する。環境地図生成部15は、物体検出部16が動いていると判定した可動物体に対応する3次元点群データが除去された、残りの3次元点群データと、LiDAR2の位置および姿勢の推定結果とを用いて、対象領域の環境地図データを生成する。すなわち、可動物体が検出されても、計測中に動いておらず、可動物体がランドマークとされても環境地図の精度に影響を与えない場合には、可動物体に対応する3次元点群データが、環境地図データの生成に用いられる3次元点群データから除去されない。これにより、環境地図生成装置1は、環境地図データの生成に用いられる3次元点群データが過剰に削減されることを防止できる。
【0030】
また、データ除去部17は、物体検出部16により動いていないと判定された可動物体を、生成された環境地図データから除去する。動いていないと判定された可動物体に対応する3次元点群データは、環境地図データの生成に用いられる3次元点群データの中から除去されない。このため、環境地図データには、動いていないと判定された当該可動物体が含まれており、データ除去部17は、環境地図データを構成する3次元点群データの中から、動いていないと判定された可動物体に対応する3次元点群データを正確に除去することができる。
【0031】
さらに、物体検出部16は、映像データに映る物体の中から除去対象物体を検出する。除去対象物体とは、対象領域の3次元計測および対象領域の撮像を遮蔽する、対象領域に固定的に存在している障害物である。例えば、盛り土の環境地図データの生成において、盛り土と移動体との間に固定的に存在する樹木(街路樹等)あるいは一時的に設置された標識等は、当該環境地図のノイズである。
なお、除去対象物体は、環境地図の利用分野ごとに決定してもよい。例えば、環境地図を土木作業の管理に利用する場合、除去対象物体としては、管理対象の作業領域を遮蔽する可能性がある樹木等が挙げられる。
【0032】
データ除去部17は、環境地図生成部15が環境地図データの生成に用いる3次元点群データの中から、除去対象物体の3次元点群データを除去する。これにより、対象領域の環境地図から樹木等の除去対象物体が除外されるので、環境地図の精度を高めることができる。なお、除去対象物体は対象領域に固定的に存在するので、物体検出部16は、除去対象物体に正確に対応する3次元点群データを判別することが可能である。
【0033】
図2は、物体検出部16の構成を示すブロック図である。
図2に示すように、物体検出部16は、例えば、物体推論部161および物体領域特定部162を備えて構成される。物体推論部161は、映像データが入力されると、映像データを構成するフレーム画像に可動物体が映っているか否かを推論する学習済みモデルを用いて、可動物体を検出する。学習済みモデルは、
図1および
図2に図示していない学習装置が生成し、学習済みモデルを定義するパラメータは、
図1および
図2に図示していない記憶装置に保存される。
【0034】
例えば、学習装置は、カメラ3が対象領域を撮像した映像データを機械学習用データとして、映像データに可動物体が映っているか否かを推論する学習済みモデルを学習する。学習済みモデルは、ディープラーニングで学習されたニューラルネットワーク(NN)である。学習装置は、可動物体の検出精度が向上するようにNNの重みの更新を繰り返し実行してNNの重みが最適化されたNN(学習済みモデル)を生成する。
【0035】
学習装置は、映像データに可動物体が映っているか否かを推論する学習済みモデルを生成すると、当該学習済みモデルを定義する重み等のパラメータを記憶装置に保存する。物体推論部161は、記憶装置に保存されたパラメータにより定義される学習済みモデルを用いて可動物体の推論を行う。これにより、環境地図生成装置1は、可動物体の検出精度を向上させることができる。
【0036】
ディープラーニングとしては、例えば、YOLO、EfficientDet等が用いられる。また、当該学習済みモデルの学習として、学習装置が、過去に撮像された映像データを教師データとして用いる教師あり学習を実行してもよいし、教師データを用いない教師なし学習を実行してもよい。物体検出部16が、学習済みモデルを用いて可動物体を検出することにより、環境地図生成装置1は、可動物体の検出精度を向上させることができる。
【0037】
物体領域特定部162は、映像データを構成するフレーム画像から可動物体の画像領域を特定し、特定した可動物体の画像領域に基づいて、可動物体が動いているか否かを判定する。例えば、物体領域特定部162は、物体推論部161が推論した可動物体が映っている画像領域を特定し、フレーム画像間での当該画像領域に含まれる可動物体の位置変化に基づいて、可動物体が動いているか否かを判定する。物体検出部16は、可動物体が映っている画像領域を示す情報と可動物体が動いているか否かの判定結果とを含む物体検出情報を、データ除去部17に出力する。
【0038】
また、物体推論部161は、映像データが入力されると、映像データを構成するフレーム画像に除去対象物体が映っているか否かを推論する学習済みモデルを用いて、除去対象物体を検出してもよい。例えば、学習装置が、除去対象物体の検出精度が向上するようにNNの重みの更新を繰り返し実行してNNの重みが最適化されたNN(学習済みモデル)を生成する。
【0039】
なお、環境地図生成装置1とは別に学習装置を設ける場合を示したが、環境地図生成装置1が、当該学習装置を備えてもよい。また、環境地図生成装置1が、学習済みモデルを定義する重み等のパラメータを保存しておく記憶装置を備えてもよい。
【0040】
図3は、物体検出部16がフレーム画像3Aから可動物体を検出する処理の概要を示す概要図である。
図3において、フレーム画像3Aは、カメラ3が撮像した対象領域の映像データに含まれるフレーム画像の例である。フレーム画像3Aには、対象領域に固定的に存在する建物21が映っており、歩行者22が映っている。物体検出部16は、カメラ3が撮像する映像データをフレーム画像ごとに画像解析するか、映像データのフレーム画像を学習済みモデルに入力することにより、対象領域の周辺に存在する可動物体である歩行者22を検出する。
【0041】
物体検出部16は、歩行者22を検出すると、検出した歩行者22を含む画像領域31を特定し、特定した画像領域に対応する3次元点群データを、歩行者22に対応する3次元点群データとして判別する。物体検出部16は、判別した3次元点群データと、これに対応する歩行者22が動いているか否かを示す判定結果とを物体検出情報として、データ除去部17に出力する。
【0042】
図4は、可動物体が動いているか否かの判定処理の概要を示す概要図であり、可動物体として歩行者22が検出された場合を示している。
図4において、フレーム画像3A1は時刻t-1(秒)における画像であり、フレーム画像3A2は、単位時間が「1」進んだ時刻t(秒)における画像である。フレーム画像3A2において、実線で示す歩行者22は、時刻tにおける歩行者22の位置であり、破線で示す歩行者22は、フレーム画像3A1における歩行者22の位置、すなわち時刻t-1における歩行者22の位置を表している。
【0043】
図4において矢印で示すように、歩行者22の位置は、フレーム画像3A1とフレーム画像3A2との間で変化している。物体検出部16は、フレーム画像3A1とフレーム画像3A2との間で歩行者22の位置の変化を検出すると、歩行者22が動いていると判定する。また、物体検出部16は、予め定められた判定期間内にフレーム画像間での歩行者22の位置変化を連続して検出した場合に、歩行者22が動いていると判定してもよい。さらに、物体検出部16は、フレーム画像間での歩行者22の位置変化が断続して予め定められた閾値を超える頻度で発生した場合に、可動物体が動いていると判定してもよい。
【0044】
物体検出部16は、環境地図データの生成に用いられる3次元点群データから、動いていると判定した歩行者22に対応する3次元点群データを判別して、判別した3次元点群データおよび対応する歩行者22が動いているか否かを示す判定結果を、物体検出情報としてデータ除去部17に出力する。
【0045】
土木作業現場における盛り土を運搬する作業の管理に用いられる環境地図について説明する。
図5は、盛り土41の環境地図を示す画面図である。
図5の左側に示す環境地
図15Aは、盛り土41とショベルカー42とに対応する3次元点群データから構成される3次元地図である。
図5の右側に示す環境地
図15Bは、環境地
図15Aからショベルカー42に対応する3次元点群データを除外した3次元地図である。なお、ショベルカー42は、盛り土41の土を運搬機械に積み込む積み込み機械である。
【0046】
環境地
図15Aにおいて、ショベルカー42は、盛り土41に存在して、盛り土41の状態を遮蔽している。このため、環境地
図15Aを用いて、盛り土41の状態を管理するためには、ショベルカー42を環境地
図15Aから除外する必要がある。この場合、環境地図生成装置1は、盛り土41を計測しているときにショベルカー42を可動物体として検出すると、ショベルカー42を除外した環境地
図15Bを生成する。
【0047】
例えば、環境地図生成装置1は、盛り土41を計測しているときにショベルカー42が動いていれば、環境地
図15Bの生成に用いる3次元点群データから、ショベルカー42に対応する3次元点群データを自動的に除外し、残りの3次元点群データを用いて環境地
図15Bを生成する。また、ショベルカー42が動いていなければ、環境地図生成装置1は、生成した環境地
図15Bから、ショベルカー42に対応する3次元点群データを自動的に除外する。これにより、作業者は、環境地
図15Bを参照することにより、盛り土41の状態を正確に認識することが可能である。
【0048】
図6は、一部の土を運び出した盛り土41の環境地図を示す画面図である。
図6の左側に示す環境地
図15Cは、盛り土41とショベルカー42とに対応する3次元点群データから構成される3次元地図である。ショベルカー42は、盛り土41の上部に存在して、盛り土41から土の運び出しを行っている。このため、作業者は、環境地
図15Cを参照しても、ショベルカー42が遮蔽して盛り土41からどれくらいの土量43が運び出されたかを認識できない。この場合、環境地図生成装置1は、ショベルカー42を可動物体として検出すると、ショベルカー42を除外した環境地
図15Dを生成する。
【0049】
例えば、環境地図生成装置1は、土の運び出し作業のためにショベルカー42が動いていれば、環境地
図15Dの生成に用いる3次元点群データから、ショベルカー42に対応する3次元点群データを自動的に除外し、残りの3次元点群データを用いて環境地
図15Dを生成する。また、ショベルカー42が停止していても、環境地図生成装置1は、生成した環境地
図15Dからショベルカー42を自動的に除外する。これにより、作業者は、環境地
図15Dを参照することで、盛り土41から運び出された土量43を正確に認識することができる。
【0050】
次に、実施の形態1に係る環境地図生成方法について説明する。
図7は、実施の形態1に係る環境地図生成方法を示すフローチャートである。
データ取得部11が、LiDAR2が対象領域を計測した3次元点群データと、カメラ3が対象領域を撮像した映像データとを取得する(ステップST1)。例えば、作業者が対象領域の周辺を移動し、このとき、作業者が携帯する端末に搭載されたLiDAR2が予め定められた計測周期で対象領域を計測し、カメラ3が予め定められたフレームレートで対象領域を撮像する。データ取得部11は、LiDAR2が計測する3次元点群データとカメラ3が撮像する映像データを順次取得する。
【0051】
色情報付加部12が、3次元点群データを構成する3次元点と映像データを構成するフレーム画像における画素との対応関係を特定し、3次元点に色情報を付加した3次元点群データを生成する(ステップST2)。なお、環境地図生成装置1が色情報付加部12を備えていない場合は、ステップST2は実施されない。
【0052】
特徴点抽出部13が、3次元点群データから、対象領域内に存在する物体の特徴点データを抽出する(ステップST3)。位置姿勢推定部14が、特徴点抽出部13が抽出した特徴点データを用いて、LiDAR2の位置および姿勢を推定する(ステップST4)。
【0053】
物体検出部16が、映像データに映る物体の中から可動物体を検出する(ステップST5)。ここで、可動物体が検出されなければ(ステップST5;NO)、環境地図生成部15は、3次元点群データおよびLiDAR2の位置および姿勢の推定結果に基づいて、対象領域の環境地図データを生成する(ステップST8)。
【0054】
可動物体を検出した場合(ステップST5;YES)、物体検出部16は、当該可動物体が動いているか否かを判定する(ステップST6)。ここで、物体検出部16により可動物体が動いていると判定された場合(ステップST6;YES)、データ除去部17は、環境地図データの生成に用いられる3次元点群データの中から、動いていると判定された可動物体の3次元点群データを除去する(ステップST7)。また、物体検出部16が、映像データから除去対象物体を検出した場合には、データ除去部17は、環境地図データの生成に用いられる3次元点群データの中から除去対象物体に対応する3次元点群データを除去する。これにより、環境地図生成部15は、可動物体または除去対象物体に対応する3次元点群データが除去された、残りの3次元点群データを用いて、対象領域の環境地図データを生成する(ステップST8)。
【0055】
一方、物体検出部16により可動物体が動いていないと判定された場合(ステップST6;NO)、環境地図生成部15は、可動物体に対応するデータを含む3次元点群データとLiDAR2の位置および姿勢の推定結果とに基づいて、対象領域の環境地図データを生成する(ステップST9)。データ除去部17は、環境地図生成部15が生成した環境地図データから可動物体に対応する3次元点群データを除去する(ステップST10)。
【0056】
次に、環境地図生成装置1の機能を実現するハードウェア構成について説明する。
環境地図生成装置1が備える、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17の機能は、処理回路により実現される。すなわち、環境地図生成装置1は、
図7に示したステップST1からステップST10までの各処理を実行するための処理回路を備える。処理回路は、専用のハードウェアであってもよいが、メモリに記憶されたプログラムを実行するCPU(Central Processing Unit)であってもよい。
【0057】
図8Aは、環境地図生成装置1の機能を実現するハードウェア構成を示すブロック図である。
図8Bは、環境地図生成装置1の機能を実現するソフトウェアを実行するハードウェア構成を示すブロック図である。
図8Aおよび
図8Bにおいて、入力インタフェース100は、LiDAR2およびカメラ3から環境地図生成装置1へ出力されるデータを中継するインタフェースである。出力インタフェース101は、環境地図生成装置1から後段の装置へ出力される環境地図データを中継するインタフェースである。
【0058】
処理回路が、
図8Aに示す専用のハードウェアの処理回路102である場合、処理回路102は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)またはこれらを組み合わせたものが該当する。
環境地図生成装置1が備える、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17の機能を、別々の処理回路が実現してもよく、これらの機能をまとめて一つの処理回路が実現してもよい。
【0059】
処理回路が
図8Bに示すプロセッサ103である場合、環境地図生成装置1が備える、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17の機能は、ソフトウェア、ファームウェアまたはソフトウェアとファームウェアとの組み合わせにより実現される。なお、ソフトウェアまたはファームウェアは、プログラムとして記述されてメモリ104に記憶される。
【0060】
プロセッサ103は、メモリ104に記憶されたプログラムを読み出して実行することにより、環境地図生成装置1が備える、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17の機能を実現する。例えば、環境地図生成装置1は、プロセッサ103により実行されるときに、
図7に示したステップST1からステップST10の処理が結果的に実行されるプログラムを記憶するためのメモリ104を備える。これらのプログラムは、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17が行う処理の手順または方法を、コンピュータに実行させる。メモリ104は、コンピュータを、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17として機能させるためのプログラムが記憶されたコンピュータ可読記憶媒体であってもよい。
【0061】
メモリ104は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically-EPROM)などの不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVDなどが該当する。
【0062】
環境地図生成装置1が備える、データ取得部11、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17の機能の一部が専用のハードウェアで実現され、残りの一部がソフトウェアまたはファームウェアで実現されてもよい。例えば、データ取得部11は、専用のハードウェアである処理回路102によってその機能が実現され、色情報付加部12、特徴点抽出部13、位置姿勢推定部14、環境地図生成部15、物体検出部16およびデータ除去部17は、プロセッサ103がメモリ104に記憶されたプログラムを読み出して実行することによりその機能が実現される。このように、処理回路はハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせによって上記機能を実現することができる。
【0063】
なお、
図2には、可動物体の存在を推論する学習済みモデルを、環境地図生成装置1とは別に設けられた学習装置が学習して得る場合を示したが、環境地図生成装置1は、これに限定されるものではない。例えば、環境地図生成装置1は、可動物体の存在を推論する学習済みモデルを学習する学習装置を備えてもよい。
【0064】
以上のように、実施の形態1に係る環境地図生成装置1は、3次元点群データおよび映像データを取得するデータ取得部11と、3次元点群データから、対象領域内に存在する物体の特徴点データを抽出する特徴点抽出部13と、LiDAR2の位置および姿勢を推定する位置姿勢推定部14と、3次元点群データと、LiDAR2の位置および姿勢の推定結果とに基づいて、対象領域の環境地図を生成する環境地図生成部15と、映像データに映る物体の中から、動くことが可能な可動物体を検出して、検出した可動物体が動いているか否かを判定する物体検出部16と、環境地図の生成に用いられる3次元点群データから、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去するデータ除去部17を備える。
環境地図生成装置1は、映像データに映る物体の中から、動くことが可能な可動物体を検出し、検出した可動物体が動いているか否かを判定して、環境地図の生成に用いられる3次元点群データから、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去する。これにより、環境地図の生成に用いられる3次元点群データが過剰に削減されることを防止できる。
【0065】
実施の形態1に係る環境地図生成装置1において、データ除去部17は、動いていないと判定された可動物体を、生成された環境地図から除去する。これにより、環境地図生成装置1は、環境地図データを構成する3次元点群データの中から、動いていないと判定された可動物体に対応する3次元点群データを正確に除去することができる。
【0066】
実施の形態1に係る環境地図生成装置1において、3次元点群データを構成する3次元点と映像データを構成するフレーム画像における画素との対応関係を特定し、3次元点に色情報を付加した3次元点群データを生成する色情報付加部12を備える。これにより、環境地図生成装置1は、3次元点に色情報が付加された環境地図データを生成することができる。
【0067】
実施の形態1に係る環境地図生成装置1において、物体検出部16は、映像データが入力されると、映像データを構成するフレーム画像に可動物体が映っているか否かを推論する学習済みモデルを用いて可動物体を検出する物体推論部161と、映像データを構成するフレーム画像に映る可動物体の画像領域を特定し、特定した可動物体の画像領域に基づいて当該可動物体が動いているか否かを判定する物体領域特定部162を備える。これにより、環境地図生成装置1は、可動物体の検出精度を向上させることができる。
【0068】
実施の形態1に係る環境地図生成装置1において、物体検出部16は、映像データに映る物体の中から、除去対象物体を検出する。データ除去部17は、環境地図データの生成に用いる3次元点群データから、除去対象物体の3次元点群データを除去する。対象領域の環境地図から除去対象物体が除外されるので、環境地図生成装置1は、環境地図の精度を高めることが可能である。
【0069】
実施の形態1に係る環境地図生成方法は、データ取得部11が、3次元点群データと映像データとを取得するステップと、特徴点抽出部13が、3次元点群データから、特徴点データを抽出するステップと、位置姿勢推定部14が、LiDAR2の位置および姿勢を推定するステップと、環境地図生成部15が、3次元点群データとLiDAR2の位置および姿勢の推定結果に基づいて、対象領域の環境地図データを生成するステップと、物体検出部16が、映像データに映る物体の中から、動くことが可能な可動物体を検出して、検出した可動物体が動いているか否かを判定するステップと、データ除去部17が、環境地図データの生成に用いられる3次元点群データの中から、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データを除去するステップを備える。これにより、環境地図の生成に用いられる3次元点群データが過剰に削減されることを防止できる。
【0070】
実施の形態1に係るプログラムは、コンピュータを環境地図生成装置1として機能させる。これにより、環境地図の生成に用いられる3次元点群データが過剰に削減されることを防止できる環境地図生成装置1を提供することができる。
【0071】
なお、実施の形態の任意の構成要素の変形もしくは実施の形態の任意の構成要素の省略が可能である。
【符号の説明】
【0072】
1 環境地図生成装置、2 LiDAR、3 カメラ、3A,3A1,3A2 フレーム画像、11 データ取得部、12 色情報付加部、13 特徴点抽出部、14 位置姿勢推定部、15 環境地図生成部、15A~15D 環境地図、16 物体検出部、17 データ除去部、21 建物、22 歩行者、31 画像領域、41 盛り土、42 ショベルカー、43 土量、100 入力インタフェース、101 出力インタフェース、102 処理回路、103 プロセッサ、104 メモリ、161 物体推論部、162 物体領域特定部。
【手続補正書】
【提出日】2023-02-13
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正の内容】
【0010】
本開示に係る環境地図生成装置は、作業現場の対象領域を示す環境地図データを生成する環境地図生成装置であって、センサが対象領域を計測した3次元点の集合である3次元点群データおよび撮像装置が対象領域を撮像した映像データを取得するデータ取得部と、3次元点群データから、対象領域内に存在する物体の特徴点データを抽出する特徴点抽出部と、3次元点群データを用いてセンサの位置および姿勢を推定する位置姿勢推定部と、特徴点データとセンサの位置および姿勢の推定結果とに基づいて、対象領域の環境地図データを生成する環境地図生成部と、映像データに映る物体の中から、センサによる作業領域の3次元計測および撮像装置による作業領域の撮像を遮蔽する除去対象物体を検出し、映像データに映る作業現場の作業に関わる物体の中から、動くことが可能な物体である可動物体を検出し、検出した可動物体が動いているか否かを判定する物体検出部と、環境地図データの生成に用いられる3次元点群データの中から、動いていないと判定された可動物体の3次元点群データを除去せず、動いていると判定された可動物体の3次元点群データおよび除去対象物体の3次元点群データを除去するデータ除去部と、を備え、環境地図生成部は、除去対象物体を除く、動いていないと判定された可動物体を含む対象領域に存在する物体の3次元点群データを用いて、作業現場の対象領域を示す環境地図データを生成する。
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
作業現場の対象領域を示す環境地図データを生成する環境地図生成装置であって、
センサが前記対象領域を計測して得られた3次元点の集合である3次元点群データと、撮像装置が前記対象領域を撮像した映像データとを取得するデータ取得部と、
前記3次元点群データから、前記対象領域内に存在する物体の特徴点データを抽出する特徴点抽出部と、
前記特徴点データを用いて前記センサの位置および姿勢を推定する位置姿勢推定部と、
前記3次元点群データと、前記センサの位置および姿勢の推定結果とに基づいて、前記対象領域の前記環境地図データを生成する環境地図生成部と、
前記映像データに映る物体の中から、前記センサによる前記作業領域の3次元計測および前記撮像装置による前記作業領域の撮像を遮蔽する除去対象物体を検出し、前記映像データに映る前記作業現場の作業に関わる物体の中から、動くことが可能な物体である可動物体を検出し、検出した前記可動物体が動いているか否かを判定する物体検出部と、
前記環境地図データの生成に用いられる前記3次元点群データの中から、動いていないと判定された前記可動物体の前記3次元点群データを除去せず、動いていると判定された前記可動物体の前記3次元点群データおよび前記除去対象物体の前記3次元点群データを除去するデータ除去部と、を備え、
前記環境地図生成部は、前記除去対象物体を除く、動いていないと判定された前記可動物体を含む前記対象領域に存在する物体の前記3次元点群データを用いて、前記作業現場の前記対象領域を示す前記環境地図データを生成する
ことを特徴とする環境地図生成装置。
【請求項2】
前記環境地図生成部は、前記可動物体が前記除去対象物体である場合、動いていないと判定されても当該可動物体を前記環境地図データから除去する
ことを特徴とする請求項1に記載の環境地図生成装置。
【請求項3】
前記3次元点群データを構成する3次元点と前記映像データを構成するフレーム画像における画素との対応関係を特定し、3次元点に色情報を付加した前記3次元点群データを生成する色情報付加部を備えた
ことを特徴とする請求項1または請求項2に記載の環境地図生成装置。
【請求項4】
前記物体検出部は、前記映像データが入力されると、前記映像データを構成するフレーム画像に前記可動物体が映っているか否かを推論する学習済みモデルを用いて、前記可動物体を検出する物体推論部と、前記映像データを構成するフレーム画像に映る前記可動物体の画像領域を特定し、特定した前記可動物体の画像領域に基づいて当該可動物体が動いているか否かを判定する物体領域特定部と、を備えた
ことを特徴とする請求項1から請求項3のいずれか1項に記載の環境地図生成装置。
【請求項5】
前記物体検出部は、前記映像データに映る物体の中から除去対象物体をさらに検出し、
前記データ除去部は、前記環境地図データの生成に用いられる前記3次元点群データの中から、前記除去対象物体の前記3次元点群データを除去する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の環境地図生成装置。
【請求項6】
作業現場の対象領域を示す環境地図データを生成し、データ取得部、特徴点抽出部、位置姿勢推定部、物体検出部、環境地図生成部、およびデータ除去部を備えた環境地図生成装置の環境地図生成方法であって、
前記データ取得部が、センサが前記対象領域を計測した3次元点の集合である3次元点群データと、撮像装置が前記対象領域を撮像した映像データとを取得するステップと、
前記特徴点抽出部が、前記3次元点群データから、前記対象領域内に存在する物体の特徴点データを抽出するステップと、
前記位置姿勢推定部が、前記特徴点データを用いて前記センサの位置および姿勢を推定するステップと、
前記環境地図生成部が、前記3次元点群データと、前記センサの位置および姿勢の推定結果とに基づいて、前記対象領域の前記環境地図データを生成するステップと、
前記物体検出部が、前記映像データに映る物体の中から、前記センサによる前記作業領域の3次元計測および前記撮像装置による前記作業領域の撮像を遮蔽する除去対象物体を検出し、前記映像データに映る、前記作業現場の作業に関わる物体の中から、動くことが可能な物体である可動物体を検出し、検出した前記可動物体が動いているか否かを判定するステップと、
前記データ除去部が、前記環境地図データの生成に用いられる前記3次元点群データの中から、動いていないと判定された前記可動物体の前記3次元点群データを除去せず、動いていると判定された前記可動物体の前記3次元点群データおよび前記除去対象物体の前記3次元点群データを除去するステップと、を備え、
前記環境地図生成部は、前記除去対象物体を除く、動いていないと判定された前記可動物体を含む前記対象領域に存在する物体の前記3次元点群データを用いて、前記作業現場の前記対象領域を示す前記環境地図データを生成する
ことを特徴とする環境地図生成方法。
【請求項7】
コンピュータを、請求項1から請求項5のいずれか1項に記載の環境地図生成装置として機能させるためのプログラム。