(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024166873
(43)【公開日】2024-11-29
(54)【発明の名称】物体規模推定装置、物体規模推定方法、および物体規模推定システム
(51)【国際特許分類】
G06T 7/60 20170101AFI20241122BHJP
G06T 7/50 20170101ALI20241122BHJP
【FI】
G06T7/60 110
G06T7/50
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023083264
(22)【出願日】2023-05-19
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000062
【氏名又は名称】弁理士法人第一国際特許事務所
(72)【発明者】
【氏名】渡邉 裕樹
(72)【発明者】
【氏名】永吉 洋登
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA09
5L096BA20
5L096CA02
5L096CA22
5L096FA52
5L096FA66
5L096HA13
5L096JA09
5L096JA11
(57)【要約】
【課題】本発明では、対象となる物体の物体数を高精度に推定する技術を提供することを目的とする。
【解決手段】本発明の物体規模推定装置の一つは、物体規模の推定処理の対象となる画像である対象画像の深度マップを生成する深度推定部と、前記対象画像において、検出対象となる物体である対象物体を検出する物体検出部と、前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出部と、前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定部と、前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定部、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
物体規模の推定処理の対象となる画像である対象画像の深度マップを生成する深度推定部と、
前記対象画像において、検出対象となる物体である対象物体を検出する物体検出部と、
前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出部と、
前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定部と、
前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定部、
を備える物体規模推定装置。
【請求項2】
前記深度推定部は、前記対象画像が撮像された場合における俯角および高度に基づいて、前記深度マップを生成する、
請求項1に記載の物体規模推定装置。
【請求項3】
前記対象画像は単眼カメラによって撮像された画像であり、
前記深度推定部は、単眼深度推定を行い前記深度マップを生成する、
請求項1に記載の物体規模推定装置。
【請求項4】
テンプレート画像と前記テンプレート画像の深度マップに含まれる特徴量であるテンプレート深度マップ特徴量を関連付けた画像テーブルと、
前記テンプレート画像に含まれる物体および前記物体の種別を含む物体テーブルと、
前記テンプレート画像から抽出される領域および前記領域の種別を示す領域テーブルと、を含む画像データベース、をさらに備え、
前記密度推定部は、密度を推定できない場合、
前記対象画像の深度マップの特徴量である対象深度マップ特徴量と類似するテンプレート深度マップ特徴量を有するテンプレート画像である類似テンプレート画像を、前記画像テーブルから抽出し、
前記類似テンプレート画像に含まれる対象物体の数である第2物体数を、前記物体テーブルに基づいて算出し、
前記類似テンプレート画像の前記領域に含まれる前記対象物体の密度である第2密度を、前記第2物体数および前記領域テーブルに基づいて算出し、
前記物体数推定部は、
前記第2密度を用いて前記第1物体数を算出する、
請求項1に記載の物体規模推定装置。
【請求項5】
前記類似テンプレート画像はユーザによって選択される、
請求項4に記載の物体規模推定装置。
【請求項6】
物体規模の推定処理の対象となる画像である対象画像の深度マップを生成する深度推定ステップと、
前記対象画像において、検出対象となる物体である対象物体を検出する物体検出ステップと、
前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出ステップと、
前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定ステップと、
前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定ステップ、
を備える物体規模推定方法。
【請求項7】
物体規模の推定処理の対象となる画像である対象画像を撮像する撮像装置と、
前記撮像装置の深度マップを生成する深度推定部と、
前記対象画像において、検出対象となる物体である対象物体を検出する物体検出部と、
前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出部と、
前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定部と、
前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定部、
を備える物体規模推定システム。
【請求項8】
前記撮像装置はドローンに搭載される、請求項7に記載の物体規模推定システム。
【請求項9】
前記対象画像に前記対象物体を示す第1図形および前記推定領域を示す第2図形を重ねて表示した画像認識結果を示す表示装置、をさらに備える請求項7に記載の物体規模推定システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物体規模推定装置、物体規模推定方法、および物体規模推定システムに関する。
【背景技術】
【0002】
近年、災害発生直後の救助計画や、復興時の計画策定に迅速な被害規模の推定が必要とされており、機動的な広域撮影が可能なドローンの活用とも相まって、高度な活用に期待が高まっている。例えば、映像認識(または画像認識)技術を活用することにより、被害家屋、流木、堆積物の量を迅速に推定することが可能となる。
【0003】
撮影画像から対象物の規模を推定するための技術としては、特許文献1から特許文献3のような技術がある。
【0004】
特許文献1は、画像における特定の領域において、対象物の密度分布を推定する技術を開示している。特許文献1における画像処理装置は、画像取得機能と、算出機能と、領域取得機能と、推定機能と、を備えている。そして、画像取得機能は、対象画像を取得する。算出機能は、対象画像に含まれる対象(人)の密度分布を算出する。領域取得機能は、対象画像内に設定された第1領域を取得する。推定機能は、対象画像内の第1領域の周辺領域の密度分布に基づいて、対象画像内の第1領域の密度分布を推定する。
【0005】
特許文献2は、監視カメラを用いて施設全体の混雑度を可視化するシステムを提供する。システムは、監視カメラ映像から群衆を検知し、そのエッジ量から群衆の大きさ(人数)を導くことで、カメラ映像範囲内の混雑状況を推定する。また通過人数カウンタや、群衆の大きさと移動速度などに基づいて人流(人の移動量)を計算し、モデル化した群衆行動パターンに基づいて、カメラ映像範囲以外のエリアの人数を推定する。モデルは、BIC(Bayesian Information Criteria)等の統計的モデル選択手法により、分布関数やそのパラメータを選択することで構築される。混雑状況はマップ上にプロットされ、即座に当該エリアの混雑状況を把握できる。
【0006】
また、特許文献3における物体計数システム40は、画像に示されている計数対象の物体に関する所定の条件が対応付けられている、画像の部分領域であり計数対象の物体の数が推定される領域の単位である推定領域の情報を取得する取得手段41と、取得された推定領域の情報が示す推定領域が、他の推定領域における計数対象の物体に含まれていない所定の条件を満たす計数対象の物体を含むように、画像内に推定領域を設定する設定手段42と、画像内に設定されている推定領域に示されている計数対象の物体の数を、推定領域毎に推定する推定手段43と、推定領域内の所定の領域同士が重なる領域における計数対象の物体の密度を、各推定領域で推定された計数対象の物体の数を用いて算出する算出手段44とを備える。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2018-022343号公報
【特許文献2】国際公開第2017/122258号
【特許文献3】国際公開第2017/043002号
【発明の概要】
【発明が解決しようとする課題】
【0008】
物体検出・領域抽出技術は深層学習技術の導入により高精度化が進んでいる。ここで、衛星画像解析のように対象との距離が一定の場合には、比較的安定した物体カウントが可能である。しかし、空撮映像などから災害規模を推定する際のように撮像装置と対象物の間の距離が一定ではない場合に、近距離にある対象は物体インスタンス単位で検出できるが、遠距離にある対象は物体インスタンス単位では検出できない。このような場合の対策については、特許文献1から特許文献3では想定されていない。
そこで、本発明では、対象となる物体の物体数を高精度に推定する技術を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記の課題を解決するために、代表的な本発明の物体規模推定装置の一つは、物体規模の推定処理の対象となる画像である対象画像の深度マップを生成する深度推定部と、前記対象画像において、検出対象となる物体である対象物体を検出する物体検出部と、前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出部と、前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定部と、前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定部、を備える。
【発明の効果】
【0010】
本発明によれば、対象となる物体の物体数を高精度に推定することができる。
上記した以外の課題、構成および効果は、以下の実施をするための形態における説明により明らかにされる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、物体規模の推定処理において物体検出および領域抽出を行う場合を示す図である。
【
図2】
図2は、第1実施形態に係る物体規模推定システムの構成を示す図である。
【
図3】
図3は、第1実施形態に係る物体規模推定システムの構成をハードウェアとして示す一例を図である。
【
図4】
図4は、物体規模推定システムの処理におけるデータの流れを模式的に示す図である。
【
図5】
図5は、物体規模推定システムにおける物体規模の推定処理のフローチャートを示す図である。
【
図6】
図6は、物体規模推定システムにおける物体規模の推定処理の結果の出力例を模式的に示す図である。
【
図7】
図7は、第2実施形態に係る物体規模推定システムの構成を示す図である。
【
図8】
図8は、画像データベースに保存されるデータの一例を示す図である。
【
図9】
図9は、物体規模推定システムの処理におけるデータの流れを模式的に示す図である。
【
図10】
図10は、密度推定処理のフローチャートを示す図である。
【
図11】
図11は、物体規模推定システムにおける物体規模の推定処理の結果の出力例を模式的に示す図である。
【
図12】
図12は、物体規模の推定処理を示すシーケンス図である。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の実施形態について説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
【0013】
本開示において、画像解析に関する説明が含まれる。解析の対象となる画像は、撮像装置が上空に配置されており、上空から見下ろした地上を撮像したものである。このため、画像には、撮像装置との間の距離が短い被写体および撮像装置との距離が大きい被写体が含まれ得る。以下の説明において、画像において「近距離」という場合には撮像装置との間の距離が小さい被写体のことを指し、画像において「遠距離」という場合には撮像装置との間の距離が大きい被写体のことを指す。
また、物体規模という場合、物体の数を計数したものを指す。物体数という表示を用いることもある。
【0014】
[従来例]
図1を参照して、従来例の画像認識による物体規模の推定処理を説明する。
図1は、物体規模の推定処理において物体検出および領域抽出を行う場合を示す図である。
図1(a)は物体検出(object detection)を行う場合を示し、
図1(b)を領域抽出(semantic segmentation)を行う場合を示す。
【0015】
図1(a)を参照して物体検出を説明する。物体検出の対象である撮像画像10は、ドローンに搭載された撮像装置によって撮像された画像の一例を示す。ドローンは、遠隔操作される無人航空機である。ドローンに搭載された撮像装置によって撮影が行われるため、撮像画像10には、例えば、水平方向から鉛直方向下向きに向かい方向に撮像装置が向く向きである俯角および撮像装置が位置する高さである高度、の情報が関連付けられる。
【0016】
撮像画像10において、画面中央部から奥側に向けて道が伸びる様子が示されている。また、撮像画像10の下方は、撮像装置の近傍の箇所に該当しており、住宅と木などが生い茂る緑地が混在している。撮像画像10の情報は、撮像装置から見て遠方の箇所に該当しており、住宅毎の境目は明瞭には示されていないが、複数の住宅が集まる住宅街が形成されている。撮像画像10の上端部は、地上と上空の境界が示されている。
【0017】
画像における物体検出は、例えばCNN(Convolutional Neural Network、畳み込みニューラルネットワーク)モデル、YOLO(You Look Only Once)モデルなどを用いて行うことができる。
【0018】
物体検出後画像11は、検出された物体を模式的に示す図である。物体検出後画像11において、矩形部分12が示されている。矩形部分12は、住宅という特性を持つ領域を示している。物体検出後画像11において矩形部分は16個示されているので、撮像画像10において住宅が16棟含まれることが検出された。
【0019】
図1(b)を参照して領域抽出を説明する。領域抽出は、例えば画素の特徴量を判定し、特徴量の近い部分をまとめて同一の領域として抽出する。領域抽出後画像13は、抽出された領域を模式的に示す図である。領域抽出後画像13において、斜線表示部分Saは住宅が含まれる領域を示す。
【0020】
ここで、物体検出と領域抽出の特性について説明する。物体検出後画像11に示されるように、撮像画像10の下方、すなわち撮像装置から近距離にある物体については検出することが可能である。しかし、撮像画像10の上方、すなわち撮像装置から遠距離にある物体については検出をすることができない。
一方、領域抽出については、撮像画像10の上方、すなわち撮像装置から遠距離にある領域についても住宅が含まれる領域として分類することが可能である。しかし、領域に含まれる住宅の数については、カウントすることができない。
【0021】
例えば、災害発生直後の状況においてドローンを用いた撮像画像から被災地域にある住宅数を把握することができれば、有効な支援計画を立てることに貢献し得る。しかしながら、従来の画像認識手法を用いる場合には、住宅数の把握をすることはできない。
【0022】
[第1実施形態]
(システムの構成)
図2および
図3を参照して、第1実施形態に係る物体規模推定システムの構成を説明する。
図2は、第1実施形態に係る物体規模推定システムの構成を示す図である。物体規模推定システム100は、物体規模の推定処理の対象となる画像である対象画像において、検出対象となる物体(以下、「対象物体」ともいう。)を検出し、対象物体の物体数(物体規模)を推定する。
【0023】
物体規模推定システム100は、記憶装置101と、入力装置102と、表示装置103と、主機能部104を含む。主機能部104は、物体規模推定システム主要な機能を発揮する。主機能部104を、物体規模推定装置として構成することも可能である。
【0024】
記憶装置101は、撮像装置によって取得された画像が記憶される。記憶された画像は、物体規模の推定処理の対象となる。記憶装置101は、任意の種類の記憶媒体によって構成される。記憶装置101は、複数の記憶媒体の組み合わせによって構成されてもよく、例えば、半導体メモリやハードディスクドライブなどの記憶デバイスの組み合わせによって構成されてもよい。記憶装置101は、クラウド上の記憶領域であってもよい。
また、記憶装置101は、撮像装置であってもよく、例えばドローン搭載の撮像装置とすることも可能である。主機能部104は、この場合には、撮像装置から直接的に画像を取得することも可能である。また、複数の撮像装置から画像を取得する構成としてもよく、例えば複数のドローン搭載の撮像装置と主機能部104とが接続するシステムを構成することも可能である。
【0025】
入力装置102は、物体規模推定システム100のユーザの入力操作を受け付ける。表示装置103は、物体規模の推定を行った結果を表示する。
【0026】
図2における主機能部104は、主に機能ブロックとしての側面を示す。主機能部104は、画像入力部105、領域抽出部106、深度推定部107、物体検出部108、密度推定部109、画像データベース110、物体数推定部111、表示部112を有する。
【0027】
画像入力部105は、記憶装置101と主機能部104との間のインターフェースとしての機能を有する。画像入力部105は、記憶装置101から物体規模の推定処理を行う対象となる画像である対象画像および対象画像に関連付けられる関連情報を取得する。
【0028】
領域抽出部106は、対象物体が含まれると推定される領域である推定領域を抽出する。領域抽出部106は、対象画像を共通の特徴を持つ領域に分類(グループ化)する処理を行う。例えば、領域抽出部106は、画素の特徴量を判定し、特徴量の近い部分をまとめて同一の領域として抽出する。領域抽出部106は、例えば、特徴量と物体の間の関係を示す教師データを予め学習しておき、物体毎に領域を区別することが可能である。また、教師データを用いずに、スペクトルやテクスチャなどの特徴量を用いて領域を分類することも可能である。第1実施形態の場合、住宅街、森林、道路、水辺などに領域を区別して抽出することが可能である。
【0029】
深度推定部107は、対象画像の深度マップを生成する。深度マップは、対象画像のなかの画素ごとの被撮像物(被写体)と撮像装置との間の距離を表現したものである。深度マップを生成する方法としては、例えば対象画像が撮像された場合における俯角および高度に基づいて、深度を推定して深度マップを生成することが可能である。他にも、対象画像が単眼カメラによって撮像された画像である場合、単眼深度推定を行い深度マップを生成する方法(例えば、画像に対応する深度マップを関連付けた教師データを集めて学習を行い対象画像の深度マップを生成する方法)、ステレオカメラにおけるカメラ間の視差を用いて深度マップを生成する方法、画像とレーザーや赤外線等を用いた測距センサの情報を組み合わせる方法、などがある。また、撮像装置の位置情報が対象画像に関連付けられている場合には、位置情報を用いて深度マップを生成することも可能である。深度推定部107は、画像および関連情報に基づいて、これらの方法から選択することが可能である。
【0030】
物体検出部108は、対象画像において、検出対象となる物体である対象物体を検出する。物体検出部108は、例えば、CNNモデル、YOLOモデルなどを用いて、対象画像から対象物体を検出する。
【0031】
密度推定部109は、対象物体および深度マップに基づいて、対象物体の密度を推定する。
【0032】
画像データベース110は、対象画像および対象画像に関連する特徴量に関するデータを記憶する。
【0033】
物体数推定部111は、推定領域および深度マップに基づいて推定領域の面積を推定し、対象物体の密度および面積に基づいて推定領域における対象物体の数を算出する。
【0034】
表示部112は、算出された物体数に関する情報を表示装置103に出力する。
【0035】
図3は、第1実施形態に係る物体規模推定システムの構成をハードウェアとして示す一例を図である。物体規模推定システム100は、記憶装置101と、入力装置102と、表示装置103と、プロセッサ201と、主記憶装置202と、NIC(Network Interface Card)204を含む。
【0036】
プロセッサ201は、一定の処理手順に基づいてデータの変換、演算、加工をする処理装置である。プロセッサ201は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)などによって構成され、または複数の処理装置の組み合わせによって構成されてもよい。
【0037】
主記憶装置202は、記憶装置101と同様に、任意の種類の記憶媒体によって構成される。主記憶装置202は、複数の記憶媒体の組み合わせによって構成されてもよく、例えば、半導体メモリやハードディスクドライブなどの記憶デバイスの組み合わせによって構成されてもよい。
【0038】
主記憶装置202に記憶される処理プログラム203は、各機能ブロック(すなわち、画像入力部105、領域抽出部106、深度推定部107、物体検出部108、密度推定部109、物体数推定部111、表示部112)の処理手順を規定している。プロセッサ201が処理プログラム203を実行することによって、各機能ブロックの機能を発揮する。
【0039】
NIC204は、主機能部104を構成する機器をネットワークに接続するためのインターフェースである。記憶装置101は、NIC204を介して、主機能部104に接続される。なお、入力装置102と表示装置103は、NIC204によって提供されるネットワークを介してプロセッサ201および主記憶装置202に接続される。
【0040】
上述のハードウェア構成は一例であり、本開示はこれに限定されない。例えば、記憶装置101は、NIC204によってネットワークに接続されているため、NAS(Network Attached Storage)またはSAN(Storage Area Network)が想定されている。記憶装置101は、DAS(Direct Attached Storage)を適用してもよい。
また、プロセッサ201と主記憶装置202の組み合わせによって機能ブロックの機能を実現しているが、負荷処理分散のため、他のプロセッサと主記憶装置の組み合わせを併用して処理プログラム203を実行することにしてもよい。
また、記憶装置101と入力装置102と表示装置103は、物体規模推定システム100のユーザと主機能部104の間のインターフェースの機能を有している。ユーザと主機能部104との間のインターフェースとして機能するものであれば、主機能部104と直接的に接続する別個のデバイスでなくともよい。例えば、表示装置103は、主機能部104と通信可能な携帯端末であってもよい。記憶装置101と入力装置102と表示装置103は、ユーザの使用態様に合わせて適宜設定することが可能である。
【0041】
(物体規模の推定処理のデータの流れ)
図4を参照して、深度および密度を用いた物体規模の推定処理を説明する。
図4は、物体規模推定システムの処理におけるデータの流れを模式的に示す図である。
【0042】
最初に、物体規模推定システム100に対象画像301を示す情報が読み込まれる。対象画像301は、例えばドローンを用いて撮像されるものであり、俯角および高度に関する情報が関連づけられている。ドローン等の航空機器による撮影に限定されず、本開示には他の画像を適用することも可能である。例えば、監視塔のような高所に設置された撮像装置によって取得された画像を用いてもよい。なお、対象画像301の画像自体は、前述の撮像画像10と同じものである。
【0043】
続いて、深度推定処理302において、対象画像301の深度マップが作成される。深度マップ303は、対象画像301に深度推定を行った場合の結果の一例を模式的に示す図である。画素ごとに撮像装置と被撮像物との間の距離(深度)が抽出され、色の濃淡が深度の大小に対応している。
【0044】
領域抽出処理304において、対象画像301から住宅が含まれる領域が抽出される。領域抽出後画像305における斜線表示部分Saは、住宅が含まれる領域を示す。
【0045】
物体検出処理306において、対象画像301から住宅(物体)が検出される。物体検出後画像307において、矩形部分は16個含まれており、住宅が16棟検出されている。
【0046】
なお、物体検出は、モデルを用いて検出する場合の検出の信頼度および矩形部分に含まれるピクセルサイズ(画素の大きさ)によって、物体検出の精度が判断される。例えば、信頼度およびピクセルサイズに基準値を設け、信頼度およびピクセルサイズが基準値を超えた矩形部分については物体検出ができたと判断し、信頼度およびピクセルサイズが基準値以下の場合には物体検出ができた物体数にカウントしない、とすることが可能である。またほかにも、画像において基準値を超える割合が高い部分を近距離として物体検出を行う、対象画像において基準値以下となる割合が高い部分を遠距離として領域抽出の対象とする、というように、領域抽出処理および物体検出処理を行う条件を設けることも可能である。
【0047】
続いて、密度推定処理308が行われる。物体検出処理を行うことができた近距離における物体密度が推定される。具体的には、まず、深度マップ303を用いて物体検出後画像307の矩形部分が検出された範囲の面積を算出する。算出された面積と物体数から、単位面積当たりの物体数(密度)が算出される。密度を示す情報である密度情報309が生成される。
【0048】
面積推定処理310において、領域抽出後画像305における斜線表示部分Saの面積が推定される。斜線表示部分Saの面積を示す情報である面積情報311が生成される。
【0049】
物体数推定処理312において、近距離における物体数の密度情報309および斜線表示部分Saの面積情報に基づいて、斜線表示部分Saに含まれる物体数(住宅数)が推定される。具体的には、近距離における住宅の密度と遠距離における住宅の密度が同じであると仮定のも、住宅の密度と斜線表示部分Saの面積の積をとることによって、斜線表示部分Saに含まれる住宅数が推定される。例えば、住宅の密度が0.0125m-2であり、斜線表示部分Saの面積が7200m2であった場合、0.0125×7200=90であり、90棟が斜線表示部分Saに含まれると推定される。
【0050】
なお、処理の順序は適宜設定しうる。例えば、深度推定処理302と領域抽出処理304と物体検出処理306は、並列に処理を行うことも可能であるし、直列に処理を行ってもよい。直列に行う場合にも、処理を実行する順序は適宜設定しうる。
【0051】
(物体規模の推定処理の手順)
図5を参照して、密度および深度を用いた物体規模の推定処理の手順を説明する。
図5は、物体規模推定システムにおける物体規模の推定処理のフローチャートを示す図である。
【0052】
最初に、物体規模推定システム100は、物体規模の推定処理を行う画像を読み込む(ステップS601)。対象画像の情報は、画像入力部105によって物体規模推定システム100に読み込まれる。
【0053】
続いて、深度推定部107は、読み込んだ対象画像の深度マップを作成する(ステップS602)。深度推定部107は、対象画像に関連付けられた情報(たとえば、撮像装置の俯角および高度など)を用いて、深度を推定し、深度マップを作成する。
【0054】
続いて、領域抽出部106は、読み込んだ画像から領域を抽出する(ステップS603)。領域抽出部106は、物体規模の推定処理の対象物体が含まれると推定される領域(推定領域)を抽出する。推定領域は、対象画像において、撮像装置から遠距離にあり、後述の物体検出を行うことができない部分においても行われる。
【0055】
続いて、物体検出部108は、読み込んだ画像から物体を検出する(ステップS604)。物体検出部108は、対象画像において、検出対象となる物体である対象物体を検出する。物体の検出は、対象画像において、概ね撮像装置から近距離にある物体が検出される。物体検出部108は、検出された物体の数を数える。
【0056】
続いて、密度推定部109は、近距離の物体密度を推定する(ステップS605)。密度推定部109は、物体検出部108によって検出された対象物体および深度推定部107によって生成された深度マップに基づいて、対象物体の密度を推定する。推定される密度は、撮像装置から近距離における物体の密度である。
【0057】
続いて、物体数推定部111は、遠距離の面積を推定する(ステップS606)。具体的には、物体数推定部111は、領域抽出部106によって抽出された推定領域および深度推定部107によって生成された深度マップに基づいて、推定領域の面積を推定する。
【0058】
さらに、物体数推定部111は、密度と面積から、遠距離の物体数を推定する(ステップS607)。具体的には、物体数推定部111は、密度推定部109によって推定された対象物体の密度およびステップS606において推定した推定領域の面積に基づいて、推定領域における対象物体の数を算出する。
【0059】
続いて、表示部112は、近距離と遠距離の物体数を出力する(ステップS608)。具体的な出力例は後述する。
【0060】
なお、画像データベース110は、物体検出部108による物体検出の結果、領域抽出部106による領域抽出の結果、物体数推定部111による物体数推定の結果、を示す情報を保存する。物体数推定の結果を関連付けて保存することによって、ユーザが過去の推定結果にアクセスすることが容易になる。
【0061】
(物体規模の推定処理の結果の出力の例)
図6は、物体規模推定システム100における物体規模の推定処理の結果の出力例を模式的に示す図である。
【0062】
図6において、入力装置102がマウスおよびキーボードとして示されている。同様に、表示装置103はディスプレイとして、主機能部104はタワー型のデスクトップコンピュータとして、それぞれ示されている。また、表示装置103の表示画面において、マウスカーソル700、画像読み込みボタン701、入力画像表示部702、画像認識結果表示部704、規模推定結果表示部705、規模推定実行ボタン703、がそれぞれ示されている。物体規模推定システム100は、マウスおよびキーボードを介して入力されたユーザの要求に基づいて、処理を行う。例えば、画像読み込みボタン701を選択して対応する処理が行われる場合には、画像読み込みボタン701上にマウスカーソル700が配置された状態で、キーボードまたはマウスを介したユーザの入力操作が行われる。
【0063】
画像読み込みボタン701が選択される場合、物体規模の推定処理の対象となる画像を読み込む処理が行われる。読み込まれる対象画像は予め定められたものであってもよい。また、画像読み込みボタン701が選択された後に、記憶装置101に記憶された画像データをリスト等の形式に表示させ、ユーザに選択させることも可能である。
【0064】
入力画像表示部702は、読み込まれた画像を示す。ユーザは、入力画像表示部702に示された画像が物体規模の推定処理を行う対象画像であるかどうかを確認することが可能である。所望の画像ではなかった場合、ユーザは、再度画像読み込みボタン701を選択し、読み込む画像を選択することが可能である。
【0065】
規模推定実行ボタン703が選択される場合、読み込まれた対象画像について物体規模の推定処理が行われる。画像認識結果表示部704は、物体検出処理によって検出された対象物体を示す矩形部分(第1図形)、および領域抽出処理によって抽出された推定領域を示す斜線表示部分(第2図形)とを、読み込まれた対象画像上に重ねて表示した態様で示す。また、規模推定結果表示部705は、物体検出処理によって推定された近距離の物体数および物体数推定処理によって推定された推定領域に含まれる遠距離の物体数を示す。具体的には、「家屋106棟」と示されるように、入力画像表示部702に示された画像に含まれると推定される住宅数は106棟である。また106棟の内訳は、「近距離:16棟」と示されるように対象画像の近距離において16棟であり、「遠距離:90棟(推定)」と示されるように対象画像の遠距離において90棟である。なお、
図6は表示態様の一例を示すものであり、本開示はこれに限定されない。例えば、対象物体を表示するのに矩形部分を表示する場合を示すが、他の多角形を採用してもよいし、ハッチ等の表示態様を変更するものでもよい。また、斜線表示部分についても、抽出された領域を区別できる態様であれば、斜線表示以外の表示態様を採用することも可能である。
【0066】
(作用・効果)
撮像された画像の中に、撮像装置から近距離にある物体と撮像装置から遠距離にある物体が含まれる場合、近距離にある物体については物体検出処理によって対象とする物体の個数を把握することが可能である。一方、遠距離にある物体については、信頼度の高い物体検出を行うことは難しい。また、領域抽出処理を行うことも可能ではあるが、対象とする物体を含む領域であることが認識されるにとどまり、これ以上の情報量を得ることは難しい。
【0067】
これに対し、本発明においては、対象画像の深度マップを生成し、近距離における物体の密度を用いることで、遠距離にある物体の物体数を推定する。このようにすることにって、物体検出処理による認識が困難な遠距離の物体の規模推定が可能となる。
また、推定結果を表示することによって、ユーザへの情報提供が可能となる。物体検出処理の結果および領域抽出処理の結果を対象画像に重畳させた表示や、物体検知処理による物体数と深度マップを利用して推定された物体数を対比した表示を一度にユーザに提示するため、ユーザは物体規模の推定処理の確からしさを直感的に把握することが可能となる。
【0068】
[第2実施形態]
(システムの構成)
第2実施形態は、画像データベース内の画像を物体規模の推定処理に用いる点で第1実施形態と異なる。以下の説明において、上述の第1実施形態と同一または同等の構成要素については同一の符号を付し、その説明を簡略または省略する。
【0069】
図7は、第2実施形態に係る物体規模推定システムの構成を示す図である。第2実施形態の物体規模推定システム100aにおいて、第1実施形態の物体規模推定システム100との違いは、画像データベース110aに保存される情報が密度推定部109に用いられる点である。
【0070】
図8は、画像データベース110aに保存されるデータの一例を示す図である。画像データベース110aは、テンプレート画像とテンプレート画像の深度マップに含まれる特徴量であるテンプレート深度マップ特徴量を関連付けた画像テーブルと、テンプレート画像に含まれる物体および物体の種別を含む物体テーブルと、テンプレート画像から抽出される領域および領域の種別を示す領域テーブルとを含む。なお、ここで物体規模の推定処理の対象となる対象画像と区別するためにテンプレート画像と表記する。テンプレート画像とは、物体規模の推定処理を行う前に事前に集められた画像または物体規模の推定処理を行う過程で取得された画像のことである。後述するように、テンプレート画像には、物体規模の推定処理の過程において生成された深度マップ、物体検出処理の結果、領域抽出処理の結果等が関連付けられている。以下、3つのテーブルのデータについて説明する。
【0071】
図8(a)は画像テーブルの一例を示す図である。画像テーブルは、物体規模推定システムに読み込まれる画像を管理する。画像テーブルは、深度マップおよび検索用の特徴量も管理する。画像テーブルは、ID、画像(以下、「テンプレート画像」ともいう。)、深度マップ、画像特徴量、深度マップ特徴量(以下、「テンプレート深度マップ特徴量」ともいう。)、の列(カラム)を含む。テーブルの行(レコード)には、テンプレート画像のデータ、テンプレート画像から生成された深度マップ、テンプレート画像の特徴量、深度マップの特徴量を含む。テンプレート画像の特徴量としては、エッジパターン、色、HOG(Histograms of Oriented Gradients)、SIFT(Scaled Invariance Feature Transform)等が画素ごとに検出されている。深度マップの特徴量としては、例えば撮像装置からの距離を示す指標が用いられる。例えば、ID=1に該当する行には、画像および深度マップが示されている。画像特徴量は[0.627,0.055,0.479,0.882,0.728,…]であり、深度マップ特徴量は[0.550,0.046,0.540,0.459,0.098,…]である。
【0072】
図8(b)は物体テーブルの一例を示す図である。物体テーブルは、物体検出処理を行った結果を管理する。物体テーブルは、ID、画像ID、座標、種別、信頼度の列を含む。テーブルの行には、画像IDのデータ、テンプレート画像において物体検出された領域を示す座標のデータ、種別を示すラベルのデータ、物体検出の信頼度のデータを含む。画像IDによって、物体テーブルと画像テーブルは紐づけがされている。具体的には、画像ID=1は、物体テーブルにおけるID=1のテンプレート画像をさす。テーブルに含まれているデータ(レコード)について、例えば、ID=1に該当する行には、画像ID=1のテンプレート画像について物体検出処理を行った場合、座標[0.42,0.63,0.6,0.8]に囲まれる箇所に物体の種別として住宅が抽出されたことを示している。上述の座標における物体検出の信頼度は、0.95である。
図8(b)に示される物体テーブルにおいては、画像ID=1のテンプレート画像に対して複数の物体が検出されている。なお、
図8(b)においては種別として住宅が検出された場合が示されているが、物体テーブルには住宅以外の物体を検出した結果も含まれ得る。
【0073】
図8(c)は領域テーブルの一例を示す図である。領域テーブルは、領域抽出処理を行った結果を管理する。領域テーブルは、ID、画像ID、領域、種別の列を含む。テーブルの行には、画像IDのデータ、抽出された領域の範囲を示すデータ、種別を示すラベルのデータを含む。物体テーブルの場合と同様に、領域テーブルにおいても、画像IDによって、物体テーブルと領域テーブルは紐づけがされている。テーブルに含まれるデータについて、例えば、画像ID=1のテンプレート画像について領域抽出処理を行った場合、領域として、抽出された領域を示す斜線表示部分Sbが示される。抽出された領域の種別は住宅街である。なお、
図8(c)においては種別として住宅街が検出された場合が示されているが、領域テーブルには住宅街以外の領域を検出した結果も含まれ得る。
【0074】
(物体規模の推定処理のデータの流れ)
図9を参照して、類似画像の検索を用いた物体規模の推定処理を説明する。
図9は、物体規模推定システムの処理におけるデータの流れを模式的に示す図である。
【0075】
対象画像801は、物体規模推定システム100aに読み込まれる画像である。対象画像801において、対象画像801の右側の手前から奥にかけて、樹木が生えている部分が広がっている。また、植物が生えておらずかつ建物もない土地が中央部分に広がっている。対象画像801の左下側に少数の建物があり、対象画像801の左奥側に複数の建物がある。
【0076】
物体検出処理802において、対象画像801から住宅が検出される。物体検出後画像803において、矩形部分は1個含まれており、住宅が1棟検出されている。住宅が1棟しか検出されないため、密度推定処理を実施することができず、密度推定不可804と判定される。
【0077】
このように、対象画像801のように近距離の領域に物体が十分な数だけ映されていない場合、第1実施形態の密度推定処理を行うことができない。これに対して、第2実施形態においては、画像データベース110aに蓄積されたテンプレート画像から、類似する深度マップを検索し、それに紐づいた物体検出結果から密度を推定する。
【0078】
深度推定処理805において、対象画像801の深度マップ806が形成される。
【0079】
続いて、類似画像検索処理807において、画像データベース110aから深度マップ806に類似する深度マップおよび関連情報が検索される。具体的には、深度マップ806から抽出される深度マップ特徴量(以下、「対象深度マップ特徴量」ともいう。)をクエリとして用いる。
【0080】
類似画像検索結果808に示されるように、まず、深度マップ806の深度マップ特徴量と深度テーブルの深度マップ特徴量を比較し、深度マップ806と深度テーブルの深度マップとの間の類似度が算出される。画像ID=2の深度マップは類似度が0.90である。画像ID=1のテンプレート画像の深度マップは類似度が0.80である。画像ID=3のテンプレート画像の深度マップは類似度が0.50である。画像テーブルには3以上のレコードが含まれているところ、類似画像検索処理においては、例えば類似度が所定値(ここでは0.50)以上となるテンプレート画像(以下、「類似テンプレート画像」ともいう。)を抽出する。または、ユーザによって類似テンプレート画像を選択させることも可能である。
【0081】
続いて、画像データベース110aから抽出された類似テンプレート画像の物体の数を取得する。具体的には、抽出された類似テンプレート画像に関して物体テーブルを参照し、対象物体と同じ種別として検出された物体の数を算出する。画像ID=2のテンプレート画像は16棟の住宅を含む。画像ID=1のテンプレート画像は11棟の住宅を含む。画像ID=3のテンプレート画像は12棟の住宅を含む。なお、物体の数をカウントする場合、所定の信頼度以上のもののみをカウント対象とすることとしてもよい。
【0082】
続いて、密度推定処理809において、物体の平均密度が計算される。具体的には、領域テーブルに示される斜線表示部分Sbの面積を算出し、物体の数と面積に基づいて密度が算出される。
【0083】
算出された密度を対象画像801に適用して、対象画像801に含まれる物体の数が推定される。
【0084】
(密度推定処理の処理手順)
図10を参照して、類似画像の検索を用いた密度推定の処理手順を説明する。
図10は、密度推定処理のフローチャートを示す図である。物体規模の推定処理のうち、特に密度推定に部分を説明する。密度推定部109は、前記対象画像の深度マップの特徴量である対象深度マップ特徴量と類似するテンプレート深度マップ特徴量を有するテンプレート画像である類似テンプレート画像を、画像テーブルから抽出し、類似テンプレート画像に含まれる対象物体の数である第2物体数を、前記物体テーブルに基づいて算出し、類似テンプレート画像の領域に含まれる対象物体の密度である第2密度を、第2物体数および前記領域テーブルに基づいて算出し、物体数推定部109は、第2密度を用いて第1物体数を算出する。
【0085】
物体検出部108は、読み込んだ対象画像から物体を検出し、検出された物体の数を数える。密度推定部109は、検出された物体の数が所定数以上であるかどうかを判断する(ステップS901)。所定数以上である場合(ステップS901においてYES)、密度推定部109は、第1実施形態に示すように密度推定を行う(ステップS909)。一方、所定数未満である場合(ステップS901においてNO)、密度推定部109は、深度マップ特徴量をクエリとして、物体規模の推定処理の対象とする対象画像に類似したテンプレート画像である類似テンプレート画像を検索する(ステップS902)。
【0086】
類似テンプレート画像の検索処理は、画像データベース110aの画像テーブルに含まれるレコードに対して繰り返して行われる(ステップS903からステップS908)。密度推定部109は、画像データベース110aの画像テーブルから、類似度が所定値以上となるテンプレート画像を抽出する。または、密度推定部109によって算出された類似度と画像テーブルのテンプレート画像をユーザに提示し、ユーザによって類似テンプレート画像を選択させることも可能である。類似度による抽出とユーザによる選択を組み合わせてもよい。ユーザによる選択を採用することによって、物体規模の推定処理の対象となる画像自体の見た目の特徴が考慮されることになるため、物体規模の推定処理の結果がより現実に即したものとなることが期待される。
【0087】
密度推定部109は、画像データベース110aから抽出されたテンプレート画像の物体を取得する(ステップS905)。具体的には、密度推定部109は、画像データベース110aの画像テーブルから抽出されたある画像IDのテンプレート画像について、物体テーブルを参照してテンプレート画像に含まれる物体の数をカウントする。なお、物体の数をカウントする場合、所定の信頼度以上のものをカウントする対象とすることとしてもよい。物体の数が所定数以上でない場合(ステップS906においてNO)、密度推定部109は次の画像について処理を行う。
【0088】
物体の数が所定数以上である場合(ステップS906においてYES)、密度推定部109は、密度を計算し、平均密度を更新する。具体的には、密度推定部109は、領域テーブルに示されて領域の面積を算出し、物体の数と面積に基づいて密度を算出する。画像テーブルから抽出されるテンプレート画像についてステップS903からステップS907の処理を行い、算出された密度の平均値を算出する。
【0089】
なお、ここで平均密度を用いることによって、複数の検索結果が考慮されることになり、推定される密度がより正しい値となることが期待される。なお、平均値の取り方としては、単純平均を用いる方法の他にも、例えば類似度に応じて重みを付けて平均をとる方法、などの種々の方法を適用することも可能である。
【0090】
(物体規模推定の結果の出力の例)
図11は、物体規模推定システム100における物体規模の推定処理の結果の出力例を模式的に示す図である。第1実施形態の出力例との違いは、類似画像検索結果表示部1001が示される点である。
【0091】
類似画像検索結果表示部1001において、画像ID、深度マップ特徴量の類似度(対象深度マップ特徴量とテンプレート深度マップ特徴量の間の類似度)、画像IDに対応するテンプレート画像における物体の数、画像テーブルにおける深度マップおよびテンプレート画像が示される。
【0092】
(物体規模の推定処理の手順)
図12を参照して、密度推定の処理手順を説明する。
図12は、物体規模の推定処理を示すシーケンス図である。ユーザ1100は、物体規模推定システム100aのユーザである。また、計算機1120は、物体規模推定システム100aをハードウェアとして実現した場合の一態様を示すものであり、例えば、入力装置102と表示装置103と主機能部104を含む電子計算機である。
【0093】
最初に、ユーザ1100は、物体数を推定する要求を計算機1120に入力する(ステップS1101)。電子計算機1120は物体数を推定する対象となる画像である入力画像の要求を記憶装置101に送り(ステップS1102)、記憶装置101は入力画像を電子計算機1120に送る(ステップS1103)。
【0094】
計算機1120は、入力画像である対象画像に対して、深度推定処理(ステップS1104)、領域抽出処理(ステップS1105)、および物体検出処理(近距離の物体数の検出)(ステップS1106)を行う。なお、
図11において示されるのは一例であり、この3つの処理は順序を入れ替えることが可能である。
【0095】
計算機1120は、深度推定処理と領域推定処理と物体検出処理によって取得された値等を含む画像認識結果を画像データベース110aに登録する(S1107)。画像データベース110aは登録完了通知をする(ステップS1108)。
【0096】
計算機1120は、画像認識結果表示をユーザ1100に示す(ステップS1109)。画像認識結果表示は、
図10の画像認識結果表示部704に示されるように、物体検出処理によって検出された物体を示す矩形部分と、領域抽出処理によって抽出された推定領域を示す斜線表示部分とを、読み込まれた対象画像上に重ねて表示した態様で示す。
【0097】
ここで、物体検出処理(ステップS1106)において物体数が所定数以上でない場合、計算機1120は密度推定処理(ステップS1110)を行う。密度推定処理(ステップS1110)は、
図10に示されるように、類似画像検索(ステップS1111)から密度推定に用いるテンプレート画像を選択する(ステップS1114)までの間の処理である。
【0098】
計算機1120は、類似画像検索(ステップS1111)を行い、画像データベース110aから検索結果を抽出する(ステップS1112)。
【0099】
計算機1120は、検索結果表示をユーザ1100に示す(ステップS1113)。類似画像検索(および密度推定)の結果表示は、
図11の類似画像検索結果表示部1001に示されるように、画像ID、深度マップ特徴量の類似度(対象深度マップ特徴量とテンプレート深度マップ特徴量の間の類似度)、画像IDに対応するテンプレート画像における物体の数、画像テーブルにおける深度マップおよび画像を含む。
【0100】
ユーザ1100は、類似画像検索の結果表示のなかから、密度推定に用いるテンプレート画像を選択する(ステップS1114)。ユーザの選択は、計算機1120に入力される。
【0101】
計算機1120は、選択されたテンプレート画像に基づいて、遠距離の物体数の推定する(ステップS1115)。計算機1120は、ユーザ1100に物体数を表示する(ステップS1116)。物体数の表示は、
図11の規模推定結果表示部705に示される態様で行われる。
【0102】
(作用・効果)
撮像を行う対象によっては、撮像された画像の中に近距離にある物体がわずかしか含まれておらず、物体検出による密度推定を行うことができない場合がある。このような場合であっても、類似画像に基づいて密度推定を行うことができるため、物体規模の推定処理を行うことが可能である。
【0103】
[その他の実施形態]
本開示において住宅を物体規模の推定処理の対象としたが、本開示はこれに限定されない。例えば、山間部に水害が発生した場合、河川に流木が流出することがある。物体規模の推定処理の対象に流木を適用することも可能である。また、資源の採掘施設において、採掘された資源を堆積させておく場合がある。物体規模の推定処理の対象に堆積物を適用することも可能である。
【0104】
本開示において物体規模の推定処理の対象に1つの画像とする場合を説明したが、本開示はこれに限定されない。被写体を複数の画像に分けて撮像する場合、複数の画像を組み合わせて形成した被写体に対して、物体規模の推定処理を行うことも可能である。
【0105】
以上、本発明の実施の形態について説明したが、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【0106】
本発明の内容となり得る態様を以下に述べる、ただしこれに限られるものではない。
(態様1)
物体規模の推定処理の対象となる画像である対象画像の深度マップを生成する深度推定部と、
前記対象画像において、検出対象となる物体である対象物体を検出する物体検出部と、
前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出部と、
前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定部と、
前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定部、
を備える物体規模推定装置。
(態様2)
前記深度推定部は、前記対象画像が撮像された場合における俯角および高度に基づいて、前記深度マップを生成する、
態様1に記載の物体規模推定装置。
(態様3)
前記対象画像は単眼カメラによって撮像された画像であり、
前記深度推定部は、単眼深度推定を行い前記深度マップを生成する、
請求項1または2に記載の物体規模推定装置。
(態様4)
テンプレート画像と前記テンプレート画像の深度マップに含まれる特徴量であるテンプレート深度マップ特徴量を関連付けた画像テーブルと、
前記テンプレート画像に含まれる物体および前記物体の種別を含む物体テーブルと、
前記テンプレート画像から抽出される領域および前記領域の種別を示す領域テーブルと、を含む画像データベース、をさらに備え、
前記密度推定部は、密度を推定できない場合、
前記対象画像の深度マップの特徴量である対象深度マップ特徴量と類似するテンプレート深度マップ特徴量を有するテンプレート画像である類似テンプレート画像を、前記画像テーブルから抽出し、
前記類似テンプレート画像に含まれる対象物体の数である第2物体数を、前記物体テーブルに基づいて算出し、
前記類似テンプレート画像の前記領域に含まれる前記対象物体の密度である第2密度を、前記第2物体数および前記領域テーブルに基づいて算出し、
前記物体数推定部は、
前記第2密度を用いて前記第1物体数を算出する、
態様1から3のいずれか1つに記載の物体規模推定装置。
(態様5)
前記類似テンプレート画像はユーザによって選択される、
態様1から4のいずれか1つに記載の物体規模推定装置。
(態様6)
物体規模の推定処理の対象となる画像である対象画像の深度マップを生成する深度推定ステップと、
前記対象画像において、検出対象となる物体である対象物体を検出する物体検出ステップと、
前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出ステップと、
前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定ステップと、
前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定ステップ、
を備える物体規模推定方法。
(態様7)
物体規模の推定処理の対象となる画像である対象画像を撮像する撮像装置と、
前記撮像装置の深度マップを生成する深度推定部と、
前記対象画像において、検出対象となる物体である対象物体を検出する物体検出部と、
前記対象物体が含まれると推定される領域である推定領域を抽出する領域抽出部と、
前記対象物体および前記深度マップに基づいて、対象物体の密度を推定する密度推定部と、
前記推定領域および前記深度マップに基づいて前記推定領域の面積を推定し、前記対象物体の前記密度および面積に基づいて前記推定領域における対象物体の数である第1物体数を算出する物体数推定部、
を備える物体規模推定システム。
(態様8)
前記撮像装置はドローンに搭載される、態様7に記載の物体規模推定システム。
(態様9)
前記対象画像に前記対象物体を示す第1図形および前記推定領域を示す第2図形を重ねて表示した画像認識結果を示す表示装置、をさらに備える態様7または8に記載の物体規模推定システム。
【符号の説明】
【0107】
10 撮像画像、11 物体検出後画像、12 矩形部分、13 領域抽出後画像、
100、100a 物体規模推定システム、101 記憶装置、
102 入力装置、103 表示装置、104 主機能部、105 画像入力部、
106 領域抽出部、107 深度推定部、108 物体検出部、109 物体数推定部、
109 密度推定部、110、110a 画像データベース、111 物体数推定部、
112 表示部、
201 プロセッサ、202 主記憶装置、203 処理プログラム
301 対象画像、302 深度推定処理、303 深度マップ、304 領域抽出処理、
305 物体検出後画像、306 物体検出処理、307 物体検出後画像、
308 密度推定処理、309 密度情報、310 面積推定処理、311 面積情報、
312 物体数推定処理、
700 マウスカーソル、701 ボタン、702 入力画像表示部、
703 規模推定実行ボタン、704 画像認識結果表示部、705 規模推定結果表示部、
801 対象画像、802 物体検出処理、803 物体検出後画像、804 密度推定不可、805 深度推定処理、806 深度マップ、
807 類似画像検索処理、808 類似画像検索結果、809 密度推定処理、
1001 類似画像検索結果表示部、1100 ユーザ、1120 電子計算機、
1120 計算機