(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024130386
(43)【公開日】2024-09-30
(54)【発明の名称】情報処理装置、アノテーション方法、及びプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240920BHJP
【FI】
G06T7/00 C
G06T7/00 U
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2023040067
(22)【出願日】2023-03-14
(71)【出願人】
【識別番号】322003857
【氏名又は名称】パナソニックオートモーティブシステムズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】張 嶼城
(72)【発明者】
【氏名】木内 真也
(72)【発明者】
【氏名】黒田 豊治
(72)【発明者】
【氏名】前田 昌克
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA09
5L096CA02
5L096CA23
5L096DA01
5L096DA02
5L096FA18
5L096FA59
5L096FA64
5L096FA66
5L096FA69
5L096GA51
5L096HA11
5L096JA13
5L096KA04
(57)【要約】
【課題】アノテーション作業にかかる負担を軽減することができる情報処理装置、アノテーション方法、及びプログラムを提供する。
【解決手段】本開示に係る情報処理装置は、第1取得部と、第1検出部と、第2取得部と、第2検出部と、照合部と、補正部と、を備える。第1取得部は、3次元距離センサにより生成された3次元情報を取得する。第1検出部は、前記3次元情報に含まれる物体の領域である3次元領域を検出する。第2取得部は、撮影部より撮影された2次元画像を取得する。第2検出部は、前記2次元画像に含まれる物体の領域である2次元領域を検出する。照合部は、前記第1特定部による3次元領域と、前記第2特定部による2次元領域とを照合する。補正部は、前記照合部による照合結果に基づいて、前記第1検出部による検出結果を補正する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
3次元距離センサにより生成された3次元情報を取得する第1取得部と、
前記3次元情報に含まれる物体の領域である3次元領域を検出する第1検出部と、
撮影部より撮影された2次元画像を取得する第2取得部と、
前記2次元画像に含まれる物体の領域である2次元領域を検出する第2検出部と、
前記第1検出部による前記3次元領域と、前記第2検出部による前記2次元領域とを照合する照合部と、
前記照合部による照合結果に基づいて、前記第1検出部による検出結果を補正する補正部と、
を備える情報処理装置。
【請求項2】
前記3次元領域から、前記2次元領域に対応する照合領域を抽出する抽出部を更に備え、
前記照合部は、前記3次元領域の前記照合領域と、前記2次元領域とを照合する、
請求項1に記載の情報処理装置。
【請求項3】
操作を受け付ける操作部を更に備え、
前記照合部は、前記2次元領域と適合しない前記照合領域のリストである誤検出リストを生成し、
前記補正部は、前記操作部が受け付けた操作に基づいて、前記誤検出リストに含まれる前記照合領域に対応する前記3次元領域を修正する、
請求項2に記載の情報処理装置。
【請求項4】
前記照合部は、照合する前記照合領域が無い前記2次元領域のリストである未検出リストを生成し、
前記補正部は、前記未検出リストに含まれる前記2次元領域に対応する前記3次元領域を追加する、
請求項2に記載の情報処理装置。
【請求項5】
前記補正部は、前記未検出リストの前記2次元領域に含まれる物体の車種により特定される大きさの前記3次元領域を付加する、
請求項4に記載の情報処理装置。
【請求項6】
前記補正部は、前記未検出リストの前記2次元領域に車両の側面が含まれているが、車種を特定することができない場合に、一般的な車両の大きさの前記3次元領域を付加する、
請求項4に記載の情報処理装置。
【請求項7】
前記補正部は、前記誤検出リストに含まれる前記照合領域を強調表示する、
請求項3に記載の情報処理装置。
【請求項8】
前記補正部は、前記誤検出リストに含まれる前記照合領域の詳細な情報を表示する、
請求項3に記載の情報処理装置。
【請求項9】
前記補正部は、前記未検出リストに含まれる前記2次元領域を表示する、
請求項4に記載の情報処理装置。
【請求項10】
前記第1検出部は、前記3次元領域をアノテーションし、
前記補正部は、前記照合部による照合結果に基づいて、前記第1検出部によるアノテーション結果を補正する、
請求項1から請求項9の何れか一項に記載の情報処理装置。
【請求項11】
3次元距離センサにより生成された3次元情報を取得し、
前記3次元情報に含まれる物体の領域である3次元領域を検出し、
撮影部より撮影された2次元画像を取得し、
前記2次元画像に含まれる物体の領域である2次元領域を検出し、
前記3次元領域と、前記2次元領域とを照合し、
照合結果に基づいて、前記3次元領域の検出結果を補正する、
ことを含むアノテーション方法。
【請求項12】
3次元距離センサにより生成された3次元情報を取得し、
前記3次元情報に含まれる物体の領域である3次元領域を検出し、
撮影部より撮影された2次元画像を取得し、
前記2次元画像に含まれる物体の領域である2次元領域を検出し、
前記3次元領域と、前記2次元領域とを照合し、
照合結果に基づいて、前記3次元領域の検出結果を補正する、
をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、アノテーション方法、及びプログラムに関する。
【背景技術】
【0002】
従来、LiDAR(Light Detection and Ranging)などの3次元距離センサにより取得された3次元情報に基づいて、対象物を認識する技術について研究されている。このような技術を向上させるためには、アノテーションされた3次元情報が数多く必要になる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、手動により3次元情報にアノテーションを付加するのは煩雑である。
【0005】
本開示は、アノテーション作業にかかる負担を軽減することができる情報処理装置、アノテーション方法、及びプログラムを提供する。
【課題を解決するための手段】
【0006】
本開示に係る情報処理装置は、第1取得部と、第1検出部と、第2取得部と、第2検出部と、照合部と、補正部と、を備える。第1取得部は、3次元距離センサにより生成された3次元情報を取得する。第1検出部は、前記3次元情報に含まれる物体の領域である3次元領域を検出する。第2取得部は、撮影部より撮影された2次元画像を取得する。第2検出部は、前記2次元画像に含まれる物体の領域である2次元領域を検出する。照合部は、前記第1特定部による3次元領域と、前記第2特定部による2次元領域とを照合する。補正部は、前記照合部による照合結果に基づいて、前記第1検出部による検出結果を補正する。
【発明の効果】
【0007】
本開示に係る情報処理装置、アノテーション方法、及びプログラムによれば、アノテーション作業にかかる負担を軽減することができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、第1の実施形態に係る情報処理装置のハードウェア構成の一例を示す図である。
【
図2】
図2は、第1の実施形態に係る情報処理装置の機能構成の一例を示すブロック図である。
【
図3】
図3は、3次元検出ボックスが付加された3次元情報の一例を示す図である。
【
図4】
図4は、3次元照合領域の一例を示す図である。
【
図5】
図5は、2次元検出ボックスの一例を示す図である。
【
図6】
図6は、車両を示す点群を強調表示した画像の一例を示す図である。
【
図7】
図7は、3次元情報に付加するか否かを入力する画像の一例を示す図である。
【
図8】
図8は、第1の実施形態に係る情報処理装置が実行するアノテーション処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、本開示に係る情報処理装置、アノテーション方法、及びプログラムの実施形態について説明する。
【0010】
(第1の実施形態)
図1は、第1の実施形態に係る情報処理装置1のハードウェア構成の一例を示す図である。情報処理装置1は、パーソナルコンピュータやサーバ装置などのコンピュータである。情報処理装置1は、3次元距離センサにより取得された3次元情報に対する物体検出の結果を付与する。
【0011】
ここで、3次元情報に含まれる物体を検出する物体検出(object detection)を行う学習済みモデルを生成するためには、数多くの教師データが必要になる。すなわち、物体検出の検出結果がアノテーションされた3次元情報が数多く必要になる。しかしながら、数多くの3次元情報に対して、アノテーション作業を行うことは煩雑である。
【0012】
そこで、情報処理装置1は、アノテーション作業の負担を軽減する。本実施形態では、道路などをスキャンした3次元画像に対して、3次元画像に含まれる車両の位置、車両の大きさ等の情報を付与するアノテーション作業の負担を軽減する場合を例について説明する。すなわち、本実施形態に係る情報処理装置1は、3次元画像から物体を検出し、検出した物体を囲うバウンディングボックス(Bounding Box)をアノテーションする。
【0013】
情報処理装置1は、プロセッサ10、RAM(Random Access Memory)11、記憶部12、通信部13、表示部14、及び操作部15を備える。
【0014】
プロセッサ10は、情報処理装置1を制御する。例えば、プロセッサ10は、CPU(Central Processing Unit)などの処理回路である。なお、プロセッサ10は、CPUに限らず、他の処理回路であってもよい。
【0015】
RAM11は、キャッシュまたはバッファなどとして使用される揮発性メモリである。プロセッサ10は、特定のコンピュータプログラムを記憶部12から読み出してRAM11に展開することによって、各種機能を実現する。
【0016】
記憶部12は、HDD(Hard Disk Drive)やSSD(Solid State Drive)などの記憶装置である。例えば、記憶部12は、情報処理装置1が有する機能を実現するためのコンピュータプログラムを記憶する。
【0017】
通信部13は、ネットワークを介して接続された装置と通信を実行する。例えば、通信部13は、NIC(Network Interface Card)である。
【0018】
表示部14は、液晶ディスプレイや有機EL(Electro Luminescence)などの表示装置である。
【0019】
操作部15は、キーボードやマウスやタッチパネルなどの入力装置である。
【0020】
次に、第1の実施形態に係る情報処理装置1が有する機能について説明する。
【0021】
図2は、第1の実施形態に係る情報処理装置1の機能構成の一例を示すブロック図である。情報処理装置1のプロセッサ10は、特定のコンピュータプログラムを記憶部12から読み出してRAM11に展開することによって、各種機能を実現する。更に詳しくは、情報処理装置1は、事前アノテーション部110、抽出部115、2次元画像取得部121、2次元物体検出部122、照合部130、及び補正部140を備える。
【0022】
事前アノテーション部110は、3次元情報に含まれる物体を検出する物体検出の検出結果を付与する。すなわち、事前アノテーション部110は、3次元情報に対して物体検出を実行することにより、3次元情報から検出した物体を囲うバウンディングボックスを3次元情報に付与する。さらに詳しくは、事前アノテーション部110は、3次元情報取得部111、3次元物体検出部112、領域調整部113、及び識別情報付与部114を備える。
【0023】
3次元情報取得部111は、3次元距離センサにより生成された3次元情報を取得する。3次元情報取得部111は、第1取得部の一例である。さらに詳しくは、3次元情報取得部111は、LiDARなどの3次元距離センサによりスキャンされた3次元情報を取得する。3次元情報は、3次元距離センサによりスキャンされた空間上の物体の形状を、3次元座標を示す点により表現した情報である。また、3次元情報の各点には、3次元距離センサが物体を検出した強度が含まれる。
【0024】
例えば、3次元情報取得部111は、ネットワークを介して接続された装置から3次元情報を取得する。なお、3次元情報取得部111は、LiDARに限らず、他の3次元距離センサによりスキャンされた3次元情報を取得してもよい。また、3次元情報取得部111は、情報処理装置1が3次元距離センサを有している場合には、3次元距離センサから3次元情報を取得してもよい。
【0025】
3次元物体検出部112は、3次元情報に含まれる物体を検出する物体検出を実行することにより、3次元情報に含まれる物体の領域である3次元検出ボックスB1を検出する。3次元物体検出部112は、第1検出部の一例である。すなわち、3次元物体検出部112は、3次元検出ボックスB1を3次元情報にアノテーションする。例えば、3次元物体検出部112は、3次元情報取得部111により取得された3次元情報を学習済みモデルに入力することにより物体検出を実行する。例えば、学習済みモデルは、ボクセルのRCNN(Region Based Convolutional Neural Networks)などである。また、3次元物体検出部112は、OpenPCDetなどの物体ごとの3次元情報が登録されたツールにより物体検出を実行してもよい。
【0026】
さらに詳しくは、3次元物体検出部112は、物体検出を実行することにより、検出した車両や歩行者などの物体を囲う3次元のバウンディングボックスである3次元検出ボックスB1を取得する。3次元検出ボックスB1には、3次元情報に含まれる物体の識別結果、物体の位置を示す座標、物体の大きさ等の情報が含まれる。
【0027】
図3は、3次元検出ボックスB1が付加された3次元情報の一例を示す図である。
図3に示すように、3次元検出ボックスB1は、3次元情報から検出した物体の領域を示す情報である。言い換えると、3次元検出ボックスB1は、3次元情報が点群により示す車両などの物体を覆う立方体である。
【0028】
領域調整部113は、3次元検出ボックスB1が示す領域を、3次元検出ボックスB1内の物体に応じて調整する。ここで、3次元検出ボックスB1の領域と、物体の領域とが一致しない場合がある。例えば、3次元物体検出部112は、3次元情報から車両を検出したとする。この場合に、3次元物体検出部112は、一般的な車両の大きさに基づいて、3次元検出ボックスB1を設定する。日本には、比較的に小さい車両が多い。そのため、3次元物体検出部112が想定している車両の大きさと、3次元情報に含まれる車両の大きさと、が一致しないことがある。そこで、領域調整部113は、3次元情報に含まれる車両の大きさに一致するように、3次元検出ボックスB1の大きさを調整する。
【0029】
識別情報付与部114は、3次元物体検出部112により検出された物体に対して、物体のそれぞれを識別するための識別情報を付与する。言い換えると、識別情報付与部114は、3次元物体検出部112により設定された3次元検出ボックスB1に対して、3次元検出ボックスB1のそれぞれを識別するための識別情報を付与する。
【0030】
このようにして、事前アノテーション部110は、事前に3次元情報にアノテーションする。すなわち、事前アノテーション部110は、補正部140が補正を行う前に、3次元情報にアノテーションする。さらに詳しくは、事前アノテーション部110は、3次元物体検出部112が検出した3次元検出ボックスB1について、領域調整部113が領域を調整し、識別情報付与部114が識別情報を付与することにより3次元情報にアノテーションする。
【0031】
抽出部115は、大きさが調整された3次元検出ボックスB1から、2次元検出ボックスB3(
図5参照)に対応する3次元照合領域B2を抽出する。
図4は、3次元照合領域B2の一例を示す図である。
図4に示す3次元検出ボックスB1は、車両の領域を示している。3次元照合領域B2は、3次元検出ボックスB1から抽出される領域であって、2次元画像から抽出された領域と照合する2次元の領域である。
【0032】
抽出部115は、大きさが調整された3次元検出ボックスB1から、断面又は面を3次元照合領域B2として抽出する。さらに詳しくは、抽出部115は、照合対象の2次元画像に応じて、3次元照合領域B2として抽出する断面又は面を特定する。
【0033】
例えば、
図4に示すように物体を右側前方から撮像した2次元画像と照合する場合、抽出部115は、
図4に示す3次元照合領域B2を抽出する。具体的には、抽出部115は、3次元検出ボックスB1の上面の頂点を繋ぐ対角線と、この対角線と平行であって3次元検出ボックスB1の底面の頂点を繋ぐ対角線と、を通る断面を3次元照合領域B2として抽出する。すなわち、抽出部115は、3次元検出ボックスB1の正面左上側の頂点と背面右上側の頂点とを繋ぐ対角線と、3次元検出ボックスB1の正面左下側の頂点と背面右下側の頂点とを繋ぐ対角線と、を通る断面を3次元照合領域B2として抽出する。
【0034】
また、物体を左側前方から撮像した2次元画像と照合する場合、抽出部115は、3次元検出ボックスB1の正面右上側の頂点と、背面左上側の頂点とを繋ぐ対角線と、3次元検出ボックスB1の正面右下側の頂点と、背面左下側の頂点とを繋ぐ対角線とを通る断面を3次元照合領域B2として抽出する。
【0035】
また、物体を前方から撮像した2次元画像と照合する場合、抽出部115は、3次元検出ボックスB1の正面を3次元照合領域B2として抽出する。
【0036】
2次元画像取得部121は、撮像部より撮像された2次元画像を取得する。2次元画像取得部121は、第2取得部の一例である。2次元画像は、2次元の画像データである。例えば、2次元画像取得部121は、ネットワークを介して接続された装置から2次元画像を取得する。また、2次元画像取得部121は、情報処理装置1が撮像部を有している場合には、撮像部から2次元画像を取得してもよい。
【0037】
2次元物体検出部122は、2次元画像に含まれる物体を検出する物体検出を実行することにより、2次元画像に含まれる物体の領域である2次元検出ボックスB3(
図5参照)を検出する。2次元物体検出部122は、第2検出部の一例である。例えば、2次元物体検出部122は、2次元画像取得部121により取得された2次元画像を学習済みモデルに入力することにより物体検出を実行する。例えば、学習済みモデルは、2次元画像から、車両を斜め方向から撮像した画像、車両の正面の画像、車両の右側側面の画像、車両の左側側面の画像を検出した場合に、該当する車両の2次元物体検出情報を取得する。例えば、学習済みモデルは、YOLO(You Only Look Once)などである。
【0038】
2次元物体検出部122は、物体検出を実行することにより、検出した車両や歩行者などの物体を囲う2次元のバウンディングボックスである2次元検出ボックスB3を取得する。2次元検出ボックスB3には、2次元画像に含まれる物体の識別結果、物体の位置を示す座標、物体の大きさが含まれる。
【0039】
図5は、2次元検出ボックスB3の一例を示す図である。
図5に示すように、2次元検出ボックスB3は、2次元画像から検出した物体の領域を示す情報である。また、2次元検出ボックスB3は、3次元画像から抽出された3次元照合領域B2と照合する2次元の領域である。
【0040】
照合部130は、3次元物体検出部112による3次元検出ボックスB1と、2次元物体検出部122による2次元検出ボックスB3とを照合する。すなわち、照合部130は、3次元検出ボックスB1から抽出した3次元照合領域B2と、2次元検出ボックスB3とを照合する。さらに詳しくは、照合部130は、抽出部115により抽出された3次元照合領域B2と、一対一の関係を有する2次元検出ボックスB3を特定する。言い換えると、照合部130は、抽出部115により抽出された3次元照合領域B2に対応する2次元検出ボックスB3を特定する。
【0041】
照合部130は、抽出部115により抽出された3次元照合領域B2の中心点から、2次元物体検出部122により検出された複数の2次元検出ボックスB3のそれぞれの中心点までのユークリッド距離を得る。また、照合部130は、ユークリッド距離により、Hungarianアルゴリズムのコスト行列を構築する。そして、照合部130は、3次元照合領域B2に対応する2次元検出ボックスB3を特定する。この処理を、照合部130は、抽出部115により抽出されたそれぞれの3次元照合領域B2に対して実行する。
【0042】
また、照合部130は、3次元照合領域B2と2次元検出ボックスB3との対応付けを検証する。そして、照合部130は、3次元照合領域B2と2次元検出ボックスB3との対応付けが不適切な場合に、誤検出リストを生成する。誤検出リストは、2次元検出ボックスB3と適合しない3次元照合領域B2のリストである誤検出リストを生成する。
【0043】
例えば、照合部130は、3次元照合領域B2の面積と2次元検出ボックスB3の面積とを比較することより、適切な対応付けであるか否かを判定する。さらに詳しくは、照合部130は、IoU(Intersection over Union)に基づいて、一対一の関係にある3次元照合領域B2と2次元検出ボックスB3との領域の重なり度合いを算出する。
【0044】
ここで、照合部130は、ユークリッド距離により対応付けているため、3次元照合領域B2の物体と2次元検出ボックスB3の物体とがそれぞれ異なっていても、3次元照合領域B2と2次元検出ボックスB3とを対応付けてしまう可能性がある。例えば、照合部130は、歩行者の3次元照合領域B2と、車両の2次元検出ボックスB3とを対応付けてしまう可能性がある。そこで、照合部130は、領域の重なり度合いにより異なる物体同士を対応付けていないかを判定する。
【0045】
照合部130は、領域の重なり度合いが閾値未満の場合に、3次元照合領域B2と2次元検出ボックスB3との対応付けは誤りであると判定する。照合部130は、対応付けは間違いと判定した場合に、判定対象の3次元照合領域B2を誤検出リストに登録する。この処理を、照合部130は、一対一の関係にある3次元照合領域B2と2次元検出ボックスB3とのそれぞれに対して実行する。
【0046】
さらに、照合部130は、抽出部115により抽出された3次元照合領域B2が、何れの2次元検出ボックスB3とも対応付けられなかった場合に、対応付けられなかった3次元照合領域B2を誤検出リストに加える。
【0047】
また、照合部130は、何れの3次元照合領域B2とも対応付けられなかった2次元検出ボックスB3が有る場合に、未検出リストに生成する。未検出リストは、照合する3次元照合領域B2が無い2次元検出ボックスB3のリストである。
【0048】
補正部140は、照合部130による照合結果に基づいて、事前アノテーション部110による事前アノテーションの結果を補正する。すなわち、補正部140は、誤検出リスト、及び未検出リストについて補正する。
【0049】
補正部140は、未検出リストに含まれる2次元検出ボックスB3に対応する3次元検出ボックスB1を3次元情報に付加する。さらに詳しくは、補正部140は、未検出リストの2次元検出ボックスB3内の画像に基づいて、車両の車種を特定可能であるか否かを判定する。
【0050】
補正部140は、車両の車種を特定可能な場合、未検出リストの2次元検出ボックスB3に含まれる物体の車種により特定される大きさの3次元検出ボックスB1を3次元情報に付加する。さらに詳しくは、補正部140は、未検出リストの2次元検出ボックスB3内の画像に含まれる車両の車種を特定する。車種とは、車両の種類を示す情報である。例えば、車種は、車検証の型式であってもよいし、車両保険における車種であってもよい。また、補正部140は、高さや奥行などの各車両の大きさに関する情報を有するデータベースなどから、特定した車両の大きさを示す情報を取得する。例えば、車両の大きさを示す情報は、車検証の車幅、車長、車高などの情報である。また、補正部140は、2次元検出ボックスB3内の画像に含まれる車両を示す点群を、3次元情報から特定する。そして、補正部140は、データベースから取得した車両の大きさに基づいて、3次元情報から特定した点群の位置に3次元検出ボックスB1を3次元情報に付加する。
【0051】
例えば、補正部140は、2次元検出ボックスB3内の画像が、車両の右側側面や左側側面などの車両の一部の場合、車両の車種を特定することができない。補正部140は、未検出リストの2次元検出ボックスB3に車両の側面が含まれているが、車種を特定することができない場合に、一般的な車両の大きさの3次元検出ボックスB1を3次元情報に付加する。さらに詳しくは、補正部140は、車両の車種を特定することができない場合、各車両の大きさに関する情報を有するデータベースなどから、一般的な車両の大きさを示す情報を取得する。また、補正部140は、2次元検出ボックスB3内の画像に含まれる車両を示す点群を、3次元情報から特定する。そして、補正部140は、データベースから取得した一般的な車両の大きさに基づいて、3次元情報から特定した点群の位置に3次元検出ボックスB1を3次元情報に付加する。一般的な車両の大きさは、事前に設定されていてもよいし、データベースに登録された各車両の大きさの平均値や中央値であってもよいし、他の方法により決定されたものであってもよい。
【0052】
このようにして、補正部140は、未検出リストの2次元検出ボックスB3内の画像に基づいて、車両の位置および車両の大きさを示す情報を3次元情報に付加する。
【0053】
また、補正部140は、未検出リストの2次元検出ボックスB3内の画像に含まれる車両を示す点群を強調して表示部14に表示してもよい。
図6は、車両を示す点群を強調表示した画像の一例を示す図である。例えば、補正部140は、未検出枠線B4で囲うことにより、車両を示す点群を強調して表示する。なお、補正部140は、未検出枠線B4で囲う方法に限らず、点群の色を変えることにより強調してもよいし、点群の点滅により強調してもよいし、他の方法により強調してもよい。
【0054】
補正部140は、誤検出リストの3次元検出ボックスB1が誤っているか否かの判断をユーザに求める。すなわち、補正部140は、3次元検出ボックスB1が誤っているか否かの操作を受け付ける。補正部140は、操作部の一例である。そして、補正部140は、受け付けた操作に基づいて、誤検出リストに含まれる3次元照合領域B2に対応する3次元検出ボックスB1を修正する。さらに詳しくは、補正部140は、誤検出リストの3次元検出ボックスB1を3次元情報に付加するか否かを入力する画像を表示部14に表示する。
【0055】
図7は、3次元情報に付加するか否かを入力する画像の一例を示す図である。補正部140は、点群画像R1と、詳細情報表示領域R2とを表示部14に表示する。点群画像R1は、誤検出リストの3次元照合領域B2を含む3次元情報を示す画像である。また、点群画像R1は、誤検出リストの3次元照合領域B2に含まれる車両などの物体を示す点群を強調する誤検出枠線B5を有する。
【0056】
補正部140は、誤検出枠線B5で囲うことにより、3次元照合領域B2を有する3次元検出ボックスB1の車両などの物体を示す点群を強調して表示する。なお、補正部140は、誤検出枠線B5で囲う方法に限らず、点群の色を変えることにより強調してもよいし、点群の点滅により強調してもよいし、他の方法により強調してもよい。
【0057】
詳細情報表示領域R2は、誤検出リストの3次元照合領域B2を有する3次元検出ボックスB1に含まれ点群の詳細な情報を表示する領域である。例えば、詳細情報表示領域R2は、3次元検出ボックスB1に含まれ点群が示す車両の高さや奥行などの大きさや、位置などの情報を表示する領域である。
【0058】
さらに、補正部140は、点群画像R1に重畳して、メッセージM1と、はいボタンM2と、いいえボタンM3とを表示する。例えば、メッセージM1は、「間違い?」などにより誤検出であるか否かの判断をユーザに求める文章である。はいボタンM2は、事前アノテーション部110による検出が誤検出であることを示す操作を受け付けるボタンである。いいえボタンM3は、事前アノテーション部110による検出が誤検出ではないことを示す操作を受け付けるボタンである。
【0059】
補正部140は、はいボタンM2が押下された場合に、強調表示を維持する。強調表示を維持することにより、補正部140は、作業者によるアノテーション作業において調整を求める。補正部140は、いいえボタンM3が押下された場合に、点群の表示を元の状態に戻す。すなわち、補正部140は、点群の強調表示を削除する。これにより、補正部140は、作業者によるアノテーション作業において調整が不要な状態にする。
【0060】
このように、補正部140は、誤検出リスト、及び未検出リストについて補正することで、事前アノテーション部110によるアノテーション結果を補正する。
【0061】
次に、情報処理装置1が実行するアノテーション処理の流れについて説明する。
【0062】
図8は、第1の実施形態に係る情報処理装置1が実行するアノテーション処理の一例を示すフローチャートである。
【0063】
3次元情報取得部111は、LiDARなどの3次元距離センサによりスキャンされた3次元情報を取得する(ステップS1)。
【0064】
3次元物体検出部112は、3次元情報に対して物体検出を実行することにより、3次元情報から検出した物体のそれぞれを囲う3次元検出ボックスB1を検出する(ステップS2)。
【0065】
領域調整部113は、3次元検出ボックスB1の物体に基づいて、3次元検出ボックスB1の領域を調整する(ステップS3)。
【0066】
識別情報付与部114は、3次元検出ボックスB1のそれぞれに識別情報を付加する(ステップS4)。
【0067】
抽出部115は、3次元検出ボックスB1から、断面又は面を3次元照合領域B2として抽出する(ステップS5)。
【0068】
2次元画像取得部121は、撮影部より撮影された2次元画像を取得する(ステップS6)。
【0069】
2次元物体検出部122は、2次元画像に含まれる物体を検出する物体検出を実行することにより、2次元画像から検出した物体のそれぞれを覆う2次元検出ボックスB3を検出する(ステップS7)。
【0070】
照合部130は、3次元照合領域B2と、2次元検出ボックスB3とを照合する(ステップS8)。これにより、照合部130は、誤検出リストと未検出リストとを生成する。
【0071】
補正部140は、誤検出リストと未検出リストとの少なくも一方に基づいて補正が必要であるか否かを判定する(ステップS9)。補正が不要な場合に(ステップS9;No)、情報処理装置1は、アノテーション処理を終了する。
【0072】
一方、誤検出リストと未検出リストとの少なくも一方に基づいて補正が必要な場合に(ステップS9;Yes)、補正部140は、事前アノテーション部110によるアノテーション結果を補正する(ステップS10)。
【0073】
以上により、情報処理装置1は、アノテーション処理を終了する。
【0074】
以上のように、第1の実施形態に係る情報処理装置1は、3次元距離センサにより生成された3次元情報に含まれる物体の領域である3次元検出ボックスB1を検出する。また、情報処理装置1は、撮影部より撮影された2次元画像に含まれる物体の領域である2次元検出ボックスB3を検出する。そして、情報処理装置1は、3次元検出ボックスB1と、2次元検出ボックスB3との照合結果に基づいて、事前に実行したアノテーション結果を補正する。
【0075】
このように、情報処理装置1は、事前に物体検出を実行することにより、検出結果をアノテーションする。そして、情報処理装置1は、アノテーション結果と、2次元画像から検出した2次元検出ボックスB3と基づいて、アノテーション結果に不具合が含まれる可能性がある場合に、アノテーション結果を補正する。これにより、ユーザは、アノテーション作業の全部ではなく、一部を行えばよい。したがって、情報処理装置1は、アノテーション作業にかかる負担を軽減することができる。
【0076】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これらの実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0077】
1 情報処理装置
10 プロセッサ
11 RAM(Random Access Memory)
12 記憶部
13 通信部
14 表示部
15 操作部
110 事前アノテーション部
111 3次元情報取得部
112 3次元物体検出部
113 領域調整部
114 識別情報付与部
115 抽出部
121 2次元画像取得部
122 2次元物体検出部
130 照合部
140 補正部
B1 3次元検出ボックス
B2 3次元照合領域
B3 2次元検出ボックス
B4 未検出枠線
B5 誤検出枠線
R1 点群画像
R2 詳細情報表示領域
M1 メッセージ
M2 はいボタン
M3 いいえボタン