(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-09
(45)【発行日】2024-10-18
(54)【発明の名称】物体追跡システムおよび方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20241010BHJP
G06T 7/20 20170101ALI20241010BHJP
H04N 7/18 20060101ALI20241010BHJP
【FI】
G06T7/00 300F
G06T7/20 300Z
H04N7/18 K
H04N7/18 D
(21)【出願番号】P 2021050629
(22)【出願日】2021-03-24
【審査請求日】2023-06-12
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】田村 雅人
(72)【発明者】
【氏名】吉永 智明
(72)【発明者】
【氏名】梁島 勇太
(72)【発明者】
【氏名】村田 幸弘
【審査官】小池 正彦
(56)【参考文献】
【文献】特開2020-013290(JP,A)
【文献】特開2011-198261(JP,A)
【文献】国際公開第2020/087820(WO,A1)
【文献】国際公開第2021/015672(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06T 7/20
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
撮影された物体を追跡する物体追跡システムであって、
入力された画像データの各フレームから物体を検出する物体検出部と、
前記検出された各物体の画像特徴量を抽出する画像特徴抽出部と、
前記各フレーム内に存在する複数の物体間の関係を検出する関係抽出部と、
前記物体検出部による検出結果と前記画像特徴抽出部により抽出された各物体の画像特徴量と前記関係抽出部による検出結果とを、解析データとして保存する解析データ蓄積部と、
前記解析データ蓄積部に蓄積された解析データを検索
して、選択された第1物体と同一物体であるとされる物体であるか否かを、前記フレームのそれぞれで検出された物体について判定する検索部
を備え、
前記解析データ蓄積部は、
前記物体検出部による検出結果としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、当該物体の識別情報、及び、フレーム画像内での位置の情報と、
前記画像特徴抽出部により抽出された各物体の画像特徴量としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、画像特徴量ベクトルの情報と、
前記関係抽出部による検出結果としての、前記フレームのそれぞれにおいて検出された物体の組み合わせのそれぞれのうち、物体間の関係が検出された物体の組み合わせについての、当該組み合わせに含まれる物体のそれぞれの識別情報を、
前記解析データとして保存するものであり、
前記検索部は、
物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第1の距離(d1)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することと、
前記あるフレームにおいて検出された物体と、前記別のフレームにおいて検出された物体が前記第1の距離(d1)に基づいては同一物体とは判定されなかった場合であって、かつ、前記あるフレームにおいて検出された物体との関係が検出されている物体と、前記別のフレームにおいて検出された物体との関係が検出されている物体が同一物体とされる場合に、物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第2の距離(d2)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することであって、前記第2の距離(d2)のために用いる重要度においては、前記第1の距離(d1)のために用いる重要度におけるよりも、前記画像特徴量の重要度が上げられている、前記判断をすることを、実行するものである、
物体追跡システム。
【請求項2】
請求項1に記載の物体追跡システムであって、
前記物体追跡システムは、更に、出力部を備えるものであり、
前記出力部は、前記検索部が前記解析データを検索したことによる結果を表示するように制御するものである、
物体追跡システム。
【請求項3】
撮影された物体を追跡する物体追跡システムであって、
入力された画像データの各フレームから物体を検出する物体検出部と、
前記検出された各物体の画像特徴量を抽出する画像特徴抽出部と、
前記各フレーム内に存在する複数の物体間の関係を検出する関係抽出部と、
前記物体検出部による検出結果と前記画像特徴抽出部により抽出された各物体の画像特徴量と前記関係抽出部による検出結果
を用いて、前記フレームのそれぞれで検出された物体どうしが互いに同一物体であるとされるか否かを判定することにより、物体の移動経路を検出する移動経路検出部と、
前記移動経路検出部による検出結果である物体の移動経路に関する情報を保存する解析データ蓄積部を備え、
前記移動経路検出部が用いる情報には、
前記物体検出部による検出結果としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、当該物体の識別情報、及び、フレーム画像内での位置の情報と、
前記画像特徴抽出部により抽出された各物体の画像特徴量としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、画像特徴量ベクトルの情報と、
前記関係抽出部による検出結果としての、前記フレームのそれぞれにおいて検出された物体の組み合わせのそれぞれのうち、物体間の関係が検出された物体の組み合わせについての、当該組み合わせに含まれる物体のそれぞれの識別情報が含まれ、
前記移動経路検出部は、
物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第1の距離(d1)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することと、
前記あるフレームにおいて検出された物体と、前記別のフレームにおいて検出された物体が前記第1の距離(d1)に基づいては同一物体とは判定されなかった場合であって、かつ、前記あるフレームにおいて検出された物体との関係が検出されている物体と、前記別のフレームにおいて検出された物体との関係が検出されている物体が同一物体とされる場合に、物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第2の距離(d2)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することであって、前記第2の距離(d2)のために用いる重要度においては、前記第1の距離(d1)のために用いる重要度におけるよりも、前記画像特徴量の重要度が上げられている、前記判断をすることを、実行するものである、
物体追跡システム。
【請求項4】
撮影された物体を追跡する物体追跡システムであって、
入力された画像データの各フレームから物体を検出する物体検出部と、
前記検出された各物体の画像特徴量を抽出する画像特徴抽出部と、
前記各フレーム内に存在する複数の物体間の関係を検出する関係抽出部と、
前記物体検出部による検出結果と前記画像特徴抽出部により抽出された各物体の画像特徴量と前記関係抽出部による検出結果とを、解析データとして保存する解析データ蓄積部と、
前記解析データ蓄積部に蓄積された解析データを検索
して、選択された第1物体と同一物体であるとされる物体である尤もらしさの高い順に、前記フレームのそれぞれで検出された物体の追跡結果を並べる検索部
を備え、
前記解析データ蓄積部は、
前記物体検出部による検出結果としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、当該物体の識別情報と、
前記画像特徴抽出部により抽出された各物体の画像特徴量としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、画像特徴量ベクトルの情報と、
前記関係抽出部による検出結果としての、前記フレームのそれぞれにおいて検出された物体の組み合わせのそれぞれのうち、物体間の関係が検出された物体の組み合わせについての、当該組み合わせに含まれる物体のそれぞれの識別情報を、
前記解析データとして保存するものであり、
前記検索部は、
前記第1物体と前記フレームのそれぞれにおいて検出された物体の間の画像特徴量ベクトルにおける距離に基づいて、前記フレームのそれぞれにおいて検出された物体が前記第1物体と同一物体である尤もらしさの高さを判断し、当該判断の結果に基づいて、尤もらしさの高さの順に、前記フレームのそれぞれで検出された物体の追跡結果を並べることにより、一次検索結果を形成することと、
前記第1物体との関係が検出された物体と、前記フレームのそれぞれにおいて検出された物体との関係が検出された物体の間の画像特徴量ベクトルにおける距離に基づいて、前記フレームのそれぞれにおいて検出された物体が前記第1物体と同一物体である尤もらしさの高さを判断し、当該判断の結果に基づいて、尤もらしさの高さの順に、前記一次検索結果に含まれる、前記フレームのそれぞれで検出された物体の追跡結果を並べ替えることにより、並び替えた後の検索結果を形成することと、を行うものである、
物体追跡システム。
【請求項5】
請求項4に記載の物体追跡システムであって、
前記物体追跡システムは、更に、出力部を備えるものであり、
前記出力部は、前記一次検索結果と、前記並べ替えた後の検索結果のうち、一方または両方を表示するように制御するものである、
物体追跡システム。
【請求項6】
請求項5に記載の物体追跡システムであって、
前記出力部は、前記並べ替えた後の検索結果を表示するように制御する際には、物体間の関係が検出された物体の画像どうしを対応付けて表示させる
ように制御するものである、
物体追跡システム。
【請求項7】
請求項4に記載の物体追跡システムであって、
前記物体追跡システムは、更に、検索難易度判定部と、出力部を備えるものであり、
前記検索難易度判定部は、
前記第1物体の画像または当該第1物体の画像の画像特徴量に基づいて、前記第1物体の画像の検索難易度を計算することと、
前記第1物体に関係する物体の画像または当該関係する物体の画像特徴量に基づいて、前記第1物体に関係する物体の検索難易度を計算することと、を行うものであり、
前記検索部は、
前記第1物体の画像の検索難易度のほうが、前記第1物体に関係する物体の画像の検索難易度よりも低い場合には、前記一次検索結果を、表示するものとして決定することと、
前記第1物体に関係する物体の画像の検索難易度のほうが、前記第1物体の画像の検索難易度よりも低い場合には、前記並べ替えた後の検索結果を、表示するものとして決定することと、を行うものであり、
前記出力部は、前記一次検索結果と、前記並べ替えた後の検索結果のうち、表示するものとして決定されたほうの検索結果を表示するように制御するものである、
物体追跡システム。
【請求項8】
計算機を用いて、撮影された物体を追跡する物体追跡方法であって、
前記物体追跡方法は、前記計算機が、
入力された画像データの各フレームから物体を検出
することと、
前記検出された各物体の画像特徴量を抽出
することと、
前記各フレーム内にある複数の物体間の関係を検出
することと、
前記各物体の検出結果と前記各物体の画像特徴量と前記検出された各関係とを、解析データとして保存
することと、
前記解析データを検索して、選択された第1物体と同一物体であるとされる物体であるか否かを、前記フレームのそれぞれで検出された物体について判定することを含むものであり、
前記解析データは、
前記各物体の検出結果としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、当該物体の識別情報、及び、フレーム画像内での位置の情報と、
前記各物体の画像特徴量としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、画像特徴量ベクトルの情報と、
前記検出された各関係としての、前記フレームのそれぞれにおいて検出された物体の組み合わせのそれぞれのうち、物体間の関係が検出された物体の組み合わせについての、当該組み合わせに含まれる物体のそれぞれの識別情報を含むものであり、
前記解析データを検索して、前記判定することは、
物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第1の距離(d1)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することと、
前記あるフレームにおいて検出された物体と、前記別のフレームにおいて検出された物体が前記第1の距離(d1)に基づいては同一物体とは判定されなかった場合であって、かつ、前記あるフレームにおいて検出された物体との関係が検出されている物体と、前記別のフレームにおいて検出された物体との関係が検出されている物体が同一物体とされる場合に、物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第2の距離(d2)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することであって、前記第2の距離(d2)のために用いる重要度においては、前記第1の距離(d1)のために用いる重要度におけるよりも、前記画像特徴量の重要度が上げられている、前記判断をすることを、含むものである、
物体追跡方法。
【請求項9】
計算機を用いて、撮影された物体を追跡する物体追跡方法であって、
前記物体追跡方法は、前記計算機が、
入力された画像データの各フレームから物体を検出
することと、
前記検出された各物体の画像特徴量を抽出
することと、
前記各フレーム内にある複数の物体間の関係を検出
することと、
前記各物体の検出結果と前記各物体の画像特徴量と前記検出された各関係
を用いて、前記フレームのそれぞれで検出された物体どうしが互いに同一物体であるとされるか否かを判定することにより、物体の移動経路を検出することと、
検出結果である物体の移動経路に関する情報を保存することを含むものであり、
前記物体の移動経路を検出することにおいて用いられる情報には、
前記各物体の検出結果としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、当該物体の識別情報、及び、フレーム画像内での位置の情報と、
前記各物体の画像特徴量としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、画像特徴量ベクトルの情報と、
前記検出された各関係としての、前記フレームのそれぞれにおいて検出された物体の組み合わせのそれぞれのうち、物体間の関係が検出された物体の組み合わせについての、当該組み合わせに含まれる物体のそれぞれの識別情報が含まれ、
前記物体の移動経路を検出することは、
物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第1の距離(d1)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することと、
前記あるフレームにおいて検出された物体と、前記別のフレームにおいて検出された物体が前記第1の距離(d1)に基づいては同一物体とは判定されなかった場合であって、かつ、前記あるフレームにおいて検出された物体との関係が検出されている物体と、前記別のフレームにおいて検出された物体との関係が検出されている物体が同一物体とされる場合に、物体間のフレーム画像内での位置における距離と、物体間の画像特徴量ベクトルにおける距離に基づいて、重要度による重みを付けて得る第2の距離(d2)を用いて、あるフレームにおいて検出された物体と、別のフレームにおいて検出された物体が同一物体であるか否かを判断することであって、前記第2の距離(d2)のために用いる重要度においては、前記第1の距離(d1)のために用いる重要度におけるよりも、前記画像特徴量の重要度が上げられている、前記判断をすることを、含むものである、
物体追跡方法。
【請求項10】
計算機を用いて、撮影された物体を追跡する物体追跡方法であって、
前記物体追跡方法は、前記計算機が、
入力された画像データの各フレームから物体を検出
することと、
前記検出された各物体の画像特徴量を抽出
することと、
前記各フレーム内にある複数の物体間の関係を検出
することと、
前記各物体の検出結果と前記各物体の画像特徴量と前記検出された各関係とを、解析データとして保存
することと、
前記解析データを検索して、選択された第1物体と同一物体であるとされる物体である尤もらしさの高い順に、前記フレームのそれぞれで検出された物体の追跡結果を並べることを含むものであり、
前記解析データは、
前記各物体の検出結果としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、当該物体の識別情報と、
前記各物体の画像特徴量としての、前記フレームのそれぞれにおいて検出された物体のそれぞれについての、画像特徴量ベクトルの情報と、
前記検出された各関係としての、前記フレームのそれぞれにおいて検出された物体の組み合わせのそれぞれのうち、物体間の関係が検出された物体の組み合わせについての、当該組み合わせに含まれる物体のそれぞれの識別情報を含むものであり、
前記解析データを検索して、前記物体の追跡結果を並べることは、
前記第1物体と前記フレームのそれぞれにおいて検出された物体の間の画像特徴量ベクトルにおける距離に基づいて、前記フレームのそれぞれにおいて検出された物体が前記第1物体と同一物体である尤もらしさの高さを判断し、当該判断の結果に基づいて、尤もらしさの高さの順に、前記フレームのそれぞれで検出された物体の追跡結果を並べることにより、一次検索結果を形成することと、
前記第1物体との関係が検出された物体と、前記フレームのそれぞれにおいて検出された物体との関係が検出された物体の間の画像特徴量ベクトルにおける距離に基づいて、前記フレームのそれぞれにおいて検出された物体が前記第1物体と同一物体である尤もらしさの高さを判断し、当該判断の結果に基づいて、尤もらしさの高さの順に、前記一次検索結果に含まれる、前記フレームのそれぞれで検出された物体の追跡結果を並べ替えることにより、並び替えた後の検索結果を形成することを、含むものである、
物体追跡方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物体追跡システムおよび方法に関する。
【背景技術】
【0002】
特許文献1には、「第1の場所で撮影された複数のフレームからなる第1の映像、および、第2の場所で撮影された複数のフレームからなる第2の映像のそれぞれから、一つ以上の移動体の移動経路を検出して記憶装置に格納し、第1の映像から検出された一つ以上の移動体のうち選択された移動体の、フレームごとの画像特徴量を抽出して記憶装置に格納し、第1の映像から検出された選択された移動体の移動経路、および、第2の映像から検出された一つ以上の移動体の移動経路に基づいて、抽出した画像特徴量のうち、検索クエリとして使用するクエリ画像特徴量を選択し、クエリ画像特徴量を用いて、第2の映像から抽出された一つ以上の移動体の画像特徴量を検索し、検索の結果を出力する映像検索装置。」と記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
物体追跡システムの用途として、例えば不審荷物の追跡がある。不審荷物の追跡では、追跡実行者であるユーザが、入力装置を用いて、追跡したい荷物の写っている画像をクエリとして選択する。これにより、検索装置は、選択された画像に写っている荷物と一致する荷物の画像及び撮影位置などのメタ情報を記憶装置から抽出し、抽出した荷物の情報を追跡結果として表示装置に表示させる。この追跡の際、検索装置は、記憶装置に保存されている映像データ中の多種多様な荷物の中から、ユーザの選択した荷物を見つけて情報を抽出する必要がある。
【0005】
特許文献1には、一つの映像から追跡対象の物体の移動経路を検出し、その検出結果から得られる追跡対象の複数枚の画像を用いて検索することにより、検索精度を向上させる方法が記載されている。
【0006】
しかし、特許文献1に記載の技術には、以下の二つの課題がある。一つ目の課題は、物体の検出漏れや遮蔽などにより、物体の移動経路の検出精度が低下することである。移動経路を検出する場合、映像から取得される複数のフレームについて、各フレーム内で物体を検出して物体の位置を特定し、フレーム間でそれらの検出結果を連結する。しかし、物体の検出漏れや物体の遮蔽により、フレーム内で物体を検出できない場合、同一物体の各フレームの検出位置が乖離し、フレーム間での連結ができないことがある。このような場合、検索に利用できる画像枚数は少なくなり、検索精度の向上は見込めない。
【0007】
二つ目の課題は、追跡対象物体が例えば黒い荷物などのように、画像特徴が乏しい物体である場合、複数の画像を用いて検索しても検索精度が向上しないことである。画像を用いた検索では、画像を特徴量という数値ベクトルに変換して検索を実施する。この変換では、同一の物体の異なる画像でも類似するベクトルになるように、物体の特徴を捉えた変換方法を用いる。しかし、黒い荷物などの特徴が少ない物体の画像では、特徴量も凡庸なものになることが多いため、多量の画像の中から同一物体の画像を見つけ出すのは困難になる。したがって、画像特徴量の乏しい画像を複数利用したとしても検索精度の向上は見込めない。
【0008】
そこで、本発明は、検索精度を向上できるようにした物体追跡システムおよび方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決すべく、本発明の一つの観点に従う物体追跡システムは、撮影された物体を追跡する物体追跡システムであって、入力された画像データの各フレームから物体を検出する物体検出部と、検出された各物体の画像特徴量を抽出する画像特徴抽出部と、各フレーム内に存在する複数の物体間の関係を検出する関係抽出部と、物体検出部による検出結果と画像特徴抽出部により抽出された各物体の画像特徴量と関係抽出部による検出結果とを、解析データとして保存する解析データ蓄積部と、解析データ蓄積部に蓄積された解析データを検索する検索部であって、選択された第1物体についての第1検索結果を、第1物体に関係する第2物体についての第2検索結果に基づいて変更する検索部と、を備える。
【発明の効果】
【0010】
本発明によれば、画像データ中の第1物体を検索して追跡する際に、第1物体と関係のある第2物体についての検索結果を利用するため、第1物体の検索精度を向上させることができる。
【図面の簡単な説明】
【0011】
【
図1】本実施形態に係る物体追跡システムの概要図。
【
図3】「画像解析処理」としての映像解析処理のフローチャート。
【
図6】画像内の物体の位置と物体の画像特徴量とを用いて物体を追跡する処理のフローチャート。
【
図10】第2実施例に係り、物体追跡システムのブロック図。
【
図12】物体の移動経路を検出した結果のテーブル。
【
図13】第3実施例に係り、物体追跡システムのブロック図。
【発明を実施するための形態】
【0012】
以下、図面に基づいて、本発明の実施の形態を説明する。本実施形態では、ユーザが高速かつ正確に追跡対象物体を追跡できるように、高精度な画像検索を行うことのできる物体追跡システムを開示する。本実施形態では、画像データのフレーム内で各物体を検出するするのに加えて、物体間の関係も検出する。本実施形態では、検出された関係を物体の移動経路の検出と画像検索の結果の並び替えとに利用することにより、物体の検索精度を向上させることができる。
【実施例1】
【0013】
図1~
図9を用いて第1実施例を説明する。本実施例では、物体追跡システム1の一例として、「第1物体」として荷物を追跡する例を説明する。追跡対象物体である「第1物体」の荷物と関係を持つ「第2物体」として人を例に挙げる。以下、「第1物体」としての追跡対象物体を追跡対象と略記する場合がある。追跡対象物体と関係する「第2物体」を関係物体と呼ぶ。
【0014】
追跡対象物体は、荷物に限定されない。撮影可能であって、移動可能な物体であれば本システムで追跡することができる。本実施例では、可視光で撮影された画像データを例に挙げて説明するが、可視光に限らず、赤外線または紫外線などで撮影された画像データにも適用することができる。
【0015】
本実施例の物体追跡システム1は、例えば、「映像の入力を行う映像入力部と、映像の各フレームにある物体を検出する物体検出部と、前記物体検出部で検出された物体の画像特徴量を抽出する画像特徴抽出部と、映像の各フレームにある物体間の関係を検出する関係検出部と、前記物体検出部の検出結果、前記画像特徴抽出部で抽出された特徴量、及び前記関係検出部の検出結果を保存する解析データ蓄積部と、検索クエリの入力を行うクエリ入力部と、前記物体間の関係検出により得られた結果を用いて検索クエリにより得られた検索結果を変更する検索部と、前記検索部が検索した結果を表示する表示部を備えるシステム」と表現することもできる。
【0016】
図1は、物体追跡システム1の全体概要図である。物体追跡システム1は、物体追跡装置100を有する。物体追跡装置100は、
図2で後述するように、物理的計算機または仮想的計算機を用いて生成することができる。一つの計算機から一つまたは複数の物体追跡装置100を生成してもよいし、連携する複数の計算機から一つまたは複数の物体追跡装置100を生成してもよい。
【0017】
物体追跡装置100の詳細な構成例は
図2で後述するが、例えば、物体追跡装置100は、物体検出部110と、画像特徴抽出部120と、関係検出部130と、解析データ蓄積部140と、検索部150と、ユーザインターフェース部160を含む。図中、ユーザインターフェースをUIと略記する。
【0018】
物体検出部110は、一つまたは複数のカメラ101からの画像データ(動画像データであり、以下では映像とも呼ぶ)を解析することにより、フレームごとに物体を検出する機能を持つ。検出された物体の情報は、画像特徴抽出部120と関係検出部130とに送られる。
【0019】
カメラ101は、例えば、駅、空港、港、道路、オフィス、公共施設、商業施設などに設けられた監視カメラである。カメラ101は、特定の場所に固定されている必要はなく、いわゆるスマートフォンのようなカメラを内蔵する移動端末のように、移動可能であってもよい。
図1では、カメラ101で撮影した画像データが物体検出部110に直接入力されるかのように示すが、
図2で後述するように、物体検出部110は、画像記憶装置102から画像データを読み出して解析する。
【0020】
画像特徴抽出部120は、検出された物体の特徴を抽出し、画像特徴量を算出する機能を持つ。抽出された画像の特徴(特徴量)は、解析データ蓄積部140へ送られる。関係検出部130は、同一フレーム内で検出された複数の物体に関係があるか判定し、その判定結果(関係の検出結果)を解析データ蓄積部140へ送る。
【0021】
解析データ蓄積部140は、物体検出部110による物体の検出結果と、画像特徴抽出部120により抽出された各物体の画像特徴量と、関係抽出部130により検出された物体間の関係とを、解析データとして保存する。
【0022】
検索部150は、ユーザがユーザインターフェース部160を介して入力する検索クエリにしたがって解析データ蓄積部140に蓄積された解析データを検索し、その検索結果をユーザインターフェース部160からユーザへ提供する。さらに、検索部150は、追跡対象物体を検索した結果を、その追跡対象物体に関係する物体の検索結果に基づいて並べ替える検索結果変更部151を有する。
【0023】
図1の下側に、追跡対象物体TO1に関係する物体TO2を用いて、追跡対象物体TO1を追跡する方法を示す。この例では、追跡対象物体TO1は旅行鞄などの荷物である。追跡対象物体TO1に関係する物体TO2は、荷物を持っている人である。説明の便宜上、連続した4個のフレームの画像を例に挙げて説明する。
【0024】
第1フレームの画像では、追跡対象物体TO1(1)と関係物体TO2(1)とが検出されている。同様に第2フレームの画像では、追跡対象物体TO1(2)と関係物体TO2(2)とが検出されている。
【0025】
第3フレームの画像では、追跡対象物体TO1が歩行者などの障害物HOによって隠されてしまっているため、関係物体TO2(3)だけが検出される。第4フレームの画像では、追跡対象物体TO1(4)と関係物体TO2(4)が検出されている。
【0026】
追跡対象物体TO1と関係物体TO2について、位置的な距離の差ΔLと画像特徴量の差ΔFとを算出することができる。位置的な距離の差ΔLとは、画像内での物体の位置座標の差である。画像特徴量の差ΔFとは、物体から抽出される特徴量の差である。
【0027】
変数ΔL1は、比較対象のフレーム間での追跡対象物体TO1の位置的な距離を示す。変数ΔL2は、比較対象のフレーム間での関係物体TO2の位置的な距離の差を示す。変数ΔF1は、比較対象のフレーム間での追跡対象物体TO1の画像特徴量の差を示す。変数ΔF2は、比較対象のフレーム間での関係物体TO2の画像特徴量の差を示す。
【0028】
第1フレームの画像と第2フレームの画像との間で追跡対象物体TO1の変化を比べると、追跡対象物体TO1(1)と追跡対象物体TO1(2)との位置的な距離の差ΔL1は「0.1」であり、画像特徴量の差ΔF1は「0.1」である。ここで説明する例では、比較される物体間の画像特徴量の差ΔFが「0.1」より小さい場合、同一物体であると判定される。
【0029】
第1フレームの画像と第2フレームの画像との間で関係物体TO2の変化を比べると、関係物体TO2(1)と関係物体TO2(2)の位置的な距離の差ΔL2は「0.1」であり、画像特徴量の差ΔF2は「0.1」である。
【0030】
第3フレームの画像では、上述の通り、障害物HOが追跡対象物体TO1の一部または全部を隠しているため、追跡対象物体TO1を検出することができない。関係物体TO2(3)は検出されている。
【0031】
第4フレームの画像では、追跡対象物体TO1(4)が再出現するが、直近で検出された追跡対象物体TO1(2)との位置的な距離の差ΔL1は「0.8」であり、画像特徴量の差ΔF1は「0.1」である。
【0032】
すなわち、第4フレームの画像では、第2フレームの画像まで検出されていた物体TO1に対する追跡がいったん途切れ、新たに物体TO1に対する追跡が開始される。この場合、追跡対象物体TO1(4)に関係する物体TO2(4)が検出されると、その関係物体TO2(4)に対応する物体TO1(2)の存在が画像データを遡って検査される。関係物体TO2(4)が過去に関係づけられていた物体TO1(2)(第2フレーム内の追跡対象物体TO1(2))と最新フレーム内の追跡対象物体TO1(4)との画像特徴量の差ΔL1は「0.1」と小さく、同一物であると判定される。
【0033】
第2フレームの画像と第4フレームの画像を比較すると、追跡対象物体TO1の位置的な距離の差ΔL1は「0.8」と大きいが、画像特徴量の差ΔF1は「0.1」と小さい。そこで、本実施例では、位置的な距離の差ΔLの重みと画像特徴量の差ΔFの重みとを、関係物体TO2の存在に応じて変更する。この例では、位置的な距離の差ΔL1の重みを小さくし、画像特徴量の差ΔF1の重みを大きくする。これにより、フレームの離れた画像間でも、追跡対象物体TO1を検出して追跡することができる。
【0034】
図2は、物体追跡システム1のブロック図である。物体追跡システム1は、例えば、物体追跡装置100を含んで構成される。物体追跡システム1は、さらに、カメラ101を含んでもよい。物体追跡システム1は、通信ネットワークCNを介して、外部の計算機2と連携することもできる。外部の計算機2は、施設監視システムなどである。
【0035】
物体追跡装置100は、例えば、マイクロプロセッサ(図中、CPU)104と、メモリ105と、インターフェース106を備える計算機上に設けられる。マイクロプロセッサ104は、メモリ105に記憶された所定のコンピュータプログラムを実行することにより、後述する各機能102,103,110-150,141,171-174を実現させる。メモリ105は、主記憶装置および補助記憶装置を含む。
【0036】
インターフェース106は、例えば、入出力インターフェースおよび通信インターフェースを含む。
【0037】
外部の記憶媒体MMは、例えば、フラッシュメモリ、ハードディスク、磁気テープ、光ディスクなどの不揮発性の書き換え可能な記憶媒体として構成されており、コンピュータプログラムを長時間保持することができる。記憶媒体MMに記憶されたコンピュータプログラムをメモリ105へ転送して記憶させることもできるし、メモリ105に記憶されたコンピュータプログラムを記憶媒体MMへ転送して記憶させることもできる。
【0038】
物体追跡装置100は、例えば、画像記憶装置102、画像入力部103、物体検出部110、画像特徴抽出部120、関係検出部130、解析データ蓄積部140、解析データ記憶装置141、入力装置171、クエリ入力部172、検索部150、出力部173、出力装置174といった要素を含む。以下で各要素について説明する。
【0039】
画像記憶装置102は、屋内または屋外に設置されたカメラ101などの撮像装置から得られる映像(画像データ)を記憶する装置である。画像記憶装置102は、例えば、ハードディスクドライブまたはソリッドステートドライブなどの補助記憶装置、あるいは画像データを一時的に記憶するメモリなどの主記憶装置である。画像記憶装置102に記憶された画像データは、解析の要否に応じて、画像入力部103に読み出される。解析対象の画像データは、主に映像のような動画像データであるが、順番の明らかな複数の静止画像データであってもよい。
【0040】
画像入力部103は、画像記憶装置102に記憶された画像データを読み出して、物体検出部110及び関係検出部130へ送信する。画像入力部103が画像記憶装置102から画像データを読み出すタイミングは、ユーザが解析の実施を指示した時でもよいし、新しい画像データが画像記憶装置102に保存されたことを検知した時でもよい。
【0041】
物体検出部110は、画像入力部103から取得された画像データに対して、各フレーム内に存在する物体を検出し、その種類と画像内での位置とを特定する。検出により得られた情報は、各フレーム画像とともに画像特徴抽出部120へ送信される。フレームの画像データを、以下では、フレーム画像または画像と略記する場合がある。
【0042】
画像特徴抽出部120は、物体検出部110から取得されたフレーム画像と当該フレーム画像内の物体の位置の情報とを用いて、フレーム画像内の各物体の画像特徴量を抽出する。抽出された画像特徴量と、物体検出部110から得られたフレーム画像および物体の情報とは、解析データ蓄積部140へ送信される。
【0043】
関係検出部130は、画像入力部103から取得されたフレーム画像に対して、各フレーム内に存在する物体間の関係を検出し、関係の種別と、関係する物体の組み合わせとを特定する。関係検出部130は、物体検出部110により検出された各物体の中から2つの検出結果を選択することにより、組み合せを特定する。関係検出部130により得られた情報は、解析データ蓄積部140へ送信される。
【0044】
解析データ蓄積部140は、画像特徴抽出部120からの情報と、関係検出部130からの情報とを取得し、それらの情報を解析データ記憶装置141へ送信する。解析データ蓄積部140は、ユーザが物体追跡装置100に追跡を実行させる場合、検索クエリのデータおよび検索対象のデータを解析データ記憶装置141から読み出して、検索部150へ送信する。
【0045】
解析データ記憶装置141は、解析された画像データデータおよび解析結果のデータを記憶する装置である。解析データ記憶装置141は、例えば、ハードディスクドライブまたはソリッドステートドライブなどの補助記憶装置、あるいはメモリなどの主記憶装置である。解析データ記憶装置141と画像記憶装置102とは、共通の記憶装置を用いて構成されてもよい。画像データの解析時または追跡対象の追跡時に、解析データ蓄積部140を介して、解析データ記憶装置141に対する解析データの読み出しおよび書き込みが行われる。
【0046】
入力装置171は、ユーザが物体追跡装置100へ指示したり情報を与えたりする装置である。入力装置171は、例えば、マウスなどのポインティングデバイス、タッチパネル、キーボードなどである。ユーザの視線を検知することにより情報を入力する装置を用いてもよい。ユーザは、入力装置171を用いることにより、追跡対象物体を指定したり、追跡開始を指示したりする。
【0047】
クエリ入力部172は、入力装置171を介してユーザによる追跡対象の決定を受け付ける。クエリ入力部172は、追跡対象となる物体のクエリを、解析データ記憶装置141に蓄積されたデータの中から決定する。決定されたクエリの情報は、検索部150へ送信される。
【0048】
検索部150は、クエリ入力部172からクエリの情報を取得すると、クエリとなる物体の画像および画像特徴量などのデータと、検索対象となる物体の画像および画像特徴量などのデータとを、解析データ蓄積部140から取得する。検索部150は、取得されたこれらのデータを用いて、追跡対象の物体を検索対象の物体の中から見つけ出す。検索部150は、検索対象の中から見つかった追跡対象のデータを追跡結果として、出力部173へ送信する。
【0049】
出力部173は、検索部150から検索結果を取得し、ユーザに結果を表示するためのグラフィックユーザーインターフェース(GUI)を作成する。作成したGUIは表示するために出力装置174へ送信される。
【0050】
出力装置174は、出力部173から取得したGUIを表示するためのモニタディスプレイなどの表示装置である。ユーザは出力装置174に表示された解析結果を見ることにより、追跡対象を決定したり、追跡対象の追跡結果を確認したりする。出力装置174は、モニタディスプレイに限らず、プリンタでもよい。
【0051】
図3は、画像解析処理を示すフローチャートである。本処理は、ユーザが解析開始を指示した場合、あるいは新しい画像データが画像記憶装置102に保存された場合に、開始される。
【0052】
最初に、画像入力部103は、画像記憶装置102から解析対象の画像データを取得する(S101)。上述の通り、画像データは、動画形式であってもよいし、時系列的に並べられた画像シーケンスであってもよい。各画像データは、メタ情報を含んでいる。メタ情報には、いつどのカメラで撮影されたデータであるかの情報と、FPS(Frame Per Second)などが含まれる。
【0053】
物体検出部110は、画像入力部103から解析対象の画像データを取得し(S102)、取得された画像データに含まれる物体を検出する(S103)。画像内の物体を検出する処理は、画像データの各フレーム画像に対して個別に行われる。
【0054】
物体の検出方法としては、例えばCNN(Convolutional neural network)を用いることができる。CNNは、ニューラルネットワークの一種であり、ニューラルネットワーク内のパラメータを学習することにより、様々な推論を行えるようになる。本実施例では、CNNを物体検出部として利用し、画像を入力すると画像内の物体の位置および種類を出力できるように予め学習させておく。物体検出部110は、検出対象の物体が複数個写っている場合には、それら全ての物体の位置と種類を出力する。
【0055】
物体検出部110は、検出された物体の位置と種類と画像(フレーム画像)を画像特徴抽出部120へ送信する(S104)。
【0056】
画像特徴抽出部120は、物体検出部110から取得した物体の位置およびフレーム画像を使って物体の画像を切り出し、切り出された画像の特徴を抽出する(S105)。特徴抽出の方法として、例えばCNNを用いて画像を数値ベクトルに変換する。CNNは予め、同一物体の画像に対しては、画像が異なっても類似するベクトルを出力し、異なる物体の画像に対しては差異の大きいベクトルを出力するように学習させておく。こうすることで、変換により得られた数値ベクトルは、画像内の物体の特徴を表すものとなり、画像検索の際には検索クエリ画像の数値ベクトルと検索対象画像の数値ベクトルの類似度を計算すればよくなる。
【0057】
画像を数値ベクトルに変換する特徴抽出器は、例えば荷物画像用の特徴抽出器と人画像用の特徴抽出器など、物体の種類ごとに複数個用意してもよいし、物体の種類に依らず画像に対して類似する数値ベクトルを出力する特徴抽出器を一個用意してもよい。特徴抽出器を複数個用意した場合には、数値ベクトルを用いた検索精度が向上する利点があり、一個用意した場合には、特徴抽出処理を簡略化し、かつパラメータ保存のための記憶装置の記憶領域を節約できる利点がある。
【0058】
画像特徴抽出部120は、ステップS103で検出された物体の位置と種類と切り出された画像と、ステップS105で抽出された画像特徴量とを、解析データ蓄積部140へ送信する(S106)。
【0059】
一方、関係検出部130は、画像入力部103から解析対象の画像データを取得し(S107)、取得された画像データに対して物体間の関係を検出する(S108)。物体間の関係を検出する処理は、画像データ内の各フレーム画像に対して個別に行う。
【0060】
物体間の関係を検出する方法として、例えばCNNを用いる。CNNを物体間の関係検出器として利用し、画像を入力すると画像内の物体間に関係がある組み合わせを特定し、その組み合わせと関係の種類を出力できるように予め学習させておく。検出対象の物体間の関係が複数個ある場合には、全ての物体間の組み合わせとその種類を出力する。この検出器は、ステップS103で用いられた物体検出器と同一のCNNを用いてもよい。その場合、CNNは画像内の物体を検出し、かつ物体間の関係も同時に検出するように学習させておく。このように一つのCNNを類似する複数の用途のために学習させておくと、各用途の精度が上がる利点がある。また、パラメータ保存のための記憶装置の記憶領域を節約できる利点がある。
【0061】
関係検出部130は、ステップS108で検出された物体間の関係の組み合わせや種類を、解析データ蓄積部140へ送信する。
【0062】
解析データ蓄積部140は、物体検出部110から取得した物体の画像や位置、種類、および画像特徴量と、関係検出部130から取得した物体間の関係の組み合わせ、および種類とを、解析データ記憶装置141に保存し、本処理を終了する。
【0063】
図3に示す画像解析処理により、画像データの各フレーム画像内に映るそれぞれの物体単体の情報に加えて、物体間の関係の情報も解析データとして蓄積できる。従来技術では各物体単体の情報のみを利用して追跡対象を検索するが、本実施例では、物体間の関係の情報も利用することで、検索精度を上げることができる。
【0064】
図4は、物体の検出結果を保存するテーブルT1を示す。テーブルT1に示すように、検出された物体の情報が各行に保存されている。
【0065】
物体ID C11は、テーブル内で検出結果をユニークに特定するIDである。物体クラスC12は、物体検出部110により特定された物体の種類である。フレームID C13は、物体が検出されたフレームをユニークに特定するIDであり、画像データの各フレームに割り当てられたIDに一致する。物体位置C14は、フレーム画像内での物体の位置を表している。本実施例では、画像の左上を原点とし、右方向をx軸の正方向、下方向をy軸の正方向としたときの(x,y)座標と物体の幅および高さ(w,h)を用いて(x,y,w,h)の形で、物体位置を表す。画像特徴量C15は、画像特徴抽出部120により画像から変換して得られた数値ベクトルを表している。
【0066】
図5は、物体間の関係の検出結果を保存するテーブルT2を示す。テーブルT2に示すように、検出された物体間の関係の情報が各行に保存されている。
【0067】
関係ID C21は、テーブル内でユニークに検出結果を特定するIDである。関係クラスC22は、関係検出部130により特定された物体間の関係の種類である。フレームID C23は、物体間の関係が検出されたフレームをユニークに特定するIDであり、画像データの各フレームに割り当てられたID C13に一致する。物体ID1および物体ID2は、関係している物体の組み合わせを示すためのIDであり、
図4のテーブルT1の物体ID C11を指すことでフレーム内の物体の組み合わせを示している。
【0068】
図6は、画像内の物体の位置および物体の画像特徴量を用いて、物体を追跡する処理を示すフローチャートである。追跡処理は、画像内の物体の位置を用いるため、同一カメラ内のフレーム間で追跡を行う場合に実施される。本処理は、ユーザが追跡開始を指示したときに実行される。
【0069】
ステップS121では、ユーザにより選択された追跡対象となる物体を取得する。追跡対象の物体を選択する方法として、例えば以下の方法がある。検索部150は、解析データ記憶装置141に記憶されている物体画像を、出力部173を介して出力装置174に表示させる。ユーザは、入力装置171を用いて、表示された物体の中から追跡対象の物体を一つ選択する。追跡対象の物体が選択された場合、画像記憶装置102に記憶されているの物体検出結果のものであるか特定できるように、検索部150は、画像とともに物体IDを保持しておく。
【0070】
クエリ入力部172は、ユーザにより選択された追跡対象物体の画像の情報を検索部150へ送信する。クエリ入力部172は、例えば出力装置174に表示されている何番目の画像が選ばれたかを検索部150に送信する。これにより、検索部150は、表示された画像と選択された画像との対応関係を特定できる。
【0071】
検索部150は、追跡対象物体に紐づく情報を、物体検出結果を保存するテーブルT1、および物体間の関係の検出結果を保存するテーブルT2から抽出する。検索部150は、物体検出結果を保存するテーブルT1から、選択されたクエリの物体IDと一致する物体IDを持つ行のデータを抽出する。検索部150は、物体間の関係の検出結果を保存するテーブルT2から、物体ID1あるいは物体ID2が選択されたクエリの物体IDと一致する行のデータを抽出する。
【0072】
検索部150は、検索対象となる物体の情報をテーブルT1およびテーブルT2から抽出する(S124)。すなわち、検索部150は、同一カメラ内の別フレームで検出された物体に紐づく情報を、物体検出結果テーブルT1と関係検出結果テーブルT2とから抽出する。
【0073】
画像記憶装置102に記憶されている解析データの量が膨大である場合、データの抽出に時間を要するため、例えば、クエリとなっている物体検出結果が得られたフレームの前後数フレームのデータに限定してデータを抽出するなどして、データ量を抑制する。
【0074】
検索部150は、ステップS123で取得した追跡対象の物体に紐づく情報と、ステップS124で取得した検索対象の物体に紐づく情報とを使って、検索対象の物体の中から追跡対象物体と同一の物体のデータを検索する(S125)。
【0075】
本実施例による追跡方法では、各フレームにおける物体の検出位置と画像特徴量とを用いて、同一物体であるかどうかの尤もらしさを計算する。前後する二つのフレームの中から同じ物体クラスを持つ物体検出結果を一つずつ選択する。これら二つの物体の画像内での物体位置の距離をdp、画像特徴量ベクトルの距離をdvとすると、二つの物体検出結果の距離d1は、式1から計算される。
【0076】
d1=αdp+βdv・・・(式1)
【0077】
αは、物体位置の距離の重要度を決めるハイパーパラメータである。βは、画像特徴量の距離の重要度を決めるハイパーパラメータである。αとβは、静的に決まるパラメータである。d1が小さければ小さいほど、同一物体であるかどうかの尤もらしさが大きくなり、d1が閾値以下である場合には同一物体であるとする。この処理を取得した全てのデータに対して実施する。
【0078】
次に、前記の処理において追跡対象物体とは同一物体ではないと判定された検出結果に対して、追跡対象物体と関係がある物体を利用して追跡処理を行う。
【0079】
例えば、追跡対象の荷物と関係する人が存在する場合、その人を介して荷物の検出結果の紐づけを行う。追跡対象物体と関係している物体の検出結果が、追跡対象と同じ物体クラスで追跡対象の検出結果と紐づいていない検出結果とも関係している場合、その検出結果と追跡対象の検出結果の距離d2を式2で計算する。
【0080】
d2=αdp+γdv・・・(式2)
【0081】
ただし、γ>βとし、d1の計算と比較して画像特徴量の重要度を上げる。d2が閾値以下である場合には同一物体であるとする。
【0082】
検索部150は、ステップS125で得られた追跡結果を出力部173へ送信する(S126)。追跡結果の視認性を向上させるために、追跡結果の他にクエリとなった画像や追跡対象と同一物体と判定された画像、検出されたフレームなどのメタ情報も出力部173へ送信する。
【0083】
出力部173は、検索部150から取得した追跡結果から、ユーザが確認しやすいようにGUIを作成し、出力装置174に表示させ(S127)、本処理を終了する。
【0084】
本実施例の追跡処理では、画像内の物体の位置および物体の画像特徴量を用いて、物体を追跡する。この追跡処理によれば、物体検出部110の検出漏れまたは障害物による遮蔽などにより追跡対象物体が検出されず、フレーム間での物体位置が離れてしまった場合でも、距離d1の計算では紐づかなかった追跡について、追跡対象物体に関係する物体を利用して紐づけることができる。
【0085】
追跡対象物体が荷物などのように比較的小さい場合、通行人などの障害物によって遮蔽されやすいため、フレーム画像から検出できない可能性がある。しかし、本実施例では、追跡対象物体に紐づく人(関係物体)を介して、画像内での位置の離れた物体同士をそれら物体の画像特徴量に基づいて紐付けることができるため、検索精度が向上する。すなわち、本実施例によれば、フレーム間で画像内の位置が離れた検出結果(あるフレーム画像内の荷物と別のフレーム画像内の荷物)に対して、それらの画像特徴量を重視して紐づける距離d2を用いることにより、検索精度を向上させることができる。
【0086】
図7は、物体の追跡結果を表示する画面G1である。画面G1は、例えば、検索クエリとなった荷物画像GP11と、クエリ画像を撮影したカメラおよびフレーム番号の情報GP12と、追跡開始ボタンGP13と、追跡対象である荷物の追跡結果GP14と、追跡対象に関係する人の追跡結果GP15を含む。
【0087】
図7に示すように、追跡対象物体の荷物は、フレーム#0およびフレーム#1では検出されているものの、フレーム#2,#3では検出されていない。荷物は、フレーム#4,#5で再び検出される。
【0088】
荷物は一時見失われるが、その荷物に関係する人は、各フレーム#0~#5で検出されていることがわかる。このような場合に、従来技術では、フレーム1の荷物の検出結果とフレーム4の荷物の検出結果とを紐づけるのは難しい。しかし、本実施例によれば、荷物に関係する人の検出を介することによって、画像内の位置の離れた荷物同士を紐づけることができるため、検索精度を向上できる。
【0089】
さらに、本実施例によれば、
図7に示す画面G1をユーザに提供するため、いったん途切れた追跡が、関係する人によって修復できているかどうかを確認することができ、検索結果の理解を容易にすることができる。
【0090】
図8は、画像特徴量のみを用いて追跡を実施した場合において、その追跡結果を関係検出結果を用いて並べ替える物体追跡処理を示すフローチャートである。この物体追跡処理は、画像特徴量のみを用いて追跡するため、同一カメラ内の追跡だけでなく、異なるカメラ間での追跡も可能である。
【0091】
ステップS121,S122,ステップS123,S126,S127は、
図6で述べたと同様であるため、説明を省略する。
【0092】
検索部150は、検索対象となる物体に紐づく情報を、物体検出結果テーブルT1および関係検出結果テーブルT2から抽出する(S131)。画像記憶装置102に記憶される解析データの量が膨大になる場合、例えば抽出するデータを、クエリとなっている物体の検出結果が得られたフレームの前後数フレームのデータに限定したり、検索対象となる物体の画像データを撮影するカメラを指定したりすればよい。
【0093】
検索部150は、ステップS123で取得した追跡対象に紐づく情報とステップS131で取得した検索対象に紐づく情報とを使って、検索対象物体の中から追跡対象物体と同一の物体のデータを検索する(S132)。
【0094】
この追跡処理では、画像特徴量のみを用いて、同一物体であるかどうかの尤もらしさを計算する。追跡対象物体のクエリ画像の画像特徴量と検索対象物体の画像の画像特徴量との距離dvが閾値以下の場合は、それらは同一物体であるとする。
【0095】
距離dvが小さいほど同一物体である尤もらしさが高いので、距離dvが小さいものから順に検索結果に表示する。次に、追跡対象物体と関係する物体の画像の画像特徴量と、前記の処理で同一物体と判定された画像に関係している物体の画像の画像特徴量との距離を計算し、この距離が小さい順に検索結果を並べ替える(S132)。そして、最初の処理で得られた検索結果と並べ替えた後の検索結果の両方を検索結果として表示する。
【0096】
本処理によれば、ありふれた黒色のビジネスバッグなどのように、追跡対象物体が特徴に乏しい物体であり、検索結果の上位に追跡対象物体とは異なる物体の画像が出現する場合であっても、関係物体の画像特徴量に基づいて、追跡対象物体の検索結果を並べ替えることができる。すなわち、本処理によれば、追跡対象物体の特徴が乏しい場合でも、その追跡対象物体に関係する物体の特徴が豊富であれば、検索結果の並べ替えにより、追跡対象と一致する物体を検索結果の上位に表示することができ、追跡精度を向上させることができる。
【0097】
図9は、追跡結果表示画面G2の具体例である。画面G2は、検索クエリとなった荷物画像GP21と、検索クエリの物体に関係している人画像GP22と、追跡開始ボタンGP23と、追跡対象物体のクエリ画像を用いた際の一次検索結果GP24と、関係物体の画像を用いて一次検索結果を並べ替えた場合の検索結果GP25とを含む。
【0098】
例えば旅行用スーツケースまたはビジネスバッグなどのように、黒い荷物T01は画像特徴に乏しく、追跡対象と同一の荷物画像を検索結果の上位に表示させるのは難しい。しかし、追跡対象物体に関係する物体である人TO2が、鮮やかな色の服装をしていたり、背がとても高いなどの特徴を有する場合、その関係物体である人TO2の画像特徴量を用いた検索は容易である。したがって、追跡対象物体の検索結果を、関係物体の画像特徴量に基づいて並べ替えることにより、追跡対象物体と同一物体の画像を検索結果の上位に表示させることができる。
【0099】
図9の例では、追跡対象物体TO1と同一なのは物体TO1eである。しかし、追跡対象物体TO1はありふれた色彩のありふれた形状であり、画像の特徴が少ない。したがって、追跡物体TO1の画像特徴量に基づく一次検索結果GP24では、追跡対象物体TO1と異なる物体TO1a,TO1bの方が上位に表示されている。
しかし、本実施例では、追跡対象物体TO1に関係する関係物体TO2の画像特徴量に基づく検索結果から、一次検索結果GP24を並べ替えることができる。
【0100】
さらに、本実施例では、検索結果の物体TO1a~TO1dと関係する物体TO2a~TO2dとの対応関係を関係線GP26によって明示的に明らかにするため、ユーザは、一次検索結果GP24が並び替えられた理由を容易に確認することができ、ユーザの使い勝手が向上する。
【0101】
なお、検出結果の物体と関係物体TO2との対応関係がユーザが見るときに明らかであれば、関係線GP26以外の表示要素を用いてもよい。例えば、検出結果の物体と関係物体とを枠で囲んで表示してもよいし、検出結果の物体と関係物体とを近接して表示させてもよい。
【実施例2】
【0102】
図10~
図12を用いて第2実施例を説明する。
図10は、本実施例の物体追跡装置100Aを含む物体追跡システム1Aのブロック図である。本実施例の物体追跡装置100Aは、
図2で述べた物体追跡装置100に移動経路検出部180を追加している。
【0103】
移動経路検出部180は、物体検出部110で検出された物体の情報と、画像特徴抽出部120で抽出された画像特徴量と、関係検出部130で検出された物体間の関係とを用いて、同一カメラのフレーム間で物体を追跡し、物体の移動経路を検出する。検出された移動経路は、解析データ蓄積部140へ送信され、解析データ蓄積部140により解析データ記憶装置141へ保存される。
【0104】
図11は、画像解析処理のフローチャートである。ステップS101~S105、ステップS107,S108,S111は、
図3で述べた各ステップと同様である。
【0105】
ステップS105の次に、画像特徴抽出部120は、ステップS103で検出された物体の位置と種類とその領域を切り出した画像と、ステップS105で抽出された画像特徴量とを、移動経路検出部180へ送信する(S141)。
【0106】
ステップS108の次に、関係検出部130は、ステップS108で検出された物体間の関係の組み合わせおよび種類を、移動経路検出部180へ送信する(S142)。
【0107】
そして、移動経路検出部180は、
図6で説明した画像内の位置および画像特徴量を用いた追跡を、画像記憶装置102に保存する前に実施し、得られた追跡結果を移動経路として検出する(S143)。
【0108】
さらに、移動経路検出部180は、ステップS103で検出された物体の位置や種類とその領域を切り出した画像と、ステップS105で抽出された画像特徴量と、ステップS108で検出された物体間の関係の組み合わせや種類と、ステップS143で検出された物体の移動経路とを、解析データ蓄積部140へ送信する(S144)。
【0109】
最後に、解析データ蓄積部140は、移動経路検出部180から取得した各情報を、解析データ記憶装置141に保存する(S145)。
【0110】
本実施例の画像解析処理によれば、同一カメラの異なるフレームで検出された物体を同一物体として予め記憶装置に保存することができ、
図8で説明した画像特徴量のみを用いて追跡を行う場合に、同一物体の複数の画像をクエリとして用いることができる。これにより、画像特徴量のみを用いた場合の検索精度を向上させることができる。
【0111】
さらに、本実施例の移動経路検出部180は、物体間の関係性を利用してカメラ内の物体追跡精度を向上させるため、特許文献1に記載されている複数の画像を検索クエリとして用いる場合よりも多くの画像を用いることができる。従って、本実施例では、特許文献1に記載されている画像特徴量のみの検索精度よりも検索精度を高くできる。
【0112】
図12は、移動経路の検出結果を保存するテーブルT3を示す。テーブルT3は、
図4に示した物体検出結果を保存するテーブルT1に対して、追跡ID C32の列を追加している。
【0113】
すなわち、物体ID C31は、テーブルT1の物体ID C11に対応する。物体クラスC33は、テーブルT1の物体クラスC12に対応する。以下同様に、テーブルT3の列C34~C36は、テーブルT1の列C13~C15に対応する。
【0114】
このように構成される本実施例も第1実施例と同様の作用効果を奏する。さらに、本実施例で追加された追跡IDでは、移動経路検出処理によって同一物体であると判定された場合に同一のIDが割り当てられる。したがって、追跡IDによって、異なるフレーム間において同一物体を特定できる。画像特徴量のみを用いた検索では、検索クエリとして選ばれた物体と同じ追跡IDを持つ検出結果の画像特徴量を全て用いて検索を行うことで、検索精度を向上させることができる。
【実施例3】
【0115】
図13~
図15を用いて、第3実施例を説明する。
図13は、本実施例による物体追跡装置100Bを含む物体追跡システム1Bのブロック図である。本実施例の物体追跡装置100Bは、
図1に示す物体追跡装置100に対して、検索難易度判定部190を追加している。
【0116】
検索難易度判定部190は、検索部150から画像あるいは画像特徴量を取得し、それらに対して画像特徴量のみを用いて検索を行った場合の検索難易度を計算する。検索難易度判定部190は、計算された検索難易度を検索部150へ送信する。
【0117】
図14は、画像特徴量のみを用いて追跡を実施した場合において、関係検出結果を用いて追跡結果を並べ替える物体追跡処理を示すフローチャートである。本処理は、画像特徴量のみを用いて追跡を行うので、同一カメラ内での追跡に限らず、異なる複数のカメラ間での追跡も可能である。ステップS121~S123,s127は、
図6で述べたステップと同様である。
【0118】
ステップS123に続くステップS151では、検索部150は、クエリ画像とは別のカメラで検出された物体の、画像、物体クラス、座標、画像特徴量、及び物体の関係を取得する。
【0119】
さらに、検索部150は、クエリ画像とは別のカメラで検出された物体とクエリ画像とを解析データ蓄積部140から取得した情報を使って紐づける(S152)
【0120】
ステップS153では、検索部150は、クエリ画像とそのクエリ画像の物体に関係する物体の画像あるいはそれらの画像特徴量を検索難易度判定部190へ送信する。
【0121】
ステップS154では、検索難易度判定部190は、ステップS151で取得された画像あるいは画像特徴量に対して、検索難易度を計算する。
【0122】
検索難易度の計算方法としては、画像の物体の属性を推定して、推定された属性によりルールベースで難易度を決定する方法がある。例えば黒い物体は検索難易度が高くなることが多いため、属性推定で黒と判定された物体に対して高い検索難易度を割り当てる。他には画像あるいは画像特徴量と検索難易度の関係をCNNや回帰モデルなどの機械学習モデルを用いて予め学習させておき、それらのモデル用いて計算する方法もある。
【0123】
ステップS155では、ステップS154で計算された検索難易度を検索部150へ送信する。
【0124】
ステップS156では、検索部150は、クエリ画像の検索難易度とクエリ画像の物体に関係している物体の画像の検索難易度とを比較する。検索部150は、クエリ画像の検索難易度の方が関係物体の検索難易度よりも低い場合には、
図9に示す一次検索結果GP24を表示させることを決定する。これに対し、検索部150は、関係物体の画像の検索難易度の方がクエリ画像の検索難易度よりも低い場合には、
図9に示す並び替えた後の検索結果GP25を表示させることを決定する。
【0125】
ステップS157では、ステップS156で決定した追跡結果を、出力部173へ送信する。
【0126】
このように構成される本実施例も第1実施例と同様の作用効果を奏する。さらに、本実施例によれば、より正確な追跡結果のみを表示することが可能となり、ユーザが追跡結果を確認する際の視認性を向上させることができる。これにより、より正確かつ高速な追跡が可能となる。
【0127】
図15は、追跡結果表示画面G2bである。画面G2bは、クエリ画像と関係する物体の画像の検索難易度GP27を表示する。そして、画面G2bは、関係物体に基づいて並べ替えた検索結果GP25が表示され、一次検索結果GP24は表示されない。したがって、本実施例によれば、正確な追跡結果のみをユーザへ提供することができ、
図9と比較して視認性が向上することがわかる。
【0128】
なお、本発明は上記各実施例に限定されず、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0129】
また、上記の各構成は、それらの一部又は全部が、ハードウェアで構成されても、プロセッサでプログラムが実行されることにより実現されるように構成されてもよい。また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
(付記1)
撮影された物体を追跡する物体追跡システムであって、
入力された画像データの各フレームから物体を検出する物体検出部と、
前記検出された各物体の画像特徴量を抽出する画像特徴抽出部と、
前記各フレーム内に存在する複数の物体間の関係を検出する関係抽出部と、
前記物体検出部による検出結果と前記画像特徴抽出部により抽出された各物体の画像特徴量と前記関係抽出部による検出結果とを、解析データとして保存する解析データ蓄積部と、
前記解析データ蓄積部に蓄積された解析データを検索する検索部であって、選択された第1物体についての第1検索結果を、前記第1物体に関係する第2物体についての第2検索結果に基づいて変更する検索部と、を備える物体追跡システム。
(付記2)
前記検索部の検索結果を表示させる出力部173をさらに備える(付記1)に記載の物体追跡システム。
(付記3)
前記検索部は、前記第1物体を検索して追跡する際に、前記第2物体を検索して追跡した結果を用いる、(付記1)に記載の物体追跡システム。
(付記4)
前記検索部は、前記第1物体を検索して追跡する際に、前記第1物体の位置の重要度と画像特徴量の重要度とを、前記第2物体に基づいて変更させる(付記3)に記載の物体追跡システム。
(付記5)
前記出力部173は、前記第1検索結果と前記第2検索結果のうち少なくともいずれか一方を表示させる(付記2)に記載の物体追跡システム。
(付記6)
前記出力部173は、前記第2検索結果を表示させる場合に、前記第1物体の画像と前記第2物体の画像とを対応付けて表示させる(付記2)に記載の物体追跡システム。
(付記7)
前記検索部は、前記第1物体の画像特徴量に基づいて前記解析データを検索した前記第1検索結果を、前記第2物体の画像特徴量に基づいて並べ替える(付記1)に記載の物体追跡システム。
(付記8)
前記第1物体の移動経路を検出する移動経路検出部をさらに備え、
前記移動経路検出部は、
前記第1物体の位置と前記第1物体の画像特徴量とを用いて前記解析データを検索することにより、前記第1物体の移動経路を検出するものであり、
前記第1物体の位置の重要度と画像特徴量の重要度とを、前記第2物体に基づいて変化させることにより、前記第1物体の移動経路を検出する(付記1)に記載の物体追跡システム。
(付記9)
前記第1物体の画像特徴量に基づく検索の難易度である第1検索難易度と、前記第2物体の画像特徴量に基づく検索の難易度である第2検索難易度とを比較して判定し、判定結果を前記検索部へ出力する検索難易度判定部をさらに備え、
前記検索部は、前記検索難易度判定部の判定結果に基づいて、前記第1検索結果または前記第2検索結果のうちいずれか難易度の低い方の検索結果を、前記出力部173により表示させる(付記2)に記載の物体追跡システム。
(付記10)
計算機を用いて、撮影された物体を追跡する物体追跡方法であって、
前記計算機は、
入力された画像データの各フレームから物体を検出し、
前記検出された各物体の画像特徴量を抽出し、
前記各フレーム内にある複数の物体間の関係を検出し、
前記各物体の検出結果と前記各物体の画像特徴量と前記検出された各関係とを、解析データとして保存し、
選択された第1物体について前記解析データを検索した結果である第1検索結果を、前記第1物体に関係する第2物体について前記解析データを検索した結果である第2検索結果に基づいて変更する、
物体追跡方法。
【符号の説明】
【0130】
1,1A,1B:物体追跡システム、100,100A,100B:物体追跡装置、101:カメラ、102:画像記憶装置、103:画像入力部、110:物体検出部、120:画像特徴抽出部、130:関係検出部、140:解析データ蓄積部、141:解析データ記憶装置、150:検索部、171:入力装置、172:クエリ入力部、173:出力部、174:出力装置、180:移動経路検出部、190:検索難易度判定部