IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-8869マルチターゲット・マルチカメラヘッド追跡のための方法及び装置
<>
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図1
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図2
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図3
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図4
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図5
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図6
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図7
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図8
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図9
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図10
  • 特開-マルチターゲット・マルチカメラヘッド追跡のための方法及び装置 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024008869
(43)【公開日】2024-01-19
(54)【発明の名称】マルチターゲット・マルチカメラヘッド追跡のための方法及び装置
(51)【国際特許分類】
   G06T 7/20 20170101AFI20240112BHJP
   H04N 7/18 20060101ALI20240112BHJP
【FI】
G06T7/20 300Z
H04N7/18 G
H04N7/18 K
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023106535
(22)【出願日】2023-06-28
(31)【優先権主張番号】202210793867.1
(32)【優先日】2022-07-07
(33)【優先権主張国・地域又は機関】CN
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
2.SMALLTALK
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】汪 留安
(72)【発明者】
【氏名】ジャン・ホォイガン
(72)【発明者】
【氏名】王 平
(72)【発明者】
【氏名】孫 俊
【テーマコード(参考)】
5C054
5L096
【Fターム(参考)】
5C054CA04
5C054CC02
5C054FE09
5C054FE13
5C054HA19
5C054HA31
5L096CA04
5L096CA05
5L096FA69
5L096GA51
5L096HA05
5L096HA11
5L096JA03
5L096MA07
(57)【要約】
【課題】本発明は、マルチターゲット・マルチカメラヘッド追跡のための方法及び装置を提供する。
【解決手段】マルチターゲット・マルチカメラヘッド追跡のための方法は、複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで総ローカル目標軌跡集合を決定し;及び、総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定することを含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
コンピュータが実行する、マルチターゲット・マルチカメラヘッド追跡のための方法であって、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
前記総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで前記複数のカメラヘッドについてのグローバル目標軌跡集合を決定することを含み、
前記複数のカメラヘッドについての前記グローバル目標軌跡集合の決定は、
前記総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;
前記クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを適用することで最小コスト経路集合を決定し;及び
前記最小コスト経路集合に基づいて前記クラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む、方法。
【請求項2】
請求項1に記載の方法であって、
各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合の決定は、
前記複数のカメラヘッドのうちの各カメラヘッドについて、前のローカル目標軌跡集合及び前記対応する画像シーケンスにおける現在の画像に基づいて現在のローカル目標軌跡集合を決定することを含み、
現在のローカル軌跡集合の決定は、
目標検出ネットワークを使用して前記現在の画像中の所定類型の目標の検出バウンディングボックス及びバウンディングボックスの信頼度を決定し;及び
前記現在の画像中の各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新して前記現在のローカル目標軌跡集合とすることを含み、
前記前の画像は前記前のローカル目標軌跡集合の対応する画像シーケンスにおける末尾の画像である、方法。
【請求項3】
請求項2に記載の方法であって、
前記現在の画像中の各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新することは、
前記検出バウンディングボックスのうち、バウンディングボックスの信頼度がバウンディングボックスの信頼度閾値よりも大きい、信頼できるバウンディングボックス、及び前記前のローカル目標軌跡集合の中の各検出済み目標軌跡に対して第一追跡マッチングを行うことで前記信頼できるバウンディングボックスの目標標識を決定し;
前記前のローカル目標軌跡集合における検出済み目標軌跡のうちの未マッチングの軌跡に対して、残りの検出バウンディングボックスのうちのものとの第二追跡マッチングを行うことで前記残りの検出バウンディングボックスの目標標識を決定し;及び
前記検出バウンディングボックスのうち、バウンディングボックスの信頼度が前記バウンディングボックスの信頼度閾値よりも大きく、かつ前記前のローカル目標軌跡集合の中の検出済み目標軌跡とマッチングしないバウンディングボックスについて、新しい目標標識を生成することを含む、方法。
【請求項4】
請求項3に記載の方法であって、
前記前の画像中の検出バウンディングボックスに基づいて前記現在の画像についての予測バウンディングボックスを予測し;及び
前記現在の画像の検出バウンディングボックス及び前記予測バウンディングボックスと関連付けられる面積オーバーラップコスト関数及び頂点オーバーラップコスト関数に基づいて前記現在の画像中の検出バウンディングボックスの目標標識を決定する
ことで、前記第一追跡マッチング及び前記第二追跡マッチングのうちの少なくとも1つを行う、方法。
【請求項5】
請求項2に記載の方法であって、
現在のローカル軌跡集合の決定は、
前記現在のローカル軌跡集合に対して後処理を行うことで現在のローカル目標軌跡集合を更新することをさらに含み、
前記現在のローカル軌跡集合に対して後処理を行うことは、
前記現在のローカル目標軌跡集合における軌跡の移動特徴に基づいて、新しい軌跡を生成するかを決定することを含む、方法。
【請求項6】
請求項2に記載の方法であって、
現在のローカル軌跡集合の決定は、
前記現在のローカル軌跡集合に対して後処理を行うことで現在のローカル目標軌跡集合を更新することをさらに含み、
前記現在のローカル軌跡集合に対して後処理を行うことは、
前記現在のローカル目標軌跡集合において新しい目標に対応する新しい軌跡点について、前記現在の画像において、前記新しい軌跡点の対応するバウンディングボックスとのオーバーラップ率が最大のオーバーラップバウンディングボックスを決定し;
前記対応するバウンディングボックス及び前記オーバーラップバウンディングボックスについて、
Sim(Freid_x′t,Freid_xt′)-Sim(Freid_xt,Freid_xt′)>sTh2
という第一類似度条件を満たすかを決定し;及び
前記第一類似度条件を満たしたと決定している場合、前記対応するバウンディングボックスと前記オーバーラップバウンディングボックスの目標標識を交換することを含み、
Sim(Freid_x′t,Freid_xt′)は前記対応するバウンディングボックスに対応する目標標識の前記現在の画像内の画像ブロックの再認識特徴Freid_x′tと、前記オーバーラップバウンディングボックスに対応する目標標識の前記前の画像内の画像ブロックの再認識特徴Freid_xt′との間の類似度であり、
Sim(Freid_xt,Freid_xt′)は前記オーバーラップバウンディングボックスに対応する目標標識の前記現在の画像及び前記前の画像の中の画像ブロックの再認識特徴Freid_xtとFreid_xt′との間の類似度であり、
sTh2は第二類似度閾値である、方法。
【請求項7】
請求項2に記載の方法であって、
現在のローカル軌跡集合の決定は、
前記現在のローカル軌跡集合に対して後処理を行うことで現在のローカル目標軌跡集合を更新することをさらに含み、
前記現在のローカル軌跡集合に対して後処理を行うことは、
前記現在のローカル軌跡集合に、
前記第一軌跡の対応する画像ブロックシーケンスにおける現在の時間tの前の時間t′における第一画像ブロックと、前記第二軌跡の対応する画像ブロックシーケンスにおける前記時間t′における第二画像ブロックがオーバーラップしており、
前記第一軌跡の対応する画像ブロックシーケンスにおける前記現在の時間tにおける第三画像ブロックと、前記第二軌跡の対応する画像ブロックシーケンスにおける前記現在の時間tにおける第四画像ブロックがオーバーラップせず、及び
前記第一軌跡の対応する画像ブロックシーケンスにおける前記時間t′よりも前の時間t′′における第五画像ブロックと、前記第二軌跡の対応する画像ブロックシーケンスにおける前記時間t′′における第六画像ブロックがオーバーラップしない
というオーバーラップ条件を満たす第一軌跡及び第二軌跡が存在するかを決定し;
前記オーバーラップ条件を満たした前記第一軌跡及び前記第二軌跡について、
Sim(Freid_xt′′、Freid_x′t)+Sim(Freid_x′t′′、Freid_xt)-Sim(Freid_xt、Freid_xt′′)+Sim(Freid_x′t′′、Freid_x′t)>sTh3
という第二類似度条件を満たすかを決定し;及び
前記第二類似度条件を満たしたと決定している場合、前記第四画像ブロックと前記第三画像ブロックの目標標識を交換することをさらに含み、
Sim(Freid_xt′′,Freid_x′t)は前記第五画像ブロックの再認識特徴Freid_xt′′と前記第四画像ブロックの再認識特徴Freid_x′tとの間の類似度であり、
Sim(Freid_x′t′′,Freid_xt)は前記第六画像ブロックの再認識特徴Freid_x′t′′と前記第三画像ブロックの再認識特徴Freid_xtとの間の類似度であり、
Sim(Freid_xt,Freid_xt′′)は前記第五画像ブロックの再認識特徴Freid_xt′′と前記第三画像ブロックの再認識特徴Freid_xtとの間の類似度であり、
Sim(Freid_x′t′′,Freid_x′t)は前記第六画像ブロックの再認識特徴Freid_x′t′′と前記第四画像ブロックの再認識特徴Freid_x′tとの間の類似度であり、
sTh3は第三類似度閾値である、方法。
【請求項8】
請求項1に記載の方法であって、
前記有向グラフを、
各対の頂点の間の有向辺のコストを無限大に初期化し;及び
前記クラスタリング・マッチング・グローバル軌跡集合の中の第一軌跡及び第二軌跡について、前記第二軌跡の開始時間と、前記第一軌跡の終了時間との間の差がゼロよりも大きく、かつ所定時間閾値よりも小さい場合、前記第一軌跡及び前記第二軌跡と関連付けられる軌跡類似度コスト関数、時間コスト関数及び空間距離コスト関数のうちの少なくとも1つに基づいて、前記第一軌跡及び前記第二軌跡と関連付けられる2つの頂点間の有向辺のコストを調整する
ことで構築し、
前記軌跡類似度コスト関数は前記第一軌跡と前記第二軌跡との軌跡類似度に関連付けられ、
前記時間コスト関数は前記第二軌跡の開始時間と前記第一軌跡の終了時間との差に関連付けられ、
前記空間距離コスト関数は前記第一軌跡の終了位置と前記第二軌跡の開始位置との間のワールド座標系での空間距離に関連付けられる、方法。
【請求項9】
マルチターゲット・マルチカメラヘッド追跡のための装置であって、
命令を記憶している記憶器;及び
前記記憶器に接続される少なくとも1つの処理器を含み、
前記処理器は前記命令を実行することで請求項1乃至8のうちの何れか1項に記載の方法を実現するように構成される、装置。
【請求項10】
コンピュータに、請求項1乃至8のうちの何れか1項に記載の方法を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理及びコンピュータビジョンに関し、特に、マルチターゲット・マルチカメラヘッド追跡のため方法、装置及びコンピュータプログラムに関する。
【背景技術】
【0002】
コンピュータ科学及び人工知能の発展に伴い、コンピュータを使用して人工知能モデルを実行して情報処理を実現することはますます一般的かつ効果的になっている。コンピュータビジョンは人工知能モデルの重要な応用分野の1つである。
【0003】
コンピュータビジョン技術のホットスポットの1つはマルチターゲット(目標)追跡である。マルチターゲット追跡は一般に、MTT(Multiple Target Tracking)と略称され、MOT(Multiple Object Tracking)と略称される場合もある。それは目標の数が事前に分からない場合、ビデオ内の例えば歩行者、車及び/又は動物のような、関心のある複数の類型の目標に対して検出を行って標識(ID)を与えることで軌跡の追跡を行うために用いられる。期待される追跡結果は次のとおりであり、即ち、異なる目標が異なるIDを有することで、正確な追跡や検索などのワーキングを実現する。MTTはコンピュータビジョンの分野における重要な技術であり、自動運転、インテリジェント監視、行動認識などの面において幅広く利用されている。
【0004】
マルチターゲット追跡では、入力ビデオについて、目標の追跡結果を出力する。追跡結果の画像では各目標は例えば、対応するIDを持つ長方形の境界ボックス(外接枠)によって示される。ビデオの複数のフレームの画像シーケンスでは、同一のIDのバウンディングボックス(外接枠)の移動軌跡は該IDの目標の軌跡と見なすことができる。これらのフレームでは、該IDのバウンディングボックスで示される複数の画像ブロックの画像ブロックシーケンスは追跡タックレット(tacklet)(スモールセグメント(small segment)ともいう)と呼ばれる。1つの追跡タックレットにおける各画像ブロックは該追跡タックレットの1つのフレームの画像とみ見なすことができ、各々のフレームの画像には目標軌跡の時間情報及び空間位置情報を表す情報を割り当てることができる。
【0005】
入力ビデオを提供するカメラヘッドの監視空間が限られていることを考慮すると、実際のビデオ監視(追跡)の応用では複数のカメラヘッドを用いてより大きな空間に対して監視及び目標追跡を行うことができる。これはマルチカメラヘッド・マルチターゲット追跡(Multi-Target Multi-Camera Tracking、MTMCT)を必要とする。MTMCTは例えば、入力される複数のカメラヘッドの画像シーケンスを処理し、標識済みの画像シーケンスを出力し、そのうち、同じIDの目標が異なるカメラヘッドの画像シーケンスに現れる場合、クロスカメラヘッドであるかどうかにもかかわらず、同一の目標IDのバウンディングボックスによって該目標の画像ブロックを標識することが望まれる。同一の目標IDのバウンディングボックスに対応するこれらの画像ブロックは該目標IDの目標のクロスカメラヘッド追跡タックレットを構成する。即ち、1つの追跡タックレットにおける2つのレームの画像は異なるカメラヘッドに由来し得る。
【0006】
今のところ、マルチカメラヘッド・マルチターゲット追跡技術には主にシングルカメラヘッド目標追跡及びマルチカメラヘッド間マッチングの2つの段階が含まれる。
【0007】
マルチカメラヘッド・マルチターゲット追跡の結果の正確さに影響する不利なファクターはオクルージョン、照明、姿勢変化などを含む。マルチカメラヘッド・マルチターゲット追跡の結果の正確さを向上されるのは困難である。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明が解決しようとする課題は、誤ったクロスカメラヘッド目標軌跡を減少させること、標識切り替えを減少させること、及び誤った目標標識割り当てを減少させること、のうちの少なくとも1つを含むが、これらに限られない。
【課題を解決するための手段】
【0009】
本発明の1つの側面によれば、マルチターゲット・マルチカメラヘッド追跡のための方法が提供される。該方法は、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定することを含み、
そのうち、グローバル目標軌跡集合の決定は、
総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;
クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合を決定し;及び
最小コスト経路集合に基づいてクラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む。
【0010】
本発明のもう1つの側面によれば、マルチターゲット・マルチカメラヘッド追跡のための装置が提供される。該装置は命令を記憶している記憶器;及び、少なくとも1つの処理器を含み、該処理器は命令を実行して次のことを行うように構成され、即ち、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定することであり、
そのうち、グローバル目標軌跡集合の決定は、
総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;
クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合を決定し;及び
最小コスト経路集合に基づいてクラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む。
【0011】
本発明のまたもう1つの側面によれば、プログラムを記憶しているコンピュータ可読記憶媒体が提供される。プログラムはコンピュータにより実行されるときに、コンピュータは次の処理を実現し、即ち、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定する処理であり、
そのうち、グローバル目標軌跡集合の決定は、
総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;
クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合を決定し;及び
最小コスト経路集合に基づいてクラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む。
【発明の効果】
【0012】
本発明の方法、装置及び記憶媒体の有利な効果は、マルチカメラヘッド・マルチターゲット追跡の結果の正確さを向上させることができること、及び、標識切り替えを減少させることができることのうちの少なくとも1つを含む。
【図面の簡単な説明】
【0013】
図1】本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための方法の例示的なフローチャートである。
図2】本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための方法の例示的なデータ変換を示す図である。
図3】本発明の1つの実施例に係るシングルカメラヘッド・マルチターゲット追跡を示す図である。
図4】本発明の1つの実施例に係る例示的なローカル目標軌跡を示す図である。
図5】本発明の1つの実施例に係る2つの例示的なローカル目標軌跡を示す図である。
図6】本発明の1つの実施例に係る2つの例示的なローカル目標軌跡を示す図である。
図7】本発明の1つの実施例に係るクラスタリング処理のための方法の例示的なフローチャートである。
図8】本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための方法の例示的なフローチャートである。
図9】本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための装置の例示的なブロック図である。
図10】本発明のもう1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための装置の例示的なブロック図である。
図11】本発明の1つの実施例に係る情報処理機器の例示的なブロック図である。
【発明を実施するための形態】
【0014】
以下、添付した図面を参照しながら、本発明を実施するための好適な実施例を詳細に説明する。なお、以下の実施例は例示に過ぎず、本発明を限定するものではない。
【0015】
本発明の実施例の各側面における処理を実行するためのコンピュータプログラムコードは1つ又は複数のプログラム設計言語の任意の組み合わせによって書かれても良く、前記プログラム設計言語はオブジェクト指向型プログラム設計言語、例えば、JavaやSmalltalk、C++を含んでも良く、通常の手続き型プログラム設計言語、例えば、Cプログラム設計言語又は類似したプログラム設計言語をさらに含んでも良い。
【0016】
本発明の方法は対応する機能の構成を持つ回路により実現されても良い。前記回路は処理器のための回路を含んでも良い。
【0017】
本発明の1つの側面ではマルチターゲット・マルチカメラヘッド追跡(MTMCT)のための方法が提供される。該方法はコンピュータにより実現されても良い。図1は本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための方法100の例示的なフローチャートである。図2は本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための方法の例示的なデータ変換を示す図である。図3は本発明の1つの実施例に係るシングルカメラヘッド・マルチターゲット追跡を示す図である。以下、図1図2及び図3を参照しながら、本発明によるMTMCT方法について例示的に説明する。なお、分かりやすくするために、図3では1つのみの目標Tg[x]が示されている。
【0018】
ステップS101では、複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定する。このステップの操作は“シングルカメラヘッド・マルチターゲット追跡操作Op_mtt”と記される。
【0019】
図2を参照するに、複数のカメラヘッドCam[cStart]乃至Cam[cEnd]のうちの各カメラヘッド(一般にCam[c]と表される)により提供される、対応する画像シーケンス(SqIm[c])が示されている。シングルカメラヘッドのためのマルチターゲット追跡モデルMmttがマルチターゲット追跡を実行することで、各カメラヘッドのローカル目標軌跡集合TJs[c]を決定する。総ローカル目標軌跡集合LTJsは複数のローカル目標軌跡集合TJs[cStart]乃至TJs[cStart]の和集合である。図3(a)及び図3(b)に示すように、カメラヘッドCam[c]が提供する画像シーケンスSqIm[c]は現在の時間tの画像Im@t及び前の時刻(時間)t′の画像Im@t′を含み、例示として、画像には複数の目標のうちの1つの目標が示されており、目標Tg[x]と記される。図3(a)及び図3(b)に示すように、時間tからt′の期間内で目標Tg[x]はリアル空間(ワールド座標系の空間に対応する)内で移動しており、また、キャプチャされた画像において、目標Tg[x]に対応する画像ブロックの位置も画像座標系XOYで移動している(図3(f)参照)。
【0020】
複数のカメラヘッドは例えば、第一ローカル空間(例えば、第一部屋)を監視する第一カメラヘッドCam[1]及び第一ローカル空間に隣接する第二ローカル空間(例えば、第二部屋)を監視する第二カメラヘッドCam[2]を含む。理解できるように、複数のカメラヘッドには監視領域がオーバーラップするカメラヘッドが含まれても良い。
【0021】
図2を参照するに、画像シーケンスSqIm[c]はカメラヘッドCam[c]が提供する所定期間のビデオにおける時間順に配列される複数の画像(フレーム)、即ち、Im[c][iCstart]乃至Im[c][iCend]を含み、cはcStart乃至cEndのうちの任意の1つの整数であっても良い。画像Im[c][ic]には関心のある類型の1つ又は複数の目標(例えば、複数の顧客)の画像が含まれても良く、そのうち、時間の経過に伴って目標はカメラヘッドの監視範囲に入ったり、カメラヘッドの監視範囲から出たりする可能性があるため、画像における目標の数は変化する場合がある。
【0022】
図2に示すように、シングルカメラヘッドのためのマルチターゲット追跡モデルMmttを使用して画像シーケンスSqIm[c]を処理することでカメラヘッドCam[c]の目標軌跡集合TJs[c]を得ることができる。目標軌跡集合TJs[c]はシングルカメラヘッドCam[c]が監視するローカル空間における目標の軌跡の集合に対応するので、目標軌跡集合TJs[c]もシングルカメラヘッド目標軌跡集合又はローカル目標軌跡集合と称されても良い。
【0023】
ローカル目標軌跡集合TJs[c]には例えば、複数のローカル目標軌跡TJ[c][jCstart]乃至TJ[jCend]、1つのローカル軌跡(対応する画像シーケンスSqIm[c]には1つのみの関心のある類型の目標が現れる)、及び0個のローカル軌跡(空集合であり、対応する画像シーケンスSqIm[c]には関心のある類型の目標が現れない)が含まれる。図2では、ローカル目標軌跡集合TJs[c]には複数のローカル目標軌跡TJ[c][jCstart]乃至TJ[jCend]が含まれていることが示されている。
【0024】
図2を参照するに、1つのローカル目標軌跡TJ[c][jc]は例えば、軌跡点PTJ[c][jc][kJCstart]乃至PTJ[c][jc][kJCend]を持つ。各軌跡点PTJは例えば、次の位置属性のうちのの少なくとも1つを有し、即ち、画像位置属性PosI及び空間位置属性PosSである。画像位置属性PosIの値は該軌跡点について、目標画像が画像座標系に所在する位置を表す。空間位置属性PosSの値は該軌跡点について、目標がワールド座標系に所在する位置を表す。各軌跡点は時間属性timeをさらに含み、時間属性timeの値は目標が対応する空間位置にあるときに対応する時間を表す。図3(f)ではカメラヘッドCam[c]により提供される画像シーケンスSqIm[c]に基づいて決定される目標Tg[x]のローカル目標軌跡TJ[c][x]が示されており、そのうち、特に、画像座標系での前の時間t′の軌跡点PTJ[c][x][kt′](その座標は(X1,Y1)である)及び画像座標系での現在の時間tの軌跡点PTJ[c][x][kt](その座標は(X2,Y2)である)が示されている。
【0025】
1つのローカル目標軌跡TJ[c][jc]は1つの追跡タックレットTrk[c][jc]に対応する。図2に示すように、追跡タックレットTrk[c][jc]は画像ブロックシーケンス、即ち、Patch[c][jc][kJCstart]乃至Patch[c][kjc][kJCend]であり、そのうち、各画像ブロックはカメラヘッドCam[c]の1つのフレームの画像における画像ブロックであり、該画像ブロックには目標の画像(即ち、ビデオフレームにおいて目標検出によって決定される目標の矩形バウンディングボックスで示される画像ブロック)が含まれ、各画像ブロックには目標軌跡に関する時間情報及び空間位置情報を示す時間属性、画像位置属性及び空間位置属性が設定されても良い。時間属性の値は対応するフレームの画像のキャプチャ時間であっても良く、画像位置属性の値は例えば、対応する画像ブロック(矩形バウンディングボックス)の中心が対応する画像に所在する位置であっても良い。空間位置属性の値は対応する画像ブロック(矩形バウンディングボックス)の中心に対応する点のワールド座標系での座標であっても良い(それは対応するカメラヘッドの内部パラメータに基づいて画像位置に対して座標変換を行うことで得られても良い)。各画像ブロックPatch[jc][kJC]は軌跡TJ[jc]上の1つの対応する軌跡点PTJ[jc][kJC]に対応する。ローカル目標軌跡TJ[jc]は追跡タックレットTrk[jc]によって記述し又は表すことができる。目標検出操作(処理)は検出したバウンディングボックスの位置情報やサイズ情報を提供でき、そのうち、位置情報はバウンディングボックスの1つの対角線の2つの端点の座標であっても良く、サイズ情報はバウンディングボックスの高さであっても良い。図3(c)では、目標検出で決定される、前の時間t′においてバウンディングボックスBox[c][x][kt′]により示される画像ブロックPatch[c][x][kt′]が示されており、それは矩形バウンディングボックスBox[c][x][kt′]により定義される画像ブロックであり、図3(d)では、目標検出で決定される、現在の時間tにおいてバウンディングボックスBox[c][x][kt]により示される画像ブロックPatch[c][x][kt]が示されており、それは矩形バウンディングボックスBox[c][x][kt]により定義される画像ブロックである。図3(e)では、時間順に相列される画像ブロックシーケンス、即ち、……、Patch[c][x][kt′]、Patch[c][x][kt]が示されており、それはカメラヘッドCam[x]に関する目標Tg[x]の追跡タックレットTrk[c][x]を構成する。
【0026】
総ローカル目標軌跡集合LTJsはシングルカメラヘッド目標軌跡集合TJs[cStart]乃至TJs[cEnd]の和集合である。クロスカメラヘッドのマルチカメラヘッド・マルチターゲット・マッチング(即ち、クロスカメラヘッド軌跡マッチング)が行われていないため、特定の目標Tg[x]が第一、第二カメラヘッドの両方のビデオに現れた場合、総ローカル目標軌跡集合LTJsでは第一、第二カメラヘッドに対応する目標Tg[x]の2つのローカル目標軌跡が同じIDによって標識されていない。望ましくは、この2つのローカル目標軌跡はその後の操作において両者がマッチングすると判明した(即ち、同一の目標に対応すると決定された)ことに応じて同じIDによって標識され、かつ同じIDによって標識される1つの目標軌跡として合併できる。このように複数のカメラヘッドの目標軌跡を合併することで得られる1つの目標軌跡は“クロスカメラヘッド目標軌跡”と称されても良い。例を挙げて言えば、2つのカメラヘッドにより提供される2つの画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡処理を行うことで12個のローカル目標軌跡を得る場合、2つの目標が2つのカメラヘッドの両方の監視空間に出現したことがあるので、理想的なときに、後続の処理を経た後に、最終的に得られるグローバル目標軌跡集合には10個のみのグローバル目標軌跡が含まれる。換言すれば、複数のカメラヘッドのビデオがシングルカメラヘッド・マルチターゲット追跡のみを経ているが、マルチカメラヘッド・マルチターゲット・マッチングを経る前に、目標標識が追加されたビデオ(例えば、各目標画像ブロックには対応標識を持つバウンディングボックスが追加されている)を再生する場合、異なるカメラヘッドのビデオの中の異なる目標標識が対応するのは同一の目標である可能性がある(例えば、ビデオ1における1#バウンディングボックスとビデオ2における3#は同じ人物に対応する可能性がある)。即ち、このときの目標標識はローカルであり、同一のビデオにおいて目標を区別できるが、異なるカメラヘッドのビデオにおいて目標を区別するために用いることができる。
【0027】
シングルカメラヘッド・マルチターゲット追跡によってカメラヘッドCam[c]の画像シーケンスSqIm[c]を処理した後に、該画像シーケンスにおける各画像内の目標はポジショニング及び標識される。該画像シーケンス(ビデオ)を再生するときに、ポジショニング済みの各目標のバウンディングボックスを画像に重ね合わせて表示でき、異なる目標のバウンディングボックスは例えば、異なる色で区別でき、このようにして、所定の色で標識される目標の対応する期間内の移動軌跡をはっきりと見ることができ、もちろん、再生時に目標の唯一の標識を画像に重ね合わせて表示することもできる。準リアルタイムで追跡結果を表示でき、即ち、1フレームの画像をキャプチャした後に、シングルカメラヘッド目標マッチングを行い、新画像における目標に対して前の軌跡とのマッチングを行って標識を割り当てることで、決定された標識を持つバウンディングボックスが重ね合わせられている新画像を表示する。マルチカメラヘッド・マルチターゲット・マッチングを行った後に、複数のカメラヘッドによって共有される共通の目標標識集合を利用して前述の表示方式と類似した方式で表示を行うことができ、共通の目標標識はグローバルであり、理想的な場合、どのカメラヘッドであっても、同じ目標には唯一の目標標識が割り当てられ、異なるカメラヘッドビデオにおいて同じ目標標識を有するバウンディングボックスは同一の目標を示す。
【0028】
図1及び図2を参照するに、ステップS103では、総ローカル目標軌跡集合LTJsに対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで、複数のカメラヘッドCam[cStart]乃至Cam[cEnd]についてのグローバル目標軌跡集合GTJsを決定する。このステップの操作は“マルチカメラヘッド・マルチターゲット・マッチング操作Op_mat”と記される。グローバル目標軌跡は全部のローカル領域を監視する1つのグローバルカメラヘッドが“見た”目標の軌跡に相当する。操作Op_matは、ステップS1031において、総ローカル目標軌跡集合LTJsの中のローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合GTJcmsを決定し(“クラスタリング処理Op_cluster”と略称する);ステップS1033において、クラスタリング・マッチング・グローバル軌跡集合GTJcmsの中の各軌跡を頂点として構築される有向グラフGに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合Pminsを決定し(“最小コスト操作Op_cminp”と略称する);及び、ステップS1035において、最小コスト経路集合Pminsに基づいてクラスタリング・マッチング・グローバル軌跡集合GTJcmsの中の対応する軌跡を合併する(“合併操作Op_merge”と略称する)ことを含む。クラスタリング・マッチング・グローバル軌跡集合GTJcmsについて、最小経路集合Pminsにおいて指示されるすべての合併可能な軌跡の合併を完了した後に得られる軌跡集合は“グローバル目標軌跡集合GTJs”である。グローバル目標軌跡集合GTJsにおける軌跡は、複数のカメラヘッドによってシェアされる共通の目標標識集合からの目標標識を用いて区別され、軌跡上の軌跡点がどのカメラヘッドからのものであるかにもかかわらず、同一の目標の軌跡点には、共通の目標標識集合における1つの目標標識が割り当てられる。
【0029】
総ローカル目標軌跡集合LTJsの中のローカル目標軌跡に対してクラスタリングを行うときに、2つのローカル目標軌跡が1つの類型にクラスタリングされるときに、この2つのローカル目標軌跡が同一の目標に対応する(即ち、2つのローカル目標軌跡が互いにマッチングしている)と見なす。よって、この2つのローカル目標軌跡は1つの軌跡として合併でき、軌跡集合における軌跡の数は減少する。クラスタリング処理Op_clusterに軌跡の合併があり得るので、得られるクラスタリング・マッチング・グローバル軌跡集合GTJcmsの中の軌跡の数は総ローカル目標軌跡集合LTJsにおける軌跡の数よりも少なくなる可能性がある。
【0030】
合併操作Op_mergeに軌跡の合併(即ち、軌跡のマッチング)が同様に生じ得るので、グローバル目標軌跡集合GTJsにおける軌跡の数はクラスタリング・マッチング・グローバル軌跡集合GTJcmsの中の軌跡の数よりも少なくなる可能性がある。例えば、目標Tg[x]が時間t1からt2の間に軌跡TJ1,2を有し、目標Tg[x′]が時間t3からt4の間に軌跡TJ3,4を有し、軌跡TJ1,2が軌跡TJ3,4にマッチングしていると決定した(即ち、目標Tg[x]と目標Tg[x′]が同一の目標Tg[X]であると見なした)ときに、軌跡TJ1,2と軌跡TJ3,4は目標Tg[X]の時間t1からt4の間の軌跡を示す1つの軌跡として合併(接続)される。
【0031】
以下、方法100の更なる細部について例示的に説明する。
【0032】
1つの実施例において、シングルカメラヘッド・マルチターゲット追跡操作Op_mttは目標検出操作Op_detB、再認識特徴抽出操作Op_extF、シングルカメラヘッド目標マッチング操作Op_matS、及びローカル目標軌跡後処理操作Op_postPを含む。シングルカメラヘッド・マルチターゲット追跡操作Op_mttは入力される複数の画像のうちの各画像内の目標を検出でき、各目標は矩形バウンディングボックスによって示される画像ブロックで表され、異なる時間における画像ブロックのマッチングにより、各画像ブロックにシングルカメラヘッド内目標標識を割り当てることができ、同一のシングルカメラヘッド内目標標識の画像ブロックの時間シーケンスはローカル目標軌跡集合内の1つのローカル目標軌跡を表す。
【0033】
目標検出操作Op_detBについて、目標検出ネットワークNwTag(例えば、YoloX)を使用して、カメラヘッドにより提供される、対応する画像シーケンスの中の画像内の目標を検出し、そして、検出した目標の矩形バウンディングボックス(検出バウンディングボックスと略称する)の情報(例えば、位置、サイズなど)及びバウンディングボックスの信頼度を出力できる。このような目標検出ネットワークは通常の技術であり、ここではその詳しい説明を省略する。
【0034】
再認識特徴抽出操作Op_extFについて、画像において検出された各バウンディングボックスによって指示される画像ブロックの、目標に関する再認識特徴Freidは再認識ネットワークNwReIDによって提供され得る。このような再認識ネットワークは通常の技術であり、ここではその詳しい説明を省略する。
【0035】
1つの実施例において、総ローカル目標軌跡集合LTJsの決定は、複数のカメラヘッドのうちの各カメラヘッドについて、シングルカメラヘッド目標マッチング操作Op_matSを実行することを含む。シングルカメラヘッド目標マッチングOp_matSは、前のローカル目標軌跡集合TJst′(即ち、軌跡が検出された集合)及び対応する画像シーケンスにおける現在の画像Imtに基づいて、現在のローカル目標軌跡集合TJsを決定することを含む。対応する画像シーケンスには隣接する画像、即ち、前の画像Imt′及び現在の画像Imが含まれ、t′は前の時間であり、tは現在の時間であり、さらには、時間t′の前にキャプチャされた画像も含まれ得る(Imt′が画像シーケンスの開始フレームでないとき)。現在のローカル目標軌跡集合TJstの決定は、目標検出ネットワークNwTagを使用して現在の画像Im内の所定類型の目標の検出バウンディングボックスBox[bStart]乃至Box[bEnd]及びバウンディングボックスの信頼度cfd[bStart]乃至cfd[bEnd]を決定し;及び、現在の画像Imにおける各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像Imt′に基づいてシングルカメラヘッド目標マッチングを行うことで、前のローカル目標軌跡集合TJst′を現在のローカル目標軌跡集合TJsとして更新することを含む。前の画像Imt′は前のローカル目標軌跡集合TJst′の対応する画像シーケンスの中の最後(最末尾/末尾)の画像(即ち、最新の画像)である。
【0036】
1つの実施例において、現在の画像における各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新することは、検出バウンディングボックスのうち、バウンディングボックスの信頼度がバウンディングボックスの信頼度閾値よりも大きい、信頼できるバウンディングボックスと、前のローカル目標軌跡集合の中の各検出済み目標軌跡との第一追跡マッチングを行うことで、信頼できるバウンディングボックスの目標標識を決定し;前のローカル目標軌跡集合における検出済み目標軌跡のうちの未マッチングの軌跡に対して、残りの検出バウンディングボックスのうちのものとの第二追跡マッチングを行うことで、残りの検出バウンディングボックスの目標標識を決定し;及び、検出バウンディングボックスのうち、バウンディングボックスの信頼度がバウンディングボックスの信頼度閾値よりも大きく、かつ前のローカル目標軌跡集合における検出済み目標軌跡にマッチングしないバウンディングボックスについて、新しい目標標識を生成することを含む。
【0037】
例示として、シングルカメラヘッド目標マッチング操作Op_matSは次のステップを含んでも良く、即ち、(1)現在の時間tにおいてカルマンフィルターを使用してt′時間におけるバウンディングボックスに基づいて、現在の時間tにおけるバウンディングボックスの位置を予測し;(2)バウンディングボックスの信頼度が所定のバウンディングボックスの信頼度閾値(例えば、0.5)よりも大きい検出バウンディングボックス、及び、前のローカル目標軌跡集合TJst′における各検出済み軌跡に対して、idマッチング(第一追跡マッチング)を行い;(3)未マッチングの軌跡に対して、残りの検出バウンディングボックスのうちのものとのマッチング(第二追跡マッチング)を行い;(4)バウンディングボックスの信頼度が所定のバウンディングボックスの信頼度閾値よりも大きく、かつ前のローカル目標軌跡集合TJst′の中の検出済み軌跡にマッチングしない検出バウンディングボックスについて、新しい軌跡を生成し;及び、(5)現在の軌跡点に対応する最新バウンディングボックス集合に基づいて、カルマンフィルターのパラメータを更新することを含む。1つの例において、1つのカメラヘッドについてのシングルカメラヘッド・マルチターゲット追跡操作Op_mttにおいて、画像シーケンスにおける1番目の画像に対して、シングルカメラヘッド目標マッチング操作Op_matSを実行せず、目標検出操作Op_detBのみを実行しても良く、そのうち、操作Op_detBは1番目の画像内の目標を検出し、そのバウンディングボックスを決定し、目標数に対応するn個の軌跡点(即ち、n個の軌跡)を取得し、各軌跡点は対応するバウンディングボックスに対応し、n個の軌跡はローカル目標軌跡集合を構成する。後続の画像について、シングルカメラヘッド目標マッチング操作Op_matSを実行しても良く、現在の画像から検出された目標と、前のローカル目標軌跡集合の中の軌跡とのマッチングを行うことで、現在のローカル目標軌跡集合を決定する(即ち、ローカル目標軌跡集合を更新する)ことができる。画像シーケンスの中の画像の順序に従って、各画像に基づいて、次第にローカル目標軌跡集合を反復して更新することで、最終的には画像シーケンス全体についてのローカル目標軌跡集合を取得する。
【0038】
1つの実施例において、次の方式で第一追跡マッチング及び第二追跡マッチングのうちの少なくとも1つを行っても良く、即ち、前の画像(即ち、前の時間t′における画像)内の検出バウンディングボックスに基づいて、現在の画像(即ち、現在の時間tにおける画像)の予測バウンディングボックスを予測し;及び、現在の画像の検出バウンディングボックス及び予測バウンディングボックスと関連付けられる面積オーバーラップコスト関数及び頂点オーバーラップコスト関数に基づいて、現在の画像におけるバウンディングボックスの目標標識を決定する。
【0039】
1つの実施例において、カメラヘッドCam[c]により提供される画像シーケンスについて、シングルカメラヘッド目標マッチングによって、前の1フレームの画像(時間t′に対応する)から検出された目標のバウンディングボックスに基づいて、現在の時間tにおける画像の中の検出目標のバウンディングボックスの目標標識を決定し、そして、例えば、前のローカル目標軌跡集合に新しい軌跡又は軌跡点を追加することで前のローカル目標軌跡集合を現在のローカル目標軌跡集合として更新することができる。シングルカメラヘッド目標マッチング操作Op_matSは例示的に以下の操作を含み得る。
【0040】
(1)予測バウンディングボックスと検出バウンディングボックスとの間のオーバーラップコスト関数Ioucostを次のように計算する。
【0041】
Ioucost=2*soverlap/(spredicted+sdetected) (1)
そのうち、soverlapは予測バウンディングボックスと検出バウンディングボックスのオーバーラップ面積であり、spredictedは予測バウンディングボックスの面積であり、sdetectedは検出バウンディングボックスの面積である。
【0042】
(2)予測バウンディングボックスの頂点と検出バウンディングボックス頂点とのオーバーラップコスト関数ycostを次のように計算する。
【0043】
cost=2*|Y0predicetd-Y0detected|/(hpredicted+hdetected)*scale (2)
そのうち、Y0predictedは予測バウンディングボックスの右上隅の縦座標であり、Y0detectedは検出バウンディングボックスの右上隅の縦座標であり、hpredictedは予測バウンディングボックスの高さであり、hdetectedは検出バウンディングボックスの高さであり、scaleは拡大縮小率であり、ここでは例示として10をとっても良い。
【0044】
(3)総コスト関数mcostを次のように計算する。
【0045】
cost=λ*Ioucost+(1-λ)*Ycost (3)
そのうち、λは所定の加重定数(係数)であり、例示として、0.8をとっても良い。
【0046】
(4)総コスト関数に対してハンガリーアルゴリズムを適用してマッチングを行うことでマッチング結果を得る。マッチング結果は次のとおりであり、即ち、現在の画像の検出バウンディングボックスBox[b]を1つの前のローカル目標軌跡TJ[x]とマッピングさせ、該検出バウンディングボックスに該前のローカル目標軌跡の目標標識xを割り当て、バウンディングボックスBox[b]に対応する軌跡点をローカル目標軌跡TJ[x]に追加してローカル目標軌跡TJ[x]上の新軌跡点とし、又は、前のローカル軌跡集合に現在の画像の検出バウンディングボックスBox[b]とのマッチング軌跡がない場合、検出バウンディングボックスBox[b]の対応する軌跡点に新目標標識を割り当てて1つの新軌跡を生成し、前のローカル軌跡集合に追加し、そして、更新後の前のローカル軌跡集合を現在のローカル軌跡集合とする。
【0047】
ローカル軌跡集合における軌跡を決定する正確さを向上させ、同一の軌跡に異なる目標が現れることを抑え、標識切り替え(目標x′の画像ブロックを誤って既存の目標xの軌跡とマッチングさせる)を抑制するために、現在のローカル軌跡集合の決定はさらに、現在のローカル軌跡集合に対して後処理を行うことで現在のローカル目標軌跡集合を更新することを含む。
【0048】
1つの実施例において、現在のローカル軌跡集合に対する後処理は次の処理(“第一後処理操作Op_posP1”と略称する)を含み、即ち、現在のローカル目標軌跡集合の中の軌跡の動き(移動)特徴に基づいて、新軌跡を生成するかを決定する。図4は本発明の1つの実施例に係る例示的なローカル目標軌跡TJ[c][x]を示す図であり、そのうち、図4(a)は現在のローカル軌跡集合TJsにおいて目標Tg[x]に関する1つの軌跡TJ[c][x]を示しており、それは現在の軌跡点PTJt及び前の軌跡点PTJt′を含む。(Xpre,Ypre)は前のデータt′の軌跡点PTJt′の画像座標であり、(Xcur,Ycur)は現在のデータtの軌跡点PTJtの画像座標である。1つの例において、現在のローカル目標軌跡集合TJsにおける軌跡の動き特徴に基づいて、新軌跡を生成するかを決定することは、現在のローカル目標軌跡集合TJsの中の1つの軌跡TJ[c][x]について、軌跡TJ[c][x]の現在の軌跡点PTJtの動き方向dirtを決定し;現在の軌跡点PTJtが動き方向dirtにおいて現在の軌跡点PTJtの軌跡TJ[c][x]上の前の軌跡点PTJt′に対して移動する移動距離disを決定し;及び、移動距離disが所定距離閾値disThよりも大きく、現在の軌跡点PTJtの動き方向dirtが前の軌跡点PTJt′の動き方向dirt′と逆であり、かつ現在の軌跡点PTJtの対応する画像ブロックの再認識特徴Freidtと、前の軌跡点PTJt′の対応する画像ブロックの再認識特徴Freidt′との類似度Sim(Freidt,Freidt′)が第一類似度閾値sTh1よりも小さい場合、現在の軌跡点の対応する画像ブロックと関連付けられる新軌跡を生成する。類似度Sim(Freidt,Freidt′)は特徴FreidtとFreidt′との間のコサイン類似度であっても良い。図4(b)は軌跡TJ[c][x]に対して第一後処理操作Op_posP1を行った後に、目標Tg[x]の軌跡が軌跡点PTJtを含まないように更新され、かつ軌跡点PTJtと関連付けられる新軌跡(例えば、軌跡点PTJtを新目標Tg[x′]の軌跡点と記す)を生成することを示している。
【0049】
1つの例において、動き方向dirは正のX方向(X軸方向)、負のX方向、正のY方向(Y軸方向)及び負のY方向のうちの1つのであり、正のX方向は正のY方向に垂直である。図4に示すように、目標Tg[x]の軌跡TJ[c][x]は2つの末端の軌跡点、即ち、前の時間t′の軌跡点PTJt′及び現在の時間tの軌跡点PTJtを含む。動き方向は以下の式(4)に基づいて決定され得る。
【0050】
【数1】
現在の軌跡点の対応する画像ブロックの再認識特徴Freidt及び前の軌跡点の対応する画像ブロックの再認識特徴Freidt′は再認識ネットワークNwReIDによって対応する画像ブロックから抽出できる。
【0051】
現在の軌跡点PTJtが動き方向dirtにおいて現在の軌跡点PTJtの軌跡TJ[c][x]上の前の軌跡点PTJt′に対して移動する移動距離disは以下の式(5)によって決定され得る。即ち、移動距離は画像内の真の移動距離の移動方向上の成分であっても良い。
【0052】
【数2】
図4を参照するに、前の軌跡点PTJt′について、動き方向dirt′=“正のX方向”であり、現在の軌跡点PTJtについて、動き方向dirt=“負のX方向”であり、即ち、2つの動き方向が相反しており、かつt′からtの目標までの移動距離dis>disThであり、Sim(Freidt,Freidt′)<sTh1である場合、軌跡点PTJtに対応する目標は軌跡点PTJt′に対応する目標とは異なる可能性が高く、即ち、軌跡点PTJtは軌跡TJ[c][x]とマッチングしない可能性が高い。よって、現在の軌跡点の対応する画像ブロックと関連付けられる新軌跡を生成し、現在のローカル目標軌跡集合の中の軌跡TJ[c][x]における軌跡点PTJtを削除し、そして、該新軌跡を現在のローカル目標軌跡集合に追加して現在のローカル目標軌跡集合を更新する。例示として、sTh1は0.6である。これは、画像において異なる目標の画像ブロックのオーバーラップが発生するときに標識切り替え(id-switch)が生じることの回避に有利である。
【0053】
画像シーケンスにおける1つの画像において、複数の目標の画像ブロックがオーバーラップすることが生じる可能性がある。このときに、標識切り替えが発生しやすい。よって、発明者はこのようなことの発生を抑えるために“第二後処理操作Op_posP2”に関する実施例を以下のように考案している。
【0054】
図5は本発明の1つの実施例に係る2つの例示的なローカル目標軌跡を示しており、そのうち、軌跡点及び例示的な対応する画像ブロックをも示している。図5(a)は後処理操作前の軌跡であり、図5(b)は後処理操作後の軌跡である。1つの実施例において、現在のローカル軌跡集合に対する後処理は次のことを含み、即ち、図5(a)に示すように、現在のローカル目標軌跡集合の中の対応する新目標Tg[x′]の新軌跡点PTJx′t(“軌跡点B”と略称し、それは現在、1つのみの軌跡点を含む軌跡に対応し、即ち、目標Tg[x′]の画像ブロックは現在の時間tの現在の画像Imtに新しく出現する画像ブロックであり、前の画像(画像Imtに隣接する前の時間t′における前の画像Imt′を含む)には目標Tg[x′]が出現したことがない)について、現在の画像Imtにおいて該新軌跡点PTJx′tの対応するバウンディングボックスBoxx′tとのオーバーラップ度(率)が最大のオーバーラップバウンディングボックスBoxxt(オーバーラップが発生した場合、それは現在のローカル軌跡集合TJs[c][x]の中の軌跡点PTJxtに対応し、“軌跡点A”と略称される)を決定し;及び、該対応するバウンディングボックスBoxx′t及び該オーバーラップバウンディングボックスBoxxtについて、以下の第一類似度条件C1を満足するかを決定することである。
【0055】
Sim(Freid_x′t,Freid_xt′)-Sim(Freid_xt,Freid_xt′)>sTh2 (6)
第一類似度条件C1を満足したと決定した場合、対応するバウンディングボックスBoxx′tとオーバーラップバウンディングボックスBoxxtの目標標識を交換する。Sim(Freid_x′t,Freid_xt′)は対応するバウンディングボックスBoxx′tに対応する目標標識x′の現在の画像Imt内の画像ブロックの再認識特徴Freid_x′tと、オーバーラップバウンディングボックスに対応する目標標識xの前の画像Imt′内の画像ブロックの再認識特徴Freid_xt′との間の類似度であり、Sim(Freid_xt,Freid_xt′)はオーバーラップバウンディングボックスBoxxtに対応する目標標識xの現在の画像Imt及び前の画像Imt′内の画像ブロックの再認識特徴Freid_xtとFreid_xt′との間の類似度であり;また、sTh2は第二類似度閾値である。例示として、sTh2は0.1をとる。類似度は特徴向量の間のコサイン類似度であっても良い。例を挙げて言えば、図5(a)を参照するに、現在のローカル目標集TJsの中の目標Tg[x]の軌跡TJ[c][x]及び目標Tg[x′]の軌跡TJ[c][x′](それは新軌跡であり、1つのみの軌跡点PTJx′tを含み、軌跡TJ[c][x]は複数の軌跡点PTJxt、PTJxt′などを含む)について、本実施例に記載の後処理を経た後に、軌跡更新が発生する可能性があり、オーバーラップバウンディングボックスの目標標識の交換の前に、類似度が条件C1を満足し、この場合、図5(b)に示すように、目標Tg[x]の軌跡TJ[c][x]の末端軌跡点を軌跡点Bとして更新し、軌跡点Aは目標標識がx′として更新され、即ち、新軌跡点になる。
【0056】
2つの目標がオーバーラップしてから分離した場合、オクルージョンが発生しており、このような場合、分離後の軌跡点には誤った目標標識が割り当てられる可能性がある。よって、発明者はこのようなことの発生を抑制するために“第三後処理操作Op_posP3”に関する実施例を以下のように考案している。
【0057】
1つの実施例において、第三後処理操作Op_posP3は、現在のローカル軌跡集合TJsに、次のオーバーラップ条件を満足した第一軌跡及び第二軌跡が存在するかを決定することを含み、即ち、第一軌跡の対応する画像ブロックシーケンス中の現在の時間tの前の時間t′における第一画像ブロックと、第二軌跡の対応する画像ブロックシーケンス中の前の時間t′における第二画像ブロックとのオーバーラップが発生しており;第一軌跡の対応する画像ブロックシーケンス中の現在の時間tにおける第三画像ブロックと、第二軌跡の対応する画像ブロックシーケンス中の現在の時間tにおける第四画像ブロックとの間にオーバーラップがなく;かつ、第一軌跡の対応する画像ブロックシーケンス中の前の時間t′よりも前の時間t′′における第五画像ブロックと、第二軌跡の対応する画像ブロックシーケンス中の前の時間t′よりも前の時間t′′における第六画像ブロックとの間にオーバーラップがない。図6は本発明の1つの実施例に係る2つの例示的なローカル目標軌跡を示しており、また、軌跡点及び例示的な対応する画像ブロックをも示しており、そのうち、図6(a)は前述のオーバーラップ条件を満足した第一軌跡TJ[c][x]及び第二軌跡TJ[c][x′]を示している。図6(a)に示すように、現在のローカル軌跡集合TJsの中の第一軌跡TJ[c][x]及び第二軌跡TJ[c][x′]について、第一軌跡TJ[c][x]は現在の時間tにおける軌跡点PTJxt(その対応する画像ブロックを“第三画像ブロックPatch3”と記し、該点も“軌跡点A”と称されても良い)、前の時間のt′における軌跡点PTJxt′(その対応する画像ブロックを“第一画像ブロックPatch1”と記す)、及び、それよりも前の時間t′′における軌跡点PTJxt′′(その対応する画像ブロックを“第五画像ブロックPatch1”と記す)を含み、第二軌跡TJ[c][x′]は現在の時間tにおける軌跡点PTJx′t(その対応する画像ブロックを“第四画像ブロックPatch4”と記し、該点も“軌跡点B”と呼ばれて良い)、前の時間のt′における軌跡点PTJx′t′(その対応する画像ブロックを“第二画像ブロックPatch2”と記す)、及び、それよりも前の時間t′′における軌跡点PTJx′t′′(その対応する画像ブロックを“第六画像ブロックPatch6”と記す)を含む。
【0058】
第三後処理操作Op_posP3はさらに、上述のオーバーラップ条件を満足した第一軌跡TJ[c][x]及び第二軌跡TJ[c][x′]について、以下の第二類似度条件C2を満足したかを決定することを含む。
【0059】
Sim(Freid_xt′′,Freid_x′t)+Sim(Freid_x′t′′,Freid_xt)-Sim(Freid_xt,Freid_xt′′)+Sim(Freid_x′t′′,Freid_x′t)>sTh3 (7)
Sim(Freid_xt′′,Freid_x′t)は第五画像ブロックの再認識特徴Freid_xt′′と第四画像ブロックの再認識特徴Freid_x′tとの間の類似度である。
【0060】
Sim(Freid_x′t′′,Freid_xt)は第六画像ブロックの再認識特徴Freid_x′t′′と第三画像ブロックの再認識特徴Freid_xtとの間の類似度である。
【0061】
Sim(Freid_xt,Freid_xt′′)は第五画像ブロックの再認識特徴Freid_xt′′と第三画像ブロックの再認識特徴Freid_xtとの間の類似度である。
【0062】
Sim(Freid_x′t′′,Freid_x′t)は第六画像ブロックの再認識特徴Freid_x′t′′と第四画像ブロックの再認識特徴Freid_x′tとの間の類似度である。
【0063】
sTh3は第三類似度閾値である。
【0064】
第三後処理操作Op_posP3はさらに、第二類似度条件C2を満足したと決定した場合、第四画像ブロックと第三画像ブロックの目標標識を交換することを含む。図6(b)は第二類似度条件C2を満足した場合、目標標識交換後の更新された第一軌跡及び第二軌跡を示しており、そのうち、軌跡点A、Bは目標標識が交換されている。
【0065】
以下、方法100におけるクラスタリング処理Op_clusterについてさらに例示的に説明する。
【0066】
図7は本発明の1つの実施例に係るクラスタリング処理Op_clusterのための方法700の例示的なフローチャートである。クラスタリング処理Op_clusterは総ローカル目標軌跡集合GTJsの中のローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合GTJcmsを決定する。
【0067】
ステップS701では、ローカル目標軌跡集合GTJsの中の各カメラヘッド間軌跡対(ペア)の複数の対応するクロスカメラヘッド画像ブロック対の再認識特徴対に基づいて、該カメラヘッド間軌跡対の軌跡類似度を決定する。例えば、第一カメラヘッドCam[c1]により提供される画像シーケンスから得られるローカル目標軌跡が第一軌跡TJ[c1][j1]を含み、TJ[c1][j1]はK1個の画像ブロックに対応し、そのうち、任意の1つの画像ブロックは第一画像ブロックPatch[c1][j1][k1]と記され、第二カメラヘッドCam[c2]により提供される画像シーケンスから得られるローカル目標軌跡が第二軌跡TJ[c2][j2]を含み、TJ[c2][j2]はK2個の画像ブロックに対応し、そのうち、任意の1つの画像ブロックは第二画像ブロックPatch[c2][j2][k2]と記されるとし、この場合、K1個の第一画像ブロックとK2個の第二画像ブロックからなるK1*K2個のクロスカメラヘッド画像ブロック対の再認識特徴対(Freid[c1][j1][k1],Freid[c2][j2][k2])に基づいて、第一、第二軌跡からなるカメラヘッド間軌跡対(第一軌跡TJ[c1][j1],第二軌跡TJ[c2][j2])の軌跡類似度SimTbC(TJ[c1][j1],TJ[c2][j2])(“カメラヘッド間軌跡類似度”ともいう)を決定できる。
【0068】
1つの例において、画像ブロックの類似度の平均値を計算することで軌跡類似度を決定し、これは“平均計算操作Op_mean”と記される。軌跡類似度SimTbC(TJ[c1][j1],TJ[c2][j2])の決定は、ステップS7011において、該カメラヘッド間軌跡対の2つの対応する追跡タックレットの、クロスカメラヘッド画像ブロック対(Patch[c1][j1][k1],Patch[c2][j2][k2])としての追跡タックレット間画像ブロック対の再認識特徴対に基づいて、該追跡タックレット間画像ブロック対の画像ブロック類似度SimPbT(Patch[c1][j1][k1],Patch[c2][j2][k2])を計算し;及び、ステップS7013において、該カメラヘッド間軌跡対の2つの対応する追跡タックレットの複数の追跡タックレット間画像ブロック対の画像ブロック類似度のうち、前のn個の最大画像ブロック類似度の平均値を軌跡類似度SimTbC(TJ[c1][j1],TJ[c2][j2])として計算することを含む。nは整数であり、例えば、n=5である。例えば、画像ブロック類似度は2つの画像ブロックの再認識特徴のコサイン類似度であり得る。例えば、K1個の軌跡点を持つ第一軌跡TJ[c1][j1]及びK2個の軌跡点を持つ第二軌跡TJ[c2][j2]について、K1*K2個の画像ブロック類似度SimPbTを得ることができ、これらの画像ブロック類似度SimPbTのうち、前のn個の最大画像ブロック類似度の平均値を、第一軌跡及び第二軌跡からなる軌跡対の類似度SimTbCとしてとる。例示として、2つのカメラヘッドがあり、第一カメラヘッドの画像からJ1個の軌跡を取得し、第二カメラヘッドの画像からJ2個の軌跡を取得するとし、この場合、得られる軌跡類似度の数はJ1*J2である。
【0069】
ステップS703では、ローカル目標軌跡集合の中の複数のカメラヘッド間軌跡対の軌跡類似度に基づいて、ローカル目標軌跡集合の中の複数の目標軌跡に対してクラスタリングを行うことで、クラスタリング・マッチング・グローバル軌跡集合GTJcmsを決定する。1つの例において、Agglomerativeクラスタリングアルゴリズムを使用して、比較的低い閾値(0.5)の場合、ローカル目標軌跡集合における複数の目標軌跡に対してクラスタリングを行う。総ローカル目標軌跡集合LTJsにおける軌跡数と比較して、クラスタリング・マッチング・グローバル軌跡集合GTJcmsにおける軌跡数は減少し得る。
【0070】
以下、方法100における合併操作Op_mergeについてさらに例示的に説明する。
【0071】
クラスタリング・マッチング・グローバル軌跡集合GTJcmsの中の各軌跡を頂点として構築される有向グラフは“G(V、E)”と記され、vを用いて有向グラフの中の1つの頂点を表し、ei,jは頂点vと頂点vとの間の有向辺(エッジ)である。構築時に、先に、各対の頂点の間の有向辺のコストを無限大に初期化する。その後、軌跡対の端点に対応する時間に基づいて、対応する有向辺のコストを調整し、以下、軌跡TJaとTJbからなる軌跡対を例にして説明する。クラスタリング・マッチング・グローバル軌跡集合GTJcmsの中の第一軌跡TJa及び第二軌跡TJbについて、第二軌跡TJbの開始時間と第一軌跡TJaの終了時間との間の差がゼロよりも大きく、かつ所定時間閾値tTh(例えば、1秒)よりも小さい場合、第一軌跡TJa及び第二軌跡TJbと関連付けられる軌跡類似度コスト関数cost_reid、時間コスト関数cost_time及び空間距離コスト関数cost_spatialのうちの少なくとも1つに基づいて、第一軌跡TJa及び第二軌跡TJbと関連付けられる2つの頂点の間の有向辺のコストを調整する。
【0072】
式(8)に示すように、軌跡類似度コスト関数cost_reidは第一軌跡TJaと第二軌跡TJbとの軌跡類似度Sim(TJa,TJb)と関連付けられる。
【0073】
cost_reid=log(1-Sim(TJa,TJb)) (8)
軌跡類似度Sim(TJa,TJb)の決定方式はクラスタリング処理時に用いられる軌跡類似度の決定方式と同じであっても良い。軌跡TJa及びTJbの画像ブロックシーケンスからの再認識特徴Freid_a及びFreid_bの再認識特徴類似度をSim(TJa,TJb)として使用しても良く、そのうち、特徴Freid_a及びFreid_bはそれぞれ、第一軌跡TJa及び第二軌跡TJbの対応する画像ブロックシーケンスにおける、認識度が所定認識度閾値よりも高いキー画像ブロックの再認識特徴である。認識度はバウンディングボックスの信頼度、オーバーラップ率及び画像ブロックの相対高さ(画像ブロックの高さと画像の高さとの比率)のうちの少なくとも1つに基づいて決定されても良く、これによって、画像ブロックの認識度に基づいて対応する画像ブロックシーケンスのうちからキー画像ブロックを選択してSim(TJa,TJb)を計算できる。好ましくは、最高認識度を持つ画像ブロックを選択する。
【0074】
式(9)に示すように、時間コスト関数cost_timeは第二軌跡の開始時間と第一軌跡の終了時間との差diffTimeに関連付けられる。
【0075】
cost_time=log(|diffTime|) (9)
式(10)に示すように、空間距離コスト関数cost_spatialは第一軌跡の終了位置と第二軌跡の開始位置との間のワールド座標系での空間距離disSpatialに関連付けられる。
【0076】
cost_spatial=log(disSpatial) (10)
2つの頂点の間の有向辺のコストcostは上述の3種類のコストのうちの少なくとも2種類の加重和の総コストであっても良い。例えば、式(11)に示す総コストである。
【0077】
cost=αcost_reid+βcost_time+γcost_spatial (11)
ここで、α、β、γは加重係数(重み)であり、α+β+γ=1である。
【0078】
向グラフGにおける最小コスト経路を決定するために、最小コスト経路アルゴリズムを施すときに仮想開始点を有向グラフの1つの頂点として設定し、該頂点から他の任意の頂点までのコストを0に設定しても良い。
【0079】
bellman-fordアルゴリズムにより、コストグラフにおける単一ソースの最短経路問題を解決できる。該アルゴリズムでは、辺の重みは負の値であっても良く、該アルゴリズムは、重みを負にできないDijkstra最短経路アルゴリズムを改良したものである。本発明の1つの例では、bellman-fordアルゴリズムを使用して仮想頂点から他の頂点までの最小コスト経路を計算し、最小コスト経路におけるすべての軌跡頂点はマルチカメラヘッド・マルチターゲットの追跡結果である。最終的には最小コスト経路集合に基づいて、クラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することで、グローバル目標軌跡集合GTJsを得ることができる。
【0080】
図8は本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための方法800の例示的なフローチャートである。便宜のため、複数のカメラヘッドは第一カメラヘッドCam[1]及び第二カメラヘッドCam[2]であり、かつそれらの監視領域は隣接するが、オーバーラップしない。
【0081】
図8に示すように、カメラヘッドCam[1]は画像シーケンスSqIm[1]:Im[1][1]、…、Im[1][i1end]を提供し、カメラヘッドCam[2]は画像シーケンスSqIm[1]:Im[1][1]、…、Im[1][i1end]を提供する。
【0082】
それぞれ、画像シーケンスSqIm[1]及びSqIm[2]に対してシングルカメラヘッド・マルチターゲット追跡操作Op_mttを行うことで総ローカル目標軌跡集合LTJsを得ることができ、そのうち、操作Op_mttは目標検出操作Op_detB、再認識特徴抽出操作Op_extF、シングルカメラヘッド目標マッチング操作Op_matS及びローカル目標軌跡後処理操作Op_postPを含み得る。例示として、図8に示す総ローカル目標軌跡集合LTJsは第一カメラヘッドに対応するローカル目標軌跡集合TJs[1]及び第二カメラヘッドに対応するローカル目標軌跡集合TJs[2]からなり、トータルで9つの軌跡があり、そのうち、ローカル目標軌跡集合TJs[1]は4つの軌跡、即ち、TJ1,1、TJ1,2、TJ1,3、TJ1,4を含み、ローカル目標軌跡集合TJs[2]は5つの軌跡、即ち、TJ2,1、TJ2,2、TJ2,3、TJ2,4、TJ2,5を含む。図8ではさらに、黒丸で各軌跡の開始点及び終点を示している。また、図8ではさらに、再認識特徴抽出操作Op_extFによって決定される、第一カメラヘッドについての再認識特徴集Freids[1]、及び第二カメラヘッドについての再認識特徴集Freids[2]をも示している。再認識特徴集Freids[1]は各軌跡に対応する再認識特徴集{Freid[1][1][j1]}、{Freid[1][2][j2]}、{Freid[1][3][j3]}及び{Freid[1][4][j4]}を含み、再認識特徴集Freids[2]は各軌跡に対応する再認識特徴集{Freid[2][1][k1]}、{Freid[2][2][k2]}、{Freid[2][3][k3]}、{Freid[2][4][k4]}、{Freid[2][5][j5]}を含み、そのうち、便宜のため、集合記号“{}”には、代表的な要素を1つだけ示しており、全ての要素を示していない。
【0083】
再認識特徴に基づいて平均計算操作Op_meanを行うことで軌跡類似度SimTbCを決定できる。この例では、4*5個のカメラヘッド間軌跡類似度SimTbCを決定できる。
【0084】
決定された複数のカメラヘッド間軌跡類似度に基づいてクラスタリング処理Op_clusterを行うことでクラスタリング・マッチング・グローバル軌跡集合GTJcmsを決定できる。図8に示すように、この例では、クラスタリング処理によってLTJsにおける軌跡TJ1,2及びTJ2,1を1つの類型にクラスタリングすることで、この2つの軌跡を合併して軌跡集合GTJcmsにおける軌跡TJcを取得する。よって、軌跡集合GTJcmsの軌跡数は8である。なお、図8では、軌跡集合LTJsに対して、軌跡集合GTJcmsにおける軌跡は番号が付け直されており、それぞれ、TJc、TJc、TJc、TJc、TJc、TJc、TJc、TJcである。
【0085】
クラスタリング・マッチング・グローバル軌跡集合GTJcmsに対して最小コスト操作Op_cminpを行うことで最小コスト経路集合Pminsを決定する。
【0086】
クラスタリング・マッチング・グローバル軌跡集合GTJcmsに対して合併操作Op_mergeを行い、最小コスト経路集合Pminsに基づいてクラスタリング・マッチング・グローバル軌跡集合GTJcmsにおける対応する軌跡を合併することで軌跡集合GTJcmsを更新してグローバル目標軌跡集合GTJsとする。図8に示すように、この例では、最小コスト経路集合Pminsの中の、GTJcmsにおける軌跡TJcとTJcとを接続する最小コスト経路に基づいて、GTJcmsにおける軌跡TJcとTJcとを合併して新軌跡TJgとする。よって、軌跡集合GTJsの軌跡数は7である。なお、図8では、軌跡集合GTJcmsに対して、軌跡集合GTJsにおける軌跡は番号が付け直されており、それぞれ、TJg、TJg、TJg、TJg、TJg、TJg、TJgであり、軌跡集合GTJsにおける軌跡TJg、TJgは、2つの異なる目標が連続して2つのカメラヘッドの監視領域に出現し、2つのクロスカメラヘッド軌跡を形成していることを示す。
【0087】
また、本発明の1つの実施例では、マルチターゲット・マルチカメラヘッド追跡のための装置が提供される。以下、図9を参照しながら例示的な説明を行う。図9は本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための装置900の例示的なブロック図である。装置900はシングルカメラヘッド・マルチターゲット追跡ユニット901及びマルチカメラヘッド・マルチターゲット・マッチングユニット903を含む。シングルカメラヘッド・マルチターゲット追跡ユニット901は次のことを行うように構成され、即ち、複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定することである。マルチカメラヘッド・マルチターゲット・マッチングユニット903は次のことを行うように構成され、即ち、総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定することである。マルチカメラヘッド・マルチターゲット・マッチングユニット903は、クラスタリングユニット9031、最小コスト経路決定ユニット9033及び合併ユニット9035を含む。クラスタリングユニット9031は次のことを行うように構成され、即ち、総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定することである。最小コスト経路決定ユニット9033は次のことを行うように構成され、即ち、クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合を決定することである。合併ユニット9035は次のことを行うように構成され、即ち、最小コスト経路集合に基づいてクラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することである。装置900は方法100に対応する。装置900の更なる構成については上述の方法100についての説明を参照できる。
【0088】
また、本発明の1つの実施例では、もう1つのマルチターゲット・マルチカメラヘッド追跡のための装置が提供される。以下、図10を参照しながら例示的な説明を行う。図10は本発明の1つの実施例に係るマルチターゲット・マルチカメラヘッド追跡のための装置1000の例示的なブロック図である。装置1000は命令を記憶している記憶器1001、及び、記憶器1001に接続される少なくとも1つの処理器1003を含み、処理器1003は記憶器1001における命令を実行することで次のことを行うように構成され、即ち、複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び、総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定することであり、そのうち、グローバル目標軌跡集合の決定は、総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合を決定し;及び、最小コスト経路集合に基づいてクラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む。命令は方法100に対応する。装置1000の更なる構成については上述の方法100についての説明を参照できる。
【0089】
また、本発明の1つの側面では、プログラムを記憶しているコンピュータ可読記憶媒体が提供され、該プログラムはコンピュータにより実行されるときに次のことを行うことができ、即ち、複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び、総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで複数のカメラヘッドについてのグローバル目標軌跡集合を決定することであり、そのうち、グローバル目標軌跡集合の決定は、総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを施すことで最小コスト経路集合を決定し;及び、最小コスト経路集合に基づいてクラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することである。プログラムは方法100に対応する。プログラムの更なる構成については上述の方法100についての説明を参照できる。
【0090】
さらに、本発明の1つの側面では情報処理機器が提供される。
【0091】
図11は本発明の実施例における情報処理機器1100を示す図である。情報処理機器1100は、例えば、コンピュータシステムであっても良い。なお、情報処理機器1100は例示に過ぎず、本発明による方法及び装置の適用範囲又は機能について限定しない。また、情報処理機器1100は、上述の方法及び装置における任意のモジュールやアセンブリなど又はその組み合わせにも依存しない。
【0092】
図11では、中央処理装置(CPU)1101は、ROM1102に記憶されているプログラム又は記憶部1108からRAM1103にロッドされているプログラムに基づいて各種の処理を行う。RAM1103では、ニーズに応じて、CPU1101が各種の処理を行うときに必要なデータなどを記憶することもできる。CPU1101、ROM1102及びRAM1103は、バス1104を経由して互いに接続される。入力/出力インターフェース1105もバス1104に接続される。
【0093】
また、入力/出力インターフェース1105には、さらに、次のような部品が接続され、即ち、キーボードなどを含む入力部1106、液晶表す器(LCD)などのような表示器及びスピーカーなどを含む出力部1107、ハードディスクなどを含む記憶部1108、ネットワーク・インターフェース・カード、例えば、LANカード、モデムなどを含む通信部1109である。通信部1109は、例えば、インターネット、LANなどのネットワークを経由して通信処理を行う。ドライブ1110は、ニーズに応じて、入力/出力インターフェース1105に接続されても良い。取り外し可能な媒体1111、例えば、半導体メモリなどは、必要に応じて、ドライブ1110にセットされることにより、その中から読み取られたコンピュータプログラムを記憶部1108にインストールすることができる。
【0094】
また、本発明は、さらに、マシン可読命令コードを含むプログラムプロダクトを提供する。このような命令コードは、マシンにより読み取られて実行されるときに、上述の本発明の実施形態における方法を実行することができる。それ相応に、このようなプログラムプロダクトをキャリー(carry)する、例えば、磁気ディスク(フロッピーディスク(登録商標)を含む)、光ディスク(CD-ROM及びDVDを含む)、光磁気ディスク(MD(登録商標)を含む)、及び半導体記憶器などの各種記憶媒体も、本発明に含まれる。
【0095】
上述の記憶媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体記憶器などを含んでも良いが、これらに限定されない。
【0096】
また、上述の方法における各操作(処理)は、各種のマシン可読記憶媒体に記憶されているコンピュータ実行可能なプログラムの方式で実現することもできる。
【0097】
さらに、本発明の目的は次のような方式で実現されても良く、即ち、実行可能なプログラムコードを記憶している記憶媒体をシステム又は装置に直接又は間接的に提供し、該システム又は装置におけるコンピュータ又は中央処理ユニット(CPU)により上述のプログラムコードを読み取って実行する。このときに、該システム又は装置がプログラム実行可能な機能を有すれば、本発明の実施例はプログラムに限定されず、また、該プログラムは任意の形式のもの、例えば、オブジェクト指向プログラム、インタープリター実行のプログラム、OSに提供するスクリプトプログラムなどであっても良い。
【0098】
上述のようなマシン可読記憶媒体は、各種の記憶器及び記憶ユニット、半導体デバイス、磁気、光磁気ディスクなどの磁気ディスク装置、及び情報を格納するのに適した他の媒体が含まれるが、これらに限定されない。
【0099】
また、コンピュータはインターネット上の対応するウェブサイトに接続し、本発明によるコンピュータプログラムコードをダウンロードしてコンピュータにインストールした後に該プログラムを実行することで、本発明の技術案を実現することもできる。
【0100】
本発明の実施例では、シングルカメラヘッド・マルチターゲット追跡に外接矩形枠情報、動き情報及び再認識特徴を融合することで、シングルカメラヘッドの下でのマルチターゲット追跡パフォーマンスを最適化し、id切り替えを効果的に減少させることができる。マルチカメラヘッドマッチングでは、有向グラフに基づく最小コスト経路アルゴリズムを利用して軌跡類似度(再認識特徴類似度)、時間及び空間に基づいて目標マッチングを全体的に最適化することでパフォーマンスを向上させることができる。また、有向グラフに基づく最小コスト経路アルゴリズムを使用することで、オクルージョン、照明及び姿勢変化によるマルチカメラヘッド・マルチターゲット追跡への不利な影響を低減することもできる。
【0101】
本発明の方法、装置及び記憶媒体の有利な効果は、マルチカメラヘッド・マルチターゲット追跡の結果の正確さを向上させることができること、及び、標識切り替えを減少させることができることのうちの少なくとも1つを含む。
【0102】
また、以上の実施例などに関し、さらに以下のように付記として開示する。
【0103】
(付記1)
コンピュータが実行する、マルチターゲット・マルチカメラヘッド追跡のための方法であって、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
前記総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで前記複数のカメラヘッドについてのグローバル目標軌跡集合を決定することを含み、
そのうち、前記複数のカメラヘッドについての前記グローバル目標軌跡集合の決定は、
前記総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;
前記クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを適用することで最小コスト経路集合を決定し;及び
前記最小コスト経路集合に基づいて前記クラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む、方法。
【0104】
(付記2)
付記1に記載の方法であって、
前記総ローカル目標軌跡集合の決定は、前記複数のカメラヘッドのうちの各カメラヘッドについて、前のローカル目標軌跡集合及び前記対応する画像シーケンスにおける現在の画像に基づいて現在のローカル目標軌跡集合を決定することを含み、
現在のローカル軌跡集合の決定は、
目標検出ネットワークを使用して前記現在の画像中の所定類型の目標の検出バウンディングボックス及びバウンディングボックスの信頼度を決定し;及び
前記現在の画像中の各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新して前記現在のローカル目標軌跡集合とすることを含み、
そのうち、前記前の画像は前記前のローカル目標軌跡集合の対応する画像シーケンスにおける最末尾の画像である、方法。
【0105】
(付記3)
付記2に記載の方法であって、
前記現在の画像中の各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新することは、
前記検出バウンディングボックスのうち、バウンディングボックスの信頼度がバウンディングボックスの信頼度閾値よりも大きい、信頼できるバウンディングボックス、及び前記前のローカル目標軌跡集合の中の各検出済み目標軌跡に対して第一追跡マッチングを行うことで前記信頼できるバウンディングボックスの目標標識を決定し;
前記前のローカル目標軌跡集合における検出済み目標軌跡のうちの未マッチングの軌跡に対して、残りの検出バウンディングボックスのうちのものとの第二追跡マッチングを行うことで前記残りの検出バウンディングボックスの目標標識を決定し;及び
前記検出バウンディングボックスのうち、バウンディングボックスの信頼度が前記バウンディングボックスの信頼度閾値よりも大きく、かつ前記前のローカル目標軌跡集合の中の検出済み目標軌跡とマッチングしないバウンディングボックスについて、新しい目標標識を生成することを含む、方法。
【0106】
(付記4)
付記3に記載の方法であって、
以下の方式で前記第一追跡マッチング及び前記第二追跡マッチングのうちの少なくとも1つを行い、即ち、
前記前の画像中の検出バウンディングボックスに基づいて前記現在の画像についての予測バウンディングボックスを予測し;及び
前記現在の画像の検出バウンディングボックス及び前記予測バウンディングボックスと関連付けられる面積オーバーラップコスト関数及び頂点オーバーラップコスト関数に基づいて前記現在の画像中の検出バウンディングボックスの目標標識を決定する、方法。
【0107】
(付記5)
付記2に記載の方法であって、
現在のローカル軌跡集合の決定は、さらに、
前記現在のローカル軌跡集合に対して後処理を行うことで現在のローカル目標軌跡集合を更新することを含む、方法。
【0108】
(付記6)
付記5に記載の方法であって、
前記現在のローカル軌跡集合に対して後処理を行うことは、
前記現在のローカル目標軌跡集合における軌跡の移動特徴に基づいて、新しい軌跡を生成するかを決定することを含む、方法。
【0109】
(付記7)
付記6に記載の方法であって、
前記現在のローカル目標軌跡集合における軌跡の移動特徴に基づいて、新しい軌跡を生成するかを決定することは、
前記現在のローカル目標軌跡集合の中の1つの軌跡について、
該軌跡の現在の軌跡点の移動方向を決定し;
前記現在の軌跡点が前記移動方向において該現在の軌跡点の該軌跡上の前の軌跡点に対して移動する移動距離を決定し;及び
前記移動距離が所定距離閾値よりも大きく、前記現在の軌跡点の移動方向が前記前の軌跡点の移動方向とは逆であり、かつ前記現在の軌跡点の対応する画像ブロックの再認識特徴と、前記前の軌跡点の対応する画像ブロックの再認識特徴との類似度が第一類似度閾値よりも小さい場合、前記現在の軌跡点の対応する画像ブロックと関連付けられる新しい軌跡を生成することを含む、方法。
【0110】
(付記8)
付記7に記載の方法であって、
前記移動方向は正のX方向、負のX方向、正のY方向及び負のY方向のうちの1つであり、前記正のX方向は前記正のY方向に垂直である、方法。
【0111】
(付記9)
付記5に記載の方法であって、
前記現在のローカル軌跡集合に対して後処理を行うことは、
前記現在のローカル目標軌跡集合において新しい目標に対応する新しい軌跡点について、前記現在の画像において、該新しい軌跡点の対応するバウンディングボックスとのオーバーラップ度が最大のオーバーラップバウンディングボックスを決定し;
該対応するバウンディングボックス及び該オーバーラップバウンディングボックスについて、以下の第一類似度条件を満たすかを決定し、即ち、
Sim(Freid_x′t,Freid_xt′)-Sim(Freid_xt,Freid_xt′)>sTh2;及び
前記第一類似度条件を満たしたと決定している場合、該対応するバウンディングボックスと該オーバーラップバウンディングボックスの目標標識を交換することを含み、
そのうち、Sim(Freid_x′t,Freid_xt′)は該対応するバウンディングボックスに対応する目標標識の前記現在の画像内の画像ブロックの再認識特徴Freid_x′tと、該オーバーラップバウンディングボックスに対応する目標標識の前記前の画像内の画像ブロックの再認識特徴Freid_xt′との間の類似度であり、
Sim(Freid_xt,Freid_xt′)は該オーバーラップバウンディングボックスに対応する目標標識の前記現在の画像及び前記前の画像の中の画像ブロックの再認識特徴Freid_xtとFreid_xt′との間の類似度であり、
sTh2は第二類似度閾値である、方法。
【0112】
(付記10)
付記5に記載の方法であって、
前記現在のローカル軌跡集合に対して後処理を行うことは、
前記現在のローカル軌跡集合に、以下のオーバーラップ条件を満たす第一軌跡及び第二軌跡が存在するかを決定し、即ち、
前記第一軌跡の対応する画像ブロックシーケンス中の現在の時間tの前の時間t′における第一画像ブロックと、前記第二軌跡の対応する画像ブロックシーケンス中の前記時間t′における第二画像ブロックがオーバーラップしており、
前記第一軌跡の対応する画像ブロックシーケンス中の前記現在の時間tにおける第三画像ブロックと、前記第二軌跡の対応する画像ブロックシーケンス中の前記現在の時間tにおける第四画像ブロックがオーバーラップせず、及び
前記第一軌跡の対応する画像ブロックシーケンス中の前記時間t′よりも前の時間t′′における第五画像ブロックと、前記第二軌跡の対応する画像ブロックシーケンス中の前記時間t′′における第六画像ブロックがオーバーラップせず;
前記オーバーラップ条件を満たした前記第一軌跡及び前記第二軌跡について、以下の第二類似度条件を満たすかを決定し、即ち、
Sim(Freid_xt′′,Freid_x′t)+Sim(Freid_x′t′′,Freid_xt)-Sim(Freid_xt,Freid_xt′′)+Sim(Freid_x′t′′,Freid_x′t)>sTh3;及び
前記第二類似度条件を満たしたと決定している場合、前記第四画像ブロックと前記第三画像ブロックの目標標識を交換することを含み、
そのうち、Sim(Freid_xt′′,Freid_x′t)は前記第五画像ブロックの再認識特徴Freid_xt′′と前記第四画像ブロックの再認識特徴Freid_x′tとの間の類似度であり、
Sim(Freid_x′t′′,Freid_xt)は前記第六画像ブロックの再認識特徴Freid_x′t′′と前記第三画像ブロックの再認識特徴Freid_xtとの間の類似度であり、
Sim(Freid_xt,Freid_xt′′)は前記第五画像ブロックの再認識特徴Freid_xt′′と前記第三画像ブロックの再認識特徴Freid_xtとの間の類似度であり、
Sim(Freid_x′t′′,Freid_x′t)は前記第六画像ブロックの再認識特徴Freid_x′t′′と前記第四画像ブロックの再認識特徴Freid_x′tとの間の類似度であり、
sTh3は第三類似度閾値である、方法。
【0113】
(付記11)
付記1に記載の方法であって、
前記総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定することは、
前記ローカル目標軌跡集合における各カメラヘッド間軌跡対の複数の対応するクロスカメラヘッド画像ブロック対の再認識特徴対に基づいて、該カメラヘッド間軌跡対の軌跡類似度を決定し;及び
前記ローカル目標軌跡集合における複数のカメラヘッド間軌跡対の軌跡類似度に基づいて、前記ローカル目標軌跡集合における複数の目標軌跡に対してクラスタリングを行うことで前記クラスタリング・マッチング・グローバル軌跡集合を決定することを含む、方法。
【0114】
(付記12)
付記11に記載の方法であって、
該カメラヘッド間軌跡対の軌跡類似度は該カメラヘッド間軌跡対の2つの対応する追跡タックレットの複数の追跡タックレット間画像ブロック対の画像ブロック類似度のうちの前のn個の最大画像ブロック類似度の平均値である、方法。
【0115】
(付記13)
付記12に記載の方法であって、
前記2つの対応する追跡タックレットの、クロスカメラヘッド画像ブロック対としての追跡タックレット間画像ブロック対の再認識特徴対に基づいて、前記追跡タックレット間画像ブロック対の画像ブロック類似度を決定する、方法。
【0116】
(付記14)
付記1に記載の方法であって、
以下の方式で前記有向グラフを構築し、即ち、
各対の頂点間の有向辺のコストを無限大に初期化し;及び
前記クラスタリング・マッチング・グローバル軌跡集合における第一軌跡及び第二軌跡について、前記第二軌跡の開始時間と前記第一軌跡の終了時間との間の差がゼロよりも大きく、かつ所定時間閾値よりも小さい場合、前記第一軌跡及び前記第二軌跡と関連付けられる軌跡類似度コスト関数、時間コスト関数及び空間距離コスト関数のうちの少なくとも1つに基づいて、前記第一軌跡及び前記第二軌跡と関連付けられる2つの頂点間の有向辺のコストを調整することを含み、
そのうち、前記軌跡類似度コスト関数は前記第一軌跡と前記第二軌跡との軌跡類似度に関連付けられ、
前記時間コスト関数は前記第二軌跡の開始時間と前記第一軌跡の終了時間との差に関連付けられ、
前記空間距離コスト関数は前記第一軌跡の終了位置と前記第二軌跡の開始位置との間のワールド座標系での空間距離に関連付けられる、方法。
【0117】
(付記15)
マルチターゲット・マルチカメラヘッド追跡のための装置であって、
命令を記憶している記憶器;及び
前記記憶器に接続される少なくとも1つの処理器を含み、
前記処理器は前記命令を実行して以下のことを実行するように構成され、即ち、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
前記総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで前記複数のカメラヘッドについてのグローバル目標軌跡集合を決定することであり、
そのうち、前記複数のカメラヘッドについての前記グローバル目標軌跡集合の決定は、
前記総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し;
前記クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを適用することで最小コスト経路集合を決定し;及び
前記最小コスト経路集合に基づいて前記クラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することを含む、装置。
【0118】
(付記16)
付記15に記載の装置であって、
前記総ローカル目標軌跡集合の決定は、前記複数のカメラヘッドのうちの各カメラヘッドについて、前のローカル目標軌跡集合及び前記対応する画像シーケンスにおける現在の画像に基づいて現在のローカル目標軌跡集合を決定することを含み、
現在のローカル軌跡集合の決定は、
目標検出ネットワークを使用して前記現在の画像中の所定類型の目標の検出バウンディングボックス及びバウンディングボックスの信頼度を決定し;及び
前記現在の画像中の各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新して前記現在のローカル目標軌跡集合とすることを含み、
そのうち、前記前の画像は前記前のローカル目標軌跡集合の対応する画像シーケンスにおける最末尾の画像である、装置。
【0119】
(付記17)
付記17に記載の装置であって、
前記現在の画像中の各検出バウンディングボックス、各バウンディングボックスの信頼度及び前の画像に基づいてシングルカメラヘッド目標マッチングを行うことで前記前のローカル目標軌跡集合を更新することは、
前記検出バウンディングボックスのうち、バウンディングボックスの信頼度がバウンディングボックスの信頼度閾値よりも大きい、信頼できるバウンディングボックス、及び前記前のローカル目標軌跡集合の中の各検出済み目標軌跡に対して第一追跡マッチングを行うことで前記信頼できるバウンディングボックスの目標標識を決定し;
前記前のローカル目標軌跡集合における検出済み目標軌跡のうちの未マッチングの軌跡に対して、残りの検出バウンディングボックスのうちのものとの第二追跡マッチングを行うことで前記残りの検出バウンディングボックスの目標標識を決定し;及び
記検出バウンディングボックスのうち、バウンディングボックスの信頼度が前記バウンディングボックスの信頼度閾値よりも大きく、かつ前記前のローカル目標軌跡集合の中の検出済み目標軌跡とマッチングしないバウンディングボックスについて、新しい目標標識を生成することを含む、装置。
【0120】
(付記18)
付記17に記載の装置であって、
以下の方式で前記第一追跡マッチング及び前記第二追跡マッチングのうちの少なくとも1つを行い、即ち、
前記前の画像中の検出バウンディングボックスに基づいて前記現在の画像についての予測バウンディングボックスを予測し;及び
前記現在の画像の検出バウンディングボックス及び前記予測バウンディングボックスと関連付けられる面積オーバーラップコスト関数及び頂点オーバーラップコスト関数に基づいて前記現在の画像中の検出バウンディングボックスの目標標識を決定する、装置。
【0121】
(付記19)
付記16に記載の装置であって、
現在のローカル軌跡集合の決定は、さらに、
前記現在のローカル軌跡集合に対して後処理を行うことで現在のローカル目標軌跡集合を更新することを含む、装置。
【0122】
(付記20)
プログラムを記憶しているコンピュータ可読記憶媒体であって、
前記プログラムはコンピュータにより実行されるときに、前記コンピュータに、以下のことを実行させ、即ち、
複数のカメラヘッドのうちの各カメラヘッドにより提供される、対応する画像シーケンスに対してシングルカメラヘッド・マルチターゲット追跡を行うことで各カメラヘッドのローカル目標軌跡集合を含む総ローカル目標軌跡集合を決定し;及び
前記総ローカル目標軌跡集合に対してマルチカメラヘッド・マルチターゲット・マッチングを行うことで前記複数のカメラヘッドについてのグローバル目標軌跡集合を決定することであり、
そのうち、前記複数のカメラヘッドについての前記グローバル目標軌跡集合の決定は、
前記総ローカル目標軌跡集合におけるローカル目標軌跡に対してクラスタリングを行うことでクラスタリング・マッチング・グローバル軌跡集合を決定し、
前記クラスタリング・マッチング・グローバル軌跡集合における各軌跡を頂点として構築される有向グラフに対して最小コスト経路アルゴリズムを適用することで最小コスト経路集合を決定し、
前記最小コスト経路集合に基づいて前記クラスタリング・マッチング・グローバル軌跡集合の中の対応する軌跡を合併することである、記憶媒体。
【0123】
以上、本発明の好ましい実施形態を説明したが、本発明はこの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は、本発明の技術的範囲に属する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11