(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-31
(45)【発行日】2023-08-08
(54)【発明の名称】画像追跡装置、画像追跡方法、及びプログラム
(51)【国際特許分類】
G06T 7/246 20170101AFI20230801BHJP
H04N 7/18 20060101ALI20230801BHJP
【FI】
G06T7/246
H04N7/18 G
H04N7/18 D
(21)【出願番号】P 2022510041
(86)(22)【出願日】2021-03-18
(86)【国際出願番号】 JP2021011080
(87)【国際公開番号】W WO2021193353
(87)【国際公開日】2021-09-30
【審査請求日】2022-09-20
(31)【優先権主張番号】P 2020054679
(32)【優先日】2020-03-25
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】110002044
【氏名又は名称】弁理士法人ブライタス
(72)【発明者】
【氏名】石寺 永記
【審査官】千葉 久博
(56)【参考文献】
【文献】特開2019-17867(JP,A)
【文献】特開2014-13432(JP,A)
【文献】特開2012-203422(JP,A)
【文献】特開2006-202135(JP,A)
【文献】特開2002-14816(JP,A)
【文献】国際公開第2018/179092(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/246
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得手段と、
前記画像データ毎に、物体を検出する、物体検出手段と、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算手段と、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定手段と、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡手段と、
を備えている、ことを特徴とする画像追跡装置。
【請求項2】
請求項1に記載の画像追跡装置であって、
前記同一性判定手段が、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す指標を算出し、更に、算出した指標の値が閾値以上であるペアを選択し、そして、選択した前記ペアを構成する、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体とを、同一であると判定する、
ことを特徴とする画像追跡装置。
【請求項3】
請求項2に記載の画像追跡装置であって、
前記同一性判定手段が、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す前記指標として、フィッシャー比を算出する、
ことを特徴とする画像追跡装置。
【請求項4】
カメラから時系列に沿ってフレーム単位で出力される画像データを取得し、
前記画像データ毎に、物体を検出し、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求め、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定し、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、
ことを特徴とする画像追跡方法。
【請求項5】
請求項4に記載の画像追跡方法であって、
前記同一性の判定において、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す指標を算出し、更に、算出した指標の値が閾値以上であるペアを選択し、そして、選択した前記ペアを構成する、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体とを、同一であると判定する、
ことを特徴とする画像追跡方法。
【請求項6】
請求項5に記載の画像追跡方法であって、
前記同一性の判定において、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す前記指標として、フィッシャー比を算出する、
ことを特徴とする画像追跡方法。
【請求項7】
コンピュータに、
カメラから時系列に沿ってフレーム単位で出力される画像データを取得させ、
前記画像データ毎に、物体を検出させ、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定させ、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求めさせ、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定させ、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行わせる、
プログラ
ム。
【請求項8】
請求項7に記載の
プログラムであって、
前記同一性の判定において、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す指標を算出させ、更に、算出した指標の値が閾値以上であるペアを選択させ、そして、選択した前記ペアを構成する、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体とを、同一であると判定させる、
ことを特徴とする
プログラム。
【請求項9】
請求項8に記載の
プログラムであって、
前記同一性の判定において、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す前記指標として、フィッシャー比を算出させる、
ことを特徴とする
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カメラからの映像上で人物等の物体を追跡する、画像追跡装置、及び画像追跡方法に関し、更には、これらを実現するためのプログラムに関する。
【背景技術】
【0002】
近年、監視システムには、監視カメラからの映像上で特定の人物を追跡する機能が付加されている。例えば、特許文献1は、このような人物追跡機能が付加された監視システムを開示している。特許文献1に開示された監視システムは、監視カメラから時系列に沿って出力されるフレーム毎に、人物と予想される領域の特徴量を抽出し、連続するフレーム間で、抽出した特徴量の同一性を判断することによって、追跡対象となっている人物を追跡する。特許文献1に開示された監視システムによれば、特定の人物の行動を監視できるため、管理者は容易に不審者を特定することができる。
【0003】
また、非特許文献1は、予め学習したニューラルネットワークを用いて、特定の人物を追跡する監視システムを開示している。非特許文献1に開示された監視システムでは、人物の画像が学習データとして用いられて、ニューラルネットワークの学習が行われる。このため、非特許文献1に開示された監視システムを用いれば、特許文献1に開示された監視システムに比べて、より追跡精度を高めることができると考えられる。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【文献】Zhedong Zheng, Xiaodong Yang, Zhiding Yu, Liang Zheng, Yi Yang, Jan Kautz1, ” Joint Discriminative and Generative Learning for Person Re-identification”, 22 May 2019, CVPR2019
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、監視システムに用いる監視カメラでは、一般に、フレームレートを上げることが難しく、フレームレートは3fps~5fps程度に設定される。これは、フレームレートを上げると、送信する画像データのサイズが大きくなり、通信回線の許容量を超えてしまうからである。このため、監視システムは、フレームレートが低い状況下で、人物追跡を行う必要がある。
【0007】
しかしながら、このようなフレームレートが低い状況下では、フレーム間における人物の移動距離が大きくなってしまうため、特許文献1に開示された監視システムでは、追跡精度が低下するという問題が発生する。一方、非特許文献1に開示された監視システムでは、特許文献1に開示された監視システムに比べて、追跡精度の低下は抑制されると考えられるが、この監視システムには、予め大量の学習データを用いて機械学習していない人物を追跡できないという問題がある。
【0008】
本発明の目的の一例は、上記問題を解消し、学習データを用いた事前の機械学習を必要とせず、且つ、フレームレートに影響されることなく、カメラからの映像上で物体を追跡し得る、画像追跡装置、画像追跡方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明の一側面における画像追跡装置は、
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得部と、
前記画像データ毎に、物体を検出する、物体検出部と、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算部と、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定部と、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡部と、
を備えている、ことを特徴とする。
【0010】
また、上記目的を達成するため、本発明の一側面における画像追跡方法は、
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得ステップと、
前記画像データ毎に、物体を検出する、物体検出ステップと、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算ステップと、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定ステップと、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡ステップと、
を有する、ことを特徴とする。
【0011】
更に、上記目的を達成するため、本発明の一側面におけるプログラムは、
コンピュータに、
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得ステップと、
前記画像データ毎に、物体を検出する、物体検出ステップと、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算ステップと、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定ステップと、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡ステップと、
を実行させる、プログラム。
【発明の効果】
【0012】
以上のように本発明によれば、学習データを用いた事前の機械学習を必要とせず、且つ、フレームレートに影響されることなく、カメラからの映像上で物体を追跡することができる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、本発明の実施の形態における画像追跡装置の概略構成を示す構成図である。
【
図2】
図2は、本発明の実施の形態における画像追跡装置の構成を具体的に示す構成図である。
【
図3】
図3は、実施の形態において取得された画像データの一例と実施の形態において設定されたペアの一例とを示す図である。
【
図4】
図4は、本発明の実施の形態における画像追跡装置の動作を示すフロー図である。
【
図5】
図5は、本発明の実施の形態における画像追跡装置を実現するコンピュータの一例を示すブロック図である。
【発明を実施するための形態】
【0014】
(実施の形態)
以下、実施の形態における、画像追跡装置、画像追跡方法、及びプログラムについて、
図1~
図5を参照しながら説明する。
【0015】
[装置構成]
最初に、実施の形態における画像追跡装置の概略構成について
図1を用いて説明する。
図1は、本発明の実施の形態における画像追跡装置の概略構成を示す構成図である。
【0016】
図1に示す実施の形態における画像追跡装置100は、カメラからの映像上で人物等の物体を追跡する装置である。
図1に示すように、画像追跡装置100は、画像データ取得部101と、物体検出部102と、分散計算部103と、同一性判定部104と、物体追跡部105とを備えている。
【0017】
この構成において、画像データ取得部101は、カメラから時系列に沿ってフレーム単位で出力される画像データを取得する。物体検出部102は、画像データ毎に、物体を検出する。
【0018】
分散計算部103は、まず、画像データ毎に、その画像データで検出された物体それぞれについて、その物体とその画像データの直後に出力された画像データで検出された、いずれかの物体とのペアを設定する。続いて、分散計算部103は、画像データ毎に、各ペアについて、特徴空間における、そのペアをクラスとする第1のクラス内分散と、そのペア以外の物体をクラスとする第2のクラス内分散と、クラス間分散とを求める。
【0019】
同一性判定部104は、各ペアについて求められた、第1のクラス内分散、第2のクラス内分散、及びクラス間分散を用いて、各画像データにおいて検出された物体と、その画像データの直後に出力された画像データにおいて検出された物体と、の同一性を判定する。物体追跡部105は、同一性の判定結果に基づいて、検出された物体の追跡処理を行う。
【0020】
このように、実施の形態では、連続するフレーム間毎に、クラス内分散によって物体の同一性が判定される。このため、実施の形態によれば、フレームレートに影響されることなく、カメラからの映像上で物体を精度よく追跡できる。また、実施の形態では、物体を追跡するに際して、学習データを用いた事前の機械学習の必要性はない。
【0021】
続いて、
図2及び
図3を用いて、実施の形態における画像追跡装置100の構成及び機能について具体的に説明する。
図2は、本発明の実施の形態における画像追跡装置の構成を具体的に示す構成図である。
図3は、実施の形態において取得された画像データの一例と実施の形態において設定されたペアの一例とを示す図である。
【0022】
図2に示すように、実施の形態では、画像追跡装置100は、カメラ200及び表示装置201に接続されており、画像監視システムとして機能している。更に、
図2に示すように、画像追跡装置100は、上述した、画像データ取得部101、物体検出部102、分散計算部103、同一性判定部104、及び物体追跡部105に加えて、画像格納部106と監視部107とを更に備えている。
【0023】
カメラ200は、監視カメラであり、監視エリアを撮影して得られた画像データを、時系列にそってフレーム単位で出力する。カメラ200から出力された画像データは、画像格納部106に格納される。
【0024】
図3の例では、時系列にそってフレーム単位で出力された画像データ10と画像データ20とが示されている。各画像データは、監視エリアの画像データである。
図3において矢印は時系列を示しており、各画像データは、カメラ200から、画像データ10、画像データ20の順に出力されている。
【0025】
画像データ取得部101は、実施の形態では、画像格納部106から、一度に処理する設定期間分の画像データを時系列の順に取得する。
図2の例では、画像データ取得部101は、画像格納部106から、画像データ10及び画像データ20を順に取得する。
【0026】
物体検出部102は、実施の形態では、カメラ200から出力された各画像データの画像を走査して、人を示す特徴量を持った領域を特定し、特定した領域を物体(人)として検出する。具体的には、物体検出部102は、YOLO、SSDといった既存の物体検出アルゴリズムを用いて、物体である人を検出する。人を表す特徴量としては、例えば、人が映った画像を教師データとした機械学習を行うことによって得られたdeep featureが挙げられる。その他、具体的な特徴量としては、HoG(Histograms of Oriented Gradients)特徴量、色ヒストグラム等も挙げられる。
【0027】
図3の例では、物体検出部102は、画像データ10から、物体11、12、及び13を検出し、画像データ20から、物体21、22、23、及び24を検出している。
【0028】
分散計算部103は、
図3の例では、例えば、画像データ10については、物体11、物体12、及び物体13それぞれ毎に、次のフレームの画像データ20で検出された、物体21~24のいずれかとペアを設定する。具体的には、分散計算部103は、例えば、画像データ10の物体11については、以下のペアを設定する。このようにして設定されたペアは、同一の物体であるという仮説を示している。
(物体11、物体21)
(物体11、物体22)
(物体11、物体23)
(物体11,物体24)
【0029】
続いて、分散計算部103は、物体検出に用いられた特徴量の次元の数Nに応じて、N次元の特徴空間を設定する(N:任意の自然数)。
図3の例では、上述した物体11と、物体21~24のいずれかと、を組み合わせたペアのクラス、更には、ペア以外の物体のクラスが、特徴空間において示されている。
【0030】
そして、分散計算部103は、特徴空間において、各物体の特徴量を用いて、ペア毎に、ペアの物体を同じクラスとする第1のクラス内分散と、ペアを構成しない物体を同じクラスとする第2のクラス内分散とを求める。また、分散計算部103は、ペア毎に、求めた第1のクラス内分散と第2のクラス内分散とから、クラス間分散も求める。
【0031】
具体的には、クラスwiに属するパターン(物体の特徴量)の集合をXiとし、Xiに含まれるパターン数をni、平均ベクトルをmi、全パターン数をn、全パターンの平均ベクトルをmとする。また、ペアの物体のクラスをi=1、ペア以外の物体のクラスをi=2とする。この場合、ある画像データの1つの物体についての、第1のクラス内分散σ2
w1、第2のクラス内分散をσ2
w2、クラス間分散σ2
Bは下記の数1~数3によって算出される。
【0032】
【0033】
【0034】
【0035】
同一性判定部104は、実施の形態では、まず、画像データ毎に、その画像データで検出された物体それぞれについて、第1のクラス内分散、第2のクラス内分散、及びクラス間分散を用いて、その物体を含む各ペアにおける同一性を示す指標を算出する。実施の形態において、同一性を示す指標としては、フィッシャー比Jσが挙げられる。ある画像データの1つの物体についてのフィッシャー比Jσは、下記の数4によって算出される。
【0036】
【0037】
続いて、同一性判定部104は、画像データ毎に、算出したフィッシャー比の値が閾値以上であるペアを選択し、そして、選択したペアを構成する、その画像データにおいて検出された物体と、その画像データの直後に出力された画像データにおいて検出された物体とを、同一であると判定する。
【0038】
物体追跡部105は、実施の形態では、同一性判定部104によって同一であると判定されたペア、具体的には、フィッシャー比の値が閾値以上となるペアにおいて、後のフレームの物体を追跡対象とし、追跡対象となった各物体にフラグを設定する。また、物体追跡部105は、フィッシャー比が閾値以上となるペアが複数存在する場合は、フィッシャー比が最も高いペアを追跡対象とする。
【0039】
図3の例では、物体追跡部105は、画像データ10で検出された物体11と画像データ20で検出された物体21とのペアを追跡対象としている。また、物体追跡部105は、フィッシャー比が閾値未満のペアを構成する物体については、新たにカメラ200のフレーム内に侵入していると判定することができる。
【0040】
監視部107は、画像格納部106に格納されている画像データを時系列に沿って取り出して、表示装置201の表示画面に表示させる。また、物体追跡部105によって追跡対象となった物体については、表示画面上で、追跡されていることを示す映像表現、例えば、記号の付加、枠の表示、色の変更等を行う。また、監視部107は、追跡対象となった物体が、特定のエリアに侵入した場合に、警報を出力することもできる。
【0041】
[装置動作]
次に、実施の形態における画像追跡装置100の動作について
図4を用いて説明する。
図4は、本発明の実施の形態における画像追跡装置の動作を示すフロー図である。以下の説明においては、適宜
図1~
図3を参照する。また、実施の形態では、画像追跡装置100を動作させることによって、画像追跡方法が実施される。よって、実施の形態における画像追跡方法の説明は、以下の画像追跡装置100の動作説明に代える。
【0042】
図4に示すように、最初に、画像データ取得部101は、画像格納部106に格納されている設定期間分の画像データを取得する(ステップA1)。設定期間は、例えば、5秒~10秒等に設定される。
【0043】
次に、物体検出部102は、ステップA1で取得された画像データ毎に、画像上において人を示す特徴量を持った領域を特定し、特定した領域を物体(人)として検出する(ステップA2)。
【0044】
次に、分散計算部103は、ステップA1で取得された画像データであって、当該ステップA3において未だ選択されていない画像データの中から、カメラで出力された時刻が最も古い画像データを選択する(ステップA3)。
【0045】
次に、分散計算部103は、ステップA3で選択した画像データにおいて、ステップA2で検出された物体毎に、次のフレームの画像データで検出された物体それぞれとの間でペアを設定する(ステップA4)。
【0046】
次に、分散計算部103は、ステップA4で設定されたペアの1つを選択する(ステップA5)。そして、分散計算部103は、各物体の特徴量を用いて、ステップA5で選択したペアについて、第1のクラス内分散と、第2のクラス内分散と、クラス間分散とを計算する(ステップA6)。
【0047】
次に、分散計算部103は、未だ選択していないペアが存在するかどうかを判定する(ステップA7)。ステップA7の判定の結果、未だ選択していないペアが存在する場合は、分散計算部103は、再度、ステップA5を実行する。
【0048】
一方、ステップA7の判定の結果、未だ選択していないペアが存在していない場合は、同一性判定部104が、各ペアについて、ステップA6で計算した、第1のクラス内分散と、第2のクラス内分散と、クラス間分散とを用いて、同一性を示す指標を算出する。そして、同一性判定部104は、各ペアについて、同一性を判定する(ステップA8)。
【0049】
次に、同一性判定部104は、ステップA1で取得された画像データのうち、未だステップA3にて選択されていない画像データが存在しているかどうかを判定する(ステップA9)。
【0050】
ステップA9の判定の結果、ステップA1で取得された画像データのうち、未だステップA3にて選択されていない画像データが存在している場合は、分散計算部103が、再度ステップA3を実行する。
【0051】
一方、ステップA9の判定の結果、ステップA1で取得された画像データのうち、未だステップA3にて選択されていない画像データが存在していない場合は、物体追跡部105は、ステップA8で同一性が高いと判定されたペアにおいて、後のフレームの物体を追跡対象に設定する(ステップA10)。
【0052】
次に、監視部107は、画像格納部106に格納されている画像データを時系列に沿って取り出して、表示装置201の表示画面に表示させると共に、ステップA9で追跡対象となった物体に対して、追跡されていることを示す映像表現を行う(ステップA11)。
【0053】
上述のステップA1~A11は、監視エリアの監視が行われる限り、繰り返し実行される。
【0054】
[実施の形態における効果]
以上のように実施の形態では、連続するフレーム間毎に、クラス内分散によって、物体の同一性が判定される。このため、実施の形態によれば、フレームレート低下した場合であっても、追跡精度の低下を抑制でき、更に、予め大量の学習データを用いて機械学習していない物体に対する追跡も可能となる。
【0055】
[プログラム]
実施の形態におけるプログラムは、コンピュータに、
図4に示すステップA1~A11を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態における画像追跡装置100と画像追跡方法とを実現することができる。この場合、コンピュータのプロセッサは、画像データ取得部101、物体検出部102、分散計算部103、同一性判定部104、物体追跡部105、及び監視部107として機能し、処理を行なう。
【0056】
また、実施の形態では、画像格納部106は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現されていても良いし、別のコンピュータの記憶装置によって実現されていても良い。
【0057】
また、コンピュータとしては、汎用のPCの他に、スマートフォン、タブレット型端末装置が挙げられる。更に、監視カメラ等のカメラに内蔵されたコンピュータであっても良い。
【0058】
また、実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、画像データ取得部101、物体検出部102、分散計算部103、同一性判定部104、物体追跡部105、及び監視部107のいずれかとして機能しても良い。
【0059】
[物理構成]
ここで、実施の形態におけるプログラムを実行することによって、画像追跡装置100を実現するコンピュータについて
図5を用いて説明する。
図5は、本発明の実施の形態における画像追跡装置を実現するコンピュータの一例を示すブロック図である。
【0060】
図5に示すように、コンピュータ110は、CPU(Central Processing Unit)111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。
【0061】
また、コンピュータ110は、CPU111に加えて、又はCPU111に代えて、GPU(Graphics Processing Unit)、又はFPGA(Field-Programmable Gate Array)を備えていても良い。この態様では、GPU又はFPGAが、実施の形態におけるプログラムを実行することができる。
【0062】
CPU111は、記憶装置113に格納された、コード群で構成された実施の形態におけるプログラムをメインメモリ112に展開し、各コードを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。
【0063】
また、実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
【0064】
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
【0065】
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
【0066】
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記録媒体、又はCD-ROM(Compact Disk Read Only Memory)などの光学記録媒体が挙げられる。
【0067】
なお、本実施の形態における画像追跡装置100は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、画像追跡装置100は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
【0068】
上述した実施の形態の一部又は全部は、以下に記載する(付記1)~(付記9)によって表現することができるが、以下の記載に限定されるものではない。
【0069】
(付記1)
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得部と、
前記画像データ毎に、物体を検出する、物体検出部と、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算部と、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定部と、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡部と、
を備えている、ことを特徴とする画像追跡装置。
【0070】
(付記2)
付記1に記載の画像追跡装置であって、
前記同一性判定部が、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す指標を算出し、更に、算出した指標の値が閾値以上であるペアを選択し、そして、選択した前記ペアを構成する、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体とを、同一であると判定する、
ことを特徴とする画像追跡装置。
【0071】
(付記3)
付記2に記載の画像追跡装置であって、
前記同一性判定部が、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す前記指標として、フィッシャー比を算出する、
ことを特徴とする画像追跡装置。
【0072】
(付記4)
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得ステップと、
前記画像データ毎に、物体を検出する、物体検出ステップと、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算ステップと、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定ステップと、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡ステップと、
を有する、ことを特徴とする画像追跡方法。
【0073】
(付記5)
付記4に記載の画像追跡方法であって、
前記同一性判定ステップにおいて、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す指標を算出し、更に、算出した指標の値が閾値以上であるペアを選択し、そして、選択した前記ペアを構成する、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体とを、同一であると判定する、
ことを特徴とする画像追跡方法。
【0074】
(付記6)
付記5に記載の画像追跡方法であって、
前記同一性判定ステップにおいて、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す前記指標として、フィッシャー比を算出する、
ことを特徴とする画像追跡方法。
【0075】
(付記7)
コンピュータに、
カメラから時系列に沿ってフレーム単位で出力される画像データを取得する、画像データ取得ステップと、
前記画像データ毎に、物体を検出する、物体検出ステップと、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、当該物体と当該画像データの直後に出力された前記画像データで検出されたいずれかの前記物体とのペアを設定し、各ペアについて、特徴空間における、当該ペアをクラスとする第1のクラス内分散と、当該ペア以外の前記物体をクラスとする第2のクラス内分散と、クラス間分散とを求める、分散計算ステップと、
前記各ペアについて求められた、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体と、の同一性を判定する、同一性判定ステップと、
前記同一性の判定結果に基づいて、検出された前記物体の追跡処理を行う、物体追跡ステップと、
を実行させる、プログラム。
【0076】
(付記8)
付記7に記載のプログラムであって、
前記同一性判定ステップにおいて、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す指標を算出し、更に、算出した指標の値が閾値以上であるペアを選択し、そして、選択した前記ペアを構成する、当該画像データにおいて検出された前記物体と、当該画像データの直後に出力された前記画像データにおいて検出された前記物体とを、同一であると判定する、
ことを特徴とするプログラム。
【0077】
(付記9)
付記8に記載のプログラムであって、
前記同一性判定ステップにおいて、
前記画像データ毎に、当該画像データで検出された前記物体それぞれについて、前記第1のクラス内分散、前記第2のクラス内分散、及び前記クラス間分散を用いて、当該物体を含む各ペアにおける同一性を示す前記指標として、フィッシャー比を算出する、
ことを特徴とするプログラム。
【0078】
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0079】
この出願は、2020年3月25日に出願された日本出願特願2020-54679を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【産業上の利用可能性】
【0080】
以上のように本発明によれば、学習データを用いた事前の機械学習を必要とせず、且つ、フレームレートに影響されることなく、カメラからの映像上で物体を追跡することができる。本発明は、監視カメラの映像に基づいて人の侵入等を監視する監視システムに有用である。
【符号の説明】
【0081】
10 画像データ
11、12、13 物体
20 画像データ
21、22、23、24 物体
100 画像追跡装置
101 画像データ取得部
102 物体検出部
103 分散計算部
104 同一性判定部
105 物体追跡部
106 画像格納部
107 監視部
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
200 カメラ
201 表示装置