【文献】
菅谷 保之、外2名,“複数運動ビデオデータベースHopkins155の誤追除去”,情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM),日本,情報処理学会,2013年 5月23日,Vol.2013-CVIM-187, No.2,pp.1-8
【文献】
須藤 智、外4名,動画像処理によるロボカップのシーン解析 Scene Analysis of Robocup Game by using image Processing,AI Challenge 研究会(第10回),日本,社団法人人工知能学会,2000年 6月24日,pp.36-41
【文献】
北澤 仁志、小野澤 晃,“移動物体の軌跡に基づく最小数のキーフレーム選択手法”,情報処理学会論文誌,日本,社団法人情報処理学会,2004年 3月15日,Vol.45, No.3,pp.942-950
(58)【調査した分野】(Int.Cl.,DB名)
映像データを構成する複数のフレームの連続する一部のフレームを時間窓フレームとして、隣り合う時間窓フレームに1つ以上のフレームが重複して含まれるように、前記映像データから複数の時間窓フレームを抽出する抽出部と、
前記抽出部によって抽出された各時間窓フレームを対象として、対象の時間窓フレームに対して対象物の追跡を行い、追跡結果を生成する追跡部と、
前記追跡部によって前記各時間窓フレームを対象として生成された各追跡結果を、他の時間窓フレームと重複して含まれるフレームに基づき統合して、統合結果を生成する統合部と
を備える追跡装置。
前記統合部は、前記各追跡結果が示す同一の対応関係の数を投票数として、前記投票数が多い対応関係を優先的に採用することにより、前記複数のフレームに含まれる各フレーム間における前記対象物の対応関係を特定する
請求項2に記載の追跡装置。
前記統合部は、前記各追跡結果が示す同一の対応関係の数を投票数として、その対応関係が選択される可能性がある回数で前記投票数を除した得票率が高い対応関係を優先して採用することにより、前記複数のフレームに含まれる各フレーム間における前記対象物の対応関係を特定する
請求項2に記載の追跡装置。
前記追跡部は、前記対象の時間窓フレームを構成する各フレームで検出された対象物の、前記対象の時間窓フレームを構成するフレーム間における対応関係を示す追跡結果を生成し、
前記統合部は、前記他の時間窓フレームと重複して含まれるフレームのうち基準フレームで検出された対象物を基準として、前記各追跡結果が示す対応関係のうち少なくとも一部分を接続することにより、前記各追跡結果を統合する
請求項1に記載の追跡装置。
映像データを構成する複数のフレームの連続する一部のフレームを時間窓フレームとして、隣り合う時間窓フレームに1つ以上のフレームが重複して含まれるように、前記映像データから複数の時間窓フレームを抽出する抽出処理と、
前記抽出処理によって抽出された各時間窓フレームを対象として、対象の時間窓フレームに対して対象物の追跡を行い、追跡結果を生成する物体追跡処理と、
前記物体追跡処理によって前記各時間窓フレームを対象として生成された各追跡結果を、他の時間窓フレームと重複して含まれるフレームに基づき統合して、統合結果を生成する結果統合処理と
をコンピュータに実行させる追跡プログラム。
【発明の概要】
【発明が解決しようとする課題】
【0005】
逐次対応付け方式は、オクルージョン又は未検出が発生した場合に、追跡が途切れてしまうという課題がある。また、逐次対応付け方式は、ある時に間違って対応付けをしてしまうと、その間違いが修正されることがないという課題がある。一方、全体最適化方式は、逐次対応付け方式の課題は解決されているものの、メモリの消費量が多いという課題がある。
この発明は、逐次対応付け方式の課題を解決しつつ、全体最適化方式と比べてメモリの消費量を減らすことを可能にすることを目的とする。
【課題を解決するための手段】
【0006】
この発明に係る追跡装置は、
映像データを構成する複数のフレームの連続する一部のフレームを時間窓フレームとして、隣り合う時間窓フレームに1つ以上のフレームが重複して含まれるように、前記映像データから複数の時間窓フレームを抽出する抽出部と、
前記抽出部によって抽出された各時間窓フレームを対象として、対象の時間窓フレームに対して対象物の追跡を行い、追跡結果を生成する追跡部と、
前記追跡部によって前記各時間窓フレームを対象として生成された各追跡結果を、他の時間窓フレームと重複して含まれるフレームに基づき統合して、統合結果を生成する統合部と
を備える。
【0007】
前記抽出部は、2つ以上の連続する時間窓フレームに2つ以上の連続するフレームが重複して含まれるように、前記複数の時間窓フレームを抽出し、
前記追跡部は、前記対象の時間窓フレームを構成する各フレームで検出された対象物の、前記対象の時間窓フレームを構成するフレーム間における対応関係を示す追跡結果を生成し、
前記統合部は、複数のフレームに含まれる各フレーム間について前記各追跡結果が示す同一の対応関係の数をカウントして、カウントされた数に基づき、前記各フレーム間における前記対象物の対応関係を特定することにより、前記各追跡結果を統合する。
【0008】
前記統合部は、前記各追跡結果が示す同一の対応関係の数を投票数として、前記投票数が多い対応関係を優先的に採用することにより、前記複数のフレームに含まれる各フレーム間における前記対象物の対応関係を特定する。
【0009】
前記統合部は、前記各追跡結果が示す同一の対応関係の数を投票数として、その対応関係が選択される可能性がある回数で前記投票数を除した得票率が高い対応関係を優先して採用することにより、前記複数のフレームに含まれる各フレーム間における前記対象物の対応関係を特定する。
【0010】
前記追跡部は、前記対象の時間窓フレームを構成する各フレームで検出された対象物の、前記対象の時間窓フレームを構成するフレーム間における対応関係を示す追跡結果を生成し、
前記統合部は、前記他の時間窓フレームと重複して含まれるフレームのうち基準フレームで検出された対象物を基準として、前記各追跡結果が示す対応関係のうち少なくとも一部分を接続することにより、前記各追跡結果を統合する。
【0011】
前記統合部は、前記他の時間窓フレームと重複して含まれるフレームのうち、中央のフレームを前記基準フレームとする。
【0012】
前記抽出部は、1フレームずつずらしながら、連続する基準数のフレームを含む前記時間窓フレームを抽出する。
【0013】
この発明に係る追跡プログラムは、
映像データを構成する複数のフレームの連続する一部のフレームを時間窓フレームとして、隣り合う時間窓フレームに1つ以上のフレームが重複して含まれるように、前記映像データから複数の時間窓フレームを抽出する抽出処理と、
前記抽出処理によって抽出された各時間窓フレームを対象として、対象の時間窓フレームに対して対象物の追跡を行い、追跡結果を生成する物体追跡処理と、
前記物体追跡処理によって前記各時間窓フレームを対象として生成された各追跡結果を、他の時間窓フレームと重複して含まれるフレームに基づき統合して、統合結果を生成する結果統合処理と
をコンピュータに実行させる。
【発明の効果】
【0014】
この発明では、時間窓フレーム毎に追跡結果を生成し、各追跡結果を統合して統合結果を生成する。これにより、逐次対応付け方式の課題を解決しつつ、全体最適化方式と比べてメモリの消費量を減らすことが可能である。
【発明を実施するための形態】
【0016】
実施の形態1.
***構成の説明***
図1を参照して、実施の形態1に係る追跡装置10の構成を説明する。
追跡装置10は、プロセッサ11と、メモリ12と、ストレージ13と、通信インタフェース14とのハードウェアを備える。プロセッサ11は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。
【0017】
プロセッサ11は、プロセッシングを行うIC(Integrated Circuit)である。プロセッサ11は、具体例としては、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)である。
【0018】
メモリ12は、データを一時的に記憶する記憶装置である。メモリ12は、具体例としては、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)である。
【0019】
ストレージ13は、データを保管する記憶装置である。ストレージ13は、具体例としては、HDD(Hard Disk Drive)である。また、ストレージ13は、SD(登録商標,Secure Digital)メモリカード、CF(CompactFlash,登録商標)、NANDフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVD(Digital Versatile Disk)といった可搬記録媒体であってもよい。
【0020】
通信インタフェース14は、外部の装置と通信するためのインタフェースである。通信インタフェース14は、具体例としては、Ethernet(登録商標)、USB(Universal Serial Bus)、HDMI(登録商標,High−Definition Multimedia Interface)のポートである。
追跡装置10は、通信インタフェース14を介して、撮影装置141と、表示装置142とに接続されている。
【0021】
追跡装置10は、機能構成要素として、抽出部21と、追跡部22と、統合部23とを備える。追跡装置10の各機能構成要素の機能はソフトウェアにより実現される。
ストレージ13には、追跡装置10の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ11によりメモリ12に読み込まれ、プロセッサ11によって実行される。これにより、追跡装置10の各機能構成要素の機能が実現される。
【0022】
図1では、プロセッサ11は、1つだけ示されていた。しかし、プロセッサ11は、複数であってもよく、複数のプロセッサ11が、各機能を実現するプログラムを連携して実行してもよい。
【0023】
***動作の説明***
図2から
図7を参照して、実施の形態1に係る追跡装置10の動作を説明する。
実施の形態1に係る追跡装置10の動作は、実施の形態1に係る追跡方法に相当する。また、実施の形態1に係る追跡装置10の動作は、実施の形態1に係る追跡プログラムの処理に相当する。
【0024】
図2を参照して、実施の形態1に係る追跡装置10の全体的な処理を説明する。
(
図2のステップS1:抽出処理)
抽出部21は、通信インタフェース14を介して、撮影装置141から映像データ30を取得する。抽出部21は、映像データ30を構成する複数のフレーム31の連続する一部のフレーム31を時間窓フレーム32として、映像データ30から複数の時間窓フレーム32を抽出する。この際、抽出部21は、隣り合う時間窓フレーム32に1つ以上のフレーム31が重複して含まれるように、映像データ30から複数の時間窓フレーム32を抽出する。そして、抽出部21は、抽出された各時間窓フレーム32をメモリ12に書き込む。
実施の形態1では、抽出部21は、2つ以上の連続する時間窓フレーム32に、追跡対象とする2つ以上の連続する全てのフレーム31の組が重複して含まれるように、複数の時間窓フレーム32を抽出する。
【0025】
図3を参照して具体的に説明する。
図3では、抽出部21は、連続する4つのフレーム31を1つの時間窓フレーム32としている。そして、抽出部21は、1つのフレーム31ずつずらしながら、複数の時間窓フレーム32を抽出している。これにより、隣り合う時間窓フレーム32に3つのフレーム31が重複して含まれる。
【0026】
(
図2のステップS2:追跡処理)
追跡部22は、ステップS1で抽出された各時間窓フレーム32を対象として、対象の時間窓フレーム32に対して人等の対象物33の追跡を行い、追跡結果34を生成する。対象物33は、人に限らず、鞄等の物体であってもよい。
具体的には、追跡部22は、対象の時間窓フレーム32をメモリ12から読み出す。追跡部22は、対象の時間窓フレーム32を構成する各フレーム31で検出された対象物33の、対象の時間窓フレーム32を構成するフレーム31間における対応関係を示す追跡結果34を生成する。例えば、追跡部22は、対象の時間窓フレーム32を構成する各フレーム31から検出された対象物33の情報を入力として、既存の全体最適化方式のアルゴリズムを用いて、追跡結果34を生成する。既存の全体最適化方式のアルゴリズムとしては、非特許文献2に記載されたアルゴリズムを用いることができる。追跡部22は、生成された追跡結果34をメモリ12に書き込む。
【0027】
図4を参照して具体的に説明する。
図4では、横軸が時間を表し、縦軸が空間を表している。
図4では、横軸に沿って各フレーム31で検出された対象物33が並べられており、縦軸方向の位置が対象物33の位置を表している。
追跡部22は、時間窓フレーム32Aと、時間窓フレーム32Bと、時間窓フレーム32Cといった各時間窓フレーム32を対象として、対象物33の追跡を行う。この際、追跡部22は、対象の時間窓フレーム32を構成する各フレーム31から検出された対象物33の情報を入力とする。例えば、時間窓フレーム32Aが対象の時間窓フレーム32である場合には、フレーム31(1)から検出された対象物33と、フレーム31(2)から検出された対象物33と、フレーム31(3)から検出された対象物33と、フレーム31(4)から検出された対象物33とが入力とされる。
そして、追跡部22は、既存の全体最適化方式のアルゴリズムを用いて、対象の時間窓フレーム32を構成する各フレーム31で検出された対象物33の、対象の時間窓フレーム32を構成するフレーム31間における対応関係を特定する。
図4では、時間窓フレーム32Aで追跡て特定された、対応する対象物33を表すノード間にエッジが描かれている。これにより、時間窓フレーム32毎に追跡結果34が得られる。
【0028】
(
図2のステップS3:統合処理)
統合部23は、ステップS2で各時間窓フレーム32を対象として生成された各追跡結果34をメモリ12から読み出す。統合部23は、読み出された各追跡結果34を統合して、統合結果35を生成する。この際、統合部23は、他の時間窓フレーム32と重複して含まれるフレーム31に基づき、追跡結果34を統合する。そして、統合部23は、生成された統合結果35を通信インタフェース14を介して表示装置142に出力する。
具体的には、統合部23は、映像データ30を構成する複数のフレーム31に含まれる各フレーム31間について、各追跡結果34が示す同一の対応関係の数をカウントする。統合部23は、カウントされた数に基づき、各フレーム31間における対象物33の対応関係を特定する。これにより、結果的に、各追跡結果34が統合される。
【0029】
図5を参照して具体的に説明する。
統合部23は、各追跡結果34が示す同一の対応関係の数を投票数として、投票数が多い対応関係を優先的に採用する。これにより、統合部23は、映像データ30を構成する複数のフレーム31に含まれる各フレーム31間における対象物33の対応関係を特定する。
例えば、フレーム31(3)における対象物33と、フレーム31(4)における対象物33との対応関係は、時間窓フレーム32Aを対象として生成された追跡結果34Aと、時間窓フレーム32Bを対象として生成された追跡結果34Bと、時間窓フレーム32Cを対象として生成された追跡結果34Cとで示されている。そこで、統合部23は、追跡結果34Aと追跡結果34Bと追跡結果34Cとを参照して、投票数が最も多い対応関係を優先的に採用する。
具体例としては、フレーム31(3)における対象物33s及び対象物33tと、フレーム31(4)における対象物33u及び対象物33vとについては、対象物33sと対象物33uとが2度対応付けされ、対象物33sと対象物33vとが1度対応付けされ、対象物33tと対象物33uとが1度対応付けされ、対象物33tと対象物33vとが2度対応付けされている。そこで、統合部23は、投票数が最も多い対応関係である、対象物33sと対象物33uとの対応付けと、対象物33tと対象物33vとの対応付けとを採用する。これにより、フレーム31(3)における対象物33s及び対象物33tと、フレーム31(4)における対象物33u及び対象物33vとの対応付けが決定される。
【0030】
図6を参照して、実施の形態1に係る統合処理(
図2のステップS3)を説明する。
(
図6のステップS11:対象選択処理)
統合部23は、遷移先が決定されておらず、かつ、遷移先の候補がある対象物33を選択する。
遷移先が決定されていないとは、時間的に後のフレーム31で検出された対象物33と対応付けがされていないという意味である。例えば、
図7に示すように、フレーム31(2)における対象物33xは、フレーム31(2)よりも時間的に前のフレーム31(1)の対象物33yとは対応付けされている。しかし、対象物33xは、フレーム31(2)よりも時間的に後のフレーム31(3)又はフレーム31(4)の対象物33とは対応付けされていない。したがって、対象物33xは、遷移先が決定されていない対象物33である。
遷移先の候補があるとは、
図2のステップS2で生成されたいずれかの追跡結果34で、時間的に後のフレーム31で検出された対象物33と対応付けがされているという意味である。例えば、フレーム31(2)における対象物33xは、時間窓フレーム32Aについての追跡結果34でフレーム31(2)よりも時間的に後のフレーム31(3)の対象物33zと接続されているとする。この場合、対象物33xは、遷移先の候補がある対象物33である。
【0031】
(
図6のステップS12:決定処理)
統合部23は、ステップS11で選択された対象物33についての遷移先を決定する。
具体的には、統合部23は、
図2のステップS2で生成された各追跡結果34における、選択された対象物33についての遷移先の候補を特定する。統合部23は、特定された遷移先の候補毎に、いくつの追跡結果34で遷移先になっているかをカウントする。ここでカウントされた数が投票数である。統合部23は、投票数が最も多かった遷移先の候補を、選択された対象物33についての遷移先に決定する。
なお、投票数が同じ遷移先の候補が複数ある場合には、何らかのルールに従い、いずれかの遷移先の候補が選択されるようにしておけばよい。
【0032】
(
図6のステップS13:終了判定処理)
統合部23は、遷移先が決定されておらず、かつ、遷移先の候補がある対象物33が残っているか否かを判定する。
統合部23は、残っている場合には処理をステップS11に戻す。一方、統合部23は、残っていない場合には処理を終了する。
【0033】
なお、以上に説明した方法では、例えば、映像データ30の先頭のフレーム31については、1つの時間窓フレーム32にだけ含まれる。このような例外的に1つの時間窓フレーム32にだけしか含まれないフレーム31については、1つの時間窓フレーム32における対応関係を採用すればよい。
【0034】
***実施の形態1の効果***
以上のように、実施の形態1に係る追跡装置10は、時間窓フレーム32毎に追跡結果34を生成し、各追跡結果34を統合して統合結果35を生成する。
これにより、各時間窓フレーム32についての追跡結果34では、逐次対応付け方式の課題が解決されている。そして、時間窓フレーム32毎に処理を行うことで、映像データ30全体について処理を行う場合に比べてメモリ12の消費量を減らすことができる。
【0035】
また、実施の形態1に係る追跡装置10は、各時間窓フレーム32についての追跡結果34から得られる投票数によって対応関係を特定する。これにより、映像データ30全体として適切な統合結果35を得ることが可能である。
【0036】
***他の構成***
<変形例1>
実施の形態1では、
図2のステップS3で統合部23は、投票数が最も多い対応関係を優先的に採用した。しかし、
図2のステップS3で統合部23は、投票数が最も多い対応関係ではなく、得票率が最も高い対応関係を優先的に採用してもよい。得票率は、投票数を投票機会の数で除した値である。投票機会の数とは、対応関係が選択される可能性がある回数である。
【0037】
図8に示すように、追跡結果34において、対象物33がフレーム31を飛び越して対応付けされる場合がある。
図8では、フレーム31(2)の対象物33と、フレーム31(4)の対象物33とが対応付けされている。つまり、あるフレーム31で検出された対象物33が、次のフレーム31で検出された対象物33ではなく、2つ以上後のフレーム31で検出された対象物33と対応付けされる場合がある。
連続する2つのフレーム31が重複して含まれる時間窓フレーム32の数よりも、連続する3つ以上のフレーム31が重複して含まれる時間窓フレーム32の数の方が少ない。例えば、
図3に示すように、連続する4つのフレーム31を1つの時間窓フレーム32とし、1つのフレーム31ずつずらしながら時間窓フレーム32が抽出されるとする。この場合、連続する2つのフレーム31が重複して含まれる時間窓フレーム32は3つであるが、連続する3つ以上のフレーム31が重複して含まれる時間窓フレーム32は2つである。
そのため、対象物33がフレーム31を飛び越して対応付けされる場合の投票数を、対象物33がフレーム31を飛び越さずに対応付けされる場合の投票数と比べてしまうと、適切な結果が得られない可能性がある。そこで、投票数に代えて得票数を用いて、対応関係を特定する。
【0038】
図3に示す例であれば、対象物33がフレーム31を飛び越さずに対応付けされる場合の得票率は、投票数を3で除した値である。この“3”は、投票機会の数であり、連続する2つのフレーム31が重複して含まれる時間窓フレーム32の数である。同様に、対象物33がフレーム31を1つ飛び越して対応付けされる場合の得票率は、投票数を2で除した値である。この“2”は、投票機会の数であり、連続する3つのフレーム31が重複して含まれる時間窓フレーム32の数である。
【0039】
<変形例2>
実施の形態1では、
図2のステップS1で抽出部21は、映像データ30から一度に複数の時間窓フレーム32を抽出した。しかし、抽出部21は、基準数の新たなフレーム31が得られる度に、新たな時間窓フレーム32を抽出してもよい。そして、新たな時間窓フレーム32が抽出されると、抽出された時間窓フレーム32を用いて
図2のステップS2以降の処理が実行されてもよい。
図3に示す例であれば、新たに1つのフレーム31が得られると、新たに1つの時間窓フレーム32を抽出できる。そこで、抽出部21は、新たに1つのフレーム31が得られる度に、新たに1つの時間窓フレーム32を抽出してもよい。もちろん、抽出部21は、1つのフレーム31が得られる度に時間窓フレーム32を抽出するのではなく、2つ以上のある数のフレーム31が得られる度に、新たな時間窓フレーム32を抽出してもよい。
この場合、既に追跡結果34の生成に使用された時間窓フレーム32のみに関するフレーム31はメモリ12から削除してもよい。例えば、
図4に示す例であれば、時間窓フレーム32Aについての追跡結果34が生成されてしまえば、フレーム31(1)はメモリ12から削除されてもよい。
また、統合結果35の生成に利用されない追跡結果34についてもメモリ12から削除してもよい。例えば、
図4に示す例であれば、フレーム31(3)とフレーム31(4)との対応関係が特定されてしまえば、時間窓フレーム32Aについての追跡結果34は使用されない。したがって、時間窓フレーム32Aについての追跡結果34はメモリ12から削除されてもよい。
これにより、メモリ12の消費量を減らすことができる。
【0040】
<変形例3>
実施の形態1では、2つ以上の時間窓フレーム32に全てのフレーム31の組が重複して含まれるように複数の時間窓フレーム32を抽出するとした。しかし、多数決で決定することを考慮すると、3つ以上の時間窓フレーム32に全てのフレーム31の組が重複して含まれるように複数の時間窓フレーム32を抽出する方が望ましい。
できるだけ多くの時間窓フレーム32に全てのフレーム31の組が重複して含まれるようにした方が、追跡の精度を高くすることができる。但し、多くの時間窓フレーム32に全てのフレーム31の組が重複して含まれるようにするほど、メモリ12の消費量は多くなる。
【0041】
また、変形例2で説明したように新たなフレーム31が得られる度に新たな時間窓フレーム32を抽出する場合、1つの時間窓フレーム32に含まれるフレーム31の数を多くすると、結果が得られるのが遅くなる。
【0042】
<変形例4>
実施の形態1では、各機能構成要素がソフトウェアで実現された。しかし、変形例4として、各機能構成要素はハードウェアで実現されてもよい。この変形例4について、実施の形態1と異なる点を説明する。
【0043】
図9を参照して、変形例4に係る追跡装置10の構成を説明する。
各機能構成要素がハードウェアで実現される場合には、追跡装置10は、プロセッサ11とメモリ12とストレージ13とに代えて、電子回路15を備える。電子回路15は、各機能構成要素と、メモリ12と、ストレージ13との機能とを実現する専用の回路である。
【0044】
電子回路15としては、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA(Gate Array)、ASIC(Application Specific Integrated Circuit)、FPGA(Field−Programmable Gate Array)が想定される。
各機能構成要素を1つの電子回路15で実現してもよいし、各機能構成要素を複数の電子回路15に分散させて実現してもよい。
【0045】
<変形例5>
変形例5として、一部の各機能構成要素がハードウェアで実現され、他の各機能構成要素がソフトウェアで実現されてもよい。
【0046】
プロセッサ11とメモリ12とストレージ13と電子回路15とを処理回路という。つまり、各機能構成要素の機能は、処理回路により実現される。
【0047】
実施の形態2.
実施の形態2は、追跡結果34の統合方法が実施の形態1と異なる。実施の形態2では、この異なる点を説明し、同一の点については説明を省略する。
【0048】
***動作の説明***
図2と、
図10から
図11とを参照して、実施の形態2に係る追跡装置10の動作を説明する。
実施の形態2に係る追跡装置10の動作は、実施の形態2に係る追跡方法に相当する。また、実施の形態2に係る追跡装置10の動作は、実施の形態2に係る追跡プログラムの処理に相当する。
【0049】
図2を参照して、実施の形態2に係る追跡装置10の全体的な処理を説明する。
ステップS1からステップS2の処理は、実施の形態1と同じである。
【0050】
(
図2のステップS3:統合処理)
統合部23は、他の時間窓フレーム32と重複して含まれるフレーム31のうち基準フレーム36で検出された対象物を基準として、各追跡結果34が示す対応関係のうち少なくとも一部分を接続することにより、各追跡結果34を統合する。
【0051】
図10を参照して具体的に説明する。
図10では、
図3に示す例のように、連続する4つのフレーム31を1つの時間窓フレーム32とし、1つのフレーム31ずつずらしながら、複数の時間窓フレーム32が抽出された場合を想定している。
統合部23は、対象の時間窓フレーム32と、対象の時間窓フレーム32の1つ前の時間窓フレーム32とで重複して含まれる特定の位置のフレーム31を基準フレーム36とする。また、統合部23は、対象の時間窓フレーム32における基準フレーム36の1つ後のフレーム31を特定フレーム37とする。統合部23は、対象の時間窓フレーム32における基準フレーム36と特定フレーム37との間の対応関係を、統合結果35における基準フレーム36と特定フレーム37との間の対応関係として採用する。
例えば、
図10の(A)に示すように、時間窓フレーム32Aが対象の時間窓フレーム32であるとする。また、時間窓フレーム32の前から2番目のフレーム31が基準フレーム36であるとする。この場合、フレーム31(2)が基準フレーム36である。そのため、フレーム31(2)の1つ後ろのフレーム31(3)が特定フレーム37である。したがって、時間窓フレーム32Aにおけるフレーム31(2)とフレーム31(3)との対応関係が、統合結果35におけるフレーム31(2)とフレーム31(3)との対応関係になる。
次に、
図10の(B)に示すように、時間窓フレーム32Bが対象の時間窓フレーム32になったとする。この場合、フレーム31(3)が基準フレーム36である。そのため、フレーム31(3)の1つ後ろのフレーム31(4)が特定フレーム37である。したがって、時間窓フレーム32Bにおけるフレーム31(3)とフレーム31(4)との対応関係が、統合結果35におけるフレーム31(3)とフレーム31(4)との対応関係になる。
その結果、
図10の(C)に示すように、統合結果35におけるフレーム31(2)からフレーム31(4)までの対応関係が得られる。つまり、基準フレーム36で検出された対象物を基準として、対象の時間窓フレーム32についての追跡結果34と、1つ前の時間窓フレーム32についての追跡結果34とが接続される。
【0052】
図11を参照して、実施の形態2に係る統合処理(
図2のステップS3)を説明する。
(
図11のステップS21:時間窓フレーム選択処理)
統合部23は、過去に対象として選択されていない時間窓フレーム32を、対象の時間窓フレーム32として選択する。例えば、統合部23は、時系列に前の時間窓フレーム32から順に対象の時間窓フレーム32として選択すればよい。
【0053】
(
図11のステップS22:対象フレーム特定処理)
統合部23は、ステップS21で選択された対象の時間窓フレーム32から基準フレーム36を特定する。基準フレーム36の位置は、予め決められているものとする。基準フレーム36は、例えば、時間窓フレーム32の中央のフレーム31である。時間窓フレーム32に含まれるフレーム31が偶数個である場合には、中央のフレーム31は2つあるので、基準フレーム36は、その2つのフレーム31のいずれかである。
統合部23は、基準フレーム36の後のフレーム31を特定フレーム37として特定する。
【0054】
(
図11のステップS23:対応特定処理)
統合部23は、ステップS21で選択された対象の時間窓フレーム32における基準フレーム36と特定フレーム37との対応関係を、統合結果35における基準フレーム36と特定フレーム37として特定する。
【0055】
(
図11のステップS24:終了判定処理)
統合部23は、過去に対象として選択されていない時間窓フレーム32が残っているか否かを判定する。
統合部23は、残っている場合には処理をステップS21に戻す。一方、統合部23は、残っていない場合には処理を終了する。
【0056】
***実施の形態2の効果***
以上のように、実施の形態2に係る追跡装置10は、時間窓フレーム32と重複して含まれるフレーム31のうち基準フレーム36で検出された対象物を基準として、各追跡結果34が示す対応関係のうち少なくとも一部分を接続することにより、各追跡結果34を統合する。
これにより、実施の形態1よりも少ない計算量で追跡結果34を統合することが可能である。
【0057】
***他の構成***
<変形例6>
実施の形態2では、
図3に示す例のように、1つのフレーム31ずつずらしながら、複数の時間窓フレーム32が抽出された場合を想定した。しかし、複数のフレーム31ずつずらしながら、複数の時間窓フレーム32が抽出されてもよい。より正確には、隣り合う時間窓フレーム32で、少なくとも1つのフレーム31が重複していればよい。
図12に示すように、N個のフレーム31ずつずらしながら、複数の時間窓フレーム32が抽出されているとする。Nは2以上の整数である。この場合には、統合部23は、対象の時間窓フレーム32における基準フレーム36のN個後のフレーム31を特定フレーム37とする。統合部23は、対象の時間窓フレーム32における基準フレーム36から特定フレーム37までの対応関係を、統合結果35における基準フレーム36から特定フレーム37までの対応関係として採用する。
【0058】
図13に示すように、隣り合う時間窓フレーム32で1つのフレーム31だけが重複しているとする。この場合には、統合部23は、前の時間窓フレーム32と重複している対象の時間窓フレーム32における最前のフレーム31を基準フレーム36とし、対象の時間窓フレーム32における最後のフレーム31を特定フレーム37とする。統合部23は、対象の時間窓フレーム32における基準フレーム36から特定フレーム37までの対応関係を、統合結果35における基準フレーム36から特定フレーム37までの対応関係として採用する。
【0059】
以上のように、隣り合う時間窓フレーム32で重複するフレーム31の数を減らすことにより、少ない計算量で追跡結果34を統合することが可能である。
しかし、隣り合う時間窓フレーム32で重複するフレーム31の数を減らすと、追跡の精度が低くなる可能性がある。例えば、
図14に示すように、ある時間窓フレーム32に含まれるフレーム31で、映像データ30に入ってきたばかりの対象物33と、映像データ30からすぐに出ていく対象物33とについては、精度よく追跡できない可能性がある。これは、時間窓フレーム32においてその対象物33が検出されたフレーム31の数が少ないため、
図2のステップS2の処理でその対象物33が正しく対応付けされない可能性が高くなるためである。
【解決手段】抽出部21は、映像データを構成する複数のフレームの連続する一部のフレームを時間窓フレームとして、隣り合う時間窓フレームに1つ以上のフレームが重複して含まれるように、映像データから複数の時間窓フレームを抽出する。追跡部22は、各時間窓フレームを対象として、対象の時間窓フレームに対して対象物の追跡を行い、追跡結果を生成する。統合部23は、各時間窓フレームを対象として生成された各追跡結果を、他の時間窓フレームと重複して含まれるフレームに基づき統合して、統合結果を生成する。