(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-21
(45)【発行日】2023-01-04
(54)【発明の名称】オブジェクト追跡装置及びそのプログラム
(51)【国際特許分類】
G06T 7/20 20170101AFI20221222BHJP
G06T 7/00 20170101ALI20221222BHJP
H04N 7/18 20060101ALI20221222BHJP
【FI】
G06T7/20
G06T7/00 350B
H04N7/18 K
H04N7/18 D
H04N7/18 U
(21)【出願番号】P 2018245234
(22)【出願日】2018-12-27
【審査請求日】2021-11-08
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】高橋 正樹
(72)【発明者】
【氏名】三ツ峰 秀樹
【審査官】藤原 敬利
(56)【参考文献】
【文献】国際公開第2018/087844(WO,A1)
【文献】特開2018-078431(JP,A)
【文献】特表2015-536507(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00 - 1/40
G06T 3/00 - 7/90
G06V 10/00 -20/90
G06V 30/418
G06V 40/16 、40/20
H04N 5/222- 5/257
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
動いているオブジェクトのそれぞれに付された赤外光マーカを赤外光で撮影した赤外画像と、それぞれの前記オブジェクトを動かしている人物を可視光で撮影した可視画像とを用いて、前記オブジェクトを追跡するオブジェクト追跡装置であって、
前記オブジェクトの位置として、前記赤外画像から前記赤外光マーカの位置を検出する赤外光検出手段と、
前記可視画像から前記人物の各関節位置を検出する関節位置検出手段と、
前記オブジェクトの位置から前記各関節位置までの特徴ベクトルを算出する特徴ベクトル算出手段と、
前記オブジェクトの位置と前記各関節位置との関係を予め学習した識別器を用いて、前記特徴ベクトルによって前記オブジェクトに対応する前記人物を選択し、前記オブジェクトと前記人物との対応関係を示す属性情報を生成する属性情報生成手段と、
前記オブジェクトの位置及び前記属性情報に基づいて、前記オブジェクトの軌跡を生成する軌跡生成手段と、
を備えることを特徴とするオブジェクト追跡装置。
【請求項2】
前記属性情報生成手段は、
回帰モデルの前記識別器を前記人物毎に学習し、
前記人物毎に学習した識別器を用いて、前記特徴ベクトルから前記オブジェクトと前記人物との組み合わせ毎の尤度を算出し、算出した前記尤度が最も高くなる前記オブジェクトと前記人物との組み合わせを選択し、前記属性情報を生成することを特徴とする請求項1に記載のオブジェクト追跡装置。
【請求項3】
前記関節位置検出手段は、前記可視画像に含まれる全人物の関節位置を検出し、
前記関節位置検出手段で検出された前記関節位置に基づいて、首関節から股関節までの胴体長を前記人物毎に算出し、算出した前記胴体長が長い順に予め設定した数の前記人物を選択し、選択した前記人物の前記関節位置を前記特徴ベクトル算出手段に出力する人物選択手段、をさらに備えることを特徴とする請求項1又は請求項2に記載のオブジェクト追跡装置。
【請求項4】
前記特徴ベクトル算出手段は、前記特徴ベクトルを前記胴体長で正規化することを特徴とする請求項3に記載のオブジェクト追跡装置。
【請求項5】
前記関節位置検出手段は、少なくとも前記人物の頭及び腕部の前記関節位置を検出することを特徴とする請求項1から請求項4の何れか一項に記載のオブジェクト追跡装置。
【請求項6】
コンピュータを、請求項1から請求項5の何れか一項に記載のオブジェクト追跡装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、赤外画像及び可視画像を用いて、オブジェクトを追跡するオブジェクト追跡装置及びそのプログラムに関する。
【背景技術】
【0002】
近年、映像解析技術の進展に伴い、カメラを用いた様々なアプリケーションが提案されている。この技術の発展は、特にスポーツシーンの映像解析において顕著である。例えば、ウィンブルドンでも使用されているテニスのホークアイシステムは、複数の固定カメラの映像を用いてテニスボールを3次元的に追跡し、IN/OUTの判定を行っている。また2014年のFIFAワールドカップでは、ゴールラインテクノロジーと称して、数台の固定カメラの映像を解析し、ゴールの判定を自動化している。さらにサッカースタジアムに多数のステレオカメラを設置し、フィールド内の全選手をリアルタイムに追跡するTRACABシステムも知られている。
【0003】
これら映像解析技術は、時間解像度が30フレーム/秒(fps)のカメラで撮影した映像を利用する前提であることが多い。例えば、フェンシングの剣先、バドミントンのシャトルなど、目視が困難なほどの高速で移動するオブジェクトを撮影すると、映像上では、そのオブジェクトに極度のモーションブラーが発生する(
図16の符号α)。このため、映像のみからオブジェクト位置を正確に計測することが極めて困難である。この場合、30fpsを超えるハイスピートカメラを利用したり、シャッター速度を高速化することで、モーションブラーを軽減できる。その一方、ハイスピードカメラは高価であり、シャッター速度を高速化すると映像の輝度が低下するという問題がある。
【0004】
このような制約条件の中、赤外カメラを利用し、高速移動体を頑健に追跡する従来技術が提案されている(特許文献1)。この従来技術は、追跡対象に再帰性の反射テープを貼付し、赤外カメラから赤外光を照射し、その反射光を赤外画像上で検出することにより、追跡対象の位置を計測するものである。この従来技術では、赤外画像上で検出を行うことで、可視画像において誤検出の原因となるノイズを低減し、高い精度でオブジェクトを追跡できる。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【0006】
前記した従来技術では、追跡対象が高速に移動している場合、又は、反射テープが赤外カメラに正対していない場合、反射テープからの反射光が微弱となり、赤外画像上で追跡対象の検出が困難となる。以後、追跡対象の検出に失敗することを「ロスト」と記載することがある。また、従来技術では、複数の追跡対象の追跡中に追跡対象同士が近接した際、又は、全追跡対象をロストした後に再検出した際、追跡対象が入れ替わる場合がある。この場合、従来技術では、正確な軌跡の描画が極めて困難となり、軌跡の入れ替わりが生じることがある。
【発明が解決しようとする課題】
【0007】
そこで、本発明は、軌跡の入れ替わりを抑制できるオブジェクト追跡装置及びそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0008】
前記した課題に鑑みて、本発明に係るオブジェクト追跡装置は、動いているオブジェクトのそれぞれに付された赤外光マーカを赤外光で撮影した赤外画像と、それぞれのオブジェクトを動かしている人物を可視光で撮影した可視画像とを用いて、オブジェクトを追跡するオブジェクト追跡装置であって、赤外光検出手段と、関節位置検出手段と、特徴ベクトル算出手段と、属性情報生成手段と、軌跡生成手段と、を備える構成とした。
【0009】
かかるオブジェクト追跡装置において、赤外光検出手段は、オブジェクトの位置として、赤外画像から赤外光マーカの位置を検出する。
関節位置検出手段は、可視画像から人物の各関節位置を検出する。
特徴ベクトル算出手段は、オブジェクトの位置から各関節位置までの特徴ベクトルを算出する。この特徴ベクトルは、追跡の対象となるオブジェクトの位置と人物の姿勢との関係を表している。
【0010】
属性情報生成手段は、オブジェクトの位置と各関節位置との関係を予め学習した識別器を用いて、特徴ベクトルによってオブジェクトに対応する人物を選択し、オブジェクトと人物との対応関係を示す属性情報を生成する。
軌跡生成手段は、オブジェクトの位置及び属性情報に基づいて、オブジェクトの軌跡を生成する。
このように、オブジェクト追跡装置は、オブジェクトを追跡する際、オブジェクトと人物との対応関係を示す属性情報を用いるので、その軌跡の入れ替わりを抑制できる。
【0011】
なお、本発明は、コンピュータが備えるCPU、メモリ、ハードディスクなどのハードウェア資源を、前記したオブジェクト追跡装置として協調動作させるプログラムで実現することもできる。
【発明の効果】
【0012】
本発明によれば、オブジェクトを追跡する際、オブジェクトと人物との対応関係を示す属性情報を用いるので、その軌跡の入れ替わりを抑制できる。このように、本発明によれば、正確なオブジェクトの軌跡を生成し、追跡頑健性を向上させることができる。
【図面の簡単な説明】
【0013】
【
図1】実施形態に係るオブジェクト追跡システムの概略構成図である。
【
図3】実施形態において、赤外画像の一例を示す図である。
【
図4】実施形態に係るオブジェクト追跡装置の構成を示すブロック図である。
【
図5】実施形態において、人物の関節点の説明図である。
【
図6】実施形態において、可視画像の一例を示す図である。
【
図7】実施形態において、関節点の検出を説明する説明図である。
【
図8】実施形態において、選手の関節点の選択を説明する説明図である。
【
図9】実施形態において、特徴ベクトルの算出を説明する説明図である。
【
図10】実施形態において、識別器の学習を説明する説明図である。
【
図11】実施形態において、識別器による判定を説明する説明図である。
【
図12】実施形態において、軌跡の描画を説明する説明図である。
【
図13】実施形態に係るオブジェクト追跡装置の動作を示すフローチャートである。
【
図14】実施例において、尤度分布を可視化した画像の一例である。
【
図15】実施例において、尤度分布を可視化した画像の別例である。
【
図16】従来技術において、フェンシングの映像におけるモーションブラーを説明する説明図である。
【発明を実施するための形態】
【0014】
(実施形態)
[オブジェクト追跡システムの概略]
以下、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。
図1を参照し、本発明の実施形態に係るオブジェクト追跡システム1の概略について説明する。
以後の実施形態では、フェンシングにおいて、選手(人物)が持っている剣の剣先(オブジェクト)を追跡対象として説明する。フェンシングの最中、両選手の剣先は、高速で動いていることが多い。
【0015】
オブジェクト追跡システム1は、可視光及び赤外光を同光軸で撮影可能な可視・赤外同軸光カメラ20を利用し、可視光画像V及び赤外画像Iを組み合わせて、高速で移動する2本の剣先位置を追跡し、その軌跡T(T
1,T
2)を描画するものである。
図1に示すように、オブジェクト追跡システム1は、赤外光投光器10と、可視・赤外同軸光カメラ20と、オブジェクト追跡装置30と、を備える。
【0016】
赤外光投光器10は、赤外光を投光する一般的な投光器である。
図2に示すように、この赤外光投光器10が投光した赤外光は、両選手の剣先90に付けた反射テープ(赤外光マーカ)91で反射され、後記する可視・赤外同軸光カメラ20で撮影される。
【0017】
反射テープ91は、赤外光投光器10からの赤外線を反射するものである。この反射テープ91は、剣先90に1枚以上付ければよく、その大きさや枚数に特に制限はない。
図2の例では、剣先90は、その側面に矩形状の反射テープ91を1枚付けている。ここで、剣先90は、側面反対側に反射テープ91を1枚追加してもよく、その側面を一周するように帯状の反射テープ91を巻いてもよい(不図示)。
【0018】
可視・赤外同軸光カメラ20は、可視光と赤外光を同一光軸で撮影し、同一画素数の可視画像V及び赤外画像Iを生成するものである。本実施形態では、可視・赤外同軸光カメラ20は、フェンシングの競技を撮影した可視画像V(
図5)と、剣先90の反射テープ91を撮影した赤外画像Iとを生成する。
図3に示すように、赤外画像Iは、2個の反射テープ91のみが撮影される一方、他の選手などが撮影されない(破線で図示)。また、可視画像Vの剣先90と、赤外画像Iの反射テープ91との画像座標が対応するため、3次元空間での視点変換を行うことなく軌跡Tを描画できる。
【0019】
オブジェクト追跡装置30は、可視・赤外同軸光カメラ20から入力された赤外画像Iと可視画像Vとを用いて、両選手の剣先90を追跡するものである。そして、オブジェクト追跡装置30は、追跡した両選手の剣先90の軌跡T
1,T
2を異なる色で描画し、描画した軌跡T
1,T
2を可視画像Vに合成することで、軌跡合成画像Fを生成する。
なお、
図1では、左側の選手が持つ剣先90の軌跡T
1を破線で図示し、右側の選手が持つ剣先90の軌跡T
2を一点鎖線で図示した。
【0020】
[オブジェクト追跡装置の構成]
図4を参照し、オブジェクト追跡装置30の構成について説明する。
図4に示すように、オブジェクト追跡装置30は、赤外光検出手段31と、人物姿勢取得手段33と、オブジェクト識別手段35と、オブジェクト追跡手段37と、を備える。
【0021】
本実施形態では、オブジェクト追跡装置30は、時間方向に連続するフレーム1,…,t-1,t,…の赤外画像I及び可視画像Vが入力され、入力された赤外画像I及び可視画像Vに順次処理を施すこととする。以後、現在のフレーム(現フレーム)をtとし、現フレームtの赤外画像Iを赤外画像Itとし、現フレームの可視画像Vを可視画像Vtとする。
【0022】
赤外光検出手段31は、赤外画像Itから剣先90(反射テープ91)の位置を検出するものである。以下、赤外光検出手段31による剣先位置の検出手法の一例を説明する。
【0023】
<剣先位置の検出手法>
まず、赤外光検出手段31は、下記の式(1)を用いて、現在のフレームの赤外画像Itと、1つ前のフレームの赤外画像It-1との2値赤外差分画像を生成することで、動オブジェクトの領域Mtのみを抽出する。つまり、赤外光検出手段31は、赤外画像Itの画素(x,y)の輝度値Ixy
tと、赤外画像It-1の画素(x,y)の輝度値Ixy
t-1との差分が、予め設定した閾値R_briを超える動オブジェクトの領域Mxy
tを、候補ブロブとして抽出する。
【0024】
【0025】
ここで、x,yは、水平及び垂直の画像座標を表す。また、閾値R_briは、任意の値で予め設定する。また、式(1)の‘0’が最小輝度値を表し、‘255’が最大輝度値を表す。
なお、赤外光検出手段31は、静止しているノイズブロブの発生を抑えるために2値赤外差分画像Mxy
tを生成したが、赤外画像Itで輝度が高い領域を候補ブロブとして抽出してもよい。
【0026】
次に、赤外光検出手段31は、抽出した候補ブロブにモルフォロジ処理を施し、小領域のノイズブロブを消去する。このモルフォロジ処理とは、画像をいくつかの方向に画素単位でずらした画像群と、もとの画像との画像間演算によって、小領域のノイズブロブを消去する処理である。
【0027】
次に、赤外光検出手段31は、モルフォロジ処理で残った候補ブロブにラベリング処理を施す。このラベリング処理とは、候補ブロブにラベル(番号)を割り当てる処理である。
次に、赤外光検出手段31は、ラベリング処理を施した候補ブロブの位置、面積及び形状特徴量を求める。ここで、候補ブロブの位置は、候補ブロブの中心位置又は重心位置である。また、候補ブロブの形状特徴量は、円形度や外接矩形のアスペクト比とする。
【0028】
次に、赤外光検出手段31は、予め設定した最小面積から最大面積までの範囲にない候補ブロブを消去する。そして、赤外光検出手段31は、形状特徴量が予め設定した範囲内にない候補ブロブを消去する。さらに、赤外光検出部311は、候補ブロブの数がオブジェクト上限数を超えている場合、面積が大きい2個の候補ブロブの位置を剣先90の位置S1,S2として残し、他の候補ブロブを消去する。なお、Sm(S1,S2)は、後記する左右の属性情報が付加されていない剣先90の位置を表す(m∈1,2)。
その後、赤外光検出手段31は、剣先90の位置S1,S2として、赤外画像Itから検出した2個の反射テープ91の位置をオブジェクト識別手段35(特徴ベクトル算出手段351)に出力する。
【0029】
人物姿勢取得手段33は、可視画像Vtから人物の姿勢を取得するものであり、人物姿勢検出手段(関節位置検出手段)331と、人物選択手段333と、を備える。
【0030】
人物姿勢検出手段331は、人物の姿勢として、可視画像Vtから人物の各関節点(関節位置)を検出するものである。ここで、人物姿勢検出手段331は、任意の手法で人物の関節点を検出可能であり、可視画像Vtから関節点を自動的に検出してもよく、可視画像Vtに手動で関節点を指定してもよい。
【0031】
本実施形態では、人物姿勢検出手段331が、一般的な姿勢計測手法の一つである“OpenPose”を用いることとして説明する(参考文献1)。
参考文献1:ZheCao, Tomas Simon, Shih-EnWei, YaserSheikh, ”Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields,”In Proceedings of the IEEE InternationalConference on Computer Vision and Pattern Recognition 2017 (CVPR2017), pp.7291-7299
【0032】
この姿勢計測手法は、深層学習を用いて人物姿勢を計測する手法であり、可視画像V
tから各人物の関節点を18点検出する。以後、
図5に示すように、各人物の関節点をB
n
iで表す。上付き添え字nは、可視画像V
tに含まれる人物の識別番号を表し(n∈N)、可視画像V
tに含まれる人物の総数をNとする。下付き添え字iは、関節点の識別番号を表す(i=0~17)。
なお、
図5では、識別番号nを省略すると共に、隣接する関節点B
n
iを結ぶ破線を図示した。
【0033】
この関節点Biには、上半身の関節点B0~B7,B14~B17と、股関節B8,B11を含めた下半身の股関節B8~B13とが含まれる。頭部の関節点B14~B17のように関節でない箇所も含まれているが、目や鼻のように画像特徴を有するので、これらも関節点として扱っている。
【0034】
例えば、
図6の可視画像V
tが人物姿勢検出手段331に入力されたこととする。この可視画像V
tは、フェンシングの試合映像であり、2人の選手H
L,H
Rの他、1人の審判H
J及び5人の観客H
Gなど、人物Hが8人含まれている(N=8)。ここで、参考文献1の姿勢計測手法では、関節点B
n
iの検出対象となる人物Hを可視画像V
tで指定できないので、全人物Hの関節点B
n
iを検出することになる。すなわち、人物姿勢検出手段331は、
図7に示すように、可視画像V
tに含まれる全人物Hの関節点B
n
iを検出する。なお、
図7では、図面を見やすくするため、一部の関節点B
n
iのみ符号を図示した。
その後、人物姿勢検出手段331は、可視画像V
tと、この可視画像V
tから検出した全人物Hの関節点B
n
iとを、人物選択手段333に出力する。
【0035】
前記したように、可視画像Vtに含まれる全人物Hの関節点Bn
iが検出されてしまう。また、フェンシングの試合映像では、観客HGや審判HJに比べ、選手HL,HRが大きなサイズで撮影されることが多い。そこで、人物選択手段333は、下記の式(2)に示すように、全人物Hの関節点Bn
iに基づいて胴体長lnを算出し、算出した胴体長lnが長い順に予め設定した人数の人物Hを選択する。
【0036】
【0037】
参考文献1の姿勢計測手法で関節点B
n
iを検出した場合、
図5に示すように、首関節が関節点B
1であり、両足の付け根にあたる股関節がそれぞれ関節点B
8,B
11である。そこで、式(2)に示すように、首関節B
1から一方の股関節B
8までのベクトルの長さと、首関節B
1から他方の股関節B
11までのベクトルの長さとの平均値を、胴体長l
nとした。
【0038】
また、フェンシングの試合は2人の選手H
L,H
Rで行うので、
図8に示すように、胴体長l
nが長い2人の選手H
L,H
Rを選択すればよい。なお、首関節B
1及び股関節B
8,B
11と、選択する人数とは、人物選択手段333に予め設定しておくこととする。
【0039】
また、フェンシングの試合では、左右の選手HL,HRの位置が入れ替わらないため、左側の選手HL又は右側の選手HRを示す属性によって、関節点Bn
i及び胴体長lnを記述できる。本実施形態では、左側の選手HLを示す識別番号nをLに置き換え、右側の選手HRを示す識別番号nをRに置き換えることとする。
その後、人物選択手段333は、左側の選手HLの関節点BL
i及び胴体長lLと、右側の選手HRの関節点BR
i及び胴体長lRとを、オブジェクト識別手段35(特徴ベクトル算出手段351)に出力する。
【0040】
オブジェクト識別手段35は、フェンシングの試合映像から検出された2個の剣先90のそれぞれが、左側の選手HL又は右側の選手HRのどちらに対応するのかを識別するものであり、特徴ベクトル算出手段351と、属性情報生成手段353と、を備える。
【0041】
特徴ベクトル算出手段351は、剣先90の位置S
1,S
2から選手H
L,H
Rの各関節点B
L
i,B
R
iまでの特徴ベクトルを算出するものである。
図9に示すように、特徴ベクトル算出手段351は、1個目の剣先90の位置S
1から右側の選手H
Rの各関節点B
R
iまでの特徴ベクトルを算出する。なお、
図9では、特徴ベクトルを二点鎖線の矢印で図示した。また、特徴ベクトル算出手段351は、剣先90の位置S
1から左側の選手H
Lの各関節点B
L
iまでの特徴ベクトルも算出する。このように、特徴ベクトルは、剣先90の位置S
1から左右の両選手H
L,H
Rに向かうので、左右の選手H
L,H
Rの相対位置を考慮した頑健な特徴量となる。
【0042】
なお、図示を省略したが、特徴ベクトル算出手段351は、1個目の剣先90の位置S1と同様、2個目の剣先90の位置S2から右側の選手HRの各関節点BR
iまでの特徴ベクトルと、剣先90の位置S2から左側の選手HLの各関節点BL
iまでの特徴ベクトルとを算出する。
【0043】
この特徴ベクトルは、以下の式(3)で表されており、関節点BL
i,BR
iがそれぞれ18点あるために36次元の特徴量となる。また、可視・赤外同軸光カメラ20のズーム量に応じて、可視画像Vt内で選手HL,HRのサイズが変化する。そこで、特徴ベクトル算出手段351は、式(3)に示すように、選手HL,HRの胴体長lL,lRで正規化(除算)することで、選手HL,HRのサイズに不変な特徴ベクトルを算出できる。
【0044】
【0045】
その後、特徴ベクトル算出手段351は、算出した特徴ベクトルと、剣先90の位置S1,S2とを属性情報生成手段353に出力する。
【0046】
属性情報生成手段353は、予め学習した識別器を用いて、剣先90の位置S1,S2に対応する選手HL,HRを選択し、剣先90と選手HL,HRとの対応関係を示す属性情報を生成するものである。つまり、属性情報は、2人の選手HL,HRと、各選手HL,HRが動かしている剣の剣先90の位置S1,S2とを対応付けた情報である。
【0047】
この属性情報生成手段353は、2つの動作モードで動作する。動作モードの1つめは、属性情報生成手段353が、識別器を学習する学習モードである。動作モードの2つめは、属性情報生成手段353が、学習した識別器を用いて、剣先90の位置S1,S2に対応する選手HL,HRを選択する選択モードである。なお、本実施形態では、オブジェクト追跡装置30のユーザが、2つの動作モードを手動で切り替えることとする。
【0048】
<学習モード>
まず、属性情報生成手段353の学習モードについて説明する。
識別器は、
図9の特徴ベクトル、すなわち、剣先90の位置S
1,S
2と、選手H
L,H
Rの関節点B
L
i,B
R
iとの関係を学習したものである。本実施形態では、属性情報生成手段353が、サポートベクタマシン(SVM:Support Vector Machine)により、回帰モデルの識別器を学習する。
【0049】
このとき、属性情報生成手段353は、
図10に示すように、左右の選手H
L,H
R毎に識別器を学習する。
図10では、SVM回帰(L)が左側の選手H
Lに対応した識別器であり、SVM回帰(R)が右側の選手H
Rに対応した識別器である。SVM回帰(L)の学習データは、剣先90の位置S
L,S
Rを可視画像V上で手動で設定し、左側の選手H
Lに対応する剣先90の位置S
Lでスコア1.0(正例)とし、右側の選手H
Rに対応する剣先90の位置S
Rでスコア-1.0(負例)とすればよい。なお、剣先90の位置S
L,S
Rは、左右の属性情報が付加された剣先90の位置を表す。SVM回帰(L)と同様、SVM回帰(R)の学習データは、左側の選手H
Lに対応する剣先90の位置S
Lでスコア-1.0(負例)とし、右側の選手H
Rに対応する剣先90の位置S
Rでスコア1.0(正例)とすればよい。一般的には、100組以上の学習データを準備すれば、高精度な識別器を学習できる。
【0050】
<選択モード>
次に、属性情報生成手段353の選択モードについて説明する。
回帰モデルの識別器は、成否、正負や真偽といった2値判定ではなく、その判定結果を数値(尤度)として出力する。つまり、回帰モデルの識別器は、2個の剣先90がそれぞれ、左側の選手H
Lのものである尤度と、右側の選手H
Rのものである尤度とを出力する。従って、属性情報生成手段353は、
図11に示すように、左側の選手H
Lに対応したSVM回帰(L)に特徴ベクトルを入力し、左側の選手H
Lであることを示す尤度と、右側の選手H
Rであることを示す尤度とを算出する。さらに、属性情報生成手段353は、右側の選手H
Rに対応したSVM回帰(R)に特徴ベクトルを入力し、左側の選手H
Lであることを示す尤度と、右側の選手H
Rであることを示す尤度とを算出する。このように、属性情報生成手段353は、左右の選手H
L,H
Rに対応する識別器を用いて、左右の選手H
L,H
Rに対応する尤度を計4通り算出する。
【0051】
次に、属性情報生成手段353は、4通りの尤度のうち、最も尤度が高くなるものを選択する。つまり、属性情報生成手段353は、2個の剣先90と左右の選手HL,HRとの4通りの組み合わせのうち、最も尤度が高くなる組み合わせを選択する。従って、属性情報生成手段353は、残りの剣先90と、残りの選手HL,HRとの組み合わせも必然的に選択できる。
【0052】
以下、4通りの尤度を算出する利点について、2値判定と対比して説明する。
左右の選手HL,HRに対応する識別器に2値判定(分類モデル)を適用した場合、両方の選手HL,HRに同一の剣先90が対応するという矛盾した判定結果を生じることがある。例えば、同一の剣先90について、SVM回帰(L)が左側の選手HLのものと判定すると共に、SVM回帰(R)が右側の選手HRのものと判定することがあり、何れが正しいか真偽不明となる。一方、属性情報生成手段353は、2値判定ではなく尤度という数値を算出するので、最も尤度が高くなる剣先90と選手HL,HRとの組み合わせを選択可能であり、2値判定のように矛盾した判定結果を生じることがない。
【0053】
次に、属性情報生成手段353は、2個の剣先90のそれぞれと、左右の選手HL,HRとの対応関係を示す属性情報を生成し、生成した属性情報を剣先90の位置S1,S2に付加する。そして、属性情報生成手段353は、属性情報が付加された剣先90の位置SL,SRをオブジェクト追跡手段37(軌跡描画手段371)に出力する。
【0054】
図4に戻り、オブジェクト追跡装置30の構成について、説明を続ける。
オブジェクト追跡手段37は、オブジェクトを追跡するものであり、可視画像蓄積手段371と、軌跡描画手段(軌跡生成手段)373と、を備える。
【0055】
可視画像蓄積手段371は、可視・赤外同軸光カメラ20より入力された可視画像Vtを蓄積するメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の記憶手段である。可視画像蓄積手段371が蓄積した可視画像Vtは、後記する軌跡描画手段373により参照される。
【0056】
軌跡描画手段373は、属性情報を参照しながら、可視画像蓄積手段371に蓄積されている可視画像Vtに剣先90の軌跡を描画するものである。このとき、軌跡描画手段373は、剣先90の位置SL,SRに付加された属性情報を参照するので、軌跡Tの入れ替わりを抑制し、正しい軌跡を描画できる。
【0057】
例えば、軌跡描画手段373は、左側の選手H
Lの剣先が赤色、右側の選手H
Rの剣先が緑色のように、左右の選手H
L,H
Rの剣先90に異なる色を予め設定する。そして、軌跡描画手段373は、
図12に示すように、可視画像V
tと軌跡Tとを合成した軌跡合成画像F
tを生成する。この軌跡合成画像F
tには、左側の選手H
Lが持つ剣先90の軌跡T
1と、右側の選手H
Rが持つ剣先90の軌跡T
2とがCGで合成されている。
その後、軌跡描画手段373は、軌跡合成画像F
tを外部の装置(例えば、ディスプレイ)に出力する。
【0058】
[オブジェクト追跡装置の動作]
図13を参照し、オブジェクト追跡装置30の動作について説明する。
図13に示すように、ステップS1において、赤外光検出手段31は、赤外画像I
tから剣先90の位置S
1,S
2を検出する。
例えば、赤外光検出手段31は、2値赤外差分画像を生成し、抽出した候補ブロブにモルフォロジ処理を施す。次に、赤外光検出部311は、モルフォロジ処理で残った候補ブロブにラベリング処理を施し、候補ブロブの位置、面積及び形状特徴量を求める。そして、赤外光検出手段31は、面積及び形状特徴量を基準にフィルタリングし、面積が大きい2個の候補ブロブの位置を剣先90の位置S
1,S
2として検出する。
【0059】
ステップS2において、人物姿勢検出手段331は、可視画像Vtに含まれる全人物Hの関節点Bn
iを検出する。例えば、一般的な姿勢計測手法の一つである“OpenPose”を用いて、人物Hの各関節点Bn
iを検出する。
ステップS3において、人物選択手段333は、ステップS2で検出した全人物Hのうち、胴体長lnが長い2人の選手HL,HRを選択する。
【0060】
ステップS4において、特徴ベクトル算出手段351は、ステップS1で検出した剣先90の位置S1,S2から、ステップS3で選択した選手HL,HRの各関節点BL
i,BR
iまでの特徴ベクトルを算出する。このとき、特徴ベクトル算出手段351は、選手HL,HRの胴体長lnで正規化する。
【0061】
ステップS5において、属性情報生成手段353は、予め学習した識別器を用いて、剣先90の位置S1,S2に対応する選手HL,HRを選択し、剣先90と選手HL,HRとの対応関係を示す属性情報を生成する。
例えば、属性情報生成手段353は、左右の選手HL,HRに対応した2つの回帰モデルの識別器を用いて、左右の選手HL,HRに対応する尤度を4通り算出する。そして、属性情報生成手段353は、2個の剣先90と左右の選手HL,HRとの4通りの組み合わせのうち、最も尤度が高くなる組み合わせを選択する。さらに、属性情報生成手段353は、2個の剣先90と、左右の選手HL,HRとの対応関係を示す属性情報を生成し、生成した属性情報を剣先90の位置S1,S2に付加する。
【0062】
ステップS6において、軌跡描画手段373は、ステップS5で生成した属性情報を参照しながら、剣先90の軌跡Tを可視画像V
tに描画する。例えば、軌跡描画手段373は、
図12に示すように、可視画像V
tと軌跡Tとを合成した軌跡合成画像F
tを生成する。
【0063】
[作用・効果]
以上のように、オブジェクト追跡装置30は、剣先90を追跡する際、剣先90と選手HL,HRとの対応関係を示す属性情報を用いるので、その軌跡の入れ替わりを抑制できる。このように、オブジェクト追跡装置30は、正確な剣先90の軌跡を生成し、追跡頑健性を向上させることができる。
【0064】
(変形例)
以上、本発明の実施形態を詳述してきたが、本発明は前記した実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0065】
前記した実施形態では、可視・近赤外同光軸カメラを利用することとして説明したが、本発明は、これに限定されない。例えば、本発明では、可視・近赤外同時撮影カメラ、及び、可視・近赤外マルチ波長カメラを利用することができる。
【0066】
[可視・近赤外同時撮影カメラ]
可視・近赤外同時撮影カメラは、RGBに加えIR(近赤外光)を分光する4波長分光プリズムを用いて、それぞれの波長毎のセンサ、合計4枚のセンサで撮影するカメラである。この可視・近赤外同時撮影カメラは、RGBセンサによる可視画像、及び、IRセンサによる赤外画像を個別に出力することが可能である。つまり、オブジェクト追跡装置は、前記した実施形態と同様、可視・近赤外同時撮影カメラから可視画像及び赤外画像を取得し、軌跡合成画像を出力できる。
【0067】
[可視・近赤外マルチ波長カメラ]
可視・近赤外マルチ波長カメラは、RGB3色以外に近赤外領域で3つの波長を分光するマルチ波長分光プリズムを利用したカメラである。通常、カメラは、IRカットフィルタ又は可視光カットフィルタを装着して可視分光特性又は近赤外分光特性に示される波長を取り出し、可視光又は近赤外のみの画像を取得する。しかし、可視・近赤外マルチ波長カメラは、IRカットフィルタ及び可視光カットフィルタを装着せず、基本分光特性に示される波長全てを取り出すことで、可視光及び近赤外光を合成した可視・赤外合成画像を生成する。
【0068】
そこで、可視・近赤外マルチ波長カメラを用いる場合、オブジェクト追跡システムは、可視・赤外分離装置を備えればよい。この可視・赤外分離装置は、可視・近赤外マルチ波長カメラが生成した可視・赤外合成画像を、可視画像と赤外画像とに分離するものである。
【0069】
[属性情報の生成方法]
前記した実施形態では、現フレームの可視画像のみで尤度を求めることとして説明したが、本発明は、これに限定されない。つまり、過去フレームの可視画像でも尤度を求めてもよい。例えば、属性情報生成手段は、現時刻から一定時間遡った期間で尤度を平均し、この尤度の平均が最も高くなる剣先と選手との組み合わせを選択する。
【0070】
[その他変形例]
前記した実施形態では、フェンシングを一例として説明したが、本発明は、これに限定されない。つまり、本発明は、テニス、バドミントン、バレーボール等、選手の位置が入れ替わらないスポーツにも適用することができる。例えば、バドミントンの場合、オブジェクト追跡装置は、選手が持つラケットの方向を識別し、ラケットの軌跡に左右の選手を対応付けることで、両選手が持つラケットの軌跡を異なる色で描画することができる。
【0071】
さらに、本発明は、軌跡を異なる色で描かない場合、選手の位置が入れ換わるスポーツにも適用することができる。例えば、オブジェクト追跡装置は、バドミントンのシャトルを追跡し、その軌跡を描画することができる。さらに、本発明は、剣道やナギナタにも適用することができる。この他、本発明は、オーケストラにおける指揮棒の軌跡や、ドラマや映画における刀等の軌跡を描画することができる。
【0072】
前記した実施形態では、識別器をSVMで学習することとして説明したが、本発明は、これに限定されない。例えば、識別器は、再帰型ニューラルネットワーク(RNN:Recurrent Neural Network)などのニューラルネットワーク、CRF(Conditional Random Fields)などで学習することができる。また、本発明では、回帰モデルの識別器だけでなく、分類モデルの識別器も利用することができる。
【0073】
前記した実施形態では、18点の関節点を検出することとして説明したが、全ての関節点を検出せずともよい。人物の姿勢に相関が高いのは上半身の関節点であり、特に、頭及び腕部の関節点であると考えられるので、これら関節点を検出すればよい。
また、関節点の検出には参考文献1に記載の手法を適用することとして説明したが、本発明は、これに限定されない。選手の関節点のみを検出できる手法を適用した場合、オブジェクト追跡装置は、人物選択手段を備えずともよい。
【0074】
前記した実施形態では、軌跡描画手段が軌跡を描画することとして説明したが、本発明は、これに限定されない。例えば、オブジェクト追跡装置は、オブジェクトの軌跡を示す軌跡データを生成し、生成した軌跡データを外部に出力してもよい。
【0075】
前記した実施形態では、オブジェクト追跡装置を独立したハードウェアとして説明したが、本発明は、これに限定されない。例えば、本発明は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記したオブジェクト追跡装置として協調動作させるプログラムで実現することもできる。これらのプログラムは、通信回線を介して配布してもよく、CD-ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
【実施例】
【0076】
オブジェクト追跡装置による識別精度向上の効果を検証するため、
図1のオブジェクト追跡装置にフェンシングの試合映像を入力して実験を行った。
従来手法では、パーティクルフィルタを用いて剣先の位置のみで追跡処理を行ったため、軌跡の入れ替わりなどの誤追跡が頻繁に生じた。この実施例では、従来手法で誤追跡が発生した映像シーケンスを利用し、その映像シーケンス毎に左右の選手を識別したときの精度(%)を算出した。さらに、オブジェクト追跡装置の処理速度(fps:フレーム/秒)をあわせて計測した。
【0077】
その実験結果を以下の表1に示す。5映像シーケンスの平均で97.6%と、高い精度が得られた。この実施例では、従来手法で誤追跡が発生した映像シーケンスを用いたが、人物姿勢を考慮することによって、全ての映像シーケンスで誤追跡を低減できることが分かった。また、この実施例では、処理速度が平均2.8fps程度であり、実用上十分であることも分かった。例えば、GPU(Graphics Processing Unit)を用いることや、識別処理を秒単位にすることで、リアルタイム処理を実現できると考えられる。
【0078】
【0079】
実験結果を検証するため、尤度分布を可視化した画像を
図14に示す。前記したように識別器(SVM回帰)は、左右の選手の尤度をそれぞれ算出できる。そこで、この実施例では、画像の全画素で左右の選手の尤度を算出し、その値に応じてヒートマップ状に可視化した。この
図14では、尤度の値に応じた輝度で、左側の選手を赤色で示し、右側の選手を緑色で示した。さらに、
図14では、剣先の検出位置を丸印で図示し、その位置での尤度を数値で示した。
【0080】
さらに、
図14と同様、別の4画像で尤度分布を可視化したものを
図15に示す。
図14及び
図15に示すように、選手同士の距離が近くなると、尤度分布の範囲も狭くなるが、オブジェクト追跡装置が左右の選手を正しく識別できた。このように、オブジェクト追跡装置は、剣先位置と人物の関節位置との関係性を学習することにより、高い精度で選手を識別できることがわかった。
【符号の説明】
【0081】
1 オブジェクト追跡システム
10 赤外光投光器
20 可視・赤外同軸光カメラ
30 オブジェクト追跡装置
31 赤外光検出手段
33 人物姿勢取得手段
331 人物姿勢検出手段(関節位置検出手段)
333 人物選択手段
35 オブジェクト識別手段
351 特徴ベクトル算出手段
353 属性情報生成手段
37 オブジェクト追跡手段
371 可視画像蓄積手段
373 軌跡描画手段(軌跡生成手段)