(58)【調査した分野】(Int.Cl.,DB名)
前記ユーザインタフェースは、複数のフレームのサムネイルビュー及び前記選択された接続されたコンポーネントを強調する前記サムネイルビューにおけるインジケータを利用する、
請求項3記載の方法。
前記ユーザインタフェースは、前記サムネイルビューにおける前記選択された接続されたコンポーネントを、前記軌跡のビューにおける前記代替の軌跡のうちの1つに関連付ける更なるインジケータを利用する、
請求項5記載の方法。
前記ユーザインタフェースは、複数のフレームのサムネイルビュー、前記選択された接続されたコンポーネントを強調する前記サムネイルビューにおけるインジケータ、及び前記代替の軌跡を表示する軌跡ビューを使用し、前記インジケータは、特定の軌跡を特定の選択された接続されたコンポーネントに関連付ける、
請求項2記載の方法。
【発明を実施するための形態】
【0008】
本発明の鍵となる態様は、人間又は別の信頼できる情報源からの最小の入力を使用することで、オブジェクト検出システムの性能を改善することである。
【0009】
軌跡に基づいた検出システムの目的は、おそらく実際のオブジェクトの経路を表すことである、軌跡のセットBT⊆Tを生成することである。T={T
1,T
2,...,T
M}は、全ての候補となる軌跡のセットであり、それぞれの候補となる軌跡T={C
1i,C
2i,C
Ni}は、所定の時間間隔において滑らかに動いているオブジェクトの実行可能な仮説を形成する連続するフレームにおける候補となるセットであり、1つのフレーム当たり1つの候補が存在する。候補は、ボール又は関心のあるオブジェクトである可能性がある、特定のフレームにおけるオブジェクトである(なお、候補“candidate”はオルタネート“Alternate”とも呼ばれる)。全ての候補のセットは、Cと呼ばれ、候補C
kiは、軌跡T
iのk番目のエレメントである。
【0010】
BTを形成する方法は、軌跡T
iを構成するエレメントに基づいて計算される最も高い候補のインデックスΩ(T
i)をもつ軌跡を繰り返し取り込み、それを移動させてBTを設定するアルゴリズムである。次いで、BTとの所定の不適合さの程度をもつTにおける全ての軌跡は、トリミングされるか又は削除される。Tにおいて軌跡がもはや存在しないとき、アルゴリズムが停止する。
【0011】
図1は、本発明により採用される軌跡に基づくボール検出方法100の1実施の形態のフローチャートである。本方法は、サッカーの試合のようなスポーツイベントである場合がある、入力ビデオ系列110に適用される。
【0012】
ステップ120で、プレイフィールドマスクPMが生成される。マスク生成は、グラスマスクGMを生成するため、芝生の領域を検出し、次いで、これら芝生の領域をカバーする穴のない領域である、プレイフィールドマスクを計算することを含む。
【0013】
ステップ130で、ボールである場合がある候補となるオブジェクトが検出される。フレームFの輝度成分Yを正規化されたガウスカーネルG
nkで畳込み演算を行い、出力画像Y
convを生成することで、強度画像において局所的な最大値が検出される。画素(x,y)は、T
imaxを予め設定された閾値として、Y(x,y)>Y
conv(x,y)+T
imaxである場合に、局所的な最大値として指定される。このアプローチは、ボールの画素を分離させることに成功するが、プレーヤ、フィールドライン、ゴールマウス等の幾つかの部分を分離する。それは、これらの特徴が局所的な最大となることができる明るいスポットを含むためである。最終的な結果は、1番目を示す明るいスポットをもつバイナリ画像I
imである。I
imにおける接続されたコンポーネントZ={Z
1,Z
2,...,Z
n}のセットは、「候補」と呼ばれ、「ボールの候補」を検出するために次のステップにおいて処理される。実施の形態では、G
nkは、分散4をもつ9×9のガウス核であり、閾値T
imaxは0.1である。
【0014】
ステップ120のプレイフィールド検出からの情報は、候補の数を低減するためにステップ130及び140で使用される。遠くのシーンにおいて、ボールがプレイフィールドの内側にあり、プレイフィールドの外側のオブジェクトは無視されるという想定がなされる。
【0015】
図2は、候補の検出のために使用されるプロセスのグラフによる例示を与える。フレーム210が与えられると、サッカーフィールドの画素は、フィールドが芝生からなるという情報を使用して識別される。プロセスの結果は、全てのフィールド画素を1として識別し、フィールドにおけるオブジェクトを含む全ての非フィールド画素を0として識別するバイナリマスク230である。サッカーフィールドエリアA
fieldは、非フィールドのオブジェクトを含めて、画像240に示される、フィールドの境界における画素数として計算される。候補の検出の結果は、画像220に示される。フィールド領域にない候補は、除かれ、結果として画像250が得られる。
【0016】
ステップ130からの候補の幾つかは、ボールである可能性が非常に低く、ステップ140でふるい分け及び認定プロセスを使用して除かれる。スコアは、それぞれの候補について計算され、それぞれがボールの予め確立されたモデルにどの位類似しているかに関する認定が与えられる。
【0017】
候補の幾つかは、ボールの特徴の統計情報を使用して除去することができる。実施の形態では、ボールの3つの特徴が考慮される。
Area(A)(領域)は、候補Z
iにおける画素の数である。
Eccentricity(E)(離心率)は、「細長さ“elongateness”」の測度である。オブジェクトが細長くなると、離心率が高くなる。実施の形態では、離心率を計算するために2値画像のモーメントを使用することができる。
Whiteness(W)(白色度)は、白色である画素の品質である。所与の画素のr,g及びb(それぞれ赤、緑及び青成分)が与えられると、白色度は以下のように定義される。
【0018】
【数1】
サンプルビデオの分析は、領域及び白色度ヒストグラムはガウス分布に従うことを示す。また、離心率ヒストグラムは、離心率の最小値が1であると考慮するため、対称化の後にガウス分布に従う。候補は、それらの特徴が範囲μ±nσの外にある場合に却下され、μは平均であり、σは対応する特徴の分布の標準偏差である。このふるいわけプロセスSに基づいて、Zにおける候補は、ボールのようなオブジェクトとして受け入れられるか又は却下される。ボールの特徴はフレームからフレームへと著しく変化するため、緩い範囲が使用される。
【0019】
領域Aは、μ
A=7.416及びσ
A=2.7433によるガウス分布としてモデル化され、範囲はn
A=3により制御される。Eは、μ
E=1及びσ
E=1.2355によるガウス分布としてモデル化され、範囲はn
E=3により制御される。Wは、μ
W=0.14337及びσ
W=0.034274によるガウス分布としてモデル化され、範囲はn
W=3により制御される。候補は、全ての3つの基準が保持されるように適合する必要がある。
【0020】
また、ステップ140において、ふるいわけプロセスS(Z)を通過した候補Cは、それらの特徴とボールの予め確立されたモデルとの類似性に基づいて認定される。A,E及びWは、ボールの候補のスコアを計算するあめに使用されるが、以下に加えて、より厳密なnの値が使用される。
最も近い候補への距離(DCC):ある候補C
iにおける何れかの画素と他の候補{C−C
i}における全ての他の画素との間の画素における最も近い距離。
フィールドのエッジへの距離(DF):所与の候補の中央とプレイフィールドマスクPMの外周との間の画素における最も近い距離。
オブジェクトマスクにおけるそれぞれのブロブ内にある候補の数(NCOM):所与の候補C
iとしてオブジェクトマスクOMにおける同じ接続されたコンポーネント内にあるCにおける候補の数。オブジェクトマスクOMは、プレイフィールド内の非芝生の画素を示す2値マスクであり、PM内のGMの反転として定義される。
【0021】
ボールは、互いに常に近いプレイヤのソックスのようなオブジェクトは対照的に、大部分の時間でプレイフィールド内で分離されたオブジェクトであることが期待される。従って、近隣のオブジェクトをもたず、且つ高いDCCを持つ候補は、ボールである可能性が高い。同様に、ボールはフィールドの境界の近くにあることも期待されない。この仮定は、芝生内に他のスペアボールが存在し、プレイフィールドの境界線の外にある場合に特に重要である。
【0022】
OMは、プレイフィールド内のどの画素が芝生でないかに関する情報を与える。これは、プレーヤ及びフィールドラインを含み、それらの内部に(例えばプレーヤのソックス又はライン部分といった)「ボールのような」ブロブを含む。理想的に、ボールの候補は、他の大きなブロック内にはない。唯一の候補C
iがOMの接続されたコンポーネント内にあることが期待されるとき、NCOM
iは、理想モデルにおいて1であることが期待される。
【0023】
従って、NCOMを計算することから利益を得る。ある候補C
iのスコアS
iは、以下のように計算される。
【0024】
【数2】
現段階で、0に等しいスコアを有する候補が拒否される。残りの候補について、スコアS
iは、以下の他の特徴を使用してペナルティが課される。
【0025】
【数3】
実施の形態では、μ
A=7.416,σ
A=2.7443,n
A=1.3,μ
E=1,σ
E=1.2355,n
E=1.3,μ
W=0.14337,σ
W=0.034274,n
W=1.3,DCC
thr=7画素,DF
thr=10画素及びNCOM
thr=1である。
【0026】
図3は、あるフレームにおけるボールの候補の識別の結果を例示するものであり、(ボールの候補310〜390についての)カウンディングボックスは、ボールの候補の存在を示す。候補のスコアを表す異なる色がインタフェースにおいて提示される。赤、緑及び青は、3,2及び1のスコアをそれぞれ表す。
図3において、候補390は赤(すなわちスコア3)であり、候補350は緑(すなわちスコア2)であり、残りの候補は青(すなわちスコア1)である。この例示では、候補310,320,335,340,360及び380は、プレイヤの一部又はプレイヤの服を表し、候補330,370は、フィールドの他のオブジェクトを現し、候補390は、実際のボールを表す。
【0027】
ステップ150で、軌跡の開始ポイント又は「シード“seed”」が識別される。候補のペア{C
i,C
j}が閾値SEED
thrよりも互いに空間的に近く、且つ1つの候補のスコアが3であるか、又は2つの候補のスコアが2である基準の何れかを満たすように、シードSEED
kは、2つの連続するフレームF
t,F
t+1におけるボールの候補のペア{C
i,C
j}であり、C
iはF
tに属し、C
jはF
t+1に属する。好適な実施の形態では、SEED
thr=8画素である。基準は、時間の複雑度のような他の検討事項に対処するために変更される。
【0028】
ステップ160で、候補の軌跡は、ステップ150のシードから作成される。軌跡T
i={C
1i,C
2i,...,C
Ni}は、フレーム当たり1つで、連続するフレームにおける候補のセットとして定義され、所定の時間間隔又はシードSEED
iを使用して生成されるフレームレンジにおいて滑らかに動いているオブジェクトの実行可能な仮説を形成する。
【0029】
両方向においてシードを成長させることで、軌跡を形成するために線形カルマンフィルタが使用される。シードを構成する2つのサンプルは、フィルタの初期状態を決定する。この情報を使用して、フィルタは、次のフレームにおけるボールの候補の位置を予測する。予測された位置でセンタリングされるサーチ窓内に次のフレームにおける候補が存在する場合、予測された位置に最も近い候補が軌跡に追加され、その位置は、フィルタを更新するために使用される。候補が窓において発見されない場合、予測された位置は根拠のないポイントとして軌跡に追加され、フィルタを更新するために使用される。軌跡を構築する手順は、a)N個の連続するフレームについて予測された位置に近い候補が存在しない場合、及びb)予測された位置の近くでK(例えばK=1)を超える個数の候補が存在する場合に終了する。フィルタは、双方向の方式で機能し、従って時間的に前方に軌跡を成長させた後、カルマンフィルタは、再初期化され、時間的に後方に成長される。軌跡を終了する第一の基準は、その極値で根拠のないポイントのセットを生成する。次いで、これらの根拠のないポイントは、軌跡から除去される。
【0030】
図4は、上述された方法を使用して形成された候補となる軌跡410〜460のプロット400を例示する。x軸は、フレームにおける時間を表す。y軸は、潜在的なボールと画像の左上の画素との間のユークリッド距離である。異なる候補となる軌跡を例示するために複数の色が使用される。
【0031】
候補となる軌跡T={T
1,T
2,...,T
M}の幾つかは、実際のボールにより記述される経路の一部であり、他は、他のオブジェクトに関連する軌跡である。アルゴリズムの目標は、他を却下する一方、実際のボールの経路を表している可能性が高い軌跡のセブセットを選択することで、軌跡BTを形成することである。アルゴリズムは、軌跡の信頼インデックス、軌跡のオーバラップインデックス、及び軌跡の距離のインデックスの使用を含む。それぞれの軌跡のスコアは、軌跡の長さ、軌跡を構成する候補のスコア、及び軌跡における根拠のないポイントの数に基づいて生成される。
【0032】
信頼インデックスは、以下のように計算される。
【0033】
【数4】
Ω(T
j)は軌跡T
jの信頼インデックスであり、p
iはスコア“i”をもつT
jにおける候補の数、q
i=p
i/|T
j|であり、軌跡においてスコア“i”をもつ候補の分数であり、|T
j|は、軌跡における候補の数であり、λ
i及びω
i(λ
1<λ
2<λ
3及びω
2<ω
3)は、コンポーネントの重要度を調節し、rは、軌跡における根拠のないポイントの数であり、Tは根拠のないポイントの重要度ファクタである。実施の形態ではλ
1=0.002,λ
2=0.2,λ
3=5,ω
2=0.8,ω
3=2及びT=10である。
【0034】
それぞれ選択された軌跡について、時間的にオーバラップするものがある。オーバラップインデックスが高い場合、対応する軌跡が廃棄される。インデックスが低い場合、競合する軌跡のオーバラップする部分がトリミングされる。
【0035】
このオーバラップインデックスは、高い信頼インデックスをもつ長い軌跡に報酬を与える一方、オーバラップしているフレームの数にペナルティを課す。
【0036】
【数5】
ここでX(T
i,T
j)は、軌跡T
iの軌跡T
jとのオーバラップインデックスである。ρ(T
i,T
j)は、T
iとT
jとがオーバラップするフレームの数である。Ω(T
i)は、軌跡T
iの信頼インデックスである。
【0037】
軌跡の距離のインデックスの使用は、BTの空間‐時間の整合性が増加する。ボールが最高速度V
max画素/フレームで移動するという仮説を使用して、軌跡の最も近い極値間のボールの候補の空間的な距離が、V
maxに、極値に許容値Dを加えたものの間のフレーム数の倍数よりも高い場合、2つの軌跡BT及びT
iは、適合しない。さもなければ、2つの軌跡は、適合し、T
iは、BTの一部である。
【0038】
距離インデックスは、以下により与えられる。
【0039】
【数6】
ここでdist(pos(C
i),pos(C
j))は、候補C
i及びC
jの位置間のユークリッド距離であり、frame(C
i)は、候補C
iが属するフレームである。pos(C)は、フレーム内の候補Cの中心の(x,y)位置であり、BT
iは、BTにおけるi番目の候補であり、CPDは、最も近い前の距離であり、CNDは、最も近い次の距離であり、CPFは、最も近い前のフレームであり、CNFは、最も近い次のフレームである。
【0040】
DI(BT,T
i)=1である場合、軌跡T
iはBTと一致する。この基準がなければ、T
iをBTに加えることは、時間的な不一致の問題を提示する可能性があり、この場合、ボールは、極端に短い時間間隔で、ある空間的な位置から別の位置にジャンプする場合がある。軌跡の選択アルゴリズムに距離インデックスの基準を加えることで、この問題が解決される。好適な実施の形態では、V
max=10画素/フレーム及びD=10画素である。
【0041】
2つの軌跡選択アルゴリズムが実現及びテストされる。第一のアルゴリズムは、最も高い信頼インデックスをもつ候補となる軌跡を繰り返し選択し、選択された軌跡と適合しない軌跡を除去又はトリミングする。第二のアルゴリズムは、最短経路の問題として定式化することでこの問題を解決しようとする。2つのアルゴリズムは、匹敵する性能を有するように調整される。
【0042】
Tである候補となる軌跡のセットが与えられると、アルゴリズムは、ビデオ系列に沿ったボールの軌跡を記述する候補となる軌跡のサブセットを出力BTとして生成する。アルゴリズムは、最も高い信頼インデックスをもつ軌跡をTから繰り返し取り込み、それをBTに移動する。次いで、BTとオーバラップしているTにおける全ての軌跡が処理され、オーバラップするインデックスX(BT,T
i)及び距離インデックスDI(BT,T
i)に依存して、軌跡のトリミング又は除去が行われる。アルゴリズムは、Tにおいて1以上の軌跡が存在しないときに停止する。
【0043】
アルゴリズムは、以下のように記述される。
【0044】
【表1】
トリミング処理trim(BT,T
i)は、軌跡T
iから、BTとT
iとの間のオーバラップしているフレームにある全ての候補を除去することからなる。このプロセスがT
iの時間的なフラグメンテーション(すなわち候補は中央から除去される)につながる場合、新たな軌跡としてフラグメントがTに加えられ、T
iは、Tから除去される。好適な実施の形態では、オーバラップインデックスの閾値O
thr=0.5が使用される。
【0045】
図5は、候補となる軌跡510〜550のセットのプロット500であり、そのうちの幾つかは、実際のボールの軌跡である。x軸は、フレームにおける時間を表す。y軸は、ボールと画像の左上画素との間のユークリッド距離である。軌跡520及び530は、ボールの軌跡を記述するアルゴリズムにより選択され、実際のボールの軌跡である。軌跡510,540及び550は、アルゴリズムにより却下される。楕円部分570は、ボールの実際の経路を表す。例えば、軌跡の選択アルゴリズムは、実際のボールの軌跡の非常に正確な推定を提供することがわかる。
【0046】
最終的なボールの軌跡を生成する別の方法は、Dijkstraの最短経路アルゴリズムに基づく。候補となる軌跡は、グラフにおけるノードとして見られる。2つのノード(又は軌跡)間のエッジは、2つの軌跡間の適合性の測度として重み付けされる。適合度の測度の逆は、ノード間の距離として見ることができる。全体のボールの経路の開始及び終了の軌跡(T
s,T
e)が既知である場合、その間の軌跡は、経路に沿った距離の合計を最小化することでノードT
s及びT
e間のグラフにおける最短経路を発見するDijkstraのアルゴリズムを使用して選択される。
【0047】
第一のステップで、軌跡間の適合度のスコアを含む適合度マトリクスが生成される。Nを候補となる軌跡の数とする。N×Nの適合度マトリクスのセル(i,j)は、軌跡T
iとT
jの間の適合度スコアを含む。
【0048】
2つの軌跡T
i及びT
jが所定の閾値を超えてオーバラップするか、又はT
iがT
jの後に終了した場合、それらの間の適合度インデックスは、無限大となる。T
iがT
jの後に終了することを強制することで、経路は常に時間的に先進することが保証される。なお、Φ(T
i,T
j)がΦ(T
j,T
i)と同じである必要はないので、基準は適合度マトリクスが非対称であることを意味することに留意されたい。T
iとT
jとの間のオーバラップインデックスが小さい場合、低い信頼インデックスをもつ軌跡は、適合度インデックスを計算するためにトリミングされる。2つの軌跡間の適合度インデックスは、以下のように定義される。
【0049】
【数7】
ここでΦ(T
i,T
j)は、軌道T
iとT
jとの間の適合度インデックスであり、Ω(T
i)は、軌跡T
iの信頼インデックスである。sdist(T
i,T
j)は、T
iの終わりでの候補とT
jの開始での候補との間の画素における空間的な距離であり、tdist(T
i,T
j)は、T
iの終わりとT
jの開始との間のフレームにおける時間であり、α,β及びγ(all < 0)は、相対的なコンポーネントの重要度であり、好適な実施の形態では、α=−1/70,β=−0.1及びγ=−0.1である。
【0050】
ひとたび適合度マトリクスが作成されると、Dijkstraの最短経路アルゴリズムは、ある軌跡のノードから別の軌跡のノードに進行するための距離(すなわち適合度の逆)を最小にするために使用される。全体のボールの経路の開始及び終了の軌跡(T
s,T
e)が既知である場合、中間の奇跡は、最短経路のアルゴリズムを使用して発見される。
【0051】
しかし、T
s,T
eは、事前に知られていない。開始及び終了の軌跡の全ての組み合わせチェックする複雑度を低減するため、閾値よりも高い信頼インデックスをもつ軌跡を使用して、全ての組み合わせのサブセットのみが考慮される。開始及び終了の軌跡(ノード)のそれぞれの組み合わせが順に考慮され、最短経路が上述されたように計算される。最後に、全てのこれらの組み合わせのうちで全体の最良の経路が選択される。
【0052】
最良のボールの経路は、低コストを有し、時間的に長く、以下の関数を最小にする。
【0053】
【数8】
Qは、最初の軌跡T
iから最後の軌跡T
jまでの最短経路のアルゴリズムを使用して構築されるT(ボール経路)からの軌跡のサブセットであり、SC(Q)は、Qのスコアであり、CD(Q)は、Qにおける軌跡を通過する、最初の軌跡T
iから最後の軌跡T
jまでのコストであり、length(Q)は、時間的ば軌跡のセットQの長さであり(すなわち軌跡間のギャップを含むQによりカバーされるフレーム数)、max_c及びmax_lは、構築される全ての最短の経路のうちの最大コスト及び最長の長さである(開始及び終了の奇跡のそれぞれの組み合わせについて1つ)、wはコスト対長さの相対的な重要度であり、この実施の形態では、w=0.5である。
【0054】
アルゴリズムの結果を改善する1つの方法は、軌跡の信頼インデックスをユーザが操作するのを可能にすることである。これを行うことで、アルゴリズムは、BTを形成するために良好な軌跡の選択を生成するために誘導される。
【0055】
残念なことに、軌跡の形状により軌跡がノーるのを含むことをユーザは保証することができず、他方で、アルゴリズムにより選択された候補が実際にボールであるかをチェックするため、フレーム毎に進めることはユーザにとって面倒である。
【0056】
候補をダイレクトに扱う代わりに軌跡のレベルで機能する利点の1つは、BTにおける軌跡のセットの濃度がBTにおける候補のセットの濃度よりも常に低いことである。さらに、高い可能性で、所与の軌跡を形成する候補は、同じオブジェクトに対応する。これら2つの仮定を使用して、BTを構成する軌跡についてその選択された候補をもつ唯一のフレームにより、BTにおける軌跡が適切に選択されているかをユーザに迅速に通知し、適切に選択されていない場合には是正措置をとることで十分である。
【0057】
ユーザにとっての相互作用のエレメントは候補であり、軌跡ではない。従って、ユーザは、(ボールである)良い候補又は(ボールでない)誤った候補として候補を分類することができる。
【0058】
C
gを良い候補とし、C
wを誤った候補とする。次いで、
【数9】
は、それぞれ、良い候補と誤った候補とを含む軌跡のセットである。
【0059】
最終的に、候補をC
g及びC
wをとして分類する目標は、T
wからの軌跡ではなく、T
gからの奇跡を含むBTを生成することである。従って、BTを生成するアルゴリズムは、分類された候補を利用するために、幾つかのやり方で変更される。以下は、係る変更の例である。
【0060】
明らかに、BTの一部となるようにT
gからの軌跡を有することが望まれ、従ってこれを達成するオプションは、Tにおける他の軌跡よりも高い信頼インデックスを軌跡T
gに与えることである。先に記述されたアルゴリズムは、最も高い信頼インデックスをもつTからの軌跡を繰り返し取る。
【0061】
これを追跡する1つの方法は、Tにおける最大値よりも大きい新たな信頼インデックスをT
gに与えることによる。これが機能するとしても、これが最良のオプションではない。それは、全ての軌跡T
gが同じ信頼インデックスを有し、どれが最小の軌跡であるかを判定することができないためである。良い候補を共有することができる幾つかの軌跡が存在することを念頭に置くことは重要である。
図6及び
図7を参照されたい。
図6は、候補の軌跡のセットを示す。X軸は、フレームにおける時間を表す。Y軸は、候補と画像の左上の画素との間のユークリッド距離である。Z軸は、異なる軌跡を示すために使用される。候補となる軌跡は通常はオーバラップすることに気付くことは重要である。異なるシェーディングレベルは、軌跡を区別するために使用される。
図6に示される多数の軌跡が存在する。例えば、影付けされたバンド601〜610のそれぞれは、所与の候補となる軌跡であるそれぞれ狭いラインをもつ軌跡のセットである。
【0062】
図7は、候補となる軌跡Tのセットの2次元の表現である。X軸は、フレームにおける時間を表す。Y軸は、候補と画像の左上の画素との間のユークリッド距離である。
図6における軌跡の幾つかは、
図7で示される。
【0063】
好適なオプションは、ポジティブなバイアスKをそれらの信頼インデックスに加えることである。これを行うことで、T
gにおける軌跡は、T
gの間で競争する。これは、それらの前の信頼インデックスは、どの軌跡がBTについての最初の選択であるかを判定するからである。バイアスKは、Tにおける最大の信頼インデックスとして設定されるか、又はより高い値として設定される。
【0064】
図8は、ユーザがデータと接触するユーザインタフェースを示す。上のユーザインタフェースプロット又は軌跡のビュー820は、候補となる軌跡Tを示し、
図7におけるように、X軸はフレームにおける時間を表し、Y軸は、候補と画像の左上画素との間のユークリッド距離を表す。太い軌跡604,608,610及び太線により表される2つの他のラベル付けされない軌跡は、現時点でBTに属する。プロットの下には、サムネイル801のセットが存在し、それぞれ1つはBTの軌跡に関連される。ボールとして検出されたオブジェクト805は、サムネイルの中央にあり、円により囲まれている(明確さのために二重下線が施されており)、従ってユーザは、軌跡がボールを追跡しているか否かを迅速に見ることができる。サムネイルが選択されたとき、選択されたサムネイル802のフレームは、ボトム又は選択フレーム810に現れる。ユーザは、候補となるオブジェクトをボールと設定/非設定することで、候補となるオブジェクトと相互作用する。明確さのために一重下線が施される矩形は、候補を示し、円は、どの候補がボールとして選択されたかを示す。円及び他のマーキングは、ユーザインタフェースの一部であるマーカであり、ユーザインタフェースは、サムネイルにおけるオブジェクトを、サムネイル801、ボトム又は選択フレーム810におけるオブジェクト及びユーザインタフェースプロット820における軌跡と、ユーザが関連付けするのを可能にする。
【0065】
ユーザは、T
wからの軌跡がBTの一部となるのを望まない。このことを考慮して、2つのオプションがここでは妥当である。第一のオプションは、T
wにおける全ての軌跡を除くことであり、第二のオプションは、それらの信頼インデックスに悪いスコアを与えるように、それらの信頼インデックスを変更することである。
【0066】
T
wからの全ての軌跡を除くことで、それらの何れもBTに現れないことが保証される。他方で、この出来事の見込みが低いとしても、トリミングされ、BTを生成するために使用される軌跡の機会を除く。
【0067】
T
wの軌跡に負の値を与え、その信頼インデックスが0よりも低い軌跡を却下するようにアルゴリズムを変更することで、BTを構築するため、T
wからの軌跡を使用する問題を回避することができる。BTを生成するプロセスの間、T
wからの幾つかの軌跡が誤りとして分類された候補が除かれるやり方でトリミングされる場合、軌跡は、BTの一部になる。信頼インデックスは、誤った候補が除かれた後に正になる。
【0068】
図9は、インタフェースを再び示す。ここで、選択されたサムネイル802は、誤った軌跡610を含む。ここで、フレームは、インタフェースのボトム810に表示される。候補をクリックすることで、コンテクストメニュー815は、スクリーンに現れ、ユーザは、
図9に示されるように、その候補を誤った候補として選択することができる。これは、誤った候補を含む全ての軌跡の信頼インデックスを低くし、BTは、計算し直される。
【0069】
システムは、候補のセットを生成するために使用されるボールの予め確立されたモデルを有する。離心率、サイズ及び色は、上述されたようにモデルの幾つかのエレメントである。
【0070】
僅かな変更により、システムは、ボールのモデルを更新するため、ユーザ入力から利益を得る。例えば、ユーザがボールの候補を良いボールの候補として設定するたび、モデルのパラメータは、新たな候補と良好に整合するために変更される。
【0071】
本発明は、
図10におけるフローチャートに示される方法とすることができる。本方法は、ビデオ系列の一部であるビデオフレームにおける接続されたコンポーネントのセットを識別するステップ1010を含む。接続されたコンポーネントは、ボールの画素又は靴のような他のオブジェクトの画素である。次いで、ステップ1020は、少なくとも1つの画像の特徴に関して接続されたコンポーネントのセットのそれぞれを評価し、画像の特徴は、領域、離心率又は白色度である。次いで、ステップ1030は、接続されたコンポーネントのセットのそれぞれの少なくとも1つの画像の特徴を予め決定された基準と比較し、接続されたコンポーネントのフィルタリングされたリストを生成し、このステップは、
図1におけるステップ120及び130の適用を含み、あるフレームの輝度値又は色度値を予め決定された基準として使用し、バックグランドを除去することを含む。ステップ1040は、他の連続するフレームにおいて、同じ繰り返すステップ、識別するステップ、評価するステップ及び比較するステップを実行する。ステップ1050は、接続されたコンポーネントのうちの選択されたコンポーネントを選択することを含む。次いで、ステップ1060は、複数のフレームにわたり生成された、選択された接続されたコンポーネント(すなわち関心のあるオブジェクト)の候補となる軌跡のセットを生成する。ステップ1070は、表示するステップであり、この表示するステップでは、選択された接続されたコンポーネントの候補となる軌跡がユーザに示され、本方法は、チャート、プロット等で軌跡をユーザが見るのを可能にするユーザインタフェースを組み込んでいる。ステップ1080は、ユーザにより提供された幾つかの入力により、ユーザインタフェースを通して選択された接続されたコンポーネントの特定の候補となる軌跡をユーザが除くステップである。少なくとも1つの実施の形態では、ユーザは、軌跡をダイレクトに除去しないが、候補がボールであるか否かを示すフィードバックを、このステップにおいてアプリケーションに与える。この除去するステップでは、ユーザは、これらの候補がBTに含まれないように、誤った候補を本質的に識別する。ステップ1090は、ビデオ系列の最終的な画像は、選択するステップ及び除去するステップに応じて表示され、最終的な画像において、所望のオブジェクト及びその軌跡の可視性を改善するオリジナルビデオの部分が選択される。選択される部分は、クローズアップ、トリミングされた部分又はズームされた部分である。改善される可視性は、所望のオブジェクトのセンタリング又はオブジェクトを有さないフレームの除去を含む。
【0072】
本発明の特徴は、
図11から更に理解され、セットBTは、ステップ1110においてアルゴリズムにおいて形成される。ステップ1120において、BTにおける軌跡は、サムネイルのビュー及び軌跡を組み込んだユーザインタフェースに表示され、選択される。ステップ1130において、軌跡は、(ボールである)良い候補又は(ボールではない)誤った候補として分類することができる。また、ステップ1110は、BTの組成変更ステップであり、BTは、改善されたBTを取得するためにステップ1130に応答して組成変更される。ステップ1110、1120及び1130は、BTがもはや変更しなくなるまで繰返され、ボールのようなオブジェクトの検出が可能となる。本発明の実施の形態では、サムネイルは、候補となる軌跡の実行中のビデオである。
【0073】
本発明は特定の実施の形態の観点で記載されたが、本発明の範囲に含まれる変更が行われることを理解されたい。例えば、様々な処理ステップは、個別に又は組み合わされて実現される場合があり、汎用又は専用のデータ処理ハードウェア又はソフトウェアで実現される場合があり、閾値及び他のパラメータは、ビデオ入力の変更するタイプに適するように調節される場合がある。