特許第5795594号(P5795594)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ トムソン ライセンシングの特許一覧

特許5795594ヒューマンインタラクションによる軌跡に基づいたシステム
<>
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000012
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000013
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000014
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000015
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000016
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000017
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000018
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000019
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000020
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000021
  • 特許5795594-ヒューマンインタラクションによる軌跡に基づいたシステム 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5795594
(24)【登録日】2015年8月21日
(45)【発行日】2015年10月14日
(54)【発明の名称】ヒューマンインタラクションによる軌跡に基づいたシステム
(51)【国際特許分類】
   G06T 7/20 20060101AFI20150928BHJP
【FI】
   G06T7/20 B
【請求項の数】16
【全頁数】18
(21)【出願番号】特願2012-544477(P2012-544477)
(86)(22)【出願日】2010年12月10日
(65)【公表番号】特表2013-514581(P2013-514581A)
(43)【公表日】2013年4月25日
(86)【国際出願番号】US2010003140
(87)【国際公開番号】WO2011084130
(87)【国際公開日】20110714
【審査請求日】2013年12月10日
(31)【優先権主張番号】61/284,261
(32)【優先日】2009年12月16日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】バーコンズ−パラオ,ジーザス
(72)【発明者】
【氏名】バガヴァティー,シタラム
(72)【発明者】
【氏名】ルラッチ,ジョーン
(72)【発明者】
【氏名】ザン,ドン−チン
【審査官】 佐藤 実
(56)【参考文献】
【文献】 米国特許出願公開第2009/0147992(US,A1)
【文献】 特開2002−099918(JP,A)
【文献】 特開2009−104474(JP,A)
【文献】 特開2004−326693(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/20
(57)【特許請求の範囲】
【請求項1】
ビデオ系列のビデオフレームにおいて、接続されたコンポーネントのセットを識別するステップと、
ユーザインタフェースを通して、選択された接続されたコンポーネントの代替の軌跡を表示するステップと、
前記ユーザインタフェースの入力に応じて、前記選択された接続されたコンポーネントの少なくとも1つの代替の軌跡を除くステップであって、前記少なくとも1つの代替の軌跡が誤った候補としてユーザによって具体的に分類され、かつ前記少なくとも1つの代替の軌跡が除かれる、ステップと、
前記選択された接続されたコンポーネントに属する複数の前記代替の軌跡について信頼レベルを生成するステップであって、前記ユーザによって誤った候補として分類された前記少なくとも1つの代替の軌跡が、前記信頼レベルが生成された前記選択された接続されたコンポーネントに属する複数の前記代替の軌跡の1つである状態から除かれる、ステップと、
あらかじめ定められた値より低い信頼レベルを持つ代替の軌跡と、誤った候補として前記ユーザによって分類され除かれることとなった前記少なくとも1つの代替の軌跡とを除去するステップと、
前記除くステップ、生成するステップ、及び除去するステップに応じて前記ビデオ系列の画像を表示するステップと、
を含む方法。
【請求項2】
少なくとも1つの画像の特徴に関して、前記接続されたコンポーネントのセットのそれぞれを評価するステップと、
接続されたコンポーネントからなるフィルタリングされたリストを生成するように、前記接続されたコンポーネントのセットのそれぞれの前記少なくとも1つの画像の特徴を予め決定された基準と比較するステップと、
連続するフレームについて、前記識別するステップ、前記評価するステップ及び前記比較するステップを繰返すステップと、
前記接続されたコンポーネントのうちの1つを選択するステップと、
前記表示するステップのために、複数のフレームにわたり生成される前記選択された接続されたコンポーネントの代替の軌跡のセットを生成するステップと、
を含む請求項1記載の方法。
【請求項3】
前記少なくとも1つの画像の特徴は、領域、離心率又は白色度である、
請求項記載の方法。
【請求項4】
前記ユーザインタフェースは、フレーム時間の関数として代替の軌跡を表す軌跡のビューを利用する、
請求項記載の方法。
【請求項5】
前記ユーザインタフェースは、複数のフレームのサムネイルビュー及び前記選択された接続されたコンポーネントを強調する前記サムネイルビューにおけるインジケータを利用する、
請求項記載の方法。
【請求項6】
前記ユーザインタフェースは、前記サムネイルビューにおける前記選択された接続されたコンポーネントを、前記軌跡のビューにおける前記代替の軌跡のうちの1つに関連付ける更なるインジケータを利用する、
請求項記載の方法。
【請求項7】
前記接続されたコンポーネントのセットを識別するステップは、局所的な最大を表す画像を生成するように、前記ビデオ系列の画像を処理るステップを含む、
請求項2記載の方法。
【請求項8】
記処理するステップは、前記画像の輝度成分をカーネルと畳むステップを含む、
請求項記載の方法。
【請求項9】
前記カーネルは、正規化されたガウス核である、
請求項記載の方法。
【請求項10】
前記基準は、最も近い代替の軌跡への距離、フィールドのエッジへの距離、又は2値オブジェクトマスク内の同じ接続されたコンポーネント内の代替の軌跡の数を含む、
請求項2記載の方法。
【請求項11】
記評価するステップは、接続されたコンポーネントのペアを識別するステップを含み、
前記ペアの1つのコンポーネントは、第一の画像にあり、前記ペアの1つのコンポーネントは、次の画像にあり、
前記ペアにおける2つの接続されたコンポーネントの位置間の距離は、予め決定された距離の閾値未満である、
請求項2記載の方法。
【請求項12】
記評価するステップは、前記軌跡の長さ、前記軌跡を構成する接続されたコンポーネントの特性、及び前記軌跡における根拠のないポイントの数、を評価する、
請求項2記載の方法。
【請求項13】
記ビデオ系列画像を表示するステップは、前記選択された軌跡に沿って移動するオブジェクトを強調する、
請求項2記載の方法。
【請求項14】
記ユーザインタフェースは、前記代替の軌跡の分類のためのコンテクストメニューを利用する、
請求項記載の方法。
【請求項15】
前記ユーザインタフェースは、複数のフレームのサムネイルビュー、前記選択された接続されたコンポーネントを強調する前記サムネイルビューにおけるインジケータ、及び前記代替の軌跡を表示する軌跡ビューを使用し、前記インジケータは、特定の軌跡を特定の選択された接続されたコンポーネントに関連付ける、
請求項2記載の方法。
【請求項16】
前記サムネイルは、代替の軌跡を表示中のビデオである、
請求項記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像系列における軌跡に基づいた検出システムに関する。
本出願は、2009年12月16日に提出された米国特許仮出願第61/284,261号の利益を特許請求するものであり、その内容は本明細書に盛り込まれる。
【背景技術】
【0002】
携帯機器の機能が益々充実し、携帯デジタルテレビ規格が開発されるにつれて、係る装置でビデオ番組を見ることがますます実用的になってきている。しかし、これらの装置の小型スクリーンは、特にスポーツイベントの視聴について幾つかの制限を提示する。スポーツ番組におけるボールのような小さなオブジェクトは、見る事が困難である。高いビデオ圧縮率を使用することは、特に遠くのシーンにおけるボールのような小さなオブジェクトの外観を著しく低下させることで、状況を悪化させる。
【0003】
従って、画像処理を適用してボールの外観を改善することが望ましい。スポーツビデオにおけるボール又はビデオにおける他の小さな動くオブジェクトを検出することは、困難な課題である。例えばボールは、フィールドラインで遮蔽されるか又はマージされる可能性がある。ボールが完全に目に見えるときでさえ、形状、領域及び色のようなその特性はフレームからフレームへと変わる場合がある。さらに、あるフレームにおいてボールのような特性をもつ多くのオブジェクトが存在する場合、唯一のフレームに基づいてどれがボールであるかに関する判定を行うことは困難であり、従って画像のエンハンスメントを行うことは困難である。
【0004】
サッカーボール等のような動くオブジェクトを検出して追跡する方法がこれまで開発されており、かなりロバスト且つ正確である。係る方法は、PCT/US10/002039に開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、これまでの方法は、幾つかの状況において機能しない。機能しない例は、ボールのような所望のオブジェクトを追跡しないこと、又は所望のオブジェクトではない別のオブジェクトを追跡することを含む。
係るように、従来技術の問題を解決する動くオブジェクトを検出して追跡する改善された方法を提供する必要が存在する。
【課題を解決するための手段】
【0006】
上述された課題を解決するため、本発明は、ユーザインタフェースによるヒューマンインタラクションを取り入れた、ビデオ系列において動くオブジェクトを検出する軌跡に基づいた技術を使用する方法及び関連する装置に関する。本方法は、ビデオフレームにおける接続されたコンポーネントのセットを識別して評価するステップ。接続されたコンポーネントの特徴を予め決定された基準に比較することで、接続されたコンポーネントのリストをフィルタリングするステップ、複数のフレームにわたり候補となる軌跡を識別するステップ、候補となる軌跡を評価して、選択された軌跡を決定するステップ、インタフェースの使用により正しくない軌跡を除去するステップ、及び評価ステップ並び除去するステップに応じて、ビデオ系列における画像を処理するステップを含む。
【図面の簡単な説明】
【0007】
本発明は、添付図面を参照して例を通して以下に記載される。
図1】本発明に係る軌跡に基づくボール検出方法を例示するフローチャートである。
図2】プレイフィールドマスクを生成し、ボールの候補を識別するプロセスを例示する図である。
図3】ビデオフレームにおけるボールの候補を例示する図である。
図4】例示的な候補となる軌跡のプロットである。
図5】例示的な候補となる軌跡と実際のボールの軌跡のプロットである。
図6】候補間の違いを示し、多くの候補となる軌跡において所与の候補がどのように存在するかを示す例示的な候補となる軌跡の2次元プロットである。
図7】異なる視点から図6の例示的な候補となる軌跡のプロットである。
図8】本発明に係るユーザインタフェースのビューを例示する図である。
図9】本発明に係るユーザインタフェースの別のビューを例示する図である。
図10】本発明に係る軌跡に基づくボール検出及び表示方法のフローチャートである。
図11】本発明に係る軌跡に基づくボール検出方法のフローチャートである。
【発明を実施するための形態】
【0008】
本発明の鍵となる態様は、人間又は別の信頼できる情報源からの最小の入力を使用することで、オブジェクト検出システムの性能を改善することである。
【0009】
軌跡に基づいた検出システムの目的は、おそらく実際のオブジェクトの経路を表すことである、軌跡のセットBT⊆Tを生成することである。T={T1,T2,...,TM}は、全ての候補となる軌跡のセットであり、それぞれの候補となる軌跡T={C1i,C2i,CNi}は、所定の時間間隔において滑らかに動いているオブジェクトの実行可能な仮説を形成する連続するフレームにおける候補となるセットであり、1つのフレーム当たり1つの候補が存在する。候補は、ボール又は関心のあるオブジェクトである可能性がある、特定のフレームにおけるオブジェクトである(なお、候補“candidate”はオルタネート“Alternate”とも呼ばれる)。全ての候補のセットは、Cと呼ばれ、候補Ckiは、軌跡Tiのk番目のエレメントである。
【0010】
BTを形成する方法は、軌跡Tiを構成するエレメントに基づいて計算される最も高い候補のインデックスΩ(Ti)をもつ軌跡を繰り返し取り込み、それを移動させてBTを設定するアルゴリズムである。次いで、BTとの所定の不適合さの程度をもつTにおける全ての軌跡は、トリミングされるか又は削除される。Tにおいて軌跡がもはや存在しないとき、アルゴリズムが停止する。
【0011】
図1は、本発明により採用される軌跡に基づくボール検出方法100の1実施の形態のフローチャートである。本方法は、サッカーの試合のようなスポーツイベントである場合がある、入力ビデオ系列110に適用される。
【0012】
ステップ120で、プレイフィールドマスクPMが生成される。マスク生成は、グラスマスクGMを生成するため、芝生の領域を検出し、次いで、これら芝生の領域をカバーする穴のない領域である、プレイフィールドマスクを計算することを含む。
【0013】
ステップ130で、ボールである場合がある候補となるオブジェクトが検出される。フレームFの輝度成分Yを正規化されたガウスカーネルGnkで畳込み演算を行い、出力画像Yconvを生成することで、強度画像において局所的な最大値が検出される。画素(x,y)は、Timaxを予め設定された閾値として、Y(x,y)>Yconv(x,y)+Timaxである場合に、局所的な最大値として指定される。このアプローチは、ボールの画素を分離させることに成功するが、プレーヤ、フィールドライン、ゴールマウス等の幾つかの部分を分離する。それは、これらの特徴が局所的な最大となることができる明るいスポットを含むためである。最終的な結果は、1番目を示す明るいスポットをもつバイナリ画像Iimである。Iimにおける接続されたコンポーネントZ={Z1,Z2,...,Zn}のセットは、「候補」と呼ばれ、「ボールの候補」を検出するために次のステップにおいて処理される。実施の形態では、Gnkは、分散4をもつ9×9のガウス核であり、閾値Timaxは0.1である。
【0014】
ステップ120のプレイフィールド検出からの情報は、候補の数を低減するためにステップ130及び140で使用される。遠くのシーンにおいて、ボールがプレイフィールドの内側にあり、プレイフィールドの外側のオブジェクトは無視されるという想定がなされる。
【0015】
図2は、候補の検出のために使用されるプロセスのグラフによる例示を与える。フレーム210が与えられると、サッカーフィールドの画素は、フィールドが芝生からなるという情報を使用して識別される。プロセスの結果は、全てのフィールド画素を1として識別し、フィールドにおけるオブジェクトを含む全ての非フィールド画素を0として識別するバイナリマスク230である。サッカーフィールドエリアAfieldは、非フィールドのオブジェクトを含めて、画像240に示される、フィールドの境界における画素数として計算される。候補の検出の結果は、画像220に示される。フィールド領域にない候補は、除かれ、結果として画像250が得られる。
【0016】
ステップ130からの候補の幾つかは、ボールである可能性が非常に低く、ステップ140でふるい分け及び認定プロセスを使用して除かれる。スコアは、それぞれの候補について計算され、それぞれがボールの予め確立されたモデルにどの位類似しているかに関する認定が与えられる。
【0017】
候補の幾つかは、ボールの特徴の統計情報を使用して除去することができる。実施の形態では、ボールの3つの特徴が考慮される。
Area(A)(領域)は、候補Ziにおける画素の数である。
Eccentricity(E)(離心率)は、「細長さ“elongateness”」の測度である。オブジェクトが細長くなると、離心率が高くなる。実施の形態では、離心率を計算するために2値画像のモーメントを使用することができる。
Whiteness(W)(白色度)は、白色である画素の品質である。所与の画素のr,g及びb(それぞれ赤、緑及び青成分)が与えられると、白色度は以下のように定義される。
【0018】
【数1】
サンプルビデオの分析は、領域及び白色度ヒストグラムはガウス分布に従うことを示す。また、離心率ヒストグラムは、離心率の最小値が1であると考慮するため、対称化の後にガウス分布に従う。候補は、それらの特徴が範囲μ±nσの外にある場合に却下され、μは平均であり、σは対応する特徴の分布の標準偏差である。このふるいわけプロセスSに基づいて、Zにおける候補は、ボールのようなオブジェクトとして受け入れられるか又は却下される。ボールの特徴はフレームからフレームへと著しく変化するため、緩い範囲が使用される。
【0019】
領域Aは、μA=7.416及びσA=2.7433によるガウス分布としてモデル化され、範囲はnA=3により制御される。Eは、μE=1及びσE=1.2355によるガウス分布としてモデル化され、範囲はnE=3により制御される。Wは、μW=0.14337及びσW=0.034274によるガウス分布としてモデル化され、範囲はnW=3により制御される。候補は、全ての3つの基準が保持されるように適合する必要がある。
【0020】
また、ステップ140において、ふるいわけプロセスS(Z)を通過した候補Cは、それらの特徴とボールの予め確立されたモデルとの類似性に基づいて認定される。A,E及びWは、ボールの候補のスコアを計算するあめに使用されるが、以下に加えて、より厳密なnの値が使用される。
最も近い候補への距離(DCC):ある候補Ciにおける何れかの画素と他の候補{C−Ci}における全ての他の画素との間の画素における最も近い距離。
フィールドのエッジへの距離(DF):所与の候補の中央とプレイフィールドマスクPMの外周との間の画素における最も近い距離。
オブジェクトマスクにおけるそれぞれのブロブ内にある候補の数(NCOM):所与の候補CiとしてオブジェクトマスクOMにおける同じ接続されたコンポーネント内にあるCにおける候補の数。オブジェクトマスクOMは、プレイフィールド内の非芝生の画素を示す2値マスクであり、PM内のGMの反転として定義される。
【0021】
ボールは、互いに常に近いプレイヤのソックスのようなオブジェクトは対照的に、大部分の時間でプレイフィールド内で分離されたオブジェクトであることが期待される。従って、近隣のオブジェクトをもたず、且つ高いDCCを持つ候補は、ボールである可能性が高い。同様に、ボールはフィールドの境界の近くにあることも期待されない。この仮定は、芝生内に他のスペアボールが存在し、プレイフィールドの境界線の外にある場合に特に重要である。
【0022】
OMは、プレイフィールド内のどの画素が芝生でないかに関する情報を与える。これは、プレーヤ及びフィールドラインを含み、それらの内部に(例えばプレーヤのソックス又はライン部分といった)「ボールのような」ブロブを含む。理想的に、ボールの候補は、他の大きなブロック内にはない。唯一の候補CiがOMの接続されたコンポーネント内にあることが期待されるとき、NCOMiは、理想モデルにおいて1であることが期待される。
【0023】
従って、NCOMを計算することから利益を得る。ある候補CiのスコアSiは、以下のように計算される。
【0024】
【数2】
現段階で、0に等しいスコアを有する候補が拒否される。残りの候補について、スコアSiは、以下の他の特徴を使用してペナルティが課される。
【0025】
【数3】
実施の形態では、μA=7.416,σA=2.7443,nA=1.3,μE=1,σE=1.2355,nE=1.3,μW=0.14337,σW=0.034274,nW=1.3,DCCthr=7画素,DFthr=10画素及びNCOMthr=1である。
【0026】
図3は、あるフレームにおけるボールの候補の識別の結果を例示するものであり、(ボールの候補310〜390についての)カウンディングボックスは、ボールの候補の存在を示す。候補のスコアを表す異なる色がインタフェースにおいて提示される。赤、緑及び青は、3,2及び1のスコアをそれぞれ表す。図3において、候補390は赤(すなわちスコア3)であり、候補350は緑(すなわちスコア2)であり、残りの候補は青(すなわちスコア1)である。この例示では、候補310,320,335,340,360及び380は、プレイヤの一部又はプレイヤの服を表し、候補330,370は、フィールドの他のオブジェクトを現し、候補390は、実際のボールを表す。
【0027】
ステップ150で、軌跡の開始ポイント又は「シード“seed”」が識別される。候補のペア{Ci,Cj}が閾値SEEDthrよりも互いに空間的に近く、且つ1つの候補のスコアが3であるか、又は2つの候補のスコアが2である基準の何れかを満たすように、シードSEEDkは、2つの連続するフレームFt,Ft+1におけるボールの候補のペア{Ci,Cj}であり、CiはFtに属し、CjはFt+1に属する。好適な実施の形態では、SEEDthr=8画素である。基準は、時間の複雑度のような他の検討事項に対処するために変更される。
【0028】
ステップ160で、候補の軌跡は、ステップ150のシードから作成される。軌跡Ti={C1i,C2i,...,CNi}は、フレーム当たり1つで、連続するフレームにおける候補のセットとして定義され、所定の時間間隔又はシードSEEDiを使用して生成されるフレームレンジにおいて滑らかに動いているオブジェクトの実行可能な仮説を形成する。
【0029】
両方向においてシードを成長させることで、軌跡を形成するために線形カルマンフィルタが使用される。シードを構成する2つのサンプルは、フィルタの初期状態を決定する。この情報を使用して、フィルタは、次のフレームにおけるボールの候補の位置を予測する。予測された位置でセンタリングされるサーチ窓内に次のフレームにおける候補が存在する場合、予測された位置に最も近い候補が軌跡に追加され、その位置は、フィルタを更新するために使用される。候補が窓において発見されない場合、予測された位置は根拠のないポイントとして軌跡に追加され、フィルタを更新するために使用される。軌跡を構築する手順は、a)N個の連続するフレームについて予測された位置に近い候補が存在しない場合、及びb)予測された位置の近くでK(例えばK=1)を超える個数の候補が存在する場合に終了する。フィルタは、双方向の方式で機能し、従って時間的に前方に軌跡を成長させた後、カルマンフィルタは、再初期化され、時間的に後方に成長される。軌跡を終了する第一の基準は、その極値で根拠のないポイントのセットを生成する。次いで、これらの根拠のないポイントは、軌跡から除去される。
【0030】
図4は、上述された方法を使用して形成された候補となる軌跡410〜460のプロット400を例示する。x軸は、フレームにおける時間を表す。y軸は、潜在的なボールと画像の左上の画素との間のユークリッド距離である。異なる候補となる軌跡を例示するために複数の色が使用される。
【0031】
候補となる軌跡T={T1,T2,...,TM}の幾つかは、実際のボールにより記述される経路の一部であり、他は、他のオブジェクトに関連する軌跡である。アルゴリズムの目標は、他を却下する一方、実際のボールの経路を表している可能性が高い軌跡のセブセットを選択することで、軌跡BTを形成することである。アルゴリズムは、軌跡の信頼インデックス、軌跡のオーバラップインデックス、及び軌跡の距離のインデックスの使用を含む。それぞれの軌跡のスコアは、軌跡の長さ、軌跡を構成する候補のスコア、及び軌跡における根拠のないポイントの数に基づいて生成される。
【0032】
信頼インデックスは、以下のように計算される。
【0033】
【数4】
Ω(Tj)は軌跡Tjの信頼インデックスであり、piはスコア“i”をもつTjにおける候補の数、qi=pi/|Tj|であり、軌跡においてスコア“i”をもつ候補の分数であり、|Tj|は、軌跡における候補の数であり、λi及びωi(λ1<λ2<λ3及びω2<ω3)は、コンポーネントの重要度を調節し、rは、軌跡における根拠のないポイントの数であり、Tは根拠のないポイントの重要度ファクタである。実施の形態ではλ1=0.002,λ2=0.2,λ3=5,ω2=0.8,ω3=2及びT=10である。
【0034】
それぞれ選択された軌跡について、時間的にオーバラップするものがある。オーバラップインデックスが高い場合、対応する軌跡が廃棄される。インデックスが低い場合、競合する軌跡のオーバラップする部分がトリミングされる。
【0035】
このオーバラップインデックスは、高い信頼インデックスをもつ長い軌跡に報酬を与える一方、オーバラップしているフレームの数にペナルティを課す。
【0036】
【数5】
ここでX(Ti,Tj)は、軌跡Tiの軌跡Tjとのオーバラップインデックスである。ρ(Ti,Tj)は、TiとTjとがオーバラップするフレームの数である。Ω(Ti)は、軌跡Tiの信頼インデックスである。
【0037】
軌跡の距離のインデックスの使用は、BTの空間‐時間の整合性が増加する。ボールが最高速度Vmax画素/フレームで移動するという仮説を使用して、軌跡の最も近い極値間のボールの候補の空間的な距離が、Vmaxに、極値に許容値Dを加えたものの間のフレーム数の倍数よりも高い場合、2つの軌跡BT及びTiは、適合しない。さもなければ、2つの軌跡は、適合し、Tiは、BTの一部である。
【0038】
距離インデックスは、以下により与えられる。
【0039】
【数6】
ここでdist(pos(Ci),pos(Cj))は、候補Ci及びCjの位置間のユークリッド距離であり、frame(Ci)は、候補Ciが属するフレームである。pos(C)は、フレーム内の候補Cの中心の(x,y)位置であり、BTiは、BTにおけるi番目の候補であり、CPDは、最も近い前の距離であり、CNDは、最も近い次の距離であり、CPFは、最も近い前のフレームであり、CNFは、最も近い次のフレームである。
【0040】
DI(BT,Ti)=1である場合、軌跡TiはBTと一致する。この基準がなければ、TiをBTに加えることは、時間的な不一致の問題を提示する可能性があり、この場合、ボールは、極端に短い時間間隔で、ある空間的な位置から別の位置にジャンプする場合がある。軌跡の選択アルゴリズムに距離インデックスの基準を加えることで、この問題が解決される。好適な実施の形態では、Vmax=10画素/フレーム及びD=10画素である。
【0041】
2つの軌跡選択アルゴリズムが実現及びテストされる。第一のアルゴリズムは、最も高い信頼インデックスをもつ候補となる軌跡を繰り返し選択し、選択された軌跡と適合しない軌跡を除去又はトリミングする。第二のアルゴリズムは、最短経路の問題として定式化することでこの問題を解決しようとする。2つのアルゴリズムは、匹敵する性能を有するように調整される。
【0042】
Tである候補となる軌跡のセットが与えられると、アルゴリズムは、ビデオ系列に沿ったボールの軌跡を記述する候補となる軌跡のサブセットを出力BTとして生成する。アルゴリズムは、最も高い信頼インデックスをもつ軌跡をTから繰り返し取り込み、それをBTに移動する。次いで、BTとオーバラップしているTにおける全ての軌跡が処理され、オーバラップするインデックスX(BT,Ti)及び距離インデックスDI(BT,Ti)に依存して、軌跡のトリミング又は除去が行われる。アルゴリズムは、Tにおいて1以上の軌跡が存在しないときに停止する。
【0043】
アルゴリズムは、以下のように記述される。
【0044】
【表1】
トリミング処理trim(BT,Ti)は、軌跡Tiから、BTとTiとの間のオーバラップしているフレームにある全ての候補を除去することからなる。このプロセスがTiの時間的なフラグメンテーション(すなわち候補は中央から除去される)につながる場合、新たな軌跡としてフラグメントがTに加えられ、Tiは、Tから除去される。好適な実施の形態では、オーバラップインデックスの閾値Othr=0.5が使用される。
【0045】
図5は、候補となる軌跡510〜550のセットのプロット500であり、そのうちの幾つかは、実際のボールの軌跡である。x軸は、フレームにおける時間を表す。y軸は、ボールと画像の左上画素との間のユークリッド距離である。軌跡520及び530は、ボールの軌跡を記述するアルゴリズムにより選択され、実際のボールの軌跡である。軌跡510,540及び550は、アルゴリズムにより却下される。楕円部分570は、ボールの実際の経路を表す。例えば、軌跡の選択アルゴリズムは、実際のボールの軌跡の非常に正確な推定を提供することがわかる。
【0046】
最終的なボールの軌跡を生成する別の方法は、Dijkstraの最短経路アルゴリズムに基づく。候補となる軌跡は、グラフにおけるノードとして見られる。2つのノード(又は軌跡)間のエッジは、2つの軌跡間の適合性の測度として重み付けされる。適合度の測度の逆は、ノード間の距離として見ることができる。全体のボールの経路の開始及び終了の軌跡(Ts,Te)が既知である場合、その間の軌跡は、経路に沿った距離の合計を最小化することでノードTs及びTe間のグラフにおける最短経路を発見するDijkstraのアルゴリズムを使用して選択される。
【0047】
第一のステップで、軌跡間の適合度のスコアを含む適合度マトリクスが生成される。Nを候補となる軌跡の数とする。N×Nの適合度マトリクスのセル(i,j)は、軌跡TiとTjの間の適合度スコアを含む。
【0048】
2つの軌跡Ti及びTjが所定の閾値を超えてオーバラップするか、又はTiがTjの後に終了した場合、それらの間の適合度インデックスは、無限大となる。TiがTjの後に終了することを強制することで、経路は常に時間的に先進することが保証される。なお、Φ(Ti,Tj)がΦ(Tj,Ti)と同じである必要はないので、基準は適合度マトリクスが非対称であることを意味することに留意されたい。TiとTjとの間のオーバラップインデックスが小さい場合、低い信頼インデックスをもつ軌跡は、適合度インデックスを計算するためにトリミングされる。2つの軌跡間の適合度インデックスは、以下のように定義される。
【0049】
【数7】
ここでΦ(Ti,Tj)は、軌道TiとTjとの間の適合度インデックスであり、Ω(Ti)は、軌跡Tiの信頼インデックスである。sdist(Ti,Tj)は、Tiの終わりでの候補とTjの開始での候補との間の画素における空間的な距離であり、tdist(Ti,Tj)は、Tiの終わりとTjの開始との間のフレームにおける時間であり、α,β及びγ(all < 0)は、相対的なコンポーネントの重要度であり、好適な実施の形態では、α=−1/70,β=−0.1及びγ=−0.1である。
【0050】
ひとたび適合度マトリクスが作成されると、Dijkstraの最短経路アルゴリズムは、ある軌跡のノードから別の軌跡のノードに進行するための距離(すなわち適合度の逆)を最小にするために使用される。全体のボールの経路の開始及び終了の軌跡(Ts,Te)が既知である場合、中間の奇跡は、最短経路のアルゴリズムを使用して発見される。
【0051】
しかし、Ts,Teは、事前に知られていない。開始及び終了の軌跡の全ての組み合わせチェックする複雑度を低減するため、閾値よりも高い信頼インデックスをもつ軌跡を使用して、全ての組み合わせのサブセットのみが考慮される。開始及び終了の軌跡(ノード)のそれぞれの組み合わせが順に考慮され、最短経路が上述されたように計算される。最後に、全てのこれらの組み合わせのうちで全体の最良の経路が選択される。
【0052】
最良のボールの経路は、低コストを有し、時間的に長く、以下の関数を最小にする。
【0053】
【数8】
Qは、最初の軌跡Tiから最後の軌跡Tjまでの最短経路のアルゴリズムを使用して構築されるT(ボール経路)からの軌跡のサブセットであり、SC(Q)は、Qのスコアであり、CD(Q)は、Qにおける軌跡を通過する、最初の軌跡Tiから最後の軌跡Tjまでのコストであり、length(Q)は、時間的ば軌跡のセットQの長さであり(すなわち軌跡間のギャップを含むQによりカバーされるフレーム数)、max_c及びmax_lは、構築される全ての最短の経路のうちの最大コスト及び最長の長さである(開始及び終了の奇跡のそれぞれの組み合わせについて1つ)、wはコスト対長さの相対的な重要度であり、この実施の形態では、w=0.5である。
【0054】
アルゴリズムの結果を改善する1つの方法は、軌跡の信頼インデックスをユーザが操作するのを可能にすることである。これを行うことで、アルゴリズムは、BTを形成するために良好な軌跡の選択を生成するために誘導される。
【0055】
残念なことに、軌跡の形状により軌跡がノーるのを含むことをユーザは保証することができず、他方で、アルゴリズムにより選択された候補が実際にボールであるかをチェックするため、フレーム毎に進めることはユーザにとって面倒である。
【0056】
候補をダイレクトに扱う代わりに軌跡のレベルで機能する利点の1つは、BTにおける軌跡のセットの濃度がBTにおける候補のセットの濃度よりも常に低いことである。さらに、高い可能性で、所与の軌跡を形成する候補は、同じオブジェクトに対応する。これら2つの仮定を使用して、BTを構成する軌跡についてその選択された候補をもつ唯一のフレームにより、BTにおける軌跡が適切に選択されているかをユーザに迅速に通知し、適切に選択されていない場合には是正措置をとることで十分である。
【0057】
ユーザにとっての相互作用のエレメントは候補であり、軌跡ではない。従って、ユーザは、(ボールである)良い候補又は(ボールでない)誤った候補として候補を分類することができる。
【0058】
gを良い候補とし、Cwを誤った候補とする。次いで、
【数9】
は、それぞれ、良い候補と誤った候補とを含む軌跡のセットである。
【0059】
最終的に、候補をCg及びCwをとして分類する目標は、Twからの軌跡ではなく、Tgからの奇跡を含むBTを生成することである。従って、BTを生成するアルゴリズムは、分類された候補を利用するために、幾つかのやり方で変更される。以下は、係る変更の例である。
【0060】
明らかに、BTの一部となるようにTgからの軌跡を有することが望まれ、従ってこれを達成するオプションは、Tにおける他の軌跡よりも高い信頼インデックスを軌跡Tgに与えることである。先に記述されたアルゴリズムは、最も高い信頼インデックスをもつTからの軌跡を繰り返し取る。
【0061】
これを追跡する1つの方法は、Tにおける最大値よりも大きい新たな信頼インデックスをTgに与えることによる。これが機能するとしても、これが最良のオプションではない。それは、全ての軌跡Tgが同じ信頼インデックスを有し、どれが最小の軌跡であるかを判定することができないためである。良い候補を共有することができる幾つかの軌跡が存在することを念頭に置くことは重要である。図6及び図7を参照されたい。図6は、候補の軌跡のセットを示す。X軸は、フレームにおける時間を表す。Y軸は、候補と画像の左上の画素との間のユークリッド距離である。Z軸は、異なる軌跡を示すために使用される。候補となる軌跡は通常はオーバラップすることに気付くことは重要である。異なるシェーディングレベルは、軌跡を区別するために使用される。図6に示される多数の軌跡が存在する。例えば、影付けされたバンド601〜610のそれぞれは、所与の候補となる軌跡であるそれぞれ狭いラインをもつ軌跡のセットである。
【0062】
図7は、候補となる軌跡Tのセットの2次元の表現である。X軸は、フレームにおける時間を表す。Y軸は、候補と画像の左上の画素との間のユークリッド距離である。図6における軌跡の幾つかは、図7で示される。
【0063】
好適なオプションは、ポジティブなバイアスKをそれらの信頼インデックスに加えることである。これを行うことで、Tgにおける軌跡は、Tgの間で競争する。これは、それらの前の信頼インデックスは、どの軌跡がBTについての最初の選択であるかを判定するからである。バイアスKは、Tにおける最大の信頼インデックスとして設定されるか、又はより高い値として設定される。
【0064】
図8は、ユーザがデータと接触するユーザインタフェースを示す。上のユーザインタフェースプロット又は軌跡のビュー820は、候補となる軌跡Tを示し、図7におけるように、X軸はフレームにおける時間を表し、Y軸は、候補と画像の左上画素との間のユークリッド距離を表す。太い軌跡604,608,610及び太線により表される2つの他のラベル付けされない軌跡は、現時点でBTに属する。プロットの下には、サムネイル801のセットが存在し、それぞれ1つはBTの軌跡に関連される。ボールとして検出されたオブジェクト805は、サムネイルの中央にあり、円により囲まれている(明確さのために二重下線が施されており)、従ってユーザは、軌跡がボールを追跡しているか否かを迅速に見ることができる。サムネイルが選択されたとき、選択されたサムネイル802のフレームは、ボトム又は選択フレーム810に現れる。ユーザは、候補となるオブジェクトをボールと設定/非設定することで、候補となるオブジェクトと相互作用する。明確さのために一重下線が施される矩形は、候補を示し、円は、どの候補がボールとして選択されたかを示す。円及び他のマーキングは、ユーザインタフェースの一部であるマーカであり、ユーザインタフェースは、サムネイルにおけるオブジェクトを、サムネイル801、ボトム又は選択フレーム810におけるオブジェクト及びユーザインタフェースプロット820における軌跡と、ユーザが関連付けするのを可能にする。
【0065】
ユーザは、Twからの軌跡がBTの一部となるのを望まない。このことを考慮して、2つのオプションがここでは妥当である。第一のオプションは、Twにおける全ての軌跡を除くことであり、第二のオプションは、それらの信頼インデックスに悪いスコアを与えるように、それらの信頼インデックスを変更することである。
【0066】
wからの全ての軌跡を除くことで、それらの何れもBTに現れないことが保証される。他方で、この出来事の見込みが低いとしても、トリミングされ、BTを生成するために使用される軌跡の機会を除く。
【0067】
wの軌跡に負の値を与え、その信頼インデックスが0よりも低い軌跡を却下するようにアルゴリズムを変更することで、BTを構築するため、Twからの軌跡を使用する問題を回避することができる。BTを生成するプロセスの間、Twからの幾つかの軌跡が誤りとして分類された候補が除かれるやり方でトリミングされる場合、軌跡は、BTの一部になる。信頼インデックスは、誤った候補が除かれた後に正になる。
【0068】
図9は、インタフェースを再び示す。ここで、選択されたサムネイル802は、誤った軌跡610を含む。ここで、フレームは、インタフェースのボトム810に表示される。候補をクリックすることで、コンテクストメニュー815は、スクリーンに現れ、ユーザは、図9に示されるように、その候補を誤った候補として選択することができる。これは、誤った候補を含む全ての軌跡の信頼インデックスを低くし、BTは、計算し直される。
【0069】
システムは、候補のセットを生成するために使用されるボールの予め確立されたモデルを有する。離心率、サイズ及び色は、上述されたようにモデルの幾つかのエレメントである。
【0070】
僅かな変更により、システムは、ボールのモデルを更新するため、ユーザ入力から利益を得る。例えば、ユーザがボールの候補を良いボールの候補として設定するたび、モデルのパラメータは、新たな候補と良好に整合するために変更される。
【0071】
本発明は、図10におけるフローチャートに示される方法とすることができる。本方法は、ビデオ系列の一部であるビデオフレームにおける接続されたコンポーネントのセットを識別するステップ1010を含む。接続されたコンポーネントは、ボールの画素又は靴のような他のオブジェクトの画素である。次いで、ステップ1020は、少なくとも1つの画像の特徴に関して接続されたコンポーネントのセットのそれぞれを評価し、画像の特徴は、領域、離心率又は白色度である。次いで、ステップ1030は、接続されたコンポーネントのセットのそれぞれの少なくとも1つの画像の特徴を予め決定された基準と比較し、接続されたコンポーネントのフィルタリングされたリストを生成し、このステップは、図1におけるステップ120及び130の適用を含み、あるフレームの輝度値又は色度値を予め決定された基準として使用し、バックグランドを除去することを含む。ステップ1040は、他の連続するフレームにおいて、同じ繰り返すステップ、識別するステップ、評価するステップ及び比較するステップを実行する。ステップ1050は、接続されたコンポーネントのうちの選択されたコンポーネントを選択することを含む。次いで、ステップ1060は、複数のフレームにわたり生成された、選択された接続されたコンポーネント(すなわち関心のあるオブジェクト)の候補となる軌跡のセットを生成する。ステップ1070は、表示するステップであり、この表示するステップでは、選択された接続されたコンポーネントの候補となる軌跡がユーザに示され、本方法は、チャート、プロット等で軌跡をユーザが見るのを可能にするユーザインタフェースを組み込んでいる。ステップ1080は、ユーザにより提供された幾つかの入力により、ユーザインタフェースを通して選択された接続されたコンポーネントの特定の候補となる軌跡をユーザが除くステップである。少なくとも1つの実施の形態では、ユーザは、軌跡をダイレクトに除去しないが、候補がボールであるか否かを示すフィードバックを、このステップにおいてアプリケーションに与える。この除去するステップでは、ユーザは、これらの候補がBTに含まれないように、誤った候補を本質的に識別する。ステップ1090は、ビデオ系列の最終的な画像は、選択するステップ及び除去するステップに応じて表示され、最終的な画像において、所望のオブジェクト及びその軌跡の可視性を改善するオリジナルビデオの部分が選択される。選択される部分は、クローズアップ、トリミングされた部分又はズームされた部分である。改善される可視性は、所望のオブジェクトのセンタリング又はオブジェクトを有さないフレームの除去を含む。
【0072】
本発明の特徴は、図11から更に理解され、セットBTは、ステップ1110においてアルゴリズムにおいて形成される。ステップ1120において、BTにおける軌跡は、サムネイルのビュー及び軌跡を組み込んだユーザインタフェースに表示され、選択される。ステップ1130において、軌跡は、(ボールである)良い候補又は(ボールではない)誤った候補として分類することができる。また、ステップ1110は、BTの組成変更ステップであり、BTは、改善されたBTを取得するためにステップ1130に応答して組成変更される。ステップ1110、1120及び1130は、BTがもはや変更しなくなるまで繰返され、ボールのようなオブジェクトの検出が可能となる。本発明の実施の形態では、サムネイルは、候補となる軌跡の実行中のビデオである。
【0073】
本発明は特定の実施の形態の観点で記載されたが、本発明の範囲に含まれる変更が行われることを理解されたい。例えば、様々な処理ステップは、個別に又は組み合わされて実現される場合があり、汎用又は専用のデータ処理ハードウェア又はソフトウェアで実現される場合があり、閾値及び他のパラメータは、ビデオ入力の変更するタイプに適するように調節される場合がある。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11