(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6031096
(24)【登録日】2016年10月28日
(45)【発行日】2016年11月24日
(54)【発明の名称】オブジェクトの位置を通じた映像ナビゲーション
(51)【国際特許分類】
H04N 5/76 20060101AFI20161114BHJP
H04N 5/93 20060101ALI20161114BHJP
G06F 17/30 20060101ALI20161114BHJP
G11B 27/10 20060101ALI20161114BHJP
G11B 27/34 20060101ALI20161114BHJP
G11B 27/02 20060101ALI20161114BHJP
G11B 20/10 20060101ALI20161114BHJP
【FI】
H04N5/76 B
H04N5/93 Z
H04N5/76 A
G06F17/30 170B
G06F17/30 350C
G11B27/10 A
G11B27/34 S
G11B27/02 B
G11B20/10 321Z
【請求項の数】13
【全頁数】11
(21)【出願番号】特願2014-515137(P2014-515137)
(86)(22)【出願日】2012年6月6日
(65)【公表番号】特表2014-524170(P2014-524170A)
(43)【公表日】2014年9月18日
(86)【国際出願番号】EP2012060723
(87)【国際公開番号】WO2012171839
(87)【国際公開日】20121220
【審査請求日】2015年6月3日
(31)【優先権主張番号】11305767.3
(32)【優先日】2011年6月17日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】シユバリエ,ルイス
(72)【発明者】
【氏名】ペレ,パトリツク
(72)【発明者】
【氏名】ランベール,アンヌ
【審査官】
堀 洋介
(56)【参考文献】
【文献】
特開2009−081845(JP,A)
【文献】
特開2011−023867(JP,A)
【文献】
特開平05−108730(JP,A)
【文献】
特開2000−285253(JP,A)
【文献】
米国特許出願公開第2009/0052861(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/76
G06F 17/30
G11B 20/10
G11B 27/02
G11B 27/10
G11B 27/34
H04N 5/93
(57)【特許請求の範囲】
【請求項1】
画像シーケンス内のナビゲーションを行う方法であって、
画像を画面上に表示するステップと、
第1の入力に従って第1の位置で前記表示された画像の第1のオブジェクトを選択するステップと、
第2の入力に従って前記第1のオブジェクトを第2の位置に移動させるステップと、
前記第1のオブジェクトが前記第2の位置の近傍にある前記画像シーケンス内の少なくとも1つの画像を特定するステップと、
前記特定された画像のうちの1つから画像シーケンスの再生を開始するステップと、
を含み、
前記第1のオブジェクトを第2の位置に移動させるステップは、
・さらなる入力に従って、第3の位置で前記表示された画像の第2のオブジェクトを選択するステップと、
・前記第2のオブジェクトに関連して前記第1のオブジェクトの移動先を定義するステップと、
・前記移動先に前記第1のオブジェクトを移動させるステップと、
を含み、
前記特定するステップは、前記第1のオブジェクトの前記移動先の相対的な位置が前記第2のオブジェクトの前記位置の近傍にある前記画像シーケンス内の少なくとも1つの画像を特定することを含む、前記方法。
【請求項2】
前記第1のオブジェクトを選択するための前記第1の入力は、前記第1のオブジェクトをクリックすることと、前記第1のオブジェクトの周りに境界ボックスを描くことと、インデックスによって前記第1のオブジェクトを選択することと、のうちの1つである、請求項1に記載の方法。
【請求項3】
前記第2の位置は、前記第1の位置の座標とは異なる前記画面上の座標によって定義される、請求項1または2に記載の方法。
【請求項4】
前記第2の位置は、前記第2のオブジェクトに対して定義される、請求項1または2に記載の方法。
【請求項5】
前記第2のオブジェクトを選択するステップにおける前記さらなる入力は、前記第2のオブジェクトをクリックすること、前記第2のオブジェクトの周りに境界ボックスを描くこと、または、インデックスで前記第2のオブジェクトを選択することである、請求項1記載の方法。
【請求項6】
前記第1の及び/又は第2のオブジェクトがオブジェクト・セグメンテーション、オブジェクト検出、または、顔検出によって選択される、請求項1〜5のいずれか1項に記載の方法。
【請求項7】
前記特定するステップは、前記画像シーケンスの画像内の前記第1のオブジェクトの前記位置を定義するためにオブジェクト・トラッキングを行うことを含む、請求項1〜5のいずれか1項に記載の方法。
【請求項8】
前記第2のオブジェクトを選択するためにキー・ポイント技術が使用される、請求項1〜7のいずれか1項に記載の方法。
【請求項9】
前記第2のオブジェクトを選択するためにキー・ポイント技術が使用され、キー・ポイントの記述が前記画像シーケンス内の複数の異なる画像におけるオブジェクトの類似度を判定するために使用される、請求項1〜7のいずれか1項に記載の方法。
【請求項10】
前記画像シーケンスの画像の部分のみが、前記第2のオブジェクトが前記第2の位置の近傍にある少なくとも1つの画像を特定するために分析される、請求項1〜9のいずれか1項に記載の方法。
【請求項11】
前記画像シーケンスの画像の部分が、現在表示されている画像から特定の再生時間のある特定の数の画像、または、前記現在表示されている画像に後続する全ての画像、または、前記現在表示されている画像よりも前の全ての画像を表す、請求項10に記載の方法。
【請求項12】
前記画像シーケンスの画像の部分が、Iピクチャ、Bピクチャ、およびPピクチャのうちの1つを表す、請求項10または11に記載の方法。
【請求項13】
画像シーケンス内のナビゲーションを行う装置であって、
該装置が、請求項1〜12のいずれか1項に従った方法を実行する、前記装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像シーケンス内、例えば、映画内でナビゲーションを行って、これをインタラクティブにレンダリングする方法、具体的には、携帯機器上で映像がレンダリングされることにより、ユーザのインタラクションが容易に行われるようにする方法に関する。さらに、本発明は、この方法を実行する装置に関する。
【背景技術】
【0002】
映像の分析関して複数の異なる技術が存在する。「オブジェクト・セグメンテーション(object segmentation)」と呼ばれる技術が本技術分野において知られており、この技術は、色およびテクスチャ情報に基づいて、空間画像セグメンテーション、すなわち、オブジェクト境界を作成するものである。オブジェクトは、ユーザによって、オブジェクト・セグメンテーション技術を使用して、単に、このオブジェクト内の1つ以上のポイントを選択することによって速やかに輪郭が定められる。オブジェクト・セグメンテーションのための公知のアルゴリズムは、「グラフカット」および「分水嶺」である。別の技術は、「オブジェクト・トラッキング」と呼ばれている。オブジェクトがその空間境界によって定義された後、オブジェクトは、後続する画像シーケンス内で自動的にトラッキングされる。オブジェクト・トラッキングのために、オブジェクトは、通常、その色分布によって記述される。オブジェクト・トラッキングの公知のアルゴリズムは、「平均値シフト法(mean shift)」である。精度および堅牢性を高めるために、アルゴリズムの中には、オブジェクトの外観構造に依存するものがある。オブジェクト・トラッキングのための公知の記述は、Scale−invariant feature transform(SIFT)である。別の技術は、「オブジェクト検出(object detection)」と呼ばれている。一般的なオブジェクト検出技術は、検出しようとするオブジェクトの外観の統計的なモデルを計算するために、機械学習を利用する。これには、オブジェクトの多数の例が必要となる(グラウンド・トルース(ground truth))。モデルを使用することによって新たな画像に対して自動的なオブジェクト検出が行われる。通常、モデルは、SIFT記述語に依存する。今日使用されている最も一般的な機械学習技術には、ブースティングおよびサポート・ベクトル・マシン(SVM)が含まれる。さらに、顔検出は、特定のオブジェクト検出のアプリケーションである。この場合、使用される特徴量は、通常、フィルタ・パラメータであり、より具体的には、「ハール・ウェーブレット」・パラメータである。良く知られている実施態様は、カスケード型ブースト分類器、例えば、Viola−Jones法に依存する。
【0003】
ニュースやドキュメンタリーなどの映像コンテンツを視聴するユーザは、何らかのセグメントをスキップして、または、何らかのポイントに直接進むことによって、映像とのインタラクションを望む可能性がある。この可能性は、ディスプレイとのインタラクションを容易に行うために映像のレンダリングに使用されるタブレットなどの触覚装置を使用しているときにより一層望まれる。
【0004】
このノンリニア・ナビゲーションを可能とするために、いくつかの手段があるシステムで利用可能ある。第1の例は、再生時間の固定量をスキップすること、例えば10秒間分または30秒間分、映像内で先送りすることである。第2の例は、次のカット、または、次のGOPにジャンプすることである。これらの2つのケースでは、根本的な分析の意味的なレベルが制限されている。これらのスキップのメカニズムは、映像データに従って行っており、映画のコンテンツに従って行っているのではない。ユーザにとって、ジャンプが終わったときに何の画像が表示されるのかが明らかではない。さらに、スキップされる期間の長さは短い。
【0005】
第3の例は、次のシーンへのジャンプを行うことである。シーンとは、一連のショットからなるTVショーまたは映画内の単一の位置におけるアクションの部分である。ひとつのシーン全部をスキップする場合、一般的には、これは、別のアクションが開始する映画の部分、映画内の別の位置にジャンプすることを意味する。ここで、スキップする映像の部分が余りにも長くなることがある。ユーザは、より細かいステップで移動することを望むことがある。
【0006】
あるシステムでは徹底的な映像分析を利用可能なものがあり、何らかのオブジェクトや人物にインデックスが付けられることさえある。そこで、ユーザは、映像内でこれらのオブジェクト/顔が視認できるときにオブジェクト/顔をクリックすることができ、すると、システムは、これらの人物が再び現れるポイントに移動することができ、または、この特定のオブジェクト上に追加的な情報を表示することができる。この方法は、システムが実効的にインデックスを付けることができるオブジェクトの数に依存する。現状では、例えば、平均的なニュース映像において遭遇することができる多様なオブジェクトと比較して、存在する検出するものの数は比較的少ない。
【発明の概要】
【0007】
本発明の目的は、概略的に上述したような制限を克服し、よりユーザ・フレンドリで直感的に認識できるナビゲーションを提供する、ナビゲーションを行う方法およびこの方法を実施する装置を提案することにある。
【0008】
本発明に従って画像シーケンス内のナビゲーションを行う方法が提案される。
この方法は、以下のステップを含む。
・画像を画面上に表示するステップ。
・第1の入力に従って第1の位置で上記表示された画像の第1のオブジェクトを選択するステップ。この第1の入力は、ユーザ入力、または、この方法を実行する装置に接続された別の装置からの入力である。
・第2の入力に従って、上記第1のオブジェクトを第2の位置に移動させるステップ。代替的には、第1のオブジェクトは、シンボル、例えば、十字、プラス、または、円のシンボルによって示され、このシンボルは、第1のオブジェクト自体の代わりに移動される。上記第2の位置は、例えば座標によって定義される画面上の位置である。第2の位置を定義する別の方法は、画像内の少なくとも1つの他のオブジェクトに関連して第1のオブジェクトの位置を定義することである。
・上記第1のオブジェクトが上記第2の位置の近傍にある上記画像シーケンス内の少なくとも1つの画像を特定するステップ。
・上記特定された画像のうちの1つから画像シーケンスの再生を開始するステップ。上記第1のオブジェクトと第2のオブジェクトとが互いに近傍にあるという条件を満たすものとして特定された第1の画像で再生が開始される。別の解決法では、この方法は、この条件を満たす全ての画像を特定し、ユーザは条件を満たす画像のうちの1つを選択してこの画像から再生を開始する。さらなる解決法では、上記2つのオブジェクト間の距離が最も小さい画像シーケンス内の画像が再生のための開始ポイントとして使用される。オブジェクト間の距離を定義するために、例えば、絶対値が使用される。オブジェクトが別のオブジェクトの近傍にあるかどうかを定義する別の方法は、X座標およびY座標を使用することのみによる方法、または、複数の異なる重み係数を使用してX方向およびY方向の距離を重み付けすることによる方法である。
【0009】
本方法には、映像またはニュース番組であり、放送または記録された画像シーケンスを視聴するユーザは、画像のコンテンツに従って画像シーケンス内のナビゲーションを行い、この際主に技術的な理由から定義される放送されたストリームの何らかの固定された構造に依存することがないという利点がある。ナビゲーションは、直感的に、よりユーザ・フレンドリな方法で行われる。この方法は、ユーザがオブジェクトを実際に移動していることを感じ取れるようにリアルタイムに行われることが好ましい。特定のインタラクションによって、ユーザは、指定されたオブジェクトが画面から消える時点を要求する。
【0010】
上記第1のオブジェクトを選択するための上記第1の入力は、オブジェクトをクリックすること、または、オブジェクトの周りに境界ボックスを描くことである。従って、ユーザは、マンマシン・インタフェースのための公知の入力方法を適用する。インデックスが作成される場合には、ユーザは、さらに、このインデックスによってデータベースからオブジェクトを選択することができる。
【0011】
本発明に従って、第2の入力に従って上記第1のオブジェクトを第2の位置に移動させるステップは、
・さらなる入力に従って第3の位置で表示された画像の第2のオブジェクトを選択することと、
・上記第2のオブジェクトに
関連して第1のオブジェクトの移動先を定義することと、
・上記移動先に上記第1のオブジェクトを移動させることと、を含む。
【0012】
上記特定するステップは、上記第1のオブジェクトの移動先の相対的な位置が第2のオブジェクトの位置の近傍にある画像シーケンス内の少なくとも1つの画像を特定することをさらに含む。これには、ユーザが画面の物理的な座標に関連する画面上の位置を選択できるだけでなく、オブジェクトに対し、画像内の他のオブジェクトに関してユーザーが予期するオブジェクトの位置を選択できるという利点がある。例えば、記録されたサッカーの試合において、第1のオブジェクトがボールであれば、ボールがゴールの近傍にあるとき、ユーザは、興味の有りそうなシーンが存在することを予期して、このボールをゴールの方向に移動させることができる。これは、間もなくチームが得点を得るか、選手がボールをゴールにキックする可能性があるためである。オブジェクトによるこの種のナビゲーションは、画面の座標から完全に独立しているが、画像内の2つのオブジェクトの相対距離に依存している。上記第1のオブジェクトの移動先の位置が上記第2のオブジェクトの位置の近傍にあるということは、さらに、第2のオブジェクトが上記第1のオブジェクトの移動先の位置と全く同じ位置にある場合、または、第2のオブジェクトが、移動した第1のオブジェクトの移動先と重なる場合を含む。2つのオブジェクトの互いの相対位置を定義するためにオブジェクトのサイズおよびオブジェクトの経時的な変化が考慮されることが好ましい。さらに代替的には、ユーザは、オブジェクト、例えば顔を選択し、顔のサイズを定義するために、顔の境界ボックスをズームする。その後、このサイズで、または、このサイズに近いサイズで顔が表示されている画像を画像シーケンス内でサーチする。この機能は、例えば、インタビューが再生され、ユーザが特定の人物のスピーチに興味を持っている場合に、この人物がスピーチを行う際、画面の最も大きな部分のほとんどを占めるようにこの人物の顔が表示されることを想定すれば、利点がある。従って、本発明の1つの利点は、特定の人物がインタビューされている録画の部分にジャンプする容易な方法が存在することにある。上記第1のオブジェクトおよび第2のオブジェクトは、必ずしも画像シーケンスの同一の画像内で選択される必要はない。
【0013】
上記第2のオブジェクトを選択するためのさらなる入力は、オブジェクトをクリックすること、または、オブジェクトの周りに境界ボックスを描くことである。従って、ユーザは、マンマシン・インタフェースのための公知の入力方法を適用する。インデックスが作成される場合には、ユーザは、さらに、このインデックスによってデータベースから上記オブジェクトを選択することができる。
【0014】
上記オブジェクトを選択するために、オブジェクト・セグメンテーション、オブジェクト検出、または、顔検出が用いられる。上記第1のオブジェクトが検出されると、画像シーケンスの後続する画像内のこのオブジェクトの位置のトラッキングをするためにオブジェクト・トラッキング技術が使用される。さらに、オブジェクトを選択するためにキー・ポイント技術が用いられる。さらに、キー・ポイントの記述が画像シーケンス内の複数の異なる画像におけるオブジェクトの類似度を判定するために使用される。オブジェクトを選択し、特定し、トラッキングするために、上述した技術を組み合わせたものが使用される。階層構造のセグメンテーションは、ノードおよびリーフが画像の重ね合わされた領域に対応するツリーを生成する。このセグメンテーションは、予め行われる。ユーザが画像の所与のポイントにタップすることによってオブジェクトを選択すると、このポイントを含む最小のノードが選択される。ユーザのさらなるタップが受信されると、1番目のタップで選択されたノードが2番目のタップで選択されたノードの親として考慮される。従って、オブジェクトを定義するために対応する領域が考慮される。
【0015】
本発明に従えば、画像シーケンスの画像の部分のみが、オブジェクトが第2の位置の近傍にある少なくとも1つの画像を特定するために分析される。分析されるべきこの部分は、実際の画像に後続する特定の数の画像であり、この特定の数の画像は、現在表示されている画像に後続する特定の再生時間を表している。この方法を実行する別の方法は、現在表示されている画像に後続する全ての画像、または、現在表示されている画像より前の全ての画像を分析することである。これは、早送りのナビゲーション、または、早戻しのナビゲーションを表すので、ユーザにとって画像シーケンス内でナビゲーションを行うための、なじみのある方法である。本発明の別の実施態様に従えば、Iピクチァのみ、または、IピクチャおよびPピクチャのみ、または、全てのピクチャがオブジェクト・ベースのナビゲーションのために分析される。
【0016】
本発明は、さらに、上述した方法に従って画像シーケンス内のナビゲーションを行う装置に関する。
【0017】
さらなる良好な理解のために、以下、図面を参照して本発明をより詳細に説明する。本発明は、この例示的な実施形態に限定されるものではなく、本発明の範囲を逸脱することなく、特定の特徴事項を適宜組み合わせ、さらに/または、改変できることも理解されよう。
【図面の簡単な説明】
【0018】
【
図1】画像シーケンスを再生し、本発明の方法を実行する装置を示す図である。
【
図2】ナビゲーションを行う本発明の方法を示す図である。
【
図3】本発明の方法を例示するフローチャートである。
【
図4】本発明に係るナビゲーションの第1の例を示す図である。
【
図5】本発明に係るナビゲーションの第2の例を示す図である。
【発明を実施するための形態】
【0019】
図1は、画像シーケンスを表示する再生装置を概略的に表している。この再生装置は、画面1と、TV受信機、HDD、DVDまたはBDプレイヤなどの画像シーケンスのソース2と、マンマシン・インタフェース3とを含む。再生装置は、全ての機能を含む装置、例えば、タブレットであってもよく、その画面をマンマシン・インタフェース(タッチスクリーン)としても使用することができ、映画またはドキュメンタリーを記憶するハード・ディスクまたはフラッシュ・ディスクが存在し、さらに、放送受信機が装置内に組み込まれている。
【0020】
図2は、複数の画像からなる、例えば、映画、ドキュメンタリー、またはスポーツ・イベントの画像シーケンス100を示している。現在画面上に表示されている画像101は、本発明の方法の開始ポイントである。最初のステップにおいて、画面ビュー11は、この画像101を表示する。マンマシン・インタフェースから受信された第1の入力に従って、第1のオブジェクト12が選択される。次に、この第1のオブジェクト12またはこの第1のオブジェクト12を表すシンボルは、例えば、マンマシン・インタフェースによって受信される第2の入力に従ったドラッグ・アンド・ドロップによって、画面上の別の位置13に移動される。画面ビュー21において、第1のオブジェクト12の新たな位置13が例示されている。次に、この方法は、第1のオブジェクト12の移動先13の近傍の位置14に第1のオブジェクト12がある、画像シーケンス100内の少なくとも1つの画像102を特定する。この画像において、位置14は、ドラッグ・アンド・ドロップの動きによって示されている、所望の位置13に対してある特定の距離15を有する。この距離15は、所望の位置と調べられる画像内の位置とがどの程度近いかを評価する尺度として使用される。これは、画面ビュー31に例示されている。最良の画像を特定した後、ユーザのリクエストに従って、この画像が画面ビュー41上に表示される。この画像は、画像シーケンス100内の画像102に示されているような、ある特定の位置を有する。画像シーケンス100は、この特定の位置から再生される。
【0021】
図3は、本方法によって実行されるステップを例示している。最初のステップ200において、第1の入力に従って、表示されている画像内でオブジェクトが選択される。第1の入力は、マンマシン・インタフェースから受信される。ここで説明している選択処理は、短期間に実行されるものと想定する。これにより、オブジェクトの外観が大きく変化しすぎることがなくなる。選択されたオブジェクトを検出するために、画像分析が実行される。現在のフレームの画像が分析され、画像内に存在するキー・ポイントのセットを捕捉する、興味のあるポイントが抽出される。これらのキー・ポイントは、強いgradient(勾配)が存在する位置に位置する。これらのキー・ポイントは、周囲のテクスチャの記述を用いて抽出される。画像における位置が選択されると、この位置の周りのキー・ポイントが収集される。キー・ポイントが収集される領域の半径は、この方法のパラメータである。キー・ポイントの選択は、他の方法、例えば、空間セグメンテーションによって支援される。抽出されたキー・ポイントのセットは、選択されたオブジェクトの記述を構成する。第1のオブジェクトを選択した後、ステップ210において、第1のオブジェクトは、第2の位置に移動される。この移動は第2の入力に従って実行され、この第2の入力はマンマシン・インタフェースからの入力である。この移動は、ドラッグ・アンド・ドロップによって実現される。次に、この方法は、ステップ220において、第1のオブジェクトが第2の位置の近傍にある画像シーケンス内の少なくとも1つの画像を特定する。この第2の位置はユーザが指定した画像位置である。複数の異なる画像におけるオブジェクトの類似度は、キー・ポイントのセットを比較することによって判定される。ステップ230において、この方法は、特定された画像にジャンプし、再生が開始される。
【0022】
図4は、複数の人々が選択されたトピックについて話し合うトーク・ショーを視聴する際にこの方法を適用する例を示している。ショー全体の再生時間が矢印tによって示されている。時点t1において、3つの顔を含む第1の画像が画面上に表示される。ユーザは、画面の左側に表示されている人物に興味を持っており、この人物を、顔の周りに境界ボックスを描くことによって選択する。次に、ユーザは、選択されたオブジェクト(奇抜な髪型を有する顔)を画面の中央にドラッグし、さらに、境界ボックスを拡大し、画面の中央で、クローズアップされたビューでこの人物を見たい旨を示す。従って、画像シーケンス内でこの条件を満たす画像がサーチされる。この画像が時点t2で発見されると、この画像が表示され、この時点t2で、再生が開始される。
【0023】
図5は、サッカーの試合を視聴する際に方法を適用する例を示している。時点t1において、フィールドの中央の試合のシーンが示される。4人の選手が存在し、そのうちの1人は、ボールの近傍に位置している。ユーザは、特定の状況、例えば、次のペナルティに興味を持っている。従って、ユーザは、境界ボックスでボールを選択し、ペナルティ・スポットにオブジェクト・トラッキングを行い、ボールがちょうどこのポイントに位置するシーンを見たい旨を示す。時点t2においてこの条件が満たされる。ボールがペナルティ・スポットにあり、選手がペナルティ・キックを行う準備をするシーンが表示される。このシーン以降の試合の再生が行われる。従って、ユーザは、自己が興味を持っている次のシーンへのナビゲーションを簡便に行うことができる。
なお、実施形態に関し以下を付記する。
(付記1) 画像シーケンス内のナビゲーションを行う方法であって、
画像を画面上に表示するステップと、
第1の入力に従って第1の位置で前記表示された画像の第1のオブジェクトを選択するステップと、
第2の入力に従って前記第1のオブジェクトを第2の位置に移動させるステップと、
前記第1のオブジェクトが前記第2の位置の近傍にある前記画像シーケンス内の少なくとも1つの画像を特定するステップと、
前記特定された画像のうちの1つから画像シーケンスの再生を開始するステップと、
を含む、前記方法。
(付記2) 前記第1のオブジェクトを選択するための前記第1の入力は、前記第1のオブジェクトをクリックすることと、前記第1のオブジェクトの周りに境界ボックスを描くことと、インデックスによって前記第1のオブジェクトを選択することと、のうちの1つである、付記1に記載のナビゲーションを行う方法。
(付記3) 前記第2の位置は、前記第1の位置の座標とは異なる前記画面上の座標によって定義される、付記1または2に記載のナビゲーションを行う方法。
(付記4) 前記第2の位置は、前記第2のオブジェクトに対して定義される、付記1または2に記載のナビゲーションを行う方法。
(付記5) 前記第2の入力に従って前記第1のオブジェクトを第2の位置に移動させるステップは、
・さらなる入力に従って、第3の位置で前記表示された画像の第2のオブジェクトを選択するステップと、
・前記第2のオブジェクトに対して相対的な前記第1のオブジェクトの移動先を定義するステップと、
・前記移動先に前記第1のオブジェクトを移動させるステップと、
を含み、
前記特定するステップは、前記第1のオブジェクトの前記移動先の相対的な位置が前記第2のオブジェクトの前記位置の近傍にある前記画像シーケンス内の少なくとも1つの画像を特定することを含む、付記1、2、または4に記載のナビゲーションを行う方法。
(付記6) 前記第2のオブジェクトを選択するための前記さらなる入力は、前記2のオブジェクトをクリックすること、前記2のオブジェクトの周りに境界ボックスを描くこと、または、インデックスで前記2のオブジェクトを選択することである、付記5記載のナビゲーションを行う方法。
(付記7) 前記オブジェクトがオブジェクト・セグメンテーション、オブジェクト検出、または、顔検出によって選択される、付記1〜6のいずれか1項に記載のナビゲーションを行う方法。
(付記8) 前記特定するステップは、前記画像シーケンスの画像内の前記第1のオブジェクトの前記位置を定義するためのオブジェクト・トラッキングを行うことを含む、付記1〜6のいずれか1項に記載のナビゲーションを行う方法。
(付記9) オブジェクトを選択するためにキー・ポイント技術が使用される、付記1〜8のいずれか1項に記載のナビゲーションを行う方法。
(付記10) オブジェクトを選択するためにキー・ポイント技術が使用され、キー・ポイントの記述が前記画像シーケンス内の複数の異なる画像におけるオブジェクトの類似度を判定するために使用される、付記1〜8のいずれか1項に記載のナビゲーションを行う方法。
(付記11) 前記画像シーケンスの画像の部分のみが、前記オブジェクトが前記第2の位置の近傍にある少なくとも1つの画像を特定するために分析される、付記1〜10のいずれか1項に記載のナビゲーションを行う方法。
(付記12) 前記画像シーケンスの画像の部分が、現在表示されている画像からの特定の再生時間、前記現在表示されている画像に後続する全ての画像、および、前記現在表示されている画像より前の全ての画像のうちの1つを表す、付記11に記載のナビゲーションを行う方法。
(付記13) 前記画像シーケンスの画像の部分が、Iピクチャ、Bピクチャ、およびPピクチャのうちの1つを表す、付記11または12に記載のナビゲーションを行う方法。
(付記14) 画像シーケンス内のナビゲーションを行う装置であって、
該装置が、付記1〜13のいずれか1項に従った方法を実行する、前記装置。