特表2022-510057 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ロヴィ　ガイズ，　インコーポレイテッドの特許一覧

特表2022-510057コンテンツの一部の対象を表示するためのシステムおよび方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-01-26

(54)【発明の名称】コンテンツの一部の対象を表示するためのシステムおよび方法

(51)【国際特許分類】

G10L 17/00 20130101AFI20220119BHJP

H04N 21/439 20110101ALI20220119BHJP

H04N 21/442 20110101ALI20220119BHJP

【ＦＩ】

G10L17/00 200C

H04N21/439

H04N21/442

G10L17/00 400

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2020571662

(86)(22)【出願日】2019-12-19

(85)【翻訳文提出日】2021-03-10

(86)【国際出願番号】 US2019067498

(87)【国際公開番号】W WO2020132255

(87)【国際公開日】2020-06-25

(31)【優先権主張番号】16/226,916

(32)【優先日】2018-12-20

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】16/226,886

(32)【優先日】2018-12-20

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】518345664

【氏名又は名称】ロヴィガイズ，インコーポレイテッド

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】ダルベック，ゲイブリエルシー．

(72)【発明者】

【氏名】ラベル，ニコラス

(72)【発明者】

【氏名】オコナー，ランスジー．

【テーマコード（参考）】

5C164

【Ｆターム（参考）】

5C164PA41

5C164UB08P

5C164UB41P

5C164UB81S

5C164YA21

(57)【要約】

システムおよび方法が、コンテンツの位置の対象を表示するために本明細書に説明される。コンテンツのメディアデータが、再生の間に分析され、いくつかのオーディオシグネチャおよび／またはアクションシグネチャが、識別される。各シグネチャは、コンテンツ内の特定の対象と関連付けられる。オーディオシグネチャは、各シグネチャが開始される再生位置に対応するタイムスタンプとともに、特定の対象の識別子と関連付けて記憶される。コマンドを受信することに応じて、現在の再生位置またはその近傍におけるいくつかのシグネチャのそれぞれを表すアイコンが、表示される。特定のシグネチャに対応するアイコンのユーザ選択を受信することに応じて、シグネチャに対応するコンテンツの一部が、再生される。

【特許請求の範囲】

【請求項1】

コンテンツのオーディオの一部の対象を表示するための方法であって、前記方法は、
前記コンテンツの再生の間、前記コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別することと、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子を記憶することと、
入力コマンドを受信することと、
各オーディオシグネチャを表すアイコンを表示のために発生させることと
を含む、方法。

【請求項2】

アイコンの選択を受信することと、
前記選択されたアイコンと関連付けられる前記オーディオシグネチャに対応する前記オーディオの一部を再生することと
をさらに含む、請求項１に記載の方法。

【請求項3】

前記コンテンツの再生の間、前記コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別することと、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶することと、
前記タイムスタンプおよび前記第２のタイムスタンプに基づいて、対象シグネチャを前記対象シグネチャの間に存在するオーディオシグネチャに割り当てることと
をさらに含む、請求項１に記載の方法。

【請求項4】

前記選択されたアイコンと関連付けられるオーディオシグネチャに対応する前記オーディオの部分を再生することは、
前記選択されたアイコンによって表される前記対象の識別子を読み出すことと、
前記読み出された識別子と関連付けられるオーディオシグネチャの前記記憶されたタイムスタンプを読み出すことと、
前記タイムスタンプにおいて開始される前記オーディオの部分を再生することと
を含む、請求項２に記載の方法。

【請求項5】

前記複数の音の各音の前記対象の画像を捕捉することをさらに含み、前記各音の個別の対象を表す前記アイコンは、前記音の個別の対象の捕捉された画像を備える、請求項１に記載の方法。

【請求項6】

オーディオシグネチャを識別することは、
第１のタイムスタンプにおいて開始される前記オーディオのオーディオ特性を分析することと、
後続タイムスタンプにおいて開始される前記オーディオのオーディオ特性が、前記第１のタイムスタンプにおいて開始される前記オーディオのオーディオ特性と異なると決定することと、
前記第１のタイムスタンプと前記後続タイムスタンプとの間の前記オーディオの部分を第１のオーディオシグネチャとして識別することと
を含む、請求項１に記載の方法。

【請求項7】

前記第１のタイムスタンプと前記後続タイムスタンプとの間の前記コンテンツのビデオフレームを分析することと、
前記音の対象が、前記ビデオフレーム内に表示されているかどうかを決定することと、
前記第１のオーディオシグネチャを前記表示される対象に割り当てることと
をさらに含む、請求項６に記載の方法。

【請求項8】

前記分析することに基づいて、前記表示される対象が、前記第１のオーディオシグネチャに対応する前記オーディオデータの対象であると決定することをさらに含む、請求項７に記載の方法。

【請求項9】

オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する音が終了する第２のタイムスタンプを記憶することと、
前記入力コマンドを受信することに応答して、現在の再生タイムスタンプから閾値時間内の第２のタイムスタンプを有する複数のオーディオシグネチャを決定することと
をさらに含む、請求項１に記載の方法。

【請求項10】

各オーディオシグネチャの前記タイムスタンプおよび前記第２のタイムスタンプに基づいて、前記複数のオーディオシグネチャのオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定することと、
前記複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応する前記コンテンツのオーディオデータの一部を再生することと
をさらに含む、請求項９に記載の方法。

【請求項11】

前記複数のオーディオシグネチャのオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、前記選択されたアイコンと関連付けられる前記オーディオシグネチャに対応する前記オーディオデータを分離することをさらに含み、複数のアイコンを表示のために発生させることは、前記複数のオーディオシグネチャのオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、請求項１０に記載の方法。

【請求項12】

前記音は、発話であり、
前記音の対象は、話者である、
請求項１に記載の方法。

【請求項13】

コンテンツのオーディオの一部の対象を表示するためのシステムであって、前記システムは、
メモリと、
請求項１－１２のいずれかに記載の方法を実行するように構成される制御回路と
を備える、システム。

【請求項14】

コンテンツのオーディオの一部の対象を表示するためのシステムであって、前記システムは、
前記コンテンツの再生の間、前記コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別するための手段と、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子を記憶するための手段と、
入力コマンドを受信するための手段と、
各オーディオシグネチャを表すアイコンを表示のために発生させるための手段と
を備える、システム。

【請求項15】

非一過性コンピュータ可読媒体であって、前記非一過性コンピュータ可読媒体は、請求項１－１２のいずれかに記載の方法に従って、コンテンツのオーディオの一部の対象を表示するためのその上にエンコードされる命令を有する、非一過性コンピュータ可読媒体。

【請求項16】

コンテンツのビデオの一部の対象を表示するための方法であって、前記方法は、
コンテンツの再生の間、前記コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別することと、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、および前記アクションシグネチャの識別子を記憶することと、
入力コマンドを受信することと、
各アクションシグネチャを表すアイコンを表示のために発生させることと
を含む、方法。

【請求項17】

アイコンの選択を備える第２の入力コマンドを受信することと、
前記選択されたアイコンと関連付けられる前記アクションシグネチャに対応する前記コンテンツの部分を再生することと
をさらに含む、請求項１６に記載の方法。

【請求項18】

前記コンテンツの再生の間、前記コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別することと、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶することと、
前記タイムスタンプおよび前記第２のタイムスタンプに基づいて、対象シグネチャを前記対象シグネチャの間に存在するアクションシグネチャに割り当てることと
をさらに含む、請求項１６に記載の方法。

【請求項19】

前記選択されたアイコンと関連付けられるアクションシグネチャに対応する前記コンテンツの部分を再生することは、
前記選択されたアイコンによって表される前記対象の識別子を読み出すことと、
前記読み出された識別子と関連付けられるアクションシグネチャの前記記憶されたタイムスタンプを読み出すことと、
前記タイムスタンプにおいて開始される前記コンテンツの部分を再生することと
を含む、請求項１７に記載の方法。

【請求項20】

運動の各識別された対象のうちの対象の画像を捕捉することをさらに含み、前記各運動の個別の対象を表す前記アイコンは、前記運動の対象の捕捉された画像を備える、請求項１６に記載の方法。

【請求項21】

アクションシグネチャを識別することは、
コンテンツの再生の間、前記コンテンツのビデオ内に表示される運動の対象を識別することと、
第１のタイムスタンプにおいて、運動の個別の対象の閾値レベルの運動を検出することと、
後続タイムスタンプにおいて、前記運動の個別の対象の運動が、前記閾値レベルを下回ることを検出することと、
前記第１のタイムスタンプと前記後続タイムスタンプとの間の前記コンテンツの部分を第１のアクションシグネチャとして識別することと
を含み、
前記記憶されたタイムスタンプは、前記第１のタイムスタンプに対応し、前記記憶された終了タイムスタンプは、前記後続タイムスタンプに対応する、
請求項１６に記載の方法。

【請求項22】

前記コンテンツのビデオ内に表示される運動の対象を識別することは、
前記コンテンツのビデオのフレーム内の顔を検出することと、
識別子を各検出された顔に割り当てることと、
検出された顔毎に、個別の検出された顔に対応するパラメータのセットを記憶することと
を含み、
前記運動の個別の対象の記憶された識別子は、前記運動の個別の対象と関連付けられる前記個別の検出された顔の割り当てられた識別子である、
請求項２１に記載の方法。

【請求項23】

運動の個別の対象の閾値レベルの運動を検出することは、
前記コンテンツのビデオの複数の連続的フレームを分析することと、
前記分析することに基づいて、前記運動の個別の対象が、閾値フレーム数未満において閾値距離を上回って移動したと決定することと
を含む、請求項２２に記載の方法。

【請求項24】

前記コンテンツとともに配布するためにメタデータファイル内にアクションシグネチャを記憶することをさらに含む、請求項１６に記載の方法。

【請求項25】

前記第２の入力コマンドは、アイコンの１つを上回る選択を備え、前記方法はさらに、
前記選択されたアイコンによって表される前記運動の対象に割り当てられた複数のアクションシグネチャを読み出すことと、
前記アイコンの選択数だけ現在の再生タイムスタンプに先行する前記複数のアクションシグネチャのアクションシグネチャを識別することと
を含み、
前記記憶されたタイムスタンプは、前記識別されたアクションシグネチャから読み出される、
請求項１７に記載の方法。

【請求項26】

前記開始タイムスタンプと前記終了タイムスタンプとの間の時間が、最小閾値時間量を下回るかどうかを決定することをさらに含み、前記開始タイムスタンプと前記終了タイムスタンプとの間の前記時間が、前記最小閾値時間量を下回ると決定することに応答して、前記コンテンツの再生は、スローモーションにおいて実施される、請求項１６に記載の方法。

【請求項27】

前記開始タイムスタンプと前記終了タイムスタンプとの間の前記時間が、最小閾値時間量と最大閾値時間量との間であるかどうかを決定することをさらに含み、前記開始タイムスタンプと前記終了タイムスタンプとの間の前記時間が、前記最小閾値時間量と前記最大閾値時間量との間であると決定することに応答して、前記コンテンツの再生は、ループされる、請求項１６に記載の方法。

【請求項28】

コンテンツのビデオの一部の対象を表示するためのシステムであって、前記システムは、
メモリと、
請求項１６－２７のいずれかに記載の方法を実行するように構成される制御回路と
を備える、システム。

【請求項29】

コンテンツのビデオの一部の対象を表示するためのシステムであって、
コンテンツの再生の間、前記コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別するための手段と、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、および前記アクションシグネチャの識別子を記憶するための手段と、
入力コマンドを受信するための手段と、
各アクションシグネチャを表すアイコンを表示のために発生させるための手段と
を備える、システム。

【請求項30】

非一過性コンピュータ可読媒体であって、前記非一過性コンピュータ可読媒体は、請求項１６－２７のいずれかに記載の方法に従って、コンテンツのビデオの一部の対象を表示するためのその上にエンコードされる命令を有する、非一過性コンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、コンテンツ配信および消費システムに関し、より具体的には、コンテンツ内の特定の対象と関連付けられるコンテンツの部分を繰り返すことに関する。

【発明の概要】

【課題を解決するための手段】

【0002】

従来のメディア消費システムでは、ユーザが、コンテンツの一部を繰り返すことを所望するとき（例えば、ユーザが、会話を理解しなかった、またはユーザが、アクションシーケンスを見逃したため）、ユーザは、ユーザが繰り返すことを所望する部分に先立つ再生位置までコンテンツを巻き戻さなければならない。しかしながら、巻き戻し機構は、不正確であり、ユーザが、コンテンツが戻る再生位置を容易に制御することを可能にしない。これは、ユーザが、十分に離れて巻き戻さず、ユーザが繰り返すことを所望するコンテンツの一部を見逃すこと、または所望の部分が開始される再生位置よりも離れて巻き戻し、コンテンツの付加的部分を不必要に再視聴する必要性があることのいずれかをもたらす。

【0003】

さらに、専門的に発生されたコンテンツは、多くの場合、クローズドキャプショニングデータを含有し、これは、システムが、会話を発話する対象またはキャラクタと関連付けられるオーディオの具体的部分を繰り返すことを可能にする。ユーザ発生コンテンツ（例えば、毎日再生のためにウェブサイトにアップロードされる数百万時間のビデオ）の場合では、システムが本目的のために使用し得る、いかなる埋設されたクローズドキャプションデータも、存在しない。

【0004】

システムおよび方法が、コンテンツ内の特定の対象（例えば、キャラクタまたはオブジェクト）と関連付けられるコンテンツの部分を繰り返すために本明細書に説明される。コンテンツが、デバイス上で再生される間、コンテンツデータが、分析され、いくつかのシグネチャが、識別される。いくつかの実施形態では、オーディオデータが、オーディオシグネチャを識別するために分析され（音声または歌認識が、オーディオシグネチャが識別子として使用され得る実施例である）、各オーディオシグネチャは、オーディオおよび／またはビデオ特性に基づいて、コンテンツ内の特定の対象と関連付けられる。いくつかの実施形態では、ビデオデータが、コンテンツ内に表示される対象の運動に基づいて、アクションシグネチャを識別するために分析される。各アクションシグネチャの識別子が、アクションシグネチャが開始される再生位置に対応するタイムスタンプとともに記憶される。対象はまた、再生の間に識別され、対象シグネチャが、識別される、または各対象に割り当てられてもよい。各対象シグネチャの識別子が、対象がコンテンツ内で表示される再生位置に対応するタイムスタンプとともに記憶される。対象シグネチャは、同一のタイムスタンプを有するオーディオシグネチャまたはアクションシグネチャに割り当てられてもよい。

【0005】

コマンドを受信することに応じて、コンテンツの再生は、一時停止され、いくつかのシグネチャのそれぞれを表すアイコンが、表示される。アイコンの数は、現在の再生位置またはその近傍におけるシグネチャの数によって決定され得る、もしくは再生位置までの識別されたシグネチャの全体を表す全てのアイコンが、表示され得る。特定のシグネチャに対応するアイコンのユーザ選択を受信することに応じて、シグネチャに対応するコンテンツの一部が、再生される。

【0006】

いくつかの実施形態では、特定の対象に対応するアイコンのユーザ選択を受信することに応じて、対象の識別子が、読み出される。識別子と関連付けられるシグネチャのタイムスタンプが、次いで、読み出され、コンテンツの一部が、タイムスタンプにおいて開始されるように再生される。

【0007】

アイコンは、その個別のシグネチャに対応する対象の画像を含んでもよい。シグネチャに対応するビデオデータが、処理され、シグネチャの対象が、識別される。対象が表示されるビデオデータのフレームの一部が、アイコン内で表示のための画像として捕捉される。

【0008】

オーディオシグネチャを識別するために、オーディオデータが、第１の再生位置において開始されるように分析される。第１の対象に一意のオーディオ特性が、識別される。分析が、継続するにつれて、現在のオーディオデータのオーディオ特性が、以前のデータのものと比較される。オーディオ特性の有意な変化が、検出される場合、第１の再生位置から現在の再生位置までのオーディオデータの部分は、オーディオシグネチャとして識別される。ビデオデータもまた、オーディオに関与する特定の対象が、コンテンツ内に表示されているかどうかを決定するために分析されてもよい。

【0009】

１つを上回るオーディオシグネチャが、現在の再生位置の閾値時間量内の終了再生位置を有してもよい。繰り返すべきオーディオデータの部分を決定するために、オーディオシグネチャのうちのいずれかが、相互に重複するかどうかが決定される。該当しない場合、直近のオーディオシグネチャに対応するオーディオデータの部分が、再生される。オーディオシグネチャが、確かに相互に重複する場合、各オーディオシグネチャに対応するオーディオデータは、分離される。各シグネチャの対象に対応するアイコンが、次いで、表示され、選択されたアイコンに対応する部分が、再生される。

【0010】

アクションシグネチャを識別するために、ビデオデータが、第１の再生位置において開始されるように分析される。コンテンツ内に表示される運動が、追跡され、運動の対象が、識別される。例えば、顔が、ビデオコンテンツのフレーム内で検出され得る。分析が、継続するにつれて、運動のレベル（例えば、対象が移動する速度）が、検出される。運動のレベルが、閾値レベルを上回るものとして検出されるとき、第１の再生位置から現在の再生位置までのコンテンツの部分が、アクションシグネチャとして識別される。

【0011】

ユーザが、複数回にわたって特定のアイコンを選択する場合、本システムは、選択されたアイコンによって表される対象に対応するいくつかのシグネチャを識別する。選択数が、カウントされ、本システムは、現在の再生位置に先立つ選択数であるシグネチャを読み出し、読み出されたシグネチャによって識別されるコンテンツの部分を繰り返す。例えば、ユーザが、アイコンをダブルタップする場合、本システムは、その対象と関連付けられる２番目に直近のコンテンツ（例えば、対象が最後のコメントに先立って発言した内容）を再生するであろう。

【0012】

アクションシグネチャが、最小閾値を下回る長さを有する場合、シグネチャに対応するコンテンツの部分は、スローモーションにおいて繰り返される。アクションシグネチャが、最小閾値と最大閾値との間の長さを有する場合、コンテンツの部分は、所定のループ回数にわたって、または所定の時間周期にわたって、別の入力コマンドが、受信されるまで、連続ループにおいて再生される。

【図面の簡単な説明】

【0013】

本開示の上記および他の目的ならびに利点は、同様の参照文字が全体を通して同様の部分を指す、付随の図面と併せて検討される、以下の発明を実施するための形態の考慮に応じて明白となるであろう。

【0014】

【図1】図１は、本開示のいくつかの実施形態による、オーディオを繰り返すコマンドに応答して表示される、ユーザインターフェースの汎用実施形態を示す。

【0015】

【図2】図２は、本開示のいくつかの実施形態に従って処理されるべきオーディオデータの汎用実施形態を示す。

【0016】

【図3】図３は、本開示のいくつかの実施形態に従って処理されるべきビデオデータの汎用実施形態を示す。

【0017】

【図4】図４は、本開示のいくつかの実施形態による、オーディオおよびビデオデータをともに処理し、対象シグネチャをオーディオシグネチャに割り当てることによって発生される表のある実施例を示す。

【0018】

【図5】図５は、本開示のいくつかの実施形態に従って処理されるべきビデオデータの別の汎用実施形態を示す。

【0019】

【図6】図６は、本開示のいくつかの実施形態による、ビデオデータを処理し、対象シグネチャをアクションシグネチャに割り当てることによって発生される表のある実施例を示す。

【0020】

【図7】図７は、本開示のいくつかの実施形態による、オーディオを繰り返すコマンドに応答する、メディアデバイス内の制御回路およびデータフローを表す、ブロック図である。

【0021】

【図8】図８は、本開示のいくつかの実施形態による、コンテンツの一部を繰り返すためのプロセスを表す、フローチャートである。

【0022】

【図9】図９は、本開示のいくつかの実施形態による、対象シグネチャをオーディオシグネチャまたはアクションシグネチャに割り当てるためのプロセスを表す、フローチャートである。

【0023】

【図10】図１０は、本開示のいくつかの実施形態による、コンテンツの一部を再生するためのプロセスを表す、フローチャートである。

【0024】

【図11】図１１は、本開示のいくつかの実施形態による、ビデオデータから対象の画像を捕捉するためのプロセスを表す、フローチャートである。

【0025】

【図12】図１２は、本開示のいくつかの実施形態による、オーディオシグネチャを識別するためのプロセスを表す、フローチャートである。

【0026】

【図13】図１３は、本開示のいくつかの実施形態による、オーディオシグネチャを対象に割り当てるためのプロセスを表す、フローチャートである。

【0027】

【図14】図１４は、本開示のいくつかの実施形態による、オーディオの複数の部分のうちの１つを再生するためのプロセスを表す、フローチャートである。

【0028】

【図15】図１５は、本開示のいくつかの実施形態による、アクションシグネチャを識別するためのプロセスを表す、フローチャートである。

【0029】

【図16】図１６は、本開示のいくつかの実施形態による、コンテンツ内に表示される対象を識別するためのプロセスを表す、フローチャートである。

【0030】

【図17】図１７は、本開示のいくつかの実施形態による、閾値レベルの運動を検出するためのプロセスを表す、フローチャートである。

【0031】

【図18】図１８は、本開示のいくつかの実施形態による、スローモーションにおいて、またはループにおいてコンテンツの一部を繰り返すためのプロセスを表す、フローチャートである。

【発明を実施するための形態】

【0032】

図１は、メディアコンテンツの一部を一時停止する、または繰り返すコマンドに応答して、コンテンツ１０２にわたって表示される、ユーザインターフェースを描写する。コンテンツ１０２が、メディアデバイス１００上で消費されている間、メディアデバイス１００は、いくつかのシグネチャ（例えば、下記に議論されるように、オーディオシグネチャまたはアクションシグネチャ）を識別するために、コンテンツ１０２のオーディオおよび／またはビデオデータを処理する。ユーザは、コンテンツ１０２を一時停止するために、メディアデバイス１００のタッチスクリーンインターフェース上をタップしてもよい。ユーザは、代替として、または加えて、例えば、音声コマンドまたはユーザ入力デバイスを使用して、コンテンツの一部が繰り返されることを要求してもよい。コマンドを受信することに応じて、メディアデバイス１００は、コンテンツ１０２の再生を一時停止し、一時停止された再生位置またはその近傍においてシグネチャの対象１０４、１０６、１０８、および１１０を表す一連のアイコン１１２ａ－１１２ｄを表示する。ユーザは、アイコン１１２ａ－１１２ｄのうちの１つを選択してもよく、応答して、メディアデバイス１００は、選択されたアイコンによって表される対象と関連付けられる最近のシグネチャに対応するコンテンツの部分を繰り返す。例えば、アイコン１１２ａは、対象１０４を表す。アイコン１１２ａの選択に応答して、メディアデバイス１００は、対象１０４として識別されるキャラクタによって発話されているものとしてメディアデバイス１００によって識別される会話の一部を繰り返す。

【0033】

図２は、コンテンツ１０２内のオーディオシグネチャを識別するためのオーディオ処理のある実施形態を描写する。メディアデバイス１００は、コンテンツ１０２の再生の間にオーディオデータ２００を処理する。メディアデバイス１００は、オーディオデータ２０２のオーディオ特性を識別し、オーディオデータ２０２が、コンテンツ１０２内の単一の対象によって発話されている、または別様に発生されていると決定する。コンテンツ１０２の再生が、継続するにつれて、メディアデバイス１００は、オーディオデータ２０４を処理し、オーディオデータ２０４のオーディオ特性とオーディオデータ２０２のものとの比較に基づいて、オーディオデータ２０４が、オーディオデータ２０２のものと異なる対象によって発話されている、または別様に発生されていると決定する。メディアデバイス１００は、関連付けられる対象の識別子とともに、各オーディオシグネチャを記憶するためのデータベースまたは他のデータ構造を発生させてもよい。メディアデバイス１００は、類似する様式でオーディオデータ２０６および２０８を処理し続ける。ある場合には、複数の対象が、同時にオーディオを発生させ得る。例えば、オーディオデータ２１０は、２つの別個の対象によって同時に発生されるオーディオを含んでもよい。メディアデバイス１００は、オーディオデータを処理し、基底周波数、変調、振幅、または他のオーディオ特性等の各対象に特有のオーディオ特性を使用して、各対象からオーディオデータを分離する。

【0034】

図３は、コンテンツ１０２内の対象シグネチャを識別するためのビデオ処理のある実施形態を描写する。メディアデバイス１００は、コンテンツ１０２のビデオ内の対象を識別するために、併せてビデオデータ３００を処理する。メディアデバイス１００は、コンテンツ１０２内の離散オブジェクトおよびキャラクタ／俳優を識別するために、ビデオデータ３００を処理する。メディアデバイス１００は、ビデオの少なくとも１つのフレーム内に存在する少なくとも１つ／１人のオブジェクトまたはキャラクタ／俳優を決定する。メディアデバイス１００は、オブジェクトおよびキャラクタ／俳優を識別するために、顔認識、オブジェクト認識、エッジ検出、または任意の他の好適なビデオ処理方法を使用してもよい。メディアデバイス１００は、キャラクタ１が、ビデオデータ部分３０２、３０６、および３１２内に表示され、キャラクタ２が、ビデオデータ部分３０４、３０８、および３１０内に表示されていると決定する。メディアデバイス１００は、各識別されたキャラクタに対応するパラメータを対象シグネチャとして記憶してもよい。

【0035】

図４は、本開示のいくつかの実施形態による、オーディオおよびビデオデータをともに処理し、対象シグネチャをオーディオシグネチャに割り当てることによって発生される表のある実施例を示す。メディアデバイス１００は、ソースシグネチャおよびオーディオシグネチャが重複するタイムスタンプを決定し、個別の対象を重複するオーディオシグネチャに割り当てる。Ｔ_０とＴ_１との間で、キャラクタ１が、コンテンツ１０２内に表示される。Ｔ_１からＴ_４まで、キャラクタ１は、オーディオシグネチャＳ_１が、コンテンツ１０２内に存在する間、表示され続ける。メディアデバイス１００は、Ｓ_１をキャラクタ１に割り当てる。Ｔ_４からＴ_５まで、キャラクタ１は、表示され続けるが、いかなるオーディオシグネチャも、存在しない。Ｔ_５からＴ_６まで、キャラクタ２が、オーディオシグネチャＳ_２が、存在する間、コンテンツ１０２内に表示される。メディアデバイス１００は、Ｓ_２をキャラクタ２に割り当てる。Ｔ_７から始まって、キャラクタ１およびキャラクタ２の両方が、コンテンツ１０２内に表示される。オーディオシグネチャＳ_３が、Ｔ_８において開始される。メディアデバイス１００は、オーディオシグネチャＳ_３のオーディオ特性が、任意の以前に識別されたオーディオシグネチャ（すなわち、Ｓ_１またはＳ_２）のオーディオ特性に合致しないと決定し、オーディオシグネチャＳ_３を「ＵＮＫＮＯＷＮ－１」に一時的に割り当てる。同様に、Ｔ_１３において、オーディオシグネチャＳ_４が、コンテンツ１０２内に存在し、メディアデバイス１００は、オーディオシグネチャＳ_４のオーディオ特性が、任意の以前に識別されたオーディオシグネチャ（すなわち、Ｓ_１、Ｓ_２、またはＳ_３）のオーディオ特性に合致しないと決定する。加えて、いかなるキャラクタも、Ｔ_１３において表示されない。したがって、メディアデバイス１００は、オーディオシグネチャＳ_４を「ＵＮＫＮＯＷＮ－２」に一時的に割り当てる。Ｔ_１８において、オーディオシグネチャが、開始される一方、キャラクタ１が、コンテンツ１０２内に表示される。オーディオシグネチャのオーディオ特性は、以前に識別され、キャラクタ１に割り当てられたオーディオシグネチャＳ_１のものに合致する。メディアデバイス１００は、したがって、オーディオシグネチャをＳ_１として識別し、これをキャラクタ１に割り当てる。Ｔ_１８において、キャラクタ２もまた、コンテンツ１０２内に表示され、Ｔ_２１において、オーディオシグネチャＳ_１が、依然としてコンテンツ１０２内に存在する間、別のオーディオシグネチャが、開始され、オーディオシグネチャＳ_２のものに合致するオーディオ特性を有する。Ｓ_２は、キャラクタ２に割り当てられるとして以前に識別されたため、およびＳ_１は、依然として存在し、キャラクタ１にすでに割り当てられているため、メディアデバイス１００は、Ｓ_２をキャラクタ２に割り当てる。Ｔ_２３において類似する分析を使用して、メディアデバイス１００は、そのオーディオ特性に基づいて、オーディオシグネチャをＳ_１として識別し、これをキャラクタ１に割り当てる。

【0036】

図５は、コンテンツ１０２内のアクションシグネチャを識別するためのビデオ処理のある実施形態を描写する。メディアデバイス１００は、ビデオ内に表示される任意の対象の運動が、閾値レベルの運動５０２を超えるかどうかを決定するために、ビデオデータ３００を処理する。メディアデバイス１００は、最初に、コンテンツ１０２のビデオ内の対象の運動５０４を識別する。メディアデバイス１００は、コンテンツ１０２内の離散オブジェクトおよびキャラクタ／俳優を識別する。メディアデバイス１００は、ビデオの少なくとも１つのフレーム内に存在する少なくとも１つ／１人のオブジェクトまたはキャラクタ／俳優を決定する。メディアデバイス１００は、オブジェクトおよびキャラクタ／俳優を識別するために、顔認識、オブジェクト認識、エッジ検出、または任意の他の好適なビデオ処理方法を使用してもよい。メディアデバイス１００は、ビデオの後続フレーム内の各対象の位置を比較し、任意の対象が、ビデオの２つのフレームの間で閾値距離を上回って移動したかどうかを決定する。例えば、メディアデバイス１００は、キャラクタ１の運動が、Ｔ_３からＴ_８まで閾値５０２を超えていると決定し、運動５０６をアクションシグネチャＡ_１として識別する。同様に、メディアデバイス１００は、キャラクタ２の運動が、Ｔ_１９からＴ_２３まで閾値５０２を超えていると決定し、運動５０８をアクションシグネチャＡ_２として識別する。

【0037】

図６は、本開示のいくつかの実施形態による、ビデオデータを処理し、対象シグネチャをアクションシグネチャに割り当てることによって発生される表のある実施例を示す。図４に関連して上記に説明される分析と同様に、メディアデバイス１００は、アクションシグネチャと一致する対象シグネチャに基づいて、アクションシグネチャを対象シグネチャに割り当てる。したがって、アクションシグネチャＡ_１が、キャラクタ１がＡ_１の開始時に存在することに起因して、Ｔ_３においてキャラクタ１に割り当てられ、アクションシグネチャＡ_２が、キャラクタ２がＡ_２の開始時に存在することに起因して、Ｔ_１９においてキャラクタ２に割り当てられる。

【0038】

図７は、本開示のいくつかの実施形態による、メディアデバイス１００内の回路およびデータフローを表す、例証的ブロック図である。メディアデバイス１００は、テレビ、スマートＴＶ、セットトップボックス、衛星テレビに対応するための統合型受信機デコーダ（ＩＲＤ）、デジタル記憶デバイス、デジタルメディア受信機（ＤＭＲ）、デジタルメディアアダプタ（ＤＭＡ）、ストリーミングメディアデバイス、ＤＶＤプレーヤ、ＤＶＤレコーダ、接続型ＤＶＤ、ローカルメディアサーバ、ＢＬＵ－ＲＡＹ（登録商標）プレーヤ、ＢＬＵ－ＲＡＹ（登録商標）レコーダ、パーソナルコンピュータ（ＰＣ）、ラップトップコンピュータ、タブレットコンピュータ、ウェブＴＶボックス、パーソナルコンピュータテレビ（ＰＣ／ＴＶ）、ＰＣメディアサーバ、ＰＣメディアセンター、ハンドヘルドコンピュータ、固定電話、携帯情報端末（ＰＤＡ）、モバイル電話、ポータブルビデオプレーヤ、ポータブル音楽プレーヤ、ポータブルゲーム機、スマートフォン、または任意の他のテレビ機器、コンピューティング機器、もしくは無線デバイス、および／またはそれらの組み合わせ等の上記に説明されるコンテンツにアクセスするための任意のデバイスであってもよい。メディアデバイス１００は、入力回路７０４を備える。入力回路７０４は、音声コマンドを受信するためのマイクロホンおよび音声処理回路、遠隔制御デバイスからコマンドを受信するための赤外線受信回路、グラフィカルユーザインターフェース要素とのユーザ相互作用を受信するためのタッチスクリーンインターフェース、またはそれらの任意の組み合わせ、もしくは任意の他の好適なユーザ入力を受信するための任意の他の好適な入力回路を含んでもよい。メディアデバイス１００はまた、制御回路７００と、記憶装置７０２とを備える。制御回路７００は、任意の好適な処理回路に基づいてもよく、単一の集積回路上に配置され得る、または離散コンポーネントであり得る、制御回路と、メモリ回路とを備える。本明細書で参照されるように、処理回路は、１つまたはそれを上回るマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、プログラマブル論理デバイス、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）等に基づく回路を意味するように理解されるべきであり、マルチコアプロセッサ（例えば、デュアルコア、クアドコア、ヘクサコア、または任意の好適な数のコア）を含んでもよい。いくつかの実施形態では、処理回路は、複数の別個のプロセッサまたは処理ユニット、例えば、複数の同一のタイプの処理ユニット（例えば、２つのＩｎｔｅｌＣｏｒｅｉ７プロセッサ）または複数の異なるプロセッサ（例えば、ＩｎｔｅｌＣｏｒｅｉ５プロセッサおよびＩｎｔｅｌＣｏｒｅｉ７プロセッサ）を横断して分散されてもよい。いくつかの制御回路は、ハードウェア、ファームウェア、またはソフトウェアにおいて実装されてもよい。入力回路７０４は、制御回路７００と統合されてもよい。記憶装置７０２は、ランダムアクセスメモリ、読取専用メモリ、ハードドライブ、光学ドライブ、デジタルビデオディスク（ＤＶＤ）レコーダ、コンパクトディスク（ＣＤ）レコーダ、ＢＬＵ－ＲＡＹ（登録商標）ディスク（ＢＤ）レコーダ、ＢＬＵ－ＲＡＹ（登録商標）３Ｄディスクレコーダ、デジタルビデオレコーダ（ＤＶＲ、または時として、パーソナルビデオレコーダもしくはＰＶＲと呼ばれる）、ソリッドステートデバイス、量子記憶デバイス、ゲームコンソール、ゲームメディア、または任意の他の好適な固定もしくはリムーバブル記憶デバイス、および／またはそれらの任意の組み合わせ等の電子データを記憶するための任意のデバイスであってもよい。

【0039】

制御回路７００は、メディア再生回路７０６を備える。メディア再生回路７０６は、コンテンツプロバイダからコンテンツ１０２を受信する。コンテンツプロバイダは、ＯＴＴ／インターネットサービス（例えば、Ｎｅｔｆｌｉｘ）、従来的テレビネットワーク（例えば、ＮＢＣ）、従来的メディア会社（例えば、ＮＢＣＵｎｉｖｅｒｓａｌ）、または任意の他の好適なコンテンツプロバイダであってもよい。コンテンツ１０２は、ケーブルテレビ接続または地上波放送を経由して、物理的ＲＦチャネルを介して受信されてもよい、もしくは有線接続（例えば、イーサネット（登録商標））または無線接続（例えば、８０２．１１ａ／ｂ／ｇ／ｎ（Ｗｉ－Ｆｉ）、ＷｉＭＡＸ、ＧＳＭ（登録商標）、ＵＴＭＳ、ＣＤＭＡ、ＴＤＭＡ、３Ｇ、４Ｇ、４ＧＬＴＥ、または任意の他の好適なタイプの無線データ伝送）を使用して、オーバーザトップ（ＯＴＴ）サービスからインターネット接続を経由して受信されてもよい。メディア再生回路は、コンテンツ１０２を処理し、それぞれ、コンテンツ１０２のオーディオおよびビデオデータをオーディオ処理回路７１０およびビデオ処理回路７１２に伝送する７０８。メディア再生回路は、それぞれ、コンテンツ１０２のオーディオおよびビデオデータをオーディオ出力回路７１６およびビデオ出力回路７１８に同時に伝送する７１４。

【0040】

オーディオ処理回路７１０は、任意の好適なオーディオ分析技法を使用して、一意のオーディオシグネチャを識別するために、コンテンツ１０２のオーディオデータのオーディオ特性を分析する。例えば、オーディオ処理回路７１０は、特定の音声の基底周波数および一意の高調波パターンを決定するための周波数分析、特定の音声のアクセントを決定するための音素分析等を使用してもよい。オーディオ処理回路７１０はまた、類似する周波数分析技法またはオーディオ分析の任意の他の好適な方法を使用して、音楽、効果音、および同等物等の非音声オーディオを識別してもよい。いったんオーディオ特性の特定のセットが、識別されると、オーディオ処理回路７１０は、例えば、記憶装置７０２内に、オーディオ特性が最初に識別されたコンテンツ１０２の再生位置に対応するタイムスタンプとともに、オーディオ特性を記憶する。オーディオ処理回路７１０は、コンテンツ１０２のオーディオデータを分析し続け、オーディオデータの決定されたオーディオ特性を記憶されたオーディオ特性と比較する。オーディオ特性の有意な差異を検出することに応じて、オーディオ処理回路７１０は、オーディオのソースが、変化したと決定する。例えば、音声の基底周波数が、２０Ｈｚを上回って変化し得る。オーディオ処理回路は、記憶されたオーディオ特性およびタイムスタンプからオーディオシグネチャを発生させ、記憶装置７０２内のデータベース内にオーディオシグネチャを記憶する７２０。オーディオ処理回路７１０は、次いで、記憶装置７０２内に新しいオーディオ特性および新しいタイムスタンプを記憶し、上記に説明されるようにオーディオデータを分析し続ける。

【0041】

いくつかの実施形態では、メディアデバイス１００は、オーディオシグネチャに対応する対象を識別するために、オーディオデータと併せてコンテンツ１０２のビデオデータを処理する。いくつかの実施形態では、メディアデバイス１００は、コンテンツ１０２内の対象の運動に基づいて、アクションシグネチャを識別するために、ビデオデータを処理する。ビデオ処理回路７１２は、ビデオフレーム内の対象を識別するために、エッジ検出、顔認識、または任意の他の好適なビデオもしくは画像処理技法を使用して、コンテンツ１０２のビデオデータを分析する。ビデオ処理回路７１２は、ビデオデータの単一のフレームを捕捉および処理してもよい、またはビデオデータの１つを上回るフレームを処理してもよい。例えば、ビデオ処理回路７１２は、フレーム内に描写される人物を識別するために、単一のフレームを処理する、または人物の口の移動を分析することによって、フレームのセット内に描写される人物が、オーディオシグネチャの対象であるかどうかを決定するために、連続的フレームのセットを処理してもよい。描写される対象が、識別される場合、オーディオシグネチャは、ソースの識別子７２２と関連付けて記憶装置７０２内に記憶される７２０。いくつかの実施形態では、ビデオ処理回路７１２はまた、対象が描写される少なくとも１つのフレームの一部を画像として捕捉し、オーディオシグネチャと関連付けて、または対象の識別子と関連付けて画像を記憶する。代替として、ビデオ処理回路７１２は、対象が描写される特定のフレームの識別子および対象を描写するフレームの一部を識別する座標のセットを記憶する。

【0042】

コンテンツ１０２の再生の間、入力回路７０４は、コンテンツの一部を繰り返すために、ユーザ入力デバイスからコマンド７２４を受信する。コマンド７２４を受信することに応じて、入力回路７０４は、コンテンツ１０２の再生を一時停止するための命令７２６をメディア再生回路７０６に伝送し、コマンド７２４が受信された時間に先立つ閾値時間量内のオーディオシグネチャおよび／またはアクションシグネチャを読み出すための命令７２８を記憶装置７０２に伝送する。例えば、入力回路７０４は、コンテンツ１０２が一時停止されるタイムスタンプに先立つ最後の３０秒以内のタイムスタンプを伴うシグネチャを読み出すように記憶装置７０２に命令してもよい。読み出されたシグネチャは、記憶装置７０２から制御回路７００に伝送される７３０。制御回路７００は、ビデオ出力回路７１８を使用して、いくつかのアイコンを表示のために発生させ、各アイコンは、読み出されたオーディオシグネチャのうちの１つの対象を表す。アイコンは、次いで、一時停止されたコンテンツ１０２にわたるオーバーレイとして表示される７３２。

【0043】

アイコンの選択７３４を受信することに応じて、入力回路７０４は、選択されたアイコンによって表されるシグネチャに対応するコンテンツ１０２の部分をリプレーするための命令７３６をメディア再生回路７０６に伝送する。メディア再生回路７０６は、メディアデータを読み出し、読み出されたメディアデータを出力７４０、７３２のためにオーディオ出力回路７１６およびビデオ出力回路７１８に伝送する７３８。

【0044】

図８は、本開示のいくつかの実施形態による、コンテンツの一部を繰り返すためのクエリを解決するための例証的プロセス８００を表す、フローチャートである。プロセス８００は、制御回路７００上で実装されてもよい。加えて、プロセス８００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0045】

８０２において、制御回路７００は、オーディオ処理回路７１０および／またはビデオ処理回路７１２を使用して、コンテンツ１０２の再生の間、複数のシグネチャを識別する。これは、図１２に関連して下記に説明される方法を使用して遂行されてもよい。オーディオ処理回路７１０および／またはビデオ処理回路７１２は、一度にコンテンツ１０２内の１つのシグネチャを識別してもよい、または同時に複数のシグネチャを識別してもよい。

【0046】

８０４において、制御回路７００は、０の値を用いてカウンタ変数Ｎを初期化する。識別されたシグネチャ毎に、制御回路７００は、８０６において、以前に識別された対象が、現在のシグネチャの対象であるかどうかを決定する。例えば、制御回路７００は、以前のオーディオシグネチャのオーディオ特性を現在のオーディオシグネチャのものと比較する。別の実施例として、制御回路７００は、ビデオのフレーム内に表示されるオブジェクトおよびキャラクタを以前に識別された対象のパラメータと比較する。現在のオーディオシグネチャのオーディオ特性が、以前のオーディオシグネチャのうちのいずれかのものに合致しない場合、または現在表示されるいかなるオブジェクトもしくはキャラクタも、以前に識別された対象に合致しない場合、８０８において、制御回路７００は、新しい識別子をシグネチャの対象として割り当てる。現在のオーディオシグネチャのオーディオ特性が、以前のオーディオシグネチャのものに確かに合致する場合、または現在表示されるオブジェクトもしくはキャラクタが、以前に識別された対象に合致する場合、制御回路７００は、現在のシグネチャの対象が、合致するオーディオ特性または画像パラメータを有する以前のシグネチャの対象と同一であると決定し、８１０において、以前のシグネチャの対象識別子を現在のシグネチャに割り当てる。制御回路７００は、次いで、現在のシグネチャの識別子および現在のシグネチャに対応する開始時間を記憶装置７０２内に記憶する。８１２において、制御回路７００は、Ｎの値を識別されたシグネチャの数と比較することによって、全ての識別されたシグネチャが、すでに処理されているかどうかを決定する。処理すべきさらなるシグネチャが、存在する場合、８１４において、制御回路７００は、Ｎの値を１だけ増分させ、処理は、ステップ８０６に戻る。

【0047】

８１６において、制御回路７００は、入力回路７０４を使用して、入力コマンドを受信する。入力コマンドは、コンテンツの再生を一時停止するコマンドまたはコンテンツの一部を繰り返すコマンドであってもよい。例えば、入力回路７０４は、音声コマンドを受信するためのマイクロホン、リモートコントロールからコマンドを受信するための赤外線受信機、タブレットまたはスマートフォン等のデバイスからコマンドを受信するためのＷｉ－ＦｉもしくはＢｌｕｅｔｏｏｔｈ（登録商標）モジュール、または入力コマンドを受信するための任意の他の好適な回路を含んでもよい。

【0048】

８１８において、制御回路７００は、ビデオ出力回路７１８を使用して、複数のアイコン（例えば、１１２ａ－１１２ｄ）を表示のために発生させ、各アイコンは、読み出されたシグネチャと関連付けられる対象を表す。８２０において、制御回路７００は、入力回路７０４を使用して、アイコンの選択を受信する。選択を受信することに応答して、制御回路７００は、選択されたアイコンと関連付けられるシグネチャのタイムスタンプを読み出す。８２２において、制御回路７００は、メディア再生回路７０６を使用して、シグネチャのタイムスタンプに対応するコンテンツ１０２の部分を読み出し、オーディオ出力回路７１６およびビデオ出力回路７１８を使用して、コンテンツの部分を再生する。複数のオーディオシグネチャが、一致する場合、制御回路７００は、オーディオ処理回路７１０を使用して、図１４に関連して下記に説明されるように、オーディオシグネチャの対象からオーディオデータを分離してもよい。

【0049】

図８のアクションまたは説明は、本開示の任意の他の実施形態と併用されてもよい。加えて、図８に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0050】

図９は、本開示のいくつかの実施形態による、対象シグネチャをオーディオシグネチャまたはアクションシグネチャに割り当てるための例証的プロセス９００を表す、フローチャートである。プロセス９００は、制御回路７００上で実装されてもよい。加えて、プロセス９００の１つまたはそれを上回るアクションは、本明細書に開示される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0051】

９０２において、制御回路７００は、コンテンツ１０２の再生の間、少なくとも１つの対象シグネチャを識別する。例えば、制御回路７００は、ビデオ処理回路７１２を使用して、コンテンツ１０２の少なくとも１つのビデオフレームを分析する。エッジ検出、顔検出、または任意の他の好適な画像処理もしくはビデオ処理技法を使用して、ビデオ処理回路７１２は、ビデオフレーム内に表示される少なくとも１つの対象の対象シグネチャを識別する。制御回路７００は、記憶装置７０２内に、各表示される対象の視覚特性に対応するパラメータのセットを記憶する。

【0052】

９０４において、制御回路７００は、０の値を用いてカウンタ変数Ｎを初期化する。識別された対象シグネチャ毎に、制御回路７００は、９０６において、以前に識別された対象が、現在のシグネチャの対象であるかどうかを決定する。例えば、制御回路７００は、以前の対象シグネチャのパラメータを現在の対象シグネチャのものと比較する。現在の対象シグネチャのパラメータが、以前の対象シグネチャのうちのいずれかのものに合致しない場合、または現在表示されるいかなる対象も、以前に識別された対象に合致しない場合、９０８において、制御回路７００は、新しい識別子を対象シグネチャに割り当てる。現在の対象シグネチャのパラメータが、以前の対象シグネチャのものに確かに合致する場合、または現在表示される対象が、以前に識別された対象に合致する場合、制御回路７００は、現在のシグネチャの対象が、合致するパラメータを有する以前のシグネチャの対象と同一であると決定し、９１０において、以前のシグネチャの対象識別子を現在のシグネチャに割り当てる。制御回路７００は、次いで、対象識別子および対象シグネチャに対応する開始時間を記憶装置７０２内に記憶する。

【0053】

９１２において、制御回路７００は、任意のオーディオシグネチャまたはアクションシグネチャが、現在の対象シグネチャと同一のタイムスタンプを有するかどうかを決定する。いかなるオーディオシグネチャまたはアクションシグネチャも、現在の対象シグネチャと同一のタイムスタンプを有していない場合、処理は、ステップ９１６に進む。オーディオシグネチャまたはアクションシグネチャが、現在の対象シグネチャと同一のタイムスタンプを有する場合、９１４において、制御回路７００は、現在の対象シグネチャを同一のタイムスタンプを有するオーディオシグネチャまたはアクションシグネチャに割り当てる。現在の対象シグネチャを同一のタイムスタンプを有するオーディオシグネチャまたはアクションシグネチャに割り当てた後、９１６において、制御回路７００は、Ｎの値を識別されたシグネチャの数と比較することによって、全ての識別されたシグネチャが、すでに処理されているかどうかを決定する。処理すべきさらなるシグネチャが、存在する場合、９１６において、制御回路７００は、Ｎの値を１だけ増分させ、処理は、ステップ９０６に戻る。

【0054】

図９のアクションまたは説明は、本開示の任意の他の実施形態と併用されてもよい。加えて、図９に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0055】

図１０は、本開示のいくつかの実施形態による、オーディオの一部を再生するための例証的プロセス１０００を表す、フローチャートである。プロセス１０００は、制御回路７００上で実装されてもよい。加えて、プロセス１０００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0056】

１００２において、制御回路７００は、アイコンによって表される対象の識別子を読み出す。例えば、表示のためにアイコンを発生させるとき、制御回路７００は、対象識別子を含むアイコンに関するメタデータを含んでもよい。別の実施例では、制御回路７００は、ソース識別子への参照またはポインタを含む、リンクもしくは他のコンピュータコードを発生させる。

【0057】

１００４において、制御回路７００は、シグネチャが対象の識別子と関連付けて記憶された、記憶装置７０２内のデータベースまたは他のデータ構造にアクセスする。１００６において、制御回路７００は、データベースまたはデータ構造から、読み出された対象識別子と関連付けられるシグネチャのタイムスタンプを読み出す。１００８において、制御回路７００は、メディア再生回路７０６を使用して、読み出されたタイムスタンプにおいて開始されるコンテンツ１０２のオーディオの部分を再生する。

【0058】

図１０のアクションまたは説明は、本開示の任意の他の実施形態と併用されてもよい。加えて、図１０に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0059】

図１１は、本開示のいくつかの実施形態による、ビデオデータからオーディオソースの画像を捕捉するための例証的プロセス１１００を表す、フローチャートである。プロセス１１００は、制御回路７００上で実装されてもよい。加えて、プロセス１１００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0060】

１１０２において、制御回路７００は、ビデオ処理回路７１２を使用して、シグネチャに対応するコンテンツ１０２のビデオデータの少なくとも１つのフレームを処理し、１１０４において、少なくとも１つのフレーム内に表示される対象を識別する。例えば、ビデオ処理回路７１２は、フレーム内に表示されるオブジェクトまたはキャラクタを識別するために、エッジ検出、顔認識、オブジェクト認識、または任意の他の好適なビデオ処理もしくは画像処理技法を使用してもよい。１つを上回るフレームが、処理される場合、ビデオ処理回路７１２は、例えば、キャラクタの口が、シグネチャの再生の間に移動しているかどうかを決定するために、フレームを比較してもよい。

【0061】

１１０６において、ビデオ処理回路７１２は、識別された対象が表示されるビデオフレームの一部を捕捉する。ビデオ処理回路７１２は、フレームから画像データを捕捉し、シグネチャと関連付けて記憶装置７０２内に画像を記憶してもよい。代替として、ビデオ処理回路７１２は、識別されたソースが表示されるフレームの面積を境界する座標を捕捉し、シグネチャと関連付けて、座標ならびにフレームの識別子を記憶装置７０２内に記憶してもよい。

【0062】

図１１のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１１に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0063】

図１２は、本開示のいくつかの実施形態による、オーディオシグネチャを識別するための例証的プロセス１２００を表す、フローチャートである。プロセス１２００は、制御回路７００上で実装されてもよい。加えて、プロセス１２００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0064】

１２０２において、制御回路７００は、オーディオ処理回路７１０を使用して、第１のタイムスタンプにおいてコンテンツ１０２のオーディオデータの分析を開始する。１２０４において、制御回路７００は、変数Ｔ_{ｆｉｒｓｔ}を初期化し、その値として第１のタイムスタンプを設定する。１２０６において、オーディオ処理回路７１０は、第１のソースに一意である、オーディオデータのオーディオ特性を識別する。例えば、オーディオ処理回路７１０は、特定のソースからのものとしてオーディオを一意に識別するために、周波数分析、リズム分析、高調波、テンポ、または任意の他のオーディオ特性を使用してもよい。１２０８において、オーディオ処理回路７１０は、オーディオデータを分析し続ける。

【0065】

１２１０において、制御回路７００は、変数Ｔ_{ｃｕｒｒｅｎｔ}を初期化し、その値を現在分析されているオーディオデータに対応するタイムスタンプとして設定する。１２１２において、オーディオ処理回路７１０は、Ｔ_{ｃｕｒｒｅｎｔ}におけるオーディオ特性が、Ｔ_{ｆｉｒｓｔ}におけるオーディオ特性と異なるかどうかを決定する。例えば、オーディオ処理回路７１０は、任意の特性の値が、５パーセント等の少なくともある閾値量だけ変化したかどうかを識別するために、Ｔ_{ｃｕｒｒｅｎｔ}におけるオーディオ特性のセットをＴ_{ｆｉｒｓｔ}において識別されたものと比較してもよい。いかなる変化も、検出されない場合、処理は、１２０８に戻り、オーディオ処理回路７１０は、オーディオデータを分析し続ける。

【0066】

Ｔ_{ｃｕｒｒｅｎｔ}におけるオーディオ特性が、Ｔ_{ｆｉｒｓｔ}におけるオーディオ特性と異なると決定される場合、１２１４において、オーディオ処理回路７１０は、オーディオシグネチャとしてＴ_{ｆｉｒｓｔ}からＴ_{ｃｕｒｒｅｎｔ}までのオーディオデータの部分を識別する。オーディオ処理回路７１０は、少なくともＴ_{ｆｉｒｓｔ}とともに、オーディオシグネチャを記憶装置７０２内に記憶する。１２１６において、制御回路７００は、Ｔ_{ｆｉｒｓｔ}の値をＴ_{ｃｕｒｒｅｎｔ}の値に設定し、処理は、１２０８に戻る。

【0067】

図１２のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１２に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0068】

図１３は、本開示のいくつかの実施形態による、オーディオシグネチャを対象に割り当てるための例証的プロセス１３００を表す、フローチャートである。プロセス９００は、制御回路７００上で実装されてもよい。加えて、プロセス９００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0069】

１３０２において、制御回路７００は、ビデオ処理回路７１２を使用して、Ｔ_{ｆｉｒｓｔ}とＴ_{ｃｕｒｒｅｎｔ}との間のコンテンツ１０２の一部からの少なくとも１つのビデオフレームを処理する。１３０４において、ビデオ処理回路７１２は、対象が、少なくとも１つのフレーム内に表示されているかどうかを決定する。ビデオ処理回路７１２は、エッジ検出、顔認識、オブジェクト認識、または任意の他の好適なビデオ処理もしくは画像処理技法を使用してもよい。

【0070】

表示される対象が、少なくとも１つのフレーム内に表示されている場合、１３０６において、制御回路７００は、表示される対象が、オーディオシグネチャのソースであるかどうかを決定する。例えば、制御回路７００は、オーディオ処理回路７１０およびビデオ処理回路７１２を使用して、オーディオシグネチャをビデオデータの少なくとも１つのフレームと比較してもよい。オーディオ処理回路７１０は、オーディオ特性に基づいて、オーディオシグネチャのタイプを識別してもよい。例えば、オーディオ処理回路７１０は、低周波数発話パターンを男性の声として識別してもよい。制御回路７００は、次いで、少なくとも１つのビデオフレーム内の男性の姿を識別するために、ビデオ処理回路７１２を使用してもよい。ビデオ処理回路４１２は、その口が、オーディオシグネチャの間に移動しているキャラクタを識別してもよい。

【0071】

表示される対象が、オーディオシグネチャのソースである場合、１３０８において、制御回路７００は、オーディオシグネチャを表示されるソースに割り当てる。例えば、制御回路７００は、オーディオシグネチャと関連付けて対象の識別子を含むために、記憶装置７０２内のデータベースまたはデータ構造を更新してもよい。

【0072】

いかなる対象も、少なくとも１つのフレーム内に表示されない場合、または表示される対象が、オーディオシグネチャのソースではない場合、１３１０において、制御回路７００は、オーディオシグネチャを別の対象に割り当てる。制御回路７００は、オーディオ処理回路７１０を使用して、オーディオシグネチャのオーディオ特性を既知の対象を有する他のオーディオシグネチャと比較してもよい。合致が、検出される場合、制御回路７００は、オーディオシグネチャの対象として、合致するオーディオ特性を有するオーディオシグネチャの対象を割り当ててもよい。いかなる合致も、検出されない場合、制御回路７００は、新しいまたは一時的な対象識別子をオーディオシグネチャに割り当ててもよい。

【0073】

図１３のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１３に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0074】

図１４は、本開示のいくつかの実施形態による、オーディオの複数の部分のうちの１つを再生するための例証的プロセス１４００を表す、フローチャートである。プロセス１４００は、制御回路４００上で実装されてもよい。加えて、プロセス１４００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0075】

１４０２において、制御回路７００は、１つを上回るオーディオシグネチャが、現在の再生タイムスタンプの閾値時間内の終了時間を有するかどうかを決定する。例えば、いくつかのキャラクタが、会話をしているコンテンツ１０２の一部では、いくつかのオーディオシグネチャは、現在の再生位置から３０秒以内に終了し得、閾値周期内に存在するオーディオシグネチャに関するクエリに応答して、返されるであろう。

【0076】

１４０４において、制御回路７００は、閾値周期内に終了するオーディオシグネチャのうちのいずれかが、時間的に重複するかどうかを決定する。例えば、２人のキャラクタが、同時に発話し、少なくとも１つのオーディオシグネチャが、別のオーディオシグネチャと同時に、またはその開始時間と終了時間との間に終了することをもたらし得る。いかなるオーディオシグネチャも、時間的に重複しない場合、１４０６において、制御回路７００は、直近のオーディオシグネチャに対応するコンテンツ１０２のオーディオデータの一部を再生する。しかしながら、任意のオーディオシグネチャが、時間的に重複する場合、１４０８において、制御回路７００は、オーディオ処理回路７１０を使用して、各オーディオシグネチャに対応するオーディオデータを分離する。オーディオ処理回路７１０は、各シグネチャに一意の周波数および高調波を分離するために、各オーディオシグネチャのオーディオ特性を使用してもよい。オーディオ処理回路７１０は、背景雑音と関連付けられる周波数を抑制してもよい。オーディオ処理回路７１０は、各個々のオーディオシグネチャを表すオーディオデータを抽出またはコピーし、各オーディオシグネチャに対応する個々のオーディオサンプルを発生させてもよい。

【0077】

１４１０において、制御回路７００は、ビデオ出力回路７１８を使用して、複数のアイコンを表示のために発生させ、各アイコンは、オーディオシグネチャのうちの１つに対応する対象を表す。１４１２において、制御回路７００は、入力回路７０４を使用して、アイコンの選択を受信し、１４１４において、メディア再生回路７０６を使用して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するコンテンツ１０２の少なくともオーディオの一部を再生する。これは、上記に説明されるような抽出されたオーディオサンプルであり得る。

【0078】

図１４のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１４に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0079】

図１５は、本開示のいくつかの実施形態による、アクションシグネチャを識別するための例証的プロセス１５００を表す、フローチャートである。プロセス１５００は、制御回路７００上で実装されてもよい。加えて、プロセス１５００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0080】

１５０２において、制御回路７００は、ビデオ処理回路７１２を使用して、第１のタイムスタンプにおいてコンテンツ１０２のビデオデータの分析を開始する。１５０４において、制御回路７００は、変数Ｔ_{ｆｉｒｓｔ}を初期化し、その値として第１のタイムスタンプを設定する。１５０６において、ビデオ処理回路７１２は、コンテンツ１０２のビデオデータ内に表示される対象が、閾値レベルの運動を表示しているかどうかを決定する。例えば、ビデオ処理回路７１２は、２つのフレームの間で進行した距離を決定するために、第１のタイムスタンプにおけるフレーム内の各対象の位置を以前のフレームのものと比較してもよい。いかなる対象も、閾値レベルの運動を表示しない場合、処理は、ステップ１５０２に戻る。

【0081】

対象が、閾値レベルの運動を確かに表示する場合、１５０８において、ビデオ処理回路７１２は、ビデオデータを分析し続ける。１５１０において、制御回路７００は、変数Ｔ_{ｃｕｒｒｅｎｔ}を初期化し、その値を現在分析されているビデオデータに対応するタイムスタンプとして設定する。１５１２において、ビデオ処理回路７１２は、Ｔ_{ｃｕｒｒｅｎｔ}における対象の運動が、依然として、閾値レベルの運動にある、またはそれを上回るかどうかを決定する。該当する場合、処理は、１５０８に戻り、ビデオ処理回路７１２は、ビデオデータを分析し続ける。

【0082】

Ｔ_{ｃｕｒｒｅｎｔ}における対象の運動が、閾値レベルの運動を下回ると決定される場合、１５１４において、ビデオ処理回路７１２は、アクションシグネチャとして、Ｔ_{ｆｉｒｓｔ}からＴ_{ｃｕｒｒｅｎｔ}までのビデオデータの部分を識別する。ビデオ処理回路７１２は、少なくともＴ_{ｆｉｒｓｔ}とともに、アクションシグネチャを記憶装置７０２内に記憶する。１５１６において、制御回路７００は、Ｔ_{ｆｉｒｓｔ}の値をＴ_{ｃｕｒｒｅｎｔ}の値に設定し、処理は、１５０６に戻る。

【0083】

図１５のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１５に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0084】

図１６は、本開示のいくつかの実施形態による、コンテンツ内に表示される対象を識別するための例証的プロセス１６００を表す、フローチャートである。プロセス１６００は、制御回路７００上で実装されてもよい。加えて、プロセス１６００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0085】

１６０２において、制御回路７００は、ビデオ処理回路７１２を使用して、コンテンツ１０２のビデオのフレーム内の顔を検出する。ビデオ処理回路７１２は、コンテンツ１０２のビデオデータ内に表示される顔を識別するために、任意の好適なビデオ処理または画像処理技法を使用してもよい。ビデオ処理回路７１２は、瞳孔間距離（すなわち、顔の眼の左および右の瞳孔の間の距離）、鼻サイズまたは位置、耳サイズまたは位置、髪の色、眼の色、全体的な顔の形状等の検出された顔を一意に識別する画像パラメータのセットを識別してもよい。ビデオ処理回路７１２はまた、顔を識別するために、Ｈａａｒアルゴリズムまたはローカルバイナリパターンアルゴリズムを採用してもよい。１６０４において、ビデオ処理回路７１２は、識別子を検出された顔に割り当てる。１６０６において、ビデオ処理回路７１２は、割り当てられた識別子と関連付けて顔に対応するパラメータのセットを記憶装置７０２内に記憶する。

【0086】

図１６のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１６に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0087】

図１７は、本開示のいくつかの実施形態による、閾値レベルの運動を検出するための例証的プロセス１７００を表す、フローチャートである。プロセス１７００は、制御回路７００上で実装されてもよい。加えて、プロセス１７００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0088】

１７０２において、制御回路７００は、ビデオ処理回路７１２を使用して、コンテンツ１０２の第１のビデオフレームを分析する。ビデオ処理回路は、図９に関連して上記に説明される方法を使用して、第１のビデオフレーム内に表示される少なくとも１つの対象を識別する。１７０４において、ビデオ処理回路７１２は、第１のビデオフレーム内の対象の位置を識別する。例えば、ビデオ処理回路７１２は、対象の隅のｘおよびｙ座標を識別する。対象が、キャラクタの顔等、不規則な形状である場合、ビデオ処理回路７１２は、最初に、対象の最上部のピクセルの直接左側にあり、対象の最も左のピクセルの直上の点に対応する左上隅と、対象の最底部のピクセルの直接右側にあり、対象の最も右のピクセルの直下の点に対応する右下隅とを有する境界ボックスを定義してもよい。ビデオ処理回路７１２は、次いで、境界ボックスの位置を識別してもよい。

【0089】

１７０６において、ビデオ処理回路７１２は、コンテンツ１０２のビデオの次のフレームを分析し、１７０８において、上記に説明される方法を使用して、ビデオの次のフレーム内の対象の位置を識別する。１７１０において、ビデオ処理回路７１２は、対象が、分析される２つのフレームの間で閾値距離だけ移動したかどうかを決定する。例えば、ビデオ処理回路７１２は、フレームのそれぞれの中のオブジェクトまたは境界ボックスの位置の間の差異を計算し、オブジェクトが、閾値数のピクセルを上回って移動したかどうかを決定してもよい。ビデオ処理回路７１２はまた、２つのフレームの間のオブジェクトの見掛けサイズを比較し、サイズが、閾値量だけ増加または減少したかどうかを決定することによって、視認者に向かう、またはそれから離れる運動を考慮してもよい。ビデオ処理回路７１２は、対象の３次元運動を決定するために、これらの計算の両方を使用してもよい。ビデオ処理回路７１２は、それに沿って対象が移動した３次元空間内のベクトルを計算し、ベクトルに沿って進行した距離を決定してもよい。対象が、閾値距離だけ移動した場合、１７１２において、ビデオ処理回路７１２は、閾値レベルの運動が、検出されたと識別する。

【0090】

図１７のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１７に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0091】

図１８は、本開示のいくつかの実施形態による、スローモーションにおいて、またはループにおいてコンテンツの一部を繰り返すための例証的プロセス１８００を表す、フローチャートである。プロセス１８００は、制御回路７００上で実装されてもよい。加えて、プロセス１８００の１つまたはそれを上回るアクションは、本明細書に説明される任意の他のプロセスまたは実施形態の１つまたはそれを上回るアクションの中に組み込まれる、もしくはそれと組み合わせられてもよい。

【0092】

１８０２において、制御回路７００は、選択されたアクションシグネチャに対応するコンテンツ１０２の部分が、３０秒等の最大閾値よりも短いかどうかを決定する。コンテンツ１０２の部分が、最大閾値よりも短い場合、１８０４において、制御回路７００は、コンテンツ１０２の部分がまた、５秒等の最小閾値よりも短いかどうかを決定する。選択されたアクションシグネチャに対応するコンテンツ１０２の部分が、最小閾値よりも短い場合、１８０６において、制御回路７００は、メディア再生回路７０６を使用して、スローモーションにおいてコンテンツ１０２の部分を繰り返す。選択されたアクションシグネチャに対応するコンテンツ１０２の部分の長さが、最小閾値と最大閾値との間である場合、１８０８において、制御回路７００は、メディア再生回路７０６を使用して、ループにおいてコンテンツ１０２の部分を繰り返す。メディア再生回路７０６は、別の入力コマンドが、受信されるまで、コンテンツ１０２の部分をループし続けてもよい。代替として、または加えて、メディア再生回路７０６は、所定のループ回数（例えば、５回のループ）または所定の時間量（例えば、３０秒）にわたってコンテンツ１０２の部分をループし続けてもよい。

【0093】

図１８のアクションまたは説明は、本開示の任意の他の実施形態と併用され得ることが検討される。加えて、図１８に関連して説明されるアクションおよび説明は、本開示の目的を促すために、好適な代替順序で、または並行して行われてもよい。

【0094】

上記に説明されるプロセスは、限定的ではなく、例証的であることを意図している。当業者は、本発明の範囲から逸脱することなく、本明細書に議論されるプロセスのステップが、省略される、修正される、組み合わせられる、および／または再配列され得、任意の付加的ステップが、実施され得ることを理解するであろう。より一般的には、上記の開示は、限定ではなく、例示的であることを意味している。続く請求項のみが、本発明が含むものに関する境界を設定することを意味している。さらに、任意の１つの実施形態に説明される特徴および限定は、本明細書の任意の他の実施形態に適用され得、一実施形態に関するフローチャートまたは実施例は、好適な様式で任意の他の実施形態と組み合わせられる、異なる順序で行われる、または並行して行われ得ることに留意されたい。加えて、本明細書に説明されるシステムおよび方法は、リアルタイムで実施されてもよい。また、上記に説明されるシステムおよび／または方法は、他のシステムおよび／または方法に適用される、もしくはそれらに従って使用され得ることにも留意されたい。
本明細書は、限定ではないが、以下を含む実施形態を説明した。
１．コンテンツのオーディオの一部の対象を表示するための方法であって、
コンテンツの再生の間、コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別するステップと、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子を記憶するステップと、
入力コマンドを受信するステップと、
各オーディオシグネチャを表すアイコンを表示のために発生させるステップと、
を含む、方法。
２．アイコンの選択を受信するステップと、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの一部を再生するステップと、
をさらに含む、項目１に記載の方法。
３．コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別するステップと、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶するステップと、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するオーディオシグネチャに割り当てるステップと、
をさらに含む、項目１に記載の方法。
４．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するステップは、
選択されたアイコンによって表される対象の識別子を読み出すステップと、
読み出された識別子と関連付けられるオーディオシグネチャの記憶されたタイムスタンプを読み出すステップと、
タイムスタンプにおいて開始されるオーディオの部分を再生するステップと、
を含む、項目２に記載の方法。
５．複数の音の各音の対象の画像を捕捉するステップをさらに含み、各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、項目１に記載の方法。
６．オーディオシグネチャを識別するステップは、
第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性を分析するステップと、
後続タイムスタンプにおいて開始されるオーディオのオーディオ特性が、第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性と異なると決定するステップと、
第１のタイムスタンプと後続タイムスタンプとの間のオーディオの部分を第１のオーディオシグネチャとして識別するステップと、
を含む、項目１に記載の方法。
７．第１のタイムスタンプと後続タイムスタンプとの間のコンテンツのビデオフレームを分析するステップと、
音の対象が、ビデオフレーム内に表示されているかどうかを決定するステップと、
第１のオーディオシグネチャを表示される対象に割り当てるステップと、
をさらに含む、項目６に記載の方法。
８．分析するステップに基づいて、表示される対象が、第１のオーディオシグネチャに対応するオーディオデータの対象であると決定するステップをさらに含む、項目７に記載の方法。
９．オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する音が終了する第２のタイムスタンプを記憶するステップと、
入力コマンドを受信することに応答して、現在の再生タイムスタンプから閾値時間内の第２のタイムスタンプを有する複数のオーディオシグネチャを決定するステップと、
をさらに含む、項目１に記載の方法。
１０．各オーディオシグネチャのタイムスタンプおよび第２のタイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定するステップと、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生するステップと、
をさらに含む、項目９に記載の方法。
１１．複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するステップをさらに含み、複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、項目１０に記載の方法。
１２．音は、発話であり、
音の対象は、話者である、
項目１に記載の方法。
１３．コンテンツのオーディオの一部の対象を表示するためのシステムであって、
メモリと、
制御回路であって、
コンテンツの再生の間、コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別し、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子をメモリ内に記憶し、
入力コマンドを受信し、
各オーディオシグネチャを表すアイコンを表示のために発生させる、
ように構成される、制御回路と、
を備える、システム。
１４．制御回路はさらに、
アイコンの選択を受信し、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの一部を再生する、
ように構成される、項目１３に記載のシステム。
１５．制御回路はさらに、
コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別し、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶し、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するオーディオシグネチャに割り当てる、
ように構成される、項目１３に記載のシステム。
１６．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するように構成される制御回路はさらに、
選択されたアイコンによって表される対象の識別子を読み出し、
読み出された識別子と関連付けられるオーディオシグネチャの記憶されたタイムスタンプを読み出し、
タイムスタンプにおいて開始されるオーディオの部分を再生する、
ように構成される、項目１４に記載のシステム。
１７．制御回路はさらに、複数の音の各音の対象の画像を捕捉するように構成され、
各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、
項目１３に記載のシステム。
１８．オーディオシグネチャを識別するように構成される制御回路はさらに、
第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性を分析し、
後続タイムスタンプにおいて開始されるオーディオのオーディオ特性が、第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性と異なると決定し、
第１のタイムスタンプと後続タイムスタンプとの間のオーディオの部分を第１のオーディオシグネチャとして識別する、
ように構成される、項目１３に記載のシステム。
１９．制御回路はさらに、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツのビデオフレームを分析し、
音の対象が、ビデオフレーム内に表示されているかどうかを決定し、
第１のオーディオシグネチャを表示される対象に割り当てる、
ように構成される、項目１８に記載のシステム。
２０．制御回路はさらに、分析するステップに基づいて、表示される対象が、第１のオーディオシグネチャに対応するオーディオデータの対象であると決定するように構成される、項目１９に記載のシステム。
２１．制御回路はさらに、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する音が終了する第２のタイムスタンプをメモリ内に記憶し、
入力コマンドを受信することに応答して、現在の再生タイムスタンプから閾値時間内の第２のタイムスタンプを有する複数のオーディオシグネチャを決定する、
ように構成される、項目１３に記載のシステム。
２２．制御回路はさらに、
各オーディオシグネチャのタイムスタンプおよび第２のタイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定し、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生する、
ように構成される、項目２１に記載のシステム。
２３．制御回路はさらに、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するように構成され、
複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、
項目２２に記載のシステム。
２４．音は、発話であり、
音の対象は、話者である、
項目１３に記載のシステム。
２５．コンテンツのオーディオの一部の対象を表示するためのシステムであって、
コンテンツの再生の間、コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別するための手段と、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子を記憶するための手段と、
入力コマンドを受信するための手段と、
各オーディオシグネチャを表すアイコンを表示のために発生させるための手段と、
を備える、システム。
２６．アイコンの選択を受信するための手段と、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの一部を再生するための手段と、
をさらに備える、項目２５に記載のシステム。
２７．コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別するための手段と、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶するための手段と、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するオーディオシグネチャに割り当てるための手段と、
をさらに備える、項目２５に記載のシステム。
２８．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するための手段は、
選択されたアイコンによって表される対象の識別子を読み出すための手段と、
読み出された識別子と関連付けられるオーディオシグネチャの記憶されたタイムスタンプを読み出すための手段と、
タイムスタンプにおいて開始されるオーディオの部分を再生するための手段と、
を備える、項目２６に記載のシステム。
２９．複数の音の各音の対象の画像を捕捉するための手段をさらに備え、各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、項目２５に記載のシステム。
３０．オーディオシグネチャを識別するための手段は、
第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性を分析するための手段と、
後続タイムスタンプにおいて開始されるオーディオのオーディオ特性が、第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性と異なると決定するための手段と、
第１のタイムスタンプと後続タイムスタンプとの間のオーディオの部分を第１のオーディオシグネチャとして識別するための手段と、
を備える、項目２５に記載のシステム。
３１．第１のタイムスタンプと後続タイムスタンプとの間のコンテンツのビデオフレームを分析するための手段と、
音の対象が、ビデオフレーム内に表示されているかどうかを決定するための手段と、
第１のオーディオシグネチャを表示される対象に割り当てるための手段と、
をさらに備える、項目３０に記載のシステム。
３２．分析するステップに基づいて、表示される対象が、第１のオーディオシグネチャに対応するオーディオデータの対象であると決定するための手段をさらに備える、項目３１に記載のシステム。
３３．オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する音が終了する第２のタイムスタンプを記憶するための手段と、
入力コマンドを受信することに応答して、現在の再生タイムスタンプから閾値時間内の第２のタイムスタンプを有する複数のオーディオシグネチャを決定するための手段と、
をさらに備える、項目２５に記載のシステム。
３４．各オーディオシグネチャのタイムスタンプおよび第２のタイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定するための手段と、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生するための手段と、
をさらに備える、項目３３に記載のシステム。
３５．複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するための手段をさらに備え、複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、項目３４に記載のシステム。
３６．音は、発話であり、
音の対象は、話者である、
項目２５に記載のシステム。
３７．非一過性コンピュータ可読媒体であって、制御回路によって実行されると、制御回路に、
コンテンツの再生の間、コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別させ、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子を記憶させ、
入力コマンドを受信させ、
各オーディオシグネチャを表すアイコンを表示のために発生させる、
コンテンツのオーディオの一部の対象を表示するためのその上にエンコードされる命令を有する、非一過性コンピュータ可読媒体。
３８．命令の実行はさらに、制御回路に、
アイコンの選択を受信させ、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの一部を再生させる、
項目３７に記載の非一過性コンピュータ可読媒体。
３９．命令の実行はさらに、制御回路に、
コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別させ、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶させ、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するオーディオシグネチャに割り当てさせる、
項目３７に記載の非一過性コンピュータ可読媒体。
４０．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するための命令の実行はさらに、制御回路に、
選択されたアイコンによって表される対象の識別子を読み出させ、
読み出された識別子と関連付けられるオーディオシグネチャの記憶されたタイムスタンプを読み出させ、
タイムスタンプにおいて開始されるオーディオの部分を再生させる、
項目３８に記載の非一過性コンピュータ可読媒体。
４１．命令の実行はさらに、制御回路に、複数の音の各音の対象の画像を捕捉させ、
各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、
項目３７に記載の非一過性コンピュータ可読媒体。
４２．オーディオシグネチャを識別するための命令の実行はさらに、制御回路に、
第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性を分析させ、
後続タイムスタンプにおいて開始されるオーディオのオーディオ特性が、第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性と異なると決定させ、
第１のタイムスタンプと後続タイムスタンプとの間のオーディオの部分を第１のオーディオシグネチャとして識別させる、
項目３７に記載の非一過性コンピュータ可読媒体。
４３．命令の実行はさらに、制御回路に、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツのビデオフレームを分析させ、
音の対象が、ビデオフレーム内に表示されているかどうかを決定させ、
第１のオーディオシグネチャを表示される対象に割り当てさせる、
項目４２に記載の非一過性コンピュータ可読媒体。
４４．命令の実行はさらに、制御回路に、分析するステップに基づいて、表示される対象が、第１のオーディオシグネチャに対応するオーディオデータの対象であると決定させる、項目４３に記載の非一過性コンピュータ可読媒体。
４５．命令の実行はさらに、制御回路に、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する音が終了する第２のタイムスタンプを記憶させ、
入力コマンドを受信することに応答して、現在の再生タイムスタンプから閾値時間内の第２のタイムスタンプを有する複数のオーディオシグネチャを決定させる、
項目３７に記載の非一過性コンピュータ可読媒体。
４６．命令の実行はさらに、制御回路に、
各オーディオシグネチャのタイムスタンプおよび第２のタイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定させ、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生させる、
項目４５に記載の非一過性コンピュータ可読媒体。
４７．命令の実行はさらに、制御回路に、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離させ、
複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、
項目４６に記載の非一過性コンピュータ可読媒体。
４８．音は、発話であり、
音の対象は、話者である、
項目３７に記載の非一過性コンピュータ可読媒体。
４９．コンテンツのオーディオの一部の対象を表示するための方法であって、
コンテンツを再生するステップと、
コンテンツの再生の間、コンテンツのオーディオ内の複数の音の各音に対応するオーディオシグネチャを識別するステップと、
オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する個別の音が開始されるタイムスタンプおよび個別のオーディオシグネチャの識別子を記憶するステップと、
入力コマンドを受信するステップと、
各オーディオシグネチャを表すアイコンを表示のために発生させるステップと、
を含む、方法。
５０．アイコンの選択を受信するステップと、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの一部を再生するステップと、
をさらに含む、項目４９に記載の方法。
５１．コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別するステップと、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶するステップと、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するオーディオシグネチャに割り当てるステップと、
をさらに含む、項目４９－５０のいずれかに記載の方法。
５２．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するステップは、
選択されたアイコンによって表される対象の識別子を読み出すステップと、
読み出された識別子と関連付けられるオーディオシグネチャの記憶されたタイムスタンプを読み出すステップと、
タイムスタンプにおいて開始されるオーディオの部分を再生するステップと、
を含む、項目４９－５１のいずれかに記載の方法。
５３．複数の音の各音の対象の画像を捕捉するステップをさらに含み、各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、項目４９－５２のいずれかに記載の方法。
５４．オーディオシグネチャを識別するステップは、
第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性を分析するステップと、
後続タイムスタンプにおいて開始されるオーディオのオーディオ特性が、第１のタイムスタンプにおいて開始されるオーディオのオーディオ特性と異なると決定するステップと、
第１のタイムスタンプと後続タイムスタンプとの間のオーディオの部分を第１のオーディオシグネチャとして識別するステップと、
を含む、項目４９－５３のいずれかに記載の方法。
５５．第１のタイムスタンプと後続タイムスタンプとの間のコンテンツのビデオフレームを分析するステップと、
音の対象が、ビデオフレーム内に表示されているかどうかを決定するステップと、
第１のオーディオシグネチャを表示される対象に割り当てるステップと、
をさらに含む、項目５４に記載の方法。
５６．分析するステップに基づいて、表示される対象が、第１のオーディオシグネチャに対応するオーディオデータの対象であると決定するステップをさらに含む、項目５５に記載の方法。
５７．オーディオシグネチャ毎に、個別のオーディオシグネチャに対応する音が終了する第２のタイムスタンプを記憶するステップと、
入力コマンドを受信することに応答して、現在の再生タイムスタンプから閾値時間内の第２のタイムスタンプを有する複数のオーディオシグネチャを決定するステップと、
をさらに含む、項目４９－５６のいずれかに記載の方法。
５８．各オーディオシグネチャのタイムスタンプおよび第２のタイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定するステップと、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生するステップと、
をさらに含む、項目５７に記載の方法。
５９．複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するステップをさらに含み、複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、項目５８に記載の方法。
６０．音は、発話であり、
音の対象は、話者である、
項目４９－５９のいずれかに記載の方法。
６１．コンテンツのオーディオの一部の対象を表示するための方法であって、
コンテンツの再生の間、第１の入力コマンドを受信するステップと、
コンテンツと関連付けられるメタデータから、オーディオシグネチャを識別するステップと、
メタデータから、各識別されたオーディオシグネチャと関連付けられる音の対象の識別子を読み出すステップと、
個別のオーディオシグネチャと関連付けられる音の各個別の読み出された対象を表すアイコンを表示のために発生させるステップと、
を含む、方法。
６２．アイコンの選択を受信するステップと、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するコンテンツの部分を再生するステップと、
をさらに含む、項目６１に記載の方法。
６３．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するステップは、
メタデータから、オーディオシグネチャと関連付けられる開始タイムスタンプを読み出すステップと、
読み出された開始タイムスタンプにおいて開始されるオーディオの部分を再生するステップと、
を含む、項目６２に記載の方法。
６４．音の各識別された対象の捕捉された画像を読み出すステップをさらに含み、各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、項目６１に記載の方法。
６５．オーディオシグネチャを識別するステップは、
コンテンツの現在の再生タイムスタンプを識別するステップと、
現在の再生タイムスタンプにおいてコンテンツ内に表示される音の対象を識別するステップと、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する音の対象の識別子を読み出すステップであって、データベースは、開始タイムスタンプおよび終了タイムスタンプを音の識別された対象からの音と関連付ける、ステップと、
オーディオシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のオーディオの部分を識別するステップと、
を含む、項目６１に記載の方法。
６６．コンテンツ内に表示される音の対象を識別するステップは、
現在の再生タイムスタンプにおけるオーディオのオーディオ特性を分析するステップと、
オーディオ特性に対応するパラメータのセットを音の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、オーディオ特性が、音の識別された対象に合致するかどうかを決定するステップと、
オーディオ特性が、音の識別された対象に合致すると決定することに応答して、音の対象の識別子を読み出すステップと、
を含む、項目６５に記載の方法。
６７．コンテンツのビデオのフレーム内のエッジを検出するステップと、
個別の検出されたエッジに対応するパラメータのセットを音の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、音の識別された対象が、コンテンツ内に表示されていると決定するステップと、
をさらに含む、項目６６に記載の方法。
６８．現在の再生タイムスタンプの閾値時間内の終了タイムスタンプを有する複数のオーディオシグネチャを識別するステップをさらに含み、開始タイムスタンプおよび終了タイムスタンプが、オーディオシグネチャ毎にメタデータ内に記憶される、項目６１に記載の方法。
６９．各オーディオシグネチャの開始タイムスタンプおよび終了タイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定するステップと、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生するステップと、
をさらに含む、項目６８に記載の方法。
７０．複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するステップをさらに含み、複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、項目６９に記載の方法。
７１．音は、発話であり、
音の対象は、話者である、
項目６１に記載の方法。
７２．コンテンツのオーディオの一部の対象を表示するためのシステムであって、
メモリと、
制御回路であって、
コンテンツの再生の間、第１の入力コマンドを受信し、
メモリ内に記憶されたコンテンツと関連付けられるメタデータから、オーディオシグネチャを識別し、
メタデータから、各識別されたオーディオシグネチャと関連付けられる音の対象の識別子を読み出し、
個別のオーディオシグネチャと関連付けられる音の各個別の読み出された対象を表すアイコンを表示のために発生させる、
ように構成される、制御回路と、
を備える、システム。
７３．制御回路はさらに、
アイコンの選択を受信し、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するコンテンツの部分を再生する、
ように構成される、項目７２に記載のシステム。
７４．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するように構成される制御回路はさらに、
メモリ内に記憶されたメタデータから、オーディオシグネチャと関連付けられる開始タイムスタンプを読み出し、
読み出された開始タイムスタンプにおいて開始されるオーディオの部分を再生する、
ように構成される、項目７３に記載のシステム。
７５．制御回路はさらに、音の各識別された対象の捕捉された画像を読み出すように構成され、
各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、
項目７２に記載のシステム。
７６．オーディオシグネチャを識別するように構成される制御回路はさらに、
コンテンツの現在の再生タイムスタンプを識別し、
現在の再生タイムスタンプにおいてコンテンツ内に表示される音の対象を識別し、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する音の対象の識別子を読み出し、データベースは、開始タイムスタンプおよび終了タイムスタンプを音の識別された対象からの音と関連付け、
オーディオシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のオーディオの部分を識別する、
ように構成される、項目７２に記載のシステム。
７７．コンテンツ内に表示される音の対象を識別するように構成される制御回路はさらに、
現在の再生タイムスタンプにおけるオーディオのオーディオ特性を分析し、
オーディオ特性に対応するパラメータのセットを音の識別された対象の対応するパラメータと比較し、
比較するステップに基づいて、オーディオ特性が、音の識別された対象に合致するかどうかを決定し、
オーディオ特性が、音の識別された対象に合致すると決定することに応答して、音の対象の識別子を読み出す、
ように構成される、項目７６に記載のシステム。
７８．制御回路はさらに、
コンテンツのビデオのフレーム内のエッジを検出し、
個別の検出されたエッジに対応するパラメータのセットを音の識別された対象の対応するパラメータと比較し、
比較するステップに基づいて、音の識別された対象が、コンテンツ内に表示されていると決定する、
ように構成される、項目７７に記載のシステム。
７９．制御回路はさらに、現在の再生タイムスタンプの閾値時間内の終了タイムスタンプを有する複数のオーディオシグネチャを識別するように構成され、
開始タイムスタンプおよび終了タイムスタンプが、オーディオシグネチャ毎にメタデータ内に記憶される、
項目７２に記載のシステム。
８０．制御回路はさらに、
各オーディオシグネチャの開始タイムスタンプおよび終了タイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定し、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生する、
ように構成される、項目７９に記載のシステム。
８１．制御回路はさらに、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するように構成され、
複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、
項目８０に記載のシステム。
８２．音は、発話であり、
音の対象は、話者である、
項目７２に記載のシステム。
８３．コンテンツのオーディオの一部の対象を表示するためのシステムであって、
コンテンツの再生の間、第１の入力コマンドを受信するための手段と、
コンテンツと関連付けられるメタデータから、オーディオシグネチャを識別するための手段と、
メタデータから、各識別されたオーディオシグネチャと関連付けられる音の対象の識別子を読み出すための手段と、
個別のオーディオシグネチャと関連付けられる音の各個別の読み出された対象を表すアイコンを表示のために発生させるための手段と、
を備える、システム。
８４．アイコンの選択を受信するための手段と、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するコンテンツの部分を再生するための手段と、
をさらに備える、項目８３に記載のシステム。
８５．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するための手段は、
メタデータから、オーディオシグネチャと関連付けられる開始タイムスタンプを読み出すための手段と、
読み出された開始タイムスタンプにおいて開始されるオーディオの部分を再生するための手段と、
を備える、項目８４に記載のシステム。
８６．音の各識別された対象の捕捉された画像を読み出すための手段をさらに備え、各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、項目８３に記載のシステム。
８７．オーディオシグネチャを識別するための手段は、
コンテンツの現在の再生タイムスタンプを識別するための手段と、
現在の再生タイムスタンプにおいてコンテンツ内に表示される音の対象を識別するための手段と、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する音の対象の識別子を読み出すための手段であって、データベースは、開始タイムスタンプおよび終了タイムスタンプを音の識別された対象からの音と関連付ける、手段と、
オーディオシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のオーディオの部分を識別するための手段と、
を備える、項目８３に記載のシステム。
８８．コンテンツ内に表示される音の対象を識別するための手段は、
現在の再生タイムスタンプにおけるオーディオのオーディオ特性を分析するための手段と、
オーディオ特性に対応するパラメータのセットを音の識別された対象の対応するパラメータと比較するための手段と、
比較するステップに基づいて、オーディオ特性が、音の識別された対象に合致するかどうかを決定するための手段と、
オーディオ特性が、音の識別された対象に合致すると決定することに応答して、音の対象の識別子を読み出すための手段と、
を備える、項目８７に記載のシステム。
８９．コンテンツのビデオのフレーム内のエッジを検出するための手段と、
個別の検出されたエッジに対応するパラメータのセットを音の識別された対象の対応するパラメータと比較するための手段と、
比較するステップに基づいて、音の識別された対象が、コンテンツ内に表示されていると決定するための手段と、
をさらに備える、項目８８に記載のシステム。
９０．現在の再生タイムスタンプの閾値時間内の終了タイムスタンプを有する複数のオーディオシグネチャを識別するための手段をさらに備え、開始タイムスタンプおよび終了タイムスタンプが、オーディオシグネチャ毎にメタデータ内に記憶される、項目８３に記載のシステム。
９１．各オーディオシグネチャの開始タイムスタンプおよび終了タイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定するための手段と、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生するための手段と、
をさらに備える、項目９０に記載のシステム。
９２．複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するための手段をさらに備え、複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、項目９１に記載のシステム。
９３．音は、発話であり、
音の対象は、話者である、
項目８３に記載のシステム。
９４．非一過性コンピュータ可読媒体であって、制御回路によって実行されると、制御回路に、
コンテンツの再生の間、第１の入力コマンドを受信させ、
コンテンツと関連付けられるメタデータから、オーディオシグネチャを識別させ、
メタデータから、各識別されたオーディオシグネチャと関連付けられる音の対象の識別子を読み出させ、
個別のオーディオシグネチャと関連付けられる音の各個別の読み出された対象を表すアイコンを表示のために発生させる、
コンテンツのオーディオの一部の対象を表示するためのその上にエンコードされる命令を有する、非一過性コンピュータ可読媒体。
９５．命令の実行はさらに、制御回路に、
アイコンの選択を受信させ、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するコンテンツの部分を再生させる、
項目９４に記載の非一過性コンピュータ可読媒体。
９６．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するための命令の実行はさらに、制御回路に、
メタデータから、オーディオシグネチャと関連付けられる開始タイムスタンプを読み出させ、
読み出された開始タイムスタンプにおいて開始されるオーディオの部分を再生させる、
項目９５に記載の非一過性コンピュータ可読媒体。
９７．命令の実行はさらに、制御回路に、音の各識別された対象の捕捉された画像を読み出させ、
各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、
項目９４に記載の非一過性コンピュータ可読媒体。
９８．オーディオシグネチャを識別するための命令の実行はさらに、制御回路に、
コンテンツの現在の再生タイムスタンプを識別させ、
現在の再生タイムスタンプにおいてコンテンツ内に表示される音の対象を識別させ、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する音の対象の識別子を読み出させ、データベースは、開始タイムスタンプおよび終了タイムスタンプを音の識別された対象からの音と関連付け、
オーディオシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のオーディオの部分を識別させる、
項目９４に記載の非一過性コンピュータ可読媒体。
９９．コンテンツ内に表示される音の対象を識別するための命令の実行はさらに、制御回路に、
現在の再生タイムスタンプにおけるオーディオのオーディオ特性を分析させ、
オーディオ特性に対応するパラメータのセットを音の識別された対象の対応するパラメータと比較させ、
比較するステップに基づいて、オーディオ特性が、音の識別された対象に合致するかどうかを決定させ、
オーディオ特性が、音の識別された対象に合致すると決定することに応答して、音の対象の識別子を読み出させる、
項目９８に記載の非一過性コンピュータ可読媒体。
１００．命令の実行はさらに、制御回路に、
コンテンツのビデオのフレーム内のエッジを検出させ、
個別の検出されたエッジに対応するパラメータのセットを音の識別された対象の対応するパラメータと比較させ、
比較するステップに基づいて、音の識別された対象が、コンテンツ内に表示されていると決定させる、
項目９９に記載の非一過性コンピュータ可読媒体。
１０１．命令の実行はさらに、制御回路に、現在の再生タイムスタンプの閾値時間内の終了タイムスタンプを有する複数のオーディオシグネチャを識別させ、
開始タイムスタンプおよび終了タイムスタンプが、オーディオシグネチャ毎にメタデータ内に記憶される、
項目９４に記載の非一過性コンピュータ可読媒体。
１０２．命令の実行はさらに、制御回路に、
各オーディオシグネチャの開始タイムスタンプおよび終了タイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定させ、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生させる、
項目１０１に記載の非一過性コンピュータ可読媒体。
１０３．命令の実行はさらに、制御回路に、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離させ、
複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、
項目１０２に記載の非一過性コンピュータ可読媒体。
１０４．音は、発話であり、
音の対象は、話者である、
項目９４に記載の非一過性コンピュータ可読媒体。
１０５．コンテンツのオーディオの一部の対象を表示するための方法であって、
コンテンツを再生するステップと、
コンテンツの再生の間、第１の入力コマンドを受信するステップと、
コンテンツと関連付けられるメタデータから、オーディオシグネチャを識別するステップと、
メタデータから、各識別されたオーディオシグネチャと関連付けられる音の対象の識別子を読み出すステップと、
個別のオーディオシグネチャと関連付けられる音の各個別の読み出された対象を表すアイコンを表示のために発生させるステップと、
を含む、方法。
１０６．アイコンの選択を受信するステップと、
選択されたアイコンと関連付けられるオーディオシグネチャに対応するコンテンツの部分を再生するステップと、
をさらに含む、項目１０５に記載の方法。
１０７．選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオの部分を再生するステップは、
メタデータから、オーディオシグネチャと関連付けられる開始タイムスタンプを読み出すステップと、
読み出された開始タイムスタンプにおいて開始されるオーディオの部分を再生するステップと、
を含む、項目１０６に記載の方法。
１０８．音の各識別された対象の捕捉された画像を読み出すステップをさらに含み、各音の個別の対象を表すアイコンは、音の個別の対象の捕捉された画像を備える、項目１０５－１０７のいずれかに記載の方法。
１０９．オーディオシグネチャを識別するステップは、
コンテンツの現在の再生タイムスタンプを識別するステップと、
現在の再生タイムスタンプにおいてコンテンツ内に表示される音の対象を識別するステップと、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する音の対象の識別子を読み出すステップであって、データベースは、開始タイムスタンプおよび終了タイムスタンプを音の識別された対象からの音と関連付ける、ステップと、
オーディオシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のオーディオの部分を識別するステップと、
を含む、項目１０５－１０８のいずれかに記載の方法。
１１０．コンテンツ内に表示される音の対象を識別するステップは、
現在の再生タイムスタンプにおけるオーディオのオーディオ特性を分析するステップと、
オーディオ特性に対応するパラメータのセットを音の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、オーディオ特性が、音の識別された対象に合致するかどうかを決定するステップと、
オーディオ特性が、音の識別された対象に合致すると決定することに応答して、音の対象の識別子を読み出すステップと、
を含む、項目１０９に記載の方法。
１１１．コンテンツのビデオのフレーム内のエッジを検出するステップと、
個別の検出されたエッジに対応するパラメータのセットを音の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、音の識別された対象が、コンテンツ内に表示されていると決定するステップと、
をさらに含む、項目１１０に記載の方法。
１１２．現在の再生タイムスタンプの閾値時間内の終了タイムスタンプを有する複数のオーディオシグネチャを識別するステップをさらに含み、開始タイムスタンプおよび終了タイムスタンプが、オーディオシグネチャ毎にメタデータ内に記憶される、項目１０５－１１１のいずれかに記載の方法。
１１３．各オーディオシグネチャの開始タイムスタンプおよび終了タイムスタンプに基づいて、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複するかどうかを決定するステップと、
複数のオーディオシグネチャのいかなるオーディオシグネチャも、別のオーディオシグネチャと時間的に重複しないと決定することに応答して、直近のオーディオシグネチャに対応するコンテンツのオーディオデータの一部を再生するステップと、
をさらに含む、項目１１２に記載の方法。
１１４．複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答して、選択されたアイコンと関連付けられるオーディオシグネチャに対応するオーディオデータを分離するステップをさらに含み、複数のアイコンを表示のために発生させるステップは、複数のオーディオシグネチャのあるオーディオシグネチャが、別のオーディオシグネチャと時間的に重複すると決定することに応答してのみ起こる、項目１１３に記載の方法。
１１５．音は、発話であり、
音の対象は、話者である、
項目１０５－１１４のいずれかに記載の方法。
１１６．コンテンツのビデオの一部の対象を表示するための方法であって、
コンテンツの再生の間、コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別するステップと、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、およびアクションシグネチャの識別子を記憶するステップと、
入力コマンドを受信するステップと、
各アクションシグネチャを表すアイコンを表示のために発生させるステップと、
を含む、方法。
１１７．アイコンの選択を備える第２の入力コマンドを受信するステップと、
選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップと、
をさらに含む、項目１１６に記載の方法。
１１８．コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別するステップと、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶するステップと、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するアクションシグネチャに割り当てるステップと、
をさらに含む、項目１１６に記載の方法。
１１９．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップは、
選択されたアイコンによって表される対象の識別子を読み出すステップと、
読み出された識別子と関連付けられるアクションシグネチャの記憶されたタイムスタンプを読み出すステップと、
タイムスタンプにおいて開始されるコンテンツの部分を再生するステップと、
を含む、項目１１７に記載の方法。
１２０．運動の各識別された対象の対象の画像を捕捉するステップをさらに含み、各運動の個別の対象を表すアイコンは、運動の対象の捕捉された画像を備える、項目１１６に記載の方法。
１２１．アクションシグネチャを識別するステップは、
コンテンツの再生の間、コンテンツのビデオ内に表示される運動の対象を識別するステップと、
第１のタイムスタンプにおいて、運動の個別の対象の閾値レベルの運動を検出するステップと、
後続タイムスタンプにおいて、運動の個別の対象の運動が、閾値レベルを下回ることを検出するステップと、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツの部分を第１のアクションシグネチャとして識別するステップと、
を含み、
記憶されたタイムスタンプは、第１のタイムスタンプに対応し、記憶された終了タイムスタンプは、後続タイムスタンプに対応する、
項目１１６に記載の方法。
１２２．コンテンツのビデオ内に表示される運動の対象を識別するステップは、
コンテンツのビデオのフレーム内の顔を検出するステップと、
識別子を各検出された顔に割り当てるステップと、
検出された顔毎に、個別の検出された顔に対応するパラメータのセットを記憶するステップと、
を含み、
運動の個別の対象の記憶された識別子は、運動の個別の対象と関連付けられる個別の検出された顔の割り当てられた識別子である、
項目１２１に記載の方法。
１２３．運動の個別の対象の閾値レベルの運動を検出するステップは、
コンテンツのビデオの複数の連続的フレームを分析するステップと、
分析するステップに基づいて、運動の個別の対象が、閾値フレーム数未満において閾値距離を上回って移動したと決定するステップと、
を含む、項目１２２に記載の方法。
１２４．コンテンツとともに配布するためにメタデータファイル内にアクションシグネチャを記憶するステップをさらに含む、項目１１６に記載の方法。
１２５．第２の入力コマンドは、アイコンの１つを上回る選択を備え、本方法はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出すステップと、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別するステップと、
を含み、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１１７に記載の方法。
１２６．開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回るかどうかを決定するステップをさらに含み、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、項目１１６に記載の方法。
１２７．開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するステップをさらに含み、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、項目１１６に記載の方法。
１２８．コンテンツのビデオの一部の対象を表示するためのシステムであって、
メモリと、
制御回路であって、
コンテンツの再生の間、コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別し、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、およびアクションシグネチャの識別子をメモリ内に記憶し、
入力コマンドを受信し、
アクションシグネチャを表すアイコンを表示のために発生させる、
ように構成される、制御回路と、
を備える、システム。
１２９．制御回路はさらに、
アイコンの選択を備える第２の入力コマンドを受信し、
選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生する、
ように構成される、項目１２８に記載のシステム。
１３０．制御回路はさらに、
コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別し、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶し、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するアクションシグネチャに割り当てる、
ように構成される、項目１２８に記載のシステム。
１３１．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するように構成される制御回路はさらに、
選択されたアイコンによって表される対象の識別子を読み出し、
読み出された識別子と関連付けられるアクションシグネチャの記憶されたタイムスタンプを読み出し、
タイムスタンプにおいて開始されるコンテンツの部分を再生する、
ように構成される、項目１２９に記載のシステム。
１３２．制御回路はさらに、運動の各識別された対象の対象の画像を捕捉するように構成され、
各運動の個別の対象を表すアイコンは、運動の対象の捕捉された画像を備える、
項目１２８に記載のシステム。
１３３．アクションシグネチャを識別するように構成される制御回路はさらに、
コンテンツの再生の間、コンテンツのビデオ内に表示される運動の対象を識別し、
第１のタイムスタンプにおいて、運動の個別の対象の閾値レベルの運動を検出し、
後続タイムスタンプにおいて、運動の個別の対象の運動が、閾値レベルを下回ることを検出し、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツの部分を第１のアクションシグネチャとして識別する、
ように構成され、
記憶されたタイムスタンプは、第１のタイムスタンプに対応し、記憶された終了タイムスタンプは、後続タイムスタンプに対応する、
項目１２８に記載のシステム。
１３４．コンテンツのビデオ内に表示される運動の対象を識別するように構成される制御回路はさらに、
コンテンツのビデオのフレーム内の顔を検出し、
識別子を各検出された顔に割り当て、
検出された顔毎に、個別の検出された顔に対応するパラメータのセットを記憶する、
ように構成され、
運動の個別の対象の記憶された識別子は、運動の個別の対象と関連付けられる個別の検出された顔の割り当てられた識別子である、
項目１３３に記載のシステム。
１３５．運動の個別の対象の閾値レベルの運動を検出するように構成される制御回路はさらに、
コンテンツのビデオの複数の連続的フレームを分析し、
分析するステップに基づいて、運動の個別の対象が、閾値フレーム数未満において閾値距離を上回って移動したと決定する、
ように構成される、項目１３４に記載のシステム。
１３６．制御回路はさらに、コンテンツとともに配布するためにメタデータファイル内にアクションシグネチャを記憶するように構成される、項目１２８に記載のシステム。
１３７．第２の入力コマンドは、アイコンの１つを上回る選択を備え、制御回路はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出し、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別する、
ように構成され、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１２９に記載のシステム。
１３８．制御回路はさらに、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回るかどうかを決定するように構成され、
開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、
項目１２８に記載のシステム。
１３９．制御回路はさらに、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するように構成され、
開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、
項目１２８に記載のシステム。
１４０．コンテンツのビデオの一部の対象を表示するためのシステムであって、
コンテンツの再生の間、コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別するための手段と、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、およびアクションシグネチャの識別子を記憶するための手段と、
入力コマンドを受信するための手段と、
各アクションシグネチャを表すアイコンを表示のために発生させるための手段と、
を備える、システム。
１４１．アイコンの選択を備える第２の入力コマンドを受信するための手段と、
選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するための手段と、
をさらに備える、項目１４０に記載のシステム。
１４２．コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別するための手段と、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶するための手段と、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するアクションシグネチャに割り当てるための手段と、
をさらに備える、項目１４０に記載のシステム。
１４３．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するための手段は、
選択されたアイコンによって表される対象の識別子を読み出すための手段と、
読み出された識別子と関連付けられるアクションシグネチャの記憶されたタイムスタンプを読み出すための手段と、
タイムスタンプにおいて開始されるコンテンツの部分を再生するための手段と、
を備える、項目１４１に記載のシステム。
１４４．運動の各識別された対象の対象の画像を捕捉するための手段をさらに備え、各運動の個別の対象を表すアイコンは、運動の対象の捕捉された画像を備える、項目１４０に記載のシステム。
１４５．アクションシグネチャを識別するための手段は、
コンテンツの再生の間、コンテンツのビデオ内に表示される運動の対象を識別するための手段と、
第１のタイムスタンプにおいて、運動の個別の対象の閾値レベルの運動を検出するための手段と、
後続タイムスタンプにおいて、運動の個別の対象の運動が、閾値レベルを下回ることを検出するための手段と、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツの部分を第１のアクションシグネチャとして識別するための手段と、
を備え、
記憶されたタイムスタンプは、第１のタイムスタンプに対応し、記憶された終了タイムスタンプは、後続タイムスタンプに対応する、
項目１４０に記載のシステム。
１４６．コンテンツのビデオ内に表示される運動の対象を識別するための手段は、
コンテンツのビデオのフレーム内の顔を検出するための手段と、
識別子を各検出された顔に割り当てるための手段と、
検出された顔毎に、個別の検出された顔に対応するパラメータのセットを記憶するための手段と、
を備え、
運動の個別の対象の記憶された識別子は、運動の個別の対象と関連付けられる個別の検出された顔の割り当てられた識別子である、
項目１４５に記載のシステム。
１４７．運動の個別の対象の閾値レベルの運動を検出するための手段は、
コンテンツのビデオの複数の連続的フレームを分析するための手段と、
分析するステップに基づいて、運動の個別の対象が、閾値フレーム数未満において閾値距離を上回って移動したと決定するための手段と、
を備える、項目１４６に記載のシステム。
１４８．コンテンツとともに配布するためにメタデータファイル内にアクションシグネチャを記憶するための手段をさらに備える、項目１４０に記載のシステム。
１４９．第２の入力コマンドは、アイコンの１つを上回る選択を備え、本方法はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出すための手段と、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別するための手段と、
を備え、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１４１に記載のシステム。
１５０．開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回るかどうかを決定するための手段をさらに備え、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、項目１４１に記載のシステム。
１５１．開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するための手段をさらに備え、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、項目１４０に記載のシステム。
１５２．非一過性コンピュータ可読媒体であって、制御回路によって実行されると、制御回路に、
コンテンツの再生の間、コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別させ、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、およびアクションシグネチャの識別子を記憶させ、
入力コマンドを受信させ、
各アクションシグネチャを表すアイコンを表示のために発生させる、
コンテンツのビデオの一部の対象を表示するためのその上にエンコードされる命令を有する、非一過性コンピュータ可読媒体。
１５３．命令の実行はさらに、制御回路に、
アイコンの選択を備える第２の入力コマンドを受信させ、
選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生させる、
項目１５２に記載の非一過性コンピュータ可読媒体。
１５４．命令の実行はさらに、制御回路に、
コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別させ、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶させ、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するアクションシグネチャに割り当てさせる、
項目１５２に記載の非一過性コンピュータ可読媒体。
１５５．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するための命令の実行はさらに、制御回路に、
選択されたアイコンによって表される対象の識別子を読み出させ、
読み出された識別子と関連付けられるアクションシグネチャの記憶されたタイムスタンプを読み出させ、
タイムスタンプにおいて開始されるコンテンツの部分を再生させる、
項目１５３に記載の非一過性コンピュータ可読媒体。
１５６．命令の実行はさらに、制御回路に、運動の各識別された対象の対象の画像を捕捉させ、
各運動の個別の対象を表すアイコンは、運動の対象の捕捉された画像を備える、
項目１５２に記載の非一過性コンピュータ可読媒体。
１５７．アクションシグネチャを識別するための命令の実行はさらに、制御回路に、
コンテンツの再生の間、コンテンツのビデオ内に表示される運動の対象を識別させ、
第１のタイムスタンプにおいて、運動の個別の対象の閾値レベルの運動を検出させ、
後続タイムスタンプにおいて、運動の個別の対象の運動が、閾値レベルを下回ることを検出させ、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツの部分を第１のアクションシグネチャとして識別させ、
記憶されたタイムスタンプは、第１のタイムスタンプに対応し、記憶された終了タイムスタンプは、後続タイムスタンプに対応する、
項目１５２に記載の非一過性コンピュータ可読媒体。
１５８．コンテンツのビデオ内に表示される運動の対象を識別するための命令の実行はさらに、制御回路に、
コンテンツのビデオのフレーム内の顔を検出させ、
識別子を各検出された顔に割り当てさせ、
検出された顔毎に、個別の検出された顔に対応するパラメータのセットを記憶させ、
運動の個別の対象の記憶された識別子は、運動の個別の対象と関連付けられる個別の検出された顔の割り当てられた識別子である、
項目１５７に記載の非一過性コンピュータ可読媒体。
１５９．運動の個別の対象の閾値レベルの運動を検出するための命令の実行はさらに、制御回路に、
コンテンツのビデオの複数の連続的フレームを分析させ、
分析するステップに基づいて、運動の個別の対象が、閾値フレーム数未満において閾値距離を上回って移動したと決定させる、
項目１５８に記載の非一過性コンピュータ可読媒体。
１６０．命令の実行はさらに、制御回路に、コンテンツとともに配布するためにメタデータファイル内にアクションシグネチャを記憶させる、項目１５２に記載の非一過性コンピュータ可読媒体。
１６１．第２の入力コマンドは、アイコンの１つを上回る選択を備え、命令の実行はさらに、制御回路に、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出させ、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別させ、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１５３に記載の非一過性コンピュータ可読媒体。
１６２．命令の実行はさらに、制御回路に、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回るかどうかを決定させ、
開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、
項目１５３に記載の非一過性コンピュータ可読媒体。
１６３．命令の実行はさらに、制御回路に、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であるかどうかを決定させ、
開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、
項目１５２に記載の非一過性コンピュータ可読媒体。
１６４．コンテンツのビデオの一部の対象を表示するための方法であって、
コンテンツを再生するステップと、
コンテンツの再生の間、コンテンツのビデオ内の複数の運動の各運動に対応するアクションシグネチャを識別するステップと、
アクションシグネチャ毎に、個別のアクションシグネチャに対応する個別の運動が開始される開始タイムスタンプ、個別のアクションシグネチャに対応する個別の運動が終了する終了タイムスタンプ、およびアクションシグネチャの識別子を記憶するステップと、
入力コマンドを受信するステップと、
各アクションシグネチャを表すアイコンを表示のために発生させるステップと、
を含む、方法。
１６５．アイコンの選択を備える第２の入力コマンドを受信するステップと、
選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップと、
をさらに含む、項目１６４に記載の方法。
１６６．コンテンツの再生の間、コンテンツのビデオ内の複数の対象のそれぞれに対応する対象シグネチャを識別するステップと、
対象シグネチャ毎に、個別の対象シグネチャが開始される第２のタイムスタンプおよび個別の対象シグネチャの識別子を記憶するステップと、
タイムスタンプおよび第２のタイムスタンプに基づいて、対象シグネチャを対象シグネチャの間に存在するアクションシグネチャに割り当てるステップと、
をさらに含む、項目１６４－１６４のいずれかに記載の方法。
１６７．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップは、
選択されたアイコンによって表される対象の識別子を読み出すステップと、
読み出された識別子と関連付けられるアクションシグネチャの記憶されたタイムスタンプを読み出すステップと、
タイムスタンプにおいて開始されるコンテンツの部分を再生するステップと、
を含む、項目１６５に記載の方法。
１６８．運動の各識別された対象の対象の画像を捕捉するステップをさらに含み、各運動の個別の対象を表すアイコンは、運動の対象の捕捉された画像を備える、項目１６４－１６７のいずれかに記載の方法。
１６９．アクションシグネチャを識別するステップは、
コンテンツの再生の間、コンテンツのビデオ内に表示される運動の対象を識別するステップと、
第１のタイムスタンプにおいて、運動の個別の対象の閾値レベルの運動を検出するステップと、
後続タイムスタンプにおいて、運動の個別の対象の運動が、閾値レベルを下回ることを検出するステップと、
第１のタイムスタンプと後続タイムスタンプとの間のコンテンツの部分を第１のアクションシグネチャとして識別するステップと、
を含み、
記憶されたタイムスタンプは、第１のタイムスタンプに対応し、記憶された終了タイムスタンプは、後続タイムスタンプに対応する、
項目１６４－１６８のいずれかに記載の方法。
１７０．コンテンツのビデオ内に表示される運動の対象を識別するステップは、
コンテンツのビデオのフレーム内の顔を検出するステップと、
識別子を各検出された顔に割り当てるステップと、
検出された顔毎に、個別の検出された顔に対応するパラメータのセットを記憶するステップと、
を含み、
運動の個別の対象の記憶された識別子は、運動の個別の対象と関連付けられる個別の検出された顔の割り当てられた識別子である、
項目１６９に記載の方法。
１７１．運動の個別の対象の閾値レベルの運動を検出するステップは、
コンテンツのビデオの複数の連続的フレームを分析するステップと、
分析するステップに基づいて、運動の個別の対象が、閾値フレーム数未満において閾値距離を上回って移動したと決定するステップと、
を含む、項目１７０に記載の方法。
１７２．コンテンツとともに配布するためにメタデータファイル内にアクションシグネチャを記憶するステップをさらに含む、項目１６４－１７１のいずれかに記載の方法。
１７３．第２の入力コマンドは、アイコンの１つを上回る選択を備え、本方法はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出すステップと、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別するステップと、
を含み、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１６５に記載の方法。
１７４．開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回るかどうかを決定するステップをさらに含み、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、項目１６４－１７３のいずれかに記載の方法。
１７５．開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するステップをさらに含み、開始タイムスタンプと終了タイムスタンプとの間の時間が、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、項目１６４－１７４のいずれかに記載の方法。
１７６．コンテンツのビデオの一部の対象を表示するための方法であって、
コンテンツの再生の間、第１の入力コマンドを受信するステップと、
コンテンツと関連付けられるメタデータから、アクションシグネチャを識別するステップと、
メタデータから、各識別されたアクションシグネチャと関連付けられる運動の対象の識別子を読み出すステップと、
個別のアクションシグネチャと関連付けられる運動の各個別の読み出された対象を表すアイコンを表示のために発生させるステップと、
を含む、方法。
１７７．アイコンの選択を備える第２の入力コマンドを受信するステップと、
第２の入力コマンドを受信することに応答して、選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップと、
をさらに含む、項目１７６に記載の方法。
１７８．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップは、
メタデータから、アクションシグネチャと関連付けられる開始タイムスタンプを読み出すステップと、
読み出された開始タイムスタンプにおいて開始されるコンテンツの部分を再生するステップと、
を含む、項目１７７に記載の方法。
１７９．運動の各識別された対象の捕捉された画像を読み出すステップをさらに含み、運動の個別の対象を表すアイコンは、読み出された捕捉された画像を備える、項目１７６に記載の方法。
１８０．アクションシグネチャを識別するステップは、
コンテンツの現在の再生タイムスタンプを識別するステップと、
現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するステップと、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する運動の対象の識別子を読み出すステップであって、データベースは、開始タイムスタンプおよび終了タイムスタンプを運動の識別された対象の運動と関連付ける、ステップと、
アクションシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のコンテンツの部分を識別するステップと、
を含む、項目１７６に記載の方法。
１８１．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するステップは、
コンテンツのビデオのフレーム内の顔を検出するステップと、
個別の検出された顔に対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、個別の検出された顔が、運動の識別された対象であるかどうかを決定するステップと、
個別の検出された顔が、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出すステップと、
を含む、項目１８０に記載の方法。
１８２．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するステップは、
コンテンツのビデオのフレーム内のエッジを検出するステップと、
個別の検出されたエッジに対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、個別の検出されたエッジが、運動の識別された対象であるかどうかを決定するステップと、
個別の検出されたエッジが、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出すステップと、
を含む、項目１８１に記載の方法。
１８３．メタデータは、コンテンツとともに受信される、項目１７６に記載の方法。
１８４．第２の入力コマンドは、アイコンの１つを上回る選択を備え、本方法はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出すステップと、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別するステップと、
を含み、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１７６に記載の方法。
１８５．アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量を下回るかどうかを決定するステップをさらに含み、運動の時間的長さが、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、項目１７６に記載の方法。
１８６．アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するステップをさらに含み、運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、項目１７６に記載の方法。
１８７．コンテンツのビデオの一部の対象を表示するためのシステムであって、
メモリと、
制御回路であって、
コンテンツの再生の間、第１の入力コマンドを受信し、
コンテンツと関連付けられるメタデータから、アクションシグネチャを識別し、
メタデータから、各識別されたアクションシグネチャと関連付けられる運動の対象の識別子を読み出し、
個別のアクションシグネチャと関連付けられる運動の各個別の読み出された対象を表すアイコンを表示のために発生させる、
ように構成される、制御回路と、
を備える、システム。
１８８．制御回路はさらに、
アイコンの選択を備える第２の入力コマンドを受信し、
第２の入力コマンドを受信することに応答して、選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生する、
ように構成される、項目１８７に記載のシステム。
１８９．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するように構成される制御回路はさらに、
メタデータから、アクションシグネチャと関連付けられる開始タイムスタンプを読み出し、
読み出された開始タイムスタンプにおいて開始されるコンテンツの部分を再生する、
ように構成される、項目１８８に記載のシステム。
１９０．制御回路はさらに、運動の各識別された対象の捕捉された画像を読み出すように構成され、
運動の個別の対象を表すアイコンは、読み出された捕捉された画像を備える、
項目１８７に記載のシステム。
１９１．アクションシグネチャを識別するように構成される制御回路はさらに、
コンテンツの現在の再生タイムスタンプを識別し、
現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別し、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する運動の対象の識別子を読み出し、データベースは、開始タイムスタンプおよび終了タイムスタンプを運動の識別された対象の運動と関連付け、
アクションシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のコンテンツの部分を識別する、
ように構成される、項目１８７に記載のシステム。
１９２．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するように構成される制御回路はさらに、
コンテンツのビデオのフレーム内の顔を検出し、
個別の検出された顔に対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較し、
比較するステップに基づいて、個別の検出された顔が、運動の識別された対象であるかどうかを決定し、
個別の検出された顔が、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出す、
ように構成される、項目１９１に記載のシステム。
１９３．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するように構成される制御回路はさらに、
コンテンツのビデオのフレーム内のエッジを検出し、
個別の検出されたエッジに対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較し、
比較するステップに基づいて、個別の検出されたエッジが、運動の識別された対象であるかどうかを決定し、
個別の検出されたエッジが、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出す、
ように構成される、項目１９２に記載のシステム。
１９４．メタデータは、コンテンツとともに受信される、項目１８７に記載のシステム。
１９５．第２の入力コマンドは、アイコンの１つを上回る選択を備え、制御回路はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出し、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別する、
ように構成され、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１８７に記載のシステム。
１９６．制御回路はさらに、アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量を下回るかどうかを決定するように構成され、
運動の時間的長さが、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、
項目１８７に記載のシステム。
１９７．制御回路はさらに、アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するように構成され、
運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、
項目１８７に記載のシステム。
１９８．コンテンツのビデオの一部の対象を表示するためのシステムであって、
コンテンツの再生の間、第１の入力コマンドを受信するための手段と、
コンテンツと関連付けられるメタデータから、アクションシグネチャを識別するための手段と、
メタデータから、各識別されたアクションシグネチャと関連付けられる運動の対象の識別子を読み出すための手段と、
個別のアクションシグネチャと関連付けられる運動の各個別の読み出された対象を表すアイコンを表示のために発生させるための手段と、
を備える、システム。
１９９．アイコンの選択を備える第２の入力コマンドを受信するための手段と、
第２の入力コマンドを受信することに応答して、選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するための手段と、
をさらに備える、項目１９８に記載のシステム。
２００．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するための手段は、
メタデータから、アクションシグネチャと関連付けられる開始タイムスタンプを読み出すための手段と、
読み出された開始タイムスタンプにおいて開始されるコンテンツの部分を再生するための手段と、
を備える、項目１９９に記載のシステム。
２０１．運動の各識別された対象の捕捉された画像を読み出すための手段をさらに備え、運動の個別の対象を表すアイコンは、読み出された捕捉された画像を備える、項目１９８に記載のシステム。
２０２．アクションシグネチャを識別するための手段は、
コンテンツの現在の再生タイムスタンプを識別するための手段と、
現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するための手段と、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する運動の対象の識別子を読み出すための手段であって、データベースは、開始タイムスタンプおよび終了タイムスタンプを運動の識別された対象の運動と関連付ける、手段と、
アクションシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のコンテンツの部分を識別するための手段と、
を備える、項目１９８に記載のシステム。
２０３．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するための手段は、
コンテンツのビデオのフレーム内の顔を検出するための手段と、
個別の検出された顔に対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較するための手段と、
比較するステップに基づいて、個別の検出された顔が、運動の識別された対象であるかどうかを決定するための手段と、
個別の検出された顔が、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出すための手段と、
を備える、項目２０２に記載のシステム。
２０４．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するための手段は、
コンテンツのビデオのフレーム内のエッジを検出するための手段と、
個別の検出されたエッジに対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較するための手段と、
比較するステップに基づいて、個別の検出されたエッジが、運動の識別された対象であるかどうかを決定するための手段と、
個別の検出されたエッジが、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出すための手段と、
を備える、項目２０３に記載のシステム。
２０５．メタデータは、コンテンツとともに受信される、項目１９８に記載のシステム。
２０６．第２の入力コマンドは、アイコンの１つを上回る選択を備え、本システムはさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出すための手段と、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別するための手段と、
を備え、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目１９８に記載のシステム。
２０７．アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量を下回るかどうかを決定するための手段をさらに備え、運動の時間的長さが、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、項目１９８に記載のシステム。
２０８．アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するための手段をさらに備え、運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、項目１９８に記載のシステム。
２０９．非一過性コンピュータ可読媒体であって、制御回路によって実行されると、制御回路に、
コンテンツの再生の間、第１の入力コマンドを受信させ、
コンテンツと関連付けられるメタデータから、アクションシグネチャを識別させ、
メタデータから、各識別されたアクションシグネチャと関連付けられる運動の対象の識別子を読み出させ、
個別のアクションシグネチャと関連付けられる運動の各個別の読み出された対象を表すアイコンを表示のために発生させる、
コンテンツのビデオの一部の対象を表示するためのその上にエンコードされる命令を有する、非一過性コンピュータ可読媒体。
２１０．命令の実行はさらに、制御回路に、
アイコンの選択を備える第２の入力コマンドを受信させ、
第２の入力コマンドを受信することに応答して、選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生させる、
項目２０９に記載の非一過性コンピュータ可読媒体。
２１１．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するための命令の実行はさらに、制御回路に、
メタデータから、アクションシグネチャと関連付けられる開始タイムスタンプを読み出させ、
読み出された開始タイムスタンプにおいて開始されるコンテンツの部分を再生させる、
項目２１０に記載の非一過性コンピュータ可読媒体。
２１２．命令の実行はさらに、制御回路に、運動の各識別された対象の捕捉された画像を読み出させ、
運動の個別の対象を表すアイコンは、読み出された捕捉された画像を備える、
項目２０９に記載の非一過性コンピュータ可読媒体。
２１３．アクションシグネチャを識別するための命令の実行はさらに、制御回路に、
コンテンツの現在の再生タイムスタンプを識別させ、
現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別させ、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する運動の対象の識別子を読み出させ、データベースは、開始タイムスタンプおよび終了タイムスタンプを運動の識別された対象の運動と関連付け、
アクションシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のコンテンツの部分を識別させる、
項目２０９に記載の非一過性コンピュータ可読媒体。
２１４．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するための命令の実行はさらに、制御回路に、
コンテンツのビデオのフレーム内の顔を検出させ、
個別の検出された顔に対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較させ、
比較するステップに基づいて、個別の検出された顔が、運動の識別された対象であるかどうかを決定させ、
個別の検出された顔が、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出させる、
項目２１３に記載の非一過性コンピュータ可読媒体。
２１５．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するための命令の実行はさらに、制御回路に、
コンテンツのビデオのフレーム内のエッジを検出させ、
個別の検出されたエッジに対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較させ、
比較するステップに基づいて、個別の検出されたエッジが、運動の識別された対象であるかどうかを決定させ、
個別の検出されたエッジが、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出させる、
項目２１４に記載の非一過性コンピュータ可読媒体。
２１６．メタデータは、コンテンツとともに受信される、項目２０９に記載の非一過性コンピュータ可読媒体。
２１７．第２の入力コマンドは、アイコンの１つを上回る選択を備え、命令の実行はさらに、制御回路に、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出させ、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別させ、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目２０９に記載の非一過性コンピュータ可読媒体。
２１８．命令の実行はさらに、制御回路に、アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量を下回るかどうかを決定させ、
運動の時間的長さが、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、
項目２０９に記載の非一過性コンピュータ可読媒体。
２１９．命令の実行はさらに、制御回路に、アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であるかどうかを決定させ、
運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、
項目２０９に記載の非一過性コンピュータ可読媒体。
２２０．コンテンツのビデオの一部の対象を表示するための方法であって、
コンテンツを再生するステップと、
コンテンツの再生の間、第１の入力コマンドを受信するステップと、
コンテンツと関連付けられるメタデータから、アクションシグネチャを識別するステップと、
メタデータから、各識別されたアクションシグネチャと関連付けられる運動の対象の識別子を読み出すステップと、
個別のアクションシグネチャと関連付けられる運動の各個別の読み出された対象を表すアイコンを表示のために発生させるステップと、
を含む、方法。
２２１．アイコンの選択を備える第２の入力コマンドを受信するステップと、
第２の入力コマンドを受信することに応答して、選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップと、
をさらに含む、項目２２０に記載の方法。
２２２．選択されたアイコンと関連付けられるアクションシグネチャに対応するコンテンツの部分を再生するステップは、
メタデータから、アクションシグネチャと関連付けられる開始タイムスタンプを読み出すステップと、
読み出された開始タイムスタンプにおいて開始されるコンテンツの部分を再生するステップと、
を含む、項目２２１に記載の方法。
２２３．運動の各識別された対象の捕捉された画像を読み出すステップをさらに含み、運動の個別の対象を表すアイコンは、読み出された捕捉された画像を備える、項目２２０－２２２のいずれかに記載の方法。
２２４．アクションシグネチャを識別するステップは、
コンテンツの現在の再生タイムスタンプを識別するステップと、
現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するステップと、
データベースから、現在の再生タイムスタンプの閾値時間量内であるタイムスタンプを有する運動の対象の識別子を読み出すステップであって、データベースは、開始タイムスタンプおよび終了タイムスタンプを運動の識別された対象の運動と関連付ける、ステップと、
アクションシグネチャとして、開始タイムスタンプと終了タイムスタンプとの間のコンテンツの部分を識別するステップと、
を含む、項目２２０－２２３のいずれかに記載の方法。
２２５．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するステップは、
コンテンツのビデオのフレーム内の顔を検出するステップと、
個別の検出された顔に対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、個別の検出された顔が、運動の識別された対象であるかどうかを決定するステップと、
個別の検出された顔が、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出すステップと、
を含む、項目２２４に記載の方法。
２２６．現在の再生タイムスタンプにおいてコンテンツ内に表示される運動の対象を識別するステップは、
コンテンツのビデオのフレーム内のエッジを検出するステップと、
個別の検出されたエッジに対応するパラメータのセットを運動の識別された対象の対応するパラメータと比較するステップと、
比較するステップに基づいて、個別の検出されたエッジが、運動の識別された対象であるかどうかを決定するステップと、
個別の検出されたエッジが、運動の識別された対象であると決定することに応答して、運動の対象の識別子を読み出すステップと、
を含む、項目２２５に記載の方法。
２２７．メタデータは、コンテンツとともに受信される、項目２２０－２２６のいずれかに記載の方法。
２２８．第２の入力コマンドは、アイコンの１つを上回る選択を備え、本方法はさらに、
選択されたアイコンによって表される運動の対象に割り当てられた複数のアクションシグネチャを読み出すステップと、
アイコンの選択数だけ現在の再生タイムスタンプに先行する複数のアクションシグネチャのあるアクションシグネチャを識別するステップと、
を含み、
記憶されたタイムスタンプは、識別されたアクションシグネチャから読み出される、
項目２２０－２２７のいずれかに記載の方法。
２２９．アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量を下回るかどうかを決定するステップをさらに含み、運動の時間的長さが、最小閾値時間量を下回ると決定することに応答して、コンテンツの再生は、スローモーションにおいて実施される、項目２２０－２２８のいずれかに記載の方法。
２３０．アクションシグネチャと関連付けられる運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であるかどうかを決定するステップをさらに含み、運動の時間的長さが、最小閾値時間量と最大閾値時間量との間であると決定することに応答して、コンテンツの再生は、ループされる、項目２２０－２２９のいずれかに記載の方法。

【図1】