(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-24
(45)【発行日】2022-01-18
(54)【発明の名称】映像再生方法及び装置
(51)【国際特許分類】
H04N 21/437 20110101AFI20220111BHJP
H04N 21/439 20110101ALI20220111BHJP
【FI】
H04N21/437
H04N21/439
【外国語出願】
(21)【出願番号】P 2019048239
(22)【出願日】2019-03-15
【審査請求日】2019-06-06
(31)【優先権主張番号】201810714342.8
(32)【優先日】2018-06-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100107319
【氏名又は名称】松島 鉄男
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100170379
【氏名又は名称】徳本 浩一
(74)【代理人】
【識別番号】100180231
【氏名又は名称】水島 亜希子
(74)【代理人】
【識別番号】100096769
【氏名又は名称】有原 幸一
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(72)【発明者】
【氏名】タン,ファン
(72)【発明者】
【氏名】ユェン,ポン
(72)【発明者】
【氏名】ユェン,ハイグァン
(72)【発明者】
【氏名】ウー,リィァンチォン
【審査官】川中 龍太
(56)【参考文献】
【文献】米国特許出願公開第2018/0070143(US,A1)
【文献】特開2001-249609(JP,A)
【文献】米国特許出願公開第2017/0329572(US,A1)
【文献】特表2008-533505(JP,A)
【文献】米国特許出願公開第2015/0331665(US,A1)
【文献】中国特許出願公開第104134334(CN,A)
【文献】中国特許出願公開第108024139(CN,A)
【文献】特開2005-284181(JP,A)
【文献】中国特許出願公開第104216990(CN,A)
【文献】米国特許出願公開第2014/0026048(US,A1)
【文献】米国特許出願公開第2008/0162471(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
H04N 5/76 - 5/93
G09B 1/00 - 9/56
G09B 17/00 - 19/26
(57)【特許請求の範囲】
【請求項1】
スマートデバイスに用いられる映像再生方法であって、
タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するステップであって、前記対象映像は、前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、
前記タイムノードに対応する自然言語による音声対話コンテンツを取得するための要求を前記サーバに送信するステップと、
前記サーバから返された自然言語による音声対話コンテンツを受信するステップと、
受信した自然言語による音声対話コンテンツを再生するステップと、
再生された自然言語による音声対話コンテンツに対するユーザの自然言語による音声フィードバック情報を受信するステップと、
前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するステップであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、判定するステップと、
前記自然言語による音声フィードバック情報
の結果が前記事前設定条件を満た
していないと判定したことに応答して、前記対象映像
における前記音声対話コンテンツに対応する映像セグメントを
再び再生するステップと
を含む、スマートデバイスに用いられる映像再生方法。
【請求項2】
前記自然言語による音声フィードバック情報
の結果が前記事前設定条件を満たしてい
ると判定したことに応答して、
前記対象映像を引き続き再生するステップを更に含む、請求項1に記載の方法。
【請求項3】
前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、
前記自然言語による音声フィードバック情報を前記サーバに送信して、前記サーバは前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、
前記サーバから返された判定結果を受信することと
を含む、請求項1に記載の方法。
【請求項4】
前記サーバには映像集合が記憶され、前記映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、
前記映像集合の映像は、
コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と、自然言語による音声対話コンテンツとを含むステップと、
前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の自然言語による音声対話コンテンツを取得するための動作をトリガーするステップと、
タイムノードが関連付けられたオリジナル映像を、映像集合に映像集合内の映像として追加するステップと
によって生成される、請求項1~3のいずれか1項に記載の方法。
【請求項5】
サーバに用いられる映像再生方法であって、
スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられる画像フレームまで対象映像が再生されたことを検出して前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令の受信に応答して前記サーバから取得したものであるステップと、
前記タイムノードの識別子に対応する自然言語による音声対話コンテンツを確定するステップと、
前記スマートデバイスが受信された自然言語による音声対話コンテンツを再生するように、確定された自然言語による音声対話コンテンツを前記スマートデバイスに送信するステップと、
前記スマートデバイスが再生された自然言語による音声対話コンテンツに対して送信した自然言語による音声フィードバック情報を受信するステップと、
前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するステップであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、判定するステップと、
判定結果を前記スマートデバイスに送信
して、前記スマートデバイスは、前記自然言語による音声フィードバック情報が前記事前設定条件を満たしていないと判定したことに応答して、前記対象映像における前記音声対話コンテンツに対応する映像セグメントを再び再生するようにするステップと
を含む、サーバに用いられる映像再生方法。
【請求項6】
前記サーバには映像集合が記憶され、前記映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、
前記方法は、
コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と、自然言語による音声対話コンテンツとを含むステップと、
前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の自然言語による音声対話コンテンツを取得するための動作をトリガーするステップと、
タイムノードが関連付けられたオリジナル映像を、映像集合内に追加するステップと
を更に含む、請求項5に記載の方法。
【請求項7】
スマートデバイスのための映像再生装置であって、
タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである映像一時停止ユニットと、
前記タイムノードに対応する自然言語による音声対話コンテンツを取得するための要求を前記サーバに送信するように配置される要求送信ユニットと、
前記サーバから返された自然言語による音声対話コンテンツを受信するように配置されるコンテンツ受信ユニットと、
受信された自然言語による音声対話コンテンツを再生するように配置されるコンテンツ再生ユニットと、
再生された自然言語による音声対話コンテンツに対するユーザの自然言語による音声フィードバック情報を受信するフィードバック情報受信ユニットと、
前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定する条件判定ユニットであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、条件判定ユニットと、
前記自然言語による音声フィードバック情報
の結果が前記事前設定条件を満た
していないと判定したことに応答して、前記対象映像
における前記音声対話コンテンツに対応する映像セグメントを
再び再生する映像再生ユニットと
を含む、スマートデバイスのための映像再生装置。
【請求項8】
前記映像再生ユニットはさらに、前記自然言語による音声フィードバック情報の結果が前記事前設定条件を満たしていると判定したことに応答して、前記対象映像を引き続き再生するように構成される、請求項7に記載の装置。
【請求項9】
前記条件判定ユニットは、
前記自然言語による音声フィードバック情報をサーバに送信し、前記サーバにより前記自然言語による音声フィードバック情報が前記事前設定条件を満たすか否かを判定させる、情報送信モジュールと、
前記サーバから、前記自然言語による音声フィードバック情報が前記事前設定条件を満たすか否かの判定結果を受信する結果受信モジュールと
を含む、請求項7に記載の装置。
【請求項10】
サーバに用いられる映像再生装置であって、
スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される要求受信ユニットであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して、前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答して前記サーバから取得したものである要求受信ユニットと、
前記タイムノードの識別子に対応する自然言語による音声対話コンテンツを確定するように配置されるコンテンツ確定ユニットと、
前記スマートデバイスが受信された自然言語による音声対話コンテンツを再生するように、確定された自然言語による音声対話コンテンツを前記スマートデバイスに送信するように配置されるコンテンツ送信ユニットと、
再生された自然言語による音声対話コンテンツについて前記スマートデバイスによって送信されたユーザの自然言語による音声フィードバック情報を受信する情報受信ユニットと、
前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定する条件判定ユニットであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、条件判定ユニットと、
前記自然言語による音声フィードバック情報が前記事前設定条件を満たすか否かについての判定結果を前記スマートデバイスに送信
して、前記スマートデバイスは、前記自然言語による音声フィードバック情報が前記事前設定条件を満たしていないと判定したことに応答して、前記対象映像における前記音声対話コンテンツに対応する映像セグメントを再び再生するようにする結果送信ユニットと
を含む、サーバに用いられる映像再生装置。
【請求項11】
電子機器であって、
一つ以上のプロセッサと、
一つ以上のプログラムが記憶される記憶装置と
を備え、
前記一つ以上のプログラムが前記一つ以上のプロセッサによって実行されると、前記一つ以上のプロセッサに請求項1~6のいずれか一項に記載の方法を実現させる、電子機器。
【請求項12】
コンピュータプログラムが記憶されるコンピュータ可読媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1~6のいずれか一項に記載の方法を実現する、コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施例は、コンピュータ技術の分野に関し、特に映像再生方法及び装置に関する。
【背景技術】
【0002】
人工知能(Artificial Intelligence)とは、英語ではAIと略される。それは、人間の知能をシミュレート、拡張、展開するための理論、方法、技術、及び応用システムを研究開発する新しい技術科学である。人工知能は、知能の本質を理解し、人間の知能と同じように反応できる新しいタイプの知能機械(スマートデバイスともいう)を生み出すことを試みるコンピュータサイエンスの一分野であり、ロボット、言語認識、画像認識、自然言語処理、及びエキスパートシステムなどの研究を含む。
【0003】
スマートデバイスは、自然言語による対話でユーザと対話し、ユーザの音声入力を取得してサーバに報告し、サーバによって返された命令を受信して、映像再生、天気照会、日常管理などの対応する動作を実行することができる。
【0004】
従来のスマートデバイスは、映像再生中において、ほとんど早送り、早戻し、再生、一時停止などの一般的な操作をサポートすることができる。
【発明の開示】
【0005】
本発明の実施例は、映像再生方法及び装置を開示する。
【0006】
第1の態様では、本発明の実施例は、スマートデバイスのための映像再生方法であって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するステップであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、タイムノードに対応する音声対話コンテンツを取得するための要求をサーバに送信するステップと、サーバから返された音声対話コンテンツを受信するステップと、受信した音声対話コンテンツを再生するステップと、を含むスマートデバイスのための映像再生方法を提供した。
【0007】
いくつかの実施例では、該方法は、再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するステップと、音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、音声フィードバック情報が事前設定条件を満たすと判定したことに応答して、対象映像を引き続き再生するステップと、を更に含む。
【0008】
いくつかの実施例では、該方法は、音声フィードバック情報が事前設定条件を満たしていないと判定したことに応答して、事前設定動作を実行するステップを更に含む。
【0009】
いくつかの実施例では、音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、音声フィードバック情報をサーバに送信して、サーバは音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、サーバから返された判定結果を受信することと、を含む。
【0010】
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、映像集合内の映像は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーするステップと、タイムノードが関連付けられたオリジナル映像を、映像集合内の映像として映像集合内に追加するステップと、によって生成される。
【0011】
第2の態様では、本発明の実施例は、サーバのための映像再生方法であって、該方法は、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、タイムノードの識別子に対応する音声対話コンテンツを確定するステップと、スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツをスマートデバイスに送信するステップと、を含むサーバのための映像再生方法を提供した。
【0012】
いくつかの実施例では、該方法は、スマートデバイスが再生された音声対話コンテンツに対して送信した音声フィードバック情報を受信するステップと、
音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、判定結果をスマートデバイスに送信するステップと、を更に含む。
【0013】
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、方法は、更に、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作を作動させるステップと、タイムノードが関連付けられたオリジナル映像を映像集合内に追加するステップと、を更に含む。
【0014】
第3の態様では、本発明の実施例は、スマートデバイスのための映像再生装置であって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである映像一時停止ユニットと、タイムノードに対応する音声対話コンテンツ取得要求をサーバに送信するように配置される要求送信ユニットと、サーバから返された音声対話コンテンツを受信するように配置されるコンテンツ受信ユニットと、受信された音声対話コンテンツを再生するように配置されるコンテンツ再生ユニットと、を含むスマートデバイスのための映像再生装置を提供した。
【0015】
いくつかの実施例では、装置は、再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するように配置されるフィードバック情報受信ユニットと、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される条件判定ユニットと、音声フィードバック情報が事前設定条件を満たすと判定したことに応答して、対象映像を連続再生するように配置される映像再生ユニットと、を更に備える。
【0016】
いくつかの実施例では、装置は、音声フィードバック情報が事前設定条件を満たしていないと判定したことに応答して、予め設定された動作を実行するように配置される動作実行ユニットを更に備える。
【0017】
いくつかの実施例では、条件判定ユニットは、音声フィードバック情報をサーバに送信するように配置される情報送信モジュールであって、サーバは音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される情報送信モジュールと、サーバから返された判定結果を受信する結果受信モジュールと、を備える。
【0018】
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含む。該映像集合の映像は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作を作動させるステップと、タイムノードが関連付けられたオリジナル映像を、映像集合内の映像として映像集合内に追加するステップと、によって生成される。
【0019】
第4の態様では、本発明の実施例は、サーバのための映像再生装置であって、該装置は、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される要求受信ユニットであって、音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである要求受信ユニットと、タイムノードの識別子に対応する音声対話コンテンツを確定するように配置されるコンテンツ確定ユニットと、スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツをスマートデバイスに送信するように配置されるコンテンツ送信ユニットと、を備えるサーバのための映像再生装置を提供した。
【0020】
いくつかの実施例では、装置は、再生された音声対話コンテンツについてスマートデバイスによって送信された音声フィードバック情報を受信するように配置される情報受信ユニットと、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される条件判定ユニットと、判定結果をマートデバイスに送信するように配置される結果送信ユニットと、を更に備える。
【0021】
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含む。装置は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するように配置される映像取得ユニットと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するノード情報取得ユニットであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むように配置されるノード情報取得ユニットと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作を作動させるように配置される関連付けユニットと、タイムノードが関連付けられたオリジナル映像を映像集合内に追加するように配置される映像追加ユニットと、更に備える。
【0022】
第5の態様では、本発明の実施例は、電子機器であって、一つ以上のプロセッサと、一つ以上のプログラムが記憶される記憶装置と、を備え、一つ以上のプログラムが一つ以上のプロセッサによって実行されると、一つ以上のプロセッサに第1態様のいずれかの実施形態に記載の方法、又は第2態様のいずれかの実施形態に記載の方法を実現させる、電子機器を提供した。
【0023】
第6の態様では、本発明の実施例は、コンピュータプログラムが記憶されるコンピュータ可読媒体であって、該コンピュータプログラムがプロセッサによって実行されると、第1態様のいずれかの実施形態に記載の方法、又は第2態様のいずれかの実施形態に記載の方法を実現する、コンピュータ可読媒体を提供した。
【0024】
本発明の実施例によって提供される映像再生方法及び装置では、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止し、その後、音声対話コンテンツ取得要求をサーバに送信し、サーバから返された音声対話コンテンツを受信し、対話コンテンツを再生することにより、映像再生中におけるユーザとの対話型インタラクションが実現される。
【図面の簡単な説明】
【0025】
本発明の他の特徴、目的及び利点は、以下の図面を参照してなされる非限定的な実施例に係る詳細な説明を読むことにより、より明らかになる。
【0026】
【
図1】本発明の一実施例を適用可能な例示的なシステムアーキテクチャを示す図である。
【
図2】本発明に係るスマートデバイスに用いられる映像再生方法の一実施例を示すフローチャートである。
【
図3A】本発明に係るスマートデバイスに用いられる映像再生方法の一つの応用シナリオを示す概略図である。
【
図3B】本発明に係るスマートデバイスに用いられる映像再生方法の一つの応用シナリオを示す概略図である。
【
図4】本発明に係るサーバに用いられる映像再生方法の一実施例を示すフローチャートである。
【
図5】本発明に係るスマートデバイスに用いられる映像再生装置の一実施例を示す構造概略図である。
【
図6】本発明に係るサーバに用いられる映像再生装置の一実施例を示す構造概略図である。
【
図7】本発明の実施例を達成するための電子機器に適用されるコンピュータシステムの構造概略図である。
【発明を実施するための形態】
【0027】
以下、図面及び実施形態を参照しながら本発明をより詳細に説明する。理解すべきことは、ここで説明する具体的な実施例は、関連する発明を説明するためのものに過ぎず、当該発明を限定するものではない。更に、説明の便宜上、図面には発明に関連する部分のみが示されている。
【0028】
なお、本発明の実施例及び実施例における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面及び実施例を参照しながら本発明を詳細に説明する。
【0029】
図1は、本発明に係るスマートデバイスに用いられる映像再生方法、サーバに用いられる映像再生方法、スマートデバイスに用いられる映像再生装置又はサーバに用いられる映像再生装置を適用可能な実施例の例示的なシステムアーキテクチャ100を示している。
【0030】
図1に示すように、システムアーキテクチャ100は、スマートデバイス101、102、103、ネットワーク104、及びサーバ105を含んでもよい。ネットワーク104は、スマートデバイス101、102、103及びサーバ105の間で通信リンクの媒体を提供するために使用される。ネットワーク104は、有線、無線通信リンク又は光ファイバケーブルなどの様々なタイプの接続を含んでもよい。
【0031】
ユーザは、自然言語対話を通じてスマートデバイス101、102、103を操作して、ネットワーク104を介してサーバ105と対話して、メッセージなどを送受信することができる。スマートデバイス101、102、103には、映像再生アプリケーション、ウェブブラウザアプリケーション、ショッピングアプリケーション、検索アプリケーション、インスタントコミュニケーションツール、メールボックスクライアント、ソーシャルプラットフォームソフトウェアなどの様々な通信クライアントアプリケーションをインストールすることができる。
【0032】
スマートデバイス101、102、103は、ハードウェアでもソフトウェアでもよい。スマートデバイス101、102、103がハードウェアである場合、ディスプレイを有するとともに対話型インタラクション及び映像再生をサポートする様々な電子機器であってもよく、スマートフォン、タブレットコンピュータ、スマートエアコン、スマート冷蔵庫、スマートテレビなどを含むが、これらに限定されない。スマートデバイス101、102、103がソフトウェアである場合、上記の電子機器に搭載されてもよい。それは、複数のソフトウェア又はソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実現されてもよく、又は単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。
【0033】
サーバ105は、様々なサービスを提供するサーバ、例えば、スマートデバイス101、102、103で再生される映像をサポートするバックエンドサーバであってもよい。バックエンドサーバは、受信した音声コンテンツ取得要求などのデータを解析処理し、その処理結果(例えば、音声対話コンテンツ)をスマートデバイスにフィードバックすることができる。
【0034】
なお、本発明の実施例によって提供されるスマートデバイスに用いられる映像再生方法は、通常にスマートデバイス101、102、103によって実行され、これに応じて、スマートデバイスに用いられる映像再生装置は、通常にスマートデバイス101、102、103に配置される。 本発明の実施例によって提供されるサーバに用いられる映像再生方法は、通常にサーバ105によって実行され、これに応じて、サーバのための映像再生装置は、通常にサーバ105に配置される。
【0035】
サーバ105は、ハードウェアでもソフトウェアでもよいことに留意されたい。サーバ105がハードウェアである場合、複数のサーバから構成される分散サーバクラスターとしても、単一のサーバとしても実現可能である。サーバがソフトウェアである場合、複数のソフトウェア又はソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実現されてもよく、又は単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。
【0036】
理解すべきことは、
図1におけるスマートデバイス、ネットワーク及びサーバの数は例示的なものに過ぎない。必要に応じて、スマートデバイス、ネットワーク及びサーバの数を任意にかつ適切に加減してもよい。
【0037】
次に、
図2を参照し、本発明に係るスマートデバイスのための映像再生方法の一実施例のフロー200を示している。スマートデバイスのための映像再生方法は、次のステップを含む。
【0038】
ステップ201:タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止する。
【0039】
この実施例では、スマートデバイスに用いられる映像再生方法の実行主体(例えば、
図1のスマートデバイス101、102、103)は、スマートデバイスで再生される対象映像がタイムノードに関連付けられる画像フレームまで再生されたか否かを検出することができる。もし肯定であれば、対象映像の再生を一時停止する。ただし、対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバ(例えば、
図1のサーバ105)から取得したものである。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。音声対話は、例えば自然言語方式で対話することなど、スマート端末が音声の形でユーザと対話することを指してもよい。
【0040】
一例として、対象映像である「消防車の手作りに関する映像」は、100個の画像フレームを含み、対象映像の第1の画像フレームから第35の画像フレームがヘッド部を作るためのデモンストレーションであり、対象映像のコンテンツプロバイダは、ユーザがヘッド部の製作を把握したか否かを確定するためには、対象映像の第35の画像フレームで音声対話をトリガーするためのタイムノードを設ける必要がある。タイムノードに関連付けられた画像フレーム(すなわち、第35の画像フレーム)まで対象映像が再生されると、スマートデバイスは、後述する音声対話動作をトリガし、対象映像である「消防車の手作りに関する映像」の再生を一時停止することができる。
【0041】
ステップ202:タイムノードに対応する音声対話コンテンツの取得要求をサーバに送信する。
【0042】
本実施例では、前記実行主体は、前記タイムノードに対応する音声対話コンテンツを取得するために、有線接続方式又は無線接続方式によって音声対話コンテンツ取得要求をサーバに送信することができる。ただし、音声対話コンテンツ取得要求は、前記タイムノードの識別子を含んでもよい。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれますか?」などが挙げられる。
【0043】
なお、前記無線接続方式は、3G(the 3rd generation)/4G(the 4th generation)/5G(the 5th generation)の通信接続、Wi-Fi(Wireless-Fidelity)接続、ブルートゥース接続、WiMAX(Worldwide Interoperability for Microwave Access)接続、Zigbee(Zigbeeプロトコルともいう)接続、UWB(Ultra Wideband)接続、及び現在知られているか又は将来開発される他の無線接続を含むことができるが、これらに限定されない。
【0044】
ステップ203:サーバから返信された音声対話コンテンツを受信する。
【0045】
本実施例では、前記実行主体は、サーバから返された音声対話コンテンツを受信することができる。ここで、音声対話コンテンツは、音声対話コンテンツ取得要求におけるタイムノードの識別子に従ってサーバによってローカルに又はリモートに取得されるものである。
【0046】
ステップ204:受信した音声対話コンテンツを再生する。
【0047】
本実施例では、前記実行主体は、ステップ203で受信した音声対話コンテンツを音声で再生することができる。例えば、スマートデバイスは、自然言語で会話するようにユーザに「今言ったことを理解しましたか?」と尋ねることができる。
【0048】
本実施例のいくつかの所望による実施態様では、このスマートデバイスに用いられる映像再生方法は、更に以下のステップを含んでもよい。
【0049】
先ずは、前記実行主体は、スマートデバイスのためにユーザによって再生された音声対話コンテンツの音声フィードバック情報を受信することができる。例えば、スマートデバイスは、音声対話コンテンツである「今言ったことを理解しましたか?」ということを再生する。ユーザは、「理解しました」と音声でフィードバックすることができる。
【0050】
次に、前記実行主体は、受信した音声フィードバック情報が事前設定条件を満たすか否かを判定することができる。ここで、事前設定条件は、ユーザの音声フィードバック情報が所望の効果を達成したか否かを判定するために予め設定された条件をいう。「消防車の手作りに関する映像」である対象映像を例として、第35の画像フレームにおける音声対話について、事前設定条件とは、音声フィードバック情報において「理解」又は類似の意味を含む情報であってもよい。受信した音声フィードバック情報が「理解しました」であれば、受信した音声フィードバック情報が事前設定条件を満たすと判定することができる。受信した音声フィードバック情報が「理解していません」であれば、受信した音声フィードバック情報が事前設定条件を満たさないと判定することができる。
【0051】
最後に、前記実行主体は、受信した音声フィードバック情報が事前設定条件を満たすか否かの判定結果に応じて対応する動作を実行することができる。
【0052】
いくつかの例では、受信された音声情報(例えば、「理解しました」)が事前設定条件を満たす場合、前記実行本体は対象映像を連続再生することができる。
【0053】
他のいくつかの例では、受信された音声情報(例えば、「理解していません」)が事前設定条件を満たさない場合に、前記実行主体は予め設定された動作を実行することができる。ここで、予め設定された動作は、ユーザの音声フィードバック情報が所望の効果を達成していない場合にスマートデバイスによって実行される動作を含んでもよい。例えば、ヘッド部を作るデモンストレーションなどを再び再生する。
【0054】
上記実施形態では、受信された音声フィードバック情報が条件を満たすか否かをスマートデバイスによって判定することを説明したが、本発明はこれに限定されない。
【0055】
本実施例のいくつかの所望による実施態様では、音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、音声フィードバック情報をサーバに送信して、サーバは音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、サーバから返された判定結果を受信することと、を含んでもよい。
【0056】
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよい。ここで、映像集合における映像のそれぞれは、タイムノードが関連付けられた少なくとも1つの画像フレームを含んでもよい。該映像集合の映像は、次のステップによって生成される。
【0057】
先ずは、コンテンツプロバイダ(開発者ともいう)によってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得する。
【0058】
次に、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得し、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含む。一例として、オリジナル映像がアップロードされた後、コンテンツプロバイダに対してオリジナル映像編集インターフェースを提供してもよく、コンテンツプロバイダは、提供されたインターフェースを通じて、スマートデバイスがユーザと対話するために必要な画像フレームを選択して音声対話コンテンツを提供することが可能である。
【0059】
そして、少なくとも1つのタイムノード記述情報内の各タイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し(例えば、タイムタグやタイムマークを作成する)、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーする。ここで、タイムノードと画像フレームとの関連付けは、タイムノードを画像フレーム(又は画像フレームの属性)に追加することでもよく、スマートデバイスが該画像フレームを通して対応するタイムノードを検出できる限り、画像フレームを実質的に変更しなくてもよい。本発明は、関連付けの方法について、特に限定しない。
【0060】
最後に、タイムノードが関連付けられたオリジナル映像を、映像集合に追加して映像集合内の映像とする。
【0061】
なお、上述した映像集合の映像生成ステップの実行主体は、音声対話コンテンツ取得要求を受信するサーバであってもよいし、他のサーバ(例えば、他のサーバによって前記映像集合を生成して、音声対話コンテンツ取得要求を受信するサーバに記憶する)であってもよい。
【0062】
次に、
図3A及び
図3Bを参照し、本発明に係るスマートデバイスのための映像再生方法の一つの応用シナリオを示している。
図3Aにおいて、先ずは、ユーザ301が「車の手作りに関する映像を再生する」という音声命令を発し、次に、スマートテレビ302がサーバ303に映像取得要求を送信し、サーバ303から返信された映像である「車の手作りに関する映像」を受信して再生する。
図3Bにおいて、スマートデバイス302は、「車の手作りに関する映像」がタイムノードに関連付けられた画像フレーム304まで再生されたことが検出されると、「車の手作りに関する映像」の再生を一時停止し、音声対話コンテンツ取得要求をサーバ303に送信し、次に、スマートデバイス302は、サーバ303から返信された音声対話コンテンツを受信し、「子供たち、車のヘッド部の作りにはいくつのステップが含まれていますか?」という音声対話コンテンツをユーザ301に再生する。ユーザ301が上記の質問を聞いた後、「3つのステップがある。第1ステップ...、第2ステップ...、第3ステップ...」と答えることができ、ユーザの回答が事前設定されたステップポイントを含む場合、スマートデバイス302は、「素晴らしい答えです。引き続きご覧になってください」という音声ヒントを発することができ、「車の手作りに関する映像」を連続再生し、それによって映像再生中のスマートデバイスとユーザとの間の音声対話が実現される。
【0063】
本発明の上述した実施例によって提供されたスマートデバイスに用いられる映像再生方法では、スマートデバイスは、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止し、その後、音声対話コンテンツ取得要求をサーバに送信し、サーバから返された音声対話コンテンツを受信し、対話コンテンツを再生することにより、映像再生中におけるユーザとの対話型インタラクションが実現された。
【0064】
次に、
図4を参照し、本発明に係るサーバのための映像再生方法の一実施例のフロー400を示している。このサーバのための映像再生方法は、次のステップを含む。
【0065】
ステップ401:スマートデバイスによって送信された音声対話コンテンツ取得要求を受信する。
【0066】
本実施例では、サーバに用いられる映像再生方法の実行主体(例えば、
図1のサーバ105)は、有線接続方式又は無線接続方式でスマートデバイス(例えば、
図1のスマートデバイス101、102、103)によって送信された音声対話コンテンツ取得要求を受信することができる。音声対話コンテンツ取得要求は、スマートデバイスによってタイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものである。音声対話コンテンツ取得要求は、タイムノードの識別子を含んでもよい。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバから取得したものである。
【0067】
ステップ402:タイムノードの識別子に対応する音声対話コンテンツを確定する。
【0068】
本実施例では、前記実行主体は、ステップ401で受信した音声対話コンテンツ取得要求内の識別子に対応する音声対話コンテンツをローカル又はリモートで取得することができる。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれていますか?」などが挙げられる。
【0069】
ステップ403:確定された音声対話コンテンツをスマートデバイスに送信する。
【0070】
本実施例では、前記実行主体は、ステップ402で確定された音声対話コンテンツをスマートデバイスに送信し、それによってスマートデバイスは受信した音声対話コンテンツを自然言語会話方式で再生できる。
【0071】
本実施例のいくつかの所望による実施態様では、このサーバのための映像再生方法は、更に以下のステップを含んでもよい。
【0072】
先ずは、前記実行主体は、再生された音声対話コンテンツについてスマートデバイスによって送信された音声フィードバック情報を受信することができる。ここで、音声フィードバック情報とは、ユーザがスマート端末によって再生された音声対話コンテンツについてフィードバックしたものである。例えば、スマートデバイスは、音声対話コンテンツである「今言ったことを理解しましたか?」ということを再生する。ユーザは、「理解しました」と音声でフィードバックすることができる。
【0073】
次に、前記実行主体は、音声フィードバック情報が事前設定条件を満たすか否かを判定することができる。ここで、事前設定条件は、ユーザの音声フィードバック情報が所望の効果を達成したか否かを判定するために予め設定された条件をいう。例えば、事前設定条件は、「理解しました」又は同様の意味の情報であってもよい。受信した音声フィードバック情報が「理解しました」であれば、受信した音声フィードバック情報が事前設定条件を満たすと判定することができる。受信した音声フィードバック情報が「理解していません」であれば、受信した音声フィードバック情報が事前設定条件を満たさないと判定することができる。
【0074】
最後に、前記実行主体は、判定結果をスマートデバイスに送信することができ、それによってスマートデバイスは、前記判定結果に従って対応する動作を実行することができる(例えば、対象映像を連続再生する)。
【0075】
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよい。ここで、映像集合における映像のそれぞれは、タイムノードが関連付けられた少なくとも1つの画像フレームを含んでもよい。このサーバのための映像再生方法は、次のステップを含んでもよい。
【0076】
先ずは、前記実行主体は、コンテンツプロバイダ(開発者ともいう)によってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得することが可能である。
【0077】
次に、前記実行主体は、オリジナル映像についてコンテンツプロバイダによって提出された、画像フレーム識別子と音声対話コンテンツとを含む少なくとも1つのタイムノード記述情報を取得することが可能である。一例として、オリジナル映像がアップロードされた後、コンテンツプロバイダに対してオリジナル映像編集インターフェースを提供してもよく、コンテンツプロバイダは、提供されたインターフェースを通じて、スマートデバイスがユーザと対話するために必要な画像フレームを選択して音声対話コンテンツを提供することが可能である。
【0078】
そして、少なくとも1つのタイムノード記述情報内の各タイムノード記述情報について、前記実行主体は、そのタイムノード記述情報に対応するタイムノードを生成し(例えば、タイムタグやタイムマークを作成する)、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けることが可能であり、それによって該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作がトリガーされる。
【0079】
最後に、前記実行主体は、タイムノードが関連付けられたオリジナル映像を、映像集合内に追加することが可能である。
【0080】
本発明の上述した実施例によって提供されたサーバのための映像再生方法によれば、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止した場合に送信された音声対話コンテンツ取得要求を受信し、その後、音声対話コンテンツ取得要求内のタイムノードの識別子に対応する音声対話コンテンツを確定し、確定された音声対話コンテンツをスマートデバイスに送信することによって、映像再生中におけるスマートデバイスとユーザとの対話型インタラクションが実現された。
【0081】
更に
図5を参照すると、
図2に示された方法の実施態様として、本発明は、スマートデバイスのための映像再生装置の一実施例を提供し、この装置の実施例は、
図2に示された方法の実施例に対応しており、該装置は、具体的にスマートデバイスに適用することができる。
【0082】
図5に示すように、本実施例のスマートデバイスのための映像再生装置500は、映像一時停止ユニット501、要求送信ユニット502、コンテンツ受信ユニット503、及びコンテンツ再生ユニット504を含んでもよい。ここで、映像一時停止ユニット501は、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである。要求送信ユニット502は、タイムノードに対応する音声対話コンテンツ取得要求をサーバに送信するように配置される。コンテンツ受信ユニット503は、サーバから返信された音声対話コンテンツを受信するように配置される。コンテンツ再生ユニット504は、受信された音声対話コンテンツを再生するように配置される。
【0083】
本実施例では、スマートデバイスのための映像再生装置500の前記映像一時停止ユニット501は、スマートデバイス(例えば、
図1のスマートデバイス101、102、103)で再生される対象映像がタイムノードに関連付けられる画像フレームまで再生されたか否かを検出することができる。もしそうであれば、対象映像の再生を一時停止する。ただし、対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバ(例えば、
図1のサーバ105)から取得したものである。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。
【0084】
本実施例では、前記要求送信ユニット502は、前記タイムノードに対応する音声対話コンテンツを取得するために、有線接続方式又は無線接続方式によって音声対話コンテンツ取得要求をサーバに送信することができる。ただし、音声対話コンテンツ取得要求は、前記タイムノードの識別子を含んでもよい。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれますか?」などが挙げられる。
【0085】
本実施例では、前記コンテンツ受信ユニット503は、サーバから返信された音声対話コンテンツを受信することができる。ここで、音声対話コンテンツは、音声対話コンテンツ取得要求の識別子に従ってサーバによってローカル又はリモートに取得されるものである。
【0086】
本実施例では、前記コンテンツ再生ユニット504は、前記コンテンツ受信ユニット503によって受信された音声対話コンテンツを音声の形式で再生することができる。例えば、スマートデバイスは、自然言語で会話するようにユーザに「今言ったことを理解しましたか?」と尋ねることができる。
【0087】
本実施例のいくつかの所望による実施態様では、該装置500は、フィードバック情報受信ユニット、条件判定ユニット、及び映像再生ユニットを更に含んでもよい。ここで、フィードバック情報受信ユニットは、再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するように配置される。条件判定ユニットは、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される。映像再生ユニットは、音声フィードバック情報が事前設定条件を満たすと判定したことに応答して、対象映像を連続再生するように配置される。
【0088】
本実施例のいくつかの所望による実施態様では、該装置500は、動作実行ユニットを更に含んでもよい。ここで、動作実行ユニットは、音声フィードバック情報が事前設定条件を満たしていないと判定したことに応答して、予め設定された動作を実行するように配置される。
【0089】
本実施例のいくつかの所望による実施態様では、前記条件判定ユニットは情報送信モジュール及び結果受信モジュールを含んでもよい。ここで、情報送信モジュールは、音声フィードバック情報をサーバに送信するように配置される。サーバは、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される。結果受信モジュールは、サーバから返された判定結果を受信する。
【0090】
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよく、映像集合内のそれぞれの映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含んでもよい。該映像集合のそれぞれの映像は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された、画像フレーム識別子と音声対話コンテンツとを含む少なくとも1つのタイムノード記述情報を取得するステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、それによって該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作がトリガされるステップと、タイムノードが関連付けられたオリジナル映像を、映像集合内の映像として映像集合内に追加するステップと、によって生成されることができる。
【0091】
本発明の上述した実施例によって提供されたスマートデバイスのための映像再生装置によれば、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出したときに対象映像の再生を一時停止し、その後、音声対話コンテンツ取得要求をサーバに送信し、サーバから返された音声対話コンテンツを受信し、最後に対話コンテンツを再生することにより、映像再生中におけるユーザとの対話型インタラクションが実現された。
【0092】
更に
図6を参照すると、
図4に示された方法の実施態様として、本発明は、サーバのための映像再生装置の一実施例を提供し、該装置の実施例は、
図4に示された方法の実施例に対応しており、該装置は、具体的にサーバに適用することができる。
【0093】
図6に示すように、本実施例のサーバに用いられる映像再生装置600は、要求受信ユニット601、コンテンツ確定ユニット602及びコンテンツ送信ユニット603を備える。要求受信ユニット601は、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される。音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである。コンテンツ確定ユニット602は、タイムノードの識別子に対応する音声対話コンテンツを確定するように配置される。コンテンツ送信ユニット603は、受信された音声対話コンテンツをスマートデバイスによって再生するように、確定された音声対話コンテンツをスマートデバイスに送信するように配置される。
【0094】
本実施例では、サーバに用いられる映像再生装置600の前記要求受信ユニット601は、有線接続方式又は無線接続方式でスマートデバイス(例えば、
図1のスマートデバイス101、102、103)によって送信された音声対話コンテンツ取得要求を受信することができる。ここで、音声対話コンテンツ取得要求は、スマートデバイスによってタイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止する場合に送信されたものである。音声対話コンテンツ取得要求は、タイムノードの識別子を含んでもよい。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバ(例えば、
図1のサーバ105)から取得したものである。
【0095】
本実施例では、サーバのための映像再生装置600の前記コンテンツ確定ユニット602は、前記要求受信ユニット601によって受信された音声対話コンテンツ取得要求内の識別子に対応する音声対話コンテンツをローカル又はリモートで取得することができる。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれていますか?」などが挙げられる。
【0096】
本実施例では、サーバのための映像再生装置600の前記コンテンツ送信ユニット603は、前記コンテンツ確定ユニット602によって確定された音声対話コンテンツをスマートデバイスに送信し、それによってスマートデバイスは受信した音声対話コンテンツを自然言語会話方式で再生できる。
【0097】
本実施例のいくつかの所望による実施態様では、当該サーバのための映像再生装置600は、情報受信ユニット、条件判定ユニット、及び結果送信ユニットを更に含んでもよい。ここで、情報受信ユニットは、再生された音声対話コンテンツについてスマートデバイスによって送信された音声フィードバック情報を受信するように配置される。条件判定ユニットは、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される。結果送信ユニットは、判定結果をマートデバイスに送信するように配置される。
【0098】
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよく、映像集合内の映像は、タイムノードと関連付けられた少なくとも1つの画像フレームを含んでもよい。当該サーバのための映像再生装置600は、映像取得ユニットと、ノード情報取得ユニットと、関連付けユニットと、映像追加ユニットと、を更に備えてもよい。ここで、映像取得ユニットは、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するように配置される。ノード情報取得ユニットは、オリジナル映像についてコンテンツプロバイダによって提出された、画像フレーム識別子と音声対話コンテンツとを含む少なくとも1つのタイムノード記述情報を取得するように配置される。関連付けユニットは、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、それによって該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガするように配置される。映像追加ユニットは、タイムノードと関連付けられたオリジナル映像を映像集合内に追加するように配置される。
【0099】
本発明の上述した実施例によって提供されたサーバのための映像再生装置によれば、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止した場合に送信された音声対話コンテンツ取得要求を受信し、その後、音声対話コンテンツ取得要求内のタイムノードの識別子に対応する音声対話コンテンツを確定し、確定された音声対話コンテンツをスマートデバイスに送信することによって、映像再生中におけるスマートデバイスとユーザとの対話型インタラクションが実現された。
【0100】
以下、本発明の実施例を実現するための電子機器(例えば、
図1に示すスマートデバイス101、102、103又はサーバ105)に適用されるコンピュータシステム700を示す構造概略図である
図7を参照する。
図7に示す電子機器は、一例に過ぎず、本発明の実施例の機能及び使用範囲を限定するものではない。
【0101】
図7に示すように、コンピュータシステム700は、読み出し専用メモリ(ROM)702に記憶されているプログラム又は記憶部708からランダムアクセスメモリ(RAM)703にロードされたプログラムによって様々な適当な動作及び処理を実行することができる中央処理装置(CPU)701を一つ以上備える。RAM703には、システム700の動作に必要な様々なプログラム及びデータが更に記憶されている。CPU701、ROM702及びRAM703は、バス704を介して互いに接続されている。入力/出力(I/O)インターフェース705もバス704に接続されている。
【0102】
マイクロホンなどを含む入力部706、有機発光ダイオード(OLED)ディスプレイ、液晶ディスプレイ(LCD)など、及びスピーカなどを含む出力部707、ハードディスクなどを含む記憶部708、並びにLANカード、モデムなどを含むネットワークインターフェースカードの通信部709は、I/Oインターフェース705に接続されている。通信部709は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ710は、必要に応じてI/Oインターフェース705に接続される。リムーバブルメディア711は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ710に取り付けられ、したがって、リムーバブルメディア711から読み出されたコンピュータプログラムが必要に応じて記憶部708にインストールされる。
【0103】
特に、本発明の実施例によれば、上記のフローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータ可読媒体に具現化されるコンピュータプログラムを含むコンピュータプログラム製品を備え、該コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、該コンピュータプログラムは、通信部709を介してネットワークからダウンロードされてインストールされてもよく、及び/又はリムーバブルメディア711からインストールされてもよい。該コンピュータプログラムが中央処理装置(CPU)701によって実行されるとき、本発明の方法で限定された上記の機能が実行される。
【0104】
注意すべきのは、本発明の前記コンピュータ可読媒体は、コンピュータ可読信号媒体又はコンピュータ可読記憶媒体、又はこれらの任意の組み合わせであってもよい。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又はデバイス、又はこれらの任意の組み合わせであることができるが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、一本以上の導線を有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光メモリ、磁気メモリ、又はこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。本発明において、コンピュータ可読記憶媒体は、命令実行システム、装置又はデバイスによって使用可能な、又はそれらに組み込まれて使用可能なプログラムを包含又は記憶する任意の有形の媒体であってもよい。本発明において、コンピュータ可読信号媒体は、ベースバンド内で、又はキャリアの一部として伝搬される、コンピュータ可読プログラムコードが担持されたデータ信号を含んでもよい。このような伝搬されたデータ信号は、様々な形態をとることができ、電磁信号、光信号、又はこれらの任意の適切な組み合わせを含むことができるがこれらに限定されない。コンピュータ可読信号媒体は、更にコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよい。該コンピュータ可読媒体は、命令実行システム、装置、又はデバイスによって使用されるか、又はそれらに組み込まれて使用されるプログラムを、送信、伝搬又は転送することができる。コンピュータ可読媒体に含まれるプログラムコードは任意の適切な媒体で送信することができ、無線、有線、光ケーブル、RFなど、又はこれらの任意の適切な組み合わせを含むがこれらに限定されない。
【0105】
本発明の動作を実行するためのコンピュータプログラムコードは、1種以上のプログラミング言語、又はそれらの組み合わせで作成されることができ、前記プログラミング言語は、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語と、「C」言語又は同様のプログラミング言語などの従来の手続き型プログラミング言語とを含む。プログラムコードは、完全にユーザのコンピュータ上で実行され、部分的にユーザのコンピュータ上で実行され、独立したソフトウェアパッケージとして実行され、一部がユーザのコンピュータ上で一部がリモートコンピュータ上で実行され、又は完全にリモートコンピュータ又はサーバ上で実行されてもよい。リモートコンピュータに関わる場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、又は外部のコンピュータに接続されることができる(例えばインターネットサービスプロバイダによりインターネットで接続される)。
【0106】
図面におけるフローチャート及びブロック図は、本発明の各実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャート又はブロック図における各枠は、1つのモジュール、プログラムセグメント又はコードの一部を表してもよく、該モジュール、プログラムセグメント、又はコードの一部は、規定されたロジック機能を達成するための1つ以上の実行可能な命令を含む。なお、いくつかの代替実施態様において、枠内に示された機能は、図面に示された順番とは異なるもので実行されてもよい。例えば、連続して示された2つの枠は、実際には関連する機能に応じて、ほぼ並行に実行されてもよく、逆の順番で実行されてもよい。なお、ブロック図及び/又はフローチャートにおける各枠、並びに、ブロック図及び/又はフローチャートにおける枠の組み合わせは、規定された機能又は動作を実行する、ハードウェアに基づく専用システムで実現されてもよく、又は、専用ハードウェアとコンピュータ命令との組み合わせで実行されてもよい。
【0107】
本発明の実施例に記載されたユニットは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「プロセッサは、映像一時停止ユニットと、要求送信ユニットと、コンテンツ受信ユニットと、コンテンツ再生ユニットとを備える」ように記載されてもよい。ここで、これらのユニットの名称は、ある場合において当該ユニット自体を限定するものではなく、例えば、映像一時停止ユニットは、「タイムノードと関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するユニット」として記載されてもよい。
【0108】
一方、本発明は、コンピュータ可読媒体を更に提供し、該コンピュータ可読媒体は、前記実施例に記載されたスマート端末又はサーバに含まれるものであってもよく、独立に存在して該スマート端末又はサーバに組み立てられていないものであってもよい。前記コンピュータ可読媒体には一つ以上のプログラムが担持され、上述した一つ以上のプログラムが該スマート端末によって実行されると、該スマート端末は、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するステップであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、タイムノードに対応する音声対話コンテンツを取得するための要求をサーバに送信するステップと、サーバから返された音声対話コンテンツを受信するステップと、受信した音声対話コンテンツを再生するステップと、を行う。上述した一つ以上のプログラムが該サーバによって実行されると、該サーバは、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令の受信に応答してサーバから取得したものであるステップと、タイムノードの識別子に対応する音声対話コンテンツを確定するステップと、受信された音声対話コンテンツをスマートデバイスによって再生するように、確定された音声対話コンテンツをスマートデバイスに送信するステップと、を行う。
【0109】
以上の記載は、本発明の好ましい実施例、及び使用された技術的原理の説明に過ぎない。本発明に係る発明の範囲が、上記の技術的特徴の特定な組み合わせからなる技術案に限定されることではなく、上記の本発明の趣旨を逸脱しない範囲で、上記の技術的特徴又はそれらの同等の特徴を任意に組み合わせたものからなる他の技術案も含むべきであることを、当業者は理解すべきである。例えば、上記の特徴と、本発明に開示された類似の機能を持っている技術的特徴(これらに限定されていない)とを互いに置き換えてなる技術案が挙げられる。
なお、出願当初の特許請求の範囲の記載は以下の通りである。
請求項1:
スマートデバイスに用いられる映像再生方法であって、
タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するステップであって、前記対象映像は、前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、
前記タイムノードに対応する音声対話コンテンツを取得するための要求を前記サーバに送信するステップと、
前記サーバから返された音声対話コンテンツを受信するステップと、
受信した音声対話コンテンツを再生するステップと、を含む、
スマートデバイスに用いられる映像再生方法。
請求項2:
前記方法は、
再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するステップと、
前記音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、
前記音声フィードバック情報が前記事前設定条件を満たすと判定したことに応答して、前記対象映像を引き続き再生するステップと、を更に含む、
請求項1に記載の方法。
請求項3:
前記方法は、前記音声フィードバック情報が前記事前設定条件を満たしていないと判定したことに応答して、事前設定動作を実行するステップを更に含む、
請求項2に記載の方法。
請求項4:
前記音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、
前記音声フィードバック情報を前記サーバに送信して、前記サーバは前記音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、
前記サーバから返された判定結果を受信することと、を含む、
請求項2に記載の方法。
請求項5:
前記サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、映像集合の映像は、
コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、
前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーするステップと、
タイムノードが関連付けられたオリジナル映像を、映像集合に映像集合内の映像として追加するステップと、によって生成される、
請求項1~4のいずれか1項に記載の方法。
請求項6:
サーバに用いられる映像再生方法であって、
スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられる画像フレームまで対象映像が再生されたことを検出して前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令の受信に応答して前記サーバから取得したものであるステップと、
前記タイムノードの識別子に対応する音声対話コンテンツを確定するステップと、
前記スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツを前記スマートデバイスに送信するステップと、を含む、
サーバに用いられる映像再生方法。
請求項7:
前記方法は、
前記スマートデバイスが再生された音声対話コンテンツに対して送信した音声フィードバック情報を受信するステップと、
前記音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、
判定結果を前記スマートデバイスに送信するステップと、を更に含む、
請求項6に記載の方法。
請求項8:
前記サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、
前記方法は、更に、
コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、
前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーするステップと、
タイムノードが関連付けられたオリジナル映像を、映像集合内に追加するステップと、を含む、
請求項6~7のいずれか1項に記載の方法。
請求項9:
スマートデバイスのための映像再生装置であって、
タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである映像一時停止ユニットと、
前記タイムノードに対応する音声対話コンテンツを取得するための要求を前記サーバに送信するように配置される要求送信ユニットと、
前記サーバから返された音声対話コンテンツを受信するように配置されるコンテンツ受信ユニットと、
受信された音声対話コンテンツを再生するように配置されるコンテンツ再生ユニットと、を含む、
スマートデバイスのための映像再生装置。
請求項10:
サーバに用いられる映像再生装置であって、
スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される要求受信ユニットであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して、前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答して前記サーバから取得したものである要求受信ユニットと、
前記タイムノードの識別子に対応する音声対話コンテンツを確定するように配置されるコンテンツ確定ユニットと、
前記スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツを前記スマートデバイスに送信するように配置されるコンテンツ送信ユニットと、を含む、
サーバに用いられる映像再生装置。
請求項11:
電子機器であって、
一つ以上のプロセッサと、
一つ以上のプログラムが記憶される記憶装置と、を備え、
前記一つ以上のプログラムが前記一つ以上のプロセッサによって実行されると、前記一つ以上のプロセッサに請求項1~5のいずれか一項に記載の方法、又は請求項6~8のいずれか一項に記載の方法を実現させる、
電子機器。
請求項12:
コンピュータプログラムが記憶されるコンピュータ可読媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1~5のいずれか一項に記載の方法、又は請求項6~8のいずれか一項に記載の方法を実現する、
コンピュータ可読媒体。