特許6411274 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許6411274タイミング補正システム、その方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6411274

(24)【登録日】2018年10月5日

(45)【発行日】2018年10月24日

(54)【発明の名称】タイミング補正システム、その方法及びプログラム

(51)【国際特許分類】

G09G 5/377 20060101AFI20181015BHJP

G09G 5/00 20060101ALI20181015BHJP

H04N 21/431 20110101ALI20181015BHJP

H04N 7/173 20110101ALI20181015BHJP

【ＦＩ】

G09G5/36 520M

G09G5/00 510H

G09G5/00 550B

H04N21/431

H04N7/173 610Z

【請求項の数】11

【全頁数】14

(21)【出願番号】特願2015-80590(P2015-80590)

(22)【出願日】2015年4月10日

(65)【公開番号】特開2016-200711(P2016-200711A)

(43)【公開日】2016年12月1日

【審査請求日】2017年4月25日

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(74)【代理人】

【識別番号】100121706

【弁理士】

【氏名又は名称】中尾直樹

(74)【代理人】

【識別番号】100128705

【弁理士】

【氏名又は名称】中村幸雄

(74)【代理人】

【識別番号】100147773

【弁理士】

【氏名又は名称】義村宗洋

(72)【発明者】

【氏名】鎌本優

(72)【発明者】

【氏名】白木善史

(72)【発明者】

【氏名】佐藤尚

(72)【発明者】

【氏名】ガブリエルパブロナバ

(72)【発明者】

【氏名】守谷健弘

【審査官】小野健二

(56)【参考文献】

【文献】特開２０１３−０８９０５２（ＪＰ，Ａ）

【文献】特開２００４−１９３８７１（ＪＰ，Ａ）

【文献】特開２００６−１５７６８９（ＪＰ，Ａ）

【文献】特開２００６−１５７６８７（ＪＰ，Ａ）

【文献】特開２００７−２７４０９０（ＪＰ，Ａ）

【文献】特開２００８−１４８０７１（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０９Ｇ５／００−５／４２

Ｈ０４Ｎ７／１７３

Ｇ０６Ｆ３／０４８

(57)【特許請求の範囲】

【請求項1】

所定の行為とその所定の行為を意味する視覚情報とが対応付けて記憶される記憶部と、
対象映像信号を見るものによって入力され、その対象映像信号に重畳して表示される視覚情報が、前記記憶部に記憶される視覚情報と一致するか否かを判定し、一致する場合には、前記対象映像信号に重畳して表示される視覚情報、前記対象映像信号に重畳して表示される視覚情報に対応する所定の行為、及び前記対象映像信号に重畳して表示される視覚情報の入力時刻を含むメタデータを検出するキー入力検出部と、
(i)前記対象映像信号、(ii)前記対象映像信号に対応する対象音響信号、並びに、(iii)前記対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及び前記既に入力済みの他の視覚情報のメタデータの少なくとも何れかから、前記キー入力検出部で検出された視覚情報の意味する行為の基準となるタイミングである基準タイミングを検出するタイミング検出部と、
前記キー入力検出部で検出された視覚情報を表示部に表示するためのタイミングを、前記基準タイミングに基づき補正する補正部とを含み、
前記記憶部に記憶される所定の行為を意味する視覚情報は前記補正部で補正された前記基準タイミングで前記対象映像信号に重畳される、
タイミング補正システム。

【請求項2】

請求項１のタイミング補正システムであって、
前記タイミング検出部は、
(1)(i)前記対象映像信号に一定のテンポがある場合の当該テンポ、
(2)(ii)前記対象音響信号に一定のテンポがある場合の当該テンポ、
(3)(i)前記対象映像信号から抽出された特徴量と、予め所定の行為を撮影した映像信号から抽出した特徴量との類似度が閾値以上である場合の、所定の時間区間毎の代表値、
(4)(ii)前記対象音響信号から抽出された特徴量と、予め所定の行為を撮影した映像信号に対応する音響信号から抽出した特徴量との類似度が閾値以上である場合の、所定の時間区間毎の代表値、
の少なくとも何れかを前記基準タイミングとして検出する、
タイミング補正システム。

【請求項3】

請求項１のタイミング補正システムであって、
前記タイミング検出部は、少なくとも複数の(iii)前記対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及び前記既に入力済みの他の視覚情報のメタデータの統計量に基づいて基準タイミングを求めるものであり、
既に入力済みの他の視覚情報のうち、前記キー入力検出部で検出したメタデータに含まれる所定の行為と一致する行為を意味する前記既に入力済みの他の視覚情報それぞれの表示時刻を抽出し、所定の時間区間毎に、抽出した表示時刻の前記所定の時間区間毎の最頻値を前記基準タイミングとして検出することを特徴とする、
タイミング補正システム。

【請求項4】

請求項１のタイミング補正システムであって、
前記タイミング検出部は、少なくとも複数の(iii)前記対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及び前記既に入力済みの他の視覚情報のメタデータの統計量に基づいて基準タイミングを求めるものであり、
既に入力済みの他の視覚情報のうち、前記キー入力検出部で検出したメタデータに含まれる所定の行為と一致する行為を意味する前記既に入力済みの他の視覚情報それぞれの表示時刻を抽出し、抽出した表示時刻を用いて、所定の時間区間毎に、表示時刻の平均値と分散とを求め、前記求めた平均値と分散とを持つガウス分布に従う乱数を基準タイミングとする、
タイミング補正システム。

【請求項5】

請求項１から請求項３の何れかのタイミング補正システムであって、
前記タイミング検出部は、所定の行為の種類ごとに生じる分散の値を予め求めておき、前記基準タイミングを中心として、求めておいた分散のうちの、前記キー入力検出部で検出したメタデータに含まれる所定の行為に対応する分散のガウス分布に従う乱数を新たな基準タイミングとする、
タイミング補正システム。

【請求項6】

記憶部には、所定の行為とその所定の行為を意味する視覚情報とが対応付けて記憶されているものとし、
キー入力検出部が、対象映像信号を見るものによって入力され、その対象映像信号に重畳して表示される視覚情報が、前記記憶部に記憶される視覚情報と一致するか否かを判定し、一致する場合には、前記対象映像信号に重畳して表示される視覚情報、前記対象映像信号に重畳して表示される視覚情報に対応する所定の行為、及び前記対象映像信号に重畳して表示される視覚情報の入力時刻を含むメタデータを検出するキー入力検出ステップと、
タイミング検出部が、(i)前記対象映像信号、(ii)前記対象映像信号に対応する対象音響信号、並びに、(iii)前記対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及び前記既に入力済みの他の視覚情報のメタデータの少なくとも何れかから、前記キー入力検出ステップで検出された視覚情報の意味する行為の基準となるタイミングである基準タイミングを検出するタイミング検出ステップと、
補正部が、前記キー入力検出ステップで検出された視覚情報を表示部に表示するためのタイミングを、前記基準タイミングに基づき補正する補正ステップとを含み、
前記記憶部に記憶される所定の行為を意味する視覚情報は前記補正ステップで補正された前記基準タイミングで前記対象映像信号に重畳される、
タイミング補正方法。

【請求項7】

請求項６のタイミング補正方法であって、
前記タイミング検出ステップにおいて、
(1)(i)前記対象映像信号に一定のテンポがある場合の当該テンポ、
(2)(ii)前記対象音響信号に一定のテンポがある場合の当該テンポ、
(3)(i)前記対象映像信号から抽出された特徴量と、予め所定の行為を撮影した映像信号から抽出した特徴量との類似度が閾値以上である場合の、所定の時間区間毎の代表値、
(4)(ii)前記対象音響信号から抽出された特徴量と、予め所定の行為を撮影した映像信号に対応する音響信号から抽出した特徴量との類似度が閾値以上である場合の、所定の時間区間毎の代表値、
の少なくとも何れかを前記基準タイミングとして検出する、
タイミング補正方法。

【請求項8】

請求項６のタイミング補正方法であって、
前記タイミング検出ステップは、少なくとも複数の(iii)前記対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及び前記既に入力済みの他の視覚情報のメタデータの統計量に基づいて基準タイミングを求めるものであり、
既に入力済みの他の視覚情報のうち、前記キー入力検出ステップで検出したメタデータに含まれる所定の行為と一致する行為を意味する前記既に入力済みの他の視覚情報それぞれの表示時刻を抽出し、所定の時間区間毎に、抽出した表示時刻の前記所定の時間区間毎の最頻値を前記基準タイミングとして検出することを特徴とする、
タイミング補正方法。

【請求項9】

請求項６のタイミング補正方法であって、
前記タイミング検出ステップは、少なくとも複数の(iii)前記対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及び前記既に入力済みの他の視覚情報のメタデータの統計量に基づいて基準タイミングを求めるものであり、
既に入力済みの他の視覚情報のうち、前記キー入力検出部で検出したメタデータに含まれる所定の行為と一致する行為を意味する前記既に入力済みの他の視覚情報それぞれの表示時刻を抽出し、抽出した表示時刻を用いて、所定の時間区間毎に、表示時刻の平均値と分散とを求め、前記求めた平均値と分散とを持つガウス分布に従う乱数を基準タイミングとする、
タイミング補正方法。

【請求項10】

請求項６から請求項８の何れかのタイミング補正方法であって、
前記タイミング検出ステップは、所定の行為の種類ごとに生じる分散の値を予め求めておき、前記基準タイミングを中心として、求めておいた分散のうちの、前記キー入力検出ステップで検出したメタデータに含まれる所定の行為に対応する分散のガウス分布に従う乱数を新たな基準タイミングとする、
タイミング補正方法。

【請求項11】

請求項１から請求項５の何れかのタイミング補正システムとしてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、映像を見るものによって入力されるテキスト情報を、その映像に重畳して表示する技術に関する。

【背景技術】

【0002】

映像を見るものによって入力されるテキスト情報を、その映像に重畳して表示する技術の従来技術として非特許文献１が知られている。非特許文献１では、視聴者は、動画を視聴しながら、コメントを投稿することができる。

【先行技術文献】

【非特許文献】

【0003】

【非特許文献1】「動画の視聴コメントの投稿」、[online]、NIWANGO.INC、[平成27年2月2日検索]、インターネット<URL : http://info.nicovideo.jp/help/player/howto/>

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、従来技術では、動画に対してコメントしたいと思ってから、コメントを入力し、コメント投稿ボタンをクリックまたはエンターキーを押下する必要があるため、視聴者がコメントしたいと思ったタイミングから遅れてコメントが表示される場合がある。逆に動画の内容を予め知っている場合には、予めコメントを入力しておき、コメント投稿ボタンをクリックまたはエンターキーを押下するタイミングを視聴者が図ることもできるが、その場合であっても、視聴者がコメントしたいと思ったタイミングよりも早くなったり、または、遅くなったりする場合がある。例えば、ミュージックビデオやライブ映像の楽曲のテンポに合わせて、拍手を意味するテキスト情報「８」をコメントする場合、実際に拍手する場合よりも、ズレてしまう場合が多い、または、ズレ幅が大きくなりやすい。

【0005】

本発明は、コメントを映像に重畳して表示する際のタイミングを、映像に合わせて補正するタイミング補正システム、その方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

上記の課題を解決するために、本発明の一態様によれば、タイミング補正システムは、対象映像信号を見るものによって入力され、その対象映像信号に重畳して表示され、所定の行為を意味する視覚情報及びその視覚情報の入力時刻を含むメタデータを検出するキー入力検出部と、(i)対象映像信号、(ii)対象映像信号に対応する対象音響信号、並びに、(iii)対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及びそのメタデータの少なくとも何れかから、キー入力検出部で検出された視覚情報の意味する行為の基準となるタイミングである基準タイミングを検出するタイミング検出部と、キー入力検出部で検出された視覚情報を表示部に表示するためのタイミングを、基準タイミングに基づき補正する補正部とを含む。

【0007】

上記の課題を解決するために、本発明の他の態様によれば、タイミング補正方法は、キー入力検出部が、対象映像信号を見るものによって入力され、その対象映像信号に重畳して表示され、所定の行為を意味する視覚情報及びその視覚情報の入力時刻を含むメタデータを検出するキー入力検出ステップと、タイミング検出部が、(i)対象映像信号、(ii)対象映像信号に対応する対象音響信号、並びに、(iii)対象映像信号に重畳して表示されている既に入力済みの他の視覚情報及びそのメタデータの少なくとも何れかから、キー入力検出ステップで検出された視覚情報の意味する行為の基準となるタイミングである基準タイミングを検出するタイミング検出ステップと、補正部が、キー入力検出ステップで検出された視覚情報を表示部に表示するためのタイミングを、基準タイミングに基づき補正する補正ステップとを含む。

【発明の効果】

【0008】

本発明によれば、コメントを映像に重畳して表示する際のタイミングを、映像に合わせて補正することができるという効果を奏する。

【図面の簡単な説明】

【0009】

【図1】第一実施形態に係るタイミング補正システムの機能ブロック図。

【図2】第一実施形態に係るタイミング補正システムの処理フローの例を示す図。

【図3】キー入力検出部の備える記憶部に記憶されるデータの例を示す図。

【図4】補正部の補正例を示す図。

【図5】テキスト情報txt_in(r)が入力時刻t_in(r)に表示部の右端から表示され、左端に向かって、移動し、左端から消えていく場合の例を示す図。

【図6】テキスト情報txt_in(q)がタイミングt_out(q)に表示部の右端から表示され、左端に向かって、移動し、左端から消えていく場合の例を示す図。

【発明を実施するための形態】

【0010】

以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。

【0011】

＜第一実施形態に係る動画配信システム１＞
図１は第一実施形態に係るタイミング補正システム１００の機能ブロック図を、図２はその処理フローを示す。

【0012】

動画配信システム１は、１台以上の視聴者端末９１と、タイミング補正システム１００と、対象映像信号を視聴者端末９１に配信する動画配信サーバ９２とを含む。各視聴者端末９１、タイミング補正システム１００及び動画配信サーバ９２は、通信回線を介して通信可能とされている。なお、動画配信システム１に含まれる各視聴者端末９１、タイミング補正システム１００、動画配信サーバ９２は、NTP(Network Time Protocol)等により、時刻を同期しておくことが望ましい。

【0013】

＜視聴者端末９１＞
視聴者端末９１は、対象映像信号(例えば、動画)を見るもの(例えば、動画の視聴者)によって操作され、入力部（キーボード、マウス、タッチパネル等）と、表示部（ディスプレイ、タッチパネル等）とを含み、例えば、パーソナルコンピュータ、スマートホン、タブレット等からなる。視聴者は、視聴者端末９１の入力部を介して、動画配信サーバ９２に対して対象映像の再生を要求することができる。また、視聴者端末９１の表示部を介して、対象映像信号を視聴することができる。さらに、視聴者は、入力部を介して、対象映像信号に重畳して表示されるテキスト情報（例えば、コメント）を入力することができる。視聴者端末９１は、テキスト情報が入力されると、例えばシステム時刻に基づき入力時刻を取得して、メタデータとしてテキスト情報と一緒に送信する。

【0014】

＜動画配信サーバ９２＞
動画配信サーバ９２は、動画データベース及びビデオカメラから動画を受け取り、視聴者端末９１の要求に応じて、動画データベース内に格納されている動画、または、ビデオカメラで収録した動画をリアルタイムで配信する。また、ビデオカメラで収録された動画に限らず、リアルタイムで合成・編集されたＣＧやモーションキャプチャ等から合成されたＣＧをリアルタイム配信することもある。なお、本実施形態において、動画とは、時間軸に同期させた音響信号と共に提供される映像信号を意味する。動画データベースには、動画と共に動画に付加されたテキスト情報が記憶される。さらに、テキスト情報にはメタデータが付加されている。メタデータとしては、テキスト情報の入力時刻、テキスト情報の大きさ、その色、その出現方法、その移動速度や、移動位置等がある。例えば、大きさ、色、出現方法、移動速度、移動位置等は、テキスト情報の入力者が選択できるものとしてもよく、視聴者端末９１がメタデータとしてテキスト情報と一緒に送信し、動画データベースに動画と共に記憶される。

【0015】

＜タイミング補正システム１００＞
タイミング補正システム１００は、テキスト情報txt_in(p)とそのそのテキスト情報の入力時刻t_in(p)を示すメタデータ及びテキスト情報付の対象映像信号が入力され、テキスト情報txt_in(p)とそのテキスト情報を表示部(例えばディスプレイ)に表示するためのタイミングt_in(p)またはt_out(p)を含むメタデータとを出力する。なお、pは入力されるテキスト情報全てに付与されるインデックスを示す。なお、テキスト情報txt_in(p)は、対象映像信号を見るものによって入力され、その対象映像信号に重畳して表示されるものある。

【0016】

タイミング補正システム１００は、キー入力検出部１１０と、タイミング検出部１２０と、補正部１３０とを含む。

【0017】

＜キー入力検出部１１０＞
キー入力検出部１１０は、テキスト情報txt_in(p)とそのテキスト情報の入力時刻t_in(p)とを受け取り、所定の行為を意味するテキスト情報txt_in(q)及びそのテキスト情報の入力時刻t_in(q)を含むメタデータを検出し（Ｓ１１０）、出力する。なお、qは所定の行為を意味するテキスト情報全てに付与されるインデックスを示す。入力される全てのテキスト情報の個数をPとし、入力されるテキスト情報の内、所定の行為を意味するテキスト情報の個数をQとすると、P≧Qであり、p=1,2,…,P、q=1,2,…,Qである。

【0018】

例えば、キー入力検出部１１０は図示しない記憶部を備え、記憶部には所定の行為とその所定の行為を意味するテキスト情報とが対応付けて記憶される（図３参照）。キー入力検出部１１０は、受け取ったテキスト情報txt_in(p)と記憶部に記憶されるテキスト情報とが一致するか否かを判定し、一致する場合には、対応するテキスト情報txt_in(q)と所定の行為（または、所定の行為を示すインデックス）と入力時刻t_in(q)とを、補正部１３０に出力する。一方、一致しない場合には、対応するテキスト情報txt_in(r)と入力時刻t_in(r)とを、動画配信サーバ９２に出力する。なお、rは所定の行為を意味するテキスト情報以外の全てのテキスト情報に付与されるインデックスを示す。入力されるテキスト情報の内、所定の行為を意味するテキスト情報以外のテキストの個数をRとすると、P=Q+Rであり、r=1,2,…,Rである。

【0019】

＜タイミング検出部１２０＞
タイミング検出部１２０は、動画配信サーバ９２から(i)対象映像信号、(ii)対象映像信号に対応する対象音響信号、並びに、(iii)対象映像信号に重畳して表示される既に入力済みの他のテキスト情報及びそのメタデータの少なくとも何れかを受け取る。例えば、テキスト情報付きの動画には(i)〜(iii)の全てが含まれる。

【0020】

タイミング検出部１２０は、(i)〜(iii)の少なくとも何れかから、キー入力検出部１１０で検出されたテキスト情報の意味する行為の基準となるタイミングである基準タイミングt_out(s)を検出し（Ｓ１２０）、出力する。なお、sは(i)〜(iii)の少なくとも何れかに含まれる所定の行為に出現番号を表すインデックスを示し、s=1,2,…,Sであり、Sは(i)〜(iii)の少なくとも何れかに含まれる所定の行為の出現回数である。

【0021】

基準タイミングt_out(s)を検出する方法としては、テキスト情報の意味する行為に応じて様々な方法が考えられる。

【0022】

例えば、テキスト情報の意味する行為が「拍手」の場合に基準タイミングを検出する方法を、用いるデータに応じて例示する。テキスト情報の意味する行為が「拍手」の場合、さらに、テキスト情報の意味する行為として、一定のテンポに合わせて行う「手拍子(clap)」と、一定のテンポを持たず行う「拍手(applause)」とが考えられる。なお、以下、単に「拍手」といった場合、一定のテンポを持たず行う「拍手(applause)」を意味するものとする。「手拍子」と「拍手」とは、手を叩く時間的間隔や音量的差異が異なるため（参考文献１）、例えば、(ii)対象映像信号に対応する対象音響信号等に基づいて、テキスト情報が何れの行為を意味するのかを判別することができる。
（参考文献１）鎌本優，河原一彦，尾本章，守谷健弘，「音楽鑑賞時に励起される拍手音・手拍子音の低遅延伝送に向けた基礎的検討」、日本音響学会 2014年秋季研究発表会, 1-Q-17、2014年.
この実施形態では、テキスト情報の意味する行為が「手拍子」の場合の、基準タイミングの検出方法について説明する。

【0023】

(i)行為が「手拍手」であり、データが対象映像信号の場合
対象映像信号に一定のテンポがある場合には、そのテンポに合わせて拍手すると仮定し、テンポを基準タイミングとして検出する（参考文献２参照）。
（参考文献２）三上弾、松本鮎美、門田浩二、川村春美、小島明、「動作学習のための遅延同期ビデオフィードバックシステム」、情報処理学会、情報処理学会論文誌コンシューマ・デバイス＆システム、２０１４年、vol.4、No.1、pp22-31.
(ii)行為が「手拍手」であり、データが対象音響信号の場合
対象音響信号に一定のテンポがある場合には、そのテンポに合わせて拍手すると仮定し、テンポを基準タイミングとして検出する（参考文献２〜参考文献５参照）。
(参考文献３)角尾衣未留,宮本賢一,小野順貴,嵯峨山茂樹,“調波音・打楽器音分離手法を用いた音楽音響信号からのリズム特徴量の抽出”,日本音響学会春季研究発表会講演集,Mar.2008,pp.905-906.
(参考文献４)角尾衣未留,小野順貴,嵯峨山茂樹,“リズムマップ：音楽音響信号からの単位リズムパターンの抽出と楽曲構造の解析”,情報処理学会研究報告,Aug.2008,vol.2008-MUS-76,no.25,pp.149-154.
（参考文献５）角尾衣未留,小野順貴,嵯峨山茂樹,“和声境界を考慮した単位リズムパターンの抽出に基づく音楽音響信号の小節境界推定”,日本音響学会秋季研究発表会講演集,Sep.2009,no.3-5-10,pp.897-898.
(iii)行為が「手拍手」であり、データが対象映像信号に重畳して表示される既に入力済みの他のテキスト情報及びそのメタデータの場合
例えば、タイミング検出部１２０は、入力済みの他のテキスト情報の中から、キー入力検出部１１０で検出されたテキスト情報の意味する行為と同じ行為を意味する他のテキスト情報を抽出する。例えば、図示しない記憶部（図３参照）を参照して、タイミング検出部１２０は、受け取った入力済みの他のテキスト情報と、記憶部に記憶され、キー入力検出部１１０で検出されたテキスト情報の意味する行為に対応するテキスト情報とが一致するか否かを判定し、一致する場合には、その表示時刻とを、抽出する。

【0024】

タイミング検出部１２０は、抽出した表示時刻の統計量に基づいて基準タイミングを求める。例えば、抽出した表示時刻を用いて、所定の時間区間(例えば、動画がミュージックビデオであり、曲のテンポが148BPM(Beats per Minutes)の場合、一拍の間隔は405ms程度なので、所定の時間区間を405msとする)毎に、時間区間毎の代表値(平均値、最頻値、最小値及び最大値等の複数の表示時刻を代表する何らかの値)を求め、基準タイミングとして検出する。例えば、抽出した表示時刻を用いて、ヒストグラムを作成し、多数決により基準タイミングを求める。つまり、最頻値を基準タイミングとする。

【0025】

(タイミングに揺らぎを与える方法)
拍手のタイミングにゆらぎを与えてもよい(参考文献１参照)。

【0026】

例えば、(iii)の場合、抽出した表示時刻を用いて、所定の時間区間毎に、表示時刻の平均値と分散とを求め、その平均値と分散とを持つガウス分布に従う乱数を基準タイミングとしてもよい。この方法により、拍手のタイミングにゆらぎを与えることができ、より自然なタイミングで所定の行動に対応するテキスト情報を表示することができる。

【0027】

なお、同様の方法により、分散を求め、(i),(ii)の方法と組合せてもよい。例えば、(i),(ii)の方法で基準タイミングを求め、その基準タイミングを中心として、求めた分散を持つガウス分布に従う乱数を新たな(最終的に用いる)基準タイミングとする。このような方法により、より自然なタイミングで所定の行動に対応するテキスト情報を表示することができる。

【0028】

また、予め手拍子を行う際に一般的に生じる分散の値を求めておき、その分散に基づき、基準タイミングを求めてもよい。例えば、(i),(ii),(iii)の方法で基準タイミングを求め、その基準タイミングを中心として、手拍子を行う際に一般的に生じる分散を持つガウス分布に従う乱数を新たな(最終的に用いる)基準タイミングとする。

【0029】

(行為が「手拍子」以外の場合について)
なお、データが(iii)対象映像信号に重畳して表示される既に入力済みの他のテキスト情報及びそのメタデータの場合には、行為が「手拍子」以外の行為であっても容易に適用することができる。例えば、行為が「拍手」または「笑い」の場合、所定の時間区間を一連の行為「拍手」または「笑い」が、継続しうる最大の時間に設定する。例えば、何らかの事象に対して、「拍手」を送るのは、長くとも30秒程度であろうと想定される場合、最初に、「拍手」を意味する他のテキスト情報が表示されてから１分以内に表示される「拍手」を意味する他のテキスト情報から代表値を求め、基準タイミングとして検出する。前述の方法により「拍手」や「笑い」のタイミングにゆらぎを与えてもよい。

【0030】

ただし、初めて対象映像信号を配信する場合（対象映像信号にテキスト情報が付加されていない場合）、または、ビデオカメラで収録した動画をリアルタイムで配信する場合は、対象映像信号に既に入力済みの他のテキスト情報がないので、(iii)を用いることはできない。

【0031】

(i)対象映像信号、または、(ii)対象音響信号から「手拍子」以外の行為の基準タイミングを検出する方法としては、例えば、予め所定の行為（例えば「拍手」「笑い」）を撮影した映像信号または音響信号から特徴量を抽出し、図示しない記憶部に記憶しておく。さらに、動画配信サーバ９２から受け取った(i)対象映像信号、または、(ii)対象音響信号から特徴量を取り出し、記憶部に記憶されている特徴量との類似度を求め、類似度が閾値以上となる場合に、所定の行為が行われていると判断し、代表値を求め、基準タイミングとして検出する。例えば、既存の顔認証技術を応用し、(i)対象映像信号から笑顔を検出し、検出した時刻から「笑い」の基準タイミングを求めてもよい。また、例えば、動画圧縮用の特徴量である動き補償ベクトル（参考文献６参照）を利用してもよい。
(参考文献６)村上篤道、浅井光太郎、関口俊一、「高効率映像符号化技術 HEVC/H.265とその応用」、オーム社、２０１３年、p.20-28,125-132
予め「拍手」を撮影した映像信号を圧縮符号化して動き補償ベクトルの時系列を取得し、図示しない記憶部に記憶しておく。さらに、動画配信サーバ９２から受け取った(i)対象映像信号を圧縮符号化して動き補償ベクトルの時系列を取得し（そもそも(i)対象映像信号が圧縮符号化されているものであれば動き補償ベクトルが含まれるため、それをそのまま利用すればよい）、記憶部に記憶されている動き補償ベクトルの時系列との類似度を求めればよい。

【0032】

＜補正部１３０＞
補正部１３０は、所定の行為を意味するテキスト情報txt_in(q)及びそのテキスト情報の入力時刻t_in(q)を含むメタデータと、基準タイミングt_out(s)とを受け取り、キー入力検出部１１０で検出されたテキスト情報を表示部に表示するためのタイミングを、基準タイミングt_out(s)に基づき補正し（Ｓ１３０）、テキスト情報txt_in(q)とそのテキスト情報を表示するためのタイミングt_out(q)を含むメタデータとを動画配信サーバ９２に出力する。例えば、S個のt_out(s)の中から最もt_in(q)に近いt_out(s)を、テキスト情報txt_in(q)を表示するためのタイミングt_out(q)とする(t_out(q)←t_out(s))。例えば、テキスト情報txt_in(q)が「８」の場合の例を図４に示す。

【0033】

なお、動画配信サーバ９２は、対象映像信号にテキスト情報を重畳して出力する。動画配信サーバ９２は、テキスト情報txt_in(q)またはtxt_in(r)を、それぞれタイミングt_out(q)または入力時刻t_in(r)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。例えば、テキスト情報txt_in(p)がタイミングt_out(q)または入力時刻t_in(r)に表示部の右端から表示され、左端に向かって、移動し、左端から消えていく場合、補正されていない場合（入力時刻t_in(r)に表示）の例を図５に示し、補正されている場合（タイミングt_out(q)に表示）の例を図６に示す。

【0034】

＜タイミングt_out(q)の適用時期について＞
なお、動画配信サーバ９２は、テキスト情報txt_in(q)をタイミングt_out(q)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信するタイミングとして二つのタイミング考えられる。

【0035】

(1)視聴者がテキスト情報txt_in(q)を入力した際、その再生時においては、テキスト情報txt_in(q)を入力時刻t_in(q)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。そして、動画配信サーバ９２は、動画データベース内に、対象映像信号とともにテキスト情報txt_in(q)と(入力時刻t_in(q)ではなく)タイミングt_out(q)とを格納しておき、次の再生時には、テキスト情報txt_in(q)をタイミングt_out(q)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。

【0036】

(2)視聴者がテキスト情報txt_in(q)を入力した際、その再生時において、テキスト情報txt_in(q)をタイミングt_out(q)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。この場合、タイミングt_out(q)と入力時刻t_in(q)との大小関係に応じて配信方法が異なる。

【0037】

(2-A)タイミングt_out(q)が入力時刻t_in(q)よりも遅い場合には、テキスト情報txt_in(q)をタイミングt_out(q)で表示部に表示されるように、表示のタイミングを遅らせて、対象映像信号とともに配信すればよい。

【0038】

(2-B)タイミングt_out(q)が入力時刻t_in(q)よりも早い場合には、以下の方法により、配信する。

【0039】

(2-B-1)例えば、図５及び図６のように、テキスト情報txt_in(q)の表示方法が時間の経過を表す場合には、その時間の経過を利用し、テキスト情報txt_in(q)がまるでタイミングt_out(q)で表示されたように、対象映像信号とともに配信する。例えば、図６の場合、タイミングt_out(q)が入力時刻t_in(q)よりも早いので、t=t_out(q)のとき（図６の一番の上の図）、動画配信サーバ９２は、テキスト情報txt_in(q)を受け取っていないため、テキスト情報txt_in(q)を表示されるように、配信することができない。テキスト情報txt_in(q)を受け取ったタイミング(入力時刻t=t_in(q))で、仮に、タイミングt_out(q)で視聴者端末９１の表示部に表示されていた場合、t=t_in(q)においてテキスト情報txt_in(q)が表示される位置にテキスト情報txt_in(q)を表示する。つまり、図６の一番の上の図から図６の真ん中の図までのテキスト情報txt_in(q)の移動（遷移）を表示せずに、t=t_in(q)において、突然、テキスト情報txt_in(q)を図６の真ん中の図のように表示し、図６の一番の下の図までテキスト情報txt_in(q)の移動させる。なお、この場合、動画配信サーバ９２は、動画データベース内に、対象映像信号とともにテキスト情報txt_in(q)とタイミングt_out(q)とを格納しておき、次の再生時には、テキスト情報txt_in(q)をタイミングt_out(q)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。

【0040】

(2-B-2)また、テキスト情報が示す所定の行為が、手拍子などの周期的な行為の場合には、取得したテキスト情報txt_in(q)を次の周期で表示する。つまり、テキスト情報txt_in(q)をタイミングt_out(q+1)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。なお、この場合、動画配信サーバ９２は、動画データベース内に、対象映像信号とともにテキスト情報txt_in(q)とタイミングt_out(q)とを格納してもよいし、テキスト情報txt_in(q)とタイミングt_out(q+1)とを格納してもよい。次の再生時には、テキスト情報txt_in(q)をタイミングt_out(q)またはタイミングt_out(q+1)で視聴者端末９１の表示部に表示されるように、対象映像信号とともに配信する。

【0041】

＜効果＞
このような構成により、テキスト情報を映像に重畳して表示する際のタイミングを、映像に合わせて補正することができる。例えば、楽曲のテンポに合わせる場合には、テキスト情報の表示のタイミングを合わせることで、視聴者の一体感を向上させることができる。

【0042】

＜変形例＞
本実施形態では、タイミング補正システム１００を視聴者端末９１または動画配信サーバ９２とは別装置として構成したが、視聴者端末９１または動画配信サーバ９２に組み込まれる構成としてもよい。また、タイミング補正システム１００は、キー入力検出部１１０と、タイミング検出部１２０と、補正部１３０とを含み、独立した装置として説明したが、各部が視聴者端末９１または動画配信サーバ９２に組み込まれる構成としてもよい。例えば、キー入力検出部１１０を視聴者端末９１に組み込み、タイミング検出部１２０と補正部１３０とを動画配信サーバ９２に組み込む構成としてもよい。

【0043】

また、動画配信サーバ９２は、テキスト情報を付加せずに動画のみを配信するサーバであってもよい。その場合には、タイミング補正システム１００においてテキスト情報用のデータベースを備え、テキスト情報を付加すればよい。

【0044】

本実施形態では、視聴者によって入力され、対象映像信号に重畳して表示される情報としてテキスト情報の例を示したが、他の視覚情報であってもよい。ここで、「視覚情報」とは、表示部を介して視覚的に認識可能な情報であって、例えば、文字、図形若しくは記号若しくはこれらの結合又はこれらと色彩との結合である。また、静止画に限らず、動く画像であってもよい。例えば、(1)本実施形態のように、「笑い」や「拍手」等の所定の行為を意味するテキスト情報（例えば「ｗ」や「８」等）、(2)テキスト情報以外の「笑い」や「拍手」等の所定の行為を意味し、識別するためのコンピュータ上のビット情報、(3)顔文字、絵文字等、通常のテキスト情報で無いもの。例えば、キャリアの異なる携帯電話間で共通絵文字(参考文献７参照)、(4)アスキーアート等，全体としてはテキスト情報とテキスト情報の配置情報を用いた絵のようになっているもの（参考文献８参照）、(5)上述の(1)〜(4)に対応するネットスラング。例えば、「笑い」を意味するテキスト情報「ｗｗｗｗｗ…」に対して「草生えた」等のネットスラングがある。
（参考文献７）「docomo／au共通絵文字」、株式会社NTTドコモ、[online]、[平成27年2月9日検索]、インターネット<URL: https://www.nttdocomo.co.jp/service/developer/smart_phone/make_contents/pictograph/>
（参考文献８）「アスキーアート」、[online]、2015年2月2日、ウィキペディア、[平成27年2月9日検索]、インターネット<URL: http://ja.wikipedia.org/wiki/%E3%82%A2%E3%82%B9%E3%82%AD%E3%83%BC%E3%82%A2%E3%83%BC%E3%83%88>

【0045】

＜その他の変形例＞
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

【0046】

＜プログラム及び記録媒体＞
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

【0047】

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

【0048】

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。

【0049】

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

【0050】

また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6411274号(P6411274)IP Force 特許公報掲載プロジェクト 2022.1.31 β版