(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
<本実施形態を想到するに至った経緯>
本発明者らは、ユーザの指定に基づいて抽出した、あるいは自動的に抽出したシーンをつなぐことによって、ハイライト動画を作成することを検討した。
【0010】
しかし、抽出したシーンをそのままつないで作成したハイライト動画は、全体の長さが短すぎて内容把握が難しかったり、長すぎて冗長であったりすることがあり、必ずしもユーザが満足するものにならない。
【0011】
本実施の形態はこのような背景の元になされたものであって、主にハイライト動画の作成のために、前記シーンの長さを最適な長さに調整することを目的とする。
【0012】
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
<情報処理装置の構成>
図1は、実施の形態1に係る情報処理装置10の構成を示す図である
情報処理装置10は、ユーザ入力受付部12、ハイライトシーン抽出部14、優先度付与部16、ハイライト動画作成部18(長さ調整部20を含む)、記憶部22、管理部24、デコード部26、表示制御部28を備える。
【0013】
ユーザ入力受付部12は、リモコン2を介してユーザの入力を受け付ける機能を有する。
【0014】
リモコン2は、動画の再生など(再生開始、再生停止、スキップ、早送り、巻き戻しなど)を指示するための複数のボタン、及びユーザがハイライト動画として希望するシーンを指定するためのボタンを含む。
【0015】
ユーザが前記シーンを指定する方法としては、前記シーンの始点及び終点を手動で指定しても良いし、前記シーンの一部分を指定しても良い。
【0016】
本実施の形態では、ユーザが後者の指定を行うとして説明する。具体的には、ユーザは面白いと感じた時に前記ハイライト動画として希望するシーンを指定するためのボタンを押下して「マーク」を入力する。ここでマークは、ユーザが面白いと感じた動画、及びその再生位置を識別するための情報から構成される。
【0017】
このようなマークは、前述のように、ユーザが指定したものであってもよく、情報処理装置10またはその他の機器が、動画を解析することにより自動的に指定したものであってもよい。実施の形態1では、マークはユーザが指定したものである場合を例として説明する。
【0018】
リモコン2においてボタンが押下されると、リモコン2はユーザ入力受付部12へとユーザの指示内容を示す情報を送信する。
【0019】
ユーザ入力受付部12は、受信した情報に示される指示内容をユーザの入力として受け付ける。
【0020】
ハイライトシーン抽出部14は、前記マークに基づいて記憶部22に記憶された動画コンテンツの中から、ハイライトシーンを抽出する。このハイライトシーンとは、ユーザが好む場面あるいは好むであろうと推測される場面のことである。
【0021】
優先度付与部16は、必要に応じてハイライトシーン抽出部14により抽出されたハイライトシーン毎に優先度を付与する。
【0022】
ハイライト動画作成部18は、抽出したハイライトシーンをつなぎ合わせてハイライト動画を作成する。
【0023】
長さ調整部20は、ハイライトシーンをつなぎ合わせて作成したハイライト動画の長さが最適かどうかの判定を行い、最適でないときには、ハイライトシーン抽出部14に長さを変えたハイライトシーンの再抽出処理を依頼することで、ハイライト動画の長さを調整する。
【0024】
これらハイライトシーンの抽出、優先度付与及びハイライト動画作成の詳細については後述する。
【0025】
記憶部22は、例えば、HDD(Hard Disk Drive)などから構成されており、動画コンテンツ及びメタデータを記憶する。
【0026】
この動画コンテンツとしては、ハイライトシーンの抽出対象として一定の長さを有するものであれば足り、特に限定されない。本実施の形態では、動画コンテンツの例として、ユーザ自身が撮影することにより作成したユーザ作成コンテンツであるとして説明する。なぜなら、このようなユーザ作成コンテンツは、冗長なシーンが入りがちなのでハイライト動画を作成したいというユーザの要望が多いためである。
【0027】
また、記憶部22が記憶するメタデータの内容の一例は
図2の通りである。
【0028】
図2のメタデータの構造を示すテーブル23は、「動画コンテンツID」23a、「ショットID」23b、「マークID」23c、「マークの再生位置(秒)」23dの項目を含む。
【0029】
「動画コンテンツID」23aは、記憶部22が記憶している動画コンテンツを一意に識別するための識別子である。
【0030】
「ショットID」23bは、「動画コンテンツID」23aに示される動画コンテンツに対応する1以上のショットを識別するための識別子である。ここで「ショット」とは、ユーザ動画の撮影時において、1回の撮影開始から撮影終了までの単位である。
【0031】
「マークID」23cは、マークを識別するための識別子である。
【0032】
「マークの再生位置(秒)」23dは、マークIDに対応する再生位置を示す。なお、この情報としては再生位置を示す情報であれば足り、例えば、秒数に代えて動画のフレームIDを用いてもよい。
【0033】
管理部24は、動画コンテンツの再生及びメタデータに関する管理を担う機能を有する。
【0034】
具体的には、ユーザ入力受付部12が動画の再生指示を受け付けると、この指示に基づいて管理部24は、記憶部22に記憶された動画コンテンツをデコード部26にデコードさせる。そして、管理部24は、表示制御部28を介してディスプレイ4上にデコードされた動画コンテンツを表示する。
【0035】
また、管理部24は、動画コンテンツの再生中に、ユーザ入力受付部12がユーザからのマークの入力を受け付けると、マークの受け付け時に再生中の動画コンテンツの動画コンテンツIDやその再生位置などをメタデータとして記憶部22に記憶させる。
【0036】
なお、
図2で示したメタデータの内容は一例に過ぎず、これに限られない。例えば、動画コンテンツに対するショットの帰属管理を、別途プレイリスト等で行う場合も考えられる。
<ハイライト動画作成の全体動作>
次に、実施の形態1における情報処理装置10のハイライト動画作成の全体動作について
図3を用いて説明する。
【0037】
情報処理装置10においては、まず、マーク入力ステップ(S310)の処理を行う。
【0038】
続いて、情報処理装置10は、上記ユーザから入力を受け付けたマークの再生位置を基にハイライトシーンを抽出するハイライトシーン抽出ステップ(S320)を実行する。
【0039】
そして、前記ハイライトシーン抽出ステップ(S320)で抽出したハイライトシーンをつないだハイライト動画の長さが最適かどうかを判定するステップ(S330)の処理を行う。
【0040】
ハイライト動画の長さが最適でないと判定した場合(S330:No)には、上記ステップS320で抽出したハイライトシーン毎に優先度を付与するハイライトシーン優先度付与ステップ(S340)と、付与した優先度に基づいてハイライトシーンの再生区間の長さを調整するハイライトシーン長調整ステップ(S350)を実行する。
【0041】
なお、ステップS330のハイライト動画の長さが最適な状態とは、例えば、ステップS320で抽出されたハイライトシーンをそのままつないだハイライト動画の長さが、所定の下限値から上限値の間(例えば、5分から15分の間)に収まっている状態である。
<マーク入力ステップ>
まず、マーク入力ステップ(S310)の詳細について
図4を用いて説明する。
【0042】
まず、管理部24により動画コンテンツの再生が開始されると、ユーザ入力受付部12は、ユーザによるマークの入力の受け付けを開始して(S410)、その入力を待つ(S420:No)。
【0043】
ユーザ入力受付部12が、マークの入力を受け付けると(S420:Yes)、受け付けたマークを構成する情報を記憶部22にメタデータとして格納する(S430)。
図2の例の場合、この受け付けたマークを構成する情報は、動画コンテンツID、ショットID、マークID、及びマークの再生位置を含む。
【0044】
なお、メタデータとして格納すべきマークの再生位置については、マークの受け付け時点でデコード部26がデコード中のフレームに対応する再生位置でもよいし、マークの受け付け時点で管理部24が読み出し中のフレームに対応する再生位置でもよい。
【0045】
このステップS420〜S430の処理は、ユーザ入力受付部12が、動画コンテンツの再生の停止を受け付けるか(S440)、動画コンテンツが終端まで再生されて完了するまで(S450)、繰り返される。
【0046】
図5に、ユーザがマークを入力する場面の一例を示す。
【0047】
この
図5の例では、ユーザは自身が撮影した娘が通う幼稚園のお遊戯会の動画コンテンツを視聴している。ユーザは娘を見たいと考えているため、娘が活躍したときに、リモコン2のハイライトボタンを押下している。
<ハイライトシーン抽出ステップ>
次に、ハイライトシーン抽出ステップ(S320)について
図6を用いて詳述する。
【0048】
上記マーク入力ステップ(S310)が完了すると、管理部24は、ハイライトシーン抽出部14に対して当該マーク入力ステップが完了した旨を通知する。
【0049】
これを受信したハイライトシーン抽出部14は、記憶部22に格納されているメタデータのうち、完了直前に再生していた動画コンテンツに関連付けられたマークを取得する(S610)。
【0050】
例えば、メタデータの内容が
図2の例のような構成であり、完了直前に再生していた動画コンテンツのIDが0ならば、
図2の表の上から3行分のメタデータを取得する。
【0051】
次に、ハイライトシーン抽出部14は、まだ対応するハイライトシーンを抽出していないマークそれぞれについて、マークの再生位置前後の再生区間をハイライトシーンとして抽出する(S620)。
【0052】
ステップS620の抽出方法としてはいくつかの手法が考えられる。例えば、マークを利用して固定長のシーンをハイライトシーンとして抽出する方法が考えられる。
【0053】
本方法では、マークの再生位置の前後の再生区間を設定された固定長分だけハイライトシーンとして抽出する。また、前記手法では、複数のマーク間の再生位置の差が前記固定長より小さい場合、前記複数のマークから抽出したハイライトシーン同士が重なる。この場合、最初のマークから固定長分遡った時点から、最後のマークの再生位置から固定長分後の時点までの再生区間をハイライトシーンとして抽出する。
【0054】
図7に前記固定長を5秒とした場合の前記手法の一例を示す。
図7(a)では、マークの再生位置が21秒であるため、その前後5秒の再生区間である16秒から26秒までをハイライトシーンとして抽出する。また、
図7(b)では、最初のマークの再生位置(21秒)から5秒遡った16秒を始点とし、次のマークの再生位置(23秒)から5秒後の時点の28秒を終点とするような再生区間をハイライトシーンとして抽出する。
【0055】
なお、
図7で固定長として設定した5秒は一例でありこれに限られない。また、ハイライトシーンの抽出方法は前記固定長を抽出するような手法に限らず、マークの再生位置が含まれるようなハイライトシーンの抽出方法であればどのような方法を用いても良い。
【0056】
例えば、マークの再生位置の前後の再生区間の各フレームの画像特徴量を計算して比較し、マークの再生位置の前後の再生区間のそれぞれで画像特徴量の差分が閾値以上になるようなフレームをハイライトシーンの切れ目とするようにハイライトシーンを抽出する特許文献3などで開示されている方法を用いても良い。
【0057】
また、マークの再生位置の前後のフレームを音響の観点から細分化してそれぞれ音環境に関する特徴量とその平均値を導出し、特徴量と平均値との差分が閾値以上になるようなフレームをシーンの切れ目とするようなシーンを抽出する方法を用いても良い。
【0058】
さらに、マークの再生位置の前後の再生区間のフレームを撮影した際のユーザの撮影機器の操作内容がある特定の操作内容であった場合、その特定の操作を行ったフレームをハイライトシーンの切れ目とするようなハイライトシーンを抽出する特許文献4などで開示されている方法を用いても良い。
【0059】
また、ハイライトシーンの抽出方法は、上に列挙した方法に限定されるものでもない。
<ハイライトシーン優先度付与ステップ>
次に、ハイライトシーン優先度付与ステップ(S340)について
図8を用いて説明する。
【0060】
まず優先度付与部16は、「ハイライトシーンの再生区間の長さ」の観点から、優先度を付与する(S810)。
【0061】
ここでユーザは面白いと思ったシーンを凝縮したハイライト動画を望むため、ハイライトシーンの再生区間の長さが長すぎず「面白いと分かる程度に長い」ことが必要である。そこで、明らかに短すぎる、及び長すぎるシーンの優先度を下げる。
【0062】
具体的には、ハイライトシーンの再生区間の長さに次の2種類の指標T1、T2(T1<T2)を導入し、ハイライトシーンの再生区間の長さがT1より短い、あるいはT2より長い場合は優先度を最低とする。なお、この手法は一例でありこれに限られない。
【0063】
ここで、「T1」とは面白いと分かる程度の最短の長さである。また、「T2」とは飽きないで楽しめる程度の最長の長さである。
【0064】
図9は、ハイライトシーンの再生区間の長さによる優先度付与の一例を示す図である。ここでは、ショット2の2つ目のマークから抽出されたハイライトシーンの再生区間の長さがT1より小さいため、優先度が最低と判定されている。また、ショット3から抽出されたハイライトシーンの再生区間の長さがT2より大きいため、同様に優先度が最低と判定されている。
【0065】
次に、優先度付与部16は、ステップS810で長さがT1以上且つT2以下であったハイライトシーンについて、「ハイライトシーン内のマークの密度」の観点から優先度を付与する(S820)。
【0066】
この「ハイライトシーン内のマークの密度」に基づいた優先度の付与の一例を詳述する。ここでマークの密度とは、1ハイライトシーンあたりのマークの数とする。
【0067】
「複数の見所が集まったハイライトシーン」は少し長くても連続して見ることで面白さが増す。そこで、1つのハイライトシーン内のマークの密度が高いハイライトシーンの優先度を上げる。つまり、優先度付与部16は、1ハイライトシーンあたりのマークの数が多いならば優先度を上げ、1ハイライトシーンあたりのマークの数が少ないならば優先度を下げるのである。
【0068】
図10は、ハイライトシーン内のマークの密度による優先度付与の一例を示す図である。ここでは、ショット2から抽出された右側のハイライトシーンのマークの密度が高いため、最も高い優先度1と判定されている。次に、ショット1から抽出されたハイライトシーンのマークの密度が中程度であるため、優先度2と判定されている。次に、ショット2から抽出された左側のハイライトシーンのマークの密度が低いため、優先度3と判定されている。最後に、ショット3から抽出されたハイライトシーンのマークの密度が最低であるため、優先度4と判定されている。なお、マークの密度として、ハイライトシーンごとの単位時間辺りのマーク数を用いても良い。
【0069】
最後に、優先度付与部16は、ステップS810とステップS820の結果、同一の優先度となったハイライトシーン同士を比較・分析して詳細な優先度を付与する(S830)。詳細な優先度を付与する方法としては、例えば次のような方法が考えられる。
・特定の画像が含まれるハイライトシーンの優先度を高くする(例:子供の顔画像が含まれているハイライトシーン)
・特定の音響が含まれるハイライトシーンの優先度を高くする(例:子供の歌が含まれているハイライトシーン)
・撮影時に特定の操作を行っているハイライトシーンの優先度を高くする(例:ズームした直後のハイライトシーン)
・撮影に失敗していると想定されるハイライトシーンの優先度を低くする(例:手ぶれがひどいハイライトシーン)
・特定のメタデータを含むハイライトシーンの優先度を高くする(例:同一シーンの静止画を撮影しているハイライトシーン)
このような詳細な優先度を付与する方法により、ハイライトシーンに対してユーザの主観を反映した優先度を付与することが可能となる。
【0070】
また、上記ハイライトシーンに詳細な優先度を付与する方法の全て、あるいはそれらの内の複数の方法を選択してハイライトシーンに得点を付け、その得点に基づいて優先度を付与しても良い。さらに、ステップS330でハイライト動画の長さを確認する際に事前に設定された時間よりも長すぎるのか、それとも短すぎるのかを合わせて確認しておいて、それぞれの場合に異なる方法で優先度を付与しても良い。
<ハイライトシーン長調整ステップ>
最後に、ハイライトシーン長調整ステップ(S350)について
図11を用いて詳述する。
【0071】
優先度付与部16は、ステップS340が完了するとハイライトシーン動画作成部18にその旨を通知する。これを受信したハイライト動画作成部18の長さ調整部20は、ハイライト動画の長さが設定時間よりも長いかどうかを確認する(S1110)。
【0072】
ハイライト動画の長さが設定時間よりも長かった場合(S1110:Yes)、長さ調整部20は、ハイライトシーン抽出部14にハイライトシーンの長さをより短くするようハイライトシーンの再抽出処理を依頼する。
【0073】
依頼を受けたハイライトシーン抽出部14は、その時点で抽出されている全てのハイライトシーンの中から長さの調整を行っていないハイライトシーンを抽出し、その内、優先度が最も低いハイライトシーンの再生区間の長さを短くする(S1120)。
【0074】
このような再抽出依頼に基づいてハイライトシーンの再生区間の長さを短くする方法としては、ハイライトシーン抽出部14が、最初の抽出処理(S320)で用いたアルゴリズムを利用してハイライトシーンの再生区間がより短くなるようパラメータを変更して再抽出を行う手法がある。
【0075】
例えば、最初の抽出処理(S320)で、前記マークの再生位置の前後の再生区間を設定された固定長分だけハイライトシーンとして抽出する方法を用いた場合、固定長を最初の抽出時よりも短くすることが考えられる。具体的には、
図7で5秒に設定されている固定長を3秒へと短く設定する。
【0076】
また、最初の抽出処理(S320)で、前記画像特徴量や音環境の特徴量を分析するような方法を用いた場合、画像間の各特徴量の差分を比較する閾値などのパラメータを調整し、上記最初の抽出処理(S320)で抽出したハイライトシーンよりも短くなるように、マークの再生位置の前後の再生区間をハイライトシーンとして抽出することが考えられる。
【0077】
さらに、最初の抽出処理(S320)で、前記撮影機器の操作内容を分析するような方法を用いた場合マークの再生位置に近い方のシーンの切れ目をそのままハイライトシーンの始点として採用し、マークの再生位置の部分を含み且つステップS320で抽出したハイライトシーンよりも短くなるようにハイライトシーンの終点を設定することが考えられる。
【0078】
なお、再抽出依頼に基づいて、ハイライトシーンの再生区間の長さを短くする方法として最初の抽出処理(S320)で用いたアルゴリズムとは異なる方法を利用してもよい。また、前記ハイライトシーンの再生区間の長さを短くする方法は、これらに限定されるものでもない。
【0079】
さらに、ステップS1120では、付与された優先度が最低のハイライトシーンのうち、ハイライトシーンの再生区間の長さがT1よりも短いような短すぎるハイライトシーンを調整対象から除外する、あるいはハイライトシーンの再生区間の長さを長くするようにしても良い。
【0080】
次に、ステップS1120で1つのハイライトシーンを短くする処理が完了すると、ハイライト動画作成部18は、ハイライト動画全体の長さと設定時間の差分が予め設定された閾値以内であるかどうかを確認する(S1130)。閾値以内であればハイライトシーン長調整ステップを完了する。一方、閾値以上であれば、ステップS1120に戻り、長さ調整部20は、ハイライトシーン抽出部14にハイライトシーンの長さをより短くするようハイライトシーンの再抽出処理を依頼する。依頼を受けたハイライトシーン抽出部14は、その時点で抽出されている全てのハイライトシーンの中から、 長さの調整を行っていないハイライトシーンを抽出し、その内、優先度が最も低いハイライトシーンの再生区間の長さを短くする。
【0081】
一方、ステップS1110の比較で設定時間よりも短かった場合、長さ調整部20は、ハイライトシーン抽出部14にハイライトシーンの長さをより長くするようハイライトシーンの再抽出処理を依頼する。まず、依頼を受けたハイライトシーン抽出部14は、長さの調整を行っていないハイライトシーンのうち、優先度が最も高いシーンの再生区間の長さを長くする(S1140)。ハイライトシーンの再生区間の長さを長くする方法は、ステップS1120のハイライトシーンを短くする方法と同様に、ハイライトシーン抽出ステップ(S320)でハイライトシーンを抽出する方法と同様の方法を用いても良いし、異なる方法を用いても良い。
【0082】
なお、ステップS1140では、付与された優先度が最低のハイライトシーンのうち、ハイライトシーンの再生区間の長さがT2よりも長いハイライトシーンを調整対象から除外する、あるいはハイライトシーンの再生区間の長さを短くするようにしても良い。
【0083】
1つのハイライトシーンを
長くすると、長さ調整部20は、ハイライト動画の長さと設定時間の差分が予め設定された閾値以内であるかどうかを確認する(S1150)。閾値以内であれば(S1150:Yes)ハイライトシーン長調整ステップを完了する。一方、閾値以上であれば(S1150:No)、ステップS1140に戻り、次に優先度の高いハイライトシーンの再生区間の長さを長くする。
【0084】
以上説明したように、本実施の形態によれば、ハイライトシーンに付与された優先度に基づいて、ハイライトシーンの再生区間の長さを調整することで、予め設定された時間に合わせ、ユーザの好みに応じたハイライト動画の作成を実現できる。
【0085】
例えば、
図12に示すように、ハイライトシーンとして抽出されたシーン1〜シーン3をそのままつないだハイライト動画では予め設定された時間を超過するような場合であったとしても、優先度が低い(ユーザにとって重要度が低いと推定される)シーン1、シーン2の長さを短縮することで、ハイライト動画の長さを設定時間内に収めることができる。
【0086】
本実施の形態によれば、ユーザは簡単に自己の好みに沿ったハイライト動画を作成することができるので、コンテンツの死蔵の防止にもつなげることができる。
(実施の形態2)
本実施の形態は、実施の形態1を応用したものであり、ハイライトシーン抽出に音響の解析手法を利用する点、及び優先度の付与にシーン同士の関係性を考慮する点などが実施の形態1と異なっている。実施の形態1と同様な点については、説明を省略する。
【0087】
図13の情報処理装置11は、特に、ハイライトシーン抽出部14aが音響安定度解析部15を有する点が
図1と異なっている。
【0088】
音響安定度解析部15は、動画コンテンツの音響安定度を分析する機能を有する。
<ハイライトシーン抽出ステップ>
次に、実施の形態2におけるハイライトシーン抽出の方法について
図14を用いて説明する。
【0089】
ハイライトシーン抽出部14aは、マークの再生位置の前後合わせてn秒の区間を抽出して音響安定度解析部15に音響安定度の解析を依頼する。
【0090】
音響安定度解析部15は、n秒の区間を最小区間a(aは正の任意の数)秒ごとの更に詳細な区間に分割する(S1410)。
【0091】
ここで、あるマークの再生位置に対応するハイライトシーンの抽出が初めてであった場合、nは予め定められた最小値とし、そうでなかった場合、nは後述するステップS1460で指定された値とする。また、最小区間a秒は、情報処理装置11に予め設定されている値としてもよいし、ユーザにより設定される値としてもよいし、その他の条件から動的に変更される値としてもよい。
【0092】
次に、音響安定度解析部15は、分割した各区間の音響特徴量と、全区間の音響特徴量の平均値を導出する(S1420)。
【0093】
続いて、ハイライトシーン抽出部14aは、その内部の音響安定度解析部15がステップS1420で導出した結果を基に、前記平均値と各区間の音響特徴量との差分をそれぞれ導出する(S1430)。
【0094】
次に、導出した差分のいずれかが、予め設定された閾値よりも大きいかどうかを確認する(S1440)。もし、
小さい場合はn=n+aとして、ステップS1410の処理から繰り返す(S1460)。もし、大きい場合は、マークの前後n−a秒の区間をシーンとして抽出する(S1450)。
【0095】
抽出したハイライトシーン内の音響の特徴量は変化量が少なく、音響安定度が高いと言える。一般的には、音響安定度の変化とシーン内の状況の変化が相関している場合が多いため、本方法によってユーザにとって意味のあるシーンが抽出できる。
【0096】
図15に、ハイライトシーン抽出ステップの一例を示す。
【0097】
図15の例では、n=10、a=2であり、マークの再生位置の前後10秒の区間を、2秒ごとの詳細な区間に分割している。そして、各詳細な区間ごとに音響の特徴量f1〜f5と、音響の特徴量の平均値f
ave=(f1+f2+f3+f4+f5)/5とを求めている。
【0098】
さらに、音響の特徴量f1〜f5と平均値f
aveとの各差分を、予め設定された閾値f
thと比較し、各差分のいずれかが閾値f
thよりも大きくはなかったので(S1440:No)、抽出する区間を10秒から12秒へと変更していることを示している。前記閾値f
thは予め設定されている値としたが、これに限らずユーザにより設定される値としてもよいし、その他の条件から動的に変更される値としてもよい。
【0099】
なお、
図14に示した処理は一例であり、再生位置前後の音響の特徴量を解析し、解析した音響の特徴量が類似する区間をシーンとして抽出できる手法であればこれに限られない。
<ハイライトシーン優先度付与ステップ>
実施の形態2のハイライトシーン優先度付与ステップ(S340)について
図16を用いて説明する。
【0100】
優先度付与部16は、抽出されたハイライトシーンに対して「ハイライトシーンの再生区間の長さ」と、「1ショット内のハイライトシーンの再生区間の長さの合計値」と、「1ショット内のハイライトシーン同士の関係性」の観点から優先度を付与する(S1610)。
【0101】
ステップS1610の優先度を付与する方法の一例を示す。まず、「ハイライトシーンの再生区間の長さ」に基づいた優先度付与方法について詳述する。ユーザは面白いと思ったシーンを凝縮したハイライト動画を望むため、ハイライトシーンの再生区間の長さが長すぎず「面白いと分かる程度に長い」ことが必要である。そこで、明らかに短すぎる、及び長すぎるシーンの優先度を下げるべきである。そこで、ハイライトシーンの再生区間の長さに次の2種類の指標T1、T2を導入する。T1とは、「面白いと分かる程度のハイライトシーンの再生区間の最短の長さ」である。また、T2とは、「飽きないで楽しめるハイライトシーンの再生区間の最長の長さ」である。これら2種類の指標に基づいた場合に分けてハイライトシーンの優先度を付与する。まず、「ハイライトシーンの再生区間の長さ」に基づいた優先度付与方法を説明する。
図17(a)に示すように、ハイライトシーンの再生区間の長さtがt<T1となる場合、ハイライトシーンの再生区間の長さが短すぎるため優先度を下げるようにする。T1≦t≦T2となる場合、ハイライトシーンの再生区間の長さが最適であるため優先度を上げるようにする。t>T2となる場合、ハイライトシーンの再生区間の長さが長すぎるため優先度を下げるようにする。
【0102】
次に、「1ショット内のハイライトシーンの再生区間の長さの合計値」に基づいた優先度付与方法を説明する。「複数の見所が集まった抽出シーン」は少し長くても連続して見ることで面白さが増す。そこで、1ショット内の関係性の高い複数のハイライトシーンの再生区間の長さの合計値に対してもT1とT2の指標に基づいた場合に分けて優先度を付与する。
図17(b)は、1ショット内のハイライトシーンの再生区間の長さの合計値Tに基づいた場合分けを示す図である。まず、1ショット内のハイライトシーンの再生区間の長さの合計値TがT<T1となる場合、短すぎるために優先度を下げるようにする。T1≦T≦T2となる場合、長さが最適であるため優先度を上げるようにする。T>T2となる場合、長すぎるため優先度を下げるようにする。
【0103】
次に、「1ショット内のハイライトシーン同士の関係性」について詳述する。一般的にユーザは1つのショットを1つのまとまりとして撮影を行う。このため、1つのショットから抽出される複数のシーンは互いに関係性が高い場合が多い。そこで、これらの関係性を考慮して場合分けを行う。
図18は、1ショット内の複数のハイライトシーンの関係性を示す図である。
【0104】
なお、
図18の例は一例に過ぎずこれに限られない。
【0105】
このような、ハイライトシーンの再生区間の長さとその合計値、及び1ショット内のハイライトシーンの関係性を総合的に考慮して優先度付与部16はハイライトシーンに優先度を設定する。
図19〜
図21は、優先度付与部16が上記した判断要素に基づいてハイライトシーンに優先度を設定する方法を示す図である。 なお、
図19〜
図21の例は一例に過ぎずこれに限られない。
【0106】
優先度付与部16は、まず、1ショット内のハイライトシーンの再生区間の長さの合計値Tを確認し、その後、ハイライトシーンの再生区間の長さと関係性を確認する。
【0107】
図19に示しているような、T≒T1で且つt≒T1の場合、ハイライトシーンの再生区間の長さの合計値、及びその1つ1つのシーンの長さが最適なハイライトシーンの再生区間の長さの下限付近であるため、優先度を最高に設定し、基本的にはこのままハイライトシーンとして抽出する。
【0108】
次に、
図20に示しているような、T≒T2の場合、ハイライトシーンの再生区間の長さとその関係性によって優先度を変更する。例えば、関係性が不規則となっている場合、各ハイライトシーン同士の関係性は濃いとも薄いとも言えないと判断し、優先度を中程度とする。また、t≒T2で且つハイライトシーン同士が独立している場合、各シーンの関係性が薄く、且つハイライトシーンを縮める余地が大きいと判断し、優先度を低く設定する。その他の場合はハイライトシーンが最適である、あるいはこれ以上長さを縮める余地が少ないと判断して優先度を高く設定する。
【0109】
次に、
図21に示しているようなT>T2の場合、長すぎると判定して基本的に優先度を低めに設定する。ただし、ハイライトシーン同士の関係性が「連結」だったり「一部重複」である場合、「複数の見所が集まった抽出シーン」である可能性がその他の場合よりも高いため、優先度を中程度と設定する。
【0110】
最後に、情報処理装置11は、ステップS1610で同一の優先度となったハイライトシーン同士を比較・分析して詳細な優先度を付与する(S830)。なお、ステップS830は実施の形態1のステップS830と同様であるため、説明を省略する。
【0111】
このように実施の形態2における優先度付与方法によれば、ハイライトシーンの長さ、及びハイライトシーン同士の関係性に基づいて、より柔軟に適切な優先度を付与することができる。このため、例えば、ハイライトシーンを短く調整することになったとしても、ユーザが大事と考えるであろうシーンについてはなるべく短縮の対象とならないようにすることができる。
<ハイライトシーン長調整ステップ>
ハイライトシーン毎に付与された優先度に基づいて長さを調整する処理である。この処理については、実施の形態1(
図11)と同様であるので説明を省略する。
(実施の形態3)
実施の形態1では、ユーザによるリモコン2の入力操作に基づいて、動画にマークを対応付けるとしていたがこれに限られない。本実施の形態3は、動画にマークを付与する他の手法について紹介する。
【0112】
図23の情報処理装置230は、特に、ユーザ入力受付部12aや、マーク付与部17を含むハイライトシーン抽出部14bを備える。それ以外の機能ブロックは、
図1と基本的には同様であるので説明を省略する。
【0113】
ユーザ入力受付部12aは、動画の再生指示は受け付けるが、実施の形態1とは異なりマーク付与のための入力操作は受け付けなくてもよい。
【0114】
マーク付与部17がマーク付与する時機は、特に限定されないが、例えば、ハイライトシーン抽出部14bによるハイライトシーン抽出処理の開始を契機として行われることが考えられる。
【0115】
ハイライトシーン抽出部14bは、マーク付与部17が付与したマークの再生位置に基づいて、動画コンテンツの中からハイライトシーンを抽出する。ハイライトシーン抽出部14bがハイライトシーンを抽出する時機は、例えば、次の(A)(B)の時機が考えられる。
【0116】
(A)記憶部22内に動画コンテンツが取り込まれたとき
(B)ハイライト動画再生をユーザから指示されたとき
ハイライトシーン抽出部14bは、マーク付与部17が付与したマークの再生位置に基づいて、動画コンテンツの中からハイライトシーンを抽出する。
【0117】
両ブロックの関係について具体的に説明すると、マーク付与部17は、1つの指標あるいは複数の指標の組み合わせに基づいて動画コンテンツにマークを付与する。付与後、付与したマークの再生位置を含むメタデータを記憶部22に記憶させる。このメタデータの構造は
図2と同様であるので説明を省略する。そして、ハイライトシーン抽出部14bは、記憶部22に記憶されたメタデータに含まれるマークの再生位置に基づいて、動画コンテンツの中からハイライトシーンを抽出する。
【0118】
図24に、マーク付与部17が用いる指標の例を示す。
【0119】
画像的特異点の指標は、画像特徴量が前後と著しく異なる点(再生位置)にマークを付与するためのものである。この画像特徴量の例としては、画像内の物体の動きベクトルや、画像内のカラー特徴量などが挙げられる。例えば、マーク付与部17は、前後のシーンで動きベクトルの差分が閾値を超えることを条件として、マークを付与する。
【0120】
音響的特異点は、音響特徴量が前後と著しく異なる点にマークを付与するためのものである。例えば、予め動画コンテンツの区間毎に音響特徴量を算出ておき、マーク付与部17は、隣り合う区間間の音響特徴量の差分が閾値以上であることを条件として、マークを付与するとしてもよい。
【0121】
撮影操作的特異点は、特定の操作を行った点にマークを付与するためのものである。例えば、ズーム操作を行っていれば、撮影者の面白いと感じたであろうという推定が働くことを利用して、マーク付与部17は、ズーム操作を開始した再生位置にマークを付与する。
【0122】
メタデータ的特異点は、特定のメタデータが現れる点にマークを付与するためのものである。メタデータの例としては、動画撮影中の静止画撮影が挙げられる。この場合、マーク付与部17は、静止画撮影した再生位置にマークを付与する。
【0123】
上述のような手法でマーク付与部17がマークを付与した後は、付与されたマークに基づいて、ハイライトシーン抽出部14bがハイライトシーンを抽出することなる。なお、マーク付与部19が付与したマークを利用して行う、ハイライトシーン抽出ステップ(S320)については、実施の形態1で説明したものと同様の手法を用いることができるので説明を省略する。また、この後に続く、ハイライトシーン優先度付与ステップ(S340)、ハイライトシーン長調整ステップ(S350)については、実施の形態1で説明したものと同様の手法を用いることができるので説明を省略する。
(実施の形態4)
本実施の形態4では、実施の形態3で述べたマーク付与部の他の形態について説明する。
【0124】
図23の情報処理装置230では、マーク付与部17は、ハイライトシーン抽出部14bに含まれるとしているが、ハイライトシーン抽出部14bから独立した形態でもよい。このような情報処理装置250を
図25に示す。
【0125】
図25の情報処理装置250は、特に、ユーザ入力受付部12aや、マーク付与部19を備える。
【0126】
ユーザ入力受付部12aは、リモコン2を介して、ハイライト動画の再生指示などの指示を受け付ける。
【0127】
マーク付与部19は、1つの指標あるいは複数の指標の組み合わせに基づいて動画コンテンツにマークを付与する。この付与の手法はマーク付与部17で説明したものと同様である。
【0128】
このマーク付与部19がマーク付与する時機も、マーク付与部17と同様であり、例えば、
(A)記憶部22内に動画コンテンツが取り込まれると、自動的にマークの付与を行う。
または、
(B)ハイライト動画再生をユーザから指示されると、自動的にマークの付与を行う。
【0129】
実施の形態4によれば、マーク付与とハイライトシーンの抽出とを同時に行う代わりに、先行してマーク付与を行い、付与したマークを後々のハイライトシーンの抽出などの用途に利用することができる。
【0130】
例えば、装置のスペックの制約から、自動的なマーク付与の処理に時間を要する場合に有用である。
【0131】
なお、マーク付与部19が付与したマークを利用して行う、ハイライトシーン抽出ステップ(S320)、ハイライトシーン優先度付与ステップ(S340)、ハイライトシーン長調整ステップ(S350)については、実施の形態1で説明したものと同様の手法を用いることができるので説明を省略する。
【0132】
なお、実施の形態4では、ハイライトシーン抽出部14によるハイライトシーンの抽出処理(ハイライト動画作成部18からの依頼に基づくハイライトシーンの再抽出処理を含む)、およびマーク付与部19によるマークの付与はそれぞれ独立して行うものとしている。しかしながら、ハイライトシーン抽出部14およびマーク付与部19は、いずれも同様のコンテンツ解析処理を行う。そのため、例えば、情報処理装置250が図示しないコンテンツ解析部を備えることとし、ハイライトシーン抽出部14およびマーク付与部19は、それぞれの処理を行う際に、コンテンツ解析部にコンテンツの解析を依頼し、その結果を用いて、ハイライトシーンの抽出やマークの付与を行うこととしてもよい。
<補足1>
以上、実施の形態について説明したが、本発明は上記の内容に限定されず、本発明の目的とそれに関連又は付随する目的を達成するための各種形態においても実施可能であり、例えば、以下であっても構わない。
(1)入力デバイス
各実施の形態では、入力デバイスの例として、リモコン2を用いて説明したが、これに限られない。ユーザがハイライトとして希望する再生位置を検出できるような入力デバイスであれば足り、次のような入力デバイスでもよい。
【0133】
例えば、マウスやキーボードのような入力デバイスでもよい。
【0134】
また、情報処理装置がタッチパネルを備えている場合は、入力デバイスがタッチペンのようなスタイラス、ユーザの指となることもあり得る。
【0135】
さらに、マイクロフォン及び音声認識機能を備える情報処理装置である場合には、音声入力でもよい。あるいは、手のひらなど人体モデルの認識機能を備える情報処理装置である場合には、ジェスチャ入力でもよい。
(2)ハイライトシーンの最適範囲
図3のステップS330のハイライト動画の長さが最適である状態とは、例えば情報処理装置10に予め登録されている長さとハイライト動画の長さの差分が一定値以内に収まっているような状態でも良いし、登録されている長さよりも長い、あるいは短い状態でも良い。さらに、登録されている長さの代わりにユーザが入力した長さを用いても良い。
【0136】
あるいは、ハイライト動画の長さが最適かどうかをユーザに問い合わせて、ユーザの判断を仰ぐようにしても構わない。
(3)優先度の付与方法
優先度の付与方法としては、
図22に示すようなリモコン2を利用して行ってもよい。すなわち、リモコン2は、最高の優先度を示すボタン1、中程の優先度を示すボタン2及び最低の優先度を示すボタン3を有する。そして、優先度付与部16は、ユーザ入力受付部12が受け付けたこれらのボタン1〜3に応じて優先度1〜3を付与するとしてもよい。
(4)集積回路
実施の形態の情報処理装置は、典型的には集積回路であるLSI(Large Scale Integration)として実現されてよい。各回路を個別に1チップとしてもよいし、全ての回路又は一部の回路を含むように1チップ化されてもよい。ここでは、LSIとして記載したが、集積度の違いにより、IC(Integrated Circuit)、システムLSI、スーパLSI、ウルトラLSIと呼称されることもある。また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後にプログラム化することが可能なFPGA(Field Programmable Gate Array)、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
【0137】
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
(5)記録媒体、プログラム
実施の形態で示した処理をコンピュータ等の各種機器のプロセッサ、及びそのプロセッサに接続された各種回路に実行させるためのプログラムコードからなる制御プログラムを、記録媒体に記録すること、又は各種通信路を介して流通させ頒布することもできる。
【0138】
このような記録媒体には、スマートメディア、コンパクトフラッシュ(登録商標)、メモリースティック(登録商標)、SDメモリーカード、マルチメディアカード、CD−R/RW、DVD±R/RW、DVD−RAM、HD−DVD、BD((Blu−ray(登録商標) Disc))等がある。
【0139】
流通、頒布された制御プログラムは、プロセッサに読み出され得るメモリ等に格納されることにより利用に供され、そのプロセッサがその制御プログラムを実行することにより実施の形態で示したような各種機能が実現されるようになる。
(6)ハイライトシーンの長さの調整について
実施の形態では、ハイライトシーンの長さの調整は、長さ調整部20がハイライト抽出部14に長さを変えたハイライトシーンの再抽出処理を依頼することで行うとしたがこれに限られない。例えば、長さ調整部20がハイライトシーンの長さの調整を直接行う構成としても構わない。この場合、長さ調整部20はハイライトシーン抽出部14が行っていた処理を直接実行する。
【0140】
例えば、上述した最初の抽出(S320)と同じアルゴリズムを用いてハイライトシーンの再生区間がより短くなるようパラメータを変更して再抽出を行う第1の手法を採用してもよい。他にも、ハイライトシーン抽出部14が、最初の抽出(S320)と異なるアルゴリズムを用いてハイライトシーンの再生区間がより短くなるよう再抽出を行う第2の手法を採用してもよい。また、前記ハイライトシーンの再生区間の長さを短くする方法は、これらに限定されるものでもない。
(7)マークの密度などに基づいた優先度の付与について
ハイライトシーンに付与する優先度の高低は、マークが再生時間軸上において集まっているか、あるいはまばらであるかに基づいて決定することができる。
【0141】
「まばら」「集まっている」を判断する指標としては、単位時間辺りのマークの密度を指標として用いることができる。もっとも、長い期間で見たときの密度が低くとも、局所的にマークが集中していれば高い優先度とすることがよいときもある。このような、局所的なマークの集中度合いも指標として採用することができる。
【0142】
このような観点から優先度を付与する手法としては、次の手法1〜手法3の例が挙げられる。
【0143】
・手法1
手法1は、実施の形態1で説明したように1つのハイライトシーン内のマークの密度を元にハイライトシーンの優先度を付与するものである。
【0144】
・手法2
手法2は、1つのハイライトシーン内のマークの数をそのハイライトシーンの長さで除することにより、単位時間辺りのマークの数を求め、これを基に、ハイライトシーンの優先度を付与するものである。
【0145】
・手法3
手法3は、局所的なマークの集中度合いを利用するものである。つまり、
1つハイライトシーン全体ではなくハイライトシーン内の任意の単位時間あたりのマークの数の最大数を基に、ハイライトシーンの優先度を付与するものである。これによりハイライトシーン全体ではマークの数が少ない場合であっても、任意の単位時間(例えば、1秒)にマークが集中していれば、前記最大数は多くなるので、高い優先度を付与することができる。なお、上で説明に用いた任意の単位時間の1秒は一例でありこれに限られない。
(8)情報処理装置に必要な構成について
実施の形態では、情報処理装置内でハイライト動画を作成するとしたが、このような作成機能は必須ではなく、ハイライト動画の作成を他装置で行うとしてもよい。また、動画コンテンツを情報処理装置内で記憶する機能も必須ではなく、外部装置に記憶された動画コンテンツを利用する形態でも構わない。
【0146】
すなわち、
図26に示すように、情報処理装置260の概要としては、動画コンテンツについて複数の再生位置を付与するマーク付与部(再生位置を特定する特定部)262と、複数の再生位置に基づいてそれぞれ再生位置を1以上含み前記動画コンテンツの区間を示す複数のハイライトシーンを抽出するハイライトシーン抽出部264と、抽出されたハイライトシーン毎に、優先度を付与する優先度付与部266、を備えていれば足り得る。
(9)優先度の用途について
実施の形態では、付与した優先度をハイライト動画の作成に利用する例を中心に説明したが、これに限られない。
【0147】
例えば付与した優先度は、複数の動画コンテンツを一覧表示する画面において、各動画コンテンツの中で優先度が高いハイライトシーンをピックアップして表示することに用いることができる。
【0148】
また、動画コンテンツの内容を示すメニュー画面において、優先度毎にハイライトシーンを色分けして表示することにより、ユーザに動画コンテンツの内容を知らせるようにしてもよい。
(10)実施の形態1〜4や、本補足1の(1)〜(9)で述べた事項は組み合わせて構わない。
<補足2>
上で説明した実施の形態は、以下の態様を含むものである。
(1)本実施の形態に係る情報処理装置は動画コンテンツについて、複数の再生位置を特定する特定手段と、特定された複数の再生位置に基づいて、それぞれ再生位置を1以上含み前記動画コンテンツの区間を示す複数のシーンを抽出する抽出手段と、抽出されたシーン毎に、優先度を付与する付与手段と、を備えることを特徴とする。
(2)(1)において、前記付与手段は、前記特定された複数の再生位置を解析して、当該複数の再生位置が再生時間軸上においてまばらであるか、当該複数の再生位置が再生時間軸上において集まっているかを判定し、まばらと判定した再生位置を含むシーンには低い優先度を付与し、集まっていると判定した再生位置を含むシーンには高い優先度を付与するとしても構わない。
(3)(1)において、前記付与手段は、抽出された複数のシーンそれぞれの長さ、及び抽出された複数のシーン同士の再生時間軸上における関係性に基づいて、優先度を付与するとしても構わない。
(4)(1)において、前記付与手段は、抽出された複数のシーンそれぞれの再生位置の数を解析し、1シーンあたりの再生位置の数が多いシーンには高い優先度を付与し、1シーンあたりの再生位置の数が少ないシーンには低い優先度を付与するとしても構わない。
(5)(1)において、前記抽出手段は、前記再生位置前後の音響の特徴量を解析し、解析した音響の特徴量が類似する区間を示すシーンを抽出するとしても構わない。
【0149】
この構成によれば、意味のあるまとまりとして期待できるシーンを抽出することに寄与する。
(6)(1)において、さらに、各シーンに付与された優先度に基づいて1以上のシーンの長さを調整し、調整後に、各シーンをつなぎ合わせてハイライト動画を作成する作成手段、を備えるとしても構わない。
(7)(6)において、前記作成手段は、抽出された複数のシーンのすべてをつなぎ合わせた場合のハイライト動画の長さが所定範囲内に収まっているかどうかを判定し、前記所定範囲の上限値より長いと判定したときには、優先度の低いシーンの長さをより短く調整し、前記所定範囲の下限値よりも短いと判定したときには、優先度の高いシーンの長さをより長く調整するとしても構わない。
【0150】
この構成によれば、作成したハイライト動画の長さを、所定範囲内に収めることができる。
(8)本実施の形態に係るハイライト動画作成方法は、動画コンテンツについて、複数の再生位置を特定する特定ステップと、特定された複数の再生位置に基づいて、それぞれ再生位置を1以上含み前記動画コンテンツの区間を示す複数のシーンを抽出する抽出ステップと、抽出されたシーン毎に、優先度を付与する付与ステップと、を含む。
(9)本実施の形態に係るプログラムは、動画コンテンツを記憶する情報処理装置に優先度付与処理を実行させるプログラムであって、前記優先度付与処理は、動画コンテンツについて、複数の再生位置を特定する特定ステップと、特定された複数の再生位置に基づいて、それぞれ再生位置を1以上含み前記動画コンテンツの区間を示す複数のシーンを抽出する抽出ステップと、抽出されたシーン毎に、優先度を付与する付与ステップと、の各ステップを含む。
(10)本実施の形態に係る集積回路は、動画コンテンツについて、複数の再生位置を特定する特定手段と、特定された複数の再生位置に基づいて、それぞれ再生位置を1以上含み前記動画コンテンツの区間を示す複数のシーンを抽出する抽出手段と、抽出されたシーン毎に、優先度を付与する付与手段と、を備える。