(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024062424
(43)【公開日】2024-05-10
(54)【発明の名称】情報収集装置、情報収集システム及び情報収集方法
(51)【国際特許分類】
G06Q 30/0241 20230101AFI20240501BHJP
【FI】
G06Q30/02 446
【審査請求】有
【請求項の数】21
【出願形態】OL
(21)【出願番号】P 2022163879
(22)【出願日】2022-10-12
(11)【特許番号】
(45)【特許公報発行日】2024-04-30
(71)【出願人】
【識別番号】517039003
【氏名又は名称】パロニム株式会社
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】小林 道生
【テーマコード(参考)】
5L030
5L049
【Fターム(参考)】
5L030BB08
5L049BB08
(57)【要約】
【課題】動画とアクションとを紐付けた際に、多くの情報を収集する。
【解決手段】所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集装置である。
【選択図】
図6
【特許請求の範囲】
【請求項1】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
を備える情報収集装置。
【請求項2】
前記アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行される、
請求項1に記載の情報収集装置。
【請求項3】
前記アクションは、前記動画が表示されている装置において実行される、
請求項2に記載の情報収集装置。
【請求項4】
前記アクションは、前記動画が表示されている装置とは異なる装置において実行される、
請求項2に記載の情報収集装置。
【請求項5】
前記動画の前記要素の情報は、前記特定部が前記実行時間を特定した後に生成される、
請求項1に記載の情報収集装置。
【請求項6】
前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である、
請求項1~5のいずれか一項に記載の情報収集装置。
【請求項7】
前記動画の前記要素は、前記動画におけるセリフであって、
前記抽出部は、前記要素の情報として、前記動画の音声を解析し、テキストデータを抽出する、
請求項6に記載の情報収集装置。
【請求項8】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項7に記載の情報収集装置。
【請求項9】
前記要素は、前記動画における前記コメントであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記コメントのテキストデータを抽出する、
請求項6に記載の情報収集装置。
【請求項10】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項9に記載の情報収集装置。
【請求項11】
前記要素は、前記動画における前記キャプションであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記キャプションのテキストデータを抽出する、
請求項6に記載の情報収集装置。
【請求項12】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項11に記載の情報収集装置。
【請求項13】
前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画における被写体を検知し、前記被写体の大きさ、移動量、明るさ及びコントラストの少なくとも1つ以上を抽出する、
請求項6に記載の情報収集装置。
【請求項14】
前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画におけるシーンチェンジを検知し、前記シーンチェンジの有無を抽出する、
請求項6に記載の情報収集装置。
【請求項15】
前記要素毎に前記要素の情報のデータを集計する解析部をさらに備える、
請求項1に記載の情報収集装置。
【請求項16】
所定の時間軸に沿って動画を表示する表示部と、
表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
を備える情報収集システム。
【請求項17】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、
を含む情報収集方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報収集装置、情報収集システム及び情報収集方法に関する。
【背景技術】
【0002】
特許文献1には、インターネットやパソコン通信等のネットワークを利用した電子商取引において、どのバナー広告からのアクセスが実際に商品等の購入に結び付いたのかを把握することができる広告情報管理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、動画の視聴中に商品等の購入を含むアクションが実行される場面において、当該動画と当該アクションとを紐付けて把握することの需要が高まっている。しかし、アクションがどの動画から実行されたのかを把握することはできても、アクションが動画のどんな状況から実行されたのかを把握することは困難であった。つまり、動画とアクションとを紐付けたとしても、収集できる情報が少なかった。
【0005】
本発明の目的の一例は、動画とアクションとを紐付けた際に、多くの情報を収集することができる情報収集装置、情報収集システム及び情報収集方法を提供することにある。本発明の他の目的は、本明細書の記載から明らかになるであろう。
【課題を解決するための手段】
【0006】
本発明の一態様は、所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集装置である。
【0007】
本発明の一態様は、所定の時間軸に沿って動画を表示する表示部と、表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集システムである。
【0008】
本発明の一態様は、所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、を含む情報収集方法である。
【0009】
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
【発明の効果】
【0010】
本発明の上記態様によれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、本実施形態の動画の一例を示す説明図である。
【
図2】
図2は、動画においてアイテム情報をストックする操作の一例を示す説明図である。
【
図3】
図3は、ストックによりアイテム情報が記憶された状態の一例を示す説明図である。
【
図4】
図4は、動画においてアイテム情報をストックする操作の別の例を示す説明図である。
【
図5】
図5は、ストックによりアイテム情報が記憶された状態の別の例を示す説明図である。
【
図6】
図6は、本実施形態の情報収集装置を含む情報収集システム100を示す図である。
【
図7】
図7は、情報収集装置で抽出される動画の要素についての説明図である。
【
図8】
図8は、本実施形態の情報収集装置による情報収集手順の第1例を示す説明図である。
【
図9】
図9は、本実施形態の情報収集装置による情報収集手順の第2例を示す説明図である。
【
図10】
図10は、本実施形態の情報収集装置による情報収集手順の第3例を示す説明図である。
【
図11】
図11は、情報解析画面の第1例の概要を示す説明図である。
【
図12】
図12は、情報解析画面の第1例において、要素の情報が表示された状態の一例を示す説明図である。
【
図13】
図13は、情報解析画面の第2例の概要を示す説明図である。
【
図14】
図14は、情報解析画面の第2例において、要素の情報が表示された状態の一例を示す説明図である。
【
図15】
図15は、情報解析画面の第3例の概要を示す説明図である。
【発明を実施するための形態】
【0012】
後述する明細書及び図面の記載から、少なくとも以下の事項が明らかとなる。
【0013】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集装置が明らかとなる。このような情報収集装置によれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0014】
前記アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行されることが望ましい。これにより、動画とアクションとを容易に紐付けることができる。
【0015】
前記アクションは、前記動画が表示されている装置において実行されることが望ましい。これにより、動画とアクションとを容易に紐付けることができる。
【0016】
前記アクションは、前記動画が表示されている装置とは異なる装置において実行されることが望ましい。これにより、動画が表示されている装置以外で実行されたアクションについても、動画と紐付けることができる。
【0017】
前記動画の前記要素の情報は、前記特定部が前記実行時間を特定した後に生成されることが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0018】
前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上であることが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0019】
前記動画の前記要素は、前記動画におけるセリフであって、前記抽出部は、前記要素の情報として、前記動画の音声を解析し、テキストデータを抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0020】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0021】
前記要素は、前記動画における前記コメントであって、前記抽出部は、前記要素の情報として、前記動画に付加された前記コメントのテキストデータを抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0022】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0023】
前記要素は、前記動画における前記キャプションであって、前記抽出部は、前記要素の情報として、前記動画に付加された前記キャプションのテキストデータを抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0024】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0025】
前記要素は、前記動画における前記カメラワークであって、前記抽出部は、前記要素の情報として、前記動画における被写体を検知し、前記被写体の大きさ、移動量、明るさ及びコントラストの少なくとも1つ以上を抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0026】
前記要素は、前記動画における前記カメラワークであって、前記抽出部は、前記要素の情報として、前記動画におけるシーンチェンジを検知し、前記シーンチェンジの有無を抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0027】
前記要素毎に前記要素の情報のデータを集計する解析部をさらに備えることが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集し、解析したレポートを作成することができる。
【0028】
所定の時間軸に沿って動画を表示する表示部と、表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集システムが明らかとなる。このような情報収集システムによれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0029】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、を含む情報収集方法が明らかとなる。このような情報収集方法によれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。
【0030】
===本実施形態===
<動画の概要>
本実施形態の情報収集装置について説明する前に、まず、本実施形態の動画の一例と、動画に対して実行されるアクション(例えば、後述するスワイプ操作によるアイテム情報のストック)とについて説明する。
【0031】
図1は、本実施形態の動画の一例を示す説明図である。
【0032】
図1に示されるように、ユーザー端末5(例えば、視聴者のスマートフォンやタブレット型端末など)のタッチパネル6上で動画(例えばバラエティ番組)が再生されている。画面上には、スポーツウェア(具体的には、ジャケットとパンツ)を着た人物の様子が映し出されている。本実施形態では、動画に含まれるフレーム(静止画)には予めアイテム領域が設定されている。
【0033】
「アイテム領域」とは、動画の中に映し出された物(以下、「アイテム」と呼ぶことがある)の、画面上における領域である。本実施形態では、動画に映し出されたアイテムに対してアイテム領域を設定し、そのアイテムに関する情報まで視聴者を誘導することにより、動画中のアイテムの情報を視聴者に簡易な方法で提供することができる。例えば、動画中のアイテムに関心を持ったとき、視聴者がアイテム領域を選択するだけで、アイテム領域に対応づけられているアイテム情報を表示することができる。このようなアイテム情報の表示手順の一例については、後述する
図2~
図5を参照しながら説明する。ここでは、
図1に示されるように、画面上のジャケットの領域に予めアイテム領域が設定されている。
【0034】
アイテム領域を示す枠は、
図1では非表示である。これにより、アイテム領域を示す枠が動画の視聴に邪魔になることを抑制することができる。但し、アイテム領域を示す枠は、後述する
図2に示される矩形の破線(枠41)のように、動画再生中に表示されても良い。
【0035】
動画の再生時にはフレーム(静止画)が順次切り替えられて表示されるため、動画の画面上(フレーム上)のジャケットの占める領域は刻々と変化することになる。しかし、本実施形態では、動画に追随するようにアイテム領域も刻々と変化するように設定されており、アイテム領域を示す枠(
図2に示される枠41)も刻々と変形する。
【0036】
図2は、動画においてアイテム情報をストックする操作の一例を示す説明図である。
図3は、ストックによりアイテム情報が記憶された状態の一例を示す説明図である。
【0037】
ユーザー端末5は、
図2に示されるように、予め動画に設定されているアイテム領域がスワイプ操作されたことを検出すると、そのアイテム領域に対応付けられているアイテム情報をストック情報として記憶する。ここで、「スワイプ操作」とは、画面上で指を滑らせる操作であり、「タッチ操作」に含まれる。また、「タッチ操作」とは、指で画面を触れて行う操作の総称である。「タッチ操作」には、上述した「スワイプ操作」のほか、「タップ」、「ダブルタップ」、「フリック」、「スクロール」、「ドラッグ」、「長押し」及び「ピンチイン又はピンチアウト」の各種操作が含まれる。なお、ユーザー端末5は、スワイプ操作ではなく、タップ操作等の他のタッチ操作を検出した場合に、そのアイテム領域に対応付けられているアイテム情報をストック情報として記憶しても良い。
【0038】
ユーザー端末5は、
図3に示されるように、所定のアイテム情報がストック情報として記憶されると、タッチパネル6上のストック情報表示部43にストック情報(ストックされたアイテム情報)に対応するアイテム画像44(例えばサムネイル画像)を表示する。すなわち、視聴者は、動画内のジャケットに興味を持ったときに、タッチパネル6上のジャケットを右にスワイプすると、そのジャケットのアイテム情報をストックさせることができる。また、視聴者は、そのジャケットのアイテム情報をユーザー端末5に記憶させたことをストック情報表示部43で確認できる。
【0039】
なお、
図2及び
図3では不図示だが、視聴者がアイテム情報をストックする際、そのアイテム領域に対応付けられているアイテム画像(例えばサムネイル画像)が表示されても良い。ユーザー端末5は、例えば、予め動画に設定されているアイテム領域がタップ操作されたことを検出すると、そのアイテム領域に対応付けられているアイテム画像を表示する。視聴者は、仮にアイテム領域を示す枠41(
図2中の矩形の破線)が非表示だとしても、動画内のジャケットに興味を持ったときにタッチパネル6上のジャケットをタップするとジャケットのアイテム画像が表示されるため、そのジャケットの関連情報を取得できることを認識できる。なお、ユーザー端末5は、タップ操作ではなく、ダブルタップ操作等の他のタッチ操作を検出した場合に、そのアイテム領域に対応付けられているアイテム画像を表示しても良い。
【0040】
ユーザー端末5は、ストック情報表示部43に表示されたアイテム画像44の領域がタップ操作されたことを検出すると、そのアイテム画像44(アイテム情報)に対応付けられているイベント情報に従った処理(例えば、ジャケットの購入ページ(決済ページ)の表示)を行う。なお、ユーザー端末5は、タップ操作ではなく、ダブルタップ操作等の他のタッチ操作を検出した場合に、そのアイテム画像44(アイテム情報)に対応付けられているイベント情報に従った処理を行っても良い。
【0041】
ここでは、ジャケットのアイテム情報に対して、ジャケットの購入ページ(決済ページ)のアドレスが対応付けられており、視聴者がジャケットのアイテム画像44をタップ操作すると、タッチパネル6上に、そのジャケットの購入ページ(決済ページ)が表示されることになる。なお、ジャケットの購入ページ(決済ページ)の表示画面は、ジャケットに関するアイテム情報であるとともに、ジャケットのアイテム画像44でもある。ウェブページの表示方法は、再生中の動画とともにマルチ画面として表示しても良いし、単独で表示しても良い。
【0042】
以下の説明では、視聴者が視聴中の動画に起因して端末を操作することで、所定の処理を発生させることを「アクション」と呼ぶことがある。
【0043】
アクションの例として、上述では、視聴者が視聴中の動画に予め設定されているアイテム領域をスワイプ操作する(すなわち、「視聴者が視聴中の動画に起因して端末を操作する」)ことで、アイテム領域に対応付けられているアイテム情報をストック情報として記憶させる(すなわち、「所定の処理を発生させる」)ことを説明した。
【0044】
また、アクションの別の例として、上述では、視聴者がストック情報表示部43に表示されたアイテム画像44をタップ操作する(すなわち、「視聴者が視聴中の動画に起因して端末を操作する」)ことで、タッチパネル6上に、そのアイテムの購入ページ(決済ページ)を表示させる(すなわち、「所定の処理を発生させる」)ことを説明した。
【0045】
なお、所定の処理を発生させるために視聴者が行う操作は、上述したタッチ操作(スワイプ操作やタップ操作)に限られない。所定の処理を発生させるために視聴者が行う操作は、例えば、音声入力であっても良いし、ユーザー端末5がパーソナルコンピュータの場合は、マウスのクリックや、キーボードによる入力であっても良い。アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行される。
【0046】
また、上述した例では、アクションが実行される端末(装置)は、動画が表示されている端末(装置)と同じ端末(装置)である。すなわち、動画が表示されたユーザー端末5において、スワイプ操作によるストック情報の記憶や、タップ操作によるアイテムの購入ページ(決済ページ)の表示が実行されている。
【0047】
しかし、アクションが実行される端末(装置)は、動画が表示されている端末とは異なる端末(装置)であっても良い。アクションは、動画が表示されたユーザー端末5とは別の端末、例えば、別のスマートフォンにおいて実行されても良い。この場合、後述するように、本実施形態の情報収集装置が動画の所定の時間軸(例えば、動画のタイムライン)におけるアクションの実行時間を特定することが可能な態様である必要がある。
【0048】
また、所定の処理は、ストック情報の記憶やウェブページの表示に限られず、リンクによる遷移を含むウェブページの移動や、アイテムの購入、資料請求、DM(ダイレクトメール)の送信などを含んでいても良い。つまり、アクションは、いわゆるコンバージョンを含む。
【0049】
図4は、動画においてアイテム情報をストックする操作の別の例を示す説明図である。
図5は、ストックによりアイテム情報が記憶された状態の別の例を示す説明図である。
【0050】
上述では、画面上のジャケットの領域に予めアイテム領域が設定されていた。しかし、予め動画に設定されているアイテム領域は、一つに限られない。例えば、ジャケットのほかに、画面上のパンツの領域に予めアイテム領域がさらに設定されていても良い。ユーザー端末5は、
図4に示されるように、予め動画に設定されているアイテム領域がスワイプ操作されたことを検出すると、そのアイテム領域に対応付けられているアイテム情報をストック情報として記憶する。そして、ユーザー端末5は、
図5に示されるように、所定のアイテム情報がストック情報として記憶されると、タッチパネル6上のストック情報表示部43にストック情報に対応するアイテム画像45をさらに表示する。
【0051】
すなわち、視聴者は、動画内のパンツに興味を持ったときに、タッチパネル6上のパンツを右にスワイプすると、そのパンツのアイテム情報をストックさせることができるとともに、そのパンツのアイテム情報をユーザー端末5に記憶させたことをストック情報表示部43で確認できる。これにより、視聴者は、動画を視聴しながら、上述したジャケットに関するアイテム情報以外にも、パンツのアイテム情報もストックすることができる。すなわち、視聴者は、複数のアイテム情報をストックすることができる。
【0052】
<情報収集システム100>
図6は、本実施形態の情報収集装置を含む情報収集システム100を示す図である。
図7は、情報収集装置で抽出される動画の要素についての説明図である。
【0053】
情報収集システム100は、動画に対して実行されたアクションと、動画の要素の情報(後述)とを紐づけたデータを収集するためのシステムである。後述する通信ネットワーク9を介した複数の装置により、情報収集処理が実行される。
【0054】
情報収集システム100は、
図6に示されるように、動画配信サーバー1と、メタデータ配信サーバー3と、ユーザー端末5と、情報収集サーバー10と、情報解析サーバー20とを含んで構成されている。動画配信サーバー1と、メタデータ配信サーバー3と、ユーザー端末5と、情報収集サーバー10と、情報解析サーバー20とは、通信ネットワーク9を介して相互に通信可能に接続されている。通信ネットワーク9は、例えばインターネット、電話回線網、無線通信網、LAN、VANなどであり、ここではインターネットを想定している。
【0055】
動画配信サーバー1は、多数の動画コンテンツ(以下、単に「動画」と呼ぶことがある)を配信するためのサーバーである。本実施形態では、動画配信サーバー1は、ストリーミング形式で動画データをユーザー端末5に配信する。但し、動画データの配信方法は、ダウンロード形式でも良いし、プログレッシブダウンロード形式でも良い。なお、ストリーミング形式の配信の場合には、ユーザー端末5にて動画データを一時的に記憶し、ダウンロード形式の配信の場合には、ユーザー端末5にてダウンロードされた動画データを記憶して保持することになる。さらに、動画配信サーバー1は、ライブ形式で動画コンテンツを配信しても良い。
【0056】
メタデータ配信サーバー3は、前述のアイテム情報(アイテム画像44及びアイテム画像45、イベント情報、アイテム領域などのアイテムに関する情報)を含むメタデータを配信するためのサーバーである。本実施形態では、メタデータの一部を動画再生前にプリロード形式にて配信するとともに、メタデータのその他の一部をプログレッシブダウンロード形式で配信する。但し、メタデータの配信方法は、これに限られるものではなく、例えばダウンロード形式でも良いし、ストリーミング形式でも良い。
【0057】
本実施形態では、説明の便宜のためメタデータと動画データとを切り離して説明しているが、メタデータが動画データ(動画ファイル)に格納されていてもよい。メタデータが動画データに格納された状態で動画配信サーバー1が動画データを配信する場合、情報収集システム100は、メタデータ配信サーバー3を備えていなくても良い。
【0058】
なお、メタデータ配信サーバー3が配信するメタデータは、メタデータ配信サーバー3で作成されたものであっても良いし、不図示のメタデータ作成端末によって作成されたものであっても良い。
【0059】
ユーザー端末5は、動画再生可能な情報端末(動画再生装置)である。ここでは、ユーザー端末5は、スマートフォンである。但し、ユーザー端末5は、スマートフォンに限られるものではなく、例えばタブレット型の携帯端末であっても良いし、パーソナルコンピュータであっても良い。ユーザー端末5は、不図示のCPU、メモリ、記憶装置、通信モジュール、タッチパネル6(表示部7A、入力部7B)などのハードウェアを備えている。ユーザー端末5には、動画再生プログラムがインストールされており、ユーザー端末5が動画再生プログラムを実行することによって、上述の各種動作が実現されることになる。なお、動画再生プログラムは、不図示のプログラム配信サーバーからユーザー端末5にダウンロードすることが可能である。
【0060】
ユーザー端末5は、表示部7Aと、入力部7Bと、制御部8Aと、通信部8Bとを備えている。
【0061】
表示部7Aは、各種画面を表示するための機能である。本実施形態では、表示部7Aは、タッチパネル6のディスプレイや、そのディスプレイの表示を制御するコントローラー等によって実現されている。入力部7Bは、ユーザーからの指示を入力・検出するための機能である。本実施形態では、入力部7Bは、タッチパネル6のタッチセンサー等によって実現されている。なお、ユーザー端末5がスマートフォンや、タブレット型の携帯端末の場合は、表示部7A及び入力部7Bが主にタッチパネル6によって実現されているが、表示部7A及び入力部7Bが、別々の部品で構成されても良い。例えば、ユーザー端末5がパーソナルコンピュータの場合には、表示部7Aは例えば液晶ディスプレイ等によって構成され、入力部7Bはマウスやキーボード等によって構成されることになる。
【0062】
制御部8Aは、ユーザー端末5を制御する機能である。制御部8Aは、動画データを処理して動画を再生(表示)するための機能や、メタデータを処理するための機能などを有する。また、制御部8Aは、ウェブページの情報を取得して、ウェブページを表示させるブラウザ機能なども有する。本実施形態では、制御部8Aは、不図示のCPUや、動画再生プログラムを記憶したメモリ及び記憶装置等によって実現されている。
【0063】
通信部8Bは、通信ネットワーク9に接続するための機能である。通信部8Bは、動画配信サーバー1から動画データを受信したり、メタデータ配信サーバー3からメタデータを受信したり、動画配信サーバー1やメタデータ配信サーバー3にデータを要求したりする。
【0064】
ユーザー端末5は、不図示であるが、上述した構成のほか、動画データを記憶する機能を有する動画データ記憶部や、メタデータを記憶する機能を有するメタデータ記憶部や、ストックされたアイテム情報を動画データに対応付けて記憶するストック情報記憶部を有していても良い。
【0065】
情報収集サーバー10は、動画に対して実行されたアクションと、動画の要素の情報(後述)とを紐づけたデータを収集するためのサーバーである。情報収集サーバー10は、ユーザー端末5において実行されたアクションに関するデータ(例えば、後述するアクションの実行時間)と、ユーザー端末5において表示された動画の要素の情報(後述)とを紐付けたデータを収集する情報収集処理を実行する。
【0066】
本実施形態では、情報収集サーバー10の不図示の各種ハードウェアと各種ソフトウェアとの協働により、情報収集サーバー10における情報収集処理を含む各種処理の実行が可能になる。本実施形態の情報収集装置として、情報収集サーバー10が相当する例を示しているが、情報収集装置は、複数のサーバーを含んでいても良い。そして、ネットワークを介した当該複数のサーバーの協働により、情報収集処理を含む各種処理が実行されても良い。
【0067】
情報収集サーバー10は、例えばコンピュータであり、演算装置(CPUなど)、メモリ、記憶装置、通信装置などで構成されている。記憶装置には、情報収集プログラムを含む各種のプログラムや各種のデータが記憶されている。演算装置が記憶装置に記憶されている情報収集プログラムをメモリに読み出して実行することにより、情報収集処理を含む各種処理、すなわち、後述の各機能(特定部11、抽出部12及び紐付け部13)が実現される。
【0068】
図6に示される情報収集システム100では、情報収集サーバー10は、一つのユーザー端末5と通信ネットワーク9を介して接続しているが、情報収集サーバー10は、多数のユーザー端末5からデータを収集し、アクションと動画の要素の情報とを紐づけたデータを多数収集することができる。
【0069】
情報収集サーバー10は、特定部11と、抽出部12と、紐付け部13とを有する。
【0070】
特定部11は、動画の所定の時間軸におけるアクションの実行時間を特定する機能である。アクションが、動画が表示されている装置(ここでは、表示部7Aを有するユーザー端末5)において実行される場合、特定部11は、動画のタイムラインにおける、アクションが実行されたときの時間のデータをユーザー端末5から取得する。アクションが、動画が表示されている装置とは異なる装置(例えば、ユーザー端末5のスマートフォンとは別のスマートフォン)において実行される場合、特定部11は、動画のタイムラインと、アクションが実行されたときの時間とを紐付けて保存する。
【0071】
抽出部12は、アクションの実行時間よりも所定時間前の、動画の要素の情報を抽出する機能である。ここで、動画の「要素」とは、動画を構成する要素であり、
図7に示されるように、例えば、動画におけるセリフ、コメント、キャプション又はカメラワークである。但し、抽出部12が抽出する対象となる動画の要素は、セリフ、コメント、キャプション及びカメラワーク以外の要素が含まれていても良い。また、抽出部12が抽出する対象となる動画の要素は、セリフ、コメント、キャプション及びカメラワークのいずれか1つに限られず、2つ以上であっても良い。
【0072】
また、「要素の情報」とは、動画の当該要素に関連する情報である。要素の情報の詳細については、後述する。
【0073】
抽出部12は、アクションの実行時間よりも所定時間前の、動画の要素の情報を抽出する。抽出部12は、具体的には、例えばアクションの実行時間より15秒前から5秒前程度の範囲の動画の要素の情報を抽出する。動画の要素の情報が発生、すなわち動画に特定の要素の情報が映し出されてから、視聴者がリンクに飛ぶと判断してアクションを起こす(すなわち、アクションの実行時間)までにタイムラグが発生する。このため、アクションの実行時間よりも所定時間前の範囲にさかのぼって動画の要素の情報を抽出することにより、アクションとの間に強い関連性を有する動画の要素の情報を精度良く抽出することができる。但し、「所定時間前」は、15秒前から5秒前程度の範囲に限られず、他の長さであっても良い。動画の種類、アクションの種類によって、所望の時間を設定することができる。
【0074】
例えば、動画配信サーバー1が配信する動画コンテンツが、ECを目的としたショッピング動画である場合、視聴者は初めから自分が欲しいものがないか興味を持って動画を視聴している。このような場合では、動画内のインフルエンサーが商品の購買を促すようなプレゼンテーションを行っていることが通常であり、視聴者が商品の購入の決断をする時間(すなわち、アクションを行うきっかけとなる時間)は、アクションの実行時間からそれほど大きくさかのぼる必要はない。ショッピング動画では、例えば、アクションの実行時間の15秒前から5秒前程度の範囲に視聴者の興味を喚起した要素の情報があったはずである。このため、抽出部12は、アクションの実行時間よりも15秒前から5秒前程度の範囲にさかのぼって動画の要素の情報を抽出すればよい。
【0075】
しかし、例えば、動画配信サーバー1が配信する動画コンテンツが映画である場合、登場人物である映画俳優が身に着けているものに興味を持ち、視聴者が購買意欲を抱くには通常はかなり時間を要する。例えば、繰り返し映し出される格好のよい出演者にあこがれを抱き、印象深いシーンでアクションを実行することになる。このような場合は、アクションの実行時間の15分程度前くらいから商品の購入の決断をするきっかけとなる時間(すなわち、アクションを行うきっかけとなる時間)があると考えられる。このため、「所定時間前」を「15分前から5分前」と設定しても良い。つまり、抽出部12は、アクションの実行時間よりも15分前から5分前程度の範囲にさかのぼって動画の要素の情報を抽出しても良い。
【0076】
なお、抽出部12は、全ての動画の要素の情報を抽出するのではなく、期間を絞って抽出している。これにより、要素の情報のデータを抽出するためのマシンパワーを抑制することができるし、上述したような商品の購買を決断したであろう瞬間を抽出できる確率が高くなる。もちろん、抽出部12は、全ての動画の要素の情報を抽出しても良い。
【0077】
紐付け部13は、実行されたアクションと、抽出された要素の情報とを紐付けて保存する機能である。例えば、ストックに対して、抽出部12が、セリフのテキストデータを抽出した場合、
図7に示されるように、当該ストック及びストックが実行された時間と、セリフのテキストデータを関連させたテーブル情報を記録部16に保存する。
【0078】
例えば、動画配信サーバー1がライブ配信でのショッピング動画を配信している場合、動画内の出演者が、「普段は値引きしないのですが、ライブでの視聴者に限り、今から15分間、2割引き!」といったセリフを話す事により、視聴者の購買の決断に大きく寄与することが想定される。したがって、出演者のセリフを抽出することで、どのようなセリフが購買の決断に寄与するのかを、事後に分析することができる。
【0079】
情報解析サーバー20は、動画の要素毎に要素の情報のデータを集計するためのサーバーである。本実施形態では、情報解析サーバー20の不図示の各種ハードウェアと各種ソフトウェアとの協働により、情報解析サーバー20における情報解析処理を含む各種処理の実行が可能になる。但し、ネットワークを介した複数のサーバーの協働により、情報解析処理を含む各種処理が実行されても良い。
【0080】
情報解析サーバー20は、例えばコンピュータであり、演算装置(CPUなど)、メモリ、記憶装置、通信装置などで構成されている。記憶装置には、情報解析プログラムを含む各種のプログラムや各種のデータが記憶されている。演算装置が記憶装置に記憶されている情報解析プログラムをメモリに読み出して実行することにより、解析部(後述)による情報解析処理を含む各種処理が実現される。
【0081】
なお、情報解析サーバー20は、情報収集サーバー10とともに情報収集装置を構成する。但し、情報収集サーバー10が情報解析サーバー20の機能を備えていても良い。また、情報収集システム100は、情報収集装置には、情報解析サーバー20が含まれていなくても良い。情報解析サーバー20により生成された情報解析画面の例については、後述する。
【0082】
<要素の情報>
以下では、本実施形態で例示したセリフ、コメント、キャプション及びカメラワークの各々の要素について、要素の情報の例と、抽出部12による抽出方法を説明する。
【0083】
・セリフ
抽出部12は、動画の音声を解析することにより、セリフに関する要素の情報を抽出する。抽出部12は、具体的には、動画の音声の文字起こしを行うソフトウェアを備えており、動画の音声の文字起こしを自動で行うことができる。すなわち、抽出部12は、セリフに関する要素の情報として、動画の音声を解析し、セリフに関するテキストデータを抽出する。また、抽出部12は、形態素解析により当該テキストデータを単語に分解し、単語毎のデータや単位時間当たりの発生単語数のデータを抽出しても良い。
【0084】
さらに、抽出部12は、要素の情報として、当該テキストデータに関連する付加データを生成することができる。抽出部12は、具体的には、セリフ発声者の年齢や性別に関するデータを、動画の音声から自動で生成、もしくは事前に動画に紐づけられた情報のリストから抽出することができる。また、抽出部12は、セリフのネガポジ数値(ネガティブ・ポジティブ数値)に関するデータを、セリフに含まれる単語の感情極性によるネガポジ判定(ネガティブ・ポジティブ判定)から自動で生成することができる。また、抽出部12は、セリフのネガポジ数値(ネガティブ・ポジティブ数値)に関するデータを、セリフに含まれる単語の感情極性によるネガポジ判定(ネガティブ・ポジティブ判定)から自動で生成することができる。また、抽出部12は、セリフの絶対音量やセリフの音量の動画全体からの偏差に関するデータを、動画の音量や、セリフの音量の動画の音量全体からの偏差計算により自動で生成することができる。
【0085】
なお、ここでのテキストデータに関連する付加データは、動画から直接得られるデータではなく、抽出部12が要素の情報を抽出する際(すなわち、特定部11がアクションの実行時間を特定した後)に生成するデータでもある。これにより、動画とアクションとを紐付けた際に、より多くの情報を収集することができる。
【0086】
・コメント
抽出部12は、動画に付加されたコメントのテキストデータを抽出する。ここで、「コメント」とは、動画の配信者や視聴者が動画に付加して投稿することができるテキストのことである。例えば、動画配信サーバー1がライブ配信でECを目的としたショッピング動画を配信している場合、動画の視聴者が「そのワンピースかわいい!」とか「もっと濃い色のものはないかな」といった反応をコメントとして投稿する。これにより、出演者が当該コメントに対してリアクションすることで、動画に対する視聴者の反応を共有することができる。
【0087】
動画の視聴者が「もっと濃い色のものはないかな」との反応をコメントとして投稿した場合、出演者が「もっと濃い色」のアイテム(ここでは、ワンピース)を用意できたかどうかは、視聴者の購買の決断に大きく寄与することが想定される。このようなコメントは、テキストデータであるので、そのテキストデータを抽出することで、どのような視聴者のコメントが購買に結び付いたのかを事後に分析することができる。また、抽出部12は、形態素解析により当該テキストデータを単語に分解し、単語毎のデータや単位時間当たりの投稿単語数のデータを抽出しても良い。
【0088】
さらに、抽出部12は、要素の情報として、当該テキストデータに関連する付加データを生成することができる。抽出部12は、具体的には、コメント投稿者の年齢や性別に関するデータを、動画の音声から自動で生成することができる。また、抽出部12は、コメントのネガポジ数値(ネガティブ・ポジティブ数値)に関するデータを、コメントに含まれる単語の感情極性によるネガポジ判定(ネガティブ・ポジティブ判定)から自動で生成することができる。
【0089】
ポジティブと判定されたコメントが、視聴者の購買の決断につながるであろうことは容易に想定できる。しかし、例えばニンジンのピクルスのショッピング動画での、「実は、今年はニンジンが取れすぎてしまって困っているんだよね。」といった、一見ネガティブと判定されるようなコメントも、時に視聴者の購買の決断につながることもある。したがって、このようなネガポジ判定の結果に関する付加データを抽出して収集しておくことで、予想していない感情極性が購買に結び付いていないかを事後に分析することができる。
【0090】
なお、ここでのテキストデータに関連する付加データは、コメントのテキストデータのような、動画から直接得られるデータではなく、抽出部12が要素の情報を抽出する際(すなわち、特定部11がアクションの実行時間を特定した後)に生成するデータでもある。これにより、動画とアクションとを紐付けた際に、より多くの情報を収集することができる。
【0091】
・キャプション
抽出部12は、動画に付加されたキャプションのテキストデータを抽出する。ここで、「キャプション」とは、動画に付加されたテキストであり、例えば、字幕やサイドスーパーである。動画にキャプションがテキストデータとして付加されている場合は、当該テキストデータをそのまま抽出しても良いし、動画にキャプションがテキストデータではなく、例えば画像データとして付加されている場合は、画面に表示されたキャプションを文字認識により抽出しても良い。抽出部12は、具体的には、動画中に含まれる文字の認識を行うソフトウェアを備えており、動画の文字認識を自動で行うことができる。
【0092】
また、抽出部12は、形態素解析により当該テキストデータを単語に分解し、単語毎のデータや単位時間当たりの発生単語数のデータを抽出しても良い。例えば、動画配信サーバー1がスニーカーのショッピング動画を配信している場合、画面内に白いアイテム(ここでは、スニーカー)が表示されていて、キャプションで他の色のアイテム(スニーカー)として青や赤のスニーカーがあると表示されたことをきっかけとして視聴者が購買の決断を行うことがある。このようなキャプションがきっかけとなって視聴者が購買の決断に至った可能性や、どのような文言をキャプションとして入れれば購買の決断につなげることにできるのかを、キャプションのテキストデータを抽出することによって事後に分析することができる。
【0093】
さらに、抽出部12は、要素の情報として、当該テキストデータに関連する付加データを生成することができる。抽出部12は、具体的には、動画の領域に対するキャプションの領域の割合のデータ、動画におけるキャプションの位置のデータ、キャプションの色情報のデータを、自動で生成することができる。
【0094】
なお、ここでのテキストデータに関連する付加データは、動画から直接得られるデータではなく、抽出部12が要素の情報を抽出する際(すなわち、特定部11がアクションの実行時間を特定した後)に生成するデータでもある。これにより、動画とアクションとを紐付けた際に、より多くの情報を収集することができる。
【0095】
・カメラワーク
「カメラワーク」とは、動画の撮影技法全般であり、被写体の撮影技法や、シーンの撮影技法などを含む。抽出部12は、動画における被写体を検知することにより、被写体の大きさ、移動量、明るさ及びコントラストや、カメラの被写体毎の寄り・引きの度合い及びカメラの移動量のデータを抽出する。また、動画におけるシーンチェンジを検知することにより、シーンチェンジの有無のデータを抽出する。
【0096】
<その他の要素>
なお、上述した要素(セリフ、コメント、キャプション、カメラワーク)はあくまで一例であり、動画を構成する要素であれば、その他の例が含まれていても良い。
【0097】
・BGM
抽出部12は、動画の音を解析することにより、BGMに関する要素の情報を抽出することもできる。ここで、「BGM」とは、Back Ground Musicの略であり、背景音楽として動画内で流されている曲の情報全般である。抽出部12は、BGMに関する要素の情報として、曲の種類(ロック、ポップス、ジャズ、クラッシック、楽器のみ、歌あり等)や調整(Cメジャー、Eマイナー等)、音量などを抽出しても良い。
【0098】
また、上述した動画の各要素に関する要素の情報はあくまで一例であり、動画の当該要素に関連する情報であれば、その他の例が含まれていても良い。
【0099】
<情報収集手順>
以下では、上述した
図6及び
図7を再び参照しつつ、
図8~
図10の本実施形態の情報収集装置による情報収集手順について説明する。ここでは、動画の要素の一つである「セリフ」を紐付けたデータが収集される場合について説明するが、すでに説明したように、動画の要素は「セリフ」に限られるものではなく、他の要素(例えば、コメント、キャプション、カメラワークなど)を紐付けたデータが収集されても良い。
【0100】
図8は、本実施形態の情報収集装置による情報収集手順の第1例を示す説明図である。
図9は、本実施形態の情報収集装置による情報収集手順の第2例を示す説明図である。
図10は、本実施形態の情報収集装置による情報収集手順の第3例を示す説明図である。
【0101】
図8に示されるように、端末で動画(例えばバラエティ番組)が再生されている。動画の再生中、タイムライン上の1:48の時点で、人物が「このジャケット、お得ですね」とのセリフを発して、視聴者が動画内のジャケットに興味を持った場面を想定する。上述したように、視聴者は、ジャケットに関するアイテム情報をストックさせることができる。ここで、タイムライン上の1:53の時点で、アクション(ここでは、ストック)が実行された場合、本実施形態の情報収集装置は、下記のような手順で動画に対して実行されたアクションと、動画の要素の情報とを紐づけたデータを収集する。
【0102】
タイムライン(所定の時間軸)に沿って表示された動画に対してアクション(ストック)が実行されたときに、まず、情報収集サーバー10の特定部11が、タイムラインにおけるアクションの実行時間を特定する。特定部11は、具体的には、動画のタイムラインにおける、アクション(ストック)が実行されたときの時間のデータ(1:53)をユーザー端末5から取得する。
【0103】
次に、情報収集サーバー10の抽出部12が、アクション(ストック)の実行時間(1:53)よりも所定時間前(例えば、35秒前から5秒前までの30秒間)の、動画の要素の情報を抽出する。動画の要素の情報は、
図8では、セリフのテキストデータ(「このジャケット、お得ですね」)である。また、抽出部12は、要素の情報として、セリフ発声者の年齢や性別に関するデータ等のテキストデータに関連する付加データをさらに生成しても良い。当該付加データは、特定部11が、動画のタイムラインにおけるアクションの実行時間を特定した後に、抽出部12により生成されるデータである。抽出部12は、画面からキャプチャした画像や、それを縮小したサムネイル画像をさらに抽出しても良い。
【0104】
そして、情報収集サーバー10の紐付け部13は、実行されたアクション(ストック)と、抽出された要素の情報とを紐付けて保存する。すなわち、ストックのデータと、セリフのテキストデータを関連させたテーブル情報を情報収集サーバー10の記録部16に保存する。
【0105】
上述では、アクションは、ストックであったが、
図9に示されるようなURL遷移(例えば、ジャケットの購入ページ(決済ページ)の表示)や、
図10に示されるような商品購入であっても良い。なお、これらのアクションが、動画が表示されている装置とは異なる装置において実行される場合、情報収集サーバー10の特定部11は、動画のタイムラインと、アクションが実行されたときの時間とを紐付けて保存することにより、アクションの実行時間を特定する。
【0106】
<解析部>
情報解析サーバー20は、解析部を有する。解析部は、動画の要素毎に要素の情報のデータを集計する機能である。解析部は、情報収集サーバー10の記録部16に保存されているデータを集計することによって情報解析画面を生成する。これにより、動画とアクションとを紐付けたデータを解析したレポートを作成することができる。
【0107】
情報解析サーバー20には、通信ネットワーク9を介して管理者端末が接続されており、情報解析画面は、管理者端末の表示部(例えば、液晶ディスプレイ等)に表示される。なお、情報解析画面が表示される表示部は、情報解析サーバー20が有していても良く、その場合、管理者端末は無くても良い。
【0108】
図11は、情報解析画面の第1例の概要を示す説明図である。
図12は、情報解析画面の第1例において、要素の情報が表示された状態の一例を示す説明図である。
【0109】
図11及び
図12に示される情報解析画面の第1例は、各々で要素の情報が集約された多数の動画から、要素の情報を表示させたい動画を指定して、アクションの実行に至った動画の要素の情報を表示させる例である。
【0110】
図11の上部に示されるグラフでは、横軸が動画の配信日時を表し、縦軸がユニークユーザー(UU)数又はユニークユーザーによるアクション率を表している。そして、ある配信日時に関する棒グラフは、その配信日時に配信された動画1本に関するデータを示している。ここで、「ユニークユーザー」とは、所定の期間内に動画を視聴した視聴者である。ユニークユーザーは、1人の視聴者ごとに固有の値として取得されるため、同じ期間内での動画へのアクセス回数に関係なく、「1」として計測されることになる。
【0111】
例えば、横軸左側の配信日時「05/20 12:00」におけるデータでは、LIVE再生UUが約380名、アーカイブ再生UUが約120名であり、合計約600名のユニークユーザーが当該動画を視聴したことが示されている。ここで、「LIVE再生UU」とは、動画が配信された時にリアルタイムで視聴したユニークユーザー数であり、「アーカイブ再生UU」とは、サーバーにアーカイブとして保存された動画を配信後にダウンロードして視聴したユニークユーザー数である。
【0112】
図11の上部に示されるグラフでは、ユニークユーザーのうち、当該動画のうちアクション(ここでは、ストックやURL遷移)を実行したユニークユーザーの割合であるアクション率を表している。例えば横軸左側の配信日時「05/20 12:00」におけるデータでは、ストックアクション率(通算)が20%である。これは、その動画全体を通して、約600名のユニークユーザーのうちの20%に相当する約120名が、何らかのアクションによってリンクや詳細データをストックしたことが示されている。
【0113】
また、例えば横軸左側の配信日時「05/20 12:00」におけるデータでは、URL遷移アクション率(通算)が約10%である。これは、約600名のユニークユーザーのうちの10%に相当する約60人が、URL遷移、すなわち購買サイトにストックしたリンクから遷移したことが示されている。
【0114】
図11の左下部には、視聴者合計(UU)と、視聴者数ピークとが示されている。視聴者合計(UU)は、その動画を通算して視聴したユニークユーザー数である。視聴者数ピークは、同じ配信日時に視聴していたユニークユーザー数が最大だった瞬間のユニークユーザー数である。
図11の左下部では、ストックアクション率が24.4%であることが示され、前回の動画のストックアクション率の30.6%よりも低下していることが示されている。また、URL遷移アクション率が14.1%であることが示され、前回の動画のURL遷移アクション率の16.3%よりも低下していることが示されている。それぞれの数値(ストックアクション率及びURL遷移アクション率)には、前回よりも低下したことを示す下向き矢印アイコンが表示されている。
【0115】
このように、複数の動画を配信した際に、それぞれの動画を比較検討することで、よりストックにつながった動画、よりURL遷移アクションにつながった動画が分かるようになる。
【0116】
解析部は、情報収集サーバー10の記録部16に保存されている複数の動画に関するデータについて、動画毎の、ユニークユーザー数及びアクションの数を集計する。これにより、
図11及び
図12の各々の上部に示されるアクション発生グラフを生成することができる。管理者端末は、アクション発生グラフのデータを情報解析サーバー20から取得し、表示部に表示する。
【0117】
ここで、
図12に示されるように、情報解析画面において、所定の時点のグラフを選択したときに、
図12の右下に、動画の要素(ここでは、セリフ、コメント、キャプション及びカメラワーク)毎に、要素の情報(例えば、「プレゼント」、「今なら」などのセリフ中の単語)を表示することができる。これにより、動画のタイムライン上の任意の時点において、どのような要素の情報により当該アクションに至ったかを容易に把握することができる。
図12では例として「セリフ」タブをアクティブにした状態を示しているが、同様に「視聴者コメント」「キャプション字幕」「カメラワーク」のタブをクリックすることで、その動画で抽出された要素の情報が列挙されて表示される。
【0118】
管理者端末の表示部に表示されたアクション発生グラフにおいて、所定の配信日時のグラフが選択されたとき、管理者端末は選択された配信日時を情報解析サーバー20に送信する。そして、情報解析サーバー20は当該選択された配信日時に応じた動画の要素の情報を管理者端末に送信する。これにより、管理者端末の表示部で、
図12に示されるように、選択された配信日時の動画の要素の情報が表示されることになる。
【0119】
図13は、情報解析画面の第2例の概要を示す説明図である。
図14は、情報解析画面の第2例において、要素の情報が表示された状態の一例を示す説明図である。
【0120】
図13及び
図14に示される情報解析画面の第2例は、ある1本の動画について、アイテムの指定から、アクションの時点と要素の情報を表示させる例である。
図13及び
図14の各々の左側には、動画に映し出されたアイテムの一覧が示されている。また、
図13及び
図14の各々の右側の上部には、動画のタイムラインを横軸とし、動画全体のアクション(ここでは、ストック)数を縦軸としたストック発生グラフが表示されている。
【0121】
図13の右上部に示されているグラフでは、横軸が、ある1本の動画の開始から終了までの時間(タイムライン)を表し、縦軸が、その動画から視聴者がアクションを実行した数(ここでは、ストックを実行した数)を表している。例えば、横軸左側の時間「00:01:56」におけるデータを見ると、ストック数が急激に伸びており、270ほどのストックが発生していることが分かる。
図13の右上に示されているグラフの場合、数分おきにストックのピークが発生していることが分かる。このような傾向を示すのは、商品アイテムを順次プレゼンテーション形式で紹介するショッピング動画であることが多い。
【0122】
図13の左上部には、「総アイテムストック個数」が示されている。「総アイテムストック個数」は、当該1本の動画でストックされた個数を示しており、ここでは、22,686個である。また、当該1本の動画の1再生につき、1.5回のストックが行われたことが示されている。
【0123】
図13の左上部には、さらに「ユニークアイテムストック個数」が示されている。「ユニークアイテムストック個数」は、ここでは、13,354個である。また、当該1本の動画の1再生につき、1.6回のストックが行われたことが示されている。
【0124】
図13の左下部にはその動画で紹介されているアイテムの情報が示されている。タイトルが商品名、URLがストックされたリンク情報で遷移する先のURLを示している。例えば商品名がAAAAのアイテムの場合、242回ストックされ、1.6%のURL遷移率であったことが示されている。
【0125】
解析部は、情報収集サーバー10の記録部16に保存されているデータについて、アイテムの一覧を取得する。これにより、
図13及び
図14の各々の左側に示されるアイテムの一覧を生成することができる。また、解析部は、情報収集サーバー10の記録部16に保存されているデータについて、動画の時点(時間)毎の、アクション(ここでは、ストック)の数を集計する。これにより、
図13及び
図14の各々の右側の上部に示されるアクション(ここでは、ストック)発生グラフを生成することができる。管理者端末は、アイテムの一覧及びアクション発生グラフのデータを情報解析サーバー20から取得し、表示部に表示する。
【0126】
ここで、
図14に示されるように、情報解析画面において、任意のアイテム(ここでは、アイテムFFFF)を選択すると、そのアイテムがストックされたアクションの個数のみを選択して「アイテム合計ストック発生グラフ」に表示する。この例の場合、14分30秒の所でストック数が急増している。また、
図14の右下部にはアイテムの、要素の情報(例えば、「このワンピ、気になっていました」などのセリフ)を表示することができる。これにより、アイテムの指定毎に、当該アクションの時点と、どのような要素の情報により当該アクションに至ったかを容易に把握することができる。
【0127】
管理者端末の表示部に表示されたアイテムの一覧において、任意のアイテムが選択されたとき、管理者端末は選択されたアイテムの情報を情報解析サーバー20に送信する。そして、情報解析サーバー20は当該選択されたアイテムに応じた動画の要素の情報を管理者端末に送信する。これにより、管理者端末の表示部では、
図14に示されるように、選択されたアイテムの要素の情報及びストック発生グラフが表示されることになる。
【0128】
図15は、情報解析画面の第3例の概要を示す説明図である。
【0129】
図15に示されるように、情報解析画面では、複数の動画を横断してアクションに至った要素の情報を表示させることもできる。これにより、動画単体ではなく全体の統計を把握することができる。
【0130】
本解析画面では、
図15の上段部に示されるように、「コンテンツ種別」「配信期間」「アクション種別」毎の要素の情報を表示することができる。ここで、コンテンツ種別は、ショッピング動画、映画、バラエティ番組等の種別に分けられるが、
図15に示されるように、「全コンテンツ」の動画を表示することもできる。配信期間は、任意の期間を指定することにより、期間を絞った分析をすることができる。アクション種別は、
図15に示されるように、「タップ」「ストック」「ジャンプ」「画面内リンク」「遷移先CV」が示されているが、何も選択しない場合は、動画の「全アクション」について表示することもできる。
【0131】
本解析画面では、
図15の中段部に示されるように、動画の要素(ここでは、セリフ、視聴者コメント、キャプション・字幕、カメラワーク)毎に要素の情報を表示することができる。
図15に示される例では、カメラワークにおける要素の情報が示されており、例えば、被写体種別、カメラ拡大率(寄り・引き)、カメラ移動量、明るさ・コントラストの情報が示されている。但し、要素の情報は
図15に示される例に限られず、その他の情報が表示されても良い。
【0132】
解析部は、情報収集サーバー10の記録部16に保存されているデータについて、全動画の要素の情報を取得する。また、解析部は、情報収集サーバー10の記録部16に保存されているデータについて、コンテンツ種別、配信期間、アクション種別、動画の要素毎の要素の情報を集計する。これにより、
図15に示される全体の統計の情報を生成することができる。管理者端末は、全動画の要素の情報のデータを情報解析サーバー20から取得し、表示部に表示する。
【0133】
===その他===
前述の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更・改良され得ると共に、本発明には、その等価物が含まれることは言うまでもない。
【0134】
例えば、情報収集サーバー10の抽出部12は、視聴者の端末(ユーザー端末5)にソフトウェアとしてインストールされていても良い。この場合、動画の要素を視聴者の端末で解析し、解析結果だけをサーバーに送信する。また、抽出部12は動画配信サーバー1にソフトウェアとしてインストールされていても良い。この場合は、視聴者の端末(ユーザー端末5)から、どの動画のいつのタイミングでアクションを発生させたかをサーバーに送信する。サーバーは特定の動画の時間情報から動画の要素を抽出する。この場合はサーバー側で動画をアーカイブしておく必要があるが、ユーザー端末5の負荷を減らし、より軽快な視聴環境を提供できる。
【0135】
上記実施形態では、記録部16はサーバーにあるとして説明したがこの限りではなく、記録部16は、ユーザー端末5にメモリ領域として確保されていても良い。これによって視聴者のプライバシーを守りつつ、特定の購買行動を視聴者の携帯端末で解析し広告表示の制御に用いることができる。
【0136】
動画の要素の情報は実施形態のものに限られない。出演者の属性(俳優、コメディアン、アニメーション)や、スポーツ中継の選手のユニフォームのロゴや競技場に掲げられた看板等、動画の中に映っていて視聴者の興味を喚起し、購買決定のきっかけになると考えられるものであればどのようなものでも良い。
【符号の説明】
【0137】
1 動画配信サーバー
3 メタデータ配信サーバー
5 ユーザー端末
6 タッチパネル
7A 表示部
7B 入力部
8A 制御部
8B 通信部
9 通信ネットワーク
10 情報収集サーバー
11 特定部
12 抽出部
13 紐付け部
16 記録部
20 情報解析サーバー
41,42 枠
43 ストック情報表示部
44,45 アイテム画像
100 情報収集システム
【手続補正書】
【提出日】2024-02-21
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
を備え、
前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である情報収集装置。
【請求項2】
前記アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行される、
請求項1に記載の情報収集装置。
【請求項3】
前記アクションは、前記動画が表示されている装置において実行される、
請求項2に記載の情報収集装置。
【請求項4】
前記アクションは、前記動画が表示されている装置とは異なる装置において実行される、
請求項2に記載の情報収集装置。
【請求項5】
前記動画の前記要素の情報は、前記特定部が前記実行時間を特定した後に生成される、
請求項1に記載の情報収集装置。
【請求項6】
前記動画の前記要素は、前記動画におけるセリフであって、
前記抽出部は、前記要素の情報として、前記動画の音声を解析し、テキストデータを抽出する、
請求項1に記載の情報収集装置。
【請求項7】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項6に記載の情報収集装置。
【請求項8】
前記要素は、前記動画における前記コメントであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記コメントのテキストデータを抽出する、
請求項1に記載の情報収集装置。
【請求項9】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項8に記載の情報収集装置。
【請求項10】
前記要素は、前記動画における前記キャプションであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記キャプションのテキストデータを抽出する、
請求項1に記載の情報収集装置。
【請求項11】
前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項10に記載の情報収集装置。
【請求項12】
前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画における被写体を検知し、前記被写体の大きさ、移動量、明るさ及びコントラストの少なくとも1つ以上を抽出する、
請求項1に記載の情報収集装置。
【請求項13】
前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画におけるシーンチェンジを検知し、前記シーンチェンジの有無を抽出する、
請求項1に記載の情報収集装置。
【請求項14】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
前記要素毎に前記要素の情報のデータを集計する解析部と、
を備える情報収集装置。
【請求項15】
前記解析部は、前記アクションの数を集計することにより、前記アクションに紐づけられた前記要素の情報のデータを集計する、
請求項14に記載の情報収集装置。
【請求項16】
前記解析部は、複数の前記アクションの数を集計し、
前記複数のアクションの各々の実行時間に対する前記要素の情報のデータを集計する、
請求項14及び15に記載の情報収集装置。
【請求項17】
前記解析部は、複数の前記動画について、前記複数の動画毎の前記要素の情報のデータを集計する、
請求項14及び15に記載の情報収集装置。
【請求項18】
所定の時間軸に沿って動画を表示する表示部と、
表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
を備え、
前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である、
コンピュータを用いて構築された情報収集システム。
【請求項19】
所定の時間軸に沿って動画を表示する表示部と、
表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
前記要素毎に前記要素の情報のデータを集計する解析部と、
を備える、コンピュータを用いて構築された情報収集システム。
【請求項20】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、
をコンピュータに実行させ、前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である、情報収集方法。
【請求項21】
所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、
前記要素毎に前記要素の情報のデータを集計すること、
をコンピュータに実行させる情報収集方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正の内容】
【0006】
本発明の一態様は、所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備え、前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である情報収集装置である。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正の内容】
【0007】
本発明の一態様は、所定の時間軸に沿って動画を表示する表示部と、表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備え、前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である、コンピュータを用いて構築された情報収集システムである。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】
本発明の一態様は、所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、をコンピュータに実行させ、前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも1つ以上である、情報収集方法である。