特開2024-62424 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ パロニム株式会社の特許一覧

特開2024-62424情報収集装置、情報収集システム及び情報収集方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024062424

(43)【公開日】2024-05-10

(54)【発明の名称】情報収集装置、情報収集システム及び情報収集方法

(51)【国際特許分類】

G06Q 30/0241 20230101AFI20240501BHJP

【ＦＩ】

G06Q30/02 446

【審査請求】有

【請求項の数】21

【出願形態】ＯＬ

(21)【出願番号】P 2022163879

(22)【出願日】2022-10-12

(11)【特許番号】

(45)【特許公報発行日】2024-04-30

(71)【出願人】

【識別番号】517039003

【氏名又は名称】パロニム株式会社

(74)【代理人】

【識別番号】110000176

【氏名又は名称】弁理士法人一色国際特許事務所

(72)【発明者】

【氏名】小林道生

【テーマコード（参考）】

5L030

5L049

【Ｆターム（参考）】

5L030BB08

5L049BB08

(57)【要約】

【課題】動画とアクションとを紐付けた際に、多くの情報を収集する。
【解決手段】所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集装置である。
【選択図】図６

【特許請求の範囲】

【請求項1】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
を備える情報収集装置。

【請求項2】

前記アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行される、
請求項１に記載の情報収集装置。

【請求項3】

前記アクションは、前記動画が表示されている装置において実行される、
請求項２に記載の情報収集装置。

【請求項4】

前記アクションは、前記動画が表示されている装置とは異なる装置において実行される、
請求項２に記載の情報収集装置。

【請求項5】

前記動画の前記要素の情報は、前記特定部が前記実行時間を特定した後に生成される、
請求項１に記載の情報収集装置。

【請求項6】

前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも１つ以上である、
請求項１～５のいずれか一項に記載の情報収集装置。

【請求項7】

前記動画の前記要素は、前記動画におけるセリフであって、
前記抽出部は、前記要素の情報として、前記動画の音声を解析し、テキストデータを抽出する、
請求項６に記載の情報収集装置。

【請求項8】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項７に記載の情報収集装置。

【請求項9】

前記要素は、前記動画における前記コメントであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記コメントのテキストデータを抽出する、
請求項６に記載の情報収集装置。

【請求項10】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項９に記載の情報収集装置。

【請求項11】

前記要素は、前記動画における前記キャプションであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記キャプションのテキストデータを抽出する、
請求項６に記載の情報収集装置。

【請求項12】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項１１に記載の情報収集装置。

【請求項13】

前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画における被写体を検知し、前記被写体の大きさ、移動量、明るさ及びコントラストの少なくとも１つ以上を抽出する、
請求項６に記載の情報収集装置。

【請求項14】

前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画におけるシーンチェンジを検知し、前記シーンチェンジの有無を抽出する、
請求項６に記載の情報収集装置。

【請求項15】

前記要素毎に前記要素の情報のデータを集計する解析部をさらに備える、
請求項１に記載の情報収集装置。

【請求項16】

所定の時間軸に沿って動画を表示する表示部と、
表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
を備える情報収集システム。

【請求項17】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、
を含む情報収集方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報収集装置、情報収集システム及び情報収集方法に関する。

【背景技術】

【0002】

特許文献１には、インターネットやパソコン通信等のネットワークを利用した電子商取引において、どのバナー広告からのアクセスが実際に商品等の購入に結び付いたのかを把握することができる広告情報管理装置が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００２－０３２６５９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

ところで、動画の視聴中に商品等の購入を含むアクションが実行される場面において、当該動画と当該アクションとを紐付けて把握することの需要が高まっている。しかし、アクションがどの動画から実行されたのかを把握することはできても、アクションが動画のどんな状況から実行されたのかを把握することは困難であった。つまり、動画とアクションとを紐付けたとしても、収集できる情報が少なかった。

【0005】

本発明の目的の一例は、動画とアクションとを紐付けた際に、多くの情報を収集することができる情報収集装置、情報収集システム及び情報収集方法を提供することにある。本発明の他の目的は、本明細書の記載から明らかになるであろう。

【課題を解決するための手段】

【0006】

本発明の一態様は、所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集装置である。

【0007】

本発明の一態様は、所定の時間軸に沿って動画を表示する表示部と、表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集システムである。

【0008】

本発明の一態様は、所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、を含む情報収集方法である。

【0009】

本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。

【発明の効果】

【0010】

本発明の上記態様によれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【図面の簡単な説明】

【0011】

【図1】図１は、本実施形態の動画の一例を示す説明図である。

【図2】図２は、動画においてアイテム情報をストックする操作の一例を示す説明図である。

【図3】図３は、ストックによりアイテム情報が記憶された状態の一例を示す説明図である。

【図4】図４は、動画においてアイテム情報をストックする操作の別の例を示す説明図である。

【図5】図５は、ストックによりアイテム情報が記憶された状態の別の例を示す説明図である。

【図6】図６は、本実施形態の情報収集装置を含む情報収集システム１００を示す図である。

【図7】図７は、情報収集装置で抽出される動画の要素についての説明図である。

【図8】図８は、本実施形態の情報収集装置による情報収集手順の第１例を示す説明図である。

【図9】図９は、本実施形態の情報収集装置による情報収集手順の第２例を示す説明図である。

【図10】図１０は、本実施形態の情報収集装置による情報収集手順の第３例を示す説明図である。

【図11】図１１は、情報解析画面の第１例の概要を示す説明図である。

【図12】図１２は、情報解析画面の第１例において、要素の情報が表示された状態の一例を示す説明図である。

【図13】図１３は、情報解析画面の第２例の概要を示す説明図である。

【図14】図１４は、情報解析画面の第２例において、要素の情報が表示された状態の一例を示す説明図である。

【図15】図１５は、情報解析画面の第３例の概要を示す説明図である。

【発明を実施するための形態】

【0012】

後述する明細書及び図面の記載から、少なくとも以下の事項が明らかとなる。

【0013】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集装置が明らかとなる。このような情報収集装置によれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0014】

前記アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行されることが望ましい。これにより、動画とアクションとを容易に紐付けることができる。

【0015】

前記アクションは、前記動画が表示されている装置において実行されることが望ましい。これにより、動画とアクションとを容易に紐付けることができる。

【0016】

前記アクションは、前記動画が表示されている装置とは異なる装置において実行されることが望ましい。これにより、動画が表示されている装置以外で実行されたアクションについても、動画と紐付けることができる。

【0017】

前記動画の前記要素の情報は、前記特定部が前記実行時間を特定した後に生成されることが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0018】

前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも１つ以上であることが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0019】

前記動画の前記要素は、前記動画におけるセリフであって、前記抽出部は、前記要素の情報として、前記動画の音声を解析し、テキストデータを抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0020】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0021】

前記要素は、前記動画における前記コメントであって、前記抽出部は、前記要素の情報として、前記動画に付加された前記コメントのテキストデータを抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0022】

【0023】

前記要素は、前記動画における前記キャプションであって、前記抽出部は、前記要素の情報として、前記動画に付加された前記キャプションのテキストデータを抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0024】

【0025】

前記要素は、前記動画における前記カメラワークであって、前記抽出部は、前記要素の情報として、前記動画における被写体を検知し、前記被写体の大きさ、移動量、明るさ及びコントラストの少なくとも１つ以上を抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0026】

前記要素は、前記動画における前記カメラワークであって、前記抽出部は、前記要素の情報として、前記動画におけるシーンチェンジを検知し、前記シーンチェンジの有無を抽出することが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0027】

前記要素毎に前記要素の情報のデータを集計する解析部をさらに備えることが望ましい。これにより、動画とアクションとを紐付けた際に、多くの情報を収集し、解析したレポートを作成することができる。

【0028】

所定の時間軸に沿って動画を表示する表示部と、表示された前記動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、を備える情報収集システムが明らかとなる。このような情報収集システムによれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0029】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、を含む情報収集方法が明らかとなる。このような情報収集方法によれば、動画とアクションとを紐付けた際に、多くの情報を収集することができる。

【0030】

＝＝＝本実施形態＝＝＝
＜動画の概要＞
本実施形態の情報収集装置について説明する前に、まず、本実施形態の動画の一例と、動画に対して実行されるアクション（例えば、後述するスワイプ操作によるアイテム情報のストック）とについて説明する。

【0031】

図１は、本実施形態の動画の一例を示す説明図である。

【0032】

図１に示されるように、ユーザー端末５（例えば、視聴者のスマートフォンやタブレット型端末など）のタッチパネル６上で動画（例えばバラエティ番組）が再生されている。画面上には、スポーツウェア（具体的には、ジャケットとパンツ）を着た人物の様子が映し出されている。本実施形態では、動画に含まれるフレーム（静止画）には予めアイテム領域が設定されている。

【0033】

「アイテム領域」とは、動画の中に映し出された物（以下、「アイテム」と呼ぶことがある）の、画面上における領域である。本実施形態では、動画に映し出されたアイテムに対してアイテム領域を設定し、そのアイテムに関する情報まで視聴者を誘導することにより、動画中のアイテムの情報を視聴者に簡易な方法で提供することができる。例えば、動画中のアイテムに関心を持ったとき、視聴者がアイテム領域を選択するだけで、アイテム領域に対応づけられているアイテム情報を表示することができる。このようなアイテム情報の表示手順の一例については、後述する図２～図５を参照しながら説明する。ここでは、図１に示されるように、画面上のジャケットの領域に予めアイテム領域が設定されている。

【0034】

アイテム領域を示す枠は、図１では非表示である。これにより、アイテム領域を示す枠が動画の視聴に邪魔になることを抑制することができる。但し、アイテム領域を示す枠は、後述する図２に示される矩形の破線（枠４１）のように、動画再生中に表示されても良い。

【0035】

動画の再生時にはフレーム（静止画）が順次切り替えられて表示されるため、動画の画面上（フレーム上）のジャケットの占める領域は刻々と変化することになる。しかし、本実施形態では、動画に追随するようにアイテム領域も刻々と変化するように設定されており、アイテム領域を示す枠（図２に示される枠４１）も刻々と変形する。

【0036】

図２は、動画においてアイテム情報をストックする操作の一例を示す説明図である。図３は、ストックによりアイテム情報が記憶された状態の一例を示す説明図である。

【0037】

ユーザー端末５は、図２に示されるように、予め動画に設定されているアイテム領域がスワイプ操作されたことを検出すると、そのアイテム領域に対応付けられているアイテム情報をストック情報として記憶する。ここで、「スワイプ操作」とは、画面上で指を滑らせる操作であり、「タッチ操作」に含まれる。また、「タッチ操作」とは、指で画面を触れて行う操作の総称である。「タッチ操作」には、上述した「スワイプ操作」のほか、「タップ」、「ダブルタップ」、「フリック」、「スクロール」、「ドラッグ」、「長押し」及び「ピンチイン又はピンチアウト」の各種操作が含まれる。なお、ユーザー端末５は、スワイプ操作ではなく、タップ操作等の他のタッチ操作を検出した場合に、そのアイテム領域に対応付けられているアイテム情報をストック情報として記憶しても良い。

【0038】

ユーザー端末５は、図３に示されるように、所定のアイテム情報がストック情報として記憶されると、タッチパネル６上のストック情報表示部４３にストック情報（ストックされたアイテム情報）に対応するアイテム画像４４（例えばサムネイル画像）を表示する。すなわち、視聴者は、動画内のジャケットに興味を持ったときに、タッチパネル６上のジャケットを右にスワイプすると、そのジャケットのアイテム情報をストックさせることができる。また、視聴者は、そのジャケットのアイテム情報をユーザー端末５に記憶させたことをストック情報表示部４３で確認できる。

【0039】

なお、図２及び図３では不図示だが、視聴者がアイテム情報をストックする際、そのアイテム領域に対応付けられているアイテム画像（例えばサムネイル画像）が表示されても良い。ユーザー端末５は、例えば、予め動画に設定されているアイテム領域がタップ操作されたことを検出すると、そのアイテム領域に対応付けられているアイテム画像を表示する。視聴者は、仮にアイテム領域を示す枠４１（図２中の矩形の破線）が非表示だとしても、動画内のジャケットに興味を持ったときにタッチパネル６上のジャケットをタップするとジャケットのアイテム画像が表示されるため、そのジャケットの関連情報を取得できることを認識できる。なお、ユーザー端末５は、タップ操作ではなく、ダブルタップ操作等の他のタッチ操作を検出した場合に、そのアイテム領域に対応付けられているアイテム画像を表示しても良い。

【0040】

ユーザー端末５は、ストック情報表示部４３に表示されたアイテム画像４４の領域がタップ操作されたことを検出すると、そのアイテム画像４４（アイテム情報）に対応付けられているイベント情報に従った処理（例えば、ジャケットの購入ページ（決済ページ）の表示）を行う。なお、ユーザー端末５は、タップ操作ではなく、ダブルタップ操作等の他のタッチ操作を検出した場合に、そのアイテム画像４４（アイテム情報）に対応付けられているイベント情報に従った処理を行っても良い。

【0041】

ここでは、ジャケットのアイテム情報に対して、ジャケットの購入ページ（決済ページ）のアドレスが対応付けられており、視聴者がジャケットのアイテム画像４４をタップ操作すると、タッチパネル６上に、そのジャケットの購入ページ（決済ページ）が表示されることになる。なお、ジャケットの購入ページ（決済ページ）の表示画面は、ジャケットに関するアイテム情報であるとともに、ジャケットのアイテム画像４４でもある。ウェブページの表示方法は、再生中の動画とともにマルチ画面として表示しても良いし、単独で表示しても良い。

【0042】

以下の説明では、視聴者が視聴中の動画に起因して端末を操作することで、所定の処理を発生させることを「アクション」と呼ぶことがある。

【0043】

アクションの例として、上述では、視聴者が視聴中の動画に予め設定されているアイテム領域をスワイプ操作する（すなわち、「視聴者が視聴中の動画に起因して端末を操作する」）ことで、アイテム領域に対応付けられているアイテム情報をストック情報として記憶させる（すなわち、「所定の処理を発生させる」）ことを説明した。

【0044】

また、アクションの別の例として、上述では、視聴者がストック情報表示部４３に表示されたアイテム画像４４をタップ操作する（すなわち、「視聴者が視聴中の動画に起因して端末を操作する」）ことで、タッチパネル６上に、そのアイテムの購入ページ（決済ページ）を表示させる（すなわち、「所定の処理を発生させる」）ことを説明した。

【0045】

なお、所定の処理を発生させるために視聴者が行う操作は、上述したタッチ操作（スワイプ操作やタップ操作）に限られない。所定の処理を発生させるために視聴者が行う操作は、例えば、音声入力であっても良いし、ユーザー端末５がパーソナルコンピュータの場合は、マウスのクリックや、キーボードによる入力であっても良い。アクションは、クリック、タッチ及び音声入力のいずれかの操作、又は、いずれかの操作の組み合わせにより実行される。

【0046】

また、上述した例では、アクションが実行される端末（装置）は、動画が表示されている端末（装置）と同じ端末（装置）である。すなわち、動画が表示されたユーザー端末５において、スワイプ操作によるストック情報の記憶や、タップ操作によるアイテムの購入ページ（決済ページ）の表示が実行されている。

【0047】

しかし、アクションが実行される端末（装置）は、動画が表示されている端末とは異なる端末（装置）であっても良い。アクションは、動画が表示されたユーザー端末５とは別の端末、例えば、別のスマートフォンにおいて実行されても良い。この場合、後述するように、本実施形態の情報収集装置が動画の所定の時間軸（例えば、動画のタイムライン）におけるアクションの実行時間を特定することが可能な態様である必要がある。

【0048】

また、所定の処理は、ストック情報の記憶やウェブページの表示に限られず、リンクによる遷移を含むウェブページの移動や、アイテムの購入、資料請求、ＤＭ（ダイレクトメール）の送信などを含んでいても良い。つまり、アクションは、いわゆるコンバージョンを含む。

【0049】

図４は、動画においてアイテム情報をストックする操作の別の例を示す説明図である。図５は、ストックによりアイテム情報が記憶された状態の別の例を示す説明図である。

【0050】

上述では、画面上のジャケットの領域に予めアイテム領域が設定されていた。しかし、予め動画に設定されているアイテム領域は、一つに限られない。例えば、ジャケットのほかに、画面上のパンツの領域に予めアイテム領域がさらに設定されていても良い。ユーザー端末５は、図４に示されるように、予め動画に設定されているアイテム領域がスワイプ操作されたことを検出すると、そのアイテム領域に対応付けられているアイテム情報をストック情報として記憶する。そして、ユーザー端末５は、図５に示されるように、所定のアイテム情報がストック情報として記憶されると、タッチパネル６上のストック情報表示部４３にストック情報に対応するアイテム画像４５をさらに表示する。

【0051】

すなわち、視聴者は、動画内のパンツに興味を持ったときに、タッチパネル６上のパンツを右にスワイプすると、そのパンツのアイテム情報をストックさせることができるとともに、そのパンツのアイテム情報をユーザー端末５に記憶させたことをストック情報表示部４３で確認できる。これにより、視聴者は、動画を視聴しながら、上述したジャケットに関するアイテム情報以外にも、パンツのアイテム情報もストックすることができる。すなわち、視聴者は、複数のアイテム情報をストックすることができる。

【0052】

＜情報収集システム１００＞
図６は、本実施形態の情報収集装置を含む情報収集システム１００を示す図である。図７は、情報収集装置で抽出される動画の要素についての説明図である。

【0053】

情報収集システム１００は、動画に対して実行されたアクションと、動画の要素の情報（後述）とを紐づけたデータを収集するためのシステムである。後述する通信ネットワーク９を介した複数の装置により、情報収集処理が実行される。

【0054】

情報収集システム１００は、図６に示されるように、動画配信サーバー１と、メタデータ配信サーバー３と、ユーザー端末５と、情報収集サーバー１０と、情報解析サーバー２０とを含んで構成されている。動画配信サーバー１と、メタデータ配信サーバー３と、ユーザー端末５と、情報収集サーバー１０と、情報解析サーバー２０とは、通信ネットワーク９を介して相互に通信可能に接続されている。通信ネットワーク９は、例えばインターネット、電話回線網、無線通信網、ＬＡＮ、ＶＡＮなどであり、ここではインターネットを想定している。

【0055】

動画配信サーバー１は、多数の動画コンテンツ（以下、単に「動画」と呼ぶことがある）を配信するためのサーバーである。本実施形態では、動画配信サーバー１は、ストリーミング形式で動画データをユーザー端末５に配信する。但し、動画データの配信方法は、ダウンロード形式でも良いし、プログレッシブダウンロード形式でも良い。なお、ストリーミング形式の配信の場合には、ユーザー端末５にて動画データを一時的に記憶し、ダウンロード形式の配信の場合には、ユーザー端末５にてダウンロードされた動画データを記憶して保持することになる。さらに、動画配信サーバー１は、ライブ形式で動画コンテンツを配信しても良い。

【0056】

メタデータ配信サーバー３は、前述のアイテム情報（アイテム画像４４及びアイテム画像４５、イベント情報、アイテム領域などのアイテムに関する情報）を含むメタデータを配信するためのサーバーである。本実施形態では、メタデータの一部を動画再生前にプリロード形式にて配信するとともに、メタデータのその他の一部をプログレッシブダウンロード形式で配信する。但し、メタデータの配信方法は、これに限られるものではなく、例えばダウンロード形式でも良いし、ストリーミング形式でも良い。

【0057】

本実施形態では、説明の便宜のためメタデータと動画データとを切り離して説明しているが、メタデータが動画データ（動画ファイル）に格納されていてもよい。メタデータが動画データに格納された状態で動画配信サーバー１が動画データを配信する場合、情報収集システム１００は、メタデータ配信サーバー３を備えていなくても良い。

【0058】

なお、メタデータ配信サーバー３が配信するメタデータは、メタデータ配信サーバー３で作成されたものであっても良いし、不図示のメタデータ作成端末によって作成されたものであっても良い。

【0059】

ユーザー端末５は、動画再生可能な情報端末（動画再生装置）である。ここでは、ユーザー端末５は、スマートフォンである。但し、ユーザー端末５は、スマートフォンに限られるものではなく、例えばタブレット型の携帯端末であっても良いし、パーソナルコンピュータであっても良い。ユーザー端末５は、不図示のＣＰＵ、メモリ、記憶装置、通信モジュール、タッチパネル６（表示部７Ａ、入力部７Ｂ）などのハードウェアを備えている。ユーザー端末５には、動画再生プログラムがインストールされており、ユーザー端末５が動画再生プログラムを実行することによって、上述の各種動作が実現されることになる。なお、動画再生プログラムは、不図示のプログラム配信サーバーからユーザー端末５にダウンロードすることが可能である。

【0060】

ユーザー端末５は、表示部７Ａと、入力部７Ｂと、制御部８Ａと、通信部８Ｂとを備えている。

【0061】

表示部７Ａは、各種画面を表示するための機能である。本実施形態では、表示部７Ａは、タッチパネル６のディスプレイや、そのディスプレイの表示を制御するコントローラー等によって実現されている。入力部７Ｂは、ユーザーからの指示を入力・検出するための機能である。本実施形態では、入力部７Ｂは、タッチパネル６のタッチセンサー等によって実現されている。なお、ユーザー端末５がスマートフォンや、タブレット型の携帯端末の場合は、表示部７Ａ及び入力部７Ｂが主にタッチパネル６によって実現されているが、表示部７Ａ及び入力部７Ｂが、別々の部品で構成されても良い。例えば、ユーザー端末５がパーソナルコンピュータの場合には、表示部７Ａは例えば液晶ディスプレイ等によって構成され、入力部７Ｂはマウスやキーボード等によって構成されることになる。

【0062】

制御部８Ａは、ユーザー端末５を制御する機能である。制御部８Ａは、動画データを処理して動画を再生（表示）するための機能や、メタデータを処理するための機能などを有する。また、制御部８Ａは、ウェブページの情報を取得して、ウェブページを表示させるブラウザ機能なども有する。本実施形態では、制御部８Ａは、不図示のＣＰＵや、動画再生プログラムを記憶したメモリ及び記憶装置等によって実現されている。

【0063】

通信部８Ｂは、通信ネットワーク９に接続するための機能である。通信部８Ｂは、動画配信サーバー１から動画データを受信したり、メタデータ配信サーバー３からメタデータを受信したり、動画配信サーバー１やメタデータ配信サーバー３にデータを要求したりする。

【0064】

ユーザー端末５は、不図示であるが、上述した構成のほか、動画データを記憶する機能を有する動画データ記憶部や、メタデータを記憶する機能を有するメタデータ記憶部や、ストックされたアイテム情報を動画データに対応付けて記憶するストック情報記憶部を有していても良い。

【0065】

情報収集サーバー１０は、動画に対して実行されたアクションと、動画の要素の情報（後述）とを紐づけたデータを収集するためのサーバーである。情報収集サーバー１０は、ユーザー端末５において実行されたアクションに関するデータ（例えば、後述するアクションの実行時間）と、ユーザー端末５において表示された動画の要素の情報（後述）とを紐付けたデータを収集する情報収集処理を実行する。

【0066】

本実施形態では、情報収集サーバー１０の不図示の各種ハードウェアと各種ソフトウェアとの協働により、情報収集サーバー１０における情報収集処理を含む各種処理の実行が可能になる。本実施形態の情報収集装置として、情報収集サーバー１０が相当する例を示しているが、情報収集装置は、複数のサーバーを含んでいても良い。そして、ネットワークを介した当該複数のサーバーの協働により、情報収集処理を含む各種処理が実行されても良い。

【0067】

情報収集サーバー１０は、例えばコンピュータであり、演算装置（ＣＰＵなど）、メモリ、記憶装置、通信装置などで構成されている。記憶装置には、情報収集プログラムを含む各種のプログラムや各種のデータが記憶されている。演算装置が記憶装置に記憶されている情報収集プログラムをメモリに読み出して実行することにより、情報収集処理を含む各種処理、すなわち、後述の各機能（特定部１１、抽出部１２及び紐付け部１３）が実現される。

【0068】

図６に示される情報収集システム１００では、情報収集サーバー１０は、一つのユーザー端末５と通信ネットワーク９を介して接続しているが、情報収集サーバー１０は、多数のユーザー端末５からデータを収集し、アクションと動画の要素の情報とを紐づけたデータを多数収集することができる。

【0069】

情報収集サーバー１０は、特定部１１と、抽出部１２と、紐付け部１３とを有する。

【0070】

特定部１１は、動画の所定の時間軸におけるアクションの実行時間を特定する機能である。アクションが、動画が表示されている装置（ここでは、表示部７Ａを有するユーザー端末５）において実行される場合、特定部１１は、動画のタイムラインにおける、アクションが実行されたときの時間のデータをユーザー端末５から取得する。アクションが、動画が表示されている装置とは異なる装置（例えば、ユーザー端末５のスマートフォンとは別のスマートフォン）において実行される場合、特定部１１は、動画のタイムラインと、アクションが実行されたときの時間とを紐付けて保存する。

【0071】

抽出部１２は、アクションの実行時間よりも所定時間前の、動画の要素の情報を抽出する機能である。ここで、動画の「要素」とは、動画を構成する要素であり、図７に示されるように、例えば、動画におけるセリフ、コメント、キャプション又はカメラワークである。但し、抽出部１２が抽出する対象となる動画の要素は、セリフ、コメント、キャプション及びカメラワーク以外の要素が含まれていても良い。また、抽出部１２が抽出する対象となる動画の要素は、セリフ、コメント、キャプション及びカメラワークのいずれか１つに限られず、２つ以上であっても良い。

【0072】

また、「要素の情報」とは、動画の当該要素に関連する情報である。要素の情報の詳細については、後述する。

【0073】

抽出部１２は、アクションの実行時間よりも所定時間前の、動画の要素の情報を抽出する。抽出部１２は、具体的には、例えばアクションの実行時間より１５秒前から５秒前程度の範囲の動画の要素の情報を抽出する。動画の要素の情報が発生、すなわち動画に特定の要素の情報が映し出されてから、視聴者がリンクに飛ぶと判断してアクションを起こす（すなわち、アクションの実行時間）までにタイムラグが発生する。このため、アクションの実行時間よりも所定時間前の範囲にさかのぼって動画の要素の情報を抽出することにより、アクションとの間に強い関連性を有する動画の要素の情報を精度良く抽出することができる。但し、「所定時間前」は、１５秒前から５秒前程度の範囲に限られず、他の長さであっても良い。動画の種類、アクションの種類によって、所望の時間を設定することができる。

【0074】

例えば、動画配信サーバー１が配信する動画コンテンツが、ECを目的としたショッピング動画である場合、視聴者は初めから自分が欲しいものがないか興味を持って動画を視聴している。このような場合では、動画内のインフルエンサーが商品の購買を促すようなプレゼンテーションを行っていることが通常であり、視聴者が商品の購入の決断をする時間（すなわち、アクションを行うきっかけとなる時間）は、アクションの実行時間からそれほど大きくさかのぼる必要はない。ショッピング動画では、例えば、アクションの実行時間の１５秒前から５秒前程度の範囲に視聴者の興味を喚起した要素の情報があったはずである。このため、抽出部１２は、アクションの実行時間よりも１５秒前から５秒前程度の範囲にさかのぼって動画の要素の情報を抽出すればよい。

【0075】

しかし、例えば、動画配信サーバー１が配信する動画コンテンツが映画である場合、登場人物である映画俳優が身に着けているものに興味を持ち、視聴者が購買意欲を抱くには通常はかなり時間を要する。例えば、繰り返し映し出される格好のよい出演者にあこがれを抱き、印象深いシーンでアクションを実行することになる。このような場合は、アクションの実行時間の15分程度前くらいから商品の購入の決断をするきっかけとなる時間（すなわち、アクションを行うきっかけとなる時間）があると考えられる。このため、「所定時間前」を「15分前から5分前」と設定しても良い。つまり、抽出部１２は、アクションの実行時間よりも15分前から5分前程度の範囲にさかのぼって動画の要素の情報を抽出しても良い。

【0076】

なお、抽出部１２は、全ての動画の要素の情報を抽出するのではなく、期間を絞って抽出している。これにより、要素の情報のデータを抽出するためのマシンパワーを抑制することができるし、上述したような商品の購買を決断したであろう瞬間を抽出できる確率が高くなる。もちろん、抽出部１２は、全ての動画の要素の情報を抽出しても良い。

【0077】

紐付け部１３は、実行されたアクションと、抽出された要素の情報とを紐付けて保存する機能である。例えば、ストックに対して、抽出部１２が、セリフのテキストデータを抽出した場合、図７に示されるように、当該ストック及びストックが実行された時間と、セリフのテキストデータを関連させたテーブル情報を記録部１６に保存する。

【0078】

例えば、動画配信サーバー１がライブ配信でのショッピング動画を配信している場合、動画内の出演者が、「普段は値引きしないのですが、ライブでの視聴者に限り、今から１５分間、２割引き！」といったセリフを話す事により、視聴者の購買の決断に大きく寄与することが想定される。したがって、出演者のセリフを抽出することで、どのようなセリフが購買の決断に寄与するのかを、事後に分析することができる。

【0079】

情報解析サーバー２０は、動画の要素毎に要素の情報のデータを集計するためのサーバーである。本実施形態では、情報解析サーバー２０の不図示の各種ハードウェアと各種ソフトウェアとの協働により、情報解析サーバー２０における情報解析処理を含む各種処理の実行が可能になる。但し、ネットワークを介した複数のサーバーの協働により、情報解析処理を含む各種処理が実行されても良い。

【0080】

情報解析サーバー２０は、例えばコンピュータであり、演算装置（ＣＰＵなど）、メモリ、記憶装置、通信装置などで構成されている。記憶装置には、情報解析プログラムを含む各種のプログラムや各種のデータが記憶されている。演算装置が記憶装置に記憶されている情報解析プログラムをメモリに読み出して実行することにより、解析部（後述）による情報解析処理を含む各種処理が実現される。

【0081】

なお、情報解析サーバー２０は、情報収集サーバー１０とともに情報収集装置を構成する。但し、情報収集サーバー１０が情報解析サーバー２０の機能を備えていても良い。また、情報収集システム１００は、情報収集装置には、情報解析サーバー２０が含まれていなくても良い。情報解析サーバー２０により生成された情報解析画面の例については、後述する。

【0082】

＜要素の情報＞
以下では、本実施形態で例示したセリフ、コメント、キャプション及びカメラワークの各々の要素について、要素の情報の例と、抽出部１２による抽出方法を説明する。

【0083】

・セリフ
抽出部１２は、動画の音声を解析することにより、セリフに関する要素の情報を抽出する。抽出部１２は、具体的には、動画の音声の文字起こしを行うソフトウェアを備えており、動画の音声の文字起こしを自動で行うことができる。すなわち、抽出部１２は、セリフに関する要素の情報として、動画の音声を解析し、セリフに関するテキストデータを抽出する。また、抽出部１２は、形態素解析により当該テキストデータを単語に分解し、単語毎のデータや単位時間当たりの発生単語数のデータを抽出しても良い。

【0084】

さらに、抽出部１２は、要素の情報として、当該テキストデータに関連する付加データを生成することができる。抽出部１２は、具体的には、セリフ発声者の年齢や性別に関するデータを、動画の音声から自動で生成、もしくは事前に動画に紐づけられた情報のリストから抽出することができる。また、抽出部１２は、セリフのネガポジ数値（ネガティブ・ポジティブ数値）に関するデータを、セリフに含まれる単語の感情極性によるネガポジ判定（ネガティブ・ポジティブ判定）から自動で生成することができる。また、抽出部１２は、セリフのネガポジ数値（ネガティブ・ポジティブ数値）に関するデータを、セリフに含まれる単語の感情極性によるネガポジ判定（ネガティブ・ポジティブ判定）から自動で生成することができる。また、抽出部１２は、セリフの絶対音量やセリフの音量の動画全体からの偏差に関するデータを、動画の音量や、セリフの音量の動画の音量全体からの偏差計算により自動で生成することができる。

【0085】

なお、ここでのテキストデータに関連する付加データは、動画から直接得られるデータではなく、抽出部１２が要素の情報を抽出する際（すなわち、特定部１１がアクションの実行時間を特定した後）に生成するデータでもある。これにより、動画とアクションとを紐付けた際に、より多くの情報を収集することができる。

【0086】

・コメント
抽出部１２は、動画に付加されたコメントのテキストデータを抽出する。ここで、「コメント」とは、動画の配信者や視聴者が動画に付加して投稿することができるテキストのことである。例えば、動画配信サーバー１がライブ配信でＥＣを目的としたショッピング動画を配信している場合、動画の視聴者が「そのワンピースかわいい！」とか「もっと濃い色のものはないかな」といった反応をコメントとして投稿する。これにより、出演者が当該コメントに対してリアクションすることで、動画に対する視聴者の反応を共有することができる。

【0087】

動画の視聴者が「もっと濃い色のものはないかな」との反応をコメントとして投稿した場合、出演者が「もっと濃い色」のアイテム（ここでは、ワンピース）を用意できたかどうかは、視聴者の購買の決断に大きく寄与することが想定される。このようなコメントは、テキストデータであるので、そのテキストデータを抽出することで、どのような視聴者のコメントが購買に結び付いたのかを事後に分析することができる。また、抽出部１２は、形態素解析により当該テキストデータを単語に分解し、単語毎のデータや単位時間当たりの投稿単語数のデータを抽出しても良い。

【0088】

さらに、抽出部１２は、要素の情報として、当該テキストデータに関連する付加データを生成することができる。抽出部１２は、具体的には、コメント投稿者の年齢や性別に関するデータを、動画の音声から自動で生成することができる。また、抽出部１２は、コメントのネガポジ数値（ネガティブ・ポジティブ数値）に関するデータを、コメントに含まれる単語の感情極性によるネガポジ判定（ネガティブ・ポジティブ判定）から自動で生成することができる。

【0089】

ポジティブと判定されたコメントが、視聴者の購買の決断につながるであろうことは容易に想定できる。しかし、例えばニンジンのピクルスのショッピング動画での、「実は、今年はニンジンが取れすぎてしまって困っているんだよね。」といった、一見ネガティブと判定されるようなコメントも、時に視聴者の購買の決断につながることもある。したがって、このようなネガポジ判定の結果に関する付加データを抽出して収集しておくことで、予想していない感情極性が購買に結び付いていないかを事後に分析することができる。

【0090】

なお、ここでのテキストデータに関連する付加データは、コメントのテキストデータのような、動画から直接得られるデータではなく、抽出部１２が要素の情報を抽出する際（すなわち、特定部１１がアクションの実行時間を特定した後）に生成するデータでもある。これにより、動画とアクションとを紐付けた際に、より多くの情報を収集することができる。

【0091】

・キャプション
抽出部１２は、動画に付加されたキャプションのテキストデータを抽出する。ここで、「キャプション」とは、動画に付加されたテキストであり、例えば、字幕やサイドスーパーである。動画にキャプションがテキストデータとして付加されている場合は、当該テキストデータをそのまま抽出しても良いし、動画にキャプションがテキストデータではなく、例えば画像データとして付加されている場合は、画面に表示されたキャプションを文字認識により抽出しても良い。抽出部１２は、具体的には、動画中に含まれる文字の認識を行うソフトウェアを備えており、動画の文字認識を自動で行うことができる。

【0092】

また、抽出部１２は、形態素解析により当該テキストデータを単語に分解し、単語毎のデータや単位時間当たりの発生単語数のデータを抽出しても良い。例えば、動画配信サーバー１がスニーカーのショッピング動画を配信している場合、画面内に白いアイテム（ここでは、スニーカー）が表示されていて、キャプションで他の色のアイテム（スニーカー）として青や赤のスニーカーがあると表示されたことをきっかけとして視聴者が購買の決断を行うことがある。このようなキャプションがきっかけとなって視聴者が購買の決断に至った可能性や、どのような文言をキャプションとして入れれば購買の決断につなげることにできるのかを、キャプションのテキストデータを抽出することによって事後に分析することができる。

【0093】

さらに、抽出部１２は、要素の情報として、当該テキストデータに関連する付加データを生成することができる。抽出部１２は、具体的には、動画の領域に対するキャプションの領域の割合のデータ、動画におけるキャプションの位置のデータ、キャプションの色情報のデータを、自動で生成することができる。

【0094】

【0095】

・カメラワーク
「カメラワーク」とは、動画の撮影技法全般であり、被写体の撮影技法や、シーンの撮影技法などを含む。抽出部１２は、動画における被写体を検知することにより、被写体の大きさ、移動量、明るさ及びコントラストや、カメラの被写体毎の寄り・引きの度合い及びカメラの移動量のデータを抽出する。また、動画におけるシーンチェンジを検知することにより、シーンチェンジの有無のデータを抽出する。

【0096】

＜その他の要素＞
なお、上述した要素（セリフ、コメント、キャプション、カメラワーク）はあくまで一例であり、動画を構成する要素であれば、その他の例が含まれていても良い。

【0097】

・BGM
抽出部１２は、動画の音を解析することにより、BGMに関する要素の情報を抽出することもできる。ここで、「BGM」とは、Back Ground Musicの略であり、背景音楽として動画内で流されている曲の情報全般である。抽出部１２は、BGMに関する要素の情報として、曲の種類（ロック、ポップス、ジャズ、クラッシック、楽器のみ、歌あり等）や調整（Cメジャー、Eマイナー等）、音量などを抽出しても良い。

【0098】

また、上述した動画の各要素に関する要素の情報はあくまで一例であり、動画の当該要素に関連する情報であれば、その他の例が含まれていても良い。

【0099】

＜情報収集手順＞
以下では、上述した図６及び図７を再び参照しつつ、図８～図１０の本実施形態の情報収集装置による情報収集手順について説明する。ここでは、動画の要素の一つである「セリフ」を紐付けたデータが収集される場合について説明するが、すでに説明したように、動画の要素は「セリフ」に限られるものではなく、他の要素（例えば、コメント、キャプション、カメラワークなど）を紐付けたデータが収集されても良い。

【0100】

図８は、本実施形態の情報収集装置による情報収集手順の第１例を示す説明図である。図９は、本実施形態の情報収集装置による情報収集手順の第２例を示す説明図である。図１０は、本実施形態の情報収集装置による情報収集手順の第３例を示す説明図である。

【0101】

図８に示されるように、端末で動画（例えばバラエティ番組）が再生されている。動画の再生中、タイムライン上の1:48の時点で、人物が「このジャケット、お得ですね」とのセリフを発して、視聴者が動画内のジャケットに興味を持った場面を想定する。上述したように、視聴者は、ジャケットに関するアイテム情報をストックさせることができる。ここで、タイムライン上の1:53の時点で、アクション（ここでは、ストック）が実行された場合、本実施形態の情報収集装置は、下記のような手順で動画に対して実行されたアクションと、動画の要素の情報とを紐づけたデータを収集する。

【0102】

タイムライン（所定の時間軸）に沿って表示された動画に対してアクション（ストック）が実行されたときに、まず、情報収集サーバー１０の特定部１１が、タイムラインにおけるアクションの実行時間を特定する。特定部１１は、具体的には、動画のタイムラインにおける、アクション（ストック）が実行されたときの時間のデータ（1:53）をユーザー端末５から取得する。

【0103】

次に、情報収集サーバー１０の抽出部１２が、アクション（ストック）の実行時間（1:53）よりも所定時間前（例えば、35秒前から5秒前までの30秒間）の、動画の要素の情報を抽出する。動画の要素の情報は、図８では、セリフのテキストデータ（「このジャケット、お得ですね」）である。また、抽出部１２は、要素の情報として、セリフ発声者の年齢や性別に関するデータ等のテキストデータに関連する付加データをさらに生成しても良い。当該付加データは、特定部１１が、動画のタイムラインにおけるアクションの実行時間を特定した後に、抽出部１２により生成されるデータである。抽出部１２は、画面からキャプチャした画像や、それを縮小したサムネイル画像をさらに抽出しても良い。

【0104】

そして、情報収集サーバー１０の紐付け部１３は、実行されたアクション（ストック）と、抽出された要素の情報とを紐付けて保存する。すなわち、ストックのデータと、セリフのテキストデータを関連させたテーブル情報を情報収集サーバー１０の記録部１６に保存する。

【0105】

上述では、アクションは、ストックであったが、図９に示されるようなＵＲＬ遷移（例えば、ジャケットの購入ページ（決済ページ）の表示）や、図１０に示されるような商品購入であっても良い。なお、これらのアクションが、動画が表示されている装置とは異なる装置において実行される場合、情報収集サーバー１０の特定部１１は、動画のタイムラインと、アクションが実行されたときの時間とを紐付けて保存することにより、アクションの実行時間を特定する。

【0106】

＜解析部＞
情報解析サーバー２０は、解析部を有する。解析部は、動画の要素毎に要素の情報のデータを集計する機能である。解析部は、情報収集サーバー１０の記録部１６に保存されているデータを集計することによって情報解析画面を生成する。これにより、動画とアクションとを紐付けたデータを解析したレポートを作成することができる。

【0107】

情報解析サーバー２０には、通信ネットワーク９を介して管理者端末が接続されており、情報解析画面は、管理者端末の表示部（例えば、液晶ディスプレイ等）に表示される。なお、情報解析画面が表示される表示部は、情報解析サーバー２０が有していても良く、その場合、管理者端末は無くても良い。

【0108】

図１１は、情報解析画面の第１例の概要を示す説明図である。図１２は、情報解析画面の第１例において、要素の情報が表示された状態の一例を示す説明図である。

【0109】

図１１及び図１２に示される情報解析画面の第１例は、各々で要素の情報が集約された多数の動画から、要素の情報を表示させたい動画を指定して、アクションの実行に至った動画の要素の情報を表示させる例である。

【0110】

図１１の上部に示されるグラフでは、横軸が動画の配信日時を表し、縦軸がユニークユーザー（ＵＵ）数又はユニークユーザーによるアクション率を表している。そして、ある配信日時に関する棒グラフは、その配信日時に配信された動画１本に関するデータを示している。ここで、「ユニークユーザー」とは、所定の期間内に動画を視聴した視聴者である。ユニークユーザーは、1人の視聴者ごとに固有の値として取得されるため、同じ期間内での動画へのアクセス回数に関係なく、「1」として計測されることになる。

【0111】

例えば、横軸左側の配信日時「05/20 12:00」におけるデータでは、ＬＩＶＥ再生ＵＵが約380名、アーカイブ再生ＵＵが約120名であり、合計約600名のユニークユーザーが当該動画を視聴したことが示されている。ここで、「ＬＩＶＥ再生ＵＵ」とは、動画が配信された時にリアルタイムで視聴したユニークユーザー数であり、「アーカイブ再生ＵＵ」とは、サーバーにアーカイブとして保存された動画を配信後にダウンロードして視聴したユニークユーザー数である。

【0112】

図１１の上部に示されるグラフでは、ユニークユーザーのうち、当該動画のうちアクション（ここでは、ストックやＵＲＬ遷移）を実行したユニークユーザーの割合であるアクション率を表している。例えば横軸左側の配信日時「05/20 12:00」におけるデータでは、ストックアクション率（通算）が20%である。これは、その動画全体を通して、約600名のユニークユーザーのうちの20%に相当する約120名が、何らかのアクションによってリンクや詳細データをストックしたことが示されている。

【0113】

また、例えば横軸左側の配信日時「05/20 12:00」におけるデータでは、ＵＲＬ遷移アクション率（通算）が約10%である。これは、約600名のユニークユーザーのうちの10％に相当する約60人が、ＵＲＬ遷移、すなわち購買サイトにストックしたリンクから遷移したことが示されている。

【0114】

図１１の左下部には、視聴者合計（ＵＵ）と、視聴者数ピークとが示されている。視聴者合計（ＵＵ）は、その動画を通算して視聴したユニークユーザー数である。視聴者数ピークは、同じ配信日時に視聴していたユニークユーザー数が最大だった瞬間のユニークユーザー数である。図１１の左下部では、ストックアクション率が24.4％であることが示され、前回の動画のストックアクション率の30.6%よりも低下していることが示されている。また、ＵＲＬ遷移アクション率が14.1%であることが示され、前回の動画のＵＲＬ遷移アクション率の16.3%よりも低下していることが示されている。それぞれの数値（ストックアクション率及びＵＲＬ遷移アクション率）には、前回よりも低下したことを示す下向き矢印アイコンが表示されている。

【0115】

このように、複数の動画を配信した際に、それぞれの動画を比較検討することで、よりストックにつながった動画、よりＵＲＬ遷移アクションにつながった動画が分かるようになる。

【0116】

解析部は、情報収集サーバー１０の記録部１６に保存されている複数の動画に関するデータについて、動画毎の、ユニークユーザー数及びアクションの数を集計する。これにより、図１１及び図１２の各々の上部に示されるアクション発生グラフを生成することができる。管理者端末は、アクション発生グラフのデータを情報解析サーバー２０から取得し、表示部に表示する。

【0117】

ここで、図１２に示されるように、情報解析画面において、所定の時点のグラフを選択したときに、図１２の右下に、動画の要素（ここでは、セリフ、コメント、キャプション及びカメラワーク）毎に、要素の情報（例えば、「プレゼント」、「今なら」などのセリフ中の単語）を表示することができる。これにより、動画のタイムライン上の任意の時点において、どのような要素の情報により当該アクションに至ったかを容易に把握することができる。図１２では例として「セリフ」タブをアクティブにした状態を示しているが、同様に「視聴者コメント」「キャプション字幕」「カメラワーク」のタブをクリックすることで、その動画で抽出された要素の情報が列挙されて表示される。

【0118】

管理者端末の表示部に表示されたアクション発生グラフにおいて、所定の配信日時のグラフが選択されたとき、管理者端末は選択された配信日時を情報解析サーバー２０に送信する。そして、情報解析サーバー２０は当該選択された配信日時に応じた動画の要素の情報を管理者端末に送信する。これにより、管理者端末の表示部で、図１２に示されるように、選択された配信日時の動画の要素の情報が表示されることになる。

【0119】

図１３は、情報解析画面の第２例の概要を示す説明図である。図１４は、情報解析画面の第２例において、要素の情報が表示された状態の一例を示す説明図である。

【0120】

図１３及び図１４に示される情報解析画面の第２例は、ある１本の動画について、アイテムの指定から、アクションの時点と要素の情報を表示させる例である。図１３及び図１４の各々の左側には、動画に映し出されたアイテムの一覧が示されている。また、図１３及び図１４の各々の右側の上部には、動画のタイムラインを横軸とし、動画全体のアクション（ここでは、ストック）数を縦軸としたストック発生グラフが表示されている。

【0121】

図１３の右上部に示されているグラフでは、横軸が、ある１本の動画の開始から終了までの時間（タイムライン）を表し、縦軸が、その動画から視聴者がアクションを実行した数（ここでは、ストックを実行した数）を表している。例えば、横軸左側の時間「00:01:56」におけるデータを見ると、ストック数が急激に伸びており、270ほどのストックが発生していることが分かる。図１３の右上に示されているグラフの場合、数分おきにストックのピークが発生していることが分かる。このような傾向を示すのは、商品アイテムを順次プレゼンテーション形式で紹介するショッピング動画であることが多い。

【0122】

図１３の左上部には、「総アイテムストック個数」が示されている。「総アイテムストック個数」は、当該１本の動画でストックされた個数を示しており、ここでは、22,686個である。また、当該１本の動画の１再生につき、1.5回のストックが行われたことが示されている。

【0123】

図１３の左上部には、さらに「ユニークアイテムストック個数」が示されている。「ユニークアイテムストック個数」は、ここでは、13,354個である。また、当該１本の動画の１再生につき、1.6回のストックが行われたことが示されている。

【0124】

図１３の左下部にはその動画で紹介されているアイテムの情報が示されている。タイトルが商品名、ＵＲＬがストックされたリンク情報で遷移する先のＵＲＬを示している。例えば商品名がAAAAのアイテムの場合、242回ストックされ、1.6%のＵＲＬ遷移率であったことが示されている。

【0125】

解析部は、情報収集サーバー１０の記録部１６に保存されているデータについて、アイテムの一覧を取得する。これにより、図１３及び図１４の各々の左側に示されるアイテムの一覧を生成することができる。また、解析部は、情報収集サーバー１０の記録部１６に保存されているデータについて、動画の時点（時間）毎の、アクション（ここでは、ストック）の数を集計する。これにより、図１３及び図１４の各々の右側の上部に示されるアクション（ここでは、ストック）発生グラフを生成することができる。管理者端末は、アイテムの一覧及びアクション発生グラフのデータを情報解析サーバー２０から取得し、表示部に表示する。

【0126】

ここで、図１４に示されるように、情報解析画面において、任意のアイテム（ここでは、アイテムFFFF）を選択すると、そのアイテムがストックされたアクションの個数のみを選択して「アイテム合計ストック発生グラフ」に表示する。この例の場合、14分30秒の所でストック数が急増している。また、図１４の右下部にはアイテムの、要素の情報（例えば、「このワンピ、気になっていました」などのセリフ）を表示することができる。これにより、アイテムの指定毎に、当該アクションの時点と、どのような要素の情報により当該アクションに至ったかを容易に把握することができる。

【0127】

管理者端末の表示部に表示されたアイテムの一覧において、任意のアイテムが選択されたとき、管理者端末は選択されたアイテムの情報を情報解析サーバー２０に送信する。そして、情報解析サーバー２０は当該選択されたアイテムに応じた動画の要素の情報を管理者端末に送信する。これにより、管理者端末の表示部では、図１４に示されるように、選択されたアイテムの要素の情報及びストック発生グラフが表示されることになる。

【0128】

図１５は、情報解析画面の第３例の概要を示す説明図である。

【0129】

図１５に示されるように、情報解析画面では、複数の動画を横断してアクションに至った要素の情報を表示させることもできる。これにより、動画単体ではなく全体の統計を把握することができる。

【0130】

本解析画面では、図１５の上段部に示されるように、「コンテンツ種別」「配信期間」「アクション種別」毎の要素の情報を表示することができる。ここで、コンテンツ種別は、ショッピング動画、映画、バラエティ番組等の種別に分けられるが、図１５に示されるように、「全コンテンツ」の動画を表示することもできる。配信期間は、任意の期間を指定することにより、期間を絞った分析をすることができる。アクション種別は、図１５に示されるように、「タップ」「ストック」「ジャンプ」「画面内リンク」「遷移先ＣＶ」が示されているが、何も選択しない場合は、動画の「全アクション」について表示することもできる。

【0131】

本解析画面では、図１５の中段部に示されるように、動画の要素（ここでは、セリフ、視聴者コメント、キャプション・字幕、カメラワーク）毎に要素の情報を表示することができる。図１５に示される例では、カメラワークにおける要素の情報が示されており、例えば、被写体種別、カメラ拡大率（寄り・引き）、カメラ移動量、明るさ・コントラストの情報が示されている。但し、要素の情報は図１５に示される例に限られず、その他の情報が表示されても良い。

【0132】

解析部は、情報収集サーバー１０の記録部１６に保存されているデータについて、全動画の要素の情報を取得する。また、解析部は、情報収集サーバー１０の記録部１６に保存されているデータについて、コンテンツ種別、配信期間、アクション種別、動画の要素毎の要素の情報を集計する。これにより、図１５に示される全体の統計の情報を生成することができる。管理者端末は、全動画の要素の情報のデータを情報解析サーバー２０から取得し、表示部に表示する。

【0133】

＝＝＝その他＝＝＝
前述の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更・改良され得ると共に、本発明には、その等価物が含まれることは言うまでもない。

【0134】

例えば、情報収集サーバー１０の抽出部１２は、視聴者の端末（ユーザー端末５）にソフトウェアとしてインストールされていても良い。この場合、動画の要素を視聴者の端末で解析し、解析結果だけをサーバーに送信する。また、抽出部１２は動画配信サーバー１にソフトウェアとしてインストールされていても良い。この場合は、視聴者の端末（ユーザー端末５）から、どの動画のいつのタイミングでアクションを発生させたかをサーバーに送信する。サーバーは特定の動画の時間情報から動画の要素を抽出する。この場合はサーバー側で動画をアーカイブしておく必要があるが、ユーザー端末５の負荷を減らし、より軽快な視聴環境を提供できる。

【0135】

上記実施形態では、記録部１６はサーバーにあるとして説明したがこの限りではなく、記録部１６は、ユーザー端末５にメモリ領域として確保されていても良い。これによって視聴者のプライバシーを守りつつ、特定の購買行動を視聴者の携帯端末で解析し広告表示の制御に用いることができる。

【0136】

動画の要素の情報は実施形態のものに限られない。出演者の属性（俳優、コメディアン、アニメーション）や、スポーツ中継の選手のユニフォームのロゴや競技場に掲げられた看板等、動画の中に映っていて視聴者の興味を喚起し、購買決定のきっかけになると考えられるものであればどのようなものでも良い。

【符号の説明】

【0137】

１動画配信サーバー
３メタデータ配信サーバー
５ユーザー端末
６タッチパネル
７Ａ表示部
７Ｂ入力部
８Ａ制御部
８Ｂ通信部
９通信ネットワーク
１０情報収集サーバー
１１特定部
１２抽出部
１３紐付け部
１６記録部
２０情報解析サーバー
４１，４２枠
４３ストック情報表示部
４４，４５アイテム画像
１００情報収集システム

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【手続補正書】

【提出日】2024-02-21

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

前記アクションは、前記動画が表示されている装置において実行される、
請求項２に記載の情報収集装置。

【請求項4】

前記アクションは、前記動画が表示されている装置とは異なる装置において実行される、
請求項２に記載の情報収集装置。

【請求項5】

前記動画の前記要素の情報は、前記特定部が前記実行時間を特定した後に生成される、
請求項１に記載の情報収集装置。

【請求項6】

前記動画の前記要素は、前記動画におけるセリフであって、
前記抽出部は、前記要素の情報として、前記動画の音声を解析し、テキストデータを抽出する、
請求項１に記載の情報収集装置。

【請求項7】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項６に記載の情報収集装置。

【請求項8】

前記要素は、前記動画における前記コメントであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記コメントのテキストデータを抽出する、
請求項１に記載の情報収集装置。

【請求項9】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項８に記載の情報収集装置。

【請求項10】

前記要素は、前記動画における前記キャプションであって、
前記抽出部は、前記要素の情報として、前記動画に付加された前記キャプションのテキストデータを抽出する、
請求項１に記載の情報収集装置。

【請求項11】

前記抽出部は、前記要素の情報として、前記テキストデータに関連する付加データを生成する、
請求項１０に記載の情報収集装置。

【請求項12】

前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画における被写体を検知し、前記被写体の大きさ、移動量、明るさ及びコントラストの少なくとも１つ以上を抽出する、
請求項１に記載の情報収集装置。

【請求項13】

前記要素は、前記動画における前記カメラワークであって、
前記抽出部は、前記要素の情報として、前記動画におけるシーンチェンジを検知し、前記シーンチェンジの有無を抽出する、
請求項１に記載の情報収集装置。

【請求項14】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定する特定部と、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出する抽出部と、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存する、紐付け部と、
前記要素毎に前記要素の情報のデータを集計する解析部と、
を備える情報収集装置。

【請求項15】

前記解析部は、前記アクションの数を集計することにより、前記アクションに紐づけられた前記要素の情報のデータを集計する、
請求項１４に記載の情報収集装置。

【請求項16】

前記解析部は、複数の前記アクションの数を集計し、
前記複数のアクションの各々の実行時間に対する前記要素の情報のデータを集計する、
請求項１４及び１５に記載の情報収集装置。

【請求項17】

前記解析部は、複数の前記動画について、前記複数の動画毎の前記要素の情報のデータを集計する、
請求項１４及び１５に記載の情報収集装置。

【請求項18】

【請求項19】

【請求項20】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、
をコンピュータに実行させ、前記動画の前記要素は、前記動画におけるセリフ、コメント、キャプション及びカメラワークの少なくとも１つ以上である、情報収集方法。

【請求項21】

所定の時間軸に沿って表示された動画に対してアクションが実行されたときに、前記所定の時間軸における前記アクションの実行時間を特定すること、
前記実行時間よりも所定時間前の、前記動画の要素の情報を抽出すること、
実行された前記アクションと、抽出された前記要素の情報とを紐付けて保存すること、
前記要素毎に前記要素の情報のデータを集計すること、
をコンピュータに実行させる情報収集方法。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】０００６

【補正方法】変更

【補正の内容】

【0006】

【手続補正3】

【補正対象書類名】明細書

【補正対象項目名】０００７

【補正方法】変更

【補正の内容】

【0007】

【手続補正4】

【補正対象書類名】明細書

【補正対象項目名】０００８

【補正方法】変更

【補正の内容】

【0008】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版