IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7265202広告閲覧情報出力方法及び広告閲覧情報出力プログラム、並びに情報処理装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-18
(45)【発行日】2023-04-26
(54)【発明の名称】広告閲覧情報出力方法及び広告閲覧情報出力プログラム、並びに情報処理装置
(51)【国際特許分類】
   G06Q 30/0242 20230101AFI20230419BHJP
【FI】
G06Q30/0242
【請求項の数】 10
(21)【出願番号】P 2021541905
(86)(22)【出願日】2019-08-29
(86)【国際出願番号】 JP2019033945
(87)【国際公開番号】W WO2021038800
(87)【国際公開日】2021-03-04
【審査請求日】2021-10-13
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100087480
【弁理士】
【氏名又は名称】片山 修平
(72)【発明者】
【氏名】山中 良祐
(72)【発明者】
【氏名】堀之内 省吾
(72)【発明者】
【氏名】増田 拓哉
(72)【発明者】
【氏名】半谷 敏規
【審査官】田川 泰宏
(56)【参考文献】
【文献】特開2011-233119(JP,A)
【文献】特開2012-123727(JP,A)
【文献】特開2011-232876(JP,A)
【文献】特開2015-015031(JP,A)
【文献】特開2008-112401(JP,A)
【文献】特許第4037130(JP,B2)
【文献】特許第5103287(JP,B2)
【文献】特開2015-228145(JP,A)
【文献】特開2011-070629(JP,A)
【文献】特開2017-010524(JP,A)
【文献】特開2018-106229(JP,A)
【文献】特開2010-087549(JP,A)
【文献】杵渕 哲也,デジタルサイネージのメディア化に向けた研究開発,NTT技術ジャーナル,社団法人電気通信協会,2009年07月01日,第21巻,第7号,p.16-19
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得し、
前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出し、
抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定し、
前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定し、
複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定した結果に基づいて前記広告の閲覧有無を判定し、
前記判定する処理の判定結果に基づいて、前記広告の閲覧人数に関する広告閲覧情報を生成し、
前記広告閲覧情報を出力する、
処理をコンピュータが実行し、
前記判定する処理では、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす、
ことを特徴とする広告閲覧情報出力方法。
【請求項2】
広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得し、
前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出し、
抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定し、
前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定し、
複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定した結果に基づいて前記広告の閲覧時間長を判定し、
前記判定する処理の判定結果に基づいて、前記広告の閲覧時間長に関する広告閲覧情報を生成し、
前記広告閲覧情報を出力する、
処理をコンピュータが実行し、
前記判定する処理では、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす、
ことを特徴とする広告閲覧情報出力方法。
【請求項3】
前記視線方向は、前記頭部領域から、基準方向に対する頭の向きを推定した結果に基づき、推定される、
ことを特徴とする請求項1または2に記載の広告閲覧情報出力方法。
【請求項4】
前記判定する処理では、前記特定する処理の結果に基づいて、前記複数フレームが撮影された時間のうち、前記広告が前記人物の視野内に入っていた時間の累積値、前記広告が前記人物の視野内に入っていた時間の最大値、又は前記広告が前記人物の視野内に最初に入った時刻と最後に入った時刻の間の時間を特定し、特定した時間が閾値以上である場合に、前記人物が前記広告を閲覧していたと特定する、ことを特徴とする請求項1~3のいずれか一項に記載の広告閲覧情報出力方法。
【請求項5】
前記特定する処理では、前記人物それぞれが位置している前記フレーム内のエリアを特定し、前記人物それぞれの視線方向が特定したエリアに対して予め定められている方向を向いている場合に、前記視野内に前記広告が入っていると特定する、ことを特徴とする請求項1~のいずれか一項に記載の広告閲覧情報出力方法。
【請求項6】
前記各フレームにおいて撮影された人物それぞれの属性を推定する処理を更に実行し、
前記出力する処理では、前記人物それぞれの属性に基づいて前記広告閲覧情報を整理して出力する、ことを特徴とする請求項1~のいずれか一項に記載の広告閲覧情報出力方法。
【請求項7】
広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得し、
前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出し、
抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定し、
前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定し、
複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定した結果に基づいて前記広告の閲覧有無を判定し、
前記判定する処理の判定結果に基づいて、前記広告の閲覧人数に関する広告閲覧情報を生成し、
前記広告閲覧情報を出力する、
処理をコンピュータに実行させ
前記判定する処理では、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす、
ことを特徴とする広告閲覧情報出力プログラム。
【請求項8】
広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得し、
前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出し、
抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定し、
前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定し、
複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定した結果に基づいて前記広告の閲覧時間長を判定し、
前記判定する処理の判定結果に基づいて、前記広告の閲覧時間長に関する広告閲覧情報を生成し、
前記広告閲覧情報を出力する、
処理をコンピュータに実行させ
前記判定する処理では、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす、
ことを特徴とする広告閲覧情報出力プログラム。
【請求項9】
広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得する取得部と、
前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出する抽出部と、
抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定する推定部と、
前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定する特定部と、
複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定部の特定結果に基づいて前記広告の閲覧有無を判定する判定部と、
前記判定部の判定結果に基づいて、前記広告の閲覧人数に関する広告閲覧情報を生成する生成部と、
前記広告閲覧情報を出力する出力処理部と、
を備え
前記判定部は、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす、
ことを特徴とする情報処理装置。
【請求項10】
広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得する取得部と、
前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出する抽出部と、
抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定する推定部と、
前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定する特定部と、
複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定部の特定結果に基づいて前記広告の閲覧時間長を判定する判定部と、
前記判定部の判定結果に基づいて、前記広告の閲覧時間長に関する広告閲覧情報を生成する生成部と、
前記広告閲覧情報を出力する出力処理部と、
を備え
前記判定部は、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす、
ことを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、広告閲覧情報出力方法及び広告閲覧情報出力プログラム、並びに情報処理装置に関する。
【背景技術】
【0002】
従来、学習モデルを用いて、頭部画像から顔の向きを出力する技術が知られている(例えば非特許文献1等参照)。また、監視カメラ等を用いた人物の追跡を実現するため、動画のフレーム間で人物をトラッキングする技術についても知られている(例えば、非特許文献2、特許文献1等参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2017-151582号公報
【非特許文献】
【0004】
【文献】Nataniel Ruiz, Eunji Chong, James M. Rehg、" Fine-Grained Head Pose Estimation Without Keypoints "、[online]、2018年4月13日、arXiv.org、[令和1年8月20日検索]、インターネット(URL:https://arxiv.org/pdf/1710.00925.pdf)
【文献】Michael Thoreau, Navinda Kottege、" Improving Online Multiple Object tracking with Deep Metric Learning "、[online]、2018年6月20日、arXiv.org、[令和1年8月20日検索]、インターネット(URL:https://arxiv.org/pdf/1806.07592.pdf)
【発明の概要】
【発明が解決しようとする課題】
【0005】
例えば、監視カメラから取得した1フレームから人物の頭部を抽出し、頭部から推定される顔の向きと広告が設置された位置との関係を用いることで、フレーム内の人物が広告の方向を向いているかどうかを推定できると考えられる。また、所定時間内に得られた複数のフレームにおける推定結果を合算することで、所定時間内において広告の方向を向いていた人物の数や、人物が広告の方向を向いていた時間を得ることができると考えられる。
【0006】
しかしながら、単に複数フレームにおける推定結果を合算しただけでは、広告の閲覧とは見做せないような場合(例えば人物が一瞬だけ広告の方向を向いた場合など)まで人数や時間としてカウントしてしまうおそれがある。
【0007】
1つの側面では、本発明は、カメラから得られる映像情報から、広告の効果測定に資する正確な情報を出力することが可能な広告閲覧情報出力方法及び広告閲覧情報出力プログラム、並びに情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
一つの態様では、広告閲覧情報出力方法は、広告の設置場所近傍の領域を撮影するカメラが撮影した映像情報を取得し、前記映像情報における各フレームにおいて、撮影された人物それぞれの頭部領域を抽出し、抽出した前記頭部領域に基づき前記人物それぞれの視線方向を推定し、前記人物それぞれの位置と前記広告の設置場所との関係、及び前記人物それぞれの視線方向に基づいて、前記人物それぞれの視野内に前記広告が入っているかを特定し、複数フレームにおいて同一人物と判定される人物ごとに、前記複数フレームにおける前記特定した結果に基づいて前記広告の閲覧有無を判定し、前記判定する処理の判定結果に基づいて、前記広告の閲覧人数に関する広告閲覧情報を生成し、前記広告閲覧情報を出力する、処理をコンピュータが実行し、前記判定する処理では、前記複数フレームにおいて、前記人物の視野内に前記広告が入っていたと特定された2つのフレームの間に、前記視野内に前記広告が入っていなかったと特定されたフレームが所定数未満存在していた場合、前記所定数未満のフレームにおいては、前記視野内に前記広告が入っていたとみなす広告閲覧情報出力方法である。
【発明の効果】
【0009】
カメラから得られる映像情報から、広告の効果測定に資する正確な情報を出力することができる。
【図面の簡単な説明】
【0010】
図1】第1の実施形態に係る広告効果測定システムの構成を概略的に示す図である。
図2】広告とカメラの配置及びカメラの撮影範囲を概略的に示す図である。
図3図3(a)は、サーバのハードウェア構成を示す図であり、図3(b)は、利用者端末のハードウェア構成を示す図である。
図4】サーバの機能ブロック図を示す図である。
図5図5(a)~図5(d)は、フレームにおける各人物の視認判定について説明するための図である。
図6図6(a)~図6(d)は、人物追跡(トラッキング)について説明するための図である。
図7】視認判定結果テーブルの一例を示す図である。
図8】閲覧判定結果テーブルの一例を示す図である。
図9】第1の実施形態に係る広告視認判定部の処理を示すフローチャートである。
図10】第1の実施形態に係る広告閲覧判定部の処理を示すフローチャートである。
図11図10の閲覧判定処理の詳細処理を示すフローチャートである。
図12】出力情報生成部の処理を示すフローチャートである。
図13】第1の実施形態における出力画面の例を示す図である。
図14】第1の実施形態における閲覧判定処理の変形例1を示すフローチャートである。
図15】第1の実施形態における閲覧判定処理の変形例2を示すフローチャートである。
図16】第1の実施形態における出力の変形例1を示す図である。
図17】第1の実施形態における出力の変形例1の別例を示す図である。
図18】第1の実施形態における出力の変形例2を示す図である。
図19】人物の属性を考慮する変形例における広告視認判定部の処理を示すフローチャートである。
図20図20(a)は、人物の属性を考慮する変形例における視認判定結果テーブルの一例を示す図であり、図20(b)は、人物の属性を考慮する変形例における閲覧判定結果テーブルの一例を示す図である。
図21図21(a)、図21(b)は、人物の属性を考慮する変形例における出力画面の例を示す図である。
図22】第2の実施形態の広告閲覧判定部の処理を示すフローチャートである。
図23】第2の実施形態の閲覧判定処理(図22のステップS342)の詳細処理を示すフローチャートである。
図24】第2の実施形態における閲覧判定結果テーブルを示す図である。
図25】第2の実施形態における出力情報生成部の処理を示すフローチャートである。
図26】第2の実施形態における出力画面の例を示す図である。
図27】第2の実施形態における出力の変形例1を示す図である。
図28図28(a)は、人物の属性を考慮する変形例における閲覧判定結果テーブルを示す図であり、図29(b)は、出力画面の例を示す図である。
図29】広告効果測定システムの変形例を示す図である。
【発明を実施するための形態】
【0011】
《第1の実施形態》
以下、第1の実施形態について、図1図13に基づいて詳細に説明する。
【0012】
図1には、第1の実施形態に係る広告効果測定システム100の構成が概略的に示されている。本第1の実施形態の広告効果測定システム100は、街中や駅構内などに設置される広告(紙媒体、デジタルサイネージなど形式は問わない)を通行人がどの程度閲覧しているかを自動的に判定して、出力するシステムである。
【0013】
図1に示すように、広告効果測定システム100は、カメラ50と、情報処理装置としてのサーバ10と、利用者端末70と、を備える。カメラ50、サーバ10、利用者端末70は、インターネットなどのネットワーク80に接続されている。
【0014】
ここで、カメラ50は、例えば駅に設置されるカメラ(監視カメラ)であり、図2に示すように、駅構内の柱に設けられた広告110の近傍に設置されているものとする。なお、カメラの設置場所は、広告を閲覧可能な領域を撮影可能な場所であればよい。例えば、広告110に対向して、設置されていてもよい。カメラ50の撮影範囲(画角)は、例えば、図2において破線枠で示すような広告110近傍の領域を含む範囲であるものとする。
【0015】
サーバ10は、カメラ50において撮影された映像情報(動画)を取得して、広告の方を向いている人物を特定するとともに、広告110を閲覧している人物を特定する。また、サーバ10は、広告110を閲覧している人数に関する情報を生成して、利用者端末70に対して出力する。なお、本第1の実施形態においては、人物が広告の方を向いている(頭の向きが広告の方を向いている)場合を、「視認」していると表現する。なお、頭の向きは、基準方向に対する角度のずれであらわされる。例えば、本第1の実施形態においては、基準方向は、首をひねったり上下に動かさずに、まっすぐカメラのレンズに顔を向けているときの方向である。この場合、首を動かさずに、カメラに対して顔が正対しているとき、頭の向きを示す3次元角度(Pitch(ピッチ)、Roll(ロール)、Yaw(ヨー))はいずれもゼロとなる。
このように、頭の向きに基づき、顔の向きを推定可能であって、さらには、顔の向きから視線方向を推定可能であるため、本第1の実施形態では、頭の向きと広告の設置位置とから、人物が広告を視認しているかを判定することができる。よって、本第1の実施形態には、ある時点における頭の向きが、広告の設置場所に向いていることは、人物が広告を「視認」しているとみなす。このように、頭部の向きを推定することは、視線方向を推定することに相当する。人物が広告を「視認」している場合、人物の視野内に広告が入っている可能性が高いことを意味する。また、本第1の実施形態では、人物が広告を「視認」している状態が一定時間以上(後述する閲覧最小時間以上)継続された場合、人物が広告を「閲覧」したものとする。人物が広告を「閲覧」した場合、広告の内容を確認できた可能性が高いこと、すなわち人物が広告を視聴したことを意味するものとする。
【0016】
利用者端末70は、例えば、広告110の掲示スペース(広告スペース)を提供する業者や、広告110の広告主が利用するPC(Personal Computer)などの端末である。利用者端末70は、利用者からの入力に応じて、サーバ10に対して情報の出力を要求するとともに、サーバ10から出力された情報を受信して、表示等する。
【0017】
図3(b)には、利用者端末70のハードウェア構成が概略的に示されている。図3(b)に示すように、利用者端末70は、CPU(Central Processing Unit)190、ROM(Read Only Memory)192、RAM(Random Access Memory)194、記憶部(ここではHDD(Hard Disk Drive))196、ネットワークインタフェース197、表示部193、入力部195、及び可搬型記憶媒体191からプログラムやデータ等を読み取り可能な可搬型記憶媒体用ドライブ199等を備えている。表示部193は、液晶ディスプレイ等を含み、入力部195は、キーボードやマウス、タッチパネル等を含む。これら利用者端末70の構成各部は、バス198に接続されている。
【0018】
(サーバ10について)
以下、サーバ10の詳細について説明する。
【0019】
図3(a)には、サーバ10のハードウェア構成が概略的に示されている。図3(a)に示すように、サーバ10は、CPU90、ROM92、RAM94、記憶部(HDD)96、ネットワークインタフェース97、及び可搬型記憶媒体用ドライブ99等を備えている。これらサーバ10の構成各部は、バス98に接続されている。サーバ10では、ROM92あるいはHDD96に格納されているプログラム(広告閲覧情報出力プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(広告閲覧情報出力プログラムを含む)をCPU90が実行することにより、図4に示す各部の機能が実現される。なお、図4には、サーバ10のHDD96等に格納されている視認判定結果テーブル40及び閲覧判定結果テーブル42も図示されている。なお、図4の各部の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0020】
図4には、サーバ10の機能ブロック図が示されている。図4に示すように、サーバ10では、CPU90がプログラムを実行することにより、取得部としての動画取得部20、広告視認判定部22、判定部としての広告閲覧判定部24、生成部としての出力情報生成部26、出力処理部としての出力部28、としての機能が実現されている。なお、CPU90は、動画取得部20、広告視認判定部22、広告閲覧判定部24、出力情報生成部26として機能する。ネットワークインタフェース197または表示部193は、出力部28として機能する。
【0021】
動画取得部20は、カメラ50が撮影した動画を所定時間ごとに取得し、動画DB38に格納する。
【0022】
広告視認判定部22は、利用者端末70からの指示に基づいて、動画DB38に格納された動画から、必要な動画を取得し、取得した動画に写っている人物それぞれが広告を視認したか否かを判定する処理を実行する。たとえば、利用者から指定された時間帯の動画や、所定時間幅の動画が取得される。広告視認判定部22は、判定結果を視認判定結果テーブル40に格納する。
【0023】
図5図6には、広告視認判定部22による処理の概要が示されている。広告視認判定部22は、動画から切り出される各フレームにおいて、人物を検出し、図5(a)において破線枠にて示すように、各人物の頭部領域を抽出する。そして、各人物の頭部領域の画像から、基準方向に対する頭の向きとして、3次元での回転角(ピッチ、ロール、ヨー)を推定する。なお、以下においては、この回転角を「3次元角度」と呼ぶ。上述のとおり、頭の向きを示す3次元角度に基づき、視線方向を推定することができる。図5(b)には、3次元角度が矢印にて示されている。この3次元角度の推定は、3次元ヘッドポーズ推定や、頭部姿勢推定(Head pose estimation)などと呼ばれ、上述した非特許文献1に開示されている技術を採用することができる。例えば、3次元ヘッドポーズ推定技術は、事前に、頭部領域の画像を入力として、基準方向に対する頭の向きを出力する学習モデルを準備する。そして、ヘッドポーズ推定時には、推定対象の人物の頭部領域の画像を学習モデルに入力することで、頭の向きを示す3次元角度を得る。
【0024】
次に、頭部の3次元角度から推定される視線方向が、広告を向いているかを判定するための処理ついて説明する。例えば、本実施例に係るシステムの管理者は、カメラ50の撮影領域に対しては、例えば図5(c)に示すように、複数(例えば3つ)のエリアA、B、Cを設定する。そして、管理者は、各エリアA~Cに存在する人物が広告を視認している可能性の高い角度範囲α、β、γを設定する。
【0025】
そして、広告視認判定部22は、例えば、人物がエリアAに存在する場合、人物の向いている方向(3次元角度)が角度範囲α内であれば、広告を視認していると判定する。具体的には、ピッチ、ロール、ヨー各々について、角度範囲の条件α1(ピッチ)、α2(ロール)、α3(ヨー)が、角度範囲αとして設定される。広告視認判定部22は、頭部方向(3次元角度)を構成するピッチ角、ロール角、ヨー角すべてが、それぞれ指定された角度範囲内であれば、人物は広告を視認していると判断する。なお、広告視認判定部22は、ピッチ角、ロール角、ヨー角のうち、ヨー角のみを使って、事前に指定された角度範囲α内であるかを判定してもよい。
また、広告視認判定部22は、人物がエリアBに存在する場合、人物の向いている方向(3次元角度)が角度範囲β内であれば、広告を視認していると判定する。この場合にも、エリアAの場合と同様、3次元角度(ピッチ、ロール、ヨー)全てを用いて人物が広告を視認しているかを判断してもよいし、ヨー角のみを用いて人物が広告を視認しているかを判断してもよい。
更に、広告視認判定部22は、人物がエリアCに存在する場合、人物の向いている方向(3次元角度)が角度範囲γ内であれば、広告を視認していると判定する。この場合にも、エリアA、Bの場合と同様、3次元角度(ピッチ、ロール、ヨー)全てを用いて人物が広告を視認しているかを判断してもよいし、ヨー角のみを用いて人物が広告を視認しているかを判断してもよい。
図5(d)においては、上記判定の結果、広告を視認している可能性が高いと判定した人物に「真」、そうでない人物に「偽」を付して示している。なお、撮影範囲内に設定されるエリアの数は、3つ以外であってもよい。また、各エリアは同一面積でなくてもよいし、撮影範囲は縦方向及び横方向に分割されてもよい。また、エリアや角度範囲は、システム管理者が手動で設定してもよいし、システム管理者が入力した広告の位置と撮影範囲との関係に基づいて、サーバ10が自動的に設定することとしてもよい。
【0026】
また、広告視認判定部22は、各フレームの各人物の見た目の類似性を利用して人物追跡(トラッキング)を行い、各フレームにおいて同一人物を特定する。以下、トラッキングについて、図6(a)~図6(d)に基づいて説明する。例えば、図6(a)に示すように時系列に沿って古い順にフレームn-2、n-1,nが得られたとする。この場合、広告視認判定部22は、既存の物体検出モデル(例えばFaster R-CNNやSSD(Single Shot MultiBox Detector))を利用して、人物を検出する(図6(b)の破線枠参照)。また、広告視認判定部22は、類似度学習モデルを利用して、人物の全身画像からN次元ベクトルを求め(図6(c)参照)、求めたN次元ベクトルに基づいて時系列方向のグルーピングを実行することで、フレーム間における同一人物の特定を行う(図6(d)参照)。なお、このようなトラッキング技術については、非特許文献2や特許文献1などに記載されている。
【0027】
そして、広告視認判定部22は、図5(d)で得られた各人物の「真」、「偽」の情報と、トラッキングにより得られたフレーム間の同一人物の情報と、を視認判定結果テーブル40にまとめる。
【0028】
ここで、視認判定結果テーブル40は、図7に示すような構造を有する。具体的には、視認判定結果テーブル40には、「個人ID」、「タイムスタンプ」、「視認判定」が関連付けて格納される。「個人ID」は、各人物に対して割り当てられた識別情報である。複数フレーム間において同一人物と特定された人物には、同一の個人IDが割り当てられる。「タイムスタンプ」は、動画から切り出したフレームに付帯するタイムスタンプであり、各人物の視認判定を行った際に用いたフレームに付帯するタイムスタンプが格納される。「視認判定」は、図5(d)の視認判定によって得られた「真」、「偽」の情報が格納される。
【0029】
図4に戻り、広告閲覧判定部24は、視認判定結果テーブル40を参照して、各人物が広告を閲覧したか否かを判定する。例えば、利用者が、デジタルサイネージを用いた30秒間の広告を表示した広告主であるとする。この場合、利用者は、自己の広告を表示していた間に、広告をどれだけの人物が閲覧していたかを知りたい場合がある。このような場合に、利用者は、利用者端末70から、当該30秒間を特定して、閲覧人数に関する情報の出力をサーバ10に要求する。広告視認判定部22は、当該要求を受け付けると、視認判定結果テーブル40のうち、特定された時間に対応するデータを参照して、各人物の閲覧判定処理を実行する。なお、複数の広告の表示に関するタイムスケジュールを、サーバ10が記憶している場合、利用者は分析対象の広告を識別する情報をサーバ10へ送信することで、サーバ10は広告が表示されていた時間帯を特定する。そして、サーバ10は、特定した時間帯において、広告閲覧情報を生成する。
【0030】
具体的には、広告閲覧判定部24は、視認判定結果テーブル40から特定された時間内における同一人物の(個人IDが共通する)視認判定結果を抽出し、抽出した視認判定結果が特定の条件を満たしていた場合に、当該人物が広告を閲覧していたと判定する。この場合の「特定の条件」とは、人物が広告を視認していた時間の合計値が所定時間(閲覧最小時間)以上であった場合であるものとする。
【0031】
広告閲覧判定部24は、上記のようにして実行した閲覧判定の結果を閲覧判定結果テーブル42に格納する。ここで、閲覧判定結果テーブル42は、図8に示すような構造を有する。具体的には、閲覧判定結果テーブル42には、個人IDに対応付けて閲覧判定結果(真/偽)が格納される。
【0032】
出力情報生成部26は、閲覧判定結果テーブル42を参照して、利用者端末70からの指示に対応する広告閲覧情報を生成し、出力部28に受け渡す。例えば、広告閲覧情報として、広告の閲覧人数に関する情報が生成される。広告閲覧情報は、広告の効果測定に資する情報である。
【0033】
出力部28は、出力情報生成部26から受け取った広告閲覧情報を利用者端末70に対して送信(出力)する。
【0034】
(サーバ10の処理について)
以下、サーバ10の処理について、フローチャートに沿って詳細に説明する。
【0035】
(広告視認判定部22の処理について)
まず、広告視認判定部22の処理について、図9のフローチャートに沿って説明する。なお、図9の処理の前提として、動画取得部20は、カメラ50で撮影された動画を随時取得して、動画DB38に格納しているものとする。また、図9の処理が開始されるのは、動画DB38に新たな動画が格納されたタイミングであるものとする。
【0036】
図9の処理が開始されると、まずステップS10において、広告視認判定部22が、動画DB38に新たに格納された動画からタイムスタンプを保持しつつ1枚のフレームを切り出す。
【0037】
次いで、ステップS12では、広告視認判定部22が、切り出したフレームにおいて、頭部領域を抽出する。その後は、広告視認判定部22は、ステップS14、S16と、ステップS18を同時並行的に実行する。
【0038】
ステップS14においては、広告視認判定部22が、3次元ヘッドポーズ推定により3次元角度を推定する。すなわち、前述したように、頭の向きの3次元角度から、視線方向(図5(b)において示す矢印の方向)を推定可能であるため、ステップS14では、頭の向きの3次元角度を推定する。次いで、ステップS16では、広告視認判定部22が、3次元角度から視認判定を行う。この場合、広告視認判定部22は、各人物の位置が、図5(a)のどのエリア内であるかを確認するとともに、各人物の3次元角度がエリアに設定された角度範囲に含まれていれば、広告を視認していると判定する。なお、基準方向を、「首をひねったり上下に動かさずに、まっすぐカメラのレンズを見ている場合の方向」としなかった場合、頭の向きを示す3次元角度を、視線方向相当の3次元角度に変換する処理を、ステップS14とステップS16の間で行う。
【0039】
一方、ステップS18においては、広告視認判定部22が、トラッキングにより個人IDを採番する。図9の処理を開始してからステップS18を初めて実行する場合には、フレーム内の人物それぞれに対して、新たな個人IDを採番する。一方、図9の処理を開始してからステップS18を実行するのが2回目以降である場合には、それ以前のフレームに含まれていた人物と同一人物に対しては、同一の個人IDを採番し、新たな人物に対しては新たな個人IDを採番する。
【0040】
ステップS14、S16の処理と、ステップS18の処理の両方が終了すると、ステップS20に移行し、広告視認判定部22は、個人IDに紐付けて、視認判定結果を視認判定結果テーブル40に格納する。この場合、広告視認判定部22は、切り出したフレームのタイムスタンプが「2019/7/24 14:30:30:00」であれば、図7の視認判定結果テーブル40のタイムスタンプ「2019/7/24 14:30:30:00」に対応付けて、個人ID(S18の結果)及び視認判定の結果(S16の結果)を格納する。
【0041】
次いで、ステップS22では、広告視認判定部22が、動画DB38に格納された動画から、全フレームの切り出しが終了したか否かを判断する。このステップS22の判断が否定された場合には、ステップS10に戻る。一方、ステップS10~S22の繰り返しの結果、ステップS22の判断が肯定された場合には、図9の全処理を終了する。図9の処理が終了した段階では、動画DB38に新たに格納された動画の全フレームについての視聴判定が終了し、視認判定結果が図7の視認判定結果テーブル40に格納された状態となる。
【0042】
(広告閲覧判定部24の処理について)
次に、広告閲覧判定部24の処理について、図10図11のフローチャートに沿って説明する。なお、図10の処理は、利用者端末70から、ある時間を指定した広告閲覧情報の出力要求を受け付けたタイミングである。ここでは、一例として、利用者が、利用者端末70を介して、例えば2019年7月24日14時30分30秒から同日14時31分00秒までを特定して、広告の閲覧人数の情報を出力する要求を行ったものとする。
【0043】
図10の処理では、まず、ステップS30において、広告閲覧判定部24が、視認判定結果テーブル40から指定されている時間帯(2019年7月24日14時30分30秒から14時31分00秒まで)のデータを抽出する。
【0044】
次いで、ステップS32では、広告閲覧判定部24が、個人IDを1つ選択する。例えば、広告閲覧判定部24は、抽出したデータに含まれる個人IDのうち最も小さい番号(例えば「001」)を選択する。
【0045】
次いで、ステップS34では、広告閲覧判定部24が、選択した個人IDに紐付くデータから、古い順に「偽」又は欠落の時間を特定する。ここで、欠落の時間とは、選択した個人IDの人物の視線方向を特定不能な時間を意味する。視線方向が特定不能となる場合は、例えば、人物が撮影されていない場合や、頭部領域の抽出ができなかった場合である。
【0046】
次いで、ステップS36では、広告閲覧判定部24が、特定した時間が修正最大時間未満であるか否かを判断する。ここで、広告を視認していると判断された時間の間に少しだけ広告を視認していないと判断された時間がある場合(頭が一瞬ブレたような場合)、その少しの時間だけ広告を視認していなかったとするのは現実的でない。また、広告を視認していると判断された時間の間に少しだけ撮影されていなかった時間がある場合(撮影範囲外に出た場合)には、その少しの時間の間は広告を視認していたとみなすのが妥当と考えられる。このため、本第1の実施形態では、特定した時間がそのような少しの時間(修正最大時間未満)であった場合には、その時間の視認判定を「真」に変更することとしている。なお、修正最大時間は、システム管理者等が設定することができるものとし、例えば0.5sec等とすることができる。
【0047】
したがって、ステップS36の判断が肯定された場合には、ステップS38に移行して、広告閲覧判定部24が視認判定を「真」に修正する。すなわち、広告閲覧判定部24は、「偽」又は欠落の時間を「真」であるとみなす。その後はステップS40に移行する。一方、ステップS36の判断が否定された場合には、広告閲覧判定部24は、特定した時間における視認判定結果の修正を行うことなく、ステップS40に移行する。
【0048】
なお、ステップS36の判断は、選択した個人IDの視認判定結果のうち、「真」と判断されたフレーム間に存在する「偽」と判断されたフレームの数が所定数未満であるか否かを判断しているとも言える。また、ステップS36の判断は、「真」と判断されたフレーム間において欠落しているフレームの数が所定数未満であるか否かを判断しているとも言える。
【0049】
ステップS40に移行すると、広告閲覧判定部24は、全ての「偽」又は欠落の時間を特定済みであるか否かを判断する。このステップS40の判断が否定された場合には、ステップS34に戻り、次に古い「偽」又は欠落の時間を特定し、以降のステップS36~S40の処理、判断を実行する。そして、ステップS40の判断が肯定された段階で、ステップS42に移行する。
【0050】
ステップS42に移行すると、広告閲覧判定部24は、閲覧判定処理のサブルーチンを実行する。具体的には、広告閲覧判定部24は、図11のフローチャートに沿った処理を実行する。
【0051】
図11の処理では、広告閲覧判定部24は、まず、ステップS50において、古い順に視認判定結果を確認し、「真」が連続している時間を算出する。
【0052】
次いで、ステップS52では、広告閲覧判定部24が、算出した時間を累積する。
【0053】
次いで、ステップS54では、広告閲覧判定部24が、全てのデータを確認済みか否かを判断する。このステップS54の判断が否定された場合には、ステップS50に戻り、ステップS50、S52の処理及びステップS54の判断を繰り返す。そして、ステップS54の判断が肯定された段階で、ステップS56に移行する。なお、ステップS54の判断が肯定された段階では、選択されている個人IDの人物が広告を視認していた時間の累積値(積算値)が得られている。
【0054】
次いで、ステップS56では、広告閲覧判定部24が、累積した時間が閲覧最小時間以上か否かを判断する。ここで、閲覧最小時間とは、累積した時間から閲覧有無を判定するための閾値であり、累積した時間が閲覧最小時間以上であれば、閲覧したと判定することとしている。なお、閲覧最小時間は、システム管理者が予め定めておくことができ、例えば0.6secなどとすることができる。ステップS56の判断が肯定された場合には、ステップS58に移行し、広告閲覧判定部24は、選択している個人IDの人物が広告を閲覧したと判定し、閲覧判定結果テーブル42にその旨を格納する。
【0055】
一方、ステップS56の判断が否定された場合には、ステップS60に移行し、広告閲覧判定部24は、選択している個人IDの人物は広告を閲覧していないと判定し、閲覧判定結果テーブル42にその旨を格納する。その後は、図11の全処理を終了し、図10のステップS44に移行する。
【0056】
ステップS44に移行すると、広告閲覧判定部24は、全ての個人IDを選択済みであるか否かを判断する。このステップS44の判断が否定された場合には、ステップS22に戻る。そして、抽出したデータに含まれる全ての個人IDに関する処理が終了した段階で、図10の全処理が終了する。
【0057】
以上のようにして、図10の全処理が終了した段階では、指定されている時間帯において、どの人物が広告を閲覧していて、どの人物が広告を閲覧していなかったかが、閲覧判定結果テーブル42(図8)に格納された状態となっている。
【0058】
(出力情報生成部26の処理について)
次に、出力情報生成部26の処理について、図12のフローチャートに沿って説明する。
【0059】
図12のフローチャートが開始されると、まずステップS70において、出力情報生成部26が、閲覧判定結果テーブル42を参照し、閲覧判定結果が「真」である個人IDの数を集計する。
【0060】
次いで、ステップS72では、出力情報生成部26が、閲覧判定結果テーブル42を参照して、閲覧判定結果が「偽」である個人IDの数を集計する。
【0061】
そして、ステップS74では、出力情報生成部26は、ステップS70で集計した数と、ステップS72で集計した数とを用いて、図13に示すような出力画面を生成し、出力部28に受け渡す。
【0062】
出力部28は、図13の出力画面を出力情報生成部26から受信すると、利用者端末70に対して送信する。これにより、利用者端末70の表示部93には、図13の出力画面が表示されるため、利用者は、自己の広告を閲覧していた人数を把握することができるとともに、広告の閲覧割合(広告近傍を通行していた人物のうち広告を閲覧していた人物の割合)を把握することができる。したがって、利用者は、図13の出力画面から、広告の掲示を継続するか否かや、広告の費用対効果が適切か否かなどを判断することができる。なお、図13の出力画面は一例である。例えば、広告閲覧人数と閲覧割合のいずれか一方のみを表示してもよい。また、広告閲覧人数と閲覧割合以外の情報を表示してもよい。
【0063】
これまでの説明からわかるように、本第1の実施形態においては、広告視認判定部22により、動画の各フレームにおいて、撮影された人物それぞれの頭部領域を抽出する抽出部、抽出した頭部領域から人物それぞれの視線方向(3次元角度)を推定する推定部、及び人物それぞれの視野内に広告が入っているかを特定する特定部としての機能が実現されている。
【0064】
以上説明したように、本第1の実施形態によると、広告視認判定部22が、動画の各フレームにおいて撮影された人物それぞれの頭部領域を抽出し(S12)、抽出した頭部領域から人物それぞれの視線方向(3次元角度)を推定する(S14)。また、広告視認判定部22は、人物それぞれの位置と広告の設置場所との関係、及び人物それぞれの視線方向(3次元角度)に基づいて、人物それぞれが広告を視認しているかを判定する(S16)。また、広告閲覧判定部24は、複数フレームにおいて同一人物と判定される人物ごと(同一の個人IDが採番された人物ごと)に、複数フレームにおける視認判定結果に基づいて広告の閲覧判定を行う(S42)。更に、出力情報生成部26は、広告を閲覧していた人物の数を集計し(S70)、出力部28を介して広告の閲覧人数に関する情報を利用者端末70に対して出力する(S74)。これにより、本第1の実施形態では、同一人物ごとに、複数フレームにおける視認判定結果に基づいて広告の閲覧有無を判定するので、広告の閲覧とは見做せないような場合(例えば人物が一瞬だけ広告の方向を向いた場合など)を閲覧と判定しないようにすることができる。したがって、本第1の実施形態によれば、広告の効果測定に資する正確な情報(閲覧人数や閲覧割合などの広告閲覧情報)を出力することができる。この場合、広告スペースの価値を数値として表すことができるので、広告スペースを管理する業者が広告スペースを広告主に提供する際の値段の決定や、広告スペースを利用した場合の効果のアピール等に用いることが可能である。
【0065】
また、本第1の実施形態では、広告閲覧判定部24は、広告を視認していると判定された時間の累積値が閲覧最小時間以上である場合(S56:肯定)に、広告を閲覧していたと判定する(S58)。これにより、人物が一瞬だけ広告の方向を向いたような場合に、広告の閲覧とは判定しないようにすることができる。
【0066】
また、本第1の実施形態では、広告閲覧判定部24は、「偽」又は欠落の時間を特定し(S34)、特定した時間が修正最大時間未満である場合(S36:肯定)に、視認判定結果を「真」に修正する(S38)。これにより、人物の動きの特性を考慮して、視認判定において「偽」と判定されたものの、実際には「真」と見做すべき場合を修正することとしているため、広告の閲覧人数や閲覧割合を精度よく集計することができる。
【0067】
また、本第1の実施形態では、広告視認判定部22は、人物が位置しているフレーム内のエリアを特定し、人物の視線方向(3次元角度)が特定したエリアに対して予め定められている方向を向いている場合に、広告を視認していると判定する。これにより、カメラ50と広告110とが離れているような場合であっても、人物が広告を視認しているか否かを簡易に判定することができる。なお、カメラ50は、広告110の向かい側に設けられてもよい。
【0068】
また、本第1の実施形態では、広告視認判定部22は、各フレームから頭部領域を抽出して、視線方向が推定可能な頭の向きの3次元角度を推定する。画像から抽出した顔領域から、顔の特徴量を抽出する技術もある。しかし、顔の特徴量はプライバシーにかかわる情報である。よって、顔の特徴量を用いる視線方向の推定技術と比較して、本第1の実施形態は、頭部領域のみを利用するため、よりプライバシーに配慮した技術といえる。また、監視カメラのように、広告の設置場所とは、独立して設けられているカメラの映像を利用する場合、監視カメラに顔が映らない通行人も多く存在する。このような場合でも、本第1の実施形態は、視線方向を推定することが可能であって、顔が映っていることを条件とする技術と比較して、汎用性が高い。
【0069】
(閲覧判定処理の変形例1)
上記第1の実施形態では、図11の閲覧判定処理において、視認判定結果が「真」である時間の累積時間が閲覧最小時間以上である場合(S56:肯定)に、広告を閲覧したと判定する(S58)場合について説明したが、これに限られるものではない。例えば、図11の閲覧判定処理に代えて、図14に示すような処理を実行することができる。図14の処理では、ステップS50において、広告閲覧判定部24が、「真」が連続している時間を算出すると、ステップS152において、算出した時間を保存する。そして、広告閲覧判定部24は、ステップS50、S152の処理を繰り返すことで、全てのデータの確認が終了すると(S54:肯定)、ステップS155に移行して、保存した時間のうち、最長の時間(最大値)を抽出する。
【0070】
次いで、ステップS156では、広告閲覧判定部24は、ステップS155において抽出した時間が閲覧最小時間以上か否かを判断する。このステップS156の判断が肯定された場合には、ステップS58に移行し、広告閲覧判定部24は、選択している個人IDの人物が広告を閲覧したと判定し、閲覧判定結果テーブル42にその旨を格納する。一方、ステップS156の判断が否定された場合には、ステップS60に移行し、広告閲覧判定部24は、選択している個人IDの人物は広告を閲覧していないと判定し、閲覧判定結果テーブル42にその旨を格納する。その後は、図14の全処理を終了する。
【0071】
以上のように、図14の処理では、選択している個人IDの視認判定結果において「真」が連続している時間のうち最長の時間を用いて、閲覧判定を行うこととしている。このようにしても、上記第1の実施形態と同様、精度よく広告を閲覧した人物を特定することができる。
【0072】
(閲覧判定処理の変形例2)
また、例えば、図11の閲覧判定処理に代えて、図15に示すような処理を実行することもできる。図15の処理では、ステップS250において、広告閲覧判定部24が、古い順に視認判定結果を確認し、最初に「真」と判定された時刻を特定する。次いで、ステップS252では、広告閲覧判定部24が、古い順に視認判定結果を確認し、最後に「真」と判定された時刻を特定する。次いで、ステップS254では、広告閲覧判定部24が、特定された時刻間の時間を算出する。すなわち、広告閲覧判定部24は、広告を最初に視認したと判定されてから、最後に視認したと判定されるまでの間の時間を算出する。
【0073】
次いで、ステップS256では、広告閲覧判定部24は、ステップS254において算出した時間が閲覧最小時間以上か否かを判断する。このステップS256の判断が肯定された場合には、ステップS58に移行し、広告閲覧判定部24は、選択している個人IDの人物が広告を閲覧したと判定し、閲覧判定結果テーブル42にその旨を格納する。一方、ステップS256の判断が否定された場合には、ステップS60に移行し、広告閲覧判定部24は、選択している個人IDの人物は広告を閲覧していないと判定し、閲覧判定結果テーブル42にその旨を格納する。その後は、図15の全処理を終了する。
【0074】
以上のように、図15の処理では、広告を最初に視認したと判定されてから、最後に視認したと判定されるまでの間の時間を用いて、閲覧判定を行うこととしている。このようにしても、上記第1の実施形態や上記閲覧判定処理の変形例1と同様、精度よく広告を閲覧した人物を特定することができる。
【0075】
なお、図15の処理を行う場合には、図10のステップS34、S36、S38、S40の処理は省略してもよい。
【0076】
(出力の変形例1)
上記第1の実施形態では、利用者端末70において、1つの広告を表示している間の時間帯を指定して、図10の処理をサーバ10に実行させる場合について説明したが、これに限られるものではない。例えば、ある1日を特定し、その1日における1時間ごとの広告閲覧人数を集計するように、利用者端末70において指定することもできる。
【0077】
この場合、特定された1日分のデータを視認判定結果テーブル40から抽出し、そのうちの1時間分のデータを用いて図10の処理を実行することで、1時間分の閲覧判定結果テーブル42を得る。そして、次の1時間分のデータを用いた図10の処理、更に、次の1時間分のデータを用いた図10の処理、…というように図10の処理を繰り返し実行することで、1時間ごとの閲覧判定結果テーブル42を得ることができる。
【0078】
この場合、出力情報生成部26は、例えば、各時間において閲覧判定結果が「真」の個人IDの数を集計し、グラフ化することで、図16に示すような出力画面を生成することができる。これにより、利用者端末70には、図16に示すような画面が表示されるため、広告主等はどの時間帯において広告が閲覧されているかを把握することが可能となる。また、広告スペースを提供する業者は、時間ごとの閲覧人数に応じて広告スペースの価格(レンタル料)を適切に調整することができる。例えば、図16において、閲覧人数が150人以上の時間帯のレンタル料を高くし、150人未満の時間帯のレンタル料を安くする、などすることができる。
【0079】
なお、図16のグラフにおいては、例えば所定期間(1週間や1カ月など)における各時間帯の閲覧人数の平均値を表示してもよい。また、複数の日の各時間帯の閲覧人数を別々に表示してもよい。この場合、図17に示すように、平日における各時間帯の閲覧人数の平均値、土曜日における各時間帯の閲覧人数の平均値、日曜日における各時間帯の閲覧人数の平均値を別々に表示するなどすることもできる。
【0080】
(出力の変形例2)
なお、出力情報生成部26は、図18に示すように、各時刻において広告を閲覧していると判定された人物の個人IDを列挙したログを生成することとしてもよい。サーバ10から利用者端末70に対して図18のログを出力した場合、利用者端末70においてログを解析し、解析結果として図13図16図17と同様の画面を表示部193上に表示することとしてもよい。
【0081】
(人物の属性を考慮する変形例)
なお、本第1の実施形態では、視認判定の際に各人物の属性(性別や年齢)を推定し、広告閲覧情報を生成する際に、各人物の属性に基づいて広告閲覧情報を整理することとしてもよい。
【0082】
具体的には、広告視認判定部22は、図9の処理に代えて、図19の処理を実行する。図19の処理においては、広告視認判定部22は、ステップS14、S16と、ステップS18の処理と並行して、ステップS19の処理を実行する。ステップS19においては、広告視認判定部22は、頭部領域から、人物の属性(性別、年齢)を推定する。ここで、人物の属性を推定する際には、機械学習等のAI(Artificial Intelligence)技術を用いることができる。そして、ステップS14、S16と、ステップS18と、ステップS19の並行処理が終了すると、ステップS20’において、広告視認判定部22は、個人IDに紐付けて、属性と、視認判定結果を視認判定結果テーブル40に格納する。
【0083】
この場合の視認判定結果テーブル40としては、図20(a)に示すようなテーブルを用いることができる。また、広告閲覧判定部24による図10の処理の結果得られる閲覧判定結果テーブル42は、図20(b)に示すようなテーブルとなる。図20(a)、図20(b)の各テーブルにおいては、個人IDに対して、性別と年齢が紐付けられている。
【0084】
出力情報生成部26は、図20(b)の閲覧判定結果テーブル42から、男女別、年代別に閲覧判定結果「真」、「偽」を集計することにより、図21(a)に示すような画面を生成することができる。利用者端末70に図21(a)に示すような画面が表示されることにより、広告主等は、広告を閲覧している年齢層や性別を的確に把握することができる。
【0085】
また、図20(b)の閲覧判定結果テーブル42が1時間ごとに作成された場合には、出力情報生成部26は、男女別、及び男女両方についての各時間における閲覧判定結果を集計することで、図21(b)に示すような出力画面を生成することができる。利用者端末70に図21(b)に示すような画面が表示されることで、広告主等はどの時間帯に男女のどちらが広告を多く閲覧しているかを把握することが可能となる。これにより、広告主等は、どの時間帯にどのような広告を出すべきかなどを判断することができる。また、広告スペースを提供する業者は、閲覧人数や閲覧している人物の属性に合わせて、広告スペースの価格(レンタル料)を調整することができる。
【0086】
《第2の実施形態》
次に、第2の実施形態について、図22図26に基づいて詳細に説明する。本第2の実施形態の広告効果測定システム100の構成は、第1の実施形態と同様であるが、広告閲覧判定部24が各人物による広告の閲覧時間長を判定する点、及び出力情報生成部26が広告の閲覧時間長に関する出力画面を生成する点が第1の実施形態と異なる。以下、第1の実施形態と異なる点について詳細に説明し、第1の実施形態と同一又は同等な点については、その説明を省略または簡略化するものとする。
【0087】
(広告閲覧判定部24の処理について)
図22には、第2の実施形態に係る広告閲覧判定部24の処理が示されている。なお、図22の処理が行われる前提として、広告視認判定部22による図9の処理が実行されており、図7に示すように視認判定結果テーブル40にデータが格納されているものとする。
【0088】
図22の処理においては、図10のステップS42(閲覧判定処理)に代えて、閲覧時間算出処理(S342)が実行され、その他の処理については、図10と同様となっている。
【0089】
ステップS342においては、図23のフローチャートに沿った処理が実行される。ここで、ステップS342の処理のうち、ステップS50、S52、S54(広告閲覧判定部24が視認判定結果「真」が連続している時間を累積する点)とステップS56(累積した時間が閲覧最小時間以上であるか判断する点)については、第1の実施形態(図11)と同様である。その一方で、ステップS56の判断が肯定された場合にステップS358に移行し、否定された場合にステップS360に移行する点が第1の実施形態と異なっている。
【0090】
ステップS358に移行した場合、広告閲覧判定部24は、累積した時間を閲覧時間長として、閲覧判定結果テーブル42に格納する。ここで、本第2の実施形態の閲覧判定結果テーブル42には、図24に示すように、「個人ID」に紐付けて各人物の「閲覧時間長」を格納できるようになっている。例えば、個人ID=001の人物の累積した時間が10secであった場合には、図24に示すように、閲覧判定結果テーブル42の「閲覧時間長」の欄に「10sec」と格納する。
【0091】
一方、ステップS360に移行した場合、広告閲覧判定部24は、閲覧時間長を「0」として、閲覧判定結果テーブル42に格納する。例えば、個人ID=002の人物の累積した時間が0.4secであった場合には、図24に示すように、閲覧判定結果テーブル42の「閲覧時間長」の欄に「0sec」と格納する。その後は、図22のステップS44に戻る。
【0092】
以上のように、広告閲覧判定部24の処理(図22図23)が行われることで、利用者端末70において指定された時間帯(例えば広告を表示した時間帯)における、各人物の閲覧時間長が、閲覧判定結果テーブル42(図24)に格納されるようになっている。
【0093】
(出力情報生成部26の処理について)
次に、本第2の実施形態における出力情報生成部26の処理について、図25のフローチャートに沿って説明する。
【0094】
図25の処理では、まず、ステップS370において、出力情報生成部26は、集計対象の閲覧時間長範囲を設定する。例えば、閲覧時間長範囲として、「0.6sec以上2sec未満」、「2sec以上7sec未満」、「7sec以上15sec未満」…が選択可能であるとする。この場合、出力情報生成部26は、例えば「0.6sec以上2sec未満」を集計対象の閲覧時間長範囲として設定する。
【0095】
次いで、ステップS372では、出力情報生成部26は、閲覧判定結果テーブル42(図24)から、集計対象の閲覧時間長範囲(0.6sec以上2sec未満)に含まれる閲覧時間長が対応付けられた個人IDの数を集計する。
【0096】
次いで、ステップS374では、出力情報生成部26は、全ての閲覧時間長範囲を集計対象として設定済みか否かを判断する。このステップS374の判断が否定された場合には、ステップS370に戻る。その後は、出力情報生成部26は、集計対象の閲覧時間長範囲を変更しつつ、ステップS372を繰り返し、ステップS374の判断が肯定された段階で、ステップS376に移行する。
【0097】
ステップS376に移行すると、出力情報生成部26は、集計した個人IDの数を用いて出力画面を生成し、出力部28に受け渡す。出力情報生成部26は、例えば、図26に示すような出力画面を生成する。出力部28は、図26の出力画面を利用者端末70に対して出力するため、利用者端末70に表示された出力画面を確認することにより、広告を閲覧していた人物がどのくらいの時間閲覧し続けたかを把握することができる。
【0098】
以上説明したように、本第2の実施形態によると、広告視認判定部22が、動画の各フレームにおいて、撮影された人物それぞれの頭部領域を抽出し(S12)、抽出した頭部領域から人物それぞれの視線方向(3次元角度)を推定する(S14)。また、広告視認判定部22は、人物それぞれの位置と広告の設置場所との関係、及び人物それぞれの視線方向(3次元角度)に基づいて、人物それぞれが広告を視認しているかを判定する(S16)。そして、広告閲覧判定部24は、複数フレームにおいて同一人物と判定される人物ごと(同の個人IDが採番された人物ごと)に、複数フレームにおける視認判定結果に基づいて広告の閲覧時間長を特定する(S358、S360)。更に、出力情報生成部26は、各人物の広告の閲覧時間長を集計し、出力部28を介して広告の閲覧時間長に関する情報を利用者端末70に対して出力する(図25)。これにより、本第2の実施形態では、同一人物ごとに複数フレームにおける視認判定結果から閲覧時間長を特定するので、広告の閲覧とは見做せないような場合(例えば人物が一瞬だけ広告の方向を向いた場合など)を閲覧と判定しないようにすることができる。したがって、本第2の実施形態によれば、広告の効果測定に資する正確な情報(閲覧時間長に関する情報)を出力することができる。この場合、広告スペースの価値を数値として表すことができるので、広告スペースを管理する業者が広告スペースを広告主に提供する際の値段の決定や、広告スペースを利用した場合の効果のアピール等に用いることが可能である。
【0099】
また、本第2の実施形態では、広告閲覧判定部24は、広告を視認していると判定された時間の累積値が閲覧最小時間以上である場合(S56:肯定)に、累積値を閲覧時間長とし(S358)、それ以外の場合に、閲覧時間長を0とする(S360)。これにより、人物が一瞬だけ広告の方向を向いたような場合に、広告の閲覧とは判定しないようにすることができる。
【0100】
(閲覧判定処理の変形例1)
なお、上記第2の実施形態では、図23の閲覧判定処理において、視認判定結果が「真」である時間の累積時間が閲覧最小時間以上である場合(S56:肯定)に、累積時間を広告の閲覧時間長とする(S358)場合について説明した。しかしながら、これに限られるものではなく、上述した第1の実施形態の変形例(図14)と同様、視認判定結果において「真」が連続している時間のうち最長の時間が閲覧最小時間以上である場合に、当該最長の時間を広告の閲覧時間長とすることとしてもよい。
【0101】
(閲覧判定処理の変形例2)
また、上述した第1の実施形態の閲覧判定処理の変形例2(図15)と同様、広告を最初に視認したと判定されてから、最後に視認したと判定されるまでの間の時間が閲覧最小時間以上である場合に、当該時間を広告の閲覧時間長とすることとしてもよい。
【0102】
(出力の変形例1)
上記第2の実施形態では、1つの広告を表示している間の時間帯の閲覧時間長を集計した表を出力する例(図26参照)について説明したが、これに限られるものではない。例えば、ある1日における1時間ごとの閲覧時間長を集計して、グラフを生成することとしてもよい。この場合、例えば、図27に示すようなグラフを生成することができる。
【0103】
これにより、利用者端末70には、図27に示すような画面が表示されるため、広告主等は各時間帯において広告を閲覧している人がどのくらいの人数いて、広告を閲覧している人が広告をどのくらいの時間見ているのかを把握することが可能となる。また、広告スペースを提供する業者は、時間帯ごとの閲覧時間長の傾向に応じて広告スペースの価格(レンタル料)を適切に調整することができる。
【0104】
なお、図27では、1日分の閲覧判定結果テーブル42を集計したグラフを示しているが、例えば、複数日分の閲覧判定結果テーブル42を時間帯ごとに集計してグラフを作成してもよいし、曜日ごとに各時間帯のデータを集計してグラフを作成してもよい。
【0105】
(出力の変形例2)
なお、出力情報生成部26は、各人物の閲覧時間長を列挙したログを生成してもよい。サーバ10から利用者端末70に対してログを出力した場合、利用者端末70においてログを解析し、解析結果として図26図27と同様の画面を表示部193上に表示することとしてもよい。
【0106】
(人物の属性を考慮する変形例)
なお、本第2の実施形態においても、視認判定の際に各人物の属性(性別や年齢)を推定し、広告閲覧情報を生成する際に、各人物の属性に基づいて広告閲覧情報を整理することとしてもよい。この場合、広告視認判定部22は、図19と同様の処理を実行すればよい。これにより、閲覧判定結果テーブル42としては、図28(a)に示すようなテーブルを得ることができる。
【0107】
この場合、出力情報生成部26は、図28(a)の閲覧判定結果テーブル42から、性別及び年齢を考慮して、閲覧時間長を集計することにより、例えば、図28(b)に示すような出力画面を生成することができる。図28(b)の出力画面には、性別ごと及び年代ごとに、閲覧時間長幅ごとの人数を集計した結果が示されている。利用者端末70に図28(b)に示すような画面が表示されることにより、広告主等は、広告を閲覧している年齢層や性別を的確に把握することができるとともに、各年齢層の人物が、広告をどの程度の時間閲覧するかを把握することもできる。
【0108】
なお、上記第1、第2実施形態及び変形例で示した出力画面は、一例である。すなわち、閲覧判定結果テーブル42から得られる種々の情報を、種々の態様で画面上に表示することができる。
【0109】
なお、上記第1、第2の実施形態の広告効果測定システム100は、カメラ50において撮影された動画を取得したサーバ10が各種処理を行う場合について説明したが、これに限られるものではない。例えば、図29に示すような広告効果測定システム100’を採用してもよい。図29の広告効果測定システム100’においては、カメラ50がエッジゲートウェイなどの情報処理装置60に接続(例えば有線接続)されているものとする。情報処理装置60は、カメラ50近傍に設けられているものとし、第1の実施形態で説明したサーバ10の機能(図4に示す各機能)を有しているものとする。すなわち、情報処理装置60は、カメラ50から動画を受信して、第1、第2の実施形態のサーバ10と同様の処理を実行する。情報処理装置60において生成された情報(出力画面)は、サーバ10に送信され、適宜、利用者端末70に送信されるものとする。なお、情報処理装置60は、図4の全ての機能を有していなくてもよい。例えば、出力情報生成部26は、サーバ10が有していてもよい。この場合、情報処理装置60は、サーバ10に対して、閲覧判定結果テーブル42の情報を出力することとし、サーバ10が、閲覧判定結果テーブル42に基づいて出力画面を生成するようにしてもよい。このように情報処理装置60を設けることにより、カメラ50からサーバ10に対して動画を送信しなくてもよくなるので、ネットワーク負荷を低減することができる。
【0110】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体(ただし、搬送波は除く)に記録しておくことができる。
【0111】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD-ROM(Compact Disc Read Only Memory)などの可搬型記憶媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0112】
プログラムを実行するコンピュータは、例えば、可搬型記憶媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0113】
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【符号の説明】
【0114】
10 サーバ(情報処理装置)
20 動画取得部(取得部)
22 広告視認判定部(抽出部、推定部、特定部)
24 広告閲覧判定部(判定部)
26 出力情報生成部(生成部)
28 出力部(出力処理部)
50 カメラ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29