(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-07
(45)【発行日】2024-11-15
(54)【発明の名称】予測システム、予測方法、及びコンピュータプログラム
(51)【国際特許分類】
H04N 17/00 20060101AFI20241108BHJP
H04N 21/258 20110101ALI20241108BHJP
H04N 21/235 20110101ALI20241108BHJP
G06F 16/908 20190101ALI20241108BHJP
【FI】
H04N17/00 M
H04N21/258
H04N21/235
G06F16/908
(21)【出願番号】P 2024095953
(22)【出願日】2024-06-13
【審査請求日】2024-06-13
【早期審査対象出願】
(73)【特許権者】
【識別番号】524065479
【氏名又は名称】株式会社博報堂テクノロジーズ
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際弁理士法人
(72)【発明者】
【氏名】▲高▼橋 正憲
(72)【発明者】
【氏名】小山田 圭佑
(72)【発明者】
【氏名】篠田 裕之
【審査官】薄井 義明
(56)【参考文献】
【文献】特許第6423132(JP,B1)
【文献】特許第7399225(JP,B1)
【文献】特許第7464711(JP,B2)
【文献】特許第7499397(JP,B1)
【文献】特開2020-013270(JP,A)
【文献】特開2022-156098(JP,A)
【文献】特開2023-183830(JP,A)
【文献】国際公開第2024/014327(WO,A1)
【文献】特開2024-010756(JP,A)
【文献】山野上 勇人 Yuto YAMANOUE,裏番組を考慮したターゲットごとの視聴率予測,日本オペレーションズ・リサーチ学会 2019年秋季研究発表会アブストラクト集 (第37回企業事例交流会) The 2019 Fall National Conference of Operations Research Society of Japan,日本,公益社団法人日本オペレーションズ・リサーチ学会,2019年09月12日,P.216-217
【文献】西村 祐樹 Yuki Nishimura,潜在表現モデルに基づくテレビ番組の魅力度要因分析モデル ,2019年度人工知能学会全国大会(第33回) [online],日本,一般社団法人人工知能学会,2019年06月07日,P.1-4
【文献】渡辺 元,本誌主催セミナー「AIと放送メディアの活用を考える」報告 Report,実用的なクラウドAIサービスが増加 最新研究では人間を凌駕する機能も,日本,(株)ニューメディア,2018年05月01日,第36巻,P.62-65
(58)【調査した分野】(Int.Cl.,DB名)
H04N 17/00
H04N 21/258
H04N 21/235
G06F 16/908
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
予測システムであって、
取得部と、
予測部と、
を備え、
前記取得部は、
予測対象番組の放送予定日時を含む第1情報と、
前記予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、
前記予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、
前記複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、
を取得するように構成され、
前記予測部は、
前記第1情報から特定される前記予測対象番組の放送予定日時と、
前記第2情報から特定される前記複数の同時間帯番組の放送日時及び視聴量と、
前記第3情報から特定される前記少なくとも1つの隣接番組の放送予定日時と、
前記第4情報から特定される前記複数の過去隣接番組の放送日時及び視聴量と、
を含む入力情報を
、学習済みの深層学習モデルに入力し、前記深層学習モデルの出力として、前記予測対象番組の視聴量の予測値を得ることにより、前記予測対象番組の視聴量を予測するように構成される、
予測システム。
【請求項2】
請求項1に記載の予測システムであって、
前記第1情報は、前記予測対象番組の放送予定日時として、予定される前記予測対象番組の放送開始日時を特定可能な情報を含み、
前記第2情報は、前記複数の同時間帯番組の放送日時として、前記複数の同時間帯番組の放送開始日時を特定可能な情報を含み、
前記複数の同時間帯番組は、前記予測対象番組と同じ曜日かつ同じ放送局において過去に放送された番組であって、過去の複数の週のそれぞれにおいて、前記予測対象番組の放送開始日時に最も近い放送開始日時を有する番組である、
予測システム。
【請求項3】
請求項1又は請求項2に記載の予測システムであって、
前記予測対象番組の特徴量である第1特徴量と、前記複数の同時間帯番組のそれぞれの特徴量である複数の第2特徴量と、を生成するように構成される生成部を更に備え、
前記第1特徴量は、前記予測対象番組及び前記少なくとも1つの隣接番組のそれぞれにおける、放送予定日時
及びタイトル
の双方に基づいて生成され、
前記複数の第2特徴量は、前記複数の同時間帯番組及び前記複数の過去隣接番組のそれぞれにおける、放送日時、
視聴量、及びタイトルに基づいて生成され、
前記予測部は、前記入力情報として、前記第1特徴量と前記複数の第2特徴量とを含む情報を
、学習済みの前記深層学習モデルに入力するように構成される、
予測システム。
【請求項4】
請求項3に記載の予測システムであって、
前記深層学習モデルは、前記入力情報に含まれる時系列情報を用いて前記予測値を算出するように構成される、
予測システム。
【請求項5】
請求項4に記載の予測システムであって、
前記生成部は、前記複数の同時間帯番組の放送順を表す情報を前記時系列情報として含むように、前記複数の第2特徴量を生成するように構成される、
予測システム。
【請求項6】
コンピュータによって実行される予測方法であって、
取得することと、
予測することと、
を含み、
前記取得することは、
予測対象番組の放送予定日時を含む第1情報と、
前記予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、
前記予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、
前記複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、
を取得することを含み、
前記予測することは、
前記第1情報から特定される前記予測対象番組の放送予定日時と、
前記第2情報から特定される前記複数の同時間帯番組の放送日時及び視聴量と、
前記第3情報から特定される前記少なくとも1つの隣接番組の放送予定日時と、
前記第4情報から特定される前記複数の過去隣接番組の放送日時及び視聴量と、
を含む入力情報を
、学習済みの深層学習モデルに入力し、前記深層学習モデルの出力として、前記予測対象番組の視聴量の予測値を得ることにより、前記予測対象番組の視聴量を予測することを含む、
予測方法。
【請求項7】
請求項6に記載の予測方法をコンピュータに実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は予測システムに関する。
【背景技術】
【0002】
テレビやインターネット等の放送媒体で放送される番組の視聴率を予測する技術が知られている。例えば、特許文献1には、対象番組に関連する関連番組を過去番組の中から抽出し、関連番組を用いて対象番組の視聴率を予測するシステムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来のように関連番組の視聴率を考慮するだけでは、対象番組の視聴率を高精度に予測することが難しかった。
本開示の一局面は、番組の視聴量の予測精度を向上させることにある。
【課題を解決するための手段】
【0005】
本開示の一態様は、予測システムであって、取得部と、予測部と、を備える。
取得部は、予測対象番組の放送予定日時を含む第1情報と、予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、を取得するように構成される。
【0006】
予測部は、第1情報から特定される予測対象番組の放送予定日時と、第2情報から特定される複数の同時間帯番組の放送日時及び視聴量と、第3情報から特定される少なくとも1つの隣接番組の放送予定日時と、第4情報から特定される複数の過去隣接番組の放送日時及び視聴量と、を含む入力情報を深層学習モデルに入力し、深層学習モデルの出力として、予測対象番組の視聴量の予測値を得ることにより、予測対象番組の視聴量を予測するように構成される。
【0007】
この予測システムによれば、予測対象番組の視聴量の予測に用いられる入力情報には、予測対象番組の視聴量に影響を及ぼし得る隣接番組の放送予定日時と過去隣接番組の放送日時及び視聴量とが含まれる。このため、予測対象番組の視聴量の予測精度を向上させることができる。
【0008】
本開示の一態様では、第1情報は、予測対象番組の放送予定日時として、予定される予測対象番組の放送開始日時を特定可能な情報を含んでもよい。第2情報は、複数の同時間帯番組の放送日時として、複数の同時間帯番組の放送開始日時を特定可能な情報を含んでもよい。複数の同時間帯番組は、予測対象番組と同じ曜日かつ同じ放送局において過去に放送された番組であって、過去の複数の週のそれぞれにおいて、予測対象番組の放送開始日時に最も近い放送開始日時を有する番組であってもよい。
【0009】
このような構成によれば、同時間帯番組の放送開始日時が予測対象番組の放送開始日時と完全一致しない場合でも、予測対象番組の放送開始日時に最も近い同時間帯番組の放送開始日時を、入力情報に含めることが可能である。このため、予測対象番組の視聴量の予測精度を向上させることができる。
【0010】
本開示の一態様は、第1特徴量と、複数の第2特徴量と、を生成するように構成される生成部を更に備えてもよい。第1特徴量は、予測対象番組の特徴量である。第2特徴量は、複数の同時間帯番組のそれぞれの特徴量である。
【0011】
第1特徴量は、予測対象番組及び少なくとも1つの隣接番組のそれぞれにおける、放送予定日時、放送する放送局の識別情報、及びタイトルに基づいて生成されてもよい。
複数の第2特徴量は、複数の同時間帯番組及び複数の過去隣接番組のそれぞれにおける、放送日時、放送した放送局の識別情報、及びタイトルに基づいて生成されてもよい。
【0012】
予測部は、入力情報として、第1特徴量と複数の第2特徴量とを含む情報を深層学習モデルに入力するように構成されてもよい。
このような構成によれば、予測対象番組に関連する番組の放送日時、放送局、及びタイトルを入力情報に含めることが可能であり、予測対象番組と似ている番組が視聴量の予測に与える影響を相対的に大きくすることができる。このため、予測対象番組の視聴量の予測精度を向上させることができる。
【0013】
本開示の一態様では、深層学習モデルは、入力情報に含まれる時系列情報を用いて予測値を算出するように構成されてもよい。
本開示の一態様では、生成部は、複数の同時間帯番組の放送順を表す情報を時系列情報として含むように、複数の第2特徴量を生成するように構成されてもよい。
【0014】
このような構成によれば、入力情報に時系列情報を含めることができる。このため、予測対象番組の視聴量の予測精度を向上させることができる。
本開示の一態様では、コンピュータによって実行される予測方法が提供されてもよい。予測方法は、予測対象番組の放送予定日時を含む第1情報と、予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、を取得することと、第1情報から特定される予測対象番組の放送予定日時と、第2情報から特定される複数の同時間帯番組の放送日時及び視聴量と、第3情報から特定される少なくとも1つの隣接番組の放送予定日時と、第4情報から特定される複数の過去隣接番組の放送日時及び視聴量と、を含む入力情報を深層学習モデルに入力し、深層学習モデルの出力として、予測対象番組の視聴量の予測値を得ることにより、予測対象番組の視聴量を予測することと、を含む。
【0015】
この予測方法によれば、上述した予測システムと同様の効果を奏する。
本開示の一態様では、上述した予測方法を少なくとも部分的に、コンピュータにより実行させるためのコンピュータプログラムが提供されてもよい。
【図面の簡単な説明】
【0016】
【
図1】予測システムの構成を示すブロック図である。
【
図3】学習処理において、学習対象番組に関連付けられる過去の同時間帯番組を説明する図である。
【
図4】学習処理において、学習対象番組に関連付けられる隣接番組を説明する図である。
【
図5】学習処理において、同時間帯番組に関連付けられる過去隣接番組を説明する図である。
【
図6】学習用第1特徴量生成処理を表すフローチャートである。
【
図7】学習用第1特徴量生成処理を説明する図である。
【
図8】学習用第2特徴量生成処理を表すフローチャートである。
【
図9】学習用第2特徴量生成処理を説明する図である。
【
図10】深層学習モデルを生成する処理を説明する図である。
【
図12】予測処理において、予測対象番組に関連付けられる過去の同時間帯番組を説明する図である。
【
図13】予測処理において、予測対象番組に関連付けられる隣接番組を説明する図である。
【
図14】予測処理において、同時間帯番組に関連付けられる過去隣接番組を説明する図である。
【
図15】予測用第1特徴量生成処理を表すフローチャートである。
【
図16】予測用第1特徴量生成処理を説明する図である。
【
図17】予測用第2特徴量生成処理を表すフローチャートである。
【
図18】予測用第2特徴量生成処理を説明する図である。
【
図19】予測対象番組の視聴量を予測する処理を説明する図である。
【発明を実施するための形態】
【0017】
以下、本開示の例示的な実施形態について図面を参照しながら説明する。
[1.第1実施形態]
[1-1.構成]
[1-1-1.全体構成]
図1に示す予測システム100は、テレビやインターネット等の放送媒体で放送される番組の視聴量を予測するシステムである。予測システム100は、パーソナルコンピュータ等の情報端末に搭載される。
【0018】
予測システム100は、予測装置1と、データベース2と、人工知能3と、を備える。
予測装置1は、プロセッサ10と、メモリ20と、ストレージ30と、ユーザインタフェース40と、通信インタフェース50と、を備える。
【0019】
プロセッサ10は、ストレージ30に記録されたコンピュータプログラムに従う処理を実行するように構成される。
メモリ20は、プロセッサ10による処理実行時に作業領域として使用される。メモリ20の一例として、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等がある。
【0020】
ストレージ30は、コンピュータプログラムと、コンピュータプログラムに従う処理の実行時に使用されるデータと、を保持する。ストレージ30の一例として、HDD(Hard Disk Drive)、SSD(Solid State Drive)等がある。
【0021】
ユーザインタフェース40は、ユーザからの各種の入力操作を受け付けるためのインタフェースと、ユーザに対して各種情報を出力するためのインタフェースとの総称である。ユーザインタフェース40の一例として、キーボード、マウス、タッチパネル、ディスプレイ等がある。
【0022】
通信インタフェース50は、所定の規格に従って各種データを通信可能なインタフェースである。予測装置1は、ユーザインタフェース40を通じてデータベース2及び人工知能3と通信可能に構成される。
【0023】
データベース2は、過去に放送された番組(以下、過去番組という。)の番組情報と、未来に放送される予定の番組(以下、放送予定番組という。)の番組情報と、を有する。
番組情報は、当該番組の放送開始日時、放送終了日時、タイトル、放送分数、及び当該番組を放送する放送局を表す情報を含む。過去番組の番組情報は、当該番組の視聴量を表す情報を更に含む。
【0024】
本実施形態では、視聴量は、視聴率又は視聴率に関連するパラメータを表す。視聴量は、例えば、世帯別の延べ視聴率を表すGRP(Gross Rating Point)であってもよく、個人別の延べ視聴率を表すTRP(Target Rating Point)であってもよい。
【0025】
人工知能3は、入力情報として、過去番組の番組情報を含む情報が入力されると、入力情報を学習することによって深層学習モデル31を生成するように構成される。
深層学習モデル31は、入力情報として、予測対象番組の放送予定日時と、過去に放送された複数の番組の放送日時及び視聴量と、を含む情報が入力されると、予測対象番組の視聴量の予測値を算出して出力するように構成される。
【0026】
放送予定日時は、放送予定番組の放送日時である。
放送日時は、番組情報によって特定される当該番組が放送される日にち及び時間帯を表す情報である。放送日時は、当該番組が放送される曜日に関する情報を含んでもよく、含まなくてもよい。放送日時は、例えば、番組情報に含まれる当該番組の放送開始日時と放送終了日時とによって説明されてもよく、当該番組の放送開始日時と放送分数とによって説明されてもよい。
【0027】
人工知能3は、時系列情報を更に用いて、深層学習モデル31を生成するように構成され得る。深層学習モデル31は、時系列情報を更に用いて、視聴量の予測値を算出するように構成され得る。
【0028】
時系列情報は、例えば、番組の放送日時に基づく情報である。時系列情報を用いた処理を行う人工知能3及び深層学習モデル31の一例として、Transformer、LSTM(Long Short Term Memory)、RNN(Recurrent Neural Network)等がある。Transformerは、Self-Attention層を含み、Self-Attention層を通じて、時系列情報を含む要素間の関連性を評価する。要素間の関連性の評価によって、Transformerを用いた深層学習モデル31は、過去番組を考慮した高精度な視聴量の予測が可能である。
【0029】
[1-1-2.機能的な構成]
図1に示すように、プロセッサ10は、コンピュータプログラムを実行することによって、取得部11と、生成部12と、予測部13として機能する。
取得部11は、過去番組の番組情報と、放送予定番組の番組情報と、を取得するように構成される。
生成部12は、番組情報に基づいて、番組の特徴量を生成するように構成される。
予測部13は、番組情報を深層学習モデル31に入力し、深層学習モデル31の出力として予測対象番組の視聴量の予測値を得ることにより、予測対象番組の視聴量を予測するように構成される。
取得部11、生成部12、及び予測部13の具体的な処理は後述する。
[1-2.処理]
予測システム100において、予測装置1は、データベース2及び人工知能3のそれぞれと相互に通信することによって、
図2に示す学習処理と、
図11に示す予測処理と、を実行するように構成される。
【0030】
学習処理は、過去の所定期間(例えば過去5年間)における複数の過去番組のそれぞれを学習対象番組に設定し、それぞれの学習対象番組の番組情報と、当該学習対象番組に関連付けられた他の過去番組の番組情報とに基づいて、学習対象番組の視聴量の予測値を算出するための深層学習モデル31を生成する処理である。学習処理は、人工知能3に対し、学習対象番組の視聴量を教師データとした教師あり学習を行うことによって深層学習モデル31を生成する。
【0031】
予測処理は、未来の所定期間における少なくとも1つの放送予定番組のそれぞれを予測対象番組に設定し、学習処理により生成した深層学習モデル31を用いて、予測対象番組の視聴量の予測値を算出することにより、予測対象番組の視聴量を予測するための処理である。
【0032】
以下、学習処理及び予測処理のそれぞれにおいて、予測装置1のプロセッサ10が実行する処理を説明する。
[1-2-1.学習処理]
プロセッサ10が実行する学習処理について、
図2のフローチャート及び
図3から
図10を用いて説明する。以下では、1つの学習対象番組についての学習を行う処理を説明する。
【0033】
プロセッサ10は、ユーザインタフェース40を通じてユーザからの所定の指示が入力されると、
図2に示す学習処理を開始する。
まず、S10で、プロセッサ10は、通信インタフェース50を通じて、データベース2から複数の過去番組の番組情報を取得する。例えば、プロセッサ10は、100週間分の過去番組の番組情報を取得する。S10の処理は、取得部11としての処理に相当する。
【0034】
続いて、S11で、プロセッサ10は、複数の過去番組から学習対象番組を1つ選択し、学習対象番組に対応する過去の同時間帯番組を学習対象番組と関連付ける(
図3参照)。学習処理における同時間帯番組は、学習対象番組と同じ曜日かつ同じ時間帯かつ同じ放送局において放送された過去番組である。S11で、プロセッサ10は、1つの学習対象番組に対し複数の同時間帯番組を関連付ける。
【0035】
以下、学習処理において、学習対象番組の番組情報を学習用第1情報41という。複数の同時間帯番組の番組情報を学習用第2情報42という。S11では、学習用第1情報41と学習用第2情報42とが関連付けられる。
【0036】
ここで、学習対象番組と同じ時間帯に放送された番組とは、各日において、学習対象番組の放送開始時刻に最も近い放送開始時刻を有する番組をいう。
ある週における、学習対象番組と同じ曜日かつ同じ放送局において放送された過去番組において、放送開始日時が学習対象番組と一致する番組が存在しない場合、学習対象番組の放送開始時刻に最も近い放送開始時刻を有する番組が、当該週における同時間帯番組として関連付けられる。学習対象番組の放送開始時刻に最も近い放送開始時刻を有する番組が複数存在する場合、いずれか1つの番組が当該週における同時間帯番組として関連付けられる。
【0037】
例えば、学習対象番組の放送開始日時が「2023/9/3 19:58」であり、学習対象番組の1週前に学習対象番組と同じ曜日かつ同じ放送局において放送された2つの過去番組の放送開始時刻がそれぞれ「2023/8/27 18:58」及び「2023/8/27 20:58」である場合、いずれか一方の過去番組が同時間帯番組として関連付けられる。このとき、どちらの番組が同時間帯番組として関連付けられてもよい。
【0038】
図3には、学習用第1情報41の一例として、学習対象番組の放送開始日時「2023/9/3 19:58」と、学習対象番組の放送終了日時「2023/9/3 20:54」と、学習対象番組の放送局「ZZテレビ」と、学習対象番組のタイトル「AAニュース」と、学習対象番組のターゲット視聴率と、が記載されている。ターゲット視聴率は、マーケティングの分野で一般的に用いられる性別及び年齢別の区分であるC(Child)層、T(Teen)層、M(Male)1-M3層、F(Female)1-F3層ごとの視聴率である。
図3には、一例として、学習対象番組に対応するC層の視聴率「3.2」及びT層の視聴率「5.5」が記載されている。
【0039】
さらに、
図3には、学習用第2情報42の一例として、学習用第1情報41と同様に、過去の複数の週のそれぞれにおける、同時間帯番組の放送開始日時と、同時間帯番組の放送終了日時と、同時間帯番組の放送局と、同時間帯番組のタイトルと、同時間帯番組のターゲット視聴率と、が示されている。換言すれば、学習用第2情報42は、学習対象番組の放送日時から過去N週(Nは2以上の整数)分の同時間帯番組の番組情報を含む。
【0040】
続いて、S12で、プロセッサ10は、学習対象番組の放送日時に隣接する時間帯に放送された少なくとも1つの隣接番組を学習対象番組と関連付ける(
図4参照)。学習対象番組の放送日時に隣接する時間帯は、学習対象番組の放送日時の前の時間帯及び後の時間帯の少なくとも一方を含む。
隣接番組の放送日時は、学習対象番組の放送日時に隣接する時間帯の中に含まれていればよいため、隣接番組の放送開始日時及び放送終了日時は、学習対象番組の放送日時に必ずしも隣接していなくてもよい。すなわち、隣接番組の放送開始日時は、学習対象番組の放送終了日時に隣接していてもよく、隣接していなくてもよい。隣接番組の放送終了日時は、学習対象番組の放送開始日時に隣接していてもよく、隣接していなくてもよい。
例えば、
図4において、学習対象番組の放送終了日時「2023/9/3 20:54」に対し、学習対象番組の放送日時に隣接する時間帯は、「2023/9/3 20:54」から「2023/9/3 22:00」までであってもよい。このとき、隣接番組は、「2023/9/3 20:54」から「2023/9/3 22:00」までに放送される番組であり得る。すなわち、
図4において、タイトルが「音楽EE」、「ドラマFF」、又は「GG天気」である番組は、いずれも隣接番組として学習対象番組と関連付けされ得る。例えば、プロセッサ10は、タイトルが「ドラマFF」である番組を隣接番組として学習対象番組と関連付け、一方で、タイトルが「音楽EE」又は「GG天気」である番組を隣接番組としなくてもよい。
【0041】
以下、少なくとも1つの隣接番組の番組情報を学習用第3情報43という。S12では、学習用第1情報41と学習用第3情報43とが関連付けられる。
図4には、学習用第3情報43の一例として、学習対象番組の前に放送されていた1つの番組及び学習対象番組の後に放送されていた3つの番組のそれぞれの番組情報が記載されている。
図4には、隣接番組は合計4つ記載されているが、隣接番組は4つに限定されない。例えば、隣接番組は、学習対象番組の前に放送されていた2つ以上の番組であってもよく、学習対象番組の後に放送されていた2つ以下又は4つ以上の番組であってもよい。
【0042】
学習対象番組と関連付けられる隣接番組は、学習対象番組の前に放送されていた番組のみであってもよく、学習対象番組の後に放送されていた番組のみであってもよい。
続いて、S13で、プロセッサ10は、同時間帯番組の放送日時に隣接する時間帯に放送された複数の番組である複数の過去隣接番組を同時間帯番組と関連付ける(
図5参照)。同時間帯番組の放送日時に隣接する時間帯は、同時間帯番組の放送日時の前の時間帯及び後の時間帯の少なくとも一方を含む。
過去隣接番組の放送日時は、同時間帯番組の放送日時に隣接する時間帯の中に含まれていればよいため、過去隣接番組の放送開始日時及び放送終了日時は、同時間帯番組の放送日時に必ずしも隣接していなくてもよい。すなわち、過去隣接番組の放送開始日時は、同時間帯番組の放送終了日時に隣接していてもよく、隣接していなくてもよい。過去隣接番組の放送終了日時は、同時間帯番組の放送開始日時に隣接していてもよく、隣接していなくてもよい。
例えば、
図5において、同時間帯番組の放送終了日時「2023/8/27 21:00」に対し、同時間帯番組の放送日時に隣接する時間帯は、「2023/8/27 21:00」から「2023/8/27 22:30」までであってもよい。このとき、過去隣接番組は、「2023/8/27 21:00」から「2023/8/27 22:30」までに放送される番組であり得る。すなわち、
図5において、タイトルが「ドラマII」、「JJ天気」、又は「スポーツKK」である番組は、いずれも過去隣接番組として同時間帯番組と関連付けされ得る。例えば、プロセッサ10は、タイトルが「スポーツKK」である番組を過去隣接番組として同時間帯番組と関連付け、一方で、タイトルが「ドラマII」又は「JJ天気」である番組を過去隣接番組としなくてもよい。
【0043】
以下、過去隣接番組の番組情報を学習用第4情報44という。S13では、学習用第2情報42と学習用第4情報44とが関連付けられる。
図5には、学習用第4情報44の一例として、同時間帯番組の前に放送されていた1つの番組及び同時間帯番組の後に放送されていた3つの番組のそれぞれの番組情報が記載されている。
図5には、過去隣接番組は合計4つ記載されているが、過去隣接番組は4つに限定されない。例えば、過去隣接番組は、同時間帯番組の前に放送されていた2つ以上の番組であってもよく、同時間帯番組の後に放送されていた2つ以下又は4つ以上の番組であってもよい。
【0044】
同時間帯番組に関連付けられる過去隣接番組は、同時間帯番組の前に放送されていた番組のみであってもよく、同時間帯番組の後に放送されていた番組のみであってもよい。
[1-2-1-1.学習用第1特徴量生成処理]
続いて、S14で、プロセッサ10は、学習用第1特徴量生成処理を実行する。学習用第1特徴量生成処理は、学習対象番組の特徴量を表す学習用第1特徴量ベクトル51を生成する処理である。プロセッサ10が実行する学習用第1特徴量生成処理について、
図6のフローチャート及び
図7を用いて説明する。
【0045】
まず、S140で、プロセッサ10は、学習用第1情報41及び学習用第3情報43に対して要素分解を行う。要素分解は、番組情報における放送開始日時、放送終了日時、及び放送局の情報を、所定の要素に分解する処理である。
【0046】
本実施形態では、
図7に示すように、要素分解は、番組ごとに、「年」、「月」、「日」、「曜日」、「開始時」、「開始分」、「放送分数」、及び「放送局」の要素に分解する。「年」、「月」、「日」、「曜日」、「開始時」、及び「開始分」は、それぞれ番組の放送開始日時に対応する値である。「放送分数」は、放送終了日時から放送開始日時を減算した値である。「放送局」は、番組情報によって表される放送局である。
【0047】
続いて、S141で、プロセッサ10は、学習用第1情報41に対して正規化(Normalization)及び埋め込み(Embedding)を行う。埋め込みは、自然言語処理や機械学習分野等における、単語や文等のテキストデータを人工知能3が扱いやすい数値ベクトルに変換する処理である。
【0048】
本実施形態では、プロセッサ10は、まず、放送開始日時、放送終了時刻、放送局、及びタイトルをテキスト形式で連結する。例えば、プロセッサ10は、
図7における学習用第1情報41の放送開始日時、放送終了時刻、放送局、及びタイトルを連結して、「2023/9/3 19:58-20:54 ZZテレビ AAニュース」というテキストデータを生成する。
【0049】
このとき、プロセッサ10は、テキストデータに対し正規化を行う。正規化は、異なる形式のテキストデータを同じ形式に変換する処理である。正規化は、人工知能3がテキストデータを扱いやすくするための処理である。正規化の一例として、全角文字と半角文字とをいずれか一方に統一すること、括弧の種類を統一すること等がある。
【0050】
その後、プロセッサ10は、生成されたテキストデータを、人工知能3を用いて数値ベクトルに変換する。テキストデータを数値ベクトルに変換する処理は、人工知能3に既存の自然言語処理モデルを適用することにより、実現される。既存の自然言語処理モデルの一例として、BERT(Bidirectional Encoder Representations from Transformers)がある。
【0051】
2つのテキストデータに含まれる番組情報が互いに類似する場合、当該2つのテキストデータは、互いに類似する2つの数値ベクトルに変換される。互いに類似する2つの数値ベクトルは、互いに類似しない2つの数値ベクトルよりも、2つのベクトルの内積が大きいことを意味する。
【0052】
続いて、S142で、プロセッサ10は、学習用第1情報41及び学習用第3情報43のそれぞれにおける視聴量を欠損値に変換する。欠損値は、実際の視聴量として存在し得ない値である。
図7では、一例として、学習対象番組に対応するC層の視聴率「3.2」及びT層の視聴率「5.5」が、欠損値「XXX」に変換されている。
【0053】
続いて、S143で、プロセッサ10は、学習対象番組の特徴量である学習用第1特徴量ベクトル51を生成する。学習用第1特徴量ベクトル51は、S140で要素分解された番組情報の各要素と、S141で得られた数値ベクトルと、S142で得られた欠損値と、に基づいて生成される。すなわち、学習用第1特徴量ベクトル51は、S140で要素分解された番組情報の各要素、S141で得られた数値ベクトル、及びS142で得られた欠損値のそれぞれを成分とするベクトルである。
【0054】
その後、プロセッサ10は、
図6の学習用第1特徴量生成処理を終了する。
このようにして、プロセッサ10は、学習用第1情報41と学習用第3情報43とに基づいて、学習用第1特徴量ベクトル51を生成する。
【0055】
[1-2-1-2.学習用第2特徴量生成処理]
続いて、S15で、プロセッサ10は、学習用第2特徴量生成処理を実行する。学習用第2特徴量生成処理は、同時間帯番組の特徴量を表す学習用第2特徴量ベクトル52を生成する処理である。
【0056】
学習用第2特徴量ベクトル52は、学習対象番組の放送日時から過去N週(Nは2以上の整数)分の同時間帯番組のそれぞれに対して生成される。換言すれば、学習用第2特徴量ベクトル52は、学習対象番組の放送日時の1週前からN週前までの同時間帯番組のそれぞれに対して、合計N個生成される。学習用第2特徴量ベクトル52は、これらの過去N週分の同時間帯番組の放送順を表す情報を時系列情報として含むように生成される。
【0057】
時系列情報は、例えば、番組の放送開始日時に基づいて、それぞれの学習用第2特徴量ベクトル52に付与される番号である。付与される番号は、N個の学習用第2特徴量ベクトル52を配列で定義するときの配列番号であると理解されてもよい。一例として、学習対象番組の1週前の同時間帯番組の学習用第2特徴量ベクトル52には、時系列情報として番号「1」が付与され、学習対象番組の2週前の同時間帯番組の学習用第2特徴量ベクトル52には、時系列情報として番号「2」が付与される。この例では、番号が小さいほど、相対的に後の放送開始日時を有する(すなわち、現在に近い)ことを表す。
【0058】
プロセッサ10が実行する学習用第2特徴量生成処理について、
図8のフローチャート及び
図9を用いて説明する。
以下、1以上N以下の整数である変数iを用いて、学習対象番組の放送日時のi週前に放送された同時間帯番組を、i週前の同時間帯番組という。プロセッサ10は、学習用第2特徴量生成処理を開始するとき、初期値として変数iに値1を設定する。
【0059】
以下の学習用第2特徴量生成処理の説明において、学習用第2情報42及び学習用第4情報44は、i週前の同時間帯番組に対応する学習用第2情報42及び学習用第4情報44を意味する。
【0060】
まず、S150で、プロセッサ10は、学習用第2情報42及び学習用第4情報44に対して要素分解を行う。要素分解は、S140と同様の処理である。学習用第2情報42及び学習用第4情報44の要素分解により、同時間帯番組及び過去隣接番組の番組情報の各要素が得られる。
【0061】
続いて、S151で、プロセッサ10は、学習用第2情報42に対して正規化及び埋め込みを行う。正規化及び埋め込みは、S141と同様の処理である。学習用第2情報42に対する正規化及び埋め込みにより、学習用第2情報42に対応する数値ベクトルが得られる。
【0062】
続いて、S152で、プロセッサ10は、学習用第2情報42及び学習用第4情報44のそれぞれにおける視聴量を取得する。
続いて、S153で、プロセッサ10は、i週前の同時間帯番組の特徴量であるi週前の学習用第2特徴量ベクトル52を生成する。学習用第2特徴量ベクトル52は、S150で要素分解された番組情報の各要素と、S151で得られた数値ベクトルと、S152で得られた視聴量と、に基づいて生成される。すなわち、学習用第2特徴量ベクトル52は、S150で要素分解された番組情報の各要素、S151で得られた数値ベクトル、及びS152で得られた視聴量のそれぞれを成分とするベクトルである。
【0063】
続いて、S154で、プロセッサ10は、変数iの値を1増加させる。
続いて、S155で、プロセッサ10は、変数iが値N以下であるか否かを判定する。プロセッサ10は、変数iが値N以下であると判定した場合(S155:YES)、S150に戻る。
【0064】
一方、プロセッサ10は、変数iが値Nより大きいと判定した場合(S155:NO)、
図8の学習用第2特徴量生成処理を終了する。
このようにして、プロセッサ10は、過去N週分の同時間帯番組に対応する学習用第2情報42と学習用第4情報44とに基づき、1週前からN週前までについて、週ごとに、合計N個の学習用第2特徴量ベクトル52を生成する。
【0065】
[1-2-1-3.深層学習モデルを生成]
続いて、S16で、プロセッサ10は、学習用第1特徴量ベクトル51と複数の学習用第2特徴量ベクトル52とを含む入力情報に基づいて、教師あり学習によって人工知能3を学習させることにより、深層学習モデル31を生成する。
【0066】
S16では、後述の予測処理において、予測対象の番組の放送予定日時が予測時点を基準に何週間先であるかに応じて、用いられる学習用第2特徴量ベクトル52が異なる。具体的には、放送予定日時がM週間先である番組が予測対象である場合、プロセッサ10は、学習対象番組を基準にM週前からN週前までの同時間帯番組の学習用第2特徴量ベクトル52を用いる。Mは1以上N以下の整数である。本実施形態では、主にM=1として説明する。
【0067】
まず、プロセッサ10は、S14,S15で生成された学習用第1特徴量ベクトル51及び複数の学習用第2特徴量ベクトル52を時系列順に並べる。すなわち、プロセッサ10は、学習用第2特徴量ベクトル52に含まれる時系列情報を用いて、学習用第1特徴量ベクトル51、M週前の同時間帯番組の学習用第2特徴量ベクトル52、(M+1)週前の同時間帯番組の学習用第2特徴量ベクトル52、…、N週前の同時間帯番組の学習用第2特徴量ベクトル52の順に並べる。
【0068】
続いて、
図10に示すように、プロセッサ10は、学習用第1特徴量ベクトル51及び複数の学習用第2特徴量ベクトル52を、時系列順に人工知能3に入力する。
人工知能3は、入力された学習用第1特徴量ベクトル51及び複数の学習用第2特徴量ベクトル52に基づいて、欠損値に変換されている学習対象番組の視聴量を予測するように構成される。人工知能3は、予測した結果である予測値と教師データとの誤差を計算することにより、誤差が最小となるようなパラメータを算出し、深層学習モデル31を生成するように構成される。
【0069】
教師データとして、S142で欠損値に変換する前の、学習用第1情報41における学習対象番組の視聴量が用いられる。換言すれば、S142で欠損値に変換する前の、学習用第1情報41における学習対象番組の視聴量は、学習対象番組の特徴量として利用しない。
【0070】
誤差として、例えば、平均絶対誤差(Mean Absolute Error、MAE)が用いられる。平均絶対誤差は、複数の予測値のそれぞれと教師データにおける真値との差の絶対値を計算し、複数の予測値のそれぞれに対応する絶対値の総和をデータ数で割った値である。予測値が真値に近いほど、平均絶対誤差は小さい。
【0071】
誤差の計算方法の一例として、バッチ学習、ミニバッチ学習、オンライン学習等がある。
その後、プロセッサ10は、
図2の学習処理を終了する。
このようにして、プロセッサ10は、学習用第1情報41と、学習用第2情報42と、学習用第3情報43と、学習用第4情報44と、に基づいて、深層学習モデル31を生成する学習処理を実行するように構成される。
【0072】
[1-2-2.予測処理]
プロセッサ10が実行する予測処理について、
図11のフローチャート及び
図12から
図19を用いて説明する。以下では、1つの放送予定番組を予測対象番組に設定し、予測対象番組の視聴量の予測を行う処理を説明する。
【0073】
予測処理の各ステップは、学習処理の各ステップと概ね同等である。具体的には、
図11に示すS20、S21、S22、S23、S24、S25、及びS26の処理は、
図2に示すS10、S11、S12、S13、S14、S15、及びS16の処理と概ね同等である。
【0074】
プロセッサ10は、ユーザインタフェース40を通じてユーザからの所定の指示が入力されると、
図11に示す予測処理を開始する。
まず、S20で、プロセッサ10は、通信インタフェース50を通じて、データベース2から複数の放送予定番組の番組情報と複数の過去番組の番組情報とを取得する。例えば、プロセッサ10は、現在から1週先までの放送予定番組の番組情報と、現在から過去100週間分の過去番組の番組情報とを取得する。S20の処理は、取得部11としての処理に相当する。
【0075】
放送予定番組の番組情報における視聴量は、未知の値であって、予測対象の視聴量であり得るため、当該視聴量には所定の欠損値が入力されている。
続いて、S21で、プロセッサ10は、予測対象番組として複数の放送予定番組から1つの番組を選択し、予測対象番組に対応する過去の同時間帯番組を予測対象番組と関連付ける(
図12参照)。予測処理における同時間帯番組は、予測対象番組と同じ曜日かつ同じ時間帯かつ同じ放送局において放送された過去番組である。S21で、プロセッサ10は、1つの予測対象番組に対し複数の同時間帯番組を関連付ける。
【0076】
以下、予測処理において、予測対象番組の番組情報を予測用第1情報61という。複数の同時間帯番組の番組情報を予測用第2情報62という。S21では、予測用第1情報61と予測用第2情報62とが関連付けられる。
【0077】
ここで、予測対象番組と同じ時間帯に放送された番組とは、各日において、予測対象番組の放送開始時刻に最も近い放送開始時刻を有する番組をいう。
ある週における、予測対象番組と同じ曜日かつ同じ放送局において放送される予定の放送予定番組において、放送開始日時が予測対象番組と一致する番組が存在しない場合、予測対象番組の放送開始時刻に最も近い放送開始時刻を有する番組が、当該週における同時間帯番組として関連付けられる。予測対象番組の放送開始時刻に最も近い放送開始時刻を有する番組が複数存在する場合、いずれか1つの番組が当該週における同時間帯番組として関連付けられる。
【0078】
例えば、予測対象番組の放送開始日時が「2023/10/22 19:58」であり、予測対象番組の1週前に予測対象番組と同じ曜日かつ同じ放送局において放送された2つの過去番組の放送開始時刻がそれぞれ「2023/10/15 18:58」及び「2023/10/15 20:58」である場合、いずれか一方の過去番組が同時間帯番組として関連付けられる。このとき、どちらの番組が同時間帯番組として関連付けられてもよい。
【0079】
図12には、予測用第1情報61の一例として、予測対象番組の放送開始日時「2023/10/22 19:58」と、予測対象番組の放送終了日時「2023/10/22 20:54」と、予測対象番組の放送局「ZZテレビ」と、予測対象番組のタイトル「ドラマLL」と、予測対象番組のターゲット視聴率と、が記載されている。ターゲット視聴率は、上述したC層、T層、M1-M3層、F1-F3層ごとの視聴率である。予測対象番組のターゲット視聴率には、欠損値「XXX」が記載されている。
【0080】
さらに、
図12には、予測用第2情報62の一例として、予測用第1情報61と同様に、過去の複数の週のそれぞれにおける、同時間帯番組の放送開始日時と、同時間帯番組の放送終了日時と、同時間帯番組の放送局と、同時間帯番組のタイトルと、同時間帯番組のターゲット視聴率と、が示されている。換言すれば、予測用第2情報62は、予測対象番組の放送日時から過去N週(Nは2以上の整数)分の同時間帯番組の番組情報を含む。
【0081】
続いて、S22で、プロセッサ10は、予測対象番組の放送日時に隣接する時間帯に放送された少なくとも1つの隣接番組を予測対象番組と関連付ける(
図13参照)。予測対象番組の放送日時に隣接する時間帯は、予測対象番組の放送日時の前の時間帯及び後の時間帯の少なくとも一方を含む。
隣接番組の放送日時は、予測対象番組の放送日時に隣接する時間帯の中に含まれていればよいため、隣接番組の放送開始日時及び放送終了日時は、予測対象番組の放送日時に必ずしも隣接していなくてもよい。すなわち、隣接番組の放送開始日時は、予測対象番組の放送終了日時に隣接していてもよく、隣接していなくてもよい。隣接番組の放送終了日時は、予測対象番組の放送開始日時に隣接していてもよく、隣接していなくてもよい。
例えば、
図13において、予測対象番組の放送終了日時「2023/10/22 20:54」に対し、予測対象番組の放送日時に隣接する時間帯は、「2023/10/22 20:54」から「2023/10/22 22:00」までであってもよい。このとき、隣接番組は、「2023/10/22 20:54」から「2023/10/22 22:00」までに放送される番組であり得る。すなわち、
図13において、タイトルが「音楽QQ」、「ドラマRR」、又は「SS天気」である番組は、いずれも隣接番組として予測対象番組と関連付けされ得る。例えば、プロセッサ10は、タイトルが「ドラマRR」である番組を隣接番組として予測対象番組と関連付け、一方で、タイトルが「音楽QQ」又は「SS天気」である番組を隣接番組としなくてもよい。
【0082】
以下、少なくとも1つの隣接番組の番組情報を予測用第3情報63という。S22では、予測用第1情報61と予測用第3情報63とが関連付けられる。
図13には、予測用第3情報63の一例として、予測対象番組の前に放送される1つの番組及び予測対象番組の後に放送される3つの番組のそれぞれの番組情報が記載されている。
図13には、隣接番組は合計4つ記載されているが、隣接番組は4つに限定されない。例えば、隣接番組は、予測対象番組の前に放送される2つ以上の番組であってもよく、予測対象番組の後に放送される2つ以下又は4つ以上の番組であってもよい。
【0083】
予測対象番組と関連付けられる隣接番組は、予測対象番組の前に放送される番組のみであってもよく、予測対象番組の後に放送される番組のみであってもよい。
続いて、S23で、プロセッサ10は、同時間帯番組の放送日時に隣接する時間帯に放送された複数の番組である複数の過去隣接番組を同時間帯番組と関連付ける(
図14参照)。同時間帯番組の放送日時に隣接する時間帯は、同時間帯番組の放送日時の前の時間帯及び後の時間帯の少なくとも一方を含む。
過去隣接番組の放送日時は、同時間帯番組の放送日時に隣接する時間帯の中に含まれていればよいため、過去隣接番組の放送開始日時及び放送終了日時は、同時間帯番組の放送日時に必ずしも隣接していなくてもよい。すなわち、過去隣接番組の放送開始日時は、同時間帯番組の放送終了日時に隣接していてもよく、隣接していなくてもよい。過去隣接番組の放送終了日時は、同時間帯番組の放送開始日時に隣接していてもよく、隣接していなくてもよい。
例えば、
図14において、同時間帯番組の放送終了日時「2023/10/15 21:54」に対し、同時間帯番組の放送日時に隣接する時間帯は、「2023/10/15 21:54」から「2023/10/15 23:25」までであってもよい。このとき、過去隣接番組は、「2023/10/15 21:54」から「2023/10/15 23:25」までに放送される番組であり得る。すなわち、
図14において、タイトルが「音楽UU」、「情報VV」、又は「バラエティWW」である番組は、いずれも過去隣接番組として同時間帯番組と関連付けされ得る。例えば、プロセッサ10は、タイトルが「音楽UU」又は「バラエティWW」である番組を過去隣接番組として同時間帯番組と関連付け、一方で、タイトルが「情報VV」である番組を過去隣接番組としなくてもよい。
【0084】
以下、過去隣接番組の番組情報を予測用第4情報64という。S23では、予測用第2情報62と予測用第4情報64とが関連付けられる。
図14には、予測用第4情報64の一例として、同時間帯番組の前に放送されていた1つの番組及び同時間帯番組の後に放送されていた3つの番組のそれぞれの番組情報が記載されている。
図14には、過去隣接番組は合計4つ記載されているが、過去隣接番組は4つに限定されない。例えば、過去隣接番組は、同時間帯番組の前に放送されていた2つ以上の番組であってもよく、同時間帯番組の後に放送されていた2つ以下又は4つ以上の番組であってもよい。
【0085】
同時間帯番組に関連付けられる過去隣接番組は、同時間帯番組の前に放送されていた番組のみであってもよく、同時間帯番組の後に放送されていた番組のみであってもよい。
[1-2-2-1.予測用第1特徴量生成処理]
続いて、S24で、プロセッサ10は、予測用第1特徴量生成処理を実行する。予測用第1特徴量生成処理は、予測対象番組の特徴量を表す予測用第1特徴量ベクトル71を生成する処理である。S24の処理は、生成部12としての処理に相当する。
【0086】
プロセッサ10が実行する予測用第1特徴量生成処理について、
図15のフローチャート及び
図16を用いて説明する。
まず、S240で、プロセッサ10は、予測用第1情報61及び予測用第3情報63に対して要素分解を行う。要素分解は、S140及びS150と同様の処理である。
本実施形態では、
図16に示すように、要素分解は、番組ごとに、「年」、「月」、「日」、「曜日」、「開始時」、「開始分」、「放送分数」、及び「放送局」の要素に分解する。「年」、「月」、「日」、「曜日」、「開始時」、及び「開始分」は、それぞれ番組の放送開始日時に対応する値である。「放送分数」は、放送終了日時から放送開始日時を減算した値である。「放送局」は、番組情報によって表される放送局である。
【0087】
続いて、S241で、プロセッサ10は、予測用第1情報61に対して正規化及び埋め込みを行う。
本実施形態では、プロセッサ10は、まず、放送開始日時、放送終了時刻、放送局、及びタイトルをテキスト形式で連結する。例えば、プロセッサ10は、
図16における予測用第1情報61の放送開始日時、放送終了時刻、放送局、及びタイトルを連結して、「2023/10/22 19:58-20:54 ZZテレビ ドラマLL」というテキストデータを生成する。
【0088】
このとき、プロセッサ10は、テキストデータに対し正規化を行う。正規化は、S141及びS151と同様の処理である。
その後、プロセッサ10は、生成されたテキストデータに対し、人工知能3を用いて数値ベクトルに変換する埋め込みを行う。埋め込みは、S141及びS151と同様の処理である。
【0089】
続いて、S242で、プロセッサ10は、予測用第1情報61及び予測用第3情報63のそれぞれにおける視聴量(すなわち、欠損値「XXX」)を取得する。
続いて、S243で、プロセッサ10は、予測対象番組の特徴量である予測用第1特徴量ベクトル71を生成する。予測用第1特徴量ベクトル71は、S240で要素分解された番組情報の各要素と、S241で得られた数値ベクトルと、S242で得られた欠損値と、に基づいて生成される。すなわち、予測用第1特徴量ベクトル71は、S240で要素分解された番組情報の各要素、S241で得られた数値ベクトル、及びS242で得られた欠損値のそれぞれを成分とするベクトルである。
【0090】
その後、プロセッサ10は、
図15の予測用第1特徴量生成処理を終了する。
このようにして、プロセッサ10は、予測用第1情報61と予測用第3情報63とに基づいて、予測用第1特徴量ベクトル71を生成する。
【0091】
[1-2-2-2.予測用第2特徴量生成処理]
続いて、S25で、プロセッサ10は、予測用第2特徴量生成処理を実行する。予測用第2特徴量生成処理は、同時間帯番組の特徴量を表す予測用第2特徴量ベクトル72を生成する処理である。S25の処理は、生成部12としての処理に相当する。
【0092】
予測用第2特徴量ベクトル72は、予測対象番組の放送日時から過去N週(Nは2以上の整数)分の同時間帯番組のそれぞれに対して生成される。換言すれば、予測用第2特徴量ベクトル72は、予測対象番組の放送日時の1週前からN週前までの同時間帯番組のそれぞれに対して、合計N個生成される。予測用第2特徴量ベクトル72は、これらの過去N週分の同時間帯番組の放送順を表す情報を時系列情報として含むように生成される。
【0093】
時系列情報は、例えば、番組の放送開始日時に基づいて、それぞれの予測用第2特徴量ベクトル72に付与される番号である。一例として、予測対象番組の1週前の同時間帯番組の予測用第2特徴量ベクトル72には、時系列情報として番号「1」が付与され、予測対象番組の2週前の同時間帯番組の予測用第2特徴量ベクトル72には、時系列情報として番号「2」が付与される。この例では、番号が小さいほど、相対的に後の放送開始日時を有する(すなわち、現在に近い)ことを表す。
【0094】
プロセッサ10が実行する予測用第2特徴量生成処理について、
図17のフローチャート及び
図18を用いて説明する。
以下、1以上N以下の整数である変数iを用いて、予測対象番組の放送日時のi週前に放送された同時間帯番組を、i週前の同時間帯番組という。プロセッサ10は、予測用第2特徴量生成処理を開始するとき、初期値として変数iに値1を設定する。
【0095】
以下の予測用第2特徴量生成処理の説明において、予測用第2情報62及び予測用第4情報64は、i週前の同時間帯番組に対応する予測用第2情報62及び予測用第4情報64を意味する。
【0096】
まず、S250で、プロセッサ10は、予測用第2情報62及び予測用第4情報64に対して要素分解を行う。要素分解は、S140、S150、及びS240と同様の処理である。予測用第2情報62及び予測用第4情報64の要素分解により、同時間帯番組及び過去隣接番組の番組情報の各要素が得られる。
【0097】
続いて、S251で、プロセッサ10は、予測用第2情報62に対して正規化及び埋め込みを行う。正規化及び埋め込みは、S141、S151、及びS241と同様の処理である。予測用第2情報62に対する正規化及び埋め込みにより、予測用第2情報62に対応する数値ベクトルが得られる。
【0098】
続いて、S252で、プロセッサ10は、予測用第2情報62及び予測用第4情報64のそれぞれにおける視聴量を取得する。
続いて、S253で、プロセッサ10は、i週前の同時間帯番組の特徴量である予測用第2特徴量ベクトル72を生成する。予測用第2特徴量ベクトル72は、S250で要素分解された番組情報の各要素と、S251で得られた数値ベクトルと、S252で得られた視聴量と、に基づいて生成される。すなわち、予測用第2特徴量ベクトル72は、S250で要素分解された番組情報の各要素、S251で得られた数値ベクトル、及びS252で得られた視聴量のそれぞれを成分とするベクトルである。
【0099】
続いて、S254で、プロセッサ10は、変数iの値を1増加させる。
続いて、S255で、プロセッサ10は、変数iが値N以下であるか否かを判定する。プロセッサ10は、変数iが値N以下であると判定した場合(S255:YES)、S250に戻る。
【0100】
一方、プロセッサ10は、変数iが値Nより大きいと判定した場合(S255:NO)、
図17の予測用第2特徴量生成処理を終了する。
このようにして、プロセッサ10は、過去N週分の同時間帯番組に対応する予測用第2情報62と予測用第4情報64とに基づき、1週前からN週前までについて、週ごとに、合計N個の予測用第2特徴量ベクトル72を生成する。
【0101】
[1-2-2-3.予測対象番組の視聴量を予測]
続いて、S26で、プロセッサ10は、予測用第1特徴量ベクトル71と予測用第2特徴量ベクトル72とを含む入力情報を深層学習モデル31に入力し、深層学習モデル31の出力として予測対象番組の視聴量の予測値を得ることにより、予測対象番組の視聴量を予測する。S26の処理は、予測部13としての処理に相当する。
【0102】
S26では、予測対象番組の放送予定日時が現在から何週間先であるかに応じて、用いられる予測用第2特徴量ベクトル72が異なる。具体的には、予測対象番組の放送予定日時がM週間先である場合、プロセッサ10は、予測対象番組を基準にM週前からN週前までの同時間帯番組の予測用第2特徴量ベクトル72を用いる(Mは1以上N以下の整数)。本実施形態では、主にM=1として説明する。
【0103】
まず、プロセッサ10は、S24,S25で生成された予測用第1特徴量ベクトル71及び複数の予測用第2特徴量ベクトル72を時系列順に並べる。すなわち、プロセッサ10は、予測用第2特徴量ベクトル72に含まれる時系列情報を用いて、予測用第1特徴量ベクトル71、M週前の同時間帯番組の予測用第2特徴量ベクトル72、(M+1)週前の同時間帯番組の予測用第2特徴量ベクトル72、…、N週前の同時間帯番組の予測用第2特徴量ベクトル72の順に並べる。
【0104】
続いて、
図19に示すように、プロセッサ10は、予測用第1特徴量ベクトル71及び複数の予測用第2特徴量ベクトル72を、時系列順に深層学習モデル31に入力する。
深層学習モデル31は、入力された予測用第1特徴量ベクトル71及び複数の予測用第2特徴量ベクトル72に基づいて、欠損値である予測対象番組の視聴量を予測するように構成される。
【0105】
その後、プロセッサ10は、
図11の予測処理を終了する。
このようにして、プロセッサ10は、予測用第1情報61と、予測用第2情報62と、予測用第3情報63と、予測用第4情報64と、を入力情報として深層学習モデル31に入力し、深層学習モデル31の出力として予測対象番組の視聴量の予測値を得ることにより、予測対象番組の視聴量を予測するように構成される。
【0106】
[1-3.効果]
以上に説明した実施形態によれば、以下の作用及び効果が得られる。
(1a)一般的に、番組の視聴量は、当該番組の放送日時に隣接する時間帯に放送される隣接番組の影響を受けることがある。
【0107】
例えば、視聴量が相対的に高い人気番組について、視聴者は、人気番組の放送が開始される少し前から視聴を開始し、人気番組の放送が終了した後も同じ放送局の視聴を継続する傾向がある。このため、人気番組の前後に放送される番組の視聴量は、人気番組の影響を受けやすい。特に、放送分数が相対的に短い(例えば、5分や10分程度)のミニ番組は、人気番組の影響をより受けやすい。
【0108】
上記実施形態において、学習用第1特徴量ベクトル51は、学習対象番組の番組情報と、学習対象番組に対応する隣接番組の番組情報とに基づいて生成される。学習用第2特徴量ベクトル52は、学習対象番組に対応する同時間帯番組の番組情報と、学習対象番組に対応する過去隣接番組の番組情報とに基づいて生成される。
【0109】
予測用第1特徴量ベクトル71は、予測対象番組の番組情報と、予測対象番組に対応する隣接番組の番組情報とに基づいて生成される。予測用第2特徴量ベクトル72は、予測対象番組に対応する同時間帯番組の番組情報と、予測対象番組に対応する過去隣接番組の番組情報とに基づいて生成される。
【0110】
したがって、学習処理及び予測処理において、隣接番組の番組情報及び過去隣接番組の番組情報を視聴量の予測に用いることによって、番組の視聴量の予測精度を向上させることができる。
【0111】
(1b)ある週において、放送開始日時が学習対象番組又は予測対象番組と一致する番組が存在しない場合、学習対象番組又は予測対象番組の放送開始時刻に最も近い放送開始時刻を有する番組が、当該週における学習対象番組又は予測対象番組の同時間帯番組として関連付けられる。学習対象番組又は予測対象番組の放送開始時刻と最も近い放送開始時刻を有する番組が複数存在する場合、いずれか1つの番組が当該週における同時間帯番組として関連付けられる。
【0112】
このような処理によれば、学習処理及び予測処理において、同時間帯番組の放送開始時刻が学習対象番組又は予測対象番組の放送開始時刻と完全一致しない場合でも、放送開始時刻が学習対象番組又は予測対象番組の放送開始時刻に最も近い同時間帯番組の番組情報を、視聴量の予測に用いることが可能である。このため、番組の視聴量の予測精度を向上させることができる。
【0113】
(1c)学習用第1特徴量ベクトル51、学習用第2特徴量ベクトル52、予測用第1特徴量ベクトル71、及び予測用第2特徴量ベクトル72は、番組情報の放送日時及び放送局に基づいて生成される。深層学習モデル31は、学習用第1特徴量ベクトル51と学習用第2特徴量ベクトル52とに基づいて生成される。深層学習モデル31は、予測用第1特徴量ベクトル71と予測用第2特徴量ベクトル72とに基づいて、予測対象番組の視聴量を予測する。
【0114】
このような処理によれば、学習処理及び予測処理において、番組情報の放送日時及び放送局に基づいて、深層学習モデル31を生成する、又は予測対象番組の視聴量を予測することが可能である。
【0115】
例えば、学習対象番組又は予測対象番組と同じ曜日かつ同じ時間帯かつ同じ放送局において放送された過去番組が視聴量の予測に与える影響を相対的に大きくすることができる。このため、番組の視聴量の予測精度を向上させることができる。
【0116】
(1d)学習用第1特徴量ベクトル51、学習用第2特徴量ベクトル52、予測用第1特徴量ベクトル71、及び予測用第2特徴量ベクトル72は、番組情報のタイトルに基づいて生成される。
【0117】
このような処理によれば、学習処理及び予測処理において、学習対象番組又は予測対象番組とは関連性が低いタイトルを有する番組が視聴量の予測に与える影響を相対的に小さくすることが可能である。
【0118】
加えて、過去番組が、定期的に放送されるレギュラー番組とは異なり、不定期で放送される単発的な番組である特別番組(いわゆる特番)であるか否かを、番組情報のタイトルに基づいて判定することが可能である。一般的に、特別番組の視聴量は、レギュラー番組の視聴量よりも高い傾向がある。このため、過去番組が特別番組であるか否かを考慮することにより、番組の視聴量の予測精度を向上させることができる。
【0119】
(1e)学習処理において、放送予定日時がM週間先である番組が予測対象である場合、プロセッサ10は、M週前からN週前までの同時間帯番組の学習用第2特徴量ベクトル52を用いる(Mは1以上N以下の整数)。
【0120】
予測処理において、放送予定日時がM週間先である番組が予測対象である場合、放送予定番組の1週前から(M-1)週前までの特徴量を使うことができない。このような学習処理によれば、予測時と同様の条件で人工知能3を学習させることが可能である。このため、番組の視聴量の予測精度を向上させることができる。
【0121】
(1f)深層学習モデル31は、入力情報に含まれる時系列情報を用いて、視聴量の予測値を算出可能なように構成される。例えば、深層学習モデル31は、過去番組のうち、放送日時が現在に近い番組であるほど、当該番組の番組情報が視聴量の予測に与える影響が相対的に大きくなるように計算するように構成される。入力情報に含まれる学習用第2特徴量ベクトル52は、過去N週分の同時間帯番組の放送順を表す情報を時系列情報として含むように生成される。
【0122】
このような深層学習モデル31を用いることにより、時系列情報を含む学習用第2特徴量ベクトル52を深層学習モデル31の入力に含めることで、番組の視聴量の予測精度を向上させることができる。
【0123】
[1-4.用語間の対応関係]
上記実施形態では、予測用第1情報61は第1情報の一例に相当し、予測用第2情報62は第2情報の一例に相当し、予測用第3情報63は第3情報の一例に相当し、予測用第4情報64は第4情報の一例に相当する。予測用第1特徴量ベクトル71は第1特徴量の一例に相当し、予測用第2特徴量ベクトル72は第2特徴量の一例に相当する。ターゲット視聴率は視聴量の一例に相当する。
【0124】
[2.他の実施形態]
以上、本開示の実施形態について説明したが、本開示は、上記実施形態に限定されることなく、種々の形態を採り得ることは言うまでもない。
【0125】
(2a)上記実施形態では、学習用第1特徴量ベクトル51は、学習用第1情報41及び学習用第3情報43に含まれる放送開始日時、放送終了時刻、放送局、タイトル、及び欠損値に基づいて生成される。学習用第2特徴量ベクトル52は、学習用第2情報42及び学習用第4情報44に含まれる放送開始日時、放送終了時刻、放送局、タイトル、及び視聴量に基づいて生成される。
【0126】
しかし、学習用第1特徴量ベクトル51は、これらすべての情報に基づいて生成される必要はなく、少なくとも放送日時に基づいて生成されればよい。学習用第2特徴量ベクトル52は、これらすべての情報に基づいて生成される必要はなく、少なくとも放送日時及び視聴量に基づいて生成されればよい。
【0127】
(2b)上記実施形態では、番組情報は、当該番組の放送開始日時、放送終了日時、タイトル、放送分数、及び当該番組を放送する放送局を表す情報を含む。
しかし、番組情報は、これらの情報をすべて含む必要はなく、少なくとも当該番組の放送日時を含んでいればよい。過去番組の番組情報は、当該番組の視聴量を更に含んでいればよい。
【0128】
番組情報は、当該番組の放送日時として、当該番組の放送開始日時を特定可能な情報を含んでいてもよい。
(2c)上記実施形態では、学習処理における同時間帯番組は、学習対象番組と同じ曜日かつ同じ時間帯かつ同じ放送局において放送された過去番組である。予測処理における同時間帯番組は、予測対象番組と同じ曜日かつ同じ時間帯かつ同じ放送局において放送された過去番組である。
しかし、これらの同時間帯番組は、学習対象番組又は予測対象番組の放送予定日時に対応する過去の時間帯に放送された番組であればよい。すなわち、同時間帯番組は、学習対象番組又は予測対象番組と少なくとも同じ時間帯において放送された過去番組であればよく、学習対象番組又は予測対象番組とは異なる曜日又は異なる放送局において放送された過去番組であってもよい。
(2d)上記実施形態では、視聴量は、視聴率又は視聴率に関連するパラメータを表す。しかし、視聴量は、視聴率又は視聴率に関連するパラメータに限定されるものではない。例えば、視聴量は、特定の視聴者へのリーチ数その他の視聴数であってもよい。視聴量は、視聴者数に対する特定の視聴者属性の含有率であってもよい。
【0129】
(2e)上記実施形態における1つの構成要素が有する複数の機能を、複数の構成要素によって実現したり、1つの構成要素が有する1つの機能を、複数の構成要素によって実現したりしてもよい。また、複数の構成要素が有する複数の機能を、1つの構成要素によって実現したり、複数の構成要素によって実現される1つの機能を、1つの構成要素によって実現したりしてもよい。また、上記実施形態の構成の一部を省略してもよい。また、上記実施形態の構成の少なくとも一部を、他の上記実施形態の構成に対して付加又は置換してもよい。
【0130】
(2f)本開示は、上述した予測システムの他、種々の形態で実現することができる。例えば、当該予測システムを構成要素とするシステム、当該予測システムとしてコンピュータを機能させるためのコンピュータプログラム、このコンピュータプログラムを記録した半導体メモリ等の非遷移的実体的記録媒体、予測方法等の形態で実現することができる。
【0131】
[本明細書が開示する技術思想]
[項目1]
予測システムであって、
取得部と、
予測部と、
を備え、
前記取得部は、
予測対象番組の放送予定日時を含む第1情報と、
前記予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、
前記予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、
前記複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、
を取得するように構成され、
前記予測部は、
前記第1情報から特定される前記予測対象番組の放送予定日時と、
前記第2情報から特定される前記複数の同時間帯番組の放送日時及び視聴量と、
前記第3情報から特定される前記少なくとも1つの隣接番組の放送予定日時と、
前記第4情報から特定される前記複数の過去隣接番組の放送日時及び視聴量と、
を含む入力情報を深層学習モデルに入力し、前記深層学習モデルの出力として、前記予測対象番組の視聴量の予測値を得ることにより、前記予測対象番組の視聴量を予測するように構成される、
予測システム。
【0132】
[項目2]
項目1に記載の予測システムであって、
前記第1情報は、前記予測対象番組の放送予定日時として、予定される前記予測対象番組の放送開始日時を特定可能な情報を含み、
前記第2情報は、前記複数の同時間帯番組の放送日時として、前記複数の同時間帯番組の放送開始日時を特定可能な情報を含み、
前記複数の同時間帯番組は、前記予測対象番組と同じ曜日かつ同じ放送局において過去に放送された番組であって、過去の複数の週のそれぞれにおいて、前記予測対象番組の放送開始日時に最も近い放送開始日時を有する番組である、
予測システム。
【0133】
[項目3]
項目1又は項目2に記載の予測システムであって、
前記予測対象番組の特徴量である第1特徴量と、前記複数の同時間帯番組のそれぞれの特徴量である複数の第2特徴量と、を生成するように構成される生成部を更に備え、
前記第1特徴量は、前記予測対象番組及び前記少なくとも1つの隣接番組のそれぞれにおける、放送予定日時、放送する放送局の識別情報、及びタイトルに基づいて生成され、
前記複数の第2特徴量は、前記複数の同時間帯番組及び前記複数の過去隣接番組のそれぞれにおける、放送日時、放送した放送局の識別情報、及びタイトルに基づいて生成され、
前記予測部は、前記入力情報として、前記第1特徴量と前記複数の第2特徴量とを含む情報を前記深層学習モデルに入力するように構成される、
予測システム。
【0134】
[項目4]
項目1から項目3までのいずれか一項に記載の予測システムであって、
前記深層学習モデルは、前記入力情報に含まれる時系列情報を用いて前記予測値を算出するように構成される、
予測システム。
【0135】
[項目5]
項目3に記載の予測システムであって、
前記深層学習モデルは、前記入力情報に含まれる時系列情報を用いて前記予測値を算出するように構成され、
前記生成部は、前記複数の同時間帯番組の放送順を表す情報を前記時系列情報として含むように、前記複数の第2特徴量を生成するように構成される、
予測システム。
【0136】
[項目6]
コンピュータによって実行される予測方法であって、
取得することと、
予測することと、
を含み、
前記取得することは、
予測対象番組の放送予定日時を含む第1情報と、
前記予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、
前記予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、
前記複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、
を取得することを含み、
前記予測することは、
前記第1情報から特定される前記予測対象番組の放送予定日時と、
前記第2情報から特定される前記複数の同時間帯番組の放送日時及び視聴量と、
前記第3情報から特定される前記少なくとも1つの隣接番組の放送予定日時と、
前記第4情報から特定される前記複数の過去隣接番組の放送日時及び視聴量と、
を含む入力情報を深層学習モデルに入力し、前記深層学習モデルの出力として、前記予測対象番組の視聴量の予測値を得ることにより、前記予測対象番組の視聴量を予測することを含む、
予測方法。
【0137】
[項目7]
項目6に記載の予測方法をコンピュータに実行させるためのコンピュータプログラム。
【符号の説明】
【0138】
1…予測装置、3…人工知能、31…深層学習モデル、10…プロセッサ、61…予測用第1情報、62…予測用第2情報、63…予測用第3情報、64…予測用第4情報、71…予測用第1特徴量ベクトル、72…予測用第2特徴量ベクトル、100…予測システム。
【要約】
【課題】番組の視聴量の予測精度を向上させる。
【解決手段】予測システムは、予測対象番組の放送予定日時を含む第1情報と、予測対象番組の放送予定日時に対応する過去の時間帯に放送された複数の番組である複数の同時間帯番組の放送日時及び視聴量を含む第2情報と、予測対象番組の放送予定日時に隣接する時間帯に放送される少なくとも1つの隣接番組の放送予定日時を含む第3情報と、複数の同時間帯番組の放送日時のそれぞれに隣接する時間帯に放送された複数の番組である複数の過去隣接番組の放送日時及び視聴量を含む第4情報と、を含む入力情報を深層学習モデルに入力し、深層学習モデルの出力として、予測対象番組の視聴量の予測値を得るように構成される。
【選択図】
図11