(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-06-05
(45)【発行日】2024-06-13
(54)【発明の名称】行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20240606BHJP
G06F 18/213 20230101ALI20240606BHJP
H04N 17/00 20060101ALI20240606BHJP
【FI】
G06N20/00
G06F18/213
H04N17/00 M
(21)【出願番号】P 2023195472
(22)【出願日】2023-11-16
【審査請求日】2023-11-17
【早期審査対象出願】
(73)【特許権者】
【識別番号】591101434
【氏名又は名称】株式会社ビデオリサーチ
(74)【代理人】
【識別番号】110000800
【氏名又は名称】デロイトトーマツ弁理士法人
(72)【発明者】
【氏名】長島 英樹
(72)【発明者】
【氏名】佐久間 淳一
【審査官】渡辺 一帆
(56)【参考文献】
【文献】特開2021-149524(JP,A)
【文献】特表2023-533071(JP,A)
【文献】特開2009-141952(JP,A)
【文献】特開2023-142769(JP,A)
【文献】特開2021-125128(JP,A)
【文献】特開2020-137005(JP,A)
【文献】特開2022-170793(JP,A)
【文献】特開2022-177387(JP,A)
【文献】土橋 諒太 ほか,"自然言語処理的アプローチによるテレビ視聴データの解析",オペレーションズ・リサーチ 経営の科学,公益社団法人 日本オペレーションズ・リサーチ学会,2020年,第65巻, 第2号,pp. 85-92,ISSN 0030-3674
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06F 18/213-18/2137
H04N 17/00
(57)【特許請求の範囲】
【請求項1】
コンピュータによって実行される行動予測モデル作成方法であって、
IDに対応する対象者の行動履歴データであって、行動時刻及び行動内容を時系列的に表す行動履歴データを学習処理モデルに入力する学習処理により、当該入力された行動履歴データの特徴ベクトルを生成する事前学習済みモデルを構築する事前学習済みモデル構築ステップと、
前記学習済みモデル構築ステップで構築された前記事前学習済みモデルに、イベントの開催時間および内容のメタデータを入力することにより該事前学習済みモデルから予測行動を生成する予測行動生成ステップと
を備えることを特徴とする行動予測モデル作成方法。
【請求項2】
コンピュータによって実行される集団行動予測方法であって、
請求項1記載の行動予測モデル作成方法により複数の前記対象者の予測行動から集団の行動を予測することを特徴とする集団行動予測方法。
【請求項3】
請求項2記載の集団行動予測方法において、前記複数の対象者を該対象者の属性に関する項目によりターゲットを限定した際のターゲット集団の行動を予測することを特徴とする集団行動予測方法。
【請求項4】
請求項1記載の行動予測モデル作成方法において、
前記事前学習済みモデル構築ステップは、生成された前記事前学習済みモデルの学習処理結果を検証する学習結果検証ステップを有し、
前記学習結果検証ステップでは、前記行動履歴データの一部をマスクして、マスクした行動
履歴データを前記事前学習済みモデルに予測させることにより該事前学習済みモデルの学習処理結果を検証することを特徴とする行動予測モデル作成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、行動履歴データに基づいて対象者の行動を予測するための行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法に関する。
【背景技術】
【0002】
従来この種の行動予測モデルとしては、下記特許文献1に示すように、行動予測装置が、利用者の行動履歴データを記憶している行動履歴データ記憶部と、行動履歴データ記憶部に記憶されている前記利用者の行動履歴データから確率的に前記利用者の行動モデルを作成する行動モデル作成部と、行動モデル作成部により作成された前記利用者の行動モデルをもとに、所定の条件に応じて確率的に前記利用者の行動を予測する行動予測部とを備え、行動予測部は、所定の条件に適合する行動履歴データのデータ数が所定の閾値に満たない場合に、該条件を拡張して前記利用者の行動を予測するものが知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、かかる従来の行動予測モデルでは、単に、行動履歴データから確率的に対象者の行動予測を行っているに過ぎず、行動履歴データが意味する内容、すなわち、対象の行動に隠れた意味が十分に考慮されるものとはなっていないという問題があった。
【0005】
これは、確率に代えて、行動履歴データを教師データとして機械学習させた場合も同様であり、対象者の行動に隠れた意味が反映されるものとはなっていないという問題があった。
【0006】
本発明はかかる背景に鑑みてなされたものであり、対象者の行動履歴データを用いて、行動に隠れた意味を反映させたサービスを適切に提供することが可能な行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
第1発明の行動予測モデル作成方法は、コンピュータによって実行される行動予測モデル作成方法であって、
IDに対応する対象者の行動履歴データであって、行動時刻及び行動内容を時系列的に表す行動履歴データを学習処理モデルに入力する学習処理により、当該入力された行動履歴データの特徴ベクトルを生成する事前学習済みモデルを構築する事前学習済みモデル構築ステップと、
前記学習済みモデル構築ステップで構築された前記事前学習済みモデルに、イベントの開催時間および内容のメタデータを入力することにより該事前学習済みモデルから予測行動を生成する予測行動生成ステップと
を備えることを特徴とする。
【0008】
なお、対象者は、IDに対応付けられた行動履歴データ(テレビ放送の視聴履歴データのほか、位置データ(GPSデータ含む)のほか、購買データ、来店データ、イベント参加(セミナー参加)データ、WEBアクセス履歴データ)を有する者を意味する。
【0009】
第1発明の行動予測モデル作成方法によれば、事前学習済みモデル構築ステップにより、対象者の行動履歴データを、学習処理モデルに入力して学習させることで、行動履歴データの特徴ベクトルを生成する事前学習モデルを構築することで、行動履歴データに隠れた対象者の趣味や嗜好や習慣などを抽出することができる。
【0010】
そして、実際に生成されたから、予測行動生成ステップでは、イベントの開催時間および内容のメタデータを入力することにより、行動に関する所定の情報を生成させることができる。
【0011】
このように、第1発明の行動予測モデル作成方法によれば、対象者の行動履歴データを用いて、対象者の趣味や嗜好や習慣など行動に隠れた意味を反映させたサービスを適切に提供することが可能となる。
【0012】
第2発明の集団行動予測方法は、コンピュータによって実行される集団行動予測方法であって、
請求項1記載の行動予測モデル作成方法により複数の前記対象者の予測行動から集団の行動を予測することを特徴とする。
【0013】
このように、第2発明の集団行動予測方法によれば、複数の対象者による行動履歴データを用いて、対象者の趣味や嗜好や習慣など行動に隠れた意味を反映させた行動予測を集計した集団の行動の予測ができ、集団行動に関するサービスを適切に提供することが可能となる。
【0014】
第3発明の集団行動予測方法は、第2発明において、
前記複数の対象者を該対象者の属性に関する項目によりターゲットを限定した際のターゲット集団の行動を予測することを特徴とする。
【0015】
第3発明の集団行動予測方法によれば、対象者の属性に関する複数の項目のそれぞれ毎に、各対象者の行動予測することができる。そのため、属性に関する項目によりターゲットとなる対象者を限定した際の行動予測を集計することによりターゲット集団の行動を予測することができる。
【0016】
このように、第3発明の集団行動予測方法によれば、複数の対象者による行動履歴データを用いて、行動に関する所定の情報として、属性に関する項目に対応したターゲットとなる対象者の行動を予測することができ、例えば、所定内容のイベントへの参加等の反応・反響に適したイベントのスケジュールを生成し、ターゲットとなる対象者の趣味や嗜好や習慣など行動に隠れた意味を反映させた行動予測に関するサービスを実際に適切に提供することが可能となる。
【0017】
第4発明の行動予測モデル作成方法は、第1発明において、
前記事前学習済みモデル構築ステップは、生成された前記事前学習済みモデルの学習処理結果を検証する学習結果検証ステップを有し、
前記学習結果検証ステップでは、前記行動履歴データの一部をマスクして、マスクした行動履歴データを前記事前学習済みモデルに予測させることにより該事前学習済みモデルの学習処理結果を検証することを特徴とする。
【0018】
第4発明の行動予測モデル作成方法によれば、事前学習済みモデルについて、行動履歴データの一部をマスクして、マスクした行動履歴データを該事前学習済みモデルに予測させることで学習処理結果を検証することでき、事前学習済みモデルの学習処理を担保することできる。
【0019】
このように、第4発明の行動予測モデル作成方法によれば、対象者による行動履歴データを用いて、行動に関する信頼性の高い学習モデルを構築して、対象者の趣味や嗜好や習慣など行動に隠れた意味を反映させた行動に関するサービスをより適切に提供することが可能となる。
【図面の簡単な説明】
【0020】
【
図1】本発明の実施形態における全体システムを示す説明図。
【
図2】
図1における視聴行動生成部の構成の一例を示す説明図。
【発明を実施するための形態】
【0021】
【0022】
図1に示すように、本実施形態の行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法の一例として、視聴行動予測モデル作成方法および当該視聴行動予測モデル作成方法を用いた視聴率予測方法が実行される放送用処理装置について説明する。
【0023】
放送用処理装置は、対象視聴者の1人1人に対応した視聴行動生成部10により各対象視聴者の視聴行動を予測し、それを集計(積算)することで視聴率を算出するシステムである。
【0024】
具体的に、
図1では、対象視聴者の1人であるAさんの行動履歴データとして、視聴行動である視聴履歴データを学習処理モデルに入力して学習させることで、視聴データの特徴ベクトル(視聴行動の特徴ベクトルおよび視聴内容である番組に関するメタ文書の特徴ベクトル)を生成する事前学習済みモデルを視聴行動生成部10が構築する。
【0025】
ここで、学習処理モデルに入力されるAさんの視聴履歴では、実際の視聴行動および視聴内容である番組のメタ情報であり、これらが入力されることにより学習処理モデルでは、Aさんの視聴行動に基づく視聴行動パターンおよび番組のメタ情報に基づく文書パターンから、視聴データから視聴行動の特徴ベクトルおよびメタ文書の特徴ベクトルを生成する事前学習モデルが視聴行動生成部10において構築される。
【0026】
かかるAさんの事前学習モデルによれば、放送時間および放送内容のメタデータを入力することにより事前学習済みモデルから対象視聴者であるAさんの予測行動としての視聴行動が生成される。
【0027】
同様の処理を、Aさん以外の対象視聴者であるBさん、Cさん、・・について行い、これらの複数の対象視聴者の視聴行動(例えば、特定の時間帯の特定の内容の番組を見るか見ないか)を、視聴率処理部20において積算等の処理を行うことで視聴率等の各種指標を算出する。
【0028】
以上が、放送用処理装置の概要であり、かかる視聴行動生成部10の構成の一例を、
図2に示す。
【0029】
図2に示すように、視聴行動生成部10は、事前学習モデル作成処理部11、ファインチューニング処理部12、視聴度合情報生成部13、および情報出力部14とを備える。
【0030】
事前学習モデル作成処理部11は、任意の対象視聴者の視聴履歴データから、該視聴履歴データの特徴ベクトルを生成する事前学習モデルを作成する処理部であり、かかる事前学習モデル作成処理部11での学習処理(STEP1)が本発明の事前学習済みモデル構築ステップに相当する。
【0031】
本実施形態では、学習処理モデルとして、例えば、GPTや、BERTなどの自然言語処理モデルを用いる場合を一例として示す。この場合、自然言語処理モデルに対して、言語データの代わりに、複数の対象視聴者の視聴履歴データを用いて学習処理を施すことで、事前学習モデルが作成される。なお、学習処理モデルは、自然言語処理モデルのほか、画像生成AIや感情可視化モデルなどの各種学習処理モデル(AIモデル)が採用され得る。
【0032】
この学習処理では、言語データの代わりに用いられる視聴履歴データは、所定の期間(例えば、〇月〇日〇時〇分から〇か月の期間、〇月〇日〇時〇分から〇月〇日〇時〇分までの期間など)における複数の単位視聴期間の時系列データである。各単位視聴期間は、その期間内でテレビ放送の視聴が行われた所定の単位時間幅(例えば5分など)の期間である。そして、各単位視聴期間には、その代表時刻(開始時刻、終了時刻、中央時刻など)と、該単位視聴期間で放送されたテレビ放送の放送局又はチャンネルとが対応づけられていると共に、各単位視聴期間毎の識別データが付されている。
【0033】
そして、事前学習モデルの作成の学習処理では、各対象視聴者の視聴履歴データの全体を文章データ、単位視聴期間毎の識別データを単語とみなして、自然言語処理モデルに入力される。これにより、事前学習モデルは、任意の対象視聴者の視聴履歴データが入力されたとき、該視聴履歴データ内での各端子視聴期間の特徴を表す特徴ベクトルを生成するように構築される。
【0034】
なお、このようにして学習処理により構築された事前学習モデルに対して、学習処理結果を検証する学習結果検証ステップを追加的に行ってもよい。
【0035】
より具体的に、学習結果検証ステップでは、視聴履歴データの一部をマスクして、マスクした視聴データの一部を事前学習モデルに予測させる処理を、マスク位置を順番に変えて行うことにより事前学習モデルの学習処理結果が一定の正答率となっているか検証することにより行う。これにより事前学習モデルの学習処理を担保することできる。
【0036】
さらに、学習処理により構築された事前学習モデルに対して、放送時間および放送内容のメタデータを入力することにより該事前学習済みモデルから対象視聴者(構築された事前学習済みモデルに対応した視聴対象者)の視聴行動を生成する視聴行動生成ステップが実行される。
【0037】
ここで、視聴行動生成ステップでは、単に、事前学習モデルに対して、放送時間および放送内容のメタデータを入力して視聴行動(特定の番組を見るか見ないか)を生成させる場合のほか、対象視聴者の特定の視聴より前の視聴履歴データを教師データとして、事前学習モデルに入力して再学習させることにより、該対象視聴者が該特定の視聴を行うか否か予測させるようにしてもよい。これにより特定の視聴に対する視聴行動を、より精度よく事前学習モデルにより予測させることができる。
【0038】
このようにして、各視聴対象者について予測された視聴行動(特定の番組を見るか見ないか)を、視聴率処理部20により複数の視聴対象者について積算することで予測視聴率などの予測視聴データを生成することができる。
【0039】
ファインチューニング処理部12は、上記のように構築される事前学習モデルをファインチューニングしてなる2種類のモデルを作成する。その2種類のモデルは、分類モデル作成部12aで作成される分類モデルと、提案モデル作成部12bで作成される提案モデルである。
【0040】
分類モデルは、任意の対象視聴者のそれぞれの視聴履歴データから、該対象視聴者の属性情報を生成するように構成される。この場合、対象視聴者の属性情報は、所定の複数種類の属性に関する情報である。当該複数種類の属性は、例えば、性別および年代を表す情報、収入を表す情報、職業を表す情報、同居家族の構成を表す情報、視聴意識を表す情報、購入意識を表す情報等である。そして、分類モデルは、これらの複数種類の属性毎に各別のモデルとして事前学習モデルから作成される。
【0041】
各属性に対応する分類モデルは、任意の対象視聴者の視聴履歴データを入力したとき、該対象視聴者が、該分類モデルに対応する種類の属性の内容を特定するように、事前学習モデルから作成される。例えば、性別・年代という属性に対応する分類モデルは、入力された視聴履歴データから、性別が男女のどちらであり、年代がどの年代であるかを特定し得るように作成される。各種類の属性に対応する分類モデルは、それに対応する属性が判明している対象視聴者の視聴履歴データを教師データとして用いて、機械学習をほどこしておくことで作成される。
【0042】
提案モデルは、対象視聴者の属性に関する複数のターゲット項目のそれぞれ毎に、各対象視聴者の視聴履歴データから、所定内容の放送を視聴させるために適した該所定内容の放送のスケジュールを生成するように、事前学習モデルから作成される。この場合、ターゲット項目は、所定内容の放送を視聴させたい対象視聴者の属性の内容である。例えば、性別・年代に関する属性の内容が、〇歳~〇歳の女性であり、且つ、収入に関する属性の内容が年額〇円以上、且つ、職業に関する属性の内容が会社員であるというような内容がターゲット項目として採用される。このようなターゲット項目があらかじめ複数、設定される。
【0043】
各ターゲット項目に対応する提案モデルは、そのターゲット項目に対応する対象視聴者の視聴履歴データを入力したとき、該対象視聴者に、所定内容の放送を視聴させるために適した該所定内容の放送のスケジュールを生成するように、事前学習モデルから作成される。
【0044】
例えば、あるターゲット項目に対応する提案モデルは、該ターゲット項目に対応する対象視聴者に、ある電気製品のコマーシャル放送を視聴させようとするとき、該コマーシャル放送の適切な放送日時(該対象視聴者が該コマーシャル放送を視聴する可能性が高い放送日時。例えば。毎週火曜日の19:00~19:20の間等)を特定し得るように作成される。各ターゲット項目に対応する提案モデルは、該ターゲット項目に対応する対象視聴者の視聴履歴データを教師データとして用いて、機械学習をほどこしておくことで作成される。
【0045】
視聴度合情報生成部13は、前記複数の対象視聴者のそれぞれの視聴履歴データ(所定内容の放送を含む視聴履歴データ)と前記分類モデルとを用いて、所定内容の放送の視聴度合と対象視聴者との属性との関係を表す視聴度合情報を生成する。該視聴度合情報は、より具体的には、該所定内容の放送が、どのような属性又はターゲット項目の対象視聴者が最も多く視聴したか(換言すれば、所定内容の放送の視聴度合い(視聴者数)が最も高い属性が又はターゲット項目がどの属性又はターゲット項目であるか)を示す情報である。
【0046】
この視聴度合情報生成部13により、例えば、電気製品のコマーシャル放送が、性別・年代が〇〇歳~〇〇歳の男性、収入が年額〇円以上、職業が会社員という属性の対象視聴者の視聴度合いが最も高いという如き視聴度合情報が得られる。
【0047】
情報出力部14は、提案モデルと視聴度合情報生成部13とにより得られた情報を図示しないディスプレイや、プリンタを介して出力する。具体的には、ユーザが、放送予定のコマーシャル放送等の放送内容と、ターゲット項目とを入力すると、情報出力部14は、前記提案モデルにより該放送内容をターゲット項目に合致する対象視聴者に視聴させる上で適切な放送スケジュールをユーザに対して出力する。また、ユーザが放送予定の放送内容に対する視聴度合情報を要求する操作を行うと、情報出力部14は、視聴度合情報生成部13で得られた視聴度合情報をユーザに対して出力する。
【0048】
なお、視聴行動生成部10の提案モデル作成部12bによる処理と併せて、視聴率処理部20が、特定のターゲット項目に合致する対象視聴者について予測される視聴行動からーゲット視聴率を算出することが好ましい。
【0049】
より具体的に、視聴率処理部20は、複数の対象視聴者の中から、ターゲット項目に合致する対象視聴者のセレクトし、セレクトした対象視聴者のみの予測される視聴行動(特定の番組を見るか見ないか)を積算することで、ターゲット視聴率を予測する。
【0050】
これにより、対象視聴者の属性に関する複数の項目のそれぞれ毎に、各対象視聴者の視聴行動予測することができる。そのため、属性に関する項目によりターゲットとなる対象視聴者を限定した際の視聴行動予測を集計することによりターゲット視聴率を予測することができる。
【0051】
すなわち、放送の視聴に関する所定の情報として、属性に関する項目に対応したターゲットとなる対象視聴者の視聴率の予測であるターゲット視聴率を予測することができ、提案モデル作成部12bの提案モデルと併せて、視聴率も加味した、所定内容の放送を視聴させるために適した放送のスケジュールを生成し、放送の視聴に関するサービスを実際に適切に提供することが可能となる。
【0052】
本実施形態の放送用処理装置は、以上の如く構成されているので、複数の視聴者によるテレビ放送の視聴履歴データを用いて、ユーザの多大な工数を必要とすることなく、テレビ放送の視聴に関するサービスを適切に提供することができる。また、当該サービスに必要な分類モデルおよび提案モデルを公知の自然言語処理モデルを利用して容易に構築することができる。
【0053】
なお、本実施形態では、視聴履歴データは、放送(テレビ、ラジオ、さらにBSおよびCSを含む)のほか、通信(IP放送、Netflix(登録商標)等のコネクテッドTVを含む)を介するものであってもよい。
【0054】
また、本実施形態では、テレビ放送におけるコマーシャル放送(映像CM)を例に説明したが、これに限定されるものではなく、番組や映画、アニメ、CG、演劇、ゲーム、インターネット配信などの映像作品のほか、映像を伴わないラジオCMやラジオ番組、写真、小説、漫画、書籍、音楽(声楽、演奏)、NFT、芸術作品(美術、建築、デザインなど)、芸術表現(パフォーマンス)などであってもよい。
【0055】
また、前記実施形態では、分類モデルおよび提案モデルを構築するために、行動履歴データの一例としての視聴履歴データを用いたが、視聴履歴データの代わりに、対象者の行動に関する所定種類の履歴データを用いてもよい。
【0056】
所定種類の履歴データ(行動履歴データ)としては、対象者のIDに紐づけられたデータであれば、種々の履歴データが採用され得る。例えば、履歴データとしては、位置データのほか、購買データ(カメラの購入履歴データなど)、来店データ、イベント参加(セミナー参加)データ、WEBアクセス履歴データであってもよい。
【0057】
かかる行動履歴データの場合にも、事前学習モデルによれば、イベントの開催時間および内容のメタデータを入力することにより事前学習済みモデルから対象者であるAさん、Bさん、Cさんのそれぞれの予測行動(当該イベントに参加するか参加しないか)が生成される。そして、かかる各対象者の予測行動を集計(積算)することにより、集団としての行動を予測することができる。
【0058】
これらの各種行動履歴データの場合にも、分類モデルは、複数種類の属性毎に各別のモデルとして事前学習モデルから作成される。また、提案モデルは、対象者の属性に関する複数のターゲット項目のそれぞれ毎に、各対象者の各種行動履歴データから、所定内容の行動をさせるために適した該所定内容の行動のスケジュールを生成するように、事前学習モデルから作成される。例えば、位置データの場合には、適切な移動(訪問)タイミング、購買データの場合には適切な購入タイミング、来店データの場合には適切な来店タイミング、行事参加(セミナー参加)データの場合には適切な参加タイミング、WEBアクセス履歴データの場合には適切なWEBアクセスタイミングのスケジュールが生成される。
【0059】
このように、対象者の趣味や嗜好や習慣など行動に隠れた意味を反映させた行動に関するサービスをより適切に提供することが可能となる。
【0060】
なお、以上説明した実施形態では、事前学習モデルを自然言語処理を用いて作成し、その事前学習モデルから分類モデル12aおよび提案モデル12bを作成したが、分類モデル12aおよび提案モデル12bを、自然言語処理モデルを用いずに作成してもよい。
【符号の説明】
【0061】
10…視聴行動生成部、11…事前学習モデル作成処理部、12…ファインチューニング処理部、12a…分類モデル作成部、12b…提案モデル作成部、13…視聴度合情報生成部、14…情報出力部。
【要約】
【課題】対象者の行動履歴データを用いて行動に隠れた意味を反映させたサービスを適切に提供することが可能な行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法を提供する。
【解決手段】行動予測モデル作成方法の一例としての視聴行動予測モデル作成方法は、視聴行動生成部10により、対象視聴者の行動履歴データとして、視聴時刻及び視聴放送内容を時系列的に表す視聴履歴データを学習処理モデルに入力する学習処理により、当該入力された視聴履歴データの特徴ベクトルを生成する事前学習済みモデルを構築する事前学習済みモデル構築ステップを実行すると共に、視聴率処理部20により、前記学習済みモデル構築ステップで構築された前記事前学習済みモデルに、放送時間および放送内容のメタデータを入力することにより該事前学習済みモデルから対象視聴者の予測行動としての視聴行動を生成する視聴行動生成ステップを実行する。
【選択図】
図1