IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社博報堂DYホールディングスの特許一覧

<>
  • 特開-推定システム及び推定方法 図1
  • 特開-推定システム及び推定方法 図2
  • 特開-推定システム及び推定方法 図3
  • 特開-推定システム及び推定方法 図4
  • 特開-推定システム及び推定方法 図5
  • 特開-推定システム及び推定方法 図6
  • 特開-推定システム及び推定方法 図7
  • 特開-推定システム及び推定方法 図8
  • 特開-推定システム及び推定方法 図9
  • 特開-推定システム及び推定方法 図10
  • 特開-推定システム及び推定方法 図11
  • 特開-推定システム及び推定方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022086981
(43)【公開日】2022-06-09
(54)【発明の名称】推定システム及び推定方法
(51)【国際特許分類】
   G16H 10/00 20180101AFI20220602BHJP
   G06Q 10/04 20120101ALI20220602BHJP
【FI】
G16H10/00
G06Q10/04
【審査請求】未請求
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2021095230
(22)【出願日】2021-06-07
(62)【分割の表示】P 2020198988の分割
【原出願日】2020-11-30
(71)【出願人】
【識別番号】507009009
【氏名又は名称】株式会社博報堂DYホールディングス
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際特許業務法人
(72)【発明者】
【氏名】▲徳▼久 真也
(72)【発明者】
【氏名】北川 雄一朗
(72)【発明者】
【氏名】▲高▼橋 潤
(72)【発明者】
【氏名】山本 悠人
【テーマコード(参考)】
5L049
5L099
【Fターム(参考)】
5L049AA04
5L099AA15
(57)【要約】
【課題】本人の健診データを参照することなしに、対応する個人の健康状態を推定可能な技術を提供する。
【解決手段】本開示の一側面によれば、複数の第1の対象者の健康状態を記述する健康データセットと、複数の第1の対象者の購買履歴を記述する購買データセットとに基づいて、第2の対象者の健康状態を第2の対象者の購買履歴から推定するための推定モデルが構築される(S150)。第2の対象者の健康状態の推定のために、第2の対象者の購買履歴を記述するデータが取得される(S310)。第2の対象者の健康状態が、取得データに記述される第2の対象者の購買履歴と推定モデルとに基づいて推定される(S330-S350)。
【選択図】図3
【特許請求の範囲】
【請求項1】
複数の第1の対象者の健康状態を記述する健康データセットと、前記複数の第1の対象者の購買履歴を記述する購買データセットとに基づいて、第2の対象者の健康状態を前記第2の対象者の購買履歴から推定するための推定モデルを構築するモデル構築部と、
前記第2の対象者の購買履歴を記述する対象データを取得するデータ取得部と、
前記第2の対象者の健康状態を、前記対象データに記述される前記第2の対象者の購買履歴と前記推定モデルとに基づいて推定する推定部と、
を備える推定システム。
【請求項2】
前記推定部は、前記第2の対象者の健康状態として、前記第2の対象者の現在又は未来の健康状態を推定する請求項1記載の推定システム。
【請求項3】
前記モデル構築部は、購買区分毎に、対応する購買区分に関する推定モデルとして、前記第2の対象者の健康状態を前記第2の対象者の前記対応する購買区分の購買履歴から推定するための推定モデルを、前記購買データセットに記述される前記複数の第1の対象者の購買履歴のうち、前記対応する購買区分の購買履歴を選択的に用いて構築し、
前記推定部は、前記第2の対象者の健康状態を、前記対象データに記述される前記第2の対象者の購買履歴と、当該購買履歴に対応する前記購買区分に関する前記推定モデルとに基づいて推定する請求項1又は請求項2記載の推定システム。
【請求項4】
前記購買区分は、購買店舗の業態、購買地域、購買時期、及び購買物の種類の少なくとも一つにより定義される区分である請求項3記載の推定システム。
【請求項5】
前記モデル構築部は、前記健康データセット及び前記購買データセットに基づいた機械学習により、前記推定モデルとして、前記第2の対象者の健康状態に関する推定値を算出するための回帰モデルを構築する請求項1~請求項4のいずれか一項記載の推定システム。
【請求項6】
前記モデル構築部は、前記健康データセット及び前記購買データセットに基づいたロジスティック回帰により、前記推定モデルとして、前記第2の対象者が特定の健康状態である確率を算出するための回帰モデルを構築する請求項1~請求項4のいずれか一項記載の推定システム。
【請求項7】
前記健康データセットは、健康に関する複数の項目のそれぞれについて、前記第1の対象者のそれぞれの、対応する項目に関する健康状態を特定可能な情報を含み、
前記推定モデルは、前記複数の項目のそれぞれについて、前記第2の対象者が対応する項目に関する健康状態の不調を有する可能性を表すスコアを算出するためのモデルを含み、
前記推定部は、前記複数の項目のそれぞれについて、前記第2の対象者が対応する項目に関する前記不調を有する可能性を表すスコアを、前記推定モデルに基づいて推定する請求項1~請求項4のいずれか一項記載の推定システム。
【請求項8】
前記モデル構築部は、前記健康データセット及び前記購買データセットに基づいたロジスティック回帰により、前記推定モデルを構築するように構成され、
前記推定モデルは、前記複数の項目のそれぞれについて、前記第2の対象者が対応する項目に関する前記不調を有する確率を、前記スコアとして算出するための回帰モデルを含む請求項7記載の推定システム。
【請求項9】
前記モデル構築部は、
L1正則化を用いたロジスティック回帰により、前記購買履歴に関する第1の説明変数の一群を含む回帰モデルであって前記第1の説明変数の一群から前記確率を算出するための回帰モデルを学習すると共に、前記回帰モデルにおける前記第1の説明変数のそれぞれの寄与度を評価し、
前記第1の説明変数の一群から前記寄与度が基準未満の説明変数を除いた第2の説明変数の一群を含む回帰モデルであって、前記第2の説明変数の一群から前記確率を算出するための回帰モデルを、前記推定モデルとして、L2正則化を用いたロジスティック回帰により構築する請求項6又は請求項8記載の推定システム。
【請求項10】
前記モデル構築部は、
L1正則化を用いたロジスティック回帰により、前記購買履歴に関する第1の説明変数の一群を含む回帰モデルであって前記第1の説明変数の一群から前記確率を算出するための回帰モデルを学習すると共に、前記回帰モデルにおける前記第1の説明変数のそれぞれの寄与度を評価し、
前記寄与度に関する評価結果を説明した画面を、表示デバイスを用いて表示し、
前記第1の説明変数の一群のうち、ユーザインタフェースを介して指定された第2の説明変数の一群を含む回帰モデルであって前記第2の説明変数の一群から前記確率を算出するための回帰モデルを、前記推定モデルとして、L2正則化を用いたロジスティック回帰により構築する請求項6又は請求項8記載の推定システム。
【請求項11】
前記第2の対象者の前記複数の項目のそれぞれに対する前記スコアのうち、相対的に最も高いスコアが算出された項目に関する前記不調を、又は、算出されたスコアが前記相対的に最も高い項目からスコア順に所定順位までの二以上の項目に関する前記不調を、前記第2の対象者が有する不調と判定する判定部
を備える請求項7又は請求項8記載の推定システム。
【請求項12】
前記第2の対象者向けの配信情報として、前記判定部により判定された前記不調に関する情報を出力する配信情報出力部
を備える請求項11記載の推定システム。
【請求項13】
前記データ取得部は、複数の小売業者のそれぞれにおける各顧客の購買履歴を記述するデータを、前記第2の対象者の前記対象データとして取得し、
前記推定部は、前記複数の小売業者のそれぞれについて、対応する小売業者における顧客毎に、前記複数の項目に関する項目別の前記スコアを、対応する顧客の前記対象データを用いて算出するように構成される請求項7又は請求項8記載の推定システム。
【請求項14】
前記複数の小売業者における前記顧客毎の前記項目別の前記スコアに基づき、前記小売業者毎に、健康に関する情報の配信先である配信対象の顧客群を決定する配信対象決定部と、
を更に備える請求項13記載の推定システム。
【請求項15】
前記配信対象決定部は、小売業者間の重み付け及び配信数に関する指定情報に基づき、前記複数の小売業者における前記配信対象の顧客群の総数が指定された前記配信数を超えない範囲内で、前記配信対象の顧客群を前記小売業者毎に決定する請求項14記載の推定システム。
【請求項16】
前記モデル構築部は、前記購買データセットが示す前記第1の対象者のそれぞれの商品カテゴリ毎の購買量を、商品カテゴリ間における購買量の分布差を低減するように所定規則に従って購買特性値に変換し、前記購買特性値に基づき、前記推定モデルとして、前記第2の対象者に関する前記商品カテゴリ毎の前記購買特性値から、前記第2の対象者の健
康状態を推定するための推定モデルを構築し、
前記推定部は、前記対象データにおける前記第2の対象者の前記商品カテゴリ毎の購買量を前記購買特性値に変換し、前記購買特性値と前記推定モデルとに基づいて、前記第2の対象者の健康状態を推定する請求項1~請求項15のいずれか一項記載の推定システム。
【請求項17】
前記モデル構築部は、前記商品カテゴリ毎に、前記第1の対象者のそれぞれの購買量を、等級化することにより、予め定められた数値範囲の等級値に変換し、更には、各商品カテゴリの等級値の分布を標準化するように、前記第1の対象者のそれぞれの前記商品カテゴリ毎の等級値を前記購買特性値に変換する請求項16記載の推定システム。
【請求項18】
請求項1~請求項17のいずれか一項記載の推定システムにおける前記モデル構築部、前記データ取得部、及び前記推定部としての機能をコンピュータに実現させるためのコンピュータプログラム。
【請求項19】
コンピュータにより実行される推定方法であって、
複数の第1の対象者の健康状態を記述する健康データセットと、前記複数の第1の対象者の購買履歴を記述する購買データセットとに基づいて、第2の対象者の健康状態を前記第2の対象者の購買履歴から推定するための推定モデルを構築することと、
前記第2の対象者の購買履歴を記述する対象データを取得することと、
前記第2の対象者の健康状態を、前記対象データに記述される前記第2の対象者の購買履歴と前記推定モデルとに基づいて推定することと、
を含む推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、推定システム及び推定方法に関する。
【背景技術】
【0002】
従来、個人の健診データを健康標準モデル及び疾病モデルと比較することにより、個人の健康を評価し、評価結果を過去から将来まで可視的に表示する健康度評価システムが知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002-63278号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
健康への関心は、多くの人が有している。しかしながら、健診データを用いて個人の健康を評価する方法は、当然のことながら、健康診断を受けていない個人には適用できない。
【0005】
そこで、本開示の一側面によれば、本人の健診データを参照することなしに、対応する個人の健康状態を推定可能な技術を提供できることが望ましい。
【課題を解決するための手段】
【0006】
本開示の一側面に係る推定システムは、モデル構築部と、データ取得部と、推定部とを備える。モデル構築部は、複数の第1の対象者の健康状態を記述する健康データセットと、複数の第1の対象者の購買履歴を記述する購買データセットとに基づいて、第2の対象者の健康状態を第2の対象者の購買履歴から推定するための推定モデルを構築する。
【0007】
データ取得部は、第2の対象者の購買履歴を記述する対象データを取得する。推定部は、第2の対象者の健康状態を、対象データに記述される第2の対象者の購買履歴と推定モデルとに基づいて推定する。
【0008】
この推定システムを用いれば、個人の健康状態を、本人の健診データなど、本人の健康に関するデータなしに、本人の購買履歴に基づいて推定することができる。従って、本開示の一側面によれば、健康に関する有意義な推定システムを構築することができる。推定された健康状態は、例えば健康改善に役立てられ得る。
【0009】
本開示の一側面によれば、推定部は、第2の対象者の健康状態として、第2の対象者の現在の又は未来の健康状態を推定するように構成され得る。未来の健康状態は、現在の健康リスクに対応し得る。本開示の一側面によれば、推定システムは、個人の健康改善又は健康に関するリスクの低減に役立ち得る。
【0010】
本開示の一側面によれば、モデル構築部は、購買区分毎に、対応する購買区分に関する推定モデルとして、第2の対象者の健康状態を第2の対象者の対応する購買区分の購買履歴から推定するための推定モデルを、購買データセットに記述される複数の第1の対象者の購買履歴のうち、対応する購買区分の購買履歴を選択的に用いて構築するように構成されてもよい。
【0011】
本開示の一側面によれば、推定部は、第2の対象者の健康状態を、対象データに記述される第2の対象者の購買履歴と、当該購買履歴に対応する購買区分に関する推定モデルとに基づいて推定するように構成され得る。
【0012】
推定モデルを購買区分毎に使い分けることによれば、対象者の健康状態をより精度よく推定することができる。本開示の一側面によれば、購買区分は、購買店舗の業態、購買地域、購買時期、及び購買物の種類の少なくとも一つにより定義される区分であり得る。
【0013】
本開示の一側面によれば、モデル構築部は、健康データセット及び購買データセットに基づいた機械学習により、推定モデルとして、第2の対象者の健康状態に関する推定値を算出するための回帰モデルを構築し得る。
【0014】
本開示の一側面によれば、モデル構築部は、健康データセット及び購買データセットに基づいたロジスティック回帰により、推定モデルを構築するように構成されてもよい。本開示の一側面によれば、モデル構築部は、健康データセット及び購買データセットに基づいたロジスティック回帰により、推定モデルとして、第2の対象者が特定の健康状態である確率を算出するための回帰モデルを構築してもよい。
【0015】
本開示の一側面によれば、健康データセットは、健康に関する複数の項目のそれぞれについて、第1の対象者のそれぞれの、対応する項目に関する健康状態を特定可能な情報を含んでもよい。
【0016】
推定モデルは、健康に関する複数の項目のそれぞれについて、第2の対象者が対応する項目に関する健康状態の不調を有する可能性を表すスコアを算出するためのモデルを含んでもよい。可能性は、現在又は未来の可能性であり得る。推定部は、複数の項目のそれぞれについて、第2の対象者が対応する項目に関する健康状態の不調を有する可能性を表すスコアを、推定モデルに基づいて推定するように構成されてもよい。
【0017】
本開示の一側面によれば、推定モデルは、複数の項目のそれぞれについて、第2の対象者が対応する項目に関する健康状態の不調を有する確率を、スコアとして算出するための回帰モデルを含み得る。
【0018】
本開示の一側面によれば、モデル構築部は、L1正則化を用いたロジスティック回帰により、購買履歴に関する第1の説明変数の一群を含む回帰モデルであって第1の説明変数の一群から上記確率を算出するための回帰モデルを学習すると共に、回帰モデルにおける第1の説明変数のそれぞれの寄与度を評価してもよい。
【0019】
本開示の一側面によれば、モデル構築部は、第1の説明変数の一群から寄与度が基準未満の説明変数を除いた第2の説明変数の一群を含む回帰モデルであって、第2の説明変数の一群から上記確率を算出するための回帰モデルを、上記推定モデルとして、L2正則化を用いたロジスティック回帰により構築してもよい。
【0020】
L1正則化ロジスティック回帰及びL2正則化ロジスティック回帰を用いた推定モデルの構築によれば、説明変数群を、適切に絞り込み、推定精度の高い推定モデルを構築することができる。
【0021】
本開示の一側面によれば、モデル構築部は、寄与度に関する評価結果を説明した画面を、表示デバイスを用いて表示してもよい。本開示の一側面によれば、モデル構築部は、第1の説明変数の一群のうち、ユーザインタフェースを介して指定された第2の説明変数の一群を含む回帰モデルであって第2の説明変数の一群から上記確率を算出するための回帰
モデルを、推定モデルとして、L2正則化を用いたロジスティック回帰により構築してもよい。この推定システムによれば、ユーザは、寄与度の評価結果に基づいて、説明変数群を、適切に絞り込み、推定精度の高い推定モデルを構築することができる。
【0022】
本開示の一側面によれば、推定システムは、第2の対象者の複数の項目のそれぞれに対するスコアのうち、相対的に最も高いスコアが算出された項目に関する不調を、第2の対象者が有する不調と判定する判定部を備えてもよい。本開示の一側面によれば、推定システムは、算出されたスコアが相対的に最も高い項目からスコア順に所定順位までの二以上の項目に関する不調を、第2の対象者が有する不調と判定する判定部を備えてもよい。
【0023】
本開示の一側面によれば、第2の対象者向けの配信情報として、判定部により判定された不調に関する情報を出力する配信情報出力部を備えてもよい。
【0024】
上記判定を伴う推定システムによれば、対象者が主に悩まされている又は悩まされ得る不調を推定することができ、例えば、この不調に注目して、対象者の健康改善又は健康に関するリスクの低減に役立つサービス又は情報を提供し得る。
【0025】
本開示の一側面によれば、データ取得部は、複数の小売業者のそれぞれにおける各顧客の購買履歴を記述するデータを、第2の対象者の対象データとして取得してもよい。推定部は、複数の小売業者のそれぞれについて、対応する小売業者における顧客毎に、複数の項目に関する項目別のスコアを、対応する顧客の対象データを用いて算出するように構成されてもよい。
【0026】
本開示の一側面によれば、推定システムは、複数の小売業者における顧客毎の項目別のスコアに基づき、小売業者毎に、健康に関する情報の配信先である配信対象の顧客群を決定する配信対象決定部を備えてもよい。
【0027】
本開示の一側面によれば、配信対象決定部は、小売業者間の重み付け及び配信数に関する指定情報に基づき、複数の小売業者における配信対象の顧客群の総数が指定された配信数を超えない範囲内で、配信対象の顧客群を小売業者毎に決定してもよい。この推定システムを用いれば、決められた配信数の範囲内で、健康に関する情報への関心度が高いと推定される消費者に対して効率よく当該情報を配信することが可能である。
【0028】
本開示の一側面によれば、モデル構築部は、購買データセットが示す第1の対象者のそれぞれの商品カテゴリ毎の購買量を、商品カテゴリ間における購買量の分布差を低減するように所定規則に従って購買特性値に変換し、当該購買特性値に基づき、上記推定モデルとして、第2の対象者に関する商品カテゴリ毎の購買特性値から、第2の対象者の健康状態を推定するための推定モデルを構築するように構成されてもよい。
【0029】
本開示の一側面によれば、推定部は、対象データにおける第2の対象者の商品カテゴリ毎の購買量を購買特性値に変換し、購買特性値と推定モデルとに基づいて、第2の対象者の健康状態を推定してもよい。
【0030】
平均的な商品の購買量は、商品カテゴリの特性によって、商品カテゴリ間で大きく異なり得る。そうした環境では、特定の商品カテゴリの購買量が、他の商品カテゴリの購買量より大きいことで、推定モデルの出力に対して大きく影響を与える可能性がある。購買量を購買特性値に変換することによれば、商品カテゴリ間の特性の違いに起因する購買量の違いにより特定の商品カテゴリの推定モデルの出力に対する影響が大きくなるのを抑制することができる。
【0031】
本開示の一側面によれば、モデル構築部は、商品カテゴリ毎に、第1の対象者のそれぞれの購買量を、等級化することにより、予め定められた数値範囲の等級値に変換し、更には、各商品カテゴリの等級値の分布を標準化するように、第1の対象者のそれぞれの商品カテゴリ毎の等級値を購買特性値に変換してもよい。
【0032】
購買量を購買特性値に変換し、購買特性値に基づいて推定モデルを構築し、当該推定モデルを用いて健康状態を推定することによれば、精度よく対象者の健康状態を推定することができる。
【0033】
本開示の一側面によれば、推定システムにおいて実行される方法の少なくとも一部を、コンピュータに実行させるためのコンピュータプログラム、又は、当該コンピュータプログラムを記録するコンピュータ読取可能な記録媒体が提供されてもよい。
【0034】
本開示の一側面によれば、コンピュータプログラムであって、上述した推定システムにおけるモデル構築部、データ取得部、及び推定部の少なくとも一つの機能をコンピュータに実現させるためのコンピュータプログラムが提供されてもよい。
【0035】
本開示の一側面によれば、推定方法であって、複数の第1の対象者の健康状態を記述する健康データセットと、複数の第1の対象者の購買履歴を記述する購買データセットとに基づいて、第2の対象者の健康状態を第2の対象者の購買履歴から推定するための推定モデルを構築することと、第2の対象者の購買履歴を記述する対象データを取得することと、第2の対象者の健康状態を、対象データに記述される第2の対象者の購買履歴と推定モデルとに基づいて推定することと、を含む推定方法が提供されてもよい。推定方法は、コンピュータにより実行され得る。この推定方法によっても、上述の推定システムと同様の効果が得られる。
【図面の簡単な説明】
【0036】
図1】情報処理システムの構成を表すブロック図である。
図2】調査対象者毎の統合データの構成を表す図である。
図3】推定システムのプロセッサが実行するモデル構築処理を表すフローチャートである。
図4】等級化及び標準化に関する説明図である。
図5】推定システムのプロセッサが実行する回帰モデル構築処理を表すフローチャートである。
図6】推定システムのプロセッサが実行する推定処理を表すフローチャートである。
図7】配信システムのプロセッサが実行する第1の配信制御処理を表すフローチャートである。
図8】配信システムのプロセッサが実行する第2の配信制御処理を表すフローチャートである。
図9図9A及び図9Bは、広告配信先の決定方法に関する説明図である。
図10】粒度の組合せに関する説明図である。
図11】第二実施形態において推定システムのプロセッサが状態セグメント毎に実行するモデル構築処理を表すフローチャートである。
図12】第二実施形態において推定システムのプロセッサが実行するスコア算出処理を表すフローチャートである。
【発明を実施するための形態】
【0037】
以下に本開示の例示的実施形態を、図面を参照しながら説明する。
[第1実施形態]
図1に示す本実施形態の情報処理システム1では、推定システム10が、統合データベースシステム30が記憶する調査対象者毎の統合データに基づき、個人の健康に関する悩み(以下「健康悩み」という)を当該個人の購買行動から推定するための推定モデルを構築するように構成される。
【0038】
推定システム10は更に、推定モデルと、ID-POS(Point Of Sales)システム50から提供される消費者の購買データとに基づき、消費者の健康悩みを推定し、推定した健康悩みに関する情報を、配信システム70に提供するように構成される。配信システム70は、推定システム10から提供された情報に基づき、消費者の情報端末90に、消費者の上記推定された健康悩みに関する情報を配信するように構成される。
【0039】
図1に示す推定システム10は、プロセッサ11と、メモリ13と、ストレージ15と、ユーザインタフェース17と、通信デバイス19とを備える。プロセッサ11は、ストレージ15が記憶するコンピュータプログラムに従う処理を実行する。メモリ13は、プロセッサ11による処理実行時に作業用メモリとして使用される。
【0040】
ユーザインタフェース17は、推定システム10を使用するユーザからの操作信号を入力するための入力デバイスと、ユーザに向けて各種情報を表示するための表示デバイスとを備える。通信デバイス19は、ネットワークを通じて外部デバイスと通信可能に構成される。
【0041】
統合データベースシステム30は、調査対象者毎に、対応する調査対象者の購買データと健康データとを統合した統合データを備える。以下では、調査対象者の一群に対応する統合データの一群を、統合データセットとも表現する。
【0042】
一人の調査対象者の統合データに含まれる購買データは、対応する調査対象者の購買履歴を記述する。健康データは、対応する調査対象者の健康状態を記述する。健康データは、調査対象者に対する健康診断及び問診等を通じて収集され得る。このように統合データベースシステム30は、購買データセットとして、複数の調査対象者の購買データの一群を備え、健康データセットとして、複数の調査対象者の健康データの一群を備える。
【0043】
図2に示す例としての統合データは、ユーザIDと関連付けて、対応する調査対象者の属性データと購買データと健康データとを備える。属性データは、対応する調査対象者の性別及び年齢階級を含むデモグラフィック属性を記述する。
【0044】
購買データは、対応する調査対象者の商品毎の購買履歴データを備える。図2には、商品P1,P2,P3,…の購買履歴データが示される。ここでいう商品は、例えばJAN(Japan Article Number)コードで分類される商品であり得る。購買履歴データは、調査対象者による対応する商品の購買毎に、対応する商品の購買量として、対応する商品の購買数又は購買金額を、購買日時及び購買チャネルと共に記述する。
【0045】
健康データは、対応する調査対象者の健康状態として、対応する調査対象者の状態セグメント毎の判定値を記述する。状態セグメントは、健康状態の種類及びレベル(換言すれば大きさ)の組合せ毎に定義される。本実施形態でいう健康状態の種類及びレベルは、対応する個人が有する身心の不調の種類及びレベルである。判定値は、対応する種類及びレベルの不調の有無を1又は0の二値で表す。
【0046】
更に付言すれば、本実施形態でいう「身心の不調の種類及びレベル」は、医学的な厳密さを伴うものではない。個人が有する身心の不調の種類及びレベルは、個人が有する健康悩みの種類及びレベルであると理解されてよい。従って、以下では、身心の不調のことを
健康悩みと表現する。すなわち、健康データには、状態セグメント別の判定値として、健康悩みの種類及びレベル別の判定値が記述される。
【0047】
健康悩みの例には、睡眠に関する悩み、便秘に関する悩み、高血糖に関する悩み、冷え性に関する悩み、及び、倦怠感に関する悩み等が含まれる。健康データが、医師の診断に基づいて作成される場合、健康データには、対応する調査対象者が有する症状又は疾患の種類及びレベルに基づいて、健康悩みの種類及びレベル別の判定値が記述され得る。図2には、状態セグメントG1,G2,G3,…の判定値が示される。
【0048】
例えば、睡眠に関する悩みに対しては、三つのレベルに対応する睡眠悩み大、睡眠悩み中、及び睡眠悩み小の三つの状態セグメントが定義され得る。便秘に関する悩みに対しては、三つのレベルに対応する便秘悩み大、便秘悩み中、及び便秘悩み小の三つの状態セグメントが定義され得る。この場合、睡眠悩みを有さない調査対象者の健康データには、状態セグメント「睡眠悩み大」の判定値「0」、状態セグメント「睡眠悩み中」の判定値「0」、状態セグメント「睡眠悩み小」の判定値「0」が記述される。睡眠悩み「中」の調査対象者の健康データには、状態セグメント「睡眠悩み大」の判定値「0」、状態セグメント「睡眠悩み中」の判定値「1」、状態セグメント「睡眠悩み小」の判定値「0」が記述される。
【0049】
調査対象者毎の購買データ及び健康データは、予めパネル調査により得られる。すなわち、調査対象者の一群は、予め購買データ及び健康データの収集に協力的な調査対象者の一群に対応する。
【0050】
配信システム70は、プロセッサ71と、メモリ73と、ストレージ75と、ユーザインタフェース77と、通信デバイス79とを備える。プロセッサ71は、ストレージ75が記憶するコンピュータプログラムに従う処理を実行する。メモリ73は、プロセッサ71による処理実行時に作業用メモリとして使用される。
【0051】
ストレージ75は、コンピュータプログラムの他、プロセッサ71によって実行される処理に供される各種データを記憶する。ユーザインタフェース77は、配信システム70を管理する管理者からの操作信号を入力するための入力デバイスと、管理者に向けて各種情報を表示するための表示デバイスとを備える。通信デバイス79は、ネットワークを通じて消費者の情報端末90等の外部デバイスと通信可能に構成される。
【0052】
続いて、推定システム10のプロセッサ11が実行するモデル構築処理を、図3を用いて説明する。図3に示すモデル構築処理は、ユーザインタフェース17を通じて当該処理の実行指示が入力されると、プロセッサ11により実行される。
【0053】
モデル構築処理を開始すると、プロセッサ11は、統合データセットを統合データベースシステム30から読み出し(S110)、調査対象者毎に、対応する調査対象者の所定期間における各商品の購買量を等級値で記述した等級化購買データを生成する(S120)。
【0054】
S120において、プロセッサ11は、調査対象者毎に、対応する調査対象者の統合データを参照して、対応する調査対象者の所定期間における各商品の購買量を等級値に変換する。具体的には、プロセッサ11は、購買量を、その量に応じて、購買なしを表す等級値0、購買量小を表す等級値1、購買量中を表す等級値2、及び、購買量大を表す等級値3のいずれかに変換する。
【0055】
このために、プロセッサ11は、商品毎に、調査対象者全体での最大購買量を特定する
ことができる。プロセッサ11は、商品毎に、購買量0を除く最大購買量までの購買量の範囲を三分割して、第1三分位値を、等級値1と等級値2との境界値に設定し、第2三分位値を、等級値2と等級値3との境界値に設定することができる。
【0056】
プロセッサ11は、各商品の購買量を、購買量0を等級値0に変換し、0以外の購買量を、対応する商品の第1三分位値及び第2三分位値を境界に等級値1~3に変換するように、等級値0~3の4値のいずれかに変換する。
【0057】
平均的な購買数及び購買金額は、商品特性の相違に応じて、商品毎に異なる。等級化は、各商品の購買量を、商品特性に起因する商品間での購買量の差異を抑えて表現するために行われる。図4上段に示すテーブルは、調査対象者毎及び商品毎の購買金額の例を示す。図4中段に示すテーブルは、調査対象者毎及び商品毎の購買金額の等級値の例を示し、図4上段のテーブルに示される購買金額を等級化したテーブルに対応する。
【0058】
このようにして、プロセッサ11は、調査対象者毎に、複数の商品のそれぞれの購買量の等級値を記述した等級化購買データを生成する(S120)。以下では、調査対象者の一群に対応する等級化購買データの一群を、等級化購買データセットと表現する。
【0059】
その後、プロセッサ11は、等級化購買データセットにおける各商品の等級値を標準化して、調査対象者毎の標準化購買データを生成する(S130)。標準化購買データは、対応する調査対象者の複数の商品のそれぞれの標準化購買量を記述する。以下では、調査対象者の一群に対応する標準化購買データの一群を、標準化購買データセットと表現する。
【0060】
S130において、プロセッサ11は、商品毎に、等級化購買データセットにおける、対応する商品の等級値の一群を、平均0及び分散1の分布を示す標準化購買量の一群に変換する。
【0061】
標準化購買量のそれぞれは、対応する等級値を標準化した値に対応する。等級値のそれぞれは、対応する商品の標準化関数であって、対応する商品の調査対象者群の等級値の分布を、平均0及び分散1の分布に標準化する標準化関数に入力されて、標準化購買量に変換される。図4下段に示すテーブルは、調査対象者毎及び商品毎の標準化購買量を示し、図4中段のテーブルに示される等級値を標準化したテーブルに対応する。標準化は、商品特性の差異に起因した商品間における購買量の分布差を低減するために行われる。
【0062】
プロセッサ11は、その後、状態セグメント毎に、対応する状態セグメントの推定モデルを構築するための教師データセットを生成する(S140)。一つの状態セグメントに対応する教師データセットは、S130で生成された標準化購買データセットに、対応する状態セグメントの判定値を付加したデータセットである。
【0063】
一つの状態セグメントの教師データセットに含まれる教師データのそれぞれは、対応する調査対象者の標準化購買データに、対応する調査対象者の統合データが示す、対応する状態セグメントの判定値を付加したデータである。すなわち、教師データのそれぞれは、対応する調査対象者の商品毎の標準化購買量を記述すると共に、この調査対象者の状態セグメントの判定値を記述する。
【0064】
その後、プロセッサ11は、状態セグメント毎に、対応する状態セグメントの教師データセットを用いた機械学習により、消費者の購買データから、当該消費者の状態セグメントに対応する健康悩みの有無を推定するための推定モデルを構築し、構築した推定モデルをストレージ15に保存する(S150)。
【0065】
推定モデルは、例えば回帰モデルであり得る。プロセッサ11は、ロジスティック回帰により、推定モデルとして、対応する個人が対応する健康悩みを有する確率を算出するロジスティック回帰モデルを、対応する状態セグメントの教師データセットを用いて構築することができる。
【0066】
ロジスティック回帰モデルの目的変数は、上記確率である。ロジスティック回帰モデルには、複数の商品の標準化購買量に対応する複数の説明変数が含まれる。一つの説明変数は、一つの商品の標準化購買量に対応する。
【0067】
すなわち、推定モデルは、消費者個人の複数の商品の標準化購買量から、対応する消費者個人が対応する健康悩みを有する確率を算出する回帰モデルであり得る。確率は、対応する消費者個人が対応する健康悩みを現在有する又は将来有する確率であり得る。以下では、この確率のことを所属確率と表現する。所属確率は、消費者個人が対応する健康悩みを現在有する又は将来有するグループに属する確率とも言うことができる。また、対応する健康悩みを将来有する確率は、対応する健康悩みが将来発生するリスクを現在有する確率とも言うことができる。
【0068】
一例によれば、プロセッサ11は、状態セグメント毎に、対応する状態セグメントの教師データセットを用いて、図5に示す回帰モデル構築処理を実行することにより、対応する状態セグメントの推定モデルとしてのロジスティック回帰モデルを構築することができる。
【0069】
図5に示す回帰モデル構築処理を開始すると、プロセッサ11は、対応する状態セグメントの教師データセットを用いて、L1正規化ロジスティック回帰を複数回実行する(S210)。これにより、プロセッサ11は、第1の説明変数の一群を備える回帰モデルであって、第1の説明変数の一群から、対応する状態セグメントについての所属確率を算出するためのロジスティック回帰モデルを学習すると共に、第1の説明変数のそれぞれの寄与度を評価する。説明するまでもないが、ロジスティック回帰モデルは、説明変数X,X,…,X、回帰係数a,a,a,…,a、及び目的変数Yを用いて下式により表される。
【0070】
【数1】
【0071】
第1の説明変数の一群は、教師データセットにおいて標準化購買量が記述される商品の一群に対応する。各説明変数は、対応する商品の標準化購買量を説明する変数である。
正則化なしのロジスティック回帰では、データの当てはまり誤差に対応する損失関数fを最小にする回帰係数を探索するように、各説明変数に作用する回帰係数が学習される。これに対しL1正則化ロジスティック回帰では、上記損失関数fに、回帰係数の絶対値の和Σ|a|に対応するL1正則化項K1・Σ|a|を加えた評価関数(f+K1・Σ|a|)を最小にする回帰係数を探索するように、各説明変数に対応する回帰係数が学習される。K1は、L1正則化項の重み係数である。
【0072】
L1正則化ロジスティック回帰では、目的変数への説明力が弱い説明変数の回帰係数を積極的にゼロにするように、各説明変数の回帰係数が学習される。S210において、プロセッサ11は、各回のL1正規化ロジスティック回帰において、対応する回のL1正規
化ロジスティック回帰に用いる教師データ群を、教師データセットからランダムに抽出することができる。
【0073】
プロセッサ11は、この教師データ群を用いてL1正規化ロジスティック回帰を実行することにより、上記評価関数を最小にするロジスティック回帰モデルを学習する。更にプロセッサ11は、学習されたロジスティック回帰モデルにおいて、回帰係数が非ゼロである説明変数と、回帰係数がゼロである説明変数とを判別する。
【0074】
プロセッサ11は、回帰係数が非ゼロである説明変数を、学習時に選択された説明変数として判別する。プロセッサ11は、このようにしてL1正規化ロジスティック回帰を複数回実行し、このときの各説明変数の選択回数、又は、L1正規化ロジスティック回帰の実行回数に対する選択回数の割合を、対応する説明変数の寄与度として算出する。
【0075】
その後、プロセッサ11は、第1の説明変数の一群のうち、寄与度が基準値以上の説明変数群を、推定モデルに用いる第2の説明変数の一群として選択し(S220)、選択した第2の説明変数の一群を備える回帰モデルであって、第2の説明変数の一群から、対応する状態セグメントについての所属確率を算出するためのロジスティック回帰モデルを、対応する状態セグメントの教師データセットを用いて、L2正則化ロジスティック回帰により学習する(S230)。
【0076】
L2正則化ロジスティック回帰によれば、上記損失関数fに、回帰係数の二乗和Σaに対応するL2正則化項K2・Σaを加えた評価関数(f+K2・Σa)を最小にする回帰係数を探索するように、各説明変数に対応する回帰係数が学習される。K2は、L2正則化項の重み係数である。
【0077】
このようにして、プロセッサ11は、L2正則化ロジスティック回帰により、第2の説明変数の一群から目的変数としての上記所属確率を算出するためのロジスティック回帰モデルであって、評価関数を最小にする回帰係数を有するロジスティック回帰モデルを、対応する状態セグメントの推定モデルとして構築する。L1正則化ロジスティック回帰及びL2正則化ロジスティック回帰を用いた推定モデルの構築によれば、説明変数群を、適切に絞り込み、推定精度の高い推定モデルを構築することが可能である。
【0078】
プロセッサ11は、構築した推定モデルを、ストレージ15に保存して、回帰モデル構築処理を終了する。プロセッサ11は、このようにして、状態セグメント毎に推定モデルを構築し、これらをストレージ15に保存する。
【0079】
ここで変形例を説明する。変形例によれば、S220において、プロセッサ11は、図5右領域に示すS221~S223の処理を実行する。これにより、プロセッサ11は、ユーザにより選択された説明変数群を、第2の説明変数の一群として選択する。
【0080】
S221において、プロセッサ11は、第1の説明変数のそれぞれの寄与度を説明する画面であって、第1の説明変数の一群のうち、推定モデルの構築に用いるべき説明変数群をユーザが選択可能な選択画面を、ユーザインタフェース17の表示デバイスを通じて、ユーザに向けて表示する。
【0081】
選択画面は、上記説明変数群の選択操作を、ユーザインタフェース17を介してユーザから受け付けるためのグラフィカルユーザインタフェースを備えることができる。選択画面には、第1の説明変数の一群が、寄与度の高い順に並べて表示される。選択画面には、各説明変数に関するユーザ向けの情報として、対応する商品の識別情報、及び、寄与度が記述される。
【0082】
続くS222において、プロセッサ11は、ユーザインタフェース17を介して上記説明変数群の選択操作を受け付ける。これにより、プロセッサ11は、S230での推定モデルの構築に用いるべき説明変数群の指定情報をユーザから取得する。ユーザは、寄与度の情報及び商品の識別情報に基づいて、良好な推定モデルの構築に役立つと考える説明変数群を、選択画面を通じて選択することができる。
【0083】
選択操作が終了すると、プロセッサ11は、S223において、ユーザにより選択された説明変数群を、推定モデルの構築に用いる上記第2の説明変数の一群として選択し、S230の処理を実行する。すなわち、ユーザにより選択された第2の説明変数の一群から、対応する状態セグメントについての所属確率を算出するためのロジスティック回帰モデルを、推定モデルとして構築する。
【0084】
このように、第2の説明変数の一群は、寄与度に基づいて自動で、あるいは、ユーザからの指定情報に基づいて選択され得る。
【0085】
続いて、ユーザインタフェース17を通じて推定処理の実行指示が入力されると、プロセッサ11が実行する推定処理の詳細を、図6を用いて説明する。図6に示す推定処理を開始すると、プロセッサ11は、健康悩みの有無を推定する対象の消費者群に関して、各消費者の購買データを取得する(S310)。
【0086】
S310において、プロセッサ11は、推定対象の各消費者の購買データとして、ID-POSシステム50が有するPOSデータを取得する。POSデータを提供するID-POSシステム50は、推定対象の各消費者を顧客に有する小売業者のID-POSシステムであり得る。ID-POSシステム50では、例えば顧客からの会員証の提示を受けて、顧客が識別された状態で、顧客に対する販売情報が記録される。
【0087】
S310において、プロセッサ11は、推定システム10のユーザが、対応する小売業者から入手し、ストレージ15に記録した推定対象の消費者群の購買データの一群を、ストレージ15から読み出すことができる。あるいは、プロセッサ11は、通信により、ID-POSシステム50から推定対象の各消費者の購買データを取得することができる。各消費者の購買データには、対応する消費者のIDが含まれる。
【0088】
続くS320において、プロセッサ11は、推定対象の消費者群のうちの一人を選択する。ここで選択した消費者(以下、選択消費者という)について、プロセッサ11は、続くS330で、スコア算出処理を実行する。
【0089】
スコア算出処理(S330)において、プロセッサ11は、各状態セグメントの所属確率を、例えば0~100までの数値範囲のスコアとして算出する。スコアの算出には、ストレージ15が記憶する状態セグメント毎の推定モデル及びS310で取得された選択消費者の購買データが用いられる。
【0090】
プロセッサ11は、推定モデルの説明変数群に対応する商品群について、選択消費者の購買データを分析して、選択消費者の所定期間における各商品の購買量を、標準化購買量に変換する。変換に際して、選択消費者の購買データから特定される各商品の購買量は、推定モデルの構築時と同じ規則で等級化され、同じ標準化関数を用いて標準化購買量に変換される。
【0091】
プロセッサ11は、各状態セグメントについて、対応する状態セグメントの推定モデルの説明変数のそれぞれに、対応する商品についての選択消費者の標準化購買量を代入する
ことによって、スコアを算出する。
【0092】
その後、プロセッサ11は、状態セグメント毎に、算出されたスコアと閾値とに基づいて、選択消費者における対応する健康悩みの有無を判定する(S340)。すなわち、健康悩みの判定値として1又は0を算出する。スコアが閾値以上であるときには、判定値1が算出され、健康悩みを有すると判定される。スコアが閾値未満であるときには、判定値0が算出され、健康悩みを有さないと判定される。
【0093】
ここで健康悩みを有するとは、現在健康悩みを有する場合だけではなく、将来健康悩みが発生するリスクを有する場合も含む。「睡眠悩み大」「睡眠悩み中」「睡眠悩み小」などの健康悩みの種類が同じでレベルが異なる状態セグメントの一群に、スコアが閾値を超える状態セグメントが二以上含まれるときには、そのうちの一つの状態セグメント、例えば最もスコアの高い状態セグメントの判定値が値1として算出され、残りの状態セグメントの判定値が値0として算出され得る。
【0094】
閾値は、例えば一定値に定められる。あるいは、閾値は、健康悩みを有する調査対象者の所定割合が、推定モデルに基づけば健康悩みを有すると正しく判定される値に定められる。
【0095】
続くS350において、プロセッサ11は、選択消費者の状態セグメント毎のスコアから、選択消費者の主の健康悩みを判定する。一例によれば、プロセッサ11は、算出された選択消費者のスコアの一群のうち、相対的に最も高いスコアを示した状態セグメントに対応する健康悩みを、主の健康悩みと判定する。ここで判定される主の健康悩みもまた、選択消費者が現在有する健康悩みとは限らない。現在健康である消費者に対して判定される主の健康悩みは、将来発生する可能性(リスク)が最も高い健康悩みであり得る。
【0096】
別例として、プロセッサ11は、S350において、選択消費者の状態セグメント別(すなわち健康悩みの種類及びレベル別)のスコアを参照し、相対的にスコアの高い種類の健康悩みから所定順位までの二以上の種類の健康悩みを、主の健康悩みと判定してもよい。
【0097】
S350の処理を終了すると、プロセッサ11は、推定対象の消費者群の全員をS320で選択したか否かを判断する(S360)。選択していないと判断した場合(S360でNo)、プロセッサ11は、処理をS320に戻して、推定対象の消費者群の中から、未選択の消費者を一人選択し、S330以降の処理を実行する。全員について、S320~S350の処理を終えると、プロセッサ11は、S360で肯定判断し、スコア関連テーブルを出力する。
【0098】
S370での上記出力により配信システム70に提供されるスコア関連テーブルは、推定対象の各消費者について、消費者のIDに関連付けて、スコア算出処理(S330)で算出された当該消費者の状態セグメント毎のスコアと、S340で算出された状態セグメント毎の判定値と、S350で判定された主の健康悩みの識別情報と、を記述したスコア関連データを備える。このスコア関連テーブルは、対応する消費者群に対する情報配信に利用される。
【0099】
配信システム70は、推定システム10から出力されるスコア関連テーブルをストレージ75に保存することができる。このスコア関連テーブルを参照して、配信システム70のプロセッサ71は、図7に示す第1の配信制御処理、及び図8に示す第2の配信制御処理を実行する。第1の配信制御処理は、小売業者から顧客への情報配信に特に好適な処理であり、第2の配信制御処理は、複数の小売業者に商品を納入するメーカから消費者への
情報配信に特に好適な処理である。
【0100】
プロセッサ71は、配信主から予め指定され配信スケジュールに従って、図7に示す第1の配信制御処理を実行することができる。配信主は、ID-POSシステム50を通じて顧客に対応する各消費者の購買データを推定システム10に提供する小売業者に対応する。
【0101】
図7に示す処理を開始すると、プロセッサ71は、複数の状態セグメントのうちの一つを、配信先セグメントとして選択し(S410)、選択した配信先セグメントに対応する健康悩みを主の健康悩みとして有する消費者群を、配信主のスコア関連テーブルにスコア関連データが登録されている消費者群の中から抽出する(S420)。ここでの消費者群は、配信主に対応する小売業者の顧客群である。
【0102】
その後、プロセッサ71は、S420で抽出された消費者群が使用する情報端末90の一群に対し、主の健康悩みに関連する配信データを送信する(S430)。ストレージ75には、主の健康悩み毎、換言すれば状態セグメント毎の配信データが格納される。各主の健康悩みの配信データは、対応する主の健康悩みの改善に役立つ商品や生活態度などの情報を記述する。主の健康悩み毎の配信データ(コンテンツ)は、予め配信主により用意され、ストレージ75に格納される。
【0103】
配信データは、例えば情報端末90にインストールされた特定のアプリケーションプログラムを通じて、消費者に提供され得る。例えば、配信データは、アプリケーションプログラムが情報端末90で起動された際に、消費者に向けて表示され得る。
【0104】
アプリケーションプログラムは、配信主の店舗で利用可能な電子クーポンを消費者に提供したり、電子的な会員証を提供したりするために、消費者に配布されるアプリケーションプログラムであり得る。プロセッサ71は、スコア関連テーブルが示す各消費者のIDに基づいて、配信先セグメントに対応する主の健康悩みを有する消費者の情報端末90に、配信データを送信することができる。
【0105】
続くS440において、プロセッサ71は、全ての状態セグメントに関してS430の処理を実行したか否かを判断する。実行していないと判断すると(S440でNo)、プロセッサ71は、処理をS410に戻して、未選択の状態セグメントを新たな配信先セグメントに選択し、S420以降の処理を実行する。プロセッサ71は、全ての状態セグメントについてS430の処理を実行したと判断すると(S440でYes)、図7に示す処理を終了する。
【0106】
このようにしてプロセッサ71は、主の健康悩み別に、対応する主の健康悩みを有する消費者群に対して、主の健康悩みに関連する有意義な情報を提供する。本実施形態によれば、消費者の健診データがなくとも、ID-POSシステム50で蓄積された購買データに基づき、対応する消費者が抱える健康悩みに関連する健康改善に役立つ有意義な情報を提供することができる。
【0107】
この他、プロセッサ71は、配信システム70の管理者からの実行指示に基づいて、図8に示す第2の配信制御処理を実行し、広告主から指定されたディジタル広告を、複数の小売業者の顧客群に向けて配信する。第2の配信制御処理は、複数の小売業者の顧客群に関するスコア関連テーブルがストレージ75に保存されていることを前提として実行される。
【0108】
これらのスコア関連テーブルは、推定システム10のプロセッサ11が、小売業者毎に
、推定処理(図6参照)を実行して、対応する小売業者のID-POSシステム50から各顧客の購買データを取得し、取得した購買データに基づき顧客毎のスコア関連データを含むスコア関連テーブルを作成し、配信システム70に提供することにより、ストレージ75に保存される。
【0109】
プロセッサ71は、図8に示す処理を開始すると、ユーザインタフェース77を通じて管理者から、広告の配信先属性及び広告配信数を指定する情報及び小売業者の優先度情報を取得する(S510)。配信先属性を指定する情報は、広告配信先の消費者の健康悩みを指定する情報である。
【0110】
小売業者の優先度情報は、複数の小売業者のそれぞれに関する広告配信先としての優先度、換言すれば重みを表す。例えば、優先度情報は、小売業者毎に優先度「大」「中」「小」のいずれかを定義する。指定された広告配信数分の広告は、優先度の高い小売業者の顧客群に対して優先的に配信される。
【0111】
続くS520において、プロセッサ71は、上記優先度情報に基づいて、広告配信先候補の消費者群の中から、広告配信先の消費者群を決定する。広告配信先候補の消費者群は、広告配信先候補の複数の小売業者の顧客群に対応する。
【0112】
プロセッサ71は、広告配信先の決定に際して、広告配信先候補に該当する全ての小売業者のスコア関連テーブルを参照して、配信先属性に対応する種類の健康悩みを有する消費者の数を、図9A及び図9Bに示すように、健康悩みのレベル毎及び小売業者毎に特定する。以下では、健康悩みのレベル及び小売業者の組合せ別の消費者群のことを、消費者集合と表現する。
【0113】
上述したようにスコア関連テーブルは、消費者毎に、各状態セグメントの判定値を記述する。これらの判定値に基づけば、プロセッサ71は、睡眠悩み、便秘悩みなどの健康悩みの種類別に、対応する消費者の健康悩みのレベル(又は発生リスク)を判別することが可能である。
【0114】
プロセッサ71は、配信先属性に対応する健康悩みが「睡眠悩み」であるとき、小売業者毎に、対応する小売業者の顧客群に対応する消費者群について、睡眠悩み大の消費者数、睡眠悩み中の消費者数、睡眠悩み小の消費者数、睡眠悩みなしの消費者数を特定する。
【0115】
その後、所定規則に従って、上記組合せ別の消費者集合に広告配信先としての選択順位を設定する。例えば、優先度「高」の小売業者における健康悩み「大」の消費者集合、優先度「高」の小売業者における健康悩み「中」の消費者集合、優先度「中」の小売業者における健康悩み「大」の消費者集合、優先度「小」の小売業者における健康悩み「大」の消費者集合の順に、選択順位を付す規則が定められている場合、この規則に従って、上記組合せ別の消費者集合に配信先としての選択順位を設定する。
【0116】
その後、プロセッサ71は、消費者数の合計が指定された広告配信数を超えるまで、選択順位の高い消費者集合の順に、当該消費者集合を広告配信先に決定する。広告配信先に決定された消費者集合の中で最も選択順位の低い消費者集合に関しては、消費者集合の一部の消費者のみを例えばランダムに広告配信先に決定することにより、指定された広告配信数に一致するように、広告配信先の消費者群を決定する。
【0117】
図9Aに示す例によれば、事業者C1,C2,C3,C4には、いずれも同じ優先度が設定されていることから、小売業者間で実質均等に広告配信先が設定されるように、健康悩み「大」の消費者群が広告配信先に決定される。広告配信先は、図9Aにおいて破線で
囲まれた消費者集合に対応する。選択順位が同じ消費者集合については、これらの消費者集合から均等に広告配信先の消費者群が選択される。
【0118】
図9Bに示す例によれば、事業者C1には優先度「高」が設定され、事業者C2,C3には優先度「中」が設定され、事業者C4には優先度「小」が設定されていることから、事業者C1の消費者群から優先的に広告配信先が選択される。広告配信先は、図9Bにおいて破線で囲まれた消費者集合に対応する。
【0119】
続くS530において、プロセッサ71は、S520で広告配信先に決定された消費者群に対し、広告主から指定されたディジタル広告を配信する。すなわち、広告配信先の消費者群が有する情報端末90の一群に対し、ディジタル広告を配信する。その後、図8に示す処理を終了する。
【0120】
この処理によれば、配信システム70は、健康悩みのレベル及び事業者間の優先度を考慮しながら、広告主から指定された数の広告を、広告のターゲット層に対応する消費者群に適切に配信することができる。但し、配信情報としてのディジタル広告は、一例に過ぎない。第2の配信制御処理によっては、ディジタル広告以外の情報が配信されてもよい。ディジタル広告以外の情報の例には、健康に関する情報が含まれる。健康に関する情報の例には、疾患啓発情報、健康に関するウェビナーの案内情報、地域医療機関紹介情報、及び薬剤師との面談予約情報などが含まれる。
【0121】
[第2実施形態]
続いて、第2実施形態の情報処理システム1を説明する。第2実施形態の情報処理システム1では、推定システム10のプロセッサ11が実行するモデル構築処理及びスコア算出処理(S330)が第1実施形態と異なる。その他の点で、第2実施形態の情報処理システム1は、第1実施形態と基本的に同一である。従って、以下では、第2実施形態として、推定システム10のプロセッサ11が実行するモデル構築処理及びスコア算出処理の詳細を選択的に説明する。
【0122】
本実施形態において推定システム10のプロセッサ11は、購買期間、購買チャネル、及び調査対象者の性年齢階級について、粒度別に推定モデルを構築し、構築された推定モデルを評価することにより、推定精度の高い粒度の推定モデルを、推定処理で使用する推定モデルに選定するように構成される。
【0123】
例えば、図10に示すように第1の粒度の購買期間として全期間(すなわち1年間)が定義され、第2の粒度の購買期間として、四半期別の期間が定義される。第1の粒度の購買チャネルとして全チャネル、すなわち全業態及び全エリアが定義され、第2の粒度の購買チャネルとして、業態及びエリアの組合せ別のチャネルが定義される。業態は、百貨店、スーパーマーケット、コンビニエンスストア、及びドラッグストアなどの営業形態に基づいて定義される購買店舗の業態である。エリアは、国土を区分化して定義される購買地域又は町の規模によって分類される購買地域(例えば都市エリア、地方エリアなど)である。更に、第1の粒度の性年齢階級として、全性年齢階級が定義され、第2の粒度の性年齢階級として、男女及び所定年齢幅の組合せ別の性年齢階級が定義される。
【0124】
本実施形態によれば更に、説明変数で購買量が説明される商品に対しても複数の粒度が定義され、粒度別の推定モデルが構築される。例えば、第1の粒度で表現される商品は、第1のカテゴリ別の商品であり、第2の粒度で表現される商品は、第1のカテゴリより細かい第2のカテゴリ別の商品である。
【0125】
商品カテゴリとしては、JANコードにより実質一商品毎に定義される商品カテゴリ、
JICFS(JAN Item Code File Service)細分類コードにより定義される商品カテゴリ、JICFS小分類コードにより定義される商品カテゴリが知られている。JANコードにより定義される商品カテゴリは、JICFS細分類コードにより定義される商品カテゴリよりも粒度が小さく、JICFS細分類コードにより定義される商品カテゴリは、JICFS小分類コードより定義される商品カテゴリも粒度が小さい。
【0126】
粒度別の推定モデルは、第1の粒度の推定モデルとしての、第1の粒度の購買期間、購買チャネル、性年齢階級、及び商品カテゴリの推定モデル、第2の粒度の推定モデルとしての、第2の粒度の購買期間、購買チャネル、性年齢階級、及び商品カテゴリの組合せ別の推定モデルを含む他、粒度混在型の推定モデルが含まれる。例えば、粒度混在型の推定モデルとしては、例えば、第1の粒度の購買期間、第2の粒度の購買チャネル、第2の粒度の性年齢階級、及び第1の粒度の商品カテゴリの組合せ別の推定モデルが含まれる。このように、粒度別の推定モデルは、購買期間、購買チャネル、性年齢階級、及び、商品カテゴリについて異なる粒度の組合せ別の推定モデルを含む。
【0127】
具体的に、推定システム10のプロセッサ11は、図3に示すモデル構築処理に代えて、図11に示すモデル構築処理を状態セグメント毎に実行する。このモデル構築処理を開始すると、プロセッサ11は、統合データセットをストレージ15から読み出す(S610)。更にプロセッサ11は、選択粒度として、購買期間、購買チャネル、性年齢階級、及び商品カテゴリの粒度の組合せのうちの一つを選択する(S620)。
【0128】
その後、プロセッサ11は、選択粒度で採り得る購買期間、購買チャネル、及び性年齢階級の組合せの一つを、処理対象パターンとして選択する(S630)。例えば、購買期間、購買チャネル、及び性年齢階級が第1の粒度であるときには、「全期間」「全チャネル」「全性年齢階級」からなる唯一の組合せを、処理対象パターンとして選択する。
【0129】
購買期間が第2の粒度、購買チャネル及び性年齢階級が第1の粒度であるときには、処理対象パターンとして選択し得る組合せとして、「第1四半期」「全チャネル」「全性年齢階級」の組合せ、「第2四半期」「全チャネル」「全性年齢階級」の組合せ、「第3四半期」「全チャネル」「全性年齢階級」の組合せ、「第四半期」「全チャネル」「全性年齢階級」の組合せが存在する。
【0130】
その後、プロセッサ11は、処理対象パターンに対応する性年齢階級の調査対象者群を特定し、対応する性年齢階級の調査対象者群の統合データ群に基づいて、推定モデルの構築に用いる教師データセットを生成する(S640)。
【0131】
教師データセットを構成する教師データのそれぞれは、対応する性年齢階級の一人の調査対象者の統合データに基づいて生成され、商品カテゴリ毎の標準化購買量を記述する。標準化購買量は、選択粒度で表される商品カテゴリ毎に記述される。各商品カテゴリの標準化購買量は、処理対象パターンに対応する購買期間に、対応する調査対象者が、対応する購買チャネルを通じて購入した、対応する商品カテゴリの商品の標準化された購買量である。教師データのそれぞれは更に、対応する調査対象者の、対応する状態セグメントの判定値を記述する。
【0132】
標準化購買量を求める過程での等級化は、処理対象パターンに対応する調査対象者群の、処理対象パターンに対応する購買期間及び購買チャネルの購買履歴に基づいて、選択粒度に対応する商品カテゴリ毎に、対応する商品カテゴリの最大購買量、第1三分位、及び第2三分位を求めて行われる。標準化は、商品カテゴリ毎に、処理対象パターンに対応する調査対象者群の等級値の分布を標準化するように行われる。
【0133】
その後、プロセッサ11は、生成した教師データセットに基づいて、対応する状態セグメントの推定モデルを構築する(S650)。すなわち、推定モデルとして、処理対象パターンに対応する購買期間、購買チャネル及び性年齢階級の購買データから、消費者の対応する状態セグメントの所属確率を算出するための推定モデルを構築する。
【0134】
構築される推定モデルは、第1実施形態と同様にロジスティック回帰モデルであり得る。ロジスティック回帰モデルの説明変数群は、選択粒度の商品カテゴリの一群に対応し、各説明変数は、対応する商品カテゴリの標準化購買量を説明する。
【0135】
例えば、選択粒度の商品カテゴリが、JICFS小分類コードで分類される商品カテゴリであるとき、説明変数のそれぞれは、対応する一つのJICFS小分類コードの標準化購買量を説明する。
【0136】
プロセッサ11は、図5に示す回帰モデル構築処理と同様の処理を実行することにより、推定モデルを構築することができる。すなわち、プロセッサ11は、教師データセットに基づいて、複数回のL1正則化ロジスティック回帰、説明変数の絞り込み、及びL2正則化ロジスティック回帰を順に実行することにより、推定モデルを構築することができる。
【0137】
S650における推定モデルの構築後、プロセッサ11は、選択粒度で採り得る「購買期間」「購買チャネル」「性年齢階級」の全組合せ、すなわち全パターンについて推定モデルを構築したか否かを判断する(S660)。
【0138】
全パターンについて推定モデルを構築していないと判断すると(S660でNo)、プロセッサ11は、S630に処理を戻し、処理対象パターンを新たに選択して、S640以降の処理を実行する。このようにしてS630~S660の処理を繰返し実行することにより、プロセッサ11は、選択粒度に対応する購買期間、購買チャネル、及び、性年齢階級の組合せ毎に推定モデルを構築する。
【0139】
プロセッサ11は、全パターンについて推定モデルを構築したと判断すると(S660でYes)、構築した推定モデルにテストデータ群を適用して、構築された推定モデルの推定能力を評価する(S670)。評価される能力は、推定モデルの推定精度であり得る。テストデータ群は、予め用意されるモデル精度検証用のデータセットであり、健康悩みの有無が予め判明している消費者群の購買データセットに対応する。
【0140】
例えば、プロセッサ11は、推定モデルの推定能力に関する評価指標としてAUC(Area Under Curve)及び/又はスコア分布を求めることができる。例えば、プロセッサ11は、図11の右領域に示すように、テストデータ群を推定モデルに適用して(S671)、ROC(Receiver Operating Characteristic)曲線を求めてAUCを算出することができ(S672)、更には、テストデータ群のスコア分布を求めることができる(S673)。
【0141】
AUCが1に近いほど、対応する推定モデルの推定能力は高いと言える。更には、テストデータ群に基づくスコア分布の、教師データセットに基づくスコア分布からの誤差が小さいほど、対応する推定モデルの推定能力は高いと言える。
【0142】
その後、プロセッサ11は、粒度の全組合せについてS620~S670の処理を実行したか否かを判断する(S680)。粒度の全組合せについてS620~S670の処理を実行していないと判断すると(S680でNo)、プロセッサ11は、S620に処理
を戻し、未選択の粒度の組合せを新たに選択する。その後、当該新たに選択した粒度の組合せを上記選択粒度として用いて、S630以降の処理を実行する。
【0143】
このように粒度の全組合せについてS620~S670の処理を実行することにより、プロセッサ11は、粒度(の組合せ)別に、対応する推定モデルを構築し(S650)、当該推定モデルの能力を評価する(S670)。
【0144】
プロセッサ11は、S680において肯定判断すると(S680でYes)、粒度別の推定モデルの中から、最も能力の高い粒度の推定モデルを、推定処理に採用する推定モデルに選択し(S690)、当該推定モデルをストレージ15に保存する(S700)。S690で選択される推定モデルは、例えば、最もAUCの高い粒度の推定モデルであり得る。あるいは、S690では、AUC及びスコア分布の誤差を所定規則で総合評価し、その評価点が最も高い粒度の推定モデルを、推定処理に採用する推定モデルに選択することができる。
【0145】
S700で保存される推定モデルは、粒度に対応する購買期間、購買チャネル、及び、性年齢階級の組合せ毎の推定モデルを含む。以下では、購買期間、購買チャネル、及び、性年齢階級の組合せ毎の推定モデルのことを条件別の推定モデルという。但し、第1の粒度の推定モデルは、「全期間」「全購買チャネル」「全性年齢階級」に対応する単一の推定モデルである。以下では、第1の粒度の推定モデルについても、他の粒度の推定モデルと同様に、条件別の推定モデルと形式的に表現する。
【0146】
このようにしてプロセッサ11は、モデル構築処理を状態セグメント毎に実行することにより、ストレージ15に、状態セグメント毎に、対応する状態セグメントの条件別の推定モデルを保存する。
【0147】
この他、プロセッサ11は、推定処理の実行指示に従って、図6に示す推定処理を開始すると、第1実施形態と同様に、健康悩みの有無を推定する対象の消費者群の購買データの一群を取得し(S310)、選択消費者として、推定対象の消費者群の一人を選択する(S320)。その後、スコア算出処理として、図12に示すスコア算出処理を実行する(S330)。
【0148】
図12に示すスコア算出処理を開始すると、プロセッサ11は、所属確率を推定する状態セグメントを選択する(S710)。続くS720において、プロセッサ11は、選択した状態セグメントの推定モデルを、ストレージ15から読み出す。推定モデルは、上述の通り、条件別の推定モデルを含む。
【0149】
その後、プロセッサ11は、上記選択した状態セグメントの推定モデルとしてストレージ15から読み出した条件別の推定モデルのうち、選択消費者の購買データに対応する購買期間及び購買チャネル、並びに、選択消費者の性年齢階級に合致する一つの推定モデルを使用する推定モデルとして選択する(S730)。
【0150】
更に、プロセッサ11は、使用する推定モデルの各説明変数に、選択消費者の購買データに基づく対応する商品カテゴリの標準購買量を代入して、推定モデルから、選択消費者の対応する状態セグメントの所属確率を、例えば0~100までの数値範囲のスコアとして算出する(S740)。
【0151】
S740において、プロセッサ11は、選択消費者の購買データから対応する購買期間における対応する購買チャネルでの商品カテゴリ毎の購買量を特定し、これを推定モデル構築時と同じ基準で等級化及び標準化して、選択消費者の商品カテゴリ毎の標準化購買量
を算出することができる。
【0152】
変形例によれば、S730において、プロセッサ11は、条件別の推定モデルのうち、選択消費者の購買データに対応する購買期間及び購買チャネル、並びに、選択消費者の性年齢階級に合致する二つ以上の推定モデルを使用する推定モデルとして選択し、S740において、二以上の推定モデルを用いて、選択消費者の対応する状態セグメントの所属確率を算出することができる。
【0153】
例えば、購買データが、「第1四半期」「第2四半期」の購買データを含む場合、プロセッサ11は、「第1四半期」の推定モデルに、「第1四半期」の購買履歴に基づく商品カテゴリ毎の標準化購買量を入力して、第1の所属確率を算出し、「第2四半期」の推定モデルに、「第2四半期」の購買履歴に基づく商品カテゴリ毎の標準化購買量を入力して、第2の所属確率を算出することができる。
【0154】
その後、プロセッサ11は、これら第1の所属確率及び第2の所属確率を統合したスコアを算出することができる。例えば、プロセッサ11は、第1の所属確率に対応するスコア及び第2の所属確率に対応するスコアの平均又は合算に対応するスコアを算出することができる。これにより、プロセッサ11は、選択消費者の対応する状態セグメントのスコアを算出することができる。
【0155】
あるいは、プロセッサ11は、二つ以上の推定モデルのうち、対応する状態セグメントに関して所属確率の算出精度が高いと予想される推定モデルの所属確率を選択的に用いて、スコアを算出してもよい。
【0156】
その後、プロセッサ11は、全状態セグメントについて、選択消費者に関する状態セグメント毎のスコアを算出したか否かを判断する(S750)。全状態セグメントについてスコアを算出していないと判断すると、プロセッサ11は、S710に処理を戻して、未選択の状態セグメントの一つを選択し、S720以降の処理を実行する。
【0157】
すなわち、プロセッサ11は、新たに選択された状態セグメントに関して、ストレージ15から読み出した当該状態セグメントの条件別の推定モデルのうち、選択消費者の購買データに合致する一つの推定モデル(又は二つ以上の推定モデル)を、使用する推定モデルとして選択する(S730)。この推定モデルの各説明変数に、選択消費者の購買データに基づく、対応する商品カテゴリの標準化購買量を代入する(S740)。これにより、プロセッサ11は、対応する状態セグメントの所属確率を、上記スコアとして算出する(S740)。
【0158】
プロセッサ11は、このようにして状態セグメント毎に、対応する状態セグメントの所属確率に対応するスコアを算出し、図12に示すスコア算出処理を終了する。プロセッサ11は、続くS340(図6参照)において、状態セグメント毎に、スコアと閾値との比較に基づいて、対応する健康悩みの有無を判定する。
【0159】
更には、プロセッサ11は、選択消費者の主の健康悩みを判定する(S350)。プロセッサ11は、推定対象の全ての消費者に関して、S330~S350の処理を抑えると(S360でYes)、これらの処理で得られた消費者毎の状態セグメント別のスコア及び判定値、並びに主の健康悩みを記述したスコア関連テーブルを配信システム70に出力する。
【0160】
配信システム70のプロセッサ71は、このスコア関連データに基づいて、第1実施形態と同様に、図7に示す処理を実行し、各消費者に対して推定される主の健康悩みに関す
る情報を配信する。この他、プロセッサ71は、図8に示す処理に従って、広告主から指定されたディジタル広告を、複数の小売業者に亘る消費者群に向けて配信する。
【0161】
以上に説明した第2実施形態の情報処理システム1によれば、粒度の異なるデータに基づく複数の推定モデルを構築して、推定能力の高い推定モデルを選出し、推定処理に用いることから、POSデータに基づく消費者の健康悩みの推定を精度よく行うことができる。
【0162】
例えば、商品の品揃えは、業態やエリアに応じて異なる。例えば、ドラッグストアでは、医薬品が販売されているが、スーパーマーケットでは通常医薬品が販売されていない。また、地域によって気候や習慣が異なることに起因して、同じ業態の店舗であっても販売されている商品の種類は、異なる。季節性の商品があることから、購買期間に応じて、店舗での商品の品揃えは異なる。また、季節、性別、及び年齢等によって購買特性は異なる。
【0163】
従って、「購買期間」「購買チャネル」「性年齢階級」に分けて推定モデルを構築することは、推定精度の向上に役立つ。
【0164】
[その他]
本開示が上述した例示的実施形態に限定されるものではなく、種々の態様を採り得ることは言うまでもない。例えば、第2実施形態においては、説明を簡単にするために、「購買期間」「購買チャネル」「性年齢階級」「商品カテゴリ」のパラメータに第1及び第2の粒度が定義される旨を説明した。しかしながら、これらのパラメータに対して、三以上の粒度が設定されてもよい。
【0165】
「商品カテゴリ」の粒度は、全商品に関して一律の粒度に設定されなくてもよい。例えば、健康に関連性の高い商品カテゴリほど、粒度を小さくして、推定モデルの説明変数群を定義してもよい。あるいは、購買量を均すために、購買量の多い商品カテゴリの粒度を小さくし、購買量の少ない商品カテゴリの粒度の大きくすることも考えられる。
【0166】
この他、推定モデルを構築するに際しては、L1正則化ロジスティック回帰を実行する前の段階から、寄与度の低い商品カテゴリの購買量についての説明変数は、用意されなくてもよい。
【0167】
関連する概念として、条件別の推定モデルのうち、第1の条件の推定モデルに含まれる説明変数群と、第2の条件の推定モデルに含まれる説明変数群は、互いに異なる商品カテゴリ群を説明する説明変数群であってもよい。季節毎に、店頭に並ぶ商品群は異なる。また、季節性の商品の店頭での配置又は展示方法は、季節毎に変化する。
【0168】
従って、夏季の推定モデルの説明変数群には、夏季に流通量が減少する商品に関する説明変数群を含ませず、冬季の推定モデルの説明変数群には、冬季に流通量が減少する商品に関する説明変数群を含ませないように、各推定モデルの学習時に用いる説明変数群を定義し得る。すなわち、条件別の推定モデルには、説明変数群に関する条件が定められ得る。具体的には「購買期間」「購買チャネル」「性年齢階級」の各組合せに対しては、対応する推定モデルの構築時に採用されるべき説明変数群に対応する商品カテゴリ群が定義され得る。この商品カテゴリ群は、推定モデルの構築時に考慮されるべき購買物の種類に対応する。
【0169】
この他、推定モデルによる推定対象の健康悩みには、女性特有の健康悩み、例えば更年期に関する悩みも含まれ得る。従って、女性特有の健康悩みの所属確率を推定するための
推定モデルに関しては、「性年齢階級」として男性を排除し女性の年齢階級のみに絞った条件別の推定モデルを構築することができる。
【0170】
この他、第2実施形態では、モデル構築処理において、推定処理に用いる推定モデルを選定したが、モデル構築処理では推定モデルを選定せずに、粒度別の推定モデルを全てストレージ15に保存してもよい。プロセッサ11は、推定処理において、POSデータを粒度別の推定モデルに適用したときのスコア分布を加味して、最も信頼性の高い推定モデルを選定し、選定した推定モデルの所属確率に基づいて、スコアリングを実現してもよい。
【0171】
第1実施形態及び第2実施形態では、ロジスティック回帰を用いて推定モデルを構築する例を説明したが、その他の機械学習技術を用いて推定モデルを構築してもよい。例えば、サポートベクタマシン、決定木、及びニューラルネットワーク等の機械学習技術を用いて、推定モデルが構築されてもよい。
【0172】
また、第2実施形態においては、予め粒度別の推定モデルを構築して、推定能力の高い推定モデルを選別したが、次のような実施形態も考えられる。すなわち、推定システム10は、予め定められた粒度で推定モデルを構築して、推定モデルの推定能力を評価し、推定能力が一定水準を満たしていない場合には、別の粒度で推定モデルを学習し直すことにより、推定能力が一定水準を満たす推定モデルを探索するように構成されてもよい。この他、推定対象の消費者群に対応するPOSデータが与えられたときに、POSデータの各商品の購買量の大小を考慮して、商品カテゴリの粒度を切り替えて、推定モデルを構築し直してもよい。
【0173】
推定システム10において推定された消費者毎の健康悩みに関する情報、具体的にはスコア関連テーブルは、消費者に対する情報端末90を通じた情報配信だけではなく、例えば消費者に対するカウンセリングに使用されてもよい。推定された健康悩みに関する情報の活用例は、上述したものに限定されない。
【0174】
上記実施形態における1つの構成要素が有する機能は、複数の構成要素に分散して設けられてもよい。複数の構成要素が有する機能は、1つの構成要素に統合されてもよい。上記実施形態の構成の一部は、省略されてもよい。上記実施形態の構成の少なくとも一部は、他の上記実施形態の構成に対して付加又は置換されてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本開示の実施形態である。
【符号の説明】
【0175】
1…情報処理システム、10…推定システム、11…プロセッサ、13…メモリ、15…ストレージ、17…ユーザインタフェース、19…通信デバイス、30…統合データベースシステム、50…ID-POSシステム、70…配信システム、71…プロセッサ、73…メモリ、75…ストレージ、77…ユーザインタフェース、79…通信デバイス、90…情報端末。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12