IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社博報堂DYホールディングスの特許一覧

特開2022-57644データ生成システム及びデータ生成方法
<>
  • 特開-データ生成システム及びデータ生成方法 図1
  • 特開-データ生成システム及びデータ生成方法 図2
  • 特開-データ生成システム及びデータ生成方法 図3
  • 特開-データ生成システム及びデータ生成方法 図4
  • 特開-データ生成システム及びデータ生成方法 図5
  • 特開-データ生成システム及びデータ生成方法 図6
  • 特開-データ生成システム及びデータ生成方法 図7
  • 特開-データ生成システム及びデータ生成方法 図8
  • 特開-データ生成システム及びデータ生成方法 図9
  • 特開-データ生成システム及びデータ生成方法 図10
  • 特開-データ生成システム及びデータ生成方法 図11
  • 特開-データ生成システム及びデータ生成方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022057644
(43)【公開日】2022-04-11
(54)【発明の名称】データ生成システム及びデータ生成方法
(51)【国際特許分類】
   G06F 16/90 20190101AFI20220404BHJP
【FI】
G06F16/90
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2020166013
(22)【出願日】2020-09-30
(71)【出願人】
【識別番号】507009009
【氏名又は名称】株式会社博報堂DYホールディングス
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際特許業務法人
(72)【発明者】
【氏名】猪狩 良介
(72)【発明者】
【氏名】道本 龍
(72)【発明者】
【氏名】黄 橙白
(72)【発明者】
【氏名】長峰 伸明
(72)【発明者】
【氏名】安永 遼真
(72)【発明者】
【氏名】橘 大揮
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175FB04
(57)【要約】      (修正有)
【課題】情報粒度の細かいデータセットを生成可能なデータ生成システム、コンピュータプログラム及びデータ生成方法を提供する。
【解決手段】データ生成システムのデータ生成処理は、第一データセットを取得しS110、第二データセットを取得しS120、第一データセット及び第二データセットに基づき分析処理を実行し、第三データセットを生成しS130、生成した第三データセットをユーザから指定された出力先に出力するS140。第一データセットは、第一の集合に関する特徴を第一の粒度で表現した第一の集合内の単一又は複数の要素群についての第一の特徴量を記述する。第二のデータセットは、第二の集合に関する特徴を第二の粒度で表現した第二の集合内の一以上の要素毎の第二の特徴量を記述する。第三データセットは、第一の特徴量及び第二の特徴量のそれぞれと第三の特徴量との関係に基づき生成される。
【選択図】図2
【特許請求の範囲】
【請求項1】
第一のデータセットであって、第一の集合に関する第一の特徴を第一の粒度で表現した前記第一の集合内の前記第一の粒度に対応する単一の要素群についての又は複数の要素群のそれぞれについての第一の特徴量を記述する第一のデータセット、及び、第二のデータセットであって、前記第一の集合と同じ第二の集合に関する前記第一の特徴とは異なる第二の特徴又は前記第一の集合より小さい第二の集合に関する前記第一の特徴と同じ若しくは異なる第二の特徴を前記第一の粒度より細かい第二の粒度で表現した前記第二の集合内の前記第二の粒度に対応する一以上の要素毎の第二の特徴量を記述する第二のデータセットを取得するように構成される取得部と、
前記第一のデータセットと、前記第二のデータセットと、に基づいて、前記第一の集合に関する前記第一の特徴を前記第一の粒度より細かく前記第二の粒度より粗い又は前記第二の粒度と同じ第三の粒度で表現した前記第一の集合内の前記第三の粒度に対応するセグメント毎の第三の特徴量を記述する第三のデータセットを生成するように構成される生成部と、
を備え、
前記生成部は、前記第一の特徴量と前記第三の特徴量との関係に基づいた前記第三の特徴量の推定に関する第一の制約条件、及び、前記第二の特徴量と前記第三の特徴量との関係に基づいた前記第三の特徴量の推定に関する第二の制約条件の下で、前記第一のデータセット及び前記第二のデータセットに基づき、セグメント毎の前記第三の特徴量を推定し、前記第三のデータセットを生成するデータ生成システム。
【請求項2】
請求項1記載のデータ生成システムであって、
前記第一のデータセットは、所定系列における複数の系列要素のそれぞれについての前記第一の特徴量を記述し、
前記第二のデータセットは、前記所定系列における複数の系列要素のそれぞれについての前記第二の特徴量を記述し、
前記生成部は、前記第一のデータセット及び前記第二のデータセットに基づき、前記所定系列における少なくとも一つの系列要素についてのセグメント毎の前記第三の特徴量を推定するデータ生成システム。
【請求項3】
請求項2記載のデータ生成システムであって、
前記生成部は、前記所定系列における複数の系列要素のそれぞれについてのセグメント毎の前記第三の特徴量を推定し、
前記第一の制約条件及び前記第二の制約条件の少なくとも一方は、前記第三の特徴量の前記系列要素間の相違に関する制約条件を含むデータ生成システム。
【請求項4】
請求項2記載のデータ生成システムであって、
前記生成部は、前記所定系列における複数の系列要素のそれぞれについてのセグメント毎の前記第三の特徴量を推定し、
前記第一の制約条件は、前記複数の系列要素のそれぞれに関して、対応する系列要素におけるセグメント毎の前記第三の特徴量の和が、前記対応する系列要素におけるセグメント全体の前記第一の特徴量に対応するという制約条件を含むデータ生成システム。
【請求項5】
請求項1記載のデータ生成システムであって、
前記第一のデータセットは、前記第一の特徴量を時系列で記述し、
前記第二のデータセットは、前記第二の特徴量を時系列で記述し、
前記生成部は、前記第一のデータセット及び前記第二のデータセットに基づき、少なくとも一つの時点でのセグメント毎の前記第三の特徴量を推定するデータ生成システム。
【請求項6】
請求項5記載のデータ生成システムであって、
前記生成部は、複数の時点でのセグメント毎の前記第三の特徴量を推定し、
前記第一の制約条件及び前記第二の制約条件の少なくとも一方は、前記第三の特徴量の時間変化に関する制約条件を含むデータ生成システム。
【請求項7】
請求項5記載のデータ生成システムであって、
前記生成部は、複数の時点でのセグメント毎の前記第三の特徴量を推定し、
前記第二の制約条件は、前記複数の時点のそれぞれに関し、対応する時点での前記第三の特徴量が、前記対応する時点より前の時点での前記第三の特徴量、及び、前記対応する時点での前記第二の特徴量に所定の関係で依存するという制約条件を含むデータ生成システム。
【請求項8】
請求項5記載のデータ生成システムであって、
前記生成部は、複数の時点でのセグメント毎の前記第三の特徴量を推定し、
前記第一の制約条件は、前記複数の時点のそれぞれに関して、対応する時点でのセグメント毎の前記第三の特徴量の和が、前記対応する時点でのセグメント全体の前記第一の特徴量に対応するという制約条件を含むデータ生成システム。
【請求項9】
請求項1記載のデータ生成システムであって、
前記第一のデータセットは、前記第一の特徴量のそれぞれを対応する場所と関連付けて記述し、前記第二のデータセットは、前記第二の特徴量のそれぞれを対応する場所と関連付けて記述し、
前記生成部は、前記第一のデータセット及び前記第二のデータセットに基づいて、少なくとも一つの場所でのセグメント毎の前記第三の特徴量を推定するデータ生成システム。
【請求項10】
請求項9記載のデータ生成システムであって、
前記第三のデータセットは、複数の場所におけるセグメント毎の前記第三の特徴量を記述し、
前記生成部は、前記第一の制約条件及び前記第二の制約条件に加えて、前記複数の場所間における前記第三の特徴量の相違に関する第三の制約条件の下で、前記第一のデータセット及び前記第二のデータセットに基づき、複数のセグメントのそれぞれの前記第三の特徴量を推定するデータ生成システム。
【請求項11】
請求項1記載のデータ生成システムであって、
前記第一のデータセットは、地域毎に、前記第一の特徴量として、対応する地域内の人の行動特性に関する特徴量を表し、
前記第二のデータセットは、前記地域よりも小さい区域毎に、前記第二の特徴量として、対応する区域の地理特性に関する特徴量を表し、
前記生成部は、前記第一のデータセット及び前記第二のデータセットに基づき、前記セグメントとしての前記区域毎に、前記第三の特徴量として、対応する区域内の人の行動特性に関する特徴量を推定するデータ生成システム。
【請求項12】
請求項1記載のデータ生成システムであって、
前記第一のデータセットは、第一の期間毎に、前記第一の特徴量として、対応する第一の期間内の人の行動特性に関する特徴量を表し、
前記第二のデータセットは、前記第一の期間よりも短い第二の期間毎に、前記第二の特徴量として、対応する第二の期間の地理特性に関する特徴量を表し、
前記生成部は、前記第一のデータセット及び前記第二のデータセットに基づき、前記セグメントとしての前記第二の期間毎に、前記第三の特徴量として、対応する第二の期間内の前記行動特性に関する特徴量を推定するデータ生成システム。
【請求項13】
請求項1~請求項12のいずれか一項記載のデータ生成システムであって、
前記第一の制約条件及び前記第二の制約条件の少なくとも一方は、前記第三の特徴量のばらつきに関する誤差項を含むデータ生成システム。
【請求項14】
請求項1~請求項13のいずれか一項記載のデータ生成システムであって、
前記生成部は、前記第一の特徴量及び前記第二の特徴量から前記第三の特徴量を推定するための前記第一の制約条件及び前記第二の制約条件に従う推定モデルの設計パラメータの適値を、前記第一のデータセット及び前記第二のデータセットに基づき、ばらつきに関する確率分布を考慮した統計分析により探索し、前記設計パラメータの適値に対応する前記推定モデルに従う前記第三の特徴量を推定するデータ生成システム。
【請求項15】
請求項1~請求項14のいずれか一項記載のデータ生成システムにおける前記取得部及び前記生成部としてコンピュータを機能させるためのコンピュータプログラム。
【請求項16】
コンピュータにより実行されるデータ生成方法であって、
第一のデータセットであって、第一の集合に関する第一の特徴を第一の粒度で表現した前記第一の集合内の前記第一の粒度に対応する単一の要素群についての又は複数の要素群のそれぞれについての第一の特徴量を記述する第一のデータセット、及び、第二のデータセットであって、前記第一の集合と同じ第二の集合に関する前記第一の特徴とは異なる第二の特徴又は前記第一の集合より小さい第二の集合に関する前記第一の特徴と同じ若しくは異なる第二の特徴を前記第一の粒度より細かい第二の粒度で表現した前記第二の集合内の前記第二の粒度に対応する一以上の要素毎の第二の特徴量を記述する第二のデータセットを取得することと、
前記第一のデータセットと、前記第二のデータセットと、に基づいて、前記第一の集合に関する前記第一の特徴を前記第一の粒度より細かく前記第二の粒度より粗い又は前記第二の粒度と同じ第三の粒度で表現した前記第一の集合内の前記第三の粒度に対応するセグメント毎の第三の特徴量を記述する第三のデータセットを生成することと、
を含み、
前記生成することは、前記第一の特徴量と前記第三の特徴量との関係に基づいた前記第三の特徴量の推定に関する第一の制約条件、及び、前記第二の特徴量と前記第三の特徴量との関係に基づいた前記第三の特徴量の推定に関する第二の制約条件の下で、前記第一のデータセット及び前記第二のデータセットに基づき、セグメント毎の前記第三の特徴量を推定し、前記第三のデータセットを生成することを含むデータ生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データ生成システム及び方法に関する。
【背景技術】
【0002】
従来、データ集計により対象を分析することが行われている(例えば、特許文献1参照)。例えば、ユーザから指定された店舗を中心とした指定された半径の商圏に対応するエリア内のデータを集計することにより、指定された商圏の特徴に関する分析結果を表示する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003-167880号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
一般的に、大きい集合に関する情報粒度の細かいデータセットを収集することは、小さい集合に関する情報粒度の細かいデータセットを収集するよりも難しい。例えば、情報収集に協力的な人の集団に関する情報粒度の細かいデータセットを収集することはできても、情報収集に非協力的な人を含む広範囲の集団に関する情報粒度の細かいデータセットを収集することは、難しい。例えば個人に関する詳細な情報を収集するには、個人情報保護の関係から、多くの場合、個人の同意が必要である。
【0005】
このため、大きな集合に関する詳細な分析を所望しても、分析に必要なデータセットを取得することができず、詳細な分析を行うことができないケースが従来では多々あった。
【0006】
そこで、本開示の一側面によれば、取得可能な限られたデータセットから、集合に関する情報粒度の細かいデータセットを生成可能な技術を提供できることが望ましい。
【課題を解決するための手段】
【0007】
本開示の一側面によれば、取得部と、生成部と、を備えるデータ生成システムが提供される。取得部は、第一のデータセット及び第二のデータセットを取得するように構成される。第一のデータセットは、第一の集合に関する第一の特徴を第一の粒度で表現する。第一のデータセットは、第一の集合内の第一の粒度に対応する単一の要素群についての又は複数の要素群のそれぞれについての第一の特徴量を記述する。
【0008】
第二のデータセットは、第一の集合と同じ第二の集合に関する第一の特徴とは異なる第二の特徴、又は、第一の集合より小さい第二の集合に関する第一の特徴と同じ若しくは異なる第二の特徴を、第二の粒度で表現する。第二の粒度は、第一の粒度より細かい。第二のデータセットは、第二の集合内の第二の粒度に対応する一以上の要素毎の第二の特徴量を記述する。
【0009】
生成部は、第一のデータセットと、第二のデータセットと、に基づいて、第三のデータセットを生成するように構成される。第三のデータセットは、第一の集合に関する第一の特徴を第三の粒度で表現する。第三の粒度は、第一の粒度より細かく第二の粒度より粗い又は第二の粒度と同じである。第三のデータセットは、第一の集合内の第三の粒度に対応するセグメント毎の第三の特徴量を記述する。
【0010】
本開示の一側面によれば、第二のデータセットは、第二の集合内の一以上の要素毎に、対応する一以上の要素のセグメントを識別可能な情報を含み得る。生成部は、第一の特徴量と第三の特徴量との関係に基づいた第三の特徴量の推定に関する第一の制約条件、及び、第二の特徴量と第三の特徴量との関係に基づいた第三の特徴量の推定に関する第二の制約条件の下で、第一のデータセット及び第二のデータセットに基づき、セグメント毎の第三の特徴量を推定し、第三のデータセットを生成するように構成される。
【0011】
本開示の一側面によれば、第一の特徴に関する情報粒度の粗い第一のデータセットを、第二の特徴に関する情報粒度の細かい第二のデータセットと共に用いることにより、更には、第一の特徴量と第三の特徴量との関係、及び、第二の特徴量と第三の特徴量との関係を用いることにより、第一の特徴に関する情報粒度の細かい第三の特徴量を記述する第三のデータセットを生成することができる。従って、本開示の一側面によれば、取得可能な限られたデータから、集合に関する情報粒度の細かいデータを生成可能である。
【0012】
本開示の一側面によれば、第一のデータセットは、所定系列における複数の系列要素のそれぞれについての第一の特徴量を記述していてもよい。第二のデータセットは、所定系列における複数の系列要素のそれぞれについての第二の特徴量を記述していてもよい。
【0013】
本開示の一側面によれば、生成部は、第一のデータセット及び第二のデータセットに基づき、所定系列における少なくとも一つの系列要素についてのセグメント毎の第三の特徴量を推定してもよい。所定系列の例には、時系列、及び、場所に関する系列が含まれ得る。
【0014】
本開示の一側面によれば、生成部は、所定系列における複数の系列要素のそれぞれについてのセグメント毎の第三の特徴量を推定してもよい。
【0015】
本開示の一側面によれば、第一の制約条件及び第二の制約条件の少なくとも一方は、第三の特徴量の系列要素間の相違に関する制約条件を含んでもよい。
【0016】
第一の系列要素における第三の特徴量は、第一の系列要素と第二の系列要素との間の物理的な又は概念的な近さに応じて、第二の系列要素における第三の特徴量に近い値を示す傾向がある。従って、第三の特徴量の系列要素間の相違に関する制約条件を考慮した推定によれば、信頼度の高い第三の特徴量を推定することが可能である。
【0017】
本開示の一側面によれば、第一の制約条件は、複数の系列要素のそれぞれに関して、対応する系列要素におけるセグメント毎の第三の特徴量の和が、対応する系列要素におけるセグメント全体の第一の特徴量に対応するという制約条件を含んでもよい。こうした制約条件を用いた推定によれば、信頼度の高い第三の特徴量を推定することが可能である。
【0018】
本開示の一側面によれば、第一のデータセットは、第一の特徴量を時系列で記述してもよい。第二のデータセットは、第二の特徴量を時系列で記述してもよい。生成部は、第一のデータセット及び第二のデータセットに基づき、少なくとも一つの時点でのセグメント毎の第三の特徴量を推定してもよい。
【0019】
本開示の一側面によれば、生成部は、複数の時点でのセグメント毎の第三の特徴量を推定してもよい。第一の制約条件及び第二の制約条件の少なくとも一方は、第三の特徴量の時間変化に関する制約条件を含んでもよい。起こり得る特徴量の時間変化を考慮して制約条件を定義すれば、信頼度の高い第三の特徴量を推定することが可能である。
【0020】
本開示の一側面によれば、生成部は、複数の時点でのセグメント毎の第三の特徴量を推定し得る。第二の制約条件は、複数の時点のそれぞれに関し、対応する時点での第三の特徴量が、対応する時点より前の時点での第三の特徴量、及び、対応する時点での第二の特徴量に所定の関係で依存するという制約条件を含んでもよい。こうした制約条件に基づいた第三の特徴量の推定によれば、ある時点の状態が前の時点での状態の影響を受ける状態の特徴に関して、信頼度の高い第三の特徴量を推定することが可能である。
【0021】
本開示の一側面によれば、生成部は、複数の時点でのセグメント毎の第三の特徴量を推定してもよい。第一の制約条件は、複数の時点のそれぞれに関して、対応する時点でのセグメント毎の第三の特徴量の和が、対応する時点でのセグメント全体の第一の特徴量に対応するという制約条件を含んでもよい。
【0022】
本開示の一側面によれば、第一のデータセットは、第一の特徴量のそれぞれを対応する場所と関連付けて記述し、第二のデータセットは、第二の特徴量のそれぞれを対応する場所と関連付けて記述してもよい。生成部は、第一のデータセット及び第二のデータセットに基づいて、少なくとも一つの場所でのセグメント毎の第三の特徴量を推定してもよい。
【0023】
本開示の一側面によれば、第三のデータセットは、複数の場所におけるセグメント毎の第三の特徴量を記述してもよい。生成部は、第一の制約条件及び第二の制約条件に加えて、複数の場所間における第三の特徴量の相違に関する第三の制約条件の下で、第一のデータセット及び第二のデータセットに基づき、複数のセグメントのそれぞれの第三の特徴量を推定してもよい。
【0024】
第一の場所における第三の特徴量は、第一の場所と第二の場所との間の物理的な近さに応じて、第二の場所における第三の特徴量に近い値を示す傾向がある。従って、第三の特徴量の場所間の相違に関する制約条件を考慮した推定によれば、信頼度の高い第三の特徴量を推定することが可能である。
【0025】
本開示の一側面によれば、第一のデータセットは、地域毎に、第一の特徴量として、対応する地域内の人の行動特性に関する特徴量を表してもよい。第二のデータセットは、地域よりも小さい区域毎に、第二の特徴量として、対応する区域の地理特性に関する特徴量を表してもよい。生成部は、第一のデータセット及び第二のデータセットに基づき、セグメントとしての区域毎に、第三の特徴量として、対応する区域内の人の行動特性に関する特徴量を推定してもよい。
【0026】
人の行動特性と、対応する区域の地理特性との間に相関があるケースでは、こうした推定によって、第一のデータセットよりも情報粒度の細かい、小さな区域毎の特徴量を推定することが可能である。
【0027】
本開示の一側面によれば、第一のデータセットは、第一の期間毎に、第一の特徴量として、対応する第一の期間内の人の行動特性に関する特徴量を表してもよい。第二のデータセットは、第一の期間よりも短い第二の期間毎に、第二の特徴量として、対応する第二の期間の地理特性に関する特徴量を表してもよい。生成部は、第一のデータセット及び第二のデータセットに基づき、セグメントとしての第二の期間毎に、第三の特徴量として、対応する第二の期間内の行動特性に関する特徴量を推定してもよい。
【0028】
人の行動特性と、対応する期間の地理特性との間に相関があるケースでは、こうした推定によって、第一のデータセットよりも情報粒度の細かい、短い期間毎の特徴量を推定することが可能である。
【0029】
本開示の一側面によれば、第一の制約条件及び第二の制約条件の少なくとも一方は、第三の特徴量のばらつきに関する誤差項を含んでもよい。
【0030】
本開示の一側面によれば、生成部は、第一の特徴量及び第二の特徴量から第三の特徴量を推定するための第一の制約条件及び第二の制約条件に従う推定モデルの設計パラメータの適値を、第一のデータセット及び第二のデータセットに基づき、ばらつきに関する確率分布を考慮した統計分析により探索し、設計パラメータの適値に対応する推定モデルに従う第三の特徴量を推定してもよい。
【0031】
確率分布を考慮した統計分析によれば、限られたデータから、第三の特徴量として尤もらしい特徴量を推定することが可能である。統計分析による探索の例には、ベイズ推定を用いて観測データからパラメータを推定する例が含まれる。
【0032】
本開示の一側面によれば、上述したデータ生成システムにおける取得部及び生成部としてコンピュータを機能させるためのコンピュータプログラムが提供されてもよい。コンピュータプログラムは、コンピュータ読取可能な一時的でない記録媒体に記録され得る。
【0033】
本開示の一側面によれば、上述したデータ生成システムに対応するデータ生成方法が提供されてもよい。
【0034】
本開示の一側面によれば、第一のデータセットであって、第一の集合に関する第一の特徴を第一の粒度で表現した第一の集合内の第一の粒度に対応する単一の要素群についての又は複数の要素群のそれぞれについての第一の特徴量を記述する第一のデータセット、及び、第二のデータセットであって、第一の集合と同じ第二の集合に関する第一の特徴とは異なる第二の特徴又は第一の集合より小さい第二の集合に関する第一の特徴と同じ若しくは異なる第二の特徴を第一の粒度より細かい第二の粒度で表現した第二の集合内の第二の粒度に対応する一以上の要素毎の第二の特徴量を記述する第二のデータセットを取得することと、第一のデータセットと、第二のデータセットと、に基づいて、第一の集合に関する第一の特徴を第一の粒度より細かく第二の粒度より粗い又は第二の粒度と同じ第三の粒度で表現した第一の集合内の第三の粒度に対応するセグメント毎の第三の特徴量を記述する第三のデータセットを生成することと、を含むデータ生成方法が提供され得る。データ生成方法は、コンピュータにより実行され得る。
【0035】
このデータ生成方法において、生成することは、第一の特徴量と第三の特徴量との関係に基づいた第三の特徴量の推定に関する第一の制約条件、及び、第二の特徴量と第三の特徴量との関係に基づいた第三の特徴量の推定に関する第二の制約条件の下で、第一のデータセット及び第二のデータセットに基づき、セグメント毎の第三の特徴量を推定し、第三のデータセットを生成することを含み得る。
【図面の簡単な説明】
【0036】
図1】データ生成システムの構成を表すブロック図である。
図2】プロセッサが実行するデータ生成処理のフローチャートである。
図3】第一実施形態の第一、第二、及び第三データセットを説明する図である。
図4】第二実施形態の第一、第二、及び第三データセットを説明する図である。
図5】第三実施形態の第一、第二、及び第三データセットを説明する図である。
図6】第四実施形態の第一、第二、及び第三データセットを説明する図である。
図7】第五実施形態の第一、第二、及び第三データセットを説明する図である。
図8】第六実施形態の第一、第二、及び第三データセットを説明する図である。
図9】第七実施形態の第一、第二、及び第三データセットを説明する図である。
図10】第八実施形態の第一、第二、及び第三データセットを説明する図である。
図11】第九実施形態の第一、第二、及び第三データセットを説明する図である。
図12】第十実施形態の第一、第二、及び第三データセットを説明する図である。
【発明を実施するための形態】
【0037】
以下に本開示の例示的実施形態を、図面を参照しながら説明する。
説明されるいくつかの実施形態に係るデータ生成システム1は、分析対象の第一集合に関する第一の特徴を説明する情報粒度の粗い第一データセットと、分析対象の第一集合より小さい第二集合に関する第二の特徴を説明する情報粒度の細かい第二データセットと、に基づいて、分析対象の第一集合の第一の特徴を第一データセットよりも細かい情報粒度で説明した第三データセットを生成するように構成される。
【0038】
第二集合は、分析対象の第一集合の部分集合、又は、分析目的に照らして、その部分集合と等価な、第一集合よりも小さいサイズの別の集合であり得る。別の集合の例には、多くの要素が第一集合に属するが、一部の要素が第一集合に属さない集合が含まれる。第二の特徴は、第一の特徴と同じ特徴、又は、第一の特徴に関連する別の特徴であり得る。
【0039】
更に説明されるいくつかの別の実施形態に係るデータ生成システム1は、分析対象の集合に関する第一の特徴を説明する情報粒度の粗い第一データセットと、分析対象の集合に関する第一の特徴とは異なる第二の特徴を説明する情報粒度の細かい第二データセットと、に基づいて、分析対象の集合の第一の特徴を第一データセットよりも細かい情報粒度で説明した第三データセットを生成するように構成される。
【0040】
例示的なデータ生成システム1は、汎用の情報処理システムに、第三データセットを生成するためのコンピュータプログラムがインストールされて構成される。以下に説明する第一実施形態から第十実施形態では、第一データセット、第二データセット、及び第三データセットの構成、及び、第三データセットの生成に係る処理内容を、具体例を挙げて説明する。図1を用いて説明される第一実施形態のデータ生成システム1のハードウェア構成は、その他の実施形態のデータ生成システム1に対しても適用される。
【0041】
[第一実施形態]
本実施形態のデータ生成システム1は、図1に示すように、プロセッサ11と、メモリ12と、ストレージ13と、ディスプレイ15と、入力デバイス17と、メディアリーダ/ライタ18と、通信デバイス19と、を備える。
【0042】
プロセッサ11は、ストレージ13が記憶するコンピュータプログラムに従う処理を実行する。メモリ12は、RAMを含み、プロセッサ11がコンピュータプログラムに従う処理を実行する際に、作業領域として使用される。メモリ12は、ストレージ13から読み出されたコンピュータプログラムを一時記憶する。
【0043】
ストレージ13は、コンピュータプログラム及び各種データを格納する。ストレージ13に格納されるコンピュータプログラムの一つには、第三データセットを生成するためのコンピュータプログラムが含まれる。ストレージ13の例には、ハードディスクドライブ及びソリッドステートドライブが含まれる。
【0044】
ディスプレイ15は、例えば液晶ディスプレイであり、ユーザに向けて各種情報を表示するように構成される。入力デバイス17は、ユーザが操作可能なキーボード及びポインティングデバイスを備え、ユーザからの操作信号をプロセッサ11に入力するように構成される。
【0045】
メディアリーダ/ライタ18は、メモリカードなどの記録メディアに記録された情報を読取可能、及び、記録メディアに新規情報を書込可能に構成される。通信デバイス19は、プロセッサ11により制御されて、ローカルエリアネットワーク内の、及び/又は、広域ネットワーク内の外部装置と通信するように構成される。
【0046】
プロセッサ11は、入力デバイス17を通じてユーザからデータ生成処理の実行指令が入力されると、コンピュータプログラムに従って、第三データセットを生成するための図2に示すデータ生成処理を開始する。
【0047】
プロセッサ11は、このデータ生成処理の実行によって、特定商品カテゴリの市場全体の売上を説明する第一データセットDS11と、特定消費者群の消費者属性別の購買量を説明する第二データセットDS12と、に基づき、特定商品カテゴリの市場全体における消費者属性別の売上を説明する第三データセットDS13を生成する。
【0048】
消費者属性の例には、消費者のデモグラフィック属性が含まれる。消費者属性別の購買量及び売上の例には、性年齢階級別の購買量及び売上が含まれる。ここでいう性年齢階級は、10代男性、10代女性、20代男性、20代女性、30代男性、及び30代女性を例に含む、性及び年齢階級の組合せによって定義される消費者のデモグラフィック属性である。購買量の例には、購買金額及び購買個数が含まれる。
【0049】
データ生成処理を開始すると、プロセッサ11は、入力デバイス17を通じてユーザから指定された第一データセットDS11及び第二データセットDS12を取得する(S110,S120)。プロセッサ11は、例えば、ストレージ13から、又はメディアリーダ/ライタ18を介して記録メディアから、又は通信デバイス19を介して外部装置から、第一データセットDS11及び第二データセットDS12を取得することができる。
【0050】
本実施形態において取得される第一データセットDS11は、具体的には、特定商品カテゴリの市場全体の売上を日毎に集計した、市場売上に関する時系列データセットである。市場全体の売上は、消費者全体の購買量に対応する。
【0051】
例示的な第一データセットDS11は、図3に示すように、日毎に、対応する日の市場全体の売上が日付と共に記述されたレコードを有する。プロセッサ11は、S110において、集計前のデータセットを取得し、取得したデータセットから、図3に示す集計後の第一データセットDS11を生成してもよい。
【0052】
本実施形態において取得される第二データセットDS12は、消費者全体のうち、購買履歴の収集に協力的な特定消費者群の購買履歴に基づき生成される。購買履歴は、モニタ調査により収集され得る。
【0053】
第二データセットDS12は、具体的には、特定消費者群の特定商品カテゴリに関する購買量を、消費者属性別及び日毎に集計したデータであり、消費者属性別(例えば性年齢階級別)の購買量に関する時系列データである。
【0054】
例示的な第二データセットDS12は、図3に示すように、日及び消費者属性の組合せ毎に、対応する日の対応する消費者属性を有する消費者群の購買量が、日付及び消費者属性情報と共に記述されたレコードを有する。プロセッサ11は、S120において、集計前のデータセットを取得し、取得したデータセットから、図3に示す集計後の第二データセットDS12を生成してもよい。
【0055】
プロセッサ11は、取得した第一データセットDS11及び第二データセットDS12に基づく分析処理を実行することにより、第三データセットDS13を生成する(S130)。
【0056】
本実施形態において生成される第三データセットDS13は、特定消費者群に限られない消費者全体に関して、特定商品カテゴリの消費者属性別及び日毎の売上の推定値を記述したデータである。すなわち、第三データセットDS13は、消費者属性別の市場売上に関する時系列データである。
【0057】
例示的な第三データセットDS13は、図3に示すように、日及び消費者属性の組合せ毎に、市場全体における対応する日の対応する消費者属性を有する消費者群の売上の推定値が、日付及び消費者属性情報と共に記述されたレコードを有する。
【0058】
プロセッサ11は、S130で生成された第三データセットDS13を、入力デバイス17を通じてユーザから指定された出力先に出力する(S140)。例えば、プロセッサ11は、ストレージ13に、又はメディアリーダ/ライタ18を介して記録メディアに、又は通信デバイス19を介して外部装置に出力することができる。プロセッサ11は、ディスプレイ15に第三データセットDS13を表示出力させてもよい。その後、プロセッサ11は、図2に示すデータ生成処理を終了する。
【0059】
続いて、分析処理(S130)の詳細を説明する。分析処理では、ベイズ統計を用いて第三データセットDS13を生成する。本実施形態によれば、分析処理は、マルコフ連鎖モンテカルロ(MCMC)法を用いたパラメータ推定処理を含む。
【0060】
処理の詳細を、式を用いて説明するために、第一データセットDS11における日毎の売上に対して変数yを割り当てる。tは、日を単位とする時点のインデックスである。すなわち、yは、時点tに対応する日の売上を表す。
【0061】
第二データセットDS12における日及び消費者属性毎の購買量に対しては、変数xmtを割り当てる。mは、消費者属性のインデックスである。すなわち、xmtは、時点tに対応する日の、対応する消費者属性mを有する消費者群の購買量を表す。
【0062】
第三データセットDS13における日及び消費者属性毎の売上に対しては、変数umtを割り当てる。すなわち、umtは、時点tに対応する日の、対応する消費者属性mを有する消費者群の売上を表す。
【0063】
本実施形態では、次の制約条件を置いてパラメータ推定処理を実行する。
<第一の制約条件>
時点tにおける消費者属性別の売上umtの合計Σumtは、同時点tの売上yを基準とした誤差範囲内にある。
【0064】
<第二の制約条件>
時点t及び消費者属性mの売上umtは、一つ前(すなわち前日)の時点t-1における消費者属性mの売上umt-1、及び、時点tにおける消費者属性mの購買量xmtと、線形関係がある。この制約条件は、売上umtの時間変化に関する制約条件を含む。
【0065】
上記第一及び第二の制約条件に従うパラメータ推定のために、次式(1)(2)に従うシミュレーションモデルを置くことができる。但し、消費者属性のインデックスmは、値1から値Mまでを採る。
【0066】
【数1】
【0067】
式(2)によれば、umtは次のように定義される。
【0068】
【数2】
【0069】
式(1)における誤差項εは、中心0及び分散σの正規分布N(0,σ)に従う確率分布を示す。式(2)(3)におけるumtのばらつきに関する誤差項emtは、中心0及び分散ψの正規分布N(0,ψ)に従う確率分布を示す。
【0070】
このモデルによれば、推定対象のパラメータは、umt,α,ρ,β,σ,ψである。MCMCによるパラメータ推定に際しては、予めumt,α,ρ,β,σ,ψに対し、次のように事前確率分布(以下、単に「事前分布」と表現する。)を設定することができる。
【0071】
<α,ρ,β,σ,ψの事前分布>
実質無情報事前分布となるように設計した共役事前分布を設定する。例えば、α,ρ,βについて、分散の大きい正規分布を設定し、σ,ψについて、母数を1に調整した逆ガンマ分布を設定する。
【0072】
<umtの事前分布>
モデルに従う次の事前分布(正規分布)を設定する。
【0073】
【数3】
【0074】
MCMCによるパラメータ推定には、例えば、ギブスサンプリングの手法が適用され得る。このパラメータ推定によれば、確率分布を考慮した統計分析により設計パラメータとしてのα,ρ,β,σ,ψの適値探索と同時に、尤もらしいumtが探索される。この探索(ベイズ推定)により、umtの事後確率分布(以下、単に「事後分布」と表現する。)が得られる。
【0075】
プロセッサ11は、umtの推定値として、umtの事後分布についての事後平均又は中央値を算出し、各日の消費者属性別の売上umtの推定値を記述した第三データセットDS13を生成することができる。
【0076】
式(2)は、時間に関する任意の次数Kを有する次式(5)に一般化することができる。次数Kは、1以上の整数値であり得る。
【0077】
【数4】
【0078】
この場合、umtの事前分布を次式(6)のように設定して、パラメータ推定を行うことができる。
【0079】
【数5】
【0080】
本実施形態によれば、上述した「分析対象の第一集合」は、消費者全体に対応し、「第二集合」は、特定消費者群に対応し、「第一の特徴」は、売上に対応し、「第二の特徴」は、購買量に対応する。
【0081】
このデータ生成システム1によれば、次の効果が得られる。すなわち、分析対象の集合の特徴を説明するデータセットとして情報粒度の粗いデータセットしか得られないときに、分析対象の集合よりも小さい集合の特徴を説明する情報粒度の細かいデータセットを根拠に、分析対象の集合の特徴を説明する情報粒度の細かいデータセットであって、統計学的見地から信頼性の高いデータセットを生成することができる。
【0082】
例えば、消費者全体における消費者属性別の売上を説明するデータセットが得られないときに、モニタ調査により得られる特定消費者群の購買履歴に基づいて、消費者全体に関する情報粒度の細かい消費者属性別の売上を説明するデータセットを生成することができる。
【0083】
本実施形態では特に、ベイズ統計を用いて、更には、式(2)(3)から理解できるように時系列の情報を用いて、売上umtの推定値を算出するので、推定値の信頼性が高い。
【0084】
比較例としては、特定消費者群の集計値を、特定消費者群と市場全体の消費者集合との間のサイズ比に従う係数で補正する例が考えられる。しかしながら、この比較例は、特定消費者群における属性分布が市場全体の属性分布と同じであるという仮定を含む。
【0085】
比較例の仮定は、通常、真実と大きく異なる。このため、比較例では、情報粒度の細かいデータセットを生成しても、その信頼性が低い。これに対して、ベイズ統計を用いる本実施形態によれば、従来よりも情報粒度の細かい信頼度の高いデータセットを生成することができる。
【0086】
本実施形態に関しては、様々な変形例が考えられる。例えば、第三データセットDS13は、第二データセットDS12と同じ消費者属性の区分毎に売上を説明しなくてもよい。すなわち、第三データセットDS13は、二つ以上の消費者属性をまとめた属性グループ毎に売上を説明するデータセットであってもよい。属性グループ毎の売上の推定値は、グループに属する消費者属性毎の売上の推定値の和で算出され得る。
【0087】
例えば、第二データセットDS12が、性年齢階級別の購買量を説明しているとき、第三データセットDS13は、性別を問わない年齢階級別の売上を説明するデータセットとして生成されてもよい。
【0088】
第三データセットDS13は、第二データセットDS12と同じ又はそれより大きい粒度のセグメント毎に売上を説明するデータであり得る。セグメントは、第二データセットDS12と同じ区分で又は第二データセットDS12よりも粗い区分で、且つ、第一データセットDS11よりも細かい区分で集合を分類して定義され得る。
【0089】
この他、本実施形態では、市場全体のセグメント別の売上を推定して、第三データセットDS13を生成したが、市場全体に代えて、注目する一つ又は複数の小売業者におけるセグメント別の売上を推定するために、本実施形態の技術的思想が使用されてもよい。
【0090】
この場合、第一データセットDS11は、一つ又は複数の小売業者の売上を日毎に説明するデータセットであり得る。第二データセットDS12は、一つ又は複数の小売業者の顧客群のうちの一部に対応する特定消費者群について、日及び消費者属性の組み合わせ毎に、購買量を説明するデータセットであり得る。
【0091】
第三データセットDS13は、一つ又は複数の小売業者の、消費者属性別の売上を日毎に説明するデータセットであり得る。更に言えば、第二データセットDS12は、第一データセットDS11に対応する消費者集合とは完全には重ならない別の消費者群の購買履歴に基づいて作成されたデータセットであってもよい。
【0092】
[第二実施形態]
続いて、第二実施形態のデータ生成システム1を説明する。上述した通り、第二実施形態以降のデータ生成システム1のハードウェア構成は、第一実施形態のデータ生成システム1と同じである。第二実施形態以降では、取り扱うデータセットが第一実施形態と異なる。第二実施形態において、プロセッサ11は、実行指令が入力されると、第一実施形態と同様に図2に示すデータ生成処理を開始する。
【0093】
プロセッサ11は、このデータ生成処理の実行により、市場における特定商品カテゴリの売上に関する第一データセットDS21と、限られた一以上の小売業者の売上記録に基づく特定商品カテゴリの商品別の売上に関する第二データセットDS22と、に基づいて、市場における特定商品カテゴリの売上を商品別に説明する第三データセットDS23を生成するように構成される。
【0094】
データ生成処理を開始すると、プロセッサ11は、入力デバイス17を通じてユーザから指定された第一データセットDS21及び第二データセットDS22を取得する(S110,S120)。
【0095】
本実施形態において取得される第一データセットDS21は、市場における特定商品カテゴリの売上を日毎に集計した、市場売上に関する時系列データセットである。例示的な第一データセットDS21は、図4に示すように、日毎に、市場における、対応する日の特定商品カテゴリの売上が日付と共に記述されたレコードを有する。
【0096】
第二データセットDS22は、限られた一以上の小売業者のPOSシステムに蓄積された売上記録に基づき、特定商品カテゴリにおける商品別の売上を、日毎に集計したデータであり、商品別の売上を説明する時系列データである。以下、この売上のことをPOS売上と称する。例えば、特定商品カテゴリが「ビール」であるとき、商品別の売上は、ビールの銘柄別の売上に対応する。
【0097】
例示的な第二データセットDS22は、図4に示すように、日及び商品の組合せ毎に、対応する日の対応する商品のPOS売上が日付及び商品情報と共に記述されたレコードを有する。
【0098】
プロセッサ11は、取得したこれら第一データセットDS21及び第二データセットDS22に基づく分析処理を実行することにより、第三データセットDS23を生成し(S130)、生成した第三データセットDS23を出力する(S140)。
【0099】
本実施形態において生成される第三データセットDS23は、特定商品カテゴリの商品別の市場売上を説明する時系列データである。例示的な第三データセットDS23は、図4に示すように、日及び商品の組合せ毎に、市場における、対応する日の対応する商品の売上の推定値が日付及び商品情報と共に記述されたレコードを有する。
【0100】
続いて、分析処理(S130)の詳細を説明する。この説明のために、第一データセットDS21における日毎の売上に対しては、変数yを割り当てる。tは、第一実施形態と同様に、日に対応する時点のインデックスであり、yは、時点tに対応する日の特定商品カテゴリの市場売上を表す。
【0101】
第二データセットDS22における日及び商品毎のPOS売上に対しては、変数xmtを割り当てる。mは、商品のインデックスである。すなわち、xmtは、時点tに対応する日の、対応する商品mのPOS売上を表す。
【0102】
更に、第三データセットDS23における日及び商品毎の売上に対しては、変数umtを割り当てる。すなわち、umtは、時点tに対応する日の、対応する商品mの市場売上を表す。
【0103】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
時点tにおける商品別の売上umtの合計Σumtは、同時点tの売上yを基準とした誤差範囲内にある。
【0104】
<第二の制約条件>
時点tにおける商品mの売上umtは、一つ前(すなわち前日)の時点t-1における商品mの売上umt-1、及び、時点tにおける商品mのPOS売上xmtと、線形関係がある。
【0105】
第一及び第二の制約条件の第一実施形態との類似性から理解できるように、本実施形態によれば、上述の式(1)(2)に従うモデルを定義し、第一実施形態と同様に事前分布を設定して、MCMCによるパラメータ推定により、umtの事後分布を求めることができる。
【0106】
プロセッサ11は、求めたumtの事後分布に基づいて、市場における日毎の商品別の売上umtの推定値を記述した第三データセットDS23を生成することができる。第三データセットDS23は、特定商品カテゴリ内の二つ以上の商品をまとめたセグメント毎に売上を説明するデータセットとして生成されてもよい。
【0107】
本実施形態によれば、上述した「分析対象の第一集合」は、市場における商取引の集合に対応し、「第二集合」は、一つ又は複数の小売業者のPOSシステムに記録される商取引の集合に対応し、「第一の特徴」は、売上に対応し、「第二の特徴」は、POS売上に対応する。
【0108】
[第三実施形態]
第三実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において利用者全体の路線利用状況に関する図5に示す第一データセットDS31を取得する。更に、S120において特定利用者群の利用者属性別の路線利用状況に関する第二データセットDS32を取得する。利用者属性別の路線利用状況は、例えば、性年齢階級別の路線利用状況であり得る。
【0109】
プロセッサ11は、取得した第一データセットDS31及び第二データセットDS32に基づいて、利用者全体における利用者属性別の路線利用状況を説明する第三データセットDS33を生成及び出力する(S130,S140)。
【0110】
本実施形態において取得される第一データセットDS31は、具体的には、利用者全体の各路線における利用量(例えば利用時間)を日毎に集計した時系列データセットである。例示的な第一データセットDS31は、図5に示すように、日及び路線毎に、対応する日における対応する路線の利用者全体の利用量(例えば利用時間合計)が、日付及び路線情報と共に記述されたレコードを有する。
【0111】
第二データセットDS32は、特定利用者群の各路線における利用量を日毎及び利用者属性別に集計した時系列データセットである。特定利用者群は、利用者全体のうち、利用履歴の収集に協力的な利用者群であり得る。
【0112】
例示的な第二データセットDS32は、図5に示すように、日、路線、及び利用者属性の組合せ毎に、対応する日の対応する利用者属性を有する利用者群の、対応する路線の利用量が、日付、路線情報、及び利用者属性情報と共に記述されたレコードを有する。
【0113】
第三データセットDS33は、利用者全体の各路線における日毎及び利用者属性別の利用量の推定値を記述した時系列データセットである。例示的な第三データセットDS33は、図5に示すように、日、路線、及び利用者属性の組合せ毎に、対応する日の対応する利用者属性を有する利用者群の、対応する路線の利用量の推定値が、日付、路線情報、及び利用者属性情報と共に記述されたレコードを有する。
【0114】
ここで、第一データセットDS31における日及び路線の組合せ毎の利用量に対して変数yntを割り当てる。nは、路線のインデックスである。すなわち、yntは、時点tに対応する日の利用者全体の路線nの利用量を表す。
【0115】
第二データセットDS32における日、路線、及び利用者属性の組合せ毎の利用量に対しては、変数xnmtを割り当てる。mは、利用者属性のインデックスである。すなわち、xnmtは、時点tに対応する日の、対応する利用者属性mを有する利用者群の路線nの利用量を表す。
【0116】
第三データセットDS33における日、路線、及び利用者属性の組合せ毎の利用量に対しては、変数unmtを割り当てる。すなわち、unmtは、時点tに対応する日の、対応する利用者属性mを有する利用者群の路線nの利用量を表す。
【0117】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
時点tにおける利用者属性別の路線nの利用量unmtの合計Σunmtは、同時点tにおける利用者全体の路線nの利用量yntを基準とした誤差範囲内にある。更に、利用量yntがゼロより大きいとき、合計Σunmtもゼロより大きい。
【0118】
<第二の制約条件>
路線n及び利用者属性mの各組合せに関して、時点tにおける利用量unmtの一日前の時点t-1からの増加率unmt/unmt-1は、観測された利用量xnmtの増加率xnmt/xnmt-1を基準とした誤差範囲内にある。
【0119】
<第三の制約条件>
路線n及び利用者属性mの各組合せに関して、時点tにおける利用量unmtは、一週間前の時点t-7における利用量unmt-7を基準とした誤差範囲内にある。
【0120】
上記制約条件に従うパラメータ推定のためには、次式に従うシミュレーションモデルを置くことができる。誤差εnt,σ1,σ2は、それぞれ正規分布に従う。利用者属性のインデックスmは、値1から値Mまでを採る。
【0121】
【数6】
【0122】
プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、利用量unmtの事後分布を求め、日毎の路線及び利用者属性別の利用量unmtの推定値を記述した第三データセットDS33を生成することができる。第三データセットDS33は、二つ以上の利用者属性をまとめたセグメント毎に、日及び路線別の利用量を説明するデータセットとして生成されてもよい。
【0123】
本実施形態によれば、上述した「分析対象の第一集合」は、利用者全体の集合に対応し、「第二集合」は、特定利用者群の集合に対応し、「第一の特徴」及び「第二の特徴」は、利用量に対応する。
【0124】
[第四実施形態]
第四実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において特定地域におけるエリア毎の滞在者数を説明する図6に示す第一データセットDS41を取得する。エリアは、特定地域を例えばメッシュ状に区画化して定義される。
【0125】
プロセッサ11は更に、S120において特定調査対象者群に関するエリア別及び属性別の滞在者数を説明する第二データセットDS42を取得する。属性別の滞在者数は、例えば、特定調査対象者群の職種別の滞在者数であり得る。特定調査対象者群は、例えば街頭調査を受けた人の集合に対応する。
【0126】
プロセッサ11は、取得した第一データセットDS41及び第二データセットDS42に基づいて、特定地域におけるエリア別及び属性別の滞在者数を説明する第三データセットDS43を生成及び出力する(S130,S140)。
【0127】
図6に例示される第一データセットDS41は、エリア毎に、対応するエリアの滞在者数が、エリア情報と共に記述されたレコードを有する。第二データセットDS42は、エリア及び属性の組合せ毎に、対応するエリアにおける対応する属性を有する滞在者の数が、エリア情報及び属性情報と共に記述されたレコードを有する。第三データセットDS43は、エリア及び属性の組合せ毎に、対応するエリアにおける対応する属性を有する滞在者の数の推定値が、エリア情報及び属性情報と共に記述されたレコードを有する。
【0128】
ここで、第一データセットDS41におけるエリア毎の滞在者数に対して変数yを割り当てる。rは、エリアのインデックスである。すなわち、yは、エリアrの滞在者数を表す。
【0129】
第二データセットDS42におけるエリア及び属性の組合せ毎の滞在者数に対しては、変数xmrを割り当てる。mは、属性のインデックスである。すなわち、xmrは、エリアrにおける属性mを有する滞在者の数を表す。第三データセットDS43におけるエリア及び属性の組合せ毎の滞在者数に対しては、変数umrを割り当てる。すなわち、umrは、エリアrにおける属性mを有する滞在者の数を表す。
【0130】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
エリアrにおける属性別の滞在者数umrの合計である延べ滞在者数Σumrは、同エリアrの滞在者数yを基準とした誤差範囲内にある。
【0131】
<第二の制約条件>
エリアrにおける属性mを有する滞在者の割合umr/Σumrは、観測されたエリアrにおける属性mを有する滞在者の割合xmr/Σxmrを基準とした誤差範囲内にある。
【0132】
<第三の制約条件>
延べ滞在者数Σumrは、隣接するエリア間で緩やかに変化する。具体的には、第一のエリアr1における延べ滞在者数Σumr1と、第二のエリアr2における延べ滞在者数Σumr2との差|Σumr1-Σumr2|は、エリアr1,r2間の距離D(r1,r2)が大きくなるにつれて増加する閾値H=D(r1,r2)・H以下である。この制約条件は、複数の場所に対応するエリアr1,r2間の滞在者数umrの相違に関する制約条件である。
【0133】
上記制約条件に従うパラメータ推定のために、次式に従うシミュレーションモデルを置くことができる。但し、誤差ε,σrは、それぞれ正規分布に従う。
【0134】
【数7】
【0135】
プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、滞在者数umrの事後分布を求め、各エリアの属性別の滞在者数umrの推定値を記述した第三データセットDS43を生成することができる。第三データセットDS43は、各エリアについて、二つ以上の属性をまとめたセグメント毎に滞在者数を説明するデータセットとして生成されてもよい。
【0136】
本実施形態によれば、エリアr1,r2間の滞在者数umrの相違に関する制約条件を用いて、各エリアの属性別の滞在者数umrを推定するので、現実の傾向に沿って、信頼度の高い滞在者数umrの推定値を求めることができる。
【0137】
本実施形態によれば、上述した「分析対象の第一集合」は、特定地域内の滞在者全体の集合に対応し、「第二集合」は、特定調査対象者群の集合に対応し、「第一の特徴」及び「第二の特徴」は、滞在者数に対応する。
【0138】
[第五実施形態]
第五実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において、特定地域における移動元エリア及び移動先エリアの組合せ毎の移動者数、並びに、移動元エリア毎の滞在者数を説明する図7に示す第一データセットDS51を取得する。エリアは、第四実施形態と同様に、特定地域を例えばメッシュ状に区画化して定義される。移動先エリアは、移動元エリアに隣接するエリアに限定され得る。
【0139】
プロセッサ11は更に、S120において、特定調査対象者群の移動人数に関する第二データセットDS52であって、特定地域における移動元エリア及び移動先エリアの組合せ毎の移動者数を、特定商品の購入有無別に説明する図7に示す第二データセットDS52を取得する。以下では、特定商品の購入有無のことを、購入属性と表現する。
【0140】
プロセッサ11は、取得した第一データセットDS51及び第二データセットDS52に基づいて、特定地域における移動元エリア及び移動先エリアの組合せ別、及び、購入属性別の移動者数を説明する第三データセットDS53を生成及び出力する(S130,S140)。
【0141】
ここで、第一データセットDS51における移動元エリア及び移動先エリアの組合せ毎の移動者数に対して変数yr1→r2を割り当てる。r1は、移動元エリアのインデックスであり、r2は、移動先エリアのインデックスである。すなわち、yr1→r2は、移動元エリアr1から移動先エリアr2への移動者数を表す。更に、第一データセットDS51における移動元エリアr1の滞在者数に対して変数zr1を割り当てる。
【0142】
第二データセットDS52における移動元エリア及び移動先エリアの組合せ毎の購入属性別の移動者数に対しては、xmr1→r2を割り当てる。mは、購入属性のインデックスである。mは、例えば、特定商品の購入があるときに、値1をとり、特定商品の購入がないときに、値2をとる。
【0143】
例えば、購入属性m=1であるとき、xmr1→r2は、移動元エリアr1から移動先エリアr2の移動者のうち、特定商品を購入した者の人数を表す。購入属性m=2であるとき、xmr1→r2は、移動元エリアr1から移動先エリアr2の移動者のうち、特定商品を購入していない者の人数を表す。
【0144】
更に、第三データセットDS53における移動元エリア及び移動先エリアの組合せ毎の購入属性別の移動者数に対しては、umr1→r2を割り当てる。umr1→r2におけるインデックスの解釈は、xmr1→r2と同様である。
【0145】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
移動元エリアr1から移動先エリアr2への購入属性別の移動者数umr1→r2の合計である延べ移動者数Σumr1→r2は、観測された移動元エリアr1から移動先エリアr2への移動者数yr1→r2を基準とした誤差範囲内にある。
【0146】
<第二の制約条件>
移動元エリアr1から移動先エリアr2への移動者数に関して、購入属性mを有する移動者数の割合umr1→r2/Σumr1→r2は、観測された移動者数の割合xmr1→r2/Σxmr1→r2を基準とした誤差範囲内にある。
【0147】
<第三の制約条件>
移動元エリアr1の滞在者数zr1は、0未満にはならない。
【0148】
上記制約条件に従うパラメータ推定のために、次式に従うシミュレーションモデルを置くことができる。但し、誤差εr1→r2,σr1→r2は、それぞれ正規分布に従う。
【0149】
【数8】
【0150】
プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、移動者数umr1→r2の事後分布を求め、移動元エリア及び移動先エリアの組合せ毎に、購入属性別の移動者数umr1→r2の推定値を記述した第三データセットDS53を生成することができる。
【0151】
本実施形態によれば、上述した「分析対象の第一集合」は、特定地域における人の集合に対応し、「第二集合」は、特定調査対象者群の集合に対応し、「第一の特徴」及び「第二の特徴」は、移動者数に対応する。変形例として「購入属性」とは別の「属性」が用いられてもよい。例えば、第二データセットDS52及び第三データセットDS53は、デモグラフィック属性別(例えば性年齢階級別)の移動者数を説明するデータセットであってもよい。
【0152】
[第六実施形態]
第六実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において、図8に示す第一データセットDS61を取得する。この第一データセットDS61は、日毎に、日本人及び外国人を含む消費者群に対する特定商品の売上を表すレコードを有する。更に、第一データセットDS61は、年毎に、外国人に対する特定商品の年間売上を表すレコードを有する。更に、第一データセットDS61は、日毎に、特定商品を購入した外国人数を表すレコードを有する。
【0153】
プロセッサ11は更に、S120において、日本人から選ばれた特定消費者群の購買量に関する図8に示す第二データセットDS62を取得する。第二データセットDS62は、特定消費者群について、日毎及び消費者属性毎に、購買量を表すレコードを有する。消費者属性毎の購買量は、例えば、性年齢階級別の購買量であり得る。購買量は、購買金額であり得る。
【0154】
プロセッサ11は、取得した第一データセットDS61及び第二データセットDS62に基づいて、図8に示す日本人に関する日毎の消費者属性別の売上を説明する第三データセットDS63を生成及び出力する(S130,S140)。
【0155】
本実施形態によれば、プロセッサ11は、S130の分析処理において、まず、第一データセットDS61を整理して、日本人の消費者群に対する特定商品の日毎の売上を算出する。具体的には、日毎の売上から外国人の日別売上を引いて、日本人の日別売上を算出する。外国人の日別売上は、外国人の年間売上を、日別人数に比例した割合で、各日に割り振ることにより算出される。
【0156】
プロセッサ11は、第一データセットDS61から導出した日本人の消費者群に対する特定商品の日毎の売上と、第二データセットDS62と、に基づいて、第三データセットDS63を生成する。
【0157】
ここで、第一データセットDS61から導出された日本人の消費者群に対する特定商品の日毎の売上に対して変数yを割り当てる。tは、日に対応する時点のインデックスである。
【0158】
第二データセットDS62における日及び消費者属性毎の購買量に対しては、変数xmtを割り当てる。mは、消費者属性のインデックスである。第三データセットDS63における日及び消費者属性毎の売上に対しては、変数umtを割り当てる。
【0159】
本実施形態では、S130において第一実施形態と同様の手法でumtの事後分布を求め、日本人の消費者群に関して、日毎及び消費者属性別の売上umtの推定値を記述した第三データセットDS63を生成することができる。第三データセットDS63は、日毎に、二つ以上の消費者属性をまとめたセグメント別の売上を説明するデータセットとして生成されてもよい。
【0160】
本実施形態によれば、上述した「分析対象の第一集合」は、消費者全体の集合に対応し、「第二集合」は、特定消費者群の集合に対応し、「第一の特徴」は、売上に対応し、「第二の特徴」は、購買量に対応する。
【0161】
[第七実施形態]
第七実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において、図9に示す第一データセットDS71を取得する。この第一データセットDS71は、市場における特定商品カテゴリに属する商品群の売上ランキングを表す。具体的に、第一データセットDS71は、市場における売上順位毎に、対応する商品の売上金額を表すレコードを有する。
【0162】
プロセッサ11は更に、S120において、図9に示される特定消費者群の購買に関する第二データセットDS72を取得する。この第二データセットDS72は、特定消費者群における、特定商品カテゴリに属する商品群の購買金額ランキングを表す。具体的に、第二データセットDS72は、購買順位毎に、対応する商品の特定消費者群による消費者属性別の購買金額を表す。消費者属性別の購買金額は、年齢階級別の購買金額であり得る。
【0163】
プロセッサ11は、取得した第一データセットDS71及び第二データセットDS72に基づき、特定商品カテゴリの商品群について、市場における売上順位毎に、対応する商品の消費者属性別の売上を説明する図9に示す第三データセットDS73を生成及び出力する(S130,S140)。
【0164】
ここで、第一データセットDS71における順位毎の売上に対して変数yを割り当てる。rは、売上順位のインデックスである。すなわち、yは、順位rに対応する商品の売上を表す。
【0165】
更に、第二データセットDS72における順位毎の消費者属性別の購買金額に対して、変数xmrを割り当てる。すなわち、xmrは、特定消費者群のうち、消費者属性mを有する消費者群の購買順位rに対応する商品の購買金額を表す。
【0166】
更に、第三データセットDS73における順位毎の消費者属性別の売上に対して、変数umrを割り当てる。すなわち、umrは、消費者属性mの消費群に対する売上順位rに対応する商品の市場売上を表す。
【0167】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
売上順位rに対応する商品の消費者属性別の売上umrの合計Σumrは、観測された売上順位rに対応する商品の売上yを基準とした誤差範囲内にある。
【0168】
<第二の制約条件>
各消費者属性mに関して、売上順位rに対応する商品の売上umrは、売上順位が一つ前r-1の商品の売上umr-1、売上順位が一つ後r+1の商品の売上umr+1、及び、観測された購買順位rに対応する商品の購買金額xmrのそれぞれと線形関係がある。この第二の制約条件は、順位間の売上umrの相違に関する制約条件を含む。
【0169】
上記制約条件に従うパラメータ推定のために、次式に従うシミュレーションモデルを置くことができる。但し、誤差ε,emrは、それぞれ正規分布に従う。
【0170】
【数9】
【0171】
プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、売上umrの事後分布を求め、市場における売上順位別及び消費者属性別の売上umrの推定値を記述した第三データセットDS73を生成することができる。第三データセットDS73は、売上順位毎に、二つ以上の消費者属性をまとめたセグメント別の売上を説明するデータセットとして生成されてもよい。
【0172】
本実施形態によれば、上述した「分析対象の第一集合」は、消費者全体の集合に対応し、「第二集合」は、特定消費者群の集合に対応し、「第一の特徴」は、売上に対応し、「第二の特徴」は、購買金額に対応する。
【0173】
第一データセットDS71は、売上ランキングにおける系列要素としての売上順位毎に、第一の特徴量として売上yを記述しており、第二データセットDS72は、購買金額ランキングにおける系列要素としての購買順位毎に、第二の特徴量として購買金額xmrを記述している。第三データセットDS73は、売上ランキングにおける系列要素としての売上順位毎に、第三の特徴量として売上umrを記述している。
【0174】
[第八実施形態]
第八実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において、図10に示す第一データセットDS81を取得する。この第一データセットDS81は、特定商品に関して、消費者年齢毎に、対応する年齢の消費者群に対する市場における1週間当たりの売上を表すレコードを有する。以下、1週間当たりの売上のことを週売上という。
【0175】
プロセッサ11は更に、S120において、特定消費者群の購入金額に関する図10に示す第二データセットDS82を取得する。第二データセットDS82は、上記1週間における平日及び休日のそれぞれについて、特定消費者群の年齢別の購入金額を表すレコードを有する。
【0176】
プロセッサ11は、取得した第一データセットDS81及び第二データセットDS82に基づいて、市場全体の平日及び休日のそれぞれにおける消費者年齢別の売上を説明する図10に示す第三データセットDS83を生成及び出力する(S130,S140)。
【0177】
ここで、第一データセットDS81における消費者年齢別の週売上に対して変数yを割り当てる。rは、年齢のインデックスである。すなわち、yは、年齢rの消費者群に対する特定商品の週売上を表す。
【0178】
更に、第二データセットDS82における平日及び休日のそれぞれにおける特定消費者群の年齢別の購入金額に対して変数xmrを割り当てる。mは、時間属性のインデックスである。ここでいう時間属性は、平日及び休日で分類される日の属性を意味する。mは、例えば、購入金額に対応する日が平日であるときに、値1をとり、休日であるときに、値2をとる。xmrは、時間属性mに対応する日の、年齢rの消費者群による特定商品の購入金額を表す。
【0179】
更に、第三データセットDS83における平日及び休日のそれぞれにおける消費者年齢別の売上に対して、変数umrを割り当てる。umrにおけるインデックスの解釈は、xmrと同じである。
【0180】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
消費者年齢rの時間属性別の売上umrの合計Σumrは、観測された売上yを基準とした誤差範囲内にある。
【0181】
<第二の制約条件>
時間属性mに対応する日における消費者年齢rの売上umrは、消費者年齢が一つ前r-1の消費者群に対する売上umr-1、消費者年齢が一つ後r+1の消費者群に対する売上umr+1、及び、観測された消費者年齢rの購入金額xmrのそれぞれと線形関係がある。
【0182】
<第三の制約条件>
隣接する年齢間では、売上金額が近い。具体的には、消費者年齢rの売上umrと、隣接する消費者年齢r-1の売上umr-1との差|Σumr-Σumr-1|は、閾値C以下である。
【0183】
上記制約条件に従うパラメータ推定のために、次式に従うシミュレーションモデルを置くことができる。但し、誤差ε,emrは、それぞれ正規分布に従う。
【0184】
【数10】
【0185】
プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、売上umrの事後分布を求め、平日及び休日のそれぞれにおける市場における消費者年齢別の売上umrの推定値を記述した第三データセットDS83を生成することができる。
【0186】
本実施形態によれば、上述した「分析対象の第一集合」は、消費者全体の購買事象の集合に対応し、「第二集合」は、特定消費者群の購買事象の集合に対応し、「第一の特徴」は、売上に対応し、「第二の特徴」は、購入金額に対応する。
【0187】
第一データセットDS81は、系列要素としての年齢毎に、第一の特徴量として週の売上yを記述しており、第二データセットDS82は、系列要素としての年齢毎に、第二の特徴量として週における平日及び休日それぞれの購入金額xmrを記述している。第三データセットDS83は、系列要素としての年齢毎に、第三の特徴量として平日及び休日それぞれの売上umrを記述している。
【0188】
[第九実施形態]
第九実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において、図11に示す第一データセットDS91を取得する。この第一データセットDS91は、国内全体について、地域(例えば都道府県)毎に、特定商品の消費量を表すレコードを有する。特定商品は、例えば、マグロなどの特定食品であり得る。
【0189】
プロセッサ11は更に、S120において、国内全体について、上記地域より細かい区域である町毎に、対応する町の地理特性として、年齢別の人口を説明する図11に示す第二データセットDS92を取得する。
【0190】
プロセッサ11は、取得した第一データセットDS91及び第二データセットDS92に基づいて、国内全体についての、町毎の特定商品の消費量を説明する図11に示す第三データセットDS93を生成及び出力する(S130,S140)。
【0191】
ここで、第一データセットDS91における地域毎の消費量に対して変数yを割り当てる。rは、地域のインデックスである。すなわち、yは、地域rにおける特定商品の消費量を表す。
【0192】
第二データセットDS92における町毎の年齢別人口に対しては、変数xmaを割り当てる。mは、町のインデックスであり、aは、年齢のインデックスである。すなわち、xmaは、町mの年齢aの人口を表す。第三データセットDS93における町毎の消費量に対しては、変数uを割り当てる。uは、町mの特定商品の消費量を表す。
【0193】
本実施形態では、次の制約条件を置いてS130でパラメータ推定処理を実行する。
<第一の制約条件>
地域rに属する町別の消費量uの合計Σuは、観測された地域rの消費量yを基準とした誤差範囲内にある。
【0194】
<第二の制約条件>
町別の消費量uは、対応する町の年齢別人口xmaに関係する。
【0195】
上記制約条件に従うパラメータ推定のために、次式に従うシミュレーションモデルを置くことができる。但し、誤差ε,eは、それぞれ正規分布に従う。
【0196】
【数11】
【0197】
プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、消費量uの事後分布を求め、町別の特定商品の消費量uの推定値を記述した第三データセットDS93を生成することができる。第三データセットDS93は、二つ以上の町をまとめたセグメント別の消費量を説明するデータセットとして生成されてもよい。
【0198】
本実施形態によれば、上述した「分析対象の集合」は、町の集合に対応し、「第一の特徴」は、消費量に対応し、第一の特徴とは異なる「第二の特徴」は、年齢別人口、換言すれば人口構成に対応する。本実施形態によれば、第一データセットDS91及び第二データセットDS92は、同じ町の集合に関して、それぞれ異なる第一の特徴及び第二の特徴を記述する。
【0199】
本実施形態によれば、集合に関する第一の特徴を記述する第一データセットDS91と、第一データセットDS91と同じ集合に関する第二の特徴を細かい情報粒度で記述する第二データセットDS92と、に基づいて、第一の特徴に関する情報粒度の細かい第三データセットDS93を生成することができる。
【0200】
[第十実施形態]
第十実施形態によれば、プロセッサ11は、実行指令に基づいて図2に示すデータ生成処理を開始し、S110において、図12に示す第一データセットDS101を取得する。この第一データセットDS101は、特定地域について、年毎に、特定地域における特定商品の年間消費量を表すレコードを有する。
【0201】
プロセッサ11は更に、S120において、年及び月の組合せ毎に、対応する年における対応する月の地理特性として、その月の平均気温を、特定地域内のエリア別に説明する図12に示す第二データセットDS102を取得する。以下でいう用語「月」は、年及び月の組合せで区別される月であると理解されたい。
【0202】
プロセッサ11は、取得した第一データセットDS101及び第二データセットDS102に基づいて、特定地域における特定商品の月毎の月間消費量を説明する図12に示す第三データセットDS103を生成及び出力する(S130,S140)。
【0203】
ここで、第一データセットDS101における特定商品の年間消費量に対して変数yを割り当てる。rは、年のインデックスである。すなわち、yは、対応する年rの年間消費量を表す。
【0204】
第二データセットDS102における月毎の平均気温に対しては、変数xmaを割り当てる。mは、月のインデックスであり、aは、エリアのインデックスである。すなわち、xmaは、エリアaにおける月mの平均気温を表す。第三データセットDS103における月毎の特定商品の月間消費量に対しては、変数uを割り当てる。uは、月mの特定商品の月間消費量を表す。
【0205】
本実施形態では、次の制約条件を置いてパラメータ推定処理を実行する。
<第一の制約条件>
ある年rにおける月別の消費量uの合計Σuは、その年rの観測された年間消費量yを基準とした誤差範囲内にある。
【0206】
<第二の制約条件>
月別の消費量uは、対応する月のエリア別の平均気温xmaに関係する。
【0207】
上記制約条件に従うパラメータ推定のために、第九実施形態と同様の式に従うシミュレーションモデルを置くことができる。プロセッサ11は、このモデルに従うMCMCによるパラメータ推定によって、月間消費量uの事後分布を求め、特定地域における月別の月間消費量uの推定値を記述した第三データセットDS103を生成することができる。第三データセットDS103は、二以上の月をまとめたセグメント別の消費量を説明するデータセットとして生成されてもよい。
【0208】
本実施形態によれば、上述した「分析対象の集合」は、月単位の時間の集合に対応し、「第一の特徴」は、消費量に対応し、第一の特徴とは異なる「第二の特徴」は、エリア別平均気温に対応する。
【0209】
商品の種類によっては、消費者の行動特性に影響を与える地理特性の種類が異なる場合も考えられる。例えば、消費者の行動特性に、降水量や日照時間が影響を与える可能性がある。従って、本実施形態の変形例としては、エリア別の平均気温に代えて、エリア別の降水量、又は、エリア別の日照時間を用いる例が考えられる。
【0210】
気温、降水量、及び日照時間以外の地理特性が分析に用いられてもよい。地理特性の例には、対応するエリアの気圧等の気象特性が含まれる。地理特性の例には、第九実施形態においても説明したように、対応するエリアの人口構成が含まれる。地理特性の例には更に、対応するエリアの特定施設又は店舗の数、対応するエリアにおけるテレビ放送コンテンツの特性、住民の関心、性格及び気質などの特性、並びに、対応するエリアの土地の分類及び分布に関する特性が含まれ得る。
【0211】
また、消費量は、消費者の行動特性を表す特徴量の一つである。本実施形態の技術思想は、消費量に代えて、消費者の行動特性を表す別の特徴量の推定に用いられてもよい。行動特性の例には、例えば、購買行動、メディア接触行動、施設の利用行動、娯楽行為、屋内及び屋外への移動行為、及びウェブ閲覧行動の一つ又は複数に関する特性が含まれ得る。メディア接触行動は、テレビ放送、ラジオ放送、新聞、雑誌、屋外広告、及び、インターネットなどの情報伝達媒体により提供されるコンテンツへの接触行動を含み得る。
【0212】
本実施形態によれば、このようなエリア別及び時間別の地理特性を説明するデータセットに基づき、人の行動特性に関する特徴量を、細かい時間単位で推定することが可能である。同様の効果は、第九実施形態によっても得られる。第九実施形態によれば、人の行動特性に関する特徴量を、細かいエリア単位で推定することが可能である。
【0213】
[他の実施形態]
本開示は、上述した実施形態に限定されるものではなく、種々の態様を採ることができる。第一実施形態から第十実施形態では、人の行動に関係するデータセットを取り扱ったが、人以外の生物又は生物以外の物体又は物理現象に関する情報粒度の細かいデータセットを生成するために、本開示の技術が適用されてもよい。
【0214】
また、上述のデータセット、例えば第一データセット等は、対応する分析対象の集合の全数調査に基づくデータセットでなくてもよく、標本調査に基づくデータセットであってもよい。例えば、上述のデータセットは、標本から全数の特徴を推定して生成されるデータセットであってもよい。標本数の多い大規模なパネル調査により得られるデータは、分析目的の範疇では、全数データに実質等しい価値を有し得る。
【0215】
この他、上記実施形態における1つの構成要素が有する機能は、複数の構成要素に分散して設けられてもよい。複数の構成要素が有する機能は、1つの構成要素に統合されてもよい。上記実施形態の構成の一部は、省略されてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本開示の実施形態である。
【符号の説明】
【0216】
1…データ生成システム、11…プロセッサ、12…メモリ、13…ストレージ、15…ディスプレイ、17…入力デバイス、18…メディアリーダ/ライタ、19…通信デバイス、DS11,DS21,DS31,DS41,DS51,DS61,DS71,DS81,DS91,DS101…第一データセット、DS12,DS22,DS32,DS42,DS52,DS62,DS72,DS82,DS92,DS102…第二データセット、DS13,DS23,DS33,DS43,DS53,DS63,DS73,DS83,DS93,DS103…第三データセット。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12