特許第5793794号(P5793794)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

<>
  • 5793794-情報処理システム、及び、プログラム。 図000002
  • 5793794-情報処理システム、及び、プログラム。 図000003
  • 5793794-情報処理システム、及び、プログラム。 図000004
  • 5793794-情報処理システム、及び、プログラム。 図000005
  • 5793794-情報処理システム、及び、プログラム。 図000006
  • 5793794-情報処理システム、及び、プログラム。 図000007
  • 5793794-情報処理システム、及び、プログラム。 図000008
  • 5793794-情報処理システム、及び、プログラム。 図000009
  • 5793794-情報処理システム、及び、プログラム。 図000010
  • 5793794-情報処理システム、及び、プログラム。 図000011
  • 5793794-情報処理システム、及び、プログラム。 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】5793794
(24)【登録日】2015年8月21日
(45)【発行日】2015年10月14日
(54)【発明の名称】情報処理システム、及び、プログラム。
(51)【国際特許分類】
   G06F 17/30 20060101AFI20150928BHJP
【FI】
   G06F17/30 210D
   G06F17/30 220Z
   G06F17/30 240C
【請求項の数】14
【全頁数】29
(21)【出願番号】特願2015-945(P2015-945)
(22)【出願日】2015年1月6日
【審査請求日】2015年1月6日
【早期審査対象出願】
(73)【特許権者】
【識別番号】507009009
【氏名又は名称】株式会社博報堂DYホールディングス
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際特許業務法人
(72)【発明者】
【氏名】道本 龍
(72)【発明者】
【氏名】▲徳▼久 真也
【審査官】 加舎 理紅子
(56)【参考文献】
【文献】 特開2006−018340(JP,A)
【文献】 特開2013−239160(JP,A)
【文献】 野村眞平 他,データフュージョンを用いた不動産サイト利用者のデモグラフィック推定,日本オペレーションズ・リサーチ学会 2014年秋季研究発表会アブストラクト集,2014年 8月28日,p.230−231
【文献】 岡内眞一郎,顧客への理解を深める実践的「データフュージョン」とは?,I.M.press ,株式会社アイ・エム・プレス,2008年 6月25日,Vol.146,p.48−51
【文献】 Roland Soong et al.,THE ANATOMY OF DATA FUSION,2001 Worldwide Readership Research Symposium (Venice),2001年,p.1-23,[online],[retrieved on 2015-02-25],Retrieved from the Internet: <URL: http://www.zonalatina.com/WRRSfusion.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06Q 10/00 − 50/34
(57)【特許請求の範囲】
【請求項1】
第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データであって前記統計処理により算出された統計量を含む前記仮想構成体毎の特徴データを備える第一のデータベースを生成する生成手段と、
前記生成手段により生成された前記第一のデータベースを、前記第一のグループとは同一又は別のグループとしての第二のグループにおける構成体毎の特徴データを備える第二のデータベースと結合する結合手段と、
を備え、
前記第一及び前記第二のデータベースが備える前記特徴データの夫々は、前記結合時に参照される参照データであって、前記第一のデータベースと前記第二のデータベースとの間で共通する種類の特徴を表す参照データを含み、
前記結合手段は、前記第一のデータベースと前記第二のデータベースとの間で前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記第一のデータベースと前記第二のデータベースとを結合すること
を特徴とする情報処理システム。
【請求項2】
前記生成手段は、前記第一のグループに関する前記特徴データの集合を、前記特徴が一致又は類似する複数の特徴データ毎にクラスタ化し、各クラスタに対応する前記複数の特徴データを統計処理して、前記複数の特徴データが有する各パラメータについての統計量を算出することにより、これらの統計量を、前記特徴を表すパラメータ値として含む前記仮想構成体毎の特徴データを生成すること
を特徴とする請求項1記載の情報処理システム。
【請求項3】
第一のデータベース及び第二のデータベースを記憶する記憶手段と、
前記記憶手段が記憶する前記第一のデータベースと前記第二のデータベースとを結合する結合手段と、
を備え、
前記第一のデータベースは、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データであって前記統計処理により算出された統計量を含む前記仮想構成体毎の特徴データを備えるデータベースであり、
前記第二のデータベースは、前記第一のグループとは同一又は別のグループとしての第二のグループにおける構成体毎の特徴データを備えるデータベースであり、
前記第一及び前記第二のデータベースが備える前記特徴データの夫々は、前記結合時に参照される参照データであって、前記第一のデータベースと前記第二のデータベースとの間で共通する種類の特徴を表す参照データを含み、
前記結合手段は、前記第一のデータベースと前記第二のデータベースとの間で前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記第一のデータベースと前記第二のデータベースとを結合すること
を特徴とする情報処理システム。
【請求項4】
前記第二のデータベースが備える前記構成体毎の前記特徴データは、前記第一のグループとは同一又は別のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データであること
を特徴とする請求項1〜請求項3のいずれか一項記載の情報処理システム。
【請求項5】
前記第二のデータベースは、前記特徴データとしてシングルソースデータを備えるデータベースであること
を特徴とする請求項1〜請求項3のいずれか一項記載の情報処理システム。
【請求項6】
前記第一及び前記第二のグループの夫々は、人、物、サービス、及び場所の少なくとも一つの集合であり、前記構成体は、前記集合の要素であることを特徴とする請求項1〜請求項5のいずれか一項記載の情報処理システム。
【請求項7】
前記第一のグループ及び前記第二のグループの一方は、人の集合であり、前記第一のグループ及び前記第二のグループの他方は、人に関連する物、サービス、及び場所の少なくとも一つの集合であることを特徴とする請求項6記載の情報処理システム。
【請求項8】
前記第一及び前記第二のグループの夫々は、人に関連する物、サービス、及び場所の少なくとも一つの集合であることを特徴とする請求項6記載の情報処理システム。
【請求項9】
互いに同一又は異なるグループについてのデータベースを生成する複数の生成手段と、
前記複数の生成手段により生成された複数の前記データベースを結合する結合手段と、
を備え、
前記生成手段の夫々は、対応する前記グループの構成体毎の特徴データに基づき、前記データベースとして、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データであって前記統計処理により算出された統計量を含む前記仮想構成体毎の特徴データを備えるデータベースを生成するように構成され、
前記複数のデータベースが備える前記特徴データの夫々は、前記結合時に参照される参照データであって、結合対象の前記データベースと共通する種類の特徴を表す参照データを含み、
前記結合手段は、前記複数のデータベース間で、前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記複数のデータベースを結合すること
を特徴とする情報処理システム。
【請求項10】
前記生成手段の夫々は、前記グループに関する前記特徴データの集合を、前記特徴が一致又は類似する複数の特徴データ毎にクラスタ化し、各クラスタに対応する前記複数の特徴データを統計処理して、前記複数の特徴データが有する各パラメータについての統計量を算出することにより、これらの統計量を、前記特徴を表すパラメータ値として含む前記仮想構成体毎の特徴データを生成すること
を特徴とする請求項9記載の情報処理システム。
【請求項11】
複数のデータベースを記憶する記憶手段と、
前記記憶手段が記憶する前記複数のデータベースを結合する結合手段と、
を備え、
前記データベースの夫々は、互いに同一又は異なるグループについてのデータベースであり、対応する前記グループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データであって前記統計処理により算出された統計量を含む前記仮想構成体毎の特徴データを備えるデータベースであり、
前記複数のデータベースが備える前記特徴データの夫々は、前記データベースの結合時に参照される参照データであって、結合対象の前記データベースと共通する種類の特徴を表す参照データを含み、
前記結合手段は、前記複数のデータベース間で、前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記複数のデータベースを結合すること
を特徴とする情報処理システム。
【請求項12】
前記結合手段は、前記複数のデータベース間を、前記複数のデータベースとは同一又は異なるグループについてのデータベースであって、前記グループの構成体毎に特徴データとしてシングルソースデータを備える特定種のデータベースを介して結合する構成にされ、
前記シングルソースデータは、前記データベースの結合時に参照される参照データであって、結合対象の前記データベースと共通する種類の特徴を表す参照データを含み、
前記結合手段は、前記参照データが表す前記特徴が類似する前記特徴データ同士を結合するように、前記特定種のデータベースと、それ以外の前記データベースの夫々とを結合することにより、前記複数のデータベース間を、前記特定種のデータベースを介して結合すること
を特徴とする請求項9〜請求項11のいずれか一項記載の情報処理システム。
【請求項13】
請求項1、請求項2、請求項9及び請求項10のいずれか一項記載の情報処理システムにおける前記生成手段としての機能をコンピュータに実現させるためのプログラム。
【請求項14】
請求項1〜請求項12のいずれか一項記載の情報処理システムにおける前記結合手段としての機能をコンピュータに実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データベースを取り扱う情報処理システムに関する。
【背景技術】
【0002】
従来、商品の販売データに基づき顧客の購買行動を解析することが行われている。商業活動に役立てるために、顧客によるマスメディアやネットワークコンテンツへの接触行動を解析することも行われている。
【0003】
この他、アンケート形式や対面での質問形式により、顧客の購買行動や、マスメディア/ネットワークコンテンツへの接触行動、ライフスタイル等の多様な情報を収集することが行われている。
【0004】
近年では、こうした顧客に関するデータを備える巨大なデータベースを、各企業が有している。しかしながら、各企業は、個人情報保護を主な理由として、これらの顧客に関するデータを外部に提供することに消極的である。これらのデータは、それを保有する企業から外部に提供される場合、暗号化されて提供されたり、顧客の特定に繋がる情報が大幅に削除されて提供されたり、意図的に誤り(ノイズ)を含むように変更された状態で提供されたりする(特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2014−109647号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述したように、データ保有企業からの顧客に関するデータの提供は、個人情報保護の観点から限られている。また、顧客に関するデータに限らず、粒度の細かなデータに関しては、その情報価値の高さや提供に起因する不利益発生への懸念から、データ保有企業がデータ提供に消極的になりがちである。このため、従来技術によれば、社会に存在する各種データを有効に活用することが難しい。
【0007】
従って、本発明の一側面では、社会に存在する各種データを有効活用可能な、データベースに関する新規技術を提供できることが望ましい。
【課題を解決するための手段】
【0008】
本発明の一側面に係る情報処理システムは、生成手段と結合手段とを備える。生成手段は、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを備える第一のデータベースを生成する。特徴データは、構成体に関する特徴を表す。生成手段は、第一のグループにおいて、特徴が一致又は類似する複数の構成体毎に、当該複数の構成体の特徴データを統計処理することにより、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを生成する構成にされ得る。
【0009】
結合手段は、生成手段により生成された第一のデータベースを、第二のデータベースと結合するように構成される。第二のデータベースは、第二のグループの構成体毎の特徴データを備える。第二のグループは、第一のグループとは同一又は別のグループである。
【0010】
第一及び第二のデータベースが備える特徴データの夫々は、結合時に参照される参照データであって、第一のデータベースと第二のデータベースとの間で共通する種類の特徴を表す参照データを含む。結合手段は、第一のデータベースと第二のデータベースとの間で参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、第一のデータベースと第二のデータベースとを結合する。
【0011】
本発明の一側面に係る情報処理システムによれば、生成手段が、複数の特徴データを(例えば統計処理によって)統合し、仮想構成体毎の特徴データを備えるデータベースを生成する。これにより、例えば、構成体の特徴データは、複数の構成体の特徴が混合された仮想構成体のデータに変換される。第一のグループが顧客の集合であり、統合前の特徴データが一人の顧客の特徴を表す単一顧客のデータである場合、特徴データは、単一顧客のデータから複数顧客の特徴が混合された仮想顧客のデータに変換される。
【0012】
また、データ保有者は、生成手段を用いて、自己が保有する特徴データの粒度を大きくすることができ、これにより細部の情報保護を図ることができる。従って、本発明の一側面によれば、データ提供に起因する不利益発生への懸念を抑えることができ、情報保護を理由とするデータ提供の障壁を小さくすることができ、データ提供を行い易くすることができる。従って、本発明の一側面によれば、社会に存在する各種データを有効活用可能なシステムを提供し得る。
【0013】
上述した特徴が一致又は類似する複数の構成体は、特徴が一致する構成体と特徴が類似する構成体との両方が混在する集合であり得る。本明細書における用語「類似」は、「一致」を下位概念に含む広義の用語として理解されてよい。
【0014】
特徴が一致又は類似する複数の構成体の特徴データを統合する際には、周知のクラスタリング技術(分類技術)を用いることが可能である。クラスタリング技術としては、言語処理、パターン認識、及び、人工知能等の分野で様々なものが知られている。良く知られるクラスタリング技術としては、k−means(k平均法)、及び、BIRCH(平衡木による階層クラスタリング)等のハードクラスタリング技術、LSA(潜在意味解析)、pLSA(確率的潜在意味解析)、及び、LDA(潜在的ディリクレ配分法)等のソフトクラスタリング技術が知られている。
【0015】
生成手段は、これら周知のクラスタリング技術、又は、その他のクラスタリング技術を用いて、第一のグループに関する特徴データの集合を、特徴が一致又は類似する複数の特徴データ毎にクラスタ化し、各クラスタに対応する複数の特徴データを統合する構成にされ得る。
【0016】
付言すると、生成手段は、クラスタ毎に、クラスタに対応する複数の特徴データが有する各パラメータについての統計量を算出する構成にされ得る。統計量の例には、平均値、最大値、最小値、及び、分布を表す値(割合等)が含まれる。特徴データのパラメータ値、及び、その統計量は、スカラー量であってもよいしベクトル量であってもよい。仮想構成体の特徴データは、クラスタ毎に生成され得て、上記統計量を、構成体に関する特徴を表すパラメータ値として含むように生成され得る。
【0017】
また、本発明の別側面に係る情報処理システムは、第一のデータベース及び第二のデータベースを記憶する記憶手段と、記憶手段が記憶する第一のデータベースと第二のデータベースとを結合する結合手段と、を備える。この情報処理システムは、上記生成手段を備えない構成にされ得る。
【0018】
記憶手段が記憶する第一のデータベースは、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを備えるデータベースであり得る。このデータベースは、生成手段によって生成されてもよいし、人による手作業によって生成されてもよいし、その他の方法(例えば、コンピュータによる情報処理と人による手作業との組合せ)によって生成されてもよい。
【0019】
記憶手段が記憶する第二のデータベースは、第二のグループにおける構成体毎の特徴データを備える。第二のグループは、第一のグループとは同一又は別のグループであり得る。
【0020】
これら第一及び第二のデータベースが備える特徴データの夫々は、結合時に参照される参照データであって、第一のデータベースと第二のデータベースとの間で共通する種類の特徴を表す参照データを含む。結合手段は、第一のデータベースと第二のデータベースとの間で参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、第一のデータベースと第二のデータベースとを結合する。この情報処理システムによっても、社会に存在するデータを有効活用可能である。
【0021】
上記第二のデータベースは、第一のデータベースと同様に生成され得る。即ち、第二のデータベースが備える構成体毎の特徴データは、第一のグループとは同一又は別のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データであり得る。
【0022】
あるいは、第二のデータベースは、上記統合のなされていない特徴データを備えるデータベースであってもよい。第二のデータベースは、特徴データとしてシングルソースデータを備え得る。シングルソースデータの夫々は、単一の情報源から収集された情報に基づくデータである。シングルソースデータは、統計化及びモデル化されていない構成体の特徴データであって、単一の構成体に関する特徴を表す特徴データであり得る。
【0023】
この他、第一及び第二のグループの夫々は、人、物、サービス、及び場所の少なくとも一つの集合であり得る。上記構成体は、この集合の要素(人、物、サービス、及び場所のいずれか)であり得る。物、サービス、及び場所は、人に関連する物、サービス、及び場所であり得る。
【0024】
本発明の一側面によれば、第一のグループ及び第二のグループの一方が、人の集合であり、第一のグループ及び第二のグループの他方が、物、サービス、及び場所の少なくとも一つの集合である情報処理システムが提供されてもよい。あるいは、第一及び第二のグループの夫々が、物、サービス、及び場所の少なくとも一つの集合である情報処理システムが提供されてもよい。
【0025】
この他、本発明の一側面によれば、情報処理システムは、互いに同一又は異なるグループについてのデータベースを生成する複数の生成手段と、複数の生成手段により生成された複数のデータベースを結合する結合手段と、を備えた構成にされてもよい。生成手段の夫々は、グループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを備えるデータベースを生成するように構成され得る。
【0026】
複数のデータベースが備える特徴データの夫々は、結合時に参照される参照データであって、結合対象のデータベースと共通する種類の特徴を表す参照データを含んでよい。結合手段は、複数のデータベース間で、参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、複数のデータベースを結合する構成にされ得る。
【0027】
本発明の一側面によれば、情報処理システムは、複数のデータベースを記憶する記憶手段と、記憶手段が記憶する複数のデータベースを結合する結合手段と、を備え、データベース及び結合手段が次のように構成されたシステムであってもよい。
【0028】
複数のデータベースの夫々は、互いに同一又は異なるグループについてのデータベースであり得る。これらのデータベースの夫々は、グループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを備え得る。
【0029】
これら複数のデータベースが備える特徴データの夫々は、データベースの結合時に参照される参照データであって、結合対象のデータベースと共通する種類の特徴を表す参照データを含み得る。そして、結合手段は、複数のデータベース間で、参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、複数のデータベースを結合する構成にされ得る。この情報処理システムによっても、社会に存在するデータを有効活用可能である。
【0030】
結合手段は、上記複数のデータベース間を、複数のデータベースとは同一又は異なるグループについてのデータベースであって、グループの構成体毎に特徴データとしてシングルソースデータを備える特定種のデータベースを介して結合する構成にされてもよい。シングルソースデータは、データベースの結合時に参照される参照データであって、結合対象のデータベースと共通する種類の特徴を表す参照データを含み得る。
【0031】
そして、結合手段は、参照データが表す特徴が類似する特徴データ同士を結合するように、特定種のデータベースと、それ以外のデータベースの夫々とを結合することにより、複数のデータベース間を、特定種のデータベースを介して結合する構成にされ得る。
【0032】
シングルソースデータは、上記統合がなされていないという点で構成体の特徴を良く表す。従って、シングルソースデータを介して各データベースを結合することにより、データベース間における仮想構成体毎の特徴データを一層適切に結びつけることができる。
【0033】
また、生成手段及び結合手段としての機能は、ハードウェアにより実現することができる。これら各手段としての機能は、プログラムにより、コンピュータに実現させてもよい。これら各手段としての機能は、複数のコンピュータにより分散して実現されてもよい。コンピュータには、これらの手段の少なくとも一つとしての機能をコンピュータに実現させるためのプログラムを提供することができる。プログラムは、半導体製メモリ、磁気ディスク及び光ディスク等のコンピュータ読取可能な記録媒体に記録され得る。
【0034】
本発明の一側面によれば、生成手段及び結合手段の少なくとも一方としての機能をコンピュータに実現させるためのプログラムを記憶するコンピュータ読取可能な一時的でない記録媒体が提供されてもよい。本発明の一側面によれば、コンピュータ(プロセッサ)と、メモリとを備え、メモリが上記プログラムを記憶した情報処理システムが提供されてもよい。
【0035】
この他、本発明の一側面によれば、上記第一のデータベースを生成する手順と、第一のデータベースを上記第二のデータベースと結合する手順と、を備えるデータベース結合方法が提供されてもよい。本発明の別側面によれば、記憶手段が記憶する上記第一のデータベースと上記第二のデータベースとを結合する手順を備えるデータベース結合方法が提供されてもよい。
【0036】
この他、上述したデータベースは、顧客に関するデータベースであってもよい。データベースは、顧客に対応する人、物、サービス、及び場所の少なくとも一つの特徴を表す特徴データを備えた構成にされ得る。顧客に関するデータを取り扱う本発明の一側面に係る情報処理システムによれば、顧客の個人情報を保護しながら、結合手段に顧客に関するデータを提供することができる。結合手段は、データ提供元の異なる顧客に関するデータを結合したデータベースを生成することができる。
【0037】
また、データベースの夫々が、顧客の特徴を表す特徴データを備える場合、上記参照データは、顧客のデモグラフィック属性を表すデータとして構成され得る。例えば、参照データは、結合対象のデータベース間で共通するデモグラフィック属性を表すデータであり得る。参照データは、デモグラフィック属性として、顧客の性別、年齢、職業、居住地域、所得、学歴、及び、家族構成の少なくとも一つを表すデータであり得る。
【0038】
性別や年齢などのデモグラフィック属性は、様々な企業な保有する顧客に関するデータに含まれる。このようなデモグラフィック属性を表す参照データに基づき、データベース間を結合すれば、異なるデータベース間の特徴データを適切に結合することができる。勿論、参照データは、デモグラフィック属性以外の顧客の特徴を、デモグラフィック属性に加えて、又は、代えて表すデータであってもよい。
【0039】
この他、顧客に関する特徴データには、参照データ以外の非参照データとして、顧客の消費行動、マスメディアへの接触行動、ネットワークコンテンツへの接触行動、ライフスタイル、価値観、及び、ブランド意識の少なくとも一つの特徴を表すデータが含まれ得る。こうした顧客に関する多様な情報を含む特徴データ同士を、データベース間で結合すれば、結合後のデータベースから、顧客(消費者)に関する多種の有意義な統計情報を解析により抽出することができる。
【0040】
付言すると、ここで例として挙げた非参照データは、参照データにもなり得る。参照データは、複数のデータベースの内、直接的に結合されるデータベース間において、共通する種類の特徴を表すデータであればよい。このため、互いに結合される二つのデータベースが共通して、特徴データ内に顧客のネットワークコンテンツへの接触行動を表す情報を有している場合、これらのネットワークコンテンツへの接触行動を表す情報が、参照データに含まれ得る。
【図面の簡単な説明】
【0041】
図1】第一実施例の情報処理システムの構成を表すブロック図である。
図2図2Aは、データ加工装置の構成を表すブロック図であり、図2Bは、演算部で実行される処理を表すブロック図である。
図3図3A−3Dは、顧客関連データベースが有する特徴データの構成を表す図である。
図4】加工後データベースの例を説明した図である。
図5図5Aは、データ結合装置の構成を表すブロック図であり、図5Bは、演算部で実行される処理を表すブロック図である。
図6図6Aは、加工後データベースの結合例を説明した図であり、図6Bは、結合データベースの構成例を下段に示す図である。
図7】結合データベースの解析例を説明した図である。
図8図8Aは、第二実施例における加工後データベースの結合例を説明した図であり、図8Bは、結合データベースの構成例を表す図である。
図9図9Aは、第三実施例における顧客関連データベースの構成を説明した図であり、図9Bは、第四実施例における顧客関連データベースの構成を説明した図である。
図10図10Aは、第五実施例における顧客関連データベースの構成を説明した図であり、図10Bは、第六実施例における顧客関連データベースの構成を説明した図である。
図11図11Aは、第七実施例における顧客関連データベースの構成を説明した図であり、図11Bは、第八実施例における顧客関連データベースの構成を説明した図である。
【発明を実施するための形態】
【0042】
以下に本発明の実施例を図面と共に説明する。
[第一実施例]
図1に示す本実施例の情報処理システム1は、複数のデータ加工装置10と、データ結合装置50と、を備える。データ加工装置10は、企業が保有する顧客に関するデータベース153を加工し、加工後データベース155をデータ結合装置50に提供する。データ加工装置10は、顧客に関するデータベース153を保有する企業側に配置される。
【0043】
以下では、顧客に関するデータベース153のことを顧客関連データベース153と表現し、顧客関連データベース153を加工して提供する企業のことをデータ提供元と表現する。顧客関連データベース153は、顧客に関する特徴データの一群を備える。
【0044】
特徴データとしては、顧客の消費行動、マスメディアへの接触行動、ネットワークコンテンツへの接触行動、ライフスタイル、価値観、及び、ブランド意識の少なくとも一つの特徴を、顧客の識別ID又はデモグラフィック属性と共に表すデータを一例に挙げることができる。
【0045】
上記顧客の識別IDは、顧客のデモグラフィック属性を表すデータを、顧客情報を記憶するデータベースから引出可能な識別コードであり得る。顧客の消費行動には、顧客の購買行動が含まれる。
【0046】
例えば、上記特徴データは、顧客のデモグラフィック属性と共に、顧客の購買データ(購入商品、購入金額等を表すデータ)を有した構成にされ得る。この場合、顧客関連データベース153は、顧客毎及び決済毎の特徴データを有し得る。
【0047】
データ加工装置10は、顧客関連データベース153が有する上記特徴データの一群に基づき、特徴が類似する複数の特徴データを一つの特徴データに統合するように加工する。本明細書で用いる用語「類似」は、「一致」を下位概念に含む広義の用語として理解されてよい。データ加工装置10は、加工後の特徴データを、仮想顧客の特徴データとして備えるデータベースを、上記加工後データベース155として生成する。本明細書では、加工後の顧客関連データベースのことを加工後データベース155とも表現する。加工後データベース155は、例えば、複数の顧客に対応する仮想顧客毎に、この仮想顧客の特徴データを備える。
【0048】
加工後データベース155は、例えば通信によりデータ結合装置50に提供される。データベースの漏洩を防ぐために、通信には、暗号鍵や専用回線を用いることができる。別例として、加工後データベース155は、持ち運び可能であってコンピュータ読取可能な記録媒体に保存され、当該記録媒体の運搬によりデータ結合装置50側に提供され得る。記録媒体としては、半導体製メモリ、CD−ROM及びDVD等の光ディスク、並びに、ハードディスク等の磁気ディスクを一例に挙げることができる。
【0049】
データ結合装置50は、データ加工装置10の夫々から提供される複数の加工後データベース155を結合して、結合データベース557を生成する。データ提供元としては、上述したように、特徴データとして顧客の購買データを含む顧客関連データベース153を備える企業を一例に挙げることができる。
【0050】
購買データを有する企業としては、コンビニエンスストア、スーパーマーケット及び/又は百貨店等を運営する小売(物販)業者、自動販売機を運営する企業、電子マネーによる決済サービスを提供する企業、並びに、クレジットカードによる決済サービスを提供する企業を一例に挙げることができる。
【0051】
小売業者によれば、POSシステム等を通じて得られる決済毎の購買データが蓄積されたデータベースを有する。POSシステムとしては、顧客を特定可能なID−POSシステムが知られている。
【0052】
この他、小売業者では、決済時にポイントカードの提示を顧客から受けて、ポイントカードから特定される顧客IDと関連付けて購買データを蓄積することにより、決済毎に顧客を特定可能な購買データを備えるデータベースを構築することが行われている。決済時に、販売員が見た目から判別される顧客の性別及び年齢を入力することで、顧客のデモグラフィック属性と購買データとを関連付けるように、決済毎の購買データを蓄積することも行われている。
【0053】
データ結合装置50は、このようなデータ提供元の異なる、購買データを含む加工後データベース155の複数を結合することで、一企業では構築することのできない巨大なデータベースを構築することができる。例えば、広範囲の商品についての顧客(消費者)の購買行動を解析可能な結合データベース557を生成することができる。
【0054】
図2Aに示すように、データ加工装置10の夫々は、演算部11、記憶部15、入力部17、及び、出力部19を備える。演算部11は、各種プログラム151に従う処理を実行するCPU13及びCPU13による処理実行時に作業メモリとして使用されるRAM14を備える。演算部11は、CPU13における上記処理の実行により、図2Bに示すように、クラスタリング処理部110及び加工処理部115として機能する。
【0055】
記憶部15は、演算部11を、クラスタリング処理部110及び加工処理部115として機能させるためのプログラムを含む各種プログラム151、加工前の顧客関連データベース153、及び、この顧客関連データベース153を加工して生成される加工後データベース155を記憶する。
【0056】
顧客関連データベース153を構成するデータは、入力部17から入力される。入力部17は、顧客関連データベース153を構成するデータを記録媒体から取込可能なインタフェースであってもよいし、当該データを企業内システムから通信により取込可能なインタフェースであってもよい。
【0057】
図3A−3Dには、顧客関連データベース153が備える特徴データ(レコード)の例を示す。図3Aに示す例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別及び年齢を表すパラメータを有し、顧客が購入した商品に関するパラメータとして、商品の購入場所、JAN(Japanese Article Number)コード、購入数、及び、商品単価を表すパラメータを有する。図3Aに示すような購入商品の詳細情報を含む顧客関連データベース153は、例えばコンビニエンスストアやスーパーマーケット等の小売業者が有する。
【0058】
図3Bに示す別例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別及び年齢を表すパラメータを有し、顧客が購入した商品に関するパラメータとして、商品の購入場所及び購入金額を表すパラメータを有する。図3Bに示すような特徴データを含む顧客関連データベース153は、例えばクレジットカード会社が有する。この顧客関連データベース153は、小売業者と比較して莫大な購買データを有する点で、小売業者が有する顧客関連データベース153よりも優れているが、具体的な購入商品までを特定することができない点で、小売業者が有する顧客関連データベース153とは相互に補完関係にある。
【0059】
図3Cに示す別例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別、年齢及び職業を表すパラメータを有し、顧客のマスメディアとの接触状況に関するパラメータとして、複数のマスメディア(新聞/雑誌/ラジオ/テレビ/映画等)についての利用状況を表すパラメータを有する。例えば、利用状況を表すパラメータは、該当するマスメディアを顧客が利用(購読/視聴等)している場合には値1を示し、利用していない場合には値0を示す。この種の情報は、例えば、アンケート形式又は対話形式により収集されて、特徴データとして顧客関連データベース153に蓄積される。この種の顧客関連データベース153は、通常、マスコミュニケーションに関する企業が有し、小売業者が有さないデータベースである。
【0060】
図3Dに示す別例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別、年齢及び居住地域を表すパラメータを有し、顧客によるネットワークコンテンツとの接触状況に関するパラメータとして、複数のインターネットサイトについての利用状況を表すパラメータを有する。例えば、利用状況を表すパラメータは、該当するサイトを顧客が利用(訪問)している場合には値1を示し、利用していない場合には値0を示す。この種の情報は、例えば、予め顧客からの同意を得て顧客の情報端末にインストールされたアクセスログ生成プログラムを通じて特定のサーバに蓄積される。この顧客関連データベース153は、通常、IT企業が有し、小売業者が有さないデータベースである。
【0061】
出力部19は、上述した顧客関連データベース153に基づく加工後データベース155をデータ加工装置10から外部に取り出し可能な構成にされる。例えば、出力部19は、加工後データベース155を通信によりデータ結合装置50に提供可能な通信インタフェース、又は、加工後データベース155を記録媒体に出力可能なインタフェースを有した構成にされる。
【0062】
クラスタリング処理部110は、記憶部15が記憶する加工前の顧客関連データベース153から、特徴データの集合を読み出し、これら特徴データの集合を、特徴が類似する複数の特徴データ毎にクラスタ化する。クラスタリングの手法としては、上述した周知の手法を採用することができる。
【0063】
簡単なクラスタリング手法としては、特徴データの夫々を、特徴ベクトルとして特徴空間上に配置し、特徴ベクトル間のコサイン類似度に基づいて、特徴が類似する特徴データを特定し、クラスタ化する手法を一例に挙げることができる。
【0064】
顧客の特徴が類似する特徴ベクトルの一群が、特徴空間上で他の特徴ベクトルと良く分離するように、次元削減行列を特徴ベクトルの夫々に作用させることも可能である。次元削減行列の調整によって、より適切なクラスタリングが可能である。
【0065】
クラスタリング技術としては、pLSA(確率的潜在意味解析)のように、一つの特徴データを、確率的に複数のクラスタに分類する技術も知られている。一つの特徴データの80%を第一のクラスタに分類し、残りの20%を第二のクラスタに分類するといった具合である。
【0066】
どのように特徴の類似性を判断し、特徴データの一群をクラスタ化するかは、結合データベース557に基づくデータ解析の目的を考慮して、データ結合装置50の運営者が決定することができる。データ結合装置50の運営者は、クラスタリング処理部110及び加工処理部115として演算部11を機能させるためのプログラムを、データ提供元に提供して、データ解析目的に良く適合した加工後データベース155をデータ提供元から取得することができる。
【0067】
留意すべき点は、本実施例の情報処理システム1が、データ提供元が保有する顧客関連データベース153に対する統計処理により、個人情報を保護した加工後データベース155を生成するものである点である。従って、クラスタリングは、クラスタの夫々が統計処理(統合)により個人情報保護可能な個数以上の特徴データを含むように、行われるのが好ましい。個人情報保護可能な個数以上の特徴データを含まないクラスタが生じる場合には、そのクラスタに属する特徴データを、加工処理部115における処理対象とせずに破棄することが考えられる。
【0068】
加工処理部115は、クラスタリング処理部110によりクラスタ化された複数の特徴データ毎に、換言すればクラスタ毎に、これら同一クラスタに属する複数の特徴データを統合するための統計処理を行う。具体的には、クラスタ毎に、同一クラスタに属する複数の特徴データが有する各パラメータについての統計量を算出し、これらの統計量をパラメータ値として含む特徴データを、クラスタに対応する仮想顧客の特徴データとして生成する処理を行う。加工処理部115は、全てのクラスタに関して、クラスタ毎に一つの仮想顧客の特徴データを生成することにより、これらの特徴データを備える加工後データベース155を生成し、これを記憶部15に書き込む。
【0069】
図4に示す例によれば、加工処理部115は、性別のパラメータに関する統計量として、クラスタ内の特徴データが表す性別の比を算出し、この比を、クラスタに対応する仮想顧客の特徴データにおいて性別のパラメータ値として記載する。また、年齢のパラメータに関する統計量として、クラスタ内の特徴データが表す年齢の平均を算出し、この平均をクラスタに対応する仮想顧客の特徴データにおいて年齢のパラメータ値として記載する。
【0070】
図4上段に示すように、加工前の特徴データが、JANコードと購入場所との組合せ毎に、顧客が該当JANコードの商品を該当購入場所で購入した金額の合計を表す購買パラメータを有するものである場合、加工処理部115は、その統計量として、JANコードと購入場所との組合せ毎に、クラスタ内の特徴データが表す金額の平均値を算出して、これをクラスタに対応する仮想顧客の特徴データに記載することができる。
【0071】
図4下段に示す加工後の特徴データは、仮想顧客のデモグラフィック属性(性別及び年齢)と共に、JANコードと購入場所との組合せ毎に、仮想顧客による商品の購入金額(平均値)を表す。
【0072】
別例として、加工処理部115は、上記金額の平均値に代えて、上記金額の最大値及び最小値を、購入金額の分布を表す値として算出し、この最大値及び最小値を、JANコードと購入場所との組合せ毎の購買パラメータに関する統計量として、仮想顧客の特徴データに記載することができる。
【0073】
図4によれば、加工前後の特徴データは、加工後の特徴データが統計量を表すものである点、及び、加工前特徴データの個数(標本数)を表すパラメータが加工後の特徴データに追加されている点を除けば、基本的に同じものである。
【0074】
但し、加工処理部115は、図3Aに示す特徴データを有する顧客関連データベース153から、図4下段に示すような仮想顧客(クラスタ)毎の特徴データを備える加工後データベース155を生成することも可能である。即ち、特徴データが有するパラメータの種類は、加工前後で一致する必要はなく、加工前のパラメータの一つ又は複数は、加工時に、そこから算出可能な他の種類のパラメータに置き換えられてもよい。
【0075】
統計量としては、比(割合)、平均、又は、最大値及び最小値の組が算出される例を上述したが、統計量としては、その他に中央値が算出されてもよいし、平均及び分散の組が算出されてもよい。どのような統計量を算出するかは、データ解析目的に応じて、解析に有意な情報が失われないように定めることができる。
【0076】
データ加工装置10では、このようにしてクラスタ毎に、このクラスタに属する特徴データの一群が、統計量を表す特徴データに加工(統合)されて、この加工後の特徴データを含む加工後データベース155がデータ結合装置50に向けて出力される。
【0077】
続いて、データ結合装置50の構成を図5A及び図5Bを用いて説明する。データ結合装置50は、図5Aに示すように、演算部51、記憶部55、入力部57、及び、出力部59を備える。演算部51は、各種プログラム551に従う処理を実行するCPU53及びCPU53による処理実行時に作業メモリとして使用されるRAM54を備える。演算部51は、CPU53における上記処理の実行により、図5Bに示すようにデータフュージョン処理部510として機能する。
【0078】
記憶部55は、演算部51をデータフュージョン処理部510として機能させるためのプログラムを含む各種プログラム551、各データ加工装置10から提供される加工後データベース155、及び、これらの加工後データベース155を結合して生成される結合データベース557を記憶する。各データ加工装置10から提供される加工後データベース155は、入力部57を通じてデータ結合装置50内に入力される。入力部57は、記録媒体から加工後データベース155を入力可能なインタフェースであってもよいし、データ加工装置10から通信により加工後データベース155を入力可能なインタフェースであってもよい。出力部59は、例えば結合データベース557や結合データベース557に基づくデータ解析結果をデータ結合装置50から外部に取り出すために用いられる。
【0079】
データフュージョン処理部510は、記憶部55が記憶する複数の加工後データベース155を結合して、結合データベース557を生成する。具体的に、データフュージョン処理部510は、糊代として機能する特徴データ内のパラメータを参照し、結合対象の加工後データベース155間で、参照パラメータが表す特徴が類似する特徴データ同士を結合するようにして、結合対象の加工後データベース155間を結合する。
【0080】
上述したように、加工後データベース155が備える各特徴データは、データ提供元が異なる加工後データベース155間でも、顧客のデモグラフィック属性を表すパラメータを共通して有する。本実施例によれば、特徴データは、データ提供元が異なる特徴データ間でも、性別を表すパラメータと、年齢を表すパラメータとを共通して有する。
【0081】
データフュージョン処理部510は、このように結合対象の加工後データベース155が備える特徴データが共通して有するパラメータ(以下、共通パラメータと表現する)を参照して、共通パラメータが表す顧客の特徴が類似する特徴データ同士を結合するように、加工後データベース155間を結合する。
【0082】
加工後データベース155間の結合は、図6Aに示すように、記憶部55が記憶する第1の加工後データベース155を第2の加工後データベース155と結合し、第2の加工後データベース155を第3の加工後データベース155と結合し、第mの加工後データベース155を第(m+1)の加工後データベース155と結合(mは3以上の整数)するようにして、順に加工後データベース155間を結合することで実現することができる。別例としては、特定の加工後データベース155に対して、残りの加工後データベース155の夫々を結合することにより、記憶部55が記憶する加工後データベース155間を、特定の加工後データベース155を中心にスター状に結合することができる(図8A参照)。
【0083】
データフュージョン技術としては種々のものが知られており、本実施例のデータフュージョン処理部510においても、周知のデータフュージョン技術を用いて加工後データベース155間を結合することができる。簡単なデータフュージョン方法によれば、二つの加工後データベース155間における類似する特徴データ同士のマッチング(結合)を次のように行うことができる。
【0084】
例えば、類似度を評価するための共通パラメータ(例えば年齢及び性別)について、これらの共通パラメータを要素とする特徴ベクトルを特徴空間に配置したときの特徴ベクトル間の距離(例えばコサイン距離)を、加工後データベース155間における全ての特徴データの組合せについて算出し、距離が最短の特徴ベクトル同士をマッチングすることにより、共通パラメータが表す顧客の特徴が類似する特徴データ同士を結合するように、加工後データベース155間を結合することができる。
【0085】
二つの特徴データ間の類似度を特徴空間上において距離で評価するときには、輸送問題の解法を援用し、輸送費が「全体で最小」となるように、加工後データベース155間における特徴データ同士のマッチングを行うことも可能である。
【0086】
このようなマッチングにより生成される結合データベース557は、二つの加工後データベース155における特徴データ間を紐付けるデータが格納されたものとして構成され得る。
【0087】
図6Bは、標本数、性別、年齢、購買P1,P2,…,購買Q1,Q2,…のパラメータを有する特徴データを備える加工後データベース155Aと、標本数、性別、年齢、購買R1,R2,…,購買Q1,Q2,…のパラメータを有する特徴データを備える加工後データベース155Bと、を結合した場合における結合データベース557の構成を下段に示す。
【0088】
これらの加工後データベース155A,155Bによれば、共通パラメータは、性別、年齢、購買Q1,Q2,…である。購買P1,P2,…,購買Q1,Q2,…,購買R1,R2,…は、例えばJANコード及び購入場所の組合せ毎の購買パラメータであって、その組合せにおける顧客の購入金額又は購入の有無を表すパラメータであり得る。
【0089】
例えば、購買Pi(iは2以上の整数)は、購買P1と同一JANコードの商品に関する異なる購入場所での顧客の購入金額又は購入の有無を表すパラメータであり得る。購買Qj,Rj(jは1以上の整数)は、購買Pjと異なるJANコードの商品に関する各購入場所での顧客の購入金額又は購入の有無を表すパラメータであり得る。
【0090】
このような構成の加工後データベース155A,155Bを結合した結合データベース557では、互いに結合される加工後データベース155Aの特徴データと加工後データベース155Bの特徴データとが、それらの識別番号の関連付けによって表現される。即ち、結合データベース557では、加工後データベース155Aの特徴データの識別番号に関連付けられて、この特徴データに結合される加工後データベース155Bの特徴データの識別番号が記載される。
【0091】
図6B下段に示すように、加工後データベース155Aにおける一つの特徴データ(A00001)に対して、加工後データベース155Bにおける複数の特徴データ(B20056,B00234,B01123)が関連付けられる場合もあり得る。
【0092】
加工後データベース155における各特徴データは、加工前の複数の特徴データに対応するものであり、加工前特徴データに対応するクラスタ内の標本数が互いに異なるものであり得る。この場合には、各特徴データが標本数に対応する量存在するものとみなして、顧客の特徴が最も類似する特徴データ同士を、同じ標本数分だけ結合し、残りの標本数分の特徴データを、次に類似する特徴データと同一標本数分だけ結合することができる。
【0093】
図6B下段において、A00001、B20056、5.3と記載されたレコードは、加工後データベース155Aの識別番号A00001の特徴データと、加工後データベース155Bの識別番号B20056の特徴データとが、互いに標本数5.3だけ結合されていることを示す。同様に次のレコードは、加工後データベース155Aの識別番号A00001の特徴データと、加工後データベース155Bの識別番号B00234の特徴データとが、互いに標本数8.2だけ結合されていることを示し、更に次のレコードは、加工後データベース155Aの識別番号A00001の特徴データと、加工後データベース155Bの識別番号B01123の特徴データとが、互いに標本数6.5だけ結合されていることを示す。加工後データベース155Aの識別番号A00001の特徴データは、標本数20のクラスタに基づき生成される。即ち、加工後データベース155Aの識別番号A00001の特徴データは、加工後データベース155Bの識別番号B20056、識別番号B00234、及び、識別番号B01123の特徴データに割り振られて結合されている。
【0094】
このように構成される結合データベース557により、加工後データベース155間は互いに結合され、結合データベース557及び加工後データベース155は、一つの巨大なデータベースを構成する。図6Bに示す例によれば、購買R1,R2,…についての情報がない加工後データベース155Aと、購買P1,P2,についての情報がない加工後データベース155Bとが結合されることで、購買P1,P2,…,購買Q1,Q2,…,購買R1,R2,…の情報が連結された巨大なデータベースが構築される。従って、例えば購買P1,P2,…を購入する顧客が、購買R1,R2,…に対してどのような傾向を示すのかを分析することが可能になる。
【0095】
図7は、JANコードと購入場所との組合せ毎のブロックが横方向に配列され、そのブロックの配列が、縦方向において、仮想顧客毎に配置された図であり、ハッチングされたブロックは、対応する仮想顧客が、該当JANコードに対応する商品を該当する購入場所で購入していることを示し、ハッチングされていないブロックは、対応する仮想顧客が、該当JANコードに対応する商品を該当する購入場所で購入していないことを示す。
【0096】
図7によれば、破線に示す領域には、ハッチングされたブロックが集中して存在しており、この領域内においてJANコードと購入場所との組合せに対する購買層が存在することを示している。従って、この領域内において、ハッチングされていないブロックに対応する顧客の層に、対応する商品の広告を行うと、広告の効果が有意義に発揮されることが理解できる。例えば、太線で囲む仮想顧客は、破線に示す領域に対応する購買行動をほとんど起こしていないが、統計上では購買層に該当するために、対応する顧客層に、対応する商品の広告を行うと、広告の効果が有意義に発揮されることが期待される。
【0097】
このようなデータ解析を、従来の顧客に関するデータに基づき行うと、顧客のプライバシーに関する情報が解析過程で詳細に特定される可能性がある。これに対し、本実施例によれば、図6B上段及び図7に示す各行のデータは、統計化された仮想的(擬似的)な顧客に関するデータである。本実施例によれば、統計化されたデータに基づき上記データ解析を行うので、このような従来技術が有する問題の発生を抑えつつも、商業活動に役立つ情報をデータ解析によって得ることができ、大変有益である。
【0098】
以上、本実施例の情報処理システム1について説明したが、本実施例によれば、データ加工装置10が、顧客関連データベース153を加工して、加工後データベース155をデータ結合装置50に提供する。そして、データ結合装置50が、データ加工装置10により生成された複数の加工後データベース155間を結合する。
【0099】
データ加工装置10の演算部11は、加工前の顧客関連データベース153が備える特徴データの一群に基づき、これら特徴データの集合を、特徴が類似する複数の特徴データ毎にクラスタ化し、各クラスタに対応する複数の特徴データを統計処理(換言すれば統合)する。これにより、特徴が類似する複数顧客に対応する仮想顧客毎の特徴データを生成する。特に、演算部11(加工処理部115)は、クラスタ毎に、クラスタに属する複数の特徴データが有する各パラメータについての統計量を算出する。仮想顧客毎の特徴データは、これらの統計量をパラメータ値として含むように生成される。演算部11(加工処理部115)は、このように複数の特徴データが統合された仮想顧客毎の特徴データを備えるデータベースを、加工後データベース155として生成する。
【0100】
加工後データベース155における特徴データの夫々は、加工後データベース155間の結合時に参照される参照データを含む。参照データは、結合対象の加工後データベース155と共通する種類の特徴を表す。上記実施例における参照データは、顧客のデモグラフィック属性として、顧客の性別及び年齢を表すパラメータである。
【0101】
データ結合装置50の演算部51は、複数の加工後データベース155間で参照データが表す特徴が類似する特徴データ同士を結合するように、加工後データベース155間を結合する。
【0102】
この情報処理システム1によれば、データ加工装置10が、複数顧客の特徴データを統計処理して統合し、仮想顧客毎の特徴データを備える加工後データベース155を生成する。例えば、統計処理前の特徴データが一人の顧客の特徴を表す単一顧客のデータである場合、データ加工装置10の動作により、特徴データは、単一顧客のデータから複数顧客の特徴が混合された仮想顧客のデータに変換される。
【0103】
従って、データ提供元では、データ加工装置10を用いて顧客関連データベース153を顧客の個人情報を保護した加工後データベース155に変換でき、個人情報を保護しながらデータ結合装置50に顧客に関するデータを提供することができる。
【0104】
これにより、データ結合装置50の運営者は、以前は情報保護の観点から顧客関連データベース153の提供に消極的であった企業から、加工後データベース155として、顧客関連データベースを入手することができ、データ結合装置50は、データ提供元の異なる各種の顧客に関するデータを結合したデータベースを生成することができる。
【0105】
結果として、この情報処理システム1は、結合データベース557として、社会に分散する各種の顧客に関するデータを統合したデータベースを構築することができ、このデータベースに基づいて、各種の顧客に関するデータを有効活用し、有意義なデータ解析を行うことができる。
【0106】
尚、上記実施例において加工後データベース155間の共通パラメータ(データベース結合時の参照データ)は、顧客の性別及び年齢であった。しかしながら、共通パラメータは、他のパラメータを含んでいてもよい。例えば、共通パラメータは、顧客のデモグラフィック属性として、顧客の性別、年齢、職業、居住地域、所得、学歴、及び、家族構成の少なくとも一つを含むことができる。
【0107】
[第二実施例]
続いて、第二実施例を説明する。本実施例の情報処理システム1は、データ結合装置50において、シングルソースデータを備えるデータベースをハブデータベースH(図8A参照)に位置づけ、このハブデータベースHに、データ加工装置10から提供された各加工後データベース155を結合することにより、複数の加工後データベース155間を、ハブデータベースHを介して結合する。
【0108】
本実施例の情報処理システム1のハードウェア構成は、第一実施例と同様である。本実施例の情報処理システム1は、データ結合装置50の記憶部55が、データ加工装置10から提供される加工後データベース155以外に、ハブデータベースHを有する点を除けば、データフュージョン処理部510の処理動作が上記実施例と異なるだけのものである。従って、以下では、上記実施例と同一構成の説明を適宜省略する。
【0109】
ハブデータベースHを構成するシングルソースデータは、例えば、博報堂株式会社が行っている生活者調査「HABIT(登録商標)」から得られる。HABITは、訪問面接やアンケート形式により、当該調査の協力者の夫々から、ライフスタイル(生活意識や態度)、価値観及びブランド意識に関する種々の情報を、協力者のデモグラフィック属性の情報と共に収集するものである。HABITにより生成される顧客(協力者)毎のシングルソースデータは、購買データ等には現れない顧客の特徴を表す。
【0110】
ハブデータベースHに設けることのできる他のシングルソースデータの例としては、ID−POSから得られる顧客の購買データを含むシングルソースデータや、アンケート形式で得られるマスメディアへの接触状況を表すシングルソースデータを挙げることができる。付言すれば、ハブデータベースHには、これらの複数種類のシングルソースデータを、同一顧客のデータ毎に結合したデータを設けてもよい。
【0111】
ハブデータベースHが備えるシングルソースデータは、顧客の特徴を表す特徴データに該当するものであり、加工後データベース155との結合のために、共通する顧客のデモグラフィック属性を表すパラメータを、加工後データベース155との間の共通パラメータとして有する。
【0112】
本実施例のデータフュージョン処理部510は、図8Aに示すように、このようなシングルソースデータを特徴データとして有するハブデータベースHに、データ加工装置10から提供された各加工後データベース155を結合することにより、複数の加工後データベース155間を、ハブデータベースHを介して結合する。結合方法は、上述した通りである。即ち、データフュージョン処理部510は、共通パラメータが表す特徴が類似する特徴データ同士を結合するようにして、ハブデータベースHと、加工後データベース155の夫々とを結合する。
【0113】
結合データベース557は、例えば、ハブデータベースHの特徴データと、それに結合される各加工後データベース155の特徴データとの関係を、上記実施例と同様に、それらの識別番号の関連付けによって表現する。図8Bに示す結合データベース557では、ハブデータベースHの特徴データの識別番号(H00001)に関連付けられて、この特徴データに結合される加工後データベース155A,155Bの特徴データの識別番号(A12345,B00044)が記載されている。図8Bに示す標本数は、図6Bで説明した通りである。
【0114】
シングルソースデータは、顧客の特徴を良く表す。従って、本実施例のように、顧客の特徴を表す特徴データとしてシングルソースデータを備えるデータベースをハブデータベースHとして、このハブデータベースHを基準に、ハブデータベースHと加工後データベース155の夫々とを結合して、複数の加工後データベース155間を、ハブデータベースHを介して結合すれば、加工後データベース155間の特徴データを一層適切に結びつけることができる。
【0115】
尚、HABIT等のシングルソースデータには、顧客の特徴を表す多様な情報が含まれる。このようなシングルソースデータを備えるハブデータベースHに対して、データ加工装置10から提供された各加工後データベース155を結合する場合には、加工後データベース155が有する顧客の特徴を表すパラメータの種類に応じて、加工後データベース155毎に、参照データを変更することができる。
【0116】
例えば、加工後データベース155が、顧客のネットワークコンテンツとの接触行動を表すパラメータを有する特徴データを備える場合、ハブデータベースHと加工後データベース155との間には、共通パラメータとして、顧客のデモグラフィック属性を表すパラメータに加えて、又は、代えて、顧客のネットワークコンテンツとの接触行動を表すパラメータが含まれる。
【0117】
この場合には、共通パラメータが表す顧客のネットワークコンテンツとの接触行動が類似する特徴データ同士を結合するようにして、ハブデータベースHと、加工後データベース155とを結合することができる。
【0118】
[第三実施例]
続いて、第三実施例を説明する。本実施例の情報処理システム1は、複数のデータ加工装置10及びデータ結合装置50を備える。データ加工装置10及びデータ結合装置50は、第一実施例及び第二実施例と同様のハードウェア構成にされる。以下では、第三実施例の情報処理システム1における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。
【0119】
本実施例の情報処理システム1は、顧客関連データベース153として、図9Aに示す顧客関連データベース1531L,1531Rを有する。図9A左領域には、POSシステムから得られた顧客の購買データを、顧客に関する特徴データとして有する顧客関連データベース1531Lの例を示す。図9A右領域には、顧客が利用するデバイスの利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース1531Rの例を示す。デバイスの例としては、オーブンレンジが挙げられる。
【0120】
図9Aによれば、顧客関連データベース1531Lは、決済毎の特徴データを備える。この特徴データは、顧客のデモグラフィック属性として、顧客の性別、年齢、及び居住地を表すパラメータを有する。更に、この特徴データは、顧客が購入した商品の購入場所、商品コード、購入数、及び、単価を表すパラメータを有する。商品コードは、例えば、JANコードを含む。
【0121】
図9Aによれば、顧客関連データベース1531Rは、オーブンレンジ毎の特徴データを備える。この特徴データは、オーブンレンジを所有する顧客の性別及び年齢を表すパラメータ、オーブンレンジの設置場所、並びに、オーブンレンジにおいて利用された時間帯別の機能及びレシピを表すパラメータを有する。
【0122】
顧客関連データベース1531Lを有するデータ加工装置10は、この顧客関連データベース1531Lにおいて、例えば、性別、年齢及び購買履歴が類似する複数の特徴データをクラスタ化するように構成される。このデータ加工装置10は、第一実施例と同様、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想顧客の特徴データをクラスタ毎に生成するように構成される。
【0123】
このようにして、データ加工装置10は、顧客関連データベース1531Lに対応する、仮想顧客毎の特徴データを備える加工後データベース155を生成する。顧客関連データベース1531Lに対応する加工後データベース155が有する特徴データは、基本的に、顧客関連データベース1531Lの特徴データと同様のパラメータを有する。但し、加工後データベース155の特徴データは、パラメータ値として、対応するクラスタの統計量を示す。顧客IDは、加工時に削除されてよい。
【0124】
別例として、データ加工装置10は、顧客関連データベース1531Lが有する決済単位の特徴データを、同一の顧客IDを示す特徴データ毎にまとめて、個人単位の特徴データに変換するように構成されてもよい。更に、データ加工装置10は、個人単位の特徴データの集合に基づき、購買履歴が類似する複数の特徴データをクラスタ化及び統計処理することにより、顧客関連データベース1531Lに対応する加工後データベース155を生成するように構成されてもよい。
【0125】
一方、顧客関連データベース1531Rを有するデータ加工装置10は、顧客関連データベース1531Rにおいて、例えば、性別、年齢、並びに、機能及びレシピの利用状況が類似する複数の特徴データをクラスタ化するように構成される。更に、データ加工装置10は、クラスタ毎に、同一クラスタに属する複数の特徴データを統計処理することにより、同一クラスタに属する複数の特徴データを統合した仮想デバイスの特徴データをクラスタ毎に生成するように構成される。データ加工装置10は、このようにして顧客関連データベース1531Rに対応する、仮想デバイス毎の特徴データを備える加工後データベース155を生成する。
【0126】
データ結合装置50は、上記顧客関連データベース1531Lに対応する加工後データベース155、及び、顧客関連データベース1531Rに対応する加工後データベース155を結合して、結合データベース557を生成するように構成される。
【0127】
データ結合装置50は、これら加工後データベース155が共通して有する顧客の性別及び年齢を表すパラメータ、並びに、食材に関するパラメータを参照データとして用いて、結合対象の加工後データベース155間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース155間を結合し得る。
【0128】
「食材に関するパラメータ」は、顧客関連データベース1531Lに対応する加工後データベース155において、特徴データが有する商品コード及び購入数を表すパラメータに対応する。顧客関連データベース1531Rに対応する加工後データベース155において、「食材に関するパラメータ」は、利用レシピに対応する。
【0129】
こうして生成される結合データベース557によれば、性別、年齢、購入食材、及び、レシピとの間の対応関係を分析することができる。従って、オーブンレンジを通じて、ユーザが良く購入する食材に対応するお勧めレシピを、ユーザに紹介することができる。また、POSレジスタから出力するレシートに、利用頻度の高いレシピに対応する食材のクーポンを付すことができる。
【0130】
以上には、第三実施例として、顧客関連データベース1531L,1531Rの両者を、特徴が類似する特徴データ毎にクラスタ化して統計処理する例を説明した。しかしながら、顧客関連データベース1531L,1531Lの一方は、統計処理されなくてもよい。
【0131】
即ち、結合データベース557は、顧客関連データベース1531Lの加工後データベース155と、顧客関連データベース1531Rとを結合して生成されてもよいし、顧客関連データベース1531Lと、顧客関連データベース1531Rの加工後データベース155とを結合して生成されてもよい。前者の結合データベース557は、例えば、顧客関連データベース1531Rのデータ提供元に提供可能である。後者の結合データベース557は、例えば、顧客関連データベース1531Lのデータ提供元に提供可能である。
【0132】
[第四実施例]
続いて、第四実施例を説明する。本実施例の情報処理システム1は、第三実施例と同様、基本的には、顧客関連データベース153の構成が第一実施例及び第二実施例と異なるだけのシステムである。本実施例の情報処理システム1が備えるデータ加工装置10及びデータ結合装置50は、第一実施例及び第二実施例と同様のハードウェア構成にされる。
【0133】
以下では、第四実施例の情報処理システム1における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。続いて説明される第五〜第八実施例の情報処理システム1のハードウェア構成及び処理内容も、基本的には、第一実施例及び第二実施例と同様である。
【0134】
本実施例の情報処理システム1は、顧客関連データベース153として、図9Bに示す顧客関連データベース1532L,1532Rを有する。図9B左領域には、POSシステムから得られた顧客の購買データを、顧客に関する特徴データとして有する顧客関連データベース1532Lの例を示す。図9B右領域には、自動販売機の利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース1532Rの例を示す。
【0135】
近年では、液晶ディスプレイ及びカメラを備えた飲料用自動販売機が知られている。この自動販売機は、カメラの撮影画像から、自動販売機の利用者の性別及び年齢を判別し、この判別結果に基づき、お勧め飲料を、液晶ディスプレイを通じて表示する機能を備える。以下に説明する結合データベース557は、自動販売機で表示するお勧め飲料の決定に役立つ。
【0136】
図9Bによれば、顧客関連データベース1532Lは、第三実施例の顧客関連データベース1531Lと同様に構成される。この顧客関連データベース1532Lは、飲料に関しての購買履歴を表す特徴データを備える。
【0137】
図9Bによれば、顧客関連データベース1532Rは、各自動販売機における飲料販売毎の特徴データを備える。この顧客関連データベース1532Rを構成する特徴データは、自動販売機の設置場所及びメーカーを表す。更に、この特徴データは、飲料販売時の気象及び時刻、並びに、購入者のデモグラフィック属性としての性別及び年齢を表す。更に、この特徴データは、購入者が購入した飲料の商品コード、購入数、及び、単価を表す。この他、特徴データは、販売時の在庫情報を表す。自動販売機の設置場所は、例えば、自動販売機が設置された地点の緯度経度で表される。
【0138】
顧客関連データベース1532Lを有するデータ加工装置10は、例えば、顧客関連データベース1532Lにおいて、性別、年齢及び購買履歴が類似する複数の特徴データをクラスタ化し、第三実施例と同様に、顧客関連データベース1532Lに対応する加工後データベース155を生成するように構成される。
【0139】
顧客関連データベース1532Rを有するデータ加工装置10は、例えば、顧客関連データベース1532Rにおける設置場所、メーカー及び在庫情報等が類似する複数の特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想デバイス(自動販売機)の特徴データをクラスタ毎に生成するように構成される。
【0140】
データ加工装置10は、このようにして、顧客関連データベース1532Rに対応する、仮想デバイス毎の特徴データを備える加工後データベース155を生成するように構成される。
【0141】
データ結合装置50は、上記顧客関連データベース1532Lに対応する加工後データベース155、及び、顧客関連データベース1532Rに対応する加工後データベース155を結合して、結合データベース557を生成するように構成される。
【0142】
例えば、データ結合装置50は、顧客の性別及び年齢を表すパラメータ、並びに、場所に関するパラメータを参照データとして用いて、結合対象の加工後データベース155間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース155間を結合する。
【0143】
ここで言う「場所に関するパラメータ」は、顧客関連データベース1532Lに対応する加工後データベース155において、特徴データが有する購入場所を表すパラメータに対応する。一方、顧客関連データベース1532Rに対応する加工後データベース155において、「場所に関するパラメータ」は、自動販売機の設置場所を表すパラメータに対応する。
【0144】
こうして生成される結合データベース557によれば、例えば、コンビニエンスストアやスーパーマーケット等の店舗での消費者の購買行動と、自動販売機での消費者の購買行動との間の対応関係を分析することができる。従って、この結合データベース557に基づいては、自動販売機において、自動販売機の前に立つ利用者の年齢及び性別に対応する購買層が同地域の店舗で良く購入する飲料を、その利用者にお勧めすることができる。店舗では、POSレジスタから出力するレシートに、同地域の自動販売機で、購入者の年齢及び性別に対応する売れ筋の飲料のクーポンを付すことができる。
【0145】
第三実施例と同様に、顧客関連データベース1532L及び顧客関連データベース1532Rの一方は、統計処理されなくてもよい。即ち、結合データベース557は、顧客関連データベース1532Lの加工後データベース155と、顧客関連データベース1532Rとを結合したものであってもよいし、顧客関連データベース1532Lと、顧客関連データベース1532Rの加工後データベース155とを結合したものであってもよい。この技術的思想は、後述する第五〜第八実施例に対しても適用することができる。
【0146】
[第五実施例]
続いて、第五実施例を説明する。以下では、第五実施例の情報処理システム1における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム1は、顧客関連データベース153として、図10Aに示す顧客関連データベース1533L,1533Rを有する。
【0147】
図10A左領域には、スマートフォンに代表される携帯端末を所有するユーザの特徴を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース1533Lの例を示す。図10A右領域には、駅の利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース1533Rの例を示す。
【0148】
図10Aによれば、顧客関連データベース1533Lは、携帯端末毎に特徴データを有する。この特徴データは、携帯端末を所有するユーザのデモグラフィック属性として性別、年齢及び居住地を表す。更に、この特徴データは、ユーザの移動履歴、及び、各移動地点の気象を表す。更に、この特徴データは、携帯端末にインストールされたアプリケーションプログラムを通じて、ユーザにより利用されたクーポンの利用状況を表す。
【0149】
一方、顧客関連データベース1533Rは、駅、改札口、気象、及び時間帯の組合せ毎に、特徴データを有する。この顧客関連データベース1533Rを構成する特徴データは、対応する駅及び改札口の通行データとして、この改札口の通行人の性別及び年齢、並びに、通行時間帯及び通行時の気象を表す。通行人の性別及び年齢は、定期券の情報から、又は、カメラによる撮影画像から得ることができる。
【0150】
顧客関連データベース1533Lを有するデータ加工装置10は、例えば、顧客関連データベース1533Lにおいて、性別、年齢、移動状況及びクーポン利用状況が類似する複数の特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想携帯端末の特徴データをクラスタ毎に生成する。このようにして、データ加工装置10は、顧客関連データベース1533Lに対応する、仮想携帯端末毎の特徴データを備える加工後データベース155を生成する。
【0151】
顧客関連データベース1533Rを有するデータ加工装置10は、顧客関連データベース1533Rにおいて、特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に上記統計処理を行うことにより、駅、改札口、気象及び時間対の組合せについての仮想組合せ毎の特徴データを備える加工後データベース155を生成する。
【0152】
データ結合装置50は、上記顧客関連データベース1533Lに対応する加工後データベース155、及び、顧客関連データベース1533Rに対応する加工後データベース155を結合して、結合データベース557を生成するように構成される。
【0153】
例えば、データ結合装置50は、これら加工後データベース155が共通して有する性別及び年齢を表すパラメータ、並びに、場所及び気象に関するパラメータを参照データとして用いて、結合対象の加工後データベース155間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース155間を結合する。
【0154】
こうして生成される結合データベース557によれば、例えば、駅周辺での消費者の行動及びクーポン利用状況と、駅及び改札口における通行人の傾向との間の対応関係を分析することができる。従って、この結合データベース557に基づいては、改札口を通過したユーザの携帯端末に、駅周辺店舗の利用促進を目的としたクーポンを適切に配信することができる。
【0155】
[第六実施例]
続いて、第六実施例を説明する。以下では、第六実施例の情報処理システム1における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム1は、顧客関連データベース153として、図10Bに示す顧客関連データベース1534L,1534Rを有する。
【0156】
図10B左領域には、ETCカードを所有する顧客の特徴データを有する顧客関連データベース1534Lの例を示す。ETCカードは、周知のように、電子料金収受(ETC)システム用のクレジットカードである。図10B右領域には、インターチェンジ及び通行ゲートの組合せ毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース1534Rの例を示す。
【0157】
図10Bによれば、顧客関連データベース1534Lは、ETCカード毎に特徴データを有する。この特徴データは、ETCカードに関連付けられた車載器のIDを表す。また、この特徴データは、ETCカードを所有する顧客の性別、年齢及び居住地を表す。更に、この特徴データは、通行ゲートのID及び通行日時を表す。
【0158】
一方、顧客関連データベース1534Rを構成する特徴データは、対応するインターチェンジの対応する通行ゲートを通行した車両のETCカード番号、車載器ID、及び通行日時を表す。更に、この特徴データは、通行車両数及び周辺施設情報を有する。
【0159】
顧客関連データベース1534Lを有するデータ加工装置10は、例えば、顧客関連データベース1534Lにおいて、性別、年齢及び移動状況が類似する複数の特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想顧客(カード)毎の特徴データをクラスタ毎に生成する。このようにして、データ加工装置10は、顧客関連データベース1534Lに対応する、仮想顧客(カード)毎の特徴データを備える加工後データベース155を生成する。
【0160】
顧客関連データベース1534Rを有するデータ加工装置10は、顧客関連データベース1534Rにおいて、特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に上記統計処理を行うことにより、仮想通行ゲート毎の特徴データを備える加工後データベース155を生成する。
【0161】
データ結合装置50は、これらの顧客関連データベース1534Lに対応する加工後データベース155、及び、顧客関連データベース1534Rに対応する加工後データベース155を結合して、結合データベース557を生成するように構成される。
【0162】
こうして生成される結合データベース557に基づけば、カーナビゲーション装置等の車載器又はクレジットカード会社を通じて、顧客に対し、通行ゲート周辺の施設の利用促進を目的としたクーポンを適切に配信することができる。
【0163】
[第七実施例]
続いて、第七実施例を説明する。以下では、第七実施例の情報処理システム1における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム1は、顧客関連データベース153として、図11Aに示す顧客関連データベース1535L,1535Rを有する。
【0164】
図11A左領域には、ディジタルサイネージ毎に、ディジタルサイネージの前を通過する通行人毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース1535Lの例を示す。図11A右領域には、各駅の改札口毎に、改札口を通行する通行人毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース1535Rの例を示す。
【0165】
図11Aによれば、顧客関連データベース1535Lが有する特徴データは、ディジタルサイネージの設置場所を表す。また、この特徴データは、通行人の性別、年齢及び通行日時を表す。通行人の性別及び年齢は、ディジタルサイネージ又はその付近に設置されたカメラによる撮影画像から判別することができる。この特徴データは、更に、ディジタルサイネージ付近の時間帯別通行人数、時間帯別のディジタルサイネージの視聴者数、及び、時間帯別の出稿情報を表すデータであってもよい。
【0166】
一方、顧客関連データベース1535Rが有する通行人毎の特徴データは、通行人の性別、年齢及び通行日時、並びに、通行改札口のID及び当該改札口を有する駅のIDを表す。
【0167】
顧客関連データベース1535Lを有するデータ加工装置10は、例えば、顧客関連データベース1535Lにおいて、通行人の特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想通行人の特徴データをクラスタ毎に生成する。このようにして、データ加工装置10は、顧客関連データベース1535Lに対応する仮想通行人毎の特徴データを備える加工後データベース155を生成する。
【0168】
顧客関連データベース1535Rを有するデータ加工装置10は、例えば、顧客関連データベース1535Rにおいて、通行人の特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に上記統計処理を行うことにより、仮想通行人毎の特徴データを備える加工後データベース155を生成する。
【0169】
データ結合装置50は、顧客関連データベース1535Lに対応する加工後データベース155、及び、顧客関連データベース1535Rに対応する加工後データベース155を結合して、結合データベース557を生成するように構成される。
【0170】
例えば、データ結合装置50は、これらの加工後データベース155が共通して有する通行人の性別及び年齢を表すパラメータ、並びに、場所に関するパラメータを参照データとして用いて、結合対象の加工後データベース155間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース155間を結合する。
【0171】
「場所に関するパラメータ」は、顧客関連データベース1535Lに対応する加工後データベース155において、特徴データが有するディジタルサイネージの設置場所を表すパラメータに対応する。顧客関連データベース1535Rに対応する加工後データベース155において、「場所に関するパラメータ」は、駅及び改札口を表すパラメータに対応する。
【0172】
こうして生成される結合データベース557によれば、例えば、改札口の通行人と、ディジタルサイネージ前の通行人との対応関係を分析することができ、改札口の通行人の変化に合わせて、ディジタルサイネージに表示させる広告を適切に切り替えることができる。
【0173】
[第八実施例]
続いて、第八実施例を説明する。以下では、第八実施例の情報処理システム1における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム1は、顧客関連データベース153として、図11Bに示す顧客関連データベース1536L,1536Rを有する。
【0174】
図11B左領域には、カメラによる監視エリアに映った通行人毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース1536Lの例を示す。図11B右領域には、飲料用自動販売機の利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース1536Rの例を示す。
【0175】
図11Bによれば、顧客関連データベース1536Lが有する特徴データは、通行人が映った場所(監視エリア)及び時間帯を表す。また、この特徴データは、通行人の性別及び年齢を表す。更に、特徴データは、通行人の滞留時間(通行時間)を表すものであってもよい。
【0176】
顧客関連データベース1536Rは、各自動販売機における飲料販売毎の特徴データを備える。この顧客関連データベース1536Rを構成する特徴データは、第四実施例における顧客関連データベース1532Rが有する特徴データと同様に構成される。
【0177】
顧客関連データベース1536Lを有するデータ加工装置10は、顧客関連データベース1536Lにおいて、通行人の特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想通行人の特徴データをクラスタ毎に生成する。このようにして、データ加工装置10は、顧客関連データベース1536Lに対応する、仮想通行人毎の特徴データを備える加工後データベース155を生成する。
【0178】
顧客関連データベース1536Rを有するデータ加工装置10は、顧客関連データベース1536Rにおいて、購入者の特徴が類似する特徴データ毎にクラスタ化して、仮想購入者毎の特徴データを備える加工後データベース155を生成する。
【0179】
データ結合装置50は、顧客関連データベース1536Lに対応する加工後データベース155、及び、顧客関連データベース1536Rに対応する加工後データベース155を結合して、結合データベース557を生成するように構成される。
【0180】
例えば、データ結合装置50は、これら加工後データベース155が共通して有する性別及び年齢を表すパラメータ、並びに、場所に関するパラメータを参照データとして用いて、結合対象の加工後データベース155間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース155間を結合する。「場所に関するパラメータ」は、顧客関連データベース1536Lに対応する加工後データベース155において、特徴データが有する通行人が映った場所を表すパラメータに対応する。一方、顧客関連データベース1536Rに対応する加工後データベース155において、「場所に関するパラメータ」は、自動販売機の設置場所を表すパラメータに対応する。
【0181】
こうして生成される結合データベース557によれば、例えば、通行人の分布及び滞留時間と、自動販売機の購買行動との対応関係を分析することができる。この分析結果は、自動販売機の在庫管理、品揃え、及び、お勧め表示に役立てることができる。
【0182】
[その他]
以上、本発明の実施例について説明したが、本発明は、上記実施例に限定されるものではなく、種々の態様を採ることができる。例えば、上記実施例では、結合対象のデータベース(加工後データベース155又は顧客関連データベース153)間の顧客グループが一致しない例について説明した。しかしながら、同一顧客グループについての異なる種類の特徴を表すデータベース間を結合するために、本発明の技術は、用いられてもよい。例えば、同一顧客グループについてのコンビニエンスストアにおける購買データと、スーパーマーケットにおける購買データと、を結合するために、本発明の技術が用いられてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本発明の実施形態である。
【0183】
最後に用語間の対応関係について説明する。データ加工装置10が備える演算部11(特にクラスタリング処理部110及び加工処理部115)は、生成手段の一例に対応し、データ結合装置50が備える演算部51(特にデータフュージョン処理部510)は、結合手段の一例に対応する。また、データ結合装置50が備える記憶部55は、記憶手段の一例に対応する。また、データベース(顧客関連データベース153/加工後データベース155)を構成する特徴データの集合、又は、この集合に対応する人、物(例えば携帯端末/自動販売機/オーブンレンジ/カード)、若しくは、場所(例えば改札口/通行ゲート)の集合は、グループの一例に対応する。この集合の要素は、構成体の一例に対応する。
【符号の説明】
【0184】
1…情報処理システム、10…データ加工装置、11…演算部、13…CPU、14…RAM、15…記憶部、17…入力部、19…出力部、110…クラスタリング処理部、115…加工処理部、151…各種プログラム、153,1531L,1531R,1532L,1532R,1533L,1533R,1534L,1534R,1535L,1535R,1536L,1536R…顧客関連データベース、155,155A,155B…加工後データベース、50…データ結合装置、51…演算部、53…CPU、54…RAM、55…記憶部、57…入力部、59…出力部、510…データフュージョン処理部、551…各種プログラム、557…結合データベース、H…ハブデータベース。
【要約】
【課題】各種データを有効活用可能な技術を提供する。
【解決手段】情報処理システム(1)の生成手段(10)は、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の特徴データを統合した仮想構成体毎の特徴データを備える第一のデータベースを生成する。情報処理システム(1)の結合手段(50)は、第一のデータベースを、第二のグループにおける構成体毎の特徴データを備える第二のデータベースと結合する。第一及び第二のデータベースが備える特徴データの夫々は、共通する種類の特徴を表す参照データを含む。情報処理システム(1)の結合手段(50)は、第一のデータベースと第二のデータベースとの間で参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、第一のデータベースと第二のデータベースとを結合する。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11