特開2015-76076(P2015-76076A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カルチュア・コンビニエンス・クラブ株式会社の特許一覧

<>
  • 特開2015076076-顧客データ解析システム 図000003
  • 特開2015076076-顧客データ解析システム 図000004
  • 特開2015076076-顧客データ解析システム 図000005
  • 特開2015076076-顧客データ解析システム 図000006
  • 特開2015076076-顧客データ解析システム 図000007
  • 特開2015076076-顧客データ解析システム 図000008
  • 特開2015076076-顧客データ解析システム 図000009
  • 特開2015076076-顧客データ解析システム 図000010
  • 特開2015076076-顧客データ解析システム 図000011
  • 特開2015076076-顧客データ解析システム 図000012
  • 特開2015076076-顧客データ解析システム 図000013
  • 特開2015076076-顧客データ解析システム 図000014
  • 特開2015076076-顧客データ解析システム 図000015
  • 特開2015076076-顧客データ解析システム 図000016
  • 特開2015076076-顧客データ解析システム 図000017
  • 特開2015076076-顧客データ解析システム 図000018
  • 特開2015076076-顧客データ解析システム 図000019
  • 特開2015076076-顧客データ解析システム 図000020
  • 特開2015076076-顧客データ解析システム 図000021
  • 特開2015076076-顧客データ解析システム 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2015-76076(P2015-76076A)
(43)【公開日】2015年4月20日
(54)【発明の名称】顧客データ解析システム
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20150324BHJP
【FI】
   G06Q30/02 100
【審査請求】有
【請求項の数】8
【出願形態】OL
【全頁数】24
(21)【出願番号】特願2013-214213(P2013-214213)
(22)【出願日】2013年10月11日
(71)【出願人】
【識別番号】503342764
【氏名又は名称】カルチュア・コンビニエンス・クラブ株式会社
(74)【代理人】
【識別番号】100071320
【弁理士】
【氏名又は名称】田辺 敏郎
(74)【代理人】
【識別番号】100126756
【弁理士】
【氏名又は名称】田辺 恵
(72)【発明者】
【氏名】毛谷村 剛太郎
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB02
(57)【要約】
【課題】運用会社システムに蒐集・蓄積される顧客データの解析を、高い精度で短時間に行う解析システムを提供することを目的とする。
【解決手段】顧客データ解析システム1は、運用会社システム2に蒐集・蓄積される明細データを解析するシステムであって、任意の明細データの複数の項目を説明変数とし、他の複数の項目を目的変数として項目間の相関度から複数の項目の確率値を確率推論により算出する予測処理手段を有することを特徴とする顧客データ解析システムである。
【選択図】 図1
【特許請求の範囲】
【請求項1】
運用会社システムに蒐集・蓄積される明細データを解析するシステムであって、任意の明細データの複数の項目を説明変数とし、他の複数の項目を目的変数として、複数の項目の確率値を確率推論により算出する予測処理手段を有することを特徴とする顧客データ解析システム。
【請求項2】
任意の明細データの複数の項目を説明変数とし、他の複数の項目を目的変数とし、かつ、前記目的変数を次世代以下の目的変数のための説明変数として、複数の項目の確率値を確率推論により算出する予測処理手段を有することを特徴とする請求項1記載の顧客データ解析システム。
【請求項3】
明細データをサマライズして解析に適した明細データにより構成されるデータマートを生成するデータマート生成処理手段を有することを特徴とする請求項1または2記載の顧客データ解析システム。
【請求項4】
任意の数の顧客の明細データをサンプリングするサンプリング処理手段を有することを特徴とする請求項1乃至3のいずれかに記載の顧客データ解析システム。
【請求項5】
明細データの項目について予測処理をし得られた確率値と、蒐集された実績値の明細データから得られる事前確率値との差分を判定する検証手段を有することを特徴とする請求項1乃至4のいずれかに記載の顧客データ解析システム。
【請求項6】
検証手段により確率値と事前確率値の差分が任意の値以下と判定されるまで、予測処理の予測テストモデルを修正する修正手段を有することを特徴とする請求項5に記載の顧客データ解析システム。
【請求項7】
検証手段により任意の値以下の差分と判定された予測テストモデルを予測処理の予測モデルとし、前記予測モデルにより、全顧客の明細データを予測処理して確率値を算出するスコアリング手段を有することを特徴とする請求項6に記載の顧客データ解析システム。
【請求項8】
算出された確率値を、閾値判定し、マップ推定値を算出することを特徴とする請求項1乃至7のいずれかに記載の顧客データ解析システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、顧客に関するデータを蒐集し、これを解析するシステムに関するものである。
【背景技術】
【0002】
ポイントカード、クレジットカードの加入者、セールスネットワーク加入者、顧客台帳登録者などを通じて、会員顧客に関する様々なデータが日々蒐集され、データベースに蓄積されているこのようなデータは、例えば、顧客の趣向に沿った商品の広告を配信するために用いられていることが知られている(引用文献1〜5)。また、顧客から蒐集されるデータは、上述のような顧客に対する広告等レコメンドのための最適な顧客の抽出のための分析、商品・サービス開発のためのリサーチや商品・サービス販売傾向のリサーチ等の市場調査のための分析に代表される様々な分析の基礎となるデータとして利用することが可能である。従来は、このような分析の基礎となるデータを生成するための解析手法としては、1つの項目に紐づけられたデータに対して、他の1つの項目に紐づけられたデータがどの程度影響を与えるかを知るべく、1つの目的変数毎にモデルを作り1つまたは複数の目的変数毎にスコアリングを行う手法を採っていた。しかしながら、多数の顧客から提供される莫大なデータ量の、ビッグデータ等と呼ばれる生データを解析する場合、上記解析手法では、複数の目的変数に対してスコアリングする場合演算に長い時間がかかり演算装置に多大な負荷をかけることから、この点の改善が要請されていた。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−211687号公報
【特許文献2】特開2009−163533号公報
【特許文献3】特開2012−247926号公報
【特許文献4】特開2004−70504号公報
【特許文献5】特開2012−190061号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
そこで本発明は、蒐集されるデータを効率よく解析して、広告、市場調査等の様々な分析の局面において利用可能な、分析の基礎となるデータを短時間で生成することのできるシステムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の顧客データ解析システムは、運用会社システムに蒐集・蓄積される明細データを解析するシステムであって、任意の明細データの複数の項目を説明変数とし、他の複数の項目を目的変数として、複数の項目の確率値を確率推論により算出する予測処理手段を有することを特徴とする。
【0006】
本発明の他の形態によれば、任意の明細データの複数の項目を説明変数とし、他の複数の項目を目的変数とし、かつ、前記目的変数を次世代の目的変数のための説明変数として、他の複数の項目の確率値を確率推論により算出する予測処理手段を有することを特徴とする。
【0007】
明細データをサマライズして解析に適した明細データにより構成されるデータマートを生成するデータマート生成処理手段を有することを特徴とする。
【0008】
任意の数の顧客の明細データをサンプリングするサンプリング処理手段を有することを特徴とする。
【0009】
明細データの項目について予測処理をし得られた確率値と、蒐集された実績値の明細データから得られる事前確率値との差分を判定する検証手段を有することを特徴とする。
【0010】
検証手段により確率値と事前確率値の差分が任意の値以下と判定されるまで、予測処理の予測テストモデルを修正する修正手段を有することを特徴とする。
【0011】
検証手段により任意の値以下の差分と判定された予測テストモデルを予測処理の予測モデルとし、前記予測モデルにより、全顧客の明細データを予測処理して確率値を算出するスコアリング手段を有することを特徴とする。
【0012】
算出された確率値を、閾値判定し、マップ推定値を算出することを特徴とする。
【発明の効果】
【0013】
本発明によれば、目的変数がいくつであっても予測モデル作成プロセス、スコアリングプロセスを一度で行うことができる。
【図面の簡単な説明】
【0014】
図1】本発明の顧客データ解析システムのブロック図である。
図2】本発明の顧客データ解析システムのフローチャートである。
図3】本発明の明細データ解析段階を示すフローチャートである。
図4】従来の予測処理の模式図である。
図5】本発明の顧客データ解析システムの予測処理の模式図である。
図6】本発明の顧客データ解析システムの予測処理の模式図である。
図7】本発明の顧客データ解析システムの予測処理の模式図である。
図8】本発明の顧客データ解析システムの予測処理の模式図である。
図9】本発明の顧客データ解析システムの予測処理の模式図である。
図10】本発明の顧客データ解析システムの予測処理の模式図である。
図11】本発明の顧客データ解析システムの予測処理の模式図である。
図12】本発明の顧客データ解析システムのデータテーブルの例である。
図13】本発明の顧客データ解析システムのデータテーブルの例である。
図14】本発明の顧客データ解析システムのデータテーブルの例である。
図15】本発明の顧客データ解析システムの解析結果の利用例としての波形生成処理及び近似率算出処理のフローチャートである。
図16】波形生成処理後のグラフである。
図17】波形生成処理後のグラフである。
図18】波形生成処理後のグラフである。
図19】近似率算出処理の算出例である。
図20】近似率算出処理の算出例である。
【発明を実施するための最良の形態】
【0015】
(システムの構成)
以下、図面を参照して本発明の顧客データ解析システム1について説明する。
図1に示すように、顧客データ解析システム1(以下、単にシステム1ということがある。)は、運用会社の管轄下にある演算装置、データベース群等からなる運用会社システム2、運用会社システム2と情報伝達可能に接続されてなり演算装置、入出力端末等からなるECサイト等のネットアライアンスシステム3、運用会社システム2と情報伝達可能に接続されてなり演算装置、入出力端末等からなる実店舗に設置されるリアルアライアンスシステム4と、アンケート手段5を有している。
【0016】
図1を参照して、システム1の概略について説明する。システム1は、ネットアライアンスシステム3、リアルアライアンスシステム4、アンケート手段5等を介してシステム1を利用する顧客から蒐集される各種データを蓄積し、解析するシステムである。顧客から運用会社システム2に蓄積されるデータには、第1に、個々の顧客に対してシステムの利用登録時に付与する顧客ID、システム1の利用登録時に顧客より提供される性別、年齢等の顧客の基本属性等の属性データがある。第2に、顧客がアライアンス企業で商品・サービス(以下、商品等という。)を購入するたびに、蒐集され、伝達される商品等の品目や商品名、来店時間帯、利用店舗等の履歴系データと、任意のアンケートを通じて顧客より蒐集され伝達される結婚の有無、子供の有無、住居の種別、年収、運転免許の有無、顧客の志向性等のリサーチ系データを含む明細データがある。属性データは、会員マスタデータベースに蓄積され顧客の属性データに変更がある場合には更新される。また、明細データは、随時、運用会社システム2に提供され解析データベースに蓄積される。
【0017】
このように蒐集される各データは、顧客IDにより管理される。顧客IDの一例を挙げれば、顧客毎に異なる任意の桁数の数字や文字列が一例であり、顧客がポイントカードを保有している場合には、当該顧客IDは、該カードに磁気的、電気的など様々な方式により記録され、リアルアライアンスシステム4のPOS端末等の入力手段で顧客IDが読み取られ、顧客IDと顧客データが紐づけられた状態で運用会社システム2へ伝達可能になっている。またネットアライアンスシステム3を通じて伝達される場合には、顧客の保有する携帯端末やコンピュータ等の顧客端末の入力手段で顧客IDが入力され、顧客IDと顧客データに紐づけられた状態で運用会社システム2へ伝達可能になっている。
【0018】
尚、システム1においては付随的な機能となるサービスポイント加算・減算処理は、運用会社システム2のポイント系システムで行われ、顧客がアライアンス企業において商品等を購入した際や、その他様々な機会にサービスポイントを利用し、サービスポイントを貯めるたびに、つまり、サービスポイントの加算・減算データが伝達されるたびに、その顧客の顧客IDに対応する口座のサービスポイントの加算・減算処理を行うようになっている。
【0019】
(明細データの蒐集・蓄積とその解析処理)
図2のフローチャートに示すように、本発明のシステム1の基幹となるのは、明細データの蒐集・蓄積とその解析処理である。システム1のオーソドックスなフローは、顧客がアライアンス企業において商品等を購入するたびに運用会社システム2に伝達される明細データを蒐集処理(S1)し、取得した明細データを蓄積する明細データ蓄積処理(S2)をする、2つのステップからなる明細データ蒐集蓄積段階と、データマートの生成処理(S3)、サンプリング処理(S4)、モデリング処理(S5)、検証処理(S6)、スコアリング処理(S7)そして解析結果算出処理(S8)のステップからなる明細データ解析段階で構成されている。
【0020】
(明細データ蒐集・蓄積処理段階)
明細データの蒐集処理(S1)は、リアルアライアンスシステム4においては、顧客が商品等を購入する際に、POS端末から履歴系入力手段により明細データが入力され、明細データに顧客IDが紐づけられた状態でインターネット回線あるいは専用回線等の通信回線を介して運用会社システム2に伝達される。また、ネットアライアンスシステム3においては、商品等を購入した際に、顧客端末から明細データと顧客IDが紐づけられた状態でインターネット回線等の通信回線を介して運用会社システム2に伝達される。
【0021】
次に明細データ蓄積処理(S2)より、リアルアライアンスシステム4、ネットアライアンスシステム3を通じて運用会社システム2に伝達された明細データは、解析データデータベースに蓄積される。このように、明細データの蒐集・蓄積は、明細データが伝達されるたびに行われるようになっている。
【0022】
(明細データ解析段階)
明細データ解析段階の最初のステップとしてのデータサマライズ処理(S3)について説明する。データサマライズ処理は、属性データ及び/又は明細データを必要に応じて離散化処理し、さらにこの属性データ及び/又は明細データを、カテゴリーデータ、上位階層、或いは大分類・中分類の項目群にまとめることによりデータマートを生成する処理である。データマートを生成することにより、属性データ及び/又は明細データを解析しやすいデータ項目にまとめることができる。データマート生成処理の一例を、図12を参照して説明する。例えば、属性データの「性別」のように連続量ではない項目についてはカテゴリカルデータにまとめる処理を行う。また、明細データの履歴系データに関する商品等の品目については「フライドチキン、フライドポテト、ウィンナー」を中分類の「惣菜」に括り、「さけおにぎり、梅おにぎり、ツナおにぎり」を中分類の「おにぎり」に括る処理を行う。このように、項目の特性に応じた手法で属性データと明細データを解析しやすい項目数にまとめるデータマート生成処理がなされる。この項目数は、演算処理装置の処理能力、アライアンス企業が提供を求めるデータ項目に鑑みて決定される。例えば、現在は、約3000項目程度にサマライズすることが解析に適しているが、項目数は任意である。
【0023】
次に、後述する予測モデルを作成するプロセス、スコアリングのプロセスの根幹となる本発明の予測処理について説明する。従来の予測処理は、図4に示すように、1の目的変数に対して、1または複数の説明変数を与え、1の項目について(結婚している、結婚していない)に対する、説明変数の影響度合いを算出する処理を行っていた。つまり、1の目的変数項目について(結婚している、結婚していない)の確率値を算出しようとすれば、1の目的変数に対して目的変数の数だけ予測処理をする必要があった。
【0024】
一方、図3図5図11に示す本発明の新規な予測処理は、例えばベイジアンネットワークに代表される確率推論を利用して、任意の明細データの複数の項目を目的変数とし、他の複数の項目を説明変数として項目間の相関度から複数の項目の確率値を確率推論により算出するものである。
【0025】
以下、図5図11に示す予測処理の模式図を参照して、本発明の予測処理について説明する。図5図7に示すケース1は、予測処理が1階層モデルの場合である。図5に示すように、任意の顧客Aの予測処理について、結婚の有無の確率を目的変数とすると、顧客Aに関する情報が運用会社システム2に何も提供されていない状態、つまり、顧客Aの説明変数に何も明細データが無い状態では、結婚の有無の確率値は、リサーチ系データを提供した顧客らのデータから得られる事前確率値(既婚0.5478、未婚0.4252)が結婚有無の項目に振られる。同様に他の説明変数(調味料購入、惣菜購入、深夜時間利用比率)についても何も明細データが無い状態では、履歴系データを提供した顧客らのデータから得られる調味料購入の事前確率値(多い0.2 少ない0.8)、惣菜購入の事前確率値(購入あり0.35、購入なし0.65)、深夜時間帯の利用比率の事前確率値(多い0.1、普通0.3、少ない0.6)が振られる。
【0026】
図6を参照すると、次に、顧客Aの説明変数のうち惣菜購入について「購入あり」の明細データが提供されると、惣菜購入ありの項目の確率値(1.0)が入り、予測処理がなされると、目的変数たる未婚の確率値は0.4252(約43%)から約0.63(63%)に上がる。
【0027】
図7を参照すると、さらに顧客Aの説明変数のうち深夜時間帯の利用について「多い」の明細データが提供されると、深夜時間帯比率の項目の確率値(1.0)が入り、目的変数たる未婚の確率値は0.63(63%)から、さらに0.9(90%)に上がるという予測処理が為される。
【0028】
次に図8図11に示す予測処理の模式図を参照して、2階層モデルの場合の予測処理について説明する。図8に示す様に、任意の顧客Aの予測処理について、手作り志向の確率を第2の目的変数とすると、顧客Aの明細データが無い状態では、手作り志向の確率値は、リサーチ系データを提供した顧客らのデータから得られる事前確率値(高い0.4809、低い0.5191)が振られ、第1の目的変数の結婚の有無の確率値は、リサーチ系データを提供した顧客らのデータから得られる事前確率値(既婚0.5748、未婚0.4252)が振られる。
【0029】
図9を参照すると、次に、顧客Aの説明変数のうち調味料購入について「購入多い」の明細データが得られると、上述した1階層モデルの仕組みと同様に、調味料購入多いの確率値(1.0)が入り、予測処理により、手作り志向の確率値は0.4809(約48%)から0.715(約71%)に上がる。
【0030】
さらに、顧客Aの説明変数のうち惣菜購入について「購入なし」の明細データが得られると、惣菜購入なしの確率値(1.0)が入り、第1の目的変数たる結婚の有無の既婚の確率値が0.5748(約57%)から0.685(約68%)に上がる。さらに、第1の目的変数たる結婚の有無は、第2の目的変数たる手作り志向に対する説明変数でもあることから、惣菜購入なしの確率値(1.0)の変動により、第1の目的変数結婚の有無の確率値が変動し、この第1の目的変数の変動が第2の目的変数の変動に伝播して、第2の目的変数たる手作り志向の確率値は、さらに0.715(約71%)から0.737(約74%)に上がる。
【0031】
図11に示すように、予測処理は説明変数(親)の確率値の変動が、第1の目的変数(子)の確率値を変動させる処理であり、第1の目的変数(子)が更なる説明変数(親)であるとき、第2の目的変数(子(最初の説明変数に対しては孫))の確率値を変動させる処理である。つまり、1の目的変数が次世代以下の目的変数に対しては説明変数ともなり、必要に応じてリンクされている全ての目的変数(第n世代の目的変数)まで設定することができる。つまり本発明の予測処理は、任意の説明変数の明細データが入ることで、これにリンクする各項目の確率値を算出する予測処理がなされ、リンクされている全ての目的変数の確率値に影響を与える。また、2階層以上の予測処理では、親世代の説明変数の実績値が入ることで、リンクされている(子、孫、第n世代の目的変数)変動に影響が伝播し、各項目の確率値を算出する予測処理をする。これが予測モデルの作成プロセスとスコアリングのプロセスで確率値を算出する予測処理であるが、ここでは、親、子、孫の関係で予測処理の伝播モデルを示したが、予測処理のリンクはこのような一方向のものに限られるものではない。
【0032】
次に、スコアリング処理に使用する予測モデルを作成するプロセスについて説明する。まず、サンプリング処理(S4)は、全顧客分の明細データの予測処理のために精度の高い予測モデル、すなわち確率推論の演算体系を作成する前段階として、予測テストモデルを作成するため、任意の顧客を抽出する動作である。サンプリング処理手段は、任意の数の顧客(例えば、100万人分)のサマライズ後のデータマート(例えば3000項目のデータマート)を抽出する処理をする。サンプリング処理において予測テストモデルの作成のために抽出の対象とする顧客はアトランダムに抽出することもできるが、後述する検証処理において的確な検証を可能とするために、確率値に対する答えを有する顧客、つまり所定項目以上の実績値の明細データが蓄積されている顧客の中から任意の数の顧客を抽出することが適当である。
【0033】
次に、モデリング処理(S5)、検証処理(S6)は、上述のサンプリング手段によりサンプリングした明細データに、予測テストモデルを用いて、予測処理つまり確率推論をし、確率値を算出し、算出された確率値と、実際に蒐集蓄積された明細データから得られる答え、つまり、事前確率値を検証して、スコアリング用の予測モデルを作成する処理である。
【0034】
モデリング処理手段は、サンプリングされた顧客の明細データに対して予測テストモデルを使用して予測処理をする。次に検証処理手段は、予測テストモデルによる予測処理によって得られた確率値と、事前に実績値として蒐集された各目的変数について得られている事前確率値との差分を全ての項目、あるいは任意の項目で算出する検証処理を行う。修正処理手段は、検証処理の結果算出された確率値と、事前確率値との差分が任意の値以下となるように、目的変数或いは説明変数の項目の差し替え、或いは、項目に対する離散化のやり方を変更する等の予測テストモデルの修正処理を行う。この検証処理と修正処理が繰り返され、予測テストモデルによる確率値と事前確率値との差分が任意の値以下となった状態の予測テストモデルが予測モデルに決定される。尚、ここで決定された予測モデルは、明細データが蒐集蓄積されるたびに旧くなる可能性があることから、暫定モデルとして用いられ、定期的にあるいは、一定量の明細データが蓄積されるたびに上述したプロセスを経て、予測処理のための予測モデルが作成される。
【0035】
次にスコアリングのプロセスについて説明する。スコアリング処理は、上記モデリング処理で作成された予測モデルを用いて全ての顧客のデータマートの明細データに予測処理を展開する処理である。これにより、全ての顧客のデータマートの全ての項目について確率値が算出される。
【0036】
図12を参照すれば、スコアリングが為されない状態では実績テーブルに示すように、実際に蒐集された属性データ、明細データの項目にのみ実績値が振られた状態である。これについて、上述の予測モデルにより予測処理をすると、図13に示す、顧客DNA(顧客プロファイリング)テーブルとも呼ばれる、全ての項目について確率推論後の確率値が振られた状態となる。さらに、図14に示すように、実績テーブルの傾向をもとに、入力された確率値を閾値で判定した結果を示す処理を追加すれば、マップ推定値を得ることも可能である。
【0037】
従来は、目的変数の数だけ予測モデルを作成するプロセス、スコアリングするプロセスが発生していたが、本発明においては目的変数がいくつであっても予測モデル作成プロセス、スコアリングプロセスを一度で行うことができる。すなわち、このような予測処理により明細データを解析することで、全ての顧客の全ての明細データの項目に対して、短時間に解析が可能である。また、全ての顧客の明細データの項目に予測処理によるスコアリングを展開する前に、サンプリング処理、モデリング処理及び検証処理を介して予測テストモデルを作成し、この予測テストモデルの検証と修正を繰り返して精度の高い予測モデルを作成することで、顧客の現実の活動に則した値を、確率値というかたちで予測することができ、全ての顧客の全ての明細データの項目に対して短時間で精度の高い確率値を得ることができる。また、予測モデルを暫定版として常時差し替えられるようにしていることから、日々アップデートされる明細データに対して現実に近い予測処理を行うことができる。尚、スコアリングを展開する解析対象の顧客数が圧倒的に少ない場合には、サンプリング処理、モデリング処理、検証処理を省略して全顧客分の明細データに直接予測処理を施すことも可能である。
【0038】
(確率値の利用例)
次に、上述した顧客データ解析システムにより得られた確率値の利用の仕方の例について説明する。顧客データ解析システムに続くシステムの一つには波形生成と近似度の算出のプロセスがある。図15に示すように運用会社システム2が波形生成手段を動作させると、波形生成手段は、縦軸にとったカテゴリーに対応する各項目の確率値をプロットするプロット処理を行い(S1)、折れ線グラフ化する波形生成処理(S2)を行う。例えば、顧客Aの波形を生成する場合には、図16に示すように、横軸を項目、縦軸を顧客データ(%)とし、顧客Aの各項目(例えば、年収レベル、喫煙率、車保有率)に対する確率値をプロットし、これを波形化する。これにより顧客Aの性質が波形により表される。同様に顧客Bの波形も表わすことができる。
【0039】
また、図17に示すように他の形態の波形生成手段は、横軸を項目、縦軸を確率値(%)とし、各項目の確率値の平均値を算出し、平均値化した確率値をプロットするプロット処理を行い、折れ線グラフ化する波形生成処理を行う。例えば、図12に示すように、商品Gの波形を生成する場合には、横軸を項目、縦軸を確率値(%)とし、商品Gを購入した履歴系データを持つ顧客らの各項目別の確率値の平均値を算出し、商品Gの各項目(例えば、年収レベル、喫煙率、車保有率)に対する平均値化した確率値をプロットし、これを波形化する。さらには図18に示すように店Aの波形と店Bの波形を生成することもできる。
【0040】
(近似度算出処理)
図19,20を参照して、近似度を算出する手段としての近似度算出処理について説明する。波形生成処理は、波形生成手段により生成された少なくとも2以上の波形の近似度(シンクロ率とも呼ばれる。)を、算出する処理をいう。この近似度は、波形生成手段により生成された少なくとも2以上の波形の点間の差分を算出する手段と、前記波形生成手段により生成された少なくとも2以上の波形の線分角度の差分を算出する手段と、前記点間の差分が閾値内に収まるか否かを判定する手段と、前記線分角度の差分が閾値内に収まるか否かを判定する手段と、前記点間の差分が閾値内に収まる割合を算出する手段と、前記線分角度の差分が閾値内に収まる割合を算出する手段と、前記点間の差分が閾値内に収まる割合と前記線分角度の差分が閾値内に収まる割合から求められる。
【0041】
図19,20に示すように、ここで、確率差分とは、対応するプロットされた点間の距離を、縦軸にとられた確率値の差で示した値であり、図16を参照すれば、例えば、あて元データAの項目の項目X1(例えば、年収レベル)の確率がX1A%(例えば75%)、あて先データBの項目の項目X1(年収レベル)の確率がX1B%(例えば、73%)の位置にプロットされている場合、X1A%(75%)−X1B%(73%)=確率差分Y1%(2%)の演算を行い、この演算をX1〜Xnの全ての項目に対応する点について繰り返し行い確率差分Y1〜Ynを算出する。次に、当該確率差分の値が閾値(例えばア5%)に収まる場合には点の一致と判定し、閾値に収まらない場合には点の不一致との判定を行う。さらに、全ての算出結果に対する点の一致率を算出する。
【0042】
また、線分角度の差分とは、折れ線グラフの線の角度の差分であり、図19,20を参照すれば、線分角度の差分θ=θ1−θ2=tan-1D/C−tan-1D'/Cの演算を行い、この演算をX1〜Xn間の全ての項目に対応する線について繰り返し行う。次に、当該線分角度の差分の値が閾値(例えばア3ー)に収まる場合には波形の一致と判定し、閾値に収まらない場合には波形の不一致との判定を行う。さらに、全ての算出結果に対する波形の一致率を算出する。
【0043】
そして、上述の演算により得られた点の一致率、波形の一致率より、波形の近似度たる近似度を、近似度=(点の一致率+波形の一致率)/2の演算により算出する。なお、上述した閾値の値は可変条件とすることができる。
【0044】
このように、波形生成手段、近似度算出手段を通じて、顧客対顧客、企業対企業、店舗対店舗等のような同カテゴリー間の近似度、あるいは、顧客対企業、顧客対店舗、顧客対商品、顧客対エリア、企業対商品、店舗対商品、店舗対エリア等のような異なるカテゴリー間の近似度すなわち近似度を求め、該近似度を視覚化することにより、本システムを顧客へのレコメンド作業に役立てることができることはもちろんのこと、本システムで例えば、企業や店舗の品揃えの分析、出店地域の分析等様々な目的のための調査分析を行うことができる。
【0045】
また、他の利用例としては、明細データが無い顧客についても確率値を求めることができるから、実際には、商品Aが未購入であるが購入する確率の高い顧客をピックアップする等の市場調査に用いることもできる。さらには、あるカテゴリーの顧客群が購入する可能性が高い商品を分析する等の市場調査に用いることもできる。
【符号の説明】
【0046】
1 顧客データ解析システム
2 運用会社システム
3 ネットアライアンスシステム
4 リアルアライアンスシステム
5 アンケート手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20