特許第6937359号(P6937359)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社 日立産業制御ソリューションズの特許一覧

特許6937359クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム
<>
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000002
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000003
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000004
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000005
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000006
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000007
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000008
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000009
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000010
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000011
  • 特許6937359-クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6937359
(24)【登録日】2021年9月1日
(45)【発行日】2021年9月22日
(54)【発明の名称】クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20210909BHJP
【FI】
   G06Q30/02 310
【請求項の数】9
【全頁数】15
(21)【出願番号】特願2019-233838(P2019-233838)
(22)【出願日】2019年12月25日
(65)【公開番号】特開2021-103398(P2021-103398A)
(43)【公開日】2021年7月15日
【審査請求日】2020年3月25日
【早期審査対象出願】
(73)【特許権者】
【識別番号】000153443
【氏名又は名称】株式会社 日立産業制御ソリューションズ
(74)【代理人】
【識別番号】110001807
【氏名又は名称】特許業務法人磯野国際特許商標事務所
(72)【発明者】
【氏名】太田 佳秀
(72)【発明者】
【氏名】北村 慎吾
【審査官】 大野 朋也
(56)【参考文献】
【文献】 特開2018−113817(JP,A)
【文献】 特開2005−038140(JP,A)
【文献】 特開2012−208734(JP,A)
【文献】 国際公開第2019/026523(WO,A1)
【文献】 特開2005−222138(JP,A)
【文献】 特開2017−224121(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
取引主体の属性の調査値、及び、前記取引主体の経済力の調査値を取得する調査値取得部と、
前記取引主体における複数の属性の調査値及び前記取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割するクラスタリング部と、
前記分割されたクラスタごとの前記属性の調査値及び前記経済力の調査値に基づき、前記取引主体の属性を説明変数とし前記取引主体の経済力を目的変数とする予測モデルを作成し、前記予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
前記パラメータが最適化された予測モデルが出力する前記取引主体の経済力の予測値と、前記取引主体の経済力の調査値との差分を、前記クラスタの数ごとに評価し、
評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
を備えることを特徴とするクラスタ分割評価装置。
【請求項2】
前記取引主体が店舗である場合、
前記属性は、売場面積、固定資産税路線価、又は、駐車場台数のうちのいずれかを含み、
前記取引主体が顧客である場合、
前記属性は、自家所有の有無、年収、支払方法、又は、特定の品目の購買金額のうちのいずれかを含むこと、
を特徴とする請求項に記載のクラスタ分割評価装置。
【請求項3】
前記クラスタリング部は、
複数の前記説明変数の一部又は全部をユーザが選択するのを受け付けること、
を特徴とする請求項2に記載のクラスタ分割評価装置。
【請求項4】
前記回帰分析部は、
ユーザが画面上で前記予測モデルの数式を記述するのを受け付け、又は、前記予測モデルのひな型を画面表示し、前記ユーザが選択するのを受け付けること、
を特徴とする請求項3に記載のクラスタ分割評価装置。
【請求項5】
前記決定したクラスタの数、及び、当該クラスタの数に対応する評価の結果を表示する表示処理部を備えること、
を特徴とする請求項に記載のクラスタ分割評価装置。
【請求項6】
前記クラスタリング部は、
前記クラスタの数の最小値及び最大値、並びに、前記クラスタが含む前記調査値の数の最小値をユーザが入力するのを受け付けること、
を特徴とする請求項に記載のクラスタ分割評価装置。
【請求項7】
前記取引主体が店舗である場合、
前記経済力は、売上高であり、
前記取引主体が顧客である場合、
前記経済力は、購買金額であること、
を特徴とする請求項に記載のクラスタ分割評価装置。
【請求項8】
クラスタ分割評価装置の調査値取得部は、
取引主体の属性の調査値、及び、前記取引主体の経済力の調査値を取得し、
前記クラスタ分割評価装置のクラスタリング部は、
前記取引主体における複数の属性の調査値及び前記取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割し、
前記クラスタ分割評価装置の回帰分析部は、
前記分割されたクラスタごとの前記属性の調査値及び前記経済力の調査値に基づき、前記取引主体の属性を説明変数とし前記取引主体の経済力を目的変数とする予測モデルを作成し、前記予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
前記パラメータが最適化された予測モデルが出力する前記取引主体の経済力の予測値と、前記取引主体の経済力の調査値との差分を、前記クラスタの数ごとに評価し、
評価の結果に基づき、前記クラスタの数を決定すること、
を特徴とするクラスタ分割評価装置のクラスタ分割評価方法。
【請求項9】
コンピュータを、
取引主体の属性の調査値、及び、前記取引主体の経済力の調査値を取得する調査値取得部と、
前記取引主体における複数の属性の調査値及び前記取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割するクラスタリング部と、
前記分割されたクラスタごとの前記属性の調査値及び前記経済力の調査値に基づき、前記取引主体の属性を説明変数とし前記取引主体の経済力を目的変数とする予測モデルを作成し、前記予測モデルのパラメータを作成し、前記複数のクラスタごとに最適化し、
前記パラメータが最適化された予測モデルが出力する前記取引主体の経済力の予測値と、前記取引主体の経済力の調査値との差分を、前記クラスタの数ごとに評価し、
評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
して機能させるためのクラスタ分割評価プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラムに関する。
【背景技術】
【0002】
例えば、ある企業が新たな出店を計画する場合、当該企業は、どこに、どのような規模の出店をすれば、どの程度の売上高を見込めるかを予測する。また、他の企業は、ある商品を購買した顧客のデータに基づき、その顧客の購買金額(総合的な購買力)を予測する。このように、マーケティングのために、購買者の購買金額又は販売者の売上高を予測する機会は多い。このような予測を行う手法として、店舗又は顧客の過去データを使用する回帰分析が知られている。特許文献1の特性値予測装置もまた、回帰分析の手法を使用し、販売管理を含む広い分野の特性値(目的変数)を予測する。
【0003】
特許文献1の特性値予測装置は、説明変数のn個の候補のうちから1つの変数の組合せ、2つの変数の組合せ、3つの変数の組合せ、・・・、n個の変数の組合せを作成する。これらの組合せの総数は、+・・・+となる。当該予測装置は、各組合せに属する説明変数の実測値及びその時点の目的変数の実測値を使用して、予測モデルを作成する。そして、当該予測装置は、予測モデルが出力する目的変数の予測値と実測値との差分(誤差)を求め、誤差の分散の対数に負の符号を付したものを“基準値”とする。当該予測装置は、説明変数の数が少ない組合せから順に基準値を算出していく。すると、説明変数の数が増えるにつれて基準値は上昇する。当該予測装置は、この上昇の度合いが所定の閾値より小さくなる直前の組合せを、目的変数を予測するための説明変数の組合せとする。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平7−93284号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
売上高又は購買金額の予測においては、データの特性に応じてデータを複数のカテゴリに分割することがある。例えば、大規模小売店の売上高の予測におけるカテゴリは、“都心部”、“住宅街”、“郊外”等である。しかしながら、通常の業務知識からは見落としがちなカテゴリが存在する。例えば、東京の皇居北西部は、“都心部”ではあるが、“オフィス街”及び“高級住宅街”となっている。千葉県の海浜地区は、“郊外”ではあるが、“オフィス街”及び“高層マンション街”となっている。いずれの場合も、“都心部”、“住宅街”及び“郊外”という一般的なカテゴリを使用することはできない。
【0006】
特許文献1の特性値予測装置は、最適な予測モデルを作成するためのものであるが、説明変数の選択に注意を集中しており、予測モデルをデータの特性に応じて使い分けるという発想に欠ける。
そこで、本発明は、精度の高い複数の予測モデルをデータの特性に応じて使用できるように、変数の多次元空間を分割することを目的とする。
【課題を解決するための手段】
【0007】
本発明のクラスタ分割評価装置は、取引主体の属性の調査値、及び、取引主体の経済力の調査値を取得する調査値取得部と、取引主体における複数の属性の調査値及び取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割するクラスタリング部と、分割されたクラスタごとの属性の調査値及び経済力の調査値に基づき、取引主体の属性を説明変数とし取引主体の経済力を目的変数とする予測モデルを作成し、予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する取引主体の経済力の予測値と、取引主体の経済力の調査値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部と、を備えることを特徴とする。
その他の手段については、発明を実施するための形態のなかで説明する。
【発明の効果】
【0008】
本発明によれば、精度の高い複数の予測モデルをデータの特性に応じて使用できるように、変数の多次元空間を分割することができる。
【図面の簡単な説明】
【0009】
図1】クラスタ分割評価装置の構成等を説明する図である。
図2】調査値情報の一例である。
図3】クラスタ情報の一例である。
図4】クラスタと予測モデルとの関係を説明する図である。
図5】クラスタと予測モデルとの関係を説明する図である。
図6】クラスタと予測モデルとの関係を説明する図である。
図7】クラスタと予測モデルとの関係を説明する図である。
図8】誤差を説明する図である。
図9】誤差情報の一例である。
図10】処理手順のフローチャートである。
図11】調査値情報の一例である。
【発明を実施するための形態】
【0010】
以降、本発明を実施するための形態(“本実施形態”という)を、図等を参照しながら詳細に説明する。本実施形態は、第1の実施形態及び第2の実施形態を有する。第1の実施形態は、店舗の年間売上高を予測する例であり、第2の実施形態は、顧客の年間購買金額を予測する例である。これらは、あくまでも一例であり、本発明は、より一般的に、マーケティングに関する数量の予測に適用可能である。
【0011】
〈第1の実施形態〉
まず、第1の実施形態を説明する。
【0012】
(クラスタ分割評価装置)
図1に沿って、クラスタ分割評価装置1の構成等を説明する。クラスタ分割評価装置1は、一般的なコンピュータであり、中央制御装置11、マウス、キーボード等の入力装置12、ディスプレイ等の出力装置13、主記憶装置14、補助記憶装置15及び通信装置16を備える。これらは、バスで相互に接続されている。補助記憶装置15は、予測モデル31、調査値情報32、クラスタ情報33及び誤差情報34(詳細後記)を格納している。
【0013】
主記憶装置14における調査値取得部21、クラスタリング部22、回帰分析部23及び表示処理部24は、プログラムである。中央制御装置11は、これらのプログラムを補助記憶装置15から読み出し主記憶装置14にロードすることによって、それぞれのプログラムの機能(詳細後記)を実現する。補助記憶装置15は、クラスタ分割評価装置1から独立した構成となっていてもよい。
【0014】
店舗サーバ3及びカード会社サーバ4は、ネットワーク2を介してクラスタ分割評価装置1に接続されている。クラスタ分割評価装置1は、店舗サーバ3及びカード会社サーバ4から、店舗及び顧客に関する様々なデータを取得することができる。
【0015】
(予測モデル)
本実施形態の予測モデル31は、以下の式1のような1次式である。
y=a+a+a+a (式1)
【0016】
ここで、yは、店舗の年間売上高である。xは、店舗の売場面積である。xは、店舗が立地している土地の固定資産税路線価である。xは、店舗の駐車場台数である。a、a、a及びaは、定数(パラメータ)である。式1は、x、x及びxを説明変数としyを目的変数とする関数になっている。そして、a、a、a及びaの値を様々に変化させることによって、4次元空間における予測モデル31の形状及びその位置が様々に変化する。ここで、変数の数(種類)を“4”としたのは、あくまでも一例である。変数の数がさらに多くても、すなわち、予測モデルの次元がさらに大きくてもよい。
【0017】
いま、年間売上高、売場面積、固定資産税路線価及び駐車場台数の過去における調査値の組合せとして、“[Y,X,X,X]”が多数存在するとする。Y、X、X及びXのそれぞれが示す数値の種類は、y、x、x及びxのそれぞれが示す数値の種類と同じである。しかしながら、説明の便宜上、実際に認められた実例としての調査値を大文字で示し、予測モデルの変数を小文字で示している。予測モデルの出力(目的変数)yは、“予測値”である。“Y−y”を誤差と呼ぶ。クラスタ分割評価装置1は、調査値の組合せを使用して、誤差の2乗和“Σ(Y−y)”を最小にするパラメータの組合せ“[a,a,a,a]”を決定する(詳細後記)。
【0018】
(調査値情報)
図2は、調査値情報32の一例である。調査値情報32においては、店舗ID欄101に記憶された店舗IDに関連付けて、目的変数欄102には目的変数の調査値が、説明変数欄103には説明変数の調査値が記憶されている。
店舗ID欄101の店舗IDは、取引主体である店舗を一意に特定する識別子である。
【0019】
目的変数欄102の目的変数の調査値は、店舗の年間売上高である。“年間”はあくまで一例であり、目的変数の調査値が、月間売上高であっても、週間売上高であっても、その他の期間の売上高であってもよい。“#”は、異なる値を省略的に示している(以下同様)。
【0020】
説明変数欄103の説明変数の調査値は、売場面積(欄103a)、固定資産税路線価(欄103b)及び駐車場台数(欄103c)である。
このうち、売場面積は、店舗の総床面積のうち、顧客に対する商品の販売に直接供される面積である。
固定資産税路線価は、店舗が立地する土地に課される固定資産税を算出する基礎となる路線価である。
駐車場台数は、店舗に来店する顧客が利用可能な駐車場の収容可能車両数である。
なお、年間売上高は、“取引主体の経済力”に、売場面積、固定資産税路線価及び駐車場台数は、“取引主体の属性”に相当する。
【0021】
(クラスタリング)
多次元空間に描画された多くの点を、位置が近いもの同士でグループ分けすることを一般に“クラスタリング”と呼ぶ。クラスタリングの手法として、“k−平均法”がよく知られている。クラスタ分割評価装置1もまた、以下の(1)〜(5)のようにk−平均法を使用する。
【0022】
(1)クラスタ分割評価装置1は、複数の点のそれぞれを、k個のグループのいずれかに適当に所属させる。
(2)クラスタ分割評価装置1は、あるグループの重心から当該グループに属する点までの距離の2乗和dをグループごとに算出する。iは、グループの番号(i=1、2、・・・、k)である。
【0023】
(3)クラスタ分割評価装置1は、1個の点の所属をあるグループから他のグループに変えたうえで、D=Σdを算出する。Dは、k個のグループのdの総和である。クラスタ分割評価装置1は、所属を変える点及び新たな所属先のすべての組合せごとに当該処理を繰り返す。
(4)クラスタ分割評価装置1は、Dを最小にするような、各点の所属を決定する。
(5)クラスタ分割評価装置1は、kを1、2、3、・・・と変化させたうえで、(1)〜(4)の処理を繰り返す。
【0024】
(クラスタ情報)
図3は、クラスタ情報33の一例である。クラスタ情報33においては、店舗ID欄111に記憶された店舗IDに関連付けて、目的変数欄112には目的変数の調査値が、説明変数欄113には説明変数の調査値が、所属クラスタID欄114には所属クラスタIDが記憶されている。
【0025】
店舗ID欄111の店舗IDは、図2の店舗IDと同じである。
目的変数欄112の目的変数の調査値は、図2の目的変数の調査値と同じである。
説明変数欄113の説明変数の調査値は、図2の説明変数の調査値のうちの売場面積(欄103a)である。説明の単純化のため、図3の説明変数は、“売場面積”だけとしている。
【0026】
所属クラスタID欄114は、クラスタの数ごとに、クラスタ数1欄114a、クラスタ数2欄114b、クラスタ数3欄114c、クラスタ数4欄114d、・・・に分かれている。そして分かれた各欄に、クラスタIDが記憶されている。クラスタIDは、クラスタを一意に特定する識別子である。各クラスタは、店舗の地域特性に対応している。一般に、新規出店を計画する企業は、地域特性に応じて、年間売上高を含む様々な数値(出店パタン)を決定する。なお、“c3”及び“c10”のように、所属する点が結果的に同じになったとしても、クラスタの数が異なれば、異なるクラスタIDが採番されている(Dを算出し直しているため)。
【0027】
図4図7は、クラスタと予測モデル31との関係を説明する図である。図4は、図3のクラスタ数1欄114aに対応している。図4の座標平面の横軸は説明変数(売場面積)であり、縦軸は目的変数(年間売上高)である。座標平面上に、店舗M01〜M20に対応する20個の点●が描画されている(図5図7においても同様)。円c1は、クラスタc1を表している。直線31aは、予測モデル31(図1)を表している。予測モデルの作成方法については後記する。
【0028】
図5は、図3のクラスタ数2欄114bに対応している。円c2は、クラスタc2を表している。円c3は、クラスタc3を表している。直線31bは、予測モデル31(図1)を表している。直線31cも、予測モデル31(図1)を表している。
図6は、図3のクラスタ数3欄114cに対応している。図7は、図3のクラスタ数4欄114dに対応している。図6及び図7の説明は、図5の説明に準ずる。
なお、図4図7においては、作図上の制約に起因し、円c1等の中心は、クラスタc1等の重心(すべての点●の座標値の平均)とはなっていない。
【0029】
図4図7において、クラスタ分割評価装置1は、クラスタごとに、当該クラスタに所属する調査値●のみを使用して、予測モデルを作成している。クラスタ分割評価装置1が予測モデル“y=a+a”を作成する方法は、以下の(11)〜(17)の通りである。
【0030】
(11)クラスタ分割評価装置1は、無作為的に発生させたパラメータa及びaの値を予測モデルのa及びaに代入する。
(12)クラスタ分割評価装置1は、調査値Xを予測モデルのxに代入し、yを算出する。
(13)クラスタ分割評価装置1は、誤差“Y−y”を算出する。
(14)クラスタ分割評価装置1は、店舗ごとに [X,Y]の値を変化させて前記(12)及び前記(13)の処理を繰り返す。
【0031】
(15)クラスタ分割評価装置1は、各店舗の“(Y−y)”の総和である“Σ(Y−y)”を算出する。
(16)クラスタ分割評価装置1は、無作為的に発生させたパラメータa及びaの他の値を予測モデルのa及びaに代入したうえで、前記(12)〜(15)の処理を充分多い回数だけ繰り返す。
(17)クラスタ分割評価装置1は、“Σ(Y−y)”を最小にするパラメータa0S及びa1Sの値を決定する。ここで“S”は、“最適化されている”ことを示す。
【0032】
(誤差)
図8は、誤差を説明する図である。図8の座標平面の横軸は売場面積であり、縦軸は年間売上高である。20個の点●は、図3における調査値の組合せ[X,Y]を示している。直線31aは、予測モデル31(図1)であり、その式は、“y=a0S+a1S”である。点●のそれぞれについて、誤差“Y−y”が定義される。前記したように、“Σ(Y−y)”は最小化されてはいるが、個々の点●に注目した場合、誤差が殆どないものと、誤差が比較的大きいものとが混在している。
【0033】
(誤差情報)
図9は、誤差情報34の一例である。誤差情報34においては、クラスタ数欄121に記憶されたクラスタ数に関連付けて、誤差欄122には誤差が、誤差評価値欄123には誤差評価値が記憶されている。
クラスタ数欄121のクラスタ数は、クラスタの数である。
誤差欄122の誤差は、“√(Σ(Y−y)/n)”である。ここで、nは、クラスタ内の点●の数である。“√(Σ(Y−y)/n)”は、図8における誤差の2乗和の平均の平方根である。“#”に付された括弧内には、クラスタIDが記載されている。
【0034】
誤差評価値欄123の誤差評価値は、誤差を加工して得られる任意の値であり、その値が小さいほど、クラスタ数に対する評価は高い。誤差評価値は、例えば、誤差情報34のレコード(行)に含まれる誤差の平均、誤差の最小値、誤差の分散等である。なお、誤差評価値の定義の仕方によっては、その値が大きいほど、クラスタ数に対する評価が高い場合もある。
【0035】
(処理手順)
図10は、処理手順のフローチャートである。処理手順を開始する前提として、調査値情報32(図2)が、完成された状態で補助記憶装置15に格納されているものとする。
ステップS201において、クラスタ分割評価装置1の調査値取得部21は、調査値を取得する。具体的には、調査値取得部21は、補助記憶装置15から調査値情報32(図2)を取得する。
【0036】
ステップS202において、クラスタ分割評価装置1のクラスタリング部22は、変数を受け付ける。具体的には、クラスタリング部22は、複数の説明変数の一部又は全部をユーザが入力装置12を介して選択するのを受け付ける。例えば、ユーザが説明変数のうち売場面積のパラメータの値aがaを除くすべてのパラメータのうちで最も大きくなりそうである、すなわち、売場面積が目的変数に与える影響が最も大きくなりそうであると予測している場合、ユーザは“売場面積”を選択してもよい。ここでは、ユーザは“売場面積”を選択したとする。
【0037】
ステップS203において、クラスタリング部22は、クラスタ数の最大値等を受け付ける。具体的には、クラスタリング部22は、クラスタ数の最小値及び最大値、並びに、1つのクラスタに含まれる点●(クラスタ情報33のレコード数)の最小値をユーザが入力装置12を介して選択するのを受け付ける。ここでは、ユーザはクラスタ数の最小値として“1”、クラスタ数の最大値として“4”、1つのクラスタに含まれる点●の最小値として“4”を入力したとする。
【0038】
ステップS204において、クラスタリング部22は、クラスタリングを行う。具体的には、第1に、クラスタリング部22は、調査値情報32(図2)から、“売場面積”以外の説明変数の欄を削除する。
第2に、クラスタリング部22は、前記したk−平均法を使用して、調査値情報32(図2)の20個の点●“[X,Y]=[売場面積,年間売上高]”を、k個(k=1、2、3、4)のクラスタに分割する。このとき、クラスタリング部22は、いずれのクラスタにも少なくとも4個の点●が含まれるようにする。
【0039】
ステップS205において、クラスタリング部22は、クラスタ情報33(図3)を作成する。具体的には、クラスタリング部22は、ステップS204の“第2”におけるクラスタリングの結果に基づきクラスタ情報33を作成する。
【0040】
ステップS206において、クラスタ分割評価装置1の回帰分析部23は、予測モデル31を作成する。具体的には、回帰分析部23は、ユーザが画面上で予測モデルの数式を記述するのを受け付け、又は、一般的な予測モデルのひな型を画面表示し、ユーザが選択するのを受け付ける。ここで作成される予測モデル31は、前記した式1のような1次式である必要はなく、高次式であってもよいし、指数、対数等を含む非線形の式であってもよい。ただし、予測モデル31は、ステップS202において受け付けた各変数についてのパラメータ(この段階では値は未知である)を含むものとする。
【0041】
ステップS207において、回帰分析部23は、クラスタごとにパラメータを最適化する。具体的には、回帰分析部23は、前記した方法で、予測モデルのパラメータをクラスタごとに決定する。つまり、回帰分析部23は、調査値情報32(図2)の店舗M01〜M20の調査値のうち、処理対象のクラスタに属するものを使用して、“Σ(Y−y)”を最小にするパラメータを決定する。
【0042】
ステップS208において、回帰分析部23は、誤差情報34(図9)を作成する。具体的には、第1に、回帰分析部23は、誤差情報34を作成する。ここで作成される誤差情報34は、4本のレコードを有し、クラスタ数欄121には、“1”、“2”、“3”及び“4”が記憶されている。誤差欄122及び誤差評価値欄123は、空欄である。
第2に、回帰分析部23は、ステップS207において最小となった“Σ(Y−y)”を使用して、誤差“√(Σ(Y−y)/n)”を算出し、誤差欄122に記憶する。
第3に、回帰分析部23は、各レコードの誤差に基づいて、誤差評価値を算出し、誤差評価値欄123に記憶する。
【0043】
ステップS209において、回帰分析部23は、誤差評価値に基づきクラスタ数を決定する。具体的には、回帰分析部23は、誤差評価値が最小であるレコードのクラスタ数を決定する。ここで“最小”としたのはあくまでも一例であり、回帰分析部23は、所定の基準を満たす程度に誤差評価値が小さい複数の“クラスタ数”を決定してもよい。
【0044】
ステップS210において、クラスタ分割評価装置1の表示処理部24は、決定したクラスタ数及び誤差評価値を表示する。具体的には、第1に、表示処理部24は、ステップS209において決定したクラスタ数及びそのクラスタ数に対する誤差評価値を出力装置13に表示する。ここでは、“クラスタ数=4”が表示されたとする。
第2に、表示処理部24は、4個のクラスタc7、c8、c9及びc10に対応する予測モデル31g、31h、31i及び31j(図7)を補助記憶装置15に記憶する。その後、処理手順を終了する。
【0045】
(予測モデルの活用)
ステップS210の“第1”において“クラスタ数=4”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタc7は、図3の店舗M01〜M04に対応している。店舗M01〜M04は、例えば、ある特定の地域に立地する店舗である。回帰分析部23は、当該地域に新たに出店される店舗の年間売上高を予測する場合、予測モデル31gを使用する。クラスタc10は、図3の店舗M17〜M20に対応している。店舗M17〜M20は、例えば、ある他の特定の地域に立地する店舗である。回帰分析部23は、当該他の地域に新たに出店される店舗の年間売上高を予測する場合、予測モデル31jを使用する。他のクラスタについても同様である。
【0046】
(処理手順の変形例)
前記では、クラスタリング部22は、すべてのクラスタ数についてクラスタリングを行い、回帰分析部23は、すべてのクラスタ数について誤差評価値を算出している(総当たり処理)。しかしながら、クラスタ数k=1、2、3、4の降順又は昇順に、クラスタリング部22がクラスタリングを行い、回帰分析部23が誤差評価値を算出する処理を繰り返してもよい。この場合、所定の閾値(目標)に誤差評価値が達するまで、又は、誤差評価値の対前回比減少分が所定の閾値以下になるまで、クラスタリング部22及び回帰分析部23は処理を繰り返す。
【0047】
〈第2の実施形態〉
続いて、第2の実施形態を説明する。第2の実施形態が第1の実施形態と異なる点は、第1の実施形態が調査値情報32(図2)を使用するのに代えて、第2の実施形態が調査値情報32b(図11)を使用することである。
【0048】
図11は、調査値情報32bの一例である。調査値情報32bにおいては、顧客ID欄131に記憶された顧客IDに関連付けて、目的変数欄132には目的変数の調査値が、説明変数欄133には説明変数の調査値が記憶されている。
顧客ID欄131の顧客IDは、取引主体である顧客を一意に特定する識別子である。
【0049】
目的変数欄132の目的変数の調査値は、顧客の年間購買金額である。ここでの年間購買金額は、すべての店舗で購入した商品の代金の合計額である。“年間”はあくまで一例であり、目的変数の調査値は、月間購買金額であっても、その他の期間の購買金額であってもよい。“#”は、異なる値を省略的に示している(以下同様)。
説明変数欄133の説明変数の調査値は、年齢(欄133a)、性別(欄133b)、自家所有(欄133c)、年収(欄133d)、支払方法(欄133e)、食品購買金額(欄133f)及び衣類購買金額(欄133g)である。
【0050】
このうち、年齢は、顧客の年齢である。
性別は、顧客の性別である。図11においては、わかりやすさのために、性別は“男”又は“女”のいずれかとしている。性別が多次元空間の説明変数の軸に割り当てられる場合、例えば“男=0、女=1”のように数値化される(後記する自家所有及び支払方法についても同様)。
【0051】
自家所有は、顧客が居住する住宅を顧客が保有していることを示す“あり”、又は、保有していないことを示す“なし”のいずれかである。自家所有が“あり”の場合、例えば、土地の面積又は市場価値が当該欄に記憶されてもよい。
年収は、顧客の年間所得金額である。顧客は、年収から貯金額又は返済額を減算した金額で商品等を購入することになる。
支払方法は、商品代金を現金で支払ったことを示す“現金”、又は、カードで支払ったことを示す“カード”のいずれかである。
【0052】
食品購買金額は、すべての店舗で購入した商品のうち食品の代金の年間合計額である。
衣類購買金額は、すべての店舗で購入した商品のうち衣類の代金の年間合計額である。
“食品”及び“衣類”は、あくまでも一例である。ユーザは、年間購買金額の使途として分析しようとしている商品又はサービスと相関がありそうな特定の品目の購買金額を選択することができる。例えば、食品購買金額が年間購買金額に占める比率(エンゲル係数)は、社会階層ごとにほぼ一定であることはよく知られている。
なお、年間購買金額は、“取引主体の経済力”に、年齢、性別、自家所有、年収、支払方法、食品購買金額及び衣類購買金額は、“取引主体の属性”に相当する。
【0053】
調査値情報32bのレコードは、基本的には顧客ごとに記憶されている。しかしながら、1本のレコードを1回の購買機会(支払単位)に対応させ、顧客ごとの重複を許容することも可能である。レコードが顧客ごとに記憶される場合、1本のレコードは、通常、その顧客についての複数の購買機会を反映している。したがって、支払方法としての“カード”及び“現金”が混在する場合がある。この場合、支払方法としていずれか回数の多い方又は金額の大きい方が代表的に採用されてもよい。また、“カード=#回、現金=#回”又は“カード=#円、現金=#円”のように2次元化された値が採用されてもよい。
【0054】
第2の実施形態の具体的な処理内容は、第1の実施形態と同様であり、図1及び図3図10についての説明が、第2の実施形態にもそのまま当てはまる。但し、図3において、“店舗ID”(欄111)は、“顧客ID”と読み替える。“年間売上高”(欄112)は、“年間購買金額”と読み替える。“売場面積”(欄113)は、図11の欄133a〜133gのうちのいずれか(例えば“年収”)と読み替える。
【0055】
第1の実施形態と同様に第2の実施形態においても、ステップS210の“第1”において“クラスタ数=4”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタc7は、前記読み替えを行った後の図3の顧客P01〜P04に対応している。顧客P01〜P04は、例えば、ある特定の地域に居住する顧客である。回帰分析部23は、当該地域に居住する顧客の年間購買金額を予測する場合、予測モデル31gを使用する。クラスタc10は、図3の顧客P17〜P20に対応している。顧客P17〜P20は、例えば、ある他の特定の地域に居住する顧客である。回帰分析部23は、当該他の地域に居住する顧客の年間購買金額を予測する場合、予測モデル31jを使用する。他のクラスタについても同様である。
【0056】
第1の実施形態及び第2の実施形態を通じて、商品取引の主体である店舗及び顧客の例を説明した。しかしながら、前記から明らかなように、本発明は、商品の買主としての顧客及び商品の売主としての店舗以外の取引主体に対しても適用することができる。取引主体は、例えば、物品賃借取引における貸主及び借主、資本取引における債権者及び債務者、交通、物流、宿泊、医療、教育、介護サービス等におけるサービスの提供者及び被提供者等を含む。
【0057】
第1の実施形態及び第2の実施形態を通じて、年間売上高及び年間購買金額を予測する例を説明した。しかしながら、前記から明らかなように、本発明は、取引主体の一般的な経済力を予測する例に対して適用することができる。経済力は、貸出残高、借入残高、提供する又は提供される商品又はサービスの数量、市場占有率等を含む。
【0058】
第1の実施形態及び第2の実施形態を通じて、商品取引の主体である店舗及び顧客の説明変数が店舗サーバ3又はカード会社サーバ4から取得可能なデータである例を説明した。しかしながら、前記から明らかなように、本発明は、数値化することが可能な取引主体のあらゆる属性に対して適用することができる。
【0059】
(本実施形態の効果)
本実施形態のクラスタ分割評価装置の効果は以下の通りである。
(1)クラスタ分割評価装置は、取引主体の属性ごとに精度の高い予測モデルを作成することができる。
(2)クラスタ分割評価装置は、期待し得る誤差評価値及び取引主体の属性に対応するクラスタ数を表示することができる。
(3)クラスタ分割評価装置は、ユーザがクラスタの数及び大きさを指定することを可能にする。
(4)クラスタ分割評価装置は、店舗の売上高又は顧客の購買金額の予測に適用することができる。
(5)クラスタ分割評価装置は、一般的に入手しやすい取引主体の属性を使用することができる。
【0060】
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0061】
また、前記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウエアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウエアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0062】
1 クラスタ分割評価装置
2 ネットワーク
3 店舗サーバ
4 カード会社サーバ
11 中央制御装置
12 入力装置
13 出力装置
14 主記憶装置
15 補助記憶装置
16 通信装置
21 調査値取得部
22 クラスタリング部
23 回帰分析部
24 表示処理部
31 予測モデル
32、32b 調査値情報
33 クラスタ情報
34 誤差情報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11