特許6937359 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社　日立産業制御ソリューションズの特許一覧

特許6937359クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6937359

(24)【登録日】2021年9月1日

(45)【発行日】2021年9月22日

(54)【発明の名称】クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

(51)【国際特許分類】

G06Q 30/02 20120101AFI20210909BHJP

【ＦＩ】

G06Q30/02 310

【請求項の数】9

【全頁数】15

(21)【出願番号】特願2019-233838(P2019-233838)

(22)【出願日】2019年12月25日

(65)【公開番号】特開2021-103398(P2021-103398A)

(43)【公開日】2021年7月15日

【審査請求日】2020年3月25日

【早期審査対象出願】

(73)【特許権者】

【識別番号】000153443

【氏名又は名称】株式会社日立産業制御ソリューションズ

(74)【代理人】

【識別番号】110001807

【氏名又は名称】特許業務法人磯野国際特許商標事務所

(72)【発明者】

【氏名】太田佳秀

(72)【発明者】

【氏名】北村慎吾

【審査官】大野朋也

(56)【参考文献】

【文献】特開２０１８−１１３８１７（ＪＰ，Ａ）

【文献】特開２００５−０３８１４０（ＪＰ，Ａ）

【文献】特開２０１２−２０８７３４（ＪＰ，Ａ）

【文献】国際公開第２０１９／０２６５２３（ＷＯ，Ａ１）

【文献】特開２００５−２２２１３８（ＪＰ，Ａ）

【文献】特開２０１７−２２４１２１（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｑ１０／００−９９／００

(57)【特許請求の範囲】

【請求項1】

取引主体の属性の調査値、及び、前記取引主体の経済力の調査値を取得する調査値取得部と、
前記取引主体における複数の属性の調査値及び前記取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割するクラスタリング部と、
前記分割されたクラスタごとの前記属性の調査値及び前記経済力の調査値に基づき、前記取引主体の属性を説明変数とし前記取引主体の経済力を目的変数とする予測モデルを作成し、前記予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
前記パラメータが最適化された予測モデルが出力する前記取引主体の経済力の予測値と、前記取引主体の経済力の調査値との差分を、前記クラスタの数ごとに評価し、
評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
を備えることを特徴とするクラスタ分割評価装置。

【請求項2】

前記取引主体が店舗である場合、
前記属性は、売場面積、固定資産税路線価、又は、駐車場台数のうちのいずれかを含み、
前記取引主体が顧客である場合、
前記属性は、自家所有の有無、年収、支払方法、又は、特定の品目の購買金額のうちのいずれかを含むこと、
を特徴とする請求項１に記載のクラスタ分割評価装置。

【請求項3】

前記クラスタリング部は、
複数の前記説明変数の一部又は全部をユーザが選択するのを受け付けること、
を特徴とする請求項２に記載のクラスタ分割評価装置。

【請求項4】

前記回帰分析部は、
ユーザが画面上で前記予測モデルの数式を記述するのを受け付け、又は、前記予測モデルのひな型を画面表示し、前記ユーザが選択するのを受け付けること、
を特徴とする請求項３に記載のクラスタ分割評価装置。

【請求項5】

前記決定したクラスタの数、及び、当該クラスタの数に対応する評価の結果を表示する表示処理部を備えること、
を特徴とする請求項１に記載のクラスタ分割評価装置。

【請求項6】

前記クラスタリング部は、
前記クラスタの数の最小値及び最大値、並びに、前記クラスタが含む前記調査値の数の最小値をユーザが入力するのを受け付けること、
を特徴とする請求項５に記載のクラスタ分割評価装置。

【請求項7】

前記取引主体が店舗である場合、
前記経済力は、売上高であり、
前記取引主体が顧客である場合、
前記経済力は、購買金額であること、
を特徴とする請求項６に記載のクラスタ分割評価装置。

【請求項8】

クラスタ分割評価装置の調査値取得部は、
取引主体の属性の調査値、及び、前記取引主体の経済力の調査値を取得し、
前記クラスタ分割評価装置のクラスタリング部は、
前記取引主体における複数の属性の調査値及び前記取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割し、
前記クラスタ分割評価装置の回帰分析部は、
前記分割されたクラスタごとの前記属性の調査値及び前記経済力の調査値に基づき、前記取引主体の属性を説明変数とし前記取引主体の経済力を目的変数とする予測モデルを作成し、前記予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
前記パラメータが最適化された予測モデルが出力する前記取引主体の経済力の予測値と、前記取引主体の経済力の調査値との差分を、前記クラスタの数ごとに評価し、
評価の結果に基づき、前記クラスタの数を決定すること、
を特徴とするクラスタ分割評価装置のクラスタ分割評価方法。

【請求項9】

コンピュータを、
取引主体の属性の調査値、及び、前記取引主体の経済力の調査値を取得する調査値取得部と、
前記取引主体における複数の属性の調査値及び前記取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割するクラスタリング部と、
前記分割されたクラスタごとの前記属性の調査値及び前記経済力の調査値に基づき、前記取引主体の属性を説明変数とし前記取引主体の経済力を目的変数とする予測モデルを作成し、前記予測モデルのパラメータを作成し、前記複数のクラスタごとに最適化し、
前記パラメータが最適化された予測モデルが出力する前記取引主体の経済力の予測値と、前記取引主体の経済力の調査値との差分を、前記クラスタの数ごとに評価し、
評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
して機能させるためのクラスタ分割評価プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラムに関する。

【背景技術】

【0002】

例えば、ある企業が新たな出店を計画する場合、当該企業は、どこに、どのような規模の出店をすれば、どの程度の売上高を見込めるかを予測する。また、他の企業は、ある商品を購買した顧客のデータに基づき、その顧客の購買金額（総合的な購買力）を予測する。このように、マーケティングのために、購買者の購買金額又は販売者の売上高を予測する機会は多い。このような予測を行う手法として、店舗又は顧客の過去データを使用する回帰分析が知られている。特許文献１の特性値予測装置もまた、回帰分析の手法を使用し、販売管理を含む広い分野の特性値（目的変数）を予測する。

【0003】

特許文献１の特性値予測装置は、説明変数のｎ個の候補のうちから１つの変数の組合せ、２つの変数の組合せ、３つの変数の組合せ、・・・、ｎ個の変数の組合せを作成する。これらの組合せの総数は、_ｎＣ_１＋_ｎＣ_２＋_ｎＣ_３＋・・・＋_ｎＣ_ｎとなる。当該予測装置は、各組合せに属する説明変数の実測値及びその時点の目的変数の実測値を使用して、予測モデルを作成する。そして、当該予測装置は、予測モデルが出力する目的変数の予測値と実測値との差分（誤差）を求め、誤差の分散の対数に負の符号を付したものを“基準値”とする。当該予測装置は、説明変数の数が少ない組合せから順に基準値を算出していく。すると、説明変数の数が増えるにつれて基準値は上昇する。当該予測装置は、この上昇の度合いが所定の閾値より小さくなる直前の組合せを、目的変数を予測するための説明変数の組合せとする。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開平７−９３２８４号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

売上高又は購買金額の予測においては、データの特性に応じてデータを複数のカテゴリに分割することがある。例えば、大規模小売店の売上高の予測におけるカテゴリは、“都心部”、“住宅街”、“郊外”等である。しかしながら、通常の業務知識からは見落としがちなカテゴリが存在する。例えば、東京の皇居北西部は、“都心部”ではあるが、“オフィス街”及び“高級住宅街”となっている。千葉県の海浜地区は、“郊外”ではあるが、“オフィス街”及び“高層マンション街”となっている。いずれの場合も、“都心部”、“住宅街”及び“郊外”という一般的なカテゴリを使用することはできない。

【0006】

特許文献１の特性値予測装置は、最適な予測モデルを作成するためのものであるが、説明変数の選択に注意を集中しており、予測モデルをデータの特性に応じて使い分けるという発想に欠ける。
そこで、本発明は、精度の高い複数の予測モデルをデータの特性に応じて使用できるように、変数の多次元空間を分割することを目的とする。

【課題を解決するための手段】

【0007】

本発明のクラスタ分割評価装置は、取引主体の属性の調査値、及び、取引主体の経済力の調査値を取得する調査値取得部と、取引主体における複数の属性の調査値及び取引主体の経済力の調査値を示す点に基づき、多次元空間内において複数のクラスタに分割するクラスタリング部と、分割されたクラスタごとの属性の調査値及び経済力の調査値に基づき、取引主体の属性を説明変数とし取引主体の経済力を目的変数とする予測モデルを作成し、予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する取引主体の経済力の予測値と、取引主体の経済力の調査値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部と、を備えることを特徴とする。
その他の手段については、発明を実施するための形態のなかで説明する。

【発明の効果】

【0008】

本発明によれば、精度の高い複数の予測モデルをデータの特性に応じて使用できるように、変数の多次元空間を分割することができる。

【図面の簡単な説明】

【0009】

【図1】クラスタ分割評価装置の構成等を説明する図である。

【図2】調査値情報の一例である。

【図3】クラスタ情報の一例である。

【図4】クラスタと予測モデルとの関係を説明する図である。

【図5】クラスタと予測モデルとの関係を説明する図である。

【図6】クラスタと予測モデルとの関係を説明する図である。

【図7】クラスタと予測モデルとの関係を説明する図である。

【図8】誤差を説明する図である。

【図9】誤差情報の一例である。

【図10】処理手順のフローチャートである。

【図11】調査値情報の一例である。

【発明を実施するための形態】

【0010】

以降、本発明を実施するための形態（“本実施形態”という）を、図等を参照しながら詳細に説明する。本実施形態は、第１の実施形態及び第２の実施形態を有する。第１の実施形態は、店舗の年間売上高を予測する例であり、第２の実施形態は、顧客の年間購買金額を予測する例である。これらは、あくまでも一例であり、本発明は、より一般的に、マーケティングに関する数量の予測に適用可能である。

【0011】

〈第１の実施形態〉
まず、第１の実施形態を説明する。

【0012】

（クラスタ分割評価装置）
図１に沿って、クラスタ分割評価装置１の構成等を説明する。クラスタ分割評価装置１は、一般的なコンピュータであり、中央制御装置１１、マウス、キーボード等の入力装置１２、ディスプレイ等の出力装置１３、主記憶装置１４、補助記憶装置１５及び通信装置１６を備える。これらは、バスで相互に接続されている。補助記憶装置１５は、予測モデル３１、調査値情報３２、クラスタ情報３３及び誤差情報３４（詳細後記）を格納している。

【0013】

主記憶装置１４における調査値取得部２１、クラスタリング部２２、回帰分析部２３及び表示処理部２４は、プログラムである。中央制御装置１１は、これらのプログラムを補助記憶装置１５から読み出し主記憶装置１４にロードすることによって、それぞれのプログラムの機能（詳細後記）を実現する。補助記憶装置１５は、クラスタ分割評価装置１から独立した構成となっていてもよい。

【0014】

店舗サーバ３及びカード会社サーバ４は、ネットワーク２を介してクラスタ分割評価装置１に接続されている。クラスタ分割評価装置１は、店舗サーバ３及びカード会社サーバ４から、店舗及び顧客に関する様々なデータを取得することができる。

【0015】

（予測モデル）
本実施形態の予測モデル３１は、以下の式１のような１次式である。
ｙ＝ａ_０＋ａ_１ｘ_１＋ａ_２ｘ_２＋ａ_３ｘ_３（式１）

【0016】

ここで、ｙは、店舗の年間売上高である。ｘ_１は、店舗の売場面積である。ｘ_２は、店舗が立地している土地の固定資産税路線価である。ｘ_３は、店舗の駐車場台数である。ａ_０、ａ_１、ａ_２及びａ_３は、定数（パラメータ）である。式１は、ｘ_１、ｘ_２及びｘ_３を説明変数としｙを目的変数とする関数になっている。そして、ａ_０、ａ_１、ａ_２及びａ_３の値を様々に変化させることによって、４次元空間における予測モデル３１の形状及びその位置が様々に変化する。ここで、変数の数（種類）を“４”としたのは、あくまでも一例である。変数の数がさらに多くても、すなわち、予測モデルの次元がさらに大きくてもよい。

【0017】

いま、年間売上高、売場面積、固定資産税路線価及び駐車場台数の過去における調査値の組合せとして、“[Ｙ，Ｘ_１，Ｘ_２，Ｘ_３]”が多数存在するとする。Ｙ、Ｘ_１、Ｘ_２及びＸ_３のそれぞれが示す数値の種類は、ｙ、ｘ_１、ｘ_２及びｘ_３のそれぞれが示す数値の種類と同じである。しかしながら、説明の便宜上、実際に認められた実例としての調査値を大文字で示し、予測モデルの変数を小文字で示している。予測モデルの出力（目的変数）ｙは、“予測値”である。“Ｙ−ｙ”を誤差と呼ぶ。クラスタ分割評価装置１は、調査値の組合せを使用して、誤差の２乗和“Σ（Ｙ−ｙ）^２”を最小にするパラメータの組合せ“[ａ_０，ａ_１，ａ_２，ａ_３]”を決定する（詳細後記）。

【0018】

（調査値情報）
図２は、調査値情報３２の一例である。調査値情報３２においては、店舗ＩＤ欄１０１に記憶された店舗ＩＤに関連付けて、目的変数欄１０２には目的変数の調査値が、説明変数欄１０３には説明変数の調査値が記憶されている。
店舗ＩＤ欄１０１の店舗ＩＤは、取引主体である店舗を一意に特定する識別子である。

【0019】

目的変数欄１０２の目的変数の調査値は、店舗の年間売上高である。“年間”はあくまで一例であり、目的変数の調査値が、月間売上高であっても、週間売上高であっても、その他の期間の売上高であってもよい。“＃”は、異なる値を省略的に示している（以下同様）。

【0020】

説明変数欄１０３の説明変数の調査値は、売場面積（欄１０３ａ）、固定資産税路線価（欄１０３ｂ）及び駐車場台数（欄１０３ｃ）である。
このうち、売場面積は、店舗の総床面積のうち、顧客に対する商品の販売に直接供される面積である。
固定資産税路線価は、店舗が立地する土地に課される固定資産税を算出する基礎となる路線価である。
駐車場台数は、店舗に来店する顧客が利用可能な駐車場の収容可能車両数である。
なお、年間売上高は、“取引主体の経済力”に、売場面積、固定資産税路線価及び駐車場台数は、“取引主体の属性”に相当する。

【0021】

（クラスタリング）
多次元空間に描画された多くの点を、位置が近いもの同士でグループ分けすることを一般に“クラスタリング”と呼ぶ。クラスタリングの手法として、“ｋ−平均法”がよく知られている。クラスタ分割評価装置１もまた、以下の（１）〜（５）のようにｋ−平均法を使用する。

【0022】

（１）クラスタ分割評価装置１は、複数の点のそれぞれを、ｋ個のグループのいずれかに適当に所属させる。
（２）クラスタ分割評価装置１は、あるグループの重心から当該グループに属する点までの距離の２乗和ｄ_ｉをグループごとに算出する。ｉは、グループの番号（ｉ＝１、２、・・・、ｋ）である。

【0023】

（３）クラスタ分割評価装置１は、１個の点の所属をあるグループから他のグループに変えたうえで、Ｄ_ｋ＝Σｄ_ｉを算出する。Ｄ_ｋは、ｋ個のグループのｄ_ｉの総和である。クラスタ分割評価装置１は、所属を変える点及び新たな所属先のすべての組合せごとに当該処理を繰り返す。
（４）クラスタ分割評価装置１は、Ｄ_ｋを最小にするような、各点の所属を決定する。
（５）クラスタ分割評価装置１は、ｋを１、２、３、・・・と変化させたうえで、（１）〜（４）の処理を繰り返す。

【0024】

（クラスタ情報）
図３は、クラスタ情報３３の一例である。クラスタ情報３３においては、店舗ＩＤ欄１１１に記憶された店舗ＩＤに関連付けて、目的変数欄１１２には目的変数の調査値が、説明変数欄１１３には説明変数の調査値が、所属クラスタＩＤ欄１１４には所属クラスタＩＤが記憶されている。

【0025】

店舗ＩＤ欄１１１の店舗ＩＤは、図２の店舗ＩＤと同じである。
目的変数欄１１２の目的変数の調査値は、図２の目的変数の調査値と同じである。
説明変数欄１１３の説明変数の調査値は、図２の説明変数の調査値のうちの売場面積（欄１０３ａ）である。説明の単純化のため、図３の説明変数は、“売場面積”だけとしている。

【0026】

所属クラスタＩＤ欄１１４は、クラスタの数ごとに、クラスタ数１欄１１４ａ、クラスタ数２欄１１４ｂ、クラスタ数３欄１１４ｃ、クラスタ数４欄１１４ｄ、・・・に分かれている。そして分かれた各欄に、クラスタＩＤが記憶されている。クラスタＩＤは、クラスタを一意に特定する識別子である。各クラスタは、店舗の地域特性に対応している。一般に、新規出店を計画する企業は、地域特性に応じて、年間売上高を含む様々な数値（出店パタン）を決定する。なお、“ｃ３”及び“ｃ１０”のように、所属する点が結果的に同じになったとしても、クラスタの数が異なれば、異なるクラスタＩＤが採番されている（Ｄ_ｋを算出し直しているため）。

【0027】

図４〜図７は、クラスタと予測モデル３１との関係を説明する図である。図４は、図３のクラスタ数１欄１１４ａに対応している。図４の座標平面の横軸は説明変数（売場面積）であり、縦軸は目的変数（年間売上高）である。座標平面上に、店舗Ｍ０１〜Ｍ２０に対応する２０個の点●が描画されている（図５〜図７においても同様）。円ｃ１は、クラスタｃ１を表している。直線３１ａは、予測モデル３１（図１）を表している。予測モデルの作成方法については後記する。

【0028】

図５は、図３のクラスタ数２欄１１４ｂに対応している。円ｃ２は、クラスタｃ２を表している。円ｃ３は、クラスタｃ３を表している。直線３１ｂは、予測モデル３１（図１）を表している。直線３１ｃも、予測モデル３１（図１）を表している。
図６は、図３のクラスタ数３欄１１４ｃに対応している。図７は、図３のクラスタ数４欄１１４ｄに対応している。図６及び図７の説明は、図５の説明に準ずる。
なお、図４〜図７においては、作図上の制約に起因し、円ｃ１等の中心は、クラスタｃ１等の重心（すべての点●の座標値の平均）とはなっていない。

【0029】

図４〜図７において、クラスタ分割評価装置１は、クラスタごとに、当該クラスタに所属する調査値●のみを使用して、予測モデルを作成している。クラスタ分割評価装置１が予測モデル“ｙ＝ａ_０＋ａ_１ｘ_１”を作成する方法は、以下の（１１）〜（１７）の通りである。

【0030】

（１１）クラスタ分割評価装置１は、無作為的に発生させたパラメータａ_０及びａ_１の値を予測モデルのａ_０及びａ_１に代入する。
（１２）クラスタ分割評価装置１は、調査値Ｘを予測モデルのｘ_１に代入し、ｙを算出する。
（１３）クラスタ分割評価装置１は、誤差“Ｙ−ｙ”を算出する。
（１４）クラスタ分割評価装置１は、店舗ごとに [Ｘ，Ｙ]の値を変化させて前記（１２）及び前記（１３）の処理を繰り返す。

【0031】

（１５）クラスタ分割評価装置１は、各店舗の“（Ｙ−ｙ）^２”の総和である“Σ（Ｙ−ｙ）^２”を算出する。
（１６）クラスタ分割評価装置１は、無作為的に発生させたパラメータａ_０及びａ_１の他の値を予測モデルのａ_０及びａ_１に代入したうえで、前記（１２）〜（１５）の処理を充分多い回数だけ繰り返す。
（１７）クラスタ分割評価装置１は、“Σ（Ｙ−ｙ）^２”を最小にするパラメータａ_０Ｓ及びａ_１Ｓの値を決定する。ここで“Ｓ”は、“最適化されている”ことを示す。

【0032】

（誤差）
図８は、誤差を説明する図である。図８の座標平面の横軸は売場面積であり、縦軸は年間売上高である。２０個の点●は、図３における調査値の組合せ[Ｘ，Ｙ]を示している。直線３１ａは、予測モデル３１（図１）であり、その式は、“ｙ＝ａ_０Ｓ＋ａ_１Ｓｘ_１”である。点●のそれぞれについて、誤差“Ｙ−ｙ”が定義される。前記したように、“Σ（Ｙ−ｙ）^２”は最小化されてはいるが、個々の点●に注目した場合、誤差が殆どないものと、誤差が比較的大きいものとが混在している。

【0033】

（誤差情報）
図９は、誤差情報３４の一例である。誤差情報３４においては、クラスタ数欄１２１に記憶されたクラスタ数に関連付けて、誤差欄１２２には誤差が、誤差評価値欄１２３には誤差評価値が記憶されている。
クラスタ数欄１２１のクラスタ数は、クラスタの数である。
誤差欄１２２の誤差は、“√（Σ（Ｙ−ｙ）^２／ｎ）”である。ここで、ｎは、クラスタ内の点●の数である。“√（Σ（Ｙ−ｙ）^２／ｎ）”は、図８における誤差の２乗和の平均の平方根である。“＃”に付された括弧内には、クラスタＩＤが記載されている。

【0034】

誤差評価値欄１２３の誤差評価値は、誤差を加工して得られる任意の値であり、その値が小さいほど、クラスタ数に対する評価は高い。誤差評価値は、例えば、誤差情報３４のレコード（行）に含まれる誤差の平均、誤差の最小値、誤差の分散等である。なお、誤差評価値の定義の仕方によっては、その値が大きいほど、クラスタ数に対する評価が高い場合もある。

【0035】

（処理手順）
図１０は、処理手順のフローチャートである。処理手順を開始する前提として、調査値情報３２（図２）が、完成された状態で補助記憶装置１５に格納されているものとする。
ステップＳ２０１において、クラスタ分割評価装置１の調査値取得部２１は、調査値を取得する。具体的には、調査値取得部２１は、補助記憶装置１５から調査値情報３２（図２）を取得する。

【0036】

ステップＳ２０２において、クラスタ分割評価装置１のクラスタリング部２２は、変数を受け付ける。具体的には、クラスタリング部２２は、複数の説明変数の一部又は全部をユーザが入力装置１２を介して選択するのを受け付ける。例えば、ユーザが説明変数のうち売場面積のパラメータの値ａ_１がａ_０を除くすべてのパラメータのうちで最も大きくなりそうである、すなわち、売場面積が目的変数に与える影響が最も大きくなりそうであると予測している場合、ユーザは“売場面積”を選択してもよい。ここでは、ユーザは“売場面積”を選択したとする。

【0037】

ステップＳ２０３において、クラスタリング部２２は、クラスタ数の最大値等を受け付ける。具体的には、クラスタリング部２２は、クラスタ数の最小値及び最大値、並びに、１つのクラスタに含まれる点●（クラスタ情報３３のレコード数）の最小値をユーザが入力装置１２を介して選択するのを受け付ける。ここでは、ユーザはクラスタ数の最小値として“１”、クラスタ数の最大値として“４”、１つのクラスタに含まれる点●の最小値として“４”を入力したとする。

【0038】

ステップＳ２０４において、クラスタリング部２２は、クラスタリングを行う。具体的には、第１に、クラスタリング部２２は、調査値情報３２（図２）から、“売場面積”以外の説明変数の欄を削除する。
第２に、クラスタリング部２２は、前記したｋ−平均法を使用して、調査値情報３２（図２）の２０個の点●“[Ｘ，Ｙ]＝[売場面積，年間売上高]”を、ｋ個（ｋ＝１、２、３、４）のクラスタに分割する。このとき、クラスタリング部２２は、いずれのクラスタにも少なくとも４個の点●が含まれるようにする。

【0039】

ステップＳ２０５において、クラスタリング部２２は、クラスタ情報３３（図３）を作成する。具体的には、クラスタリング部２２は、ステップＳ２０４の“第２”におけるクラスタリングの結果に基づきクラスタ情報３３を作成する。

【0040】

ステップＳ２０６において、クラスタ分割評価装置１の回帰分析部２３は、予測モデル３１を作成する。具体的には、回帰分析部２３は、ユーザが画面上で予測モデルの数式を記述するのを受け付け、又は、一般的な予測モデルのひな型を画面表示し、ユーザが選択するのを受け付ける。ここで作成される予測モデル３１は、前記した式１のような１次式である必要はなく、高次式であってもよいし、指数、対数等を含む非線形の式であってもよい。ただし、予測モデル３１は、ステップＳ２０２において受け付けた各変数についてのパラメータ（この段階では値は未知である）を含むものとする。

【0041】

ステップＳ２０７において、回帰分析部２３は、クラスタごとにパラメータを最適化する。具体的には、回帰分析部２３は、前記した方法で、予測モデルのパラメータをクラスタごとに決定する。つまり、回帰分析部２３は、調査値情報３２（図２）の店舗Ｍ０１〜Ｍ２０の調査値のうち、処理対象のクラスタに属するものを使用して、“Σ（Ｙ−ｙ）^２”を最小にするパラメータを決定する。

【0042】

ステップＳ２０８において、回帰分析部２３は、誤差情報３４（図９）を作成する。具体的には、第１に、回帰分析部２３は、誤差情報３４を作成する。ここで作成される誤差情報３４は、４本のレコードを有し、クラスタ数欄１２１には、“１”、“２”、“３”及び“４”が記憶されている。誤差欄１２２及び誤差評価値欄１２３は、空欄である。
第２に、回帰分析部２３は、ステップＳ２０７において最小となった“Σ（Ｙ−ｙ）^２”を使用して、誤差“√（Σ（Ｙ−ｙ）^２／ｎ）”を算出し、誤差欄１２２に記憶する。
第３に、回帰分析部２３は、各レコードの誤差に基づいて、誤差評価値を算出し、誤差評価値欄１２３に記憶する。

【0043】

ステップＳ２０９において、回帰分析部２３は、誤差評価値に基づきクラスタ数を決定する。具体的には、回帰分析部２３は、誤差評価値が最小であるレコードのクラスタ数を決定する。ここで“最小”としたのはあくまでも一例であり、回帰分析部２３は、所定の基準を満たす程度に誤差評価値が小さい複数の“クラスタ数”を決定してもよい。

【0044】

ステップＳ２１０において、クラスタ分割評価装置１の表示処理部２４は、決定したクラスタ数及び誤差評価値を表示する。具体的には、第１に、表示処理部２４は、ステップＳ２０９において決定したクラスタ数及びそのクラスタ数に対する誤差評価値を出力装置１３に表示する。ここでは、“クラスタ数＝４”が表示されたとする。
第２に、表示処理部２４は、４個のクラスタｃ７、ｃ８、ｃ９及びｃ１０に対応する予測モデル３１ｇ、３１ｈ、３１ｉ及び３１ｊ（図７）を補助記憶装置１５に記憶する。その後、処理手順を終了する。

【0045】

（予測モデルの活用）
ステップＳ２１０の“第１”において“クラスタ数＝４”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタｃ７は、図３の店舗Ｍ０１〜Ｍ０４に対応している。店舗Ｍ０１〜Ｍ０４は、例えば、ある特定の地域に立地する店舗である。回帰分析部２３は、当該地域に新たに出店される店舗の年間売上高を予測する場合、予測モデル３１ｇを使用する。クラスタｃ１０は、図３の店舗Ｍ１７〜Ｍ２０に対応している。店舗Ｍ１７〜Ｍ２０は、例えば、ある他の特定の地域に立地する店舗である。回帰分析部２３は、当該他の地域に新たに出店される店舗の年間売上高を予測する場合、予測モデル３１ｊを使用する。他のクラスタについても同様である。

【0046】

（処理手順の変形例）
前記では、クラスタリング部２２は、すべてのクラスタ数についてクラスタリングを行い、回帰分析部２３は、すべてのクラスタ数について誤差評価値を算出している（総当たり処理）。しかしながら、クラスタ数ｋ＝１、２、３、４の降順又は昇順に、クラスタリング部２２がクラスタリングを行い、回帰分析部２３が誤差評価値を算出する処理を繰り返してもよい。この場合、所定の閾値（目標）に誤差評価値が達するまで、又は、誤差評価値の対前回比減少分が所定の閾値以下になるまで、クラスタリング部２２及び回帰分析部２３は処理を繰り返す。

【0047】

〈第２の実施形態〉
続いて、第２の実施形態を説明する。第２の実施形態が第１の実施形態と異なる点は、第１の実施形態が調査値情報３２（図２）を使用するのに代えて、第２の実施形態が調査値情報３２ｂ（図１１）を使用することである。

【0048】

図１１は、調査値情報３２ｂの一例である。調査値情報３２ｂにおいては、顧客ＩＤ欄１３１に記憶された顧客ＩＤに関連付けて、目的変数欄１３２には目的変数の調査値が、説明変数欄１３３には説明変数の調査値が記憶されている。
顧客ＩＤ欄１３１の顧客ＩＤは、取引主体である顧客を一意に特定する識別子である。

【0049】

目的変数欄１３２の目的変数の調査値は、顧客の年間購買金額である。ここでの年間購買金額は、すべての店舗で購入した商品の代金の合計額である。“年間”はあくまで一例であり、目的変数の調査値は、月間購買金額であっても、その他の期間の購買金額であってもよい。“＃”は、異なる値を省略的に示している（以下同様）。
説明変数欄１３３の説明変数の調査値は、年齢（欄１３３ａ）、性別（欄１３３ｂ）、自家所有（欄１３３ｃ）、年収（欄１３３ｄ）、支払方法（欄１３３ｅ）、食品購買金額（欄１３３ｆ）及び衣類購買金額（欄１３３ｇ）である。

【0050】

このうち、年齢は、顧客の年齢である。
性別は、顧客の性別である。図１１においては、わかりやすさのために、性別は“男”又は“女”のいずれかとしている。性別が多次元空間の説明変数の軸に割り当てられる場合、例えば“男＝０、女＝１”のように数値化される（後記する自家所有及び支払方法についても同様）。

【0051】

自家所有は、顧客が居住する住宅を顧客が保有していることを示す“あり”、又は、保有していないことを示す“なし”のいずれかである。自家所有が“あり”の場合、例えば、土地の面積又は市場価値が当該欄に記憶されてもよい。
年収は、顧客の年間所得金額である。顧客は、年収から貯金額又は返済額を減算した金額で商品等を購入することになる。
支払方法は、商品代金を現金で支払ったことを示す“現金”、又は、カードで支払ったことを示す“カード”のいずれかである。

【0052】

食品購買金額は、すべての店舗で購入した商品のうち食品の代金の年間合計額である。
衣類購買金額は、すべての店舗で購入した商品のうち衣類の代金の年間合計額である。
“食品”及び“衣類”は、あくまでも一例である。ユーザは、年間購買金額の使途として分析しようとしている商品又はサービスと相関がありそうな特定の品目の購買金額を選択することができる。例えば、食品購買金額が年間購買金額に占める比率（エンゲル係数）は、社会階層ごとにほぼ一定であることはよく知られている。
なお、年間購買金額は、“取引主体の経済力”に、年齢、性別、自家所有、年収、支払方法、食品購買金額及び衣類購買金額は、“取引主体の属性”に相当する。

【0053】

調査値情報３２ｂのレコードは、基本的には顧客ごとに記憶されている。しかしながら、１本のレコードを１回の購買機会（支払単位）に対応させ、顧客ごとの重複を許容することも可能である。レコードが顧客ごとに記憶される場合、１本のレコードは、通常、その顧客についての複数の購買機会を反映している。したがって、支払方法としての“カード”及び“現金”が混在する場合がある。この場合、支払方法としていずれか回数の多い方又は金額の大きい方が代表的に採用されてもよい。また、“カード＝＃回、現金＝＃回”又は“カード＝＃円、現金＝＃円”のように２次元化された値が採用されてもよい。

【0054】

第２の実施形態の具体的な処理内容は、第１の実施形態と同様であり、図１及び図３〜図１０についての説明が、第２の実施形態にもそのまま当てはまる。但し、図３において、“店舗ＩＤ”（欄１１１）は、“顧客ＩＤ”と読み替える。“年間売上高”（欄１１２）は、“年間購買金額”と読み替える。“売場面積”（欄１１３）は、図１１の欄１３３ａ〜１３３ｇのうちのいずれか（例えば“年収”）と読み替える。

【0055】

第１の実施形態と同様に第２の実施形態においても、ステップＳ２１０の“第１”において“クラスタ数＝４”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタｃ７は、前記読み替えを行った後の図３の顧客Ｐ０１〜Ｐ０４に対応している。顧客Ｐ０１〜Ｐ０４は、例えば、ある特定の地域に居住する顧客である。回帰分析部２３は、当該地域に居住する顧客の年間購買金額を予測する場合、予測モデル３１ｇを使用する。クラスタｃ１０は、図３の顧客Ｐ１７〜Ｐ２０に対応している。顧客Ｐ１７〜Ｐ２０は、例えば、ある他の特定の地域に居住する顧客である。回帰分析部２３は、当該他の地域に居住する顧客の年間購買金額を予測する場合、予測モデル３１ｊを使用する。他のクラスタについても同様である。

【0056】

第１の実施形態及び第２の実施形態を通じて、商品取引の主体である店舗及び顧客の例を説明した。しかしながら、前記から明らかなように、本発明は、商品の買主としての顧客及び商品の売主としての店舗以外の取引主体に対しても適用することができる。取引主体は、例えば、物品賃借取引における貸主及び借主、資本取引における債権者及び債務者、交通、物流、宿泊、医療、教育、介護サービス等におけるサービスの提供者及び被提供者等を含む。

【0057】

第１の実施形態及び第２の実施形態を通じて、年間売上高及び年間購買金額を予測する例を説明した。しかしながら、前記から明らかなように、本発明は、取引主体の一般的な経済力を予測する例に対して適用することができる。経済力は、貸出残高、借入残高、提供する又は提供される商品又はサービスの数量、市場占有率等を含む。

【0058】

第１の実施形態及び第２の実施形態を通じて、商品取引の主体である店舗及び顧客の説明変数が店舗サーバ３又はカード会社サーバ４から取得可能なデータである例を説明した。しかしながら、前記から明らかなように、本発明は、数値化することが可能な取引主体のあらゆる属性に対して適用することができる。

【0059】

（本実施形態の効果）
本実施形態のクラスタ分割評価装置の効果は以下の通りである。
（１）クラスタ分割評価装置は、取引主体の属性ごとに精度の高い予測モデルを作成することができる。
（２）クラスタ分割評価装置は、期待し得る誤差評価値及び取引主体の属性に対応するクラスタ数を表示することができる。
（３）クラスタ分割評価装置は、ユーザがクラスタの数及び大きさを指定することを可能にする。
（４）クラスタ分割評価装置は、店舗の売上高又は顧客の購買金額の予測に適用することができる。
（５）クラスタ分割評価装置は、一般的に入手しやすい取引主体の属性を使用することができる。

【0060】

なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

【0061】

また、前記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウエアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウエアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Solid State Drive）等の記録装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。

【符号の説明】

【0062】

１クラスタ分割評価装置
２ネットワーク
３店舗サーバ
４カード会社サーバ
１１中央制御装置
１２入力装置
１３出力装置
１４主記憶装置
１５補助記憶装置
１６通信装置
２１調査値取得部
２２クラスタリング部
２３回帰分析部
２４表示処理部
３１予測モデル
３２、３２ｂ調査値情報
３３クラスタ情報
３４誤差情報

【図1】