(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0010】
以降、本発明を実施するための形態(“本実施形態”という)を、図等を参照しながら詳細に説明する。本実施形態は、第1の実施形態及び第2の実施形態を有する。第1の実施形態は、店舗の年間売上高を予測する例であり、第2の実施形態は、顧客の年間購買金額を予測する例である。これらは、あくまでも一例であり、本発明は、より一般的に、マーケティングに関する数量の予測に適用可能である。
【0011】
〈第1の実施形態〉
まず、第1の実施形態を説明する。
【0012】
(クラスタ分割評価装置)
図1に沿って、クラスタ分割評価装置1の構成等を説明する。クラスタ分割評価装置1は、一般的なコンピュータであり、中央制御装置11、マウス、キーボード等の入力装置12、ディスプレイ等の出力装置13、主記憶装置14、補助記憶装置15及び通信装置16を備える。これらは、バスで相互に接続されている。補助記憶装置15は、予測モデル31、調査値情報32、クラスタ情報33及び誤差情報34(詳細後記)を格納している。
【0013】
主記憶装置14における調査値取得部21、クラスタリング部22、回帰分析部23及び表示処理部24は、プログラムである。中央制御装置11は、これらのプログラムを補助記憶装置15から読み出し主記憶装置14にロードすることによって、それぞれのプログラムの機能(詳細後記)を実現する。補助記憶装置15は、クラスタ分割評価装置1から独立した構成となっていてもよい。
【0014】
店舗サーバ3及びカード会社サーバ4は、ネットワーク2を介してクラスタ分割評価装置1に接続されている。クラスタ分割評価装置1は、店舗サーバ3及びカード会社サーバ4から、店舗及び顧客に関する様々なデータを取得することができる。
【0015】
(予測モデル)
本実施形態の予測モデル31は、以下の式1のような1次式である。
y=a
0+a
1x
1+a
2x
2+a
3x
3 (式1)
【0016】
ここで、yは、店舗の年間売上高である。x
1は、店舗の売場面積である。x
2は、店舗が立地している土地の固定資産税路線価である。x
3は、店舗の駐車場台数である。a
0、a
1、a
2及びa
3は、定数(パラメータ)である。式1は、x
1、x
2及びx
3を説明変数としyを目的変数とする関数になっている。そして、a
0、a
1、a
2及びa
3の値を様々に変化させることによって、4次元空間における予測モデル31の形状及びその位置が様々に変化する。ここで、変数の数(種類)を“4”としたのは、あくまでも一例である。変数の数がさらに多くても、すなわち、予測モデルの次元がさらに大きくてもよい。
【0017】
いま、年間売上高、売場面積、固定資産税路線価及び駐車場台数の過去における調査値の組合せとして、“[Y,X
1,X
2,X
3]”が多数存在するとする。Y、X
1、X
2及びX
3のそれぞれが示す数値の種類は、y、x
1、x
2及びx
3のそれぞれが示す数値の種類と同じである。しかしながら、説明の便宜上、実際に認められた実例としての調査値を大文字で示し、予測モデルの変数を小文字で示している。予測モデルの出力(目的変数)yは、“予測値”である。“Y−y”を誤差と呼ぶ。クラスタ分割評価装置1は、調査値の組合せを使用して、誤差の2乗和“Σ(Y−y)
2”を最小にするパラメータの組合せ“[a
0,a
1,a
2,a
3]”を決定する(詳細後記)。
【0018】
(調査値情報)
図2は、調査値情報32の一例である。調査値情報32においては、店舗ID欄101に記憶された店舗IDに関連付けて、目的変数欄102には目的変数の調査値が、説明変数欄103には説明変数の調査値が記憶されている。
店舗ID欄101の店舗IDは、取引主体である店舗を一意に特定する識別子である。
【0019】
目的変数欄102の目的変数の調査値は、店舗の年間売上高である。“年間”はあくまで一例であり、目的変数の調査値が、月間売上高であっても、週間売上高であっても、その他の期間の売上高であってもよい。“#”は、異なる値を省略的に示している(以下同様)。
【0020】
説明変数欄103の説明変数の調査値は、売場面積(欄103a)、固定資産税路線価(欄103b)及び駐車場台数(欄103c)である。
このうち、売場面積は、店舗の総床面積のうち、顧客に対する商品の販売に直接供される面積である。
固定資産税路線価は、店舗が立地する土地に課される固定資産税を算出する基礎となる路線価である。
駐車場台数は、店舗に来店する顧客が利用可能な駐車場の収容可能車両数である。
なお、年間売上高は、“取引主体の経済力”に、売場面積、固定資産税路線価及び駐車場台数は、“取引主体の属性”に相当する。
【0021】
(クラスタリング)
多次元空間に描画された多くの点を、位置が近いもの同士でグループ分けすることを一般に“クラスタリング”と呼ぶ。クラスタリングの手法として、“k−平均法”がよく知られている。クラスタ分割評価装置1もまた、以下の(1)〜(5)のようにk−平均法を使用する。
【0022】
(1)クラスタ分割評価装置1は、複数の点のそれぞれを、k個のグループのいずれかに適当に所属させる。
(2)クラスタ分割評価装置1は、あるグループの重心から当該グループに属する点までの距離の2乗和d
iをグループごとに算出する。iは、グループの番号(i=1、2、・・・、k)である。
【0023】
(3)クラスタ分割評価装置1は、1個の点の所属をあるグループから他のグループに変えたうえで、D
k=Σd
iを算出する。D
kは、k個のグループのd
iの総和である。クラスタ分割評価装置1は、所属を変える点及び新たな所属先のすべての組合せごとに当該処理を繰り返す。
(4)クラスタ分割評価装置1は、D
kを最小にするような、各点の所属を決定する。
(5)クラスタ分割評価装置1は、kを1、2、3、・・・と変化させたうえで、(1)〜(4)の処理を繰り返す。
【0024】
(クラスタ情報)
図3は、クラスタ情報33の一例である。クラスタ情報33においては、店舗ID欄111に記憶された店舗IDに関連付けて、目的変数欄112には目的変数の調査値が、説明変数欄113には説明変数の調査値が、所属クラスタID欄114には所属クラスタIDが記憶されている。
【0025】
店舗ID欄111の店舗IDは、
図2の店舗IDと同じである。
目的変数欄112の目的変数の調査値は、
図2の目的変数の調査値と同じである。
説明変数欄113の説明変数の調査値は、
図2の説明変数の調査値のうちの売場面積(欄103a)である。説明の単純化のため、
図3の説明変数は、“売場面積”だけとしている。
【0026】
所属クラスタID欄114は、クラスタの数ごとに、クラスタ数1欄114a、クラスタ数2欄114b、クラスタ数3欄114c、クラスタ数4欄114d、・・・に分かれている。そして分かれた各欄に、クラスタIDが記憶されている。クラスタIDは、クラスタを一意に特定する識別子である。各クラスタは、店舗の地域特性に対応している。一般に、新規出店を計画する企業は、地域特性に応じて、年間売上高を含む様々な数値(出店パタン)を決定する。なお、“c3”及び“c10”のように、所属する点が結果的に同じになったとしても、クラスタの数が異なれば、異なるクラスタIDが採番されている(D
kを算出し直しているため)。
【0027】
図4〜
図7は、クラスタと予測モデル31との関係を説明する図である。
図4は、
図3のクラスタ数1欄114aに対応している。
図4の座標平面の横軸は説明変数(売場面積)であり、縦軸は目的変数(年間売上高)である。座標平面上に、店舗M01〜M20に対応する20個の点●が描画されている(
図5〜
図7においても同様)。円c1は、クラスタc1を表している。直線31aは、予測モデル31(
図1)を表している。予測モデルの作成方法については後記する。
【0028】
図5は、
図3のクラスタ数2欄114bに対応している。円c2は、クラスタc2を表している。円c3は、クラスタc3を表している。直線31bは、予測モデル31(
図1)を表している。直線31cも、予測モデル31(
図1)を表している。
図6は、
図3のクラスタ数3欄114cに対応している。
図7は、
図3のクラスタ数4欄114dに対応している。
図6及び
図7の説明は、
図5の説明に準ずる。
なお、
図4〜
図7においては、作図上の制約に起因し、円c1等の中心は、クラスタc1等の重心(すべての点●の座標値の平均)とはなっていない。
【0029】
図4〜
図7において、クラスタ分割評価装置1は、クラスタごとに、当該クラスタに所属する調査値●のみを使用して、予測モデルを作成している。クラスタ分割評価装置1が予測モデル“y=a
0+a
1x
1”を作成する方法は、以下の(11)〜(17)の通りである。
【0030】
(11)クラスタ分割評価装置1は、無作為的に発生させたパラメータa
0及びa
1の値を予測モデルのa
0及びa
1に代入する。
(12)クラスタ分割評価装置1は、調査値Xを予測モデルのx
1に代入し、yを算出する。
(13)クラスタ分割評価装置1は、誤差“Y−y”を算出する。
(14)クラスタ分割評価装置1は、店舗ごとに [X,Y]の値を変化させて前記(12)及び前記(13)の処理を繰り返す。
【0031】
(15)クラスタ分割評価装置1は、各店舗の“(Y−y)
2”の総和である“Σ(Y−y)
2”を算出する。
(16)クラスタ分割評価装置1は、無作為的に発生させたパラメータa
0及びa
1の他の値を予測モデルのa
0及びa
1に代入したうえで、前記(12)〜(15)の処理を充分多い回数だけ繰り返す。
(17)クラスタ分割評価装置1は、“Σ(Y−y)
2”を最小にするパラメータa
0S及びa
1Sの値を決定する。ここで“S”は、“最適化されている”ことを示す。
【0032】
(誤差)
図8は、誤差を説明する図である。
図8の座標平面の横軸は売場面積であり、縦軸は年間売上高である。20個の点●は、
図3における調査値の組合せ[X,Y]を示している。直線31aは、予測モデル31(
図1)であり、その式は、“y=a
0S+a
1Sx
1”である。点●のそれぞれについて、誤差“Y−y”が定義される。前記したように、“Σ(Y−y)
2”は最小化されてはいるが、個々の点●に注目した場合、誤差が殆どないものと、誤差が比較的大きいものとが混在している。
【0033】
(誤差情報)
図9は、誤差情報34の一例である。誤差情報34においては、クラスタ数欄121に記憶されたクラスタ数に関連付けて、誤差欄122には誤差が、誤差評価値欄123には誤差評価値が記憶されている。
クラスタ数欄121のクラスタ数は、クラスタの数である。
誤差欄122の誤差は、“√(Σ(Y−y)
2/n)”である。ここで、nは、クラスタ内の点●の数である。“√(Σ(Y−y)
2/n)”は、
図8における誤差の2乗和の平均の平方根である。“#”に付された括弧内には、クラスタIDが記載されている。
【0034】
誤差評価値欄123の誤差評価値は、誤差を加工して得られる任意の値であり、その値が小さいほど、クラスタ数に対する評価は高い。誤差評価値は、例えば、誤差情報34のレコード(行)に含まれる誤差の平均、誤差の最小値、誤差の分散等である。なお、誤差評価値の定義の仕方によっては、その値が大きいほど、クラスタ数に対する評価が高い場合もある。
【0035】
(処理手順)
図10は、処理手順のフローチャートである。処理手順を開始する前提として、調査値情報32(
図2)が、完成された状態で補助記憶装置15に格納されているものとする。
ステップS201において、クラスタ分割評価装置1の調査値取得部21は、調査値を取得する。具体的には、調査値取得部21は、補助記憶装置15から調査値情報32(
図2)を取得する。
【0036】
ステップS202において、クラスタ分割評価装置1のクラスタリング部22は、変数を受け付ける。具体的には、クラスタリング部22は、複数の説明変数の一部又は全部をユーザが入力装置12を介して選択するのを受け付ける。例えば、ユーザが説明変数のうち売場面積のパラメータの値a
1がa
0を除くすべてのパラメータのうちで最も大きくなりそうである、すなわち、売場面積が目的変数に与える影響が最も大きくなりそうであると予測している場合、ユーザは“売場面積”を選択してもよい。ここでは、ユーザは“売場面積”を選択したとする。
【0037】
ステップS203において、クラスタリング部22は、クラスタ数の最大値等を受け付ける。具体的には、クラスタリング部22は、クラスタ数の最小値及び最大値、並びに、1つのクラスタに含まれる点●(クラスタ情報33のレコード数)の最小値をユーザが入力装置12を介して選択するのを受け付ける。ここでは、ユーザはクラスタ数の最小値として“1”、クラスタ数の最大値として“4”、1つのクラスタに含まれる点●の最小値として“4”を入力したとする。
【0038】
ステップS204において、クラスタリング部22は、クラスタリングを行う。具体的には、第1に、クラスタリング部22は、調査値情報32(
図2)から、“売場面積”以外の説明変数の欄を削除する。
第2に、クラスタリング部22は、前記したk−平均法を使用して、調査値情報32(
図2)の20個の点●“[X,Y]=[売場面積,年間売上高]”を、k個(k=1、2、3、4)のクラスタに分割する。このとき、クラスタリング部22は、いずれのクラスタにも少なくとも4個の点●が含まれるようにする。
【0039】
ステップS205において、クラスタリング部22は、クラスタ情報33(
図3)を作成する。具体的には、クラスタリング部22は、ステップS204の“第2”におけるクラスタリングの結果に基づきクラスタ情報33を作成する。
【0040】
ステップS206において、クラスタ分割評価装置1の回帰分析部23は、予測モデル31を作成する。具体的には、回帰分析部23は、ユーザが画面上で予測モデルの数式を記述するのを受け付け、又は、一般的な予測モデルのひな型を画面表示し、ユーザが選択するのを受け付ける。ここで作成される予測モデル31は、前記した式1のような1次式である必要はなく、高次式であってもよいし、指数、対数等を含む非線形の式であってもよい。ただし、予測モデル31は、ステップS202において受け付けた各変数についてのパラメータ(この段階では値は未知である)を含むものとする。
【0041】
ステップS207において、回帰分析部23は、クラスタごとにパラメータを最適化する。具体的には、回帰分析部23は、前記した方法で、予測モデルのパラメータをクラスタごとに決定する。つまり、回帰分析部23は、調査値情報32(
図2)の店舗M01〜M20の調査値のうち、処理対象のクラスタに属するものを使用して、“Σ(Y−y)
2”を最小にするパラメータを決定する。
【0042】
ステップS208において、回帰分析部23は、誤差情報34(
図9)を作成する。具体的には、第1に、回帰分析部23は、誤差情報34を作成する。ここで作成される誤差情報34は、4本のレコードを有し、クラスタ数欄121には、“1”、“2”、“3”及び“4”が記憶されている。誤差欄122及び誤差評価値欄123は、空欄である。
第2に、回帰分析部23は、ステップS207において最小となった“Σ(Y−y)
2”を使用して、誤差“√(Σ(Y−y)
2/n)”を算出し、誤差欄122に記憶する。
第3に、回帰分析部23は、各レコードの誤差に基づいて、誤差評価値を算出し、誤差評価値欄123に記憶する。
【0043】
ステップS209において、回帰分析部23は、誤差評価値に基づきクラスタ数を決定する。具体的には、回帰分析部23は、誤差評価値が最小であるレコードのクラスタ数を決定する。ここで“最小”としたのはあくまでも一例であり、回帰分析部23は、所定の基準を満たす程度に誤差評価値が小さい複数の“クラスタ数”を決定してもよい。
【0044】
ステップS210において、クラスタ分割評価装置1の表示処理部24は、決定したクラスタ数及び誤差評価値を表示する。具体的には、第1に、表示処理部24は、ステップS209において決定したクラスタ数及びそのクラスタ数に対する誤差評価値を出力装置13に表示する。ここでは、“クラスタ数=4”が表示されたとする。
第2に、表示処理部24は、4個のクラスタc7、c8、c9及びc10に対応する予測モデル31g、31h、31i及び31j(
図7)を補助記憶装置15に記憶する。その後、処理手順を終了する。
【0045】
(予測モデルの活用)
ステップS210の“第1”において“クラスタ数=4”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタc7は、
図3の店舗M01〜M04に対応している。店舗M01〜M04は、例えば、ある特定の地域に立地する店舗である。回帰分析部23は、当該地域に新たに出店される店舗の年間売上高を予測する場合、予測モデル31gを使用する。クラスタc10は、
図3の店舗M17〜M20に対応している。店舗M17〜M20は、例えば、ある他の特定の地域に立地する店舗である。回帰分析部23は、当該他の地域に新たに出店される店舗の年間売上高を予測する場合、予測モデル31jを使用する。他のクラスタについても同様である。
【0046】
(処理手順の変形例)
前記では、クラスタリング部22は、すべてのクラスタ数についてクラスタリングを行い、回帰分析部23は、すべてのクラスタ数について誤差評価値を算出している(総当たり処理)。しかしながら、クラスタ数k=1、2、3、4の降順又は昇順に、クラスタリング部22がクラスタリングを行い、回帰分析部23が誤差評価値を算出する処理を繰り返してもよい。この場合、所定の閾値(目標)に誤差評価値が達するまで、又は、誤差評価値の対前回比減少分が所定の閾値以下になるまで、クラスタリング部22及び回帰分析部23は処理を繰り返す。
【0047】
〈第2の実施形態〉
続いて、第2の実施形態を説明する。第2の実施形態が第1の実施形態と異なる点は、第1の実施形態が調査値情報32(
図2)を使用するのに代えて、第2の実施形態が調査値情報32b(
図11)を使用することである。
【0048】
図11は、調査値情報32bの一例である。調査値情報32bにおいては、顧客ID欄131に記憶された顧客IDに関連付けて、目的変数欄132には目的変数の調査値が、説明変数欄133には説明変数の調査値が記憶されている。
顧客ID欄131の顧客IDは、取引主体である顧客を一意に特定する識別子である。
【0049】
目的変数欄132の目的変数の調査値は、顧客の年間購買金額である。ここでの年間購買金額は、すべての店舗で購入した商品の代金の合計額である。“年間”はあくまで一例であり、目的変数の調査値は、月間購買金額であっても、その他の期間の購買金額であってもよい。“#”は、異なる値を省略的に示している(以下同様)。
説明変数欄133の説明変数の調査値は、年齢(欄133a)、性別(欄133b)、自家所有(欄133c)、年収(欄133d)、支払方法(欄133e)、食品購買金額(欄133f)及び衣類購買金額(欄133g)である。
【0050】
このうち、年齢は、顧客の年齢である。
性別は、顧客の性別である。
図11においては、わかりやすさのために、性別は“男”又は“女”のいずれかとしている。性別が多次元空間の説明変数の軸に割り当てられる場合、例えば“男=0、女=1”のように数値化される(後記する自家所有及び支払方法についても同様)。
【0051】
自家所有は、顧客が居住する住宅を顧客が保有していることを示す“あり”、又は、保有していないことを示す“なし”のいずれかである。自家所有が“あり”の場合、例えば、土地の面積又は市場価値が当該欄に記憶されてもよい。
年収は、顧客の年間所得金額である。顧客は、年収から貯金額又は返済額を減算した金額で商品等を購入することになる。
支払方法は、商品代金を現金で支払ったことを示す“現金”、又は、カードで支払ったことを示す“カード”のいずれかである。
【0052】
食品購買金額は、すべての店舗で購入した商品のうち食品の代金の年間合計額である。
衣類購買金額は、すべての店舗で購入した商品のうち衣類の代金の年間合計額である。
“食品”及び“衣類”は、あくまでも一例である。ユーザは、年間購買金額の使途として分析しようとしている商品又はサービスと相関がありそうな特定の品目の購買金額を選択することができる。例えば、食品購買金額が年間購買金額に占める比率(エンゲル係数)は、社会階層ごとにほぼ一定であることはよく知られている。
なお、年間購買金額は、“取引主体の経済力”に、年齢、性別、自家所有、年収、支払方法、食品購買金額及び衣類購買金額は、“取引主体の属性”に相当する。
【0053】
調査値情報32bのレコードは、基本的には顧客ごとに記憶されている。しかしながら、1本のレコードを1回の購買機会(支払単位)に対応させ、顧客ごとの重複を許容することも可能である。レコードが顧客ごとに記憶される場合、1本のレコードは、通常、その顧客についての複数の購買機会を反映している。したがって、支払方法としての“カード”及び“現金”が混在する場合がある。この場合、支払方法としていずれか回数の多い方又は金額の大きい方が代表的に採用されてもよい。また、“カード=#回、現金=#回”又は“カード=#円、現金=#円”のように2次元化された値が採用されてもよい。
【0054】
第2の実施形態の具体的な処理内容は、第1の実施形態と同様であり、
図1及び
図3〜
図10についての説明が、第2の実施形態にもそのまま当てはまる。但し、
図3において、“店舗ID”(欄111)は、“顧客ID”と読み替える。“年間売上高”(欄112)は、“年間購買金額”と読み替える。“売場面積”(欄113)は、
図11の欄133a〜133gのうちのいずれか(例えば“年収”)と読み替える。
【0055】
第1の実施形態と同様に第2の実施形態においても、ステップS210の“第1”において“クラスタ数=4”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタc7は、前記読み替えを行った後の
図3の顧客P01〜P04に対応している。顧客P01〜P04は、例えば、ある特定の地域に居住する顧客である。回帰分析部23は、当該地域に居住する顧客の年間購買金額を予測する場合、予測モデル31gを使用する。クラスタc10は、
図3の顧客P17〜P20に対応している。顧客P17〜P20は、例えば、ある他の特定の地域に居住する顧客である。回帰分析部23は、当該他の地域に居住する顧客の年間購買金額を予測する場合、予測モデル31jを使用する。他のクラスタについても同様である。
【0056】
第1の実施形態及び第2の実施形態を通じて、商品取引の主体である店舗及び顧客の例を説明した。しかしながら、前記から明らかなように、本発明は、商品の買主としての顧客及び商品の売主としての店舗以外の取引主体に対しても適用することができる。取引主体は、例えば、物品賃借取引における貸主及び借主、資本取引における債権者及び債務者、交通、物流、宿泊、医療、教育、介護サービス等におけるサービスの提供者及び被提供者等を含む。
【0057】
第1の実施形態及び第2の実施形態を通じて、年間売上高及び年間購買金額を予測する例を説明した。しかしながら、前記から明らかなように、本発明は、取引主体の一般的な経済力を予測する例に対して適用することができる。経済力は、貸出残高、借入残高、提供する又は提供される商品又はサービスの数量、市場占有率等を含む。
【0058】
第1の実施形態及び第2の実施形態を通じて、商品取引の主体である店舗及び顧客の説明変数が店舗サーバ3又はカード会社サーバ4から取得可能なデータである例を説明した。しかしながら、前記から明らかなように、本発明は、数値化することが可能な取引主体のあらゆる属性に対して適用することができる。
【0059】
(本実施形態の効果)
本実施形態のクラスタ分割評価装置の効果は以下の通りである。
(1)クラスタ分割評価装置は、取引主体の属性ごとに精度の高い予測モデルを作成することができる。
(2)クラスタ分割評価装置は、期待し得る誤差評価値及び取引主体の属性に対応するクラスタ数を表示することができる。
(3)クラスタ分割評価装置は、ユーザがクラスタの数及び大きさを指定することを可能にする。
(4)クラスタ分割評価装置は、店舗の売上高又は顧客の購買金額の予測に適用することができる。
(5)クラスタ分割評価装置は、一般的に入手しやすい取引主体の属性を使用することができる。
【0060】
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0061】
また、前記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウエアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウエアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。