(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-02
(45)【発行日】2023-11-13
(54)【発明の名称】情報処理方法
(51)【国際特許分類】
G06Q 30/0203 20230101AFI20231106BHJP
G06F 17/18 20060101ALI20231106BHJP
【FI】
G06Q30/0203
G06F17/18 Z
(21)【出願番号】P 2019201313
(22)【出願日】2019-11-06
【審査請求日】2022-09-15
(73)【特許権者】
【識別番号】316016852
【氏名又は名称】株式会社マクロミル
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】西村 広之
【審査官】大野 朋也
(56)【参考文献】
【文献】特開2013-182538(JP,A)
【文献】特開2004-185515(JP,A)
【文献】国際公開第2019/073913(WO,A1)
【文献】特開2017-102710(JP,A)
【文献】特開2009-251779(JP,A)
【文献】特開2012-252572(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 17/18
(57)【特許請求の範囲】
【請求項1】
情報処理装置が、消費者による実際の商品購入時の購買データである実購買データを取得する取得ステップであって、前記実購買データは、前記消費者が購入した商品区分の組み合わせを示す併売パターン情報を含む、取得ステップと、
前記情報処理装置が、複数の前記実購買データに基づいて、複数の前記商品区分それぞれに対応する複数の固有ベクトルと、前記複数の固有ベクトルそれぞれの係数となる複数の固有値を算出する算出ステップと、
前記情報処理装置が、前記複数の固有値および前記複数の固有ベクトルを用いた線形結合により、仮想的な購買データである疑似購買データを生成する生成ステップと、
を有
し、
前記算出ステップは、複数の前記実購買データに基づいて、所定の処理対象範囲の併売パターン情報を反映する共起行列を生成し、前記共起行列をスペクトル分解することにより、前記固有値および前記固有ベクトルを算出するものであり、
前記算出ステップは、前記消費者が同時に購入した商品の組み合わせと購入数に基づいて前記共起行列を生成する
ことを特徴とする情報処理方法。
【請求項2】
前記情報処理装置が、前記複数の固有ベクトルから少なくとも1つの前記固有ベクトルを選択し、選択された前記固有ベクトルに対応する前記固有値を変化させるための変化情報を取得する変化取得ステップをさらに有し、
前記生成ステップは、前記変化情報に基づいて前記固有値を変化させて前記線形結合を行う事により、前記併売パターン情報が変化した前記疑似購買データを生成する
ことを特徴とする請求項1に記載の情報処理方法。
【請求項3】
前記生成ステップは、前記固有値を不規則に変化させることにより、前記併売パターン情報に揺らぎのある前期疑似購買データを生成する
ことを特徴とする請求項2に記載の情報処理方法。
【請求項4】
前記算出ステップは、前記消費者が同時に購入した商品の組み合わせと購入数に基づいて、前記商品区分と同じ数の行および列からなる正方行列の要素の値を決定することによ
り、前記共起行列を生成する
ことを特徴とする請求項
1に記載の情報処理方法。
【請求項5】
前記算出ステップは、前記複数の固有値のうち絶対値が最大の前記固有値を選択し、選択された前記固有値に対応する前記固有ベクトルが有する要素から絶対値が最大の要素を抽出することにより、抽出された前記要素を起点とする併売特性を取得する
ことを特徴とする請求項1~
4のいずれか1項に記載の情報処理方法。
【請求項6】
前記算出ステップは、前記複数の固有値のうち、絶対値が大きい順に所定の数の前記固有値を選択し、選択された所定の数の前記固有値にそれぞれ対応する所定の数の前記固有ベクトルについて、前記併売特性を取得する
ことを特徴とする請求項
5に記載の情報処理方法。
【請求項7】
前記情報処理装置が、前記複数の固有値および前記複数の固有ベクトルに基づいて、少なくとも1つの前記固有ベクトルを選択し、選択された前記固有ベクトルに対応する前記商品区分と、他の商品区分との併売の状況を可視化する可視化ステップをさらに有する
ことを特徴とする請求項1~
6のいずれか1項に記載の情報処理方法。
【請求項8】
前記可視化ステップは、前記併売の状況をマトリクスとして可視化する
ことを特徴とする請求項
7に記載の情報処理方法。
【請求項9】
前記可視化ステップは、複数の前記商品区分の間の併売の状況に応じて濃度、色相および彩度の少なくとも何れかが変化するような前記マトリクスを作成する
ことを特徴とする請求項
8に記載の情報処理方法。
【請求項10】
情報処理装置が、消費者による実際の商品購入時の購買データである実購買データを取得する取得ステップであって、前記実購買データは、前記消費者が購入した商品区分の組み合わせを示す併売パターン情報を含む、取得ステップと、
前記情報処理装置が、複数の前記実購買データに基づいて、複数の前記商品区分それぞれに対応する複数の固有ベクトルと、前記複数の固有ベクトルそれぞれの係数となる複数の固有値を算出する算出ステップと、
前記情報処理装置が、前記複数の固有値および前記複数の固有ベクトルに基づいて、少なくとも1つの前記固有ベクトルを選択し、選択された前記固有ベクトルに対応する前記商品区分と、他の商品区分との併売の状況を可視化する可視化ステップと、
前記情報処理装置が、前記複数の固有値および前記複数の固有ベクトルを用いた線形結合により、仮想的な購買データである疑似購買データを生成する生成ステップと、
を有
し、
前記算出ステップは、複数の前記実購買データに基づいて、所定の処理対象範囲の併売パターン情報を反映する共起行列を生成し、前記共起行列をスペクトル分解することにより、前記固有値および前記固有ベクトルを算出するものであり、
前記算出ステップは、前記消費者が同時に購入した商品の組み合わせと購入数に基づいて前記共起行列を生成する
ことを特徴とする情報処理方法。
【請求項11】
前記可視化ステップは、前記併売の状況をマトリクスとして可視化する
ことを特徴とする請求項
10に記載の情報処理方法。
【請求項12】
前記可視化ステップは、複数の前記商品区分の間の併売の状況に応じて濃度、色相および彩度の少なくとも何れかが変化するような前記マトリクスを作成する
ことを特徴とする請求項
11に記載の情報処理方法。
【請求項13】
請求項1~
12のいずれか1項に記載の情報処理方法を情報処理装置に実行させるプログラム。
【請求項14】
請求項1~
12のいずれか1項に記載の情報処理方法を実行する、情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法に関する。
【背景技術】
【0002】
マーケティングにおいては、消費者の購買行動データの収集が重視されており、特に消費者が同時に購入した商品の組み合わせを示す併売パターン情報の解析は、販売戦略を策定する上で重要視されている。例えば実店舗においては、併売パターン情報を利用して店舗レイアウトや商品陳列パターンを決定する。また電子商取引の際には、解析結果に基づいて消費者への情報提示やレコメンドを最適化する。
【0003】
従来、併売パターン情報を用いた解析の精度は、得られたデータ数に大きく影響されることが知られている。さらに、近年発達を見せている、機械学習を用いた購買行動データ解析においては、併売パターン情報に基づいて購買予測モデル等を作成してマーケティングに役立てているが、その際の予測モデルの精度もまた、データの多寡に影響される。
【0004】
消費者による併売パターン情報を収集するときには、従来のようなPOS(Point
of Sale)情報を用いる方法のほか、消費者にレシート情報をスキャンして貰う方法や、インターネット経由で消費者にネットリサーチを行う方法など、様々な方法を採用できる。ネットリサーチには、回答者の負担軽減、集計および解析の省力化、コスト低減などのメリットがある。また、企業の代わりにネットリサーチ事業者がデータ収集を行う場合、多数のモニタを組織化することでデータの母数を増やせるという利点がある。
【0005】
しかし、上述のように、統計解析の精度向上や良好な予測モデル作成の観点から、より多数の購買行動データを収集することが求められている。そのために実際の購買データを増幅することにより
特許文献1(特開2010-277481号公報)は、実際の購買データに基づいて擬似データを生成する技術を開示する。特許文献1には、実データ自体を蓄積することなく、実データの傾向を保持した擬似データを生成することが記載されている。
また特許文献2(特開2019-046390号公報)に開示の技術では、実データとの区別がされないような擬似データを生成しようとしている。
【0006】
また、得られたデータが不完全な場合でも、該データの精度を向上させて統計解析に用いる試みもなされている。例えば特許文献3(特開2018-028859号公報)は、消費者が利用可能な複数の端末のうちの一部からの情報しか得られない場合でも、収集されたデータに基づく推計により精度を向上させる技術を開示している。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2010-277481号公報
【文献】特開2019-046390号公報
【文献】特開2018-028859号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、従来の併売パターンの解析においては、購買データを解析および提示する方法が十分に検討されておらず、調査者が解析結果から意味のある内容を抽出することが難しかった。また、従来の実データに基づくデータ増幅により生成される擬似データの
品質をより向上させることが求められていた。
【0009】
本発明は上記の課題に鑑みてなされたものであり、その目的は、消費者による実際の購買データに基づいて生成される疑似データの品質を向上させるための技術を提供することにある。
【課題を解決するための手段】
【0010】
上記の目的を達成するため、本発明は以下のような構成を採用する。すなわち、
消費者による実際の商品購入時の購買データである実購買データを取得する取得ステップであって、前記実購買データは、前記消費者が購入した商品区分の組み合わせを示す併売パターン情報を含む、取得ステップと、
複数の前記実購買データに基づいて、複数の前記商品区分それぞれに対応する複数の固有ベクトルと、前記複数の固有ベクトルそれぞれの係数となる複数の固有値を算出する算出ステップと、
前記複数の固有値および前記複数の固有ベクトルを用いた線形結合により、仮想的な購買データである疑似購買データを生成する生成ステップと、
を有することを特徴とする情報処理方法である。
【0011】
本発明はまた、以下の構成を採用する。すなわち、
消費者による実際の商品購入時の購買データである実購買データを取得する取得ステップであって、前記実購買データは、前記消費者が購入した商品区分の組み合わせを示す併売パターン情報を含む、取得ステップと、
複数の前記実購買データに基づいて、複数の前記商品区分それぞれに対応する複数の固有ベクトルと、前記複数の固有ベクトルそれぞれの係数となる複数の固有値を算出する算出ステップと、
前記複数の固有値および前記複数の固有ベクトルに基づいて、少なくとも1つの前記固有ベクトルを選択し、選択された前記固有ベクトルに対応する前記商品区分と、他の商品区分との併売の状況を可視化する可視化ステップと、
を有することを特徴とする情報処理方法である。
【発明の効果】
【0012】
本発明によれば、消費者による実際の購買データに基づいて生成される疑似データの品質を向上させるための技術を提供することができる。
【図面の簡単な説明】
【0013】
【
図1】情報処理システムの構成を説明する図である。
【
図2】実施例1の制御ブロックの構成を説明する図である。
【
図5】実施例2の制御ブロックの構成を説明する図である。
【発明を実施するための形態】
【0014】
以下に図面を参照しつつ、本発明の好適な実施の形態を説明する。ただし、以下に記載されている構成ブロックやそれらの相対配置などは、発明が適用されるシステムの各種条件により適宜変更されるべきものであり、この発明の範囲を以下の記載に限定する趣旨のものではない。
【0015】
本発明は、消費者から収集した実購買データに基づいて、品質の高い疑似購買データを生成するために好ましく用いられる。本発明は、このような調査を行う情報処理方法また
は情報処理システムとして捉えられる。本発明はまた、かかる情報処理方法に用いられる、またはかかる情報処理システムを構成する、情報処理装置としても捉えられる。本発明はまた、情報処理システムまたは情報処理装置の制御方法としても捉えられる。本発明はまた、情報処理装置の演算資源を利用して動作し、情報処理方法の各工程を実行するプログラムや、該プログラムが格納された記憶媒体としても捉えられる。記憶媒体は、コンピュータにより読み取り可能な非一時的な記憶媒体であってもよい。
【0016】
以下の実施例において、消費者は商品やサービスを購買する主体であり、実購買データを提供する。調査者は、消費者から実購買データを収集して疑似購買データを生成する。なお、実購買データの収集と疑似購買データ生成を別の主体が行っても構わない。調査者は、営業などの調査目的に応じて消費者から実購買データを収集し、解析する。調査者は、実際の事業会社ではなく、ネットリサーチ業者のような調査代行者でも良い。調査者がネットリサーチ業者である場合、組織化している会員モニタから情報収集できるという利点がある。
【0017】
(検討)
ここで、発明者による鋭意検討によれば、従来の併売パターン解析および疑似購買データの作成には、以下の問題点があることが分かった。
【0018】
まず併売パターン解析での問題について検討する。併売パターン情報は、消費者が購入した商品の組み合わせや商品ごとの購入数を示す情報である。したがって、調査対象となる消費者数が増加するほど、また、検討対象の商品数が増加するほど、併売される商品が取り得る組み合わせの数も増加する。そのため、収集した膨大なデータの意味を損なわないように解析し、かつ、調査者が容易に解釈できる形式で提示することが求められている。しかし、従来の解析手法では、データ量の増加に伴う組み合わせ爆発への対応や調査者への適切な提示方法という点で不十分であった。
【0019】
次に、データ増幅によって疑似購買データを生成するときの問題について検討する。データ増幅の際には、データの利用目的を損なわないために、品質の良い疑似購買データを生成する必要がある。しかし、実購買データをコピーした後に確率的な揺らぎを加えただけの擬似購買データでは、実購買データに含まれる情報と同質の情報しか含んでいない。例えば、機械学習の学習用データとしてこのような品質の低い疑似購買データを利用したとしても、購買予測モデルの精度を高めることはできない。
【0020】
上記の問題意識に基づいて発明者が検討した結果、まずは、実購買データが、どのような情報をどの程度含んでいるか、すなわち情報の質と量を評価する必要があることが分かった。そして、かかる実購買データの分析結果を基礎とすることで、品質の良い疑似購買データを生成できることが分かった。以下の各実施例では、好ましい実購買データの分析方法と疑似購買データの生成方法について説明する。
【0021】
[実施例1]
(システムの構成)
本実施例のシステムの全体的な構成について、
図1を参照しながら説明する。
情報処理システム1は概略、調査者が使用する情報処理装置10と、複数の消費者30それぞれが使用する消費者端末20と、店舗に設置された店舗端末40を備えている。情報処理装置10は、消費者端末20および店舗端末40と、Webや専用回線等の通信ネットワークを介して相互に接続される。
【0022】
調査者は、各種の情報処理を実施するために情報処理装置10を運用する。情報処理装置10としては、CPU等の制御部1001、ROM、RAMやHDD等の記憶部100
2、通信アダプタ等の通信部1003、マウスやキーボード等の入力部1004、ディスプレイ等の表示部1005などの演算資源を備え、記憶部に展開されたプログラムの指示やインタフェースを介したユーザ指示によって動作する、PCやワークステーションなどの情報処理装置が好適である。なお、情報処理装置10として、クラウド上の演算資源を利用するクラウドサーバを用いてもよい。また、ネット回線または直接的に接続された複数のPC等を組み合わせて情報処理装置10としてもよい。その場合、アンケート収集、疑似購買データの生成、学習済みモデルの生成に、それぞれ異なる情報処理装置を用いても良い。
【0023】
消費者端末20は、消費者30がアンケートを受信し、購買データを回答し、回答を送信するための端末装置である。
図1に示したように、消費者端末20として、情報処理装置10と同様の、制御部2001、記憶部2002、通信部2003、入力部2004および表示部2005を備えるPCを使用しても良い。また、消費者端末20として、スマートフォンやタブレットデバイスなどのモバイル機器を用いてもよい。消費者端末20は、実購買データをアンケートによって取得する場合に利用される。
【0024】
店舗端末40は、商品を販売する店舗に設置され、併売パターン情報を含む実購買データを収集し、送信するための端末装置である。店舗端末40として、情報処理装置10と同様に、制御部4001、記憶部4002、通信部4003、入力部4004および表示部4005を備えるPCを使用できる。入力部4004としては、商品購入時のレジ処理においてPOS(Point of Sale)情報を取得するPOS端末を利用しても良い。
【0025】
なお、情報処理システム1における実購買データの取得元に、オンラインモールの運営者などが用いる、電子商取引用情報処理装置を含めても良い。情報処理装置10が電子商取引用情報処理装置から実購買データを取得することにより、電子商取引における消費者の併売パターン情報を取得することができる。
【0026】
(制御ブロックの構成)
図2を参照して、情報処理装置10の制御部1001の仮想的な処理ブロックの構成を説明する。
図2は、情報処理装置10においてプログラムの機能モジュールにより実現される、データ送受信とデータ処理について説明するブロック図である。ただし、本発明の情報処理を実現可能であればブロック構成はこれに限定されない。
【0027】
本実施例の制御部1001は、実購買データ処理部1040、疑似購買データ生成部1060、データ解析部1080を有する。実購買データ処理部1040は、データ収集部1041、共起行列生成部1042、スペクトル分解部1043を含む。疑似購買データ生成部1060は、固有値・固有ベクトル取得部1061、変化情報入力部1062、データ生成部1063を含む。データ解析部1080は、データ取得部1081、情報取得部1082を含む。これら各ブロックの処理については後述する。
【0028】
<処理フロー>
図3を参照して、本実施例の処理フローについて説明する。処理フローは、調査の目的と内容が決定された時点でスタートする。また、説明を簡潔にするために、
図3の処理は単一の調査者が一連の処理として行うものとする。
【0029】
(実購買データの取得と処理)
ステップS101において、データ収集部1041は、情報処理装置10の通信部1003を介してネットワーク上から実購買データを収集して記憶部1002に保存する。必要な情報が含まれていれば、データソースの種類は問わず、消費者端末20、店舗端末4
0、電子商取引用情報処理装置(不図示)の何れか、または全てから取得しても良い。
例えば、情報処理装置10からネットワークを介して消費者端末20にアンケートを送信し、消費者30が入力部2004を用いて入力した実購買データを取得しても良い。また、店舗端末40のPOSデータに基づいて、消費者30が店舗で購入した商品の実購買データを取得しても良い。また、電子商取引用情報処理装置から、ある消費者30の実購買データを取得しても良い。
【0030】
ここで、実購買データには、少なくとも、消費者30が同時に購入した商品区分の組み合わせを示す併売パターン情報が含まれる。商品区分とは、具体的な商品名そのものであっても良い。また、商品コードやJANコード等の符号化された情報であっても良い。また、調査の目的に鑑みて大まかな区分で十分な場合は、商品区分として、「飲料」「食品」などの商品カテゴリを用いても良い。カテゴリを用いる場合、情報処理装置10の側で、商品名や商品コードに基づくカテゴライズを行っても良い。カテゴリの粒度は、調査の目的に応じて自由に決定できる。
実購買データには、また、商品の購入数量を示す情報も含まれる。さらに、統計処理を容易にするために、購入者、購入日時、購入場所、レシート番号、購入金額などの情報を含めることも好ましい。
【0031】
ステップS102において、共起行列生成部1042は、取得した実購買データから共起行列を生成する。本実施例において「共起行列」とは、消費者10が同時に購入した商品の情報を蓄積した行列形式のデータを意味し、同時購入した複数種の商品の情報が存在することを「共起」と表現している。よって共起行列は、処理対象範囲の実購買データにおける併売パターンを反映している。本実施例では、2019年7月1日に、商店「Aコンビニ」で発生した併売パターン情報を行列化する。ただし、処理対象範囲とするデータの取得範囲はこれに限定されない。本実施例のように所定の日付や場所で区切っても良いし、それ以外の方法でデータを選択しても良い。
【0032】
まず、共起行列生成部1042が、実購買データから併売パターン情報を抽出する方法の一例を示す。
図4(a)は、データ収集部1041が収集した実購買データから説明に必要な部分を抽出したものであり、実際には図示したもの以外にも多数のデータレコードが存在する。共起行列生成部1042は、アンケートに答えた消費者30のID、購入日時、購入場所が一致している3つのデータレコードが示す商品を、同時購入されたと判定する。
【0033】
図4(b)および
図4(c)は、共起行列生成の一例を示す。簡略化のため、商品カテゴリを6つとしている。共起行列生成部1042は、まず
図4(b)で示すように、カテゴリ数である6×6の二次元正方行列の対角要素に、同時購入された商品の購入数を設定する。続いて
図4(c)で示すように、併売が発生した商品カテゴリの組み合わせ箇所に「1」を設定する。以下同様に、共起行列生成部1042は、2019年7月1日に商店「Aコンビニ」で発生した全ての実購買データを共起行列に反映する。生成された共起行列を以下、Σとおく。
【0034】
本実施例では、実購買データの購入日時等に基づいて併売パターン情報の判定を行ったが、その他の方法で併売パターン情報を取得しても構わない。例えば、一回の購入を同一のトランザクションで管理することで、そのトランザクション中の購入物品は同時に購入されたと判断することができる。
【0035】
ステップS103において、スペクトル分解部1043は、既知の固有値問題解法を用いて共起行列Σをスペクトル分解して、複数の固有値とそれに対応する固有ベクトルを算出する。商品カテゴリ数をn個とし、共起行列をn×nの正方行列としたときに、この算
出結果は、
Σ = λ1P1P1
t+ λ2P2P2
t + … + λnPnPn
t 式(1)
として示される。ここでP1~Pnは固有ベクトルを示し、係数であるλ1~λnはそれに対応する固有値を示す。したがって共起行列Σは、n個の固有ベクトルおよびその転置行列の積と、それに対応する固有値に分解することができる。
【0036】
ステップS104において、スペクトル分解部1043は、算出された固有値と固有ベクトルに基づいて併売パターンの特性を取得する。以下、併売パターン特性の取得と意味解釈手法の一例を説明する。
【0037】
スペクトル分解部1043は、n×n行列の共起行列Σから得られた各固有値λ1~λnから、絶対値が最大の固有値λmを抽出し、この最大固有値λmに対応する固有ベクトルPmを選択する。この固有ベクトルPmは、n個の要素を持つ列ベクトルとして示される。すると、
λmPmPm
t 式(2)
は、共起行列Σにおける最大の構成要素となり、併売パターン情報を説明する際の最大の要因となる。
【0038】
続いてスペクトル分解部1043は、固有ベクトルPmが有するn個の要素から、絶対値が最大の要素を抽出する。ここでは、n個の商品カテゴリ中、t番目の要素が最大絶対値であったとする。例えば、t番目の商品カテゴリが「食品」であった場合、固有ベクトルPmと転置ベクトルPm
tの積PmPm
tは、食品を起点とした併売特性を示していると理解される。
【0039】
以下同様に、スペクトル分解部1043は、2番目に絶対値が大きい固有値λpと、それに対応する固有ベクトルPpを抽出する。そして例えば、固有ベクトルPpの要素中u番目の要素が最大絶対値であり、u番目の商品カテゴリが「嗜好品」である場合、ベクトル積PpPp
tは、嗜好品を起点とした併売特性を示していると理解される。
同様の処理を他の固有値に対しても繰り返すことにより、それぞれの固有ベクトルが説明する商品カテゴリの併売特性を取得することができる。なお、演算に利用できるリソースによっては、必ずしも全ての固有値の併売特性を取得せずに、最上位から所定の数の固有値についてのみ算出を行っても良い。
スペクトル分解部1043が取得した、各固有値およびそれに対応する各固有ベクトルは、それらが説明する併売特性に関する情報とともに、固有値・固有ベクトル取得部1061に送信される。
【0040】
ステップS105からの処理は、疑似購買データ生成部1060により行われる。固有値・固有ベクトル取得部1061は、実購買データ処理部1040が算出した情報を取得する。
【0041】
ここで、疑似購買データの生成方法について説明する。上述したように各固有ベクトルP1~Pnは、何れかの商品カテゴリに対応する要素を中心とした併売パターンを表現している。また、ある消費者による一回の買い物における購買データは、各固有ベクトルの線形結合によって近似できると考えられる。したがって、各固有ベクトルの線形結合データを作成することにより、実購買データに類似した疑似購買データを自由に作成できる。
また、各固有値λ1~λnは線形結合の際の係数となる。したがって、これらの係数を人為的に操作することにより、所望の固有ベクトルを強調して、実購買データには無い特徴を持つ疑似購買データを作成できる。
【0042】
ステップS105において、変化情報入力部1062は、疑似購買データの利用目的に
応じた変化情報の入力を受ける。ここで変化情報とは、疑似購買データが示す購買状態の特徴を変化させるための情報を指す。ただし、変化情報を用いずに擬似購買データを生成しても良く、その場合は変化情報がゼロだとみなすことができる。また、乱数発生関数等を用いて各固有値を不規則に変化させるような変化情報を自動的に生成し、適度な揺らぎのある疑似購買データを生成しても良い。
【0043】
変化情報は、具体的には、係数である各固有値を増減させる指示情報である。すなわち調査者は、入力部1004を介した指示等により、強調したい併売パターンに対応する固有ベクトルの固有値を増加させる。また逆に、固有値の絶対値が下位の固有ベクトルについては、固有値を減少させる(またはゼロにする)ことにより、共起行列の特徴を強調しても良い。
変化情報における固有ベクトルの選択方法は任意である。例えば、対応する固有値の絶対値が大きい順に、任意の数の固有ベクトルを選択しても良い。また、所望の商品カテゴリを最も良く説明する固有ベクトルが判明している場合、当該固有ベクトルの係数を増加させることにより、所望の商品カテゴリと関連の深い併売特性を強調することができる。
【0044】
ステップS106において、データ生成部1063は、取得した変化情報に基づいて固有値を決定し、線形結合操作を行って疑似購買データを生成する。本ステップの処理を繰り返すことにより、所望の数の高品質な疑似購買データが生成される。
【0045】
ステップS107からの処理は、データ解析部1080により行われる。データ取得部1081は、データ生成部1063が生成した疑似購買データを取得する。データ取得部1081はまた、疑似購買データと併せて、メモリに保存された実購買データを取得してデータ解析に用いても良い。
【0046】
ステップS108において、情報取得部1082は購買データを解析して調査者が必要とする情報を取得する。データ解析の内容は特に限定されず、購買データを用いて調査者に情報を提供できるのであれば、いかなる方法を採用しても良い。例えば、情報取得部1082は、実購買データおよび疑似購買データを対象として既知のアソシエーション分析手法を適用し、店舗設計等に利用しても良い。また、電子商取引に関する購買データに基づいて、消費者に推奨商品を提示するレコメンド機能を改善しても良い。調査者へのデータの提供は、表示部1005への表示により行っても良いし、その他の方法でも良い。
【0047】
以上のように本実施例では、消費者による実購買データから生成された共起行列をスペクトル分解することにより、購買データには含まれている併売パターンの種類や量を明らかにしている。そして、分解により得られた固有値と固有ベクトルの線形結合により、実購買データと遜色のない疑似購買データを大量に生成可能である。また、必要に応じて固有値を調整することで、実購買データにはあまり含まれていない併売パターンを大量に生成可能である。本実施例で生成された疑似購買データは、実購買データと同程度の信頼性を持つものであるため、併売パターン情報を用いた様々な解析に利用可能である。
【0048】
[実施例2]
続いて、実施例2について、実施例1とは異なる部分を中心に説明する。
上記の処理フローのステップS102では、実購買データの発生頻度に応じて正方行列を作成することにより、共起行列を生成していた。この場合、スペクトル分解により固有値と固有ベクトルを算出したときに、負値を持つ固有値が含まれることがあり、固有ベクトルの意味解釈を困難にする可能性がある。そこで本実施例においては、共起行列の生成方法を変更する。
【0049】
具体的には、共起行列生成部1042は、まず、一つのトランザクションに相当する、
ある消費者による1件の購買データを列ベクトルとする。例えば
図4(a)のように商品カテゴリ数が6個の場合、下式(3)のように6次元の列ベクトルXを作成し、商品カテゴリごとの購入数を各要素の値に置く。
【数1】
そして、この消費者の実購買データが例えばM個ある場合、共起行列Σを下式(4)により作成する。
Σ =X
1X
1
t+X
2X
2
t + … +X
MX
M
t 式(4)
このように作成された共起行列は負の固有値を含まないため、併売パターンの意味解釈時を容易にすることができる。
【0050】
[実施例3]
続いて、実施例3について、実施例1、2とは異なる部分を中心に説明する。
図5は、本実施例の制御部1001における制御ブロックの構成を説明する図である。
図2と比較すると、実購買データ処理部1040に可視化部1044が含まれている。なお、以下の説明の範囲においては、疑似購買データ生成部1060およびデータ解析部1080は必ずしも必要ではない。
【0051】
上記実施例で述べたように、本発明では、実購買データから生成した共起行列をスペクトル分解して、固有値および固有ベクトルを算出する。その結果として得られる固有ベクトル(または固有ベクトルとその転置ベクトルの積)は、該固有ベクトル中で最大値を持つ要素に対応する商品カテゴリを起点とした併売特性を示していると解釈できる。そこで本実施例では、可視化部1044は、かかる固有ベクトルが示す情報をマトリクスとして可視化することにより、調査者が直感的に併売特性を理解できるようにする。
【0052】
図6は、ある実購買データ群から生成された共起行列のスペクトル分解に含まれる併売特性を可視化したものである。ここでは、固有ベクトルが示す併売特性に関する情報をマップ上の位置で、固有値の大きさが示す購買特性への影響度の大きさを色調で、それぞれ示している。
【0053】
図6(a)は、最大の固有値λ
1に対応する固有ベクトルP
1と、その転置ベクトルP
1
tの積を可視化したものである。ここで、本実施例の商品カテゴリ数を250とすると、積P
1P
1
tは250×250の正方行列となる。そこで、該正方行列の各要素の値をカラーマップに対応させてグラフ上にプロットしたものが、
図6(a)である。ここでは、要素の値が小さいほど(負値が大きくなるほど)ほど色が薄くなり、要素の値が大きいほど(負値が小さくなって0に近づくほど)色が濃くなるようにしている。
ここで、固有ベクトルP
1においては、54番目の要素が最大の絶対値を持っていた。そして商品カテゴリ区分において、54番目は「豚肉」に対応しているものとする。したがって、
図6(a)のグラフは、豚肉を起点とした併売特性を可視化したものだと言える。
【0054】
また、
図6(b)は、絶対値の大きさが2番目の固有値λ
2に対応する固有ベクトルP
2とその転置ベクトルP
2
tの積P
2P
2
Tの各要素の値を可視化したものである。固有ベクトルP
2においては、17番目の要素が最大の絶対値を持っていた。そして17番目
の商品カテゴリは「菓子パン」に対応しているものとする。したがって
図6(b)は、菓子パンを起点とした併売特性を示している。
【0055】
同様に、
図6(c)は、絶対値の大きさが3番目の固有値λ
3に対応する固有ベクトルP
3とその転置ベクトルP
3
tの積P
3P
3
tの各要素の値を可視化したものである。固有ベクトルP
3においては、250番目の要素が最大の絶対値を持っていた。そして250番目の商品カテゴリは「その他日用品」に対応しているものとする。したがって
図6(c)は、その他日用品を起点とした併売特性を示している。
ここで、
図6(a)を見ると、
図6(b)や(c)と比べて、様々な商品カテゴリが併売されていることが分かる。また、カラースケールから見て、併売の度合いも大きいことが分かる。このことから調査者は、豚肉が多くの他の商品と併売されていることを理解できる。
【0056】
以上述べたように、本実施例によれば、実購買データをスペクトル分解して得られる情報を可視化することで、調査者による併売パターンの直感的な理解を助けることができる。
なお、マトリクスの表現方法は色の濃度に限らず、色相や彩度など任意の方法を用いて良い。また、本実施例の表示方法は、実施例1および2の疑似購買データ生成と組み合わせて利用可能である。
【符号の説明】
【0057】
10:情報処理装置、20:消費者端末、40;店舗端末
1001:制御部、1040:実購買データ処理部、1060:疑似購買データ生成部、1080:データ解析部