(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
以下に、本願に係る分類装置、分類方法、及び分類プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る分類装置、分類方法、及び分類プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
(実施形態)
〔1.分類処理〕
図1を用いて、実施形態に係る分類処理の一例について説明する。
図1は、実施形態に係る分類処理の一例を示す図である。
図1の例では、分類装置100は、各ユーザの購入に関する情報(以下、「購入情報」ともいう)に基づいて、ユーザをクラスタに分類する場合を示す。なお、以下では、購入の対象となる商品やサービスを「商品等」と記載する場合がある。
【0011】
図1に示すように、分類システム1には、端末装置10(
図2参照)と、商取引装置50と、分類装置100とが含まれる。端末装置10と、分類装置100とは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。また、
図1に示した分類システム1には、複数台の端末装置10や、複数台の商取引装置50と、複数台の分類装置100が含まれてもよい。
【0012】
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。
図1に示す例においては、端末装置10がスマートフォンである場合を示す。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。
【0013】
商取引装置50は、電子商取引サービスを提供するために用いられる情報処理装置である。例えば、商取引装置50は、ユーザからの購入要求に応じて、電子商取引サービスを提供する。また、商取引装置50は、ユーザの購入情報を分類装置100へ提供する。なお、商取引装置50を用いる提供元が提供するサービスは、各ユーザが購入した商品やサービスをユーザに提供可能であれば、電子商取引サービスに限らず、どのような態様のサービスであってもよい。また、商取引装置50は、分類装置100と一体であってもよい。例えば、分類装置100は、電子商取引サービスを提供してもよい。
【0014】
分類装置100は、各ユーザの購入に関する情報の分布に基づいて、ユーザをクラスタに分類する。例えば、分類装置100は、ユーザにより購入された商品等の数の分布に基づいて、ユーザをクラスタに分類する。なお、分類装置100は、ユーザの購入に関する情報であれば、購入履歴に限らず、種々の情報を用いてもよい。例えば、分類装置100は、ユーザの購入に関する閲覧履歴や検索履歴等を用いてもよい。例えば、分類装置100は、ユーザの購入に関するインターネット上におけるコンテンツの閲覧履歴やインターネット上におけるコンテンツの検索履歴等を用いて、ユーザをクラスタに分類してもよい。
【0015】
まず、
図1の例では、分類装置100は、商取引装置50から各ユーザの購入情報の履歴(以下、「購入履歴」ともいう)の提供を受ける(ステップS11)。例えば、分類装置100は、ユーザU1〜Un(nは任意の数値)の購入履歴の提供を受ける。例えば、「n」は100万等であってもよい。なお、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により識別されるユーザであることを示す。例えば、「ユーザU1」と記載した場合、そのユーザはユーザID「U1」により識別されるユーザである。
【0016】
図1の例では、分類装置100は、ユーザ情報記憶部121に示すような各ユーザの購入履歴を商取引装置50から取得する(ステップS11)。なお、分類装置100は、所定の期間における各ユーザの購入履歴を商取引装置50から取得する。
図1の例では、分類装置100は、購入履歴を取得する以前の1ヶ月間における各ユーザの購入履歴を商取引装置50から取得するものとする。
【0017】
例えば、
図1のユーザ情報記憶部121に示すように、分類装置100は、ユーザU1が1ヶ月間において、水Aを6つ購入し、ワインAを3つ購入し、洗濯機Aを購入していないことを示す購入履歴を取得する。また、例えば、
図1に示す例において、ユーザU2は、1ヶ月間において、水AやワインAを購入しておらず、洗濯機Aを1つ購入していることを示す。また、例えば、
図1に示す例において、ユーザU3は、1ヶ月間において、水Aを5つ購入し、ワインAを4つ購入し、洗濯機Aを購入していないことを示す。また、例えば、
図1に示す例において、ユーザU4は、1ヶ月間において、水AやワインAを購入しておらず、洗濯機Aを100個購入していることを示す。
【0018】
また、
図1中のグラフD1は、ユーザU1が1ヶ月間に購入した商品等の数の分布を示す。また、
図1中のグラフD2は、ユーザU2が1ヶ月間に購入した商品等の数の分布を示す。また、
図1中のグラフD3は、ユーザU3が1ヶ月間に購入した商品等の数の分布を示す。また、
図1中のグラフD4は、ユーザU4が1ヶ月間に購入した商品等の数の分布を示す。
【0019】
商取引装置50から購入履歴を取得した分類装置100は、取得した購入履歴に基づいて各ユーザを分類する(ステップS12)。例えば、分類装置100は、ユーザにより購入された商品またはサービスの数の分布に基づいて、ユーザをクラスタに分類する。
図1の例では、分類装置100は、ユーザ情報記憶部121に示す各ユーザの購入履歴に基づいて、クラスタ情報記憶部122に示すように、各ユーザを分類する。
【0020】
例えば、分類装置100は、各ユーザの購入履歴を用いて、K−means等の種々の従来技術を適宜用いて、各ユーザが購入した商品等の個数の分布の類似性に応じて各ユーザをクラスタに分類する。例えば、分類装置100は、クラスタ数が所定数(例えば1000個)になるように、ユーザをクラスタに分類する。なお、分類装置100は、各ユーザが購入した商品等の個数の分布の類似性に基づいて、ユーザを複数のクラスタに分類可能であれば、どのようなクラスタリング技術を用いてもよい。例えば、分類装置100は、各ユーザが購入した商品等の数の分布をベクトルとして、各ユーザのベクトル間の類似度に基づいて、ユーザをクラスタに分類してもよい。
【0021】
図1の例では、クラスタID「C11」により識別されるクラスタ(クラスタC11)には、「ユーザU1」や「ユーザU3」や「ユーザU15」や「ユーザU40」といったユーザが含まれることを示す。なお、「クラスタC*(*は任意の数値)」と記載した場合、そのクラスタはクラスタID「C*」により識別されるユーザであることを示す。例えば、「クラスタC11」と記載した場合、そのクラスタはクラスタID「C11」により識別されるクラスタである。また、
図1の例では、クラスタC12には、「ユーザU2」や「ユーザU500」といったユーザが含まれることを示す。また、
図1の例では、クラスタC13には、「ユーザU4」や「ユーザU302」といったユーザが含まれることを示す。
図1の例では、例えば、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、各商品等について購入した個数が類似しているユーザU1とユーザU3とを同じクラスタC11に分類する。
【0022】
上述したように、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、ユーザを適切に分類することができる。具体的には、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、各ユーザの購入量に関する情報を加味したクラスタに分類する。例えば、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、各ユーザが購入した商品等の類似性と各ユーザが購入する商品等の量の類似性との2つの類似性を加味したクラスタに分類する。これにより、分類装置100は、ユーザを適切に分類することができる。
【0023】
なお、上述した例では、分類装置100が商品等ごとに各ユーザが購入した個数を集計し、その情報に基づいてユーザを分類する場合を示したが、分類装置100は、各ユーザが購入した商品等の個数に基づく情報であれば、どのような情報を用いて、ユーザを分類してもよい。例えば、分類装置100は、商品等のカテゴリごとに各ユーザが購入した商品等の個数を集計し、各ユーザが購入した商品等の個数のカテゴリごとの分布に基づいて、ユーザを分類してもよい。例えば、分類装置100は、水やお茶を飲料のカテゴリに属する商品等とし、ワインやビールや日本酒等をアルコールのカテゴリに属する商品等とし、冷蔵庫や洗濯機を家電のカテゴリに属する商品等として、ユーザを分類してもよい。例えば、分類装置100は、カテゴリ「飲料」の個数を水やお茶等が購入された個数の合計値とし、カテゴリ「アルコール」の個数をワインやビールや日本酒等が購入された個数の合計値とし、カテゴリ「家電」の個数を冷蔵庫や洗濯機を家電が購入された個数の合計値として、ユーザを分類してもよい。
【0024】
また、分類装置100は、上述した分類処理により生成されたクラスタのうち、購入に関する量が所定の閾値を超える特殊ユーザが属する特殊クラスタを抽出してもよい。例えば、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、クラスタのうち、購入に関する量が所定の閾値を超える特殊ユーザが属する特殊クラスタを抽出する。例えば1年以内の所定の期間(例えば1ヶ月等)に同一の商品等(例えば冷蔵庫A)を複数個購入するユーザはほとんどいないと考えられる。
【0025】
そのため、
図1の例では、分類装置100は、所定の期間に冷蔵庫Aを2個以上購入しているユーザを特殊ユーザとし、そのユーザが含まれるクラスタを特殊クラスタとして抽出する。この場合、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、クラスタC11〜C14等のうち、購入に関する量が所定の閾値を超える特殊ユーザであるユーザU4が属するクラスタC13を特殊クラスタとして抽出する。例えば、分類装置100は、クラスタC11〜C14等のうち、冷蔵庫Aを所定の期間に2個以上購入しているユーザU4が属するクラスタC13を特殊クラスタとして抽出する。
【0026】
例えば、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、冷蔵庫のみを購入しているユーザであるユーザU2とユーザU4とを別のクラスタに分類することができるため、ユーザを通常ユーザと業者ユーザとを分類するクラスタを生成することができる。なお、ここでいう通常ユーザとは、例えば、個人的な消費等のために商品等を購入する一般的なユーザを意味する。また、ここでいう業者ユーザとは、例えば、自身の消費のために商品を購入するユーザではなく、転売等の商取引のために商品等を購入するユーザを意味する。
【0027】
上述したように、分類装置100は、通常ユーザと業者ユーザとを適切に分類したクラスタを生成することにより、各クラスタに対して適切なサービスを提供することができる。例えば、分類装置100は、通常ユーザが属するクラスタを対象として所定のキャンペーンやクーポンの配布等の購入を促進する情報を提供してもよい。また、例えば、分類装置100は、大量に同一商品を購入する等の行為により、通常ユーザの利用を阻害する業者ユーザに対しては、購入の数を制限したりしてもよい。なお、分類装置100は、上述した通常ユーザや業者ユーザを特定した情報を他の情報処理装置へ提供してもよい。
【0028】
〔1−2.サービスの提供〕
次に、
図2を用いて、クラスタ情報を用いたサービスの提供の一例を説明する。
図2は、実施形態に係るクラスタ情報を用いたサービスの提供の一例を示す図である。
【0029】
まず、
図2の例では、ユーザU15が利用する端末装置10は、ユーザU15による操作に応じて、分類装置100に広告を要求する(ステップS21)。
【0030】
端末装置10から広告の要求を取得した分類装置100は、ユーザU15が属するクラスタを抽出する(ステップS22)。例えば、分類装置100は、クラスタ情報記憶部122に記憶されたクラスタのうち、ユーザU15が属するクラスタC11を抽出する。
【0031】
その後、分類装置100は、ユーザU15が購入していない商品等であって、同じクラスタに属する他のユーザが購入した商品等を、ユーザ情報記憶部121から抽出する(ステップS23)。
図2の例では、分類装置100は、ユーザU15が購入していない商品であって、同じクラスタに属する他のユーザU1やユーザU3が購入した商品であるワインAを抽出する。
【0032】
その後、分類装置100は、抽出した商品等に関する広告を抽出する(ステップS24)。
図2の例では、分類装置100は、ワインAに関する広告Aを、広告情報記憶部123から抽出する。なお、分類装置100は、ワインAとともに消費される商品に関する広告Aを、広告情報記憶部123から抽出してもよい。例えば、分類装置100は、ワインAとともに消費される商品の広告としてチーズに関する広告を抽出してもよい。
【0033】
そして、分類装置100は、抽出した広告を端末装置10へ提供する(ステップS25)。
図2の例では、分類装置100は、ワインAに関する広告AをユーザU15が利用する端末装置10へ提供する。なお、分類装置100は、ワインAに関する広告Aとともにチーズに関する広告をユーザU15が利用する端末装置10へ提供してもよい。
【0034】
上述したように、分類装置100は、一のクラスタに属する一のユーザに、一のユーザが購入していない商品またはサービスであって、一のクラスタに属する他のユーザが購入した商品またはサービスに関する情報を提供することにより、一のユーザに対して広告配信等の種々のサービスを適切に提供することができる。なお、分類装置100は、ユーザU15のように、同じクラスタに属する他のユーザの多くが購入した商品を購入していないユーザを対象ユーザとして抽出してもよい。そして、分類装置100は、対象ユーザに対して、対象ユーザが購入していない商品であって、同じクラスタに属する他のユーザの多くが購入した商品に関する広告を提供してもよい。なお、上述した例では、分類装置100がユーザからの要求に応じて広告を配信する例を示したが、分類装置100は、ユーザのクラスタ情報を用いたサービスの提供であれば、どのようなサービスを提供してもよい。例えば、分類装置100は、ユーザのクラスタ情報に基づいて、ユーザへのレコメンドサービスを提供してもてもよい。例えば、分類装置100は、レコメンドの対象ユーザが属するクラスタの他のユーザの購入履歴に基づいて、所定のタイミングで対象ユーザへ商品の購入を促す情報を提供してもてもよい。例えば、分類装置100は、レコメンドの対象ユーザが属するクラスタの他のユーザの購入した商品に関するコンテンツを閲覧した場合、所定のタイミングで対象ユーザへ他のユーザの購入した商品に関する情報を提供してもてもよい。
【0035】
〔2.分類装置の構成〕
次に、
図3を用いて、実施形態に係る分類装置100の構成について説明する。
図3は、実施形態に係る分類装置100の構成例を示す図である。
図3に示すように、分類装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、分類装置100は、分類装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0036】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば分類システム1に含まれる端末装置10との間で情報の送受信を行う。
【0037】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、
図3に示すように、ユーザ情報記憶部121と、クラスタ情報記憶部122と、広告情報記憶部123とを有する。
【0038】
(ユーザ情報記憶部121)
実施形態に係るユーザ情報記憶部121は、ユーザに関する各種情報を記憶する。例えば、ユーザ情報記憶部121は、ユーザに関する情報として、各ユーザが購入した商品等に関する購入情報を含む各種情報を記憶する。
図4は、実施形態に係るユーザ情報記憶部の一例を示す図である。
図4に示すユーザ情報記憶部121は、「ユーザID」、「購入一覧」といった項目が含まれる。
【0039】
「ユーザID」は、ユーザを識別するための識別情報を示す。「購入一覧(個数)」は、対応するユーザIDにより識別されるユーザが購入した商品等の個数を示す。「購入一覧(個数)」には、「水A」、「ワインA」、「洗濯機A」といった項目が含まれる。
【0040】
例えば、
図4に示す例において、ユーザID「U1」により識別されるユーザは、水Aを6つ購入し、ワインAを3つ購入し、洗濯機Aを購入していないことを示す。また、例えば、
図4に示す例において、ユーザID「U2」により識別されるユーザは、水AやワインAを購入しておらず、洗濯機Aを1つ購入していることを示す。なお、所定の期間(例えば1ヶ月間)において各ユーザが購入した商品等の個数であってもよい。
【0041】
なお、ユーザ情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部121は、氏名、性別、年齢、居住地、興味、家族構成、収入、ライフスタイル等の情報を記憶してもよい。例えば、ユーザ情報記憶部121は、各ユーザが利用する端末装置10を識別する情報を記憶してもよい。例えば、ユーザ情報記憶部121は、各ユーザが購入した各商品等に関する金額に関する情報を記憶してもよい。例えば、ユーザ情報記憶部121は、商品等ごとに各ユーザが使った総額に関する情報を記憶してもよいし、各商品の単価(1つ当たりの金額)を記憶してもよい。例えば、ユーザ情報記憶部121に各商品の単価が記憶される場合、分類装置100は、各ユーザが購入した各商品の個数とその単価とに基づいて、各ユーザが購入した各商品に使った総額を算出してもよい。
【0042】
(クラスタ情報記憶部122)
実施形態に係るクラスタ情報記憶部122は、クラスタに関する情報を記憶する。
図5には、クラスタ情報記憶部122に記憶されるユーザに関する情報の一例を示す。
図5に示すように、クラスタ情報記憶部122は、「クラスタID」、「ユーザ一覧」といった項目を有する。ユーザ一覧には、「ユーザ1」〜「ユーザ4」等の項目が含まれる。
【0043】
「クラスタID」は、クラスタを識別するための識別情報を示す。「ユーザ一覧」のユーザ1」〜「ユーザ4」等は、対応するクラスタに属するユーザを示す。
【0044】
図5の例では、クラスタID「C11」により識別されるクラスタ(クラスタC11)には、「ユーザU1」や「ユーザU3」や「ユーザU15」や「ユーザU40」といったユーザが含まれることを示す。
【0045】
なお、クラスタ情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、クラスタ情報記憶部122は、ユーザを分類しクラスタを生成した日時に関する情報を記憶してもよい。また、クラスタ情報記憶部122は、特徴クラスタであることを示すフラグを記憶してもよい。例えば、クラスタ情報記憶部122は、クラスタC13には特殊ユーザであるユーザU4が含まれる特殊クラスタであるため、項目「特殊クラスタ」に特徴クラスタであることを示すフラグ(例えば、1)が記憶される。
【0046】
(広告情報記憶部123)
実施形態に係る広告情報記憶部123は、広告に関する各種情報を記憶する。
図6に、実施形態に係る広告情報記憶部123の一例を示す。
図6に示す広告情報記憶部123は、「広告ID」、「広告コンテンツ」、「対象」、「入札価格」といった項目を有する。
【0047】
「広告ID」は、広告を識別するための識別情報を示す。「広告コンテンツ」は、広告主や代理店等から入稿された広告を示す。
図6では「広告コンテンツ」に「広告A」といった概念的な情報が格納される例を示したが、実際には、静止画像や動画像やテキストデータやURL、または、これらの格納場所を示すファイルパス名などが格納される。以下では、「広告主」といった表記は、広告主だけでなく代理店を含む概念であるものとする。「入札価格」は、広告主が広告コンテンツを入稿する際に指定する広告料金を示す。例えば、「入札価格」は、広告コンテンツがユーザに1回クリックされた際に広告主から広告配信者(例えば、分類装置100の管理者)に支払われる単価に該当する。なお、「入札価格」の単位は、「円」や「ドル」など種々の通貨単位であってもよい。「対象」は、例えば、広告の対象となる商品やサービス、すなわち商品等を示す。なお、商品やサービスを識別する情報としては「対象」に限らず、商品やサービスを識別するための「商品ID」等の情報を記憶してもよい。
【0048】
例えば、
図6に示す例において、広告ID「AC1」により識別される広告Aは、商品「ワインA」を対象とする広告であり、入札価格が「80」であることを示す。また、例えば、
図6に示す例において、広告ID「AC2」により識別される広告Bは、商品「ビールA」を対象とする広告であり、入札価格が「80」であることを示す。また、例えば、
図6に示す例において、広告ID「AC3」により識別される広告Cは、商品「日本酒A」を対象とする広告であり、入札価格が「100」であることを示す。
【0049】
なお、広告情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
【0050】
(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、分類装置100内部の記憶装置に記憶されている各種プログラム(分類プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0051】
図3に示すように、制御部130は、取得部131と、分類部132と、抽出部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0052】
(取得部131)
例えば、取得部131は、各種情報を取得する。例えば、取得部131は、ユーザが行った商品またはサービスの購入に関する情報を取得する。
図1では、取得部131は、商取引装置50から各ユーザの購入情報を取得する。例えば、取得部131は、商取引装置50から取得した各ユーザの購入履歴をユーザ情報記憶部121に格納する。
【0053】
また、取得部131は、広告の要求を取得する。
図2では、取得部131は、ユーザU15が利用する端末装置10から広告の要求を取得する。
【0054】
(分類部132)
分類部132は、種々の情報を分類する。例えば、分類部132は、取得部131により取得された購入に関する情報の分布に基づいて、ユーザをクラスタに分類する。例えば、分類部132は、ユーザにより購入された商品またはサービスの数の分布に基づいて、ユーザをクラスタに分類する。例えば、分類部132は、ユーザにより購入された商品またはサービスの金額の分布に基づいて、ユーザをクラスタに分類する。
【0055】
図1の例では、分類部132は、各ユーザが購入した商品等の個数の分布に基づくことにより、各ユーザの購入量に関する情報を加味したクラスタに分類する。例えば、分類部132は、各ユーザが購入した商品等の個数の分布に基づくことにより、各ユーザが購入した商品等の類似性と各ユーザが購入する商品等の量の類似性との2つの類似性を加味したクラスタに分類する。
【0056】
図1の例では、分類部132は、購入履歴に基づいて各ユーザを分類する。例えば、分類部132は、ユーザ情報記憶部121(
図4参照)に示す各ユーザの購入履歴に基づいて、クラスタ情報記憶部122(
図5参照)に示すように、各ユーザを分類する。例えば、分類部132は、各ユーザが購入した商品等の個数の分布に基づくことにより、各商品等について購入した個数が類似しているユーザU1とユーザU3とを同じクラスタC11に分類する。例えば、分類部132は、各ユーザが購入した商品等の個数の分布に基づくことにより、冷蔵庫のみを購入しているユーザであるユーザU2とユーザU4とを別のクラスタに分類する。また、例えば、分類部132は、ユーザを通常ユーザと業者ユーザとを別のクラスタに分類する。
【0057】
例えば、分類部132は、各ユーザの購入履歴を用いて、K−means等の種々の従来技術を適宜用いて、各ユーザが購入した商品等の個数の分布の類似性に応じて各ユーザをクラスタに分類する。例えば、分類装置100は、クラスタ数が所定数(例えば1000個)になるように、ユーザをクラスタに分類する。なお、分類装置100は、各ユーザが購入した商品等の個数の分布の類似性に基づいて、ユーザを複数のクラスタに分類可能であれば、どのようなクラスタリング技術を用いてもよい。例えば、分類部132は、各ユーザが購入した商品等の数の分布をベクトルとして、各ユーザのベクトル間の類似度に基づいて、ユーザをクラスタに分類してもよい。
【0058】
また、分類部132は、水やお茶を飲料のカテゴリに属する商品等とし、ワインやビールや日本酒等をアルコールのカテゴリに属する商品等とし、冷蔵庫や洗濯機を家電のカテゴリに属する商品等として、ユーザを分類してもよい。例えば、分類部132は、カテゴリ「飲料」の個数を水やお茶等が購入された個数の合計値とし、カテゴリ「アルコール」の個数をワインやビールや日本酒等が購入された個数の合計値とし、カテゴリ「家電」の個数を冷蔵庫や洗濯機を家電が購入された個数の合計値として、ユーザを分類してもよい。
【0059】
(抽出部133)
抽出部133は、種々の情報を推定する。例えば、抽出部133は、分類部132によるユーザの分類に基づくクラスタのうち、購入に関する量が所定の閾値を超える特殊ユーザが属する特殊クラスタを抽出する。
【0060】
図1の例では、抽出部133は、所定の期間に冷蔵庫Aを2個以上購入しているユーザを特殊ユーザとし、そのユーザが含まれるクラスタを特殊クラスタとして抽出する。例えば、抽出部133は、クラスタC11〜C14等のうち、購入に関する量が所定の閾値を超える特殊ユーザであるユーザU4が属するクラスタC13を特殊クラスタとして抽出する。例えば、抽出部133は、クラスタC11〜C14等のうち、冷蔵庫Aを所定の期間に2個以上購入しているユーザU4が属するクラスタC13を特殊クラスタとして抽出する。
【0061】
例えば、抽出部133は、端末装置10を利用するユーザが購入していない商品等であって、同じクラスタに属する他のユーザが購入した商品等を抽出する。
図2では、抽出部133は、ユーザU15が購入していない商品であって、同じクラスタに属する他のユーザU1やユーザU3が購入した商品であるワインAを抽出する。
【0062】
(提供部134)
提供部134は、外部の情報処理装置へ各種情報を提供する。例えば、提供部134は、分類部132によるユーザの分類に基づくクラスタに応じて、ユーザにサービスを提供する。例えば、提供部134は、一のクラスタに属する一のユーザに、一のユーザが購入していない商品またはサービスであって、一のクラスタに属する他のユーザが購入した商品またはサービスに関する情報を提供する。
図2では、提供部134は、ワインAに関する広告AをユーザU15が利用する端末装置10へ提供する。
【0063】
〔3.分類処理のフロー〕
ここで、
図7を用いて、実施形態に係る分類装置100による分類処理の手順について説明する。
図7は、実施形態に係る分類処理の一例を示すフローチャートである。
【0064】
図7に示すように、分類装置100は、各ユーザの購入情報を取得する(ステップS101)。
図1では、分類装置100は、商取引装置50から各ユーザの購入情報を取得する。
【0065】
その後、分類装置100は、各ユーザの購入に関する情報の分布に基づいてユーザを分類する(ステップS102)。
図1では、分類装置100は、各ユーザの購入に関する情報の分布に基づいてユーザをクラスタに分類する。
【0066】
〔4.サービス提供のフロー〕
次に、
図8を用いて、実施形態に係る分類装置100によるサービスの提供の手順について説明する。
図8は、実施形態に係るクラスタ情報を用いたサービスの提供の一例を示すフローチャートである。
【0067】
図8に示すように、分類装置100は、端末装置10から広告要求を取得する(ステップS201)。
図2では、分類装置100は、ユーザU15が利用する端末装置10から広告要求を取得する。
【0068】
その後、分類装置100は、端末装置10を利用するユーザが属するクラスタを抽出する(ステップS202)。
図2では、分類装置100は、端末装置10を利用するユーザU15が属するクラスタC11を抽出する。
【0069】
その後、分類装置100は、端末装置10を利用するユーザが購入していない商品等であって、同じクラスタに属する他のユーザが購入した商品等を抽出する(ステップS203)。
図2では、分類装置100は、ユーザU15が購入していない商品であって、同じクラスタに属する他のユーザU1やユーザU3が購入した商品であるワインAを抽出する。
【0070】
その後、分類装置100は、抽出した商品等に関する広告を端末装置10へ提供する(ステップS204)。
図2では、分類装置100は、ワインAに関する広告AをユーザU15が利用する端末装置10へ提供する。
【0071】
〔5.分類処理(金額)〕
上述した例では、分類装置100が各商品の個数の分布に基づいて、ユーザを分類する場合を示したが、分類装置100は、他の情報に基づいてユーザを分類してもよい。例えば、分類装置100は、ユーザにより購入された商品等の金額の分布に基づいて、ユーザをクラスタに分類してもよい。この点について、
図9を用いて説明する。
図9は、実施形態に係る分類処理の一例を示す図である。
【0072】
図9の例では、分類装置100は、ユーザ情報記憶部121Aに示すような各ユーザの購入履歴を商取引装置50から取得する(ステップS31)。なお、
図9の例では、分類装置100は、ユーザ情報記憶部121Aに示すように、購入履歴として、各ユーザが各商品等に使用した金額を取得する点において、
図1における処理と相違する。また、
図9の例では、分類装置100は、購入履歴を取得する以前の2ヶ月間における各ユーザの購入履歴を商取引装置50から取得するものとする。例えば、分類装置100は、所定の期間(例えば2ヶ月間)において各ユーザが各商品等に使用した金額を購入履歴として取得する。
【0073】
例えば、
図9のユーザ情報記憶部121Aに示すように、分類装置100は、ユーザU1が2ヶ月間において、水Aに使用した金額が6000(円)であり、ワインAに使用した金額が3000(円)であり、洗濯機Aに使用した金額が0(円)であることを示す購入履歴を取得する。また、例えば、
図9に示す例において、ユーザU2は、2ヶ月間において、水AやワインAに使用した金額が0(円)であり、洗濯機Aに使用した金額が50000(円)であることを示す。また、例えば、
図9に示す例において、ユーザU3は、2ヶ月間において、水Aに使用した金額が5000(円)であり、ワインAに使用した金額が4000(円)であり、洗濯機Aに使用した金額が0(円)であることを示す。また、例えば、
図9に示す例において、ユーザU4は、2ヶ月間において、水AやワインAに使用した金額が0(円)であり、洗濯機Aに使用した金額が5000000(円)であることを示す。
【0074】
また、
図9中のグラフD1は、ユーザU1が2ヶ月間に各商品等の購入に使用した金額の分布を示す。また、
図9中のグラフD2は、ユーザU2が2ヶ月間に各商品等の購入に使用した金額の分布を示す。また、
図9中のグラフD3は、ユーザU3が2ヶ月間に各商品等の購入に使用した金額の分布を示す。また、
図9中のグラフD4は、ユーザU4が2ヶ月間に各商品等の購入に使用した金額の分布を示す。
【0075】
商取引装置50から購入履歴を取得した分類装置100は、取得した購入履歴に基づいて各ユーザを分類する(ステップS32)。例えば、分類装置100は、ユーザにより購入された商品またはサービスの金額の分布に基づいて、ユーザをクラスタに分類する。
図9の例では、分類装置100は、ユーザ情報記憶部121Aに示す各ユーザの購入履歴に基づいて、クラスタ情報記憶部122Aに示すように、各ユーザを分類する。なお、
図9に示すクラスタ情報記憶部122Aは、各ユーザの使用金額に基づくクラスタに関する情報である点以外は、クラスタ情報記憶部122と同様である。
【0076】
例えば、分類装置100は、各ユーザの購入履歴を用いて、K−means等の種々の従来技術を適宜用いて、各ユーザが購入した商品等の個数の分布の類似性に応じて各ユーザをクラスタに分類する。例えば、分類装置100は、クラスタ数が所定数(例えば1000個)になるように、ユーザをクラスタに分類する。なお、分類装置100は、各ユーザが購入した商品等の個数の分布の類似性に基づいて、ユーザを複数のクラスタに分類可能であれば、どのようなクラスタリング技術を用いてもよい。例えば、分類装置100は、各ユーザが各商品等の購入に使用した金額の分布をベクトルとして、各ユーザのベクトル間の類似度に基づいて、ユーザをクラスタに分類してもよい。
【0077】
図9の例では、クラスタID「C11」により識別されるクラスタ(クラスタC11)には、「ユーザU1」や「ユーザU3」や「ユーザU15」や「ユーザU40」といったユーザが含まれることを示す。なお、「クラスタC*(*は任意の数値)」と記載した場合、そのクラスタはクラスタID「C*」により識別されるユーザであることを示す。例えば、「クラスタC11」と記載した場合、そのクラスタはクラスタID「C11」により識別されるクラスタである。また、
図9の例では、クラスタC12には、「ユーザU2」や「ユーザU500」といったユーザが含まれることを示す。また、
図9の例では、クラスタC13には、「ユーザU4」や「ユーザU302」といったユーザが含まれることを示す。
図9の例では、例えば、分類装置100は、各ユーザが購入した商品等の金額の分布に基づくことにより、各商品等について購入に使用した金額が類似しているユーザU1とユーザU3とを同じクラスタC11に分類する。
【0078】
上述したように、分類装置100は、各ユーザが購入した商品等の金額の分布に基づくことにより、ユーザを適切に分類することができる。具体的には、分類装置100は、各ユーザが購入した商品等の金額の分布に基づくことにより、各ユーザの購入費用の多寡に関する情報を加味したクラスタに分類する。例えば、分類装置100は、各ユーザが購入した商品等の金額の分布に基づくことにより、各ユーザが購入した商品等の類似性と各ユーザが購入に使用した金額の類似性との2つの類似性を加味したクラスタに分類する。これにより、分類装置100は、ユーザを適切に分類することができる。
【0079】
〔6.効果〕
上述してきたように、実施形態に係る分類装置100は、取得部131と、分類部132とを有する。取得部131は、ユーザが行った商品またはサービスの購入に関する情報を取得する。分類部132は、取得部131により取得された購入に関する情報の分布に基づいて、ユーザをクラスタに分類する。
【0080】
これにより、実施形態に係る分類装置100は、ユーザが行った商品またはサービスの購入に関する情報に基づくことにより、ユーザを適切に分類することができる。
【0081】
また、実施形態に係る分類装置100において、分類部132は、ユーザにより購入された商品またはサービスの数の分布に基づいて、ユーザをクラスタに分類する。
【0082】
これにより、実施形態に係る分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、各ユーザが購入した商品等の類似性と各ユーザが購入する商品等の量の類似性との2つの類似性を加味したクラスタに分類する。これにより、分類装置100は、ユーザを適切に分類することができる。
【0083】
また、実施形態に係る分類装置100において、分類部132は、ユーザにより購入された商品またはサービスの金額の分布に基づいて、ユーザをクラスタに分類する。
【0084】
これにより、実施形態に係る分類装置100は、各ユーザが購入した商品等の金額の分布に基づくことにより、各ユーザが購入した商品等の類似性と各ユーザが購入に使用した金額の類似性との2つの類似性を加味したクラスタに分類する。したがって、分類装置100は、ユーザを適切に分類することができる。
【0085】
また、実施形態に係る分類装置100は、抽出部133を有する。抽出部133は、分類部132によるユーザの分類に基づくクラスタのうち、購入に関する量が所定の閾値を超える特殊ユーザが属する特殊クラスタを抽出する。
【0086】
これにより、実施形態に係る分類装置100は、購入に関する量が所定の閾値を超える特殊ユーザが属する特殊クラスタを抽出することができる。例えば、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、クラスタのうち、購入に関する量が所定の閾値を超える特殊ユーザが属する特殊クラスタを抽出することができる。例えば、分類装置100は、各ユーザが購入した商品等の個数の分布に基づくことにより、冷蔵庫のみを購入しているユーザであるユーザU2とユーザU4とを別のクラスタに分類することができるため、ユーザを通常ユーザと業者ユーザとを分類するクラスタを生成することができる。
【0087】
また、実施形態に係る分類装置100において、分類部132は、ユーザにより購入された商品またはサービスのカテゴリごとの分布に基づいて、ユーザをクラスタに分類する。
【0088】
これにより、実施形態に係る分類装置100は、ユーザにより購入された商品またはサービスのカテゴリごとの分布に基づくことにより、ユーザを適切に分類することができる。
【0089】
また、実施形態に係る分類装置100は、提供部134を有する。提供部134は、分類部132によるユーザの分類に基づくクラスタに応じて、ユーザにサービスを提供する。
【0090】
これにより、実施形態に係る分類装置100は、ユーザの分類に基づくクラスタに基づくことにより、レビューに関するサービスを適切に提供することができる。
【0091】
また、実施形態に係る分類装置100において、提供部134は、一のクラスタに属する一のユーザに、一のユーザが購入していない商品またはサービスであって、一のクラスタに属する他のユーザが購入した商品またはサービスに関する情報を提供する。
【0092】
これにより、実施形態に係る分類装置100は、一のクラスタに属する一のユーザに、一のユーザが購入していない商品またはサービスであって、一のクラスタに属する他のユーザが購入した商品またはサービスに関する情報を提供することにより、レビューに関するサービスを適切に提供することができる。
【0093】
〔7.ハードウェア構成〕
上述してきた実施形態に係る分類装置100は、例えば
図10に示すような構成のコンピュータ1000によって実現される。
図10は、分類装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0094】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0095】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ提供する。
【0096】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0097】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0098】
例えば、コンピュータ1000が実施形態に係る分類装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0099】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0100】
〔8.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0101】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0102】
また、上述してきた実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0103】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。