特許第6231204号(P6231204)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オラクル・インターナショナル・コーポレイションの特許一覧

<>
  • 特許6231204-アイテム間類似度の生成 図000018
  • 特許6231204-アイテム間類似度の生成 図000019
  • 特許6231204-アイテム間類似度の生成 図000020
  • 特許6231204-アイテム間類似度の生成 図000021
  • 特許6231204-アイテム間類似度の生成 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6231204
(24)【登録日】2017年10月27日
(45)【発行日】2017年11月15日
(54)【発明の名称】アイテム間類似度の生成
(51)【国際特許分類】
   G06F 17/30 20060101AFI20171106BHJP
【FI】
   G06F17/30 350C
   G06F17/30 210D
【請求項の数】11
【全頁数】17
(21)【出願番号】特願2016-527299(P2016-527299)
(86)(22)【出願日】2014年9月5日
(65)【公表番号】特表2017-501477(P2017-501477A)
(43)【公表日】2017年1月12日
(86)【国際出願番号】US2014054259
(87)【国際公開番号】WO2015065590
(87)【国際公開日】20150507
【審査請求日】2016年5月18日
(31)【優先権主張番号】14/070,871
(32)【優先日】2013年11月4日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】特許業務法人深見特許事務所
(72)【発明者】
【氏名】ティワリ,サンディープ
(72)【発明者】
【氏名】ウー,ス−ミン
【審査官】 石田 信行
(56)【参考文献】
【文献】 特開2012−027757(JP,A)
【文献】 特開平10−240815(JP,A)
【文献】 特開平08−180071(JP,A)
【文献】 国際公開第2007/088576(WO,A1)
【文献】 石野 正彦 M.Ishino,商品属性を用いたリコメンデーションシステムの提案 The proposal of the Recommendation System using the goods attribute,情報処理学会研究報告 Vol.2004 No.116 IPSJ SIG Technical Reports,日本,社団法人情報処理学会 Information Processing Society of Japan,2004年11月17日,41−46頁
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06Q 30/02
G06Q 30/06
(57)【特許請求の範囲】
【請求項1】
命令が格納されたコンピュータ読取可能プログラムであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、複数の製品を含むカテゴリについてのアイテム間類似度を生成させ、当該生成することは、
前記カテゴリにおける各々の製品についての属性値と、前記カテゴリにおける各々の製品についての各々の店舗ごとの週の売上げ単位とを受取ることと、
属性重みを推定することと、
重み付けされた属性マッチスコアとして前記アイテム間類似度を決定することとを備え、
前記属性重みを推定することは、
各々の店舗ごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差(MAD)を決定することと、
前記MADの店舗にわたる加重平均を決定することとを含み、各々の店舗ごとの重みは、前記カテゴリにおける総履歴売上げ単位であり、さらに、
前記MADの店舗にわたる前記加重平均を正規化することを含む、コンピュータ読取可能プログラム。
【請求項2】
包括的な有効範囲を有するアイテムのサブセットについての取引ベースのアイテム間類似度を生成することと、
対応する属性類似度に製品類似度を関連付ける関数を生成することとを備える、請求項に記載のコンピュータ読取可能プログラム。
【請求項3】
前記関数は、製品類似度の予測モデルを含み、当該予測モデルは、アイテムの前記サブセットについての取引ベースの類似度に当該予測モデルを適合させることによって生成される対応する属性類似度の関数としてのものである、請求項に記載のコンピュータ読取可能プログラム。
【請求項4】
前記取引ベースのアイテム間類似度を生成することは、製品Aおよび製品Bについて、
製品Aおよび製品Bの取引履歴を分析し、製品Aを含む少なくとも1回の取引および製品Bを含む少なくとも1回の取引で、顧客を識別することと、
各々の識別された顧客ごとに、量f(k)を計算することとを含み、ここで、
【数1】
である、請求項またはに記載のコンピュータ読取可能プログラム。
【請求項5】
前記属性重みを推定することは、
【数2】
ここで、jは期間であり、kは店舗であり、Dj,kは、店舗kおよび期間jについての陳列在庫占有率ベクトルと売上げ占有率ベクトルとの間の偏差であり、Sは前記店舗の正味売上高であり、Jは所与の店舗における期間の数であり、q番目の属性の重みは、
【数3】
であり、ここで、Dはq番目の属性の偏差である、請求項1〜のいずれか1項に記載のコンピュータ読取可能プログラム。
【請求項6】
前記重み付けされた属性マッチスコアとして前記アイテム間類似度を決定することは、
製品Aと製品Bとの間の類似度に関して、
【数4】
を含み、ここで、A=Bであればδ(A=B)=1であり、その他の場合には0であり、w=q番目の属性の重みである、請求項1〜のいずれか1項に記載のコンピュータ読取可能プログラム。
【請求項7】
前記アイテム間類似度を用いて、消費者デシジョンツリー、需要移転効果または売上げ予測のうち少なくとも1つを生成することを備える、請求項1〜のいずれか1項に記載のコンピュータ読取可能プログラム。
【請求項8】
複数の製品を含むカテゴリについてのアイテム間類似度を生成する方法であって、
前記カテゴリにおける各々の製品についての属性値と、前記カテゴリにおける各々の製品についての各々の店舗ごとの週の売上げ単位とを受取るステップと、
属性重みを推定するステップと、
重み付けされた属性マッチスコアとして前記アイテム間類似度を決定するステップとを備え、
前記属性重みを推定するステップは、
各々の店舗ごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差(MAD)を決定するステップと、
前記MADの店舗にわたる加重平均を決定するステップとを含み、各々の店舗ごとの重みは、前記カテゴリにおける総履歴売上げ単位であり、さらに、
前記MADの店舗にわたる前記加重平均を正規化するステップを含む、方法。
【請求項9】
アイテム間生成システムであって、
メモリデバイスに結合されたプロセッサを含み、前記メモリデバイスは、前記プロセッサによって実行されると推定モジュールおよび決定モジュールを生成する命令を格納し、
前記推定モジュールは、製品のカテゴリにおける各々の製品についての属性値と、前記カテゴリにおける各々の製品についての各々の店舗ごとの週の売上げ単位とを受取り、属性重みを推定し、
前記決定モジュールは、重み付けされた属性マッチスコアとしてアイテム間類似度を決定し、
前記属性重みを推定することは、
各々の店舗ごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差(MAD)を決定することと、
前記MADの店舗にわたる加重平均を決定することとを含み、各々の店舗ごとの重みは前記カテゴリにおける総履歴売上げ単位であり、さらに、
前記MADの店舗にわたる前記加重平均を正規化することを含む、アイテム間生成システム。
【請求項10】
前記決定モジュールはさらに、
包括的な有効範囲を有するアイテムのサブセットについての取引ベースのアイテム間類似度を生成し、
対応する属性類似度に製品類似度を関連付ける関数を生成する、請求項に記載のアイテム間生成システム。
【請求項11】
前記関数は、製品類似度の予測モデルを含み、当該予測モデルは、アイテムの前記サブセットについての取引ベースの類似度に当該予測モデルを適合させることによって生成される対応する属性類似度の関数としてのものである、請求項10に記載のアイテム間生成システム。
【発明の詳細な説明】
【技術分野】
【0001】
分野
一実施形態は、概して、コンピュータシステムに向けられ、特に、アイテム間類似度(item-to-item similarities)を生成するコンピュータシステムに向けられる。
【背景技術】
【0002】
背景情報
「カテゴリマネジメント」は小売業の概念であって、小売り業者によって販売される製品の範囲を類似製品または関連製品からなる別々のグループに分類している。これらのグループは「製品カテゴリ」と称される。食料雑貨店についての製品カテゴリの例として、ヨーグルト、コーヒー、練り歯磨き、ペーパータオルなどが含まれる。
【0003】
各々の製品カテゴリ内では、アイテム間の類似度または代替可能性を定量化する必要がある。アイテム間類似度は、グループのアイテム同士がどれくらい類似しているかまたは代替可能であるかについての顧客の認識を表わしている。類似度は、同じカテゴリ内の1対のアイテムについて規定されており、このため、顧客は類似のアイテム同士を取替える傾向があると考えられている。
【0004】
類似度は基本的に顧客に関連付けられているが、顧客レベルでのモデリングは多くの実用例に対して有用ではない可能性がある。これは、個々の顧客の取引(transaction)率が低すぎて、挙動を正確にモデリングするのに十分なデータを生成することができない可能性があるからである。したがって、類似度を少なくとも総「顧客セグメント」レベルでモデリングする必要がある。結果として、同じ顧客セグメントに属する顧客は製品対同士の間の類似度について共通の認識を有する傾向があると想定される。
【発明の概要】
【課題を解決するための手段】
【0005】
概要
一実施形態は、複数の製品を含むカテゴリについてのアイテム間類似度を生成するシステムである。当該システムは、カテゴリにおける各々の製品についての属性値と、カテゴリにおける各々の製品についての製品/店舗/週の売上げ単位(product-store-week sales unit)とを受取る。システムは属性重みを推定する。システムは次いで、重み付けされた属性マッチスコアとしてアイテム間類似度を決定する。
【図面の簡単な説明】
【0006】
図1】本発明の実施形態に従ったコンピュータサーバ/システムを示すブロック図である。
図2】一実施形態に従って2つの製品Aと製品Bとの間の取引ベースの類似度を生成する場合における、図1のアイテム間類似度モジュールの機能を示すフロー図である。
図3】一実施形態に従ってカテゴリCについての属性ベースの類似度を生成する場合における、図1のアイテム間類似度モジュールの機能を示すフロー図である。
図4】一実施形態に従って属性Qについての属性重みの推定値(estimation)を生成する場合における、図1のアイテム間類似度モジュールの機能を示すフロー図である。
図5】一実施形態に従って複合型アプローチを用いて類似度を生成する場合における、図1のアイテム間類似度モジュールの機能を示すフロー図である。
【発明を実施するための形態】
【0007】
詳細な説明
一実施形態は、特に顧客にリンクされた取引履歴が利用不可能であるかまたは不適切である場合にアイテム間類似度を決定するシステムである。製品同士が、属性/内容物に基づいて比較され、属性の重みが決定される。さらに、重み付けされた属性の決定は、別の「複合型(hybrid)」実施形態における利用可能な如何なる取引履歴とも組合わせることができる。
【0008】
アイテム間類似度の決定は多くのビジネスプロセスにとって重要である。たとえば、あるカテゴリ内にあるさまざまな種類のアイテムに遭遇したときに製品を選択するために顧客がとるべき選択肢は、最も有意な属性(たとえばブランド、風味およびサイズ)が降順に並んだトップダウンツリーとして視覚的に表わすことができる。アイテム間類似度のマトリクスは、「消費者デシジョンツリー(Consumer Decision Tree)」(「CDT」)と称されるこのツリーを生成するために、キー入力として提供される。
【0009】
さらに、店舗の陳列在庫(assortment)に対して在庫管理単位(stock keeping unit)(「SKU」)を追加するかまたは取除くことによってもたらされるであろう「需要移転(demand transference)」効果を決定するための入力として、アイテム間類似度が用いられる。たとえば、店舗の陳列在庫からSKUを取除くことは、通常、そのSKUを購入した顧客のうちほんの何人かが同じ店舗から類似のSKUを購入することを選ぶであろうことを意味し得る。このため、取除かれたSKUについての需要の一部が店舗の陳列在庫に残っているSKUに移転する。たとえば、「ヨーグルト」のカテゴリにおいては、カテゴリマネージャが陳列在庫から特定ブランドのヨーグルトのイチゴ風味を取除いた場合、取除かれたヨーグルトを購入した多くの(但しすべてではない)消費者が、代替品として別のブランドのイチゴ風味を購入すると決定することもできる。この代替品のヨーグルトは、消費者が、イチゴ風味のヨーグルトを備えていない店舗から立ち去るのではなく自発的に交換しよう思えるほど、これら消費者にとって、取除かれたヨーグルトと十分に類似しているように思われるものである。このため、取除かれたSKUに対する需要は2つの部分からなる。すなわち、陳列在庫における残りのSKUに移転されるであろう需要と、取除かれたSKUに十分に類似しているSKUを陳列在庫の中から発見することができない買物客による需要の損失を表わす損失需要とである。
【0010】
さらに、最適な製品価格を決定するシステムは、「交差効果(cross effects)」を決定するためにアイテム間類似度を用いてもよい。この「交差効果」は、1つの製品についての価格を変更することが別の製品の売上げにどのように影響を及ぼし得るか(すなわち、売上げが減少するかまたは増大するか)を意味している。交差効果は、類似度が既知であるかどうかを算出するのをより容易にする。なぜなら、価格変更が他のどの製品に影響を及ぼすかについての手掛かりが、類似度によって与えられるからである。具体的には、価格変更は、価格が変更された製品と類似する他の製品にも影響を及ぼすだろう。
【0011】
算出された交差効果は、価格変更が全く異なるアイテムではなく類似するアイテムに影響を及ぼすであろうという点で、ユーザにとってはより合理的に思えるだろう。交差効果を計算するのに類似度を用いなくても、AとBとが明らかに関連していないにも関わらずアイテムAの価格を変更した場合にアイテムBの売上げが変化するという結果が計算によってもたらされる可能性もある。
【0012】
図1は、本発明の実施形態に従ったコンピュータサーバ/システム10を示すブロック図である。単一のシステムとして示されているが、システム10の機能は分散型システムとして実現することもできる。さらに、この明細書中に開示される機能は、ネットワークを介して結合され得る別個のサーバまたは装置上で実現することができる。さらに、システム10のうち1つ以上の構成要素は含まれていなくてもよい。たとえば、ユーザクライアントの機能に関して、システム10はプロセッサ、メモリおよびディスプレイを含むスマートフォンであってもよいが、図1に示される他の構成要素のうち1つ以上を含まなくてもよい。
【0013】
システム10は、情報を通信するためのバス12または他の通信メカニズムと、情報を処理するための、バス12に結合されたプロセッサ22とを含む。プロセッサ22は、如何なるタイプの汎用または特定用途のプロセッサであってもよい。システム10はさらに、プロセッサ22によって実行されるべき情報および命令を格納するためのメモリ14を含む。メモリ14は、ランダムアクセスメモリ(「RAM」(random access memory))、読取専用メモリ(「ROM」(read only memory))、磁気ディスクもしくは光ディスクなどのスタティックストレージ、または他のタイプのコンピュータ読取可能媒体の如何なる組合せからも構成することができる。システム10はさらに、ネットワークにアクセスするためのネットワークインターフェイスカードなどの通信装置20を含む。したがって、ユーザは、ネットワーク、または他の何らかの方法によって直接的または遠隔的にシステム10とインターフェイスを取り得る。
【0014】
コンピュータ読取可能媒体は、プロセッサ22によってアクセスすることができる如何なる利用可能な媒体であってもよく、揮発性媒体および不揮発性媒体、取外し可能な媒体および取外し不可能な媒体、ならびに通信媒体を含む。通信媒体は、コンピュータ読取り可能な命令、データ構造、プログラムモジュールまたは他のデータを、搬送波または他の搬送メカニズムなどの変調されたデータ信号で含んでもよく、如何なる情報伝達媒体をも含む。
【0015】
プロセッサ22はさらに、液晶ディスプレイ(「LCD」(Liquid Crystal Display))などのディスプレイ24にバス12を介して結合される。コンピュータマウスなどのキーボード26およびカーソル制御デバイス28はさらに、ユーザがシステム10とインターフェイスをとることを可能にするようにバス12に結合される。
【0016】
一実施形態においては、メモリ14は、プロセッサ22によって実行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、システム10のためにオペレーティングシステム機能を与えるオペレーティングシステム15を含む。モジュールはさらに、アイテム間類似度を決定するためのアイテム間類似度モジュール16を含み、他のすべての機能がこの明細書中に開示されている。システム10はより大型のシステムの一部であってもよい。したがって、システム10は、オラクル社(Oracle Corp.)から入手できる「Retail Demand Forecasting(小売り需要予測)」などの付加的な機能を含むように、1つ以上の付加的な機能モジュール18を含み得る。データベース17は、モジュール16および18のための集中型ストレージを提供するようにバス12に結合される。一実施形態においては、アイテム間類似度は、「取引(transaction)ベースの」アプローチ、「属性ベースの」アプローチまたは「複合型」アプローチを用いて、モジュール16によって決定される。
【0017】
取引ベースの決定
顧客にリンクされた取引データが十分に利用可能であると想定して、一実施形態は、所与のカテゴリにおける個々の顧客の完了した取引履歴を分析することによって類似度を決定する(「取引ベースの決定」と称される)。次いで、これらの類似度の値が顧客セグメントレベルにまで上げられる。
【0018】
一般には、2つのアイテムが類似していると顧客が認識する場合、顧客はある製品の代わりに別の製品を選択することを厭わないだろう。観察されたこのような代用品の選択は、類似度についてのプロキシとして用いることができる。グループをなすアイテムが同じ顧客によって購入される場合、これは、顧客の取引履歴に見られるように、それらのアイテムがその顧客にとって代替可能であるかまたは類似していることを暗に意味している。対のアイテム間の類似度の程度は、取引履歴にある両方のアイテムを購入し、かつこれらのアイテムの交換を厭わない顧客の数に比例する。しかしながら、カテゴリ内の一群の製品が同じバスケット内の何人かの顧客によって購入される場合、これは、多様性を要求する傾向があるせいで、アイテムが一緒に購入される可能性がある場合にそれらアイテムが非類似となることを暗に意味している。同じ理由付けが適用される属性空間においては、製品がブランド、風味などの各々の製品に対応する属性値に置換えられる。
【0019】
実施形態は、特定のカテゴリ「C」についての取引ベースの類似度を決定するために以下の入力データを用いてもよい。(1)Cについての、顧客にリンクされた取引;(2)顧客を顧客セグメントにグループ分け;および(3)店舗を取引区域にグループ分け。取引区域は、小売り業者によって事業上の目的で指定される地理的な領域(たとえば、比較的広いボストン区域、シカゴ、サンフランシスコ湾岸地帯など)である。
【0020】
図2は、一実施形態に従って2つの製品Aと製品Bとの間の取引ベースの類似度を生成する場合における、図1のアイテム間類似度モジュール16の機能を示すフロー図である。一実施形態においては、図2および以下の図3図5のフロー図の機能は、メモリまたは他のコンピュータ読取り可能な媒体もしくは有形媒体に格納されてプロセッサによって実行されるソフトウェアによって実現される。他の実施形態においては、機能は、ハードウェアによって(たとえば、特定用途向け集積回路(「ASIC」(application specific integrated circuit))、プログラマブルゲートアレイ(「PGA」(programmable gate array))、フィールドプログラマブルゲートアレイ(「FPGA」(field programmable gate array))などを用いることによって)、またはハードウェアとソフトウェアとのいずれかの組合せによって実行されてもよい。
【0021】
一実施形態における図2の機能は、セグメントと取引区域との各組合せのために実行される。セグメントと取引区域との各組合せに関して、実施形態は、単に特定のセグメントにいる顧客だけを利用し、特定の取引区域における店舗からの取引だけを利用している。図2の機能はセグメントと取引区域との各組合せについて繰り返される。
【0022】
202において、製品Aおよび製品Bについての取引履歴と上述の他の入力データとが受取られる。
【0023】
204において、製品Aを含む少なくとも1回の取引と製品Bを含む少なくとも1回の取引とを含む履歴を有する顧客を見出すために、取引履歴が分析される。
【0024】
206において、204において識別された各々の顧客「k」ごとに、量f(k)が以下を用いて計算される:
【0025】
【数1】
【0026】
208において、206から得られた量f(k)が204において識別された顧客のすべてに関して合計される。
【0027】
210において、Aを含む取引またはBを含む取引を含む履歴を有する顧客の数が決定される。
【0028】
212において、AとBとの間の類似度を生成するために、208で得られた量を210で得られた量で割る。212における結果は以下のとおりである:
【0029】
【数2】
【0030】
ここで、AおよびBは所与の如何なる属性にも対応する製品値または属性値であってもよく、顧客が取引履歴においてAおよびBの両方を少なくとも一回購入していれば、F=1となり、その他の場合には0となる。
【0031】
図2の機能はカテゴリCにおける製品の各対について実行される。これにより、顧客セグメントと取引区域との特定の組合せに関してCにおける製品のすべての対同士の間の類似度が与えられる。機能は、セグメントと取引区域との各組合せについて繰り返される。次いで、計算された類似度の合計が、小売り販売予測システムまたは消費者デシジョンツリー生成システムなどの、類似度を必要とするアプリケーションに送信される。
【0032】
属性ベースの決定
顧客にリンクされた取引履歴が利用不可能であるかまたは不適切である場合、実施形態は製品の属性/内容物を比較する。類似度推定のための最も基本的なアプローチは、製品対同士の間で一致する属性の百分率を推定することであるだろう。しかしながら、ほとんどのシナリオの下では、CDTによって示されるように、さまざまな属性は、製品類似度を顧客に認識させるのに際してさまざまなレベルの重要性を有する。したがって、実施形態は、製品対同士の間の重み付けされた属性マッチスコアを必要とする。重みは、製品の相違点を提供する際における対応する属性の重要性に比例する。
【0033】
図3は、一実施形態に従ってカテゴリCについての属性ベースの類似度を生成する場合における、図1のアイテム間類似度モジュール16の機能を示すフロー図である。
【0034】
302において、カテゴリCについての入力データが受取られる。入力データは以下を含み得る。(1)カテゴリCにおける各々の製品についての属性値;(2)カテゴリCにおける各々の製品についての製品/店舗/週の売上げ単位;(3)取引区域;(4)セグメントごとの売上げ単位データ(すなわち、各セグメントについての上述の(2));および、(5)所与の週における所与の店舗の陳列在庫(すなわち、店舗ごとの週単位の陳列在庫)。
【0035】
304において、属性重みが、以下に詳細に開示されるように推定される。
306において、重み付けされた属性マッチスコアとしての類似度が、以下に詳細に開示されるように決定される。
【0036】
取引ベースの類似度と同様に、図3の機能が、セグメントと取引地域との各々の組合せごとに実行される。さらに、セグメントと取引区域との組合せごとに、取引区域における特定のセグメントおよび特定の店舗についての売上げデータだけを用いる。
【0037】
上に開示されるように、属性重みは304において推定される。一実施形態における重み付け機能は、仮に顧客がいずれの特定の属性も気にかけない場合、購買習性がランダムであるため、その売上げ占有率分布(sales share distribution)が陳列在庫占有率分布(assortment share distribution)と同一なるはずであるという仮定に基づいている。いずれかの特定の属性についての陳列在庫占有率分布からの売上げ占有率分布の偏差の程度は、その特定の属性の重要性についての優れた基準となる。
【0038】
いずれの属性値の「売上げ占有率」も、その属性値が全体的なカテゴリ売上げに対して寄与する売上げの占有率を示す。いずれの属性値の「陳列在庫占有率」も、その属性値に属する陳列在庫におけるアイテムの一部である。所与の属性についてのすべての属性値にわたる売上げ占有率および陳列在庫占有率の分布は、その属性について、それぞれ、「売上げ占有率分布」および「陳列在庫占有率分布」と称される。これらの分布は、特定の属性値の占有率に対応する各々の成分を用いてベクトルとして表わされる。
【0039】
各々の属性ごとに、実施形態は、上述したとおり、売上げ占有率分布ベクトルおよび陳列在庫占有率分布ベクトルを得る。さらに、占有率分布が時間および店舗によって異なると予想されるので、このようなベクトルは各々の店舗および期間ごとに生成される。実施形態はさらに、各々の店舗および期間における売上げ占有率ベクトルと陳列在庫占有率ベクトルとの間の偏差を属性ごとに計算する。売上げ占有率分布ベクトルと陳列在庫占有率分布ベクトルとの間の偏差は、平均絶対偏差(Mean Absolute Deviation)(「MAD」)、平方自乗平均差(Root Mean Square Difference)(「RMS」)、エントロピー関数、KLダイバージェンスなどとして推定することができる。これらの偏差の数は、次いで、各々の店舗および属性についての単一の偏差数を得るために、ある一定の期間にわたって集約される/平均される。
【0040】
実施形態はさらに、店舗についての重みとして総店舗売上げを用いて、店舗群にわたる偏差値の加重平均を計算する。これにより、ある属性について1個の偏差値が得られる。次いで、これらの偏差値は、すべての属性に関する偏差値が合計で1になって最終的な重みに到達するように、正規化される。
【0041】
数学的用語では、一実施形態における属性重みの式は以下のとおりである。
【0042】
【数3】
【0043】
j:期間
k:店舗
j,k:店舗「k」および期間「j」についての陳列在庫占有率ベクトルと売上げ占有率ベクトルとの間の偏差
:(全履歴にわたって総計された)店舗の総売上げ
:所与の店舗における期間の数。
【0044】
【数4】
【0045】
ここで、Dは、q番目の属性についての偏差である。
図4は、一実施形態に従って属性Qについての属性重みの推定値(estimation)を生成する(すなわち、図3の304における機能)場合における、図1のアイテム間類似度モジュール16の機能を示すフロー図である。
【0046】
402において、各々の店舗Sごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差が見出される。
【0047】
404において、MADの店舗に関する加重平均が決定される。ここで、各々の店舗ごとの重みは、カテゴリCにおける総履歴売上げ単位である。この最終的な値は式1において上述された値「D」である。
【0048】
406において、上述の式2を用いるD(Q)が正規化される。結果としてQの重みとなる。
【0049】
以下の例は、一実施形態に従った、偏差についての占有率計算および推定を示す。
1.市場占有率の計算:
属性値の売上げ占有率は全体的なカテゴリ売上げに対する寄与を百分率で表わしたものである。たとえば、イチゴ風味のヨーグルトアイテムの正味売上高が100単位であり、ヨーグルトカテゴリの正味売上高が500単位である場合、イチゴ風味の売上げ占有率=(100/500)*100=20%となる。所与の属性タイプについての属性値の売上げ占有率は合計で100になるはずである。たとえば、イチゴの他にバニラなどの風味がもう1つだけあった場合、バニラの売上げ占有率は100−20=80%となるだろう。
【0050】
2.陳列在庫占有率の計算:
属性値の陳列在庫占有率は、その特定の属性値に属する所与のカテゴリの陳列在庫におけるSKUの百分率として規定される。たとえば、陳列在庫に100のヨーグルトSKUがあり、それらのうちの40がイチゴ風味である場合、イチゴ風味の陳列在庫占有率は(40/100)*100=40%となるだろう。
【0051】
3.偏差の基準:
各々の属性は、各店舗(k)および各期間(j)についてのその陳列在庫占有率ベクトルおよび売上げ占有率ベクトルを有する。これらのベクトルの各成分は特定の属性値に対応する。店舗「k」および期間「j」についての陳列在庫占有率ベクトルと売上げ占有率ベクトルとの間の偏差(Djk)は、平均絶対偏差(「MAD」)で表わすことができる。これは以下の例によってさらに示される。
【0052】
属性:ブランド
属性値:Dannon(D)、Yoplait(Y)、およびChobani(C)
【0053】
【表1】
【0054】
jk=(|30−60|+|30−20|+|40−20|)/3=20
上述のように、重み付けされた属性マッチスコアとしての類似度の値が図3の306において決定される。製品Aと製品Bとの間の類似度は以下を用いて得ることができる。
【0055】
【数5】
【0056】
ここで、A=Bであれば、δ(A=B)=1であり、その他の場合には0となる。
=q番目の属性の重み
以下は、予め計算された属性重みを用いて2つの異なるヨーグルトSKUのAとBとの間の類似度の値を決定する際における一実施形態の例である。
【0057】
【表2】
【0058】
【表3】
【0059】
類似度=(0.40+0.20+0.41)=0.4
カテゴリCから2つの製品Aおよび製品Bが想定される場合、決定された重み(D(Q)は、上述の式3を用いてAとBとの類似度を計算するために用いられる。この計算は、カテゴリCのうちの製品すべての対に対して行われ、これにより、すべての製品対についての類似度が得られる。次いで、類似度が、小売り販売予測システムまたは消費者デシジョンツリー生成システムなどの、類似度を必要とするアプリケーションに送信される。
【0060】
複合型決定
使用される売上げデータの粒度が高ければ高いほど、取引ベースの類似度が属性ベースの類似度よりも正確になると考えられる。しかしながら、取引ベースの実施形態は、上述のとおり、典型的には、データが不足している以下のシナリオの場合にはスタンドアロンベースでは用いられない。
【0061】
1.取引履歴を持たないアイテムがほとんどない場合、または、
2.時間および店舗の観点から見て十分な陳列(exposure)を有さないアイテムがほとんどない場合。
【0062】
たとえば、1つの季節だけ(for one quarter)保持されるアイテムまたはほんのわずかな店舗にのみ保持されるアイテムである。
【0063】
このようなシナリオにおいては、一実施形態は、製品属性と同様に取引にも基づいて類似度を決定する「複合型」アプローチを用いる。概して、複合型の実施形態は、(時間および位置の両方の観点から)包括的な有効範囲を有するアイテムのサブセットについてのみ上述の取引ベースのアプローチを用いて、類似度を推定する。実施形態は、次いで、アイテムのサブセットについての取引ベースの類似度にモデルを適合させることによって、対応する属性類似度の関数として製品類似度の予測モデルを構築する。予測モデルは、サポートベクトルマシン(「SVM」(support vector machines)などの非線形モデルを用いて、一実施形態において構築される。別の実施形態においては、予測モデルは、同様のアイテムによって類似度推定(すなわち「同様アイテム」アプローチ)を用いて構築される。
【0064】
非線形/SVMの実施形態の場合、SVMモデルは、アイテムの取引ベースのサブセットから得られる結果に向けられている。実施形態は次いで、除外されたアイテムにモデルを適用し、残りのすべての製品対同士の類似度を獲得する。一実施形態はSVMのためにラジアルカーネルを用いる。他の実施形態では、ニューラルネットワーク、ロジスティック回帰、対数線形などを含むさまざまな非線形モデルを用いる。
【0065】
同様アイテムの実施形態によって類似度を推定するために、入力は、如何なるソースからも得ることができる一組の「既存の類似度」であってもよいが、取引ベースの類似度を用いるものではない。以下の式が一実施形態において用いられる。
【0066】
Eが、類似度を既に所有する一組のSKUであると仮定すると、これは、類似度の一組の「SIM」を意味する。ここで、EのうちのSKUの各対がSIMにおいて指定された類似度を有している。Sが、Eを含む一組のSKUであって、この一組のSKUが、SIMによって類似度が特定されていない付加的なSKUを有していると仮定する。最終的には、SにおけるすべてのSKUに関して、属性値が利用可能となる。
【0067】
Nの組をS−Eとする。すなわち、SのうちSIMに類似度を有さないSKUとする。
この目的は、以下の付加的な類似度の組をSIMに追加することである:
1.NにおけるSKUとEにおけるSKUとの間の類似度。
【0068】
2.NにおけるSKU同士の間の類似度。
こうして、SIMは、Sについての完全な一組の類似度を有することになるだろう。
【0069】
アプローチは、Nにおける各SKUごとに、Nにおける一組の「同様のアイテム」を識別することである。以下の2つの事例によって示されるように決定がなされる。
【0070】
事例1:
ここで、sがNにおけるSKUであると仮定する。属性ベースの類似度を用いて、E、e,…,eのうち5つの「最も類似する」SKUを見出す。これらはsの「同様のアイテム」である。(NにおけるSKUに関して、それらの属性値だけが利用可能であるので、属性ベースの類似度を用いて同様のアイテムを見出す。)
ここで、eがEのSKUであると仮定する。以下のとおり、sとeとの間の類似度を規定する:
【0071】
【数6】
【0072】
ここで、simは「属性ベースの類似度」を示し、simはSIMからの類似度を示す。したがって、sim(s,e)は、実際にはSIMベースの類似度の加重平均であり、ここで、重みは、sとeとの間の属性ベースの類似度である。合計がe≠eの下で実行されることに留意されたい。なぜなら、eのうちの1つがe自体である場合には、それは合計に含まれるべきでないからである。
【0073】
事例2:
これは事例1に類似している。というのも、これも加重平均であるからである。ここで、sおよびtがNにおける2つのSKUであると仮定する。再び属性ベースの類似度を用いて、Eからsにおいて最も類似する5個のSKUe,…,SKUeを見出し、Eからtにおいて最も類似する5個のSKUf,…,SKUfを見出す。ここでは、指数i、jに対する加重平均を用いる。
【0074】
【数7】
【0075】
また、合計がe≠fの下であることに留意されたい。これは、重みがsおよびtの両方から得られることを除いては事例1と同様である。合計は多くて25個のアイテムを含んでいる。なぜなら、sについて5個の類似度があり、tについて5個の類似度があるからである。
【0076】
同様のアイテム類似度の実施形態に関して、新しい類似度がSIMにおける類似度の加重平均として導き出されるので、新しい類似度は、SIMにおける類似度とほぼ同様の規模(magnitudes)を有することとなる。したがって、新しい類似度は、既にSIMにある類似度とはほとんど一致しなくなるだろう。
【0077】
図5は、一実施形態に従って複合型アプローチを用いて類似度を生成する場合における、図1のアイテム間類似度モジュール16の機能を示すフロー図である。
【0078】
502において、入力データが受取られる。入力データは、包括的な有効範囲を有するアイテムのサブセットについての取引ベースの類似度と、類似度が未知である(すなわち、データが不足しているために取引ベースのアプローチを用いて決定することができない)アイテムについての製品属性とを含む。取引ベースの類似度が、上述の図2に関して開示されるように生成される。
【0079】
504において、既存の取引ベースの類似度を用いて製品類似度を対応する属性類似度に関連付ける関数が生成される。一実施形態における関数は、アイテムのサブセットについての取引ベースの類似度に対してモデルを適合させることによって生成される対応する属性類似度の関数としての製品類似度の予測モデルである。
【0080】
506において、関数属性および製品属性を用いて、残りのアイテムについての類似度を得る。関数には、各々の製品についての属性値と共に対の製品が導入される。ここで、対における少なくとも1つの製品は、「新しい」製品(すなわち、上述の組Nにおける製品)である。次いで、類似度が、小売り販売予測システムまたは消費者デシジョンツリー生成システムなどの、類似度を必要とするアプリケーションに送信される。
【0081】
類似度の値の検証
実施形態は、下流において用いられる前に類似度を検証するために、類似度の値の精度/量を評価することができる。検証は、類似するアイテムが所与の顧客セグメントのための同じ店舗(または、セグメントが利用可能でない場合には店舗全体)において類似する売上げ占有率を有するだろうという考えに基づいている。
【0082】
一実施形態は、類似度の値と占有率差との間の相関関係を決定することによって、類似度の値を検証する。特定の顧客セグメント(占有率差SD)内の2つのアイテムの店舗占有率(セグメントが利用可能であれば店舗セグメント占有率)の差は、その顧客セグメントによって認識されるこれらの2つのアイテム間の類似度に対して負の相関関係にある。具体的には、アイテムAとアイテムBとの間の占有率差は以下のとおりである。
【0083】
【数8】
【0084】
1対のアイテムについての類似度の値と占有率差との間の負相関関係の程度は、類似度についての精度の基準である。
【0085】
別の実施形態は、類似度を用いて新しいアイテム需要予測モデルの精度を決定することによって検証を行う。新しいアイテムの売上げは、店舗における他のすべてのアイテムの売上げの加重平均として推定することができる。ここで、重みは、新しいアイテムと他のアイテムとの間の類似度の程度を示す。
【0086】
【数9】
【0087】
このモデルの精度は、類似度自体の精度に依存する。したがって、類似度の値の精度は予測モデルの精度に比例する。予測モデルの精度は一実施形態においては以下の方法で測定される:すべての履歴アイテム−位置は、既存のアイテム−位置(学習セット−70%)および新しいアイテム−位置(テストセット−30%)に仮説的に分割される。新しいアイテム−位置についての予測された需要は、既存のアイテム−位置に対して構築されたモデルを適用することによって得られる。平均絶対百分率誤差(「MAPE」(Mean Absolute Percentage Error))および重み付けされた絶対百分率誤差(「WAPE」(Weighted Absolute Percentage Error))を用いて、実際値と予想値との間の偏差を精度の基準として定量化することができる。
【0088】
開示されたように、実施形態は、利用可能な取引データに応じて、さまざまな方法を用いてアイテム間類似度を決定する。顧客にリンクされた取引データが、対象となるアイテムに対して利用可能である場合、取引ベースのアプローチを用いることができる。合計売上げデータ、陳列在庫情報および十分な製品属性が利用可能である場合、属性ベースのアプローチを用いることができる。顧客にリンクされた取引データ(いくつかのアイテムについての取引履歴が不十分であるかまたはまったく含まない)と製品属性情報とが利用可能である場合、複合型アプローチを用いることができる。実施形態は、製品販売予測、CDTの生成および需要移転決定などの下流のアプリケーションにおいて確実に用いることができるように、類似度を検証することができる。
【0089】
いくつかの実施形態がこの明細書中において具体的に例示および/または記載されている。しかしながら、開示された実施形態の変更例および変形例が、本発明の精神および意図される範囲から逸脱することなく、上述の教示によって、添付の特許請求の範囲内に包含されることが認識されるだろう。
図1
図2
図3
図4
図5