特許6231204 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オラクル・インターナショナル・コーポレイションの特許一覧

特許6231204アイテム間類似度の生成

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6231204

(24)【登録日】2017年10月27日

(45)【発行日】2017年11月15日

(54)【発明の名称】アイテム間類似度の生成

(51)【国際特許分類】

G06F 17/30 20060101AFI20171106BHJP

【ＦＩ】

G06F17/30 350C

G06F17/30 210D

【請求項の数】11

【全頁数】17

(21)【出願番号】特願2016-527299(P2016-527299)

(86)(22)【出願日】2014年9月5日

(65)【公表番号】特表2017-501477(P2017-501477A)

(43)【公表日】2017年1月12日

(86)【国際出願番号】US2014054259

(87)【国際公開番号】WO2015065590

(87)【国際公開日】20150507

【審査請求日】2016年5月18日

(31)【優先権主張番号】14/070,871

(32)【優先日】2013年11月4日

(33)【優先権主張国】US

(73)【特許権者】

【識別番号】502303739

【氏名又は名称】オラクル・インターナショナル・コーポレイション

(74)【代理人】

【識別番号】110001195

【氏名又は名称】特許業務法人深見特許事務所

(72)【発明者】

【氏名】ティワリ，サンディープ

(72)【発明者】

【氏名】ウー，ス−ミン

【審査官】石田信行

(56)【参考文献】

【文献】特開２０１２−０２７７５７（ＪＰ，Ａ）

【文献】特開平１０−２４０８１５（ＪＰ，Ａ）

【文献】特開平０８−１８００７１（ＪＰ，Ａ）

【文献】国際公開第２００７／０８８５７６（ＷＯ，Ａ１）

【文献】石野正彦 M.Ishino，商品属性を用いたリコメンデーションシステムの提案 The proposal of the Recommendation System using the goods attribute，情報処理学会研究報告Ｖｏｌ．２００４Ｎｏ．１１６ IPSJ SIG Technical Reports，日本，社団法人情報処理学会 Information Processing Society of Japan，２００４年１１月１７日，４１−４６頁

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

Ｇ０６Ｑ３０／０２

Ｇ０６Ｑ３０／０６

(57)【特許請求の範囲】

【請求項1】

命令が格納されたコンピュータ読取可能プログラムであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、複数の製品を含むカテゴリについてのアイテム間類似度を生成させ、当該生成することは、
前記カテゴリにおける各々の製品についての属性値と、前記カテゴリにおける各々の製品についての各々の店舗ごとの週の売上げ単位とを受取ることと、
属性重みを推定することと、
重み付けされた属性マッチスコアとして前記アイテム間類似度を決定することとを備え、
前記属性重みを推定することは、
各々の店舗ごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差（ＭＡＤ）を決定することと、
前記ＭＡＤの店舗にわたる加重平均を決定することとを含み、各々の店舗ごとの重みは、前記カテゴリにおける総履歴売上げ単位であり、さらに、
前記ＭＡＤの店舗にわたる前記加重平均を正規化することを含む、コンピュータ読取可能プログラム。

【請求項2】

包括的な有効範囲を有するアイテムのサブセットについての取引ベースのアイテム間類似度を生成することと、
対応する属性類似度に製品類似度を関連付ける関数を生成することとを備える、請求項１に記載のコンピュータ読取可能プログラム。

【請求項3】

前記関数は、製品類似度の予測モデルを含み、当該予測モデルは、アイテムの前記サブセットについての取引ベースの類似度に当該予測モデルを適合させることによって生成される対応する属性類似度の関数としてのものである、請求項２に記載のコンピュータ読取可能プログラム。

【請求項4】

前記取引ベースのアイテム間類似度を生成することは、製品Ａおよび製品Ｂについて、
製品Ａおよび製品Ｂの取引履歴を分析し、製品Ａを含む少なくとも１回の取引および製品Ｂを含む少なくとも１回の取引で、顧客を識別することと、
各々の識別された顧客ごとに、量ｆ（ｋ）を計算することとを含み、ここで、

【数1】

である、請求項２または３に記載のコンピュータ読取可能プログラム。

【請求項5】

前記属性重みを推定することは、

【数2】

ここで、ｊは期間であり、ｋは店舗であり、Ｄ_ｊ，ｋは、店舗ｋおよび期間ｊについての陳列在庫占有率ベクトルと売上げ占有率ベクトルとの間の偏差であり、Ｓ_ｋは前記店舗の正味売上高であり、Ｊ_ｋは所与の店舗における期間の数であり、ｑ番目の属性の重みは、

【数3】

であり、ここで、Ｄ_ｑはｑ番目の属性の偏差である、請求項１〜４のいずれか１項に記載のコンピュータ読取可能プログラム。

【請求項6】

前記重み付けされた属性マッチスコアとして前記アイテム間類似度を決定することは、
製品Ａと製品Ｂとの間の類似度に関して、

【数4】

を含み、ここで、Ａ＝Ｂであればδ（Ａ＝Ｂ）＝１であり、その他の場合には０であり、ｗ_ｑ＝ｑ番目の属性の重みである、請求項１〜５のいずれか１項に記載のコンピュータ読取可能プログラム。

【請求項7】

前記アイテム間類似度を用いて、消費者デシジョンツリー、需要移転効果または売上げ予測のうち少なくとも１つを生成することを備える、請求項１〜６のいずれか１項に記載のコンピュータ読取可能プログラム。

【請求項8】

複数の製品を含むカテゴリについてのアイテム間類似度を生成する方法であって、
前記カテゴリにおける各々の製品についての属性値と、前記カテゴリにおける各々の製品についての各々の店舗ごとの週の売上げ単位とを受取るステップと、
属性重みを推定するステップと、
重み付けされた属性マッチスコアとして前記アイテム間類似度を決定するステップとを備え、
前記属性重みを推定するステップは、
各々の店舗ごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差（ＭＡＤ）を決定するステップと、
前記ＭＡＤの店舗にわたる加重平均を決定するステップとを含み、各々の店舗ごとの重みは、前記カテゴリにおける総履歴売上げ単位であり、さらに、
前記ＭＡＤの店舗にわたる前記加重平均を正規化するステップを含む、方法。

【請求項9】

アイテム間生成システムであって、
メモリデバイスに結合されたプロセッサを含み、前記メモリデバイスは、前記プロセッサによって実行されると推定モジュールおよび決定モジュールを生成する命令を格納し、
前記推定モジュールは、製品のカテゴリにおける各々の製品についての属性値と、前記カテゴリにおける各々の製品についての各々の店舗ごとの週の売上げ単位とを受取り、属性重みを推定し、
前記決定モジュールは、重み付けされた属性マッチスコアとしてアイテム間類似度を決定し、
前記属性重みを推定することは、
各々の店舗ごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差（ＭＡＤ）を決定することと、
前記ＭＡＤの店舗にわたる加重平均を決定することとを含み、各々の店舗ごとの重みは前記カテゴリにおける総履歴売上げ単位であり、さらに、
前記ＭＡＤの店舗にわたる前記加重平均を正規化することを含む、アイテム間生成システム。

【請求項10】

前記決定モジュールはさらに、
包括的な有効範囲を有するアイテムのサブセットについての取引ベースのアイテム間類似度を生成し、
対応する属性類似度に製品類似度を関連付ける関数を生成する、請求項９に記載のアイテム間生成システム。

【請求項11】

前記関数は、製品類似度の予測モデルを含み、当該予測モデルは、アイテムの前記サブセットについての取引ベースの類似度に当該予測モデルを適合させることによって生成される対応する属性類似度の関数としてのものである、請求項１０に記載のアイテム間生成システム。

【発明の詳細な説明】

【技術分野】

【0001】

分野
一実施形態は、概して、コンピュータシステムに向けられ、特に、アイテム間類似度（item-to-item similarities）を生成するコンピュータシステムに向けられる。

【背景技術】

【0002】

背景情報
「カテゴリマネジメント」は小売業の概念であって、小売り業者によって販売される製品の範囲を類似製品または関連製品からなる別々のグループに分類している。これらのグループは「製品カテゴリ」と称される。食料雑貨店についての製品カテゴリの例として、ヨーグルト、コーヒー、練り歯磨き、ペーパータオルなどが含まれる。

【0003】

各々の製品カテゴリ内では、アイテム間の類似度または代替可能性を定量化する必要がある。アイテム間類似度は、グループのアイテム同士がどれくらい類似しているかまたは代替可能であるかについての顧客の認識を表わしている。類似度は、同じカテゴリ内の１対のアイテムについて規定されており、このため、顧客は類似のアイテム同士を取替える傾向があると考えられている。

【0004】

類似度は基本的に顧客に関連付けられているが、顧客レベルでのモデリングは多くの実用例に対して有用ではない可能性がある。これは、個々の顧客の取引（transaction）率が低すぎて、挙動を正確にモデリングするのに十分なデータを生成することができない可能性があるからである。したがって、類似度を少なくとも総「顧客セグメント」レベルでモデリングする必要がある。結果として、同じ顧客セグメントに属する顧客は製品対同士の間の類似度について共通の認識を有する傾向があると想定される。

【発明の概要】

【課題を解決するための手段】

【0005】

概要
一実施形態は、複数の製品を含むカテゴリについてのアイテム間類似度を生成するシステムである。当該システムは、カテゴリにおける各々の製品についての属性値と、カテゴリにおける各々の製品についての製品／店舗／週の売上げ単位（product-store-week sales unit）とを受取る。システムは属性重みを推定する。システムは次いで、重み付けされた属性マッチスコアとしてアイテム間類似度を決定する。

【図面の簡単な説明】

【0006】

【図1】本発明の実施形態に従ったコンピュータサーバ／システムを示すブロック図である。

【図2】一実施形態に従って２つの製品Ａと製品Ｂとの間の取引ベースの類似度を生成する場合における、図１のアイテム間類似度モジュールの機能を示すフロー図である。

【図3】一実施形態に従ってカテゴリＣについての属性ベースの類似度を生成する場合における、図１のアイテム間類似度モジュールの機能を示すフロー図である。

【図4】一実施形態に従って属性Ｑについての属性重みの推定値（estimation）を生成する場合における、図１のアイテム間類似度モジュールの機能を示すフロー図である。

【図5】一実施形態に従って複合型アプローチを用いて類似度を生成する場合における、図１のアイテム間類似度モジュールの機能を示すフロー図である。

【発明を実施するための形態】

【0007】

詳細な説明
一実施形態は、特に顧客にリンクされた取引履歴が利用不可能であるかまたは不適切である場合にアイテム間類似度を決定するシステムである。製品同士が、属性／内容物に基づいて比較され、属性の重みが決定される。さらに、重み付けされた属性の決定は、別の「複合型（hybrid）」実施形態における利用可能な如何なる取引履歴とも組合わせることができる。

【0008】

アイテム間類似度の決定は多くのビジネスプロセスにとって重要である。たとえば、あるカテゴリ内にあるさまざまな種類のアイテムに遭遇したときに製品を選択するために顧客がとるべき選択肢は、最も有意な属性（たとえばブランド、風味およびサイズ）が降順に並んだトップダウンツリーとして視覚的に表わすことができる。アイテム間類似度のマトリクスは、「消費者デシジョンツリー（Consumer Decision Tree）」（「ＣＤＴ」）と称されるこのツリーを生成するために、キー入力として提供される。

【0009】

さらに、店舗の陳列在庫（assortment）に対して在庫管理単位（stock keeping unit）（「ＳＫＵ」）を追加するかまたは取除くことによってもたらされるであろう「需要移転（demand transference）」効果を決定するための入力として、アイテム間類似度が用いられる。たとえば、店舗の陳列在庫からＳＫＵを取除くことは、通常、そのＳＫＵを購入した顧客のうちほんの何人かが同じ店舗から類似のＳＫＵを購入することを選ぶであろうことを意味し得る。このため、取除かれたＳＫＵについての需要の一部が店舗の陳列在庫に残っているＳＫＵに移転する。たとえば、「ヨーグルト」のカテゴリにおいては、カテゴリマネージャが陳列在庫から特定ブランドのヨーグルトのイチゴ風味を取除いた場合、取除かれたヨーグルトを購入した多くの（但しすべてではない）消費者が、代替品として別のブランドのイチゴ風味を購入すると決定することもできる。この代替品のヨーグルトは、消費者が、イチゴ風味のヨーグルトを備えていない店舗から立ち去るのではなく自発的に交換しよう思えるほど、これら消費者にとって、取除かれたヨーグルトと十分に類似しているように思われるものである。このため、取除かれたＳＫＵに対する需要は２つの部分からなる。すなわち、陳列在庫における残りのＳＫＵに移転されるであろう需要と、取除かれたＳＫＵに十分に類似しているＳＫＵを陳列在庫の中から発見することができない買物客による需要の損失を表わす損失需要とである。

【0010】

さらに、最適な製品価格を決定するシステムは、「交差効果（cross effects）」を決定するためにアイテム間類似度を用いてもよい。この「交差効果」は、１つの製品についての価格を変更することが別の製品の売上げにどのように影響を及ぼし得るか（すなわち、売上げが減少するかまたは増大するか）を意味している。交差効果は、類似度が既知であるかどうかを算出するのをより容易にする。なぜなら、価格変更が他のどの製品に影響を及ぼすかについての手掛かりが、類似度によって与えられるからである。具体的には、価格変更は、価格が変更された製品と類似する他の製品にも影響を及ぼすだろう。

【0011】

算出された交差効果は、価格変更が全く異なるアイテムではなく類似するアイテムに影響を及ぼすであろうという点で、ユーザにとってはより合理的に思えるだろう。交差効果を計算するのに類似度を用いなくても、ＡとＢとが明らかに関連していないにも関わらずアイテムＡの価格を変更した場合にアイテムＢの売上げが変化するという結果が計算によってもたらされる可能性もある。

【0012】

図１は、本発明の実施形態に従ったコンピュータサーバ／システム１０を示すブロック図である。単一のシステムとして示されているが、システム１０の機能は分散型システムとして実現することもできる。さらに、この明細書中に開示される機能は、ネットワークを介して結合され得る別個のサーバまたは装置上で実現することができる。さらに、システム１０のうち１つ以上の構成要素は含まれていなくてもよい。たとえば、ユーザクライアントの機能に関して、システム１０はプロセッサ、メモリおよびディスプレイを含むスマートフォンであってもよいが、図１に示される他の構成要素のうち１つ以上を含まなくてもよい。

【0013】

システム１０は、情報を通信するためのバス１２または他の通信メカニズムと、情報を処理するための、バス１２に結合されたプロセッサ２２とを含む。プロセッサ２２は、如何なるタイプの汎用または特定用途のプロセッサであってもよい。システム１０はさらに、プロセッサ２２によって実行されるべき情報および命令を格納するためのメモリ１４を含む。メモリ１４は、ランダムアクセスメモリ（「ＲＡＭ」（random access memory））、読取専用メモリ（「ＲＯＭ」（read only memory））、磁気ディスクもしくは光ディスクなどのスタティックストレージ、または他のタイプのコンピュータ読取可能媒体の如何なる組合せからも構成することができる。システム１０はさらに、ネットワークにアクセスするためのネットワークインターフェイスカードなどの通信装置２０を含む。したがって、ユーザは、ネットワーク、または他の何らかの方法によって直接的または遠隔的にシステム１０とインターフェイスを取り得る。

【0014】

コンピュータ読取可能媒体は、プロセッサ２２によってアクセスすることができる如何なる利用可能な媒体であってもよく、揮発性媒体および不揮発性媒体、取外し可能な媒体および取外し不可能な媒体、ならびに通信媒体を含む。通信媒体は、コンピュータ読取り可能な命令、データ構造、プログラムモジュールまたは他のデータを、搬送波または他の搬送メカニズムなどの変調されたデータ信号で含んでもよく、如何なる情報伝達媒体をも含む。

【0015】

プロセッサ２２はさらに、液晶ディスプレイ（「ＬＣＤ」（Liquid Crystal Display））などのディスプレイ２４にバス１２を介して結合される。コンピュータマウスなどのキーボード２６およびカーソル制御デバイス２８はさらに、ユーザがシステム１０とインターフェイスをとることを可能にするようにバス１２に結合される。

【0016】

一実施形態においては、メモリ１４は、プロセッサ２２によって実行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、システム１０のためにオペレーティングシステム機能を与えるオペレーティングシステム１５を含む。モジュールはさらに、アイテム間類似度を決定するためのアイテム間類似度モジュール１６を含み、他のすべての機能がこの明細書中に開示されている。システム１０はより大型のシステムの一部であってもよい。したがって、システム１０は、オラクル社（Oracle Corp.）から入手できる「Retail Demand Forecasting（小売り需要予測）」などの付加的な機能を含むように、１つ以上の付加的な機能モジュール１８を含み得る。データベース１７は、モジュール１６および１８のための集中型ストレージを提供するようにバス１２に結合される。一実施形態においては、アイテム間類似度は、「取引（transaction）ベースの」アプローチ、「属性ベースの」アプローチまたは「複合型」アプローチを用いて、モジュール１６によって決定される。

【0017】

取引ベースの決定
顧客にリンクされた取引データが十分に利用可能であると想定して、一実施形態は、所与のカテゴリにおける個々の顧客の完了した取引履歴を分析することによって類似度を決定する（「取引ベースの決定」と称される）。次いで、これらの類似度の値が顧客セグメントレベルにまで上げられる。

【0018】

一般には、２つのアイテムが類似していると顧客が認識する場合、顧客はある製品の代わりに別の製品を選択することを厭わないだろう。観察されたこのような代用品の選択は、類似度についてのプロキシとして用いることができる。グループをなすアイテムが同じ顧客によって購入される場合、これは、顧客の取引履歴に見られるように、それらのアイテムがその顧客にとって代替可能であるかまたは類似していることを暗に意味している。対のアイテム間の類似度の程度は、取引履歴にある両方のアイテムを購入し、かつこれらのアイテムの交換を厭わない顧客の数に比例する。しかしながら、カテゴリ内の一群の製品が同じバスケット内の何人かの顧客によって購入される場合、これは、多様性を要求する傾向があるせいで、アイテムが一緒に購入される可能性がある場合にそれらアイテムが非類似となることを暗に意味している。同じ理由付けが適用される属性空間においては、製品がブランド、風味などの各々の製品に対応する属性値に置換えられる。

【0019】

実施形態は、特定のカテゴリ「Ｃ」についての取引ベースの類似度を決定するために以下の入力データを用いてもよい。（１）Ｃについての、顧客にリンクされた取引；（２）顧客を顧客セグメントにグループ分け；および（３）店舗を取引区域にグループ分け。取引区域は、小売り業者によって事業上の目的で指定される地理的な領域（たとえば、比較的広いボストン区域、シカゴ、サンフランシスコ湾岸地帯など）である。

【0020】

図２は、一実施形態に従って２つの製品Ａと製品Ｂとの間の取引ベースの類似度を生成する場合における、図１のアイテム間類似度モジュール１６の機能を示すフロー図である。一実施形態においては、図２および以下の図３〜図５のフロー図の機能は、メモリまたは他のコンピュータ読取り可能な媒体もしくは有形媒体に格納されてプロセッサによって実行されるソフトウェアによって実現される。他の実施形態においては、機能は、ハードウェアによって（たとえば、特定用途向け集積回路（「ＡＳＩＣ」（application specific integrated circuit））、プログラマブルゲートアレイ（「ＰＧＡ」（programmable gate array））、フィールドプログラマブルゲートアレイ（「ＦＰＧＡ」（field programmable gate array））などを用いることによって）、またはハードウェアとソフトウェアとのいずれかの組合せによって実行されてもよい。

【0021】

一実施形態における図２の機能は、セグメントと取引区域との各組合せのために実行される。セグメントと取引区域との各組合せに関して、実施形態は、単に特定のセグメントにいる顧客だけを利用し、特定の取引区域における店舗からの取引だけを利用している。図２の機能はセグメントと取引区域との各組合せについて繰り返される。

【0022】

２０２において、製品Ａおよび製品Ｂについての取引履歴と上述の他の入力データとが受取られる。

【0023】

２０４において、製品Ａを含む少なくとも１回の取引と製品Ｂを含む少なくとも１回の取引とを含む履歴を有する顧客を見出すために、取引履歴が分析される。

【0024】

２０６において、２０４において識別された各々の顧客「ｋ」ごとに、量ｆ（ｋ）が以下を用いて計算される：

【0025】

【数1】

【0026】

２０８において、２０６から得られた量ｆ（ｋ）が２０４において識別された顧客のすべてに関して合計される。

【0027】

２１０において、Ａを含む取引またはＢを含む取引を含む履歴を有する顧客の数が決定される。

【0028】

２１２において、ＡとＢとの間の類似度を生成するために、２０８で得られた量を２１０で得られた量で割る。２１２における結果は以下のとおりである：

【0029】

【数2】

【0030】

ここで、ＡおよびＢは所与の如何なる属性にも対応する製品値または属性値であってもよく、顧客が取引履歴においてＡおよびＢの両方を少なくとも一回購入していれば、Ｆ＝１となり、その他の場合には０となる。

【0031】

図２の機能はカテゴリＣにおける製品の各対について実行される。これにより、顧客セグメントと取引区域との特定の組合せに関してＣにおける製品のすべての対同士の間の類似度が与えられる。機能は、セグメントと取引区域との各組合せについて繰り返される。次いで、計算された類似度の合計が、小売り販売予測システムまたは消費者デシジョンツリー生成システムなどの、類似度を必要とするアプリケーションに送信される。

【0032】

属性ベースの決定
顧客にリンクされた取引履歴が利用不可能であるかまたは不適切である場合、実施形態は製品の属性／内容物を比較する。類似度推定のための最も基本的なアプローチは、製品対同士の間で一致する属性の百分率を推定することであるだろう。しかしながら、ほとんどのシナリオの下では、ＣＤＴによって示されるように、さまざまな属性は、製品類似度を顧客に認識させるのに際してさまざまなレベルの重要性を有する。したがって、実施形態は、製品対同士の間の重み付けされた属性マッチスコアを必要とする。重みは、製品の相違点を提供する際における対応する属性の重要性に比例する。

【0033】

図３は、一実施形態に従ってカテゴリＣについての属性ベースの類似度を生成する場合における、図１のアイテム間類似度モジュール１６の機能を示すフロー図である。

【0034】

３０２において、カテゴリＣについての入力データが受取られる。入力データは以下を含み得る。（１）カテゴリＣにおける各々の製品についての属性値；（２）カテゴリＣにおける各々の製品についての製品／店舗／週の売上げ単位；（３）取引区域；（４）セグメントごとの売上げ単位データ（すなわち、各セグメントについての上述の（２））；および、（５）所与の週における所与の店舗の陳列在庫（すなわち、店舗ごとの週単位の陳列在庫）。

【0035】

３０４において、属性重みが、以下に詳細に開示されるように推定される。
３０６において、重み付けされた属性マッチスコアとしての類似度が、以下に詳細に開示されるように決定される。

【0036】

取引ベースの類似度と同様に、図３の機能が、セグメントと取引地域との各々の組合せごとに実行される。さらに、セグメントと取引区域との組合せごとに、取引区域における特定のセグメントおよび特定の店舗についての売上げデータだけを用いる。

【0037】

上に開示されるように、属性重みは３０４において推定される。一実施形態における重み付け機能は、仮に顧客がいずれの特定の属性も気にかけない場合、購買習性がランダムであるため、その売上げ占有率分布（sales share distribution）が陳列在庫占有率分布（assortment share distribution）と同一なるはずであるという仮定に基づいている。いずれかの特定の属性についての陳列在庫占有率分布からの売上げ占有率分布の偏差の程度は、その特定の属性の重要性についての優れた基準となる。

【0038】

いずれの属性値の「売上げ占有率」も、その属性値が全体的なカテゴリ売上げに対して寄与する売上げの占有率を示す。いずれの属性値の「陳列在庫占有率」も、その属性値に属する陳列在庫におけるアイテムの一部である。所与の属性についてのすべての属性値にわたる売上げ占有率および陳列在庫占有率の分布は、その属性について、それぞれ、「売上げ占有率分布」および「陳列在庫占有率分布」と称される。これらの分布は、特定の属性値の占有率に対応する各々の成分を用いてベクトルとして表わされる。

【0039】

各々の属性ごとに、実施形態は、上述したとおり、売上げ占有率分布ベクトルおよび陳列在庫占有率分布ベクトルを得る。さらに、占有率分布が時間および店舗によって異なると予想されるので、このようなベクトルは各々の店舗および期間ごとに生成される。実施形態はさらに、各々の店舗および期間における売上げ占有率ベクトルと陳列在庫占有率ベクトルとの間の偏差を属性ごとに計算する。売上げ占有率分布ベクトルと陳列在庫占有率分布ベクトルとの間の偏差は、平均絶対偏差（Mean Absolute Deviation）（「ＭＡＤ」）、平方自乗平均差（Root Mean Square Difference）（「ＲＭＳ」）、エントロピー関数、ＫＬダイバージェンスなどとして推定することができる。これらの偏差の数は、次いで、各々の店舗および属性についての単一の偏差数を得るために、ある一定の期間にわたって集約される／平均される。

【0040】

実施形態はさらに、店舗についての重みとして総店舗売上げを用いて、店舗群にわたる偏差値の加重平均を計算する。これにより、ある属性について１個の偏差値が得られる。次いで、これらの偏差値は、すべての属性に関する偏差値が合計で１になって最終的な重みに到達するように、正規化される。

【0041】

数学的用語では、一実施形態における属性重みの式は以下のとおりである。

【0042】

【数3】

【0043】

ｊ：期間
ｋ：店舗
Ｄ_ｊ，ｋ：店舗「ｋ」および期間「ｊ」についての陳列在庫占有率ベクトルと売上げ占有率ベクトルとの間の偏差
Ｓ_ｋ：（全履歴にわたって総計された）店舗の総売上げ
Ｊ_ｋ：所与の店舗における期間の数。

【0044】

【数4】

【0045】

ここで、Ｄ_ｑは、ｑ番目の属性についての偏差である。
図４は、一実施形態に従って属性Ｑについての属性重みの推定値（estimation）を生成する（すなわち、図３の３０４における機能）場合における、図１のアイテム間類似度モジュール１６の機能を示すフロー図である。

【0046】

４０２において、各々の店舗Ｓごとに、売上げ占有率と陳列在庫占有率との間の平均絶対偏差が見出される。

【0047】

４０４において、ＭＡＤの店舗に関する加重平均が決定される。ここで、各々の店舗ごとの重みは、カテゴリＣにおける総履歴売上げ単位である。この最終的な値は式１において上述された値「Ｄ」である。

【0048】

４０６において、上述の式２を用いるＤ（Ｑ）が正規化される。結果としてＱの重みとなる。

【0049】

以下の例は、一実施形態に従った、偏差についての占有率計算および推定を示す。
１．市場占有率の計算：
属性値の売上げ占有率は全体的なカテゴリ売上げに対する寄与を百分率で表わしたものである。たとえば、イチゴ風味のヨーグルトアイテムの正味売上高が１００単位であり、ヨーグルトカテゴリの正味売上高が５００単位である場合、イチゴ風味の売上げ占有率＝（１００／５００）＊１００＝２０％となる。所与の属性タイプについての属性値の売上げ占有率は合計で１００になるはずである。たとえば、イチゴの他にバニラなどの風味がもう１つだけあった場合、バニラの売上げ占有率は１００−２０＝８０％となるだろう。

【0050】

２．陳列在庫占有率の計算：
属性値の陳列在庫占有率は、その特定の属性値に属する所与のカテゴリの陳列在庫におけるＳＫＵの百分率として規定される。たとえば、陳列在庫に１００のヨーグルトＳＫＵがあり、それらのうちの４０がイチゴ風味である場合、イチゴ風味の陳列在庫占有率は（４０／１００）＊１００＝４０％となるだろう。

【0051】

３．偏差の基準：
各々の属性は、各店舗（ｋ）および各期間（ｊ）についてのその陳列在庫占有率ベクトルおよび売上げ占有率ベクトルを有する。これらのベクトルの各成分は特定の属性値に対応する。店舗「ｋ」および期間「ｊ」についての陳列在庫占有率ベクトルと売上げ占有率ベクトルとの間の偏差（Ｄ_ｊｋ）は、平均絶対偏差（「ＭＡＤ」）で表わすことができる。これは以下の例によってさらに示される。

【0052】

属性：ブランド
属性値：Ｄａｎｎｏｎ（Ｄ）、Ｙｏｐｌａｉｔ（Ｙ）、およびＣｈｏｂａｎｉ（Ｃ）

【0053】

【表1】

【0054】

Ｄ_ｊｋ＝（｜３０−６０｜＋｜３０−２０｜＋｜４０−２０｜）／３＝２０
上述のように、重み付けされた属性マッチスコアとしての類似度の値が図３の３０６において決定される。製品Ａと製品Ｂとの間の類似度は以下を用いて得ることができる。

【0055】

【数5】

【0056】

ここで、Ａ＝Ｂであれば、δ（Ａ＝Ｂ）＝１であり、その他の場合には０となる。
ｗ_ｑ＝ｑ番目の属性の重み
以下は、予め計算された属性重みを用いて２つの異なるヨーグルトＳＫＵのＡとＢとの間の類似度の値を決定する際における一実施形態の例である。

【0057】

【表2】

【0058】

【表3】

【0059】

類似度＝（０．４^＊０＋０．２^＊０＋０．４^＊１）＝０．４
カテゴリＣから２つの製品Ａおよび製品Ｂが想定される場合、決定された重み（Ｄ（Ｑ）は、上述の式３を用いてＡとＢとの類似度を計算するために用いられる。この計算は、カテゴリＣのうちの製品すべての対に対して行われ、これにより、すべての製品対についての類似度が得られる。次いで、類似度が、小売り販売予測システムまたは消費者デシジョンツリー生成システムなどの、類似度を必要とするアプリケーションに送信される。

【0060】

複合型決定
使用される売上げデータの粒度が高ければ高いほど、取引ベースの類似度が属性ベースの類似度よりも正確になると考えられる。しかしながら、取引ベースの実施形態は、上述のとおり、典型的には、データが不足している以下のシナリオの場合にはスタンドアロンベースでは用いられない。

【0061】

１．取引履歴を持たないアイテムがほとんどない場合、または、
２．時間および店舗の観点から見て十分な陳列（exposure）を有さないアイテムがほとんどない場合。

【0062】

たとえば、１つの季節だけ（for one quarter）保持されるアイテムまたはほんのわずかな店舗にのみ保持されるアイテムである。

【0063】

このようなシナリオにおいては、一実施形態は、製品属性と同様に取引にも基づいて類似度を決定する「複合型」アプローチを用いる。概して、複合型の実施形態は、（時間および位置の両方の観点から）包括的な有効範囲を有するアイテムのサブセットについてのみ上述の取引ベースのアプローチを用いて、類似度を推定する。実施形態は、次いで、アイテムのサブセットについての取引ベースの類似度にモデルを適合させることによって、対応する属性類似度の関数として製品類似度の予測モデルを構築する。予測モデルは、サポートベクトルマシン（「ＳＶＭ」（support vector machines）などの非線形モデルを用いて、一実施形態において構築される。別の実施形態においては、予測モデルは、同様のアイテムによって類似度推定（すなわち「同様アイテム」アプローチ）を用いて構築される。

【0064】

非線形／ＳＶＭの実施形態の場合、ＳＶＭモデルは、アイテムの取引ベースのサブセットから得られる結果に向けられている。実施形態は次いで、除外されたアイテムにモデルを適用し、残りのすべての製品対同士の類似度を獲得する。一実施形態はＳＶＭのためにラジアルカーネルを用いる。他の実施形態では、ニューラルネットワーク、ロジスティック回帰、対数線形などを含むさまざまな非線形モデルを用いる。

【0065】

同様アイテムの実施形態によって類似度を推定するために、入力は、如何なるソースからも得ることができる一組の「既存の類似度」であってもよいが、取引ベースの類似度を用いるものではない。以下の式が一実施形態において用いられる。

【0066】

Ｅが、類似度を既に所有する一組のＳＫＵであると仮定すると、これは、類似度の一組の「ＳＩＭ」を意味する。ここで、ＥのうちのＳＫＵの各対がＳＩＭにおいて指定された類似度を有している。Ｓが、Ｅを含む一組のＳＫＵであって、この一組のＳＫＵが、ＳＩＭによって類似度が特定されていない付加的なＳＫＵを有していると仮定する。最終的には、ＳにおけるすべてのＳＫＵに関して、属性値が利用可能となる。

【0067】

Ｎの組をＳ−Ｅとする。すなわち、ＳのうちＳＩＭに類似度を有さないＳＫＵとする。
この目的は、以下の付加的な類似度の組をＳＩＭに追加することである：
１．ＮにおけるＳＫＵとＥにおけるＳＫＵとの間の類似度。

【0068】

２．ＮにおけるＳＫＵ同士の間の類似度。
こうして、ＳＩＭは、Ｓについての完全な一組の類似度を有することになるだろう。

【0069】

アプローチは、Ｎにおける各ＳＫＵごとに、Ｎにおける一組の「同様のアイテム」を識別することである。以下の２つの事例によって示されるように決定がなされる。

【0070】

事例１：
ここで、ｓがＮにおけるＳＫＵであると仮定する。属性ベースの類似度を用いて、Ｅ、ｅ_１，…，ｅ_５のうち５つの「最も類似する」ＳＫＵを見出す。これらはｓの「同様のアイテム」である。（ＮにおけるＳＫＵに関して、それらの属性値だけが利用可能であるので、属性ベースの類似度を用いて同様のアイテムを見出す。）
ここで、ｅがＥのＳＫＵであると仮定する。以下のとおり、ｓとｅとの間の類似度を規定する：

【0071】

【数6】

【0072】

ここで、ｓｉｍ_ａは「属性ベースの類似度」を示し、ｓｉｍ_ｅはＳＩＭからの類似度を示す。したがって、ｓｉｍ（ｓ，ｅ）は、実際にはＳＩＭベースの類似度の加重平均であり、ここで、重みは、ｓとｅ_ｉとの間の属性ベースの類似度である。合計がｅ_ｉ≠ｅの下で実行されることに留意されたい。なぜなら、ｅ_ｉのうちの１つがｅ自体である場合には、それは合計に含まれるべきでないからである。

【0073】

事例２：
これは事例１に類似している。というのも、これも加重平均であるからである。ここで、ｓおよびｔがＮにおける２つのＳＫＵであると仮定する。再び属性ベースの類似度を用いて、Ｅからｓにおいて最も類似する５個のＳＫＵｅ_１，…，ＳＫＵｅ_５を見出し、Ｅからｔにおいて最も類似する５個のＳＫＵｆ_１，…，ＳＫＵｆ_５を見出す。ここでは、指数ｉ、ｊに対する加重平均を用いる。

【0074】

【数7】

【0075】

また、合計がｅ_ｉ≠ｆ_ｊの下であることに留意されたい。これは、重みがｓおよびｔの両方から得られることを除いては事例１と同様である。合計は多くて２５個のアイテムを含んでいる。なぜなら、ｓについて５個の類似度があり、ｔについて５個の類似度があるからである。

【0076】

同様のアイテム類似度の実施形態に関して、新しい類似度がＳＩＭにおける類似度の加重平均として導き出されるので、新しい類似度は、ＳＩＭにおける類似度とほぼ同様の規模（magnitudes）を有することとなる。したがって、新しい類似度は、既にＳＩＭにある類似度とはほとんど一致しなくなるだろう。

【0077】

図５は、一実施形態に従って複合型アプローチを用いて類似度を生成する場合における、図１のアイテム間類似度モジュール１６の機能を示すフロー図である。

【0078】

５０２において、入力データが受取られる。入力データは、包括的な有効範囲を有するアイテムのサブセットについての取引ベースの類似度と、類似度が未知である（すなわち、データが不足しているために取引ベースのアプローチを用いて決定することができない）アイテムについての製品属性とを含む。取引ベースの類似度が、上述の図２に関して開示されるように生成される。

【0079】

５０４において、既存の取引ベースの類似度を用いて製品類似度を対応する属性類似度に関連付ける関数が生成される。一実施形態における関数は、アイテムのサブセットについての取引ベースの類似度に対してモデルを適合させることによって生成される対応する属性類似度の関数としての製品類似度の予測モデルである。

【0080】

５０６において、関数属性および製品属性を用いて、残りのアイテムについての類似度を得る。関数には、各々の製品についての属性値と共に対の製品が導入される。ここで、対における少なくとも１つの製品は、「新しい」製品（すなわち、上述の組Ｎにおける製品）である。次いで、類似度が、小売り販売予測システムまたは消費者デシジョンツリー生成システムなどの、類似度を必要とするアプリケーションに送信される。

【0081】

類似度の値の検証
実施形態は、下流において用いられる前に類似度を検証するために、類似度の値の精度／量を評価することができる。検証は、類似するアイテムが所与の顧客セグメントのための同じ店舗（または、セグメントが利用可能でない場合には店舗全体）において類似する売上げ占有率を有するだろうという考えに基づいている。

【0082】

一実施形態は、類似度の値と占有率差との間の相関関係を決定することによって、類似度の値を検証する。特定の顧客セグメント（占有率差ＳＤ）内の２つのアイテムの店舗占有率（セグメントが利用可能であれば店舗セグメント占有率）の差は、その顧客セグメントによって認識されるこれらの２つのアイテム間の類似度に対して負の相関関係にある。具体的には、アイテムＡとアイテムＢとの間の占有率差は以下のとおりである。

【0083】

【数8】

【0084】

１対のアイテムについての類似度の値と占有率差との間の負相関関係の程度は、類似度についての精度の基準である。

【0085】

別の実施形態は、類似度を用いて新しいアイテム需要予測モデルの精度を決定することによって検証を行う。新しいアイテムの売上げは、店舗における他のすべてのアイテムの売上げの加重平均として推定することができる。ここで、重みは、新しいアイテムと他のアイテムとの間の類似度の程度を示す。

【0086】

【数9】

【0087】

このモデルの精度は、類似度自体の精度に依存する。したがって、類似度の値の精度は予測モデルの精度に比例する。予測モデルの精度は一実施形態においては以下の方法で測定される：すべての履歴アイテム−位置は、既存のアイテム−位置（学習セット−７０％）および新しいアイテム−位置（テストセット−３０％）に仮説的に分割される。新しいアイテム−位置についての予測された需要は、既存のアイテム−位置に対して構築されたモデルを適用することによって得られる。平均絶対百分率誤差（「ＭＡＰＥ」（Mean Absolute Percentage Error））および重み付けされた絶対百分率誤差（「ＷＡＰＥ」（Weighted Absolute Percentage Error））を用いて、実際値と予想値との間の偏差を精度の基準として定量化することができる。

【0088】

開示されたように、実施形態は、利用可能な取引データに応じて、さまざまな方法を用いてアイテム間類似度を決定する。顧客にリンクされた取引データが、対象となるアイテムに対して利用可能である場合、取引ベースのアプローチを用いることができる。合計売上げデータ、陳列在庫情報および十分な製品属性が利用可能である場合、属性ベースのアプローチを用いることができる。顧客にリンクされた取引データ（いくつかのアイテムについての取引履歴が不十分であるかまたはまったく含まない）と製品属性情報とが利用可能である場合、複合型アプローチを用いることができる。実施形態は、製品販売予測、ＣＤＴの生成および需要移転決定などの下流のアプリケーションにおいて確実に用いることができるように、類似度を検証することができる。

【0089】

いくつかの実施形態がこの明細書中において具体的に例示および／または記載されている。しかしながら、開示された実施形態の変更例および変形例が、本発明の精神および意図される範囲から逸脱することなく、上述の教示によって、添付の特許請求の範囲内に包含されることが認識されるだろう。

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6231204号(P6231204)IP Force 特許公報掲載プロジェクト 2022.1.31 β版