IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 斉魯工業大学の特許一覧

特許7498503実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法
<>
  • 特許-実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法 図1
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-04
(45)【発行日】2024-06-12
(54)【発明の名称】実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法
(51)【国際特許分類】
   G06Q 30/015 20230101AFI20240605BHJP
   G06Q 30/0601 20230101ALI20240605BHJP
【FI】
G06Q30/015
G06Q30/0601
【請求項の数】 8
(21)【出願番号】P 2021562005
(86)(22)【出願日】2020-11-17
(65)【公表番号】
(43)【公表日】2022-11-21
(86)【国際出願番号】 CN2020129274
(87)【国際公開番号】W WO2022036894
(87)【国際公開日】2022-02-24
【審査請求日】2021-10-18
(31)【優先権主張番号】202010832287.X
(32)【優先日】2020-08-18
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】520063990
【氏名又は名称】斉魯工業大学
【氏名又は名称原語表記】QILU UNIVERSITY OF TECHNOLOGY
【住所又は居所原語表記】No.3501, Daxue Road, ChangQing District,Jinan City, Shandong Province 250353 China
(74)【代理人】
【識別番号】100130111
【弁理士】
【氏名又は名称】新保 斉
(72)【発明者】
【氏名】董 祥軍
(72)【発明者】
【氏名】張 孟▲ジォ▼
【審査官】小原 正信
(56)【参考文献】
【文献】中国特許出願公開第110349678(CN,A)
【文献】米国特許出願公開第2018/0218436(US,A1)
【文献】中国特許出願公開第110277172(CN,A)
【文献】米国特許出願公開第2018/0342007(US,A1)
【文献】米国特許出願公開第2017/0124487(US,A1)
【文献】米国特許出願公開第2016/0171540(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムであって、情報収集モジュール、商品推薦モジュール、商品販売モジュールからなり、
前記情報収集モジュールは、順次接続された情報抽出モジュールと第1の情報送信モジュールとを含み、
前記情報抽出モジュールは、ユーザID、年齢、性別、タイムスタンプ、およびユーザが閲覧した商品マークを含むユーザ行動データをリアルタイムで抽出して保存するために用いられ、前記第1の情報送信モジュールは、ユーザの行動データを、伝送ネットワークを介して前記商品推薦モジュールに送信するために用いられ、
前記商品推薦モジュールは、順次接続された情報処理モジュール、情報分析モジュール、表示モジュール、および第2の情報送信モジュールを含み、
前記商品推薦モジュールはクラウドサーバーに配置され、前記第1の情報送信モジュールは情報処理モジュールに接続され、
前記情報処理モジュールは、収集されたユーザ行動データに対してデータクリーニング・分類するために使用されて、前記情報分析モジュールは、前記情報処理モジュールの処理結果に従って、ユーザの買い物行動を分析・予測するために使用され、詳しくは、前記情報分析モジュールは、前記情報処理モジュールによって処理されたユーザ行動データに基づいて、ユーザIDに対応する買い物行動配列を作成し、次に、買い物行動を分析・予測し、同じ性別および同じ年齢層のユーザの買い物行動データは、配列データベースを構成し、各ユーザIDは、特定の期間中のユーザのすべての買い物記録によって形成された順序付けられた配列に対応し、次に、配列データベースのマイニングを実行して、実用的な高効用の負の配列ルール、つまりユーザのニーズを満たす商品の推奨を取得し、前記表示モジュールは、商品ID、品番、数量、および単価を含むユーザへの推奨結果を表示するために使用され、ユーザからショッピングカートへの追加指示が入力された場合、それらをショッピングカートに追加し、ユーザからショッピングカートへの追加指示が入力されない場合、推奨結果を破棄し、前記第2の情報送信モジュールは、前記商品推薦モジュールの処理結果を、送信ネットワークを介して前記商品販売モジュールに送信するために用いられ、
前記商品販売モジュールは、順次接続された決済モジュール、在庫更新モジュール、および第3の情報送信モジュールを含み、
前記商品販売モジュールは、クラウドサーバーに設置され、前記第3の情報送信モジュールは、前記商品推薦モジュールを接続するために用いられ、前記決済モジュールは、前記商品推薦モジュールの処理結果に従ってショッピングカート内の商品を決済するために用いられ、そして、前記在庫更新モジュールは、注文が正常に決済された後、リアルタイムで商品在庫を更新するために用いられ、前記商品販売モジュールはまた、ユーザの今回の買い物行動データをキャッシュし、前記第3の情報送信モジュールを介して、買い物記録を前記商品推薦モジュールにリアルタイムでフィードバックし、
伝送ネットワーク通信で前記の情報収集モジュール、商品推薦モジュール、商品販売モジュールを順次接続する
ことを特徴とする実用的な高効用負の配列ルールマイニングに基づく商品推奨システムにおいて、
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法であって、
工程(1)において、前記情報抽出モジュールは、ユーザID、性別、年齢、タイムスタンプ、およびユーザが閲覧した商品マークを含むユーザ行動データをリアルタイムで抽出して保存する工程と、
工程(2)において、前記第1の情報送信モジュールは、工程(1)で述べたように情報収集モジュールによって抽出されたユーザ行動データを、送信ネットワークを介して前記商品推薦モジュールに送信する工程と、
工程(3)において、前記情報処理モジュールは、収集したユーザ行動データに対してデータクリーニングし、クリーニング後のデータを分類する工程と、
工程(4)において、前記情報分析モジュールは、前記情報処理モジュールの処理結果に基づいて、ユーザの買い物行動を分析・予測するに当たり、前記情報処理モジュールが処理するユーザ行動データに基づいて、前記情報分析モジュールは、ユーザIDに対応する買い物行動配列を作成し、次に、買い物行動を分析・予測し、同じ性別および同じ年齢層のユーザの買い物行動データは、配列データベースを構成し、各ユーザIDは、特定の期間中のユーザのすべての買い物記録によって形成された順序付けられた配列に対応し、次に、配列データベースのマイニングを実行して、求められる、実用的な高効用の負の配列ルール、つまりユーザのニーズを満たす商品の推奨を取得する工程と、
工程(5)において、工程(4)で得られたユーザのニーズに沿った商品推奨に基づいて、前記表示モジュールは、商品ID、品番、数量、および単価を含むユーザの推奨結果を表示し、ユーザからショッピングカートへの追加指示が入力された場合、それらをショッピングカートに追加し、ユーザからショッピングカートへの追加指示が入力されない場合、推奨結果を破棄する工程と、
工程(6)において、前記第2の情報送信モジュールは、前記商品推薦モジュールの処理結果を、送信ネットワークを介して前記商品販売モジュールに送信する工程と、
工程(7)において、前記決済モジュールは、前記商品推薦モジュールの処理結果に従って、ショッピングカート内の商品を決済し、次に、前記在庫更新モジュールは、注文が正常に決済された後、リアルタイムで商品在庫を更新し、前記商品販売モジュールはまた、ユーザの今回の買い物行動データをキャッシュし、前記第3の情報送信モジュールを介して、前記商品推薦モジュールにリアルタイムで買い物記録をフィードバックする工程と、を含み、
また、
前記工程(4)において、前記情報分析モジュールはAUNSRMアルゴリズムを介して、ユーザ行動データを分析・予測し、
工程Aにおいて、高効用負の配列ルールマイニング方法のe-HUNSRアルゴリズムで効用配列データベースをマイニングして、高効用負の配列ルール即ちユーザの購入配列のなか、特定の値より大きいすべてのルールを取得し、且つ、各高効用負の配列ルールの効用と効用の信頼度を計算し、次に、高効用負ルールから取得した情報をそれぞれ2つのハッシュテーブルに格納し、1番目のハッシュテーブルのなか、key1は高効用負の配列ルールを表し、value1は対応する高効用負の配列ルールの効用を表し、2番目のハッシュテーブルのなか、key2は高効用負の配列ルールを表し、value2は対応する高効用負の配列ルールの効用の信頼度を表す工程と、
工程Bにおいて、実用的な高効用負の配列ルールのフィルタリングについて、サポート、ルール包含条件、効用に基づき高効用負の配列ルールを対象にフィルタリングし、サポート、ルール包含条件、効用の順に各高効用負の配列ルールを、以下に示されるとおり、順番にフィルタリングし、
高効用負の配列ルールR=X⇒YとRi=Xi⇒Yiとがあり、RとRiがそれぞれ2つの異なる高効用負の配列ルールを表すと仮定すると、XはRの前部を表し、YはRの後部を表し、XiはRiの前部を表し、YiはRiの後部を表し、
条件(1):RとRiとはサポートが同じであること;
条件(2):R=X⇒YをRi=Xi⇒Yiと比較した場合、Ri⊆R,X⊆Xi,Yi⊆Yであること;
条件(3):u(Ri)≦u(R)、ここにu(Ri)はRiの効用を指し、u(R)はRの効用を指すこと;
上記の3つの条件(1)、(2)、および(3)が満たされる場合、高効用負の配列ルールRは、Riに比べて実用的な高効用負の配列ルールであり、すべてのRiを削除し、すべてのRを保持することにより、(1)、(2)、(3)の条件を満たした、すべての実用的な高効用負の配列ルール即ちユーザのニーズを満たす商品推奨を取得する工程と、
を含む
ことを特徴とする実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項2】
前記伝送ネットワークが、有線ネットワーク、LAN、Wi-Fi、パーソナルネットワーク、または4G/5Gネットワークであり得る
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項3】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法であって、
ユーザIDを主キーとして使用して、データベースからユーザIDを含むすべての買い物行動データを検索し、ユーザの買い物行動データとは、タイムスタンプ、ユーザID、商品ID、数量、および単価を含む、前記第3の情報送信モジュールを介して前記商品販売モジュールにフィードバックするデータのことであり、次に、買い物行動データを同じユーザIDで組み合わせし、つまり、タイムスタンプ(買い物時間)を削除し、ユーザIDを最初のフィールドとして保持し、ユーザが購入した商品IDと数を時系列に並べ替えて2番目のフィールドを構成し、各商品の単価は個別に保存され、このようにして、異なる性別および異なる年齢層に対応する高効用配列データベースを取得し、
工程Aにおいて、前記に示すとおり、高効用配列データベースは、工程(3)のデータ分類後に得られたデータベースから変換される
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項4】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法であって、
工程aにおいて、HUNSPMアルゴリズムを利用して、高効用配列データベースをマイニングし、すべての高効用の負の配列パターンを取得し、それらの効用を保存し、高効用負の配列パターンとは、効用が最小効用閾値以上の高効用負の配列パターンのことであり、
工程bにおいて、工程aで生成された高効用負の配列パターンに基づいてすべての候補ルールを取得し、高効用負の配列パターンを2つの部分、つまり前部と後部に分割し、
工程cにおいて、前部または後部に1つの負のアイテムのみ含まれている候補ルールを削除し、
工程dにおいて、残りの候補ルールの効用の信頼度を計算し、最小効用の信頼度閾値よりも大きい効用の信頼度を持つルールは求める高効用負の配列ルールであり、
工程Aにおいて、高効用負の配列ルールマイニング方法のe-HUNSRアルゴリズムで前記工程a~dを経て、効用配列データベースをマイニングして、高効用負の配列ルールを取得する
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項5】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法であって、
条件(1)において、Rのサポートは、以下、式(I)に示す式で計算されるとおり:
【数1】
Riのサポートの計算式は、以下、式(II)に示すとおり:
【数2】
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項6】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法であって、
条件(2)において、R=ac⇒be,Ri=ac⇒bと仮定し、〈ac⇒b〉⊆〈ac⇒be〉, ac⊆ac,b⊆beであり、そのなか、RとRiはそれぞれ2つの異なる高効用負の配列ルールを表し、acはRの前部を表し、beはRの後部を表し、acはRiの前部を表し、bはRiの後部を表し、RとRiは条件(2)を満たす
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項7】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法であって、
条件(3)において、ルールR=X⇒Yについて、〈e1e2e3…ei-1〉が前部Xを表し、〈ei…ek〉が後部Yを表すと設定した場合、当該ルールはR=〈e1e2e3…ei-1〉⇒〈ei…ek〉と表され、
ルールRの効用u(R)の計算式は、以下、式(III)に示すとおり:
【数3】
式(III)において、i=1,2,3…k、ei∈R、u(ei)=q(ei,R)×p(ei)、q(ei,R)はアイテムeiの内部効用を示し、p(ei)はeiの外部効用を示し、
ルールRi=Xi⇒Yiについて、〈e1e2e3…ej-1〉が前部Xiを表し、〈ej…ek〉が後部Yiを表すと設定した場合、当該ルールはRi=〈e1e2e3…ej-1〉⇒〈ej…ek〉と表され、
ルールRiの効用u(Ri)の計算式は、以下、式(IV)に示すとおり:
【数4】
式(IV)において、j=1,2,3…k、ej∈Ri、u(ej)=q(ej,R) ×p(ej)であり、q(ej,R)はアイテムejの内部効用を示し、p(ej)はアイテムejの外部効用を示す
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【請求項8】
実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法でであって、
工程(3)において、欠落しているデータの場合、欠落しているデータの範囲が決定され、不要なフィールドが削除され、欠落しているコンテンツが入力され、 重複データの場合は、他のデータを削除し、1つのみ残し、一貫性のないデータの場合は、データを補間して、前記情報処理モジュールは、収集されたユーザ行動データに対してデータクリーニングし、
工程(3)において、同性および同年齢層のユーザの行動データでデータベースを構成し、異なる性別または異なる年齢層のユーザの行動データは、互いに独立した異なるデータベースを構成し、各データベースには、対応するユーザのすべての行動データが含まれ、データクリーニングした後のデータは、ユーザの性別および年齢に基づいて分類される
請求項1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法に関し、実用的な高効用負の配列ルールの応用技術分野に属する。
【背景技術】
【0002】
インターネット技術の普及にともない、電子商取引は急速な発展を遂げている。電子商取引のメリットは、ユーザのアカウントやブラウザのCookieなどに基づいてさまざまなユーザを特定し、過去の閲覧や購入の記録に基づいてユーザに商品を推奨できることにある。ただし、ユーザに提供される推奨商品が明らかにユーザのニーズを満たさないことがある。さらに、実店舗は依然として商品販売の重要なチャネルであるが、インテリジェンスが整備されていないため、電子商取引同様の商品推奨と相応のユーザエクスペリエンスを実現できない。インテリジェント化により実店舗のユーザに適切な商品推奨を行い、電子商取引なみのユーザエクスペリエンスを実現させることは、解決を急ぐすべき問題である。既存の商品推薦方法は多くの情報を得ることができるが、情報の多大な部分は冗長であるか矛盾していることさえある。このような役に立たない情報を除外するのが非常に難しい。さらに、実店舗のメリットを如何に活用し、ユーザの関連情報を収集し、それを効用的に分析し、実用的な推奨情報を取得することが克服すべき技術的難題である。
【0003】
データマイニングは、大量のデータから効果的で斬新で、潜在的に適用可能で、最終的に理解できるパターンを発見することを目的としている。これは、データベースからの知識発見(Knowledge-Discovery in Databases,KDD)のプロセスである。データマイニングは通常、コンピュータサイエンスに関連しており、統計、オンライン分析と処理、情報検索、機械学習、エキスパートシステム(過去の経験則)、パターン認識などの多くの方法を通じて前記の目標を実現させる。データマイニングは、いまや、大量のデジタル情報を効果的に処理および使用するための主要なコンピューター手法であり、情報化時代における情報過多および知識不足の問題を解決するための主要な手法である。
【0004】
高効用負の配列ルールマイニングの使用は、データマイニングにおける非常に重要な研究分野である。従来の相関ルールマイニングと比較して、アイテムの統計的有意性を考慮するだけではなく、アイテムのセマンティック測定も考慮される。これにより、実在するニーズをより明確に表現できる。マイニングアルゴリズムでは、各アイテムに異なる効用ウェイトを割り当てることができるため、各アイテムの発生数が記録され、アイテムは各トランザクションで繰り返し表示される可能性がある。これは、実際の需給により一致する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、前記従来技術の有する問題点に鑑みて実用的な高効用負の配列ルールをより見つけるために提案されたもので、実用的な高効用負の配列ルールマイニングに基づく商品推奨システムを提供する。
【0006】
本発明は、また、前記の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法を提供する。
【0007】
本発明は、実用的な高効用負の配列ルールをマイニングするためのAUNSRMという名前の高効用アルゴリズムを提供した。 AUNSRMアルゴリズムは、商品推奨に適用されると、商品間の負の相関関係を見つけて、ユーザへの商品推奨に実用的なサポートを提供できる。
【0008】
以下に、本明細書において用いられる用語の定義を説明する。
「e-HUNSRアルゴリズム」とは、高効用負の配列ルールマイニングアルゴリズムをいう。このアルゴリズムは、効用的な負の配列ルールをマイニングする方法を初めて定義し、効用の信頼度を使用してルールの有用性を測定する。候補ルールの生成方法、必要な情報の保存方法、および不要なルールのプルーニング方法の具体的な実装方法が提供される。
【0009】
「ハッシュテーブル」とは、英語で「Hash table」といい、キー値(Key value)に基づいて直接アクセスされるデータ構造を指す。
【0010】
「効用」とは、配列内の各アイテムの数量とアイテムの単位効用の積の合計を指す。
【0011】
「最小効用閾値」とは、英語で「minimum utility」といい、略して「min_utility」といい、高効用配列が満たす最小効用をいう。高効用配列と低効用配列を区別するための閾値は、ユーザより設定される。
【0012】
「効用の信頼度」とは、英語でuconfといい、高効用配列ルールR:X→Yのなか、アイテムセットX∪Y におけるアイテムセットXのローカル効用と、のデータベースにおけるアイテムセットXの効用との比率をいい、つまり、 アイテムセットXのアイテムセットX∪Y 発生への効用寄与度がアイテムセットXの総効用に占める割合をさす。
【0013】
「最小効用の信頼度閾値」とは、英語で「minimum uconf」といい、略して「min_uconf」といい、高効用負の配列ルールによって満たされる効用の信頼度の最小値をいう。
【0014】
「サポート(support)」とは、データベース内の配列またはルールの出現数と、データベース内の配列の総数の比率をいう。
【0015】
「高効用負の配列ルール」とは、英語で「High Utility Negative Sequential Rule」といい、略して「HUNSR」といい、最小効用閾値と最小効用の信頼度閾値の両方を満たす負の配列ルールをいう。たとえば、負の配列ルール¬ab⇒cの効用と効用の信頼度がそれぞれ420と1である場合、設定された最小効用と最小の効用の信頼度がそれぞれ200と0.25である場合、¬ab⇒cはまさに高い効用の負の配列ルールである。
【課題を解決するための手段】
【0016】
前記の課題を解決するためになされた本発明は、以下のとおり。
伝送ネットワーク通信で順次接続された情報収集モジュール、商品推奨モジュール、および商品販売モジュールを含む実用的な高効用負の配列ルールマイニングに基づく商品推奨システムを提供する。
【0017】
前記情報収集モジュールは、順次接続された情報抽出モジュールと第1の情報送信モジュールとを含む。
前記の情報抽出モジュールは、ユーザID、顔マーク、年齢、性別、タイムスタンプ、およびユーザが閲覧した商品マークを含むユーザ行動データをリアルタイムで抽出して保存するために用いられる。前記第1の情報伝送モジュールは、ユーザの行動データを、伝送ネットワークを介して前記商品推奨モジュールに送信するために用いられる。
【0018】
前記商品推薦モジュールは、順次接続された情報処理モジュール、情報分析モジュール、表示モジュール、および第2の情報送信モジュールを備える。
前記商品推薦モジュールはクラウドサーバーに配置され、前記第1の情報送信モジュールは情報処理モジュールに接続されている。
【0019】
実世界のデータには、不完全データがほとんどで、ノイズが多くて、一貫性がないため、前記情報処理モジュールは、収集されたユーザ行動データに対してデータクリーニングし、且つデータクリーニング後のデータを分類するために用いられる。前記分析モジュールは、前記情報処理モジュールの処理結果に従って、ユーザの買い物行動を分析・予測するために用いられる。具体的なプロセスは次のとおりである。前記情報処理モジュールによって処理されたユーザ行動データに基づいて、前記情報分析モジュールは、ユーザIDに対応する買い物行動配列を作成し、次に、ユーザの買い物行動を分析・予測する。同じ性別および同じ年齢層のユーザの買い物行動データは、配列データベースを構成し、各ユーザIDは、特定の期間中のユーザのすべての買い物記録によって形成された順序付けられた配列に対応する。次に、配列データベースのマイニングを実行して、求められる、実用的な高効用の負の配列ルール、つまりユーザのニーズを満たす商品の推奨を取得する。前記表示モジュールは、商品ID、品番、数量、および単価を含むユーザへの推奨結果を表示するために用いられる。ユーザが満足している場合、それらをショッピングカートに追加する。それ以外の場合、推奨結果は破棄される。前記第2の情報送信モジュールは、前記商品推奨モジュールの処理結果を、送信ネットワークを介して前記商品販売モジュールに送信するために用いられる。
【0020】
前記商品販売モジュールは、順次接続された決済モジュール、在庫更新モジュール、および第3の情報送信モジュールを含む。
前記商品販売モジュールは、クラウドサーバーにセットアップされ、前記第3の情報送信モジュールは、前記商品推奨モジュールを接続するために用いられる。前記決済モジュールは、ユーザが決済のためにカウンターに行く間に、前記商品推奨モジュールの処理結果に従ってショッピングカート内の商品を決済するために用いられる。前記在庫更新モジュールは、注文が正常に決済された後、リアルタイムで商品在庫を更新するために用いられる。さらに、前記商品販売モジュールはユーザの今回の買い物行動データをキャッシュし、前記第3の情報送信モジュールを介して、買い物記録を前記商品推奨モジュールにリアルタイムでフィードバックする。このようにして、商品推奨モジュールのデータを最新の状態に維持し、システムによって推奨される結果がより正確になり、ユーザのニーズにより一致するようにすることができる。
【0021】
本発明において、好ましくは、前記伝送ネットワークは、有線ネットワーク、LAN、Wi-Fi、パーソナルネットワーク、または4G/5Gネットワークでありうる。
【0022】
本発明は、複雑なオフラインハードウェア構成を必要とせず、クラウドサーバーに商品推奨モジュールと商品販売モジュールの両方をセットアップしたため、シンプルで操作が容易なクラウド管理プラットフォーム設計を採用している。このように、オフラインストアのアウトレットは、個別のサーバーで構成する必要がなくなり、代わりに、システムのクラウド管理プラットフォームサーバーを直接レンタルすることで、データをアップロードおよびダウンロードし、情報クラウドデータストレージをいつでもどこでも取得できる。データ損失率を削減できるだけではなく、運用コストや不要な費用も削減できる。このシステムは、企業のデータセンターのファイアウォールまたは安全なホスティング場所のいずれかで、企業の内部プライベートクラウドに展開することもできる。既存のハードウェアおよびソフトウェアリソースを最大限に活用して、企業のコストを大幅に削減し、企業の既存のIT管理プロセスに影響を与えることなく、データ、セキュリティ、およびサービス品質を最も効果的に制御できる。
【0023】
以下に示すように、工程(1)~(7)を含む前記の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法を提供する。
【0024】
工程(1)において、前記情報抽出モジュールは、ユーザID、顔マーク、性別、年齢、タイムスタンプ、およびユーザが閲覧した商品マークを含むユーザ行動データをリアルタイムで抽出して保存する。その中で、顔マークには、眼鏡をかけるかどうか、目の座標位置が含まれる。
【0025】
工程(2)において、前記第1の情報送信モジュールは、工程(1)で述べたように情報収集モジュールによって抽出されたユーザ行動データを、送信ネットワークを介して前記商品推奨モジュールに送信する。
【0026】
工程(3)において、前記情報処理モジュールは、収集したユーザ行動データに対してデータクリーニングし、クリーニング後のデータを分類する。
【0027】
工程(4)において、前記分析処理モジュールは、前記情報処理モジュールの処理結果に基づいて、ユーザの買い物行動を分析・予測する。具体的なプロセスは次のとおりである。前記情報処理モジュールが処理するユーザ行動データに基づいて、前記情報分析モジュールは、ユーザIDに対応する買い物行動配列を作成し、次に、買い物行動を分析・予測する。同じ性別および同じ年齢層のユーザの買い物行動データは、配列データベースを構成し、各ユーザIDは、特定の期間中のユーザのすべての買い物記録によって形成された順序付けられた配列に対応する。次に、配列データベースのマイニングを実行して、求められる実用的な高効用の負の配列ルール、つまりユーザのニーズを満たす商品の推奨を取得する。
【0028】
工程(5)において、工程(4)で得られたユーザのニーズに沿った商品推奨に基づいて、前記表示モジュールは、商品ID、品番、数量、および単価を含むユーザの推奨結果を表示し、ユーザが満足している場合は、ショッピングカートに追加する。それ以外の場合、推奨結果は破棄される。
【0029】
工程(6)において、前記第2の情報送信モジュールは、前記商品推奨モジュールの処理結果を、送信ネットワークを介して前記商品販売モジュールに送信する。
【0030】
工程(7)において、ユーザが決済のためにカウンターに行く間、前記決済モジュールは、前記商品推奨モジュールの処理結果に従って、ショッピングカート内の商品を決済する。次に、前記在庫更新モジュールは、注文が正常に決済された後、リアルタイムで商品在庫を更新する。前記商品販売モジュールはまた、ユーザの今回の買い物行動データをキャッシュし、前記第3の情報送信モジュールを介して、前記商品推奨モジュールにリアルタイムで買い物記録をフィードバックする。
【0031】
本発明において、好ましくは、工程(3)において、実世界のデータには、不完全なでーたがほとんどで、ノイズが多く、一貫性がないため、ユーザ行動データが情報収集モジュールを介して収集されるときに、欠落、重複、および一貫性のないデータが発生する可能性がある。たとえば、ユーザC2とC3の間に情報のクロスが存在する。前記情報処理モジュールは、収集されたユーザ行動データに対してデータクリーニングする。具体的なプロセスは次に示す。欠落しているデータの場合、欠落しているデータの範囲が決定され、不要なフィールドが削除され、欠落しているコンテンツが入力される。重複データの場合は、他のデータを削除し、1つのみ残す。一貫性のないデータの場合は、データを補間する。
【0032】
本発明において、好ましくは、工程(3)において、ユーザの性別および年齢に基づいたデータのクリーンニング・分類は、以下のことをいう。同性および同年齢層のユーザの行動データでデータベースを構成し、異なる性別または異なる年齢層のユーザの行動データは、互いに独立した異なるデータベースを構成し、各データベースには、このタイプのユーザのすべての行動データが含まれている。たとえば、年齢が20~25歳の女性ユーザのデータベースには、以下に示すとおり、ユーザの買い物記録が含まれている。C1,2010.11.20,女性,21歳,チェーン付きのテクスチャードファッショナブルなハンドバッグ,ブラウン,数量1 ; C2,2010.11.21,女性,25歳,夏の花柄のドレス,青,数量1。
【0033】
本発明において、好ましくは、工程(4)において、前記情報分析モジュールは、AUNSRMアルゴリズムを介して以下に示す工程A~Bを経てユーザ行動データを分析・予測する。
【0034】
工程Aにおいて、高効用負の配列ルールマイニング方法のe-HUNSRアルゴリズムで効用配列データベースをマイニングして、高効用負の配列ルール即ちユーザの購入配列のなか、特定の値より大きいすべてのルールを取得し、且つ、各高効用負の配列ルールの効用と効用の信頼度を計算する。次に、高効用負ルールから取得した情報をそれぞれ2つのハッシュテーブルに格納する。1番目のハッシュテーブルのなか、key1は高効用負の配列ルールを表し、value1は対応する高効用負の配列ルールの効用を表し、2番目のハッシュテーブルのなか、key2は高効用負の配列ルールを表し、value2は対応する高効用負の配列ルールの効用の信頼度を表す。たとえば、高い効用の負の配列ルールR=a¬b⇒d(utility=1350,uconf=80%)の場合、効用配列データベースのなか、最初に商品aを購入し、次に商品bを購入せず、最後に商品dを購入したユーザの消費額は合計で1350人民元で、効用の信頼度は80%であることを表す。最小効用閾値が1000、最小効用の信頼度が60%であるという前提の下で、次のように結論が得られる。ユーザが商品aを購入し、商品bを購入していなかったことが判明された時に、当該ユーザに商品dをタイムリーに推奨した場合、80%の可能性でより高い利益を得る。
【0035】
本発明において、好ましくは、工程Aの高効用配列データベースは、工程(3)のデータ分類後に得られたデータベースから変換される。具体的な方法は以下に示す。まず、ユーザIDを主キーとして使用して、データベースからユーザIDを含むすべての買い物行動データを検索する。ここに、ユーザの買い物行動データは、タイムスタンプ、ユーザID、商品ID、数量、および単価を含む、前記第3の情報送信モジュールを介して前記商品販売モジュールにフィードバックするデータをいう。次に、買い物行動データを同じユーザIDで組み合わせする。つまり、タイムスタンプ(買い物時間)を削除し、ユーザIDを最初のフィールドとして保持し、ユーザが購入した商品IDと数を時系列に並べ替えて2番目のフィールドを構成する。各商品の単価は個別に保存される。このようにして、異なる性別および異なる年齢層に対応する高効用配列データベースが取得される。
【0036】
本発明において、好ましくは、工程Aにおいて、高効用負の配列ルールマイニング方法のe-HUNSRアルゴリズムで、以下に示す工程a~dを経て、効用配列データベースをマイニングして、高効用負の配列ルールを取得する。
【0037】
工程aにおいて、HUNSPMアルゴリズムを利用して、高効用配列データベースをマイニングし、すべての高効用の負の配列パターンを取得し、それらの効用を保存する。高効用負の配列パターンは、効用が最小効用閾値以上の高効用負の配列パターンをいう。たとえば<a¬bcd¬e>の効用を20とすると、最小効用が18に設定されている場合、高効用の負の配列パターンである。
【0038】
工程bにおいて、工程aで生成された高効用負の配列パターンに基づいてすべての候補ルールを取得する。高効用負の配列パターンを2つの部分、つまり前部と後部に分割する。たとえば、<a¬bcd¬e>に対応する候補ルールは、a⇒¬bcd¬e、a¬b⇒cd¬e、a¬bc⇒d¬e、a¬bcd⇒¬eである。
【0039】
工程cにおいて、前部または後部に1つの負のアイテムのみ含まれている候補ルールを削除する。たとえば、<a¬bcd¬e>に対応する候補ルールのうち、a¬bcd⇒¬eは、後部に1つの負のアイテムしか含まれていないため、削除する必要がある。他の候補ルールは保持される。
【0040】
工程dにおいて、残りの候補ルールの効用の信頼度を計算し、最小効用の信頼度閾値よりも大きい効用の信頼度を持つルールは、求められる高効用負の配列ルールである。
【0041】
工程Bにおいて、実用的な高効用負の配列ルールのフィルタリングについて、サポート、ルール包含条件、効用に基づき高効用負の配列ルールを対象にフィルタリングし、サポート、ルール包含条件、効用の順に各高効用負の配列ルールを、順番にフィルタリングし、以下に示す工程を含む。
【0042】
高効用負の配列ルールR=X⇒YとRi=Xi⇒Yiがあり、RとRiがそれぞれ2つの異なる高効用負の配列ルールを表すと仮定すると、XはRの前部を表し、YはRの後部を表す。同時に、XiはRiの前部を表し、YiはRiの後部を表す。次の3つの条件(1)、(2)、および(3)が満たされる場合、高効用負の配列ルールRは、Riに比べて実用的な高効用負の配列ルールである。すべてのRiを削除し、すべてのRを保持することにより、(1)、(2)、(3)の条件を満たすすべての実用的な高効用負の配列ルール即ちユーザのニーズを満たす商品推奨を取得する。
【0043】
条件(1):RとRiとはサポートが同じであること。
条件(2):R=X⇒YをRi=Xi⇒Yi比較した場合、Ri⊆R,X⊆Xi, Yi⊆Yであること。
条件(3):u(Ri) ≦u(R);u(Ri)はRiの効用であり、u(R)はRの効用であること。
【0044】
本発明において、さらに好ましくは、条件(1)におけるRのサポートは、式(I)に示す式で計算される。
【0045】
【数1】
【0046】
【0047】
Riのサポートは、式(II)に示す式で計算される。
【0048】
【数2】
【0049】
【0050】
本発明において、さらに好ましくは、条件(2)において、R=ac⇒be,Ri=ac⇒bと仮定し、<ac⇒b>⊆<ac⇒be>, ac⊆ac,b⊆beであり、そのなか、RとRiはそれぞれ2つの異なる高効用負の配列ルールを表し、acはRの前部を表し、beはRの後部を表し、acはRiの前部を表し、bはRiの後部を表し、すると、この2つのルールは条件(2)を満たす。
【0051】
本発明において、さらに好ましくは、条件(3)において、ルールR=X⇒Yについて、<e1e2e3…ei-1>が前部Xを表し、<ei…ek>が後部Yを表すと設定した場合、当該ルールはR=<e1e2e3…ei-1>⇒<ei…ek>と表される。ルールRの効用u(R)は式(III)に示す式で計算される。
【0052】
【数3】
【0053】
式(III)において、i=1,2,3…k、ei∈R、u(ei)=q(ei,R)×p(ei)、q(ei,R)はアイテムeiの内部効用を示し、p(ei)はeiの外部効用を示す。
【0054】
ルールRi=Xi⇒Yiについて、<e1e2e3…ej-1>が前部Xiを表し、<ej…ek>が後部Yiを表すと設定した場合、当該ルールはRi=<e1e2e3…ej-1>⇒<ej…ek>と表される。
ルールRiの効用u(Ri)は式(IV)に示す式で計算される。
【0055】
【数4】
【0056】
式(IV)において、j=1,2,3…k、ej∈Ri、u(ej)=q(ej,R) ×p(ej)であり、q(ej,R)はアイテムejの内部効用を示し、p(ej)はアイテムejの外部効用を示す。
【発明の開示】
【発明の効果】
【0057】
1.従来の高効用の負の配列ルールマイニングアルゴリズムは、特に多数のルールを取得でき、それらの多くは相互に矛盾するか冗長なルールであるため、実行には意味がなく、有用なルールを見つけるのをより困難にする。本発明は、事物間の統計的相関だけではなく、事物間の語義の意味も考慮に入れる、実用的な高効用負ルールマイニングアルゴリズム-AUNSRMアルゴリズムを提供して、多くの役に立たないルールを削除するし、 直接実行に使える、有意義なルールをより多く取得できる。これは、商品推奨行動分析の業界で、ユーザのフォローアップショッピング行動に対する科学的な意思決定サポートを提供できる。
2.本発明は、商品推薦行動の分析に適用され、商品タイプだけではなく商品価値にも注意を払うという商品推薦業界の特性に適応する。ユーザにアドバイスを提供するとき、本発明は、過去の買い物記録から興味深い規則を見つけ、ユーザのフォローアップ買い物行動を予測し、サポートを提供することができる。
【図面の簡単な説明】
【0058】
図1】本発明の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの構造ブロック図である。
【発明を実施するための形態】
【0059】
以下に、本発明に係る実施形態について図面を参照して説明するが、本発明は以下の実施例に限定されるものではない。
【実施例
【0060】
実施例1
図1に示されるとおり、伝送ネットワーク通信を介して情報収集モジュール、商品推奨モジュール、および商品販売モジュールを順次接続する、実用的な高効用負の配列ルールマイニングに基づく商品推奨システムである。
【0061】
情報収集モジュールは、順次接続された情報抽出モジュールと第1の情報送信モジュールとを含む。情報抽出モジュールは、ユーザID、顔マーク、年齢、性別、タイムスタンプ、およびユーザが閲覧した商品マークを含むユーザ行動データをリアルタイムで抽出して保存するために用いられる。第1の情報伝送モジュールは、ユーザの行動データを、伝送ネットワークを介して商品推奨モジュールに送信するために用いられる。
【0062】
商品推薦モジュールは、順次接続された情報処理モジュール、情報分析モジュール、表示モジュール、および第2の情報送信モジュールを含む。商品推薦モジュールはクラウドサーバーに配置され、第1の情報送信モジュールは情報処理モジュールに接続されている。実世界のデータには不完全データがほとんどで、ノイズが多く、一貫性がないため、情報処理モジュールは、収集されたユーザ行動データに対してデータクリーニング・分類するために用いられる。情報処理モジュールは、情報処理モジュールの処理結果に従って、ユーザの買い物行動を分析・予測するために用いられる。具体的なプロセスは次のとおりである。情報処理モジュールによって処理されたユーザ行動データに基づいて、情報分析モジュールは、ユーザIDに対応する買い物行動配列を作成し、次に、買い物行動を分析・予測する。同じ性別および同じ年齢層のユーザの買い物行動データは、配列データベースを構成し、各ユーザIDは、特定の期間中のユーザのすべての買い物記録によって形成された順序付けられた配列に対応する。次に、配列データベースのマイニングを実行して、求められる実用的な高効用の負の配列ルール即ちユーザのニーズを満たす商品推奨を取得する。表示モジュールは、商品ID、品番、数量、および単価を含むユーザへの推奨結果を表示するために用いられる。ユーザが満足している場合、それらをショッピングカートに追加する。それ以外の場合、推奨結果は破棄される。第2の情報送信モジュールは、商品推奨モジュールの処理結果を、送信ネットワークを介して商品販売モジュールに送信するために用いられる。
【0063】
商品販売モジュールは、順次接続された決済モジュール、在庫更新モジュール、および第3の情報送信モジュールを含む。商品販売モジュールは、クラウドサーバーにセットアップされ、第3の情報送信モジュールは、商品推奨モジュールを接続するために用いられる。決済モジュールは、ユーザが決済のためにカウンターに行く間に、商品推奨モジュールの処理結果に従ってショッピングカート内の商品を決済するために用いられる。そして、前述の在庫更新モジュールは、注文が正常に決済された後、リアルタイムで商品在庫を更新するために用いられる。さらに、商品販売モジュールはまた、今回、ユーザの買い物行動データをキャッシュし、第3の情報送信モジュールを介して、買い物記録を商品推奨モジュールにリアルタイムでフィードバックする。このようにして、商品推奨モジュールのデータを最新の状態に維持し、システムによって推奨される結果がより正確になり、ユーザのニーズにより一致するようにすることができる。
【0064】
伝送ネットワークは、有線ネットワーク、LAN、Wi-Fi、パーソナルネットワーク、または4G/5Gネットワークでありうる。
【0065】
本発明は、複雑なオフラインハードウェア構成を必要とせず、クラウドサーバーに商品推奨モジュールと商品販売モジュールの両方をセットアップしたため、シンプルで操作が容易なクラウド管理プラットフォーム設計を採用している。このように、オフラインストアのアウトレットは、個別のサーバーで構成する必要がなくなり、代わりに、システムのクラウド管理プラットフォームサーバーを直接レンタルすることで、データをアップロードおよびダウンロードし、情報クラウドデータストレージをいつでもどこでも取得できる。データ損失率を削減できるだけではなく、運用コストや不要な費用も削減できる。このシステムは、企業のデータセンターのファイアウォールまたは安全なホスティング場所のいずれかで、企業の内部プライベートクラウドに展開することもできる。既存のハードウェアおよびソフトウェアリソースを最大限に活用して、企業のコストを大幅に削減し、企業の既存のIT管理プロセスに影響を与えることなく、データ、セキュリティ、およびサービス品質を最も効果的に制御できる。
【0066】
実施例2
以下に示す工程(1)~(7)を含む、実施例1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法である。
【0067】
工程(1)において、情報抽出モジュールは、ユーザID、顔マーク、性別、年齢、タイムスタンプ、およびユーザが閲覧した商品マークを含むユーザ行動データをリアルタイムで抽出して保存する。その中で、顔マークには、眼鏡をかけるかどうか、目の座標位置が含まれる。
【0068】
工程(2)において、第1の情報送信モジュールは、工程(1)で述べたように情報収集モジュールによって抽出されたユーザ行動データを、送信ネットワークを介して商品推奨モジュールに送信する。
【0069】
工程(3)において、情報処理モジュールは、収集したユーザ行動データに対してデータクリーニング・分類する。
【0070】
工程(4)において、分析モジュールは、情報処理モジュールの処理結果に基づいて、ユーザの買い物行動を分析・予測する。具体的なプロセスは次のとおりである。情報処理モジュールが処理するユーザ行動データに基づいて、情報分析モジュールは、ユーザIDに対応する買い物行動配列を作成し、次に、買い物行動を分析・予測する。同じ性別および同じ年齢層のユーザの買い物行動データは、配列データベースを構成し、各ユーザIDは、特定の期間中のユーザのすべての買い物記録によって形成された順序付けられた配列に対応する。次に、配列データベースのマイニングを実行して、求められる実用的な高効用の負の配列ルール、つまりユーザのニーズを満たす商品の推奨を取得する。
【0071】
工程(5)において、工程(4)で得られたユーザのニーズに沿った商品推奨に基づいて、前記表示モジュールは、商品ID、品番、数量、および単価を含むユーザの推奨結果を表示し、ユーザが満足している場合、ショッピングカートに追加する。それ以外の場合、推奨結果は破棄される。
【0072】
工程(6)において、第2の情報送信モジュールは、商品推奨モジュールの処理結果を、送信ネットワークを介して商品販売モジュールに送信する。
【0073】
工程(7)において、ユーザが決済のためにカウンターに行く間、決済モジュールは、商品推奨モジュールの処理結果に従って、ショッピングカート内の商品を決済する。次に、在庫更新モジュールは、注文が正常に決済された後、リアルタイムで商品在庫を更新する。商品販売モジュールはまた、ユーザの今回の買い物行動データをキャッシュし、第3の情報送信モジュールを介して、商品推奨モジュールにリアルタイムで買い物記録をフィードバックする。
【0074】
実施例3
以下に示す工程(1)~(7)を含む、実施例1に記載の実用的な高効用負の配列ルールマイニングに基づく商品推奨システムの動作方法である。
【0075】
実施3において、ショッピングモールのオフラインストアで販売されたスナックのショッピングデータレコードを実験データとして使用する。 表1と表2は、前処理と整理が行われたユーザの買い物行動データ後の効用配列データベースと効用表の結果の一部をそれぞれ示している。
【0076】
【表1】
【0077】
【表2】
【0078】
工程(3)において、実世界のデータには不完全データがほとんどで、ノイズが多く、一貫性がないため、ユーザ行動データが情報収集モジュールを介して収集されるときに、欠落、重複、および一貫性のないデータが発生する可能性がある。たとえば、ユーザC2とC3の間に情報のクロスが存在する。前記情報処理モジュールは、収集されたユーザ行動データに対してデータクリーニングする。具体的なプロセスは次に示す。欠落しているデータの場合、欠落しているデータの範囲が決定され、不要なフィールドが削除され、欠落しているコンテンツが入力される。重複データの場合は、他のデータを削除し、1つだけ残す。一貫性のないデータの場合は、データを補間する。
【0079】
工程(3)において、ユーザの性別および年齢に基づいたデータのクリーンニング・分類は、以下のことをいう。同性および同年齢層のユーザの行動データでデータベースを構成し、異なる性別または異なる年齢層のユーザの行動データは、互いに独立した異なるデータベースを構成し、各データベースには、このタイプのユーザのすべての行動データが含まれている。たとえば、年齢が18~22歳の女性ユーザのデータベースには、以下に示すとおり、ユーザの買い物記録が含まれている。C1、2019.10.20,女性,20歳,干しイチゴ,1000g;C2,2020.1.14,女性,22歳,ピリ辛味干し豆腐,2000g。
【0080】
工程(4)において、前記情報分析モジュールは、以下に示す工程A~Bを経て、AUNSRMアルゴリズムを介してユーザ行動データを分析・予測し、最小効用閾値min_util=300、最小効用の信頼度min_uconf=0.55である。
【0081】
工程Aにおいて、高効用負の配列ルールマイニング方法のe-HUNSRアルゴリズムで効用配列データベースをマイニングして、高効用負の配列ルール即ちユーザの購入配列のなか、特定の値より大きいすべてのルールを取得し、且つ、各高効用負の配列ルールの効用と効用の信頼度を計算する。次に、高効用負ルールから取得した情報をそれぞれ2つのハッシュテーブルに格納する。1番目のハッシュテーブルのなか、key1は高効用負の配列ルールを表し、value1は対応する高効用負の配列ルールの効用を表し、2番目のハッシュテーブルのなか、key2は高効用負の配列ルールを表し、value2は対応する高効用負の配列ルールの効用の信頼度を表す。たとえば、高い効用の負の配列ルールR=a¬b⇒d(utility=1350,uconf=80%)の場合、効用配列データベースのなか、最初に商品aを購入し、次に商品bを購入せず、最後に商品dを購入したユーザの消費額は合計で1350人民元で、効用の信頼度は80%であることを表す。最小効用閾値が1000、最小効用の信頼度が60%であるという前提の下で、次のように結論が得られる。ユーザが商品aを購入し、商品bを購入していなかったことが判明されたときに、当該ユーザに商品dをタイムリーに推奨した場合、80%の可能性でより高い利益を得る。
【0082】
工程Aにおいて、高効用配列データベースは、工程(3)のデータ分類後に得られたデータベースから変換される。具体的な方法は以下に示す。まず、ユーザIDを主キーとして使用して、データベースからユーザIDを含むすべての買い物行動データを検索する。ここに、ユーザの買い物行動データは、タイムスタンプ、ユーザID、商品ID、数量、および単価を含む、前記第3の情報送信モジュールを介して前記商品販売モジュールにフィードバックするデータをいう。次に、買い物行動データを同じユーザIDで組み合わせする。つまり、タイムスタンプ(買い物時間)を削除し、ユーザIDを最初のフィールドとして保持し、ユーザが購入した商品IDと数を時系列に並べ替えて2番目のフィールドを構成する。各商品の単価は個別に保存される。このようにして、異なる性別および異なる年齢層に対応する高効用配列データベースが取得される。
【0083】
以下に、ユーザの買い物行動データから効用配列データベースを取得する方法を例に示す。 表1は、トランザクションID、トランザクション時間、ユーザID、商品、数量、および単価をキーワードとしてソートされたトランザクションデータベースを示している。 このようなトランザクションデータベースでは、トランザクションはショッピングレコードを表し、単一のアイテムはユーザが購入した商品を表し、アイテム属性の文字は商品IDを記録する。 たとえば、T3は、ユーザC3が2019年12月4日の8:02:12に商品b5つと商品e3つを購入したことを示しす。ここに、商品bと商品eの単価はそれぞれ5と6である。
【0084】
ユーザの買い物行動データを含むトランザクションデータベースを、時間順に効用配列データベースに変換する。 たとえば、表3のトランザクションデータベースを表4の配列データベースと表5のユーティリティテーブルに変換する。
【0085】
【表3】
【0086】
【表4】
【0087】
【表5】
【0088】
表4では、特定の期間におけるユーザのすべての買い物記録が、<>で示される順序付けられたシーケンスを形成している。配列では、アイテム/要素は時系列になっている。各アイテムは商品を表し、各要素は、{}で表される特定の時点でユーザが同時に購入した商品を指す。たとえば、{(c、3)(e、5}は、ユーザが3つの商品cと5つの商品eを同時に購入したことを表す。各アイテムの後には、商品の数量を表す内部効用と呼ばれる番号が続き、ユーザがその時点で購入したものであり、各アイテムには単位効用(外部効用)と呼ばれる独自の値もある。たとえば、表5に示すように、1つの商品aは9元の価値がある。
【0089】
工程Aにおいて、高効用負の配列ルールマイニング方法およびe-HUNSRアルゴリズムによる効用配列データベースからの高効用負の配列ルールマイニングは、以下に示すとおり、工程a~dを含む。
【0090】
工程aにおいて、HUNSPMアルゴリズムを利用して、高効用配列データベースをマイニングし、すべての高効用の負の配列パターンを取得し、それらの効用を保存する。高効用負の配列パターンは、効用が最小効用閾値以上の高効用負の配列パターンをいう。たとえば<a¬bcd¬e>の効用を20とすると、最小効用が18に設定されている場合、高効用の負の配列パターンである。
【0091】
工程bにおいて、工程aで生成された高効用負の配列パターンに基づいてすべての候補ルールを取得する。高効用負の配列パターンを2つの部分、つまり前部と後部に分割する。たとえば、<a¬bcd¬e>に対応する候補ルールは、a⇒¬bcd¬e、a¬b⇒cd¬e、a¬bc⇒d¬e、a¬bcd⇒¬eである。
【0092】
工程cにおいて、前部または後部に1つの負のアイテムのみ含まれている候補ルールを削除する。たとえば、<a¬bcd¬e>に対応する候補ルールのうち、a¬bcd⇒¬eは、後部に1つの負のアイテムしか含まれていないため、削除する必要がある。他の候補ルールは保持される。
【0093】
工程dにおいて、残りの候補ルールの効用の信頼度を計算し、最小効用の信頼度閾値よりも大きい効用の信頼度を持つルールは、求められる高効用負の配列ルールである。
【0094】
表6は、高効用負の配列ルールの一部と、それらの効用および効用の信頼度を示している。たとえば、高効用負の配列ルールR = <クルミカーネル¬ロピリ辛味干し豆腐>ロ>⇒<<ピーカンナッツ>(効用 = 534、uconf = 0.64)では、当該効用配列データベースのユーザがまずクルミカーネルを購入し、次にピリ辛味干し豆腐を購入せず、最後にピーカンナッツとクルミカーネルを購入して、合計534 CNYを費やしたことが示される。効用の信頼度は0.64である。最小効用が300、最小効用の信頼度が55%であるという前提の下で、次のように結論付けることができる。ユーザがクルミカーネルを購入し、ピリ辛味干し豆腐を購入していなかったことが判明されたときに、ピーカンナッツとクルミカーネルをタイムリーにお客様に推奨した場合、64%の確率でより高い利益を得ることができる。効用データベースは、データ分類後に取得されたデータベースから変換される。具体的な方法は次のとおり。まず、ユーザIDを主キーとしてデータベースからユーザIDを含むすべての買い物行動データを検索する。次に、買い物行動データを同じユーザIDで組み合わせする。つまり、タイムスタンプ(ショッピング時間)を削除し、ユーザIDを保持し、ユーザが購入した商品をIDと数量で時系列に並べ替えて2番目のフィールドを構成する。こうようにして、異なる性別および異なる年齢間隔に対応する効用配列データベースが得られる。
【0095】
【表6】
【0096】
工程Aで取得した高効用負の配列ルールをハッシュテーブルに格納する。Key値は高効用負の配列ルールを表し、value値は対応する効用と効用の信頼度を表す。
【0097】
工程Bにおいて、実用的な高効用負の配列ルールのフィルタリングについて、サポート、ルール包含条件、効用に基づき高効用負の配列ルールを対象にフィルタリングし、サポート、ルール包含条件、効用の順に各高効用負の配列ルールを、順番にフィルタリングし、以下に示す工程を含む。
【0098】
高効用負の配列ルールR=X⇒YとRi=Xi⇒Yiがあり、RとRiがそれぞれ2つの異なる高効用負の配列ルールを表すと仮定すると、XはRの前部を表し、YはRの後部を表す。同時に、XiはRiの前部を表し、YiはRiの後部を表す。次の3つの条件(1)、(2)、および(3)が満たされる場合、高効用負の配列ルールRは、Riに比べて実用的な高効用負の配列ルールである。すべてのRiを削除し、すべてのRを保持することにより、(1)、(2)、(3)の条件を満たす、すべての実用的な高効用負の配列ルール即ちユーザのニーズを満たす商品推奨を取得する。
【0099】
条件(1):RとRiとはサポートが同じであること。
条件(2):R=X⇒YをRi=Xi⇒Yi比較した場合、Ri⊆R,X⊆Xi, Yi⊆Yであること。
条件(3):u(Ri) ≦u(R)、u(Ri)はRiの効用であり、u(R)はRの効用であること。
【0100】
以下に示す例で詳しく説明する。ルールR1:〈a¬be〉⇒〈c d〉およびR2〈a¬be〉⇒〈c〉の場合、R1とR2は工程(1)ではサポートが同じであって、工程(2)に進む。工程(2)では、R2 ⊆R1R1、R1の前部がR2の前部に含まれ、つまりa¬be⊆a¬beであり、R1の後部はR2の後部を含み、つまりc⊆c dであって、工程(3)に進む。工程(3)では、R1はR2よりも大きな効用を持っいる。以上からして、R1はR2に比べて実行可能なルールであることで、R2は削除され、R1は保持され、R2とに類似しているルールはすべて削除され、R1に類似しているルールはすべて保持される。そして、すべてのR1によって形成された実用的な高効用負の配列ルールは、求められる、ユーザに商品を直接推奨できるようルールである。
【0101】
条件(1)におけるRのサポートは、式(I)に示す式で計算される。
【0102】
【数5】
【0103】
【0104】
Riのサポートは、式(II)に示す式で計算される。
【0105】
【数6】
【0106】
【0107】
条件(2)において、R=ac⇒be,Ri=ac⇒b,と仮定し、〈ac⇒b〉⊆〈ac⇒be, ac⊆ac,b⊆beだり、そのなか、RとRiはそれぞれ2つの異なる高効用負の配列ルールを表し、acはRの前部を表し、beはRの後部を表し、acはRiの前部を表し、bはRiの後部を表し、すると、この2つのルールは条件(2)を満たす。
ルールR=X⇒Yについて、〈e1e2e3…ei-1〉が前部Xを表し、〈ei…ek〉が後部Yを表すと設定した場合、当該ルールはR=〈e1e2e3…ei-1〉⇒〈ei…ek〉と表され、
ルールRの効用u(R)
【0108】
条件(3)において、ルールR=X⇒Yについて、〈e1e2e3…ei-1〉が前部Xを表し、〈ei…ek〉が後部Yを表すと設定した場合、当該ルールはR=〈e1e2e3…ei-1〉⇒〈ei…ek〉と表される。
ルールRの効用u(R)は式(III)に示す式で計算される。
【0109】
【数7】
【0110】
式(III)において、i=1,2,3…k、ei∈R、u(ei)=q(ei,R)×p(ei)、q(ei,R)はアイテムeiの内部効用を示し、p(ei)はeiの外部効用を示す。
【0111】
ルールRi=Xi⇒Yiのなか、〈e1e2e3…ej-1〉が前部Xiを表し、〈ej…ek〉が後部Yiを表すと設定した場合、当該ルールはRi=〈e1e2e3…ej-1〉⇒〈ej…ek〉と表される。
ルールRiの効用u(Ri)は式(IV)に示す式で計算される。
【0112】
【数8】
【0113】
式(IV)において、j=1,2,3…k、ej∈Ri、u(ej)=q(ej,R) ×p(ej)であり、q(ej,R)はアイテムejの内部効用を示し、p(ej)はアイテムejの外部効用を示す。
【0114】
【0115】
【表7】
【0116】
擬似コード
INPUT:効用配列データベース (D),最小効用閾値(min_utility),最小効用の信頼度閾値(min_uconf);
OUTPUT: 実用的な高効用配列ルール (AUNSRs)
(1) e-HUNSRアルゴリズムによるすべての高効用負の配列ルール((HUNSRs))のマイニング;
(2) AUNSRset←(HUNSRs);
(3) FOR(Ri:Xi⇒Yiand Ri+1:Xi+1⇒Yi+1inAUNSRset){
(4) IF(supp(Ri)=supp(Ri+1)){ //工程(1)
(5) IF(Ri+1⊆Ri∩Xi⊆Xi+1∩Yi+1⊆Yi){// 工程(2)
(6) IF(u(Ri+1) ≦u(Ri)){// 工程(3)
(7) Eliminate Ri+1
(8) }END OF LINE(6)
(9) }END OF LINE(5)
(10) }END OF LINE(4)
(11) }END FOR
(12) Return AUNSRset;
【0117】
工程 (1)において、 e-HUNSRアルゴリズムによるすべての高効用負の配列ルールをマイニングし、
工程 (2)において、すべての高効用負の配列ルールをセットAUNSRsetに格納し、
工程 (4)において、サポートに従ってルールをフィルタリングし、
工程 (5) において、ルールの包含基準に従ってルールをフィルタリングし、
工程 (6) において、効用に従ってルールをフィルタリングし、
工程 (7) において、冗長なルールを削除し、
工程 (12)において、 セットAUNSRsetを返す。

図1