(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0013】
本発明は、プロセス、装置、システム、合成物、コンピュータ読み取り可能なストレージ媒体に実装されたコンピュータプログラム製品、並びに/又は結合先のメモリに記憶された命令及び/若しくは結合先のメモリによって提供される命令を実行するように構成されるプロセッサなどのプロセッサのような、数々の形態で実現することができる。本明細書では、これらの実現形態、又は本発明がとりえるその他のあらゆる形態が、技術と称されてよい。総じて、開示されたプロセスのステップの順序は、本発明の範囲内で変更されてよい。別途明記されない限り、タスクを実施するように構成されるものとして説明されるプロセッサ又はメモリなどのコンポーネントは、所定時にタスクを実施するように一時的に構成される汎用コンポーネントとして、又はタスクを実施するように製造された特殊コンポーネントとして実装されてよい。本明細書で使用される「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成される1つ以上のデバイス、回路、並びに/又は処理コアを言う。
【0014】
本発明の原理を例示した添付の図面とともに、以下で、本発明の1つ以上の実施形態の詳細な説明が提供される。本発明は、このような実施形態との関わりのもとで説明されるが、いずれの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定され、本発明は、数々の代替形態、変更形態、及び均等物を包含している。以下の説明では、本発明の完全な理解を与えるために、数々の具体的詳細が明記されている。これらの詳細は、例示を目的として提供され、本発明は、これらの詳細の一部又は全部を伴わずとも、特許請求の範囲にしたがって実施されえる。明瞭さを期するために、本発明に関係する技術分野で知られる技術要素は、本発明が不必要に不明瞭にされないように、詳細な説明を省略されている。
【0015】
本出願は、ユーザ行動カテゴリと、ユーザ行動カテゴリに対応するユーザ行動度数とを決定し、これらの統計結果を既定の閾値と比較して悪意のある行動や不正な行動などの「虚偽データ」をフィルタ除去し、次いで、上記の最適化されたユーザ行動データを基にしてユーザ嗜好分析を実施し、そして、この分析から得られたユーザ嗜好特色を基にして適切な内容情報の推薦を行う。
【0016】
本出願の実施形態は、履歴ユーザ行動カテゴリと、これらのカテゴリに対応する度数とを既定の閾値と比較することによって、疑わしい(例えば、異常な、不正な、及び悪意のある)データを履歴ユーザ行動から排除する。ユーザ嗜好分析は、この処理されたデータを基にして実施される。内容情報の推薦は、この分析から得られたユーザ嗜好データによって行われる。その結果、ユーザ行動データから得られたユーザ嗜好は、より正確であるのが通常であり、ユーザの実際のニーズ及び期待を真に反映させており、より優れた推薦結果をもたらし、より高い成功率を電子商取引情報取引において有することができる。推薦された製品情報がユーザの実際のニーズ及び希望に一致するときは、ユーザは、必要な製品情報を繰り返し探索する必要はなく、電子商取引プラットフォームによって推薦される情報に依存して自身の取引を完了させることができ、したがって、製品情報を繰り返し探索することで生じる電子商取引プラットフォーム上で必要な処理量を低減させる。また、本出願による最適化は、ユーザ行動データからの多量の「虚偽データ」を排除しているので、情報推薦分析で使用されるデータ量が減り、情報推薦分析が実施される速度が増す。したがって、より迅速に推薦情報が得られる。
【0017】
当業者が本発明の特徴及び技術内容に関する更なる理解を得ることを可能にするために、図面及び実施形態に照らして本出願の技術的構想の詳細な説明が以下で提示される。
【0018】
電子商取引情報取引プラットフォームは、買い手と売り手とが直に話し合う必要なく取引を完了させることができる模擬市場である。取引の成功は、売り手が何を購入したいか、及びそれが売り手が供給する内容にどれだけ厳密に一致するかによって判断される。売り手は、製品情報を能動的に供給することによって、その露出率及び取引成功可能性を高めることができる。しかしながら、売り手によって供給される内容が、買い手のニーズからずれ過ぎていると、その売り手は、非常に乏しい結果に終わるだろう。したがって、取引成功率を上げるためには、売り手によってとられる販促行為が、ユーザの行動や嗜好などの分析に基づいている必要があるのが一般的である。このような分析は、ユーザ履歴行動データ、ユーザ属性データ、及び同様なその他の内容などの多量のユーザ情報の事前収集を必要とする。ユーザ情報は、特定の内容情報についての傾向予測データを作成するトレーニングのために使用される。次いで、特定のユーザにどのようにして適切な内容情報を推薦するかを判断するために、その特定のユーザのユーザ嗜好が傾向予測データと突き合わされる。ユーザ嗜好の分析は、総じて、ユーザ履歴行動データに基づく。ユーザ履歴行動は、ユーザの購入願望を反映している。例えば、或るユーザの行為が、或る期間内に集中しており、すなわち高い度数で生じており、これらの行為の標的(ターゲット、対象)にされる内容情報が、特定の製品に集中しているとすると、これは、この期間内におけるユーザの嗜好が、これらの製品に対してであることを示している。ユーザは、これらの製品を購入する可能性が非常に高く、この嗜好に一致する製品情報を情報提供者が提供することができれば、取引成功率は、必然的に上がる。
【0019】
しかしながら、本出願の背景で論じられたように、一部のユーザの履歴行動データは、信憑性がないかもしれず、「虚偽データ」であるかもしれない。例えば、多くのユーザが、特定の期間内に特定の製品に注意を払うかもしれない。これは、その製品がその期間中の流行の製品であることを示していると考えられる。ユーザの個人的嗜好は、大衆消費動向によって影響されるので、その製品の情報には、個々のユーザ嗜好が向けられ、結果として、その製品を扱う売り手にとってかなりの利益になる。利益の奪い合いのなかで、一部の売り手は、このユーザ心理を掌握し、ユーザのふりをして特定の期間内に特定の行為を大規模に繰り返し、消費動向を誘発させようとする。このような虚偽データは、このようなユーザの履歴行動データのなかに現れる。このようなデータに基づくユーザ嗜好分析は、歪められており、推薦される内容情報をユーザの真のニーズからずれさせ、そうして取引成功率を低下させる。また、ユーザ嗜好の分析は、大量の履歴ユーザ行動データに基づく必要があるゆえに、また、一部の売り手が、悪意をもってユーザのふりをして特定の期間内に特定の行為を大規模に繰り返すゆえに、結果として、ユーザ嗜好分析の基になる履歴行動データの量が増加し、ユーザ嗜好分析の低速化がもたらされる。本出願の実施形態は、ユーザ行動に基づいて電子商取引情報を推薦する技術を提供する。一部の実施形態では、この技術は、履歴ユーザ行動データを最適化して、ユーザの興味及び願望を真に反映していない虚偽データ又はその他のデータなどのあらゆる異常データをフィルタ除去することを含む。
【0020】
図1は、電子商取引情報推薦システムの一実施形態を示したシステム図である。システム100は、クライアントデバイス102と、ネットワーク104と、推薦エンジンサーバ106と、データベースとを含む。ネットワーク104は、任意の高速データネットワーク及び/又は電気通信ネットワークを含む。
【0021】
クライアントデバイス102は、ユーザがそれを通じてウェブサイトにアクセス可能であるウェブブラウザなどのアプリケーションを実行させるように構成される。様々な実施形態において、ユーザは、ユーザがそこで内容情報推薦を受信可能である電子商取引ウェブサイトにアクセスするために、クライアントデバイス102を使用する。デバイス102の例は、デスクトップコンピュータ、ラップトップコンピュータ、携帯型端末、スマートフォン、タブレット、モバイル機器、又はクライアントアクセスをサポートするその他の任意のハードウェア/ソフトウェアの組み合わせを含む。
【0022】
推薦エンジンサーバ106は、ユーザ行動データに基づいて内容情報を決定するように構成される。図に示されるように、データベース108は、ユーザについてのユーザ行動データを電子商取引プラットフォームに記憶させるために及びそれを分析のために推薦エンジンサーバに提供するために使用される。
【0023】
図2は、ユーザ行動に基づいて電子商取引情報を推薦するためのプロセスの一実施形態を示したフローチャートである。プロセス200は、
図1の100などのシステム上で実行に移すことができる。プロセス200は、以下を含む。
【0024】
ステップ202:既定の期間内におけるユーザ行動カテゴリと、このユーザ行動カテゴリに対応するユーザ行動度数とを決定する。
【0025】
一部の実施形態では、ユーザ嗜好データの取得は、ユーザの履歴行動の分析に基づく。分析は、参照期間、すなわち既定の期間の選択を前提とする。この既定の期間の長さは、ユーザ嗜好分析の結果に影響を及ぼす。選択されるユーザ行動カテゴリ及びユーザ行動度数の量は、既定の期間の長さにしたがって変動する。結果として得られるユーザ嗜好も、大幅に変動するだろう。総じて、長すぎる既定の期間を選択することは最善でない。長すぎ場合、そのような期間は、ユーザ嗜好における変遷の特性及び微妙な変化を正確に反映させることができないだろう。或いは、短すぎる場合、ユーザ嗜好は、代表的なものにならないだろう。一部の実施形態では、既定の期間として30日が使用され、これは、適切な量のデータが収集されるかどうかに応じて更に長く又は更に短く調節することが可能である。
【0026】
既定の期間が決定されたら、この既定の期間内におけるユーザ行動カテゴリと、これらのユーザ行動カテゴリに対応するユーザ行動度数とに対して統計的分析が実施される。本明細書で使用されるユーザ行動カテゴリとは、電子商取引プラットフォームのユーザによって実施される行為のタイプを言う。一部の実施形態では、ユーザ行動カテゴリとして、検索行為(例えばキーワード検索)、(例えばウェブサーバによって提供される閲覧機能を使用した)閲覧行為、(例えば商品詳細を見るために特定の商品をクリックする)選択、(例えば商品を欲しい物リストに保存する)保存行為、(例えば
商品を実際に買う)購入行為、(例えば製品レビューを作成する)レビュー行為などが挙げられるが、これらに限定はされない。(特に、プラットフォームが大きく且つユーザデータが沢山ある)一部の実施形態では、より細かくユーザ行動カテゴリを分けることができる。例えば、文学作品の検索と、旅行本の検索と、園芸用品の検索とが、別々のユーザ行動カテゴリとして定められる。実際のカテゴリは、システム管理者によって、又は事前に設定された構想にしたがって定めることができる。
【0027】
本明細書で使用されるユーザ行動度数という用語は、既定の期間内に特定のカテゴリのユーザ行動が発生した回数を言う。以下で説明される例では、既定の期間T内に5つの行動カテゴリが数えられたと想定される。この例では、5つの行動カテゴリact1、act2、act3、act4、及びact5は、検索行為、選択行為、保存行為、購入行為、及びレビュー行為にそれぞれ対応する。特定のユーザについて、これら5つのカテゴリに対応するユーザ行動度数は、それぞれf1、f2、f3、f4、及びf5である。虚偽データなどの異常データの存在ゆえに、上述された5つのユーザ行動カテゴリの一部は、ユーザの行動を真に表していないかもしれない。
【0028】
ステップ204:ユーザ行動カテゴリの数が既定のカテゴリ閾値を超えるかどうかを決定する。超える場合には、ユーザ行動カテゴリは、ユーザの嗜好を予測するものではない異常行為を含んでいるかもしれない。このような行為は、ユーザ行動嗜好データを確立するときに、除外されるべきである。そうでないと、このような行為は、嗜好データを基にして行われる推薦の推薦結果に影響を及ぼすだろう。不正データを排除する基になるのは、既定のカテゴリ閾値である。この既定の閾値は、特定の期間中における多量のユーザ行為を分析することから導き出される統計データであってよい。これは、また、実際の動作から導き出される経験的推定値であってもよい。例えば、オペレータによる観察又はシステムによる統計的決定によって、システムのユーザは、30日の期間内に4つ以下の活動カテゴリに携わるのが通常であるとされてよく、したがって、既定のカテゴリ閾値は、θ
活動閾値=4ユーザ行動カテゴリである。閾値は、推薦結果にしたがって調整することができる。
【0029】
ユーザ行動カテゴリの数が閾値を超えない場合には、制御は、ステップ208に移される。そうでない場合には、ステップ206において、保持されるユーザ行動カテゴリの数が既定のカテゴリ閾値に等しくなるように、1つ以上の余分なユーザ行動カテゴリがフィルタ除去される(例えば排除される)。ユーザが5つのユーザ行動カテゴリに携わっており、しかしながら、既定の閾値が4であるならば、これらのユーザ行動カテゴリのうちの1つは、ユーザの嗜好を予測するものではない異常行為を含む可能性が高く、フィルタ処理されるべきである。
【0030】
異なる実施形態では、異なるフィルタ処理基準が使用される。一部の実施形態では、行動カテゴリは、日付によってソートされ、最も古い行動を含むカテゴリは、それがユーザ嗜好に及ぼす影響に関して既に「期限切れ」であろうゆえに、最初にフィルタ除去することができる。例えば、ユーザが、30日期間の最初の方の数日中に幾つかの検索を行ったがその後は何の検索も実施しなかった場合、そのユーザは、探していたその何かを見つけることに対してもう興味を持っていないかもしれず、したがって、その検索カテゴリは、フィルタ除去される。どのカテゴリが最も古いかをどのようにして決定するかの詳細が、以下で説明される。一部の実施形態では、最も高い度数を有するユーザ行動カテゴリが、その最も高い度数のユーザ行動が不正行動を表す可能性があるゆえに、フィルタ除去される。例えば、ユーザが、突然多くの製品レビューを投稿し始めたると、この行動は、不正であるかもしれず、フィルタ除去されるべきである。一部の実施形態では、フィルタ処理技術は、適切な数の余分なカテゴリをフィルタ排除して所望の数のカテゴリを保持するために、複数回にわたって適用される。一部の実施形態では、ユーザ行動カテゴリは、日付又は度数によってソートされ、閾値の数のカテゴリを実現するために、最も古い又は最も高度数の幾つかのカテゴリがフィルタ除去される。その他の実施形態では、日付及び度数以外に、その他の基準が適用可能である。
【0031】
一部の実施形態では、更なるフィルタ処理が随意に実施される。随意のフィルタ処理は、ステップ206のフィルタ処理に先立って、続いて、又は並行して起きることができる。例えば、一部の実施形態では、異常であると見なされたユーザ行動度数(例えば、正常な発生率に相当する何らかの既定の閾値と比較して異常に高い又は低い発生度数)が、随意にフィルタ除去される。一部の実施形態では、異常に高い又は異常に低いと見なされたユーザ行動度数が、閾値に置き換えられる。
【0032】
ステップ208:残りのユーザ行動カテゴリと、それらに対応するユーザ行動度数とにしたがって、ユーザ行動の標的にされる内容情報を分析し、ユーザ嗜好データを決定する。この例では、ユーザ嗜好データは、各内容情報の度数分布を含む。
【0033】
(例えば、本を買う、製品を買い物カゴに入れる、製品レビューを書く、製品を検索するなどの)いずれのユーザ行為も、1つ以上の行為標的に対応している。行為標的は、ユーザ行為が向けられる対象となる内容情報である。この内容情報は、単一情報であってよい、又は複合情報であってよい。例えば、ユーザが、電子商取引プラットフォーム内で製品を検索する。ユーザ行動カテゴリは、したがって、「検索行為」である。この検索行為の標的にされる内容情報は、製品であり、具体的には、検索行為を実施しているユーザが興味を持っている製品に関連付けられた製品の価格帯、製品の送料、製品が分類される製品カテゴリ、製品の生産者、製品の認定情報などの1つ以上の属性である。各属性は、したがって、1つのタイプの内容情報にそれぞれ対応している。別の例として、ユーザが、製品の製品レビューを提供するときは、このユーザは、その製品の送料又は製品生産者情報には関心を持っていないのが一般的である。したがって、標的内容情報は、製品カテゴリ及び価格帯を含む。ユーザ行動と標的内容情報との間には、多くの様々な対応付けが可能である。一部の実施形態では、各タイプのユーザ行動に対応する標的内容情報は、経験的に決定され、変更されることがある。一部の実施形態では、属性/内容情報タイプは、より細かく分けることができる。例えば、異なる製品生産者が、異なる内容情報タイプに対応することができる、異なる製品カテゴリが、異なる内容情報タイプに対応することができるなどである。
【0034】
上述された例において、5つあるユーザ行動カテゴリのうち、act1に対応するカテゴリがフィルタ除去されると想定する。更に、5つの内容情報C1、C2、C3、C4、及びC5が、製品カテゴリ、製品生産者、製品価格帯、製品送料、及び製品格付けにそれぞれ対応すると想定する。ユーザは、異なる状況のなかで異なる行為を実施して異なる結果を得るので、各行為は、異なる内容情報を標的にすることができる。Act2は、3つの内容情報C1、C2、及びC3を標的にする(例えば、この場合は、製品を保存する行為が、製品カテゴリ、製品生産者、及び製品価格帯を標的にし、送料又は製品格付けを標的にしない)。Act2の標的にされるこれら3つの内容情報の度数は、f21、f22、及びf23としてそれぞれ記される。Act2についての度数分布データは、act2(C1[f21]、C2[f22]、C3[f23])で表される。Act3は、内容情報C1、C2、C3、C4、及びC5を標的にし、act3についての度数分布データは、act3(C1[f31]、C2[f32]、C3[f33]、C4[f34]、C5[f35])で表される。Act4は、内容情報C2、C3、及びC5を標的にし、act4についての度数分布データは、act4(C2[f42]、C3[f43]、C5[f45])で表される。Act5は、内容情報C2、C3、C4、及びC5を標的にし、act5についての度数分布データは、act5(C2[f52]、C3[f53]、C4[f54]、C5[f55])で表される。したがって、5つの内容情報についての度数分布は、fc1=f21+f31、fc2=f22+f32+f42+f52、fc3=f23+f33+f43+f53、fc4=f34+f54、fc5=f35+f45+f55である。これらの値は、表1に示される。
【表1】
【0035】
図3は、5つの内容情報C1〜C5の度数分布を示したユーザ嗜好データのグラフの一例を示している。適切な内容情報をユーザ嗜好データとして選択するために、異なる基準が使用可能である。一部の実施形態では、最も高い度数に対応する内容情報が、ユーザ嗜好データとして選択される。
図3に示された例では、2つの内容情報C2及びC3が、最も高い総度数を有するゆえに選択される。一部の実施形態では、既定の値が決定され、この既定の値を超える総度数を有する内容情報が、このユーザについてのユーザ嗜好データとして選択される。この例において、既定の値が20に設定されると、C2、C3、及びC5が、それらに対応する度数が20を超えているゆえに選択される。一部の実施形態では、最も高い総度数を有する上位N個の内容情報が選択される。例えば、N=3である場合、C2、C3、及びC5が選択される。
【0036】
図2に戻り、ステップ210において、プロセスは、内容情報推薦を行うためにユーザ嗜好データを使用する。言い換えると、内容情報の度数分布に基づいて最も関連性があると見なされた内容情報が、ユーザに推薦される。関連性の決定には、多くの異なるやり方がある。例えば、C1が選択されると、ユーザの行為が最も頻繁に標的にしていると見なされた製品カテゴリの製品が、ユーザに推薦され、C4が選択されると、最も送料の低い製品がユーザに推薦され、C4及びC5が選択されると、最も送料が低く且つ最も高い製品格付けを有する製品がユーザに推薦され、C2、C4、及びC5が選択されると、最も人気のある製品生産者によって作成され、最も送料が低く、且つ最も高い製品格付けを有する製品がユーザに推薦される。ユーザ嗜好に基づく任意の適切な推薦技術が使用可能である。
図7及び表2との関連のもとで以下で更に詳しく説明されるように、一部の実施形態では、推薦を行うためのルールを決定するために、履歴ユーザデータに対して機械学習技術が適用される。
【0037】
上述された実施形態は、疑わしいデータを、既定のカテゴリ閾値と突き合わせることを通じてユーザ行動からフィルタ除去する。このようにしてフィルタ処理されたユーザ行動データは、ユーザの真の嗜好をより良く反映することができる。しかしながら、ユーザ行為は、既定の期間T内のどの時点で発生するかによって異なることが多く、異なる発生時間は、ユーザ嗜好の分析に対して異なる影響を及ぼす。総じて、ユーザ行為は、既定の期間Tの終わりに近いほど、ユーザの真の嗜好である可能性が高い。同様に、ユーザ行為は、既定の期間Tの始まりに近いほど、ユーザの真の嗜好である可能性が低い。一部の実施形態では、ユーザ行動データは、時間効果排除処理を随意に施される。このような処理は、遅く生じたユーザ行為であるほど、早く生じた同じ種類のユーザ行為よりも、ユーザ嗜好に対して大きな影響を有する処理結果に終わる限り、多くの具体的形態をとることができる。一部の実施形態では、時間効果排除処理は、ユーザ行動度数を調整するために、分析ステップ208の一部として行われる。一部の実施形態では、既定の期間の終わりの近くに生じた新しいユーザ行為であるほど増加し既定の期間の始まりの近くに生じた古いユーザ行為であるほど減少する時間加重が各ユーザ行為に乗じられ、そうしてユーザ行動度数値が修正される。
【0038】
ユーザ行動データに時間効果排除処理を施すことによって、本実施形態は、ユーザ行動を基にして確立されるユーザ嗜好の精確さを更に高め、そうして推薦結果を更に向上させる。
【0039】
時間効果排除は、幾つかの特定の形態をとることができ、本出願のこの実施形態では、時間加重は、好ましくは以下の式にしたがって計算可能である。
【0041】
D
offは、ユーザ行動が発生した時点と、既定の期間の終了時との間の時間差である。
【0042】
一部の実施形態では、ユーザ行為に時間加重が割り当てられた後、各ユーザ行為に起因する度数値は、それに対応する時間加重を乗じることによって調整され、このユーザ行動カテゴリの総度数は、調整された度数値を足し合わせることによって計算される。このやり方で最適化されたユーザ行動データは、期間中におけるユーザの嗜好特性を、より正確に反映することができる。
【0043】
別の態様では、ユーザ行動の標的にされる内容情報が、ユーザ嗜好分析の基になる。しかしながら、ユーザが特定のユーザ行為を実施している間に標的にされる内容情報は、ユーザの知識及び能力によって制限され、正確でないことがある。したがって、分析の基になる結果は、誤差を引き起こす恐れがある。例えば、ユーザが検索行為を実施し、その検索行為が或るキーワードを標的にしているとする。このキーワードは、ユーザ自身の知識を基にして決定されたキーワードであり、しかも、このキーワードは、所望の製品についての正確な記述ではないかもしれない。例えば、製品の正確な記述が「バランスバイク」(三輪車)であるときに、或るユーザは、キーワード「スクータバイク」(スクータ)を入力するかもしれない。したがって、一部の実施形態では、ユーザ嗜好分析を行うために使用される標準化された補正データを得るために、(例えばプロセス200のステップ208の前に)「ずれ補正」が随意に実施される。
【0044】
一部の実施形態では、ずれ補正の実施は、標準化製品ユニット及び業界知識バンクにしたがって内容情報を補正することを含む。標準化製品ユニット(SPU)は、容易に検索可能である標準化された再利用可能な情報集合である。例えば、複数の売り手が、名称や記述などは異なるがブランド及びモデルは同じである携帯電話に関する情報を投稿することがある。情報は、入手されて標準化され、製品の特性を記述するとともに製品に関する基本情報を記憶している1つのSPUに入れられる。SPUがどのように作成されるかに関する詳細な説明は、あらゆる目的のためにその全体を参照によって本明細書に組み込まれる発明の名称を「METHOD AND APPARATUS FOR PROVIDING DATA STATISTICS(データ統計を提供するための方法及び装置)」とする2009年6月22日出願の米国特許出願通し番号第12/456,806号(代理人整理番号ALIBP001)に見いだすことができる。業界知識バンクは、或る業界についての知識バンクである。この「知識」は、業界標準、業界のビジネスモデル、業界のビジネスデータ・情報モデル、情報をベースにした業界の概観、業界分野の構成要素、業界の購入チェーン、業界の上流/下流製品などを含む。この知識バンクによって網羅される内容は、かなりに及ぶ。ユーザ行動に基づく標的内容情報が決定された後、各標的内容情報が探索され、標準化製品ユニット及び業界知識バンクと比較される。標的内容情報と、SPUデータベース又は業界知識バンクの中の対応する記述との間に差がある場合、この内容情報を記述するために、標準化製品ユニット又は業界知識バンクの標準言語が使用される。このやり方で標準化された内容情報は、後続のステップにおける識別及び処理に、より容易に役立てることができる。
【0045】
上述された実施形態は、参照期間、すなわち既定の期間Tを活用した。この期間にわたってユーザ行動カテゴリ及びユーザ行動度数に対して実施される分析から、ユーザ嗜好データが得られる。しかしながら、ユーザは、この期間内に嗜好の変遷(変動)を経るかもしれない。言い換えると、或るユーザは、或る時間区分中は、内容情報1に興味があるかもしれず、別の時間区分中は、内容情報1に関連した内容情報2に興味があるかもしれない。例えば、或るユーザは、或る本(内容情報1)が最初に出版されたときに、その本に興味を持つかもしれず、そのユーザは、何年か後、その本に基づく映画のDVD(内容情報2)がリリースされたときに、その映画のDVDにも興味を持つかもしれない。内容情報1及び内容情報2は、1つの変遷ペアを形成すると考えられ、ユーザ嗜好データは、ユーザ嗜好の変遷特性を含む。嗜好変遷特性を有するユーザ行動を分析するときは、変遷ペアの変遷終点に対応する内容情報(内容情報2)のみが、現時点におけるユーザの興味を真に表している。この仮定は、ユーザが、変遷ペアの変遷始点に対応する内容情報(内容情報1)を既に見限っており、もう興味を持っていないというものである。したがって、変遷終点に対応する内容情報が、ユーザの嗜好であると見なされるべきであり、内容情報推薦は、これと同じことを基にして行われるべきである。
【0046】
ユーザ嗜好の変遷に加えて、ユーザは、既定の期間の中の特定の時間区分中に、極端に高いユーザ行為度数で特定の内容情報に強い興味を持つようになるかもしれない(例えば、ユーザは、地震の直後に災害緊急キットに非常に興味を持つようになる)。このような状況は、ユーザ嗜好に関する突発性の特性を構成する。この特性は、不安定である。これは、単に感情的なユーザ嗜好を表しており、既定の期間中ずっと継続する嗜好を表すことはできない(例えば、ユーザは、災害緊急キットを1つ購入した後はもうそれに興味はなくなる)。したがって、これは、ユーザ嗜好の分析中に排除されるべきである。ユーザ嗜好における突発性特性と対照的であるのは、ユーザ嗜好の継続性特性である。すなわち、ユーザの嗜好は、或る時間区分中、特定の幾つかの内容情報(例えば、特定の著者の本の選択又は照会)に集中している。別の時間区分中、ユーザの嗜好は、依然としてそれらの内容情報に集中している。このような状況は、ユーザの嗜好が比較的安定していること、及びこのユーザ行動データがユーザ嗜好を比較的良く反映できていることを示している。このようなユーザ嗜好を基にして行われた内容情報推薦は、ユーザのニーズに見合っている可能性及びそれゆえに取引成功率を向上させる可能性が非常に高い。本出願は、したがって、更なる実施形態を提示する。この実施形態は、上述された突発性ユーザ嗜好及び変遷ユーザ嗜好をフィルタ除去すること、並びに継続性ユーザ嗜好を保持することを追加している。
【0047】
図4は、分析からユーザ嗜好データを得るためのプロセスの一実施形態を示したフローチャートである。プロセス400は、プロセス200のステップ208を実行に移すために使用することができる。プロセスは、以下を含む。
【0048】
ステップ402:既定の期間内における、処理されたユーザ行動カテゴリ及びユーザ行動度数を、ユーザ行動がいつ発生したかにしたがって複数の時間区分に分割する。一部の実施形態では、これらの時間区分は、長さが等しい。
【0049】
既定の期間用に選択された時間区分の長さが短いほど、ユーザ嗜好は細かくなる。異なる時間区分を比較するユーザ嗜好曲線を使用することによって、突発性ユーザ嗜好及び変遷ユーザ嗜好が得られる。既定の期間Tは、長さが等しい少なくとも2つの時間区分に分割することができ、実際のニーズに応じて2つ又は3つ以上の区分が選択されてよい。選択される時間区分の数が多いほど、ユーザ嗜好の変動に関する情報が微細になる。便宜上、ここでは例として2つの時間区分T1及びT2が使用され、T1+T2=Tである。
【0050】
ステップ404:各時間区分におけるユーザ行動カテゴリ及びユーザ行動度数にしたがって、ユーザ行動の標的にされる内容情報を分析し、これらの時間区分についてのユーザ嗜好データを得る。
【0051】
プロセスは、時間区分T1及びT2についてユーザ行動カテゴリ及びユーザ行動度数を別々に分析し、標的内容情報を分析する。当該分析プロセスは、標的内容情報を横軸に、ユーザ内容情報の度数を縦軸にとって曲線を作成することによって実行に移すことができる。
【0052】
ステップ406:各時間区分のユーザ嗜好データを比較し、変遷ユーザ嗜好データペアの変遷始点データ及び/又は突発性ユーザ嗜好データをフィルタ除去し、そうして既定の期間全体についてのユーザ嗜好データを得る。
【0053】
2つの時間区分T1及びT2についてのユーザ嗜好曲線が得られた後、これら2つの曲線は、比較分析を施される。このプロセスは、両方の時間区分で見つかった内容情報を取り上げて、それを継続性嗜好データとして保持する。プロセスは、第1の時間区分にのみ現れる内容情報を変遷ユーザ嗜好データ変遷始点と見なし、それをフィルタ除去する。プロセスは、更に、第2の時間区分内にのみ現れる内容情報を変遷ユーザ嗜好変遷終点と見なし、それを保持する。プロセスは、また、いずれかの時間区分に現れる突発性ユーザ嗜好データ(例えば、内容情報が一般的に標的にされる平均度数と比べて異常に高い度数で標的にされる内容情報)もフィルタ除去する。その結果、既定の期間T全体についてのユーザ嗜好データが得られる。
【0054】
既定の期間を更に小さい期間に分割し、次いで、この分割に続いて、各時間区分におけるユーザ嗜好データの変化を比較することによって、本実施形態は、変遷ユーザ嗜好データ及び突発性ユーザ嗜好データをフィルタ除去する。このやり方で得られたユーザ嗜好データは、既定の期間全体にわたるユーザ嗜好を更に正確に反映している。その結果、このユーザ嗜好データを基にした、更に優れた内容情報推薦が行われる。
【0055】
上述された実施形態を使用して、更に正確なユーザ行動データが得られる。一連の最適化手続きを通じて、ユーザ行動における「虚偽データ」がフィルタ除去され、分析を通じて正確なユーザ嗜好を得るための、より優れた基盤が敷かれる。別の一態様では、ユーザ行動の標的にされる内容情報の精度も高める必要がある。内容情報は、ユーザ嗜好の分析のための出発点であるが、この内容情報は、電子商取引情報の売り手によって提供されるものである。利益及び顧客を奪い合うなかで、一部の売り手は、内容情報との関連で、悪意をもって「虚偽データ」をねつ造することがある。例えば、或る売り手は、或る製品について非常に低い価格を意図的に挙げつつ、非常に高い送料及び手数料を課するかもしれない。このような行動は、電子商取引情報の取引市場を混乱させる。この「虚偽」内容情報を基にしたユーザ嗜好分析の結果は、大幅に歪められるだろう。したがって、一部の実施形態では、虚偽内容情報が検出される。
図5は、虚偽内容情報をフィルタ除去するためのプロセスの一実施形態を示したフローチャートである。プロセス500は、プロセス200のステップ208の一部として又はこのステップ208の前に使用することができる。プロセス500は、以下を含む。
【0056】
ステップ502:指定の製品価格が既定の価格帯以内であるかどうかを決定する。既定の価格帯は、同じ製品の、異なる売り手による過去の平均価格帯であってよい。価格帯以内でない場合、プロセスは、製品価格を既定の価格帯以内に設定する(通常は、この値は上限閾値又は下限閾値に設定される)。価格が既定の範囲内である場合、ステップ506において、プロセスは、製品が属している業界が製品の供給者/生産者の登録業界と同じであるかどうかを随意に決定し、同じでない場合、プロセスは、この製品及びその関連情報をユーザ嗜好又は推薦分析に含まれないようにフィルタ除去する。
【0057】
内容情報を最適化することによって、本実施形態は、ユーザ嗜好分析のためのデータソースの精度を高める。これは、より有効なユーザ嗜好データを得るのに有用である。
【0058】
上述された幾つかの実施形態で説明された方法では、ユーザ嗜好データが得られた後に具体的に情報推薦ステップを実行に移す方法において、先行技術を用いることができる。先行技術では、内容情報は、総じて、独立で且つ個別である。この種の推薦は、しかしながら、常に最も効果的であるとは限らない。ユーザ履歴の分析を通じて得られたユーザ嗜好が、ユーザに内容情報を推薦するための基として使用されるときは、このような情報は、ユーザのショッピング願望に合致している傾向が強く、結果として取引成功率を高くする。しかしながら、各ユーザのユーザ嗜好は、実際は、過去の嗜好にはむしろ限定されない。ユーザの嗜好が変化し続ける一方で、ユーザが自身のニーズに最も良く合う最適な製品を見つけるために情報を探索及び取得する能力には限界があるのが通常である。ユーザと同じ又は類似の嗜好を有するその他のユーザは、上述された分野に加えてその他の分野でも同じ嗜好を有する可能性が高いので、そのようなユーザのユーザ嗜好データを調査することには価値がある。したがって、一部の実施形態では、協調推薦技術が使用され、この技術では、多量のユーザ内容情報が、それらについての母集団嗜好データを得るために分析される。内容情報推薦は、ユーザ嗜好データ及び母集団嗜好データを基にして行われる。
図6は、内容推薦を提供するための一実施形態を示したフローチャートである。プロセス600は、プロセス200のステップ210を実行に移すために使用することができる。
【0059】
ステップ602において、類似ユーザからなる集合が形成される。一部の実施形態では、このプロセスは、既定の数のユーザを無作為に選択して参照ユーザ集合を形成し、この参照ユーザ集合の中の各ユーザに対するその他のユーザの類似性を算出し、既定の類似性閾値(オペレータの経験又は統計的な分析に基づいて決定することができる)を超える類似性を有する類似ユーザからなる1つ以上の集合を形成する。
【0060】
様々な実施形態において、ユーザ間の類似性を計算するために、クラスタ化アルゴリズムなどの多様な技術が利用可能である。例えば、ユーザ嗜好が内容情報の度数分布を含む上述の例について言うと、ユーザ間の類似性は、内容情報についてのユーザの度数分布のコサイン類似値を使用して測定することができる。多くの既存のクラスタ化アルゴリズムが使用可能であり、これらのアルゴリズムの詳細は、本明細書の範囲外である。既定の閾値は、オペレータの経験又は統計的な分析に基づいて決定することができる。
【0061】
ステップ604において、プロセスは、類似ユーザからなる集合の中の各ユーザの行動を分析し、この集合の母集団嗜好データを得る。ここで、母集団嗜好データは、標的内容情報についてのユーザ行動の度数分布を含む。一部の実施形態では、母集団嗜好データは、その集合の中の全てのユーザの行為の標的にされる内容情報の度数を数えて度数分布に入れることを除き、上述された個々のユーザの嗜好データを算出するのと同じやり方で算出される。同じ集合の中の類似ユーザは、同様な内容に興味を持つ可能性が高いので、母集団嗜好は、ユーザ嗜好を導くことができる。
【0062】
ステップ606において、プロセスは、少なくとも一部には母集団嗜好データに基づいて、ユーザに内容情報を推薦する。一部の実施形態では、ユーザ個人の嗜好に少なくとも部分的に基づいて、更なる内容情報がユーザに推薦される。
【0063】
クラスタ化技術を使用して類似性を算出することによって、本実施形態は、問題にされているユーザと同様な特性を有するその他のユーザを見つけ出す。更に、本実施形態は、それらその他のユーザのユーザ行動データを、内容情報推薦を行うための参照として使用する。したがって、本実施形態は、ユーザに推薦される内容情報を更に効果的に拡張し、ユーザ満足経験を向上させ、電子商取引情報取引の分野及び範囲を更に広げる。例えば、或るユーザは、科学の本に対する嗜好を明示していなかったが、類似ユーザが、科学の本に対する母集団嗜好を有する(製品カテゴリの内容情報の中で、高い度数で科学の本が標的にされている)ゆえに、このユーザには、科学の本が推薦可能である。
【0064】
地理的環境の相違及び地域的習慣のばらつきゆえに、1つの地域内のユーザについてのユーザ嗜好データは、より大きい参照値を有するだろう。したがって、本実施形態では、以下のプロセスにしたがって、参照ユーザ集合が選択される。すなわち、このプロセスは、ユーザのインターネットプロトコル(IP)アドレス(例えば、ウェブサイト上でユーザの現セッションによって示されるIPアドレス)に対応する地理的地域と、この地域がユーザの登録地理的地域(例えば、サインアッププロセス中にユーザによって指定された地理的情報)と同じであるかどうかとを評価し、同じである場合、プロセスは、ユーザの登録地理的地域と同じ地理的地域を登録したその他のユーザを選択して参照ユーザ群を構成し、同じでない場合、プロセスは、上記ユーザのIPアドレスに対応する地理的地域と同じ地理的地域を登録したその他のユーザを選択して参照ユーザ集合を形成する。
【0065】
一部の実施形態では、ユーザが登録したユーザデータは、母集団嗜好を分析するための基として使用される。同じ地理的地域からのユーザ行動データは、その他の場所からのユーザ行動よりも大きな参照値を有する。このようなデータの分析の結果得られるユーザ嗜好は、より正確であり、このような分析に基づく推薦結果は、より優れている。これは、ひいては、電子商取引情報の取引成功率を大幅に高める。更に、接近性原則の採用は、電子商取引情報取引の完了後に適切な製品又はサービスを迅速に得ることが、ユーザにとって大幅に容易になることを意味する。
【0066】
嗜好データが得られた後に情報推薦ステップを実行に移すには、様々なやり方がある。一部の実施形態では、情報推薦ステップは、協調推薦を行うことを含む。協調推薦を行うことは、推薦を待っているユーザのデータを、特定の制限内で母集団嗜好データと組み合わせる(例えば、特定のユーザに対する推薦を行うために、集合の中で最も類似している上位N人のユーザのみが使用される)ことを含む。こうして、推薦を待っているユーザに推薦される内容情報が拡張される(「水平」拡張と呼ばれることもある)。
【0067】
一部の実施形態では、水平拡張技術に代わって又は加えて、垂直拡張技術が使用される。垂直拡張技術の一例は、共同推薦技術であり、この技術では、ユーザ嗜好データの中の複数のユーザ嗜好が、既定のルール集合と突き合わされ、成功裏に一致した1つ以上の嗜好が、ユーザに内容情報を推薦するための基として取り上げられる。
図7は、内容情報を推薦するための共同推薦プロセスの一実施形態を示している。プロセス700は、プロセス200のステップ210を実行に移すために使用することができる。
【0068】
この例では、ステップ702において、プロセスは、既定の数のユーザを選択してルール設定用ユーザ集合を形成し、上記ルール設定用ユーザ集合の中の各ユーザの行動を分析して各ユーザに関するユーザ嗜好データを取得し、各ユーザのユーザ嗜好データに基づいてトレーニングを行ってルール集合を得る。この例では、ルール集合は、内容情報推薦のために各タイプのユーザ嗜好を予測するための複合ルール集合を含む。
【0069】
多くの場合、ユーザの履歴行動の分析を通じて得られたユーザ嗜好は、複合嗜好である。言い換えると、このユーザ嗜好データは、様々なレベル、分野、及び時間区分内における、製品嗜好(例えば、特定の製品の識別子、名称、若しくはモデルに対する嗜好)、供給者嗜好(例えば、特定の供給者の識別子若しくは名称に対する嗜好)、製品検索ワード嗜好(例えば、製品を検索するときに使用するための検索キーワードに対する嗜好)、購入リクエスト嗜好(例えば、たとえ現時点で入手可能でなくても、どの製品が所望されるかに関する嗜好)、及び情報嗜好(例えば、討議の場から得られた情報に対する嗜好)などの、ユーザの複数の嗜好を含んでいる。内容情報推薦は、これら全ての嗜好にしたがって行われてもよいが、このような「全考慮」手法は、より高い取引成功率という目的を達成することはできないと考えられる。反対に、このような手法は、膨大な量の内容情報から何を選ぶかでユーザを途方に暮れさせる可能性があると考えられる。したがって、代替になるのは、量よりも質を重視する高ヒット率の手法を用いてユーザに内容情報を推薦するやり方である。一部の実施形態では、多量のユーザ嗜好のなかから「有効な」ユーザ嗜好を見つけ出すために、特定の数のユーザが選択されてルール設定用ユーザ集合が設定され、これらのユーザの嗜好に基づいてルール集合が確立され、次いで、ユーザ嗜好を選択するための基としてこのルール集合が使用される。ルール設定用ユーザ集合内のユーザ嗜好データは、全て、既知の技術を使用して取得することができる、又は本出願で提案された方法にしたがってユーザ行動データが最適化された後に、分析を通じて得ることができる。サンプルユーザからなる集合のユーザ嗜好データを得た後、ユーザの各嗜好は、その嗜好に対応する度数と組み合わされて、そのユーザについてのベクトル特色群を形成する。ベクトル特色群の一例は、製品、供給者、製品検索ワード、購入リクエスト、及び情報に基づいて形成されたベクトルである([製品、供給者、製品検索ワード、購入リクエスト、情報]として表される)。次いで、様々なユーザについてのベクトル特色群がトレーニングされ、ユーザにとって有用である可能性が最も高い内容情報を予測するルール集合が得られる。具体的には、ルールは、過去のユーザ嗜好のパターンを前提として、そのユーザに推薦されるべき1つ以上のタイプのユーザ嗜好データに対応する内容情報を指定する。決定木をベースにした又はサポートベクトルをベースにした機械学習技術などの、多くの異なるタイプのトレーニング技術が利用可能である。
【0070】
ステップ704において、プロセスは、推薦を待っている標的ユーザのユーザ嗜好データをルール集合と突き合わせ、成功裏に一致した嗜好データに基づいて、推薦を待っている標的ユーザに内容情報を推薦する。
【0071】
一部の実施形態では、ルール集合が得られた後、推薦を待っているユーザの嗜好が、ルール集合の中のルールと突き合わされる。成功裏に一致した場合、その一致するユーザ嗜好に基づいて、ユーザに内容情報が推薦される。
【0072】
表2は、プロセス700がどのように適用されるかの詳細な例を与える。この例では、表は、所定のユーザの、好ましいカテゴリの内容情報(先の例ではC1)を推薦するために使用される。好ましい製品生産者、好ましい価格帯、好ましい送料、好ましい格付けなどのその他のタイプの内容情報は、それぞれそれ自身の表を有するだろう。議論を容易にするために、ユーザに推薦可能である3つの特定のカテゴリ(例えば教科書のカテゴリ)、すなわち数学、英語、及び中国語があると想定される。
【0073】
ルール集合を構築するために、ルール設定用ユーザ集合のために100人のユーザが選択されたと想定される。これらのユーザは、無作為に選択することができる、又は標的ユーザに類似するユーザのプールから選択することができる。この例では、5つの情報ソース(製品、供給者、製品ワード、購入リクエスト、及び情報)があると想定され、したがって、各ユーザの嗜好は、5タイプの嗜好、すなわち製品、供給者、製品ワード、購入リクエスト、及び情報を含む。また、この集合の中のユーザ嗜好データは、次いで、100人のユーザからなるこの母集団についての母集団嗜好を得るために使用することができる。これらの母集団嗜好は、次いで、母集団嗜好に関するルールを設定するために使用される。
【0074】
特定の標的ユーザ(A1、B2、C3など)について、嗜好データは、ユーザの履歴行動データを分析し、100人のユーザのデータによって(例えば、ユーザの行動度数を100人のユーザの総行動度数で割ることによって)正規化することによって得られる。嗜好データは、内容情報の度数分布と、内容情報タイプとを含む。度数は、比較を促すために正規化を経る(例えば、特定の内容情報が一個人の標的にされた回数が、その内容情報が全個人の標的にされた回数で割られる)。一部の実施形態では、正規化ベンチマーク値10が使用される。例えば、A1についての0.6|数学は、A1のデータに基づくと、製品参照に関わる全てのA1行動について、A1が正規化度数0.6で数学カテゴリを好むことを示している。
【0075】
100人のユーザの嗜好データを既知の機械学習技術にしたがってトレーニングすることによって、3つのルールが得られる。これらのルールは、表の右端の欄に示されている。
【0076】
次は、3人のユーザ、A1、B2、及びC3に対して推薦を行う。各ユーザの嗜好データは、表の中の対応する欄に挙げられている。ルール集合の中のルールが、順番に適用される(すなわち、先ず、ルール1が適用され、ユーザ嗜好がルール1の基準に一致しない場合、ルール2をチェックし、ルール3へと続く)。成功裏に一致したユーザ嗜好にしたがって、内容情報が推薦される。具体的には、A1の嗜好は、ルール1に一致し、したがって、A1の製品嗜好に基づいて、数学に関連した内容情報が推薦され、B2の嗜好は、ルール3に一致し、したがって、母集団嗜好に基づいて、英語に関連した内容情報が推薦され、C3の嗜好は、ルール2に一致し、したがって、製品ワード嗜好に基づいて、中国語に関連する内容情報が推薦される。
【表2】
【0077】
本実施形態は、多くの種類のユーザ嗜好を組み合わせ、内容情報推薦を行うために実質的に最適な推薦構想を選択する。これは、従来の推薦方法を特徴付ける全嗜好に基づく非選択式の推薦を回避し、そうして推薦結果を向上するとともに取引成功率を効果的に高める。
【0078】
図8は、ユーザ行動に基づいて電子商取引情報を推薦するためのシステムの一実施形態を示したブロック図である。
【0079】
システム800は、計数モジュール801と、評価モジュール802と、嗜好分析モジュール803と、情報推薦モジュール804とを含む。
【0080】
計数モジュール801は、既定の期間内におけるユーザ行動カテゴリと、各ユーザ行動カテゴリに対応するユーザ行動度数とを数え上げるために使用される。
【0081】
評価モジュール802は、ユーザ行動カテゴリの量が既定のカテゴリ閾値を超えるかどうかを評価し、超える場合には、既定のカテゴリ閾値以下の量のユーザ行動カテゴリを保持するために、及び/又は各ユーザ行動の度数が既定の度数閾値を超えるかどうかを評価し、超える場合には、既定の度数閾値をユーザ行動の度数として取り上げるために使用される。
【0082】
嗜好分析モジュール803は、上述のように処理されたユーザ行動カテゴリ及びユーザ行動度数にしたがって、ユーザ行動の標的にされる内容情報を分析し、各内容情報の度数分布を含むユーザ嗜好データを得るために使用される。
【0083】
情報推薦モジュール804は、嗜好データを使用して内容情報をユーザに推薦する。
【0084】
この装置の作業プロセスは、以下の通りである。すなわち、計数モジュール801は、既定の期間内におけるユーザ行動カテゴリと、各行動カテゴリに対応するユーザ行動度数とを数え上げ、そのデータを評価モジュール802に送る。評価モジュール802は、ユーザ行動カテゴリの数が既定の閾値を超えるかどうかを評価し、超える場合には、既定の閾値に等しい量のユーザ行動カテゴリを保持する、且つ/又は各ユーザ行動の度数がこの行動についての既定の閾値度数を超えるかどうかを評価し、超える場合には、既定の閾値度数をこのユーザ行動についての度数として設定する。次いで、嗜好分析モジュール803は、上述のように処理されたユーザ行動カテゴリ及びユーザ行動度数を使用し、ユーザ行動の標的にされる内容情報を分析してユーザ嗜好データを得る。更に、嗜好分析モジュール803は、このデータを情報推薦モジュール804に送り、情報推薦モジュール804は、ユーザ嗜好データを使用して内容情報推薦を行う。
【0085】
ユーザ嗜好に基づいて情報推薦を行う前に、本出願の技術的構想は、ユーザ行動カテゴリ量及びユーザ行動度数が既定値に適合するかどうかを評価することによって、ユーザ行動履歴を最適化する。最適化されたユーザ行動データは、悪意のある行動及び不正な行動を排除する。このユーザ行動データに基づく分析を通じて得られたユーザ嗜好データは、より忠実にユーザの嗜好特性を反映し、ひいては、このユーザ嗜好データを基にして行われる情報推薦の結果を向上させ、これは、電子商取引情報取引の正常な発展を促すのに役立つ。また、推薦される製品情報は、ユーザの実際のニーズ及び期待に応えることができるので、ユーザは、ゆえに、電子商取引プラットフォームによって推薦される情報のみを基にして取引を完了させることができ、必要な製品情報を繰り返し調べる必要はない。これは、製品情報を繰り返し調べることによって電子商取引プラットフォームにかかる訪問ストレスを軽減する。また、本出願による最適化は、ユーザ行動データから多量の「虚偽データ」を排除しているので、情報推薦分析で使用されるデータの量が減り、情報推薦分析が行われる速度が速くなる。こうして、より迅速に推薦情報が得られる。
【0086】
本実施形態の装置800は、更に、ユーザ行動の標的にされる内容情報を分析する前にユーザ行動に時間加重を付与するための時間効果排除モジュール805を随意に含む。上記時間加重は、既定の期間の終了の瞬間に近いほど増加し、既定の期間の開始の瞬間に近いほど増加する。このモジュールによる時間効果の排除は、ユーザ行動データの分析の精度を高めるのに役立つ。
【0087】
本実施形態の装置800の嗜好分析モジュール803は、様々な形に構築することができる。
【0088】
この例では、モジュールは、時間区分分割サブモジュール8031と、嗜好分析サブモジュール8032と、フィルタ処理サブモジュール8033とを含む。
【0089】
時間区分分割サブモジュール8031は、既定の期間内における処理されたユーザ行動カテゴリ及びユーザ行動度数を、ユーザ行動がいつ発生したかにしたがって少なくとも2つの時間区分に分割するためのものである。
【0090】
嗜好分析サブモジュール8032は、各時間区分内におけるユーザ行動カテゴリ及びユーザ行動度数にしたがって、ユーザ行動の標的にされる内容情報を分析し、これらの時間区分についてのユーザ嗜好データを得るためのものである。
【0091】
フィルタ処理サブモジュール8033は、既定の期間全体についてのユーザ嗜好データを得るために、各時間区分のユーザ嗜好データにしたがって、変遷嗜好データ及び突発性嗜好データをフィルタ除去するためのものである。
【0092】
本実施形態の装置800は、更に、既定の量のその他のユーザを選択して参照ユーザ集合を構成し、次いで、推薦を待っている各ユーザの、参照ユーザ集合の中の各ユーザに対する類似性を算出し、既定の類似性閾値を超える類似性を有するユーザから類似ユーザ集合を構成するための類似性計算サブモジュール806を随意に含む。嗜好分析モジュール803は、また、類似ユーザ集合の中の各ユーザの行動を分析してこの類似ユーザ集合の母集団嗜好データを得るためにも使用される。情報推薦モジュール804は、また、推薦を待っているユーザのユーザ嗜好データと、母集団嗜好データとに基づいて、推薦を待っているユーザに内容情報を推薦するためにも使用される。
【0093】
本実施形態の装置800は、更に、ルール設定用ユーザ集合を構成するための既定量のユーザを選択し、嗜好分析モジュールを起動させて上記ルール設定用ユーザ集合の中の各ユーザの行動を分析して各ユーザに関するユーザ嗜好データを得て、各ユーザのユーザ嗜好データに基づいてトレーニングを行ってルール集合を得るための、ルール集合構築モジュール807を含む。上記ルール集合は、内容情報推薦のために各タイプのユーザ嗜好を予測するための複合ルール集合を含む。嗜好分析モジュールは、また、ルール設定用ユーザ集合の中の各ユーザの行動から得られる各ユーザのユーザ嗜好データを分析するためのものでもあり、上記ユーザ嗜好データは、ユーザ行動の標的にされる内容情報の度数分布を含む。情報推薦モジュールは、推薦を待っているユーザのユーザ嗜好データを上記ルール集合と突き合わせ、成功裏に一致したユーザ嗜好データに基づいて、推薦を待っているユーザに内容情報を推薦するためのものである。ルール集合作成ユニット807を含む装置は、ユーザの複数の嗜好を組み合わせ、内容情報推薦を行うのに最適な推薦構想を選択する。これは、従来の推薦方法を特徴付ける全嗜好に基づく非選択式の「総合的」推薦を回避し、そうして推薦結果を向上させるとともに取引成功率を効果的に高める。
【0094】
上述されたモジュールは、1つ以上の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、又はプログラム可能論理装置及び/若しくは特定の機能を実施するように設計された特殊用途向け集積回路などのハードウェアとして、又はそれらの組み合わせとして実装することができる。一部の実施形態では、モジュールは、本発明の実施形態に記載された方法を(パソコン、サーバ、ネットワーク機器などの)計算装置に実行させるための幾つかの命令を含み尚且つ(光ディスク、フラッシュストレージデバイス、モバイルハードディスクなどの)不揮発性のストレージ媒体に記憶させることができるソフトウェア製品の形で具現化することができる。モジュールは、1つのデバイスに実装されてよい、又は複数のデバイスに分散されてよい。モジュールの機能は、互いに合体されてよい、又は複数の小モジュールに更に分割されてよい。
【0095】
以上の実施形態は、理解を明瞭にすることを目的として幾らか詳細に説明されてきたが、本発明は、与えられた詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、非限定的である。
適用例1:内容推薦システムであって、1つ以上のコンピュータプロセッサであって、既定の期間内における複数のユーザ行動に関する複数のユーザ行動カテゴリと、前記複数のユーザ行動カテゴリに対応する複数のユーザ行動度数とを決定し、前記ユーザ行動カテゴリの数が既定のカテゴリ閾値を超えるか否かを決定し、前記ユーザ行動カテゴリの数が前記既定の閾値を超える場合に、残りのユーザ行動カテゴリの数が前記既定の閾値を超えないように1つ以上のユーザ行動カテゴリを排除し、前記残りのユーザ行動カテゴリと、対応するユーザ行動度数とに基づいて、前記残りのユーザ行動カテゴリの中のユーザ行動の標的にされる複数の内容情報の度数分布情報を含むユーザ嗜好データを決定し、少なくとも一部には前記ユーザ嗜好データに基づいて、ユーザに内容情報を推薦する1つ以上のコンピュータプロセッサと、前記1つ以上のプロセッサに接続され、前記1つ以上のプロセッサに命令を提供するように構成されている結合された1つ以上のメモリと、を備える、システム。
適用例2:適用例1に記載のシステムであって、前記1つ以上のプロセッサは、更に、ユーザ行動カテゴリのユーザ行動度数が度数閾値を超えるか否かを決定し、前記ユーザ行動カテゴリの前記ユーザ行動度数が前記度数閾値を超える場合に、前記ユーザ行動度数の値を前記度数閾値に置き換える、システム。
適用例3:適用例1に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記複数のユーザ行動のユーザ行動データに時間加重を適用し、時間的に古いユーザ行動データよりも時間的に新しいユーザ行動データに対して大きい時間加重が適用される、システム。
適用例4:適用例3に記載のシステムであって、前記時間加重は、時間加重=1/log(Doff)に従って計算され、Doffは、ユーザ行動が発生した時間と、前記既定の期間の終わりと、の間の時間差である、システム。
適用例5:適用例1に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記既定の期間を複数の時間区分に分割し、各時間区分の中でユーザ行動の標的にされる内容情報を分析し、各時間区分についてのユーザ嗜好データを決定し、時間的に早い時間区分の中では現れるが時間的に遅い時間区分の中では現れない内容情報を識別することによって、変遷ユーザ嗜好を取り除く、システム。
適用例6:適用例1に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記既定の期間を複数の時間区分に分割し、各時間区分の中でユーザ行動の標的にされる内容情報を分析し、各時間区分についてのユーザ嗜好データを決定し、異常に高い度数で標的にされる内容情報を識別することによって、突発性ユーザ嗜好を取り除く、システム。
適用例7:適用例1に記載のシステムであって、前記ユーザは、標的ユーザであり、前記1つ以上のプロセッサは、更に、前記標的ユーザに類似する複数の類似ユーザを識別し、前記複数の類似ユーザの、ユーザ行動カテゴリ及び対応するユーザ行動度数を取得し、前記複数の類似ユーザの、前記ユーザ行動カテゴリ及び対応するユーザ行動度数に基づいて、前記複数の類似ユーザのユーザ行動の標的にされる複数の内容情報の度数分布を含む母集団嗜好データを決定し、少なくとも一部には前記母集団嗜好データに基づいて、前記標的ユーザに内容情報を推薦する、システム。
適用例8:適用例7に記載のシステムであって、前記複数の類似ユーザを識別することは、前記標的ユーザの現インターネットプロトコル(IP)アドレスに対応する地理的領域が、前記標的ユーザの登録地理的領域に一致するか否かを決定し、前記標的ユーザの前記現IPアドレスに対応する前記地理的領域が、前記標的ユーザの前記登録地理的領域に一致する場合に、前記標的ユーザの前記登録地理的領域と同じ登録地理的領域を有するその他のユーザの中から、参照ユーザ集合を選択し、前記標的ユーザの前記現IPアドレスに対応する前記地理的領域が、前記標的ユーザの前記登録地理的領域に一致しない場合に、前記標的ユーザの前記IPアドレスに対応する前記地理的領域と同じ地理的領域を有するその他のユーザの中から、参照ユーザ集合を選択し、前記標的ユーザを前記参照ユーザ集合の中のユーザと比較することによって、前記複数の類似ユーザを識別すること、を含む、システム。
適用例9:適用例1に記載のシステムであって、前記ユーザは、標的ユーザであり、少なくとも一部には前記ユーザ嗜好データに基づいて、前記ユーザに内容情報を推薦することは、ユーザの集合を選択し、ルール設定用のユーザ集合を形成し、前記ルール設定用ユーザ集合の中のユーザの行動を分析し、前記ルール設定用ユーザのユーザ嗜好データを取得し、前記ルール設定用ユーザの前記ユーザ嗜好データに基づいてトレーニングを実施し、過去のユーザ嗜好のパターンを前提にして、推薦されるべきユーザ嗜好のタイプに対応する内容情報を予測する1つ以上のルールを含むルール集合を取得し、前記標的ユーザの前記ユーザ嗜好データに前記ルール集合を適用し、推薦される内容情報を得ること、を含む、システム。
適用例10:適用例9に記載のシステムであって、前記標的ユーザの前記ユーザ嗜好データに前記ルール集合を適用し、推薦される内容情報を得ることは、前記標的ユーザの前記ユーザ嗜好データを前記ルール設定用ユーザの前記ユーザ嗜好データによって正規化することを含む、システム。
適用例11:ユーザに内容情報を推薦する方法であって、1つ以上のコンピュータプロセッサを使用し、既定の期間内における複数のユーザ行動に関する複数のユーザ行動カテゴリと、前記複数のユーザ行動カテゴリに対応する複数のユーザ行動度数とを決定し、前記ユーザ行動カテゴリの数が既定のカテゴリ閾値を超えるか否かを決定し、前記ユーザ行動カテゴリの数が前記既定の閾値を超える場合に、残りのユーザ行動カテゴリの数が前記既定の閾値を超えないように1つ以上のユーザ行動カテゴリを排除し、前記残りのユーザ行動カテゴリと、対応するユーザ行動度数とに基づいて、前記残りのユーザ行動カテゴリの中のユーザ行動の標的にされる複数の内容情報の度数分布情報を含むユーザ嗜好データを決定し、前記ユーザ嗜好データに基づいて、前記ユーザに内容情報を推薦すること、
を備える方法。
適用例12:適用例11に記載の方法であって、更に、ユーザ行動カテゴリのユーザ行動度数が度数閾値を超えるか否かを決定し、前記ユーザ行動カテゴリの前記ユーザ行動度数が前記度数閾値を超える場合に、前記ユーザ行動度数の値を前記度数閾値に置き換えること、を備える方法。
適用例13:適用例11に記載の方法であって、更に、前記複数のユーザ行動のユーザ行動データに時間加重を適用することを備え、時間的に古いユーザ行動データよりも時間的に新しいユーザ行動データに対して大きい時間加重が適用される、方法。
適用例14:適用例13に記載の方法であって、前記時間加重は、時間加重=1/log(Doff)に従って計算され、Doffは、ユーザ行動が発生した時間と、前記既定の期間の終わりと、の間の時間差である、方法。
適用例15:適用例11に記載の方法であって、前記既定の期間を複数の時間区分に分割し、各時間区分の中でユーザ行動の標的にされる内容情報を分析し、各時間区分についてのユーザ嗜好データを決定し、時間的に早い時間区分の中では現れるが時間的に遅い時間区分の中では現れない内容情報を識別することによって、変遷ユーザ嗜好を取り除くこと、を備える方法。
適用例16:適用例11に記載の方法であって、更に、前記既定の期間を複数の時間区分に分割し、各時間区分の中でユーザ行動の標的にされる内容情報を分析し、各時間区分についてのユーザ嗜好データを決定し、異常に高い度数で標的にされる内容情報を識別することによって、突発性ユーザ嗜好を取り除くこと、を備える方法。
適用例17:適用例11に記載の方法であって、前記ユーザは、標的ユーザであり、前記方法は、更に、前記標的ユーザに類似する複数の類似ユーザを識別し、前記複数の類似ユーザの、ユーザ行動カテゴリ及び対応するユーザ行動度数を取得し、前記複数の類似ユーザの、前記ユーザ行動カテゴリ及び対応するユーザ行動度数に基づいて、前記複数の類似ユーザのユーザ行動の標的にされる複数の内容情報の度数分布を含む母集団嗜好データを決定し、少なくとも一部には前記母集団嗜好データに基づいて、前記標的ユーザに内容情報を推薦すること、を備える方法。
適用例18:適用例17に記載の方法であって、前記複数の類似ユーザを識別することは、前記標的ユーザの現インターネットプロトコル(IP)アドレスに対応する地理的領域が、前記標的ユーザの登録地理的領域に一致するか否かを決定し、前記標的ユーザの前記現IPアドレスに対応する前記地理的領域が、前記標的ユーザの前記登録地理的領域に一致する場合に、前記標的ユーザの前記登録地理的領域と同じ登録地理的領域を有するその他のユーザの中から、参照ユーザ集合を選択し、前記標的ユーザの前記現IPアドレスに対応する前記地理的領域が、前記標的ユーザの前記登録地理的領域に一致しない場合に、前記標的ユーザの前記IPアドレスに対応する前記地理的領域と同じ地理的領域を有するその他のユーザの中から、参照ユーザ集合を選択し、前記標的ユーザを前記参照ユーザ集合の中のユーザと比較することによって、前記複数の類似ユーザを識別すること、を含む、方法。
適用例19:適用例11に記載の方法であって、前記ユーザは、標的ユーザであり、少なくとも一部には前記ユーザ嗜好データに基づいて、前記ユーザに内容情報を推薦することは、ユーザの集合を選択し、ルール設定用のユーザ集合を形成し、前記ルール設定用ユーザ集合の中のユーザの行動を分析し、前記ルール設定用ユーザのユーザ嗜好データを取得し、前記ルール設定用ユーザの前記ユーザ嗜好データに基づいてトレーニングを実施し、過去のユーザ嗜好のパターンを前提にして、推薦されるべきユーザ嗜好のタイプに対応する内容情報を予測する1つ以上のルールを含むルール集合を取得し、前記標的ユーザの前記ユーザ嗜好データに前記ルール集合を適用し、推薦される内容情報を取得すること、を含む、方法。
適用例20:適用例19に記載の方法であって、前記標的ユーザの前記ユーザ嗜好データに前記ルール集合を適用し、推薦される内容情報を得ることは、前記標的ユーザの前記ユーザ嗜好データを前記ルール設定用ユーザの前記ユーザ嗜好データによって正規化することを含む、方法。
適用例21:コンピュータ読み取り可能ストレージ媒体に実装された、内容推薦のためのコンピュータプログラム製品であって、1つ以上のコンピュータプロセッサを使用し、既定の期間内における複数のユーザ行動に関する複数のユーザ行動カテゴリと、前記複数のユーザ行動カテゴリに対応する複数のユーザ行動度数とを決定するためのコンピュータ命令と、前記ユーザ行動カテゴリの数が既定のカテゴリ閾値を超えるか否かを決定するためのコンピュータ命令と、前記ユーザ行動カテゴリの数が前記既定の閾値を超える場合に、残りのユーザ行動カテゴリの数が前記既定の閾値を超えないように1つ以上のユーザ行動カテゴリを排除するためのコンピュータ命令と、前記残りのユーザ行動カテゴリと、対応するユーザ行動度数とに基づいて、前記残りのユーザ行動カテゴリの中のユーザ行動の標的にされる複数の内容情報の度数分布情報を含むユーザ嗜好データを決定するためのコンピュータ命令と、前記ユーザ嗜好データに基づいて、前記ユーザに内容情報を推薦するためのコンピュータ命令と、を備えるコンピュータプログラム製品。