特許第5928920号(P5928920)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アリババ・グループ・ホールディング・リミテッドの特許一覧

<>
  • 特許5928920-お勧めデータの決定 図000009
  • 特許5928920-お勧めデータの決定 図000010
  • 特許5928920-お勧めデータの決定 図000011
  • 特許5928920-お勧めデータの決定 図000012
  • 特許5928920-お勧めデータの決定 図000013
  • 特許5928920-お勧めデータの決定 図000014
  • 特許5928920-お勧めデータの決定 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5928920
(24)【登録日】2016年5月13日
(45)【発行日】2016年6月1日
(54)【発明の名称】お勧めデータの決定
(51)【国際特許分類】
   G06F 17/30 20060101AFI20160519BHJP
   G06Q 30/02 20120101ALI20160519BHJP
【FI】
   G06F17/30 340B
   G06Q30/02 150
【請求項の数】20
【全頁数】24
(21)【出願番号】特願2014-508468(P2014-508468)
(86)(22)【出願日】2012年4月23日
(65)【公表番号】特表2014-518583(P2014-518583A)
(43)【公表日】2014年7月31日
(86)【国際出願番号】US2012034684
(87)【国際公開番号】WO2012148855
(87)【国際公開日】20121101
【審査請求日】2013年12月16日
【審判番号】不服2014-23845(P2014-23845/J1)
【審判請求日】2014年11月25日
(31)【優先権主張番号】201110104248.9
(32)【優先日】2011年4月25日
(33)【優先権主張国】CN
(31)【優先権主張番号】13/452,371
(32)【優先日】2012年4月20日
(33)【優先権主張国】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】510330264
【氏名又は名称】アリババ・グループ・ホールディング・リミテッド
【氏名又は名称原語表記】ALIBABA GROUP HOLDING LIMITED
(74)【代理人】
【識別番号】110000028
【氏名又は名称】特許業務法人明成国際特許事務所
(72)【発明者】
【氏名】チウ・グワーン
(72)【発明者】
【氏名】リウ・イージョ
(72)【発明者】
【氏名】イン・ウェイドーン
(72)【発明者】
【氏名】ヤーン・ソーン
(72)【発明者】
【氏名】グオ・ニーン
(72)【発明者】
【氏名】ジャーン・リアーン
【合議体】
【審判長】 手島 聖治
【審判官】 緑川 隆
【審判官】 石川 正二
(56)【参考文献】
【文献】 特開2005−352754(JP,A)
【文献】 特開2005−316899(JP,A)
【文献】 特開2000−215204(JP,A)
【文献】 特開2008−141416(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F17/30
G06Q30/02
(57)【特許請求の範囲】
【請求項1】
お勧めデータを決定するためのシステムであって、
プロセッサであって、
所定の時点よりも前に発生したユーザ操作ログ集合から第1のキーワード集合を抽出し、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定し、前記所定の時点は現在時点と関連して決定され、
前記所定の時点よりも後に発生したユーザ操作ログ集合から第2のキーワード集合を抽出し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値は、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値よりも大きく、
ユーザによるウェブサイトコンテンツを求める次のリクエストの前に、
前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させて第3のキーワード集合を得て、前記第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定し、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させることは、
前記第1のキーワード集合及び前記第2のキーワード集合の両方で見いだされるキーワード集合の重複キーワードを識別すること、
前記識別された重複キーワードを前記第3のキーワード集合に含ませること、
前記識別された重複キーワードについての結合重み値を、前記第1のキーワード集合用に決定された前記重複キーワードの重み値と、前記第2のキーワード集合用に決定された前記重複キーワードの重み値とに少なくとも部分的に基づいて決定すること、を含み、
前記第3のキーワード集合を、前記ユーザにお勧めされる可能性があるデータのデータベースと突き合わせ、
あるデータが前記第3のキーワード集合からの少なくとも1つのキーワードに一致することが決定された場合に、前記ユーザによるウェブサイトコンテンツの前記次のリクエストに応じて、そのデータを前記ユーザにお勧めされるデータとして決定する、ように構成されているプロセッサと、
前記プロセッサに結合され、前記プロセッサに命令を提供するように構成されているメモリと、
を備える、システム。
【請求項2】
請求項1に記載のシステムであって、
キーワードについての重み値は、
【数5】
を使用して決定され、
tiは、所定の日から何日離れているかを表し、kは、時間区分の総数を表し、n(ti)は、tiに関連付けられている日付における1つ以上のタイプのユーザ動作にわたる前記キーワードの発生回数を表し、f(ti)は、tiに関する減少重み関数を表している、システム。
【請求項3】
請求項1に記載のシステムであって、
各ユーザ操作ログは、少なくとも、タイムスタンプと、ユーザ動作と、関連付けられているキーワードとを含む、システム。
【請求項4】
請求項1に記載のシステムであって、
前記データは、オンライン広告を含む、システム。
【請求項5】
請求項1に記載のシステムであって、
前記第1のキーワード集合の抽出は、更に、
前記所定の時点よりも前のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、
各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、
前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル3の優先レベルに割り当てることと、
前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、
関連付けられている優先レベルが最も高い所定数のキーワードを前記第1のキーワード集合であるとして決定することと、
を含む、システム。
【請求項6】
請求項1に記載のシステムであって、
前記第2のキーワード集合の抽出は、更に、
前記所定の時点よりも後のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、
各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、
前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル3の優先レベルに割り当てることと、
前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、
関連付けられている優先レベルが最も高い所定数のキーワードを前記第2のキーワード集合であるとして決定することと、
を含む、システム。
【請求項7】
請求項1に記載のシステムであって、
前記第1のキーワード集合は、第1の時間間隔ごとに抽出され、前記第2のキーワード集合は、第2の時間間隔ごとに抽出され、前記第1の時間間隔は、前記第2の時間間隔よりも大きい、システム。
【請求項8】
請求項1に記載のシステムであって、
前記プロセッサは、更に、制限を超えた場合に、比較的低い重み値に関連付けられている1つ以上のキーワードを前記第3のキーワード集合から排除することによって、前記第3のキーワード集合に含められるキーワードの数に対して前記制限を維持するように構成されている、システム。
【請求項9】
請求項1に記載のシステムであって、
前記第3のキーワード集合を、お勧めされる可能性がある前記データと突き合わせることは、前記データに関連付けられているキーワードが前記第3のキーワード集合からのいずれかのキーワードに一致するか否かを決定することを含む、システム。
【請求項10】
請求項1に記載のシステムであって、
前記プロセッサは、更に、前記ユーザにお勧めされることになる前記データを、ウェブサイトコンテンツを求める前記次のリクエストに応答し、前記ユーザに関連付けられているデバイスに送信するように構成されている、システム。
【請求項11】
コンピュータによって実行されるお勧めデータを決定するための方法であって、
所定の時点よりも前に発生したユーザ操作ログ集合から第1のキーワード集合を抽出し、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定することと、前記所定の時点は現在時点と関連して決定され、
前記所定の時点よりも後に発生したユーザ操作ログ集合から第2のキーワード集合を抽出し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定することと、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値は、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値よりも大きく、
ユーザによるウェブサイトコンテンツを求める次のリクエストの前に、
前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させて第3のキーワード集合を得て、前記第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定することと、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させることは、
前記第1のキーワード集合及び前記第2のキーワード集合の両方で見いだされるキーワード集合の重複キーワードを識別すること、
前記識別された重複キーワードを前記第3のキーワード集合に含ませること、
前記識別された重複キーワードについての結合重み値を、前記第1のキーワード集合用に決定された前記重複キーワードの重み値と、前記第2のキーワード集合用に決定された前記重複キーワードの重み値とに少なくとも部分的に基づいて決定すること、を含み、
前記第3のキーワード集合を、前記ユーザにお勧めされる可能性があるデータのデータベースと突き合わせることと、
あるデータが前記第3のキーワード集合からの少なくとも1つのキーワードに一致することが決定された場合に、前記ユーザによるウェブサイトコンテンツの前記次のリクエストに応じて、そのデータを前記ユーザにお勧めされるデータとして決定することと、
を備える方法。
【請求項12】
請求項11に記載の方法であって、
各ユーザ操作ログは、少なくとも、タイムスタンプと、ユーザ動作と、関連付けられているキーワードとを含む、方法。
【請求項13】
請求項11に記載の方法であって、
前記データは、オンライン広告を含む、方法。
【請求項14】
請求項11に記載の方法であって、
前記第1のキーワード集合を抽出することは、更に、
前記所定の時点よりも前のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、
各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、
前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル3の優先レベルに割り当てることと、
前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、
関連付けられている優先レベルが最も高い所定数のキーワードを前記第1のキーワード集合であるとして決定することと、
を含む、方法。
【請求項15】
請求項11に記載の方法であって、
前記第2のキーワード集合を抽出することは、更に、
前記所定の時点よりも後のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、
各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、
前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル3の優先レベルに割り当てることと、
前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、
関連付けられている優先レベルが最も高い所定数のキーワードを前記第2のキーワード集合であるとして決定することと、
を含む、方法。
【請求項16】
請求項11に記載の方法であって、
前記第1のキーワード集合は、第1の時間間隔ごとに抽出され、前記第2のキーワード集合は、第2の時間間隔ごとに抽出され、前記第1の時間間隔は、前記第2の時間間隔よりも大きい、方法。
【請求項17】
請求項11に記載の方法であって、更に、
制限を超えた場合に、比較的低い重み値に関連付けられている1つ以上のキーワードを前記第3のキーワード集合から排除することによって、前記第3のキーワード集合に含められるキーワードの数に対して前記制限を維持することを備える方法。
【請求項18】
請求項11に記載の方法であって、
前記第3のキーワード集合を、お勧めされる可能性がある前記データと突き合わせることは、前記データに関連付けられているキーワードが前記第3のキーワード集合からのいずれかのキーワードに一致するか否かを決定することを含む、方法。
【請求項19】
請求項11に記載の方法であって、更に、
前記ユーザにお勧めされることになる前記データを、ウェブサイトコンテンツを求める前記次のリクエストに応答し、前記ユーザに関連付けられているデバイスに送信することを備える方法。
【請求項20】
お勧めデータを決定するためのコンピュータプログラムであって、
所定の時点よりも前に発生したユーザ操作ログ集合から第1のキーワード集合を抽出し、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定するための機能と、前記所定の時点は現在時点と関連して決定され、
前記所定の時点よりも後に発生したユーザ操作ログ集合から第2のキーワード集合を抽出し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定するための機能と、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値は、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値よりも大きく、
ユーザによるウェブサイトコンテンツを求める次のリクエストの前に、
前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させて第3のキーワード集合を得て、前記第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定するための機能と、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させることは、
前記第1のキーワード集合及び前記第2のキーワード集合の両方で見いだされるキーワード集合の重複キーワードを識別すること、
前記識別された重複キーワードを前記第3のキーワード集合に含ませること、
前記識別された重複キーワードについての結合重み値を、前記第1のキーワード集合用に決定された前記重複キーワードの重み値と、前記第2のキーワード集合用に決定された前記重複キーワードの重み値とに少なくとも部分的に基づいて決定すること、を含み、
前記第3のキーワード集合を、前記ユーザにお勧めされる可能性があるデータのデータベースと突き合わせるための機能と、
前記第3のキーワード集合からの少なくとも1つのキーワードにあるデータが一致することが決定された場合に、前記ユーザによるウェブサイトコンテンツの前記次のリクエストに応じて、そのデータを前記ユーザにお勧めされるデータとして決定するための機能と、
をコンピュータによって実現させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本出願は、あらゆる目的のために、参照によって本明細書に組み込まれる、2011年4月25日に出願された発明の名称を「A RECOMMENDATION DATA PUSHING METHOD AND SYSTEM(お勧めデータプッシングの方法及びシステム)」とする中国特許出願第20111014248.9号に基づく優先権を主張する。
【0002】
本出願は、データ処理技術を伴い、特に、お勧めデータを決定するための技術を伴う。
【背景技術】
【0003】
ウェブサイトでは、ユーザに対してお勧めデータが提示されることがある。お勧めデータは、ユーザが閲覧した又は現時点で閲覧しているウェブページに関係するオンラインの広告及び/又は製品のお勧めを含むことができる。
【0004】
インターネット広告掲載を含むお勧めデータを例にとる。ウェブサイトに広告を掲載する幾つかの従来技術では、所定の広告が所定の長さの期間にわたってウェブサイト上の固定された位置に表示される。この技術によって表示される広告は、ウェブサイトを訪問する全てのユーザが見ることができ、要するに、そのウェブサイトを訪問するどのユーザも、同じ広告を閲覧することができる。多くの場合、このタイプの広告掲載技術は、ウェブサイトを訪問するユーザ間の個人差を考慮に入れておらず、したがって、これらの広告掲載技術の有効性は、比較的乏しい。これを受けて、特定のユーザにターゲットを定めた広告掲載が、より良く個々のウェブサイト訪問者に応じられることが分かってきた。
【0005】
ターゲットを定めた幾つかの従来の広告掲載システムでは、ユーザが現時点で閲覧しているコンテンツに基づいて、そのユーザ用に広告が選択され、ウェブサイト上の所定位置に表示される。例えば、ユーザがウェブページを閲覧する過程において、ウェブサイトを運営しているウェブサーバは、ユーザが閲覧を実施しているクライアントデバイスによって送信されたウェブページデータリクエストを受信し、ウェブサイトのコンテンツとして表示される、リクエストされたウェブページデータを取得する。次いで、このウェブサイトコンテンツ上に表示されることになる広告が決定され、その広告データは、クライアントデバイスに表示されることになるリクエストされたウェブサイトコンテンツとともに返される。しかしながら、ターゲットを定めたこの広告掲載技術の欠点は、1つには、ウェブサイトコンテンツに基づいて決定される広告データが、各ウェブサイトに表示することができるコンテンツの多様性ゆえに、ユーザの関心に正確には一致していないかもしれないことである。
【0006】
更に、ターゲットを定めた幾つかの従来の広告掲載システムでは、広告掲載の決定が、ウェブサイトコンテンツを求めるユーザリクエストの受信に応答してリアルタイムでなされる。したがって、ウェブサーバにおける大量のデータ解析を伴うであろうリアルタイム決定は、頻繁に実施される必要があるだろう。しかしながら、ウェブサーバにおける頻繁なデータ処理は、非効率的であると考えられ、また、ウェブサイトトラフィックが多いときなどは特に、ウェブサイトコンテンツを求めるクライアントリクエストへの応答時間を遅くする恐れがある。
【図面の簡単な説明】
【0007】
以下の詳細な説明及び添付の図面において、発明の様々な実施形態が開示される。
【0008】
図1】お勧めデータを決定するためのシステムの一実施形態を示す図である。
【0009】
図2】お勧めデータを決定するためのプロセスの一実施形態を示すフローチャートである。
【0010】
図3】ユーザ操作ログ集合からキーワード集合を抽出するための及びそのキーワード集合の中の少なくとも1つのキーワードについての重み値を決定するためのプロセスの一実施形態を示すフローチャートである。
【0011】
図4】第1のキーワード集合と第2のキーワード集合とを合体させるためのプロセスの一実施形態を示すフローチャートである。
【0012】
図5】お勧めデータを決定するためのシステムの一実施形態を示す図である。
【0013】
図6】第1の計算要素の一実施形態を示す図である。
【0014】
図7】第1の計算要素又は第2の計算要素の一実施形態を示す図である。
【発明を実施するための形態】
【0015】
発明は、プロセス、装置、システム、合成物、コンピュータ読み取り可能ストレージ媒体に実装されたコンピュータプログラム製品、並びに/又は結合先のメモリに保存された命令及び/若しくは結合先のメモリによって提供される命令を実行するように構成されたプロセッサのようなプロセッサなどの、数々の形態で実現することができる。本明細書では、これらの実現形態又は発明がとりうるその他のあらゆる形態が、技術と称されてよい。総じて、開示されたプロセスのステップの順序は、発明の範囲内で変更されてよい。別途明記されない限り、タスクを実施するように構成されたものとして説明されるプロセッサ又はメモリなどのコンポーネントは、所定時にタスクを実施するように一時的に構成された汎用コンポーネントとして、又はタスクを実施するように製造された特殊コンポーネントとして実装されてよい。本明細書で使用される「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された1つ以上のデバイス、回路、並びに/又は処理コアを言う。
【0016】
発明の原理を例示す添付の図面とともに、以下で、発明の1つ以上の実施形態の詳細な説明が提供される。発明は、このような実施形態との関わりのもとで説明されるが、いずれの実施形態にも限定されない。発明の範囲は、特許請求の範囲によってのみ限定され、発明は、数々の代替形態、変更形態、及び均等物を網羅している。以下の説明では、発明の完全な理解を与えるために、数々の具体的詳細が明記される。これらの詳細は、例示を目的として提供されるものであり、発明は、これらの詳細の一部又は全部を伴わずとも、特許請求の範囲にしたがって実施することができる。明瞭さを期するために、発明に関係する技術分野において知られる技術要素は、発明が不必要に不明瞭にされないように、詳細な説明を省略されている。
【0017】
お勧めデータを決定することが開示される。ウェブサイトにおけるユーザによるデータリクエストに応答したリアルタイムなお勧めデータ生成は、非効率的で遅いと考えられ、したがって、お勧めデータは、事前に決定して格納することが可能である。お勧めデータの例として、ユーザが現時点で訪問しているウェブサイトに掲載されることになる広告、及び/又はウェブサイトを現時点で訪問しているユーザにお勧めされることになる製品が挙げられる。したがって、その後ユーザがそのウェブサイトにおいてデータをリクエストしたときは、事前に決定されたお勧めデータの少なくとも幾らかを読み出して、リクエストされたコンテンツとともにウェブサイトにおいてユーザに対してプッシュされる。お勧めデータは、1つ以上のウェブサイトに関連付けられているユーザの過去操作ログに基づいて、そのユーザについて作成される。例えば、ユーザ操作ログとしては、(1つ以上の)ウェブサイトにユーザが訪問/アクセスしている最中における、タイムスタンプと、(1つ以上の)ウェブサイト上におけるユーザによるクリック動作、検索動作、閲覧動作、及びお気に入り追加動作と、(1つ以上の)ウェブサイトにおけるユーザ動作に関連付けられているキーワードとが挙げられる。ユーザに対するお勧めデータは、ユーザの過去ユーザ操作ログから抽出されたキーワードに少なくとも部分的に基づいて決定される。過去操作ログは、一人のユーザについて大量に記憶されているかもしれないので、大量のユーザ操作ログ全体からキーワードを抽出することは、非効率的である。様々な実施形態において、操作ログを2つの集合に、すなわち所定の時点よりも前に記録されたユーザ操作ログを含む1つの集合と、所定の時点よりも後に記録されたユーザ操作ログを含む第2の集合とに分割する一時点が、事前に決定される。例えば、所定の時点は、最近の3日間のように、ウェブサイトにおけるユーザの現訪問日時に関係するように構成することができる。その例では、一方のユーザ操作ログ集合が、ここ3日間中にユーザについて記録されたものを含むことができる一方で、もう一方のユーザ操作ログ集合は、ユーザがウェブサイトを最初に訪問したときから現日付の3日前までにユーザについて記録されたものを含むことができる。
【0018】
様々な実施形態において、キーワード抽出及び重み付け計算は、所定の時点よりも前に発生したユーザ操作ログ集合及び所定の時点よりも後に発生したユーザ操作ログ集合に対し、別々に実施される。一部の実施形態では、現時点に近い時点で発生したユーザ操作ログから抽出されたキーワード(すなわち、所定の時点よりも後のユーザ操作ログ集合から抽出されたキーワード)が、それらがユーザの最も新しい関心をより良く表していると想定されるゆえに、より高い重み値を割り振られる一方で、現時点から遠い時点で発生したユーザ操作ログから抽出されたキーワード(すなわち、所定の時点よりも前のユーザ操作ログ集合から抽出されたキーワード)は、それらが古くて恐らくは賞味期限の切れたユーザの関心を表していると想定されるゆえに、より低い重み値が割り振られる。様々な実施形態において、所定の時点よりも前のタイムスタンプに関連付けられているユーザ操作ログ集合は、大きめの周期的値を使用して周期的に処理され、所定の時点よりも後のタイムスタンプに関連付けられているユーザ操作ログ集合は、小さめの周期的値を使用して周期的に処理される(すなわち、所定の時点よりも前に発生したユーザ操作ログ集合は、所定の時点よりも後に発生したユーザ操作ログよりも低い頻度で処理される)。一部の実施形態では、所定の時点よりも後に発生したユーザ操作集合は、ひいては、ユーザがウェブページにアクセスしていること及び/又はユーザがウェブサイトコンテンツをリクエストしていることをウェブサーバが決定した時点でも処理されてよい。一部の実施形態では、所定の時点よりも前に及び所定の時点よりも後に発生したユーザ操作ログ集合から抽出されたキーワードは、記憶させてユーザが次にウェブサイトを訪問したときにユーザに送信するためのお勧めデータを決定するために使用される。
【0019】
ユーザが次にウェブサイトを訪問したときは、もはや、ユーザによってリクエストされたウェブページデータに基づいてお勧めデータをリアルタイムに決定する必要はない。その代わり、ユーザに対応するお勧めデータが、そのユーザ用に既に事前に決定されているので、単純に、お勧めデータをストレージから取り出すことが可能である。たとえもし、ユーザがウェブサーバを訪問している時点で、ウェブサーバが所定の時点よりも後のタイムスタンプに関連付けられているユーザ操作ログ集合を処理しているとしても、処理されるデータの量は、全ユーザ操作ログに関連付けられているデータの量と比べると比較的小さく、したがって、お勧めデータを決定するための処理量は、大幅に軽減される。
【0020】
図1は、お勧めデータを決定するためのシステムの一実施形態を示す図である。この例では、システム100は、クライアント102と、ネットワーク104と、サーバ106と、データベース108とを含む。ネットワーク104は、高速データネットワーク及び/又は電気通信ネットワークを含んでいてよい。
【0021】
サーバ106は、サーバ106によって運営されているウェブサイトにアクセスするユーザに関連付けられているユーザ操作ログを記録するように構成されている。サーバ106は、例えば、データベース108にユーザ操作ログを記憶させることができる。例えば、ユーザ操作ログとしては、(1つ以上の)ウェブサイトにユーザが訪問/アクセスしている最中における、タイムスタンプと、(1つ以上の)ウェブサイトにおけるユーザによるクリック動作、検索動作、閲覧動作、及びお気に入り追加動作と、(1つ以上の)ウェブサイトにおけるユーザ動作に関連付けられているキーワードとが挙げられる。クライアント102は、ラップトップコンピュータ、デスクトップコンピュータ、タブレット、モバイルデバイス、スマートフォン、又はその他の任意のコンピューティングデバイスであることができる。一部の実施形態では、ウェブブラウザアプリケーションが、クライアント102にインストールされ、サーバ106によって運営されているウェブサイトに関連付けられているウェブページにユーザがアクセスすることを可能にしている。サーバ106は、1つの又は複数のデバイスを含んでいてよい。
【0022】
サーバ106は、ユーザ用に、データベース108から読み出されたそのユーザについての記録されたユーザ操作ログに基づいて、ウェブサイトにおけるユーザの関心を表すために使用されるキーワード集合を決定するように構成されている。ユーザについて決定されるこのキーワード集合は、ユーザにお勧めされる可能性があるデータ(例えば、ユーザに対して提示されることになるオンライン広告)のデータベースと突き合わせるために使用することができる。一部の実施形態では、ユーザにお勧めされるものとして決定されるデータは、データベース108に記憶され、したがって、ユーザが、サーバ106によって運営されているウェブサイトにクライアント102を使用して次に訪問したときは、ユーザによってリクエストされたその他のウェブサイトコンテンツに加えて、ユーザにお勧めするためのこのようなデータの少なくとも1つが、クライアント102においてユーザ用に表示される。ユーザの関心を表すこのキーワード集合がどのように決定されるかは、以下で更に詳しく説明される。
【0023】
図2は、お勧めデータを決定するためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス200は、システム100において実行に移すことができる。
【0024】
プロセス200は、ウェブサイトコンテンツを求めるユーザのリクエスト(例えば、ユーザがウェブサイトを訪問すること及び/又はウェブサイトにおいて選択可能エレメントを選択したこと)の受信に応答して開始させることができる。一部の実施形態では、プロセス200の開始前に、一時点が決定される。例えば、当該時点は、現時点から一定期間を隔てた時点であることができる。一時点の一例として、現時点から3日前が挙げられる。
【0025】
一部の実施形態では、特定のユーザについて記録された全ての過去ユーザ操作ログを読み出すことができる。例えば、ユーザ操作ログとしては、(1つ以上の)ウェブサイトにユーザが訪問/アクセスしている最中における、タイムスタンプと、(1つ以上の)ウェブサイトにおけるユーザによるクリック動作、検索動作、閲覧動作、及びお気に入り追加動作と、(1つ以上の)ウェブサイトにおけるユーザ動作に関連付けられているキーワードとが挙げられる。一部の実施形態では、関連のユーザ操作ログを識別するために使用されることになるユーザ識別情報は、ユーザが登録アカウントを使用してウェブサイトにログインした後に得られてよい、又はユーザについて知られているIPアドレス若しくはその他の情報に基づいてウェブサーバによって決定されてよい。例えば、もし、ユーザがウェブサイトの登録ユーザであるならば、そのユーザは、ユーザアカウントを通じてウェブサイトに登録及びログインしたときは、アカウントのユーザIDによって識別することができ、ユーザ操作ログの読み出しは、ユーザIDに基づくことができる。もし、ユーザが登録ユーザではない又はユーザがアカウントを通じてログインしていないならば、そのユーザの操作ログは、ユーザのクッキーに基づいて読み出すことができる。
【0026】
一部の実施形態では、読み出されたユーザ操作ログは、2つの集合に、すなわち所定の時点よりも前に発生した一方の集合と、所定の時点よりも後に発生したもう一方の集合とに分割することができる。
【0027】
ステップ202では、所定の時点よりも前に発生したユーザ操作ログ集合から、第1のキーワード集合が抽出され、その第1のキーワード集合の中の少なくとも1つのキーワードについての重み値が決定される。一部の実施形態では、第1のキーワード集合は、所定の抽出技術/方式に少なくとも部分的に基づいて、所定の時点よりも前に発生したユーザ操作ログ集合から抽出される。
【0028】
ステップ204では、所定の時点よりも後に発生したユーザ操作ログ集合から、第2のキーワード集合が抽出され、その第2のキーワード集合の中の少なくとも1つのキーワードについての重み値が決定される。一部の実施形態では、第2のキーワード集合は、所定の抽出技術/方式に少なくとも部分的に基づいて、所定の時点よりも後に発生したユーザ操作ログ集合から抽出される。一部の実施形態では、第2のキーワード集合の中の各キーワードは、第1のキーワード集合の値に割り振られる重み値よりも高い重み値を割り振られる。なぜならば、第2のキーワード集合は、より最近のユーザの関心を表しており、したがって、第2のキーワード集合の重み値によって示されるように、より重視されるに値すると見なされるからである。
【0029】
一部の実施形態では、ステップ202またはステップ204は、いずれか一方がもう一方の前に実施されてよく、あるいはステップ202およびステップ204は、少なくとも重複する時間の最中に実施されてよい。
【0030】
一部の実施形態では、第1の期間を、各第1の期間の終わりに202が実施されるように設定することができる。一部の実施形態では、第2の期間を、各第2の期間の終わりにステップ204が実施されるように設定することができる。第1及び第2の期間のいずれか一方又は両方を設定することによって、各期間の終わりに第1及び第2の集合の抽出キーワードを定期的にリフレッシュさせ(すなわち、新しい集合に置き換わらせ)、より最近に記憶されたユーザ操作ログのキーワードをより良く反映させることができる。様々な実施形態において、第1の期間は、第2のキーワード集合が第1のキーワード集合よりも頻繁にリフレッシュされるように、第2の期間よりも長く設定される。例えば、第1の期間を1日に設定し、第2の期間を1時間に又はユーザがウェブサイトにアクセスするのに応答するように設定することができる。
【0031】
ステップ206では、第1のキーワード集合の少なくとも一部分と、第2のキーワード集合の少なくとも一部分とが合体されて、第3のキーワード集合が得られ、その第3のキーワード集合の中の少なくとも1つのキーワードについての重み値が決定される。一部の実施形態では、第1のキーワード集合と第2のキーワード集合とを合体させることは、第1のキーワード集合及び第2のキーワード集合の両方で見られる重複キーワードを識別することを含む。このような重複キーワードのそれぞれについて、第1のキーワード集合用に決定されたその重み値が、第2のキーワード集合用に決定されたその重み値と結合(例えば加算)される。この結合された重み値は、次いで、キーワードが第3のキーワード集合に含められる際に、そのキーワードに関連付けられる。第3のキーワード集合は、各重複キーワードを1つのみと、その重複キーワードに関連付けられている結合重み値とを含み、また、第1のキーワード集合及び第2のキーワード集合からのその他の非重複キーワードと、それらのキーワードが第1のキーワード集合及び第2のキーワード集合にある間に決定されたそれぞれの重み値とを含む。
【0032】
一部の実施形態では、ユーザについて決定された第3のキーワード集合は、そのユーザの関心を表していると見なされる。一部の実施形態では、第3のキーワード集合は、そのユーザ用に記憶される。
【0033】
ステップ208では、第3のキーワード集合が、お勧めされる可能性があるデータのデータベースと突き合わされる。一部の実施形態では、ユーザにお勧めされる可能性があるデータは、事前に決定されてデータベースに記憶される。例えば、このようなデータとしては、(例えば、ウェブサイトが電子商取引ウェブサイトであるならば、)オンライン広告及び/又は製品が挙げられる。
【0034】
ステップ210では、データベースからのあるデータが、第3のキーワード集合からの少なくとも1つのキーワードに一致すると決定された場合に、そのデータが、ユーザにお勧めされるものとして決定される。例えば、あるデータは、オンライン広告であって、1つ以上の入札ワード/キーワード/メタデータに関連付けられていてよく、そのデータに関連付けられている入札ワード/キーワード/メタデータが、第3のキーワード集合の中のキーワードに一致する場合には、その広告は、ユーザがウェブサイトコンテンツをリクエストしたときに、ユーザに対して表示される。別の例では、第3のキーワード集合とデータとを突き合わせるにあたり、BM25又はベクトル空間モデルなどの、既知の突き合わせ技術が使用されてよい。
【0035】
一部の実施形態では、一致したデータが、ユーザによってリクエストされた幾らかのウェブサイトコンテンツとともにユーザに対して表示されるために送信される。一部の実施形態では、プロセス200の実施後、更なるウェブサイトコンテンツを求めるユーザリクエストに応答し、ユーザにお勧めされるものとして決定された少なくとも1つのデータ(例えば、ターゲットを定めたオンライン広告)をユーザに対して提示することができる。例えば、あるウェブサイトにおいて、そのウェブサイトを少なくとも幾らかの新しいコンテンツでリフレッシュさせる選択可能エレメントをユーザが選択するたびに、リクエストされたコンテンツとともに、ユーザにお勧めされるものとして決定された1つ以上のデータがクライアントデバイスに送信される。
【0036】
図3は、ユーザ操作ログ集合からキーワード集合を抽出するための及びそのキーワード集合の中の少なくとも1つのキーワードについての重み値を決定するためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス300は、システム100において実行に移すことができる。
【0037】
一部の実施形態では、プロセス300は、所定の時点よりも前に発生した読み出されたユーザ操作ログ集合から第1のキーワード集合を抽出するために実施される(例えばステップ202)。一部の実施形態では、プロセス300は、所定の時点よりも後に発生した読み出されたユーザ操作ログ集合から第2のキーワード集合を抽出するためにも実施される(例えばステップ204)。言い換えると、プロセス300は、プロセス200のステップ202および/または204を実施するために使用することができる。しかしながら、一部の実施形態では、プロセス300は、プロセス200のステップ202を、プロセス200のステップ204とは異なる周期的間隔で実施するために使用することができる。
【0038】
プロセス300は、読み出された全ユーザ操作ログの一部(所定の時点よりも前に発生した読み出されたユーザ操作ログ集合からの第1のキーワード集合及び所定の時点よりも後に発生した読み出されたユーザ操作ログ集合からの第2のキーワード集合)をそれぞれステップ202および204などで処理するために使用されるのではなく、読み出された全ユーザ操作ログを一度に処理するために使用することができるが、その一方で、読み出された全ユーザ操作ログは、大量になって、その処理が低速になる恐れがある。更に、全ユーザ操作ログが一度に処理されるときに、現時点におけるユーザの関心が見落とされるかもしれない。しかしながら、所定の時点よりも前に発生した読み出されたユーザ操作ログ集合からの第1のキーワード集合と、所定の時点よりも後に発生した読み出されたユーザ操作ログ集合からの第2のキーワード集合とを、別々に(例えば異なる時点で)処理すれば、各データ集合は、小さくなり、したがって、より高速に処理することができる。所定の時点よりも前に発生し読み出されたユーザ操作ログ集合からの第1のキーワード集合(プロセス200のステップ202)が、既に処理され、その結果を記憶されている一方で、所定の時点よりも後に発生した読み出されたユーザ操作ログ集合からの第2のキーワード集合(プロセス200のステップ204)は、ユーザがウェブページにアクセスしたときも発生することができる。所定の時点よりも後に発生したユーザ操作ログの中から別途キーワードを抽出すれば、ユーザがその意図を最近変更した可能性が考慮に入れられ、したがって、そのようにしてそこから抽出されたキーワードは、所定の時点よりも前に発生したユーザ操作ログ集合から抽出されたキーワードよりも、より良くユーザ意図を反映したものになる。
【0039】
一部の実施形態では、ユーザ操作ログ集合から抽出されたキーワード集合の中の各キーワードを、それぞれに決定されたそれらの重み値とともに、形式<キーワード、重み値>の二次元ベクトルとして記憶させることができる。抽出されたキーワードは、過去におけるユーザの関心を表すために使用され、それぞれのキーワードの重み値は、そのキーワードに対してユーザが示す関心のレベルを表している。例えば、特定のユーザのユーザ操作ログから抽出されたキーワード集合が、{<ワイン,14.1586>、<Sitir liquor(四特酒),9.29328>、<低級蒸留酒,3.74181>、<Zhongliang Great Wall(中米良長城),3.22576>、<Changyu(張裕),3.1076>}であるならば、ユーザは、ワインに対して最も強く関心があり、次いで、Sitir liquor、低級蒸留酒等などと続くと結論付けることができる。
【0040】
ステップ302では、ユーザ操作ログ集合に含まれる少なくとも一部のキーワードのそれぞれに割り振られた優先レベル値に少なくとも部分的に基づいて、ユーザ操作ログ集合からキーワード集合が抽出される。一部の実施形態では、優先レベル値は、ユーザ操作ログ集合に含まれる全キーワードの少なくとも一部のキーワードのそれぞれに割り振られる。値を割り振られたキーワードは、次いで、ランク付けされ、関連付けられている優先レベルが最も高い、所定数のキーワードがキーワード集合として抽出される。
【0041】
以下は、ステップ302を実行するための技術の一例である。
【0042】
プロセス300の実行に先立って、製品ワードリスト及び入札ワードリストをそれぞれ設定することができる。製品ワードリストは、全カテゴリの製品ワード(例えば製品名)又は幾つかのカテゴリの製品ワードに基づいて確立されるデータベースであってよい。入札ワードリストは、広告提供者が入札することができる広告キーワードに対応していてよい。
【0043】
まず、操作ログ集合から所定数の中心ワードを抽出するために、中心ワード抽出方法が使用される。様々な実施形態において、「中心ワード」は、何らかの測定基準/算定に基づいて、ワード集合の中の少なくとも幾つかのその他のワードよりも統計的に重要であるものとして決定されたワードである。任意の既知の中心ワード抽出技術が使用可能である。例えば、操作ログ集合に含まれる各キーワードのtf-idf重み及び/又はその他の統計値が、(既知の技術を使用して)決定されてよく、最も高いtf-idf重み及び/又は統計値を有するキーワードが、中心ワードと見なされる。例えば、もし、操作ログ集合に含まれるキーワードが、「韓国語でYESがプリントされた、ウエスト周りが緩い婦人物のカジュアルドレス2011-T-9の卸売提供を申し出る」を含むならば、この集合から抽出される中心ワードには、「婦人物」、「韓国語」、「プリント」、「ウエスト」、「カジュアル」、及び「ドレス」があると考えられる。抽出された各中心ワードは、レベル1の優先レベルを割り振られる。この例では、3つの異なる優先レベルがあり、優先レベル1<優先レベル2<優先レベル3である。
【0044】
第2に、抽出された各中心ワードが、所定の製品ワードリストに含まれる製品ワードと突き合わされる。ある中心ワードがある製品ワードに一致する場合には、その製品ワードは、製品ワードリストから抽出され、対応する中心ワードの優先レベルは、優先レベル2に引き上げられる。
【0045】
第3に、抽出された各製品ワードが、所定の入札ワードリストに含まれる入札ワードと突き合わされる。抽出されたある製品ワードが、入札ワードリストからのあるワードに一致する場合には、その入札ワードは、入札ワードリストから抽出され、対応する中心ワードの優先レベルは、優先レベル3に引き上げられる。
【0046】
第4に、中心ワードの集合が、上述のように割り振られたそのそれぞれの優先レベルによってランク付けされる。次いで、ランク付けされた中心ワードの中から、関連付けられている優先レベルが最も高い所定数の中心ワードが抽出される。関連付けられている優先レベルが最も高い抽出された中心ワードからなるこの集合は、ユーザ操作ログ集合から抽出されたキーワード集合であると見なされる。
【0047】
ステップ304では、キーワード集合からの少なくとも1つのキーワードについての重み値が決定される。一部の実施形態では、ユーザ操作ログ集合から抽出された各キーワードについての重み値が決定される。
【0048】
以下は、ステップ304を実行するための技術の一例である。
【0049】
まず、現日付などの既定の時点が決定される。現日付などのこの既定の時点から始まって、この時点に先行する時間は、所定の時間間隔にしたがって幾つかの時間区分に分割される。例えば、時間間隔は、X日、Y時間、1時間、又は30分に設定されてよい。このような各時間区分には、順序番号が割り振られる。
【0050】
第2に、キーワード集合の中の各キーワードについて、そのキーワードが各時間区分中にユーザ操作ログ集合内で発生する回数が決定される。
【0051】
第3に、キーワード集合の中の各キーワードについて、所定の重み関数と、時間区分の順序番号と、各時間区分中にユーザ操作ログ集合内でキーワードが(例えば、検索動作や閲覧動作などの様々なタイプのユーザ動作にわたって)発生する回数とに基づいて、重み値が決定される。
【0052】
一部の実施形態では、時間区分の順序番号は、選択された重み関数に依存する。一部の実施形態では、重み関数が増加関数であ場合には、各時間区分の順序番号は、次のように決定される。すなわち、現日付からの時間距離にしたがって、遠く離れた(すなわち、現日付よりも時間的に早い)時間区分であるほどその順序番号は小さく、近い(すなわち、現日付に時間的に近い)時間区分であるほどその順序番号は大きい。
【0053】
その他の一部の実施形態では、もし、重み関数が減少関数であるならば、各時間区分の順序番号は、以下の例に示されるように決定されてよい。
【0054】
この例では、時間間隔は1日であり、したがって、各時間区分は長さが1日であり、キーワード集合の中の各キーワードについての重み値(「重み(キーワード)」)を計算するために、以下の式が使用されてよい。
【0055】
【数1】
【0056】
ここで、tiは、所定の日付から幾日離れているかを表し、kは、現日付に至るまでの総日数(時間区分の総数)を表し、n(ti)は、tiに関連付けられている日付における(全タイプのユーザ動作にわたる)キーワードの発生回数を表し、f(ti)は、tiに関する減少重み関数を表している。式(1)では、tiに関連付けられている日付が現日付から離れているほど、キーワードについて決定される値f(ti)×n(ti)は小さい。例えば、重み関数f(ti)は、ユーザの関心を中心ワードで表すということと、より初期のユーザ操作に関連付けられているキーワードの方が、より最近のユーザ操作に関連付けられているキーワードよりもユーザにとって関心が薄いという前提とをともに反映することができる限り、tiが大きくなるほど値が減少する任意の適切な関数として選択されてよい。例えば、重み関数f(ti)として、パラメータaに適切な値を割り当てることができる
【数2】
を選択することができる。
【0057】
以下は、式(1)を使用してキーワード集合の中のキーワードについての重み値を決定する一例である。
【0058】
時間間隔が1日であり、期間内における既定の地点が現日付(8日目)であると仮定する。ユーザ操作ログ集合の期間は、キーワードWについての検索が10回あった直近の7日間からなる。閲覧された100のウェブページのうち、27のウェブページが、下記の表1に示されるような日ごとの頻度でキーワードWを含んでいた。
【0059】
【表1】
【0060】
この例では、f(t)として、パラメータaの値を適宜選択される関数
【数3】
を選択することができ、n(ti)は、tiに関連付けられている日付におけるキーワードWの検索頻度と、キーワードWを含む閲覧されたウェブページの総数とを足し合わせることによって決定される。上述されたように、tiは、現日付である日付8から離れている日数を表すので、ti=1に関連付けられている日付は日付7を示し、ti=2に関連付けられている日付は日付6を示し、ti=3に関連付けられている日付は日付5を示し、ti=4に関連付けられている日付は日付4を示し、ti=5に関連付けられている日付は日付3を示し、ti=6に関連付けられている日付は日付2を示し、ti=7に関連付けられている日付は日付1を示す。更に、n(ti)は、日付iにおけるキーワードの(検索や閲覧などのあらゆるタイプのユーザ動作にわたる)発生回数を表すので、n(ti)は、1つ以上のタイプのユーザ動作に関連付けられているキーワードの発生頻度の和である。現行の例にあてはめると、n(ti)は、tiに関連付けられている日付における、キーワードWの検索頻度と、キーワードWを含む閲覧されたウェブページの総数との和になる。
【0061】
日付8である既定の時点よりも前のキーワードWの重み値を決定するために、以下のように、表1の値を式(1)あてはめることができる。
【0062】
【数4】
【0063】
図4は、第1のキーワード集合と第2のキーワード集合とを合体させるためのプロセスの一実施形態を示すフローチャートである。一部の実施形態ではプロセス400は、システム100において実行に移される。一部の実施形態では、プロセス400は、プロセス200のステップ206を実行に移すために使用することができる。
【0064】
ステップ402では、所定の時点よりも前に発生したユーザ操作ログ集合から抽出された第1のキーワード集合と、所定の時点よりも後に発生したユーザ操作ログ集合から抽出された第2のキーワード集合とが合体されて、第3のキーワード集合になる。第3のキーワード集合は、第1のキーワード集合及び第2のキーワード集合の両方を含むことができる。
【0065】
ステップ404では、第1のキーワード集合及び第2のキーワード集合の両方で見られる第3のキーワード集合の重複キーワードが識別される。重複キーワードは、第1のキーワード集合及び第2のキーワード集合の両方で現れるキーワードであり、識別される。例えば、キーワード「キーボード」が第1のキーワード集合及び第2のキーワード集合の両方で現れる場合には、「キーボード」は、重複キーワードとして識別される。
【0066】
ステップ406では、(第1のキーワード集合に含まれていたときと第2のキーワード集合に含まれていたときとで、同じキーワードについて別々の重み値が決定されているので、)第1のキーワード集合用に決定された重複キーワードの重み値と、第2のキーワード集合用に決定された重複キーワードの重み値とに少なくとも部分的に基づいて、識別された重複キーワードについての結合重み値が決定される。引き続き先述の例において、例えば、第1のキーワード集合において「キーボード」について決定された重み値がW1であり、第2のキーワード集合において「キーボード」について決定された重み値がW2である場合には、第3のキーワード集合における「キーボード」についての結合重み値は、W1+W2である。重複キーワードの結合重み値は、第3のキーワード集合の中の一キーワードに関連付けることができる。したがって、第3のキーワード集合の中にある重複キーワードは1つずつであり、結合重み値に関連付けられている。更に、第3のキーワード集合の中で重複キーワードではないキーワードは、第1のキーワード集合において又は第2のキーワード集合においてのいずれかで決定されたそれぞれの重み値に関連付けられている。
【0067】
一部の実施形態では、第3のキーワード集合の中に含まれるキーワードの数が制限を超えた場合にそれらのキーワードをそれぞれの重み値によってランク付けすることができるように、第3のキーワード集合のなかに含めることができるキーワードの数に対し、予め制限を設定することができる。そして、その制限がキーワードX個である場合には、重み値が高い順にX個のキーワードのみが第3のキーワード集合のなかに維持され、その他は排除/破棄される。
【0068】
例えば、ユーザ操作ログに含まれるキーワードが「アップル」だと仮定する。「アップル」は、一種の果物であるかもしれないし、電子機器ブランドでもあるかもしれないので、このキーワードを検索することによるユーザの意図が何なのかは、直ちに明らかではない。しかしながら、もし、ユーザの過去操作ログの解析から、「ノートブック」、「mp3」、「ノートブックアクセサリ」などのキーワードが得られたならば、ユーザの意図は、そのユーザについて決定された第3のキーワード集合によって表すことができる。例えば、{アップル、ノートブック、ノートブックアクセサリ}が、ユーザについて決定された第3のキーワード集合を構成していると仮定すると、「アップル」以外のキーワードは、電子機器製品に関連付けられているので、このキーワード集合から、ユーザの意図は、「アップル」ブランドの電子機器製品であると推測することができる。例えば、もし、ユーザに対して提示される可能性がある広告が、「アップル ノートブック」という入札ワードに関連付けられているならば、その広告は、「アップル 果物」という入札ワードに関連付けられている別の広告よりも、ユーザにふさわしいものであることができる。
【0069】
ユーザについて決定された第3のキーワード集合及び該第3のキーワード集合のそれぞれのキーワードの重み値は、ユーザの関心を表すものと見なされてよい。一部の実施形態では、ユーザの意図を表すものと見なされた第3のキーワード集合及び第3の集合の中のそれぞれのキーワードの重み値が、そのユーザ用に記憶される。一部の実施形態では、ユーザについて決定された第3のキーワード集合は、そのユーザにお勧めされる可能性がある様々なデータと突き合わせるために使用することができる。
【0070】
ターゲットを定めたオンライン広告掲載を例にとると、お勧めデータの決定は、以下のように適用することができる。すなわち、ターゲットを定めたオンライン広告掲載において、ウェブサイトに広告を載せることを希望する関係者は、そのターゲット市場に関連するキーワードを購入/入札してよい。通常は、ウェブサイトにおいてユーザが入力したクエリが、関係者による購入/入札キーワードに一致したときに、その関係者の広告は、ウェブサイトにおいてユーザに対して表示されるだろう。しかしながら、上述のようなお勧めデータ決定プロセスを適用すれば、ウェブサイトを以前訪問したことがある各ユーザについてキーワード集合(「第3のキーワード集合」)を決定し、そのユーザ用に記憶させることができる。次いで、そのユーザが次にウェブサイトを訪問したときは、そのユーザに関連付けられているキーワード集合の中の少なくとも1つのキーワードに関連付けられている広告が、そのユーザのために表示される。このようにすれば、表示される広告は、各ユーザのそれぞれの関心にかかわらずどのユーザに対しても同じ広告が表示されているのではなく、ウェブサイトを現在訪問しているユーザをターゲットに定めたものになる。例えば、ウェブサイト上の特定の広告スポットに対し、広告主Aは、この広告スペースを購入するときに、その広告のターゲットユーザを「スポーツ」に関心があるユーザであると指定することができ、一方で、別の広告主Bは、同じ広告スポットを購入し、その広告のターゲットユーザを「電子機器」に関心があるユーザであると指定することができる。このようにすれば、(アリスに関連付けられている第3のキーワード集合によって示されるように)「スポーツ」に関心があるユーザであるアリスがウェブサイトを訪問すると、上記広告スポットにおける広告掲載は、アリスについて決定されたキーワード「スポーツ」を広告主Aによって購入されたキーワード及び広告主Bによって購入されたキーワードと突き合わせることによって実施することができる。アリスについて決定されたキーワード「スポーツ」は、上記広告スポットに対して広告主Aが購入したキーワード「スポーツ」に一致するので、広告主A及びキーワード「スポーツ」に関連付けられている広告が表示される。複数の広告主が同じキーワードを購入/入札する必要があるときは、広告主によって提示された様々な入札に基づいてオークションが行われ、落札した広告主に関連付けられている広告が、関心を表すものとしてそのキーワードを決定されたユーザのために表示される。例えば、ユーザについて決定されたキーワードは、入札ワードリストに含められてよく、広告主は、その関連市場におけるユーザをターゲットに定めるために、入札ワードリストの中の1つ以上のキーワードに入札することができる。
【0071】
図5は、お勧めデータを決定するためのシステムの一実施形態を示す図である。
【0072】
要素及び部分要素は、1つ以上の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、プログラマブルロジックデバイス及び/若しくは特定の機能を実施するように設計された特殊用途向け集積回路などのハードウェアとして、又はそれらの組み合わせとして実装することができる。一部の実施形態では、要素及び部分要素は、本発明の実施形態で説明される方法を(パソコン、サーバ、ネットワーク機器などの)計算装置に実行させるための幾つかの命令を含み尚且つ(光ディスク、フラッシュストレージデバイス、モバイルハードディスクなどの)不揮発性のストレージ媒体に保存することができるソフトウェア製品の形で具現化することができる。要素及び部分要素は、1つのデバイスに実装されてよい、又は複数のデバイスに分散されてよい。
【0073】
システム500は、第1の計算要素510と、第2の計算要素520と、合体要素530と、突き合わせ要素540とを含む。第1の計算要素510は、所定の時点よりも前に発生したユーザ操作ログを読み出し、それらの操作ログに含まれる第1のキーワード集合を抽出し、第1のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定するように構成されている。
【0074】
第2の計算要素520は、所定の時点よりも後に発生したユーザ操作ログを読み出し、それらの操作ログに含まれる第2のキーワード集合を抽出し、第2のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定するように構成されている。
【0075】
合体要素530は、第1のキーワード集合と第2のキーワード集合との合体処理を実施し、第3のキーワード集合、及び該第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を得るように構成されている。
【0076】
突き合わせ要素640は、第3のキーワード集合に含まれるキーワードを、お勧めされる可能性がある所定のお勧めデータに関連付けられているキーワードと突き合わせ、お勧めされることになる1つ以上のお勧めデータを決定し、該決定されたお勧めデータをユーザが現時点で使用しているクライアントデバイスに送信するように構成されている。一部の実施形態では、突き合わせ要素540は、更に、以下の部分要素を含む。
【0077】
第3のキーワード集合に含まれるキーワードを所定のお勧めデータに関連付けられているキーワードと突き合わせ、お勧めされることになるお勧めデータを決定するように構成されている、突き合わせ部分要素。
【0078】
お勧めされることを決定されたお勧めデータ及びユーザによってリクエストされたウェブサイトコンテンツをユーザが使用しているクライアントデバイスに送信するように構成されている、配信部分要素。
【0079】
図6は、第1の計算要素の一実施形態を示す図である。一部の実施形態では、第1の計算要素510は、図6の例を使用して実装されてよい。第1の計算要素510は、分割部分要素610と、発見部分要素620と、計算部分要素630とを含んでいてよい。
【0080】
分割部分要素610は、所定の時間間隔に基づいて、例えば現日付などの既定の時点よりも前の時間を複数の時間区分に分割するように構成されている(ここでは、各時間区分が、所定の時間間隔の長さになる)。
【0081】
発見部分要素620は、各キーワードに関し、そのキーワードが各時間区分中に(1つ以上のタイプのユーザ動作に関連して)操作ログ内で発生する回数を決定するように構成されている。
【0082】
計算部分要素630は、所定の重み関数と、既定の時点から時間区分が離れている時間間隔と、各時間区分中におけるキーワードの発生関数とに基づいて、第1のキーワード集合の中の各キーワードについての重みを計算するように構成されている。
【0083】
図7は、第1の計算要素又は第2の計算要素の一実施形態を示す図である。一部の実施形態では、第1の計算要素510又は第2の計算要素520は、システム700を使用して実装されてよい。システム700は、第1の抽出部分要素710と、第2の抽出部分要素720と、第3の抽出部分要素730と、選択部分要素740とを含む。
【0084】
第1の抽出部分要素710は、操作ログ集合から第1の所定数の中心ワードを抽出し、各中心ワードの優先レベルを優先レベル1に設定するように構成されている。
【0085】
第2の抽出部分要素720は、各抽出された中心ワードを所定の製品ワードリストに含まれる製品ワードと突き合わせ、中心ワードに一致する製品ワードを抽出し、抽出された製品ワードに一致する中心ワードの優先レベルを優先レベル2に引き上げるように構成されている。
【0086】
第3の抽出部分要素730は、各抽出された製品ワードを所定の入札ワードリストに含まれる入札ワードと突き合わせ、(中心ワードに一致した)製品ワードに一致する入札ワードを抽出し、抽出された入札ワードに一致する中心ワードの優先レベルを優先レベル3に引き上げるように構成されている。
【0087】
選択部分要素740は、中心ワードをそれらのそれぞれの優先レベルにしたがってランク付けし、ランク付けされた中心ワードの中から優先レベルが高い順に第2の所定数のキーワードを選択してキーワード集合を構成するように構成されている。
【0088】
当該分野の当業者ならば、以上の実施形態で説明された技術を実現するプロセスが、プログラムされたコマンドに関連付けられているハードウェアを使用して達成可能であること、及び上記プログラムが、読み出し可能なストレージ媒体に記憶可能であることを理解することができ、上述された方法に含まれる対応するステップは、上記プログラムの実行中に実行される。ストレージ媒体は、ROM/RAM、フロッピィディスク、CDなどの媒体を含んでいてよい。
【0089】
上記の説明は、本出願を実現するための好ましい一手段にすぎず、当業者ならば、本出願の原則から逸脱しないという前提のもとで数々の改善及び潤色をなしうること、並びにそのような改善及び潤色もまた、本出願による保護の範囲内であると見なされるべきであることが、指摘されるべきである。
【0090】
以上の実施形態は、理解を明瞭にする目的で、幾らか詳細に説明されてきたが、発明は、与えられた詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、非限定的である。
適用例1:お勧めデータを決定するためのシステムであって、プロセッサであって、所定の時点よりも前に発生したユーザ操作ログ集合から第1のキーワード集合を抽出し、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定し、前記所定の時点よりも後に発生したユーザ操作ログ集合から第2のキーワード集合を抽出し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定し、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させて第3のキーワード集合を得て、前記第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定し、前記第3のキーワード集合を、ユーザにお勧めされる可能性があるデータのデータベースと突き合わせ、あるデータが前記第3のキーワード集合からの少なくとも1つのキーワードに一致することが決定された場合に、そのデータを前記ユーザにお勧めされるデータとして決定する、ように構成されているプロセッサと、前記プロセッサに結合され、前記プロセッサに命令を提供するように構成されているメモリと、を備える、システム。
適用例2:適用例1に記載の方法であって、キーワードについての重み値は、
【数5】
を使用して決定され、
tiは、既定の時点から何日離れているかを表し、kは、時間区分の総数を表し、n(ti)は、tiに関連付けられている日付における1つ以上のタイプのユーザ動作にわたる前記キーワードの発生回数を表し、f(ti)は、tiに関する減少重み関数を表している、方法。
適用例3:適用例1に記載のシステムであって、各ユーザ操作ログは、少なくとも、タイムスタンプと、ユーザ動作と、関連付けられているキーワードとを含む、システム。
適用例4:適用例1に記載のシステムであって、前記データは、オンライン広告を含む、システム。
適用例5:適用例1に記載のシステムであって、前記第1のキーワード集合の抽出は、更に、前記所定の時点よりも前のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、関連付けられている優先レベルが最も高い所定数のキーワードを前記第1のキーワード集合であるとして決定することと、を含む、システム。
適用例6:適用例1に記載のシステムであって、前記第2のキーワード集合の抽出は、更に、前記所定の時点よりも後のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、関連付けられている優先レベルが最も高い所定数のキーワードを前記第2のキーワード集合であるとして決定することと、を含む、システム。
適用例7:適用例1に記載のシステムであって、前記第1のキーワード集合は、第1の時間間隔ごとに抽出され、前記第2のキーワード集合は、第2の時間間隔ごとに抽出され、前記第1の時間間隔は、前記第2の時間間隔よりも大きい、システム。
適用例8:適用例1に記載のシステムであって、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させることは、
前記第1のキーワード集合及び前記第2のキーワード集合の両方で見いだされる前記第3のキーワード集合の重複キーワードを識別することと、前記識別された重複キーワードについての結合重み値を、前記第1のキーワード集合用に決定された前記重複キーワードの重み値と、前記第2のキーワード集合用に決定された前記重複キーワードの重み値とに少なくとも部分的に基づいて決定することと、を含む、システム。
適用例9:適用例8に記載のシステムであって、前記プロセッサは、更に、制限を超えた場合に、比較的低い重み値に関連付けられている1つ以上のキーワードを前記第3のキーワード集合から排除することによって、前記第3のキーワード集合に含められるキーワードの数に対して前記制限を維持するように構成されている、システム。
適用例10:適用例1に記載のシステムであって、前記第3のキーワード集合を、お勧めされる可能性があるデータと突き合わせることは、前記データに関連付けられているキーワードが前記第3のキーワード集合からのいずれかのキーワードに一致するか否かを決定することを含む、システム。
適用例11:適用例1に記載のシステムであって、前記プロセッサは、更に、前記ユーザにお勧めされることになる前記データを、ウェブサイトコンテンツを求めるリクエストに応答し、前記ユーザに関連付けられているデバイスに送信するように構成されている、システム。
適用例12:お勧めデータを決定するための方法であって、所定の時点よりも前に発生したユーザ操作ログ集合から第1のキーワード集合を抽出し、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定することと、前記所定の時点よりも後に発生したユーザ操作ログ集合から第2のキーワード集合を抽出し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定することと、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させて第3のキーワード集合を得て、前記第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定することと、前記第3のキーワード集合を、ユーザにお勧めされる可能性があるデータのデータベースと突き合わせることと、あるデータが前記第3のキーワード集合からの少なくとも1つのキーワードに一致することが決定された場合に、そのデータを前記ユーザにお勧めされるデータとして決定することと、を備える方法。
適用例13:適用例12に記載の方法であって、各ユーザ操作ログは、少なくとも、タイムスタンプと、ユーザ動作と、関連付けられているキーワードとを含む、方法。
適用例14:適用例12に記載の方法であって、前記データは、オンライン広告を含む、方法。
適用例15:適用例12に記載の方法であって、前記第1のキーワード集合を抽出することは、更に、前記所定の時点よりも前のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、関連付けられている優先レベルが最も高い所定数のキーワードを前記第1のキーワード集合であるとして決定することと、を含む、方法。
適用例16:適用例12に記載の方法であって、前記第2のキーワード集合を抽出することは、更に、前記所定の時点よりも後のタイムスタンプに関連付けられている前記操作ログ集合から所定数の中心ワードを抽出し、各中心ワードをレベル1の優先レベルに割り当てることと、各中心ワードを製品ワードリストの中のワードと突き合わせ、前記製品ワードリストの中のワードに一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記製品ワードリストの中のワードに一致した中心ワードのそれぞれを入札ワードリストに含まれる入札ワードと突き合わせ、前記製品ワードリストの中のワードに一致するとともに前記入札ワードリストからのワードにも一致する各中心ワードをレベル2の優先レベルに割り当てることと、前記中心ワードをそのそれぞれの優先レベルにしたがってランク付けすることと、関連付けられている優先レベルが最も高い所定数のキーワードを前記第2のキーワード集合であるとして決定することと、を含む、方法。
適用例17:適用例12に記載の方法であって、前記第1のキーワード集合は、第1の時間間隔ごとに抽出され、前記第2のキーワード集合は、第2の時間間隔ごとに抽出され、前記第1の時間間隔は、前記第2の時間間隔よりも大きい、方法。
適用例18:適用例12に記載の方法であって、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させることは、前記第1のキーワード集合及び前記第2のキーワード集合の両方に見られる前記第3のキーワード集合の重複キーワードを識別することと、前記識別された重複キーワードについての結合重み値を、前記第1のキーワード集合のために決定された前記重複キーワードの重み値と、前記第2のキーワード集合のために決定された前記重複キーワードの重み値とに少なくとも部分的に基づいて決定することと、を含む、方法。
適用例19:適用例18に記載の方法であって、更に、制限を超えた場合に、比較的低い重み値に関連付けられている1つ以上のキーワードを前記第3のキーワード集合から排除することによって、前記第3のキーワード集合に含められるキーワードの数に対して前記制限を維持することを備える方法。
適用例20:適用例12に記載の方法であって、前記第3のキーワード集合を、お勧めされる可能性があるデータと突き合わせることは、前記データに関連付けられているキーワードが前記第3のキーワード集合からのいずれかのキーワードに一致するか否かを決定することを含む、方法。
適用例21:適用例12に記載の方法であって、更に、前記ユーザにお勧めされることになる前記データを、ウェブサイトコンテンツを求めるリクエストに応答し、前記ユーザに関連付けられているデバイスに送信することを備える方法。
適用例22:非一時的なコンピュータ読み取り可能ストレージ媒体に実装された、お勧めデータを決定するためのコンピュータプログラム製品であって、所定の時点よりも前に発生したユーザ操作ログ集合から第1のキーワード集合を抽出し、前記第1のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定するためのコンピュータ命令と、前記所定の時点よりも後に発生したユーザ操作ログ集合から第2のキーワード集合を抽出し、前記第2のキーワード集合の中の少なくとも1つのキーワードについての重み値を決定するためのコンピュータ命令と、前記第1のキーワード集合の少なくとも一部分と、前記第2のキーワード集合の少なくとも一部分とを合体させて第3のキーワード集合を得て、前記第3のキーワード集合の中のキーワードの少なくとも1つについての重み値を決定するためのコンピュータ命令と、前記第3のキーワード集合を、ユーザにお勧めされる可能性があるデータのデータベースと突き合わせるためのコンピュータ命令と、前記第3のキーワード集合からの少なくとも1つのキーワードにあるデータが一致することが決定された場合に、そのデータを前記ユーザにお勧めされるデータとして決定するためのコンピュータ命令と、を備えるコンピュータプログラム製品。
図1
図2
図3
図4
図5
図6
図7