(58)【調査した分野】(Int.Cl.,DB名)
前記試験製品の第1のグループの前記関連付けられたトランザクションデータと前記試験製品の第2のグループの前記関連付けられたトランザクションデータとの比較に基づいて前記実効特性を前記選択することは、
前記関連付けられたデータを使用して、前記試験製品の第1のグループの複数の初期特性の個々の特性の第1の特性値を計算することと、
前記関連付けられたデータを使用して、前記試験製品の第2のグループの複数の初期特性の個々の特性の第2の特性値を計算することと、
前記第1の特性値と第2の特性値との間の差異を決定することと、
前記差異が所定の値よりも大きいという決定に応答して、前記個々の特性を実効特性として選択することと、を含む、請求項2に記載の方法。
前記過去のトランザクションデータに基づいて前記複数の実効特性の前記個々の特性の前記初期重みを前記決定することと、前記最終重みを得るために前記過去のトランザクションデータおよび前記所定のトレーニングモデルを使用して前記初期重みを前記トレーニングすることとは、
実効特性の初期重みを決定することと、
理論上のデータを計算するために前記過去のトランザクションデータおよび前記初期重みを前記所定のトレーニングモデルに置換することと、
実際のデータと前記理論上のデータとの間の差異を決定することと、
前記差異は所定の値より小さいという決定に応答して、前記初期重みが前記実効特性の最終重みであることを決定することと、を含む、請求項1に記載の方法。
前記理論上の順位付けスコアは、単一の特性の予測された値または特性の組み合わせの予測された値であり、前記実際の順位付けスコアは、前記理論上の順位付けスコアに対応する単一の特性の実際の値または特性の組み合わせの実際の値である、請求項7に記載の1つ以上のコンピュータで読み取り可能な媒体。
前記過去のトランザクションデータに基づいて前記複数の実効特性の前記個々の特性の前記初期重みを前記決定することと、前記最終重みを得るために前記過去のトランザクションデータおよび前記所定のトレーニングモデルを使用して前記初期重みを前記トレーニングすることとは、
実効特性の初期重みを決定することと、
理論上のデータを計算するために前記過去のトランザクションデータおよび前記初期重みを前記所定のトレーニングモデルに置換することと、
実際のデータと前記理論上のデータとの間の差異を決定することと、
前記差異は所定の値より小さいという決定に応答して、前記初期重みが前記実効特性の最終重みであることを決定することと、を含む、請求項15に記載のシステム。
【発明の概要】
【0006】
本開示は、検索結果を順位付ける方法およびシステムならびに検索結果を順位付ける最適化方法およびシステムを提供する。本開示の実施形態は、上記したようにサーバへの負荷の増加やネットワークの混雑の問題を解決する。
【0007】
本開示の実施形態は、検索結果を順位付ける方法に関する。実施形態は、1組の初期特性を取得することを含む。いくつかの実施形態では、初期特性は、検索結果の順位付けに影響を及ぼし得る予め設定された特性を含む。実施形態はまた、過去のトランザクションデータに基づいて1組の初期特性から実効特性を抽出することを含み得、実効特性は、検索結果の順位付けに影響を及ぼし得る過去のトランザクションデータに基づいて決定された特性を参照し、過去のトランザクションデータに基づいて実効特性のそれぞれの初期重みを決定し、最終重みを得るために過去のトランザクションデータおよび所定のトレーニングモデルを使用して初期重みをトレーニングし、実効特性の最終重みに基づいて検索結果を順位付ける。
【0008】
更に、過去のトランザクションデータに基づいて1組の初期特性から実効特性を抽出することは、試験製品の2つのグループであって、それらの一方は取引記録を有する製品であり、それらの他方は取引記録を有さない製品である、当該2つのグループを過去のトランザクションデータに基づいて選択することと、過去のトランザクションデータから一定の期間内の試験製品の2つのグループの関連付けられたデータをそれぞれ抽出することと、関連付けられたデータを使用して試験製品の2つのグループの各初期特性の特性値を計算することと、試験製品の2つのグループの同じ初期特性の特性値を比較することと、それらの差異値が閾値を超える場合、実効特性として初期特性を選択することと、を含む。
【0009】
更に、過去のトランザクションデータに基づいて1組の初期特性から実効特性を抽出することは、過去のトランザクションデータから所定の期間内にトランザクションデータを抽出することと、所定の期間内の各製品の取引転換率を計算することと、試験製品として閾値より大きな取引転換率の差異値を有する製品の2つのグループを選択することと、過去のトランザクションデータから所定の期間に続く一定の期間内に試験製品の2つのグループのトランザクションデータを抽出し、試験製品の2つのグループの1組の初期特性における各初期特性の特性値を計算することと、試験製品の2つのグループの同じ初期特性の特性値を比較することと、それらの差異値が閾値を超える場合、実効特性として初期特性を選択することと、を含む。
【0010】
更に、過去のトランザクションデータに基づいて実効特性のそれぞれの初期重みを決定すること、および最終重みを得るために過去のトランザクションデータとトレーニングモデルを使用して初期重みをトレーニングすることは、実効特性の初期重みを決定することと、理論上のデータを計算するために過去のトランザクションデータと初期重みを所定のトレーニングモデルに置換することと、理論上のデータを実際のデータと比較することと、それらの間の差異が所定の範囲内にある場合、初期重みが実効特性の最終重みであることを決定することと、そうではない場合、実効特性の初期重みを決定するステップに戻ることと、を含む。
【0011】
更に、実効特性の最終重みに基づいて検索結果を順位付けることは、検索結果の実際の実効特性値を決定することと、実効特性の最終重みと実際の実効特性値に基づいて検索結果の予測された取引転換率を計算することと、予測された取引転換率に基づいて検索結果を順位付けることと、を含む。
【0012】
本開示の実施形態は、検索結果を順位付ける最適化方法に関する。実施形態は、検索結果の実効特性の候補重み値の各グループをそれぞれ取得することと、候補重み値の各々をそれぞれ使用して一定の所定の時点に検索結果の理論上の順位付けスコアを計算することと、順位付け結果の各グループを得るために理論上の順位付けスコアに基づいて検索結果を順位付けることと、順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果をそれぞれ取得することと、所定の時点後に検索結果のトランザクションデータを取得することと、トランザクションデータに基づいて順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果の実際の順位付けスコアを計算することと、実効特性の最終重み値として最も高い実際の順位付けスコアを有する順位付け結果のグループに対応する候補重み値を選択することと、を含み得る。
【0013】
更に、理論上の順位付けスコアは、単一特性の予測された値または特性の組み合わせの予測された値であり、実際の順位付けスコアは、理論上の順位付けスコアに対応する単一特性の実際の値または特性の組み合わせの実際の値である。
【0014】
更に、理論上の順位付けスコアは、予測された取引転換率であり、実際の順位付けスコアは、実際の取引転換率であり、あるいは理論上の順位付けスコアは、予測された肯定的なフィードバック率であり、実際の順位付けスコアは、実際の肯定的なフィードバック率である。
【0015】
更に、実効特性の最終重み値として最も高い実際の順位付けスコアを有する順位付け結果のグループに対応する候補重み値を選択することは、実効特性の最終重み値として実際の順位付けスコアの最も高い合計または平均値を有する順位付け結果のグループに対応する候補重み値を選択することを含む。
【0016】
本開示の実施形態は、検索結果を順位付ける最適化方法に関する。実施形態は、検索結果の理論上の順位付けスコアであって、実効特性の最終重みおよび検索結果のそれぞれの実際の実効特性値に基づいて得られる、理論上の順位付けスコアに基づいて順位付けられた一定の所定の時点における順位付け結果を取得することと、所定の時点後に順位付け結果においてより高く順位付けられた所定の数の検索結果のトランザクションデータを取得し、そのトランザクションデータに基づいて検索結果の実際の順位付けスコアを計算することと、実際の順位付けスコアを理論上の順位付けスコアと比較することと、それらの差異値が閾値を超える場合、実効特性の最終重みを最適化することと、を含み得る。
【0017】
更に、理論上の順位付けスコアは、予測された取引転換率であり、実際の順位付けスコアは、実際の取引転換率であり、あるいは理論上の順位付けスコアは、予測された肯定的なフィードバック率であり、実際の順位付けスコアは、実際の肯定的なフィードバック率である。
【0018】
本開示の実施形態は、検索結果を順位付けるシステムに更に関する。実施形態は、1組の初期特性であって、検索結果の順位付けに影響を及ぼし得る予め設定された特性を含む、当該初期特性を取得するための初期特性設定取得モジュールと、実効特性であって、検索結果の順位付けに影響を及ぼし得る過去のトランザクションデータに基づいて決定された特性を参照にする、当該実効特性を過去のトランザクションデータに基づいて1組の初期特性から抽出するための実効特性抽出モジュールと、過去のトランザクションデータに基づいて実効特性のそれぞれの初期重みを決定するための実効特性重み決定モジュールと、最終重みを得るために過去のトランザクションデータおよび所定のトレーニングモデルを使用して初期重みをトレーニングすることと、実効特性の最終重みに基づいて検索結果を順位付けるための順位付けモジュールと、を含み得る。
【0019】
更に、実効特性抽出モジュールは、試験製品の2つのグループであって、それらの一方が取引記録を有する製品であり、それらの他方が取引記録を有さない製品である、当該2つのグループを過去のトランザクションデータに基づいて選択するための試験製品選択サブモジュールと、過去のトランザクションから一定の期間内の試験製品の2つのグループの関連付けられたデータをそれぞれ抽出するためのおよび関連付けられたデータを使用して試験製品の2つのグループの各初期特性の特性値を計算するための特性値計算サブモジュールと、試験製品の2つのグループの同じ初期特性の特性値を比較するための比較サブモジュールであって、それらの差異値が閾値を超える場合、実効特性として初期特性を選択する、比較サブモジュールと、を備える。
【0020】
本開示の実施形態は、検索結果を順位付ける最適化システムに関する。実施形態は、検索結果の実効特性の候補重み値の各グループをそれぞれ取得するための候補重み値取得モジュールと、候補重み値の各々を使用してそれぞれ一定の所定の時点で検索結果の理論上の順位付けスコアを計算するための、および順位付け結果の各グループを得るために理論上の順位付けスコアに基づいて検索結果を順位付けるための理論上の順位付けスコア計算モジュールと、順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果をそれぞれ取得するための、および所定の時点後に検索結果のトランザクションデータを取得するためのトランザクションデータ取得モジュールと、トランザクションデータに基づいて順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果の実際の順位付けスコアを計算するための実際の順位付けスコア計算モジュールと、実効特性の最終重み値として最も高い実際の順位付けスコアを有する順位付け結果のグループに対応する候補重み値を選択するための最終重み決定モジュールと、を含み得る。
【0021】
本開示の実施形態は、検索結果を順位付ける最適化システムに関する。実施形態は、検索結果の理論上の順位付けスコアであって、実効特性の最終重みおよび検索結果のそれぞれの実際の実効特性値に基づいて得られる、当該理論上の順位付けスコアに基づいて順位付けられた一定の所定の時点における順位付け結果を取得するための理論上の順位付けスコア計算モジュールと、所定の時点後に順位付け結果においてより高く順位付けられた所定の数の検索結果のトランザクションデータを取得するための、およびトランザクションデータに基づいて検索結果の実際の順位付けスコアを計算するための実際の順位付けスコア計算モジュールと、実際の順位付けスコアを理論上の順位付けスコアと比較するための最適化モジュールであって、それらの差異値が閾値を超える場合、実効特性の最終重みを最適化する、最適化モジュールと、を含み得る。
【0022】
本開示の実施形態は、先行技術を超える利点を含む。本開示の実施形態は、過去のトランザクションデータを通して順位付け結果に影響を及ぼす実効特性を選択し、過去のトランザクションデータと組み合わせて実効特性の最終重みを決定し、これらの重みを使用して検索結果を最終的に順位付ける。この過程において、実効特性のそれぞれの初期重みは過去のトランザクションデータに基づいて決定されることに加えて、初期重みもまた過去のトランザクションデータを使用してトレーニングされることになり、それによって、最終重みの客観性および正確さを確保するように最適化された最終重みを得、それによって、ユーザは、不正確な順位付けによってもたらされる期待された検索結果を得ることができないという事実に起因して、ユーザが、残りのデータを取得することを連続的に要求することまたはクライアント側経由で新たな検索要求をサーバに再送信することを防ぐために順位付け結果の客観性および正確さを改善させ、それによって、サーバへの負担およびネットワークリソースの占有ならびにデータの伝送量を減らす。
【0023】
加えて、実効特性が選択されると、まず、高いおよび低い取引率ならびにより高い対比を有する試験製品の2つのグループが、過去のトランザクションデータに基づいて試験基準として選択される。試験製品の2つのグループの特性値が過去のトランザクションデータに基づいてそれぞれ計算された後、製品の2つのグループは、製品取引率への特性の影響を決定するために同じ初期特性の特性値間の差異について比較され、それによって、実効特性を正確に選択し、順位付けの正確さを改善させる。
【0024】
本開示の検索結果を順位付ける最適化方法およびシステムでは、最適な重み値が決定されるか、または、決定された重み値が一定の時点におよびその時点後にトランザクションデータの使用によって最適化され、すなわち、検索結果を順位付ける比較的に最適化された手法が決定されるか、または、検索結果を順位付ける既存の手法が現実の過去のトランザクションデータの使用によって最適化され、それは、順位付け結果がより客観的で正確であることを可能にさせ、また、ユーザが不正確な順位付けによってもたらされる期待された検索結果を得ることができないという事実に起因して、ユーザが、残りのデータを取得することを連続的に要求することか、またはクライアント側経由で新たな検索要求をサーバに再送信することを防ぎ得、それによって、サーバへの負担およびネットワークリソースの占有ならびにデータの伝送量を減らす。本開示の実施形態は、上記利点のすべてを同時にかなえるように実施されない可能性がある。
【0025】
その上、本開示の実施形態は、無効な文字、および/または語根を削除することによってページの情報およびクエリフレーズを予め処理し得る。本開示の実施形態は、検索を加速化し、分類過程を決定し、正確で関係のある結果を戻し得る。
【発明を実施するための形態】
【0027】
本開示の実施形態は、図面を参照にして詳細に以下に更に説明される。
【0028】
図1は、検索結果を順位付けるための例示的な過程のフローチャートである。102で、サーバは、1組の初期特性を取得し得、初期特性は、検索結果の順位付けに影響を及ぼし得る予め設定された特性を含む。1組の初期特性は、過去のトランザクションデータに基づいてまたは経験的に決定され得る。いくつかの実施形態では、特性は、1組の初期特性トレーディング量、取引転換率、肯定的なフィードバック率、配送速度、画像−単語の質、トランザクション量などを含み得る。
【0029】
いくつかの実施形態では、検索結果の1組の初期特性は、予め設定され得、また、必要とされる場合にはサーバまたは他のデータベースから直接取得され得、過去のトランザクションデータはまた、サーバまたはデータベースから実時間に取得され得、実時間分析によって抽出され得る。
【0030】
104で、サーバは、過去のトランザクションデータに基づいて1組の初期特性から実効特性を抽出し得る。いくつかの実施形態では、実効特性は、検索結果の順位付けに影響を及ぼし得る過去のトランザクションデータに基づいて決定される特性を含み得る。
【0031】
いくつかの実施形態では、過去のトランザクションデータは、サーバから直接読み取られ得る。これらの場合では、具体的に過去のトランザクションデータに基づいて1組の初期特性から実効特性を抽出することは、試験製品の2つのグループであって、それらの一方が取引記録を有する製品であり、それらの他方が取引記録を有さない製品である、当該2つのグループを過去のトランザクションデータに基づいて選択することと、過去のトランザクションデータから一定の期間内の試験製品の2つのグループの関連付けられたデータをそれぞれ抽出し、その関連付けられたデータを使用して試験製品の2つのグループの各初期特性の特性値を計算することと、試験製品の2つのグループの同じ初期特性の特性値を比較することと、それらの差異値が閾値を超える場合、実効特性として初期特性を選択することと、を含み得る。
【0032】
いくつかの実施形態では、関連付けられたデータは、1組の初期特性における様々な特性の特定の値を計算するために使用され得る。異なる特性は、異なる関連付けられたデータを必要とし、特定の関連付けられたデータは、特定の必要性に従って決定され得る。例えば、この特性トレーディング量について、それの要求されたデータは所定の期間内の取引の数であり、それゆえ、それの関連付けられたデータは取引の数である。別の例の場合、肯定的なフィードバック率について、それの必要とされた生データは、所定の期間内のフィードバックの総数および肯定的なフィードバックの数を含み、それゆえ、それの関連付けられたデータは、フィードバックの総数および肯定的なフィードバックの数を含む。
【0033】
いくつかの実施形態では、1組の初期特性における各初期特性の特性値の計算式は、実際の状況に従って決定され得る。いくつかの場合では、特性をどのように効果的に表すかが考慮され得る。例えば、この特性トレーディング量について、それの特性値がトレーディング量の値によって直接表される場合には、それの理論上の値は、0から任意の自然数までであり得る。いくつかの場合では、特定の値が得られると、その問題は、値間の差異を単に比較することによって説明されることができないことが多い。
【0034】
例えば、トレーディング量は、それぞれ0と1である。これらの場合では、両方のトレーディング量の特性値間の差異は1であるが、その差異は、トランザクションがあるかどうかを示す。別の例の場合、トレーディング量は、それぞれ100と101である。差異は依然として1であるが、その差異は、トレーディング量間の1つのトランザクションを示す。従って、計算式は、特性のために再設定され得る。例えば、最終特性値は、特性値の代わりにパラメータとしてトレーディング量を取ることによって計算され得る。
【0035】
例えば、トレーディング量がnであると仮定すると、式1−1/(1+n)が、特性値を計算するために用いられ得る。それに応じて、トレーディング量がそれぞれ0と1である場合、特性値は、それぞれ0と0.5である。一方、100個のトランザクションと101個のトランザクションの特性値は、それぞれ0.9901と0.9902である。このようにして、トレーディング量の変化は、より効果的に表され得る。
【0036】
上述したステップにおける試験製品の2つのグループを選択するための基準は、取引記録があるかどうかであることが理解され得る。いくつかの実施形態では、試験製品の2つのグループの対比を改善させ、選択された製品の範囲を増やし、結果の正確さを改善させるために、一方のグループは、第1の閾値よりも高い取引記録を有する製品であり得る一方、他方のグループは、取引記録を有さないまたは第2の閾値よりも低い取引記録を有する製品である。これらの場合では、第1の閾値および第2の閾値は、実際の状況に従って設定され得る。第1の閾値は、できるだけ高く設定され得、一方、第2の閾値は、できるだけ低く設定され得る。これは、試験製品の2つのグループがより大きな差異を有することを確保し得、それ故、実効特性の後続の正確な抽出を容易にする。
【0037】
試験製品は、過去のトランザクションデータ(例えば、取引記録)に加えて、いくつかの特性に基づいて選択され得ることが理解され得る。本開示のいくつかの実施形態に従って、検索結果は、eコマースウェブサイトにおいて順位付けられ、ユーザによって期待される検索結果が提供される。これは、製品購入の可能性を増加させ、ユーザが検索クエリをサーバに繰り返し送信することを防ぐ。本開示の実施形態は、相関関係に加えて、製品の取引転換率を含む。製品の取引転換率は、一定の製品が検索結果に現れた後に購入されるという可能性であり得る。いくつかの実施形態では、この特性(例えば、製品の取引転換率)は、順位付け結果上のより大きな重みを有し得る。いくつかの実施形態では、ユーザは、クエリを提示し、製品を含む検索結果を受信する。ユーザが製品を購入する可能性がより大きいと、同じまたは類似のクエリを提示した他のユーザが同じ製品を購入する可能性がより大きくなる。
【0038】
いくつかの実施形態では、試験製品は、取引転換率に基づいて選択され得る。サーバは、過去のトランザクションデータから所定の期間内のトランザクションデータを抽出し得、所定の期間内の各製品の取引転換率を計算し得る。サーバは、次いで、試験製品として閾値よりも大きな取引転換率の差異値を有する製品の2つのグループを選択し得る。サーバは、過去のトランザクションデータから所定の期間に続く一定の期間内の試験製品の2つのグループのトランザクションデータを抽出し得、試験製品の2つのグループの1組の初期特性における各初期特性の特性値を計算し得る。サーバは、試験製品の2つのグループの同じ初期特性の特性値を比較し得る。それらの差異値が閾値を超えるという決定に応答して、サーバは、実効特性として初期特性を選択し得る。
【0039】
所定の期間は、実際の必要性に従って設定され得る。いくつかの場合では、計算時間を節約し計算量を減らすために、より短い期間が設定され得る。他の場合では、正確さおよびサーバの容量を考慮して、より長い期間が設定され得る。例えば、1日、3日、10日、30日または他の期間が設定され得る。所定の期間に続く一定の期間がまた、実際の必要性に従って設定され得る。いくつかの場合では、計算された結果の一致を確保するために、一定期間が、所定の期間に基づいて設定され得る。例えば、一定期間は、所定の期間と同じとして設定され得る。
【0040】
いくつかの実施形態では、サーバは、取引転換率のより大きな差異値を有する製品の2つのグループを選択し得る。2つのグループは、所定の期間内の取引転換率に基づいて試験製品として選択され得る。いくつかの場合では、第1の転換値と第2の転換値の差異値は、閾値に設定され得る。製品の1つのグループの取引転換率が第1の転換値よりも高いものの第2の転換値よりも低い場合、製品の2つのグループは、試験製品として選択され得る。サーバは、次いで、試験製品の2つのグループの1組の初期特性における各初期特性の特性値を計算し得る。特性値は、所定の期間に続く一定の期間内の試験製品の2つのグループのトランザクションデータを使用して計算され得る。試験製品の2つのグループの同じ初期特性の特性値は、より大きな差異値を有すると、初期特性は、実効特性として働き得る。例えば、差異値は、設定された閾値を超える。従って、取引転換率の大幅な差異を有する試験製品の2つのグループが選択される。一定の初期特性の特性値の差異値がより大きいと、取引が製品について成立したかどうかへの初期特性の影響がより大きいことを示す。初期特性は、関連した実効特性を抽出するためにこのようにして選別され得、それ故、順位付け結果がより正確であることを可能にする。
【0041】
上述したいくつかの方法による実効特性の選択は、より高い取引対比(deal contrast)を有する試験製品の2つのグループに依存し得る。例えば、一方のグループは取引記録を有する製品である一方、他方のグループは、取引記録を有さない製品である。別の例の場合、一方のグループは、より高い取引転換率を有する製品である一方、他方のグループは、より低い取引転換率を有する製品である。一定の特性が製品の取引により大きな影響を及ぼす場合、トランザクションデータに基づいて計算される特性値もまた、より大きな差異を有することになる。一定の特性が製品の取引に影響を少し及ぼすかほとんど及ぼさない場合、より高い取引対比を有する製品の2つのグループの特性値もまた、差異を少し有するかほとんど有さないことになる。その結果として、実効特性は、この方法によってより良く選別され得、それ故、後続の検索結果の順位付けの正確さを改善させる。
【0042】
試験製品はまた、他の特性に基づいて選択され得ることが理解され得る。例えば、順位付け結果が肯定的なフィードバック度合いにより依存する場合、肯定的なフィードバック度合いのより大きな差異を有する製品の2つのグループが、試験製品として選択され得る。次いで、試験製品の2つのグループの初期特性の特性値が、実効特性として特性値のより大きな差異を有する初期特性を抽出するために上記と類似の手法で計算される。同様に、順位付け結果がトレーディング量により依存する場合、トレーディング量のより大きな差異を有する製品の2つのグループは、試験製品として選択され得る。一定の選択は、上記と類似の過程で行われ得、それは、ここでは詳細には説明されない。
【0043】
106で、サーバは、過去のトランザクションデータに基づいて実効特性のそれぞれの初期重みを決定し得、最終重みを得るために過去のトランザクションデータおよび所定のトレーニングモデルを使用して初期重みをトレーニングする。いくつかの実施形態では、様々な実効特性の初期重みと最終重みの両方が、モデルトレーニングによって決定され得る。初期重みはまた、経験的に設定され得ることが理解され得る。例えば、多次元線形モデルを考えると、様々な実効特性の初期重みは、まず、多次元線形フィッティングによって決定され得る。これらの初期重みは、次いで、計算式に置換され得、理論上のデータを計算するために過去のトランザクションデータと組み合わされ得る。理論上のデータは、実際のデータと比較され得る。差異が小さくなればなるほど、より正確に初期重みが決定される。差異が所定の範囲内にある場合、初期重みは、実効特性の最終重みとして選択され得る。差異が所定の範囲内にない場合、初期重みは、差異が所定の範囲内にあるように減らされるまで、上述の方法によって再決定され計算され得る。
【0044】
例えば、製品の取引を考えると、まず、理論上の取引が、初期重みおよび過去のトランザクションデータに基づいて計算され得る。次いで、計算された理論上の取引は、実際の取引と比較され得る。差異が小さくなればなるほど、より正確に初期重みが決定される。初期重みは、実効特性の最終重みとして働き得る。いくつかの実施形態では、重みは、決定された重み値が、理論上の取引と実際の取引との間の差異が最小限にされるか所定の範囲内にあることを可能にするまで、再決定され得る。特定のトレーニングにおいて、取引は、取引転換率または取引が起こったかどうかの指標によって表され得る。モデルトレーニングは、複数の機械学習方法によって行われ得ることが理解され得、それは、本開示では説明されないことになる。
【0045】
108で、サーバは、実効特性の最終重みに基づいて検索結果を順位付け得る。いくつかの実施形態では、実効特性の最終重みに基づいて検索結果を順位付けることは、検索結果の実際の実効特性値を決定することと、実効特性の最終重みおよび実際の実効特性値に基づいて検索結果の予測された取引転換率を計算することと、予測された取引転換率に基づいて検索結果を順位付けることと、を含む。
【0046】
いくつかの実施形態では、順位付けは、他の要因に基づいて行われ得る。これらの要因は、検索結果の肯定的なフィードバック率、および異なる順位付け目的に従って決定され得る他の要因を含み得る。順位付け目的が異なると、順位付けのための要因は、異なり得る。従って、順位付け結果は、それに応じて変化し得る。次いで、様々な検索結果の順位付けスコアが計算され得、検索結果は、上述の方法に基づいて順位付けられ得る。
【0047】
上述の方法は、特定の例を参照にして詳細に以下に説明されることになる。1組の抽出された初期特性に含まれる5つの特性が、トレーディング量、取引転換率、肯定的なフィードバック率、配送速度および画像−単語の質であることを仮定する。
【0048】
所定の期間は30日であることを仮定する。表1に例示されるように、取得されることになる過去のトランザクションデータは、取引の数、露出の数、肯定的なフィードバックの数、フィードバックの総数、配送の日数、画像の数および単語の数を含むことが、決定され得る。これらの過去のトランザクションデータが取得された後、計算は、各初期特性の特性値を決定するための計算方法に従って行われ得る。
【0050】
上記過去のトランザクションデータに基づいて計算された試験製品の2つのグループの5つの特性の特性値が初期特性値であることを仮定する。より高い対比を有する試験製品の2つのグループは、計算された初期特性値に基づいて選択され得る。一方のグループは、70%より多くの取引転換率を有する製品である一方、他方のグループは、1%よりも低い取引転換率を有する製品であることを更に仮定する。試験製品が取引転換率に依存してここで選択される場合、取引転換率だけが計算され得、他の特性の特性値は計算され得ないことが理解され得る。
【0051】
上記30日に続くいくつかの期間内の試験製品の2つのグループの過去のトランザクションデータが、取得され得る。例えば、それは、1週間以内の過去のトランザクションデータであり得、また、更に30日以内の過去のトランザクションデータであり得、試験製品の2つのグループの5つの特性の特性値は、これらの過去のトランザクションデータに基づいて計算され得、有効な特性値であると推定され得る。
【0052】
次いで、試験製品の2つのグループの同じ特性の有効な特性値が、それぞれ比較され得る。それらの差異値が閾値を超える場合、特性は、実効特性として決定され得る。閾値が0.3であることを更に仮定すると、上記比較は、試験製品の2つのグループの5つの特性を示す。トレーディング量、取引転換率、肯定的なフィードバック率、配送速度および画像−単語の質は、それぞれ、0.6、0.9、0.8、0.5および0.02の差異値を有する。従って、最終的に選択される実効特性は、トレーディング量、取引転換率、肯定的なフィードバック率および配送速度であるということになる。
【0053】
4つの実効特性の最終重みは、過去のトランザクションデータに基づいてモデルトレーニングによって決定され得、検索結果における4つの実効特性の実際の値が取得され得る。次いで、様々な検索結果の順位付けスコアは、決定された最終重みおよび実効特性の実際の値に基づいて計算され得る。従って、検索結果は、順位付けスコアに基づいて順位付けられる。
【0054】
本開示の実施形態は、過去のトランザクションデータを通して順位付け結果に影響を及ぼす実効特性を選択し、過去のトランザクションデータと組み合わせて実効特性の最終重みを決定し、これらの重みを使用して検索結果を最終的に順位付ける。この過程において、実効特性のそれぞれの初期重みは、過去のトランザクションデータに基づいて決定され得る。次いで、初期重みは、過去のトランザクションデータを使用してトレーニングされ得る。これは、最終重みの客観性および正確さを確保するために最適化された最終重みを得て、順位付け結果の客観性および正確さを改善する。
【0055】
加えて、実効特性が選択されると、まず、高いおよび低い取引率を有する試験製品の2つのグループが選択され得、より高い対比がまた、過去のトランザクションデータに基づいて試験基準として選択され得る。試験製品の2つのグループの特性値が過去のトランザクションデータに基づいてそれぞれ計算された後、製品の2つのグループは、製品取引率への特性の影響を決定するために同じ初期特性の特性値間の差異について比較され得、それによって、実効特性を正確に選択し、順位付けの正確さを改善する。
【0056】
図2は、検索結果を最適化するための例示的な過程のフローチャートである。202で、サーバは、検索結果の実効特性の候補重み値の各グループをそれぞれ取得し得る。実効特性の候補重み値の少なくとも2つのグループがあり、また、それらの3つまたは4つのグループがあり得る。
【0057】
204で、サーバは、候補重み値の各々を使用してそれぞれ一定の所定の時点で検索結果の理論上の順位付けスコアを計算し得、順位付け結果の各グループを得るために理論上の順位付けスコアに基づいて検索結果を順位付ける。理論上の順位付けスコアは、取引転換率、予測された肯定的なフィードバック率または他の特性あるいは検索結果の特性の組み合わせの特定のスコアであり得、それらは、実際の順位付け目的に基づいて決定され、本開示において限定されるものではない。
【0058】
いくつかの実施形態では、理論上の順位付けスコアは、予測された取引転換率を本開示の実施形態における一例として取ることによって例示される。サーバは、候補重み値の各々を使用してそれぞれ一定の所定の時点で検索結果の予測された取引転換率を計算し得、順位付け結果の各グループを得るために予測された取引転換率に基づいて検索結果を順位付ける。
【0059】
一定の所定の時点で検索結果が決定されると、検索結果の実効特性がまず取得され得、これらの検索結果の実効特性値は、実際のデータに基づいて計算され得る。検索結果の異なる予測された取引転換率は、候補重み値の各グループと組み合わせてそれぞれ実効特性値に基づいて計算され得、異なる順位付け結果は、異なる予測された取引転換率に基づいて得られ得る。
【0060】
例えば、a、b、cおよびdを含む一定の所定の時点で全部で4つの検索結果があることを仮定する。候補重み値の2つのグループがあることを更に仮定する。重み値の一方のグループに基づいて計算された順位付け結果はa、b、cおよびdである一方、重み値の他方のグループに基づいて計算された順位付け結果はd、c、aおよびbであるという可能性がある。
【0061】
206で、サーバは、順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果をそれぞれ取得し得、所定の時点後に検索結果のトランザクションデータを取得し得る。より高く順位付けられた所定の数の特定の値は、実際の検索結果の数およびシステムの計算能力に基づいて決定され得る。例えば、実際の検索結果の数が所定の値よりも大きく、一方、システムの計算能力が1つの所定の値よりも低い場合。所定の数は、より小さな値、例えば2%、4%などに設定され得る。システムの計算能力が許す場合、所定の数は、より大きな値、例えば10%などに設定され得る。勿論、データが大きくなればなるほど、より多くの客観的で正確な結果が提供され得る。それ故、複数の所定の数はまた、例えば2%、4%、6%、8%、10%などで、設定され得る。
【0062】
所定の時点後のトランザクションデータの特定の範囲は、特定の条件に従って設定され得る。例えば、トランザクションデータが所定の時点後に取得されることができるならば、その範囲は、所定の時点後の1週間以内のトランザクションデータをカバーし得、また、10日、20日または他の期間以内のトランザクションデータをカバーし得る。
【0063】
208で、サーバは、トランザクションデータに基づいて順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果の実際の順位付けスコアを計算し得る。いくつかの実施形態では、実際の順位付けスコアは、理論上の順位付けスコアを計算するためのものと同じ方法を使用して実際のデータに基づいて計算された検索結果のものであり得る。例えば、理論上の順位付けスコアが予測された取引転換率である場合、ここにおける実際の順位付けスコアは、実際の取引転換率を含み得る。
【0064】
210で、サーバは、実効特性の最終重み値として最も高い実際の順位付けスコアを有する順位付け結果のグループに対応する候補重み値を選択し得る。
【0065】
いくつかの実施形態では、様々な検索結果の理論上の順位付けスコアは、順位付けの間に計算され得る。従って、理論上の順位付けスコアが高くなればなるほど、順位付け順序がより前方になる。実際の順位付けスコアが高くなればなるほど、実際の状況により適合する順位付け結果がユーザに示され、ここにおける順位付けはより正確である。最も高い実際の順位付けスコアは、一定の順位付け結果から選択された検索結果の実際の順位付けスコアが、他の順位付け結果における同じ位置での検索結果のものよりも高いことを意味し得ることが理解され得る。しかしながら、これは、比較的理想の順位付け結果であり、そのような最適化された順位付け結果は、いくつかの実施形態では得られ得ず、それ故、最も高い実際の順位付けスコアは、計算フローを簡単にするように実際の順位付けスコアの最も高い合計または平均値を参照にし得る。
【0066】
例えば、上述の2つの順位付け結果a、b、cおよびd、ならびにd、c、aおよびbを考える。順位付けの基準は取引転換率であることを仮定する。結果として、検索結果は、予測された取引転換率の値に基づいて順位付けられ得、次いで、最初の2つの位置に順位付けられた検索結果は、順位付け結果の各グループから選択され得、それらは、それぞれ、aおよびb、ならびにdおよびcである。4つの検索結果(a、b、cおよびd)の実際の取引転換率は、トランザクションデータに基づいて計算され得、それらは、それぞれ、5%、4%、3%および2%である。次いで、aおよびbの実際の取引転換率の平均値は4.5%ということになり、それは、dおよびcの実際の取引転換率の平均値2.5%よりも高い。従って、順位付け結果a、b、cおよびdのグループに対応する候補重み値は、実効特性の最終重み値としてみなされ得る。
【0067】
検索結果の最適化に関連する上述の実施形態は、取引転換率を特定の例と組み合わせて例としてみなすことによって詳細に以下に説明される。
【0068】
検索結果のグループは、時点Tにキーワードを検索することによって得られ得ることを仮定する。上述の実施形態によれば、検索結果のグループの実効特性は一定であり得、それらの実効特性値もまた一定であり得る。実効特性は、最終重みの2つのグループを有することを仮定する。結果として、検索結果の予測された取引転換率は、最終重み値の2つのグループに基づいて計算され得、次いで、検索結果は、予測された取引転換率の値に基づいて順位付けられ得る。50個の検索結果があり、順位付け結果の2つのグループが重み値間の差異の結果として得られ得ることを仮定する。順位付け結果の2つのグループは、(
図3に示されるように)NおよびOであると仮定され、それについて、検索結果の最初のx%の実際の取引転換率の平均値が、T後の期間内(例えば1週間以内)に計算され得る。順位付け結果Nの最初のx%の実際の取引転換率の平均値が、順位付け結果Oの最初のx%の実際の取引転換率のそれよりも高いという事実は、時点Tに順位付け結果Nによって予測された順位付け結果の取引転換率が実際の結果により近いということを示す。すなわち、時点Tに戻される場合、順位付け結果Nによって用いられた重み値が、検索結果を順位付けるために適用され得、それ故、時点T後により高い取引転換率を有する検索結果をより高く順位付け得、それによって、これらの検索結果の提示機会を増やし、より多くのトランザクションを促進する。
【0069】
いくつかの実施形態では、順位付け結果の2つのグループ間の差異は、より総合的で客観的な比較を得るために異なるx値を選択することによって計算され得る。例えば、商品の最初の2%の実際の取引転換率の平均値が計算され、次いで(表2に示されるように)最初の4%、6%、8%...のそれが計算される。2つの順位付け結果は、次いで、異なる点で比較され得る。順位付け結果Nの予測的効果は、順位付け結果Oのそれよりもかなり良いということになる。データは、それらの間の効果差異をより視覚的に観察するために実際の取引転換率の平均値の曲線として更にプロットされ得ることが理解され得る。
【0071】
いくつかの実施形態では、有意性検証がまた、順位付け結果Nによって用いられた実効特性の最終重みが、効果改善に関して順位付け結果Oによって用いられたものを超える偶発的ではない統計的な有意性を有することを確保するために、更に行われ得る。有意性検証は、多くの先行の方法を通して実現され得、例えば、例としてT検定を考える。T検定は、2つのグループのサンプルの平均値を比較するために行われ得る。T検定におけるAP値は、2つのサンプルの平均値間に差異があることは間違いであるという確率を表す。P<=0.01であるとき、2つのサンプル間の差異は非常に著しいことが一般に信じられている。実際の取引転換率の50個の平均値があることを仮定する。結果として、T検定は、表1における2つの順位付け結果の実際の取引転換率の50個の平均値に適用され得、得られるP値は約8.7E−07であり、それは、0.01よりもかなり小さい。従って、統計的有意性の場合において、順位付け結果Nによって用いられた実効特性の最終重みは、順位付け結果Oによって用いられるものよりも著しく最適化され得る。
【0072】
取引転換率は、上述の方法における例示のための例として使用されるけれども、順位付けおよび最適化は、他の特性(例えば、肯定的なフィードバック率、配送速度など)に基づいて行われ得ることが理解され得る。いくつかの実施形態では、順位付けおよび最適化はまた、総合的特性に基づいて行われ得る。
【0073】
いくつかの実施形態では、実効特性の最終重みは、まだ決定されておらず、最適な実効特性のグループの最終重みは、可能性のある結果の複数のグループから選択される必要がある。いくつかの実施形態は、最適化は、実効特性の最終重みが決定されたという事実に基づいて行われ得るときに、実施され得ることが理解され得る。
【0074】
図4は、検索結果を最適化するための例示的な過程のフローチャートである。402で、サーバは、検索結果の理論上の順位付けスコアに基づいて順位付けられた一定の所定の時点で順位付け結果を取得し得、理論上の順位付けスコアは、実効特性の最終重みおよび検索結果のそれぞれの実際の実効特性値に基づいて得られる。
【0075】
404で、サーバは、所定の時点後に順位付け結果においてより高く順位付けられた所定の数の検索結果のトランザクションデータを取得し得、そのトランザクションデータに基づいて検索結果の実際の順位付けスコアを計算する。
【0076】
406で、サーバは、実際の順位付けスコアを理論上の順位付けスコアと比較し得、それらの差異値が閾値を超える場合、実効特性の最終重みを最適化する。
【0077】
実効特性の最終重みは、上記順位付け方法において述べたモデルトレーニングによって最適化され得る。いくつかの場合では、各実効特性の最終重みは、トレーニングモデルと組み合わせて過去のトランザクションデータを取得することによって決定され最適化され得、そのモデルは本明細書において詳細には説明され得ない。閾値はまた、実際の順位付けスコアおよび理論上の順位付けスコアに対応する実際の特性に基づいて設定され得る。例えば、実際の順位付けスコアおよび理論上の順位付けスコアが、それぞれ、実際の取引転換率および予測された取引転換率である場合、それらの閾値は、一般的な場合において取引転換率の許容可能な差異値範囲(例えば、0.2または他の値)によって決定され得る。
【0078】
いくつかの実施形態では、最適な重み値は、一定の時点におけるおよびその時点後のトランザクションデータの使用によって決定され得る。いくつかの実施形態では、決定された重み値は、一定の時点におけるおよびその時点後のトランザクションデータの使用によって最適化され得る。いくつかの場合では、検索結果を順位付ける比較的最適化された手法は、現実の過去のトランザクションデータの使用によって決定され得、それは、順位付け結果がより客観的で正確であることを可能にする。いくつかの場合では、検索結果を順位付ける既存の手法は、現実の過去のトランザクションデータの使用によって最適化され得る。
【0079】
図5〜
図7は、検索結果を順位付けて最適化することができる例示的なコンピューティングアーキテクチャの概略図である。
図5は、コンピューティングデバイス500の図である。コンピューティングデバイス500は、複数の位置ログイン制御のためのユーザデバイスまたはサーバであり得る。1つの典型的な構成では、コンピューティングデバイス500は、1つ以上のプロセッサ502、入出力インターフェース504、ネットワークインターフェース506、およびメモリ508を含む。
【0080】
メモリ508は、揮発性メモリ、例えばランダムアクセスメモリ(RAM)など、および/または不揮発性メモリ、例えば読み取り専用メモリ(ROM)もしくはフラッシュRAMなどの形態のコンピュータで読み取り可能な媒体を含み得る。メモリ408は、コンピュータで読み取り可能な媒体の一例である。
【0081】
コンピュータで読み取り可能な媒体は、コンピュータで読み取り可能な命令、データ構造、プログラムモジュール、もしくは他のデータ等の情報の記憶のための任意の方法または技術で実装される揮発性および不揮発性の、取り外し可能および取り外し不可能な媒体を含む。コンピュータ記憶媒体の例は、限定されるものではないが、相変化メモリ(PRAM)、静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的に消去可能でプログラム可能な読み取り専用メモリ(EEPROM)、フラッシュメモリまたは他のメモリ技術、コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)または他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイス、またはコンピューティングデバイスによるアクセスのために情報を記憶するように使用され得る任意の他の非伝送媒体を含む。本明細書において定義されるように、コンピュータで読み取り可能な媒体は、変調データ信号および搬送波等の一時的媒体を含まない。
【0082】
より詳細にメモリ508に戻ると、メモリ508は、初期特性設定取得モジュール510、実効特性抽出モジュール512、実効特性重み決定モジュール514および順位付けモジュール516を含み得る。
【0083】
初期特性設定取得モジュール510は、1組の初期特性を取得するように構成され、初期特性は、検索結果の順位付けに影響を及ぼし得る予め設定された特性を含む。実効特性抽出モジュール512は、過去のトランザクションデータに基づいて1組の初期特性から実効特性を抽出するように構成され、実効特性は、検索結果の順位付けに影響を及ぼし得る過去のトランザクションデータに基づいて決定された特性を参照する。いくつかの実施形態では、実効特性抽出モジュールは、試験製品選択サブモジュール、特性値計算サブモジュールおよび比較サブモジュールを備える。試験製品選択サブモジュールは、過去のトランザクションデータに基づいて試験製品の2つのグループを選択するように構成され、それらの一方は、取引記録を有する製品であり、それらの他方は、取引記録を有さない製品である。特性値計算サブモジュールは、過去のトランザクションから一定の期間内の試験製品の2つのグループの関連付けられたデータをそれぞれ抽出し、その関連付けられたデータを使用して試験製品の2つのグループの各初期特性の特性値を計算するように構成される。比較サブモジュールは、試験製品の2つのグループの同じ初期特性の特性値を比較するように構成される。それらの差異値が閾値を超える場合、サーバは、実効特性として初期特性を選択し得る。
【0084】
実効特性重み決定モジュール512は、過去のトランザクションデータに基づいて実効特性のそれぞれの初期重みを決定し、最終重みを得るために過去のトランザクションデータおよび所定のトレーニングモデルを使用して初期重みをトレーニングするように構成される。
【0085】
順位付けモジュール514は、実効特性の最終重みに基づいて検索結果を順位付けるように構成される。
【0086】
いくつかの実施形態では、
図6に示されるように、メモリ508は、候補重み値取得モジュール602、理論上の順位付けスコア計算モジュール604、トランザクションデータ取得モジュール606、実際の順位付けスコア計算モジュール608および最終重み決定モジュール610を含み得る。
【0087】
候補重み値取得モジュール602は、検索結果の実効特性の候補重み値の各グループをそれぞれ取得するように構成される。
【0088】
理論上の順位付けスコア計算モジュール604は、候補重み値の各々をそれぞれ使用して一定の所定の時点で検索結果の理論上の順位付けスコアを計算し、順位付け結果の各グループを得るために理論上の順位付けスコアに基づいて検索結果を順位付けるように構成される。
【0089】
トランザクションデータ取得モジュール606は、順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果をそれぞれ取得し、所定の時点後に検索結果のトランザクションデータを取得するように構成される。
【0090】
実際の順位付けスコア計算モジュール608は、トランザクションデータに基づいて順位付け結果の各グループにおいてより高く順位付けられた所定の数の検索結果の実際の順位付けスコアを計算するように構成される。
【0091】
最終重み決定モジュール610は、実効特性の最終重み値として最も高い実際の順位付けスコアを有する順位付け結果のグループに対応する候補重み値を選択するように構成される。
【0092】
いくつかの実施形態では、
図7に示されるように、メモリ508は、理論上の順位付けスコア計算モジュール702、実際の順位付けスコア計算モジュール704および最適化モジュール706を含み得る。
【0093】
理論上の順位付けスコア計算モジュール702は、検索結果の理論上の順位付けスコアに基づいて順位付けられた一定の所定の時点における順位付け結果を取得するように構成され、理論上の順位付けスコアは、実効特性の最終重みおよび検索結果のそれぞれの実際の実効特性値に基づいて得られ得る。
【0094】
実際の順位付けスコア計算モジュール704は、所定の時点後に順位付け結果においてより高く順位付けられた所定の数の検索結果のトランザクションデータを取得し、トランザクションデータに基づいて検索結果の実際の順位付けスコアを計算するように構成される。
【0095】
最適化モジュール706は、実際の順位付けスコアを理論上の順位付けスコアと比較するように構成される。それらの差異値が閾値を超える場合、最適化モジュール706は、実効特性の最終重みを最適化し得る。
【0096】
本明細書の様々な実施形態は、進歩的なやり方で説明されたが、実施形態のそれぞれは、他の実施形態との差異に焦点を合わせる。それ故、様々な実施形態間の同じおよび類似の部分は、互いに参照され得る。
【0097】
様々な実施形態は、本開示を明らかにするために本明細書において説明され、上記実施形態の説明は、本開示を理解することを助ける目的のためにだけ使用される。その一方で、当業者は、本開示の考えに基づいて特定の実施形態および適用範囲に関して変更を加え得る。要約すれば、本明細書の内容は、本開示を限定するものとして解釈され得ない。
【0098】
実施形態は、単に本開示を例示するためのものに過ぎず、本開示の範囲を限定することは意図されない。一定の修正や改良は、本開示の原理から逸脱すること無くなされ得、本開示の保護の下で考えられるべきであることは、当技術分野における者に理解されるべきである。