(58)【調査した分野】(Int.Cl.,DB名)
前記製品を分類する前に、偽製品の製品情報をフィルタリングするための偽製品識別モデルを使用することによって前記製品情報をフィルタリングすることをさらに含む、請求項1に記載の方法。
各製品カテゴリに対応する価格情報を得るために、各カテゴリ下の製品にクラスタ解析アルゴリズムをそれぞれ適用した後で、前記製品情報と前記得られた価格情報との間の対応する関係を格納することをさらに含む、請求項1に記載の方法。
前記クラスタ解析アルゴリズムおよび前記事前に設定された情報クラスタの数に基づいて、前記製品カテゴリ内でフィルタリングされた価格情報を複数の価格情報クラスタにグループ化することは、
フィルタリング後の価格情報セットの平均値および事前に設定されたクラスタの数に従って、初期クラスタの中心点を選択することと、
前記初期クラスタの前記中心点および前記クラスタ解析アルゴリズムに基づいて、必要な事前に設定されたクラスタの数を得るために、収束に到達するまで前記価格情報セットに反復クラスタリングを適用することと、
最終的に得られた複数のクラスタとして、前記複数のクラスタから十分な数の価格情報を有するクラスタを選択することと、
を含む、請求項10に記載の方法。
偽製品の製品情報をフィルタリングするための1つ以上の偽製品識別モデルを使用することによって、前記製品をフィルタリングする偽製品識別モデルモジュールをさらに備える、請求項15に記載のデバイス。
【発明を実施するための形態】
【0020】
本開示の実施形態をよりよく例示するために、実施形態の説明において使用される図の簡単な紹介を以下に示す。記載される実施形態は、本開示の全ての実施形態ではなく、いくつかの実施形態に関連しているに過ぎないことは明白である。当業者は、創造的な努力をせずに、本開示に記載される実施形態に従って他の実施形態を得ることができる。
【0021】
開示される実施形態は、普遍的コンピュータシステムまたは特化型コンピュータシステムの環境または構成において使用されてもよい。その例として、パーソナルコンピュータ、サーバコンピュータ、手持ち式デバイスまたは携帯デバイス、タブレットデバイス、マルチプロセッサシステム、マイクロプロセッサに基づくシステム、セットアップボックス、プログラム可能な顧客電子デバイス、ネットワークPC、小型コンピュータ、大型コンピュータ、および上記のいずれかのシステムまたはデバイスを含む分散コンピューティング環境が挙げられる。
【0022】
本開示は、プログラムモジュール等の、コンピュータによって実行されるコンピュータ実行可能命令の一般的な文脈において説明することができる。一般的に、プログラムモジュールは、特定のタスクを実行するかまたは特定の抽象データ型を実装するためのルーチン、プログラム、オブジェクト、モジュール、データ構造、コンピュータ実行可能命令等を含む。開示される方法およびデバイスは、分散コンピューティング環境内に実装されてもよい。分散コンピューティング環境において、通信ネットワークを通して接続されるリモート処理デバイスによってタスクが実行される。分散コンピューティング環境において、プログラムモジュールは、ローカルおよび/またはリモートコンピュータの記憶媒体(記憶デバイスを含む)内に位置してもよい。
【0023】
本開示において、データベースから特定のカテゴリ下の製品情報が検索され、製品は、それらの製品属性および販売属性に従って分類される。同じ製品カテゴリ下の製品は、同じかまたは実質的に同じ製品属性および販売属性を有する。販売属性は、製品価格に影響する製品属性以外の属性である。したがって、得られたカテゴリは、製品価格情報に影響する販売属性も考慮に入れる。製品の平均価格情報を得るために、クラスタリングアルゴリズム等の1つ以上の計算アルゴリズムが製品カテゴリに適用されてもよい。製品の価格に関するユーザの検索クエリを受信すると、オンライン取引プラットフォームのサーバは、計算された平均価格情報をユーザに返信することができる。ユーザは、適正な真の価格情報を得るため、ユーザは、サーバに重複または反復した検索動作を実行するよう要求する必要がない。オンライン取引プラットフォームのサーバで実行される本開示の方法またはシステムは、サーバの実行速度および性能も向上させる。
【0024】
図1は、本開示の第1の例示的な実施形態におけるオンライン取引プラットフォームに基づく例示的なデータ処理方法のフロー図を示す。
【0025】
101では、カテゴリ情報に従って、データベースからカテゴリ下の製品情報が検索される。製品情報は、製品識別情報(ID)および製品価格情報を含む。
【0026】
一実施形態において、データベースは、オンライン取引プラットフォームの取引に関与する関連取引情報を格納することができる。そのような取引情報は、製品情報、製品取引情報、オンライン取引プラットフォームにおける売り手のユーザ情報等の売り手の情報等を含むことができる。製品情報は、製品IDおよび製品価格情報を含むことができ、また、オンライン取引プラットフォームにおける売り手のユーザID等の製品の売り手のIDも含むことができる。製品取引情報は、売却価格情報、売却製品の数に関連する情報、売り手のユーザID、買い手のユーザIDを含むことができる。売り手のユーザ情報は、売り手のクレジット情報、30日累積取引数、売り手のオンライン製品の数、低い評価に関連する情報等を含むことができる。例示的な実施形態において、製品情報は、製品IDおよび製品価格情報を含むことができる。
【0027】
カテゴリは、製品の分類後の産業セグメント情報である。例えば、カテゴリは、携帯電話、ノートブック、顔用クリーム、日焼け止めクリーム等を含むことができる。製品は、例えば、オンライン取引プラットフォームで取り引きすることができるアイテムを意味してもよい。
【0028】
102では、複数の製品カテゴリを得るために、製品属性および販売属性に従って製品が分類される。同じ製品カテゴリ下の製品は、同じかまたは実質的に同じ製品属性および販売属性を有する。販売属性は、製品価格に影響する製品属性以外の属性である。
【0029】
1つのカテゴリ下の製品情報が得られた後、製品IDに従って対応する製品を得ることができる。製品属性とは、製品の固定的な機能的特徴である製品の固定属性を意味する。
【0030】
例えば、Nokia N73は、製品の型である。同じかまたは実質的に同じ型のNokia N73を含む製品は、Nokia N73の固定属性をある程度有する。例えば、ブランド属性は「Nokia」であり、表示体裁は「直線型」であり、カメラ解像度は「3.2MP」である等。同様の機能的特徴を有する製品は、一般的に同じ製品型の下にあると見なされるが、パッケージング等の他の非機能的属性のために販売価格が異なる可能性がある。機能的特徴に加えて、同じかまたは実質的に同じ型の製品は、異なる価格、異なるセット販売内容、または異なる販売後サービス、さらには異なるレベルの新しさ等の他の属性も有する可能性がある。そのような属性の全てが製品の固定属性ではない。
【0031】
販売属性は、製品価格に影響する製品属性以外の属性である。換言すると、販売属性は、価格に影響する可能性のある製品の固定属性を排除した後に残る属性である。例えば、1つの型の化粧品が、異なる種類の販売パッケージを有する可能性があり、各パッケージの容量が異なる販売価格の原因となる。販売後サービスの種類および化粧品の容量等の他の販売属性も異なる価格の原因となる。
【0032】
したがって、1つの型の製品を、販売属性に基づいてさらに分類することができる。例えば、「Da Bao美容洗顔料」等の製品は、「容積」という販売属性を有し、販売属性「容積」に対応する値は、300mlおよび100mlである可能性がある。これらの2つの販売価格は異なる。しかしながら、それらの機能的特徴は、容積が300mlであるかまたは100mlであるかにかかわらず、実際には同じである。
【0033】
図2は、例示的な製品「Lenovo I300」の販売属性および固定属性のインターフェースの略図を示す。
【0034】
この例示的な実施形態において、得られた平均価格は、同じかまたは実質的に同じ製品属性および販売属性を有する1つの型の製品の価格である。
【0035】
103では、各製品カテゴリに対応する価格情報を得るために、各カテゴリ下の製品に1つ以上の計算分析アルゴリズムがそれぞれ適用されてもよい。1つ以上の計算アルゴリズムは、クラスタリングアルゴリズムを含む。価格情報とは、それらの対応する販売属性下の製品の価格情報を意味する。
【0036】
クラスタ解析アルゴリズムは、K平均アルゴリズムを使用することができる。例えば、クラスタ解析アルゴリズム(K平均アルゴリズム等)は、クラスタリング後に最も大きいクラスタをさらに選択するように製品価格情報をクラスタリングするために使用されてもよい。組み合わせた最も大きいクラスタ内の要素の数が所定の閾値よりも大きくなるまで、最も大きいクラスタを隣接するクラスタと組み合わせることができる。次いで、最も大きいクラスタ内の価格情報に従って製品の平均価格情報が得られる。
【0037】
例示的な実施形態において得られる価格情報は、その販売属性下の型の製品の対応する価格情報である。実践的な用途において、たとえDa Bao洗顔料等の同じ型の製品であっても、販売属性は同じではない可能性がある。例えば、一方の型の製品の販売属性は100mlであり、別の型の製品の販売属性は300mlである。その場合、これらの2種類のDa Bao洗顔料製品の価格情報は、同じではない。
【0038】
例えば、
図3は、各型の製品の対応する価格情報を得るために、製品カテゴリ下の製品に対してクラスタ解析アルゴリズムを適用するフロー図を示す。
【0039】
301では、製品カテゴリ下の製品の価格情報が、事前に設定された価格帯情報に従ってフィルタリングされる。
【0040】
製品カテゴリが得られた後、製品カテゴリ内の製品の製品属性および販売属性は、同じかまたは実質的に同じである。しかしながら、必ずしも各製品の価格が考慮される必要はない。したがって、製品カテゴリ内の製品に関連する価格情報がフィルタリングされてもよい。フィルタリングの間に、ラベル付き価格情報を有する製品のために、ラベル付き価格の価格比率範囲を事前に定義することができる。例えば、上限は価格の2倍として設定されてもよく、下限は0.5倍として設定されてもよい。次いで、ラベル付き価格情報は、ラベル付き価格帯情報内で上限価格および下限価格を計算するために使用される。価格情報は、上限および下限の価格情報を使用することによってフィルタリングされる。
【0041】
例えば、フィルタリング後の製品数対フィルタリング前の製品数の比率が所定の閾値よりも低い場合、そのようなフィルタリングは、非効果的または無効であると見なすことができる。例えば、そのような閾値は0.5に設定されてもよい。フィルタリング処理後に、製品カテゴリ下の製品の半数超が排除された場合、そのようなフィルタリング処理は、最適な処理ではない可能性がある。その場合、事前にフィルタリングされた価格情報を、ソースデータとしてなおも使用することができる。フィルタリング後の製品数対フィルタリング前の製品数の比率が所定の閾値よりも低くない場合、そのようなフィルタリング処理は、効果的または有効であると見なすことができる。フィルタリングされた価格情報が、ソースデータとして使用される。
【0042】
さらに、Nokia N73が携帯電話カテゴリに属し、ThinkPad X100がノートブックカテゴリに属すように製品は特定のカテゴリに属するため、各カテゴリに、有効な価格情報の範囲を定義するための最高価格(price_max)および最低価格(price_min)を設定することができる。定義された価格情報の範囲を超える価格情報は、無効であると見なすことができる。
【0043】
したがって、製品カテゴリ下の製品がラベル付き価格情報を有さない場合、カテゴリ内の製品の最高および最低価格情報を事前に定義することができる。カテゴリに基づいて異なる値が定義されてもよい。例えば、携帯電話のカテゴリは、最低価格100ドルおよび最高価格10,000ドルを有することができ、ノートブックコンピュータのカテゴリは、最低価格100ドルおよび最高価格50,000ドルを有してもよい。そのような価格帯は、カテゴリ内の製品価格情報をフィルタリングするために使用することができる。
【0044】
302では、製品カテゴリ内に収容された価格情報が、クラスタ解析アルゴリズムおよび事前に設定された数に従っていくつかのクラスタに分割される。
【0045】
製品カテゴリ内でフィルタリングされた製品価格情報が得られた後、N個等のいくつかのグループに分けて製品を分析するために、各製品カテゴリに対してクラスタ解析アルゴリズム(K平均アルゴリズム等)が行われる。数Nは、いずれの整数であってもよい。例えば、Nは10であってもよい。K平均アルゴリズムの原則に基づくと、1つのクラスタ内の要素は隣接する要素であり、この実施形態ではそれらの価格情報が比較的近いことを意味する。例えば、1つの製品カテゴリについて、その製品カテゴリ内の製品価格は、それぞれ、1、102、3、4、5、100、101、104、および8である。この実施形態におけるクラスタリング方法に基づいて、そのような価格情報を[1、3、4、5、8]および[102、100、101、104]の2つのクラスタに分割することができる。
【0046】
303では、最大の価格情報数を有するクラスタが、隣接するクラスタとマージされる。
例えば、クラスタが得られた後、最大の製品数を有するクラスタが見つかる。選択されたクラスタが十分な数の要素を有し、かつ十分な提示品質を有することを確実にするために、組み合わせた後の製品の数が事前に設定された閾値よりも大きくなるまで、最大の製品数を有するクラスタに隣接するクラスタがマージされる。例えば、そのような閾値は、組み合わせた製品の数が製品カテゴリの5%を占めるようであってもよい。
【0047】
304では、組み合わせた後のクラスタ内の複数の価格情報に基づいて、マージされたクラスタ内の平均価格情報が計算される。
【0048】
例えば、平均価格情報は、加重平均価格情報または演算平均価格情報に基づいていてもよい。
【0049】
1つの製品カテゴリの平均価格情報が得られた後、製品カテゴリの1つ以上の製品キーワードが平均価格情報と関連付けられている可能性がある。そのような関連性は、将来、照会に使用するためにデータベース内に格納されてもよい。
【0050】
104では、1つ以上の製品キーワードが受信されると、製品キーワードに対応する製品カテゴリの価格情報が表示される。
【0051】
ユーザのクエリから製品キーワードが受信されると、製品キーワードの情報に従って製品カテゴリの平均価格情報が検索され、ユーザに提示される。例えば、この例示的な実施形態における平均価格情報は、ある特定の販売属性下の製品の平均価格情報を意味する。例えば、
図4は、それぞれ「全国的な保証」および「小売店保証」である2つの販売属性下にある例示的な製品「Nokia 5230」の平均価格情報のインターフェースの略図を示す。
【0052】
この実施形態において、製品の分類は、固定属性および販売属性の両方に基づいている。販売属性は、製品の価格情報にも影響を与えるため、1つの例示的な実施形態において、販売属性に基づいて製品が分類された後、固定属性および販売属性の両方を満たす製品の平均価格情報を計算するためにクラスタ解析方法が行われてもよい。これにより、製品の価格情報をより適正に反映することができる。そのような方法は、価格情報を調べるための利便性をユーザに提供するだけではなく、ユーザとオンライン取引プラットフォームとの間のインタラクション操作および繰り返される照会操作の数を減少させる。さらに、そのような方法は、オンライン取引プラットフォームのサーバの動作性能も高める。
【0053】
図5は、第2の例示的な実施形態に従って、オンライン取引プラットフォームに基づく例示的なデータ処理方法のフロー図を示す。
【0054】
501では、カテゴリ情報に従って、データベースからカテゴリ下の製品情報が検索される。製品情報は、製品識別情報(ID)および製品価格情報を含む。
【0055】
502では、製品情報がフィルタリングされる。例えば、製品情報は、偽製品の製品情報をフィルタリングするための偽製品識別モデルに従ってフィルタリングされてもよい。
【0056】
この例示的な実施形態は、偽製品識別モデルを使用することによって得られた製品情報にフィルタリング処理を適用することを含む。実際の用途において、ある製品は既に在庫になっている可能性があり、またはあるユーザは故意に虚偽の製品情報を公開する。そのような製品情報は、製品価格情報を計算するために使用されるのに適していない。したがって、偽製品の製品情報をフィルタリングするように学習させた偽製品識別モデルが使用されてもよい。
【0057】
偽製品識別モデルは、定期的に更新することもできる。
【0058】
503では、複数の第1レベルの製品カテゴリを得るために、製品情報内の製品IDに従って第1の時点で製品が分類される。1つの第1レベルの製品カテゴリ内の製品は、同じかまたは実質的に同じ製品属性を有する。
【0059】
製品属性とは、製品に固有の固定属性を意味する。製品属性に従って第1の時点で製品が分類されると、製品は、複数の第1レベルの製品カテゴリに分類される。1つの製品カテゴリ内の製品は、同じかまたは実質的に同じ機能および特徴を有する。例えば、300mlのDa Bao洗顔料および100mlのDa Bao洗顔料は、同じ第1レベルの製品カテゴリに属するが、Mary Kayソフトフェイシャルクレンザーは、別の第1レベルの製品カテゴリに属する。
【0060】
504では、複数の第2レベルの製品カテゴリを得るために、製品の販売属性に従って、第2の時点で複数の第1レベルの製品カテゴリの各々内の製品が分類される。1つの第2レベルの製品カテゴリ内の製品は、同じかまたは実質的に同じ販売属性を有する。
【0061】
複数の第1レベルの製品カテゴリが得られた後、製品の販売属性に基づいて、第2の時点で第1レベルの製品カテゴリ内の製品がさらに分類される必要がある。各第2レベルの製品カテゴリ内の製品は、同じかまたは実質的に同じ販売属性を有する。例えば、第1のユーザの製品は300mlのDa Bao洗顔料であり、第2のユーザの製品は100mlのDa Bao洗顔料であり、第3のユーザの製品は300mlのDa Bao洗顔料である。これらの3つの製品は、同じ第1レベルの製品カテゴリに属するが、第2の時点での製品分類の間に、第1のユーザおよび第3のユーザの製品は、1つの第2レベルのカテゴリに属し、第2のユーザの製品は、別の第2レベルの製品カテゴリに属する。
【0062】
505では、第2レベルの製品カテゴリ下の製品の価格情報が、事前に設定された価格帯情報に従ってフィルタリングされる。
【0063】
事前に設定された価格帯情報とは、所定の価格情報の上限および価格情報の下限を意味する。1つの第2レベルの製品カテゴリ内の製品の価格情報は、事前に設定された価格帯情報に従ってフィルタリングされる。事前に設定された価格帯内の製品の価格情報は保持される。事前に設定された価格帯外の製品の価格情報は排除される。
【0064】
価格のフィルタリングを行うための異なる方法が存在してもよい。
【0065】
A1では、製品カテゴリ内の製品がラベル付き価格情報を有さない場合、フィルタリング後の価格情報セットを得るために、製品が属するカテゴリの事前に設定された価格帯情報がフィルタリング目的に使用される。
【0066】
製品が製造業者によって販売された場合、ラベル付き価格情報は、製造業者によってラベルを付けられた価格情報であってもよい。製品が製造業者によってラベルを付けられた価格情報を有さない場合、製品価格情報は、カテゴリの事前に設定された価格帯情報に従ってフィルタリングされる。フィルタリング後の価格情報は全て、事前に設定された価格帯情報の範囲内に属する。
【0067】
A2では、製品カテゴリ内の製品がラベル付き価格情報を有する場合、事前に設定されたラベル付き価格帯情報を得るために、製品が属するカテゴリの事前に設定された価格比率範囲情報が使用される。製品カテゴリ内の製品の価格情報をフィルタリングするために、現時点でのラベル付き価格帯情報が使用される。
【0068】
第2レベルのカテゴリ内の製品がラベル付き価格情報を有する場合、製品カテゴリ内の製品のラベル付き価格帯情報を計算するために、事前に設定された価格比率範囲情報が使用される。さらに、第2レベルの製品カテゴリ内の製品の価格情報をフィルタリングするために、ラベル付き価格帯情報が使用される。
【0069】
A3では、フィルタリングされた製品価格情報に基づいて、フィルタリング強度が所定の閾値よりも低いかどうかを判定するために、フィルタリング処理のフィルタリング強度が得られる。結果が「はい」である場合、フィルタリング前の価格情報が使用される。結果が「いいえ」である場合、フィルタリングから得られた価格情報が、フィルタリングされた価格情報セットとして使用される。
【0070】
フィルタリング強度を測定するための種々の方法が存在してもよい。例えば、フィルタリング強度を得るために、フィルタリング後の製品価格情報の数を、フィルタリング前の製品価格情報の数で除する。次いで、フィルタリング強度を事前に設定された閾値と比較する。事前に設定されたフィルタリング強度が事前に設定された閾値(0.5等)よりも低い場合、製品価格情報のうちの半数超がフィルタリングされたため、フィルタリングは無効と見なすことができる。フィルタリング強度が事前に設定された閾値よりも高い場合、フィルタリング後の価格情報が、フィルタリングされた価格情報セットとして使用される。
【0071】
506では、製品カテゴリ内でフィルタリングされた価格情報が、複数の価格情報クラスタにグループ化される。そのようなグループ化は、クラスタ解析アルゴリズムおよび事前に設定された情報クラスタの数に基づいていてもよい。
【0072】
第2レベルのカテゴリ内の価格情報は、クラスタ解析アルゴリズムおよび事前に設定されたクラスタの数に従っていくつかのクラスタにグループ化される。例えば、クラスタの数は10に設定される。種々のクラスタ解析アルゴリズムも存在する。クラスタリング処理の一例を以下に記載する。
【0073】
B1では、フィルタリングされた価格情報セットの平均値および事前に設定されたクラスタの合計数に従って、初期クラスタの中心点が選択される。
【0074】
価格情報クラスタの数が得られた後、フィルタリングされた価格情報セットの平均値およびクラスタの合計数に従って、初期クラスタの中心点が選択される。初期クラスタを選択することの目的は、クラスタの中で最も大きいクラスタを見つけることである。最も大きいクラスタは、最大の価格情報数を有するクラスタである。最も大きいクラスタ情報は、現在の販売属性下で製品カテゴリの平均価格情報を計算するための基準として用いられる。
【0075】
B2では、初期クラスタの中心点およびクラスタ解析アルゴリズムに基づいて、必要な事前に設定されたクラスタの数を得るために、収束に到達するまで価格情報セットに反復クラスタリングが適用される。
【0076】
例えば、必要な事前に設定されたクラスタの数を得るために、収束に到達するまで反復クラスタリングにおいてK平均アルゴリズムが使用されてもよい。
【0077】
B3では、最終的に得られた複数のクラスタとして、クラスタセットから十分な数の価格情報を有するクラスタが選択される。
【0078】
クラスタの集合から、十分に大きな数の価格情報を有するクラスタが、その後の価格情報計算において使用されるための最終的に得られた数のクラスタとして選択される。
【0079】
507では、得られた複数のクラスタから、最大の価格情報数を有するクラスタが隣接するクラスタとマージされる。
種々のマージ方法が存在する。マージ方法の一例を以下に記載する。
【0080】
C1では、各クラスタの中心点の値に従って複数のクラスタがソートされる。最大の価格情報数を有する最も大きいクラスタも、複数のクラスタから得られる。
【0081】
クラスタがマージされると、各クラスタの中心点の値に従って最大の価格情報数を有する最も大きいクラスタが検索される。
【0082】
C2では、最も大きいクラスタ内の価格情報の数が事前に設定された閾値に達するまで、ソート順序に従って最も大きいクラスタに隣接するクラスタがマージされる。
【0083】
ソート順序に従って、最も大きいクラスタ内の価格情報の数が事前に設定された閾値に達するまで、最も大きいクラスタに隣接するクラスタが最も大きいクラスタとマージされる。
【0084】
508では、融合後のクラスタ内の複数の価格情報に基づいて、マージされたクラスタ内の平均価格情報が計算される。
【0085】
種々の計算方法が存在する。計算方法の一例を以下に記載する。
【0086】
D1では、製品の参照価格情報が設定されているかどうかが決定される。結果が「はい」である場合、D2の動作が行われる。結果が「いいえ」である場合、D3の動作が行われる。
【0087】
D2では、1つ以上のクラスタの数が1より大きい場合、各クラスタの中心点の値に基づいて1つ以上のクラスタがソートされる。第2のクラスタは、最終的に得られたクラスタであってもよい。第2のクラスタ内の価格情報の数が、最終的に得られたクラスタ内の価格情報の合計数の比率(0.4倍等)よりも大きい場合、第2のクラスタの平均価格情報は、製品カテゴリの平均価格情報である。
【0088】
D3では、クラスタ内の複数の価格情報に基づいて、マージされたクラスタの加重平均価格情報が計算される。
【0089】
509では、1つ以上の製品キーワードが受信されると、製品キーワードに対応する製品カテゴリの平均価格情報が表示される。
【0090】
さらに、別の実施形態において、フロー図は、510をさらに含んでもよい。
510では、1つ以上の固定期間内に得られた平均価格情報が曲線図等のチャートに表される。
【0091】
図4に対応する
図6は、例示的な製品「Nokia 5230」の過去3ヶ月以内の価格情報の推移図を示す。
【0092】
この実施形態に記載される動作は、サーバの動作速度を向上させるだけでなく、推移図を使用することによって、ユーザに1つの製品の価格情報を表示する。K平均アルゴリズム等の適用可能なクラスタ解析アルゴリズムは、平均価格情報の計算の正確性をさらに向上させることができる。ユーザの製品価格の検索における正確性がさらに向上され、したがって、サーバの動作性能もさらに向上される。
【0093】
さらなる例示および詳細な例を提供するために、
図7は、第2レベルの製品カテゴリ下の製品の製品平均価格情報の例示的な計算のフロー図を示す。以下の例は、第2レベルのカテゴリが得られた後の、平均価格情報の計算処理に焦点を当てている。
【0094】
701では、製品カテゴリ内の製品がラベル付き価格情報を有する場合、事前に設定されたラベル付き価格帯情報を得るために、製品が属するカテゴリの事前に設定された価格比率範囲情報が使用される。製品カテゴリ内の製品の価格情報をフィルタリングするために、現時点でのラベル付き価格帯情報が使用される。
【0095】
例えば、特定の製品の場合、n数の製品アイテムが存在する。それらの価格情報セットは、
【0097】
で表される。Aは、情報セットを表す。a
nは、n番目の製品アイテムの価格情報を表す。ラベル付き価格情報を有する製品の場合、価格情報は、ラベル付き価格情報P
refを使用することによってフィルタリングされてもよい。所定の価格比率の範囲は、例えば、
【0099】
で表される。ラベル付き価格帯は、例えば、
【0101】
で表され(ラベル付き価格情報P
refを使用することによって計算されてもよい)、
【0103】
である。製品カテゴリ内の製品がラベル付き価格情報を有する場合、
【0105】
で表されるフィルタリングされた価格情報クラスタを得るために、ラベル付き価格帯
【0107】
を使用して価格情報をフィルタリングすることができる。例えば、
【0109】
は、値[0.5,2)を有してもよい。
【0110】
702では、フィルタリングされた製品価格情報に基づいて、フィルタリング強度が所定の閾値よりも低いかどうかを判定するために、フィルタリング処理のフィルタリング強度が得られる。結果が「はい」である場合、フィルタリング前の価格情報が使用され、702の動作が行われる。結果が「いいえ」である場合、フィルタリング後の価格情報がフィルタリングされた価格情報セットとして使用され、704の動作が行われる。
【0111】
例えば、フィルタリング強度は、得られた価格情報クラスタに基づいて計算され、式は、
【0113】
である。フィルタリング強度sが有効な閾値S
validよりも低い場合、ラベル付き価格情報に基づくフィルタリング処理は失敗であると見なされ、フィルタリング前の価格情報が使用される。換言すると、
【0115】
である。例えば、S
validは、値0.5を有してもよい。
【0116】
703では、製品カテゴリ内の製品がラベル付き価格情報を有さない場合またはラベル付き価格情報を使用したフィルタリングが失敗した場合、フィルタリング後の価格情報セットを得るために、製品が属するカテゴリの事前に設定された価格帯情報がフィルタリング目的に使用される。
【0117】
製品カテゴリ内の製品がラベル付き価格情報を有さない場合またはラベル付き価格情報を使用したフィルタリング処理が失敗である場合、データをフィルタリングするために、製品が属するカテゴリの価格帯情報の所定の上限および下限を使用することができる。
【0118】
例えば、製品が属するカテゴリの場合、価格帯の上限および下限は
【0120】
で表され、CP
lowは価格の下限を表し、CP
highは価格の上限を表す。価格の上限および下限は、カテゴリ下の製品の有効な価格帯を決定するために使用される。製品の価格情報が価格帯を越える場合、そのような価格情報は無効な価格情報であると見なすことができる。最終的に得られた価格情報セットは、
【0123】
704では、フィルタリング後の価格情報セットの平均値および事前に設定されたクラスタの合計数に従って、初期クラスタの中心点が選択される。
【0124】
例えば、実際の計算処理において、価格情報クラスタの平均値に基づいて初期クラスタの中心点が選択される。mが事前に設定されたクラスタの合計数として定義される場合、中心点の位置は、
【0127】
705では、初期クラスタの中心点およびクラスタ解析アルゴリズムに基づいて、必要な事前に設定されたクラスタの数を得るために、収束に到達するまで価格情報セットに反復クラスタリングが適用される。
【0128】
例えば、実際の用途において、K平均計算方法を使用することによって反復クラスタリングを行うことができ、収束の間に、C
resで表されるクラスタの集合を得ることができる。この動作において、例えば、反復収束を評価するための基準は、2つの反復から得られた2つの中心点間の距離の二乗和が閾値t
disよりも小さいようであってもよい。例えば、K数の反復を経験した後、2つの最も近い中心点クラスタ
【0132】
が満たされることが決定された後、C
kは、クラスタC
resの集合になる。上の基準において、例えば、
【0135】
706では、最終的に得られた複数のクラスタとして、クラスタセットから十分な数の価格情報を有するクラスタが選択される。
【0136】
十分に大きな数の価格情報を有するクラスタが保持され、
【0139】
例えば、閾値t
minは、0.05と定義されてもよい。
【0140】
707では、各クラスタの中心点の値に従って複数のクラスタがソートされる。最大の価格情報数を有する最も大きいクラスタも、複数のクラスタから得られる。
【0141】
最大の要素数を有するクラスタc
bを見つけるために、中心点の値に基づいて維持された複数のクラスタがソートされる。
【0142】
708では、最も大きいクラスタ内の価格情報の数が事前に設定された閾値に達するまで、ソート順序に従って最も大きいクラスタに隣接するクラスタがマージされる。
【0143】
例えば、マージされた最も大きいクラスタ内の価格情報の合計数の比率が閾値t
c1よりも高くなるまで、最も大きいクラスタの左側および右側の隣接するクラスタが、最も大きいクラスタとマージされる。換言すると、以下の基準が満たされる:
【0145】
例えば、閾値t
c1は、0.05と定義されてもよい。
【0146】
709では、製品カテゴリ内の製品のために製品の参照価格情報が設定されているかどうかが決定される。結果が「はい」である場合、710の動作が行われる。結果が「いいえ」である場合、711の動作が行われる。
【0147】
710では、1つ以上のクラスタの数が1より大きい場合、各クラスタの中心点の値に基づいて1つ以上のクラスタがソートされる。例えば、第2のクラスタは、最終的に得られたクラスタであってもよい。第2のクラスタ内の価格情報の数が、最終的に得られたクラスタ内の価格情報の合計数の比率(0.4倍等)よりも大きい場合、第2のクラスタの平均価格情報は、製品カテゴリの平均価格情報である。
【0148】
例えば、製品カテゴリ内の製品のために参照価格情報が確立されている場合、C
keep内のクラスタの数は1よりも大きく、クラスタ内の価格情報の数に基づいてクラスタの集合がソートされる。ソート後の第2のクラスタがC
keepに属し、第2のクラスタ内の価格情報の数がクラスタの集合内の価格情報の合計数よりも0.4倍大きい場合、第2のクラスタの平均価格情報が製品カテゴリの参照価格として使用される。
【0149】
711では、マージされたクラスタの加重平均価格情報が、その収容された複数の価格情報に基づいて計算される。
【0150】
例えば、C
main内のクラスタが加重平均を計算するために使用される:
【0152】
この場合、lおよびrは、クラスタが中心点の値に基づいて小さい順にソートされた後の、最終的に保持されたクラスタの左境界および右境界をそれぞれ意味する。Count(c
i)は、クラスタ内の要素の合計数を意味する。a
i,jは、クラスタ要素を意味し、この例では価格情報を意味する。bは、最大の要素数を有する中心クラスタを意味する。この例では、m=10である。例えば、クラスタリング後に、6番目のクラスタが最大の要素数を有することが分かった場合、6番目のクラスタの左および右の隣接するクラスタは、マージされたクラスタ内の価格情報の数が十分に大きくなるまで6番目のクラスタとマージされる。例えば、左境界のクラスタの位置が3であり、右境界のクラスタの位置が8であると仮定すると、その販売属性下にある現在の製品カテゴリの平均価格情報を計算するために、これらの値を上記式に代入することができる。
【0153】
この例において計算される平均価格情報は、その販売属性下の製品の平均価格情報である。この例において、計算される製品の平均価格情報は、オンライン取引プラットフォーム上で製品のラベル付き価格情報と取引価格情報とを組み合わせる。製品価格情報に対するクラスタリング解析方法の適用は、価格情報に製品の適正な価格情報を現実的に反映させる。さらに、偽製品情報のフィルタリングも、計算される製品価格の適正性を向上させる。
【0154】
上述の例示的な方法は、便宜上、一連の動作として記載される。当業者は、本開示が記載される動作の順序に限定されなくてもよいことを理解するであろう。本開示に従って、動作は他の順序を用いてもよい。また、動作のうちのいくつかまたは全てが、同時にまたは実質的に同時に起こってもよい。当業者は、いくつかの動作またはモジュールは、いくつかの実施形態には必要ないことも理解するであろう。
【0155】
第1の例示的な方法の実施形態におけるオンライン取引プラットフォームに基づくデータ処理方法に対応して、
図8は、第1の例示的な実施形態におけるオンライン取引プラットフォームに基づく第1の例示的なデータ処理デバイス800の構造図を示す。
【0156】
一実施形態において、デバイス800は、これらに限定されないが、1つ以上のプロセッサ802およびメモリ804を含んでもよい。メモリ804は、ランダムアクセスメモリ(RAM)等の揮発性メモリおよび/またはリードオンリーメモリ(ROM)もしくはフラッシュRAM等の不揮発性メモリの形態でコンピュータ可読媒体を含んでもよい。メモリ504は、コンピュータ可読媒体の一例である。
【0157】
コンピュータ可読媒体は、コンピュータ実行可能命令、データ構造、プログラムモジュール、または他のデータ等の情報の格納のための任意の方法または技術において実装される、揮発性および不揮発性の、取り外し可能および取り外し不可能な媒体を含む。コンピュータ記憶媒体の例として、限定されないが、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、電気的消去・プログラム可能型読取専用メモリ(EEPROM)、フラッシュメモリもしくは他のメモリ技術、コンパクトディスク読取専用メモリ(CD−ROM)、デジタル多目的ディスク(DVD)もしくは他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、またはコンピュータデバイスによるアクセスのために情報を格納するために使用することができる任意の他の非伝送媒体が挙げられる。本明細書で定義される場合、コンピュータ可読媒体は、変調データ信号および搬送波等の一過性媒体を含まない。
【0158】
メモリ804は、その中にプログラム単位またはモジュールおよびプログラムデータを格納することができる。一実施形態において、モジュールは、検索モジュール810、分類モジュール820、価格計算モジュール830、および表示モジュール840を含んでもよい。
【0159】
これらのモジュールは、したがって、1つ以上のプロセッサ802によって実行することができるソフトウェア内に実装されてもよい。他の実装において、モジュールは、ファームウェア、ハードウェア、ソフトウェア、またはそれらの組み合わせの中に実装されてもよい。
【0160】
検索モジュール810は、カテゴリ情報に従って、データベースからカテゴリ下の製品情報を検索する。製品情報は、製品識別情報(ID)および製品価格情報を含む。
【0161】
分類モジュール820は、複数の製品カテゴリを得るために、製品属性および販売属性に従って製品を分類する。同じ製品カテゴリ下の製品は、同じかまたは実質的に同様の製品属性および販売属性を有する。販売属性は、製品価格に影響する製品属性以外の属性である。
【0162】
価格計算モジュール830は、各製品カテゴリに対応する価格情報を得るために、各カテゴリ下の製品に1つ以上の計算分析アルゴリズムをそれぞれ適用する。1つ以上の計算アルゴリズムは、クラスタリングアルゴリズムを含む。価格情報とは、それらの対応する販売属性下の製品の価格情報を意味する。
【0163】
表示モジュール840は、1つ以上の製品キーワードが受信されると、製品キーワードに対応する製品カテゴリの価格情報を表示する。
【0164】
図9に示すように、価格計算モジュール830は、フィルタリングサブモデル901、グループ化サブモジュール902、融合サブモジュール903、および計算サブモジュール904をさらに含んでもよい。
【0165】
フィルタリングサブモジュール901は、事前に設定された価格帯情報に従って、1つの製品カテゴリ下の製品の価格情報をフィルタリングする。
【0166】
フィルタリングサブモジュール901は、価格情報をフィルタリングするための多くの方法および/または実施形態とともに構成されてもよい。例えば、フィルタリングサブモジュール901は、第1のフィルタリングサブモジュール、第2のフィルタリングサブモジュール、および決定サブモジュールも含んでもよい。
【0167】
第1のフィルタリングサブモジュールは、製品カテゴリ内の製品がラベル付き価格情報を有さない場合、フィルタリング後の価格情報セットを得るために、製品が属するカテゴリの事前に設定された価格帯情報に従って価格情報をフィルタリングする。
【0168】
第2のフィルタリングサブモジュールは、製品カテゴリ内の製品がラベル付き価格情報を有する場合、製品が属するカテゴリの事前に設定された価格比率範囲情報に従って、事前に設定されたラベル付き価格帯情報を得、現時点でのラベル付き価格帯情報を使用することによって価格情報をフィルタリングする。
【0169】
決定サブモジュールは、フィルタリングされた製品価格情報に基づいて、フィルタリング処理のフィルタリング強度を得、フィルタリング強度が所定の閾値よりも低いかどうかを判定する。結果が「はい」である場合、フィルタリング前の価格情報が使用される。結果が「いいえ」である場合、フィルタリングから得られた価格情報が、フィルタリングされた価格情報セットとして使用される。
【0170】
グループ化サブモジュール902は、製品カテゴリ内でフィルタリングされた価格情報を複数の価格情報クラスタにグループ化する。そのようなグループ化は、クラスタ解析アルゴリズムおよび事前に設定された情報クラスタの数に基づいていてもよい。
【0171】
グループ化サブモジュール902は、フィルタリングされた価格情報をグループ化するための多くの方法および/または実施形態とともに構成されてもよい。例えば、グループ化サブモジュール902は、選択サブモジュール、クラスタリングサブモジュール、およびクラスタ取得サブモジュールをさらに含んでもよい。
【0172】
選択サブモジュールは、フィルタリングされた価格情報セットの平均値および事前に設定されたクラスタの合計数に従って、初期クラスタの中心点を選択する。
【0173】
クラスタリングサブモジュールは、初期クラスタの中心点およびクラスタ解析アルゴリズムに基づいて、必要な事前に設定されたクラスタの数を得るために、収束に到達するまで価格情報セットに反復クラスタリングを適用する。
【0174】
クラスタ取得サブモジュールは、最終的に得られた複数のクラスタとして、クラスタセットから十分な数の価格情報を有するクラスタを選択する。
【0175】
融合サブモジュール903は、得られた複数のクラスタから、最大の価格情報数を有するクラスタを隣接するクラスタとマージする。
【0176】
融合サブモジュール903は、クラスタをマージするための多くの方法および/または実施形態とともに構成されてもよい。例えば、融合サブモジュール903は、ソートサブモジュールおよびマージサブモジュールをさらに含んでもよい。
【0177】
ソートサブモジュールは、各クラスタの中心点の値に従って複数のクラスタをソートし、複数のクラスタから最大の価格情報数を有する最も大きいクラスタを得る。
【0178】
マージサブモジュールは、最も大きいクラスタ内の価格情報の数が事前に設定された閾値に達するまで、ソート順序に従って最も大きいクラスタに隣接するクラスタを最も大きいクラスタとマージする。
【0179】
計算サブモジュール904は、融合後のクラスタ内の複数の価格情報に基づいて、マージされたクラスタ内の平均価格情報を計算する。
【0180】
計算サブモジュール904は、平均価格情報を計算するための多くの方法および/または実施形態とともに構成されてもよい。
【0181】
例えば、計算サブモジュール904は、製品の参照価格情報が設定されているかどうかを決定することができる。結果が「はい」であり、かつ1つ以上のクラスタの数が1より大きい場合、各クラスタの中心点の値に基づいて1つ以上のクラスタがソートされる。第2のクラスタは、最終的に得られたクラスタであってもよい。第2のクラスタ内の価格情報の数が、最終的に得られたクラスタ内の価格情報の合計数の比率(0.4倍等)よりも大きい場合、第2のクラスタの平均価格情報は、製品カテゴリの平均価格情報である。
【0182】
結果が「いいえ」である場合、クラスタ内の複数の価格情報に基づいて、マージされたクラスタの加重平均価格情報が計算される。
【0183】
例示的な実施形態におけるデバイスおよび/または1つ以上のモジュールは、オンライン取引プラットフォームのサーバに統合することができるか、またはオンライン取引プラットフォームのサーバに接続される独立した物体として設定することができる。本開示の方法がソフトウェアによって実装される場合、本方法は、オンライン取引プラットフォームのサーバ内に追加の機能として含まれてもよく、また、コンピュータ可読媒体上に保存される独立したプログラムとして実装されてもよい。本開示は、方法、デバイス、および/またはモジュールの実装の形態について制限を設けない。
【0184】
例示的な実施形態において開示されるデバイスは、製品の価格情報をより正確かつ適正に反映することができる。このことは、ユーザが価格情報を検索する処理を簡素化し、それと同時に、ユーザのオンライン取引プラットフォームのサーバとのインタラクションの頻度および繰り返されるクエリを減少させ、それによって、オンライン取引プラットフォームのサーバの動作機能を向上させる。
【0185】
第2の例示的な方法の実施形態におけるオンライン取引プラットフォームに基づくデータ処理方法に対応して、
図10は、第1の例示的な実施形態におけるオンライン取引プラットフォームに基づく第2の例示的なデータ処理デバイス1000の構造図を示す。
【0186】
一実施形態において、デバイス1000は、これらに限定されないが、1つ以上のプロセッサ802およびメモリ804を含んでもよい。
【0187】
メモリ804は、その中にプログラム単位またはモジュールおよびプログラムデータを格納することができる。一実施形態において、モジュールは、検索モジュール810、偽製品識別モデルモジュール1002、分類モジュール820、価格計算モジュール830、対応する関係記憶モジュール1004、および表示モジュール840を含んでもよい。
【0188】
これらのモジュールは、したがって、1つ以上のプロセッサ802によって実行することができるソフトウェア内に実装されてもよい。他の実装において、モジュールは、ファームウェア、ハードウェア、ソフトウェア、またはそれらの組み合わせの中に実装されてもよい。
【0189】
検索モジュール810は、カテゴリ情報に従って、データベースからカテゴリ下の製品情報を検索する。製品情報は、製品識別情報(ID)および製品価格情報を含む。
【0190】
偽製品識別モデルモジュール1002は、偽製品の製品情報をフィルタリングするための1つ以上の偽製品識別モデルを使用することによって、製品をフィルタリングする。
【0191】
分類モジュール820は、第1の分類サブモジュール1006および第2の分類サブモジュール1008をさらに含んでもよい。
【0192】
第1の分類サブモジュール1006は、複数の第1レベルの製品カテゴリを得るために、製品情報内の製品IDに従って第1の時点で製品を分類する。1つの第1レベルの製品カテゴリ内の製品は、同じかまたは実質的に同じ製品属性を有する。
【0193】
第2の分類サブモジュール1008は、複数の第2レベルの製品カテゴリを得るために、製品の販売属性に従って、第2の時点で複数の第1レベルの製品カテゴリの各々内の製品を分類する。1つの第2レベルの製品カテゴリ内の製品は、同じかまたは実質的に同じ販売属性を有する。
【0194】
価格計算モジュール830は、各製品カテゴリに対応する価格情報を得るために、各カテゴリ下の製品に1つ以上の計算分析アルゴリズムをそれぞれ適用する。1つ以上の計算アルゴリズムは、クラスタリングアルゴリズムを含む。
【0195】
対応する関係記憶モジュール1004は、製品情報と計算された価格情報との間の対応する関係を格納する。
【0196】
表示モジュール840は、1つ以上の製品キーワードが受信されると、製品キーワードに対応する製品カテゴリの平均価格情報を表示する。
【0197】
さらに、本開示は、オンライン取引プラットフォームのサーバも提供する。サーバの1つ以上のプロセッサおよび/またはコンピュータ可読媒体が、本開示に開示されるようなデバイスの任意の部分または任意のデバイスと統合されてもよい。
【0198】
種々の例示的な実施形態が、本開示において段階的に説明される。例示的な実施形態の同じかまたは同様の部分は、相互に参照されてもよい。各例示的な実施形態は、他の例示的な実施形態とは異なる焦点を有する。具体的には、例示的なシステムの実施形態は、その例示的な方法の実施形態との基本的一致のために、比較的単純な様式で記載されている。その詳細は、例示的な方法の実施形態の関連する部分に言及されてもよい。
【0199】
最後に、本開示における「第1の」および「第2の」等の任意の関係を表す用語は、一方の物体を他方の物体から、または一方の動作を他方の動作から識別することを意味するに過ぎず、必ずしも、これらの物体または動作の間の任意の実際の関係または順序の存在を要求または暗示するわけではないことに留意されたい。さらに、「含む(include)」、「有する(have)」等の用語、または任意の他の変形語は、非排他的に「含む(comprising)」ことを意味することが企図される。したがって、一連の特徴を個々に含むプロセス、方法、物品、またはデバイスは、これらの特徴を含むことができるだけではなく、列挙されていない他の特徴、またはこれらのプロセス、方法、物品、もしくはデバイスの任意の固有の特徴も含むことができる。さらなる制限なしに、「〜を含む(include)」という句に定義される特徴は、特徴を列挙するプロセス、方法、物品、またはデバイスが他の均等な特徴を含むかもしれないという可能性を排除するものではない。
【0200】
本開示によって提供されるクラスタリングの方法およびシステムを上に詳述した。上述の例示的な実施形態は、本開示の概念および実装を例示するために用いられる。例示的な実施形態は、本開示の方法およびそれぞれの中心的概念を理解し易くするために提供される。本開示の概念に基づいて、当業者は、実践的な実装および用途の範囲に対する変更を行うことができる。結論として、本開示の内容は、本開示を制限するものであると解釈されるべきではない。