【文献】
埋金 進一、外1名,Hadoop−企業システムでの実力は? 1000万件のバッチを2分で実行 ノード数に比例して性能が向上,日経SYSTEMS,日本,日経BP社,2010年10月26日,第211号,p.62−67
(58)【調査した分野】(Int.Cl.,DB名)
前記クラスタ内の注文コンテンツが特徴文字列にマッピングされ、分析すべき注文コンテンツのマッピングされた文字列が前記特徴文字列と同じである場合、前記分析すべき注文は直接前記クラスタに追加される、
請求項1乃至請求項6のいずれか1項に記載の方法。
【発明を実施するための形態】
【0019】
本願の実施の形態は、注文クラスタリング方法及び装置並びに悪意ある情報に対抗する方法及び装置を提供する。
【0020】
当業者が本願の技術的解決策をより良く理解するように、本願の実施の形態における添付図面に関連して、本願の実施の形態における技術的解決策を明確かつ完全に以下説明する。明らかなことであるが、記載した実施の形態は、本願の実施の形態の全てではなく、一部に過ぎない。本願の実施の形態に基づき当業者が創造的に努力することなく獲得する他の全ての実施の形態は、本願の保護範囲に含まれる。
【0021】
図1は、本願の実施の形態に係る、電子商取引における注文クラスタリング方法を示すフローチャートである。この実施の形態では、転送される情報の一部は正常な情報であり、また一部は悪意ある情報である。ユーザによって転送された情報は、電子商取引システム内のサーバによって送られるので、この実施の形態に係る方法は、電子商取引システムのサーバによって実施することができる。ミーンシフトクラスタリングアルゴリズム等のクラスタリングアルゴリズムを用いて、転送された情報を自動的に分類し、新しいクラスタを自動的に作成することができる。開発者は、クラスタの数を事前に特定する必要はない。この分類方法は柔軟であり、注文コンテンツの自己識別精度及び分類精度を改善できる。さらに、人の関与を減らし、作業効率を向上させ、その後の悪意ある情報に対抗する処理効率を改善できる。
【0022】
図1には、以下のステップが含まれる。すなわち、
ステップ101:注文に関する情報に基づいて、一意の注文IDと、対応する注文コンテンツとを生成する。
【0023】
ステップ102:注文コンテンツを注文ベクトルに変換する。
【0024】
ステップ103:一意の注文ID及び注文ベクトルに基づいてクラスタリング操作を実行し、注文クラスタリング結果を取得する。
【0025】
この実施の形態では、ミーンシフト(mean shift)クラスタリングアルゴリズムを用いて注文に対しクラスタリング操作を行うことにより注文クラスタリング結果を取得することができる。ミーンシフトクラスタリング操作は、ノンパラメトリック多数モデルのセグメント化方法である。その基本的な計算モジュールでは、従来のパターン認識プログラムが用いられる。セグメント化は、画像の固有空間の解析とクラスタリング方法とに基づいて行われる。ミーンシフトクラスタリング操作では、固有空間確率密度関数の極大値を直接的に推定し、未知クラスタの密度パターンを求め、パターンの位置を特定する。次に、その注文がパターンに関連するクラスタに追加される。実際の実施の形態では、必要に応じて、適切なクラスタリングアルゴリズムを選択又は用いることができる。
【0026】
本願の実施の形態によると、本方法は、クラスタ内の注文コンテンツを特徴文字列(characteristic string)にマッピングするステップをさらに含む。分析すべき注文コンテンツのマッピングされた文字列がその特徴文字列と同じである場合、分析すべき注文は直接クラスタに追加される。
【0027】
本願の実施の形態によると、注文に関する情報に基づいて注文コンテンツ及び一意の注文IDを生成する前に、本方法は、注文をHadoop分散ファイルシステム(HDFS)へインポートするステップをさらに含む。本願におけるその後のステップは、処理効率を改善するためにHDFSにおいて実行できる。もちろん、本開示の別のステップをHDFSにおいて実行することは任意である。これらのステップは、他の分散システムでも実行でき、効率も改善できるだろう。ここでは、説明を簡単にするために詳細は省略する。
【0028】
本願の実施の形態によると、注文に関する情報に基づいて注文コンテンツ及び一意の注文IDを生成するステップは:注文に関する情報のユーザID、注文ID、及びサービスタイプに基づいて一意の注文IDを生成するステップと;注文に関する情報の注文タイトル又は注文リマーク(注文の注釈)に基づいて注文コンテンツを生成するステップと;をさらに含む。
【0029】
本実施の形態では、ユーザID、注文ID及びサービスタイプ(及びこれら3つのフィールドの組み合わせ)に基づいて一意の注文IDを生成することに加え、一意の注文IDを、ユーザID、注文ID、及びサービスタイプのどの組み合わせに基づいても生成できる。代替として、一意の注文IDを生成するために別のフィールドの(例えば外部の注文番号のような)コンテンツを含むこともできる。
【0030】
注文タイトルには、商品説明と注文明細が含まれる。例えば、代金回収サービスの注文タイトルは、サービス名、支払人、又はメッセージを含むことができる。注文リマークには、URLアドレス、宣伝文、宣伝画像等、注文を始めたユーザのプロモーション(販売促進)情報を含むことができる。
【0031】
本願の実施の形態によると、注文コンテンツを注文ベクトルに変換するステップは、注文コンテンツをTF−IDF(term frequency−inverse document frequency、(単語出現頻度−逆文書頻度))ベクトルに変換するステップを含む。
【0032】
本願のこの実施の形態では、ミーンシフトクラスタリングアルゴリズムを用いて電子商取引における注文を自動的に分類でき、新しいクラスタを、注文のリアルタイムコンテンツに基づいて分析することによって取得することができる。注文が処理されると、この注文はコード変換(transcoding)される。次に、注文の分類効率をさらに改善するために、コード変換された注文が、あるクラスタ内の注文の特徴文字列と同じであるかどうかを判断できる。注文は、分散システムの特性を利用して、注文分類効率をさらに改善するために、HDFS等の分散ファイルシステムへインポートすることができる。
【0033】
図2は、本願の実施の形態に係る、電子商取引における注文クラスタリング装置を示す概略構造図である。本実施の形態に係る装置は、電子商取引システムのサーバへインストールできる。又は、高性能サーバを別に用いて本実施の形態に係る装置を実装できる。本実施の形態に係る装置の各機能ユニット又は各機能モジュールは、専用の中央演算処理装置(CPU)、シングルチップマイクロコンピュータ、若しくは書き換え可能ゲートアレイ(FPGA)によって実現できる、又は各機能モジュールの制御ロジックを実行する汎用プロセッサによって実現できる。本実施の形態に係る装置の機能モジュールは、注文を効率的に分類するためのミーンシフトクラスタリング操作を実行し、注文コンテンツに基づいて新しいクラスタを取得することができる。開発者は、クラスタの数を事前に特定する必要はない。このように、注文クラスタリングに基づく悪意ある情報に対抗する自己識別精度、分類精度及び作業効率を改善でき、また、人の関与を減らせる。
【0034】
本実施の形態に係る装置は、注文に関する情報に基づいて一意の注文IDと注文コンテンツとを生成するように構成された生成ユニット201と;注文コンテンツを注文ベクトルへ変換するように構成されたベクトル変換ユニット202と;一意の注文IDと注文ベクトルとに基づいてクラスタリング操作を実行して注文クラスタリング結果を取得するクラスタリング操作ユニット203と;を含む。
【0035】
本願の実施の形態によると、この装置は生成ユニットとクラスタリング操作ユニットとを接続する変換ユニット204をさらに含み、クラスタ内の注文コンテンツを特徴文字列にマッピングするように構成されている。注文コンテンツのマッピングされた文字列がその特徴文字列と同じ場合、注文をそのクラスタに追加する。
【0036】
本願の実施の形態によると、この装置は、Hadoop分散ファイルシステム(HDFS)へ注文をインポートするように構成されたインポートユニット205をさらに含む。
【0037】
本願の実施の形態によると、生成ユニットは、注文情報に含まれるユーザID、注文ID、及びサービスタイプに基づいて一意の注文IDを生成するように、及び注文情報の注文タイトル又は注文説明に基づいて注文コンテンツを生成するように、さらに構成される。
【0038】
本願の実施の形態によると、ベクトル変換ユニットは、注文コンテンツをTF−IDFベクトルへ変換するように、さらに構成される。
【0039】
本願の本実施の形態における装置では、ミーンシフトクラスタリングアルゴリズムを用いて、電子商取引における注文を自動的に分類でき、新しいクラスタは注文のリアルタイムコンテンツに基づいた分析によって取得することができる。注文が処理されると、注文はコード変換される。次に、注文の分類効率をさらに改善するために、コード変換された注文が、あるクラスタ内の注文の特徴文字列と同じであるかどうかを特定できる。注文は、分散システムの特性を利用して、注文の分類効率をさらに改善するために、HDFS等の分散ファイルシステムへインポートすることができる。
【0040】
図3は、本願の実施の形態に係る、注文クラスタリングに基づいて悪意ある情報に対抗する方法を示すフローチャートである。本実施の形態では、生成されたクラスタを分析して、悪意ある情報(迷惑注文等)を含むクラスタを特定する。クラスタ内の注文の対応処理を実行することによって、電子商取引のリスクを回避できる。
【0041】
図には、以下のステップが含まれている。すなわち、
ステップ301:注文に関する情報に基づいて、一意の注文ID及び注文コンテンツを生成する。
【0042】
ステップ302:注文コンテンツを注文ベクトルに変換する。
【0043】
ステップ303:一意の注文ID及び注文ベクトルに基づいてクラスタリング操作を実行し、注文クラスタリング結果を取得する。
【0044】
ステップ304:各クラスタの代表的な注文コンテンツを分析し、代表的な注文コンテンツに悪意ある情報が含まれている場合は、クラスタ内の注文の対応処理を実行する。
【0045】
既存の方法を用いて、クラスタ内の注文コンテンツが悪意ある情報かどうかを特定できる。例えば、クラスタ内の特定の注文コンテンツが悪意ある情報であるかどうかを、キーワードに基づいて特定する、又はその注文コンテンツをマニュアルスクリーニングする。この対応する処理ステップは、クラスタ内にユーザIDを記録するステップ、ユーザIDを禁止するよう管理者へユーザIDを送信するステップ、及びユーザIDへアラーム情報を送信するステップ等を含むことができる。
【0046】
本願の実施の形態によると、本方法は、クラスタ内の注文コンテンツを特徴文字列にマッピングするステップをさらに含む。注文コンテンツのマッピングされた文字列が特徴文字列と同じ場合、この注文を直接、クラスタへ追加する。
【0047】
本発明の実施の形態によると、注文コンテンツのマッピングされた文字列が特徴文字列と同じである場合において、本方法はさらに:クラスタが迷惑な分類としてマーキングされた場合、取引を凍結する又は注文に関連するユーザアカウントをブロックする等、悪意ある情報を自動で処理する工程を直ちに実行するステップを含む。
【0048】
ここでいう注文コンテンツは、クラスタからランダムに選択された注文のコンテンツである。
【0049】
先に述べたステップにより、クラスタリング操作後に得られたクラスタに基づいて、解析すべき注文を分類できる。あるユーザにとって、多数の転送された情報(例えば注文)が同じである可能性がある。したがって、転送された情報を含むクラスタは、前述のクラスタリングアルゴリズムを通して得られる。クラスタ内の特徴的なサンプル(最も代表的な転送される情報)がMD5コードへコード変換される。転送された情報が再度受信されると、転送された情報がクラスタに含まれているかどうかは、転送された情報をMD5コードに変換し、2つのMD5コードを比較することによって特定できる。先に述べた技術的解決策に基づいて、当業者は、別のタイプのコード変換が実現可能であると推論できる。説明を簡単にするため、ここでは詳細を繰り返さない。
【0050】
本願のこの実施の形態における方法では、ミーンシフトクラスタリングアルゴリズムを用いて、電子商取引における注文を自動的に分類できる(実際の実施態様では、必要に応じて適切なクラスタリングアルゴリズムを選択でき、又は用いることができる)。また、新しいクラスタは、注文のリアルタイムコンテンツに基づく分析を通して取得することができる。注文が処理されると、注文はコード変換される。次に、注文を分類する効率をさらに改善するために、コード変換された注文が、あるクラスタ内の注文の特徴文字列と同じであるかどうかを特定できる。注文は、分散システムの特性を利用して、注文の分類効率をさらに向上させるために、HDFS等の分散ファイルシステムへインポートすることができる。類似の注文のみが1つのクラスタにクラスタリングされるため、クラスタ内の1つの代表的な注文コンテンツを分析すれば、クラスタ全体が悪意ある情報クラスタであるかどうかを特定でき、それにより各注文を比較して特定する工程が単純化される。
【0051】
図4は、本願の実施の形態に係る、注文クラスタリングに基づく悪意ある情報に対抗する装置を示す概略構造図である。本実施の形態の装置は、電子商取引システムのサーバにインストールすることができる。あるいは、高性能サーバを別途用いて本実施の形態における装置を実現できる。本実施の形態における装置の各機能ユニット又は機能モジュールは、専用の中央演算処理装置(CPU)、シングルチップマイクロコンピュータ、若しくは書き換え可能ゲートアレイ(FPGA)によって実装でき、又は各機能モジュールの制御ロジックを実行する汎用プロセッサによって実現することができる。本実施の形態における装置の機能モジュールは、注文を効率的に分類するために、ミーンシフトクラスタリング操作を実行し、注文コンテンツに基づいて新たなクラスタを取得することができる。開発者は、クラスタの数を事前に特定する必要はない。このように、注文クラスタリングに基づいて悪意ある情報に対抗する自己識別精度、分類精度、及び作業効率を改善でき、また、人の関与を減らせる。
図に示す実施の形態は、注文に関する情報に基づいて一意の注文ID及び注文コンテンツを生成するように構成された生成ユニット401と;注文コンテンツを注文ベクトルへ変換するように構成されたベクトル変換ユニット402と;一意の注文ID及び注文ベクトルに基づいてクラスタリング操作を実行して注文クラスタリング結果を取得するクラスタリング操作ユニット403と;各クラスタの代表的な注文コンテンツを分析し、代表的な注文コンテンツに悪意ある情報が含まれている場合には、クラスタ内の注文の対応処理を実行する処理ユニット404と;を含む。
【0052】
本願の実施の形態によると、この装置は生成ユニットとクラスタリング操作ユニットとを接続する変換ユニット405をさらに含み、クラスタ内の注文コンテンツを特徴文字列にマッピングするよう構成されている。注文コンテンツのマッピングされた文字列が特徴文字列と同じ場合、分析すべき注文をクラスタに追加する。
【0053】
本願の実施の形態によると、クラスタに迷惑な分類がマーキングされている場合、変換ユニットは、分析すべき注文を処理ユニットへ直接送信して、悪意ある情報を自動的に処理する(取引の凍結又はアカウントのブロッキング等)ようにさらに構成される。
【0054】
本願の本実施の形態における装置では、ミーンシフトクラスタリングアルゴリズムを用いて、電子商取引における注文を自動的に分類できる(実際の実施態様では、必要に応じて適切なクラスタリングアルゴリズムを選択する、又は用いることができる)。また、新しいクラスタを、注文のリアルタイムコンテンツに基づく分析を通して取得することができる。注文が処理されると、注文はコード変換される。次に、注文の分類効率をさらに改善するために、コード変換された注文が特定のクラスタ内の注文の特徴文字列と同じであるかどうかを特定できる。注文は、分散システムの特性を利用して、注文の分類効率をさらに向上させるために、HDFS等の分散ファイルシステムにインポートすることができる。類似の注文のみが1つのクラスタにクラスタ化されるため、クラスタ内の1つの代表的な注文コンテンツを分析して、クラスタ全体が悪意ある情報クラスタであるかどうかを特定することができ、各注文を比較して特定する工程が単純化される。
【0055】
図5は、本願の実施の形態に係る、電子商取引における注文クラスタリングに基づく、悪意ある情報に対抗する方法を示すフローチャートである。本実施の形態では、総合的な作業効率を向上させるために、Hadoop分散ファイルシステムで全ての方法を実行する。クラスタリング処理では、ミーンシフトクラスタリング方法を例に説明する。例えば、回収サービスの場合、回収サービスによって開始される注文には、ユーザID、注文ID、サービスタイプ、支払人ID、日付、金額等が含まれる。注文にはリマーク情報がさらに含まれる。リマーク情報には、フィッシングサイトのURLが含まれる。悪意あるユーザは、転送された情報を多くのユーザへ送信する。
【0056】
図では、以下のステップが含まれる:
ステップ501:データベースから得た注文をHadoop分散ファイルシステム(HDFS)にインポートする。
【0057】
ステップ502:注文の一意のIDとして、ユーザID、注文ID、及びサービスタイプの組み合わせを用いる。
【0058】
本ステップにおける組み合わせは、ユーザID、注文ID、及びサービスタイプを組み合わせて注文の一意のIDを形成するステップ、又はユーザIDの最後の2文字、注文IDの最後の2文字、及びサービスタイプを組み合わせて注文の一意のIDを形成するステップを含んでもよい。一意のIDは、注文を一意に識別するために、別の方法で生成することもできる。例えば、注文を、注文IDだけで一意に識別できる。
【0059】
ステップ503:注文におけるリマーク情報を注文コンテンツとして用いる。
【0060】
本実施の形態では、注文のリマーク情報が注文コンテンツを記述する。例えば、リマーク情報には、フィッシングサイトのURLアドレスが含まれる。別の実施の形態では、注文が取引記録のようなコンテンツをさらに含む場合、このコンテンツの部分を注文コンテンツとして用いることもできる。取引記録には、注文の商品記述を含めることができる。代金回収の利用の場合、取引記録には、サービスのタイトル、支払人、金額等が含まれる。
【0061】
この場合、各注文の一意のIDは注文コンテンツに対応する。
【0062】
ステップ504:注文の一意のIDと注文コンテンツとをシーケンスファイル形式に変換する。
【0063】
本ステップでは、変換後に得られるシーケンスファイル形式は、Hadoop分散ファイルシステム(HDFS)で使用されるデータ形式である。HDFSに基づく処理方法は、注文の一意のIDと注文コンテンツとをこのフォーマットに変換して処理効率を改善させた後に限って用いることができる。
【0064】
ステップ505:注文コンテンツをTF−IDFベクトルに変換する。
【0065】
変換後に得られたTF−IDFベクトルは、注文の一意のIDとの間でマッピング関係<キー、ベクトル>を持つ。キーは注文の一意のIDである。ベクトルは、注文コンテンツによって形成され、注文コンテンツの数式表現形式である。
【0066】
ステップ506:ベクトルに対してミーンシフトクラスタリング操作を実行して注文クラスタリング結果を取得する。
【0067】
本ステップでは、注文コンテンツをクラスタと繰り返し比較する。その注文コンテンツを含むクラスタ又は新しいクラスタは出力される。ベクトルとの間でマッピング関係を持つキー値(注文の一意のID)が存在するため、特定の注文を含むクラスタを特定できる。ミーンシフトクラスタリング操作における反復パラメータ、収束パラメータ等は、実際の実施の形態に基づいて開発者が設定できる。出力結果の形式はシーケンスファイル形式である。
【0068】
ミーンシフトクラスタリング操作に基づく注文分類工程は、この時点で終了する。
【0069】
ステップ507:注文クラスタリング結果をテキスト形式に変換する。
【0070】
注文クラスタリング結果の形式は、先に述べたステップにおけるシーケンスファイル形式である。続いて注文クラスタリング結果を特定して処理することは便利ではないかもしれない。したがって、注文クラスタリング結果をテキスト形式に変換する必要がある。
【0071】
ステップ508:クラスタ内の注文コンテンツに悪意ある情報が含まれているかどうかを特定する。コンテンツに悪意ある情報が含まれている場合は、ステップ509へ進む。コンテンツに悪意ある情報が含まれていない場合は、ステップ510へ進む。
【0072】
キーワードに基づく方法やマニュアルでの特定方法等の技術を用いて、注文コンテンツに悪意ある情報が含まれているかどうかを特定できる。1つのクラスタには多くの注文が含まれる。場合によっては、特定のためにクラスタ内の1つの注文だけを選択する必要がある。
【0073】
別の実施の形態では、多くの情報、特には、より多くの悪意ある情報を転送することができるので、各クラスタは、クラスタリング操作が終了した後に複数の注文を含む。良好な監視結果を達成するためには、より多くの注文を含むいくつかのクラスタが選択され(例えば、上位10個のクラスタを選択する)、監視のために管理者へ送信される。どのクラスタが悪質な情報として分類される可能性が高いかは、選択された上位10個のクラスタのコンテンツに基づいて特定することができる。
【0074】
ステップ509:注文を開始したユーザをマークして管理者に迅速な情報を提供する。
【0075】
本ステップで述べた処理方法に加え、取引凍結やアカウントブロック等、悪意ある情報を処理する別の方法がある。これらの方法は、説明が複雑にならないように、詳細は述べない。
【0076】
ステップ510:コンテンツに悪意ある情報が含まれていない場合は、これ以上の処理を行う必要はない。
【0077】
先に説明した実施の形態では、ミーンシフトクラスタリング操作を用いて電子商取引システムにおける注文を分類することができ、そして新しいクラスタを自動的に生成できることで、人の関与を減らし、リアルタイムで変わる悪意ある情報の分類に適応する。
【0078】
図6は、本願の実施の形態に係る、クラスタリング処理後の注文を迅速に分類する方法を示すフローチャートである。この方法は、
図5に示す実施の形態に基づく方法である。各クラスタには多くの注文が含まれる。システムは、分析すべき新しい注文を受け取り、処理する。
【0079】
図6には、以下のステップが含まれる。すなわち、
ステップ601:各クラスタの注文コンテンツを抽出する。
【0080】
このステップ601では、各クラスタにおける注文コンテンツをランダムに抽出できる。各クラスタの注文コンテンツは類似しているため、抽出されたどの注文コンテンツも、そのクラスタの特徴として用いることができる。
【0081】
ステップ602:抽出された注文コンテンツに対してMD5コード変換操作を実行して、特徴文字列を取得する。
【0082】
本ステップでは、各クラスタの特徴文字列を取得することができる。任意の実施の形態において、MD5コード変換操作は、多くのコード変換操作の1つであり、他のコード変換方法も用いることができる。あるいは、開発者は、必要に応じてコード変換方法を設計できる。用いられるコード変換方法は、ここでは限定しない。
【0083】
ステップ603:分析すべき注文を取得する。
【0084】
本ステップでは、例えば、
図5に示す実施の形態におけるステップ503に基づいて、分析すべき注文を取得することができる。
図5に示す実施の形態は、通常、既存の注文を分析するために用いられるので、
図6に示す実施の形態は、
図5に示す実施の形態に基づいて実行できる。前に述べた方法を用いて複数のクラスタが確立された後に、新しい注文を分析できる。そのようにして、より良好にリアルタイムで実行でき、比較的複雑なクラスタリング操作を回避できる。
【0085】
あるいは、本ステップでは、転送された情報(注文)をリアルタイムに比較及び分析して、注文を含むクラスタを特定できる。
【0086】
ステップ604:注文コンテンツにMD5コード変換操作を実行してマッピングされた文字列を取得する。
【0087】
ステップ605:特徴文字列とマッピングされた文字列とを比較する。2つの文字列が一致している場合は、ステップ606へ進む。2つの文字列が一致しない場合は、ステップ607へ進む。
【0088】
ステップ606:特徴文字列を含むクラスタに、分析すべき注文を追加する。
【0089】
その後、ステップ508に戻り、クラスタ処理を続行する。コンテンツに悪意ある情報が含まれていると、転送された情報の送信がブロックされる可能性がある。
【0090】
オプションのステップとして、分析すべき注文のマッピングされた文字列が、迷惑な分類としてマーキングされた特定のクラスタの特徴文字列と同じである場合、ステップ606を実行することなく、直接ステップ509へ進む。また、取引の凍結やアカウントブロック等の自動予防措置を注文に対して実行できる。
【0091】
ステップ607:ステップ504に戻り、クラスタリング処理を継続する。
【0092】
本願の実施の形態における方法及び装置では、ミーンシフトクラスタリングアルゴリズムを用いて、電子商取引における注文を自動的に分類することができ、新しいクラスタは注文のリアルタイムコンテンツに基づく分析によって取得することができる。注文が処理されると、注文はコード変換される。次に、注文の分類効率をさらに改善するために、コード変換された注文が特定のクラスタ内の注文の特徴文字列と同じであるかどうかを特定できる。分散システムの特性を利用して注文の分類効率をさらに向上するために、注文を、HDFS等の分散ファイルシステムへインポートすることができる。
【0093】
技術的な改善は、ハードウェアの改善(例えば、ダイオード、トランジスタ、スイッチ等の回路構造の改善)とソフトウェアの改善(方法プロセスの改善)とに区別することができる。しかし、技術の発展にともない、多くの現方法の工程の改善は、ハードウェア回路構造の直接的な改善と見なすことができる。ほぼすべての設計者が、改善された方法の工程をハードウェア回路にプログラミングすることによって、対応するハードウェア回路構造を取得する。したがって、ハードウェアエンティティモジュールを使用した方法の工程を改善できないとは言えない。例えば、書き換え可能ゲートアレイ(FPGA)等のプログラム可能論理デバイス(PLD)は、その論理機能が、ユーザによってデバイスをプログラミングすることによって特定される集積回路である。設計者は、チップメーカーに専用の集積回路チップ2の設計及び製造を依頼することなく、デジタルシステムを単一のPLDに「統合」するためのプログラミングを実行する。加えて、今日では、集積チップをマニュアルで製造する代わりに、このタイプのプログラミングは、主に「論理コンパイラ」ソフトウェアを用いて実装される。このプログラミングは、プログラムの開発と作成に使用されるソフトコンパイラに類似する。コンパイルのために、元のコードを特定のプログラミング言語で記述する必要がある。言語はハードウェア記述言語(HDL)と呼ばれる。高度なブール表現言語(ABEL)、アルテラハードウェア記述言語(AHDL)、Confluence、コーネル大学プログラミング言語(CUPL)、HDCal、Java(登録商標)ハードウェア記述言語(JHDL)、Lava、Lola、MyHDL、PALASM、及びRubyハードウェア記述言語(RHDL)のような多くのハードウェア記述言語がある。超高速の集積回路ハードウェア記述言語(VHDL)及びVerilog2が最も一般的に使用される。論理的な方法の工程のハードウェア回路は、前述のいくつかのハードウェア記述言語を通して方法の工程に対して論理プログラミングを実行し、方法の工程を集積回路にプログラミングすることによって容易に取得することができることも当業者には明らかである。
【0094】
コントローラは、適切な方法で実装できる。例えば、コントローラは、マイクロプロセッサ又はプロセッサと、マイクロプロセッサ又はプロセッサによって実行可能なコンピュータ読み取り可能なプログラムコード(ソフトウェア又はファームウェア等)を格納するコンピュータ読み取り可能媒体、論理ゲート、スイッチ、特定用途向け集積回路(ASIC)、プログラマブルロジックコントローラ、及び埋め込み型マイクロコントローラの形をとる。コントローラの例には、以下のマイクロコントローラ、すなわち、ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20、及びSilicone Labs C8051F320、が含まれるが、これらに限定されない。メモリコントローラは、メモリの制御ロジックの一部として実装することもできる。
【0095】
当業者にとって、コンピュータ読み取り可能プログラムコードを用いてコントローラを実装することに加えて、論理プログラミングを方法のステップで実行して、コントローラが論理ゲート、スイッチ、特定用途向け集積回路、プログラマブルロジックコントローラ、及び埋め込み型マイクロコントローラの形で同じ機能を実装するようにできることは知られている。したがって、このようなコントローラは、ハードウェアコンポーネントと考えることができる。コントローラに含まれ、さまざまな機能を実装するように構成された装置は、ハードウェアコンポーネント内の構造とみなせる。あるいは、さまざまな機能を実装するように構成された装置は、この方法を実施するソフトウェアモジュールとハードウェアコンポーネント内の構造との両方とみなすこともできる。
【0096】
前述の実施の形態に示されたシステム、装置、モジュール又はユニットは、コンピュータチップ又はエンティティによって実装でき、又は特定の機能を有する製品によって実現できる。
【0097】
説明を容易にするために、機能をさまざまなユニットに分割して説明する。当然ながら、本願が実施される場合、すべてのユニットの機能を、一又は複数のソフトウェア及び/又はハードウェアで実現することができる。
【0098】
必要なユニバーサルハードウェアプラットフォームに加えてソフトウェアを用いることによって、本願を実施できることを当業者であれば明らかに理解できることを実施の説明から学ぶことができる。このような理解に基づいて、従来技術に本質的に又は部分的に寄与する本願の技術的解決策は、ソフトウェア製品の形で実現することができる。ソフトウェア製品は、ROM/RAM、磁気ディスク、光ディスク等の記憶媒体に格納されていてもよく、また本願の実施の形態又は本願の実施の形態の一部に説明された方法を実行するように、コンピュータ装置(パーソナルコンピュータ、サーバ、ネットワーク装置)に行う命令をいくつか含む。
【0100】
本明細書に示す実施の形態は、進歩的な方法で記述されている。実施の形態における同じ又は類似の部分については、相互に参照できる。各実施の形態は、別の実施の形態との違いに焦点を当てている。特に、システムの実施の形態は方法の実施の形態に類似しているため、簡単な説明に留める。関連する部分については、方法の実施の部分的な説明を参照されたい。
【0101】
本願は、多くの汎用又は専用のコンピュータシステム環境又は構成、例えばパーソナルコンピュータ、サーバコンピュータ、手持ち型デバイス又は携帯型デバイス、フラットパネルデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラマブル民生用デジタルデバイス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、及び前述のシステム又はデバイスのうちの任意の1つを含む分散コンピューティング環境等で用いることができる。
【0102】
本願は、例えばプログラムモジュールのようなコンピュータによって実行される実行可能なコンピュータ命令の一般的な文脈(context)で記述できる。一般に、プログラムモジュールは、特定のタスクを実行するための、又は特定の抽象データ型を実装するためのルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。本願は、分散コンピューティング環境においても実施できる。分散コンピューティング環境では、通信ネットワークを介して接続された遠隔処理装置によってタスクが実行される。分散コンピューティング環境では、プログラムモジュールは、記憶デバイスを含むローカル及びリモートコンピュータ記憶媒体の両方に配置することができる。
【0103】
本願は実施の形態を通して説明されている。しかし、当業者は、本願の精神から逸脱することなく、本願の多くの修正及び変化が可能であることを理解している。特許請求の範囲は、本願の精神から逸脱することなく、これらの修正及び変化を含むことが意図されている。
[第1の局面]
電子商取引における注文クラスタリングの方法であって:
注文に関する情報に基づいて、一意の注文ID及び注文コンテンツを生成するステップと;
前記注文コンテンツを注文ベクトルに変換するステップと;
前記一意の注文ID及び前記注文ベクトルに基づいてクラスタリング操作を実行して注文クラスタリング結果を取得するステップと;を備える、
電子商取引における注文クラスタリングの方法。
[第2の局面]
前記クラスタ内の注文コンテンツは特徴文字列にマッピングされ、分析すべき注文コンテンツのマッピングされた文字列が前記特徴文字列と同じである場合、前記分析すべき注文は直接前記クラスタに追加される、
第1の局面に記載の方法。
[第3の局面]
注文に関する情報に基づいて、一意の注文ID及び注文コンテンツを生成する前記ステップは:
前記注文に関する前記情報のユーザID、注文ID、及びサービスタイプに基づいて前記一意の注文IDを生成するステップと;
前記注文に関する前記情報の注文タイトル又は注文リマークに基づいて前記注文コンテンツを生成するステップと;を備える、
第1の局面に記載の方法。
[第4の局面]
注文クラスタリングに基づいて悪意ある情報に対抗する方法であって:
注文に関する情報に基づいて、一意の注文ID及び注文コンテンツを生成するステップと;
前記注文コンテンツを注文ベクトルに変換するステップと;
前記一意の注文ID及び前記注文ベクトルに基づいてクラスタリング操作を実行して注文クラスタリング結果を取得するステップと;
各クラスタの代表的な注文コンテンツを分析し、前記代表的な注文コンテンツに悪意ある情報が含まれている場合は、前記クラスタ内の注文の対応処理を実行するステップと;を備える、
注文クラスタリングに基づいて悪意ある情報に対抗する方法。
[第5の局面]
前記クラスタ内の注文コンテンツが特徴文字列にマッピングされ、分析すべき注文コンテンツのマッピングされた文字列が前記特徴文字列と同じである場合、前記分析すべき注文は直接前記クラスタに追加される、
第4の局面に記載の方法。
[第6の局面]
前記分析すべき注文の前記注文コンテンツの前記マッピングされた文字列が前記特徴文字列と同じである場合、前記方法は:
前記クラスタが迷惑な分類としてマークされた場合、前記分析すべき注文について悪意ある情報の処理を直接実行するステップ;をさらに備える、
第5の局面に記載の方法。
[第7の局面]
電子商取引における注文クラスタリングの装置であって:
注文に関する情報に基づいて、一意の注文ID及び注文コンテンツを生成するように構成された生成ユニットと;
前記注文コンテンツを注文ベクトルに変換するように構成されたベクトル変換ユニットと;
前記一意の注文ID及び前記注文ベクトルに基づいてクラスタリング操作を実行して注文クラスタリング結果を取得するように構成されたクラスタリング操作ユニットと;を備える、
電子商取引における注文クラスタリングの装置。
[第8の局面]
前記生成ユニットと前記クラスタリング操作ユニットとの間に接続され;前記クラスタ内の注文コンテンツを特徴文字列にマッピングし、分析すべき注文コンテンツのマッピングされた文字列が前記特徴文字列と同じである場合、分析すべき注文を直接前記クラスタに追加するように構成される;変換ユニットをさらに備える、
第7の局面に記載の装置。
[第9の局面]
前記生成ユニットは:前記注文に関する前記情報において、ユーザID、注文ID、及びサービスタイプに基づいて、前記一意の注文IDを生成するように、及び前記注文に関する前記情報の注文タイトル又は注文リマークに基づいて、前記注文コンテンツを生成するように、さらに構成される、
第7の局面に記載の装置。
[第10の局面]
注文クラスタリングに基づいて悪意ある情報に対抗する装置であって:
注文に関する情報に基づいて、一意の注文ID及び注文コンテンツを生成するよう構成される生成ユニットと;
前記注文コンテンツを注文ベクトルに変換するように構成されるベクトル変換ユニットと;
前記一意の注文ID及び前記注文ベクトルに基づいてクラスタリング操作を実行して注文クラスタリング結果を取得するように構成されるクラスタリング操作ユニットと;
各クラスタの代表的な注文コンテンツを分析し、前記代表的な注文コンテンツに悪意ある情報が含まれている場合は、前記クラスタ内の注文の対応処理を実行するように構成される、処理ユニットと;を備える、
注文クラスタリングに基づいて悪意ある情報に対抗する装置。
[第11の局面]
前記生成ユニットと前記クラスタリング操作ユニットとの間に接続され;前記クラスタ内の注文コンテンツを特徴文字列にマッピングし、分析すべき注文コンテンツのマッピングされた文字列が前記特徴文字列と同じである場合、前記分析すべき注文を直接前記クラスタに追加するように構成される、変換ユニットをさらに備える、
第10の局面に記載の装置。
[第12の局面]
前記変換ユニットは:前記クラスタが迷惑な分類としてマーキングされている場合に、前記分析すべき注文を悪意ある情報の処理のため、前記処理ユニットへ直接送信するようにさらに構成される、
第11の局面に記載の装置。