(58)【調査した分野】(Int.Cl.,DB名)
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後に、前記方法は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出することと、
前記ID不正閉鎖率が所定の標準のデータ範囲内にあるかを決定することと、
肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、かつ前記ユーザ識別と関連付けられた前記アカウントが通常のアカウントであると決定することと、
を更に含む、請求項1に記載の方法。
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後、前記方法は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出することと、
前記ID不正閉鎖率が、所定の通常のデータ範囲内にあるかを決定することと、
肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、かつ前記ユーザ識別と関連付けられた前記アカウントが通常のアカウントであると決定することと、
を更に含む、請求項7に記載の方法。
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後に、前記装置は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュールと、
前記ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュールと、
前記第2のパラメータ決定モジュールの決定結果が肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、
かつ前記ユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュールと、
を更に備える、請求項11に記載の装置。
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後、前記装置は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュールと、
前記ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュールと、
前記第2のパラメータ決定モジュールの決定結果が肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、
かつ前記ユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュールと、
を更に備える、請求項17に記載の装置。
【発明の概要】
【0007】
本概要は、以下に詳細な説明で更に説明する概念の選択を簡潔な形で導入するために提供される。本概要は、特許請求の範囲の主題の重要な特徴または不可欠な特徴の全てを特定するように意図されてはなく、特許請求の範囲の主題の範囲を決定する上での援助として単独に用いられるように意図されたものでもない。「技法」という用語は、例えば、上述の文脈によりおよび本開示の全体を通じて許容されるような、デバイス(複数可)、システム(複数可)、方法(複数可)および/またはコンピュータ可読命令を指す。
【0008】
上述の技術的課題を解決するために、本開示実施形態は、ウェブサイトユーザを効率的に識別することにより、識別の正解率を高め、かつサーバの処理速度を向上し、ならびに不正事件を事前に防止する目的を達成する方法および装置を提供する。
【0009】
本開示の実施形態は、以下の技術的方式を提供する。
【0010】
第1の実施形態は、ウェブサイトユーザを識別する方法であって、
データベースからアカウントおよびユーザ識別を取得することと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築することと、
接続されたグラフから接続された構成要素を見つけることであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけることと、
アカウント群のアカウント密度および不正アカウント閉鎖率を計算することと、
アカウント密度および不正アカウント閉鎖率がそれぞれの所定の標準値範囲内にあるかを決定することと、
肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定することと、
を含む、方法に関する。
【0011】
別の実施形態は、ウェブサイトユーザを識別する方法であって、
データベースからアカウントおよびユーザ識別を取得することと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築することと、
接続されたグラフから接続された構成要素を見つけることであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけることと、
不正および/または不正疑惑により閉鎖されたアカウントが、アカウント群内に存在するかを決定することと、
肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定することと、
そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定することと、
を含む、方法に関する。
【0012】
別の実施形態は、ウェブサイトユーザを識別する装置であって、
データベースからアカウントおよびユーザ識別を取得するために使用される取得モジュールと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される作成モジュールと、
接続されたグラフから接続された構成要素を見つけるために使用される検索モジュールであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、検索モジュールと、
アカウント群のアカウント密度および不正アカウント閉鎖率を計算するために使用される第1のパラメータ計算モジュールと、
アカウント密度および不正アカウント閉鎖率が、それぞれの所定の標準の値の範囲内にあるかを決定するために使用される第1のパラメータ決定モジュールと、
第1のパラメータ決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される第1のウェブサイトユーザ特定モジュールと、
を備える、装置に関する。
【0013】
別の実施形態は、ウェブサイトユーザを識別する装置であって、
データベースからアカウントおよびユーザ識別を取得するために使用される取得モジュールと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される作成モジュールと、
接続されたグラフから接続された構成要素を見つけることであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけるために使用される検索モジュールと、
不正および/または不正疑惑により閉鎖されたアカウントが、アカウント群内に存在するかを決定するために使用される決定モジュールと、
決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される第2のウェブサイトユーザ特定モジュールと、
を備える、装置に関する。
【0014】
以上から分かるように、例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連付けられたアカウントを直接または間接的に見つける。同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群に基づいたウェブサイトユーザの識別は、より包括的でより正確である。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。あるいは、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかを決定することに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、特定が事前に可能である。
【発明を実施するための形態】
【0017】
本開示の実施形態は、ウェブサイトユーザを識別する方法および装置を提供する。グラフ理論を用いて、直接または間接的に関連付けられるアカウントが、データベース内の膨大な量のアカウントおよびユーザ識別から見つけられる。これらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群が、同一のウェブサイトユーザに属することに基づく、ウェブサイトユーザの特定は、より包括的でより正確である。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。あるいは、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかを決定することに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、特定が事前に可能である。
【0018】
本開示の目的、特性および利点をより明確かつ容易に理解するために、本開示の実施形態を、添付図面を参照しながら詳細に説明する。
【0019】
(第1の実施形態)
図1は、本開示に従うウェブサイトユーザを特定する実施例方法のフローチャートである。本方法は、以下を含む。
ブロック101では、データベースからアカウントおよびユーザ識別を取得する。
【0020】
ウェブサイトユーザがウェブサイトにログインすると、サーバは、ウェブサイトにログインしたときに各ウェブサイトユーザと関連付けられたアカウントおよびいくつかのユーザ識別を記録し、それらをデータベースに記憶する。実際の実現形態では、データベースから一定期間(例えば、最近の3ヶ月間)に記憶されたアカウントおよびユーザ識別を、定期的に取得できる。
【0021】
例えば、データベースから取得されたユーザ識別は、(1)各アカウントと関連付けられた全てのユーザ識別のリストと、(2)各ユーザ識別と関連付けられた全てのアカウントのリストとの情報を含み得る。この情報は、接続されたグラフをグラフ理論で表すために使用される隣接性リストと見なすことができ、この接続されたグラフは隣接性リストに基づいて構築される。
【0022】
ブロック102では、アカウントおよびユーザ識別をノードと見なして、互いに関連関係を有するアカウントノードおよびユーザ識別ノードを接続することにより、接続されたグラフを構築する。
【0023】
図2は、グラフ理論における接続されたグラフ201の概要図を示す。
図2中の接続されたグラフは、3つの接続された構成要素202、203、および204により構築されている。グラフ理論では、任意の2つのノード間に経路が存在し、かつこれらのノードがサブグラフ外部のノードと接続されない場合、このサブグラフは、接続された構成要素と呼ばれる。
図2では、円記号は、接続された構成要素内のノードを表す。本開示では、アカウントおよびユーザ識別をノードと見なし、
図2中の接続線は接続された構成要素内の経路を表す。本開示では、アカウントとユーザ識別との間に関連関係が存在すると、アカウントに対応するアカウントノードと、ユーザ識別に対応するユーザ識別ノードとの間に経路が作成され得る。
【0024】
ブロック103では、接続されたグラフから接続された構成要素を見つけるのだが、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0025】
図2に示すような接続されたグラフが、アカウントおよびユーザ識別を用いて作成された後、接続された構成要素を、接続されたグラフから、グラフ理論のラベル拡張法を用いて見つけることができる。接続されたグラフ内で接続された構成要素を見つけるために、グラフ理論の他の方法を用いることができる。本開示では、そのことに対する限定はない。
【0026】
図3は、本開示に従うラベル拡張法を用いて接続されたグラフ内の接続された構成要素を見つける方法を図解する概要図である。接続されたグラフから接続された構成要素を見つけることは、以下を含む。
ブロック301では、各ノードの現在のラベル値を、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値と比較する。
ブロック302では、最小のラベル値を、各ノードの現在のラベル値として選択する。
ブロック303では、少なくとも1つのノードの現在のラベル値が変化しているかを決定する。肯定的である場合、ブロック301に戻り、そうでなければ、ブロック304に進む。
ブロック304では、同一のラベル値を有するノードを、接続された構成要素として、接続されたグラフから抽出する。
【0027】
例えば、
図4−1に示すように、接続されたグラフがA、B、C、D、およびEの5つのノードを有すると想定し、5つのノードは、各ノードについてラベル値で、ラベル付けする。例として、これら5つのノードは、5つの任意の番号を用いて、ラベル付けされ得る。当然、簡単な方法は上から下にノードをラベル付けすることである。これら5つのノードの現在のラベル値は、ラベル付け後に、それぞれ0、1、3、2および4であると想定する。ノードAの現在のラベル値が、ノードBに送られる。ノードBの現在のラベル値が、ノードAおよびCに送られる。ノードCの現在のラベル値が、ノードB、DおよびEに送られる。ノードDの現在のラベル値が、ノードCに送られる。ノードEの現在のラベル値が、ノードCに送られる。ノードAに関しては、ノードAの現在のラベル値は0でノードBの受信した現在のラベル値は1なので、ノードAの現在のラベル値は0のままである。ノードBに関しては、ノードBの現在のラベル値は1でノードAの受信した現在のラベル値は0なので、ノードBの現在のラベル値は1から0に変化しており、以下同様である。
図4−2に示すように、第一回目の更新後、ノードBの現在のラベル値は1から0に変化しており、ノードCの現在のラベル値は3から1に変化しており、ノードDの現在のラベル値は2のままであり、ノードEの現在のラベル値は4から3に変化している。
【0028】
ノードB、CおよびEのそれぞれの現在のラベル値が変化しているので、各ノードの現在のラベル値は、それぞれのノードと接続関係を有する他の全てのノードに送られ、各ノードの現在のラベル値は2度目の更新がされる。
図4−3に示すように、2度目の更新後、ノードCの現在のラベル値は1から0に変化しており、ノードDの現在のラベル値は2から1に変化しており、ノードEの現在のラベル値は3から1に変化しており、ノードAおよびBの現在のラベル値は0のままである。
【0029】
ノードC、DおよびEの現在のラベル値が変化しているので、各ノードの現在のラベル値がそれぞれのノードと接続関係を有する他の全てのノードに送られ、各ノードの現在のラベル値は3度目の更新がされる。
図4−4に示すように、3度目の更新後、ノードDの現在のラベル値は1から0に変化しており、ノードEの現在のラベル値は1から0に変化しており、他のノードの現在のラベル値は変化せずに0のままである。
【0030】
ノードDおよびEの現在のラベル値が変化しているので、各ノードの現在のラベル値が、それぞれのノードと接続関係を有する他の全てのノードに送られ、各ノードの現在のラベル値は4度目の更新がされる。4度目の更新後、全てのノードDの現在のラベル値は変更されず0のままである。更新の処理は終了される。このとき、ノードA〜Eは同一のラベル値を有し、接続された構成要素を形成する。上記は、グラフ理論のラベル拡張法を用いて同一のラベル値を有するノードを見つけることに対応している。グラフ理論では、同一のラベル値を有するノードは、接続されたグラフにおける接続された構成要素と見なされる。接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。例えば、
図4−1、4−2、4−3および4−4中で、ノードAおよびCがユーザ識別ノードでありノードB、DおよびEがアカウントノードであるとすると、ノードB、DおよびEに対応するアカウントは、アカウント群を形成し、このアカウント群は同一のウェブサイトユーザに結び付いている。言い換えれば、アカウント群は同一のウェブサイトユーザを識別する。更に、グラフ理論を用いて取得したアカウント群は、直接関連付けられたアカウントのみならず間接的に関連付けられたアカウントも含み得る。直接関連付けられたアカウントは、同一のユーザ識別と関連付けられたアカウントの群に対応する。間接的にアカウントは、アカウントAおよびBに関して、一連のアカウントX
1、X
2、...、X
m(m≧1)が、AおよびX
1が直接関連付けられ、X
iおよびX
i+1(1≦i≦n−1)が直接関連付けられ、かつXmおよびBが直接関連付けられているように見つけられる場合、AおよびBは互いに間接的に関連付けられたアカウントである、ことに対応する。
【0031】
ブロック104では、アカウント群のアカウント密度と不正アカウント閉鎖率とを計算する。
【0032】
アカウント群のアカウント密度は、
全てのアカウントの総数と、アカウント群内の全てのアカウントに対応するアカウントノードのノード次数の合計とを計数することと、
【0034】
(式中、nは、アカウント群内の全てのアカウントの総数である)、
に従って、アカウント密度を算出することと、
の手法により計算される。
【0035】
グラフ理論では、ノードのノード次数は、当該ノードに接続されるノードの数に対応する。例えば、
図4では、ノードBのみがノードAに接続される。言い換えれば、ノードAに接続されるノードの数は1つであり、ノードAのノード次数は1である。ノードAおよびCは、ノードBに接続される。言い換えれば、ノードBに接続されるノードの数は2であり、ノードBのノード次数は2である。
【0036】
アカウント群の不正アカウント閉鎖率は、
全てのアカウントの総数と、アカウント群内の不正および/または不正疑惑により閉鎖されたアカウントの数とを計数することと、
不正および/または不正疑惑により閉鎖されたアカウントの数と、アカウント群内の全てのアカウントの総数との比率を算出することと、
の手法を用いて計算される。比率は、アカウント群の不正アカウント閉鎖率に対応する。
【0037】
ウェブサイトの監視システムは、全てのアカウントと関連付けられた行為を監視する。特定のアカウントにより行われた不正行為を見つけると、そのアカウントは不正アカウントとして閉鎖されることになる。特定のアカウントと関連付けられた異常な行為が分析時に発見されると、そのアカウントは不正疑惑アカウントとして閉鎖されることになる。システムは、不正または不正疑惑により閉鎖されるこれらのアカウントのラベル付けを遂行する。本開示では、不正または不正疑惑により閉鎖されたアカウント群内のどのアカウントがラベル付けにより直接特定され得、およびその数が、算出され得る。
【0038】
ブロック105では、アカウント密度および不正アカウント閉鎖率が、所定の標準値範囲内であるかを決定し、肯定的である場合、ブロック106へ進み、そうでなければ、ブロック107に進む。
【0039】
ブロック106では、アカウント群が危険なアカウント群であり、かつそのアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定する。処理を終了する。
【0040】
ブロック107では、アカウント群が通常のアカウント群であり、かつそのアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定する。処理を終了する。
【0041】
ブロック107では、公知の危険なウェブサイトユーザに結びつけられた全てのアカウントのアカウント密度が、事前に経験的に算出され得る。平均値はサンプル統計を用いて決定でき、その平均値はアカウント密度に対する標準値範囲として用い得る。同様に、不正アカウント閉鎖率に対する標準値範囲を取得できる。
【0042】
実際の実現形態では、別個の標準値範囲を、アカウント群内のアカウントの総数に基づいて構成し得る。例えば、アカウント群内のアカウントの総数が[5、2000]の閉区間内にある場合、アカウント密度に対する標準値範囲は[0.5、1)の半閉区間として構成され得、不正アカウント閉鎖率に対する標準値範囲は[0.1、1)の半閉区間として構成され得る。アカウント密度および不正アカウント閉鎖率の標準値範囲は、アカウント群内のアカウントの総数が別の範囲内にある場合、別個の間隔に構成され得る。本開示は、アカウント密度の標準値範囲および不正アカウント閉鎖率の標準値範囲に対して、特定の間隔について限定されない。
【0043】
アカウント群が危険なアカウント群と決定されると、その危険なアカウント群内の全てのアカウントが不正であるとみなされ得る。更に、危険なアカウント群内の全てのアカウントは、同一のウェブサイトユーザに結び付いているため、そのウェブサイトユーザが危険なウェブサイトユーザである。システムは、危険なアカウント群内の全てのアカウントを監視し、必要ならばそれらのアカウントを閉鎖し得る。
【0044】
以上から分かるように、例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連付けられたアカウントを直接または間接的に見つける。ウェブサイトユーザが、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能であり、不正の事態を事前に防止する目的を達成できる。
【0045】
(第2の実施形態)
特定のアカウント群が危険なアカウント群と決定されたとき、その危険なアカウント群内の特定のアカウントは、盗難されたもので不正なアカウントではないのかもしれない。危険なアカウント群内のどのアカウントがより不正なものであるのかをより良い方法で識別するために、本実施形態は、接続された構成要素内の危険なユーザ識別を更に特定し、第1の実施形態に基づいて、その危険なユーザ識別と関連付けられたアカウントが危険なアカウントであると最終的に決定する。
図5は、本開示の別の実施形態に従うウェブサイトユーザを識別する方法を図解するフローチャートである。本方法は、以下のブロックを含む。
ブロック501では、データベースからアカウントおよびユーザ識別を取得する。
ブロック502では、アカウントおよびユーザ識別をノードと見なし、かつ互いに関連関係を有するアカウントノードとユーザ識別ノードとを接続することにより、接続されたグラフを構築する。
ブロック503では、接続されたグラフから接続された構成要素を見つけるが、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成している。
ブロック504では、アカウント群のアカウント密度および不正アカウント閉鎖率を計算する。
ブロック505では、アカウント密度および不正アカウント閉鎖率が、所定の標準値範囲内にあるかを決定し、肯定的である場合、ブロック506に進み、そうでなければ、ブロック507に進む。
ブロック506では、アカウント群が危険なアカウント群であり、かつそのアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、ブロック508を実行する。
ブロック507では、アカウント群が通常のアカウント群であり、かつ通常のウェブサイトユーザに結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定する。処理を終了する。
【0046】
ブロック501〜507を実行する処理については、第1の実施形態のブロック101〜107を参照することができる。これらの処理は、第1の実施形態で詳細に説明したので、本明細書では重複した説明は行わない。
【0047】
ブロック508では、接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を計算する。
【0048】
例えば、
図4に示すような接続された構成要素では、全てのアカウントノードに対応するアカウントにより形成されるアカウント群が、危険なアカウント群であると決定されると、
図4に示すような接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率が算出される。
【0049】
接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率は、
ユーザ識別と関連付けられたアカウント群内のアカウントの総数を計数し、ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数することと、
ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数と、ユーザ識別と関連付けられたアカウント群内のアカウントの総数との比率を算出することであって、比率がアカウント群の不正アカウント閉鎖率に対応する、算出することと、
の手法を用いて算出される。
【0050】
ブロック509では、ID不正閉鎖率が、所定の標準データ範囲内であるかを決定し、肯定的である場合、ブロック510に進み、そうでなければ、ブロック511に進む。
【0051】
ブロック510では、ユーザ識別が危険なユーザ識別であり、かつユーザ識別と関連付けられたアカウントが危険なアカウントであると決定する。処理を終了する。
【0052】
ブロック511では、ユーザ識別が通常のユーザ識別であり、ユーザ識別と関連付けられたアカウントが通常のアカウントであると決定する。処理を終了する。
【0053】
本ブロックでは、公知の危険なウェブサイトユーザと結びつけられるアカウントの中で、これらのアカウントと関連付けられるユーザ識別のID不正閉鎖率が、事前に経験的に算出され得る。平均値はサンプル統計を用いて決定され得、その平均値はID不正閉鎖率に対する標準値範囲として使用され得る。
【0054】
実際の実現形態では、別個の標準値範囲を、アカウント群の不正アカウント閉鎖率と、そのアカウント群内のユーザ識別と関連付けられたアカウントの総数とに基づいて、構成し得る。例えば、アカウント群の不正アカウント閉鎖率が0.2より大きく、アカウント群内のユーザ識別と関連付けられたアカウントの総数が100より大きければ、ID不正閉鎖率に対する標準値範囲を、0.2より大きい任意の値として設定し得る。アカウント群内のユーザ識別と関連付けられたアカウントの総数が[5、100]の閉区間内であれば、ID不正閉鎖率に対する標準値範囲を、0.5より大きい任意の値として設定し得る。アカウント群のID不正閉鎖率とそのアカウント群内のユーザ識別と関連付けられたアカウントの総数とが他の範囲になれば、不正アカウント閉鎖率の標準値範囲を、他の値に設定し得る。本開示は、ID不正閉鎖率の標準値範囲に対して、特定値に限定されない。
【0055】
以上から分かるように、これらの例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連するアカウントを直接または間接的に見つけ出す。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけ出すとき、サーバは、全てのアカウントおよびユーザ識別内の検索を遂行する必要ないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能であり、不正の事態を事前に防止する目的を達成できる。
【0056】
更に、アカウント群内のどのアカウントがより不正であるのかを、より良い方法で特定し得る。
【0057】
(第3の実施形態)
アカウント群が危険なアカウント群であるかを第1の実施形態ではアカウント密度および不正アカウント閉鎖率を用いて決定することに加えて、アカウント群が危険なアカウント群であるかは、そのアカウント群が不正および/または疑惑により閉鎖されたアカウントを含むかに基づいて決定することも可能である。
図6は、本開示の別の実施形態に従うウェブサイトユーザを識別する方法を図解するフローチャートを示し、以下のブロックを含む。
ブロック601では、データベースからアカウントおよびユーザ識別を取得する。
ブロック602では、アカウントおよびユーザ識別をノードと見なし、かつ互いに関連関係を有するアカウントノードとユーザ識別ノードとを接続することにより、接続されたグラフを構築する。
ブロック603では、接続されたグラフから接続された構成要素を見つけるが、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0058】
ブロック601〜603を実行する処理については、第1の実施形態のブロック101〜103を参照することができる。これらの処理は、第1の実施形態で詳細に説明したので、本明細書では重複した説明は行わない。
【0059】
ブロック604では、アカウント群は不正および/または不正疑惑により閉鎖されたアカウントを含むかを決定し、肯定的である場合、ブロック605に進み、そうでなければ、ブロック606に進む。
【0060】
ウェブサイトの監視システムは、全てのアカウントと関連付けられる行為を監視する。分析に際して特定のアカウントにより行われた不正行為が発見されると、そのアカウントは不正アカウントとして閉鎖される。分析時に特定のアカウントと関連する異常な行為が発見されると、そのアカウントは不正疑惑アカウントとして閉鎖されることになる。本システムは、不正または不正疑惑により閉鎖されるこれらのアカウントのラベル付けを更に遂行する。本開示では、アカウント群内のどのアカウントが不正または不正疑惑により閉鎖されたのかが、ラベル付けにより直接特定され得る。
【0061】
ブロック605では、アカウント群が危険なアカウント群であり、かつそのウェブサイトユーザに結びつけられるアカウント群が危険なウェブサイトユーザであると決定する。処理を終了する。
【0062】
ブロック606では、アカウント群が通常のアカウント群であり、そのアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定する。処理を終了する。
【0063】
以上から分かるように、これらの例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連するアカウントを直接または間接的に見つけ出す。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけ出すとき、サーバは、全てのアカウントおよびユーザ識別内の検索を遂行する必要ないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。
【0064】
(第4の実施形態)
第1の実施形態でのウェブサイトユーザを特定する方法に対応して、本開示は、ウェブサイトユーザを識別する実施例装置を更に提供する。
図7は、ウェブサイトユーザを特定する実施例装置を図解する構成図である。本装置は、取得モジュール701、作成モジュール702、検索モジュール703、第1のパラメータ計算モジュール704、第1のパラメータ決定モジュール705、および第1のウェブサイトユーザ特定モジュール706を含む。本装置の内部構成体および接続関係を、その動作原理と関連して更に詳細に説明する。
【0065】
取得モジュール701は、データベースからアカウントおよびユーザ識別を取得するために使用される。
【0066】
作成モジュール702は、アカウントおよびユーザ識別をノードと見なし、アカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される。
【0067】
検索モジュール703は、接続されたグラフから接続された構成要素を見つけ出すために使用され、接続された構成要素での全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0068】
第1のパラメータ計算モジュール704は、アカウント群のアカウント密度および不正アカウント閉鎖率を計算するために使用される。
【0069】
第1のパラメータ決定モジュール705は、アカウント密度および不正アカウント閉鎖率が、それぞれの所定の標準値範囲内にあるかを決定するために使用される。
【0070】
第1のウェブサイトユーザ特定モジュール706は、第1のパラメータ決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつその危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつその通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される。
【0071】
図8に示すように、検索モジュール703は、
各ノードの現在のラベル値を、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値と比較するために使用される比較サブモジュール7031と、
最小のラベル値を、各ノードの現在のラベル値として選択するために使用される選択サブモジュール7032と、
少なくとも1つのノードの現在のラベル値が変化しているかを決定するために使用される第1の決定サブモジュール7033と、
第1の決定モジュールの決定結果が肯定的である場合、比較サブモジュールを起動して、各ノードの現在のラベル値と、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値との比較を継続させるために使用される反復サブモジュール7034と、
第1の決定モジュールの決定結果がそうでないとき、同一のラベル値を有するノードを、接続された構成要素として、接続されたグラフから抽出するために使用される抽出サブモジュール7035と、
を含む。
【0072】
一実施形態では、第1のパラメータ計算モジュール704は、
全てのアカウントの総数と、アカウント群内の全てのアカウントに対応するアカウントノードのノード次数の合計とを計数するために使用される第1の計数サブモジュールと、
【0074】
(式中、nは、アカウント群内の全てのアカウントの総数である)、に従って、アカウント密度を算出するために使用される密度計算サブモジュールと、
を含む。
【0075】
加えてまたはあるいは、第1のパラメータ計算モジュール704は、
全てのアカウントの総数と、アカウント群内の不正および/または不正疑惑により閉鎖されたアカウントの数とを計数するために使用される第2の計数サブモジュールと、
不正および/または不正疑惑により閉鎖されたアカウントの数と、アカウント群内の全てのアカウントの総数との比率を算出するためであって、比率がアカウント群の不正アカウント閉鎖率に対応する、算出するために使用される不正アカウント閉鎖率計算サブモジュールと、
を含む。
【0076】
図8に示す構成に基づいて、本装置は、
図9に示すように、
接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュール707と、
ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュール708と、
第2のパラメータ決定モジュールの決定結果が肯定的である場合、ユーザ識別が危険なユーザ識別であり、かつユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、ユーザ識別が通常のユーザ識別であり、かつユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュール709と、
を更に備え得る。
【0077】
一実施形態では、第2のパラメータ計算モジュール707は、
ユーザ識別と関連付けられたアカウント群内のアカウントの総数を計数し、かつユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数するために使用される第3の計数サブモジュールと、
ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数と、ユーザ識別と関連付けられたアカウント群内のアカウントの総数との比率を算出するためであって、比率はユーザ識別のID不正閉鎖率である、算出するために使用されるID不正閉鎖率計算サブモジュールと、
を含む。
【0078】
以上から分かるように、これらの例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から関連付けられたアカウントを直接または間接的に見つけ出す。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけ出すとき、サーバは、全てのアカウントおよびユーザ識別内の検索を遂行する必要ないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能であり、不正の事態を事前に防止する目的を達成できる。
【0079】
更に、アカウント群のうちのどのアカウントがより不正であるかを、より良い方法で特定できる。
【0080】
(第5の実施形態)
第3の実施形態におけるウェブサイトユーザを識別する方法に対応して、本開示は、ウェブサイトユーザを特定する実施例装置を更に提供する。
図10は、ウェブサイトユーザを識別する実施例装置を図解する構成図である。本装置は、取得モジュール1001、作成モジュール1002、検索モジュール1003、決定モジュール1004、および第2のウェブサイトユーザ特定モジュール1005を含む。本装置の内部構成体および接続関係を、その動作原理と関連して更に詳細に説明する。
【0081】
取得モジュール1001は、データベースからアカウントおよびユーザ識別を取得するために使用される。
【0082】
作成モジュール1002は、アカウントおよびユーザ識別をノードと見なし、かつアカウントノードとそれと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される。
【0083】
検索モジュール1003は、接続されたグラフから、接続された構成要素を見つけるために使用され、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0084】
決定モジュール1004は、不正および/または不正疑惑により閉鎖されたアカウントがアカウント群内に存在するかを決定するために使用される。
【0085】
第2のウェブサイトユーザ特定モジュール1005は、決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつその危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつその通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される。
【0086】
一実施形態では、検索モジュール1003は、
各ノードの現在のラベル値を、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値と比較するために使用される比較サブモジュールと、
最小のラベル値を、各ノードの現在のラベル値として選択するために使用される選択サブモジュールと、
少なくとも1つのノードの現在のラベル値が変化しているかを決定するために使用される第1の決定サブモジュールと、
第1の決定モジュールの決定結果が肯定的である場合、比較サブモジュールを起動して、各ノードの現在のラベル値と、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値との比較を継続させるために使用される反復サブモジュールと、
第1の決定モジュールの決定結果が否定的である場合、同一のラベル値を有するノードを、接続された構成要素として、接続されたグラフから抽出するために使用される抽出サブモジュールと、
を含む。
【0087】
図10における構成に基づいて、本装置は、
接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュールと、
ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュールと、
第2のパラメータ決定モジュールの決定結果が肯定的である場合、ユーザ識別が危険なユーザ識別であり、かつユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、ユーザ識別が通常のユーザ識別であり、かつユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュールと、
を更に含み得る。
【0088】
一実施形態では、第2のパラメータ計算モジュールは、
ユーザ識別と関連付けられたアカウント群内のアカウントの総数を計数することと、ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数するために使用される第3の計数サブモジュールと、
ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数と、ユーザ識別と関連付けられたアカウント群内のアカウントの総数との比率を算出するためであって、比率はユーザ識別のID不正閉鎖率である、算出するために使用されるID不正閉鎖率計算サブモジュールと、
を含む。
【0089】
以上から分かるように、例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連付けられたアカウントを直接または間接的に見つける。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。
【0090】
当業者であれば、関連ハードウエアを指示するコンピュータプログラムを用いて例示の方法の全てまたは一部を実現することができることを理解し得ることに留意されたい。そのプログラムは、コンピュータ可読記憶媒体内に記憶され得る。実行時には、プログラムは、上述の実施形態の方法の処理を含み得る。記憶媒体には、磁気ディスク、光ディスク、ROM(リードオンリメモリ)、またはRAM(ランダムアクセスメモリ)、等を含み得る。
【0091】
図11は、上で説明したような装置等の実施例装置1100をより詳細に図解する。一実施形態は、装置1100は、1つ以上のプロセッサ1101、ネットワークインターフェース1102、メモリ1103、および入力/出力インターフェース1104を、含み得るが、これらに限定はされない。
【0092】
メモリ1103は、ランダムアクセスメモリ(RAM)等の、揮発性メモリおよび/またはリードオンリメモリ(ROM)またはフラシュRAM等の、不揮発性メモリの形で、コンピュータ可読媒体を含み得る。メモリ1103は、コンピュータ可読媒体の例である。
【0093】
コンピュータ可読媒体には、コンピュータ可読命令、データ構成、プログラムモジュール、または他のデータ等の、情報記憶のための任意の方法または技術で実装された揮発性または不揮発性の、取り外し可能または取り外し不可能な媒体を含む。コンピュータ記憶媒体の例には、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、フラシュメモリまたはその他のメモリ技術、コンパクトディスクリードオンリメモリ(CD−ROM)、デジタル多用途ディスク(DVD)、またはその他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置またはその他の磁気記憶デバイス、またはコンピューティングデバイスによるアクセスのための情報を記憶するために使用され得る任意の他の非伝送媒体を含むが、これらに限定はされない。本明細書に定義付けられるように、コンピュータ可読媒体には、変調されたデータ信号および搬送波等の一時的な媒体は含まない。
【0094】
メモリ1103は、プログラムモジュール1105およびプログラムデータ1106を含み得る。一実施形態は、プログラムモジュール1105は、取得モジュール1107、作成モジュール1108、検索モジュール1109、第1のパラメータ計算モジュール1110、第1のパラメータ決定モジュール1111、第1のウェブサイトユーザ特定モジュール1112、第2のパラメータ計算モジュール1113、第2のパラメータ決定モジュール1114、ユーザ識別特定モジュール1115、決定モジュール1116、および第2のウェブサイトユーザ特定モジュール1117を含み得る。更に、検索モジュール1109は、比較サブモジュール1118、選択サブモジュール1119、第1の決定サブモジュール1120、反復サブモジュール1121、および抽出サブモジュール1122を含み得る。第1のパラメータ計算モジュール1110は、第1の計数サブモジュール1123、密度計算サブモジュール1124、第2の計数サブモジュール1125、および不正アカウント閉鎖率計算サブモジュール1126を含み得る。一実施形態は、第2のパラメータ計算モジュール1113は、第3の計数サブモジュール1127およびID不正閉鎖率計算サブモジュール1128を含み得る。これらのプログラムモジュールおよびサブモジュールの詳細については、以上に説明した前述の実施形態において見出すことができる。
【0095】
ウェブサイトユーザを特定する方法および装置が、本開示に詳細に説明された。例示の実施形態は、本開示における本発明の概念および実現形態を図解するために用いられる。例示の実施形態は、本開示の方法および概念をよりよく理解するためにのみ使用される。当業者であれば、本開示の概念に基づいて、例示の実施形態および適用分野を修正することができ得る。総じて、本開示の内容は本開示に対する限定として解されるべきではない。