特許第6321681号(P6321681)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アリババ・グループ・ホールディング・リミテッドの特許一覧

特許6321681ウェブサイトユーザを識別する方法および装置
<>
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000006
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000007
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000008
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000009
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000010
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000011
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000012
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000013
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000014
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000015
  • 特許6321681-ウェブサイトユーザを識別する方法および装置 図000016
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6321681
(24)【登録日】2018年4月13日
(45)【発行日】2018年5月9日
(54)【発明の名称】ウェブサイトユーザを識別する方法および装置
(51)【国際特許分類】
   G06F 21/31 20130101AFI20180423BHJP
   G06F 21/45 20130101ALI20180423BHJP
【FI】
   G06F21/31
   G06F21/45
【請求項の数】20
【全頁数】26
(21)【出願番号】特願2015-552803(P2015-552803)
(86)(22)【出願日】2014年1月10日
(65)【公表番号】特表2016-509300(P2016-509300A)
(43)【公表日】2016年3月24日
(86)【国際出願番号】US2014011045
(87)【国際公開番号】WO2014110370
(87)【国際公開日】20140717
【審査請求日】2016年12月14日
(31)【優先権主張番号】201310011312.8
(32)【優先日】2013年1月11日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】510330264
【氏名又は名称】アリババ・グループ・ホールディング・リミテッド
【氏名又は名称原語表記】ALIBABA GROUP HOLDING LIMITED
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】グーリ リン
(72)【発明者】
【氏名】ドーピン チェン
(72)【発明者】
【氏名】ジーチアン チェン
【審査官】 平井 誠
(56)【参考文献】
【文献】 米国特許出願公開第2006/0149674(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/30−46
(57)【特許請求の範囲】
【請求項1】
コンピュータによってウェブサイトユーザを識別する方法であって、
前記コンピュータが、
データベースからアカウントおよびユーザ識別を取得することと、
前記アカウントおよび前記ユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築することと、
前記接続されたグラフから接続された構成要素を見つけることであって、前記接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけることと、
前記アカウント群のアカウント密度および不正アカウント閉鎖率を計算することと、
前記アカウント密度および前記不正アカウント閉鎖率がそれぞれの所定の標準値範囲内にあるかを決定することと、
肯定的である場合、前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、前記アカウント群が通常のアカウント群であり、かつ前記通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定することと、
を含む、方法。
【請求項2】
前記接続されたグラフ内の前記接続された構成要素を見つけることは、
各ノードの現在のラベル値を、前記接続されたグラフ内の前記ノードと接続関係を有する他のノードの現在のラベル値と比較することと、
最小のラベル値を、各ノードの前記現在のラベル値として選択することと、
少なくとも1つのノードの現在のラベル値が変化しているかを決定することと、
肯定的である場合、各ノードの前記現在のラベル値を、前記接続されたグラフ内の前記ノードと前記接続関係を有する前記他のノードの前記現在のラベル値と比較し続けることと、
そうでなければ、前記接続されたグラフから同一のラベル値を有するノードを前記接続された構成要素として抽出することと、
を含む、請求項1に記載の方法。
【請求項3】
前記アカウント群の前記アカウント密度を計算することは、
全てのアカウントの総数と、前記アカウント群内の全ての前記アカウントに対応するアカウントノードのノード次数の合計とを計数することと、
【数1】
に従って、前記アカウント密度を算出することと、を含み、
式中、nは、前記アカウント群内の全てのアカウントの前記総数である、請求項1に記載の方法。
【請求項4】
前記アカウント群の前記不正アカウント閉鎖率を計算することは、
全てのアカウントの総数と、前記アカウント群内の不正および/または不正疑惑により閉鎖されたアカウントの数とを計数することと、
不正および/または不正疑惑により閉鎖されたアカウントの前記数と、前記アカウント群内の全ての前記アカウントの前記総数との比率を算出することと、
を含み、
前記比率は、前記アカウント群の前記不正アカウント閉鎖率に対応する、請求項1に記載の方法。
【請求項5】
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後に、前記方法は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出することと、
前記ID不正閉鎖率が所定の標準のデータ範囲内にあるかを決定することと、
肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、かつ前記ユーザ識別と関連付けられた前記アカウントが通常のアカウントであると決定することと、
を更に含む、請求項1に記載の方法。
【請求項6】
前記接続された構成要素内の前記ユーザ識別ノードに対応する前記ユーザ識別の前記ID不正閉鎖率を算出することは、
前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの総数を計数し、かつ前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数することと、
前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの前記数と、前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの前記総数との比率を算出することであって、前記比率が、前記ユーザ識別の前記ID不正閉鎖率である、算出することと、
を含む、請求項5に記載の方法。
【請求項7】
コンピュータによってウェブサイトユーザを識別する方法であって、
前記コンピュータが、
データベースからアカウントおよびユーザ識別を取得することと、
前記アカウントおよび前記ユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築することと、
前記接続されたグラフから接続された構成要素を見つけることであって、前記接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけることと、
不正および/または不正疑惑により閉鎖されたアカウントが、前記アカウント群内に存在するかを決定することと、
肯定的である場合、前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定することと、
そうでなければ、前記アカウント群が通常のアカウント群であり、かつ前記通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定することと、
を含む、方法。
【請求項8】
前記接続されたグラフ内で前記接続された構成要素を見つけることは、
各ノードの現在のラベル値を、前記接続されたグラフ内の前記ノードと接続関を有する他のノードの現在のラベル値と比較することと、
最小のラベル値を、各ノードの前記現在のラベル値として選択することと、
少なくとも1つのノードの現在のラベル値が変化しているかを決定することと、
肯定的である場合、各ノードの前記現在のラベル値を、前記接続されたグラフ内の前記ノードと前記接続関係を有する前記他のノードの前記現在のラベル値と比較し続けることと、
そうでなければ、前記接続されたグラフから同一のラベル値を有するノードを前記接続された構成要素として抽出することと、
を含む、請求項7に記載の方法。
【請求項9】
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後、前記方法は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出することと、
前記ID不正閉鎖率が、所定の通常のデータ範囲内にあるかを決定することと、
肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、かつ前記ユーザ識別と関連付けられた前記アカウントが通常のアカウントであると決定することと、
を更に含む、請求項7に記載の方法。
【請求項10】
前記接続された構成要素内の前記ユーザ識別ノードに対応する前記ユーザ識別の前記ID不正閉鎖率を算出することは、
前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの総数を計数し、かつ前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数することと、
前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの前記数と、前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの前記総数との比率を算出することであって、前記比率が、前記ユーザ識別の前記ID不正閉鎖率である、算出することと、
を含む、請求項9に記載の方法。
【請求項11】
ウェブサイトユーザを識別する装置であって、
データベースからアカウントおよびユーザ識別を取得するために使用される取得モジュールと、
前記アカウントおよび前記ユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される作成モジュールと、
前記接続されたグラフから接続された構成要素を見つけるために使用される検索モジュールであって、前記接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、検索モジュールと、
前記アカウント群のアカウント密度および不正アカウント閉鎖率を計算するために使用される第1のパラメータ計算モジュールと、
前記アカウント密度および前記不正アカウント閉鎖率が、それぞれの所定の標準の値の範囲内にあるかを決定するために使用される第1のパラメータ決定モジュールと、
前記第1のパラメータ決定モジュールの決定結果が肯定的である場合、前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、前記アカウント群が通常のアカウント群であり、かつ前記通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される第1のウェブサイトユーザ特定モジュールと、
を備える、装置。
【請求項12】
前記検索モジュールは、
各ノードの現在のラベル値を、前記接続されたグラフ内の前記ノードと接続関係を有する他のノードの現在のラベル値と比較するために使用される比較サブモジュールと、
最小のラベル値を、各ノードの前記現在のラベル値として選択するために使用される選択サブモジュールと、
少なくとも1つのノードの現在のラベル値が変化しているかを決定するために使用される第1の決定サブモジュールと、
前記第1の決定サブモジュールの決定結果が肯定的である場合、前記比較サブモジュールをトリガして、各ノードの前記現在のラベル値と、前記接続されたグラフ内の前記それぞれ
のノードと前記接続関係を有する前記他のノードの前記現在のラベル値との比較を継続させるために使用される反復サブモジュールと、
前記第1の決定サブモジュールの前記決定結果が否定的である場合、同一のラベル値を有するノードを、前記接続された構成要素として前記接続されたグラフから抽出するために使用される抽出サブモジュールと、
を備える、請求項11に記載の装置。
【請求項13】
前記第1のパラメータ計算モジュールは、
全てのアカウントの総数と、前記アカウント群内の全ての前記アカウントに対応するアカウントノードのノード次数の合計と、を計数するために使用される第1の計数サブモジュールと、
【数2】
(式中、nは、前記アカウント群内の全てのアカウントの前記総数である)、に従って、前記アカウント密度を算出するために使用される密度計算サブモジュール、
を備える、請求項11に記載の装置。
【請求項14】
前記第1のパラメータ計算モジュールは、
全てのアカウントの総数と、前記アカウント群内の不正および/または不正疑惑により閉鎖されたアカウントの数と、を計数するために使用される第2の計数サブモジュールと、
不正および/または不正疑惑により閉鎖されたアカウントの前記数と、前記アカウント群内の全ての前記アカウントの前記総数との比率を算出するために使用される不正アカウント閉鎖率計算サブモジュールであって、前記比率が、前記アカウント群の前記不正アカウント閉鎖率に対応する、不正アカウント閉鎖率計算サブモジュールと、
を備える、請求項11に記載の装置。
【請求項15】
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後に、前記装置は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュールと、
前記ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュールと、
前記第2のパラメータ決定モジュールの決定結果が肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、
かつ前記ユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュールと、
を更に備える、請求項11に記載の装置。
【請求項16】
前記第2のパラメータ計算モジュールは、
前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの総数を計数し、かつ前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数するために使用される第3の計数サブモジュールと、
前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの前記数と、前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの前記総数との比率を算出するために使用されるID不正閉鎖率計算サブモジュールであって、前記比率が、前記ユーザ識別の前記ID不正閉鎖率である、ID不正閉鎖率計算サブモジュールと、
を備える、請求項15に記載の装置。
【請求項17】
ウェブサイトユーザを識別する装置であって、
データベースからアカウントおよびユーザ識別を取得するために使用される取得モジュールと、
前記アカウントおよび前記ユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される作成モジュールと、
前記接続されたグラフから接続された構成要素を見つけるために使用される検索モジュールであって、前記接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、検索モジュールと、
不正および/または不正疑惑により閉鎖されたアカウントが、前記アカウント群内に存在するかを決定するために使用される決定モジュールと、
前記決定モジュールの決定結果が肯定的である場合、前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、前記アカウント群が通常のアカウント群であり、かつ前記通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される第2のウェブサイトユーザ特定モジュールと、
を備える、装置。
【請求項18】
前記検索モジュールは、
各ノードの現在のラベル値を、前記接続されたグラフ内の前記ノードと接続関係を有する他のノードの現在のラベル値と比較するために使用される比較サブモジュールと、
最小のラベル値を、各ノードの前記現在のラベル値として選択するために使用される選択サブモジュールと、
少なくとも1つのノードの現在のラベル値が変化しているかを決定するために使用される第1の決定サブモジュールと、
前記第1の決定サブモジュールの決定結果が肯定的である場合、前記比較サブモジュールをトリガして、各ノードの前記現在のラベル値と、前記接続されたグラフ内の前記ノードと前記接続関係を有する前記他のノードの前記現在のラベル値との比較を継続させるために使用される反復サブモジュールと、
前記第1の決定サブモジュールの前記決定結果が否定的である場合、同一のラベル値を有するノードを、前記接続された構成要素として前記接続されたグラフから抽出するために使用される抽出サブモジュールと、
を備える、請求項17に記載の装置。
【請求項19】
前記アカウント群が危険なアカウント群であり、かつ前記危険なアカウント群に結びつけられた前記ウェブサイトユーザが危険なウェブサイトユーザであると決定した後、前記装置は、
前記接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュールと、
前記ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュールと、
前記第2のパラメータ決定モジュールの決定結果が肯定的である場合、前記ユーザ識別が危険なユーザ識別であり、かつ前記ユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、前記ユーザ識別が通常のユーザ識別であり、
かつ前記ユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュールと、
を更に備える、請求項17に記載の装置。
【請求項20】
前記第2のパラメータ計算モジュールは、
前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの総数を計数し、かつ前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数するために使用される第3の計数サブモジュールと、
前記ユーザ識別と関連付けられたアカウントの前記総数の中から不正および/または不正疑惑により閉鎖されるアカウントの前記数と、前記ユーザ識別と関連付けられた前記アカウント群内のアカウントの前記総数との比率を算出するために使用されるID不正閉鎖率計算サブモジュールであって、前記比率が、前記ユーザ識別の前記ID不正閉鎖率である、ID不正閉鎖率計算サブモジュールと、
を備える、請求項19に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2013年1月11日出願の中国特許出願第201310011312.8号、表題「Method and Apparatus of Identifying a Website User」に対する外国優先権を主張するものであり、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は、コンピュータアプリケーションの分野に関し、具体的には、ウェブサイトユーザを識別する方法および装置に関する。
【背景技術】
【0003】
各種類のウェブサイトは、それぞれ一般に多数のウェブサイトユーザを有する。これらのウェブサイトユーザの中で、一部のウェブサイトユーザが、ウェブサイトにログインした後、そのウェブサイトをプラットフォームとして用いて、他のウェブサイトユーザに対してある種の不正行為を行うことがある。例えば、Taobao Marketplaceのウェブサイトユーザ等の一部の売り手は、Taobao Marketplaceに偽造の製品情報を掲載して、代金の受領後に製品を発送せず、金銭を盗み取ることがある。ウェブサイトシステムに関して、不正行為を行うこのようなウェブサイトユーザは、危険なウェブサイトユーザに属する。
【0004】
危険なウェブサイトユーザの不正行為を防止および抑制するためには、誰が危険なウェブサイトユーザであるのかを莫大な数のウェブサイトユーザから正確に識別する必要がある。一般に、ウェブサイトユーザはアカウントを介してウェブサイトにログインするが、異なるウェブサイトユーザに結びつけられるアカウントは異なるものである。したがって、ウェブサイトユーザは、彼の/彼女のアカウントを用いて、直接、識別され得る。更に、特定のアカウントが不正な事件に関与したかを決定することにより、そのアカウントに結びつけられたウェブサイトユーザが危険なウェブサイトユーザであるか、について決定される。危険と決定されたウェブサイトユーザに対しては、ウェブサイトは、該当するアカウントを念入りに監視しまたは必要な場合にはそれらの該当するアカウントを閉鎖する等の、防止および抑制措置を更に採り得る。しかし、これらの危険なウェブサイトユーザは、通常、種々の手段により同一のウェブサイトについて複数のアカウントを登録し、1つのアカウントが閉鎖された後にも不正行為を続けて行えるように他の有効なアカウントを使用し得る。
【0005】
ウェブサイトユーザがアカウントを介してウェブサイトにログインすると、サーバは、通常、例えば、IPアドレス、Agent、クッキー、ユーザID(ユーザの電子メールまたは携帯電話番号等)またはMAC(メディアアクセス制御)アドレス、等の、ユーザのユーザ識別を示す基礎情報を記録する。ウェブサイトユーザが同一のウェブサイトに複数のアカウントを登録し得るが、それらのアカウントは同一のユーザ識別と関連付けられる可能性が非常に高い。例えば、ウェブサイトユーザが同一のコンピュータを用いて同一のウェブサイトにアカウントを登録したとき、全てのアカウントは同一のIPアドレスと関連付けられる。複数のアカウントが同一のユーザ識別と関連付けられるとき、これらのアカウントから構築されるアカウント群は、同一のウェブサイトユーザにおそらくは結びつけられる可能性が大きい。したがって、同一のユーザ識別と関連付けられたアカウント群は、アカウントに加えてウェブサイトユーザを識別するためにも使用され得る。さらに、特定のアカウントが不正な事件に関与したかを決定することにより、そのアカウントに結びつけられたウェブサイトユーザが危険なウェブサイトユーザであるか、について決定し得る。例えば、サーバは、アカウントと関連付けられる全てのユーザ識別を、ブラックリストに登録し得る。ブラックリスト中のユーザ識別と関連付けられるアカウントに結びつけられたウェブサイトユーザは誰であっても、危険なウェブサイトユーザである。
【0006】
しかし、現存の技術には、少なくとも以下の問題がある。即ち、同一のユーザ識別と関連付けられたアカウント群を用いてウェブサイトユーザを識別することは、アカウントを用いる場合と比べて、識別の範囲がより広く精度もより高いのだが、危険なウェブサイトユーザはそれ以上に注意深く、彼らに使用される全てのアカウントが同一のユーザ識別を共有するとは限らない。例えば、ウェブサイトユーザが別個のコンピュータを用いて複数のアカウントを登録するとき、これらのアカウントは別個のIPアドレスと関連付けられることになる。したがって、不正行為への関与を見つけられたアカウントと関連付けられたユーザ識別を用いる処理では、その精度が一定の程度に制限されて、危険なウェブサイトユーザを包括的に識別することが依然としてできない。加えて、上述の関連関係を用いてアカウント群を決定するとき、同一のユーザ識別と関連付けられるアカウント群を見つけるためには、全てのアカウントおよびユーザ識別を検索する必要がある。アカウントおよびユーザ識別の数は膨大なため、上述の検索を行う際にサーバの作業負荷が非常に大聞く、サーバの処理速度は非常に低くなる。
【発明の概要】
【0007】
本概要は、以下に詳細な説明で更に説明する概念の選択を簡潔な形で導入するために提供される。本概要は、特許請求の範囲の主題の重要な特徴または不可欠な特徴の全てを特定するように意図されてはなく、特許請求の範囲の主題の範囲を決定する上での援助として単独に用いられるように意図されたものでもない。「技法」という用語は、例えば、上述の文脈によりおよび本開示の全体を通じて許容されるような、デバイス(複数可)、システム(複数可)、方法(複数可)および/またはコンピュータ可読命令を指す。
【0008】
上述の技術的課題を解決するために、本開示実施形態は、ウェブサイトユーザを効率的に識別することにより、識別の正解率を高め、かつサーバの処理速度を向上し、ならびに不正事件を事前に防止する目的を達成する方法および装置を提供する。
【0009】
本開示の実施形態は、以下の技術的方式を提供する。
【0010】
第1の実施形態は、ウェブサイトユーザを識別する方法であって、
データベースからアカウントおよびユーザ識別を取得することと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築することと、
接続されたグラフから接続された構成要素を見つけることであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけることと、
アカウント群のアカウント密度および不正アカウント閉鎖率を計算することと、
アカウント密度および不正アカウント閉鎖率がそれぞれの所定の標準値範囲内にあるかを決定することと、
肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定することと、
を含む、方法に関する。
【0011】
別の実施形態は、ウェブサイトユーザを識別する方法であって、
データベースからアカウントおよびユーザ識別を取得することと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築することと、
接続されたグラフから接続された構成要素を見つけることであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけることと、
不正および/または不正疑惑により閉鎖されたアカウントが、アカウント群内に存在するかを決定することと、
肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定することと、
そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定することと、
を含む、方法に関する。
【0012】
別の実施形態は、ウェブサイトユーザを識別する装置であって、
データベースからアカウントおよびユーザ識別を取得するために使用される取得モジュールと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される作成モジュールと、
接続されたグラフから接続された構成要素を見つけるために使用される検索モジュールであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、検索モジュールと、
アカウント群のアカウント密度および不正アカウント閉鎖率を計算するために使用される第1のパラメータ計算モジュールと、
アカウント密度および不正アカウント閉鎖率が、それぞれの所定の標準の値の範囲内にあるかを決定するために使用される第1のパラメータ決定モジュールと、
第1のパラメータ決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される第1のウェブサイトユーザ特定モジュールと、
を備える、装置に関する。
【0013】
別の実施形態は、ウェブサイトユーザを識別する装置であって、
データベースからアカウントおよびユーザ識別を取得するために使用される取得モジュールと、
アカウントおよびユーザ識別をノードと見なし、かつアカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される作成モジュールと、
接続されたグラフから接続された構成要素を見つけることであって、接続された構成要素内の全てのアカウントノードに対応するアカウントが、同一のウェブサイトユーザに結びつけられるアカウント群を形成する、見つけるために使用される検索モジュールと、
不正および/または不正疑惑により閉鎖されたアカウントが、アカウント群内に存在するかを決定するために使用される決定モジュールと、
決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつ危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつ通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される第2のウェブサイトユーザ特定モジュールと、
を備える、装置に関する。
【0014】
以上から分かるように、例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連付けられたアカウントを直接または間接的に見つける。同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群に基づいたウェブサイトユーザの識別は、より包括的でより正確である。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。あるいは、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかを決定することに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、特定が事前に可能である。
【図面の簡単な説明】
【0015】
本開示の実施形態または現存の技術についての技術的方式を明確に説明するために、実施形態または現存の技術を説明するために必要な添付図面について以下に簡単に述べる。以下の説明における添付図面は、本開示のいくつかの実施形態に過ぎない。当業者であれば、独創的に努力することなく、これらの添付図面に基づいて他の図面を得ることができる。
【0016】
図1】本開示に従う、ウェブサイトユーザを識別する実施例方法のフローチャートである。
図2】グラフ理論における接続されたグラフを図解する概要図である。
図3】本開示に従う、ラベル拡張法を用いて接続されたグラフ内の接続された構成要素を見つける方法を図解する概要図である。
図4図4−1、4−2、4−3、および4−4は、本開示に従う接続された構成要素を見つける概要図である。
図5】本開示に従うウェブサイトユーザを識別する別の方法のフローチャートである。
図6】本開示に従うウェブサイトユーザを識別する別の方法のフローチャートである。
図7】本開示に従うウェブサイトユーザを識別する実施例装置を図解する構成図である。
図8】本開示に従う検索モジュールを図解する構成図である。
図9】本開示に従うウェブサイトユーザを識別する別の実施例装置を図解する構成図である。
図10】本開示に従うウェブサイトユーザを識別する別の実施例装置を図解する構成図である。
図11】本開示の実施形態に従う実施例装置を図解する構成図である。
【発明を実施するための形態】
【0017】
本開示の実施形態は、ウェブサイトユーザを識別する方法および装置を提供する。グラフ理論を用いて、直接または間接的に関連付けられるアカウントが、データベース内の膨大な量のアカウントおよびユーザ識別から見つけられる。これらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群が、同一のウェブサイトユーザに属することに基づく、ウェブサイトユーザの特定は、より包括的でより正確である。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。あるいは、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかを決定することに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、特定が事前に可能である。
【0018】
本開示の目的、特性および利点をより明確かつ容易に理解するために、本開示の実施形態を、添付図面を参照しながら詳細に説明する。
【0019】
(第1の実施形態)
図1は、本開示に従うウェブサイトユーザを特定する実施例方法のフローチャートである。本方法は、以下を含む。
ブロック101では、データベースからアカウントおよびユーザ識別を取得する。
【0020】
ウェブサイトユーザがウェブサイトにログインすると、サーバは、ウェブサイトにログインしたときに各ウェブサイトユーザと関連付けられたアカウントおよびいくつかのユーザ識別を記録し、それらをデータベースに記憶する。実際の実現形態では、データベースから一定期間(例えば、最近の3ヶ月間)に記憶されたアカウントおよびユーザ識別を、定期的に取得できる。
【0021】
例えば、データベースから取得されたユーザ識別は、(1)各アカウントと関連付けられた全てのユーザ識別のリストと、(2)各ユーザ識別と関連付けられた全てのアカウントのリストとの情報を含み得る。この情報は、接続されたグラフをグラフ理論で表すために使用される隣接性リストと見なすことができ、この接続されたグラフは隣接性リストに基づいて構築される。
【0022】
ブロック102では、アカウントおよびユーザ識別をノードと見なして、互いに関連関係を有するアカウントノードおよびユーザ識別ノードを接続することにより、接続されたグラフを構築する。
【0023】
図2は、グラフ理論における接続されたグラフ201の概要図を示す。図2中の接続されたグラフは、3つの接続された構成要素202、203、および204により構築されている。グラフ理論では、任意の2つのノード間に経路が存在し、かつこれらのノードがサブグラフ外部のノードと接続されない場合、このサブグラフは、接続された構成要素と呼ばれる。図2では、円記号は、接続された構成要素内のノードを表す。本開示では、アカウントおよびユーザ識別をノードと見なし、図2中の接続線は接続された構成要素内の経路を表す。本開示では、アカウントとユーザ識別との間に関連関係が存在すると、アカウントに対応するアカウントノードと、ユーザ識別に対応するユーザ識別ノードとの間に経路が作成され得る。
【0024】
ブロック103では、接続されたグラフから接続された構成要素を見つけるのだが、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0025】
図2に示すような接続されたグラフが、アカウントおよびユーザ識別を用いて作成された後、接続された構成要素を、接続されたグラフから、グラフ理論のラベル拡張法を用いて見つけることができる。接続されたグラフ内で接続された構成要素を見つけるために、グラフ理論の他の方法を用いることができる。本開示では、そのことに対する限定はない。
【0026】
図3は、本開示に従うラベル拡張法を用いて接続されたグラフ内の接続された構成要素を見つける方法を図解する概要図である。接続されたグラフから接続された構成要素を見つけることは、以下を含む。
ブロック301では、各ノードの現在のラベル値を、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値と比較する。
ブロック302では、最小のラベル値を、各ノードの現在のラベル値として選択する。
ブロック303では、少なくとも1つのノードの現在のラベル値が変化しているかを決定する。肯定的である場合、ブロック301に戻り、そうでなければ、ブロック304に進む。
ブロック304では、同一のラベル値を有するノードを、接続された構成要素として、接続されたグラフから抽出する。
【0027】
例えば、図4−1に示すように、接続されたグラフがA、B、C、D、およびEの5つのノードを有すると想定し、5つのノードは、各ノードについてラベル値で、ラベル付けする。例として、これら5つのノードは、5つの任意の番号を用いて、ラベル付けされ得る。当然、簡単な方法は上から下にノードをラベル付けすることである。これら5つのノードの現在のラベル値は、ラベル付け後に、それぞれ0、1、3、2および4であると想定する。ノードAの現在のラベル値が、ノードBに送られる。ノードBの現在のラベル値が、ノードAおよびCに送られる。ノードCの現在のラベル値が、ノードB、DおよびEに送られる。ノードDの現在のラベル値が、ノードCに送られる。ノードEの現在のラベル値が、ノードCに送られる。ノードAに関しては、ノードAの現在のラベル値は0でノードBの受信した現在のラベル値は1なので、ノードAの現在のラベル値は0のままである。ノードBに関しては、ノードBの現在のラベル値は1でノードAの受信した現在のラベル値は0なので、ノードBの現在のラベル値は1から0に変化しており、以下同様である。図4−2に示すように、第一回目の更新後、ノードBの現在のラベル値は1から0に変化しており、ノードCの現在のラベル値は3から1に変化しており、ノードDの現在のラベル値は2のままであり、ノードEの現在のラベル値は4から3に変化している。
【0028】
ノードB、CおよびEのそれぞれの現在のラベル値が変化しているので、各ノードの現在のラベル値は、それぞれのノードと接続関係を有する他の全てのノードに送られ、各ノードの現在のラベル値は2度目の更新がされる。図4−3に示すように、2度目の更新後、ノードCの現在のラベル値は1から0に変化しており、ノードDの現在のラベル値は2から1に変化しており、ノードEの現在のラベル値は3から1に変化しており、ノードAおよびBの現在のラベル値は0のままである。
【0029】
ノードC、DおよびEの現在のラベル値が変化しているので、各ノードの現在のラベル値がそれぞれのノードと接続関係を有する他の全てのノードに送られ、各ノードの現在のラベル値は3度目の更新がされる。図4−4に示すように、3度目の更新後、ノードDの現在のラベル値は1から0に変化しており、ノードEの現在のラベル値は1から0に変化しており、他のノードの現在のラベル値は変化せずに0のままである。
【0030】
ノードDおよびEの現在のラベル値が変化しているので、各ノードの現在のラベル値が、それぞれのノードと接続関係を有する他の全てのノードに送られ、各ノードの現在のラベル値は4度目の更新がされる。4度目の更新後、全てのノードDの現在のラベル値は変更されず0のままである。更新の処理は終了される。このとき、ノードA〜Eは同一のラベル値を有し、接続された構成要素を形成する。上記は、グラフ理論のラベル拡張法を用いて同一のラベル値を有するノードを見つけることに対応している。グラフ理論では、同一のラベル値を有するノードは、接続されたグラフにおける接続された構成要素と見なされる。接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。例えば、図4−1、4−2、4−3および4−4中で、ノードAおよびCがユーザ識別ノードでありノードB、DおよびEがアカウントノードであるとすると、ノードB、DおよびEに対応するアカウントは、アカウント群を形成し、このアカウント群は同一のウェブサイトユーザに結び付いている。言い換えれば、アカウント群は同一のウェブサイトユーザを識別する。更に、グラフ理論を用いて取得したアカウント群は、直接関連付けられたアカウントのみならず間接的に関連付けられたアカウントも含み得る。直接関連付けられたアカウントは、同一のユーザ識別と関連付けられたアカウントの群に対応する。間接的にアカウントは、アカウントAおよびBに関して、一連のアカウントX1、X2、...、Xm(m≧1)が、AおよびX1が直接関連付けられ、XiおよびXi+1(1≦i≦n−1)が直接関連付けられ、かつXmおよびBが直接関連付けられているように見つけられる場合、AおよびBは互いに間接的に関連付けられたアカウントである、ことに対応する。
【0031】
ブロック104では、アカウント群のアカウント密度と不正アカウント閉鎖率とを計算する。
【0032】
アカウント群のアカウント密度は、
全てのアカウントの総数と、アカウント群内の全てのアカウントに対応するアカウントノードのノード次数の合計とを計数することと、
【0033】
【数1】
【0034】
(式中、nは、アカウント群内の全てのアカウントの総数である)、
に従って、アカウント密度を算出することと、
の手法により計算される。
【0035】
グラフ理論では、ノードのノード次数は、当該ノードに接続されるノードの数に対応する。例えば、図4では、ノードBのみがノードAに接続される。言い換えれば、ノードAに接続されるノードの数は1つであり、ノードAのノード次数は1である。ノードAおよびCは、ノードBに接続される。言い換えれば、ノードBに接続されるノードの数は2であり、ノードBのノード次数は2である。
【0036】
アカウント群の不正アカウント閉鎖率は、
全てのアカウントの総数と、アカウント群内の不正および/または不正疑惑により閉鎖されたアカウントの数とを計数することと、
不正および/または不正疑惑により閉鎖されたアカウントの数と、アカウント群内の全てのアカウントの総数との比率を算出することと、
の手法を用いて計算される。比率は、アカウント群の不正アカウント閉鎖率に対応する。
【0037】
ウェブサイトの監視システムは、全てのアカウントと関連付けられた行為を監視する。特定のアカウントにより行われた不正行為を見つけると、そのアカウントは不正アカウントとして閉鎖されることになる。特定のアカウントと関連付けられた異常な行為が分析時に発見されると、そのアカウントは不正疑惑アカウントとして閉鎖されることになる。システムは、不正または不正疑惑により閉鎖されるこれらのアカウントのラベル付けを遂行する。本開示では、不正または不正疑惑により閉鎖されたアカウント群内のどのアカウントがラベル付けにより直接特定され得、およびその数が、算出され得る。
【0038】
ブロック105では、アカウント密度および不正アカウント閉鎖率が、所定の標準値範囲内であるかを決定し、肯定的である場合、ブロック106へ進み、そうでなければ、ブロック107に進む。
【0039】
ブロック106では、アカウント群が危険なアカウント群であり、かつそのアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定する。処理を終了する。
【0040】
ブロック107では、アカウント群が通常のアカウント群であり、かつそのアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定する。処理を終了する。
【0041】
ブロック107では、公知の危険なウェブサイトユーザに結びつけられた全てのアカウントのアカウント密度が、事前に経験的に算出され得る。平均値はサンプル統計を用いて決定でき、その平均値はアカウント密度に対する標準値範囲として用い得る。同様に、不正アカウント閉鎖率に対する標準値範囲を取得できる。
【0042】
実際の実現形態では、別個の標準値範囲を、アカウント群内のアカウントの総数に基づいて構成し得る。例えば、アカウント群内のアカウントの総数が[5、2000]の閉区間内にある場合、アカウント密度に対する標準値範囲は[0.5、1)の半閉区間として構成され得、不正アカウント閉鎖率に対する標準値範囲は[0.1、1)の半閉区間として構成され得る。アカウント密度および不正アカウント閉鎖率の標準値範囲は、アカウント群内のアカウントの総数が別の範囲内にある場合、別個の間隔に構成され得る。本開示は、アカウント密度の標準値範囲および不正アカウント閉鎖率の標準値範囲に対して、特定の間隔について限定されない。
【0043】
アカウント群が危険なアカウント群と決定されると、その危険なアカウント群内の全てのアカウントが不正であるとみなされ得る。更に、危険なアカウント群内の全てのアカウントは、同一のウェブサイトユーザに結び付いているため、そのウェブサイトユーザが危険なウェブサイトユーザである。システムは、危険なアカウント群内の全てのアカウントを監視し、必要ならばそれらのアカウントを閉鎖し得る。
【0044】
以上から分かるように、例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連付けられたアカウントを直接または間接的に見つける。ウェブサイトユーザが、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能であり、不正の事態を事前に防止する目的を達成できる。
【0045】
(第2の実施形態)
特定のアカウント群が危険なアカウント群と決定されたとき、その危険なアカウント群内の特定のアカウントは、盗難されたもので不正なアカウントではないのかもしれない。危険なアカウント群内のどのアカウントがより不正なものであるのかをより良い方法で識別するために、本実施形態は、接続された構成要素内の危険なユーザ識別を更に特定し、第1の実施形態に基づいて、その危険なユーザ識別と関連付けられたアカウントが危険なアカウントであると最終的に決定する。図5は、本開示の別の実施形態に従うウェブサイトユーザを識別する方法を図解するフローチャートである。本方法は、以下のブロックを含む。
ブロック501では、データベースからアカウントおよびユーザ識別を取得する。
ブロック502では、アカウントおよびユーザ識別をノードと見なし、かつ互いに関連関係を有するアカウントノードとユーザ識別ノードとを接続することにより、接続されたグラフを構築する。
ブロック503では、接続されたグラフから接続された構成要素を見つけるが、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成している。
ブロック504では、アカウント群のアカウント密度および不正アカウント閉鎖率を計算する。
ブロック505では、アカウント密度および不正アカウント閉鎖率が、所定の標準値範囲内にあるかを決定し、肯定的である場合、ブロック506に進み、そうでなければ、ブロック507に進む。
ブロック506では、アカウント群が危険なアカウント群であり、かつそのアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、ブロック508を実行する。
ブロック507では、アカウント群が通常のアカウント群であり、かつ通常のウェブサイトユーザに結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定する。処理を終了する。
【0046】
ブロック501〜507を実行する処理については、第1の実施形態のブロック101〜107を参照することができる。これらの処理は、第1の実施形態で詳細に説明したので、本明細書では重複した説明は行わない。
【0047】
ブロック508では、接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を計算する。
【0048】
例えば、図4に示すような接続された構成要素では、全てのアカウントノードに対応するアカウントにより形成されるアカウント群が、危険なアカウント群であると決定されると、図4に示すような接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率が算出される。
【0049】
接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率は、
ユーザ識別と関連付けられたアカウント群内のアカウントの総数を計数し、ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数することと、
ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数と、ユーザ識別と関連付けられたアカウント群内のアカウントの総数との比率を算出することであって、比率がアカウント群の不正アカウント閉鎖率に対応する、算出することと、
の手法を用いて算出される。
【0050】
ブロック509では、ID不正閉鎖率が、所定の標準データ範囲内であるかを決定し、肯定的である場合、ブロック510に進み、そうでなければ、ブロック511に進む。
【0051】
ブロック510では、ユーザ識別が危険なユーザ識別であり、かつユーザ識別と関連付けられたアカウントが危険なアカウントであると決定する。処理を終了する。
【0052】
ブロック511では、ユーザ識別が通常のユーザ識別であり、ユーザ識別と関連付けられたアカウントが通常のアカウントであると決定する。処理を終了する。
【0053】
本ブロックでは、公知の危険なウェブサイトユーザと結びつけられるアカウントの中で、これらのアカウントと関連付けられるユーザ識別のID不正閉鎖率が、事前に経験的に算出され得る。平均値はサンプル統計を用いて決定され得、その平均値はID不正閉鎖率に対する標準値範囲として使用され得る。
【0054】
実際の実現形態では、別個の標準値範囲を、アカウント群の不正アカウント閉鎖率と、そのアカウント群内のユーザ識別と関連付けられたアカウントの総数とに基づいて、構成し得る。例えば、アカウント群の不正アカウント閉鎖率が0.2より大きく、アカウント群内のユーザ識別と関連付けられたアカウントの総数が100より大きければ、ID不正閉鎖率に対する標準値範囲を、0.2より大きい任意の値として設定し得る。アカウント群内のユーザ識別と関連付けられたアカウントの総数が[5、100]の閉区間内であれば、ID不正閉鎖率に対する標準値範囲を、0.5より大きい任意の値として設定し得る。アカウント群のID不正閉鎖率とそのアカウント群内のユーザ識別と関連付けられたアカウントの総数とが他の範囲になれば、不正アカウント閉鎖率の標準値範囲を、他の値に設定し得る。本開示は、ID不正閉鎖率の標準値範囲に対して、特定値に限定されない。
【0055】
以上から分かるように、これらの例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連するアカウントを直接または間接的に見つけ出す。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけ出すとき、サーバは、全てのアカウントおよびユーザ識別内の検索を遂行する必要ないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能であり、不正の事態を事前に防止する目的を達成できる。
【0056】
更に、アカウント群内のどのアカウントがより不正であるのかを、より良い方法で特定し得る。
【0057】
(第3の実施形態)
アカウント群が危険なアカウント群であるかを第1の実施形態ではアカウント密度および不正アカウント閉鎖率を用いて決定することに加えて、アカウント群が危険なアカウント群であるかは、そのアカウント群が不正および/または疑惑により閉鎖されたアカウントを含むかに基づいて決定することも可能である。図6は、本開示の別の実施形態に従うウェブサイトユーザを識別する方法を図解するフローチャートを示し、以下のブロックを含む。
ブロック601では、データベースからアカウントおよびユーザ識別を取得する。
ブロック602では、アカウントおよびユーザ識別をノードと見なし、かつ互いに関連関係を有するアカウントノードとユーザ識別ノードとを接続することにより、接続されたグラフを構築する。
ブロック603では、接続されたグラフから接続された構成要素を見つけるが、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0058】
ブロック601〜603を実行する処理については、第1の実施形態のブロック101〜103を参照することができる。これらの処理は、第1の実施形態で詳細に説明したので、本明細書では重複した説明は行わない。
【0059】
ブロック604では、アカウント群は不正および/または不正疑惑により閉鎖されたアカウントを含むかを決定し、肯定的である場合、ブロック605に進み、そうでなければ、ブロック606に進む。
【0060】
ウェブサイトの監視システムは、全てのアカウントと関連付けられる行為を監視する。分析に際して特定のアカウントにより行われた不正行為が発見されると、そのアカウントは不正アカウントとして閉鎖される。分析時に特定のアカウントと関連する異常な行為が発見されると、そのアカウントは不正疑惑アカウントとして閉鎖されることになる。本システムは、不正または不正疑惑により閉鎖されるこれらのアカウントのラベル付けを更に遂行する。本開示では、アカウント群内のどのアカウントが不正または不正疑惑により閉鎖されたのかが、ラベル付けにより直接特定され得る。
【0061】
ブロック605では、アカウント群が危険なアカウント群であり、かつそのウェブサイトユーザに結びつけられるアカウント群が危険なウェブサイトユーザであると決定する。処理を終了する。
【0062】
ブロック606では、アカウント群が通常のアカウント群であり、そのアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定する。処理を終了する。
【0063】
以上から分かるように、これらの例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連するアカウントを直接または間接的に見つけ出す。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけ出すとき、サーバは、全てのアカウントおよびユーザ識別内の検索を遂行する必要ないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。
【0064】
(第4の実施形態)
第1の実施形態でのウェブサイトユーザを特定する方法に対応して、本開示は、ウェブサイトユーザを識別する実施例装置を更に提供する。図7は、ウェブサイトユーザを特定する実施例装置を図解する構成図である。本装置は、取得モジュール701、作成モジュール702、検索モジュール703、第1のパラメータ計算モジュール704、第1のパラメータ決定モジュール705、および第1のウェブサイトユーザ特定モジュール706を含む。本装置の内部構成体および接続関係を、その動作原理と関連して更に詳細に説明する。
【0065】
取得モジュール701は、データベースからアカウントおよびユーザ識別を取得するために使用される。
【0066】
作成モジュール702は、アカウントおよびユーザ識別をノードと見なし、アカウントノードと、それと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される。
【0067】
検索モジュール703は、接続されたグラフから接続された構成要素を見つけ出すために使用され、接続された構成要素での全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0068】
第1のパラメータ計算モジュール704は、アカウント群のアカウント密度および不正アカウント閉鎖率を計算するために使用される。
【0069】
第1のパラメータ決定モジュール705は、アカウント密度および不正アカウント閉鎖率が、それぞれの所定の標準値範囲内にあるかを決定するために使用される。
【0070】
第1のウェブサイトユーザ特定モジュール706は、第1のパラメータ決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつその危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつその通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される。
【0071】
図8に示すように、検索モジュール703は、
各ノードの現在のラベル値を、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値と比較するために使用される比較サブモジュール7031と、
最小のラベル値を、各ノードの現在のラベル値として選択するために使用される選択サブモジュール7032と、
少なくとも1つのノードの現在のラベル値が変化しているかを決定するために使用される第1の決定サブモジュール7033と、
第1の決定モジュールの決定結果が肯定的である場合、比較サブモジュールを起動して、各ノードの現在のラベル値と、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値との比較を継続させるために使用される反復サブモジュール7034と、
第1の決定モジュールの決定結果がそうでないとき、同一のラベル値を有するノードを、接続された構成要素として、接続されたグラフから抽出するために使用される抽出サブモジュール7035と、
を含む。
【0072】
一実施形態では、第1のパラメータ計算モジュール704は、
全てのアカウントの総数と、アカウント群内の全てのアカウントに対応するアカウントノードのノード次数の合計とを計数するために使用される第1の計数サブモジュールと、
【0073】
【数2】
【0074】
(式中、nは、アカウント群内の全てのアカウントの総数である)、に従って、アカウント密度を算出するために使用される密度計算サブモジュールと、
を含む。
【0075】
加えてまたはあるいは、第1のパラメータ計算モジュール704は、
全てのアカウントの総数と、アカウント群内の不正および/または不正疑惑により閉鎖されたアカウントの数とを計数するために使用される第2の計数サブモジュールと、
不正および/または不正疑惑により閉鎖されたアカウントの数と、アカウント群内の全てのアカウントの総数との比率を算出するためであって、比率がアカウント群の不正アカウント閉鎖率に対応する、算出するために使用される不正アカウント閉鎖率計算サブモジュールと、
を含む。
【0076】
図8に示す構成に基づいて、本装置は、図9に示すように、
接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュール707と、
ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュール708と、
第2のパラメータ決定モジュールの決定結果が肯定的である場合、ユーザ識別が危険なユーザ識別であり、かつユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、ユーザ識別が通常のユーザ識別であり、かつユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュール709と、
を更に備え得る。
【0077】
一実施形態では、第2のパラメータ計算モジュール707は、
ユーザ識別と関連付けられたアカウント群内のアカウントの総数を計数し、かつユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数するために使用される第3の計数サブモジュールと、
ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数と、ユーザ識別と関連付けられたアカウント群内のアカウントの総数との比率を算出するためであって、比率はユーザ識別のID不正閉鎖率である、算出するために使用されるID不正閉鎖率計算サブモジュールと、
を含む。
【0078】
以上から分かるように、これらの例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から関連付けられたアカウントを直接または間接的に見つけ出す。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけ出すとき、サーバは、全てのアカウントおよびユーザ識別内の検索を遂行する必要ないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群のアカウント密度および不正アカウント閉鎖率の計算に基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能であり、不正の事態を事前に防止する目的を達成できる。
【0079】
更に、アカウント群のうちのどのアカウントがより不正であるかを、より良い方法で特定できる。
【0080】
(第5の実施形態)
第3の実施形態におけるウェブサイトユーザを識別する方法に対応して、本開示は、ウェブサイトユーザを特定する実施例装置を更に提供する。図10は、ウェブサイトユーザを識別する実施例装置を図解する構成図である。本装置は、取得モジュール1001、作成モジュール1002、検索モジュール1003、決定モジュール1004、および第2のウェブサイトユーザ特定モジュール1005を含む。本装置の内部構成体および接続関係を、その動作原理と関連して更に詳細に説明する。
【0081】
取得モジュール1001は、データベースからアカウントおよびユーザ識別を取得するために使用される。
【0082】
作成モジュール1002は、アカウントおよびユーザ識別をノードと見なし、かつアカウントノードとそれと関連関係を有するユーザ識別ノードとを接続することにより、接続されたグラフを構築するために使用される。
【0083】
検索モジュール1003は、接続されたグラフから、接続された構成要素を見つけるために使用され、接続された構成要素内の全てのアカウントノードに対応するアカウントは、同一のウェブサイトユーザに結びつけられるアカウント群を形成する。
【0084】
決定モジュール1004は、不正および/または不正疑惑により閉鎖されたアカウントがアカウント群内に存在するかを決定するために使用される。
【0085】
第2のウェブサイトユーザ特定モジュール1005は、決定モジュールの決定結果が肯定的である場合、アカウント群が危険なアカウント群であり、かつその危険なアカウント群に結びつけられたウェブサイトユーザが危険なウェブサイトユーザであると決定し、そうでなければ、アカウント群が通常のアカウント群であり、かつその通常のアカウント群に結びつけられたウェブサイトユーザが通常のウェブサイトユーザであると決定するために使用される。
【0086】
一実施形態では、検索モジュール1003は、
各ノードの現在のラベル値を、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値と比較するために使用される比較サブモジュールと、
最小のラベル値を、各ノードの現在のラベル値として選択するために使用される選択サブモジュールと、
少なくとも1つのノードの現在のラベル値が変化しているかを決定するために使用される第1の決定サブモジュールと、
第1の決定モジュールの決定結果が肯定的である場合、比較サブモジュールを起動して、各ノードの現在のラベル値と、接続されたグラフ内のそれぞれのノードと接続関係を有する他のノードの現在のラベル値との比較を継続させるために使用される反復サブモジュールと、
第1の決定モジュールの決定結果が否定的である場合、同一のラベル値を有するノードを、接続された構成要素として、接続されたグラフから抽出するために使用される抽出サブモジュールと、
を含む。
【0087】
図10における構成に基づいて、本装置は、
接続された構成要素内のユーザ識別ノードに対応するユーザ識別のID不正閉鎖率を算出するために使用される第2のパラメータ計算モジュールと、
ID不正閉鎖率が、所定の標準のデータ範囲内にあるかを決定するために使用される第2のパラメータ決定モジュールと、
第2のパラメータ決定モジュールの決定結果が肯定的である場合、ユーザ識別が危険なユーザ識別であり、かつユーザ識別と関連付けられたアカウントが危険なアカウントであると決定し、そうでなければ、ユーザ識別が通常のユーザ識別であり、かつユーザ識別と関連付けられたアカウントが通常のアカウントであると決定するために使用されるユーザ識別特定モジュールと、
を更に含み得る。
【0088】
一実施形態では、第2のパラメータ計算モジュールは、
ユーザ識別と関連付けられたアカウント群内のアカウントの総数を計数することと、ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数を計数するために使用される第3の計数サブモジュールと、
ユーザ識別と関連付けられたアカウントの総数の中から不正および/または不正疑惑により閉鎖されるアカウントの数と、ユーザ識別と関連付けられたアカウント群内のアカウントの総数との比率を算出するためであって、比率はユーザ識別のID不正閉鎖率である、算出するために使用されるID不正閉鎖率計算サブモジュールと、
を含む。
【0089】
以上から分かるように、例示の実施形態は、グラフ理論を用いて、データベース内の膨大な量のアカウントおよびユーザ識別から、関連付けられたアカウントを直接または間接的に見つける。ウェブサイトユーザは、同一のウェブサイトユーザに属するこれらのアカウントと関連付けられるアカウントおよびユーザ識別から構築されるアカウント群から、包括的かつ正確に特定され得る。加えて、グラフ理論を用いてアカウント群を見つけるとき、サーバは、全てのアカウントおよびユーザ識別において検索を遂行する必要がないので、サーバの負担を軽減してサーバの処理速度を向上させることができる。アカウント群を所有するウェブサイトユーザに関しては、アカウント群が不正および/または不正疑惑により閉鎖されるアカウントを含むかに基づいて、ウェブサイトユーザが危険なウェブサイトユーザであるかについて、事前に特定が可能である。
【0090】
当業者であれば、関連ハードウエアを指示するコンピュータプログラムを用いて例示の方法の全てまたは一部を実現することができることを理解し得ることに留意されたい。そのプログラムは、コンピュータ可読記憶媒体内に記憶され得る。実行時には、プログラムは、上述の実施形態の方法の処理を含み得る。記憶媒体には、磁気ディスク、光ディスク、ROM(リードオンリメモリ)、またはRAM(ランダムアクセスメモリ)、等を含み得る。
【0091】
図11は、上で説明したような装置等の実施例装置1100をより詳細に図解する。一実施形態は、装置1100は、1つ以上のプロセッサ1101、ネットワークインターフェース1102、メモリ1103、および入力/出力インターフェース1104を、含み得るが、これらに限定はされない。
【0092】
メモリ1103は、ランダムアクセスメモリ(RAM)等の、揮発性メモリおよび/またはリードオンリメモリ(ROM)またはフラシュRAM等の、不揮発性メモリの形で、コンピュータ可読媒体を含み得る。メモリ1103は、コンピュータ可読媒体の例である。
【0093】
コンピュータ可読媒体には、コンピュータ可読命令、データ構成、プログラムモジュール、または他のデータ等の、情報記憶のための任意の方法または技術で実装された揮発性または不揮発性の、取り外し可能または取り外し不可能な媒体を含む。コンピュータ記憶媒体の例には、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、フラシュメモリまたはその他のメモリ技術、コンパクトディスクリードオンリメモリ(CD−ROM)、デジタル多用途ディスク(DVD)、またはその他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置またはその他の磁気記憶デバイス、またはコンピューティングデバイスによるアクセスのための情報を記憶するために使用され得る任意の他の非伝送媒体を含むが、これらに限定はされない。本明細書に定義付けられるように、コンピュータ可読媒体には、変調されたデータ信号および搬送波等の一時的な媒体は含まない。
【0094】
メモリ1103は、プログラムモジュール1105およびプログラムデータ1106を含み得る。一実施形態は、プログラムモジュール1105は、取得モジュール1107、作成モジュール1108、検索モジュール1109、第1のパラメータ計算モジュール1110、第1のパラメータ決定モジュール1111、第1のウェブサイトユーザ特定モジュール1112、第2のパラメータ計算モジュール1113、第2のパラメータ決定モジュール1114、ユーザ識別特定モジュール1115、決定モジュール1116、および第2のウェブサイトユーザ特定モジュール1117を含み得る。更に、検索モジュール1109は、比較サブモジュール1118、選択サブモジュール1119、第1の決定サブモジュール1120、反復サブモジュール1121、および抽出サブモジュール1122を含み得る。第1のパラメータ計算モジュール1110は、第1の計数サブモジュール1123、密度計算サブモジュール1124、第2の計数サブモジュール1125、および不正アカウント閉鎖率計算サブモジュール1126を含み得る。一実施形態は、第2のパラメータ計算モジュール1113は、第3の計数サブモジュール1127およびID不正閉鎖率計算サブモジュール1128を含み得る。これらのプログラムモジュールおよびサブモジュールの詳細については、以上に説明した前述の実施形態において見出すことができる。
【0095】
ウェブサイトユーザを特定する方法および装置が、本開示に詳細に説明された。例示の実施形態は、本開示における本発明の概念および実現形態を図解するために用いられる。例示の実施形態は、本開示の方法および概念をよりよく理解するためにのみ使用される。当業者であれば、本開示の概念に基づいて、例示の実施形態および適用分野を修正することができ得る。総じて、本開示の内容は本開示に対する限定として解されるべきではない。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11