【課題を解決するための手段】
【0005】
前述の目的を達成するため、本発明の技術的解決法は、以下の通りである。
【0006】
ユーザラベルデータの漏洩チャネルを検出するためのラベルデータ漏洩チャネル検出方法であって、
ユーザラベルデータセットを生成するために、ユーザが所有する正常なラベルに基づいてユーザの検出ラベルを追加することと、
ユーザラベルデータセットに従って検出ラベルを所定のチャネルに割り当て、ユーザID、検出ラベルおよびチャネルIDと関連付けられたチャネルインデックスを確立することと、
プッシュ情報がユーザの正常なラベルから生成される確率に従って、ユーザによって受信されたプッシュ情報を傍受することと、
プッシュ情報がユーザの検出ラベルから生成される確率に従って、傍受したプッシュ情報をスクリーニングし、プッシュ情報がユーザの検出ラベルから生成される確率が所定の閾値より高い場合は、ユーザの検出ラベルを漏洩疑いラベルセットに追加することと、
漏洩疑いチャネルIDの対応するリストを得るために、漏洩疑いラベルセットに従ってチャネルインデックスを検索することと、
プッシュ情報が、見つかったチャネルからのものかどうかを検出し、そうである場合は、対応するチャネルを削除し、残りのチャネルを漏洩疑いチャネルとして出力することと
を含む、検出方法。
【0007】
さらに、ユーザが所有する正常なラベルに基づいてユーザの検出ラベルを追加するステップは、
設定された第1の閾値より低い、新しく追加された検出ラベルがユーザの既存のラベルと同時に発生する確率
を含む。
【0008】
さらに、ユーザラベルデータセットに従って検出ラベルを所定のチャネルに割り当て、ユーザID、検出ラベルおよびチャネルIDと関連付けられたチャネルインデックスを確立するステップは、
所定のチャネルの挙動履歴に従って当該所定のチャネルの信頼性を計算することと、
チャネルのチャネルIDを変数として取り入れることによって設定された設定ハッシュ関数からハッシュ関数を選択することと、
チャネルの信頼性に基づいてユーザグループをサンプリングすることと、
サンプリングを通じて得られたユーザグループの各ユーザに対し、ユーザIDを変数として用いて、選択したハッシュ関数に従ってユーザの検出ラベルからチャネルに対応する検出ラベルを選択することと、
[ユーザID,検出ラベル]からチャネルIDへのチャネルインデックスを確立することと
を含む。
【0009】
さらに、プッシュ情報がユーザの正常なラベルから生成される確率に従って、ユーザによって受信されたプッシュ情報を傍受するステップは、
プッシュ情報が正常なラベルから生成される確率が、設定された第2の閾値より低い場合は傍受を実行し、そうでない場合はユーザにプッシュ情報を表示すること
を含む。
【0010】
さらに、検出方法は、ユーザの正常なラベルの変化に従ってユーザの検出ラベルを更新するステップをさらに含み、当該ステップは、具体的には、
新しい正常なラベルが既存の検出ラベルと同時に発生する確率に従って、ユーザの当該新しい正常なラベルとの同時発生の高い確率を有する検出ラベルを削除することと、
第1の閾値より低い、新しく追加された検出ラベルがユーザの既存のラベルと同時に発生する確率、ユーザの新しい検出ラベルを追加することと
を含む。
【0011】
さらに、検出方法は、
削除した検出ラベルの関連アイテムをチャネルインデックスから取り除くこと
をさらに含む。
【0012】
本発明は、ユーザラベルデータの漏洩チャネルを検出するためのラベルデータ漏洩チャネル検出装置であって、
ユーザラベルデータセットを生成するために、ユーザが所有する正常なラベルに基づいてユーザの検出ラベルを追加するように構成された検出ラベル追加モジュールと、
ユーザラベルデータセットに従って検出ラベルを所定のチャネルに割り当て、ユーザID、検出ラベルおよびチャネルIDと関連付けられたチャネルインデックスを確立するように構成されたチャネル関連付けモジュールと、
プッシュ情報がユーザの正常なラベルから生成される確率に従って、ユーザによって受信されたプッシュ情報を傍受するように構成された傍受モジュールと、
プッシュ情報がユーザの検出ラベルから生成される確率に従って、傍受したプッシュ情報をスクリーニングし、プッシュ情報がユーザの検出ラベルから生成される確率が所定の閾値より高い場合は、ユーザの検出ラベルを漏洩疑いラベルセットに追加するように構成された傍受情報分析モジュールと、
漏洩疑いチャネルIDの対応するリストを得るために、漏洩疑いラベルセットに従ってチャネルインデックスを検索するように構成されたチャネル検索モジュールと、
プッシュ情報が、見つかったチャネルからのものかどうかを検出し、そうである場合は、対応するチャネルを削除し、残りのチャネルを漏洩疑いチャネルとして出力するように構成された出力モジュールと
を含む、検出装置をさらに提案する。
【0013】
さらに、検出ラベル追加モジュールが、ユーザが所有する正常なラベルに基づいてユーザの検出ラベルを追加する場合、新しく追加された検出ラベルがユーザの既存のラベルと同時に発生する確率は、設定された第1の閾値より低い。
【0014】
さらに、ユーザラベルデータセットに従って検出ラベルを所定のチャネルに割り当てる場合、チャネル関連付けモジュールは、以下の動作、すなわち、
所定のチャネルの挙動履歴に従って所定のチャネルの信頼性を計算することと、
チャネルのチャネルIDを変数として取り入れることによって設定された設定ハッシュ関数からハッシュ関数を選択することと、
チャネルの信頼性に基づいてユーザグループをサンプリングすることと、
サンプリングを通じて得られたユーザグループの各ユーザに対し、ユーザIDを変数として用いて、選択したハッシュ関数に従ってユーザの検出ラベルからチャネルに対応する検出ラベルを選択することと、
[ユーザID,検出ラベル]からチャネルIDへのチャネルインデックスを確立することと
を実行する。
【0015】
さらに、プッシュ情報がユーザの正常なラベルから生成される確率に従って、ユーザによって受信されたプッシュ情報を傍受する場合、傍受モジュールは、以下の動作、すなわち、
プッシュ情報が正常なラベルから生成される確率が、設定された第2の閾値より低い場合は傍受を実行し、そうでない場合はユーザにプッシュ情報を表示すること
を実行する。
【0016】
さらに、検出ラベル追加モジュールは、ユーザの正常なラベルの変化に従ってユーザの検出ラベルを更新するようにさらに構成され、具体的には、以下のステップ、すなわち、
新しい正常なラベルが既存の検出ラベルと同時に発生する確率に従って、ユーザの当該新しい正常なラベルとの同時発生の高い確率を有する検出ラベルを削除することと、
第1の閾値より低い、新しく追加された検出ラベルがユーザの既存のラベルと同時に発生する確率、ユーザの新しい検出ラベルを追加することと
を実行する。
【0017】
さらに、チャネル関連付けモジュールは、削除した検出ラベルの関連アイテムをチャネルインデックスから取り除くようにさらに構成される。
【0018】
本発明は、ラベルデータ漏洩チャネル検出方法および装置を提案し、同方法および装置は、同じユーザのラベルの異なる発生確率に従って異なるデータ使用チャネルのための異なる検出ラベルを生成し、次いで、検出ラベルの使用を間接的に検出し、最終的に、膨大な量のデータのインデックス作成および検索技術に基づいて、想定されるデータ漏洩チャネルを効果的に検出する。検出方法は、高い検出効率を有し、膨大な量の動的なユーザラベルデータを処理することができる。