(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-07
(45)【発行日】2022-04-15
(54)【発明の名称】デジタル通信ネットワーク上の複数のデバイスにわたるデジタルタッチポイントを確立するための分散ノードクラスタ
(51)【国際特許分類】
G06F 21/31 20130101AFI20220408BHJP
【FI】
G06F21/31 360
(21)【出願番号】P 2019563759
(86)(22)【出願日】2018-05-15
(86)【国際出願番号】 US2018032790
(87)【国際公開番号】W WO2018213325
(87)【国際公開日】2018-11-22
【審査請求日】2021-03-04
(32)【優先日】2017-05-19
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】519161872
【氏名又は名称】ライブランプ インコーポレーテッド
(74)【代理人】
【識別番号】110000855
【氏名又は名称】特許業務法人浅村特許事務所
(72)【発明者】
【氏名】モハンラル、アムレシュ
(72)【発明者】
【氏名】コリンズ、ドウェイン、ダブリュー.
(72)【発明者】
【氏名】マルパリー、パバン、ロイ
【審査官】青木 重徳
(56)【参考文献】
【文献】米国特許出願公開第2017/0091310(US,A1)
【文献】特開2004-078953(JP,A)
【文献】特開2014-044583(JP,A)
【文献】国際公開第2017/081740(WO,A1)
【文献】特開2016-118931(JP,A)
【文献】米国特許第8131745(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/31
(57)【特許請求の範囲】
【請求項1】
消費者/家庭解決システムへのタッチポイントのノードクラスタアーキテクチャであって、
a.複数の表現データ構造を備えるエンティティグラフ解決リポジトリ(EGRR)であって、各表現データ構造は、
i.個人または家庭に関する少なくとも1つのデータと、
ii.このような個人または家庭に関連付けられた少なくとも1つのタッチポイントと、
iii.少なくとも1つの消費者リンク(CL)または家庭リンク(HHL)とを
備える、EGRRと、
b.前記ノードクラスタアーキテクチャ全体でホストされ、前記EGRRと通信するエンティティグラフ解決エンジン(EGRE)であって、それぞれ個人または家庭に対する複数の入力識別子を受信し、前記EGRRを利用して、前記ノードクラスタアーキテクチャ内の複数のノードにわたってこのような識別子を並行して解決するように構成される、EGREと、
c.前記EGREによって生成され、タッチポイントと個人または家庭とのペアリングを含む時間信号ファイルと、
d.前記時間信号ファイルから前記EGREによって作成され、タッチポイントに対するCLもしくはHHLのランク付け、またはCLもしくはHHLに対するタッチポイントのランク付けを含む相互参照ファイルとを備え、
前記EGREは、リクエストを受信するアプリケーションプログラミングインタフェース(API)をさらに備え、前記リクエストは1つ以上のCLもしくはHHL、または1つ以上のタッチポイントを含み、
さらに、前記EGREは、CLまたはHHLの受信に応じて前記相互参照ファイルから1つ以上のタッチポイントを返すか、タッチポイントの受信に応答して1つ以上のCLまたはHHLを返すように構成された出力モジュールを含む、ノードクラスタアーキテクチャ。
【請求項2】
各デジタルタッチポイントが、電話番号、電子メールアドレス、モバイル広告主識別子(MAID)、ソーシャルネットワークハンドル、またはゲームハンドルを含む、請求項1に記載のノードクラスタアーキテクチャ。
【請求項3】
前記EGRRは複数のデータソースを含み、前記データソースは複数の生データソースファイルを含む、請求項1に記載のノードクラスタアーキテクチャ。
【請求項4】
前記EGRRデータソースは、タッチポイント関連付け履歴をさらに含む、請求項3に記載のノードクラスタアーキテクチャ。
【請求項5】
前記EGRRデータソースは、内部メタデータからの生のソース使用統計をさらに含む、請求項4に記載のノードクラスタアーキテクチャ。
【請求項6】
前記EGRRデータソースは、ウェブアドレス/ドメイン分類をさらに含む、請求項5に記載のノードクラスタアーキテクチャ。
【請求項7】
前記EGREは、ファイル衛生を通じて前記生データソースファイルを処理し、URL分類フラグをオーバーレイし、前記EGRRからのCLまたはHHLを前記生データソースファイルに追加するようにさらに構成される、請求項3に記載のノードクラスタアーキテクチャ。
【請求項8】
前記EGREは、URL業界/タイプ分類フラグを含む時間信号を作成するようにさらに構成される、請求項7に記載のノードクラスタアーキテクチャ。
【請求項9】
前記EGREは、使用統計から来るデータの時間信号を作成するようにさらに構成される、請求項8に記載のノードクラスタアーキテクチャ。
【請求項10】
前記EGREは、CLまたはHHLおよびタッチポイントの組合せの属性データを取り込むようにさらに構成される、請求項9に記載のノードクラスタアーキテクチャ。
【請求項11】
前記EGREは、時間信号と属性データとを組み合わせるようにさらに構成される、請求項10に記載のノードクラスタアーキテクチャ。
【請求項12】
クライアントデバイスと、前記EGREを前記クライアントデバイスに接続するネットワークとをさらに備え、前記クライアントデバイスは前記APIと通信してリクエストを送信するように構成されており、前記リクエストには1つ以上のCLもしくはHHL、または1つ以上のタッチポイントが含まれ、さらに、前記クライアントデバイスは、前記EGREからCLもしくはHHLの送信に応答して1つ以上のタッチポイントを、またはタッチポイントの送信に応答して1つ以上のCLもしくはHHLを受信するように構成される、請求項1に記載のノードクラスタアーキテクチャ。
【請求項13】
分散ノードアーキテクチャの特定のタッチポイントに対してベストな個人または家庭を決定する方法であって、
a.複数の表現データ構造を備えるエンティティグラフ解決リポジトリ(EGRR)を構築するステップであって、各表現データ構造は、
i.個人または家庭に関する少なくとも1つのデータと、
ii.このような個人または家庭に関連付けられた少なくとも1つのタッチポイント表現と、
iii.個人または家庭にそれぞれ関連付けられた少なくとも1つの消費者リンク(CL)または家庭リンク(HHL)とを備えるステップと、
b.エンティティグラフ解決エンジン(EGRE)を使用して、各タッチポイント表現から、各タッチポイント表現に対して最も正当化できる個人または家庭を解決するステップであって、各潜在的な個人または家庭の評価は、前記分散ノードアーキテクチャの複数のノードにわたり分散されるステップと、
c.前記EGREによって入力され、タッチポイント表現と個人または家庭とのペアリングを含む時間信号ファイルを構築するステップと、
d.前記時間信号ファイルから、各タッチポイント表現に対して、CL、HHL、またはCLとHHLの両方のランキングを含む相互参照ファイルを構築するステップとを含む、方法。
【請求項14】
1つ以上のタッチポイント表現を含むクライアントデバイスからのリクエストを、前記EGREのアプリケーションプログラミングインタフェース(API)で受信するステップをさらに含む、請求項13に記載の方法。
【請求項15】
EGRE出力モジュールにおいて、前記相互参照ファイルから1つ以上のCL、HHL、またはCLとHHLの両方を前記クライアントデバイスに戻すステップをさらに含む、請求項14に記載の方法。
【請求項16】
前記EGREを関与させて、各タッチポイント表現から各タッチポイント表現に対して最も正当化できる個人または家庭を解決するステップは、ファイル衛生を通じて生データソースファイルを処理し、URL分類フラグをオーバーレイし、CLまたはHHLを前記生データソースファイルに追加するステップをさらに含む、請求項13の方法。
【請求項17】
前記EGREを関与させて、各タッチポイント表現から各タッチポイント表現に対して最も正当化できる個人または家庭を解決するステップは、URL業界/タイプ分類フラグを含む時間信号を作成するステップをさらに含む、請求項16に記載の方法。
【請求項18】
前記EGREを関与させて、各タッチポイント表現から各タッチポイント表現に対して最も正当化できる個人または家庭を解決するステップは、使用統計から来るデータセットの時間信号を作成するステップをさらに含む、請求項17に記載の方法。
【請求項19】
前記EGREを関与させて、各タッチポイント表現から各タッチポイント表現に対して最も正当化できる個人または家庭を解決するステップは、タッチポイントとCLまたはHHLとの組合せの属性データを取り込むステップをさらに含む、請求項18に記載の方法。
【請求項20】
前記EGREを関与させて、各タッチポイント表現から各タッチポイント表現に対して最も正当化できる個人または家庭を解決するステップは、時間信号と属性データとを組み合わせるステップをさらに含む、請求項19に記載の方法。
【請求項21】
分散ノードアーキテクチャの特定の個人または家庭に対してベストタッチポイントを決定する方法であって、
a.複数の表現データ構造を備えるエンティティグラフ解決リポジトリ(EGRR)を構築するステップであって、各表現データ構造は、
i.個人または家庭に関する少なくとも1つのデータと、
ii.このような個人または家庭に関連付けられた少なくとも1つのタッチポイント表現と、
iii.個人または家庭にそれぞれ関連付けられた少なくとも1つの消費者リンク(CL)または家庭リンク(HHL)とを備えるステップと、
b.エンティティグラフ解決エンジン(EGRE)を使用して、各個人または家庭から、各個人または家庭に対して最も正当化できるタッチポイント表現を解決するステップであって、各潜在的なタッチポイント表現の評価は、前記分散ノードアーキテクチャの複数のノードにわたり分散されるステップと、
c.前記EGREによって入力され、個人または家庭とタッチポイント表現とのペアリングを含む時間信号ファイルを構築するステップと、
d.前記時間信号ファイルから、各個人または家庭に対して、タッチポイント表現およびCL、HHL、またはCLとHHLの両方のランキングを含む相互参照ファイルを構築するステップとを含む、方法。
【請求項22】
1つ以上の個人または家庭を含むクライアントデバイスからのリクエストを前記EGREのアプリケーションプログラミングインタフェース(API)で受信するステップをさらに含む、請求項21に記載の方法。
【請求項23】
EGRE出力モジュールにおいて、前記相互参照ファイルから1つ以上のCL、HHL、またはCLとHHLの両方を前記クライアントデバイスに戻すステップをさらに含む、請求項22に記載の方法。
【請求項24】
前記EGREを関与させて、各個人または家庭から各個人または家庭に対して最も正当化できるタッチポイント表現を解決するステップは、ファイル衛生を通じて生データソースファイルを処理し、URL分類フラグをオーバーレイし、CLまたはHHLを前記生データソースファイルに追加するステップをさらに含む、請求項21に記載の方法。
【請求項25】
前記EGREを関与させて、各個人または家庭から各個人または家庭に対して最も正当化できるタッチポイント表現を解決するステップは、URL業界/タイプ分類フラグを含む時間信号を作成するステップをさらに含む、請求項24に記載の方法。
【請求項26】
前記EGREを関与させて、各個人または家庭から各個人または家庭に対して最も正当化できるタッチポイント表現を解決するステップは、使用統計から来るデータセットの時間信号を作成するステップをさらに含む、請求項25に記載の方法。
【請求項27】
前記EGREを関与させて、各個人または家庭から各個人または家庭に対して最も正当化できるタッチポイント表現を解決するステップは、タッチポイントとCLまたはHHLとの組合せの属性データを取り込むステップをさらに含む、請求項26に記載の方法。
【請求項28】
前記EGREを関与させて、各個人または家庭から各個人または家庭に対して最も正当化できるタッチポイント表現を解決するステップは、時間信号と属性データとを組み合わせるステップをさらに含む、請求項27に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の分野は、デジタル通信であり、特に、デジタル通信ネットワーク内で複数の電子通信デバイスを使用する識別された個人または家庭に関する1つ以上の「タッチポイント」の関連付けおよび解釈に対する並列処理ソリューションである。
【背景技術】
【0002】
デジタルネットワーク上の通信は、実際の個人の間ではなく、個人が使用する可能性のある電子デバイスの間で行われる。インターネットなどのデジタル通信ネットワーク上でデジタル通信を行う際に、特定の個人が複数の電子デバイスを使用することは、今日、非常に一般的である。例えば、特定の個人がデスクトップコンピュータ、ラップトップコンピュータ、デジタルタブレット、ゲームコンソール、デジタルセットトップテレビボックス、およびスマートフォンを所有して使用する場合があるが、これらは全てセルラーネットワーク、Wi-Fiネットワーク、衛星、直接ケーブルテレビ回線または電話回線接続、またはその他の手段によってインターネットに接続されている。
【0003】
デジタル通信ネットワーク上でデジタル通信に使用される個々の電子デバイスを区別するのは比較的簡単である。例えば、ウェブサイトは、通常、ウェブサイトにアクセスする個人が使用している電子デバイスに設定されている(保存されている)永続的な「クッキー」を使用する。これらのクッキーは、特定の電子デバイスの識別子など様々な種類の情報を含む小さなテキストファイルである。後日、ユーザがウェブブラウザを同じウェブサイトに誘導すると、ウェブサイトは永続的なクッキーを読み取り、それによってこの特定の電子デバイスが以前にウェブサイトにアクセスしたことを認識する。同様に、サードパーティクッキーは、一般にウェブサイトによって使用され、訪問される可能性のある複数のウェブサイトにわたって特定の電子デバイスの使用を追跡できる。多くのユーザに関心のあるコンテンツを含むウェブサイトには、追跡と広告収益化のために、ユーザのウェブブラウザに多数のサードパーティクッキーを設定する広告が含まれる場合がある。デジタル通信ネットワーク上で特定の電子デバイスを識別するためのその他の手法には、電子デバイスの「フィンガープリント」が含まれ、これには、例えば、デジタル通信ネットワーク上の他のデバイスと区別するデバイスの一意のプロファイルを作成するために、ウェブサイトによる電子デバイスの様々なソフトウェアおよびハードウェア構成の検査が含まれる場合がある。
【0004】
デジタル通信ネットワークを介して電子通信デバイスを使用して通信を行う個人および家庭は、デジタル電話番号、電子メールアドレス、ソーシャルハンドル、モバイル広告主識別子など、いくつかのタイプのタッチポイント(TP)の1つ以上を使用する。個人は、任意のタッチポイントタイプの1つ以上の特定の(タッチポイント)インスタンスを有することができる。本明細書の目的のために、「タッチポイント」は、個人または家庭へのリーチを画定および拡大できるデジタル接点として定義されてもよい。例えば、電子メールアドレス、電話番号、ソーシャルメディアハンドル、モバイル広告主識別子(MAID)、およびゲーム内ハンドルは、デジタルタッチポイントの非排他的な例である。これらのタッチポイントは、必ずしも、デジタル通信ネットワーク上の特定の電子通信デバイスに関連付けられているわけではない。例えば、同じ個人は自分の電子メールアドレスを使用して、当該個人が使用する複数の電子通信デバイスによって情報を送信できる。同様に、家族のラップトップコンピュータを使用する複数の個人など、異なる個人は異なる電子メールアドレス、ソーシャルメディアハンドルなどを使用して、同じ電子通信デバイスを使用してインターネットによって通信できる。別の例では、家庭のゲストのデジタルタッチポイントが、ゲームコンソールが設置されている家庭内の誰とも関連付けられていなくても、家庭のゲストは、ゲームコンソールを使用しながら、自分のデジタルタッチポイントを使用して通信できる。したがって、デジタル通信ネットワークによって通信するために特定のデジタルタッチポイントが特定の電子デバイスで使用されていることを知るだけでは、デジタルタッチポイントを特定の個人または特定の家庭に関連付けることはできない。
【0005】
各タッチポイントタイプに対する複数のタッチポイントインスタンスは、通常、特定の個人または家庭に関連付けられる。例えば、1人の個人が個人用の電子メールアドレスと自分の仕事に関連する電子メールアドレス、複数のソーシャルメディアフォーラムで使用される様々なソーシャルメディアハンドル、ビジネス固定電話番号、個人の携帯電話番号を有している場合がある。同様に、一部のタッチポイントインスタンスは、家族の電子メールアドレスなど、特定の個人ではなく家庭に関連付けられている場合がある。複数の電子通信デバイスを介してデジタル通信ネットワークとインタラクトする特定の個人または家庭に接触するために使用する「ベストな」タッチポイントインスタンスの識別は、配信されるメッセージのタイプとコンテキストに依存する。
【0006】
一連のデジタルタッチポイントインスタンスに関連付けられている特定の家庭または特定の個人を区別すること、および個人または家庭の1つ以上の「ベストな」タッチポイントインスタンスを識別することは、デジタル通信ネットワークを介して個人および家庭に情報を提供する様々な関係者にとって大きな価値がある。例えば、広告主は、どの個人またはどの家庭が特定のデジタルタッチポイントインスタンスに関連付けられているかを知ることによって、または、少なくとも、どのデジタルタッチポイントインスタンスが特定の広告セグメントの個人または家庭に関連付けられているか、または特定の購入傾向を示しているかを知ることによって、インターネットベースの広告を、その広告に最も関心がある可能性が高い、したがって最も応答する可能性が高い消費者にターゲットを絞ることができる。同時に、個人または家庭を特定のデジタルタッチポイントインスタンスに関連付けるシステムは、これらの個人および家庭のプライバシーが保護されていることを保証する必要があり、これにより、適用される管轄区域の様々なプライバシー法と規則、およびデジタル通信ネットワークの使用に関連して成長した業界のベストプラクティスを順守する必要がある。したがって、個人または家庭の所与のタッチポイントタイプに対するベストデジタルタッチポイントインスタンスの識別を可能にすると同時に、これらのデジタル通信ネットワークで電子通信デバイスを使用する個人および家庭のプライバシーを保証するシステムと方法は、非常に望ましい。
【発明の概要】
【0007】
本発明は、とりわけ、個人および家庭と、デジタル通信ネットワーク上の電子通信デバイスを使用して通信するときに使用される1つ以上のデジタルタッチポイントインスタンスとの関連付けを可能にする分散ノードクラスタアーキテクチャコンピューティングシステムを対象とする。本発明は、エンティティ解決を可能にする発見不可能なリポジトリであるエンティティグラフ解決リポジトリ(EGRR)を組み込んでおり、各エンティティは個人情報(PII)表現、属性、およびメタデータのセットで構成される。これらのエンティティには、参照によりその全体が本明細書に組み込まれる、例えば米国特許第6,523,041号および第6,766,327号に記載されているような、独自のリンク技術を使用した持続され、維持された識別リンクが与えられる。本発明の目的のために、主要なエンティティは、「消費者」、「アドレス」、および「家庭」を表す。本発明は、EGRRの上位に位置し、適切な要求情報の検索だけでなく、グラフへの入力(マッチサービス、マッチサービスによって行われるリンク付け)を担当するエンティティグラフ解決エンジン(EGRE)をさらに含む。
【0008】
本発明は、EGRRを利用して必要な計算を実行する。特定の実装では、本発明は、個人名または家庭名が与えられたときにデジタルタッチポイントインスタンスの決定を可能にし、あるいは、代替的に、デジタルタッチポイントインスタンスが与えられたときに対応する個人または家庭の決定を可能にすることができる。これは、デジタルタッチポイントインスタンスと個人/家庭との永続的なリンクを作成することで実現され、その逆もまた同様である。様々な実装において、本発明は4つのフレームワークに分割することができる。
a.個人のベストタッチポイントインスタンスのフレームワークは、1つまたは一連の最もアクティブまたは現在のデジタルタッチポイントインスタンスを識別し、個人に関連付ける。また、このフレームワークは、個人に関連付けられたタッチポイントインスタンスのライフサイクルを管理する。
b.家庭のベストタッチポイントインスタンスのフレームワークは、1つまたは一連の最もアクティブなまたは現在のデジタルタッチポイントインスタンスを識別し、家庭に関連付ける。また、このフレームワークは、家庭に関連付けられたタッチポイントインスタンスのライフサイクルを管理する。
c.タッチポイントインスタンスのベストな個人のフレームワークは、1人の個人または一連の個人を識別し、デジタルタッチポイントインスタンスに関連付ける。
d.タッチポイントインスタンスのベストな家庭のフレームワークは、1つの家庭または一連の家庭を識別し、デジタルタッチポイントインスタンスに関連付ける。
【0009】
EGRRには、タッチポイントに加えて、氏名、アドレス、消費者リンク(CL)、アドレスリンク(AL)、および家庭リンク(HHL)が含まれる。消費者リンクは、EGRRから活用される個人表現の単一ポイントを表す数値、アルファベット、または英数字の値である。消費者世界内で同じCLを共有する消費者は2人として存在せず、すなわち、各CLは、CLの世界全体で一意である。アドレスリンクは、EGRRから活用されるアドレス表現の単一ポイントを表す数値、アルファベット、または英数字の値である。各ALは、各CLと同様に、ALの世界全体で一意である。家庭リンクは、EGRRから活用される家庭(すなわち、現在のALでの単一または複数のCLの組合せ)の表現の単一ポイントを表す数値、アルファベット、または英数字の値である。各HHLは、HHLの世界全体でも一意である。本発明のこれらの実装は、EGRRとEGREの両方で構成されるエンティティ解決システム(ER)をさらに利用する。ノードクラスタアーキテクチャの複数のノードを使用して、並列処理の機会を活用し、システム内の演算速度を大幅に向上させる。
【0010】
特定の実装では、本発明は、個人によって制御されるデジタル通信ネットワーク上の電子通信デバイスを使用して、タッチポイントインスタンスの動きが個人により表明された活動に基づいているデジタルタッチポイントインスタンスのみを使用する。例えば、これらのタイプのタッチポイントには、電話番号、電子メールアドレス、MAID、ソーシャルネットワークハンドル、ゲームハンドルなどが含まれる。フレームワークは、ソースデータを使用して構築され、EGRRを通じてERが利用できる個人情報(PII)の履歴と、内部メタデータからの使用履歴に基づいて構築される。本システムの特定の実装によると、本システムと方法を利用するクライアントは、デジタルタッチポイントインスタンスを送信し、クライアントの使用ケースに基づいて個人リンクまたは家庭リンクを取り戻すことができる。クライアントはまた、氏名やアドレスなど、個人または家庭に関連付けられた個人情報(PII)を渡し、クライアントの使用ケースに基づいて、その個人または家庭に関連付けられたベストデジタルタッチポイントインスタンスを回収することができる。
【0011】
本発明のこれらおよび他の特徴、目的、および利点は、以下に説明する図面と併せて、様々な実施形態についての以下の詳細な説明および添付の特許請求の範囲を考慮することにより、よりよく理解されるであろう。
【図面の簡単な説明】
【0012】
【
図1】本発明の実装によるエンティティグラフ解決リポジトリ(EGRR)からの例示的データの表である。
【
図2】あらゆるタッチポイントタイプに対する各タッチポイントインスタンスについてベストな個人/家庭を選択するための本発明の実装の高レベルのフローチャートである。
【
図3】
図2からの第1のサブシステム(ブロック14)の詳細バージョン(すなわち、ベストな個人/家庭の選択の決定)である。
【
図4】
図3に示された入力データの集約の実装からの例示的なデータの表である。
【
図5】
図4の表からの例示的なデータを使用した決定サブシステム(
図2のブロック22)からの出力の表である。
【
図6】各個人/家庭のあらゆるタッチポイントタイプについて、その利用可能なそれぞれのタッチポイントインスタンスからベストタッチポイントインスタンスを選択するための本発明の実装の高レベルのフローチャートである。
【
図7】
図6からの第1のサブシステム(ブロック40)の詳細バージョン(すなわち、ベストタッチポイントインスタンスの選択の決定)である。
【
図8A】消費者リンクについて
図7に示された入力データの集約の実装からの例示的なデータの表である。
【
図8B】家庭リンクについて
図7に示された入力データの集約の実装からの例示的なデータの表である。
【
図9】
図8の表からの例示的なデータを使用した決定サブシステム(
図6のブロック42)からの出力の表である。
【
図10】本発明の実装によるベストタッチポイントインスタンスの配信のためのエンティティグラフ解決エンジン(EGRE)とクライアントとの間の通信のフローチャートである。
【
図11】本発明の実装によるベストな消費者リンク/家庭リンクの配信のためのクライアントとEGREとの間の通信のフローチャートである。
【
図12】本発明の実装を利用するシステムストレージの改善を示す表である。
【
図13】本発明の実装を利用する処理時間の改善を示す表である。
【発明を実施するための形態】
【0013】
本発明をさらに詳細に説明する前に、本発明は、説明される特定の実施形態および実装に限定されず、特定の実施形態および実装を説明する際に使用する用語は、それらの特定の実施形態および実装のみを説明するためのものであり、本発明の範囲は特許請求の範囲によってのみ制限されるため、限定することを意図するものではないことを理解すべきである。特に、この説明では従来の家庭の概念を使用しているが、家庭に関する全ての主張は、大家族、ビジネスパートナなど、一部の地域の共通性によって定義される一連の個人の概念に対しても同様に有効である。
【0014】
所与のタッチポイントインスタンスに対してベストな個人/家庭を決定する方法は、
図1の表形式で示されるEGRRからの例示的なデータから始めて、
図2~
図3のフローチャートと併せて説明できる。
図1のデータは、消費者リンク、家庭リンク、関連する姓名、タッチポイント、関連するURL、およびタッチポイントインスタンスのタイプの例を示す。タッチポイントのインスタンスが与えられると、そのインスタンスと1人以上の個人および/または1つ以上の家庭との潜在的な関連付けがいくつか存在する可能性がある。(本明細書での例は、わかりやすくするために個人に限定されるが、本発明は家庭に対して同じ概念を拡張する。)そのタッチポイントインスタンスに関連付けられた「ベストな」個人リンク(CL)または家庭リンク(HHL)は、最初に、実際に関連付けが有効なものと思われるという正当化できる証拠を有する必要がある(想定される複数の独立ソースによって確認され、および/または最近の時間ウィンドウで複数回出現する)。また、選択された「ベストな」関連付けは、他のどの候補の関連付けよりも正当化できる証拠が多くなければならない。明確なベストな関連付けがない場合は、全ての「ベストな」関連付けを比較して、それらの間に強い局所性関係があるように見えるものがいくつかあるかどうかを確認する必要がある。このような強い局所性関係には、同じ姓および/または複数の共通アドレス、および/またはEGRR内の同じ家庭および/またはこのような類似した共通性属性を共有する異なる個人が含まれる。その場合、これらの候補者のいずれかにアクセスすると、一連の関連する個人内の他の候補者に、間接的にアクセスする可能性が高いと想定できる。したがって、関連する個人のこのような最大のセットは、これらの個人の関連付けの強さを高め、その特定のグループ内の全ての個人に対して期待されるマーケティング効果を最適化する効果を持つ1つを「ベスト」として選択できる。
【0015】
本発明の一実装において時間コンポーネントを分析するために、今月および少なくとも過去5か月間の取引履歴データが、様々な適切なソースから識別された各タッチポイント/個人または家庭の関連付けペアごとに収集され、EGRRで長期データとして収集される。必要に応じて、このシステムの実装では、このようなデータを最大3年間またはわずか3か月間だけで収集できる。このデータは、デジタル通信ネットワークを介して通信する電子通信デバイスから収集される。ソースは範囲の点で異なる場合がある(すなわち、記録数と別個の報告されたタッチポイントタイプの両方)。収集されたデータには、多くの個人が複数の有効なタッチポイントインスタンスを有しているため、同じ個人を共有する複数のこのような関連付けられたペア、および電子メールや電話番号などの多くのタッチポイントインスタンスが複数の個人間で共有されているため、共通のタッチポイントインスタンスを共有する複数の個人が含まれ可能性がある。これらの関連付けられたペアは、最初にタッチポイントインスタンスの観点から集約され(例えば、全ての別個の電話番号で集約する)、その後、個人の観点から最初に集約された各グループ内でサブ集約される。このプロセスにより、前述の収集データを取得し、そのタイムスタンプで月ごとに集約し、最新の月から開始して時間を遡って結果を並べることによって構築される時間信号パターンの構築が推進される。これにより、個人/家庭とタッチポイントインスタンスとの関連付けの両方を履歴的に見ることができる。例えば、この時間データは、所与の個人がどのタッチポイントインスタンスを最も多く使用するかだけでなく、どの個人がその特定のタッチポイントを最も多く使用しているかを示すことができる。
【0016】
ここで
図2および
図3を参照すると、プロセスをより詳細に説明することができる。特に、システムの高レベルの概要を示す
図2について説明する。この図には、
図3で詳細に説明する1つのコンポーネント(ブロック14)が含まれている。入力10には、証拠で明らかになった個人とタッチポイントインスタンス間の現在の関連付けを含む、今月の生データソースファイルのセット(ブロック12)が含まれる。これらは、サードパーティのソース貢献者によって提供されるソースである。入力10はさらに、個人(EGRRで計算された全ての消費者リンク関連付け)とタッチポイントインスタンスとの間の履歴的に推測された関連付け(ブロック18)を含む。これらの関連付けは、EGRRの一部であるが、最近、このシステムで使用されるサードパーティのソースデータによる貢献がない、履歴的に推測された関連付け間のギャップを埋めるためにのみ取り込まれる。内部使用メタデータ(ブロック20)は収集され月単位で計算される。EGRR内の個人/タッチポイントインスタンスの各関連付けに対して、その内部メタデータは上記の時間信号パターンを形成する。この集約データは、個人/家庭の両方の動きに起こり得る変化を推測するために使用される。ドメイン(URL)分類(ブロック24)は、業界ごとにURLを分類する。一部のサードパーティデータソースは、オンラインソースからコンパイルされる。データの収集元のURLはソースファイルで送信される。これらのURLは、業界分類に基づいて分類され、例えば、www.amazon.comは小売URLとしてフラグ付けされ、cnn.comはメディアURLとしてフラグ付けされ、citi.comは金融URLとしてフラグ付けされる。
【0017】
EGREシステムは、Hadoop分散ファイルシステムコンピューティング環境で処理される(ブロック16)。Hadoopは非常に大きなデータセットを含む演算に特に効果的なツールであるため、Hadoopはこのような処理に対して理想的な環境であるが、本発明はそれに限定されず、他のタイプの分散ファイルシステムコンピューティング環境を代替の実装に採用してもよい。システムのこのコンポーネントには、いくつかのサブコンポーネントが含まれる。「タッチポイントインスタンスの正当化できる現在の個人/家庭を識別する」(ブロック14)は、入力データを結合し、タッチポイントインスタンスで情報を集約する。次に、この情報を使用して、タッチポイントインスタンスにベストな(最もアクティブな)CL/HHLを選択する。決定で使用されるデータのコンテキストと決定自体の両方が生成される。このプロセスについては、
図3を使用してさらに詳しく説明する。ブロック14の最終決定ファイルを使用して、EGRRビルドに統合するために、CL/HHLとタッチポイントインスタンスとの関連付けを有する相互参照ファイル(ブロック22)を生成する。次に、ブロック22からの結果は、EGRE(マッチサービス)に統合され、クライアントが使用する配信バンドルの一部として(ブロック26)使用される。
【0018】
ブロック14(すなわち、
図2の最も正当化できるアクティブな個人/家庭の、それぞれのタッチポイントインスタンスとの関連付けを計算するコンポーネント)について、
図3を使用して詳細に説明する。
図2の説明で述べたように、
図3の全ての処理は、この実装でHadoopコンピューティング環境またはその同等物を使用して実行される。
図3の入力ストリーム(ブロック10)は、
図2で上記したものと同じである。一連の生データソースファイル(上記のブロック12)は、ウェブアドレス/ドメイン分類(上記のブロック24)と共にシステムに読み込まれ、このデータに対する時間信号パターンが作成される。最初に、ブロック27で、これらの生データソースは、データの重複排除(すなわち、重複リストの削除)、名前表現、郵便アドレス表現、およびデジタルタッチポイントインスタンスの標準化を含む標準ファイル衛生システムを介して送信される。次いで、この高度化されたデータは、EGREによって照合され、各記録にCLとHHLが追加される。次に、システムは、ブロック29でウェブアドレス分類ファイルの業界フラグをオーバーレイし、ブロック29でタッチポイントインスタンスのデータを集約してソースデータの時間パターン信号を作成する。この時間信号パターンの一部として、各記録インスタンス内の識別された各タッチポイント/個人の関連付けが記録される。また、記録に貢献したソースからの特定のソース識別子、ソース活動の日付、およびデータに貢献した別個のソースの数のカウントも記録される。
【0019】
各タッチポイントインスタンス/個人/家庭の関連付けの使用履歴は、
図3のブロック30に示される。EGRR内の特定のエンティティ表現にアクセスすると、内部メタデータには、一定期間の長期にわたる特定のエンティティ表現のアクセス履歴の集約が含まれる。この集約データは、これらが表すエンティティの動きに起こり得る変化を推測するために使用される。この方法は、現在のサードパーティソースデータではシミュレートできないタッチポイントインスタンスの活動と変化に関連付けられる可能性のある個人/家庭の履歴見通しを提供するのに役立つ。特に、本発明者らは、この広く匿名化された範囲を活用して、前述の全ての問題に直接対処するEGRR内の全ての消費者リンクの代表的なタッチポイントインスタンスの関連付けを構築できることを認識した。この集約されたメタデータは、非常に詳細なレベルでPII情報の変化を直接に識別および検証できる時間信号パターンを形成するために使用される。EGRRは、識別されたタッチポイントの関連付けに関連する各個人/世帯および長年にわたる属性データに対して、いくつかのこのような時間的見通しを提供する。このような情報の収集と集約は、ブロック30に示す内部メタデータから時間パターン信号を構築するために使用される。
【0020】
上記のように、タッチポイントと個人/家庭との関連付けの全ては、特定のタッチポイントインスタンスに対する関連付けがベストの可能性のある個人/家庭と見なされる。コンポーネントブロック32により、生データソース、内部メタデータ、およびEGRRからの関連付け履歴の範囲の間にあるギャップが埋められる。これらのタイプの関連付けは、タッチポイントインスタンスレベルで収集および集約され、個人/家庭とタッチポイントインスタンスとの各関連付けに単一の視点を提供する。このコンポーネントには、ソース貢献数やEGRRから最後に提供された日付などの属性が含まれることになる。
【0021】
上記の3つのコンポーネント全て(ブロック29、30、および32)からのファイルをブロック34で組み合わせて(データのタイムスタンプを使用して)時間信号パターンを作成し、上記で収集された所与のタッチポイントインスタンスとその関連属性に対して考えられる全ての個人/家庭の全体像を提供し、これはブロック36で出力される。結果として得られる時間信号ファイルは、各タッチポイント/個人の関連付けペアの全てのデータ属性を使って作成される。
図4は、結果として得られる時間信号ファイルの表形式の例(表はわかりやすくするために2つのセクションに分割されているが、2つのセクション内の対応する行は同じ結果ファイルに関連することに注意すること)で、次の例で使用される。上記のこの結果ファイルは、コンテキストが非常に豊富であり、かつ線形化された半構造化形式であり、これから所与のタッチポイントインスタンスに対してベストな個人(CL)または家庭(HHL)を、
図3のブロック36で、正当に識別することができる。この単一の個人/家庭が識別されるだけでなく、所与のタッチポイントインスタンスとの関連付けをサポートするある程度の意味のある証拠を有する個人/家庭の全てのインスタンスがランク付けされる。このランキングは、与えられた証拠と関連するコンテキストの強さと正当化可能性の観点から決定される。候補である各関連付けの強さは、2つの次元、すなわち、関連付けを提供する証拠の量とコンテキストのタイプによって測定される。数量は、所与の関連付けを提供する別個のソースの数によって測定される。例えば、
図4の表の最初のタッチポイント「john.doe@yahoo.com」(「タッチポイント」という名前の列)を使用すると、リストされた単一のCL(「CL」という名前の列)として123が返される。複数のCLが使用可能な場合、それぞれがこの列に含まれるが、パイプで区切られる。同様に、HHL(「HHL」という名前の列)として10001が返される。このタッチポイントインスタンスは、セミコロンで区切られた2つの氏名、具体的には「John Doe」と「John Dough」(「氏名」という名前の列)にも関連付けられる。このタッチポイントインスタンスに2つ以上のCLが関連付けられている場合、各CLの氏名はパイプで区切られる(この例の2番目の記録を見ること)。このタッチポイントインスタンスには、セミコロンで区切られた2つのURL(「URL」という名前の列)がある。2つの時間信号(「時間信号パターン」という名前の列)は、「45,38,26,24,19,12」および「111000」(「#」で区切られている)である。最初の部分は、最近の月から始まり最新の月で終わる、EGRRを介してこの関連付けにアクセスした回数を表す。2番目の部分は、この関連付けが少なくとも1つのデータソースによって提供されたかどうかを表し、「1」ははい、「0」はいいえを意味する。また、この強さはまた、直近の月から最新の月へと順序付けられている。
【0022】
ランキングプロセスに関して、個人とタッチポイントインスタンスとの関連付けが、EGRRの内部メタデータ内で見つかった複数の独立データプロバイダによって報告され、および/または異なるURLを介して提供される場合、この情報により、この関連付けは関係があるという主張に正当化可能性が追加される。このような一連の証拠の数がより多くなることで、関連付けの信頼性が大幅に強化される。2番目の次元、すなわちURL分類では、個人が使用することはないであろうタッチポイントインスタンス(偽または休止状態のタッチポイントインスタンス)を意図的に提供する場合がある。これらのインスタンスは、関連付けのソースのコンテキストの性質を評価することにより、考慮から除外できることがよくある。例えば、出会い系サービスに提供される電子メールは、調査サイトに提供される電子メールよりも、個人にとって意味のある電子メールである可能性が高くなる。同様に、金融クライアントから発信される内部メタデータに記録されるタッチポイント関連付けへのアクセスは、様々なソースから多様な調査データを頻繁に購入する直販クライアントから発信されるものよりも意味がある可能性が高い。その後、これらの関連付けは、最終ランキングの支配的な動きを毎月持続するために「チャンピオン-チャレンジャ」フィードバックループを使用した二段階ランキングシステムでランク付けされる。
【0023】
この二段階ランキングシステムの一部として、最初にタッチポイントインスタンスに関連付けられた個人/家庭は、証拠のコンテキストの側面に基づいて、強、中、弱として分類される。第二に、これらの各カテゴリの関連付けは、上記の証拠の量的側面とコンテキストの強さに基づいて数値的に部分的にランク付けされる。例えば、
図4で、mary.doe@yahoo.comは、メタデータの使用履歴とデータソースの貢献から、強い時間信号パターンを備えた強のカテゴリ内にある2つのCL(CL 123とCL 135)を取り込む。具体的には、CL 123は時間信号28、17、36、27、18、15および001001をそれぞれ報告し、CL 135は時間信号55、39、37、42、29、12および111100をそれぞれ報告した。mary.doe@yahoo.comの場合では、CL 135とCL 123の両方が、内部メタデータからの一貫したアクセス信号も、過去6か月間のデータソース貢献者ファイルの存在も報告した。しかし、システムは、電子メールのローカル部分(mary.doe)がCL 135に関連付けられている個人の氏名「Mary Doe」と一致したこと、アクセス数は一貫して多く、ソース貢献者から過去6か月間のうち最新の4か月でアクセスが見られたことから、CL 135を上位ランキングのものとして識別した。同様に、CL 123とCL 135の両方が10001という同じ家庭に属していたため、システムは家庭10001をベストとして識別した。
【0024】
図4に示すように、ベストピックについて最終決定が行われる前に、前月のベストピック、すなわち「前月ベストCL」の列内の値は、識別された選択肢と比較される。これら2つの値が一致する場合、システムはその値を最終選択として使用する。そうでない場合、証拠を再評価し、決定を覆すために十分な違いがあることを確認する必要がある。この場合、証拠がわずかに強いだけであれば、選択されたものが正しければその信号は将来強くなり、最終的にはベストピックになるという期待を持って、前のものが維持される。
【0025】
次に、このコンポーネントから得られた結果ファイルは、
図2で前述したブロック22で処理され、システムから最終出力ファイルが作成される。このファイルは、
図5に示すように、タッチポイントインスタンスと、それぞれのタッチポイントインスタンスに対して選択されランク付けされた一連のCLおよびHHLとの相互参照、すなわち、タッチポイントインスタンス(「タッチポイント」列内にある)と、それぞれ選択された一連のCL(列CL内にあり、複数のCLがパイプで区切られている)またはHHL(列HHL内にあり、複数のHHLがパイプで区切られている)との相互参照である。タッチポイントが複数のCLまたはHHLへ解決される場合、これらのCL(CLランキングの列内にあり、タッチポイントインスタンスに複数のCLがある場合、各CLのランクは、パイプで区切られる)またはHHL(HHLランキングの列内にあり、タッチポイントインスタンスに複数のHHLがある場合、各HHLのランクはパイプで区切られる)は、当該タッチポイントインスタンスが解決された他のCLまたはHHLに関するランクと共に返されることがわかる。繰り返すが、これは同じタッチポイントインスタンスを使用する複数の個人または家庭に対応する場合があるが、ランキングプロセスにより、所与のタッチポイントインスタンスに関連付けられた「ベスト」な個人または家庭を決定することが可能になる。
【0026】
ここで、逆のプロセス、すなわち個人または家庭に対してのベストタッチポイントインスタンスの決定について、
図6~
図9に目を向けることができる。個人または個人の家庭を考えると、最初に選択された一連の個人のメンバーに関連付けられている所与のタッチポイントに複数のインスタンスが存在する可能性がある。「ベスト」タッチポイントインスタンスには、最初、そのインスタンスと最初の個人との関連付けは有効であり、かつ最近のものであるという明確で正当化できる証拠がなければならない。次に、選択したベストタッチポイントインスタンスの証拠の強さはまた、他の候補よりも大きくなければならない。このコンテキストは、
図2~
図3を参照して上記したコンテキストよりも複雑である。このコンテキストでは、個人/家庭は、アクティブに使用される複数のタッチポイントインスタンスを有する可能性がある。しかしながら、このような場合には、タッチポイントインスタンスは、それを介した通信を無視する意図で提供されるが、その例は上記で提供されている。
【0027】
図6および
図7は、CLまたはHHL(それぞれ特定の個人または特定の家庭に対応)に対するベストタッチポイントを計算するシステム像を提供する。前のプロセスと同様の方法で、
図6はシステムの高レベルのシステム像を表している。この図には、
図7でより詳細に表される1つのコンポーネント(ブロック40)が含まれる。
【0028】
ここで
図6を参照すると、
図2~
図3を参照して上記した類似のプロセスにおいて、個人/タッチポイント関連付けペアに対する証拠の時間信号パターンが、前のプロセスと同じ入力(ブロック10)を使用して構築される。個人/家庭およびタッチポイントインスタンスの役割が逆になったため、収集された情報は最初に個人ごとに集約され、次に最初に集約された各個人グループのタッチポイントインスタンスごとにサブ集約される。このデータ集約により、特定のペアのレベルと個人のレベルの両方で、これらの関連付けの時間的動きの2次元での見通しが可能になる。
【0029】
分散ファイルシステムコンピューティング環境でのこの逆システムの処理(ブロック16)は、以下で説明する手順で再び行われる。個人/家庭の正当化できる現在のタッチポイントインスタンスの識別(ブロック40)では、入力データが結合され、個人/家庭の情報が集約される。次に、この情報を使用して、個人(CL)/家庭(HHL)に対してベストな(最もアクティブな)タッチポイントインスタンスを選択する。決定で使用されるデータのコンテキストと決定自体の両方が生成される。このプロセスについては、
図7を使用してさらに詳しく説明する。ブロック40からの最終決定ファイルを使用して、ブロック42で、EGRRビルドに統合するために、タッチポイントインスタンスからCL/HHLへの関連付けを持つ相互参照ファイルを生成する。次に、ブロック42からの結果は、EGRE(マッチサービス)に統合され、ブロック44でクライアントが使用する配信バンドルの一部として使用される。
【0030】
ブロック40(すなわち、
図6からの最も正当化できるアクティブなタッチポイントインスタンスのそれぞれの個人/家庭との関連付けを計算するコンポーネント)について、
図7を使用して詳細に説明する。
図6の説明で述べたように、
図7の全ての処理は、Hadoopコンピューティング環境16を使用して実行される。
図7の入力ストリーム(ブロック10)は、
図6で上記したものと同じである。一連の生データソースファイル(上記のブロック12)は、ウェブアドレス/ドメイン分類(上記のブロック24)と共にシステムに読み込まれ、このデータに対する時間信号パターンが作成される。最初に、これらの生データソースは同じ標準ファイル衛生サブシステムを介して送信され、
図3のブロック27で説明されているように、CLとHHLが追加される。次に、システムは、ウェブアドレス分類ファイルからの業界フラグをオーバーレイし、個人/家庭のデータを集約して、ブロック46でソースデータの時間パターン信号を作成する。この時間信号パターンの一部として、各記録インスタンス内で識別された各タッチポイントインスタンス/個人/家庭の関連付けは、
図7のブロック46で関連データソース情報(
図3で説明)と共に記録される。タッチポイントインスタンス/個人/家庭の各関連付けの使用履歴は、
図7のブロック48に示される。
図3の説明で述べたように、EGRRの特定のエンティティ表現にアクセスすると、その内部メタデータは、一定期間の長期にわたってデータを捕捉して集約する。この集約データは、これらが表すエンティティの動きに起こり得る変化を推測するために使用される。この方法は、現在のサードパーティのソースデータではシミュレートできない、タッチポイントインスタンス関連付けの起こり得る変化に関する履歴見通しを得るのに役立つ。
図3の説明で述べたように、本願の発明者は、この広く匿名化されたカバレッジを活用して、前述の全ての問題に直接対処するEGRR内の全ての消費者リンクの代表的なタッチポイントインスタンスの関連付けを構築できることを認識している。上記のこの集約されたメタデータは、非常に詳細なレベルでPII情報の変化を直接識別および検証できる時間信号パターンを形成するために使用される。EGRRは、識別された個人/家庭の関連付けに関連する各タッチポイントインスタンスおよび長年にわたる属性データに対するいくつかのこのような時間的な見通しを提供する。このような情報の収集と集約を使用して、ブロック48に示す内部メタデータから時間パターン信号を構築する。
【0031】
上記のように、タッチポイントおよび個人/家庭の全ての関連付けは、特定の個人/家庭の関連付けに対する起こり得るベストタッチポイントインスタンスと見なされる。ブロック50は、生データソースと内部メタデータを通じて提供される関連付けの範囲と、EGRRからの全ての関連付け履歴との間のギャップを埋める。これら2つのタイプの関連付けは個人/家庭で収集および集約され、個人/家庭およびタッチポイントインスタンスの全ての関連付けに対して単一の視点を提供する。このコンポーネントは、ソース貢献数やEGRRから最後に提供された日付などの属性で構成される。
【0032】
上記の3つのコンポーネント全て(ブロック46、48、および50)からのファイルを組み合わせて、上記のブロック34で収集した特定の個人/家庭およびその関連属性に対して、所与の個人/家庭の考えられる全てのタッチポイントインスタンスの全体像を提供する時間信号パターンを作成する。結果ファイルは、各タッチポイントインスタンス/個人/家庭の関連付けペアの全てのそれぞれのデータ属性で作成され、ブロック52で出力される。
図8Aは、個人の場合の結果ファイル例を示す(わかりやすくするために、表は2つのセクションに分割されているが、2つのセクションの対応する行は、前の例と同じように同じ結果ファイルに関連していることに注意すること)。
図8Bに示すような非常によく似た別個の結果ファイルが、家庭用に生成される。
【0033】
上記の逆プロセスの説明で述べたように、上記のこの結果ファイルは、コンテキストが非常に豊富であり、かつ線形化された半構造化形式であり、これから所与の個人(CL)または家庭(HHL)に対してベストタッチポイントインスタンス個人(CL)または家庭(HHL)を、
図7のブロック52で、正当に識別できる。前のシステムと同様に、この単一のタッチポイントインスタンスが識別されるだけでなく、所与のタッチポイントインスタンスとの関連付けをサポートするある程度の意味のある証拠を有する全てのタッチポイントタイプの全てのタッチポイントインスタンスがランク付けされる。前のシステムと同様に、このランク付けは、所与の証拠および関連するコンテキストの強さと正当化可能性の観点から決定される。繰り返すが、各候補の関連付けの強さは、2つの次元、すなわち、関連付けを提供する証拠の量とコンテキストのタイプによって測定される。数量は、所与の関連付けを提供する別個のソースの数によって測定される。
【0034】
このシステムのランキングプロセスは、前のシステムで説明したプロセスと非常によく類似しており、前のシステムで説明したのと同じ基準を使用している。しかしながら、2つのシステムには1つの大きな違いがある。タッチポイントインスタンスに対してベストな個人/家庭を選択するとき前のシステムでは、各候補である個人/家庭は、時間的証拠を見て「ベスト」を選択する前に、同等の信憑性があると見なされている。この場合、システムはベストタッチポイントインスタンスを選択する必要があり、一部のタッチポイントインスタンスは実際の時間データに関係なく疑わしいことがある。例えば、「000-000-0000」のような明らかに「偽の」電話番号、明らかに悪意のある電子メールインスタンス、または短命の電子メールアドレスのプロバイダからのドメインを持つ電子メールインスタンスは、「ベスト」なインスタンスとして返されることはない。このようなインスタンスは、(前のシステムで既に説明したように)「不良」カテゴリに含めても差し支えない。例えば、
図8Aの表の最初の個人(「CL」という名前の列のCL 123)を使用すると、3つの電子メールインスタンス(列名「タッチポイントタイプ」)、「john.doe@yahoo.com」、「john.doe@yahoo.com」および「john.doe@yahoo.com」(列名「タッチポイント」)が返される。「URL」という名前の列内の情報を見ると、最初の電子メールインスタンスは金融機関と小売サイトの両方から提供され、他の2つのインスタンスは信頼性の低いサイト(調査サイトとソーシャルサイト)から提供された。同様に、最初の電子メールインスタンスには、個人に関連付けられた2つの氏名の一方、すなわち「John Doe」(「氏名」という名前の列)が含まれる。「時間信号パターン」という名前の列内の2つの時間信号を見ると、3つ全ての電子メールインスタンスには意味のある使用シグナルがあり、最初の電子メールインスタンスが最も強く、2番目が次に強く、最後のインスタンスが最も弱い。「ソースファイル内での存在」信号のゼロと1の観点では、最初の電子メールインスタンスは直近3か月間、2番目は直近2か月間と6か月前に見られ、3番目は6か月前にしか見られていない。これらの電子メールインスタンスのランキングに関しては、例における1番目と2番目の電子メールは上記の情報に基づいて「良好」カテゴリに入れられるが、3番目は、時間数が少ないこと、調査サイトのみによる貢献であること、生データソースファイルによる最近の貢献がないことにより、「中」カテゴリに入れられる。このカテゴリ化により、この3番目のインスタンスは自動的に「良好」カテゴリのインスタンスよりも低くランク付けされる。「良好」カテゴリの2つを見ると、上記で収集された情報は、最初の電子メールインスタンスがCL 123のベストなものとして最初に選択されることを示している。最終ステップ(チャンピオン-チャレンジャプロセス)では、システムは「前月ベストTP」の列内の値をチェックし、最初に選択された値が計算されたベスト値と同じであるため、この値が最終選択として選択されることを指摘する。前月の選択が他の2つの電子メールインスタンスのうちの一方である場合、最初の選択と他の選択の違いが劇的であるため、最初のインスタンスがチャンピオン(前月の選択)に勝つことに注目すべきである。
【0035】
次に、このコンポーネントの結果ファイルは、
図6で前述したブロック42で処理され、システムから2つの最終出力ファイルが作成される。これらのファイルは、
図9に示すように、CL/HHLと、それぞれのCLおよび/またはHHLに対して選択された一連のランク付けされたタッチポイントインスタンスとの相互参照であり、すなわち、CL(列CLにある)およびHHL(列HHLにある)と、それぞれ選択された一連のタッチポイントインスタンス(「個人に対するベストタッチポイント」および/または「家庭に対するベストタッチポイント」の列内にあり、複数のタッチポイントインスタンスがパイプで区切られている)との相互参照である。CLおよび/またはHHLが複数のタッチポイントインスタンスへ解決される場合、それらのインスタンスは、CLおよび/またはHHLが解決された他のタッチポイントインスタンス(「タッチポイントランキング」の列内にあり、CLおよび/またはHHLに対して複数のタッチポイントインスタンスを有する場合、それぞれのタッチポイントインスタンスの各ランクはパイプで区切られる)に関するランクと共に返されることがわかる。繰り返すが、これは同じCLおよび/またはHHLを使用した複数のタッチポイントインスタンスに対応する可能性があるが、ランキングプロセスにより、所与の個人または家庭に関連付けられた「ベスト」タッチポイントインスタンスを決定することが可能になる。また、上記のように、タッチポイントのランキングは、アプリケーションに応じて特定の業界または用途に固有のものである場合がある。
【0036】
次に
図10を参照すると、上記のCL/HHLシステムのベストタッチポイントインスタンスからの相互参照ファイルを使用して、クライアントの入力から個人/家庭の望ましいベストタッチポイントインスタンスが決定される。クライアントが個人に対する任意のタッチポイントタイプに対するベストタッチポイントインスタンスを見つけたい場合、クライアントはブロック54で個人または家庭の適切なエンティティ表現を入力することになる。EGREのマッチングロジックを使用することにより、ブロック56でEGRRから一意のリンク(CLまたはHHL)が検索され、ブロック58で
図6のブロック44の出力から適切なベストタッチポイントインスタンスが返される(このデータはこのようなリンク、すなわち、CL/HHLに入力される)。同様に、
図11を参照すると、上記のタッチポイントインスタンスシステムにとってベストなCL/HHLの相互参照ファイルを使用して、クライアントの入力から所与のタッチポイントインスタンスに対して所望のベストなCL/HHLを決定する。クライアントが所与のタッチポイントインスタンスに対してベストなCL/HHLを見つけたい場合、クライアントはブロック60でそのタッチポイントインスタンスを入力する。ブロック62で、EGREからの結果には、適切なEGRRの属性バンドルと共に返された
図2のブロック26の出力が含まれる。
【0037】
本システムの実装の1つは、300以上のノードコンピュータ/プロセッサを含む分散Hadoopクラスタにある。アプリケーションプログラミングインタフェース(API)を使用して、ラップトップコンピュータやデスクトップコンピュータなどのクライアントデバイスから入力を受信することができる。同様に、出力モジュールは、結果データをクライアントデバイスに出力する手段を提供する。前述のように、分散ファイルシステムコンピューティング環境は、大規模データ環境での操作を簡素化する主要な機能により、本発明の実装に特に適しているが、他の実装も可能である。また、分散クラスタのサイズは、本システムの実装にとって重要な要件ではないが、ノードの数が増えると、本システムの全体的な効率が劇的に向上することになる。
図12で参照されているように、コンピューティング環境は、ある特定の実装では、28テラバイトを超える入力データの取り込みを可能にする。このデータには、複数月の内部メタデータ、複数のエンティティ表現、およびEGRRから抽出されたタッチポイント参照テーブルが含まれる。また、複数のデータプロバイダのソースファイルも含まれる。このデータ収集により、実際の意思決定と、最終決定および各決定が行われたコンテキストの両方のアーカイブで使用される、コンテキストが豊富なヒントファイルが作成される。結果として得られるコンテキストヒントファイルのメモリフットプリントは、わずか175ギガバイトであり、これは、これらのヒントファイルを作成するために消費および解釈する必要があるデータのフットプリントの1%(1つの実装では、わずか0.63%)未満である。これは、それぞれ
図4、
図8A、および
図8Bの表に示されているように、個人、家庭、およびタッチポイントインスタンスで入力される半構造化データを作成することによって実現される。これらのヒントファイルは、
図3および
図7に示すように作成された時間信号パターンからの出力である。これらの表現により、
図3および
図7を参照して前述したように、この実装のデータフットプリントを大幅に削減しながら、計算された豊富なコンテキストフレームワークが保持される。
【0038】
これらの出力コンテキストヒントファイルについては、バックエンド処理でマルチノードクラスタが使用中であっても、記載されている各タッチポイント関連付けシステムの結果をカスタマーサポートで使用するために、単一のラップトップコンピュータなどのクライアントデバイスに簡単に保存できる。これにより、サポートサービス環境がコンピューティング環境から切り離される。このアプローチは、クライアントデバイスが出力データにアクセスするためのファイアウォールの背後にデータの大部分が保存されるため、データセキュリティの点で優位性がある。ラップトップまたはデスクトップコンピュータを使用すると購入および保守が安価になり、任意の数のクライアントデバイスを使用できるため、コスト削減と効率化が実現される。また、最終結果(ランキング)を裏付ける証拠の全部または一部の識別は、ほんの数秒で調べることができる。タッチポイントインスタンスに対してベストな個人/家庭、および所与の個人/家庭に対してベストなタッチポイントインスタンスを選択するための全ての候補の識別は、非常に効率的かつ正確に行われる。同様に、これらの候補の最終的なランキングも、同程度の効率と精度で生成される。
【0039】
この分散システムにより、純粋に逐次的な方法ではなく、非常に大量の生データを並列で効率的に処理できる。解決すべき特定の問題の性質は、分散ノード環境での並列処理に適しており、したがって、本発明は、実世界のビジネス環境で実用的な時間枠での実行を可能にすることによってプロセスを実行可能にするために、分散ノードクラスタを対象とする。例えば、3つの大きなファイルを取り込む必要があり、それぞれが互いに独立して処理することができると仮定する。それぞれに2時間の処理が必要な場合、逐次システムでは全てのデータを処理するのに6時間以上かかるが、分散システムでは各ファイルが並行して処理されるため2時間しかかからず、1つのファイルから別のファイルに移動するときに失われた時間はない。さらに、分散システムは、中間結果をメモリに保持するのではなく、ディスクに中間結果を保存できる所与のアルゴリズムに対して一連の独立したステップを簡単に使用することができる。ディスク容量がメモリ容量を大きく上回っているため、本システムを使用して、典型的なシリアル、シングルノードシステムで正常に実行できる発見的(やや近似の代替)アルゴリズムを作成するために変更する必要なく、計算およびメモリ集約型の正確なアルゴリズムを実装できる。したがって、このシステムと方法を使用してシステムの結果の品質が低下することはない。
【0040】
このシステムと方法で規定されたコンピューティング環境により、膨大な量の必要なデータの取り込みとその後の意思決定プロセスのための非常に効率的なコンピューティング(実行時間)が可能になる。
図13には、ランタイムに関連して示されたシステムのデータ構築には、7つの異なるコンポーネントがある。「記憶装置サイズ」という名前の列は、これらの各コンポーネントの入力用の記憶装置を識別する。この実装では、合計17.5テラバイトの入力データ記憶装置が使用されることに注意すべきである。これらのコンポーネントが単一のプロセッサで逐次に実行された場合、これらの各タスクを完了するのに必要な時間は「逐次処理を使用した期間」という名前の列に示されている(合計14時間)。ただし、このシステムの1つの実装では、上記のように分散ネットワークで並列コンピューティングが使用され、各ステップの時間は「並列処理を使用した期間」という名前の列に示されている(合計3.5時間、すなわち25%の時間)。
【0041】
このシステムは、クライアントがマーケティングの見通しを立てるのに役立つ。クライアントが個人/家庭を知っている場合、使用ケースに基づいてその個人/家庭に到達するため/ターゲット設定するための一連のベストデジタルタッチポイントを探すことができる。また、クライアントがデジタルタッチポイントを有している場合、そのデジタルタッチポイントを使用してターゲット設定または到達できる一連のベストな個人/家庭を探すことができ、これにより、市場性のある顧客を非常によく理解することができる。したがって、このシステムにより、サービスプロバイダのクライアントは、見込み客(個人または家庭)をさらにうまく識別し、セグメント化し、ターゲット設定し、およびマーケティングを行うことができる。具体的には、クライアントはターゲットとなる見込み客の理解を深めることができること、クライアントは見込み消費者の精度とリーチを改善できること、クライアントはあるタッチポイントを別のタッチポイントに置き換える効果的な能力を期待できるが、それでも既存の顧客の品質範囲を維持できること、クライアントは市場性のある顧客に到達するための効果的なデジタル手段を特定できるであろうこと、などの利点が得られる。上記および
図13に示した例で示されているように、処理時間が大幅に短縮されるため、このシステムでは、ビジネスの世界で実用的な時間枠で意思決定プロセスを行うことができる。様々な外部データソースから入ってくる更新により、基礎データが絶えず変化しているという事実は、処理時間が遅くなると、生成される時点までに出力が既に古くなっていることを意味する。一方、単純な逐次処理では、生成される時点までに最早、ビジネスに関係のない出力が生成される可能性がある。
【0042】
今日の急速に変化するデジタルの世界では、個人(CL)または家庭(HHL)が、各タッチポイントタイプごとに複数のタッチポイントを持つ複数のデジタルタッチポイントタイプに関連付けられる可能性がある。クライアントがデジタルマーケティングの観点からリーチと精度を拡大するには、タッチポイントインスタンスに関連付けることができる個人と、そのCLまたはHHLに到達するベストタッチポイントインスタンスを識別することが重要である。また、場合によっては、クライアントは、正しい最終消費者にターゲット設定し到達する可能性を高めるために使用できるベストタッチポイントタイプと、そのタッチポイントタイプに関連付けられたタッチポイントインスタンスを知ることに関心がある。したがって、このシステムは、クライアントがデジタルマーケティングの範囲と精度を拡大するのに役立つ。このシステムと方法は、コンピューティング環境の効率が劇的に向上したことを実証しており、クライアントのデジタルマーケティングキャンペーンへの集中と精度の向上により、クライアントに高い価値を提供することがさらに期待される。システムの精度、最新性、時間的安定性に焦点を当てることにより、デジタルタッチポイントの豊富な単一の視点が提供される。
【0043】
特に明記しない限り、本明細書で使用される全ての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載されるものと類似または同等の任意の方法および材料も本発明の実施または試験に使用することができるが、限定された数の例示的な方法および材料が本明細書に記載される。本明細書の発明概念から逸脱することなく、さらに多くの修正が可能であることは当業者には明らかであろう。
【0044】
本明細書で使用される全ての用語は、コンテキストと一致する可能な限り最も広い方法で解釈されるべきである。本明細書でグループ化が使用される場合、グループの全ての個々のメンバー、およびグループの可能な全ての組合せおよび部分的組合せは、個々に含まれることが意図されている。本明細書に範囲が記載されている場合、その範囲は、その範囲内の全ての部分範囲および個々の点を含むことを意図している。本明細書に引用される全ての参考文献は、本明細書の開示と矛盾しない範囲で参照により本明細書に組み込まれる。
【0045】
本発明は、例示のみを目的とし、添付の特許請求の範囲に記載されている本発明の全範囲を限定するものではない特定の好適かつ代替の実施形態を参照して説明した。