IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グーグル インコーポレイテッドの特許一覧

<>
  • 特表-分析レポートを生成するための技術 図1A
  • 特表-分析レポートを生成するための技術 図1B
  • 特表-分析レポートを生成するための技術 図1C
  • 特表-分析レポートを生成するための技術 図2
  • 特表-分析レポートを生成するための技術 図3
  • 特表-分析レポートを生成するための技術 図4
  • 特表-分析レポートを生成するための技術 図5
  • 特表-分析レポートを生成するための技術 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-07-03
(54)【発明の名称】分析レポートを生成するための技術
(51)【国際特許分類】
   G06F 16/9035 20190101AFI20250626BHJP
   G06Q 50/10 20120101ALI20250626BHJP
【FI】
G06F16/9035
G06Q50/10
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024573815
(86)(22)【出願日】2022-06-17
(85)【翻訳文提出日】2025-02-13
(86)【国際出願番号】 US2022034017
(87)【国際公開番号】W WO2023244244
(87)【国際公開日】2023-12-21
(81)【指定国・地域】
(71)【出願人】
【識別番号】502208397
【氏名又は名称】グーグル エルエルシー
【氏名又は名称原語表記】Google LLC
【住所又は居所原語表記】1600 Amphitheatre Parkway 94043 Mountain View, CA U.S.A.
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100188558
【弁理士】
【氏名又は名称】飯田 雅人
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(72)【発明者】
【氏名】マシュー・トンプソン・ウォルター
(72)【発明者】
【氏名】マイケル・ジョセフ・ヴァレンティ
(72)【発明者】
【氏名】サンダーダス・サミュエル・ドライ-ラジ
(72)【発明者】
【氏名】モシェ・リッチマン
(72)【発明者】
【氏名】マニッシュ・アグラワル
(72)【発明者】
【氏名】ジョセフ・ケリー
(72)【発明者】
【氏名】マイケル・アンドリュー・ウォレス
(72)【発明者】
【氏名】スティーヴン・ポール・ガネム
【テーマコード(参考)】
5B175
5L050
【Fターム(参考)】
5B175DA10
5B175HA01
5L050CC12
(57)【要約】
ウェブサイトのレポートを生成するための技術が本明細書に提示されている。方法は、1つまたは複数のコンピューティングデバイスによって、複数の非識別イベントにアクセスすることを含むことができる。複数の非識別イベントにおける各イベントは、1つまたは複数の特性に関連付けられ得る。さらに、方法は、機械学習済み予測モデルを使用して、イベント対ユーザの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられた疑似ユーザの数を計算することができる。さらに、方法は、複数の非識別イベントからの第1のイベントを、第1のイベントの1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てることを含むことができる。さらに、方法はウェブサイトのレポートを生成することを含み得る。レポートは、第1の疑似ユーザに割り当てられる第1のイベントから導出される情報を含む。
【特許請求の範囲】
【請求項1】
コンピュータに実装される方法であって、
1つまたは複数のコンピューティングデバイスによって、複数の非識別イベントにアクセスすることであって、前記複数の非識別イベントは、非識別イベントの総数を有し、前記複数の非識別イベントの各イベントは、1つまたは複数の特性に関連付けられる、アクセスすること、
機械学習済み予測モデルを使用して、イベント対ユーザの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられた疑似ユーザの数を計算すること、
前記機械学習済み予測モデルを使用して、前記複数の非識別イベントからの第1のイベントを、前記第1のイベントの前記1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てること、及び
ウェブサイトの分析レポートを生成することであって、前記分析レポートは、前記疑似ユーザの数から導出される情報と、前記第1の疑似ユーザに割り当てられる前記第1のイベントとを含む、生成すること、を含む、コンピュータに実装される方法。
【請求項2】
前記非識別イベントが、ユーザ識別子のないイベントに関連付けられ、前記機械学習済み予測モデルが、前記ウェブサイトをブラウズするときに識別子を受け入れた前記ウェブサイトの複数の識別ユーザに関連付けられる複数の識別イベントから導出されたデータに基づいて、前記イベント対ユーザの比率を決定する、請求項1に記載のコンピュータに実装される方法。
【請求項3】
前記複数の識別イベントから導出された前記データは、前記ウェブサイト由来の第1の当事者データである、請求項2に記載のコンピュータに実装される方法。
【請求項4】
前記第1のイベントが第1の特性に関連付けられ、前記方法が、
前記第1のイベントの前記第1の特性に基づいて、前記複数の識別ユーザから類似ユーザのサブセットを選択することであって、前記類似ユーザのサブセットは前記第1の特性に関連付けられている、選択すること、及び
前記類似ユーザのサブセットから導出されたデータに基づいて、前記イベント対ユーザの比率を更新することをさらに含む、請求項2または請求項3に記載のコンピュータに実装される方法。
【請求項5】
前記第1のイベントが、前記ウェブサイトのショッピングカートに品物を追加することであり、前記類似ユーザのサブセットが、前記ウェブサイトのショッピングカートに品物を追加したユーザである、請求項4に記載のコンピュータに実装される方法。
【請求項6】
前記第1の特性が、前記第1のイベントに関連付けられるウェブブラウザ、前記第1のイベントに関連付けられる原産国、または前記第1のイベントに関連付けられる表示の解像度である、請求項4または請求項5に記載のコンピュータに実装される方法。
【請求項7】
前記類似ユーザのサブセットが、第1の次元に関連付けられ、前記方法が、
前記機械学習済み予測モデルを使用して、前記第1の特性に基づいて、前記第1の疑似ユーザに前記第1の次元を割り当てることをさらに含み、
前記分析レポートは、前記第1の疑似ユーザに割り当てられている前記第1の次元から導出された情報をさらに含む、請求項4から6のいずれか一項に記載のコンピュータに実装される方法。
【請求項8】
前記第1の次元は、前記第1のイベントに関連付けられる最初の訪問日であり、前記第1の次元は、前記複数の識別イベントから導出された確率分布に基づいて、前記第1の疑似ユーザに割り当てられる、請求項7に記載のコンピュータに実装される方法。
【請求項9】
前記方法が、
前記機械学習済み予測モデルを使用して、イベント対セッションの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられたセッション数を計算することをさらに含み、
前記分析レポートは、前記セッション数から導出される情報をさらに含む、請求項1から8のいずれか一項に記載のコンピュータに実装される方法。
【請求項10】
前記機械学習済み予測モデルが、前記ウェブサイトをブラウズするときに識別子を受け入れた前記ウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されたデータに基づいて、前記イベント対セッションの比率を決定する、請求項9に記載のコンピュータに実装される方法。
【請求項11】
前記方法が、
前記機械学習済み予測モデルを使用して、前記第1の疑似ユーザを複数の疑似セッションに割り当てること、
前記第1のイベントの第1の特性に基づいて、前記第1のイベントを前記複数の疑似セッションからの第1の疑似セッションに割り当てること、をさらに含み、
前記分析レポートが、前記複数の疑似セッションに割り当てられている前記第1の疑似ユーザと、前記第1の疑似セッションに割り当てられている前記第1のイベントとから導出される情報をさらに含む、請求項10に記載のコンピュータに実装される方法。
【請求項12】
前記方法が、
前記ウェブサイトの構成に基づいて一連のイベントを決定すること、
前記機械学習済みモデルを使用して、前記一連のイベントに基づいて、前記複数の非識別イベントから第2のイベントを決定すること、
前記機械学習済み予測モデルを使用して、前記第2のイベントを前記第1の疑似セッションに割り当てること、をさらに含み、
前記分析レポートは、前記第1の疑似セッション及び前記第1の疑似ユーザに割り当てられている前記第2のイベントから導出された情報をさらに含む、請求項11に記載のコンピュータに実装される方法。
【請求項13】
前記第1のイベントが第2の次元に関連付けられ、前記方法が、
前記機械学習済み予測モデルを使用して、前記第2の次元を前記第1の疑似セッションに割り当てること、をさらに含み、
前記分析レポートは、前記第1の疑似セッション及び前記第1の疑似ユーザに割り当てられている前記第2の次元から導出された情報をさらに含む、請求項11または請求項12に記載のコンピュータに実装される方法。
【請求項14】
前記方法が、
クライアントコンピューティングデバイスから受信した要求に応答して、前記クライアントコンピューティングデバイスのディスプレイに前記分析レポートを提示すること、をさらに含む、請求項1から13のいずれか一項に記載のコンピュータに実装される方法。
【請求項15】
前記機械学習済み予測モデルは、時間イベントにおいて、リアルタイムで、前記第1のイベントを前記第1の疑似ユーザに割り当て、前記方法は、
前記時間イベントの後の特定の期間、追加の非識別イベントにアクセスすること、
前記追加の非識別イベントに基づいて、前記第1のイベントを第2の疑似ユーザに再度割り当てること、
前記ウェブサイトの更新されたレポートを生成することであって、前記更新されたレポートは、第2の疑似ユーザに再度割り当てられる前記第1のイベントから導出された情報を含む、生成すること、及び
前記ディスプレイに提示される前記分析レポートを前記更新されたレポートに置き換えること、をさらに含む、請求項14に記載のコンピュータに実装される方法。
【請求項16】
前記機械学習済み予測モデルが回帰モデルである、請求項1から15のいずれか一項に記載のコンピュータに実装される方法。
【請求項17】
前記方法が、
複数の日から取得されたデータに基づいて補正係数を計算すること、及び
前記補正係数に基づいて、前記複数の非識別イベントに関連付けられる疑似ユーザの数を更新すること、をさらに含む、請求項1から16のいずれか一項に記載のコンピュータに実装される方法。
【請求項18】
前記方法が、
前記補正係数に基づいて、前記複数の日の間にわたって前記ウェブサイトを訪問した一意の疑似ユーザの数を決定すること、をさらに含み、
前記分析レポートは、前記複数の日の間にわたって前記ウェブサイトを訪問した前記一意の疑似ユーザの数から導出される情報をさらに含む、請求項17に記載のコンピュータに実装される方法。
【請求項19】
コンピューティングシステムであって、
1つまたは複数のプロセッサと、
1つまたは複数の非一時的コンピュータ可読媒体とを備え、前記1つまたは複数の非一時的コンピュータ可読媒体は、
機械学習済み予測モデルであって、識別子を受け入れたウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されるデータに基づいて、イベント対ユーザの比率を生成するように構成される、機械学習済み予測モデルと、
前記1つまたは複数のプロセッサによって実行されると、前記コンピューティングシステムに動作を実行させる命令とを集合的に格納し、前記動作が、
複数の非識別イベントにアクセスすることであって、前記複数の非識別イベントは、非識別イベントの総数を有し、前記複数の非識別イベントの各イベントは、1つまたは複数の特性に関連付けられる、アクセスすること、
前記機械学習済み予測モデルを使用して、前記イベント対ユーザの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられた疑似ユーザの数を計算すること、
前記機械学習済み予測モデルを使用して、前記複数の非識別イベントからの第1のイベントを、前記第1のイベントの前記1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てること、及び
前記ウェブサイトの分析レポートを生成することであって、前記分析レポートは、前記疑似ユーザの数から導出される情報と、前記第1の疑似ユーザに割り当てられる前記第1のイベントとを含む、生成すること、を含む、コンピューティングシステム。
【請求項20】
1つまたは複数のコンピューティングデバイスによって実行されると、前記1つまたは複数のコンピューティングデバイスに動作を実行させる命令を含む1つまたは複数の非一時的コンピュータ可読媒体であって、前記動作は、
複数の非識別イベントにアクセスすることであって、前記複数の非識別イベントは、非識別イベントの総数を有し、前記複数の非識別イベントの各イベントは、1つまたは複数の特性に関連付けられる、アクセスすること、
機械学習済み予測モデルを使用して、イベント対ユーザの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられた疑似ユーザの数を計算すること、
前記機械学習済み予測モデルを使用して、前記複数の非識別イベントからの第1のイベントを、前記第1のイベントの前記1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てること、及び
ウェブサイトの分析レポートを生成することであって、前記分析レポートは、前記疑似ユーザの数から導出される情報と、前記第1の疑似ユーザに割り当てられる前記第1のイベントとを含む、生成すること、を含む、1つまたは複数の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、概して、ウェブサイトのデータ分析レポートを自動生成することに関する。より具体的には、本開示は、機械学習済み予測モデルを使用して、複数の非識別イベントに関連付けられる情報(例えば、ユーザ数、セッション数)を決定するための技法に関する。
【背景技術】
【0002】
ウェブサイトの所有者が、ユーザがどのようなコンテンツに接触したか、どのキャンペーンが最高のパフォーマンスをもたらしたか、及びコンバージョンを促進する上での重要なタッチポイントを把握することを望む場合がある。しかしながら、ウェブサイトの所有者が利用できる情報に欠落がある可能性があるため、ユーザがコンテンツアイテムまたはインプレッションとインタラクトした後にユーザが実行するアクションを理解することは困難である。さらに、ユーザは、異なるブラウザ及びデバイスを使用してウェブサイトとインターフェースすることができる。さらに、ユーザはオンラインで製品を調べてから、その製品をオフラインで購入し得る。ウェブサイトの所有者は、データに基づいた意思決定を行い、カスタマジャーニーの向上に注力する必要がある。
【発明の概要】
【0003】
本開示の実施形態の態様及び利点は、以下の説明において部分的に示され、または説明から学習することができ、または実施形態の実践を通じて学習することができる。
【0004】
本開示は、機械学習済み予測モデルを使用して、分析レポートのための分析データを生成するためのシステム及び方法を提供する。分析データは、ユーザ識別データ及び非識別イベント(例えば、安定したユーザ識別子を欠く可能性のあるイベント)を含み得る。機械学習済み予測モデルは、非識別イベントからビジネスメトリックを推定できる。ビジネスメトリックは、性別や広告キャンペーンなどの他の次元と共に、ユーザ数、セッション数を含むことができる。システムは、識別データからのメトリックを、非識別データ(例えば、非識別イベント)由来の推定値と内部で組み合わせて、ビジネスの意思決定のために使用できる完全な分析レポートを与えることができる。
【0005】
本開示の1つの例示的な態様は、コンピュータに実装される方法を対象とする。方法は、1つまたは複数のコンピューティングデバイスによって、複数の非識別イベントにアクセスすることを含むことができる。複数の非識別イベントは、非識別イベントの総数を有する。例えば、非識別イベントは、ユーザ識別子(例えば、安定したユーザ識別子など)のないイベントに関連付けることができる。複数の非識別イベントにおける各イベントは、1つまたは複数の特性に関連付けられ得る。さらに、方法は、機械学習済み予測モデルを使用して、イベント対ユーザの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられた疑似ユーザの数を計算することを含むことができる。さらに、方法は、機械学習済み予測モデルを使用して、複数の非識別イベント由来の第1のイベントを、第1のイベントの1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てることを含むことができる。さらに、方法は、ウェブサイトの分析レポートを生成することを含むことができる。分析レポートは、疑似ユーザの数及び第1の疑似ユーザに割り当てられる第1のイベントから導出される情報を含むことができる。
【0006】
本開示の他の例示的な態様は、1つまたは複数のプロセッサ、及び1つまたは複数の非一時的コンピュータ可読媒体を含むコンピューティングシステムを対象とする。1つまたは複数の非一時的コンピュータ可読媒体は、機械学習済み予測モデル、及び、1つまたは複数のプロセッサによって実行されると、コンピューティングシステムに動作を実行させる命令を集合的に格納し得る。機械学習済み予測モデルは、ウェブサイトをブラウズするときに、識別子を受け入れたウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されるデータに基づいて、イベント対ユーザの比率を生成するように構成される。動作は、複数の非識別イベントにアクセスすることを含み得る。例えば、非識別イベントは、ユーザ識別子(例えば、安定したユーザ識別子など)のないイベントに関連付けることができる。複数の非識別イベントは、非識別イベントの総数を有する。複数の非識別イベントにおける各イベントは、1つまたは複数の特性に関連付けられ得る。さらに、動作は、機械学習済み予測モデルを使用して、イベント対ユーザの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられた疑似ユーザの数を計算することを含むことができる。さらに、動作は、機械学習済み予測モデルを使用して、複数の非識別イベント由来の第1のイベントを、第1のイベントの1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てることを含むことができる。さらに、動作は、ウェブサイトの分析レポートを生成することを含むことができる。分析レポートは、疑似ユーザの数及び第1の疑似ユーザに割り当てられる第1のイベントから導出される情報を含むことができる。いくつかの実施態様では、システムの処理パラメータは、生成された分析レポートから得たデータに基づいて調整され得る。
【0007】
本開示のさらに他の例示的な態様は、1つまたは複数のコンピューティングデバイスによって実行されると、1つまたは複数のコンピューティングデバイスに動作を実行させる命令を含む1つまたは複数の非一時的コンピュータ可読媒体を対象とする。動作は、複数の非識別イベントにアクセスすることを含み得る。例えば、非識別イベントは、ユーザ識別子(例えば、安定したユーザ識別子など)のないイベントに関連付けることができる。複数の非識別イベントは、非識別イベントの総数を有する。複数の非識別イベントにおける各イベントは、1つまたは複数の特性に関連付けられる。さらに、動作は、機械学習済み予測モデルを使用して、イベント対ユーザの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられた疑似ユーザの数を計算することを含むことができる。さらに、動作は、機械学習済み予測モデルを使用して、複数の非識別イベント由来の第1のイベントを、第1のイベントの1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てることを含むことができる。さらに、動作は、ウェブサイトの分析レポートを生成することを含むことができる。分析レポートは、疑似ユーザの数及び第1の疑似ユーザに割り当てられる第1のイベントから導出される情報を含むことができる。
【0008】
いくつかの実施態様では、機械学習済み予測モデルは、ウェブサイトをブラウズするときに、識別子を受け入れたウェブサイトの識別ユーザに関連付けられた複数の識別イベントから導出されたデータに基づいて、イベント対ユーザの比率を決定できる。いくつかの例では、複数の識別イベントから導出されたデータは、ウェブサイトからの第1の当事者データである場合がある。
【0009】
いくつかの実施態様では、第1のイベントは第1の特性に関連付けることができる。さらに、方法は、第1のイベントの第1の特性に基づいて、複数の識別ユーザから類似ユーザのサブセットを選択することをさらに含むことができる。類似ユーザのサブセットは、第1の特性に関連付けられ得る。さらに、方法は、類似ユーザのサブセットから導出されたデータに基づいて、イベント対ユーザの比率を更新することを含むことができる。
【0010】
いくつかの実施態様では、第1のイベントは、ウェブサイトのショッピングカートに品物を追加することであり得る。さらに、類似ユーザのサブセットは、ウェブサイトのショッピングカートに、やはり品物を追加したユーザであり得る。
【0011】
いくつかの実施態様では、第1の特性は、第1のイベントに関連付けられるウェブブラウザであり得る。あるいは、いくつかの実施態様では、第1の特性は、第1のイベントに関連付けられる原産国であり得る。あるいは、いくつかの実施態様では、第1の特性は、第1のイベントに関連付けられる表示の解像度であり得る。
【0012】
いくつかの実施態様では、類似ユーザのサブセットは、第1の次元に関連付けられ得る。さらに、方法は、機械学習済み予測モデルを使用して、第1の特性に基づいて、第1の次元を第1の疑似ユーザに割り当てることをさらに含むことができる。さらに、分析レポートは、第1の疑似ユーザに割り当てられる第1の次元から導出された情報をさらに含むことができる。
【0013】
いくつかの実施態様では、第1の次元は、第1のイベントに関連付けられる最初の訪問日とすることができる。さらに、第1の次元は、複数の識別イベントから導出された確率分布に基づいて、第1の疑似ユーザに割り当てることができる。いくつかの実施態様では、第1の次元は、第1の疑似ユーザに関連付けられた性別であることができる。
【0014】
いくつかの実施態様では、方法は、機械学習済み予測モデルを使用して、イベント対セッションの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられたセッション数を計算することをさらに含むことができる。さらに、分析レポートは、セッション数から導出された情報をさらに含むことができる。
【0015】
いくつかの実施態様では、機械学習済み予測モデルは、ウェブサイトをブラウズするときに、識別子を受け入れたウェブサイトの識別ユーザに関連付けられた複数の識別イベントから導出されたデータに基づいて、イベント対セッションの比率を決定できる。
【0016】
いくつかの実施態様では、方法は、機械学習済み予測モデルを使用して、第1の疑似ユーザを複数の疑似セッションに割り当てることをさらに含むことができる。さらに、方法は、第1のイベントの第1の特性に基づいて、複数の疑似セッション由来の第1の疑似セッションに第1のイベントを割り当てることを含むことができる。さらに、分析レポートは、複数の疑似セッションに割り当てられている第1の疑似ユーザ、及び第1の疑似セッションに割り当てられている第1のイベントから導出された情報を含むことができる。
【0017】
いくつかの実施態様では、方法は、ウェブサイトの構成に基づいて一連のイベントを決定することをさらに含むことができる。さらに、方法は、機械学習済みモデルを使用して、一連のイベントに基づいて、複数の非識別イベント由来の第2のイベントを決定することを含むことができる。さらに、方法は、機械学習済み予測モデルを使用して、第2のイベントを第1の疑似セッションに割り当てることを含むことができる。分析レポートは、第1の疑似セッション及び第1の疑似ユーザの両方に割り当てられている第2のイベントから導出された情報をさらに含むことができる。
【0018】
いくつかの実施態様では、第1のイベントは第2の次元に関連付けることができ、方法は、機械学習済み予測モデルを使用して、第2の次元を第1の疑似セッションに割り当てることをさらに含むことができる。分析レポートは、第1の疑似セッション及び第1の疑似ユーザの両方に割り当てられている第2の次元から導出された情報をさらに含むことができる。
【0019】
いくつかの実施態様では、方法は、クライアントコンピューティングデバイスから受信した要求に応答して、クライアントコンピューティングデバイスのディスプレイに分析レポートを提示することをさらに含むことができる。
【0020】
いくつかの実施態様では、機械学習済み予測モデルは、時間イベントにおいて、リアルタイムで、第1のイベントを第1の疑似ユーザに割り当てることができる。さらに、方法は、時間イベントの後の特定の期間、追加の非識別イベントにアクセスすることを含むことができる。さらに、方法は、追加の非識別イベントに基づいて、第1のイベントを第2の疑似ユーザに再度割り当てることを含むことができる。さらに、方法は、ウェブサイトの更新されたレポートを生成することを含むことができる。更新されたレポートは、第2の疑似ユーザに再度割り当てられる第1のイベントから導出された情報を含むことができる。その後、方法は、ディスプレイに提示される分析レポートを更新されたレポートに置き換えることを含むことができる。
【0021】
いくつかの実施態様では、機械学習済み予測モデルは、回帰モデルであり得る。
【0022】
いくつかの実施態様では、方法は、複数の日から取得されたデータに基づいて補正係数を計算することをさらに含むことができる。さらに、方法は、補正係数に基づいて、複数の非識別イベントに関連付けられる疑似ユーザの数を更新することを含むことができる。さらに、方法は、補正係数に基づいて、複数の日の間にわたってウェブサイトを訪問した一意の疑似ユーザの数を決定することを含むことができる。さらに、分析レポートは、複数の日の間にわたってウェブサイトを訪問した一意の疑似ユーザの数から導出される情報を含むことができる。
【0023】
本開示の他の態様は、様々なシステム、装置、非一時的コンピュータ可読媒体、ユーザインターフェース、及び電子デバイスを対象とする。
【0024】
本開示の様々な実施形態のこれら及び他の特徴、態様及び利点は、以下の発明を実施するための形態及び添付の特許請求の範囲を参照して、よりよく理解されるようになる。本明細書に組み込まれ、本明細書の一部を構成する添付の図面は、本開示の例示的な実施形態を例示し、発明を実施するための形態と併せて、関連する原理を説明する役目を果たしている。
【0025】
当業者を対象にした実施形態の詳細な説明は、添付の図面を参照する本明細書で示されている。
【図面の簡単な説明】
【0026】
図1A】本開示の例示的な実施形態による、例示的なコンピューティングシステムのブロック図である。
図1B】本開示の例示的な実施形態による、例示的なコンピューティングデバイスのブロック図である。
図1C】本開示の例示的な実施形態による、例示的なコンピューティングデバイスのブロック図である。
図2】本開示の例示的な実施形態による、レポート用のデータを決定するための例示的なモデルのブロック図である。
図3】本開示の例示的な実施形態による、ウェブサイトの分析レポートを生成するための例のフローチャート図である。
図4】本開示の例示的な実施形態による、イベントをセッションに割り当てるためのフローチャート図である。
図5】本開示の例示的な実施形態による、リアルタイムでレポートを提示し、その後追加情報に基づいてレポートを更新するためのフローチャートである。
図6】本開示の例示的な実施形態による、第1のレポート及び第2のレポートを提示するグラフィカルユーザインターフェースの図である。
【発明を実施するための形態】
【0027】
本開示の態様による例示的な実施形態は、ウェブサイトの分析レポートを生成するための機械学習済み予測モデルを有するコンピューティングデバイスに関する。レポートは、識別イベント及び非識別イベントに基づいて生成され得る。識別イベントは、オンラインでのアクティビティを第1の当事者データとしてウェブサイトのパブリッシャに送信することに同意したウェブサイトのユーザに関連付けられ得る。非識別イベントは、ユーザ識別子を欠いているイベントに関連付けることができる。同意モードは、イベントがユーザ識別子を欠く場合がある例である。いくつかの例では、ユーザ識別子は安定したユーザ識別子である。安定した(例えば、恒久的な)ユーザ識別子は、同意の場合にブラウザセッション内でのイベント全体にわたって同じユーザ識別子、プラットフォーム制約の場合は複数の日にちにわたるイベントに対して同じユーザ識別子、または複数のデバイス(例えば、デスクトップ、モバイルなど)にわたるイベントに対して同じユーザ識別子であり得る。いくつかの実施態様では、機械学習済み予測モデルは、識別子なしで分析データを取得し、行動データを推定するためのモデリングを実行することができる。識別子のない分析データは、顧客(例えば、ウェブサイトまたはモバイルアプリケーションの管理者)から取得された第1の当事者データであり得る。例えば、機械学習済み予測モデルは、ユーザ識別子を許容する類似ユーザの行動に基づいて、疑似ユーザに関連付けられる非識別イベントをモデル化することができる。機械学習済み予測モデルをトレーニングするために使用されるトレーニングデータは、識別イベントから導出されたデータに基づいている。本明細書に記載の技術は、機械学習済み予測モデルを使用することによって、非識別イベントに関連付けられる分析データを予測することができる。機械学習済み予測モデルは、非識別イベントから、複数の次元にわたる複数のメトリックを推定して、分析レポートを生成することができる。
【0028】
いくつかの実施態様では、システムは、確率的ハードコード化アルゴリズムと機械学習済み予測とのハイブリッドを利用することができる。例えば、システムは、機械学習済み予測モデルを利用して、非識別イベントを疑似ユーザ、疑似セッション、及び観察不可能な次元に割り当てることができる。さらに、機械学習済み予測モデルは、非識別イベントを割り当てるために、本明細書に記載の比率及びアルゴリズムを決定することができる。いくつかの例では、比率及びハードコーディングアルゴリズムは、機械学習済み予測モデルによって事前計算され得る。両方のタイプのアプローチ(例えば、リアルタイムでの決定及び事前に計算された比率/アルゴリズム)を使用して、機械学習済み予測モデルのタスクが簡素化され、モデルをより小さく、トレーニングしやすく、より速くトレーニングすることが可能になる。さらに、両方のタイプのアプローチを使用することにより、システムは、非識別イベントから、リアルタイムで分析レポートを生成することが可能になる。いくつかの実施態様では、システムの処理パラメータは、生成された分析レポートから得たデータに基づいて調整され得る。
【0029】
機械学習済み予測モデルは、膨大な量の履歴データを分析し、主要なデータポイント間の相関関係及び傾向を識別し、それらの洞察を使用して行動に関する正確な予測を行うことによって、分析データを生成することができる。機械学習済み予測モデルは、ユーザ識別子のないイベントの欠落を埋めることができる。機械学習済みモデルは、ウェブサイトによって取得された第1の当事者データを活用して、カスタマジャーニーの欠落を埋め、洞察を決定することができる。第1の当事者データは、非識別イベント(例えば、非ラベル付きデータ、ユーザ識別子を欠いているデータ)に関する情報を決定する(例えば、推定する、予測する)ために利用され得るラベル付きデータ(例えば、観察可能な測定)を含むことができる。例えば、ユーザがデバイス間で、オンラインからオフラインへ、ブラウザの制限、及び様々な同意の選択に移行すると、カスタマジャーニーの欠落が発生する可能性がある。
【0030】
本明細書で説明されるシステム及び方法は、非識別イベント(例えば、非ラベル付きデータ)の行動モデリングの予測を改善することができる。行動モデリングは、非識別イベント及び観察不可能な次元と関連付けられる可能性があり、これらは、機械学習モデルをトレーニングするためのグラウンドトゥルースを有さない場合がある。グラウンドトゥルースは、当該のユースケースに関連付けられる関連データセットによって反映される、機械学習モデルのターゲットである問題の実際の性質を指す。行動モデリングは、ユーザがウェブサイトで、またはモバイルアプリケーションの中で行い得る変換を超えたアクションに関する洞察を提供できる。機械学習済み予測モデルは、識別子を有するイベントから導出されたデータを利用して、識別子を有さないイベントをモデル化し、分析することができる。例えば、本明細書に説明する技術は、ウェブサイトはユーザとセッションとを関連付け、「私の最後のキャンペーンで何人の新規ユーザを獲得したのでしょうか?」といった質問に答えることを可能にする。
【0031】
いくつかの実施態様では、企業は、識別子のないイベントの数に比例する、分析レポーティング由来のデータの損失を経験する場合がある。これにより、測定が不完全なシナリオが発生し、企業が以下のような質問に対する答えを得ることができなくなる可能性がある。
a) 1日あたりの有効なユーザ数は何人なのでしょうか?
b) 私の最後のキャンペーンで何人の新規ユーザを獲得したのでしょうか?
c) 私のウェブサイトにアクセスしてから実際に購入するまでのユーザジャーニーはどのようなものでしたか?
d) 私のサイトの訪問者のうち、英国と比較して、ドイツを本拠としている訪問者は何人いますか?
e) モバイル訪問者とウェブ訪問者との間のユーザの行動の違いは何でしょうか?
【0032】
例えば、1日あたりの有効なユーザの正確なカウントを有することは、ウェブサイト及びモバイルアプリケーションのクラッシュを減らすために処理、ネットワーク帯域幅、及び他のコンピューティングリソースがどれほど必要であり得るか決定するために、システムにより使用され得る。いくつかの実施態様では、図3~5に記載の方法は、生成された分析レポートからのデータに基づいて処理パラメータを調整することをさらに含むことができる。
【0033】
いくつかの実施態様では、機械学習済み予測モデルは、ユーザ識別子を備えるイベントに基づいてユーザ識別子を備えていないイベントをモデル化することにより、データの欠落を埋めようとする。モデル化に使用されるトレーニングデータは、モデルをトレーニングできる特性に関連付けられた、同意したユーザデータに基づくことができる。特性は、ウェブサイト及び/またはモバイルアプリケーションに関する分析レポートとデータのセットであってもよい。生成及び提示されるレポート及びユーザインターフェースは、クライアントが表示するために選択した特性の種類によって異なり得る。
【0034】
例えば、機械学習済み予測モデルは、識別子(例えば、分析クッキー、ユーザID)が入手できない場合に観察不可能であり得る1日あたりの有効なユーザ及びコンバージョンの比率などの、ユーザ及びセッションのメトリックに基づいて、データを推定する。
【0035】
機械学習済み予測モデルは、非識別イベントのモデル化されたデータ(例えば、非ラベル付きデータ)を生成できる。さらに、ウェブサイトから取得された第1の当事者データは、ラベル付きデータと呼ばれ得る。例えば、ラベル付きデータは、ユーザがクライアントのウェブサイトを訪問し、分析クッキーに同意したときに取得されたデータを含む。さらに、ユーザが識別子を使用してパーソナライズすることに同意した場合、データはラベル付きデータと呼ばれる。いくつかの例では、ユーザは、第1の当事者のウェブサイトまたはモバイルアプリケーションに署名することによって、パーソナリゼーションに対して同意を与えることができる。
【0036】
あるいは、ユーザが分析クッキーまたは同等のモバイルアプリケーション識別子の使用に同意しない場合、イベントはユーザ識別子に関連付けられず、データは非識別イベント(例えば、非ラベル付きデータ)と呼ばれる。例えば、システムが10個のページビューイベントを収集する場合、システムは、それらのイベントが10人のユーザに関連付けられているのか、それとも1人のユーザだけに関連付けられているのかを観察して報告することができない。代わりに、システムは、機械学習済み予測モデルを使用して、許容される分析クッキーまたは同等のモバイルアプリケーション識別子を受け入れた類似したユーザの行動に基づいて、非識別イベントを分析することができる。
【0037】
いくつかの実施形態では、本開示の例示的な態様によるシステム及び方法は、ラベル(例えば、識別イベント)及び非ラベル付きデータ(例えば、非識別イベント)に基づいて、機械学習済みモデルフレームワークを使用して分析データ及び/またはレポートを生成することで、上記の利点を得ることができる。例えば、機械学習済みモデルフレームワークは、ラベル付きデータを使用してトレーニングできる予測モデルを含むことができる。このようにして、例えば、機械学習済みモデルフレームワークは、非ラベル付きデータを使用して予測及び分析データを生成するために、予測モデルを使用することを学習することができる。
【0038】
いくつかの実施形態では、本開示の例示的な態様による例示的なシステム及び方法は、メモリ(例えば、データベース)のデータ構造の格納、管理、検索、及び相互参照の改善を提供することができる。例えば、例示的なデータベースは、様々な非識別イベント(例えば、非ラベル付きデータ)を記述する実世界のデータ構造を含み得る。他のデータベースはまた、識別イベント(例えば、ラベル付きデータ)を記述するデータ構造を含み得る。ラベル付きデータに基づいて、本開示による例示的なコンピューティングシステムは、中間のデータ構造セット(例えば、機械学習済み予測モデルの学習済みパラメータのセット)を学習して、非識別イベントを疑似ユーザ、疑似セッション、及び観察不可能な次元にマッピングすることができる。いくつかの実施形態では、例えば、中間のデータ構造セットは、データベースの非ラベル付きデータと1つまたは複数の変換ラベルとの関連付けを提供するように機能して、非ラベル付きデータの改善された格納及び/または取得(例えば、1つまたは複数のラベルに基づくインデックス付けされたストレージ、1つまたは複数のラベルに基づいた検索など)を可能にし得る。
【0039】
いくつかの実施形態では、例えば、中間のデータ構造セットは、非識別イベントに対するクエリの処理及び実行を提供するように機能し得る。例えば、クエリは、非識別イベントに関連付けられる分析データを取得するためのクエリを含み得る。非識別イベントは、分析データ及び/またはレポートを迅速に生成するために、疑似ユーザ、疑似セッション、及び観察不可能な次元に割り当てられ得る。しかしながら、有利なことに、中間のデータ構造セットは、非識別イベントを疑似ユーザ、疑似セッション、及び観察不可能な次元に機能マッピングし得る。このようにすると、例えば、本開示の態様による例示的なシステム及び方法は、そのようなクエリが他の方法では(例えば、データ不良または通信が制限されている実施態様のため)利用できない場合でも、入力データセットに対するクエリの実行と処理を提供することができる。
【0040】
いくつかの実施形態では、本開示の例示的な態様による例示的なシステム及び方法は、非識別イベント(例えば、非ラベル付きデータ)の中から関連性を決定することを提供することができる。例えば、関連性は、非識別イベントデータにおいてラベル付けがないか、または不完全なラベル付けの次元に沿って決定され得る。例えば、時間的関連性は、データが時間的関係の完全な(またはいずれかの)ラベル付けを欠いている場合でも、非識別イベントデータに対して決定され得る。例えば、いくつかの実施形態では、非識別イベントデータは、イベントに関連付けられるタイムスタンプ(例えば、日付、時刻、日付と時刻)を含むことができるが、非識別イベントデータは、予測モデルが一連のイベントがある可能性があると決定したときでさえ、後続のいずれかのイベントのタイムスタンプを欠く場合がある。
【0041】
いくつかの実施態様では、機械学習済み予測モデルは、モデルのパラメータのうちの1つまたは複数を修正することによって更新され得る。例えば、システムは、保留検証を実行することによってモデルの正確さをチェックし、保留検証に基づいてモデルのパラメータ(複数可)を修正できる。保留検証は、推定ユーザデータを、モデルトレーニングから保留された観察されたユーザデータの一部と比較することによって、モデルの精度を維持することができ、その情報は、モデルを調整する(例えば、1つまたは複数のパラメータを修正する)ために使用される。さらに、システムは、データに影響を与え得る変更をクライアントに伝達できる。
【0042】
本開示のシステム及び方法は、いくつかの技術的効果及び利点を提供する。本開示の態様は、リアルタイムでレポートを生成するための処理時間を短縮することにより、機械学習予測モデルに対するいくつかの技術的改善を提供することができる。異なるタイプの比率を利用してユーザ及びセッションの数を決定することにより、システムは、レポート用のデータを生成するために必要なモデリングの量を削減することができる。一部が事前計算できる場合において、異なる種類の比率を用いてモデルをトレーニング及び/または実行することにより、モデルをトレーニング及び/または実行するための計算リソース(例えばプロセッサ時間、メモリ使用量など)を削減することができる。本明細書に記載されるシステム及び方法は、レポートを生成する処理速度を向上させ、また、モデリングを実行してレポート用のデータを生成するために必要なコンピューティングリソースを減らすことができる。その結果、システムは、予測データの精度を維持しながら、最先端のパフォーマンスを達成できる。さらに、本明細書に記載されるシステム及び方法は、生成された分析レポートからのデータに基づいて、システムの処理パラメータを調整することができる。
【0043】
ここで図面を参照して、本開示の例示的な実施形態がさらに詳細に議論される。
【0044】
複数の日の補正の実施態様
疑似ユーザ識別子は1日だけ持続し得るが、複数の日の補正の実施態様では、同意したユーザ識別子が経時的に持続し得ることを所与とすると、システムは、複数の日にちにわたってアクセスされたより正確なデータを使用することで、分析レポートを更新(例えば、補正など)することができる。したがって、システムが任意の日付の範囲にわたって同意したユーザの一意の数を決定及び報告すると、システムは単にその時間窓での一意の識別子の数をカウントすることができる。
【0045】
例えば、2日前にウェブサイトを訪問した100人の同意したユーザ、前日にウェブサイトを訪問した120人の同意したユーザ、及び両日とも訪問した30人のユーザがいる場合、2日間の間に一意の同意したユーザの数は(100+120-30)=190となる。
【0046】
いくつかの実施態様では、システムは、疑似ユーザに割り当てられた識別子が1日の境界を越えて持続することを可能にしない。そのため、いくつかの例では、システムは、任意の日付の範囲にわたって疑似ユーザの超過カウントを調整するための補正係数(「複数の日の補正」とも呼ばれる)を含む。補正係数は、日付の範囲にわたる1日の同意したユーザに対する、日付の範囲にわたる一意の同意したユーザの比率とすることができる。
【0047】
上の例を使用すると、2日間にわたって、補正係数は、(100+120-30)/(100+120)=190/220=0.86となる。
【0048】
したがって、システムが、2日前に220人の疑似ユーザが、昨日250人の疑似ユーザが存在していると決定した場合、2日間にわたって重複排除した疑似ユーザの補正された数は、(220+250)*0.86=404になる。したがって、システムは、2日間の間に404人の一意の疑似ユーザが存在すると決定することができる。
【0049】
さらに、重複排除プロセスの後、システムは、両日ともウェブサイトを訪問した疑似ユーザ46人(1日目に220人の疑似ユーザ+2日目に250人の疑似ユーザ-両日間で404人の一意の疑似ユーザ)が存在すると決定することができる。
【0050】
いくつかの実施態様では、報告が顧客によって生成されると、複数の日の補正がクエリ実行時に適用され得る(例えば、システムは、レポートが要求されたときに補正を計算することができ、システムのバックエンドに補正係数を格納しない)。
【0051】
いくつかの実施態様では、方法は、複数の日から取得されたデータに基づいて補正係数を計算することをさらに含むことができる。さらに、方法は、補正係数に基づいて、複数の非識別イベントに関連付けられる疑似ユーザの数を更新することを含むことができる。さらに、方法は、補正係数に基づいて、複数の日の間にわたってウェブサイトを訪問した一意の疑似ユーザの数を決定することを含むことができる。さらに、分析レポートは、複数の日の間にわたってウェブサイトを訪問した一意の疑似ユーザの数から導出される情報を含むことができる。
【0052】
例示的なデバイス及びシステム
図1Aは、本開示の例示的な実施形態による、画像編集を実行する例示的なコンピューティングシステム100のブロック図を示す。システム100は、ネットワーク180を介して通信可能に結合されたユーザコンピューティングデバイス102と、サーバコンピューティングシステム130と、トレーニングコンピューティングシステム150とを含む。
【0053】
ユーザコンピューティングデバイス102は、例えば、パーソナルコンピューティングデバイス(例えば、ラップトップもしくはデスクトップ)、モバイルコンピューティングデバイス(例えば、スマートフォンもしくはタブレット)、ゲームコンソールもしくはコントローラ、ウェアラブルコンピューティングデバイス、組み込みコンピューティングデバイス、または任意の他のタイプのコンピューティングデバイスなど、いずれかのタイプのコンピューティングデバイスであることができる。
【0054】
コンピューティングデバイス102は、1つまたは複数のプロセッサ112と、メモリ114とを含む。1つまたは複数のプロセッサ112は、任意の適切な処理デバイス(例えば、プロセッサコア、マイクロプロセッサ、ASIC、FPGA、コントローラ、マイクロコントローラなど)である場合があり、また、1つのプロセッサ、または動作可能に接続された複数のプロセッサである場合がある。メモリ114は、RAM、ROM、EEPROM、EPROM、フラッシュメモリデバイス、磁気ディスクなど、1つまたは複数の非一時的なコンピュータ可読記憶媒体、及びそれらの組み合わせを含むことができる。メモリ114は、ユーザコンピューティングデバイス102に動作を実行させるためにプロセッサ112によって実行されるデータ116及び命令118を格納することができる。
【0055】
いくつかの実施態様では、ユーザコンピューティングデバイス102は、1つまたは複数のモデル120を格納する、または含むことができる。例えば、モデル120(例えば、予測モデル)は、ニューラルネットワーク(例えば、ディープニューラルネットワーク)などの様々な機械学習済みモデル、または非線形モデル及び/または線形モデルを含む他のタイプの機械学習済みモデルであることができる、またはその他の方法でそれらを含むことができる。ニューラルネットワークは、フィードフォワードニューラルネットワーク、再帰型ニューラルネットワーク(例えば、長・短期記憶再帰型ニューラルネットワーク)、畳み込みニューラルネットワーク、または他の形式のニューラルネットワークを含むことができる。例示的なモデル120は、図2~5を参照して説明される。
【0056】
いくつかの実施態様では、1つまたは複数のモデル120は、ネットワーク180を介してサーバコンピューティングシステム130から受信され、ユーザコンピューティングデバイスメモリ114に格納され、次に、1つまたは複数のプロセッサ112によって使用される、またはその他の方法で実装され得る。いくつかの実施態様では、ユーザコンピューティングデバイス102は、単一モデル120の複数の並列インスタンスを実装することができる。
【0057】
より具体的には、モデル120は、モデルを最適化するためにモデルのパラメータをトレーニングするよう、トレーニングデータセット162でトレーニングコンピューティングシステム150を使用してトレーニングされ得る。トレーニングコンピューティングシステム162は、観察されたデータに依存して、トレーニングモデルに効率及び精度を加え得る。さらに、トレーニングデータ162はまた、第1の当事者データであり得る。さらに、トレーニングデータ162は、ユーザがクライアントのウェブサイトを訪れ、分析クッキーに同意したときに取得されたデータを含み得る。さらに、トレーニングデータ162は、ユーザが識別子を受け入れるときに取得されたデータを含み得る。
【0058】
追加的、または代替的に、1つまたは複数のモデル140は、クライアント-サーバ関係に従ってユーザコンピューティングデバイス102と通信するサーバコンピューティングシステム130に含まれることができ、またはその他の方法で格納されることができ、それによって実装され得る。例えば、モデル140は、ウェブサービス(例えば、ウェブサイト)の一部としてサーバコンピューティングシステム140によって実装できる。よって、1つまたは複数のモデル120は、ユーザコンピューティングデバイス102において格納及び実装され得、及び/または、1つまたは複数のモデル140は、サーバコンピューティングシステム130において格納及び実装され得る。
【0059】
また、ユーザコンピューティングデバイス102は、ユーザ入力を受信する1つまたは複数のユーザ入力コンポーネント122を含むことができる。例えば、ユーザ入力コンポーネント122は、ユーザ入力オブジェクト(例えば、指またはスタイラス)のタッチに感応するタッチ感応コンポーネント(例えば、タッチ感応表示画面またはタッチパッド)であることができる。タッチ感応コンポーネントは、仮想キーボードを実施する役割を果たすことができる。他の例示的なユーザ入力コンポーネントは、マイクロフォン、従来のキーボード、またはユーザがユーザ入力を提供できる他の手段を含む。
【0060】
サーバコンピューティングシステム130は、1つまたは複数のプロセッサ132と、メモリ134とを含む。1つまたは複数のプロセッサ132は、任意の適切な処理デバイス(例えば、プロセッサコア、マイクロプロセッサ、ASIC、FPGA、コントローラ、マイクロコントローラなど)である場合があり、かつ、1つのプロセッサ、または動作可能に接続された複数のプロセッサである場合がある。メモリ134は、RAM、ROM、EEPROM、EPROM、フラッシュメモリデバイス、磁気ディスクなど、1つまたは複数の非一時的なコンピュータ可読記憶媒体、及びそれらの組み合わせを含むことができる。メモリ134は、サーバコンピューティングシステム130に動作を実行させるためにプロセッサ132によって実行されるデータ136及び命令138を格納することができる。
【0061】
いくつかの実施態様では、サーバコンピューティングシステム130は、1つまたは複数のサーバコンピューティングデバイスを含むか、またはその他の方法で実施される。サーバコンピューティングシステム130が複数のサーバコンピューティングデバイスを含む場合、そのようなサーバコンピューティングデバイスは、シーケンシャルコンピューティングアーキテクチャ、パラレルコンピューティングアーキテクチャ、またはそれらの何らかの組み合わせに従って動作できる。
【0062】
上記のように、サーバコンピューティングシステム130は、1つまたは複数の機械学習済みモデル140を格納する、またはさもなければ含むことができる。例えば、モデル140は、様々な機械学習済みモデルであるか、またはそれ以外の場合、様々な機械学習済みモデルを含むことができる。例示的な機械学習済みモデルは、ニューラルネットワークまたはその他の多層非線形モデルを含む。例示的なニューラルネットワークは、フィードフォワードニューラルネットワーク、ディープニューラルネットワーク、再帰型ニューラルネットワーク、及び畳み込みニューラルネットワークを含む。例示的なモデル140は、図2~6を参照して説明される。
【0063】
ユーザコンピューティングデバイス102及び/またはサーバコンピューティングシステム130は、ネットワーク180を介して通信可能に結合されるトレーニングコンピューティングシステム150とのインタラクションによってモデル120及び/または140をトレーニングすることができる。トレーニングコンピューティングシステム150は、サーバコンピューティングシステム130とは別個であることができ、または、サーバコンピューティングシステム130の一部であることができる。
【0064】
トレーニングコンピューティングシステム150は、1つまたは複数のプロセッサ152及びメモリ154を含む。1つまたは複数のプロセッサ152は、任意の適切な処理デバイス(例えば、プロセッサコア、マイクロプロセッサ、ASIC、FPGA、コントローラ、マイクロコントローラなど)である場合があり、また、1つのプロセッサ、または動作可能に接続された複数のプロセッサである場合がある。メモリ154は、RAM、ROM、EEPROM、EPROM、フラッシュメモリデバイス、磁気ディスクなど、1つまたは複数の非一時的なコンピュータ可読記憶媒体、及びそれらの組み合わせを含むことができる。メモリ154は、トレーニングコンピューティングシステム150に動作を実行させるためにプロセッサ152によって実行されるデータ156及び命令158を格納することができる。いくつかの実施態様では、トレーニングコンピューティングシステム150は、1つまたは複数のサーバコンピューティングデバイスを含むか、またはそうでなければ、1つまたは複数のサーバコンピューティングデバイスによって実装される。
【0065】
トレーニングコンピューティングシステム150は、例えば誤差逆伝播などの様々なトレーニングまたはラーニング技術を使用して、ユーザのコンピューティングデバイス102及び/またはサーバコンピューティングシステム130に格納された機械学習済みモデル120及び/または140をトレーニングするモデルトレーナ160を含むことができる。例えば、損失関数は、(例えば、損失関数の勾配に基づいて)モデル(複数可)の1つまたは複数のパラメータを更新するためにモデル(複数可)を通して逆伝搬できる。平均二乗誤差、尤度損失、交差エントロピー損失、ヒンジ損失、及び/または様々な他の損失関数など、様々な損失関数を使用できる。勾配降下法は、いくつかのトレーニング反復にわたってパラメータを反復的に更新するために使用できる。
【0066】
いくつかの実施態様では、誤差逆伝播を実行することは、経時的に切り捨てられた逆伝播を実行することを含んでもよい。モデルトレーナ160は、トレーニングされるモデルの汎化能力を改善するために、いくつかの汎化技術(例えば、荷重減衰、ドロップアウトなど)を実行できる。
【0067】
特に、モデルトレーナ160は、トレーニングデータ162のセットに基づいて画像編集モデル120及び/または140をトレーニングすることができる。トレーニングデータ162は、例えば、観察データ及び/または第1の当事者データを含むことができる。
【0068】
いくつかの実施態様では、ユーザが同意を提供した場合、ユーザコンピューティングデバイス102によってトレーニング例を提供することができる。したがって、そのような実施態様では、ユーザコンピューティングデバイス102に提供されたモデル120を、トレーニングコンピューティングシステム150によって、ユーザコンピューティングデバイス102から受信されたユーザ固有データに対してトレーニングすることができる。いくつかの実施態様では、このプロセスはモデルのパーソナライズと呼ばれ得る。
【0069】
モデルトレーナ160は、所望の機能を提供するために利用されるコンピュータロジックを含む。モデルトレーナ160を、ハードウェア、ファームウェア、及び/または汎用プロセッサを制御するソフトウェアにおいて実装することができる。例えば、いくつかの実施態様では、モデルトレーナ160は、ストレージデバイスに記憶され、メモリにロードされ、1つまたは複数のプロセッサによって実行されるプログラムファイルを含む。他の実施態様では、モデルトレーナ160は、RAM、ハードディスク、または光もしくは磁気媒体などの有形のコンピュータ可読記憶媒体に記憶されるコンピュータ実行可能命令の1つまたは複数のセットを含む。
【0070】
ネットワーク180は、ローカルエリアネットワーク(例えば、イントラネット)、ワイドエリアネットワーク(例えば、インターネット)、またはそれらの何らかの組み合わせなどの、いずれかのタイプの通信ネットワークであり得、いずれかの数の有線リンクまたは無線リンクを含むことができる。一般に、ネットワーク180を介した通信は、多種多様な通信プロトコル(例えば、TCP/IP、HTTP、SMTP、FTP)、符号化またはフォーマット(例えば、HTML、XML)、及び/または保護スキーム(例えば、VPN、セキュアHTTP、SSL)を用いて、任意のタイプの有線リンクまたは無線リンクを介して行われ得る。
【0071】
図1Aは、本開示を実装するために使用することができる1つの例示的なコンピューティングシステムを例示する。他のコンピューティングシステムも同様に使用することができる。例えば、いくつかの実施態様では、ユーザコンピューティングデバイス102は、モデルトレーナ160と、トレーニングデータセット162とを含むことができる。そのような実施態様では、モデル120は、ユーザコンピューティングデバイス102においてローカルでトレーニング及び使用の両方を行うことができる。そのような実施態様の一部では、ユーザコンピューティングデバイス102は、ユーザ固有データに基づいてモデル120を個別化するモデルトレーナ160を実装することができる。
【0072】
図1Bは、本開示の例示的な実施形態により実行する例示的なコンピューティングデバイス10のブロック図を示す。コンピューティングデバイス10は、ユーザコンピューティングデバイスまたはサーバコンピューティングデバイスであることができる。
【0073】
コンピューティングデバイス10は、いくつかのアプリケーション(例えば、アプリケーション1~N)を含む。各アプリケーションは、独自の機械学習ライブラリと、機械学習済みモデル(複数可)とを含む。例えば、各々のアプリケーションは、機械学習済みモデルを含むことができる。例示的なアプリケーションは、テキストメッセージングアプリケーション、電子メールアプリケーション、ディクテーションアプリケーション、仮想キーボードアプリケーション、ブラウザアプリケーションなどを含む。
【0074】
図1Bに例示されるように、各々のアプリケーションは、例えば1つまたは複数のセンサ、コンテキストマネージャ、デバイス状態コンポーネント、及び/または追加のコンポーネントなど、コンピューティングデバイスのいくつかの他のコンポーネントと通信することができる。いくつかの実施態様では、各アプリケーションは、API(例えば、公開API)を使用して各デバイスコンポーネントと通信できる。いくつかの実施態様では、各アプリケーションによって使用されるAPIは、そのアプリケーションに固有である。
【0075】
図1Cは、本開示の例示的な実施形態により実行する例示的なコンピューティングデバイス50のブロック図を表す。コンピューティングデバイス50は、ユーザコンピューティングデバイスまたはサーバコンピューティングデバイスであることができる。
【0076】
コンピューティングデバイス50は、いくつかのウェブサイト及び/またはモバイルアプリケーション(例えば、アプリケーション1~N)を含む。各々のウェブサイト及び/またはモバイルアプリケーションは、中央インテリジェンス層と通信し得る。例示的なウェブサイトは、コマース(例えば、ショッピング)ウェブサイト、メディアストリーミングウェブサイト、ソーシャルネットワークウェブサイトなどを含むことができる。例示的なアプリケーションは、テキストメッセージングアプリケーション、電子メールアプリケーション、ディクテーションアプリケーション、仮想キーボードアプリケーション、ブラウザアプリケーションなどを含む。いくつかの実施態様では、各々のアプリケーションは、API(例えば、すべてのアプリケーションにわたる共通API)を使用して中央インテリジェンス層(及びその中に格納されたモデル(複数可))と通信することができる。
【0077】
中央インテリジェンス層は、複数の機械学習済みモデルを含む。例えば、図1Cに示すように、それぞれの機械学習済みモデル(例えば、モデル)は、ウェブサイト及び/またはアプリケーションごとに提供することができ、中央インテリジェンス層によって管理できる。他の実施態様では、2つ以上のウェブサイト及び/またはモバイアプリケーションは、単一の機械学習済みモデルを共有することができる。例えば、いくつかの実施態様では、中央インテリジェンス層は、ウェブサイト及び/またはアプリケーションのすべてに対して単一のモデル(例えば、単一のモデル)を提供できる。いくつかの実施態様では、中央インテリジェンス層は、コンピューティングデバイス50のオペレーティングシステム内に含まれ、またはそうでなければ、コンピューティングデバイス50のオペレーティングシステムによって実装される。
【0078】
中央インテリジェンス層は中央デバイスデータ層と通信することができる。中央デバイスデータ層は、コンピューティングデバイス50のデータの集中型リポジトリであることができる。図1Cに示されるように、中央デバイスデータ層は、例えば、1つまたは複数のセンサ、コンテキストマネージャ、デバイス状態コンポーネント、及び/または追加コンポーネントなど、コンピューティングデバイスの他のいくつかのコンポーネントと通信できる。いくつかの実施態様では、中央デバイスデータ層は、API(例えば、プライベートAPI)を使用して各デバイスコンポーネントと通信することができる。
【0079】
例示的なモデル配置
図2は、本開示の例示的な実施形態による、レポート用の分析データを決定するための例示的な機械学習済み予測モデル200のブロック図を示す。いくつかの実施態様では、コンピューティングシステム(ユーザコンピューティングデバイス102、サーバコンピューティングデバイス130、トレーニングコンピューティングデバイス150、コンピューティングデバイス10、コンピューティングデバイス50)は、機械学習済み予測モデル200を含むことができる。
【0080】
いくつかの実施態様では、機械学習済み予測モデル200は、4層モデルであり得る。機械学習済み予測モデル200は、ウェブサイトの複数の非識別イベントに関連付けられる疑似ユーザ(例えば、第1のユーザ210)を決定するための第1の層のモデルを含むことができる。疑似ユーザは、非識別イベントに関連付けられるユーザであり得る。例えば、システムが10個のページビューイベントを収集する場合、システムは、10個のページビューイベントに関連付けられる疑似ユーザの数(すなわち、1~10人)を決定することができる。
【0081】
いくつかの実施態様では、機械学習済み予測モデル200は、ウェブサイトの複数の非識別イベントに関連付けられるセッション(例えば、第1のセッション220、第2のセッション222)を決定するために、第2の層のモデルを含むことができる。疑似ユーザは、1つまたは複数のセッションに関連付けられ得る。例えば、図2に示すように、第1のユーザ210は、第1のセッション220及び第2のセッション222に関連付けられ得る。10個のページビューイベントの例を続けると、システムは10個のページビューイベントに関連付けられたセッション数を決定することができる。いくつかの例では、1人の疑似ユーザは複数のセッションを有し得るので、疑似ユーザの数はセッションの数より少ない。セッションは、時にユーザトラフィックと呼ばれることがある。
【0082】
いくつかの実施態様では、機械学習済み予測モデル200は、非識別イベント(例えば、第1のイベント230、第2のイベント232、第3のイベント234)を疑似ユーザ及び/またはセッションに割り当てるために、第3の層のモデルを含むことができる。例えば、図2に示すように、第1のイベント230、第2のイベント232、及び第3のイベント234は、第1のセッション220と第1のユーザとの両方に割り当てられる。図3~5は、本開示の例示的な実施形態による、非識別イベントを疑似ユーザ及び/またはセッションに割り当てるための方法を説明する。
【0083】
いくつかの実施態様では、機械学習済み予測モデル200は、観察不可能な次元(例えば、最初の訪問日、1日あたりのウェブサイト訪問回数、前のイベント、連続するイベント、性別)を疑似ユーザ及び/または、セッションに割り当てるべく第4の層モデルを含み得る。観察不可能な次元は、疑似ユーザまたはセッションに既に割り当てられているイベントに関連付けられる特性に基づいて割り当てられ得る。いくつかの例では、システムは、システムが疑似ユーザまたはセッションに割り当てることができる数百の観察不可能な次元を含むことができる。例えば、図2に示すように、観察不可能な次元250は、第1のセッション220及び第1のユーザの両方に割り当てられる。図3~5は、本開示の例示的な実施形態による、観察不可能な次元を疑似ユーザ及び/またはセッションに割り当てるための方法を説明する。
【0084】
例示的な方法
図3は、本開示の例示的な実施形態による、ウェブサイトの分析レポートを生成するための例のフローチャート図を示す。図3は、例示及び説明の目的で特定の順序で実行されるステップを示しているが、本開示の方法は、特に示された順序または配置に限定されない。方法300の様々なステップは、本開示の範囲から逸脱することなく、様々な方法で省略、再配置、結合、及び/または適合できる。
【0085】
いくつかの実施態様では、方法300は、コンピューティングデバイス102、サーバコンピューティングシステム130、トレーニングコンピューティングシステム150、コンピューティングデバイス10、コンピューティングデバイス50などのコンピューティングシステムによって実行することができる。さらに、コンピューティングシステムは、方法300を実行するために、1つまたは複数のプロセッサ(例えば、プロセッサ(複数可)112、132、152)を使用することができる。
【0086】
302で、コンピューティングシステムは、複数の非識別イベントにアクセスすることができる。例えば、非識別イベントは、ユーザ識別子(例えば、安定したユーザ識別子)のないイベントに関連付けることができる。いくつかの例では、ユーザが分析クッキーまたは同等のモバイルアプリケーション識別子の使用に同意しない場合、イベントはユーザ識別子なしであり得る。複数の非識別イベントは、非識別イベントの総数を有する。複数の非識別イベントにおける各イベントは、1つまたは複数の特性に関連付けられ得る。
【0087】
いくつかの例では、機械学習済み予測モデルは、回帰モデルであり得る。さらに、例示的な機械学習済み予測モデルは、ニューラルネットワークまたはその他の多層非線形モデルを含む。例示的なニューラルネットワークは、フィードフォワードニューラルネットワーク、ディープニューラルネットワーク、再帰型ニューラルネットワーク、及び畳み込みニューラルネットワークを含む。
【0088】
いくつかの例では、機械学習済み予測モデルは、例えば、誤差の逆伝播など、様々なトレーニングまたは学習技術を用いて、トレーニングされ得る。例えば、損失関数は、(例えば、損失関数の勾配に基づいて)モデル(複数可)の1つまたは複数のパラメータを更新するためにモデル(複数可)を通して逆伝搬できる。平均二乗誤差、尤度損失、交差エントロピー損失、ヒンジ損失、及び/または様々な他の損失関数など、様々な損失関数を使用できる。勾配降下法は、いくつかのトレーニング反復にわたってパラメータを反復的に更新するために使用できる。
【0089】
304では、コンピューティングシステムは、機械学習済み予測モデルを使用して、イベント対ユーザの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられた疑似ユーザの数を計算することができる。いくつかの例では、コンピューティングシステムは、機械学習済み予測モデルを使用して、イベント対ユーザの比率に基づいて、複数の非識別イベントに関連付けられた疑似ユーザの数を計算することができる。
【0090】
いくつかの実施態様では、機械学習済み予測モデルは、識別子を受け入れたウェブサイトの識別ユーザに関連付けられた複数の識別イベントから導出されたデータに基づいて、イベント対ユーザの比率を決定できる。例えば、ユーザは、ウェブサイトをブラウズするときに、分析クッキーを受け入れることができる。他の例では、ユーザは、モバイルアプリケーションをインターフェースするときまたはブラウズするときにユーザ識別子を受け入れることができる。いくつかの例では、複数の識別イベントから導出されたデータは、ウェブサイトまたはモバイルアプリケーションからの第1の当事者データである可能性がある。
【0091】
306で、コンピューティングシステムは、機械学習済み予測モデルを使用して、複数の非識別イベントからの第1のイベントを、第1のイベントの1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てる。
【0092】
いくつかの実施態様では、第1のイベントは第1の特性に関連付けることができる。さらに、コンピューティングシステムは、第1のイベントの第1の特性に基づいて、複数の識別ユーザから類似ユーザのサブセットを選択できる。類似ユーザのサブセットは、第1の特性に関連付けられ得る。さらに、コンピューティングシステムは、類似ユーザのサブセットから導出されたデータに基づいて、イベント対ユーザの比率を更新することができる。更新されたイベントの比率は、コンピューティングシステムによって利用されて、動作304で疑似ユーザの数を決定することができる。
【0093】
いくつかの実施態様では、第1の特性は第1のイベントに関連付けられるウェブブラウザである。あるいは、いくつかの実施態様では、第1の特性は、第1のイベントに関連付けられる原産国であり得る。あるいは、いくつかの実施態様では、第1の特性は、第1のイベントに関連付けられる表示の解像度である。機械学習済み予測モデルは、第1の特性を有する複数のイベントを疑似ユーザ及び/または疑似セッションに割り当てることができる。例えば、特定の表示の解像度を有する複数のイベントは、第1の疑似ユーザに割り当てることができ、異なる表示の解像度を有する他のイベントは、ユーザがセッションの間に異なる表示の解像度を有さないので、第1の疑似ユーザに割り当てられることからフィルタリングされる。
【0094】
いくつかの例では、第1のイベントは、ウェブサイトのショッピングカートに品物を追加することであり得、同様のユーザのサブセットは、ウェブサイトのショッピングカートに品物を追加したユーザである。いくつかの例では、第1のイベントは、ウェブサイトのショッピングカートの品物を購入することであり得、同様のユーザのサブセットは、ウェブサイトのカートの品物を購入したユーザである。機械学習済み予測モデルは、第1のイベントと前の非識別イベントとの間の相関を予測するためにセッションについてのジャーニーを決定し得る。セッションのジャーニーは、第1のイベントと後続の非識別イベントとの間の相関関係を予測するために利用され得る。例えば、セッションのジャーニーは、製品をクリックすること、次に、その製品をショッピングカートに追加すること、及びその後、ショッピングカートから製品を購入することを含むことができる。さらに、イベントは、限定されないが、クレジットカード情報の入力、配送先アドレスの入力、及び製品の購入に関連付けられる他のイベントなど、ジャーニーに関連付けられ得る。
【0095】
いくつかの実施態様では、類似ユーザのサブセットは、第1の次元に関連付けられ得る。例えば、第1の次元は、最初の訪問日などの観察できない次元であり得る。他の例では、第1の次元は、第1の疑似ユーザに関連付けられる性別であってもよい。さらに、コンピューティングシステムは、機械学習済み予測モデルを使用して、第1の特性に基づいて、第1の次元を第1の疑似ユーザに割り当てることができる。いくつかの例では、第1の次元は、第1のイベントに関連付けられる最初の訪問日であってもよく、第1の次元は、複数の識別イベントから導出された確率分布に基づいて、第1の疑似ユーザに割り当てられる。例えば、確率分布は、最初の訪問日が特定の日数だけ前であった可能性が高いことを示すことができ、その日を第1の疑似ユーザの最初の訪問日として割り当てることができる。さらに、分析レポートでは、第1の疑似ユーザに割り当てられている第1の次元から導出された情報を提供できる。
【0096】
308で、コンピューティングシステムは、ウェブサイトの分析レポートを生成することができる。いくつかの例では、コンピューティングシステムは、モバイルアプリケーションの分析レポートを生成することができる。分析レポートは、疑似ユーザの数及び第1の疑似ユーザに割り当てられる第1のイベントから導出される情報を含むことができる。いくつかの例では、コンピューティングシステムは、モバイルアプリケーションの分析レポートを生成することができる。
【0097】
いくつかの実施態様では、方法は、複数の日から取得されたデータに基づいて補正係数を計算することをさらに含むことができる。さらに、方法は、補正係数に基づいて、複数の非識別イベントに関連付けられる疑似ユーザの数を更新することを含むことができる。さらに、方法は、補正係数に基づいて、複数の日の間にわたってウェブサイトを訪問した一意の疑似ユーザの数を決定することを含むことができる。さらに、分析レポートは、複数の日の間にわたってウェブサイトを訪問した一意の疑似ユーザの数から導出される情報を含むことができる。
【0098】
いくつかの実施態様では、方法は、308で生成された分析レポートから導出されたデータに基づいて、処理パラメータ(例えば、処理能力、メモリの容量、ネットワーク帯域幅)を調整することをさらに含む。
【0099】
図4は、本開示の例示的な実施形態による、イベントをセッションに割り当てるためのフローチャート図を示す。図4は、例示及び説明の目的で特定の順序で実行されるステップを示しているが、本開示の方法は、特に示された順序または配置に限定されない。方法400の様々なステップは、本開示の範囲から逸脱することなく、様々な方法で省略、再配置、結合、及び/または適合できる。
【0100】
いくつかの実施態様では、動作方法400は、方法300及び/または方法500の動作と組み合わせることができる。例えば、動作402は、方法300の動作304の後に実行することができる。
【0101】
402で、コンピューティングシステムは、機械学習済み予測モデルを使用して、識別子を受け入れたウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されるデータに基づいて、イベント対セッションの比率を決定することができる。
【0102】
404では、コンピューティングシステムは、機械学習済み予測モデルを使用して、イベント対セッションの比率及び非識別イベントの総数に基づいて、複数の非識別イベントに関連付けられたセッション数を計算することができる。さらに、308で生成される分析レポートは、セッション数から導出された情報を含み得る。
【0103】
406で、コンピューティングシステムは、機械学習済み予測モデルを使用して、第1の疑似ユーザを複数の疑似セッションに割り当てることができる。
【0104】
408で、コンピューティングシステムは、第1のイベントの第1の特性に基づいて、複数の疑似セッション由来の第1の疑似セッションに第1のイベントを割り当てることができる。さらに、308で生成される分析レポートは、複数の疑似セッションに割り当てられている第1の疑似ユーザ、及び第1の疑似セッションに割り当てられている第1のイベントから導出される情報を含み得る。
【0105】
410で、コンピューティングシステムは、ウェブサイトの構成に基づいて一連のイベントを決定することができる。例えば、一連のイベントは、ホームページでユーザがジャーニーを開始(すなわち、第1のイベント)し、次に、ユーザが製品ページをクリックし(すなわち、第2のイベント)、次にユーザが製品のページから製品を選択してショッピングカートに追加(すなわち、第3のイベント)し、次にユーザがチェックアウトページをクリックして選択した製品を購入(すなわち、第4のイベント)し、次にユーザがクレジットカード及び配送情報を入力して、選択した製品の購入を終了(例えば、第5のイベント)するセッションを含むことができる。
【0106】
412で、コンピューティングシステムは、機械学習済みモデルを使用して、一連のイベントに基づいて、複数の非識別イベントから第2のイベントを決定することができる。製品の購入の例を続けると、コンピューティングシステムは、第1及び第2のイベントの両方を第1の疑似ユーザに割り当てることができ、第1のイベントは、ウェブサイトのホームページを開くことであり、第2のイベントは、ウェブサイトの製品のページを開くことである。
【0107】
414で、コンピューティングシステムは、機械学習済み予測モデルを使用して、第2のイベントを第1の疑似セッションに割り当てることができる。製品の購入の例を続けると、コンピューティングシステムは、第1のイベント及び第2のイベントの両方を第1の疑似セッションに割り当てることができ、ホームページを開くことが第1のイベントであり、製品のページを開くことが第2のイベントである。さらに、308で生成される分析レポートは、第1の疑似セッションと第1の疑似ユーザの両方に割り当てられている第2のイベントから導出される情報を含み得る。
【0108】
いくつかの実施態様では、第1のイベントは第2の次元に関連付けることができる。さらに、コンピューティングシステムは、機械学習済み予測モデルを使用して、第2の次元を第1の疑似セッションに割り当てることができる。さらに、308で生成される分析レポートは、第1の疑似セッションと第1の疑似ユーザの両方に割り当てられている第2の次元から導出される情報を含み得る。
【0109】
図5は、本開示の例示的な実施形態による、リアルタイムでレポートを提示し、その後追加情報に基づいてレポートを更新するためのフローチャート図を示す。図5は、例示及び説明の目的で特定の順序で実行されるステップを示しているが、本開示の方法は、特に示された順序または配置に限定されない。方法500の様々なステップは、本開示の範囲から逸脱することなく、様々な方法で省略、再配置、結合、及び/または適合できる。
【0110】
いくつかの実施態様では、動作方法400は、方法300及び/または方法400の動作と組み合わせることができる。例えば、動作502は、方法300の動作308の後に実行することができる。
【0111】
502で、コンピューティングシステムは、クライアントコンピューティングデバイスから受信した要求に応答して、クライアントコンピューティングデバイスのディスプレイに分析レポートを提示することができる。いくつかの例では、分析レポートは、リアルタイムまたはほぼリアルタイムで存在する。分析レポートの提示は、時間イベントのときであってよい。さらに、機械学習済み予測モデルは、時間イベントにおいてリアルタイムで第1のイベントを第1の疑似ユーザに割り当てることができる。
【0112】
504で、コンピューティングシステムは、時間イベントの後の特定の期間、追加の非識別イベントにアクセスすることができる。例えば、コンピューティングシステムは、特定の期間(例えば、12時間、24時間)、非識別イベントのすべてにアクセスできる。追加の非識別イベントは、機械学習済み予測モデルの予測を向上させることができる。
【0113】
506で、コンピューティングシステムは、追加の非識別イベントに基づいて、第1のイベントを第2の疑似ユーザに再度割り当てることができる。例えば、機械学習済みモデルは、リアルタイムで取得される限られた情報を用いて、第1のイベントに関してリアルタイムで第1の予測を行うことができる。さらに、機械学習済みモデルは、特定の期間にキャプチャされた追加の非識別イベントに基づいて、時間イベントの後に、より正確な予測を行うことができる。
【0114】
508で、コンピューティングシステムは、ウェブサイトの更新されたレポートを生成することができる。例えば、更新されたレポートは、第2の疑似ユーザに再度割り当てられる第1のイベントから導出された情報を含むことができる。
【0115】
510で、コンピューティングシステムは、502でディスプレイに提示される分析レポートを、更新されるレポートに置き換えることができる。
【0116】
図6は、本開示の例示的な実施形態による、第1のレポート及び第2のレポートを提示するグラフィカルユーザインターフェース610の図解600を示す。いくつかの実施態様では、グラフィカルユーザインターフェース610は、ウェブサイト所有者が、利用可能な第1の当事者データに基づいて第1のレポート620を見る、及び/または機械学習済み予測モデルによって生成される第2のレポート630を見るオプションを提示し得る。第1のレポート620は、識別子を受け入れたウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されたデータに基づいて生成され得る。第2のレポート630は、図3~5で説明した技法に基づいて生成することができる。図6に示すように、システムは、モデル化されたデータと観察されたデータとを、結合または分離されたレポートで、シームレスに統合できる。
【0117】
追加の開示
上述に加え、本明細書で説明されるシステム、プログラム、または機能がユーザ情報(例えば、ユーザのソーシャルネットワーク、ソーシャルアクション、または活動、職業、ユーザの好み、またはユーザの現在の位置に関する情報)の収集を可能にし得る場合、及び可能にし得るときの両方について、またサーバからユーザにコンテンツまたは通信を送信するかについて、ユーザが選択することを可能にする制御をユーザに提供し得る。さらに、特定のデータは、保存または使用される前に、個人を特定できる情報が削除されるように、1つまたは複数の方法で処理され得る。例えば、ユーザの識別情報は、ユーザ個人を特定できる情報を決定できないように処理され得るか、または、位置情報が得られる(市、郵便番号、または州レベルなど)場合、ユーザの特定の場所を決定することができないように、ユーザの地理的位置が一般化され得る。したがって、ユーザは、ユーザについてどのような情報が収集されるか、その情報がどのように使用されるか、及びユーザにどのような情報が提供されるかを制御し得る。
【0118】
本明細書で説明する技術は、サーバ、データベース、ソフトウェアアプリケーション、及び他のコンピュータベースのシステム、ならびに実行されるアクション及びそのようなシステムに送信される情報及びそのようなシステムから送信される情報を示す。コンピュータベースのシステムに固有の柔軟性により、コンポーネント間のタスク及び機能の多種多様な実現可能な構成、組み合わせ、分割が可能になる。例えば、本明細書で論じるプロセスは、単一のデバイスまたはコンポーネント、あるいは組み合わせて作動する複数のデバイスまたはコンポーネントを使用して実装できる。データベース及びアプリケーションは、単一のシステムに実装し得るか、または複数のシステムに分散し得る。分散されたコンポーネントは、順次または並列に動作できる。
【0119】
本開示の主題は、その様々に具体的で例示的な実施形態について詳細に説明されてきたが、それぞれの例は、説明するために提供されており、本開示を限定するものではない。当業者は、前述の理解に達すると、そのような実施形態への変更、変形、及び均等物を容易に作り出すことができる。したがって、主題の開示は、当業者に容易にとって明らかであろうような、本主題へのそのような修正、変形、及び/または追加を含めることを排除しない。例えば、一実施形態の一部として図示または説明されている特徴を他の実施形態で使用して、さらに他の実施形態を生み出し得る。したがって、本開示は、そのような変更、変形、及び均等物を網羅することを意図している。
図1A
図1B
図1C
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2025-02-13
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コンピュータに実装される方法であって、
1つまたは複数のコンピューティングデバイスによって、複数の非識別イベントにアクセスすることであって、前記複数の非識別イベントは、非識別イベントの総数を有し、前記複数の非識別イベントの各イベントは、1つまたは複数の特性に関連付けられる、アクセスすること、
機械学習済み予測モデルを使用して、イベント対ユーザの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられた疑似ユーザの数を計算すること、
前記機械学習済み予測モデルを使用して、前記複数の非識別イベントからの第1のイベントを、前記第1のイベントの前記1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てること、及び
ウェブサイトの分析レポートを生成することであって、前記分析レポートは、前記疑似ユーザの数から導出される情報と、前記第1の疑似ユーザに割り当てられる前記第1のイベントとを含む、生成すること、を含む、コンピュータに実装される方法。
【請求項2】
前記非識別イベントが、ユーザ識別子のないイベントに関連付けられ、前記機械学習済み予測モデルが、前記ウェブサイトをブラウズするときに識別子を受け入れた前記ウェブサイトの複数の識別ユーザに関連付けられる複数の識別イベントから導出されたデータに基づいて、前記イベント対ユーザの比率を決定する、請求項1に記載のコンピュータに実装される方法。
【請求項3】
前記複数の識別イベントから導出された前記データは、前記ウェブサイト由来の第1の当事者データである、請求項2に記載のコンピュータに実装される方法。
【請求項4】
前記第1のイベントが第1の特性に関連付けられ、前記方法が、
前記第1のイベントの前記第1の特性に基づいて、前記複数の識別ユーザから類似ユーザのサブセットを選択することであって、前記類似ユーザのサブセットは前記第1の特性に関連付けられている、選択すること、及び
前記類似ユーザのサブセットから導出されたデータに基づいて、前記イベント対ユーザの比率を更新することをさらに含む、請求項2に記載のコンピュータに実装される方法。
【請求項5】
前記第1のイベントが、前記ウェブサイトのショッピングカートに品物を追加することであり、前記類似ユーザのサブセットが、前記ウェブサイトのショッピングカートに品物を追加したユーザである、請求項4に記載のコンピュータに実装される方法。
【請求項6】
前記第1の特性が、前記第1のイベントに関連付けられるウェブブラウザ、前記第1のイベントに関連付けられる原産国、または前記第1のイベントに関連付けられる表示の解像度である、請求項4に記載のコンピュータに実装される方法。
【請求項7】
前記類似ユーザのサブセットが、第1の次元に関連付けられ、前記方法が、
前記機械学習済み予測モデルを使用して、前記第1の特性に基づいて、前記第1の疑似ユーザに前記第1の次元を割り当てることをさらに含み、
前記分析レポートは、前記第1の疑似ユーザに割り当てられている前記第1の次元から導出された情報をさらに含む、請求項4に記載のコンピュータに実装される方法。
【請求項8】
前記第1の次元は、前記第1のイベントに関連付けられる最初の訪問日であり、前記第1の次元は、前記複数の識別イベントから導出された確率分布に基づいて、前記第1の疑似ユーザに割り当てられる、請求項7に記載のコンピュータに実装される方法。
【請求項9】
前記方法が、
前記機械学習済み予測モデルを使用して、イベント対セッションの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられたセッション数を計算することをさらに含み、
前記分析レポートは、前記セッション数から導出される情報をさらに含む、請求項1に記載のコンピュータに実装される方法。
【請求項10】
前記機械学習済み予測モデルが、前記ウェブサイトをブラウズするときに識別子を受け入れた前記ウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されたデータに基づいて、前記イベント対セッションの比率を決定する、請求項9に記載のコンピュータに実装される方法。
【請求項11】
前記方法が、
前記機械学習済み予測モデルを使用して、前記第1の疑似ユーザを複数の疑似セッションに割り当てること、
前記第1のイベントの第1の特性に基づいて、前記第1のイベントを前記複数の疑似セッションからの第1の疑似セッションに割り当てること、をさらに含み、
前記分析レポートが、前記複数の疑似セッションに割り当てられている前記第1の疑似ユーザと、前記第1の疑似セッションに割り当てられている前記第1のイベントとから導出される情報をさらに含む、請求項10に記載のコンピュータに実装される方法。
【請求項12】
前記方法が、
前記ウェブサイトの構成に基づいて一連のイベントを決定すること、
前記機械学習済みモデルを使用して、前記一連のイベントに基づいて、前記複数の非識別イベントから第2のイベントを決定すること、
前記機械学習済み予測モデルを使用して、前記第2のイベントを前記第1の疑似セッションに割り当てること、をさらに含み、
前記分析レポートは、前記第1の疑似セッション及び前記第1の疑似ユーザに割り当てられている前記第2のイベントから導出された情報をさらに含む、請求項11に記載のコンピュータに実装される方法。
【請求項13】
前記第1のイベントが第2の次元に関連付けられ、前記方法が、
前記機械学習済み予測モデルを使用して、前記第2の次元を前記第1の疑似セッションに割り当てること、をさらに含み、
前記分析レポートは、前記第1の疑似セッション及び前記第1の疑似ユーザに割り当てられている前記第2の次元から導出された情報をさらに含む、請求項11に記載のコンピュータに実装される方法。
【請求項14】
前記方法が、
クライアントコンピューティングデバイスから受信した要求に応答して、前記クライアントコンピューティングデバイスのディスプレイに前記分析レポートを提示すること、をさらに含む、請求項1に記載のコンピュータに実装される方法。
【請求項15】
前記機械学習済み予測モデルは、時間イベントにおいて、リアルタイムで、前記第1のイベントを前記第1の疑似ユーザに割り当て、前記方法は、
前記時間イベントの後の特定の期間、追加の非識別イベントにアクセスすること、
前記追加の非識別イベントに基づいて、前記第1のイベントを第2の疑似ユーザに再度割り当てること、
前記ウェブサイトの更新されたレポートを生成することであって、前記更新されたレポートは、第2の疑似ユーザに再度割り当てられる前記第1のイベントから導出された情報を含む、生成すること、及び
前記ディスプレイに提示される前記分析レポートを前記更新されたレポートに置き換えること、をさらに含む、請求項14に記載のコンピュータに実装される方法。
【請求項16】
前記機械学習済み予測モデルが回帰モデルである、請求項1に記載のコンピュータに実装される方法。
【請求項17】
前記方法が、
複数の日から取得されたデータに基づいて補正係数を計算すること、及び
前記補正係数に基づいて、前記複数の非識別イベントに関連付けられる疑似ユーザの数を更新すること、をさらに含む、請求項1から16のいずれか一項に記載のコンピュータに実装される方法。
【請求項18】
前記方法が、
前記補正係数に基づいて、前記複数の日の間にわたって前記ウェブサイトを訪問した一意の疑似ユーザの数を決定すること、をさらに含み、
前記分析レポートは、前記複数の日の間にわたって前記ウェブサイトを訪問した前記一意の疑似ユーザの数から導出される情報をさらに含む、請求項17に記載のコンピュータに実装される方法。
【請求項19】
コンピューティングシステムであって、
1つまたは複数のプロセッサと、
1つまたは複数の非一時的コンピュータ可読記憶媒体とを備え、前記1つまたは複数の非一時的コンピュータ可読記憶媒体は、
機械学習済み予測モデルであって、識別子を受け入れたウェブサイトの識別ユーザに関連付けられる複数の識別イベントから導出されるデータに基づいて、イベント対ユーザの比率を生成するように構成される、機械学習済み予測モデルと、
前記1つまたは複数のプロセッサによって実行されると、前記コンピューティングシステムに動作を実行させる命令とを集合的に格納し、前記動作が、
複数の非識別イベントにアクセスすることであって、前記複数の非識別イベントは、非識別イベントの総数を有し、前記複数の非識別イベントの各イベントは、1つまたは複数の特性に関連付けられる、アクセスすること、
前記機械学習済み予測モデルを使用して、前記イベント対ユーザの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられた疑似ユーザの数を計算すること、
前記機械学習済み予測モデルを使用して、前記複数の非識別イベントからの第1のイベントを、前記第1のイベントの前記1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てること、及び
前記ウェブサイトの分析レポートを生成することであって、前記分析レポートは、前記疑似ユーザの数から導出される情報と、前記第1の疑似ユーザに割り当てられる前記第1のイベントとを含む、生成すること、を含む、コンピューティングシステム。
【請求項20】
1つまたは複数のコンピューティングデバイスによって実行されると、前記1つまたは複数のコンピューティングデバイスに動作を実行させる命令を含む1つまたは複数の非一時的コンピュータ可読記憶媒体であって、前記動作は、
複数の非識別イベントにアクセスすることであって、前記複数の非識別イベントは、非識別イベントの総数を有し、前記複数の非識別イベントの各イベントは、1つまたは複数の特性に関連付けられる、アクセスすること、
機械学習済み予測モデルを使用して、イベント対ユーザの比率及び前記非識別イベントの総数に基づいて、前記複数の非識別イベントに関連付けられた疑似ユーザの数を計算すること、
前記機械学習済み予測モデルを使用して、前記複数の非識別イベントからの第1のイベントを、前記第1のイベントの前記1つまたは複数の特性に基づいて、第1の疑似ユーザに割り当てること、及び
ウェブサイトの分析レポートを生成することであって、前記分析レポートは、前記疑似ユーザの数から導出される情報と、前記第1の疑似ユーザに割り当てられる前記第1のイベントとを含む、生成すること、を含む、1つまたは複数の非一時的コンピュータ可読記憶媒体。
【国際調査報告】