IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カーベーセー グローバル サービシズ エンフェーの特許一覧

特許7658907改善されたコンピュータ実装の事象予測および情報提供
<>
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図1
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図2A
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図2B
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図3
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図4
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図5
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図6
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図7
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図8
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図9
  • 特許-改善されたコンピュータ実装の事象予測および情報提供 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-31
(45)【発行日】2025-04-08
(54)【発明の名称】改善されたコンピュータ実装の事象予測および情報提供
(51)【国際特許分類】
   G06N 5/04 20230101AFI20250401BHJP
   G06Q 10/04 20230101ALI20250401BHJP
   G06F 11/30 20060101ALI20250401BHJP
【FI】
G06N5/04
G06Q10/04
G06F11/30 165
【請求項の数】 10
(21)【出願番号】P 2021544208
(86)(22)【出願日】2020-02-21
(65)【公表番号】
(43)【公表日】2022-04-06
(86)【国際出願番号】 EP2020054634
(87)【国際公開番号】W WO2020169807
(87)【国際公開日】2020-08-27
【審査請求日】2022-12-20
(31)【優先権主張番号】19158636.1
(32)【優先日】2019-02-21
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】523037141
【氏名又は名称】カーベーセー グローバル サービシズ エンフェー
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(72)【発明者】
【氏名】バリー ヘイコック
(72)【発明者】
【氏名】フロイド ジャクソン
【審査官】児玉 崇晶
(56)【参考文献】
【文献】特開2017-129891(JP,A)
【文献】特開2015-106334(JP,A)
【文献】特開2013-117926(JP,A)
【文献】特開平10-240770(JP,A)
【文献】米国特許出願公開第2017/0140285(US,A1)
【文献】Pablo Gay et al.,Sequential learning for case-based pattern recognition in complex event domains,Proceedings of the 16th UK Workshop on Case-Based Reasoning,2011年12月,pages 46-55,http://ceur-ws.org/Vol-829/paper6.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G06N 5/04
G06Q 10/04
G06F 11/30
(57)【特許請求の範囲】
【請求項1】
事象予測および情報提供のためのコンピュータにより実行される方法であって、前記方法は、
複数のエンティティのグループの各エンティティについて、1つ又は複数の事象を取得するステップであって、各事象はタイムスタンプ及びカテゴリの集合のカテゴリと関連付けられる、ステップと、
前記グループの各エンティティについて、平均事象頻度を計算するステップと、
前記計算された平均事象頻度に基づいて、エンティティのアクティブな下位グループを決定するステップであって、前記エンティティのアクティブな下位グループが、前記計算された平均事象頻度が所定の頻度のカットオフ値より大きいか、または小さくない前記エンティティを含む、ステップと、
前記アクティブな下位グループ内の前記エンティティについて取得される前記事象内の前記カテゴリの集合の前記カテゴリの発生度に基づいて、前記カテゴリの集合からモデルカテゴリの部分集合を決定するステップであって、
前記カテゴリの集合の各カテゴリについて、前記アクティブな下位グループ内の前記エンティティについて取得される前記事象に基づいて、カテゴリの平均頻度を計算するステップと、
前記カテゴリの集合に含まれるカテゴリのうち、前記計算されたカテゴリの平均頻度が上位の所定の数のカテゴリ、または所定の割合のカテゴリに基づいて、前記モデルカテゴリの部分集合を決定するステップと、を含む、ステップ、と、
前記アクティブな下位グループ内の前記エンティティについて取得される前記事象内の前記モデルカテゴリの部分集合の前記カテゴリの最初の発生までの期間に基づいて、前記モデルカテゴリの部分集合から対象カテゴリの部分集合を決定するステップであって、
前記モデルカテゴリの部分集合の各カテゴリについて、前記エンティティのアクティブな下位グループにわたって前記カテゴリと関連付けられた事象の最初の発生までの平均期間を計算するステップと、
前記モデルカテゴリの部分集合に含まれるカテゴリのうち、決定された前記平均期間が下位である所定の数のカテゴリ、または所定の割合のカテゴリに基づいて、前記対象カテゴリの部分集合を決定するステップと、を含む、ステップと、
前記エンティティについて取得される前記事象が、前記対象カテゴリの部分集合の各カテゴリについて、前記カテゴリと関連付けられた少なくとも1つの事象を含む、前記複数のエンティティのグループの各エンティティについて、前記エンティティについて取得される前記事象内の前記モデルカテゴリの部分集合の前記カテゴリの時間順の発生に基づいて、前記モデルカテゴリの部分集合のカテゴリの配列を決定するステップであって、前記配列は、1つ又は複数のカテゴリを含む基部と、前記基部の後の末尾カテゴリと、から成り、2つ又は3つ以上のカテゴリを含む基部は、基部自身が、1つ又は複数のカテゴリを含む基部と、前記基部の後の末尾カテゴリと、から成る下位配列である、ステップと、
前記決定された配列とその下位配列との各配列について、前記配列の前記末尾カテゴリが前記配列の前記基部に続く確率を計算するステップと、
前記複数のエンティティのグループの対象エンティティであって、前記対象エンティティについて取得される前記事象が、前記対象カテゴリの部分集合のうちの少なくとも1つのカテゴリについて、前記少なくとも1つのカテゴリと関連付けられた事象を含まない、対象エンティティについて、前記対象エンティティについて取得される前記事象内の前記モデルカテゴリの部分集合の前記カテゴリの時間順の発生に基づいて前記モデルカテゴリの部分集合のカテゴリの対象配列を決定し、前記対象配列と前記計算された確率とに基づいて前記少なくとも1つのカテゴリの対象カテゴリを決定するステップと、
前記対象エンティティと前記決定された対象カテゴリとに基づいて情報を提供するステップと、
を含む、方法。
【請求項2】
請求項1に記載のコンピュータにより実行される方法において、エンティティについて決定された配列は前記モデルカテゴリの部分集合の各カテゴリを最大一回含み、前記決定された配列が、前記エンティティについて取得される前記事象内の前記モデルカテゴリの部分集合の前記カテゴリの時間順における最初の発生に基づくものである、方法。
【請求項3】
請求項1に記載のコンピュータにより実行される方法において、エンティティについて決定された配列が、前記モデルカテゴリの部分集合のカテゴリを、前記カテゴリと関連付けられた前記エンティティについて取得された事象の数に等しい回数で含む、方法。
【請求項4】
請求項1から請求項3のいずれか1項に記載のコンピュータにより実行される方法において、前記決定された配列とその下位配列との各配列について、前記配列の前記末尾カテゴリが前記配列の前記基部に続く確率を計算する前記ステップは、
前記決定された配列を含み、決定された配列ごとに、すべての対応する下位配列を1度に含む、入力配列の入力表を取得するステップと、
前記入力表の前記入力配列の全ての固有の基部を含む出力表を取得するステップと、
前記出力表の各基部について、入力配列が前記基部である前記入力表中の入力配列の先行数を決定するステップと、
前記入力表の各入力配列について、前記入力表内の前記入力配列の発生の回数を、前記出力表内のその基部の対応する前記先行数で除算することによって、前記入力配列の前記末尾カテゴリが前記入力配列の前記基部に続く確率を計算するステップと、
を含む、方法。
【請求項5】
請求項1から請求項4のいずれか1項に記載のコンピュータにより実行される方法において、事象は通信チャネルの集まりの通信チャネルを含み、前記方法は、前記対象エンティティについて、前記集まりの対象通信チャネルを決定するステップを含み、前記対象エンティティと前記決定された対象カテゴリとに基づく前記情報は、前記対象通信チャネルを介して提供される、方法。
【請求項6】
請求項1から請求項5のいずれか1項に記載の、装置における故障予測と情報提供とのためのコンピュータにより実行される方法において、エンティティは1つまたは複数のセンサを含む装置であり、各装置の1つまたは複数の前記事象は、前記装置の前記1つまたは複数のセンサからのデータに基づいて取得され、前記情報は故障回避のために提供される情報である、方法。
【請求項7】
請求項1から請求項5のいずれか1項に記載の、事象予測および情報提供のためのコンピュータにより実行される方法において、エンティティがユーザであり、カテゴリがコンピュータプログラム製品の機能であり、前記対象エンティティと前記対象カテゴリとに基づいて情報を提供する前記ステップが、対象の前記ユーザに対して、視覚化手段を介して対象の前記機能に関する学習情報を提供するステップである、方法。
【請求項8】
請求項1から請求項5のいずれか1項に記載の、サービスとのユーザによる対話の型の予測と情報提供とのためのコンピュータにより実行される方法において、エンティティがユーザであり、カテゴリが対話の型であり、前記対象エンティティと前記対象カテゴリとに基づいて情報を提供する前記ステップが、前記ユーザに対象の前記対話の型に関する情報を提供するステップである、方法。
【請求項9】
事象予測および情報提供のためのコンピュータシステムであって、前記コンピュータシステムは、請求項1から請求項8のいずれか1項に記載の前記コンピュータにより実行される方法を実行するように構成される、コンピュータシステム。
【請求項10】
事象予測および情報提供のためのコンピュータプログラムであって、前記コンピュータプログラムは、前記コンピュータプログラムがコンピュータによって実行されると、前記コンピュータに、請求項1から請求項8のいずれか1項に記載の前記コンピュータにより実行される方法を実行させる命令を含む、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特定の事象における知識の表現(G06N5/02、G06N5/00)に基づく、推論(G06N5/04)(特にシーケンスパターンマイニング)についてのコンピュータにより実行される方法、コンピュータシステム、およびコンピュータプログラム製品に関する。本発明は、
・装置のグループにおけるセンサに基づく故障追跡であって、装置の対象故障を予測することと、故障回避のために装置を保守点検するための情報を提供することと、
・ユーザのグループ内のコンピュータプログラム製品の機能の使用を追跡することと、ユーザの対象機能の使用を予測することと、ユーザに対象機能の使用の学習情報を提供することと、および/または、
・ユーザのグループ内のサービスとの対話を追跡することと、ユーザの対象対話を予測することと、ユーザに対象対話に関する情報を提供すること、
のために使用されることができる。
【背景技術】
【0002】
米国特許第5465321号明細書は、動的システムにおける故障検出に関連する。システム故障監視方法および装置は、訓練データから兆候と故障とのマッピングを学習する。システムの状態は、最初に、離散的な時間隔で推定される。特徴ベクトルは、センサデータの連続するウィンドウのセットから推定される。次いで、パターン認識構成は、特徴が与えられると、事後故障クラス確率の瞬時推定値をモデル化する。隠れマルコフモデルは、時間的コンテキストを利用して、最近の過去の履歴を条件とするクラス確率を推定することに使用される。
【0003】
米国特許第6415276号明細書は、工業上の処理のベイジアンネットワーク(Bayesian belief network)に関連する。ベイジアンネットワークを使用してセンサおよび/または処理を診断する方法および装置が開示される。より具体的には、本方法および装置は、センサおよび/または処理の故障検出、分離、および適応を達成する。
【0004】
上述の開示によれば、隠れマルコフモデルまたはベイジアンネットワークが利用されるので、履歴は部分的にのみ考慮される。したがって、上述の開示は、長い履歴を十分な量まで考慮に入れるための技術的特徴を教示していない。
【0005】
米国特許出願公開第2016/0071126号明細書は、顧客道程(ジャーニ)の予測および解決に関連する。各ユーザが特定のビジネスに対応するすべての利用可能なユーザの道程の情報にマッピングされる予測モデルが開示される。予測モデルは、ユーザによって加入されるサービスに関連したユーザの特性、嗜好、および最低労力での解決を理解するために分析される。予測モデルは、各ユーザについて、サービスまたはサービスの収集を予測するために分析される。実施形態は、チャネルおよびサービスを介して顧客(カスタマ)と相互作用し、顧客に情報を提供し、顧客から情報を受信し、顧客に反応し、および/または顧客に動作を配信する。すべての顧客およびシステムの挙動、データ、および動作は、継続的なフィードバックおよび性能改善のために追跡され、調整され、活用される。
【0006】
米国特許出願公開第2017/0372347号明細書は、顧客道程の配列(シーケンス)に基づくマーケティング属性モデルに関連する。本方法は、異なるトピック上の異なる時間における異なるチャネル上の顧客対話を含む顧客道程の配列から下位配列を抽出することを含む。本方法は、統計的仮説検定アプローチを適用することによって、道程の成功データに基づいて各下位配列の有効性を測定することをさらに含む。また、本方法は、配列に基づく道程属性モデルを適用することによって、下位配列のうちの所与の1つに対する顧客対話の各々の寄与を決定することを含む。
【0007】
米国特許第10067990号明細書は、記録の重要な属性を識別するシステム、方法およびコンピュータプログラムに関連する。複数の属性を有する複数の事象を含む複数の記録が記憶される。さらに、事象の属性は機械学習を利用して処理される。この目的のために、処理に基づいて、属性のうちの少なくとも1つが重要であると識別される。次に、そのように識別された少なくとも1つの属性は表示されることができる。
【0008】
Gay, Lopez and Melendez, “Sequential learning for case-based pattern recognition in complex event domains”, Proceedings of the 16th UK Workshop on Case-Based Reasoning (UKCBR 2011), Cambridge, United Kingdom, 13 December 2011, published on 20 January 2012 in CEUR Workshop Proceedings (ISSN 1613-0073), Vol. 829, paper 6, http://ceur-ws.org/Vol-829/paper6.pdf, 、以下、Gay(2012)は、シーケンスパターンマイニングを開示する。
【0009】
上述の引用された文献に開示された教示のうちの少なくともいくつかは、情報の過負荷に悩まされる。典型的には、全ての又はほとんどの情報が等しい立場で扱われる。例えば、Gay(2012)は、主体(actor)に、列挙した配列を利用することを教示していない(セクション3.1の最後の文)。さらに、上述の引用された文献のうちの少なくともいくつかにおいて、動作予測は教示されていないか、または適切に教示されていない。適切な動作予測は、時宜を得た介入を提供すべきである。さらに、通常、結果として得られる配列は、時間順の情報を除いて、さらなる時間情報を欠いている。次の故障が間もなく、例えば明日に起こるであろう第1の装置にとっては、次の故障が遠い特徴、例えば2年以内に起こるであろう第2の装置よりも、介入はより緊急である。後者の場合、例えば、装置の予定される寿命、または来るべき予定される保守を考慮して、介入は、もはや必要とされないかもしれない。さらに、限られた資源を有する環境、例えば、装置のプール全体に対して1人の整備士がいる環境では、限られた資源は最適に分散させなければならない。例えば、装置のプールについて、これは、プールにわたる全体的な故障時間(ダウンタイム)を最小限に抑えることを含むことができる。一般的な定式化では、これは、(例えば、装置の予定される保守または予定される寿命を考慮して)少なくとも最初の期間中にエンティティのグループ(例えば、装置のプール)にわたって全体的な保持(例えば、装置の稼働時間)を最大化することを含む。
【0010】
本発明は、上述の問題のうちの少なくともいくつかを解決することを目的とする。
【発明の概要】
【0011】
第1の態様では、本発明は、請求項1に記載の、事象予測および情報提供のためのコンピュータにより実行される方法を提供する。
【0012】
第2の態様では、本発明は、請求項12に記載の、事象予測および情報提供のためのコンピュータシステムを提供する。
【0013】
第3の態様では、本発明は、請求項13に記載の、事象予測および情報提供のためのコンピュータプログラム製品を提供する。
【0014】
本発明は、いくつかの理由で利点がある。
【0015】
1つの理由は、特に、(a)カテゴリの全体の集合からカテゴリのモデルカテゴリの部分集合の決定と、(b)モデルカテゴリの部分集合内の履歴全体に基づいて、末尾カテゴリが基部に続く確率の計算と、を組み合わせることに関する。カテゴリの全体の集合をモデルカテゴリの部分集合に縮小することによって、モデルカテゴリの部分集合内の履歴全体は配列を介してモデル化されることができ、確率を決定する際に考慮に入れられることができる。これは、時間規模がモデルに対して固有であり、最近の履歴のみが考慮される、隠れマルコフモデルまたはベイジアンネットワークと対比されなければならない。
【0016】
別の理由は、部分集合の決定の特定の階層に関する。カテゴリの対象カテゴリの部分集合が最初に選択され、その後、モデルカテゴリの部分集合が選択される場合、精度は主に、モデルカテゴリの部分集合内の特定のカテゴリの包含または除外に依存し、しばしば、最終的に、縮小されたモデルカテゴリの部分集合内で動作することによって、対象カテゴリの部分集合のカテゴリに関連した特定の変遷を不十分にモデル化する。最初にモデルカテゴリの部分集合を選択し、その後、モデルカテゴリの部分集合に基づく対象カテゴリの部分集合を選択することによって、出願人は、驚くべきことに、対象カテゴリの部分集合の制約がまだ存在しないので、縮小されたモデルカテゴリの部分集合においてより良好な変遷が取得され得ることを見出した。さらに、モデルカテゴリの部分集合に基づく対象カテゴリの部分集合が本質的に不完全であることは先験的に明らかであるが、出願人は、驚くべきことに、精度が低下しないことを見出した。これは、対象カテゴリの部分集合が最初に決定されるときに、対象カテゴリの部分集合のカテゴリに関連した特定の変遷の不十分なモデル化に後天的に帰することができる。言い換えると、対象カテゴリの部分集合を最初に選択するときと、モデルカテゴリの部分集合を最初に選択するときとの両方で、すべての変遷が、縮小されたモデルカテゴリの部分集合で捕捉されることはできず、一方、モデルカテゴリの部分集合の最初の決定と、モデルカテゴリの部分集合に基づく対象カテゴリの部分集合のその後の決定とは、全体としてより良好な変遷のモデル化を提供する。
【0017】
Gay(2012)は、少なくとも以下の際立たった特徴を開示していない。
・エンティティのアクティブな下位グループ
・平均事象頻度に基づくアクティブな下位グループの決定
・対象カテゴリの部分集合
・モデルカテゴリの部分集合のカテゴリの最初の発生までの期間に基づく、モデルカテゴリの部分集合からの対象カテゴリの部分集合の決定
【0018】
Gay(2012)のセクション3.1の最後の文章を参照すると、Gay(2012)は特に、主体に対する特殊化を教示していない。
【0019】
Gay(2012)に関するこれらの際立たった特徴は、少なくとも最初の期間中に、エンティティのグループにわたる全体的な保持を最大化する結果となる。
・個々のエンティティは異なる動きをすることができ、先験的には知られていない固有の差異を有することができる。例えば、装置の場合、第1の故障が装置内で発生した場合、第2の故障は非常に高い発生の確率を有することができる。同様に、第3の故障が装置内で発生した場合、第4の故障は非常に高い発生の確率を有することができる。一方、第1と第3との故障が同じ装置内で発生する可能性は非常に低くなり得る。エンティティに対する特殊化がなければ、エンティティ間のこのような差異は推測されることができない。したがって、特定のエンティティの履歴は、特定のエンティティの将来を予測するのに最も重要であり、他の特定のエンティティの同様の履歴に基づくことができる。
・タイムスタンプと関連付けられる事象を配列に変換することによって、時間順の情報のみが通常保持されるが、絶対的または相対的な時間情報は保持されない。最初の発生までの期間に基づく対象カテゴリの部分集合の作成は、対象エンティティのカテゴリを予測するための絶対的または相対的なタイムスタンプを明示的に利用する必要なしに、エンティティの事象の時間順序付けに追加してモデル空間内の時間情報を導入する。代わりに、対象カテゴリの部分集合は、モデルカテゴリの部分集合の対象カテゴリの部分集合内にどのカテゴリを含めるかの決定を介して、絶対的または相対的なタイムスタンプの態様を間接的に組み込む。
・エンティティのアクティブな下位グループは、実質的なエンティティのシーケンスマイニングが実行されることができるエンティティを提供する。また、高い事象頻度を有するエンティティが、同じ量の事象を有するが、より低い事象頻度を有するエンティティよりも有利に働くという追加の利点もある。同一の履歴を有する2つのエンティティは、事象頻度を除いて、次の事象のカテゴリの等しい確率分布を有するであろうが、より高い事象頻度を有するエンティティは、より早く発生するので、それを処理する緊急性がより大きくなるであろう。エンティティのグループにわたる保持は、高い事象頻度を有するエンティティ、すなわち、特定の期間内に発生する多数の事象を有するエンティティ、から推測することによって、最も有益となる。
【図面の簡単な説明】
【0020】
図1】本発明の実施形態による、アルゴリズムの概略図を示す。
図2A】本発明の実施形態による、カテゴリの集合(201)、カテゴリのモデルカテゴリの部分集合(202)、およびカテゴリの対象カテゴリの部分集合(203)の概略図を示す。
図2B】本発明の実施形態による、カテゴリの集合(201)、カテゴリのモデルカテゴリの部分集合(202)、およびカテゴリの対象カテゴリの部分集合(203)の概略図を示す。
図3】本発明の実施形態による、通信チャネルとデータ処理との概略図を示す。
図4】本発明の実施形態による、モデルカテゴリの部分集合のカテゴリに対する最初の発生までの平均期間を示すチャートを示す。
図5】本発明の実施形態による、アルゴリズムの概略図を示す。
図6】本発明の実施形態による、エンティティの事象に基づくモデルカテゴリの部分集合のカテゴリの配列の概略図を示す。
図7】本発明の実施形態による、配列の概略図を示す。
図8】本発明の実施形態による、アルゴリズムの概略図を示す。
図9】本発明の実施形態による、アルゴリズムの概略図を示す。
図10】本発明の実施形態による、エンティティの刺激されたグループ対エンティティの制御グループの成功率を示すチャートを示す。
【発明を実施するための形態】
【0021】
本発明は、事象予測および情報提供のためのコンピュータにより実行される方法(CIM)、コンピュータシステム、およびコンピュータプログラム製品(CPP)に関する。本発明は、上述の対応する部分に要約される。以下では、本発明が詳細に説明され、好ましい実施形態が説明され、本発明は非限定的な例によって説明される。
【0022】
別段の定義がない限り、本発明を開示する際に使用されるすべての用語は、技術用語と科学用語とを含み、本発明が属する技術分野の当業者によって一般に理解されるような意味を有する。さらなる手引きによって、本発明の教示をより良く理解するために、用語の定義が含まれる。
【0023】
本明細書で使用される場合、以下の用語は、以下の意味を有する。
【0024】
本明細書で使用される「1つ」、は文脈が明確に別段の指示をしない限り、単数と複数との両方の指示対象を指す。例として、「1つの区画」は、1つまたは複数の区画を指す。
【0025】
本明細書で使用される「含む」、「備える」、「有する」は同義であり、後続するもの(例えば、構成要素)の存在を特定することと、当技術分野で知られている、または本明細書で開示されている追加の、非列挙構成要素、特徴、成分、要素、工程の存在を排除する、または排除しないことと、をいう包括的または限定されない用語である。
【0026】
本明細書で使用される「に基づいて」は「に少なくとも部分的に基づいて」と同義であり、後続するものの存在を特定することと、追加の、非列挙構成要素、特徴、成分、要素、工程などの存在を排除する、または排除しないことと、をいう包括的または限定されない用語である。
【0027】
本明細書で使用される「配列」は要素の順序付けられた表である。配列は少なくとも2つの要素を含む。配列は、「基部」および「末尾要素」を含む。配列は特に、末尾要素が続く基部を含む。基部は、1つまたは複数の要素を含む。基部が少なくとも2つの要素を含む場合、基部は配列であり、基部自体は基部と末尾要素とを含む。非限定的な例では、第1の配列は、E1→E9→E7→E4→E8の順序で、要素E1、E4、E7、E8、およびE9を含むことができる。第1の配列は、第2の配列である基部E1→E9→E7→E4、および末尾要素E8を含む。第2の配列は、第3の配列である基部E1→E9→E7、および末尾要素E4を含む。
【0028】
本明細書で使用されるような要素を含む「グループ」、「集合」、「集まり」、「表」、「配列」などは、コンピュータ可読で、好ましくはデジタルな、要素の識別子などの要素のポインタを含むグループ、集合、集まり、表、配列などの表現を指す。したがって、カテゴリの集合は、カテゴリの識別子などのカテゴリのポインタを含むコンピュータ可読な表現の集合を指す。次に、各カテゴリは、カテゴリの識別子によって表される。したがって、装置のグループは、装置の識別子などの装置のポインタを含むグループのコンピュータ可読な表現のグループを指す。次に、各装置は、装置の識別子によって表される。従って、ユーザのグループは、ユーザの識別子などのユーザのポインタを含むコンピュータ可読な表現のグループを指す。次に、各ユーザは、ユーザ識別子によって表される。
【0029】
第1の態様では、本発明が事象予測および情報提供のためのCIMを提供する。第2の態様では、本発明が事象予測および情報提供のためのコンピュータシステムを提供し、コンピュータシステムは1つまたは複数のプロセッサを含み、コンピュータシステムは、本発明の第1の態様に従ってCIMを実行するように構成される。第3の態様では、本発明が事象予測および情報提供のためのCPPを提供し、CPPが第2の態様によるコンピュータシステムなどのコンピュータによって実行されると、CPPは、コンピュータに第1の態様によるCIMを実行させる命令を含む。第3の態様は、CPPを含む有形の非一時的コンピュータ可読のデータ通信を提供することができる。
【0030】
したがって、本技術分野の当業者は、本発明の3つの態様が相互に関連づけられることを理解するであろう。したがって、以下では、特定の態様への明示的な参照は省略されることができる。さらに、上記または下記の各特徴は、たとえそれが本発明の特定の態様と関連して開示されていたとしても、本発明の態様の各々に関係することができる。
【0031】
CIMは、いくつかのステップを含む。図1図2とが参照される。複数のエンティティのグループの各エンティティについて、1つまたは複数の事象が取得される(101)。好ましくは、複数のエンティティのグループの各エンティティについて、複数の事象が取得される。各事象は、カテゴリの集合のカテゴリと関連付けられる(201)。事象は、さらに、タイムスタンプと関連付けられることができる。さらに、事象は、通信チャネルの集まりからの通信チャネルと関連付けられることができる。事象は、特に、カテゴリの集合のカテゴリのポインタを含むことができる。事象は、さらに、タイムスタンプを含むことができる。また、事象は、通信チャンネルの集まりの通信チャネルのポインタを含むことができる。好ましくは、グループの各エンティティについて、平均事象頻度が計算される。好ましくは、エンティティのアクティブな下位グループが計算された平均事象頻度に基づいて決定される。カテゴリの集合(201)のモデルカテゴリの部分集合(202)は、(102)において決定される。したがって、カテゴリの集合(201)は、モデルカテゴリの部分集合(202)を含む。好ましくは、モデルカテゴリの部分集合が、アクティブな下位グループ内のエンティティについて取得される事象内のカテゴリの集合のカテゴリの発生(prevalence)に基づいて、カテゴリの集合から決定される。対象カテゴリの部分集合(203)は、モデルカテゴリの部分集合(202)に基づいて決定される(102)。特に、モデルカテゴリの部分集合(202)は、対象カテゴリの部分集合(203)を含む。好ましくは、対象カテゴリの部分集合が、アクティブな下位グループ内のエンティティについて取得されるイベント内のモデルカテゴリの部分集合のカテゴリの最初の発生までの期間に基づいて、モデルカテゴリの部分集合から決定される。対象カテゴリの部分集合(203)のカテゴリごとにカテゴリと関連付けられた少なくとも1つの事象が取得されている、すなわち、エンティティについて取得される事象が、対象カテゴリの部分集合の各カテゴリについて、カテゴリと関連付けられた少なくとも1つの事象を含む、グループの各エンティティについて、モデルカテゴリの部分集合(202)のカテゴリの配列が、エンティティについて取得される事象に基づいて、好ましくは、エンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの時間順の発生に基づいて、決定される(103)。配列は、1つまたは複数のカテゴリを含む基部と、基部の後の末尾カテゴリとから成る。2つまたは3つ以上のカテゴリを含む基部は、基部自身が、1つまたは複数のカテゴリを含む基部と基部の後の末尾カテゴリとからなる下位配列である。決定された配列と、2つまたは3つ以上のカテゴリを含むそれらの再帰的基部との各配列について、すなわち、決定された配列とそれらの下位配列との各配列について、配列の末尾カテゴリが配列の基部に続く確率が計算される(104)。対象カテゴリの部分集合のうちの少なくとも1つのカテゴリについて、少なくとも1つのカテゴリと関連付けられる事象が取得されていない、すなわち、エンティティについて取得される事象が、対象カテゴリの部分集合のうちの少なくとも1つのカテゴリについて、カテゴリと関連付けられる事象を含まない、複数のエンティティのグループの対象エンティティについて、対象エンティティについて取得される事象に基づいて(105)、好ましくは、対象エンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの時間順の発生に基づいて、モデルカテゴリの部分集合のカテゴリの対象配列が決定される(105)。少なくとも1つのカテゴリの対象カテゴリは、対象配列と計算された確率とに基づいて決定される(105)。対象エンティティと決定された対象カテゴリとに基づく情報が提供される(106)。
【0032】
好ましい実施形態では、CIMは以下のステップを含む。
・複数のエンティティのグループの各エンティティについて、1つまたは複数の、好ましくは複数の、事象、タイムスタンプと関連付けられる各事象、カテゴリの集合のカテゴリを取得すること。
・グループの各エンティティについて、平均事象頻度を計算すること。
・計算された平均事象頻度に基づいて、エンティティのアクティブな下位グループを決定すること。
・アクティブな下位グループ内のエンティティについて取得されるイベント内のカテゴリの集合のカテゴリの発生度に基づいて、カテゴリの集合からモデルカテゴリの部分集合を決定すること。
・アクティブな下位グループ内のエンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの最初の発生までの期間に基づいて、モデルカテゴリの部分集合から対象カテゴリの部分集合を決定すること。
・エンティティについて取得される事象は、対象カテゴリの部分集合の各カテゴリについて、カテゴリと関連付けられる少なくとも1つの事象を含む、複数のエンティティのグループの各エンティティについて、エンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの時間順の発生に基づいて、モデルカテゴリの部分集合のカテゴリの配列を決定することであって、配列は、
・1つまたは複数のカテゴリを含む基部と、
・基部の後の末尾カテゴリと、
から成り、2つまたは3つ以上のカテゴリを含む基部は、基部自身が、
・1つまたは複数のカテゴリを含む基部と、
・基部の後の末尾カテゴリと、
から成る配列である。
・決定された配列とそれらの下位配列との各配列について、配列の末尾カテゴリが配列の基部に続く確率を計算すること。
・エンティティについて取得される事象が、対象カテゴリの部分集合の少なくとも1つのカテゴリについて、カテゴリと関連付けられる事象を含まない、複数のエンティティのグループの対象エンティティについて、対象エンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの時間順の発生に基づいて、モデルカテゴリの部分集合のカテゴリの対象配列を決定することと、対象配列と計算された確率とに基づいて、少なくとも1つのカテゴリの対象カテゴリを決定すること。
・対象エンティティと決定された対象カテゴリとに基づいて情報を提供すること。
【0033】
いくつかの利点の議論については、上述の「発明の概要」の部を参照されたい。
【0034】
好ましい実施形態では、本発明が装置内の故障予測と情報提供とのために構成される。この実施形態では、エンティティは装置であり、それにより、この装置は好ましくは1つまたは複数のセンサを備える。装置は、装置の識別子によって表されることができる。次に、各装置の1つまたは複数の事象は、好ましくは、装置の1つまたは複数のセンサからのデータに基づいて取得される。この実施形態では、情報は、好ましくは、故障回避のために提供される情報である。同一または類似の装置では、特定の兆候が故障の出現を示すことができる。これは、兆候が故障を引き起こし得るからである。これは代替的に、あるいは追加的に、兆候およびこれから出現するであろう故障が共通の根本原因によって引き起こされ得るからである。
【0035】
別の実施形態では、本発明が、CPPにおけるユーザによる機能使用の予測と情報提供とのために構成される。この実施形態では、エンティティはユーザである。ユーザは、ユーザの識別子によって表されることができる。この実施形態では、カテゴリがコンピュータプログラム製品の機能である。この実施形態では、対象エンティティと対象カテゴリとに基づいて情報を提供するステップは、好ましくは、対象ユーザに対して、視覚化手段を介して、対象機能に関する学習情報を提供するステップである。CPPを使用することを学習すると、新しい機能の量は、ユーザにとって圧倒的であることができる。この実施形態では、本発明が、対象機能について学習情報をユーザに提供して、対象機能はユーザの機能の利用履歴に基づいて特に選択され、したがって、ユーザにとって特に興味深いものとすることができる。これは、次に、ユーザは、大部分は無関係であるが、大部分は関係するチュートリアルである長い文書に基づく急な学習曲線を提示されないので、より多くの時間と資源効率の良い学習処理とをもたらすことができる。また、これは、CPPの新しい版を発表する際に、経験豊富なユーザに選択的な新しい機能の導入をもたらすことができる。
【0036】
さらに別の実施形態では、本発明が、サービスとのユーザによる対話の型の予測と情報提供とのために構成される。この実施形態では、エンティティはユーザであり、ユーザはユーザの識別子によって表されることができる。この実施形態では、カテゴリは対話の型である。この実施形態では、対象エンティティと対象カテゴリとに基づいて情報を提供するステップは、ユーザに対象の対話の型に関する情報を提供するステップである。
【0037】
好ましい実施形態では、エンティティについて取得される事象に基づくモデルカテゴリの部分集合のカテゴリの配列のエンティティの決定は、エンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの時間順の発生に基づくものである。それによって、エンティティの決定された配列は、モデルカテゴリの部分集合の各カテゴリを最大で一度に含むことができ、それにより、決定された配列は、好ましくは、エンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの時間順の最初の発生に基づくものである。あるいは、エンティティの決定された配列が、モデルカテゴリの部分集合のカテゴリを、カテゴリと関連付けられるエンティティについて取得される事象の数に等しい回数で含むことができ、すなわち、配列は、モデルカテゴリの部分集合のカテゴリを、エンティティについて取得される関連付けられた事象においてそれが生じる数と同様の数で含む。カテゴリの再発は重要であるかもしれないし、またはあまり関連性がないかもしれない。CPP機能の学習の提示の例として、機能または機能配列の繰り返しの使用は、ユーザが特定の他の機能から利点を得るであろうことを示すことができ、一方、一回の使用は、試行またはエラーを示すことがあり得る。装置の故障を予測する例として、正の相関がカテゴリと故障との間に存在することができ、それにより、故障可能性は、特定のカテゴリの発生の数とはさらに無関係である。
【0038】
カテゴリの集合の対象カテゴリの部分集合とモデルカテゴリの部分集合とを決定するステップは、次のステップのうちの1つまたは複数を含むことができる。好ましくは、グループの各エンティティについて、平均頻度が計算される。好ましくは、エンティティのアクティブな下位グループが、計算された平均事象頻度に基づいて決定される。エンティティのアクティブな下位グループは、好ましくは、計算された平均事象頻度が所定の頻度のカットオフ値よりも大きいか、または小さくないエンティティを含む。好ましくは、カテゴリの集合のモデルカテゴリの部分集合が、カテゴリの発生に基づいて、好ましくはアクティブな下位グループ内のエンティティについて取得される事象内で、決定される。好ましくは、モデルカテゴリの部分集合が、アクティブな下位グループ内のエンティティについて取得される事象内のカテゴリの集合のカテゴリの発生度に基づいて、カテゴリの集合から決定される。好ましくは、カテゴリの集合の各カテゴリについて、好ましくはアクティブな下位グループ内のエンティティについて取得される事象に基づいて、平均カテゴリ頻度が計算される。好ましくは、モデルカテゴリの部分集合が、好ましくはアクティブな下位グループ内のエンティティについて取得される事象にわたり、計算された平均カテゴリ頻度が上位であるカテゴリの集合のカテゴリの所定の数または所定の割合に基づいて決定される。次に、対象カテゴリの部分集合がモデルカテゴリの部分集合から決定され、それによって、モデルカテゴリの部分集合が対象カテゴリの部分集合を含む。
【0039】
カテゴリの集合の対象カテゴリの部分集合とモデルカテゴリの部分集合とを決定するステップは、次のステップのうちの1つまたは複数を含むことができる。好ましくは、グループの各エンティティについて、平均頻度が計算される。好ましくは、エンティティのアクティブな下位グループが計算された平均事象頻度に基づいて決定される。エンティティのアクティブな下位グループは、好ましくは、計算された平均事象頻度が所定の頻度のカットオフ値よりも大きいか、または小さくないエンティティを含む。カテゴリの集合のモデルカテゴリの部分集合は、好ましくは上述のように、決定される。好ましくは、モデルカテゴリの部分集合の各カテゴリについて、好ましくはエンティティのアクティブな下位グループにわたって、カテゴリと関連付けられた事象の最初の発生までの平均期間が計算される。好ましくは、対象カテゴリの部分集合が、モデルカテゴリの部分集合のカテゴリについて決定された平均期間に基づいて、モデルカテゴリの部分集合から決定される。好ましくは、対象カテゴリの部分集合が、アクティブな下位グループ内のエンティティについて取得される事象内のモデルカテゴリの部分集合のカテゴリの最初の発生までの期間に基づいて、モデルカテゴリの部分集合から決定される。好ましくは、対象カテゴリの部分集合が、モデルカテゴリの部分集合のカテゴリのうち、決定された平均期間が下位の所定の数のカテゴリ又は所定の割合のカテゴリに基づいて、決定される。
【0040】
決定された配列の各配列と2つ又は3つ以上のカテゴリを含むそれらの再帰的基部とについて、すなわち、決定された配列の各配列とそれらの下位配列とについて、配列の末尾カテゴリが配列の基部に続く確率を計算するステップは、次のステップのうちの1つまたは複数を含むことができる。好ましくは、入力配列の入力表が得られる。好ましくは、入力表が決定された配列を含む。好ましくは、入力表が、決定された配列ごとに、2つ又は3つ以上のカテゴリを一度に含むすべての対応する再帰的基部をさらに含み、すなわち、入力表は、決定された配列ごとに、すべての対応する下位配列を一度にさらに含む。好ましくは、出力表が得られる。好ましくは、出力表が入力表の入力配列の全ての固有の基部を含む。出力表は、好ましくは、入力表の入力配列の全ての固有の基部を一度に含む。好ましくは、出力表の各基部について、先行数が決定される。好ましくは、基部の先行数が、入力配列が基部である入力表中の入力配列の数である。好ましくは入力表の入力配列について、より好ましくは入力表の各入力配列について、好ましくは入力表における入力配列の発生の数と、出力表におけるその基部の対応する先行数とに基づいて、入力配列の末尾カテゴリが入力配列の基部に続く確率が計算される。好ましくは、入力配列の末尾カテゴリが入力配列の基部に続く確率が、入力表内の入力配列の発生の数を、出力表内のその基部の対応する先行数で除算することによって、計算される。
【0041】
好ましい実施形態では、事象が通信チャネルの集まりの通信チャネルを含む。対象通信チャネルの集まりは、対象エンティティについて決定される。対象エンティティと決定された対象カテゴリとに基づく情報は、好ましくは対象通信チャネルを介して提供される。第1の他の実施形態では、カテゴリが通信チャネルを含むことができ、対象通信チャネルは対象カテゴリの決定を介して決定されることができる。第2の代替の他の実施形態では、通信チャネルの配列、またはカテゴリと通信チャネルとの対の配列が、対象通信チャネルを決定するために使用されることができる。
【0042】
本発明は、本発明を更に例示する以下の非限定的な例によって更に説明され、本発明の範囲を限定することを意図するものではなく、また本発明の範囲を限定すると解釈されるべきではない。
[実施例]
【実施例1】
【0043】
<本発明による実施形態>
複数のエンティティのグループの各エンティティについて、1つまたは複数の事象が取得される。各事象は、タイムスタンプとカテゴリの集合のカテゴリとに関連付けられる。カテゴリと関連付けられた事象がエンティティについて取得されると、カテゴリがエンティティについて「発生する」。カテゴリと関連付けられた事象がエンティティについて取得されていないと、カテゴリはエンティティについて「まだ発生していない」。
【0044】
<モデルおよび対象カテゴリの部分集合>
グループの各エンティティについて、平均事象頻度が計算される。例えば、エンティティの平均事象頻度は、昨年のエンティティの月当たりの事象の平均数とすることができる。また、エンティティが通年でまだアクティブでない場合は、エンティティの平均事象頻度は、アクティブな期間中のエンティティの月当たりの事象の平均数とすることができる。アクティブなエンティティのアクティブな下位グループが決定される。「アクティブなエンティティ」は、計算された平均事象頻度が所定の頻度のカットオフ値よりも大きいか、または小さくないエンティティである。他のエンティティは「非アクティブなエンティティ」と呼ばれる。
【0045】
(アクティブな下位グループの)アクティブなエンティティについて取得される事象は、フィルタで除去される。カテゴリの集合の各カテゴリについて、アクティブなカテゴリの平均頻度が、フィルタをかけられた事象、すなわちアクティブな下位グループ内のアクティブなエンティティの事象、に基づいて計算される。例えば、アクティブなカテゴリの平均頻度は、月当たりのアクティブなエンティティごとのカテゴリの発生の平均数とすることができる。モデルカテゴリの部分集合は、カテゴリの集合に含まれるカテゴリのうち、計算されたアクティブなカテゴリの平均頻度が上位の所定の数のカテゴリまたは所定の割合のカテゴリに基づいて、カテゴリの集合から決定される。例えば、カテゴリの集合のカテゴリは、計算されたアクティブなカテゴリの平均頻度に従って第1の選択表内で順序付けられることができる。増加する順序付け、または減少する順序付けが利用されるかどうかによって、第1の選択表のカテゴリの下部または上部は、所定の頻度の所定の数に基づいて、カテゴリの集合のモデルカテゴリの部分集合として保持される。さらに、モデルカテゴリの部分集合のカテゴリは、モデルカテゴリとも呼ばれる。
【0046】
各モデルカテゴリについて、(モデルカテゴリと関連付けられる事象の)最初の発生までの平均期間が、アクティブなエンティティのアクティブな下位グループにわたって決定される。好ましくは、モデルカテゴリがまだ発生していないアクティブなエンティティについて、最初の発生までの平均期間を決定するために所定の初期設定の期間の値が利用されるか、または最初の発生までの平均期間を決定するためにこれらのアクティブなエンティティは考慮されないか、のいずれかであるが、最も好ましくは後者である。対象カテゴリの部分集合は、モデルカテゴリの部分集合のモデルカテゴリの最初の発生について、決定された平均期間に基づいて、モデルカテゴリの部分集合から決定される。好ましくは、対象カテゴリの部分集合が、モデルカテゴリの部分集合に含まれるモデルカテゴリのうち、最初の発生について決定された平均期間が下位である所定の数のカテゴリまたは所定の割合のカテゴリに基づくものである。例えば、モデルカテゴリの部分集合のモデルカテゴリは、最初の発生について決定された平均期間に従って第2の選択表内で順序付けられることができる。増加する順序付け、または減少する順序付けが利用されるかどうかによって、第2の選択表のモデルカテゴリの上部または下部は、所定の頻度の所定の数に基づいて、モデルカテゴリの部分集合の対象カテゴリの部分集合として保持される。さらに、対象カテゴリの部分集合のカテゴリは、対象カテゴリとも呼ばれる。
【0047】
<予測モデルの構築>
全トラック(track)のエンティティの全トラックの下位グループが決定される。対象カテゴリの部分集合の各対象カテゴリについて、対象カテゴリと関連付けられる少なくとも1つの事象が取得されると、つまり、エンティティについて、各対象カテゴリが発生すると、エンティティは全トラックのエンティティである。対象カテゴリの部分集合の少なくとも1つの対象カテゴリについて、少なくとも1つのカテゴリと関連付けられる事象が取得されていないエンティティ、すなわち、少なくとも1つの対象カテゴリがまだ発生していないエンティティは、部分トラックのエンティティと呼ばれる。当業者は次の4つの場合、アクティブな全トラックのエンティティ、非アクティブな全トラックのエンティティ、アクティブな部分トラックのエンティティ、および非アクティブな部分トラックのエンティティ、が生じ得ることを理解するであろう。
【0048】
グループの各々の全トラックのエンティティについて、全トラックのエンティティについて取得される事象に基づいて、モデルカテゴリの部分集合のモデルカテゴリの配列が決定される。これにより、配列は、全トラックのエンティティについて取得される事象内のモデルカテゴリの時間順の発生に基づいて決定される。これにより、決定された配列は各モデルカテゴリを最大で一度に含むことができ、それにより、全トラックのエンティティについて取得される事象内のモデルカテゴリの部分集合のモデルカテゴリの時間順の第1の発生に従って、特に事象のタイムスタンプに従って、決定された配列のモデルカテゴリは順序付けられ、すなわち、モデルカテゴリの第1の発生のみが決定された配列内に表される。これにより、決定された配列は、代替的に、モデルカテゴリと関連付けられた全トラックのエンティティについて取得される事象の数に等しい回数でモデルカテゴリを含むことができ、すなわち、全トラックのエンティティについて、モデルカテゴリの各発生は、その決定された配列で表される。
【0049】
決定された配列の各配列と2つまたは3つ以上のカテゴリを含むそれらの再帰的基部と(それゆえ、どの基部も配列である)について、配列の末尾カテゴリが配列の基部に続く確率が計算される。したがって、次のステップは、好ましくは、確率の算出のために利用される。入力配列の入力表が取得される。入力表は決定された配列を含む。入力表は、さらに、決定された配列ごとにすべて対応する、2つ又は3つ以上のカテゴリを一度に含む再帰的基部を含む。出力表が取得される。出力表は、入力表の入力配列のすべての固有の基部を一度に含む。出力表の各基部について、入力配列が基部である入力表内の入力配列の先行数が決定される。入力表の各入力配列について、入力配列の末尾カテゴリが入力配列の基部に続く確率は、入力表内の入力配列の発生数を、出力表内の基部の対応する先行数で除算することによって、計算される。
【0050】
<部分トラックのエンティティの予測>
対象の部分トラックのエンティティについて、モデルカテゴリの部分集合のモデルカテゴリの対象配列が、対象エンティティについて取得される事象に基づいて決定される。これにより、配列は、対象の部分トラックのエンティティについて取得される事象内のモデルカテゴリの時間順の発生に基づいて決定される。これにより、決定された配列は各モデルカテゴリを一度で含むことができ、それにより、対象の部分トラックのエンティティについて取得される事象内のモデルカテゴリの部分集合のモデルカテゴリの時間順の第1の発生に従って、特に事象のタイムスタンプに従って、決定された配列のモデルカテゴリは順序付けられ、すなわち、モデルカテゴリの第1の発生のみが決定された配列内に表される。これにより、決定された配列は、代替的に、モデルカテゴリと関連付けられた対象の部分トラックのエンティティについて取得される事象の数に等しい回数で、モデルカテゴリを含むことができ、すなわち、モデルカテゴリの各発生は、決定された配列で表される。
【0051】
対象の部分トラックのエンティティについて、対象カテゴリは、対象配列と計算された確率とに基づいて決定される。決定された対象カテゴリは、特に、対象カテゴリと関連付けられた事象が対象の部分トラックのエンティティについて取得されていない対象カテゴリの部分集合のカテゴリである。したがって、対象の部分トラックのエンティティについて決定された対象カテゴリの発生は、対象の部分トラックのエンティティを全トラックのエンティティとなるように「近づける」ことになるであろう。好ましくは、決定された対象カテゴリが、対象配列に続く計算された確率による、最大の確率を含む。
【0052】
<情報提供>
対象の部分トラックのエンティティと決定された対象カテゴリとに基づく情報が提供される。
【実施例2】
【0053】
<ユーザ関与>
本実施例は実施例1をさらに基礎とし、組織とのユーザ対話に関連する。エンティティはユーザである。カテゴリは、事象の型とも呼ばれる。モデルカテゴリは、地点情報(waypoint)とも呼ばれる。対象カテゴリは、中間地点(milestone)とも呼ばれる。(モデルカテゴリの)配列は、(地点情報の)道程(journey)とも呼ばれる。基部は、副道程とも呼ばれる。全トラックのエンティティは、加入(onboarded)ユーザとも呼ばれる。部分トラックのエンティティは、加入前ユーザとも呼ばれる。
【0054】
図3は、本例の実施形態による、通信チャネルおよびデータ処理の概略図を示す。ユーザは6つの通信チャネル、すなわち、対面対話(301)、電話(302)、メール(303)、組織のウェブプラットフォームを介したオンラインおよび/または電子メール(304)、組織のモバイルまたはウェブプラットフォームを介したモバイル(305)、ならびにデビットおよびクレジットカード取引(306)、を介して組織と対話することができる。ユーザの各対話は、ユーザと関連付けられた固有のユーザの識別子に基づいて、いくつかのシステムのうちの1つの内に記録されることができる。定期的に、好ましくは各日の開始時に、前の期間、好ましくは前の日からの記録されたデータが記憶装置から抽出され、正しいフォーマットに変換され、関係あるデータベース(307)に読み込まれることができる。
【0055】
関係あるデータベース(307)内の新しいデータは、好ましくは毎日、事象に変換されることができ(308)、事象ログに追加される(309)。事象は、ユーザの識別子、事象の型の集合の事象の型(カテゴリ)、および日時(タイムスタンプ)を含む。事象ログ(309)は、本発明によるアルゴリズム(310)で使用する事象について照会されることができる。
【0056】
各ユーザの識別について、月当たりの事象の平均数(平均事象頻度)が決定される。所定の閾値(所定の頻度のカットオフ値)上またはそれを超える事象の平均数と関連付けられたユーザの識別子は、アクティブとしてフラグが立てられる。すべての他のユーザの識別子は非アクティブとしてフラグが立てられる。所定の閾値は、ユーザ入力装置を介して調整されることができる。
【0057】
実行可能予測アルゴリズムを得るために、特に、有限または限りあるリソース量であるコンピュータシステム上で、変数の数または自由度が減らされる。地点情報(モデルカテゴリ)のモデルカテゴリの部分集合が選択される。地点情報は、アクティブなユーザの識別子ごとに各事象の型が発生する平均回数を計算することによって、最も頻度の高いものを地点情報としてフラグを立てることによって、選択される。この選択の動機づけは、事象の型がユーザのグループ内において高頻度になるほど、その事象の型がユーザのそのグループに対してより重要になる。アクティブなユーザの識別子の事象がフィルタで除去され、アクティブなユーザのアクティブな下位グループ内の各事象の型の平均月次頻度が計算され、所定の数の地点情報を含むモデルカテゴリの部分集合が出力される。地点情報は、最大平均月次頻度を有する事象の型である。所定の数の地点情報は、ユーザ入力装置を介して調整されることができる。
【0058】
中間地点の対象カテゴリの部分集合は、地点情報のモデルカテゴリの部分集合から選択される。ユーザが組織に加わる日時と、ユーザの地点情報の発生(最初の発生までの平均期間)との間の平均時間量が決定される。図4は、平均期間の増加順に、地点情報の最初の発生に対する平均期間を示す例示的なチャートを示す。地点情報00は中間地点として選択されることができる。それは、ユーザの発生に(平均して)最小の日数であるためである。最初の発生について決定された下位の平均期間の選択基準は、情報提供による介入の適時性を反映する。他の目的のために、他の基準が利用されることができる。
【0059】
加入ユーザの識別子は、全ての中間地点を「達成した」ユーザと関連付けられ、すなわち、事象のログが、各中間地点について、ユーザの識別子と中間地点とを含む少なくとも1つの事象を含む。加入前ユーザの識別子は、全ての中間地点を「達成していない」ユーザと関連付けられる、すなわち、事象のログが、少なくとも1つの中間地点について、ユーザの識別子と中間地点とを含む事象を欠いている。次の手順は、好ましくは、どのユーザの識別子が加入されているかと、どのユーザの識別子が加入される前であるかと、を決定するために利用される。ユーザの識別子を有する列と、同様に中間地点ごとの列とを含むデータテーブルが作成される。列とユーザの識別子とに対応するデータテーブルの入力は、対応するユーザが最初に地点情報に達した事象の日時を含む。地点情報がユーザによってまだ達成されていない場合、データテーブルの対応する入力は空入力を含む。行ごとに、中間地点と関連付けられた列がループされ、空値が検出された場合、ユーザの識別子は加入される前としてフラグが設定される。空値が検出されない場合、ユーザの識別子は加入されたとしてフラグが設定される。データテーブルの追加の列にフラグが入力される。次に、データテーブルは2つのデータテーブル、すなわち、加入ユーザの識別子の入力を含む加入データテーブルと、加入前ユーザの識別子の入力を含む加入前データテーブルと、に分割される。
【0060】
次に、加入データテーブルが利用されて、加入前ユーザの識別子の予測モデルを構築する。各ユーザの識別子について、地点情報の最初の発生が時系列順にマッピングされる。加入ユーザの識別子について、道程に加えて、2つ又は3つ以上の地点情報を含む全ての副道程も決定される。これは、道程の地点情報を分離することと、道程が再び取得されるまで、順番に、一度に1つずつ増分的に加えることと、によって達成されることができる。すべての道程と少なくとも2つの長さの副道程とを含む入力表が取得される。入力表中の配列の全ての固有の基部を含む出力表が決定される。各固有の基部に対応する入力表内の配列(道程および少なくとも2つの長さの副道程)の(先行)数が決定され、個別の表に追加される。次に、入力表の各固有の配列の発生の数が決定され、対応する基部の先行数によって除算される。この結果、加入ユーザの加入グループにわたる入力表の各固有の配列の計数確率が得られる。加入ユーザの識別子の固有の道程および副道程ごとに、計算された確率を含む確率表が取得されることができる。確率表はサンキー図で視覚的に表されることができ、その一例が図7に示される。
【0061】
図6を参照する。ユーザの識別子xを仮定すると、地点情報W1のデータテーブルの入力が日付2015-09-05を含み、地点情報W2のデータテーブルの入力が空入力を含み、地点情報W3のデータテーブルの入力が日付2014-12-11を含み、地点情報W4のデータテーブルの入力が日付2018-11-09を含み、地点情報W5のデータテーブルの入力が日付2016-05-02を含み、次に、ユーザの識別子xの道程はW3→W1→W5→W4として決定されることができる。ユーザの識別子xが加入ユーザの識別子の場合、副道程W3→W1→W5およびW3→W1も決定される。ユーザの識別子yを仮定すると、道程W3→W1→W4→W5が決定され、同様に、副道程W3→W1→W4およびW3→W1も決定される。次に、入力表は、「W3→W1、W3→W1→W5、W3→W1→W5→W4、W3→W1、W3→W1→W4、W3→W1→W4→W5」とすることができる。次に、出力表は、対応する先行数表「2、2、1、1]を有する「W3、W3→W1、W3→W1→W5、W3→W1→W4」とすることができる。次に、配列W3→W1→W4の確率は、1/2=0.5である。
【0062】
図5は、配列の確率を計算するアルゴリズムの実施形態の概略図を示し、開始(501)から終了(508)まで実行されることができる。加入ユーザの道程データは、提供されることができる(502)。加入ユーザの道程の地点情報は、昇順の日付によって順序付けられることができる(503)。加入ユーザによって達成されたあらゆる可能な副道程が計算されることができ、各配列がデータ内で発生する回数が計算されることができる(504)。ユーザの識別子について道程a→b→c→d→eが取得された場合、副道程はa、a→b、a→b→c、およびa→b→c→dである(509)。少なくとも2つの長さの副道程は、a→b、a→b→c、およびa→b→c→dである。各配列(道程もしくは少なくとも2つの長さの副道程)について、配列の最後の地点情報を除去することによって基部が決定される(505)。地点情報に遷移する基部の各々の計数確率は、各配列が発生する回数を、その対応する基部の先行数で除算することによって計算される(506)。たとえば、基部a→bが地点情報cに10回、地点情報dに5回遷移する場合、その結果として、遷移確率はa→b→cの場合は0.6666...で、a→b→dの場合は0.3333...である。対応する配列および確率は、確率表に出力される(507)。
【0063】
加入前ユーザの識別子について、加入前データテーブルに基づいて、対象配列が決定されることができる。対応するユーザがまだ達成していない中間地点の各々に対する遷移確率は、計算された確率に基づいて決定され、すなわち、遷移確率は、計算された確率が存在する場合には確率表から読み出され、計算された確率が存在しない場合にはゼロで設定される。最大の確率に対応する中間地点が選択される。
【実施例3】
【0064】
<情報提供>
本実施例は、実施例1および2をさらに基礎とする。
【0065】
加入前ユーザの加入前グループについて、中間地点が予測されると、ユーザは連絡される。加入前グループは、特定の中間地点が予測された加入前ユーザを含むことができる。加入前グループは、全ての加入前ユーザを含むことができる。加入前グループは、最近、すなわち、所定の連絡期間内に、連絡されていない加入前ユーザを含むことができる。ユーザの連絡先データは、第1および第2の名前、自宅住所、電子メールアドレス、電話番号、および/または携帯電話番号を含むことができる。ユーザの識別子に基づくSQLクエリを介して、予測された中間地点は、対応する連絡先データと結合されることができる。クエリは、特に、連絡先情報の1つまたは複数の特定の部分についてフィルタをかけられることができる。連絡先情報は、特定の事象の型と関連付けられることができる。例えば、中間地点がモバイルプラットフォームの使用である場合、関連する連絡先情報は、SMSを送信するための電話番号とすることができる。この場合、第1の名前、第2の名前、電話番号が取得される。
【0066】
図8は、ユーザ連絡のためのアルゴリズムの概略図を示し、開始(801)から終了(807)まで実行されることができる。各々の加入前ユーザの識別子について、次に可能性の高い中間地点が、上述の実施例2で説明されるように予測される(802)。中間地点の予測を有するユーザの識別子の連絡先詳細が取得される(803)。取得された連絡先詳細は、検証チームに送られる(804)。検証をすると、連絡先詳細は連絡先ログに更新される(805)。連絡先ログに基づいて、ユーザは連絡される。連絡されたユーザは、特に予測された及び/又は他の中間地点の達成に関して、定期的に追跡される(806)。
【0067】
連絡先情報は、1つ又は複数のテスト機能を介してテストされることができる。全てのテスト機能が合格しない場合、手動介入が要求されることができる。すべてのテスト機能が合格した場合、連絡先情報は、連絡先センタに送信するためのエクセルファイルとして出力されることができる。
【0068】
図9は、連絡先センタへのユーザ連絡先詳細を作成することと、電子メールを送信することと関係することができるステップを含むアルゴリズムを示し、開始(901)から終了(905)まで実行されることができる。6文字のパスワードがランダムに生成されることができる(902)。エクセルファイルは、パスワードに基づいて暗号化されることができる(903)。暗号化されたエクセルファイルを含む電子メールは、連絡先センタに送信されることができる(904)。パスワードは、別の電子メールを介する別の通信チャネルを介して連絡先センタに提供されることができる(904)。
【0069】
ユーザの識別子と事象の型とを含む事象が、それによって、事象の型が連絡先と関連付けられる、事象のログに追加されることができる。
【実施例4】
【0070】
<アルゴリズムの性能の評価>
本実施例では、例1、2、3をさらに基礎とする。
【0071】
ユーザの(予測)グループと重複しないユーザの制御グループが取得される。制御グループのユーザについて、未達成の中間地点はランダムに割り当てられる。また、制御グループのユーザは、ランダムに選択された中間地点との関連で連絡される。ユーザのグループの結果をユーザの制御グループの結果と比較することによって、本発明の性能が評価される。
【0072】
性能は、所定のタイムウィンドウ内、または次の地点情報として、のいずれかにおいて、ユーザによって予測されたまたはランダムに選択された中間地点の達成に基づいて、評価されることができる。好ましくは、本実施例において、性能が、連絡からの所定のタイムウィンドウ内に、特に、連絡から3ヶ月という所定のタイムウィンドウの本実施例の文脈内で、予測された、またはランダムに選択された中間地点の達成に基づいて、評価される。
【0073】
図10は、予測された中間地点(黒い棒)またはランダムに選択された中間地点(白い棒)の、中間地点当たりの達成に合致する連絡されたユーザの割合を、制御グループ(白い棒)と予測グループ(黒い棒)とについて別々に示すチャートを示す。ユーザは、ランダムに選択された中間地点より予測された中間地点を達成する可能性がかなり高いことが観察されることができる。
図1
図2A
図2B
図3
図4
図5
図6
図7
図8
図9
図10