(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-27
(45)【発行日】2025-03-07
(54)【発明の名称】ランダムフォレスト分類器を用いて、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成する方法およびシステム
(51)【国際特許分類】
G06Q 10/04 20230101AFI20250228BHJP
G06Q 10/0637 20230101ALI20250228BHJP
【FI】
G06Q10/04
G06Q10/0637
(21)【出願番号】P 2022552305
(86)(22)【出願日】2021-03-04
(86)【国際出願番号】 IB2021051787
(87)【国際公開番号】W WO2021176380
(87)【国際公開日】2021-09-10
【審査請求日】2024-01-22
(32)【優先日】2020-03-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】522342525
【氏名又は名称】ユービーエス ビジネス ソリューションズ エージー
【氏名又は名称原語表記】UBS Business Solutions AG
【住所又は居所原語表記】Bahnhofstrasse 45 8001 Zurich Switzerland
(74)【代理人】
【識別番号】100126572
【氏名又は名称】村越 智史
(72)【発明者】
【氏名】ルース, ヘイデン トーマス
(72)【発明者】
【氏名】デセウジオ, デイヴィッド アンドリュー
(72)【発明者】
【氏名】ジャンセン, ロナルド
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2020-135434(JP,A)
【文献】特開2019-204142(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
ランダムフォレスト分類器を用いて、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成する方法であって、
制御回路を用いて、第1のエンティティの第1のマネジメントアレンジメントに関する第1のデータを受信することであって、前記第1のデータは、前記第1のエンティティの第1のマネジメント変革および第1の時間特性を含む、受信することと、
前記制御回路を用いて、前記第1のデータに対して第1の特徴ベクトルを生成することであって、前記第1の特徴ベクトルの第1の要素は、前記第1の時間特性に対応する、生成することと、
前記制御回路を用いて、前記第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングして、前記第1のデータを前記第1のマネジメント変革に対応するものとして分類することと、
前記制御回路を用いて、第2のエンティティの第2のマネジメントアレンジメントに関する第2のデータを受信することであって、前記第2のデータは前記第2のエンティティの未知のマネジメント変革および第2の時間特性を含む、受信することと、
前記制御回路を用いて、前記第2のデータに対して第2の特徴ベクトルを生成することであって、前記第2の特徴ベクトルの第2の要素は、前記第2の時間特性に対応する、生成することと、
前記制御回路を用いて、前記第2の特徴ベクトルを前記ランダムフォレスト分類器に入力することと、
前記制御回路を用いて、予測される第2のマネジメント変革に関する出力を前記ランダムフォレスト分類器から受信することと、
表示するためにユーザインターフェースにおいて、前記予測される第2のマネジメント変革に基づき予測を生成することと
を備える方法。
【請求項2】
ベイズ分類器に基づいて、前記出力を指数分布から確率に変換することをさらに備え、前記予測は前記確率を含む、請求項1に記載の方法。
【請求項3】
前記第1のマネジメント変革を示す前記第1のデータの第1のデータ構成要素を決定することと、
前記第1のデータ構成要素に対応する前記第2のデータの第2のデータ構成要素を決定することと、
前記予測における前記第2のデータ構成要素の表現を表示するために生成することと
をさらに備える、請求項1に記載の方法。
【請求項4】
前記第1のマネジメント変革を示す前記第1のデータ構成要素の第1の値を決定することと、
前記第1の値に対応する前記第2のデータ構成要素の第2の値を決定することと、
前記予測における前記第2の値の表現を表示するために生成することと
をさらに備える、請求項3に記載の方法。
【請求項5】
前記ランダムフォレスト分類器は時系列分類器であり、前記予測される第2のマネジメント変革は第3の時間特性を有する、請求項1に記載の方法。
【請求項6】
前記第1のマネジメント変革は、前記第1のマネジメントアレンジメントに対する第1のアクティビズムキャンペーンの立ち上げを含み、前記予測される第2のマネジメント変革に基づく前記予測は、前記第2のマネジメントアレンジメントに対する第2のアクティビズムキャンペーンの立ち上げの確率を含む、請求項1に記載の方法。
【請求項7】
前記第1の特徴ベクトルに基づいて前記ランダムフォレスト分類器をトレーニングして、前記第1のデータを前記第1のマネジメント変革に対応するものとして分類することは、過去のマネジメントアレンジメントおよび過去のマネジメント変革に関する過去のデータに対して前記ランダムフォレスト分類器をバックテストすることを含む、請求項1に記載の方法。
【請求項8】
複数のエンティティのマネジメントアレンジメントに関する公開データのレビューを開始するユーザ入力を受信することと、
前記レビューに応答して、前記第2のデータについてデータソースに対してクエリを実行することであって、前記第2のデータは前記データソースに対してクエリを実行することに応答して受信される、クエリを実行することと
をさらに備える、請求項1に記載の方法。
【請求項9】
複数のエンティティのマネジメントアレンジメントに関する公開データに基づいて、前記複数のエンティティに対するそれぞれの予測を表示するために生成することと、
前記予測と前記それぞれの予測との比較に基づいて、前記複数のエンティティにおける前記第2のエンティティの順位を決定することと
さらに備える、請求項1に記載の方法。
【請求項10】
第3のエンティティの第3のマネジメントアレンジメントに関する第3のデータを受信することであって、前記第3のデータは、前記第3のエンティティの第3のマネジメント変革および第3の時間特性を含む、受信することと、
前記第3のデータと前記第2のデータとの間の類似性を判断することと、
前記ユーザインターフェースにおいて、前記類似性に基づいて前記第2のエンティティと前記第3のエンティティとの比較を表示するために生成することであって、前記比較は前記第3のマネジメント変革の結果を含む、生成することと
をさらに備える、請求項1に記載の方法。
【請求項11】
ランダムフォレスト分類器を用いて、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成し、命令を備える非一時的コンピュータ可読媒体であって、前記命令が1または複数のプロセッサによって実行されると、
第1のエンティティの第1のマネジメントアレンジメントに関する第1のデータを受信する処理であって、前記第1のデータは、前記第1のエンティティの第1のマネジメント変革および第1の時間特性を含む、受信する処理と、
前記第1のデータに対して第1の特徴ベクトルを生成する処理であって、前記第1の特徴ベクトルの第1の要素は、前記第1の時間特性に対応する、生成する処理と、
前記第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングして、前記第1のデータを前記第1のマネジメント変革に対応するものとして分類する処理と、
第2のエンティティの第2のマネジメントアレンジメントに関する第2のデータを受信する処理であって、前記第2のデータは、前記第2のエンティティの未知のマネジメント変革および第2の時間特性を含む、受信する処理と、
前記第2のデータに対して第2の特徴ベクトルを生成する処理であって、前記第2の特徴ベクトルの第2の要素は前記第2の時間特性に対応する、生成する処理と、
前記第2の特徴ベクトルを前記ランダムフォレスト分類器に入力する処理と、
予測される第2のマネジメント変革に関する出力を前記ランダムフォレスト分類器から受信する処理と、
表示するためにユーザインターフェースにおいて、前記予測される第2のマネジメント変革に基づき予測を生成する処理と
を備える処理を発生させる、非一時的コンピュータ可読媒体。
【請求項12】
前記命令はさらに、ベイズ分類器に基づいて、前記出力を指数分布から確率に変換する処理を含む処理を発生させ、前記予測は前記確率を含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項13】
前記命令はさらに、
前記第1のマネジメント変革を示す前記第1のデータの第1のデータ構成要素を決定する処理と、
前記第1のデータ構成要素に対応する前記第2のデータの第2のデータ構成要素を決定する処理と、
前記予測における前記第2のデータ構成要素の表現を表示するために生成する処理と
を含む処理を発生させる、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項14】
前記命令はさらに、
前記第1のマネジメント変革を示す前記第1のデータ構成要素の第1の値を決定する処理と、
前記第1の値に対応する前記第2のデータ構成要素の第2の値を決定する処理と、
前記予測における前記第2の値の表現を表示するために生成する処理と
を含む処理を発生させる、請求項13に記載の非一時的コンピュータ可読媒体。
【請求項15】
前記ランダムフォレスト分類器は時系列分類器であり、前記予測される第2のマネジメント変革は第3の時間特性を有する、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項16】
前記第1のマネジメント変革は、前記第1のマネジメントアレンジメントに対する第1のアクティビズムキャンペーンの立ち上げを含み、前記予測される第2のマネジメント変革に基づく前記予測は、前記第2のマネジメントアレンジメントに対する第2のアクティビズムキャンペーンの立ち上げの確率を含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項17】
前記第1の特徴ベクトルに基づいて前記ランダムフォレスト分類器をトレーニングして、前記第1のデータを前記第1のマネジメント変革に対応するものとして分類することは、過去のマネジメントアレンジメントおよび過去のマネジメント変革に関する過去のデータに対して前記ランダムフォレスト分類器をバックテストすることを含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項18】
前記命令はさらに、
複数のエンティティのマネジメントアレンジメントに関する公開データのレビューを開始するユーザ入力を受信する処理と、
前記レビューに応答して、前記第2のデータについてデータソースに対してクエリを実行する処理であって、前記第2のデータは前記データソースに対してクエリを実行することに応答して受信される、クエリを実行する処理と
を含む処理を発生させる、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項19】
前記命令はさらに、
複数のエンティティのマネジメントアレンジメントに関する公開データに基づいて、前記複数のエンティティに対するそれぞれの予測を表示するために生成する処理と、
前記予測と前記それぞれの予測との比較に基づいて、前記複数のエンティティにおける前記第2のエンティティの順位を決定する処理と
を含む処理を発生させる、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項20】
前記命令はさらに、
第3のエンティティの第3のマネジメントアレンジメントに関する第3のデータを受信する処理であって、前記第3のデータは、前記第3のエンティティの第3のマネジメント変革および第3の時間特性を含む、受信する処理と、
前記第3のデータと前記第2のデータとの間の類似性を判断する処理と、
前記ユーザインターフェースにおいて、前記類似性に基づいて前記第2のエンティティと前記第3のエンティティとの比較を表示するために生成する処理であって、前記比較は前記第3のマネジメント変革の結果を含む、生成する処理と
含む処理を発生させる、請求項11に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ランダムフォレスト分類器を用いて、さまざまな時間特性を有するデータを処理し、マネジメントアレンジメントに関する予測を生成することに関する。
【背景技術】
【0002】
近年、データ処理およびデータ処理技術は、さまざまな目的を実現するためのコンピュータアプリケーションにおける重要性と応用性が増している。しかし、データセットのサイズは大きくなる一方であり、新たなアプリケーションでの要件を満たすべくこのようなデータセットを処理するために必要な処理能力も増加の一途を辿っており、開発者にとって常に頭痛の種である。
【発明の概要】
【発明が解決しようとする課題】
【0003】
この問題に鑑み、データ処理を改善するための方法およびシステムを本明細書で開示する。具体的には、さまざまな時間特性を持つデータを処理して予測を生成することで改善を実現した。上述したデータ処理は特に、マネジメントアレンジメントに関する予測を生成するために用いられるアプリケーションに関する。例えば、エンティティのマネジメントアレンジメント(例えば、エンティティの意思決定機関および/またはその他の制御システムの構成)および/またはマネジメント変革(例えば、投資家の行動(アクティビズム)に基づくエンティティのマネジメントアレンジメントにおける変化)に関するアプリケーションは、機械学習モデルに関して特定の要件を持つ。具体的には、これらのモデルは、多くの場合トレーニングデータが限られた中で信頼性の高い予測を生成しなければならず、予測の根拠となる特徴および/または所与の予測に影響を与える特徴について可視的でなければならない。
【0004】
本明細書に記載された方法およびシステムはさらに、ランダムフォレスト分類器に基づくモデルの使用に関する。しかし、マネジメントアレンジメントに関するアプリケーションにランダムフォレスト分類器をベースにしたモデルを利用するには、さらなる技術的なハードルが立ちふさがる。具体的には、マネジメントアレンジメントに関するアプリケーションでは、時間特性が必要となる(すなわち、データが特定の時間/日付と相関付けられており、モデルは予測を行う上でこの相関性を考慮する必要がある)。この時間特性が適切に保持されていないと、マネジメントアレンジメントに関するアプリケーションは実現できず、および/または、将来に関する予測はできない。これは特に、ランダムフォレスト分類器に基づくモデルで問題となる。ランダムフォレスト分類器は従来、時系列での将来の時点に基づく予測機能に限界があった。つまり、ランダムフォレスト分類器は現時点での分類に限定されている。例えば、ランダムフォレスト分類器は時間を認識しない。その代わり、ランダムフォレスト分類器では、系列依存性を特徴とする時系列データとは対照的に、観測値を独立かつ同一分布であると見なす。
【0005】
このような限界を克服するべく、ランダムフォレスト分類器用のシステムおよび方法のトレーニングデータは前処理によって各特徴ベクトルに時間インデックスを割り振る。例えば、所与のエンティティの特徴ベクトルはマネジメントアレンジメントデータを含むとしてよく、マネジメントアレンジメントデータは、基本データ、所得データ、市場データ、取引量データ、株主権データ、構造データ、在任期間/職務権限、関連企業数および/またはマネジメントアレンジメントに関する任意のその他のデータを含むとしてよい。後述するが、この前処理には、統計的変換、デトレンド、時間遅延の埋め込み、特徴量エンジニアリングのうちの1または複数が含まれるとしてよい。この前処理を行った後、ランダムフォレスト分類器を用いたモデルをトレーニングするとしてよい。
【0006】
このようにトレーニングされたモデルは、マネジメントアレンジメントに関するアプリケーションに適用された場合、1または複数の利点を実現することができる。第一に、当該モデルは、マネジメント変革の成功の可能性(例えば、新たに打ち出したアクティビズムキャンペーンの成功の可能性)についてだけでなく、マネジメント変革が起こる可能性(例えば、アクティビズムキャンペーンが開始される可能性)についても予測を提供するとしてよい。第二に、当該モデルは、現在のエンティティに対する予測を提供するために、現在のエンティティならびに/またはそれらのエンティティのマネジメントアレンジメントおよびマネジメントアレンジメントデータと、過去のマネジメントアレンジメント、および、マネジメント変革を特徴とするエンティティのマネジメントアレンジメントデータとを比較する複数の解釈ツールを提供してもよい。これに加えて、またはこれに代えて、当該モデルは、マネジメント変革の成功または発生の可能性に対する所与の特徴(例えば、マネジメントアレンジメントデータのカテゴリおよび/または値)の影響を特定する解釈ツールを提供してもよい。第三に、当該モデルは、特定の状況に対して調整可能であるべく、後処理を通じて、所与の時系列および他の要因(例えば、地理的に考慮すべき事柄)に基づき調整され得る出力を提供してもよい。
【課題を解決するための手段】
【0007】
一部の態様において、ランダムフォレスト分類器を用いて、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成するシステムおよび方法を記載する。例えば、当該システムは、第1のエンティティの第1のマネジメントアレンジメントに関する第1のデータを受信するとしてよく、第1のデータは、第1のエンティティの第1のマネジメント変革および第1の時間特性を含む。当該システムは、第1のデータに対して第1の特徴ベクトルを生成するとしてよく、第1の特徴ベクトルの第1の要素は、第1の時間特性に対応する。当該システムは、第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングして、第1のデータを第1のマネジメント変革に対応するものとして分類してもよい。当該システムは、第2のエンティティの第2のマネジメントアレンジメントに関する第2のデータを受信するとしてよく、第2のデータは、第2のエンティティの未知のマネジメント変革および第2の時間特性を含む。当該システムは、第2のデータに対して第2の特徴ベクトルを生成するとしてよく、第2の特徴ベクトルの第2の要素は、第2の時間特性に対応する。当該システムは、第2の特徴ベクトルをランダムフォレスト分類器に入力してもよい。当該システムは、ランダムフォレスト分類器から予測される第2のマネジメント変革に関する出力を受信してもよい。当該システムは、表示するためにユーザインターフェースにおいて、予測される第2のマネジメント変革に基づき予測値を生成してもよい。
【0008】
本発明のさまざまなその他の態様、特徴および利点が、以下の本発明の詳細な説明および添付の図面を参照することにより明らかとなる。また、上記の概要および以下の詳細な説明は共に例示に過ぎず、本発明の範囲を限定するものではないと理解されたい。本明細書および特許請求の範囲で用いる場合、単数形の「a」、「an」、および「the」は複数を示唆するものである。ただし、文脈によって別に解すべきことが明白な場合はこの限りでない。さらに、本明細書および特許請求の範囲で用いる場合、「または」という用語は「および/または」を意味する。ただし、文脈によって別に解すべきことが明白な場合はこの限りではない。また、「一部分」は、本明細書で用いる場合、文脈上明らかに異なる場合を除き、所与のアイテム(例えば、データ)の一部または全体(すなわち、部分全体)を指す。
【図面の簡単な説明】
【0009】
【
図1】1または複数の実施形態に応じた、予測される第2のマネジメント変革に基づく予測にアクセスするためのユーザインターフェースを説明するための一例を示している。
【0010】
【
図2】1または複数の実施形態に応じた、類似性に基づくエンティティと別のエンティティとの比較にアクセスするためのユーザインターフェースの別のインスタンスを説明するための一例を示す図である。
【0011】
【
図3】1または複数の実施形態に応じた、ランダムフォレスト分類器を用いて、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成するシステムを示す図である。
【0012】
【
図4】1または複数の実施形態に応じた、ランダムフォレスト分類器を使用してさまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成する際のステップのフローチャートである。
【0013】
【
図5】1または複数の実施形態に応じた、さまざまな種類のデータで予測を生成する際のステップを示すフローチャートである。
【0014】
【
図6】1または複数の実施形態に応じた、類似性に基づくエンティティと別のエンティティと比較を生成する際のステップを示すフローチャートである。
【発明を実施するための形態】
【0015】
以下の記載において、本発明の実施形態を完全に理解できるように、説明を目的として、多くの具体的且つ詳細な内容を記載する。しかしながら、当業者であれば、これらの具体的且つ詳細な内容がなくとも、または、均等な構成でも、本発明の実施形態が実施され得ることを理解するであろう。その他の場合には、本発明の各実施形態を不必要に不明瞭にすることを避ける目的で、周知の構造およびデバイスがブロック図の形式で示される。
【0016】
図1は、1または複数の実施形態に応じた、予測される第2のマネジメント変革に基づく予測にアクセスするためのユーザインターフェースを説明するための一例を示す図である。例えば、このシステムは、表示するために、複数のエンティティのマネジメントアレンジメントに関する公開されたデータに基づいて、1または複数のエンティティに対するそれぞれの予測を生成するとしてよい。これに加えて、またはこれに代えて、当該システムは、あるエンティティの予測と他のそれぞれの予測との比較に基づいて、複数のエンティティにおける当該エンティティの順位を決めてよい。例えば、ユーザインターフェース100は、エンティティのマネジメントアレンジメントおよびマネジメント変革に関するマネジメントアレンジメントデータおよび多数の予測を含む。ユーザインターフェース100のインスタンスは、エンティティが取り得るさまざまな行動が、マネジメント変革の可能性に与え得る影響を定量化する分析を表しているとしてよい。
図3を参照して説明するが、モデルおよび/または当該モデルが生成する予測は、バックテストされ、事前にアクティビズムを提供および予測することができる。アプリケーションは予測を生成するだけでなく、マネジメント変革の根本的な原因について独自の考察を実行する分析機能も内蔵している。
【0017】
エンティティのマネジメントアレンジメントとは、本明細書で説明する場合、エンティティの編成、エンティティが採用している管理方式、および/または、エンティティの制御権または経営権を持つ人物を含む。例えば、エンティティのマネジメントアレンジメントには、当該エンティティの管理方法、運営方法または編成方法、当該エンティティが企業体、非営利組織または政府機関であるか否かが含まれるとしてよい。マネジメントには、組織の戦略を設定する活動、資金、天然資源、技術、人材などの利用可能なリソースを活用して目的を達成するために、組織の従業員(またはボランティア)の労力を調整する活動が含まれる。マネジメントアレンジメントは、組織の運営者および/または運営者のエンティティにおける地位を指す場合もある。エンティティには、企業、パートナーシップ、非営利団体、政府機関、および/または、ある目的のために集められた人およびリソースの集団が含まれる。「マネジメント変革」は、本明細書において、アクティビズムキャンペーンの立ち上げを含む。アクティビズムキャンペーンは、投資家または株主が、エンティティのマネジメントアレンジメントを変えるために利用するべく、エンティティにおける一部の権益または支配権を取得することを含むとしてよい。「マネジメントアレンジメントデータ」は、本明細書で用いる場合、基本データ、所得データ、市場データ、取引量データ、株主権データ、構造データ、在任期間/職務権限、関連企業数および/またはマネジメントアレンジメントに関する任意のその他のデータを含むとしてよい。マネジメントアレンジメントデータは、前処理を行って時間インデックスを付与するとしてよい。
【0018】
予測102は、あるエンティティのマネジメント変革の確率と、他の複数のエンティティの中での当該エンティティのマネジメント変革の可能性の順位とを含む。例えばユーザインターフェース100は、本明細書で説明するようにアプリケーションによって生成されるとしてもよい。当該アプリケーションは、エンティティがアクティビズムの対象になるリスクおよび/またはマネジメント変革が起こるリスクを定量化するための分析プラットフォームであってよい。ユーザインターフェース100は、公開されているエンティティに関する大量のデータと共に過去のマネジメント変革(例えば、アクティビズムキャンペーンの立ち上げ)を分析する機械学習モデル(例えば、
図3において後述)に基づくとしてよい。当該アプリケーションは、地理的に分散且つ公開されている多岐にわたるエンティティのマネジメント変革の確率を計算するとしてよい。マネジメントアレンジメントデータ106は、エンティティの名称またはその他の識別子、ならびに/または、株価、評価および/あるいは他の情報などエンティティに関する情報を含むとしてよい。
【0019】
予測104および108は、マネジメント変革に対して特に関連性が高いか、または、影響が大きい特徴(例えば、マネジメントアレンジメントデータのカテゴリおよび/または値)を含むとしてよい。例えば、予測108は、マネジメント変革と相関性の高い主要な定性測定基準または定量測定基準を含むとしてよい。予測110は、マネジメント変革の過去の確率を含んでもよい。一部の実施形態では、予測110は、時系列における特定の時点に基づく確率および予測を含むとしてもよい(例えば、
図3を参照して後述する)。
【0020】
図2は、1または複数の実施形態に応じた、類似性に基づくエンティティと別のエンティティの比較にアクセスするためのユーザインターフェースの別のインスタンスを説明するための一例を示す図である。例えば、一部の実施形態では、当該システムは、エンティティのマネジメントアレンジメントに関するデータを受信するとしてよく、データは、エンティティのマネジメント変革および時間特性を含む。当該システムはこの後、当該データと他のエンティティのデータとの類似性を判断するとしてよい。当該システムは続いて、表示するために、ユーザインターフェース(例えば、ユーザインターフェース200)において、類似性に基づいて当該エンティティと他のエンティティとの比較を生成してもよい。一部の実施形態では、この比較は、当該エンティティのマネジメント変革の結果を含む。
【0021】
ユーザインターフェース200は、複数の比較可能なエンティティ202を含む。比較可能なエンティティ202は、類似度がしきい値以上の複数のエンティティを含んでもよい(例えば、
図6を参照して後述する)。ユーザインターフェース200はまた、比較可能なエンティティ202の1または複数のカテゴリ(例えば、カテゴリ208)のマネジメントアレンジメントデータを含むとしてもよい。ユーザインターフェース200は、一部の実施形態において、比較可能なエンティティ202の複数のカテゴリのマネジメントアレンジメントデータに対するそれぞれの値、および/または、それぞれの値の比較を含むとしてよい。ユーザインターフェース200はさらに、1または複数のカテゴリに対する値(例えば、値204)を含むとしてもよい。これらの値は、比較可能なエンティティ202の各々がカテゴリ208にどの程度対応するか、および/または、存在するかを表現する定性値または定性値であってもよい。
【0022】
ユーザインターフェース200はまた、比較可能なエンティティ202のマネジメント変革に関する1または複数のカテゴリを含むとしてもよい(例えば、カテゴリ210)。ユーザインターフェース200は、一部の実施形態において、比較可能なエンティティ202のマネジメント変革の複数のカテゴリのマネジメントアレンジメントデータに対するそれぞれの値、および/または、それぞれの値の比較を含むとしてよい。ユーザインターフェース200はさらに、1または複数のカテゴリに対する値(例えば、値212)を含むとしてもよい。これらの値は、比較可能なエンティティ202の各々がカテゴリ210にどの程度対応するか、および/または、存在するかを表現する定性値または定性値であってもよい。
【0023】
ユーザインターフェース200はさらに、推奨事項206も含むとしてもよい。推奨事項206は、マネジメントアレンジメントデータ、マネジメント変革、および/または、カテゴリおよびその値の比較に基づくとしてよい。例えば、推奨事項206は、マネジメントアレンジメントデータ、マネジメント変革、および/または、カテゴリおよびその値の比較に基づく定性表現または定量表現(例えば、文字表現、視覚表現、グラフィック表現等)を提供するとしてよい。
【0024】
図3は、1または複数の実施形態に応じた、ランダムフォレスト分類器を使用して、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成するシステムを示す図である。
図3に示すように、システム300は、ユーザデバイス322、ユーザデバイス324および/またはその他の構成要素を備えるとしてよい。各ユーザデバイスには、任意の種類のモバイル端末、固定端末または他の装置が含まれるとしてよい。各デバイスは、入出力(以下、「I/O」)経路を介してコンテンツおよびデータを受け取るとしてよく、さらにI/O経路を使用してコマンド、要求およびその他の適切なデータを送受信するプロセッサおよび/または制御回路も含むとしてよい。制御回路は、任意の適切な処理回路で構成するとしてよい。各デバイスはさらに、データの受信および表示に用いるユーザ入力インタフェースおよび/またはディスプレイ(例えば、ユーザインターフェース100(
図1))を含むとしてよい。一例として、ユーザデバイス322およびユーザデバイス324は、デスクトップコンピュータ、サーバ、またはその他のクライアントデバイスを含むとしてもよい。ユーザは、例えば、ユーザデバイスのうち1または複数を利用して、お互いと、1または複数のサーバと、または、システム300のその他の構成要素とやり取りを行うとしてよい。システム300の特定の構成要素が実行するものとして1または複数の処理を本明細書で説明するが、これらの処理は、一部の実施形態では、システム300の他の構成要素によって実行し得るものであることに留意されたい。一例として、ユーザデバイス322の構成要素が実行する処理として本明細書で説明する1または複数の処理は、一部の実施形態において、ユーザデバイス324の構成要素によって実行されるとしてよい。システム300はさらに、機械学習モデル302を含む。機械学習モデル302は、ユーザデバイス322およびユーザデバイス324に実装されるとしてもよく、または、それぞれ通信経路328および330を介してアクセス可能であるとしてもよい。機械学習モデルに関するものとして一部の実施形態が本明細書に記載されているが、他の実施形態では他の予測モデル(例えば、統計モデルまたは他の分析モデル)を機械学習モデルの代わりにまたは機械学習モデルに加えて使用してもよいことに留意されたい(例えば、1または複数の実施形態では、機械学習モデルに代えて統計モデル、および非機械学習モデルに代えて非統計モデルを使用してもよい)。
【0025】
これらのデバイスはそれぞれ、電子ストレージとしてメモリをさらに含むとしてもよい。電子ストレージは、情報を電子的に記憶する非一時的記憶媒体を含むとしてよい。媒体のうち電子ストレージには、(i)サーバまたはクライアントデバイスと一体に(例えば、実質的に着脱不能に)設けられたシステムストレージ、および/または、(ii)例えばポート(例えば、USBポート、ファイヤーワイヤポート等)またはドライブ(例えば、ディスクドライブ等)を介してサーバまたはクライアントデバイスに着脱可能に接続されたリムーバブルストレージが含まれるとしてよい。電子ストレージには、光学的に読み取り可能な記憶媒体(例えば、光学ディスク等)、磁気的に読み取り可能な記憶媒体(例えば、磁気テープ、磁気ハードドライブ、フロッピードライブ等)、電荷型記憶媒体(例えば、EEPROM、RAM等)、ソリッドステート記憶媒体(例えば、フラッシュドライブ等)、および/または、これら以外の電子的に読み取り可能な記憶媒体が含まれるとしてよい。電子ストレージは、仮想ストレージリソース(例えば、クラウドストレージ、仮想プライベートネットワーク、および/またはこれら以外の仮想ストレージリソース)を含むとしてよい。電子ストレージは、ソフトウェアアルゴリズム、プロセッサが決定した情報、サーバから取得した情報、クライアントデバイスから取得した情報、または、本明細書に記載する機能を可能とする他の情報を記憶してもよい。
【0026】
一部の実施形態において、システム300は、ソースコードプログラミングプロジェクトのコントリビュータ性能を監視するべくソフトウェア開発バージョン管理システムを提供するための複数のクラウドベースコンポーネントを含むクラウドベースシステムを表す場合がある。クラウドベースシステムは、メモリ、制御回路、および/またはI/O回路などのコンポーネントを含むとしてよい。このような実施形態では、システム300および/またはシステム300の1または複数の機能は、複数の場所および/またはデバイスに分散させるとしてもよい。
【0027】
図3はさらに、通信経路328、330、332を含む。通信経路328、330および332は、インターネット、携帯電話ネットワーク、モバイル音声ネットワークまたはモバイルデータネットワーク(例えば、4GネットワークまたはLTEネットワーク)、ケーブルネットワーク、公衆交換電話網、または、その他の種類の通信ネットワークもしくは複数の通信ネットワークの組み合わせを含むとしてよい。通信経路328、330、および332は、衛星経路、光ファイバ経路、ケーブル経路、インターネット通信(例えば、IPTV)をサポートする経路、フリースペース接続(例えば、放送または他の無線信号用)、または他の任意の適切な有線通信経路もしくは無線通信経路またはこのような経路の組み合わせなどの、1以上の通信経路を含むことができる。コンピューティングデバイスは、協働する複数のハードウェアコンポーネント、ソフトウェアコンポーネントおよび/またはファームウェアコンポーネントを接続する通信経路をさらに含むとしてよい。例えば、コンピューティングデバイスは、コンピューティングデバイスとして協動する多数のコンピューティングプラットフォームによって実装されてもよい。
【0028】
一例として、
図3に示すように、機械学習モデル302が入力304を取り込み、出力306を提供してもよい。入力には、トレーニングデータセットおよびテストデータセット等、複数のデータセットが含まれるとしてよい。複数のデータセット(例えば、入力304)はそれぞれ、共通の特性を有するデータサブセットを含むとしてもよい。例えば、入力304は、過去、現在、および/または将来のアクティビズムキャンペーンに関する情報を含むとしてよい。これに加えて、またはこれに代えて、入力304は、マネジメントアレンジメントデータを含むとしてよい。「マネジメントアレンジメントデータ」は、本明細書で用いる場合、基本データ、所得データ、市場データ、取引量データ、株主権データ、構造データ、在任期間/職務権限、関連企業数および/またはマネジメントアレンジメントに関する任意のその他のデータを含むとしてよい。マネジメントアレンジメントデータは、前処理を行って時間インデックスを付与するとしてよい。
【0029】
一部の実施形態において、機械学習モデル302は、ランダムフォレスト分類器に基づくものであってもよい。ランダムフォレスト分類器は、複数の決定木を含むとしてよい。各決定木は、別個の分類を実現するとしてよい。そして、システムは、さまざまな個々の分類を平均化すること(または、個々の分類の総合的な定性評価または定量評価を提供する別の操作または機能を利用すること)に基づいて、クラスを予測するとしてよい。ランダムフォレスト分類器は、相関性の低い複数の決定木を含むとしてもよい。例えば、相関のない(または多様な)決定木(またはモデル)を使用すると、ランダムフォレスト分類器で使用した場合には、より正確な予測が得られる場合がある。
【0030】
システムは、多様性を確保するべく、各決定木が置換を行いつつデータセットからランダムにサンプリングすることができるブートストラップアグリゲーティングを使用するとしてよい。例えば、トレーニングデータセットのサイズがNの場合、各決定木は、トレーニングデータセットのうちのデータサブセットでトレーニングされるとしてよく、当該サブセットでは置換によってトレーニングデータセットの合計サイズがNのサイズのままであることが保証される。これに加えて、またはこれに代えて、当該システムは特徴ランダム性を利用して多様性を確保してもよい。例えば、ランダムフォレストの各決定木は、(例えば、すべての可能な特徴とは対照的に)複数の特徴のうちランダムなサブセットからしか選択できない場合がある。
【0031】
しかしながら、ランダムフォレスト分類器に基づくモデルをマネジメントアレンジメントに関連するアプリケーションに使用すると、技術面から見てさらなるハードルが立ちふさがる。具体的には、マネジメントアレンジメントに関するアプリケーションでは、時間特性が必要とされる(すなわち、データが特定の時間/日付と相関付けられており、モデルは予測を行う上でこの相関付けを考慮する必要がある)。したがって、トレーニングに用いる各特徴ベクトルには、時間インデックスの付与が必要である。
【0032】
この時間特性が適切に保持されていないと、マネジメントアレンジメントに関するアプリケーションは実現できず、および/または、将来に関する予測はできない。これは特に、ランダムフォレスト分類器に基づくモデルで問題となる。ランダムフォレスト分類器は従来、時系列における将来の時点に基づく予測機能に限界があった。つまり、ランダムフォレスト分類器は現在時刻の分類に限定されている。例えば、ランダムフォレスト分類器は時間を認識しない。その代わり、ランダムフォレスト分類器では、系列依存性を特徴とする時系列データとは対照的に、観測値を独立同分布であると見なす。
【0033】
このような制限を克服するべく、ランダムフォレスト分類用のシステムおよび方法のトレーニングデータは前処理によって各特徴ベクトルに時間インデックスを割り振る。例えば、所与のエンティティの特徴ベクトルはマネジメントアレンジメントデータを含むとしてよく、マネジメントアレンジメントデータは、基本データ、所得データ、市場データ、取引量データ、株主権データ、構造データ、在任期間/職務権限、関連企業数および/またはマネジメントアレンジメントに関する任意のその他のデータを含むとしてよい。特徴ベクトルの時間インデックスは、特徴ベクトルにおけるデータの時間に対応するとしてもよい。
【0034】
前処理には、統計的変換、デトレンド、時間遅延の埋め込みまたは特徴量エンジニアリングのうちの1または複数が含まれるとしてよい。この前処理により、ランダムフォレスト分類器で処理するべき時系列情報が破壊される可能性がある。統計的変換には、Box-Cox変換(例えば、非正規分布の従属変数を正規分布に変換する)またはべき乗変換(例えば、べき乗関数を用いたデータの単調変換)が含まれるとしてよい。デトレンドには、測定値と当該測定値の発生時刻とを関連付けることによって、一連の測定値を時系列として処理し、トレンドを推定することで、データの傾向について推定しステートメントを正当化することが含まれるとしてよい。デトレンドには、ディファレンシング(differencing)、STL、SEATSが含まれるとしてよい。ディファレンシングとは、時系列データを定常状態にするために実行する変換である。時間遅延埋め込みは、動的システムモデルに履歴情報を含めることに関するもので、特徴量エンジニアリングには、モデルにラグ、ローリング統計、フーリエ項、時間ダミーなどを組み込むことが含まれるとしてよい。
【0035】
前処理を行った後、ランダムフォレスト分類器を用いたモデルをトレーニングするとしてよい。トレーニングされたモデルは、マネジメントアレンジメントに関連するアプリケーションに適用された場合、1または複数の利点を実現するとしてよい。第一に、当該モデルは、マネジメント変革の成功の可能性(例えば、新たに打ち出したアクティビズムキャンペーンの成功の可能性)についてだけでなく、マネジメント変革が起こる可能性(例えば、アクティビズムキャンペーンが今後開始される可能性)についても予測を提供することができる。第二に、当該モデルは、現在のエンティティに対する予測を提供するために、現在のエンティティならびに/またはそれらのエンティティ用のマネジメントアレンジメントおよびマネジメントアレンジメントデータと、マネジメント変革を特徴とするエンティティの過去のマネジメントアレンジメントおよびマネジメントアレンジメントデータとを比較する複数の解釈ツールを提供してもよい。これに加えて、またはこれに代えて、当該モデルは、マネジメント変革の成功または発生の可能性に対する所与の特徴(例えば、マネジメントアレンジメントデータのカテゴリおよび/または値)の影響を特定する解釈ツールを提供してもよい。第三に、当該モデルは、特定の状況に対して調整可能であるべく、後処理を通じて所与の時系列要因および他の要因(例えば、地理的に考慮すべき事柄)に基づき調整され得る出力を提供してもよい。
【0036】
後処理は、ランダムフォレスト分類器の出力をある確率モデルから別の確率モデルに変換することを含むとしてよい。例えば、ランダムフォレスト分類器の出力は、尤度比に基づく予測確率であってよい。尤度比とは、所与のテスト結果が対象クラスを持つデータで期待される尤度の、同じ結果が対象クラスを持たないデータで期待される尤度に対する比である。一部の実施形態では、この確率(または確率の分布)は、観察された割合とは異なる場合がある。例えば、システムは確率を正規分布またはベルヌーイ分布からベータ分布に変換するとしてよい。ベータ分布において、確率分布は、αおよびβで示される2つの正の形状パラメータによってパラメータ化された区間[0、1]で定義される。αおよびβは、確率変数の指数であり、分布形状を左右する。別の例では、ランダムフォレスト分類器の出力は、変数群とそれらの条件付き依存関係を有向非巡回グラフによって表現するベイジアンネットワークに変換されるとしてよい。そしてベイジアンネットワークは、所与のマネジメント変革について影響を与える特徴を決定するために使用されるとしてよい。
【0037】
一部の実施形態において、出力306は、(例えば、単独で、もしくは、出力306の精度に関するユーザの指示、入力に関連するラベルまたはその他の参照フィードバック情報と組み合わせて)機械学習モデル302をトレーニングするための入力として機械学習モデル302にフィードバックされてもよい。別の実施形態では、機械学習モデル302は、予測(例えば、出力306)および参照フィードバック情報(例えば、精度に関するユーザの指示、参照ラベルまたはその他の情報)の評価に基づいて、その構成(例えば、重み、バイアスまたはその他のパラメータ)を更新してもよい。別の実施形態では、機械学習モデル302がニューラルネットワークである場合、結合重みは、ニューラルネットワークの予測と参照フィードバックとの間の差異を調整するように調整されてもよい。更なる使用例では、ニューラルネットワークの1または複数のニューロン(またはノード)は、更新プロセス(例えば、誤差逆伝播)を容易にするために、それぞれの誤差がニューラルネットワークを介して自身に送り返されるように要求してもよい。結合重みの更新は、例えば、順伝播が完了した後に後方に伝搬させる誤差の大きさが反映されてもよい。このようにして、例えば、生成する予測を改善するべく機械学習モデル302をトレーニングするとしてよい。
【0038】
一部の実施形態において、機械学習モデル302は、人工ニューラルネットワークを含むとしてよい。このような実施形態では、機械学習モデル302は、入力層と1または複数の隠れ層とを含んでもよい。機械学習モデル302の各ニューラルユニットは、機械学習モデル302の他の多くのニューラルユニットと結合されているとしてよい。このような結合は、接続されているニューラルユニットの活性状態に対して、補強的または阻害的に影響を与え得る。一部の実施形態では、各ニューラルユニットは、自身に入力された値を全て組み合わせる合算機能を持つとしてよい。一部の実施形態では、各結合(またはニューラルユニット自体)は、閾値機能を持つとしてよく、信号が他のニューラルユニットへと伝播する前に、信号が超過しなければならない。機械学習モデル302は、明示的にプログラミングされるのではなく自動で学習しトレーニングされ得るものであり、従来のコンピュータプログラムに比べて所定の分野の問題解決において性能が大きく優れているとしてよい。トレーニング中、機械学習モデル302の出力層は、機械学習モデル302のある分類に対応するとしてよく、その分類に対応することが知られている入力は、トレーニング中に機械学習モデル302の入力層に入力されるとしてよい。テスト時には、分類が既知でない入力が入力層に入力され、分類が決定されて出力されるとしてよい。
【0039】
一部の実施形態では、機械学習モデル302は複数の層を持つとしてよい(例えば、信号経路は上位層から下位層へと横断している)。一部の実施形態では、機械学習モデル302がバックプロパゲーションを利用するとしてよく、この場合、前方向の刺激を利用して「上位層」のニューラルユニットへの重みをリセットする。一部の実施形態では、機械学習モデル302に対する刺激および阻害は、結合の相互作用がより混沌且つより複雑になるほど、流動性が高くなるとしてよい。テスト時には、機械学習モデル302の出力層は、所与の入力が機械学習モデル302のある分類に対応するか否かを示してもよい(例えば、所与の第1のタイプのソリューションに対するプログラミング時間の決定された平均長さに基づき、プログラミング時間の第1の長さを決定するとしてよい)。
【0040】
図3に示すように、機械学習モデル302は、ユーザデバイス324に表示される予測334となる出力を生成している。予測334は、
図1および
図2を参照して上述した情報だけでなく、
図4から
図6と共に後述するような追加の情報を含むとしてよい。例えば、一部の実施形態では、予測334は、ユーザインターフェース100(
図1)またはユーザインターフェース200(
図2)のインスタンスに対応するとしてよい。
【0041】
図4は、1または複数の実施形態に応じた、ランダムフォレスト分類器を使用して、さまざまな時間特性を有するデータを処理してマネジメントアレンジメントに関する予測を生成する際のステップのフローチャートである。例えば、プロセス400は、
図1から
図3に示すような1または複数のデバイスが実行するステップを表すとしてよい。
【0042】
ステップ402において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)第1のエンティティの第1のマネジメントアレンジメントに関する第1のデータを受信する。例えば、当該システムは、制御回路を利用して、第1のエンティティの第1のマネジメントアレンジメントに関する第1のデータを受信するとしてよく、第1のデータは、第1のエンティティの第1のマネジメント変革(例えば、アクティビズムキャンペーンの開始)および第1の時間特性(例えば、日付)を含む。例えば、第1のマネジメント変革は、第1のマネジメントアレンジメントに対する第1のアクティビズムキャンペーンの開始を含むとしてよい。時間特性は、過去の日付に関するものであってもよい。
【0043】
ステップ404において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)第1のデータに対する第1の特徴ベクトルを生成する。例えば、当該システムは、制御回路を用いて第1のデータに対して第1の特徴ベクトルを生成するとしてよく、第1の特徴ベクトルの第1の要素は、第1の時間特性に対応する。時間特性は、特徴ベクトルを指標とする時間値に対応するとしてよい。時間値は、特徴ベクトルに対応するマネジメントアレンジメントデータの日付を示すとしてよい。
【0044】
ステップ406において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングし、第1のデータを第1のマネジメント変革に対応するものとして分類する。例えば、当該システムは、制御回路を用いて第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングして、第1のデータを第1のマネジメント変革に対応するものとして分類してもよい。一部の実施形態において、第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングして、第1のデータを第1のマネジメント変革に対応するものとして分類することは、過去のマネジメントアレンジメントおよび過去のマネジメント変革に関する過去のデータに対してランダムフォレスト分類器をバックテストすることを含む。例えば、当該システムは、バックテストにより、過去に用いられたものと仮定して、ランダムフォレスト分類器の性能を推定するとしてよい。このような場合、当該システムは、過去のデータを用いて十分詳細な点まで過去の状況をシミュレートするとしてよい。一部の実施形態では、システムは、オーバーフィッティングを防ぐためにバックテストを制限してもよく、および/または、オーバーフィッティングを防ぐために追加のトレーニング技術を採用してもよい。
【0045】
一部の実施形態において、ランダムフォレスト分類器は時系列分類器であってもよく、予測される第2のマネジメント変革は他の時間特性とは異なる時間特性であってもよい。例えば、予測される第2のマネジメント変革の時間特性は、将来であってもよい。
【0046】
ステップ408において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第2のエンティティの第2のマネジメントアレンジメントに関する第2のデータを受信する。例えば、当該システムは、制御回路を利用して、第2のエンティティの第2のマネジメントアレンジメントに関する第2のデータを受信するとしてよく、第2のデータは、第2のエンティティの未知のマネジメント変革(例えば、アクティビズムキャンペーンが立ち上げられるのか否か)および第2の時間特性(例えば、日付)を含む。時間特性は、現在または将来の日付に関するものであってもよい。一部の実施形態では、当該システムは、複数のエンティティのマネジメントアレンジメントに関する公開データのレビューを開始するユーザ入力を(例えば、ユーザインターフェース100(
図1)またはユーザインターフェース200(
図2)を介して)受信するとしてよい。システムは、レビューに応答して、第2のデータについてデータソース(例えば、システム300(
図3)に組み込まれたデータソースおよび/またはシステム300がアクセス可能なデータソース)に対してクエリを実行するとしてよく、第2のデータはクエリに応答して受信される。
【0047】
ステップ410で、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第2のデータについて第2の特徴ベクトルを生成する。例えば、当該システムは、制御回路を用いて第2のデータに対して第2の特徴ベクトルを生成するとしてよく、第2の特徴ベクトルの第2の要素は、第2の時間特性に対応する。
【0048】
ステップ412において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第2の特徴ベクトルをランダムフォレスト分類器に入力する。例えば、当該システムは、制御回路を用いて第2の特徴ベクトルをランダムフォレスト分類器に入力してもよい。
【0049】
ステップ414において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、予測される第2のマネジメント変革に関する出力をランダムフォレスト分類器から受信する。例えば、当該システムは、制御回路を用いて、予測される第2のマネジメント変革に関する出力をランダムフォレスト分類器から受信してもよい。
【0050】
ステップ416において、プロセス400は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、予測される第2のマネジメント変革に基づく予測を表示するために生成する。例えば、当該システムは、表示するためにユーザインターフェースにおいて、予測される第2のマネジメント変革に基づき予測を生成してもよい。一部の実施形態において、第1のマネジメント変革は、第1のマネジメントアレンジメントに対する第1のアクティビズムキャンペーンの立ち上げを含むとしてよく、予測される第2のマネジメント変革に基づく予測は、第2のマネジメントアレンジメントに対する第2のアクティビズムキャンペーンの立ち上げの確率を含むとしてよい。
【0051】
一部の実施形態では、当該システムは、
図1および
図2に示すような1または複数の特徴を生成するために、さらに追加のステップを実行するとしてよい。例えば、当該システムは、ベイズ分類器に基づいて、出力を指数分布から確率に変換してもよい。予測は確率を含む。これに加えて、またはこれに代えて、当該システムは特定の情報を含む予測を生成するとしてもよい。例えば、当該システムは、第1のマネジメント変革を示す第1のデータの第1のデータ構成要素(例えば、第1のエンティティの株価のフィールドまたはカテゴリ)を決定してもよい。続いて、当該システムは、第1のデータ構成要素に対応する第2のデータの第2のデータ構成要素(例えば、第2のエンティティの株価のフィールドまたはカテゴリ)を決定してもよい。当該システムは次に、予測における第2のデータ構成要素の表現を表示するために生成するとしてよい。これに加えて、またはこれに代えて、当該システムは、特定の値(例えば、株価の値)に関する情報を生成するとしてよい。例えば、当該システムは、第1のマネジメント変革を示す第1のデータ構成要素の第1の値(例えば、第1のエンティティの株価の値)を決定してもよい。システムは続いて、第1の値に対応する第2のデータ構成要素の第2の値(例えば、第2のエンティティの株価の値)を決定するとしてよい。当該システムは次に、予測における第2の値の表現を表示するために生成するとしてよい。
【0052】
図4のステップまたは説明は本開示の任意の他の実施形態で利用され得るものと考えられる。また、
図4を参照して説明したステップおよび説明は、本開示内容の目的を実現するべく、別の順序でまたは並行して実施するとしてもよい。例えば、各ステップは、システムまたは方法での遅延を減らすべく、または、システムまたは方法を高速化するべく、任意の順序で、または並行して、または実質的に同時に実行することができる。さらに、
図1から
図3を参照して説明したデバイスまたは機器のいずれもが、
図4のステップのうち1または複数のステップを実行するために使用され得ることに留意されたい。
【0053】
図5は、1または複数の実施形態に従って、さまざまな種類のデータを含む予測を生成する際のステップを示すフローチャートである。例えば、このシステムは、表示するために、複数のエンティティのマネジメントアレンジメントに関する公開されたデータに基づいて、複数のエンティティに対するそれぞれの予測を生成するとしてよい。これに加えて、またはこれに代えて、当該システムは、あるエンティティの予測と他のそれぞれの予測との比較に基づいて、複数のエンティティにおける当該エンティティの順位を決めてよい。例えば、プロセス500は、
図1から
図3に示すような1または複数のデバイスが実行するステップを表現しているとしてよい。
【0054】
ステップ502において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第1のエンティティについての予測に対するクエリを受信する。例えば、クエリは、ユーザがユーザインターフェース100(
図1)にアクセスすること、および/または、ユーザがユーザインターフェース100(
図1))においてアイコンを選択することに応答して、システムが生成するとしてよい。
【0055】
ステップ504において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、予測に比較可能なエンティティが含まれているか否かを決定する。含まれていれば、プロセス500はステップ506に進む。例えば、システムは、予測に含まれる情報および予測に付随する情報を決定する際に、さまざまな基準を使用するとしてよい。システムは、ユーザ入力に基づき1または複数の基準を選択するとしてもよいし、アプリケーションの設定に基づき自動的に選択するとしてもよい。含まれていなければ、プロセス500はステップ512に進む。
【0056】
ステップ506において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、予測を生成する際に使用するための比較可能なエンティティを決定する。これは、例えば、一部の実施形態において
図6で後述するように、2つのエンティティの類似性を決定することを含むとしてよい。システムは、比較可能なエンティティを決定することに応答して、比較可能なエンティティ(または比較可能なエンティティを特定する情報)を格納し、ステップ508に進むとしてよい。
【0057】
ステップ508において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポ-ネントの制御回路を介して)、予測に比較可能なエンティティのマネジメントアレンジメントデータが含まれているか否かを判断する。含まれていれば、プロセス500はステップ510に進む。含まれていなければ、プロセス500はステップ512に進む。
【0058】
ステップ510において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、比較可能なエンティティに対するマネジメントアレンジメントデータを決定する。これは、例えば、一部の実施形態では、第1のエンティティの現在または過去の情報と比較する際に用いるべく、エンティティに関する情報を決定することを含んでもよい。例えば、当該システムは、第1のマネジメント変革を示す第1のデータの第1のデータ構成要素(例えば、第1のエンティティの取締役会の構成のフィールドまたはカテゴリ)を決定してもよい。続いて、当該システムは、第1のデータ構成要素に対応する第2のデータの第2のデータ構成要素(例えば、第2のエンティティの取締役会の構成のフィールドまたはカテゴリ)を決定してもよい。当該システムは次に、予測における第2のデータ構成要素の表現を表示するために生成するとしてよい。システムは、これに加えて、またはこれに代えて、特定の値(例えば、取締役会のメンバーの数などの取締役会の構成を示す値、および/または、構成の定量評価または定性評価を表す他の値)についての情報を生成してもよい。例えば、当該システムは、第1のマネジメント変革を示す第1のデータ構成要素の第1の値(例えば、第1のエンティティの取締役会の構成の値)を決定してもよい。システムは続いて、第1の値に対応する第2のデータ構成要素の第2の値(例えば、第2のエンティティの取締役会の構成の値)を決定するとしてよい。
【0059】
ステップ512において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)予測に追加の情報が何か含まれているか否かを判断する。含まれていれば、プロセス500はステップ514に進む。含まれていなければ、プロセス500はステップ516に進む。
【0060】
ステップ514において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第1のエンティティに関する追加の情報を決定する。追加の情報は、例えば、
図1および
図2に示す第1のエンティティに関連する情報のいずれかを含むとしてよい。これには、名称、収入データ、市場データ、取引量、株主権など、および/または、マネジメントアレンジメントの評価に関連し得る任意のその他の情報が含まれるとしてよい。
【0061】
ステップ516において、プロセス500は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、プロセス500で決定した情報に基づいて予測を生成する。例えば、プロセス500で決定した情報は、ユーザインターフェース(例えば、ユーザインターフェース100(
図1)またはユーザインターフェース200(
図2))をポピュレートする際にシステムが利用するとしてよい。
【0062】
図5のステップまたは説明は、本開示の他の任意の実施形態で使用され得ると考えられる。さらに、
図5を参照して説明したステップおよび説明は、本開示の目的をさらに実現するべく、別の順序で、または並行して行われてもよい。例えば、各ステップは、システムまたは方法での遅延を減らすべく、または、システムまたは方法を高速化するべく、任意の順序で、または並行して、または実質的に同時に実行するとしてよい。さらに、
図1から
図3を参照しつつ説明したデバイスまたは機器のいずれもが、
図5のステップのうち1または複数を実行するために利用され得ることに留意されたい。
【0063】
図6は、1または複数の実施形態に応じた、類似性に基づくエンティティと別のエンティティとの比較を生成する際のステップを示すフローチャートである。例えば、一部の実施形態では、当該システムは、エンティティのマネジメントアレンジメントに関するデータを受信するとしてよく、データは、エンティティのマネジメント変革および時間特性を含む。当該システムはこの後、当該データと他のエンティティのデータとの類似性を判断するとしてよい。そして、システムは、表示するためにユーザインターフェース(例えば、ユーザインターフェース200(
図2))において、類似性に基づく当該エンティティと他のエンティティとの比較を生成するとしてよい。一部の実施形態では、この比較は、当該エンティティのマネジメント変革の結果を含む。例えば、プロセス600は、
図1から
図3に示すような1または複数のデバイスが実行するステップを表現するとしてよい。
【0064】
ステップ602において、プロセス600は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)第1のエンティティのマネジメントアレンジメントに関するデータを受信する。例えば、所与のエンティティについて、当該システム(例えば、モデル302(
図3))は、マネジメントアレンジメント、マネジメントアレンジメントデータ、マネジメント変革、および/または、マネジメント変革データに関連する測定基準のうち最も関連性が高い測定基準に関して最も類似性が高い比較可能なエンティティ、および/または、過去にマネジメント変革(例えば、アクティビズムキャンペーン)を経験したことがある比較可能なエンティティを特定する。
【0065】
ステップ604において、プロセス600は(例えば、システム300(
図3)の1つまたは複数のコンポーネントの制御回路を介して)、第2のエンティティのマネジメントアレンジメントに関連するデータを受信する。一部の実施形態では、システムは、同様の産業から第2のエンティティを取得するとしてよい。一部の実施形態では、システムは、さまざまな産業のエンティティ間の類似性を決定するとしてよい(例えば、システムは、類似していると指定する際に、異なる産業のエンティティを除外しないとしてもよい)。例えば、システムは、前例となるマネジメント変革の状況を鑑みて、基本的なマネジメントアレンジメントデータの類似性に基づいて、「有効ピアグループ」を決定するとしてよい。
【0066】
ステップ606において、プロセス600は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第1のエンティティと第2のエンティティとについてデータの類似性を決定する。例えば、歴史的に対象となったエンティティと第1のエンティティの類似性から、第1のエンティティでマネジメント変革が発生する可能性が高い具体的な理由を指摘することができる。
【0067】
ステップ608において、プロセス600は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、類似度がしきい値を超えるか否かを判断する。例えば、システムは、エンティティの数、産業、期間、および/または他の要因に基づいてしきい値を取得するとしてよい。しきい値は、業界標準に基づいて決定されるとしてもよいし、および/または、ユーザによって(例えば、ユーザインターフェース100(
図1)を介して)調整されるとしてもよい。越えていれば、プロセス600はステップ610に進む。類似度がしきい値を超えない場合、プロセス600はステップ604に戻り、異なるエンティティに関するデータを受信する。
【0068】
ステップ610において、プロセス600は(例えば、システム300(
図3)の1または複数のコンポーネントの制御回路を介して)、第1および第2のエンティティが比較可能であると決定する。例えば、システムは、第1および第2のエンティティが比較可能であると判断することに応じて、(例えば、第1および第2のエンティティの比較を生成する際に使用するため)第2のエンティティに関する追加の情報を決定するとしてよい。一部の実施形態において、システムは、類似しているエンティティを比較するユーザインターフェースのインスタンス(例えば、
図2を参照)において、第2のエンティティを使用することを決定するとしてよい。例えば、システムは、ある一群の「比較可能な過去のアクティビズムの状況」を決定し、マネジメント変革同士の共通点を表示するために生成し、マネジメント変革の引き金となった要因および/または影響力のある特徴に関するユーザへの推奨事項(例えば、推奨事項206(
図2))をシステムが生成できるようにしてもよい。
【0069】
一部の実施形態では、システムは、影響力の強い特徴の分析を従来の測定基準のピア比較と組み合わせて、包括的な説明を伴う予測(例えば、ユーザインターフェース100(
図1)において推奨事項として提示される)を生成するとしてよい。例えば、システムは、エンティティでマネジメント変革が発生する可能性に与える影響が最も強い特徴を列挙することができる。システムは、モデル出力(例えば、マネジメント変革の可能性)と統計的関連性が最も高いモデル入力が影響力の強い特徴となるように、統計的学習モデルを使用してもよい。
【0070】
図6のステップまたは説明は、本開示の他の任意の実施形態で使用され得ると考えられる。さらに、
図6を参照しつつ説明したステップおよび説明は、本開示の目的を実現するべく別の順序で、または並行して実行されてもよい。例えば、各ステップは、システムまたは方法での遅延を減らすべく、または、システムまたは方法を高速化するべく、任意の順序で、または並行して、または実質的に同時に実行することができる。さらに、
図1から
図3を参照して説明したデバイスまたは機器のいずれも、
図6のステップの1または複数を実行するために使用され得ることに留意されたい。
【0071】
本開示の上述した実施形態は、例示のために記載したものであって、これらに限定されるものではなく、本開示は、後述する請求項によってのみ限定されるものである。さらに、任意の一実施形態で説明した特徴および制限事項は、本明細書の他の任意の実施形態に適用することができ、一実施形態に関するフローチャートまたは例は、他の任意の実施形態と適切な方法で組み合わせ、異なる順序で実行し、または並行して実行し得ることに留意されたい。さらに、本明細書に記載したシステムおよび方法は、リアルタイムで実行することができる。上述したシステムおよび/または方法は、他のシステムおよび/または方法に適用され得ること、または、他のシステムおよび/または方法に従って利用し得ることにも留意されたい。
【0072】
本発明に係る技術は、以下に列挙した実施形態を参照することにより、よりよく理解されるであろう。
<実施形態1>
ランダムフォレスト分類器を用いてマネジメントアレンジメントに関する予測を生成するためにさまざまな時間特性を有するデータを処理する方法であって、制御回路を用いて第1のエンティティの第1のマネジメントアレンジメントに関する第1のデータを受信することであって、第1のデータは第1のエンティティの第1のマネジメント変革および第1の時間特性を含む、受信することと、制御回路を用いて第1のデータに対する第1の特徴ベクトルを生成することであって、第1の特徴ベクトルの第1の要素は第1の時間特性に対応する、生成することと、制御回路を用いて第1の特徴ベクトルに基づきランダムフォレスト分類器をトレーニングして、第1のデータを第1のマネジメント変革に対応するものと分類することと、制御回路を用いて第2のエンティティの第2のマネジメントアレンジメントに関する第2のデータを受信することであって、第2のデータは第2のエンティティの未知のマネジメント変革および第2の時間特性を含む、受信することと、制御回路を用いて第2のデータに対する第2の特徴ベクトルを生成することであって、第2の特徴ベクトルの第2の要素は第2の時間特性に対応する、生成することと、制御回路を用いて第2の特徴ベクトルをランダムフォレスト分類器に入力することと、制御回路を用いて、予測される第2のマネジメント変革に関する出力をランダムフォレスト分類器から受信することと、表示するためにユーザインターフェースにおいて、予測される第2のマネジメント変革に基づき予測を生成することと、を含む、方法。
<実施形態2>
ベイズ分類器に基づいて出力を指数分布から確率に変換することをさらに含み、予測は確率を含む、実施形態1の方法。
<実施形態3>
第1のマネジメント変革を示す第1のデータの第1のデータ構成要素を決定することと、第1のデータ構成要素に対応する第2のデータの第2のデータ構成要素を決定することと、予測における第2のデータ構成要素の表現を表示するために生成することと、を更に含む、実施形態1または2に記載の方法。
<実施形態4>
第1のマネジメント変革を示す第1のデータ構成要素の第1の値を決定することと、第1の値に対応する第2のデータ構成要素の第2の値を決定することと、予測における第2の値の表現を表示するために生成することとをさらに含む、実施形態3に記載の方法。
<実施形態5>
ランダムフォレスト分類器は時系列分類器であり、予測される第2のマネジメント変革は第3の時間特性を有する、実施形態1から4のいずれか1つに記載の方法。
<実施形態6>
第1のマネジメント変革は、第1のマネジメントアレンジメントに対する第1のアクティビズムキャンペーンの立ち上げを含み、予測される第2のマネジメント変革に基づく予測は、第2のマネジメントアレンジメントに対する第2のアクティビズムキャンペーンの立ち上げの確率を含む、実施形態1から5のいずれか1つに記載の方法。
<実施形態7>
第1の特徴ベクトルに基づいてランダムフォレスト分類器をトレーニングして、第1のデータを第1のマネジメント変革に対応するものとして分類することは、過去のマネジメントアレンジメントおよび過去のマネジメント変革に関する過去のデータに対してランダムフォレスト分類器をバックテストすることを含む、実施形態1から6のいずれか1つに記載の方法。
<実施形態8>
複数のエンティティのマネジメントアレンジメントに関する公開データのレビューを開始するユーザ入力を受信することと、レビューに応答して、第2のデータについてデータソースに対してクエリを実行することとをさらに含み、第2のデータはクエリに応答して受信される、実施形態1から7のいずれか1つに記載の方法。
<実施形態9>
複数のエンティティのマネジメントアレンジメントに関する公開データに基づいて、複数のエンティティについてそれぞれの予測を表示のために生成することと、予測とそれぞれの予測との比較に基づいて、複数のエンティティにおける第2のエンティティの順位を決定することとをさらに含む、実施形態1から8のいずれか1つに記載の方法。
<実施形態10>
第3のエンティティの第3のマネジメントアレンジメントに関する第3のデータを受信することであって、第3のデータが、第3のエンティティの第3のマネジメント変革および第3の時間特性を含む、受信することと、第3のデータと第2のデータとの間の類似性を決定することと、ユーザインターフェースにおいて、類似性に基づいて第2のエンティティと第3のエンティティとの比較を表示するために生成することであって、比較が第3のマネジメント変革の結果を含む、生成することとをさらに含む、実施形態1から9のいずれか1つに記載の方法。
<実施形態11>
命令を格納している有形で非一時的な機械可読媒体であって、命令をデータ処理装置で実行すると、データ処理装置は実施形態1から10のいずれかの処理を含む処理を実行する、機械可読媒体。
<実施形態12>
1または複数のプロセッサと、命令を格納しているメモリとを備えるシステムであって、当該命令は、1または複数のプロセッサによって実行されると、1または複数のプロセッサによって実施形態1から10のいずれかの処理を含む処理を実現させる、システム。
<実施形態13>
実施形態1から10のいずれかを実行するための手段を備えるシステム。