(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-07-03
(45)【発行日】2023-07-11
(54)【発明の名称】特徴選択システム
(51)【国際特許分類】
G06F 16/9035 20190101AFI20230704BHJP
G06F 16/907 20190101ALI20230704BHJP
【FI】
G06F16/9035
G06F16/907
【外国語出願】
(21)【出願番号】P 2022109971
(22)【出願日】2022-07-07
【審査請求日】2022-07-07
(32)【優先日】2022-01-25
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】516172237
【氏名又は名称】アクセンチュア グローバル ソリューションズ リミテッド
(74)【代理人】
【識別番号】100102406
【氏名又は名称】黒田 健二
(74)【代理人】
【識別番号】100100240
【氏名又は名称】松本 孝
(72)【発明者】
【氏名】スイート,ジュリー
(72)【発明者】
【氏名】ゴーシュ,バスカー
(72)【発明者】
【氏名】タニル,ラージェーンドラ プラサード
(72)【発明者】
【氏名】サーカー,ソマリア
(72)【発明者】
【氏名】ヴィジャヤラガヴァン,クーシク エム.
(72)【発明者】
【氏名】クリシュナン,ビベック
(72)【発明者】
【氏名】ジャガナタン,プルニマ
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】米国特許出願公開第2021/0081377(US,A1)
【文献】米国特許出願公開第2021/0342541(US,A1)
【文献】米国特許出願公開第2020/0184210(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
関心対象のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信するステップと、
前記受信されたデータに基づき、エンティティ固有特徴候補のセットを特定するステップと、
1つ以上の特徴空間にそれぞれが割り当てられている複数の特徴を含む特徴ライブラリを読み込むステップと、
特徴選択エンジンを使用して、前記エンティティ固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を選択するステップと
を含む、コンピュータに実装された方法。
【請求項2】
前記エンティティ固有特徴候補のセットを特定するステップは、
前記エンティティに関連する前記テキストデータ、オーディオデータ、画像データ、またはビデオデータからテキストを抽出するステップと、
自然言語処理(NLP)モデルを使用して、特徴に関係する単語のベクトルを、前記エンティティに関連する前記データにおける前記単語の用法およびコンテキストに基づき作成するステップと
を含む、請求項1に記載のコンピュータに実装された方法。
【請求項3】
複数のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信するステップと、
前記関心対象のエンティティおよび追加の複数のエンティティを含むエンティティドメインを、前記受信されたデータに基づき特定するステップと、
ドメイン固有特徴候補のセットをドメイン固有特徴ライブラリから読み込むステップであって、前記特徴選択エンジンは、前記エンティティ固有特徴候補のセットおよび前記ドメイン固有特徴候補のセットに基づき前記特徴空間のそれぞれから前記1つ以上の特徴を選択する、前記読み込むステップと
をさらに含む、請求項1に記載のコンピュータに実装された方法。
【請求項4】
説明可能なAI技術を使用して、加重スコアを前記選択された特徴のそれぞれに割り当てるステップと、
前記選択された特徴を前記加重スコアに基づきフィルタリングするステップと
をさらに含む、請求項3に記載のコンピュータに実装された方法。
【請求項5】
前記特徴選択エンジンは、第1の時間に、前記エンティティ固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を含む第1の特徴セットを選択し、
前記特徴選択エンジンは、前記第1の時間の後の第2の時間に、前記エンティティ固有特徴候補のセットおよび前記ドメイン固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を含む第2の特徴セットを選択する、請求項3に記載のコンピュータに実装された方法。
【請求項6】
前記読み込まれたドメイン固有特徴候補のそれぞれは、ベースライン尺度をさらに含み、前記方法は、
前記選択された特徴のそれぞれについて、ベースライン尺度を前記ドメイン固有特徴候補の前記ベースライン尺度に基づき特定するステップ
をさらに含む、請求項3に記載のコンピュータに実装された方法。
【請求項7】
前記エンティティ固有特徴候補のセットまたは前記ドメイン固有特徴候補のセットに含まれ、且つ前記特徴ライブラリに含まれない、1つ以上のカスタム特徴を特定するステップと、
前記1つ以上のカスタム特徴を前記特徴ライブラリに格納するステップと
をさらに含む、請求項3に記載のコンピュータに実装された方法。
【請求項8】
前記特徴選択エンジンにより選択された前記特徴および非選択の1つ以上の特徴の両方を特徴空間ごとに提示する視覚化を生成するステップと、
前記特徴の1つ以上を選択するかまたは非選択にするユーザ入力を受信するステップと、
前記選択された特徴を前記ユーザ入力に基づき更新するステップと
をさらに含む、請求項1に記載のコンピュータに実装された方法。
【請求項9】
1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合され命令が格納されたコンピュータ可読ストレージデバイスと
を含むシステムであって、前記命令は、前記1つ以上のプロセッサにより実行されると前記1つ以上のプロセッサに動作を実行させ、前記動作は、
関心対象のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信することと、
前記受信されたデータに基づき、エンティティ固有特徴候補のセットを特定することと、
1つ以上の特徴空間にそれぞれが割り当てられている複数の特徴を含む特徴ライブラリを読み込むことと、
特徴選択エンジンを使用して、前記エンティティ固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を選択することと
を含む、システム。
【請求項10】
前記エンティティ固有特徴候補のセットを特定することは、
前記エンティティに関連する前記テキストデータ、オーディオデータ、画像データ、またはビデオデータからテキストを抽出することと、
自然言語処理(NLP)モデルを使用して、特徴に関係する単語のベクトルを、前記エンティティに関連する前記データにおける前記単語の用法およびコンテキストに基づき作成することと
を含む、請求項9に記載のシステム。
【請求項11】
前記動作は、
複数のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信することと、
前記関心対象のエンティティおよび追加の複数のエンティティを含むエンティティドメインを、前記受信されたデータに基づき特定することと、
ドメイン固有特徴候補のセットをドメイン固有特徴ライブラリから読み込むことであって、前記特徴選択エンジンは、前記エンティティ固有特徴候補のセットおよび前記ドメイン固有特徴候補のセットに基づき前記特徴空間のそれぞれから前記1つ以上の特徴を選択する、前記読み込むことと
をさらに含む、請求項9に記載のシステム。
【請求項12】
前記動作は、
説明可能なAI技術を使用して、加重スコアを前記選択された特徴のそれぞれに割り当てることと、
前記選択された特徴を前記加重スコアに基づきフィルタリングすることと
をさらに含む、請求項11に記載のシステム。
【請求項13】
前記特徴選択エンジンは、第1の時間に、前記エンティティ固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を含む第1の特徴セットを選択し、
前記特徴選択エンジンは、前記第1の時間の後の第2の時間に、前記エンティティ固有特徴候補のセットおよび前記ドメイン固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を含む第2の特徴セットを選択する、請求項11に記載のシステム。
【請求項14】
前記読み込まれたドメイン固有特徴候補のそれぞれは、ベースライン尺度をさらに含み、前記動作は、
前記選択された特徴のそれぞれについて、ベースライン尺度を前記ドメイン固有特徴候補の前記ベースライン尺度に基づき特定すること
をさらに含む、請求項11に記載のシステム。
【請求項15】
前記動作は、
前記エンティティ固有特徴候補のセットまたは前記ドメイン固有特徴候補のセットに含まれ、且つ前記特徴ライブラリに含まれない、1つ以上のカスタム特徴を特定することと、
前記1つ以上のカスタム特徴を前記特徴ライブラリに格納することと
をさらに含む、請求項11に記載のシステム。
【請求項16】
前記動作は、
前記特徴選択エンジンにより選択された前記特徴および非選択の1つ以上の特徴の両方を特徴空間ごとに提示する視覚化を生成することと、
前記特徴の1つ以上を選択するかまたは非選択にするユーザ入力を受信することと、
前記選択された特徴を前記ユーザ入力に基づき更新することと
をさらに含む、請求項9に記載のシステム。
【請求項17】
1つ以上のプロセッサに結合され命令が格納されたコンピュータ可読ストレージ媒体であって、前記命令は、前記1つ以上のプロセッサにより実行されると前記1つ以上のプロセッサに動作を実行させ、前記動作は、
関心対象のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信することと、
前記受信されたデータに基づき、エンティティ固有特徴候補のセットを特定することと、
1つ以上の特徴空間にそれぞれが割り当てられている複数の特徴を含む特徴ライブラリを読み込むことと、
特徴選択エンジンを使用して、前記エンティティ固有特徴候補のセットに基づき前記特徴空間のそれぞれから1つ以上の特徴を選択することと
を含む、ストレージ媒体。
【請求項18】
前記エンティティ固有特徴候補のセットを特定することは、
前記エンティティに関連する前記テキストデータ、オーディオデータ、画像データ、またはビデオデータからテキストを抽出することと、
自然言語処理(NLP)モデルを使用して、特徴に関係する単語のベクトルを、前記エンティティに関連する前記データにおける前記単語の用法およびコンテキストに基づき作成することと
を含む、請求項17に記載のストレージ媒体。
【請求項19】
前記動作は、
複数のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信することと、
前記関心対象のエンティティおよび追加の複数のエンティティを含むエンティティドメインを、前記受信されたデータに基づき特定することと、
ドメイン固有特徴候補のセットをドメイン固有特徴ライブラリから読み込むことであって、前記特徴選択エンジンは、前記エンティティ固有特徴候補のセットおよび前記ドメイン固有特徴候補のセットに基づき前記特徴空間のそれぞれから前記1つ以上の特徴を選択する、前記読み込むことと
をさらに含む、請求項17に記載のストレージ媒体。
【請求項20】
前記動作は、
説明可能なAI技術を使用して、加重スコアを前記選択された特徴のそれぞれに割り当てることと、
前記選択された特徴を前記加重スコアに基づきフィルタリングすることと
をさらに含む、請求項17に記載のストレージ媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、全般的に、特徴を選択するシステムに関する。
【背景技術】
【0002】
一般的に、製品およびサービスは、それらの特徴の観点から定義できる。特徴は、数値指標を含むことが多い。複雑な製品およびサービスの場合、増加していく関連した特徴および指標を特定し、継続的に追跡するために、ネットワークベースのプラットフォームが使用され得る。
【発明の概要】
【課題を解決するための手段】
【0003】
本明細書は、全般的に、自然言語処理を使用してデータソースからの情報を処理し、例えば会社などのエンティティに固有のセット特徴を特定するシステムについて記載する。特徴選択エンジンが、機械学習手法を使用して、関連した特徴を特徴ライブラリからエンティティ固有の特徴に基づき選択する。選択された特徴は、例えば特徴の編集および更新のために、ユーザインターフェース上に表示されることが可能である。
【0004】
概して、本明細書に記載される主題の画期的な一側面は、関心対象のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信するアクションと、受信されたデータに基づき、エンティティ固有特徴候補のセットを特定するアクションと、1つ以上の特徴空間にそれぞれが割り当てられている複数の特徴を含む特徴ライブラリを読み込むアクションと、特徴選択エンジンを使用して、エンティティ固有特徴候補のセットに基づき特徴空間のそれぞれから1つ以上の特徴を選択するアクションとを含む方法において具現化することができる。この側面の他の実装は、対応するシステムと、装置と、本方法のアクションを実行するように構成されコンピュータストレージデバイス上にエンコーディングされたコンピュータプログラムとを含む。
【0005】
これらおよび他の実装は、それぞれ任意選択で、以下の特徴のうちの1つ以上を含むことができる。
【0006】
一部の実装において、エンティティ固有特徴候補のセットを特定することは、エンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータからテキストを抽出することと、自然言語処理(NLP:natural language processing)モデルを使用して、特徴に関係する単語のベクトルを、エンティティに関連するデータにおける単語の用法およびコンテキストに基づき作成することとを含む。
【0007】
一部の実装において、動作は、複数のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信することと、関心対象のエンティティおよび追加の複数のエンティティを含むエンティティドメインを、受信されたデータに基づき特定することと、ドメイン固有特徴候補のセットをドメイン固有特徴ライブラリから読み込むことであって、特徴選択エンジンは、エンティティ固有特徴候補のセットおよびドメイン固有特徴候補のセットに基づき特徴空間のそれぞれから1つ以上の特徴を選択する、読み込むこととを含む。
【0008】
一部のケースにおいて、動作は、説明可能なAI技術を使用して、加重スコアを選択された特徴のそれぞれに割り当てることと、選択された特徴を加重スコアに基づきフィルタリングすることとを含むことができる。
【0009】
一部の実装において、特徴選択エンジンは、第1の時間に、エンティティ固有特徴候補のセットに基づき特徴空間のそれぞれから1つ以上の特徴を含む第1の特徴セットを選択し、特徴選択エンジンは、第1の時間の後の第2の時間に、エンティティ固有特徴候補のセットおよびドメイン固有特徴候補のセットに基づき特徴空間のそれぞれから1つ以上の特徴を含む第2の特徴セットを選択する。
【0010】
一部の実装において、読み込まれたドメイン固有特徴候補のそれぞれは、ベースライン尺度をさらに含み、動作は、選択された特徴のそれぞれについて、ベースライン尺度をドメイン固有特徴候補のベースライン尺度に基づき特定することを含む。
【0011】
一部の実装において、動作は、エンティティ固有特徴候補のセットまたはドメイン固有特徴候補のセットに含まれ、且つ特徴ライブラリに含まれない、1つ以上のカスタム特徴を特定することと、1つ以上のカスタム特徴を特徴ライブラリに格納することとを含むことができる。
【0012】
一部の実装において、動作は、特徴選択エンジンにより選択された特徴および非選択の1つ以上の特徴の両方を特徴空間ごとに提示する視覚化を生成することと、特徴の1つ以上を選択するかまたは非選択にするユーザ入力を受信することと、選択された特徴をユーザ入力に基づき更新することとを含むことができる。
【0013】
当然のことながら、本開示による方法は、本願明細書に記載される側面と特徴との任意の組み合わせを含むことができる。つまり、例として、本開示による装置および方法は、本願明細書に具体的に記載される側面と特徴との組み合わせに限定されず、示される側面と特徴との任意の組み合わせも含んでもよい。
【0014】
本開示の1つ以上の実装の詳細が、添付の図面および下記の説明の中に記載されている。本開示の他の特徴および利点が、その説明、図面、および特許請求の範囲から明らかになるであろう。
【図面の簡単な説明】
【0015】
【
図3】特徴を選択する例示のプロセスのフロー図である。
【
図4】本開示の実装を実行することができる例示のシステムを示す。
【発明を実施するための形態】
【0016】
別々の図面内の同じ参照番号および名称は、同じ構成要素を示す。
【0017】
従来から、多くの技術的なコンテキストおよび商業上のコンテキストにおいて、「成功」は数値指標の観点から定義されており、たいていの場合は、それがクライアント・ベンダー間の契約書またはサービスレベル合意書に記載される。その協力関係が成功したかどうかの評価は、かかる合意の当事者が下せるのが通例であった。近年は大局的な変化が生じ、そのような合意の当事者が、契約上の合意当事者ではない、例えば株主、従業員、顧客、およびサプライヤーなどの他の利害関係者ならびに公衆に対して責任を負うようになっている。各当事者は相変わらず成功を数字的に定義することもできるが、クライアント・ベンダー間の関係は、他の利害関係者の期待事項により形作られるようになりつつある。
【0018】
例として、タイヤの製造者と自動車の製造者とが、タイヤの製造者が自動車の製造者に特定のモデル向けのタイヤを供給する合意を有することもある。従来、この合意は、制動距離などのパフォーマンス指標、単位あたりの価格などの金銭的指標を規定してきたであろう。しかしながら、電気自動車の出現に伴い指標の数が増加し、例えばトレッドパターンの設計および材料の選択に影響を与え得る路面騒音に関する要件などを含むようになることもある。さらに、電気自動車は、同じく材料の選択ならびにタイヤの製造法に影響を与え得る、外部の利害関係者からの持続可能性に関する一定の期待事項を伴う場合もある。急な複雑性の増大および優先順位の移り変わりに直面すると、当事者が他の領域を犠牲にして一部の重点領域を過度に強調し、エンジニアリングプロジェクトの全体像が不完全または不均衡になることもある。
【0019】
例えばコンサルティング分野においてなど、商業上のコンテキストにおいても、同様の課題に直面することがある。従来、コンサルタントは金銭的指標を改善することを約束していたが、今では同時に多様な形でパフォーマンスを改善することも期待される。契約の開始時、クライアントの経営陣とシニアコンサルタントとが面談し、改善領域、当該領域の改善へ向けたアクションおよび方策、ならびに改善を測定するための指標を特定する。一般に、クライアントが改善領域を明示し、コンサルタントがアクション、方策、および指標を提案する。様々な潜在的課題に直面すると、クライアントの経営幹部は、例えば広報に関わる一連の不利な出来事が理由で、多様性または持続可能性など1つの特定領域に過度に重点を置くかもしれない。逆にシニアコンサルタントは、他のクライアントとの過去の契約から馴染みのある特定の指標を用いて改善を追跡することを強く好むかもしれない。
【0020】
よって、多数のプロジェクトに関わる各期待事項の均衡のとれたセットを正確に示して追跡する、柔軟且つ安定したツールに対するニーズがある。本開示において、例えば目標、アクション、および指標など、期待事項を特徴に関して定義できる。特に、本開示は、構造化されたクライアント関連情報をそれぞれが含む特徴ツリーの集合と、人工知能を使用して個々のクライアントに関わる特徴を特定するためのこの集合の活用法について記載する。各例により示されるように、特徴ツリーは、多様なコンテキストおよび状況に当てはまる。本開示の実装は、均衡のとれた広範なアクションおよび指標を提供するのみならず、自動追跡に適当であると考えられ、さらには、クライアントの運用システム(例えばエンタープライズリソースプランニングシステム)と連動して、特定されたアクションをクライアントの事業の一環として自動的に実装することもできる。
【0021】
図1は、特徴を選択する例示のシステム100を示す。例示のシステム100は、データソース110、特徴ライブラリ120、特徴選択エンジン130、およびユーザインターフェース140を含む。より詳しく後述されるように、データソース110は、関心対象のエンティティに関連する公開情報および/または内部情報を含むことができる。データソース110からの情報は、エンティティ固有特徴候補のリスト150をまとめるために使用される。特徴選択エンジン130は、特徴ライブラリ120から読み込まれた1つ以上の特徴160を選択するために使用できる。一部の事例では、特徴ライブラリ120は、或る特徴空間または重点領域にそれぞれが属する複数の特徴ツリーを含む。より詳しく後述されるように、システム100の一部の実装は、エンタープライズリソースプランニングシステム180またはその他情報を使用する主体とデータをやり取りするように構成される。一部の実装において、システム100はさらに、相関エンジン190を含むことができる。
【0022】
特徴ツリーは、階層に従い情報を構造化するために使用できる。例として、特徴ツリーは、前述の電気自動車の各特徴を、例えば車台、パワートレイン、バッテリー、電子機器、および車室のグループにグループ化してもよい。これらのグループはそれぞれ、詳細の度合いが次第に増すサブグループへと分類されてもよい。タイヤの場合、特徴ツリーは、例えばトレッドパターン、構造、ゴム組成のグループを含んでもよい。同様に、ソフトウェアアーキテクチャは、サブシステムの階層へと分類できる。一部の事例において、特徴ツリーの各ノードは、1つ以上の数値指標に関連してもよい。例として、電気自動車のバッテリーは、マイルまたはキロメートル単位で測定された或る移動範囲を提供する必要、または一定の制限未満の重量である必要があるかもしれない。よって、特徴ツリーは、情報を格納するための標準化されたフォーマットを提供する。例えば、前述した自動車の製造者は、あらゆる車両のあらゆる構成に対する特徴ツリー群を有してもよい。特徴ツリーの集合は、
図1の特徴ライブラリ120を構成する、ネットワークベースの複数の非一時的ストレージデバイス上に格納されてもよい。
【0023】
一部のケースでは、特徴ツリーの階層は、システムのパーツ間の、単純な構造上の関係にとどまらない関係を示してもよい。
図2は、下位目標と変革をもたらすアクションとの階層を通して戦略的な目標を指標に関連付ける、例示のバリューツリー200を示す。例として、持続可能性の戦略的領域202は、廃棄物削減および環境配慮などのいくつかの目標204へと分類できる。各目標領域204は、1つ以上の下位目標206を包含する。例として、廃棄物削減は、再利用拡大および埋め立て廃棄物削減の両方を包含してもよい。環境配慮は、炭素排出量削減を包含してもよい。省略記号により示されているように、バリューツリーの具体的な実装は、明瞭性のためにこの図面からは省略されているさらなるノードおよびブランチを含んでもよい。
【0024】
下位目標は、指標210を使用して測定される固有のクライアントアクション208を通して達成できる。一部の事例において、バリューツリーの最上位レベル204~206は、すべてに共通であり(例えばセクター全体にまたがり)、その一方で、アクションおよび指標は、一定の業界に、またはさらには一定の会社に、固有であってもよい。例として、一部の事例において製造業の会社が、廃熱回収システムを設置することにより再利用を拡大してもよく、この廃熱回収システムは、1つの製造プロセスにより生成される熱を取り込み、その熱を使用して、製造システムの別の部分を冷却する冷凍サイクルに電力を供給する。このタイプの再利用に関連する取り組みは、例えば廃熱回収システムにより提供される冷却能力により測定できる。しかしながら、このタイプのアクションは、大量生産にのみ適すると考えられ、これは3Dプリントに依拠するニッチ的な生産とは対照的である。そのような事業では、再利用を拡大するために、例えば再使用可能なパッケージをサプライチェーンの中で使用するなどの他のアクションが実装されてもよい。この下位目標が製造業セクターではなくITセキュリティ部門を対象に検討される場合、ターゲットとされたこれらのアクションのいずれも適切でないかもしれない。
【0025】
製造業セクターの中でも、
図2に示されたアクションは単なる例である。一部の事例では、単に冷却能力を増大させるのとは対照的に、既存の製造ラインを分析し、調節して、周囲に放出される廃熱を削減することが適切であるかもしれない。同じく、単に不良部品の再利用に重点を置くのとは対照的に、機械の設定および公差を分析して、そのような部品の数を削減することが適切であるかもしれない。こうした追加のアクションは、例えば、それ自体は持続可能性のゴールではない、製造プロセスの技術的側面の最新化または改善というさらなる戦略的領域に関する。それでもなお、この例は、アクションおよび指標が固有であり、複数の次元または戦略的領域に関係し得ることを示す。
【0026】
例示のバリューツリー200は5つの階層レベルにより示されているが、他の例はさらなるレベルを含んでもよい。例として、一部のアクションはサブタスクの階層に分類できる。一部のケースにおいて、特定のアクションは、択一的な複数の指標に結びつけられてもよい。指標は、業界情報または過去の契約に基づくベースライン値およびターゲット値に関連してもよい。
【0027】
所与の契約またはプロジェクトについて、特徴ツリーのセット(例えば
図1内の選択された特徴160)が、関連したターゲット領域、アクション、および指標を構造化された形で表すことができる。一部の事例において、特徴ツリーのセットを特定することは、特徴ツリーの集合に格納された適当な特徴ツリー候補をクライアント要件に基づき特定することを含む。一部の実装において、特徴ツリーのセットを特定することは、複数の戦略的領域を決定し、各戦略的領域に対して1つ以上の特徴ツリーを提供することを含んでもよい。戦略的領域は、数例を挙げると、財務、経験、持続可能性、包摂および多様性、ならびに人材を含むことができる。一部のケースにおいて、特徴ツリーの集合に含まれていないカスタムの戦略的領域のために、セット内の他のバリューツリーに加えて、1つ以上の特徴ツリーを作成および特定できる。
【0028】
逆に、
図1においてユーザインターフェース140から特徴ライブラリ120につながる矢印により示されているように、クライアントとの契約またはプロジェクトからのフィードバックとして、集合に格納された特徴ツリーが更新(または新たな特徴ツリーが作成)されてもよい。一部のケースでは、特徴ツリーは、それらが更新されたベースライン値およびターゲット値を備えた詳細な指標を含むという点で完成しているとよい。他の特徴ツリーは、上位レベルの目標のみが定義され、アクションおよび指標は不完全であり得るという点で、不完全であってもよい。不完全な特徴ツリーは、適したアクションおよび指標がまだ十分に理解されていない新たな動向または進展中の状況を捕捉してもよい。これらの更新された特徴ツリーおよび新たに作成された特徴ツリーは、後のクライアントとの契約において特定されること、または一部の事例においては進行中の契約を更新するために使用されることが可能である。
【0029】
一部の実装において、特徴選択エンジン130は、特徴ツリーの集合に格納された適当な特徴ツリー候補を特定することにより、或るエンティティまたはクライアントに関連した特徴のセット160を特定することができる。特徴ツリー候補は、例えばクライアント要件などに基づき特定される。クライアント要件は、契約またはプロジェクトに関するクライアントの優先事項または関心事を表現する情報のチャンクである。一般的に、要件は、1つ以上の特徴ツリーの中のノードに対応することになるが、クライアントの表現を特徴ツリーノードの正確なコンテンツとマッチさせるには、ある程度の解釈が要求されることが多い。
【0030】
本開示の実装は、クライアントに関連する情報をまとめることにより要件を選択してもよい。かかる情報は、クライアントに関連する、例えばテキストデータ、オーディオデータ、画像データ、またはビデオデータなどのデータの形態を取ることができる(
図1内のデータソース110)。データは、データがクライアントにより作成され、且つ/またはクライアントおよびそのアクティビティについて記述するという点で、クライアント「に関連する」。例として、データは、要件を捕捉するために従来から使用されている会議の議事録または記録を含むことができるが、このプロセスは広範なソースから集める。
【0031】
一部の事例において、情報は一般公開されていてもよい。一般公開されているデータは、数例を挙げると、クライアントのウェブサイト、ニュースリリース、収支報告、ソーシャルメディアプレゼンス、および技術的な製品文書(例えばユーザマニュアル)からのデータを含むことができる。例として、クライアントにより作成される一般公開されているデータは、クライアントのウェブサイトにアップロードされているpdfのパンフレットのことを指す場合もある。業界誌のインターネットサイト上で新製品の発売について記載している記事は、一般公開された第三者情報の例であろう。本開示の目的上、クライアント自体により作成または提供されたデータは、第三者データよりも正確に要件を反映し得る。例として、クライアント自体により公開されたニュースリリースは、クライアントをタグ付けした第三者によるソーシャルメディアの投稿よりも信頼性が高いであろう。
【0032】
本開示の実装は、収集されたデータにおける偏りを特定し、修正する手法も含んでもよい。かかる手法は、例えばモデルおよびモデルのパフォーマンスを著しく変えるかもしれない、巧みに作られた記事を多数公開することなどにより、基礎をなすモデルが操作されるのを防止するのに役立ってもよい。偏り防止の手法は、例えば、訓練前に行われるデータの前処理、訓練自体の間に行われる処理、または訓練後に行われる後処理を含むことができる。
【0033】
一般公開された情報を使用すると、周期的な形で適当な時点に要件をまとめられるという利点があるかもしれない。例として、クライアントとの最初の会議に備えて要件をまとめることができ、これによりオンボーディングスケジュールが短縮される可能性がある。実際のところ、要件は、クライアントとの契約とは関係なくまとめることができる。
【0034】
クライアントとの契約がある場合、一般公開されたデータの代わりに、またはそれに加えて、内部情報を使用できる。そのような内部情報は、一般に、関心対象のエンティティの外部では入手できない。内部情報の例には、議事録、電話または会議の記録、社内メモ、会社のイントラネット上のページ、技術仕様書、および研究室のノートが含まれるであろう。かかる情報は、未公開の機密の用途(例えば製品開発または製品発売)を扱う契約に有用であろう。
【0035】
一部の実装において、データソースは、内部情報と一般公開情報とが混ざったもの、および/またはクライアントにより作成された情報と第三者によりクライアントについて書かれた情報とが混ざったものを含んでもよい。
【0036】
生データのフォーマット次第で、光学式文字認識(OCR:optical character recognition)およびテキスト音声化手法を使用して生データをテキスト形式に変換できる。例として、TesseractなどのOCRエンジンを使用して、画像データをテキストに変換できる。一部の事例において、OCRの精度を改善するために、画像データは、サイズ変更され、または調節されて、ノイズの除去およびコントラストの増大が行われる。一部の実装において、抽出されたテキストは、手動で検証される(例えばホワイトボードの手書きメモをデジタル化した画像の場合)。
【0037】
次に、テキストデータが自然言語処理(NLP)手法を使用して処理される。例として、GloVeアルゴリズムを使用する単語埋め込みなどテキストのスニペットがNLPモデルに供給されてもよい。一部の事例において、クライアントデータからエンコーディングされたキーワードを特徴ツリーの集合内のエントリまたはノードと照合する専有辞書を、NLP処理に使用できる。NLP処理は、潜在的なクライアント要件に対応する単語のベクトルを作成することができる。前述のように、要件は、典型的には1つ以上の特徴ツリーの中のノードに対応することになる。
【0038】
NLP処理の出力は、顧客要件をそれぞれが表し得るエンティティ固有特徴候補のリスト150である。このリストを使用して、特徴ツリーの集合をフィルタリングできる。クライアントのパンフレットのpdfから抽出される潜在的な特徴の例としては、「2026年までに40%再生可能エネルギー源に移行する」が考えられる。例として、単語埋め込みからのデータが集約されて、特徴候補のリストが作成されてもよい。このリストはさらに、検証されて、後から使用するために格納されてもよい。
【0039】
各実装は、例えばエンティティ固有特徴候補のリスト150などのクライアント要件に基づき特徴ツリーの集合の中の適当な特徴ツリー候補を特定してもよい。例として、AIベースの特徴選択エンジン130を使用して、特徴候補150に基づき、特徴ライブラリ120に含まれる特徴ツリーの集合がフィルタリングされてもよい。
【0040】
一部の事例において、特徴ツリーは、(例えば戦略的目標に従う)重点領域ごとに集合の中でグループ化され、特徴選択エンジン130は、事前選択された重点領域のセットのそれぞれから特徴ツリー候補を少なくとも1つ提供するように構成される。例として、ユーザは、財務、顧客または従業員の経験、持続可能性、包摂および多様性、ならびに人材を重点領域として指定してもよく、特徴選択エンジン130は、各戦略的領域に対して少なくとも1つのバリューツリーを提供することになる。別の実装は、ハイブリッド電気車両の設計に関係してもよく、重点領域は、例えば車台、電子機器、バッテリー、ドライブトレイン、および車室を含むことができる。さらなる例において、各重点領域は、例えば半導体製造における成膜、除去、パターン形成、および電気的性質の調節など、プロセスの中の1つの工程に対応することができる。
【0041】
一部のケースでは、特徴候補のリスト150は、クライアントと同じ技術上または商業上の位置にある他のエンティティに照らして評価される。例として、クライアントは、エネルギー業界の会社であってもよい。特徴選択エンジン130は、機械学習アルゴリズム(例えばk近傍アルゴリズム)を使用して、市場規模、業界、地域、収益セグメント、および重点領域に基づき類似した会社を特定するように構成されてもよい。特徴選択エンジン130は、クライアントについてまとめられた特徴候補のリストを増強し、またはリストの中の個々の特徴を加重して、市場全体の重点をより厳密に反映してもよい。
【0042】
一部の実装において、特徴候補のリスト150を使用して、特徴ツリーの集合の中で検索が行われ、マッチする特徴ツリーが返されてもよい。例として、「2026年までに40%再生可能エネルギー源に移行する」のエントリは、再生可能エネルギーに関係するすべての特徴ツリーを返してもよい。特徴ツリーの集合のサイズ、および特徴候補の幅の広さ次第で、検索により返される特徴ツリーの数は、所望されるよりも多いかもしれない。よって、一部のケースでは、特徴選択エンジン130が、特定の契約に対する固有の特徴または特徴ツリーを推薦してもよい。
【0043】
集合の特徴ツリーの中の個々の特徴は、特異値分解(SVD:single value decomposition)行列を作成し、行列内の各特徴に加重スコアを適用することにより、評価されてもよい。SVDは、協調フィルタリングメカニズムおよび潜在因子モデルを使用して推薦を生成する行列因子分解手法である。加重スコアは、過去の契約、すなわち特徴および特徴ツリーの選択から学習する、説明可能なAI技術を使用して決定されてもよい。加重スコアは、例えば類似したクライアントによる特定の特徴の選択、および現在のベンチマークに基づくターゲット指標の達成確率などを考慮してもよい。
【0044】
例として、特徴ツリーの集合は、特定の車両の様々な設計を、そのサブシステムおよびそれらの構成コンポーネントすべてとともに示してもよい。特定の契約の目標は、車両の総重量を削減することであってもよい。クライアントに関係する情報が、本開示の手法に従い処理されて、重量削減に関わる特徴、すなわちコンポーネントの候補リストが取得されてもよい。単に特定された特徴の重量を削減することもできるであろうが、上述された推薦を使用して、関心対象の車両に類似した車両の特徴ツリーを特定し、当該特徴ツリーの中で当該車両の重量削減に貢献する特徴を特定することができる。本例では、関連するコンポーネントの重量を調節するために、選択された特徴160を設計プラットフォームに入力できる。
【0045】
一部の実装において、特徴選択エンジン130は、推薦された特徴のそれぞれについてベースライン値およびターゲット値を推薦するように構成されてもよい。例として、特徴選択エンジン130は、様々な業界において一般的に使用される特徴のベースライン値およびターゲット値を格納するデータベースにアクセスしてもよい。ベースライン値およびターゲット値は、契約が進行している間に更新できる。例として、最初は、特定の業界の試験的なクライアントが、所与の特徴に対して40%のターゲット値を設定してもよい。契約の開始後1年以内に、予見できなかった状況が市場において生じてもよく、このことが、クライアントの競争相手に同じ特徴に対して70%のターゲットを設定させる。そのようなケースにおいて、特徴選択エンジン130は、更新されたターゲット情報が格納されるたびに、特徴に関わる更新されたターゲットを含むメッセージを自動的に生成し、そのメッセージを最初のクライアントアカウントの関連ユーザに送信するように構成されてもよい。
【0046】
システム100は、特徴選択エンジン130により選択された特徴および/または特徴ツリーを示すグラフィカルユーザインターフェース140を生成するように構成できる。一部の事例において、グラフィカルユーザインターフェース140を使用して、特徴ツリーの集合に、すなわち特徴ライブラリ120に含まれていない、カスタム特徴ツリーを作成することができる。他の事例において、ユーザは、インターフェース140を使用して、例えば個々の特徴を既存のツリーに追加し、または既存のツリーから特徴を削除することにより、選択された特徴ツリー160の一部を調節してもよい。新たな、または調節された特徴ツリーは、
図1において対応する矢印により示されているように、特徴ライブラリ120に保存されてもよい。
【0047】
ユーザインターフェース140は、選択された特徴160の或る期間にわたる進展を追跡するためにも使用できる。ユーザは、特徴160に対応する値をインターフェース140を介して手動で更新することができる。一部の例において、機械学習手法を使用して、選択された特徴160間の相関を判断し、値を更新する際にユーザを支援することができる。他の例では、特徴に関わる更新された値が、データソース110内の更新された情報に基づき自動的に入力されてもよい。
【0048】
例としてシステム100は、選択された特徴160間の相関を判断するように構成されている相関エンジン190を含むことができる。一部の実装において相関エンジン190は、選択された特徴160を受信し、自動的にクラスタ化することができる。例として、クライアントのクラスタを、k平均およびセントロイドベースのクラスタリングを使用して作成できる。一部のケースにおいて、ユーザ(例えばデータサイエンティスト)は、相関エンジンにより特定された所与の相関が妥当な相関であるかどうかを評価してもよい。一部のケースにおいて、特定された相関が妥当かどうかの評価は、相関の最小ランダムサンプルに依存する。妥当な相関は、相関リポジトリに保存されてもよい。システム100は、個々のクライアントと、相関リポジトリに格納された相関とを、ユークリッド距離を使用して比較することができる。エンコーダを使用して、データを比較のために単一の数値ベクトルへと変換することができる。一部の事例においてシステム100は、相関エンジン190により特定された特定の相関をクライアントが示すかどうかについて、インターフェース140を介してユーザ入力を求める。
【0049】
相関エンジン190は、k平均を使用して単一のクライアントに固有の相関パターンを発見することもできる。相関パターンは、クライアントに対して選択された特徴の中に存在するが、まだクラスタにおいて(例えば業界または市場セグメントにわたって)示されていない。相関エンジン190は、そのような相関を、クラスタの中の十分なサンプルセットが相関を示すまで監視し、その後、相関を相関リポジトリに保存するように構成できる。
【0050】
一部の実装において、特徴選択エンジン130は、相関エンジン190により特定された相関に基づき特徴を選択するように構成される。
【0051】
図3は、関心対象のエンティティ(例えばクライアント)に関わる特徴のセットを選択する例示のプロセス300のフローチャートである。プロセスは、例えば
図1の特徴選択システム100により実行できる。
【0052】
特徴選択システム100は、関心対象のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つをネットワーク上で受信する(302)。特徴選択システム100は、受信されたデータに基づきエンティティ固有特徴候補のセットを特定する(304)。一部の事例において特徴選択システム100は、エンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータからテキストを抽出し、自然言語処理(NLP)モデルを使用して、特徴に関係する単語のベクトルを、エンティティに関連するデータにおける単語の用法およびコンテキストに基づき作成する。特徴選択システム100は、1つ以上の特徴空間にそれぞれが割り当てられている複数の特徴を含む特徴ライブラリを読み込む(306)。例として特徴ライブラリは、上述されたように特徴ツリーの集合を含むことができる。各特徴ツリーは、所与の特徴空間(例えば重点領域)に複数の特徴を割り当てる。特徴選択システム100は、特徴選択エンジン130を使用して、エンティティ固有特徴候補のセットに基づき特徴空間のそれぞれから1つ以上の特徴を選択する(308)。
【0053】
一部の実装において、特徴選択エンジン130は、エンティティ固有特徴候補のセットならびにドメイン固有特徴候補のセットの両方に基づき特徴空間のそれぞれから1つ以上の特徴を選択する。この事例において特徴選択システム100は、最初の関心対象のエンティティに加え、複数のエンティティに関連するテキストデータ、オーディオデータ、画像データ、またはビデオデータのうちの少なくとも1つを受信することができる。受信されたデータに基づき、特徴選択システム100は、関心対象のエンティティおよび追加の複数のエンティティに共通するエンティティドメインを特定する。例としてエンティティドメインは、各エンティティにより実装されている共通の技術(例えばブロックチェーン技術)を包含することができる。他のケースでは、エンティティドメインは、特定のタイプのデバイス(プラグインハイブリッド電気車両)に対応することができる。他の例では、エンティティドメインは、特定の業界(例えばエネルギー業界または半導体製造業界)を包含することができる。
【0054】
エンティティドメインが特定されると、特徴選択システム100は、ドメイン固有特徴ライブラリからドメイン固有特徴候補のセットを読み込むことができる。次に特徴選択エンジン130は、エンティティ固有特徴候補のセットおよびドメイン固有特徴候補のセットの両方に基づき特徴空間のそれぞれから1つ以上の特徴を選択することができる。一部の事例において、読み込まれたドメイン固有特徴候補のそれぞれが、ベースライン尺度をさらに含み、特徴選択システム100は、選択された特徴のそれぞれに関わるベースライン尺度をドメイン固有特徴候補のベースライン尺度に基づき特定する。
【0055】
一部の事例において特徴選択エンジン130は、エンティティ固有特徴候補のセットに基づき、特徴空間のそれぞれから1つ以上の特徴を含む第1の特徴セットを選択する。次に、第1の時間の後の第2の時間に、特徴選択エンジン130は、エンティティ固有特徴候補のセットおよびドメイン固有特徴候補のセットの両方に基づき特徴空間のそれぞれから1つ以上の特徴を含む第2の特徴セットを選択する。例として第2の時間は、第1の時間の1か月後、1四半期後、または1年後とされてもよい。一部のケースにおいて、第2の特徴セットを使用して第1の特徴セットを更新または上書きできる。例として特徴選択エンジン130は、第2の時間の後、継続的に一定間隔で新たな特徴セットを選択することができる。
【0056】
一部の実装において特徴選択システム100は、説明可能なAI技術を使用して、加重スコアを選択された特徴のそれぞれに割り当て、選択された特徴を加重スコアに基づきフィルタリングする。
【0057】
一部のケースにおいて特徴選択システム100は、エンティティ固有特徴候補のセットまたはドメイン固有特徴候補のセットに含まれ、且つ特徴ライブラリに含まれない、1つ以上のカスタム特徴を特定し、1つ以上のカスタム特徴を特徴ライブラリに格納することができる。
【0058】
一部の実装において、特徴選択エンジン130により選択された特徴と、非選択の1つ以上の特徴との両方を特徴空間ごとに提示する、視覚化を生成できる。視覚化は、ユーザ側のデバイス上でユーザに提示されてもよい。特徴の1つ以上を選択するかまたは非選択にするユーザ入力を受信でき、選択された特徴をユーザ入力に基づき更新できる。
【0059】
図4は、本開示の実装を実行することができる例示のシステム400を示す。例示のシステム400は、コンピューティングデバイス402、バックエンドシステム408、およびネットワーク406を含む。一部の例では、ネットワーク406は、ローカルエリアネットワーク(LAN:local area network)、ワイドエリアネットワーク(WAN:wide area network)、インターネット、またはそれらの組み合わせを含み、ウェブサイト、デバイス(例えばコンピューティングデバイス402)、およびバックエンドシステム(例えばバックエンドシステム408)を接続する。一部の例において、ネットワーク406には、有線および/またはワイヤレスの通信リンク上でアクセスできる。
【0060】
一部の例においてコンピューティングデバイス402は、デスクトップコンピュータ、ラップトップコンピュータ、ハンドヘルドコンピュータ、タブレットコンピュータ、携帯情報端末(PDA:personal digital assistant)、携帯電話、ネットワークアプライアンス、カメラ、スマートフォン、拡張汎用パケット無線サービス(EGPRS:enhanced general packet radio service)モバイル電話、メディアプレーヤ、ナビゲーションデバイス、電子メールデバイス、ゲーム機、またはこれらのデバイスもしくは他のデータ処理デバイスのいずれか2つ以上の適切な組み合わせなど、任意の適切なタイプのコンピューティングデバイスを含むことができる。
【0061】
示されている例において、バックエンドシステム408は、少なくとも1つのサーバシステム412およびデータストア414(例えばデータベースおよび知識グラフ構造)を含む。一部の例において少なくとも1つのサーバシステム412は、コンピュータに実装された1つ以上のサービスをホストし、ユーザはコンピューティングデバイスを使用してそのサービスと相互作用できる。例としてサーバシステム412は、本開示の実装による特徴選択システムの一部として提供される1つ以上のアプリケーションをホストすることができる。例としてユーザ420(例えばベンダー)は、コンピューティングデバイス402を使用して特徴選択システムと相互作用することができる。本願明細書にさらに詳しく記載されているように、一部の例においてユーザ420は、特徴選択エンジンを使用して1つ以上の特徴を選択するために、関心対象のエンティティに関連するデータを提供することができる。本願明細書にさらに詳しく記載されているように、一部の例においてユーザ420は、1つ以上の特徴ツリーを作成または更新することができる。一部のケースでは、更新された、または新たな特徴ツリー(単数または複数)が、
図1のエンタープライズリソースプランニングシステム180に送信されてもよい。
【0062】
図1のエンタープライズリソースプランニング(ERP:enterprise resource planning)システム180は、例えば製造、購買、会計、販売宣伝、人事など企業の種々の部署からのデータを収集、格納、管理、および解釈するソフトウェアシステムとして実装できる。例として、ERPシステム180を使用して、企業の種々の部署にわたる、種々の相違するユーザプラットフォームで収集されたデータを共有できる。1つの部署により収集されたデータは、多くの場合、その部署により使用されるハードウェアプラットフォームまたはソフトウェアプラットフォームにより決定される非標準のフォーマットで、コンピュータ上でローカルに、またはサーバ上に格納される。そのような相違は、ERPシステムがリアルタイムで処理できない断片的または不完全なデータをもたらし得る。その反面、データの一部のインスタンスは重複して、ERPシステムのプロセッサに過度な負荷をかけ、データ送信に余計な帯域幅を消費し得る。
【0063】
例としてERPシステムは、ハイブリッド電気車両のバッテリーに関するデータと、ハイブリッド電気車両のドライブトレインに関するデータとを有してもよい。そのようなデータを統合することが、フォーマットの不一致が原因でできなければ、ERPシステムは、一連の車両のそれぞれにバッテリーを取り付ける製造工程をスケジューリングできないかもしれない。同様に、データが別々の場所において維持され、適時または容易にERPシステムで共有できなければ、生産計画に困難が発生するかもしれない。一部の事例において、かかる非標準的または不完全な記録からのデータを統合しようとする取り組みは、例えば誤ったバッテリーが誤った車両に取り付けられるなどの生産ミスにつながり得る。本開示の実装は、ERPシステム全体の情報を収集して変換し、標準化されたフォーマットに統合することにより、これらおよび他の課題に対処してもよい。
図1は、システム100とERPシステム180とを別々のエンティティとして示すが、一部の実装では、システム100を直接ERPシステム180自体に一体化できる。
【0064】
本明細書に記載された実装およびすべての機能動作は、デジタル電子回路構成において、または本明細書で開示された構造およびその構造上の等価物を含むコンピュータソフトウェア、ファームウェアもしくはハードウェアにおいて、またはそれらのうちの1つ以上の組み合わせにおいて実現され得る。実装は、1つ以上のコンピュータプログラム製品として、すなわちデータ処理装置により実行されまたはデータ処理装置の動作を制御するようコンピュータ可読媒体上にエンコーディングされたコンピュータプログラム命令の1つ以上のモジュールとして実現されてもよい。コンピュータ可読媒体は、機械可読ストレージデバイス、機械可読ストレージ基板、メモリデバイス、機械可読伝播信号をもたらす物質の構成、またはそれらのうちの1つ以上の組み合わせとされてもよい。「コンピューティングシステム」という用語は、データを処理するすべての装置、デバイス、および機械を包含し、例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサもしくはコンピュータを含む。装置は、ハードウェアに加えて、対象のコンピュータプログラムの実行環境を作り出すコード(例えばプロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらのうち1つ以上の任意の適切な組み合わせなどを構成するコード)を含んでもよい。伝播信号とは、適当な受信機装置に送信される情報をエンコーディングするために生成される人工的に生成された信号(例えば機械生成された電気信号、光信号、または電磁信号)である。
【0065】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても知られる)は、コンパイル型またはインタープリタ型言語を含む任意の適切な形態のプログラミング言語で書かれてもよく、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、もしくはコンピューティング環境での使用に適当な他のユニットとしてを含め、任意の適切な形態で展開されてもよい。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えばマークアップ言語文書に格納される1つ以上のスクリプト)、対象のプログラム専用の単一ファイル、または複数の連携ファイル(例えば1つ以上のモジュール、サブプログラム、またはコードの一部を格納する複数ファイル)に格納されてもよい。コンピュータプログラムは、1つのコンピュータ上で実行されるように、または1つの場所に位置するかもしくは複数の場所に分散し通信ネットワークにより相互接続された複数のコンピュータ上で実行されるように、展開されてもよい。
【0066】
本明細書に記載されたプロセスおよび論理フローは、入力データに作用し出力を生成することにより機能を実行する1つ以上のコンピュータプログラムを実行する、1つ以上のプログラマブルプロセッサにより実行されてもよい。プロセスおよび論理フローは、専用論理回路構成(例えばFPGA(field programmable gate array:フィールドプログラマブルゲートアレイ)またはASIC(application specific integrated circuit:特定用途向け集積回路))によっても実行でき、装置は該専用論理回路構成としても実装できる。
【0067】
コンピュータプログラムを実行するのに適当なプロセッサには、例として、汎用および専用両方のマイクロプロセッサ、ならびに任意の適切な種類のデジタルコンピュータの任意の1つ以上のプロセッサが含まれる。一般に、プロセッサは、読み取り専用メモリもしくはランダムアクセスメモリまたは両方から命令およびデータを受信する。コンピュータの構成要素は、命令を実行するプロセッサならびに命令およびデータを格納する1つ以上のメモリデバイスを含むことができる。一般に、コンピュータはさらに、データを格納する1つ以上の大容量ストレージデバイス(例えば磁気、光磁気ディスク、もしくは光ディスク)を含むか、またはそれとの間でデータの受信もしくはデータの転送もしくはその両方を行うよう動作可能に結合される。なお、コンピュータがそのようなデバイスを有することは要求されない。さらにコンピュータは、別のデバイス(例えばモバイル電話、携帯情報端末(PDA)、モバイルオーディオプレーヤ、グローバルポジショニングシステム(GPS:Global Positioning System)受信機)に内蔵されてもよい。コンピュータプログラム命令およびデータを格納するのに適当なコンピュータ可読媒体には、あらゆる形態の不揮発性メモリ、媒体、およびメモリデバイスが含まれ、例として、半導体メモリデバイス(例えばEPROM、EEPROM、およびフラッシュメモリデバイス)、磁気ディスク(例えば内蔵ハードディスクまたはリムーバブルディスク)、光磁気ディスク、ならびにCD ROMおよびDVD-ROMディスクが含まれる。プロセッサおよびメモリは、専用論理回路構成により補完されてもよく、またはそれに組み込まれてもよい。
【0068】
ユーザとの相互作用を提供するために、情報をユーザに表示するディスプレイデバイス(例えばCRT(cathode ray tube:陰極線管)、LCD(liquid crystal display:液晶ディスプレイ)モニタ)、ならびにユーザがコンピュータに入力を提供できるキーボードおよびポインティングデバイス(例えばマウス、トラックボール、タッチパッド)を有するコンピュータ上で各実装が実現されてもよい。他の種類のデバイスが、同じくユーザとの相互作用を提供するために使用されてもよい。例として、ユーザに提供されるフィードバックは、任意の適切な形態の感覚フィードバック(例えば視覚フィードバック、聴覚フィードバック、触覚フィードバック)であってもよく、ユーザからの入力は、音響、音声、または触覚入力を含め、任意の適切な形態で受信されてもよい。
【0069】
実装は、バックエンドコンポーネントを含むコンピューティングシステム(例えばデータサーバとして)、ミドルウェアコンポーネントを含むコンピューティングシステム(例えばアプリケーションサーバ)、および/もしくはフロントエンドコンポーネントを含むコンピューティングシステム(例えばユーザが実装と相互作用するのに用いることができるグラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータ)、またはそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、もしくはフロントエンドコンポーネント1つ以上の任意の適切な組み合わせにおいて実現されてもよい。システムのコンポーネントは、任意の適切な形態または媒体のデジタルデータ通信(例えば通信ネットワーク)により相互接続されてもよい。通信ネットワークの例には、ローカルエリアネットワーク(「LAN」)、および例えばインターネットなどのワイドエリアネットワーク(「WAN」)が含まれる。
【0070】
コンピューティングシステムは、クライアントおよびサーバを含んでもよい。クライアントおよびサーバは、一般に、互いに遠隔にあり、典型的には通信ネットワークを介して相互作用する。クライアントとサーバとの関係は、個別のコンピュータ上で実行され相互にクライアント・サーバ関係を有するコンピュータプログラムにより生じる。
【0071】
本明細書は多数の詳細事項を含むが、これらは、本開示の範囲または特許請求の範囲に対する限定として解釈されるべきではなく、むしろ特定の実装に固有の特徴が記載されているものと解釈されるべきである。別々の実装のコンテキストで本明細書に記載されている特定の特徴は、単一の実装に組み合わせても実装可能である。逆に、単一の実装のコンテキストで記載されている種々の特徴が、複数の実装において別々に実装されることも、または任意の適当な組み合わせの構成要素において実装されることも可能である。さらに、各特徴は特定の組み合わせで動作するよう上述されていることもあり、当初そのように請求されていることさえもあるが、一部のケースでは、請求されている組み合わせの特徴1つ以上をその組み合わせから削除可能であり、請求されている組み合わせは、組み合わせの構成要素または組み合わせの構成要素の変形を対象とし得る。
【0072】
同じく、各動作は図面内に特定の順序で示されているが、これは、望ましい結果を実現するために、当該の動作が示されている特定の順序もしくは順番で実行されること、または示されているすべての動作が実行されることを要求するものと理解されてはならない。特定の状況では、マルチタスクおよび並列処理が有利なこともある。さらに、上述の実装における種々のシステムコンポーネントの分離は、すべての実装においてそのような分離を要求するものと理解されてはならず、当然のことながら、記載されているプログラムコンポーネントおよびシステムは、概して、単一のソフトウェア製品に一体化されても、または複数のソフトウェア製品にパッケージ化されてもよい。
【0073】
いくつかの実装が記載された。しかし、当然のことながら、本開示の意図および範囲から逸脱することなく種々の調節が加えられ得る。例として、工程が並べ替え、追加、または除去された、上記で示されたフローの種々の形態が使用されてもよい。したがって、他の実装は、添付の特許請求の範囲に記載の範囲内にある。
【要約】 (修正有)
【課題】データソースの中からエンティティに固有のセット特徴を特定する方法、システム及びストレージ媒体を提供する。
【解決手段】関心対象のエンティティに関連する公開情報及び/又は内部情報を含むデータソース、複数の特徴ツリーを含む特徴ライブラリ、特徴選択エンジン、相関エンジン及びユーザインターフェースを含むシステムにおいて、関心対象のエンティティに関わる特徴のセットを選択するプロセスは、関心対象のエンティティに関連するテキストデータ、オーディオデータ、画像データ又はビデオデータのうちの少なくとも1つをネットワーク上で受信し、受信したデータに基づき、エンティティ固有特徴候補のセットを特定し、1つ以上の特徴空間にそれぞれが割り当てられている複数の特徴を含む特徴ライブラリを読み込み、特徴選択エンジンを使用して、エンティティ固有特徴候補のセットに基づき特徴空間のそれぞれから1つ以上の特徴を選択する。
【選択図】
図3