IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヒタチ ヴァンタラ エルエルシーの特許一覧

<>
  • 特表-自己学習分析ソリューションコア 図1
  • 特表-自己学習分析ソリューションコア 図2
  • 特表-自己学習分析ソリューションコア 図3
  • 特表-自己学習分析ソリューションコア 図4
  • 特表-自己学習分析ソリューションコア 図5
  • 特表-自己学習分析ソリューションコア 図6
  • 特表-自己学習分析ソリューションコア 図7
  • 特表-自己学習分析ソリューションコア 図8
  • 特表-自己学習分析ソリューションコア 図9
  • 特表-自己学習分析ソリューションコア 図10
  • 特表-自己学習分析ソリューションコア 図11
  • 特表-自己学習分析ソリューションコア 図12
  • 特表-自己学習分析ソリューションコア 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-06
(54)【発明の名称】自己学習分析ソリューションコア
(51)【国際特許分類】
   G06N 20/00 20190101AFI20231129BHJP
   G06N 3/092 20230101ALI20231129BHJP
   G06N 3/10 20060101ALI20231129BHJP
【FI】
G06N20/00
G06N3/092
G06N3/10
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023532377
(86)(22)【出願日】2020-12-21
(85)【翻訳文提出日】2023-05-26
(86)【国際出願番号】 US2020066387
(87)【国際公開番号】W WO2022139789
(87)【国際公開日】2022-06-30
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
2.JAVA
3.JAVASCRIPT
4.VISUAL BASIC
(71)【出願人】
【識別番号】520155228
【氏名又は名称】ヒタチ ヴァンタラ エルエルシー
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】ダモ, マウロ, エー.
(72)【発明者】
【氏名】リン, ウェイ
(72)【発明者】
【氏名】シュマルゾ, ウィリアム
(57)【要約】
本明細書に記載される例示的実装形態は、複数の装置に関連付けられた複数のセンサを備えたシステムを対象とし、このシステムは、複数のセンサから仮説キャンバス及びメタデータを受け取るために、複数のメタパイプラインステージを生成することであって、複数のメタパイプラインステージは、メタデータ及び1又は複数のステージを有し、1又は複数のステージのそれぞれは、メタデータ及び仮説キャンバスに基づいて実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、システムの分析モデルを生成するために、複数のメタパイプラインステージをメタデータに対して実行順序で実行することと、を含む。
【特許請求の範囲】
【請求項1】
複数の装置に関連付けられた複数のセンサを含むシステムのための方法であって、前記方法は、前記複数のセンサから仮説キャンバス及びメタデータを受け取るために、
複数のメタパイプラインステージを生成することであって、前記複数のメタパイプラインステージは、前記メタデータ及び1又は複数のステージを含み、前記1又は複数のステージのそれぞれは、前記メタデータ及び前記仮説キャンバスに基づいて実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、
前記システムの分析モデルを生成するために、前記複数のメタパイプラインステージを前記メタデータに対して実行順序で実行することと、
を含む、方法。
【請求項2】
前記メタデータに対して実行するための前記生成された複数のメタパイプラインステージのうちの1つを選択するために、強化学習プロセスを実行することをさらに含む、請求項1に記載の方法。
【請求項3】
前記複数のメタパイプラインステージを前記生成することは、
自然言語処理を使用してセマンティック検索のためのクエリを生成するために、前記仮説キャンバスを翻訳することと、
前記複数の装置に関連する1又は複数のパイプラインを検索するために、前記クエリからメタ学習データベースに対してセマンティック検索を実行することと、
前記1又は複数のパイプラインから前記メタパイプラインステージを生成することと、
前記メタパイプラインステージから生成された学習モデル、前記学習モデルに関連付けられたメタデータ、及び前記学習モデルにおいて関連付けられたメタフィーチャを追跡するように構成されたリポジトリにおいて前記メタパイプラインステージを管理することと、
を含む、請求項1に記載の方法。
【請求項4】
前記仮説キャンバスから抽出された1又は複数のキーパフォーマンス指標に対して前記分析モデルを評価することと、
前記評価に基づいて、前記複数のメタパイプラインステージのうちの1又は複数を修正することと、
をさらに含む、請求項1に記載の方法。
【請求項5】
前記システムの前記分析モデルを生成するために、前記複数のメタパイプラインステージを前記メタデータに対して実行順序で前記実行することは、ハイパーパラメータポリシーから選択された様々なハイパーパラメータを有する複数の候補分析モデルを生成することを含み、
前記仮説キャンバスから抽出された1又は複数のキーパフォーマンス指標に対して前記分析モデルを前記評価することは、マルチアームドバンディット手法を用いて前記複数の候補分析モデルを通して処理された前記複数のセンサから受信されたセンサデータに対して前記複数の候補分析モデルを評価することを含み、
前記評価に基づいて前記複数のメタパイプラインステージのうちの1又は複数を前記修正することは、
前記マルチアームドバンディット手法を用いて収集された報酬を最大化する前記候補分析モデルのうちの1つを前記分析モデルとして選択することと、
前記候補分析モデルのうちの前記選択された1つに従って、前記複数のパイプラインステージのうちの前記1又は複数を修正することと、
を含む、請求項4に記載の方法。
【請求項6】
前記分析モデルを前記システム上で展開することにより、前記複数の装置のうちの1又は複数を制御することをさらに含む、請求項1に記載の方法。
【請求項7】
前記仮説キャンバスは、前記メタデータ、前記システムに関連付けられた仮説、前記仮説から予期される予測、及び前記仮説に関連付けられたリスクを取得するために、前記複数のセンサのうちの1つを識別する複数のデータソースを含む、請求項1に記載の方法。
【請求項8】
新しいデータセットにメタパイプラインを適用するために、異なるメタデータ及びメタフィーチャからのデータ構造、既存のデータセット及び前記新しいデータセットからのデータ構造、並びに異なるデータセットからのデータ構造を比較するように構成されたメタ学習プロセスを実行することをさらに含む、請求項1に記載の方法。
【請求項9】
複数の装置に関連付けられた複数のセンサを含むシステムのための命令を格納する、非一時的コンピュータ可読媒体であって、前記命令は、前記複数のセンサから仮説キャンバス及びメタデータを受け取るために、
複数のメタパイプラインステージを生成することであって、前記複数のメタパイプラインステージは、前記メタデータ及び1又は複数のステージを含み、前記1又は複数のステージのそれぞれは、前記メタデータ及び前記仮説キャンバスに基づいて実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、
前記システムの分析モデルを生成するために、前記複数のメタパイプラインステージを前記メタデータに対して実行順序で実行することと、
を含む、非一時的コンピュータ可読媒体。
【請求項10】
前記命令は、前記メタデータに対して実行するための前記生成された複数のメタパイプラインステージのうちの1つを選択するために、強化学習プロセスを実行することをさらに含む、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項11】
前記複数のメタパイプラインステージを前記生成することは、
自然言語処理を使用してセマンティック検索のためのクエリを生成するために、前記仮説キャンバスを翻訳することと、
前記複数の装置に関連する1又は複数のパイプラインを検索するために、前記クエリからメタ学習データベースに対してセマンティック検索を実行することと、
前記1又は複数のパイプラインから前記メタパイプラインステージを生成することと、
前記メタパイプラインステージから生成された学習モデル、前記学習モデルに関連付けられたメタデータ、及び前記学習モデルにおいて関連付けられたメタフィーチャを追跡するように構成されたリポジトリにおいて前記メタパイプラインステージを管理することと、
を含む、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項12】
前記命令は、
前記仮説キャンバスから抽出された1又は複数のキーパフォーマンス指標に対して前記分析モデルを評価することと、
前記評価に基づいて、前記複数のメタパイプラインステージのうちの1又は複数を修正することと、
をさらに含む、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項13】
前記システムの前記分析モデルを生成するために、前記複数のメタパイプラインステージを前記メタデータに対して実行順序で前記実行することは、ハイパーパラメータポリシーから選択された様々なハイパーパラメータを有する複数の候補分析モデルを生成することを含み、
前記仮説キャンバスから抽出された1又は複数のキーパフォーマンス指標に対して前記分析モデルを前記評価することは、マルチアームドバンディット手法を用いて前記複数の候補分析モデルを通して処理された前記複数のセンサから受信されたセンサデータに対して前記複数の候補分析モデルを評価することを含み、
前記評価に基づいて前記複数のメタパイプラインステージのうちの1又は複数を前記修正することは、
前記マルチアームドバンディット手法を用いて収集された報酬を最大化する前記候補分析モデルのうちの1つを前記分析モデルとして選択することと、
前記候補分析モデルのうちの前記選択された1つに従って、前記複数のパイプラインステージのうちの前記1又は複数を修正することと、
を含む、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項14】
前記命令は、前記分析モデルを前記システム上で展開することにより、前記複数の装置のうちの1又は複数を制御することをさらに含む、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項15】
前記仮説キャンバスは、前記メタデータ、前記システムに関連付けられた仮説、前記仮説から予期される予測、及び前記仮説に関連付けられたリスクを取得するために前記複数のセンサのうちの1つを識別する複数のデータソースを含む、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項16】
前記命令は、新しいデータセットにメタパイプラインを適用するために、異なるメタデータ及びメタフィーチャからのデータ構造、既存のデータセット及び前記新しいデータセットからのデータ構造、並びに異なるデータセットからのデータ構造を比較するように構成されたメタ学習プロセスを実行することをさらに含む、請求項9に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データ分析プラットフォーム、より具体的には、自己学習分析ソリューションコアを促進するシステム及び方法を対象とする。
【背景技術】
【0002】
関連技術において、モデルの作成は、1つにはリソースのギャップに起因して、データ分析にとって非常に困難な問題である。データサイエンティスト及び主題の専門家は、企業内では、ますますまれなポジションとなっている。
【0003】
関連技術では、以前の訓練モデルから学習するシステムの促進に関する問題がある。一般的なデータサイエンスプロセス中に、データサイエンティストは、複数のハイパーパラメータを使用して、幾つかの種類のモデルを試す。このプロセスは、データサイエンスチームにかなりの時間を要求し、結局は、データサイエンティストは、作成された少数のモデルしか保持しない。たとえ後でモデルを構築する際に潜在的に有用である可能性があるとしても、機能しなかったこれらのモデルからの学習はすべて破棄される。モデルの履歴が保持されないため、将来の分析で何が機能する可能性があるかを識別することは不可能である。
【0004】
関連技術において、分析における難題の1つは、ビジネス要件を使用してモデルを作成することである。ビジネスの問題を理解し、それを仮説試験に変換し、及び適切なパイプラインを適用するプロセスは、ステージの無限の可能性により複雑である。ステージは、機械学習パイプラインにおける分析パイプラインの1つの逐次ステップである。
【0005】
関連技術では、以前のフィーチャエンジニアリング実験から教訓を得ることに問題がある。データサイエンティストは、データの準備にかなりの時間を費やす。フィーチャエンジニアリング及びフィーチャ選択から学習されたすべての教訓は、この学習は保存されないため、無駄になる。これらのメタフィーチャの教訓を維持することは、将来のモデルで使用するために重要となり得る。
【発明の概要】
【発明が解決しようとする課題】
【0006】
関連技術の問題に対処するために、例示的実装形態は、ツール及びプロシージャの一群を含むフレームワークを含む。以前の訓練モデルから学習し、ビジネス要件を使用してモデルを作成するシステムを促進するために、本明細書に記載する例示的実装形態は、メタ学習を取り入れ、それらのリソースギャップを解消し、分析ソリューションを製品に組み込む。
【0007】
例示的実装形態では、自然言語処理(NLP)を使用して、分析ソリューションコア(ASC)の仮説キャンバス(テキスト)の数値表現を作成し、それを、(以前のユースケースで使用された)メタパイプラインを保存し、並びに分析アプリケーション及び機械学習アプリケーションの一群を含む1つ又は複数のメタステージコンポーネントで構成される、メタ学習データベース(DB)に保存する。例示的実装形態は、モデリングフェーズに関するすべての情報を保存できるデータベースを作成することを含む。データサイエンスサイクルでは、モデリングフェーズは、どのモデルが問題の解決に最も適するかを決定するために、データサイエンティストが幾つかの異なるフィーチャ及びモデルを試すときである。データベースは、これらすべての実験を保存し、将来の分析の生成において、それらを使用することによって、以前の実験を将来の潜在的アセットに変換する。
【0008】
このソリューションの主な目的は、将来の分析で機能する可能性のあるモデルを保持し、それによって時間及びリソースを節約することである。
【0009】
さらに、ソリューションに対する新しい要求に応答して、NLPは、確率的検索を使用して、単語のペアの数値表現を使用すること(例えば、低尤度は、異なる単語群であり、高確率は、類似の単語群である)、及び入力情報を使用してメタアーニングDBにおいてペアの類似度を算出するために距離法を使用することによって、テキストの異なるシーケンスの尤度を検出める。
【0010】
データサイエンスプロジェクトの作成は、データエンジニアリング、データサイエンス、及び主題の専門知識を必要とする。これら3つの役割はそれぞれ、データサイエンスプロジェクトに極めて重要な寄与をする。データサイエンティストは、ビジネス、数学、及びコーディングの専門知識を提供し、主題の専門家は、ユースケースのドメイン知識に寄与し、データエンジニアは、プロジェクトのデータエンジニアリングの部分で、データサイエンティスト及び主題の専門家をサポートする。例示的実装形態は、システムにおいて、データサイエンティスト、主題の専門家、及びドメイン専門家の知識をカプセル化するデータサイエンスプロジェクトの作成を可能にする。例示的実装形態は、分析ソリューションを構築するために必要とされるすべてのビジネス要件を備えた入力情報として機能するアーチファクトである、仮説ビジネスキャンバスを使用する。
【0011】
分析ソリューションコアの構成可能性は、分析アーチファクトの再利用性の欠如の問題を解決する。現在では、分析アーチファクトは、自動プロシージャにおいて再利用されない。データサイエンティストは、ステージを再利用するために、分析パイプラインを設計する必要がある。分析コンポーネントは、接続されて、ASCを構築する。このASCは、コンポーネントを使用して生成され、ソリューションは、分析のコンテキストとして仮説キャンバスを使用して、権利ステージを選ぶ。例えば、ユースケースが、チャーン分析であり、ユーザが、チャーン分析を実行するために取引情報を使用したい場合、変換に関するデータセットは、顧客製品の表現を作成するためにカテゴリフィーチャをコード化する取引データセットの最新購買日、購買頻度、及び購買金額を含み得る。この表現は、訓練すべき幾つかの機械学習アルゴリズムの入力となる。
【0012】
適切なソリューションコアを見つけることができない場合は、最も近いメタステージが、DBから選択され、選択されたコンポーネントは、新しいタスクを学習し、どれが最良の学習方法であるかを学習する能力を有するシミュレーションプロセスを使用して、新しいメタパイプラインASCとなるように組み合わせられる。最良の方法を学習した後、システムは、将来のモデルにおいて、それらの方法を適用する。ASCのすべての組み合わせは、メタ学習DBに保存される。
【0013】
関連技術の実装形態では、データサイエンスプロジェクトは、データサイエンティストが最終モデルを選んだ後に、未使用のモデルを捨てる。ここでの主な目的は、将来のモデルの参照として、生成されたすべてのモデルからのすべての情報を保存することである。この情報を保持することは、新しい分析実験で有用となる場合がある。
【0014】
本明細書に記載する例示的実装形態は、ビジネスユーザにエンドツーエンドのソリューションを提供することを目的とする。仮説ビジネスキャンバスは、データサイエンティストがレイヤを構築するために必要なすべての要件を提供し、キャンバスは、自然言語理解(NLU)と、再利用性及び構成可能性のような分析ソリューションコア特性を使用して分析パイプラインでビジネスユースケースを変換するセマンティックマッチングレイヤとに接続する。
【課題を解決するための手段】
【0015】
本開示の態様は、複数の装置に関連付けられた複数のセンサを含むシステムのための方法であって、方法は、複数のセンサから仮説キャンバス及びメタデータを受信するために、複数のメタパイプラインステージを生成することであって、複数のメタパイプラインステージは、メタデータ及び1又は複数のステージを含み、1又は複数のステージのそれぞれは、メタデータ及び仮説キャンバスに基づいた実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、システムの分析モデルを生成するために、複数のメタパイプラインステージをメタデータに対して実行順序で実行することと、を含む、方法を含む。
【0016】
本開示の態様は、複数の装置に関連付けられた複数のセンサを含むシステムのための命令を記憶するコンピュータプログラムであって、命令は、複数のセンサから仮説キャンバス及びメタデータを受信するために、複数のメタパイプラインステージを生成することであって、複数のメタパイプラインステージが、メタデータ及び1又は複数のステージを含み、1又は複数のステージのそれぞれは、メタデータ及び仮説キャンバスに基づいた実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、システムの分析モデルを生成するために、複数のメタパイプラインステージをメタデータに対して実行順序で実行することと、を含む、コンピュータプログラムを含む。コンピュータプログラムは、非一時的コンピュータ可読媒体に記憶され、1又は複数のプロセッサによって実行されてもよい。
【0017】
本開示の態様は、複数の装置に関連付けられた複数のセンサと、複数のセンサから仮説キャンバス及びメタデータを受信するために、複数のメタパイプラインステージを生成するための手段であって、複数のメタパイプラインステージは、メタデータ及び1又は複数のステージを含み、1又は複数のステージのそれぞれは、メタデータ及び仮説キャンバスに基づいた実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成するための手段と、システムの分析モデルを生成するために、複数のメタパイプラインステージをメタデータに対して実行順序で実行するための手段と、を含む、システムを含む。
【0018】
本開示の態様は、複数の装置に関連付けられた複数のセンサを含むシステムのための管理装置であって、管理装置は、複数のセンサから仮説キャンバス及びメタデータを受信するために、複数のメタパイプラインステージを生成することであって、複数のメタパイプラインステージは、メタデータ及び1又は複数のステージを含み、1又は複数のステージのそれぞれは、メタデータ及び仮説キャンバスに基づいた実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、システムの分析モデルを生成するために、複数のメタパイプラインステージをメタデータに対して実行順序で実行することと、を行うように構成されたプロセッサを含む、管理装置を含む。
【図面の簡単な説明】
【0019】
図1図1は、ある例示的実装形態による、ASCのバリューチェーンとして協働する様々な役割に関する一例を示す図である。
【0020】
図2図2は、ある例示的実装形態による、システムのアーキテクチャ例を示す図である。
【0021】
図3図3は、ある例示的実装形態による、プロセスを開始するためのデータサイエンティストキュレーションフローの一例を示す図である。
【0022】
図4図4は、ある例示的実装形態による、移動中のアセットに関するASC連続異常監視及び位置識別からのASCキャンバスの一例を示す図である。
【0023】
図5図5は、ある例示的実装形態による、移動中のアセットに関する連続異常監視及び位置識別からの仮説キャンバスの一例を示す図である。
【0024】
図6図6は、ある例示的実装形態によるシステム認知の一例を示す図である。
【0025】
図7図7は、ある例示的実装形態によるメタ学習サブシステムプロセスの一例を示す図である。
【0026】
図8図8は、ある例示的実装形態による分類ツリーの一例を示す図である。
【0027】
図9図9は、ある例示的実装形態によるメタ学習プロセスの一例を示す図である。
【0028】
図10図10は、ある例示的実装形態による強化学習(RL)プロセスを示す図である。
【0029】
図11図11は、ある例示的実装形態による例示的メタパイプラインを示す図である。
【0030】
図12図12は、ある例示的実装形態による、接続されたセンサを有する複数のシステム及び管理装置を含むシステムを示す図である。
【0031】
図13図13は、いくつかの例示的実装形態での使用に適した例示的コンピュータデバイスを備えた例示的コンピューティング環境を示す図である。
【発明を実施するための形態】
【0032】
以下の詳細な説明は、本出願の図面及び例示的実装形態の詳細を提供する。明確さのために、図面間の冗長な要素の参照番号及び説明は省略されている。明細書全体を通して使用される用語は、例として提供されるものであり、限定することを意図したものではない。例えば、「自動」という用語の使用は、本出願の実装形態を実施する当業者の所望の実装形態に応じて、実装形態の特定の態様に対するユーザ又は管理者の制御を伴う完全自動又は半自動実装形態を含んでもよい。選択は、ユーザインタフェース又は他の入力手段を用いてユーザによって行われ得、又は所望のアルゴリズムを用いて実装され得る。本明細書に記載するような例示的実装形態は、単独で、又は組み合わせて利用され得、例示的実装形態の機能は、所望の実装形態による任意の手段によって実装され得る。
【0033】
分析コードは、顧客関与から生まれ、市場観点から有用な関連性を示す。分析ソリューションコア(ASC)を中心とするバリューチェーンを説明するために、3人の主要な登場人物:プロデューサ、キュレータ、及び消費者が関与する。プロデューサは、分析ユースケースを作成するエンティティを含む。プロデューサは、コアアーチファクトを作成し、それらのアーチファクトをキュレータに提供する。キュレータは、プロデューサによって提供されたアーチファクトの品質を選択し、標準化し、及び改善するエンティティである。消費者は、バリューチェーンの末端におり、キュレータが変換プロシージャを適用した後にアーチファクトを消費するエンティティを含む。
【0034】
図1は、ある例示的実装形態による、ASCのバリューチェーンとして協働する様々な役割に関する一例を示す。
【0035】
分析プロジェクトが必要とされる場合、分析プロジェクトは、機密保持契約及び知的財産条項の必要性の決定などの、プロジェクトの財務及び法的プロファイルを含むビジネスユースケースを作成するデータサイエンティストチームを含むプロデューサ100によって、システムに配置される。データサイエンティストチームは、特に仮説キャンバス及び分析コードを含むアーチファクトの構築に取り組む。プロジェクトの最後には、幾つかのアーチファクトは、ASCで変換される準備が整う。
【0036】
プロジェクトの終了後に、データサイエンスチームは、ASCチームを含み得るキュレータ101に顧客アーチファクトを届ける。ASCチームは、アーチファクトを準備し、すべてをASCの仕様及び要件に適合させ、コードの品質を制御し、必要に応じてコードを改良する。
【0037】
キュレーションプロセスの後には、アーチファクトは、消費者102のために展開される準備が整っている。プロデューサ100は、顧客との幾つかの分析的関与を持っていてもよい。これらの関与から、そのドメインの専門家と共にアイデアをテストし、関連する分析コードを開発し、及びそれをASCに変換することができる。コードをASCに変換する際に、データサイエンティストにとっての最初のステップは、コードを標準化することである。このプロセスのために、データサイエンティストは、python言語、仮説キャンバス、元のデータセット、ビジネスドキュメンテーション、技術ドキュメンテーション、仮説キャンバステンプレート、及びASCキャンバステンプレートなどのアーチファクトを作成する必要がある。
【0038】
図2は、ある例示的実装形態による、システムの例示的アーキテクチャを示す。具体的には、図2は、例示的実装形態をサポートするために、どのようにサブグループが統一されたプロセスフローに加わるかを示す。図1で説明したように、プロデューサ100は、ユーザインタフェース201に入力される顧客関与200から分析プロジェクトを受け取る。キュレータ101は、コーディングリファクタ、仕様定義、及びユニットテスト202をウェブサービスメタデータ203に提供する。メタデータ203は、メタ学習システム210の管理者ユーザインタフェース204を介して、アーチファクト213としてASCカタログ207で発行され得る。
【0039】
消費者102は、チャットボット205を介してメタ学習システム210と通信する。チャットボット205は、消費者102とメタ学習システム210との間の通信を促進するために、仮説キャンバスコンテキスト化206のための自然言語処理(NLP)を促進する機能とインタフェースを確立する。メタ学習210は、データカタログ215をクエリできるようにインタフェース212に提供するために、仮説キャンバスコンテキスト化206のためのNLPの出力に対してセマンティックマッチング211を行う。メタ学習210の要素のさらなる説明は、図7に関して以下に提供する。
【0040】
図3は、ある例示的実装形態による、プロセスを開始するためのデータサイエンティストキュレーションフローの一例を示す。
【0041】
データサイエンティストは、アーチファクト213を「顧客関与からの分析プロジェクト」として受け取る。これらのアーチファクト213は、限定されないが、所望の実装形態に応じて、Python言語のコード、仮説キャンバス、元のデータセット、(仮説キャンバステンプレートで処理される)ユースケースのビジネス部分の説明を備えたドキュメンテーション、(ASCキャンバステンプレートで処理される)ユースケースの技術的部分の説明を備えたドキュメンテーションなどを含み得る。
【0042】
このドキュメンテーションを用いて、プロデューサ100は、UI/UXインタフェース204を使用して作業を開始するために、すべてのパッケージをキュレータ101のためのコードリポジトリに提出する。キュレータ101の主な目的は、パイプライン及びステージを形成するために、一連のコード片から標準化された逐次ロジックにコードを変換することである。次に、キュレータ101は、プロデューサ100によって以前に行われたすべての作業を検証する。キュレータ101は、幾つかの主要なプロセスを実行する。
【0043】
第1の主要なプロセスは、以下のプロシージャを含む「コーディングリファクタ仕様定義及びユニットテスト(Coding Refactor Specification Definition and Unit Test)」群202と呼ばれる。
【0044】
1.ASCカタログ207に発行するために、分析コードをASC規格に変換する。
【0045】
2.クライアントデータソースシステムの依存性を除去する。
【0046】
3.テストデータセットを含めて、確認する。
【0047】
4.訓練データの準備を含み、訓練データの検査及び検証を行う。
【0048】
5.コードの品質保証対策を実行する。
【0049】
6.水平及び垂直アプリケーションのコードをテストする。
【0050】
7.YAMLによる処理のためのYMLフォーマットを作成する。
【0051】
第2の主要なプロセスは、以下のプロシージャを含む、ASCのためのドキュメンテーション準備に焦点が当てられている。
【0052】
1.ASCモデルのドキュメントを検査する。
【0053】
2.コードのコメント及び規格を検査する。
【0054】
3.コードをpythonスクリプトフォーマットからJupyter Notebookフォーマットに書き換える。
【0055】
4.ASC開発キャンバスを検査する。
【0056】
5.ユーザ行程統合のドキュメントを作成する。
【0057】
6.仮説開発キャンバスを検査する。
【0058】
7.ASC訓練ドキュメントを作成する。
【0059】
8.訓練データドキュメンテーションの検査及び検証を行う。
【0060】
第3の主要なプロセスは、コード拡充群に焦点を当てたプロシージャの一群である。この群は、追加のフィーチャで分析コードを拡充する方法を含む。
【0061】
1.モデルの処理時間及び/又は精度のためにコード性能を向上させる新しいフィーチャを追加することによって、元の分析コードを拡充する。
【0062】
2.必要であれば、コンプライアンス及びソフトウェアライセンスのチェック及び改訂。
【0063】
図3に示される主な目標の1つは、以下を含む将来のフェーズのためにコード及びアーチファクトを準備することである。
【0064】
1.YAMLファイルの作成:プロデューサ100のデータサイエンティストチームメンバーは、ツールの仕様に基づいてYAMLファイルを作成する。このYAMLファイルは、ASCを起動及び実行するためにアプリケーションが必要なすべてのガイドラインを有する。
【0065】
2.Pythonコードのリファクタリング:図1に示されるように、プロデューサ100のデータサイエンティストチームメンバーは、PythonコードをASCのPythonコード規格に変換する。
【0066】
3.ASCのメタデータ情報の検証:ASCからのメタデータ情報の検証は、ウェブサービスメタデータ203によって利用される。この情報を使用して、データベースにおける通常の検索の代わりに、コンテキスト検索を行うことができる。
【0067】
4.単体テスト及び統合テストの作成:ASC内のブロック、ステージ、及びパイプラインをテストするための単体テストの作成。
【0068】
上記の3つのプロセス及びメタデータ情報は、ウェブサービスメタデータ203の基本情報である。内容は、以下のアーチファクトに必要とされる。
【0069】
1.YAMLファイル(パイプライン及びステージ):パイプライン及びステージに関する情報を有する、YAMLフォーマットのファイルの一群。
【0070】
2.Pythonファイル:ASCコードを有するPythonファイル。
【0071】
3.ユースケースメタデータ:業種、解決すべき問題、及び使用される機械類の仕様などの、ASCに関する参照の詳細を有するユースケースの情報。ASCキャンバスは、以下に論じられる。
【0072】
ASC及び仮説キャンバスは、分析のランタイム環境の技術的コンポーネントに関する異なるメタデータを含む2つのアーチファクトであり、ビジネスユースケースに関する情報も含む。どちらのキャンバスも、自然言語理解(NLU)及びNLPプロセスを供給し、ASCの技術的なeビジネスコンテキストをシステムに提供する。
【0073】
図4は、ある例示的実装形態による、移動中のアセットに関するASC連続異常監視及び位置識別からのASCキャンバスの一例を示す。
【0074】
例示的ASCキャンバスでは、内容の様々なセクションが存在する。このようなセクションは、以下のものを含み得る。
【0075】
モデル記述401は、モデル及びその適用性の簡単な説明を提供する。アルゴリズムライブラリ402は、ASCを起動するために必要なライブラリ及びアプリケーションのリストを含む。ソフトウェア及びハードウェア技術要件403は、データの処理及び保存に必要なリソースのリストを含む。ライセンス変数404は、ライブラリのライセンスのリストを含む。潜在的ユースケース405は、このモデルで機能する潜在的なユースケースの記述を含む。変数及びデータソース406は、アルゴリズムを処理するために必要な変数及びデータソースのリストを含む。フィーチャエンジニアリング要件407は、生データを処理し、より意味のある情報をモデルに供給するために必要なフィーチャのリストを含む。モジュールメトリクス/KPI408は、モデルの性能を測定するために使用されるメトリクのリストを含む。アプリケーションプログラミングインタフェース(API)(出力)409は、ASCの出力の記述を含む。動作コメント410は、ASCにとって重要な追加コメントを含む。
【0076】
例示的実装形態では、以下の要素に関するモデルフィーチャを訓練し、テストし、及び推論するためにASCによって使用されるデータセット。データスキーマは、各列の記述、列名、変数のタイプ、テーブル間の関係などを含む、データセットの定義を含む。データ内容は、データの内容を含む。
【0077】
図5は、ある例示的実装形態による、移動中のアセットに関する連続異常監視及び位置識別からの仮説キャンバスの一例を示す。具体的には、仮説キャンバスは、ASCのビジネスデータについての詳細な情報を提供する。
【0078】
仮説キャンバスを作成するために、インタフェースは、入力のために以下の要素を提供する。仮説501は、仮説を定義する。キーパフォーマンス指標(KPI)502は、仮説の進行及び成功が測定されるKPIを定義する。事業価値503は、仮説の事業価値を定義する。ステークホルダ504は、仮説によって影響を受ける構成要素を示す。エンティティ505は、分析を構築するためのエンティティを定義する。決定506は、仮説の裏付けとして最も重要な決定を定義する。予測507は、決定を裏付ける予測を定義する。
【0079】
データソース508は、使用されるデータソースを定義する。データソース508は、データソースが仮説を裏付けるために必要とされる点数も定義することができる(例えば、最も価値の低い1から最も価値の高い4まで)。変数(大きさ)509は、性能のより良い予測因子を生じさせる可能性がある変数を定義する。推奨510は、決定を裏付けるために必要とされる推奨を示す。障害511は、成功に対する技術的障害、データ障害、及び組織的障害を含む。リスク512は、偽陽性及び偽陰性に関連するコスト又はリスクを示す。財務評価513は、仮説の利得のメトリクス、及び障害によって仮説が影響を受ける点数(例えば、最も価値の低い1から最も価値の高い4まで)を含む。障害評価514は、仮説の障害評価の変数、及び仮説が障害によって影響を受ける点数(例えば、最も価値の低い1から最も価値の高い4まで)を含む。
【0080】
図6は、ある例示的実装形態によるシステム認知の一例を示す。図6のシステムは、仮説キャンバスに基づいて、ユーザから要求されたASCのコンテキストを決定するように構成される。ユーザは、チャットボット205を介して、NLP、NLU、及びセマンティックマッチングプロセス206に情報を提供し、次に、システムは、ユーザが必要とするものを翻訳し、データベースを検索して、ユーザのニーズを満たすASCが存在するか否か、又は類似のASCが存在するかどうかを決定する。本明細書に記載する例示的実装形態では、仮説キャンバスの翻訳から生成されたクエリを使用して、クエリに基づいてメタパイプラインの検索し、又は生成を行う。メタパイプラインは、システムの基礎となる装置からのデータを含むメタデータ、及びメタデータに対して逐次実行されるように構成された1又は複数のメタステージで構成され、各メタステージは、分析アプリケーション又は機械学習アプリケーションを含む。
【0081】
システム認知の一部として生成されるコンポーネントの幾つかは、以下の態様を含む。最初に、ユーザは、チャットボット205と情報を交換する。次に、自然言語処理アルゴリズム206は、ユーザの発言から幾つかの「not」ワードを除去する。次に、自然言語理解モデルは、分類モデルを適用して、会話中のユーザの意図を認識する。チャットボット205は、この情報を取得し、ルールベースのアルゴリズムの使用により、ユーザの質問に答える。
【0082】
幾つかのインタラクションの後に、セマンティックマッチングプロセス211は、グラフ化技術、分類法、及びオントロジーを使用して、意味的に関連する情報の識別に関連するファジーマッチを作成し、それらの表現を、ウェブサービスメタデータ203に格納された仮説キャンバスのデータベースと比較する。ウェブサービスがセマンティックマッチングを見つけると、ASCは、アーチファクト作成213及び汎用モデルZooデータベース218からユーザに提供される。成功マッチがない場合、プロセスは、メタ学習プロセス210の開始をトリガして、メタ学習システム216を使用して新しいASCを作成する。
【0083】
図7は、ある例示的実装形態によるメタ学習サブシステムプロセス210の一例を示す。システム認知が、マッチするユースケースを選択しようとして、その結果が成功しなかった後に、メタ学習プロセス210が呼び出される。データベースは、オントロジー/分類法を使用して、事前定義されたすべてのパイプラインの格納に対処する。
【0084】
図8は、ある例示的実装形態による分類ツリー903の一例を示す。分類ツリーは、ビジネスの観点を分析にリンクさせる。例えば、分類上のビジネスの問題のニーズに適合するようにASCを事前定義することができる。分類ツリー903は、ビジネスの観点を分析にリンクさせるために横断する様々なレベル800、801、802、803を含み得る。レベルの例は、限定されないが、ASC800、分析801、問題802、及びビジネスの分野803が含まれ得る。
【0085】
データベースに加えて、それは、プロセスを維持し、また結果をユーザに説明するために、説明可能な人工知能(AI)219の事前構築されたプロシージャを有する。この説明可能なAI219の能力は、ユースケースにとって最良の説明可能なフィーチャを含む分類ツリーも含む。このプロセスは、アセット階層内のあらゆるアセットについて、次のフローにおけるモデル管理プロセスによって調整される。
【0086】
最初に、モデルマネージャ224は、ビジネスユーザの入力に基づいてASCを使用すること、並びに分類法及びアセットモデルのアセットを使用することによって、プロセスを開始する。モデルマネージャは、最も類似したASCを探す。
【0087】
次に、モデルマネージャは、事前定義された分類法を使用して、データカタログ215上のデータを識別する。必要であれば、それは、欠測値を埋めるか、或いは現在のサンプリングに基づいて合成データ214を準備する。サンプリング方法の場合、現在のサンプルの使用から、モデルマネージャ224は、データの分布を使用して新しいデータを再現し、どの分布がサンプルデータセットを表すかを調べる。このステップの後に、それは、モンテカルロシミュレーションを行い、同じ分布のランダムサンプルを生成する。データカタログ215及び合成データプロセス214は、アセット階層220内のあらゆるアセットに対して呼び出される。
【0088】
類似のASCが見つからない場合は、モデルマネージャ224は、図9に関して説明されるメタ学習プロセスからASCを構築するプロセスを経る。既存のASCに基づいて、又は新しいASCに基づいて、ASCは、本番システム225上でモデルを実行できるモデルサーバ222を使用して展開される。次いで、モデル監視221は、モデルのドリフトを監視し、新しいデータを使用して新しい訓練フェーズを開始する。訓練フェーズが十分な結果を得なければ、プロシージャは、新しいモデルを見つけるために、メタ学習プロセス216及びデータ特性化プロセス217を開始する。メタ学習プロセスが成功しなければ、全体的なソリューションは、データサイエンティストが前進するために微調整することを必要とする。このプロセスは、アセット階層のアセットごとに繰り返され、すべてのアセットの最適性能のために並行して行われる。
【0089】
図9は、ある例示的実装形態によるメタ学習プロセスの一例を示す。
【0090】
モデル展開フェーズでは、モデルは、メタパイプライン905及びモデル作成908を形成するメタステージの実行から生成される。モデルは、AutoMLライブラリ900によって展開され、図10でさらに説明するように、強化学習901を使用することによって訓練される。モデルは、モデル判断902によって、KPIに対して評価される。モデルを再作成する必要がある場合は、メタステージを修正し、モデル作成908によって新しいモデルを作成するために、フィードバックがメタパイプライン905に提供され得る。
【0091】
モデル訓練ステップ中に、図9のメタ学習プロセスは、別のASC方法が存在しない場合に、別のASC方法を実現するために使用される。メタ学習フェーズは、以下のように定義される。
【0092】
最初に、分類法903を使用することによって、プロセスは、メタステージリポジトリ904を横断し、事前定義されたメタパイプライン905、メタデータ907、及びメタフィーチャ906を選択する。メタ学習の概念は、以前の機械学習モデルからの自動学習が再利用され、将来のモデルで学習されるプロセスである。メタステージは、以前は他のユースケースで使用され、同じ性質の将来のユースケースで有用となり得る分析のアトムコンポーネントである。そのようなメタステージは、メタステージリポジトリ904に格納され得る。メタパイプライン905は、他のユースケースで以前に使用されたメタステージによって構成された分析パイプラインであり、それは、同じ性質の将来のユースケースに有用となり得る。
【0093】
図10は、ある例示的実装形態による強化学習(RL)プロセスを示す。RLプロセスの入力は、幾つかの異なるシナリオを作成するために以前に定義されたメタデータ、メタフィーチャ、及びメタパイプラインを使用する幾つかの潜在的モデルである。
【0094】
RLの第1ラウンドは、最良のモデルが、アクションに基づいて選択され、報酬システムを最大化し、及びマルチアームドバンディット(multi-armed bandit)手法からなるリグレットを最小化する探索フェーズである。各モデルは、エージェント1000と名付けられる。この目的は、インスタンスのスコアを最大化し、性能メトリックを最大化することである。アクションは、ハイパーパラメータポリシーを使用してのモデルにおける異なるハイパーパラメータの選択である。最高の報酬を集めるエージェント1000は、モデル管理により、本番時に配備される。これは、エージェントの活用である。本番環境1001では、モデル管理はヘルス状態を測定し、エージェントの挙動を監視する。エージェントの報酬が最適なものではない場合は、モデル管理は、現在のエージェントを本番から除外し、活用される第2エージェントを選択する。このプロセスは、プロセスがすべてのエージェント1000を使い果たすまで繰り返される。
【0095】
図11は、ある例示的実装形態による例示的メタパイプライン1100を示す。メタパイプライン1100は、異なるやり方で構成可能な異なるメタステージ1101によって処理されるメタデータ1102を含む。これらのメタステージ1101のそれぞれは、評価され、どのメタステージ1101又はそれらの組み合わせが最良の性能を有するかを決定するために、顧客からのメタデータと比較される。
【0096】
メタステージ1101は、異なる分析アプリケーション(例えば、統計アプリケーション、視覚化アプリケーションなど)及び/又は逐次適用及び実行される機械学習アプリケーションを含み得る。例えば、メタステージ1101は、メタパイプライン1100を作成するために使用され、且つ実行順序で相互接続され得る、統計、分析、データ情報、又は機械学習モデルのユニットを含み得る。メタステージ1101の例は、限定されないが、メタフィーチャ1103、メタモデル1104、及びメタ視覚化アプリケーション1105を含み得る。
【0097】
メタパイプライン1100の以下の例では、メタデータ1102は、限定されないが、製品階層1110、取引1111、顧客マーケティング属性1112、気象データ1113、及び作付面積1114を含み得る。メタデータ1102は、メタフィーチャ1103である第1メタステージにリンクされる。メタフィーチャ1103は、メタデータ1102からフィーチャを生成するアプリケーションを含む。メタデータ1102からフィーチャを生成するためにメタフィーチャ1103によって使用されるサブ機能の例は、メタデータを好ましい構造にフォーマットするためのデータスキーマ1115、及び処理されたメタデータからフィーチャを導出するためのフィーチャエンジニアリング1116を含み得る。次に、メタフィーチャ1103メタステージは、メタモデル1104である次のメタステージにリンクされる。
【0098】
メタモデル1104は、モデルを生成するために、メタフィーチャ1103から生成されたフィーチャを取り込むように構成される。この例では、メタモデル1104は、モデルの組み合わせから形成された最良適合モデルを識別するためにグリッド検索を使用することによるマルチモデル手法を含む。グリッド検索、ランダム検索、又はベイジアン最適化のためのそのようなモデルは、限定されないが、決定木1117、ランダムフォレスト1118、サポートベクターマシン1119、及びロジスティック回帰1120を含み得る。
【0099】
次に、メタモデル1104は、メタ視覚化アプリケーション1105である次のメタステージにリンクされる。次に、メタモデル1104によって生成されたモデルは、分析を視覚化するための出力を生成するメタ視覚化アプリケーション1105に接続される。視覚化アプリケーション1105からの出力の例は、尤度p(i)1121、属性1122、及びE(Rev)-p(i)*昨年収益1123を含み得る。
【0100】
したがって、例示的メタパイプライン1100では、メタデータ1102は、メタデータ1102を処理してフィーチャを抽出するためのメタフィーチャ1103の実行、次に、モデルを生成するためにメタフィーチャ1103からフィーチャを取り込むためのメタモデル1104の実行、及び次に、視覚化出力を生成するためのメタ視覚化1105の実行を含む実行順序で、メタステージ1101を通して処理される。別の例示的実装形態では、メタステージ1101の別の例は、メタモデル1104の出力に基づいてシステムの基礎となる装置を制御するコントローラアプリケーションを含み得る。
【0101】
本明細書に記載の例示的実装形態を用いて、大規模システム(例えば、分析工場、生産ラインなど)における展開により、モデルがリアルタイムで更新されながらシステムを制御することを許容し得る。ある例では、分析コード及びビジネスアーチファクトを含む、仮説キャンバス及びメタデータを介して、出力は、SaaSサービスフォーマットに配備され得るモデルを有する分析システムでよい。
【0102】
本明細書に記載する例示的実装形態は、モデルのデータウェアハウスを促進することができ、データサイエンティストが所与のソリューションのために任意のモデルをチェックして、再利用することを容易にする。「悪い」結果をもたらしたモデルを保持することによって、データサイエンティストは、うまく機能しなかった領域をチェックし、検査することができる。うまく機能したモデルに関して、データサイエンティストは、それらのモデルを維持し、別のデータでそれらを再訓練するか、或いは再訓練しないで再利用することができる。
【0103】
図12は、ある例示的実装形態による、接続されたセンサを有する複数のシステム及び管理装置を含むシステムを示す。接続されたセンサを有する1又は複数のシステム1201-1、1201-2、1201-3、及び1201-4は、モノのインターネット(IoT)ゲートウェイ又は他の製造管理システムの機能を促進する管理装置1202に接続されているネットワーク1200に通信可能に接続されている。管理装置1202は、システム1201-1、1201-2、1201-3、及び1201-4から受け取ったラベル付きデータ及びラベルなしデータを含み得る、システム1201-1、1201-2、1201-3、及び1201-4のセンサから収集された履歴データを含むデータベース1203を管理する。代替例示的実装形態では、システム1201-1、1201-2、1201-3、1201-4のセンサからのデータは、中央リポジトリ、又は企業資源計画システムなどのデータを取り込む専用データベースなどの中央データベースに保存され得、管理装置1202は、中央リポジトリ又は中央データベースからデータにアクセスすること、又はデータを取り出すことができる。そのようなシステムは、所望の実装形態に応じて、センサを備えたロボットアーム、センサを備えたタービン、センサを備えた旋盤などを含み得る。
【0104】
図13は、図12に示されるような管理装置1202などの、いくつかの例示的実装形態での使用に適した例示的コンピュータデバイスを備えた例示的コンピューティング環境を示す。
【0105】
コンピューティング環境1300内のコンピュータデバイス1305は、1又は複数の処理ユニット、コア、又はプロセッサ1310と、メモリ1315(例えば、RAM、ROM、及び/又は同様のもの)、内部ストレージ1320(例えば、磁気、光学、ソリッドステートストレージ、及び/又は有機)、及び/又はI/Oインタフェース1325を含み得、これらの何れも、情報を通信するための通信機構又はバス1330上で接続されてもよく、又はコンピュータデバイス1305に埋め込まれてもよい。I/Oインタフェース1325はまた、所望の実装形態に応じて、カメラから画像を受信するか、或いはプロジェクタ又はディスプレイに画像を提供するように構成される。
【0106】
コンピュータデバイス1305は、入力/ユーザインタフェース1335及び出力デバイス/インタフェース1340に通信可能に接続され得る。入力/ユーザインタフェース1335及び出力デバイス/インタフェース1340の一方又は両方は、有線又は無線インタフェースであってもよく、取り外し可能であってもよい。入力/ユーザインタフェース1335は、入力を提供するために使用され得る、物理的又は仮想の任意のデバイス、コンポーネント、センサ、又はインタフェース(例えば、ボタン、タッチスクリーンインタフェース、キーボード、ポインティング/カーソル制御、マイクロフォン、カメラ、点字、モーションセンサ、光学リーダ、及び/又は同様のもの)を含んでもよい。出力デバイス/インタフェース1340は、ディスプレイ、テレビ、モニタ、プリンタ、スピーカ、点字などを含んでもよい。いくつかの例示的実装形態では、入力/ユーザインタフェース1335及び出力デバイス/インタフェース1340は、コンピュータデバイス1305に埋め込まれ得、又は物理的にされ得る。他の例示的実装形態では、他のコンピュータデバイスが、コンピュータデバイス1305のための入力/ユーザインタフェース1335及び出力デバイス/インタフェース1340として機能してもよく、又はそれらの機能を提供してもよい。
【0107】
コンピュータデバイス1305の例は、限定されないが、高移動性デバイス(例えば、スマートフォン、車両及び他の機械内のデバイス、人及び動物によって携行されるデバイスなど)、モバイルデバイス(例えば、タブレット、ノート型パソコン、ラップトップ型コンピュータ、パーソナルコンピュータ、ポータブルテレビ、ラジオなど)、並びに移動用に設計されていないデバイス(例えば、デスクトップコンピュータ、他のコンピュータ、情報キオスク、内部に埋め込まれた、及び/又は接続された1又は複数のプロセッサを備えたテレビ、ラジオなど)を含み得る。
【0108】
コンピュータデバイス1305は、(例えば、I/Oインタフェース1325を介して)外部ストレージ1345、並びに任意の数のネットワーク化されたコンポーネント、デバイス、及び、同じ又は異なる構成の1又は複数のコンピュータデバイスを含んでいるシステムと通信するためのネットワーク1350に通信可能に接続されてもよい。コンピュータデバイス1305又は任意の接続されたコンピュータデバイスは、サーバ、クライアント、シンサーバ、汎用マシン、専用マシン、若しくは別のラベルとして機能すること、それらのサービスを提供すること、又はサーバ、クライアント、シンサーバ、汎用マシン、専用マシン、若しくは別のラベルと呼ばれることが可能である。
【0109】
I/Oインタフェース1325は、限定されないが、コンピューティング環境1300内の少なくともすべての接続されたコンポーネント、デバイス、及びネットワークへ及び/又はそれらから情報を通信するための任意の通信又はI/Oプロトコル又は規格(例えば、イーサネット、802.11x、ユニバーサルシステムバス、WiMax、モデム、セルラーネットワークプロトコルなど)を含み得る。ネットワーク1350は、任意のネットワーク、又はネットワークの組み合わせ(例えば、インターネット、ローカルエリアネットワーク、広域ネットワーク、電話網、セルラーネットワーク、衛星ネットワークなど)であり得る。
【0110】
コンピュータデバイス1305は、一時的媒体及び非一時的媒体を含む、コンピュータ使用可能又はコンピュータ可読媒体を使用すること、及び/又はそれらを使用して通信することができる。一時的媒体は、伝送媒体(例えば、金属ケーブル、光ファイバ)、信号、搬送波などを含む。非一時的媒体は、磁気媒体(例えば、ディスク及びテープ)、光学媒体(例えば、CD-ROM、デジタルビデオディスク、Blu-ray(登録商標)ディスク)、ソリッドステート媒体(例えば、RAM、ROM、フラッシュメモリ、ソリッドステートストレージ)、及び他の不揮発性ストレージ又はメモリを含む。
【0111】
コンピュータデバイス1305は、幾つかの例示的コンピューティング環境において、技術、方法、アプリケーション、プロセス、又はコンピュータ実行可能命令を実装するために使用され得る。コンピュータ実行可能命令は、一時的媒体から取り出すこと、並びに非一時的媒体に格納し及び非一時的媒体から取り出すことができる。実行可能命令は、任意のプログラミング、スクリプティング、及び機械語(例えば、C、C++、C#、Java、Visual Basic、Python、Perl、JavaScriptなど)の1又は複数から由来し得る。
【0112】
1つ又は複数のプロセッサ1310は、ネイティブ又は仮想環境において、任意のオペレーティングシステム(OS)(図示せず)の下で実行することができる。論理ユニット1360、アプリケーションプログラミングインタフェース(API)ユニット1365、入力ユニット1370、出力ユニット1375、並びに異なるユニットが互いに通信するため、OSと通信するため、及び他のアプリケーション(図示せず)と通信するためのユニット間通信機構1395を含む1又は複数のアプリケーションが展開され得る。記載したユニット及び要素は、設計、機能、構成、又は実装において変更することができ、提供された記載に限定されない。
【0113】
幾つかの例示的実装形態では、情報又は実行命令がAPIユニット1365によって受信されると、それは、1つ又は複数の他のユニット(例えば、論理ユニット1360、入力ユニット1370、出力ユニット1375)に通信されてもよい。場合によっては、論理ユニット1360は、上記の幾つかの例示的実装形態において、ユニット間の情報フローを制御し、APIユニット1365、入力ユニット1370、出力ユニット1375によって提供されるサービスを指示するように構成されてもよい。例えば、1又は複数のプロセス又は実装のフローは、論理ユニット1360単独で、又はAPIユニット1365と併せて制御されてもよい。入力ユニット1370は、例示的実装形態に記載される計算のための入力を取得するように構成されてもよく、出力ユニット1375は、例示的実装形態に記載される計算に基づいて出力を提供するように構成されてもよい。
【0114】
複数のセンサから図5に示されるような仮説キャンバス及びメタデータを受け取るために、プロセッサ1310は、複数のメタパイプラインステージを生成することであって、複数のメタパイプラインステージは、メタデータ及び1又は複数のステージを含み、1又は複数のステージのそれぞれは、図11に示されるようなメタデータ及び仮説キャンバスに基づいて実行順序でスタックされた分析アプリケーション又は機械学習アプリケーションである、生成することと、図9に示されるように、システムの分析モデルを生成するために、複数のメタパイプラインステージをメタデータに対して実行順序で実行することと、を行うように構成され得る。
【0115】
プロセッサ1310は、図10に示されるように、メタデータに対して実行するための、生成された複数のメタパイプラインステージのうちの1つを選択するために、強化学習プロセスを実行するように構成され得る。
【0116】
プロセッサ1310は、図3及び図6に示されるように、自然言語処理を使用してセマンティック検索のためのクエリを生成するために、仮説キャンバスを翻訳することと、複数の装置に関連する1又は複数のパイプラインを検索するために、クエリからメタ学習データベースに対してセマンティック検索を実行することと、1又は複数のパイプラインからメタパイプラインステージを生成することと、メタパイプラインステージから生成された学習モデル、学習モデルに関連付けられたメタデータ、及び学習モデルに関連付けられたメタフィーチャを追跡するように構成されたリポジトリにおいてメタパイプラインステージを管理することと、によって複数のメタパイプラインステージを生成するように構成され得る。
【0117】
プロセッサ1310は、図9及び図10に示されるように、仮説キャンバスから抽出された1又は複数のキーパフォーマンス指標に対して分析モデルを評価するように構成され得、評価に基づいて、複数のメタパイプラインステージのうちの1又は複数を修正する。
【0118】
図7~11に示されるように、プロセッサ1310は、ハイパーパラメータポリシーから選択された様々なハイパーパラメータを有する複数の候補分析モデルを生成することを含んで、システムの分析モデルを生成するために、メタデータに対して複数のメタパイプラインステージを実行順序で実行するように構成することができ、仮説キャンバスから抽出された1又は複数のキーパフォーマンス指標に対して分析モデルを評価することは、マルチアームドバンディット手法を用いて複数の候補分析モデルを通して処理された複数のセンサから受信されたセンサデータに対して複数の候補分析モデルを評価することを含み、評価に基づいて複数のメタパイプラインステージのうちの1又は複数を修正することは、マルチアームドバンディット手法を用いて収集された報酬を最大化する候補分析モデルのうちの1つを分析モデルとして選択することと、候補分析モデルのうちの選択された1つに従って、複数のパイプラインステージのうち1又は複数を修正することと、をさらに含む。
【0119】
図5に示されるように、仮説キャンバスは、メタデータ、システムに関連付けられた仮説、仮説から予期される予測、及び仮説に関連付けられたリスクを取得するために、複数のセンサのうちの1つを識別する複数のデータソースを含み得る。
【0120】
図9に示されるように、プロセッサ1310は、新しいデータセットにメタパイプラインを適用するために、異なるメタデータ及びメタフィーチャからのデータ構造、既存のデータセット及び新しいデータセットからのデータ構造、並びに異なるデータセットからのデータ構造を比較するように構成されたメタ学習プロセスを実行するように構成され得る。
【0121】
プロセッサ1310は、システム上で分析モデルを展開することにより、複数の装置のうちの1又は複数を制御するように構成され得る。例えば、プロセッサ1310は、所望の実装形態に応じて、分析モデルの出力に基づいて、装置の電源をオン/オフすること、職長にフラグを立てるために装置の近くでアンドンを起動すること、リアルタイムで装置の設定を調整することなどを行うように構成され得る。
【0122】
詳細な説明のいくつかの部分は、コンピュータ内の動作のアルゴリズム及び記号表現で提示される。これらのアルゴリズム記述及び記号表現は、データ処理分野の当業者が、イノベーションの本質を他の当業者に伝えるために使用される手段である。アルゴリズムは、所望の最終状態又は最終結果に至る一連の定義されたステップである。例示的実装形態では、実行されるステップは、具体的な成果を達成するために具体的な量の物理的操作を必要とする。
【0123】
特に別段の記載のない限り、説明から明らかなように、明細書の記載全体を通して、「処理する」、「算出する」、「計算する」、「決定する」、「表示する」などの用語を利用した説明は、コンピュータシステムのレジスタ及びメモリ内の物理(電子)量として表されるデータを操作し、コンピュータシステムのメモリ又はレジスタ又は他の情報ストレージ、伝送デバイス、又は表示デバイス内の物理量として同様に表される他のデータに変換する、コンピュータシステム又は他の情報処理デバイスのアクション及びプロセスを含み得ることが理解される。
【0124】
例示的実装形態は、本明細書の動作を実行するための装置にも関係してもよい。この装置は、必要とされる目的のために特別に構築されてもよく、又は1若しくは複数のコンピュータプログラムによって選択的に起動又は再構成される1若しくは複数の汎用コンピュータを含んでもよい。そのようなコンピュータプログラムは、コンピュータ可読ストレージ媒体又はコンピュータ可読信号媒体などのコンピュータ可読媒体に保存されてもよい。コンピュータ可読ストレージ媒体は、限定されないが、光ディスク、磁気ディスク、リードオンリーメモリ、ランダムアクセスメモリ、ソリッドステートデバイス及びドライブ、又は電子情報の格納に適した任意の他のタイプの有形若しくは非一時的媒体などの有形媒体が含まれてもよい。コンピュータ可読信号媒体は、搬送波などの媒体を含んでもよい。本明細書に提示されるアルゴリズム及び表示は、本質的に特定のコンピュータ又は他の装置に関連するものではない。コンピュータプログラムは、所望の実装形態の動作を実行する命令を含む純粋なソフトウェア実装形態を含み得る。
【0125】
様々な汎用システムは、本明細書の例によるプログラム及びモジュールと共に使用されてもよく、又は所望の方法ステップを実行するために、より専門化した装置を構築することが便利であると判明する場合がある。さらに、例示的実装形態は、特定のプログラミング言語に関して説明されていない。本明細書に記載する例示的実装形態の技術を実装するために、様々なプログラミング言語を使用してもよいことが理解されるだろう。1又は複数のプログラミング言語の命令は、1又は複数の処理デバイス(例えば中央処理装置(CPU)、プロセッサ、又はコントローラ)によって実行されてもよい。
【0126】
当該技術分野で知られているように、上記の動作は、ハードウェア、ソフトウェア、又はソフトウェア及びハードウェアの何らかの組み合わせによって実行され得る。例示的実装形態の様々な態様は、回路及び論理デバイス(ハードウェア)を使用して実装されてもよく、他の態様は、プロセッサによって実行される場合にプロセッサに本出願の実装形態を実施するための方法を行わせる、機械可読媒体(ソフトウェア)に格納された命令を使用して実装されてもよい。さらに、本出願のいくつかの例示的実装形態は、ハードウェアのみで実行されてもよいが、他の例示的実装形態は、ソフトウェアのみで実行されてもよい。さらに、記載された様々な機能は、単一のユニットで実行され得、又は様々な方法いくつかのコンポーネントに分散されてもよい。ソフトウェアによって実行される場合、方法は、コンピュータ可読媒体に格納された命令に基づいて、汎用コンピュータなどのプロセッサによって実行されてもよい。必要に応じて、命令は、圧縮及び/又は暗号化されたフォーマットで媒体に格納され得る。
【0127】
さらに、本出願の他の実装形態は、本明細書の考察及び本出願の技術の実施から、当業者には明らかとなるであろう。記載した例示的実装形態の様々な態様及び/又はコンポーネントは、単独で又は任意の組み合わせで使用されてもよい。本明細書及び例示的実装形態は、単なる例と見なされることが意図されたものであり、本出願の真の範囲及び精神は、以下の特許項によって示される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
【国際調査報告】