(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-17
(54)【発明の名称】価値関数の最適化および所望のデータの生成のための教師付きVAE
(51)【国際特許分類】
G06N 3/09 20230101AFI20240110BHJP
G06N 3/0464 20230101ALI20240110BHJP
G06N 3/044 20230101ALI20240110BHJP
G06F 18/214 20230101ALI20240110BHJP
G06N 3/0455 20230101ALI20240110BHJP
【FI】
G06N3/09
G06N3/0464
G06N3/044
G06F18/214
G06N3/0455
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023541691
(86)(22)【出願日】2022-01-12
(85)【翻訳文提出日】2023-07-07
(86)【国際出願番号】 CN2022071599
(87)【国際公開番号】W WO2022152166
(87)【国際公開日】2022-07-21
(32)【優先日】2021-01-13
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【氏名又は名称】片岡 忠彦
(74)【復代理人】
【識別番号】100091568
【氏名又は名称】市位 嘉宏
(72)【発明者】
【氏名】ミン、シュー
(72)【発明者】
【氏名】メイ、ジン
(72)【発明者】
【氏名】チャン、ユアン
(72)【発明者】
【氏名】タン、ゼファン
(57)【要約】
モデル学習およびサンプル値生成フレームワークは、元の入力サンプル・データ空間をできる限り正確に再構成するために、符号化、復号、および値予測、ならびに最適化の機能を包括的に統合するためのシステムおよび方法を含む。このシステムは変分オートエンコーダ・モデルを利用して、そのデータ空間のできる限り現実的なサンプルを生成する。このシステムは、元の入力データの代わりに潜在特徴データに基づいてターゲット結果を得るための価値予測関数を学習する。さらに、このシステムは制約なし潜在空間における最適化の課題を解決して、元のサンプル・データ空間における最適化の困難さを回避する。生成される最適サンプルは、現実世界の入力サンプルにできる限り類似したものとなる。システムは柔軟なデータ生成機構を提供し、これはさまざまな種類のターゲット結果の仕様にとって好適である。
【特許請求の範囲】
【請求項1】
ターゲット結果を得るための最適モデル入力データを生成するコンピュータ実施方法であって、前記方法が、
教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、
前記入力データの前記潜在特徴表現を用いて前記入力データを再構成することを学習するためにVAEデコーダ・モデルを受信することと、
前記入力データの前記潜在特徴表現を用いて前記入力データとターゲット結果との関係を学習するために値予測モデルを受信することと、
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングすることと、
トレーニング済の前記値予測モデルを用いて、前記入力データの前記潜在特徴空間表現を最適化することと、
トレーニング済の前記VAEデコーダ・モデルにおいて、前記入力データの前記最適化された潜在特徴空間表現を受信することと、
前記入力データの前記最適化された潜在特徴空間表現に基づいて前記ターゲット結果を得るための前記入力データの最適サンプルを生成するために、前記トレーニング済のVAEデコーダ・モデルを実行することと
を含む、コンピュータ実施方法。
【請求項2】
前記VAEエンコーダ・モデル、前記VAEデコーダ・モデル、および前記値予測モデルが、畳み込みニューラル・ネットワーク(CNN)、再帰型ニューラル・ネットワーク(RNN)、または多層パーセプトロン(MLP)から選択される機械学習済ディープ・ニューラル・ネットワーク・モデルを含む、請求項1に記載のコンピュータ実施方法。
【請求項3】
前記VAEデコーダ・モデルおよび前記値予測モデルを前記同時にトレーニングすることによって、前記VAEデコーダ・モデルのトレーニングに用いるための再構成誤差損失成分と、前記値予測モデルの前記トレーニングに用いるためのラベル予測誤差損失成分とを含む損失関数を最適化する、請求項1に記載のコンピュータ実施方法。
【請求項4】
前記入力データの前記潜在特徴空間表現を前記最適化することが、制約なし潜在空間における最適化の課題を形成することを含む、請求項1に記載のコンピュータ実施方法。
【請求項5】
前記最適化の課題が、最大のターゲット結果値を生成する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための大域的最適化である、請求項1に記載のコンピュータ実施方法。
【請求項6】
前記最適化の課題が、前記ターゲット結果値と一致する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための局所的最適化である、請求項1に記載のコンピュータ実施方法。
【請求項7】
前記最適化の課題が、所与の前記入力データに類似しているがより大きなターゲット結果を有する最適サンプルを見出すための特定の入力データを与えられたときの局所的最適化である、請求項1に記載のコンピュータ実施方法。
【請求項8】
前記最適化の課題が、前記潜在特徴空間表現の確率を最適化するための確率正則化成分を含む、請求項1に記載のコンピュータ実施方法。
【請求項9】
ターゲット結果を得るための最適モデル入力データを生成するコンピュータ・システムであって、前記コンピュータ・システムが、
コンピュータ可読プログラムを記憶するためのメモリ・ストレージ・デバイスと、
前記コンピュータ可読プログラムを実行するように適合された少なくとも1つのプロセッサとを含み、前記コンピュータ可読プログラムが、
教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、
前記入力データの前記潜在特徴表現を用いて前記入力データを再構成することを学習するためにVAEデコーダ・モデルを受信することと、
前記入力データの前記潜在特徴表現を用いて前記入力データとターゲット結果との関係を学習するために値予測モデルを受信することと、
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングすることと、
トレーニング済の前記値予測モデルを用いて、前記入力データの前記潜在特徴空間表現を最適化することと、
トレーニング済の前記VAEデコーダ・モデルにおいて、前記入力データの前記最適化された潜在特徴空間表現を受信することと、
前記入力データの前記最適化された潜在特徴空間表現に基づいて前記ターゲット結果を得るための前記入力データの最適サンプルを生成するために、前記トレーニング済のVAEデコーダ・モデルを実行することと
を行うように前記少なくとも1つのプロセッサを構成するためのものである、コンピュータ・システム。
【請求項10】
前記VAEエンコーダ・モデル、前記VAEデコーダ・モデル、および前記値予測モデルが、畳み込みニューラル・ネットワーク(CNN)、再帰型ニューラル・ネットワーク(RNN)、または多層パーセプトロン(MLP)から選択される機械学習済ディープ・ニューラル・ネットワーク・モデルを含む、請求項9に記載のコンピュータ・システム。
【請求項11】
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングするために、前記少なくとも1つのプロセッサが、前記VAEデコーダ・モデルのトレーニングに用いるための再構成誤差損失成分と、前記値予測モデルの前記トレーニングに用いるためのラベル予測誤差損失成分とを含む損失関数を最適化するようにさらに構成される、請求項9に記載のコンピュータ・システム。
【請求項12】
前記入力データの前記潜在特徴空間表現を前記最適化することが、制約なし潜在空間における最適化の課題を形成することを含む、請求項9に記載のコンピュータ・システム。
【請求項13】
前記最適化の課題が、最大のターゲット結果値を生成する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための大域的最適化である、請求項9に記載のコンピュータ・システム。
【請求項14】
前記最適化の課題が、前記ターゲット結果値と一致する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための局所的最適化か、または所与の前記入力データに類似しているがより大きなターゲット結果を有する最適サンプルを見出すための特定の入力データを与えられたときの局所的最適化から選択されるものである、請求項9に記載のコンピュータ・システム。
【請求項15】
前記最適化の課題が、前記潜在特徴空間表現の確率を最適化するための確率正則化成分を含む、請求項9に記載のコンピュータ実施方法。
【請求項16】
コンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品が、コンピュータ可読プログラムを記憶するコンピュータ可読記憶媒体を含み、前記コンピュータ可読プログラムが、少なくとも1つのプロセッサを含むコンピュータにおいて実行されるときに、前記少なくとも1つのプロセッサに、
教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、
前記入力データの前記潜在特徴表現を用いて前記入力データを再構成することを学習するためにVAEデコーダ・モデルを受信することと、
前記入力データの前記潜在特徴表現を用いて前記入力データとターゲット結果との関係を学習するために値予測モデルを受信することと、
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングすることと、
トレーニング済の前記値予測モデルを用いて、前記入力データの前記潜在特徴空間表現を最適化することと、
トレーニング済の前記VAEデコーダ・モデルにおいて、前記入力データの前記最適化された潜在特徴空間表現を受信することと、
前記入力データの前記最適化された潜在特徴空間表現に基づいて前記ターゲット結果を得るための前記入力データの最適サンプルを生成するために、前記トレーニング済のVAEデコーダ・モデルを実行することと
を行わせる、コンピュータ・プログラム製品。
【請求項17】
前記VAEデコーダおよび値予測モデルを同時にトレーニングするために、前記コンピュータ可読媒体が、前記VAEデコーダ・モデルのトレーニングに用いるための再構成誤差損失成分と、前記値予測モデルの前記トレーニングに用いるためのラベル予測誤差損失成分とを含む損失関数を最適化するように前記少なくとも1つのプロセッサをさらに構成する、請求項16に記載のコンピュータ・プログラム製品。
【請求項18】
前記入力データの前記潜在特徴空間表現を前記最適化することが、制約なし潜在空間における最適化の課題を形成することを含む、請求項16に記載のコンピュータ・プログラム製品。
【請求項19】
前記最適化の課題が、最大のターゲット結果値を生成する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための大域的最適化である、請求項16に記載のコンピュータ・プログラム製品。
【請求項20】
前記最適化の課題が、前記ターゲット結果値と一致する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための局所的最適化か、または所与の前記入力データに類似しているがより大きなターゲット結果を有する最適サンプルを見出すための特定の入力データを与えられたときの局所的最適化から選択されるものである、請求項16に記載のコンピュータ・プログラム製品。
【請求項21】
前記最適化の課題が、前記潜在特徴空間表現の確率を最適化するための確率正則化成分を含む、請求項16に記載のコンピュータ・プログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ターゲット結果を得るための最適なサンプルを生成するという課題を解決し、かつ変分オートエンコーダ(VAE:variational autoencoder)モデルを利用してデータ空間のできる限り現実的なサンプルを生成するために用いられる機械学習済モデルおよび人工知能モデルのアプリケーションに関する。
【背景技術】
【0002】
人工知能(AI:artificial intelligence)アプリケーションにおいて、特定のターゲット結果が得られるように機械学習済モデルをトレーニングするために用いる入力として最適なデータ・サンプルを生成することが、非常に一般的に求められている。たとえば、病院などのヘルスケア・プロバイダは、最高の病院パフォーマンスを達成するために自身のリソースの利用を最適化する必要がある。この場合、最適化する必要があるのはリソース利用「現実世界」の入力サンプル・データであり、ターゲットとする結果は病院パフォーマンスである。別の例として、小学校の教師は、彼/彼女の生徒に100点のモデル作文を見せるために作文を最適化する必要がある。この場合、最適化する必要があるのは現実世界の作文入力データであり、ターゲットとする結果は点数(スコア)である。
【0003】
しかし、こうした所望の入力データ・サンプルを生成するときに、いくつかの課題が存在する。第1に、入力データ・サンプルと出力ターゲットとの関係は事前に定義されず、大きいデータセットから学習される必要がある。言い換えると、第1の課題は、入力データxと出力データyとの関係をモデル化する必要があることである。
【0004】
第2に、入力xの空間はしばしば高次元であり、明確に定義されない。その結果、空間xにおける単純な最適化は実行不可能であり、xに対して明示的な制約を与えることは困難である。
【0005】
第3に、入力xに対応する生成された最適サンプル空間は、できる限り現実世界のサンプルに類似することが要求される。生成されるサンプルは、現実世界のデータとの一貫性を保つために、現実世界のデータと同じ分布からサンプリングされるべきである。
【0006】
既存の関連する方法は、上記の3つの課題すべてを同時に解決できない。
【発明の概要】
【0007】
以下の概要は、単なる例示であることが意図される。この概要は、請求項の範囲を限定することは意図されていない。
【0008】
ある態様によると、本開示は、入力サンプルと出力ターゲットとの関係が事前定義されずに大きいデータセットから学習される必要があるとき、すなわち入力データxと出力データyとの関係をモデル化する必要があるときに、特定のターゲット結果を得るための機械学習済モデルに対する最適データ・サンプルを生成するためのシステムおよび方法を提供する。
【0009】
さらなる態様によると、本開示は、入力データxの空間が高次元であって明確に定義されていないために空間xにおける任意の単純な最適化が実行不可能であり、xに対して明示的な制約を与えることを困難にしているときに、特定のターゲット結果に対する最適サンプルを生成するためのシステムおよび方法を提供する。
【0010】
さらなる態様によると、本開示は、特定のターゲット結果に対する最適サンプルを生成し、生成された最適サンプルx*が現実世界のサンプルとできる限り類似するようにするためのシステムおよび方法を提供し、すなわち、現実世界のデータとの一貫性を保つために、生成されるサンプルは現実世界のデータと同じ分布からサンプリングされるべきである。
【0011】
本発明の態様によると、ターゲット結果を得るための最適モデル入力データを生成するコンピュータ実施方法が提供される。この方法は、教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、入力データの潜在特徴表現を用いて入力データを再構成することを学習するためのVAEデコーダ・モデルを受信することと、入力データの潜在特徴表現を用いて入力データとターゲット結果との関係を学習するための値予測モデルを受信することと、VAEデコーダ・モデルおよび値予測モデルを同時にトレーニングすることと、トレーニング済の値予測モデルを用いて、入力データの潜在特徴空間表現を最適化することと、トレーニング済のVAEデコーダ・モデルにおいて、入力データの最適化された潜在特徴空間表現を受信することと、入力データの最適化された潜在特徴空間表現に基づいてターゲット結果を得るための入力データの最適サンプルを生成するために、トレーニング済のVAEデコーダ・モデルを実行することとを含む。
【0012】
一態様によると、ターゲット結果を得るための最適モデル入力データを生成するためのコンピュータ・システムが提供される。このコンピュータ・システムは、コンピュータ可読プログラムを記憶するためのメモリ・ストレージ・デバイスと、コンピュータ可読プログラムを実行するように適合された少なくとも1つのプロセッサとを含み、このコンピュータ可読プログラムは、教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、入力データの潜在特徴表現を用いて入力データを再構成することを学習するためのVAEデコーダ・モデルを受信することと、入力データの潜在特徴表現を用いて入力データとターゲット結果との関係を学習するための値予測モデルを受信することと、VAEデコーダ・モデルおよび値予測モデルを同時にトレーニングすることと、トレーニング済の値予測モデルを用いて、入力データの潜在特徴空間表現を最適化することと、トレーニング済のVAEデコーダ・モデルにおいて、入力データの最適化された潜在特徴空間表現を受信することと、入力データの最適化された潜在特徴空間表現に基づいてターゲット結果を得るための入力データの最適サンプルを生成するために、トレーニング済のVAEデコーダ・モデルを実行することとを行うように少なくとも1つのプロセッサを構成するためのものである。
【0013】
さらなる態様において、動作を行うためのコンピュータ・プログラム製品が提供される。このコンピュータ・プログラム製品は、処理回路によって可読であり、かつ方法を実行するために処理回路によって実行される命令を記憶する記憶媒体を含む。この方法は上記に挙げられた方法と同じである。
【0014】
前述の態様およびその他の特徴は、添付の図面に関連して行われる以下の記載において説明される。
【図面の簡単な説明】
【0015】
【
図1】本発明の実施形態による、特定のターゲット結果に対する最適サンプルを自動的に生成するための実施形態を実装するために適用可能な例示的コンピュータ・システムを概略的に示す図である。
【
図2】本発明の実施形態による、特定のターゲット結果に対する最適サンプルを生成するための2段階フレームワークをそれぞれ示すシステム・ブロック図である。
【
図3】ある実施形態による、特定のターゲット結果に対する最適サンプルを生成するための2段階フレームワークを実行するためにコンピュータ・システムによって呼び出される方法を示す図である。
【
図4】本発明の実施形態による、リソース利用最適化の課題の例の2段階ネットワーク処理によってもたらされる最適サンプル・データ入力/出力および最適化されたターゲット結果の例を示す表の例を示す図である。
【
図5】本発明の実施形態によるコンピュータまたは処理システムの例を示す概略図である。
【
図6】本発明の実施形態によるクラウド・コンピューティング環境を示す図である。
【
図7】本発明の実施形態による抽象化モデル・レイヤを示す図である。
【発明を実施するための形態】
【0016】
ある実施形態によると、本開示は、ターゲット結果を得るための機械学習済モデルに対する最適サンプルを迅速かつ自動的に生成するためのシステムおよび方法を提供する。最適ターゲット結果(最適価値関数)をもたらすこととなる最適サンプル・データを生成するための課題を解決するために、教師付き変分オートエンコーダ方法が実装される。
【0017】
ある実施形態において、このシステムおよび方法は、学習段階および生成段階の2段階で実装される。学習段階において、教師付き変分オートエンコーダ(VAE)は、(1)入力データxの分布と、(2)入力データxおよびターゲット出力yの関係との両方を同時に学習するようにトレーニングされる。生成段階においては、制約なし最適化の課題が、潜在空間zにおいてオプティマイザを用いて解決され、さまざまな目的に対するさまざまなデータが生成される。システムは、元の入力データの代わりに潜在特徴に基づく価値予測関数を学習する。システムは、さまざまな種類のターゲット結果仕様に適した柔軟なデータ生成機構を提供する。
【0018】
図1に示されるとおり、一実施形態による、最適ターゲット結果をもたらすこととなる最適サンプル・データを生成するための課題を解決する状況において、システムおよび方法を実装するツール100はコンピュータ・システム、コンピュータ・デバイス、モバイル・デバイス、またはサーバである。いくつかの態様において、コンピュータ・デバイス100は、たとえばパーソナル・コンピュータ、ラップトップ、タブレット、スマート・デバイス、スマート・フォン、または任意のその他の類似のコンピュータ・デバイスなどを含んでもよい。
【0019】
コンピュータ・システム100は、1つ以上のハードウェア・プロセッサ152A、152Bと、たとえばオペレーティング・システム、アプリケーション・プログラム・インターフェース(API:application program interfaces)、およびプログラム命令などを記憶するためのメモリ150と、ネットワーク・インターフェース156と、ディスプレイ・デバイス158と、入力デバイス159と、コンピュータ・デバイスに共通する任意のその他の特徴とを含む。いくつかの態様において、コンピュータ・システム100はたとえば、パブリックまたはプライベート通信ネットワーク99を通じてウェブベースまたはクラウドベースのサーバ120を含む1つ以上のウェブサイト125と通信するように構成された任意のコンピュータ・デバイスなどであってもよい。たとえば、ウェブサイトは、特定のドメインに関する入力データを含んでいてもよい。実装例において、こうしたデータは、いかにして病院の労働費を最小化するかという課題を解決するために使用され得る病院リソース利用データを含んでもよい。こうしたデータは、電子的形態でデータベース130に記憶されてもよい。
【0020】
さらに、システム100の一部として示されるとおり、取り付けられたメモリ・ストレージ・デバイス160を含み得るデータ処理フレームワークのために有用なローカル・メモリか、またはたとえばシステム100への入力のためのリモート・ネットワーク接続を介してアクセス可能なデータベースなどのリモート・メモリ・ストレージ・デバイスが提供される。
【0021】
図1に示される実施形態において、プロセッサ152A、152Bは、たとえばマイクロコントローラ、フィールド・プログラマブル・ゲート・アレイ(FPGA:Field Programmable Gate Array)、またはさまざまな動作を行うように構成された任意のその他のプロセッサなどを含んでもよい。加えて示されているのは、システム100のさまざまなコンポーネントの間で信号を転送するための、たとえばデータ・バス・ラインなどの有線接続、アドレス・バス・ライン、入力/出力(I/O:Input/Output)データ・ライン、ビデオ・バス、拡張バスなどの通信チャネル140である。プロセッサ152A、152Bは、以下に記載される方法命令を実行するように構成される。これらの命令は、たとえばプログラムされたモジュールなどとして、さらなる関連メモリ・ストレージ・デバイス150に記憶されてもよい。
【0022】
メモリ150は、たとえばランダム・アクセス・メモリ(RAM:random access memory)もしくはキャッシュ・メモリまたはその両方、あるいはその他のものなどの、揮発性メモリの形態の非一時的なコンピュータ可読媒体などを含んでもよい。メモリ150は、たとえばその他の取り外し可能/取り外し不可能な、揮発性/不揮発性記憶媒体などを含んでもよい。単なる非限定的な例として、メモリ150は、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、リード・オンリ・メモリ(ROM:read-only memory)、消去可能プログラマブル・リード・オンリ・メモリ(erasable programmable read-only memory)(EPROMまたはフラッシュ・メモリ)、ポータブル・コンパクト・ディスク・リード・オンリ・メモリ(CD-ROM:compact disc read-only memory)、光ストレージ・デバイス、磁気ストレージ・デバイス、または前述の任意の好適な組み合わせを含んでもよい。
【0023】
ネットワーク・インターフェース156は、たとえば有線またはワイヤレス接続などを介して、ウェブサイト・サーバ120へのデータまたは情報の送信およびそこからの受信を行うように構成される。たとえば、ネットワーク・インターフェース156はたとえばBluetooth(R)、WIFI(例、802.11a/b/g/n)、セルラ・ネットワーク(例、CDMA、GSM、M2M、および3G/4G/4G LTE、5G)、近距離通信システム、衛星通信、ローカル・エリア・ネットワーク(LAN:local area network)を介するもの、広域ネットワーク(WAN:wide area network)を介するもの、またはコンピュータ・デバイス100がサーバ120に情報を送信するか、もしくはそこから情報を受信することを可能にする任意のその他の通信形態などのワイヤレス技術および通信プロトコルを使用してもよい。
【0024】
ディスプレイ158は、たとえばコンピュータ・モニタ、テレビ、スマート・テレビ、たとえばラップトップなどのパーソナル・コンピュータ・デバイスに統合されたディスプレイ・スクリーン、スマート・フォン、スマート・ウォッチ、仮想現実ヘッドセット、スマート・ウェアラブル・デバイス、またはユーザに情報を表示するための任意のその他の機構などを含んでもよい。いくつかの態様において、ディスプレイ158は液晶ディスプレイ(LCD:liquid crystal display)、an eペーパー/eインク・ディスプレイ、有機LED(OLED:organic LED)ディスプレイ、またはその他の類似のディスプレイ技術を含んでもよい。いくつかの態様において、ディスプレイ158はタッチ・センサであってもよく、入力デバイスとしても機能してもよい。
【0025】
入力デバイス159は、たとえばキーボード、マウス、タッチ・センサ・ディスプレイ、キーパッド、マイクロホン、またはその他の類似の入力デバイス、またはユーザにコンピュータ・デバイス100と対話する機能を提供するために単独または一緒に使用され得る任意のその他の入力デバイスなどを含んでもよい。ある実施形態において、ユーザはユーザ・インターフェースを通じて、解決されるべき課題に対して意図される特定のターゲット結果を入力できる。たとえば、病院リソース利用に関する課題を解決する状況において、ユーザはたとえばいかにして病院の労働費を最小化するかなどのターゲット結果yを指定してもよい。
【0026】
ターゲット出力を生成するためのモデルを構築するための最適サンプル(潜在)空間を生成するためにデータを分析および処理するようにコンピュータ・システムを構成することに関して、ローカルまたはリモート・メモリ160は、たとえば病院リソース利用データか、またはたとえばウェブ・サーバ(単数または複数)などのリモート位置から得られたその他のデータなどの、特定のドメインにおいて解決されるべき課題に関するデータまたは情報162を一時的に記憶するように構成されてもよい。
【0027】
これらのデータはデータベースとして記憶され、たとえばヘルスケア、教育などの特定のドメインにおける目下の課題を解決するために使用される最適サンプル空間の生成に使用するために処理される。
【0028】
取り込まれたデータ162は、電子データベース130またはその他のデータ・ソース(図示せず)に記憶された情報から取り出されたデータであり得る。代替的に、このデータは、コンピュータ・システム100に取り付けられた別個のローカル・メモリ・ストレージ・デバイスに記憶されてもよい。
【0029】
図1に示されるとおり、コンピュータ・システム100のメモリ150はさらに、VAE技術を用いて課題を解決するために使用される最適潜在サンプル空間を提供するようにコンピュータ・システムを構成するように適合されたプロセッサ(単数または複数)によって実行されるプログラム命令を含む処理モジュールを記憶する。
【0030】
一実施形態において、関連するメモリ150に記憶されるプログラム処理モジュールの1つはデータ摂取モジュール165を含み、データ摂取モジュール165は、(例、構造化または非構造化)データのアクセス/受信を行って、それらのデータを本発明の実施形態に従ってデータを処理する他のモジュールによる使用のための入力データxの形態にするように回路を動作させる命令およびロジックを提供する。
【0031】
ある実施形態において、VAEエンコーダ・モジュール170は、解決されるべき課題に関する入力データ内容を受信するように回路を動作させるための命令およびロジックを提供する。このデータは、解決されるべき予測の課題に用いられる情報のn次元ベクトルであってもよい。VAEエンコーダは、入力の潜在属性を確率論的方式(分布)で符号化することによって、潜在サンプル空間を生成する。エンコーダ(E:encoder)は、入力データxの分布を取り込んで、入力xを解きほぐされた潜在空間zに符号化する。
【0032】
ある実施形態において、VAEエンコーダ・モジュール170は、解決される課題のタイプに依存する入力データxの符号化を行い得る畳み込みニューラル・ネットワーク(CNN:Convolution Neural Network)、再帰型ニューラル・ネットワーク(RNN:Recurrent Neural Network)、または多層パーセプトロン(MLP:Multilayer Perceptron)モデル・パイプライン、ならびにその可能な組み合わせおよび変形175を含むがそれに限定されない、ディープ・ニューラル・ネットワーク(DNN:deep neural network)モデル・パイプライン・アーキテクチャに従ってモデル化された符号化関数を実行できる。
【0033】
システム100の関連メモリ150に記憶される別のプログラム処理モジュールは、データxを入力潜在サンプル空間zに基づいて最適な程度の誤差以内で再構成するためのデコーダ関数を提供する回路を動作させるためのロジックおよび命令を使用するVAEデコーダ・モジュール180を含む。ある実施形態において、デコーダ(D:decoder)モジュール180は、解決される課題のタイプに依存する入力潜在サンプル空間データzの復号を行い得るCNN、RNN、またはMLPモデル・パイプライン、ならびにその可能な組み合わせおよび変形を含むがそれに限定されないディープ・ニューラル・ネットワーク・モデル・アーキテクチャ185に従ってモデル化された復号関数を実行できる。
【0034】
関連コンピュータ・メモリ150に記憶される別の処理モジュールは、指定される精度以内でターゲット結果を予測するために関数(V)を実行するように回路を動作させるためのロジックおよび命令を使用する値予測モジュール190を含む。ある実施形態において、値予測モジュール190は、潜在特徴空間zに基づいてできる限り正確にターゲット結果の値を予測するように構成されたCNN、RNN、またはMLPモデル・パイプライン、ならびにその可能な組み合わせおよび変形を含むがそれに限定されないディープ・ニューラル・ネットワーク・モデル・アーキテクチャも実行する。
【0035】
関連コンピュータ・メモリ150に記憶される別の処理モジュールは、特定の最適化の課題を解決するための回路を動作させるためのロジックおよび命令を使用するオプティマイザ・モジュール195を含む。オプティマイザは、解決される予測の課題において指定されるターゲット結果に対する最良の結果を得るために使用される最適化された潜在サンプル空間z*を生成するために、制約なし最適化の課題を解決するための最適化アルゴリズム(O:optimization algorithm)を実行する。最適化アルゴリズムは、たとえば確率的勾配降下法(SGD:Stochastic Gradient Descent)などの、任意の一般的なアルゴリズムであり得る。いくつかのタイプの最適化を行うことができ、それらの唯一の相違点は最適化ターゲット定式化である。
【0036】
図1にさらに示されるとおり、メモリ150は、各々のプログラム・モジュールを呼び出して、解決される予測の課題において指定されるターゲット結果に対する最良の結果を得るため、すなわち最適ターゲット結果を有する最適サンプルを生成するために使用される潜在サンプル空間z
*を最適化する教師付きVAEの学習および生成段階に対する動作を呼び出すようにコンピュータ・システム100を構成するための命令を有する監視プログラム110を含む。この監視プログラムは、最適潜在サンプル空間z
*を復号することによって得られるデータ値x
*、すなわちx
*=D(z
*)として表される最適ターゲット結果値を生成するようにコンピュータ・システムを構成する。
【0037】
図2は、第1の段階で教師付きVAEを使用し、第2の段階でオプティマイザ(O:optimizer)を使用した入力データxの処理の結果として潜在変数空間zにおける最適化された潜在変数z
*を生成するための2段階フレームワーク200を実装するシステムを示す。
【0038】
第1の学習段階205において、解決されるべき特定の課題に関する属性を含む1つ以上のベクトルの形態の入力データx210が、教師付きVAEのエンコーダ・モデル(E)170に入力される。この入力属性データ・ベクトルxに基づいて、エンコーダDNNモデル(E)は入力データxの分布を取り込み、かつ入力xを解きほぐされた潜在変数空間zに符号化する、すなわちE(x)→zとすることによってトレーニングされる。エンコーダはサンプル・データxを入力として受け取り、次いで潜在空間220における特徴表現z=E(x)を生成する。入力データ・タイプxに依存して、エンコーダ関数(E)の実施形態はCNN、RNN、またはMLPであり得る。符号化の利点は、複雑な高次元空間における入力を、解きほぐされた低次元潜在空間220に変換することである。
【0039】
続いて
図2に示されるとおり、デコーダ・モデル185は入力としてサンプル潜在空間z220を受信し、それを復号してサンプルxを再構成し、すなわちD(z)→xとして、損失関数によって定められた何らかの予め定められた損失または誤差の尺度以内となるようにする。入力データ・タイプxに依存して、デコーダ関数(D)の実施形態はCNN、RNN、またはMLPであり得る。デコーダ・モデル処理の結果として、この方法は教師なし再構成誤差損失|D(E(x))-x|を生成する。
【0040】
同時に、値予測モデル(V:value predictor model)190は入力として同じサンプル潜在空間z220を受信して、できる限り正確に、または予め定められた損失もしくは誤差尺度以内となるように、ターゲット結果y230の値を予測する。よってこの方法は、潜在変数空間z220を用いて入力データxの分布を学習することに加えて、損失関数によって決定される何らかの予め定められた損失または誤差尺度以内となるような入力データxとターゲット結果出力yとの関係、すなわちx→z→(x,y)も学習する。入力データ・タイプxに依存して、値予測関数(V)の実施形態は、ターゲット結果と入力データとの関係をモデル化するように設計されたCNN、RNN、またはMLPであり得る。しかし、これはxからyへの直接の関数ではない。この関数はxからzへ、次いでyへの2ステップ関数である。この部分は、VAEのトレーニングのための教師付き予測誤差損失|V(E(x))-y|を生成する。これらの動作が与えられるとき、この方法は、ターゲット結果に対する下流の最適サンプル生成を行い得る。
【0041】
サンプル潜在空間が与えられて結果を予測する方式でVAEモデルをトレーニングする際に、最小化されるべき損失は、以下の方程式1)によって代替的に示される。
【0042】
【0043】
ここで||D(E(xi))-xi||は入力データxを再作成するときの再構成損失を表す損失成分であり、||yi-V(E(xi))||はラベル予測損失を表す損失成分である。
【0044】
より具体的には、第1の学習段階205において、教師付きVAEの損失関数は次の3つの部分からなる。1)再構成損失、すなわちE(logP(x|z))。この部分は、連続する特徴および個別の特徴に対する2つの部分にさらに分けられ得る。2)事前損失、すなわちD_KL(Q(z|x)|P(z))。この部分は、後のz|xと前のp(z)との間のKL発散距離を算出する。および、3)予測損失、すなわちE(logV(y|z))。一実施形態において、この部分は、y|zと真のyとの間の平方誤差を算出する教師付き損失である。これらの損失関数は、特定の適用に従ってカスタマイズされ得る。すなわち、この方法はこうした広範囲の類似のタスクに対する効率的な解決策であり、異なるタスクは異なる損失関数を有してもよい。
【0045】
第1の段階において教師付きVAEを用いた入力データxの処理の結果として潜在変数空間zにおける最適化された潜在変数z
*を生成するための、2段階フレームワーク200を実装するシステムを示す
図2にさらに示されるとおり、第2の学習段階250は、潜在変数空間zにおける制約なし最適化の課題を解決するための最適化技術を実行して、異なる目的に対するさまざまなデータ生成のやり方を提供する。
【0046】
ある実施形態において、学習段階205が終了した後に、生成段階250において、システムは最適化モジュール195を実行して、特定のターゲット結果に対する最適潜在空間変数z*260を見出すために用いられるオプティマイザを実行する。
【0047】
解決される最適化の課題の特定のタイプに依存して、異なるタイプのオプティマイザが用いられる。オプティマイザ間の唯一の相違点は、最適化ターゲット定式化のみである。最適化アルゴリズムは、たとえば確率的勾配降下法(SGD)、Adam、AdaGradなどの、任意の一般的なアルゴリズムであり得る。
【0048】
ある実施形態において、第1のタイプのオプティマイザ(O1)は、以下によって定義される大域的最適化を解決する。
z*=arg maxzV(z)
【0049】
ここでV(z)は値予測モデルである。オプティマイザ(O1)を用いるタスクは、最大のターゲット結果値を生成する最良のサンプルを見出すための制約なし最適化である。
【0050】
さらなる実施形態において、第2のオプティマイザ(O2)は、以下によって定義される特定の入力データxを与えられたときの局所的最適化を解決する。
zx
*=arg maxzV(z)-γ||D(z)-x||
【0051】
ここでV(z)は値予測関数であり、D(z)は対応する潜在空間変数zに適用されるデコーダ関数であり、xは特定の入力データ値であり、γは正則化項||D(z)-x||の影響を制御するための係数である。たとえば、正則化項の影響を制御するためのγ係数は0.1、または0.5、または他の値であり得る。オプティマイザ(O2)を用いる制約なし最適化の課題のタスクは、所与の入力xにより類似しているがより大きなターゲット結果を有する最適サンプルを生成することである。
【0052】
さらなる実施形態において、第3のタイプのオプティマイザ(O3)は、以下によって定義されるターゲット結果値yを与えられたときの局所的最適化を解決する。
zy
*=arg minz||V(z)-y||
【0053】
ここでV(z)は値予測関数であり、yは予測された結果値である。オプティマイザ(O3)を用いるタスクは、ターゲット結果値yと一致する最適サンプルを生成するための制約なし最適化の課題である。
【0054】
任意のオプティマイザ(O1)~(O3)を用いて最適化の課題を解決した結果として、各潜在空間変数zに対して、対応する最適化された潜在変数空間z*が生成される。
【0055】
図2の続きにおいて、最適化された潜在空間変数z
*は教師付きVAEデコーダ185に入力されて、最適化された入力データ変数x
*が生成され、すなわちD(z
*)→x
*となり、ここでx
*は最終の生成された出力サンプルである。たとえば、解決されるべき予測の課題に対して変数xを含む入力ベクトルが与えられるとき、第1および第2の段階の実行後に、最適化された入力変数x
*に対応するベクトルが生成され、すなわち最適化されたターゲット結果yをもたらすように算出される。
【0056】
すなわち、最適化された潜在空間入力変数z*をその後に値予測関数V(z*)に入力することによって、予測関数は最適な(最良の)ターゲット出力値yを生成することとなる。
【0057】
図3は、
図2の2段階フレームワーク200において実装される方法を示す。第1のステップ302において、データ摂取モジュールは、解決されるべき課題に関する入力データを受信して、その入力データをVAEエンコーダ・モジュール170によって使用される形態にするための任意のデータ・フォーマット化を行う。解決されるべき非限定的な課題の例はヘルスケア・ドメインにあり、具体的には、たとえばユーザ指定のターゲット結果データyである患者当たりの労働費コストを最小化するような方式でリソース利用データxを最適化することに関する課題である。入力データは、たとえば100の病院などのいくつかの病院からのデータを含み得る。各病院は、入力データxおよびyの入力対を提供する。
【0058】
たとえば、
図4に示されるとおり、たとえば病院などのヘルスケア・プロバイダを考えるとき、病院はたとえばベッド数、看護師の数、または何らかのその他のリソースなどの自身のリソースをいくらか利用する。それらのリソースの構成が異なると、異なる病院パフォーマンスがもたらされるだろう。よって解決されるべき課題は、病院が最良のパフォーマンスを得られるようにそれらのリソースの利用をいかに最適化するかということになるだろう。
【0059】
よってある実施形態において、本発明のシステム100のタスクは、病院の労働費を最小化する最良の病院リソース利用を伴う最適サンプル空間を生成することである。
【0060】
図4は、病院の経費に寄与する関連リソース利用属性データ402(すなわち、xは現実世界のデータである)を含む各病院からのデータ入力を示す表400を示す。この例において、システムが入力として受信するのは、たとえば100の病院などのいくつかの病院における病院リソース使用に関するデータである。ある実施形態において、各病院に対する現実世界の入力データ402は20次元のデータ・ベクトルであり、各次元は、
図4の表に示されるそれぞれの行401として示される病院リソース利用属性に対応する。各病院からのこうしたデータ402は文字タイプ・データ405を含んでもよく、これはたとえば、病院が80%以上のフル・タイムの立場の職員を有するかどうか、患者がケース・マネージャを有するかどうか、病院がティーチング・ホスピタルであるかどうか、または担当看護師が50%以上の時間にわたり臨床患者ケアを提供するかなどを示す値「1」または「0」を有するバイナリ・データなどである。各病院からのこうしたデータ402は数値タイプ・データ408を含んでもよく、これはたとえば、勤務時間のパーセンテージとしての残業時間の数値、平均賃金指数(average wage index)、病院ケース混合指数値、ベッド・キャパシティ、等価平均入院期間値、等価患者日当たりの支払い時間に関する値、または等価患者日当たりの労働費などである。病院リソース利用属性の1つが行410に示されており、これは最適化(最小化)されることが意図されるターゲット結果値420、すなわち等価患者日当たりの労働費に対応する。
【0061】
ある実施形態において、各々の入力データ属性値402に対して、各病院からの入力データに基づいて、対応するたとえば中央値411および平均値413などの統計値が計算される。たとえば、100病院の各々の現実世界の入力データ・ベクトルから、「ベッド・キャパシティ」属性415の中央値が24であることが決定されてもよい。各病院からのデータは、たとえば
図4の病院リソース利用の例において示される20次元ベクトルなどのm次元ベクトルとして入力されてもよい。学習段階の間に、システムは入力データxの分布を学習する。
【0062】
図3に戻ると、ステップ302において、ユーザはさらに、解決されるべき課題に対するターゲット結果yを指定する。学習段階の間に、システムは入力データxとyとの関係を学習する。
図4の例において、課題例のターゲット結果は、行410における属性を最適化すること、たとえば病院の労働費を最小化することである。よって、病院リソース利用の例における
図3の方法は、病院労働費(すなわち、値予測関数V(z
*)によって生成されるy
*)を最小化する最適サンプルx
*を決定するという課題を解決するためのものである。
【0063】
図3の304に進むと、たとえば各病院からの20次元データ・ベクトルなどの受信された入力データに対してVAEエンコーダ・モジュール170関数(E)を実行して、307において潜在サンプル空間変数の潜在サンプル空間zを生成するための動作が行われる。タスクおよび入力データ・タイプに依存して、エンコーダ・モデル関数E()(および同様にD()および予測V()関数)はMLP、CNN、またはRNNのいずれか1つであり得る。たとえば、病院リソース利用の例における20次元データ・ベクトルなどの入力データの構造タイプは、MLPモデル・タイプ・エンコーダ/デコーダを用いて処理される。
【0064】
代替的に、画像タイプの入力データはCNNモデル・タイプ・エンコーダ/デコーダを使用することとなり、ここで入力データxは写真の画素データであり、ターゲット結果yは写真のスコア(例、美しさ)であり得る。
【0065】
代替的に、時系列または連続的な入力データはRNNモデル・タイプ・エンコーダ/デコーダを使用することとなる。たとえば、教育ドメインの使用ケースの例において、小学校の教師は、彼/彼女の生徒に100点のモデル作文を見せるために作文を最適化する必要がある。こうした使用ケースにおいて、作文は最適化する必要があるものであり、作文スコアはターゲット結果(100点(スコア)の作文)である。多くの作文データを取り込み、作文とスコアとの関係を考慮すると、100点のスコアを与える最適作文を生成できる。入力x*は100点の作文スコアを生じる作文となるだろう。この入力データxは連続する単語であり、連続的なデータを構成するため、構造タイプのデータとは異なるだろう。
【0066】
ある実施形態において、こうしたエンコーダは、入力サンプルxの次元を低減させることとなる。たとえば、MLPモデル・タイプ・エンコーダ関数を用いると、エンコーダ処理の出力は[20x5]に従って入力次元を変換し、すなわち病院の例における20次元データ・ベクトルを5次元ベクトル出力に低減させる。教師付きトレーニングを用いて、損失関数を最小化して初期パラメータを調整することで入力xデータをより良好に再構成し、かつターゲット結果値yをより良好に予測することによって誘導されるとおりに反復を行った後に、最適エンコーダ/デコーダ・モデルが学習される。
【0067】
よって、310で、並行動作において、潜在サンプル空間属性zがVAEデコーダ・モジュール関数(D)に入力され、これは316において出力再構成入力サンプルxを得るために実行される。310において、潜在サンプル空間属性zは同時に値予測モデル(V)に入力され、これは316において出力予測値yを得るために実行される。デコーダ・モデルは[5x20]関数を実装して、出力次元が元の入力データxに対応することを確実にできる。損失関数の最適化(例、最小化)によって、エンコーダ/デコーダ・モデルのパラメータが調整される。所与の例において、値予測モデル(V)は[5x1]関数を実装して、出力次元が所望のターゲット結果yに対応することを確実にできる。
【0068】
図3の316において、デコーダ・モデルおよび予測モデルに対するそれぞれの損失関数を用いて、それぞれの誤差値が生成され、それらは次いで318において評価される。ある実施形態において、教師付きVAEの損失関数はE(logP(x|z))であり、ここでE()は条件付き確率P(x|z)の対数の期待値であり、オートエンコーダはxを入力xにより近くなるように再構成するため、この条件付き確率はすなわち、潜在変数zを与えられたときのx
iの条件付き確率である。P()関数は、たとえばガウス分布などの任意の特定的な確率分布関数を用いて定義される。ガウス分布が用いられるとき、この損失式は、方程式1)による各データ属性iに対する入力データxを再作成するために最小化されるべき再構成損失関数||D(E(x
i))-x
i||に変換される。ある実施形態において、この再構成損失は、連続する特徴および個別の特徴に対する2つの部分に分けられ得る。
【0069】
D_KL(Q(z|x)|P(z))による2つの確率分布(QおよびP)の相違を最小化するためのさらなる事前損失が計算される。すなわち、後のz|xと前のp(z)との間の距離を測定するためのKL発散損失関数が計算され、ここでQ(z|x)は入力データxが与えられたときの潜在変数zの条件付き分布であり、これはデコーダ・ネットワークに対応し、P(z)は、たとえば標準ガウス分布などの単一分布に従うものとして取られた潜在変数zの事前分布である。入力データxのオートエンコーダ過剰適合を避けるために、この事前損失項は最小化される。
【0070】
ある実施形態において、E(logV(y|z))に従って各データ属性iに対するラベル予測損失が計算され、ここでV()は確率分布関数であり、V(y|z)はzが与えられたときのyの確率を示す。この損失項は、y|zと真のyとの間の平方誤差を算出する教師付き損失である。logV(y|z)の期待値、すなわちE(logV(y|z))を最大化することが望まれる。V()に特定の分布を導入することによって、方程式1)の予測損失||y-V(z)||または||y-V(E(x))||項が得られる。
【0071】
図3の318において、再構成損失および予測ラベル損失が最小化されていないことが決定されるとき、プロセスは
図3の320に続くことによってE()、D()、またはV()モデル・パラメータを調整し、かつ
図3の304に戻って再びVAEエンコーダ・モデル、デコーダ・モデル、および予測モデルを実行してそれぞれの潜在空間変数z、再構成入力サンプルx、およびターゲット予測値yを得ることによって繰り返される。誤差損失が過剰適合なしに最小化されるまで、ステップ304~318が繰り返される。
【0072】
318において誤差損失が指定された精度以内に最小化されたとき、プロセスは322に続くことによって、サンプルz
*が自然に現実世界のサンプルに類似するように、たとえばSGD、Adam、AdaGradなどの最適化アルゴリズムを用いてオートエンコーダが生成したターゲット結果に対する結果的な潜在サンプル空間サンプルz
*を最適化するために、オプティマイザ・モジュール190を使用する。特に322において、その最大値または最小値が見出されるべき最適化目的が定式化される。この最適化目的定式化は、課題特有のものである。
図4に示される例示的な病院リソース利用の例に対して、最適化目的は予測関数V(z)として表される労働費属性420であり、最適化の課題は第1のオプティマイザ・タイプによってminV(z)として定義され、すなわち病院労働費属性を最小化することである。この例において、最適潜在空間変数zはz
*=arg minV(z)と示される。特定の課題に依存して、期待ターゲット結果に対する最適化目的は、次のような他のタイプのオプティマイザを用いて定式化されてもよい。z
*=arg max
zV(z)もしくはz
x
*=arg max
zV(z)-γ||D(z)-x||、または特定のターゲット結果yが提供されているときは、z
y
*=arg min
z||V(z)-y||。
【0073】
図4の病院リソース利用の例において、期待ターゲット結果yは病院労働費420であり、これはzに従って最小化されるべき変数である。すなわち、最適化変数は潜在変数空間である。よって、最適化目的の第1の部分は変数yに関するものであり、3つのタイプの目的関数のうちの1つ、たとえばz
*=arg minV(z)などを用いて解決される。
【0074】
ある実施形態において、
図3の最適潜在サンプル生成段階322に対して、最適化目的は以下の方程式2)によって定式化される。
min
zV(z)-logP(z) (2)
【0075】
ここで第1の部分1)は3つのオプティマイザ・タイプのうちの1つを実装する期待ターゲット結果であり、第2の部分2)は確率正則化項、すなわち潜在特徴z*の確率である。この第2の正則化項は高確率の結果z*を確実にし、かつ復号サンプルの存在を確実にする。そうでない場合は、極端なz*が非現実的なサンプルx*をもたらすだろう。変数zを正則化することによって、結果z*の確率が過度に小さくならないことが確実にされる。
【0076】
最後に
図3の325において、この方法はz
*を用いて最終最適サンプルx
*を生成して、ターゲット結果y
*を得る。すなわち、デコーダ・モジュール180は、ターゲット結果を得るための最終最適サンプルx
*を生成するために、最適化された潜在サンプル空間z
*を用いてVAEデコーダ・モデルを実行する。すなわちこのステップにおいて、x
*を得るために、学習段階から得られるデコーダ関数D()は次のとおりに実行される。
【0077】
x*=D(z*)=D(arg minV(z))
【0078】
ターゲット結果y*は、学習段階から得られる値予測関数V()を用いて次の計算をすることによって得られる。
y*=V(E(x*))=V(z*))
【0079】
図4に戻ると、病院リソース利用の例400に対して、最適化されたターゲット結果y
*420は病院の労働費の最小化であり、その値は95.33である。すなわち、最適リソース利用データx
*を得た後に、このベクトルを用いて、100の病院において労働費を減少させてコストを減少させるための変更を誘導する。非正規化データ列425における値のベクトルは、このターゲット結果を達成するであろう最適サンプルx
*である。
【0080】
図4の表の例400に示されるとおり、最適潜在サンプル空間z
*を構築するための本明細書の方法を実行した結果として、値予測モデルは、正規化最適結果データx
*423および対応する非正規化最適結果データx
*425を用いて、最適化されたターゲット結果出力y
*を得るだろう。正規化結果データx
*423は、入力データの平均値からのx
*の偏差、たとえば平均値より大きいこと(正の値)または小さいこと(負の値)などを表す。非正規化最適結果データx
*425は、病院の労働費を最小化するというターゲット結果を達成するための各属性(行)に対する最良の利用値を表す。よって、特定の病院に対する、元の入力データ・ベクトルxに基づいて病院の労働費の最小化をもたらし得る列425に示されるリソース利用の最良の構成が、100の病院すべてに対して、その病院における労働費またはコストを最小化するというターゲット結果に基づいて与えられる。
図4に示される例400に基づいて、100の病院すべてに対する等価患者日当たりのターゲット属性労働費420に対する平均値は$564.9である。ある病院に対する等価患者日当たりの労働費420を最小化する最適値は$95である。ある病院においてこの最適非正規化値x
*を達成するための最良のリソース利用は、列425に示されるとおりの病院リソースの構成となるだろう。たとえば、例示的な病院リソース利用の例を用いると、x
*ベクトルは、労働費を減少させるという所望の結果の達成において、ベッド・キャパシティ属性415を平均値24から新たな値32に増加させるためのガイダンスを提供する。
【0081】
本明細書の実施形態による学習および生成フレームワーク100は、符号化、復号、予測、および最適化を含む4つのモジュールを包括的に統合するシステムであり、かつ教師付きVAEモデルを利用してできる限り現実的なサンプルを生成する。システム100は、元の入力データの代わりに潜在特徴に基づく価値予測関数を学習し、これはよりロバストである。さらに、このシステムは制約なし潜在空間における最適化の課題を解決し、元の空間xにおける最適化の困難さを回避する。システム100は柔軟なデータ生成機構を提供し、これはさまざまな種類のターゲット結果仕様にとって好適である。
【0082】
図5は、本発明によるコンピュータ・システムの例を示す。示されるコンピュータ・システムは好適な処理システムの単なる一例であり、本発明の実施形態の使用または機能の範囲に関するいかなる限定を示唆することも意図されていないことが理解されるべきである。たとえば、示されるシステムは、多数の他の汎用目的または特定目的のコンピュータ・システム環境または構成と共に動作してもよい。
図5に示されるシステムと共に使用するために好適であり得る周知のコンピュータ・システム、環境、もしくは構成、またはその組み合わせの例は、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、ハンドヘルドまたはラップトップ・デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラマブル家電機器、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、および上記のシステムまたはデバイスのいずれかを含む分散型クラウド・コンピューティング環境などを含んでもよいが、それに限定されない。
【0083】
いくつかの実施形態において、コンピュータ・システムは、そのコンピュータ・システムによって実行される、メモリ16に記憶されたプログラム・モジュールとして具現化されるコンピュータ・システム実行可能命令の一般的な文脈で記載されてもよい。一般的に、プログラム・モジュールは、本発明に従って特定のタスクを実行するか、あるいは特定の入力データもしくはデータ・タイプまたはその両方を実装するか、あるいはその両方である(例、
図3を参照)、ルーチン、プログラム、オブジェクト、コンポーネント、ロジック、およびデータ構造などを含んでもよい。
【0084】
コンピュータ・システムのコンポーネントは、1つ以上のプロセッサまたは処理ユニット12、メモリ16、およびメモリ16を含むさまざまなシステム・コンポーネントをプロセッサ12に動作可能に結合するバス14を含んでもよいが、それに限定されない。いくつかの実施形態において、プロセッサ12は、メモリ16からロードされた1つ以上のモジュール11を実行してもよく、このプログラム・モジュール(単数または複数)は、本発明の1つ以上の方法実施形態をプロセッサに実行させるソフトウェア(プログラム命令)を具現化する。いくつかの実施形態において、モジュール11は、メモリ16、ストレージ・デバイス18、ネットワーク24、および/またはその組み合わせからロードされて、プロセッサ12の集積回路にプログラミングされてもよい。
【0085】
バス14は、メモリ・バスまたはメモリ・コントローラ、ペリフェラル・バス、アクセラレーテッド・グラフィクス・ポート、およびさまざまなバス・アーキテクチャのいずれかを用いるプロセッサまたはローカル・バスを含むいくつかのタイプのバス構造のいずれか1つ以上を表してもよい。限定ではなく例として、こうしたアーキテクチャは、インダストリ・スタンダード・アーキテクチャ(ISA:Industry Standard Architecture)バス、マイクロ・チャネル・アーキテクチャ(MCA:Micro Channel Architecture)バス、拡張ISA(EISA:Enhanced ISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(VESA:Video Electronics Standards Association)ローカル・バス、およびペリフェラル・コンポーネント・インターコネクト(PCI:Peripheral Component Interconnects)バスを含む。
【0086】
コンピュータ・システムは、さまざまなコンピュータ・システム可読媒体を含んでもよい。こうした媒体は、コンピュータ・システムによるアクセスが可能な任意の利用可能な媒体であってもよく、それは揮発性および不揮発性媒体、取り外し可能および取り外し不可能媒体の両方を含んでもよい。
【0087】
メモリ16(システム・メモリと呼ばれることもある)は、たとえばランダム・アクセス・メモリ(RAM)、キャッシュ・メモリ、もしくはその他の形態、またはその組み合わせなどの、揮発性メモリの形態のコンピュータ可読媒体を含み得る。コンピュータ・システムは、その他の取り外し可能/取り外し不可能な揮発性/不揮発性コンピュータ・システム記憶媒体をさらに含んでもよい。単なる例として、ストレージ・システム18は、取り外し不可能な不揮発性磁気媒体(例、「ハード・ドライブ」)からの読取りおよびそこへの書込みのために提供され得る。示されていないが、取り外し可能な不揮発性磁気ディスク(例、「フレキシブル・ディスク」)からの読取りおよびそこへの書込みのための磁気ディスク・ドライブ、ならびにたとえばCD-ROM、DVD-ROM、またはその他の光媒体などの取り外し可能な不揮発性光ディスクからの読取りまたはそこへの書込みのための光ディスク・ドライブが提供され得る。こうした場合に、各々は1つ以上のデータ媒体インターフェースによってバス14に接続され得る。
【0088】
加えてコンピュータ・システムは、たとえばキーボード、ポインティング・デバイス、ディスプレイ28などの1つ以上の外部デバイス26;ユーザがコンピュータ・システムと対話することを可能にする1つ以上のデバイス;もしくはコンピュータ・システムが1つ以上の他のコンピュータ・デバイスと通信することを可能にする任意のデバイス(例、ネットワーク・カード、モデムなど)、またはその組み合わせと通信してもよい。こうした通信は、入力/出力(I/O)インターフェース20を介して起こり得る。
【0089】
さらに、コンピュータ・システムはネットワーク・アダプタ22を介して、たとえばローカル・エリア・ネットワーク(LAN)、一般的な広域ネットワーク(WAN)、もしくはパブリック・ネットワーク(例、インターネット)、またはその組み合わせなどの1つ以上のネットワーク24と通信し得る。示されるとおり、ネットワーク・アダプタ22は、バス14を介してコンピュータ・システムのその他のコンポーネントと通信する。示されていないが、このコンピュータ・システムと共に、他のハードウェアもしくはソフトウェア・コンポーネントまたはその両方が使用され得ることが理解されるべきである。その例は、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部ディスク・ドライブ・アレイ、RAIDシステム、テープ・ドライブ、およびデータ・アーカイバル・ストレージ・システムなどを含むが、それに限定されない。
【0090】
本発明は、任意の可能な技術的詳細レベルの統合におけるシステム、方法、もしくはコンピュータ・プログラム製品、またはその組み合わせであってもよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(または複数の媒体)を含んでもよい。
【0091】
コンピュータ可読記憶媒体は、命令実行デバイスによって使用するための命令を保持および記憶できる有形デバイスであり得る。コンピュータ可読記憶媒体は、たとえば電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、または前述の任意の好適な組み合わせなどであってもよいが、それに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストは以下を含む。ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、リード・オンリ・メモリ(ROM)、消去可能プログラマブル・リード・オンリ・メモリ(erasable programmable read-only memory)(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク・リード・オンリ・メモリ(CD-ROM)、デジタル多用途ディスク(DVD:digital versatile disk)、メモリ・スティック、フレキシブル・ディスク、機械的に符号化されたデバイス、たとえばパンチ・カードまたは記録された命令を有する溝の中の隆起構造体など、および前述の任意の好適な組み合わせ。本明細書において用いられるコンピュータ可読記憶媒体は、たとえば電波もしくはその他の自由に伝播する電磁波、導波路もしくはその他の伝送媒体を通じて伝播する電磁波(例、光ファイバ・ケーブルを通過する光パルス)、またはワイヤを通じて伝送される電気信号など、それ自体が一時的な信号であると解釈されるべきではない。
【0092】
本明細書に記載されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスにダウンロードされ得るか、あるいはたとえばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、もしくはワイヤレス・ネットワーク、またはその組み合わせなどのネットワークを介して外部コンピュータまたは外部ストレージ・デバイスにダウンロードされ得る。ネットワークは銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、もしくはエッジ・サーバ、またはその組み合わせを含んでもよい。各コンピューティング/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信して、そのコンピュータ可読プログラム命令をそれぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体に記憶するために転送する。
【0093】
本発明の動作を実行するためのコンピュータ可読プログラム命令はアセンブラ命令、命令セット・アーキテクチャ(ISA:instruction-set-architecture)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路に対する構成データ、または1つ以上のプログラミング言語の任意の組み合わせで書かれたソース・コードもしくはオブジェクト・コードであってもよく、このプログラミング言語はオブジェクト指向プログラミング言語、たとえばSmalltalk、またはC++など、および手続き型プログラミング言語、たとえば「C」プログラミング言語または類似のプログラミング言語などを含む。コンピュータ可読プログラム命令は、すべてがユーザのコンピュータで実行されてもよいし、スタンドアロン・ソフトウェア・パッケージとして部分的にユーザのコンピュータで実行されてもよいし、一部がユーザのコンピュータで、一部がリモート・コンピュータで実行されてもよいし、すべてがリモート・コンピュータまたはサーバで実行されてもよい。後者のシナリオにおいて、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを通じてユーザのコンピュータに接続されてもよいし、(たとえば、インターネット・サービス・プロバイダを用いてインターネットを通じて)外部コンピュータへの接続が行われてもよい。いくつかの実施形態において、たとえばプログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic arrays)などを含む電子回路は、本発明の態様を行うために電子回路をパーソナライズするためのコンピュータ可読プログラム命令の状態情報を使用することによって、コンピュータ可読プログラム命令を実行してもよい。
【0094】
本明細書においては、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図もしくはブロック図またはその両方を参照して、本発明の態様を説明している。フローチャート図もしくはブロック図またはその両方の各ブロック、およびフローチャート図もしくはブロック図またはその両方におけるブロックの組み合わせは、コンピュータ可読プログラム命令によって実装され得ることが理解されるだろう。
【0095】
これらのコンピュータ可読プログラム命令は、汎用目的のコンピュータか、特定目的のコンピュータか、またはマシンを生成するためのその他のプログラマブル・データ処理装置のプロセッサに提供されることによって、そのコンピュータまたはその他のプログラマブル・データ処理装置のプロセッサを介して実行される命令が、フローチャートもしくはブロック図またはその両方の単数または複数のブロックにおいて指定される機能/動作を実装するための手段を生じてもよい。これらのコンピュータ可読プログラム命令は、コンピュータ、プログラマブル・データ処理装置、もしくはその他のデバイス、またはその組み合わせに特定の方式で機能するように指示できるコンピュータ可読記憶媒体にも記憶されることによって、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートもしくはブロック図またはその両方の単数または複数のブロックにおいて指定される機能/動作の態様を実装する命令を含む製造物を含んでもよい。
【0096】
コンピュータ可読プログラム命令は、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにもロードされて、コンピュータに実装されるプロセスを生成するためにコンピュータ、他のプログラマブル装置、または他のデバイスにおいて一連の動作ステップを行わせることによって、そのコンピュータ、他のプログラマブル装置、または他のデバイスにおいて実行される命令が、フローチャートもしくはブロック図またはその両方の単数または複数のブロックにおいて指定される機能/動作を実装してもよい。
【0097】
図面におけるフローチャートおよびブロック図は、本発明のさまざまな実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示すものである。これに関して、フローチャートまたはブロック図の各ブロックは、命令のモジュール、セグメント、または一部分を表してもよく、これは指定される論理機能(単数または複数)を実装するための1つ以上の実行可能命令を含む。いくつかの代替的実装において、ブロック内に示される機能は、図面に示されるものとは異なる順序で起こってもよい。たとえば、連続して示される2つのブロックは、実際には実質的に同時に実行されてもよく、または関与する機能に依存して、これらのブロックがときには逆の順序で実行されてもよい。加えて、ブロック図もしくはフローチャート図またはその両方の各ブロック、およびブロック図もしくはフローチャート図またはその両方のブロックの組み合わせは、指定された機能もしくは動作を行うか、または特定目的のハードウェアおよびコンピュータ命令の組み合わせを実行する特定目的のハードウェア・ベースのシステムによって実装され得ることが注目されるだろう。
【0098】
本明細書において用いられる用語は、単に特定の実施形態を説明する目的のためのものであり、本発明を限定することは意図されていない。本明細書において用いられる単数形「a」、「an」、および「the」は、文脈が別様を明確に示さない限り複数形も含むことが意図される。この明細書において用いられるときの「含む(comprises)」もしくは「含んでいる(comprising)」またはその両方の用語は、記述される特徴、整数、ステップ、動作、エレメント、もしくはコンポーネント、またはその組み合わせの存在を特定するが、1つ以上の他の特徴、整数、ステップ、動作、エレメント、コンポーネント、もしくはそのグループ、またはその組み合わせの存在または付加を除外しないことがさらに理解されるだろう。以下の請求項におけるすべての構成要素に対応する構造、材料、動作、および均等物は、特定的に請求される他の請求構成要素と組み合わせてその機能を行うための任意の構造、材料、または動作を含むことが意図される。本発明の説明は例示および説明の目的のために提供されたものであるが、開示される形の本発明に対して網羅的または限定的になることは意図されていない。本発明の範囲および思想から逸脱することなく、当業者には多くの修正および変更が明らかになるだろう。実施形態は、本発明の原理および実際の適用を最もよく説明し、かつ他の当業者が予期される特定の使用に対して好適であるようなさまざまな修正を伴うさまざまな実施形態に対して本発明を理解できるようにするために選択されて記載されたものである。
【0099】
本開示はクラウド・コンピューティングの詳細な説明を含むが、本明細書に記述される教示の実装はクラウド・コンピューティング環境に限定されないことが理解されるべきである。むしろ、本発明の実施形態は、現在公知であるか、または後に開発される任意のその他のタイプのコンピューティング環境と共に実装され得る。
【0100】
クラウド・コンピューティングは、最小限の管理努力またはサービスのプロバイダとの対話によって迅速にプロビジョニングおよびリリースされ得る構成可能なコンピューティング・リソース(例、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス)の共有プールへの便利なオンデマンド・ネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは少なくとも5つの特性と、少なくとも3つのサービス・モデルと、少なくとも4つの展開モデルとを含んでもよい。
【0101】
特性は次のとおりである。
【0102】
オンデマンド・セルフサービス。クラウド消費者は、たとえばサーバ時間およびネットワーク・ストレージなどのコンピューティング機能を、必要に応じて自動的に、サービスのプロバイダとの人的対話を必要とせずに一方的にプロビジョニングできる。
【0103】
広範なネットワーク・アクセス。機能はネットワークを通じて利用可能であり、さまざまなシンまたはシック・クライアント・プラットフォーム(例、携帯電話、ラップトップ、およびPDA)による使用を促進する標準的な機構を通じてアクセスされる。
【0104】
リソース・プール。マルチテナント・モデルを用いて複数の消費者にサービスするために、プロバイダのコンピューティング・リソースはプールされ、要求に従って異なる物理および仮想リソースが動的に割り当ておよび再割り当てされる。消費者は一般的に、提供されるリソースの正確な場所に対する制御も知識も有さないが、より高い抽象化レベルにおける場所(例、国、州、またはデータセンタ)を特定できてもよいという点で、場所独立性の意味が存在する。
【0105】
迅速な弾力性。機能は、素早くスケール・アウトするために場合によっては自動的に、迅速かつ弾力的にプロビジョニングされ、かつ素早くスケール・インするために迅速にリリースされ得る。消費者にとって、プロビジョニングのために利用可能な機能はしばしば無制限にみえ、任意のときに任意の量を購入できる。
【0106】
従量制サービス。クラウド・システムは、サービスのタイプ(例、ストレージ、処理、帯域幅、およびアクティブ・ユーザ・アカウント)に対して適切な何らかの抽象化レベルにおいて計測機能を利用することによって、リソースの使用を自動的に制御および最適化する。リソースの使用をモニタ、制御、および報告して、利用されるサービスのプロバイダおよび消費者の両方に対する透明性を提供できる。
【0107】
サービス・モデルは次のとおりである。
【0108】
サービスとしてのソフトウェア(SaaS:Software as a Service)。消費者に提供される機能は、クラウド・インフラストラクチャにおいて動作するプロバイダのアプリケーションの使用である。アプリケーションは、さまざまなクライアント・デバイスからたとえばウェブ・ブラウザ(例、ウェブ・ベースのeメール)などのシン・クライアント・インターフェースを通じてアクセス可能である。消費者はネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能さえも含む基礎的なクラウド・インフラストラクチャを管理または制御することはなく、例外となり得るのは限られたユーザ特有のアプリケーション構成設定である。
【0109】
サービスとしてのプラットフォーム(PaaS:Platform as a Service)。消費者に提供される機能は、プロバイダによってサポートされるプログラミング言語およびツールを用いて作成された、消費者が作成または取得したアプリケーションのクラウド・インフラストラクチャへの展開である。消費者はネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基礎的なクラウド・インフラストラクチャを管理または制御することはないが、展開されたアプリケーションおよび場合によってはアプリケーション・ホスティング環境構成に対する制御を有する。
【0110】
サービスとしてのインフラストラクチャ(IaaS:Infrastructure as a Service)。消費者に提供される機能は、オペレーティング・システムおよびアプリケーションを含み得る、消費者が任意のソフトウェアを展開および実行することが可能な処理、ストレージ、ネットワーク、およびその他の基本的なコンピューティング・リソースのプロビジョニングである。消費者は基礎的なクラウド・インフラストラクチャを管理または制御することはないが、オペレーティング・システム、ストレージ、展開されたアプリケーションに対する制御、および場合によってはネットワーク形成コンポーネント(例、ホスト・ファイアウォール)の選択に対する限られた制御を有する。
【0111】
展開モデルは次のとおりである。
【0112】
プライベート・クラウド。このクラウド・インフラストラクチャは、ある組織に対してのみ操作される。これはその組織またはサード・パーティによって管理されてもよく、オンプレミスまたはオフプレミスに存在してもよい。
【0113】
コミュニティ・クラウド。このクラウド・インフラストラクチャは複数の組織によって共有され、共通する関心事項(例、任務、セキュリティ要件、ポリシー、およびコンプライアンスの検討)を有する特定のコミュニティをサポートする。これはそれらの組織またはサード・パーティによって管理されてもよく、オンプレミスまたはオフプレミスに存在してもよい。
【0114】
パブリック・クラウド。このクラウド・インフラストラクチャは、一般人または大規模な産業グループに対して利用可能にされ、クラウド・サービスを販売する組織が所有している。
【0115】
ハイブリッド・クラウド。このクラウド・インフラストラクチャは2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の複合体であり、それらのクラウドは独自のエンティティに留まるが、データおよびアプリケーション・ポータビリティを可能にする標準または独自の技術(例、クラウド間のロード・バランシングのためのクラウド・バースティング)によって共に結合される。
【0116】
クラウド・コンピューティング環境はサービス指向型であり、ステートレス性、低結合性、モジュラリティ、およびセマンティックな相互運用性に焦点を合わせている。クラウド・コンピューティングの中心には、相互接続されたノードのネットワークを含むインフラストラクチャがある。
【0117】
ここで
図6を参照すると、例示的なクラウド・コンピューティング環境50が示されている。示されるとおり、クラウド・コンピューティング環境50は1つ以上のクラウド・コンピューティング・ノード10を含み、たとえばパーソナル・デジタル・アシスタント(PDA:personal digital assistant)もしくは携帯電話54A、デスクトップ・コンピュータ54B、ラップトップ・コンピュータ54C、または自動車のコンピュータ・システム54N、あるいはその組み合わせなどの、クラウド消費者によって用いられるローカル・コンピュータ・デバイスが、このクラウド・コンピューティング・ノード10によって通信してもよい。ノード10は互いに通信してもよい。これらのノードは、たとえば上述したプライベート、コミュニティ、パブリック、もしくはハイブリッド・クラウド、またはその組み合わせなどの1つ以上のネットワークにおいて、物理的または仮想的にグループ化(図示せず)されてもよい。このことは、クラウド・コンピューティング環境50がインフラストラクチャ、プラットフォーム、もしくはソフトウェア、またはその組み合わせを、クラウド消費者がそれに対するリソースをローカル・コンピュータ・デバイスにおいて維持する必要のないサービスとして提供することを可能にする。
図6に示されるコンピュータ・デバイス54A~Nのタイプは単なる例示であることが意図されており、コンピューティング・ノード10およびクラウド・コンピューティング環境50は、任意のタイプのネットワークもしくはネットワーク・アドレス可能接続(例、ウェブ・ブラウザを使用するもの)またはその両方を通じて、任意のタイプのコンピュータ・デバイスと通信できることが理解される。
【0118】
ここで
図7を参照すると、クラウド・コンピューティング環境50(
図6)によって提供される機能的抽象化レイヤのセットが示されている。
図7に示されるコンポーネント、レイヤ、および機能は単なる例示であることが意図されており、本発明の実施形態はそれらに限定されないことが予め理解されるべきである。示されるとおり、以下のレイヤおよび対応する機能が提供される。
【0119】
ハードウェアおよびソフトウェア・レイヤ60は、ハードウェアおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例は、メインフレーム61、RISC(縮小命令セット・コンピュータ(Reduced Instruction Set Computer))アーキテクチャ・ベースのサーバ62、サーバ63、ブレード・サーバ64、ストレージ・デバイス65、ならびにネットワークおよびネットワーク形成コンポーネント66を含む。いくつかの実施形態において、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア67およびデータベース・ソフトウェア68を含む。
【0120】
仮想化レイヤ70は抽象化レイヤを提供し、この抽象化レイヤから仮想エンティティの以下の例が提供されてもよい。仮想サーバ71、仮想ストレージ72、仮想プライベート・ネットワークを含む仮想ネットワーク73、仮想アプリケーションおよびオペレーティング・システム74、ならびに仮想クライアント75。
【0121】
一例において、管理レイヤ80は以下に記載される機能を提供してもよい。リソース・プロビジョニング81は、クラウド・コンピューティング環境内でタスクを行うために使用されるコンピューティング・リソースおよびその他のリソースの動的調達を提供する。計測および価格決定82は、クラウド・コンピューティング環境内でリソースが使用される際のコスト追跡と、これらのリソースの消費に対する課金またはインボイス作成を提供する。一例において、これらのリソースはアプリケーション・ソフトウェア・ライセンスを含んでもよい。セキュリティは、クラウド消費者およびタスクに対するアイデンティティ検証、ならびにデータおよびその他のリソースの保護を提供する。ユーザ・ポータル83は、消費者およびシステム管理者に対するクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理84は、要求されるサービス・レベルが満たされるようにクラウド・コンピューティング・リソースの割り当ておよび管理を提供する。サービス・レベル・アグリーメント(SLA:Service Level Agreement)計画および実現85は、SLAによって将来の要求が予測されるクラウド・コンピューティング・リソースに対する事前の取り決めおよびその調達を提供する。
【0122】
ワークロード・レイヤ90は、クラウド・コンピューティング環境が使用され得る機能の例を提供する。このレイヤから提供され得るワークロードおよび機能の例は、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想教室の教育配信93、データ分析処理94、トランザクション処理95、および本開示の態様によるターゲット結果に対する最適サンプルを自動的に生成するための処理96を含む。
【手続補正書】
【提出日】2023-09-03
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、
前記入力データの前記潜在特徴表現を用いて前記入力データを再構成することを学習するためにVAEデコーダ・モデルを受信することと、
前記入力データの前記潜在特徴表現を用いて前記入力データとターゲット結果との関係を学習するために値予測モデルを受信することと、
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングすることと、
トレーニング済の前記値予測モデルを用いて、前記入力データの前記潜在特徴空間表現を最適化することと、
トレーニング済の前記VAEデコーダ・モデルにおいて、前記入力データの前記最適化された潜在特徴空間表現を受信することと、
前記入力データの前記最適化された潜在特徴空間表現に基づいて前記ターゲット結果を得るための前記入力データの最適サンプルを生成するために、前記トレーニング済のVAEデコーダ・モデルを実行することと
を含む、コンピュータ実施方法。
【請求項2】
前記VAEエンコーダ・モデル、前記VAEデコーダ・モデル、および前記値予測モデルが、畳み込みニューラル・ネットワーク(CNN)、再帰型ニューラル・ネットワーク(RNN)、または多層パーセプトロン(MLP)から
なる群からそれぞれ選択される機械学習済ディープ・ニューラル・ネットワーク・モデルを含む、請求項1に記載のコンピュータ実施方法。
【請求項3】
前記VAEデコーダ・モデルおよび前記値予測モデルを前記同時にトレーニングすることによって、前記VAEデコーダ・モデルのトレーニングに用いるための再構成誤差損失成分と、前記値予測モデルの前記トレーニングに用いるためのラベル予測誤差損失成分とを含む損失関数を最適化する、請求項1に記載のコンピュータ実施方法。
【請求項4】
前記入力データの前記潜在特徴空間表現を前記最適化することが、制約なし潜在空間における最適化の課題を
解決することを含む、請求項1に記載のコンピュータ実施方法。
【請求項5】
前記最適化の課題が、最大のターゲット結果値を生成する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための大域的最適化である、請求項
4に記載のコンピュータ実施方法。
【請求項6】
前記最適化の課題が、前記ターゲット結果値と一致する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための局所的最適化である、請求項
4に記載のコンピュータ実施方法。
【請求項7】
前記最適化の課題が、所与の前記入力データに類似しているがより大きなターゲット結果を有する最適サンプルを見出すための特定の入力データを与えられたときの局所的最適化である、請求項
4に記載のコンピュータ実施方法。
【請求項8】
前記最適化の課題が、前記潜在特徴空間表現の確率を最適化するための確率正則化成分を含む、請求項
4に記載のコンピュータ実施方法。
【請求項9】
メモリ・ストレージ・デバイスと、
前記メモリ・ストレージ・デバイスに結合された少なくとも1つのプロセッサと
を含み、前記
プロセッサが、
教師付き変分オートエンコーダ(VAE)のエンコーダ・モデルを用いて、潜在特徴空間における入力データの潜在特徴表現を生成することと、
前記入力データの前記潜在特徴表現を用いて前記入力データを再構成することを学習するためにVAEデコーダ・モデルを受信することと、
前記入力データの前記潜在特徴表現を用いて前記入力データとターゲット結果との関係を学習するために値予測モデルを受信することと、
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングすることと、
トレーニング済の前記値予測モデルを用いて、前記入力データの前記潜在特徴空間表現を最適化することと、
トレーニング済の前記VAEデコーダ・モデルにおいて、前記入力データの前記最適化された潜在特徴空間表現を受信することと、
前記入力データの前記最適化された潜在特徴空間表現に基づいて前記ターゲット結果を得るための前記入力データの最適サンプルを生成するために、前記トレーニング済のVAEデコーダ・モデルを実行することと
を行うように
構成された、コンピュータ・システム。
【請求項10】
前記VAEエンコーダ・モデル、前記VAEデコーダ・モデル、および前記値予測モデルが、畳み込みニューラル・ネットワーク(CNN)、再帰型ニューラル・ネットワーク(RNN)、または多層パーセプトロン(MLP)から
なる群からそれぞれ選択される機械学習済ディープ・ニューラル・ネットワーク・モデルを含む、請求項9に記載のコンピュータ・システム。
【請求項11】
前記VAEデコーダ・モデルおよび前記値予測モデルを同時にトレーニングするために、前記少なくとも1つのプロセッサが、前記VAEデコーダ・モデルのトレーニングに用いるための再構成誤差損失成分と、前記値予測モデルの前記トレーニングに用いるためのラベル予測誤差損失成分とを含む損失関数を最適化するようにさらに構成される、請求項9に記載のコンピュータ・システム。
【請求項12】
前記入力データの前記潜在特徴空間表現を前記最適化することが、制約なし潜在空間における最適化の課題を
解決することを含む、請求項9に記載のコンピュータ・システム。
【請求項13】
前記最適化の課題が、最大のターゲット結果値を生成する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための大域的最適化である、請求項
12に記載のコンピュータ・システム。
【請求項14】
前記最適化の課題が、前記ターゲット結果値と一致する前記入力データ・サンプルの前記最適化された潜在特徴空間表現を見出すための局所的最適
化である、請求項
12に記載のコンピュータ・システム。
【請求項15】
前記最適化の課題が、所与の前記入力データに類似しているがより大きなターゲット結果を有する最適サンプルを見出すための特定の入力データを与えられたときの局所的最適化である、請求項12に記載のコンピュータ・システム。
【請求項16】
前記最適化の課題が、前記潜在特徴空間表現の確率を最適化するための確率正則化成分を含む、請求項
12に記載のコンピュータ実施方法。
【請求項17】
少なくとも1つのプロセッサに、請求項1ないし8のいずれかに記載の方法を実行させるためのコンピュータ・プログラム。
【国際調査報告】