IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エスアールアイ インターナショナルの特許一覧

特表2023-541737教師なしの可逆的な物理学ベースの分子のベクトル表現
<>
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図1
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図2
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図3
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図4
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図5
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図6
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図7
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図8
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図9
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図10
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図11
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図12
  • 特表-教師なしの可逆的な物理学ベースの分子のベクトル表現 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-04
(54)【発明の名称】教師なしの可逆的な物理学ベースの分子のベクトル表現
(51)【国際特許分類】
   G16C 20/30 20190101AFI20230927BHJP
【FI】
G16C20/30
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022543145
(86)(22)【出願日】2021-06-23
(85)【翻訳文提出日】2022-07-14
(86)【国際出願番号】 US2021038592
(87)【国際公開番号】W WO2021262792
(87)【国際公開日】2021-12-30
(31)【優先権主張番号】63/043,480
(32)【優先日】2020-06-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
2.PYTHON
(71)【出願人】
【識別番号】501228071
【氏名又は名称】エスアールアイ インターナショナル
【氏名又は名称原語表記】SRI International
【住所又は居所原語表記】333 Ravenswood Avenue, Menlo Park, California 94025, U.S.A.
(74)【代理人】
【識別番号】100098899
【弁理士】
【氏名又は名称】飯塚 信市
(74)【代理人】
【識別番号】100163865
【弁理士】
【氏名又は名称】飯塚 健
(72)【発明者】
【氏名】バーンズ, ジョン, ジェイ.
(72)【発明者】
【氏名】ロワー, リチャード, ジェイ.
(72)【発明者】
【氏名】ルーブキー, ケビン, ジェイ.
(72)【発明者】
【氏名】マドリッド, ピーター
(57)【要約】
人工知能エンジンは、1つまたは複数の動作を実行できる。目標特性のセットを有する、名前のない分子のための目標特性のセットを直接検索するためのクエリを、人工知能エンジンに発行することができる。目標特性のセットを有していることを発見された1つまたは複数の候補分子の構造の表示は、人工知能エンジンを用いて、1つまたは複数の機械学習アルゴリズムを適用することによって生成される。3次元空間における目標特性のセットを満足することを発見された1つまたは複数の候補分子の構造の表示は、人工知能エンジンへの目標特性のセットを求めるクエリに応答してユーザに提供される。
【選択図】図1
【特許請求の範囲】
【請求項1】
1つまたは複数の機械学習モデルを使用する2つ以上のモジュールから構成された人工知能エンジンを備え、
分子特性予測モジュールが、分子ベクトルモジュールと連携して、3次元空間における分子ベクトル場から分子特性を予測するように構成され、
入力モジュールが、前記分子ベクトルモジュール、前記分子特性予測モジュール、および原子ベクトルモジュールと連携して、ユーザが、1)前記分子特性予測モジュールにおいて、2つ以上の原子を入力して、第1の機械学習モデルに、前記2つ以上の原子によって形成された結果的に得られた分子の特性のセットを出力させるのみならず、2)ラベル付けされていない分子の目標特性のセットの入力を提供し、前記第1の機械学習モデルに、前記ラベル付けされていない分子の原子のセットおよび幾何学的構造を出力させることができるように、これらのモジュールが、前記1つまたは複数の機械学習モデルを適用できるように構成された、装置。
【請求項2】
原子ベクトル場を、前記3次元空間における前記分子ベクトル場と比較し、それらがほぼ同じである場合を判定するようにトレーニングされた第2の機械学習モデルを有する一致比較モジュールをさらに備え、前記ラベル付けされていない分子の前記幾何学的構造は、前記3次元空間における前記原子のセットによって形成される、請求項1に記載の装置。
【請求項3】
前記原子ベクトルモジュールおよび前記分子ベクトルモジュールは、分子ベクトルに対する原子ベクトルの適切な比較を可能にするために、同じ座標系を用いて、前記原子ベクトルを前記3次元空間にマッピングするのみならず、前記分子ベクトルを前記3次元空間にマッピングするために、1つまたは複数のトランスフォーマと連携するように構成される、請求項1に記載の装置。
【請求項4】
前記AIエンジンは、少なくとも化学の専門家からの情報を含む1つまたは複数の知識ソースから情報を受け取り、使用して、前記情報によって作成された制約に適合させるために、1つまたは複数の制約として機能して、原子ベクトル場と一致する候補分子ベクトル場を発見するように機械学習を適応させるように構成される、請求項1に記載の装置。
【請求項5】
前記分子特性予測モジュールにおける前記第1の機械学習モデルは、前記3次元空間における分析中の分子の各空間に分子セマンティック依存ベクトル場を有することによって、分析中のその分子の構造的特性の値に対する分析中の前記分子の分子特性を予測するように学習するように構成される、請求項1に記載の装置。
【請求項6】
原子特性モジュールは、前記原子特性モジュールの出力層が、i)原子の識別情報と、ii)提供された原子ベクトル値の前記原子特性の値とを生成するように、原子ベクトルモジュールと連携して、原子特性を原子ベクトル値に相互に予測するように構成される、請求項1に記載の装置。
【請求項7】
実行可能な命令を含む非一時的なコンピュータ可読媒体であって、前記命令が、1つまたは複数のプロセッサを用いて実行された場合、人工知能エンジンに対して、
分子ベクトルモジュールと連携して、3D空間における分子ベクトル場から分子特性を予測するために、分子特性予測モジュールを使用することと、
前記分子ベクトルモジュール、前記分子特性予測モジュール、および原子ベクトルモジュールと連携して、ユーザが、1)前記分子特性予測モジュールにおいて、2つ以上の原子を入力して、第1の機械学習モデルに、前記2つ以上の原子によって形成された結果得られた分子の特性のセットを出力させるのみならず、2)ラベル付けされていない分子の目標特性のセットの入力を提供し、前記第1の機械学習モデルに、前記ラベル付けされていない分子の原子のセットおよび幾何学的構造を出力させることができるように、これらのモジュールが、前記1つまたは複数の機械学習モデルを適用できるようにするために、入力モジュールを使用することとを含む動作を実行させる、非一時的なコンピュータ可読媒体。
【請求項8】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
機械学習アルゴリズムを用いてトレーニングされた一致比較モジュールを使用して、原子ベクトル場を、前記3次元空間における前記分子ベクトル場と比較し、それらがほぼ同じである場合を判定することを含むさらなる動作を実行させ、前記ラベル付けされていない分子の前記幾何学的構造は、前記3次元空間における前記原子のセットによって形成される、請求項7に記載の非一時的なコンピュータ可読媒体。
【請求項9】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
前記原子ベクトルモジュールおよび前記分子ベクトルモジュールを使用して、分子ベクトルに対する原子ベクトルの適切な比較を可能にするために、同じ座標系を用いて、前記原子ベクトルを前記3次元空間にマッピングするためのみならず、前記分子ベクトルを前記3次元空間にマッピングするために、1つまたは複数のトランスフォーマと連携することを含むさらなる動作を実行させる、請求項7に記載の非一時的なコンピュータ可読媒体。
【請求項10】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
前記入力モジュールを使用して、少なくとも化学の専門家からの情報を含む知識ソースから情報を受け取り、提供して、前記情報によって作成された制約に適合させるために、1つまたは複数の制約として機能して、前記3次元空間における原子ベクトル場と一致する候補分子ベクトル場を発見するように機械学習を適応させることを含むさらなる動作を実行させる、請求項7に記載の非一時的なコンピュータ可読媒体。
【請求項11】
人工知能エンジンを使用する方法であって、
目標特性のセットを有する、名前のない分子のための前記目標特性のセットを直接検索するためのクエリを、前記人工知能エンジンに発行することと、
前記人工知能エンジンを用いて、前記目標特性のセットを有していることを発見された1つまたは複数の候補分子の構造の表示を、1つまたは複数の機械学習アルゴリズムを適用することによって生成することと、
前記人工知能エンジンへの前記目標特性のセットを求める前記クエリに応答して、3次元空間における前記目標特性のセットを満足することを発見された前記1つまたは複数の候補分子の前記構造の前記表示をユーザに提供することとを含む、方法。
【請求項12】
i)前記目標特性のセットを満足することを発見された第1の候補分子の構造の3次元ベクトル場を、ii)同じ3次元空間における1つまたは複数の原子からの原子ベクトルの構造を用いて再構築することをさらに含む、請求項11に記載の人工知能エンジンを使用する方法。
【請求項13】
3次元空間における1つまたは複数の候補分子の幾何学的構造に対応する分子ベクトル値を反復的に発行するようにトレーニングされた機械学習モジュールを使用することをさらに含み、前記1つまたは複数の候補分子の前記幾何学的構造に対応する前記分子ベクトル値は、自然界において当然発生するものとして、および/または、実験室において作成されたものとして、まだ発見されていない、単なる架空の分子を含むことができ、
前記分子ベクトル値は、分子ベクトルモジュールから分子特性予測子に反復的に発行され、前記目標特性のセットを満足する第1の候補分子が発見されるときを確認する、請求項11に記載の人工知能エンジンを使用する方法。
【請求項14】
自然界において当然に発生すると知られている分子の特性の、予測またはルックアップ機能の実行を単に行うのではなく、前記目標特性を有する前記第1の候補分子を構成する原子を含む、前記第1の候補分子およびその幾何学的構造の表現を生成することと、
前記目標特性を有する前記第1の候補分子を構成する前記原子を含む、前記第1の候補分子およびその幾何学的構造の前記表現を、1)表示画面で、2)印刷物において、3)前記ユーザのアカウントに送信される電子メッセージとして、および4)これら3つの任意の組合せで前記ユーザに提供することとをさらに含む、請求項13に記載の人工知能エンジンを使用する方法。
【請求項15】
前記ユーザから、前記名前のない分子の前記目標特性のセットの入力を受け取ることであって、前記目標特性のセットは、前記目標特性のセットを満足する前記1つまたは複数の候補分子の発見を試みるときに達成する第1の機械学習アルゴリズムの出力目標として、分子特性予測モジュールに提供される、受け取ることと、
前記名前のない分子に対して提供された前記目標特性を満足する1つまたは複数の候補分子ベクトル値が発見されるまで、候補分子ベクトル値を、前記特性予測モジュールに反復的に提供することと、
前記名前のない分子に対して提供された前記目標特性を満足する第1の候補分子ベクトル値を発見した後、前記第1の候補分子ベクトル値を、第1の候補分子の構造を示す前記第1の候補分子ベクトル値の3次元ベクトル場に変換することとをさらに含む、請求項11に記載の人工知能エンジンを使用する方法。
【請求項16】
実行可能な命令を含む非一時的なコンピュータ可読媒体であって、前記命令が、1つまたは複数のプロセッサを用いて実行された場合、人工知能エンジンに対して、
目標特性のセットを有する、名前のない分子のための前記目標特性のセットを直接検索するためのクエリを、前記人工知能エンジンに発行することと、
前記人工知能エンジンを用いて、前記目標特性のセットを有していることを発見された1つまたは複数の候補分子の構造の表示を、1つまたは複数の機械学習アルゴリズムを適用することによって生成することと、
前記人工知能エンジンへの前記目標特性のセットを求める前記クエリに応答して、3次元空間における前記目標特性のセットを満足することを発見された前記1つまたは複数の候補分子の前記構造の前記表示をユーザに提供することとを含む動作を実行させる、非一時的なコンピュータ可読媒体。
【請求項17】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
i)前記目標特性のセットを満足することを発見された第1の候補分子の構造の3次元ベクトル場を、ii)同じ3次元空間における1つまたは複数の原子からの原子ベクトルの構造を用いて再構築することを含むさらなる動作を実行させる、請求項16に記載の非一時的なコンピュータ可読媒体。
【請求項18】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
3次元空間における1つまたは複数の候補分子の幾何学的構造に対応する分子ベクトル値を反復的に発行するようにトレーニングされた機械学習モジュールを使用することを含むさらなる動作を実行させ、前記1つまたは複数の候補分子の前記幾何学的構造に対応する前記分子ベクトル値は、自然界において当然発生するものとして、および/または、実験室において作成されたものとして、まだ発見されていない、単なる架空の分子を含むことができ、
前記分子ベクトル値は、分子ベクトルモジュールから分子特性予測子に反復的に発行され、前記目標特性のセットを満足する第1の候補分子が発見されるときを確認する、請求項16に記載の非一時的なコンピュータ可読媒体。
【請求項19】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
自然界において当然に発生すると知られている分子の特性の、予測またはルックアップ機能の実行を単に行うのではなく、前記目標特性を有する前記第1の候補分子を構成する原子を含む、前記第1の候補分子およびその幾何学的構造の表現を生成することと、
前記目標特性を有する前記第1の候補分子を構成する前記原子を含む、前記第1の候補分子およびその幾何学的構造の前記表現を、1)表示画面で、2)印刷物において、3)前記ユーザのアカウントに送信される電子メッセージとして、および4)これら3つの任意の組合せで前記ユーザに提供することとを含むさらなる動作を実行させる、請求項18に記載の非一時的なコンピュータ可読媒体。
【請求項20】
さらなる実行可能な命令を含み、前記命令が、前記1つまたは複数のプロセッサを用いて実行された場合、前記人工知能エンジンに対して、
前記ユーザから、前記名前のない分子の前記目標特性のセットの入力を受け取ることであって、前記目標特性のセットは、前記目標特性のセットを満足する前記1つまたは複数の候補分子の発見を試みるときに達成する第1の機械学習アルゴリズムの出力目標として、分子特性予測モジュールに提供される、受け取ることと、
前記名前のない分子に対して提供された前記目標特性を満足する1つまたは複数の候補分子ベクトル値が発見されるまで、候補分子ベクトル値を、前記特性予測モジュールに反復的に提供することと、
前記名前のない分子に対して提供された前記目標特性を満足する第1の候補分子ベクトル値を発見した後、前記第1の候補分子ベクトル値を、第1の候補分子の前記構造を示す前記第1の候補分子ベクトル値の3次元ベクトル場に変換することとを含むさらなる動作を実行させる、請求項16に記載の非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2020年6月24日に出願された「Unsupervised invertible physics-based vector representation for molecules」(教師なしの可逆的な物理学ベースの分子のベクトル表現)と題された米国仮特許出願SN63/043,480号に対する米国特許法第119条に基づく優先権を主張し、そのような開示はその全体が参照により本明細書に組み込まれる。
【0002】
本明細書の概念の実施形態は、人工知能コンピューティングにおける技法およびツールに関する。
【背景技術】
【0003】
知られているように、ダイヤモンドおよびグラファイトは、同じ化学組成を有するが、各分子の物理的特性は非常に異なる2つの分子である。どちらの分子も、炭素が、共有結合によって結合されているが、グラファイトでは、炭素原子は、シートを形成し、それらが弱く結合する。ダイヤモンドでは、炭素が、3次元のフレームワークを形成する。異性体は、同じ分子式を有するが、同じ分子式に対して異なる分子特性を与える異なる分子幾何学的形状を有する分子の例示的なクラスである。
【0004】
したがって、異なる用途(たとえば、創薬、新規な燃料構成要素など)で新しい化合物を生成するには、所望の特性を与える可能性のある幾何学的形状を有する分子を設計し、その分子を化学実験室で合成し、その分子が目標特性を有するか否かを判定するために、その分子を試験する、といった高価なサイクルが必要である。今日、ほとんどの人工知能(AI)技法には、特定の特性を有する新しい化合物を生成するタスクを実行するための標準的な使用事例がない。たとえば、通常のAI技法は、ユーザが予測したい特性がすでに知られている分子から(つまり、ラベル付けされた分子から)表現を単に学習することしかできない。これは、名前のある分子と、その知られている特性とのデータベース相関付けに過ぎず、その分子を構成する構造を調べ、その後、各構造および/または構造の組合せを、同じまたは化学的に非常に類似した原子のセット、および、所与の分子内のその幾何学的形状を含む、名前のある、または名前のない任意の分子の結果として得られた、または得られる可能性のある1つまたは複数の特性に相関付けることとは異なる。
【発明の概要】
【0005】
本明細書で提供されるものは、人工知能ベースの推論エンジンおよびその推論プロセスの説明のための様々な方法、装置、およびシステムである。
【0006】
一実施形態では、人工知能エンジンは、1つまたは複数の機械学習モデルを使用する2つ以上のモジュールから構成することができる。分子特性予測モジュールが、分子ベクトルモジュールと連携して、3次元空間における分子[セマンティック依存]ベクトル場から分子特性を予測する。入力モジュールが、分子ベクトルモジュール、分子特性予測モジュール、および原子ベクトルモジュールと連携して、ユーザが、1)分子特性予測モジュールにおいて、2つ以上の原子を入力して、第1の機械学習モデルに、2つ以上の原子によって形成された結果得られた分子の特性のセットを出力させるのみならず、2)ラベル付けされていない分子の目標特性のセットの入力を提供し、第1の機械学習モデルに、ラベル付けされていない分子の原子のセットおよび幾何学的構造を出力させることができるように、これらのモジュールが、1つまたは複数の機械学習モデルを適用できるようにする。一実施形態では、ラベル付けされた分子は、名前、タイプ、または番号などの分子の識別を支援するためのタグまたは他のメタデータを伴うデータである。ラベル付けされていない分子は、タグのないデータである。
【0007】
一実施形態では、人工知能エンジンは、1つまたは複数の動作を実行することができる。目標特性のセットを有する、名前のない分子のための目標特性のセットを直接検索するためのクエリを、人工知能エンジンに発行することができる。人工知能エンジンを用いて、目標特性のセットを有していることを発見された1つまたは複数の候補分子の構造の表示が、1つまたは複数の機械学習アルゴリズムを適用することによって生成される。人工知能エンジンへの目標特性のセットを求めるクエリに応答して、3次元空間における目標特性のセットを満足することを発見された1つまたは複数の候補分子の構造の表示が、ユーザに提供される。これらの実施形態、およびさらに多くの実施形態が、以下で論じられる。
【図面の簡単な説明】
【0008】
図1】ユーザから、名前のない分子の目標特性のセットの入力を受け取り、その後、それらの目標特性のセットを有する可能性のある候補分子を出力することができる、人工知能エンジンを備えたシステムの、例示的な高レベル表現の実施形態を例示する図である。
【0009】
図2】分子を生成、試験、および予測するために、教師なしの可逆的な物理学ベースのベクトル表現を使用する人工知能エンジンを備えた、より詳細な例示的なシステムの実施形態を例示する図である。
【0010】
図3】目標特性のセットを満足する可能性があることを発見された候補分子を発見するための例示的な人工知能エンジンの実施形態を例示する図である。
【0011】
図4】分子の幾何学的構造の表現を生成することを含む複数の動作を行うようにトレーニングされた1つまたは複数の機械学習モデルを使用する2つ以上のモジュールから構成される例示的な人工知能エンジンの実施形態を例示する例示的なブロック図である。
【0012】
図5】例示的な人工知能エンジンと、原子ベクトルモジュールおよび/または分子ベクトルモジュールへの直接入力を有する例示的なモジュールとの実施形態を例示する例示的なブロック図である。
【0013】
図6】分析中の分子の構造的特性の値に対する分析中の分子の例示的な分子特性の実施形態を例示する例示的なブロック図である。
【0014】
図7】原子ベクトルを3次元空間にマッピングするために、1つまたは複数のトランスフォーマと連携するように構成された、例示的な原子ベクトルモジュールの実施形態を例示する図である。
【0015】
図8】分子は3次元オブジェクトであり、その3次元空間内の原子の配置であるので、分子ベクトルに対する原子ベクトルの適切な比較を可能にするために、同じ座標系を用いた、原子ベクトルの3次元空間へのマッピングのみならず、分子ベクトルから3次元空間へのマッピングをも示す図である。
【0016】
図9】少なくとも化学の専門家からの情報を含む、1つまたは複数の知識ソースから情報を受け取り、提供して、情報によって作成された制約に適合させるために、原子ベクトル場と一致する候補分子ベクトル場を発見するように機械学習を適応させるための1つまたは複数の制約として機能するように構成された、例示的な入力モジュールの実施形態を例示する図である。
【0017】
図10】分子特性を、分子における構造的特性に相関付けることができるように、分子における構造のパターンを認識する例示的な人工知能エンジンの実施形態を例示する図である。
【0018】
図11】分子を試験および予測するための物理学ベースのベクトル表現を生成できる例示的な人工知能エンジンの実施形態を例示する図である。
【0019】
図12】人工知能エンジンの一実施形態に従って、ネットワーク環境において互いに通信するいくつかの電子システムおよびデバイスを例示する図である。
【0020】
図13】本明細書で論じられる人工知能エンジンに関連付けられたシステムの一部となることができる、1つまたは複数のコンピューティングデバイスの実施形態を例示する図である。
【0021】
設計は、様々な修正、同等物、および代替形態の対象となるが、その特定の実施形態は、例として図面に示され、ここで詳細に説明される。設計は、開示された特定の実施形態に限定されず、逆に、特定の実施形態を使用するすべての修正、同等物、および代替形態を網羅することを意図していることを理解されたい。
【発明を実施するための形態】
【0022】
以下の説明では、本設計の完全な理解を提供するために、特定のデータ信号、名前のある構成要素、モデルの数などの例など、多くの特定の詳細を記述することができる。しかしながら、本設計が、これらの特定の詳細なしで実現できることは当業者には明らかであろう。他の事例では、本設計を不必要に曖昧にすることを避けるために、よく知られている構成要素または方法は、詳細に説明されず、ブロック図で説明される。さらに、第1のサーバなどの特定の数値参照を行うことができる。しかしながら、特定の数値参照は、文字通りの順序として解釈されるべきではなく、むしろ第1のサーバは第2のサーバとは異なると解釈されるべきである。したがって、記述されている特定の詳細は、単なる例示に過ぎない。具体的な詳細は、本設計と異なることがあるが、それでも本設計の主旨および範囲内にあると考えられる。「結合された」という用語は、構成要素に直接接続されているか、または別の構成要素を介して構成要素に間接的に接続されていることを意味すると規定される。
【0023】
ディープアダプティブセマンティックロジックネットワークなどの人工知能エンジンは、3D空間における分子構造をキャプチャするそのモジュールを備えた非常に柔軟なアーキテクチャを有する。例示的なディープアダプティブセマンティックロジックネットワークは、2018年5月8日に出願された「Deep Adaptive Semantic Logic Network」(ディープアダプティブセマンティックロジックネットワーク)と題されたPCT出願番号PCT/US18/31645に記載されており、その内容は参照によりその全体が本明細書に組み込まれる。
【0024】
全体として、本書は、読者にこの設計の理解を与えるために、モジュールにおける機械学習ネットワークによって実行される特定のタスクについて最初に論じる。後で、本書は、この設計がサポートおよび実行できる複数の例示的なタスクについて論じる。
【0025】
図1は、ユーザから、名前のない分子の目標特性のセットの入力を受け取り、その後、それらの目標特性のセットを有する可能性のある候補分子を出力することができる人工知能エンジンを備えたシステムの例示的な高レベル表現の図の実施形態を例示する。マルチパラメータ人工知能モデルは、人工知能エンジン100の一部として、構造生成段階において、モジュール(たとえば、一致比較モジュール、原子ベクトルモジュール、分子ベクトルモジュール、および3Dベクトル場モジュール)に、目標特性のセットを有する候補分子を提供することができる。その後、人工知能エンジン100は、その分子およびその構造を、原子と、目標特性のセットを有する候補分子を構成するそれらの構造とに、相関付け戻すことができる。候補分子は、ラベル付けされた分子、ラベル付けされていない分子、および/または、ラベル付けされていない分子と、ラベル付けされた分子との両方の組合せを含む分子のセット内の分子であり得ることに留意されたい。次に、目標特性のセットを有する候補分子を構成する原子とそれらの構造に対して、統合された合成および試験を実行して、目標特性のセットを有する、最適化された高性能分子を作成できるか否かを確認できる。
【0026】
図2は、分子を生成、試験、および予測するために、教師なしの可逆的な物理学ベースのベクトル表現を使用する人工知能エンジンを備えた、より詳細な例示的なシステムの図の実施形態を例示する。
【0027】
目標特性のセットを有する、名前のない分子のための目標特性のセットを直接検索するためのクエリを、人工知能エンジン100へ発行することができる。目標特性のセットを有していることを発見された1つまたは複数の候補分子の構造の表示は、1つまたは複数の機械学習アルゴリズムを適用することによって人工知能エンジン100を用いて生成される。3次元空間における目標特性のセットを満足することを発見された1つまたは複数の候補分子の構造の表示は、人工知能エンジン100への目標特性のセットを求めるクエリに応答してユーザに提供される。
【0028】
システムは、i)化学知識、ii)トレーニングデータとして使用できる、分子の幾何学的構造に関するデータなどの構造化データ、iii)トレーニングデータにおいて使用できる、化学文献からの抽出ツール、iv)分子設計/目標特性要件などの分子設計者からの入力、v)物理学ベースのシミュレーション、vi)合成計画プロセス、vii)自動化されたフロー合成および精製システム、viii)自動化された試験システム、およびix)最適化された高性能分子を生成するためのフィードバックループを含むことができる。これらの構成要素がすべて連携して、目標特性のセットから合成可能な化合物の設計を可能にする。
【0029】
トレーニングデータの抽出および強化は、i)公開データベース抽出、ii)たとえば、その分野の専門家からのマニュアル入力、iii)化学文献からの抽出、およびiv)人工知能エンジン100などからの以前の結果からの内部知識の利用などのいくつかのソースから得ることができる。
【0030】
物理学ベースのシミュレーション情報は、たとえば、分子に関する情報と、原子価および結合が分子特性にどのように影響するかなどを提供することができる。
【0031】
人工知能エンジン100は、分子特性を計算的に予測することができ、物理的な設計-製造-試験サイクルによって、反復数を低減することができる。これにより、合成化学者が、最適化された化合物に到達するために実行する必要のある反復回数を大幅に低減することができる。
【0032】
生成されたその幾何学的構造を有する候補分子は、フィードバックループを介して人工知能エンジン100の機械学習ネットワークにフィードバックされる、統合された合成および試験を経ることができる。したがって、合成および試験は、人工知能によって駆動される閉ループフィードバックで行うことができる。このプロセスにおける例示的なフィードバックループは、ユーザとともに開始できる。この例では、分子設計の専門家であるユーザは、所望される情報(たとえば、分子における目標特性のセット)を提供する。人工知能エンジン100およびそのトレーニングされたモジュールは、機械学習プロセスを適用して、1つまたは複数の候補分子およびそれらの構造を発見するのみならず、その後、候補分子を構成する原子およびそれらの構造を出力する。人工知能エンジン100の出力モジュールは、候補分子の表現を、合成計画プロセスモジュール(?)のみならず、自動化されたフロー合成および精製プロセスモジュール(?)にも提供する。候補分子は、自動化された試験を経て、その後、試験の結果を人工知能エンジン100に返し、モジュール内の人工知能モデルおよびそれらのネットワークを更新することができる。最終的に、このフィードバックループおよび設計プロセスにより、最適化された高性能分子を生成できる。
【0033】
図3は、目標特性のセットを満足する可能性が高いことを発見された候補分子を発見するための、例示的な人工知能エンジンの図の実施形態を例示する。
【0034】
人工知能エンジン100は、i)目標特性のセットを満足することを発見された第1の候補分子の構造の3次元ベクトル場を、ii)同じ3次元空間における1つまたは複数の原子からの原子ベクトルの構造を用いて再構築する。
【0035】
人工知能エンジン100は、多くの例を正確に捕捉し、その後、その知識を適用して、構造的な知識を、トレーニングされていない実際のおよび/または仮想の分子に拡張する構造ベースのルールを記述するロジックを有することができる。人工知能エンジン100は、部分1、部分2、および部分3を発生させる原子の例示的な官能基に対する所与の機能に関連付けられた分子の部分/パーツを認識することができる。(たとえば、図11を参照されたい)この例では、機械学習ネットワークを用いた部分認識を、分子の構造内の様々な原子の3つの異なる官能基に対応する例のリガンドモデルに適用する。
モジュールを含む人工知能エンジンのトレーニングと一般的な構築および動作
【0036】
図4は、分子の幾何学的構造の表現を生成することを含む複数の動作を行うようにトレーニングされた1つまたは複数の機械学習モデルを使用する2つ以上のモジュールから構成される例示的な人工知能エンジンの例示的なブロック図の実施形態を例示する。図5は、例示的な人工知能エンジンと、原子ベクトルモジュールおよび/または分子ベクトルモジュールへの直接入力を有する例示的なモジュールとの例示的なブロック図の実施形態を例示する。
【0037】
2つ以上のモジュールから構成される人工知能エンジン100の例示的な実施形態は、たとえば、分子ベクトルモジュールと、1つまたは複数の3Dベクトル場モジュールと、分子特性予測モジュールと、原子ベクトルモジュールと、原子特性モジュールと、原子および分子エンコーダモジュールのみならず、他のほとんどのモジュールへの入力経路を含むことができる入力モジュール104と、それらの出力を、たとえば表示画面上においてユーザに提示するために、他のほとんどのモジュールからの出力を収集する出力モジュールとを含むことができる。各モジュールのためのこれらの入力および出力は、ユーザが人工知能エンジン100内の機械学習の推論を理解するのに役立つ。
【0038】
入力モジュール104は、分子ベクトルモジュール、分子特性予測モジュール、および原子ベクトルモジュールと連携して、ユーザが、様々な情報を入力し(たとえば、図2を参照)、人工知能エンジン100に複数の動作を実行させることができるように、これらのモジュールが1つまたは複数の機械学習モデルを適用することを可能にする。たとえば、ユーザは、1)2つ以上の原子を入力し、分子特性予測モジュールにおける機械学習モデルに対して、2つ以上の原子によって形成された結果得られた候補分子の特性のセットを出力させるのみならず、2)ラベル付けされていない/名前のない分子の目標特性のセットの入力を提供し、機械学習モデルに対して、ラベル付けされていない分子の原子のセットおよび幾何学的構造を出力させる。モジュールは連携して、分析中の分子を構成する構造(のみならず、その逆に、所望される特性のセット)を調べ、その後、各構造および/または構造の組合せを、所与の分子内の同じまたは化学的に非常に類似した原子のセットと、その幾何学的構造とを含む、名前のある、または名前のない任意の分子のための結果をもたらす、または、結果をもたらす可能性が高い1つまたは複数の特性に相関付けることができる。
【0039】
一致比較モジュールは、原子ベクトル場を、3次元空間における分子ベクトル場と比較し、それらがほぼ同じであるときを判定するようにトレーニングされた機械学習モデルを有することができる。分子の幾何学的構造は、原子のセットと、3次元空間におけるそれらの配置とによって形成されることに留意されたい。(例示的な構造については、図7図8、および図11を参照されたい)。
【0040】
分子特性予測モジュールは、分子ベクトルモジュールと連携して、分子特性を分子ベクトル値に相互に相関付けるように構成される。
【0041】
原子特性モジュールは、原子ベクトルモジュールと連携して、原子特性を原子ベクトル値に相互に相関付けるように構成され、その結果、原子特性モジュールの出力層は、i)原子の識別情報と、ii)提供された原子ベクトル値の原子特性の値とを生成する。
【0042】
全体として、人工知能エンジン100は、1)複数の入力パラメータ機械学習モデル、および/または、2)複数の機械学習モデル(たとえば、このプロセスの段階ごとに1つ)のいずれかを構築およびトレーニングすることができる。
【0043】
モジュールは、それらのタスクについて、ニューラルネットワークなどの機械学習をトレーニングする必要がある。いくつかの特定のタスクを学習する必要がある。任意に、この人工知能エンジン100の原子側(段階1)での機械学習のトレーニング、その後、この人工知能エンジン100の分子側(段階2)での機械学習のトレーニング、その後、原子側の構造と分子側の構造との間の相関付け(段階3)での機械学習のトレーニングを論じることができる。
【0044】
原子側での機械学習に関する段階1のトレーニングは、原子の特性の、3次元空間における原子の構造への相互の相関付けを論じる。分子側での機械学習に関する段階2のトレーニングは、分子の特性の、3次元空間における特性を発生させる分子内の特定の構造への相互の相関付けを論じる。機械学習に関する段階3のトレーニングは、3次元空間における分子の構造の、原子のセットの1つまたは複数の構造への相互の相関付けと、3次元空間におけるそれらの配置とを論じる。
【0045】
図6は、3次元空間における分析中の分子の各空間に、分子セマンティック依存ベクトル場を有することによって、分析中の分子の構造的特性の値に対する、分析中の分子の例示的な分子特性の例示的なブロック図の実施形態を例示する。
【0046】
分子特性および分子の構造に関するいくつかの一般的な議論は、以下の通りであることに留意されたい。i)原子ベクトルモジュールと原子特性モジュールとの間のみならず、ii)分子ベクトルモジュールと分子特性予測モジュールとの間の機械学習は、これらの基本的な理論および関係の理解を有する。分子は、共有結合などによって、互いに対する特定の位置に、ともに保持された原子で、その原子の空間分布を伴う等によって構成される。その結果、各分子は、比較的定義された幾何学的構造を有する。分子内では、原子は3D空間にあり、分子を本質的に同じ原子で多次元的に形成することができる。たとえば、結合の回転である(たとえば、異なる原子が、異なる幾何学的配置で接続され、異なる結合角度が生じる可能性がある)。繰り返すが、異性体は、同じ分子式を有するが、同じ分子式に対して異なる分子特性を与える異なる分子幾何学的形状を有する分子の例示的なクラスである。
【0047】
分子の分子特性は、非常に大量の異なる特性を含むことができるが、いくつかの例示的な特性は、安定性、溶解性、毒性、阻害性、芳香族性、双極子モーメント、溶媒和、コンフォーマ、励起状態、分光学的特性(IR/UV)などを含むことができる。分子特性は、その分子の幾何学的構造に関連付けることができる。
【0048】
次に、図4を再び参照すると、人工知能エンジン100のモジュールにおいて、トレーニングの段階1~3における3つの基本的なタスクが、ニューラルネットワーク、長短期記憶ネットワーク、ディープビリーフネットワーク、ランダムフォレストなどの機械学習ネットワークによって学習された後、その後、複数の内部接続されたタスクを、人工知能エンジン100のモジュールにおける機械学習ネットワークにおいてトレーニングすることができ、この機械学習ネットワークによって学習することができる。段落0044におけるテキストは、トレーニング段階1~3を論じたが、次のテキストでは、トレーニングの追加の段階について論じることに留意されたい。たとえば、以下の段階4は、モジュールにおいて、1)原子のセットの入力を受け取り、その後、出力モジュールにおいて、2)i)3次元空間における分子の構造を含む、結果的に得られた分子、ii)結果的に得られた分子における原子の組成のみならず、iii)入力された原子のセットから結果的に得られた、結果的に得られた分子の特性の予測されたセットを出力する、機械学習ネットワークのトレーニングについて論じる。段階5は、モジュールにおいて、1)分子の入力を受け取り、その後、出力モジュールにおいて、2)i)3次元空間における各原子の配置/位置を含む分子について、結果的に得られた原子の組成と、ii)入力された分子から結果的に得られた、原子の各々、および/または、原子のグループ化のための特性のセットとを出力する、機械学習ネットワークのトレーニングについて論じる。段階6は、モジュールにおいて、1)原子特性のセットの入力を受け取り、その後、出力モジュールにおいて、2)i)3次元空間における分子の構造を含む、結果的に得られた分子、ii)結果的に得られた分子の原子の組成のみならず、iii)入力された原子特性のセットから結果的に得られた、結果的に得られた分子の特性のセットを出力する、機械学習ネットワークのトレーニングについて論じる。段階7は、モジュールにおいて、1)i)名前のない分子の所望/目標特性のセットの入力を受け取り、その後、出力モジュールにおいて2)、i)所望/目標の特性のセットを有する分子の、結果的に得られた原子の組成のみならず、ii)入力された所望/目標特性のセットから結果的に得られた、所望/目標特性を有する分子の3次元空間における各原子の配置/位置を出力する、機械学習ネットワークのトレーニングについて論じる。人工知能エンジン100をトレーニングすることができ、その後、実行することができる他の例示的な動作は、段階4~7における例から当然理解されるであろう。
【0049】
ステップ0。段階1および段階3の場合、入力モジュール104のユーザインターフェースを介して、ユーザは、原子特性の知られている値のみならず、3次元空間におけるその原子の知られている幾何学的構造を備えたトレーニング原子を、原子ベクトルモジュールに提供することができる。原子ベクトルモジュールは、データベース、化学文献、物理学シミュレータなどの情報ソースを参照して(たとえば、図2を参照)、3次元空間において学習中の原子の幾何学的配置を取得することもできる。いずれにせよ、原子ベクトルモジュールは、知られている原子を、ベクトル形式の3次元空間でのその原子の、知られている幾何学的配置で表現する。
【0050】
同様に、段階2および段階3の場合、知られている分子特性の値のみならず、3次元空間におけるその分子の知られている幾何学的構造を有するトレーニング分子を、入力モジュール104を介して、ユーザによって、分子ベクトルモジュールに最初に提供することができる。いずれにせよ、分子ベクトルモジュールは、知られている分子を、ベクトル形式の3次元空間でのその分子の、知られている幾何学的配置で表現する。同様に、分子ベクトルモジュールは、データベース、化学文献、物理学シミュレータなどの情報ソースを参照して(たとえば、図2を参照)、3次元空間において学習中の分子の幾何学的配置を取得することもできる。加えて、原子および分子エンコーダは、原子および分子の情報の提供を支援できる。
【0051】
ステップ1。原子側での機械学習に関する段階1のトレーニングは、原子の特性の、3次元空間における原子の配置/位置への相互の相関付けを論じる。
【0052】
原子ベクトルモジュールは、分析中の原子を、原子自体の識別情報のみならず、3次元空間における原子の知られている配置/位置(たとえば、幾何学的構造)を反映する、その原子の原子ベクトルに相関付けるように構成される。原子ベクトルモジュールは、原子と、3次元空間におけるその知られている配置/位置とを、その原子の原子ベクトル値に相互に相関付けるアルゴリズムを適用するように構成される。原子の例示的なベクトル値の一部は、3D平面における(X,Y,Z)座標/点(たとえば、3,5,7)を含むことができる。原子の例示的なベクトル値の一部は、炭素原子、酸素原子などの原子の識別情報を含むことができる。原子の例示的なベクトル値の一部は、単結合炭素原子、二重結合炭素原子、結合角など、他の原子に関する他の幾何学的構造情報を含むことができる。
【0053】
原子ベクトルモジュールは、原子特性モジュールと連携するように構成される。原子特性モジュールは、原子を、その原子の原子特性の値に相関付けるように構成される。原子特性モジュールは、学習中の原子を、その原子の原子特性の値に相関付けるように学習する、ニューラルネットワーク、長短期記憶ネットワーク、ディープビリーフネットワークなどの機械学習ネットワークをAIモデルに有することができる。原子ベクトルモジュールは、学習中の原子に対して、原子自体の識別情報のみならず、原子特性モジュールに対する3次元空間における原子の知られている位置/配置を反映する、その原子の原子ベクトルを提供する。トレーニングのために、原子ベクトル値から、i)学習中の原子の識別情報が知られるのみならず、ii)3次元空間における原子の配置/位置も知られる。機械学習モデルの入力層には、学習中の原子の原子ベクトル値がフィードされ、たとえば、学習中の原子に関連付けられたすべての潜在的な特性について、原子のトレーニングデータとそれらの原子特性からなる2,000万の例が、原子特性に関連付けられた値と同様に学習される。機械学習モデルは、教師なし学習アルゴリズムを適用して、分類されていないおよびラベル付けされていないデータを使用するように展開されたときに、トレーニングおよび/または分析を行うことができ、教師なし学習アルゴリズムは、データからパターンを明らかにすることを試みる。機械学習モデルは、教師あり学習アルゴリズムを適用して、例を用いて、各例のラベルまたは目標とともに、教師あり学習を使用するように展開されたときに、トレーニングおよび/または分析を行うことができる。データにおけるラベルは、学習アルゴリズムが、特徴を相関付けるのに役立つ。機械学習ネットワークは、強化学習のいくつかの形態をトレーニングして、その後使用することもできる。実施形態では、トレーニング中、専門家の知識/規則または制約は適用されない。むしろ、人工知能エンジン100は、ラベル付けされていないトレーニングデータと、制約のない統計的なデータ駆動型学習に基づいて、複数入力の機械学習モデル(ニューラルネットワークを含む)、および/または、最初にトレーニングされた複数の機械学習モデルを構築するように構成され、トレーニングで使用される単なる例を超えた、原子および/または原子のグループと可能な分子のパターンの、より良好な認識を可能にする。
【0054】
機械学習ネットワークによる学習は、3次元空間におけるその幾何学的構造を有する原子の正確な特性および値が、学習中の原子の知られている目標値であるので、行うことができる。したがって、特性の目標値は知られており、機械学習モデルは、すべての原子特性のこれらの目標値を予測する。したがって、機械学習モデルにおけるネットワークの係数と特徴の重みは、原子特性モジュールが、学習中の原子の特性とその値を予測する際に非常に高い精度を達成するまで調節される。トレーニングは、原子特性モジュールにおける機械学習モデルが、電荷、原子価など、3次元空間においてその幾何学的構造を有する原子(たとえば、学習中の原子のみならず、3次元空間において類似の幾何学的構造を有する任意の他の原子)のすべての特性の正確な値を生成できるようになるまで継続する。例から、機械学習ネットワークは、パターンを識別および認識できる。したがって、機械学習モデルは、パターン、パラメータ、値を認識し、その後、それらのパターン、パラメータ、値に関連付けられた効果を予測するように学習する。機械学習モデルは、当然、この理解を、トレーニングされていない可能性のある類似の構造パターンを有する原子に、特徴的に一般化することができる。
【0055】
各トレーニング原子について、トレーニング中の原子ベクトルは、その後、たとえば、機械学習モデルのニューラルネットワークが、ラベル付けされた、および/または、ラベル付けされていないトレーニング原子の実際に知られている値を正確に予測できるまで、原子ベクトルモジュールから原子特性モジュールを介して反復的にフィードされる。原子ベクトルおよび原子特性を、特定の原子の原子特性の知られている値とともにトレーニングすることができる。人工知能エンジン100のこのパートは、人工知能エンジン100が展開中のとき、その後、分析中の原子および/または原子の官能基からの原子ベクトル値を、すでにトレーニングされた原子特性モジュールに適用できるようにトレーニングされる。その後、すでにトレーニングされた原子特性モジュールは、炭素原子など、これがどのタイプの原子であるかを含む、原子特性の知られている値と、3D空間におけるその幾何学的構造(たとえば、3D平面におけるX,Y,Z座標/点、原子価結合のタイプ、結合角度など)を含むその炭素原子について知られている他の特性とを正確に予測する。展開中、すでにトレーニングされた原子特性モジュールと、原子ベクトルモジュールとは、相互に相関する。トレーニングされた原子特性モジュールおよび原子ベクトルモジュールの例示的な使用は、特性付きの分子の案出に役立つように、それらを3Dベクトル埋込空間に適用することに留意されたい。1)所望される原子特性の入力は、トレーニングされた原子特性モジュールの入力層に提供でき、原子ベクトル値モジュールの出力層は、それらの所望される原子特性を有する(原子と、3D空間におけるその幾何学的構造とを伝える)原子ベクトル値を生成する。2)3D空間における1つまたは複数の原子の幾何学的配置を伝える1つまたは複数の原子および/または原子ベクトル値を、原子ベクトル値モジュールの入力層に提供でき、トレーニングされた原子特性モジュールの出力層は、原子と、入力された原子の原子特性の値および/または原子ベクトル値とを生成する。
【0056】
ステップ2。分子側の機械学習に関する段階2のトレーニングは、分子の特性と、3次元空間における分子の構造との相互の相関付けを論じる。
【0057】
分子ベクトルモジュールは、分析中の分子を、分子自体の識別情報のみならず、3次元空間における分子の知られている幾何学的構造をも反映する、その分子の分子ベクトルに相関付けるように構成される。分子ベクトルモジュールは、分子と、3次元空間におけるその知られている幾何学的構造とを、その分子の分子ベクトル値に相互に相関付けるように構成される。
【0058】
分子の特性の3次元空間における分子の構造への相互の相関付けは、原子の段階1と同様にトレーニングおよび構築されるが、代わりに分子を使用する。
【0059】
分子ベクトルモジュールは、分子特性予測モジュールと連携するように構成される。
【0060】
繰り返すが、構成要素に関して、分子特性予測モジュールは、分子をその分子の分子特性の値に相関付けるように構成される。分子特性予測モジュールは、学習中の分子をその分子の分子特性の値に相関付けるように学習する、ニューラルネットワーク、長短期記憶ネットワーク、ディープビリーフネットワークのような機械学習ネットワークを、AIモデルに有することができる。分子特性予測モジュールは、分子ベクトルと連携して、分析中の分子の分子ベクトルを、この分子の目標特性にマッピングするように学習する。
【0061】
トレーニングにおいて、3次元空間においてその幾何学的構造を有する分子の正確な特性および値は、学習中の分子の知られている目標値であるため、学習を行うことができる。したがって、特性の目標値は知られており、機械学習モデルは、分子のすべての特性のこれらの目標値を予測する。したがって、機械学習モデルにおけるネットワークの係数および特徴の重みは、特性予測モジュールが、学習中の分子の特性とそれらの値を予測する際に、非常に高い精度を達成するまで調節される。たとえば、ニューラルネットワークなどの機械学習モデルの特性予測子のトレーニングは、分子ベクトル値から、ラベル付けされたトレーニング分子の実際に知られている値を正確に予測できるまで継続する。このトレーニングの後、このAIモデルにおけるニューラルネットワークのすべての重みがロックダウンされる。トレーニングは、特性予測モジュールにおける機械学習モデルが、溶解性、毒性など、3次元空間においてその幾何学的構造を有する分子(たとえば、学習中の分子のみならず、3次元空間において類似の幾何学的構造を有する任意の他の分子)のすべての特性の正確な値を生成できるまで継続する。繰り返すが、機械学習の特徴である機械学習モデルは、パターンを、その後、それらのパターンに関連付けられたパラメータ、値、および効果を認識するように学習する。分子内の構造パターンの認識に関する図8の議論を参照されたい。機械学習モデルは、当然、この理解を、トレーニングされていない可能性のある類似の構造パターンを有する分子に特徴的に一般化することができる。各トレーニング分子について、トレーニング中の分子ベクトルは、たとえば、機械学習モデルのニューラルネットワークが、ラベル付きのトレーニング分子の実際に知られている値を正確に予測できるまで、分子特性予測モジュールを介して、分子ベクトルモジュールから反復的にフィードされる。システムのこのパートは、AIエンジンが展開中のとき、分析中の分子からの分子ベクトル値を、すでにトレーニングされた特性予測モジュールに適用できるようにトレーニングされる。その後、すでにトレーニングされた特性予測モジュールは、その分子の3D空間における幾何学的構造であるものを含む特性の、知られている値を正確に予測する。展開中、すでにトレーニングされた分子特性予測モジュールと、分子ベクトルモジュールとは、相互に相関する。1)所望される分子の特性の入力は、トレーニングされた分子特性予測モジュールの入力層に提供でき、分子ベクトルモジュールの出力層は、それらの所望される分子の特性を有する(分子と、3D空間におけるその幾何学的構造とを伝える)分子ベクトル値を生成する。2)分子エンコーダを介して、分子を、および/または、3D空間における分子の幾何学的構造を伝える分子ベクトル値を、原子ベクトル値モジュールの入力層に提供でき、トレーニングされた分子特性予測モジュールの出力層は、知られているのであれば、分子と、入力された分子の分子特性の値および/または分子ベクトル値を生成する。
【0062】
ステップ3。機械学習に関する段階3のトレーニングは、3次元空間における分子の構造の、3次元空間における原子の構造への相互の相関付けを論じる。
【0063】
一致比較モジュールは、3次元場を使用して、原子埋め込みを、分子埋め込みに結合する。3Dベクトル場モジュールは、3Dベクトルアルゴリズムを、原子ベクトル値に適用して、3D空間にセマンティックベクトル場を生成する。一致比較モジュールは、3Dベクトル場モジュールおよび原子ベクトルモジュールと連携して、3D空間におけるすべてのポイントにおいて、学習中の原子の特性ベクトルを生成する。これは、学習中の原子に対する原子の埋め込みを作成する。学習中の各原子に対して、反復的に、一致比較モジュールは、3Dベクトル場モジュールおよび原子ベクトルモジュールと連携して、3D空間におけるすべてのポイントにおいて、学習中の各原子の特性ベクトルを生成する。
【0064】
次に、3Dベクトル場は、分子ベクトルモジュールおよび一致比較モジュールからの分子ベクトルと連携して、3D空間において、学習中の分子の特性ベクトルを生成する。学習されたすべての原子のすべてのベクトルが、一致比較モジュールによって理解された後、一致比較モジュールは、機械学習アルゴリズムを用いて、1つまたは複数の原子ベクトル場106を、3D次元空間における分子ベクトル場と比較し、それらがほぼ同じであるか否かを判定するように、トレーニングすることができる。分子の構造は、3D次元空間における原子によって形成されることに留意されたい。1つまたは複数の3Dベクトル場モジュールは、分子ベクトル値および原子ベクトル値を変換し、これらの値が、同じ3D空間および座標空間で比較されるようにする。したがって、一致比較モジュール、分子ベクトルモジュール、および3Dベクトル場モジュールは、一致比較モジュールの機械学習モデルにおけるネットワークが、分子ベクトル場を、対応する原子ベクトル場106に繰り返し正確に合致できるまで、学習中の分子のために、3D空間に分子ベクトル場を提供するために反復的に連携する。
【0065】
人工知能エンジン100の各段階(たとえば、対応するモジュールとの一致比較モジュールの連携、原子ベクトルモジュールとの原子特性モジュールの連携、分子ベクトルモジュールとの分子特性予測モジュールの連携、および原子ベクトルモジュールおよび分子ベクトルモジュールを備えた原子および分子エンコーダは、一致比較モジュールの機械学習のトレーニング中、たとえば、ベクトル空間における代表的な分子の少なくとも200万の例を実行する。
【0066】
これら3つの段階のトレーニングは、すべて並行して行うことができる。この後、トレーニング中および動作のために展開されたとき、3つの段階が連携して機能するには、もう少しトレーニングが必要である。
【0067】
ステップ4。モジュールをトレーニングして(したがって、その後、展開された場合)、1)原子および分子エンコーダを介して、原子のセットの入力を受け取り、その後、2)分子特性予測モジュールからのi)結果的に得られた分子と、ii)結果的に得られた分子における原子の組成と、iii)3次元空間における分子の構造を含む、結果的に得られた分子の特性のセットと、iv)入力された原子のセットから結果的に得られた、これら3つの任意の組合せとを、出力モジュールに提示することができる。
【0068】
ラベル付けされていない、またはラベル付けされた原子のセットを、原子および分子エンコーダモジュールを介して、および原子ベクトルモジュールを通って、原子特性モジュールに入力することができる。各モジュールは、上記で論じられたように、そのトレーニングおよび/またはコード化された機能を実行する。原子特性モジュールは、入力された原子の原子特性の知られている値を出力する。一致比較モジュール、3Dベクトル場モジュール、および原子ベクトルモジュールは、すべての原子ベクトル値に対してセマンティック3Dベクトル場を作成する。分子ベクトルモジュール、および3Dベクトル場、および一致比較モジュールは、勾配降下などの学習アルゴリズムを介して反復的に連携し、3D空間において原子ベクトル場106とほぼ合致する(たとえば、一致する)分子ベクトル場108を有する1つまたは複数の分子、したがって、1つまたは複数の合致する分子ベクトル値を判定する。分子ベクトルモジュールは、3D空間における原子ベクトル場106と合致する候補分子の分子ベクトル値を、特性予測モジュールに入力し、特性予測モジュールは、入力された原子から結果的に得られた分子の、および/または、結果的に得られた可能性のある分子の分子特性が何であるかを出力する機能を実行する。
【0069】
ステップ5。モジュールを介したリバースフローにおいて、モジュールをトレーニングして(したがって、その後、展開された場合)、1)原子および分子エンコーダを介して、分子の入力を受け取り、その後、2)原子特性モジュールからのi)その分子のための原子の、結果的に得られた組成と、ii)3次元空間における各原子の配置/位置を含む、原子の各々の特性のセットと、iii)入力された分子から結果的に得られた、これら2つの任意の組合せとを出力モジュールに提示することができる。
【0070】
ステップ6。モジュールをトレーニングして(したがって、その後、展開された場合)、1)原子特性モジュールへの原子特性のセットの入力を受け取り、その後、2)分子特性予測モジュールからのi)結果的に得られた分子と、ii)結果的に得られた分子の原子の組成と、iii)3次元空間における分子の構造を含む、結果的に得られた分子の特性のセットと、iv)入力された原子特性のセットから結果的に得られた、これら3つの任意の組合せとを出力モジュールに提示することができる。
【0071】
ステップ7。モジュールをトレーニングして(したがって、その後、展開された場合)、1)分子特性予測モジュールへの分子の所望/目標特性のセットの入力を受け取り、その後、2)原子特性予測モジュールからのi)所望/目標の特性のセットを有する分子の、結果的に得られた原子の組成と、ii)所望/目標特性を有する分子の3次元空間における各原子の配置/位置と、入力された所望/目標特性のセットから結果的に得られた、これら2つの任意の組合せとを、出力モジュールに提示することができる。
【0072】
これら3つの段階が連携して動作するためのトレーニングが完了すると、その後、それらの機能を連携的に実行するようにトレーニングおよびコード化された人工知能エンジン100およびそのモジュールを、現場で使用するために展開することができる。
追加の詳細および例
【0073】
すでにトレーニングされた人工知能エンジン100は、分子の目標特性に対する逆設計を含む動作を実行するための入力モジュール104を有する。入力モジュール104は、ユーザインターフェースおよび/またはAPIを介して、ユーザによる1つまたは複数の目標分子特性を受け入れ、人工知能エンジン100のトレーニングされたモジュールが連携して、以下の例示的な動作のいずれかを実施することを要求するように構成される。一例では、入力モジュール104は、情報を、原子および分子エンコーダに、原子ベクトルモジュールに直接、および/または分子ベクトルモジュールに直接、原子特性モジュールおよび/または分子特性予測モジュールに直接、およびこれらの任意の組合せに提供することができる。
【0074】
展開中、人工知能エンジン100および人工知能エンジン100のモジュールにおけるその1つまたは複数のすでにトレーニングされた機械学習モデルは、以下の4つの動作A~Dのような例示的な動作を実行することができる。
【0075】
A.展開中、人工知能エンジン100において実施される例示的な機械学習プロセスは、以下のようであることができる。
【0076】
第1のアプローチでは、1)入力モジュール104は、ラベル付けされていない分子の所望/目標特性のセットの入力を、ユーザから受け取ることができ、この入力は、達成すべき出力目標として、分子特性予測モジュールに提供され、2)分子ベクトルモジュールは、ラベル付けされていない分子に、提供された目標特性を満足する1つまたは複数の候補分子ベクトル値が発見されるまで、候補分子ベクトル値を、特性予測モジュールに反復的に提供するようにトレーニングされ、その後、3)原子特性モジュールは、i)所望/目標の特性のセットを有する可能性があると発見された分子に関する原子の、結果的に得られた組成と、ii)所望/目標特性を有すると発見された分子に関する3次元空間における各原子の配置/位置の表示と、iii)入力モジュール104に入力された所望/目標特性のセットから結果的に得られた、これら2つの任意の組合せとを出力モジュールに提供するように構成される。ラベル付けされていない分子の現在の識別情報または組成は、人工知能エンジン100に提供されないことに留意されたい。
【0077】
別のアプローチでは、1)入力モジュール104は、分子特性予測モジュールに直接提供される、ラベル付けされていない分子の所望/目標特性のセットの入力をユーザから受け取ることができ、2)リバースフロープロセスは、特性予測モジュールを介して、ラベル付けされていない分子のために提供された目標特性を満足する1つまたは複数の分子を発見する際に適応プロセスを開始するために、1つまたは複数の候補分子ベクトル値を生成し、その後、3)原子特性モジュールは、i)所望/目標の特性のセットを有する可能性があると発見された分子に関する原子の、結果的に得られた構成と、ii)所望/目標の特性を有すると発見された分子に関する3次元空間における各原子の配置/位置の表示と、iii)入力された所望/目標特性のセットから結果的に得られた、これら2つの任意の組合せとを出力モジュールに提供するように構成される。このアプローチでは、情報のリバースフローが分子特性予測モジュールで発生し、分子特性予測モジュールは、分子ベクトルモジュールと連携して、開始点として目標特性のセットのすべてではないが、ほとんどを含む初期候補分子ベクトル値を提供できる。
【0078】
第1のアプローチでは、プロセスのロジックフローは、以下の通りとなることができる。入力モジュール104は、(その現在の識別情報または組成は、人工知能エンジン100に提供されていない)ラベル付けされていない分子の所望/目標特性のセットの入力を受け取ることができる。
【0079】
分子の局所的構造は、入力された特徴から埋め込みへのマッピングを学習するのではなく、可能な埋め込みを反復的に実行する機械学習アルゴリズムを使用することにより、目標特性の基準を満足する1つまたは複数の埋め込みを検索する人工知能エンジン100のアプローチを使用することによって取得することができる。
【0080】
人工知能エンジン100における機械学習モデルは、分子ベクトル値の初期候補を用いて開始することができる。
【0081】
分子ベクトルモジュールは、i)専門家(たとえば、化学者)の直感、内部知識の相互参照、ii)以前に試験されたデータベース、および/または、分析中の分子の1つまたは複数の目標特性に相関付けられた学習済みの分子ベクトル値、およびiii)たとえば、物理学および化学の文献のような他の知識ソースのような多くの要因に基づいて、分子ベクトル値の初期候補を提供することができる。ユーザはまた、分子ベクトルモジュールと連携する原子および分子エンコーダを介して、分子ベクトル値にエンコードされた、初期候補分子をマニュアルで入力し得ることに留意されたい。
【0082】
人工知能エンジン100における機械学習モデルは、ラベル付けされていない分子の目標特性のセットを達成/満足する、1つまたは複数の分子ベクトル値を発見することができる。分子ベクトルモジュールは、各候補分子ベクトル値を、すでにトレーニングされた分子特性予測モジュールにフィードし、分子特性予測モジュールは、結果的に得られた分子と、その構造に基づいて結果的に得られた分子の特性とを出力する。結果的に得られた分子と、その結果的に得られた分子の特性とが、ユーザによって発行されたラベル付けされていない分子の目標特性のセットを満足/達成しているか否かを確認するための比較を行うことができる。人工知能エンジン100は、初期候補分子ベクトル値を用いて開始し、候補分子ベクトル値の1つまたは複数の事例が、ラベル付けされていない分子の目標特性のセットを達成/満足するまで、分子ベクトル値を適応させるように構成される。繰り返すが、人工知能エンジン100は、分子ベクトルモジュールを介して分子ベクトル値を反復的に作成し、その特徴の重みおよび係数がロックダウンされてすでにトレーニングされている分子特性予測子に発行することによって、初期候補分子ベクトル値から分子ベクトル値を適応させることができる。分子ベクトルモジュールおよび分子特性予測子は、たとえば、勾配降下などの反復を介して、分子ベクトル値の事例を適応させることができる。ラベル付けされていない分子の目標特性を満足/達成する分子ベクトル値を発見するための機械学習プロセス中に、人工知能エンジン100は、分子ベクトル値が、ラベル付けされていない分子の目標特性を達成/満足することを発見されるまで、化学知識および他の形態の知識を考慮に入れて、分子ベクトル値の事例を適応させるための制約として機能することができる。ここで、人工知能エンジン100における機械学習モデルが、目標特性を達成できるラベル付けされていない分子の分子ベクトル値を発見したので、機械学習プロセスは、次の段階に進み得る。
【0083】
人工知能エンジン100は、ラベル付けされていない分子の目標特性を満足することを発見された分子の3Dベクトル場を生成できる。所望の目標特性を達成するラベル付けされていない分子の候補分子ベクトル値が発見されると、3Dベクトル場モジュールは、所望の目標特性を達成するラベル付けされていない分子の分子ベクトル値を、分子ベクトルモジュールから、3D空間におけるベクトル場に、変換およびマッピングするように構成される。
【0084】
次に、原子ベクトルモジュールと3Dベクトル場とが連携して、3D空間におけるすべての点において特性ベクトルを生成する。一致比較モジュールは、原子ベクトル場106を、3次元空間における分子ベクトル場108と比較し、それらがほぼ同じであるか否かを判定するために、機械学習アルゴリズムを用いてすでにトレーニングされている。分子の構造は、3次元空間において、原子によって形成されることに留意されたい。
【0085】
3Dベクトル場は、原子ベクトル値および/または分子ベクトル値と連動して、これらのベクトル値を、同じ3D座標空間に配置するように構成される。これは、3次元空間に原子を配置し、それらの埋め込みを投影して、連続的な3次元埋め込みベクトル場を生成することにより、分子の全体的な構造をキャプチャする。一致比較モジュールは、分子ベクトルを原子ベクトルにマッピングし、それらがほぼ同じになるようになる方法を学習するために、特徴の重みおよび係数がロックダウンされた機械学習アルゴリズムを用いてすでにトレーニングされている。たとえば、一致比較モジュールにおける機械学習モデルは、候補分子の分子ベクトルを、まったく同じ3D空間における5つのベクトルなど、Xを超える量のベクトルの分子と比較できる(たとえば、図8を参照されたい)。
【0086】
人工知能エンジン100は、合致する原子ベクトル値を発見できる。人工知能エンジン100が、ラベル付けされていない分子のセマンティック分子ベクトル場を作成すると、一致比較モジュールと原子ベクトルモジュールとが連携して、3D空間において、ラベル付けされていない分子の分子ベクトル場108に合致する原子の原子ベクトル値を発見できる。その後、一致比較モジュールと原子ベクトルモジュールとが連携して、原子埋め込みを学習し、分子ベクトル場108の埋め込みを再構築する。
【0087】
原子ベクトルモジュール、3Dベクトル場モジュール、および一致比較モジュールは、連携して、反復的な機械学習プロセスを実行して、3D空間において、分子ベクトル場108とほぼ一致する1つまたは複数の候補原子ベクトル場106を発見する。原子ベクトルモジュールは、候補原子ベクトル値を設定し、たとえば、目標特性のセットを有する分子ベクトル値から、3D空間におけるセマンティックベクトル場に合致するように少なくとも接近する原子ベクトル値が発見されるまで、勾配降下反復を使用できる。原子ベクトルの候補事例を用いた機械学習は、3D空間における目標特性のセットを満足する、ラベル付けされていない分子からの分子ベクトルとほぼ合致する、特定の原子ベクトル値を学習する。これは、ラベル付けされていない分子の全体的な構造をキャプチャする。
【0088】
機械学習の異なる段階は、構造に関する事前の知識を組み込むことができることに留意されたい。展開中、化学者の直感、物理学の知識、および物理的な知識が、化学者の直感の制約、および物理学の知識の制約に適合するように、学習された原子ベクトル構造およびサブ構造間の関係を一致3D空間における分子ベクトルに適応させるための制約として機能することができる。化学者の直感、物理学の知識、および物理的な知識は、たとえば、開始するための原子ベクトルの初期事例を選択するのに役立ち、この知識に基づいて、原子ベクトル値のランダムな事例よりも合致する可能性が高くなる。化学者の直感、物理学の知識、および物理的な知識は、ルールが高速化され、分子ベクトルにほぼ合致するこれらの原子ベクトル値の機械学習に焦点を合わせるときに、記述された制約として機能することもできる。
【0089】
実施形態では、一致比較モジュールおよび原子ベクトルモジュールは、原子ベクトル表現および分子ベクトル表現を、機械学習モデルによって理解可能なネットワークにグラフ化することができる化学者の直感および物理的な知識に適合するように適応させる。
【0090】
次に、3D空間における分子ベクトルと合致する原子の原子ベクトル値が発見された。その後、原子ベクトルモジュールは、原子ベクトル値を、すでにトレーニングされた原子特性モジュールにフィードする。原子特性モジュールは、原子ベクトル値を、原子特性にマッピングする。原子特性モジュールは、i)所望/目標の特性のセットを有する可能性があると発見された分子に関する原子の、結果的に得られた配置と、ii)所望/目標の特性を有する分子に関する、3次元空間における各原子の配置/位置の表示と、iii)入力された所望/目標特性のセットから結果的に得られた、これら2つの任意の組合せとを、出力モジュールに提示するように構成される。
【0091】
これらの人工知能の方法は、新しい化合物を生成できる。人工知能エンジン100は、ユーザが何を目標にしたいかによって決定されるそのような特性を有する、ラベル付けされていない分子の埋め込みを直接検索することができる。これ自体により、人工知能エンジン100を、教師なしにする(すなわち、ラベル付けされていないデータから学習する)ことができる。人工知能エンジン100のモジュールは、連携して、その分子の局所的構造および全体的構造の両方で、ユーザの目標特性を満足すると発見された分子の表現を提示することができ、しかも、その分子は、ラベル付けされていない分子から学習することができる。
【0092】
B.モジュールは、連携して、1)原子特性予測モジュールへの原子特性のセットの入力を受け取り、その後、2)分子特性予測モジュールからのi)結果的に得られた分子と、ii)結果的に得られた分子の原子の組成と、iii)3次元空間における分子の構造を含む、結果的に得られた分子の特性のセットと、iv)入力された原子特性のセットから結果的に得られた、これら3つの任意の組合せとを、出力モジュールに提示する動作を実行することができる。
【0093】
モジュールは、本明細書でトレーニングされ、論じられたものと同様に動作する。しかしながら、情報のフローは、原子特性モジュールにおいて開始し、その後、原子ベクトルモジュールを通って、3Dベクトル場モジュールへ、さらには一致比較モジュールまで上がり、3Dベクトル場モジュールおよび分子ベクトルモジュールまで下がり、最後に分子特性予測モジュールを通る。
【0094】
C.モジュールは連携して、1)i)原子および分子エンコーダを介して、または、ii)ユーザによってマニュアルで原子ベクトルモジュールへ直接提供された原子のセットの入力を受け取り、その後、2)分子特性予測モジュールからのi)結果的に得られた分子と、ii)結果的に得られた分子における原子の組成と、iii)3次元空間における分子の構造を含む、結果的に得られた分子の特性のセットと、iv)入力された原子のセットから結果的に得られた、これら3つの任意の組合せとを、出力モジュールに提示する動作を実行することができる。
【0095】
モジュールは、本明細書でトレーニングされ、論じられたものと同様に動作する。しかしながら、情報のフローは、原子特性モジュールにおいて開始し、その後、原子ベクトルモジュールを通って、3Dベクトル場モジュールへ、さらには一致比較モジュールまで上がり、3Dベクトル場モジュールおよび分子ベクトルモジュールまで下がり、最後に、分子特性予測モジュールを通る。
【0096】
D.モジュールを介したリバースフローにおいて、モジュールは連携して、1)i)原子および分子エンコーダを介して、またはii)分子ベクトルモジュールにマニュアルで、分子の入力を受け取り、その後、2)原子特性モジュールからのi)その分子のための原子の、結果的に得られた組成と、ii)3次元空間における各原子の配置/位置を含む、原子の各々の特性のセットと、iii)入力された分子から結果的に得られた、これら2つの任意の組合せとを、出力モジュールに提示する動作を実行できる。
【0097】
モジュールは、本明細書でトレーニングされ、論じられたものと同様に動作する。しかしながら、情報のフローは、分子ベクトルモジュールにおいて開始し、3Dベクトル場モジュールへ、さらには一致比較モジュールまで上がり、3Dベクトル場モジュールおよび原子ベクトルモジュールまで下がり、最後に原子特性モジュールを通る。
【0098】
図7は、原子ベクトルを3次元空間にマッピングするために、3Dベクトル場モジュールなどの1つまたは複数のトランスフォーマと連携するように構成された例示的な原子ベクトルモジュールの図の実施形態を示す。
【0099】
機械学習アルゴリズムは、主張された関係を満足するために、原子および/または原子のセットを構成するオブジェクトにベクトルを割り当てることができる。ベクトルは、たとえば、酸素原子と、隣接する炭素原子との間に二重結合が存在することを示すことができる。位置b+c+dにおける窒素原子、酸素原子、および炭素原子間に単結合が存在する。単結合(a)および二重結合(a)は、「a」における原子(たとえば、炭素)への結合を指すことに留意されたい。窒素原子、第1の炭素原子、および第2の炭素原子などの各原子は、ベクトルで表されるオブジェクトとして取り扱うことができる。ベクトルは、一連の数字またはシンボルであることができる。たとえば、ベクトル値(3,5,7)は、3D空間における点(たとえば、X,Y,Z座標)を示す(たとえば、図8参照)。
【0100】
次に、人工知能エンジン100は、たとえば、専門家の知識に基づいて構造化されたニューラルネットワークを構築し、その後、経験的データに基づいてニューラルネットワークをトレーニングすることができる。人工知能エンジン100は、構築されたニューラルネットワークにおけるノードに、論理演算子を使用できる。人工知能エンジン100は、ニューラルネットワークにおけるサブネットワークとして表される関係を有することができる。
【0101】
図8は、分子は3次元オブジェクトであり、その3次元空間内の原子の配置であるので、分子ベクトルに対する原子ベクトルの適切な比較を可能にするために、同じ座標系を用いた、原子ベクトルの3次元空間へのマッピングのみならず、分子ベクトルから3次元空間へのマッピングをも示す。この例では、候補分子のセマンティックベクトル場と、その幾何学的構造とが表示される。3D空間におけるすべての(x,y,z)ベクトル点は、原子ベクトルの、距離に依存する合計を取得できる。3D空間における各ベクトル点が表示される。機械学習モデルは、最も近い原子への参照に基づいて、3D空間から2D表面を選択し得る。一例では、機械学習モデルは、類似性によってベクトルを色にマッピングする。
【0102】
機械学習モデルは、分子ベクトルと、原子ベクトル間のそれらの3D関係とをエンコードするようにトレーニングされた。
【0103】
機械学習モデルは、空間における分子ベクトルを、原子によって生成された原子ベクトルと比較することによって、空間における分子ベクトル(およびその逆)を再構築するようにトレーニングされた。原子ベクトル場106を作成するとき、(x2,y2,z2)座標などの原子ベクトル値の一部は、原子を3次元空間に投影するのに役立つ。
【0104】
機械学習モデルは、たとえば、5つの別個の例示的な原子および/または炭素原子、酸素原子、窒素原子、および他の原子のセットを、原子ベクトル値から構築された原子ベクトル場106にマッピングする。機械学習モデルは、例示的な分子およびその分子ベクトル場(炭素、酸素、窒素などを有する)を、例示されるように5つの別個の例示的な原子および/または原子のセットにマッピングする。このようにして、(原子および/または原子のセットで構成される)分子は、原子ベクトル場106とほぼ一致する分子ベクトル値から再構築される。この例では、第1、第3、および第5のボックスにおける原子ベクトルは、原子ベクトルから分子ベクトルにほぼ正確に合致するのみならず、第2および第4のボックスは、同じ原子を有するが、3D空間における分子ベクトルと原子ベクトルとは異なる。この場合、比較はまだ大まかに一致するため、ほぼ同じであることに留意されたい。
【0105】
繰り返すが、一致比較モジュールは、勾配降下などの機械学習アルゴリズムを使用して、原子ベクトル場106の事例を、3D次元空間における分子ベクトル場と(および逆に、分子ベクトル場を、原子ベクトル場106と)反復的に比較し、それらがほぼ同じであるか否かを判定するようにトレーニングされた。繰り返すが、3次元空間において原子によって形成される分子の構造は、3次元空間における原子ベクトルと比較される。
【0106】
一致比較モジュールにおける機械学習ネットワークは、分子ベクトルに対する原子ベクトルの比較を調べるようにトレーニングされ、その後、3次元空間におけるこれら2つのベクトルの潜在的な正の一致として緩い合致を含む。したがって、分子ベクトルに対する原子ベクトルの緩い大まかな合致は、(正確な合致の必要はなく)満足できるものとすることができる。これは、一致比較モジュールが、セマンティックベクトル空間において、未知の何か(所望される目標特性のセットを有する必要がある仮想の分子など)を判定するのに役立つ。原子ベクトルおよび分子ベクトルのセマンティックベクトル場は、ほぼ同じ(大まかに同じ近傍)であることができ、これは、ほぼ同じ分子特性を有することを意味する。
【0107】
一実施形態では、一致比較モジュールにおける機械学習ネットワークは、画像化アルゴリズムを使用して、2つのベクトル場の間で、たとえば5点のような、「X」量のベクトル点を合致させて、それらがほぼ合致するか否かを確認できる。たとえば、比較されたベクトル点の大部分が合致し、残りが近傍に近い場合、原子ベクトルは分子ベクトルとほぼ合致すると見なされる。
【0108】
図9は、少なくとも化学の専門家からの情報を含む、1つまたは複数の知識ソースから情報を受け取り、提供して、情報によって作成された制約に適合させるために、1つまたは複数の制約として機能して、原子ベクトル場106と一致する候補分子ベクトル場を発見するように機械学習を適応させるように構成された例示的な入力モジュールの図の実施形態を例示する。
【0109】
化学者は、リング構造が存在する必要がある、および/または、互いに対する特定の幾何学的関係が存在する必要がある、および/または、特定の原子がペアになっている必要があるなど、3D空間における分子の特性のセマンティックベクトル場を制約するために、所与の目標の構造に関する直感を有することができる。ニューラルネットワークは、3D空間におけるこれらのパターンおよび関係、ならびにこれらの3D幾何学的関係を有する対応する分子ベクトルを認識するように学習するときに、知識ソースからの制約を使用できる。したがって、機械学習は、分子および対応する分子ベクトルの原子特性、および/または、目標/所望の特性の知られている値を実質的に満足する分子ベクトルの解明を依然として試みながら、化学の専門家によって設定されたこれらの関係の制約を利用することができる。
【0110】
次に、ユーザからの目標特性のセットは、目標特性のセットを満足する1つまたは複数の候補分子の発見を試みるときに達成する機械学習アルゴリズムの出力目標として、分子特性予測モジュールに提供することができる。機械学習プロセスは、名前のない分子に対して提供された目標特性(学習アルゴリズムの目標)を満足する1つまたは複数の候補分子ベクトル値が発見されるまで、候補分子ベクトル値を、特性予測モジュールに反復的に提供する。名前のない分子に対して提供された目標特性を満足する各候補分子ベクトル値を発見した後、各候補分子ベクトル値を、候補分子の構造を示すその候補分子ベクトル値の3次元ベクトル場に変換する。したがって、人工知能エンジン100は、機械学習のために自動化された様式で、知能を用いてコード化され、目標特性の分子設計を、存在する分子に、または、自然界において当然発生するものとして、および/または、実験室において作成されたが、目標特性のセットに対応する、以前に学習された幾何学的構造と類似の幾何学的構造を有する、まだ発見されていない架空の分子に、論理的に適応させる。
【0111】
図10は、分子特性を、分子における構造的特性に相関付けることができるように、分子における構造のパターンを認識する例示的な人工知能エンジンの図の実施形態を示す。人工知能エンジン100は、3次元空間における1つまたは複数の候補分子の幾何学的構造に対応する分子ベクトル値を反復的に発行するようにトレーニングされた機械学習モジュールを使用する。分子ベクトル値は、1つまたは複数の候補分子の幾何学的構造に対応する。これらの分子ベクトル値および構造は、自然界において当然発生するものとして、および/または、実験室において作成されたものとして、まだ発見されていない、単なる架空の分子を含むことができる。分子ベクトル値は、分子ベクトルモジュールから分子特性予測子に反復的に発行され、目標特性のセットを満足する第1の候補分子が発見されるときを確認する。
【0112】
一実施形態では、例示的なニューラルネットワークは、3D空間においてコンピュータビジョン技法を適用して、部分を認識するようにニューラルネットワークをトレーニングする。論じられたように、ニューラルネットワークは、構造ベースのルールによってキャプチャされなかった分子に当然に一般化される。ニューラルネットワークは、分子の一部に対する特定の機能および構造を用いて、分子の部分/一部(たとえば、原子のグループ)を認識し、その後、原子構造の異なる各パターンを、セマンティックベクトル場における独自の領域としてラベル付けるよう学習するようにトレーニングされた。たとえば、トレーニングされたニューラルネットワークは、3D空間における楕円体、および/または3D空間における円を有する特定の原子のリングなどのいずれかで、原子の各異なる部分を特徴付ける。各幾何学的構造は、後で、分子の特性に相関付けることができる。これらの部分は、類似したパターンおよび関係を有しているが、元の分子およびその正確なパターンに正確に合致する必要はない。機械学習の特徴として、機械学習モデルは、パターンを認識し、その後、それらのパターンに関連付けられたパラメータ、値、および効果を認識するように学習する。機械学習モデルは、当然、この理解を、トレーニングされていない可能性のある類似の構造パターンを有する原子のセットに特徴的に一般化することができる。
【0113】
図11は、分子を試験および予測するための物理学ベースのベクトル表現を生成できる例示的な人工知能エンジンの図の実施形態を示す。
【0114】
人工知能エンジン100は、自然界において当然に発生すると知られている分子の特性の、予測またはルックアップ機能の実行を単に行うのではなく、目標特性を有する候補分子を構成する原子を含む、候補分子およびその幾何学的構造の表現を生成する。人工知能エンジン100は、目標特性を有する候補分子を構成する原子を含む、候補分子およびその幾何学的構造の表現を、1)表示画面で、2)印刷物において、3)ユーザのアカウントに送信される電子メッセージ(たとえば、電子メール、テキスト、インスタントメッセージなど)として、および4)これら3つの任意の組合せでユーザに提供する。
【0115】
人工知能エンジン100は、幾何学的構造を含む分子および分子の特性のデータベースと連携することができる。人工知能エンジン100は、ユーザによって発行された目標特性のセットに関するクエリに応答して、既存の分子データベースにおける分子が、目標特性のセットを満足するか否か?を判定することができる。満足する場合、分子およびその幾何学的構造を、ユーザに送信する。満足しない場合、トレーニングされたモジュールを調べて、分子の目標特性のセットを有することができる1つまたは複数の候補分子の機械学習モデルを用いて評価する。目標特性のセットを満足する候補分子を探索する場合、人工知能エンジン100は、様々なデータソースの情報を抽出して情報を取得し、機械学習プロセスにおける制約として機能して、合致する候補分子のみならず、原子および分子の幾何学的構造に関する情報源を発見することができる。人工知能エンジン100は、その特定のデータソースからデータを照会および抽出するための適切なデータソースを決定するための知能でコード化される。目標特性のセットを満足する候補分子は、合成および試験されるために送信された、その原子組成および幾何学的構造を有することもできる。
ネットワーク
【0116】
図12は、人工知能エンジンの実施形態に従って、ネットワーク環境において互いに通信するいくつかの電子システムおよびデバイスの図を例示する。ネットワーク環境800は、通信ネットワーク820を有する。ネットワーク820は、光ネットワーク、セルラネットワーク、インターネット、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、衛星ネットワーク、ファイバネットワーク、ケーブルネットワーク、およびそれらの組合せから選択される1つまたは複数のネットワークを含むことができる。一実施形態では、通信ネットワーク820は、インターネットである。図示されるように、通信ネットワーク820を介して互いに接続された多くのサーバコンピューティングシステムおよび多くのクライアントコンピューティングシステムが存在し得る。しかしながら、たとえば、単一のクライアントコンピューティングシステムを、単一のサーバコンピューティングシステムに接続できることも理解されたい。したがって、サーバコンピューティングシステムとクライアントコンピューティングシステムとの任意の組合せは、通信ネットワーク820を介して互いに接続し得る。
【0117】
人工知能エンジン100を含むシステムは、このようなネットワークを使用して、機械学習ネットワークを作成およびトレーニングするためのトレーニングデータを提供することができる。人工知能エンジン100はまた、たとえば、サーバ804Aおよびデータベース806A、ローカルサーバ804Bおよびデータベース806Bのクラウドプラットフォームに、ラップトップ802Dなどのデバイス上に、スマート自動車802Dのようなスマートシステム、および他の類似のプラットフォームにおけるように、このネットワーク環境に常駐し、実施することができる。
【0118】
通信ネットワーク820は、少なくとも第1のサーバコンピューティングシステム804Aおよび第2のサーバコンピューティングシステム804Bから選択された1つまたは複数のサーバコンピューティングシステムを互いに、および、少なくとも1つまたは複数のクライアントコンピューティングシステムにも同様に接続することができる。サーバコンピューティングシステム804Aは、たとえば、1つまたは複数のサーバシステム220であることができる。サーバコンピューティングシステム804Aおよび804Bは各々、データベース806Aおよび806Bなどの組織化されたデータ構造を任意選択で含むことができる。1つまたは複数のサーバコンピューティングシステムの各々は、1つまたは複数の仮想サーバコンピューティングシステムを有することができ、複数の仮想サーバコンピューティングシステムを、設計によって実施できる。1つまたは複数のサーバコンピューティングシステムの各々は、データの整合性を保護するための1つまたは複数のファイアウォールを有することができる。
【0119】
少なくとも1つまたは複数のクライアントコンピューティングシステムは、第1のモバイルコンピューティングデバイス802A(たとえば、アンドロイド(登録商標)ベースのオペレーティングシステムを備えたスマートフォン)、第2のモバイルコンピューティングデバイス802E(たとえば、iOSベースのオペレーティングシステムを備えたスマートフォン)、第1のウェアラブル電子デバイス802C(たとえば、スマートウォッチ)、第1のポータブルコンピュータ802B(たとえば、ラップトップコンピュータ)、第3のモバイルコンピューティングデバイスまたは第2のポータブルコンピュータ802F(たとえば、アンドロイドベースのまたはiOSベースのオペレーティングシステムを備えたタブレット)、第1のスマート自動車802Dに組み込まれたスマートデバイスまたはシステム、第1のスマート自転車に組み込まれたスマートデバイスまたはシステム、第1のスマートテレビ802H、第1の仮想現実または拡張現実ヘッドセット804Cなどから選択することができる。クライアントコンピューティングシステム802Bは、たとえば、1つまたは複数のクライアントシステム210のうちの1つであることができ、他のクライアントコンピューティングシステム(たとえば、802A、802C、802D、802E、802F、802G、802H、および/または804C)のうちの任意の1つまたは複数は、たとえば、人工知能のトレーニングを、行うことができる、および/または、展開することができるソフトウェアアプリケーションまたはハードウェアベースのシステムを含むことができる。1つまたは複数のクライアントコンピューティングシステムの各々は、データの整合性を保護するための1つまたは複数のファイアウォールを有することができる。
【0120】
「クライアントコンピューティングシステム」および「サーバコンピューティングシステム」という用語の使用は、一般に通信を開始するシステムと、一般に通信に応答するシステムとを示すことが意図されていると理解されたい。たとえば、クライアントコンピューティングシステムは、一般に、通信を開始でき、サーバコンピューティングシステムは、一般に、通信に応答する。明示的に述べられていない限り、階層は含まれない。両方の機能を単一の通信システムまたはデバイスに含めることができ、その場合、クライアント-サーバおよびサーバ-クライアントの関係は、ピアツーピアと見なすことができる。したがって、第1のポータブルコンピュータ802B(たとえば、クライアントコンピューティングシステム)とサーバコンピューティングシステム804Aとの両方が、通信を開始し、通信に応答することができる場合、それらの通信は、ピアツーピアと見なすことができる。加えて、サーバコンピューティングシステム804Aおよび804Bは、ネットワーク820を介して互いに通信することを可能にする回路構成およびソフトウェアを含む。サーバ804Bは、たとえば、シミュレータデータをサーバ804Aに送信し得る。
【0121】
サーバコンピューティングシステムのうちの任意の1つまたは複数は、クラウドプロバイダであることができる。クラウドプロバイダは、クラウド(たとえば、インターネットなどのネットワーク820)にアプリケーションソフトウェアをインストールして動作することができ、クラウドユーザは、クライアントコンピューティングシステムのうちの1つまたは複数から、そのアプリケーションソフトウェアにアクセスできる。一般に、クラウドにクラウドベースのサイトを有するクラウドユーザは、アプリケーションソフトウェアが実行するクラウドインフラストラクチャまたはプラットフォームを単独で管理することはできない。したがって、サーバコンピューティングシステムおよびその組織化されたデータ構造は、共有リソースであることができ、各クラウドユーザは、共有リソースの特定量の専用の使用を与えられる。各クラウドユーザのクラウドベースのサイトには、クラウドに仮想量の専用空間および帯域幅を与えることができる。クラウドアプリケーションは、スケーラビリティにおいて他のアプリケーションとは異なる場合があり、これは、実行時において、複数の仮想マシンにタスクを複製することによって、変化する作業需要に対応することで達成できる。負荷バランサは、仮想マシンのセットに作業を分散する。このプロセスは、単一のアクセスポイントのみを見るクラウドユーザに対して透過的である。
【0122】
クラウドベースのリモートアクセスを、ハイパーテキスト転送プロトコル(「HTTP」)などのプロトコルを利用して、クライアントコンピューティングシステムに常駐するウェブブラウザアプリケーションなどの、クライアントコンピューティングシステム上のアプリケーションとの要求および応答サイクルと関係するようにコード化することができる。クラウドベースのリモートアクセスは、スマートフォン、デスクトップコンピュータ、タブレット、または任意の他のクライアントコンピューティングシステムによって、いつでも、および/または、どこへでもアクセスできる。クラウドベースのリモートアクセスは、1)すべてのウェブブラウザベースのアプリケーションからの要求および応答のサイクルと、3)専用のオンラインサーバからの要求および応答のサイクルと、4)クライアントデバイスに常駐するネイティブアプリケーションと、別のクライアントコンピューティングシステムへのクラウドベースのリモートアクセスとの間の直接的な要求および応答のサイクルと、5)これらの組合せと関係するようにコード化される。
【0123】
一実施形態では、サーバコンピューティングシステム804Aは、サーバエンジン、ウェブページ管理構成要素または直接アプリケーション構成要素、コンテンツ管理構成要素、およびデータベース管理構成要素を含むことができる。サーバエンジンは、基本的な処理およびオペレーティングシステムレベルのタスクを実行できる。ウェブページ管理構成要素は、ブラウザを介して、デジタルコンテンツおよびデジタル広告の受信および提供に関連付けられたウェブページまたは画面の作成および表示またはルーティングを取り扱うことができる。同様に、直接アプリケーション構成要素は、ユーザのデバイスに常駐するクライアントアプリと連携し得る。ユーザ(たとえば、クラウドユーザ)は、その間に関連付けられたユニフォームリソースロケータ(「URL」)によって、サーバコンピューティングシステムのうちの1つまたは複数にアクセスできる。コンテンツ管理構成要素は、本明細書で説明する実施形態におけるほとんどの機能を取り扱うことができる。データベース管理構成要素は、データベースに関する記憶および検索タスク、データベースへのクエリ、およびデータの記憶を含むことができる。
【0124】
一実施形態では、サーバコンピューティングシステムは、ウィンドウ、ウェブページなどに情報を表示するように構成することができる。たとえば、サーバコンピューティングシステム804Aにおいて実行される場合に実行可能な、任意のプログラムモジュール、アプリケーション、サービス、プロセス、および他の類似ソフトウェアを含むアプリケーションは、サーバコンピューティングシステム804Aに対して、ウィンドウおよびユーザインターフェース画面を、ディスプレイ画面空間の一部に表示させることができる。
【0125】
各アプリケーションは、所望の情報の詳細を取得するための場を提示するなど、ソフトウェア構成要素が実行するようにコード化されている機能を実行するようにスクリプト化されたコードを有する。たとえば、サーバコンピューティングシステム804A内のアルゴリズム、ルーチン、およびエンジンは、提示場から情報を取得し、その情報をデータベース(たとえば、データベース806A)などの適切な記憶媒体に書き込むことができる。比較ウィザードは、データベースを参照し、そのようなデータを活用するようにスクリプト化できる。アプリケーションは、たとえば、サーバコンピューティングシステム804Aにおいてホストされ得、たとえば、クライアントコンピューティングシステム802Bの特定のアプリケーションまたはブラウザへ提供され得る。その後、アプリケーションは、詳細の入力を可能にするウィンドウまたはページを提供する。
コンピューティングシステム
【0126】
図13は、本明細書で論じられる人工知能エンジンに関連付けられたシステムの一部となることができる、1つまたは複数のコンピューティングデバイスの実施形態の図を示す。コンピューティングデバイス900は、命令を実行するための1つまたは複数のプロセッサまたは処理ユニット920と、情報を格納するための1つまたは複数のメモリ930~932と、コンピューティングデバイス900のユーザからのデータ入力を受け取るための1つまたは複数のデータ入力構成要素960~963と、管理モジュールを含む1つまたは複数のモジュールと、コンピューティングデバイスの外部の他のコンピューティングデバイスと通信するための通信リンクを確立するためのネットワークインターフェース通信回路970と、特定のトリガ条件を感知し、その後、それに対応して1つまたは複数の事前にプログラムされたアクションを生成するために、センサからの出力が使用される、1つまたは複数のセンサと、1つまたは複数のメモリ930~932および他の構成要素に格納された情報の少なくとも一部を表示する表示画面(モニタ)991とを含み得る。ソフトウェア944、945、946において実施されるこのシステムの一部は、1つまたは複数のメモリ930~932に格納され得、1つまたは複数のプロセッサ920によって実行されることに留意されたい。
【0127】
システムメモリ930は、読取専用メモリ(ROM)931およびランダムアクセスメモリ(RAM)932などの揮発性および/または不揮発性メモリの形態のコンピュータ記憶媒体を含む。これらのコンピューティング機械可読媒体は、コンピューティングシステム900によってアクセスできる任意の利用可能な媒体であることができる。限定ではなく例として、コンピューティング機械可読媒体の使用は、コンピュータ可読命令、データ構造、他の実行可能なソフトウェア、または他のデータなどの情報の記憶を含む。コンピュータ記憶媒体を、RAM、ROM、EEPROM、フラッシュメモリまたはその他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたは他の磁気記憶デバイス、または所望の情報を格納するために使用することができ、コンピューティングデバイス900によってアクセスできる任意の他の有形媒体を含むが、これらに限定されない。ワイヤレスチャネルなどの一時的な媒体は、機械可読媒体に含まれない。
【0128】
システムはさらに、起動中など、コンピューティングシステム900内の要素間で情報を転送するのを助ける基本ルーチンを含む基本入力/出力システム933(BIOS)を含み、通常、ROM931に格納される。RAM932は、通常、処理ユニット920に即座にアクセス可能な、および/または、処理ユニット920で現在動作している、データおよび/またはソフトウェアを含む。限定ではなく例として、RAM932は、オペレーティングシステム934、アプリケーションプログラム935、他の実行可能なソフトウェア936、およびプログラムデータ937の一部を含むことができる。
【0129】
コンピューティングシステム900はまた、他の取外し可能/取外し不可能な、揮発性/不揮発性コンピュータ記憶媒体を含むことができる。ほんの一例として、システムは、ソリッドステートメモリ941を有する。ソリッドステートメモリ941は、通常、インターフェース940などの取外し不可能なメモリインターフェースを介してシステムバス921に接続され、USBドライブ951は、通常、インターフェース950などの取外し可能なメモリインターフェースによってシステムバス921に接続される。
【0130】
ユーザは、キーボード、タッチ画面、またはソフトウェアもしくはハードウェア入力ボタン962、マイクロフォン963のような入力デバイス、マウス、トラックボール、またはタッチパッドのようなポインティングデバイスおよび/またはスクロール入力構成要素を介して、コマンドおよび情報をコンピューティングシステム900に入力し得る。これらの入力デバイスおよび他の入力デバイスを、システムバス921に結合されたユーザ入力インターフェース960を介して処理ユニット920に接続することが多いが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス(USB)のような他のインターフェースおよびバス構造によって接続することができる。ディスプレイモニタ991または他のタイプのディスプレイ画面デバイスもまた、ディスプレイインターフェース990などのインターフェースを介してシステムバス921に接続される。モニタ991に加えて、コンピューティングデバイスはまた、スピーカ997、バイブレータ999、および他の出力デバイスのような、出力周辺インターフェース995を介して接続され得る、他の周辺出力デバイスを含み得る。
【0131】
コンピューティングシステム900は、リモートコンピューティングシステム980などの1つまたは複数のリモートコンピュータ/クライアントデバイスへの論理接続を使用して、ネットワーク化された環境で動作することができる。リモートコンピューティングシステム980は、パーソナルコンピュータ、モバイルコンピューティングデバイス、サーバ、ルータ、ネットワークPC、ピアデバイス、または他の一般的なネットワークノードであることができ、通常、コンピューティングシステム900に関連する上記の要素の多くまたはすべてを含む。論理接続は、パーソナルエリアネットワーク(PAN)972(たとえば、Bluetooth(登録商標))、ローカルエリアネットワーク(LAN)971(たとえば、Wi-Fi)、およびワイドエリアネットワーク(WAN)973(たとえば、セルラネットワーク)を含むことができるが、パーソナルエリアネットワーク(たとえば、Bluetooth(登録商標))などの他のネットワークも含み得る。そのようなネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネット、およびインターネットにおいて一般的である。ブラウザアプリケーションは、コンピューティングデバイス上で共鳴し、メモリに格納され得る。
【0132】
LANネットワーキング環境において使用される場合、コンピューティングシステム900は、たとえば、Bluetooth(登録商標)またはWi-Fiアダプタであることができるネットワークインターフェース970を介してLAN971に接続される。WANネットワーキング環境(たとえば、インターネット)で使用される場合、コンピューティングシステム900は、通常、WAN973を介して通信を確立するためのいくつかの手段を含む。移動通信技術に関して、たとえば、内部または外部であることができる無線インターフェースを、ネットワークインターフェース970または他の適切なメカニズムを介してシステムバス921に接続することができる。ネットワーク化された環境では、コンピューティングシステム900またはその一部に関連して記述された他のソフトウェアは、リモートメモリ記憶デバイスに格納され得る。限定ではなく例として、システムは、リモートコンピューティングデバイス980に常駐するリモートアプリケーションプログラム985を有する。図示されているネットワーク接続は、使用され得るコンピューティングデバイス間の通信リンクを確立する例および他の手段であることが理解されよう。
【0133】
論じられたように、コンピューティングシステム900は、処理ユニット920、メモリ(たとえば、ROM931、RAM932など)、コンピューティングデバイスに電力を提供するための内蔵バッテリ、バッテリを充電するためのAC電源入力、ディスプレイ画面、ネットワークに接続されたリモートコンピューティングデバイスとワイヤレスで通信するための内蔵Wi-Fi回路構成を備えたモバイルデバイスを含むことができる。
【0134】
本設計を、本明細書に図示されるものに関して説明されたものなどのコンピューティングシステム上で実行することができることに留意されたい。しかしながら、本設計を、サーバ、メッセージ処理専用のコンピューティングデバイス、または本設計の異なる部分が分散コンピューティングシステムの異なる部分で実行される分散システムにおいて実行することができる。
【0135】
いくつかの実施形態では、本明細書で論じられるアルゴリズムを容易にするために使用されるソフトウェアを、非一時的な機械可読媒体に埋め込むことができる。機械可読媒体は、機械(たとえば、コンピュータ)による読取可能な形態で情報を格納する任意のメカニズムを含む。たとえば、非一時的な機械可読媒体は、読取専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイス、デジタル多用途ディスク(DVD)、EPROM、EEPROM、フラッシュメモリ、磁気カードまたは光学カード、または電子命令の記憶に適した任意のタイプの媒体を含むことができる。
【0136】
本明細書で説明されるアプリケーションは、ソフトウェアアプリケーションと、モバイルアプリケーションと、オペレーティングシステムアプリケーションの一部であるプログラムとを含むが、これらに限定されないことに留意されたい。この説明の一部は、コンピュータメモリ内のデータビットに対する動作のアルゴリズムおよびシンボル表現の観点から提供される。これらのアルゴリズムの説明および表現は、データ処理技術における当業者によって、当該技術分野の他の熟練者に当業者の作業の内容を最も効果的に伝えるために使用される手段である。アルゴリズムは、本明細書において、一般に、所望される結果をもたらす自己矛盾のない一連のステップであると考えられる。ステップは、物理量の物理的な操作を必要とするステップである。通常、必ずしもそうとは限らないが、これらの量は、記憶、転送、結合、比較、および他の方法で操作できる電気信号または磁気信号の形態をとる。主に、一般的な使用法の理由から、時として、これらの信号を、ビット、値、要素、シンボル、文字、用語、数値などと称すると便利な場合があることが証明された。これらのアルゴリズムは、C、C+、HTTP、Java、Python、または他の類似の言語など、多くの異なるソフトウェアプログラミング言語で記述することができる。また、アルゴリズムを、ソフトウェアにおけるコードの行、ソフトウェアにおける構成されたロジックゲート、または両方の組合せで実施することができる。一実施形態では、このロジックは、ブール論理のルールに従う電子回路、命令のパターンを含むソフトウェア、または両方の任意の組合せからなる。ソフトウェアにおいて実施されるアルゴリズムの任意の部分は、メモリの一部に、実行可能な形式で格納でき、1つまたは複数のプロセッサによって実行される。一実施形態では、モジュールを、そのモジュールについて論じられた機能を実行するためのロジックおよび他の電子構成要素などの電子ハードウェア、そのモジュールについて論じられた機能を実行するようにコード化された実行可能なコードのブロックとしてのソフトウェア、および/または、電子ハードウェアと連携するソフトウェアの組合せで実施することができる。
【0137】
しかしながら、これらの用語および類似の用語のすべては、適切な物理量に関連付けられるべきであり、これらの量に適用される単なる便利なラベルであることに留意されたい。上記議論から明らかなように、特に明記しない限り、説明全体を通して、「処理すること」または「コンピュータ操作すること」または「計算すること」または「判定すること」または「表示すること」などの用語を利用する議論は、コンピュータシステムのレジスタおよびメモリ内の物理的な(電子的な)量として表されるデータを操作し、コンピュータシステムのメモリまたはレジスタ、または他のそのような情報の記憶デバイス、送信デバイス、または表示デバイス内の物理量として同様に表される他のデータに変換する、コンピュータシステムまたは類似の電子コンピューティングデバイスのアクションおよびプロセスを称することが認識される。
【0138】
電子ハードウェア構成要素によって実行される多くの機能を、ソフトウェアエミュレーションによって複製することができる。したがって、これらの同じ機能を遂行するために記述されたソフトウェアプログラムは、入力-出力回路構成におけるハードウェア構成要素の機能をエミュレートすることができる。したがって、本明細書で提供されるものは、前述したシステムのコンピューティングデバイス上の1つまたは複数のプロセッサによって実行されると、コンピューティングデバイスに対して、本明細書に説明されるように概説される動作を実行させる命令およびデータを格納するように構成された1つまたは複数の非一時的な機械可読媒体である。
【0139】
本明細書における「一実施形態」、「一例」などへの言及は、記載された実施形態または例が、特定の特徴、構造、または特性を含み得るが、すべての実施形態が、必ずしも特定の特徴、構造、または特性を含まなくてもよいことを示す。そのような句は、必ずしも同じ実施形態を指すとは限らない。さらに、特定の特徴、構造、または特性が、一実施形態に関連して説明される場合、明示的に示されているか否かに関わらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を与えることは、当業者の知識の範囲内であると考えられる。
【0140】
前述の設計およびその実施形態はかなり詳細に提供されたが、本明細書で提供される設計および実施形態を限定することは出願人の意図ではない。追加の適応および/または修正が可能であり、また、より広い態様では、これらの適応および/または修正も含まれる。したがって、以下の特許請求の範囲によって提供される範囲から逸脱することなく、前述の設計および実施形態から離れる場合があり、その範囲は、適切に解釈される場合、特許請求の範囲によってのみ限定される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
【国際調査報告】