(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-03
(45)【発行日】2025-03-11
(54)【発明の名称】簡易化された分子入力線エントリ・システム反応からの有機合成手順の生成
(51)【国際特許分類】
G16C 20/10 20190101AFI20250304BHJP
【FI】
G16C20/10
(21)【出願番号】P 2023509391
(86)(22)【出願日】2021-08-09
(86)【国際出願番号】 EP2021072165
(87)【国際公開番号】W WO2022037985
(87)【国際公開日】2022-02-24
【審査請求日】2024-01-23
(32)【優先日】2020-08-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【氏名又は名称】片岡 忠彦
(72)【発明者】
【氏名】ジョージャポーリス、レオニダス
(72)【発明者】
【氏名】ゲルイケンス、ジョピ
(72)【発明者】
【氏名】ボシェ、アラン、クロード
(72)【発明者】
【氏名】シュヴァラー、フィリップ
(72)【発明者】
【氏名】ソブチェク、アレクサンドロス
(72)【発明者】
【氏名】ハリクリシュナン、ナイル、ヴィシュヌ
(72)【発明者】
【氏名】レノ、テオドロ
【審査官】前田 侑香
(56)【参考文献】
【文献】Bowen Liu, 外9名,”Retrosynthetic Reaction Prediction Using Neural Sequence-to- Sequence Models”,ACS central science [online],米国,American Chemical Society,2017年03月,p. 1103-1113,[2024年09月26日検索], インターネット: <URL: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5658761/pdf/oc7b00303.pdf>
【文献】Connor W. Coley, 外16名,“A robotic platform for flow synthesis of organic compounds informed by AI planning”,Science [online],米国,AAAS,2019年08月09日,Vol. 365, Issue 6453,p. 1-9,[2024年09月25日検索], インターネット: <URL: https://www.science.org/doi/pdf/10.1126/science.aax1566>
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G16B 5/00-99/00
G16C 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータの情報処理により、簡易化された分子入力線エントリ・システム(SMILES)文字列から有機合成手順を生成する方法であって、
コンピュータにより、第1の部分が所望の化学製品を記述し、第2の残りの部分が必要な反応物質を記述する複数のSMILES文字列を受け取ることと、
コンピュータにより、前記所望の化学製品を製造するための有機合成手順についての手順ステップを、それぞれの所望の化学製品、必要な反応物質、及び関連する手順ステップを記述するSMILES文字列のセットを訓練データとして用いて訓練された深層機械学習モデル・システムによって予測することであって、前記セットは関連付けられた化学文献のコーパスから抽出され、前記予測された手順ステップは人間が読むことができる、前記予測することと、
コンピュータにより、前記予測された手順ステップの修正についての修正信号を受け取ることと、
コンピュータにより、受け取った前記複数のSMILES文字列、前記予測された手順ステップ、及び前記予測された手順ステップの前記修正を格納することと
を含む方法。
【請求項2】
コンピュータにより、前記修正済みの予測された手順ステップを、化学ロボットによって解釈可能な実行ステップのシーケンスに変換することと、
コンピュータにより、前記実行ステップのシーケンスを格納することと、
をさらに含む、請求項1に記載の方法。
【請求項3】
前記実行ステップのシーケンスを前記化学ロボットによって実行し、それにより、受けとった前記複数のSMILES文字列の前記第1の部分に従って前記所望の化学製品を製造することをさらに含む、請求項2に記載の方法。
【請求項4】
受け取った前記複数のSMILES文字列の前記第1の部分は、SMILES文字列から有機合成手順を生成するための、ポリマ、ポリマ添加物、触媒、殺虫剤、染料、肥料、人工香料及び甘味料、基礎研究に用いられる化合物、ペプチド模倣物、合成タンパク質、及びナノ構造体を含む群のうちの少なくとも1つに関する、請求項1に記載の方法。
【請求項5】
コンピュータにより、前記複数のSMILES文字列のセット及び関連する修正済みの予測された手順ステップを用いて、前記深層機械学習モデル・システムを再訓練することをさらに含む、請求項1に記載の方法。
【請求項6】
コンピュータにより、前記複数のSMILES文字列をテキスト文献から抽出することをさらに含む、請求項1に記載の方法。
【請求項7】
コンピュータにより、ユーザ・インターフェース又は前記深層機械学習モデル・システムのアプリケーション・プログラミング・インターフェースを通して、前記複数のSMILES文字列を受け取ることをさらに含む、請求項1に記載の方法。
【請求項8】
前記修正信号を受け取ることは、前記予測された手順ステップをユーザ・インターフェースに与え、前記予測された手順ステップに対する修正を示す前記修正信号を受け取ることを含む、請求項1に記載の方法。
【請求項9】
前記化学ロボットは、第1の化学ロボットであり、前記実行ステップのシーケンスは、第1の制約を有する前記第1の化学ロボットに向けられ、前記方法は、
コンピュータにより、前記第1の化学ロボットのための前記実行ステップのシーケンスを、第2の制約下にある第2の化学ロボットによって実行可能であるように変換することをさらに含む、請求項2に記載の方法。
【請求項10】
前記実行ステップのシーケンスは、第1の化学ロボットによって解釈可能であり、前記方法は、
コンピュータにより、前記第1の化学ロボットのための前記実行ステップのシーケンスを、第2の化学ロボットによって解釈可能な実行ステップのシーケンスに変換することをさらに含む、請求項2に記載の方法。
【請求項11】
コンピュータにより、前記所望の化学製品が製造されたかどうか、前記化学ロボットにより前記実行ステップのシーケンスを実行することによって製造された製品を分析することをさらに含む、請求項2に記載の方法。
【請求項12】
前記所望の化学製品が製造されていると判断された場合、前記予測された手順ステップと
、行われた手順ステップが成功したことを示す信頼度値とによって、前記訓練データを拡張することをさらに含む、請求項11に記載の方法。
【請求項13】
前記訓練データは、化学ロボットの技術的制約データをさらに含む、請求項1に記載の方法。
【請求項14】
簡易化された分子入力線エントリ・システム(SMILES)文字列から有機合成手順を生成するためのシステムであって、
第1の部分が所望の化学製品を記述し、第2の残りの部分が必要な反応物質を記述する複数の前記SMILES文字列を受け取るように適合された第1の受取手段と、
前記所望の化学製品を製造するための有機合成手順についての手順ステップを、それぞれの所望の化学製品、必要な反応物質、及び関連する手順ステップを記述するSMILES文字列のセットを訓練データとして用いて訓練された深層機械学習モデル・システムによって予測するように適合された予測手段であって、前記セットは関連付けられた化学文献のコーパスから抽出され、前記予測された手順ステップは人間が読むことができる、前記予測手段と、
前記予測された手順ステップの修正についての修正信号を受け取るように適合された第2の受取手段と、
受け取った前記複数のSMILES文字列、前記予測された手順ステップ、及び前記予測された手順ステップの前記修正を格納するように適合された第1のストレージ手段と
を備えるシステム。
【請求項15】
実行ステップのシーケンスを化学ロボットによって実行し、それにより、受け取った前記複数のSMILES文字列の前記第1の部分に従って前記所望の化学製品を製造するように適合された実行手段をさらに備える、請求項14に記載のシステム。
【請求項16】
受け取った前記複数のSMILES文字列の第1の部分は、ポリマ、ポリマ添加物、触媒、殺虫剤、染料、肥料、人工香料及び甘味料、基礎研究に用いられる化合物、ペプチド模倣物、合成タンパク質、及びナノ構造体を含む群のうちの少なくとも1つに関する、請求項14に記載のシステム。
【請求項17】
前記複数のSMILES文字列のセット、前記必要な反応物質及び関連する修正済みの予測された手順ステップを用いて、前記深層機械学習モデル・システムを再訓練するように適合された再訓練手段をさらに備える、請求項14に記載のシステム。
【請求項18】
前記複数のSMILES文字列をテキスト文献から抽出するように適合された抽出手段をさらに備える、請求項14に記載のシステム。
【請求項19】
ユーザ・インターフェース又は前記深層機械学習モデル・システムのアプリケーション・プログラミング・インターフェースを通して、前記複数のSMILES文字列を受け取る第3の受取手段をさらに備える、請求項14に記載のシステム。
【請求項20】
前記修正信号を受け取ることは、前記予測された手順ステップをユーザ・インターフェースにレンダリングし、前記予測された手順ステップに対する修正を示す前記修正信号を受け取るように適合されたレンダリング手段をさらに備える、請求項14に記載のシステム。
【請求項21】
前記化学ロボットは、第1の化学ロボットであり、前記実行ステップのシーケンスは、第1の制約を有する前記第1の化学ロボットに向けられ、前記システムは、前記第1の化学ロボットのための前記実行ステップのシーケンスを、第2の制約下にある第2の化学ロボットによって実行可能であるように変換するために適合された変換手段をさらに備える、請求項15に記載のシステム。
【請求項22】
前記実行ステップのシーケンスは、第1の化学ロボットによって解釈可能であり、前記システムは、前記第1の化学ロボットのための前記実行ステップのシーケンスを、第2の化学ロボットによって解釈可能な実行ステップのシーケンスに変換するように適合された変換手段をさらに備える、請求項15に記載のシステム。
【請求項23】
前記化学ロボットにより前記実行ステップのシーケンスを実行することによって製造された製品を、前記所望の化学製品が製造されたかどうか分析するように適合された分析手段をさらに備える、請求項15に記載のシステム。
【請求項24】
前記予測された手順ステップと、前記所望の化学製品が製造されているとの判断のための信頼度とによって、前記訓練データを拡張するように適合された拡張手段をさらに備える、請求項23に記載のシステム。
【請求項25】
簡易化された分子入力線エントリ・システム(SMILES)文字列から有機合成手順を生成するためのコンピュータ・プログラムであって、請求項1から請求項13までのいずれか1項に記載の方法をコンピュータに実行させるコンピュータ可読プログラム命令を含むコンピュータ・プログラム。
【請求項26】
請求項25に記載のコンピュータ・プログラムを格納したコンピュータ可読ストレージ媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、有機合成手順を生成する方法に関し、より具体的には、簡易化された分子入力線エントリ・システム(simplified molecular-input line-entry system、以下「SMILES」)から有機合成手順を生成する方法に関する。本発明はさらに、簡易化された分子入力線エントリ・システムから有機合成手順を生成するためのシステム、及びコンピュータ・プログラム製品に関する。
【発明の概要】
【0002】
本発明の一態様により、簡易化された分子入力線エントリ・システム(以下「SMILES」)文字列から有機合成手順を生成するためのコンピュータ実施の方法が提供される。本方法は、第1の部分が所望の化学製品を記述し、第2の残りの部分が必要な反応物質を記述する複数のSMILES文字列を受け取ることと、所望の化学製品を製造するための有機合成手順のための手順ステップを、それぞれの所望の化学製品、必要な反応物質及び関連する手順ステップを記述するSMILES文字列のセットを訓練データとして用いて訓練された深層機械学習モデル・システムによって予測することとを含むことができる。それに関して、それらのセットは、関連付けられた化学文献のコーパスから抽出することができる。予測された手順ステップは人間が読むことができる。
【0003】
本方法はさらに、予測された手順ステップの修正についての修正信号を受け取ることと、受け取った複数の簡易化された分子入力線エントリ・システム文字列、予測された手順ステップ、及び予測された手順ステップの修正を格納することとを含むことができる。
【0004】
本発明の別の態様により、簡易化された分子入力線エントリ・システム文字列から有機合成手順を生成するためのシステムを提供することができる。本システムは、第1の部分が所望の化学製品を記述し、第2の残りの部分が必要な反応物質を記述する複数のSMILES文字列を受け取るように適合された第1の受取手段と、所望の化学製品を製造するための有機合成手順に関する手順ステップを、それぞれの所望の化学製品、必要な反応物質及び関連する手順ステップを記述するSMILES文字列のセットを訓練データとして用いて訓練された深層機械学習モデル・システムによって予測するように適合された予測手段とを含むことができる。それに関して、それらのセットは、関連付けられた化学文献のコーパスから抽出することができる。予測された手順ステップは人間が読むことができる。
【0005】
本システムはさらに、予測された手順ステップの修正についての修正信号を受け取るように適合された第2の受取手段と、受け取った複数の簡易化された分子入力線エントリ・システム文字列、予測された手順ステップ、及び予測された手順ステップの修正を格納するように適合された第1のストレージ手段とを含むことができる。
【0006】
複数のSMILES文字列から有機合成手順を生成するための提案されるコンピュータ実施の方法並びに関連するシステムは、多数の利点、技術的効果、寄与若しくは改善又はそれらの組み合わせを提供することができる。
【0007】
説明される方法及びシステムは、コマンドのシーケンスを生成する問題に向けることができ、コマンドのシーケンスは、人間により及び構造化された形式によって理解可能であり、さらに、潜在的には変換後に、化学合成を実行するプロセスを自動化し、同時に人間の監督を可能にすることができる、これらのコマンドを実行することができる化学ロボットに連結されたコンピュータ・システムによって理解可能である。
【0008】
このことは、例えばSMILESなどの共通化学形式において反応に含まれる複数の分子、特に反応生成物及び必要な反応物質を、適切に訓練された機械学習モデルに提供し、次いで、化学製品の製造を行うために必要な、人間が理解可能なアクション、すなわち、手順ステップ又はレシピを受け取ることによって、達成することができる。予測アクションは、修正及び検証のために人間の専門家又はスーパーバイザーに提示される場合があり、次いで、コンピュータ構造化形式の技術データ、例えば、JSON(JavaScript Object Notation)、YAML(“YAML Ain’t Markup Language”)、Protobuf(Protocol Buffers)シリアリゼーションとして、データ・ストレージに格納することができ、そこから、要求された化学製品を製造する化学反応についてロボット・アレイによって実行するために、取り上げることができる。
【0009】
訓練された人工知能システム、すなわち機械学習(ML)システムは、コーパス、すなわち、特定の化学製品を記述するSMILES文字列と所望の化学製品の合成のための関連する推奨手順ステップとの組み合わせが記述される場合がある関連付けられた化学文書、すなわち文献の化学文書の本文に基づいて、SMILES文字列を可能な若しくは最適な又はその両方の処理ステップのシーケンスに解釈するのに役立ち得る。機械学習システムは、SMILES文字列の特定のセットと全ての必要な手順ステップとの間の直接的対応が記述されていない場合にも、手順ステップのシーケンスを予測するために用いることができる。
【0010】
MLシステムのための訓練データのソースは、多数あり得る。化学反応手順は、雑誌、教科書、科学文献、学会論文、インターネットを介してのプライベート研究データベース並びに特許文献に、長年にわたって公表されている。訓練データは、MLシステムのために手動で準備することも、自動的に、すなわち関連する反応手順と共にSMILES文字列を収集することもできる。例えば、幾つかのソースの名称を挙げれば、バイルシュタイン(Beilstein)・データベース、1億を超える化学物質、4千5百万を超える化学反応、及び5億を超える実験事実を含むリアクシス(Reaxys)データベース、エルゼビア(Elsevier)によるスコーパス(Scopus)データベース、王立化学会によるケムスパイダ(ChemSpider)データベース、ケミカル・アブストラク・サービス(CAS)によるSciFinderデータベース、科学技術情報ネットワーク(CASによるSTNインターナショナル)がある。バイルシュタイン・データベースは、リアクシス(登録商標)を通して利用できる。リアクシス(登録商標)は、エルゼビア・プロパティSAの登録商標である。
【0011】
しかし、現在の科学者が化学データベースを通して利用できる情報量をもってしても、例えば、新しい薬品を手作業で行うことは実際的ではなく、非常に時間がかかり費用も高い。
【0012】
従って、提案される本方法及び関連するシステムは、理論的に可能な化合物の選択肢と現実的な実験の成功との間のギャップを埋める効果的でエレガントな方法を示すことができる。多くの研究者にとって、これは、上記の制約がある新しい薬品若しくは化合物又はその両方(及び他の化合物)を開発する唯一の実際的な選択肢となり得る。
【0013】
それゆえに、本概念は、ウェット・ラボ化学実験の生産性を高め、所望の化学製品を製造するために多数の既存の文献を自動的に使用すると同時に必要な実験の数を減らすことを可能にする。製造された化学製品の追加分析と、機械学習システムの可能性のある再訓練と、少なくとも部分的に人間が介在する閉ループを用いる化学実験の繰り返しの成功とを用いることによって、自己最適化システム方法及び関連するシステムを達成することができる。
【0014】
以下で、関連するシステムにも適用可能な、本発明の方法の追加の実施形態が説明されることになる。
【0015】
拡張された一実施形態により、本方法は、修正済の予測された手順ステップを、化学ロボットによって解釈可能な実行ステップのシーケンスに変換することと、実行ステップのシーケンスを格納することとをさらに含むことができる。このようにして、本方法は、所望の化学製品を多かれ少なかれ自動で製造することをサポートすることができる。
【0016】
有利な一実施形態により、本方法は、実行ステップのシーケンスを化学ロボットによって実行することをさらに含むことができる。それにより、受け取ったSMILES文字列の第1の部分に従って所望の化学製品を製造することができる。これによって、人間の相互作用及びプロセス全体を大きく迂回することができる。化学の専門家は、ルーチン・タスクから大きく解放されることができる。
【0017】
本方法の許容される実施形態により、受け取った簡易化された分子入力線エントリ・システム文字列の第1の部分は、ポリマ、ポリマ添加物、触媒、殺虫剤、染料、肥料、人工香料及び甘味料、基礎研究に使用される化合物、ペプチド模倣物、合成タンパク質、及びナノ構造体を含む群のうちの少なくとも1つに関連することができる。他の種類の化学製品にも対応できる可能性がある。したがって、多数の化学反応製品を、ウェット・ラボ実験において人間の介在無しに広く用いることができる。
【0018】
好ましい一実施形態により、本方法はさらに、SMILES文字列のセット及び関連する修正済みの予測された手順ステップを用いて、深層機械学習モデル・システムを再訓練することを含むことができる。このようにして、提案される本方法及び関連システムは、時間と共に改良され、より複雑な実験状況でも人手をかけずに済む可能性がある。
【0019】
さらに別の有用な一実施形態により、本方法はさらに、簡易化された分子入力線エントリ・システム文字列をテキスト文献から抽出することを含むことができる。テキスト文献は、多種多様な種々のソースに由来するものとすることができる。テキスト文献の分析のために、正規発現解析若しくは自然言語処理技術又はその両方をうまく使用することができる。
【0020】
1つの任意の実施形態により、本方法はさらに、ユーザ・インターフェース又は深層機械学習モデル・システムのアプリケーション・プログラミング・インターフェースを通して、複数の簡易化された分子入力線エントリ・システム文字列を受け取ることを含むことができる。したがって、提案される本方法は、簡易化された分子入力線エントリ・システム文字列のソースを限定しない。例えばユーザ・インターフェースによって入力される、人間に由来する入力は、別のシステムからの入力と同様に受け入れられる。
【0021】
本方法の有利な一実施形態により、修正信号を受け取ることは、予測された手順ステップをユーザ・インターフェースに与えることを含み、予測された手順ステップに対する修正を示す修正信号を受け取ることができる。したがって、ウェット・ラボ実験が行われ得る前に、人間の経験を専門家の最終的な手段として含めることができる。このことによって、時間及び物質に関する貴重な資源を節約することができる。
【0022】
本方法の先進的な一実施形態により、化学ロボットは第1の化学ロボットとすることができ、その際、実行ステップのシーケンスが、具体的には実行される可能性のある実験についての自由度の形で第1の制約を有する第1の化学ロボットに向けられ、本方法はさらに、第1の化学ロボットのための実行ステップのシーケンスを、第2の制約下にある第2の化学ロボットによって実行可能であるように変換することを含む。したがって、特定の化学ロボットのために設計され、例えばライブラリとして利用可能にされた、実行ステップのシーケンスを、技術的進歩及び化学ロボットを反映するように、他の制約及び能力を有する別のタイプの別の化学ロボットのために変換することができる。その一方で、異なる化学ロボットの実験的オプションの間に不適合が存在し得る場合には、エラー・メッセージを生成することができ、専門家は、対話サブシステムを用いて、実行ステップのシーケンスを手動で修正することができる。
【0023】
したがって、提案される本方法のさらに拡張された実施形態により、第1のロボットによって解釈可能な実行ステップのシーケンスは、第1のロボットのための実行ステップのシーケンスから、第2のロボットによって解釈可能な実行ステップのシーケンスに自動的に変換することができる。代替的に、第2の化学ロボットによって解釈可能な実行ステップは、手順ステップのシーケンスから直接得ることもできる。
【0024】
付加的で先進的な一実施形態により、本方法はさらに、所望の化学製品が実際に製造されているかどうか、ロボットにより実行ステップのシーケンスを実行することによって製造された製品を、例えば質量分析計を用いて分析することを含むことができる。本方法はさらに任意に、上記のユーザ・インターフェースを用いて手順ステップを修正することを可能にし、実験を半自動的に再試行することを可能にする。
【0025】
別の有利な実施形態により、本方法はさらに、予測された手順ステップと、所望の化学製品が製造されたという肯定的な結果の判断、すなわち行われた手順ステップが成功したことを示す、信頼度値とによって、訓練データセットを拡張することを含むことができる。信頼度値は、ユーザに出力することができる。
【0026】
本方法のさらに有利な実施形態により、訓練データは、化学ロボットの技術的制約データ、すなわち、基本的に化学ロボットのオプションの制限を記述するデータを、含むこともできる。このことは、特定の化学ロボットに広く依存しないメタデータを用いて行うことができる。したがって、この態様は、異なる製造者間の化学ロボットの制限に対処することもできる。
【0027】
さらに、実施形態は、コンピュータ若しくは任意の命令実行システムにより又はそれに接続して使用するためのプログラム・コードを与える、コンピュータ使用可能又はコンピュータ可読媒体からアクセス可能な、関連するコンピュータ・プログラム製品の形態をとることができる。この説明のために、コンピュータ使用可能又はコンピュータ可読媒体は、命令実行システム、装置、若しくはデバイスにより、又はそれらに接続して、使用するためのプログラムを、格納し、通信し、伝搬し、又は移送するための手段を含むことができる任意の装置とすることができる。
【図面の簡単な説明】
【0028】
本発明の実施形態は、種々の主題に関連して説明されることに留意されたい。具体的には、幾つかの実施形態は、方法タイプの特許請求に関連して説明され、他の実施形態は装置タイプの特許請求に関連して説明される。しかし、当業者であれば、上記及び以下の説明から、特に別に通知されない限り、1つのタイプの主題に属する特徴の任意の組み合わせ、さらに、異なる主題に関連する特徴、具体的には、方法タイプの特許請求の特徴及び装置タイプの特許請求の特徴の間の任意の組み合わせが、本明細書において開示されるものと見做されることを認識するであろう。
【0029】
本発明の上記で定められた態様及びさらに別の態様は、以下で説明される実施形態の実施例から明白となり、本発明がそれらに限定されない実施形態の実施例を参照しながら説明される。本発明の好ましい実施形態が、例としてのみ、以下の図面を参照しながら説明されることになる。
【0030】
【
図1】系統的な簡易化された分子入力線エントリ・システム(以後「SMILES」)文字列を生成するための、本発明のコンピュータ実施の方法の一実施形態のブロック図を示す。
【
図2】アクション及び必要な構成要素の例示的なフローを示す。
【
図3】SMILES文字列で開始し、手順ステップで終了するアクティビティの例示的なフローのブロック図を示す。
【
図4】SMILES文字列から有機合成手順を生成するためのシステムの一実施形態についての例示的なフローチャートを示す。
【
図5】
図4によるシステムを備えたコンピューティング・システムのブロック図を示す。
【
図6】本発明の一実施形態によるクラウド・コンピューティング環境を示す。
【
図7】本発明の一実施形態による抽象化モデル層を示す。
【発明を実施するための形態】
【0031】
化学、生化学又は薬学分野における新しい分子の合成のための化学実験を行うことは、時間が掛かり、典型的には大きな労働力を要する。そのような合成実験を部分的に自動化するために、人間によるウェット・ラボ実験などを行う代わりに、例えば、設計された実験生成物を製造するための反応チャンバ内で、実験のための限られた数の原料を反応させることができるように設計されたソフトウェア制御実験を可能にする化学ロボットが導入されている。そのドメインの専門家は、自動化ハードウェアを利用するとき、特定のタスクを実行するようにロボットをプログラミングする複雑さを管理する。これらの作業は、典型的には専門家のドメイン知識の一部であり、化学合成を成功させるための重要な変数を表す。
【0032】
しかし、(部分的な)自律型化学ロボットのハードウェアのプログラミングは、これらのユニットのプログラミングが、付加的なプログラミングスキルを有する高スキルの熟練した化学者を必要とし得るので、著しい制約を示す可能性がある。
【0033】
これに関連して、分子構造データを化学的な概念及びデスクリプタの階層的表現に変換し、データの共通ツリー状パターンを検出することによって、1つ又は複数の分子における分子構造と生物学的活性との間の関係を分析するための幾つかの文献と、コンピュータを用いた化学反応の予測のためのルール・パイプラインを設計し処理するための幾つかの文献とが、公表されている。
【0034】
しかし、これらの手法もまた、これまでのところ、あまりにも多くの人間の介在を必要とし得るので、所望の化学反応生成物分子のみを提供し、実験を行う方法の詳細、特に、正しい個々の手順ステップを実験自動化システムに任せることの問題を解決しない。
【0035】
この説明に関連して、以下の規定、用語若しくは表現又はこれらの組み合わせを用いることができる。
【0036】
用語「簡易化された分子入力線エントリ・システム文字列」(SMILES文字列)は、短いASCII文字列を用いて化学種の構造を記述するための線表記法の形態の既知の仕様を示すことができる。SMILES文字列は、分子の2次元図面又は3次元モデルに変換し直すために、大部分の分子エディタによって取り込むことができる。
【0037】
用語「有機合成手順」は、化学製品を合成するためのウェット・ラボ化学における実験ステップのシーケンスを表すことができる。これは、化学物質の1つのセットを別のものに化学的に変換させる、段階的に記述されたプロセスとすることができる。化学反応において初めに含まれる物質(単数又は複数)は、反応物質又は試薬と呼ばれる。化学反応は、通常、化学変化によって特徴付けられ、通常、反応物質とは異なる性質を有する1つ又は複数の生成物を生じる。反応は、多くの場合、個々のサブ・ステップ、いわゆる素反応のシーケンスからなり、アクションの正確な行程に関する情報は、反応機構の一部である。化学反応は、出発物質、最終生成物、及び場合により中間生成物を記号で表す化学方程式、並びに反応条件によって記述される。化学方程式若しくは生成物又はその両方にたういての幾つかの表記法、例えばSMILES文字列、がある。
【0038】
用語「所望の化学製品」は、化学ロボットによって製造できる可能性があり、SMILES文字列によって記述することができる化学製品を表すことができる。複数の反応物質から出発して所望の化学製品に達するために、手順ステップのシーケンスが必要な場合がある。
【0039】
用語「深層機械学習(ML)モデル・システム」は、入力層、出力層、及び複数の埋め込み層を備えた深層ニューラル・ネットワークを用いる人工知能システムを表すことができる。各々の層は、通常、前の層の複数のノードから入力を受け取り、次の層へ信号を配信する、複数のノードを含むことができる。各々のノードは、訓練後、手続型プログラミングとは対照的に、受け取った信号(単数又は複数)に特定の変換を行い、重み付け関数を追加することができる。MLモデルは、既知の出力データが生成されることになる既知のデータを用いて、訓練することができる(教師付き訓練)。学習法は、手続型プログラミングを使用せず、実例によって学習することを可能にする場合がある。このことは、化学物質(例えば、本明細書で記述される所望の化学製品)と、ステップのシーケンス後に所望の化学製品に達するための手順ステップとを関連付けるためにテキスト文献を分析するときに、特に有用な場合がある。
【0040】
用語「予測された手順ステップの修正」は、決定された予測された手順ステップのシーケンスにおける人間の介入と、これらのステップを、化学ロボットによって実行可能なステップのシーケンスに変換することとを表すことができる。人間のスーパーバイザは、化学実験の失敗を避けるために、システムが提案した手順ステップを変更することができる。この時点で、人間の経験をMLシステムの機械知能と組み合わせることができる。
【0041】
用語「実行ステップ」は、化学ロボットによって実行可能であり、実行されている個々のステップを表すことができる。実行ステップは、機械可読である必要はないが、化学ロボットによって直接実行される有用な命令とすることができる。
【0042】
用語「化学ロボット」は、実験室ロボットとも呼ばれ、新しい化学成分を合成するため又は既存の化学物質の薬学的価値をテストするために、生物学的又は化学的サンプルを移動させるように適合されたロボットを表すことができる。高度な実験室ロボットは、既知のロボット科学プロジェクトにおけるように、科学のプロセスを完全に自動化するために使用することができる。実験室プロセスは、プロセスが反復的な移動(例えば、掴む/置く、液体/固体の添加、加熱/冷却する、混合する、振盪する、テストする)から成る場合に、ロボット自動化に適している。多くの実験室ロボットは、それらの主要な作業が、分析デバイスのために連続的にサンプルを供給することであるので、普通、オートサンプラーと呼ばれる
【0043】
用語「技術的制約データ」は、化学ロボットの仕様の一部分を表すことができる。制約は、例えば、試薬の最大数、現在ロードされている試薬、利用可能な補助試薬(水又は溶媒など)及び選択可能な温度条件として、定めることができる。しかし、化学ロボットの仕様は、多種多様な制限及び選択肢を示す。これらを記述する特徴は、本明細書では制約として解釈することができる。
【0044】
以下で、図面の詳細な説明が与えられることになる。図面中の指示は、すべて概略的なものである。初めに、SMILES文字列から有機合成手順を生成するための、本発明のコンピュータ実施の方法の一実施形態のブロック図が与えられる。その後、さらに別の実施形態、並びに、関連するシステムの実施形態が説明されることになる。
【0045】
図1は、一実施形態によるSMILES文字列から有機合成手順を生成するためのコンピュータ実施の方法100の好ましい実施形態のブロック図を示す。
【0046】
方法100は、第1の部分が所望の化学製品を記述し、第2の残りの部分が必要な反応物質を記述する、複数のSMILES文字列を受け取ること102を含む。方法100は、深層機械学習(ML)モデル・システムによって、所望の化学製品を製造するための有機合成手順についての手順ステップを予測すること104に続く。深層MLモデル・システムは、それぞれの所望の化学製品、必要な反応物質及び関連する手順ステップを記述するSMILES文字列のセットを訓練データとして用いて、訓練されている。これにより、そのセットを、関連付けられた化学文書、すなわち化学文献のコーパスから抽出することが可能になる。ライブラリ、科学研究、教科書などからの任意の種類の文献を使用することができる。予測される手順ステップは、さらに人間が読むことができ、ユーザのために表示することができる。
【0047】
さらに、方法100は、予測された手順ステップの修正についての修正信号を受け取ること106を含む。方法100は、受け取ったSMILES文字列、予測された手順ステップ及び予測された手順ステップの修正を格納すること108に続く。オプションとして(波線で示される)、方法100はさらに、修正済みの予測された手順ステップを化学ロボットによって解釈可能な実行ステップのシーケンスに変換すること110と、実行ステップのシーケンスを、例えば後の実行又は即時の実行のために格納すること112とを含む。
【0048】
図2は、一実施形態における使用中の方法のアクション及び関連する構成要素の例示的なフローを示す。システムが化学反応生成物及び反応物質の化学式を受け取った後、深層MLモデルがクエリされる202。この結果、以前の訓練に基づいて深層MLモデル・システムによって生成された手順ステップのリスト204をもたらすことができる。これは、表示すること(図示されず)ができ、場合によりユーザ及びスーパーバイザーによって修正することができる。次に、206で機械可読データ構造形式に変換され、化学ロボット208によって使用されるように格納することができる。提案される本システムは、化学ロボット208の部分ではない(しかし、そうすることができる)。実行ステップの機械可読形式(110、112で示される変換)は、任意に化学ロボット208に送信することができる。提案されるシステムと比較した場合、化学ロボットは、遠隔地、例えば、スーパーバイザーを危険に晒さないような保護区域に、配置することができる。
【0049】
図3は、一実施形態による、連結されたSMILES文字列302で開始し、手順ステップ314で終了するアクティビティの例示的なフロー300のブロック図を示す。SMILES文字列302(SMILES文字列302の例示的な連結が示されている)は、深層MLモデル・システム304に対する入力として使用される。これは、深層MLモデル・システム304の入力層へ向けることができる。これは、それぞれのMLシステム・モデル・ベクトル空間における複数の隠れ層308によって埋め込まれてもよい。MLモデル・システム304の出力層310は、人間が読むことができる手順ステップ314のリスト形式で、所望の化学製品を製造するためのレシピへのポインタを有することができる。これらは、データ・ストレージ312に格納することができる。
【0050】
さらに、これらの手順ステップ314は、手順ステップ314が化学ロボット(図示されず)によって解釈可能な実行ステップのシーケンスに変換され得る前に、潜在的な修正のためにユーザ/スーパーバイザー/オペレータに表示することができる。
【0051】
以下のテーブル1は例示的な手順ステップを示す。
【表1】
【0052】
図4は、一実施形態による、SMILES文字列から有機合成手順を生成するためのシステム400の一実施形態の例示的なフローチャートを示す。システム400は、所望の化学製品を記述するSMILES文字列を受け取るように適合された第1の受取手段、具体的には第1のレシーバ402と、所望の化学製品を製造するための有機合成手順についての手順ステップを予測するように適合された予測手段、具体的には深層機械学習モデル・システム404とを含む。深層MLモデル・ベースのシステムは、それぞれの所望の化学製品、必要な反応物質、及び関連する手順ステップを記述する簡易化されたSMILES文字列のセットを訓練データとして用いて訓練され、それらのセットは、関連付けられた化学文献のコーパスから抽出される。予測された手順ステップは人間が読むことができる。
【0053】
システム400はさらに、予測された手順ステップの修正についての修正信号を受け取るように適合された第2の受取手段、具体的には第2のレシーバ406を含む。システム400は、受け取ったSMILES文字列、予測された手順ステップ及び予測された手順ステップの修正を格納するように適合された第1のストレージ手段、具体的には第1のストレージ・ユニット408を含む。
【0054】
システム400は、修正済みの予測された手順ステップを、化学ロボットによって解釈可能な実行ステップのシーケンスに変換するように適合された変換手段、具体的にはコンバータ410を含む。システム400は、実行ステップのシーケンスを格納するように適合された第2のストレージ手段、具体的には第2のストレージ・ユニット412を含む。第1及び第2のストレージ・ユニット408、412は、関連するストレージ管理システムと同じものとすることができる。
【0055】
言及されたユニット及びモジュールは、情報若しくは信号又はその両方の交換のために直接又は間接に相互接続することができることに留意されたい。代替的に、第1のレシーバ402、深層MLモデル・ベースのシステム404、第1のストレージ・ユニット408、任意の(破線で示された)コンバータ410及び第2のストレージ・ユニット412は、システムのインターネット・バス・システム414を介して相互接続することができる。
【0056】
本発明の実施形態は、プログラム・コードを格納すること若しくは実行すること又はその両方に適したプラットホームに関わらず、実質的に、任意のタイプのコンピュータと共に実施することができる。
図5は、一例として、提案される本方法に関連するプログラム・コードを実行するのに適したコンピューティング・デバイス500を示す。
【0057】
コンピューティング・デバイス500は、適切なコンピュータ・システムの一例に過ぎず、コンピューティング・デバイス500が、上記で示された機能性のいずれかを実施する若しくは実行する又はその両方の能力を有するかどうかに関わらず、本明細書で説明される本発明の実施形態の使用又は機能性の範囲に対する何らかの制限を示唆することを意図したものではない。コンピューティング・デバイス500には、多くの他の汎用又は特定目的のコンピューティング・システム環境又は構成とともに動作可能な構成要素が存在する。コンピューティング・デバイス500と共に使用するのに適した、周知のコンピューティング・システム、環境若しくは構成又はその両方の例としては、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、手持ち又はラップトップ・デバイス、マイクロプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラム可能なコンシューマ電子装置、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、及び、上記のシステム又はデバイスのいずれかを含む分散クラウド・コンピューティング環境、などが挙げられるが、それらに限定されない。コンピューティング・デバイス500は、コンピューティング・デバイス500によって実行されるプログラム・モジュールなどのコンピュータ・システム実行可能命令の文脈において記述することができる。一般に、プログラム・モジュールは、特定のタスクを実行する又は特定の抽象データ・タイプを実装する、ルーティン、プログラム、オブジェクト、構成要素、論理、データ構造などを含むことができる。コンピューティング・デバイス500は、通信ネットワークを通してリンクされた遠隔処理デバイスによってタスクが実行される分散クラウド・コンピューティング環境で実行することができる。分散クラウド・コンピューティング環境において、プログラム・モジュールは、メモリ・ストレージ・デバイスを含むローカル及び遠隔コンピュータ・システム・ストレージ媒体の両方に配置することができる。
【0058】
図5に示されるように、本発明の一実施形態による、コンピューティング・デバイスの構成要素のブロック図が示される。
図5は、実施の一例のみを与えるもので、種々異なる実施形態を実施することができる環境に関する何らかの限定を意味するものではないことを認識されたい。描かれた環境には、多くの修正が行われる場合がある。
【0059】
コンピューティング・デバイスは、通信ファブリック518上で相互接続された、1つ又は複数のプロセッサ502、1つ又は複数のコンピュータ可読RAM504、1つ又は複数のコンピュータ可読ROM506、1つ又は複数のコンピュータ可読ストレージ媒体508、デバイス・ドライバ512、読み出し/書き込みドライブ又はインターフェース514、ネットワーク・アダプタ又はインターフェース516を含むことができる。通信ファブリック518は、プロセッサ(マイクロプロセッサ、通信及びネットワーク・プロセッサなど)、システム・メモリ、周辺デバイス、及びシステム内の任意の他のハートウェア構成要素の間でデータ若しくは制御情報又はその両方を通過させるために設計されたいずれかのアーキテクチャによって実施することができる。
【0060】
1つ又は複数のオペレーティング・システム510、及び1つ又は複数のアプリケーション・プログラム511が、1つ又は複数のプロセッサ502による、それぞれのRAM504(典型的にはキャッシュ・メモリを含む)を介しての実行のために、1つ又は複数のコンピュータ可読ストレージ媒体508に格納される。例えば、例示的なフロー200及び例示的なフロー300は、各々、1つ又は複数のコンピュータ可読ストレージ媒体508に格納することができる。図示された実施形態において、コンピュータ可読ストレージ媒体508の各々は、内部ハード・ドレイブの磁気ディスク・ストレージ・デバイス、CD-ROM、DVD、メモリ・スティック、磁気テープ、磁気ディスク、光ディスク、RAM、ROM、EPROM、フラッシュ・メモリなどの半導体ストレージ・デバイス、又は、コンピュータ・プログラム及びデジタル情報を格納することができる任意の他のコンピュータ可読有形ストレージ・デバイス、とすることができる。
【0061】
コンピューティング・デバイスはさらに、1つ又は複数のポータブル・コンピュータ可読ストレージ媒体526から読み出す及びそれらに書き込むためのR/Wドライブ又はインターフェース514を含むことができる。コンピューティング・デバイス上のアプリケーション・プログラム511は、1つ又は複数のポータブル・コンピュータ可読ストレージ媒体526に格納することができ、それぞれのR/Wドライブ又はインターフェース514を介して読み出すことができ、それぞれのコンピュータ可読ストレージ媒体508にロードすることができる。
【0062】
コンピューティング・デバイスはさらに、TCP/IPアダプタ・カード又は無線通信アダプタ(OFDMA技術を用いる4G無線通信アダプタなど)のようなネットワーク・アダプタ又はインターフェース516を含むことができる。アプリケーション・プログラム511は、外部コンピュータ又は外部ストレージ・デバイスから、ネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク又は他の広域ネットワーク、あるいは無線ネットワーク)及びネットワーク・アダプタ又はインターフェース516を介して、当該コンピューティング・デバイスにダウンロードすることができる。プログラムは、ネットワーク・アダプタ又はインターフェース516から、コンピュータ可読ストレージ媒体508にロードすることができる。ネットワークは、銅線、光ファイバ、無線伝送、ルータ、ファイアウォール、スウィッチ、ゲートウェイ・コンピュータ若しくはエッジ・サーバ、又はこれらの組み合わせを含むことができる。
【0063】
コンピューティング・デバイスはさらに、ディスプレイ・スクリーン520、キーボード又はキーパッド522、及びコンピュータ・マウス又はタッチパッド524を含むことができる。デバイス・ドライバ512は、イメージングのためのディスプレイ・スクリーン520、キーボード又はキーパッド522、コンピュータ・マウス又はタッチパッド524、若しくは英数字入力及びユーザ選択の圧力検知のためのディスプレイ・スクリーン520、又はこれらの組み合わせに、インターフェース接続する。デバイス・ドライバ512、R/Wドライバ又はインターフェース514、及びネットワーク・アダプタ又はインターフェース516は、ハードウェア及びソフトウェア(コンピュータ可読ストレージ媒体508若しくはROM506又はその両方に格納される)を含むことができる。
【0064】
さらに、SMILES文字列から有機合成手順を生成するためのシステム400を通信ファブリック518に取り付けることができる。
【0065】
本発明の様々な実施形態の説明が例示のために提示されてきたが、網羅的であること又は開示された実施形態に限定することを意図したものではない。当業者であれば、説明された実施形態の範囲及び趣旨から逸脱しない多くの修正及び変形が明白となるであろう。本明細書で用いられた用語は、実施形態の原理、実際的な応用、又は市場において見出される技術を超える技術的改善を最もよく説明するために、或いは、他の当業者が本明細書で開示された実施形態を理解できるようにするために、選ばれたものである。
【0066】
本明細書で説明されたプログラムは、本発明の特定の実施形態において実施されるアプリケーションに基づいて識別される。しかし、いずれの特定のプログラム体系も本明細書においては単に便宜のために使用されており、それゆえに、本発明は、そのような体系によって識別される若しくは暗示される又はその両方の任意の特定のアプリケーションのみに使用することに限定されるべきではない。
【0067】
本発明の実施形態は、クラウド・コンピューティング・インフラストラクチャを通して、エンド・ユーザに提供することができる。クラウド・コンピューティングは一般に、ネットワーク上のサービスとしてスケーラブルなコンピューティング・リソースの提供を意味する。より公式には、クラウド・コンピューティングは、最小の管理努力又はサービス・プロバイダ相互作用によって迅速に供給されリリースされることができる構成可能なコンピューティング・リソースの共用プールへの、便利なオンデマンドのネットワーク・アクセスを可能にする、コンピューティング・リソースとその基礎となる技術的アークテクチャ(例えば、サーバ、ストレージ、ネットワーク)の間の仮想化を提供するコンピューティング能力として定めることができる。それゆえに、クラウド・コンピューティングは、ユーザが、コンピューティング・リソースを提供するために使用される基礎となる物理的システム(又はそれらシステムの場所)を顧慮せずに、「クラウド」内の、実際のコンピューティング・リソース(例えば、ストレージ、データ、アプリケーション、さらには完全な仮想化コンピューティング・システム)にアクセスすることを可能にする。
【0068】
典型的には、クラウド・コンピューティング・リソースは、ユーザが実際に使用したコンピューティング・リソース(例えば、ユーザによって消費されたストレージ・スペースの量、又はユーザによってインスタンス化された仮想化システムの数)に対してのみ課金されるペイ・パー・ユース・ベースで、ユーザに提供される。ユーザは、クラウド内に常駐するリソースのいずれにも、任意の時間にインターネットの任意の場所からアクセスすることができる。本発明の文脈において、ユーザは、クラウド内で利用可能な標準化された検索エンジン又は関連するデータにアクセスすることができる。例えば、標準化された検索エンジンは、クラウド内のコンピューティング・システム上で実行することができ、標準化された検索を実行することができる。そのような場合、標準化された検索エンジンは、情報のコーパスを標準化し、標準化されたインデックスをクラウド内のストレージ位置に格納することができる。そのようにすることは、ユーザが、クラウドに接続されたネットワーク(例えば、インターネット)に取り付けられた任意のコンピューティング・システムから、この情報にアクセスすることを可能する。
【0069】
本開示はクラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載される教示の実装は、クラウド・コンピューティング環境に限定されないことが予め理解される。むしろ、本発明の実施形態は、現在知られている又は後に開発される任意の他のタイプのコンピューティング環境と関連して実施することが可能である。
【0070】
クラウド・コンピューティングは、最小限の管理労力又はサービスのプロバイダとの対話で迅速にプロビジョニングされ、かつ解放されることが可能である構成可能なコンピューティング・リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、及びサービス)の共有プールへの、便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、及び少なくとも4つのデプロイメント・モデルを含むことができる。
【0071】
特徴は以下の通りである。
【0072】
オンデマンド・セルフサービス:クラウド・コンシューマは、必要に応じて、サーバ時間及びネットワーク・ストレージ等のコンピューティング機能を、人間がサービスのプロバイダと対話する必要なく自動的に、一方的にプロビジョニングすることができる。
【0073】
広範なネットワーク・アクセス:機能は、ネットワーク上で利用可能であり、異種のシン又はシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、及びPDA)による使用を促進する標準的な機構を通じてアクセスされる。
【0074】
リソース・プール化:プロバイダのコンピューティング・リソースは、マルチテナント・モデルを用いて複数のコンシューマにサービスを提供するためにプールされ、異なる物理及び仮想リソースが要求に応じて動的に割り当て及び再割り当てされる。コンシューマは、一般に、提供されたリソースの正確な位置についての制御又は知識を持たないという点で、位置とは独立しているといえるが、より高い抽象化レベル(例えば、国、州、又はデータセンタ)では位置を特定できる場合がある。
【0075】
迅速な弾力性:機能は、迅速かつ弾力的に、場合によっては自動的に、プロビジョニングしてすばやくスケールアウトし、迅速に解放して素早くスケールインすることができる。コンシューマにとって、プロビジョニングに利用可能な能力は、多くの場合、無制限であるように見え、いつでもどんな量でも購入できる。
【0076】
サービスの測定:クラウド・システムは、サービスのタイプ(例えば、ストレージ、処理、帯域幅、及びアクティブなユーザ・アカウント)に適した何らかの抽象化レベルでの計量機能を用いることによって、リソースの使用を自動的に制御及び最適化する。リソース使用を監視し、制御し、報告して、利用されるサービスのプロバイダとコンシューマの両方に対して透明性をもたらすことができる。
【0077】
サービス・モデルは、以下の通りである。
Software as a Service(SaaS):コンシューマに提供される機能は、クラウド・インフラストラクチャ上で実行されるプロバイダのアプリケーションを使用することである。これらのアプリケーションは、ウェブ・ブラウザ(例えば、ウェブベースの電子メール)などのシン・クライアント・インターフェースを通じて、種々のクライアント・デバイスからアクセス可能である。コンシューマは、限定されたユーザ固有のアプリケーション構成設定を想定される例外として、ネットワーク、サーバ、オペレーティング・システム、ストレージ、又は個々のアプリケーション能力をも含めて、基礎をなすクラウド・インフラストラクチャを管理又は制御しない。
Platform as a Service(PaaS):コンシューマに提供される機能は、プロバイダによってサポートされるプログラミング言語及びツールを用いて作成された、コンシューマが作成又は取得したアプリケーションを、クラウド・インフラストラクチャ上にデプロイすることである。コンシューマは、ネットワーク、サーバ、オペレーティング・システム、又はストレージを含む基礎をなすクラウド・インフラストラクチャを管理又は制御しないが、デプロイされたアプリケーション、及び場合によってはアプリケーションをホストする環境構成を制御する。
Infrastructure as a Service(IaaS):コンシューマに提供される機能は、コンシューマが、オペレーティング・システム及びアプリケーションを含み得る任意のソフトウェアをデプロイして実行させることができる、処理、ストレージ、ネットワーク、及び他の基本的なコンピューティング・リソースをプロビジョニングすることである。コンシューマは、基礎をなすクラウド・インフラストラクチャを管理又は制御しないが、オペレーティング・システム、ストレージ、デプロイされたアプリケーションに対する制御、及び場合によってはネットワーク構成要素(例えば、ホストのファイアウォール)選択に対する限定された制御を有する。
【0078】
デプロイメント・モデルは以下の通りである。
プライベート・クラウド:クラウド・インフラストラクチャは、ある組織のためだけに運営される。それは、組織又は第三者によって管理することができ、オンプレミス又はオフプレミスに存在することができる。
コミュニティクラウド:クラウド・インフラストラクチャは、幾つかの組織によって共有され、共通の関心事項(例えば、ミッション、セキュリティ要件、ポリシー、及びコンプライアンス上の考慮事項)を有する特定のコミュニティをサポートする。これは、それらの組織又は第三者によって管理することができ、オンプレミス又はオフプレミスに存在することができる。
パブリック・クラウド:クラウド・インフラストラクチャは、一般公衆又は大規模な業界グループによって利用可能であり、クラウド・サービスを販売する組織によって所有される。
ハイブリッドクラウド:クラウド・インフラストラクチャは、固有のエンティティのままであるが、データ及びアプリケーションのポータビリティを可能にする標準化技術又は専用技術(例えば、クラウド間の負荷平衡のためのクラウドバースティング)によって互いに結び付けられた、2つ以上のクラウド(プライベート、コミュニティ、又はパブリック)の混成物である。
【0079】
クラウド・コンピューティング環境は、サービス指向であり、ステートレス性、低結合性、モジュール性、及びセマンティック相互運用性に焦点を置く。クラウド・コンピューティングの中心は、相互接続されたノードのネットワークを含むインフラストラクチャである。
【0080】
ここで
図6を参照すると、クラウド・コンピューティングを利用する例示的なクラウド・コンピューティング環境600が示される。図示のように、クラウド・コンピューティング環境600は、例えば、携帯情報端末(PDA)もしくはセルラ電話640A、デスクトップ・コンピュータ640B、ラップトップ・コンピュータ640Cもしくは自動車コンピュータ・システム640N又はそれらの組み合わせなどの、クラウド・コンシューマによって使用されるローカル・コンピューティング・デバイスが通信することができる、1つ又は複数のクラウド・コンピューティング・ノード610を含む。ノード610は、互いに通信することができる。ノード610は、上述されるプライベート・クラウド、コミュニティクラウド、パブリック・クラウド、又はハイブリッドクラウド、又はそれらの組み合わせなどの、1つ又は複数のネットワークにおいて物理的に又は仮想的にグループ化することができる(図示せず)。このことは、クラウド・コンピューティング環境600が、クラウド・コンシューマがローカル・コンピューティング・デバイス上にリソースを保持する必要のないInfrastructure as a Service、Platform as a ServiceもしくはSoftware as a Service又はその組み合わせを提供することを可能にする。
図6に示されるコンピューティング・デバイス640A~Nのタイプは、単に例示的であることが意図され、コンピューティング・ノード610及びクラウド・コンピューティング環境600は、任意のタイプのネットワークもしくはネットワークアドレス指定可能な接続又はその両方を介して任意のタイプのコンピュータ化されたデバイスと通信することが可能である(例えば、ウェブ・ブラウザを用いて)ことが理解される。
【0081】
ここで
図7を参照すると、クラウド・コンピューティング環境600(
図6)により提供される機能抽象化層の例示的セットが示される。
図7に示される構成要素、層及び機能は単に例示であることを意図し、本発明の実施形態はそれらに限定されないことを予め理解されたい。図示されるように、以下の層及び対応する機能が提供される。
【0082】
ハードウェア及びソフトウェア層760は、ハードウェア構成要素及びソフトウェア構成要素を含む。ハードウェア構成要素の例として、メインフレーム761、RISC(Reduced Instruction Set Computer(縮小命令セットコンピュータ))アーキテクチャ・ベースのサーバ762、サーバ763、ブレード・サーバ764、ストレージ・デバイス765、並びにネットワーク及びネットワーキング構成要素766が含まれる。幾つかの実施形態において、ソフトウェア構成要素は、ネットワーク・アプリケーション・サーバ・ソフトウェア767と、データベース・ソフトウェア768とを含む。
【0083】
仮想化層770は、抽象化層を提供し、この層により、仮想エンティティの以下の例、すなわち、仮想サーバ771、仮想ストレージ772、仮想プライベート・ネットワークを含む仮想ネットワーク773、仮想アプリケーション及びオペレーティング・システム774、並びに仮想クライアント775を提供することができる。
【0084】
一例において、管理層780は、以下で説明される機能を提供することができる。リソース・プロビジョニング781は、クラウド・コンピューティング環境内でタスクを実行するために利用されるコンピューティング・リソース及び他のリソースの動的な調達を提供する。計量及び価格決定782は、クラウド・コンピューティング環境内でリソースが利用されたときの費用追跡と、これらのリソースの消費に対する課金又は請求とを提供する。一例において、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むことができる。セキュリティは、クラウド・コンシューマ及びタスクについての識別検証、並びにデータ及び他のリソースに対する保護を提供する。ユーザ・ポータル783は、コンシューマ及びシステム管理者に対して、クラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理784は、必要なサービス・レベルが満たされるように、クラウド・コンピューティング・リソースの割当て及び管理を提供する。サービス・レベル・アグリーメント(microservice Level Agreement、SLA)の計画及び履行785は、SLAに従って将来的な必要性が予測されるクラウド・コンピューティング・リソースの事前配置及び調達を提供する。
【0085】
作業負荷層790は、クラウド・コンピューティング環境を利用することができる機能の例を提供する。この層から提供することができる作業負荷及び機能の例として、マッピング及びナビゲーション791、ソフトウェア開発及びライフサイクル管理792、仮想教室教育配信793、データ分析処理794、トランザクション処理795、及び有機合成手順の生成796が挙げられる。
【0086】
本発明は、システム、方法もしくはコンピュータ・プログラム製品又はそれらの組み合わせを、いずれかの可能な技術的詳細レベルで統合したものとすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読ストレージ媒体(単数又は複数)を含むことができる。
【0087】
コンピュータ可読ストレージ媒体は、命令実行デバイスにより使用される命令を保持及び格納できる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、これらに限定されるものではないが、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストとして、以下のもの、すなわち、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM又はフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピー・ディスク、パンチカードもしくは命令がそこに記録された溝内の隆起構造のような機械的にエンコードされたデバイス、及び上記のいずれかの適切な組み合わせが挙げられる。本明細書で使用される場合、コンピュータ可読ストレージ媒体は、電波、又は他の自由に伝搬する電磁波、導波管もしくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、又はワイヤを通って送られる電気信号などの、一時的信号自体として解釈されない。
【0088】
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスに、又は、例えばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、及び/又は無線ネットワークなどのネットワークを介して外部コンピュータ又は外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、もしくはエッジ・サーバ、又はそれらの組み合わせを含むことができる。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カード又はネットワーク・インタフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、コンピュータ可読プログラム命令を転送して、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体内に格納する。
【0089】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、又は、Smalltalk、C++などのオブジェクト指向プログラミング言語、及び、「C」プログラミング言語もしくは類似のプログラミング言語などの従来の手続き型プログラミング言語を含む1つ又は複数のプログラミング言語の任意の組み合わせで記述されるソース・コード又はオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータもしくはサーバ上で実行される場合もある。最後のシナリオにおいて、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータへの接続がなされる場合もある(例えば、インターネットサービスプロバイダを用いたインターネットを通じて)。幾つかの実施形態において、例えば、プログラム可能論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はプログラム可能論理アレイ(PLA)を含む電子回路は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行して、電子回路を個別化することができる。
【0090】
本発明の態様は、本発明の実施形態による方法、装置(システム)及びコンピュータ・プログラム製品のフローチャート図もしくはブロック図又はその両方を参照して説明される。フローチャート図もしくはブロック図又はその両方の各ブロック、並びにフローチャート図もしくはブロック図又はその両方におけるブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されるであろう。
【0091】
これらのコンピュータ可読プログラム命令を、コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えて機械を製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャートもしくはブロック図又は両方の1つ又は複数のブロック内で指定された機能/動作を実施するための手段を作り出すようにすることができる。これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置もしくは他のデバイス又はそれらの組み合わせを特定の方式で機能させるように指示することができるコンピュータ可読媒体内に格納し、それにより、そのコンピュータ可読媒体内に格納された命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作の態様を実施する命令を含む製品を含むようにすることもできる。
【0092】
コンピュータ可読プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上で行わせてコンピュータ実施のプロセスを生産し、それにより、コンピュータ又は他のプログラム可能装置、又は他のデバイス上で実行される命令が、フローチャートもしくはブロック図又は両方の1つ又は複数のブロックにおいて指定された機能/動作を実行するためのプロセスを提供するようにすることもできる。
【0093】
図面内のフローチャート及びブロック図は、本発明の様々な実施形態による、システム、方法、及びコンピュータ・プログラム製品の可能な実装の、アーキテクチャ、機能及び動作を示す。この点に関して、フローチャート内の各ブロックは、指定された論理機能を実装するための1つ又は複数の実行可能命令を含む、モジュール、セグメント、又はコードの一部を表すことができる。幾つかの代替的な実装において、ブロック内に示される機能は、図に示される順序とは異なる順序で生じることがある。例えば、連続して示される2つのブロックは、関与する機能に応じて、実際には実質的に同時に実行されることもあり、又はこれらのブロックはときとして逆順で実行されることもある。ブロック図もしくはフローチャート図又は両方の各ブロック、及びブロック図もしくはフローチャート図又はその両方におけるブロックの組み合わせは、指定された機能又は動作を実行する、又は専用のハードウェアとコンピュータ命令との組み合わせを実行する、専用ハードウェア・ベースのシステムによって実装できることにも留意されたい。
【0094】
本開示の種々の実施形態の説明は、例示の目的のために提示されたが、これらは、網羅的であること、又は開示した実施形態に限定することを意図するものではない。本明細書で用いられる用語は、実施形態の原理、実際の適用、又は市場に見られる技術に優る技術的改善を最もよく説明するため、又は、当業者が、本明細書に開示される実施形態を理解するのを可能にするために選択された。