(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-06
(54)【発明の名称】テンプレートなしの反応予測のためのシステム及び方法
(51)【国際特許分類】
G16C 10/00 20190101AFI20240130BHJP
【FI】
G16C10/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023544355
(86)(22)【出願日】2022-01-20
(85)【翻訳文提出日】2023-09-11
(86)【国際出願番号】 US2022013083
(87)【国際公開番号】W WO2022159558
(87)【国際公開日】2022-07-28
(32)【優先日】2021-01-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523276485
【氏名又は名称】ケボティクス,インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】シェベラ,デニス
(72)【発明者】
【氏名】クライスベック,クリストフ
(72)【発明者】
【氏名】ライアン,ケビン
(72)【発明者】
【氏名】ニシャダム,チャンドラムーリ
(72)【発明者】
【氏名】シュー,ヘンギュ
(57)【要約】
本明細書に記載の技法は、標的生成物を生成するための反応の組を決定する方法及び装置に関する。方法は、標的生成物を受信することと、グラフ巡回スレッドを実行することと、グラフ巡回スレッドを介して、標的生成物のための第1の組の反応物予測を要求することと、分子拡張スレッドを実行することと、分子拡張スレッド及び反応物予測モデルを介して第1の組の反応物予測を決定することと、第1の組の反応物予測を反応の組の少なくとも一部として記憶することとを含む。
【特許請求の範囲】
【請求項1】
標的生成物を生成するための反応の組を決定するコンピュータ化された方法であって、
前記標的生成物を受信することと、
グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための第1の組の反応物予測を要求することと、
分子拡張スレッドを実行することと、
前記分子拡張スレッド及び反応物予測モデルを介して前記第1の組の反応物予測を決定することと、
前記第1の組の反応物予測を前記反応の組の少なくとも一部として記憶することと
を含むコンピュータ化された方法。
【請求項2】
前記グラフ巡回スレッドを介して、前記第1の組の反応物予測から反応物予測のための第2の組の反応物予測を要求することと、
第2の分子拡張スレッドを実行することと、
前記第2の分子拡張スレッド及び前記反応物予測モデルを介して前記第2の組の反応物予測を決定することと
を更に含む、請求項1に記載の方法。
【請求項3】
前記第2の組の反応物予測を前記第1の組の反応物予測と共に前記反応の組の少なくとも一部として記憶することを更に含む、請求項2に記載の方法。
【請求項4】
トレーニング反応の組にアクセスすることと、
前記トレーニング反応の組を使用して前記反応物予測モデルをトレーニングすることと
を更に含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記トレーニング反応の組を使用して前記反応物予測モデルをトレーニングすることは、トレーニング中に前記トレーニング反応の組を増分的に増強することを含む、請求項4に記載の方法。
【請求項6】
前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第1の部分を増強することと、
前記トレーニング反応の組の前記増強された第1の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第1の部分内の各トレーニング反応について、
前記トレーニング反応の生成物を入力として使用すること、及び
前記トレーニング反応の反応の組を出力として使用すること
を含む、トレーニングすることと
を含む、請求項5に記載の方法。
【請求項7】
前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第2の部分を増強することと、
前記トレーニング反応の組の前記増強された第2の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第2の部分内の各トレーニング反応について、
前記トレーニング反応の生成物を前記入力として使用すること、及び
前記トレーニング反応の反応の組を前記出力として使用すること
を含む、トレーニングすることと
を含む、請求項6に記載の方法。
【請求項8】
前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第1の部分を増強することと、
前記トレーニング反応の組の前記増強された第1の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第1の部分内の各トレーニング反応について、
前記トレーニング反応の反応の組を入力として使用すること、及び
前記トレーニング反応の生成物を出力として使用すること
を含む、トレーニングすることと
を含む、請求項5~7のいずれか一項に記載の方法。
【請求項9】
前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第2の部分を増強することと、
前記トレーニング反応の組の前記増強された第2の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第2の部分内の各トレーニング反応について、
前記トレーニング反応の反応の組を前記入力として使用すること、及び
前記トレーニング反応の生成物を前記出力として使用すること
を含む、トレーニングすることと
を含む、請求項8に記載の方法。
【請求項10】
オーケストレータスレッドを実行することを更に含み、前記オーケストレータスレッドは、
前記グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための前記第1の組の反応物予測の前記要求を受信することと、
前記分子拡張スレッドを実行して、前記第1の組の反応物予測を決定することと
を行う、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記オーケストレータスレッドは、前記決定された第1の組の反応物予測を前記グラフ巡回スレッドに送信する、請求項10に記載の方法。
【請求項12】
前記オーケストレータスレッドは、前記第1の組の反応物予測を記憶して、逆合成グラフを維持する、請求項10又は11に記載の方法。
【請求項13】
前記逆合成グラフに対してツリー検索を実行して、前記逆合成グラフを通して可能なルートの組を識別することを更に含み、前記可能なルートの組の各ルートは、前記標的生成物を構築するための関連する方法を表す、請求項12に記載の方法。
【請求項14】
前記可能なルートの組において識別された各ルートについて、反応物-生成物対のブラックリストを更新することを更に含む、請求項13に記載の方法。
【請求項15】
前記ツリー検索中、1つ又は複数の追加のルートが前記ブラックリスト内の反応-生成物対における反応を含むと決定することにより、前記可能なルートの組から前記1つ又は複数の追加のルートを省くことを更に含む、請求項14に記載の方法。
【請求項16】
前記反応物予測モデルは、前記標的生成物に基づいて前記第1の組の反応物予測を決定する、トレーニングされた単一ステップ逆合成モデルである、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記単一ステップ逆合成モデルは、
入力反応物の組に基づいて生成物予測を生じさせるように構成される、トレーニングされた順方向予測モデルと、
入力生成物に基づいて反応物予測の組を生じさせるように構成される、トレーニングされた逆方向予測モデルと
を含む、請求項16に記載の方法。
【請求項18】
前記入力反応物の組、前記反応物予測の組又は両方は、
1つ又は複数の試薬、
1つ又は複数の触媒、及び
1つ又は複数の溶媒
の1つ又は複数を含む、請求項17に記載の方法。
【請求項19】
前記反応物予測モデルを介して前記第1の組の反応物予測を決定することは、
前記トレーニングされた逆方向予測モデルを前記標的生成物に対して実行することにより、前記第1の組の反応物予測を予測することと、
前記トレーニングされた順方向予測モデルを前記第1の組の反応物予測に対して実行することにより、生成物を予測することと、
前記標的生成物を、前記予測された生成物と比較して、前記第1の組の反応物予測を記憶するか否かを決定することと
を含む、請求項17又は18に記載の方法。
【請求項20】
命令を含む非一時的コンピュータ可読媒体であって、前記命令は、1つ又は複数のプロセッサによって計算デバイスで実行されると、前記1つ又は複数のプロセッサに、標的生成物を生成するための反応の組を、
前記標的生成物を受信することと、
グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための第1の組の反応物予測を要求することと、
分子拡張スレッドを実行することと、
前記分子拡張スレッド及び反応物予測モデルを介して前記第1の組の反応物予測を決定することと、
前記第1の組の反応物予測を前記反応の組の少なくとも一部として記憶することと
を行うことによって決定させるように動作可能である、非一時的コンピュータ可読媒体。
【請求項21】
命令を記憶するメモリと、少なくとも1つのプロセッサであって、前記命令を実行して、標的生成物を生成するための反応の組を、
前記標的生成物を受信することと、
グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための第1の組の反応物予測を要求することと、
分子拡張スレッドを実行することと、
前記分子拡張スレッド及び反応物予測モデルを介して前記第1の組の反応物予測を決定することと、
前記第1の組の反応物予測を前記反応の組の少なくとも一部として記憶することと
を行うことによって決定するように構成された少なくとも1つのプロセッサとを含むシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本願は、米国特許法第119条(e)の下、2021年1月21日付けで出願された「SYSTEMS AND METHODS FOR TEMPLATE-FREE REACTION PREDICTIONS」という名称の米国仮特許出願第63/140,090号の利益を主張するものであり、これは、全体として参照により本明細書に援用される。
【0002】
分野
本願は、概して、反応を予測するための、テンプレートなしの技法に関する。
【背景技術】
【0003】
背景
化学空間の探索は、創薬、材料合成及び生体分子化学等の多くの研究分野の中心である。化学探索は、可能な変換の空間が膨大であり、熟練した化学者を必要とするため、困難な問題であり得る。新規の化学反応及び合成経路の発見は、合成化学の永続的な目標であるが、それには何年もの知識及び経験が必要とされる。したがって、反応予測、逆合成及び/又は化学物質示唆等の種々の合成タスクで化学者を支援する化学予測ツールの提供を含めて、性質が改良された新規の分子を合成する際に化学者の創造性を支援し得る新しい技術を提供することが望まれている。
【発明の概要】
【0004】
概要
一態様では、標的生成物を生成するための反応の組(例えば、化学反応ネットワーク又はグラフ)を決定するコンピュータ化された方法が提供される。本方法は、標的生成物を受信することと、グラフ巡回スレッドを実行することと、グラフ巡回スレッドを介して、標的生成物のための第1の組の反応物予測を要求することと、分子拡張スレッドを実行することと、分子拡張スレッド及び反応物予測モデル(例えば、単一ステップ逆合成モデル)を介して第1の組の反応物予測を決定することと、第1の組の反応物予測を反応の組の少なくとも一部として記憶することとを含む。
【0005】
上記の概念及びより詳細に後述される追加の概念の全ての組合せは、(そのような概念が相互に矛盾しないことを条件として)本明細書に開示される本発明の主題の一部として企図されることを理解されたい。特に、本開示の末尾に見られる請求項に記載の主題の全ての組合せは、本明細書に開示される本発明の主題の一部として企図される。上記の概念及び後述の追加の概念は、任意の適した組合せで構成可能であり、本開示は、これに関して限定されないことを更に理解されたい。更に、添付図と併せて考慮される場合、種々の非限定的な実施形態の以下の詳細な説明から本開示の他の利点及び新規な特徴が明らかになるであろう。
【0006】
図面の簡単な説明
種々の態様及び実施形態について、以下の図を参照して本明細書で説明する。図は、必ずしも一定の縮尺であるわけではないことを理解されたい。複数の図に現れる項目は、それらが現れる全ての図において同じ又は同様の参照番号で示される。
【図面の簡単な説明】
【0007】
【
図1】幾つかの実施形態による、テンプレートなしの反応予測を提供する例示的なシステムの図である。
【
図2】幾つかの実施形態による例示的な反応予測フローの図である。
【
図3A】幾つかの実施形態による、逆合成を使用した化学空間における反応ネットワークグラフの生成を示す図である。
【
図3B】幾つかの実施形態による、化学空間における反応ネットワークグラフの生成の別の例の図である。
【
図4】幾つかの実施形態による例示的なモデル予測プロセスの態様の図である。
【
図5】幾つかの実施形態による、標的生成物を生成するための反応の組を決定する例示的なコンピュータ化された方法を示す図である。
【
図6】幾つかの実施形態による、反応予測に使用することができる例示的な文字列の図である。
【
図7】幾つかの実施形態による、順方向モデル及び逆方向モデルを使用した単一ステップ逆合成予測の例示的なコンピュータ化されたプロセスの図である。
【
図8】本明細書に記載の技術の実施形態の実施に使用し得る例示的なコンピュータシステムのブロック図を示す。
【発明を実施するための形態】
【0008】
詳細な説明
逆合成は、標的分子を合成するための一連の化学変換の識別を目的とする。単一ステップ逆合成フォーミュレーションでは、タスクは、所与の標的の反応物分子の組を識別することである。従来の逆合成予測技法は、多くの場合、既知の反応のデータベース中の変換を調べる必要がある。可能な化学変換の膨大な空間は、逆合成を困難な問題にし、典型的には熟練した化学者の技能を必要とする。合成計画では、化学者は、最終生成物を可視化し、一層より単純な化合物に向かって逆方向に作業する必要がある。新規経路の合成は、中間ステップ数、利用可能な開始材料、コスト、収量、毒性及び/又は他の要因等の多くの要因の最適化に依存するため、困難なタスクである。更に、多くの標的化合物では、代替の合成ルートを確立することが可能であり、その目標は、他の部分を変えずに分子の一部分のみに影響する反応を発見することである。
【0009】
合成計画では、確立された知識を超えて探検する能力が必要になることもあり、これは、典型的には、既知の反応のデータベースに依存する従来の技法を使用して可能ではない。本発明者らは、新しい変換を発見及び/又は再発見することを目標として、データ駆動AIモデルを使用してそのような論拠の追加を試みることができることを認めた。AIモデルは、テンプレートベースのモデル(例えば、シンボリックAIを用いた深層学習手法、グラフ畳み込みネットワーク等)及びテンプレートなしのモデル(例えば、分子トランスフォーマーモデル)を含み得る。テンプレートベースのモデルは、反応のデータベースから化学変換(例えば、テンプレート)を学習することにより構築することができ、順方向反応予測又は逆合成等の種々の合成タスクを行うために使用することができる。テンプレートなしのモデルは、機械翻訳モデル(例えば、自然言語処理に使用されるもの)に基づき得、したがってテキストベースの反応(例えば、Simplified Molecular Input Line-Entry System(SMILES)記法での入力)を使用してトレーニングすることができる。
【0010】
分子及び科学反応は、化学反応ネットワーク又はグラフとして表すことができ、その場合、分子は、ノードに対応し、反応は、これらのノード間の有向接続に対応する。反応は、限定ではなく、共有結合、イオン結合、配位結合、ファンデルワールス相互作用、疎水性相互作用、静電相互作用、原子複合体及びゲノム構成(例えば、分子ケージに含まれる分子)等を含めて、例えば電子の位置及び/又はフォーメーションの変化又は原子間の化学結合の破断を含む任意の種類の化学反応を含み得る。本発明者らは、テンプレートなしのモデルを使用して、そのようなネットワークを構築できることを発見し、認めた。特に、テンプレートなしのモデルは、データセット内の化学(例えば、変換規則)により制限される必要がないため、所望の柔軟性を提供することができる。加えて又は代わりに、テンプレートなしのモデルは、テキストベースの反応により指定された反応物及び生成物内の化学モチーフ間の相関を学習することにより、化学空間で外挿することができる。しかしながら、テンプレートなしのモデルを使用して化学反応ネットワークを構築することには、種々の欠陥があり得る。例えば、拡張する分子を識別する技法が必要であり得、化学反応ネットワークを構築するためにそれらの分子を拡張する技法も必要であり得る。しかしながら、そのような処理タスクを切り離すことができない場合、相当なオーバーヘッド及び非効率性を化学反応ネットワークの構築に付加する恐れがある。本発明者らは、したがって、種々のスレッドを利用して、反応の組を決定するために必要な処理を分散する、標的生成物を生成するための反応の組(例えば、化学反応ネットワーク又はグラフ)を決定する技法を開発した。幾つかの実施形態では、グラフ巡回スレッドを使用して、拡張する分子を反復的に識別し、標的生成物の最終的な作成に使用することができる化学ネットワークを作成する。1つ又は複数の分子拡張スレッドを使用して、予測モデル(例えば、単一ステップ逆合成モデル)を実行し、グラフ巡回スレッドにより拡張するものとして識別された分子の反応予測を決定することができる。グラフ巡回スレッドからの要求数に応じて、複数の分子拡張スレッドを実行することができる。グラフ巡回スレッド及び分子拡張スレッドの反復実行により、標的生成物を構築するための反応の組を最終的に決定する効率的で堅牢な技法をもたらすことができる。
【0011】
本発明者らは、そのようなモデルのトレーニングに使用される従来の技法に伴う問題を更に発見し、認めた。特に、モデルのトレーニングに大きいデータセットが必要とされることが多い。イメージベースのデータセット等の一部のトレーニングセットについて、データは、トレーニングのために増強することができる。例えば、イメージ認識モデルのトレーニング手法は、ランダムな回転、スキュー、明度及びコントラストの調整等の増強を行うことを含み得る(例えば、そのような増強は、認識される、イメージが含む物体の存在に影響すべきではないため)。しかしながら、本発明者らは、非イメージベースのトレーニングセット(例えば、テキストベースのモデルに使用することができる)等の他のタイプのトレーニングデータを増強する必要があることを認めた。特に、本発明者らは、テキストベースのモデルに向けたそのようなイメージベースの増強に類似するものがなく、そのため、既存のテキストベースのプラットフォームがテキストベースの入力に増強ツールを提供しない(及び増強技法の追加さえも可能でないことがある)ことを認めた。
【0012】
本発明者らは、データ増強が大きい記憶要件を課す恐れがあることを更に認めた。例えば、従来の増強手法は、多くの場合、データセットの幾つかの異なるコピーを生じさせる必要がある(例えば、モデルが、トレーニングの過程にわたり処理するのに十分なデータを有するように)。しかしながら、トレーニング中にコピーを記憶する必要があり、トレーニングプロセスは、数日又は数週間にわたって実行され得るため、そのような従来の手法は、ストレージに大きい影響を及ぼし得る。例えば、全てのトレーニング例をループするために1時間かかり、モデルが3日の過程にわたって収束する場合、従来の手法は、データ増強から同等の例多様性を有するために、トレーニングセットの72(24*3)個のコピーを作成する必要がある。このポイントを更に示すために、トレーニング時間が5倍に増える場合、ストレージ要件も同様に5倍大きくなる(例えば、データセットの360(24*3*5)個のコピー)。
【0013】
本発明者らは、したがって、反復的増強技法を提供する入力増強パイプラインを開発した。本技法は、モデルの堅牢性を改善するように入力例を変更することを含めて、テキストベースのトレーニングデータセットの増強を提供する。本技法は、トレーニングデータのサブセットを増強し、更なるサブセットが増強されている間、それらのサブセットを使用してモデルを反復的にトレーニングすることを更に提供する。本技法は、従来の手法と比較して、本明細書に記載の反復的手法を使用して記憶する必要があるデータ量が劇的に少ないため、記憶要件を劇的に低減することができる。そのような技法は、順方向予測モデル及び逆方向予測モデルの両方のトレーニングに使用することができ、各モデルにより予測された結果を検証するために、これらのモデルは、単一ステップ逆合成予測に向けて一緒に実行することができる。
【0014】
テンプレートなしのモデルの特定の例示的な実施形態について本明細書で更に説明するが、モデルに関連する全ての構成要素(モデルのトレーニング及び/又はモデルのデプロイを含む)の他の代替の実施形態は、異なる用途に合うように相互交換可能である。図を参照して、テンプレートなしのモデル及び対応する方法の特定の非限定的な実施形態が更に詳述される。これらの実施形態に関して説明される種々のシステム、構成要素、特徴及び方法は、独立して及び/又は任意の所望の組合せで使用することができ、本開示は、本明細書に記載の特定の実施形態のみに限定されないことを理解されたい。
【0015】
幾つかの実施形態では、本技法は、化学反応予測を行うためのポータル又はウェブインタフェース等のツールを提供することができる。幾つかの実施形態では、ツールは、1つ又は複数のウェブページをユーザに提供する1つ又は複数の計算デバイスにより提供することができる。ウェブページを使用して、予測の計算態様を行うために必要なデータを収集することができる。
図1は、幾つかの実施形態による、テンプレートなしの反応予測を提供する例示的なシステム100の図である。システム100は、ネットワーク106を通して1つ又は複数のリモート計算デバイス104と通信するユーザコンピュータデバイス102を含む。ユーザ計算デバイス102は、スマートフォン、ラップトップ及び/又はデスクトップ等の任意の計算デバイスであり得る。1つ又は複数のリモート計算デバイス104は、本明細書に記載の技法の提供に使用される任意の適した計算デバイスであり得、デスクトップ又はラップトップコンピュータ、ウェブサーバ、データサーバ、バックエンドサーバ及び/又はクラウド計算リソース等を含み得る。本明細書に記載のように、リモート計算デバイス104は、ユーザが、本明細書に記載の技法に従って分子の化学予測、高スループットスクリーニング及び/又は合成可能性予測を行うことを可能にするオンラインツールを提供し得る。
【0016】
図2は、幾つかの実施形態による例示的な反応予測フロー200の図である。予測エンジン202は、入力/所望の生成物204を受信し、逆合成解析206、反応予測208及び/又は試薬予測210の1つ又は複数を行うことができる。本明細書に記載のように、予測エンジン202は、生成物204(例えば、標的分子)に基づいて化学反応ネットワークを構築して、現実世界の化学系の挙動をモデリングすることができる。予測エンジン202は、反応グラフを解析して、逆合成206等の種々のタスクにおいて化学者を支援することができる。例えば、予測エンジンは、順方向反応予測等のタスクについて、本明細書に記載の種々のアルゴリズムを使用してグラフを解析することができる。予測エンジン202は、更に後述するトランスフォーマーモデルを利用することなどにより、反応予測208及び/又は試薬予測210を提供することもできる。
【0017】
幾つかの実施形態では、予測エンジン202は、利用可能な選択肢のリストをユーザに送信することができる(例えば、ユーザインタフェースを介して)。ユーザは、予測エンジン202へのクエリの選択肢を構成することができる。例えば、システムは、選択肢を使用して、グラフィカルユーザインタフェースの部分を動的に生じさせ得る。別の例として、選択肢は、クエリ及び/又は予測に関連するパラメータをユーザが変更することを可能にする、構成された選択肢の組を予測エンジン202が受信することを可能にし得る。構成可能な選択肢の例には、予測ランタイム、追加のフィードストック及び/又はモデル予測を制御する構成(例えば、所望のルート数、ルートにおける最大反応、分子/反応ブラックリスト等)がある。
【0018】
幾つかの実施形態では、予測エンジン202は、各予測の反応ネットワークグラフを生じさせることができる。分子は、予め投入され、及び/又は化学者の要件に従って投入され得る。幾つかの実施形態では、標的の分子、反応又は試薬を所与として、予測エンジンは、入力分子から始まる一連の単一ステップ逆合成ステップを通して反応ネットワークを生じさせることができる。
図3Aは、幾つかの実施形態による、逆合成を使用した化学空間における反応ネットワークグラフの生成の簡易化された例を示す
図300である。標的分子A302を所与として、予測エンジンは、304及び306に示されるように、一連の単一ステップ逆合成を通して反応ネットワークを生じさせる。幾つかの実施形態では、入力された標的分子及びフィードストック分子は、SMILES記法等のテキスト文字列ベースの記法又は本明細書に記載されるものなどの他の記法で指定することができる。304に示されるように、第1の逆合成ステップは、グラフにおいて分子「B」、「C」、「D」及び「E」を生じさせ、これらは、それぞれ試薬R
1、R
2、R
3及びR
4に関連付けられる。次いで、グラフ巡回アルゴリズムは、次の標的(この例では分子B)を選択し、別の単一ステップ逆合成を行い、したがって所望の合成経路が見つけられるまでグラフ反応ネットワークを生じさせる。したがって、グラフ306は、グラフにおいて分子「F」、「G」及び「H」を更に含み、これらは、それぞれ試薬R
7、R
6及びR
5に関連付けられる。304及び306における矢頭は、反応の方向を示す。
図3Aに示されるグラフは、例示を目的としており、実際には、グラフは、はるかに大きい可能性があることを理解されたい。例えば、本技法は、平均で毎分5000反応を超える速度で反応を生じさせる大きい反応ネットワークグラフを生成することができる(例えば、1GPU当たり概ね5000反応/分であり、したがってGPUの数に従ってスケーリングすることができる)。
【0019】
図3Bは、幾つかの実施形態による、化学空間における反応ネットワークグラフの生成の別の例の
図350である。セクション352は、3つの反応例を示し、A、B、C、D、E、F、Gは、化合物であり、R
1~R
3は、試薬である。セクション354は、セクション352に示される化学反応のグラフネットワークを示し、
図3Aのように、分子A、B、C、D、E、F、Gは、ノードに対応し、反応は、これらのノード間の有向接続に対応する。
【0020】
本明細書に記載の技法は、標的分子の逆合成を行って、標的分子の構築に使用することができる反応の組を識別するために使用することができる。
図4は、幾つかの実施形態による例示的なモデル予測プロセス400の態様の図である。本明細書に記載のように、予測プロセスは、例えば、テンプレートなしのモデルを使用して行われ得る。示されるように、モデル予測プロセスは、逆合成要求402、拡張オーケストレータ404(グラフ巡回スレッド406及び分子拡張スレッド408を調整する)、ツリー検索410及び逆合成結果412を含む。
【0021】
図4を
図5と併せて説明し、
図5は、幾つかの実施形態による、標的生成物を生成するための反応の組(例えば、化学反応ネットワーク又はグラフ)を決定する例示的なコンピュータ化された方法500を示す図である。ステップ502において、予測エンジンは、逆合成要求402の標的生成物を受信する。ステップ504において、拡張オーケストレータ404は、グラフ巡回スレッド406を実行する。ステップ506において、予測エンジン要求は、グラフ巡回スレッド406を介して、標的生成物のための第1の組の反応物予測を要求する。それに応答して、ステップ508において、拡張オーケストレータ404は、分子拡張スレッド408を実行する。ステップ510において、予測エンジンは、分子拡張スレッド408及び反応物予測モデル(例えば、単一ステップ逆合成モデル)を介して第1の組の反応物予測を実行する。ステップ512において、予測エンジンは、第1の組の反応物予測を反応の組の少なくとも一部として記憶する。
【0022】
方法500は、ステップ506に戻り、ステップ510において決定された結果に対して更なる予測を行って、フルセットの結果を構築(例えば、完全な化学反応ネットワークを構築)する。例えば、
図3Aを参照すると、分子A302に対するステップ506~512の第1の実行は、化学ネットワーク内の分子「B」、「C」、「D」及び「E」(並びにそれぞれ試薬R
1、R
2、R
3及びR
4)を有する、304に示されるグラフの部分を生じさせることができる。ステップ506~512の第2の反復を次の標的(この例では分子B)に対して行って、別の単一ステップ逆合成を行い、したがってグラフ306を生じさせることができ、グラフ306は、分子Bから生じる分子「F」、「G」及び「H」(並びにそれぞれ試薬R
7、R
6及びR
5)をグラフに更に含む。
【0023】
構築されると、予測エンジンは、ツリー検索(例えば、
図4の410)を行い、逆合成要求402に応答してユーザに提供される逆合成結果412を最終的に生じさせる。ツリー検索410は、化学反応ネットワーク又はグラフに基づいて、標的分子を構築することができる複数の異なる経路を識別するために使用することができる。例えば、
図3Aを更に参照すると、化学ネットワーク内の「B」、「C」、「D」及び「E」(並びにそれぞれ試薬R
1、R
2、R
3及びR
4)のいずれかを使用して、標的分子A302を構築することができる。分子「B」が選択される場合、「B」の構築に利用可能な3つの更なる選択肢がある:1つの選択肢は、分子「F」及び試薬R
7を使用することであり、第2の選択肢は、分子「G」及び試薬R
6を使用することであり、第3の選択肢は、分子「H」及び試薬R
8を使用することである。その結果、逆合成結果412は、標的生成物の構築に使用することができる異なる技法のリストを含み得る。
【0024】
本発明者らは、結果の組(例えば、逆合成グラフ)が、化学的に重要ではないように異なる幾つかのルートを含み得ることを認めた。この一例は、反応の1つで異なる溶媒を使用するによってのみ異なる2つのルートである。幾つかの実施形態では、技法は、溶媒及び他の関連する詳細を直接予測すること含み得るため、結果は、そのような問題を特に受けやすいことがある。幾つかの実施形態では、そのような違いが重要ではないルートは、改変された検索戦略を使用して対処することができる。例えば、技法は、ツリー検索を繰り返し呼び出して、逆合成グラフ内で「最良」の(例えば、指定又は構成することができる任意/相互交換可能な基準に従って)ルートを見つけることを含み得る。各ツリー検索後、返されたルート内の幾つか及び/又は全ての反応から反応物-生成物対のブラックリストを作成することができる。連続する各ツリー検索は、ブラックリストに見られる反応-生成物対を含む反応の幾つか及び/又は全ての使用を禁止することができる。この検索プロセスは、例えば、要求された数のルートが見つかるまで、プロセスが時間切れするまで、及び/又は逆合成グラフ内の可能な全てのツリーが尽きるまで繰り返すことができる。
【0025】
逆合成結果を識別する例示的な技法としてツリー検索が本明細書で考察されるが、他のタイプの検索も本明細書に記載の技法と併用できることを理解されたい。他の例示的な検索戦略には、例えば、深さ優先検索、幅優先検索及び/又は反復深化深さ優先検索等がある。幾つかの実施形態では、結果(例えば、化学反応ネットワーク)は、検索前に前処理することができる。ツリー検索前及び/又は逆合成拡張ループ(例えば、拡張オーケストレータ404による)中など、プルーニングを行うことができる。例えば、プルーニングプロセスは、検索前に結果に対して行われて、最良ルートの一部であり得るか否かの決定に基づいて反応をプルーニングすることができる。例えば、反応が、指定されたリスト外のストックを必要とする場合、反応が完全なルートをもたらすことができない(例えば、フィードストック内の全ての開始材料を用いて)場合、反応が、ブラックリストに記載された分子、ブラックリストに記載された反応、望ましくない性質(例えば、中間体の溶解度、反応速度、反応エンタルピー及び/又は熱力学等)等を有する反応を含む場合、反応をプルーニングし得る。
【0026】
グラフ巡回スレッド406は、拡張オーケストレータ404により使用されて、特定のステップから予測された反応を解析して、後続ステップでの更に拡張する分子を識別することにより、化学反応ネットワークのルート(例えば、分岐)を繰り返し構築することができる。拡張オーケストレータ404は、拡張オーケストレータ404と数ミリ秒毎に1回等、頻繁に通信することができる。グラフ巡回スレッド406は、分子拡張要求を拡張オーケストレータ404に送信することができ、拡張オーケストレータ404により行われた逆合成グラフ更新を検索することができる。
【0027】
幾つかの実施形態では、拡張オーケストレータ404は、グラフ巡回スレッド406とは別個のスレッド又はプロセスとして実行することができ、分子拡張スレッド408は、グラフ巡回スレッド406及び分子拡張スレッド408を調整することができる。一般に、拡張オーケストレータ404は、グラフ巡回スレッド406を(繰り返し)実行することができ、反応(例えば、文字列として)及び信頼度(例えば、浮動小数等の数として)のリストを必要に応じてグラフ巡回スレッド406に提供することができる。拡張オーケストレータ404は、新しい分子(例えば、標的生成物及び/又は予測プロセスを通して決定された他の分子)の反応物予測についての分子拡張要求をグラフ巡回スレッド406から受信することができる。拡張オーケストレータ404は、それに従って分子拡張スレッド408の実行を調整して、グラフ巡回スレッド406により要求された反応物予測を決定することができる。説明のための例として、幾つかの実施形態では、拡張オーケストレータ404は、Pythonキュー等のキューを利用してグラフ巡回ワーカー406と連係することができる。別の例として、拡張オーケストレータ404は、Dask機能を利用して分子拡張スレッド408のリアルタイム実行を提供することができる。しかしながら、Python及びDaskは、単なる例であり、限定を意図していないことを理解されたい。
【0028】
拡張オーケストレータ404は、分子拡張スレッド408に対する必要数の進行中拡張要求を維持することができる。グラフ巡回スレッド406からの各拡張要求について、拡張オーケストレータ404は、関連付けられた分子拡張スレッド408を実行して分子拡張プロセスを行い、化学反応ネットワークを構築するための新しい組の反応物予測を識別することができる。各分子拡張要求に対して反応物予測を生じさせるために、分子拡張スレッド408は、
図7と併せて説明する単一ステップ逆合成予測をそれぞれ行うことができる。拡張オーケストレータ404は、各分子拡張スレッド408に拡張する分子(例えば、文字列として)、モデル経路(例えば、文字列として)及び/又は拡張プロセスの選択肢(例えば、文字列及び/又は浮動小数若しくは整数等の数として)を提供することができる。各分子拡張スレッド408は、反応(例えば、文字列として)及び信頼度(例えば、浮動小数として)のリストを拡張オーケストレータに提供することができる。
【0029】
拡張オーケストレータ404は、分子拡張スレッド408が、グラフ巡回スレッド406から発行された要求された拡張を行うにつれて、分子拡張スレッド408から分子拡張結果を検索し、蓄積することができる。拡張オーケストレータ404は、分子拡張スレッド408から受信されると、新しい拡張結果を追加することにより、逆合成ネットワーク又はグラフのマスターコピーを更新及び維持することができる。拡張オーケストレータ404は、更なる拡張について考慮するために、逆合成グラフ更新をグラフ巡回スレッド406に送信することができる。
【0030】
幾つかの実施形態では、分子拡張スレッド408により利用される拡張プロセスは、自然言語(NL)処理技法を使用して反応予想及び逆合成を行うように構成することができる。幾つかの実施形態では、テンプレートなしのモデルは、機械翻訳モデル又はトランスフォーマーモデルである。トランスフォーマーモデルは、翻訳及びオートコンプリ-ション等の自然言語処理タスクに使用することができる。トランスフォーマーモデルの一例は、Segler, M., Preuss, M. & Waller, M. P.,“Towards‘Alphachem’: Chemical synthesis planning with tree search and deep neural network policies,”5th International Conference on Learning Representations, ICLR 2017 - Workshop Track Proceedings (2019)に記載されており、これは、全体として参照により本明細書に援用される。トランスフォーマーモデルは、化学での反応予測及び単一ステップ逆合成問題に使用することができる。したがって、モデルは、反応物、試薬及び生成物の文字列間の機械翻訳技法を使用して反応予測を行うように設計することができる。幾つかの実施形態では、文字列は、SMILES文字列等のテキストベースの表現又は本明細書に記載されるものなどの他の表現を使用して指定することができる。
【0031】
幾つかの実施形態では、本技法は、1つ又は複数の逆合成モデルを使用するように構成することができる。幾つかの実施形態では、システムは、同じモデルの複数のインスタンスを実行することができる。幾つかの実施形態では、システムは、複数の異なるモデルを実行することができる。拡張オーケストレータ404は、1つ又は複数の逆合成モデルと通信するように構成することができる。幾つかの実施形態では、複数の単一ステップ逆合成モデルを使用する場合、拡張オーケストレータ404は、拡張要求を複数のモデルにルーティングするように構成することができる。例えば、各拡張要求は、実行中のモデルのサブセット及び/又は全てにルーティングされ得る。同じモデルを複数実行している(例えば、単独で及び/又は他の異なるモデルと組み合わせて)場合、拡張オーケストレータ404は、拡張要求を同じモデルの全てにルーティングするように構成することができる。異なる複数のモデルを実行している場合、拡張要求は、異なる複数のモデルに基づいてルーティングすることができる。例えば、拡張要求は、拡張要求に基づいて、拡張要求を適切なモデルに(例えば、必要な専門知識特性、性能特性、スループット特性等の該当する特性を有するモデルのみに)送信するように構成することができるルーティング規則及び/又はルーティングモデルを使用することなどにより、特定のモデルに選択的にルーティングすることができる。
【0032】
幾つかの実施形態では、同じニューラルネットワークアーキテクチャ及び/又は異なるニューラルネットワークアーキテクチャを使用して、異なる複数の単一ステップ逆合成モデルを生じさせることができる。例えば、同じニューラルネットワークアーキテクチャ及びアルゴリズム(例えば、
図7と併せて説明される)は、複数のモデルに使用することができるが、異なるトレーニングデータを使用して異なるモデルを達成することができる。別の例として、単一ステップ逆合成モデルは、異なるモデルアーキテクチャ及びアルゴリズムを含み得る。例えば、単一ステップ予測モデルは、記憶されている反応(例えば、既知の反応)に対してデータベースルックアップを行うように構成することができる。各単一ステップ逆合成モデルは、(例えば、モデル構造、ネットワーク及び/又はアルゴリズムを問わず)入力として生成物をとり、出力として示唆された反応(及び関連付けられた信頼度)を返すように構成することができる。その結果、システムは、モデルアーキテクチャ及び/又はアルゴリズムを問わず、各モデルと対話するように構成することができる。
【0033】
幾つかの実施形態では、分子拡張スレッド408は、複数のモデルを実行するように構成することができる。例えば、1つ又は複数の分子拡張スレッド408は、複数のモデルの各々に対して実行することができる。幾つかの実施形態では、分子拡張スレッド408は、本明細書に記載のように異なるモデルを実行することができる。本技法は、複数のモデルを使用する場合、分子拡張スレッド408をスケーリングするように構成することができる。例えば、2つのモデル拡張スレッド408がそれぞれ異なるモデルを実行するように構成される場合、本技法は、異なる分子拡張スレッド408にルーティングされた要求に基づいて負荷平衡を行うことを含み得る。例えば、第1のモデルに第2のモデルよりも多くの予測がルーティングされる場合、システムは、予測の非対称需要を取り扱い、モデルの負荷平衡を達成するために、第2のモデルと比べて第1のモデルにより多くの分子拡張スレッド408を作成することができる。
【0034】
図6は、幾つかの実施形態による、反応予測についてモデルをトレーニングするために使用することができる例示的な文字列の
図600である。
図600の例は、図示の反応のSMILES記法での文字列602を含む。文字列602に示されるように、反応物、試薬及び生成物は、大なり(>)記号を使用して区切ることができる。その結果、テンプレートなしのモデルは、利用可能な変換に制限される必要がなく、したがってより大きい化学空間を包含することが可能であり得る。
【0035】
幾つかの実施形態では、トレーニングされた機械学習モデルは、標的生成物に基づいて反応物予測の組を決定する、トレーニングされた単一ステップ逆合成モデルである。幾つかの実施形態では、モデルは、複数のモデルを含み得る。幾つかの実施形態では、単一ステップ逆合成モデルは、入力反応物の組に基づいて生成物予測を生じさせるように構成される、トレーニングされた順方向予測モデルと、入力生成物に基づいて反応物予測の組を生じさせるように構成される、トレーニングされた逆方向予測モデルとを含む。その結果、入力生成物が予測生成物と比較されて、反応物予測の組を検証することができる。ビームサーチを使用してルートを発見し、及び/又はサンプリング戦略を使用してルートを発見するなど、異なるルート発見戦略をモデルに使用することができる。
【0036】
幾つかの実施形態では、ビームサーチは、発見された逆合成ルートの多様性を(例えば、大幅に)制限することができ、ビームサーチにより生成される予測の多くは、化学的視点から互いに類似するため、逆方向予測モデルは、ビームサーチの代わりにサンプリング戦略を利用するように構成することができる。その結果、サンプリング戦略の利用は、本明細書に記載の技法全体の品質及び有効性を改善することができる。例えば、シーケンスモデルは、次の位置における可能なトークンにわたる確率分布を予測することができ、その結果、繰り返し評価されなければならず、一度にトークン1つずつでシーケンスを構築する(例えば、復号化と呼ぶことができる)。ナイーブ戦略の一例は、欲張り復号化であり、最も可能性の高いトークン(モデルにより評価される)が復号化プロセスの各反復で選択される。ビームサーチは、各反復でk個の最も可能性の高い予測の組を維持することにより、この手法を拡張することができる(例えば、kは、ビームと呼ぶことができる)。なお、k=1の場合、ビームサーチは、基本的に欲張り復号化と同じである。逆に、サンプリングは、各確率(例えば、多項分布からのサンプリング)で重み付けられたトークンを無作為に選択することを含む。トークンの確率は、低及び高確率トークンの相対尤度を調整する「温度」パラメータを用いて変更することもできる。例えば、温度0は、多項分布をargmaxに低減する一方、無限温度は、均一分布に低減する。実際には、温度が高いほど、予測の全体品質が下がるが、多様性が上がる。最も可能性の高い予測は、通常、確率密度の大半を有するため(例えば、通常、反応には1つのみの可能な生成物があるため)、順方向予測モデルは、欲張り復号化を使用することができる。逆方向モデルは、サンプリング方式を使用して、所与の生成物を作る多様な可能な反応物/化学物質を生じさせることができる。サンプリング温度に関して、1前後及び/又は1よりわずかに低い温度(例えば、0.7、0.75、0.8、0.85)を使用することができるが、本技法は、そのように限定されない(例えば、1.5、2、2.5、3等までの温度も同様に使用することができる)。温度は、トレーニングの持続時間、トレーニングデータの多様性等の多くの要因に応じてより高くても又はより低くてもよい。
【0037】
幾つかの実施形態では、複数の復号化戦略を順方向及び/又は逆方向予測モデルに使用することができる。復号化戦略は、所与のモデルを使用してシーケンスを予測している間、任意の一時点(又は複数の時点)で変更及び/又は修正することができる。例えば、幾つかの実施形態では、第1の復号化戦略は、予測モデルの第1の部分に使用することができ、第2の復号化戦略は、予測モデルの第2の部分に使用することができる(また任意選択的に第1及び/又は第3の復号化戦略は、予測モデルの第3の部分に使用することができ、以下同様である)。説明のための例として、ある復号化戦略は、ある出力(例えば、反応物又は化学物質(試薬、溶媒及び/又は触媒))を生じさせるために使用することができ、別の復号化戦略は、第2の出力(例えば、第1の復号化戦略により生じない反応物又は化学物質の他方)を生じさせるために使用することができる。特に、サンプリングは、反応物分子を生じさせるために使用することができ、その場合、シーケンスは、欲張り復号化を使用して完成されて、(例えば、最も可能性の高い)残りの組の反応物及び試薬を生じさせることができる。しかしながら、これらの例は、例示目的で提供され、限定の意図はなく、本明細書に記載の技法に従って他の復号化戦略(例えば、ビームサーチ)を使用することも可能であり、及び/又は3つ以上の復号化戦略を使用することも可能であることを理解されたい。
【0038】
幾つかの実施形態では、トレーニングプロセスは、検索戦略に基づいて合わせることができる。例えば、逆方向予測モデルがサンプリング戦略を使用する(例えば、ビームサーチの代わりに)場合、本技法は、逆方向予測モデルのトレーニング時間を増やすことを含み得る。特に、本発明者らは、トレーニングの延長が、ビームサーチ等の他の検索戦略により生成されるサンプルの品質にあまり影響しないが、トレーニングの延長が、サンプリングにより生成される予測の品質を改善することを認めた。
【0039】
図7は、幾つかの実施形態による、順方向モデル及び逆方向モデルを使用した単一ステップ逆合成予測の例示的なコンピュータ化されたプロセス700の図である。幾つかの実施形態では、コンピュータ化されたプロセス700は、分子拡張スレッドにより実行することができる。ステップ702において、予測エンジンは、トレーニングされた逆方向予測モデルを標的生成物に対して実行することにより、反応物予測の組(例えば、試薬、触媒及び/又は溶媒の組)を予測する。ステップ704において、予測エンジンは、トレーニングされた順方向予測モデルを反応物予測の組に対して実行することにより、生成物を予測する。ステップ706において、予測エンジンは、標的生成物を、予測された生成物と比較する。予測された生成物が、入力された生成物と一致することが比較により示される場合、ステップ710において、予測エンジンは、反応物予測の組を確認し、反応物予測の組を化学反応ネットワークの一部として記憶することができる。一方、予測された生成物が、入力された生成物と一致しない場合、ステップ712において、予測エンジンは、結果を除去及び/又は破棄することができる。
【0040】
幾つかの実施形態では、本明細書に記載の方法は、特許又は他の適した文献若しくはデータセットにおいて提供される反応、例えば米国特許に記載の反応でトレーニングすることができる。任意のデータセットが使用可能であり、及び/又は2つ以上のタイプのデータセットを(例えば、プロプライエタリデータセットを米国特許及び/又はPCT特許及び特許出願に記載の反応と)組み合わせ得る。例えば、本発明者らにより行われた幾つかの実験では、米国特許に記載の3百万を超える反応で例示的なモデルをトレーニングした。モデルは、分子の構造を表す任意のバイトシーケンスを用いて機能するように構成することができる。したがって、トレーニングデータセットは、任意のランク(一次元シーケンス(ランク1行列)及び/又はより高次のシーケンス(例えば、二次元隣接行列)等)を含めて、任意のバイト行列又はバイトシーケンスを使用して指定することができる。非限定的な例には、一般的な分子線記法(例えば、SMILES、SMILES arbitrary target specification(SMARTS)、Self-Referencing Embedded Strings(SELFIES)、SMIRKS、SYBYLライン記法又はSLN、InChI、InChIKey等)、連結性(例えば、行列、原子のリスト及び結合についてのリスト)、原子の3D座標(例えば、pdb、mol、xyz等)、分子サブグループ又は畳み込み形式(例えば、フィンガープリント、ニューラルフィンガープリント、モルガンフィンガープリント、RDKitフィンガープリンティング等)、化学マークアップ言語(例えば、ChemML又はCML)、JCAMPファイル形式及び/又はXYZファイル形式等がある。幾つかの実施形態では、本技法は、トレーニング前に入力形式を変換することができる。例えば、表検索を使用して畳み込み形式を変換することができ、例えばInChIKeyをInChI又はSMILESに変換することができる。その結果、予測は、トレーニングを通して、利用可能なデータセットに存在する反応物、試薬及び生成物における化学モチーフの有無間の相関を学習することに基づき得る。
【0041】
幾つかの実施形態では、本技法は、1つ又は複数の改変を記法に提供することを含み得る。改変は、例えば、多種化合物が一緒に記述される場合など、記法に生じ得る曖昧さを考慮するために行うことができる。SMILESを説明のための例として使用することは、限定を意図せず、SMILES符号化は、特定の化合物(例えば、イオン化合物)における種をグループ化するように改変することができる。反応SMILESは、SMILESを異なる種/分子から分ける区切り記号として「.」記号を使用する。イオン化合物は、多くの場合、複数の荷電種として表される。例えば、塩化ナトリウムは、「[Na+].[Cl-]」と記述される。これは、複数の多種化合物が一緒に記述される場合、曖昧さを生じさせる恐れがある。そのような曖昧さの一例は、塩化ナトリウムと過塩素酸カリウムとの反応である。正規順序がどのように指定されるかに応じて、SMILESは、「[O-][Cl+3]([O-])([O-])[O-].[Na+].[Cl-].[K+]」であり得る。しかしながら、そのような順序では、追加された種が塩化ナトリウム及び過塩素酸カリウムであるか、又は塩化カリウム及び過塩素酸ナトリウムであるかを見分けることは、可能ではない。したがって、反応SMILESは、異なる文字を使用して、多種化合物及び分子における種を区切るように改変することができる。例えば、SMILES規格で現在使用されていない任意の文字を使用することができる(例えば、スペース「 」)。その結果、この改変表現でトレーニングされたモデルは、システムが反応SMILESで種の適切なサブグループを決定することを可能にする。更に、本技法は、元の記法形態に戻すように構成することができる。前の例を続けると、従来の反応SMILES規約は、分子/種の区切り記号(例えば、この例ではスペース「 」)の発生を標準文字の分子区切り文字(例えば、「.」)で置換することにより戻ることができる。
【0042】
幾つかの実施形態では、入力された表現は、モデルと併用するために符号化することができる。例えば、入力文字列を構成する文字セットは、文字を整数トークン代表で置換することなど(例えば、各文字が整数で置換される場合、文字シーケンスは1つの整数で置換されるなど)により、トークン化された文字列に変換することができる。幾つかの実施形態では、整数の列は、ワンホット符号化に変換することができ、これは、基本的に各カテゴリの表現を他のカテゴリから等距離にするようにカテゴリの組を表すために使用することができる。ワンホット符号化は、例えば、長さnのゼロベクトルを初期化することにより作成することができ、ここで、nは、モデルの語彙における一意のトークン数である。トークンの値の位置において、ゼロを1に変更して、そのトークンの識別情報を示すことができる。ワンホット符号化は、argmax関数(例えば、アレイ内の最大値のインデックスを返す)等の関数を使用してトークンに戻すことができる。その結果、そのような符号化を使用して、100%の確率が、符号化されるトークンにある全ての可能なトークンにわたる確率分布を提供することができる。したがって、モデルの出力は、可能なトークンの全てにわたる確率分布の予測であり得る。
【0043】
幾つかの実施形態によれば、トレーニングは、トレーニング反応の増強を必要とし得る。例えば、入力ソース文字列は、トレーニングに向けて増強することができる。限定を意図しない説明のための例として、以下の例は、SMILES記法に関連して提供されるが、本明細書に記載の技法の趣旨から逸脱することなく、任意の形式が使用可能であることを理解されたい。幾つかの実施形態では、増強技法は、非正規化を行うことを含み得る。SMILESは、分子グラフの巡回として分子を表す。大半のグラフは、2つ以上の有向巡回順を有し、これは、異なる方向からの「姿勢」又はビューの概念に類似し得る。SMILESは、正規巡回順序を有することができ、各分子に単一の一意の表現を可能にすることができる。幾つかの非正規SMILESが同じ分子を表すことができるため、本技法は、同じ情報を表す多様な異なる入力文字列を生成することができる。幾つかの実施形態では、無作為非正規SMILESは、学習中、使用されるたびに各分子について生成される。各分子は、トレーニング中、幾つかの異なるときに使用することができるため、本技法は、各分子に幾つかの異なる非正規SMILESを生じさせることができ、それにより、モデルを堅牢にし、入力のバリエーションに対処可能にすることができる。
【0044】
幾つかの実施形態によれば、増強技法は、キラリティ反転を行うことを含み得る。キラリティ反応は、鏡面対称であり得、反応の分子をミラーリングすると、別の有効な反応例を生成することができる。そのようなミラーリング技法は、反応に少なくとも1つのキラル中心がある場合、新しいトレーニング例を生成することができ、したがって、ミラーリングされた反応は、少なくとも1つのキラル中心を有する入力に生成することができる。その結果、キラル中心を含む任意の反応について、トレーニング前に反応を反転して、ミラーリングされた反応を生じさせることができる(例えば、反応の全てのキラル中心を反転させることにより)。そのような技法は、反応のクラスが、あるキラリティを有する例を、別のキラリティを有する例よりも圧倒的に多く有し得るトレーニングデータにおける偏りを軽減することができる。
【0045】
幾つかの実施形態では、増強技法は、化学物質ドロップアウトを行うことを含み得る。多くの場合、データセットにおける例は、欠損化学物質(例えば、溶媒、触媒及び/又は試薬)である。トレーニング中、化学物質分子は、反応例において省くことができ、それにより推論中に欠損情報に対してモデルをより堅牢にすることができる。
【0046】
幾つかの実施形態では、増強技法は、分子順序シャッフルを行うことを含み得る。例えば、入力された分子が列記される順序は、予測と無関係であり得る。その結果、本技法は、入力された分子の順序を無作為化することを含み得る(例えば、トレーニング中に各入力において)。
【0047】
トレーニング前にデータセット全体を増強することができるが、本発明者らは、全てのデータをまず増強しなければならず、その後、トレーニングが行われ、したがってトレーニングをいかなる増強とも平行して行うことができないため、そのような手法がはるかに長いトレーニング時間になり得ることを認めた。したがって、本発明者らは、幾つかの実施形態で使用することができるトレーニングに使用される反応の組を増分的に増強する技法を開発した。特に、本技法は、トレーニングデータのサブセットを増強し、次いでその増強されたサブセットを使用してモデルのトレーニングを開始することを含み得、その間、トレーニングデータの他のサブセットは、トレーニングに向けて増強される。例えば、順方向予測モデルの場合、モデルは、増強された反応の生成物を入力として使用し、増強された反応のうちの反応のセットを出力として使用することにより、トレーニング反応の増強されたサブセットを使用してトレーニングすることができる。したがって、トレーニングプロセスは、トレーニングデータの各サブセットが増強されるにつれて続くことができる。別の例として、逆方向予測モデルの場合、モデルは、増強された反応のうちの反応セットを入力として使用し、反応の生成物を出力として使用してトレーニングすることができ、これは、増強されたサブセットの各々について反復的に行われ得る。
【0048】
反応条件は、示唆された合成ルートを実施するための有用な情報であり得る。しかしながら、典型的には、試みる手順を自ら設計することを促進するために、文献に向かい、類似する反応で使用される方法論を見つけることは、化学者に委ねられる。これは、例えば、化学者が文献を調べ、いずれの反応が関連するのに十分に類似するかを主観的に判断し、オートメーションが関わる場合、機械が実行する詳細なアルゴリズムに手順を変換することなどに時間を費やさなければならないため、最適未満であり得る。
【0049】
本明細書に記載の技法は、例えば、分子トランスフォーマーの概念を拡張することにより、機械可読形式で作用リストを提供することを含み得る。更に
図2を参照すると、幾つかの実施形態では、予測エンジン202は、作用予測212を生じさせることができる。例えば、逆方向モデルは、本明細書に記載のように反応物/化学物質を予測し、その後、作用リストを予測することができる。幾つかの実施形態では、作用リストは、JSON/XML/HTML等の構造化テキスト形式で提供することができる。構造化データは、劣ったモデル(例えば、自然言語手法と比較して)に繋がると見なされることが多いため、構造化テキスト形式の使用は、従来の通念と対立し得ることを理解されたい。しかしながら、本発明者らは、そのような従来の問題なしで構造化テキスト形式を本明細書に記載の技法と併せて使用できることを認めた。順方向モデルは、作用リストと共に逆方向モデルにより予測された反応物/化学物質を読み込み、それを使用して生成物分子を予測することができる。作用リストは、反応物/化学物質で既に指定されている分子のSMILES文字列を繰り返し得る。概念上、これは、要求される材料が最初に列記され、その後にそれらを利用する手順が続く学術論文の材料及び方法セクションの概念と同様である。データの不完全性に起因して、反応物/化学物質における全ての分子/種を作用リストで見つけられるわけではない(逆も同様である)。したがって、幾つかの実施形態では、本技法は、反応物/化学物質及び作用リストを一緒に含み得る。データのそのような不完全性が存在しない場合、幾つかの実施形態では、簡潔にするために反応物/化学物質を省くことができる。
【0050】
幾つかの実施形態では、本技法は、所与の反応と関連付けられた自然言語手順を予測するようにモデルをトレーニングすることを含み得る。再び
図2を参照すると、幾つかの実施形態では、予測エンジン202は、したがって、手順214を生じさせることができる。これは、幾つかのシナリオでは、そのような技法は、反応段落を構造化作用リストに変換するためにアルゴリズム(例えば、エラーを生じさせる恐れがある)に依存する必要がないため、有用であり得る。化学手順の態様は、簡易化リスト形式で表現することが難しいことがある。したがって、幾つかの実施形態では、本技法は、分子/種の名称をそれらのSMILES均等物で置換することを含み得、それにより、モデルは、手順を記述するとき、適切な場合、関連する分子を単に書き換えることができる。この変更なしでは、例えば、モデルは、データに存在する全ての種類の様々な化学命名法(例えば、IUPAC、一般名、参照インデックス)にSMILESを翻訳するように学習する必要があり、一般化可能性を制限する恐れがある。更に、作用リストに変換するときに破棄され得る細かい詳細(例えば、生成物が無色油として得られた)を代わりに保持することができる。自然言語手順の生成は、化学者が(例えば、文献/特許における手順を)読むのに慣れた形式を通して行うことができるため、化学者が本明細書に記載の技法と対話するためにより容易な対話を提供することができる。
【0051】
アルゴリズムフロー例
本明細書に記載の技法の限定を意図せずに、以下は、本明細書に記載の技法を使用して化学反応ネットワークを構築するためのトレーニング及び予測プロセスの一例である。
【0052】
トレーニング
トレーニング入力は、トレーニング反応の組を含む(例えば、化学反応のデータベース又はリストにおいて)。トレーニング反応の組は、例えば、概ね3百万個の反応等、米国特許からとられた数百万の反応を含み得る。反応は、本明細書に記載のように任意の形式又は記法で読み込むことができる。単一ステップ逆合成モデルは、本明細書に援用されるSeglerに記載のものと同様のものなどの分子トランスフォーマーモデルを使用し、トレーニングデータセット内の生成物を入力として使用し、対応する反応物を出力として使用してトレーニングすることができる。Seglerに記載のモデルへの改変は、例えば、異なるオプティマイザ(例えば、Adamax)、異なる学習率(例えば、この例では5e-4)、異なる学習率ウォームアップスケジュール(例えば、8,000回のトレーニング反復にわたり0~5e-4の線形ウォームアップ)、学習率減衰なし及びより長いトレーニング持続時間(例えば、Seglerに記載されるものの5倍~10倍)等の使用を含み得る。
【0053】
実行
予測エンジンを実行するための入力は、標的分子フィンガープリント(例えば、ここでもSMILES、SMARTS及び/又は任意の他のフィンガープリント記法として)である。最終的な出力は、化学反応ネットワーク又はグラフであり、以下の例示的なステップを使用して生じさせることができる:
ステップ1 - 入力された標的分子フィンガープリントを受信及び/又は読み込む。
ステップ2 - グラフ巡回スレッドを実行して、単一ステップ逆合成標的分子の定期的要求を行う。
ステップ3 - 分子拡張(単一ステップ予測)スレッドを実行して、グラフ巡回スレッドからの予測要求を満たす。本明細書に記載のように、実行時性能は、単一ステップ予測スレッド数に伴ってスケーリング(例えば、線形に)することができるため、複数の分子拡張スレッドを実行することができる。
ステップ4 - 分子拡張スレッドにより予測された全ての一意の反応を収集する。
ステップ5 - ステップ4から収集された反応における各反応セットについて、指定数の分子拡張の行うことなどの1つ又は複数の所定の基準に達するまで、及び/又はタイムリミット、所望の開始材料の識別及び/又は所望の反応の識別等の達せられた任意の他の関連する基準に達するまで、ステップ2~4を再帰的に繰り返すことにより、新しい反応出力を収集する。
ステップ6 - ステップ2~5を反復的に行うことから収集された反応のリストは、化学反応ネットワーク又はグラフの決定に必要な全ての情報を含む。
ステップ7 - 化学反応ネットワーク又はグラフを返す。
【0054】
本明細書に記載の技法は、種々のタイプの回路及び/又は計算デバイスに組み込むことができる。
図8は、本明細書に記載の技術の実施形態の実施に使用し得る例示的なコンピュータシステム800のブロック図を示す。例えば、コンピュータシステム800は、
図1におけるユーザ計算デバイス102及び/又はリモート計算デバイス104の一例であり得る。計算デバイス800は、1つ又は複数のコンピュータハードウェアプロセッサ802及び非一時的コンピュータ可読記憶媒体(例えば、メモリ804及び1つ又は複数の不揮発性記憶装置806)を含み得る。プロセッサ802は、(1)メモリ804、及び(2)不揮発性記憶装置806とのデータの読み書きを制御し得る。本明細書に記載の任意の機能を行うために、プロセッサ802は、1つ又は複数の非一時的コンピュータ可読記憶媒体(例えば、メモリ804)に記憶された1つ又は複数のプロセッサ実行可能命令を実行し得、1つ又は複数の一時的コンピュータ可読記憶媒体は、プロセッサ802による実行のためにプロセッサ実行可能命令を記憶する非一時的コンピュータ可読記憶媒体として機能し得る。計算デバイス800は、ネットワークI/Oインタフェース808及びユーザI/Oインタフェース810も含む。
【0055】
2021年1月21日付けで出願された「SYSTEMS AND METHODS FOR TEMPLATE-FREE REACTION PREDICTIONS」という名称の米国仮特許出願第63/140,090号は、全体として参照により本明細書に援用される。
【0056】
「プログラム」又は「ソフトウェア」という用語は、本明細書では、一般的な意味において、上述したような実施形態の種々の態様を実施するようにコンピュータ又は他のプロセッサ(物理的又は仮想)をプログラムするために採用することができる任意のタイプのコンピュータコード又はプロセッサ実行可能命令の組を指すために使用される。更に、一態様によれば、実行されると、本明細書に提供される本開示の方法を行う1つ又は複数のコンピュータプログラムは、単一のコンピュータ又はプロセッサに存在する必要はなく、異なる複数のコンピュータ又はプロセッサにモジュール式に分散して、本明細書に提供された本開示の種々の態様を実施し得る。
【0057】
プロセッサ実行可能命令は、1つ又は複数のコンピュータ又は他のデバイスにより実行されるプログラムモジュール等の多くの形態であり得る。一般に、プログラムモジュールは、タスクを行うか又は抽象データ型を実施するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。典型的には、プログラムモジュールの機能は、組み合わされるか又は分散され得る。
【0058】
種々の本発明の概念は、例が提供された1つ又は複数のプロセスとして実施され得る。各プロセスの一部として行われる動作は、任意の適した順序であり得る。したがって、動作が図示と異なる順序で行われ、例示的な実施形態では順次動作として示されている場合でも、幾つかの動作を同時に行うことを含み得る実施形態を構築し得る。
【0059】
ここで、本明細書及び特許請求の範囲において使用される場合、1つ又は複数の要素のリストに関連する「少なくとも1つ」という句は、要素のリスト内の要素の任意の1つ又は複数から選択される少なくとも1つの要素を意味するが、必ずしも要素リスト内に特に列記されたあらゆる要素の少なくとも1つを含むわけではなく、また要素リスト内の要素の任意の組み合わせを除外しないと理解されたい。この定義では、「少なくとも1つ」という句が指す、要素リスト内で特に識別された要素以外の要素が、特に識別された要素に関連するか又は関連しないかを問わず、任意選択的に存在し得ることも可能である。したがって、例えば、「A及びBの少なくとも1つ」(又は均等に「A又はBの少なくとも1つ」、又は均等に「A及び/又はBの少なくとも1つ」)は、一実施形態では、Bが存在しない状態で、任意選択的に2つ以上を含む少なくとも1つのA(及び任意選択的にB以外の要素を含む);別の実施形態では、Aが存在しない状態で、任意選択的に2つ以上を含む少なくとも1つのB(及び任意選択的にA以外の要素を含む);更に別の実施形態では、任意選択的に2つ以上を含む少なくとも1つのA及び任意選択的に2つ以上を含む少なくとも1つのB(並びに任意選択的に他の要素を含む)等を指すことができる。
【0060】
ここで、本明細書及び特許請求の範囲において使用される場合、「及び/又は」という句は、等位接続された要素、即ち接続的に存在することもあれば、離接的に存在することもある要素の「いずれか一方又は両方」を意味するものと理解されたい。「及び/又は」を用いて列記された複数の要素は、同じように、即ち等位接続された要素の「1つ又は複数」として解釈されるべきである。「及び/又は」節により特に識別された要素以外の他の要素は、特に識別された要素に関連するか又は関連しないかを問わず、任意選択的に存在し得る。したがって、非限定的な例として、「A及び/又はB」の言及は、「含む」等のオープンエンド言語と併用される場合、一実施形態ではAのみ(任意選択的にB以外の要素を含む);別の実施形態ではBのみ(任意選択的にA以外の要素を含む);更に別の実施形態ではA及びBの両方(任意選択的に他の要素を含む)等を指すことができる。
【0061】
請求項要素を修飾するための特許請求の範囲での「第1」、「第2」、「第3」等の序数詞の使用は、それ自体では、別の請求項要素と比べたある請求項要素の優先性、先行性若しくは序列又は方法の動作が行われる時間順をいずれも含意しない。そのような用語は、単に、特定の名称を有するある請求項要素を(序数詞の使用を別にすれば)同じ名称を有する別の要素から区別するためのラベルとして使用される。本明細書で使用される表現及び用語は、説明を目的としており、限定として見なされるべきではない。「包含する」、「含む」、「有する」、「含有する」、「伴う」及びそれらの変形の使用は、列記された項目及び追加の項目の包含を意味する。
【0062】
本明細書に記載の技法の幾つかの実施形態を詳述したが、当業者であれば、種々の改変形態及び改良形態を容易に想到するであろう。そのような改変形態及び改良形態は、本開示の趣旨及び範囲内にあると意図される。したがって、上記の説明は、単なる例としてのものであり、限定として意図されない。本技法は、以下の特許請求の範囲及びその均等物により規定されるものとしてのみ限定される。
【国際調査報告】