特表2024-505467 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ケボティクス，インコーポレイテッドの特許一覧

特表2024-505467テンプレートなしの反応予測のためのシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
4
5
6a)
6b)
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-02-06

(54)【発明の名称】テンプレートなしの反応予測のためのシステム及び方法

(51)【国際特許分類】

G16C 10/00 20190101AFI20240130BHJP

【ＦＩ】

G16C10/00

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023544355

(86)(22)【出願日】2022-01-20

(85)【翻訳文提出日】2023-09-11

(86)【国際出願番号】 US2022013083

(87)【国際公開番号】W WO2022159558

(87)【国際公開日】2022-07-28

(31)【優先権主張番号】63/140,090

(32)【優先日】2021-01-21

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＰＹＴＨＯＮ

(71)【出願人】

【識別番号】523276485

【氏名又は名称】ケボティクス，インコーポレイテッド

(74)【代理人】

【識別番号】100079108

【弁理士】

【氏名又は名称】稲葉良幸

(74)【代理人】

【識別番号】100109346

【弁理士】

【氏名又は名称】大貫敏史

(74)【代理人】

【識別番号】100117189

【弁理士】

【氏名又は名称】江口昭彦

(74)【代理人】

【識別番号】100134120

【弁理士】

【氏名又は名称】内藤和彦

(72)【発明者】

【氏名】シェベラ，デニス

(72)【発明者】

【氏名】クライスベック，クリストフ

(72)【発明者】

【氏名】ライアン，ケビン

(72)【発明者】

【氏名】ニシャダム，チャンドラムーリ

(72)【発明者】

【氏名】シュー，ヘンギュ

(57)【要約】

本明細書に記載の技法は、標的生成物を生成するための反応の組を決定する方法及び装置に関する。方法は、標的生成物を受信することと、グラフ巡回スレッドを実行することと、グラフ巡回スレッドを介して、標的生成物のための第１の組の反応物予測を要求することと、分子拡張スレッドを実行することと、分子拡張スレッド及び反応物予測モデルを介して第１の組の反応物予測を決定することと、第１の組の反応物予測を反応の組の少なくとも一部として記憶することとを含む。

【特許請求の範囲】

【請求項1】

標的生成物を生成するための反応の組を決定するコンピュータ化された方法であって、
前記標的生成物を受信することと、
グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための第１の組の反応物予測を要求することと、
分子拡張スレッドを実行することと、
前記分子拡張スレッド及び反応物予測モデルを介して前記第１の組の反応物予測を決定することと、
前記第１の組の反応物予測を前記反応の組の少なくとも一部として記憶することと
を含むコンピュータ化された方法。

【請求項2】

前記グラフ巡回スレッドを介して、前記第１の組の反応物予測から反応物予測のための第２の組の反応物予測を要求することと、
第２の分子拡張スレッドを実行することと、
前記第２の分子拡張スレッド及び前記反応物予測モデルを介して前記第２の組の反応物予測を決定することと
を更に含む、請求項１に記載の方法。

【請求項3】

前記第２の組の反応物予測を前記第１の組の反応物予測と共に前記反応の組の少なくとも一部として記憶することを更に含む、請求項２に記載の方法。

【請求項4】

トレーニング反応の組にアクセスすることと、
前記トレーニング反応の組を使用して前記反応物予測モデルをトレーニングすることと
を更に含む、請求項１～３のいずれか一項に記載の方法。

【請求項5】

前記トレーニング反応の組を使用して前記反応物予測モデルをトレーニングすることは、トレーニング中に前記トレーニング反応の組を増分的に増強することを含む、請求項４に記載の方法。

【請求項6】

前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第１の部分を増強することと、
前記トレーニング反応の組の前記増強された第１の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第１の部分内の各トレーニング反応について、
前記トレーニング反応の生成物を入力として使用すること、及び
前記トレーニング反応の反応の組を出力として使用すること
を含む、トレーニングすることと
を含む、請求項５に記載の方法。

【請求項7】

前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第２の部分を増強することと、
前記トレーニング反応の組の前記増強された第２の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第２の部分内の各トレーニング反応について、
前記トレーニング反応の生成物を前記入力として使用すること、及び
前記トレーニング反応の反応の組を前記出力として使用すること
を含む、トレーニングすることと
を含む、請求項６に記載の方法。

【請求項8】

前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第１の部分を増強することと、
前記トレーニング反応の組の前記増強された第１の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第１の部分内の各トレーニング反応について、
前記トレーニング反応の反応の組を入力として使用すること、及び
前記トレーニング反応の生成物を出力として使用すること
を含む、トレーニングすることと
を含む、請求項５～７のいずれか一項に記載の方法。

【請求項9】

前記トレーニング反応の組を増分的に増強することは、
前記トレーニング反応の組の第２の部分を増強することと、
前記トレーニング反応の組の前記増強された第２の部分を使用して、前記反応物予測モデルをトレーニングすることであって、前記増強された第２の部分内の各トレーニング反応について、
前記トレーニング反応の反応の組を前記入力として使用すること、及び
前記トレーニング反応の生成物を前記出力として使用すること
を含む、トレーニングすることと
を含む、請求項８に記載の方法。

【請求項10】

オーケストレータスレッドを実行することを更に含み、前記オーケストレータスレッドは、
前記グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための前記第１の組の反応物予測の前記要求を受信することと、
前記分子拡張スレッドを実行して、前記第１の組の反応物予測を決定することと
を行う、請求項１～９のいずれか一項に記載の方法。

【請求項11】

前記オーケストレータスレッドは、前記決定された第１の組の反応物予測を前記グラフ巡回スレッドに送信する、請求項１０に記載の方法。

【請求項12】

前記オーケストレータスレッドは、前記第１の組の反応物予測を記憶して、逆合成グラフを維持する、請求項１０又は１１に記載の方法。

【請求項13】

前記逆合成グラフに対してツリー検索を実行して、前記逆合成グラフを通して可能なルートの組を識別することを更に含み、前記可能なルートの組の各ルートは、前記標的生成物を構築するための関連する方法を表す、請求項１２に記載の方法。

【請求項14】

前記可能なルートの組において識別された各ルートについて、反応物－生成物対のブラックリストを更新することを更に含む、請求項１３に記載の方法。

【請求項15】

前記ツリー検索中、１つ又は複数の追加のルートが前記ブラックリスト内の反応－生成物対における反応を含むと決定することにより、前記可能なルートの組から前記１つ又は複数の追加のルートを省くことを更に含む、請求項１４に記載の方法。

【請求項16】

前記反応物予測モデルは、前記標的生成物に基づいて前記第１の組の反応物予測を決定する、トレーニングされた単一ステップ逆合成モデルである、請求項１～１５のいずれか一項に記載の方法。

【請求項17】

前記単一ステップ逆合成モデルは、
入力反応物の組に基づいて生成物予測を生じさせるように構成される、トレーニングされた順方向予測モデルと、
入力生成物に基づいて反応物予測の組を生じさせるように構成される、トレーニングされた逆方向予測モデルと
を含む、請求項１６に記載の方法。

【請求項18】

前記入力反応物の組、前記反応物予測の組又は両方は、
１つ又は複数の試薬、
１つ又は複数の触媒、及び
１つ又は複数の溶媒
の１つ又は複数を含む、請求項１７に記載の方法。

【請求項19】

前記反応物予測モデルを介して前記第１の組の反応物予測を決定することは、
前記トレーニングされた逆方向予測モデルを前記標的生成物に対して実行することにより、前記第１の組の反応物予測を予測することと、
前記トレーニングされた順方向予測モデルを前記第１の組の反応物予測に対して実行することにより、生成物を予測することと、
前記標的生成物を、前記予測された生成物と比較して、前記第１の組の反応物予測を記憶するか否かを決定することと
を含む、請求項１７又は１８に記載の方法。

【請求項20】

命令を含む非一時的コンピュータ可読媒体であって、前記命令は、１つ又は複数のプロセッサによって計算デバイスで実行されると、前記１つ又は複数のプロセッサに、標的生成物を生成するための反応の組を、
前記標的生成物を受信することと、
グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための第１の組の反応物予測を要求することと、
分子拡張スレッドを実行することと、
前記分子拡張スレッド及び反応物予測モデルを介して前記第１の組の反応物予測を決定することと、
前記第１の組の反応物予測を前記反応の組の少なくとも一部として記憶することと
を行うことによって決定させるように動作可能である、非一時的コンピュータ可読媒体。

【請求項21】

命令を記憶するメモリと、少なくとも１つのプロセッサであって、前記命令を実行して、標的生成物を生成するための反応の組を、
前記標的生成物を受信することと、
グラフ巡回スレッドを実行することと、
前記グラフ巡回スレッドを介して、前記標的生成物のための第１の組の反応物予測を要求することと、
分子拡張スレッドを実行することと、
前記分子拡張スレッド及び反応物予測モデルを介して前記第１の組の反応物予測を決定することと、
前記第１の組の反応物予測を前記反応の組の少なくとも一部として記憶することと
を行うことによって決定するように構成された少なくとも１つのプロセッサとを含むシステム。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願
本願は、米国特許法第１１９条（ｅ）の下、２０２１年１月２１日付けで出願された「SYSTEMS AND METHODS FOR TEMPLATE-FREE REACTION PREDICTIONS」という名称の米国仮特許出願第６３／１４０，０９０号の利益を主張するものであり、これは、全体として参照により本明細書に援用される。

【0002】

分野
本願は、概して、反応を予測するための、テンプレートなしの技法に関する。

【背景技術】

【0003】

背景
化学空間の探索は、創薬、材料合成及び生体分子化学等の多くの研究分野の中心である。化学探索は、可能な変換の空間が膨大であり、熟練した化学者を必要とするため、困難な問題であり得る。新規の化学反応及び合成経路の発見は、合成化学の永続的な目標であるが、それには何年もの知識及び経験が必要とされる。したがって、反応予測、逆合成及び／又は化学物質示唆等の種々の合成タスクで化学者を支援する化学予測ツールの提供を含めて、性質が改良された新規の分子を合成する際に化学者の創造性を支援し得る新しい技術を提供することが望まれている。

【発明の概要】

【0004】

概要
一態様では、標的生成物を生成するための反応の組（例えば、化学反応ネットワーク又はグラフ）を決定するコンピュータ化された方法が提供される。本方法は、標的生成物を受信することと、グラフ巡回スレッドを実行することと、グラフ巡回スレッドを介して、標的生成物のための第１の組の反応物予測を要求することと、分子拡張スレッドを実行することと、分子拡張スレッド及び反応物予測モデル（例えば、単一ステップ逆合成モデル）を介して第１の組の反応物予測を決定することと、第１の組の反応物予測を反応の組の少なくとも一部として記憶することとを含む。

【0005】

上記の概念及びより詳細に後述される追加の概念の全ての組合せは、（そのような概念が相互に矛盾しないことを条件として）本明細書に開示される本発明の主題の一部として企図されることを理解されたい。特に、本開示の末尾に見られる請求項に記載の主題の全ての組合せは、本明細書に開示される本発明の主題の一部として企図される。上記の概念及び後述の追加の概念は、任意の適した組合せで構成可能であり、本開示は、これに関して限定されないことを更に理解されたい。更に、添付図と併せて考慮される場合、種々の非限定的な実施形態の以下の詳細な説明から本開示の他の利点及び新規な特徴が明らかになるであろう。

【0006】

図面の簡単な説明
種々の態様及び実施形態について、以下の図を参照して本明細書で説明する。図は、必ずしも一定の縮尺であるわけではないことを理解されたい。複数の図に現れる項目は、それらが現れる全ての図において同じ又は同様の参照番号で示される。

【図面の簡単な説明】

【0007】

【図1】幾つかの実施形態による、テンプレートなしの反応予測を提供する例示的なシステムの図である。

【図2】幾つかの実施形態による例示的な反応予測フローの図である。

【図3A】幾つかの実施形態による、逆合成を使用した化学空間における反応ネットワークグラフの生成を示す図である。

【図3B】幾つかの実施形態による、化学空間における反応ネットワークグラフの生成の別の例の図である。

【図4】幾つかの実施形態による例示的なモデル予測プロセスの態様の図である。

【図5】幾つかの実施形態による、標的生成物を生成するための反応の組を決定する例示的なコンピュータ化された方法を示す図である。

【図6】幾つかの実施形態による、反応予測に使用することができる例示的な文字列の図である。

【図7】幾つかの実施形態による、順方向モデル及び逆方向モデルを使用した単一ステップ逆合成予測の例示的なコンピュータ化されたプロセスの図である。

【図8】本明細書に記載の技術の実施形態の実施に使用し得る例示的なコンピュータシステムのブロック図を示す。

【発明を実施するための形態】

【0008】

詳細な説明
逆合成は、標的分子を合成するための一連の化学変換の識別を目的とする。単一ステップ逆合成フォーミュレーションでは、タスクは、所与の標的の反応物分子の組を識別することである。従来の逆合成予測技法は、多くの場合、既知の反応のデータベース中の変換を調べる必要がある。可能な化学変換の膨大な空間は、逆合成を困難な問題にし、典型的には熟練した化学者の技能を必要とする。合成計画では、化学者は、最終生成物を可視化し、一層より単純な化合物に向かって逆方向に作業する必要がある。新規経路の合成は、中間ステップ数、利用可能な開始材料、コスト、収量、毒性及び／又は他の要因等の多くの要因の最適化に依存するため、困難なタスクである。更に、多くの標的化合物では、代替の合成ルートを確立することが可能であり、その目標は、他の部分を変えずに分子の一部分のみに影響する反応を発見することである。

【0009】

合成計画では、確立された知識を超えて探検する能力が必要になることもあり、これは、典型的には、既知の反応のデータベースに依存する従来の技法を使用して可能ではない。本発明者らは、新しい変換を発見及び／又は再発見することを目標として、データ駆動ＡＩモデルを使用してそのような論拠の追加を試みることができることを認めた。ＡＩモデルは、テンプレートベースのモデル（例えば、シンボリックＡＩを用いた深層学習手法、グラフ畳み込みネットワーク等）及びテンプレートなしのモデル（例えば、分子トランスフォーマーモデル）を含み得る。テンプレートベースのモデルは、反応のデータベースから化学変換（例えば、テンプレート）を学習することにより構築することができ、順方向反応予測又は逆合成等の種々の合成タスクを行うために使用することができる。テンプレートなしのモデルは、機械翻訳モデル（例えば、自然言語処理に使用されるもの）に基づき得、したがってテキストベースの反応（例えば、Simplified Molecular Input Line-Entry System（ＳＭＩＬＥＳ）記法での入力）を使用してトレーニングすることができる。

【0010】

分子及び科学反応は、化学反応ネットワーク又はグラフとして表すことができ、その場合、分子は、ノードに対応し、反応は、これらのノード間の有向接続に対応する。反応は、限定ではなく、共有結合、イオン結合、配位結合、ファンデルワールス相互作用、疎水性相互作用、静電相互作用、原子複合体及びゲノム構成（例えば、分子ケージに含まれる分子）等を含めて、例えば電子の位置及び／又はフォーメーションの変化又は原子間の化学結合の破断を含む任意の種類の化学反応を含み得る。本発明者らは、テンプレートなしのモデルを使用して、そのようなネットワークを構築できることを発見し、認めた。特に、テンプレートなしのモデルは、データセット内の化学（例えば、変換規則）により制限される必要がないため、所望の柔軟性を提供することができる。加えて又は代わりに、テンプレートなしのモデルは、テキストベースの反応により指定された反応物及び生成物内の化学モチーフ間の相関を学習することにより、化学空間で外挿することができる。しかしながら、テンプレートなしのモデルを使用して化学反応ネットワークを構築することには、種々の欠陥があり得る。例えば、拡張する分子を識別する技法が必要であり得、化学反応ネットワークを構築するためにそれらの分子を拡張する技法も必要であり得る。しかしながら、そのような処理タスクを切り離すことができない場合、相当なオーバーヘッド及び非効率性を化学反応ネットワークの構築に付加する恐れがある。本発明者らは、したがって、種々のスレッドを利用して、反応の組を決定するために必要な処理を分散する、標的生成物を生成するための反応の組（例えば、化学反応ネットワーク又はグラフ）を決定する技法を開発した。幾つかの実施形態では、グラフ巡回スレッドを使用して、拡張する分子を反復的に識別し、標的生成物の最終的な作成に使用することができる化学ネットワークを作成する。１つ又は複数の分子拡張スレッドを使用して、予測モデル（例えば、単一ステップ逆合成モデル）を実行し、グラフ巡回スレッドにより拡張するものとして識別された分子の反応予測を決定することができる。グラフ巡回スレッドからの要求数に応じて、複数の分子拡張スレッドを実行することができる。グラフ巡回スレッド及び分子拡張スレッドの反復実行により、標的生成物を構築するための反応の組を最終的に決定する効率的で堅牢な技法をもたらすことができる。

【0011】

本発明者らは、そのようなモデルのトレーニングに使用される従来の技法に伴う問題を更に発見し、認めた。特に、モデルのトレーニングに大きいデータセットが必要とされることが多い。イメージベースのデータセット等の一部のトレーニングセットについて、データは、トレーニングのために増強することができる。例えば、イメージ認識モデルのトレーニング手法は、ランダムな回転、スキュー、明度及びコントラストの調整等の増強を行うことを含み得る（例えば、そのような増強は、認識される、イメージが含む物体の存在に影響すべきではないため）。しかしながら、本発明者らは、非イメージベースのトレーニングセット（例えば、テキストベースのモデルに使用することができる）等の他のタイプのトレーニングデータを増強する必要があることを認めた。特に、本発明者らは、テキストベースのモデルに向けたそのようなイメージベースの増強に類似するものがなく、そのため、既存のテキストベースのプラットフォームがテキストベースの入力に増強ツールを提供しない（及び増強技法の追加さえも可能でないことがある）ことを認めた。

【0012】

本発明者らは、データ増強が大きい記憶要件を課す恐れがあることを更に認めた。例えば、従来の増強手法は、多くの場合、データセットの幾つかの異なるコピーを生じさせる必要がある（例えば、モデルが、トレーニングの過程にわたり処理するのに十分なデータを有するように）。しかしながら、トレーニング中にコピーを記憶する必要があり、トレーニングプロセスは、数日又は数週間にわたって実行され得るため、そのような従来の手法は、ストレージに大きい影響を及ぼし得る。例えば、全てのトレーニング例をループするために１時間かかり、モデルが３日の過程にわたって収束する場合、従来の手法は、データ増強から同等の例多様性を有するために、トレーニングセットの７２（２４＊３）個のコピーを作成する必要がある。このポイントを更に示すために、トレーニング時間が５倍に増える場合、ストレージ要件も同様に５倍大きくなる（例えば、データセットの３６０（２４＊３＊５）個のコピー）。

【0013】

本発明者らは、したがって、反復的増強技法を提供する入力増強パイプラインを開発した。本技法は、モデルの堅牢性を改善するように入力例を変更することを含めて、テキストベースのトレーニングデータセットの増強を提供する。本技法は、トレーニングデータのサブセットを増強し、更なるサブセットが増強されている間、それらのサブセットを使用してモデルを反復的にトレーニングすることを更に提供する。本技法は、従来の手法と比較して、本明細書に記載の反復的手法を使用して記憶する必要があるデータ量が劇的に少ないため、記憶要件を劇的に低減することができる。そのような技法は、順方向予測モデル及び逆方向予測モデルの両方のトレーニングに使用することができ、各モデルにより予測された結果を検証するために、これらのモデルは、単一ステップ逆合成予測に向けて一緒に実行することができる。

【0014】

テンプレートなしのモデルの特定の例示的な実施形態について本明細書で更に説明するが、モデルに関連する全ての構成要素（モデルのトレーニング及び／又はモデルのデプロイを含む）の他の代替の実施形態は、異なる用途に合うように相互交換可能である。図を参照して、テンプレートなしのモデル及び対応する方法の特定の非限定的な実施形態が更に詳述される。これらの実施形態に関して説明される種々のシステム、構成要素、特徴及び方法は、独立して及び／又は任意の所望の組合せで使用することができ、本開示は、本明細書に記載の特定の実施形態のみに限定されないことを理解されたい。

【0015】

幾つかの実施形態では、本技法は、化学反応予測を行うためのポータル又はウェブインタフェース等のツールを提供することができる。幾つかの実施形態では、ツールは、１つ又は複数のウェブページをユーザに提供する１つ又は複数の計算デバイスにより提供することができる。ウェブページを使用して、予測の計算態様を行うために必要なデータを収集することができる。図１は、幾つかの実施形態による、テンプレートなしの反応予測を提供する例示的なシステム１００の図である。システム１００は、ネットワーク１０６を通して１つ又は複数のリモート計算デバイス１０４と通信するユーザコンピュータデバイス１０２を含む。ユーザ計算デバイス１０２は、スマートフォン、ラップトップ及び／又はデスクトップ等の任意の計算デバイスであり得る。１つ又は複数のリモート計算デバイス１０４は、本明細書に記載の技法の提供に使用される任意の適した計算デバイスであり得、デスクトップ又はラップトップコンピュータ、ウェブサーバ、データサーバ、バックエンドサーバ及び／又はクラウド計算リソース等を含み得る。本明細書に記載のように、リモート計算デバイス１０４は、ユーザが、本明細書に記載の技法に従って分子の化学予測、高スループットスクリーニング及び／又は合成可能性予測を行うことを可能にするオンラインツールを提供し得る。

【0016】

図２は、幾つかの実施形態による例示的な反応予測フロー２００の図である。予測エンジン２０２は、入力／所望の生成物２０４を受信し、逆合成解析２０６、反応予測２０８及び／又は試薬予測２１０の１つ又は複数を行うことができる。本明細書に記載のように、予測エンジン２０２は、生成物２０４（例えば、標的分子）に基づいて化学反応ネットワークを構築して、現実世界の化学系の挙動をモデリングすることができる。予測エンジン２０２は、反応グラフを解析して、逆合成２０６等の種々のタスクにおいて化学者を支援することができる。例えば、予測エンジンは、順方向反応予測等のタスクについて、本明細書に記載の種々のアルゴリズムを使用してグラフを解析することができる。予測エンジン２０２は、更に後述するトランスフォーマーモデルを利用することなどにより、反応予測２０８及び／又は試薬予測２１０を提供することもできる。

【0017】

幾つかの実施形態では、予測エンジン２０２は、利用可能な選択肢のリストをユーザに送信することができる（例えば、ユーザインタフェースを介して）。ユーザは、予測エンジン２０２へのクエリの選択肢を構成することができる。例えば、システムは、選択肢を使用して、グラフィカルユーザインタフェースの部分を動的に生じさせ得る。別の例として、選択肢は、クエリ及び／又は予測に関連するパラメータをユーザが変更することを可能にする、構成された選択肢の組を予測エンジン２０２が受信することを可能にし得る。構成可能な選択肢の例には、予測ランタイム、追加のフィードストック及び／又はモデル予測を制御する構成（例えば、所望のルート数、ルートにおける最大反応、分子／反応ブラックリスト等）がある。

【0018】

幾つかの実施形態では、予測エンジン２０２は、各予測の反応ネットワークグラフを生じさせることができる。分子は、予め投入され、及び／又は化学者の要件に従って投入され得る。幾つかの実施形態では、標的の分子、反応又は試薬を所与として、予測エンジンは、入力分子から始まる一連の単一ステップ逆合成ステップを通して反応ネットワークを生じさせることができる。図３Ａは、幾つかの実施形態による、逆合成を使用した化学空間における反応ネットワークグラフの生成の簡易化された例を示す図３００である。標的分子Ａ３０２を所与として、予測エンジンは、３０４及び３０６に示されるように、一連の単一ステップ逆合成を通して反応ネットワークを生じさせる。幾つかの実施形態では、入力された標的分子及びフィードストック分子は、ＳＭＩＬＥＳ記法等のテキスト文字列ベースの記法又は本明細書に記載されるものなどの他の記法で指定することができる。３０４に示されるように、第１の逆合成ステップは、グラフにおいて分子「Ｂ」、「Ｃ」、「Ｄ」及び「Ｅ」を生じさせ、これらは、それぞれ試薬Ｒ_１、Ｒ_２、Ｒ_３及びＲ_４に関連付けられる。次いで、グラフ巡回アルゴリズムは、次の標的（この例では分子Ｂ）を選択し、別の単一ステップ逆合成を行い、したがって所望の合成経路が見つけられるまでグラフ反応ネットワークを生じさせる。したがって、グラフ３０６は、グラフにおいて分子「Ｆ」、「Ｇ」及び「Ｈ」を更に含み、これらは、それぞれ試薬Ｒ_７、Ｒ_６及びＲ_５に関連付けられる。３０４及び３０６における矢頭は、反応の方向を示す。図３Ａに示されるグラフは、例示を目的としており、実際には、グラフは、はるかに大きい可能性があることを理解されたい。例えば、本技法は、平均で毎分５０００反応を超える速度で反応を生じさせる大きい反応ネットワークグラフを生成することができる（例えば、１ＧＰＵ当たり概ね５０００反応／分であり、したがってＧＰＵの数に従ってスケーリングすることができる）。

【0019】

図３Ｂは、幾つかの実施形態による、化学空間における反応ネットワークグラフの生成の別の例の図３５０である。セクション３５２は、３つの反応例を示し、Ａ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇは、化合物であり、Ｒ_１～Ｒ_３は、試薬である。セクション３５４は、セクション３５２に示される化学反応のグラフネットワークを示し、図３Ａのように、分子Ａ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇは、ノードに対応し、反応は、これらのノード間の有向接続に対応する。

【0020】

本明細書に記載の技法は、標的分子の逆合成を行って、標的分子の構築に使用することができる反応の組を識別するために使用することができる。図４は、幾つかの実施形態による例示的なモデル予測プロセス４００の態様の図である。本明細書に記載のように、予測プロセスは、例えば、テンプレートなしのモデルを使用して行われ得る。示されるように、モデル予測プロセスは、逆合成要求４０２、拡張オーケストレータ４０４（グラフ巡回スレッド４０６及び分子拡張スレッド４０８を調整する）、ツリー検索４１０及び逆合成結果４１２を含む。

【0021】

図４を図５と併せて説明し、図５は、幾つかの実施形態による、標的生成物を生成するための反応の組（例えば、化学反応ネットワーク又はグラフ）を決定する例示的なコンピュータ化された方法５００を示す図である。ステップ５０２において、予測エンジンは、逆合成要求４０２の標的生成物を受信する。ステップ５０４において、拡張オーケストレータ４０４は、グラフ巡回スレッド４０６を実行する。ステップ５０６において、予測エンジン要求は、グラフ巡回スレッド４０６を介して、標的生成物のための第１の組の反応物予測を要求する。それに応答して、ステップ５０８において、拡張オーケストレータ４０４は、分子拡張スレッド４０８を実行する。ステップ５１０において、予測エンジンは、分子拡張スレッド４０８及び反応物予測モデル（例えば、単一ステップ逆合成モデル）を介して第１の組の反応物予測を実行する。ステップ５１２において、予測エンジンは、第１の組の反応物予測を反応の組の少なくとも一部として記憶する。

【0022】

方法５００は、ステップ５０６に戻り、ステップ５１０において決定された結果に対して更なる予測を行って、フルセットの結果を構築（例えば、完全な化学反応ネットワークを構築）する。例えば、図３Ａを参照すると、分子Ａ３０２に対するステップ５０６～５１２の第１の実行は、化学ネットワーク内の分子「Ｂ」、「Ｃ」、「Ｄ」及び「Ｅ」（並びにそれぞれ試薬Ｒ_１、Ｒ_２、Ｒ_３及びＲ_４）を有する、３０４に示されるグラフの部分を生じさせることができる。ステップ５０６～５１２の第２の反復を次の標的（この例では分子Ｂ）に対して行って、別の単一ステップ逆合成を行い、したがってグラフ３０６を生じさせることができ、グラフ３０６は、分子Ｂから生じる分子「Ｆ」、「Ｇ」及び「Ｈ」（並びにそれぞれ試薬Ｒ_７、Ｒ_６及びＲ_５）をグラフに更に含む。

【0023】

構築されると、予測エンジンは、ツリー検索（例えば、図４の４１０）を行い、逆合成要求４０２に応答してユーザに提供される逆合成結果４１２を最終的に生じさせる。ツリー検索４１０は、化学反応ネットワーク又はグラフに基づいて、標的分子を構築することができる複数の異なる経路を識別するために使用することができる。例えば、図３Ａを更に参照すると、化学ネットワーク内の「Ｂ」、「Ｃ」、「Ｄ」及び「Ｅ」（並びにそれぞれ試薬Ｒ_１、Ｒ_２、Ｒ_３及びＲ_４）のいずれかを使用して、標的分子Ａ３０２を構築することができる。分子「Ｂ」が選択される場合、「Ｂ」の構築に利用可能な３つの更なる選択肢がある：１つの選択肢は、分子「Ｆ」及び試薬Ｒ_７を使用することであり、第２の選択肢は、分子「Ｇ」及び試薬Ｒ_６を使用することであり、第３の選択肢は、分子「Ｈ」及び試薬Ｒ_８を使用することである。その結果、逆合成結果４１２は、標的生成物の構築に使用することができる異なる技法のリストを含み得る。

【0024】

本発明者らは、結果の組（例えば、逆合成グラフ）が、化学的に重要ではないように異なる幾つかのルートを含み得ることを認めた。この一例は、反応の１つで異なる溶媒を使用するによってのみ異なる２つのルートである。幾つかの実施形態では、技法は、溶媒及び他の関連する詳細を直接予測すること含み得るため、結果は、そのような問題を特に受けやすいことがある。幾つかの実施形態では、そのような違いが重要ではないルートは、改変された検索戦略を使用して対処することができる。例えば、技法は、ツリー検索を繰り返し呼び出して、逆合成グラフ内で「最良」の（例えば、指定又は構成することができる任意／相互交換可能な基準に従って）ルートを見つけることを含み得る。各ツリー検索後、返されたルート内の幾つか及び／又は全ての反応から反応物－生成物対のブラックリストを作成することができる。連続する各ツリー検索は、ブラックリストに見られる反応－生成物対を含む反応の幾つか及び／又は全ての使用を禁止することができる。この検索プロセスは、例えば、要求された数のルートが見つかるまで、プロセスが時間切れするまで、及び／又は逆合成グラフ内の可能な全てのツリーが尽きるまで繰り返すことができる。

【0025】

逆合成結果を識別する例示的な技法としてツリー検索が本明細書で考察されるが、他のタイプの検索も本明細書に記載の技法と併用できることを理解されたい。他の例示的な検索戦略には、例えば、深さ優先検索、幅優先検索及び／又は反復深化深さ優先検索等がある。幾つかの実施形態では、結果（例えば、化学反応ネットワーク）は、検索前に前処理することができる。ツリー検索前及び／又は逆合成拡張ループ（例えば、拡張オーケストレータ４０４による）中など、プルーニングを行うことができる。例えば、プルーニングプロセスは、検索前に結果に対して行われて、最良ルートの一部であり得るか否かの決定に基づいて反応をプルーニングすることができる。例えば、反応が、指定されたリスト外のストックを必要とする場合、反応が完全なルートをもたらすことができない（例えば、フィードストック内の全ての開始材料を用いて）場合、反応が、ブラックリストに記載された分子、ブラックリストに記載された反応、望ましくない性質（例えば、中間体の溶解度、反応速度、反応エンタルピー及び／又は熱力学等）等を有する反応を含む場合、反応をプルーニングし得る。

【0026】

グラフ巡回スレッド４０６は、拡張オーケストレータ４０４により使用されて、特定のステップから予測された反応を解析して、後続ステップでの更に拡張する分子を識別することにより、化学反応ネットワークのルート（例えば、分岐）を繰り返し構築することができる。拡張オーケストレータ４０４は、拡張オーケストレータ４０４と数ミリ秒毎に１回等、頻繁に通信することができる。グラフ巡回スレッド４０６は、分子拡張要求を拡張オーケストレータ４０４に送信することができ、拡張オーケストレータ４０４により行われた逆合成グラフ更新を検索することができる。

【0027】

幾つかの実施形態では、拡張オーケストレータ４０４は、グラフ巡回スレッド４０６とは別個のスレッド又はプロセスとして実行することができ、分子拡張スレッド４０８は、グラフ巡回スレッド４０６及び分子拡張スレッド４０８を調整することができる。一般に、拡張オーケストレータ４０４は、グラフ巡回スレッド４０６を（繰り返し）実行することができ、反応（例えば、文字列として）及び信頼度（例えば、浮動小数等の数として）のリストを必要に応じてグラフ巡回スレッド４０６に提供することができる。拡張オーケストレータ４０４は、新しい分子（例えば、標的生成物及び／又は予測プロセスを通して決定された他の分子）の反応物予測についての分子拡張要求をグラフ巡回スレッド４０６から受信することができる。拡張オーケストレータ４０４は、それに従って分子拡張スレッド４０８の実行を調整して、グラフ巡回スレッド４０６により要求された反応物予測を決定することができる。説明のための例として、幾つかの実施形態では、拡張オーケストレータ４０４は、Pythonキュー等のキューを利用してグラフ巡回ワーカー４０６と連係することができる。別の例として、拡張オーケストレータ４０４は、Dask機能を利用して分子拡張スレッド４０８のリアルタイム実行を提供することができる。しかしながら、Python及びDaskは、単なる例であり、限定を意図していないことを理解されたい。

【0028】

拡張オーケストレータ４０４は、分子拡張スレッド４０８に対する必要数の進行中拡張要求を維持することができる。グラフ巡回スレッド４０６からの各拡張要求について、拡張オーケストレータ４０４は、関連付けられた分子拡張スレッド４０８を実行して分子拡張プロセスを行い、化学反応ネットワークを構築するための新しい組の反応物予測を識別することができる。各分子拡張要求に対して反応物予測を生じさせるために、分子拡張スレッド４０８は、図７と併せて説明する単一ステップ逆合成予測をそれぞれ行うことができる。拡張オーケストレータ４０４は、各分子拡張スレッド４０８に拡張する分子（例えば、文字列として）、モデル経路（例えば、文字列として）及び／又は拡張プロセスの選択肢（例えば、文字列及び／又は浮動小数若しくは整数等の数として）を提供することができる。各分子拡張スレッド４０８は、反応（例えば、文字列として）及び信頼度（例えば、浮動小数として）のリストを拡張オーケストレータに提供することができる。

【0029】

拡張オーケストレータ４０４は、分子拡張スレッド４０８が、グラフ巡回スレッド４０６から発行された要求された拡張を行うにつれて、分子拡張スレッド４０８から分子拡張結果を検索し、蓄積することができる。拡張オーケストレータ４０４は、分子拡張スレッド４０８から受信されると、新しい拡張結果を追加することにより、逆合成ネットワーク又はグラフのマスターコピーを更新及び維持することができる。拡張オーケストレータ４０４は、更なる拡張について考慮するために、逆合成グラフ更新をグラフ巡回スレッド４０６に送信することができる。

【0030】

幾つかの実施形態では、分子拡張スレッド４０８により利用される拡張プロセスは、自然言語（ＮＬ）処理技法を使用して反応予想及び逆合成を行うように構成することができる。幾つかの実施形態では、テンプレートなしのモデルは、機械翻訳モデル又はトランスフォーマーモデルである。トランスフォーマーモデルは、翻訳及びオートコンプリ－ション等の自然言語処理タスクに使用することができる。トランスフォーマーモデルの一例は、Segler, M., Preuss, M. & Waller, M. P.,“Towards‘Alphachem’: Chemical synthesis planning with tree search and deep neural network policies,”5th International Conference on Learning Representations, ICLR 2017 - Workshop Track Proceedings (2019)に記載されており、これは、全体として参照により本明細書に援用される。トランスフォーマーモデルは、化学での反応予測及び単一ステップ逆合成問題に使用することができる。したがって、モデルは、反応物、試薬及び生成物の文字列間の機械翻訳技法を使用して反応予測を行うように設計することができる。幾つかの実施形態では、文字列は、ＳＭＩＬＥＳ文字列等のテキストベースの表現又は本明細書に記載されるものなどの他の表現を使用して指定することができる。

【0031】

幾つかの実施形態では、本技法は、１つ又は複数の逆合成モデルを使用するように構成することができる。幾つかの実施形態では、システムは、同じモデルの複数のインスタンスを実行することができる。幾つかの実施形態では、システムは、複数の異なるモデルを実行することができる。拡張オーケストレータ４０４は、１つ又は複数の逆合成モデルと通信するように構成することができる。幾つかの実施形態では、複数の単一ステップ逆合成モデルを使用する場合、拡張オーケストレータ４０４は、拡張要求を複数のモデルにルーティングするように構成することができる。例えば、各拡張要求は、実行中のモデルのサブセット及び／又は全てにルーティングされ得る。同じモデルを複数実行している（例えば、単独で及び／又は他の異なるモデルと組み合わせて）場合、拡張オーケストレータ４０４は、拡張要求を同じモデルの全てにルーティングするように構成することができる。異なる複数のモデルを実行している場合、拡張要求は、異なる複数のモデルに基づいてルーティングすることができる。例えば、拡張要求は、拡張要求に基づいて、拡張要求を適切なモデルに（例えば、必要な専門知識特性、性能特性、スループット特性等の該当する特性を有するモデルのみに）送信するように構成することができるルーティング規則及び／又はルーティングモデルを使用することなどにより、特定のモデルに選択的にルーティングすることができる。

【0032】

幾つかの実施形態では、同じニューラルネットワークアーキテクチャ及び／又は異なるニューラルネットワークアーキテクチャを使用して、異なる複数の単一ステップ逆合成モデルを生じさせることができる。例えば、同じニューラルネットワークアーキテクチャ及びアルゴリズム（例えば、図７と併せて説明される）は、複数のモデルに使用することができるが、異なるトレーニングデータを使用して異なるモデルを達成することができる。別の例として、単一ステップ逆合成モデルは、異なるモデルアーキテクチャ及びアルゴリズムを含み得る。例えば、単一ステップ予測モデルは、記憶されている反応（例えば、既知の反応）に対してデータベースルックアップを行うように構成することができる。各単一ステップ逆合成モデルは、（例えば、モデル構造、ネットワーク及び／又はアルゴリズムを問わず）入力として生成物をとり、出力として示唆された反応（及び関連付けられた信頼度）を返すように構成することができる。その結果、システムは、モデルアーキテクチャ及び／又はアルゴリズムを問わず、各モデルと対話するように構成することができる。

【0033】

幾つかの実施形態では、分子拡張スレッド４０８は、複数のモデルを実行するように構成することができる。例えば、１つ又は複数の分子拡張スレッド４０８は、複数のモデルの各々に対して実行することができる。幾つかの実施形態では、分子拡張スレッド４０８は、本明細書に記載のように異なるモデルを実行することができる。本技法は、複数のモデルを使用する場合、分子拡張スレッド４０８をスケーリングするように構成することができる。例えば、２つのモデル拡張スレッド４０８がそれぞれ異なるモデルを実行するように構成される場合、本技法は、異なる分子拡張スレッド４０８にルーティングされた要求に基づいて負荷平衡を行うことを含み得る。例えば、第１のモデルに第２のモデルよりも多くの予測がルーティングされる場合、システムは、予測の非対称需要を取り扱い、モデルの負荷平衡を達成するために、第２のモデルと比べて第１のモデルにより多くの分子拡張スレッド４０８を作成することができる。

【0034】

図６は、幾つかの実施形態による、反応予測についてモデルをトレーニングするために使用することができる例示的な文字列の図６００である。図６００の例は、図示の反応のＳＭＩＬＥＳ記法での文字列６０２を含む。文字列６０２に示されるように、反応物、試薬及び生成物は、大なり（＞）記号を使用して区切ることができる。その結果、テンプレートなしのモデルは、利用可能な変換に制限される必要がなく、したがってより大きい化学空間を包含することが可能であり得る。

【0035】

幾つかの実施形態では、トレーニングされた機械学習モデルは、標的生成物に基づいて反応物予測の組を決定する、トレーニングされた単一ステップ逆合成モデルである。幾つかの実施形態では、モデルは、複数のモデルを含み得る。幾つかの実施形態では、単一ステップ逆合成モデルは、入力反応物の組に基づいて生成物予測を生じさせるように構成される、トレーニングされた順方向予測モデルと、入力生成物に基づいて反応物予測の組を生じさせるように構成される、トレーニングされた逆方向予測モデルとを含む。その結果、入力生成物が予測生成物と比較されて、反応物予測の組を検証することができる。ビームサーチを使用してルートを発見し、及び／又はサンプリング戦略を使用してルートを発見するなど、異なるルート発見戦略をモデルに使用することができる。

【0036】

幾つかの実施形態では、ビームサーチは、発見された逆合成ルートの多様性を（例えば、大幅に）制限することができ、ビームサーチにより生成される予測の多くは、化学的視点から互いに類似するため、逆方向予測モデルは、ビームサーチの代わりにサンプリング戦略を利用するように構成することができる。その結果、サンプリング戦略の利用は、本明細書に記載の技法全体の品質及び有効性を改善することができる。例えば、シーケンスモデルは、次の位置における可能なトークンにわたる確率分布を予測することができ、その結果、繰り返し評価されなければならず、一度にトークン１つずつでシーケンスを構築する（例えば、復号化と呼ぶことができる）。ナイーブ戦略の一例は、欲張り復号化であり、最も可能性の高いトークン（モデルにより評価される）が復号化プロセスの各反復で選択される。ビームサーチは、各反復でｋ個の最も可能性の高い予測の組を維持することにより、この手法を拡張することができる（例えば、ｋは、ビームと呼ぶことができる）。なお、ｋ＝１の場合、ビームサーチは、基本的に欲張り復号化と同じである。逆に、サンプリングは、各確率（例えば、多項分布からのサンプリング）で重み付けられたトークンを無作為に選択することを含む。トークンの確率は、低及び高確率トークンの相対尤度を調整する「温度」パラメータを用いて変更することもできる。例えば、温度０は、多項分布をａｒｇｍａｘに低減する一方、無限温度は、均一分布に低減する。実際には、温度が高いほど、予測の全体品質が下がるが、多様性が上がる。最も可能性の高い予測は、通常、確率密度の大半を有するため（例えば、通常、反応には１つのみの可能な生成物があるため）、順方向予測モデルは、欲張り復号化を使用することができる。逆方向モデルは、サンプリング方式を使用して、所与の生成物を作る多様な可能な反応物／化学物質を生じさせることができる。サンプリング温度に関して、１前後及び／又は１よりわずかに低い温度（例えば、０．７、０．７５、０．８、０．８５）を使用することができるが、本技法は、そのように限定されない（例えば、１．５、２、２．５、３等までの温度も同様に使用することができる）。温度は、トレーニングの持続時間、トレーニングデータの多様性等の多くの要因に応じてより高くても又はより低くてもよい。

【0037】

幾つかの実施形態では、複数の復号化戦略を順方向及び／又は逆方向予測モデルに使用することができる。復号化戦略は、所与のモデルを使用してシーケンスを予測している間、任意の一時点（又は複数の時点）で変更及び／又は修正することができる。例えば、幾つかの実施形態では、第１の復号化戦略は、予測モデルの第１の部分に使用することができ、第２の復号化戦略は、予測モデルの第２の部分に使用することができる（また任意選択的に第１及び／又は第３の復号化戦略は、予測モデルの第３の部分に使用することができ、以下同様である）。説明のための例として、ある復号化戦略は、ある出力（例えば、反応物又は化学物質（試薬、溶媒及び／又は触媒））を生じさせるために使用することができ、別の復号化戦略は、第２の出力（例えば、第１の復号化戦略により生じない反応物又は化学物質の他方）を生じさせるために使用することができる。特に、サンプリングは、反応物分子を生じさせるために使用することができ、その場合、シーケンスは、欲張り復号化を使用して完成されて、（例えば、最も可能性の高い）残りの組の反応物及び試薬を生じさせることができる。しかしながら、これらの例は、例示目的で提供され、限定の意図はなく、本明細書に記載の技法に従って他の復号化戦略（例えば、ビームサーチ）を使用することも可能であり、及び／又は３つ以上の復号化戦略を使用することも可能であることを理解されたい。

【0038】

幾つかの実施形態では、トレーニングプロセスは、検索戦略に基づいて合わせることができる。例えば、逆方向予測モデルがサンプリング戦略を使用する（例えば、ビームサーチの代わりに）場合、本技法は、逆方向予測モデルのトレーニング時間を増やすことを含み得る。特に、本発明者らは、トレーニングの延長が、ビームサーチ等の他の検索戦略により生成されるサンプルの品質にあまり影響しないが、トレーニングの延長が、サンプリングにより生成される予測の品質を改善することを認めた。

【0039】

図７は、幾つかの実施形態による、順方向モデル及び逆方向モデルを使用した単一ステップ逆合成予測の例示的なコンピュータ化されたプロセス７００の図である。幾つかの実施形態では、コンピュータ化されたプロセス７００は、分子拡張スレッドにより実行することができる。ステップ７０２において、予測エンジンは、トレーニングされた逆方向予測モデルを標的生成物に対して実行することにより、反応物予測の組（例えば、試薬、触媒及び／又は溶媒の組）を予測する。ステップ７０４において、予測エンジンは、トレーニングされた順方向予測モデルを反応物予測の組に対して実行することにより、生成物を予測する。ステップ７０６において、予測エンジンは、標的生成物を、予測された生成物と比較する。予測された生成物が、入力された生成物と一致することが比較により示される場合、ステップ７１０において、予測エンジンは、反応物予測の組を確認し、反応物予測の組を化学反応ネットワークの一部として記憶することができる。一方、予測された生成物が、入力された生成物と一致しない場合、ステップ７１２において、予測エンジンは、結果を除去及び／又は破棄することができる。

【0040】

幾つかの実施形態では、本明細書に記載の方法は、特許又は他の適した文献若しくはデータセットにおいて提供される反応、例えば米国特許に記載の反応でトレーニングすることができる。任意のデータセットが使用可能であり、及び／又は２つ以上のタイプのデータセットを（例えば、プロプライエタリデータセットを米国特許及び／又はＰＣＴ特許及び特許出願に記載の反応と）組み合わせ得る。例えば、本発明者らにより行われた幾つかの実験では、米国特許に記載の３百万を超える反応で例示的なモデルをトレーニングした。モデルは、分子の構造を表す任意のバイトシーケンスを用いて機能するように構成することができる。したがって、トレーニングデータセットは、任意のランク（一次元シーケンス（ランク１行列）及び／又はより高次のシーケンス（例えば、二次元隣接行列）等）を含めて、任意のバイト行列又はバイトシーケンスを使用して指定することができる。非限定的な例には、一般的な分子線記法（例えば、ＳＭＩＬＥＳ、SMILES arbitrary target specification（ＳＭＡＲＴＳ）、Self-Referencing Embedded Strings（ＳＥＬＦＩＥＳ）、ＳＭＩＲＫＳ、ＳＹＢＹＬライン記法又はＳＬＮ、InChI、InChIKey等）、連結性（例えば、行列、原子のリスト及び結合についてのリスト）、原子の３Ｄ座標（例えば、ｐｄｂ、ｍｏｌ、ｘｙｚ等）、分子サブグループ又は畳み込み形式（例えば、フィンガープリント、ニューラルフィンガープリント、モルガンフィンガープリント、RDKitフィンガープリンティング等）、化学マークアップ言語（例えば、ChemML又はＣＭＬ）、ＪＣＡＭＰファイル形式及び／又はＸＹＺファイル形式等がある。幾つかの実施形態では、本技法は、トレーニング前に入力形式を変換することができる。例えば、表検索を使用して畳み込み形式を変換することができ、例えばInChIKeyをInChI又はＳＭＩＬＥＳに変換することができる。その結果、予測は、トレーニングを通して、利用可能なデータセットに存在する反応物、試薬及び生成物における化学モチーフの有無間の相関を学習することに基づき得る。

【0041】

幾つかの実施形態では、本技法は、１つ又は複数の改変を記法に提供することを含み得る。改変は、例えば、多種化合物が一緒に記述される場合など、記法に生じ得る曖昧さを考慮するために行うことができる。ＳＭＩＬＥＳを説明のための例として使用することは、限定を意図せず、ＳＭＩＬＥＳ符号化は、特定の化合物（例えば、イオン化合物）における種をグループ化するように改変することができる。反応ＳＭＩＬＥＳは、ＳＭＩＬＥＳを異なる種／分子から分ける区切り記号として「．」記号を使用する。イオン化合物は、多くの場合、複数の荷電種として表される。例えば、塩化ナトリウムは、「［Ｎａ＋］．［Ｃｌ－］」と記述される。これは、複数の多種化合物が一緒に記述される場合、曖昧さを生じさせる恐れがある。そのような曖昧さの一例は、塩化ナトリウムと過塩素酸カリウムとの反応である。正規順序がどのように指定されるかに応じて、ＳＭＩＬＥＳは、「［Ｏ－］［Ｃｌ＋３］（［Ｏ－］）（［Ｏ－］）［Ｏ－］．［Ｎａ＋］．［Ｃｌ－］．［Ｋ＋］」であり得る。しかしながら、そのような順序では、追加された種が塩化ナトリウム及び過塩素酸カリウムであるか、又は塩化カリウム及び過塩素酸ナトリウムであるかを見分けることは、可能ではない。したがって、反応ＳＭＩＬＥＳは、異なる文字を使用して、多種化合物及び分子における種を区切るように改変することができる。例えば、ＳＭＩＬＥＳ規格で現在使用されていない任意の文字を使用することができる（例えば、スペース「」）。その結果、この改変表現でトレーニングされたモデルは、システムが反応ＳＭＩＬＥＳで種の適切なサブグループを決定することを可能にする。更に、本技法は、元の記法形態に戻すように構成することができる。前の例を続けると、従来の反応ＳＭＩＬＥＳ規約は、分子／種の区切り記号（例えば、この例ではスペース「」）の発生を標準文字の分子区切り文字（例えば、「．」）で置換することにより戻ることができる。

【0042】

幾つかの実施形態では、入力された表現は、モデルと併用するために符号化することができる。例えば、入力文字列を構成する文字セットは、文字を整数トークン代表で置換することなど（例えば、各文字が整数で置換される場合、文字シーケンスは１つの整数で置換されるなど）により、トークン化された文字列に変換することができる。幾つかの実施形態では、整数の列は、ワンホット符号化に変換することができ、これは、基本的に各カテゴリの表現を他のカテゴリから等距離にするようにカテゴリの組を表すために使用することができる。ワンホット符号化は、例えば、長さｎのゼロベクトルを初期化することにより作成することができ、ここで、ｎは、モデルの語彙における一意のトークン数である。トークンの値の位置において、ゼロを１に変更して、そのトークンの識別情報を示すことができる。ワンホット符号化は、ａｒｇｍａｘ関数（例えば、アレイ内の最大値のインデックスを返す）等の関数を使用してトークンに戻すことができる。その結果、そのような符号化を使用して、１００％の確率が、符号化されるトークンにある全ての可能なトークンにわたる確率分布を提供することができる。したがって、モデルの出力は、可能なトークンの全てにわたる確率分布の予測であり得る。

【0043】

幾つかの実施形態によれば、トレーニングは、トレーニング反応の増強を必要とし得る。例えば、入力ソース文字列は、トレーニングに向けて増強することができる。限定を意図しない説明のための例として、以下の例は、ＳＭＩＬＥＳ記法に関連して提供されるが、本明細書に記載の技法の趣旨から逸脱することなく、任意の形式が使用可能であることを理解されたい。幾つかの実施形態では、増強技法は、非正規化を行うことを含み得る。ＳＭＩＬＥＳは、分子グラフの巡回として分子を表す。大半のグラフは、２つ以上の有向巡回順を有し、これは、異なる方向からの「姿勢」又はビューの概念に類似し得る。ＳＭＩＬＥＳは、正規巡回順序を有することができ、各分子に単一の一意の表現を可能にすることができる。幾つかの非正規ＳＭＩＬＥＳが同じ分子を表すことができるため、本技法は、同じ情報を表す多様な異なる入力文字列を生成することができる。幾つかの実施形態では、無作為非正規ＳＭＩＬＥＳは、学習中、使用されるたびに各分子について生成される。各分子は、トレーニング中、幾つかの異なるときに使用することができるため、本技法は、各分子に幾つかの異なる非正規ＳＭＩＬＥＳを生じさせることができ、それにより、モデルを堅牢にし、入力のバリエーションに対処可能にすることができる。

【0044】

幾つかの実施形態によれば、増強技法は、キラリティ反転を行うことを含み得る。キラリティ反応は、鏡面対称であり得、反応の分子をミラーリングすると、別の有効な反応例を生成することができる。そのようなミラーリング技法は、反応に少なくとも１つのキラル中心がある場合、新しいトレーニング例を生成することができ、したがって、ミラーリングされた反応は、少なくとも１つのキラル中心を有する入力に生成することができる。その結果、キラル中心を含む任意の反応について、トレーニング前に反応を反転して、ミラーリングされた反応を生じさせることができる（例えば、反応の全てのキラル中心を反転させることにより）。そのような技法は、反応のクラスが、あるキラリティを有する例を、別のキラリティを有する例よりも圧倒的に多く有し得るトレーニングデータにおける偏りを軽減することができる。

【0045】

幾つかの実施形態では、増強技法は、化学物質ドロップアウトを行うことを含み得る。多くの場合、データセットにおける例は、欠損化学物質（例えば、溶媒、触媒及び／又は試薬）である。トレーニング中、化学物質分子は、反応例において省くことができ、それにより推論中に欠損情報に対してモデルをより堅牢にすることができる。

【0046】

幾つかの実施形態では、増強技法は、分子順序シャッフルを行うことを含み得る。例えば、入力された分子が列記される順序は、予測と無関係であり得る。その結果、本技法は、入力された分子の順序を無作為化することを含み得る（例えば、トレーニング中に各入力において）。

【0047】

トレーニング前にデータセット全体を増強することができるが、本発明者らは、全てのデータをまず増強しなければならず、その後、トレーニングが行われ、したがってトレーニングをいかなる増強とも平行して行うことができないため、そのような手法がはるかに長いトレーニング時間になり得ることを認めた。したがって、本発明者らは、幾つかの実施形態で使用することができるトレーニングに使用される反応の組を増分的に増強する技法を開発した。特に、本技法は、トレーニングデータのサブセットを増強し、次いでその増強されたサブセットを使用してモデルのトレーニングを開始することを含み得、その間、トレーニングデータの他のサブセットは、トレーニングに向けて増強される。例えば、順方向予測モデルの場合、モデルは、増強された反応の生成物を入力として使用し、増強された反応のうちの反応のセットを出力として使用することにより、トレーニング反応の増強されたサブセットを使用してトレーニングすることができる。したがって、トレーニングプロセスは、トレーニングデータの各サブセットが増強されるにつれて続くことができる。別の例として、逆方向予測モデルの場合、モデルは、増強された反応のうちの反応セットを入力として使用し、反応の生成物を出力として使用してトレーニングすることができ、これは、増強されたサブセットの各々について反復的に行われ得る。

【0048】

反応条件は、示唆された合成ルートを実施するための有用な情報であり得る。しかしながら、典型的には、試みる手順を自ら設計することを促進するために、文献に向かい、類似する反応で使用される方法論を見つけることは、化学者に委ねられる。これは、例えば、化学者が文献を調べ、いずれの反応が関連するのに十分に類似するかを主観的に判断し、オートメーションが関わる場合、機械が実行する詳細なアルゴリズムに手順を変換することなどに時間を費やさなければならないため、最適未満であり得る。

【0049】

本明細書に記載の技法は、例えば、分子トランスフォーマーの概念を拡張することにより、機械可読形式で作用リストを提供することを含み得る。更に図２を参照すると、幾つかの実施形態では、予測エンジン２０２は、作用予測２１２を生じさせることができる。例えば、逆方向モデルは、本明細書に記載のように反応物／化学物質を予測し、その後、作用リストを予測することができる。幾つかの実施形態では、作用リストは、ＪＳＯＮ／ＸＭＬ／ＨＴＭＬ等の構造化テキスト形式で提供することができる。構造化データは、劣ったモデル（例えば、自然言語手法と比較して）に繋がると見なされることが多いため、構造化テキスト形式の使用は、従来の通念と対立し得ることを理解されたい。しかしながら、本発明者らは、そのような従来の問題なしで構造化テキスト形式を本明細書に記載の技法と併せて使用できることを認めた。順方向モデルは、作用リストと共に逆方向モデルにより予測された反応物／化学物質を読み込み、それを使用して生成物分子を予測することができる。作用リストは、反応物／化学物質で既に指定されている分子のＳＭＩＬＥＳ文字列を繰り返し得る。概念上、これは、要求される材料が最初に列記され、その後にそれらを利用する手順が続く学術論文の材料及び方法セクションの概念と同様である。データの不完全性に起因して、反応物／化学物質における全ての分子／種を作用リストで見つけられるわけではない（逆も同様である）。したがって、幾つかの実施形態では、本技法は、反応物／化学物質及び作用リストを一緒に含み得る。データのそのような不完全性が存在しない場合、幾つかの実施形態では、簡潔にするために反応物／化学物質を省くことができる。

【0050】

幾つかの実施形態では、本技法は、所与の反応と関連付けられた自然言語手順を予測するようにモデルをトレーニングすることを含み得る。再び図２を参照すると、幾つかの実施形態では、予測エンジン２０２は、したがって、手順２１４を生じさせることができる。これは、幾つかのシナリオでは、そのような技法は、反応段落を構造化作用リストに変換するためにアルゴリズム（例えば、エラーを生じさせる恐れがある）に依存する必要がないため、有用であり得る。化学手順の態様は、簡易化リスト形式で表現することが難しいことがある。したがって、幾つかの実施形態では、本技法は、分子／種の名称をそれらのＳＭＩＬＥＳ均等物で置換することを含み得、それにより、モデルは、手順を記述するとき、適切な場合、関連する分子を単に書き換えることができる。この変更なしでは、例えば、モデルは、データに存在する全ての種類の様々な化学命名法（例えば、ＩＵＰＡＣ、一般名、参照インデックス）にＳＭＩＬＥＳを翻訳するように学習する必要があり、一般化可能性を制限する恐れがある。更に、作用リストに変換するときに破棄され得る細かい詳細（例えば、生成物が無色油として得られた）を代わりに保持することができる。自然言語手順の生成は、化学者が（例えば、文献／特許における手順を）読むのに慣れた形式を通して行うことができるため、化学者が本明細書に記載の技法と対話するためにより容易な対話を提供することができる。

【0051】

アルゴリズムフロー例
本明細書に記載の技法の限定を意図せずに、以下は、本明細書に記載の技法を使用して化学反応ネットワークを構築するためのトレーニング及び予測プロセスの一例である。

【0052】

トレーニング
トレーニング入力は、トレーニング反応の組を含む（例えば、化学反応のデータベース又はリストにおいて）。トレーニング反応の組は、例えば、概ね３百万個の反応等、米国特許からとられた数百万の反応を含み得る。反応は、本明細書に記載のように任意の形式又は記法で読み込むことができる。単一ステップ逆合成モデルは、本明細書に援用されるSeglerに記載のものと同様のものなどの分子トランスフォーマーモデルを使用し、トレーニングデータセット内の生成物を入力として使用し、対応する反応物を出力として使用してトレーニングすることができる。Seglerに記載のモデルへの改変は、例えば、異なるオプティマイザ（例えば、Ａｄａｍａｘ）、異なる学習率（例えば、この例では５ｅ^－４）、異なる学習率ウォームアップスケジュール（例えば、８，０００回のトレーニング反復にわたり０～５ｅ^－４の線形ウォームアップ）、学習率減衰なし及びより長いトレーニング持続時間（例えば、Seglerに記載されるものの５倍～１０倍）等の使用を含み得る。

【0053】

実行
予測エンジンを実行するための入力は、標的分子フィンガープリント（例えば、ここでもＳＭＩＬＥＳ、ＳＭＡＲＴＳ及び／又は任意の他のフィンガープリント記法として）である。最終的な出力は、化学反応ネットワーク又はグラフであり、以下の例示的なステップを使用して生じさせることができる：
ステップ１－入力された標的分子フィンガープリントを受信及び／又は読み込む。
ステップ２－グラフ巡回スレッドを実行して、単一ステップ逆合成標的分子の定期的要求を行う。
ステップ３－分子拡張（単一ステップ予測）スレッドを実行して、グラフ巡回スレッドからの予測要求を満たす。本明細書に記載のように、実行時性能は、単一ステップ予測スレッド数に伴ってスケーリング（例えば、線形に）することができるため、複数の分子拡張スレッドを実行することができる。
ステップ４－分子拡張スレッドにより予測された全ての一意の反応を収集する。
ステップ５－ステップ４から収集された反応における各反応セットについて、指定数の分子拡張の行うことなどの１つ又は複数の所定の基準に達するまで、及び／又はタイムリミット、所望の開始材料の識別及び／又は所望の反応の識別等の達せられた任意の他の関連する基準に達するまで、ステップ２～４を再帰的に繰り返すことにより、新しい反応出力を収集する。
ステップ６－ステップ２～５を反復的に行うことから収集された反応のリストは、化学反応ネットワーク又はグラフの決定に必要な全ての情報を含む。
ステップ７－化学反応ネットワーク又はグラフを返す。

【0054】

本明細書に記載の技法は、種々のタイプの回路及び／又は計算デバイスに組み込むことができる。図８は、本明細書に記載の技術の実施形態の実施に使用し得る例示的なコンピュータシステム８００のブロック図を示す。例えば、コンピュータシステム８００は、図１におけるユーザ計算デバイス１０２及び／又はリモート計算デバイス１０４の一例であり得る。計算デバイス８００は、１つ又は複数のコンピュータハードウェアプロセッサ８０２及び非一時的コンピュータ可読記憶媒体（例えば、メモリ８０４及び１つ又は複数の不揮発性記憶装置８０６）を含み得る。プロセッサ８０２は、（１）メモリ８０４、及び（２）不揮発性記憶装置８０６とのデータの読み書きを制御し得る。本明細書に記載の任意の機能を行うために、プロセッサ８０２は、１つ又は複数の非一時的コンピュータ可読記憶媒体（例えば、メモリ８０４）に記憶された１つ又は複数のプロセッサ実行可能命令を実行し得、１つ又は複数の一時的コンピュータ可読記憶媒体は、プロセッサ８０２による実行のためにプロセッサ実行可能命令を記憶する非一時的コンピュータ可読記憶媒体として機能し得る。計算デバイス８００は、ネットワークＩ／Ｏインタフェース８０８及びユーザＩ／Ｏインタフェース８１０も含む。

【0055】

２０２１年１月２１日付けで出願された「SYSTEMS AND METHODS FOR TEMPLATE-FREE REACTION PREDICTIONS」という名称の米国仮特許出願第６３／１４０，０９０号は、全体として参照により本明細書に援用される。

【0056】

「プログラム」又は「ソフトウェア」という用語は、本明細書では、一般的な意味において、上述したような実施形態の種々の態様を実施するようにコンピュータ又は他のプロセッサ（物理的又は仮想）をプログラムするために採用することができる任意のタイプのコンピュータコード又はプロセッサ実行可能命令の組を指すために使用される。更に、一態様によれば、実行されると、本明細書に提供される本開示の方法を行う１つ又は複数のコンピュータプログラムは、単一のコンピュータ又はプロセッサに存在する必要はなく、異なる複数のコンピュータ又はプロセッサにモジュール式に分散して、本明細書に提供された本開示の種々の態様を実施し得る。

【0057】

プロセッサ実行可能命令は、１つ又は複数のコンピュータ又は他のデバイスにより実行されるプログラムモジュール等の多くの形態であり得る。一般に、プログラムモジュールは、タスクを行うか又は抽象データ型を実施するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。典型的には、プログラムモジュールの機能は、組み合わされるか又は分散され得る。

【0058】

種々の本発明の概念は、例が提供された１つ又は複数のプロセスとして実施され得る。各プロセスの一部として行われる動作は、任意の適した順序であり得る。したがって、動作が図示と異なる順序で行われ、例示的な実施形態では順次動作として示されている場合でも、幾つかの動作を同時に行うことを含み得る実施形態を構築し得る。

【0059】

ここで、本明細書及び特許請求の範囲において使用される場合、１つ又は複数の要素のリストに関連する「少なくとも１つ」という句は、要素のリスト内の要素の任意の１つ又は複数から選択される少なくとも１つの要素を意味するが、必ずしも要素リスト内に特に列記されたあらゆる要素の少なくとも１つを含むわけではなく、また要素リスト内の要素の任意の組み合わせを除外しないと理解されたい。この定義では、「少なくとも１つ」という句が指す、要素リスト内で特に識別された要素以外の要素が、特に識別された要素に関連するか又は関連しないかを問わず、任意選択的に存在し得ることも可能である。したがって、例えば、「Ａ及びＢの少なくとも１つ」（又は均等に「Ａ又はＢの少なくとも１つ」、又は均等に「Ａ及び／又はＢの少なくとも１つ」）は、一実施形態では、Ｂが存在しない状態で、任意選択的に２つ以上を含む少なくとも１つのＡ（及び任意選択的にＢ以外の要素を含む）；別の実施形態では、Ａが存在しない状態で、任意選択的に２つ以上を含む少なくとも１つのＢ（及び任意選択的にＡ以外の要素を含む）；更に別の実施形態では、任意選択的に２つ以上を含む少なくとも１つのＡ及び任意選択的に２つ以上を含む少なくとも１つのＢ（並びに任意選択的に他の要素を含む）等を指すことができる。

【0060】

ここで、本明細書及び特許請求の範囲において使用される場合、「及び／又は」という句は、等位接続された要素、即ち接続的に存在することもあれば、離接的に存在することもある要素の「いずれか一方又は両方」を意味するものと理解されたい。「及び／又は」を用いて列記された複数の要素は、同じように、即ち等位接続された要素の「１つ又は複数」として解釈されるべきである。「及び／又は」節により特に識別された要素以外の他の要素は、特に識別された要素に関連するか又は関連しないかを問わず、任意選択的に存在し得る。したがって、非限定的な例として、「Ａ及び／又はＢ」の言及は、「含む」等のオープンエンド言語と併用される場合、一実施形態ではＡのみ（任意選択的にＢ以外の要素を含む）；別の実施形態ではＢのみ（任意選択的にＡ以外の要素を含む）；更に別の実施形態ではＡ及びＢの両方（任意選択的に他の要素を含む）等を指すことができる。

【0061】

請求項要素を修飾するための特許請求の範囲での「第１」、「第２」、「第３」等の序数詞の使用は、それ自体では、別の請求項要素と比べたある請求項要素の優先性、先行性若しくは序列又は方法の動作が行われる時間順をいずれも含意しない。そのような用語は、単に、特定の名称を有するある請求項要素を（序数詞の使用を別にすれば）同じ名称を有する別の要素から区別するためのラベルとして使用される。本明細書で使用される表現及び用語は、説明を目的としており、限定として見なされるべきではない。「包含する」、「含む」、「有する」、「含有する」、「伴う」及びそれらの変形の使用は、列記された項目及び追加の項目の包含を意味する。

【0062】

本明細書に記載の技法の幾つかの実施形態を詳述したが、当業者であれば、種々の改変形態及び改良形態を容易に想到するであろう。そのような改変形態及び改良形態は、本開示の趣旨及び範囲内にあると意図される。したがって、上記の説明は、単なる例としてのものであり、限定として意図されない。本技法は、以下の特許請求の範囲及びその均等物により規定されるものとしてのみ限定される。

【図1】