特許7089086 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ザイマージェン　インコーポレイテッドの特許一覧

特許7089086生体到達可能予測ツール

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11A
11B

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-06-13

(45)【発行日】2022-06-21

(54)【発明の名称】生体到達可能予測ツール

(51)【国際特許分類】

G16B 5/30 20190101AFI20220614BHJP

C12N 1/15 20060101ALN20220614BHJP

C12N 1/19 20060101ALN20220614BHJP

C12N 1/21 20060101ALN20220614BHJP

C12N 5/10 20060101ALN20220614BHJP

C12N 15/52 20060101ALN20220614BHJP

【ＦＩ】

G16B5/30

C12N1/15

C12N1/19

C12N1/21

C12N5/10

C12N15/52 Z

【請求項の数】 15

(21)【出願番号】P 2021053219

(22)【出願日】2021-03-26

(62)【分割の表示】P 2019543768の分割

【原出願日】2018-02-14

(65)【公開番号】P2021120865

(43)【公開日】2021-08-19

【審査請求日】2021-03-26

(31)【優先権主張番号】62/459,558

(32)【優先日】2017-02-15

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】517366688

【氏名又は名称】ザイマージェンインコーポレイテッド

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】アレクサンダージー．シアラー

(72)【発明者】

【氏名】ミッシェルエル．ウィン

(72)【発明者】

【氏名】エリックジェデディアディーン

【審査官】渡邉加寿磨

(56)【参考文献】

【文献】特表２０１６－５１０３１０（ＪＰ，Ａ）

【文献】特開２０１０－２７９３８２（ＪＰ，Ａ）

【文献】特開２００７－３１７２２６（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／０１４７７４２（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１４／０２４４２２８（ＵＳ，Ａ１）

【文献】特開２００６－７２６５３（ＪＰ，Ａ）

【文献】米国特許出願公開第２００６／００５２９４２（ＵＳ，Ａ１）

【文献】THOMAS HANDORF; ET AL，EXPANDING METABOLIC NETWORKS: SCOPES OF COMPOUNDS, ROBUSTNESS, AND EVOLUTION，JOURNAL OF MOLECULAR EVOLUTION，SPRINGER-VERLAG，2005年09月12日，VOL:61, NR:4，PAGE(S):498 - 512，DOI: 10.1007/s00239-005-0027-1

【文献】SUNISA CHATSURACHAI; ET AL，AN IN SILICO PLATFORM FOR THE DESIGN OF HETEROLOGOUS PATHWAYS IN NONNATIVE METABOLITE PRODUCTION，BMC BIOINFORMATICS，英国，BIOMED CENTRAL，2012年05月11日，VOL:13, NR:93，PAGE(S):1 - 11，http://dx.doi.org/10.1186/1471-2105-13-93

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１６Ｂ５／００－９９／００

Ｃ１２Ｎ１／１５

Ｃ１２Ｎ１／１９

Ｃ１２Ｎ１／２１

Ｃ１２Ｎ５／１０

Ｃ１２Ｎ１５／５２

(57)【特許請求の範囲】

【請求項1】

予測分子のセットを予測するための方法であって、前記方法は、
少なくとも１つのプロセッサを使用して、反応が、前記反応を触媒するために利用可能であると示される１つ以上の対応する触媒によって触媒されると示されるかどうかに少なくとも部分的に基づいて、前記反応を選択することであって、反応セットは、前記選択された反応を含む、ことと、
少なくとも１つのプロセッサによって実施された１つ以上の処理ステップにおいて、前記反応セットにおける１つ以上の反応に従って、１つ以上の出発代謝物を表すデータおよび／または１つ以上の前の処理ステップにおいて生成された１つ以上の予測分子を表すデータを処理することにより、前記予測分子のセットのうちの１つ以上の予測分子を表すデータを生成することと
を含む、方法。

【請求項2】

選択することは、生物の中に組み込まれることまたは生物が生育される成長媒体から摂取されることが可能であると示される１つ以上の対応する触媒によって触媒されると示される反応を選択することを含む、請求項１に記載の方法。

【請求項3】

選択することは、１つ以上のアミノ酸配列または１つ以上の遺伝子配列に対応すると示される１つ以上の対応する触媒によって触媒されると示される反応を選択することを示す、請求項１に記載の方法。

【請求項4】

選択することは、反応が、前記反応を触媒するために利用可能であると示される１つ以上の対応する触媒によって触媒されると少なくとも１つのデータベースにおいて示されるかどうかに少なくとも部分的に基づいて、前記反応を選択することを含む、請求項１に記載の方法。

【請求項5】

前記１つ以上の対応する触媒は、酵素および／または酵素－ナノ粒子共役を含む、請求項１に記載の方法。

【請求項6】

反応を選択することは、触媒が少なくとも１つの反応を触媒するために利用可能であるかどうかに関する複数の信頼度のうちの信頼度に少なくとも部分的に基づいて、前記少なくとも１つの反応を選択することを含む、請求項１に記載の方法。

【請求項7】

選択することは、自発的であると示される反応および／またはオーファン酵素によって触媒されると示される反応を選択することを含む、請求項１に記載の方法。

【請求項8】

予測分子につながる１つ以上の反応経路の記録を生成することをさらに含む、請求項１に記載の方法。

【請求項9】

前記予測分子のうちの１つ以上のものを産生することの困難度のインジケーションを生成することをさらに含む、請求項１に記載の方法。

【請求項10】

標的分子を産生するための１つ以上の宿主生物を同定するためのコンピュータ実装方法であって、
少なくとも１つのプロセッサを使用して、前記標的分子を産生することに関与する１つ以上の触媒が、１つ以上の標的宿主生物の中に組み込まれることおよび／または前記１つ以上の標的宿主生物が生育される成長媒体から摂取されることが可能であるという証拠に少なくとも部分的に基づいて、標的分子を産生するための前記１つ以上の標的宿主生物として前記１つ以上の宿主生物のうちの少なくとも１つを選択することと、
少なくとも１つのプロセッサを使用して、出力として、前記１つ以上の標的宿主生物を表すデータを提供することと
を含む、方法。

【請求項11】

１つ以上のプロセッサと、
前記１つ以上のプロセッサに作用可能に結合され、命令を備える１つ以上のメモリであって、前記命令は、前記１つ以上のプロセッサの少なくとも１つによって実行されると、請求項１～１０のいずれか一項に記載の方法を前記システムに行わせる、メモリと
を備えるシステム。

【請求項12】

命令を記憶する１つ以上の非一過性コンピュータ可読媒体であって、前記命令は、１つ以上のコンピューティングデバイスによって実行されると、請求項１～１０のいずれか一項に記載の方法を前記１つ以上のコンピューティングデバイスのうちの少なくとも１つに行わせる、１つ以上の非一過性コンピュータ可読媒体。

【請求項13】

予測分子のセットを予測するための方法であって、前記方法は、
請求項１～９のいずれか一項に記載の方法に従って前記予測分子のセットを予測すること
を含み、１つ以上の触媒は、予測分子を産生する生物の中に組み込まれるか、または、１つ以上の触媒は、予測分子を産生する生物の成長媒体の中に導入される、方法。

【請求項14】

予測分子のセットを予測するためのシステムであって、前記システムは、
１つ以上のプロセッサと、
前記１つ以上のプロセッサに作用可能に結合され、命令を備える１つ以上のメモリと
を備え、前記命令は、前記１つ以上のプロセッサの少なくとも１つによって実行されると、
請求項１～９のいずれか一項に記載の方法に従って前記予測分子のセットを予測することを前記システムに行わせ、
１つ以上の触媒は、予測分子を産生する生物の中に組み込まれるか、または、１つ以上の触媒は、予測分子を産生する生物の成長媒体の中に導入される、システム。

【請求項15】

予測分子のセットを予測するための命令を記憶する１つ以上の非一過性コンピュータ可読媒体であって、前記命令は、１つ以上のコンピューティングデバイスによって実行されると、
請求項１～９のいずれか一項に記載の方法に従って前記予測分子のセットを予測することを前記１つ以上のコンピューティングデバイスのうちの少なくとも１つに行わせ、
１つ以上の触媒は、予測分子を産生する生物の中に組み込まれるか、または、１つ以上の触媒は、予測分子を産生する生物の成長媒体の中に導入される、１つ以上の非一過性コンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本願は、２０１７年２月１５日に出願された米国仮出願第62/459,558号に対する優先権を主張するものであり、該米国仮出願は、その全体が参照により本明細書中に援用される。

【0002】

本発明は、ＤＡＲＰＡによって授与された契約番号第ＨＲ００１１－１５－９－００１４号に従って米国政府の支援により行われた。政府は、本発明において一定の権利を有する。

【0003】

本開示は、概して、微生物の遺伝子操作を改良する方法に関し、特に、広範な手動介入を伴わずに、特定の微生物内で産生され得る分子のセットを同定することによって微生物の遺伝子操作を改良し、それによって、宿主選択および経路操作等のプロセスを促進する方法に関する。

【背景技術】

【0004】

化学者および材料科学者は、宿主生物（例えば、細菌、酵母、または菌類）のゲノムを改変し、所望の化学物質を産生するために、合成生物学を採用する。しかしながら、化学物質が微生物内でバイオマスの一部として産生され得ることには限界が存在する。概して、広範な手動介入を要求することなく、ゲノム改変を通して生成され得る化学物質の最大可能プールを決定する問題に直面する。そのような化学物質は、本明細書では、「生体到達可能」化学物質、分子、または代謝物として参照されるものとする。

【0005】

生物学的化学物質生成の現在の最新技術は、以下の２つのカテゴリに大きく分類され得る。

【0006】

１）標的分子または代謝経路が理解されており、本具体的経路に焦点を当て、強制的に本経路における化学物質を有用なものにしようとする、化学生産。

【0007】

２）既知の代謝反応のサブセットを使用し、それらを通して単純な追跡を行うことによって作製され得る分子をコンピュータ的に予測する試み。

【0008】

これらのアプローチは、エラーが発生しやすく、いくつかは、非常に高い偽陽性率をもたらす。一連の制約を前提として、宿主生物が生物学的に生成することが可能である化学物質をより正確に予測するための方法の必要性が存在する。

【発明の概要】

【課題を解決するための手段】

【0009】

本開示は、従来の技法の不利点を克服する様式で生存標的分子を予測するための生体到達可能予測ツールを提供する。特に、本開示の生体到達可能予測ツールは、規定された宿主生物に特異的である生存標的分子を予測する。

【0010】

本開示の実施形態の生体到達可能予測ツールは、宿主生物に関する出発代謝物を規定する出発代謝物セットを取得する。実施形態では、出発代謝物セットは、コア代謝物を規定し、コア代謝物は、規定された条件下で操作されていない宿主によって産生されるような少なくとも１つのデータベースによって示される代謝物を含む。実施形態では、宿主は、ゲノム改変を受けていない。

【0011】

実施形態では、生体到達可能予測ツールは、反応を規定する出発反応セットを取得する。実施形態では、ツールは、それ自体が宿主生物内で起こり得る１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒、例えば、酵素によって触媒されるものとして少なくとも１つのデータベース内に示される、出発反応セットからの１つ以上の反応をフィルタ処理された反応セット内に含む。

【0012】

生体到達可能予測ツールが、例えば、公的または専用データベースから、触媒を宿主の中に組み込むことによって（例えば、宿主ゲノムを改変することによって）、または宿主が生育される成長培地からの触媒の摂取を介してのいずれかで、触媒が宿主の中に導入され得ることを示す情報を決定する場合、触媒は、宿主生物内で反応を「触媒するために利用可能な」可能性が高い。

【0013】

より具体的には、本開示は、宿主生物が触媒（例えば、酵素タンパク質）を産生するように宿主生物のゲノムが（例えば、挿入、欠失、置換を介して）改変されるとき、触媒等の部分を宿主生物の中に「組み込まれる」ものと称する。しかしながら、その部分自体が遺伝子材料（例えば、酵素として作用する核酸配列）を含む場合、宿主生物の中へのその部分の「組み込み」は、その部分自体を具現化するように宿主ゲノムを改変することを指す。

【0014】

ある部分は、生体到達可能予測ツールがその部分が宿主の中に組み込まれ得ることを示す情報を決定する場合、宿主生物の中に「組み込まれるように利用可能な」可能性が高い。例えば、実施形態によると、ツールは、ツールによってアクセスされる公的または専用データベースが、（例えば、注釈を介して）酵素が既知のアミノ酸配列に対応するものとして示されることを示す場合、酵素が宿主の中に組み込まれるように利用可能な可能性が高いことを示す情報を決定するであろう。アミノ酸配列が既知である場合、当業者は、アミノ酸配列をコードするために使用される対応する遺伝子配列を導出し、それに応じて、宿主ゲノムを改変することが可能であろう。

【0015】

本文脈および請求項では、「可能性が高い」は、そうではないことよりも起こりそうであるということ、すなわち、５０％を上回る可能性を有することを意味する。

【0016】

１つ以上の処理ステップの各処理ステップにおいて、生体到達可能予測ツールは、フィルタ処理された反応セットの１つ以上の反応に従って、出発代謝物および前の処理ステップにおいて生成された代謝物を表すデータを処理し、１つ以上の生存標的分子を表すデータを生成する。ツールは、出力として、１つ以上の生存標的分子を表すデータを提供する。

【0017】

実施形態では、生体到達可能予測ツールは、対応する触媒が宿主生物内の１つ以上の反応を触媒するために利用可能である、例えば、１つ以上の反応を触媒するために宿主生物の中に組み込まれるように利用可能であるかどうかに関する信頼度を決定する。信頼度は、例えば、少なくとも、第１の信頼度または第１の信頼度よりも高い第２の信頼度を含んでもよい。ツールは、それ自体が宿主生物内の１つ以上の反応を触媒するために第２の信頼度で利用可能であると決定される、例えば、１つ以上の反応を触媒するために宿主生物の中に組み込むために、第２の信頼度で利用可能であると決定される、１つ以上の対応する触媒によって触媒されるものとして少なくとも１つのデータベース内に示される、出発反応セットからの１つ以上の反応をフィルタ処理された反応セット内に含んでもよい。

【0018】

本開示の実施形態では、生体到達可能予測ツールは、生存標的分子のうちの１つ以上のものを産生することの困難度のインジケーションを生成する。困難度のインジケーションは、熱力学的性質、１つ以上の生存標的分子に関する反応経路長、または触媒が生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度に基づいてもよい。

【0019】

本開示の実施形態では、特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成した後、次の処理ステップの前に、生体到達可能予測ツールは、特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成するステップと関連付けられる任意の反応をフィルタ処理された反応セットから除去する。

【0020】

実施形態では、ツールは、各生存標的分子につながる１つ以上の反応経路（すなわち、系統）の記録を生成する。実施形態では、記録を生成するステップは、遍在代謝物からの反応経路を記録内に含めないステップを含む。実施形態では、ツールは、生存標的分子を表すデータが生成されるステップの記録を生成する。実施形態では、ツールは、出発代謝物セットから各生存標的分子への最短反応経路の記録を生成する。

【0021】

単一の宿主生物を所与とする生存標的分子を決定する代わりに、所与の生存標的分子を産生する１つ以上の宿主生物を同定することが、所望され得る。例えば、顧客は、ツールのユーザに、標的分子を産生する複数の宿主内の最適な宿主生物を決定するように求めてもよい。実施形態では、生体到達可能予測ツールは、複数の宿主生物のために起動され、複数の宿主生物の宿主生物毎に、本明細書に説明される方法のうちのいずれかに従って、１つ以上の生存標的分子を表すデータを生成する。そのような実施形態では、所与の生存標的分子に関して、ツールは、所与の宿主生物によって産生される生存標的分子の所与の予測される収率または所与の宿主生物内で所与の生存標的分子を産生するために必要と予測される処理ステップの所与の数等の少なくとも１つの基準を満たす複数の宿主生物のうちの少なくとも１つを決定する。ツールは、出力として、少なくとも１つの基準を満たすと決定された宿主生物を表すデータを提供する。

【0022】

上記の実施形態に関して説明されるように、ツールは、各宿主生物によって産生される各標的分子につながる１つ以上の反応経路（すなわち、系統）の、例えば、熱力学的性質を含む記録を生成してもよい。複数の宿主生物のためにツールを起動する上記の実施形態に基づいて、ツールは、収率、処理ステップの数、反応経路における反応を触媒するための触媒の可用性等のパラメータを規定する注釈を含み得る、ライブラリとしてデータベース内に宿主生物、標的分子、および系統の間の関連付けを記憶してもよい。

【0023】

実施形態では、ツールがそのようなライブラリへのアクセスを有する場合、ツールは、所与の生存標的分子を産生する複数の宿主生物を同定するために起動される必要はない。代わりに、そのような実施形態では、ツールは、宿主、標的分子、および反応の間の関連付けに関する注釈データを含み得る、ライブラリからの系統を使用してもよい。ツールは、少なくとも部分的に、例えば、公的または専用データベースからの、またはライブラリからの、少なくとも１つの標的宿主生物内の標的分子の産生につながる少なくとも１つの反応経路における反応を触媒するように予測される全ての触媒が、全てのそのような反応を触媒するために利用可能な可能性が高いという証拠に基づいて、１つ以上の宿主生物の間から少なくとも１つの標的宿主生物を同定してもよい。実施形態では、ツールは、標的宿主が、標的分子を産生するために必要と予測される反応経路内の反応ステップの閾値数未満を要求することに基づいて、標的宿主を決定してもよい。

【0024】

いくつかの反応酵素は、既知の関連付けられるアミノ酸配列または遺伝子配列を有していない場合がある（「オーファン酵素」）。そのような場合では、ツールは、新しく配列された酵素が１つ以上の反応を触媒するために宿主生物の中に組み込まれ得るように、オーファン酵素を生物資源探査し、それらのアミノ酸配列を予測し、最終的に、それらの遺伝子配列を予測してもよい。ツールは、フィルタ処理された反応データのメンバとして、新しく配列された酵素に対応する反応を含んでもよい。

【0025】

実施形態では、生体到達可能予測ツールは、「工場」、例えば、遺伝子製造システムに、生存標的分子につながる反応経路における１つ以上の反応と関連付けられる１つ以上の遺伝子配列のインジケーションを提供する。実施形態では、遺伝子製造システムは、示された遺伝子配列を宿主のゲノムの中に具現化し、それによって、標的分子の製造のために操作されたゲノムを産生する。実施形態では、ツールは、工場に、工場のための１つ以上の触媒のインジケーションを提供し、標的分子の産生のために宿主生物の成長培地の中に１つ以上の触媒を導入する。

【0026】

実施形態では、生体到達可能予測ツールは、少なくとも部分的に、１つ以上の反応が自発的であるかどうかに基づいて、少なくとも部分的に、それらの方向性に基づいて、少なくとも部分的に、１つ以上の反応が輸送反応であるかどうかに基づいて、または少なくとも部分的に、１つ以上の反応がハロゲン化合物を生成するかどうかに基づいて、出発反応セットからの反応をフィルタ処理された反応セット内に含む。

【0027】

本開示の実施形態では、生体到達可能予測ツールは、宿主生物に関する出発代謝物を規定する出発代謝物セットを取得し、宿主に特異的な反応を規定する出発反応セットを取得する。本開示の実施形態では、生体到達可能予測ツールは、少なくとも１つのデータベース内で自発的と示される１つ以上の反応をフィルタ処理された反応セット内に含む。１つ以上の処理ステップの各処理ステップにおいて、ツールは、フィルタ処理された反応セットの１つ以上の反応に従って、出発代謝物および前の処理ステップにおいて生成された任意の代謝物を表すデータを処理し、各ステップにおける１つ以上の生存標的分子を表すデータを生成する。実施形態では、ツールは、出力として、１つ以上の生存標的分子を表すデータを提供する。
本発明は、例えば、以下を提供する。
（項目１）
宿主生物内で標的分子を産生する生存能力を予測するためのコンピュータ実装方法であって、前記方法は、
少なくとも１つのプロセッサを使用して、前記宿主生物に関する出発代謝物を規定する出発代謝物セットを取得するステップと、
少なくとも１つのプロセッサを使用して、反応を規定する出発反応セットを取得するステップと、
少なくとも１つのプロセッサを使用して、フィルタ処理された反応セット内に前記出発反応セットからの１つ以上の反応を含めるステップと、
少なくとも１つのプロセッサによって実施された１つ以上の処理ステップの各処理ステップにおいて、前記フィルタ処理された反応セットの１つ以上の反応に従って、前記出発代謝物および前の処理ステップにおいて生成された代謝物を表すデータを処理し、１つ以上の生存標的分子を表すデータを生成するステップと、
少なくとも１つのプロセッサを使用して、出力として、前記１つ以上の生存標的分子を表すデータを提供するステップと
を含む、方法。
（項目２）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物における前記１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目１に記載の方法。
（項目３）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物における前記１つ以上の反応を触媒するために利用可能な可能性が高いとして少なくとも１つのデータベース内に示される１つ以上の対応する触媒によって触媒されるものとして少なくとも１つのデータベース内に示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、前記項目のいずれか１項に記載の方法。
（項目４）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物の中に組み込まれるように利用可能な可能性が高い、または前記宿主生物が生育される成長培地からの摂取を介して前記宿主生物の中に導入されるように利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、前記項目のいずれか１項に記載の方法。
（項目５）
各対応する触媒は、酵素および酵素－ナノ粒子共役から成る群から選択される、項目２－４のいずれか１項に記載の方法。
（項目６）
各対応する触媒は、酵素であり、前記酵素は、少なくとも部分的に、前記酵素に関するアミノ酸配列または前記酵素をコードするＤＮＡ配列の可用性に基づいて、前記宿主生物における前記反応を触媒するために利用可能な可能性が高いと示される、項目２－５のいずれか１項に記載の方法。
（項目７）
前記出発反応セット内の１つ以上の反応は、１つ以上の対応するオーファン酵素によって触媒されるものとして示され、前記方法はさらに、
１つ以上の対応するアミノ酸配列を予測するために、前記１つ以上のオーファン酵素を生物資源探査するステップと、
前記１つ以上の対応する生物資源探査されたオーファン酵素によって触媒された前記１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップと
を含む、前記項目のいずれか１項に記載の方法。
（項目８）
触媒が対応する反応を触媒するために利用可能であるかどうかに関する信頼度を決定するステップをさらに含み、前記信頼度は、少なくとも、第１の信頼度または前記第１の信頼度よりも高い第２の信頼度であり、
前記フィルタ処理された反応セット内に前記出発反応セットからの１つ以上の反応を含めるステップは、それ自体が１つ以上の第２の反応を触媒するために前記第２の信頼度で利用可能であると決定される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの前記１つ以上の第２の反応を前記フィルタ処理された反応セット内に含めるステップを含む、
前記項目のいずれか１項に記載の方法。
（項目９）
処理するステップはさらに、特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成した後、次の処理ステップの前に、前記特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成するステップと関連付けられる任意の反応を前記フィルタ処理された反応セットから除去するステップを含む、前記項目のいずれか１項に記載の方法。
（項目１０）
前記出発代謝物セットは、コア代謝物を規定し、前記コア代謝物は、規定された条件下で操作されていない宿主によって産生されるような代謝物を含む、前記項目のいずれか１項に記載の方法。
（項目１１）
前記宿主は、ゲノム改変を受けていない、前記項目のいずれか１項に記載の方法。
（項目１２）
生存標的分子につながる１つ以上の反応経路の記録を生成するステップをさらに含む、前記項目のいずれか１項に記載の方法。
（項目１３）
記録を生成するステップは、遍在代謝物からの反応経路を前記記録内に含めないステップを含む、項目１２に記載の方法。
（項目１４）
生存標的分子を表すデータが生成されるステップの記録を生成するステップをさらに含む、前記項目のいずれか１項に記載の方法。
（項目１５）
前記出発代謝物セットから前記生存標的分子のうちの１つ以上のものへの最短反応経路の記録を生成するステップをさらに含む、前記項目のいずれか１項に記載の方法。
（項目１６）
生存標的分子への反応経路に沿った１つ以上の反応の熱力学的性質の記録を生成するステップをさらに含む、前記項目のいずれか１項に記載の方法。
（項目１７）
触媒が生存標的分子への反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度の記録を生成するステップをさらに含む、前記項目のいずれか１項に記載の方法。
（項目１８）
前記生存標的分子のうちの１つ以上のものを産生することの困難度のインジケーションを生成するステップをさらに含む、前記項目のいずれか１項に記載の方法。
（項目１９）
前記困難度のインジケーションは、少なくとも部分的に、前記１つ以上の生存標的分子に関する反応経路長に基づく、項目１８に記載の方法。
（項目２０）
前記困難度のインジケーションは、少なくとも部分的に、熱力学的性質に基づく、項目１８または１９のいずれか１項に記載の方法。
（項目２１）
前記困難度のインジケーションは、少なくとも部分的に、触媒が前記生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度に基づく、項目１８、１９、または２０のいずれか１項に記載の方法。
（項目２２）
前記困難度のインジケーションは、少なくとも部分的に、前記生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の反応が、それ自体が前記１つ以上の第１の反応経路に沿った前記１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示されるかどうかに基づく、項目１８－２１のいずれかに記載の方法。
（項目２３）
遺伝子製造システムに、生存標的分子につながる反応経路における１つ以上の反応と関連付けられる１つ以上の遺伝子配列のインジケーションを提供するステップをさらに含み、
前記遺伝子製造システムは、前記示された１つ以上の遺伝子配列を前記宿主のゲノムの中に具現化し、前記生存標的分子の製造のために操作されたゲノムを産生するように動作可能である、前記項目のいずれか１項に記載の方法。
（項目２４）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応が自発的であるかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、前記項目のいずれか１項に記載の方法。
（項目２５）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応の方向性に基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、前記項目のいずれか１項に記載の方法。
（項目２６）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応が輸送反応であるかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、前記項目のいずれか１項に記載の方法。
（項目２７）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応がハロゲン化合物を生成するかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、前記項目のいずれか１項に記載の方法。
（項目２８）
方法であって、
複数の宿主生物の宿主生物毎に前記項目のいずれか１項に記載の方法を実施するステップと、
所与の生存標的分子に関して、少なくとも１つの基準を満たす前記複数の宿主生
物のうちの１つ以上のものを決定するステップと、
前記決定された１つ以上の宿主生物を示すデータを提供するステップと
を含む、方法。
（項目２９）
前記少なくとも１つの基準は、収率および処理ステップの数から成る群から選択される少なくとも１つの基準を含む、項目２８に記載の方法。
（項目３０）
前記項目のいずれか１項に記載の方法によって提供されるデータによって表される、生存標的分子。
（項目３１）
前記項目のいずれか１項に記載の方法によって提供されるデータによって表される、前記１つ以上の生存標的分子のうちの少なくとも１つを産生するための生物。
（項目３２）
宿主生物内で標的分子を産生する生存能力を予測するためのシステムであって、前記システムは、
１つ以上のプロセッサと、
１つ以上のメモリであって、前記１つ以上のメモリは、命令を備え、前記命令が前記１つ以上のプロセッサのうちの少なくとも１つによって実行されると、前記命令は、前記システムに、
前記宿主生物に関する出発代謝物を規定する出発代謝物セットを取得するステップと、
反応を規定する出発反応セットを取得するステップと、
前記出発反応セットからの１つ以上の反応をフィルタ処理された反応セット内に含めるステップと、
少なくとも１つのプロセッサによって実施された１つ以上の処理ステップの各処理ステップにおいて、前記フィルタ処理された反応セットの１つ以上の反応に従って、前記出発代謝物および前の処理ステップにおいて生成された代謝物を表すデータを処理し、１つ以上の生存標的分子を表すデータを生成するステップと、
出力として、前記１つ以上の生存標的分子を表すデータを提供するステップと
を行わせる、１つ以上のメモリと
を備える、システム。
（項目３３）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物における前記１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２に記載のシステム。
（項目３４）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物における前記１つ以上の反応を触媒するために利用可能な可能性が高いとして少なくとも１つのデータベース内に示される１つ以上の対応する触媒によって触媒されるものとして少なくとも１つのデータベース内に示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２または３３に記載のシステム。
（項目３５）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物の中に組み込まれるように利用可能な可能性が高い、または前記宿主生物が生育される成長培地からの摂取を介して前記宿主生物の中に導入されるように利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２－３４のいずれか１項に記載のシステム。
（項目３６）
各対応する触媒は、酵素および酵素－ナノ粒子共役から成る群から選択される、項目３３－３５のいずれか１項に記載のシステム。
（項目３７）
各対応する触媒は、酵素であり、前記酵素は、少なくとも部分的に、前記酵素に関するアミノ酸配列または前記酵素をコードするＤＮＡ配列の可用性に基づいて、前記宿主生物における前記反応を触媒するために利用可能な可能性が高いと示される、項目３３－３６のいずれか１項に記載のシステム。
（項目３８）
前記出発反応セット内の１つ以上の反応は、１つ以上の対応するオーファン酵素によって触媒されるものとして示され、前記命令はさらに、
１つ以上の対応するアミノ酸配列を予測するために、前記１つ以上のオーファン酵素を生物資源探査するステップと、
前記１つ以上の対応する生物資源探査されたオーファン酵素によって触媒された前記１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップと
を行わせるための命令を備える、項目３２－３７のいずれか１項に記載のシステム。
（項目３９）
前記命令はさらに、触媒が対応する反応を触媒するために利用可能であるかどうかに関する信頼度を決定するための命令を備え、前記信頼度は、少なくとも、第１の信頼度または前記第１の信頼度よりも高い第２の信頼度であり、
前記フィルタ処理された反応セット内に前記出発反応セットからの１つ以上の反応を含めるステップは、それ自体が１つ以上の第２の反応を触媒するために前記第２の信頼度で利用可能であると決定される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの前記１つ以上の第２の反応を前記フィルタ処理された反応セット内に含めるステップを含む、
項目３２－３８のいずれか１項に記載のシステム。
（項目４０）
処理するステップはさらに、特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成した後、次の処理ステップの前に、前記特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成するステップと関連付けられる任意の反応を前記フィルタ処理された反応セットから除去するステップを含む、項目３２－３９のいずれか１項に記載のシステム。
（項目４１）
前記出発代謝物セットは、コア代謝物を規定し、前記コア代謝物は、規定された条件下で操作されていない宿主によって産生されるような代謝物を含む、項目３２－４０のいずれか１項に記載のシステム。
（項目４２）
前記宿主は、ゲノム改変を受けていない、項目３２－４１のいずれか１項に記載のシステム。
（項目４３）
前記命令はさらに、前記生存標的分子のうちの１つ以上のものにつながる１つ以上の反応経路の記録を生成するための命令を備える、項目３２－４２のいずれか１項に記載のシステム。
（項目４４）
記録を生成するステップは、遍在代謝物からの反応経路を前記記録内に含めないステップを含む、項目４３に記載のシステム。
（項目４５）
前記命令はさらに、生存標的分子を表すデータが生成されるステップの記録を生成するための命令を備える、項目３２－４４のいずれか１項に記載のシステム。
（項目４６）
前記命令はさらに、前記出発代謝物セットから前記生存標的分子のうちの１つ以上のものへの最短反応経路の記録を生成するための命令を備える、項目３２－４５のいずれか１項に記載のシステム。
（項目４７）
前記命令はさらに、生存標的分子への反応経路に沿った１つ以上の反応の熱力学的性質の記録を生成するための命令を備える、項目３２－４７のいずれか１項に記載のシステム。
（項目４８）
前記命令はさらに、触媒が生存標的分子への反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度の記録を生成するための命令を備える、項目３２－４８のいずれか１項に記載のシステム。
（項目４９）
前記命令はさらに、前記生存標的分子のうちの１つ以上のものを産生することの困難度のインジケーションを生成するための命令を備える、項目３２－４８のいずれか１項に記載のシステム。
（項目５０）
前記困難度のインジケーションは、少なくとも部分的に、前記１つ以上の生存標的分子に関する反応経路長に基づく、項目４９に記載のシステム。
（項目５１）
前記困難度のインジケーションは、少なくとも部分的に、熱力学的性質に基づく、項目４９または５０に記載のシステム。
（項目５２）
前記困難度のインジケーションは、少なくとも部分的に、触媒が前記生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度に基づく、項目４９－５１のいずれか１項に記載のシステム。
（項目５３）
前記困難度のインジケーションは、少なくとも部分的に、前記生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の反応が、それ自体が前記１つ以上の第１の反応経路に沿った前記１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示されるかどうかに基づく、項目４９－５２に記載のシステム。
（項目５４）
前記命令はさらに、遺伝子製造システムに、生存標的分子につながる反応経路における１つ以上の反応と関連付けられる１つ以上の遺伝子配列のインジケーションを提供するための命令を備え、
前記遺伝子製造システムは、前記示された１つ以上の遺伝子配列を前記宿主のゲノムの中に具現化し、前記生存標的分子の製造のために操作されたゲノムを産生するように動作可能である、項目３２－５３のいずれか１項に記載のシステム。
（項目５５）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応が自発的であるかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２－５４のいずれか１項に記載のシステム。
（項目５６）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応の方向性に基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２－５５のいずれか１項に記載のシステム。
（項目５７）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応が輸送反応であるかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２－５６のいずれか１項に記載のシステム。
（項目５８）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応がハロゲン化合物を生成するかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目３２－５７のいずれか１項に記載のシステム。
（項目５９）
標的分子を産生する宿主生物を同定することに関し、前記命令は、前記出発代謝物セットの取得、前記出発反応セットの取得、および前記複数の宿主生物の宿主生物毎の項目３２－５８のいずれか１項に記載の処理のための命令を含み、前記命令はさらに、複数の宿主生物の宿主生物毎に、
所与の生存標的分子に関して、少なくとも１つの基準を満たす前記複数の宿主生物のうちの１つ以上のものを決定するステップと、
前記決定された１つ以上の宿主生物を示すデータを提供するステップと
を実施するための命令を備える、項目３２－５８のいずれか１項に記載のシステム。
（項目６０）
前記少なくとも１つの基準は、収率および処理ステップの数から成る群から選択される少なくとも１つの基準を含む、項目５９に記載のシステム。
（項目６１）
宿主生物内で標的分子を産生する生存能力を予測するための命令を記憶する１つ以上の非一過性コンピュータ可読媒体であって、前記命令は、１つ以上のコンピューティングデバイスによって実行されると、前記１つ以上のコンピューティングデバイスのうちの少なくとも１つに、
前記宿主生物に関する出発代謝物を規定する出発代謝物セットを取得するステップと、
反応を規定する出発反応セットを取得するステップと、
前記出発反応セットからの１つ以上の反応をフィルタ処理された反応セット内に含めるステップと、
少なくとも１つのプロセッサによって実施された１つ以上の処理ステップの各処理ステップにおいて、前記フィルタ処理された反応セットの１つ以上の反応に従って、前記出発代謝物および前の処理ステップにおいて生成された代謝物を表すデータを処理し、１つ以上の生存標的分子を表すデータを生成するステップと、
出力として、前記１つ以上の生存標的分子を表すデータを提供するステップと
を行わせる、１つ以上の非一過性コンピュータ可読媒体。
（項目６２）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物における前記１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１に記載の１つ以上のコンピュータ可読媒体。
（項目６３）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物における前記１つ以上の反応を触媒するために利用可能な可能性が高いとして少なくとも１つのデータベース内に示される１つ以上の対応する触媒によって触媒されるものとして少なくとも１つのデータベース内に示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１または６２に記載の１つ以上のコンピュータ可読媒体。
（項目６４）
前記フィルタ処理された反応セット内に１つ以上の反応を含めるステップは、それ自体が前記宿主生物の中に組み込まれるように利用可能な可能性が高い、または前記宿主生物が生育される成長培地からの摂取を介して前記宿主生物の中に導入されるように利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示される前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１－６３のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目６５）
各対応する触媒は、酵素および酵素－ナノ粒子共役から成る群から選択される、項目６２－６４のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目６６）
各対応する触媒は、酵素であり、前記酵素は、少なくとも部分的に、前記酵素に関するアミノ酸配列または前記酵素をコードするＤＮＡ配列の可用性に基づいて、前記宿主生物における前記反応を触媒するために利用可能な可能性が高いと示される、項目６２－６５のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目６７）
前記出発反応セット内の１つ以上の反応は、１つ以上の対応するオーファン酵素によって触媒されるものとして示され、前記命令はさらに、
１つ以上の対応するアミノ酸配列を予測するために、前記１つ以上のオーファン酵素を生物資源探査するステップと、
前記１つ以上の対応する生物資源探査されたオーファン酵素によって触媒された前記１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップと
を行うための命令を備える、項目６１－６６のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目６８）
前記命令はさらに、対応する触媒が対応する反応を触媒するために利用可能であるかどうかに関する信頼度を決定するための命令を備え、前記信頼度は、少なくとも、第１の信頼度または前記第１の信頼度よりも高い第２の信頼度であり、
前記フィルタ処理された反応セット内に前記出発反応セットからの１つ以上の反応を含めるステップは、それ自体が１つ以上の第２の反応を触媒するために前記第２の信頼度で利用可能であると決定される１つ以上の対応する触媒によって触媒されるものとして示される、前記出発反応セットからの前記１つ以上の第２の反応を前記フィルタ処理された反応セット内に含めるステップを含む、
項目６１－６７のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目６９）
処理するステップはさらに、特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成した後、次の処理ステップの前に、前記特定の処理ステップにおいて１つ以上の生存標的分子を表すデータを生成するステップと関連付けられる任意の反応を前記フィルタ処理された反応セットから除去するステップを含む、項目６１－６８のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７０）
前記出発代謝物セットは、コア代謝物を規定し、前記コア代謝物は、規定された条件下で操作されていない宿主によって産生されるような代謝物を含む、項目６１－６９のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７１）
前記宿主は、ゲノム改変を受けていない、項目６１－７０のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７２）
前記命令はさらに、前記生存標的分子のうちの１つ以上のものにつながる１つ以上の反応経路の記録を生成するための命令を備える、項目６１－７１のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７３）
記録を生成するステップは、遍在代謝物からの反応経路を前記記録内に含めないステップを含む、項目７２に記載の１つ以上のコンピュータ可読媒体。
（項目７４）
前記命令はさらに、生存標的分子を表すデータが生成されるステップの記録を生成するための命令を備える、項目６１－７３のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７５）
前記命令はさらに、前記出発代謝物セットから前記生存標的分子のうちの１つ以上のものへの最短反応経路の記録を生成するための命令を備える、項目６１－７４のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７６）
前記命令はさらに、生存標的分子への反応経路に沿った１つ以上の反応の熱力学的性質の記録を生成するための命令を備える、項目６１－７５のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７７）
前記命令はさらに、触媒が生存標的分子への反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度の記録を生成するための命令を備える、項目６１－７６のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７８）
前記命令はさらに、前記生存標的分子のうちの１つ以上のものを産生することの困難度のインジケーションを生成するための命令を備える、項目６１－７７のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目７９）
前記困難度のインジケーションは、少なくとも部分的に、前記１つ以上の生存標的分子に関する反応経路長に基づく、項目７８に記載の１つ以上のコンピュータ可読媒体。
（項目８０）
前記困難度のインジケーションは、少なくとも部分的に、熱力学的性質に基づく、項目７８または７９に記載の１つ以上のコンピュータ可読媒体。
（項目８１）
前記困難度のインジケーションは、少なくとも部分的に、触媒が前記生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の対応する反応を触媒するために利用可能であるかどうかに関する信頼度に基づく、項目７８－８０のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８２）
前記困難度のインジケーションは、少なくとも部分的に、前記生存標的分子のうちの１つ以上のものへの１つ以上の第１の反応経路に沿った１つ以上の反応が、それ自体が前記１つ以上の第１の反応経路に沿った前記１つ以上の反応を触媒するために利用可能な可能性が高いと示される１つ以上の対応する触媒によって触媒されるものとして示されるかどうかに基づく、項目７８－８１のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８３）
前記命令はさらに、遺伝子製造システムに、生存標的分子につながる反応経路における１つ以上の反応と関連付けられる１つ以上の遺伝子配列のインジケーションを提供するための命令を備え、
前記遺伝子製造システムは、前記示された１つ以上の遺伝子配列を前記宿主のゲノムの中に具現化し、前記生存標的分子の製造のために操作されたゲノムを産生するように動作可能である、項目６１－８２のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８４）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応が自発的であるかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１－８３のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８５）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応の方向性に基づいて、前記出発反応からの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１－８４のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８６）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応が輸送反応であるかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１－８５のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８７）
前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップは、少なくとも部分的に、前記１つ以上の反応がハロゲン化合物を生成するかどうかに基づいて、前記出発反応セットからの１つ以上の反応を前記フィルタ処理された反応セット内に含めるステップを含む、項目６１－８６のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８８）
標的分子を産生する宿主生物を同定することに関し、前記命令は、前記出発代謝物セットの取得、前記出発反応セットの取得、および前記複数の宿主生物の宿主生物毎の項目６１－８７のいずれか１項に記載の処理のための命令を含み、前記命令はさらに、複数の宿主生物の宿主生物毎に、
所与の生存標的分子に関して、少なくとも１つの基準を満たす前記複数の宿主生物のうちの１つ以上のものを決定するステップと、
前記決定された１つ以上の宿主生物を示すデータを提供するステップと
を実施するための命令を備える、項目６１－８７のいずれか１項に記載の１つ以上のコンピュータ可読媒体。
（項目８９）
前記少なくとも１つの基準は、収率および処理ステップの数から成る群から選択される少なくとも１つの基準を含む、項目８９に記載の１つ以上のコンピュータ可読媒体。
（項目９０）
標的分子を産生する宿主生物を同定するための方法であって、
少なくとも１つのプロセッサを使用して、１つ以上の分子と前記１つ以上の分子が産生される１つ以上の宿主生物との間の関連付けに関する情報にアクセスするステップと、
少なくとも１つのプロセッサを使用して、少なくとも部分的に、前記標的分子を産生することに関与する全ての触媒が、前記１つ以上の標的宿主生物内の前記標的分子の産生につながる反応を触媒するために利用可能な可能性が高いという証拠に基づいて、前記１つ以上の宿主生物のうちの少なくとも１つを標的分子を産生する１つ以上の標的宿主生物として同定するステップと、
少なくとも１つのプロセッサを使用して、出力として、前記１つ以上の標的宿主生物を表すデータを提供するステップと
を含む、方法。
（項目９１）
前記１つ以上の標的宿主生物を表すデータは、前記１つ以上の標的宿主生物内で前記標的分子を産生するために使用可能である、項目９０に記載の方法。
（項目９２）
前記証拠は、前記標的分子の産生につながる１つ以上の反応経路の記録を備える、項目９０または９１に記載の方法。
（項目９３）
前記１つ以上の標的宿主生物を同定するステップは、少なくとも部分的に、前記１つ以上の標的宿主生物内で前記標的分子を産生するために要求される前記１つ以上の反応経路内の反応ステップの数に基づく、項目９２に記載の方法。
（項目９４）
１つ以上の標的宿主生物内で前記標的分子を産生するステップをさらに含む、項目９０－９３のいずれか１項に記載の方法。
（項目９５）
標的分子を産生する宿主生物を同定するためのシステムであって、前記システムは、
１つ以上のプロセッサと、
１つ以上のメモリであって、前記１つ以上のメモリは、命令を備え、前記命令が前記１つ以上のプロセッサのうちの少なくとも１つによって実行されると、前記命令は、前記システムに、
１つ以上の分子と前記１つ以上の分子が産生される１つ以上の宿主生物との間の関連付けに関する情報にアクセスするステップと、
少なくとも部分的に、前記標的分子を産生することに関与する全ての触媒が、前記１つ以上の標的宿主生物内の前記標的分子の産生につながる反応を触媒するために利用可能な可能性が高いという証拠に基づいて、前記１つ以上の宿主生物のうちの少なくとも１つを標的分子を産生する１つ以上の標的宿主生物として同定するステップと、
出力として、前記１つ以上の標的宿主生物を表すデータを提供するステップと
を行わせる、１つ以上のメモリと
を備える、システム。
（項目９６）
前記１つ以上の標的宿主生物を表すデータは、前記１つ以上の標的宿主生物内で前記標的分子を産生するために使用可能である、項目９５に記載のシステム。
（項目９７）
前記証拠は、前記標的分子の産生につながる１つ以上の反応経路の記録を備える、項目９５または９６に記載のシステム。
（項目９８）
前記１つ以上の標的宿主生物を同定するステップは、少なくとも部分的に、前記１つ以上の標的宿主生物内で前記標的分子を産生するために要求される前記１つ以上の反応経路内の反応ステップの数に基づく、項目９７に記載のシステム。
（項目９９）
前記命令はさらに、１つ以上の標的宿主生物内で前記標的分子を産生するための命令を備える、項目９５－９８のいずれか１項に記載のシステム。
（項目１００）
標的分子を産生する宿主生物を同定するための命令を記憶する１つ以上の非一過性コンピュータ可読媒体であって、前記命令は、１つ以上のコンピューティングデバイスによって実行されると、前記１つ以上のコンピューティングデバイスのうちの少なくとも１つに、
１つ以上の分子と前記１つ以上の分子が産生される１つ以上の宿主生物との間の関連付けに関する情報にアクセスするステップと、
少なくとも部分的に、前記標的分子を産生することに関与する全ての触媒が、前記１つ以上の標的宿主生物内の前記標的分子の産生につながる反応を触媒するために利用可能な可能性が高いという証拠に基づいて、前記１つ以上の宿主生物のうちの少なくとも１つを標的分子を産生する１つ以上の標的宿主生物として同定するステップと、
出力として、前記１つ以上の標的宿主生物を表すデータを提供するステップと
を行わせる、１つ以上の非一過性コンピュータ可読媒体。
（項目１０１）
前記１つ以上の標的宿主生物を表すデータは、前記１つ以上の標的宿主生物内で前記標的分子を産生するために使用可能である、項目１００に記載の１つ以上のコンピュータ可読媒体。
（項目１０２）
前記証拠は、前記標的分子の産生につながる１つ以上の反応経路の記録を備える、項目１００または１０１に記載の１つ以上のコンピュータ可読媒体。
（項目１０３）
前記１つ以上の標的宿主生物を同定するステップは、少なくとも部分的に、前記１つ以上の標的宿主生物内で前記標的分子を産生するために要求される前記１つ以上の反応経路内の反応ステップの数に基づく、項目１０２に記載の１つ以上のコンピュータ可読媒体。
（項目１０４）
前記命令はさらに、１つ以上の標的宿主生物内で前記標的分子を産生するための命令を備える、項目１００－１０３のいずれか１項に記載の１つ以上のコンピュータ可読媒体。

【図面の簡単な説明】

【0028】

【図1】図１は、本開示の実施形態による、生体到達可能予測ツールを実装するためのシステムを図示する。

【0029】

【図2】図２は、本開示の実施形態による、生体到達可能予測ツールの動作を図示するフロー図である。

【0030】

【図3】図３は、本開示の実施形態による、厳密および緩和酵素配列検索を実装するための擬似コードを図示する。

【0031】

【図4】図４は、本開示の実施形態の生体到達可能予測ツールによって生成され得る報告の実施例を図示する。

【0032】

【図5】図５は、本開示の実施形態の生体到達可能予測ツールによって生成され得る反応系統追跡の報告の仮説的実施例を図示する。

【0033】

【図6】図６は、本開示の実施形態による、クラウドコンピューティング環境を図示する。

【0034】

【図7】図７は、本開示の実施形態による、非一過性コンピュータ可読媒体（例えば、メモリ）内に記憶される命令を実行するために使用され得るコンピュータシステムの実施例を図示する。

【0035】

【図8】図８は、本開示の実施形態の生体到達可能予測ツールによって生成され得るタイプの単一の経路の実施例を図示する。本実施例では、チラミン分子は、宿主生物への単一の酵素的ステップの追加によって到達可能であることが予測された。本経路は、実践するために短縮され、チラミンを産生するために宿主生物の中に組み込まれている。本経路の評価スコアが、反応図の最後に添付される。

【0036】

【図9】図９は、本開示の実施形態の生体到達可能予測ツールによって生成され得るタイプの２つの明確に異なる経路の実施例を図示する。本実施例では、両方の経路が、生体到達可能予測ツールによって、生体到達可能分子（Ｓ）－２，３，４，５－テトラヒドロジピコリネート（ＴＨＤＰ）を生成することが可能であるとして同定された。２つの経路は、還元当量タイプ（ＮＡＤＨ対ＮＡＤＰＨ）のそれらの使用によって異なる。これらの経路のうちの一方は、実践するために短縮され、ＴＨＤＰを産生するために宿主生物の中に組み込まれている。各経路の評価スコアが、反応図の最後に添付される。

【0037】

【図10】図１０は、本開示の実施形態の生体到達可能予測ツールによって生成され得るタイプのより複雑な多経路予測の実施例を図示する。各経路の評価スコアが、反応図の最後に添付される。

【0038】

【図11A】図１１Ａおよび１１Ｂはともに、本開示の実施形態の生体到達可能予測ツールによって生成され得るスコア分類の実施例を図示する。（図１１Ｂは、図１１Ａの下側に添付される。）この場合、示される評価データは、分子（Ｓ）－２，３，４，５－テトラヒドロジピコリネート（ＴＨＤＰ）への経路を予測するプロセスの間に生成された。

【図11B】図１１Ａおよび１１Ｂはともに、本開示の実施形態の生体到達可能予測ツールによって生成され得るスコア分類の実施例を図示する。（図１１Ｂは、図１１Ａの下側に添付される。）この場合、示される評価データは、分子（Ｓ）－２，３，４，５－テトラヒドロジピコリネート（ＴＨＤＰ）への経路を予測するプロセスの間に生成された。

【発明を実施するための形態】

【0039】

本説明は、種々の例示的実施形態が示される、付随の図面を参照して行われる。しかしながら、多くの異なる例示的実施形態が、使用されてもよく、したがって、本説明は、本明細書に記載される例示的実施形態に限定されるように解釈されるべきではない。むしろ、これらの例示的実施形態は、本開示が徹底的かつ完全であろうように提供される。例示的実施形態の種々の修正が、当業者に容易に明白となり、本明細書に定義される一般的原理は、本開示の精神および範囲から逸脱することなく、他の実施形態および用途に適用されてもよい。したがって、本開示は、示される実施形態に限定されることを意図せず、本明細書に開示される原理および特徴と一貫する最も広い範囲を与えられるものである。

【0040】

本発明者らは、生存標的分子を予測するための従来の方法が以下の障害に悩まされていることを認識した。

【0041】

１）生物学的部分の欠如。これは、生物学的に生成され得る化学物質についての偽陽性予測の単一の最大の原因である。いくつかの従来の方法は、既存の反応データベースを採用し、グルコースのような供給原料から全ての既知の代謝反応をステップスルーし、全ての経路が操作され得ると仮定する。しかしながら、多くの反応は、宿主生物の中に組み込まれ得る遺伝子部分に対応しない。典型的には、反応は、酵素によって触媒される。既存のデータベースにおける反応は、それらの触媒酵素に従って明確に特性評価され得るが、それらの酵素の多くは、それらのアミノ酸が配列決定されておらず、酵素と関連付けられる遺伝子配列との間にいかなる相関関係も確立されていないことを意味する。遺伝子配列がないと、宿主ゲノムは、要求される酵素を産生するために改変されることができない。実際、明確に特性評価された酵素反応の約２５～５０％は、いかなる既知の関連付けられる遺伝子配列も有しておらず、したがって、それらの酵素は、操作目的のための生物学的部分として有用ではない。全体的生物学的データベースにおける遺伝子不在反応の割合は、これらのデータベースが明確に特性評価されていない多くの反応を含むため、さらに高い可能性が高い。本発明者らは、ある場合には、酵素－ナノ粒子共役等の酵素以外の触媒が採用され得ることに注目している。例えば、ＶｅｒｔｇｅｌＡＡ，ｅｔａｌ．，
Ｅｎｚｙｍｅ－ｎａｎｏｐａｒｔｉｃｌｅｃｏｎｊｕｇａｔｅｓｆｏｒｂｉｏｍｅｄｉｃａｌａｐｐｌｉｃａｔｉｏｎｓ，ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏ．２０１１；６７９：１６５－８２；ＪｏｈｎｓｏｎＰＡ，ｅｔａｌ．，Ｅｎｚｙｍｅｎａｎｏｐａｒｔｉｃｌｅｆａｂｒｉｃａｔｉｏｎ：ｍａｇｎｅｔｉｃｎａｎｏｐａｒｔｉｃｌｅｓｙｎｔｈｅｓｉｓａｎｄｅｎｚｙｍｅｉｍｍｏｂｉｌｉｚａｔｉｏｎ，ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．２０１１；６７９：１８３－９１（その全てが、参照することによってその全体として本明細書に組み込まれる）を参照されたい。それらの場合では、それらの触媒を宿主生物の中に組み込むために要求される部分は、既知である場合とそうではない場合がある。

【0042】

２）不正確な経路追跡。多くの試行される解決策は、分子間の経路を恣意的に追跡しようと試みる。これは、標的分子の炭素骨格の生成を適切に追跡することができないことにつながり得る。一般的な実施例を引用すると、経路が、グルタミンから標的分子を生成する反応まで追跡され得、次いで、グルタミンは、その標的分子を生成するまでの経路の一部として引用されるであろう。しかしながら、殆どの場合では、グルタミンは、窒素族を提供し、いかなる炭素も提供せず、したがって、本追跡は、誤解を招き、標的分子が作製され得ることを示さない（他のエラーは、ＡＴＰ等の他の遍在分子または水等の無機分子を通した追跡接続を含む）。これらのタイプの経路追跡エラーはまた、（マッピングアプリケーションが、２～３つの最も直接的かつ有用な経路の代わりに、ＳａｎＦｒａｎｃｉｓｃｏを通した全ての可能性として考えられる道路ルートを可能にするかのように）使用不可能な多数の予測される経路につながる。

【0043】

３）双方向性反応の仮定。別の有意なエラー源は、熱力学／反応の方向を考慮できないことである。熱力学は、いくつかの反応が一方向にのみ進行し得ることを指示する。しかしながら、分子Ａを分子Ｂに分解するだけの反応は、多くの場合、従来の手段によって両方向に進行するように予測され、したがって、分子ＡがＢから合成され得ることが、誤って予測されるであろう。特定の実施例として、一部の細菌は、有機塩化物等のハロゲン化化合物を分解するが、ハロゲン化化合物を生成するように逆に進行することはできない。多くの生物学的反応は、一方向にのみ進行することが著しく好まれるため、反応の方向性を考慮できないこともまた、偽陽性予測をもたらすであろう。

【0044】

４）他のエラー。全ての宿主が、同一の代謝経路のセットを維持するわけではないため、全ての宿主が、全ての標的分子を産生するように操作される、または同一の改変のセットまたは成功の可能性を伴って全ての標的分子を産生するように操作され得るわけではない。

【0045】

本開示の実施形態の生体到達可能予測ツール（ＢＰＴ）は、従来の方法の限界を克服する。本開示の実施形態のＢＰＴは、標的にとらわれない方式で、出発制約（例えば、特定の宿主生物、反応ステップの数、遺伝子配列決定された酵素との反応のみが可能にされるかどうか）のセットを前提として、生物学的に生成され得る可能性が高い全ての化学物質を記述し得る。これは、生存標的化学物質のリストである「生体到達可能リスト」を作成する。これらの標的化学物質およびそれらの関連付けられる構造は、それらを生成するために要求される生物学を考慮する必要性なく、分子の化学的有用性を精査し得る専門の化学者に提供されることができる。特定の生体到達可能標的化学物質が選択された後、それらの化学式および反応経路が、宿主生物の遺伝子配列を改変し、選択された標的分子を産生するために、遺伝子製造システムに提供されてもよい。

【0046】

システム設計

【0047】

図１は、本開示の実施形態の分散システム１００を図示する。ユーザインターフェース１０２は、テキストエディタまたはグラフィカルユーザインターフェース（ＧＵＩ）等のクライアント側インターフェースを含む。ユーザインターフェース１０２は、ラップトップまたはデスクトップコンピュータ等のクライアント側コンピューティングデバイス１０３に常駐してもよい。クライアント側コンピューティングデバイス１０３は、インターネット等のネットワーク１０６を通して１つ以上のサーバ１０８に結合される。

【0048】

サーバ１０８は、１つ以上のデータベース１１０にローカルまたは遠隔に結合され、これは、分子、反応、および配列データの１つ以上の集成を含んでもよい。反応データは、全ての既知の代謝反応のセットを表してもよい。実施形態では、反応データは、普遍的であり、すなわち、宿主特異的ではない。

【0049】

分子データは、基質または生産物のいずれかとして反応データ内に含有される反応に関与する代謝物反応物質に関するデータを含む。実施形態では、代謝物に関するデータは、特定の宿主微生物内で産生されることが当技術分野で公知である、コア代謝物等の宿主特異的代謝物に関するデータを含む。いくつかの実施形態では、いくつかのコア代謝物は、本発明者らによって集約された経験的証拠を通して、特定の宿主によって産生されると決定された。これらの宿主特異的代謝物セットは、宿主生物のメタボロミクス分析等の種々の方法を通して、またはある成長条件下で不可欠である酸素をコードする遺伝子を同定し、それらの遺伝子によってコードされる酵素によって産生される代謝物の存在を推測することによって同定された。分子データは、宿主生物、成長培地特性、および分子がコア代謝物であるか、前駆体であるか、遍在するか、または無機であるか等の多くの特徴を表す注釈でタグ付けられてもよい。

【0050】

データベース１１０、例えば、ＵｎｉＰｒｏｔはまた、触媒が、宿主が生育される成長培地からの触媒の摂取を介して宿主生物の中に導入され得るかどうかに関するデータを含んでもよい。

【0051】

配列データは、反応を宿主生物の中に組み込むために、反応が、配列、例えば、酵素または遺伝子配列に対応することが既知である可能性が高いかどうかに関して反応データセット内の反応に注釈を付けるために、反応注釈エンジン１０７のためのデータを含んでもよい。例えば、配列データは、反応が対応するアミノ酸配列が既知である可能性が高い酵素によって触媒されるかどうかに関して反応データ内の反応に注釈をつけるためのデータを含んでもよい。該当する場合、当技術分野で公知の方法を通して、酵素をコードするための遺伝子配列が、決定されることができる。実施形態では、生体到達可能標的分子を決定する目的のために、反応注釈エンジン１０７は、配列データ自体を把握する必要はなく、むしろ、配列が触媒のために存在することが既知である可能性が高いかどうかのみを把握する必要がある。下記に説明される反応注釈エンジン１０７は、関連付けられるコード配列を有するものとして示される反応を触媒する酵素に関する配列データを含む、ＵｎｉＰｒｏｔ等のデータベースからの配列データをコンパイルしてもよい。

【0052】

実施形態では、サーバ１０８は、反応注釈エンジン１０７と、生体到達可能予測エンジン１０９とを含み、これらはともに、本開示の実施形態の生体到達可能予測ツールを形成する。代替として、注釈エンジン１０７、予測エンジン１０９、または両方のためのソフトウェアおよび関連付けられるハードウェアは、サーバ１０８の代わりにクライアント１０３にローカルに常駐する、またはクライアント１０３およびサーバ１０８の両方の間に分散されてもよい。データベース１１０は、ＵｎｉＰｒｏｔ、ＰＤＢ、Ｂｒｅｎｄａ、ＢＫＭＲ、およびＭＮＸｒｅｆ等の公的データベース、およびユーザまたはその他によって生成されるカスタムデータベース、例えば、ユーザまたはサードパーティの貢献者によって実施された合成生物学実験を介して生成された分子および反応を含むデータベースを含んでもよい。データベース１１０は、クライアント１０３に対してローカルまたは遠隔である、またはローカルまたは遠隔の両方で分散されてもよい。いくつかの実施形態では、注釈エンジン１０７は、クラウドベースのサービスとして起動してもよく、予測エンジン１０９は、クライアントデバイス１０３上でローカルに起動してもよい。実施形態では、任意のローカルに常駐するエンジンによる使用のためのデータは、クライアントデバイス１０３上のメモリ内に記憶されてもよい。

【0053】

システム動作

【0054】

出発代謝物リストおよび出発反応データセットの取得

【0055】

生体到達可能予測プロセスへの入力は、出発代謝物リスト、出発反応リスト、宿主生物、および宿主のための燃料レベル（例えば、最小または豊富な成長培地）等のベースライン条件、および温度等の環境条件等の情報を含む。注釈エンジン１０７は、データベース１１０からの関連付けられる注釈とともに、代謝物および反応データを組み立ててもよい。

【0056】

ユーザインターフェース１０２を通して、ユーザは、出発代謝物および反応リストに関する情報を取得するためのデータベース１１０を規定してもよい。例えば、反応および宿主特異的代謝物は、ＫＥＧＧ、Ｕｎｉｐｒｏｔ、ＢＫＭＲ、およびＭＮＸｒｅｆ等の公的データベースから取得されてもよい。（当業者は、本議論の文脈から、本明細書および請求項における「代謝物」、「反応」、および同等物の言及が、多くの事例では、実際には、物理的物体またはプロセス自体ではなく、それらの物理的物体またはプロセスを表すデータを指し得ることを認識するであろう。）

【0057】

出発代謝物リスト

【0058】

図２を参照すると、実施形態では、反応注釈エンジン１０７は、データベース１１０から、特定の時点における宿主生物の成長の間に、または所与の成長条件下の特定の時間間隔の間に存在することが予期される化学化合物（出発、中間、および最終生産物）のリストを備える宿主特異的出発代謝物ファイルを取得する、またはそれ自体が集約する（２０２）。これは、出発代謝物を選択するための最も消極的なアプローチであるため、デフォルト成長条件は、最小成長培地であり得る。実施形態では、反応注釈エンジン１０７は、出発代謝物リストとしての代謝物ファイルを予測エンジン１０９に提供してもよい。

【0059】

実施形態では、反応注釈エンジン１０７は、宿主生物に関する、または類似する生物に関する成長データに基づいて、出発代謝物を決定またはテンプレート化（類似する微生物から）してもよい。本アプローチは、ＲＡＳＴシステム等のシステムにおいて微生物のゲノムに注釈を付けるために、またはＢｉｏＣｙｃデータベース収集における代謝経路を予測するために使用されるアプローチと類似する。本アプローチは、存在する代謝経路を最良に推測するために、所与の宿主生物に関するゲノム注釈を使用し、次いで、それらの経路における全ての構成反応の存在およびそれらの代謝物を仮定する。ＢｉｏＣｙｃデータベースの場合では、既存のゲノム注釈は、個々の酵素（したがって、それらの反応）の推定上の存在を同定するために使用される。ルールベースのシステムが、次いで、それらの置換基反応（そのうちのいくつか）の存在に基づいて、代謝経路全体の存在を推測するために使用される。

【0060】

宿主生物に特異的な出発代謝物リストを有することは、本開示の実施形態の際立った出発点である。他の従来のアプローチは、作製され得る標的についての一般的予測を行う一方、本開示の実施形態の本カスタマイズ可能なステップは、宿主生物の生物学における差異に起因して、どの標的分子が作製され得るか（またはそれらが作製され得る方法）について不正確な予測を行う問題を回避する。

【0061】

実施形態では、ユーザは、宿主生物および成長培地等のパラメータを伴うデータベースまたはデータセットにクエリを行うことに基づいて、および、いくつかの実施形態では、それらのデータベースを関連モデル生物データベースまたは具体的代謝物の存在の他のインジケーションと相互参照付けることを介して、ＭＮＸｒｅｆ、ＫＥＧＧ、またはＢＫＭＲ等の既存のデータベースまたはデータセットから出発代謝物を読み出すように反応注釈エンジン１０７に命令してもよい。これまで、特定の産業用宿主に関して、譲受人は、約２００～３００種の代謝物の典型的な出発代謝物ファイルを作成している。上記のように、公的データベース内の代謝物を表すデータオブジェクトおよび注釈エンジン１０７によって形成されるリストは、宿主生物、成長培地タイプ、および代謝物がコア代謝物であるか、前駆体であるか、無機であるか、または遍在するか等のメタデータを含む注釈を含んでもよい。

【0062】

コア代謝物は、成長培地の豊富度等の所与のベースライン条件に対して遺伝子改変されていない微生物に元々見出される出発（例えば、基質）、中間、および最終代謝物である。大腸菌のような微生物のバイオマスにおける各コア代謝物（例えば、アミノ酸）は、１１個の前駆体代謝物のうちの１つから細胞のコア代謝において生成され得、根本的に、遺伝子改変されていない生物に提供されるどの炭素入力からも生成され得る。実施形態では、ユーザは、ＭＮＸｒｅｆ、ＫＥＧＧ、ＣｈＥＢＩ、Ｒｅａｃｔｏｍｅ、またはその他等のデータベースから、それらの前駆体依存性とタグ付けられる選択的コア化合物の出発代謝物セットを選択してもよい。

【0063】

その名が示すように、アンモニウム等の無機代謝物は、炭素を含んでおらず、したがって、炭素原子を代謝の新しい生産物に与えることができない。故に、反応注釈エンジン１０７は、出発代謝物セットから無機代謝物を除外してもよい。

【0064】

いくつかの代謝物は、遍在し、すなわち、それらは、多くの反応において見出される。それらは、ＡＴＰおよびＮＡＤＰのような分子を含む。典型的には、遍在分子は、炭素を標的生産物に与えず、したがって、いかなる標的への代謝経路の一部でもないであろう。故に、反応注釈エンジン１０７は、出発代謝物セットから遍在代謝物を除外してもよい。遍在分子は、専門家評価に基づいて、注釈において手動で指定される、または特定の閾値数を超えて反応に関与する分子を決定することによって同定されることができる。１つのヒューリスティックは、典型的なコア代謝物入力のサイズ（例えば、３００）を上回る数において反応セットに現れる全ての分子にフラグを立てる。例えば、１つのデータセットでは、ＡＴＰは、約３１，０００個の反応のうちの２，４１５個に現れ、ＮＡＤＨは、２，０００個の反応に現れ、ＮＡＤＰＨは、３，１０７個の反応に現れ、これは、それらをコア代謝物アウントよりも上回らせ、それらすべてが「遍在」タグを獲得する。

【0065】

出発反応データセット

【0066】

反応注釈エンジン１０７は、生存標的分子の予測のための基礎として出発反応データセットを取得する（２０４）。ユーザは、出発反応データセットを構築する方法を規定してもよい、またはユーザは、公的データベース１１０またはユーザまたはその他によって以前に作成されたカスタムデータベース等の専用データベース１１０から直接データを取得するように注釈エンジン１０７に命令してもよい。一実施形態では、注釈エンジン１０７は、ＭＮＸｒｅｆのＭｅｔａＮｅｔｘ反応ネームスペース（ＭＮＸ）から全反応セット（約３０，０００個の反応）をインポートしてもよい。他の実施形態では、注釈エンジン１０７は、ＭｅｔａＣｙｃおよびＫＥＧＧまたは他の公的または私的データベースから反応セット（約２２，０００個の合計反応）をインポートし、併合してもよい。

【0067】

実施形態では、反応注釈エンジン１０７は、データベース１１０から取得された情報を選択的に集約することによって出発反応データセットを構築してもよい。例えば、ＢＫＭＲは、反応が自発的であるかどうかの情報を提供する。注釈エンジン１０７は、対応する反応のためにＢＫＭＲ反応ＩＤをＭＮＸｒｅｆにおけるＩＤにマッピングするために既知のマッピングを使用してもよい。他の実施例では、ＫＥＧＧまたはＭｅｔａＣｙｃおよびそれらのＩＤが、ＢＫＭＲおよびそのＩＤの代わりに採用されてもよい。本関連付けを使用して、反応注釈エンジン１０７は、次いで、ＢＫＭＲからの対応する自発的反応タグとともに、ＭＮＸｒｅｆからの既存の注釈（例えば、コア、遍在）を使用して、データベース１１０内にカスタム反応リストを作成してもよい。同様に、対応するＩＤをマッピングすることを通して、注釈エンジン１０７は、ＭＮＸｒｅｆにおける反応をＵｎｉＰｒｏｔにおける注釈と関連付け、反応が輸送反応であるかどうか、または反応基質または生産物がハロゲンを含有するかどうかに関するタグを取得し、データベース１１０内のカスタム反応リスト内の反応に関する注釈の中にそれらのタグを組み込んでもよい。（ハロゲン化化合物を同定することは、殆どのハロゲン関連反応が化学物質を分解することに関するため、誤った方向に進行する反応を同定するためのヒューリスティックである）。

【0068】

これらの方針に沿って、反応注釈エンジン１０７は、データベースを横断して関連付けられたＩＤを使用し、データベースからデータを集約し、他のタグの中でもとりわけ、反応が自発的であるか、熱力学に起因して一方向にのみ進行するか、（方向性を決定することに関連する）ハロゲンを含有するか、遍在代謝物を含有するか、輸送反応であるか、不平衡であるか（すなわち、化学反応の２つの側面が元素平衡を維持せず、反応がソースデータべース内に不適切に書き込まれ、無視されるべきであることを示唆する）、利用可能なデータベース内で不完全に特性評価されているか、酵素が既知のアミノ酸配列または酵素をコードする遺伝子配列と関連付けられるインジケータをタグ付けられる酵素と関連付けられるか、または膜貫通領域を有する可能性が高いソース酵素によって触媒されるかどうか等、カスタム注釈とともに出発反応セットを記憶するデータベース１１０を構築してもよい。注釈エンジン１０７を通して、ユーザは、したがって、例えば、ＭＮＸｒｅｆデータベース内の約３０，０００個の反応の全てに注釈を割り当ててもよい。下記に説明されるように、ユーザは、次いで、各注釈特徴またはそれらの任意の組み合わせに関して本マスタファイルを個々のリストにフィルタ処理するための基準を構成してもよい。

【0069】

生体到達可能分子予測

【0070】

図２のフロー図を参照すると、以下は、本開示の実施形態の予測エンジン１０９の動作の実施例を説明する。予測エンジン１０９は、例えば、遺伝子操作を介して、恣意的に選択された宿主生物内に生成され得る化学物質を予測する。予測エンジン１０９は、入力として、出発代謝物ファイル、出発反応データセット、および配列データベースを取り込んでもよい。配列データベースは、触媒化合物（酵素等）に関するアミノ酸配列または触媒化合物をエンコードする遺伝子配列を記憶してもよい。実施形態では、本開示の実施形態のＢＰＴは、配列データベースを使用し、反応毎のアミノ酸配列または遺伝子配列の存在または不在を決定する。そのような実施形態では、配列データベースは、触媒が利用可能またはそうではない酵素または遺伝子部分を有するものとしてタグ付けられる限り、配列自体を含む必要はない。生体到達可能分子のリストとともに、予測エンジン１０９は、規定された宿主生物に関して、出発代謝物、例えば、いくつかの実施形態では、宿主のコア代謝物からの各到達可能標的分子の産生につながる反応の「系統」（反応経路）を生産する。

【0071】

特に、予測は、反応を触媒するための触媒の可用性見込み（例えば、宿主生物の中に組み込まれる遺伝子部分の可用性見込みまたは宿主生物が生育される成長培地からの摂取を介して宿主生物の中に導入される触媒の可用性見込み）、（出発代謝物から開始される）可能にされる反応ステップの最大数、可能にされる部分または化学反応のタイプ、および他の選択可能な特徴等のいくつかのパラメータに基づいて調整されることができる。予測エンジン１０９はまた、コア代謝物から各標的分子までの潜在的経路を予測することによって、標的分子へのアプローチ、およびそれを設計することの困難度を予測することに役立つ。

【0072】

フィルタ処理された反応データセット

【0073】

実施形態では、予測エンジン１０９は、フィルタ処理および検証された反応データセット（ＲＤＳ）を作成する。反応注釈エンジン１０７によって特性評価された反応を使用して、予測エンジン１０９は、反応を所望の検証のレベル、例えば、反応酵素に関するコード配列が存在する信頼のレベルにフィルタ処理してもよい（２０６）。これは、予測の正確度を微調整し、偽陽性予測の主原因を制御するためのステップである。上記に言及される実施例では、本発明者らは、ＭＮＸｒｅｆのＭｅｔａＮｅｔｘ反応ネームスペース（ＭＩＮＸ）から全反応セット（約３０，０００個の反応）をインポートし、注釈を付けることによって、１つの生体到達可能リストに関するＲＤＳを生成した。類似するアプローチが、ＫＥＧＧ、Ｒｅａｃｔｏｍｅ、およびＭｅｔａＣｙｃ等の他の公的に利用可能な反応データベースに適用され得る。

【0074】

本発明者らの経験に基づいて、最も一般的な公的データベースにおける反応の２５～５０％は、いかなる既知の関連付けられる生物学的部分も有し得ない。例えば、反応を触媒するための酵素のアミノ酸配列またはそれらの付随の遺伝子配列は、未知であり得る。酵素配列情報がないと、バイオリアクタは、それらの酵素を採用する反応を実施することが可能ではなく、したがって、反応情報を操作目的のために無用にするであろう。経路内の１つの酵素のみが既知の遺伝子配列を欠如する場合であっても、経路全体が、宿主の中に組み込まれることができない。

【0075】

本欠陥に対処するために、予測エンジン１０９は、公的に利用可能な、またはカスタム酵素データを使用して、一連の検証試験を通して反応をフィルタ処理してもよい。１つの公的データベースは、大規模であり、オープンアクセスであり、確実にキュレーションされるＵｎｉＰｒｏｔである。その他は、ＲＣＳＢタンパク質データバンク（ＰＤＢ）およびＧｅｎＢａｎｋを含む。ＭＮＸｒｅｆ、ＵｎｉＰｒｏｔ、Ｂｒｅｎｄａ、またはＰＤＢ等のいくつかの公的データベースでは、反応は、それらが触媒する反応に基づく酵素に関する数値分類である、酵素委員会（ＥＣ）番号をタグ付けられてもよい。ＵｎｉＰｒｏｔまたはＰＤＢ等のいくつかのデータベースは、触媒酵素をコードする遺伝子配列が既知である反応に関するＥＣ番号タグのみを記憶する。ＫＥＧＧおよびＭｅｔａＣｙｃ等の他のデータベースは、遺伝子配列が既知ではない酵素に関するＥＣ番号を含む。

【0076】

したがって、データベースに応じて、ＥＣ番号は、既知の酵素遺伝子配列の存在を示す場合とそうではない場合がある。概算で、ＥＣ番号を伴う反応の２０～２５％が、いかなる関連付けられる酵素コード配列も有していない。ある場合には、ＥＣ番号は、ＥＣ番号と関連付けられる酵素配列の存在が、そのＥＣと関連付けられる全ての反応が有効な関連付けられる配列を有することを意味しないように、複数の具体的化学転換に注釈を付けるために使用される（ＥＣ番号と化学反応との間に１対多関係が存在する）。したがって、酵素活性上のＥＣタグの存在は、その酵素に関する遺伝子配列の存在の信頼性のある一般的インジケータではなく、これは、配列がその酵素に関して合理的に存在する可能性が高いかどうかを決定するために、あるデータベースに適用されることができる。いくつかのデータベースはまた、所与のアミノ酸配列によって決定的に触媒される（したがって、酵素触媒をコードするための既知の遺伝子配列を有する）ことが既知であるような特定の化学反応を明示的に記述する別個のフィールド（例えば、ＵｎｉＰｒｏｔにおける「触媒活性」フィールド）を有する。そのような反応は、本明細書では、「決定的に配列決定されている」と注釈を付けられるものとして参照される。

【0077】

予測エンジン１０９は、触媒が宿主生物内の反応を触媒するために利用可能（例えば、反応を触媒するために宿主の中に組み込まれるように利用可能）であるかどうかに関する信頼度を決定してもよい。例えば、酵素コード配列が既知である確実性における差異に基づいて、予測エンジン１０９は、いくつかの実施形態では、反応データセット内の注釈に対して酵素コード配列に関して「厳密」検索または「緩和」検索を実行してもよい。厳密検索に関して、予測エンジン１０９は、例えば、決定的に配列決定されていると注釈を付けられる反応のみを選択してもよい。

【0078】

緩和検索に関して、予測エンジン１０９は、例えば、ＭｅｔａＣｙｃ等のデータベースから導出される注釈から、既知の酵素コード配列と関連付けられるＥＣ番号を有すると注釈を付けられる反応、または配列データベース内で「決定的に配列決定されている」と注釈を付けられる（ブール非排他的ＯＲ）反応を選択してもよい。予測エンジン１０９は、いずれかの信頼のレベルに関して、任意の遺伝子またはアミノ酸配列が反応に関して見出されるかどうかを記録する。例えば、予測エンジン１０９は、これが緩和検索を満たすが、厳密検索を満たさないことを示すタグで反応に注釈を付けてもよい。

【0079】

図３は、本開示の実施形態による、ＭＮＸｒｅｆおよびＵｎｉＰｒｏｔ等のデータベースに対して厳密および緩和酵素配列検索を実装するための例示的擬似コードを図示する。擬似コードは、配列が酵素に関して存在するかどうかを決定するためのヒューリスティックによって使用される論理を記述する。本実施形態は、４つの信頼のレベルを提供する。コードは、最初に、反応データセット注釈が少なくとも１つのＥＣ番号を含むかどうかを決定するステップを示す。該当する場合、コードは、ＥＣ番号に関して配列データベースを検索することを求める。厳密検索が実行されている場合、コードは、決定的に配列決定されている反応に関して配列データベースを検索することを求める。緩和検索が実行されている場合、コードは、関連付けられるＥＣ番号を有する反応に関するＲｅｌａｘｅｄ注釈タグを真に設定する。

【0080】

初期ステップが、反応データセット注釈が（ａ）ＥＣ番号を含んでいない、または（ｂ）（上記に言及されるように）ＥＣ配列検索が配列データベース内にＥＣ番号を見出し、厳密検索が実行されていると決定する場合、コードは、決定的に配列決定されている反応に関して配列データを検索することを求める。その検索が反応を決定的に配列決定されていると見出す場合、コードは、その反応に関する厳密および緩和注釈の両方を真として設定する。該当しない場合、コードは、その反応に関する両方のそれらの注釈を偽として設定する。

【0081】

要するに、本ヒューリスティックの出力は、反応毎の２つの注釈タグ、すなわち、ＳｔｒｉｃｔおよびＲｅｌａｘｅｄである。本ヒューリスティックは、下記に説明されるように、４つの信頼のレベルを提供する。
Ｓｔｒｉｃｔ＝真→非常に高い信頼性配列が存在する
Ｓｔｒｉｃｔ＝偽→中程度の信頼性配列が存在しない（いくつかの偽陰性を除く）
Ｒｅｌａｘｅｄ＝真→中程度の信頼性配列が存在する（いくつかの偽陽性を除く）
Ｒｅｌａｘｅｄ＝偽→非常に高い信頼性配列が存在しない

【0082】

本発明者らは、緩和検索を実行することが２０％未満の偽陰性率をもたらす一方、ＵｎｉＰｒｏｔにおける触媒活性フィールドに対する厳密検索が有意な偽陽性率をもたらすことを見出した。したがって、緩和検索の側でわずかにエラーを起こした方が良い場合がある。「緩和」および「厳密」タグは、配列ベースのフィルタ処理を取り扱う２つの潜在的方法にすぎない。ＢＰＴは、標的活性に関する適切なモチーフを伴う配列の存在を同定すること等のより寛容な方法またはＭｅｔａＣｙｃ等のより大量にキュレーションされるデータベース内の直接文献支援活性配列リンクの存在を要求すること等のより厳重な方法を含む、任意の配列ベースのタグ付け（したがって、フィルタ処理）アプローチに適している。

【0083】

配列ベースのフィルタ処理の代替として、またはそれに加えて、予測エンジン１０９は、反応方向性、または反応が自発的反応であるか、輸送反応であるか、またはハロゲンを含有するか等、注釈エンジン１０７に関して上記に議論される注釈の任意の組み合わせに基づいて、反応をフィルタ処理してもよい（すなわち、選択する、または選択しない）。予測エンジン１０９は、ユーザインターフェース１０２を通したユーザ構成またはデフォルト設定に基づいて、フィルタ処理を実施してもよい。実施形態では、予測エンジン１０９は、シミュレートされた代謝経路に沿った異なる反応ステップにおいて異なるフィルタを適用してもよい。デフォルト設定の実施例として、それらは、反応が、緩和基準に基づく配列を有すること、全ての輸送反応を除外すること、反応が配列を有する場合、ハロゲンを含有する反応のみを含むこと、上記の属性にかかわらず、全ての自発的反応を含むことであってもよい。

【0084】

反応が自発的である場合、反応は、自発的反応を触媒するための酵素を産生するように宿主ゲノムを操作する必要性なく、自動的に起こるであろう。反応は、所与の宿主に関して所与の条件下で起こることが既知であるため、予測エンジン１０９は、自発的反応生産物が産生されるであろうことを予測することができる。

【0085】

上記のように、無機分子は、炭素を与えず、遍在分子は、炭素を標的代謝物に与える可能性が低い。したがって、出発代謝物として使用されるものから遍在および無機分子を排除することは、ヒューリスティックに、予測エンジン１０９が生存標的分子を予測する際に有効な代謝経路を辿るであろうという高い信頼レベルを提供する。故に、予測エンジン１０９は、反応に限定されるように遍在または無機分子を処理しない。すなわち、それらは、それらが関与する反応に常に利用可能であると仮定される。

【0086】

代謝物予測

【0087】

図２を参照すると、予測エンジン１０９は、フィルタ処理されたＲＤＳにおける反応に従って処理される入力代謝物の基質を前提として、形成されるであろう代謝物を予測するための段階的シミュレーションを実施してもよい（２０８）。（化学反応が、化学生産物を産生するように入力「基質」（例えば、分子のセット）に作用する。）本開示の実施形態の予測エンジン１０９の動作は、以下のように説明され得る。

【0088】

ステップ０：最初に、コア代謝物のみが、シミュレートされた宿主生物内に存在する。それらは、次のステップにおける反応のために現在の基質を形成する。

【0089】

ステップ１：予測エンジン１０９は、ステップ０からのコア代謝物がフィルタ処理された反応セット（ＲＤＳ）内の化学方程式のうちのいずれかの一方の側と合致するかどうか、および反応が（方向／熱力学的注釈に基づいて）所与の方向に起こり得るかどうかを決定し、それによって、反応方程式の他方の側上で化学物質を産生し始めるであろう反応を決定する（２０８）。予測エンジン１０９は、任意の新しい代謝物が開始された反応によって産生されるかどうかを決定する（２１０）。

【0090】

予測エンジン１０９がいかなる新しい代謝物も予測されていないと決定する（２１０）場合、予測エンジン１０９は、予測プロセスを終了し、結果を報告する（２１２）。

【0091】

逆に、予測エンジン１０９が新しい代謝物が形成されるであろうと決定する（２１０）場合、予測エンジン１０９は、新しい代謝物を基質プールに追加する（２１４）。更新された基質プールは、ここで、コア代謝物およびステップ１からの新しく予測された代謝物を含む。

【0092】

予測エンジン１０９は、各ステップにおける代謝物および開始された反応を記録し、また、フィルタ処理されたＲＤＳから開始された反応を除去する（ステップ２１６）。本除去は、同一の反応が後続ステップにおいて開始されることを防止し、それによって、反応およびその結果として生じる代謝物が後続ステップにおいて存在するものとして同定されないように回避する。各反応は、プロセスの全てのステップ全体を通して一度だけシミュレートされる。これは、概して、代謝物に到達する最短経路（最小数のステップ）に焦点を当てる操作のベストプラクティスに適合し、同一の代謝物へのより長い経路は、典型的には、準最適である。各ステップ内の代謝物および反応とともに、予測エンジン１０９は、代謝物が作製される（すなわち、作製されることが予測される）ステップを記録する。そのステップは、代謝物を生成するまでの代謝経路長を表す。代謝物は、これが明確に異なる反応を介して生成される場合、複数のステップにおける生産物のように見え得ることに留意されたい。本事実は、予測エンジンが、同一の代謝物に明確に異なる反応によって到達する、有用に明確に異なる経路を同定することを可能にする。

【0093】

ステップ２：予測エンジン１０９は、次いで、入力として現在更新されている代謝物の基質プールを使用して、ステップ２０８に戻り、（開始された反応がここでは除去された）フィルタ処理されたＲＤＳに対して実行し、任意の反応が新しい代謝物を産生し始めるであろうかどうかを予測する。

【0094】

複数の反復後、代謝物のプールは、拡大する一方、利用可能な反応のプールは、縮小する。最終的に、フィルタ処理されたＲＤＳに残っている反応を開始し得る代謝物がそれ以上残っていないため、プロセスは、飽和状態になり得る。本発明者らによる実験では、約１０，０００個のフィルタ処理された反応は、全ての反復後に数千個の代謝物をもたらし得る。代替として、予測エンジン１０９は、予測を停止し、結果を報告する前に、可能にされた反応ステップの数を規定するように構成されてもよい（２１２）。反応ステップの数の限定は、実世界の操作を反映し、これは、典型的には、サイクル数を限定するであろう。

【0095】

図４および５は、本開示の実施形態の生体到達可能予測ツールによって生成され得る報告の実施例を図示する。図４は、処理ステップ毎に、生成された代謝物（生体到達可能物名）、それらの化学式、代謝物のタイプ（例えば、コア、前駆体、反応によって産生された候補生体到達可能物）、周知のデータベースにおいて使用されるＩＤ等の一意の反応ＩＤによって表されるような代謝物の反応系統（これはまた、開始される反応の左（「Ｌ」）側かまたは右（「Ｒ」）側かを示す）、候補生体到達可能分子を産生するために最近傍コア代謝物から必要とされる反応ステップの数、および候補生体到達可能分子毎の最近傍コア代謝物の名称を示す。ステップ０における分子のみは、出発代謝物リストからのものであることに留意されたい（例えば、コア、前駆体）。

【0096】

図５は、反応系統追跡の仮説的実施例を図示する。段階的に、反応は、以下の通りである。

【0097】

ステップ１：Ａ＋Ｂ←→Ｃ＋Ｄ

【0098】

ステップ２：Ｃ＋Ｂ←→Ｅ＋Ｆ

【0099】

ステップ３：Ｄ＋Ｅ←→Ｇ＋Ｈ

【0100】

本実施例における属性は、ステップにおいて生成された代謝物がコアであるかどうか、代謝物が見出されるステップ、ステップの数における距離によって測定されるような生成された代謝物に対する最近傍コア代謝物、および代謝物を産生し始めた化学反応を表す反応系統を含む。代謝物Ａは、コア代謝物であり、Ｂは、ステップ０において宿主のバイオマスに存在する前駆体代謝物である。したがって、それらは、いかなる反応系統も有していない。

【0101】

ＣおよびＤは、反応系統における反応Ａ＋Ｂ（ソース反応）によってステップ１において産生されるものとして示される。ＣおよびＤの両方への最近傍コアは、Ａである。ＣおよびＤは、コアＡおよびＢとともに基質に追加される。

【0102】

ＥおよびＦは、反応Ｃ＋Ｂによってステップ２において産生されるものとして示される。ＥおよびＦの両方への最近傍コアは、Ａである。ＥおよびＦは、コアＡおよびＢおよび生体到達可能生産物ＣおよびＤとともに基質に追加される。

【0103】

ＧおよびＨは、反応Ｄ＋Ｅによってステップ３において産生されるものとして示される。ＧおよびＨの両方への最近傍コアは、Ａである。

【0104】

ツールはまた、以下のように代謝物毎に経路（反応の「系統」シーケンスとしても公知である）を出力してもよい。

【0105】

Ｃ：Ａ＋Ｂ→

【0106】

Ｄ：Ａ＋Ｂ→

【0107】

Ｅ：Ａ＋Ｂ→；Ｃ＋Ｂ→

【0108】

Ｆ：Ａ＋Ｂ→；Ｃ＋Ｂ→

【0109】

Ｇ：Ａ＋Ｂ→；Ｃ＋Ｂ→；Ｄ＋Ｅ→

【0110】

Ｈ：Ａ＋Ｂ→；Ｃ＋Ｂ→；Ｄ＋Ｅ→

【0111】

経路フィルタ処理。実施形態では、宿主生物、標的分子、および所与の標的分子につながる経路の反応系統を前提として、予測エンジン１０９は、経路長（例えば、出発代謝物から標的分子までの反応処理ステップの数）等の所与のパラメータに基づいて経路を同定するために、経路を選択的にフィルタ処理してもよい。予測エンジン１０９は、出力として、同定された反応経路を表すデータを提供してもよい。

【0112】

宿主生物選択。単一の宿主生物を所与とする生存標的分子を決定する代わりに、所与の生存標的分子を産生する１つ以上の宿主生物を同定することが、所望され得る。実施形態では、予測エンジン１０９は、１つのみの宿主生物ではなく、複数の宿主生物に関して、上記に説明される方法のうちのいずれかに従って、生存標的分子を表すデータを生成する。そのような実施形態では、所与の生存標的分子に関して、予測エンジン１０９は、少なくとも１つの基準を満たす複数の宿主生物のうちの少なくとも１つを決定する。例えば、反応系統データを使用して、予測エンジン１０９は、その宿主生物内で所与の生存標的分子を産生するために必要と予測される処理ステップの数に基づいて、宿主生物を選択してもよい。別の実施例として、予測エンジン１０９は、その宿主生物によって産生される生存標的分子の予測される収率に基づいて、宿主生物を選択してもよい。予測される収率は、潜在的宿主毎の別個のモデルに基づくフラックスバランス分析（ＦＢＡ）、単純な元素収率モデル化、および前駆体ベースのパーセント収率推定を含む、いくつかの方法で導出されてもよい。予測エンジン１０９は、出力として、少なくとも１つの基準を満たすと決定された宿主生物を表すデータを提供する。

【0113】

上記の実施形態に関して説明されるように、予測エンジン１０９は、各宿主生物によって産生される各標的分子につながる１つ以上の経路（すなわち、系統）の記録を生成してもよい。複数の宿主生物のためにツールを起動する上記の実施形態に基づいて、反応注釈エンジン１０７は、収率、処理ステップの数、反応経路における反応を触媒するための触媒の可用性等のパラメータを規定する注釈を含み得る、ライブラリとしてデータベース内に宿主生物、標的分子、および系統の間の関連付けを記憶してもよい。代替として、ライブラリは、サードパーティから取得されてもよい。

【0114】

実施形態では、予測エンジン１０９がそのようなライブラリへのアクセスを有する場合、ツールは、所与の生存標的分子を産生する複数の宿主生物を同定するために起動される必要はない。代わりに、そのような実施形態では、予測エンジン１０９は、宿主、標的分子、および反応の間の関連付けに関する注釈データを含み得る、ライブラリからの系統を使用してもよい。予測エンジン１０９は、少なくとも部分的に、例えば、ライブラリまたは公的または専用データベースからの、少なくとも１つの標的宿主生物内の標的分子の産生につながる少なくとも１つの反応経路における反応を触媒するように予測される全ての触媒が、少なくとも１つの反応経路における全てのそのような反応を触媒するために利用可能な可能性が高いという証拠に基づいて、１つ以上の宿主生物の間から少なくとも１つの標的宿主生物を同定してもよい。実施形態では、予測エンジン１０９は、標的宿主が、標的分子を産生するために必要と予測される反応経路内の反応ステップの閾値数未満を要求することに基づいて、標的宿主を決定してもよい。

【0115】

生物資源探査。いくつかの反応酵素は、ＥＣ番号を有し、明確に特性評価される（それらの反応物質および生産物が既知である）が、既知の関連付けられるアミノ酸配列または遺伝子配列を有していない場合がある（「オーファン酵素」）。そのような場合では、予測エンジン１０９は、新しく配列された酵素が１つ以上の反応を触媒するために宿主生物の中に組み込まれ得るように、オーファン酵素を生物資源探査し、それらのアミノ酸配列を予測し、最終的に、それらの遺伝子配列を予測してもよい。予測エンジン１０９は、次いで、フィルタ処理された反応データのメンバとして新しく配列された酵素に対応する反応を指定してもよい。実施形態では、予測エンジン１０９は、当技術分野で公知の技法を使用してオーファン酵素を生物資源探査する。例えば、１つのチームが、配列を同定するために、質量分析法ベースの分析および算出方法（配列類似性ネットワークおよびオペロンコンテキスト分析を含む）を適用することによって、少数のオーファン酵素に関するアミノ酸配列を決定した。チームは、次いで、多くのより以前に特性評価されていなかった、または誤って注釈されたタンパク質の触媒機能をより正確に予測するために、新しく決定された配列を使用した。ＲａｍｋｉｓｓｏｏｎＫＲ，ｅｔａｌ．（２０１３）
ＲａｐｉｄＩｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＳｅｑｕｅｎｃｅｓｆｏｒＯｒｐｈａｎＥｎｚｙｍｅｓｔｏＰｏｗｅｒＡｃｃｕｒａｔｅＰｒｏｔｅｉｎＡｎｎｏｔａｔｉｏｎ，ＰＬｏＳＯＮＥ８（１２）：ｅ８４５０８．ｄｏｉ：
１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．００８４５０８（ＳｈｅａｒｅｒＡＧ，ｅｔａｌ．（２０１４）ＦｉｎｄｉｎｇＳｅｑｕｅｎｃｅｓｆｏｒｏｖｅｒ２７０ＯｒｐｈａｎＥｎｚｙｍｅｓ．ＰＬｏＳＯＮＥ９（５）：ｅ９７２５０．ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．００９７２５０；ＹａｍａｄａＴ，ｅｔａｌ．，Ｐｒｅｄｉｃｔｉｏｎａｎｄｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｓｅｑｕｅｎｃｅｓｃｏｄｉｎｇｆｏｒｏｒｐｈａｎｅｎｚｙｍｅｓｕｓｉｎｇｇｅｎｏｍｉｃａｎｄｍｅｔａｇｅｎｏｍｉｃｎｅｉｇｈｂｏｕｒｓｇｅｎｏｍｉｃａｎｄｍｅｔａｇｅｎｏｍｉｃｎｅｉｇｈｂｏｕｒｓ，ＭｏｌｅｃｕｌａｒＳｙｓｔｅｍｓＢｉｏｌｏｇｙ８：５８１もまた参照）（その３つ全てが、参照することによってその全体として本明細書に組み込まれる）。

【0116】

ゲノム操作。生体到達可能予測ツールは、生体到達可能候補分子（生存標的分子）のリストを顧客等のサードパーティであり得る化学者、材料科学者、または同等物に提供してもよい。標的分子のその選定に基づいて、ユーザは、遺伝子製造システムに、各選択された標的分子につながる反応経路における反応を触媒するために使用される酵素または他の触媒に関する遺伝子配列のインジケーションを提供するようにツールに命令してもよい。遺伝子製造システムは、次いで、示された遺伝子配列を宿主のゲノムの中に（例えば、挿入、置換、欠失を通して）具現化し、それによって、生存標的分子の製造のために操作されたゲノムを産生してもよい。実施形態では、遺伝子製造システムは、２０１６年４月２７日に出願され、「ＭｉｃｒｏｂｉａｌＳｔｒａｉｎＤｅｓｉｇｎＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｓｆｏｒＩｍｐｒｏｖｅｄＬａｒｇｅＳｃａｌｅＰｒｏｄｕｃｔｉｏｎｏｆＥｎｇｉｎｅｅｒｅｄＮｕｃｌｅｏｔｉｄｅＳｅｑｕｅｎｃｅｓ」と題された、係属中の米国特許出願第１５／１４０，２９６号（参照することによってその全体として本明細書に組み込まれる）に説明される、当技術分野で公知のシステムおよび技法を使用することによって、または工場２１０を使用することによって実装されてもよい。実施形態では、予測エンジン１０９は、工場に、工場が標的分子の産生のための宿主生物の成長培地の中に１つ以上の触媒を導入するための１つ以上の触媒のインジケーションを提供する。

【0117】

経路予測実施例

【0118】

予測エンジン１０９は、本開示の実施形態に従って、標的分子に到達するように触媒または操作されるように利用可能な可能性が高い触媒を採用する反応の全ての経路を予測してもよい。予測エンジン１０９はまた、予測エンジン１０９によって生成され得るスコア等の定性的情報または定量的情報に基づいて、分子の製造を試行するために予測された経路の中から選択するために使用されてもよい。

【0119】

反応標識およびカテゴリ

【0120】

反応セットが、本特許の別の場所に説明されるように、フィルタ処理および標識化されることができる。例えば、反応は、それらが利用可能な遺伝子配列を有する可能性が高いことを示すために「緩和された配列」と標識化されることができる、またはそれらは、遺伝子が本質的に存在するが、実験的に特性評価される必要があることを示すために「特性評価されるオーファン」と標識化され得る。反応は、それらの質量およびエネルギー平衡、または他の特色を反映するために同様に標識化されることができる。

【0121】

加えて、ＢＰＴは、熱力学的データに基づいて、反応が作用する可能性が高い方向を計算してもよい。

【0122】

標的分子を生成するための反応の処理の間、反応注釈エンジン１０７は、反応による標的分子の産生が熱力学的に好ましい方向において、または熱力学的に好ましくない方向において起こるかどうかフラグを立てることができる。

【0123】

これらの熱力学的結果および他の反応標識の全ては、次いで、ＢＰＴの所与の起動によって産生される分子および系統にタグ付けするように反応注釈エンジン１０７によって使用されることができる。例えば、１つの熱力学的に好ましくない反応および反応を触媒するための酵素を産生するための既知の遺伝子が欠如する２つの反応を含有する５ステップ系統は、以下のように標識化され得る。

【0124】

経路長：５

【0125】

好ましくない反応：１

【0126】

遺伝子が欠如する反応：２

【0127】

これらの標識は、次いで、各反応をスコアリングするために予測エンジン１０９によって使用されてもよい。それらはまた、出力の小区分をソートし、それに作用するために使用されることができ、それらは、所与の宿主に関する所与の分子の操作可能性への直接的な洞察を提供する。

【0128】

下記に詳述される実施例では、ＢＰＴは、生体到達可能標的分子を同定し、それらの標的分子に到達するために使用され得る予測された経路を示すために使用された。

【0129】

経路生産および評価に組み込まれた熱力学的データは、グループ寄与法を使用して生成されたが、また、任意の数の代謝データベースから導出されている場合もある。

【0130】

予測エンジン１０８は、各潜在的経路に、本明細書に説明されるスコアリング方法を使用して作成された関連付けられるスコアを割り当ててもよい。これらのスコアは、標的分子を作製するように操作することを試みる経路変形例についての決定を知らせるために使用されることができる。

【0131】

実施形態では、予測エンジン１０９は、１００ポイントの最適スコアから開始され、困難度または設計失敗のリスクを追加する経路特徴に関するポイントを減算してもよい。例えば、経路長は、設計リスクと相関し、合計スコアは、経路長が増加するにつれて低減され得、例えば、予測エンジン１０９は、スコアから、経路長における各付加的ステップに関する１つ以上のポイントを減算し得る。

【0132】

チラミン

【0133】

図８は、本開示の実施形態による、チラミンを産生するために予測エンジン１０９によって同定される経路を図示する。チラミンの場合では、１つの反応ステップ（Ｒ^１）から成る単一の経路が、予測された。示される経路は、可逆的であるように熱力学的データに基づいて計算される反応に依存し、これがチラミンを生成するために要求される方向に作用し得ることを意味する。

【0134】

経路図では、黒色矢印は、所望の分子（ここではチラミン）を産生するための経路におけるその反応のために要求される反応方向を表す。白色矢印は、反応に関する計算された熱力学的方向を表す。要求および計算された反応方向が合致するとき、経路は、妥当である。

【0135】

本単一の経路は、別の場所に説明されるメトリックによって１００ポイントのスコアとなる。

【0136】

（Ｓ）－２，３，４，５－テトラヒドロジピコリネート（ＴＨＤＰ）

【0137】

図９に示されるように、ＢＰＴは、本開示の実施形態に従って、ＴＨＤＰを生成するための２つの可能性として考えられる２ステップ経路を予測した。両方の経路が、これらの実施形態では、９７ポイントの同一のスコアを達成する。

【0138】

経路は、同一の第１の反応（Ｒ^１）を共有し、第２の反応（Ｒ^２またはＲ^３）において異なる。この場合、これらの反応は、それらが使用する還元コファクタの形態、例えば、ＮＡＤＨ対ＮＡＤＰＨにおいて異なる。経路スコアは同一であるが、本コファクタ差異は、操作目的に関連し、したがって、設計決定をガイドすることに役立てるためにＢＰＴの本実施形態において示される。典型的には、１つのコファクタ（ＮＡＤＨまたはＮＡＤＰＨのいずれか）は、各所与の宿主生物にはるかに豊富に存在する。したがって、実施形態では、当業者は、ＴＨＤＰを産生するためのより豊富なコファクタを採用する経路を選択してもよい。他の実施形態では、予測エンジン１０９は、標的分子スコアを算出するために操作可能性へのコファクタの影響に関する情報をデータベースから読み出し、考慮し、それによって、経路コファクタの人間精査の必要性を不要にしてもよい。

【0139】

仮説的分子「Ｆ」に関する例示的予測経路

【0140】

別の実施例では、生体到達可能分子「Ｆ」に関して、ＢＰＴは、図１０に図示されるように、３つの潜在的経路を予測した。

【0141】

第１の経路は、２ステップ長であり、低信頼性オーファン反応（Ｒ^２）を含み、５８ポイントのスコアをもたらす。低信頼性オーファン反応は、対応するＤＮＡ配列が広範な具体的研究作業を伴わずに容易に利用可能である可能性が低いオーファン酵素によって触媒される反応である。したがって、多くのポイントが、オーファン酵素に関して減点される。

【0142】

第２の経路は、３ステップ長であり、利用可能な真核生物遺伝子のみとの１つの反応（Ｒ^４）を含み、９２ポイントのスコアをもたらす。ポイントが、全体的経路長のため、およびＲ^４に関するソース遺伝子の限定のため、減点される。

【0143】

第３の経路もまた、３ステップ長であり、他の３ステップ反応と共通する２つの反応（Ｒ^３およびＲ^４）を有する。これはまた、利用可能な真核生物遺伝子のみとの１つの反応（Ｒ^４）と、操作された酵素を要求する別の反応（Ｒ^５）とを有し、８２ポイントのスコアをもたらす。加えて、本経路は、経路スコアにいかなる影響も及ぼさないが、具体的宿主および用途のために最良適合である経路を決定するときに考慮事項である、出発コア代謝物の代替セット（Ａ＋Ｂの代わりにＫ＋Ｌ）を有する。

【0144】

本実施例では、ＢＰＴの予測エンジン１０９からのスコアリング出力は、単純な経路長を超える重要な操作情報を提供する。最短経路（＃１）が最良であり得るという直感にもかかわらず、各反応について注釈エンジン１０７によって、そしてフィルタ処理または処理の間にＢＰＴによって収集された情報は、より長い経路が（＃２および＃３）が操作するためにより適している場合があることを示す。例えば、反応注釈エンジン１０７は、いくつかの反応のための触媒が高リスクカテゴリ（例えば、低信頼性オーファン、操作された酵素）においてのみ利用可能であると決定し得、予測エンジン１０９は、短い経路がこれらの高リスクカテゴリに依存する一方、長い経路はそうではないと決定し得、これは、より長い経路が操作するためにより適している場合があることを示し得る。

【0145】

テトラヒドロジピコリネートスコアリング表

【0146】

本開示の実施形態によると、予測エンジン１０９は、標的分子を産生する困難度をスコアリングするために、これが生成する情報を使用する。（逆に、スコアは、分子を産生する容易度を示すものと見なされてもよい。）本スコアは、同義的に、本明細書では、「分子スコア」、「標的分子スコア」、または「全体的経路スコア」として参照される。

【0147】

実施例として、図１１Ａおよび１１Ｂはともに、予測エンジン１０９がテトラヒドロジピコリネート（ＴＨＤＰ）の産生をスコアリングし得る様子を図示する表を提供する。実施形態では、全体的経路スコアリングプロセスは、表に示されるように、例えば、３０％、６０％、１０％として加重される、経路スコア、部分スコア、および生産物スコア等の成分によって分類されてもよい。示される評価データは、分子（Ｓ）－２，３，４，５－テトラヒドロジピコリネート（ＴＨＤＰ）への経路を予測するプロセスの間に生成された。

【0148】

経路成分スコアは、経路の相対的操作実行可能性を表す。実施形態では、これは、２つの要素を備える。

【0149】

経路長－経路における反応ステップの数。これは、本開示の実施形態に従って、予測エンジン１０９による生体到達可能予測の本質的部分として集計される。

【0150】

遺伝子カウント－経路のために要求されることが予測される遺伝子の数。これは、反応注釈エンジン１０７による反応フィルタ処理の一部としてデータベースにクエリを行うことによって同定される。

【0151】

反応および酵素は、必ずしも１：１の関係にあるわけではない（例えば、単一の反応が、時として、２つの部分の酵素によって触媒され、２つの遺伝子を要求する）ため、予測エンジン１０９は、両方の要素を経路を操作する予測される困難度の因子としてもよい。

【0152】

ＢＰＴによって予測される両方の系統では、図９に示されるように、ＴＨＤＰは、所望の宿主生物において２ステップ経路を要求する。これは、２対１ステップ経路の困難度における適度な増加に基づいて、適切なスコア減点をもたらす。

【0153】

この場合、経路反応ステップあたりの遺伝子の数（反応が少しでも遺伝子を有する可能性が高いかどうかを決定する同一の評価プロセスを介して同定可能）もまた、ある程度の罰点をもたらす。

【0154】

部分成分スコア

【0155】

部分スコアは、個々の経路部分の相対的操作実行可能性を表す。実施形態では、これは、評価されている経路における反応のために宿主の中に触媒を組み込むために要求される部分（例えば、遺伝子）を見出すことの予測される困難度に基づく。

【0156】

実施形態では、部分を見出す能力に影響を及ぼし得る可能性として考えられる特徴は、以下を含む。

【0157】

＞１００個の既知の酵素配列－反応フィルタ処理ステップの間に反応に関して見出された１００個以上の配列（例えば、反応を触媒するための酵素に対応する少なくとも１つのデータベース内に示される１００個以上のアミノ酸配列）。

【0158】

＜１００個の既知の酵素配列－酵素配列が見出されたが、１００個よりも少ないものが、反応フィルタ処理ステップの間に同定された。

【0159】

高信頼性オーファン／低信頼性オーファン－いかなる酵素配列も、反応フィルタ処理ステップの間に公的データベース内に見出されなかったが、それらの配列が比較的に同定することが容易（高信頼性）または困難（低信頼性）であろうことを示唆する関連付けられる証拠が、見出された。

【0160】

操作された酵素－反応フィルタ処理ステップの間に本反応にリンクされた酵素のみが、反応を実行するために操作された（本データは、データベース検索において見出されることができる）。これは、典型的には、それらが自然に触媒する反応とは異なる反応を触媒するように変異した天然酵素を指す。これらの操作された酵素は、それらが限定された範囲のドナー生物からの１つまたはいくつかの配列に限定され得るため、新規の経路において使用することが困難であり得る。そのような操作された酵素は、ＢＲＥＮＤＡ等の公的データベース内で見出されることができる。

【0161】

遺伝子分類ソーシング－（酵素配列が見出されたと仮定して）同様に、反応フィルタ処理ステップの間に識別される。本成分は、生体到達可能分子に関する予測された経路における反応の中で「最悪の場合」（最大の罰点）によって生体到達可能分子を分類し、罰点は、産業用プラットフォーム生物において示された源から酵素を発現させることの困難度に関する現在までの経験的データに基づく。

【0162】

個々の反応が未知であるときの経路に関する遺伝子可用性－ある場合には、経路は、データセット内の代用反応を使用して定義され、これらの反応は、個々の遺伝子クラスタまたは生物にプログラム的にリンクされることができ、個々の反応が未知である経路は、操作リスクおよび困難度の有意な増加を表し、したがって、大きい罰点が、割り当てられる。

【0163】

これらの特徴要素は全て、各反応を触媒する酵素に関する配列データの存在、不在、および豊富さについての情報が蓄積されるにつれて、反応注釈エンジン１０７によって識別される。

【0164】

ＴＨＤＰの場合では、遺伝子は、両方の経路反応に関して豊富に存在し、いかなる罰点ももたらさない。代わりに、例えば、反応のうちの１つが低信頼性オーファンによって触媒された場合、ＴＨＤＰは、有意な罰点を生じていたであろう。

【0165】

生産物成分スコア

【0166】

生産物スコアは、本開示の実施形態では、標的分子スコアへの最小の全体的寄与分である。生産物スコアは、細胞内で生産物を持続し、細胞からこれを排出し、培地中でこれを維持することの困難度に影響を及ぼす因子を表す。実施形態では、これは、分子の予期される毒性、排出可能性、および安定性の評価を表す。本実施形態に説明される具体的特徴は、以下を含む。

【0167】

毒性－分子が１つ以上の宿主生物に毒性であることが予期され得る程度。本情報は、抗菌データベース（または宿主生物の一般的カテゴリに関する毒性情報を収集する他のデータベース）にクエリを行うことから導出されることができる。

【0168】

排出－分配係数データに関する化学データベースにクエリを行うことによって、または内部実験データにクエリを行うことによって予測される。

【0169】

安定性－安定性問題が、化学データベースにクエリを行うことによって識別される。

【0170】

スコア要約

【0171】

表の下側は、全体的スコアおよびカテゴリスコアを要約する。これはまた、任意のフラグ、すなわち、経路操作のために特定のディリスキングを要求するエリアを強調する。ＴＨＤＰは、いかなるフラグも有していない場合がある。例示的フラグは、経路にその反応ステップのための１つ以上の遺伝子（例えば、高または低信頼性オーファン）が欠落しているかどうかであろう。

【0172】

コンピュータシステム実装

【0173】

図６は、本開示の実施形態による、クラウドコンピューティング環境６０４を図示する。本開示の実施形態では、図１の反応注釈エンジン１０７および予測エンジン１０９のためのソフトウェア６１０は、クラウドコンピューティングシステム６０２内で実装され、複数のユーザが、本開示の実施形態に従って、反応に注釈を付け、生体到達可能分子を予測することを可能にしてもよい。図７に図示されるもの等のクライアントコンピュータ６０６が、インターネット等のネットワーク６０８を介して本システムにアクセスする。本システムは、図７に図示されるタイプの１つ以上のプロセッサを使用して１つ以上のコンピューティングシステムを採用してもよい。クラウドコンピューティングシステム自体は、ネットワーク６０８を介して生体到達可能予測ツールソフトウェア６１０をクライアントコンピュータ６０６にインターフェースさせるためのネットワークインターフェース６１２を含む。ネットワークインターフェース６１２は、クライアントコンピュータ６０６におけるクライアントアプリケーションがシステムソフトウェア６１０にアクセスすることを可能にするために、アプリケーションプログラミングインターフェース（ＡＰＩ）を含んでもよい。特に、ＡＰＩを通して、クライアントコンピュータ６０６は、注釈エンジン１０７および予測エンジン１０９にアクセスしてもよい。

【0174】

サービスとしてのソフトウェア（ＳａａＳ）ソフトウェアモジュール６１４が、クライアントコンピュータ６０６へのサービスとしてＢＰＴシステムソフトウェア６１０を提供する。クラウド管理モジュール６１６が、クライアントコンピュータ６０６によるシステム６１０へのアクセスを管理する。クラウド管理モジュール６１６は、マルチテナントアプリケーション、仮想化、または当技術分野で公知の他のアーキテクチャを採用するクラウドアーキテクチャが複数のユーザにサービス提供することを可能にしてもよい。

【0175】

図７は、本開示の実施形態による、非一過性コンピュータ可読媒体（例えば、メモリ）内に記憶されるプログラムコードを実行するために使用され得る、コンピュータシステム８００の実施例を図示する。コンピュータシステムは、用途に応じて、人間ユーザおよび／または他のコンピュータシステムとインターフェースをとるために使用され得る、入力／出力サブシステム８０２を含む。Ｉ／Ｏサブシステム８０２は、アプリケーションプログラムインターフェース（ＡＰＩ）を含む、例えば、キーボード、マウス、グラフィカルユーザインターフェース、タッチスクリーン、または入力のための他のインターフェースと、例えば、ＬＥＤまたは他のフラットスクリーンディスプレイ、または出力のための他のインターフェースとを含んでもよい。注釈エンジン１０７および予測エンジン１０９等の本開示の実施形態の他の要素は、コンピュータシステム８００のもののようなコンピュータシステムとともに実装されてもよい。

【0176】

プログラムコードは、二次メモリ８１０または主要メモリ８０８または両方における永続記憶装置等の非一過性媒体内に記憶されてもよい。主要メモリ８０８は、ランダムアクセスメモリ（ＲＡＭ）等の揮発性メモリまたは読取専用メモリ（ＲＯＭ）等の不揮発性メモリ、および命令およびデータへのより高速のアクセスのための異なるレベルのキャッシュメモリを含んでもよい。二次メモリは、ソリッドステートドライブ、ハードディスクドライブ、または光学ディスク等の永続記憶装置を含んでもよい。１つ以上のプロセッサ８０４は、１つ以上の非一過性媒体からプログラムコードを読み取り、コンピュータシステムが本明細書の実施形態によって実施される方法を遂行することを可能にするようにコードを実行する。当業者は、プロセッサが、ソースコードを取り入れ、ソースコードをプロセッサ８０４のハードウェアゲートレベルにおいて理解可能である機械コードに解釈またはコンパイルし得ることを理解するであろう。プロセッサ８０４は、コンピュータ的に集約的であるタスクを処理するためのグラフィックス処理ユニット（ＧＰＵ）を含んでもよい。

【0177】

プロセッサ８０４は、ネットワークインターフェースカード、ＷｉＦｉ送受信機等の１つ以上の通信インターフェース８０７を介して外部ネットワークと通信してもよい。バス８０５が、Ｉ／Ｏサブシステム８０２、プロセッサ８０４、周辺デバイス８０６、通信インターフェース８０７、メモリ８０８、および永続記憶装置８１０を通信可能に結合する。本開示の実施形態は、本代表的アーキテクチャに限定されない。代替実施形態は、異なる配列およびタイプのコンポーネント、例えば、入力／出力コンポーネントおよびメモリサブシステムのための別個のバスを採用してもよい。

【0178】

当業者は、本開示の実施形態の要素のうちのいくつかまたは全ておよびそれらの付随の動作が、コンピュータシステム８００のもののような１つ以上のプロセッサおよび１つ以上のメモリシステムを含む、１つ以上のコンピュータシステムによって全体的または部分的に実装され得ることを理解するであろう。特に、生体到達可能予測ツールおよび本明細書に説明される任意の他の自動化システムまたはデバイスの要素は、コンピュータ実装されてもよい。いくつかの要素および機能性は、ローカルに実装されてもよく、その他は、例えば、異なるサーバを通してネットワークを経由する分散方式で、例えば、クライアント－サーバ方式で実装されてもよい。特に、サーバ側動作は、図６に示されるように、サービスとしてのソフトウェア（ＳａａＳ）方式で複数のクライアントに利用可能にされてもよい。

【0179】

本開示は、本明細書に説明されるいくつかの実施形態または特徴が本明細書に説明される他の実施形態または特徴と組み合わせられ得ることを明確に開示していない場合があるが、本開示は、当業者によって実践可能であろう任意のそのような組み合わせを説明するように読み取られるべきである。

【0180】

当業者は、いくつかの実施形態では、本明細書に説明される動作のうちのいくつかが、人間実装によって、または自動化および手動手段の組み合わせを通して実施され得ることを認識するであろう。動作が完全に自動化されていないとき、生体到達可能予測ツールの適切なコンポーネントが、例えば、その独自の動作能力を通して結果を生成するのではなく、動作の人間実施の結果を受信してもよい。

【図1】