(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-13
(54)【発明の名称】核酸配列を編集する方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20241106BHJP
【FI】
C12N15/09 110
C12N15/09 ZNA
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024526648
(86)(22)【出願日】2022-11-03
(85)【翻訳文提出日】2024-06-26
(86)【国際出願番号】 EP2022080675
(87)【国際公開番号】W WO2023078997
(87)【国際公開日】2023-05-11
(32)【優先日】2021-11-03
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】518160355
【氏名又は名称】ユナイテッド キングダム リサーチ アンド イノベーション
(74)【代理人】
【識別番号】100107984
【氏名又は名称】廣田 雅紀
(74)【代理人】
【識別番号】100182305
【氏名又は名称】廣田 鉄平
(74)【代理人】
【識別番号】100096482
【氏名又は名称】東海 裕作
(74)【代理人】
【識別番号】100131093
【氏名又は名称】堀内 真
(74)【代理人】
【識別番号】100150902
【氏名又は名称】山内 正子
(74)【代理人】
【識別番号】100141391
【氏名又は名称】園元 修一
(74)【代理人】
【識別番号】100221958
【氏名又は名称】篠田 真希恵
(74)【代理人】
【識別番号】100192441
【氏名又は名称】渡辺 仁
(72)【発明者】
【氏名】ザーカー ジェローム エフ
(72)【発明者】
【氏名】ファンケ ルイーズ エフ エイチ
(72)【発明者】
【氏名】クレーフエルト アスカー エー
(72)【発明者】
【氏名】ビルンバウム ジェイコブ
(72)【発明者】
【氏名】フレデンス ジュリウス
(72)【発明者】
【氏名】スピンク マーティン
(72)【発明者】
【氏名】チン ジェイソン ダブリュー
(57)【要約】
一態様では、本発明は、所望の配列を標的核酸に導入する方法に関する。本発明はまた、所望の配列を標的核酸に導入する方法を繰り返すことを含む、核酸配列をアセンブルする方法、並びに、より多くの量の異種核酸をコードするレプリコンのアセンブリにも関する。
【特許請求の範囲】
【請求項1】
所望の配列を標的核酸に導入する方法であって、
a)宿主細胞を提供するステップであって、
前記宿主細胞がエピソームレプリコンを含み、
前記エピソームレプリコンが骨格配列及びドナー核酸配列を含み、
前記ドナー核酸配列が、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を順に含み、
前記骨格配列が、相同組換え配列1の隣に位置する第1の切除部位及び相同組換え配列2の隣に位置する第2の切除部位を含み、
前記宿主細胞が標的核酸をさらに含む、前記ステップ、
b)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供するステップ、
c)RNAによってガイドされるDNAエンドヌクレアーゼを提供するステップ、
d)前記第1の切除部位に特異的な配列を含む第1のRNA分子及び前記第2の切除部位に特異的な配列を含む第2のRNA分子を提供するステップであって、前記第1及び前記第2のRNA分子が、切除の際の、前記RNAによってガイドされるDNAエンドヌクレアーゼの指向に関与する、前記ステップ、
e)前記RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列の切除を誘導するステップ、並びに
f)インキュベートを行って、前記切除されたドナー核酸と前記標的核酸との間で組換えを起こすステップ
を含む、前記方法。
【請求項2】
RNAによってガイドされるDNAエンドヌクレアーゼがCRISPR-Casヌクレアーゼであり、第1のRNA分子が、第1の切除部位に特異的なスペーサーを含み、第2のRNA分子が、第2の切除部位に特異的なスペーサーを含む、請求項1に記載の方法。
【請求項3】
CRISPR-CasヌクレアーゼがCas9である、請求項2に記載の方法。
【請求項4】
第1のRNA分子及び/又は第2のRNA分子がエピソームレプリコンによってコードされる、請求項1~3のいずれかに記載の方法。
【請求項5】
切除された核酸の各末端が、骨格配列に由来する核酸配列を含む、請求項1~4のいずれかに記載の方法。
【請求項6】
切除されたドナー核酸が、各末端で、骨格配列に由来する核酸配列の6個又は5個以下の塩基対を含む、請求項5に記載の方法。
【請求項7】
エピソームレプリコンが細菌人工染色体である、請求項1~6のいずれかに記載の方法。
【請求項8】
エピソームレプリコンが接合伝達によって宿主細胞に送達される、請求項1~7のいずれかに記載の方法。
【請求項9】
標的核酸が宿主細胞のゲノムである、請求項1~8のいずれかに記載の方法。
【請求項10】
宿主細胞が原核細胞である、請求項1~9のいずれかに記載の方法。
【請求項11】
原核細胞が大腸菌である、請求項1~10のいずれかに記載の方法。
【請求項12】
核酸配列をアセンブルする方法であって、
(i)請求項1~11のいずれかに記載のステップを行って、第1のドナー核酸配列を第1の標的核酸に導入し、それによって第2の標的核酸を作製するステップ、及び
(ii)請求項1~11のいずれかに記載のステップを行って、第2のドナー核酸配列を第2の標的核酸に導入し、それによって第3の標的核酸を作製するステップ
を含む、前記方法
【請求項13】
パート(i)及びパート(ii)が繰り返される、請求項12に記載の方法。
【請求項14】
パート(i)のための第1のRNA分子の配列が各繰り返しで同一であり、及び/又はパート(i)のための第2のRNA分子の配列が各繰り返しで同一であり、
パート(ii)のための第1のRNA分子の配列が各繰り返しで同一であり、及び/又はパート(ii)のための第2のRNA分子の配列が各繰り返しで同一である、請求項13に記載の方法。
【請求項15】
(iii)請求項1~11のいずれかに記載のステップを行って、第3のドナー核酸配列を第3の標的核酸に導入し、それによって第4の標的核酸を作製するステップ、
パート(i)、(ii)、及び(iii)を繰り返すステップ
をさらに含み、
パート(iii)のための第1のRNA分子の配列が各繰り返しで同一であり、及び/又はパート(iii)のための第2のRNA分子の配列が各繰り返しで同一である、請求項12~14のいずれかに記載の方法。
【請求項16】
パート(i)が、第1の骨格配列を含む、ドナー核酸配列をコードするエピソームレプリコンの使用を含み、パート(ii)が、第2の骨格配列を含む、ドナー核酸配列をコードするエピソームレプリコンの使用を含み、
前記第1の骨格配列が、第1のマーカー又はマーカーセットを含み、前記第1の骨格配列内の第1の切除部位に特異的な第1のRNA分子をコードし、並びに、前記第1の骨格配列内の第2の切除部位に特異的な第2のRNA分子をコードし、
前記第2の骨格配列が、第2のマーカー又はマーカーセットを含み、前記第2の骨格配列内の第1の切除部位に特異的な第1のRNA分子をコードし、並びに、前記第2の骨格配列内の第2の切除部位に特異的な第2のRNA分子をコードし、
前記第1のマーカー又はマーカーセットが、前記第2のマーカー又はマーカーセットと異なる、請求項12~15のいずれかに記載の方法。
【請求項17】
エピソームレプリコンを構築するための方法であって、
a)ドナーエピソームレプリコンを提供するステップであって、前記レプリコンが、
ユニバーサルスペーサー配列を含む骨格、組み込みステップnに特異的な第1の相同性領域HRn、及び第2のユニバーサルな相同性領域uHR、HRnの隣に位置する第1の切除部位及びuHRの隣に位置する第2の切除部位、
ドナー核酸DNAn、
ポジティブセレクションマーカー及びネガティブセレクションマーカーを含むダブルセレクションカセット
を含む、前記ステップ、
b)HRn及びuHRが隣接する、ポジティブセレクションマーカー及びネガティブセレクションマーカーを含むダブルセレクションカセットを含む、アセンブリエピソームレプリコンを含む、宿主細胞を提供するステップであって、前記アセンブリレプリコン内の前記ダブルセレクションカセットが、前記ドナーレプリコン内の前記セレクションカセットと異なるマーカーを含む、前記ステップ、
c)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパクを提供するステップ、
c)RNAによってガイドされるDNAエンドヌクレアーゼを提供するステップ、
d)前記第1の切除部位に特異的な配列を含む第1のRNA分子及び前記第2の切除部位に特異的な配列を含む第2のRNA分子を提供するステップであって、前記第1及び前記第2のRNA分子が、切除の際の、前記RNAによってガイドされるDNAエンドヌクレアーゼの指向に関与する、前記ステップ、
e)前記宿主細胞において、前記RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列DNAnの切除を誘導するステップ、並びに
f)インキュベートを行って、前記切除されたドナー核酸と前記アセンブリレプリコンとの間の組換えを起こし、前記核酸DNAnを含む第2のアセンブリレプリコンを形成するステップ
を含む、前記方法。
【請求項18】
RNAによってガイドされるDNAエンドヌクレアーゼがCRISPR-Casヌクレアーゼであり、第1のRNA分子が、第1の切除部位に特異的なスペーサーを含み、第2のRNA分子が、第2の切除部位に特異的なスペーサーを含む、請求項17に記載の方法。
【請求項19】
CRISPR-CasヌクレアーゼがCas9である、請求項18に記載の方法。
【請求項20】
第1のRNA分子及び/又は第2のRNA分子がドナーエピソームレプリコンによってコードされる、請求項17~19のいずれかに記載の方法。
【請求項21】
切除された核酸の各末端が、骨格配列に由来する核酸配列を含む、請求項17~20のいずれかに記載の方法。
【請求項22】
切除されたドナー核酸が、各末端で、骨格配列に由来する核酸配列の6個又は5個以下の塩基対を含む、請求項21に記載の方法。
【請求項23】
エピソームレプリコンが細菌人工染色体である、請求項17~22のいずれかに記載の方法。
【請求項24】
エピソームレプリコンが接合伝達によって宿主細胞に送達される、請求項17~23のいずれかに記載の方法。
【請求項25】
エピソームレプリコンがドナー宿主細胞に含まれ、アセンブリレプリコンがレシピエント宿主細胞に含まれ、前記ドナーレプリコンが接合伝達によって前記レシピエント宿主細胞に送達され、前記ドナー宿主細胞が、伝達不可能なF’プラスミドを含む、請求項24に記載の方法。
【請求項26】
宿主細胞が原核細胞である、請求項17~25のいずれかに記載の方法。
【請求項27】
原核細胞が大腸菌である、請求項17~26のいずれかに記載の方法。
【請求項28】
ドナー核酸DNAnが相同性領域HRn+1を含み、方法が、第2のドナー核酸DNAn+1を含むさらなるドナーエピソームレプリコンを宿主細胞に導入するステップ、前記宿主細胞における、RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列DNAn+1の切除を誘導するステップ、及びインキュベートを行って、前記切除されたドナー核酸DNAn+1と前記第2のアセンブリレプリコンとの間の組換えを起こし、核酸DNAn及び核酸DNAn+1を含む第3のアセンブリレプリコンを形成するステップをさらに含む、請求項17~27のいずれかに記載の方法。
【請求項29】
繰り返し反復される、請求項28に記載の方法。
【請求項30】
請求項1~11のいずれかに記載のステップのエピソームレプリコンが、請求項17~29のいずれかに記載の方法に従って構築される、請求項12~16のいずれかに記載の方法。
【請求項31】
宿主細胞がコンピテントなrecA及び/又はrecOを欠いている、請求項1~30のいずれかに記載の方法。
【請求項32】
宿主細胞がrecAを欠いている(ΔrecA)、請求項31に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
一態様では、本発明は、所望の配列を標的核酸に導入する方法に関する。本発明はまた、所望の配列を標的核酸に導入する方法を繰り返すことを含む、核酸配列をアセンブルする方法にも関する。
【背景技術】
【0002】
ゲノムDNAを合成DNAで置き換えるための戦略(非特許文献1~12)は、ゲノムの改変を可能にし、そして、編集方法論のみによっては作製することができない全体的に合成のゲノムを作製するための強力な技術の基礎を提供する。ゲノム合成は、2つの生物で合成ゲノムを作製するために使用されており、これら生物は、ゲノム最小化を調べるために使用されているマイコプラズマ(1Mb)(非特許文献13)、及びリコードされた生物を作製するために使用されている大腸菌(E. coli)(4Mb)(非特許文献14)である。大腸菌における研究は、18000を超える同義コドンを除去して、カノニカルなアミノ酸をコードするためにわずか61個のコドンしか使用しない、遺伝子コードが圧縮された生物を作製した。遺伝子コードが圧縮された、リコードされた大腸菌は、ウイルス耐性細胞を作製するための、並びに、非カノニカルなアミノ酸の組み込み及びコードされる非カノニカルなポリマーの合成のためのセンスコドンの再割り当てのための基礎を提供する(非特許文献15)。他のゲノムを合成するための試み、及びゲノムをリコードする、最小化する、又はリアレンジするための戦略が、現在行われている(非特許文献9、10、16~18)。
【0003】
大腸菌のゲノム合成は、レプリコン切除強化型組換え(REXER(Replicon Excision Enhanced Recombination))に基づくものであった(非特許文献5)。REXER(
図1a)では、ダブルセレクションカセット(ポジティブセレクションマーカー及びネガティブセレクションマーカーから構成される)が隣接している所望の合成DNAとゲノムに相同な50~152bpの領域とから構成されるインサートを有している細菌人工染色体(BAC、bacterial artificial chromosome)が、CRISPR/Cas9及びラムダレッド組換え機構をコードするヘルパープラスミドを有する細胞に形質転換される。正確なBACを有する1つのクローンが単離され、コンピテント化され、次いで、BACからの、合成DNAを有するインサートのCas9介在性の切除を活性化するために、スペーサーアレイがコンピテント細胞に導入される。スペーサー配列は、スペーサーRNAがインサートの相同性領域内の固有の配列と塩基対合し、インサートとBAC骨格との間の連結を正確に切断するように設計されている(
図1b)。正確に切除されたインサートは次いで、合成DNAを、対応するゲノムDNAの代わりにゲノムに挿入するために、ラムダレッド組換え機構によって使用される。ゲノム及び合成DNA内の別々のダブルセレクションカセットは、所望の組み込みを選択するために使用される(
図1a)。適切にマークされたゲノムを有する細胞から開始して、REXER後の寒天プレート上でクローンコロニーを得るまでには4日間を要する。
【0004】
1ステップのREXERが、最大136kbのゲノムを合成のリコードされたDNAで置き換えるために使用されている。1ステップのREXERから得られたゲノムは次のREXERラウンドのための鋳型を提供し、REXERの繰り返し(ゲノム交換段階的合成(GENESIS、Genome interchange stepwise synthesis))は、より大きな大腸菌ゲノムセクションを合成DNAで置き換えることを可能にする。38回のREXERステップが、これは各ステップがカスタムメイドのスペーサー対の設計、合成、クローニング、及び検証を要するものであるが、大腸菌ゲノム全体(7つの株にわたる)を合成のリコードされたDNAで置き換えるために使用された。リコードされたDNAは次いで、接合によって1つの株にまとめられて、リコードされた生物が作製された。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Santos, C. N., Regitsky, D. D. & Yoshikuni, Y. Implementation of stable and complex biological systems through recombinase-assisted genome engineering. Nat Commun 4, 2503, doi:10.1038/ncomms3503 (2013)
【非特許文献2】Santos, C. N. & Yoshikuni, Y. Engineering complex biological systems in bacteria through recombinase-assisted genome engineering. Nat Protoc 9, 1320-1336, doi:10.1038/nprot.2014.084 (2014)
【非特許文献3】Krishnakumar, R. et al. Simultaneous non-contiguous deletions using large synthetic DNA and site-specific recombinases. Nucleic Acids Res 42, e111, doi:10.1093/nar/gku509 (2014)
【非特許文献4】Wang, G. et al. CRAGE enables rapid activation of biosynthetic gene clusters in undomesticated bacteria. Nat Microbiol 4, 2498-2510, doi:10.1038/s41564-019-0573-8 (2019)
【非特許文献5】Wang, K. et al. Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64, doi:10.1038/nature20124 (2016)
【非特許文献6】Itaya, M., Tsuge, K., Koizumi, M. & Fujita, K. Combining two genomes in one cell: stable cloning of the Synechocystis PCC6803 genome in the Bacillus subtilis 168 genome. Proc Natl Acad Sci U S A 102, 15971-15976, doi:10.1073/pnas.0503868102 (2005)
【非特許文献7】Lau, Y. H. et al. Large-scale recoding of a bacterial genome by iterative recombineering of synthetic DNA. Nucleic Acids Res 45, 6971-6980, doi:10.1093/nar/gkx415 (2017)
【非特許文献8】Lartigue, C. et al. Creating bacterial strains from genomes that have been cloned and engineered in yeast. Science 325, 1693-1696, doi:10.1126/science.1173759 (2009)
【非特許文献9】Ostrov, N. et al. Design, synthesis, and testing toward a 57-codon genome. Science 353, 819-822, doi:10.1126/science.aaf3639 (2016)
【非特許文献10】Dymond, J. S. et al. Synthetic chromosome arms function in yeast and generate phenotypic diversity by design. Nature 477, 471-476, doi:10.1038/nature10403 (2011)
【非特許文献11】Gibson, D. G. et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science 329, 52-56, doi:10.1126/science.1190719 (2010)
【非特許文献12】Wang, K., de la Torre, D., Robertson, W. E. & Chin, J. W. Programmed chromosome fission and fusion enable precise large-scale genome rearrangement and assembly. Science 365, 922-926, doi:10.1126/science.aay0737 (2019)
【非特許文献13】Hutchison, C. A., 3rd et al. Design and synthesis of a minimal bacterial genome. Science 351, aad6253, doi:10.1126/science.aad6253 (2016)
【非特許文献14】Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518, doi:10.1038/s41586-019-1192-5 (2019)
【非特許文献15】de la Torre, D. & Chin, J. W. Reprogramming the genetic code. Nat Rev Genet 22, 169-184, doi:10.1038/s41576-020-00307-7 (2021)
【非特許文献16】Mercy, G. et al. 3D organization of synthetic and scrambled chromosomes. Science 355, doi:10.1126/science.aaf4597 (2017)
【非特許文献17】Richardson, S. M. et al. Design of a synthetic yeast genome. Science 355, 1040-1044, doi:10.1126/science.aaf4557 (2017)
【非特許文献18】Venetz, J. E. et al. Chemical synthesis rewriting of a bacterial genome to achieve design flexibility and biological functionality. Proc Natl Acad Sci U S A 116, 8070-8079, doi:10.1073/pnas.1818259116 (2019)
【非特許文献19】Lovett, S. T. The DNA Damage Response. Bacterial Stress Responses, 341 2nd Edition, 205-228 (2011).
【非特許文献20】Anstey-Gilbert, C. S. et al. The structure of Escherichia coli ExoIX--implications for DNA binding and catalysis in flap endonucleases. Nucleic Acids Res 41, 8357-8367, doi:10.1093/nar/gkt591 (2013).
【非特許文献21】Liu, Y., Kao, H. I. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu Rev Biochem 73, 589-615, doi:10.1146/annurev.biochem.73.012803.092453 (2004).
【非特許文献22】Anzalone, A. V. et al. Search-and-replace genome editing without double-strand breaks or donor DNA. Nature 576, 149-157, doi:10.1038/s41586-019-1711-4 (2019).
【発明の概要】
【発明が解決しようとする課題】
【0006】
大腸菌のゲノムへの合成DNAの導入をさらに単純化し、短時間にするための戦略は、将来的な大規模ゲノム改変、及びゲノム合成の試みの鍵となるであろう。
【課題を解決するための手段】
【0007】
本発明の一態様では、所望の配列を標的核酸に導入する方法であって、
a)宿主細胞を提供するステップであって、
前記宿主細胞がエピソームレプリコンを含み、
前記エピソームレプリコンが骨格配列及びドナー核酸配列を含み、
前記ドナー核酸配列が、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を順に含み、
骨格配列が、相同組換え配列1の隣に位置する第1の切除部位及び相同組換え配列2の隣に位置する第2の切除部位を含み、
前記宿主細胞が標的核酸をさらに含む、前記ステップ、
b)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供するステップ、
c)RNAによってガイドされるDNAエンドヌクレアーゼを提供するステップ、
d)前記第1の切除部位に特異的な配列を含む第1のRNA分子及び前記第2の切除部位に特異的な配列を含む第2のRNA分子を提供するステップであって、第1及び第2のRNA分子が、切除の際の、RNAによってガイドされるDNAエンドヌクレアーゼの指向に関与する、前記ステップ、
e)RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列の切除を誘導するステップ、並びに
f)インキュベートを行って、切除されたドナー核酸と前記標的核酸との間で組換えを起こさせるステップ
を含む、前記方法が提供される。
【0008】
RNAによってガイドされるDNAエンドヌクレアーゼはCRISPR-Casヌクレアーゼであり得、第1のRNA分子は第1の切除部位に特異的なスペーサーを含み得、そして第2のRNA分子は第2の切除部位に特異的なスペーサーを含み得る。CRISPR-CasヌクレアーゼはCas9であり得る。第1のRNA分子及び/又は第2のRNA分子は、エピソームレプリコンによってコードされていてよい。
【0009】
一実施形態では、切除された核酸の各末端は、骨格配列に由来する核酸配列を含む。切除されたドナー核酸は、各末端で、骨格配列に由来する核酸配列の6つ又は5つ以下の塩基対を含み得る。
【0010】
一実施形態では、エピソームレプリコンは細菌人工染色体(bacterial artificial chromosome)である。エピソームレプリコンは、接合伝達によって宿主細胞に送達され得る。
【0011】
標的核酸は、宿主細胞のゲノムであり得る。宿主細胞は、原核細胞、例えば大腸菌(Escherichia coli)であり得る。
【0012】
本発明の一態様では、核酸配列をアセンブルする方法であって、
(i)本発明の、所望の配列を標的核酸に導入する方法のステップを行って、第1のドナー核酸配列を第1の標的核酸に導入し、それによって第2の標的核酸を作製するステップ、及び
(ii)本発明の、所望の配列を標的核酸に導入する方法のステップを行って、第2のドナー核酸配列を第2の標的核酸に導入し、それによって第3の標的核酸を作製するステップ
を含む方法が提供される。パート(i)及びパート(ii)は繰り返してもよい。
【0013】
一実施形態では、パート(i)のための第1のRNA分子の配列は各繰り返しで同一であり、及び/又は、パート(i)のための第2のRNA分子の配列は各繰り返しで同一であり、パート(ii)のための第1のRNA分子の配列は各繰り返しで同一であり、及び/又はパート(ii)のための第2のRNA分子の配列は各繰り返しで同一である。
【0014】
一実施形態では、本方法は、
(iii)本発明の、所望の配列を標的核酸に導入する方法のステップを行って、第3のドナー核酸配列を第3の標的核酸に導入し、それによって第4の標的核酸を作製するステップ、
パート(i)、(ii)、及び(iii)を繰り返すステップ
をさらに含み、
パート(iii)のための第1のRNA分子の配列は各繰り返しで同一であり、及び/又はパート(iii)のための第2のRNA分子の配列は各繰り返しで同一である。
【0015】
特定の実施形態では、パート(i)は、第1の骨格配列を含む、ドナー核酸配列をコードするエピソームレプリコンの使用を含み、またパート(ii)は、第2の骨格配列を含む、ドナー核酸配列をコードするエピソームレプリコンの使用を含み、
第1の骨格配列は、第1のマーカー又はマーカーセットを含み、前記第1の骨格配列内の第1の切除部位に特異的な第1のRNA分子をコードし、並びに、前記第1の骨格配列内の第2の切除部位に特異的な第2のRNA分子をコードし、
第2の骨格配列は、第2のマーカー又はマーカーセットを含み、前記第2の骨格配列内の第1の切除部位に特異的な第1のRNA分子をコードし、並びに、前記第2の骨格配列内の第2の切除部位に特異的な第2のRNA分子をコードし、
第1のマーカー又はマーカーセットは、第2のマーカー又はマーカーセットと異なる。
【0016】
本発明のさらなる態様では、エピソームレプリコンを構築するための方法であって、
a)ドナーエピソームレプリコンを提供するステップであって、前記レプリコンが、
ユニバーサルスペーサー配列を含む骨格、
組み込みステップnに特異的な第1の相同性領域HRn、及び第2のユニバーサルな相同性領域uHR、
HRnの隣に位置する第1の切除部位及びuHRの隣に位置する第2の切除部位、
HRnとuHRとの間に位置するドナー核酸DNAn、並びに
ポジティブセレクションマーカー及びネガティブセレクションマーカーを含むダブルセレクションカセット
を含む、前記ステップ、
b)HRn及びuHRが隣接する、ポジティブセレクションマーカー及びネガティブセレクションマーカーを含むダブルセレクションカセットを含む、アセンブリエピソームレプリコンを含む、宿主細胞を提供するステップであって、アセンブリレプリコン内のダブルセレクションカセットが、ドナーレプリコン内のセレクションカセットと異なるマーカーを含む、前記ステップ、
c)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供するステップ、
d)RNAによってガイドされるDNAエンドヌクレアーゼを提供するステップ、
e)第1の切除部位に特異的な配列を含む第1のRNA分子及び第2の切除部位に特異的な配列を含む第2のRNA分子を提供するステップであって、第1及び第2のRNA分子が、切除の際の、RNAによってガイドされるDNAエンドヌクレアーゼの指向に関与する、前記ステップ、
f)宿主細胞において、RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列DNAnの切除を誘導するステップ、並びに
g)インキュベートを行って、切除されたドナー核酸と前記アセンブリレプリコンとの間の組換えを起こし、核酸DNAnを含む第2のアセンブリレプリコンを形成するステップ
を含む、前記方法が提供される。
【0017】
RNAによってガイドされるDNAエンドヌクレアーゼはCRISPR-Casヌクレアーゼであり得、第1のRNA分子は第1の切除部位に特異的なスペーサーを含み得、また、第2のRNA分子は第2の切除部位に特異的なスペーサーを含み得る。CRISPR-CasヌクレアーゼはCas9であり得る。第1のRNA分子及び/又は第2のRNA分子は、エピソームレプリコンによってコードされていてよい。
【0018】
一実施形態では、切除された核酸の各末端は、骨格配列に由来する核酸配列を含む。切除されたドナー核酸は、各末端で、骨格配列に由来する核酸配列の12個、10個、8つ、6つ、4つ、又は2つの塩基対を含み得る。好ましくは、切除されたドナー核酸は、各末端で、骨格配列に由来する核酸配列の6又は5以下の塩基対を含む。
【0019】
一実施形態では、エピソームレプリコンは細菌人工染色体である。エピソームレプリコンは、接合伝達によって宿主細胞に送達され得る。
【0020】
本発明の好ましい態様では、ドナーエピソームレプリコンはドナー宿主細胞内に含まれ、細胞アセンブリレプリコンはレシピエント宿主細胞内に含まれる。ドナー宿主細胞とレシピエント宿主細胞との間の接合で、ドナーエピソームレプリコンがレシピエント宿主細胞に有利に伝達され得る。ドナー宿主細胞は、好ましくは、伝達不可能なF’プラスミドを含み、その結果、F’プラスミドはレシピエント宿主細胞に伝達されない。好ましくは、F’プラスミドは、oriTの欠失によって伝達不可能となっている。ドナーエピソームは伝達可能であり、oriTを有し得る。
【0021】
宿主細胞の選択は、組み換えられたドナーに存在するポジティブセレクションマーカー及びネガティブセレクションマーカー並びにアセンブリレプリコンDNAを利用することを除いて、記載されているように行うことができる。
【0022】
標的核酸は、宿主細胞のゲノムであり得る。宿主細胞は、原核細胞、例えば大腸菌であり得る。
【0023】
一実施形態では、ドナー核酸は相同性領域HRn+1を含み、本方法は、ドナー核酸DNAn+1を含むさらなるドナーエピソームレプリコンを宿主細胞に導入するさらなるステップ(h)、及び宿主細胞における、RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列DNAn+1の切除を誘導するステップ、及びインキュベートを行って、切除されたドナー核酸DNAn+1と前記第2のアセンブリレプリコンとの間の組換えを起こし、核酸DNAn及び核酸DNAn+1を含む第3のアセンブリレプリコンを形成するステップをさらに含む。
【0024】
前記方法ステップは、繰り返し反復することができる。
【0025】
本発明のこの態様で提供されるレプリコンは、核酸配列をアセンブルする方法を記載している前述の態様で使用してもよい。
【0026】
本発明の全ての態様の有利な実施形態では、宿主細胞は、コンピテントなrecA及び/又はrecOを欠いている。好ましくは、宿主細胞は、recAを欠いている(ΔrecA)。
【図面の簡単な説明】
【0027】
【
図1】相同性領域(HR、homology region)に特異的なスペーサーを使用する、大腸菌ゲノムへの約100kbの合成DNAのREXER介在性の組み込みにおけるステップ、及びHR特異的なスペーサーによって指向される切断とユニバーサルスペーサーによって指向される切断との間の関係を示す図である。a:REXERは、ゲノムDNAの置き換え(本明細書で示される)を介するか又はゲノムへの挿入による、ゲノム内への100kbを超える合成DNA(ピンク)の組み込みを可能にする。所望の合成DNAを有する細菌人工染色体(BAC)が、適切にマークされたゲノムを有するコンピテント細胞にエレクトロポレーションされ、この細胞もまた、Cas9タンパク質及びラムダレッド組換え成分をコードするヘルパープラスミドを有する。細胞は次いで、アラビノースで、ヘルパープラスミド遺伝子を発現するように誘導され、再びエレクトロコンピテント化される。HR特異的なスペーサーアレイ(示されているようにプラスミドベースであるか、又は直鎖状DNAとしての)が次いで、細胞にエレクトロポレーションされ、その結果、BACからの、ダブルセレクションカセットとゲノムに対するHRとが隣接する合成DNAのCRISPR/Cas9介在性のインビボ切除が生じる。ラムダレッド組換え機構は次に、HRを使用して、ゲノム内への切除されたDNAの組み込みを指向する。三角は、合成DNAに隣接するHR(灰色の四角)にあるCas9切断部位を示す。+1、青はkan
Rであり、-1、黄色はrpsLであり、+2、緑はcatであり、-2、ピンクはsacBであり、+3、暗い青はtet
Rであり、-3、紫はpheS
*であり、+4、オレンジはamp
Rである。b:これまでに、本発明者らは、組換え対象の遺伝子座に隣接する各HRに特異的なスペーサーRNAを設計した。合成DNAインサートに隣接するBAC配列は、一定のPAM配列(黒の四角)を有する。HR特異的なスペーサーRNAを伴うCas9を指向させることで、HR1及びHR2の末端での合成DNAの正確な切除が可能となる。c:ユニバーサルスペーサーRNAは、Cas9をBAC骨格の定常配列に向かわせる。REXER遺伝子座に依存しない、あらゆるBACのためのユニバーサル切断部位を作成するために、Cas9は、HRのすぐ隣にあるPAM配列に向けられる。これは、切除されたDNA断片の両端に、追加の6bpの非相同配列を付加する。
【
図2-3】ユニバーサルスペーサーでのREXERが大きな合成DNA断片のスカーレスな(scarless)ゲノム組み込みをもたらすことを示す図である。a:大腸菌ゲノムの全合成に使用したBAC骨格。奇数BAC及び偶数BACと呼ばれる2つのBACは、異なるポジティブセレクションカセット及びネガティブセレクションカセットを有し、これによってREXERが繰り返される。本発明者らは、全て奇数のBACのためのユニバーサル1スペーサー及び全て偶数のBACのためのユニバーサル2スペーサーを設計した(表3、並びに配列番号24及び25)。1つのユニバーサルスペーサーRNA(青)は、BAC骨格内の配列を5’からインサートまで標的化する。この配列は両骨格で共通である。ユニバーサルスペーサーRNAは、BAC骨格を3’からインサートまで標的化する。これらの3’配列は2つの骨格で異なり、したがって、2つの異なるスペーサー配列(それぞれ黄色及び赤)を設計した。切断部位は色の付いた三角形で示されており、PAM配列は黒の四角で示されており、セレクションカセットは色の付いた矢印で示されており、そして合成DNAはピンクで示されている。b:5つの遺伝子座での、ユニバーサルスペーサーを使用するREXERの後の5’及び3’ゲノム組み込み部位のゲノタイピングによる検証。5’遺伝子座では、REXERによる置き換えが成功すると、ダブルセレクションカセットがゲノムから除去され、一方で別のダブルセレクションカセットが3’遺伝子座に挿入される。11のREXER後のクローンを各実験でゲノタイピングした。三角形は、REXERの前(白)及び後(黒)の、各遺伝子座での予想されるPCR産物のサイズを示す。c:ユニバーサルスペーサーRNAを使用するREXERの後の組み込み部位の末端の配列検証。HR及び6bpの非相同配列(傾いている箇所)が隣接する切除された合成DNAが、スカーレスな(傷のない)組み込みが期待される配列の上に示されている。5つのREXER後のクローンを各実験でシーケンシングした。本発明者らは、いずれのクローンでも非相同末端の組み込みを観察せず、また、いかなる点変異も現れなかった。色の付いた三角形は、パネルaに記載されているそれぞれのスペーサー配列によるCas9切断部位を示している。d:HR特異的なスペーサー及びユニバーサルスペーサーをそれぞれ用いるREXERのリコードの状況をまとめたものである。本発明者らは、REXERを行って、95.6kbの野生型ゲノムDNAを合成DNA(100k24)で置き換えた。合成DNAは、410のコドンが同義コドンで置き換えられていることを除いて、対応するゲノムDNAに大部分が相同である(非特許文献14)。Cas9切断を、HR特異的なスペーサーRNA又はユニバーサルスペーサーRNAで開始した。10個のREXER後のクローンを各実験でNGSによって完全にシーケンシングした(2つの独立した反復実験から全部で20個)。リコードの状況をまとめたグラフは、各リコードされたコドンが遺伝子座の全体で組み込まれた平均頻度を示している。全体として、ユニバーサルスペーサーRNAを用いたREXERでは、410のコドンの全てが完全に置き換えられた8つのクローンが得られ、一方、HR特異的なスペーサーRNAを用いたREXERでは、この領域で4つの完全にリコードされたクローンが得られた(
図5の個々のクローンのリコードの状況)。
【
図3】強化型組換え(CONEXER、Conjugaion coupled with programmed excision for enhanced recombination)のためのプログラムされた切除と組み合わされた接合を示す図である。エピソーム伝達と、ユニバーサルスペーサーでの合成DNAの切除と、相同性によって導かれる組換えとの組み合わせによって、大規模なゲノム改変及びゲノム合成のための迅速で、単純で、標準化された方法が得られる。a:ユニバーサルスペーサーアレイ(灰色のバー)及びoriT配列(赤の矢印)を有するBACが、伝達不可能なF’プラスミドを利用して、接合伝達を介して1時間にわたり、ドナー細胞からレシピエント細胞に伝達される。レシピエント細胞は、ヘルパープラスミド、及び適切にマークされたゲノムを有している(REXERにおけるように)。BACを得たレシピエント細胞が次いで選択され、+3及び+1の両方についての選択によってドナー細胞が除去される(Cas9及びラムダレッド成分を誘導するためにアラビノースで1.5時間、その後、さらなる発現を停止させるためにグルコースで2.5時間)。-2の喪失についてさらに選択することによって、合成DNAでのゲノムDNAの置き換えが次いで選択される。-3の喪失の選択は、BAC骨格の喪失を確実にする。セレクタブルマーカーは、+1、青、kan
R;-1、黄色、rpsL;+2、緑、cat;-2、ピンク、sacB;+3、暗い青、tet
R;-3、紫、pheS
*である。b:100k24を用いるCONEXERで得られた84個のクローンのリコードの状況をまとめたものである(
図2dに類似)。
【
図5-4】HR特異的なスペーサー及びユニバーサルスペーサーをそれぞれ用いたREXERのリコードの状況をまとめた図である。個々のクローンのリコードの状況が示されている。
【
図6-2】BACの段階的挿入合成(BASIS、BAC Stepwise Insertion Synthesis)を示す図である。BAC内での大きなDNAの繰り返しアセンブリのための、BACの段階的挿入合成(BASIS)。a:ドナーBACは、レシピエントBACに相同なHRn及びuHRを有する。BAC骨格は、oriT及びユニバーサルスペーサーを有する。uHRは、挿入の全ステップでのユニバーサル相同性領域である。HRnは、挿入のn番目のステップに特異的である。BACインサートはHRn+1を有しており、これは、(n+1)番目のステップでのHRnとして機能する。BACは、示されているダブルセレクションカセット、-3、+3を有している。アセンブリBACは、HRn及びuHRが隣接する、示されている異なるダブルセレクションカセット、-1、+1を有している。このDNAインサートはドナーBACから切除され、レシピエント細胞のアセンブリBACに挿入される。緑の三角形は、Cas9切除のための切断部位を示している。本明細書では、HRnはHR1と記載されていることに留意されたい。示されている例では、セレクタブルマーカーは、+1、青、kanR;-1、黄色、rpsL;+3、紫、hygroR;-2、オレンジ、PheS;+4、ペトロール、GentamycinRである。b:BASISのワークフロー。ドナーBACは、接合によって、アセンブリBACを有しCas9及びラムダレッド成分を発現するレシピエント細胞に送達される。(a)に示したように、インサートはドナーBACから切除され、レシピエントBACに挿入される。交互のマーカーセットを使用するこのプロセスの繰り返しによって、n個のDNA断片をアセンブリBACに挿入することが可能となる。c:CFTR遺伝子のセグメントをコードする3つのBACを酵母内でアセンブルした。完全なCFTR遺伝子配列を、繰り返しBASISを介して再構成し、次世代シーケンシング(NGS、next generation sequencing)によって検証した。d:21番染色体の示された領域をカバーするヒトBACを、次に続くアセンブリのための基質として利用した。中間アセンブリ産物及び最終アセンブリ産物をNGSによって検証した。最終的な503KbpのBACは、495KbpのヒトDNAインサートを有していた。このBACは、さらなる繰り返し挿入のための基質として機能し得、そのため、はるかに長いヒトDNAをエピソーム内でアセンブルすることを可能にする。
【
図7】宿主ゲノムからのrecAの欠失が、CONEXER介在性のゲノム置き換えにおける完全にリコードされたクローンの頻度を増大させることを示す図である。a:ゲノム断片100k24のCONEXER介在性の置き換えにおける、完全にリコードされたクローンの頻度の増大についてのKO株のスクリーニングは、recA及びrecOの欠失が合成DNAのインタクトな組み込みを改善することを明らかにしている。b:recAが欠失すると、CONEXER介在性のゲノム置き換えの後の完全にリコードされたクローンの頻度は、全ての試験した断片(100k24~100k28)で増大している。これらの実験で記録されたコロニー形成単位(CFU、Colony forming units)を
図9に示す。
【
図8】連続的なゲノム合成を示す図である。a:接合送達されエピソーム切除された合成DNAは、適切にマークされたゲノム(LS23にある-2/+2)の大きな断片(100k24)を置き換えることにより組み換えられる。選択によって、-2/+2(LS23にある)を喪失し-1/+1(LS24にある)を組み込んだ細胞のみが生存することが確実になる。選択で得られたクローンをプールし、これに、次のラウンドの、CONEXER介在性のゲノム置き換えを行った(100k25)。選択によって、-1/+1(LS24にある)を喪失し-2/+2(LS25にある)を組み込んだ細胞のみが生存することが確実になる。このプロセスを、-1/+1(LS28にある)を有する細胞の集団が得られるまでさらに3回(100k26、100k27、及び100k28)、全部で5回反復した。これらの細胞のサブセットは、500Kbpの領域全体にわたって、連続的に組み込まれた合成DNAを有すると予想される。セレクタブルマーカーは、+1、青、kanR;-1、黄色、rpsL;+2、緑、cat;-2、ピンク、sacBである。b:100k24~100k28の連続的ゲノム合成から得られた182のクローンのリコードの状況をまとめたものである。182個のシーケンシングされたクローンのうち19個が、500Kbpのゲノムセクション全体にわたって完全にリコードされていた。
【
図9】異なるゲノムバックグラウンドでの、CONEXER介在性のゲノム置き換えのためのコロニー形成単位を示す図である。ゲノムセクション100k24のCONEXER介在性の置き換えでのKO株のスクリーニング。各実験で得られたコロニー形成単位(CFU)が示されている。recAの欠失はCFUの低減をもたらす。
【
図10】500Kbpの大腸菌ゲノムの連続的な合成を示す図である。合成DNAでの100Kbpのゲノムセクションの接合強化型の置き換えは、連続的ゲノム合成を可能にする(
図5)。エピソーム切除された合成DNAは、適切にマークされたゲノム(LS23にある-2/+2)の大きなセクション(100k24)を置き換えることにより組み換えられる。選択によって、-2/+2(LS23にある)を喪失し-1/+1(LS24にある)を組み込んだ細胞のみが生存することが確実になる。選択で得られたクローンをプールし、これに、次のラウンドの、CONEXER介在性のゲノム置き換えを行った(100k25)。選択によって、-1/+1(LS24にある)を喪失し-2/+2(LS25にある)を組み込んだ細胞のみが生存することが確実になる。このプロセスを、-1/+1(LS28にある)を有する細胞の集団が得られるまでさらに3回繰り返した(100k26、100k27、及び100k28)。これらの細胞のサブセットは、500Kbpの領域全体にわたって、連続的に組み込まれた合成DNAを有すると予想される。セレクタブルマーカーは、+1、青、kan
R;-1、黄色、rpsL;+2、緑、cat;-2、ピンク、sacBである。CONEXERによる100Kbpを超える合成DNAの組み込みの各ステップは2日間を要する。500Kbpの連続的な合成は、したがって、10日間で行うことができる。
【発明を実施するための形態】
【0028】
先行技術で開示されている方法、例えばREXERには、標的化されている各遺伝子座についてクローニングされるべき相同性領域(HR)特異的なスペーサーの新たなセットが必要である。これらのスペーサーはクローニングが困難であり得、スペーサーのクローニングは、高価で時間のかかるものであり得る。例えば、最近の大腸菌ゲノム合成では、78個の固有のスペーサーのクローニングが必要であった。新たなスペーサーセットの各々は、標的核酸の望ましくない切断を避けるように設計されなくてはならない。加えて、スペーサー配列の変化は切除効率に影響し得、これは、異なる遺伝子座でのREXERの効率の違いの原因であり得る。HR特異的なスペーサーRNAが必要であることはワークフローを複雑にし、REXERのスケーラビリティーを制限し得る。
【0029】
本発明者らは、インサートではなく、エピソームレプリコン骨格内の配列が、エピソームレプリコンからのインサートの切除を指向する(direct)ために使用され得るとすれば、同一のスペーサー対、すなわち「ユニバーサルスペーサー」を使用して、所与のエピソームレプリコン骨格を用いて任意の標的遺伝子座でREXERを行うことができると仮説を立てた。これは、標的核酸、例えば大腸菌ゲノムへの合成DNAの導入を大幅に単純化し、大規模ゲノム改変及び全ゲノム合成のための短時間の方法を可能にする。しかし、これまでの方法は、Cas9のためのスペーサーを使用しており、これは、これらスペーサーがインサート内で特異的に結合していない限り、エピソームレプリコン骨格とインサートとの間の連結の正確な切断を指向することができない。実際、骨格内で結合し、骨格とインサートとの間の連結からの切断部位の距離を最小にする、スペーサーの配置は、各末端での骨格の6つの塩基対が隣接しているインサートの切除をもたらす(
図1c)。これらの6bpの配列は、インサートに相補的な領域に隣接する標的核酸の領域に対して共通して相同ではない。したがって、ユニバーサルスペーサーを使用したREXERの誘導体が機能するかどうか、及びそれが望ましくない挿入又は欠失をもたらすかどうかは不明であった。
【0030】
本明細書で示されるように、本発明者らは、ユニバーサルスペーサーを提供し、これらのスペーサーが標的核酸内への合成DNAのスカーレスな組み込みに使用され得ることを実証している。さらに、本発明者らは、100kbの合成DNAを細胞のゲノムに1日で導入することができる、ゲノムDNAを合成DNAで置き換えるための短時間のプロトコルを開発している。このアプローチは、(Wang et al.(Defining synonymous codon compression schemes by genome recoding, Nature 2016 November 03; 539(7627):59-64, doi:10.1038/nature20124)及び国際公開第2018/020248号パンフレット(これらの各々は参照によって組み込まれる)で開示されているREXERアプローチに基づいている。実施例では、本発明者らは、REXERベースの全ゲノム合成に使用する2つのBAC骨格のためのユニバーサルスペーサーを開発している。
【0031】
これらの実験は、切除された合成DNA上の短い非相同末端の存在が組換え及び組み込み効率を妨げず、スカーレスな組み込みが依然として達成されることを明らかにしている。特定の理論には拘束されないが、本発明者らは、BAC内のDNAの非相同末端が、真核生物のFEN1について記載されているメカニズムと同様に、組換えの前にエキソヌクレアーゼによって、又は組換えの最中にEcoIXなどのフラップエンドヌクレアーゼによって除去され得ることを示唆している。したがって、本発明者らは、切断部位が厳密にドナー核酸とエピソームレプリコンの骨格との間の連結にある必要はないことを発見した。
【0032】
この発見は重要であり、それは、実際の切断部位の両側に隣接する配列の認識が、RNAによってガイドされる多くのDNAエンドヌクレアーゼの要件であるためである。したがって、正確に連結で切断するために、RNAによってガイドされるDNAエンドヌクレアーゼが、エピソームレプリコンの骨格の部分及びドナー核酸の部分を認識することが必要である。本発明者らは驚くべきことに、切除されたドナー核酸が組換えに影響することなく骨格配列の領域を許容し得ることを発見したが、このことは、「切除部位」、すなわち、実際の切断部位及び所要のフランキング配列の組み合わせの全体が骨格配列内に位置することを可能にする。したがって、RNAによってガイドされるDNAエンドヌクレアーゼが、方法のラウンド間で変化するドナー核酸配列のいずれをも認識する必要がないため、プロセスの複雑性が低減する。
【0033】
したがって、本発明の一実施形態では、所望の配列を標的核酸に導入する方法であって、
a)宿主細胞を提供するステップであって、
前記宿主細胞がエピソームレプリコンを含み、
前記エピソームレプリコンが骨格配列及びドナー核酸配列を含み、
前記ドナー核酸配列が、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を順に含み、
骨格配列が、相同組換え配列1の隣に位置する第1の切除部位及び相同組換え配列2の隣に位置する第2の切除部位を含み、
前記宿主細胞が標的核酸をさらに含む、前記ステップ、
b)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供するステップ、
c)RNAによってガイドされるDNAエンドヌクレアーゼを提供するステップ、
d)前記第1の切除部位に特異的な配列を含む第1のRNA分子及び前記第2の切除部位に特異的な配列を含む第2のRNA分子を提供するステップであって、第1及び第2のRNA分子が、切除の際の、RNAによってガイドされるDNAエンドヌクレアーゼの指向に関与する、前記ステップ
e)RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列の切除を誘導するステップ、並びに
f)インキュベートを行って、切除されたドナー核酸と前記標的核酸との間で組換えを起こすステップ
を含む、前記方法が提供される。
【0034】
ステップa)、b)、c)、及びd)は順に行われる必要はなく、また、別々のステップとして行われる必要もない。例えば、RNAによってガイドされるDNAエンドヌクレアーゼは、前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質が提供される前に提供されてよい。エンドヌクレアーゼ及び関連するRNAは、個別に、異なる時点で、及び任意の順序で提供することができる。しかし、切除に必要な全ての成分、例えばエンドヌクレアーゼ及び関連するRNAは、切除の誘導の前に提供される。加えて、核酸の組換えを補助し得る全てのヘルパータンパク質は、組換えを行わせるためのインキュベーションの前に提供される。ステップa)、b)、c)、及びd)は、同時に行ってよい。
【0035】
エピソームレプリコンは骨格配列及びドナー核酸配列を含み、骨格配列はドナー核酸配列とオーバーラップしていない。したがって、定常な骨格配列は、複数の異なるドナー核酸配列の導入に使用することができる。本発明の方法を繰り返すことによって複数のドナー核酸が標的に導入される実施形態では、2つ以上のタイプの骨格配列が使用され得る。例えば、異なるマーカー、例えばセレクションマーカーを含む骨格が使用され得、その結果、所望の配列の成功裏の導入が各ステップで同定され得る。
【0036】
第1及び第2の切除部位は、エピソームレプリコンを切断して、ドナー核酸配列を切除することを可能にする。切除部位は、エンドヌクレアーゼによる認識及び切断に必要な全ての核酸配列を提供し、したがって、切断を生じさせるために、相同組換え配列1又は相同組換え配列2のどの部分も認識されることはない。このことは先行技術(
図1b)と対照的であり、先行技術では、相同組換え配列1及び相同組換え配列2が、切断を可能にするために認識される配列を提供している。
【0037】
切除部位は、ドナー核酸の相同組換え配列に隣接している。好ましくは、各切除部位は相同組換え配列と連続している。このような実施形態では、切除に必要な配列と相同組換え配列との間に塩基対は存在しない。他の実施形態では、1、2、3、又は4塩基対の介在配列が許容され得る。
【0038】
エピソームレプリコンが切断される部位と相同組換え配列との間のいずれの骨格配列も、切除された核酸の一部として存在する。したがって、切除された核酸は、骨格配列の第1の部分、ドナー核酸、及び骨格配列の第2の部分を含み得る。したがって、一実施形態では、切除された核酸の各末端は、骨格配列に由来する核酸配列を含む。
【0039】
骨格配列の第1の部分及び第2の部分は、10、9、8、7、6、又は5以下の塩基対長であり得る。特定の実施形態では、骨格配列の第1及び/又は第2の部分は、6塩基対長である。この実施形態は、切断が、3塩基対のPAMの3塩基対上流を切断し得るCas9によって行われる場合に、特に関連する。
【0040】
本発明の方法は、RNAによってガイドされるDNAエンドヌクレアーゼに第1の切除部位を認識させることに寄与する第1のRNA分子、及びRNAによってガイドされるDNAエンドヌクレアーゼに第2の切除部位を認識させることに寄与する第2のRNA分子の提供を含む。第1及び第2のRNA分子は、全体が骨格配列内に含まれるエピソームレプリコンの領域に特異的である。第1及び第2のRNA分子は、ドナー核酸配列内の配列も相同組換え配列内の配列も認識しない。第1及び第2のRNA分子は、同一の配列のものであっても、異なる配列のものであってもよい。
【0041】
RNAによってガイドされるDNAエンドヌクレアーゼの例は、CRISPR-Casヌクレアーゼである。このような実施形態では、第1のRNA分子は、第1の切除部位に特異的なスペーサーを含み得、第2のRNA分子は、第2の切除部位に特異的なスペーサーを含み得る。本明細書で論じられる通り、第1及び第2のRNA分子のスペーサーは、全体が骨格配列内に含まれるエピソームレプリコンの領域に特異的である。スペーサーがそれに対して特異的であるエピソームレプリコンの領域は、プロトスペーサーと呼ぶことができる。したがって、第1の切除部位は、第1のRNA分子のスペーサーと同族のプロトスペーサー全体を含み、第2の切除部位は、第2のRNA分子のスペーサーと同族のプロトスペーサー全体を含む。第1及び第2のRNA分子のスペーサーは、ドナー核酸配列内の配列も相同組換え配列内の配列も認識しない。第1及び第2のRNA分子のスペーサーは、同一の配列のものであっても、異なる配列のものであってもよい。
【0042】
したがって、切断がCRISPR-Casヌクレアーゼによって行われる実施形態では、切除部位は、スペーサーRNAと同族のプロトスペーサーを含む。切除部位はまた、PAMも含む。
【0043】
特定の実施形態では、第1のRNA分子及び第2のRNA分子は、エピソームレプリコンによってコードされ、骨格配列の一部である。REXERでは、RNA分子は、ドナー核酸配列の相同領域に特異的なスペーサーをコードするが、スペーサー配列は導入対象のドナー核酸配列に応じて変化する必要があるため、スペーサーは、エピソームレプリコンの骨格によってコードされていてはならない。本発明はそのようには限定されておらず、したがって、本方法は、切除を指向するためのRNA分子がドナー核酸配列も含むエピソームレプリコンによってコードされ得るため、短時間になり得る。このことは、関連するスペーサーが各骨格によって直接コードされ得るため、2以上のタイプの骨格配列が使用される繰り返し方法にとって特に有利である。
【0044】
一部の実施形態では、核酸の組換えを補助し得るヘルパータンパク質、並びに/又は、第1及び/若しくは第2の切除部位を切断し得る少なくとも1つのエンドヌクレアーゼは、エピソームレプリコン上でコードされる。一部の実施形態では、核酸の組換えを補助し得るヘルパータンパク質、並びに/又は、第1及び/若しくは第2の切除部位を切断し得る少なくとも1つのエンドヌクレアーゼは、個別のエピソームレプリコン、例えばプラスミド上でコードされる。この個別のエピソームレプリコンは、ヘルパーエピソームレプリコン又はヘルパープラスミドとして公知であり得る。
【0045】
特定の実施形態では、方法であって、
1)宿主細胞を提供するステップであって、
前記宿主細胞がエピソームレプリコン、例えばBACを含み、
前記エピソームレプリコンが骨格配列及びドナー核酸配列を含み、
前記ドナー核酸配列が、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を順に含み、
骨格配列が、相同組換え配列1の隣に位置する第1の切除部位及び相同組換え配列2の隣に位置する第2の切除部位を含み、第1の切除部位が第1のプロトスペーサーを含み、第2の切除部位が第2のプロトスペーサーを含み、
前記宿主細胞が標的核酸、例えば宿主細胞のゲノムをさらに含む、前記ステップ、
2)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供するステップ、
3)CRISPR-Casヌクレアーゼ、例えばCas9ヌクレアーゼを提供するステップ、
4)第1のプロトスペーサーに特異的なスペーサーを含む第1のRNA分子、及び第2のプロトスペーサーに特異的なスペーサーを含む第2のRNA分子を提供するステップ、
5)CRISPR-Casヌクレアーゼによる前記ドナー核酸配列の切除を誘導するステップ、並びに
6)インキュベートを行って、切除されたドナー核酸と前記標的核酸との間で組換えを起こすステップ
を含む方法が提供される。
【0046】
ステップ1)、2)、3)、及び4)は順に行われる必要はなく、また、別々のステップとして行われる必要もない。例えば、CRISPR-Casヌクレアーゼは、前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質が提供される前に提供されてよい。加えて、CRISPR-Casヌクレアーゼ並びに第1及び第2のRNA分子は、個別に、異なる時点で、及び任意の順序で提供することができる。しかし、切除に必要な全ての成分は、切除の誘導の前に提供される。加えて、核酸の組換えを補助し得る全てのヘルパータンパク質は、組換えを行わせるためのインキュベーションの前に提供される。ステップ1)、2)、3)、及び4)は、同時に行ってよい。
【0047】
エピソームレプリコンは、接合によって宿主細胞に提供され得る。したがって、本方法は、接合伝達によってエピソームレプリコンを宿主細胞に送達するステップをさらに含み得る。エピソームレプリコン、例えばBACは、伝達のためのドナー細胞に含まれていてよい。エピソームレプリコンは、伝達開始点(oriT)を含み得る。ドナー細胞は、伝達不可能なF’プラスミドを含み得る。
【0048】
本発明の方法は、大きな合成核酸配列をアセンブルするための繰り返しに特に適している。例えば、人工ゲノムの構築のためである。したがって、本発明の一態様では、核酸配列をアセンブルする方法であって、
(i)本発明の任意の方法のステップを行って、第1のドナー核酸配列を第1の標的核酸に導入して、第2の標的核酸を作製する工程、及び
(ii)本発明の任意の方法のステップを行って、第2のドナー核酸配列を第2の標的核酸に導入して、第3の標的核酸を作製する工程
を含む方法が提供される。
【0049】
パート(i)及び(ii)は複数回繰り返してもよい。これによって、第1のドナー核酸、第2のドナー核酸、第3のドナー核酸、及び潜在的にさらなるドナー核酸の導入が可能となる。この技術が繰り返されると、本発明の方法の1ラウンドの産物が次のラウンドの核酸導入のための標的核酸配列として機能し得る。
【0050】
第1のRNA分子は、本発明の方法の各繰り返しの間、同一の配列のものであり得、及び/又は、第2のRNA分子は、本発明の方法の各繰り返しの間、同一の配列のものであり得る。或いは、第1のRNA分子対及び第2のRNA分子対は、本発明の繰り返しの間、交互の様式で使用され得、その結果、第1の対は全ての奇数の繰り返しに使用され、第2の対は全ての偶数の繰り返しに使用される。第1のRNA分子対は、第2のRNA分子対と同一の配列のものであってよい。第1のRNA分子対は、第2の対にあるRNA分子と同一の1つのRNA分子と、第2の対にあるRNA分子と配列が異なる1つのRNA分子とを含んでいてよい。第1のRNA分子対は各々、第2の対のRNA分子の各々と配列が異なっていてよい。
【0051】
他の実施形態では、さらなるRNA分子対、例えば第3の対が、繰り返しのパターンの一環として使用され得る。したがって、本方法は、パート(i)、(ii)、及び(iii)を繰り返すステップであって、パート(iii)が、本発明の任意の方法のステップを行って、第3のドナー核酸配列を第3の標的核酸に導入し、それによって第4の標的核酸を作製する工程を含み、パート(iii)が、第3のRNA分子対の使用を含む、ステップをさらに含み得る。このパターンは必要に応じて延長してもよい。
【0052】
エピソームレプリコンの骨格配列は、パート(i)の間及びパート(ii)の間で異なっていてよい。例えば、エピソームレプリコンは、所望の配列の成功裏の導入の同定又は選択を可能にするための1つ又は複数のマーカーを含み得る。同定又は選択を含む核酸導入のラウンドを可能にするために、パート(i)のエピソームレプリコンは第1のマーカー又はマーカーセットを含み得、パート(ii)のエピソームレプリコンは第2のマーカー又はマーカーセットを含み得る。パート(i)及び(ii)が繰り返される実施形態では、これは、第1のマーカー又はマーカーセットが全ての奇数の選択に使用され、第2のマーカー又はマーカーセットが全ての偶数の選択に使用されることを意味し得る。他の実施形態では、さらなるマーカー、例えば第3のマーカー又はマーカーセットが、繰り返しのパターンの一環として使用され得る。選択を可能にするためには、核酸導入の各ラウンドのための1又は複数のマーカーは、前のラウンドで使用された1又は複数のマーカーと異なっていなくてはならない。
【0053】
パート(i)の間のエピソームレプリコンの骨格配列は、第1のマーカー又はマーカーセットを含む第1の骨格配列であり得、本明細書で記載される第1のRNA分子対をコードし得る。パート(ii)の間のエピソームレプリコンの骨格配列は、第2のマーカー又はマーカーセットを含む第2の骨格配列であり得、本明細書で記載される第2のRNA分子対をコードし得る。このパターンは繰り返しの間維持され得、その結果、第1の骨格配列は全ての奇数の繰り返しの間に存在し、第2の骨格配列は全ての偶数の繰り返しの間に存在する。繰り返しのパターンはまた、さらなるマーカー又はマーカーセットを含み、さらなるRNA分子対をコードする、さらなる骨格配列、例えば第3の骨格配列を含んでいてもよい。第1のマーカー又はマーカーセット及び第2のマーカー又はマーカーセットは互いに異なり、その結果、組換えのラウンドの際に各成功裏の核酸導入の選択が可能となる。各骨格配列によってコードされるRNA分子は、コードしている骨格の切断を可能にする。
【0054】
さらなる態様において、CONEXER用に確立された原理は、大腸菌のエピソームへのメガベースのDNAの繰り返し挿入を介して、スカーレスなアセンブリ及びクローニングの実現に拡張することができる。本発明はしたがって、その中にDNAを繰り返し挿入しアセンブルするためのアセンブリエピソームレプリコンに関する(
図6a)。実施形態では、このレプリコンは、次の挿入配列の一方の末端に相同なおよそ50bpの配列(HR1)を有する。このすぐ後には、ポジティブセレクションカセット及びネガティブセレクションカセット、並びに、挿入対象の配列の他方の末端に相補的なユニバーサル相同性領域(uHR)が続く。10の数乗kbの配列ほどに長い、より長い相同性もまた、利用することができる。
【0055】
本発明はまた、ユニバーサルスペーサー及びoriTを有する、CONEXER骨格を有するドナーエピソームレプリコンも提供する(
図6a)。ドナーレプリコンにおいて、HR1は、レシピエントBACに挿入される次のDNA配列の一方の末端内にある。このDNA配列の後には、異なるポジティブセレクションカセット及びネガティブセレクションカセット及びユニバーサル相同性領域が続く。各アセンブリステップ(
図6a、b)は、アセンブリレプリコンを有するレシピエント細胞へのドナーレプリコンの接合、ドナーレプリコンからのHR1からuHRまでの配列のヌクレアーゼ介在性の切除、及びアセンブリレプリコンへのこの配列の組換え介在性の挿入によって進められる。アセンブリレプリコン上でのネガティブセレクションマーカーの喪失、及びドナーレプリコンから切除された配列からのポジティブマーカーの獲得についての選択は、挿入が正確なアセンブリレプリコンを有する細胞を選択する。新たなアセンブリレプリコンを有する細胞は、次の挿入ステップのためのインプットを提供する。このアプローチは、BACの段階的挿入合成(BASIS)と名付けられた。
【0056】
したがって、本発明のさらなる態様では、複数のアセンブリステップを含む、エピソームレプリコンを構築するための方法であって、ステップnが、
a)ドナーエピソームレプリコンを提供するステップであって、前記レプリコンが、
ユニバーサルスペーサー配列を含む骨格、組み込みステップnに特異的な第1の相同性領域HRn、及び第2のユニバーサルな相同性領域uHR、HRnの隣に位置する第1の切除部位、及びuHRの隣に位置する第2の切除部位、
アセンブリステップn+1に特異的な相同性領域HRn+1を含むドナー核酸DNAn、
ポジティブセレクションマーカー及びネガティブセレクションマーカーを含むダブルセレクションカセット
を含む、前記ステップ、
b)HRn及びuHRが隣接する、ポジティブセレクションマーカー及びネガティブセレクションマーカーを含むダブルセレクションカセットを含む、アセンブリエピソームレプリコンを含む宿主細胞を提供するステップであって、アセンブリレプリコン内のダブルセレクションカセットが、ドナーレプリコン内のセレクションカセットと異なるマーカーを含む、前記ステップ、
c)前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供するステップ、
c)RNAによってガイドされるDNAエンドヌクレアーゼを提供するステップ、
d)第1の切除部位に特異的な配列を含む第1のRNA分子及び第2の切除部位に特異的な配列を含む第2のRNA分子を提供するステップであって、第1及び第2のRNA分子が、切除の際の、RNAによってガイドされるDNAエンドヌクレアーゼの指向に関与する、前記ステップ、
e)宿主細胞において、RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列DNAnの切除を誘導するステップ、並びに
f)インキュベートを行って、切除されたドナー核酸と前記アセンブリレプリコンとの間の組換えを起こし、核酸DNAnを含む第2のアセンブリレプリコンを形成するステップ
を含む、前記方法が提供される。
【0057】
ドナー核酸を有するアセンブリレプリコンは次に、第2のステップのアセンブリレプリコンとして使用することができ、この場合、相同性領域HRn+1及びuHR並びに第2のドナー核酸DNAn+1を含む第2のドナーレプリコンは、第1のステップで生じたアセンブリレプリコンに第2のドナー核酸を導入するために利用される。
【0058】
交互のポジティブセレクションマーカー及びネガティブセレクションマーカーのセットによって、無数のステップを繰り返し行うことが可能となり、任意の所望のサイズのエピソームレプリコンがアセンブルされる。好ましくは、行われるステップの数は、少なくとも2つ、及び100個以下、50個以下、25個以下、最も好ましくは約10個、9つ、8つ、7つ、6つ、又は5つであり得る。
【0059】
アセンブルされるレプリコンのサイズは、好ましくは1~100Mbの間である。好ましくは、このサイズは、2~50Mb、3~25Mb、4~15Mb、又は5~10Mbである。
【0060】
したがって、一実施形態では、本発明は、ドナー核酸DNAn+1を含むさらなるドナーエピソームレプリコンを宿主細胞に導入するステップ、及び宿主細胞において、RNAによってガイドされるDNAエンドヌクレアーゼによる前記ドナー核酸配列DNAnの切除を誘導するステップ、及びインキュベートを行って、切除されたドナー核酸DNAn+1と前記アセンブリレプリコンとの間の組換えを起こし、核酸DNAn及び核酸DNAn+1を含む第2のアセンブリレプリコンを形成するステップをさらに含む、本発明の上記の態様の方法を行う工程を含む。
【0061】
本発明のこの実施形態のステップを繰り返し行って、ドナー核酸DNAn+2、n+3、n+4などをアセンブリエピソームレプリコンに挿入してもよい。
【0062】
BASISは、連続的ゲノム合成(CGS、continuous genome synthesis)に有用なエピソーム又は他のDNAベクター又はセグメントを作製するために使用することができる。BASISはまた、それ自体、連続的ゲノム合成(CGS)を進めるために、エピソーム、ゲノム、細菌、又は他の遺伝子及びDNAを問わず人工DNAの連続的な産生のために、シーケンシングステップを伴わずに連続的に適用することができる。本発明者らはまず、BASISによる208Kbpのヒト嚢胞性線維症膜貫通調節因子遺伝子のアセンブリを実証した。CFTR遺伝子を、3ステップのBASISで、およそ70Kbpの遺伝子断片を有するドナーBACSとアセンブルした。
【0063】
BASISは、エクソン領域、イントロン領域、及び遺伝子間領域を含むヒトゲノムDNAの大きなセクションを1つのエピソームにアセンブルするために使用することができる。
【0064】
1つのCONEXERに由来するクローンのシーケンシングされていないプールを次のCONEXERのためのインプットとして直接使用することによって、CONEXERの迅速な繰り返しを可能にするために、各クローンを検証するためのシーケンシングステップを取り除くことが望ましい。したがって、CONEXERの1つのステップでゲノムDNAが合成DNAで完全に置き換えられているクローンの画分を実質的に増大させる因子を調べた。
【0065】
recA及びrecOの両方が、完全に合成の配列を有するクローンの画分を増大させる因子として同定されている(
図7a、
図9)。recAの欠失(ΔrecA)は、100k24では、完全に合成のDNAの画分を20%からおよそ80%まで増大させた(
図7a)。いくつかの他の100Kbpの領域で同様の劇的な増大が見られ、これらの所見の普遍性を裏付けている(
図7b)。
【0066】
連続的ゲノム合成は、1ラウンドのCONEXERから得られたアウトプットを、個々の完全にリコードされたクローンをシーケンシングによって同定することは伴わずに、次のラウンドのCONEXERのためのインプットとして直接使用することによって、行うことができる。
【0067】
したがって、本発明の態様で使用される宿主細胞は、有利には、コンピテントなrecA及び/又はrecOを欠いている。好ましくは、宿主細胞は、recAを欠いている(ΔrecA)。
【0068】
エピソームレプリコン
本発明の実施形態は、ドナー核酸配列を含むエピソームレプリコンを含む。ドナー核酸はDNAであり得る。
【0069】
「エピソーム」という用語は、当技術分野におけるその通常の意味を有し、例えば、自律的に存在し得るか又は染色体と共に組み込まれ得る任意のアクセサリー染色体外複製遺伝子エレメントである。
【0070】
エピソームレプリコンは、前記宿主細胞内で機能し得るそれ自体の複製起点を有する、エピソーム性の核酸である。
【0071】
エピソームレプリコンは、プラスミドであり得る。プラスミドは、小さな環状核酸(一般にはDNA、最も一般には二本鎖DNA)分子を意味する。細胞内のプラスミドは、DNAなどのあらゆる染色体核酸から物理的に離れており、独立して複製することができる。プラスミドについては、「小さな」は、それらが典型的には10kbを越える大きさではないことを意味する。適切には、本発明で有用なプラスミドは、以下の遺伝子エレメントを有する:宿主細胞と同族の複製起点、及び少なくとも1つのセレクションマーカー。
【0072】
エピソームレプリコンは、BACであり得る。BACは、以下の遺伝子エレメントを含み得る:宿主細胞に同族の複製起点、及び少なくとも1つのセレクションマーカー。
【0073】
BAC及びプラスミドは、それらの複製起点が互いに異なる。BACは特別な複製起点を有し、これは、典型的には、BACを各細胞内で1つのコピーとし、また、BACがより大きなサイズ(最大数百kb)を維持することを助ける。プラスミドはプラスミド複製起点を有し、これは、典型的には、プラスミドを各細胞内で複数のコピーとし(細胞当たり数コピーから数百コピーの範囲)、典型的には最大およそ10kbのサイズにする。
【0074】
エピソームレプリコンは、酵母人工染色体(YAC、yeast artificial chromosome)であり得る。YACは、以下の遺伝子エレメントを含み得る:宿主細胞に同族の複製起点、及び少なくとも1つのセレクションマーカー。
【0075】
同一の細胞内で同一の単一の核酸に対して活性な複数の複製起点は、通常望ましいものではない。このことは、例えば、マルチコピーエピソーム核酸、例えばプラスミドがドナー核酸を有している場合に特に当てはまり、このシナリオでは、プラスミドの複製起点を(例えば)BAC又は宿主ゲノムに組み込むことは明らかに望ましくない。したがって、適切には、前記切除された直鎖状ドナー核酸は、複製起点を含まない。適切には、標的核酸配列は複製起点を含む。
【0076】
適切には、ドナー配列を有するエピソームレプリコン上の複製起点は、宿主、例えば全ての原核生物宿主と適合しなくてはならない。適切には、標的を含むエピソームレプリコン上及びドナー配列を含むエピソームレプリコン上の複製起点は、宿主、例えば全ての原核生物宿主と適合しなくてはならない。
【0077】
適切には、ドナー配列を有するエピソームレプリコンは、原核生物複製起点を有する。適切には、標的配列を含むレプリコンは、原核生物複製起点を有する。適切には、標的配列を含むレプリコンはエピソームレプリコンであり、原核生物複製起点を有する。適切には、宿主細胞は原核生物宿主細胞である。適切には、合成ゲノムは合成原核生物ゲノムである。
【0078】
標的核酸
標的核酸は、ドナー核酸配列の導入に適切な任意ものであり得る。特に、標的核酸は、ドナーDNA分子の導入に適切なDNA分子であり得る。
【0079】
標的核酸は、相同組換え配列1及び相同組換え配列2を含み得る。標的核酸は1又は複数のセレクションマーカーを含み得、当該セレクションマーカーには相同組換え配列が隣接していてよい。例えば、標的核酸はネガティブセレクションマーカーを含み得る。
【0080】
標的核酸は、宿主細胞内で機能し得るそれ自体の複製起点も有する核酸領域であり得る。標的核酸はプラスミドであり得る。標的核酸はBACであり得る。標的核酸はYACであり得る。特定の実施形態では、標的核酸は宿主細胞のゲノムである。
【0081】
本発明がゲノムに適用される場合、適切には、ゲノムは非ヒトゲノムであり、適切には非哺乳動物ゲノムである。適切には、ゲノムは原核生物ゲノムであり、適切には細菌ゲノムである。特に、ゲノムは大腸菌ゲノムであり得る。
【0082】
特定の実施形態では、ドナーDNA分子を含むエピソームレプリコンはBACであり、標的核酸は大腸菌細胞のゲノムである。
【0083】
相同組換え
理論上は、任意のヌクレオチド配列を相同組換え配列のための部位として選択することができる。
【0084】
相同組換えのためのヌクレオチド配列は固有であり得る。例えば、相同組換えのためのヌクレオチド配列は、ドナー配列をその中で組み換えるための標的配列内で固有であり得る。他の実施例では、相同組換え配列1及び/又は相同組換え配列2は、ドナー配列をその中で組み換えるための標的配列内で固有であり得る。
【0085】
或いは、相同組換え配列1及び/又は相同組換え配列2は、ドナー配列をその中で組み換えるための標的配列内で固有でなくてもよい。このような実施例では、所望の部位への所望の配列の成功裏の導入を同定するために選択が使用され得る。例えば、オフターゲット組み込みは、ネガティブセレクションマーカーの除去若しくは破壊を生じさせないか、又はオフターゲット組み込みは、導入部位で誘導された二本鎖切断を修復しない。
【0086】
適切には、相同組換えのための配列は、非反復的である。
【0087】
適切には、相同組換えのための配列は、少なくとも30ヌクレオチド長である。30ヌクレオチド程の短い相同組換え配列は、低い効率をもたらし得る。したがって、高い効率のためには、適切には、相同組換え配列は、少なくとも40ヌクレオチド長、適切には少なくとも50ヌクレオチド、適切には50~100ヌクレオチド、最も適切には50~65ヌクレオチドである。
【0088】
相同組換えのための配列は標的配列に応じて選択され、ドナー配列に導入される。したがって、ドナー配列上の相同組換え配列1(HR1)及び相同組換え配列2(HR2)は、標的配列上のHR1及びHR2に対して100%の配列同一性を示す。
【0089】
ラムダレッド組換えの使用によって、上記で概説したように、短いヌクレオチド配列を相同組換えに使用することが可能となる。他の組換え補助システムを使用してもよい。例えば、RecBCDシステムが使用され得る。RecBCDシステムが使用される場合、適切には、「前記宿主細胞における核酸の組換えを補助し得るヘルパータンパク質を提供する」ステップは、宿主細胞内でのRecBCDシステムの発現を誘導する又は可能にすることからなる。
【0090】
RecBCDシステム又は他の組換え補助システムを使用する場合、当業者は、相同組換えに選択された配列に対するこれらのシステムの要件に注意を払うことになる。例えば、RecBCDシステムは、3~10kb長などの、より長い相同組換え配列を必要とし得る。
【0091】
より詳細には、RecBCDは、3つの成分RecB、RecC、及びRecDからなる天然の大腸菌組換えシステムである。3つのサブユニットは、大腸菌における形質導入及び接合の過程の間の相同組換えと二本鎖切断の修復との両方に必須の、ATP依存性ヘリカーゼ/ヌクレアーゼ複合体を形成している。大腸菌DNAにおいて二本鎖切断をインビボで誘導する研究は、二本鎖切断の修復(DSBR、double-strand break repair)が2つの組換え経路の一方を介して進み得ることを示している。どちらの経路もRecBCD及びRecAを必要とするが、一方はリゾルバーゼ酵素RuvABCに依存し、その一方で、他方はリゾルバーゼ酵素RuvABCに依存せず、その代わりにRecGに依拠する。recB遺伝子及びrecD遺伝子はオペロンを形成し、一方、recCはすぐ近くに位置しているが、それ自体のプロモーターを有している。3つの遺伝子産物は、エキソヌクレアーゼVとしても公知のヘテロトリマーを形成する。何らかのさらなるガイダンスが必要なケースでは、詳細は、例えば大腸菌のK12-MG-1655株についての、「RecBCD」という公開されているEcoCycデータベースで見ることができる(Keseler et al. (2013), “EcoCyc: fusing model organism databases with systems biology”, Nucleic Acids Research 41: D605-12)。
【0092】
したがって、この実施形態に従って組換えを補助するためには、少なくともRecBCDが宿主細胞で発現されるべきである。
【0093】
RecAもまた必要であり得る。したがって、さらに適切には、この実施形態に従って組換えを補助するためには、少なくともRecBCD及びRecAが宿主細胞で発現されるべきである。最も適切には、この実施形態に従って組換えを補助するためには、RecBCD及びRecAが宿主細胞で発現されるべきである。
【0094】
ラムダレッドシステムに代わる別の代替は、RecETシステムである。RecE及びRecTは、ファージ由来の大腸菌遺伝子である。RecEはラムダレッドアルファを模倣し、RecTはラムダレッドベータを模倣する(Muyrers, J.P., Zhang, Y., Buchholz, F. & Stewart, A. F. RecE/RecT and Redalpha/Redbeta initiate double-stranded break repair by specifically interacting with their respective partners. Genes Dev. 14, 1971-1982 (2000))。RecETの組み合わせは、ラムダレッドアルファ/ベータの組み合わせよりも比較的良く機能する。ラムダレッドアルファ及びベータは、組換えを実行する実際の成分であり、一方、ラムダレッドガンマは、RecBCDシステムの阻害剤である。
【0095】
適切には、組換えの補助は、ラムダレッドシステムを介して、例えば、Gene Bridges社から市販されているpRed/ETプラスミドから提供される(Gene Bridges GmbH社、Im Neuenheimer Feld 584、69120、ハイデルベルク、ドイツの「Quick & Easy E. coli Gene Deletion Kit」)。
【0096】
この設定のこのシステムは、ここで参照によって特にラムダレッドシステムの詳細について本明細書に組み込まれる、Datsenko et al 2000 (Datsenko K. A. & Wanner, B. L. One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc. Natl. Acad. Sci. U.S.A. 97, 6640-6645 (2000))で最初に記載されている。
【0097】
本発明者らは、pRed/ETプラスミドが、Datsenko et al 2000におけるpKD46プラスミドに基づいており(配列同一性によって判断された)、したがって、pKD46プラスミドがラムダレッドシステムの構築のためにPCRを行うための鋳型として使用され得ることを教示する。
【0098】
核酸の組換えを補助し得る前記ヘルパータンパク質がラムダレッドタンパク質を含む場合、適切には、以下のタンパク質が前記宿主細胞で発現される:
【表1】
【0099】
相同組換え配列
相同組換え配列を選択するために、以下のステップを使用することができる:
- 細菌のゲノム又はプラスミド骨格などの改変対象の核酸(標的核酸)の配列内の所望の位置にある50~100ヌクレオチドを選択する。
- 標的核酸に対する選択された配列のBLASTサーチを行う。
- BLASTサーチでの最も近いマッチと比較した、選択された配列のE値を考慮する。典型的には、10-20を超える、標的核酸のどこかにある望ましくない標的部位と比較したE値は、高すぎることになる。これが見つかったら、適切には、別の相同組換え配列が選択される。
【0100】
適切には、標準的なBLASTツールが、相同組換え(HR、homologous recombination)配列のE値の計算に使用される。1つのこのようなオンラインツールは、http://biocyc.org/ECOLI/blast.htmlにある。適切には、E値によって判断したところ所与のHR配列がいかに固有であるかということに焦点が当てられる。適切には、親和性を考慮する/計算する必要はない。原理的には、従来の組換えで機能し得る全ての配列は、本発明でより良好に機能する。
【0101】
より詳細には、HR配列が従来の組換えで機能し得るなら、これらは、本発明でより良好に機能する。適切には、本発明のためのHR配列は、ラムダレッドシステムを使用する従来の組換えについての正確な原理及び要件に従って選択される。例えば、本発明者らは、典型的には、50~70bp長のHRを設計し、10-20未満の予想値について、大腸菌ゲノムに対してblastを行う。(所与の配列がいかに固有であるかの測定値であるE値;E値が小さいほど配列は固有である。計算のための任意の適切なツール、例えば、HR配列のE値を計算するための標準的なBLASTツールを使用することができる。1つのこのようなオンラインツールは、http://biocyc.org/ECOLI/blast.htmlにある)。10-20のE値よりも小さい値は不要であると予想されるが、当然のことながら、値が小さい配列も依然として本発明では有用である。
【0102】
E値は、所与の配列がいかに固有であるかの測定値である。従来の組換えは相同領域の特異性にのみ依拠しているため、これは、10-20などの、比較的ストリンジェントなE値のカットオフを必要とする。本発明の方法は、相同領域の特異性によるのみではなく、同時のネガティブセレクションマーカーの喪失及びポジティブセレクションマーカーの獲得によっても、遺伝子座の特異性を高めることができるため、本方法は、原理上は、あまりストリンジェントではないE値(例えば、あまりストリンジェントではない相同性領域)を許容し得る。しかし、実際には、ストリンジェントなE値を有する相同性領域を作成することは非常に簡単であり、したがって、適切には、10-20のE値カットオフが使用される。
【0103】
セレクタブルマーカー
本発明の方法のいずれも、ドナー核酸が標的核酸に組み込まれている組換え体を選択するさらなるステップを含み得る。このステップは、組換えを引き起こすための誘導ステップの後に行われる。
【0104】
所望の配列は、ポジティブセレクタブルマーカーを含み得る。このようなマーカーとしては、マーカーを含む細胞の同定又は選択を可能にする任意のマーカーが含まれる。
【0105】
標的核酸は、5’-相同組換え配列1-ネガティブセレクタブルマーカー-相同組換え配列2-3’を順に含み得る。
【0106】
前記ドナー核酸が前記標的核酸に組み込まれている組換え体の選択は、ドナー核酸のポジティブセレクタブルマーカーの獲得及び標的核酸のネガティブセレクタブルマーカーの喪失の選択を含み得る。適切には、ドナー核酸のポジティブセレクタブルマーカーの獲得及び標的核酸のネガティブセレクタブルマーカーの喪失の選択は、同時に行われる。他の実施形態では、組換え体を選択するステップは、ポジティブマーカー及びネガティブマーカーの連続的な選択、又はネガティブマーカー及びポジティブマーカーの連続的な選択を含む。
【0107】
所望の配列は、ポジティブセレクタブルマーカー及びネガティブセレクタブルマーカーの両方を含み得る。
【0108】
本発明の方法は、
標的核酸配列内で少なくとも1つの二本鎖切断を誘導するステップであって、前記二本鎖切断が前記相同組換え配列1と前記相同組換え配列2との間にある、ステップをさらに含み得る。
【0109】
適切には、少なくとも2つの二本鎖切断が標的核酸配列内で誘発され、各前記二本鎖切断は、前記相同組換え配列1と前記相同組換え配列2との間である。
【0110】
エピソームレプリコンは、ドナー核酸配列に依存しないネガティブセレクタブルマーカーを含み得る。適切には、前記方法は、ドナー核酸配列に依存しない前記ネガティブセレクタブルマーカーの喪失について選択することによる、エピソームレプリコンの喪失について選択するさらなるステップを含む。
【0111】
本発明の一部の方法は、ポジティブマーカーとネガティブマーカーの喪失とを伴うコンビナトリアル選択アプローチを含む。この「ダブルセレクション」スキームの使用は、実際、部位特異性にも役立つ。例えば、組換えイベントが不適切な部位で起こると、ポジティブセレクタブルマーカーが獲得され得る。しかし、ポジティブマーカーとネガティブマーカーの喪失との同時の選択を使用することによって、核酸が不適切な部位で標的核酸に組み込まれていても(これによってポジティブマーカーが付与される)、このような分子は依然として選択されず、それは、これら分子が不適切な部位に組み換えられていれば、これら分子はネガティブマーカーの喪失を同時には生じさせないためである。したがって、それ自体で有用な選択であることと同時に、これは実際、ドナー配列の獲得だけではなく、除去される/置き換えられる配列の同時の欠失も選択することによって、部位特異性において補助するという技術的利益をも付加する。
【0112】
適切なセレクタブルマーカーの例を、以下の表(表2)に示す。さらに、任意の適切な抗生物質マーカーを使用してもよい。このような抗生物質マーカーの例としては、TetR、AmpR、HyR、及びErmRが含まれ、これらは、テトラサイクリン耐性、アンピシリン耐性、ハイグロマイシン耐性、又はエリスロマイシン耐性をそれぞれ含む選択スキームを可能にする。
【表2】
【0113】
したがって、一実施形態では、ネガティブセレクタブルマーカーは、sacB(ショ糖感受性)及びrpsL(S12リボソームタンパク質-ストレプトマイシン感受性)からなる群から選択される。一部の実施形態では、ポジティブセレクタブルマーカーは、CmR(クロラムフェニコール耐性)及びKanR(カナマイシン耐性)からなる群から選択される。
【0114】
二本鎖切断の切除/導入
本発明の方法は、二本鎖切断を切除/導入するためのメカニズムを含む。適切には、切除は、直鎖状ドナー核酸を生じさせるために行われる。
【0115】
特定の実施形態では、システムは、CRISPR/Cas9システムである。しかし、この機能をもたらす他のシステムも公知である。
【0116】
例えば、オリジナルのストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のCRISPR/Cas9に代わる代替的なRNAによってガイドされるエンドヌクレアーゼについて、3つの公開された論文が存在する(Ran, F. A. et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191 (2015)、Zetsche, B. et al. Cpfl is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Cell 163, 759-771 (2015)、Lee, C. M., Cradick, T. J. & Bao, G. The Neisseria meningitidis CRISPR-Cas9 System Enables Specific Genome Editing in Mammalian Cells. Mal. Ther. 24, 645-654 (2016))。これらは全て、本発明でのインビボ切除をガイドするために使用することができる。これらの参考文献は、本明細書で使用される二本鎖切断/切除の導入のための代わりのシステムについての教示について、参照することによって具体的に本明細書に明確に組み込まれる。
【0117】
CRISPR/Cas9配列
CRISPR/Cas9システムは、Jiang et al 2013 (Jiang, W., Cox, D., Zhang, F., Bikard, D. & Marraffini, L.A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature Biotechnology 31, 233-239 (2013))において記載されている。
【0118】
概略では、ガイドRNAは、tracrRNAとスペーサーRNAとの間の単一の融合RNAを指す。適切には、本明細書で論じられる通り、一定のtracrRNAと異なるスペーサーRNAとの組み合わせが本発明で使用される。これらのtracrRNAスペーサーRNAの組み合わせは、複数の異なるガイドRNAで置き換えられていてもよい。
【0119】
当技術分野では、ガイドRNAは、1つのRNAとしての、tracrRNAとスペーサーRNAとの融合体のみを指し、tracrRNAとスペーサーRNAとの二重RNA複合体は意味しない。
【0120】
PAMは、プロトスペーサー隣接モチーフ(protospacer adjacent motif)を表す。これは、典型的には、3ヌクレオチドのモチーフである。典型的なガイドRNAは、30ヌクレオチド長である。ガイドRNAは、典型的には、27ヌクレオチドの標的配列及び3ヌクレオチドのPAM配列を含む。
【0121】
適切には、Jiang et al 2013と同一の、個別のtracrRNA/スペーサーRNAのCRISPR設定を、本発明で使用してよい。或いは、例えば当技術分野で公知の、1つのガイドRNA CRISPR設定を使用してもよい(Le Cong et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013)、Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013)を参照されたい)。
【0122】
CRISPR/Cas9を使用する場合に切除を補助するためには、適切には、核酸切除を補助し得るヘルパータンパク質は、最低でも、関連するRNA(スペーサーRNAガイド、tracrRNA(以下を参照されたい))と共に、Cas9(例えば、以下を参照されたい)及びRNAseIII(例えばrnc、EcoCycの受託ID EG10857)を含む。
【0123】
典型的な配列を以下に示す。
Cas9(配列番号10)
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
tracrRNA(配列番号11)
AAAAAGTTTAAATTAAATCCATAATGATTTGATGATTTCAATAATAGTTTTAATGACCTCCGAAATTAGTTTAATATGCTTTAATTTTTCTTTTTCAAAATATCTCTTCAAAAAATATTACCCAATACTTAATAATAAATAGATTATAACACAAAATTCTTTTAAAAAGTAGTTTATTTTGTTATCATTCTATAGTATTAAGTATTGTTTTATGGCTGATAAATTTCTTTGAATTTCTCCTTGATTATTTGTTATAAAAGTTATAAAATAATCTTGTTGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGATACTTCTATTCTACTCTGACTGCAAACCAAAAAAACAAGCGCTTTCAAAACGCTTGTTTTATCATTTTTAGGGAAATTAATCTCTTAATCCTTTT
【0124】
Cas9及びtracrRNAの実際の配列は、典型的には、全ての実験を通して一定のままである。スペーサーRNA配列は、正確なCRISPR/Cas9切断部位に応じて変化する。本明細書で論じられる通り、本発明の方法は、本発明の繰り返しで一定なままであるユニバーサルスペーサーの使用を可能にする。例えば、スペーサーは、本発明の全ての奇数の繰り返しで一定であり得、別のスペーサーセットは、本発明の全ての偶数の繰り返しで一定であり得る。
【0125】
適切には、Cas9、tracrRNA、及びスペーサーRNAは、切除が起こる細胞(すなわち宿主細胞)に共に提供される。適切には、これらのエレメントの3つ全てが、効率的な切除に必須である。
【0126】
一実施形態では、tracrRNAは宿主細胞で構成的に発現される。Cas9は、核酸の組換えを補助し得るヘルパータンパク質(例えば、ラムダレッドアルファ/ベータ/ガンマ)と共に誘導される。スペーサーRNAは、スペーサーRNAを発現する小さなプラスミドで細胞を形質転換することによって宿主細胞に提供され得る。或いは、好ましい実施形態では、スペーサーRNAは、ドナー核酸配列を含むエピソームレプリコンによってコードされる。3つ成分の全てが細胞内に存在する場合に切除が生じる。
【0127】
別の実施形態では、Cas9、tracrRNA、及びスペーサーRNAを発現するための核酸(例えばDNA)配列は、細胞に共に提供され得るが、3つの成分(の一部)の実際の発現は抑制され得る(誘導されない/サイレント)。適切な時点で発現は誘導され得、したがって、切除を誘導する。
【0128】
一実施形態では、切除を引き起こすために、tracrRNAは常に(構成的に)発現され、Cas9の発現は誘導され、そしてスペーサーRNAは最後に提供される。
【0129】
発現の誘導は、十分に当業者の能力の範囲内である。例えば、所望の配列(例えばCas9)は、誘導性プロモーターの制御下に置かれる。そのプロモーターの活性は、必要に応じて誘導される。例えば、アラビノースの存在下で誘導される周知のアラビノース(pAra)プロモーターが使用され得る。同様に、当業者は、構成的発現に適した周知のプロモーターの広大なアレイから必要に応じて構成的プロモーターを選択してもよい。
【0130】
CRISPRシステムの操作に関して周知のように、スペーサーRNAの配列は、標的部位ごとに異なる。適切なスペーサーRNAの選択は、十分に当業者の領域内である。
【表3】
【表4】
【0131】
tracrRNAとスペーサーRNAとの組み合わせは、個別に提供することができるか、又はtracrRNAとスペーサーRNAとの融合体である1つのガイドRNAとして提供することができる。
【0132】
CRISPRシステムの異なるエレメントには異なるモチーフが必要であることが留意されるべきである。Cas9では、PAMはNGGである。より詳細には、CRISPRシステムの代替的な実装がオペレーターの選択に応じて使用されてもよく、例えば、代替的なPAMをもたらす実装が使用される。より詳細には、NGGをPAMとして天然に認識するストレプトコッカス・ピオゲネスのCRISPR/Cas9システムが、変化したPAMを認識するように改変され得ることが実証されている(Kleinstiver, B. P. et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature (2015). doi:10.1038/nature14592)。Ran 2015、Zetsche 2015、及びLee 2016(上記を参照されたい)で記載されている、3つの代替的なRNAによってガイドされるエンドヌクレアーゼシステムは、異なるPAMを天然に有する。
【0133】
当業者には、CRISPRシステムの代替的な成分が本発明で利用されるかどうかが分かり、その後、対応する代替の同族PAM配列が使用されるべきである。これは、十分に当業者の領域の範囲内である。何らかのさらなるガイダンスが必要なケースでは、以下の表が、CRISPRシステムの代替的なエレメントと、それらのPAM配列を共に示している。
【表5】
【0134】
切除の制御のためのPAM部位の操作
本発明を実施する際、標的配列上のPAMを、標的に導入予定のドナー核酸(例えばsDNA)上のPAMと比較し、PAM配列がドナー核酸(例えばsDNA)及び標的核酸(例えばゲノムDNA)にマッチするならば、必要であれば、二重切除の問題(例えば、相同組換え配列を偶発的に含む切除)を避けるように変異させることができる。これは、本明細書で教示するような順でエレメントを配置する際に、当業者によって容易に行われる。
【0135】
エピソームレプリコン上のドナー核酸(例えば合成DNA)に隣接する相同領域には、AvrII部位(CCTAGG)がさらに隣接していてもよい。AGG又はCCTは、ストレプトコッカス・ピオゲネスのCRISPR/Cas9システムによって必要とされるNGG PAM配列に対応する(方向に応じて)が、補足的なCCT又はAGGは、プロトスペーサーの最後の3つのヌクレオチドを構成する。プロトスペーサーの最後の3つのヌクレオチド及び/又はNGG PAMのGのいずれかの任意の置換は、CRISPR/Cas9の認識及び/又は切断を不能にする。
【0136】
一部の実施形態は、そこにドナー核酸を組み換えようとしている標的核酸に二本鎖切断を導入するステップを含む。このような実施形態では、改変対象の核酸(標的核酸)に存在する配列上で利用されるPAMの選択で注意が必要である。なぜなら、ドナー核酸上の配列(例えば、標的核酸に導入しようとしているDNA)は標的核酸上のPAMにマッチしないためである。もしこれらがマッチするとすれば、本発明の方法の切除ステップは、標的核酸の不適切な位置にも二本鎖切断を導入してしまう。したがって、適切には、標的核酸(例えば、そこにドナーDNAを導入しようとしているゲノム又はプラスミド又はBAC)上のPAMは、ドナー核酸を有するエピソームレプリコン上のPAMと比較されるべきである。PAM配列がマッチすることが分かったら、これら配列は、考えられる問題を避けるために、改変対象の標的核酸上で変異させられる。これは、十分に当業者の領域の範囲内である。より詳細には、これらの実施形態では、エピソームレプリコン上の2つの切断部位は、上記で開示したものと同一の様式で、標的核酸上の相同領域の対応する末端と区別される。標的核酸上の相同領域の内側にある2つのさらなる切断部位は、標的核酸上の相同領域の境界を規定するNGGモチーフを探すことによって同定する必要がある。標的核酸上の相同領域の内側にある2つのさらなる切断部位のNGG PAMはまた、「二重切除」を避けるために、ドナー核酸を有するエピソームレプリコンの相同領域の対応する末端には存在しない必要がある。これは非常に容易に達成され得るが、それは、挿入のための配列が標的核酸(例えばゲノム)上の切断部位と天然に異なるためである。これは、ドナー核酸(例えば合成DNA)が標的核酸(例えば野生型ゲノムDNA)に類似の配列を有する場合、慎重に配列されるべきである。これは、ドナー核酸(例えば合成DNA)内の対応するNGG及び/又はNGGのすぐ次にある他のプロトスペーサー内の最後の3つのヌクレオチドを変更することによる置き換えで達成される。このようにして、本発明者らは、標的核酸(例えばゲノム)位置のみに対して切断部位をマークする。
【0137】
一実施形態では、組換え体の選択を補助するために、標的核酸の切断を誘導することが望ましい場合がある。この実施形態では、適切には3つの切断が存在し、2つは、ドナー核酸を切除するためにエピソームレプリコン上にあり、1つは、選択を補助するために標的核酸上にある。したがって、適切には、前記標的核酸は、5’-相同組換え配列1-切断部位-相同組換え配列2-3’を順に含む。
【0138】
適切には、前記標的核酸は、
a)5’-相同組換え配列1-切断部位-相同組換え配列2-3’、
b)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ポジティブセレクタブルマーカー-相同組換え配列2-3’、
c)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ネガティブセレクタブルマーカー-相同組換え配列2-3’、
d)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ポジティブセレクタブルマーカー-ネガティブセレクタブルマーカー-相同組換え配列2-3’、
e)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ネガティブセレクタブルマーカー-ポジティブセレクタブルマーカー-相同組換え配列2-3’
を順に含む。
【0139】
本発明を複数のラウンドで適用する場合、第1のラウンドのドナー核酸は、次のラウンドの標的核酸に関与し得る/次のラウンドの標的核酸の一部となり得る。したがって、適切には、所望の配列は、
a)5’-相同組換え配列1-切断部位-相同組換え配列2-3’
b)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ポジティブセレクタブルマーカー-相同組換え配列2-3’、
c)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ネガティブセレクタブルマーカー-相同組換え配列2-3’、
d)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ポジティブセレクタブルマーカー-ネガティブセレクタブルマーカー-相同組換え配列2-3’、
e)前記相同組換え配列1と相同組換え配列2との間に切断部位をさらに含む、5’-相同組換え配列1-ネガティブセレクタブルマーカー-ポジティブセレクタブルマーカー-相同組換え配列2-3’
を順に含み得る。
【0140】
適切には、標的核酸又は所望の配列上の切断部位は、エピソームレプリコン/ドナー核酸上の切除部位と異なる。
【0141】
前記切断部位は、前記ポジティブ/ネガティブセレクタブルマーカーの間にあっても、前記ポジティブ/ネガティブセレクタブルマーカーの中にあってもよい。適切には、前記標的核酸は、2つのこのような切断部位を含む。適切には、前記切断部位は、前記相同組換え配列の1つに隣接している。適切には、前記2つの切断部位は、前記相同組換え配列1に隣接した第1の切断部位、及び前記相同組換え配列2に隣接した第2の切断部位を含む。
【0142】
適用
本発明は、標的核酸への所望の配列の導入を伴う。「所望の配列の導入」は、本明細書で使用する場合、得られた核酸配列が所望の配列を含むように、所望の配列を標的核酸に組み込むことを意味する。これは、標的核酸内への所望の配列の組み込みとも記載され得る。
【0143】
標的核酸への所望の配列の導入は、所望の配列での標的核酸配列の一部の置き換えを含み得る。したがって、置き換えの後、得られた核酸配列は、所望の配列、及び標的核酸のオリジナルの配列の一部のみを含む。例えば、ゲノムが標的核酸配列である実施形態では、ゲノム配列の一部は、本発明の方法の繰り返しの間に、導入される所望の配列によって置き換えられてもよい。所望の配列は、所望の配列よりも小さい、所望の配列と同じサイズの、又は所望の配列よりも大きい標的核酸内の領域を置き換え得る。
【0144】
所望の配列の導入は、標的核酸内への所望の配列の挿入を含み得る。本明細書で使用する場合、「挿入」は、得られた核酸配列が標的核酸のオリジナルの配列の全てを有し、また挿入された所望の配列も含むように、所望の配列が標的核酸内の部位に導入されることを意味する。
【0145】
本発明の方法は、複数のステップを含み得、これによると、セレクションマーカーを例えばコードするドナー核酸が標的核酸に導入され、次いで所望の配列によって置き換えられる。
【0146】
例えば、本発明の方法は、新たに挿入された所望の配列に加えてゲノムの全てのオリジナルの配列が残るようにゲノム又は他の標的核酸内に所望の配列を挿入するために使用することができる。別の実施例では、本発明の方法は、ゲノムの全体のサイズが変化しないようにゲノム又は他の標的核酸の一部を所望の配列で置き換えるために使用することができる。さらなる他の実施例では、本発明の方法は、得られた核酸がオリジナルのゲノム配列の一部のみを有し、またゲノムの全体のサイズが増大するように、ゲノム又は他の標的核酸の一部を、置き換えられる領域よりも長い所望の配列で置き換えるために使用することができる。
【0147】
本発明は、プラスミドの構築において有用である。本発明は、宿主ゲノムの改変において有用である。本発明は、BACなどの人工染色体の構築において有用である。
【0148】
本発明は、大きなサイズの核酸構築物の作製において特に用途がある。本発明は、多様性が高いライブラリーの作製において特に用途がある。この点に関して、現在の形質転換技術を使用するとおよそ108の形質転換効率が達成可能である。しかし、1010又はそれを超える形質転換効率は非常に困難である、及び/又は不確実である。本発明によると、第1のハーフライブラリーが作製され得、第1の宿主細胞(宿主細胞の集団)に形質転換され得る。この第1のハーフライブラリーに、次いで、第2のハーフライブラリーをコードする核酸が形質転換される。本発明による組換えを使用することによって、これら2つのハーフライブラリーが次いでインビボで組み合わされ、1010の多様性を有するライブラリーが得られるが、このライブラリーは、105の形質転換効率を使用しさえすれば有利に得られた。
【0149】
宿主細胞
適切には、宿主細胞は原核細胞である。適切には、宿主細胞は細菌細胞である。
【0150】
一実施形態では、宿主細胞は、インビトロ、すなわち、実験室内にある。本発明の一実施形態では、本方法は、インビトロでの方法である。一部の実施形態では、本方法は、インビボでは実施されない。適切には、宿主細胞は、生存しているヒト又は動物の身体の一部ではない。適切には、宿主細胞は、以下の実施例で使用される宿主細胞の1つから選択される。
【0151】
宿主細胞は、任意のグラム陰性細菌であり得る。宿主細胞は大腸菌であり得る。宿主細胞は、任意の大腸菌株(MG1655若しくはBL21など)、又はこれらに由来する細胞であり得る。
【0152】
MG1655は、大腸菌の野生型株であるとみなされる。この株のゲノム配列のGenBank IDは、U00096(出願日の時点ではU00096.3)である。BL21は広く市販されている。
【0153】
大腸菌などの宿主生物は、天然の修復メカニズムを阻害して、二本鎖修復が非存在であること又は二本鎖修復の可能性が非常に低いことが確実となるように、選択又は改変されていてよい。例えば、宿主細胞内の核酸組換えを補助し得る適切なヘルパータンパク質、例えば、本明細書で記載されるラムダレッドタンパク質又は他の適切な組換え補助タンパク質が、RecBCDの代わりに存在しているという条件で、RecBCDシステムが変異しているか又は阻害されていてよい。例えば、一実施形態では、RecBCDはラムダレッド成分に干渉する可能性があり、ラムダレッド成分によって行われる短い相同性領域(例えばおよそ50bp)(RecBCDシステムによって分解される)を有する二本鎖DNAを使用する組換えの効率を低減させるため、RecBCDは阻害されてよい。しかし、長い相同性領域(例えば、およそ3~5kb)が使用されるならば、RecBCDは、組換え補助タンパク質としてのラムダレッド成分に代わる、組換え補助タンパク質としての代替となり得る。
【0154】
任意の追加のステップ又は特徴
一実施形態では、本発明は、従来の技術によって行われる第1の組換えステップを伴い得る。これは、逆セレクタブルマーカーの標的部位への導入を可能にするという利点を有する。
【0155】
本発明は、本明細書で開示されている方法によって又は従来の組換えによって行われ得る最終組換えの最終ステップを含んでいてもよい。例えば、これは、それらの目的を果たし、本明細書で開示されている方法のさらなる繰り返しにはもはや必要ではないセレクタブルマーカーの除去において、有利であり得る。
【0156】
一部の実施形態では、本明細書で開示されている繰り返し方法は、第1の従来の相同組換えイベントを伴わずに開始及び継続される。
【0157】
一実施形態では、切除機構、例えばCRISPR/Cas9が、組換えイベントによって置き換えようとしている部位での切断に利用され、これによって、切断(組み換えられていない)標的核酸に対する選択圧、すなわち、二本鎖切断によるネガティブセレクションが生じる。別の実施形態では、標的配列内での二本鎖切断によるこのネガティブセレクションは、3つの二本鎖切断の実施形態での選択を改良するために使用される(ドナー核酸の切除のための2つの二本鎖切断、及び標的核酸上のHR1配列とHR2配列との間の1つの二本鎖切断で、全部で3つのDS破壊/切断となる)。
【0158】
特定の実施形態では、所望の配列を標的核酸に導入する方法であって、
1)標的核酸を含むゲノムを含む大腸菌宿主細胞を提供するステップ、
2)接合伝達によってBACを宿主細胞に送達するステップであって、
前記BACが、骨格配列及びドナー核酸配列を含み、
前記ドナー核酸配列が、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を順に含み、
骨格配列が、相同組換え配列1の隣に位置する第1の切除部位及び相同組換え配列2の隣に位置する第2の切除部位を含み、第1の切除部位が第1のプロトスペーサーを含み、第2の切除部位が第2のプロトスペーサーを含み、
骨格配列が、第1のプロトスペーサーに特異的なスペーサーを含む第1のRNA分子、及び第2のプロトスペーサーに特異的なスペーサーを含む第2のRNA分子をコードする、前記ステップ、
3)前記宿主細胞における核酸の組換えを補助し得るラムダレッドタンパク質を提供するステップ、
4)Cas9ヌクレアーゼを提供するステップ、
5)Cas9ヌクレアーゼによる前記ドナー核酸配列の切除を誘導するステップ、
6)インキュベートを行って、切除されたドナー核酸と前記標的核酸との間で組換えを起こすステップ、並びに
7)前記ドナー核酸が前記標的核酸に組み込まれた組換え体を選択するステップ
を含む、前記方法が提供される。本明細書で議論されるこの方法の特徴の代替のいずれかを、この方法の対応する特徴の代わりに使用することができる。例えば、BACはエピソームレプリコンであり得、標的核酸は任意の標的核酸であり得、ラムダレッドタンパク質を、目的に適した任意のものの代わりに使用することができる、などである。
【0159】
本明細書で議論される通り、ステップ1)~4)は、任意の順序で又は同時に行ってよい。
【0160】
別の実施形態では、本方法は、核酸配列のアセンブリのためのものであり、ステップ1)~7)を行って、第1のドナー核酸配列を第1の標的核酸に導入し、それによって第2の標的核酸を作製する工程、次いでステップ1)~7)を行って、第2のドナー核酸配列を第2の標的核酸に導入し、それによって第3の標的核酸を作製する工程を含む。このプロセスは繰り返してもよく、各繰り返しの産物は、次の繰り返しの標的である。第1の骨格配列を含むBACは各奇数の繰り返しに使用することができ、第2の骨格配列を含むBACは各偶数の繰り返しに使用することができる。第1の骨格配列及び第2の骨格配列は異なるスペーサーをコードしてよく、異なるセレクションマーカーを含んでいてよい。
【0161】
本明細書で記載される特徴の全て(あらゆる添付の特許請求の範囲、要約書、及び図面を含む)、並びに/又は、開示された任意の方法若しくはプロセスのステップの全ては、このような特徴及び/又はステップの少なくとも一部が相互排他的である組み合わせを除いて、上記の態様のいずれかと任意の組み合わせで組み合わせることができる。
【0162】
本発明をより良く理解するため、及び本発明の実施形態がいかにして行われ得るかを示すために、ここで実施例を参照するが、これら実施例は、本発明を限定するためのものでは決してない。
[実施例]
【0163】
方法
この研究で使用された株及びプラスミド
本発明者らは、ゲノムの低減した、ストレプトマイシン耐性の大腸菌(Mds42、Scarab Genomics社)を、REXER及びCONEXERの開始株として使用した。同一の株を、BASISによるヒトCFTR遺伝子のアセンブリに使用した。ヒトゲノムの大きなセクションを、同一株のΔrecA変異体とアセンブルした。全てのクローニング手順を、大腸菌DH10bで行った。本発明者らは、株BY4741において酵母アセンブリを行った。
【0164】
本発明者らは、この研究で、以下のBAC:100k13、100k22、100k24、100k25、100k26、100k27、100k28、及び100k37aを使用した(非特許文献14)。各BACは、2つのセリンコドン(TCG及びTCA)並びに停止コドン(TAG)が、規定されたリコードルール(TCGをAGCに、TCAをAGTに、及びTAGをTAAに)を介して置き換えられる、規定された同義コドン圧縮スキームを伴う、約100kbの合成DNAを有する。
【0165】
本発明者らは、REXER及びCONEXERにおいて、以下のポジティブセレクションマーカー及びネガティブセレクションマーカー:sacB(ショ糖感受性を付与する)、cat(クロラムフェニコール耐性)、rpsL(ストレプトマイシン感受性)、kanR(カナマイシン耐性)、pheST251a_a294G(pheS*)(4-クロロフェニルアラニン(4-CP、4-chloro-phenylalanine)感度)、及びHygR(ハイグロマイシン耐性)を使用した(非特許文献14)。REXERでは、本発明者らは、組み込み部位の上流末端(遺伝子座0)にゲノムダブルセレクションカセットを有する、ゲノムが減少したストレプトマイシン耐性の大腸菌株(Mds42)を使用した:100k13及び100k37aでのREXERではrpsL-kanR、100k22、100k24、及び100k28でのREXERではsacB-cat。CONEXERでは、本発明者らは、レシピエント細胞の組み込み部位の上流末端(遺伝子座0)にゲノムダブルセレクションカセットを有する、ゲノムが減少したストレプトマイシン耐性の大腸菌(示されているように、WT又はΔrecA)株を使用した:100k25及び100k27でのCONEXERではrpsL-kanR、100k24、100k26、及び100k28でのCONEXERではsacB-cat。
【0166】
本発明者らは、REXER及びCONEXERでの切除及び組換えを可能にするために、ヘルパープラスミドpKW20(Wang, K. et al. Nature 539, 59-64, doi:10.1038/nature20124 (2016))を使用した。pKW20は、tracrRNA、並びにアラビノース誘導性プロモーターの制御下にあるcas9及びラムダレッド成分を構成的に発現する。さらに、本発明者らは、Cas9の発現を伴わないラムダレッド組換えを可能にするために、cas9を有さない誘導体プラスミドを作製し、これを、CONEXERのためのBACの修飾に利用した(以下を参照されたい)。これは、pKW20の残り部分のPCR増幅と、その後の、NEBuilder HiFi DNAアセンブリによって行った。
【0167】
ヒト21番染色体の大きな領域のアセンブリのためのBAC(
図3C)は、32k-ヒトBACライブラリー(BACPACKゲノミクス)のBACに基づく。これらを、CONEXERのためのBACの構築において記載されているようなラムダレッド組換えを使用するCONEXERに適用した。
【0168】
宿主遺伝子の欠失では、本発明者らは、スペーサー配列を有するプラスミド及びpKW20を使用した。スペーサープラスミドは、ガイドをコードするssDNAオリゴヌクレオチドを用いるpMB1プラスミド骨格への制限ライゲーションによって構築した。全てのスペーサー配列を、表3a及び表3bに示す。
【0169】
スペーサーアレイの構築
この研究で、本発明者らは、2つの異なる設計(偶数及び奇数でそれぞれ標識されている)のBACからの合成DNAのゲノム組み込みを行うが、これは、それぞれのユニバーサルスペーサー(ユニバーサル1及びユニバーサル2)のセットを必要とする。ヒトBACライブラリーに由来するCONEXER BACのためのスペーサーは、第3の設計(ユニバーサル3)に基づく。本方法をさらに単純化するために、1つのユニバーサルスペーサーRNAが全てのBACにおいて5’及び3’の両方を切除するように、一連のBACが設計され得ることに留意されたい。
【0170】
REXERのための全てのスペーサーRNAは、アンピシリン耐性マーカー、tracrRNA、及びスペーサーアレイを有するプラスミドpKW3_MB1amp_tracr_スペーサー(表15)から発現する。本発明者らは、2ラウンドのPCRを介して、オーバーラップしているオリゴヌクレオチドから各アレイを構築し、AccI及びEcoRIでのpKW3の制限消化によって骨格を準備した(非特許文献14)。本発明者らは、NEBuilder HiFi DNAアセンブリによって骨格と各アレイとを組み合わせ、その後、サンガーシーケンシングによって検証した。全てのスペーサー配列及びオリゴヌクレオチド配列を、表5~表15に示す。
【0171】
CONEXERのためのBACの構築
本発明者らは、接合による伝達を可能にするための伝達起点(oriT)の配列、及びユニバーサルスペーサーアレイ(ユニバーサル2)をBAC骨格に組み込むことによって、CONEXERのための偶数のBACを修飾した(表5)。この目的のために、本発明者らは、oriT配列及びスペーサーアレイ配列をセレクションマーカーampRに結合した。本発明者らは、PCRによって各配列を増幅した。プラスミドpKW3_MB1amp_tracr_ユニバーサル2はampRの鋳型として機能し、pRK24(addgene番号51950)はoriTの鋳型として機能し、そしてpKW3_MB1amp_tracr_ユニバーサル2はスペーサーアレイの鋳型として機能した。本発明者らは、2回の連続するPCRのPCR産物を繋ぎ合わせて、pheS*に対する50bpの相同性領域を生じさせるプライマー及びBAC骨格を有する最終のampR-oriT-ユニバーサル2カセットを作製した。本発明者らは、cas9を有さないヘルパープラスミドpLF118を使用して、ラムダレッド組換えを開始し、アンピシリンで、BACへのカセットの組み込みについて選択した。カセットの完全な組み込みをサンガーシーケンシングによってまず検証し、成功裏に修飾されたBAC 100k24を次世代シーケンシング(NGS)によってさらに検証して、合成DNAインサート全体の完全性を確認した。全てのオリゴヌクレオチド配列を、表5~表14に示す。
【0172】
奇数のBACは、CONEXERでは類似の方法で修飾することができる。対応するユニバーサルスペーサーアレイであるユニバーサル1を、上記のpKW3_Mb1amp_tracr_ユニバーサル1プラスミドから増幅した。対応するオリゴヌクレオチド配列を表8に列挙する。
【0173】
奇数及び偶数のCONEXER BACは、CONEXERプロトコルを用いて大腸菌ゲノムの任意の点で合成DNAを組み込むための、単純で迅速な基礎を提供する。この目的では、BACと他の合成DNAとのサッカロミセス・セレビシエ(S. cerevisae)を介するアセンブリのために、BAC骨格を、記載されているBACを鋳型として使用して直接増幅してもよい(非特許文献14、5)。Robertson, W. E. et al. Nat Protoc 16, 2345-2380, doi:10.1038/s41596-020-00464-3 (2021)。
【0174】
ヒトライブラリー由来のBACを、oriT配列、ユニバーサルスペーサーアレイ、ユニバーサル相同性領域、及びダブルセレクションカセットの組み込みによって、CONEXERに適用した。この目的のために、本発明者らは、全ての成分を有するプラスミドを、ギブソンアセンブリを介して正確な方向でクローニングした。これらのプラスミドはPCRの鋳型として機能し、ここで、本発明者らは、BACに組み込まれる配列全体を1つの直鎖状のDNA片として増幅する。本発明者らは、ラムダレッド組換えを開始するために、cas9を有さないヘルパープラスミドpLF118を使用し、適切な抗生物質(使用したダブルセレクションカセットのタイプに応じて、ハイグロマイシン又はカナマイシン)で、BACへのカセットの組み込みについて選択した。カセットの完全な組み込みを、カセットの両端での連結をゲノタイピングすることによってまず検証した。成功裏に修飾されたBACを次世代シーケンシング(NGS)によってさらに検証して、合成DNAインサート全体の完全性を確認した。
【0175】
CFTR遺伝子のアセンブリのためのBACを、酵母内の断片からアセンブルした(Robertson, W. E. et al. Nature Protocols 16, doi:10.1038/s41596-020-00464-3 (2021))。PCR増幅を介して断片を作製した。CONEXER BAC 100k25は、BAC骨格断片(複製起点、ユニバーサル相同性領域、oriT、及びユニバーサルスペーサーアレイを有する)の増幅のための鋳型として機能した。hTERT RPE-1細胞から精製されたゲノムDNAは、本発明者らがアセンブリに使用したCFTR遺伝子の断片のPCR増幅のための鋳型として機能した。
【0176】
REXER
本発明者らはREXERを行った(非特許文献14、5)。Robertson, W. E. et al. Nat Protoc 16, 2345-2380, doi:10.1038/s41596-020-00464-3 (2021)。ヘルパープラスミドpKW20_CDFtet_pAraRedCas9_tracrRNA及びゲノムダブルセレクションカセットを有する、ゲノムが減少したストレプトマイシン耐性の大腸菌細胞から開始して、本発明者らは、関連するBACで細胞を形質転換し、ヘルパープラスミドについての選択(5μg/mLのテトラサイクリン)、BACについての選択(18μg/mLのクロラムフェニコール又は50μg/mLのカナマイシンのいずれか)、並びにCas9及びラムダレッドの発現の抑制(2%グルコース)を有するLB寒天に播種した。本発明者らは、単離されたコロニーを、5μg/mLのテトラサイクリン及びBACについての抗生物質選択を有するLB培地に接種し、培養物を、振とうしながら37℃で一晩インキュベートした。細胞を誘導し、コンピテント化するために、本発明者らは、5μg/mLのテトラサイクリン及びBACについての抗生物質選択を有する培地に、一晩培養物を1:50で希釈した。細胞がOD600≒0.2に達したら(通常は2時間後)、本発明者らは、アラビノースを最終濃度0.5%(w/v)まで添加することによってラムダレッド及びCas9の発現を誘導し、振とうしながら37℃でさらに1時間インキュベーションを続けた。本発明者らは細胞を採取し、これらをエレクトロコンピテント化した(Fredens, et al., 2019; Robertson et al., 2021)。
【0177】
REXERによる合成DNAのゲノム組み込みでは、本発明者らは、エレクトロコンピテントな誘導された細胞を、スペーサーRNAをコードする2μgのプラスミドpKW3_MB1amp_tracr_スペーサーで形質転換した。37℃で振とうしながら4mLのSOB培地中に1時間回収した後、本発明者らは、培養物を、5μg/mLのテトラサイクリンを有する50mLのLB培地に移し、スペーサーRNAについて選択し(100μg/mLのアンピシリン)、BACについて抗生物質選択をし、そして、振とうしながら37℃で3時間インキュベーションを続けた。本発明者らは、培養物を、5μg/mLのテトラサイクリン、BACについての抗生物質選択、並びにゲノム上のネガティブマーカー及びBAC骨格上のネガティブマーカーについて選択する薬剤(rpsLに対する200μg/mLのストレプトマイシン、sacBに対する7.5%ショ糖、及び/又はpheS*に対する2.5mMの4-CP)を有するLB寒天に播種した。37℃で一晩インキュベートした後、本発明者らは、10個~11個のコロニーを採取し、これらを30μLの水に溶解した。本発明者らは、各クローンを、コロニーPCRによって、上流のゲノムダブルセレクションカセット(遺伝子座0)の喪失、及び下流のダブルセレクション(遺伝子座1)のゲノム組み込みについて評価した。本発明者らは、コロニーPCR産物のサンガーシーケンシングによって、最初の5つのクローンをさらに検証した。全てのオリゴヌクレオチド配列を表5~14に示す。
【0178】
CONEXER
CONEXERは、コンピテントドナー細胞とレシピエント細胞との接合の準備を必要とする。ドナー細胞は、伝達不可能な接合性プラスミドpJF146(受託番号MK809154.1、(Fredens, et al., 2019))、並びに組み込みのための合成DNA、oriT配列、及びユニバーサルスペーサーアレイを有するBACを有する。oriTの方向は、レシピエント細胞におけるCas9切断の早すぎる開始による部分的切除のリスクを最小にするために、スペーサーアレイがレシピエント細胞に最後に入ることを確実にする。レシピエント細胞は、組み込み部位の上流末端をマークする遺伝子座0のゲノムダブルセレクションカセット、並びに、Cas9及びラムダレッド成分の誘導性発現のためのヘルパープラスミドpKW20を有している。奇数及び偶数のBACは、基本的にはREXER及びGENESISについて記載されているような交互選択戦略での、繰り返しCONEXERステップにおける隣接したゲノム領域の置き換えのために、交互であり得る(非特許文献14、5)。
【0179】
ここで、本発明者らは、100kbの合成DNAインサート及びBAC骨格上のrpsL-kanR(又はsacB-cat)とそれに続くpheS*(又はrpsL)を有する偶数(又は奇数)のBACを有するドナー株、並びに遺伝子座0にゲノムsacB-cat(又はrpsL-kanR)セレクションカセットを有するレシピエント株での、CONEXERを記載する。本発明者らは、ドナー株を、飽和するまで、pJF146についての選択(50μg/mLのアプラマイシン)及びBACについての選択(50μg/mLのカナマイシン又は20μg/mLのクロラムフェニコール)を有する25mLのLB培地中で一晩増殖させた。本発明者らは、レシピエント株を、飽和するまで、ヘルパープラスミドについての選択(5μg/mLのテトラサイクリン)、ゲノムダブルセレクションカセット(20μg/mLのクロラムフェニコール又は50μg/mLのカナマイシン)、並びにCas9及びラムダレッドの発現の抑制(2%グルコース)を有する25mLのLB培地中で一晩増殖させた。本発明者らは、各培養物から遠心分離によって細胞を採取し、ペレットを1mLのLB培地中で3回洗浄した。最終の洗浄の後、本発明者らは、ペレットを800μlのLB中に再懸濁した。本発明者らは、160μlのレシピエントを640μlのドナーと混合し、混合物をLB寒天プレートにスポットし、スポットが乾燥したら、プレートを37℃で1時間インキュベートした。接合の後、本発明者らは、細胞をプレートから洗い流し、全てを、ヘルパープラスミド(5μg/mLのテトラサイクリン)及びBAC(50μg/mLのカナマイシン又は20μg/mLのクロラムフェニコール)を有するレシピエント細胞についての選択を有する、250mLの事前に温めたLB培地に移し、Cas9及びラムダレッドの発現を誘導した(0.5%L-アラビノース)。振とうしながら37℃で1.5時間インキュベートした後、本発明者らは、細胞を遠心分離によって採取し、全てを、50μg/mLのカナマイシン(又は20μg/mLのクロラムフェニコール)、5μg/mLのテトラサイクリン、並びにCas9及びラムダレッドの発現を抑制することによって組換えを終わらせるための2%グルコースを有する、250ml事前に温めたLBにすぐに移した。振とうしながら37℃でさらに2.5時間インキュベートした後、本発明者らは、培養物を遠心分離によって回転させ、ペレットを2mLのMilli-Q濾水に再懸濁した。細胞懸濁液を、ヘルパープラスミドについての選択(5μg/mLのテトラサイクリン)、遺伝子座1でのダブルセレクションカセットの組み込みについての選択(50μg/mlのカナマイシン又は20μg/mLのクロラムフェニコール)、遺伝子座0でのダブルセレクションカセットの喪失についての選択(7.5%ショ糖又は200μg/mlのストレプトマイシン)、及びBAC骨格の喪失についての選択(2.5mMの4-CP又は200μg/mLのストレプトマイシン[このケースでは、骨格上のセレクションマーカーは遺伝子座0のセレクションマーカーに等しいため、追加では添加されない])を有するLB寒天プレートに、連続希釈で広げた。ショ糖を有さないセレクションプレートでは、本発明者らは、Cas9及びラムダレッドの発現を抑制するために2%グルコースを添加した。
【0180】
(最初のスクリーニングとは別の)ΔrecA宿主における実験では、本発明者らは、細胞を、50μg/mLのカナマイシン(又は20μg/mLのクロラムフェニコール)、5μg/mLのテトラサイクリン、並びにBACを受け取った細胞をCas9及びラムダレッドの発現の1.5時間の誘導の前に増殖させるための2%グルコースを有する、250mlの事前に温めたLB中で2~8時間増殖させた。これによって、成功裏の組換え体の数がCONEXER実験から増大した。
【0181】
エピソームにおけるヒトDNAのアセンブリのために、一部のBACを、ヒトDNAインサートの後のpheS*-HygRダブルセレクションカセット及び骨格上のrpsLを使用した。pheS*-HygRダブルセレクションカセットの維持について選択するために、本発明者らは、200μg/mLのハイグロマイシンを使用した。pheS*-HygRダブルセレクションカセットの喪失について選択するために、本発明者らは、2.5mMの4-CPを添加した。BAC骨格の喪失について選択するために、本発明者らは、200μg/mlのストレプトマイシンを使用した。
【0182】
37℃で一晩インキュベートした後、本発明者らは、16~24のコロニーを採取し、これらを30μLの水に溶解した。本発明者らは、REXERについて記載したように、各クローンを、コロニーPCRによって、遺伝子座0のsacB-catカセットの喪失、及び遺伝子座1のrpsL-kanRカセットの組み込みについて評価した。本発明者らは、NGSによる全ゲノムシーケンシングのために、遺伝子型が検証された5個~16個のコロニーを選択した。全てのオリゴヌクレオチド配列を表5~表14に示す。
【0183】
次世代シーケンシング(NGS)及びシーケンシングデータの分析
BACS及びゲノムDNA(gDNA、genomic DNA)を、QIAprep Spin Miniprepキット及びDNEasy Blood and Tissueキット(QIAGEN社製)をそれぞれ使用して、大腸菌の一晩の培養物から抽出した。NGSのための調製物は以前に記載されている(非特許文献14、5)、Robertson, W. E. et al. Nat Protoc 16, 2345-2380, doi:10.1038/s41596-020-00464-3 (2021)。多くのゲノムの調製のために、自動ワークフローを以下のようにBiomek FXp(Beckman Coulter社)で行った:大腸菌培養物(500μL)を1.2mLの96ウェルプレート内で一晩増殖させ、その後、ATLバッファー(QIAGEN社製、90μL)及びプロテイナーゼK(10μL)中に再懸濁し、そして56℃で2時間インキュベートした。AMPure XP(Beckman Coulter社製、100μL)を各ウェルに添加し、プレートをボルテックスした(1000rpm、6分間)。ビーズを磁化し(5分間)、上清を除去し、そして70%EtOHで洗浄し(3×400μL)、その後、gDNAをバッファーAE(QIAGEN社製、100μL)で溶出した。gDNAを次いでH2Oに1:10で希釈し、検量線及び96ウェルプレート内で100μLの総容積(ex/em:502/532)を使用して、接続された蛍光プレートリーダー(Molecular Devices SpectraMAX I3)に適合したQubit(商標)dsDNA HSアッセイキット(Thermofisher社製)を使用して定量した。このデータをオンボードで処理し、0.25ng/μLまでのgDNAの直後の希釈に使用した。最後に、本発明者らは、Nextera XT DNA Library Preparationキット(Illumina社製)を、容積を減らした以外は製造者のプロトコルに従って用いて、ペアエンドシーケンシングライブラリーを準備した:インプットgDNA(0.2~0.25ng/μL、2μL)、TDバッファー(3μL)、ATM(2μL)、NTバッファー(1.5μL)、インデックス(1μL)、NPM(3.5μL)。インデックス配列を、Biomers社から購入した「Illumina Adapter Sequences」サポートドキュメント(Nextera DNAインデックス、第16頁、2020年6月)から作製し、10μMで使用した。ライブラリーを次いで、AMPure XP磁気ビーズ(Beckman Coulter社製)を製造者の指示に従って用いて(7:14のビーズ:反応物の容積比)精製し、Qubit(Thermofisher社製)によって定量し、プールし、そして製造者の指示に従って変性させた。
【0184】
ライブラリーを、MiSeq(Illumina社製、試薬キットv3(600サイクル))、Illumina HiSeq2500(200サイクル)、又はNextSeq 2000(Illumina社製、P2試薬キットv3(100/200サイクル))でペアエンドシーケンスした。下流のシーケンシング分析は、以前に詳述されているようにカスタムPythonスクリプトで行った(非特許文献14)、Robertson et al., 2021。標的ゲノム領域全体のリコードの状況を作成するために、本発明者らは、以前に詳述されているようにカスタムPythonスクリプトを使用した(非特許文献14)、Robertson et al., 2021。アウトプットは、対象のゲノム領域全体でプロットされた各標的コドンでのリコードの頻度である。
【0185】
宿主因子KO株の作製
CRISPR/Cas9介在性の切断による遺伝子欠失及びラムダレッドリコンビニアリングのために、本発明者らは、Jiang et al. (2013) (Jiang, W., et al. Nat Biotechnol 31, 233-239, doi:10.1038/nbt.2508 (2013))の手順を採用した。本発明者らは、ガイドをコードするssDNAオリゴヌクレオチドを用いるpMSP43骨格への制限ライゲーションによって、スペーサー配列を有するスペーサープラスミドをクローニングした。簡潔に述べると、本発明者らは、ssDNAオリゴヌクレオチドをT4 PNK(NEB社製)でリン酸化し、アニーリングし、そしてpMSP43骨格とライゲーションした。本発明者らは、得られたプラスミドを大腸菌DH10bに形質転換し、配列をサンガーシーケンシングによって検証した。宿主因子の単一の欠失を、ヘルパープラスミドpKW20を有するLS23にsacB-catダブルセレクションカセットが組み込まれた、ゲノムが減少したストレプトマイシン耐性の大腸菌で行った。本発明者らは、培養物をLB中でOD600=0.2まで増殖させ、次いで、L-アラビノース(0.5%)を添加して、Cas9及びラムダレッドを誘導した。1.5時間のアラビノース誘導の後、細胞を採取し、氷冷したMilli-Q水の中の20%(w/v)グリセロール50mLで3回洗浄することによってエレクトロコンピテント化した。CRISPR/Cas9介在性の切断では、標的特異的なスペーサー配列(スペクチノマイシン耐性を付与する)を発現するさらなるヘルパープラスミドを、2つの終止コドン及びフレームシフト変異を標的遺伝子に導入する修復ssDNAオリゴヌクレオチドとコエレクトロポレーションした。エレクトロポレーション後、37℃で1時間、1mlのSOB中に培養物を回収し、次いで、選択LB寒天プレート(75μg/mLのスペクチノマイシン、20μg/mLのクロラムフェニコール、及びCas9活性の継続のための0.5%L-アラビノース)に播種した。翌日、本発明者らは、コロニーを選択プレートから採取し、標的化された遺伝子領域をコロニーPCRによって増幅した。欠失をサンガーシーケンシングによって確認した。その後、反復継代によって、欠失株のヘルパープラスミド(specRを有するpHFXX)を除去した。除去はフェノタイピングによって確認した。
【0186】
連続的ゲノム合成
連続的ゲノム合成のために、CONEXER 100k24をまず、LS23にsacB-catダブルセレクションカセットを有する、ゲノムが減少したストレプトマイシン耐性の大腸菌ΔrecAで行った。翌日、40個のクローンをセレクションプレートから採取し、個別に増殖させた。本発明者らは、各クローンを、REXERについて記載したように、フェノタイピングによって、LS23でのsacB-catカセットの喪失及びLS24でのrpsL-kanRカセットの組み込みについて評価した。正しい表現型を有するクローン(39個)を、その後、等しい比率で25mLの総容積までプールした。この細胞プールは、CONEXER 100k25のためのレシピエント培養物として機能した。セレクションプレートから96個のクローンを採取し、個別に増殖させた。ここでも、本発明者らは、各クローンを、フェノタイピングによって、LS24でのrpsL-kanRカセットの喪失及びLS25でのsacB-catカセットの組み込みについて評価した。正しい表現型を有するクローン(72個)を、その後、等しい比率で25mLの総容積までプールした。この細胞プールは、CONEXER 100k26のためのレシピエント培養物として機能した。セレクションプレートから96個のクローンを採取し、個別に増殖させた。ここでも、本発明者らは、各クローンを、フェノタイピングによって、LS25でのsacB-catカセットの喪失及びLS26でのrpsL-kanRカセットの組み込みについて評価した。正しい表現型を有するクローン(53個)を、その後、等しい比率で25mLの総容積までプールした。この細胞プールは、CONEXER 100k27のためのレシピエント培養物として機能した。翌日、セレクションプレートから96個のクローンを採取し、個別に増殖させた。ここでも、本発明者らは、各クローンを、フェノタイピングによって、LS26でのrpsL-kanRカセットの喪失及びLS27でのsacB-catカセットの組み込みについて評価した。正しい表現型を有するクローン(77個)を、その後、等しい比率で25mLの総容積までプールした。この細胞プールは、CONEXER 100k28のためのレシピエント培養物として機能した。翌日、セレクションプレートから288個のクローンを採取し、個別に増殖させた。ここでも、本発明者らは、各クローンを、フェノタイピングによって、LS27でのsacB-catカセットの喪失及びLS28でのrpsL-kanRカセットの組み込みについて評価した。正しい表現型を有するクローン(284個)の全ての中から、182個をNGSによってシーケンシングした。
【0187】
連続的ゲノム合成における、完全にリコードされたクローンの予想される頻度を計算するために、本発明者らは、CONEXERの各ステップの完全にリコードされたクローンの実験的に決定された頻度を掛け合わせた。
【表6】
【表7】
【表8】
【表9】
【表10】
【表11】
【表12】
【表13】
【表14】
【表15】
【表16】
[実施例1]
【0188】
大腸菌においてカスタム合成ゲノムを作製するための迅速かつ一般的な方法
概要
全ゲノム合成及び大規模ゲノム改変は、生物の機能を理解するため、生合成経路を大規模に改変するため、及び天然で見られる機能よりも優れた機能を有する生物を作製するための強力なアプローチを提供するために有望である。ゲノムDNAを合成DNAで置き換えるための単純な、ロバストな、短時間のスケーラブルな方法は、ゲノム合成及び大規模ゲノム改変をより短時間にする。
【0189】
ここで、本発明者らは、大腸菌ゲノムへの100kbを超える合成DNAの導入を単純化する及び短時間にするアプローチを報告する。本発明者らの方法は、迅速な(1日の)プロトコルを使用してこれを達成し、このプロトコルは、さらに大きな合成DNA配列を導入するために繰り返してもよい。重要なことに、本方法は、全ての必要な成分を標準化及び一体化し、その結果、ユーザーが行う必要があるのは、所望の合成DNAを細菌人工染色体にクローニングし、次いで標準的なプロトコルを実行するだけである。
【0190】
結果
本明細書で議論される通り、ユニバーサルスペーサーを使用したREXERは、切除されたドナー核酸の末端に存在する非相同配列を生じさせるため、ユニバーサルスペーサーを使用したREXERの誘導体が機能するかどうかは不明であった。これが望ましくない挿入又は欠失をもたらすかどうかについては不明であった。
【0191】
ユニバーサルスペーサーでのREXERの効率及び忠実度を調べるために、本発明者らはまず、本発明者らがREXER及びGENESISを介する大腸菌ゲノム合成に使用したBAC骨格の各々に結合し、当該BAC骨格内の切断を指向する、2つのスペーサーRNA対(ユニバーサル1及びユニバーサル2)(表3、並びに配列番号24及び25)を設計し、クローニングした(
図2a)。ユニバーサル1及びユニバーサル2は、奇数及び偶数でそれぞれ指定されているゲノムセクションに使用したBAC骨格を標的化する(
図4)。
【0192】
本発明者らはまず、合成DNAが、BACからのユニバーサルスペーサーRNAを介するCas9切除の結果生じる両端の非相同配列にもかかわらず、スカーレスにゲノムに組み込まれることを実証した。本発明者らは、リコードされた合成DNA 100k13、100k22、100k24、100k28、及び100k37を用いて、REXERを複数の遺伝子座で試験した(非特許文献14)(
図4及び表3)。REXERでは、合成DNAのゲノム組み込みは、BAC内のゲノム組み込み部位の上流末端及び合成DNAインサートの下流末端に位置する抗生物質耐性マーカーでの同時のポジティブ及びネガティブセレクションによって、選択される(
図1a)。成功裏の組換えは、組み込み部位の5’末端(遺伝子座
0)でのゲノムセレクションカセットの喪失、及び3’末端(遺伝子座
1)でのセレクションカセットの組み込みをもたらす。本発明者らは、試験した5つの遺伝子座の各々での11/11のREXER後のクローンの成功裏の組み込みを確認した(
図2b)。
【0193】
本発明者らは、REXER後のクローンにおける組換えについて相同性領域の周辺の配列を検証し、全てのクローンが6bpの非相同配列を喪失していることを確認した(
図2c)。したがって、両ユニバーサルスペーサーセットによって作製されたミスマッチ配列は、試験した5つの遺伝子座全てで、REXER実験において効率的かつ確実に除去されている。本発明者らは、ユニバーサルスペーサーがゲノム内への大きな合成DNAのスカーレスな組み込みを可能にすると結論付ける。
【0194】
次に、本発明者らは、REXERへのユニバーサルスペーサーの使用が、合成DNAでの置き換えについて標的化されている100kbのゲノム領域全体にわたる組換えに影響するかどうかを評価した。BACからの合成DNAインサートと、置き換えについて標的化されている対応するゲノムDNAとの間のREXERは、組換えによる交差(crossover)の結果生じるキメラ配列を生じさせ得る(非特許文献5)。これらの交差は、リコードされたDNAと野生型DNAとの間の相同性の程度が高いと促進される:大腸菌ゲノム全体にわたり同義コドン圧縮を行うために本発明者らが使用した合成DNAと、対応する天然のゲノムDNA配列との間には、およそ98.5%の配列同一性がある(非特許文献14)。本発明者らはこれまでに、REXERから生じたキメラが、細胞によって許容されない合成DNAにおける配列の同定及び固定に非常に有用であり得ることを示している。本発明者らがREXERで観察した交差頻度は、合成DNAが対応するゲノムDNAを完全に置き換えている(細胞が合成DNA配列全体を許容していると推測される)8つのクローンのうち少なくとも1つを得るために十分に低いため、理想的である。同時に、交差頻度は、許容されない合成DNA配列内の領域(個々のコドン位置を含む)を効率的に特定できるほどに十分に高い。これは、いくつかのREXER後のクローン又はREXER後のクローンのプールのシーケンシング、並びに各コドン位置でのリコードの頻度の分析を介して行われ(非特許文献14、5)、各コドン位置でのリコードの頻度は、シーケンシングデータに基づいてリコードの状況をまとめることによって可視化することができる(
図2d)。一度もリコードされていないコドン位置は、試験中のスキームによるリコードを許容しない可能性がある。
【0195】
本発明者らはまず、96.5kbの大腸菌ゲノムを置き換えるための、同一のリコードされた合成DNA 100k24でのREXERで、ユニバーサルスペーサーRNAの使用とHR特異的なスペーサーRNAの使用とを比較した。以前のREXER実験から、本発明者らは、全ての設計された同義コドンの置き換えがこの領域で許容されることが分かっている(非特許文献14)。まとめられた状況は同様であるが、ユニバーサルスペーサーRNAで開始されたREXERは、2倍多くの、合成DNAが完全に組み込まれたクローンと、40%の完全にリコードされたREXER後のクローンをもたらした(
図2d及び
図5)。したがって、切除された合成DNAに短い非相同末端が存在しているにもかかわらず、本発明者らは、より高い頻度の交差を観察していない。驚くべきことに、ユニバーサルスペーサーでのREXERの全体的な効率は、HR特異的なスペーサーでの場合と少なくとも同様に良好である。
【0196】
本発明者らは、組換えのための鋳型上での末端ミスマッチの生成が組換え及び組み込みの効率を妨げないと結論付ける。本発明者らは、真核生物のFEN1について記載されているメカニズムと同様に(非特許文献21、22)、BAC内のDNAの非相同末端が組換えの前にエキソヌクレアーゼによって(非特許文献19)、又は組換えの間にEcoIXなどのフラップエンドヌクレアーゼによって(非特許文献20)除去され得ることを示唆する。
【0197】
REXERは、コンピテント細胞の調製及びエレクトロポレーションからなる2つの連続的なラウンドを必要とし、これは、適切にマークされたゲノムを有する細胞から開始して、REXER後の寒天プレート上でのクローンコロニーを得るまでに4日間を要する。ゲノムへの合成DNAの導入を短時間にし、単純化するために、本発明者らは、ユニバーサルスペーサーアレイ及びoriT配列がBAC骨格に組み込まれているBACを作製した(
図3、並びに配列番号26及び27)。これらの新たなBAC(合成DNAインサートを有する)及び伝達不可能なF’プラスミドを有する「ドナー細胞」と所望の「レシピエント細胞」とを混合したら、本発明者らは、接合伝達を介するレシピエントへのBAC伝達について選択した。本発明者らは、アラビノースで1.5時間、レシピエントにおけるヘルパープラスミドからのCas9タンパク質及びラムダレッド組換え成分の発現をオンにし、その後、グルコースで2.5時間、それらの発現をオフにした。スペーサーはBACから発現された。本発明者らは、ネガティブセレクションマーカーがゲノムから喪失しておりポジティブセレクションマーカーがBACから獲得されているレシピエント細胞について選択した。この1日のユニバーサルプロトコルを使用して、本発明者らは、レシピエント細胞において、対応するゲノムDNAの代わりに合成DNA(完全にリコードされた断片24、96kb)を導入した。クローンの19%で、合成DNAは対応するゲノム配列を完全に置き換えた(
図3b)。本発明者らは、本発明者らの短時間のアプローチをCONEXER(強化型組換えのためのプログラムされた切除と組み合わされた接合、CONjugation coupled with programmed EXcision for Enhanced Recombination)と名付けた。
[実施例2]
【0198】
エピソームにおけるMbpサイズのヒトDNAのアセンブリ
エピソーム内での大きなDNAのアセンブリは、ゲノム構築のための基礎的な技術を提供する。全体的に合成のマイコプラズマゲノムは、マイコプラズマへの伝達の前に酵母内でアセンブルされている。植物及び動物のGbpサイズのゲノムを数十から数百Mbpの長さの染色体で合成するには、妥当な数のステップの、染色体内のDNAを置き換えるために使用することができる、MbpサイズのDNAをアセンブルするための技術が必要である。
【0199】
特に、本質的に完全なヒトゲノムのシーケンシングに使用されるヒトDNAは、大腸菌内のBACに主にキャプチャーされた。多くの、ヒト、動物、及び作物のゲノム配列の反復的性質によって、大腸菌は、合成のGbpサイズのゲノムを構築するためのDNAをアセンブルするための魅力的な宿主である。本発明者らは、CONEXERについて本発明者らが確立した原理を、大腸菌内エピソームへのメガベースサイズのDNAの繰り返し挿入を介するスカーレスなアセンブリ及びクローニングの実現に拡張することができると仮定した。
【0200】
本発明者らは、その中にDNAを繰り返し挿入しアセンブルするためのアセンブリBACを設計した(
図6a)。このBACは、次に挿入される配列の一方の末端に相同なおよそ50bpの配列(HR1)を有する。このすぐ後には、ポジティブセレクションカセット及びネガティブセレクションカセット、並びに、挿入される配列の他方の末端に相補的なユニバーサル相同性領域(uHR)が続く。本発明者らはまた、ユニバーサルスペーサー及びoriTを有する、CONEXER骨格を有するドナーBACを設計した(
図6a)。ドナーBACでは、HR1は、レシピエントBACに挿入される次のDNA配列の一方の末端内にある。このDNA配列の次には、異なるポジティブセレクションカセット及びネガティブセレクションカセット、並びにユニバーサル相同性領域が続く。アセンブリの各ステップ(
図6a、
図6b)は、アセンブリBACを有するレシピエント細胞へのドナーBACの接合、ドナーBACからのHR1からユニバーサル相同性領域までの配列のCas9介在性の切除、及びアセンブリBACへのこの配列のラムダレッド介在性の挿入によって進められる。アセンブリBAC上でのネガティブセレクションマーカーの喪失、及びドナーBACから切除された配列からのポジティブマーカーの獲得についての選択は、挿入が正確なアセンブリBACを有する細胞を選択する。新たなアセンブリBACを有する細胞は、次の挿入ステップのためのインプットを提供する。本発明者らは、本発明者らのアプローチを、BACの段階的挿入合成(BASIS)と名付けた。
【0201】
本発明者らはまず、BASISによる208Kbpのヒト嚢胞性線維症膜貫通調節因子遺伝子のそのアセンブリを実証した。本発明者らは、各々がおよそ70Kbpの遺伝子断片を有する2つのドナーBACS及び1つのレシピエントエピソームでの3ステップのBASISでCFTR遺伝子をアセンブルした。本発明者らは、次世代シーケンシングによって各中間ステップアセンブリ及び最終アセンブリを検証した(
図6c)。
【0202】
次に、本発明者らは、BASISを、エクソン領域、イントロン領域、及び遺伝子間領域を含むヒトゲノムDNAの大きなセクションを1つのエピソームにアセンブルするために使用することができることを実証した。本発明者らは、ヒトゲノムの本質的に完全なシーケンシングに使用したヒトBACのライブラリーで開始した。これらのヒトBACの各々はおよそ100KbpのヒトDNAを有しており、ヒトBAC配列間にはかなりのオーバーラップが存在する。
【0203】
本発明者らは、1ステップのラムダレッド組換えを使用して、21番染色体の領域をカバーするヒトBACライブラリーのメンバーを、BASISのためのドナーBACに変換した。このステップは、ポジティブセレクションカセット及びネガティブセレクションカセット、uHR、oriT、並びにユニバーサルスペーサーを導入した。本発明者らは、3ステップのBASISを行って、495KbpのヒトDNAを有する503Kbpのエピソームをアセンブルした。本発明者らは、正確にアセンブルされたクローンをシーケンシングによって同定し、これらのクローンをBASISの次のステップのためのインプットとして使用し、最終アセンブリもシーケンシングによって検証した(
図6d)。
[実施例3]
【0204】
交差の最小化
本発明者らの大腸菌ゲノム合成において、REXERの各ステップの後にゲノムシーケンシングを行って、次のREXERラウンドのためのインプットとして使用することができる1つの正確なクローンを同定した。100KbpのゲノムDNAの全てを合成DNAで置き換えた各ステップからのクローンはおよそ20%のみであったため、進行に使用するための正確な中間クローンを同定することが必要であった。したがって、各ステップでの正確なクローンの同定を伴わない場合、5つのステップで得られる完全にリコードされたクローンの頻度は3×10-4以下であり、したがって、正確な配列を有する1つのクローンを同定するためには、何万ものクローンをシーケンシングする必要がある。したがって、REXERの各ステップの後のシーケンシングが、合成を完了するために必要であったが、これは合成を大きく遅延させ、その費用を増大させた。
【0205】
本発明者らは、1つのCONEXERに由来するクローンのシーケンシングされていないプールを次のCONEXERのためのインプットとして直接使用することによってCONEXERを繰り返すことを構想した。このために、本発明者らは、1ステップのCONEXERでゲノムDNAが合成DNAで完全に置き換えられているクローンの画分を実質的に増大させる因子を同定することにした。
【0206】
本発明者らは、DNAの修復、複製、及び組換えに関与する20個の因子を同定して、CONEXERへのそれらの寄与を試験した。本発明者らは、大腸菌内でこれらの因子の各々を欠失させ、得られた欠失株において100k 24でCONEXERを行った。これらの実験は、recA及びrecOを、完全に合成の配列を有するクローンの画分を増大させる因子として同定した(
図6a、
図9)。recAの欠失(ΔrecA)は、100k 24で、完全に合成のDNAの画分を20%からおよそ80%まで増大させた(
図7a)。本発明者らは、いくつかの他の100Kbpの領域で類似の劇的な増大を観察し、これは本発明者らの観察結果の普遍性を明確に示している(
図7b)。
[実施例5]
【0207】
迅速かつ連続的なゲノム合成
本発明者らが観察した、1ステップのCONEXERにおける合成DNAでのゲノムDNAでの完全な置き換えの増大に後押しされて、本発明者らは、1ラウンドのCONEXERのアウトプットを、個々の完全にリコードされたクローンをシーケンシングによって同定することなく、次のラウンドのCONEXERのためのインプットとして直接使用することができるかどうかを調べた。
【0208】
本発明者らはまずCONEXERを行って、そのゲノムのランディング部位(LS、landingsite)23に+2/-2セレクションカセットを有するΔrecA大腸菌において、LS23とLS24との間で、大腸菌ゲノムを合成のリコードされたDNAで置き換えた(
図8a、
図10)。本発明者らは、ゲノムからのネガティブ7マーカーの喪失(LS23にある+2/-2カセットにおける)及び合成DNAに関連するポジティブマーカーの獲得(LS24にある+1/-1カセットにおける)について選択した。本発明者らは、クローンをセレクションプレートから採取し、これらを一晩増殖させた。一晩の増殖と並行して、本発明者らは、クローンをセレクティブ寒天上にスタンプして、これらクローンが正確なCONEXER後表現型を確実に有するようにした。翌日、LS24とLS25との間のゲノムDNAが合成DNAで置き換えられている正確な表現型のクローンをプールし、次のラウンドのCONEXERのための直接的なインプットとして使用した(100k25)(
図8a)。本発明者らは、ゲノムからのネガティブマーカーの喪失(LS24にある+1/-1カセットにおける)及び合成DNAに関連するポジティブマーカーの獲得(LS25にある+2/-2カセットにおける)について選択した。本発明者らは、基本的には記載されている通りに、前ラウンドのCONEXERからクローンを採取し、プールし、そして、得られたプールを次のラウンドのCONEXERのためのインプットとして使用した(100k26)。本発明者らは、5ラウンドのCONEXERを行って、大腸菌ゲノムのLS23とLS28との間の0.5Mbpのセクションを合成DNAで置き換えた(
図8a)。プロセス全体は10日間を要した。シーケンシングによって、5ラウンドのCONEXERの後、標的化された0.5Mbpのゲノム領域全体で10パーセントのクローン(182のうち19)が完全にリコードされたことが明らかになった(
図5b)。本発明者らは、本発明者らが迅速かつ連続的なゲノム合成(GCS、continuous genome synthesis)のための方法を開発したと結論付ける。
【0209】
考察
本発明者らは、少なくとも100Kbpの合成DNAを大腸菌ゲノムに導入するための、1ステップの、1日の、ユニバーサルプロトコルを実現した。本発明者らは、宿主ゲノムと合成DNAとの間の交差を最小化し、連続的ゲノム合成を可能にする、宿主因子ノックアウトを同定した。本発明者らは、0.5Mbpの大腸菌ゲノムセクションをBACから10日間で構築するための、連続的ゲノム合成を実証した。この方法は並列化可能であるため、7~8株で、ゲノムをカバーしている合成DNAを約10日間で構築することが可能であろう。この利点を、0.5Mbpの合成のリコードされたセクションを1つの株にまとめるために得られた迅速で正確な方法と組み合わせることによって(非特許文献14、12)、本発明者らは、本発明者らの利点が、大腸菌ゲノムを合成するためのタイムスケールを数年から数週間まで減少させると予測する。さらに、本発明者らは、本発明者らのアプローチが多くのゲノムの並行した構築を可能にして、ゲノムレベルの仮説を大規模で試験すること及び新たな細胞機能を発見するためにゲノムライブラリーを作製することを可能にすると予測する。
【0210】
本発明者らが大腸菌ゲノム合成について確立した原理を拡張することによって、本発明者らは、大きなヒトゲノム領域を有するエピソームのスカーレスなアセンブリを実現した。本発明者らは、ヒトBAC由来の天然配列のアセンブリを介してこの原理を例示してきたが(Osoegawa, K. et al. Genome Res 11, 483-496, doi:10.1101/gr.169601 (2001))、このアプローチはまた、合成DNA断片をアセンブルするためにも使用することができる。さらに、ヒト、動物、又は植物の細胞におけるよりもはるかに迅速に、アセンブルされたヒトDNAの大きな領域を編集するために、大腸菌におけるマルチプレックス編集のための多くの方法(Wang, H. H. et al. Nature 460, 894-898, doi:10.1038/nature08187 (2009)、Tong, Y., et al. Nat Commun 12, 5206, doi:10.1038/s41467-021-25541-3 (2021)、Jiang, W., et al., Nat Biotechnol 31, 233-239, doi:10.1038/nbt.2508 (2013)、Farzadfard, F. & Lu, T. K. Science 346, 1256272, doi:10.1126/science.1256272 (2014))をアセンブリと組み合わせてもよい。これらの方法を、大きなエピソーム性のDNAを動物細胞内に移動させるため(Waters, V. L. Nat Genet 29, 375-376, doi:10.1038/ng779 (2001)、Litzkas, P., Jha, K. K. & Ozer, H. L. Mol Cell Biol 4, 2549-2552, doi:10.1128/mcb.4.11.2549-2552.1984 (1984))、及び動物染色体への合成DNAの繰り返し組換えのため(Martella, A., et al. ACS Synth Biol 6, 1380-1392, doi:10.1021/acssynbio.7b00016 (2017)、Lee, E. C. et al. Nat Biotechnol 32, 356-363, doi:10.1038/nbt.2825 (2014)、Macdonald, L. E. et al. Proc Natl Acad Sci U S A 111, 5147-5152, doi:10.1073/pnas.1323896111 (2014))のアプローチと組み合わせてもよい。
【0211】
全体として、エピソームにおいて大きなDNAを迅速にアセンブルする能力、及び連続的ゲノム合成方法の開発は、迅速かつスケーラブルなゲノム合成のための基礎を提供する。
【0212】
(参考文献)
1. Santos, C. N., Regitsky, D. D. & Yoshikuni, Y. Implementation of stable and complex biological systems through recombinase-assisted genome engineering. Nat Commun 4, 2503, doi:10.1038/ncomms3503 (2013).
2. Santos, C. N. & Yoshikuni, Y. Engineering complex biological systems in bacteria through recombinase-assisted genome engineering. Nat Protoc 9, 1320-1336, doi:10.1038/nprot.2014.084 (2014).
3. Krishnakumar, R. et al. Simultaneous non-contiguous deletions using large synthetic DNA and site-specific recombinases. Nucleic Acids Res 42, e111, doi:10.1093/nar/gku509 (2014).
4. Wang, G. et al. CRAGE enables rapid activation of biosynthetic gene clusters in undomesticated bacteria. Nat Microbiol 4, 2498-2510, doi:10.1038/s41564-019-0573-8 (2019).
5. Wang, K. et al. Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64, doi:10.1038/nature20124 (2016).
6. Itaya, M., Tsuge, K., Koizumi, M. & Fujita, K. Combining two genomes in one cell: stable cloning of the Synechocystis PCC6803 genome in the Bacillus subtilis 168 genome. Proc Natl Acad Sci U S A 102, 15971-15976, doi:10.1073/pnas.0503868102 (2005).
7. Lau, Y. H. et al. Large-scale recoding of a bacterial genome by iterative recombineering of synthetic DNA. Nucleic Acids Res 45, 6971-6980, doi:10.1093/nar/gkx415 (2017).
8. Lartigue, C. et al. Creating bacterial strains from genomes that have been cloned and engineered in yeast. Science 325, 1693-1696, doi:10.1126/science.1173759 (2009).
9. Ostrov, N. et al. Design, synthesis, and testing toward a 57-codon genome. Science 353, 819-822, doi:10.1126/science.aaf3639 (2016).
10. Dymond, J. S. et al. Synthetic chromosome arms function in yeast and generate phenotypic diversity by design. Nature 477, 471-476, doi:10.1038/nature10403 (2011).
11. Gibson, D. G. et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science 329, 52-56, doi:10.1126/science.1190719 (2010).
12. Wang, K., de la Torre, D., Robertson, W. E. & Chin, J. W. Programmed chromosome fission and fusion enable precise large-scale genome rearrangement and assembly. Science 365, 922-926, doi:10.1126/science.aay0737 (2019).
13. Hutchison, C. A., 3rd et al. Design and synthesis of a minimal bacterial genome. Science 351, aad6253, doi:10.1126/science.aad6253 (2016).
14. Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518, doi:10.1038/s41586-019-1192-5 (2019).
15. de la Torre, D. & Chin, J. W. Reprogramming the genetic code. Nat Rev Genet 22, 169-184, doi:10.1038/s41576-020-00307-7 (2021).
16. Mercy, G. et al. 3D organization of synthetic and scrambled chromosomes. Science 355, doi:10.1126/science.aaf4597 (2017).
17. Richardson, S. M. et al. Design of a synthetic yeast genome. Science 355, 1040-1044, doi:10.1126/science.aaf4557 (2017).
18. Venetz, J. E. et al. Chemical synthesis rewriting of a bacterial genome to achieve design flexibility and biological functionality. Proc Natl Acad Sci U S A 116, 8070-8079, doi:10.1073/pnas.1818259116 (2019).
19. Lovett, S. T. The DNA Damage Response. Bacterial Stress Responses, 341 2nd Edition, 205-228 (2011).
20. Anstey-Gilbert, C. S. et al. The structure of Escherichia coli ExoIX--implications for DNA binding and catalysis in flap endonucleases. Nucleic Acids Res 41, 8357-8367, doi:10.1093/nar/gkt591 (2013).
21. Liu, Y., Kao, H. I. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu Rev Biochem 73, 589-615, doi:10.1146/annurev.biochem.73.012803.092453 (2004).
22. Anzalone, A. V. et al. Search-and-replace genome editing without double-strand breaks or donor DNA. Nature 576, 149-157, doi:10.1038/s41586-019-1711-4 (2019).
【配列表】
【国際調査報告】