(58)【調査した分野】(Int.Cl.,DB名)
核酸ライブラリであって、該核酸ライブラリは、少なくとも500の非同一のDNA分子を含み、各非同一のDNA分子は異なるgRNA配列をコードし、各gRNA配列は哺乳類遺伝子に相補的な標的ドメインを含み、および、少なくとも500の非同一のDNA分子の少なくとも80%が、核酸ライブラリ中の非同一のDNA分子の各々について平均頻度の2倍以内の量で核酸ライブラリにそれぞれ存在する、核酸ライブラリ。
少なくとも500の非同一のDNA分子は、生物学的経路において、遺伝子を標的とするgRNA配列をコードする非同一のDNA分子を含む、請求項1に記載の核酸ライブラリ。
少なくとも500の非同一のDNA分子は、全ゲノムにおいて、遺伝子を標的とするgRNA配列をコードする非同一のDNA分子を含む、請求項1に記載の核酸ライブラリ。
少なくとも2000の非同一の核酸が、生物学的経路において、遺伝子を標的とするsgRNA配列をコードする非同一の核酸を含む、請求項11に記載の核酸ライブラリ。
アンプリコンライブラリであって、該アンプリコンライブラリは複数の非同一のDNA分子含み、各非同一のDNA分子は増幅産物の集団中に存在し、各非同一のDNA分子は異なるgRNA配列をコードし、各gRNA配列は真核生物の遺伝子に相補的な標的ドメインを含み、および複数の非同一のDNA分子の少なくとも80%は、アンプリコンライブラリ中の非同一のDNA分子の各々について平均頻度の2倍以内の量でアンプリコンライブラリにそれぞれ存在する、アンプリコンライブラリ。
【発明を実施するための形態】
【0015】
本明細書で提供されるのは、非常に正確なガイドRNA(「gRNA」)ライブラリの効率的な合成およびスクリーニングのための、システム、方法、および組成物である。本明細書にて記載されるデノボ合成方法は、標的遺伝子編集用の酵素システムに取り込むために、gRNAの大規模なライブラリの迅速で非常に正確な生成を提供する。
【0016】
定義
本開示の全体にわたって、様々な実施形態は範囲形式で提示される。範囲形式での記載は単に利便性と簡潔さのためのものに過ぎず、任意の実施形態の範囲に対する確固たる限定として解釈されてはならないということを理解されたい。これに応じて、範囲の記載は、文脈で別段の定めのない限り、すべての可能性のある下位範囲と、下限の単位の小数第2位までのその範囲内の個々の数値を具体的に開示したと考えられなければならない。例えば、1乃至6などの範囲の記載は、1乃至3、1乃至4、1乃至5、2乃至4、2乃至6、3乃至6などの下位範囲と、例えば、1.1、2、2.3、5、および5.9のその範囲内の個々の数値を具体的に開示したと考えられなければならない。これは、範囲の広さにかかわらず適用される。これらの介入する範囲の上限および下限は、より小さな範囲内に独立して含まれてもよく、また、定められた範囲内のあらゆる具体的に除外された限度に従って、本発明内に包含される。定められた範囲が上限および下限の1つ又はその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲もまた、文脈が明らかに他に指示しない限り、本発明内に包含される。
【0017】
本明細書で使用される用語は、特定の実施形態のみを記載するためにあり、任意の実施形態を制限することを意図していない。本明細書で使用されるように、単数形「1つ(a)、「1つ(an)」、および「その(the)」は、文脈上他の意味を明白に示すものでない限り、同様に複数形を含むことを意図している。用語「含む(comprises)」および/または「含むこと(comprising)」は、本明細書で使用されるとき、明示される特徴、整数、工程、操作、要素、および/または構成要素の存在を指定するが、1つ以上の他の特徴、整数、工程、操作、要素、構成要素、そのおよび/またはその群の存在や添加を妨げない。本明細書で使用されるように、用語「および/または」は、関連する列挙された項目の1つ以上のあらゆる組み合わせを含む。
【0018】
別段の定めのない限り、あるいは文脈から明らかでない限り、本明細書で使用されるように、数あるいは数の範囲に関連して用語「約」とは、明示された数とその数+/−10%、あるいはある範囲の列挙された値について列挙された下限の10%以下と列挙された10%以上を意味する。
【0019】
本明細書において言及される用語「gRNA」は、ガイドRNAは配列を指し、単一および二重のガイドRNA配列の両方を包含する。本明細書では、具体的に明示されるか文脈から明らかでない限り、本明細書において言及される用語「dgRNA」は二重のガイドRNA配列を指す:部分的に相補的RNAである、crRNA(標的配列への相補的なシード領域を含むスペーサー配列)および個別のtracrRNA(トランス活性化配列)。本明細書では、具体的に明示されるか文脈から明らかでない限り、本明細書において言及される用語「sgRNA」は、縮合crRNAおよびtracrRNAの両方を含む単一ガイドRNA配列を指す。
【0020】
本明細書では、具体的に明示されるか文脈から明らかでない限り、用語「オリゴ核酸」および「核酸」は、一本鎖の分子と同様に、二本または三本鎖の核酸も包含する。二本または三本鎖の核酸において、核酸鎖は同一の広がりをもつ必要はない(つまり、二本鎖の核酸は、両方の鎖の全長に沿って二本鎖である必要はない)。特に明記されない限り、核酸配列は提供される時、5’から3’の方向へと列挙される。本明細書に記載される方法は、単離された核酸の生成を提供する。本明細書に記載される方法はさらに、単離精製された核酸の生成を提供する。本明細書で言及される「オリゴ核酸」および「核酸」は、少なくとも、5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、またはより多くの塩基の長さを含むことができる。
【0021】
本明細書では、具体的に明示されるか文脈から明らかでない限り、本明細書で言及される用語「アンプリコン」は、増幅反応物を指す。
【0022】
本開示は、別段の定めのない限り、当該技術の範囲内である従来の分子生物学的技術を採用する。別段の定めのない限り、本明細書で使用されるすべての技術的および科学的な用語は、これらの発明が属する分野の当業者によって一般に理解されるのと同じ意味を有する。
【0023】
gRNAライブラリ・スクリーニング
本明細書で提供されるのは、クラスタ化して規則的な配置の短い回文配列リピート(CRISPR)−酵素複合体中での取り込みのための、非常に正確なgRNAライブラリを設計、構築、およびスクリーニングするための方法である。例えば、
図1A−ABを参照する。本明細書に記載された方法を用いて生成されたgRNAライブラリは、sgRNAライブラリおよびdgRNAライブラリの両方を含む。本明細書で提供されるのは、結果としてもたらされるライブラリで、予め決められたgRNAの高度な表示をもたらす非常に均一な合成のための方法である。設計段階では、gRNAが設計される。
図2を参照する。設計戦略は、遺伝子に及ぶgRNAの設計が挙げられるが、これに限定されない。所望のワークフローに応じて、デノボ合成された核酸はDNAまたはRNA塩基である。
【0024】
デノボ合成されたDNAの場合、核酸を含むライブラリは合成され、ここで合成された各核酸は、転写産物としてのgRNA(例えばsgRNA)配列をコードするDNA配列である。いくつかの例では、合成された核酸はその後、発現ベクターへと挿入される。1つの例示的なワークフローでは、合成された核酸はウイルスベクターへと挿入され、細胞へと形質導入するためにパッケージされ、続いてスクリーニングおよび分析される。
図2を参照。典型的な細胞は、限定することなく、原核細胞および真核細胞を含む。典型的な真核細胞は、限定することなく、動物、植物および真菌の細胞を含む。典型的な動物細胞は、限定することなく、昆虫、魚、および哺乳動物の細胞を含む。典型的な哺乳動物細胞は、マウス、ヒト、および霊長類の細胞を含む。試験される典型的な細胞機能は、限定することなく、細胞増殖における変化、遊走/接着、代謝活性、および細胞シグナル伝達活性を含む。デノボ合成されたRNAの場合、gRNAそれ自身が合成され、細胞へのトランスフェクションなどの下流の適用に利用可能である。
【0025】
オリゴ核酸は、アレイ(301)上で伸長するために、クラスタ(303)の位置(「遺伝子座」)内で合成されることができる。
図3を参照する。そのような構成は、クラスタ化された遺伝子座構成のないプレート全体にわたって合成されたオリゴ核酸の増幅産物と比較した時、合成されたオリゴ核酸のオリゴ核酸からの改善された産物のオリゴ核酸表示−“アンプリコン”と呼ばれる−を提供する。いくつかの例では、一般的に「ドリフト」と呼ばれる、重度のGC含有量を有するオリゴ核酸を有する多くのオリゴ核酸集団の繰り返された合成により、増幅反応物におけるGCの低いまたはGCの高いアンプリコンの提示不足により、単一のクラスタ内で合成されたオリゴ核酸の増幅(310)は、表示における負の効果に対抗する。いくつかの例では、本明細書に記載される単一のクラスタは、50−1000、75−900、100−800、125−700、150−600、200−500、または300−400の別々の遺伝子座を含む。いくつかの例では、単一のクラスタは、50−500別々の遺伝子座を含む。いくつかの例では、遺伝子座は、スポット、ウェル、マイクロウェル、チャネル、またはポストである。いくつかの例では、各クラスタは、同一の配列を有するオリゴ核酸の伸長を支持する別個の特徴の、少なくとも1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、またはより多くの冗長性を有する。
【0026】
本明細書で提供されるのは、発現ベクターに挿入するためのgRNAライブラリである。
図3におけるワークフローを続けて見ると、アレイ(301)は、オリゴ核酸合成および伸長のための遺伝子座の多数のクラスタ(303)を含む。デノボDNAは合成されプレートから取り除かれて、オリゴ核酸の集団(305)(例えばsgRNAをコードするDNA)を形成し、これは、増幅(310)を受けてベクター(330)の挿入のための増幅したオリゴ核酸のライブラリ(320)を形成し、合成されたDNA(335)を含むベクターのライブラリを形成する。一旦細胞内に入ると、DNAはgRNA(例えばsgRNA)に転写され、ゲノム編集レジーム(genomic editing regime)(例えば、Cas9に基づいたシステム)との結合に利用可能となる。細胞は、編集酵素(例えばCas9)の自然発現または異所的発現を有してもよい。編集酵素(例えばCas9)は、二本鎖DNA切断活性、あるいは、ニッキング、塩基交換、または配列交換活性などの修飾された活性を有してもよい。ベクターへの挿入のために合成されたDNAは、sgRNA、dgRNA、またはそれらの断片を含み得る。
【0027】
本明細書に開示される核酸ライブラリを挿入するための発現ベクターは、真核生物または原核生物の発現ベクターを含む。典型的な発現ベクターは、限定することなく、哺乳動物の発現ベクター:pSF−CMV−NEO−NH2−PPT−3XFLAG、pSF−CMV−NEO−COOH−3XFLAG、pSF−CMV−PURO−NH2−GST−TEV、pSF−OXB20−COOH−TEV−FLAG(R)−6His、pCEP4 pDEST27、pSF−CMV−Ub−KrYFP、pSF−CMV−FMDV−daGFP、pEF1a−mCherry−N1ベクター、pEF1a−tdTomatoベクター、pSF−CMV−FMDV−Hygro、pSF−CMV−PGK−Puro、pMCP−タグ(m)、およびpSF−CMV−PURO−NH2−CMYC;細菌性の発現ベクター:pSF−OXB20−BetaGal、pSF−OXB20−Fluc、pSF−OXB20、およびpSF−Tac;植物の発現ベクター:pRI 101−AN DNAおよびpCambia2301;および、酵母発現ベクター:pTYB21およびpKLAC2、および昆虫のベクター:pAc5.1/V5−His AおよびpDEST8を含む。
【0028】
本明細書に記載される方法によって合成されたデノボオリゴ核酸ライブラリは、細胞内で発現され得る。いくつかの例では、細胞は疾患状態と関連している。例えば、疾患状態に関連付けられる細胞として、これらに限定されないが、被験体からの細胞株、組織サンプル、初代細胞、被験体からの増殖された培養細胞、またはモデルシステムにおける細胞が挙げられる。いくつかの例では、モデルシステムは、植物または動物のシステムである。いくつかの例では、デノボオリゴ核酸ライブラリは、細胞活動における変化について評価するために細胞内で発現され得る。典型的な細胞活性として、これらに限定されないが、増殖、周期進行、細胞死、接着、遊走、繁殖、細胞シグナル伝達、エネルギー産生、酸素利用、代謝活性、および老化、遊離基損傷に対する反応、またはそれらの任意の組み合わせが挙げられる。
【0029】
本明細書で提供されるのは、遺伝子あたり複数の非同一のgRNAを含むgRNAライブラリ(または、転写された時にgRNAライブラリをもたらすDNAライブラリ)を合成する方法である。gRNAは、sgRNAまたはdgRNAをコードし得る。いくつかの例では、gRNAライブラリは、遺伝子あたり少なくとも、3、4、5、6、7、8、9、10、または10よりも多い非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、1以上の遺伝子を標的にする。いくつかの例では、gRNAライブラリは、約1、5、10、20、30、40、50、60、70、80、90、100、または100よりも多い遺伝子を標的にする。いくつかの例では、gRNAライブラリは、約1−100、2−95、5−90、10−85、15−80、20−75、25−70、30−65、35−60、または40−50の遺伝子を標的にする。いくつかの例では、本明細書に記載されるgRNAライブラリは、経路内の遺伝子を標的にする。典型的な経路として、これらに限定されないが、代謝、細胞死、細胞周期進行、免疫細胞活性化、炎症反応、血管新生、リンパ球新生、低酸素ストレス応答、酸化ストレス応答、または細胞接着、および細胞遊走経路が挙げられる。
【0030】
本明細書で記載されるようなgRNAライブラリを合成するための方法は、ゲノムの一部への相補的な塩基対合領域、ゲノム標的領域を有する非同一のgRNAの合成を提供し得る。ゲノム標的領域は、エクソン、イントロン、コーディング、または非コーディングの配列を含んでもよい。いくつかの例では、gRNAライブラリは、全ゲノム中の遺伝子の少なくともまたは約5%に相補的な塩基対合領域を相対的に有する非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、全ゲノム中の遺伝子の少なくともまたは約80%に相補的な塩基対合領域を相対的に有する非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、全ゲノム中の遺伝子の少なくともまたは約90%に相補的な塩基対合領域を相対的に有する非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、全ゲノム中の遺伝子の少なくともまたは約95%に相補的な塩基対合領域を相対的に有する非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、全ゲノム中の遺伝子の少なくともまたは約100%に相補的な塩基対合領域を相対的に有する非同一のgRNAを含む。
【0031】
本明細書で提供されるのは、様々な細胞にわたる遺伝子の少なくとも2倍の枯渇を有するgRNAをもたらす、本明細書に記載される方法によって合成されたgRNAライブラリである。いくつかの例では、gRNAライブラリは、細胞内または複数の細胞集団内に存在する時に、少なくともあるいは、約10%、12%、15%、16%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、またはより多くの少なくとも2倍の遺伝子の枯渇を提供するgRNAを含む。いくつかの例では、遺伝子は必須遺伝子、つまり、細胞生存のために重大な遺伝子である。例示的な必須遺伝子は、これらに限定されないが、PCNA、PSMA7、RPP21、およびSF3B3が挙げられる。いくつかの例では、gRNAライブラリは、細胞内に存在する時に、少なくとも2倍、3倍、4倍、5倍、6倍、または6倍よりも多い遺伝子の枯渇を提供するgRNAを含む。いくつかの例では、gRNAライブラリは、細胞内または複数の細胞集団内に存在する時に、最大で5%、10%、12%、15%、または20%の遺伝子のゼロまたは負の枯渇を有するgRNA含む。いくつかの例では、複数の細胞集団は、少なくともまたは約2000、3000、4000、5000、6000、7000、8000、9000、10000、12000、15000、20000、25000、30000、または30000よりも多い細胞集団を含む。いくつかの例では、gRNAライブラリは、複数の遺伝子について、少なくとも2倍、3倍、4倍、5倍、6倍、または6倍よりも多い枯渇を有するgRNAを含む。いくつかの例では、gRNAライブラリは、複数の遺伝子について少なくとも2倍の枯渇を提供する平均で少なくともまたは約40%、45%、50%、60%、65%、70%、75%、80%、または90%よりも多いgRNAを含む。そのような遺伝子欠失プロファイルを提供するgRNAは、sgRNAまたはdgRNAでありえる。
【0032】
本明細書で提供されるのは、オリゴ核酸の非常に均一なライブラリを合成する方法である。場合によっては、90%よりも多い合成されたオリゴ核酸(RNAまたはDNA)が、核酸ライブラリのためのオリゴ核酸表示について、平均の4倍以内で表わされる。場合によっては、90%よりも多いオリゴ核酸が、ライブラリのためのオリゴ核酸表示について平均の2倍以内で表わされる。場合によっては、90%よりも多いオリゴ核酸が、ライブラリのためのオリゴ核酸表示について平均の1.5倍以内で表わされる。場合によっては、80%よりも多いオリゴ核酸が、ライブラリのためのオリゴ核酸表示について平均の1.5倍以内で表わされる。
【0033】
本明細書に記載される方法によってデノボ合成されたオリゴ核酸ライブラリは、予め決められた配列と比較して、高い割合の正確な配列を含む。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、70%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、75%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、80%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、85%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、90%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、95%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、オリゴ核酸について予め決められた配列と比較して、100%を超える正確な配列を有する。
【0034】
いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応後のオリゴ核酸についての予め決められた配列と比較して、70%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応後のオリゴ核酸についての予め決められた配列と比較して、75%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応後のオリゴ核酸についての予め決められた配列と比較して、80%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応後のオリゴ核酸についての予め決められた配列と比較して、85%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応後のオリゴ核酸についての予め決められた配列と比較して、90%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応後のオリゴ核酸についての予め決められた配列と比較して、95%を超える正確な配列を有する。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、増幅反応に続くオリゴ核酸のための予め決められた配列と比較すると、100%の正確な配列を有する。
【0035】
いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内に移された時、オリゴ核酸についての予め決められた配列と比較して、80%を超える正確な配列をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内に移された時、オリゴ核酸についての予め決められた配列と比較して、85%を超える正確な配列をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内に移された時、オリゴ核酸についての予め決められた配列と比較して、90%を超える正確な配列をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内に移された時、オリゴ核酸についての予め決められた配列と比較して、95%を超える正確な配列をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内へ移された時、オリゴ核酸についての予め決められた配列と比較して、100%正確な配列をもたらす。
【0036】
いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内へ移された時、80%を超える配列表示をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内へ移された時、90%を超える配列表示をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内へ移された時、95%を超える配列表示をもたらす。いくつかの例では、本明細書に開示されるデノボ合成されたオリゴ核酸ライブラリは、細胞内へ移された時、100%の配列表示をもたらす。
【0037】
本明細書に記載されるデノボオリゴ核酸ライブラリは、ポリメラーゼ酵素および増幅試薬(例えば緩衝剤、リン酸塩、およびデオキシヌクレオチド三リン酸)の添加を有する増幅反応を受けてもよい。いくつかの例では、デノボオリゴ核酸ライブラリは、少なくともまたは約6、8、10、15、20、または20よりも多いサイクルのPCRによって増幅される。いくつかの例では、デノボオリゴ核酸ライブラリは、約6〜20、7〜18、8〜17、9〜16または10〜15のサイクルの範囲でPCRによって増幅される。いくつかの例では、デノボオリゴ核酸ライブラリは、約15のサイクルのPCRによって増幅される。
【0038】
いくつかの例では、デノボオリゴ核酸ライブラリの増幅は、DNA分子のアンプリコンライブラリを提供する。いくつかの例では、アンプリコンライブラリは、gRNA配列をコードする非同一の核酸を含む。いくつかの実例では、gRNA配列はsgRNAまたはdgRNAである。
【0039】
いくつかの例では、デノボオリゴ核酸ライブラリは非同一の核酸を含み、各非同一の核酸はDNA分子を含む。いくつかの例では、DNA分子の数は、約500、2000、3500、または3500より多い分子である。いくつかの例では、DNA分子の数は、少なくともまたは約、250、500、1000、1250、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、15000、20000、50000、100000、250000、750000、1000000、または1000000より多い分子である。いくつかの例では、DNA分子の数は最大で、250、500、1000、1250、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、15000、20000、50000、100000、250000、500000、750000、1000000、または1000000よりも多い分子である。いくつかの例では、DNA分子はgRNA配列をコードする。いくつかの実例では、gRNA配列はsgRNAまたはdgRNAである。
【0040】
いくつかの例では、デノボオリゴ核酸ライブラリは非同一の核酸を含み、各非同一の核酸はRNA分子を含む。いくつかの例では、RNA分子の数が約2000の分子である。いくつかの例では、RNA分子の数は、少なくともまたは約、250、500、1000、1250、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、15000、20000、50000、100000、250000、750000、1000000、または1000000よりも多い分子である。いくつかの例では、RNA分子の数は、最大で、250、500、1000、1250、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、15000、20000、50000、100000、250000、500000、750000、1000000、または1000000よりも多い分子である。いくつかの例では、RNA分子はgRNA配列をコードする。いくつかの実例では、gRNA配列はsgRNAまたはdgRNAである。
【0041】
本明細書で提供されるのは、増幅後の高い均一性を有するデノボオリゴ核酸ライブラリである。いくつかの例では、本明細書に記載されるデノボオリゴ核酸ライブラリ内の80%より多くのオリゴ核酸は、増幅後のライブラリ全体について、平均表示の少なくとも約1.5倍以内で表わされる。いくつかの例では、本明細書に記載されるデノボオリゴ核酸ライブラリ内の90%より多くのオリゴ核酸は、増幅後のライブラリ全体について、平均表示の少なくとも約1.5倍以内で表わされる。いくつかの例では、本明細書に記載されるデノボオリゴ核酸ライブラリ内の80%より多くのオリゴ核酸は、増幅後のライブラリ全体について、平均表示の少なくとも約2倍以内で表わされる。いくつかの例では、本明細書に記載されるデノボオリゴ核酸ライブラリ内の80%より多くのオリゴ核酸は、増幅後のライブラリ全体について、平均表示の少なくとも約2倍以内で表わされる。
【0042】
本明細書に記載され方法を用いるデノボ合成されたオリゴ核酸の非増幅集団は、非同一のオリゴ核酸配列の数を変えることができる。いくつかの例では、非同一のオリゴ核酸配列の数は、約2000−1000000、3000−900000、4000−800000、5000−700000、6000−600000、7000−500000、8000−400000、9000−300000、10000−200000、11000−100000、12000−75000、14000−60000、および20000−50000の配列の範囲である。場合によっては、非同一のオリゴ核酸配列の数は、約50−2000、75−1800、100−1700、150−1600、200−1500、250−1400、300−1300、400−1200、500−1100、600−1000、700−900の配列の範囲である。いくつかの例では、非同一のオリゴ核酸配列の数は2000の配列である。いくつかの例では、非同一のオリゴ核酸配列の数は1000000よりも多い配列である。いくつかの例では、非同一のオリゴ核酸配列の数は、少なくとも、50、100、200、400、600、800、1000、1200、1400、1600、1800、2000、3000、5000、7000、10000、20000、30000、50000、100000、500000、700000、1000000、10000000、1000000000、または1000000000より多くの配列である。いくつかの例では、非同一のオリゴ核酸配列の数は、最大で、50、100、200、400、600、800、1000、1200、1400、1600、1800、2000、3000、5000、7000、10000、20000、30000、50000、100000、500000、700000、1000000、または1000000より多くの配列である。いくつかの例では、非同一のオリゴ核酸配列の数は、最大で、50、100、200、400、600、800、1000、1200、1400、1600、1800、2000、3000、5000、7000、10000、20000、30000、50000、100000、500000、700000、および1000000の配列である。
【0043】
非増幅集団のオリゴ核酸は、様々な量で存在する。いくつかの例では、非増幅集団のオリゴ核酸は、少なくともまたは約0.25fmol/mgの量で存在する。いくつかの例では、非増幅集団のオリゴ核酸は、少なくともまたは約1fmol/mgの量で存在する。いくつかの例では、非増幅集団のオリゴ核酸は、少なくとも0.25、1、10、20、30、40、50、100、250、500、750、1000、または1000fmol/mgよりも多い量で存在する。いくつかの例では、非増幅集団のオリゴ核酸は、最大で、0.25、1、10、20、30、40、50、100、250、500、750、および1000fmol/mgの量で存在する。
【0044】
本明細書で提供されるのは、非同一のオリゴ核酸のライブラリを合成するための方法であり、非同一のオリゴ核酸の配列長または平均の配列長は様々である。場合によっては、非同一のオリゴ核酸の配列長または平均配列長は、最大で150塩基である。場合によっては、非同一のオリゴ核酸の配列長または平均配列長は、約100〜約200の塩基の範囲である。いくつかの例では、非同一のオリゴ核酸の配列長または平均配列長は、少なくとも、30、50、100、125、150、200、250、300、350、400、450、500、あるいは500よりも多い塩基である。いくつかの例では、非同一のオリゴ核酸の配列長または平均配列長は、最大で、150、200、250の、300、350、400、450、あるいは500の塩基である。非同一のオリゴ核酸の例示的な配列長は、約25〜約150、あるいは約50〜約200の塩基の範囲である。場合によっては、非同一のオリゴ核酸の配列長または平均配列長は、約125〜約200、あるいは約150〜約200の塩基の範囲である。
【0046】
本明細書で提供されるのは、特定の標的核酸配列にゲノム配列編集酵素(例えばCas9)を向けるための、単一ガイドRNA(sgRNA)配列である。Cas9酵素と複合したsgRNAの例が
図4Aで例示され、単独の例が
図4Bで例示される。gRNAは、
図4Cに例示されるような二重のガイドRNAであってもよい。本明細書に開示されるガイド配列は、塩基対合領域を含む。塩基対合領域は、標的配列に結合するためのシード領域、および随意にスペーサー領域を含む。塩基対合領域は、長さが変わってもよい。例えば、塩基対合領域は、約1〜10、1〜20、20〜25、または1〜30の塩基の長さを含んでもよい。いくつかの例において、塩基対合領域は、少なくとも、10、15、20、25、30、または30より多くの塩基の長さを含む。いくつかの例では、塩基対合領域は、少なくとも10の塩基の長さのシード領域を含む。シード領域は、約8〜20の塩基の長さを含み得る。いくつかの例では、シード領域は約12の塩基の長さである。いくつかの例では、本明細書に記載される塩基対合領域は、転写中に鋳型鎖を標的とするように設計される(
図5A)。いくつかの例では、本明細書に記載される塩基対合領域は、転写中に非鋳型鎖を標的とするように設計される(
図5B)。
【0047】
いくつかの例では、sgRNAの塩基対合領域の3’は、Cas9に結合するためのCas9ハンドル領域である。いくつかの例では、Cas9ハンドル領域は、dCas9酵素に結合するためのdCas9ハンドル領域である。ハンドル領域は、長さが変わってもよい。例えば、ハンドル領域は、約1〜50、20〜45、または15〜60の塩基の長さを含み得る。いくつかの例において、ハンドル領域は、少なくとも、35、40、45、50、または50より多くの塩基の長さを含む。ハンドル領域は、約42の塩基の長さを含み得る。
【0048】
いくつかの例では、sgRNAのハンドル領域の3’は、終結領域である。いくつかの例では、終結領域は化膿性連鎖球菌の終結領域である。いくつかの例では、終結領域は約40の塩基の長さを含む。いくつかの例では、終結領域は約10〜50、20〜60、または30〜55の塩基の長さを含む。
【0049】
本明細書に記載されるgRNA配列のための設計スキームは、gRNA配列をコードするDNAのDNA依存性RNAポリメラーゼ・プロモーター領域5’上流の包含を含み得る。例示的なDNA依存性RNAポリメラーゼ・プロモーター領域として、これらに限定されないが、T3およびT7 RNAポリメラーゼ・プロモーター配列が挙げられる。例えば、
図6Aは、T7 プロモーター領域がgRNAの5’上流にあり、結果としての転写されたgRNAが生成され、ここで、gRNAがヘアピンを含む構成を示す。いくつかの構成では、gRNAは、ヘアピン二次構造を形成する配列を欠くように設計される(
図6B)。ヘアピン二次構造は、Cas9ハンドルおよび/または終結領域内で欠いていることもある。
【0050】
本明細書で提供されるのは、ゲノム配列編集酵素(例えばCas9)を特定の標的核酸配列に向けるためのdgRNAである。いくつかの例では、ライブラリはdgRNAのための配列をコードするオリゴ核酸配列を含む。いくつかの例では、ライブラリは核酸を含み、ここで、合成された各核酸は、転写産物としてのdgRNA配列をコードするDNA配列である。いくつかの例では、ライブラリは核酸を含み、ここで、合成された各核酸はRNA配列であり、dgRNA自体は合成される。いくつかの例では、dgRNAライブラリは、別個のオリゴ核酸として合成されるcrRNAおよびtracrRNAのためのオリゴ核酸配列を含む。いくつかの例では、オリゴ核酸は、crRNAおよびtracrRNAを別々にコードする。いくつかの例では、オリゴ核酸は、転写された時に個別のcrRNA配列および個別のtracrRNA配列をもたらす単一の配列をコードする。crRNAおよびtracrRNAのための例示的な配列は、表1で見られる。
【0052】
本明細書に記載されるgRNAライブラリは、インビトロスクリーニングおよび分析のために使用され得る。そのような構成の例が
図7で示され、標的の二本鎖のDNA配列がgRNA配列およびCas9酵素と共にインキュベートする。その混合物は、二重鎖DNA切断をもたらす。DNA切断は、ゲノム要素の機能または発現において測定可能な変化をもたらす。本明細書に記載されるgRNA、またはgRNAをコードするDNAは、当技術分野において既知の様々な方法で細胞に加えられ、これらの方法としては、限定されないが、トランスフェクション、形質導入、またはエレクトロポレーションが挙げられる。
【0053】
いくつかの例では、本明細書に記載されるgRNAライブラリは、インビボまたはエクスビボのスクリーニングおよび分析のために使用される。スクリーニングのための細胞は、生物体または細胞株から取られた初代細胞を含む。細胞は、原核生物(例えば、バクテリアおよび菌類)または真核生物(例えば、動植物)からのものであってもよい。例示的な動物細胞としては、これらに限定されないが、マウス、ウサギ、霊長類、および昆虫からのものが挙げられる。いくつかの例では、本明細書に記載されるgRNAライブラリは、多細胞生物に提供されてもよい。例示的な多細胞生物としては、これらに限定されないが、植物、マウス、ウサギ、霊長類、および昆虫が挙げられる。
【0055】
本明細書で提供されるのは、特定の標的核酸配列のヌクレアーゼ標的化のための核酸を含むライブラリである。いくつかの例では、本明細書に記載されるライブラリは合成された核酸を含み、ここで、核酸は、DNA、RNA、任意のアナログ、またはそれらの誘導体である。いくつかの例では、標的核酸配列は、DNA、RNA、任意のアナログ、あるいはそれらの誘導体を含む。いくつかの例では、ヌクレアーゼは標的核酸配列を切断する。いくつかの例では、ヌクレアーゼは標的核酸を結合するが、それを切断しない。ヌクレアーゼの型としては、これらに限定されないが、 転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ(ZFN)、メガヌクレアーゼ、アルゴノート、およびクラスタ化して規則的な配置の短い回文配列リピート(CRISPR)−関連の(Cas)タンパク質が挙げられる。いくつかの例では、ヌクレアーゼは野生型、遺伝子組換え型、または組み換え型である。
【0056】
標的遺伝子編集のためのモデルシステムは、Cas9に基づくアプローチを含む。gRNAと共に細胞内に発現されたか移された時、Cas9は、mRNAのクラスタ化して規則的な配置の短い回文配列リピート(CRISPR)配列との複合体を介して、遺伝子情報の標的導入または欠失を可能にする。
図1A−1Bに例示されるようなCas9複合体は、ガイドRNA(「gRNA」)転写産物と係合するCas9タンパク質を含む。例示されるgRNAは、標的配列領域、PAM領域、およびヘアピン領域を含む。CRISPR/Cas9プロセスでは、gRNAは、Cas9酵素を特異的なひと続きのDNAに誘導する。示されたgRNAはsgRNA(一本鎖のガイドRNA)であるが、複合体はdgRNA(二本鎖のガイドRNA)と共に形成されてもよい。その後、Cas9は、遺伝子を不能にするか修復するためにDNAを切断する。このプロセスへの例示的な修正の非限定的なリストが本明細書で記載される。CRISPR/dCas9プロセスにおいて、不能にされたまたは「死んでいる」Cas9(「dCas9」)は、もはやスプライシング機能を有さないが、別の酵素活性の添加によって、異なる標的分子修正機能を果たす。例えば、シチジンデアミナーゼのdCas9への繋留は、C−G DNA塩基対をT−A 塩基対へと変換する。他のdCas9プロセスでは、dCas9に繋留された異なる酵素は、標的DNA内で塩基CをTへ、または塩基GをAへと変更することをもたらす。あるいは、dCas9プロセスは、RNAポリメラーゼ活性を遮断するか活性化するために、転写因子の融合によって修飾することができ、結果として遺伝子転写の遮断(CRISPRi)または活性化(CRISPRa)をもたらし、したがって遺伝子発現を調節する。例えば、dCas9プロセスは転写抑制因子との融合によって修飾される。いくつかの例では、dCas9プロセスは、転写活性化因子との融合によって修飾される。いくつかの例では、dCas9プロセスは、複数の転写抑制因子または転写活性化因子との融合によって修飾される。他の構成では、gRNAは切断のための複数の部位を有し、遺伝子編集のための複数の領域を有するgRNAを結果としてもたらす。Cas9n、すなわち「ニッキングCas9」の場合には、RuvCまたはHNHの切断ドメインのいずれかが不活性になるように修正される。この不活性化は、Cas9が、二本鎖切断ではなく、DNAにおける一本鎖切断(ニック)を生成することしかできないようにさせる。いくつかの構成では、2つのCas9n酵素、各鎖に1本ずつ、が二本鎖切断を生成するために使用される。それらが、切断部位の上流および下流の領域の両方を認識することができるように、オフターゲット効果が除去される。hfCas9の場合には、オフターゲット効果のないCas9切断を生成するために、二重のCas9nタンパク質を使用する代わりに、修飾されたCas9酵素が、結合標的特異性のストリンジェンシーを緩めて酵素活性に先立って完全未満の適合を可能にする。いくつかの例では、dCas9プロセスは標的核酸を検知するためのラベルまたはタグとの融合によって、修飾される。例えば、ラベルは、標的核酸を検知するための蛍光性のマーカー(例えばGFP)である。いくつかの例では、dCas9はエピトープタグと融合し、gRNAによって特定された標的核酸の精製のために使用される。
【0057】
本明細書で提供されるのは、ヌクレアーゼを特定の標的核酸配列に向けるための核酸を含むライブラリ。いくつかの例では、標的核酸配列はDNAを含む。いくつかの例では、標的核酸配列はRNAを含む。例えば、C2c2を方向付けるための核酸を含むライブラリは、RNA配列を標的とするために生成される。いくつかの例では、DNAまたはRNAは一本鎖のまたは二本鎖である。
【0058】
本明細書で提供されるのは、特定の標的核酸配列のヌクレアーゼ標的化のための核酸を含むライブラリであり、ここで、ヌクレアーゼは、これらに限定されないが、連鎖球菌属、カンピロバクター属、ニトラティフラクター属(Nitratifractor)、ブドウ球菌属、パービバキュラム属(Parvibaculum)、ロゼブリア、ナイセリア属、グルコンアセトバクター属(Gluconacetobacter)、アゾスピリルム属(Azospirillum)、フェロケタ属(Sphaerochaeta)、乳酸桿菌属、ユーバクテリウム属、コリネバクテリウム属(Corynebacter)、カルノバクテリウム属(Carnobacterium)、ロドバクター属(Rhodobacter)、リステリア菌、パルディバクター属(Paludibacter)、クロストリジウム属、ラクノスピラ科(Lachnospiraceae)、クロストリジアリジウム属(Clostridiaridium)、レプトトリキア属(Leptotrichia)、フランシセラ属、レジオネラ属、アリシクロバチルス属(Alicyclobacillus)、メタノメチオフィラス属(Methanomethyophilus)、ポルフィロモナス属(Porphyromonas)、プレボテラ属(Prevotella)、バクテロイデス門(Bacteroidetes)、ヘルココッカス属(Helcococcus)、レプトスピラ属(Letospira)、デサルフォビブリオ属、デスルフォナトロナム属(Desulfonatronum)、デスルフロコッカス属(Desulfurococcus)、オピトゥトゥス科(Opitutaceae)、テュベリバシラス属(Tuberibacillus)、かん菌、ブレビバチルス属(Brevibacilus)、メチロバクテリウム属(Methylobacterium)、ナトロノバクテリウム属(Natronobacterium)、フラボバクテリウム属、サッカロミケス属、クラミドモナス属、サーマス属、パイロコッカス属(Pyrococcus)、マイコプラズマ属、またはアシダミノコッカス属の種に由来する。例示的なヌクレアーゼは、表2Aにおいて列挙される。本明細書に記載されるgRNAは、上記の種のいずれかに由来のヌクレアーゼ、または酵素がゲノム編集機能を可能にするさらなる種の由来のヌクレアーゼのターミネーター配列に結合することができる。例示的なターミネーター配列は、限定されないが、表2Bに列挙されたものが挙げられる。例示的なPAM配列は、限定されないが、表2Cにおいて列挙されるものが挙げられる。
【0062】
本明細書で提供されるのは、特定の核酸配列に1以上のヌクレアーゼを標的とするための核酸を含むライブラリである。いくつかの例では、ヌクレアーゼは、TALEN、ZFN、メガヌクレアーゼ、アルゴノート、およびCasタンパク質の少なくとも1つである。例えば、1を超えるヌクレアーゼは、大きなゲノム欠失を生成するため、直ちに複数の配列を修飾するため、またはニッカーゼなどの他の酵素と合わせて使用されるために多重化することができる。いくつかの例では、ヌクレアーゼの数は、標的核酸配列に対して少なくとも2のヌクレアーゼである。いくつかの例では、ヌクレアーゼの数は、標的核酸配列に対して、約2〜3、2〜4、2〜5、2〜6、2〜7、2〜8、2〜9、または2〜10のヌクレアーゼの範囲である。
【0063】
本明細書で提供されるのは、特定の核酸配列のニッカーゼ標的化のための合成された核酸を含むライブラリである。ニッカーゼは、核酸配列内で一本鎖の切断を生成する酵素である。いくつかの例では、合成された核酸は、DNA、RNA、任意のアナログ、またはそれらの誘導体である。いくつかの例では、特定の核酸配列は、含むDNA、RNA、任意のアナログ、またはそれらの誘導体を含む。いくつかの例では、ニッカーゼは特定の核酸配列を切断する。いくつかの例では、ニッカーゼは特定の核酸を結合するが、それを切断しない。いくつかの例では、ニッカーゼは変更されたヌクレアーゼであり、ここで、ヌクレアーゼが、TALEN、ZFN、メガヌクレアーゼ、アルゴノート、またはCasタンパク質である。いくつかの例では、ニッカーゼは、TALEN、ZFN、メガヌクレアーゼ、アルゴノート、またはCasタンパク質のヌクレアーゼドメインを変更することによって生成される。いくつかの例では、ニッカーゼは、Cas9のヌクレアーゼドメインを変更することによって生成される。
【0064】
いくつかの例では、ライブラリは、特定の核酸配列の1以上のニッカーゼ標的化のための核酸含む。いくつかの例では、ニッカーゼの数は、特定の核酸配列に対して少なくとも2つのニッカーゼである。いくつかの例では、ニッカーゼの数は、特定の核酸配列に対して、約2〜3、2〜4、2〜5、2〜6、2〜7、2〜8、2〜9、または2〜10のニッカーゼの範囲である。いくつかの例では、ライブラリは、1以上のニッカーゼおよび1以上のヌクレアーゼを特定の核酸配列に向けるための核酸を含む。
【0065】
本明細書で提供される特定の核酸配列に対してヌクレアーゼを標的とするための核酸を含むライブラリは、特定の核酸配列の切断を結果としてもたらし得る。いくつかの例では、ヌクレアーゼは、TALEN、ZFN、メガヌクレアーゼ、アルゴノート、およびCasタンパク質の少なくとも1つである。いくつかの例では、ヌクレアーゼは、切断以外の、特定の核酸配列の修飾を提供するキメラヌクレアーゼである。例えば、キメラヌクレアーゼは、メチル化、脱メチル反応、ポリアデニル化、脱アデニル化、脱アミノ化、またはポリウリジニリル化(polyuridinylation)をもたらす。
【0066】
転写活性化因子様エフェクターヌクレアーゼ
本明細書で提供されるのは、特定の核酸配列の転写活性化因子様エフェクターヌクレアーゼ(TALEN)標的化のための核酸を含む、核酸ライブラリを合成する方法である。TALENは、特定の標的配列で二本鎖切断を誘発するために使用することができる、操作された配列の特異的なヌクレアーゼの類である。TALENは、ヌクレアーゼの触媒ドメインに、 転写活性化因子様(TAL)エフェクターDNA結合ドメイン、またはそれらの機能部分を融合させることによって生成され得る。TALエフェクターDNA結合ドメインは、一連のTAL反復を含み、それは、各々がRVD(repeat variable diresidue)として知られる非常に可変的な12番目と13番目のアミノ酸を含む一般的に高度に保存された33または34のアミノ酸配列セグメントである。各RVDは、特異的なヌクレオチドを認識し、それに結合することができる。したがって、TALエフェクター結合ドメインは、適切なRVDを含むTAL反復を組み合わせることによってヌクレオチドの特異的なシーケンスを認識するように操作され得る。
【0067】
本明細書で提供されるのは、TALエフェクターDNA結合ドメインをコードする非同一の核酸を含む核酸ライブラリを合成する方法である。いくつかの例では、TALエフェクターDNA結合ドメインは、特定の標的核酸配列を認識し、特別の部位で二本鎖切断を誘発するようにするように設計される。いくつかの例では、TALエフェクターDNA結合ドメインは、特定の核酸配列を認識してそれに結合するように設計される多くのTAL反復を含む。いくつかの例では、TAL反復の数は、少なくともまたは約、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、またはそれより多くのTAL反復である。
【0068】
いくつかの例では、TALエフェクターDNA結合ドメインをコードする非同一の核酸を含む核酸ライブラリは合成される。いくつかの例では、本明細書で記載されるような核酸ライブラリは、翻訳される時にタンパク質ライブラリをコードする。いくつかの例では、核酸ライブラリが細胞内で発現し、タンパク質ライブラリが生成される。いくつかの例では、合成された核酸ライブラリは、発現ベクターへと挿入される。いくつかの例では、合成された核酸ライブラリは、発現ベクターへと挿入され、細胞内で発現する。
【0069】
本明細書に記載される方法によって生成されたTALエフェクターDNA結合ドメインをコードする核酸を含む核酸ライブラリは、TALENを生成するために用いられる。いくつかの例では、これは、クローン化され、ヌクレアーゼを有するベクター内で発現するTALエフェクター結合ドメインのライブラリを混合することによって達成される。例示的なヌクレアーゼとしては、これらに限定されないが、AciI、AcuI、AlwI、BbvI、BccI、BceAI、BciVI、BfuAI、BmgBI、BmrI、BpmI、BpuEI、BsaI、BsmAI、BsmFI、BseRI、BspCNI、BsrI、BsgI、BsmI、BspMI、BsrBI、BsrDI、BtgZI、BtsI、BtsCI、EarI、Ecil、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SfaNI、BbvCI、Bpu10I、BspQI、SapI、BaeI、BsaXI、またはCspCIが挙げられる。いくつかの例では、混合は、ライゲーションによって生じる。例示的なリガーゼとしては、これらに限定されないが、大腸菌リガーゼ、T4リガーゼ、哺乳類のリガーゼ(例えば、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV)、熱安定性リガーゼ、およびファストリガーゼ(fast ligases)が挙げられる。本明細書に記載される方法で生成されたTALENは、発現ベクターに挿入され得る。いくつかの例では、TALENは、発現ベクターに挿入され、細胞内で発現する。
【0070】
本明細書で提供されるのは、原核生物または真核生物のゲノム中の遺伝子について、非同一の核酸配列を含むTALエフェクターDNA結合ドメインのライブラリを合成するための方法である。いくつかの例では、TALエフェクターDNA結合ドメインのライブラリは、ゲノムの少なくとも5%について、遺伝子のための少なくとも3、4、5、6、7、8、9、10、または10よりも多い非同一の核酸配列を含む。いくつかの例では、TALエフェクターDNA結合ドメインのライブラリは、ゲノムの少なくとも5%ついて、1以上の遺伝子のための非同一の核酸配列を含む。いくつかの例では、TALエフェクターDNA結合ドメインのライブラリは、ゲノムの少なくとも5%について、約1、5、10、20、30、40、50、60、70、80、90、100、または100よりも多い遺伝子のための、非同一の核酸配列を含む。いくつかの例では、TALエフェクターDNA結合ドメインのライブラリは、ゲノムの少なくとも5%について、約1−100、2−95、5−90、10−85、15−80、20−75、25−70、30−65、35−60、または40−50の遺伝子のための、非同一の核酸配列を含む。
【0072】
本明細書で提供されるのは、特定の核酸配列のジンクフィンガーヌクレアーゼ(ZFN)標的化のための核酸を含む核酸ライブラリを合成する方法である。ZFNは、ヌクレアーゼとDNA結合ジンクフィンガードメイン(ZFD)との融合によって生成され得る。ZFDは、1以上のジンクフィンガーを介して標的核酸配列に結合することができる。いくつかの例では、ZFDは、少なくとも2、3、4、5、6、7、8、9、10、または10以上のジンクフィンガーを含む。いくつかの例では、ZFDは、最大で2、3、4、5、6、7、8、9、10、または10以上のジンクフィンガーを含む。いくつかの例では、ZFDは、特定の標的核酸配列を認識し、特別の部位で二本鎖切断を誘発するようにするように設計される。
【0073】
本明細書で提供されるのは、転写され翻訳された時、ZFDをコードする核酸を含む核酸ライブラリを合成する方法である。いくつかの例では、核酸ライブラリが翻訳される時、タンパク質ライブラリをコードする。いくつかの例では、核酸ライブラリが細胞内で発現され、タンパク質ライブラリが生成される。いくつかの例では、合成された核酸ライブラリは、発現ベクターに挿入される。いくつかの例では、合成された核酸ライブラリは、発現ベクターに挿入され、細胞内で発現する。
【0074】
本明細書に記載される方法によって生成されたZFDをコードする核酸を含む核酸ライブラリは、ZFNを生成するために用いられる。いくつかの例では、これは、クローン化され、ヌクレアーゼを有するベクター内で発現するZFDを混合することによって達成される。例示的なヌクレアーゼとしては、これらに限定されないが、AciI、AcuI、AlwI、BbvI、BccI、BceAI、BciVI、BfuAI、BmgBI、BmrI、BpmI、BpuEI、BsaI、BsmAI、BsmFI、BseRI、BspCNI、BsrI、BsgI、BsmI、BspMI、BsrBI、BsrDI、BtgZI、BtsI、BtsCI、EarI、Ecil、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SfaNI、BbvCI、Bpu10I、BspQI、SapI、BaeI、BsaXI、またはCspCIが挙げられる。いくつかの例では、混合は、ライゲーションによって生じる。例示的なリガーゼとしては、これらに限定されないが、大腸菌リガーゼ、T4リガーゼ、哺乳類のリガーゼ(例えば、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV)、熱安定性リガーゼ、およびファストリガーゼ(fast ligases)が挙げられる。本明細書に記載される方法によって生成されたTALENは、発現ベクターに挿入され得る。いくつかの例では、ZFNは、発現ベクターに挿入され、細胞内で発現する。
【0075】
本明細書で提供されるのは、原核生物または真核生物のゲノム中の遺伝子について、非同一の核酸配列を含むZFDライブラリを合成するための方法である。いくつかの例では、ZFDライブラリは、ゲノムの少なくとも5%について、遺伝子のための少なくとも3、4、5、6、7、8、9、10、または10よりも多い非同一の核酸配列を含む。いくつかの例では、ZFDライブラリは、ゲノムの少なくとも5%について、1以上の遺伝子のための、非同一の核酸配列を含む。いくつかの例では、ZFDライブラリは、ゲノムの少なくとも5%について、約1、5、10、20、30、40、50、60、70、80、90、100、または100よりも多い遺伝子のための、非同一の核酸配列を含む。いくつかの例では、ZFDライブラリは、ゲノムの少なくとも5%について、約1−100、2−95、5−90、10−85、15−80、20−75、25−70、30−65、35−60、または40−50の遺伝子のための、非同一の核酸配列を含む。
【0077】
本明細書で提供されるのは、特定の核酸配列のメガヌクレアーゼ標的化のための核酸を含む核酸ライブラリを合成する方法である。メガヌクレアーゼは、塩基対の長い(例えば12−40の塩基対)DNA標的を認識し切断することができる酵素である。いくつかの例では、メガヌクレアーゼは、標的核酸配列について特異性を与える他の酵素のドメインを含むように操作される。例えば、メガヌクレアーゼはTALエフェクターDNA結合ドメインを含むように操作される。
【0078】
本明細書で提供されるのは、転写され翻訳された時、メガヌクレアーゼと共に使用するための結合ドメインをコードする核酸を含む核酸ライブラリを合成する方法である。いくつかの例では、核酸ライブラリが翻訳される時、タンパク質ライブラリをコードする。いくつかの例では、核酸ライブラリが細胞内で発現され、タンパク質ライブラリが生成される。いくつかの例では、合成された核酸ライブラリは、発現ベクターに挿入される。いくつかの例では、合成された核酸ライブラリは、発現ベクターに挿入され、細胞内で発現する。
【0079】
本明細書に記載される方法によって生成されたドメインをコードする核酸を含む核酸ライブラリは、特定の核酸配列を標的とするためのメガヌクレアーゼを操作するために使用される。いくつかの例では、これは、クローン化され、メガヌクレアーゼを有するベクター内で発現するTALエフェクター結合ドメインのライブラリのような結合ドメインのライブラリを混合することによって達成される。本明細書で提供される方法と共に使用するための例示的なメガヌクレアーゼとしては、これら限定されないが、I−Scel、I−Scell、I−SceIII、I−SceIV、I−SceV、I−SceVI、I−SceVII、I−Ceul、I−CeuAIIP、I−Crel、I−CrepsbIP、I−CrepsbllP、I−CrepsbIIIP、I−CrepsbIVP、I−Tlil、I−Ppol、PI−PspI、F−Scel、F−Scell、F−Suvl、F− TevI、F−TevII、I−Amal、I−Anil、I−Chul、I−Cmoel、I−Cpal、I−CpaII、I−Csml、I−Cvul、I−CvuAIP、I−Ddil、I−DdiII、I−Dirl、I−Dmol、I−Hmul、I−HmuII、I−HsNIP、I−Llal、I−Msol、I−Naal、I−Nanl、I− NcIIP、I−NgrIP、I−Nitl、I−Njal、I−Nsp236IP、I−Pakl、I−PboIP、I−PcuIP、I−PcuAI、I−PcuVI、I−PgrlP、1−PobIP、I−Porl、I−PorIIP、I−PbpIP、I−SpBetaIP、I−Scal、I−SexIP、1−SneIP、I−Spoml、I−SpomCP、I−SpomIP、I−SpomIIP、I−SquIP、I−Ssp6803I、I−SthPhiJP、I−SthPhiST3P、I−SthPhiSTe3bP、I−TdeIP、I−Tevl、I−TevII、I−TevIII、I−UarAP、I−UarHGPAIP、I−UarHGPA13P、I−VinIP、1−ZbiIP、PI−MtuI、PI−MtuHIP PI−MtuHIIP、PI−PfuI、PI−PfuII、PI−PkoI、Pl−PkoII PI− Rma43812IP、PI−SpBetaIP、PI−SceI、PI−TfuI、PI−TfuII、PI−Thyl、PI−Tlil、PI−TliII、またはそれらの断片が挙げられる。いくつかの例では、混合は、ライゲーションによって生じる。例示的なリガーゼとしては、これらに限定されないが、大腸菌リガーゼ、T4リガーゼ、哺乳類のリガーゼ(例えば、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV)、熱安定性リガーゼ、およびファストリガーゼ(fast ligases)が挙げられる。本明細書に記載される方法によって操作されたメガヌクレアーゼは、発現ベクターに挿入され得る。いくつかの例では、操作されたメガヌクレアーゼは、発現ベクターに挿入され、細胞内で発現する。
【0080】
本明細書で提供されるのは、原核生物または真核生物のゲノム中の遺伝子について非同一の核酸配列を含むメガヌクレアーゼと共に使用するための結合ドメインライブラリを合成するための方法である。いくつかの例では、ドメインライブラリは、ゲノムの少なくとも5%のゲノムについて、遺伝子のための少なくとも3、4、5、6、7、8、9、10、または10よりも多い非同一の核酸配列を含む。いくつかの例では、ドメインライブラリは、ゲノムの少なくとも5%について、1以上の遺伝子のための、非同一の核酸配列を含む。いくつかの例では、ドメインライブラリは、ゲノムの少なくとも5%について、約1、5、10、20、30、40、50、60、70、80、90、100、または100よりも多い遺伝子のための、非同一の核酸配列を含む。いくつかの例では、ドメインライブラリは、ゲノムの少なくとも5%について、約1−100、2−95、5−90、10−85、15−80、20−75、25−70、30−65、35−60、または40−50の遺伝子のための、非同一の核酸配列を含む。
【0082】
本明細書で提供されるのは、特定の核酸配列のメガヌクレアーゼ標的化のための核酸を含む核酸ライブラリを合成する方法である。アルゴノートは、RNAまたはDNAのガイドヌクレアーゼのファミリーである。いくつかの例では、アルゴノートは、標的核酸を識別するためにガイド核酸を使用する。いくつかの例では、ガイド核酸は、単一ガイドRNA(sgRNA)である。いくつかの例では、ガイド核酸は、ガイドDNA(gDNA)である。例示的なアルゴノートとしては、これらに限定されないが、TtAgo、PfAgo、およびNgAgoが挙げられる。いくつかの実施形態では、アルゴノートはNgAgoである。
【0083】
本明細書で提供されるのは、原核生物または真核生物のゲノム中の遺伝子について、非同一の核酸配列を含むガイド核酸ライブラリを合成するための方法である。幾つかの事例では、ガイド核酸ライブラリはsgRNAライブラリである。幾つかの事例では、ガイド核酸ライブラリはdgRNAライブラリである。いくつかの例では、ガイド核酸ライブラリは、ゲノムの少なくとも5%について、遺伝子のための少なくとも3、4、5、6、7、8、9、10、または10よりも多い非同一の核酸配列を含む。いくつかの例では、ガイド核酸ライブラリは、ゲノムの少なくとも5%について、1以上の遺伝子のための、非同一の核酸配列を含む。いくつかの例では、ガイド核酸ライブラリは、ゲノムの少なくとも5%について、約1、5、10、20、30、40、50、60、70、80、90、100、または100よりも多い遺伝子のための、非同一の核酸配列を含む。いくつかの例では、ガイド核酸ライブラリは、ゲノムの少なくとも5%について、約1−100、2−95、5−90、10−85、15−80、20−75、25−70、30−65、35−60、または40−50の遺伝子のための、非同一の核酸配列を含む。
【0085】
本明細書で提供されるのは、特定の核酸配列のCRISPR関連(Cas)タンパク質標的化のためのgRNAをコードする核酸を含む核酸ライブラリを合成する方法である。いくつかの例では、Casタンパク質は、少なくとも、Cpf1、C2c1、C2c2、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらの相同体、およびそれらの修飾バージョンの1つである。いくつかの例では、Casタンパク質はCas9である。
【0086】
本明細書で提供されるのは、原核生物または真核生物のゲノム中の遺伝子について、非同一の核酸配列を含むgRNAライブラリを合成するための方法である。いくつかの例では、gRNAライブラリは、ゲノムの少なくとも5%について、遺伝子のための少なくとも3、4、5、6、7、8、9、10、または10よりも多い非同一の核酸配列を含む。いくつかの例では、gRNAライブラリは、ゲノムの少なくとも5%について、1以上の遺伝子のための、非同一の核酸配列を含む。いくつかの例では、gRNAライブラリは、ゲノムの少なくとも5%について、約1、5、10、20、30、40、50、60、70、80、90、100、または100よりも多い遺伝子のための、非同一の核酸配列を含む。いくつかの例では、gRNAライブラリは、ゲノムの少なくとも5%について、約1−100、2−95、5−90、10−85、15−80、20−75、25−70、30−65、35−60、または40−50の遺伝子のための、非同一の核酸配列を含む。gRNAライブラリは、sgRNAまたはdgRNAをコードし得る。
【0088】
本明細書で提供されるのは、gRNAおよびヌクレアーゼ、例えば、Cas9酵素またはCas9変異酵素を有する、完全または一部の遺伝子配列をコードする核酸の組み合わせによって生成された変異体核酸ライブラリを合成するための方法である。断片は、遺伝子の全領域に相対的に間隔をあけてもよい。場合によっては、ライブラリがDNAまたはRNAをコードする。場合によっては、ライブラリが、単一の遺伝子または最大で全ゲノムをコードする。例えば、約20,000の遺伝子を含むゲノムについて、遺伝子あたり、5つのgRNAをコードするgRNAライブラリは、約100,000のgRNAを結果としてもたらす。そのようなライブラリは、単一遺伝子、遺伝子の経路、または単一ゲノム内の全遺伝子を、選択的にサイレンシングするか修飾するために使用することができる。ある構成では、gRNAは相同配列を欠き、無作為な末端結合が生じる。そのようなプロセスは、非相同末端結合(「NHEJ」)を結果としてもたらす。いくつかの例では、NHEJに続いて、挿入、欠失、フレームシフト、または一塩基スワッピング(single base swapping)が生じる。
図2のBを参照する。
【0089】
本明細書に記載される合成されたライブラリは、CRISPR−Cas9機能における適用のために使用することができ、ここで、生成されたgRNA配列が、細胞内または標的DNAおよびCas9酵素を含む混合物内で標的DNA配列の発現を破壊するか発現産物配列を変更するために使用される。いくつかの実施形態では、各変異体は、翻訳中に異なるアミノ酸をもたらすコドンをコードする。表3は、変異部位にとって可能性のあるそれぞれのコドン(と代表的なアミノ酸)のリストを提供する。
【0092】
本明細書で提供されるのは、ヌクレアーゼを有する完全なまたは一部の遺伝子配列をコードする核酸の組み合わせによって生成された変異核酸ライブラリを合成するための方法であり、ここで、ヌクレアーゼはTALEN、ZFN、または操作されたメガヌクレアーゼである。いくつかの例では、ヌクレアーゼを有するsgRNAなどのガイド核酸を有する完全なまたは一部の遺伝子配列をコードする核酸の組み合わせによって生成された、変異体核酸ライブラリを合成するための方法であり、ここで、ヌクレアーゼはアルゴノートまたはCasタンパク質である。本明細書に記載される合成されたライブラリは、ヌクレアーゼ機能における適用のために使用することができ、ここで、生成された核酸配列が、細胞内または標的DNAおよびヌクレアーゼを含む混合物内で標的DNA配列の、発現を破壊するか発現産物配列を変更するために使用される。いくつかの実施形態では、各変異体は、翻訳中に異なるアミノ酸をもたらすコドンをコードする。
【0093】
本明細書で記載されるような変異核酸ライブラリは、合成された核酸によってコードされる後続タンパク質において、単一の残基の複数の様々な変異体が標準的な翻訳プロセスによって生成されるように、少なくとも単一のコドンをコードする標的核酸配列を変えるためのsgRNAまたはdgRNAを含む。いくつかの事例では、各変異体は、タンパク質ドメインの異なるアミノ酸をもたらすコドンをコードする。例えば、タンパク質ドメインは、保存ドメインまたは触媒ドメインである。いくつかの実施形態では、タンパク質ドメインとしては、これらに限定されないが、キナーゼドメイン、ATP結合ドメイン、GTP結合ドメイン、グアニンヌクレオチド交換因子(GEF)ドメインGTPアーゼ活性化タンパク質ドメイン、ヒドロラーゼドメイン、エンドヌクレアーゼドメイン、エキソヌクレアーゼドメイン、プロテアーゼドメイン、ホスファターゼドメイン、ホスホリパーゼドメイン、プレクストリン相同ドメイン、Src相同ドメイン、およびユビキチン結合ドメインが挙げられる。いくつかの例では、変異体核酸ライブラリは、少なくとも1、2、3、4、5、6、7、8、9、10、または10よりも多いタンパク質ドメインにおける変異をコードする核酸配列を標的とするために、sgRNAまたはdgRNAを含む。
【0094】
いくつかの実施形態では、変異体は、特定の活性を有するタンパク質についてアミノ酸を体コードする。例えば、変異体は、それはメチルトランスフェラーゼ活性、デメチラーゼ活性、ジスムターゼ活性、アルキル化活性、デプリネーション活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、レコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、ホトリアーゼ活性、グリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活、リボシル化活性、脱リボシル化活性、ミリストイル化活性、リモデリング活性、プロテアーゼ活性、オキシドレダクターゼ活性、トランスフェラーゼ活性、ヒドロラーゼ活性、リアーゼ活性、イソメラーゼ活性、シンターゼ活性、シンテターゼ活性、または脱ミリストイル化活性を含むタンパク質をエンコードする。
【0095】
相同組換え修復(HDR)によって生成される変異
変異核酸ライブラリ生成のための例示的なプロセスにおいて、Cas9切断および相同組換えが、標的DNAライブラリ内に変型を生成するために組込まれる。まず、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後(インビボまたはインビトロの)転写をしてgRNAを生成することによって)gRNAライブラリが合成され、ここで、ライブラリは、遺伝子あたり複数のgRNA分子を含む。例えば、gRNAライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれより多くのgRNAを含み得る。gRNAライブラリは、Cas9酵素および標的DNAライブラリと混合され、ここで、標的DNAライブラリは少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは1、2、3、4、5、6、7、8、9、10、またはそれより多くの遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。さらに、変異が標的DNA鎖に導入されるように、相性配列および変異核酸配列を含む置換配列が混合物に加えられる。結果として生じる標的DNAライブラリは、複数の変異DNA配列を含むだろう。いくつかの例では、変異は、欠失、フレームシフト、または標的DNA配列への挿入を導入する。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片あたり、少なくとも1のコドンについての変異を結果としてもたらす。いくつかの例では、遺伝子の一部が標的DNAに挿入され、あるいは、標的DNA配列の一部(つまり、遺伝子の断片または全遺伝子)は、標的DNAから取り除かれる。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片と関連付けられる少なくとも1つの転写調節配列、例えば、プロモーター、UTR、あるいはターミネーター配列についての変異を結果としてもたらす。
【0096】
変異核酸ライブラリ生成ためのいくつかの例では、ヌクレアーゼ切断および相同組換えは、標的DNAライブラリ内に変型を生成するために組込まれ、ここで、ヌクレアーゼは、TALEN、ZFN、メガヌクレアーゼ、Cas、またはアルゴノートである。いくつかの例では、ヌクレアーゼがTALENである場合、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後、(インビボまたはインビトロの)転写および翻訳によって)TALエフェクターDNA結合ドメインのライブラリが合成され、ここで、ライブラリは、遺伝子あたり複数のTALエフェクターDNA結合ドメイン分子を含む。例えば、TALエフェクターDNA結合ドメインのライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれ以上のTALエフェクターDNA結合ドメイン分子を含み得る。その後、TALエフェクターDNA結合ドメインのライブラリは、TALENを生成するためにヌクレアーゼ酵素と混合され得る。いくつかの例では、TALENは標的DNAライブラリと結合され、ここで、標的DNAライブラリは、少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは1、2、3、4、5、6、7、8、9、10、またはそれ以上の遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。いくつかの例では、変異が標的DNA鎖に導入されるように、相性配列および変異核酸配列を含む置換配列が混合物に加えられる。結果として生じる標的DNAライブラリは、複数の変異DNA配列を含むだろう。いくつかの例では、変異は、欠失、フレームシフト、または標的DNA配列への挿入を導入する。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片あたり、少なくとも1のコドンについての変異を結果としてもたらす。いくつかの例では、遺伝子の一部が標的DNAに挿入され、あるいは、標的DNA配列の一部(つまり、遺伝子の断片または全遺伝子)は、標的DNAから取り除かれる。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片と関連付けられる少なくとも1つの転写調節配列、例えば、プロモーター、UTR、あるいはターミネーター配列についての変異を結果としてもたらす。
【0097】
修飾されたCas9酵素によって生成される変異
【0098】
変異核酸ライブラリの生成のための2番目の例示的なプロセスは、修飾されたCas9酵素が、変異標的DNAライブラリを生成するために組込まれる。まず、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後(インビボまたはインビトロの)転写をしてgRNAを生成することによって)gRNAライブラリが合成され、ここで、ライブラリは、遺伝子あたり複数のgRNA分子を含む。例えば、gRNAライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれ以上のgRNAを含み得る。gRNAライブラリは、修飾されたCas9酵素および標的DNAライブラリと混合され、ここで、標的DNAライブラリは少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは1、2、3、4、5、6、7、8、9、10、またはそれ以上の遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。修飾されたCas9酵素は、核酸配列修飾能力を有する別の酵素に繋留される。例示的な修飾されたCas9酵素は、dCas9プロセスを含み、このプロセスは、不能にされたまたは「死んでいる」Cas9(「dCas9」)は、もはやスプライシング機能を有しないが、別の酵素活性の添加によって、異なる標的分子修正機能を果たす。例えば、シチジンデアミナーゼのdCas9への繋留は、C−G DNA塩基対をT−A 塩基対へと変換する。他のdCas9プロセスでは、dCas9に繋留された異なる酵素は、標的DNA内で塩基CをTへ、または塩基GをAへと変更することをもたらす。結果として生じる標的DNAライブラリは、複数の変異標的DNA配列を含む。いくつかの例では、変異は、欠失、フレームシフト、または標的DNA配列への挿入を導入する。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片あたり、少なくとも1のコドンについての変異を結果としてもたらす。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片と関連付けられる少なくとも1つの転写調節配列、例えば、プロモーター、UTR、あるいはターミネーター配列についての変異を結果としてもたらす。
【0099】
修飾されたヌクレアーゼよって生成される変異
【0100】
本明細書で提供されるのは、変異標的DNAライブラリを生成するために組込まれる修飾されたヌクレアーゼ酵素を含む、変異核酸ライブラリの生成のための方法である。いくつかの例では、ヌクレアーゼはTALENである。いくつかの例では、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後、転写および翻訳をしてTALエフェクターDNA結合ドメインのライブラリを生成することによって)TALエフェクターDNA結合ドメインのライブラリが合成され、ここで、ライブラリが遺伝子あたり複数の非同一の核酸配列を含む。例えば、TALエフェクターDNA結合ドメインのライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれ以上の非同一の核酸配列を含み得る。その後、TALエフェクターDNA結合ドメインのライブラリは、ヌクレアーゼ酵素と混合され得る。いくつかの例では、TALENは標的DNAライブラリと混合され、ここで、標的DNAライブラリは、少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは、1、2、3、4、5、6、7、8、9、10、またはそれ以上の遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。
【0101】
いくつかの例では、ヌクレアーゼはZFNである。いくつかの例では、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後、転写および翻訳をしてZFDライブラリを生成することによって)ZFDライブラリが合成され、ここで、ライブラリが遺伝子あたり複数の非同一の核酸配列を含む。例えば、ZFDライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれ以上の非同一の核酸配列を含み得る。その後、ZFDライブラリは、ZFNを生成するためにヌクレアーゼ酵素と混合され得る。いくつかの例では、ZFNは標的DNAライブラリと混合され、ここで、標的DNAライブラリは、少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは、1、2、3、4、5、6、7、8、9、10、またはそれ以上の遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。
【0102】
いくつかの例では、ヌクレアーゼは、メガヌクレアーゼである。いくつかの例では、特定の核酸配列に対してメガヌクレアーゼを標的とするための、TALエフェクターDNA結合ドメインのライブラリのような結合ドメインライブラリは、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後、転写をして結合ドメインライブラリを生成することによって)合成され、ここで、結合ドメインライブラリは、遺伝子あたり複数の非同一の核酸配列を含む。例えば、結合ドメインライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれより多くの非同一の核酸配列を含み得る。その後、結合ドメインライブラリは、操作されたメガヌクレアーゼを生成するためにメガヌクレアーゼ酵素と混合され得る。いくつかの例では、操作されたメガヌクレアーゼは標的DNAライブラリと混合され、ここで、標的DNAライブラリは、少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは、1、2、3、4、5、6、7、8、9、10、またはそれ以上の遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。
【0103】
いくつかの例では、ヌクレアーゼはアルゴノートである。いくつかの例では、(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後、転写をしてガイド核酸ライブラリを生成することによって)ガイド核酸ライブラリ (gRNAまたはgDNA) が合成され、ここで、ガイド核酸ライブラリが、遺伝子あたり複数の非同一の核酸配列を含む。例えば、ガイド核酸ライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれより多くの非同一の核酸配列を含み得る。ガイド核酸ライブラリは、修飾されたアルゴノート酵素および標的DNAライブラリと混合され、ここで、標的DNAライブラリは少なくとも1つの遺伝子断片または少なくとも1つの遺伝子をコードする核酸配列を含む。例えば、標的DNAライブラリは、1、2、3、4、5、6、7、8、9、10、またはそれ以上の遺伝子または遺伝子断片を含み得る。いくつかの例では、標的DNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。
【0104】
いくつかの例では、修飾されたヌクレアーゼ酵素は、核酸配列修飾能力を有する別の酵素に繋留される。例示的な修飾能力としては、これらに限定されないが、メチル化、脱メチル化、ポリアデニル化、脱アデニル化、脱アミノ化、およびポリウリジニリル化(polyuridinylation)が挙げられる。いくつかの例では、複数の変異標的DNA配列を含む標的DNAライブラリは、変異を結果としてもたらす。いくつかの例では、変異は、欠失、フレームシフト、または標的DNA配列への挿入を導入する。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片あたり、少なくとも1のコドンについての変異を結果としてもたらす。いくつかの例では、変異DNA配列は、遺伝子または遺伝子の断片と関連付けられる少なくとも1つの転写調節配列、例えば、プロモーター、UTR、あるいはターミネーター配列についての変異を結果としてもたらす。
【0105】
モデルシステムの遺伝子を標的とするためのgRNAライブラリ合成
【0106】
本明細書で提供されるのは、本明細書に記載される核酸ライブラリを有するモデルシステムをスクリーニングための方法である。いくつかの事例では、核酸ライブラリは、本明細書に記載されるgRNAライブラリである。いくつかの例では、核酸ライブラリは、転写された時にgRNA配列の転写をもたらす本明細書に記載されるDNAライブラリである。モデル生物体の非限定的で例示的なリストが、表4において提供される。
【0108】
(RNAのデノボ合成またはDNAのデノボ合成のいずれか、その後、(インビボまたはインビトロの)転写をしてgRNAを生成することによって)gRNAライブラリが合成され、ここで、ライブラリは、遺伝子あたり複数のgRNA分子を含む。例えば、本明細書に記載されるライブラリは、遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれ以上のgRNAを含む。いくつかの例では、デノボ合成されたライブラリ内の核酸は、単一遺伝子あたり、少なくともまたは約3の非同一のgRNAについての配列をコードする。いくつかの例では、核酸は、単一遺伝子あたり、約1〜約10の非同一のgRNAの範囲で配列をコード化する。いくつかの例では、核酸は、単一遺伝子あたり、少なくともまたは約1の非同一のgRNAについての配列をコードする。いくつかの例では、核酸は、単一遺伝子あたり、最大で10の非同一のgRNAについての配列をコードする。いくつかの例では、核酸は、単一遺伝子あたり、1〜2、1〜3、1〜4、1〜5、1〜6、1〜7、1〜8、1〜9または1〜10の非同一のgRNAについての配列をコードする。いくつかの例では、gRNAはsgRNAである。いくつかの例では、gRNAはdgRNAである。
【0109】
いくつかの例では、本明細書に記載されるgRNAライブラリは、遺伝子または生物体あたり、1以上の非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、生物体のための遺伝子あたり、1、2、3、4、5、6、7、8、9、10、またはそれより多くの非同一のgRNAを含む。例示的な生物体としては、これらに限定されないが、シロイヌナズナ、線虫、イヌ科、コナミドリムシ、ゼブラフィッシュ、細胞性粘菌、キイロショウジョウバエ、大腸菌、アカゲザル、ハツカネズミ、アナウサギ、ドブネズミ、出芽酵母、イノシシ、およびヒトが挙げられる。いくつかの例では、gRNAはsgRNAである。いくつかの例では、gRNAはdgRNAである。いくつかの例では、gRNAライブラリは、生物体の全ゲノムの少なくともまたは約5%について、非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、生物体の全ゲノムの約5%〜約100%について、非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、生物体の全ゲノムの少なくともまたは約80%について、非同一のgRNAを含む。いくつかの例では、sgRNAライブラリは、生物体の全ゲノムの少なくともまたは約90%について、非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、生物体の全ゲノムの少なくともまたは約95%について、非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、生物体の全ゲノムの少なくともまたは約100%について、非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、生物体の全ゲノムの約5%〜10%、5%〜20%、5%〜30%、5%〜40%、5%〜50%、5%〜60%、5%〜70%、5%〜80%、5%〜90%、5%〜95%、5%〜100%、10%〜20%、10%〜30%、10%〜40%、10%〜50%、10%〜60%、10%〜70%、10%〜80%、10%〜90%、10%〜95%、10%〜100%、20%〜30%、20%〜40%、20%〜50%、20%〜60%、20%〜70%、20%〜80%、20%〜90%、20%〜95%、20%〜100%、30%〜40%、30%〜50%、30%〜60%、30%〜70%、30%〜80%、30%〜90%、30%〜95%、30%〜100%、40%〜50%、40%〜60%、40%〜70%、40%〜80%、40%〜90%、40%〜95%、40%〜100%、50%〜60%、50%〜70%、50%〜80%、50%〜90%、50%〜95%、50%〜100%、60%〜70%、60%〜80%、60%〜90%、60%〜95%、60%〜100%、70%〜80%、70%〜90%、70%〜95%、70%〜100%、80%〜90%、80%〜95%、80%〜100%90%〜95%、90%〜100%、または95%〜100%の非同一のgRNAを含む。いくつかの例では、gRNAライブラリは、経路内の同義遺伝子からの配列または生物体内の全遺伝子からの配列を含む。gRNAの数は、表4列挙される生物体において、遺伝子あたり、少なくとも2倍、3倍、5倍、または10倍を含み得る。いくつかの例では、gRNAライブラリは、遺伝子、遺伝子の群(例えば3−10の遺伝子)、経路(例えば10−100の遺伝子)、またはシャーシ(例えば100−1000の遺伝子)のうち少なくとも1つを標的とする。
【0111】
本明細書に記載されるのは、革新的な合成プラットフォームを作るために、シリコン上のナノウェル内のオリゴ核酸合成から遺伝子アセンブリへの末端間プロセスの小型化、並列化、および垂直的統合を利用するプラットフォームアプローチがされる。本明細書に記載される装置は、96ウェルのプレートと同じフットプリントを提供し、シリコン合成プラットフォームは、従来の合成方法と比較して、100〜1,000倍スループットを増加させることができ、単一の高度に並列されたラン(run)で、およそ1,000,000までのオリゴ核酸を産生することができる。いくつかの例では、本明細書に記載される単一のシリコンプレートは、約6,100の非同一のオリゴ核酸の合成を提供する。いくつかの例では、非同一のオリゴ核酸の各々は、クラスタ内に位置づけられる。クラスタは、50〜500の非同一のオリゴ核酸を含んでもよい。
【0112】
いくつかの例では、本明細書に記載されるgRNAライブラリをコードするDNAライブラリは、DNAについて予め決められた配列と比較すると、1:500未満のエラー率を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、DNAについて予め決められた配列と比較すると、1:500、1:1000、1:1500、1:2000、1:3000、1:5000以下、またはそれ未満の総エラー率を有する。いくつかの例では、DNAについて予め決められた配列と比較すると、総エラー率は1:1000未満である。エラー率は、総エラー率または平均エラー率であり得る。
【0113】
いくつかの例では、本明細書に記載されるgRNAライブラリをコードするRNAライブラリは、RNAについての予め決められた配列と比較すると、1:500より低いエラー率を有する。いくつかの例では、本明細書に開示されるデノボオリゴ核酸ライブラリは、核酸についての予め決められた配列と比較すると、1:500、1:1000、1:1500、1:2000、1:3000 1:5000、1:10,000、またはそれより低い総エラー率を有する。いくつかの例では、RNAについての予め決められた配列と比較すると、総エラー率は1:1000より低い。
【0115】
場合により、本明細書には、複数のクラスタを含む基質が記載され、ここで各クラスタはオリゴ核酸の付着及び合成を支持する複数の遺伝子座を含む。本明細書で使用されるような用語「遺伝子座」は、表面から伸長する単一の予め決められた配列をコードするオリゴ核酸に対する支持を提供する構造上の離散的領域を指す。幾つかの実施形態において、遺伝子座は、二次元表面、例えば、実質的に平らな表面上にある。幾つかの実施形態において、遺伝子座は、三次元表面、例えば、ウェル、微小ウェル、チャネル、又はポスト上にある。幾つかの実施形態において、遺伝子座の表面は、オリゴ核酸合成のための少なくとも1つのヌクレオチド、又は好ましくは、オリゴ核酸の集団の合成のための同一のヌクレオチドの集団に付着するために活発に官能化される物質を含む。幾つかの実施形態において、オリゴ核酸は、同じ核酸配列をコードするオリゴ核酸の集団を指す。場合により、基質の表面は、基質の1つ又は複数の表面を包含する。提供されるシステム及び方法を用いてライブラリ内で合成されるオリゴ核酸に関する平均エラー率は多くの場合、1000分の1未満、2000分の1未満、3000分の1未満、或いはそれよりも遥かに少ない。
【0116】
幾つかの実施形態において、基質は、共通の支持体上のアドレス可能位置に異なる予め決められた配列を有している複数のオリゴ核酸の合成を支持する表面を含む。幾つかの実施形態において、基質は、50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000;5,000;10,000;20,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000、又はそれ以上の非同一のオリゴ核酸の合成のための支持を提供する。場合により、基質は、50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000;5,000;10,000;20,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000を超える、又はそれ以上のオリゴ核酸の合成のための支持を提供する。幾つかの実施形態において、オリゴ核酸の少なくとも一部は、同一の配列を有しているか、又は同一の配列で合成されるように構成されている。幾つかの実施形態において、基質は、少なくとも80、90、100、120、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、又はそれ以上の塩基を持つオリゴ核酸の成長のための表面環境を提供する。
【0117】
幾つかの実施形態において、オリゴ核酸は、基質の別々の遺伝子座上で合成され、ここで各遺伝子座はオリゴ核酸の集団の合成を支持する。場合により、各遺伝子座は、別の遺伝子座上で成長させられたオリゴ核酸の集団とは異なる配列を有するオリゴ核酸の集団の合成を支持する。幾つかの実施形態において、基質の遺伝子座は複数のクラスタ内に位置する。幾つかの例において、基質は、少なくとも10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000、又はそれ以上のクラスタを含む。幾つかの実施形態において、基質は、2,000;5,000;10,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,100,000;1,200,000;1,300,000;1,400,000;1,500,000;1,600,000;1,700,000;1,800,000;1,900,000;2,000,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;又は10,000,000、或いはそれ以上の別々の遺伝子座を含む。幾つかの実施形態において、基質は約10,000の別々の遺伝子座を含む。単一のクラスタ内の遺伝子座の量は、異なる実施形態において変動する。場合により、各クラスタは、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500、又はそれ以上の遺伝子座を含む。幾つかの実施形態において、各クラスタは約50−500の遺伝子座を含む。幾つかの実施形態において、各クラスタは約100−200の遺伝子座を含む。幾つかの実施形態において、各クラスタは約100−150の遺伝子座を含む。幾つかの実施形態において、各クラスタは約109、121、130、又は137の遺伝子座を含む。幾つかの実施形態において、各クラスタは約19、20、61、64、又はそれ以上の遺伝子座を含む。
【0118】
本明細書には、シリコンプレート上で非同一のオリゴ核酸を合成する方法が提供される。幾つかの例において、シリコンプレートは約1−10、1−50、又は50−500のクラスタを含む。幾つかの例において、シリコンプレートは、約50、100、250、500、2500、5000、6000、6150、10000、又はそれ以上のクラスタを含む。幾つかの例において、各クラスタは121の遺伝子座を含む。幾つかの例において、各クラスタは、約50−5000、50−200、100−150の遺伝子座を含む。幾つかの例において、各クラスタは、少なくとも約50、100、150、200、500、1000、又はそれ以上の遺伝子座を含む。幾つかの例において、単一のプレートは、100、500、10000、20000、30000、50000、100000、500000、700000、1000000、又はそれ以上の遺伝子座を含む。
【0119】
幾つかの実施形態において、基質上で合成された別々のオリゴ核酸の数は、基質における利用可能な別々の遺伝子座の数に左右され得る。幾つかの実施形態において、基質のクラスタ内の遺伝子座の密度は、1mm
2当たり少なくとも又は約1の遺伝子座、1mm
2当たり10の遺伝子座、1mm
2当たり25の遺伝子座、1mm
2当たり50の遺伝子座、1mm
2当たり65の遺伝子座、1mm
2当たり75の遺伝子座、1mm
2当たり100の遺伝子座、1mm
2当たり130の遺伝子座、1mm
2当たり150の遺伝子座、1mm
2当たり175の遺伝子座、1mm
2当たり200の遺伝子座、1mm
2当たり300の遺伝子座、1mm
2当たり400の遺伝子座、1mm
2当たり500の遺伝子座、1mm
2当たり1,000の遺伝子座、又はそれ以上である。場合により、基質は、1mm
2から約500mm
2当たり約10の遺伝子座、1mm
2から約400mm
2当たり約25の遺伝子座、1mm
2から約500mm
2当たり約50の遺伝子座、1mm
2から約500mm
2当たり約100の遺伝子座、1mm
2から約500mm
2当たり約150の遺伝子座、1mm
2から約250mm
2当たり約10の遺伝子座、1mm
2から約250mm
2当たり約50の遺伝子座、1mm
2から約200mm
2当たり約10の遺伝子座、1mm
2から約200mm
2当たり約50の遺伝子座を含む。幾つかの実施形態において、クラスタ内の2つの隣接した遺伝子座の中心間の距離は、約10μmから約500μm、約10μmから約200μm、又は約10μmから約100μmである。場合により、隣接した遺伝子座の2つの中心間の距離は、約10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、又は100μmより長い。場合により、2つの隣接した遺伝子座の中心間の距離は、約200μm、150μm、100μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、又は10μm未満である。幾つかの例において、各遺伝子座の幅は、約0.5μm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、又は100μmである。場合により、各遺伝子座の幅は、約0.5μmから100μm、約0.5μmから50μm、約10μmから75μm、又は約0.5μmから50μmである。
【0120】
幾つかの実施形態において、基質内のクラスタの密度は、100mm
2当たり少なくとも又は約1のクラスタ、10mm
2当たり1のクラスタ、5mm
2当たり1のクラスタ、4mm
2当たり1のクラスタ、3mm
2当たり1のクラスタ、2mm
2当たり1のクラスタ、1mm
2当たり1のクラスタ、1mm
2当たり2のクラスタ、1mm
2当たり3のクラスタ、1mm
2当たり4のクラスタ、1mm
2当たり5のクラスタ、1mm
2当たり10のクラスタ、1mm
2当たり50のクラスタ、又はそれ以上である。幾つかの実施形態において、基質は、10mm
2当たり約1のクラスタから1mm
2当たり約10のクラスタを含む。幾つかの実施形態において、2つの隣接したクラスタの中心間の距離は、約50μm、100μm、200μm、500μm、1000μm、2000μm、又は5000μm未満である。場合により、2つの隣接したクラスタの中心間の距離は、約50μmから約100μm、約50μmから約200μm、約50μmから約300μm、約50μmから約500μm、及び約100μmから約2000μmである。場合により、2つの隣接したクラスタの中心間の距離は、約0.05mmから約50mm、約0.05mmから約10mm、約0.05mmから約5mm、約0.05mmから約4mm、約0.05mmから約3mm、約0.05mmから約2mm、約0.1mmから10mm、約0.2mmから10mm、約0.3mmから約10mm、約0.4mmから約10mm、約0.5mmから10mm、約0.5mmから約5mm、又は約0.5mmから約2mmである。場合により、各クラスタは、約0.5から2mm、約0.5から1mm、又は約1から2mmの断面を有している。場合により、各クラスタは、約0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、又は2mmの断面を有している。場合により、各クラスタは、約0.5、0.6、0.7、0.8、0.9、1、1.1、1.15、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、又は2mmの内部断面を有している。
【0121】
幾つかの実施形態において、基質は、例えば、約100〜200mm×約50〜150mmの、およその標準の96ウェルプレートのサイズであり得る。幾つかの実施形態において、基質は、約1000mm、500mm、450mm、400mm、300mm、250nm、200mm、150mm、100mm、又は50mm以下の直径を有している。幾つかの実施形態において、基質の直径は、約25mmから1000mm、約25mmから約800mm、約25mmから約600mm、約25mmから約500mm、約25mmから約400mm、約25mmから約300mm、又は約25mmから約200である。基質サイズの非限定的な例は、約300mm、200mm、150mm、130mm、100mm、76mm、51mm、及び25mmを含む。幾つかの実施形態において、基質は、少なくとも約100mm
2;200mm
2;500mm
2;1,000mm
2;2,000mm
2;5,000mm
2;10,000mm
2;12,000mm
2;15,000mm
2;20,000mm
2;30,000mm
2;40,000mm
2;50,000mm
2又はそれ以上の平面の表面積を有している。幾つかの実施形態において、基質の厚さは、約50mmから約2000mm、約50mmから約1000mm、約100mmから約1000mm、約200mmから約1000mm、又は約250mmから約1000mmである。基質の厚さの非限定的な例は、275mm、375mm、525mm、625mm、675mm、725mm、775mm、及び925mmを含む。場合により、基質の厚さは、直径によって変わり、基質の組成物に左右される。例えば、シリコン以外の物質を含む基質は、同じ直径のシリコン基質とは異なる厚さを有している。基質の厚さは、使用される物質の機械強度によって決定され、取り扱い中に割れることなくそれ自体の重量を支えるのに十分でなければならない。
【0123】
本明細書に提供される基質、装置、及びリアクターは、本明細書に記載される方法及び組成物に適したあらゆる様々な物質から作り上げられる。特定の実施形態において、低レベルのヌクレオチド結合を示すために、基質物質が作り上げられる。場合により、基質物質は、高レベルのヌクレオチド結合を示す別々の表面を生成するために修正される。幾つかの実施形態において、基質物質は、可視光及び/又はUV光に対して透過性である。幾つかの実施形態において、基質物質は、十分に導電性である、例えば、基質の全て又は一部にわたって均一な電場を形成することができる。幾つかの実施形態において、導電性材料は電気接地(electric ground)に接続される。場合により、基質は、熱伝導性であるか又は断熱される。場合により、物質は、化学的又は生化学的な反応、例えばオリゴ核酸合成反応プロセスを支持するために耐薬品性及び耐熱性である。幾つかの実施形態において、基質は可撓性材料を含む。可撓性材料は、限定されないが、修飾ナイロン、非修飾ナイロン、ニトロセルロース、ポリプロピレンなどを含む。幾つかの実施形態において、基質は剛性材料を含む。剛性材料は、限定されないが、ガラス、石英ガラス(fuse silica)、シリコン、二酸化ケイ素、窒化ケイ素、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネート、及びそれらの混合物など)、及び金属(例えば、金、白金など)を含む。幾つかの実施形態において、基質は、シリコン、ポリスチレン、アガロース、デキストラン、セルロース系ポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、ガラス、又はそれらの任意の組み合わせを含む材料から作り上げられる。場合により、基質は、本明細書にリストされた材料又は当該技術分野において既知の他の適切な材料の組み合わせで製造される。
【0125】
様々な実施形態において、基質は隆起した及び/又は沈降した特徴を含む。そのような特徴を有している1つの利点は、オリゴ核酸合成を支持する表面積の増大である。幾つかの実施形態において、隆起した及び/又は沈降した特徴を有する基質は、三次元基質と呼ばれる。場合により、三次元基質は1つ以上のチャネルを含む。場合により、1つ以上の遺伝子座はチャネルを含む。場合により、チャネルは、オリゴ核酸シンセサイザーなどの堆積装置を介した試薬の堆積に利用可能である。場合により、試薬及び/又は流体は、1つ以上のチャネルと流体連通してより大きなウェルに集まる。例えば、基質は、クラスタを有する複数の遺伝子座に対応する複数のチャネルを含み、複数のチャネルは、クラスタの1つのウェルと流体連通している。
幾つかの方法において、オリゴ核酸のライブラリは、クラスタの複数の遺伝子座において合成される。
【0126】
幾つかの実施形態において、その構造は、表面上のオリゴ核酸合成に関する流れの及び物質移動経路の制御を可能にするように構成されている。幾つかの実施形態において、基質の構成は、オリゴ核酸合成中の物質移動経路、化学暴露時間、及び/又は洗浄効果の制御並びにその分布までをも可能にする。幾つかの実施形態において、基質の構成は、例えば、成長しているオリゴ核酸による排除体積が、オリゴ核酸の成長に利用可能な又は適切な最初に利用可能な体積の50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1%を超えて、又はそれ以下を占めないほど十分な、オリゴ核酸の成長に対する体積を提供することによって、奏効率の増大を可能にする。幾つかの実施形態において、三次元構造は、化学暴露の急速な交換を可能にするために流体の流れの管理を可能にする。
【0127】
幾つかの実施形態において、物理構造によって隔離が達成される。幾つかの実施形態において、オリゴ核酸合成に対する能動領域及び受動領域を発生させる表面の差次的な官能化によって、隔離が達成される。差次的な官能化はまた、基質表面にわたる疎水性を変え、それによって、堆積した試薬の水滴(beading)又は湿りを引き起こす水接触角の効果を作り出すことによって達成される。より大きな構造を利用することで、飛び散り(splashing)及び隣接するスポットの試薬による別々のオリゴ核酸合成位置の相互汚染を減らすことができる。場合により、オリゴ核酸シンセサイザーなどの装置が、別々のオリゴ核酸合成位置のための試薬を堆積させるために使用される。三次元の特徴を有する基質は、低いエラー率(例えば、約1:500、1:1000、1:1500、1:2,000、1:3,000、1:5,000、又は1:10,000未満)で多数のオリゴ核酸(例えば約10,000を超える)の合成を可能にする方法で構成される。幾つかの事例では、基質は、1mm
2当たり約1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400又は500、或いはそれらを超える特徴の密度を備えた特徴を含む。
【0128】
基質のウェルは、基質の別のウェルと同じ又は異なる幅、高さ、及び/又は体積を有し得る。基質のチャネルは、基質の別のチャネルと同じ又は異なる幅、高さ、及び/又は体積を有し得る。幾つかの実施形態において、クラスタの直径、又はクラスタを含むウェルの直径、或いはその両方は、約0.05mmから約50mm、約0.05mmから約10mm、約0.05mmから約5mm、約0.05mmから約4mm、約0.05mmから約3mm、約0.05mmから約2mm、約0.05mmから約1mm、約0.05mmから約0.5mm、約0.05mmから約0.1mm、約0.1mmから10mm、約0.2mmから10mm、約0.3mmから約10mm、約0.4mmから約10mm、約0.5mmから10mm、約0.5mmから約5mm、又は約0.5mmから約2mmである。幾つかの実施形態において、クラスタ、ウェル、又はその両方の直径は、約5mm、4mm、3mm、2mm、1mm、0.5mm、0.1mm、0.09mm、0.08mm、0.07mm、0.06mm又は0.05mm、或いはそれ未満である。幾つかの実施形態において、クラスタ、ウェル、又はその両方の直径は約1.0〜1.3mmである。幾つかの実施形態において、クラスタ、ウェル、又はその両方の直径は約1.150mmである。幾つかの実施形態において、クラスタ、ウェル、又はその両方の直径は約0.08mmである。クラスタの直径は、二次元又は三次元の基質内のクラスタを指す。
【0129】
幾つかの実施形態において、ウェルの高さは、約20μmから約1000μm、約50μmから約1000μm、約100μmから約1000μm、約200μmから約1000μm、約300μmから約1000μm、約400μmから約1000μm、又は約500μmから約1000μmである。場合により、ウェルの高さは、約1000μm未満、約900μm未満、約800μm未満、約700μm未満、又は約600μm未満である。
【0130】
幾つかの実施形態において、基質は、クラスタ内の複数の遺伝子座に対応する複数のチャネルを含み、チャネルの高さ又は深さは、約5μmから約500μm、約5μmから約400μm、約5μmから約300μm、約5μmから約200μm、約5μmから約100μm、約5μmから約50μm、又は約10μmから約50μmである。場合により、チャネルの高さは、100μm未満、80μm未満、60μm未満、40μm未満又は20μm未満である。
【0131】
幾つかの実施形態において、チャネル、遺伝子座(例えば、実質的に平面の基板における)、又はチャネル及び遺伝子座の両方の直径(例えば、遺伝子座がチャネルに対応する三次元構造基質における)は、約1μmから約1000μm、約1μmから約500μm、約1μmから約200μm、約1μmから約100μm、約5μmから約100μm、又は約10μmから約100μm、例えば、約90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、又は10μmである。幾つかの実施形態において、チャネル、遺伝子座、又はチャネル及び遺伝子座の両方の直径は、約100μm、90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm又は10μm未満である。幾つかの実施形態において、2つの隣接チャネル、遺伝子座、又はチャネル及び遺伝子座の中心間の距離は、約1μmから約500μm、約1μmから約200μm、約1μmから約100μm、約5μmから約200μm、約5μmから約100μm、約5μmから約50μm、又は約5μmから約30μm、例えば、約20μmである。
【0133】
様々な実施形態において、基質表面又は基質表面の選択部位或いは領域の1つ以上の化学的及び/又は物理的な特性を変更する加算或いは減算のプロセスによる化学的及び/又は物理的な変更のために、表面修飾が利用される。例えば、表面修飾は、限定されないが、(1)表面の湿潤性を変更すること、(2)表面を官能化すること、つまり、表面官能基を提供する、修飾する、又は置換すること、(3)表面を脱官能基化すること、つまり、表面官能基を除去すること、(4)そうでなければ、例えばエッチングによって、表面の化学組成を変更すること、(5)表面粗さを増大又は低減すること、(6)表面上にコーティング、例えば、表面の湿潤性とは異なる湿潤性を示すコーティングを提供すること、及び/又は(7)表面上に粒子を堆積させることを含む。
【0134】
場合により、(接着プロモーターと呼ばれる)表面の上部の化学層の追加は、基質の表面上の遺伝子座の構造化されたパターン化を促進する。接着促進の適用のための典型的な表面は、限定されないが、ガラス、シリコン、二酸化ケイ素及び窒化ケイ素を含む。場合により、接着プロモーターは、高い表面エネルギーを有する化学物質である。幾つかの実施形態において、基質の表面上に第2の化学層が堆積される。場合により、第2の化学層は、低い表面エネルギーを有している。場合により、表面上にコーティングされた化学層の表面エネルギーは、表面上での液滴の局在化を支持する。選択されるパターン化の配置によって、遺伝子座の接近及び/又は遺伝子座での流体接触の領域は変更可能である。
【0135】
幾つかの実施形態において、例えばオリゴ核酸合成のために、核酸又は他の部分が堆積される、基質表面、或いは分解された遺伝子座は、滑らか又は実質的に平面である(例えば、二次元)か、或いは隆起した又は沈降した特徴などの不規則性を有している(例えば三次元の特徴)。幾つかの実施形態において、基質表面は、化合物の1つ以上の異なる層で修飾される。対象のそのような修飾層は、限定されないが、金属、金属酸化物、ポリマー、小さな有機分子などの無機層及び有機層を含む。非限定的なポリマー層は、ペプチド、タンパク質、核酸又はそれらの模倣物(例えば、ペプチド核酸など)、多糖類、リン脂質、ポリウレタン、ポリエステル、ポリカーボネート、ポリ尿素、ポリアミド、ポリエチレンアミン、ポリアリーレンスルフィド、ポリシロキサン、ポリイミド、ポリアセテート、及び本明細書に記載される又はそうでなければ当該技術分野に既知の他の適切な化合物を含む。場合により、ポリマーはヘテロポリマーである。場合により、ポリマーはホモポリマーである。場合により、ポリマーは、官能性部分を含むか又は結合される。
【0136】
幾つかの実施形態において、基質の分解された遺伝子座は、表面エネルギーを増大させる及び/又は低減させる1つ以上の部分で官能化される。場合により、部分は化学的に不活性である。場合により、部分は、望ましい化学反応、例えば、オリゴ核酸合成反応における1つ以上のプロセスを支持するように構成されている。表面の表面エネルギー、即ち疎水性は、表面上へと付着するヌクレオチドの親和性を決定するための因子である。幾つかの実施形態において、基質の官能化のための方法は、(a)二酸化ケイ素を含む表面を有する基質を提供する工程;及び(b)本明細書に記載される又はそうでなければ当該技術分野で既知の適切なシラン化剤、例えば、有機官能性アルコキシシラン分子を使用して、表面をシラン処理する工程を含む。場合により、有機官能性アルコキシシラン分子は、ジメチルクロロ−オクトデシル−シラン、メチルジクロロ−オクトデシル−シラン、トリクロロ−オクトデシル−シラン、トリメチル−オクトデシル−シラン、トリエチル−オクトデシル−シラン、又はそれらの任意の組み合わせを含む。幾つかの実施形態において、基質表面は、ポリエチレン/ポリプロピレン(ヒドロキシアルキル表面へのガンマ線照射又はクロム酸酸化、及び還元によって官能化)、高度に架橋されたポリスチレン−ジビニルベンゼン(クロロメチル化によって誘導体化され、ベンジルアミン官能面にアミノ化された)、ナイロン(末端のアミノヘキシル基は直接反応性である)で官能化されるか、又は還元されたポリテトラフルオロエチレンでエッチングされる。他の方法及び官能化剤は、米国特許第5,474,796号に記載され、これは参照によってその全体が本明細書に組み込まれる。
【0137】
幾つかの実施形態において、基質表面は、典型的に基質表面上に存在する反応性の親水性部分を介して、基質表面にシランを結合させるのに有効な反応条件下で、シランの混合物を含有している誘導体化組成物との接触によって官能化される。シラン処理は、一般に、自己組織化を介して有機官能性アルコキシシラン分子で表面を覆う。当該技術分野において現在知られているように、例えば、表面エネルギーを低下させる又は増大させるための様々なシロキサン官能化試薬が更に使用され得る。有機官能性のアルコキシシランは、その有機官能基に応じて分類される。シロキサン官能化試薬の非限定的な例は、ヒドロキシアルキルシロキサン(シリル化表面(silylate surface)、ジボランで官能化し、過酸化水素によりアルコールを参加させる)、ジオール(ヒドロキシアルキル)シロキサン(シリル化表面、ジオールへと加水分解)、アミノアルキルシロキサン(アミンは中間の官能化工程を必要としない)、グリシドキシシラン(3−グシリドキシプロピル−ジメチル−エトキシシラン、グリシドキシ−トリメトキシシラン、メルカプトシラン(3−メルカプトプロピル−トリメトキシシラン、3−4エポキシシクロヘキシル−エチルトリメトキシシラン、又は3−メルカプトプロピル−メチル−ジメトキシシラン)、ビシクロヘプタヘニル−トリクロロシラン、ブチル−アルデヒド(aldehydr)−トリメトキシシラン、又は二量体の第2のアミノアルキルシロキサンを含む。例示的なヒドロキシアルキルシロキサンは、3−ヒドロキシプロピルへと変わるアリルトリクロロクロロシラン、又は8−ヒドロキシオクチルへと変わる7−オクタ−1−エニルトリクロロクロロシランを含む。ジオール(ジヒドロキシアルキル)シロキサンは、グリシジルトリメトキシシラン由来(2,3−ジヒドロキシプロピルオキシ)プロピル(GOPS)を含む。アミノアルキルシロキサンは、3−アミノプロピル(3−アミノプロピル−トリエトキシシラン、3−アミノプロピル−ジエトキシ−メチルシラン、3−アミノプロピル−ジメチル−エトキシシラン、又は3−アミノプロピル−トリメトキシシラン)へと変わる3−アミノプロピルトリメトキシシランを含む。例示的な二量体の第2のアミノアルキルシロキサンは、ビス(シリルオキシルプロピル)アミンへと変わるビス(3−トリメトキシシリルプロピル)アミンを含む。幾つかの実施形態において、官能化剤は、11−アセトキシウンデシルトリエトキシシラン、n−デシルトリエトキシシラン、(3−アミノプロピル)トリメトキシシラン、(3−アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシラン、及びN−(3−トリエトキシシリルプロピル)−4−ヒドロキシブチルアミドを含む。
【0139】
オリゴ核酸合成のための方法は、様々な実施形態において、ホスホロアミダイト化学物質を含むプロセスを含む。幾つかの実施形態において、オリゴ核酸合成は、塩基をホスホラミダイトと結合する工程を含む。幾つかの実施形態において、オリゴ核酸合成は、結合条件下でホスホラミダイトの堆積によって塩基を結合する工程を含み、ここで同じ塩基が、1回より多く、即ち、二重の結合でホスホラミダイトと共に随意に堆積される。幾つかの実施形態において、オリゴ核酸合成は、未反応部位のキャッピングを含む。場合により、キャッピングは随意である。幾つかの実施形態において、オリゴ核酸合成は酸化を含む。幾つかの実施形態において、オリゴ核酸合成はデブロッキング又は脱トリチル化を含む。幾つかの実施形態において、オリゴ核酸合成は硫化を含む。場合により、オリゴ核酸合成は、酸化又は硫化のいずれかを含む。幾つかの実施形態において、オリゴ核酸合成反応中の1つ又は各々の工程間で、基質は、例えば、テトラゾール又はアセトニトリルを使用して洗浄される。ホスホラミダイト合成方法における任意の1工程に対する時間枠は、約2分、1分、50秒、40秒、30秒、20秒及び10秒未満を含む。
【0140】
ホスホラミダイト方法を使用するオリゴ核酸合成は、亜リン酸塩トリエステル結合の形成のために成長しているオリゴ核酸鎖へのホスホラミダイト構築ブロック(例えば、ヌクレオシドホスホラミダイト)のその後の追加を含む。ホスホラミダイトオリゴ核酸合成は、3’方向から5’方向に進む。ホスホラミダイトオリゴ核酸合成は、1つの合成サイクル当たり、成長している核酸鎖への1つのヌクレオチドの追加の制御を可能にする。幾つかの実施形態において、各合成サイクルは結合工程を含む。ホスホラミダイト結合は、活性化されたヌクレオシドホスホラミダイトと、例えばリンカーを介して基質に結合されたヌクレオシドとの間の亜リン酸塩トリエステル結合の形成を含む。幾つかの実施形態において、ヌクレオシドホスホラミダイトは、活性化された基質に提供される。幾つかの実施形態において、ヌクレオシドホスホラミダイトは、活性化因子と共に基質に提供される。幾つかの実施形態において、ヌクレオシドホスホラミダイトは、基質に結合されたヌクレオシドよりも1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍、又はそれ以上の過剰量で、基質に提供される。幾つかの実施形態において、ヌクレオシドホスホラミダイトの追加は、無水環境において、例えば、無水アセトニトリルにおいて実行される。ヌクレオシドホスホラミダイトの追加に続いて、基質は随意に洗浄される。幾つかの実施形態において、結合工程は、随意に、基質へのヌクレオシドホスホラミダイトの追加間の洗浄工程と共に、追加で1回以上繰り返される。幾つかの実施形態において、本明細書で使用されるオリゴ核酸合成方法は、1、2、3又はそれ以上の連続結合工程を含む。結合前に、多くの場合において、基質に結合されたヌクレオシドは、保護基の除去によって脱保護され、ここで、保護基は重合を防ぐように機能する。一般的な保護基は、4,4’−ジメトキシトリチル(DMT)である。
【0141】
結合に続いて、ホスホラミダイトオリゴ核酸合成方法は、随意にキャッピング工程を含む。キャッピング工程では、成長しているオリゴ核酸は、キャッピング剤で処置される。キャッピング工程は、更なる鎖伸長からの結合後に未反応の基質に結合した5’−OH基をブロックするのに有用であり、これによって、内部塩基欠失(internal base deletions)でのオリゴ核酸の形成を防ぐ。更に、1H−テトラゾールで活性化されたホスホラミダイトは、小さい程度まで、グアノシンのO6位置と反応し得る。理論に縛られることなく、I
2/水での酸化で、この副産物は、恐らくO6−N7遊走を介して、脱プリン化を受けることもある。脱プリン部位は、最終的に、オリゴ核酸の最終的な脱保護の間に切断され、これにより全長産物の収率が低下する。O6修飾は、I
2/水での酸化前にキャッピング試薬による処置によって除去され得る。幾つかの実施形態において、オリゴ核酸合成の間にキャッピング工程を含めることで、キャッピングなしでの合成と比較して、エラー率は低下する。一例として、キャッピング工程は、無水酢酸と1−メチルイミダゾールとの混合物で、基質に結合したオリゴ核酸を処置することを含む。キャッピング工程に続いて、基質は随意に洗浄される。
【0142】
幾つかの実施形態において、ヌクレオシドホスホラミダイトの追加に続いて、及び随意にキャッピングと1以上の洗浄工程の後に、基質に結合した成長している核酸が酸化される。酸化工程は、亜リン酸塩トリエステルが、自然発生のリン酸ジエステルのヌクレオシド間の結合の保護された前駆体である、四配位リン酸塩トリエステルへと酸化される。場合により、成長しているオリゴ核酸の酸化は、随意に弱塩基(例えば、ピリジン、ルチジン、コリジン)の存在下で、ヨウ素及び水による処置によって達成される。酸化は、例えば、tert−ブチルヒドロペルオキシド又は(1S)−(+)−(10−カンファースルホニル)−オキサジリジン(CSO)を使用して、無水条件下で実行され得る。幾つかの方法では、キャッピング工程は、酸化に続いて実行される。持続し得る酸化からの残留水が、後の結合を阻害することができるため、第2のキャッピング工程は基質の乾燥を可能にする。酸化に続いて、基質及び成長しているオリゴ核酸は随意に洗浄される。幾つかの実施形態において、酸化の工程は、オリゴヌクレオチドホスホロチオエートを得るための硫化工程と置き換えられ、ここでキャッピング工程は硫化後に実行され得る。限定されないが、3−(ジメチルアミノメチリデン)アミノ)−3H−1,2,4−ジチアゾール−3−チオン、DDTT、Beaucage試薬としても知られている3H−1,2−ベンゾジチオール−3−オン1,1−ジオキシド、及びN,N,N’N’テトラエチルチウラムジスルフィド(TETD)を含む、多くの試薬が、効率的な硫黄移動を行うことができる。
【0143】
ヌクレオシド取り込みの後のサイクルを、結合を介して生じさせるために、基質に結合した成長しているオリゴ核酸の保護された5’末端は除去され、その結果、一次ヒドロキシル基が次のヌクレオシドホスホラミダイトと反応する。幾つかの実施形態において、保護基はDMTであり、デブロッキングがジクロロメタン中でトリクロロ酢酸により生じる。長時間にわたり、又は推奨された酸の溶液よりも強力なもので、脱トリチル化を行うことは、固形支持体に結合したオリゴヌクレオチドの脱プリン化の増大につながり、故に望ましい全長産物の収率が低下することがある。本明細書に記載の本発明の方法及び組成物は、望ましくない脱プリン反応を制限する制御されたデブロッキングの条件を提供する。場合により、基質に結合したオリゴ核酸は、デブロッキング後に洗浄される。場合により、デブロッキング後の効率的な洗浄は、低いエラー率を有する合成オリゴ核酸に寄与する。
【0144】
オリゴ核酸の合成のための方法には、典型的に下記工程の一連の繰り返し(iterating sequence)が伴う:活性化された表面、リンカー、又は以前に脱保護された単量体と結合するために、保護された単量体の活発に官能化された表面(例えば遺伝子座)への適用;後に適用される保護された単量体と反応するような、適用された単量体の脱保護;及び結合のための別の保護された単量体の適用。1以上の中間工程は、酸化又は硫化を含む。場合により、1以上の洗浄工程は、工程の1つ又は全てに先行する、又はそれらに続いて行われる。
【0145】
ホスホラミダイトベースのオリゴ核酸合成のための方法は、一連の化学工程を含む。幾つかの実施形態において、合成方法の1以上の工程は、試薬のサイクリングを含み、ここで、方法の1以上の工程は、この工程に有用な試薬の基質への適用を含む。例えば、試薬は、一連の液体堆積及び真空乾燥の工程によって循環させられる。ウェル、マイクロウェル、チャネルなどの三次元の特徴を含む基質のために、試薬は、随意にウェル及び/又はチャネルを介して基質の1つ以上の領域に通される。
【0146】
本明細書に記載される方法及び/又は基質を使用して合成されたオリゴ核酸は、様々な実施形態において、少なくとも約20、30、40、50、60、70、75、80、90、100、120、150、又はそれ以上の塩基を含む。幾つかの実施形態において、少なくとも約1pmol、10pmol、20pmol、30pmol、40pmol、50pmol、60pmol、70pmol、80pmol、90pmol、100pmol、150pmol、200pmol、300pmol、400pmol、500pmol、600pmol、700pmol、800pmol、900pmol、1nmol、5nmol、10nmol、100nmol、又はそれ以上のオリゴ核酸は、遺伝子座内で合成される。本明細書で提供される、表面上でのオリゴ核酸合成の方法は、高速での合成を可能にする。一例として、1時間につき少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45 50、55、60、70、80、90、100、125、150、175、200のヌクレオチド、又はそれ以上が合成される。ヌクレオチドは、アデニン、グアニン、チミン、シトシン、ウリジンの構築ブロック、又はそれらのアナログ/修飾されたバージョンを含む。幾つかの実施形態において、オリゴ核酸のライブラリは基質上で平行に合成される。例えば、約又は少なくとも約100;1,000;10,000;100,000;1,000,000;2,000,000;3,000,000;4,000,000;又は5,000,000の分解された遺伝子座を含む基質は、少なくとも同じ数の別個のオリゴ核酸の合成を支援することができ、ここで、別個の配列をコードするオリゴ核酸が、分解された遺伝子座の上で合成される。幾つかの実施形態において、オリゴ核酸のライブラリは、約3か月、2か月、1か月、3週、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日、24時間未満で、本明細書に記載される低いエラー率を伴う基質上で合成される。幾つかの実施形態において、本明細書に記載される基質及び方法を用いて低いエラー率で合成されるオリゴ核酸ライブラリから組み立てられる、より大きな核酸は、約3か月、2か月、1か月、3週、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日、24時間未満で調製される。
【0147】
一旦、生成のためにより大きなオリゴ核酸が選択されると、オリゴ核酸の予め定められたライブラリは、デノボ合成のために設計される。高密度のオリゴ核酸アレイを生成するための様々な適切な方法が知られている。ワークフローの例において、基質表面層が提供される。この例において、表面の化学的性質(chemistry)は、オリゴ核酸合成プロセスを改善するために変更される。低い表面エネルギーの領域が液体を弾くために生成され、一方で高い表面エネルギーの領域が液体を引き付けるために生成される。表面自体は、平坦な表面の形であり、又は、表面積を増大させる突起又はマイクロウェルなどの形状の変形を含み得る。ワークフローの例において、全体において参照により本明細書に組み込まれる国際特許出願公開WO/2015/021080に開示されるように、選択された高い表面エネルギー分子は、DNAの化学的性質を支援する二元機能に役立つ。
【0148】
オリゴ核酸アレイのインサイツの調製は、固形支持体上で生成され、平行して複数のオリゴマーを伸長させるために単一のヌクレオチド伸長プロセスを利用する。オリゴ核酸シンセサイザーなどの堆積装置は、段階的な様式で試薬を放出するように設計され、その結果、複数のオリゴ核酸が平行して、一度に1つの残基を伸長させ、それにより予め定められた核酸配列を持つオリゴマーを生成する。場合により、オリゴ核酸はこの段階で表面から切断される。切断は、例えばアンモニア又はメチルアミンによる気相切断(gas cleavage)を含む。
【0150】
本明細書に記載されるシステムの何れかは、コンピューターに操作可能に連結され、且つコンピューターを介して局所的に又は遠隔で自動操作され得る。様々な実施形態において、本発明の方法及びシステムは更に、コンピューターシステム上のソフトウェアプログラム、及びその使用を含み得る。従って、材料堆積装置の動作、分配行為、及び減圧の作動を編成及び同期するなど、機能の分配/減圧/再充填の同期のためのコンピューター制御は、本発明の範囲内にある。コンピューターシステムは、ユーザーに指定された塩基配列と材料堆積装置の位置との間に干渉するようにプログラムされ、基質の指定された領域に正確な試薬を送達する。
【0151】
図8に例示されるコンピューターシステム(800)は、媒体(811)及び/又はネットワークポート(805)から命令を読み出すことが可能な、論理的な装置として理解され、固定された媒体(812)を持つサーバー(809)に随意に接続され得る。
図8に示されるものなどのシステムは、CPU(801)、ディスクドライブ(803)、キーボード(815)及び/又はマウス(816)などの随意の入力装置、及び随意のモニター(807)を含み得る。データ通信は、局所又は遠隔の位置でサーバーに対して示された通信媒体を通じて達成され得る。通信媒体は、データを送信及び/又は受信する任意の手段を含み得る。例えば、通信媒体は、ネットワーク接続、無線接続、又はインターネット接続であり得る。そのような接続は、ワールド・ワイド・ウェブ上での通信を提供することができる。本開示に関するデータは、
図8に例示されるように当事者(822)による受理及び/又は検討のためにそのようなネットワーク又は接続によって伝達され得ることが想定される。
【0152】
図9は、本発明の実施形態の例と関連して使用され得るコンピューターシステム(900)の第1の例のアーキテクチャを示すブロック図である。
図9に表されるように、コンピューターシステムの例は、命令を処理するためのプロセッサ(902)を含み得る。プロセッサの限定されない例は、以下を含む:Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32−bit RISC ARM 1176JZ(F)−S v1.0(商標)プロセッサ、ARM Cortex−A8 Samsung S5PC100(商標)プロセッサ、ARM Cortex−A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、又は機能的に同等なプロセッサ。複数のスレッドの実行が並列処理のために使用され得る。幾つかの実施形態において、複数のプロセッサ、又は複数のコアを持つプロセッサはまた、単一のコンピューターシステム中でも、クラスタの中でも、又は、複数のコンピューター、携帯電話、及び/又は個人用携帯情報端末装置を含むネットワーク上のシステムにわたって分布されても、使用され得る。
【0153】
図9に例示されるように、高速キャッシュ(904)は、プロセッサ(902)に接続するか、又はその中に組み込まれることで、プロセッサ(902)により近年使用されてきた又は頻繁に使用されている命令又はデータのための高速メモリを提供することができる。プロセッサ(902)は、プロセッサバス(908)によりノースブリッジ(906)に接続される。ノースブリッジ(906)は、メモリバス(912)によりランダムアクセスメモリ(RAM)(910)に接続され、プロセッサ(902)によりRAM(910)へのアクセスを管理する。ノースブリッジ(906)はまた、チップセットバス(916)によりサウスブリッジ(914)に接続される。サウスブリッジ(914)は次に、周辺バス(918)に接続される。周辺バスは、例えばPCI、PCI−X、PCI Express、又は他の周辺バスであり得る。ノースブリッジ及びサウスブリッジは頻繁に、プロセッサチップセットと称され、周辺バス(918)上でプロセッサと、RAMと、周辺コンポーネントとの間のデータ転送を管理する。幾つかの代替的なアーキテクチャにおいて、ノースブリッジの機能性は、別個のノースブリッジチップを使用する代わりにプロセッサに組み込まれ得る。幾つかの実施形態において、システム(900)は、周辺バス(918)に付けられたアクセラレータカード(922)を含むことができる。アクセラレータは、特定の処理を促進するためのフィールドプログラマブルゲートアレイ(FPGA)又は他のハードウェアを含み得る。例えば、アクセラレータは、適応データの再構築のために、又は、拡張設定処理に使用される代数式を評価するために使用され得る。
【0154】
ソフトウェアとデータは、外部記憶装置(924)に記憶され、プロセッサによる使用のためにRAM(910)及び/又はキャッシュ(904)へとロードされ得る。システム(900)は、システムリソースの管理のためのオペレーティングシステムを含み;オペレーティングシステムの限定されない例は、以下を含む:Linux(登録商標)、Windows(商標)、MACOS(商標)、BlackBerry OS(商標)、iOS(商標)、及び他の機能的に同等なOS、同様に、本発明の実施形態の例に従ってデータの記憶と最適化を管理するためのオペレーティングシステム上で実行するアプリケーションソフトウェア。この例において、システム(900)はまた、ネットワーク接続ストレージ(NAS)などの外部記憶装置、及び分散並列処理に使用され得る他のコンピューターシステムに対するネットワークインターフェースを提供するために、周辺バスに接続されるネットワークインターフェースカード(NIC)(920)及び(921)を含む。
【0155】
図10は、複数のコンピューターシステム(1002a)及び(1002b)、複数の携帯電話及び個人用携帯情報端末(1002c)、並びにネットワーク接続ストレージ(NAS)(1004a)及び(1004b)を含むネットワーク(1000)を示す略図である。実施形態の例において、システム(1002a)、(1002b)、及び(1002c)は、データ記憶を管理し、ネットワーク接続ストレージ(NAS)(1004a)及び(1004b)に記憶されたデータに対するデータアクセスを最適化することができる。数学モデルはこのデータに対して使用され、コンピューターシステム(1002a)及び(1002b)、並びに携帯電話及び個人用携帯情報端末システム(1002c)にわたって分散並列処理を使用して評価され得る。コンピューターシステム(1002a)及び(1002b)、並びに携帯電話及び個人用携帯情報端末システム(1002c)はまた、ネットワーク接続ストレージ(NAS)(1004a)及び(1004b)に記憶されたデータの適応データ再構築に対して並列処理を提供することができる。
図10は一例のみを例示しており、様々な他のコンピューターのアーキテクチャ及びシステムは、本発明の様々な実施形態と共に使用され得る。例えば、ブレードサーバーは並列処理を提供するために使用され得る。プロセッサブレードは、並列処理を提供するためにバックプレーンを通じて接続され得る。ストレージはまた、別個のネットワークインターフェースを通ってバックプレーンに、又はネットワーク接続ストレージ(NAS)として接続され得る。幾つかの実施形態の例において、プロセッサは、別個のメモリ空間を維持し、ネットワークインターフェース、バックプレーン、又は他のプロセッサによる並列処理のための他のコネクターを通じてデータを伝達することができる。他の実施形態において、プロセッサの幾つか又は全てが、共有仮想アドレスメモリ空間を使用することができる。
【0156】
図11は、実施形態の例に従って共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピューターシステムのブロック図である。システムは、共有メモリサブシステム(1104)にアクセス可能な複数のプロセッサ(1102a−f)を含む。システムは、メモリサブシステム(1104)に複数のプログラマブルハードウェアのメモリアルゴリズムプロセッサ(MAP)(1106a−f)を組み込む。MAP(1106a−f)は各々、メモリ(1108a−f)及び1以上のフィールドプログラマブルゲートアレイ(FPGA)(1110a−f)を含み得る。MAPは設定可能な機能ユニットを提供し、特定のアルゴリズム又はその一部は、各プロセッサと密接に協働して処理を行うためにFPGA(1110a−f)に提供され得る。例えば、MAPは、データモデルに関する代数式を評価し、且つ実施形態の例における適応データの再構築を行なうために使用され得る。この例において、MAPは各々、このような目的のためのプロセッサ全てにより世界的にアクセス可能である。1つの構成において、MAPは各々、関連するメモリ(1108a−f)にアクセスするためにダイレクトメモリアクセス(DMA)を使用することができ、それにより、各マイクロプロセッサ(1102a−f)とは別個に、且つこれらから非同期的にタスクを実行することが可能となる。この構成において、MAPは、パイプライン処理(pipelining)及びアルゴリズムの並列の実行のために別のMAPに直接結果を供給することができる。
【0157】
上述のコンピューターのアーキテクチャ及びシステムは単なる例であり、様々な他のコンピューター、携帯電話、個人用携帯情報端末のアーキテクチャ及びシステムは、一般的なプロセッサ、コプロセッサ、FPGA、及び他のプログラム可能論理回路の任意の組み合わせを使用するシステム、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、及び他の処理要素と論理素子を含む実施形態の例と共に使用され得る。幾つかの実施形態において、コンピューターシステムの全て又は一部は、ソフトウェア又はハードウェアに実装され得る。様々なデータ記憶媒体が、例えばランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワーク接続ストレージ(NAS)、及び他のローカル又は分散データ記憶装置及びシステムを含む実施形態の例と共に使用され得る。
【0158】
実施形態の例において、コンピューターシステムは、上述の又は他のコンピューターのアーキテクチャ及びシステムの何れかにて実行するソフトウェアモジュールを使用して実施され得る。他の実施形態において、システムの機能は、ファームウェア、
図11で言及されるようなフィールドプログラマブルゲートアレイ(FPGA)などのプログラム可能論理回路、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、又は他の処理要素及び論理素子において部分的又は完全に実施され得る。例えば、セットプロセッサ及びオプティマイザは、
図9に示されるアクセラレータカード(922)などのハードウェアアクセラレータカードの使用によるハードウェアアクセラレーションで実施され得る。
【0159】
以下の実施例は、当業者に対し本明細書に開示される実施形態の原理及び実践をより明白に示すために説明されるものであり、任意の請求された実施形態の範囲を制限するものとして解釈されるものではない。他に明示されない限り、全ての部分及びパーセンテージは重量基準である。
【実施例】
【0160】
以下の実施例は、本発明の様々な実施形態を例証する目的で与えられ、あらゆる様式で本発明を制限することを意図していない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態の代表例であり、典型的なものであり、且つ、本発明の範囲を限定するものとして意図されない。請求項の範囲によって定義される本発明の趣旨内に包含されるその変化及び他の使用が、当業者に想定される。
【0161】
実施例1:基質表面の機能化
【0162】
基質を機能化し、オリゴ核酸のライブラリの付着及び合成を支援した。基質表面を先ず、20分間、90%のH
2SO
4及び10%のH
2O
2を含むピラニア溶液を使用して湿式洗浄した。基質を、DI水を含む幾つかのビーカーの中ですすぎ、5分間DI水のグーズネック形状の蛇口の下で保持して、N
2で乾燥させた。基質を5分間、NH
4OH(1:100;3mL:300mL)に浸し、ハンドガン(handgun)を使用してDI水ですすぎ、DI水を含む3つの連続するビーカーの中で各々1分間浸し、その後ハンドガンを使用してDI水で再びすすいだ。その後、基質表面をO
2にさらすことにより基質をプラズマ洗浄した。SAMCO PC−300機器を使用して、下流モードで1分間、250ワットでO
2をプラズマエッチングした。
【0163】
以下のパラメータを有するYES−1224P気相蒸着オーブンシステムを使用して、清潔になった基質表面をN−(3−トリエトキシシリルプロピル)−4−ヒドロキシブチルアミドを含む溶液で活動的に官能化した:0.5から1トル、60分、70℃、135℃の気化器。Brewer Science 200Xスピンコータを使用して、基質表面をレジストコートした(resist coated)。SPR(商標)3612フォトレジストを、40秒間2500rpmで基質上でスピンコートした。基質を予め、Brewerホットプレート上で、90℃で30分間焼いた。Karl Suss MA6マスクアライナー機器を使用して、基質をフォトリソグラフィーにさらした。基質を2.2秒間さらし、MSF 26Aの中で1分間展開させた(developed)。残りの展開物(developer)をハンドガンですすぎ、基質を5分間水に浸した。基質をオーブンの中、100℃で30分間焼き、その後、Nikon L200を使用してリソグラフィーの欠損に対する目視検査を行った。洗浄処理を使用し、SAMCO PC−300機器を用いて残りのレジストを取り除き、1分間250ワットでO
2プラズマエッチングした。
【0164】
基質表面を、10μLの軽油と混合したパーフルオロオクチルトリクロロシランの100μLの溶液で受動的に官能化した。基質をチャンバに入れ、10分間ポンプでくみ出し、その後、バルブを閉じてポンプを止め、10分間放置した。チャンバを通気した。最大パワー(Crestシステム上で9)での超音波処理による70℃で500mLのNMPの中で5分間の2回の浸漬を行なうことにより、基質をレジスト剥離した。その後、最大パワーでの超音波処理により室温で500mLのイソプロパノールの中で5分間、基質を浸した。基質を、300mLの200プルーフエタノール(200 proof ethanol)に漬けて、N
2で送風乾燥した。官能化した表面は活性化され、オリゴ核酸合成のための支持体として役立った。
【0165】
実施例2:オリゴ核酸合成装置上での50merの配列の合成
【0166】
二次元オリゴ核酸合成装置をフローセルに組み入れ、フローセル(Applied Biosystems 「ABI394 DNA Synthesizer」)に接続させた。N−(3−トリエトキシシリルプロピル)−4−ヒドロキシブチルアミド(Gelest)で二次元オリゴ核酸合成装置を均一に官能化し、これを使用して、本明細書に記載されるオリゴ核酸合成方法を用いて50bpの例示的なオリゴ核酸(「50merのオリゴ核酸」)を合成した。
【0167】
50merの配列は、SEQ ID NO:1に記載されている通りであった。5’AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3’(SEQ ID NO:1)、ここで、#は、チミジン−スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP−2244)を表わし、これは、脱保護中に表面からのオリゴ核酸の放出を可能にする切断可能なリンカーである。
【0168】
表5のプロトコル及びABIシンセサイザーに従い標準DNA合成化学(結合、キャッピング、酸化、及び非ブロック化)を使用して、合成を行った。
【0169】
【表5-1】
【0170】
【表5-2】
【0171】
【表5-3】
【0172】
ホスホラミダイト/活性化因子の組み合わせを、フローセルを通じたバルク試薬の送達と同様に送達した。環境が時間全体にわたり試薬により「湿った」ままであると、乾燥工程を行わなかった。
【0173】
フローリストリクターをABI394シンセサイザーから取り除き、より速い流れを可能した。フローリストリクターなしで、アミダイト(ACN中で0.1M)、活性化因子(ACN中で0.25Mのベンゾイルチオテトラゾール(「BTT」;GlenResearchの30−3070−xx))、及びOx(20%のピリジン、10%の水、及び70%のTHF中の0.02MのI2)の流量は、(フローリストリクターで全ての試薬に対し〜50uL/secと比較して)およそ〜100uL/sec、アセトニトリル(「ACN」)及びキャッピング試薬(CapAとCapBの1:1の混合物、ここで、CapAはTHF/ピリジン中の無水酢酸であり、CapBはTHF中の16%の1−メチルイミダゾール(methylimidizole))についてはおよそ〜200uL/sec、及び、Deblock(トルエン中の3%のジクロロ酢酸)についてはおよそ〜300uL/secであった。Oxidizerを完全に押し出す時間を観察し、化学フロー時間のタイミングを適宜調整し、余分なACN洗浄を異なる化学物質間に導入した。オリゴヌクレオチド合成の後、75psiで一晩、ガス状のアンモニア中でチップを脱保護した。表面に水を5滴加えて、オリゴ核酸を再生した。その後、再生したオリゴ核酸を、BioAnalyzerの小さなRNAチップ上で分析した(データは示さない)。
【0174】
実施例3:オリゴ核酸合成装置上での100merの配列の合成
【0175】
50merの配列の合成について実施例2に記載されるのと同じプロセスを、2つの異なるシリコンチップ上で100merのオリゴ核酸(「100merのオリゴ核酸」;5’CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3、ここで、#はチミジン−スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP−2244)を表わす;SEQ ID NO:2)の合成に使用し、一方のシリコンチップはN−(3−トリエトキシシリルプロピル)−4−ヒドロキシブチルアミドで均一に官能化され、他方のシリコンチップは11−アセトキシウンデシルトリエトキシシランとn−デシルトリエトキシシランの5/95の混合物で官能化されており、表面から抽出されたオリゴ核酸を、BioAnalyzer機器の上で分析した(データは示さない)。
【0176】
以下の熱サイクルプログラムを使用して、50uLのPCR混合物(25uLのNEB Q5 mastermix、2.5uLの10uMフォワードプライマー、2.5uLの10uMリバースプライマー、表面から抽出した1uLのオリゴ核酸、及び最大50uLの水)の中で、フォワードプライマー(5’ATGCGGGGTTCTCATCATC3’;SEQ ID NO:3)及びリバースプライマー(5’CGGGATCCTTATCGTCATCG3’;SEQ ID NO:4)を使用して、2つのチップからの10のサンプル全てを更にPCR増幅した:
98C、30秒
98C、10秒;63℃、10秒;72℃、10秒;12のサイクルを繰り返す
72℃、2分
【0177】
PCR産物をBioAnalyzer上でも実行して(データは示さず)、100merの位置で急なピークを実証した。次に、PCR増幅サンプルをクローン化し、Sanger配列決定を行った(Sanger sequence)。表6は、チップ1からのスポット1−5から得たサンプル、及びチップ2からのスポット6−10から得たサンプルに対するSanger配列決定から生じる結果を要約する。
【0178】
【表6】
【0179】
故に、高品質及び高均一性の合成されたオリゴ核酸を、異なる界面化学的性質を持つ2つのチップ上で繰り返した。配列決定された100merの262のうち233に対応している、全体の89%が、エラーのない完全な配列であった。
【0180】
最後に、表7は、スポット1−10からのオリゴ核酸サンプルから得た配列に対するエラー特徴を要約する。
【0181】
【表7】
【0182】
実施例4:sgRNA設計
【0183】
5’末端の可変領域を有するキメラsgRNA配列を、Cas9タンパク質による直接の配列特異的な切断のために設計した。
図4Aを参照。sgRNA配列は、12の塩基の種子領域を含む特異的なDNA結合に関する20の塩基の塩基対合領域を有していた。塩基対合領域の5’末端は、転写開始部位となるように設計された。塩基対合領域に近接する3’は、長さが42の塩基であった、Cas9結合のためにdCas9処理された領域であった。dCas9処理された領域に近接する3’は、長さが40の塩基であった、化膿レンサ球菌終結領域であった。dCas9処理された領域及び終結領域はそれぞれ、U字型の構造をもたらす配列を含むように設計された。
【0184】
sgRNAも、鋳型(T)又は非鋳型(NT)DNA鎖を標的とするように設計された。
図5A−5Bを参照。鋳型DNA鎖を標的とするために設計されたsgRNAは、転写された配列と同じ配列同一性を持つsgRNAの塩基対合領域を含んでいた。非鋳型DNA鎖を標的とするために設計されたsgRNAは、転写された配列の逆補体であるsgRNAの塩基対合領域を含んでいた。
【0185】
追加の構成において、T7プロモーターは、可変塩基対合領域のすぐ上流に設計された。
図6A−
図6Bを参照。T7プロモーター領域を加えて、T7ポリメラーゼを有するsgRNAのインビトロの産生を可能にした。
【0186】
実施例5:sgRNAをコードするDNAの合成 − 設計及びポリメラーゼ分析
【0187】
DNAオリゴ核酸を、接合時にsgRNA配列をコードする断片として設計した。
図12を参照。sgRNAを、可変配列領域(1233)のすぐ上流でのT7プロモーターの封入のため設計した。DNAオリゴ核酸のデノボ合成に続いて、増幅反応を行い、重なる断片を接合且つ伸長させた。
【0188】
(1201)におけるDNAオリゴ核酸の転写は、DNA鋳型からのT7ポリメラーゼを有するsgRNAのインビトロの産生をもたらした。
【0189】
設計1(1220)、設計2(1222)、設計3(1224)、及び設計4(1226)の配列を、表8に示されるように設計した。設計1、設計2、設計3、及び設計4それぞれの配列は、T7プロモーター、可変配列部分、及び一定の配列領域(ハンドル及びターミネーター)を含む(表8)。具体的には、
図12に見られるような一定の配列領域は、塩基対領域(1211)、(1213)、(1215)、(1217)、(1223)、及び(1225)を含むCas9ハンドルヘアピン、及び、塩基対領域(1219)及び(1221)を含むターミネーターヘアピンを備えている。
【0190】
【表8】
【0191】
インビトロの分析に関しては、T7 RNAポリメラーゼ・プロモーター領域がT7 RNAポリメラーゼによる認識のための二本鎖であるべきであることに注目されたい。アンチセンスオリゴ核酸をハイブリダイゼーションのために使用した:5’−TAATACGACTCACTATAGG−3’(SEQ ID NO:18)。加えて、表9は、鋳型オリゴ核酸及び増幅オリゴ核酸の4つの異なるセットの分析のために使用されたプライマーのリストを提供する。
図12を参照する。
【0192】
【表9】
【0193】
鋳型オリゴ核酸及び増幅オリゴ核酸の4つの異なるセットは、完全長の鋳型の純度及び収量を最適化する様々な条件の下で分析された。10ulのPCR反応を、100fMolでの鋳型オリゴ核酸(SgR1−R1&SgR1−F1、SgR1−F2、SgR1−F3、SgR1−F4)、及び、600nMolのポリメラーゼ−1 PCR濃度での増幅プライマーの各セットにより実行した。Eppendorf Mastercycler上で勾配を使用して、3つのアニーリング温度(50℃、55℃、60℃)を、2つの高忠実度DNAポリメラーゼ(ポリメラーゼ1及び3)並びに標準的なDNAポリメラーゼ(ポリメラーゼ2)を使用して、25のサイクルのPCRにおいて評価した。表10は反応条件の概要を提供し、表11は増幅プロトコルを提供する。
【0194】
【表10】
【0195】
【表11】
【0196】
ポリメラーゼ−1のPCR反応からの結果を、収量を評価するためにBioAnalyzer(図示せず)上で実行し、表12において要約した。DNA収量をng/ulで表す(表12)。オリゴ核酸の設計3と4はそれぞれ、オリゴ核酸の設計1と2よりも高いDNA収量をもたらした。より高いアニーリング温度は同様に収量の増加をもたらし、60℃ではより高い収量であった。
【0197】
【表12】
【0198】
ポリメラーゼ−2のPCR反応からの結果を、収量を評価するためにBioAnalyzer(図示せず)上で実行し、表13において要約した。DNA収量をng/ulで表す(表13)。再度、オリゴ核酸の設計3と4はそれぞれ、オリゴ核酸の設計1と2よりも高いDNA収量をもたらした。より高いアニーリング温度は同様に収量の増加をもたらし、60℃ではより高い収量であった。
【0199】
【表13】
【0200】
ポリメラーゼ−3のPCR反応からの結果を、収量を評価するためにBioAnalyzer(図示せず)上で実行し、表14において要約した。DNA収量をng/ulで表す(表14)。オリゴ核酸の設計3と4はそれぞれ、オリゴ核酸の設計1と2よりも高いDNA収量をもたらした。より高いアニーリング温度は同様に収量の増加をもたらし、60℃ではより高い収量であった。
【0201】
【表14】
【0202】
要するに、オリゴ核酸の設計3と4は、3つのポリメラーゼ全てを含むDNA収量の増加をもたらした。加えて、60℃でのより高いアニーリング温度はDNA収量の増加をもたらした。
【0203】
実施例6:CRISPR sgRNAの合成 − 温度分析
【0204】
実施例5からのオリゴ核酸プライマーを使用して、アニーリング温度条件の増加の影響を、実施例5に記載されるようなPCR反応の実行後に分析した。増幅産物を、収量を評価するためにBioAnalyzer(図示せず)で実行し、表15において要約した。DNA収量をng/ulで表す(表15)。要するに、ポリメラーゼ3はDNA収量の増加をもたらし、60℃のアニーリング温度はDNA収量の増加をもたらした。
【0205】
【表15】
【0206】
実施例7:sgRNAの生成 − 構造の無いRNA
【0207】
2つのオリゴ核酸の集合体を設計し、T7プロモーター配列とターミネーターを用いるが、tracrRNAを用いることなく、修飾されたsgRNA鋳型(120bp)を生成した。表16を参照する。
【0208】
【表16】
【0209】
オリゴ核酸の集合体を、実施例5のsgRNAの増幅に使用される同じオリゴ核酸を用いて増幅した。使用される反応条件を表17に要約する。
【0210】
【表17】
【0211】
T7 RNAポリメラーゼでの転写は、二次構造を欠いた80bpのRNA産物をもたらすと推測された。増幅産物の転写をインビトロの転写キット(NEB HiScribe)により行った。反応混合物をBioAnalyzer上で分析した。
図13A−13Bを参照する。修飾されたsgRNA産物は、tracrRNAヘアピン含有配列を持つsgRNA(
図13A)よりも、構造の無い設計により清潔であった(
図13B)。
【0212】
実施例8:sgRNA配向Cas9切断
【0213】
3つのsgRNA配列をT7プロモーター領域で設計し、各々には720bpGFPコード配列の領域のための異なる認識配列が備わっていた。sgRNA配列の各々を2つのオリゴ核酸のPCRから組み立てた。sgRNAバックボーン及びプライマーを表18に提供する。
【0214】
【表18】
【0215】
オリゴ核酸集合体を、表19に要約された反応条件下で増幅した。
【0216】
【表19】
【0217】
各sgRNA集合体反応からのサンプルをBioAnalyzer上で分析した(
図14A−14C)。T7 RNAポリメラーゼPCR増幅産物を使用する転写反応を行った。各反応からのサンプルをBioAnalyzer上で分析した(
図14D−14F)。
【0218】
Cas9消化物を、GFP増幅産物、Cas9、及び転写されたsgRNAを使用して調製した。対照の単一のピークと比較して、2つのピークを3つ全ての消化物に観察した。(
図14G−14J)。3つの合成されたsgRNAを使用するCas9切断から予想され且つ結果として生じた断片を、表20に列挙する。
【0219】
【表20】
【0220】
Cas9消化サンプルを精製し、BioAnalyzer上で再び分析した(図示せず)。
精製されたサンプルからの結果を表21に要約する。
【0221】
【表21】
【0222】
実施例9:29,040の固有のオリゴ核酸の平行的な集合体
【0223】
平坦なシリコン上に各々12の遺伝子座を含む、256のクラスタ(1505)を含む構造を、
図15に示すように製造した。クラスタの拡大図を121の遺伝子座と共に(1510)で示す。256のクラスタのうち240からの遺伝子座は、別個の配列を持つオリゴ核酸の合成の付着と支持をもたらした。オリゴ核酸合成を、実施例3の一般法を使用するホスホロアミダイト化学物質によって実行した。256のクラスタのうち16からの遺伝子座は対照クラスタであった。合成された29,040の固有のオリゴ核酸の全体的な分布(1つのクラスタ当たり240の非対照クラスタ×121のオリゴ核酸集団)を
図16Aに示す。NGS配列決定は、合成のために選択される設計されたオリゴ核酸の100%の表示を確認した。
図16Bに示されるように、分布を各クラスタについて測定した。4つの代表的なクラスタにおいて合成された固有のオリゴ核酸の分布を、
図17に示す。全体的なレベルでは、合成のために設計された全てのオリゴ核酸が存在し、オリゴ核酸の99%が平均の2倍以内にある存在量を備えており、このことは合成の高い均一性を示している。この同じ観察はクラスタ当たりのレベル上で一貫していた。
【0224】
各オリゴ核酸のエラー率を、Illumina MiSeq遺伝子シーケンサーを使用して判定した。29,040の固有のオリゴ核酸に関するエラー率分布を
図18Aに示し、平均は500の塩基において約1であり、幾つかエラー率は800の塩基におけるものほど低いものであった。
図18Bに示されるように、分布を各クラスタについて測定した。4つの代表的なクラスタにおける固有のオリゴ核酸に関するエラー率分布を
図19に示す。29,040の固有のオリゴ核酸のライブラリを20時間未満で合成した。29,040の固有のオリゴ核酸の全てにわたるオリゴ核酸表示に対するGC割合の分析は、合成がGC含有量(1つのオリゴ核酸当たりおよそ20%〜85%)にもかかわらず一定であったことを示した(
図20)。
【0225】
実施例10:sgRNAをコードするデノボ合成されたDNAライブラリのPCR増幅分析
【0226】
20−80%の様々なGC含有量を含む無作為化された配列の長さ100の塩基を有する9,996のオリゴ核酸を設計し、実施例9に記載される同様の構成を持つ構造上で合成した。GCの表示に対するPCR増幅の効果を判定するために、オリゴ核酸集団を、高忠実度DNAポリメラーゼ(DNAポリメラーゼ1)を伴う6又は20のサイクルのために増幅した。代替的に、オリゴ核酸集団を、6、8、10、又は15のサイクルのために他の2つの高忠実度PCR酵素を使用して増幅し、ポリメラーゼ選択が増幅後の全体的な配列の表示に対し効果があったかどうかを判定した。PCR増幅の後、サンプルを次世代配列決定のために調製し、Illumina MiSeqプラットフォーム上で配列決定した。150の塩基対のSEリードを、100Xのおよそのリード適用範囲に生成した。生のFASTQファイルを分析した。6、10、又は15のサイクルのために何れかのポリメラーゼによるオリゴ核酸の表示を、
図21に図示する。配列決定リードにおける表現の頻度によって測定されたオリゴ核酸の均一性を、様々な条件について評価し、表22に要約した。
【0227】
【表22】
【0228】
増幅されたオリゴ核酸集団それぞれのドロップアウトの数を、
図22、即ち増幅サイクルvs平均閾値の10%より下の集団の分画に示されるように定量化した。ポリメラーゼ1のドロップアウトは早く成長した一方、ポリメラーゼ2のドロップアウトは比較的一定に留まった。
【0229】
GC分布に対する増幅の影響を、
図23において評価した。一般的に、30%から70%のGC含有量を有するオリゴ核酸は、傾向線であるY=Xに従い、より多くのサイクルにより頻度を増大させた。70%より大きいGC含有量を有するオリゴ核酸は一般的に、20のサイクルの後にわずかに多く頻繁であったが、30%未満のGC含有量を有するオリゴ核酸は一般的に、6つのサイクルの後にわずかに多く頻繁であった。
【0230】
実施例11:ヒトの後成的なCRISPRスクリーン
【0231】
sgRNAスクリーンを行い、CRISPR−Cas9を使用して機能ドメインをコードするエクソンへの突然変異を導入した。約10,000のDNAオリゴ核酸を、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。総じて、オリゴ核酸には約1:500以下の総合エラー率があった。各オリゴ核酸は長さ最大200の塩基であり、オリゴ核酸種1つ当たり少なくとも1fmoleが生成された。オリゴ核酸をPCR増幅し、ベクターへとクローン化し、sgRNA転写のために培養細胞へと電気穿孔した。核酸を細胞から単離し、次世代配列決定を使用して配列決定した。
【0232】
配列決定の結果は、sgRNAの最小のバイアス及び高忠実度産生と共に、非常に正確で均一なライブラリ合成を示した。下流のスクリーニングのために正確な配列を持つsgRNAの30%以上の最小の配列決定の回復を伴うガイド配列1つ当たりのより多くのリードが、競合プール(competitor pool)と比較される。表23を参照する。プールされた配列決定の結果は、競合プールに基づいたアレイを持つ6つの対数と比較して、ガイド配列当たりより多くのリード、及びリードのはるかにタイトな分布(4つの対数)を示した。
図24A−24Bを参照する。クローンの配列決定の検証は、100%のsgRNA回復(
図24A)、及び市販のアレイベースのプールに比べて高い配列の正確さ(
図24B)を示した。配列決定されたクローンのうち、著しく多くが正確なsgRNA配列により回復された。表23を参照する。予め決められた配列の100%がオリゴ核酸集団に表わされた。sgRNAクローンのNGSベースの検証は、100%のsgRNA回復、及び競合集団(図示せず)と比較して13%高い1つのクローン当たりの正確さを示した。
【0233】
【表23】
【0234】
実施例12:全体的なゲノムsgRNAライブラリ
【0235】
DNAライブラリを、101,000の異なるオリゴ核酸のためにクローンを生成するために、sgRNA(20200の遺伝子標的当たり5つのsgRNAs)をコードするDNAを含むように設計した。101,000のオリゴ核酸を、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。合成されたオリゴ核酸をPCR増幅し、消化し、レンチウイルスベクターへとクローン化し、細胞へと形質転換した。核酸を細胞から単離し、次世代配列決定を使用して配列決定した。代替的に、合成されたオリゴ核酸をPCR増幅して、アンプリコンベースのライブラリを形成し、配列決定した。
【0236】
回復されたsgRNAの数に対する次世代配列決定のプロットは、オリゴ核酸プールのサイズが増加すると、オリゴ核酸集団がライブラリ全体にわたりリードのより均一でタイトな分布を維持し、最小の尾部が市販のアレイベースの参照オリゴ核酸集団と比較されることを示した。
図25を参照。
【0237】
実施例13:標的化と活性が改善したsgRNAライブラリの設計
【0238】
sgRNAライブラリを設計し、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。
合成されたオリゴ核酸をPCR増幅し、消化し、ベクターへとクローン化し、スクリーニング及び分析を含む下流の適用のための使用のために細胞へと転移させた。
【0239】
NAG PAM、NGG PAM、高活性、低いオフターゲットで特徴されるライブラリを含む、異なるsgRNA設計のパラメータを比較し、フィルタ処理した。本明細書に記載される方法により設計されるsgRNAは、他の市販のgRNAシステムに比べて高い割合のsgRNAをもたらし、結果として、遺伝子発現の少なくとも2倍の枯渇、約16%のsgRNAをもたらす。
図26Aを参照。sgRNAはまた、他の市販のgRNAシステムに比べて低い割合のsgRNAをもたらし、結果として、遺伝子発現のゼロ又は負の枯渇、約17%をもたらす。
図26Bを参照。
【0240】
sgRNA媒介性の枯渇を、同様に実質的な遺伝子発現レベルについて評価し、そこでは以下の遺伝子をsgRNAにより標的化した:PCNA、PSMA7、RPP21、及びSF3B3。少なくとも2倍の枯渇を示したsgRNAの数を分析すると、sgRNAライブラリには、競合1、競合2、及び競合3と比較して高い割合の、実質的な遺伝子を枯渇するsgRNAがあった。表24を参照。
【0241】
【表24】
【0242】
実施例14:MS2に関するsgRNAライブラリ
【0243】
sgRNAをコードする非同一DNA配列を含むDNAライブラリを、C2c2タンパク質による配列特異的な切断のために設計した。ライブラリは、バクテリオファージMS2ゲノムのC2c2標的化のための全ての可能なスペーサー配列を含んでいた。レプトトリキア・シャヒイからのC2c2の成熟crRNAが28のヌクレオチドの最大のスペーサー長を含むため、バクテリオファージゲノムに全ての可能な28のヌクレオチド標的部位のタイリング(tiling)は結果として約3500のスペーサー配列のライブラリをもたらした。
【0244】
約3,500の非同一オリゴ核酸を、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。約3500の配列のライブラリをベクターへと挿入し、大腸菌に形質転換させた。大腸菌細胞を、MS2の3つの希釈を使用してMS2バクテリオファージで感染させた。その後、ライブラリを、MS2感染に対する大腸菌耐性を与えた配列についてスクリーニングした。
【0245】
多数のスペーサー配列は耐性を与えることが見出された。スペーサー表現(crRNA頻度)を比較すると、多くのスペーサー配列がMS2感染の3つの希釈において1.25を超える対数2倍の富化を示したが、非標的スペーサー配列は富化されないことが分かった。
【0246】
実施例15:ゼブラフィッシュに関するsgRNAライブラリ
【0247】
DNAライブラリを、約130,000のsgRNAをコードする配列により設計する。平均して、約5のsgRNA鋳型を各ゼブラフィッシュ遺伝子のために設計する。オリゴ核酸を、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。デノボ合成は、130,000のオリゴ核酸を賛成し、各々、シリコンプレートの表面上で異なる遺伝子座から伸長している。オリゴ核酸をプレートから取り除き、PCRによって増幅し、発現ベクターへとクローン化した。各鋳型を配列決定にさらす。sgRNAライブラリをゼブラフィッシュの胚へと注入する。ゼブラフィッシュを成体まで育てる。その後、精子を凍結保存し、生殖系列伝達された挿入と欠失を同定するために配列決定することによりスクリーニングする。生殖系列のスクリーンの後、競合の対立遺伝子に特異的なPCRによって精子の遺伝子型を同定する。
【0248】
実施例16:マウスのためのgRNAライブラリ
【0249】
DNAライブラリを、約100,000のsgRNAをコードする配列により設計する。平均して、約5のsgRNA鋳型を1つのマウス遺伝子ごとに設計する。オリゴ核酸を、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。sgRNA配列をコードするsgRNAライブラリをデノボ合成して、100,000のオリゴ核酸を生成する。デノボ合成は、100,000のオリゴ核酸を産生し、各々、シリコンプレートの表面上で異なる遺伝子座から伸長している。オリゴ核酸をプレートから取り除き、PCRによって増幅し、ベクターへとクローン化した。各鋳型を配列決定にさらす。sgRNAのオンターゲット効率を、監督者によるヌクレアーゼアッセイ又は配列決定によって検証する。その後、望ましい遺伝的バックグラウンドを持つマウスの接合子においてsgRNAを微量注入する。代替的に、sgRNA効率の検証の後、sgRNAをアデノ関連性ウイルス(AAV)などのウイルスベクターへとパッケージングする。その後、sgRNAを、望ましい位置にてマウスへと定位的に送達する。予め選択された標的遺伝子の発現レベルを、マウスから採取した組織において観察する。
【0250】
実施例17:受容体チロシンキナーゼのためのgRNAライブラリ
【0251】
DNAオリゴ核酸ライブラリを、表25に列挙される58のヒト受容体チロシンキナーゼのための遺伝子を標的とする5つのsgRNAをコードする配列で設計し、異なるDNAのオリゴ核酸は合計290であった。オリゴ核酸を、実施例3に記載されるものと同様の方法を使用して、実施例1に記載されるシリコンチップ上で、実施例9に記載される同様の構成を持つ構造で、デノボ合成した。オリゴ核酸をプレートから取り除き、PCRにより増幅し、ベクターへとクローン化し、細胞の予め選択された集団へと移入した。表25に列挙された予め選択された遺伝子の発現レベルは、キナーゼ特異的sgRNAの無い対照にさらされる細胞の対照集団に対する細胞の予め選択された集団において比較される。
【0252】
【表25-1】
【0253】
【表25-2】
【0254】
実施例18:ヒトキノームのためのgRNAライブラリ
【0255】
DNAオリゴ核酸ライブラリを、518のヒトキナーゼのための遺伝子を標的とする5つのsgRNAをコードする配列で設計し、異なるDNAのオリゴ核酸は合計2590であった。オリゴ核酸をプレートから取り除き、PCRにより増幅し、ベクターへとクローン化し、細胞の予め選択された集団へと移入した。予め選択された518の遺伝子の発現レベルは、キナーゼ特異的sgRNAの無い対照にさらされる細胞の対照集団に対する細胞の予め選択された集団において比較される。
【0256】
実施例19:ヒトホスファトームのためのgRNAライブラリ
【0257】
DNAオリゴ核酸ライブラリを、200のヒトホスファターゼのための遺伝子を標的とする5つのsgRNAをコードする配列で設計し、異なるDNAのオリゴ核酸は合計1000であった。オリゴ核酸をプレートから取り除き、PCRにより増幅し、ベクターへとクローン化し、細胞の予め選択された集団へと移入した。200の予め選択された遺伝子の発現レベルは、キナーゼ特異的sgRNAの無い対照にさらされる細胞の対照集団に対する細胞の予め選択された集団において比較される。
【0258】
本発明の好ましい実施形態が本明細書中で示され且つ記載されてきたが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。多数の変形、変更、及び置き換えは、本発明から逸脱することなく、当業者によって現在想到されるものである。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用されるかもしれないことを理解されたい。以下の特許請求の範囲は本発明の範囲を定義するものであり、この特許請求の範囲及びその同等物の範囲内の方法及び構造は、それにより包含されることが、意図されている。