(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024045294
(43)【公開日】2024-04-02
(54)【発明の名称】二段階相同組換え修復によるスカーレスゲノム編集
(51)【国際特許分類】
C12N 15/09 20060101AFI20240326BHJP
C12N 1/15 20060101ALI20240326BHJP
C12N 1/19 20060101ALI20240326BHJP
C12N 1/21 20060101ALI20240326BHJP
C12N 5/10 20060101ALI20240326BHJP
C12N 15/63 20060101ALI20240326BHJP
【FI】
C12N15/09 110
C12N1/15 ZNA
C12N1/19
C12N1/21
C12N5/10
C12N15/63 Z
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2024008447
(22)【出願日】2024-01-24
(62)【分割の表示】P 2020502409の分割
【原出願日】2018-07-18
(31)【優先権主張番号】62/533,780
(32)【優先日】2017-07-18
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TRITON
2.Blu-ray
(71)【出願人】
【識別番号】515158308
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】池田 和哉
(72)【発明者】
【氏名】ポルテウス マシュー エイチ.
(57)【要約】 (修正有)
【課題】スカーレスゲノム編集のための方法、特に、細胞を遺伝子改変し、望まれない配列を除去するための、相同組換え修復(HDR)段階を用いることによるスカーレスゲノム改変を提供する。
【解決手段】以下の工程を含む、細胞のゲノムDNAのスカーレス編集のための方法を提供する。(a)第1のCas9媒介相同組換え修復(HDR)段階を行う工程;(b)少なくとも1つの選択マーカーの陽性選択に基づいて、遺伝子改変細胞を単離する工程;(c)第2のCas9媒介相同組換え修復(HDR)段階を行う工程;ならびに(d)少なくとも1つの選択マーカーの陰性選択に基づいて、意図した編集を含む遺伝子改変細胞を単離する工程であって、該少なくとも1つの選択マーカーをコードする発現カセットが欠失している、工程。
【選択図】
図1A
【特許請求の範囲】
【請求項1】
以下の工程を含む、細胞のゲノムDNAのスカーレス編集のための方法:
(a)(i) 第1のドナーポリヌクレオチドの細胞中への導入であって、第1のドナーポリヌクレオチドが、細胞のゲノムDNAにおける改変されるべき標的配列に対する意図した編集を含む配列に隣接する第1の左ホモロジーアームおよび第1の右ホモロジーアームと、少なくとも1つの選択マーカーをコードする発現カセットとを含む、導入;および
(ii) 第1のガイドRNAおよびCas9の細胞中への導入であって、第1のガイドRNAが、Cas9が第1のガイドRNAと第1の複合体を形成するように、細胞のゲノムDNAにおける改変されるべきゲノム標的配列に対して相補的な配列を含み、該ガイドRNAが、第1の複合体をゲノム標的配列に方向づけ、Cas9が、細胞のゲノムDNAにおいて二本鎖切断を作製し、第1のドナーポリヌクレオチドが、Cas9媒介相同組換え修復(HDR)によってゲノムDNA中に組み込まれて、遺伝子改変細胞を生成する、導入
を含む、第1のCas9媒介相同組換え修復(HDR)段階を行う工程;
(b) 少なくとも1つの選択マーカーの陽性選択に基づいて、遺伝子改変細胞を単離する工程;
(c)(i) 第2のドナーポリヌクレオチドの遺伝子改変細胞中への導入であって、第2のドナーポリヌクレオチドが、少なくとも1つの選択マーカーをコードする発現カセットの欠失を含む以外はCas9媒介HDRによるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に対して相補的な配列に隣接する、第2の左ホモロジーアームおよび第2の右ホモロジーアームを含む、導入;
(ii) 第2のガイドRNAおよびCas9ヌクレアーゼの細胞中への導入であって、Cas9が、第2のガイドRNAと第2の複合体を形成し、該第2のガイドRNAが、第2の複合体を改変標的ゲノム配列に方向づけ、Cas9が、改変ゲノムDNAにおいて二本鎖切断を作製し、かつ第2のドナーポリヌクレオチドが、Cas9媒介HDRによってゲノムDNA中に組み込まれ、それにより、少なくとも1つの選択マーカーをコードする発現カセットをCas9媒介HDRによって改変ゲノムDNAから除去する、導入
を含む、第2のCas9媒介相同組換え修復(HDR)段階を行う工程;ならびに
(d) 少なくとも1つの選択マーカーの陰性選択に基づいて、意図した編集を含む遺伝子改変細胞を単離する工程であって、該少なくとも1つの選択マーカーをコードする発現カセットが欠失している、工程。
【請求項2】
前記意図した編集を含む配列が、少なくとも1つの選択マーカーをコードする発現カセット内またはその近くに位置づけられる、請求項1記載の方法。
【請求項3】
前記意図した編集が、細胞のゲノムDNAにおける遺伝子中に変異を導入する、請求項1記載の方法。
【請求項4】
前記変異が、挿入、欠失、および置換からなる群より選択される、請求項3記載の方法。
【請求項5】
前記意図した編集が、細胞のゲノムDNAにおける遺伝子から変異を除去する、請求項1記載の方法。
【請求項6】
前記意図した編集が、細胞のゲノムDNAにおける遺伝子の不活性化を結果としてもたらす、請求項1記載の方法。
【請求項7】
一方のアレルが、ゲノムDNAにおいて改変される、請求項1記載の方法。
【請求項8】
両方のアレルが、ゲノムDNAにおいて改変される、請求項1記載の方法。
【請求項9】
前記少なくとも1つの選択マーカーが、蛍光マーカーである、請求項1記載の方法。
【請求項10】
前記遺伝子改変細胞が、単一アレル編集を含むかまたは両アレル編集を含むかを決定するために、蛍光強度を測定する工程をさらに含む、請求項9記載の方法。
【請求項11】
前記細胞が、真核生物、原核生物、または古細菌生物由来である、請求項1記載の方法。
【請求項12】
前記細胞が哺乳動物である、請求項11記載の方法。
【請求項13】
前記細胞がヒトである、請求項12記載の方法。
【請求項14】
前記細胞が細胞株由来である、請求項1記載の方法。
【請求項15】
前記細胞が不死化細胞である、請求項1記載の方法。
【請求項16】
前記細胞ががん性である、請求項1記載の方法。
【請求項17】
前記細胞がインビトロまたはインビボである、請求項1記載の方法。
【請求項18】
前記細胞が、K562細胞、胚性幹細胞、および人工多能性幹細胞からなる群より選択される、請求項1記載の方法。
【請求項19】
前記少なくとも1つの選択マーカーが、細胞表面マーカー、薬物耐性遺伝子、レポーター遺伝子、および自殺遺伝子からなる群より選択される、請求項1記載の方法。
【請求項20】
前記細胞表面マーカーが、切断型CD8、NGFR、切断型CD19(tCD19)、CCR5、およびABO抗原からなる群より選択される、請求項19記載の方法。
【請求項21】
前記細胞表面マーカーが、細胞機能にとって不可欠ではない、請求項19記載の方法。
【請求項22】
第1のHDR段階から生成された遺伝子改変細胞が、選択マーカーに特異的に結合する結合物質を用いた陽性選択によって単離される、請求項19記載の方法。
【請求項23】
前記結合物質が、選択マーカーに特異的に結合する抗体、抗体模倣物、またはアプタマーを含む、請求項22記載の方法。
【請求項24】
前記抗体が、モノクローナル抗体、ポリクローナル抗体、キメラ抗体、ナノボディ、抗体の組換え断片、Fab断片、Fab'断片、F(ab')2断片、Fv断片、およびscFv断片からなる群より選択される、請求項23記載の方法。
【請求項25】
前記抗体が、抗tCD19抗体、抗CD8抗体、および抗NGFR抗体からなる群より選択される、請求項22記載の方法。
【請求項26】
前記結合物質が、固体支持体上に固定化される、請求項22記載の方法。
【請求項27】
前記固体支持体が、磁性ビーズ、非磁性ビーズ、スライド、ゲル、膜、またはマイクロタイタープレートウェルである、請求項26記載の方法。
【請求項28】
前記少なくとも1つの選択マーカーをコードする発現カセットが、UbCプロモーター、mCherryをコードするポリヌクレオチド、T2Aペプチドをコードするポリヌクレオチド、切断型CD19(tCD19)をコードするポリヌクレオチド、およびポリアデニル化配列を含む、請求項1記載の方法。
【請求項29】
第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、またはCas9のうちの1つまたは複数が、ベクターによって提供される、請求項1記載の方法。
【請求項30】
前記ベクターが、プラスミドまたはウイルスベクターである、請求項1記載の方法。
【請求項31】
第1のドナーポリヌクレオチド、第1のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、請求項29記載の方法。
【請求項32】
第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、請求項29記載の方法。
【請求項33】
第1のドナーポリヌクレオチドが、ランダムに組み込まれるかまたはエピソーム性である選択マーカーの発現を阻害する短鎖ヘアピン型RNA(shRNA)をコードする少なくとも1つの発現カセットをさらに含む、請求項1記載の方法。
【請求項34】
第1のドナーポリヌクレオチドが、shRNAをコードする発現カセットのペアを含み、該ペアの第1の発現カセットが、第1の左ホモロジーアームの5'に位置し、かつ該ペアの第2の発現カセットが、第1の右ホモロジーアームの3'に位置する、請求項33記載の方法。
【請求項35】
前記shRNAが、ゲノム中にランダムに組み込まれている選択マーカーを発現するクローンの選択を低減させる、請求項33記載の方法。
【請求項36】
前記二本鎖切断が、非遺伝子破壊性二本鎖切断である、請求項1記載の方法。
【請求項37】
前記二本鎖切断が、前記少なくとも1つの選択マーカーの発現に影響を及ぼさない、請求項1記載の方法。
【請求項38】
以下を含む、スカーレスゲノム編集システム:
(a) 細胞のゲノムDNAにおける改変されるべき標的配列に対する意図した編集を含む配列に隣接する第1の左ホモロジーアームおよび第1の右ホモロジーアームと、少なくとも1つの選択マーカーをコードする発現カセットとを含む、第1のドナーポリヌクレオチド;
(b) 少なくとも1つの選択マーカーをコードする発現カセットの欠失を含む以外は第1のドナーポリヌクレオチドの配列に対して相補的な配列に隣接する、第2の左ホモロジーアームおよび第2の右ホモロジーアームを含む、第2のドナーポリヌクレオチド;
(c) Cas9ヌクレアーゼ;
(d) Cas9ヌクレアーゼと複合体を形成し、該複合体を標的配列に方向づけることができる、第1のガイドRNA;ならびに
(e) Cas9ヌクレアーゼと複合体を形成し、該複合体を、Cas9媒介相同組換え修復(HDR)によるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に方向づけることができる、第2のガイドRNA。
【請求項39】
前記少なくとも1つの選択マーカーをコードする発現カセットが、SEQ ID NO:1の配列またはSEQ ID NO:1の配列に対して少なくとも95%の同一性を有する配列を含み、第1のドナーポリヌクレオチドを、少なくとも1つの選択マーカーの発現に適している条件下で、前記Cas9媒介HDRによって標的配列で細胞のゲノムDNA中に組み込むことができ、かつ、Cas9媒介HDRによって標的部位で細胞のゲノムDNA中に組み込まれた第1のドナーポリヌクレオチドを有する細胞を、発現カセットによってコードされる該少なくとも1つの選択マーカーの陽性選択により、特定することができる、請求項38記載のスカーレスゲノム編集システム。
【請求項40】
第2のドナーポリヌクレオチドが、SEQ ID NO:2の配列またはSEQ ID NO:2の配列に対して少なくとも95%の同一性を有する配列を含むポリヌクレオチドを含み、第2のドナーポリヌクレオチドを、少なくとも1つの選択マーカーをコードする発現カセットを除去するために、Cas9媒介HDRによって標的部位で細胞の改変ゲノムDNA中に組み込むことができる、請求項38記載のスカーレスゲノム編集システム。
【請求項41】
第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、またはCas9のうちの1つまたは複数が、ベクターによって提供される、請求項38記載のスカーレスゲノム編集システム。
【請求項42】
前記ベクターが、プラスミドまたはウイルスベクターである、請求項38記載のスカーレスゲノム編集システム。
【請求項43】
第1のドナーポリヌクレオチド、第1のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、請求項38記載のスカーレスゲノム編集システム。
【請求項44】
第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、請求項38記載のスカーレスゲノム編集システム。
【請求項45】
第1のドナーポリヌクレオチドが、ランダムに組み込まれるかまたはエピソーム性である選択マーカーの発現を阻害する短鎖ヘアピン型RNA(shRNA)をコードする少なくとも1つの発現カセットをさらに含む、請求項38記載のスカーレスゲノム編集システム。
【請求項46】
第1のドナーポリヌクレオチドが、shRNAをコードする発現カセットのペアを含み、該ペアの第1の発現カセットが、第1の左ホモロジーアームの5'に位置し、かつ該ペアの第2の発現カセットが、第1の右ホモロジーアームの3'に位置する、請求項38記載のスカーレスゲノム編集システム。
【請求項47】
請求項38記載のスカーレスゲノム編集システムを含む、宿主細胞。
【請求項48】
請求項38記載のスカーレスゲノム編集システム、およびゲノムDNAのスカーレス編集を行うための説明書を含む、キット。
【請求項49】
請求項47記載の宿主細胞を含む、キット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概して、ゲノム工学およびスカーレスゲノム編集の分野に属する。特に、本発明は、細胞を遺伝子改変して望まれない配列を除去するための、相同組換え修復(HDR)を利用したスカーレスゲノム編集の方法に関する。
【背景技術】
【0002】
背景
ゲノムにおける特異的部位にDNA二本鎖切断(DSB)を作製することによって、精密なゲノム編集が可能になってきている(Jasin Trends Genet. 12, 224-228 (1996)(非特許文献1))。DSBの作製は、プログラム可能なZnフィンガーヌクレアーゼ(ZFN)および転写活性化因子様エフェクターヌクレアーゼ(TALEN、Porteus Annu. Rev. Pharmacol. Toxicol. 56, 163-190 (2016)(非特許文献2))によって行われている。しかし、clustered regularly interspaced short palindromic repeats(CRISPR)/Cas9/ガイドRNAシステム(Cas9/gRNA)の出現により、前例のない使用の容易さ、効率、および特異性を有する標的化切断が可能になった。これらのヌクレアーゼシステムの各々は、非相同末端結合(NHEJ)、マイクロホモロジー媒介末端結合(MMEJ)、または相同組換え修復(HDR)経路のいずれかによって次いで修復され得る配列特異的二本鎖切断(DSB)を開始することによって、ゲノム編集を刺激する。修復のHDR経路は、2つの機構的に別個の戦略:Rad51依存性相同組換え経路(HR)を用いた古典的な遺伝子ターゲティングまたは一本鎖オリゴヌクレオチドを用いた一本鎖鋳型修復(SSTR)を介するものに分けることができる(Porteus Annu. Rev. Pharmacol. Toxicol. 56, 163-190 (2016)(非特許文献2);Richardson et al. "CRISPR-Cas9 genome editing in human cells works via the Fanconi Anemia pathway" (2017)(非特許文献3))。DSBがNHEJまたはMMEJのいずれかによって修復される場合、機能喪失型置換またはINDELが作製され得る。他方、相同ドナーが供給される場合、HDRは、単一ヌクレオチドから大きな遺伝子カセットまでの精密な挿入、欠失、または置換の導入を可能にする(Hsu et al. Cell 157, 1262-1278 (2014)(非特許文献4))。
【0003】
ヒト多能性幹細胞(hPSC)などの、編集に対して伝統的に不応性の細胞型においては、ゲノム編集された集団またはクローンを特定し、精製するために、選択マーカーが通常必要とされる。しかし、ゲノム中に選択マーカーを置き去ることは、領域の転写調節を干渉する場合があり、かつ通常、臨床トランスレーションに不適合であろう。選択可能マーカーを残さない方法が存在する(Gonzalez et al. Cell Stem Cell 15, 215-226 (2014)(非特許文献5);Mitzelfelt et al. Stem Cell Reports 0, 1-9 (2017)(非特許文献6))が、これらは、編集部位の近くの配列特異的ヌクレアーゼの持続的な活性に依拠し、これは、元の編集を破壊する潜在性を有する(Paquet et al. Nature 533, 1-18 (2016)(非特許文献7))。これを打ち消すように、以前の編集の方法は、編集されたアレルを持続的なヌクレアーゼ活性から保護するために、ホモロジードナー内にサイレント変異を導入する。しかしそれでも、このサイレント変異の導入が、いくつかの意図しない結果、例えば、スプライシング異常(Yadegari et al. Blood 128, 2144-2152 (2016)(非特許文献8))、mRNAもしくはタンパク質構造の変化(Duan et al. Human Molecular Genetics 12, 205-216 (2003)(非特許文献9);Kimchi-Sarfaty et al. Science 315, 525-8 (2007)(非特許文献10))、またはコドン使用頻度バイアスのための総タンパク質レベルの変化までももたらす可能性がある。したがって、理想的なゲノム編集法は、「スカーレス」であり、これは、HDR媒介ゲノム編集を生じる能力を依然として保持しながら、選択マーカーまたはサイレント変異の形態のいずれでも、編集プロセスの残遺物を残さないものである。
【0004】
いくつかのスカーレス編集法が報告されているが、それらのすべては、hPSCにおける効率および/または汎用性の点で限界を有する。スカーレス編集の難しさは、以下の難題に直面する:1) 高頻度の所望の編集を生じるために高活性のヌクレアーゼを有する必要、合わせて2) 非標的化アレル上でのINDELを阻止する必要;および3) HDR改変アレルが活性ヌクレアーゼによって再切断されること、およびしたがってまたINDELを蓄積することを阻止する必要。後者に対する解決法は、再切断を妨げる同義変化を導入することであるが、小さな変化に対する許容性を有するため、Cas9の再切断を阻止するには、少なくとも1つの変化および時にはそれよりも多い変化が必要であるために、これらの同義変化は小さな遺伝学的瘢痕に相当する(Fu et al. Nat. Biotechnol. 31, 822-826 (2013)(非特許文献11))。代替的なアプローチは、数百~数千のクローンをスクリーニングしてスカーレス両アレル編集を有するクローンを見出すことであるが、そのようなクローンが存在することを保証する構造化された方法はない。オンターゲット編集の頻度を単純に改善することは、スカーレス改変を有するクローンを特定する問題を解決せず、時には課題をより難しくすらさせ得る。
【0005】
以前に報告された方法の多くは、編集後にCas9/gRNA再切断が阻止されるように、gRNA標的とオーバーラップする標的編集に依拠する(上記のGonzalez et al.(非特許文献5);Yu et al. Cell Stem Cell 16, 142-147 (2015)(非特許文献12);Liu et al. One-Step Biallelic and Scarless Correction of a β-Thalassemia Mutation in Patient-Specific iPSCs without Drug Selection. Mol Ther Nucleic Acids. 6, 57-67 (2017)(非特許文献13);Steyer et al. Stem Cell Reports 10, 642-654 (2018)(非特許文献14))。しかし、これは、瘢痕を伴わずに編集され得る標的部位の範囲を限定する。Paquet et al (2016)は、CORRECTと命名された、ssODNおよびgRNA-Cas9を用いた二段階編集プロセスによって、この限界を解決しようとした(上記のPaquet et al.(非特許文献7))。彼らは、意図した編集に加えて再切断を妨げるための変異を導入し、次いで、第2ラウンドの編集によって望まれない変異を修復した。これは、切断部位から編集部位までの長さが短い場合に見事な解決法を提供したが、切断部位から標的編集部位までが20塩基対よりも大きい場合は、CORRECTは、極度に非効率的であるか、または全く効率的でなかった(0.0~0.3%)。最終的に、ssODNベースの方法はすべて、スカーレスの大きな挿入編集、例えばcDNAレポーターの導入の可能性を除外する、小さな編集を行うことに限定される(Yang et al. Nucleic Acids Res. 41, 9049-9061 (2013)(非特許文献15))。最終的に、CORRECT法は、正しいクローンを特定するために第1および第2の段階の両方で何百ものクローンの解析を必要とし得るため、煩雑なままである。選択可能マーカーを除去を伴わずに付加することは、解析される必要があるクローンの数を減少させることができるが、マーカーは、ゲノム中に明らかな瘢痕を残す。したがって、それがスカーレスシステムであるためには、組み込まれたマーカーが除去される必要がある。PiggyBacシステムは、PiggyBacトランスポゾンを用いて組み込まれたマーカーを除去し、トランスポゾン特異的逆方向末端反復配列の間のマーカーを切除して「TTAA」配列のみを残すように設計されており、TTAAが内在性標的の一部である限りはスカーレスである(Ye et al. Proc. Natl. Acad. Sci. 111, 9591-9596 (2014)(非特許文献16))。しかし、切断から標的までの短い距離を有するgRNAおよび隣り合うTTAA配列の両方が存在する部位の数は、限定されている。ごく最近、Kimおよび同僚は、組み込まれたマーカーの両方の末端にマイクロホモロジーが存在する場合は、MMEJベースの編集がそのマーカーのスカーレス除去を可能にすることを報告した(Kim et al. Nat. Commun. 9, (2018)(非特許文献17))。彼らの報告において、彼らは、プロセスの最中に同義変異を導入したため、真のスカーレス編集は実証しなかった。さらに、彼らは、ランダムな組み込み物を有するクローンを特定する頻度を減少させるために、多能性細胞において発現される遺伝子中にレポーターを組み込むシステムを用いた。この特性もまた、方法を適用することができる遺伝子標的の範囲を限定する。
【0006】
したがって、任意の位置でゲノムを改変すること、およびより大きなサイズの編集を可能にすることができる、スカーレス編集のより効率的なかつ柔軟な方法が、ゲノムを望ましいように設計することを可能にするために必要である。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】Jasin Trends Genet. 12, 224-228 (1996)
【非特許文献2】Porteus Annu. Rev. Pharmacol. Toxicol. 56, 163-190 (2016)
【非特許文献3】Richardson et al. "CRISPR-Cas9 genome editing in human cells works via the Fanconi Anemia pathway" (2017)
【非特許文献4】Hsu et al. Cell 157, 1262-1278 (2014)
【非特許文献5】Gonzalez et al. Cell Stem Cell 15, 215-226 (2014)
【非特許文献6】Mitzelfelt et al. Stem Cell Reports 0, 1-9 (2017)
【非特許文献7】Paquet et al. Nature 533, 1-18 (2016)
【非特許文献8】Yadegari et al. Blood 128, 2144-2152 (2016)
【非特許文献9】Duan et al. Human Molecular Genetics 12, 205-216 (2003)
【非特許文献10】Kimchi-Sarfaty et al. Science 315, 525-8 (2007)
【非特許文献11】Fu et al. Nat. Biotechnol. 31, 822-826 (2013)
【非特許文献12】Yu et al. Cell Stem Cell 16, 142-147 (2015)
【非特許文献13】Liu et al. One-Step Biallelic and Scarless Correction of a β-Thalassemia Mutation in Patient-Specific iPSCs without Drug Selection. Mol Ther Nucleic Acids. 6, 57-67 (2017)
【非特許文献14】Steyer et al. Stem Cell Reports 10, 642-654 (2018)
【非特許文献15】Yang et al. Nucleic Acids Res. 41, 9049-9061 (2013)
【非特許文献16】Ye et al. Proc. Natl. Acad. Sci. 111, 9591-9596 (2014)
【非特許文献17】Kim et al. Nat. Commun. 9, (2018)
【発明の概要】
【0008】
概要
本発明は、スカーレスゲノム編集のための方法に関する。特に、本方法は、細胞を遺伝子改変し、望まれない配列を除去するための、HDR段階を用いることによるスカーレスゲノム改変を提供する。本方法は、ゲノム中にサイレンス変異、選択マーカー配列、または他の付加的な望ましくない配列を残さずに、ゲノムにおける任意の位置に変異、欠失、または挿入を導入することを含むゲノム編集のために使用され得る。
【0009】
1つの局面において、本発明は、以下の工程を含む、細胞のゲノムDNAのスカーレス編集の方法を含む:(a) (i) 第1のドナーポリヌクレオチドの細胞中への導入であって、第1のドナーポリヌクレオチドが、細胞のゲノムDNAにおける改変されるべき標的配列に対する意図した編集を含む配列に隣接する第1の左ホモロジーアームおよび第1の右ホモロジーアームと、少なくとも1つの選択マーカーをコードする発現カセットとを含む、導入;および(ii) 第1のガイドRNAおよびCas9の細胞中への導入であって、第1のガイドRNAが、Cas9が第1のガイドRNAと第1の複合体を形成するように、細胞のゲノムDNAにおける改変されるべきゲノム標的配列に対して相補的な配列を含み、該ガイドRNAが、第1の複合体をゲノム標的配列に方向づけ、第1のドナーポリヌクレオチドが、Cas9媒介HDRによってゲノムDNA中に組み込まれて、遺伝子改変細胞を生成する、導入、を含む、第1のCas9媒介相同組換え修復(HDR)段階を行う工程;(b) 少なくとも1つの選択マーカーの陽性選択に基づいて、遺伝子改変細胞を単離する工程;(c) (i) 第2のドナーポリヌクレオチドの遺伝子改変細胞中への導入であって、該第2のドナーポリヌクレオチドが、少なくとも1つの選択マーカーをコードする発現カセットの欠失を含む以外はCas9媒介HDRによるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に対して相補的な配列に隣接する、第2の左ホモロジーアームおよび第2の右ホモロジーアームを含む、導入;(ii) 第2のガイドRNAおよびCas9ヌクレアーゼの細胞中への導入であって、Cas9が、第2のガイドRNAと第2の複合体を形成し、該第2のガイドRNAが、第2の複合体を改変標的ゲノム配列に方向づけ、Cas9が、改変ゲノムDNAにおいて二本鎖切断を作製し、かつ第2のドナーポリヌクレオチドが、Cas9媒介HDRによってゲノムDNA中に組み込まれ、それにより、少なくとも1つの選択マーカーをコードする発現カセットをCas9媒介HDRによって改変ゲノムDNAから除去する、導入、を含む、第2のCas9媒介相同組換え修復(HDR)段階を行う工程;ならびに、(d) 少なくとも1つの選択マーカーの陰性選択に基づいて、意図した編集を含む遺伝子改変細胞を単離する工程であって、該少なくとも1つの選択マーカーをコードする発現カセットが欠失している、工程。
【0010】
1つの態様において、意図した編集を含む配列は、選択マーカーをコードする発現カセット内またはその近くに位置づけられる。
【0011】
ある特定の態様において、意図した編集は、細胞のゲノムDNAにおける遺伝子中に変異、例えば挿入、欠失、または置換を導入する。他の態様において、意図した編集は、細胞のゲノムDNAにおける遺伝子から変異を除去する。別の態様において、意図した編集は、細胞のゲノムDNAにおける遺伝子の不活性化を結果としてもたらす。
【0012】
1つのアレルまたは2つのアレルのいずれかが、ゲノムDNAにおいて改変されてもよい。ある特定の態様において、少なくとも1つの選択マーカーは、蛍光マーカーであり、遺伝子改変細胞が単一アレル編集を含むかまたは両アレル編集を含むかを決定するために、蛍光強度を測定することができる。
【0013】
ある特定の態様において、二本鎖切断は、非遺伝子破壊性二本鎖切断である。ある特定の態様において、二本鎖切断は、前記少なくとも1つの選択マーカーの発現に影響を及ぼさない。
【0014】
ある特定の態様において、第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、およびCas9のうちの1つまたは複数は、ベクター、例えばプラスミドまたはウイルスベクターによって提供される。別の態様において、第1のガイドRNAおよびCas9は、単一のベクターまたは複数のベクターによって提供される。別の態様において、第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9は、単一のベクターまたは複数のベクターによって提供される。
【0015】
ある特定の態様において、遺伝子改変される細胞は、真核生物、原核生物、または古細菌生物由来である。本明細書に記載されるようなスカーレスゲノム編集は、インビトロまたはインビボで、細胞に対して行われてもよい。細胞は、脊椎動物または無脊椎動物を含む、任意のタイプの動物由来であってもよい。例えば、細胞は、哺乳動物、例えばヒトもしくは非ヒト哺乳動物(例えば、非ヒト霊長類、実験動物、家畜)、または飼いならされた鳥、野生の鳥、もしくは猟鳥から取得されてもよい。別の態様において、細胞は細胞株由来である。細胞は、不死化細胞またはがん性であってもよい。別の態様において、細胞は、K562細胞、胚性幹細胞、および人工多能性幹細胞からなる群より選択される。
【0016】
ある特定の態様において、少なくとも1つの選択マーカーは、細胞表面マーカー、薬物耐性遺伝子、レポーター遺伝子、および自殺遺伝子からなる群より選択される。別の態様において、細胞表面マーカーは、切断型CD8、NGFR、切断型CD19(tCD19)、CCR5、およびABO抗原からなる群より選択される。
【0017】
第1のHDR段階から生成された遺伝子改変細胞は、選択マーカーに特異的に結合する結合物質を用いた陽性選択によって単離されてもよい。ある特定の態様において、結合物質は、選択マーカーに特異的に結合する抗体、抗体模倣物、またはアプタマーを含む。
【0018】
別の態様において、結合物質は、モノクローナル抗体、ポリクローナル抗体、キメラ抗体、ナノボディ、抗体の組換え断片、Fab断片、Fab'断片、F(ab')2断片、Fv断片、およびscFv断片からなる群より選択される抗体を含む。
【0019】
例えば、表面マーカーを発現するように遺伝子改変された細胞は、その表面マーカーに特異的に結合する結合物質(例えば、tCD19表面マーカーを保有する細胞を単離するための抗tCD19抗体、CD8表面マーカーを保有する細胞を単離するための抗CD8抗体、またはNGFR表面マーカーを保有する細胞を単離するための抗NGFR抗体)を用いて単離されてもよい。
【0020】
ある特定の態様において、結合物質は、固体支持体上に固定化される。例示的な固体支持体には、磁性ビーズ、非磁性ビーズ、スライド、ゲル(例えば、アガロースまたはアクリルアミド)、ナイロン、膜、ガラスプレート、マイクロタイタープレートウェル、または金属、ガラス、もしくはプラスチックの表面が含まれる。
【0021】
蛍光活性化細胞選別(FACS)、磁気活性化細胞選別(MACS)、水簸、免疫精製、または親和性クロマトグラフィーを含むがそれらに限定されない任意の細胞分離技法が、遺伝子改変細胞を単離するために用いられてもよい。
【0022】
別の態様において、少なくとも1つの選択マーカーをコードする発現カセットは、UbCプロモーター、mCherryをコードするポリヌクレオチド、T2Aペプチドをコードするポリヌクレオチド、切断型CD19(tCD19)をコードするポリヌクレオチド、およびポリアデニル化配列を含む。
【0023】
ある特定の態様において、第1のドナーポリヌクレオチドは、ランダムに組み込まれるかまたはエピソーム性である選択マーカーの発現を阻害する短鎖ヘアピン型RNA(shRNA)をコードする少なくとも1つの発現カセットをさらに含む。例えば、第1のドナーポリヌクレオチドは、短鎖ヘアピン型RNA(shRNA)をコードする発現カセットのペアを含んでもよく、該ペアの第1の発現カセットは、第1の左ホモロジーアームの5'に位置し、かつ該ペアの第2の発現カセットは、第1の右ホモロジーアームの3'に位置する。shRNAの発現は、ゲノム中にランダムに組み込まれている選択マーカーを発現するクローンの選択を低減させる。
【0024】
別の局面において、本発明は、以下を含むスカーレスゲノム編集システムを含む:(a) 細胞のゲノムDNAにおける改変されるべき標的配列に対する意図した編集を含む配列に隣接する第1の左ホモロジーアームおよび第1の右ホモロジーアームと、少なくとも1つの選択マーカーをコードする発現カセットとを含む、第1のドナーポリヌクレオチド;(b) 少なくとも1つの選択マーカーをコードする発現カセットの欠失を含む以外は第1のドナーポリヌクレオチドの配列に対して相補的な配列に隣接する、第2の左ホモロジーアームおよび第2の右ホモロジーアームを含む、第2のドナーポリヌクレオチド;(c) Cas9ヌクレアーゼ;(d) Cas9ヌクレアーゼと複合体を形成し、該複合体を標的配列に方向づけることができる、第1のガイドRNA;ならびに(e) Cas9ヌクレアーゼと複合体を形成し、該複合体を、Cas9媒介相同組換え修復(HDR)によるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に方向づけることができる、第2のガイドRNA。
【0025】
別の態様において、第1のドナーポリヌクレオチドは、少なくとも1つの選択マーカーをコードする発現カセットを含み、該発現カセットは、SEQ ID NO:1の配列、またはそれに対して少なくとも約80~100%の配列同一性を、これらの範囲内の任意のパーセント同一性、例えば、それに対して81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%の配列同一性を含めて示す配列を含み、第1のドナーポリヌクレオチドを、少なくとも1つの選択マーカーの発現に適している条件下で、Cas9媒介HDRによって標的部位で細胞のゲノムDNA中に組み込むことができ、かつ、Cas9媒介HDRによって標的部位で細胞のゲノムDNA中に組み込まれた第1のドナーポリヌクレオチドを有する細胞を、発現カセットによってコードされる少なくとも1つの選択マーカーの陽性選択により、特定することができる。
【0026】
ある特定の態様において、スカーレスゲノム編集システムにおける第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、およびCas9のうちの1つまたは複数は、ベクター、例えばプラスミドまたはウイルスベクターによって提供される。別の態様において、第1のガイドRNAおよびCas9は、単一のベクターまたは複数のベクターによって提供される。別の態様において、第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9は、単一のベクターまたは複数のベクターによって提供される。
【0027】
別の局面において、本発明は、本明細書に記載されるスカーレスゲノム編集システムを含む宿主細胞を含む。
【0028】
別の局面において、本発明は、本明細書に記載されるスカーレスゲノム編集システムを含むキットを含む。そのようなキットは、第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、およびCas9ヌクレアーゼを含んでもよい。キットは、ゲノムDNAのスカーレス編集を行うための説明書をさらに含んでもよい。
【0029】
ある特定の態様において、キットにおける第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、およびCas9は、ベクター、例えばプラスミドまたはウイルスベクターによって提供される。別の態様において、第1のガイドRNAおよびCas9は、単一のベクターまたは複数のベクターによって提供される。別の態様において、第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9は、単一のベクターまたは複数のベクターによって提供される。
【0030】
1つの態様において、第1のドナーポリヌクレオチドは、SEQ ID NO:1の配列、またはそれに対して少なくとも約80~100%の配列同一性を、この範囲内の任意のパーセント同一性、例えば、それに対して81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%の配列同一性を含めて示す配列を含む、選択マーカー発現カセットを含み、Cas9媒介HDRによって標的部位で細胞のゲノムDNA中に組み込まれた第1のドナーポリヌクレオチドを有する細胞を、発現カセットによってコードされる選択マーカーの陽性選択により、特定することができる。
【0031】
本発明のこれらのおよび他の態様は、本明細書における開示を考慮して、当業者に容易に見出されるであろう。
[本発明1001]
以下の工程を含む、細胞のゲノムDNAのスカーレス編集のための方法:
(a)(i) 第1のドナーポリヌクレオチドの細胞中への導入であって、第1のドナーポリヌクレオチドが、細胞のゲノムDNAにおける改変されるべき標的配列に対する意図した編集を含む配列に隣接する第1の左ホモロジーアームおよび第1の右ホモロジーアームと、少なくとも1つの選択マーカーをコードする発現カセットとを含む、導入;および
(ii) 第1のガイドRNAおよびCas9の細胞中への導入であって、第1のガイドRNAが、Cas9が第1のガイドRNAと第1の複合体を形成するように、細胞のゲノムDNAにおける改変されるべきゲノム標的配列に対して相補的な配列を含み、該ガイドRNAが、第1の複合体をゲノム標的配列に方向づけ、Cas9が、細胞のゲノムDNAにおいて二本鎖切断を作製し、第1のドナーポリヌクレオチドが、Cas9媒介相同組換え修復(HDR)によってゲノムDNA中に組み込まれて、遺伝子改変細胞を生成する、導入
を含む、第1のCas9媒介相同組換え修復(HDR)段階を行う工程;
(b) 少なくとも1つの選択マーカーの陽性選択に基づいて、遺伝子改変細胞を単離する工程;
(c)(i) 第2のドナーポリヌクレオチドの遺伝子改変細胞中への導入であって、第2のドナーポリヌクレオチドが、少なくとも1つの選択マーカーをコードする発現カセットの欠失を含む以外はCas9媒介HDRによるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に対して相補的な配列に隣接する、第2の左ホモロジーアームおよび第2の右ホモロジーアームを含む、導入;
(ii) 第2のガイドRNAおよびCas9ヌクレアーゼの細胞中への導入であって、Cas9が、第2のガイドRNAと第2の複合体を形成し、該第2のガイドRNAが、第2の複合体を改変標的ゲノム配列に方向づけ、Cas9が、改変ゲノムDNAにおいて二本鎖切断を作製し、かつ第2のドナーポリヌクレオチドが、Cas9媒介HDRによってゲノムDNA中に組み込まれ、それにより、少なくとも1つの選択マーカーをコードする発現カセットをCas9媒介HDRによって改変ゲノムDNAから除去する、導入
を含む、第2のCas9媒介相同組換え修復(HDR)段階を行う工程;ならびに
(d) 少なくとも1つの選択マーカーの陰性選択に基づいて、意図した編集を含む遺伝子改変細胞を単離する工程であって、該少なくとも1つの選択マーカーをコードする発現カセットが欠失している、工程。
[本発明1002]
前記意図した編集を含む配列が、少なくとも1つの選択マーカーをコードする発現カセット内またはその近くに位置づけられる、本発明1001の方法。
[本発明1003]
前記意図した編集が、細胞のゲノムDNAにおける遺伝子中に変異を導入する、本発明1001の方法。
[本発明1004]
前記変異が、挿入、欠失、および置換からなる群より選択される、本発明1003の方法。
[本発明1005]
前記意図した編集が、細胞のゲノムDNAにおける遺伝子から変異を除去する、本発明1001の方法。
[本発明1006]
前記意図した編集が、細胞のゲノムDNAにおける遺伝子の不活性化を結果としてもたらす、本発明1001の方法。
[本発明1007]
一方のアレルが、ゲノムDNAにおいて改変される、本発明1001の方法。
[本発明1008]
両方のアレルが、ゲノムDNAにおいて改変される、本発明1001の方法。
[本発明1009]
前記少なくとも1つの選択マーカーが、蛍光マーカーである、本発明1001の方法。
[本発明1010]
前記遺伝子改変細胞が、単一アレル編集を含むかまたは両アレル編集を含むかを決定するために、蛍光強度を測定する工程をさらに含む、本発明1009の方法。
[本発明1011]
前記細胞が、真核生物、原核生物、または古細菌生物由来である、本発明1001の方法。
[本発明1012]
前記細胞が哺乳動物である、本発明1011の方法。
[本発明1013]
前記細胞がヒトである、本発明1012の方法。
[本発明1014]
前記細胞が細胞株由来である、本発明1001の方法。
[本発明1015]
前記細胞が不死化細胞である、本発明1001の方法。
[本発明1016]
前記細胞ががん性である、本発明1001の方法。
[本発明1017]
前記細胞がインビトロまたはインビボである、本発明1001の方法。
[本発明1018]
前記細胞が、K562細胞、胚性幹細胞、および人工多能性幹細胞からなる群より選択される、本発明1001の方法。
[本発明1019]
前記少なくとも1つの選択マーカーが、細胞表面マーカー、薬物耐性遺伝子、レポーター遺伝子、および自殺遺伝子からなる群より選択される、本発明1001の方法。
[本発明1020]
前記細胞表面マーカーが、切断型CD8、NGFR、切断型CD19(tCD19)、CCR5、およびABO抗原からなる群より選択される、本発明1019の方法。
[本発明1021]
前記細胞表面マーカーが、細胞機能にとって不可欠ではない、本発明1019の方法。
[本発明1022]
第1のHDR段階から生成された遺伝子改変細胞が、選択マーカーに特異的に結合する結合物質を用いた陽性選択によって単離される、本発明1019の方法。
[本発明1023]
前記結合物質が、選択マーカーに特異的に結合する抗体、抗体模倣物、またはアプタマーを含む、本発明1022の方法。
[本発明1024]
前記抗体が、モノクローナル抗体、ポリクローナル抗体、キメラ抗体、ナノボディ、抗体の組換え断片、Fab断片、Fab'断片、F(ab')2断片、Fv断片、およびscFv断片からなる群より選択される、本発明1023の方法。
[本発明1025]
前記抗体が、抗tCD19抗体、抗CD8抗体、および抗NGFR抗体からなる群より選択される、本発明1022の方法。
[本発明1026]
前記結合物質が、固体支持体上に固定化される、本発明1022の方法。
[本発明1027]
前記固体支持体が、磁性ビーズ、非磁性ビーズ、スライド、ゲル、膜、またはマイクロタイタープレートウェルである、本発明1026の方法。
[本発明1028]
前記少なくとも1つの選択マーカーをコードする発現カセットが、UbCプロモーター、mCherryをコードするポリヌクレオチド、T2Aペプチドをコードするポリヌクレオチド、切断型CD19(tCD19)をコードするポリヌクレオチド、およびポリアデニル化配列を含む、本発明1001の方法。
[本発明1029]
第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、またはCas9のうちの1つまたは複数が、ベクターによって提供される、本発明1001の方法。
[本発明1030]
前記ベクターが、プラスミドまたはウイルスベクターである、本発明1001の方法。
[本発明1031]
第1のドナーポリヌクレオチド、第1のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、本発明1029の方法。
[本発明1032]
第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、本発明1029の方法。
[本発明1033]
第1のドナーポリヌクレオチドが、ランダムに組み込まれるかまたはエピソーム性である選択マーカーの発現を阻害する短鎖ヘアピン型RNA(shRNA)をコードする少なくとも1つの発現カセットをさらに含む、本発明1001の方法。
[本発明1034]
第1のドナーポリヌクレオチドが、shRNAをコードする発現カセットのペアを含み、該ペアの第1の発現カセットが、第1の左ホモロジーアームの5'に位置し、かつ該ペアの第2の発現カセットが、第1の右ホモロジーアームの3'に位置する、本発明1033の方法。
[本発明1035]
前記shRNAが、ゲノム中にランダムに組み込まれている選択マーカーを発現するクローンの選択を低減させる、本発明1033の方法。
[本発明1036]
前記二本鎖切断が、非遺伝子破壊性二本鎖切断である、本発明1001の方法。
[本発明1037]
前記二本鎖切断が、前記少なくとも1つの選択マーカーの発現に影響を及ぼさない、本発明1001の方法。
[本発明1038]
以下を含む、スカーレスゲノム編集システム:
(a) 細胞のゲノムDNAにおける改変されるべき標的配列に対する意図した編集を含む配列に隣接する第1の左ホモロジーアームおよび第1の右ホモロジーアームと、少なくとも1つの選択マーカーをコードする発現カセットとを含む、第1のドナーポリヌクレオチド;
(b) 少なくとも1つの選択マーカーをコードする発現カセットの欠失を含む以外は第1のドナーポリヌクレオチドの配列に対して相補的な配列に隣接する、第2の左ホモロジーアームおよび第2の右ホモロジーアームを含む、第2のドナーポリヌクレオチド;
(c) Cas9ヌクレアーゼ;
(d) Cas9ヌクレアーゼと複合体を形成し、該複合体を標的配列に方向づけることができる、第1のガイドRNA;ならびに
(e) Cas9ヌクレアーゼと複合体を形成し、該複合体を、Cas9媒介相同組換え修復(HDR)によるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に方向づけることができる、第2のガイドRNA。
[本発明1039]
前記少なくとも1つの選択マーカーをコードする発現カセットが、SEQ ID NO:1の配列またはSEQ ID NO:1の配列に対して少なくとも95%の同一性を有する配列を含み、第1のドナーポリヌクレオチドを、少なくとも1つの選択マーカーの発現に適している条件下で、前記Cas9媒介HDRによって標的配列で細胞のゲノムDNA中に組み込むことができ、かつ、Cas9媒介HDRによって標的部位で細胞のゲノムDNA中に組み込まれた第1のドナーポリヌクレオチドを有する細胞を、発現カセットによってコードされる該少なくとも1つの選択マーカーの陽性選択により、特定することができる、本発明1038のスカーレスゲノム編集システム。
[本発明1040]
第2のドナーポリヌクレオチドが、SEQ ID NO:2の配列またはSEQ ID NO:2の配列に対して少なくとも95%の同一性を有する配列を含むポリヌクレオチドを含み、第2のドナーポリヌクレオチドを、少なくとも1つの選択マーカーをコードする発現カセットを除去するために、Cas9媒介HDRによって標的部位で細胞の改変ゲノムDNA中に組み込むことができる、本発明1038のスカーレスゲノム編集システム。
[本発明1041]
第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、またはCas9のうちの1つまたは複数が、ベクターによって提供される、本発明1038のスカーレスゲノム編集システム。
[本発明1042]
前記ベクターが、プラスミドまたはウイルスベクターである、本発明1038のスカーレスゲノム編集システム。
[本発明1043]
第1のドナーポリヌクレオチド、第1のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、本発明1038のスカーレスゲノム編集システム。
[本発明1044]
第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9が、単一のベクターまたは複数のベクターによって提供される、本発明1038のスカーレスゲノム編集システム。
[本発明1045]
第1のドナーポリヌクレオチドが、ランダムに組み込まれるかまたはエピソーム性である選択マーカーの発現を阻害する短鎖ヘアピン型RNA(shRNA)をコードする少なくとも1つの発現カセットをさらに含む、本発明1038のスカーレスゲノム編集システム。
[本発明1046]
第1のドナーポリヌクレオチドが、shRNAをコードする発現カセットのペアを含み、該ペアの第1の発現カセットが、第1の左ホモロジーアームの5'に位置し、かつ該ペアの第2の発現カセットが、第1の右ホモロジーアームの3'に位置する、本発明1038のスカーレスゲノム編集システム。
[本発明1047]
本発明1038のスカーレスゲノム編集システムを含む、宿主細胞。
[本発明1048]
本発明1038のスカーレスゲノム編集システム、およびゲノムDNAのスカーレス編集を行うための説明書を含む、キット。
[本発明1049]
本発明1047の宿主細胞を含む、キット。
【図面の簡単な説明】
【0032】
【
図1A】スカーレス編集の概略を示す。
図1Aは、二段階HRによるスカーレス編集手順のワークフローを示す。
【
図1B】スカーレス編集の概略を示す。
図1Bは、二段階HRのためのドナーDNA構築物およびガイドRNAを示す。TBX1編集の場合には、意図した変異は、TBX1 cDNAコード部位の928塩基対(bp)でのGからAへの置換である(TBX1 c.928G>A)。矢印は、遺伝子型判定のためのプライマーの設計を示す。
【
図1C】スカーレス編集の概略を示す。
図1Cは、編集の時間表を示す。総推定時間は、細胞の成長速度に応じて1.5~2ヶ月である。
【
図2A】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Aは、一過性発現(2日目)および安定発現(6日目)のフローサイトメトリー解析を示す。
【
図2B】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Bは、tCD19発現に基づくFACSによる、磁気活性化細胞分離(MACS)による陽性選択の前後の解析を示す。CD19陽性細胞は、2.1%から67.8%に濃縮された。
【
図2C】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Cは、MACS陽性選択後の単一細胞コロニーの蛍光顕微鏡観察を示す。明るいコロニー(黄色の矢頭)と薄暗いコロニー(白色の矢頭)があった。スケールバーは、200μmを示す。
【
図2D】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Dは、
図1Bに示されるプライマーを用いた、MACS陽性選択後の単一細胞クローンの遺伝子型判定を示す。
【
図2E】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Eは、droplet digital PCRによって評定したUbCプロモーターのコピー数解析を示す。データを、3回の反復測定に由来する平均±SDとして示す。
【
図2F】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Fは、第2のHRおよびMACS陰性選択の前後のクローン2番および13番のCD19陽性細胞集団を示す。CD19陰性細胞は、2番において0.097%から99.5%に、および13番において0.044%から94.7%に濃縮された。
【
図2G】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Gは、シークエンシングによって決定した単一細胞クローンの遺伝子型を示す。
【
図2H】2段階HRによるヒトES細胞におけるスカーレス1塩基置換を示す。
図2Hは、単一アレル性および両アレル性に編集されたクローンの代表的な配列データを示す(TBX1参照配列(SEQ ID NO:32)およびc.928G>A変異体(SEQ ID NO:33))。
【
図3A】2段階編集によるヒトiPSCにおけるRUNX1終止コドンの5'側でのスカーレスレポーター遺伝子組み込みを示す。
図3Aは、RUNX1編集のためのドナーDNAおよびガイドRNAの模式的設計を示す。矢印は、遺伝子型判定のためのプライマーを示す。各遺伝子型由来のPCRアンプリコンのサイズを、右の表に示す。
【
図3B】2段階編集によるヒトiPSCにおけるRUNX1終止コドンの5'側でのスカーレスレポーター遺伝子組み込みを示す。
図3Bは、MACS陽性選択および単一細胞クローニングが後に続く、第1の編集後の明るいクローンのPCRによる遺伝子型判定を示す。クローン2番を、その後の手順に用いた。
【
図3C】2段階編集によるヒトiPSCにおけるRUNX1終止コドンの5'側でのスカーレスレポーター遺伝子組み込みを示す。
図3Cは、MACS陰性選択および単一細胞クローニングが後に続く、第2の編集後のクローンのPCRによる遺伝子型判定を示す。
【
図3D】2段階編集によるヒトiPSCにおけるRUNX1終止コドンの5'側でのスカーレスレポーター遺伝子組み込みを示す。
図3Dは、RUNX1-mOrange iPSC嚢の代表的な画像を示す。分化の誘導の13日後に、細胞を観察した。スケールバー=100μm。
【
図3E】2段階編集によるヒトiPSCにおけるRUNX1終止コドンの5'側でのスカーレスレポーター遺伝子組み込みを示す。
図3Eは、分化の誘導の14日後の、細胞の代表的なフローサイトメトリープロファイルを示す。CD34陽性、CD45中間の二重陽性細胞である集団Aは、すべての集団の中で最高強度のmOrangeを発現する。
【
図4A】
図4A~4Dは、ES H9系統における、shRNA(shGFP)発現カセットを伴うドナーベクターを用いた、B2M遺伝子の終止コドンの直前での両アレルスカーレスHLA-A
*24 cDNA(1.1 kb)組み込みを示す。ドナーDNA設計およびPCRによる遺伝子型判定の模式図。
図4Aは、shGFP発現カセットを伴わない第1の編集を示す。
【
図4B】ES H9系統における、shRNA(shGFP)発現カセットを伴うドナーベクターを用いた、B2M遺伝子の終止コドンの直前での両アレルスカーレスHLA-A
*24 cDNA(1.1 kb)組み込みを示す。ドナーDNA設計およびPCRによる遺伝子型判定の模式図。
図4Bは、shGFP発現カセットを伴う第1の編集を示す。示したすべてのクローンは、明るいGFP蛍光を発現していた。
【
図4C】ES H9系統における、shRNA(shGFP)発現カセットを伴うドナーベクターを用いた、B2M遺伝子の終止コドンの直前での両アレルスカーレスHLA-A
*24 cDNA(1.1 kb)組み込みを示す。ドナーDNA設計およびPCRによる遺伝子型判定の模式図。
図4Cは、クローン7番を用いた第2の編集を示す。
【
図4D】ES H9系統における、shRNA(shGFP)発現カセットを伴うドナーベクターを用いた、B2M遺伝子の終止コドンの直前での両アレルスカーレスHLA-A
*24 cDNA(1.1 kb)組み込みを示す。ドナーDNA設計およびPCRによる遺伝子型判定の模式図。
図4Dは、細胞の代表的なフローサイトメトリープロファイルを示す。ES H9系統のクラスI HLA型は、(A
*02、A
*03、B
*35、B
*44、C2
*04、およびCw
*07)である。iAM9系統は、天然のHLA-A
*24発現の陽性対照として用いられる、HLA-A
*24を有するhiPSCである。細胞を、FCM解析の前に3日間、50 ng/mLのINFγで処理した。
【
図5A】gRNA-Cas9システムでのMMEJ補助スカーレス編集(KIMet al, Nature Commun.)の実際の使用の検討を示す。
図5Aは、標準とMMEJ補助スカーレス戦略との間の、マーカーの組み込みによるgRNA-Cas9再切断の妨害における差を示す。標準的なマーカーの組み込みにおいて、マーカーがgRNA標的配列で組み込まれる場合は、編集されたゲノムが、もはやgRNA-Cas9によって切断されない。他方、マーカーが、選択マーカーの両端にマイクロホモロジー配列を伴って組み込まれる場合は、マイクロホモロジーが十分に短いかまたは変異が導入されない限り、gRNA標的は保持されるであろう。
【
図5B】gRNA-Cas9システムでのMMEJ補助スカーレス編集(KIMet al, Nature Commun.)の実際の使用の検討を示す。
図5Bは、gRNA標的が意図した編集とオーバーラップしない場合の、マイクロホモロジーの可能な設計を示す。Cas9は多くの場合、2 ntの5'ミスマッチ(PAMから遠い側)に対して許容性であり、したがって、19 ntのマイクロホモロジーは、再切断を回避するための長さの実際的な上限である。Kimらは、19 ntのホモロジーを有するMMEJベースの正確な切除のアレル頻度が、32 ntのホモロジーを有するものの約3分の1であったことを実証し、これは、19 ntのホモロジーにおける両アレルの正確な切除の理論的頻度が、32 ntにおけるものよりも約10倍低いことを意味する。32 ntのホモロジーを用いた正確な両アレル切除の頻度が10%であったと仮定すると、19 ntのホモロジーを用いたものは約1%であろう。
【
図5C】gRNA-Cas9システムでのMMEJ補助スカーレス編集(KIMet al, Nature Commun.)の実際の使用の検討を示す。
図5Cは、gRNA標的が意図した編集(「Z」によって示す)とオーバーラップする場合の、マイクロホモロジーの可能な設計を示す。32 ntよりも長いホモロジーを生成することができるが、1塩基ミスマッチは典型的には、Cas9による再切断を阻止しない(Fu et al., 2014 Nature Biotech)。意図した編集での1塩基ミスマッチが再切断を効率的に妨げ、かつgRNAのHR性能が高い場合には、標準的な1段階スカーレス編集は、現在高効率で利用可能である。
【
図6A】TBX1(
図6A)の編集のためのガイドRNAの標的部位を示す。
【
図6B】RUNX1(
図6B)の編集のためのガイドRNAの標的部位を示す。
【
図6C】GFI1(
図6C)の編集のためのガイドRNAの標的部位を示す。
【
図6D】B2M(
図6D)の編集のためのガイドRNAの標的部位を示す。
【
図7A】TBX1単一アレル性マーカー挿入クローン14番における第2ラウンドのHRを示す。
図7Aは、クローン14番のマーカーを含まないアレルの配列データを示す。第1の編集プロセスにおけるCRISPR/Cas9による切断部位の位置に、Gの1塩基挿入がある。
【
図7B】TBX1単一アレル性マーカー挿入クローン14番における第2ラウンドのHRを示す。
図7Bは、配列解析によるクローン14番における第2のHR後のクローンの遺伝子型を示す。
【
図7C】TBX1単一アレル性マーカー挿入クローン14番における第2ラウンドのHRを示す。
図7Cは、ドナーDNAまたは染色体ホモログを伴うHRの絵画的図解を示す。
【
図8】TBX1が編集されたES細胞におけるOct4、Tra1-60、およびNanogの免疫染色を示す(スケールバー=400μm)。
【
図9A】RUNX1-mOrange系統におけるGFI1遺伝子の終止コドン直前でのスカーレスマーカー組み込みを示す。
図9Aは、RUNX1編集のためのドナーDNAおよびガイドRNAの模式的設計を示す。矢印は、遺伝子型判定のためのプライマーを示す。各遺伝子型由来のPCRアンプリコンのサイズを、右の表に示す。
【
図9B】RUNX1-mOrange系統におけるGFI1遺伝子の終止コドン直前でのスカーレスマーカー組み込みを示す。
図9Bは、MACS陽性選択および単一細胞クローニングが後に続く、第1の編集後の明るいクローンのPCRによる遺伝子型判定を示す。UbCプロモーターのコピー数を、ddPCR法によって評定した。クローン2番を、その後の手順に用いた。
【
図9C】RUNX1-mOrange系統におけるGFI1遺伝子の終止コドン直前でのスカーレスマーカー組み込みを示す。
図9Cは、MACS陰性選択および単一細胞クローニングが後に続く、第2の編集後のクローンのPCRによる遺伝子型判定を示す。第2のドナーベクターは、ホモロジーアームに加えて同じ配列(EGFP)を含有するため、(
図9D)に図示されるように、望ましくない編集事象が混入した(1~3番、5番)。
【
図10A】第1ラウンドの編集後の、RUNX1およびGFI1編集におけるランダムな組み込みの検出を示す。
図10Aは、ランダムな組み込みの検出のためのプライマー設計の模式図を示す。選択マーカーが、(プラスミドバックボーンに由来する)それぞれ左ホモロジーアームおよび右ホモロジーアームの外側の配列でゲノムに組み込まれる場合は、プライマーセット1および2が、ランダムな組み込みを検出することができる。PCRの結果を、RUNX1編集については(
図10B)に、GFI1編集については(
図10C)に示す。
【
図11A】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Aは、ATG開始コドンから上流314番目および315番目のGG>AA変異を示す。
【
図11B】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Bは、UbCプロモーターのWTおよびGG>AA変異体が、K562細胞においてほぼ同じ強度のGFPを発現させたことを示すフローサイトメトリー解析を示す。
【
図11C】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Cは、プライマー設計の模式図を示す。
【
図11D】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Dは、EcoRI-HF酵素で消化したPCR産物のアガロースゲル電気泳動を示す。DNAを、MidoriGreen色素で染色した。
【
図11E】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Eは、Image Jソフトウェアによる画像解析の代表的な画像を示す。
【
図11F】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Fは、EcoRI消化と組み合わせた正規のPCR由来の試料における蛍光強度(FI)の定量を示す。明るいクローン由来の試料はすべて、WTとGG>AAとの間で同じ強度を示し、これは、2コピーの外来性UbCプロモーターが組み込まれていることを意味し、GG>AAのFIは、薄暗いクローン由来の試料においてWTの半分であり、これは、1コピーの外来性UbCプロモーターが組み込まれたことを意味する。
【
図11G】B2M編集におけるUbCプロモーターの正規のPCRベースのコピー数解析を示す。
図11Gは、ddPCRベースの方法を用いたUbCプロモーターのコピー数解析を示す。ddPCR由来の結果は、正規のPCR-EcoRI消化ベースの実験の結果と一致していた。データを、平均±SDとして示す(N=3)。
【
図12】切断から編集までの距離の限界(Paquet et al. 2016)およびCas9のミスマッチに対する許容性(Fu et al., 2013)の点での、スカーレス編集において編集可能な範囲を示す。
【
図13A】種々のパターンのスカーレス編集のためのドナーDNA設計を示す。本発明者らは、HRベースの編集を、適切なマーカー選択と組み合わせた場合は、hPSC中で、TBX1編集においては3 kbよりも長くを組み込み、および欠失させるため、ならびにB2M編集においては約3 kb~1 kbの配列を改変するために利用可能であることを実証した。それらを組み合わせることは、以下のようなスカーレス編集の追加的な適用を理論的に可能にする:(
図13A)多能性幹細胞における分化の最適化または薬物スクリーニングに有用であるはずであるレポーター遺伝子の導入などのための大きな挿入。(
図13B)疾患モデルまたはノックアウト動物を作製するための大きな欠失。(
図13C)ヒト化モデルを含むノックイン動物を作製するための大きな置換。(
図13D)意図した変異部位の近くに、Znフィンガーヌクレアーゼを含む部位特異的ヌクレアーゼ(SSN)の良好な標的部位がない場合における編集。この技法を用いて、編集部位に対するほぼすべての限定が排除されるはずである。
【
図14】ngd-DSB、HDR駆動選択マーカー除去、および陰性選択の組み合わせを用いた二段階HDRベースのスカーレスゲノム編集戦略の模式図を示す。この方法は、編集された細胞の100%濃縮を可能にする。
【
図15】細胞機能にとって不可欠ではない表面マーカーを用いた選択戦略の適用を示す。
【
図16】ランダムに組み込まれたかまたはエピソーム性に存在する選択マーカーからのGFP発現の抑制のためのドナープラスミド設計を示す。
【発明を実施するための形態】
【0033】
詳細な説明
本発明の実践は、特に指示されない限り、当技術分野の技能内のゲノム編集、生化学、化学、免疫学、分子生物学、および組換えDNA技法の従来の方法を使用する。そのような技法は、文献において完全に説明されている。例えば、Targeted Genome Editing Using Site-Specific Nucleases: ZFNs, TALENs, and the CRISPR/Cas9 System (T. Yamamoto ed., Springer, 2015);Genome Editing: The Next Step in Gene Therapy (Advances in Experimental Medicine and Biology, T. Cathomen, M. Hirsch, and M. Porteus eds., Springer, 2016);Aachen Press Genome Editing (CreateSpace Independent Publishing Platform, 2015);Handbook of Experimental Immunology, Vols. I-IV (D.M. Weir and C.C. Blackwell eds., Blackwell Scientific Publications);A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition);Sambrook, et al., Molecular Cloning: A Laboratory Manual (3rd Edition, 2001);Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.)を参照されたい。
【0034】
本明細書において引用されるすべての刊行物、特許、および特許出願は、上記であろうと下記であろうと、その全体が参照により本明細書に組み入れられる。
【0035】
I. 定義
本発明を説明する際に、以下の用語が使用され、下記に示されるように定義されることが意図される。
【0036】
本明細書および添付の特許請求の範囲において用いられる場合、単数形の「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈が明らかに別のように指図しない限り、複数の指示対象を含む。したがって、例えば、「1つの細胞(a cell)」への言及は、2つ以上の細胞の混合物などを含む。
【0037】
特に所与の量に関する「約」という用語は、プラスまたはマイナス5パーセントの偏差を包含するように意味される。
【0038】
本明細書において用いられる場合、「細胞」とは、組織、器官、および生検材料由来の細胞、ならびに組換え細胞、インビトロで培養された細胞株由来の細胞、および細胞断片、細胞構成要素、または核酸を含む細胞小器官を含めて、細菌、古細菌、真菌、原生動物、植物、および動物を含む原核生物、真核生物、または古細菌生物から単離された任意のタイプの細胞を指す。用語はまた、核酸をカプセル化するナノ粒子、リポソーム、ポリマーソーム、またはマイクロカプセルなどの人工細胞も包含する。細胞は、固定細胞または生存細胞を含み得る。本明細書に記載されるゲノム編集法は、例えば、単一細胞または細胞の集団を含む試料に対して行うことができる。用語はまた、遺伝子改変細胞も含む。
【0039】
「ポリペプチド」および「タンパク質」という用語は、アミノ酸残基のポリマーを指し、最小長に限定されない。したがって、ペプチド、オリゴペプチド、二量体、多量体などが、定義内に包まれる。全長タンパク質およびその断片が両方とも、定義によって包含される。用語はまた、ポリペプチドの発現後修飾、例えば、グリコシル化、アセチル化、リン酸化、ヒドロキシル化なども含む。さらに、本発明の目的で、「ポリペプチド」は、タンパク質が所望の活性を維持する限り、天然の配列に対する修飾、例えば欠失、付加、および置換を含むタンパク質を指す。これらの修飾は、部位特異的変異誘発によるように計画的であってもよく、または、例えばタンパク質を生成する宿主の変異もしくはPCR増幅のためのエラーによるように偶発的であってもよい。
【0040】
本明細書において用いられる「Cas9」という用語は、任意の種由来のII型clustered regularly interspaced short palindromic repeats(CRISPR)システムCas9エンドヌクレアーゼを包含し、Cas9エンドヌクレアーゼ活性を保持する(すなわち、二本鎖切断を生じるようにDNAの部位特異的切断を触媒する)その生物学的活性断片、バリアント、類似体、および誘導体も含む。Cas9エンドヌクレアーゼは、その結合したガイドRNA(gRNA)に対して相補的な配列を含む部位でDNAに結合して、切断する。
【0041】
Cas9ポリヌクレオチド、核酸、オリゴヌクレオチド、タンパク質、ポリペプチド、またはペプチドは、任意の供給源に由来する分子を指す。分子は、物質的に生物に由来する必要はなく、合成または組換えで生成されてもよい。複数の細菌種由来のCas9配列が、当技術分野において周知であり、National Center for Biotechnology Information(NCBI)データベースに列挙されている。例えば、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)(WP_002989955、WP_038434062、WP_011528583);カンピロバクター・ジェジュニ(Campylobacter jejuni)(WP_022552435、YP_002344900)、カンピロバクター・コリ(Campylobacter coli)(WP_060786116);カンピロバクター・フィタス(Campylobacter fetus)(WP_059434633);コリネバクテリウム・ウルセランス(Corynebacterium ulcerans)(NC_015683、NC_017317);コリネバクテリウム・ジフテリア(Corynebacterium diphtheria)(NC_016782、NC_016786);エンテロコッカス・フェカリス(Enterococcus faecalis)(WP_033919308);スピロプラズマ・シルフィディコーラ(Spiroplasma syrphidicola)(NC_021284);プレボテラ・インターメディア(Prevotella intermedia)(NC_017861);スピロプラズマ・タイワネンス(Spiroplasma taiwanense)(NC_021846);ストレプトコッカス・イニアエ(Streptococcus iniae)(NC_021314);ベルリエラ・バルティカ(Belliella baltica)(NC_018010);サイクロフレクサス・トルキスI(Psychroflexus torquisI)(NC_018721);ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(YP_820832)、ストレプトコッカス・ミュータンス(Streptococcus mutans)(WP_061046374、WP_024786433);リステリア・イノキュア(Listeria innocua)(NP_472073);リステリア・モノサイトゲネス(Listeria monocytogenes)(WP_061665472);レジオネラ・ニューモフィラ(Legionella pneumophila)(WP_062726656);スタフィロコッカス・アウレウス(Staphylococcus aureus)(WP_001573634);フランシセラ・ツラレンシス(Francisella tularensis)(WP_032729892、WP_014548420)、エンテロコッカス・フェカリス(WP_033919308);ラクトバチルス・ラムノサス(Lactobacillus rhamnosus)(WP_048482595、WP_032965177);およびナイセリア・メニンギティディス(Neisseria meningitidis)(WP_061704949、YP_002342100)由来のCas9についてのNCBI登録を参照されたい;(本出願の出願日までに登録された)これらの配列のすべては、参照により本明細書に組み入れられる。これらの配列、またはそれに対して少なくとも約70~100%の配列同一性を、この範囲内の任意のパーセント同一性、例えば、それに対して70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を含めて有する配列を含むそのバリアントのいずれかを、本明細書に記載されるようなスカーレスゲノム編集のために用いることができ、ここで、バリアントは、Cas9部位特異的エンドヌクレアーゼ活性などの生物学的活性を保持している。Cas9の配列比較および遺伝的多様性の考察および系統発生解析については、Fonfara et al. (2014) Nucleic Acids Res. 42(4):2577-90;Kapitonov et al. (2015) J. Bacteriol. 198(5):797-807、Shmakov et al. (2015) Mol. Cell. 60(3):385-397、およびChylinski et al. (2014) Nucleic Acids Res. 42(10):6091-6105もまた参照されたい。
【0042】
「誘導体」により、関心対象の天然のポリペプチドの、天然のポリペプチドの断片の、またはそれらのそれぞれの類似体の任意の適している修飾、例えば、グリコシル化、リン酸化、ポリマーコンジュゲーション(例えばポリエチレングリコールとの)、または外来部分の他の付加が、天然のポリペプチドの所望の生物学的活性が保持される限り、意図される。ポリペプチド断片、類似体、および誘導体を作製するための方法は概して、当技術分野において利用可能である。
【0043】
「断片」により、無傷の完全長配列および構造の一部のみからなる分子が意図される。断片は、ポリペプチドのC末端欠失、N末端欠失、および/または内部欠失を含むことができる。特定のタンパク質またはポリペプチドの活性断片は概して、完全長分子の少なくとも約5~10個の連続したアミノ酸残基、好ましくは完全長分子の少なくとも約15~25個の連続したアミノ酸残基、および最も好ましくは完全長分子の少なくとも約20~50個もしくはそれよりも多い連続したアミノ酸残基、または5アミノ酸と完全長配列との間の任意の整数を、当該断片が、Cas9部位特異的エンドヌクレアーゼ活性などの生物学的活性を保持するという条件で含む。
【0044】
「実質的に精製された」とは概して、物質(化合物、ポリヌクレオチド、核酸、タンパク質、ポリペプチド、ポリペプチド組成物)が、それが属する試料の大多数のパーセントを構成するような、物質の単離を指す。典型的には試料において、実質的に精製された構成要素は、試料の50%、好ましくは80%~85%、より好ましくは90%~95%を構成する。関心対象のポリヌクレオチドおよびポリペプチドを精製するための技法は、当技術分野において周知であり、例えば、イオン交換クロマトグラフィー、親和性クロマトグラフィー、および密度にしたがう沈降を含む。
【0045】
「単離された」により、ポリペプチドに言及する場合、示された分子が、その分子が天然でそれと共に見出される生物全体から離れており、かつ別個であるか、または、同じタイプの他の生物学的巨大分子の実質的な非存在下で存在することが意味される。ポリヌクレオチドに関する「単離された」という用語は、天然でそれに通常会合している配列を全部または一部欠いている核酸分子;または、天然に存在しているようであるが、それに関連した異種配列を有する配列;または、染色体から解離された分子である。
【0046】
本明細書において用いられる場合、「細胞の不均質集団」という句は、1つのタイプが関心対象の細胞である(例えば、関心対象のゲノム改変を有する)、少なくとも2つのタイプの細胞の混合物を指す。細胞の不均質集団は、任意の生物に由来してもよい。
【0047】
関心対象のゲノム改変を有する細胞または細胞の集団を選択する文脈中で、本明細書において用いられる「単離すること」および「単離」という用語は、関心対象のゲノム改変を有する細胞または細胞の集団を、例えば陽性選択または陰性選択によって、細胞の不均質集団から分離することを指す。
【0048】
「選択マーカー」という用語は、(マーカーを発現する細胞を選択する)陽性選択によるかまたは(マーカーを発現する細胞を除外する)陰性選択によるかいずれかでの、細胞の不均質集団からの細胞集団の濃縮のために用いることができるマーカーを指す。
【0049】
「結合物質」という用語は、選択マーカーに特異的に結合する任意の物質を指す。結合物質の例には、非限定的に、選択マーカーに特異的に結合する抗体、抗体断片、抗体模倣物、およびアプタマーが含まれる。
【0050】
結合物質に言及する場合の「特異的に(または選択的に)結合する」という句は、細胞の不均質集団および他の生物製剤において特定の選択マーカーを保有する細胞の存在を決定する結合反応を指す。したがって、指定された条件下で、結合物質は、バックグラウンドの少なくとも2倍、細胞上の特定の選択マーカーに結合し、かつ実質的に、試料中に存在する選択マーカーを保有しない他の細胞には有意な量で結合しない。そのような条件下での選択マーカーを保有する細胞に対する特異的結合は、特定の選択マーカーに対するその特異性について選択されている結合物質(例えば、抗体、抗体模倣物、またはアプタマー)を必要とし得る。典型的には、結合物質と選択マーカーとの間の特異的または選択的結合は、バックグラウンドシグナルまたはノイズの少なくとも2倍であり、より典型的にはバックグラウンドの10~100倍よりも大きい。
【0051】
「抗体」という用語は、ポリクローナルおよびモノクローナル抗体調製物、ならびに、ハイブリッド抗体、変更された抗体、キメラ抗体、およびヒト化抗体を含む調製物、ならびに:ハイブリッド(キメラ)抗体分子(例えば、Winter et al. (1991) Nature 349:293-299;および米国特許第4,816,567号を参照されたい);F(ab')2およびF(ab)断片;Fv分子(非共有結合性へテロ二量体、例えば、Inbar et al. (1972) Proc Natl Acad Sci USA 69:2659-2662;およびEhrlich et al. (1980) Biochem 19:4091-4096を参照されたい);一本鎖Fv分子(sFv)(例えば、Huston et al. (1988) Proc Natl Acad Sci USA 85:5879-5883を参照されたい);ナノボディまたは単一ドメイン抗体(sdAb)(例えば、Wang et al. (2016) Int J Nanomedicine 11:3287-3303、Vincke et al. (2012) Methods Mol Biol 911:15-26を参照されたい);二量体および三量体抗体断片構築物;ミニボディ(minibody)(例えば、Pack et al. (1992) Biochem 31:1579-1584;Cumber et al. (1992) J Immunology 149B:120-126を参照されたい);ヒト化抗体分子(例えば、Riechmann et al. (1988) Nature 332:323-327;Verhoeyan et al. (1988) Science 239:1534-1536;および1994年9月21日に公開された英国特許公開番号GB 2,276,169を参照されたい);ならびに、そのような分子から得られた任意の機能的断片を包含し、ここで、そのような断片は、親抗体分子の特異的結合特性を保持している。
【0052】
本明細書において用いられる場合、「固体支持体」とは、磁性ビーズ、ラテックスビーズ、マイクロタイタープレートウェル、ガラスプレート、ナイロン、アガロース、アクリルアミドなどのような固体表面を指す。
【0053】
「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」、および「核酸分子」という用語は、リボヌクレオチドまたはデオキシリボヌクレオチドいずれかの、任意の長さのヌクレオチドのポリマー形態を含むように、本明細書において用いられる。この用語は、分子の一次構造のみを指す。したがって、用語は、三本鎖、二本鎖、および一本鎖DNA、ならびに三本鎖、二本鎖、および一本鎖RNAを含む。また、ポリヌクレオチドの、例えばメチル化によるおよび/またはキャッピングによる修飾、ならびに非修飾形態も含む。より詳しくは、「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」、および「核酸分子」という用語は、(2-デオキシ-D-リボースを含有する)ポリデオキシリボヌクレオチド、(D-リボースを含有する)ポリリボヌクレオチド、プリンまたはピリミジン塩基のN-グリコシドまたはC-グリコシドであるポリヌクレオチドの任意の他のタイプ、ならびに、ポリマーが、DNAおよびRNAにおいて見出されるような塩基対および塩基の積み重ねを可能にする形状で核酸塩基を含有するという条件で、非ヌクレオチドバックボーン、例えば、ポリアミド(例えば、ペプチド核酸(PNA))およびポリモルホリノ(NeugeneとしてAnti-Virals, Inc., Corvallis, Oreg.から市販されている)ポリマー、および他の合成配列特異的核酸ポリマーを含有する他のポリマーを含む。「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」、および「核酸分子」という用語の間には、意図された長さの区別はなく、これらの用語は互換的に用いられる。したがって、これらの用語は、例えば、3'-デオキシ-2',5'-DNA、オリゴデオキシリボヌクレオチドN3' P5'ホスホルアミダート、2'-O-アルキル-置換RNA、二本鎖および一本鎖DNA、ならびに二本鎖および一本鎖RNA、マイクロRNA、DNA:RNAハイブリッド、ならびにPNAとDNAまたはRNAとの間のハイブリッドを含み、かつまた、公知のタイプの修飾、例えば、当技術分野において公知である標識、メチル化、「キャップ」、天然に存在するヌクレオチドのうちの1つまたは複数の類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、C5-プロピニルシチジン、C5-プロピニルウリジン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-メチルシチジン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン)での置換、ヌクレオチド間修飾、例えば、無電荷の結合を有するもの(例えば、メチルホスホナート、ホスホトリエステル、ホスホルアミダート、カルバマートなど)、負電荷の結合を有するもの(例えば、ホスホロチオアート、ホスホロジチオアートなど)、および正電荷の結合を有するもの(例えば、アミノアルキルホスホルアミダート、アミノアルキルホスホトリエステル)など、ペンダント部分、例えば、タンパク質(ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ-L-リジンなどを含む)などを含有するもの、インターカレーター(例えば、アクリジン、ソラレンなど)を有するもの、キレーター(例えば、金属、放射性金属、ホウ素、酸化金属など)を含有するもの、アルキル化剤を含有するもの、修飾された結合を有するもの(例えば、αアノマー核酸など)、ならびにポリヌクレオチドまたはオリゴヌクレオチドの非修飾形態も含む。用語はまた、(例えば、2'-酸素原子と4'-炭素原子との間にメチレン架橋を有するリボヌクレオチドを含む)ロックド核酸も含む。例えば、Kurreck et al. (2002) Nucleic Acids Res. 30: 1911-1918;Elayadi et al. (2001) Curr. Opinion Invest. Drugs 2: 558-561;Orum et al. (2001) Curr. Opinion Mol. Ther. 3: 239-243;Koshkin et al. (1998) Tetrahedron 54: 3607-3630;Obika et al. (1998) Tetrahedron Lett. 39: 5401-5404を参照されたい。
【0054】
「ハイブリダイズする」および「ハイブリダイゼーション」という用語は、ワトソン-クリック塩基対形成を介して複合体を形成するのに十分相補的であるヌクレオチド配列間の複合体の形成を指す。
【0055】
「相同領域」という用語は、別の核酸領域に対してホモロジーを有する核酸の領域を指す。したがって、「相同領域」が核酸分子中に存在するかどうかは、同じ分子または異なる分子における別の核酸領域に関して決定される。さらに、核酸は多くの場合に二本鎖であるため、本明細書において用いられる「相同領域」という用語は、互いにハイブリダイズする核酸分子の能力を指す。例えば、一本鎖核酸分子は、互いにハイブリダイズすることができる2つの相同領域を有することができる。したがって、「相同領域」という用語は、相補配列を有する核酸セグメントを含む。相同領域は、長さが変動してもよいが、典型的には、4~500ヌクレオチド(例えば、約4~約40、約40~約80、約80~約120、約120~約160、約160~約200、約200~約240、約240~約280、約280~約320、約320~約360、約360~約400、約400~約440など)である。
【0056】
本明細書において用いられる場合、「相補的な」または「相補性」という用語は、互いに塩基対を形成することができるポリヌクレオチドを指す。塩基対は典型的には、ポリヌクレオチド鎖の間の逆平行の向きでのヌクレオチド単位間の水素結合によって形成される。相補的ポリヌクレオチド鎖は、ワトソン・クリック様式(例えば、A-T、A-U、C-G)で、または二重鎖の形成を可能にする任意の他の様式で塩基対形成することができる。当業者が承知しているように、DNAとは対照的にRNAを用いる場合、チミン(T)ではなくウラシル(U)が、アデノシンに対して相補的であると考えられる塩基である。しかし、本発明の文脈においてウラシルが表される場合、特に述べられない限り、チミンを置換する能力が暗示される。「相補性」は、2本のRNA鎖の間、2本のDNA鎖の間、またはRNA鎖とDNA鎖との間に存在し得る。2つ以上のポリヌクレオチドが「相補的」であってもよく、完全に満たないまたは100%未満の相補性を有するにもかかわらず、二重鎖を形成できることが、概して理解される。2つの配列は、相補性の領域を含む各ポリヌクレオチド配列の少なくとも連続した一部分が、そのような領域内にいかなるミスマッチまたは中断も有さずに他のポリヌクレオチドと完全に塩基対形成する場合は、「完全に相補的」または「100%相補的」である。2つ以上の配列は、各ポリヌクレオチド内の連続した相補性の領域が互いに完全にハイブリダイズすることができる限り、たとえいずれかまたは両方のポリヌクレオチドが追加的な非相補性配列を含有するとしても、「完全に相補的」または「100%相補的」と考えられる。「完全に満たない」相補性とは、そのような相補性の領域内のすべてに満たない連続したヌクレオチドが互いに塩基対形成することができる状況を指す。2つのポリヌクレオチド配列間の相補性のパーセンテージを決定することは、当技術分野において通常の技能の問題である。Cas9ターゲティングの目的で、gRNAは、二重鎖を形成するのに十分な塩基対形成が可能である、標的配列(例えば、メジャーアレルまたはマイナーアレル)に対して「相補的な」配列を含んでもよい(すなわち、gRNAは標的配列とハイブリダイズする)。加えて、gRNAは、PAM配列に対して相補的な配列を含んでもよく、gRNAはまた、標的DNA中のPAM配列にもハイブリダイズする。
【0057】
「標的部位」または「標的配列」は、ガイドRNA(gRNA)またはドナーポリヌクレオチドのホモロジーアームによって認識される(すなわち、ハイブリダイゼーションのために十分相補的な)核酸配列である。標的部位は、アレル特異的(例えば、メジャーアレルまたはマイナーアレル)であってもよい。
【0058】
「ドナーポリヌクレオチド」という用語は、HDRによって標的遺伝子座でゲノム中に組み込まれるべき意図した編集の配列を提供する、ポリヌクレオチドを指す。
【0059】
「ホモロジーアーム」により、細胞において編集されるべきゲノム配列へのドナーポリヌクレオチドのターゲティングを担う、ドナーポリヌクレオチドの一部分が意味される。ドナーポリヌクレオチドは、典型的には、ゲノムDNAに対する意図した編集を含むヌクレオチド配列に隣接する、5'ゲノム標的配列にハイブリダイズする5'ホモロジーアームおよび3'ゲノム標的配列にハイブリダイズする3'ホモロジーアームを含む。ホモロジーアームは、5'および3'(すなわち、上流および下流)ホモロジーアームと本明細書において呼ばれ、これは、ドナーポリヌクレオチド内の意図した編集を含むヌクレオチド配列に対するホモロジーアームの相対位置に関する。5'および3'ホモロジーアームは、それぞれ「5'標的配列」および「3'標的配列」と本明細書において呼ばれる、改変されるべきゲノムDNAにおける標的遺伝子座内の領域にハイブリダイズする。意図した編集を含むヌクレオチド配列は、5'および3'ホモロジーアームによって認識される(すなわち、ハイブリダイゼーションのために十分相補的な)ゲノム標的遺伝子座でHDRによってゲノムDNA中に組み込まれる。
【0060】
ドナーポリヌクレオチド、ガイドRNA、またはCas9発現システムなどの核酸を細胞に「投与すること」は、形質導入、トランスフェクション、エレクトロポレーション、転位、融合、ファゴサイトーシス、シューティングまたは弾道法など、すなわち、それによって核酸を、細胞膜を横切って輸送することができる任意の手段を含む。
【0061】
ガイドRNAに関する「選択的に結合する」により、ガイドRNAが、関心対象の標的配列に優先的に結合する、または他のゲノム配列よりも高い親和性で標的配列に結合することが意味される。例えば、gRNAは、実質的に相補的な配列に結合し、無関係の配列には結合しない。特定の変異体アレル(例えば、置換、挿入、または欠失を含むアレル)などの特定のアレルに「選択的に結合する」gRNAは、特定の標的アレルに優先的に結合するが、野生型アレルまたは他の配列にはより少ない程度で結合するgRNAを表す。特定の標的DNA配列に選択的に結合するgRNAは、標的部位で実質的に相補的な配列に対するCas9の結合を選択的に方向づけ、無関係の配列に対しては方向づけない。
【0062】
本明細書において用いられる場合、「標識」および「検出可能な標識」という用語は、放射性同位体、蛍光剤、化学発光剤、発色団、酵素、酵素基質、酵素補因子、酵素阻害剤、半導体ナノ粒子、色素、金属イオン、金属ゾル、リガンド(例えば、ビオチン、ストレプトアビジン、またはハプテン)などを含むがそれらに限定されない、検出が可能な分子を指す。「蛍光剤」という用語は、検出可能な範囲で蛍光を呈することができる物質またはその一部分を指す。本発明の実践において用いられ得る標識の特定の例には、SYBR green、SYBR gold;CAL Fluor Gold 540、CAL Fluor Orange 560、CAL Fluor Red 590、CAL Fluor Red 610、およびCAL Fluor Red 635などのCAL Fluor色素;Quasar 570、Quasar 670、およびQuasar 705などのQuasar色素;Alexa Fluor 350、Alexa Fluor 488、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 594、Alexa Fluor 647、およびAlexa Fluor 784などのAlexa Fluor;Cy 3、Cy3.5、Cy5、Cy5.5、およびCy7などのシアニン色素;フルオレセイン、2',4',5',7'-テトラクロロ-4-7-ジクロロフルオレセイン(TET)、カルボキシフルオレセイン(FAM)、6-カルボキシ-4',5'-ジクロロ-2',7'-ジメトキシフルオレセイン(JOE)、ヘキサクロロフルオレセイン(HEX)、ローダミン、カルボキシ-X-ローダミン(ROX)、テトラメチルローダミン(TAMRA)、FITC、ダンシル、ウンベリフェロン、ジメチルアクリジニウムンエステル(DMAE)、Texas red、ルミノール、NADPH、西洋ワサビペルオキシダーゼ(HRP)、およびα-β-ガラクトシダーゼが含まれるが、それらに限定されない。
【0063】
「ホモロジー」とは、2つのポリヌクレオチドまたは2つのポリペプチド分子の間のパーセント同一性を指す。2つの核酸または2つのポリペプチド配列は、配列が、分子の定義された長さにわたって少なくとも約50%の配列同一性、好ましくは少なくとも約75%の配列同一性、より好ましくは少なくとも約80%、85%の配列同一性、より好ましくは少なくとも約90%の配列同一性、および最も好ましくは少なくとも約95%、98%の配列同一性を呈する場合、互いに「実質的に相同」である。本明細書において用いられる場合、実質的に相同とはまた、指定された配列に対して完全な同一性を示す配列も指す。
【0064】
概して、「同一性」とは、それぞれ、2つのポリヌクレオチドまたはポリペプチド配列の、ヌクレオチドに対するヌクレオチドまたはアミノ酸に対するアミノ酸の正確な対応を指す。パーセント同一性は、配列を整列させること、2つの整列させた配列間の一致の正確な数を計数すること、より短い配列の長さで割ること、および結果に100をかけることにより、2つの分子間の配列情報の直接比較によって決定することができる。容易に利用可能なコンピュータプログラム、例えば、Smith and Waterman Advances in Appl. Math. 2:482 489, 1981の局所ホモロジーアルゴリズムをペプチド解析に適合させるAtlas of Protein Sequence and Structure M.O. Dayhoff ed., 5 Suppl. 3:353 358, National biomedical Research Foundation, Washington, DCにおけるALIGN, Dayhoff, M.O.を、解析を助けるために用いることができる。ヌクレオチド配列同一性を決定するためのプログラムは、Wisconsin Sequence Analysis Package, Version 8(Genetics Computer Group, Madison, WIから利用可能)、例えば、Smith and Watermanアルゴリズムにも依拠するBESTFIT、FASTA、およびGAPプログラムにおいて利用可能である。これらのプログラムは、製造業者によって推奨され、上記で言及されるWisconsin Sequence Analysis Packageに記述されているデフォルトパラメータと共に容易に利用される。例えば、参照配列に対する特定のヌクレオチド配列のパーセント同一性は、デフォルトスコアリング表および6ヌクレオチドの位置のギャップペナルティを伴うSmith and Watermanのホモロジーアルゴリズムを用いて決定することができる。
【0065】
本発明の文脈においてパーセント同一性を確立する別の方法は、University of Edinburghが著作権を有し、John F. CollinsおよびShane S. Sturrokによって開発され、IntelliGenetics, Inc. (Mountain View, CA)によって配信されているMPSRCHパッケージのプログラムを用いることである。この一式のパッケージから、Smith Watermanアルゴリズムを使用することができ、スコアリング表のためにデフォルトパラメータが用いられる(例えば、12のギャップオープンペナルティ、1のギャップ伸長ペナルティ、および6のギャップ)。生じたデータから、「一致」値は、「配列同一性」を反映する。配列間のパーセント同一性または類似性を算出するための他の適しているプログラムは、概して、当技術分野において公知であり、例えば、別のアラインメントプログラムは、デフォルトパラメータと共に用いられるBLASTである。例えば、BLASTNおよびBLASTPは、以下のデフォルトパラメータを用いて使用することができる:遺伝コード=標準;フィルター=なし;鎖=両方;カットオフ=60;期待値=10;マトリクス=BLOSUM62;記載=50配列;HIGH SCOREによって選別;データベース=非冗長性GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + Swiss protein + Spupdate + PIR。これらのプログラムの詳細は、容易に利用可能である。
【0066】
あるいは、ホモロジーは、相同領域間で安定な二重鎖を形成する条件下でのポリヌクレオチドのハイブリダイゼーション、後に続く一本鎖特異的ヌクレアーゼでの消化、および消化された断片のサイズ決定によって決定することができる。実質的に相同であるDNA配列は、例えば、その特定のシステムについて定義されるようなストリンジェントな条件下で、サザンハイブリダイゼーション実験において特定することができる。適切なハイブリダイゼーション条件を定義することは、当技術分野の技能内である。例えば、上記のSambrook et al.;上記のDNA Cloning;上記のNucleic Acid Hybridizationを参照されたい。
【0067】
核酸分子を説明するために本明細書において用いられる「組換え」とは、その起源または操作のおかげで、それが天然で会合しているポリヌクレオチドのすべてまたは一部分と会合していない、ゲノム、cDNA、ウイルス、半合成、または合成起源のポリヌクレオチドを意味する。タンパク質またはポリペプチドに関して用いられる「組換え」という用語は、組換えポリヌクレオチドの発現によって生成されるポリペプチドを意味する。概して、さらに以下に記載されるように、関心対象の遺伝子をクローニングし、次いで、形質転換した生物において発現させる。宿主生物は、発現条件下で外来遺伝子を発現して、タンパク質を生成する。
【0068】
「形質転換」という用語は、宿主細胞中への外来性ポリヌクレオチドの挿入を、挿入のために用いられる方法に関係なく指す。例えば、直接の取り込み、形質導入、またはf-接合が含まれる。外来性ポリヌクレオチドは、非組み込み型ベクター、例えば、プラスミドとして維持されてもよく、あるいは、宿主ゲノム中に組み込まれてもよい。
【0069】
「組換え宿主細胞」、「宿主細胞」、「細胞」、「細胞株」、「細胞培養」、および単細胞実体として培養される微生物または高等真核生物細胞株を表す他のそのような用語は、組換えベクターまたは他の移入されるDNAのためのレシピエントとして用いることができるかまたは用いられている細胞を指し、かつトランスフェクションされている元の細胞の元の子孫を含む。
【0070】
「コード配列」または選択されたポリペプチドを「コードする」配列は、適切な調節配列(または「制御エレメント」)の制御下に置かれた場合に、インビボでポリペプチドに、転写され(DNAの場合)、翻訳される(mRNAの場合)核酸分子である。コード配列の境界は、5'(アミノ)末端の開始コドンおよび3'(カルボキシ)末端の翻訳終止コドンによって決定することができる。コード配列は、ウイルス、原核生物、または真核生物mRNA由来のcDNA、ウイルスまたは原核生物DNA由来のゲノムDNA配列、および合成DNA配列までも含むことができるが、それらに限定されない。転写終結配列が、コード配列の3'に位置していてもよい。
【0071】
典型的な「制御エレメント」には、転写プロモーター、転写エンハンサーエレメント、転写終結シグナル、ポリアデニル化配列(翻訳終止コドンの3'に位置する)、翻訳の開始の最適化のための配列(コード配列の5'に位置する)、および翻訳終結配列が含まれるが、それらに限定されない。
【0072】
「機能的に連結された」とは、そのように記載された構成要素が、その通常の機能を果たすために形作られているエレメントの配置を指す。したがって、コード配列に機能的に連結された所与のプロモーターは、妥当な酵素が存在する場合に、コード配列の発現をもたらすことができる。プロモーターは、それがコード配列の発現を方向づけるように機能する限り、コード配列と連続している必要はない。したがって、例えば、介在性の翻訳されないが転写される配列が、プロモーター配列とコード配列との間に存在することができ、プロモーター配列は依然として、コード配列に「機能的に連結された」と考えることができる。
【0073】
「発現カセット」または「発現構築物」は、関心対象の配列または遺伝子の発現を方向づけることができるアセンブリを指す。発現カセットは概して、上記のような制御エレメント、例えば、関心対象の配列または遺伝子に(その転写を方向づけるために)機能的に連結されているプロモーターを含み、かつ多くの場合、ポリアデニル化配列を同様に含む。本発明のある特定の態様内で、本明細書に記載される発現カセットは、ドナーポリヌクレオチド、プラスミド、またはウイルスベクター構築物内に含有されてもよい。発現カセットの構成要素に加えて、構築物はまた、1つまたは複数の選択可能マーカー、構築物が一本鎖DNAとして存在することを可能にするシグナル(例えば、M13複製開始点)、少なくとも1つの多重クローニング部位、および「哺乳動物」複製開始点(例えば、SV40またはアデノウイルス複製開始点)も含んでもよい。
【0074】
「精製ポリヌクレオチド」とは、そのポリヌクレオチドが天然で会合しているタンパク質を本質的に含まない、例えば、約50%未満、好ましくは約70%未満、およびより好ましくは約少なくとも90%未満を含有する、関心対象のポリヌクレオチドまたはその断片を指す。関心対象のポリヌクレオチドを精製するための技法は、当技術分野において周知であり、例えば、ポリヌクレオチドを含有する細胞のカオトロピック剤での破壊、ならびにイオン交換クロマトグラフィー、親和性クロマトグラフィー、および密度にしたがう沈降によるポリヌクレオチドおよびタンパク質の分離を含む。
【0075】
「トランスフェクション」という用語は、細胞による外来DNAの取り込みを指すように用いられる。外来性DNAが細胞膜の内側に導入されている場合、細胞は「トランスフェクト」されている。複数のトランスフェクション技法が、当技術分野において概して公知である。例えば、Graham et al. (1973) Virology, 52:456、Sambrook et al. (2001) Molecular Cloning, a laboratory manual, 3rd edition, Cold Spring Harbor Laboratories, New York、Davis et al. (1995) Basic Methods in Molecular Biology, 2nd edition, McGraw-Hill, and Chu et al. (1981) Gene 13:197を参照されたい。そのような技法を、適している宿主細胞中に1つまたは複数の外来性DNA部分を導入するために用いることができる。用語は、遺伝子材料の安定な取り込みおよび一過性の取り込みの両方を指し、ペプチド結合DNAまたは抗体結合DNAの取り込みを含む。
【0076】
「ベクター」は、標的細胞に核酸配列を移入することができる(例えば、ウイルスベクター、非ウイルスベクター、粒子状担体、およびリポソーム)。典型的には、「ベクター構築物」、「発現ベクター」、および「遺伝子移入ベクター」は、関心対象の核酸の発現を方向づけることができ、かつ標的細胞に核酸配列を移入することができる任意の核酸構築物を意味する。したがって、用語は、クローニングおよび発現ビヒクル、ならびにプラスミドおよびウイルスベクターを含む。
【0077】
「バリアント」、「類似体」、および「ムテイン」という用語は、部位特異的Cas9エンドヌクレアーゼ活性などの所望の活性を保持する、参照分子の生物学的活性誘導体を指す。概して、「バリアント」および「類似体」という用語は、修飾が生物学的活性を破壊しない限り、天然の分子と比べて1つまたは複数のアミノ酸付加、(概して天然で保存的な)置換、および/または欠失を伴う天然のポリペプチド配列および構造を有し、かつ下記で定義されるように参照分子に対して「実質的に相同」である化合物を指す。概して、そのような類似体のアミノ酸配列は、2つの配列を整列させた場合に、参照配列に対して高度の配列ホモロジー、例えば、50%よりも大きい、概して60%~70%よりも大きい、さらにより詳細には80%~85%またはそれよりも大きい、例えば少なくとも90%~95%またはそれよりも大きいアミノ酸配列ホモロジーを有する。多くの場合、類似体は、本明細書において説明されるように、同じ数のアミノ酸を含むが、置換を含む。「ムテイン」という用語は、さらに、アミノおよび/またはイミノ分子のみを含む化合物、アミノ酸の1つまたは複数の類似体(例えば、非天然アミノ酸などを含む)を含有するポリペプチド、置換された結合を有するポリペプチド、ならびに、当技術分野において公知の他の修飾、天然および非天然(例えば、合成)の両方、環化、分枝状の分子などを含むがそれらに限定されない、1つまたは複数のアミノ酸様分子を有するポリペプチドを含む。用語はまた、1つまたは複数のN-置換グリシン残基(「ペプトイド」)、および他の合成アミノ酸またはペプチドを含む分子も含む。(例えば、ペプトイドの記述については、米国特許第5,831,005号;同第5,877,278号;および同第5,977,301号;Nguyen et al., Chem. Biol. (2000) 7:463-473;およびSimon et al., Proc. Natl. Acad. Sci. USA (1992) 89:9367-9371を参照されたい)。ポリペプチド類似体およびムテインを作製するための方法は、当技術分野において公知であり、さらに以下に記載される。
【0078】
上記で説明されるように、類似体は概して、天然で保存的である置換、すなわち、その側鎖において関連するアミノ酸のファミリー内で起こる置換を含む。具体的には、アミノ酸は概して、以下の4つのファミリーに分けられる:(1) 酸性‐アスパラギン酸およびグルタミン酸;(2) 塩基性‐リジン、アルギニン、ヒスチジン;(3) 非極性‐アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン;ならびに(4) 無電荷極性‐グリシン、アスパラギン、グルタミン、システイン、セリン、スレオニン、およびチロシン。フェニルアラニン、トリプトファン、およびチロシンは、時には、芳香族アミノ酸として分類される。例えば、イソロイシンもしくはバリンでのロイシンの、グルタミン酸でのアスパラギン酸の、セリンでのスレオニンの単発的な置き換え、または構造的に関連したアミノ酸でのアミノ酸の同様の保存的置き換えは、生物学的活性に対して大きな影響を有さないことが、合理的に予測可能である。例えば、関心対象のポリペプチドは、分子の所望の機能が無傷のままである限り、最大で約5~10個の保存的もしくは非保存的なアミノ酸置換、またはさらに最大で約15~25個の保存的もしくは非保存的なアミノ酸置換、または5~25の間の任意の整数を含んでもよい。当業者は、当技術分野において周知のHopp/WoodsおよびKyte-Doolittleプロットを参照することによって、変化に対して許容性であることができる、関心対象の分子の領域を容易に決定し得る。
【0079】
「遺伝子移入」または「遺伝子送達」とは、関心対象のDNAまたはRNAを宿主細胞中に確実に挿入するための方法またはシステムを指す。そのような方法は、移入された非組み込み型DNAの一過性発現、移入されたレプリコン(例えば、エピソーム)の染色体外複製および発現、または移入された遺伝子材料の宿主細胞のゲノムDNA中への組み込みを結果としてもたらすことができる。遺伝子送達発現ベクターには、細菌プラスミドベクター、ウイルスベクター、非ウイルスベクター、アデノウイルス、レトロウイルス、アルファウイルス、ポックスウイルス、およびワクシニアウイルスに由来するベクターが含まれるが、それらに限定されない。
【0080】
「に由来する」という用語は、分子の元の供給源を特定するために本明細書において用いられるが、例えば、化学合成または組換え手段によることができる、分子がそれによって作製される方法を限定するようには意味されない。
【0081】
指定された配列「に由来する」ポリヌクレオチドは、指定されたヌクレオチド配列の領域に対応する、すなわち、それと同一のまたはそれに対して相補的な、およそ少なくとも約6ヌクレオチド、好ましくは少なくとも約8ヌクレオチド、より好ましくは少なくとも約10~12ヌクレオチド、およびさらにより好ましくは少なくとも約15~20ヌクレオチドの連続した配列を含むポリヌクレオチド配列を指す。由来するポリヌクレオチドは、関心対象のヌクレオチド配列に必ずしも物質的に由来しないが、ポリヌクレオチドが由来する領域における塩基の配列によって提供される情報に基づく、化学合成、複製、逆転写、または転写を含むがそれらに限定されない任意の様式において作製され得る。したがって、それは、元のポリヌクレオチドのセンスまたはアンチセンスいずれかの向きに相当し得る。
【0082】
「対象」という用語は、ヒトおよび非ヒト哺乳動物、例えば、チンパンジーならびに他の類人猿およびサルの種を含む非ヒト霊長類;マウス、ラット、ウサギ、ハムスター、モルモット、およびチンチラなどの実験動物;イヌおよびネコなどの飼いならされた動物;ヒツジ、ヤギ、ブタ、ウマ、およびウシなどの家畜を含む哺乳動物;ならびに、ニワトリ、シチメンチョウ、および他のキジ類の鳥、アヒル、ガチョウなどを含む飼いならされた鳥、野生の鳥、および猟鳥を非限定的に含む、脊椎動物および無脊椎動物の両方を含む。いくつかの場合には、本発明の方法は、マウス、ラット、およびハムスターを含むげっ歯類;霊長類、およびトランスジェニック動物を含むがそれらに限定されない、実験動物において、獣医学的適用において、および疾患用の動物モデルの開発において用いられる。
【0083】
II. 発明を実施する形態
本発明を詳細に説明する前に、本発明は、特定の製剤またはプロセスパラメータに限定されず、したがって当然変動してもよいことが、理解されるべきである。本明細書において用いられる用語法は、本発明の特定の態様を説明することのみを目的とし、限定するようには意図されないこともまた、理解されるべきである。
【0084】
本明細書に記載されるものと同様または等価の複数の方法および材料を、本発明の実践において用いることができるが、好ましい材料および方法を、本明細書に記載する。
【0085】
本発明は、細胞を遺伝子改変し、望まれない配列を除去するために2段階HDR修復を用いる、スカーレスゲノム編集の方法の開発に基づく。本方法は、ゲノム中にサイレント変異、選択マーカー配列、または他の付加的な望ましくない配列を残さずに、ゲノムにおける任意の位置に変異、欠失、または挿入を導入するために、ゲノム編集において使用され得る。さらに、編集部位の選択に対してほぼ制限がない。本方法は、小さな編集だけではなく、数千の塩基の大きな編集のためにも使用され得る。このゲノム編集法の大きな利点は、種々の種類の細胞におけるその極度に高い効率および柔軟性を含む。本発明者らは、ヒトES/iPS細胞のゲノム編集のための本方法の使用の実証に成功している(実施例1)。本方法の高い効率により、所望のクローンを、典型的には、10個よりも多くのコロニーをスクリーニングする必要なく特定することが可能である。加えて、本方法は、複数の遺伝子編集を可能にするように容易に適合可能である(実施例1を参照されたい)。
【0086】
本発明の理解を進めるために、2段階HDR修復を用いたスカーレスゲノム編集に関するより詳細な考察を、以下に提供する。
【0087】
A. 2段階HDR修復によるスカーレスゲノム編集
上記で説明されるように、本発明の方法は、Cas9ヌクレアーゼを用いたスカーレスゲノム編集を達成するために、2つのHDR修復段階を利用する。第1のHDR段階において、ゲノムに対する意図した編集を含む配列を含有するドナーポリヌクレオチドが、細胞において標的ゲノム配列を改変するために用いられ、該ドナーポリヌクレオチドは、部位特異的相同組換えによって標的遺伝子座でゲノム中に組み込まれる。ドナーポリヌクレオチドは、標的遺伝子を修復する、改変する、置き換える、欠失させる、減衰させる、または不活性化する目的で、例えば、ゲノム中に意図した編集を導入するために使用され得る。ドナーポリヌクレオチドに選択マーカー発現カセットが含まれることにより、第1のHDR段階によって生成される遺伝子改変細胞を、陽性選択によって単離することが可能である。第2のHDR段階において、第2のドナーポリヌクレオチドが、第1のHDR段階において生成された遺伝子改変細胞から選択マーカー発現カセットを欠失させるために用いられる。第2のドナーポリヌクレオチドは、選択マーカー発現カセットの欠失を含む以外は第1のHDR段階におけるゲノムDNA中への第1のドナーポリヌクレオチドの組み込みによって改変されるような標的ゲノム配列に対して相補的な配列を含む。それ故、標的ゲノム遺伝子座での第2のドナーポリヌクレオチドの組み込みは、発現カセットを除去する。選択マーカーカセットが除去されている遺伝子改変細胞は、陰性選択に基づいて単離することができる。
【0088】
第1のHDR段階において用いられるドナーポリヌクレオチド中で、意図した編集を含む配列は、細胞において編集されるべき標的遺伝子座へのドナーポリヌクレオチドのターゲティングを担う、ホモロジーアームのペアが隣接している。ドナーポリヌクレオチドは、典型的には、5'ゲノム標的配列にハイブリダイズする5'ホモロジーアームおよび3'ゲノム標的配列にハイブリダイズする3'ホモロジーアームを含む。ホモロジーアームは、5'および3'(すなわち、上流および下流)ホモロジーアームと本明細書において呼ばれ、これは、ドナーポリヌクレオチド内の意図した編集を含むヌクレオチド配列に対するホモロジーアームの相対位置に関する。5'および3'ホモロジーアームは、それぞれ「5'標的配列」および「3'標的配列」と本明細書において呼ばれる、改変されるべきゲノムDNAにおける標的遺伝子座内の領域にハイブリダイズする。選択マーカー発現カセットを除去するために第2のHDR段階において用いられるドナーポリヌクレオチドは、同様に、第1のHDR段階由来の組み込まれたドナーポリヌクレオチドに対して相補的な配列に隣接する、5'ホモロジーアームおよび3'ホモロジーアームを有する。
【0089】
ホモロジーアームは、標的遺伝子座でドナーポリヌクレオチドとゲノムDNAとの間の相同組換えを媒介するように、標的配列へのハイブリダイゼーションのために十分相補的でなければならない。例えば、ホモロジーアームは、対応するゲノム標的配列に対して少なくとも約80~100%の配列同一性を、この範囲内の任意のパーセント同一性、例えば、それに対して少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%、または100%の配列同一性を含めて有するヌクレオチド配列を含んでもよく、意図した編集を含むヌクレオチド配列は、5'および3'ホモロジーアームによって認識される(すなわち、ハイブリダイゼーションのために十分相補的な)ゲノム標的遺伝子座でのHDRによってゲノムDNA中に組み込まれる。
【0090】
ある特定の態様において、ゲノム標的配列(すなわち、「5'標的配列」および「3'標的配列」)における対応する相同ヌクレオチド配列は、切断のための特異的部位、および/または意図した編集を導入するための特異的部位に隣接する。特異的な切断部位と相同ヌクレオチド配列(例えば、各ホモロジーアーム)との間の距離は、数百ヌクレオチドであることができる。いくつかの態様において、ホモロジーアームと切断部位との間の距離は、200ヌクレオチド以下(例えば、0、10、20、30、50、75、100、125、150、175、および200ヌクレオチド)である。ほとんどの場合には、より短い距離が、より高い遺伝子ターゲティング率を生じ得る。好ましい態様において、ドナーポリヌクレオチドは、特異的な切断部位および変更されるべきゲノム標的配列の一部分の両方を包含するゲノムの一部分に導入されるべき配列変化を除いてその全長にわたって、標的ゲノム配列と実質的に同一である。
【0091】
ホモロジーアームは、任意の長さ、例えば、10ヌクレオチド以上、50ヌクレオチド以上、100ヌクレオチド以上、250ヌクレオチド以上、300ヌクレオチド以上、350ヌクレオチド以上、400ヌクレオチド以上、450ヌクレオチド以上、500ヌクレオチド以上、1000ヌクレオチド(1 kb)以上、5000ヌクレオチド(5 kb)以上、10000ヌクレオチド(10 kb)以上などであることができる。いくつかの例において、5'および3'ホモロジーアームは、互いに長さが実質的に同等であり、例えば、一方は、もう一方のホモロジーアームよりも30%以下短いか、もう一方のホモロジーアームよりも20%以下短いか、もう一方のホモロジーアームよりも10%以下短いか、もう一方のホモロジーアームよりも5%以下短いか、もう一方のホモロジーアームよりも2%以下短いか、またはもう一方のホモロジーアームよりも数ヌクレオチド少ないだけであってもよい。他の例において、5'および3'ホモロジーアームは、互いに長さが実質的に異なり、例えば、一方は、もう一方のホモロジーアームよりも40%以上短いか、50%以上短いか、時には、60%以上短いか、70%以上短いか、80%以上短いか、90%以上短いか、または95%以上短くてもよい。
【0092】
ある特定の態様において、第1のHDR段階において生成される改変ゲノムを含有する細胞は、ドナーポリヌクレオチド中に選択マーカー発現カセットを含むことによって、インビトロまたはインビボで特定される。選択マーカーは、細胞に対して特定可能な変化を付与し、これは、ゲノム中に組み込まれたドナーポリヌクレオチドを有する遺伝子改変細胞の陽性選択を可能にする。例えば、蛍光または生物発光マーカー(例えば、緑色蛍光タンパク質(GFP)、高感度緑色蛍光タンパク質(EGFP)、Dronpa、mCherry、mOrange、mPlum、Venus、YPet、フィコエリトリン、もしくはルシフェラーゼ)、細胞表面マーカー(例えば、切断型CD8、NGFR、もしくはCD19)、レポーター遺伝子(例えば、GFP、dsRed、GUS、lacZ、CAT)の発現、または、ネオマイシン、ピューロマイシン、ハイグロマイシン、DHFR、GPT、zeocin、もしくはヒスチジノールに対する耐性を付与する遺伝子などの薬物選択マーカーが、細胞を特定するために用いられてもよい。あるいは、単純ヘルペスウイルスチミジンキナーゼ(tk)またはクロラムフェニコールアセチルトランスフェラーゼ(CAT)などの酵素が、使用されてもよい。任意の選択可能マーカーが、それが第1のHDR段階におけるドナーポリヌクレオチドの組み込み後に発現されて、遺伝子改変細胞の特定を可能にできる限り、用いられてもよい。選択可能マーカーのさらなる例は、当業者に周知である。
【0093】
ある特定の態様において、選択マーカー発現カセットは、2つ以上の選択マーカーをコードする。選択マーカーは、組み合わせで用いられてもよく、例えば、細胞表面マーカーが蛍光マーカーと共に用いられてもよく、または薬物耐性遺伝子が自殺遺伝子と共に用いられてもよい。ある特定の態様において、ドナーポリヌクレオチドは、組み合わせで複数の選択マーカーの発現を可能にするマルチシストロン性ベクターによって提供される。マルチシストロン性ベクターは、さらに以下に記載されるような単一ベクターからの1つよりも多い選択マーカーの発現を可能にする、IRESまたはウイルス2Aペプチドを含んでもよい。
【0094】
本明細書に記載されるようなゲノム編集は、細胞のゲノムDNAにおいて改変されている1つのアレルまたは2つのアレルのいずれかを結果としてもたらし得る。ある特定の態様において、陽性選択のために用いられる選択マーカーのうちの少なくとも1つは、蛍光マーカーであり、遺伝子改変細胞が単一アレル編集を含むかまたは両アレル編集を含むかを決定するために、蛍光強度を測定することができる。
【0095】
蛍光mCherryマーカーおよび切断型CD19(tCD19)細胞表面マーカーをコードする例示的な発現カセットを、実施例1に示す。選択マーカー発現カセットは、mCherryをコードするポリヌクレオチドに機能的に連結されたUbCプロモーター、T2Aペプチドをコードするポリヌクレオチド、切断型CD19(tCD19)をコードするポリヌクレオチド、およびポリアデニル化配列を含む。
【0096】
ある特定の態様において、陰性選択マーカーが、選択マーカー発現カセットを有さない(すなわち、陽性選択マーカーをコードする配列が欠失している)細胞を特定するために用いられる。例えば、第2のHDR段階後の細胞の陰性選択を容易にするための選択マーカー発現カセットにおける陰性選択マーカーとして、自殺マーカーが含まれてもよい。自殺遺伝子は、遺伝子改変細胞においてアポトーシスを誘導すること、または非毒性薬物を毒性化合物に変換することによって、細胞を選択的に死滅させるために使用され得る。例には、チミジンキナーゼ、シトシンデアミナーゼ、細胞内抗体、テロメラーゼ、カスパーゼ、およびDNアーゼをコードする自殺遺伝子が含まれる。ある特定の態様において、自殺遺伝子は、1つまたは複数の他の選択マーカー、例えば、細胞の陽性選択における使用のための上記のものと組み合わせて用いられる。自殺遺伝子は、スカーレス編集を達成するために第2のHDR段階において除去されてよい。あるいは、自殺遺伝子は、その破壊を意のままに可能にすることによってその安全性を改善するため、第2のHDR段階後に遺伝子改変細胞において保持されてもよい。例えば、参照により本明細書に組み入れられるJones et al. (2014) Front. Pharmacol. 5:254、Mitsui et al. (2017) Mol. Ther. Methods Clin. Dev. 5:51-58、Greco et al. (2015) Front. Pharmacol. 6:95を参照されたい。
【0097】
あるいはまたは加えて、ポリメラーゼ連鎖反応(PCR)、蛍光インサイチュハイブリダイゼーション(FISH)、遺伝子アレイ、シークエンシング、またはハイブリダイゼーション技法(例えば、サザンブロット)などの従来の方法を用いて、第2のHDR段階後の遺伝子改変細胞における選択マーカー配列および他の望ましくない配列の非存在について、細胞を試験することができる。
【0098】
ゲノム編集は、関心対象の単一細胞または細胞の集団に対して行ってもよく、かつ、細菌、古細菌、真菌、原生生物、植物、および動物を含む原核生物、真核生物、または古細菌生物由来の任意の細胞を含む任意のタイプの細胞に対して行うことができる。組織、器官、および生検材料由来の細胞、ならびに組換え細胞、遺伝子改変細胞、インビトロで培養された細胞株由来の細胞、および人工細胞(例えば、核酸をカプセル化するナノ粒子、リポソーム、ポリマーソーム、またはマイクロカプセル)はすべて、本発明の実践において用いられてもよい。本発明の方法はまた、細胞断片、細胞構成要素、または核酸を含む細胞小器官(例えば、動物および植物細胞におけるミトコンドリア、植物細胞および藻類における色素体(例えば、葉緑体))における核酸の編集にも適用可能である。細胞は、本明細書に記載されるようなスカーレスゲノム編集を行う前、またはプロセスの最中の任意の時間、例えば、第1のHDR段階の実施と第2のHDR段階の実施との間、または第2のHDR段階の後に、培養または増大させてもよい。
【0099】
任意の種由来の任意のII型CRISPRシステムCas9エンドヌクレアーゼ、またはCas9エンドヌクレアーゼ活性を保持する(すなわち、二本鎖切断を生じるようにDNAの部位特異的切断を触媒する)その生物学的活性断片、バリアント、類似体、または誘導体が、HDR段階を行うために用いられてもよい。Cas9は、物質的に生物に由来する必要はなく、合成でまたは組換えで生成されてもよい。複数の細菌種由来のCas9配列が、当技術分野において周知であり、National Center for Biotechnology Information(NCBI)データベースに列挙されている。例えば、ストレプトコッカス・ピオゲネス(WP_002989955、WP_038434062、WP_011528583);カンピロバクター・ジェジュニ(WP_022552435、YP_002344900)、カンピロバクター・コリ(WP_060786116);カンピロバクター・フィタス(WP_059434633);コリネバクテリウム・ウルセランス(NC_015683、NC_017317);コリネバクテリウム・ジフテリア(NC_016782、NC_016786);エンテロコッカス・フェカリス(WP_033919308);スピロプラズマ・シルフィディコーラ(NC_021284);プレボテラ・インターメディア(NC_017861);スピロプラズマ・タイワネンス(NC_021846);ストレプトコッカス・イニアエ(NC_021314);ベルリエラ・バルティカ(NC_018010);サイクロフレクサス・トルキスI(NC_018721);ストレプトコッカス・サーモフィルス(YP_820832)、ストレプトコッカス・ミュータンス(WP_061046374、WP_024786433);リステリア・イノキュア(NP_472073);リステリア・モノサイトゲネス(WP_061665472);レジオネラ・ニューモフィラ(WP_062726656);スタフィロコッカス・アウレウス(WP_001573634);フランシセラ・ツラレンシス(WP_032729892、WP_014548420)、エンテロコッカス・フェカリス(WP_033919308);ラクトバチルス・ラムノサス(WP_048482595、WP_032965177);およびナイセリア・メニンギティディス(WP_061704949、YP_002342100)由来のCas9についてのNCBI登録を参照されたい;(本出願の出願日までに登録された)これらの配列のすべては、参照により本明細書に組み入れられる。これらの配列、またはそれに対して少なくとも約70~100%の配列同一性を、この範囲内の任意のパーセント同一性、例えば、それに対して70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を含めて有する配列を含むそのバリアントのいずれかを、本明細書に記載されるようなスカーレスゲノム編集のために用いることができる。Cas9の配列比較および遺伝的多様性の考察および系統発生解析については、Fonfara et al. (2014) Nucleic Acids Res. 42(4):2577-90;Kapitonov et al. (2015) J. Bacteriol. 198(5):797-807、Shmakov et al. (2015) Mol. Cell. 60(3):385-397、およびChylinski et al. (2014) Nucleic Acids Res. 42(10):6091-6105もまた参照されたい。
【0100】
CRISPR-Casシステムは、細菌および古細菌に天然に存在し、そこで外来DNAに対するRNA媒介適応免疫において役割を果たす。細菌II型CRISPRシステムは、エンドヌクレアーゼであるCas9を用い、これは、相補的なゲノム標的配列に特異的にハイブリダイズするガイドRNA(gRNA)と複合体を形成し、そこでCas9エンドヌクレアーゼは、二本鎖切断を生成するように切断を触媒する。Cas9のターゲティングはさらに、gRNA結合部位のまたはその近くのDNAにおける5'プロトスペーサー隣接モチーフ(PAM)の存在に依拠する。
【0101】
Cas9は、そのガイドRNA配列を変更することによって、特定のゲノム配列(すなわち、改変されるべきゲノム標的配列)を標的とすることができる。標的特異的ガイドRNAは、ゲノム標的配列に対して相補的であるヌクレオチド配列を含み、それによって、標的部位でのハイブリダイゼーションによるCas9-gRNA複合体の結合を媒介する。例えば、gRNAは、Cas9-gRNA複合体を変異の部位にターゲティングするために、マイナーアレルの配列に対して相補的な配列を伴って設計することができる。変異は、挿入、欠失、または置換を含んでもよい。例えば、変異は、単一ヌクレオチドバリエーション、遺伝子融合、転位、逆位、重複、フレームシフト、ミスセンス、ナンセンス、または関心対象の表現型もしくは疾患に関連する他の変異を含んでもよい。標的とされるマイナーアレルは、一般的な遺伝子バリアント、または希少な遺伝子バリアントであってもよい。ある特定の態様において、gRNAは、例えば、Cas9-gRNA複合体の一塩基多型(SNP)に対する結合を可能にするために、単一塩基対識別力を有するマイナーアレルに選択的に結合するように設計される。特に、gRNAは、遺伝子から変異を除去するためのゲノム編集の目的で、関心対象の疾患関連変異を標的とするように設計されてもよい。あるいは、gRNAは、細胞のゲノムDNAにおける遺伝子中に変異、例えば、挿入、欠失、または置換を導入するためのゲノム編集の目的で、Cas9-gRNA複合体をアレルにターゲティングするために、メジャーアレルまたは野生型アレルの配列に対して相補的な配列を伴って設計することができる。そのような遺伝子改変細胞を、例えば、薬物スクリーニング用の疾患モデルを生成するために用いることができる。
【0102】
ゲノム標的部位は、典型的には、gRNAに対して相補的であるヌクレオチド配列を含み、プロトスペーサー隣接モチーフ(PAM)をさらに含んでもよい。ある特定の態様において、標的部位は、3塩基対PAMに加えて、20~30塩基対を含む。典型的には、PAMの第1のヌクレオチドは、任意のヌクレオチドであることができるが、2つの他のヌクレオチドは、選択される特異的なCas9タンパク質に依存する。例示的なPAM配列は、当業者に公知であり、非限定的に、NNG、NGN、NAG、およびNGGを含み、配列中、Nは任意のヌクレオチドを表す。ある特定の態様において、gRNAによって標的とされるアレルは、アレル内にPAMを作製する変異を含み、該PAMは、アレルに対するCas9-gRNA複合体の結合を促進する。
【0103】
ある特定の態様において、gRNAは、5~50ヌクレオチド長、10~30ヌクレオチド長、15~25ヌクレオチド長、18~22ヌクレオチド長、もしくは19~21ヌクレオチド長、または、例えば、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、もしくは35ヌクレオチド長を含む、述べられた範囲の間の任意の長さである。ガイドRNAは、単一RNA分子中にcrRNAおよびtracrRNA配列を含む単一ガイドRNAであってもよく、またはガイドRNAは、別々のRNA分子中に存在するcrRNAおよびtracrRNA配列を有する2つのRNA分子を含んでもよい。
【0104】
ドナーポリヌクレオチドおよびgRNAは、標準的な技法、例えば、参照により本明細書に組み入れられる米国特許第4,458,066号および同第4,415,732号;Beaucage et al., Tetrahedron (1992) 48:2223-2311;ならびにApplied Biosystems User Bulletin No. 13 (1 April 1987)において開示されるような、ホスホラミダイト化学を介した固相合成によって、容易に合成される。他の化学合成法には、例えば、Narang et al., Meth. Enzymol. (1979) 68:90によって記述されるホスホトリエステル法、およびBrown et al., Meth. Enzymol. (1979) 68:109によって開示されるホスホジエステル法が含まれる。
【0105】
いくつかの例において、細胞の集団は、遺伝子改変細胞を残りの集団から分離することによって、遺伝子改変を含むものが濃縮されてもよい。遺伝子改変細胞の分離は、典型的には、標的遺伝子座で意図した編集と同時に組み込まれた選択可能マーカーの発現に依拠する。第1のHDR段階後に、例えば、遺伝子改変を含む濃縮された細胞の集団を作製するように、細胞を集団から単離するために、陽性選択が行われる。第2のHDR段階後に、例えば選択マーカー発現カセット由来の望まれない配列を依然として含有する細胞を除去するために、陰性選択が行われる。
【0106】
細胞分離は、フローサイトメトリー、蛍光活性化細胞選別(FACS)、磁気活性化細胞選別(MACS)、水簸、免疫精製、および親和性クロマトグラフィーを含むがそれらに限定されない、用いられる選択マーカーに適切な任意の好都合な分離技法によって達成され得る。例えば、蛍光マーカーが用いられる場合は、細胞が、蛍光活性化細胞選別(FACS)によって分離され得るのに対して、細胞表面マーカーが用いられる場合は、細胞は、親和性分離技法、例えば、MACS、親和性クロマトグラフィー、固体マトリックスに付着した親和性試薬での「パンニング」、細胞表面マーカーに特異的な抗体での免疫精製、または他の好都合な技法によって、不均質集団から分離され得る。
【0107】
ある特定の態様において、遺伝子改変細胞の陽性選択または陰性選択は、細胞上の選択マーカー(例えば、ドナーポリヌクレオチドに含まれる選択マーカー発現カセットから生成されるような)に特異的に結合する結合物質を用いて行われる。結合物質の例には、非限定的に、抗体、抗体断片、抗体模倣物、およびアプタマーが含まれる。いくつかの態様において、結合物質は、高い親和性で選択マーカーに結合する。結合物質は、遺伝子改変細胞の液体培養物からの単離を容易にするために、固体支持体上に固定化されていてもよい。例示的な固体支持体には、磁性ビーズ、非磁性ビーズ、スライド、ゲル、膜、およびマイクロタイタープレートウェルが含まれる。
【0108】
ある特定の態様において、結合物質は、細胞上の選択マーカーに特異的に結合する抗体を含む。ポリクローナルおよびモノクローナル抗体、ハイブリッド抗体、変更された抗体、キメラ抗体、およびヒト化抗体、ならびに:ハイブリッド(キメラ)抗体分子(例えば、Winter et al. (1991) Nature 349:293-299;および米国特許第4,816,567号を参照されたい);F(ab')2およびF(ab)断片;Fv分子(非共有結合性へテロ二量体、例えば、Inbar et al. (1972) Proc Natl Acad Sci USA 69:2659-2662;およびEhrlich et al. (1980) Biochem 19:4091-4096を参照されたい);一本鎖Fv分子(sFv)(例えば、Huston et al. (1988) Proc Natl Acad Sci USA 85:5879-5883を参照されたい);ナノボディまたは単一ドメイン抗体(sdAb)(例えば、Wang et al. (2016) Int J Nanomedicine 11:3287-3303、Vincke et al. (2012) Methods Mol Biol 911:15-26を参照されたい);二量体および三量体抗体断片構築物;ミニボディ(例えば、Pack et al. (1992) Biochem 31:1579-1584;Cumber et al. (1992) J Immunology 149B:120-126を参照されたい);ヒト化抗体分子(例えば、Riechmann et al. (1988) Nature 332:323-327;Verhoeyan et al. (1988) Science 239:1534-1536;および1994年9月21日に公開された英国特許公開番号GB 2,276,169を参照されたい);ならびに、そのような分子から得られた任意の機能的断片を含む、任意のタイプの抗体が用いられてもよく、ここで、そのような断片は、親抗体分子の特異的結合特性を保持している(すなわち、細胞上の選択マーカーに特異的に結合する)。
【0109】
他の態様において、結合物質は、細胞上の選択マーカーに特異的に結合するアプタマーを含む。標的抗体アイソタイプに特異的に結合するDNA、RNA、ゼノ核酸(XNA)、またはペプチドアプタマーを含む、任意のタイプのアプタマーが用いられてもよい。そのようなアプタマーは、例えば、コンビナトリアルライブラリをスクリーニングすることによって特定することができる。標的抗体アイソタイプに選択的に結合する核酸アプタマー(例えば、DNAまたはRNAアプタマー)は、インビトロ選択または試験管内進化法(systematic evolution of ligands by exponential enrichment)(SELEX)の反復ラウンドを実施することによって生成することができる。細胞上の選択マーカーに結合するペプチドアプタマーは、コンビナトリアルライブラリから単離され、定方向変異または変異誘発および選択の反復ラウンドによって改善されてもよい。アプタマーを生成する方法の記述については、例えば、その全体が参照により本明細書に組み入れられる、Aptamers: Tools for Nanotherapy and Molecular Imaging (R.N. Veedu ed., Pan Stanford, 2016)、Nucleic Acid and Peptide Aptamers: Methods and Protocols (Methods in Molecular Biology, G. Mayer ed., Humana Press, 2009)、Nucleic Acid Aptamers: Selection, Characterization, and Application (Methods in Molecular Biology, G. Mayer ed., Humana Press, 2016)、Aptamers Selected by Cell-SELEX for Theranostics (W. Tan, X. Fang eds., Springer, 2015)、Cox et al. (2001) Bioorg. Med. Chem. 9(10):2525-2531;Cox et al. (2002) Nucleic Acids Res. 30(20): e108、Kenan et al. (1999) Methods Mol Biol. 118:217-231;Platella et al. (2016) Biochim. Biophys. Acta Nov 16 pii: S0304-4165(16)30447-0、およびLyu et al. (2016) Theranostics 6(9):1440-1452を参照されたい。
【0110】
さらに他の態様において、結合物質は、抗体模倣物を含む。affibody分子(Nygren (2008) FEBS J. 275 (11):2668-2676)、affilin(Ebersbach et al. (2007) J. Mol. Biol. 372 (1):172-185)、アフィマー(affimer)(Johnson et al. (2012) Anal. Chem. 84 (15):6553-6560)、アフィチン(affitin)(Krehenbrink et al. (2008) J. Mol. Biol. 383 (5):1058-1068)、アルファボディ(alphabody)(Desmet et al. (2014) Nature Communications 5:5237)、anticalin(Skerra (2008) FEBS J. 275 (11):2677-2683)、avimer(Silverman et al. (2005) Nat. Biotechnol. 23 (12):1556-1561)、darpin(Stumpp et al. (2008) Drug Discov. Today 13 (15-16):695-701)、fynomer(Grabulovski et al. (2007) J. Biol. Chem. 282 (5):3196-3204)、およびモノボディ(monobody)(Koide et al. (2007) Methods Mol. Biol. 352:95-109)を含むがそれらに限定されない、任意のタイプの抗体模倣物が用いられてもよい。
【0111】
陽性選択においては、選択マーカーを保有する細胞が収集されるのに対して、陰性選択においては、選択マーカーを保有する細胞が細胞集団から除去される。例えば、陽性選択においては、表面マーカーに特異的な結合物質を、固体支持体(例えば、カラムまたは磁性ビーズ)上に固定化し、関心対象の細胞を固体支持体上で収集するために用いることができる。関心対象ではない細胞は、固体支持体に結合しない(例えば、カラムを通り抜けるか、または磁性ビーズに付着しない)。陰性選択においては、結合物質が、関心対象ではない細胞、細胞の集団を枯渇させるために用いられる。関心対象の細胞は、結合物質に結合しない(例えば、カラムを通り抜けるか、または磁性ビーズが除去された後に残る)ものである。
【0112】
死細胞は、死細胞を優先的に染色する色素(例えば、ヨウ化プロピジウム)を使用することによって選択されてもよい。遺伝子改変細胞の生存率に過度に有害ではない任意の技法が、使用されてもよい。
【0113】
所望の遺伝子改変を有する細胞が高度に濃縮されている組成物を、この様式で生成することができる。「高度に濃縮された」により、遺伝子改変細胞が、細胞組成物の70%以上、75%以上、80%以上、85%以上、90%以上、または95%以上、または98%以上であることが意味される。換言すると、組成物は、遺伝子改変細胞の実質的に純粋な組成物であってもよい。
【0114】
本明細書に記載される方法によって生成された遺伝子改変細胞は、直ちに用いられてもよい。あるいは、細胞は、液体窒素温度で凍結され、解凍して用いる前に長い期間保存されてもよい。そのような場合には、細胞は、10% DMSO、50%血清、40%緩衝培地、または、そのような凍結温度で細胞を保存するために当技術分野において一般的に用いられるようないくつかの他の溶液中で凍結され、凍結培養細胞を解凍するために当技術分野において一般的に公知の様式で解凍されてもよい。
【0115】
ある特定の態様において、非相同末端結合(NHEJ)経路の阻害剤が、HDRによって遺伝子改変される細胞の頻度を増加させるために用いられる。NHEJ経路の阻害剤の例には、NHEJ経路における任意のタンパク質構成要素の発現または活性のいずれかを阻害するかまたは妨げる任意の化合物(物質)が含まれる。NHEJ経路のタンパク質構成要素には、Ku70、Ku86、DNAタンパク質キナーゼ(DNA-PK)、Rad50、MRE11、NBS1、DNAリガーゼIV、およびXRCC4が含まれるが、それらに限定されない。例示的な阻害剤は、NHEJ経路の少なくとも1つのタンパク質構成要素(例えば、DNA-PK)を阻害するワートマニンである。別の例示的な阻害剤は、DSBの結合を阻害するScr7(5,6-ビス((E)-ベンジリデンアミノ)-2-メルカプトピリミジン-4-オール)である(Maruyama et al. (2015) Nat. Biotechnol. 33(5):538-542、Lin et al. (2016) Sci. Rep. 6:34531)。RNA干渉もまた、NHEJ経路のタンパク質構成要素(例えば、DNA-PKまたはDNAリガーゼIV)の発現を妨げるために用いられてもよい。例えば、低分子干渉RNA(siRNA)、ヘアピン型RNA、およびsiRNAを形成するためにインビボで切断または解離され得る他のRNAまたはRNA:DNA種が用いられてもよい。あるいは、RS-1などのHDRエンハンサーが、細胞におけるHDRの頻度を増加させるために用いられてもよい(Song et al. (2016) Nat. Commun. 7:10548)。
【0116】
ある特定の態様において、第1のドナーポリヌクレオチドは、ランダムに組み込まれるかまたはエピソーム性である選択マーカーの発現を阻害するステム-ループ構造を含む短鎖ヘアピン型RNA(shRNA)をコードする少なくとも1つの発現カセットをさらに含む。例示的な構築物を
図4Aに示し、ここで、第1のドナーポリヌクレオチドは、shRNAをコードする発現カセットのペアを含み、該ペアの第1の発現カセットは、第1の左ホモロジーアームの5'に位置し、かつ該ペアの第2の発現カセットは、第1の右ホモロジーアームの3'に位置する。
【0117】
本明細書に記載されるような、Cas9ヌクレアーゼ、ドナーポリヌクレオチド、およびガイドRNAを用いる方法段階を、任意の所望の数のDNA改変を提供するために反復することができる。さらに、方法を、細胞のマルチプレックスゲノム編集を提供するために適合させることができる。例えば、別々の遺伝子を特異的に標的とする複数のドナーポリヌクレオチドおよびガイドRNAをプールすることによって、複数の遺伝子を同時に編集することができる。
【0118】
B. ドナーポリヌクレオチド、ガイドRNA、およびCas9をコードする核酸
ある特定の態様において、ドナーポリヌクレオチド、ガイドRNA、および/またはCas9は、インビボでベクターから発現される。「ベクター」とは、関心対象の核酸を細胞の内部に送達するために用いることができる物質の組成物である。ドナーポリヌクレオチド、ガイドRNA、およびCas9は、単一ベクターでまたは複数の別々のベクターにおいて細胞中に導入することができる。ドナーポリヌクレオチド、ガイドRNA、およびCas9ヌクレアーゼを生成し、細胞を遺伝子改変する構築物の能力は、経験的に決定することができる(例えば、遺伝子改変細胞の検出のためのmCherry蛍光マーカーの使用およびtCD19表面マーカーを発現する細胞の免疫磁気分離を記載する実施例1を参照されたい)。
【0119】
直鎖ポリヌクレオチド、イオン性または両親媒性化合物と会合したポリヌクレオチド、プラスミド、およびウイルスを含むがそれらに限定されない多数のベクターが、当技術分野において公知である。したがって、「ベクター」という用語は、自律的に複製するプラスミドまたはウイルスを含む。ウイルスベクターの例には、アデノウイルスベクター、アデノ随伴ウイルスベクター、レトロウイルスベクター、レンチウイルスベクターなどが含まれるが、それらに限定されない。発現構築物は、生存細胞において複製させることができるか、または合成で作製することができる。本出願の目的で、「発現構築物」、「発現ベクター」、および「ベクター」という用語は、一般的な例証となる意味で、本発明の適用を実証するために互換的に用いられ、本発明を限定するようには意図されない。
【0120】
1つの態様において、ドナーポリヌクレオチド、gRNA、またはCas9を発現するための発現ベクターは、ドナーポリヌクレオチド、gRNA、またはCas9をコードするポリヌクレオチドに「機能的に連結された」プロモーターを含む。本明細書において用いられる「機能的に連結された」または「転写制御下の」という句は、プロモーターが、RNAポリメラーゼによる転写の開始およびポリヌクレオチドの発現を制御するためにポリヌクレオチドに関して正確な位置および向きにあることを意味する。
【0121】
ある特定の態様において、関心対象のポリヌクレオチドをコードする核酸は、プロモーターの転写制御下である。「プロモーター」とは、遺伝子の特異的転写を開始するために必要とされる、細胞の合成機構または導入された合成機構によって認識されるDNA配列を指す。プロモーターという用語は、RNAポリメラーゼI、II、またはIIIのための開始部位の周りにクラスター化している転写制御モジュールの群を指すように、本明細書において用いられる。哺乳動物細胞発現のための典型的なプロモーターには、とりわけ、SV40初期プロモーター、CMV最初期プロモーターなどのCMVプロモーター(その全体が参照により本明細書に組み入れられる米国特許第5,168,062号および同第5,385,839号を参照されたい)、マウス乳癌ウイルスLTRプロモーター、アデノウイルス主要後期プロモーター(Ad MLP)、および単純ヘルペスウイルスプロモーターが含まれる。マウスメタロチオネイン遺伝子に由来するプロモーターなどの他の非ウイルスプロモーターもまた、哺乳動物発現のために用いられる。これらのおよび他のプロモーターは、当技術分野において周知の技法を用いて、市販されているプラスミドから取得することができる。例えば、上記のSambrook et al.を参照されたい。構築物の発現レベルを増加させるために、エンハンサーエレメントが、プロモーターに伴って用いられてもよい。例には、Dijkema et al., EMBO J. (1985) 4:761に記述されているようなSV40初期遺伝子エンハンサー、Gorman et al., Proc. Natl. Acad. Sci. USA (1982b) 79:6777に記述されているようなラウス肉腫ウイルスの末端反復配列(LTR)に由来するエンハンサー/プロモーター、および、CMVイントロンA配列に含まれるエレメントなどの、Boshart et al., Cell (1985) 41:521に記述されているようなヒトCMVに由来するエレメントが含まれる。
【0122】
典型的には、転写ターミネーター/ポリアデニル化シグナルもまた、発現構築物中に存在する。そのような配列の例には、上記のSambrook et al.に記述されているようなSV40に由来するもの、およびウシ成長ホルモンターミネーター配列(例えば、米国特許第5,122,458号を参照されたい)が含まれるが、それらに限定されない。加えて、同じものの発現を増強するために、5'-UTR配列を、コード配列に隣り合うように置くことができる。そのような配列は、内部リボソーム進入部位(IRES)を含むUTRを含んでもよい。
【0123】
IRESを含むことにより、ベクターからの1つまたは複数のオープンリーディングフレームの翻訳が可能になる。IRESエレメントは、真核生物リボソーム翻訳開始複合体を誘引し、翻訳開始を促進する。例えば、Kaufman et al., Nuc. Acids Res. (1991) 19:4485-4490;Gurtu et al., Biochem. Biophys. Res. Comm. (1996) 229:295-298;Rees et al., BioTechniques (1996) 20:102-110;Kobayashi et al., BioTechniques (1996) 21:399-402;およびMosser et al., BioTechniques (1997 22 150-161を参照されたい。数多くのIRES配列が公知であり、多種多様なウイルスに由来する配列、例えば、脳心筋炎ウイルス(EMCV)UTRなどのピコルナウイルスのリーダー配列(Jang et al. J. Virol. (1989) 63:1651-1660)、ポリオリーダー配列、A型肝炎ウイルスリーダー、C型肝炎ウイルスIRES、ヒトライノウイルス2型IRES(Dobrikova et al., Proc. Natl. Acad. Sci. (2003) 100(25):15125-15130)、口蹄疫ウイルス由来のIRESエレメント(Ramesh et al., Nucl. Acid Res. (1996) 24:2697-2700)、ジアルジアウイルスIRES(Garlapati et al., J. Biol. Chem. (2004) 279(5):3389-3397)など由来のものが含まれる。酵母由来のIRES配列、ならびに1型ヒトアンジオテンシンII受容体IRES(Martin et al., Mol. Cell Endocrinol. (2003) 212:51-61)、線維芽細胞増殖因子IRES(FGF-1 IRESおよびFGF-2 IRES、Martineau et al. (2004) Mol. Cell. Biol. 24(17):7622-7635)、血管内皮増殖因子IRES(Baranick et al. (2008) Proc. Natl. Acad. Sci. U.S.A. 105(12):4733-4738、Stein et al. (1998) Mol. Cell. Biol. 18(6):3112-3119、Bert et al. (2006) RNA 12(6):1074-1083)、およびインスリン様成長因子2 IRES(Pedersen et al. (2002) Biochem. J. 363(Pt 1):37-44)を含むがそれらに限定されない様々な非ウイルスIRES配列もまた、本明細書において用いられる。これらのエレメントは、例えば、Clontech(Mountain View, CA)、Invivogen(San Diego, CA)、Addgene(Cambridge, MA)、およびGeneCopoeia(Rockville, MD)によって販売されるプラスミドにおいて、容易に商業的に入手可能である。また、実験的に検証されたIRES構造のデータベースであるIRESite(iresite.org)も参照されたい。IRES配列は、例えば、発現カセットから複数の選択マーカーを、または1つもしくは複数の選択マーカーと組み合わせてCas9を発現するために、ベクター中に含まれてもよい。
【0124】
あるいは、ウイルスT2Aペプチドをコードするポリヌクレオチドを、単一のベクターからの複数のタンパク質産物(例えば、Cas9、1つまたは複数の選択マーカー)の生成を可能にするために用いることができる。2Aリンカーペプチドは、マルチシストロン性構築物においてコード配列の間に挿入される。自己切断性である2Aペプチドは、マルチシストロン性構築物から同時発現されるタンパク質が、当モルレベルで生成されることを可能にする。口蹄疫ウイルス、ウマ鼻炎Aウイルス、トセア・アシグナ(Thosea asigna)ウイルス、およびブタテッショウウイルス-1に由来する2Aペプチドを含むがそれらに限定されない、種々のウイルス由来の2Aペプチドが、用いられてもよい。例えば、その全体が参照により本明細書に組み入れられるKim et al. (2011) PLoS One 6(4):e18556、Trichas et al. (2008) BMC Biol. 6:40、Provost et al. (2007) Genesis 45(10):625-629、Furler et al. (2001) Gene Ther. 8(11):864-873を参照されたい。
【0125】
発現ベクターが細胞中に導入され得る、複数のやり方がある。ある特定の態様において、発現構築物は、ウイルス、またはウイルスゲノムに由来する操作された構築物を含む。複数のウイルスベースのシステムが、哺乳動物細胞中への遺伝子移入のために開発されている。これらには、アデノウイルス、レトロウイルス(γ-レトロウイルスおよびレンチウイルス)、ポックスウイルス、アデノ随伴ウイルス、バキュロウイルス、および単純ヘルペスウイルスが含まれる(例えば、その全体が参照により本明細書に組み入れられるWarnock et al. (2011) Methods Mol. Biol. 737:1-25;Walther et al. (2000) Drugs 60(2):249-271;およびLundstrom (2003) Trends Biotechnol. 21(3):117-122を参照されたい)。受容体媒介エンドサイトーシスを介して細胞に入る、宿主細胞ゲノム中に組み込まれて、安定にかつ効率的にウイルス遺伝子を発現する、ある特定のウイルスの能力により、それらは、哺乳動物細胞中への外来遺伝子の移入のための魅力的な候補になっている。
【0126】
例えば、レトロウイルスは、遺伝子送達システムのための好都合なプラットフォームを提供する。当技術分野において公知の技法を用いて、選択された配列を、ベクター中に挿入して、レトロウイルス粒子にパッケージングすることができる。組換えウイルスを次いで、単離して、インビボまたはエクスビボのいずれかで対象の細胞に送達することができる。複数のレトロウイルスシステムが、記述されている(米国特許第5,219,740号;Miller and Rosman (1989) BioTechniques 7:980-990;Miller, A. D. (1990) Human Gene Therapy 1:5-14;Scarpa et al. (1991) Virology 180:849-852;Burns et al. (1993) Proc. Natl. Acad. Sci. USA 90:8033-8037;Boris-Lawrie and Temin (1993) Cur. Opin. Genet. Develop. 3:102-109;およびFerry et al. (2011) Curr. Pharm. Des. 17(24):2516-2527)。レンチウイルスは、分裂細胞および非分裂細胞の両方に感染することができるため、哺乳動物細胞にポリヌクレオチドを送達するのに特に有用である、レトロウイルスのクラスである(例えば、参照により本明細書に組み入れられるLois et al (2002) Science 295:868-872;Durand et al. (2011) Viruses 3(2):132-159を参照されたい)。
【0127】
複数のアデノウイルスベクターもまた、記述されている。宿主ゲノム中に組み込まれるレトロウイルスとは異なり、アデノウイルスは、染色体外に存在し、したがって、挿入変異誘発に伴う危険性を最小化する(Haj-Ahmad and Graham, J. Virol. (1986) 57:267-274;Bett et al., J. Virol. (1993) 67:5911-5921;Mittereder et al., Human Gene Therapy (1994) 5:717-729;Seth et al., J. Virol. (1994) 68:933-940;Barr et al., Gene Therapy (1994) 1:51-58;Berkner, K. L. BioTechniques (1988) 6:616-629;およびRich et al., Human Gene Therapy (1993) 4:461-476)。加えて、種々のアデノ随伴ウイルス(AAV)ベクターシステムが、遺伝子送達のために開発されている。AAVベクターは、当技術分野において周知の技法を用いて、容易に構築することができる。例えば、米国特許第5,173,414号および同第5,139,941号;国際公開番号WO 92/01070(1992年1月23日に公開)およびWO 93/03769(1993年3月4日に公開);Lebkowski et al., Molec. Cell. Biol. (1988) 8:3988-3996;Vincent et al., Vaccines 90 (1990) (Cold Spring Harbor Laboratory Press);Carter, B. J. Current Opinion in Biotechnology (1992) 3:533-539;Muzyczka, N. Current Topics in Microbiol. and Immunol. (1992) 158:97-129;Kotin, R. M. Human Gene Therapy (1994) 5:793-801;Shelling and Smith, Gene Therapy (1994) 1:165-169;ならびにZhou et al., J. Exp. Med. (1994) 179:1867-1875を参照されたい。
【0128】
本発明のポリヌクレオチドを送達するのに有用な別のベクターシステムは、Small, Jr., P. A., et al.(参照により本明細書に組み入れられる、1997年10月14日に発行された米国特許第5,676,950号)によって記述されている、腸管に投与される組換えポックスウイルスワクチンである。
【0129】
関心対象の核酸分子を送達するために用いられる追加的なウイルスベクターには、ワクシニアウイルスおよびトリポックスウイルスを含む、ポックスファミリーのウイルスに由来するものが含まれる。例として、関心対象の核酸分子(例えば、ドナーポリヌクレオチド、gRNA、またはCas9)を発現するワクシニアウイルス組換え体を、以下のように構築することができる。特定の核酸配列をコードするDNAを、最初に、ワクシニアプロモーターおよび隣接するワクシニアDNA配列、例えばチミジンキナーゼ(TK)をコードする配列に隣り合うように、適切なベクター中に挿入する。このベクターを次に、ワクシニアを同時に感染させる細胞にトランスフェクトするために用いる。相同組換えが、ワクシニアプロモーター+関心対象の配列をコードする遺伝子をウイルスゲノム中に挿入するように働く。結果として生じたTK組換え体を、5-ブロモデオキシウリジンの存在下で細胞を培養し、それに対して耐性のウイルスプラークを採取することによって、選択することができる。
【0130】
あるいは、鶏痘ウイルスおよびカナリア痘ウイルスなどのアビポックスウイルスもまた、関心対象の核酸分子を送達するために使用され得る。アビポックス属のメンバーは、感受性の鳥類の種においてのみ生産的に複製することができ、したがって哺乳動物細胞において感染性ではないため、アビポックスベクターの使用は、ヒトおよび他の哺乳動物の種において特に望ましい。組換えアビポックスウイルスを生成するための方法は、当技術分野において公知であり、ワクシニアウイルスの生成に関する上記のような遺伝子組み換えを使用する。例えば、WO 91/12882;WO 89/03429;およびWO 92/03545を参照されたい。
【0131】
Michael et al., J. Biol. Chem. (1993) 268:6866-6869およびWagner et al., Proc. Natl. Acad. Sci. USA (1992) 89:6099-6103に記述されているアデノウイルスキメラベクターなどの、分子コンジュゲートベクターもまた、遺伝子送達のために使用され得る。
【0132】
シンドビスウイルス(SIN)、セムリキ森林ウイルス(SFV)、およびベネズエラウマ脳炎ウイルス(VEE)に由来するベクターなどであるがそれらに限定されないアルファウイルス属のメンバーもまた、本発明のポリヌクレオチドを送達するためのウイルスベクターとして用いられる。本発明の方法の実践に有用なシンドビスウイルス由来のベクターの記述については、Dubensky et al. (1996) J. Virol. 70:508-519;および国際公開番号WO 95/07995、WO 96/17072;ならびに、両方とも参照により本明細書に組み入れられる1998年12月1日に発行されたDubensky, Jr., T. W., et al.、米国特許第5,843,723号、および1998年8月4日に発行されたDubensky, Jr., T. W.、米国特許第5,789,245号を参照されたい。特に好ましいのは、シンドビスウイルスおよびベネズエラウマ脳炎ウイルスに由来する配列から構成されるキメラアルファウイルスベクターである。例えば、その全体が参照により本明細書に組み入れられるPerri et al. (2003) J. Virol. 77: 10394-10403、ならびに国際公開番号WO 02/099035、WO 02/080982、WO 01/81609、およびWO 00/61772を参照されたい。
【0133】
ワクシニアベースの感染/トランスフェクションシステムは、宿主細胞における関心対象のポリヌクレオチド(例えば、miR-181またはその模倣物もしくは阻害剤)の誘導性、一過性発現を提供するために好都合に使用され得る。このシステムにおいては、細胞に、最初に、バクテリオファージT7 RNAポリメラーゼをコードするワクシニアウイルス組換え体をインビトロで感染させる。このポリメラーゼは、T7プロモーターを有する鋳型のみを転写する点で、精妙な特異性を示す。感染後、細胞に、T7プロモーターによって駆動される関心対象のポリヌクレオチドをトランスフェクトする。ワクシニアウイルス組換え体から細胞質において発現されたポリメラーゼが、トランスフェクトされたDNAをRNAに転写する。方法は、大量のRNAの高レベル、一過性の細胞質生成を提供する。例えば、Elroy-Stein and Moss, Proc. Natl. Acad. Sci. USA (1990) 87:6743-6747;Fuerst et al., Proc. Natl. Acad. Sci. USA (1986) 83:8122-8126を参照されたい。
【0134】
ワクシニアもしくはアビポックスウイルス組換え体の感染、または他のウイルスベクターを用いた核酸の送達に対する代替的なアプローチとして、宿主細胞中への導入後に高レベル発現をもたらす増幅システムを用いることができる。具体的には、T7 RNAポリメラーゼのコード領域に先行するT7 RNAポリメラーゼプロモーターを操作することができる。この鋳型に由来するRNAの翻訳は、次により多くの鋳型を転写することになるT7 RNAポリメラーゼを生じる。付随して、その発現がT7プロモーターの制御下であるcDNAが存在する。したがって、増幅鋳型RNAの翻訳から生じたT7 RNAポリメラーゼのうちのいくらかは、所望の遺伝子の転写をもたらすことになる。いくらかのT7 RNAポリメラーゼは増幅を開始するために必要とされるため、T7 RNAポリメラーゼを、転写反応をプライミングするための鋳型と共に細胞中に導入することができる。ポリメラーゼは、タンパク質として、またはRNAポリメラーゼをコードするプラスミド上で導入することができる。T7システムおよび細胞を形質転換するためのその使用のさらなる考察については、例えば、国際公開番号WO 94/26911;Studier and Moffatt, J. Mol. Biol. (1986) 189:113-130;Deng and Wolff, Gene (1994) 143:245-249;Gao et al., Biochem. Biophys. Res. Commun. (1994) 200:1201-1206;Gao and Huang, Nuc. Acids Res. (1993) 21:2867-2872;Chen et al., Nuc. Acids Res. (1994) 22:2114-2120;および米国特許第5,135,855号を参照されたい。
【0135】
センスまたはアンチセンスの遺伝子構築物の発現をもたらすために、発現構築物が細胞中に送達されなければならない。この送達は、細胞株を形質転換するための実験手順におけるようにインビトロで、またはある特定の疾患状態の処置におけるようにインビボもしくはエクスビボで達成されてもよい。送達のための1つの機構は、発現構築物が感染性ウイルス粒子中にカプセル化されているウイルス感染を介する。
【0136】
培養哺乳動物細胞中への発現構築物の移入のためのいくつかの非ウイルス性の方法もまた、本発明によって企図される。これらには、リン酸カルシウム沈殿、DEAE-デキストラン、エレクトロポレーション、直接マイクロインジェクション、DNAロードリポソーム、lipofectamine-DNA複合体、細胞超音波処理、高速微小発射物を用いた遺伝子衝撃、および受容体媒介トランスフェクションの使用が含まれる(例えば、参照により本明細書に組み入れられるGraham and Van Der Eb (1973) Virology 52:456-467;Chen and Okayama (1987) Mol. Cell Biol. 7:2745-2752;Rippe et al. (1990) Mol. Cell Biol. 10:689-695;Gopal (1985) Mol. Cell Biol. 5:1188-1190;Tur-Kaspa et al. (1986) Mol. Cell. Biol. 6:716-718;Potter et al. (1984) Proc. Natl. Acad. Sci. USA 81:7161-7165);Harland and Weintraub (1985) J. Cell Biol. 101:1094-1099);Nicolau and Sene (1982) Biochim. Biophys. Acta 721:185-190;Fraley et al. (1979) Proc. Natl. Acad. Sci. USA 76:3348-3352;Fechheimer et al. (1987) Proc Natl. Acad. Sci. USA 84:8463-8467;Yang et al. (1990) Proc. Natl. Acad. Sci. USA 87:9568-9572;Wu and Wu (1987) J. Biol. Chem. 262:4429-4432;Wu and Wu (1988) Biochemistry 27:887-892を参照されたい)。これらの技法のうちのいくつかは、インビボまたはエクスビボでの使用のために成功裡に適合され得る。
【0137】
ひとたび発現構築物が細胞中に送達されると、関心対象の遺伝子をコードする核酸は、様々な部位に位置づけられ、発現され得る。ある特定の態様において、遺伝子をコードする核酸は、細胞のゲノム中に安定に組み込まれ得る。この組み込みは、相同組換えを介して同起源の位置および向きであってもよく(遺伝子置換)、またはランダムな非特異的な位置において組み込まれてもよい(遺伝子強化)。またさらなる態様において、核酸は、DNAの別々のエピソーム性セグメントとして細胞において安定に維持され得る。そのような核酸セグメント、すなわち「エピソーム」は、宿主細胞周期から独立した、またはそれと同調した維持および複製を可能にするのに十分な配列をコードする。発現構築物がいかに細胞に送達されるか、および細胞においてどこに核酸がとどまるかは、使用される発現構築物のタイプに依存する。
【0138】
本発明のまた別の態様において、発現構築物は、単純に裸の組換えDNAまたはプラスミドからなってもよい。構築物の移入は、物理的にまたは化学的に細胞膜を透過化処理する上述の方法のいずれかによって行われてもよい。これは特に、インビトロでの移入に適用可能であるが、インビボでの使用にも同様に適用され得る。Dubensky et al.(Proc. Natl. Acad. Sci. USA (1984) 81:7529-7533)は、成体および新生児マウスの肝臓および脾臓中へのリン酸カルシウム沈殿物の形態でのポリオーマウイルスDNAの注射に成功し、活性ウイルスの複製および急性感染を実証した。Benvenisty and Neshif(Proc. Natl. Acad. Sci. USA (1986) 83:9551-9555)もまた、リン酸カルシウム沈殿プラスミドの直接腹腔内注射が、トランスフェクトされた遺伝子の発現を結果としてもたらすことを実証した。関心対象の遺伝子をコードするDNAはまた、インビボで同様の様式で移入されてもよく、遺伝子産物を発現し得ることが構想されている。
【0139】
さらに別の態様において、裸のDNA発現構築物が、粒子衝撃によって細胞中に移入されてもよい。この方法は、DNAコーティング微小発射物を高速に加速して、それらが細胞膜を突き抜け、細胞を死滅させずに細胞に入ることを可能にする能力に依存している(Klein et al. (1987) Nature 327:70-73)。小さな粒子を加速するためのいくつかの装置が、開発されている。1つのそのような装置は、次に原動力を提供する電流を生じるための高圧放電に依拠する(Yang et al. (1990) Proc. Natl. Acad. Sci. USA 87:9568-9572)。微小発射物は、タングステンまたは金ビーズなどの生物学的に不活性の物質からなってもよい。
【0140】
さらなる態様において、発現構築物は、リポソームを用いて送達されてもよい。リポソームは、リン脂質二重層膜および内部水性媒体を特徴とする小胞構造である。多重膜リポソームは、水性媒体によって分離された複数の脂質層を有する。それらは、リン脂質を過剰な水溶液に懸濁した場合に自然的に形成する。脂質構成要素は、閉じた構造の形成の前に自己再配置を受け、脂質二重層の間に水および溶解した溶質を閉じ込める(Ghosh and Bachhawat (1991) Liver Diseases, Targeted Diagnosis and Therapy Using Specific Receptors and Ligands, Wu et al. (Eds.), Marcel Dekker, NY, 87-104)。また、lipofectamine-DNA複合体の使用も企図される。
【0141】
本発明のある特定の態様において、リポソームを、血球凝集性ウイルス(HVJ)と複合体形成させてもよい。これは、細胞膜との融合を容易にし、リポソームカプセル化DNAの細胞進入を促進することが示されている(Kaneda et al. (1989) Science 243:375-378)。他の態様において、リポソームを、核内非ヒストン染色体タンパク質(HMG-I)と複合体形成させるかまたはそれと共に使用してもよい(Kato et al. (1991) J. Biol. Chem. 266(6):3361-3364)。またさらなる態様において、リポソームを、HVJおよびHMG-Iの両方と複合体形成させるかまたはそれと共に使用してもよい。そのような発現構築物が、インビトロおよびインビボで核酸の移入および発現において成功裡に使用されているという点において、それらは本発明に適用可能である。細菌プロモーターがDNA構築物において使用される場合は、リポソーム内に適切な細菌ポリメラーゼを含むこともまた望ましい。
【0142】
細胞中に核酸を送達するために使用することができる他の発現構築物は、受容体媒介送達ビヒクルである。これらは、ほぼすべての真核細胞生物における、受容体媒介エンドサイトーシスによる巨大分子の選択的取り込みを利用する。種々の受容体の細胞型特異的分布のために、送達は、非常に特異的であることができる(Wu and Wu (1993) Adv. Drug Delivery Rev. 12:159-167)。
【0143】
受容体媒介遺伝子ターゲティングビヒクルは概して、細胞受容体特異的リガンドおよびDNA結合物質の2つの構成要素からなる。いくつかのリガンドが、受容体媒介遺伝子移入のために用いられている。最も広範に特徴決定されているリガンドは、アシアロオロソムコイド(ASOR)およびトランスフェリンである(例えば、上記のWu and Wu (1987);Wagner et al. (1990) Proc. Natl. Acad. Sci. USA 87(9):3410-3414を参照されたい)。最近、ASORと同じ受容体を認識する合成ネオ糖タンパク質が、遺伝子送達ビヒクルとして用いられており(Ferkol et al. (1993) FASEB J. 7:1081-1091;Perales et al. (1994) Proc. Natl. Acad. Sci. USA 91(9):4086-4090)、上皮成長因子(EGF)もまた、扁平上皮癌細胞に遺伝子を送達するために用いられている(Myers, EPO 0273085)。
【0144】
他の態様において、送達ビヒクルは、リガンドおよびリポソームを含んでもよい。例えば、Nicolau et al.(Methods Enzymol. (1987) 149:157-176)は、リポソーム中に組み入れられたラクトシルセラミド、ガラクトース末端アシアロガングリオシド(asialganglioside)を使用し、肝細胞によるインスリン遺伝子の取り込みの増加を観察した。したがって、特定の遺伝子をコードする核酸はまた、リポソームを伴うかまたは伴わない任意の数の受容体-リガンドシステムによって、細胞中に特異的に送達され得ることが実行可能である。また、細胞上の表面抗原に対する抗体も、ターゲティング部分として同様に使用され得る。
【0145】
特定の例において、ドナーポリヌクレオチド、gRNA、またはCas9をコードする組換えポリヌクレオチドは、カチオン性脂質と組み合わせて投与されてもよい。カチオン性脂質の例には、lipofectin、DOTMA、DOPE、およびDOTAPが含まれるが、それらに限定されない。参照により具体的に組み入れられるWO/0071096の公報は、遺伝子治療のために効果的に用いることができるDOTAP:コレステロールまたはコレステロール誘導体製剤などの、様々な製剤を記述している。他の開示もまた、ナノ粒子を含む様々な脂質またはリポソーム製剤、および投与の方法を考察し;これらには、それらが製剤、ならびに核酸の投与および送達の他の関連する局面を開示する程度まで参照により具体的に組み入れられる米国特許出願公開第20030203865号、同第20020150626号、同第20030032615号、および同第20040048787号が含まれるが、それらに限定されない。粒子を形成するために用いられる方法もまた、それらの局面について参照により組み入れられる米国特許第5,844,107号、同第5,877,302号、同第6,008,336号、同第6,077,835号、同第5,972,901号、同第6,200,801号、および同第5,972,900号において開示されている。
【0146】
ある特定の態様において、遺伝子移入は、エクスビボ条件下でより容易に行われ得る。エクスビボ遺伝子治療とは、対象からの細胞の単離、インビトロでの細胞中への核酸の送達、および次いで、改変された細胞の対象中への返却を指す。これは、細胞を含む生物学的試料の対象からの収集を含み得る。例えば、血液は、静脈穿刺によって取得することができ、固形組織試料は、当技術分野において周知の方法にしたがって、外科的技法によって取得することができる。
【0147】
常にではないが通常、細胞を受ける対象(すなわち、レシピエント)はまた、それから細胞が採集されるかまたは取得される対象でもあり、これは、供与される細胞が自己由来である利点を提供する。しかし、細胞を、別の対象(すなわち、ドナー)、ドナー由来の細胞の培養物から、または樹立された細胞培養株から取得することができる。細胞は、処置されるべき対象と同じ種または異なる種から取得されてもよいが、好ましくは同じ種のものであり、より好ましくは対象と同じ免疫学的プロファイルのものである。そのような細胞を、例えば、近親者または適合ドナー由来の細胞を含む生物学的試料から取得し、次いで(例えば、ドナーポリヌクレオチド、gRNA、またはCas9をコードする)核酸をトランスフェクトし、例えば、疾患または状態の処置のためにゲノム改変の必要がある対象に投与することができる。
【0148】
C. キット
第1および第2のHDR段階のためのドナーDNAおよびガイドRNA、ならびにCas9を含む上記の試薬は、本明細書に記載されるようなスカーレスゲノム改変のための適している説明書および他の必要な試薬と共に、キットにおいて提供することができる。キットはまた、ゲノム改変のための細胞、細胞の陽性選択および陰性選択のための結合物質、およびトランスフェクション剤も含有し得る。キットは標準的に、別々の容器に、ドナーDNA、ガイドRNA、Cas9、および必要とされる他の試薬を含有する。本明細書に記載されるようなゲノム編集を実施するための説明書(例えば、書面、CD-ROM、DVD、Blu-ray、フラッシュドライブ、デジタルダウンロードなど)が通常、キットに含まれる。キットはまた、用いられる特定のアッセイに応じて、他のパッケージングされた試薬および材料(すなわち、洗浄緩衝液など)も含有することができる。本明細書に記載されるような細胞のゲノム編集は、これらのキットを用いて実施することができる。
【0149】
別の態様において、キットは、UbCプロモーター、mCherryをコードするポリヌクレオチド、T2Aペプチドをコードするポリヌクレオチド、切断型CD19(tCD19)をコードするポリヌクレオチド、およびポリアデニル化配列を含む選択マーカー発現カセットを含む、第1のドナーポリヌクレオチドを含む。1つの態様において、ドナーDNAは、SEQ ID NO:1の配列、またはそれに対して少なくとも約80~100%の配列同一性を、この範囲内の任意のパーセント同一性、例えば、それに対して81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%の配列同一性を含めて示す配列を含む、選択マーカー発現カセットを含み、Cas9媒介HDRによって標的部位で細胞のゲノムDNA中に組み込まれた第1のドナーポリヌクレオチドを有する細胞を、発現カセットによってコードされる選択マーカーの陽性選択によって特定することができる。
【0150】
別の態様において、キットは、SEQ ID NO:2の配列またはSEQ ID NO:2の配列に対して少なくとも95%の同一性を有する配列を含むポリヌクレオチドを含む、第2のドナーポリヌクレオチドを含み、第2のドナーポリヌクレオチドを、組み込まれた第1のドナーポリヌクレオチドの選択マーカー発現カセットを除去するために、Cas9媒介HDRによって細胞の改変ゲノムDNA(すなわち、組み込まれた第1のドナーポリヌクレオチドを伴う)中に組み込むことができる。
【0151】
ある特定の態様において、キットにおける第1のドナーポリヌクレオチド、第2のドナーポリヌクレオチド、第1のガイドRNA、第2のガイドRNA、およびCas9のうちの1つまたは複数は、ベクター、例えばプラスミドまたはウイルスベクターによって提供される。別の態様において、第1のガイドRNAおよびCas9は、単一のベクターまたは複数のベクターによって提供される。別の態様において、第2のドナーポリヌクレオチド、第2のガイドRNA、およびCas9は、単一のベクターまたは複数のベクターによって提供される。
【0152】
D. 応用
本発明のスカーレスゲノム編集法は、基礎研究および開発ならびに再生医療において多数の応用を見出す。本方法は、細胞のゲノムDNAにおける任意の遺伝子中に変異(例えば、挿入、欠失、または置換)を導入するために使用され得る。例えば、本明細書に記載される方法は、遺伝子ノックアウトの効果を決定するため、または公知の疾患を引き起こす変異の効果を研究するために、細胞における遺伝子の不活性化に使用され得る。あるいは、本明細書に記載される方法は、細胞のゲノムDNAにおける遺伝子からの変異、例えば疾患を引き起こす変異の除去のために使用され得る。
【0153】
特に、本明細書に記載されるようなスカーレスゲノム編集は、所望の特徴を有する細胞株を開発するために使用され得る。本方法は、例えば、ヒトES/iPS細胞における遺伝子疾患モデルの開発、またはヒトES/iPS細胞に対する分化マーカー遺伝子の付加において使用され得る。加えて、本方法は、トランスジェニック動物の作製、所望の部位での細胞に対するレポーター遺伝子の付加、または細胞に対して所望の特性、例えば安全システム、強化された効力、可制御性、および/もしくは改善された移植片生存を付与するゲノム改変のために使用され得る。
【0154】
ある特定の局面において、本発明の方法は、本明細書に記載されるようなゲノム改変によって、個体において疾患を改善、処置、または阻止するために使用され得る。例えば、アレルは、疾患に対する個体の感受性を増加させることによって、または疾患に対する直接の原因寄与物であることによって、疾患に寄与する可能性がある。したがって、アレルの配列を変化させることによって、疾患が改善、処置、または阻止され得る。個体は、哺乳動物または他の動物、好ましくはヒトであり得る。
【0155】
鎌状赤血球貧血、血友病、重症複合免疫不全症(SCID)、テイ-サックス病、デュシェンヌ型筋ジストロフィー、ハンチントン病、α地中海貧血、およびレッシュ-ナイハン症候群を含む、3,000を超える疾患が、変異によって引き起こされる。したがって、すべてのそのような遺伝子疾患は、本明細書に記載されるようなスカーレスゲノム編集による、細胞における遺伝子欠損の修正から恩恵を受け得る。本発明の方法は、ゲノム改変によって修正された細胞が変異体細胞を上回る有意な選択的利点を有する疾患に特に適しているが、ゲノム改変によって修正された細胞が変異体細胞を上回る有意な選択的利点を有さない疾患にも有用であり得る。
【0156】
ある特定の態様において、本方法は、対象を感染性疾患に対して感受性にするゲノム標的配列を変更するために用いられてもよい。例えば、多くのウイルスおよび細菌病原体は、細胞表面タンパク質および細胞内タンパク質のセットに結合し、かつ動員することによって、細胞に入る。遺伝子ターゲティングが、そのような結合部位または進入機構を排除するためまたは減衰させるために用いられてもよい。
【0157】
本明細書に記載されるある特定の方法は、インビトロまたはエクスビボで細胞に適用されてもよい。あるいは、方法は、インビボでゲノム改変をもたらすように対象に適用されてもよい。ドナーポリヌクレオチド、ガイドRNA、およびCas9、またはそれらをコードするベクターを、当技術分野において概して公知の投与の経路(例えば、非経口、粘膜、経鼻、注射、全身、インプラント、腹腔内、経口、皮内、経皮、筋肉内、点滴および/またはボーラス注射を含む静脈内、皮下、局所、硬膜外、頬側、直腸、膣など)を用いて個体中に導入することができる。ある特定の局面において、本発明のドナーポリヌクレオチド、ガイドRNA、Cas9、およびベクターは、適している薬学的に許容される担体(賦形剤)、例えば、食塩水、滅菌水、デキストロース、グリセロール、エタノール、リンガー液、等張塩化ナトリウム溶液、およびそれらの組み合わせと組み合わせて、製剤化することができる。製剤は、投与の様式に適さなければならず、当技術分野の技能内で申し分ない。投与の様式は、好ましくは、改変されるべき標的細胞の場所である。
【0158】
ドナーポリヌクレオチド、ガイドRNA、およびCas9、またはそれらをコードするベクターは、単独でまたは他の治療剤と共に、個体に投与され得る。これらの様々なタイプの治療剤は、同じ製剤においてまたは別々の製剤において投与され得る。投与の頻度を含む、個体に投与されるドナーポリヌクレオチド、ガイドRNA、およびCas9、またはそれらをコードするベクターの投薬量は、投与の様式および経路;レシピエントのサイズ、年齢、性別、健康、体重、および食事;処置されている疾患または障害の症状の性質および程度;併用処置の種類、処置の頻度、および所望の効果;製剤の性質;ならびに担当医の判断を含む、様々な要因に応じて変動するであろう。これらの投薬量レベルにおける変動は、当技術分野において十分理解されているように、最適化のための標準的な経験的ルーチンを用いて調整することができる。
【実施例0159】
III. 実験
以下は、本発明を実施するための具体的な態様の実施例である。実施例は、例証目的でのみ提供され、決して本発明の範囲を限定するようには意図されない。
【0160】
用いられる数(例えば、量、温度など)に関しては精度を確保するように努力されているが、当然、いくらかの実験誤差および偏差は許容されるべきである。
【0161】
実施例1
ヒト多能性幹細胞における高効率スカーレスゲノム編集
本発明者らの方法において、本発明者らは、単一ヌクレオチド変化またはより大きなDNA断片(レポーター遺伝子など)の挿入のいずれかを作製しながらINDELを作製することなく、いずれか一方または両方のアレル上のスカーレス編集を可能にする2段階HRアプローチを、ヒト胚性幹細胞(ESC)および人工多能性幹細胞(iPSC)の両方において4つの遺伝子に適用した。
【0162】
以前のスカーレス編集法の限界を打破するために、本発明者らは、Cas9/gRNAシステムを用いた2段階HR戦略と、磁性ビーズを用いた陽性-陰性選択との組み合わせを使用した(
図1A~1C)。概念実証として、本発明者らは、ディジョージ症候群としても公知の22q11.2欠失症候群を引き起こす、cDNAのヌクレオチド928位でのTBX1内の点変異(c.928 G>A)をヒトESCにおいて導入した(Yagi et al. Lancet 362, 1366-1373 (2003))。TBX1 c.928 Gの1kb以内にはTTAA部位がないため、この遺伝子座の編集は、piggyBacシステムを用いて可能ではない。本発明者らの方法のために、本発明者らは、hESCに、S. ピオゲネスCas9(Cas9)およびTBX1 c.928 G近くを標的とするガイドRNA(gRNA)を同時発現するプラスミドをトランスフェクトした(
図6A)。Cas9/gRNAプラスミドに加えて、本発明者らはまた、Cas9-gRNA複合体によって導入されるDSBの後に、修復鋳型として用いられるドナーDNAを保有するプラスミドもトランスフェクトした。ドナー鋳型はまた、左ホモロジーアームと右ホモロジーアームとの間でマーカーとして働くようにヒトUbCプロモーターの制御下でmCherryおよび切断型CD19(tCD19)を発現する、2シストロン性カセットも含有する(
図1B)。mCherryおよびtCD19はエピソーム性に発現されるため、トランスフェクション後6日以内に2.1%まで低減する、mCherryの一過性発現が観察される(
図2A)。したがって、トランスフェクション後6日目に、本発明者らは、磁性ビーズとコンジュゲートされた抗CD19を用いた磁気補助細胞分離(MACS)選択によって、tCD19陽性細胞を精製した(
図2B)。細胞を次いで、単一細胞クローニングのために低密度(100細胞/cm
2)でプレーティングした。培養においてさらに8日後に、明るいかまたは薄暗いmCherry蛍光を有するコロニーが観察された(
図2C)。これらの蛍光細胞におけるTBX1の遺伝子型判定により、明るいmCherry発現を有する11クローンのうち9個が、意図したTBX1部位中に両アレル編集を所有することが明らかになった(
図2D)。本発明者らはまた、薄暗いmCherry発現を有する3クローンも採取し、そのうちのすべては、意図した遺伝子座での本発明者らのマーカーの単一アレル挿入を示した。さらなる確認のために、本発明者らは、UbCプロモーターのddPCR定量によって、ゲノムに挿入されたターゲティングベクターのコピー数を検証した。明るいコロニーはすべて、4コピーのUbCプロモーターを含有していた(ユビキチン遺伝子座での内在性の2コピーのUbCプロモーター+本発明者らの標的化遺伝子座での外来性の2コピーに由来する、
図2E)。これは、11クローンのうち9個が、ランダムな組み込みを伴わずに正確に標的化されたことを示す。本発明者らの仮説に沿って、薄暗いコロニーはすべて、内在性の2コピー+TBX1内の単一アレル編集事象からの1つに由来する、3コピーのUbCプロモーターを含有していた。
【0163】
第1ラウンドのMACS選択の後に、スカーレス両アレル編集および単一アレル編集を有する細胞を生じる本発明者らの方法の能力を実証するために、本発明者らは、両アレル性に編集されたクローン2番および単一アレル性に編集されたクローン13番において第2ラウンドのHRを行った。これは、挿入されたマーカーのみを標的とするカスタムgRNAと共にCas9を発現するプラスミドをトランスフェクトすることによって、以前のように行った(ガイド2、
図6A)。ガイド2は、生物情報学解析に基づいて高い特異性を有するように設計され、マーカー遺伝子とホモロジーアームとの間の接合部のみを標的とし、したがって、ヒトゲノムにおける内在性標的部位を有さない。本発明者らは、スカーレスのマーカーを含まない編集事象を生じるであろう、ホモロジーアームと共にTBX1 c.G928 G>A変異を含有するドナー鋳型を保有するプラスミドを、同時にトランスフェクトした(
図1B)。この第2の編集を所有する細胞を、トランスフェクション後7日目にMACS陰性選択によって精製した。陰性選択を用いて、本発明者らは、98%よりも多くがtCD19陰性細胞の集団を増大させる(
図2F)。本発明者らは次いで、tCD19陰性集団からの単一細胞クローニングを用いて、両アレル編集事象を経験したマーカーを含まない細胞を特定した。クローンの解析により、クローン2番に由来する7個の別個のクローン由来の7個のTBX1 c.G928 G>A両アレル編集系統、およびクローン13番に由来する16クローン由来の12個の単一アレル編集系統が示された(
図2G、2H)。クローン13番に由来する16クローンすべてで、単一アレル編集事象を伴う第2ラウンドのHRを始めたが、その後、16クローンのうちの4個は、WTアレルのみを所有した。本発明者らは、単一アレル編集事象のこの喪失は、第2のCas9媒介DSBの後の(姉妹染色分体ではない)WTホモログ染色体を用いたHR事象のせいであったと仮説を立てた。この考えを支持して、非編集細胞の混入には由来し得ない、第2ラウンドのHR後にホモ接合性1塩基挿入を有する単一のクローンが見出された(
図7)。加えて、WTおよびTBX1 c.928 G>Aドナーの混合物を用いたクローン2番における第2ラウンドのHRは、WT、ヘテロ接合性、およびホモ接合性の変異体を生じた(
図2G)。このため、同質遺伝子バックグラウンドにおけるWT、ヘテロ接合性、およびホモ接合性のスカーレスクローンを、ちょうど同腹比較などの疾患のモデリングが遺伝子改変動物で行われる場合の、適切な比較のために容易に取得することができる。第2ラウンドのHRおよびその後の陰性選択の後に、本発明者らは、編集された幹細胞が多能性マーカーを保持することを確認した(
図8)。
【0164】
本発明者らは次に、RUNX1遺伝子の終止コドンの直前での、2A自己切断性ペプチド配列の後に続くmOrange遺伝子の組み込みによってRUNX1レポーターiPS細胞株を作製するために、同じアプローチを適用した。この編集の目標は、RUNX1
+造血幹および前駆細胞への方向づけられた分化の画像解析を可能にするため、ならびにPSCのRUNX1
+細胞への分化を増強する培養条件/小分子をスクリーニングするためおよびCRISPRまたはshRNAベースの遺伝子スクリーニングのために、同質遺伝子スカーレスRUNX1レポーターを作製することである(
図3A)。RUNX1遺伝子はPSCにおいて発現しないため、従来の編集法によって編集された系統を取得することは容易ではなく、マーカー選択が使用されない限り、通常何百ものコロニーを採取して解析しなければならない。第1ラウンドの編集を通して、本発明者らは、
図6Bおよび7に図示されるCas9/gRNAおよびドナープラスミドを用いて、RUNX1終止コドンの5'側にmCherry-tCD19発現カセットを挿入した。tCD19陽性細胞のMACS濃縮および単一細胞培養の後、本発明者らは8個の明るいクローンを採取した。PCRベースの遺伝子型判定により、クローン2番および8番において、マーカーが標的化遺伝子座で両アレル性に挿入されたことが示され(
図3B)、ddPCRベースのコピー数解析により、これらのクローンが4コピーのUbCプロモーターを有することが示される。次いで、本発明者らは、クローン2番を、
図3Aに図示されるようなCas9/gRNAおよびドナーベクターを用いた第2ラウンドの編集に供した。その後、tCD19陰性細胞をMACS分離によって濃縮し、次いで、単一細胞クローニングにより、RUNX1の終止コドンの直前に2A-mOrangeを両アレル性に有する所望の系統がもたらされた(クローン1、3、5、6、および7番、
図3C)。このように、本発明者らは、内在性RUNX1遺伝子を破壊することなくRUNX1のためのレポーターを導入した、PSC系統を作製した。組み込まれたmOrangeがRUNX1のためのレポーターとして働くかどうかを確認するために、本発明者らは、このiPS細胞株を造血幹前駆細胞(HSPC)への分化に供した(Nishimura et al. Cell Stem Cell 12, 114-126 (2013))。放射線照射C3H10T1/2細胞との共培養の13日後に、mOrange陽性HSPC様細胞が検出された(
図3D)。FACS解析により、主としてHSPCを含有する、CD34が陽性、かつCD45が中間陽性である集団は、未分化のまたは他の細胞型を含有する他の集団よりも多くの明るいmOrangeを発現することが示される(
図3E)。これらの結果は、mOrangeレポーター細胞が、その分化能力を保持し、系列分化を調節する非細胞表面転写因子であるRUNX1の発現について正確に報告することを実証する。本発明者らはまた、同じ編集戦略によってRUNX1-GFI1二重レポーター系統を作製するために、このRUNX1-mOrange系統を用いてGFI1遺伝子座でのさらなる編集も実施した(
図9)。
【0165】
RUNX1およびGFI1両方のレポーター組み込みにおいて、第1の編集段階でのランダムな組み込みを伴わない両アレルターゲティング頻度は、クローンの30%未満で起こった。ランダムな組み込みを伴うクローンの大部分はプラスミドバックボーン由来の配列を有していたため(
図10)、本発明者らは、プラスミドバックボーンにおける陰性選択特性の導入は、第1ラウンドの編集におけるランダムな組み込みを伴う細胞の濃縮を効果的に低減させるという仮説を立てた。薬物選択を用いる必要によって限定される、広く用いられているチミジンキナーゼ選択法を用いる代わりに、本発明者らは、shRNAベースの対抗選択に基づく新規の陰性選択法を開発した。このシステムにおいて、shRNAカセットは、両方のホモロジーアームに隣接し、陽性マーカー選択遺伝子を抑制するように設計されている。shRNAが(エピソーム性発現またはランダムな組み込みのいずれかから)発現される限り、マーカー遺伝子は抑制され、細胞は陽性として記録されないことになる。ひとたびエピソーム性発現が失われると、マーカー遺伝子抑制は緩和され、カセットが標的化様式のみで組み込まれている陽性マーカークローンを、容易に特定することができる。本発明者らは、このシステムを、ES H9系統におけるB2M遺伝子座の、B2M-HLA-A
*24融合タンパク質を作製するためにB2M終止コドンの5'側にリンカーを伴ってHLA-A
*24 cDNAを組み込むように設計されたドナーベクターでの編集に適用した。
図4Bに示されるように、shGFP発現カセット(各々0.3 kb)を、第1のドナーベクターにおける左ホモロジーアームおよび右ホモロジーアーム両方の外側に導入し、選択マーカーを、mCherryおよびtCD19からGFPおよびtCD8に変更した。結果として、5個の明るいクローンから、ランダムな組み込みを伴わない4個の両アレル性にマーカーが組み込まれたクローンが取得され(
図4B)、他方、shRNA選択システムを伴わずにドナーベクターを用いた6個の明るいクローンからは、1個の両アレル性に標的化されたクローンのみが取得され(
図4A)、これは、shRNAベースの対抗選択特性が、第1ラウンドの編集からの陽性選択におけるランダムな組み込みを伴う細胞の混入を効果的に低減したことを示した。本発明者らは、薬物選択を用いる必要なくそのようなクローンを特定することができ、したがってこれは、システムをより容易に、かつ残ったクローンに対する毒性をより少なくした。
【0166】
加えて、本発明者らは、新規EcoRI部位を生成する、ATGから上流314番目および315番目の変異(GG>AA)の導入が、ヒトUbCプロモーター活性に影響を及ぼさないことを見出した。この特性により、ddPCRなどの定量的PCR戦略を用いる必要なく正規のPCRによって、選択マーカーを駆動する新たな外来性UbCプロモーターのコピー数解析を行うことが可能になる(
図11)。次いで、本発明者らは、陰性選択と組み合わせた第2ラウンドの編集によって、8個の濃縮されたクローンから8個の正確に編集されたクローンを取得したことを確認し(
図4C)、所望のHLA発現プロファイル(内在性HLAのノックアウトおよびHLA-A
*24の発現)が、編集された細胞において観察された(
図4D)。本発明者らはまた、高密度SNPアレイ解析によって、すべての編集実験における元の系統、第1ラウンドおよび/または第2ラウンドの編集産物の間でゲノムのコピー数変動(CNV)を比較した。2段階編集プロセスによって引き起こされた実質的な染色体変化(欠失または増倍)はなかったが、第2ラウンドの編集後のTBX1系統のうちの1つにおける「コピー中立性のヘテロ接合性喪失(LOH)」および1つの各標的化遺伝子座でRUNX1マーカーが組み込まれた系統が見出され、これは、これらの変化がgRNA/Cas9駆動二本鎖切断によって引き起こされたことを示唆した。しかし、2段階編集プロセス後の大部分の系統は、そのような変化を有さなかった。これらの変化がgRNA/Cas9切断によって誘導されたと仮定すると、そのような変化は、操作されたヌクレアーゼを用いた他の編集戦略を用いても起こる可能性が高い。多くの場合にゲノム完全性を調べるために行われるGバンド解析は、コピー中立性LOHを検出することができず、したがって、高密度SNPアレイ解析を用いなかった以前の研究においては見落とされていた可能性がある。オンターゲット部位の周りの高密度SNPアレイを用いたCNV解析が、ゲノム編集細胞を用いる機能解析または臨床細胞療法の場合に特に推奨される。
【0167】
これらの結果は、方法が、精密なかつスカーレスの様式で単一ヌクレオチド変化または大きなDNA断片のいずれかを導入するために用いられ得ることを実証する。他の方法とは対照的に、本発明者らの方法は、スカーレスゲノム編集において3種類の重要な利点をもたらす。第1に、本発明者らの方法は、(TBX1編集において示されるように)同じクローンから十分に一致した同質遺伝子対照(WT)、ホモ接合性、およびヘテロ接合性の系統を生成する。編集プロセスは、hPSCの表現型を変化させる可能性がある長期培養を必要とするため、元の系統と編集された系統との間の表現型の比較は、その獲得された変化のために誤解を招く場合がある。本発明者らの戦略は、同じクローンから同じ段階において様々な遺伝子型(WT、ヘテロ接合性、ホモ接合性)を生じることが容易であるように、第2の編集段階において極度に高いターゲティング効率を利用し、したがって、長期の培養によって誘導される変動性を低減させる。第2に、本発明者らの方法は、hPSCにおいて発現されない遺伝子中へを含み、ssODN法を用いて組み込むことが可能ではない挿入物サイズである、より大きな導入遺伝子のスカーレス様式での導入を可能にする。他の方法が、例えば、レポーター遺伝子の組み込みを達成しているが、hPSCにおいて発現される遺伝子中へだけである。RUNX1およびGFI1での本発明者らの編集は、hPSCにおいて発現されない遺伝子でのスカーレスのマーカー組み込みの例である。第3に、本発明者らの方法は、切断から編集までの距離が長い遺伝子座で効率的に働き、これは、他の方法を用いて以前に達成されていなかった特性であった。例えば、B2M遺伝子座について、本発明者らは、63塩基対の切断から編集までの距離で、本発明者らのマーカーの80%の標的化された組み込みを達成した。切断から編集までの距離のこの延長は、hPSCにおいて達成され得るスカーレス編集の範囲を有意に増大させる(
図12)。マーカー選択およびその後のマーカー除去を用いることは、第1および第2両方の編集段階の効率を増加させ、したがって、他の方法を用いて必要である数百の代わりに、5~10クローンのみを解析することが必要であるシステムを作製した(表2)(上記のPaquet et al.;Miyaoka et al. Nat. Methods 11, 291-3 (2014))。本発明者らは、加えて、蛍光マーカータンパク質に対するshRNAカセットを含めることによって、第1段階の編集プロセスの効率を改善し、それによって、ランダムな組み込みを伴うクローンが採取されることを低減させ、または排除すらした。第2ラウンドの編集について、濃縮されたマーカー細胞におけるターゲティング頻度は100%であることができ、かつ常に100%に近く、したがって、何百ものクローンの骨の折れるかつ面倒なスクリーニングおよび解析を排除する。この高い頻度は、以前にCre-loxPベースの2段階編集でも用いられた(Xi et al. Genome Biol. 16, 1-17 (2015))、蛍光マーカーを用いることによって達成されるが、本発明者らの新規2段階法が現在まで失敗例なく働くことを可能にしている。加えて、陰性選択は、標的化された組み込みおよびランダムな組み込みの両方を伴う細胞を特定する陽性選択とは異なり、第1の段階で標的化細胞のみを濃縮するため、第2の編集段階での100%ターゲティング頻度に寄与する。この合理化されたプロセスは、6~8週間でヘテロ接合性クローンおよびホモ接合性クローンの特定を結果としてもたらし、ヒトPSCにおいて発現されない遺伝子座で達成され、したがって、高速かつ効率的であるために発現される標的部位を必要としないことを実証した。この高い効率は、代替法で必要とされる大きな労働力を要するコロニー採取、遺伝子型判定、およびシーケンシングの必要を排除する。要約すると、本発明者らの方法は、スカーレスゲノム編集を有するヒト多能性細胞を生じ、したがって疾患モデルおよび発生モデル、薬物スクリーニングツール、ならびに治療薬として幹細胞技術を進歩させる際の複数の障害に対処する。
【0168】
材料および方法
プラスミド
sgRNA発現ベクターを、標的配列およびアダプター配列を含むアニーリングさせたオリゴヌクレオチドの、ヒトコドン最適化SpCas9発現カセットおよびキメラsgRNAの発現を駆動するヒトU6プロモーターを含有するBbsI消化px330(Addgeneプラスミド番号42230)中への挿入によって構築した。標的部位を、
図6に記載する。
【0169】
ドナーDNAプラスミドベクターを、NEBuilder HiFi DNA Assembly(NEB)によって構築した。左ホモロジーアームおよび右ホモロジーアームを、K562細胞(ATCC)由来のゲノムDNA抽出物を鋳型として用いたネステッドPCRによって増幅した。TBX1の変異は、PCRおよびライゲーションによって生成した。
【0170】
細胞培養
ヒトES H9細胞を、TBX1およびB2M編集のために用い、以前に記述されたように(Takayama et al. J Exp Med. 207, 2817-2830 (2010))ヒト皮膚線維芽細胞から樹立されたTkDA3-4 iPSC系統(Cell Applications Inc.)を、RUNX1およびGFI1編集のために用いた。iAM9 iPSC系統を、HLA-A*24検出の陽性対照に用いた。hPSCは、フィーダーを含まないMatrigel(Corning)コーティングプレート上でmTeSR1(STEMCELL technologies)において維持した。継代培養を、EDTA法によって4~6日毎に行った。プレーティング後、10μM Y-27632(Tocris)を1日間添加した。
【0171】
K562(ATCC)細胞は、10%ウシ成長血清(HyClone)、100 mg/mlストレプトマイシン、100単位/mlペニシリン、および2 mM l-グルタミンを補給したRPMI 1640(HyClone)において維持した。
【0172】
トランスフェクション
iPSCのESC(70~80%コンフルエント)を、Accutase(Life Technologies)で採集した。2×106細胞を、P3 Primary Cell 4D-Nucleofector Lキットおよび4D-Nucleofectorシステム(Lonza)を用いて製造業者のプロトコール(プログラム:TBX1、RUNX1編集についてはCB-150、GFI1およびB2M編集についてはCA-137)にしたがい、5μg pX330プラスミドおよび5μgドナーベクターでエレクトロポレーションに供した。ドナーDNAの混合物(WTおよびTBX1 c.928G>A)でのトランスフェクションにおいては、各々2.5μgを供した。トランスフェクション後、細胞を、Matrigelコーティング6ウェルプレートの3ウェルにプレーティングし、10μM Y-27632を添加したmTeSR1で3日間維持した。次いで、細胞を、Y-27632を含まないmTeSRで維持した。
【0173】
K562細胞に、Lonza Nucleofector 2b(プログラムT-016)および100 mM KH2PO4、15 mM NaHCO3、12 mM MgCl2×6H2O、8 mM ATP、2 mMグルコースを含有するnucleofection緩衝液(pH 7.4)を用いてヌクレオフェクションした。
【0174】
iPSCを用いたHSPC分化
iPSCを用いたHSPCへの分化を、わずかな改変を伴って以前に報告されたように行った。簡潔に述べると、iPSCの小さな凝集塊(100細胞未満)を、放射線照射C3H10T1/2細胞上に移し、EB培地(15%胎児ウシ血清ならびに10μg/mlヒトインスリン、5.5μg/mlヒトトランスフェリン、5 ng/ml亜セレン酸ナトリウム、2 mM L-グルタミン、0.45μM a-モノチオグリセロール、および50μg/mlアスコルビン酸のカクテルを補給したIscove改変Dulbecco培地)においてVEGF、SCF、TPO、IL-3、およびIL-6の存在下で共培養した。培地を、3日毎に交換した。培養の14日後に、細胞を、37℃で5分間のTrypLE Select(Thermo Fisher Scientific)での処理によって採集し、次いで、細胞をFACS解析に供した。
【0175】
フローサイトメトリーおよび蛍光顕微鏡観察
編集頻度の測定のために、Accutaseでの採集後に、細胞を、APCとコンジュゲートされた抗ヒトCD19抗体(クローンLT19、1:20、Miltenyi Biotec)で製造業者のプロトコールにしたがって染色した。次いで、細胞を洗浄緩衝液(1%ヒトアルブミンおよび0.5 mM EDTAを含むPBS)で2回洗浄した。HLAの検出のためには、50 ng/mL INFγ処理の3日後に、細胞を剥がして、APCとコンジュゲートされた抗HLA-A*02(クローンBB7.2、1:20、eBioscience)、PEとコンジュゲートされた抗HLA-A*03(クローンGAP. A3、1:20、eBioscience)、またはFITCとコンジュゲートされた抗HLA-A*24(クローン22E1、1:20、MBL)で、製造業者のプロトコールにしたがって染色した。次いで、細胞を洗浄緩衝液で2回洗浄した。データを、Accuri C6 plusフローサイトメーター(BD biosciences)を用いて獲得した。分化研究のためには、剥がした後、死細胞の除外を可能にするようにヨウ化プロピジウムを添加した。細胞を、APC-Cy7とコンジュゲートされた抗CD34(eBioscience)およびAPCとコンジュゲートされた抗CD45(eBioscience)で30分間、4℃で染色し、次いで、細胞を洗浄緩衝液で2回洗浄した。データを、FACSAria II(BD Biosciences)を用いて獲得した。すべての獲得したデータを、FlowJo(FlowJo, LLC)を用いて解析した。
【0176】
コロニー採取の前に明るいmCherry蛍光を有するクローンと薄暗いmCherry蛍光を有するクローンとを区別するために、細胞を、蛍光顕微鏡IX-70(Olympus)を用いて観察した。蛍光画像はすべて、EVOS FL細胞イメージングシステム(Thermo Fisher Scientific)を用いて獲得した。
【0177】
オフターゲット解析
遺伝子編集ES/iPS細胞株を、ガイドRNA標的配列におけるミスマッチ、挿入、および欠失を考慮するCOSMID46ツール(http://crispr.bme.gatech.edu)によって、各sgRNAに対して予測されるオフターゲット編集事象について試験した。結果を、表2に示す。オフターゲット候補として予測される遺伝子座でのすべての配列を、最終産物において調べて、オフターゲット編集は検出されなかった。いかなるオフターゲット候補も、COSMID46ツールのデフォルト設定において、TBX1およびB2Mの第1ラウンドの編集、すべての第2ラウンドの編集のために用いられたガイドRNA配列について予測されなかった。
【0178】
磁気補助細胞分離(MACS)
分離の1時間前に、細胞を10μM Y-27632で処理し、Y-27632を洗浄緩衝液(1%ヒトアルブミンおよび0.5μM EDTAを含むPBS)中に添加することによって、この処理を分離の間中保った。細胞をAccutaseで剥がした後、陽性選択および陰性選択を、それぞれトランスフェクション後6日目および7日目に、それぞれMSカラムおよびLDカラム(Miltenyi Biotec)ならびに磁性ビーズコンジュゲート抗ヒトCD19(Miltenyi Biotec)または抗ヒトCD8(Miltenyi Biotec)で、製造業者のプロトコールにしたがって行った。陽性選択は、2つのMSカラムを連続的に用いて2回繰り返した。
【0179】
遺伝子型判定および配列解析
TBX1遺伝子座中へのマーカー挿入を、Accuprime GC rich DNA Polymerase(Thermo Fisher Scientific)でのPCRによって確認した。配列解析を、PrimeSTAR HS with GC rich(Takara Bio)によって生成されたPCRアンプリコンを用いて、McLab(South San Francisco, CA, USA)で行った。RUNX1、GFI1、およびB2Mの遺伝子型判定を、PrimeSTAR GXL(Takara Bio)で行った。すべてのプライマーを、表1に列挙する。ゲノムDNA試料は、QuickExtract DNA Extraction Solution(Epicentre Madison)によって製造業者の説明書にしたがって調製した。
【0180】
ddPCRベースのコピー数解析
選択マーカーに由来する組み込まれた外来性UbCプロモーターのコピー数解析を、ゲノムUbCプロモーターおよび参照配列を定量するDroplet Digital PCR(ddPCR)によって行った。UbCプロモーターのコピー数は、内在性の2コピーおよび外来性のドナーDNA由来コピーからの合計を反映し、他方で、2コピーのみの参照配列が存在する。そのため、UbCプロモーターと参照配列との間の量の比較は、マーカーアレルの正味のコピー数を提供する。ddPCRは、QX200(BioRad)およびddPCR Supermix for Probe(BioRad)を用いて製造業者のプロトコールにしたがって行った。プライマーおよびプローブの配列は、UbCプロモーターについて、プライマー1
、プライマー2
、プローブ
、参照遺伝子座について、プライマー1
、プライマー2
、プローブ
であった。ゲノムDNA試料は、QuickExtract DNA Extraction Solutionによって調製した。
【0181】
正規のPCRおよび制限酵素消化によるUbCプロモーターの代替的なコピー数解析
PCR反応を、15μLスケールでPhusion Green Hot Start II High-Fidelity PCR Master Mix(Thermo Fisher Scientific)を用いて、ゲノムDNA試料およびプライマー
で行った。次いで、1×CutSmart緩衝液で10 U/μLに希釈したEcoRI-HF(NEB)の1μLを、PCR産物中に直接添加した。37℃での1.5時間のインキュベーション後に、試料を、Midori Green Advance(Fast Gene)を含有する2.0%アガロースゲル上の電気泳動(30分、150V)に供した。画像を、ChemiDoc XRS+(Bio-Rad)を用いて取り込み、次いでImage Jソフトウェアを用いて解析した。
【0182】
免疫細胞化学および顕微鏡観察
NANOGおよびOCT4の染色のために、細胞を、4%パラホルムアルデヒドにおいて固定し、PBS中の0.2% Triton X-100において透過化処理し、ブロッキング緩衝液(PBS中、0.1% Triton-Xおよび2% FBS)でブロッキングして、ブロッキング緩衝液で200倍希釈した抗体で、室温で一晩染色し、次いで、細胞を、ブロッキング緩衝液で2000倍希釈したAlexa594とコンジュゲートされた抗ウサギIgG抗体(R37117, Thermo Fisher Scientific)で、室温で40分間染色した。TRA-1-60の染色のためには、細胞を、4%パラホルムアルデヒドにおいて固定し、PBS中の2% FBSでブロッキングして、PBS中の2% FBSによって200倍希釈した抗体で染色した。本研究において用いた抗体は、STEMGENTから取得し、それらのカタログ番号は、NANOG(カタログ番号09-0020)、OCT4(カタログ番号09-0023)、およびTRA-1-60(カタログ番号09-0068)である。蛍光画像を、EVOS FL細胞イメージングシステムを用いて獲得した。
【0183】
高密度SNPアレイ解析
編集プロセスの最中のゲノム完全性を調べるために、高密度SNPアレイ解析を、CytoSNP-850K BeadChip(Illumina)を用いて行った。GeneJETゲノムDNA精製キット(Thermo Fisher Scientific)によって調製したゲノムDNA試料の200 ngを、製造業者のプロトコールにしたがって、加工処理し、マイクロアレイスライドにハイブリダイズさせた。次いで、それらを、iScanシステム(Illumina)を用いてスキャンした。得られたデータを、cnvPartitionアルゴリズムを有するGenomeStudioソフトウェア(Illumina)によって解析した。
【0184】
本発明の好ましい態様を例証し、かつ説明してきたが、本発明の精神および範囲から逸脱することなく、種々の変更がその中でなされ得ることが認識されるであろう。
【0185】
(表1)遺伝子型判定およびシーケンシングのためのプライマーリスト
【0186】
(表2)COSMIDツールによって予測されるオフターゲット候補
ミスマッチおよびINDELに下線が引かれている。
【0187】
配列情報
SEQUENCE LISTING
<110> The Board of Trustees of the Leland Stanford Junior
University
<120> SCARLESS GENOME EDITING THROUGH TWO-STEP HOMOLOGY DIRECTED REPAIR
<150> US 62/533,780
<151> 2017-07-18
<160> 33
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 1
cgtcagtttc tttggtcggt 20
<210> 2
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 2
<220>
<221> source
<222> (1)..(18)
<223> sequence is synthesized
<400> 2
aaacacactc gccaaccc 18
<210> 3
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> probe
<220>
<221> source
<222> (1)..(26)
<223> sequence is synthesized
<400> 3
tcttcttaag tagctgaagc tccggt 26
<210> 4
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> UbC promoter primer 1
<220>
<221> source
<222> (1)..(21)
<223> sequence is synthesized
<400> 4
ctctcctctt tgatacggcc c 21
<210> 5
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> UbC promoter primer 2
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 5
agtgttgtcc cagacagtgc 20
<210> 6
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> UbC promoter probe
<220>
<221> source
<222> (1)..(26)
<223> sequence is synthesized
<400> 6
ctgccaagtt gtggcctctg tcaaag 26
<210> 7
<211> 7151
<212> DNA
<213> Artificial Sequence
<220>
<223> Tbx1 1st donor vector
<400> 7
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 60
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 120
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 180
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 240
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 300
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 360
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 420
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 480
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 540
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 600
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 660
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 720
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 780
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 840
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 900
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 960
gcgcacattt ccccgaaaag tgccacctga cgttaactcg agtcgacggc ccagtgaccc 1020
agcctcatct tggaattaag ggttttgccc aactcatcca ggaaactcat tgccaactca 1080
gacctcagcc catttcctgg ctcccacccc agatcctcag cccagcccca ccgctggagc 1140
tgattcccca ccttgtcttc cagattattc tgaattccat gcacagatac cagccccgct 1200
tccacgtggt ctatgtggac ccacgcaaag atagcgagaa atatgccgag gagaacttca 1260
aaacctttgt gttcgaggag acacgattca ccgcggtcac tgcctaccag aaccatcggg 1320
tgagggcctg tggggaggac ctgagcggat tcaacgcctc tggaaaagcg ggtgtaattt 1380
tcagttgccg tttggggaca gtgggtccgc ttagacctgc aggctgtggt cccagtggag 1440
cccaacccaa ctggagcccc actcccaagg gcctcaggca gccccctccc tctcgaggct 1500
ggccggccca gcctcctatc agcttgacct ctccagcggc aactgtcact tcgtcctgaa 1560
agtttgtttt ccgaaccatt ccggaaactc cccatcaggg gcctgatctg aggtttaccc 1620
agattactag ggaacccgct ctgttcccca ccccccaccc cactgcacgt ggggggtggt 1680
gaccacattc ctgtcccagc gaggagcaca gggcctccat ccccacccac ctgggggaca 1740
ccagagaggg gttccctagt gagagaggag gttcctcaga cccccgcccc cctgcaggag 1800
ggagcaccag ctccgtagag gaggggcaga cgtggactgg ttcttgtcag ggcagcagaa 1860
aggcccttgg tgcgcttctc ctaacactcc cctatcctcc gccgaggtcg ggtggcccag 1920
gctgcagggc tccagcggct tgctcacacc cacctccctg cagatcacgc agctcaagat 1980
tgccagcaat cccttcgcga aaggcttccg ggactgtgac cctgaggact ggtgagtgtc 2040
ctcccccgag agagtgagcg ccgggcgcct ggcgcaggcg ccgccctgat ccgcctcccg 2100
cccgcaggcc ccggaaccac cggcccagcg cactgccgct catcgaaggt ctagactccg 2160
cgccgggttt tggcgcctcc cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca 2220
gacgaagggc gcagcgagcg tcctgatcct tccgcccgga cgctcaggac agcggcccgc 2280
tgctcataag actcggcctt agaaccccag tatcagcaga aggacatttt aggacgggac 2340
ttgggtgact ctagggcact ggttttcttt ccagagagcg gaacaggcga ggaaaagtag 2400
tcccttctcg gcgattctgc ggagggatct ccgtggggcg gtgaacgccg atgattatat 2460
aaggacgcgc cgggtgtggc acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc 2520
ttgtttgtgg atcgctgtga tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg 2580
ctttcgtggc cgccgggccg ctcggtggga cggaagcgtg tggagagacc gccaagggct 2640
gtagtctggg tccgcgagca aggttgccct gaactggggg ttggggggag cgcagcaaaa 2700
tggcggctgt tcccgagtct tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg 2760
aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg 2820
cgggaaagct cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa 2880
gtttgtcact gactggagaa ctcggtttgt cgtctgttgc gggggcggca gttatggcgg 2940
tgccgttggg cagtgcaccc gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc 3000
acccgttctg ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc 3060
ttttctccgt cgcaggacgc agtgttcggg cctagggtag gctctcctga atcgacaggc 3120
gccggacctc tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg 3180
tacctatctt cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag 3240
tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa 3300
ttttcagtgt tagactagta aattgtccgc taaattctgg ccgtttttgg cttttttgtt 3360
agacggtacc gagctcttcg aaggatccat cgccaccatg gtgagcaagg gcgaggagga 3420
taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 3480
cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 3540
cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 3600
tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 3660
gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 3720
cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 3780
gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 3840
ggaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 3900
gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 3960
caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 4020
ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 4080
cggcggcatg gacgagctgt acaaggaggg caggggcagc ctgctgacct gcggcgacgt 4140
ggaggagaac cccggcccca tgcccccccc caggctgctg ttcttcctgc tgttcctgac 4200
ccccatggag gtgaggcccg aggagcccct ggtggtgaag gtggaggagg gcgacaacgc 4260
cgtgctgcag tgcctgaagg gcaccagcga cggccccacc cagcagctga cctggagcag 4320
ggagagcccc ctgaagccct tcctgaagct gagcctgggc ctgcccggcc tgggcatcca 4380
catgaggccc ctggccatct ggctgttcat cttcaacgtg agccagcaga tgggcggctt 4440
ctacctgtgc cagcccggcc cccccagcga gaaggcctgg cagcccggct ggaccgtgaa 4500
cgtggagggc agcggcgagc tgttcaggtg gaacgtgagc gacctgggcg gcctgggctg 4560
cggcctgaag aacaggagca gcgagggccc cagcagcccc agcggcaagc tgatgagccc 4620
caagctgtac gtgtgggcca aggacaggcc cgagatctgg gagggcgagc ccccctgcct 4680
gccccccagg gacagcctga accagagcct gagccaggac ctgaccatgg cccccggcag 4740
caccctgtgg ctgagctgcg gcgtgccccc cgacagcgtg agcaggggcc ccctgagctg 4800
gacccacgtg caccccaagg gccccaagag cctgctgagc ctggagctga aggacgacag 4860
gcccgccagg gacatgtggg tgatggagac cggcctgctg ctgcccaggg ccaccgccca 4920
ggacgccggc aagtactact gccacagggg caacctgacc atgagcttcc acctggagat 4980
caccgccagg cccgtgctgt ggcactggct gctgaggacc ggcggctgga aggtgagcgc 5040
cgtgaccctg gcctacctga tcttctgcct gtgcagcctg gtgggcatcc tgcacctgca 5100
gagggccctg gtgctgagga ggaagaggaa gaggatgacc gaccccacca ggaggttctg 5160
aggcgcgccc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 5220
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 5280
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 5340
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 5400
gggctctatg gcgtacgcct cacgagcgcc ttcgcgcgct cgcggaaccc cgtggcttcc 5460
ccgacgcagc ccagcggcac ggagaaaggt agggccgggg tcgtgggatc cgggttccgg 5520
ccctgtgcgc gctctacccc gggccggcgg cctcgcccga cctcgcctgc gcccccgggg 5580
cgctccaggc tttcgcgccg gttgcacaac ggccgcggcg gcgggcaagc gcgcactcgc 5640
ccgcccggcc cgacggctgc gccccgcccg ccgccgccgc cgcccgcaga ggggcgcggg 5700
ccccggggag ggctcggggc gccggcgact tggggtctcg ggcacgctgg caccgactgg 5760
tcggggaaca ccgagggcgg ccaagagcct tctctccgcc agggcctcgc atggggcgtc 5820
ggagctcctc ggcggccccg gccggccgcg ctcactcctc ggccctctcc gcagacgcgg 5880
ctgaggcccg gcgagaattc cagcgcgacg cgggcgggcc agcagtgctc ggggacccgg 5940
cgcatcctcc gcagctgctg gcccgggtgc taagcccctc gctgcccggg gccggcggcg 6000
ccggcggctt agtcccgctg cccggcgcgc ccggaggccg gcccagtccc ccgaaccccg 6060
agctgcgcct ggaggcgccc ggcgcatcgg agccgctgca ccaccacccc tacaaatatc 6120
cggccgccgc ctacgaccac tatctcgggg ccaagagccg gccggcgccc tacccgctgc 6180
ccggcctgcg tggccacggc taccacccgc acgcgcatcc gcaccaccac caccaccccg 6240
tgagtccagc cgccgcggcc gccgccgccg ctgccgcagc tgccgcggcc gccaacaatt 6300
gtccggaatt ctgcagagtg gcggccgcac atgtgagcaa aaggccagca aaaggccagg 6360
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 6420
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 6480
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 6540
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 6600
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 6660
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 6720
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 6780
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 6840
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 6900
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 6960
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 7020
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 7080
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 7140
tctgacagtt a 7151
<210> 8
<211> 3872
<212> DNA
<213> Artificial Sequence
<220>
<223> Tbx1 2nd donor vector
<400> 8
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 60
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 120
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 180
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 240
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 300
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 360
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 420
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 480
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 540
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 600
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 660
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 720
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 780
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 840
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 900
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 960
gcgcacattt ccccgaaaag tgccacctga cgttaactcg agtcgacggc ccagtgaccc 1020
agcctcatct tggaattaag ggttttgccc aactcatcca ggaaactcat tgccaactca 1080
gacctcagcc catttcctgg ctcccacccc agatcctcag cccagcccca ccgctggagc 1140
tgattcccca ccttgtcttc cagattattc tgaattccat gcacagatac cagccccgct 1200
tccacgtggt ctatgtggac ccacgcaaag atagcgagaa atatgccgag gagaacttca 1260
aaacctttgt gttcgaggag acacgattca ccgcggtcac tgcctaccag aaccatcggg 1320
tgagggcctg tggggaggac ctgagcggat tcaacgcctc tggaaaagcg ggtgtaattt 1380
tcagttgccg tttggggaca gtgggtccgc ttagacctgc aggctgtggt cccagtggag 1440
cccaacccaa ctggagcccc actcccaagg gcctcaggca gccccctccc tctcgaggct 1500
ggccggccca gcctcctatc agcttgacct ctccagcggc aactgtcact tcgtcctgaa 1560
agtttgtttt ccgaaccatt ccggaaactc cccatcaggg gcctgatctg aggtttaccc 1620
agattactag ggaacccgct ctgttcccca ccccccaccc cactgcacgt ggggggtggt 1680
gaccacattc ctgtcccagc gaggagcaca gggcctccat ccccacccac ctgggggaca 1740
ccagagaggg gttccctagt gagagaggag gttcctcaga cccccgcccc cctgcaggag 1800
ggagcaccag ctccgtagag gaggggcaga cgtggactgg ttcttgtcag ggcagcagaa 1860
aggcccttgg tgcgcttctc ctaacactcc cctatcctcc gccgaggtcg ggtggcccag 1920
gctgcagggc tccagcggct tgctcacacc cacctccctg cagatcacgc agctcaagat 1980
tgccagcaat cccttcgcga aaggcttccg ggactgtgac cctgaggact ggtgagtgtc 2040
ctcccccgag agagtgagcg ccgggcgcct ggcgcaggcg ccgccctgat ccgcctcccg 2100
cccgcaggcc ccggaaccac cggcccgagc gcactgccgc tcatgagcgc cttcgcgcgc 2160
tcgcggaacc ccgtggcttc cccgacgcag cccagcggca cggagaaagg tagggccggg 2220
gtcgtgggat ccgggttccg gccctgtgcg cgctctaccc cgggccggcg gcctcgcccg 2280
acctcgcctg cgcccccggg gcgctccagg ctttcgcgcc ggttgcacaa cggccgcggc 2340
ggcgggcaag cgcgcactcg cccgcccggc ccgacggctg cgccccgccc gccgccgccg 2400
ccgcccgcag aggggcgcgg gccccgggga gggctcgggg cgccggcgac ttggggtctc 2460
gggcacgctg gcaccgactg gtcggggaac accgagggcg gccaagagcc ttctctccgc 2520
cagggcctcg catggggcgt cggagctcct cggcggcccc ggccggccgc gctcactcct 2580
cggccctctc cgcagacgcg gctgaggccc ggcgagaatt ccagcgcgac gcgggcgggc 2640
cagcagtgct cggggacccg gcgcatcctc cgcagctgct ggcccgggtg ctaagcccct 2700
cgctgcccgg ggccggcggc gccggcggct tagtcccgct gcccggcgcg cccggaggcc 2760
ggcccagtcc cccgaacccc gagctgcgcc tggaggcgcc cggcgcatcg gagccgctgc 2820
accaccaccc ctacaaatat ccggccgccg cctacgacca ctatctcggg gccaagagcc 2880
ggccggcgcc ctacccgctg cccggcctgc gtggccacgg ctaccacccg cacgcgcatc 2940
cgcaccacca ccaccacccc gtgagtccag ccgccgcggc cgccgccgcc gctgccgcag 3000
ctgccgcggc cgccaacaat tgtccggaat tctgcagagt ggcggccgca catgtgagca 3060
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 3120
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 3180
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 3240
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 3300
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 3360
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 3420
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3480
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 3540
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 3600
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 3660
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 3720
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 3780
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 3840
agtatatatg agtaaacttg gtctgacagt ta 3872
<210> 9
<211> 7132
<212> DNA
<213> Artificial Sequence
<220>
<223> Runx1 1st donor vector
<400> 9
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 60
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 120
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 180
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 240
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 300
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 360
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 420
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 480
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 540
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 600
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 660
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 720
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 780
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 840
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 900
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 960
gcgcacattt ccccgaaaag tgccacctga cgttaactcg agtcgacaag cttccaatct 1020
tcctgggcgg taaattctga tagaaaccca tctccctgga cagtagcatc ctgggtgtcc 1080
cccgtcctcc taggcggtag catcctgggt ggtctccatc ctcccaggtg gtgtcatcct 1140
gggtggtctc cgtcctctca ggaggtggca tcctgagtgg tccccgacct cctgggcata 1200
gcatcatggg tagtccccat cctcttggga ggtgacatgc tgggtgatcc tcgtcatctc 1260
aggaggtggc atcctgggtg gtccctgtcc ccctgggtat agcatcctgg gtaatcctcg 1320
tcctcttggg agtagcatcc cgggtggtcc ccgtcctccc cagcagtagc atcctgggtg 1380
gcttcccatc ctcctaggcg gtatcatcct gggtagcccc ctggggcaga gggaagagct 1440
gtggcctccg caacctccta ctcacttccg ctccgttctc ttgcccgccc tgcagcggca 1500
cccgacctga cagcgttcag cgacccgcgc cagttccccg cgctgccctc catctccgac 1560
ccccgcatgc actatccagg cgccttcacc tactccccga cgccggtcac ctcgggcatc 1620
ggcatcggca tgtcggccat gggctcggcc acgcgctacc acacctacct gccgccgccc 1680
taccccggct cgtcgcaagc gcagggaggc ccgttccaag ccagctcgcc ctcctaccac 1740
ctgtactacg gcgcctcggc cggctcctac cagttctcca tggtgggcgg cgagcgctcg 1800
ccgccgcgca tcctgccgcc ctgcaccaac gcctccaccg gctccgcgct gctcaacccc 1860
agcctcccga accagagcga cgtggtggag gccgagggca gccacagcaa ctcccccacc 1920
aacatggcgc cctccgcgcg cctggaggag gccgtgtgga ggccctaccc tgcgatgagc 1980
ggcagtgcgc tccgcgccgg gttttggcgc ctcccgcggg cgcccccctc ctcacggcga 2040
gcgctgccac gtcagacgaa gggcgcagcg agcgtcctga tccttccgcc cggacgctca 2100
ggacagcggc ccgctgctca taagactcgg ccttagaacc ccagtatcag cagaaggaca 2160
ttttaggacg ggacttgggt gactctaggg cactggtttt ctttccagag agcggaacag 2220
gcgaggaaaa gtagtccctt ctcggcgatt ctgcggaggg atctccgtgg ggcggtgaac 2280
gccgatgatt atataaggac gcgccgggtg tggcacagct agttccgtcg cagccgggat 2340
ttgggtcgcg gttcttgttt gtggatcgct gtgatcgtca cttggtgagt agcgggctgc 2400
tgggctggcc ggggctttcg tggccgccgg gccgctcggt gggacggaag cgtgtggaga 2460
gaccgccaag ggctgtagtc tgggtccgcg agcaaggttg ccctgaactg ggggttgggg 2520
ggagcgcagc aaaatggcgg ctgttcccga gtcttgaatg gaagacgctt gtgaggcggg 2580
ctgtgaggtc gttgaaacaa ggtggggggc atggtgggcg gcaagaaccc aaggtcttga 2640
ggccttcgct aatgcgggaa agctcttatt cgggtgagat gggctggggc accatctggg 2700
gaccctgacg tgaagtttgt cactgactgg agaactcggt ttgtcgtctg ttgcgggggc 2760
ggcagttatg gcggtgccgt tgggcagtgc acccgtacct ttgggagcgc gcgccctcgt 2820
cgtgtcgtga cgtcacccgt tctgttggct tataatgcag ggtggggcca cctgccggta 2880
ggtgtgcggt aggcttttct ccgtcgcagg acgcagtgtt cgggcctagg gtaggctctc 2940
ctgaatcgac aggcgccgga cctctggtga ggggagggat aagtgaggcg tcagtttctt 3000
tggtcggttt tatgtaccta tcttcttaag tagctgaagc tccggttttg aactatgcgc 3060
tcggggttgg cgagtgtgtt ttgtgaagtt ttttaggcac cttttgaaat gtaatcattt 3120
gggtcaatat gtaattttca gtgttagact agtaaattgt ccgctaaatt ctggccgttt 3180
ttggcttttt tgttagacgg taccgagctc ttcgaaggat ccatcgccac catggtgagc 3240
aagggcgagg aggataacat ggccatcatc aaggagttca tgcgcttcaa ggtgcacatg 3300
gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac 3360
gagggcaccc agaccgccaa gctgaaggtg accaagggtg gccccctgcc cttcgcctgg 3420
gacatcctgt cccctcagtt catgtacggc tccaaggcct acgtgaagca ccccgccgac 3480
atccccgact acttgaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac 3540
ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga cggcgagttc 3600
atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt aatgcagaag 3660
aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg cgccctgaag 3720
ggcgagatca agcagaggct gaagctgaag gacggcggcc actacgacgc tgaggtcaag 3780
accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt caacatcaag 3840
ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga acgcgccgag 3900
ggccgccact ccaccggcgg catggacgag ctgtacaagg agggcagggg cagcctgctg 3960
acctgcggcg acgtggagga gaaccccggc cccatgcccc cccccaggct gctgttcttc 4020
ctgctgttcc tgacccccat ggaggtgagg cccgaggagc ccctggtggt gaaggtggag 4080
gagggcgaca acgccgtgct gcagtgcctg aagggcacca gcgacggccc cacccagcag 4140
ctgacctgga gcagggagag ccccctgaag cccttcctga agctgagcct gggcctgccc 4200
ggcctgggca tccacatgag gcccctggcc atctggctgt tcatcttcaa cgtgagccag 4260
cagatgggcg gcttctacct gtgccagccc ggccccccca gcgagaaggc ctggcagccc 4320
ggctggaccg tgaacgtgga gggcagcggc gagctgttca ggtggaacgt gagcgacctg 4380
ggcggcctgg gctgcggcct gaagaacagg agcagcgagg gccccagcag ccccagcggc 4440
aagctgatga gccccaagct gtacgtgtgg gccaaggaca ggcccgagat ctgggagggc 4500
gagcccccct gcctgccccc cagggacagc ctgaaccaga gcctgagcca ggacctgacc 4560
atggcccccg gcagcaccct gtggctgagc tgcggcgtgc cccccgacag cgtgagcagg 4620
ggccccctga gctggaccca cgtgcacccc aagggcccca agagcctgct gagcctggag 4680
ctgaaggacg acaggcccgc cagggacatg tgggtgatgg agaccggcct gctgctgccc 4740
agggccaccg cccaggacgc cggcaagtac tactgccaca ggggcaacct gaccatgagc 4800
ttccacctgg agatcaccgc caggcccgtg ctgtggcact ggctgctgag gaccggcggc 4860
tggaaggtga gcgccgtgac cctggcctac ctgatcttct gcctgtgcag cctggtgggc 4920
atcctgcacc tgcagagggc cctggtgctg aggaggaaga ggaagaggat gaccgacccc 4980
accaggaggt tctgaggcgc gccccgctga tcagcctcga ctgtgccttc tagttgccag 5040
ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 5100
gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 5160
ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 5220
gctggggatg cggtgggctc tatggcgtac gccttgaggc gccaggcctg gcccggctgg 5280
gccacgcggg ccgccgcctt cgcctccggg cgcgcgggcc tcctgttcgc gacaagcccg 5340
ccgggatccc gggccctggg cccggccacc gtcctggggc cgagggcgcc cgacggccag 5400
gatctcgctg taggtcaggc ccgcgcagcc tcctgcgccc agaagcccac gccgccgccg 5460
tctgctggcg ccccggccct cgcggaggtg tccgaggcga cgcacctcga gggtgtccgc 5520
cggccccagc acccagggga cgcgctggaa agcaaacagg aagattcccg gagggaaact 5580
gtgaatgctt ctgatttagc aatgctgtga ataaaaagaa agattttata cccttgactt 5640
aactttttaa ccaagttgtt tattccaaag agtgtggaat tttggttggg gtggggggag 5700
aggagggatg caactcgccc tgtttggcat ctaattctta tttttaattt ttccgcacct 5760
tatcaattgc aaaatgcgta tttgcatttg ggtggttttt atttttatat acgtttatat 5820
aaatatatat aaattgagct tgcttctttc ttgctttgac catggaaaga aatatgattc 5880
ccttttcttt aagttttatt taacttttct tttggacttt tgggtagttg tttttttttg 5940
ttttgttttg tttttttgag aaacagctac agctttgggt catttttaac tactgtattc 6000
ccacaaggaa tccccagata tttatgtatc ttgatgttca gacatttatg tgttgataat 6060
tttttaatta tttaaatgta cttatattaa gaaaaatatc aagtactaca ttttcttttg 6120
ttcttgatag tagccaaagt taaatgtatc acattgaaga aggctagaaa aaaagaatga 6180
gtaatgtgat cgcttggtta tccagaagta ttgtttacat taaactccct ttcatgttaa 6240
tcaaacaagt gagtagctca cgcatgacgt acgcgtcaat tgtccggaat tctgcagagt 6300
ggcggccgca catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 6360
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 6420
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 6480
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 6540
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 6600
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 6660
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 6720
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 6780
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 6840
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 6900
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 6960
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 7020
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 7080
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt ta 7132
<210> 10
<211> 4617
<212> DNA
<213> Artificial Sequence
<220>
<223> Runx1 2nd donor vector
<400> 10
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 60
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 120
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 180
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 240
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 300
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 360
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 420
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 480
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 540
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 600
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 660
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 720
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 780
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 840
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 900
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 960
gcgcacattt ccccgaaaag tgccacctga cgttaactcg agtcgacaag cttccaatct 1020
tcctgggcgg taaattctga tagaaaccca tctccctgga cagtagcatc ctgggtgtcc 1080
cccgtcctcc taggcggtag catcctgggt ggtctccatc ctcccaggtg gtgtcatcct 1140
gggtggtctc cgtcctctca ggaggtggca tcctgagtgg tccccgacct cctgggcata 1200
gcatcatggg tagtccccat cctcttggga ggtgacatgc tgggtgatcc tcgtcatctc 1260
aggaggtggc atcctgggtg gtccctgtcc ccctgggtat agcatcctgg gtaatcctcg 1320
tcctcttggg agtagcatcc cgggtggtcc ccgtcctccc cagcagtagc atcctgggtg 1380
gcttcccatc ctcctaggcg gtatcatcct gggtagcccc ctggggcaga gggaagagct 1440
gtggcctccg caacctccta ctcacttccg ctccgttctc ttgcccgccc tgcagcggca 1500
cccgacctga cagcgttcag cgacccgcgc cagttccccg cgctgccctc catctccgac 1560
ccccgcatgc actatccagg cgccttcacc tactccccga cgccggtcac ctcgggcatc 1620
ggcatcggca tgtcggccat gggctcggcc acgcgctacc acacctacct gccgccgccc 1680
taccccggct cgtcgcaagc gcagggaggc ccgttccaag ccagctcgcc ctcctaccac 1740
ctgtactacg gcgcctcggc cggctcctac cagttctcca tggtgggcgg cgagcgctcg 1800
ccgccgcgca tcctgccgcc ctgcaccaac gcctccaccg gctccgcgct gctcaacccc 1860
agcctcccga accagagcga cgtggtggag gccgagggca gccacagcaa ctcccccacc 1920
aacatggcgc cctccgcgcg cctggaggag gccgtgtgga ggccctacgg atcaggagag 1980
gggagaggat ccctgctgac ttgcggggat gtggaagaga accctggacc gatggtgagc 2040
aagggcgagg agaataacat ggccatcatc aaggagttca tgcgcttcaa ggtgcgcatg 2100
gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac 2160
gagggctttc agaccgctaa gctgaaggtg accaagggtg gccccctgcc cttcgcctgg 2220
gacatcctgt cccctcagtt cacctacggc tccaaggcct acgtgaagca ccccgccgac 2280
atccccgact acttcaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac 2340
ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga cggcgagttc 2400
atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt aatgcagaag 2460
aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg cgccctgaag 2520
ggcgagatca agatgaggct gaagctgaag gacggcggcc actacacctc cgaggtcaag 2580
accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacatcgt cggcatcaag 2640
ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga acgcgccgag 2700
ggccgccact ccaccggcgg catggacgag ctgtacaagt gaggcgccag gcctggcccg 2760
gctgggccac gcgggccgcc gccttcgcct ccgggcgcgc gggcctcctg ttcgcgacaa 2820
gcccgccggg atcccgggcc ctgggcccgg ccaccgtcct ggggccgagg gcgcccgacg 2880
gccaggatct cgctgtaggt caggcccgcg cagcctcctg cgcccagaag cccacgccgc 2940
cgccgtctgc tggcgccccg gccctcgcgg aggtgtccga ggcgacgcac ctcgagggtg 3000
tccgccggcc ccagcaccca ggggacgcgc tggaaagcaa acaggaagat tcccggaggg 3060
aaactgtgaa tgcttctgat ttagcaatgc tgtgaataaa aagaaagatt ttataccctt 3120
gacttaactt tttaaccaag ttgtttattc caaagagtgt ggaattttgg ttggggtggg 3180
gggagaggag ggatgcaact cgccctgttt ggcatctaat tcttattttt aatttttccg 3240
caccttatca attgcaaaat gcgtatttgc atttgggtgg tttttatttt tatatacgtt 3300
tatataaata tatataaatt gagcttgctt ctttcttgct ttgaccatgg aaagaaatat 3360
gattcccttt tctttaagtt ttatttaact tttcttttgg acttttgggt agttgttttt 3420
ttttgttttg ttttgttttt ttgagaaaca gctacagctt tgggtcattt ttaactactg 3480
tattcccaca aggaatcccc agatatttat gtatcttgat gttcagacat ttatgtgttg 3540
ataatttttt aattatttaa atgtacttat attaagaaaa atatcaagta ctacattttc 3600
ttttgttctt gatagtagcc aaagttaaat gtatcacatt gaagaaggct agaaaaaaag 3660
aatgagtaat gtgatcgctt ggttatccag aagtattgtt tacattaaac tccctttcat 3720
gttaatcaaa caagtgagta gctcacgcat gacgtacgcg tcaattgtcc ggaattctgc 3780
agagtggcgg ccgcacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3840
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3900
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3960
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4020
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 4080
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4140
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4200
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 4260
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 4320
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 4380
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 4440
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 4500
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 4560
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagtta 4617
<210> 11
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection of marker-integrated Tbx1
<220>
<221> source
<222> (1)..(24)
<223> sequence is synthesized
<400> 11
gaggattggg aagacaatag cagg 24
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection of marker-integrated Tbx1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 12
gcctccgacc gggcgctttg 20
<210> 13
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection and sequencing of marker-free Tbx1
<220>
<221> source
<222> (1)..(23)
<223> sequence is synthesized
<400> 13
ggcccagtga cccagcctca tct 23
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection and sequencing of marker-free Tbx1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 14
gcctccgacc gggcgctttg 20
<210> 15
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> marker-free Tbx1 read sequence
<220>
<221> source
<222> (1)..(21)
<223> sequence is synthesized
<400> 15
gctgcagggc tccagcggct t 21
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection of Runx1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 16
gggtggcaga ttctgggtag 20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection of Runx1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 17
cagcctggtg aaagcaacac 20
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> alternate UbC promoter forward primer
<220>
<221> source
<222> (1)..(21)
<223> sequence is synthesized
<400> 18
tgcgggaaag ctcttattcg g 21
<210> 19
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> alternate UbC promoter reverse primer
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 19
caaaaacggc cagaatttag cg 22
<210> 20
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> RUNX1 gRNA
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 20
ccgtatggag tccctactga gg 22
<210> 21
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> GFI1 gRNA
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 21
agggctcaaa tgaggaccca gg 22
<210> 22
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> GFI1 gRNA
<220>
<221> source
<222> (1)..(23)
<223> sequence is synthesized
<400> 22
atgggttcaa atgagcaacc tgg 23
<210> 23
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> GFI1 gRNA
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 23
atgggctcaa atgagcctct gg 22
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection of GFI1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 24
aatgccatgc tgggctattg 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection of GFI1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 25
ccagctttcc ccctacagac 20
<210> 26
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection of B2M
<220>
<221> source
<222> (1)..(21)
<223> sequence is synthesized
<400> 26
atgcagcgca atctccagtg a 21
<210> 27
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection of B2M
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 27
gtagctgcag acagttctcc aa 22
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection of random integration 1
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 28
aaggatcagg acgctcgctg 20
<210> 29
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection of random integration 1
<220>
<221> source
<222> (1)..(28)
<223> sequence is synthesized
<400> 29
gtctcatgag cggatacata tttgaatg 28
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for detection of random integration 2
<220>
<221> source
<222> (1)..(20)
<223> sequence is synthesized
<400> 30
cacctctgac ttgagcgtcg 20
<210> 31
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for detection of random integration 2
<220>
<221> source
<222> (1)..(27)
<223> sequence is synthesized
<400> 31
ggaaattgca tcgcattgtc tgagtag 27
<210> 32
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> TBX1 reference cDNA
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 32
ccaccggccc ggcgcactgc cg 22
<210> 33
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> TBX1 c. 928G>A
<220>
<221> source
<222> (1)..(22)
<223> sequence is synthesized
<400> 33
ccaccggccc agcgcactgc cg 22