IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ロンザ リミテッドの特許一覧 ▶ バブラハム・インスティテュートの特許一覧 ▶ ファイザー・インクの特許一覧

特許7549582予測可能かつ安定な導入遺伝子発現を有するSSI細胞および形成の方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-03
(45)【発行日】2024-09-11
(54)【発明の名称】予測可能かつ安定な導入遺伝子発現を有するSSI細胞および形成の方法
(51)【国際特許分類】
   C12N 5/10 20060101AFI20240904BHJP
   C12N 5/071 20100101ALI20240904BHJP
   C12N 15/13 20060101ALN20240904BHJP
   C12N 15/12 20060101ALN20240904BHJP
   C12N 15/52 20060101ALN20240904BHJP
   C12N 15/09 20060101ALN20240904BHJP
【FI】
C12N5/10 ZNA
C12N5/071
C12N15/13
C12N15/12
C12N15/52 Z
C12N15/09 100
【請求項の数】 19
(21)【出願番号】P 2021542082
(86)(22)【出願日】2019-10-01
(65)【公表番号】
(43)【公表日】2022-02-07
(86)【国際出願番号】 US2019054045
(87)【国際公開番号】W WO2020072480
(87)【国際公開日】2020-04-09
【審査請求日】2022-09-21
(31)【優先権主張番号】62/739,546
(32)【優先日】2018-10-01
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】391003864
【氏名又は名称】ロンザ リミテッド
【氏名又は名称原語表記】LONZA LIMITED
(73)【特許権者】
【識別番号】507404514
【氏名又は名称】バブラハム・インスティテュート
【氏名又は名称原語表記】BABRAHAM INSTITUTE
(73)【特許権者】
【識別番号】521127675
【氏名又は名称】ファイザー・インク
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100187540
【弁理士】
【氏名又は名称】國枝 由紀子
(72)【発明者】
【氏名】オカラガン,ピーター・エム
(72)【発明者】
【氏名】ベバン,スティーブン
(72)【発明者】
【氏名】ヤング,ロバート
(72)【発明者】
【氏名】フレイザー,ピーター
(72)【発明者】
【氏名】ジャーン,リン
【審査官】植原 克典
(56)【参考文献】
【文献】国際公開第2018/150269(WO,A1)
【文献】国際公開第2013/190032(WO,A1)
【文献】国際公開第2018/150271(WO,A1)
【文献】米国特許出願公開第2017/0130247(US,A1)
【文献】国際公開第2018/132518(WO,A1)
【文献】国際公開第2001/083751(WO,A2)
【文献】nature,2012年,Volume 485,pp. 376-380
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12N 5/00- 5/28
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
第1の高組込み性(HI)座位において染色体組込みされた第1の組換え標的部位(RTS)を含む哺乳動物細胞であって、前記第1のHI座位が、接近可能なクロマチンの活性のゲノムコンパートメント内かつトポロジカル関連ドメイン(TAD)境界の30,000塩基対以内にあり、前記第1のHI座位が、少なくとも1つのエンハンサーエレメントと相互作用する細胞ゲノムの領域とオーバーラップする、細胞。
【請求項2】
前記第1のHI座位が、配列番号1~125のうちの1つを含むか、または配列番号1~125のいずれか1つの5’末端もしくは3’末端のいずれかの5,000塩基対以内にあるか、もしくはそれとオーバーラップする、請求項1に記載の細胞。
【請求項3】
請求項1または2に記載の細胞であって、ここで:
前記第1のHI座位が、活性のゲノムコンパートメント内の転写開始部位(TSS)とオーバーラップする;あるいは、
前記第1のHI座位が遺伝子座とオーバーラップしない;あるいは、
前記第1のHI座位が、遺伝子座のインサイチューの内因性プロモーターとオーバーラップせず、たとえば前記第1のHI座位が、前記プロモーターの1,000塩基対以内にない、
前記細胞。
【請求項4】
前記第1のHI座位が、活性のゲノムコンパートメント内の転写開始部位(TSS)とオーバーラップし、前記TSSが、活性の遺伝子に作動可能に連結しており、前記活性の遺伝子の発現または発現の欠如が、前記哺乳動物細胞に対して不可欠ではない、請求項3に記載の細胞。
【請求項5】
第2の別個のRTSを含み、任意選択で追加の別個のRTSを含む、請求項1~4のいずれか一項に記載の細胞であって、ここで:
前記第1のRTSおよび前記第2の別個のRTSが、前記第1のHI座位内に染色体組込みされている;あるいは、
前記第2の別個のRTSが、第2のHI座位内に染色体組込みされている;あるいは、
前記第2の別個のRTSが、別々の座位において染色体組込みされていて、たとえば前記別々の座位がFer1L4座位であり、
かつ、任意選択で、前記RTSのうちの少なくとも1つが、frt部位、lox部位、rox部位、またはatt部位であり、たとえば前記RTSのうちの少なくとも1つが、配列番号126~155の中から選択される配列を含む、前記細胞。
【請求項6】
前記哺乳動物細胞が、マウス細胞、ヒト細胞、チャイニーズハムスター卵巣(CHO)細胞、CHO-K1細胞、CHO-DXB11細胞、CHO-DG44細胞、CHOK1SV(商標)もしくはそのバリアント、CHOグルタミンシンセターゼノックアウト細胞もしくはそのバリアント、HEK細胞、HEK293細胞もしくはその接着もしくは懸濁適応性のバリアント、HeLa細胞、またはHT1080細胞である、請求項1~5のいずれか1項に記載の細胞。
【請求項7】
請求項1~6のいずれか1項に記載の細胞であって、第1の目的の遺伝子をさらに含み、前記第1の目的の遺伝子が染色体組込みされている

前記細胞。
【請求項8】
前記第1の目的の遺伝子が、レポーター遺伝子、選択遺伝子、治療目的の遺伝子、補助的遺伝子、またはその組合せを含み、たとえば前記目的の遺伝子が、発現困難タンパク質、たとえばFc融合タンパク質、酵素、膜受容体、またはモノクローナル抗体からなる群から選択される発現困難タンパク質をコードする遺伝子を含む治療目的の遺伝子を含む、請求項7に記載の細胞。
【請求項9】
さらに、前記第1の目的の遺伝子が、2つのRTSの間に位置する、請求項7または8に記載の細胞。
【請求項10】
前記第1の目的の遺伝子が、前記第1のHI座位内に位置する、請求項7または8に記載の細胞。
【請求項11】
第2の目的の遺伝子をさらに含み、任意選択でさらに第3の目的の遺伝子を含む、請求項1~10のいずれか1項に記載の細胞であって、ここで:
前記第2の目的の遺伝子および前記第3の目的の遺伝子が、存在する場合は、染色体組込みされていて、かつ、前記第2の目的の遺伝子が、前記第1のHI座位内に位置する;あるいは、
前記第1の目的の遺伝子が、前記第1のHI座位内に位置し、かつ前記第2の目的の遺伝子が、第2のHI座位内または別々の座位内に位置する;あるいは、
a.前記第1の目的の遺伝子、前記第2の目的の遺伝子、および前記第3の目的の遺伝子のうちの少なくとも1つが、前記第1のHI座位内にあり、かつ
b.前記第1の目的の遺伝子、前記第2の目的の遺伝子、および前記第3の目的の遺伝子のうちの少なくとも1つが、第2のHI座位内にある、
前記細胞。
【請求項12】
部位特異的リコンビナーゼ遺伝子をさらに含む、請求項1~11のいずれか1項に記載の細胞であって、任意選択で、前記部位特異的リコンビナーゼ遺伝子が染色体組込みされている、前記細胞。
【請求項13】
組換え細胞を製造する方法であって、
a.細胞ゲノムの接近可能なクロマチンにおいてピークをマッピングすること、
b.前記マッピングされたピーク内で、前記接近可能なクロマチンの活性のゲノムコンパートメント内かつトポロジカル関連ドメイン(TAD)境界の30,000塩基対以内にあるピークの第1のセットを同定すること、
c.ピークの前記第1のセット内で、第1の高組込み性(HI)座位を定義することであって、前記第1のHI座位が、少なくとも1つのエンハンサーエレメントと相互作用する前記ゲノムの領域とオーバーラップする、前記定義すること、および
d.第1の組換え標的部位(RTS)を前記第1のHI座位内に挿入すること
を含む、方法。
【請求項14】
組換え細胞を製造する方法であって、
a.細胞ゲノムの接近可能なクロマチンにおいてピークをマッピングすること、
b.前記マッピングされたピーク内で、前記接近可能なクロマチンの活性のゲノムコンパートメント内かつトポロジカル関連ドメイン(TAD)境界の30,000塩基対以内にあるピークの第1のセットを同定すること、
c.前記接近可能なクロマチン内で、少なくとも1つのエンハンサーエレメントと相互作用する前記ゲノムの領域を同定すること、
d.ピークの前記第1のセット内で、複数の高組込み性(HI)座位を定義することであって、前記複数のHI座位の各HI座位が、同定された領域とオーバーラップする、前記定義すること、
e.組換え標的部位(RTS)を複数の細胞に組み込むこと、および
f.前記複数の細胞から、HI座位において組み込まれた前記RTSを含む細胞を選択すること
を含む、方法。
【請求項15】
前記HI座位が、配列番号1~125のうちの1つを含むか、または配列番号1~125のいずれか1つの5’末端もしくは3’末端のいずれかの5,000塩基対以内にあるか、もしくはそれとオーバーラップする、請求項13または14に記載の方法。
【請求項16】
ピークの前記第1のセット内で、その発現生成物またはその欠如が不可欠でない遺伝子のための任意の転写開始部位(TSS)とオーバーラップするピークを同定すること、および前記遺伝子とオーバーラップし、かつ前記TSSの下流にあるピークの第2のセットを定義することであって、前記HI座位が、ピークの前記第2のセット内に定義される、前記定義することをさらに含む、請求項13~15のいずれか一項に記載の方法。
【請求項17】
ピークの前記第1のセット内で、いかなる遺伝子ともオーバーラップしないピークの第3のセットを同定することであって、前記HI座位が、ピークの前記第3のセット内に定義される、前記同定することをさらに含む、請求項13~15のいずれか一項に記載の方法。
【請求項18】
第1の目的の遺伝子をコードする交換可能なカセットを含む第1のベクターを請求項13に記載の細胞または請求項14に記載の複数の細胞にトランスフェクトすること、および前記第1の交換可能なカセットを該細胞のHI座位内に組み込むことをさらに含む、請求項13~17のいずれか一項に記載の方法であって、
染色体に組み込まれた前記第1の交換可能なカセットを含む組換えタンパク質産生細胞を選択することをさらに含む、
前記方法。
【請求項19】
前記HI座位を順位付けすることをさらに含む、請求項13~18のいずれか1項に記載の方法であって、たとえば、前記HI座位が、各座位と関連付けられる1つまたはより多くの遺伝子の発現レベル、各座位から最近接のTAD境界までの距離、各座位における予測されるエンハンサー相互作用の数、および各座位と関連付けられる1つまたはより多くの遺伝子のmRNAの発現レベルのうちの1つまたはより多くにしたがって順位付けされる、前記方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年10月1日の出願日を有する米国仮特許出願第62/739,546号の出願の利益を主張し、該仮特許出願は参照により全ての目的のために本明細書に組み込まれる。
【背景技術】
【0002】
異種ポリペプチドの発現のための宿主細胞中での組換えタンパク質(recombinant protein;rP)発現カセットの組込みが長年実行されてきた。伝統的に、発現カセットの組込みのためにゲノム中に存在する二本鎖切断を利用するランダム組込み(random integration;RI)プロセスが使用されていた。残念なことに、位置雑多性効果に起因して、組み込まれる遺伝子コピーの数および組込み部位における発現的特徴の両方はRIプロセスにおいて高度に変動性であって、望ましくない表現型上の不均質性を生じさせることがある。そのため、RIプロセスは、有用な細胞系の開発において組込み事象の高価なスクリーニングを要求する。さらに、発現を増加させるために使用される遺伝子増幅方法は、ゲノムにおける不安定性(例えば、欠失、重複、転座)の他に、発現修飾性のエピジェネティックな作用(例えば、メチル化、ヒストン修飾、ヘテロクロマチン侵入)を生じさせることがある。結果として、RI製造性の細胞系は多くの場合に不安定であり、経時的な製造の低減を示す。
【0003】
より最近では、部位特異的組込み(site-specific integration;SSI)が開発されており、SSIでは、Saccharomyces cerevisiae由来のFLP-FrtシステムまたはバクテリオファージP1由来のCre-loxPシステムなどの部位特異的リコンビナーゼシステムに由来する組換え標的部位(recombination target site;RTS)の組込みを通じて細胞ゲノム中に「ランディングパッド」が形成される。SSI細胞系中にカセットを組み込むプロセスは、リコンビナーゼ媒介性カセット交換(recombinase-mediated cassette-exchange;RMCE)と称される。RMCEは、一般に、リコンビナーゼをコードする発現ベクターと、リコンビナーゼ標的化配列により隣接される目的の遺伝子(gene of interest;GOI)を含有する標的化発現ベクターとの共トランスフェクションを伴う。(ドナーDNAおよび標的DNAの両方において)交換されるカセットの5’および3’末端において別個のRTSを使用することにより、SSI組込みアプローチは、組換えが方向性の方式で起こることおよび好ましいカセット領域のみが交換されることを確実にすることができる。
【0004】
残念なことに、SSI生成性の細胞系もまた、制限を有し得る。例えば、SSIシステムは、ベクター標的化およびGOIを発現する細胞系の生成のための必要条件としてゲノムへのRTSの挿入を要求する。RTS挿入は、一般に、RIによりまたは限定された数の特定のゲノム領域中に実行されるため、結果としてもたらされる細胞系は依然として不安定性および経時的な製造の低減にさらされる。さらに、SSIは、一般に、組み込まれる遺伝子コピーの低い数を結果としてもたらし、これはrP製造タイターを間接的に制限する可能性がある。
【0005】
組換え遺伝子の組み込まれるコピーを増加させる1つの方法は、累積的または蓄積的SSIと称される(例えば、Kameyama et al.Biotechnol.Bioeng.105:1106-14(2010)、Kawabe et al.Cytotechnology 64:267-79(2012)およびTuran et al.J.Mol.Biol.402:52-69(2010)を参照)。そのような方法は、単一の部位に逐次的にrP発現カセットの複数のコピーを積み込むためのRMCEの繰返しのラウンドを含むことができる。
【0006】
当該技術分野において必要とされるのは、宿主細胞のゲノム内の転写的に活性かつ高度に安定な座位においてRTSを組み込むSSI細胞系である。そのような細胞系は、GOIの安定かつ長期間の発現が可能であろう。
【0007】
刊行物、特許、および特許出願が本明細書において参照され、それらの開示は参照により全体が本明細書に組み込まれる。
【発明の概要】
【0008】
本開示は、導入遺伝子挿入部位からの転写出力の他に、その発現系の安定性は、その領域中のクロマチンの3次元(3D)構造により強く影響を及ぼされるという認識に基づく。本開示は、構造の決定および3次元におけるゲノムの確認(ゲノムの3Dマッピング)のためのこの認識に基づく方法を記載する。開示される3Dマッピング方法は、とりわけ、例えば、Hi-Cおよび他の染色体コンホメーション捕捉方法(Elzo de Wit and Wouter de Laat.Genes Dev.2012 26:11-24)ならびにプロモーター捕捉Hi-C(Promoter Capture Hi-C)(Schoenfelder et al.Genome Res 25:582-97(2015))などの技術の利用を通じて実行することができる。3Dマッピングプロトコールにより得られる情報を利用する方法の他に、該方法により形成され得る哺乳動物細胞もまた記載される。本出願は、マルチレベル3Dゲノムマップを生成し、次にその情報を使用して異種遺伝子の発現のための最適なゲノム組込み部位を同定する方法を教示する。例えば、マッピングされた3Dゲノム構造を調べることにより、高性能を呈するらしい組込み部位を同定することができる。
【0009】
一実施形態では、本開示は、高組込み性(high integrating;HI)座位においてRTSを含む哺乳動物細胞を対象とする。HI座位は、ゲノムクロマチンの3D階層構造の解析を通じて本発明者らにより同定された高性能ゲノム部位である。有益なことに、HI座位は、ゲノムの安定な、転写的に活性の環境中にあり、予測可能かつ安定なレベルのGOI発現を与えるために繰り返して標的化され得る。
【0010】
HI座位は、接近可能なクロマチンの活性のゲノムコンパートメント内にあることができ、そしてまた、トポロジカル関連ドメイン(topologically associated domain;TAD)境界の約30,000塩基対以内にあることができる。追加的に、HI座位は、少なくとも1つのエンハンサーエレメントと相互作用するゲノムの領域とオーバーラップすることができる。HI座位は、GOIの発現がインサイチューの内因性プロモーターにより駆動されるのか、それとも異種プロモーターにより駆動されるのかに依存して変動することができる。例えば、GOIの発現がインサイチューの内因性プロモーターにより駆動される細胞系において、HI座位は、転写開始部位(transcription start site;TSS)とオーバーラップすること、およびその下流にあることができる。さらに、この実施形態では、HI座位は、活性の、および一部の実施形態では完全にアノテーション付きでもある、遺伝子座、例えば、その発現生成物またはその欠如が細胞に対して不可欠でない活性の遺伝子とオーバーラップすることができる。GOIの発現が異種プロモーターにより駆動される細胞系において、HI座位は、一般に、活性のまたは転写されない遺伝子座の外部にあることができる。例えば、そのような細胞中のHI座位は、活性の遺伝子のいかなる関連付けられるプロモーター領域ともオーバーラップしない、または一実施形態では、いかなる活性の遺伝子の約1,000塩基対以内にもない(例えば、いかなる活性の完全にアノテーション付きの遺伝子の約1,000塩基対以内にもない)座位を包含することができる。
【0011】
一部の実施形態では、細胞は、複数のRTS、例えば、少なくとも2つのRTS、少なくとも4つのRTS、または一部の実施形態ではよりいっそう多くを含むことができる。例えば、細胞は、単一のHI座位中、別個のHI座位中、および/または別々の座位(例えば、FerIL4座位)中に複数のRTSを含むことができる。
【0012】
一部の実施形態では、RTSは、Frt部位、lox部位、rox部位、またはatt部位を含むことができる。一部の実施形態では、RTSは、配列番号126~155の中から選択される配列を含むことができる。
【0013】
本明細書に包含される細胞種は、マウス細胞、ヒト細胞、チャイニーズハムスター卵巣(CHO)細胞、CHO-K1細胞、CHO-DXB11細胞、CHO-DG44細胞、全てのバリアントを含むCHOK1SV(商標)細胞、全てのバリアントを含むCHOグルタミンシンセターゼノックアウト細胞、HEK細胞、接着および懸濁適応バリアントを含むHEK293細胞、HeLa細胞、またはHT1080細胞を含むことができるがそれに限定されない。
【0014】
一実施形態では、細胞は、GOI、例えば、染色体組込みされたGOI、例えば、レポーター遺伝子、選択遺伝子、治療目的の遺伝子、補助的遺伝子、または遺伝子の組合せを含むことができる。GOIは、発現困難(difficult to express;DtE)タンパク質、例えば、Fc融合タンパク質、酵素、膜受容体、またはモノクローナル抗体(例えば、二重特異性もしくは三重特異性モノクローナル抗体)をコードすることができる。一実施形態では、GOIは、単一のHI座位内の2つのRTSの間に位置することができる。細胞は、一部の実施形態では、複数のGOIを組み込むことができる。例えば、細胞は、単一のHI座位内に2つもしくはより多くのGOIを組み込むことができ、その1つもしくはより多くが異なるHI座位中にある複数のGOIを組み込むことができ、かつ/またはHI座位および別々の座位の任意の組合せ中に複数のGOIを組み込むことができる。一部の実施形態では、細胞は、リコンビナーゼ遺伝子、例えば、一実施形態では染色体組込みされ得る、部位特異的リコンビナーゼ遺伝子を組み込むことができる。
【0015】
組換え細胞を製造する方法もまた開示される。例えば、方法は、細胞ゲノムの接近可能なクロマチンにおいてピークをマッピングすること、および、接近可能なクロマチンにおいてマッピングされたピーク内で、接近可能なクロマチンの活性のゲノムコンパートメント内にあり、かつトポロジカル関連ドメイン(TAD)境界の約30,000塩基対以内にもあるピークの第1のセットを同定することを含むことができる。一実施形態では、ピークの第1のセットは、(例えば、主成分分析法(Principle Component Analysis Methods;PCA)により定義されるような)活性のゲノムコンパートメント内にあることができ、かつ(例えば、ATAC-seqにより定義されるような)オープンクロマチン内にもあることができるが、これは方法の要求ではなく、他の実施形態では、ピークの第1のセットは、マッピングされた接近可能なクロマチンの全体内の活性のゲノムコンパートメント内にあるピークを含むことができる。方法はまた、ピークの第1のセットの中で、少なくとも1つのエンハンサーエレメントと相互作用するゲノムの領域とオーバーラップするものを同定することを含むことができる。HI座位は、次に、これらの基準に適合するピークの中で定義され得る。HI座位の同定後に、RTSをHI座位に挿入することができる。任意選択的に、部位特異的リコンビナーゼをコードする遺伝子もまた細胞に挿入することができる。
【0016】
HI座位からの遺伝子の発現がインサイチューの内因性プロモーターにより駆動される実施形態では、方法は、少なくとも1つのエンハンサーエレメントと相互作用するゲノムの領域とオーバーラップするピークの第1のセットの中で、TSS、特に、その発現生成物またはその欠如が不可欠でない活性の遺伝子のTSSとオーバーラップするピークの第2のセットを同定することをさらに含むことができる。HI座位をピークのこの第2のセット内で定義することができ、HI座位は、活性の遺伝子とオーバーラップし、かつ活性の遺伝子のTSSの下流にある。
【0017】
HI座位からの遺伝子の発現が異種プロモーターにより駆動される実施形態では、方法は、少なくとも1つのエンハンサーエレメントと相互作用するゲノムの領域とオーバーラップするピークの第1のセット内で、活性の遺伝子ともそれらの関連付けられるプロモーター領域ともオーバーラップしない接近可能なクロマチン内のピークを同定することをさらに含むことができ、HI座位をピークのこの第2のセット内で定義することができる。
【0018】
方法はまた、GOIをコードする交換可能なカセットを含むベクターを細胞にトランスフェクトすることおよび交換可能なカセットをHI座位に組み込むことを含むことができる。HI座位において染色体に組み込まれた交換可能なカセットを含む細胞を次に組換えタンパク質産生細胞として選択することができる。
【0019】
任意選択的に、方法は、追加のRTSを細胞に組み込むことを含むことができる。例えば、追加のRTSは、第1のRTSと同じHI座位、1つもしくはより多くの追加のHI座位、および/または1つもしくはより多くの別々の座位に組み込むことができる。
【0020】
別の実施形態によれば、細胞ゲノムの接近可能なクロマチンにおいてピークをマッピングすること、および、接近可能なクロマチンにおいてマッピングされたピーク内で、接近可能なクロマチンの活性のゲノムコンパートメント内にあり、かつトポロジカル関連ドメイン(TAD)境界の約30,000塩基対以内にもあるピークの第1のセットを同定することを含む、組換え細胞を製造する方法が開示される。一実施形態では、ピークの第1のセットは、(例えば、主成分分析法(PCA)により定義されるような)活性のゲノムコンパートメント内にあることができ、かつ(例えば、ATAC-seqにより定義されるような)オープンクロマチン内にもあることができるが、これは方法の要求ではなく、他の実施形態では、ピークの第1のセットは、マッピングされた接近可能なクロマチンの全体内の活性のゲノムコンパートメント内にあるピークを含むことができる。方法はまた、ピークの第1のセット内で、少なくとも1つのエンハンサーエレメントと相互作用するゲノムの領域とオーバーラップするものを同定することを含むことができる。複数のHI座位を次に、マッピングされたピークの結果としてもたらされるセット内で定義することができる。方法は、(例えば、RIプロトコールにしたがって)RTSを複数の細胞に組み込むこと、および次にその複数の細胞からHI座位に組み込まれたRTSを含む細胞を選択することをさらに含むことができる。任意選択的にまた、部位特異的リコンビナーゼをコードする遺伝子をその選択された細胞に挿入することができる。
【0021】
一実施形態では、方法により同定されたHI座位を有効性にしたがって順位付けすることができる。例えば、HI座位は、各座位と関連付けられる1つまたはより多くの遺伝子の発現レベル、各座位から最近接のTAD境界までの距離、および各座位の予測されるエンハンサー相互作用の数のうちの1つまたはより多くにしたがって順位付けすることができる。HI座位に組み込まれたRTSを含む細胞が選択される1つのそのような実施形態では、HI座位挿入部位の順位にしたがって細胞を選択することができる。
【0022】
一実施形態では、HI座位を定義する方法はまた、HI座位が、インサイチューの内因性プロモーターまたは異種プロモーターのいずれを用いて駆動される異種遺伝子を発現するために利用されることが意図されるのかに依存することができる。例えば、HI座位からの遺伝子の発現がインサイチューの内因性プロモーターにより駆動される実施形態では、方法は、上記に定義されるようなマッピングされたピークの結果としてもたらされるセット内で、その発現生成物またはその欠如が不可欠でない活性の遺伝子などの、活性の遺伝子のTSSとオーバーラップするピークを同定することをさらに含むことができる。同定された遺伝子とオーバーラップし、かつこれらの同定された遺伝子のTSSの下流にあるピークの第2のセットを次に定義することができ、HI座位をピークのこの第2のセット内で定義することができる。
【0023】
HI座位からの遺伝子の発現が異種プロモーターにより駆動される実施形態では、方法は、上記に定義されるようなマッピングされたピークの結果としてもたらされるセット内で、いかなる遺伝子、例えば、いかなる活性の遺伝子とも、それらの関連付けられるプロモーター領域ともオーバーラップしないピークの第2のセットを同定することをさらに含むことができ、HI座位をピークのこの第2のセット内で定義することができる。
【0024】
方法はまた、HI座位に組み込まれたRTSを含む選択された細胞にGOIをコードする交換可能なカセットを含むベクターをトランスフェクトすることおよび交換可能なカセットをHI座位に組み込むことを含むことができる。染色体に組み込まれた交換可能なカセットを含む細胞を次に組換えタンパク質産生細胞として選択することができる。
【0025】
任意選択的に、方法は、追加のRTSを細胞に組み込むことを含むことができる。例えば、追加のRTSは、第1のHI座位、1つもしくはより多くの追加のHI座位、および/または1つもしくはより多くの別々の座位に組み込むことができる。
【図面の簡単な説明】
【0026】
当業者に対するその最良の形態を含む本発明の主題の完全かつ実施可能にする開示は、添付の図面への参照を含めて、本明細書の残りの部分においてより具体的に示される。
図1】1は、ゲノムの3Dマップの生成ならびに候補HI座位を定義および順位付けするためのその利用の方法の一実施形態を示すフローチャートを提示する。図表は、逐次的なフィルタリングまたはスクリーニングプロセスの要約を示し、該プロセスにより、マルチレベル3Dゲノムマップを生成するために使用されるデータを次に使用して候補HI座位を同定することができる。
図2A図2Aは、個々のCHO-K1SV未加工スキャフォールドの解像(resolution)においてLACHESISアセンブリーにマッピングされたデータについてのゲノムワイドHi-Cヒートマップのセクションを示す。シス相互作用のみをプロットしており、最小LACHESIS群7、8および9は視覚的明確性を理由に含めていない。
図2B図2Bは、個々のインプットCHO-K1SVスキャフォールドおよび最終LACHESISアセンブリーにマッピングされたCHO-K1SV 10E9 Hi-C複製物にわたる近接シス(<10kb)、遠方シス(>10kb)およびトランス特有の、有効なジタグ(di-tags)の平均パーセンテージを表し示す100%に積み上げられた棒グラフを示す。比較のために、ヒト胚性幹細胞およびマウス胎仔肝細胞に由来する同等のHi-Cデータセットの複製物にわたり平均化した、近接シス、遠方シスおよびトランスジタグの分布を含めている(Nagano,T.et al.Comparison of Hi-C results using in-solution versus in-nucleus ligation.Genome Biol.16,175(2015))。
図3A図3Aは、候補HI座位配列番号3の構造的特徴を示す(位置を菱形により指し示す)。候補座位は活性のユークロマチン様領域内に存在することを示すHi-C PCAの結果(左)。近傍において同定されたTADに対する候補座位の位置(中央)。ATAC-Seq、H3K4me3、H3K27acおよびH3K4me1シグナルを用いてアノテーションされた候補座位HindIII制限断片ならびにベイト付きのプロモーターHindIII制限断片の位置の相互作用プロファイル(右)。
図3B図3Bは、候補HI座位配列番号2の構造的特徴を示す(位置を菱形により指し示す)。候補座位は活性のユークロマチン様領域内に存在することを示すHi-C PCAの結果(左)。近傍において同定されたTADに対する候補座位の位置(中央)。ATAC-Seq、H3K4me3、H3K27acおよびH3K4me1シグナルを用いてアノテーションされた候補座位HindIII制限断片ならびにベイト付きのプロモーターHindIII制限断片の位置の相互作用プロファイル(右)。
図3C図3Cは、現行の産業上関連するFer1L4ランディングパッドの構造的特徴を示す(位置を菱形により指し示す)。候補座位は活性のユークロマチン様領域内に存在することを示すHi-C PCAの結果(左)。近傍において同定されたTADに対する候補座位の位置(中央)。ATAC-Seq、H3K4me3、H3K27acおよびH3K4me1シグナルを用いてアノテーションされた候補座位HindIII制限断片ならびにベイト付きのプロモーターHindIII制限断片の位置の相互作用プロファイル(右)。
図4A図4A図4Dは、CMVプロモーターの制御下の組み込まれたeGFPレポーターカセットの発現についての表1から取られたゲノム座位のサブセットのスクリーニングの結果を示す。候補座位を図1に記載のスクリーニングプロセスにより同定し、座位特異的ガイドRNAと組み合わせてCas9ヌクレアーゼを使用して同一のCMV-eGFP発現カセットを該座位に標的化することにより経験的に試験した。図4Aに示されるドナープラスミド内に含有されるCMV-eGFPカセットを、トランスフェクション後のプラスミドからのCMV-eGFPカセットのインビボCas9媒介性切断のために要求される「シュードgRNA」(pseudo gRNA)配列も発現する細胞にトランスフェクトした。プラスミドから放出されると、CMV-eGFPカセットは、BbsI部位においてgRNAスキャフォールド配列の上流でドナープラスミドにクローニングされた、座位特異的gRNAの発現により要求されるゲノム座位への組込みのために標的化される。Cas9ヌクレアーゼは、別々のプラスミド(図示せず)上での共トランスフェクションにおいて供給した。図4Bは、図4Cに示される各プールについてのGFP+細胞のメジアンGFPシグナルと共に、Cas9およびCMV-eGFPドナープラスミドの両方のトランスフェクションの13日後の、チャイニーズハムスター卵巣SSI 10E9細胞系(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56)のプールにおいて達成されたGFP陽性細胞のパーセンテージを示す。図4Cにおいて、各標的座位についての2つのバーはフローサイトメーター解析の技術的複製物を表す。各プールにおけるCMV-eGFPカセットのオンターゲット組込みを確認するために、抽出されたゲノムDNAに対してPCRベースのアッセイを使用した(図4D)。PCR生成物はオンターゲットゲノム組込みにおいてのみ製造され、ドナープラスミドのみ(「D」)が鋳型として使用された場合にはPCR生成物は製造されない。「ドナー」はドナープラスミドを指し、「Het対照」はヘテロクロマチン対照組込み部位を指し、「Fer1l4」は、以下において言及される10E9細胞系を用いたランディングパッドを指す。
図4B】同上。
図4C】同上。
図4D】同上。
【発明を実施するための形態】
【0027】
本議論は例示的な実施形態の説明に過ぎず、本開示のより広い態様を限定することは意図されないことが当業者により理解されるべきである。
【0028】
本開示は、一般に、細胞ゲノムの3Dマップの構築、および1つの具体的な実施形態では、チャイニーズハムスター卵巣細胞ゲノムの3Dマップの構築を対象とする。組換え導入遺伝子が発現され得る高性能組込み部位(HI座位)を同定するためのそのようなマップの使用もまた開示される。3Dマップは、本明細書にさらに記載される1つの具体的な実施形態では、ゲノムワイド転写活性に関するRNA-Seqデータの他に核ヒストンのメチル化およびアセチル化のデータセットと組み合わせたATAC-seq(Assay for Transposase-Accessible Chromatin using sequencing)(Buenrostro et al.10:1213-8(2013))、Hi-C、およびプロモーター捕捉Hi-Cなどの直交的方法の組合せの使用により生成することができる。そのようなアプローチを通じて、3Dゲノムの他にその発現プロファイルの大域的な描写を生成することができ、これはH1座位の認識および設計の情報を与えることができる。
【0029】
一実施形態によれば、HI座位内に組み込まれたRTSを含む哺乳動物細胞が開示される。哺乳動物細胞を組み込んだrP産生細胞系およびそのような哺乳動物細胞を形成する方法もまた開示される。本明細書に記載のHI座位および細胞ゲノム中のHI座位を同定する方法は、哺乳動物細胞中のクロマチンの3D階層構造の理解およびマッピングを通じて開発された。HI座位は、クロマチンの接近可能性およびエピジェネティックな安定性の両方を提供することができる転写的に活性の環境中に存在する。そのため、1つまたはより多くのHI座位において(すなわち、完全に内部に、オーバーラップして、または+/-約5Kbで)RTSを組み込んだSSI哺乳動物細胞は、予測可能かつ安定な導入遺伝子の製造を提供することができる。例えば、開示されるような哺乳動物細胞中でのGOIの発現は、約70、約100、約150、約200、または約300世代にわたり安定であり得る。本明細書において利用される場合、発現は、製造開始の直後の初期発現レベルと比較した場合に経時的に約30%もしくはそれ未満だけ減少し、または同じレベルもしくは増加したレベル(例えば、約30%もしくはそれより大きい)に維持される場合に「安定」であると考えることができる。一部の実施形態では、発現は、容量生産性が±30%未満で変化し、または同じレベルに維持される場合に安定であると考えられる。一部の実施形態では、SSI宿主細胞は、約1.5g/L、約2g/L、約3g/L、約4g/L、もしくは約5g/Lまたはより多くのGOIの発現生成物を製造することができる。一部の実施形態では、SSI細胞(例えば、SSI細胞系)は、さらなる選択なしに培養において維持することができる。そのため、開示される細胞系は、規制機関にとってより許容可能なものであり得る。
【0030】
本明細書において使用される場合、「約」という用語は、値が、値を決定するために用いられている方法/デバイスについて本来備わっている誤差の変動、または研究対象の間で存在する変動を含むことを指し示すために使用される。典型的には、該用語は、状況に依存して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%もしくは20%程度またはそれ未満の変動性を包含することが意味される。
【0031】
一実施形態では、哺乳動物細胞はチャイニーズハムスター卵巣(CHO)細胞に由来することができる。この議論の大半はCHO細胞および細胞系に言及するが、本開示はいかなる具体的な細胞種にも決して限定されないことが理解されるべきであり、本明細書において言及される場合、「哺乳動物細胞」という用語は、哺乳目の任意のメンバーからの細胞を含む。本明細書に包含される哺乳動物細胞としては、ヒト細胞、マウス細胞、ラット細胞、サル細胞、ハムスター細胞、およびウシ細胞などを挙げることができるがそれに限定されない。一部の実施形態では、哺乳動物細胞は、マウス細胞(例えば、マウス骨髄腫、例えば、NS0もしくはSP2/0細胞系)、ヒト細胞、チャイニーズハムスター卵巣(CHO)細胞、CHO-K1細胞、CHO-DXB11細胞、CHO-DG44細胞、全てのバリアントを含むCHOK1SV(商標)細胞(例えば、CHOK1SV(商標)POTELLIGENT(登録商標)、Lonza、Slough、UK)、全てのバリアントを含むCHOグルタミンシンセターゼノックアウト細胞(例えば、GS-KO(商標)、Xceed(商標))、DG44 CHO細胞、DUXB11 CHO細胞、CHOS、CHO FUT8 GSノックアウト細胞、CHOZN、または任意のCHO由来の細胞である。
【0032】
一実施形態によれば、ゲノム内に天然に存在するHI座位を同定することができ、この同定を使用して、HI座位のうちの1つまたはより多くにおいて染色体組込みされた異種核酸分子を組み込んだ哺乳動物細胞を開発することができる。例えば、異種核酸分子は、組換えタンパク質の製造用の細胞系の形成においてGOIを発現するために設計された外因性のカセットを包含することができる。
【0033】
本明細書において使用される場合、「核酸」、「核酸分子」、および「オリゴヌクレオチド」という用語は交換可能であり、共有結合的に連結したヌクレオチドを含むポリマー化合物を指す。該用語は、ポリ(リボ核酸)(RNA)およびポリ(デオキシリボ核酸)(DNA)を含み、これらの両方は、一本鎖または二本鎖であってもよい。DNAとしては、相補的(complimentary)DNA(cDNA)、ゲノムDNA、プラスミドまたはベクターDNA、および合成DNAが挙げられるがそれに限定されない。RNAとしては、mRNA、tRNA、rRNA、snRNA、マイクロRNA、miRNA、またはMIRNAが挙げられるがそれに限定されない。
【0034】
本明細書において使用される場合、「ペプチド」、「ポリペプチド」、および「タンパク質」という用語は交換可能であり、任意の長さのアミノ酸のポリマー形態を指し、該形態は、コーディングされたおよびコーディングされないアミノ酸、化学的もしくは生化学的に修飾されたまたは誘導体化されたアミノ酸、ならびに修飾されたペプチド骨格を有するポリペプチドを含むことができる。「鎖」およびポリペプチド「鎖」という用語は本明細書において交換可能に使用され、単一のペプチド骨格のアミノ酸のポリマー形態を指す。「アミノ酸」という用語は、天然および非天然、すなわち合成の両方のアミノ酸を指す。
【0035】
本明細書において使用される場合、「組換え」という用語は、核酸分子、ペプチド、ポリペプチド、またはタンパク質に関して使用される場合、天然に存在することが知られていない遺伝材料の新たな組合せを意味し、またはその結果としてもたらされる。組換え分子は、組換え技術の分野において利用可能な任意の周知の技術により製造することができ、該技術としては、ポリメラーゼ連鎖反応(PCR)、遺伝子切断(例えば、制限エンドヌクレアーゼを使用する)、DNAライゲーション(例えば、DNAリガーゼ酵素を使用する)、RI、RMCE、CRISPR媒介性の技術、核酸分子、ペプチド、またはタンパク質の固体状態合成の他に、技術の組合せが挙げられるがそれに限定されない。一部の実施形態では、「組換え」は、天然に存在することが知られていないウイルスベクターまたはウイルス、例えば、ウイルスベクターまたはウイルス中に1つまたはより多くの突然変異、核酸挿入、または異種遺伝子を有するウイルスベクターまたはウイルスを指す。一部の実施形態では、「組換え」は、天然に存在することが知られていない細胞または宿主細胞、例えば、細胞または宿主細胞中に1つまたはより多くの突然変異、核酸挿入、または異種遺伝子を有する細胞または宿主細胞を指す。
【0036】
本明細書において使用される場合、「遺伝子」という用語は、ポリペプチドをコードするヌクレオチドのアセンブリーを指し、cDNAおよびゲノムDNA核酸分子を含む。「遺伝子」はまた、コーディング配列に先行する(5’非コーディング配列)および後続する(3’非コーディング配列)調節エレメントとして作用することができる核酸断片を指す。異種遺伝子は、単一のコピーで、複数のコピーで、かつ/または予め定義されたコピー数において宿主細胞ゲノムに組み込まれ得る。
【0037】
本明細書において使用される場合、「調節エレメント」という用語は、核酸配列の発現の何らかの態様を制御する遺伝子エレメントを指す。
【0038】
本明細書において使用される場合、「プロモーター」、「プロモーター配列」、または「プロモーター領域」という用語は交換可能であり、RNAポリメラーゼに結合することができ、かつ下流のコーディングまたは非コーディング配列の転写の開始に関与するDNA調節領域/配列を指す。本開示の一部の例では、プロモーター配列は、転写開始部位(本明細書においてtranscription start site(TSS)と称されることもある)を含み、バックグラウンドより高い検出可能なレベルで転写を開始させるために必要な最小数のエレメントを含むように上流に伸長する。一部の実施形態では、プロモーター配列は、TSSの他に、RNAポリメラーゼの結合の原因となるタンパク質結合ドメインを含む。真核性プロモーターは、常にではないが多くの場合に、「TATA」ボックスおよび「CAT」ボックスを含有する。誘導性プロモーター、リーキープロモーター(leaky promoters)、合成プロモーターなどを含む様々なプロモーターが、本開示の宿主細胞および/またはベクターにおいて遺伝子発現を駆動するために使用されてもよい。
【0039】
本明細書において使用される場合、「異種」という用語は、それが位置する宿主細胞とは異なる種に由来するか、または同じ種に由来するが、該種(もしくは宿主細胞)において異なる位置に天然に見出される、核酸配列、例えば、任意選択的にGOIに作動可能に連結したプロモーターを指す。異種核酸配列は原核システムまたは真核システムに由来することができる。異種調節配列と関連付けられた(例えば、異種プロモーターの下流にあり、その開始を通じて転写される)コーディングまたは非コーディング配列は、異種調節配列にとって内因性であることができ(例えば、異種プロモーターは、天然の状況における配列に作動可能に連結している)、または異種調節配列にとって異種であることができる(例えば、異種プロモーターは、天然の状況における配列に作動可能に連結していない)。
【0040】
本明細書において使用される場合、「内因性」という用語は、宿主細胞中に天然に存在する核酸配列を指す。例えば、内因性プロモーターは、作動可能に連結して、宿主細胞にとって異種である下流のコーディングまたは非コーディング配列の転写を開始させることができる。
【0041】
本明細書において使用される場合、「作動可能な組合せで」、「作動可能な順序で」、および「作動可能に連結した」という用語は交換可能であり、所与の遺伝子の転写および/または所望のタンパク質分子の合成を指令することができる核酸分子が製造されるような方式での核酸配列の連結を指す。該用語はまた、機能的タンパク質が製造されるような方式でのアミノ酸配列の連結を指す。例えば、GOI、補助的遺伝子、リコンビナーゼコーディング遺伝子、または非コーディング配列は、プロモーターに作動可能に連結していることができ、核酸配列は、宿主細胞に染色体組込みされることができる。
【0042】
本明細書において言及される場合、「染色体組込みされた」または「染色体組込み」という用語は、宿主細胞、例えば、哺乳動物細胞の染色体への核酸配列の安定な組込み、すなわち、宿主細胞、例えば、哺乳動物細胞のゲノムDNA(gDNA)に染色体組込みされた核酸配列を指す。
【0043】
本明細書において使用される場合、「染色体座位」および「座位」(locus)(複数形:「loci」)という用語は交換可能に使用され、細胞の染色体上の核酸の定義された位置を指す。一部の実施形態では、座位は少なくとも1つの遺伝子を含んでもよい。例として、染色体座位は、約500塩基対~約100,000塩基対、約5,000塩基対~約75,000塩基対、約5,000塩基対~約60,000塩基対、約20,000塩基対~約50,000塩基対、約30,000塩基対~約50,000塩基対、または約45,000塩基対~約49,000塩基対を含むことができる。一部の実施形態では、染色体座位は、定義された核酸配列の5’および/または3’末端へ向けて約100塩基対、約250塩基対、約500塩基対、約750塩基対、約1,000塩基対、または約5,000塩基対まで伸長することができる。
【0044】
一実施形態では、方法は、ゲノム中のHI座位を同定することを含むことができる。HI座位は、接近可能なクロマチンの活性のゲノムコンパートメント内にあることができ、かつトポロジカル関連ドメイン境界の5’方向または3’方向のいずれかにおいて約30,000塩基対以内にあることができる。一実施形態では、ピークの第1のセットは、(例えば主成分分析法(PCA)により定義されるような)活性のゲノムコンパートメント内にあることができ、かつ(例えばATAC-seqにより定義されるような)オープンクロマチン内にもあることができるが、これは方法の要求ではなく、他の実施形態では、ピークの第1のセットは、マッピングされた接近可能なクロマチンの全体内の活性のゲノムコンパートメント内にあるピークを含むことができる。HI座位はまた、少なくとも1つのエンハンサーエレメントと相互作用する領域とオーバーラップすることができる。よって、HI座位の同定は、これらの基準を満たすピークのセットを同定するためのゲノムの3Dマッピングを含むことができる。
【0045】
本明細書において使用される場合、「トポロジカル関連ドメイン」、および「TAD」、ならびに「コンタクトドメイン」という用語は交換可能に使用され、互いと優先的に物理的に相互作用する核酸配列を含有する高度に保存されたゲノム領域を指す。そのため、TAD内の核酸配列は、TADの領域外に存在する配列とよりも頻繁に互いと物理的に相互作用する。TADは、何千から何百万もの塩基対に伸長することができる。TADは、活性転写と関連付けられる因子が濃縮され得る境界領域(「TAD境界」)により仕切られ得る。例えば、TAD境界領域は、比較的高いレベルのCTCF結合を呈することができる。TAD境界領域はまた、比較的多数のtRNA遺伝子およびハウスキーピング遺伝子(例えば、アクチン、GAPDH、ユビキチンなど)の存在により認識され得る
【0046】
本明細書において使用される場合、「エンハンサー」、「エンハンサーエレメント」、「推定上の活性のエンハンサーエレメント」、および「予測される活性のエンハンサーエレメント」という用語は交換可能に使用され、標的遺伝子の転写速度を増加させることができ、かつアノテーション付きの転写開始部位の2Kb上流または2Kb下流の領域とオーバーラップしないが、ChromHMM分析(例えば、Ernst and Kellis M.Nat Protoc.12:2478-2492(2017)を参照)により指し示されるように、ATAC-Seqシグナル(オープンな接近可能なクロマチンを指し示す)、ならびにH3K4me1およびH3K27acヒストンマーク(Shlyueva et al.2014.Nat Rev Genet.15:272-86)について濃縮されている、DNA調節領域/配列を指す。
【0047】
「エンハンサーエレメント」という用語はまた、「相互作用性の推定上の活性のエンハンサー制限断片」を包含することができ、これは、それ自体はアノテーション付きの転写開始部位(TSS)を含有せず、かつ/または(ChromHMM分析により指し示されるような)H3K27me3もしくはH3K9me3のいずれかのヒストンマークについて濃縮されたゲノム領域とオーバーラップしないが、(上記に定義されるような)推定上の活性のエンハンサーとオーバーラップし、かつシスおよび複数のPCHi-C(プロモーター捕捉Hi-C)複製物において、アノテーション付きTSSを含有するHindIII制限断片と相互作用する、HindIII制限断片を指す。
【0048】
エンハンサーエレメントは、コーディングまたは非コーディング配列用のプロモーターに連結されることができ、プロモーターおよび関連付けられる遺伝子の上流または下流のいずれかに位置することができる。エンハンサーエレメントは、多くの場合に、いずれかの方向で置かれた場合に活性を呈することができ、エンハンサーは、プロモーターからかなりの距離に位置する場合に活性であってもよい。例えば、エンハンサーエレメントは、TSSの約1,000,000まで上流または下流のいずれかに位置することができ、TSSと連続または非連続であることができる。エンハンサー活性を検出する方法は当該技術分野において公知であり、例えば、Molecular Cloning,A Laboratory Manual,Second Edition,(Sambrook Fritsch,Maniatis,Eds.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor N.Y.,1989)を参照。そのようなエンハンサーエレメントと関連付けられる活性(最初にウイルス配列(Banerji et al.,1981,Moreau et al.,1981)について、およびその後に後生動物の遺伝子座を起源とする配列(Banerji et al.,1983,Gillies et al.,1983)について記載された)としては、プラスミド構築物内のプロモーターに対するエレメントの位置または方向性にかかわらない転写の活性化が挙げられる。
【0049】
図1に示されるように、方法は、接近可能なクロマチン内のピークの同定を含むことができる。本明細書において使用される場合、「ピーク」という用語は、DNAシークエンシングリードの数(すなわち、シークエンシングリード深さ)の増加を含むゲノムの領域を指す。例えば、ATAC-Seqにより明らかにされるようなゲノム領域についての正規化されたバックグラウンドモデルより高いシークエンシングリード深さの増加はオープンクロマチンを指し示すことができる一方、PCHi-C実験からの2つのHindIII制限断片の間のシークエンシングリードの数における設定された閾値より高い増加(例えば、5またはより高い正規化されたCHiCAGOスコア;Cairns J,et al.,Genome Biology.2016.17:127)は、2つのゲノム領域の間の統計的に有意なシス相互作用を指し示す。「ピーク」という用語はまた、Hi-CおよびPCHi-Cなどの技術により明らかにされるようなゲノム中の2点の間のコンタクト頻度における予め決定された閾値より高い増加を指すことができる。
【0050】
一部の実施形態では、ピーク同定は、例えば、ChIP-シークエンシングまたはMeDIP-seq(メチル化DNA免疫沈降シークエンシング)プロトコールといったシークエンスプロトコールを行う帰結として実行することができる。当該技術分野において公知であるような任意のピークコーリングツールが、本明細書において定義されるようなピークの同定において利用されてもよい。公知のピークコーリングツールの多くは、転写因子ChIP-seqについてのみまたはDNase-seqについてのみなど、一部の種類のアッセイについてのみ最適化されている。しかしながら、本明細書に包含されるピーク同定の方法論はそのようなツールに限定されず、DFilter、GEM、MACS2(Zhang et al.Model-based Analysis of ChIP-Seq(MACS).Genome Biol(2008)vol.9(9)pp.R137)、MUSIC、BCP、Threshold-based Method(商標)およびZINBAが挙げられるがそれに限定されない任意のピークコーリング方法およびソフトウェアを利用することができる。ピークコーリング方法としては、検出の一般化された最適な理論に基づく方法の他に、異なる種類のシークエンシングデータと共に利用することができるものを挙げることができる。
【0051】
目的の配列中のピークのマッピングおよび同定のために選択されるデータセットは、同定されているピークの種類に依存して最適化することができる。さらに、ピークは、参照配列としての複数のデータセットの利用を通じて同定することができる。例えば、ピークは、シミュレートされたChIP-seqデータセット、現実のデータセット、その組合せの利用を通じて、および数学的解析(例えば、候補ピークを順位付けするためのポアソン検定の利用)と組み合わせて同定することができる。データセットとしては、ChIP-seq、ATAC-seq(例えば、Giresi et al.、米国特許出願公開第2016/0060691号;Buenrostro,et al.2015 “ATAC-Seq:A method for assaying chromatin accessibility genome-wide.” Curr Protoc Mol Bio 109:21.29.1-21.29.9を参照)、Hi-C、プロモーター捕捉Hi-C(PCHi-C)(例えば、Fraser et al.、米国特許出願公開第2016/0194713号を参照)、RNA-seq、およびその任意の組合せを挙げることができるがそれに限定されない。当該技術分野において公知であるような他のデータセット、例えば、Feichtinger ChiP-Seqデータセット(アクセッション番号-PRJEB9291)を利用することができる(例えば、Feichtinger et al.Biotechnol Bioeng.113(10):2241-53(2016)を参照)。一部の実施形態では、例えばSALSAまたはLACHESISソフトウェアを使用して、目的の配列中のHI座位の同定において利用することができる染色体スケールのデノボの参照ゲノムデータをアセンブルするために複数のデータセット(例えば、複数のHi-Cデータセット)を利用することができる(例えば、Burton,et al.,2013 “Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions.” Nat Biotechnol 31:1119-1125を参照)。
【0052】
図1に示されるように、HI座位は、接近可能なクロマチンの活性のゲノムコンパートメント内にあることができる(図3も)。そのため、図1に指し示されるように、ゲノム上のHI座位の同定は、(例えば、ATAC-seqを利用するピークコーリングアルゴリズムの利用を通じた)接近可能なクロマチンにおけるピークの初期同定、続いてそれらのピークのいずれが活性のゲノムコンパートメント中に存在するのかを決定するための解析を含むことができる。図1に示される同定ステップの特定の順序は代表的なものに過ぎず、開示される方法は、ゲノムの様々な態様がマッピングされるいかなる具体的な順序にも限定されないことが理解されるべきである。例えば、図1に示される実施形態では、活性のゲノムコンパートメント内にある接近可能なクロマチン内の全てのピークを同定するステップは、TADの30Kb以内に位置するピークの同定の前に実行されるが、実施形態におけるこれらおよび他のステップの具体的な順序を改変することができる。
【0053】
一実施形態によれば、目的の配列の活性のゲノムコンパートメント内に見出される接近可能なクロマチンのピークの同定は、目的のゲノム配列の参照配列との比較により実行することができる。参照配列は、単一の既知の配列であることができ、または(例えば、複数のHi-Cおよび/もしくはPCHi-Cデータセットを用いるLACHESISソフトウェアの利用を通じて)既知の配列のコンピレーションを通じてアセンブルされたものであり得る。一実施形態では、参照配列は、目的の全てのピーク、例えば、参照配列の全てのATAC-Seqピークを同定するために調べることができる。活性のゲノムコンパートメント中に見出されるピークとの接近可能なクロマチン中に見出されるピークの比較は、参照配列の接近可能なクロマチンの活性のゲノムコンパートメント中に存在するピークのセットを提供することができる。参照配列に対して目的の配列がマッピングされたら、接近可能なクロマチン中および活性のゲノムコンパートメント内にある目的の配列中のピークを同定するためにフィルタリングプロトコールを実行することができる。
【0054】
HI座位はまた、TAD境界領域の約30,000塩基対以内にあることができる。よって、一実施形態では、図1に示されるように、接近可能なクロマチンの活性のゲノムコンパートメント中に存在する目的の配列中のピークのセットの同定に続いて、ピークのこのセットをさらに解析して、それらのピークのいずれがTAD境界領域の約30,000塩基対(上流または下流のいずれか)以内にもあるのかを決定することができる。これは、同じまたは異なる参照配列に対する目的の配列のマッピングを通じて実行することができる。必要な場合、マッピングの前にTAD境界領域を参照配列において同定することができる。一実施形態では、TAD境界領域は、「方向性指数」(directionality index)を使用して記載される方法にしたがって同定することができる(例えば、Dixon et al.,2012,“Topological domains in mammalian genomes identified by analysis of chromatin interactions.” Nature.485(7398):376-80を参照)。当然、TAD境界領域を同定するための他の方法およびツールを同様に利用することができる。
【0055】
一実施形態(以下の実施例セクションにおいてさらに記載される)では、活性のゲノムコンパートメントおよびTAD境界位置の同定は、例えば、目的の配列にマッピングされたLACHESISソフトウェアの使用により得られるゲノムアセンブリーに対してアルゴリズムを適用することにより、目的の配列に対して参照配列(例えば、ゲノムアセンブリー、Hi-Cデータセットの1つまたはコンピレーションなど)を比較することにより実行することができる。TAD境界が同定されたら、ゲノムの接近可能なクロマチンセクションの少なくとも活性のゲノムコンパートメントにわたり完全な1つまたはより多くの参照ゲノム配列の利用を通じて、各TAD境界の約30,000塩基対以内のピークを同定することができる。
【0056】
図1に示される実施形態に示されるように、TAD境界の約30,000塩基対以内にあり、かつ接近可能なクロマチンの活性のゲノムコンパートメント内にもあると同定されたピークのセットをさらに調べて、それらのピークのいずれがまた、少なくとも1つのエンハンサーエレメントと相互作用(トランス相互作用もまた本明細書に包含されるが、一般にシス相互作用)するゲノムの領域とオーバーラップするのかを決定することができる。例えば、方法は、PCHi-C、ATAC-Seq、ChIP-seq、ChromHMM、またはその組合せなどであるがそれに限定されないデータセットを使用する、少なくとも1つのエンハンサーエレメントと相互作用するゲノムの領域の同定を含むことができる。一実施形態では、統計的に有意なエンハンサー相互作用予測は、目的の配列に対してマッピングされた参照配列のPCHi-CおよびChromHMM分析により同定することができる。目的の配列中に以前に同定されたピークを次にさらにフィルタリングして、エンハンサーエレメントと相互作用するもののみを含めることができる。このさらなるフィルタリングは、ピークのセットをこれらの領域内に入るものに狭めることができる。結果としてもたらされるフィルタリングされたピークのセットを使用してゲノムのHI座位を同定することができ、すなわち、これらのピークのそれぞれはゲノムの潜在的なHI座位を定義することができる。
【0057】
ゲノムに挿入される異種遺伝子の転写の駆動において使用されることが意図されるプロモーターの種類に依存してHI座位のさらなる精密化を実行することができる。
【0058】
異種プロモーターがGOIの転写において使用される実施形態におけるHI座位は、好ましくは、ゲノムのいかなる遺伝子ともオーバーラップすることができない。一実施形態では、HI座位は、ゲノムのいかなる活性の遺伝子ともオーバーラップしない座位を含むことができるが、異種プロモーターを組み込む実施形態は、活性の遺伝子とのオーバーラップの欠如に限定されない。一実施形態では、HI座位は、いかなる遺伝子のいかなるプロモーターともオーバーラップせず、または一実施形態では、ゲノムのいかなる活性の遺伝子のいかなるプロモーターともオーバーラップしない。一実施形態では、HI座位は、いかなるそのようなプロモーターのいずれの側においても約1,000塩基対以内に入らない。そのため、一実施形態では、方法は、目的の配列に対する参照配列の再マッピングを通じて以前に得られた潜在的なHI座位をフィルタリングして、目的の配列のこれらの領域(例えば、活性の遺伝子およびそれらの関連付けられるプロモーター領域(プロモーターの±約1,000塩基対))に対して外的なピークを同定することをさらに含むことができる。これらのピークを次に、望ましいHI座位として同定することができる。
【0059】
インサイチューの内因性プロモーターがGOIの転写において使用される実施形態において使用するためのHI座位は、その発現または発現の欠如が細胞に対して不可欠でない、すなわち、組換え細胞がその活性の遺伝子なしで生存することができる、活性の遺伝子についてのインサイチューの内因性のTSSとオーバーラップすることができる。そのため、図1の右側のフロー経路に示されるように、方法は、目的の配列に対する参照配列の再マッピングを通じて以前に得られた潜在的なHI座位をフィルタリングして、接近可能なクロマチンの活性のコンパートメント内の不可欠でない活性の遺伝子およびそれらの関連付けられるTSSを同定することをさらに含むことができる。目的の遺伝子はまた、挿入されるRTSの発現における遺伝子のプロモーターの使用に影響し得る他の特徴、例えば、致死性について調べることができる。好適な遺伝子のこれらの領域とオーバーラップするピークを次に、望ましいHI座位として同定することができる。
【0060】
具体的な応用のための所望のカテゴリーの全てに適する、結果としてもたらされるピークのセットは、ゲノムのHI座位を提供することができる。例えば、異種プロモーターの利用を包含する応用において使用するためのHI座位は、接近可能なクロマチンの活性のゲノムコンパートメント中かつTAD境界の約30,000塩基対(上流または下流)以内に位置するピークを含むことができる。追加的に、これらのHI座位は、エンハンサーエレメントと相互作用するゲノムの領域とオーバーラップすることができ、一般に、遺伝子ともそれらの関連付けられるプロモーター領域ともオーバーラップしない。
【0061】
インサイチューの内因性プロモーターの利用を包含する応用において使用するためのHI座位もまた、接近可能なクロマチンの活性のゲノムコンパートメント中かつTAD境界の約30,000塩基対(上流または下流)以内に位置するピークを包含することができ、これらのHI座位もまた、エンハンサーエレメントと相互作用するゲノムの領域とオーバーラップすることができる。追加的に、これらのHI座位は、接近可能なクロマチンの活性のゲノムコンパートメント内に制限され、かつ細胞に対して不可欠でないと分類された機能を有する活性の遺伝子の内因性のTSSとオーバーラップする。
【0062】
一実施形態では、方法は、HI座位の同定後にそれを順位付けすることを含むことができる。例えば、HI座位は、座位と関連付けられる1つまたはより多くの遺伝子の発現レベル、座位から最近接のTAD境界までの距離、予測されるエンハンサー相互作用の数、および座位と関連付けられる1つまたはより多くの遺伝子の定常状態mRNAレベルのうちの1つまたはより多くに基づいて順位付けすることができる。例えば、一実施形態では、各同定されたHI座位は、単一のパラメーターのみにしたがって順位付けすることができ、全てのHI座位についてのこれらの複数の順位を次に解析して、全体的な順位を決定することができる。コンビナトリアル解析は、所望により、重み付けすることができ、またはそうしなくてもよい。例えば、各座位の各順位についての単純和のスコアを利用して、非重み付けのコンビナトリアル方法にしたがって全体的な順位を決定することができる。高い順位の座位、例えば、高発現遺伝子と関連付けられ、最近接のTAD境界まで近く、および多数のエンハンサー相互作用を有することが予測されるものは、RTSの挿入のための非常に望ましい座位であり得る。
【0063】
記載される方法の利用を通じて、HI座位を任意の哺乳動物細胞において同定することができる。例として、以下の表1は、開示される方法にしたがって同定されたCHOゲノムHI座位の例を提供する。しかしながら、CHOゲノムHI座位は表1の座位に決して限定されず、配列番号1~125のいずれか1つに対する相同配列が本明細書に包含されることを理解されたい。他の実施形態では、CHOゲノムHI座位は、以下の表1において同定されるように座位の5’および/または3’末端に対して約5,000塩基対、約1,000塩基対、約750塩基対、約500塩基対、約250塩基対、または約100塩基対以内にあることができる。
【0064】
HI座位は、表1の配列と比較した場合に少数のミスマッチまたはギャップを有することができる。例えば、本明細書に包含されるCHOゲノムHI座位は、以下に記載の配列と約10個またはより少ないミスマッチを有することができる。例えば、本明細書に包含されるCHO HI座位は、表1に記載されるような配列と10、9、8、7、6、5、4、3、2、もしくは1個のミスマッチを有することができ、かつ/または表1に記載されるような配列と比較した場合に5個もしくはより少ないギャップを有することができる。
【0065】
本明細書において定義されるようなHI座位はまた、配列番号1~125のいずれか1つの部分を包含することができ、配列番号1~125の全長配列に限定されない。例えば、HI座位は、配列番号1~125のいずれか1つの部分のみに同等の配列または相同の配列であるゲノム配列、例えば、配列番号1~125のいずれか1つの約5bpから約98%またはそれ未満までの領域に対して同等または相同のゲノム配列を包含することができる。例として、本明細書に包含されるHI座位は、配列番号1~125のいずれか1つの約5bpから全長の約95%、90%、85%、80%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%または5%までに対して同等または相同の配列を含むことができる。
【0066】
本明細書において利用される場合、「ホモログ」または「相同の配列」という用語は、特に与えられた比較配列に対して、例えば、表1の配列番号1~125のいずれか1つまたは配列番号1~125のいずれか1つの部分に対して、配列相同性を有するヌクレオチド配列を指す。本明細書において使用される場合、「配列相同性」という用語は、アライメントされたヌクレオチドの間の類似性を最大化する配列のアライメントに基づき、かつ同一のヌクレオチドの数、ヌクレオチドの総数、ならびに配列アライメント中のギャップの存在および長さの関数である、2つの配列の同一性または類似性の程度の度合を指す。標準的なパラメーターを使用して配列類似性を決定するための様々なアルゴリズムおよびコンピュータープログラムが利用可能である。一実施形態では、配列相同性は、National Center for Biotechnology Information(www.ncbi.nlm.nih.gov/)を通じて利用可能であり、例えば、Altschul et al.(1990),J Mol.Biol.215:403-410;Gish and States(1993),Nature Genet.3:266-272;Madden et al.(1996),Meth.Enzymol.266:131 -141;Altschul et al.(1997),Nu- cleic Acids Res.25:33 89-3402);Zhang et al.(2000),J.Comput.Biol.7(l-2):203-14に記載されている、核酸配列用のBLASTnプログラムを使用して測定することができる。一実施形態では、2つのヌクレオチド配列の配列相同性は、BLASTnアルゴリズム用の以下のパラメーター:ワードサイズ=1 1、ギャップオープニングペナルティ=-5、ギャップ伸長ペナルティ=-2、マッチリウォード=1、およびミスマッチペナルティ=-3に基づくスコアにより決定することができる。
【0067】
以下の表1の配列は、公的に利用可能なBGI CHOデータベースの他に、NCBI遺伝子配列データベースにおいて公的に利用可能なGenBank(登録商標)を参照している。表1の配列のGenBankアセンブリーアクセッション番号はGCA_000223135.1であり、表1の配列のBGI CHO RefSeqアセンブリーアクセッション番号は、Beijing Genomics Instituteにより2011年8月23日に提出されたGCF_000223135.1である。表1において言及される「開始」および「終了」番号は、公的に利用可能な完全配列内の各HI座位の開始および終了ヌクレオチドを指す。
【表1-1】
【表1-2】
【表1-3】
【0068】
一実施形態によれば、ゲノムのHI座位が同定されたら、ゲノムのHI座位においてランディングパッドを含むように哺乳動物細胞を改変することができる。例えば、一実施形態では、具体的なHI座位を(例えば、同定されたHI座位の順位により)選択することができ、(例えば、配列番号1~125のいずれか1つの中もしくはそれとオーバーラップするまたは配列番号1~125のいずれか1つの5’末端もしくは3’末端のいずれかの約5,000塩基対、約1,000塩基対、約750塩基対、約500塩基対、約250塩基対、もしくは約100塩基対以内もしくはそれとオーバーラップする)部位特異的組込み部位の形成においてその座位にRTSを挿入することができる。
【0069】
一実施形態では、組込みプロトコールを実行して、複数の細胞のゲノムにランダムに発現カセットを組み込むことができる。例えば、一実施形態では、ランダム組込みプロトコールを実行することができ、検出可能なマーカーを持つ発現カセットを細胞に組み込むことができる。続いて、細胞を調べて、カセットの組込み部位を決定することができ、HI座位(例えば、一実施形態では、高い順位のHI座位)において組込み部位を含む細胞を選択することができる。その選択された細胞を次に利用して、(例えば、配列番号1~125のいずれか1つの中もしくはそれとオーバーラップするまたは配列番号1~125のいずれか1つの5’末端もしくは3’末端のいずれかの約5,000塩基対、約1,000塩基対、約750塩基対、約500塩基対、約250塩基対、もしくは約100塩基対以内もしくはそれとオーバーラップする)HI座位におけるランディングパッドを確立することができる。
【0070】
本明細書において言及される場合、「ランディングパッド」という用語は、宿主細胞に染色体組込みされたRTSを含む核酸配列を指す。一部の実施形態では、ランディングパッドは、宿主細胞に染色体組込みされた2つまたはより多くのRTSを含む。ランディングパッドは、1つまたはより多くの別個の染色体座位に組み込まれることができる。例えば、別個のランディングパッドは、1、2、3、4、5、6、7、または8個の別個の染色体座位に組み込まれることができ、別個の染色体座位のうちの1つまたはより多くはHI座位であることができる。
【0071】
本明細書において言及される場合、「部位特異的組込み部位」、「組換え標的部位」、「RTS」、および「部位特異的リコンビナーゼ標的部位」という用語は交換可能に使用され、部位特異的リコンビナーゼにより認識され、かつ部位特異的組換え事象の間のクロスオーバー領域であり得る、短い、例えば、約60塩基対未満の、核酸部位または配列を指す。一部の実施形態では、組換え標的部位は、約60塩基対未満、約55塩基対未満、約50塩基対未満、約45塩基対未満、約40塩基対未満、約35塩基対未満、または約30塩基対未満であることができる。一部の実施形態では、組換え標的部位は、約30~約60塩基対、約30~約55塩基対、約32~約52塩基対、約34~約44塩基対、約32塩基対、約34塩基対、または約52塩基対であることができる。部位特異的リコンビナーゼ標的部位の例としては、lox部位、rox部位、frt部位、att部位およびdif部位が挙げられるがそれに限定されない。一部の実施形態では、組換え標的部位は、配列番号126~155に示されるものと実質的に同じ配列を有する核酸である。
【0072】
一部の実施形態では、RTSは、表2から選択されるlox部位である。本明細書において言及される場合、「lox部位」という用語は、Creリコンビナーゼが部位特異的組換えを触媒することができるヌクレオチド配列を指す。様々な非同一のlox部位が当該技術分野において公知である。様々なlox部位の配列は、それら全てが、組換えが起こる8塩基対の非対称コア領域に隣接する同一の13塩基対逆位反復を含有するという点で類似している。部位の方向性および異なるlox部位の中でのバリエーションの原因となるのは非対称コア領域である。これらの実例的(非限定的)な例としては、天然に存在するloxP(P1ゲノム中に見出される配列)、loxB、loxLおよびloxR(これらはE.coli染色体中に見出される)の他に、いくつかの突然変異体またはバリアントlox部位、例えば、loxP 511、loxΔ86、loxΔ 117、loxC 2、loxP 2、loxP 3およびloxP 23が挙げられる。一部の実施形態では、lox組換え標的部位は、表2に見出される配列に対して少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する核酸である。
【表2】
【0073】
本明細書において使用される場合、核酸配列またはアミノ酸配列の文脈における「配列同一性」または「同一性%」という用語は、指定された比較ウインドウにわたり配列がアライメントされた場合に同じである、比較された配列中の残基のパーセンテージを指す。比較ウインドウは、配列をアライメントおよび比較することができる少なくとも10残基から1,000残基を超えるセグメントであることができる。配列同一性の決定のためのアライメントの方法は当該技術分野において周知であり、BLAST(blast.ncbi.nlm.nih.gov/Blast.cgi)などの公的に利用可能なデータベースを使用して行うことができる。
【0074】
一部の実施形態では、RTSは、loxΔ86、loxΔ117、loxC2、loxP 2、loxP 3およびloxP 23から選択されるlox部位である。
【0075】
一部の実施形態では、RTSは、表3から選択されるFrt部位である。本明細書において言及される場合、「Frt部位」という用語は、酵母2μmプラスミドのFLP遺伝子の生成物、FLPリコンビナーゼが部位特異的組換えを触媒することができるヌクレオチド配列を指す。様々な非同一のFrt部位が当該技術分野において公知である。様々なFrt部位の配列は、それら全てが、組換えが起こる8塩基対の非対称コア領域に隣接する同一の13塩基対逆位反復を含有するという点で類似している。部位の方向性および異なるFrt部位の中でのバリエーションの原因となるのは非対称コア領域である。これらの実例的(非限定的)な例としては、天然に存在するFrt(F)、およびいくつかの突然変異体またはバリアントFrt部位、例えば、Frt F1およびFrt F2が挙げられる。一部の実施形態では、Frt組換え標的部位は、表3に見出される配列に対して少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する核酸である。
【表3】
【0076】
一部の実施形態では、RTSは、表4から選択されるrox部位である。本明細書において言及される場合、「rox部位」という用語は、Dreリコンビナーゼが部位特異的組換えを触媒することができるヌクレオチド配列を指す。様々な非同一のrox部位が当該技術分野において公知である。これらの実例的(非限定的)な例としては、roxRおよびroxFが挙げられる。一部の実施形態では、rox組換え標的部位は、表4に見出される配列に対して少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する核酸である。
【表4】
【0077】
一部の実施形態では、RTSは、表5から選択されるatt部位である。本明細書において言及される場合、「att部位」という用語は、λインテグラーゼまたはφC31インテグラーゼが部位特異的組換えを触媒することができるヌクレオチド配列を指す。様々な非同一のaat部位が当該技術分野において公知である。これらの実例的(非限定的)な例としては、attP、attB、proB、trpC、galT、thrA、およびrrnBが挙げられる。一部の実施形態では、att組換え標的部位は、表5に見出される配列に対して少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する核酸である。
【表5】
【0078】
一部の実施形態では、細胞は、複数(例えば、少なくとも4つ)のRTS、例えば、複数の別個のRTSを含むことができ、RTSの任意の有用な組合せを使用することができる。本明細書において使用される場合、「別個の組換え標的部位」または「別個のRTS」という用語は、非同一のまたはヘテロ特異的な組換え標的部位を指す。例えば、いくつかのバリアントFrt部位が存在するが、組換えは、通常、2つの同一のFrt部位の間でのみ起こることができる。一部の実施形態では、別個の組換え標的部位は、同じ組換えシステムからの非同一の組換え標的部位(例えば、LoxPおよびLoxR)を指す。一部の実施形態では、別個の組換え標的部位は、異なる組換えシステムからの非同一の組換え標的部位(例えば、LoxPおよびFrt)を指す。一部の実施形態では、別個の組換え標的部位は、同じ組換えシステムからの組換え標的部位および異なる組換えシステムからの組換え標的部位の組合せ(例えば、LoxP、LoxR、Frt、およびFrt1)を指す。例えば、一部の実施形態では、哺乳動物細胞は、少なくとも2つの別個のRTSであって、少なくとも1つのRTSがHI座位に染色体組込みされており、かつ少なくとも1つのRTSが、Fer1L4(例えば、米国特許出願第14/409,283号を参照)、ROSA26、HGPRT、DHFR、COSMC、LDHA、またはMGAT1から選択される染色体座位に染色体組込みされているものを含むことができる。
【0079】
HI座位にRTSを組み込んだ細胞は、組換えタンパク質産生細胞を製造するためにさらに加工することができる。RTSに加えて、組換えタンパク質産生主体は、部位特異的リコンビナーゼをコードする遺伝子を含むことができる。リコンビナーゼとも称されるリコンビナーゼ酵素は、部位特異的組換えにおいて組換えを触媒する酵素である。一実施形態では、部位特異的組換えのために利用され得るようなリコンビナーゼは、非哺乳動物システムに由来することができる。例えば、リコンビナーゼは、細菌、バクテリオファージ、または酵母に由来することができる。
【0080】
一部の実施形態では、リコンビナーゼをコードする核酸配列を宿主細胞に組み込むことができる。例えば、リコンビナーゼをコードする核酸配列を、分子生物学に公知の方法により宿主細胞に送達することができる。一部の実施形態では、リコンビナーゼポリペプチド配列を細胞に直接的に送達することができる。
【0081】
利用され得るようなリコンビナーゼ酵素の例としては、Creリコンビナーゼ、FLPリコンビナーゼ、Dreリコンビナーゼ、KDリコンビナーゼ、B2B3リコンビナーゼ、Hinリコンビナーゼ、Treリコンビナーゼ、λインテグラーゼ、HK022インテグラーゼ、HP1インテグラーゼ、γδリゾルバーゼ/インベルターゼ、ParAリゾルバーゼ/インベルターゼ、Tn3リゾルバーゼ/インベルターゼ、Ginリゾルバーゼ/インベルターゼ、φC31インテグラーゼ、BxB1インテグラーゼ、R4インテグラーゼまたは別の機能的なリコンビナーゼ酵素が挙げられるがそれに限定されない。
【0082】
一実施形態では、FLPリコンビナーゼを利用することができる。FLPリコンビナーゼは、DNA複製の間のSaccharomyces cerevisiaeの2μプラスミドのコピー数の増幅に関与する部位特異的組換え反応を触媒する。FLPリコンビナーゼは、Saccharomyces属の種に由来することができ、一実施形態では、Saccharomyces cerevisiaeの株に由来することができる。一部の実施形態では、FPLリコンビナーゼは、Saccharomyces cerevisiaeの株に由来する。FLPリコンビナーゼは、熱安定性の突然変異体FLPリコンビナーゼ、例えば、FLP1またはFLPeであることができる。一部の実施形態では、FLPリコンビナーゼをコードする核酸配列はヒト最適化コドンを含む。
【0083】
Creリコンビナーゼは、リコンビナーゼのIntファミリーのメンバーであり(Argos et al.(1986)EMBO J.5:433)、細菌だけでなく真核細胞においてもlox部位(locus of X-ing over)の効率的な組換えを行うことが示されている(Sauer(1987)Mol.Cell.Biol.7:2087;SauerおよびHenderson(1988)Proc.Natl Acad.Sci.85:5166)。Creリコンビナーゼは、一実施形態では、バクテリオファージ、例えば、P1バクテリオファージに由来することができる。
【0084】
一実施形態では、哺乳動物細胞は、HI座位内に染色体組込みされたRTSを含むことができ、SSI組込みプロトコールにしたがって目的の遺伝子をコードする交換可能なカセットを含むベクターを細胞にトランスフェクトすることができる。HI座位内に交換可能なカセットが組み込まれたら、染色体に組み込まれた交換可能なカセットを含む組換えタンパク質産生細胞を選択することができる。選択は、例えば、当業者に公知の方法を使用してマーカーの存在の検出を通じて行うことができ、またはマーカーの非存在の検出を通じて行うことができる。
【0085】
SSIプロトコールは、1つまたはより多くの遺伝子を宿主細胞染色体に導入するために使用することができる。本明細書において使用される場合、「部位特異的組込み」は、特定の部位における染色体への核酸配列の組込みを指すことができ、「部位特異的組換え」を意味することもでき、これは、配列または標的部位のコグネイトペアにおいて組換えを行う特定の酵素による2つのDNAパートナー分子の再構成を指す。部位特異的組換えは、相同組換えとは対照的に、パートナーDNA分子の間のDNA相同性を要求せず、RecA非依存性であり、いかなるステージにおいてもDNA複製を伴わない。一部の実施形態では、部位特異的組換えは、宿主細胞、例えば、哺乳動物細胞中での核酸の部位特異的組込みを達成するために部位特異的リコンビナーゼシステムを使用する。リコンビナーゼシステムは、典型的には、3つのエレメント:2つのマッチするDNA配列(組換え標的部位)および特定の酵素(リコンビナーゼ)からなる。リコンビナーゼは、マッチする組換え部位の間の組換え反応を触媒する。
【0086】
2つのRTS配列に関する「マッチする」という用語は、リコンビナーゼにより結合され、2つの配列の間の部位特異的組換えに影響する能力を有する2つの配列を指す。一部の実施形態では、細胞のRTSにマッチする交換可能なカセットのRTSは、細胞のRTSに実質的に同一の配列を有するカセットのRTSを指す。一部の実施形態では、交換可能なカセットは、宿主細胞ゲノムに染色体組込みされたRTSのうちの1または2つに実質的に同一の配列を含有する。
【0087】
本明細書において使用される場合、「トランスフェクション」は、細胞への、ベクターを含む外因性核酸分子の導入を指す。「トランスフェクトされた」細胞は、細胞の内側に外因性核酸分子を含み、「形質転換された」細胞は、細胞内の外因性核酸分子が細胞において表現型の変化を誘導するものである。トランスフェクトされた核酸分子は、宿主細胞のゲノムDNAに組み込まれることができ、かつ/または染色体外で一時的にもしくは長期の期間にわたり細胞により維持されることができる。外因性核酸分子または断片を発現する宿主細胞または生物は、「組換え」、「形質転換」、または「トランスジェニック」生物と称される。
【0088】
ベクター(発現ベクターとも称される)は、別のDNAセグメントを取り付けて、細胞中での取り付けられたDNAセグメントの複製および/または発現をもたらすことができる任意の好適なレプリコン、例えば、プラスミド、ファージ、ウイルス、またはコスミドであることができる。ベクターとしては、エピソーム(例えば、プラスミド)および非エピソームベクターを挙げることができる。例えば、一実施形態では、例えば非対称分割により、多数の細胞世代後に細胞の集団から除去/喪失されるエピソームベクターを利用することができる。ベクターはウイルスまたは非ウイルスベクターであることができ、インビトロ、インビボ、またはエクスビボで核酸分子を細胞に導入することができる。合成ベクターもまた本明細書に包含される。ベクターは、トランスフェクション、形質導入、細胞融合、およびリポフェクションが挙げられるがそれに限定されない周知の方法により所望の宿主細胞に導入されてもよい。ベクターは、プロモーターを含む様々な調節エレメントを含むことができる。
【0089】
本明細書において使用される場合、「交換可能なカセット」、「発現カセット」、および「カセット」という用語は交換可能に使用され、遺伝子を含有し、かつRTSを含むことができる移動性の遺伝子エレメントを指す。一部の実施形態では、交換可能なカセットは、複数のRTSおよび/または複数の遺伝子を含むことができる。例えば、交換可能なカセットは、レポーター遺伝子または選択遺伝子と組み合わせてGOIを含むことができる。
【0090】
GOIは、レポーター遺伝子、選択遺伝子、治療目的の遺伝子、補助的遺伝子またはその組合せを含むことができるがそれに限定されない。
【0091】
本明細書において使用される場合、「レポーター遺伝子」という用語は、その発現が細胞に容易に同定および測定され得る表現型を付与する遺伝子を指す。例えば、レポーター遺伝子は、蛍光タンパク質遺伝子または選択遺伝子を含むことができる。一実施形態では、選択遺伝子は、そうでなければ必須の栄養分となるであろうものを欠いた培地中で生存する能力を細胞に付与する生成物をコードすることができる。一部の実施形態では、選択遺伝子は、抗生物質または薬物に対する抵抗性を細胞に付与することができる。選択遺伝子は、宿主細胞に具体的な表現型を付与するために使用されてもよい。選択培地中で生存するために宿主細胞が選択遺伝子を発現する場合、該遺伝子は陽性選択遺伝子と言われる。具体的な遺伝子を含有する宿主細胞に反対して選択するための選択遺伝子を使用することもでき、この方式において使用される選択遺伝子は陰性選択遺伝子と称される。
【0092】
本明細書において使用される場合、「治療目的の遺伝子」という用語は、任意の機能的に関連するヌクレオチド配列を指す。そのため、治療目的の遺伝子は、その発現が治療的な組換えタンパク質の調製に所望されるタンパク質をコードする任意の遺伝子を含むことができる。好適な治療目的の遺伝子の代表的(非限定的)な例としては、モノクローナル抗体、二重特異性モノクローナル抗体、および抗体薬物コンジュゲートが挙げられる(血液凝固因子、タンパク質発現が転写に限定されたよく発現されるmAb、EPOなどのホルモン、免疫融合タンパク質(Fc融合物)、三重特異性mAbなどを含む)。
【0093】
本明細書において使用される場合、「補助的遺伝子」または「ヘルパー遺伝子」という用語は交換可能に使用され、第2の遺伝子の発現を補助する、または第2の遺伝子の生成物の安定化、フォールディング、もしくは翻訳後修飾を補助する、または第2の遺伝子の生成物の製造を促進する細胞環境を作製する第1の遺伝子を指す。一部の実施形態では、第2の遺伝子はDtEタンパク質(またはその部分)をコードする。補助的遺伝子は、例えば、RNA(例えば、mRNA、tRNA、もしくはmiRNA)、転写因子、シャペロン、シャペロニン、シンセターゼ、オキシダーゼ、レダクターゼ、糖転移酵素、プロテアーゼ、キナーゼ、ホスファターゼ、アセチルトランスフェラーゼ、リパーゼ、またはアルキラーゼ(alkylase)をコードすることができる。
【0094】
GOIは、よく発現される治療用タンパク質をコードする遺伝子を所望のコピー数において包含することができる。例えば、よく発現される治療用タンパク質をコードする遺伝子は、2コピー、3コピー、4コピー、5コピー、6コピー、7コピー、8コピー、9コピー、または10コピーのコピー数であることができる。
【0095】
本明細書において使用される場合、「発現困難タンパク質」という用語は、製造が困難なタンパク質を指す。例えば、DtEタンパク質の製造は、タンパク質発現が高度に調節されなければならないため、タンパク質を宿主細胞から回収することが困難であるため、タンパク質がミスフォールディングしやすいため、タンパク質がクリッピングしやすいため、タンパク質が分解しやすいため、タンパク質が凝集しやすいため、タンパク質が可溶性に乏しいため、タンパク質が膜結合タンパク質であるため、タンパク質の精製が困難であるため、タンパク質が細胞傷害性であるため、タンパク質が複数のポリペプチド鎖、例えば、2、3もしくは4つのポリペプチド鎖を含むため、またはその任意の組合せのために、困難であり得る。例えば、DtEタンパク質は、DtEタンパク質を製造するためにホモオリゴマーまたはヘテロオリゴマーを形成する複数のポリペプチド鎖を含むことができる。そのような一実施形態では、DtEタンパク質の鎖は、組換え細胞の同じまたは異なるRTSと関連付けられ得る1つまたはより多くの目的の遺伝子上にコードされることができる。ホモオリゴマーまたはヘテロオリゴマーは、共有結合性相互作用、非共有結合性相互作用、またはその組合せを通じて形成され得る。DtEタンパク質はまた、DtEタンパク質を製造するために補助的遺伝子の発現が要求されるタンパク質、またはDtEタンパク質を製造するために翻訳後修飾が要求されるタンパク質であることができる。
【0096】
DtEタンパク質は、モノクローナル抗体、例えば、二重特異性モノクローナル抗体または三重特異性モノクローナル抗体であることができる。DtEタンパク質の他の例としては、免疫グロブリンのFcドメインが第2のペプチドに作動可能に連結した融合タンパク質であるFc融合タンパク質が挙げられる。DtEタンパク質は、酵素、膜受容体、および二重特異性T細胞エンゲージャー(BITE(登録商標)Micromet AG、Munich、Germany)であることができる。
【0097】
一実施形態では、GOIは2つのRTSの間に位置することができ、すなわち、RTSのうちの1つは遺伝子の5’に位置し、異なるRTSは遺伝子の3’に位置することができる。一部の実施形態では、RTSは、それらの間に位置する遺伝子に直接的に隣接して位置する。一部の実施形態では、RTSは、それらの間に位置する遺伝子から定義された距離において位置する。一部の実施形態では、RTSは方向性の配列である。一部の実施形態では、それらの間に位置する遺伝子の5’および3’のRTSは直接的に配向している(すなわち、それらは同じ方向に配向している)。一部の実施形態では、それらの間に位置する遺伝子の5’および3’のRTSは逆に配向している(すなわち、それらは反対の方向に配向している)。
【0098】
一部の実施形態では、細胞は1つまたはより多くの追加のGOIを含むことができ、1つまたはより多くの追加のGOIは染色体組込みされることができる。第2の目的の遺伝子は、例えば、レポーター遺伝子、選択遺伝子、治療目的の遺伝子(例えば、DtEタンパク質をコードする遺伝子)、補助的遺伝子、またはその組合せであることができる。追加のGOIは、第1のGOIと同じHI内、第2のHI座位内、または別々の座位内に位置することができる。
【0099】
第2のGIOは、第1のGOIを細胞にトランスフェクトするために使用されるものと同じまたは異なるベクターの使用を通じて細胞に組み込まれることができる。例えば、第1の目的の遺伝子をコードする第1の交換可能なカセットを含む第1のベクターおよび第2の目的の遺伝子をコードする第2の交換可能なカセットを含む第2のベクターを細胞にトランスフェクトすることができる。第1のカセットをHI座位に組み込むことができ、かつ第2のカセットを同じHI座位、第2のHI座位、または別々の座位に組み込むことができる。例えば、第2のカセットをFer1L4座位に組み込むことができる。所望の位置において染色体に組み込まれた第1の交換可能なカセットおよび第2の交換可能なカセットの両方を含む組換えタンパク質産生細胞を次に選択することができる。
【0100】
有益なことに、rP発現細胞の調製においてHI座位中に位置するランディングパッドを使用するSSIは、rP発現細胞のプールがその遺伝子構成において均質であることを確実にすることができる。追加的に、rP発現細胞を調製するためにHI座位中に位置するランディングパッドを使用するSSIは、rP発現細胞のプールがその効率において均質であることを確実にすることができる。例えば、産生細胞のプールは、第2のヘルパー遺伝子に対する第1のヘルパー遺伝子の比において均質であることができ、かつ/または産生細胞のプールは、治療目的の遺伝子に対するヘルパー遺伝子の比において均質であること。よって、rP発現細胞を調製するためにHI中に位置するランディングパッドを使用するSSIは、より一貫したrP製造物品質を確実にすることができる。
【0101】
原核および/または真核細胞系を含む、本明細書に記載の細胞系は、任意の好適なデバイス、設備および方法を使用して培養することができる。さらに、実施形態では、デバイス、設備および方法は、懸濁細胞または足場依存(接着)細胞を培養するために好適であり、薬学およびバイオ医薬製品、例えば、ポリペプチド製造物、核酸製造物(例えば、DNAもしくはRNA)、または哺乳動物もしくは微生物細胞および/もしくはウイルス、例えば、細胞および/もしくはウイルスならびにマイクロバイオータ療法において使用されるものの製造のために構成された製造処理のために好適である。
【0102】
細胞は、製造物、例えば、組換え治療用または診断用製造物を発現または産生することができる。細胞により産生される製造物の例としては、抗体分子(例えば、モノクローナル抗体、二重特異性抗体)、抗体模倣物(抗原に特異的に結合するが、抗体に構造的に関しないポリペプチド分子、例えば、DARPin、アフィボディ、アドネクチン、もしくはIgNAR)、融合タンパク質(例えば、Fc融合タンパク質、キメラサイトカイン)、他の組換えタンパク質(例えば、グリコシル化タンパク質、酵素、ホルモン)、ウイルス治療剤(例えば、抗がん性腫瘍溶解性ウイルス、遺伝子療法およびウイルス免疫療法用のウイルスベクター)、細胞治療剤(例えば、多能性幹細胞、間葉幹細胞および成体幹細胞)、ワクチンもしくは脂質被包性粒子(例えば、エキソソーム、ウイルス様粒子)、RNA(例えば、siRNAなど)もしくはDNA(例えば、プラスミドDNAなど)、抗生物質またはアミノ酸を挙げることができるがそれに限定されない。実施形態では、デバイス、設備および方法は、バイオシミラーを製造するために使用することができる。
【0103】
開示される方法は、真核細胞、例えば、哺乳動物細胞もしくは下等真核細胞、例えば、酵母細胞もしくは糸状真菌細胞などの他に、原核細胞、例えば、グラム陽性もしくはグラム陰性細胞、ならびに/または真核もしくは原核細胞の生成物、例えば、大スケールの方式において真核細胞により合成される、タンパク質、ペプチド、抗生物質、アミノ酸、核酸(例えば、DNAもしくはRNA)の製造を可能とすることができる。一部の実施形態では、マイクロバイオータ治療において利用される微生物およびその胞子の使用もまた開示される。本明細書において他に記載されなければ、デバイス、設備、および方法は、ベンチスケール、パイロットスケール、および完全製造スケールのキャパシティが挙げられるがそれに限定されない任意の所望の容量または製造キャパシティを含むことができる。
【0104】
さらに、本明細書において他に記載されなければ、デバイス、設備、および方法は、任意の好適なリアクターまたはバイオリアクターを含むことができ、これには、撹拌槽、エアリフト、繊維、マイクロファイバー、中空繊維、セラミックマトリックス、流動床、固定床、および/または噴流床バイオリアクターが含まれるがそれに限定されない。本明細書において使用される場合、「リアクター」または「バイオリアクター」は、発酵槽もしくは発酵ユニット、または任意の他の反応容器を含むことができ、「リアクター」という用語は「発酵槽」と交換可能に使用される。発酵槽または発酵という用語は、微生物および哺乳動物の両方の培養を指す。例えば、一部の態様では、例となるバイオリアクターユニットは、以下:栄養分および/もしくは炭素供給源の供給、好適な気体(例えば、酸素)の注入、発酵もしくは細胞培養培地の入口および出口流れ、気相および液相の分離、温度の維持、酸素およびCOレベルの維持、pHレベルの維持、撹拌(例えば、かき混ぜ)、ならびに/または洗浄/滅菌のうちの1つもしくはより多く、または全てを行うことができる。発酵ユニットなどの例となるリアクターユニットは、ユニット内に複数のリアクターを含有してもよく、例えば、ユニットは、各ユニット中に1~約100もしくはより多くのバイオリアクター、例えば、各ユニット中に約10~約90、もしくは約20~約80のバイオリアクターを有することができ、かつ/または、設備は、設備内に単一もしくは複数のリアクターを有する複数のユニットを含有してもよい。バイオリアクターは、バッチ、セミフェドバッチ、フェドバッチ、灌流、および/または連続発酵プロセスのために好適なものであることができる。任意の好適なリアクター直径を使用することができる。例えば、バイオリアクターは約100mL~約50,000Lの容量を有することができる。非限定的な例としては、約250mL~約10L、約10L~約500L、約20L~約200L、約500L~約5,000L、または約5,000L~約50,000Lの容量が一部の実施形態では挙げられる。追加的に、好適なリアクターは、複数回使用、単回使用、使い捨て、または非使い捨てのものであることができ、金属合金、例えば、ステンレス鋼(例えば、316Lもしくは任意の他の好適なステンレス鋼)およびInconel、プラスチック、ならびに/またはガラスを含む、任意の好適な材料から形成されたものであり得る。
【0105】
実施形態では、本明細書において他に記載されなければ、本明細書に記載のデバイス、設備、および方法はまた、他に記載されていない任意の好適なユニット操作および/または機器、例えば、そのような製造物の分離、精製、および単離のための操作および/または機器を含むことができる。任意の好適な設備および環境を使用することができ、これは例えば、伝統的なスティックビルト設備、モジュール式、移動性かつ一時的な設備、または任意の他の好適な構築、設備、および/もしくはレイアウトである。例えば、一部の実施形態では、モジュール式のクリーンルームを使用することができる。追加的に、他に記載されなければ、本明細書に記載のデバイス、システム、および方法は、単一の位置もしくは設備において収容および/もしくは実行することができ、または代替的に別々のもしくは複数の位置および/もしくは設備において収容および/もしくは実行することができる。
【0106】
非限定的な例として、非限定的に、米国特許出願公開第2013/0280797号、同2012/0077429号、同2011/0280797号、同2009/0305626号、ならびに米国特許第8,298,054号、同7,629,167号、および同5,656,491号(これらは参照により全体が本明細書に組み込まれる)は、好適であり得る、例となる設備、機器、および/またはシステムを記載している。
【0107】
組換え細胞は、以前に議論されたように哺乳動物細胞であることができ、1つの具体的な実施形態では、CHO細胞(例えば、CHO-K1細胞、CHO-DXB11細胞、CHO-DG44細胞、全てのバリアントを含むCHOK1SV(商標)細胞、全てのバリアントを含むCHOグルタミンシンセターゼノックアウト細胞など)であることができるが、本開示はこれらの細胞に限定されない。HI座位中にRTSを組み込み得るような細胞の他の例としては、接着および懸濁適応バリアントを含むHEK293細胞、HeLa、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓細胞)、VERO、YB2/0、Y0、C127、L、COS(例えば、COS1およびCOS7)、QC1-3、HEK-293、VERO、PER.C6、EBl、EB2、EB3、腫瘍溶解性またはハイブリドーマ細胞系を挙げることができる。真核細胞はまた、鳥細胞、細胞系または細胞株、例えば、EBx(登録商標)細胞、EB14、EB24、EB26、EB66、またはEBvl3などであることができる。
【0108】
一部の実施形態では、真核幹細胞を利用することができる。幹細胞は、例えば、胚性幹細胞(ESC)、成体幹細胞、人工多能性幹細胞(iPSC)を含む多能性幹細胞、組織特異的幹細胞(例えば、造血幹細胞)および間葉幹細胞(MSC)であることができる。分化した形態の本明細書に記載の任意の細胞が本明細書に包含される。
【0109】
真核細胞は、下等真核細胞、例えば、酵母細胞(例えば、Pichia属(例えば、Pichia pastoris、Pichia methanolica、Pichia kluyveri、およびPichia angusta)、Komagataella属(例えば、Komagataella pastoris、Komagataella pseudopastorisもしくはKomagataella phaffii)、Saccharomyces属(例えば、Saccharomyces cerevisiae、Saccharomyces kluyveri、Saccharomyces uvarum)、Kluyveromyces属(例えば、Kluyveromyces lactis、Kluyveromyces marxianus)、Candida属(例えば、Candida utilis、Candida cacaoi、Candida boidinii)、Geotrichum属(例えば、Geotrichum fermentans)、Hansenula polymorpha、Yarrowia lipolytica、またはSchizosaccharomyces pombeなどであることができる。
【0110】
真核細胞は、真菌細胞(例えば、Aspergillus(例えば、A.niger、A.fumigatus、A.orzyae、A.nidula)、Acremonium(例えば、A.thermophilum)、Chaetomium(例えば、C.thermophilum)、Chrysosporium(例えば、C.thermophile)、Cordyceps(例えば、C.militaris)、Corynascus、Ctenomyces、Fusarium(例えば、F.oxysporum)、Glomerella(例えば、G.graminicola)、Hypocrea(例えば、H.jecorina)、Magnaporthe(例えば、M.orzyae)、Myceliophthora(例えば、M.thermophile)、Nectria(例えば、N.heamatococca)、Neurospora(例えば、N.crassa)、Penicillium、Sporotrichum(例えば、S.thermophile)、Thielavia(例えば、T.terrestris、T.heterothallica)、Trichoderma(例えば、T.reesei)、またはVerticillium(例えば、V.dahlia))であることができる。
【0111】
真核細胞は、昆虫細胞(例えば、Sf9、Mimic(商標)Sf9、Sf21、High Five(商標)(BT1-TN-5B1-4)、もしくはBT1-Ea88細胞)、藻類細胞(例えば、Amphora、Bacillariophyceae、Dunaliella、Chlorella、Chlamydomonas、Cyanophyta(シアノバクテリア)、Nannochloropsis、Spirulina、もしくはOchromonas属のもの)、または植物細胞(例えば、単子葉植物(例えば、トウモロコシ、コメ、コムギ、もしくはエノコログサ属植物)、もしくは双子葉植物(例えば、キャッサバ、ジャガイモ、ダイズ、トマト、タバコ、アルファルファ、Physcomitrella patensもしくはArabidopsis)からの細胞であることができる。
【0112】
細胞は細菌または原核細胞であることができる。例えば、グラム陽性細胞、例えば、Bacillus、Streptomyces Streptococcus、StaphylococcusまたはLactobacillusを利用することができる。使用することができるBacillusとしては、例えば、B.subtilis、B.amyloliquefaciens、B.licheniformis、B.natto、またはB.megateriumを挙げることができる。実施形態では、細胞は、B.subtilis、例えば、B.subtilis 3NAおよびB.subtilis 168である。Bacillusは、例えば、Bacillus Genetic Stock Center、Biological Sciences 556、484 West 12th Avenue、Columbus OH 43210-1214から入手可能である。
【0113】
グラム陰性細胞、例えば、Salmonella spp.またはEscherichia coli、例えば、TG1、TG2、W3110、DH1、DHB4、DH5a、HMS 174、HMS174(DE3)、NM533、C600、HB101、JM109、MC4100、XL1-BlueおよびOrigamiなどの他に、E.coli B株に由来するもの、例えば、BL-21またはBL21(DE3)などを利用することができ、これらの全ては商業的に入手可能である。好適な宿主細胞は、例えば、カルチャーコレクション、例えば、DSMZ(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH、Braunschweig、Germany)またはAmerican Type Culture Collection(ATCC)から商業的に入手可能である。一部の実施形態では、細胞は、治療剤として利用される他のマイクロバイオータを含む。これらとしては、Firmicutes、Bacteroidetes、Proteobacteria、Verrumicrobia、actinobacteria、fusobacteriaおよびcyanobacteria門に属するヒトマイクロバイオーム中に存在するマイクロバイオータが挙げられる。マイクロバイオータは、好気性、絶対嫌気性または通性嫌気性のものを含むことができ、かつ細胞または胞子を含むことができる。治療的なマイクロバイオータはまた、遺伝学的にマニピュレートされた生物およびそれらの改変において利用されるベクターを含むことができる。他のマイクロバイオーム関連の治療的な生物は、古細菌、真菌およびウイルスを含むことができる。例えば、The Human Microbiome Project Consortium.Nature 486,207-214(14 June 2012);Weinstock,Nature,489(7415):250-256(2012);Lloyd-Price,Genome Medicine 8:51(2016)を参照。
【0114】
rP産生細胞を培養して、ペプチド、アミノ酸、脂肪酸または他の有用な生化学的中間体もしくは代謝物を製造することができる。例えば、約4,000ダルトンから約140,000ダルトンより大きい分子量を有する分子を製造することができる。細胞により製造される分子は、広範な複雑性を有することができ、グリコシル化を含む翻訳後修飾を含むことができる。
【0115】
製造され得るようなタンパク質としては、例えば、BOTOX、Myobloc、Neurobloc、Dysport(またはボツリヌス神経毒の他の血清型)、アルグルコシダーゼアルファ、ダプトマイシン、YH-16、コリオゴナドトロピンアルファ、フィルグラスチム、セトロレリクス、インターロイキン-2、アルデスロイキン、テセロイキン(teceleulin)、デニロイキンジフチトクス、インターフェロンアルファ-n3(注射)、インターフェロンアルファ-nl、DL-8234、インターフェロン、Suntory(ガンマ-1a)、インターフェロンガンマ、サイモシンアルファ1、タソネルミン、DigiFab、ViperaTAb、EchiTAb、CroFab、ネシリチド、アバタセプト、アレファセプト、Rebif、エプトテルミンアルファ、テリパラチド(骨粗しょう症)、カルシトニン注射剤(骨疾患)、カルシトニン(経鼻、骨粗しょう症)、エタネルセプト、ヘモグロビングルタマー250(ウシ)、ドロトレコギンアルファ、コラゲナーゼ、カルペリチド、組換えヒト表皮増殖因子(外用ゲル、創傷治癒)、DWP401、ダルベポエチンアルファ、エポエチンオメガ、エポエチンベータ、エポエチンアルファ、デシルジン、レピルジン、ビバリルジン、ノナコグアルファ、Mononine、エプタコグアルファ(活性化型)、組換え第VIII因子+VWF、Recombinate、組換え第VIII因子、第VIII因子(組換え)、Alphnmate、オクトコグアルファ、第VIII因子、パリフェルミン、Indikinase、テネクテプラーゼ、アルテプラーゼ、パミテプラーゼ、レテプラーゼ、ナテプラーゼ、モンテプラーゼ、フォリトロピンアルファ、rFSH、hpFSH、ミカファンギン、ペグフィルグラスチム、レノグラスチム、ナルトグラスチム、セルモレリン、グルカゴン、エキセナチド、プラムリンチド、イミグルセラーゼ(iniglucerase)、ガルスルファーゼ、Leucotropin、モルグラモスチム(molgramostirn)、酢酸トリプトレリン、ヒストレリン(皮下インプラント、Hydron)、デスロレリン、ヒストレリン、ナファレリン、ロイプロリド持続放出デポー(ATRIGEL)、ロイプロリドインプラント(DUROS)、ゴセレリン、Eutropin、KP-102プログラム、ソマトロピン、メカセルミン(成長阻害)、エンフビルチド(enlfavirtide)、Org-33408、インスリングラルギン、インスリングルリジン、インスリン(吸入)、インスリンリスプロ、インスリンデテミル(insulin deternir)、インスリン(頬側、RapidMist)、メカセルミンリンファバート、アナキンラ、セルモロイキン、99 mTc-アプシタイド注射、ミエロピド(myelopid)、Betaseron、グラチラマー酢酸塩、Gepon、サルグラモスチム、オプレルベキン、ヒト白血球由来アルファインターフェロン、Bilive、インスリン(組換え)、組換えヒトインスリン、インスリンアスパルト、メカセルミン(mecasenin)、Roferon-A、インターフェロン-アルファ2、Alfaferone、インターフェロンアルファコン-1、インターフェロンアルファ、Avonex組換えヒト黄体形成ホルモン、ドルナーゼアルファ、トラフェルミン、ジコノチド、タルチレリン、ジボテルミンアルファ、アトシバン、ベカプレルミン、エプチフィバチド、Zemaira、CTC-111、Shanvac-B、HPVワクチン(四価)、オクトレオチド、ランレオチド、アンセスチム(ancestirn)、アガルシダーゼベータ、アガルシダーゼアルファ、ラロニダーゼ、酢酸プレザチド銅(外用ゲル)、ラスブリカーゼ、ラニビズマブ、Actimmune、PEG-Intron、Tricomin、組換えチリダニアレルギー脱感作注射、組換えヒト副甲状腺ホルモン(PTH)1-84(sc、骨粗しょう症)、エポエチンデルタ、トランスジェニックアンチトロンビンIII、Granditropin、Vitrase、組換えインスリン、インターフェロン-アルファ(経口ロゼンジ)、GEM-21S、バプレオチド、イデュルスルファーゼ、オマパトリラート(omnapatrilat)、組換え血清アルブミン、セルトリズマブ-ペゴル、グルカルピダーゼ、ヒト組換えC1エステラーゼ阻害剤(血管性浮腫)、ラノテプラーゼ、組換えヒト成長ホルモン、エンフビルチド(ニードルフリー注射、Biojector 2000)、VGV-1、インターフェロン(アルファ)、ルシナクタント、アビプタジル(吸入、肺疾患)、イカチバント、エカランチド、オミガナン、Aurograb、酢酸ペキシガナン(pexigananacetate)、ADI-PEG-20、LDI-200、デガレリクス、シントレデキン・ベスドトクス(cintredelinbesudotox)、Favld、MDX-1379、ISAtx-247、リラグルチド、テリパラチド(骨粗しょう症)、チファコギン、AA4500、T4N5リポソームローション、カツマキソマブ、DWP413、ART-123、Chrysalin、デスモテプラーゼ、アメジプラーゼ(amediplase)、コリフォリトロピンアルファ、TH-9507、テデュグルチド、Diamyd、DWP-412、成長ホルモン(持続放出注射)、組換えG-CSF、インスリン(吸入、AIR)、インスリン(吸入、Technosphere)、インスリン(吸入、AERx)、RGN-303、DiaPep277、インターフェロンベータ(C型肝炎ウイルス感染症(HCV))、インターフェロンアルファ-n3(経口)、ベラタセプト、経皮インスリンパッチ、AMG-531、MBP-8298、Xerecept、オペバカン(opebacan)、AIDSVAX、GV-1001、LymphoScan、ランピルナーゼ、Lipoxysan、ルスプルチド(lusupultide)、MP52(ベータ-リン酸三カルシウムキャリア、骨再生)、黒色腫ワクチン、シプリューセル-T、CTP-37、Insegia、ビテスペン、ヒトトロンビン(凍結、外科出血)、トロンビン、TransMID、アルフィメプラーゼ(alfimeprase)、Puricase、テルリプレシン(静脈内、肝腎症候群)、EUR-1008M、組換えFGF-I(注射剤、血管疾患)、BDM-E、ロチガプチド、ETC-216、P-113、MBI-594AN、デュラマイシン(吸入、嚢胞性線維症)、SCV-07、OPI-45、Endostatin、Angiostatin、ABT-510、Bowman Birk Inhibitor Concentrate、XMP-629、99 mTc-Hynic-Annexin V、カハラリドF、CTCE-9908、テベレリクス(持続放出)、オザレリクス(ozarelix)、ロミデプシン(rornidepsin)、BAY-504798、インターロイキン4、PRX-321、Pepscan、イボクタデキン、rhラクトフェリン、TRU-015、IL-21、ATN-161、シレンギチド、Albuferon、Biphasix、IRX-2、オメガインターフェロン、PCK-3145、CAP-232、パシレオチド、huN901-DMI、卵巣がん免疫療法ワクチン、SB-249553、Oncovax-CL、OncoVax-P、BLP-25、CerVax-16、マルチエピトープペプチド黒色腫ワクチン(MART-1、gp100、チロシナーゼ)、ネミフィチド、rAAT(吸入)、rAAT(皮膚科)、CGRP(吸入、喘息)、ペグスネルセプト、サイモシンベータ4、プリチデプシン、GTP-200、ラモプラニン、GRASPA、OBI-1、AC-100、サケカルシトニン(経口、エリゲン(eligen))、カルシトニン(経口、骨粗しょう症)、エキサモレリン、カプロモレリン、Cardeva、ベラフェルミン、131I-TM-601、KK-220、T-10、ウラリチド、デペレスタット、ヘマタイド、Chrysalin(外用)、rNAPc2、組換え第V111因子(PEG化リポソーム)、bFGF、PEG化組換えスタフィロキナーゼバリアント、V-10153、SonoLysis Prolyse、NeuroVax、CZEN-002、膵島細胞新生療法、rGLP-1、BIM-51077、LY-548806、エキセナチド(制御放出、Medisorb)、AVE-0010、GA-GCB、アボレリン(avorelin)、ACM-9604、酢酸リナクロチド(linaclotid eacetate)、CETi-1、Hemospan、VAL(注射剤)、即効性インスリン(注射剤、Viadel)、鼻腔内インスリン、インスリン(吸入)、インスリン(経口、エリゲン(eligen))、組換えメチオニルヒトレプチン、ピトラキンラ皮下(subcutancous)注射、湿疹)、ピトラキンラ(吸入乾燥粉末、喘息)、Multikine、RG-1068、MM-093、NBI-6024、AT-001、PI-0824、Org-39141、Cpn10(自己免疫疾患/炎症)、タラクトフェリン(外用)、rEV-131(眼科)、rEV-131(呼吸器疾患)、経口組換えヒトインスリン(糖尿病)、RPI-78M、オプレルベキン(経口)、CYT-99007 CTLA4-Ig、DTY-001、バラテグラスト、インターフェロンアルファ-n3(外用)、IRX-3、RDP-58、Tauferon、胆汁塩刺激リパーゼ、Merispase、アルカリホスファターゼ(alaline phosphatase)、EP-2104R、Melanotan-II、ブレメラノチド、ATL-104、組換えヒトマイクロプラスミン、AX-200、SEMAX、ACV-1、Xen-2174、CJC-1008、ダイノルフィンA、SI-6603、LAB GHRH、AER-002、BGC-728、マラリアワクチン(ビロソーム、PeviPRO)、ALTU-135、パルボウイルスB19ワクチン、インフルエンザワクチン(組換えノイラミニダーゼ)、マラリア/HBVワクチン、炭疽菌ワクチン、Vacc-5q、Vacc-4x、HIVワクチン(経口)、HPVワクチン、Tat Toxoid、YSPSL、CHS-13340、PTH(1-34)リポソームクリーム(Novasome)、Ostabolin-C、PTHアナログ(外用、乾癬)、MBRI-93.02、MTB72Fワクチン(結核)、MVA-Ag85Aワクチン(結核)、FARA04、BA-210、組換えplague FIVワクチン、AG-702、OxSODrol、rBetV1、Der-p1/Der-p2/Der-p7アレルゲン標的化ワクチン(チリダニアレルギー)、PR1ペプチド抗原(白血病)、突然変異体rasワクチン、HPV-16 E7リポペプチドワクチン、ラビリンチンワクチン(腺癌)、CMLワクチン、WT1ペプチドワクチン(がん)、IDD-5、CDX-110、Pentrys、Norelin、CytoFab、P-9808、VT-111、イクロカプチド(icrocaptide)、テルベルミン(telbermin)(皮膚科、糖尿病性足潰瘍)、ルピントリビル、レティクローゼ(reticulose)、rGRF、HA、アルファ-ガラクトシダーゼA、ACE-011、ALTU-140、CGX-1160、アンギオテンシン治療ワクチン、D-4F、ETC-642、APP-018、rhMBL、SCV-07(経口、結核)、DRF-7295、ABT-828、ErbB2特異的免疫毒素(抗がん剤)、DT3SSIL-3、TST-10088、PRO-1762、Combotox、コレシストキニン-B/ガストリン受容体結合ペプチド、111In-hEGF、AE-37、トラスツズマブ-DM1(trasnizumab-DM1)、Antagonist G、IL-12(組換え)、PM-02734、IMP-321、rhIGF

-BP3、BLX-883、CUV-1647(外用)、L-19ベースの放射免疫療法剤(がん)、Re-188-P-2045、AMG-386、DC/1540/KLHワクチン(がん)、VX-001、AVE-9633、AC-9301、NY-ESO-1ワクチン(ペプチド)、NA17.A2ペプチド、黒色腫ワクチン(パルス抗原治療剤)、前立腺がんワクチン、CBP-501、組換えヒトラクトフェリン(ドライアイ)、FX-06、AP-214、WAP-8294A(注射剤)、ACP-HIP、SUN-11031、ペプチドYY[3-36](肥満症、鼻腔内)、FGLL、アタシセプト、BR3-Fc、BN-003、BA-058、ヒト副甲状腺ホルモン1-34(経鼻、骨粗しょう症)、F-18-CCR1、AT-1100(セリアック病/糖尿病)、JPD-003、PTH(7-34)リポソームクリーム(Novasome)、デュラマイシン(眼科、ドライアイ)、CAB-2、CTCE-0214、グリコPEG化エリスロポエチン、EPO-Fc、CNTO-528、AMG-114、JR-013、第XIII因子、アミノカンジン、PN-951、716155、SUN-E7001、TH-0318、BAY-73-7977、テベレリクス(即時放出)、EP-51216、hGH(制御放出、Biosphere)、OGP-I、シフビルチド(sifuvirtide)、TV4710、ALG-889、Org-41259、rhCC10、F-991、thymopentin(肺疾患)、r(m)CRP、肝臓選択性インスリン、スバリン(subalin)、L19-IL-2融合タンパク質、エラフィン、NMK-150、ALTU-139、EN-122004、rhTPO、トロンボポエチン受容体アゴニスト(血小板減少性障害)、AL-108、AL-208、神経増殖因子アンタゴニスト(疼痛)、SLV-317、CGX-1007、INNO-105、経口テリパラチド(エリゲン(eligen))、GEM-OS1、AC-162352、PRX-302、LFn-p24融合ワクチン(Therapore)、EP-1043、S pneumoniae小児ワクチン、マラリアワクチン、Neisseria meningitidis B群ワクチン、新生B群ストレプトコッカスワクチン、炭疽菌ワクチン、HCVワクチン(gpE1+gpE2+MF-59)、中耳炎療法、HCVワクチン(コア抗原+ISCOMATRIX)、hPTH(1-34)(経皮、ViaDerm)、768974、SYN-101、PGN-0052、アビスクミン(aviscumnine)、BIM-23190、結核ワクチン、マルチエピトープチロシナーゼペプチド、がんワクチン、エンカスチム(enkastim)、APC-8024、GI-5005、ACC-001、TTS-CD3、血管標的化TNF(固形腫瘍)、デスモプレシン(頬側制御放出)、オネルセプト、およびTP-9201を挙げることができる。
【0116】
製造され得るようなペプチドの他の例としては、アダリムマブ(HUMIRA)、インフリキシマブ(REMICADE(商標))、リツキシマブ(RITUXAN(商標)/MABTHERA(商標))エタネルセプト(ENBREL(商標))、ベバシズマブ(AVASTIN(商標))、トラスツズマブ(HERCEPTIN(商標))、ペグフィルグラスチム(pegrilgrastim)(NEULASTA(商標))、またはバイオシミラーおよびバイオベターを含む任意の他の好適なポリペプチドが挙げられるがそれに限定されない。
【0117】
他の好適なポリペプチドは、以下の表6およびUS2016/0097074に列記されるものである。本発明の開示は、本明細書に記載されるような製造物の組合せおよび/またはコンジュゲート[(すなわち、マルチタンパク質、(PEG、毒素、他の活性の原料成分に共役した)修飾タンパク質を包含することを当業者は認め得る。
【表6-1】
【表6-2】
【表6-3】
【0118】
実施形態では、ポリペプチドは、表7に示されるようなホルモン、血液凝固/凝血因子、サイトカイン/増殖因子、抗体分子、融合タンパク質、タンパク質ワクチン、またはペプチドであることができる。
【表7-1】
【表7-2】
【0119】
実施形態では、タンパク質は、表8に示されるような多重特異性タンパク質、例えば、二重特異性抗体である。
【表8-1】
【表8-2】
【表8-3】
【表8-4】
【実施例
【0120】
実施例1
直交的方法によりゲノムの多次元マップを生成し、次にその1つまたは複数のマップを使用して、予測される高い発現および安定性を伴う導入遺伝子の標的化された組込みのための候補HI座位のリストを生成するプロセスの実施例が記載される。多次元マップを使用して候補座位のリストを得るために用いられるフィルタリングプロセスまたはアルゴリズムを図1に要約し、以下に記載する。
【0121】
最初に、マルチレベル遺伝学的およびエピジェネティックデータがその後に付加される参照ゲノムアセンブリーを構築した。
【0122】
CHO-K1SV 10E9チャイニーズハムスター卵巣(CHO)細胞系に由来するHi-Cデータ(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56)を使用して、ショートリードIllumina配列から初期に構築されたCHO-K1SV(10E9の祖先細胞系)シークエンシングスキャフォールドのデノボのアセンブリーの情報を与えた。近接性ベースのライゲーションの結果として、直鎖配列上で互いに近くに存在する領域、および/または同じ染色体内の領域の間でのコンタクトの密度の増加によりHi-Cデータを特徴付ける。そのため、Hi-Cを使用して、断片化された参照アセンブリー内の以前に単離された配列スキャフォールドの間の接続を確認することができる。3つの生物学的複製物からの3億1千万を超える特有の、有効なHi-Cリードペアアライメントを使用して、報告されたLACHESISアルゴリズム(Burton,J.et al.Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions.Nat.Biotechnol.31,1119-1125(2013))を介してCHO-K1SV配列スキャフォールドをクラスター化し、順序付けしかつ方向付けた。LACHESISアセンブリーは1146のインプット配列スキャフォールドを含み、元々のCHO-K1SV配列の90.52%を含む。最終のアセンブリーは、インプット配列スキャフォールドを13の高い信頼度の群にクラスター化し、長さプロファイルは12Mb~455Mbの範囲に及んだ。
【0123】
LACHESISアセンブリーに対してアライメントされた10E9細胞系からのHi-Cデータは、より確立されたヒトおよびマウス参照アセンブリーと関連付けられるものと似たゲノムワイドコンタクトマップ(図2A)を生成し、ヒト胚性幹細胞およびマウス胎仔肝細胞に由来する同等のHi-Cデータセットと合致する有効なリードペアのシス/トランス比を有した(図2B)。
【0124】
チャイニーズハムスター卵巣SSI 10E9細胞系に由来するペアードエンドHi-C配列データおよびプロモーター捕捉Hi-C(PCHi-C)配列データの3つの複製物(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56)をデフォルトのパラメーターの下でHiCUPバージョン0.5.9.dev(Wingett S,et al.,F1000Research 2015,4:1310))を通じて個々に処理した。目的の配列に対して特有にアライメントされた有効なリードペアのマッピングを、HiCUPパイプラインの部分としてBowtieバージョン1.1.0(Langmead B,et al.,Genome Biol.2009;10(3):R25)を使用して実行した。
【0125】
Buenrostro et al.2013(Nat Methods 10,1213-1218)に記載のプロトコールにしたがって生成され、チャイニーズハムスター卵巣SSI 10E9細胞系に由来するペアードエンドATAC-Seq配列データの3つの複製物を2つのレーンにわたりシークエンシングした。全ての結果としてもたらされたFASTQファイルをトリミングして、ペアードエンドモードにおいてシークエンシングアダプター配列を除去した後に、ペアードエンドモードおよび2,000塩基対の最大断片長さにおいてBowtie2(Langmead B,Salzberg S.Fast gapped-read alignment with Bowtie 2.Nature Methods.2012,9:357-359)を使用して目的の配列へのマッピングを行った。同じ試料に対応するその後のBAMファイルを特製のPerlスクリプトを使用して次にマージし、20未満のマッピングクオリティスコアを有するアライメントをSamtoolsのビュー機能を使用して試料マージBAMファイルから除去した(Li H.,Handsaker B.,Wysoker A.,Fennell T.,Ruan J.,Homer N.,Marth G.,Abecasis G.,Durbin R.および1000 Genome Project Data Processing Subgroup(2009)The Sequence alignment/map(SAM)format and SAMtools.Bioinformatics,25,2078-9)。
【0126】
懸濁適応性のCHO-K1細胞系に由来する報告されたヒストン修飾ChIP-Seq配列データセット(Feichtinger J,et al.Biotechnol Bioeng.113(10):2241-53(2016)- Accession Code PRJEB9291)をダウンロードし、各FASTQファイルをトリミングしてシングルエンドモードにおいてシークエンシングアダプター配列を除去した。トリミングされたFASTQファイルを次に、シングルエンドモードおよび1,000塩基対の最大断片長さにおいてBowtie2を使用して目的の配列に対してマッピングした。同じヒストン修飾の異なる時点に対応するBAMファイルを特製のPerlスクリプトを使用してマージし、もう一度、20未満のマッピングクオリティスコアを有するアライメントをSamtoolsのビュー機能を使用して試料マージBAMファイルから除去した。
【0127】
チャイニーズハムスター卵巣SSI 10E9細胞系に由来するペアードエンドトータルRNA-Seqデータの3つの複製物からのFASTQファイル(Zhang L,et al.2015)をトリミングして、ペアードエンドモードにおいてシークエンシングアダプター配列を除去した。トリミングされたFASTQファイルを次に、デフォルトのパラメーターの下でペアードエンドモードにおいてHiSat2(Kim D,Langmead B and Salzberg SL.HISAT:a fast spliced aligner with low memory requirements.Nature Methods.2012,12:357-360)を使用して目的の配列にマッピングした。40未満のマッピングクオリティスコアを有するアライメントを除去し、複製物データセットをSeqmonk内でマージした。ライブラリーは非鎖特異的なペアードエンドであること、およびアノテーション付きエクソンとオーバーラップするリードのみを定量化すべきであることを指定して、SeqMonk(Babraham Bioinformatics - SeqMonk Mapped Sequence Analysis Tool、Simon Andrewsによる)内のRNA-Seq定量パイプラインを使用してRNA-Seq定量(RPKM値)を実行した。結果としてもたらされた定量を異なる転写物長さについて正規化し、log変換した。負のlog-RPKM値を有する遺伝子座には全て、下流の解析のために0の値を与えた。
【0128】
Hi-C解析
3つの複製物からのフィルタリングおよびマッピングされたHi-C BAMファイルを特製のPerlスクリプトを使用してマージした。Hi-C要約ファイルを特製のPythonスクリプトを使用してマージされたBAMファイルから作製した後に、HOMER(Heinz S.,et al.,Mol Cell 2010 May 28;38(4):576-589.PMID:20513432)タグHi-Cディレクトリを作製した。
【0129】
5Kbの解像度、25Kbの超解像度および1Mbの最大相互作用距離カットオフを用いて上記のHi-Cタグディレクトリを「findHiCDomains.pl」HOMERスクリプトに供することによりトポロジカル関連ドメイン(TAD)を同定した。アルゴリズム内で利用したTAD境界は、出力ファイル中で定義されるドメインの塩基対末端であった。
【0130】
50Kbの解像度および100Kbの超解像度を用いて上記のHi-CタグディレクトリをHOMER「runHiCpca.pl」スクリプトに供することにより、活性のゲノムコンパートメントの同定を媒介する主成分分析を実行した。シード領域として152の「活発に発現される」遺伝子座位(チャイニーズハムスター卵巣10E9細胞系からの定常状態RNA-Seqデータの定量により決定される)の選択を使用して第1の2つの主成分を同定した。第1の主成分が異なる染色体アームの分離を表す場合、第2の主成分からのデータを使用した。全ての他の「染色体」について、第1の主成分からのデータを使用した。アルゴリズム内で利用した「活性」ドメインは、上記に議論した主成分分析データの融合をHOMER「findHiCCompartments.pl」スクリプトに供することにより同定した。
【0131】
この解析後にアルゴリズムにインプットされたデータは、目的の配列内で同定されたTAD境界位置および目的の配列内で同定された活性のコンパートメントの座標を含んだ。
【0132】
ATAC-Seq解析
以下のパラメーター;-q 0.01 --nolambda --nomodel --call-summitsを用いてMACS2「callpeak」機能を使用して目的の配列にマッピングされた3つ全ての複製物のATAC-Seqフィルタリング、マージBAMファイルにおいて接近可能なクロマチンにおけるピークを同定した。GenomicRanges Bioconductorパッケージ(Lawrence M,Huber W,Pages H,Aboyoun P,Carlson M,Gentleman R,Morgan M,Carey V(2013).“Software for Computing and Annotating Genomic Ranges.” PLoS Computational Biology,9)を使用して定義される、3つ全ての複製物においてオーバーラップするピークのユニオンをアルゴリズム内でその後に使用した。
【0133】
PCHi-C解析
デフォルトのパラメーターの下でCHiCAGOバージョン1.1.3(Cairns J,et al.,Genome Biology.2016.17:127)を使用してプロモーター捕捉Hi-Cデータセットから有意なプロモーター相互作用を同定した。プロモーターキャプチャーRNAベイトライブラリーを目的の配列に対して設計し、HindIII制限断片を含有するベイト付きのプロモーターのリストを作製した。CHiCAGOを実行する前に、特製のPerlスクリプトを使用して、アライメントされたPCHi-C BAMファイルをフィルタリングして、HindIII制限断片を含有するこれらのベイト付きのプロモーターの1つともオーバーラップしないリードペアを除去した。CHiCAGOを次に、デフォルトのパラメーターを使用して個々の複製物、フィルタリングされたBAMファイルに対して実行した。3つの複製物のうちの少なくとも2つにおいて統計的に有意として分類されたシス相互作用をさらなる使用のために抽出した。
【0134】
ChromHMM分析
フィルタリングされた、マージされたATAC-Seqおよび目的の配列に対してアライメントされた報告されたChIP-Seq BAMファイルを使用して、17の状態のChromHMMモデルの製造の情報を得た(Ernst and Kellis M.Nat Protoc.12:2478-2492(2017)。状態2および3は潜在的な活性のエンハンサー領域であるという属性を与えられ、状態11、12、14、15および16は、潜在的な抑圧的な特徴を有する領域として割り当てられた。
【0135】
潜在的な活性のエンハンサーHindIII制限断片のリストを、アノテーション付きTSSの2Kb以内にない少なくとも1つのChromHMM状態2または3の領域と最初にオーバーラップする制限断片として定義した。これらの候補制限断片をその後にフィルタリングして、「抑圧的」ChromHMM状態領域(11、12、14、15および16)のいずれかならびに/またはPCHi-C解析セクション内にリストされたHindIII制限断片を含有するベイト付きのプロモーターともオーバーラップするものを除去した。
【0136】
アルゴリズムの目的のために、少なくとも2つのPCHi-C複製物において統計的に有意として分類されたシスPCHi-C相互作用のリストを潜在的な活性のエンハンサーHindIII制限断片のリストに対してフィルタリングして、アルゴリズム内で利用されるシスの統計的に有意な相互作用の再現性のあるプロモーター:予測されるエンハンサーのセットを得た。
【0137】
アルゴリズムのこのバージョンにより発見された、結果としてもたらされた潜在的なHI座位を表1に記載する。包含されるHI座位は、これらの部位+/-特定の同定された部位のいずれかの側へ約5,000塩基対を含んだ。最近接のTAD境界に対する近接性、再現性のある予測されたエンハンサーのシス相互作用の数、および「関連付けられる」遺伝子の定常状態mRNAレベルに関する各部位についての順位付けの非重み付けの和の合計に基づいて予測される成績にしたがって表1における部位を順位付けしている。
【0138】
候補HI座位が3Dゲノムマップ内でどこに位置するのかの例を候補HI座位配列番号3について図3A、候補HI座位配列番号2について図3Bにおいて提供し、図3Cにおいて現行の産業上関連するFerIL4ランディングパッドについてのものと比較している。特に注意すべきことは、1)TAD境界、2)ATAC-Seqにより決定されたオープンクロマチンにおけるマッピングされたピーク、3)領域にマッピングされたプロモーター捕捉Hi-C相互作用、および4)マッピングされたエピジェネティックマークと比較した空間的位置である。
【0139】
実施例2
図1に概説し、実施例1に記載した手順を使用してHI座位を同定する方法の能力を実証するために、上位に順位付けされた候補座位のうちの5つおよびより低く順位付けされた座位のうちの5つを経験的な評価のために選んだ。これは、同定された座位におけるゲノム組込みのために標的化されたレポーター遺伝子カセットの発現を測定することにより達成された。2つの対照;チャイニーズハムスター卵巣SSI 10E9細胞系(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56)のヘテロクロマチン領域および5’隣接配列、Fer1l4ランディングパッドと共に標的座位を評価した。ヘテロクロマチン対照領域は、いかなる再現可能に有意なPCHi-C相互作用に関与するHindIII制限断片ともオーバーラップしない接近可能なクロマチンにおいてピークを表した。ピークはまた、不活性のゲノムコンパートメント内の「転写されない」Fbxl2遺伝子(Ref Seq ID NW_003613997.1、Genbank ID JH000418.1)の約14kb上流に存在し、構成的なヘテロクロマチンヒストンマーク、H3K9me3が存在する領域とオーバーラップする。これらの対照を含めることで、候補座位の査定のための直接的な参照点が提供された。
【0140】
候補座位を試験するために、特別に設計された「シュードgRNA」のための認識部位により隣接される、構成的なCMVプロモーターの制御下のeGFP発現カセットからなる、特別に設計されたGFPドナー鋳型プラスミドを構築した(図4A)。トランスフェクション後のインビボ切除を媒介するための特別に設計されたシュードgRNA配列を使用する前提は、報告された一般的な遺伝子タグ付加技術(Lackner et al.,2015;Nat Commun.6:10237.)から採用した。レポーター遺伝子に加えて、ドナープラスミドは、共にU6プロモーターの制御下であり、かつ共にRan et al.,2013(Ran et al.,2013;Nat Protoc.8(11):2281-2308)において指定されるgRNAスキャフォールド配列を含む、シュードgRNAおよび座位特異的gRNA配列(CMV-eGFPカセットを目的の座位に標的化するため)の両方を含有した。さらには、座位特異的gRNAカセット骨格は、再びRan et al.,2013(Ran et al.,2013)において概説されたクローニング戦略を使用する座位特異的crRNA配列の組込みを可能とするgRNAスキャフォールド配列の上流の2つのBbsI制限部位からなるものであった。シュードgRNAは全ての実験において一定のままであった一方、座位特異的gRNAは、CMV-eGFPカセットの座位特異的標的化を可能とするために変動させた。
【0141】
ドナーおよびCas9プラスミドの共トランスフェクション後に、Cas9ヌクレアーゼは、CMV-eGFPカセットに隣接する認識部位へのシュードgRNAの結合により指令された際にドナープラスミドからCMV-eGFPカセットを切断する。カセットは次に、座位特異的gRNAと組み合わせて働くCas9による標的ゲノムDNA切断後の細胞の内因性のNHEJ(非相同末端結合)機構により標的ゲノム座位において組み込まれるはずである。
【0142】
各候補座位について、オフターゲットゲノム切断を媒介する傾向を考慮に入れた自社製CRISPR gRNA設計ツールを使用してcrRNA標的配列を同定した。関連する候補座位にわたり別個の領域にそれぞれ特異的な、上位3つに順位付けされたcrRNA標的配列を選んだ。これらの配列を次に、U6プロモーターの下流かつgRNAスキャフォールド配列の上流でBbsI部位においてドナープラスミドに個々にクローニングして、Ran et al.2013において概説されるように標的座位についての最終の発現されるgRNAを作製した。各標的座位について、個々のcrRNA配列を含有する3つの別々のドナープラスミドを構築した。等モル比の3つの構築されたドナープラスミドを混合することにより各候補座位について無菌の5μgのドナープラスミドライブラリーを作製した。これらのライブラリーを次に5μgの無菌のCas9-Puroプラスミド(Dharmacon U-005100-120)と共にチャイニーズハムスター卵巣SSI 10E9細胞にトランスフェクトして、トランスフェクションにおいて合計で10μgのプラスミドDNAを得た。
【0143】
100μLのTE緩衝液中の10μgのプラスミドDNAに対して0.7mLのCD-CHO培地中の1×10個の生存細胞の細胞対DNAトランスフェクション比を用いて、Bio-Rad Gene Pulser Xcellエレクトロポレーションシステムを使用してエレクトロポレーションにより継代培養の2または3日目のチャイニーズハムスター卵巣SSI 10E9細胞にドナーおよびCas9プラスミドをトランスフェクトした。3連のトランスフェクションキュベットを次に30mLの予め温めたCD-CHO培地にプールし、回復させた。解析の前に培養物を合計で13日間回復させた。この時間の間に、培養培地を4日目に交換し、培養物を7日目および10日目に1mL当たり1×10個の生存細胞の細胞密度で継代培養した。
【0144】
解析の日に各細胞プールから20,000個の細胞の二重の注入を、Guava easyCyte 12HT卓上フローサイトメーターを使用してフローサイトメトリーにより細胞当たりのGFP出力について解析した。(図4B)において、特定のゲノム座位を標的化する各トランスフェクションプール中のGFP+細胞の平均パーセンテージを観察することができた。いかなる座位特異的gRNAも欠いたドナープラスミドを、ドナープラスミドのランダムな、相同性非依存のゲノム組込みから達成されるGFP発現および/またはプール派生物後に残っている残余の一過性のプラスミドからの発現についての陰性対照(「プラスミド対照」)として含めた。(図4C)において、各プールについてのGFP+細胞のメジアンGFPシグナルを示す。座位のこの試料から、大スケールの、ランダムな、経験的なスクリーニングにより高性能ゲノム部位として以前に同定されたFer1L4部位((Zhang et al.,Biotechnol Prog.2015:31(6)1645-56))と発現性能においておおよそ同等のHI座位を同定できたことを観察することができる。
【0145】
CMV-eGFPカセットのオンターゲット組込みが、上記で解析したプールにおいて起こったことを実証するために、製造者の説明書の下でGeneJET Genomic DNA purification kitを使用して各細胞プールからゲノムDNAを抽出した。GFP発現カセットの標的化された組込みを、GFP特異的プライマーならびに各候補組込み座位の上流および下流の配列に特異的なプライマーを使用してPCRを介してアッセイした。座位配列番号4を別にして、全ての候補座位において標的化された組込みが確認された(図4D)。この研究におけるプライマーの組合せを使用して、Ferl14座位からのセンスアンプリコンは観察されなかった。
【0146】
本発明に対するこれらおよび他の修飾およびバリエーションは、添付の特許請求の範囲においてより具体的に示される本発明の精神および範囲から離れることなく、当業者により実施され得る。追加的に、様々な実施形態の態様は、全体的または部分的のいずれかで相互交換されてもよいことが理解されるべきである。さらには、以上の記載は例に過ぎず、そのような添付の特許請求の範囲において記載されるものよりも本発明を限定することは意図されないことを当業者は認める。
図1
図2A
図2B
図3A
図3B
図3C
図4A
図4B
図4C
図4D
【配列表】
0007549582000001.app