(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024156849
(43)【公開日】2024-11-06
(54)【発明の名称】合成シス調節DNAを操作する方法
(51)【国際特許分類】
C12N 15/67 20060101AFI20241029BHJP
C12N 15/85 20060101ALN20241029BHJP
【FI】
C12N15/67 Z
C12N15/85 Z ZNA
C12N15/85 Z
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2024126042
(22)【出願日】2024-08-01
(62)【分割の表示】P 2021512569の分割
【原出願日】2019-09-05
(31)【優先権主張番号】18192715.3
(32)【優先日】2018-09-05
(33)【優先権主張国・地域又は機関】EP
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
2.SIMULINK
3.PYTHON
4.TRITON
5.PHOTOSHOP
(71)【出願人】
【識別番号】504439274
【氏名又は名称】マックス-デルブリュック-ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ-ゲマインシャフト
(74)【代理人】
【識別番号】100088904
【弁理士】
【氏名又は名称】庄司 隆
(74)【代理人】
【識別番号】100124453
【弁理士】
【氏名又は名称】資延 由利子
(74)【代理人】
【識別番号】100135208
【弁理士】
【氏名又は名称】大杉 卓也
(74)【代理人】
【識別番号】100183656
【弁理士】
【氏名又は名称】庄司 晃
(74)【代理人】
【識別番号】100224786
【弁理士】
【氏名又は名称】大島 卓之
(74)【代理人】
【識別番号】100225015
【弁理士】
【氏名又は名称】中島 彩夏
(74)【代理人】
【識別番号】100231647
【弁理士】
【氏名又は名称】千種 美也子
(72)【発明者】
【氏名】ガルジウロ,ガエターノ
(57)【要約】 (修正有)
【課題】レポーター遺伝子又は機能的エフェクターの細胞型又は発生段階特異的発現を可能にする合成シス調節DNAに基づく遺伝子追跡カセット又はベクターの生成のための代替的な及び/又は改善された手段を提供する。
【解決手段】対象の細胞型の所与の転写シグネチャーから内因的に生じるシス調節要素のセットを特定し、これらのシス調節要素をレポーター遺伝子又はエフェクター遺伝子の前に配置することによって発現カセットを生成するシステム生物学アプローチを用いる。
【選択図】
図1-1
【特許請求の範囲】
【請求項1】
a)対象の細胞型の遺伝子発現プロファイルを準備する工程と、
b)前記対象の細胞型のゲノム配列データを準備する工程と、
c)シグネチャー遺伝子のセットを該遺伝子発現プロファイルから選択する工程と、
なお、前記シグネチャー遺伝子は、(i)参照細胞型と比較して差次的に調節されるか、又は(ii)遺伝子発現レベルに応じて選択される;
d)転写因子をコードする遺伝子を、c)で選択された該シグネチャー遺伝子のセットにおいて特定する工程と、
e)ゲノム領域のセットを該ゲノム配列データから決定する工程と、
なお、各ゲノム領域は、c)で特定されたシグネチャー遺伝子をコードする配列と、前記シグネチャー遺伝子をコードする配列に隣接した付加的なゲノム配列とを含む;
f)同等の限定されたサイズ、好ましくは同じサイズの複数のゲノム小領域を、e)で決定された該ゲノム領域のセットにおいて特定する工程と、
なお、前記ゲノム小領域は、d)で特定された該転写因子の1つ以上についての1つ以上の結合部位を含む;
g)好ましくは2個~10個のゲノム小領域の最小セットを、f)で決定されたゲノム小領域から選択する工程と、
なお、該ゲノム小領域のセットは、d)で特定された全転写因子の所定のパーセンテージについての転写因子結合部位を含むように選択される;
h)レポーター遺伝子又はエフェクター遺伝子と操作可能に連結した、工程g)で選択された該ゲノム小領域のセットを含む細胞型特異的発現カセットを生成する工程と、
なお、該ゲノム小領域は、前記レポーター遺伝子又はエフェクター遺伝子の発現を調節するように構成される;
を含む、細胞型特異的発現カセットを生成する方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞型特異的発現カセット及びレポーターベクターを生成する方法、並びにかかる方法によって生成することができる核酸構築物に関する。細胞型特異的発現カセット及びレポーターベクターは、特性評価された、合成遺伝子座領域(sLCR)とも称される合成シス調節DNAである。sLCRは、レポーター遺伝子又はエフェクター遺伝子の細胞型特異的発現を可能にする。本発明は、遺伝子療法及びウイルス療法、創薬又は検証における細胞の特性、好ましくは細胞型、状態又は運命転換(fate transition)の決定を含む、レポーターベクターの様々な用途に更に関する。
【背景技術】
【0002】
発現カセット及びレポーターベクターは、基礎研究、薬物スクリーニング診断又は遺伝子療法において広範な用途を有する。
【0003】
細胞型特異的同一性を選択的に特定することは、様々な細胞型が組織恒常性に寄与する生物学的過程を理解する上で極めて重要である。理想的には、このアプローチは、代謝障害、免疫障害、神経障害又は精神障害、並びに炎症及び癌を含む、組織恒常性の変化を伴う疾患状況においても情報を与える。発生状況では、これは従来、系列追跡を用いて達成される1。
【0004】
最もよく知られている例の中でも、Fbx15発現の系列追跡は、多能性細胞への線維芽細胞のリプログラミングが可能な規定の因子の発見をもたらし49、Lgr5発現の系列追跡は、真の結腸幹細胞及び小腸幹細胞の特定を可能にし2、これらが他の幾つかの成体組織幹細胞をマークすることが後に示されている3。精巧なレポーター戦略の並行開発により、複数の系列の分析における単一細胞解析が可能である。
【0005】
従来、幾つかの遺伝子追跡アプローチが、細胞型特異的遺伝子操作及び細胞標識のためのレポーターマウスの生成に利用されている(例えばLacZ、mGmT、Brainbow及びConfettiシステム、二重標識を用いるモザイク解析(MADM)等)。これらの戦略により、複雑なニューロン結合パターンを明らかにすることができ4、生体内の腫瘍の起始細胞等の未解決の問題に取り組むことができる5。近年では、光遺伝学及びCRISRP/Cas9に基づく戦略によって、より定量的な読み出しを得る際の柔軟性が更に与えられた。
【0006】
成体幹細胞生物学に基づくレポーター戦略の使用は、組織の起源及びその異常な恒常性についての情報を同時に与えることができる6,7,8。よく特性評価された経路を反映する遺伝子レポーターによって、毛包恒常性において骨形成タンパク質(BMP)シグナル伝達に対抗する形質転換成長因子等の複雑なシグナル伝達の二分(dichotomy)をより深く理解することができる9。
【0007】
癌では、このアプローチにより、異常な恒常性が療法耐性の原因となる可能性があること10、又は再生能及び腫瘍感受性が幾つかの器官で共有され、若しくは他では著しく異なり得ること11が厳密に明らかになった。定量的な時空間的パターン形成ダイナミクスは、転写因子結合部位に基づいて合成レポーターを設計することで明らかにすることができる47。これらの研究及び他の幾つかの研究から推論されるように、遺伝子レポーターの選択は、精巧かつ複雑な生物学的問題に確実に対処するために重要な因子である。これは、多数の因子及び複雑な相互作用によって支配される発生状況又は疾患状況において特に有効である12。これらの状況では、単一遺伝子カセットにおいて多数の経路を妨害する合成レポーターを柔軟に設計する能力が確かに大きな利点であることが判明しているが、現在のアプローチは依然として限定されている。
【0008】
例えば、現在用いられている遺伝子追跡ベクターのアプローチは、レポーター遺伝子又は機能的エフェクターと結合した細胞型特異的、経路特異的又は合成プロモーター又はエンハンサーの使用に依存する。
【0009】
細胞型特異的プロモーターの使用は、レポーター遺伝子又は機能的エフェクターを対象の細胞型のシグネチャー遺伝子の最小プロモーターの後に配置することに基づく。これにより、所与の遺伝子のプロモーターによって媒介される所与のレポーター又はエフェクターの特異的転写活性化が可能となる。細胞型特異的ベクターは、細胞状態又は発生段階の代理として所与の一遺伝子を使用する可能性を与える。
【0010】
一例は、神経前駆細胞をマークするためのネスチンプロモーターの使用である。このアプローチは広く用いられ、研究者が未分化細胞における特定のレポーター又はエフェクターの活性化を誘導することを可能にする。
【0011】
これらのアプローチの大きな制約は、シグネチャー遺伝子についての予備知識が必要であること、及び上記遺伝子の調節要素が既知であり、転写開始部位に近接していると仮定されることである。さらに、これらのアプローチは、単一遺伝子の特異性が複雑な調節系を示すのに不十分である。この問題の煩雑な解決策は、任意の所与の対象の細胞型についての全ての特異的エンハンサーの細胞型特異的特定、それに続くかかる要素の1つの選択及び最小ウイルスプロモーターの上流へのそのクローニングを必要とする。しかしながら、このアプローチは技術的に要求が厳しく、教師付き選択に依存する48。どちらの制約によっても、かかるアプローチの用途が非常に選択的な状況に制限される。
【0012】
代替的アプローチでは、レポーター又はエフェクターを所与の経路に特異的な人工的に組み立てられた転写因子結合部位の後に配置するために経路特異的プロモーターを使用する。それにより、特異的転写活性化を上記経路にとって必須であることが知られる調節要素の媒介によって制御することができる。
【0013】
一例は、BMP経路の活性化を表すSMAD1/5/8の核活性に特異的なBMP応答要素(BRE)である。BMP応答要素(BRE)は標準経路活性化を確実に表すが、非標準活性化を逃し、フィードバックループへの感受性が不十分なレポーター系をもたらす。
【0014】
経路特異的プロモーターの使用の制限は、使用される調節要素の最小セットが経路活性化について情報を与えるのに十分であるという仮定に依存する必要性を含む。さらに、かかる調節要素の演繹的知識及びそれらの広範な特性評価及びそれらの天然環境からの単離が必要であり、複雑な、あまり特性評価されていない細胞型への適用が妨げられる。
【0015】
更なるアプローチとして、最小プロモーターの前の複数の人工的に組み立てられた転写因子結合部位の後に対象のレポーターを配置することによる合成エンハンサー又はプロモーターが提唱されている。しかしながら、これらの方法も、細胞型又は発生段階に関連することが知られる転写因子結合部位の演繹的知識に依存する。
【0016】
いずれの方法も、演繹的知識又は対象の細胞型若しくは段階に特異的な調節要素の正確な発見及び検証に依存するという問題がある。さらに、多くの場合、全ての調節要素がカバーされるわけではないため、信頼性の高い細胞型特性評価を確実にするために多数のマーカーを使用する必要があり、それによりレポーターの構築及び任意の実験結果の評価が複雑となる。
【0017】
フローサイトメトリーによる細胞特異的表面分子の発現に基づく細胞の特性評価も当該技術分野で記載されている。これは一般的な方法であるが、対応するマーカーが事前に知られている必要があり、全ての細胞型が特徴的な表面タンパク質を有するわけではないという点で制限される。さらに、かかるアプローチを用いた細胞型のin vivo追跡は可能でないか又は極めて困難である。
【0018】
レポーター遺伝子の発現を調節する多数の転写因子結合部位を用いるために代替的な遺伝子発現レポーターベクターが開発されている。
【0019】
特許文献1(韓国生命工学研究所)は、癌遺伝子において発現されるE2F転写因子の結合部位(EF2bs)に加え、更なる転写因子(例えばSP1、AP1、NF1又はC/EFB)の付加的な結合部位を有するプロモーターを含む癌特異的遺伝子発現ベクターを開示している。しかしながら、このアプローチも、特定の癌型に関連することが既に特定されたTF結合部位(例えばEF2bs)の演繹的知識に依然として依存する。
【0020】
特許文献2(ブリュッセル自由大学/ゲント大学)は、転写因子結合部位(TFBS)の富化により心筋及び骨格筋の特異的調節要素を特定するコンピューターによる方法を開示しており、各々が複数(3個~10個)の保存されたTFBSを含有する、長さ300 bp~500 bpの異なる調節領域(CSk-SH1~CSk-SH6;Sk-SH1)が開示される。しかしながら、この技術は、進化的に保存されたTFBSを用いることに焦点を合わせており、筋肉における発現を増強するために調節配列のゲノム保存に依存する。
【0021】
特許文献3は、対象の細胞において活性がある転写因子調節要素(TFRE)を特定するコンピューターによる方法を開示しており、ここで、TFREは少なくとも6 bp~100bpの長さを有し、6個以上のTFREを発現ベクターのプロモーター要素において組み合わせることができる。しかしながら、この技術には、予め選択された同じ最小プロモーターと任意の所与の条件下で特定された付加的なTFREとの融合、すなわち既知の機能を有するシス要素の教師付きマージが用いられる。
【0022】
非特許文献1は、幾つかのウイルスベクター及び転写調節要素を概説する。非特許文献2は、発現ベクターが調節ゲノム領域の種々のセグメントを含む、ショウジョウバエの濾胞上皮における卵黄膜タンパク質遺伝子32(VMPE)の細胞特異的発現のためのシス作用要素の特定を開示している。
【0023】
本分野におけるこれらの進展にも関わらず、かかる代替的アプローチは、関連プロモーターの演繹的知識への依存、TFBSの遺伝的/進化的保存に焦点を合わせること、又は既知の機能を有するシス要素によって修飾される単一プロモーターの使用等のレポーターベクターの生成に対して不利な戦略に依存する。
【0024】
したがって、合成レポーターの分野では、任意の所与の細胞型又は状態についての調節情報を解読及び再構築するための偏りのないde novoアプローチに基づく代替的な又は改善された方法及び構築物が必要とされている。
【先行技術文献】
【特許文献】
【0025】
【特許文献1】国際公開第2001/49868号
【特許文献2】国際公開第2015/110449号
【特許文献3】国際公開第2008/107725号
【非特許文献】
【0026】
【非特許文献1】Guo et al. (Trends in Mol. Medicine, 14:410-418)
【非特許文献2】Gargiulo et al. (Mechanisms of Development, 35:193-203)
【発明の概要】
【発明が解決しようとする課題】
【0027】
従来技術を考慮すると、本発明の基礎をなす技術的課題は、レポーター遺伝子又は機能的エフェクターの細胞型又は発生段階特異的発現を可能にする合成シス調節DNAに基づく遺伝子追跡カセット又はベクターの生成のための代替的な及び/又は改善された手段を提供することである。
【課題を解決するための手段】
【0028】
上記課題は、独立請求項の特徴によって解決される。本発明の好ましい実施の形態は、従属請求項によって提供される。
【0029】
したがって、本発明は、
a)対象の細胞型の遺伝子発現プロファイルを準備する工程と、
b)前記対象の細胞型のゲノム配列データを準備する工程と、
c)シグネチャー遺伝子のセットを該遺伝子発現プロファイルから選択する工程と、
なお、前記シグネチャー遺伝子は、(i)参照細胞型と比較して差次的に調節されるか、又は(ii)遺伝子発現レベルに応じて選択される;
d)転写因子をコードする遺伝子を、c)で選択された該シグネチャー遺伝子のセットにおいて特定する工程と、
e)ゲノム領域のセットを該ゲノム配列データから決定する工程と、
なお、各ゲノム領域は、c)で特定されたシグネチャー遺伝子をコードする配列と、前記シグネチャー遺伝子をコードする配列の隣に隣接した付加的なゲノム配列とを含む;
f)同等の限定されたサイズ、好ましくは同じサイズの複数のゲノム小領域を、e)で決定された該ゲノム領域のセットにおいて特定する工程と、
なお、前記ゲノム小領域は、d)で特定された該転写因子の1つ以上についての1つ以上の結合部位を含む;
g)好ましくは2個~10個のゲノム小領域の最小セットを、f)で決定されたゲノム小領域から選択する工程と、
なお、該ゲノム小領域のセットは、d)で特定された全転写因子の所定のパーセンテージについての転写因子結合部位を含むように選択される;
h)レポーター遺伝子又はエフェクター遺伝子と操作可能に連結した、工程g)で選択された該ゲノム小領域のセットを含む細胞型特異的発現カセットを生成する工程と、
なお、該ゲノム小領域は、前記レポーター遺伝子又はエフェクター遺伝子の発現を調節するように構成される;
を含む、細胞型特異的発現カセットを生成する方法に関する。
【0030】
方法は、対象の実体又は状態における遺伝子発現の調節についての予備知識を必要とせずに、対象の細胞に導入した場合に、レポーターが示すように設計された細胞型又は状態等の特定の実体又は状態に対して高度に特異的にレポーター遺伝子又はエフェクター遺伝子の発現をもたらす発現カセットの生成を可能にする。
【0031】
従来技術とは対照的に、本発明の方法及び構築物は、任意の所与の細胞型/状態についての調節情報を解読及び再構築する偏りのないde novoアプローチに基づく。本発明は、本質的に細胞型/状態特異的シグネチャー遺伝子での細胞型/状態特異的TFBSのクラスタリングに基づく全く新しいアプローチである。本発明は、任意の所与の細胞型/状態についての関連TFBSの定量的及び/又は統計的富化を用いることの利点も特徴とする。
【0032】
幾つかの実施の形態では、方法は本質的に、対象の細胞型の所与の転写シグネチャーから内因的に生じるシス調節要素のセットを特定し、これらのシス調節要素をレポーター遺伝子又はエフェクター遺伝子の前に配置することによって発現カセットを生成するシステム生物学アプローチを用いる。このアプローチは、対象の細胞型の特定の特性についての先入情報とは独立し、任意の所与の細胞型についてのレポーター構築物の標準化された偏りのない直接的な作製を可能にする。
【0033】
この目的で、方法は、細胞型に特徴的な転写因子結合部位を含むゲノム小領域を特定し、それらを対象の細胞型における転写調節配列情報の関連部分を含むゲノム小領域のセットに組み立てる。ゲノム小領域のセットは、「合成シス調節DNA」、「合成調節領域」又は「合成遺伝子座制御領域(sLCR)」と称される場合もある。
【0034】
細胞内に導入した場合に、特徴的な転写因子結合部位に対応する転写因子が上記細胞型に存在し、レポーター遺伝子又はエフェクター遺伝子の発現を開始するため、レポーター遺伝子又はエフェクター遺伝子の発現が生じる。このため、発現のレベルは特定の細胞型と関連している。各細胞型は、本質的にシグネチャー遺伝子セットに応じて異なる遺伝子のセットをもたらし、各細胞型は、存在する転写因子及びsLCRに組み立てられた調節領域の組合せに応じて異なるレベルのレポーター発現を示す。
【0035】
有利には、方法は、或る特定の細胞型に限定されず、実質的に任意の細胞型に適用することができ、更には或る特定の細胞型における細胞状態又は運命転換を区別することができる。この目的で対象の細胞型における遺伝子調節の演繹的知識は必要とされない。
【0036】
代わりに、方法は、標準的な生体分子技術又は専門的な(consulting)公開データベースを用いて得ることができる、所与の細胞型についての遺伝子発現プロファイル及びゲノム配列データの提供にのみ依存する。
【0037】
遺伝子発現プロファイルは、対象の細胞型における遺伝子発現のレベルを反映する。この目的で、例えばRNA-SEQ又は他のシークエンシング若しくはマイクロアレイベースの手法を用いて、対象の細胞型におけるRNA転写物のレベルを定量化することができる。しかしながら、遺伝子発現プロファイルは、潜在的にプロテオミクスを用いて、例えば遺伝子発現プロファイルに一致させることができる、対象の細胞型に存在するタンパク質又はペプチドの発現を定量化することによって推測することもできる。
【0038】
遺伝子発現プロファイルから、対象の細胞型、細胞状態又は実体に特徴的なシグネチャー遺伝子が選択される。シグネチャー遺伝子の選択を所望の用途に適合させることができる。
【0039】
例えば、シグネチャー遺伝子は、対象の細胞型の遺伝子をそれらの遺伝子発現レベルに応じてランク付けし、或る特定の閾値を上回る若しくは下回る遺伝子を選択するか、又は所定数の発現が最も高い若しくは最も低い遺伝子を選択することによって、遺伝子発現レベルに応じて選択することができる。かかるシグネチャー遺伝子の選択のために、対象の細胞型の遺伝子の絶対発現レベルを参照とする。これにより、得られる発現カセットは、調査対象の細胞とは独立して、様々なアッセイにおいて対象の細胞型の存在について忠実に報告することができる。
【0040】
しかしながら、或る特定の用途では、対象の細胞型と参照細胞又は参照細胞状態とを特に高い特異性で区別する発現カセットを生成することが望ましい場合もある。かかる用途では、参照細胞型における発現レベルと比較して上方調節又は下方調節される遺伝子を特定することによって、差次的に調節されるシグネチャー遺伝子が選択される。これらの実施の形態では、対象の細胞型及び参照細胞型の遺伝子発現プロファイルが提供される。差次的に調節される遺伝子を選択することで、対象の細胞型(又は状態若しくは運命)と或る特定の参照型(又は状態若しくは運命)とを区別する必要があるアッセイのために発現カセットを微調整することができる。
【0041】
選択されたシグネチャー遺伝子から、シグネチャー遺伝子のセット内の転写因子をコードする全遺伝子が特定される。この目的で、方法は、ENCODE、mENCODE(ENCODEプロジェクトのマウスバージョン)、JASPAR、Ensemble、EntrezGene、Genebank等の公的にアクセス可能な注釈付きデータベースを利用し得る。これにより、特徴的に発現される対象の細胞型についての転写因子のセットが特定される。当業者は、一般に利用可能なデータベースにおける機能の注釈により転写因子を特定することができる。さらに、各転写因子についての標的配列、すなわち転写因子結合部位は通例、当業者に既知であり、及び/又は上記のような適切に注釈付けされたデータベースを用いて得ることができる。好ましくは、幾つかの実施の形態では、方法は、結合部位(DNA配列又は配列モチーフの形態)が既に知られており、及び/又は好ましくは公開データベースにおいて注釈付けされた転写因子の使用のために行われる。
【0042】
さらに、選択された遺伝子のセットを用いて、各ゲノム領域がシグネチャー遺伝子をコードする配列と、該シグネチャー遺伝子をコードする配列に隣接した(好ましくはすぐ隣の)付加的なゲノム配列とを含むゲノム領域のセットを、対象の細胞型のゲノム配列データから決定する。このゲノム配列、例えば非コード参照DNA(但しシス調節要素がコード領域に存在していてもよい)は、大抵は転写開始部位に近接するが、これに限らない、コード領域の上流、コード領域の下流又はコード領域内に位置し得る調節配列を包含することを意図する。方法が有利には付加的なゲノム配列の追加部分の存在に対して過度に高感度ではないため、シグネチャー遺伝子に隣接した付加的なゲノム配列のサイズは変動し得る。
【0043】
このため、付加的なゲノム配列は、シグネチャー遺伝子の発現を調節するシス調節要素(特に転写因子結合部位又はエンハンサー若しくはサイレンサー)を包含するのに十分なほど大きいものとする。かかるシス調節要素は構造的にコード領域に近接し得るが、核小体内のゲノムの3D構造分布を考えると、シス調節要素が線状ゲノム配列においては相当な距離に位置する場合があることが知られている。好ましい実施の形態では、調節ゲノム配列は、トポロジカル関連ドメイン(topological associating domains)を境界として用いて、細胞型におけるクロマチン内のDNAの折り畳まれた三次元状態に基づいて選択される。好ましくは、幾つかの実施の形態では、細胞型特異的非コードCTCF結合部位がトポロジカル関連ドメインの代理として方法に想定される。CTCF結合部位(DNA配列又は配列モチーフの形態)は、一般に当業者に既知であり、及び/又は一般に公開データベースにおいて注釈付けされている。
【0044】
好ましい実施の形態では、ゲノム領域のセットを決定した後、方法により、シグネチャー遺伝子によってコードされる転写因子について1つ以上、好ましくは幾つかの結合部位を含む同様又は同等のサイズ(例えば同じサイズ)の複数のゲノム小領域を検索する。このため、方法の工程f)で特定されたゲノム小領域は全て、対象の細胞型において特徴的に発現される転写因子のDNA結合部位を含む。ゲノム小領域をsLCRに組み立て、該sLCRを対象の細胞に導入すると、特徴的に発現されるシグネチャー転写因子が該sLCRに結合し、下流のレポーター遺伝子又はエフェクター遺伝子の発現を調節し得る。通例、sLCRを構成するものよりも多くのゲノム小領域が特定され、これは特徴的な転写因子の結合部位について冗長である。限定数の特定された全ゲノム小領域の組立てが全体的な調節複雑性を表すのに十分であり、全ての要素を含むことで特異性は増大せず、むしろ不必要に大きな発現カセットが得られる。
【0045】
したがって、方法は、選択されたシグネチャー遺伝子によってコードされる全転写因子の所定のパーセンテージについて転写因子結合部位を含むゲノム小領域の最小セットを選択する工程を更に包含する。
【0046】
例としては、シグネチャー遺伝子のセットにおいて、100個の転写因子結合部位が既知である100個の転写因子が特定され得ると想定することができる。しかしながら、幾つかの実施の形態では、選択されるシグネチャー遺伝子によってコードされる転写因子の数は、必ずしも転写因子結合部位の数と同じとは限らない。幾つかの選択される実施の形態では、全ての転写因子が既知の結合部位を有していなくてもよく、又は複数の転写因子結合部位マトリックスが幾つかの転写因子に関連付けられていてもよい。
【0047】
例えば得られる調節配列をコンパクトにしておくために、sLCRの組立てにおいて可能な限り少数のゲノム小領域を使用する目的では、転写因子結合部位の多様性に加えて、方法によりゲノム小領域を転写因子結合部位の数に応じてランク付けするのが好ましい。例えば、最も高いランクのゲノム小領域は、工程d)の転写因子について35個の転写因子結合部位を含有し得るが、これらの結合部位のうち3個が同じゲノム小領域において5回表され、残りの結合部位は1回しか存在しない。この場合、この最も高いランクのゲノム小領域は、シグネチャー遺伝子の23個の転写因子の結合部位を表す23個の異なる(特有の)転写因子結合部位を含む。したがって、この最も高いランクのゲノム小領域は、工程d)の特徴的な転写因子の23%をカバーする。
【0048】
例えば、所定のパーセンテージを50%に設定した場合、第2の(潜在的には第3の)ゲノム小領域(複数の場合もある)が、好ましくは第1のゲノム小領域の23個の結合部位内に未だ含まれていない転写因子結合部位を包含するゲノム小領域等について検索され、更なるゲノム小領域(複数の場合もある)が第1の最も高いランクのゲノム小領域によって既にカバーされていない転写因子について少なくとも7個の結合部位を含む。通例、2個~10個のゲノム小領域の最小セットは、シグネチャー遺伝子によってコードされる転写因子の少なくとも50%について結合標的である転写因子結合部位を含む。
【0049】
発現カセットを対象の細胞型に導入した場合、ゲノム小領域の最小セットが、特徴的な転写因子が結合し得る合成シス調節DNAとして働く。したがって、方法の工程g)で選択されるゲノム小領域の最小セットは、本明細書で合成遺伝子座制御領域(sLCR)と称される。したがって、幾つかの実施の形態では、カセットは、例えば対象の細胞型において発現される又は高度に発現される転写因子が結合する調節配列について富化された調節領域(sLCR)を含む。したがって、この調節領域は、この特定の細胞型に特有であり/適合し、この細胞型に特有のレポーター遺伝子の発現レベルをもたらす。
【0050】
d)で特定される特徴的な転写因子の総量が対象の細胞型の調節機構を反映することを考えると、転写因子のカバレッジの所定のパーセンテージは、ゲノム小領域の最小セットによってカバーされる「調節情報のパーセンテージ」とみなすことができる。理論上は、カバーされる調節情報の量が多いほど、レポーター遺伝子又はエフェクター遺伝子の発現が細胞型に対してより特異的となる。しかしながら、有利には、少なくとも30%、好ましくは少なくとも40%又は50%の調節情報をカバーするパーセンテージは、実験的検証によって判断される細胞型特異的発現プロファイルの点で優れた結果をもたらす。
【0051】
方法の工程h)では、工程g)で選択されたゲノム小領域の最小セット(set minimal)を、レポーター又はエフェクターとともに、それらが操作可能に連結する、すなわちシス調節要素として転写因子結合部位を含むゲノム小領域がレポーター遺伝子又はエフェクター遺伝子の発現を調節するように構成されるように組み立てることによって細胞型特異的発現カセットを生成する。
【0052】
組み立てられたゲノム小領域による調節情報の高いカバレッジは、事前情報を必要とせずに、本明細書に記載の方法及び構築物の大きな使用可能性を開く。レポーターベクターの一部としての発現カセットは、固有の細胞状態、外部シグナル伝達又は化学的入力に対する適応反応、細胞運命転換、リプログラミング、フォワード及び化学的遺伝子スクリーニングのレポーターとしてin vitro及びin vivoで利用することができる。さらに、細胞型特異的sLCRをエンドヌクレアーゼ又は自殺遺伝子と組み合わせることで、遺伝子療法又は他の遺伝子改変状況において細胞型、発生段階又は疾患特異的な集団を枯渇させるためにベクターを用いることができる。これらの他の遺伝子改変状況においては、sLCRによって腫瘍溶解療法の特異性及び有効性を増大する目的で腫瘍溶解性ウイルスの構成成分及び/又は共刺激分子の腫瘍特異的発現を誘導することができる。
【0053】
本発明の好ましい実施の形態では、方法は、遺伝子発現プロファイルが該対象の細胞型における遺伝子の発現レベルを含み、
工程c)の(i)に従って、参照細胞型における遺伝子の発現レベルを含む、参照細胞型の遺伝子発現プロファイルを準備し、差次的に調節されるシグネチャー遺伝子を、該参照細胞型における発現レベルと比較して上方調節若しくは下方調節される遺伝子を特定すること、好ましくは該対象の細胞型において3倍~10倍以上、上方調節される遺伝子を選択することによって選択するか、又は、
工程c)の(ii)に従って、該対象の細胞型の遺伝子を、それらの遺伝子発現レベルに応じてランク付けし、シグネチャー遺伝子を、該対象の細胞型において100個~1000個の最も高度に発現された遺伝子若しくは100個~1000個の最も低く発現された遺伝子等の所定レベル若しくは所定数のシグネチャー遺伝子の発現に基づいて選択する。
【0054】
第2の代替案は、遺伝子発現プロファイルから導き出せる上記細胞型の遺伝子の発現レベルの比較に基づくシグネチャー遺伝子の選択を可能にする。かかる実施の形態は、異なる実験的状況において対象の細胞型を表す発現カセットの生成に特に適している。この目的で、平均発現レベルよりも3倍~10倍以上、上方調節される遺伝子の選択は、優れた結果をもたらした。
【0055】
第1の代替案は、参照細胞型と比較して対象の細胞型を区別するために発現カセットを調整することを可能にする。例としては、対象の細胞型が或る特定の腫瘍細胞であってもよく、参照細胞型は通例、腫瘍又は腫瘍細胞が由来する細胞型が浸潤した組織型の正常細胞を指す。
【0056】
しかしながら、参照細胞型は、同じ細胞型であるが、異なる細胞状態又は運命転換の前若しくは後を指す場合もある。対象の細胞型の遺伝子発現プロファイルが、上皮間葉転換(EMT)後の間葉状態の癌細胞の遺伝子発現プロファイルを指し、参照細胞型の遺伝子発現プロファイルが、同じ型であるが上皮状態の、すなわち上皮間葉転換(ETM)の前の癌細胞の遺伝子発現プロファイルを指す場合もある。この場合、発現カセットによってEMTを経た細胞とEMTを経ていない細胞とを区別することが可能である。
【0057】
参照細胞型と比較した相対調節に基づいてシグネチャー遺伝子を選択することによって導き出せる発現カセットは、特に高い特異性を特徴とし、任意の付加的なマーカーを必要とせずに参照細胞型と対象の細胞型との区別を可能にする。
【0058】
本発明の好ましい実施の形態では、方法は、カバーされる転写因子の所定のパーセンテージが30%以上、好ましくは40%以上、最も好ましくは50%以上であることを特徴とする。
【0059】
本発明の更に好ましい実施の形態では、方法は、e)で決定されたゲノム領域が、該差次的に調節される遺伝子を含有するトポロジカル関連ドメインのゲノム配列に相当し、好ましくはトポロジカル関連ドメインが、2つのCTFC結合部位間のゲノム配列に相当することを特徴とする。
【0060】
トポロジカル関連ドメインに基づいてゲノム領域のサイズを選択することによって、上記シグネチャー遺伝子の転写を支配する潜在的なシス調節要素の最適カバレッジを達成することができる。トポロジカル関連ドメインにおいて、DNA配列は、トポロジカル関連ドメインの外側の配列よりも頻繁に互いに物理的に相互作用し、それにより転写機構がアクセス可能な三次元染色体構造を形成する。特に良好な結果は、2つのCTFC結合部位間のゲノム配列を選択することによって達成され得る。かかる実施の形態は、コンピューターバッテリー容量、調節する可能性が最も高い遺伝子に対する非コードシス調節DNAの特異性、及び特徴的な転写因子結合部位をカバーする隣接DNAのサイズの間の最適なバランスをもたらす。
【0061】
方法の好ましい実施の形態では、工程f)における同等の、例えば同じサイズのゲノム小領域の特定は、e)で決定されたゲノム領域のスライディングウィンドウアルゴリズムによって行われ、好ましくは該ウィンドウが500 bp~5000 bp、好ましくは700bp~2000 bp、より好ましくは800 bp~1200 bp、最も好ましくは1000 bpの長さを有し、スライディングステップが100 bp~1000 bp、好ましくは120bp~300 bp、より好ましくは130 bp~170 bp、最も好ましくは150 bpの長さを有する。一実施の形態では、スライディングウィンドウは、150 bpのステップでスライディングする1000 bpのサイズに固定されるが、スキャニングから得られるゲノム小領域のサイズは、統計スコア及びTFBSの分布に左右されるため、異なるサイズであり得る。
【0062】
スライディングウィンドウアルゴリズムにより、工程d)で特定された転写因子に対応する転写因子結合部位に制限される関連データベース(例えばJASPAR)からの転写因子結合部位のモチーフの統計的富化が算出されることが更に好ましい。これにより、特定の領域内の特徴的な転写因子結合部位の大幅な富化のリストが作成され、シグネチャー遺伝子によってコードされる少なくとも1つの特徴的な転写因子について少なくとも1つの転写因子結合部位を含む同等の、好ましくは同じサイズのゲノム小領域の特定に用いられる。数十個(10個~200個、好ましくは20個~180個)のTFBSが同等のサイズのゲノム小領域に含まれることが好ましく、可能性が最も高い。
【0063】
本発明によると、e)で(工程fに従って)決定されたゲノム領域のセットにおける同等の限定されたサイズ、好ましくは同じサイズの複数のゲノム小領域は通例、同じサイズであるが、異なっていてもよい。この文脈での同等とは、好ましくは500 bp~5000 bpの任意のウィンドウサイズを示す複数のゲノム小領域を指す。
【0064】
本発明の更に好ましい実施の形態では、ゲノム小領域は100 bp~1000 bp、好ましくは120bp~300 bp、より好ましくは130 bp~170 bp、最も好ましくは150 bpの長さである。スライディングウィンドウアルゴリズムを用いる場合、ゲノム小領域の長さは、好ましくはスライディングステップと相関する。他の実施の形態では、スライディングウィンドウアプローチでは、1 bpから上記のウィンドウサイズについて示したステップサイズまでの任意の所与のステップサイズを用いることができる。好ましい長さは、細胞型及びアッセイシステムを区別し(difference)、発現カセットの発現特異性及び合計サイズの点で最適な結果を反映する方法を用いることで決定した。
【0065】
本発明の更に好ましい実施の形態では、方法は、g)におけるゲノム小領域のセットの選択が、f)で特定された各ゲノム小領域について、
該ゲノム配列データにおけるd)による転写因子についての結合部位の富化と、
結合部位が存在する転写因子の多様性のスコアと、
を算出することによって行われることを特徴とし、
該ゲノム小領域が、結合部位が存在する転写因子の累積パーセンテージに応じてランク付けされ、
ゲノム小領域の最小セットが、d)で特定された全転写因子の所定のパーセンテージについての結合部位を含むように選択される。
【0066】
例えば、転写因子結合部位の数及びタイプが、c)で選択されたシグネチャー遺伝子のセットにおいて転写因子をコードする遺伝子を特定した後に生成された。さらに、工程f)で生成されたゲノム小領域のリストを提供する。この情報を用いて、ゲノム配列データにおけるd)に従う転写因子の結合部位について富化を表す、ゲノム小領域当たりの転写因子結合部位(TFBS)の数を算出することができる(例えば、TFBS=35)。さらに、ゲノム小領域当たりの転写因子結合部位の多様性を算出することが好ましい。例えば、35個のTFBSのうち3個のTFBSが5回存在し、残りのTFBSが1回しか存在せず、上記ゲノム小領域について35個のTFBS数、23の多様性スコアが得られる。
【0067】
更なる工程では、好ましい方法により、ゲノム小領域を最大数のTFBS及び最良の多様性スコアに基づいてランク付けする。ゲノム遺伝子座chr10:6019558-6019708における1位のランクの一例としては、上記方法によって間葉GBM状態と関連付けられた20個のTFBSが存在し、幾つかが2回~6回反復する。最良のランクのゲノム小領域が決定された後、最初のゲノム小領域に存在するTFBSをランクから除外した残りの全ゲノム小領域において2番目に良いものを算出することができる。反復により、転写因子結合部位のセット全体又は所定のパーセンテージをカバーするのに必要とされる異なるゲノム小領域の数を算出することができる。全調節能のパーセンテージ(TFBSn×TFBSd)が必要とされる場合、2つの独立したLCRを生成することができる。通例、4個又は5個の要素が調節能の50%にまで達するのに十分であり、これが同じシグナル伝達に対応する2つの独立したsLCRを生成するのに十分であることが実証された(実施例を参照されたい)。
【0068】
本発明の更に好ましい実施の形態では、方法は、h)におけるゲノム小領域の構成が、転写開始部位を含むゲノム小領域がレポーター遺伝子をコードする配列に隣接して、その上流に組み立てられ、転写開始部位を含まないゲノム小領域が、好ましくは最も近い転写開始部位の更に上流に組み立てられるようなものであることを特徴とする。この場合、方法により天然の転写開始部位を含有するゲノム小領域要素(例えば、150 bpの要素)及び転写開始部位を含有しないもの全てに注釈を付けることができ、転写開始部位を含有するゲノム小領域からランク付けを始めることが特に好ましい。転写開始部位を含有する最良のランクのゲノム小領域を選んだ後、付加的なゲノム小領域のランク付けを、これらのゲノム小領域が転写開始部位を含有するか否かとは独立して行うことができる。
【0069】
本発明によると、幾つかの実施の形態では、「細胞型特異的発現カセットを生成する」という用語は、核酸分子の設計及び物理的作製に関する。幾つかの実施の形態では、「細胞型特異的発現カセットを生成する」という用語は、対応する核酸分子を物理的に作製することのない細胞型特異的発現カセットの設計に関し、例えば方法がコンピューターによって実行される方法であっても、又は方法の1つ以上のコンピューターによって実行される工程を含んでいてもよい。幾つかの実施の形態では、方法は、コンピューターによって実行される要素であるか又はそれを含み、方法のアウトプットとして、上記構築物のコンピューター内での設計、製品、シミュレーション及び/又はコンピューター表現をもたらす。したがって、カセット又は構築物の「生成」は、幾つかの実施の形態では、コンピューターにおいて、すなわちコンピューターソフトウェアにおいて行うことができ、例えばアウトプットは、核酸配列、核酸配列情報、すなわちコンピューター可読のフォーマットであり得る。
【0070】
本発明の方法は、幾つかの実施の形態では、ソフトウェア製品等のコンピュータープログラム製品に関する場合もある。
【0071】
ソフトウェアは、一般的なコンピューターデバイスで実行するように構成することができ、本明細書に記載の方法の工程a)~h)の1つ以上を行うように構成される。したがって、本発明のコンピュータープログラム製品は、本明細書で提供される方法について記載した特徴も包含し、それと直接的に関連する。好ましいコンピューターベースのアプローチについての更なる詳細は、実施例及び本明細書に記載される関連の参照文献に与えられる。方法が、例えば本発明のカセットのシミュレーション又はコンピューター設計を用いてコンピュータープログラムにおいて行われる場合、幾つかの実施の形態では、配列を続いて実験室において当業者に既知の方法によって合成し、in vitro又はin vivo用途のいずれが所望される場合にも利用することができる。
【0072】
本発明は、システムコンポーネントとして1つ以上のコンピューターデバイス、データ記憶装置及び/又はソフトウェアを備える本明細書に記載の方法を行うためのシステムにも関し、ここで、上記コンポーネントは、好ましくは互いに近接して又はデータ接続によって、例えばインターネットを通じて接続することができ、上記コンポーネントの1つ以上と相互作用し、及び/又は本明細書に記載の方法を行うように構成される。システムは、コンピューターデバイス、データ記憶装置及び/又は適切なソフトウェア、例えば本明細書に記載される方法を行うように互いに相互作用する個々のソフトウェアモジュールを備えることができる。
【0073】
コンピューターによる実現に関して、
対象の細胞型の遺伝子発現プロファイルの準備に関する工程a)は、コンピューターによって実行することができ、すなわち対象の細胞型の遺伝子発現プロファイルについての情報は、好ましくは方法の更なる工程で処理するように構成されるコンピューター可読のフォーマットで与えられる。
【0074】
上記対象の細胞型のゲノム配列データの準備に関する工程b)は、コンピューターによって実行することができ、すなわちゲノム配列データの情報は、好ましくは方法の更なる工程で処理するように構成されるコンピューター可読のフォーマットで与えられる。
【0075】
遺伝子発現プロファイルからのシグネチャー遺伝子のセットの選択に関する工程c)(ここで、該シグネチャー遺伝子は、(i)参照細胞型と比較して差次的に調節されるか、又は(ii)遺伝子発現レベルに応じて選択される)は、好ましくはコンピューターによって実行される。好ましい実施の形態では、遺伝子及びそれらの発現プロファイルは、コンピューターデバイスによって処理するように構成されるフォーマットの情報として表され、遺伝子の特定の群をこの情報に基づいて選択することができる。この工程は、用いられる/必要とされる選択特性又はユーザーの技能に応じて自動化するか又は手動で行うことができる。
【0076】
c)で選択されたシグネチャー遺伝子のセットにおける転写因子をコードする遺伝子の特定に関する工程d)は、好ましくは遺伝子が機能によって注釈付けされるコンピューターによって実行される方法において行われ、特定されたシグネチャー遺伝子のいずれか1つ以上において転写因子の機能を(任意に)自動的に詮索することができる。本明細書で例として言及される適切なデータベースを用いることができる。
【0077】
ゲノム配列データからのゲノム領域のセットの決定に関する工程e)(ここで、各ゲノム領域は、c)で特定されたシグネチャー遺伝子をコードする配列と、該シグネチャー遺伝子をコードする配列に隣接した付加的なゲノム配列とを含む)は、好ましくはコンピューターによって実行される方法において行われる。当業者は、対象の遺伝子に隣接したゲノム配列の評価及び選択をゲノム配列、すなわちデータベースから利用可能なゲノム配列に基づき、自動選択基準を用いて又は隣接した配列を手動で評価及び選択することによって行うことができる。
【0078】
e)で決定されたゲノム領域のセットにおける同じサイズの複数のゲノム小領域の特定に関する工程f)(ここで、上記ゲノム小領域は、d)で特定された転写因子の1つ以上についての1つ以上の結合部位を含む)は、好ましくはコンピューターによって実行される方法を用いて行われる。転写因子の1つ以上についての結合部位の特定は、当該技術分野で確立された方法を用いて行うことができ、例えば任意の所与の配列を、特定の配列又は配列モチーフによって規定される既知の結合部位の存在について検索及び/又は詮索する。配列をかかる既知の配列の存在についてスクリーニングするように構成されるソフトウェアは、当業者に利用可能である。
【0079】
f)で決定されたものからの好ましくは2個~10個のゲノム小領域の最小セットの選択に関する工程g)(ここで、ゲノム小領域のセットは、d)で特定された全転写因子の所定のパーセンテージについての転写因子結合部位を含むように選択される)は、好ましくは(任意に)自動化されたコンピューターアルゴリズムを用いて行われる。ゲノム小領域の決定についての詳細は上記に提示する。複数のオプションが所望のゲノム小領域の選択に適したソフトウェアソリューションに利用可能であるか、又は熟練したユーザーが手動で選択を行い、様々な小領域を評価し、工程d)で特定された関連の転写因子の或る特定のパーセンテージについての結合部位を含むように編成することができる。
【0080】
当業者は、転写因子結合部位の存在についてゲノム小領域を評価し、これらの結合部位とシグネチャー遺伝子として特定された転写因子とを比較し、関連の転写因子の所定のパーセンテージをカバーするゲノム小領域の編成を選択するための確立されたプログラミング、コーディング及びバイオインフォマティクス手法を用いてソフトウェアを設計及び/又は構成することができる。
【0081】
方法の工程h)によると、レポーター遺伝子又はエフェクター遺伝子と操作可能に連結した、工程g)で選択されたゲノム小領域のセットを含む細胞型特異的発現カセットが生成される。上記のように、上記の「生成」は、コンピューター可読の形態での核酸配列情報のコンピューターによって実行される作成及び/又は該配列に基づく及び/又は該配列を含む物理的核酸分子の合成に関連し得る。
【0082】
したがって、本発明は、工程a)~g)から得られる生成物DNA配列情報に対応するか、それを含むか又はそれに基づく核酸分子を設計及び/又は製造する方法に更に関する。方法は、好ましくは本明細書に記載の方法を行うことと、続いて上記核酸分子を合成、クローニング及び/又は単離することとを含む。
【0083】
「カセットを生成する」という用語は、かかる実施の形態では、核酸分子の生成に用いられるクローニング、突然変異、組換え、PCR増幅及び/又は合成のための任意の関連する分子生物学的又は化学的手法を含み得る。
【0084】
好ましい実施の形態では、本発明の方法によって得られた情報に基づき、de novo核酸合成を用いてカセットを合成する。
【0085】
更に好ましい実施の形態では、本発明は、本明細書に記載される方法によって生成された発現カセットを含む細胞型特異的レポーターベクターに関する。
【0086】
更なる態様では、本発明は、リンカーなしに又は小領域の間に位置する100 bp以下のリンカー配列によって隣接して位置する100 bp~1000 bpの2個~10個のゲノム小領域を含み、前記小領域が対象の細胞型の同じゲノムにおける別個の(非隣接)位置に由来し、該小領域が少なくとも5個、好ましくは少なくとも10個、最も好ましくは少なくとも20個の転写因子についての結合部位を累積的に含む合成調節領域と、レポーター遺伝子又はエフェクター遺伝子とを含み、該ゲノム小領域が、前記レポーター遺伝子又はエフェクター遺伝子の発現を調節するように該レポーター遺伝子又はエフェクター遺伝子と操作可能に連結する、細胞型特異的レポーターベクターに関する。
【0087】
本明細書に記載される工程a)~g)に従う方法によってゲノム小領域を選択することが特に好ましい。当業者には、方法について開示された好ましい実施の形態が本明細書に記載の細胞型特異的レポーターベクターにも等しく当てはまることが理解される。本発明の方法は、この分野で特有のベクターの構造的特徴をもたらす。
【0088】
本発明の好ましい実施の形態は、同じゲノムの非隣接領域に由来するゲノム小領域の起源と組み合わせた、ゲノム小領域に由来する転写因子結合部位が100 bp~1500 bp又は100bp~1250 bp、好ましくは100 bp~1000 bp、より好ましくは120 bp~300 bp、より好ましくは130 bp~170 bp、最も好ましくは本質的に150 bpの長さを有する構築物の設計に関する。この組合せにより、本発明の構築物は、調節情報の関連サイズ、特にDNAが巻き付けられるヒストン粒子のサイズに近い、好ましくは120 bp~300 bp、より好ましくは130 bp~170 bp、最も好ましくは150 bpのサイズを反映する、異なる/分離しているが、大いに関連する調節領域をまとめることによる新規の偏りのないde novo構築によって規定される。
【0089】
本発明の好ましい実施の形態は、5個以上の転写因子結合部位が用いられる、すなわちより多くのTFBS数が、任意の所与の細胞型/状態の関連TFの大きな調節部分をカバーするのに十分な数のTFBSをまとめることによる新規の偏りのないde novo構築を反映する構築物の設計に関する。
【0090】
ゲノム小領域は、それらが細胞型の同じゲノム内の別の位置に由来し、累積的に少なくとも5個、好ましくは少なくとも10個、最も好ましくは少なくとも20個、又はそれ以上の転写因子の結合部位を含むことを特徴とする。幾つかの実施の形態では、2個~10個(すなわち2個、3個、4個、5個、6個、7個、8個、9個又は10個)のゲノム小領域が少なくとも5個、10個、15個、20個、25個、30個、35個、40個以上の転写因子結合部位を含むsLCRを形成するように編成される。したがって、ゲノム小領域は通例、対象の細胞型の調節情報をカバーするのに十分である多量の転写因子の結合部位をカバーする。転写因子の結合部位が対象の細胞型において特徴的に発現された転写因子を指すことが好ましい。対象の細胞型において特徴的に発現される転写因子を決定するために、例えば本明細書に記載の方法の工程a)~d)を用いることができる。
【0091】
長さ100 bp~1000 bpのかかるゲノム小領域を2個~10個含む合成調節領域を用いることで、転写因子結合部位によって表される大量の調節情報を維持した上でベクターのサイズを最小限に抑えるという点で最適なレジームが証明された。
【0092】
この点でも、隣接してリンカーなしに又は100 bp未満のリンカー配列によって隣接したゲノム小領域の配置により、調節情報の量を含まないレポーターベクターのコンパクトな設計及び効率的な形質導入が確実となる。
【0093】
本発明の特定の好ましい実施の形態では、ベクターは、ゲノム小領域の各々が120 bp~300 bp、より好ましくは130 bp~170 bp、最も好ましくは150 bpの長さを有することを特徴とする。かかる長さのゲノム小領域は、バックグラウンドゲノム領域に対する統計的有意性について富化された関連の転写因子結合部位を最適にカバーする。150 bpの最適なサイズは、ヒストンのコア粒子に円形の146塩基対(bp)のDNAゲノムが巻き付けられ、転写因子へのアクセスを妨げることによる可能性がある。対照的に、通常は活性シス調節DNAと関連するヌクレオソームフリー領域(NFR)がDNAのアンラッピング後に転写因子へのアクセシビリティを可能にし、これはしたがって最小で146bpである。シス調節DNAの平均サイズは概して、DNaseI超感受性部位とも称されるNFRの平均サイズによって推論され、これは約1000 bpであり、通常はこれらの長さスケールでの関連の転写因子結合部位のクラスタリングを含む。
【0094】
本発明の更に好ましい実施の形態では、ベクターは、レポーター遺伝子又はエフェクター遺伝子に隣接したゲノム小領域が転写開始部位を含むことを特徴とする。これによりエフェクター及びレポーターがインフレームであり、上流の合成調節領域によって正に調節され得ることが確実となる。
【0095】
本明細書に記載の本発明の特有の設計は、様々なレポーター遺伝子又はエフェクター遺伝子が所望の用途に応じてゲノム小領域を含む合成調節領域と結合し得るという利点を有する。
【0096】
本発明の好ましい実施の形態では、ベクターは、レポーター遺伝子又はエフェクター遺伝子が、蛍光タンパク質、自殺遺伝子、ルシフェラーゼ、β-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、表面受容体、6×Hisタグ、V5タグ、GFPタグを含むが、これらに限定されないタンパク質タグ、自己プロセシングリボザイムカセット、メバロン酸キナーゼ及びその誘導体、BirAを含むが、これに限定されないビオチンリガーゼ及びその誘導体、APEX2を含むが、これに限定されない改変ペルオキシダーゼ及びその誘導体、制限酵素、Cre、Flp、Tn5、SpCas9、SaCas9、TALENを含むが、これらに限定されないエンドヌクレアーゼ若しくは部位特異的リコンビナーゼ及びそれらの誘導体、単一遺伝子疾患を矯正する遺伝子、細胞型特異的ワクチン接種を誘導するためのE1A及びE1B等のウイルス抗原、又はGM-CSF若しくはIL-12等の免疫認識を増強するためのアジュバントサイトカイン/ケモカインを含む群から選択されるタンパク質をコードすることを特徴とする。
【0097】
蛍光タンパク質は、レポーター遺伝子の発現の指標となるシグナルの任意の種類の光学的測定に特に有用であり得る。この目的で、方法は、現行の技術水準の顕微鏡的及び/又は蛍光活性化細胞選別装置及び定量化手法の使用から利益を得る可能性がある。
【0098】
さらに、本発明は、異なる種類のベクター系を使用して容易に用いることができ、対象の細胞に容易に適合することができる。
【0099】
本発明の好ましい実施の形態では、ベクターはウイルスベクター、好ましくはレンチウイルスベクター又はアデノ随伴ウイルスベクターである。
【0100】
本発明の更に好ましい実施形態では、ベクターは、配列番号1~6による核酸配列又は配列番号1~6のいずれか1つに対して少なくとも80%、好ましくは少なくとも90%の同一性を有する核酸配列を含む。
【0101】
本明細書に記載されるように、本発明は、予備知識を必要とせずに、対象の細胞型における所望のレポーター遺伝子又はエフェクター遺伝子の信頼性の高い発現を媒介する細胞型特異的ベクター構築物の提供を可能にする。そのため、ベクター構築物は、基礎研究から臨床研究又は治療戦略に及ぶ様々な異なる用途を可能にする。
【0102】
例えば、ベクター構築物は、細胞型の特定又は固有の細胞状態若しくは細胞の発生状態の決定に用いることができる。ベクターは、細胞がどのように外部シグナル又は化学物質と反応するかを研究することも可能にする。さらに、ベクターは、例えば癌の状態又は型、例えば上皮又は間葉膠芽腫が存在するかを決定する診断に使用することができ、より効果的な治療指針を可能にする。さらに、ベクターは、例えば遺伝子療法アプローチにおいて医薬品自体としても用いることができる。
【0103】
本発明の好ましい実施の形態では、遺伝子療法及びウイルス療法、創薬又は検証のために細胞を形質転換し、及び/又は細胞の特性、好ましくは細胞型、状態又は運命転換を決定する、ベクターの使用に関する。
【0104】
既に形質転換した細胞における本明細書に記載されるベクター又はsLCRの存在は、本発明の実施の形態に包含される。
【0105】
一実施の形態では、本発明は、
a.本明細書に記載される細胞型特異的レポーターベクターを準備する工程と、
b.細胞を準備する工程と、
c.該細胞に前記ベクターを形質導入する工程と、
d.レポーター遺伝子又はエフェクター遺伝子の発現の指標となるシグナルを測定する工程と、
なお、該シグナルの量は、該細胞の特性、好ましくは細胞型、状態又は運命転換を示唆する;
を含む、細胞の特性、好ましくは細胞型、状態又は運命転換を決定する方法に関する。
【0106】
任意の好適な測定法を用いることができる。例えば、レポーター遺伝子又はエフェクター遺伝子は蛍光タンパク質であってもよく、この場合、顕微鏡装置を用いて蛍光シグナル、ひいては調査される細胞におけるレポーター遺伝子又はエフェクター遺伝子の発現を定量的に評価することができる。
【0107】
一実施の形態では、本発明は、
a.本明細書に記載される細胞型特異的レポーターベクターを準備する工程と、
b.固有の細胞状態が存在する若しくは存在しないか、又は任意に誘導することができる細胞を準備する工程と、
c.細胞に上記ベクターを形質導入する工程と、
d.任意に細胞を誘導する工程と、
e.レポーター遺伝子の発現の指標となるシグナルを測定する工程と、
なお、シグナルの量は、細胞の各々の固有の細胞状態を示唆する;
を含む、固有の細胞状態を決定する方法に関する。
【0108】
一実施の形態では、本発明は、
a.本明細書に記載される細胞型特異的レポーターベクターを準備する工程と、
b.外部シグナル伝達及び/又は化学的摂動に応答して運命転換を経た細胞を準備する工程と、
c.細胞に上記ベクターを形質導入する工程と、
d.細胞を外部シグナル伝達及び/又は化学的摂動に曝露する工程と、
e.レポーター遺伝子の発現の指標となるシグナルを測定する工程と、
なお、シグナルの量は、細胞の運命転換を示唆する;
を含む、細胞運命転換を決定する方法に関する。
【0109】
一実施の形態では、本発明は、
a.本明細書に記載される細胞型特異的レポーターベクターを準備する工程と、
b.転写因子、外部シグナル伝達及び/又は化学的摂動を含むリプログラミング因子に応答して運命転換を経た細胞を準備する工程と、
c.細胞に上記ベクターを形質導入する工程と、
d.細胞を転写因子、外部シグナル伝達及び/又は化学的摂動に曝露する工程と、
e.レポーター遺伝子の発現の指標となるシグナルを測定する工程と、
なお、シグナルの量は、細胞の運命転換を誘導する因子を示唆する;
を含む、細胞運命リプログラミング因子を決定する方法に関する。
【0110】
一実施の形態では、本発明は、
a.本明細書に記載される細胞型特異的レポーターベクターを準備する工程と、
b.固有のシグネチャーをin vivoで有する細胞を準備する工程と、
c.細胞に上記シグネチャーを反映する上記ベクターを形質導入する工程と、
d.細胞を一連の生物製剤及び化学物質に曝露する工程と、
e.対象とする表現型の指標となるシグナルを測定する工程と、
なお、シグナルの量は、表現型を示唆する;
を含む、対象とする表現型のin vitro細胞増殖の最小必要要件を決定する方法に関する。
【0111】
一実施の形態では、本発明は、
a.本明細書に記載される細胞型特異的レポーターベクターを準備する工程と、
b.所与の細胞における所与の遺伝子の発現又は排除によって矯正することができる固有の病的状態を有する細胞を準備する工程と、
c.細胞に上記疾患を矯正する遺伝子、又は自殺遺伝子、又はエンドヌクレアーゼの発現を誘導する上記ベクターを形質導入する工程と、
d.上記疾患を矯正する遺伝子、自殺遺伝子若しくはエンドヌクレアーゼを活性化する薬物に細胞を曝露する工程と、
e.レポーター遺伝子の発現の指標となるシグナル及び疾患矯正の指標となるシグナルを測定する工程と、
を含む、罹患細胞の標的化矯正のための方法に関する。
【0112】
一実施の形態では、本発明は、
a.本明細書に記載される腫瘍細胞型特異的レポーターを準備する工程と、
b.遺伝子導入により腫瘍sLCRの発現下で腫瘍関連抗原(TAA)及び/又は分子アジュバントを発現するように改変することができる、アデノウイルス、マラバ(Maraba)ウイルス、VSV、HSV-1、麻疹ウイルス、レオウイルス、レトロウイルス及びワクシニアウイルスを含む腫瘍溶解性ウイルスゲノムをコードするベクターを準備する工程と、
c.上記ベクターを含むウイルス粒子を生成する工程と、
d.標的生物に上記ウイルス粒子を形質導入して腫瘍細胞を感染させる工程と、
e.周囲組織にはない腫瘍組織内のウイルス遺伝物質を測定する工程と、
を含む、腫瘍溶解性ウイルス療法の方法に関する。
【0113】
本明細書に記載の方法、例えば細胞の特性、好ましくは細胞型、状態又は運命転換を決定する方法は、様々な生物学的、生物工学的又は薬学的(スクリーニング)状況において用いることができる。
【0114】
本発明の更なる実施の形態は、シグネチャー遺伝子の発見のためのインプットとしてのDNAメチル化及び/又はATAC-seqプロファイルの使用に関する。
【0115】
ATAC-seq(シークエンシングを用いたトランスポザーゼでアクセス可能なクロマチンのアッセイ)は、シークエンシングアダプターをゲノムのオープン領域に挿入する高活性突然変異体Tn5トランスポザーゼでオープンクロマチンを調査することによってゲノムワイドクロマチンアクセシビリティを評価するために用いられる手法である。突然変異体Tn5トランスポザーゼは、シークエンシングアダプターが予め組み込まれたTn5トランスポザーゼによってDNAの同時の断片化及びタグ付けが行われるタグメンテーションと呼ばれるプロセスにおいて任意の十分に長いDNAを切除する。次いで、タグ付きDNAフラグメントを精製し、PCRによって増幅し、シークエンシングに送る。次いで、シークエンシングの読み取りを用いてアクセシビリティが増大した領域を推測するとともに、転写因子結合部位及びヌクレオソーム位置の領域をマッピングすることができる。
【0116】
幾つかのクラスのシス調節要素のクロマチンアクセシビリティは、転写因子によるin vivo DNA結合の予測マーカーである。クロマチン中の全てのアクセス可能な部位のレパートリーは、細胞同一性の最も強い予測因子である。実際に、癌では、クロマチンアクセシビリティが癌型類似性の最も強い予測因子であり、個々の癌型の共通次元空間におけるサブタイプ同一性の特定に用いることができる。sLCRによって示される後天的異質性がゲノムワイドクロマチンアクセシビリティの変化を伴うかを調査するために、ATAC-seqを行い、本明細書に記載のレポーター構築物の発現レベルに従って細胞を選別することができる。したがって、クロマチンアクセシビリティの示差分析は、リモデリングが起こっている多くの遺伝子を明らかにすることができる。下記実施例に記載するこれらの結果により、例えば腫瘍内異質性を明らかにし、原発性癌データとともに腫瘍モデルの徹底的な細胞及び分子特性解析を可能にするsLCRの有効性が強調される。
【0117】
本発明の更なる実施の形態は、ストレス反応(例えば高ERストレス又は炎症性シグナル伝達を有する細胞の死滅)及びセノリティクス(例えば老化細胞の死滅)の分野における薬物標的についての標的発見及び検証に関する。
【0118】
本発明の方法を用いることで、特異的調節プロファイルを任意の所与の細胞状態について特定し、レポーター構築物を効果的に生成することができる。幾つかの実施の形態では、高ERストレス若しくは炎症性シグナル伝達を有する、又は老化が起こっている細胞型/状態についてsLCRを生成することができる。したがって、かかるレポーターを用いて、任意の所与の、すなわちスクリーニング中に適用される薬物候補が細胞状態の変化をもたらすかを測定することができる。
【0119】
本発明の更なる実施の形態は、細胞同一性/運命変化の分野における薬物標的についての標的発見及び検証に関する。本明細書に詳細に記載されるように、特異的調節プロファイルを任意の所与の細胞同一性、又は同一性若しくは運命の変化の前後の状態について特定し、レポーター構築物を効果的に生成することができる。幾つかの実施の形態では、sLCRを同一性変化の前後の細胞型について生成することができる。したがって、かかるレポーターを用いて、任意の所与の、すなわちスクリーニング中に適用される薬物候補が細胞状態の変化をもたらすかを測定することができる。
【0120】
本発明の更なる実施の形態は、本明細書に記載の方法及び構築物を用いた合成ペプチドについての標的発見及び検証に関する。
【0121】
本発明の更なる実施の形態は、本明細書に記載の方法及び構築物を用いた治療用エキソソーム及びアンチセンスオリゴヌクレオチドについての標的発見及び検証に関する。
【0122】
本発明の更なる実施の形態は、治療反応及び耐性における自然免疫細胞の役割を含むが、これに限定されない免疫療法における薬物候補の治療可能性の発見、並びに枯渇及び主要標的特異性に対抗する治療用適応免疫細胞(T細胞、NK)を操作するためのsLCRの使用に関する。
【0123】
幾つかの実施の形態では、sLCRを免疫細胞活性及び/又は標的特異性の読み出しとして生成することができ、免疫細胞(T細胞、NK)が候補化合物で増強/処理した場合に枯渇に対抗し得るかを評価するために候補分子を試験し、sLCR読み出しの変化を測定することができる。
【0124】
更なる実施の形態では、本発明は、本明細書に記載される方法の工程a)~g)を含む、合成遺伝子座制御領域(sLCR)の配列を決定するコンピューターによって実行される方法に関する。したがって、本発明は、本明細書に記載される方法工程a)~g)を行うことが可能であり、そのように適合したコンピューターソフトウェア製品、及びプログラムがコンピューターによって実行される場合、コンピューターに本明細書に記載の方法のa)~g)の工程を行わせる指示を含む、本明細書に記載の方法に使用されるコンピュータープログラムにも関する。
【0125】
本発明を添付の図面によって更に説明する。これらは、本発明の範囲を限定することを意図したものではなく、本明細書に記載される本発明の更なる説明のために提示される本発明の態様の好ましい実施形態を示す。
【図面の簡単な説明】
【0126】
【
図1-1】合成遺伝子座制御領域(sLCR)の生成及び検証を示す図である。
【
図1-2】合成遺伝子座制御領域(sLCR)の生成及び検証を示す図である。
【
図1-3】合成遺伝子座制御領域(sLCR)の生成及び検証を示す図である。
【
図1-4】合成遺伝子座制御領域(sLCR)の生成及び検証を示す図である。
【
図2-1】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答を示す図である。
【
図2-2】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答を示す図である。
【
図2-3】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答を示す図である。
【
図3】sLCRを用いたGBMサブタイピング及びリプログラミングを示す図である。
【
図4-1】sLCRによって明らかになった組織非依存性上皮-間葉恒常性を示す図である。
【
図4-2】sLCRによって明らかになった組織非依存性上皮-間葉恒常性を示す図である。
【
図4-3】sLCRによって明らかになった組織非依存性上皮-間葉恒常性を示す図である。
【
図5-1】in vivoでsLCRによって明らかになった不均一な間葉分化転換を示す図である。
【
図5-2】in vivoでsLCRによって明らかになった不均一な間葉分化転換を示す図である。
【
図6-1】MES GBMサブタイプのサブタイプ特異的遺伝子の選択を示す図である。
【
図6-2】MES GBMサブタイプのサブタイプ特異的遺伝子の選択を示す図である。
【
図7-1】自動化された合成遺伝子座制御領域(sLCR)生成を示す図である。
【
図7-2】自動化された合成遺伝子座制御領域(sLCR)生成を示す図である。
【
図8】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答を示す図である。
【
図9】MGT#1シス調節DNAに結合する転写因子を示す図である。
【
図10】乳癌細胞におけるMGT#1発現の恒常性維持を示す図である。
【
図11-1】MGT#1がEMTへのTGFB及びGSK126の単独及び組合せでの寄与を反映することを示す図である。
【
図11-2】MGT#1がEMTへのTGFB及びGSK126の単独及び組合せでの寄与を反映することを示す図である。
【
図12】MGT#1が外部シグナル伝達及び/又は化学的摂動によって誘導される細胞運命転換のスクリーニングを可能にすることを示す図である。
【
図13-1】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答(増殖)を示す図である。
【
図13-2】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答(増殖)を示す図である。
【
図13-3】sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答(増殖)を示す図である。
【
図14-1】sLCRによって明らかになった不均一な間葉分化転換(in vivoで増殖)を示す図である。
【
図14-2】sLCRによって明らかになった不均一な間葉分化転換(in vivoで増殖)を示す図である。
【
図15-1】sLCRが腫瘍と免疫細胞との間の非細胞自律的クロストークの治療との関連の発見を容易にすることを示す図である。
【
図15-2】sLCRが腫瘍と免疫細胞との間の非細胞自律的クロストークの治療との関連の発見を容易にすることを示す図である。
【
図15-3】sLCRが腫瘍と免疫細胞との間の非細胞自律的クロストークの治療との関連の発見を容易にすることを示す図である。
【
図16】合成遺伝子座制御領域(sLCR)の詳細な特性評価を示す図である。
【
図17】sLCRによって明らかになった適応応答の更なる例を示す図である。
【
図18】GICにおけるsLCRによって測定されたMES-GBM状態の誘導が特異的かつ可逆的であることを示す図である。
【
図19-1】MES-GBMにおける電離放射線及びNFkBシグナル伝達の役割を分析するためのMES-sLCRを示す図である。
【
図19-2】MES-GBMにおける電離放射線及びNFkBシグナル伝達の役割を分析するためのMES-sLCRを示す図である。
【
図20-1】表現型CRISPR/Cas9フォワード遺伝子スクリーニングにおけるsLCRの使用を支持する更なる証拠を示す図である。
【
図20-2】表現型CRISPR/Cas9フォワード遺伝子スクリーニングにおけるsLCRの使用を支持する更なる証拠を示す図である。
【
図20-3】表現型CRISPR/Cas9フォワード遺伝子スクリーニングにおけるsLCRの使用を支持する更なる証拠を示す図である。
【
図20-4】表現型CRISPR/Cas9フォワード遺伝子スクリーニングにおけるsLCRの使用を支持する更なる証拠を示す図である。
【
図21-1】hGICにおいてMGT#1発現を誘導するhMG細胞、並びに治療法及びhMG細胞に対する感受性差を支持する更なる証拠を示す図である。
【
図21-2】hGICにおいてMGT#1発現を誘導するhMG細胞、並びに治療法及びhMG細胞に対する感受性差を支持する更なる証拠を示す図である。
【
図21-3】hGICにおいてMGT#1発現を誘導するhMG細胞、並びに治療法及びhMG細胞に対する感受性差を支持する更なる証拠を示す図である。
【
図21-4】hGICにおいてMGT#1発現を誘導するhMG細胞、並びに治療法及びhMG細胞に対する感受性差を支持する更なる証拠を示す図である。
【
図22】表現型CRISPRiスクリーニングにおけるsLCRの使用を支持する更なる証拠を示す図である。
【発明を実施するための形態】
【0127】
本発明は、細胞型特異的発現カセットを生成する方法、かかる発現カセットを用いた細胞型特異的ベクター及びかかるベクターの適用に関する。本発明を実施例に関して説明する前に、本明細書で使用される専門用語は、特定の実施形態を説明することのみを目的とし、本発明の範囲を限定することを意図するものではないことを理解されたい。
【0128】
特許文献及び非特許文献の全ての引用文献は、それらの全体が引用することにより本明細書の一部をなす。全ての用語は、本明細書で他の記載がない限り、それらの通常の専門的な意味が与えられるものとする。
【0129】
本明細書で使用される場合、「発現カセット」という用語は、遺伝子産物の発現に十分な核酸要素を含む核酸構築物を指す。発現カセットは、本明細書に記載されるような発現カセットの電子的な表現も包含する。通例、発現カセットは、遺伝子産物の発現の調節要素として働く転写結合部位を含む、選択されたゲノム小領域に操作可能に連結したレポーター遺伝子又は機能的エフェクターを遺伝子産物としてコードする核酸(配列)を含む。
【0130】
本明細書で使用される場合、「合成シス調節DNA」、「合成調節領域」又は「合成遺伝子座制御領域(sLCR)」という用語は、天然に存在しない順序で(すなわち、天然に存在するゲノムにおいてその順序又は配置で生じない)、隣接して(スペーサーを有して又は有さずに)配置された、検証された及び/又は潜在的な(推定上の/予測された)シス調節配列を含む複数のゲノム小領域の配置を指す。シス調節配列の例は、転写因子結合部位(TFBS)、プロモーター、エンハンサー、サイレンサー、又はコード領域の発現にシス作用することが可能な他の調節配列である。これらの調節領域は、合成調節領域中に配置されている場合、通例は細胞型に特徴的である。本明細書に記載の方法では、好ましくは、これらの調節領域を対象の細胞型における転写調節配列情報の関連部分を含むゲノム小領域のセットに組み立てる。
【0131】
本明細書で使用される場合、「レポーターベクター」という用語は、発現カセットと、in vitro又はin vivoのいずれかで発現カセットを細胞に導入することを可能にする更なる核酸要素とを含む核酸構築物を指す。「レポーターベクター」、「ベクター」及び「エフェクターベクター」という用語は、区別なく使用される場合がある。「ベクター」は、その部位でベクターの必須の生物学的機能を失うことなく決定可能な方式で配列を切断することができ、その複製及びクローニングを引き起こすために核酸フラグメントをスプライス又は挿入することができる、1つ以上の制限エンドヌクレアーゼ認識部位を(I型、II型又はIIs型のいずれかに関わらず)有し得る。ベクターは、2つの核酸分子間での核酸配列の交換を可能にする1つ以上の組換え部位を含んでいてもよい。ベクターは、例えばPCRのためのプライマー部位、転写及び/又は翻訳の開始及び/又は調節部位、組換えシグナル、レプリコン、選択可能なマーカー等を更に与えることができる。ベクターは、ベクターで形質転換された細胞の特定に使用するのに好適な1つ以上の選択可能なマーカーを更に含有し得る。当該技術分野で既知のベクター及び市販のベクター(及びその変異体又は誘導体)を本明細書に記載の発現カセットとともに使用することができる。かかるベクターは、例えばVector Laboratories Inc.、Invitrogen、Promega、Novagen、NEB、Clontech、Boehringer Mannheim、Pharmacia、EpiCenter、OriGenesTechnologies Inc.、Stratagene、PerkinElmer、Pharmingen及びResearch Geneticsから入手することができるか、又はAddgeneにより科学者に無料配布され得る。
【0132】
本明細書で使用される場合、「ウイルスベクター」という用語は、ウイルス起源の少なくとも1つの要素を含み、ウイルスベクター粒子にパッケージングされる能力を有し、少なくとも外来核酸をコードする核酸ベクター構築物を指す。ベクター及び/又は粒子は、in vitro又はin vivoのいずれかで任意の核酸を細胞に移入する目的で利用することができる。多数の形態のウイルスベクターが当該技術分野で既知である。ビリオンという用語は、単一の感染性ウイルス粒子を指すために使用される。「ウイルスベクター」、「ウイルスベクター粒子」及び「ウイルス粒子」は、そのDNA又はRNAコアと、細胞外に存在する場合にタンパク質コートとを有する完全ウイルス粒子も指す。
【0133】
「トランスフェクション」という用語は、好ましくは真核(例えば哺乳動物)細胞へのDNAの送達を指す。「形質転換」という用語は、好ましくは原核(例えば大腸菌(E.coli))細胞へのDNAの送達を指す。「形質導入」という用語は、好ましくは細胞にウイルス粒子を感染させることを指す。核酸分子は、当該技術分野で一般に知られているゲノムに安定して組み込まれ得る。しかしながら、「形質導入」、「トランスフェクション」及び「形質転換」という用語は、本明細書で区別なく使用される場合もあり、発現カセットを含むベクターを細胞に導入するプロセスを指す。
【0134】
本明細書で使用される場合、「細胞型特異的」という用語は、本明細書に記載される発現カセットを対象の細胞に導入した場合の、他の細胞(例えば参照細胞)と比較したレポーター遺伝子又はエフェクター遺伝子の発現の特異性に関する。細胞型特異的という用語は、対象の細胞の細胞型及びその細胞状態又は運命に特異的な発現(レベル)を包含する。したがって、細胞型特異的発現カセット又はベクターという用語は、細胞状態特異的及び細胞運命特異的な発現カセット又はベクターも包含する。
【0135】
「レポーター」、「エフェクター」又は「レポーター遺伝子又はエフェクター遺伝子」という用語は、本明細書で使用される場合、当該技術分野で既知のアッセイ又は方法によって検出することができ、それにより構築物の発現を「報告し」、及び/又はそれらを発現する細胞の状態又は運命を「生じさせる」、本明細書で提供される発現構築物中に含まれる核酸によってコードされる遺伝子産物を指す。レポーター及びエフェクター、並びにレポーターをコードする核酸配列は、当該技術分野で既知である。レポーター又はエフェクターとしては、例えば緑色蛍光タンパク質(GFP)、青色蛍光タンパク質(BFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、増強蛍光タンパク質誘導体(例えばeGFP、eYFP、mVenus、eRFP、mCherry等)等の蛍光タンパク質、酵素(例えば、検出可能な生成物を生じる反応を触媒する酵素、例えばルシフェラーゼ、β-グルクロニダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、アミノグリコシドホスホトランスフェラーゼ、アミノシクリトールホスホトランスフェラーゼ、又はピューロマイシンN-アセチルトランスフェラーゼ)、及び表面抗原が挙げられる。適切なレポーター又はエフェクターは、関連技術分野の当業者に明らかである。好ましいタンパク質は、蛍光タンパク質、チミジンキナーゼ、ルシフェラーゼ、β-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼを含むが、これらに限定されない自殺遺伝子、表面受容体、6×Hisタグ、V5タグ、GFPタグを含むが、これらに限定されないタンパク質タグ、自己プロセシングリボザイムカセット、メバロン酸キナーゼ及びその誘導体、BirAを含むが、これに限定されないビオチンリガーゼ及びその誘導体、APEX2を含むが、これに限定されない改変ペルオキシダーゼ及びその誘導体、制限酵素、Cre、Flp、Tn5、SpCas9、SaCas9、TALENを含むが、これらに限定されないエンドヌクレアーゼ若しくは部位特異的リコンビナーゼ及びそれらの誘導体、単一遺伝子疾患を矯正する遺伝子、腫瘍関連抗原、又はMAGEA3m GM-CSF、IFNγ、IFNβ、CXCL-9-10-11を含むが、これらに限定されない、免疫療法を容易にする免疫変調成分をコードする遺伝子を含む群から選択される。
【0136】
「遺伝子」という用語は本質的に、適切な調節配列に操作可能に連結している場合に、in vitro又はin vivoでポリペプチドに転写(DNA)及び翻訳(mRNA)されるコード核酸配列を意味する。遺伝子は、コード領域に先行及び後行する領域、例えば5'非翻訳(5'UTR)又は「リーダー」配列及び3'UTR又は「トレーラー」配列、並びに個々のコードセグメント(エクソン)間の介在配列(イントロン)を含んでいても、又は含んでいなくてもよい。
【0137】
「遺伝子発現」は、本明細書で使用される場合、遺伝子の発現の絶対若しくは相対レベル及び/又は発現のパターンを指す。遺伝子の発現は、DNA、cDNA、RNA、mRNA、タンパク質又はそれらの組合せのレベルで測定することができる。遺伝子発現は、タンパク質発現から推測することもできる。
【0138】
「遺伝子発現プロファイル」は、対象の細胞型について測定される複数の異なる遺伝子の発現のレベルを指す。遺伝子発現プロファイルは、様々な細胞型、種々の組織、種々の器官又は体液(例えば血液、尿、髄液、汗、唾液又は血清)を含むサンプル等のサンプルにおいて、超並列シグネチャーシークエンシング(Massively Parallel Signature Sequencing;MPSS)によるRNA-SEQ、遺伝子発現の連続分析(Serial Analysis of GeneExpression;SAGE)技術、マイクロアレイ技術、マイクロ流体技術、in situハイブリダイゼーション法、定量的及び半定量的なRT-PCR法、又は質量分析を含むが、これらに限定されない様々な方法によって測定することができる。
【0139】
遺伝子の発現を検出する当該技術分野で利用可能な任意の方法が本明細書に包含される。「発現を検出する」とは、RNA転写物又はその発現産物の量又は存在を、例えばタンパク質レベルで決定することを意図する。
【0140】
本明細書で使用される場合、「発現レベル」という用語は、遺伝子に適用される場合、遺伝子のRNA発現レベル又は遺伝子のポリペプチド発現レベルで決定される遺伝子産物の正規化レベル、例えば正規化値を指す。
【0141】
「遺伝子産物」又は「発現産物」という用語は、mRNAを含む遺伝子のRNA転写産物(転写物)及びかかるRNA転写物のポリペプチド翻訳産物を指すために本明細書で使用される。遺伝子産物は、例えばスプライシングされていないRNA、mRNA、スプライス変異体mRNA、マイクロRNA、フラグメント化RNA、ポリペプチド、翻訳後修飾ポリペプチド、スプライス変異体ポリペプチド等であり得る。「RNA転写物」という用語は、本明細書で使用される場合、例えばmRNA、スプライシングされていないRNA、スプライス変異体mRNA、マイクロRNA及びフラグメント化RNAを含む遺伝子のRNA転写産物を指す。
【0142】
本発明の遺伝子の発現を検出する方法、すなわち遺伝子発現プロファイリングには、ポリヌクレオチドのハイブリダイゼーション分析に基づく方法、ポリヌクレオチドのシークエンシングに基づく方法、免疫組織化学法及びプロテオミクスベースの方法が含まれる。これらの方法では、概して遺伝子の発現産物(例えばmRNA)が検出される。
【0143】
多くの発現検出方法で単離RNAが使用される。出発物質は通例、対象の細胞型及び参照細胞型等の生体サンプルからそれぞれ単離された全RNAである。
【0144】
RNA抽出の一般的な方法は、当該技術分野で既知であり、Ausubel et al.,ed., Current Protocols in Molecular Biology, John Wiley & Sons, New York1987-1999を含む分子生物学の標準的な教科書に開示されている。パラフィン包埋組織からのRNA抽出の方法は、例えばRupp and Locker (Lab Invest. 56:A67, 1987)及びDeAndres et al. (Biotechniques 18:42-44, 1995)に開示されている。特に、RNA単離は、Qiagen(Valencia,Calif.)等の商業的製造業者からの精製キット、バッファーセット及びプロテアーゼを製造業者の使用説明書に従って用いて行うことができる。
【0145】
単離RNAを、PCR分析及びプローブアレイを含むが、これらに限定されないハイブリダイゼーション又は増幅アッセイに使用することができる。RNAレベルを検出する一方法は、単離RNAと、検出される遺伝子によってコードされるmRNAにハイブリダイズすることができる核酸分子(プローブ)とを接触させることを含む。核酸プローブは、例えば完全長cDNA又はその一部分、例えば少なくとも7、15、30、60、100、250又は500のヌクレオチド長であり、厳しい条件下で本発明の固有の遺伝子、又は任意の誘導体DNA若しくはRNAに特異的にハイブリダイズするのに十分なオリゴヌクレオチドであり得る。mRNAとプローブとのハイブリダイゼーションにより、問題となる固有の遺伝子が発現されていることが示される。
【0146】
代替的に(An alternative)、対象の細胞型の遺伝子発現のレベルは、例えばRT-PCR(米国特許第4,683,202号)、リガーゼ連鎖反応(Barany, Proc. Natl.Acad. Sci. USA 88:189-93, 1991)、自家持続配列複製法(Guatelli etal., Proc. Natl. Acad. Sci. USA 87:1874-78, 1990)、転写増幅系(Kwoh et al., Proc. Natl. Acad. Sci. USA 86:1173-77, 1989)、Q-βレプリカーゼ(Lizardi et al., Bio/Technology6:1197, 1988)、ローリングサークル複製(米国特許第5,854,033号)、又は任意の他の核酸増幅法による核酸増幅のプロセスに続く当業者に既知の手法を用いた増幅分子の検出を伴う。これらの検出スキームは、核酸分子が非常に少数しか存在しない場合の核酸分子の検出に特に有用である。
【0147】
特に、遺伝子発現は、定量的RT-PCRによって評価することができる。多数の異なるPCR又はQPCRプロトコルが当該技術分野で既知である。概して、PCRでは、標的ポリヌクレオチド配列は、少なくとも1つのオリゴヌクレオチドプライマー又はオリゴヌクレオチドプライマー対との反応によって増幅される。プライマー(複数の場合もある)が標的核酸の相補的領域にハイブリダイズし、DNAポリメラーゼがプライマー(複数の場合もある)を伸長させることで、標的配列が増幅される。ポリメラーゼベースの核酸増幅の産物をもたらすのに十分な条件下では、或るサイズの核酸フラグメントが反応生成物(増幅産物である標的ポリヌクレオチド配列)の大半を占める。増幅サイクルを繰り返し、単一の標的ポリヌクレオチド配列の濃度を上昇させる。反応は、PCRに一般に使用される任意のサーモサイクラーにおいて行うことができる。しかしながら、リアルタイム蛍光測定能を有するサイクラーが好ましい。
【0148】
定量的PCR(QPCR)(リアルタイムPCRとも称される)は、定量的測定だけでなく、時間及び汚染の減少ももたらすため、或る状況下で好ましい。本明細書で使用される場合、「定量的PCR」(又は「リアルタイムQPCR」)は、反応生成物のサンプリングを繰り返す必要なしに行われるPCR増幅の進行の直接的なモニタリングを指す。定量的PCRでは、反応生成物は、シグナルがバックグラウンドレベルよりも高くなった後であるが、反応が停滞状態になる前に反応生成物が生成し、追跡されるシグナル伝達機構(例えば蛍光)によってモニタリングすることができる。検出可能な又は「閾値」蛍光レベルを達成するのに必要とされるサイクル数は、リアルタイムでのサンプル中の標的核酸の量の測定をもたらすシグナル強度の測定を可能にする、PCRプロセスの開始時の増幅可能な標的の濃度に正比例して変化する。
【0149】
さらに、マイクロアレイを遺伝子発現プロファイリングに用いることができる。「マイクロアレイ」とは、基板上のハイブリダイズ可能なアレイ要素、例えばポリヌクレオチドプローブの秩序配置を意図する。「プローブ」という用語は、特に対象とする標的生体分子、例えば固有の遺伝子によってコードされる又はそれに対応するヌクレオチド転写物又はタンパク質に選択的に結合することが可能な任意の分子を指す。当業者は、プローブを合成するか又は適切な生物学的調製物から得ることができる。プローブは、標識されるように特別に設計することができる。プローブとして利用することができる分子の例としては、RNA、DNA、タンパク質、抗体及び有機分子が挙げられるが、これらに限定されない。
【0150】
DNAマイクロアレイは、多数の遺伝子の発現レベルを同時測定する一方法を与える。各アレイは、固体支持体に付着した捕捉プローブの再現可能なパターンからなる。標識されたRNA又はDNAをアレイ上の相補的プローブにハイブリダイズさせた後、レーザースキャニングによって検出する。アレイ上の各プローブのハイブリダイゼーション強度を決定し、相対遺伝子発現レベルを表す定量値に変換する。例えば米国特許第6,040,138号、同第5,800,992号及び同第6,020,135号、同第6,033,860号及び同第6,344,316号を参照されたい。高密度オリゴヌクレオチドアレイがサンプル中の多数のRNAの遺伝子発現プロファイルを決定するのに特に有用である。
【0151】
遺伝子発現の連続分析(SAGE)は、各転写物の個々のハイブリダイゼーションプローブを準備する必要なしに多数の遺伝子転写物の同時の定量分析を可能にする方法である。初めに、タグが各転写物内の特有の位置から得られる限りにおいて、転写物を一意的に特定するのに十分な情報を有する短い配列タグ(約10 bp~14 bp)を生成する。次いで、多くの転写物を互いに連結することで、シークエンシングして複数のタグの同一性を同時に明らかにすることができる長い連続した分子を形成する。転写物の任意の集団の発現パターンは、個々のタグの存在量を決定し、各タグに対応する遺伝子を特定することによって定量的に評価することができる。詳細については、例えばVelculescu et al., Science 270:484-487 (1995)及びVelculescu et al., Cell 88:243-51 (1997)を参照されたい。
【0152】
核酸シークエンシング技術は、遺伝子発現の分析に好適な方法である。これらの方法の根底にある原理は、サンプル中のcDNA配列を検出する回数が、その配列に対応するmRNAの相対発現と直接関連しているということである。
【0153】
これらの方法は、得られるデータの個別の数値的特性を反映するデジタル遺伝子発現(DGE)という用語で言及されることもある。この原理を適用した初期の方法は、遺伝子発現の連続分析(SAGE)及び超並列シグネチャーシークエンシング(MPSS)であった。例えば、S. Brenner, et al., Nature Biotechnology 18(6):630-634 (2000)を参照されたい。
【0154】
「次世代」シークエンシング技術の出現により、DGEはより単純、より高スループット、またより低コストとなった。結果として、より多くの研究室でDGEを利用して、以前に可能であったよりも多くの対象の細胞型において多くの遺伝子の発現をスクリーニングすることができる。例えば、J. Marioni, Genome Research 18(9): 1509-1517 (2008)、R. Morin, Genome Research 18(4):610 621 (2008)、A. Mortazavi, Nature Methods 5(7):621-628 (2008)、N. Cloonan, Nature Methods 5(7):613-619 (2008)を参照されたい。
【0155】
次世代シークエンシングは通例、従来のサンガーアプローチよりもはるかに高いスループットを可能にする。Schuster, Next-generation sequencing transforms today's biology,Nature Methods 5:16-18 (2008)、Metzker, Sequencingtechnologies the next generation. Nat Rev Genet. 2010 January; 11(1):31-46を参照されたい。これらのプラットホームは、クローン的に広がった又は増幅しなかった核酸フラグメントの単一分子のシークエンシングを可能にし得る。或る特定のプラットホームは、例えば色素修飾(dyemodified)プローブのライゲーション(周期的なライゲーション及び切断を含む)によるシークエンシング、パイロシークエンシング及び単一分子シークエンシングを含む。ヌクレオチド配列種、増幅核酸種及びそれらから生成した検出可能な生成物は、かかる配列分析プラットホームによって分析することができる。例えば対象の細胞型の遺伝子発現プロファイル又はゲノム配列データを決定するために、次世代シークエンシングを本発明の方法に用いることができる。
【0156】
RNAシークエンシング(RNA-Seq)では、例えばサンガーシークエンシング及びマイクロアレイベースの方法を用いて利用可能であるよりも通例はるかに高い分解能でゲノムのトランスクリプトーム分析を可能にする超並列シークエンシングを用いる。RNA-Seq法では、対象のRNAから生成した相補的DNA(cDNA)を、次世代シークエンシング技術を用いて直接シークエンシングする。RNA-Seqは、転写物レベルを正確に定量化し、以前に注釈付けされた遺伝子の5'末端及び3'末端を確認又は訂正し、エクソン/イントロン境界をマッピングするために首尾よく用いられている(Eminaga et al., 2013. Quantification of microRNA Expression withNext-Generation Sequencing. Current Protocols in Molecular Biology. 103:4.1 7.1-4.1 7.14)。
【0157】
このため、本明細書で使用される場合、「シークエンシング」は、核酸の少なくとも一部の連続ヌクレオチドの特定を可能にする当該技術分野で既知の任意の手法を指す。例示的なシークエンシング法としては、Illumina(商標)シークエンシング、直接シークエンシング、ランダムショットガンシークエンシング、サンガージデオキシ終結シークエンシング、全ゲノムシークエンシング、超並列シグネチャーシークエンシング(MPSS)、RNA-seq(全トランスクリプトームシークエンシングとしても知られる)、ハイブリダイゼーションによるシークエンシング、パイロシークエンシング、キャピラリー電気泳動、ゲル電気泳動、二重鎖シークエンシング、サイクルシークエンシング、一塩基伸長シークエンシング、固相シークエンシング、ハイスループットシークエンシング、超並列シグネチャーシークエンシング、エマルションPCR、リバーシブルダイターミネーターによるシークエンシング、ペアエンドシークエンシング、短期的(near-term)シークエンシング、エキソヌクレアーゼシークエンシング、ライゲーションによるシークエンシング、ショートリード(short-read)シークエンシング、単一分子シークエンシング、合成によるシークエンシング、リアルタイムシークエンシング、リバースターミネーター(reverse-terminator)シークエンシング、ナノポアシークエンシング、454シークエンシング、Solexa Genome Analyzerシークエンシング、SOLiD(商標)シークエンシング、Illumina Hiseq4000、Illumina NextSeq500、Illumina MiSeq及びMiniseq、MS-PETシークエンシング、質量分析及びそれらの組合せが挙げられる。
【0158】
遺伝子発現プロファイルは、プロテオームに関する情報から推測することもできる。「プロテオーム」という用語は、或る特定の時点で細胞型に存在するタンパク質全体として本明細書で定義される。プロテオミクスには、特にサンプルにおけるタンパク質発現の全体的変化の研究(「発現プロテオミクス」とも称される)が含まれる。プロテオミクスは通例、以下の工程を含む:(1)2-Dゲル電気泳動(2-D PAGE)によるサンプル中の個々のタンパク質の分離、(2)ゲルから回収される個々のタンパク質の特定、例えばmy質量分析(my mass spectrometry)又はN末端シークエンシング、及び(3)バイオインフォマティクスを用いたデータの分析。
【0159】
「ゲノム」という用語は、本明細書で使用される場合、概してテキスト又はコンピューターによる表現を含む1つ以上の核酸配列の形態の完全な遺伝情報集合を指す。ゲノムは、その起源の生物に応じてDNA又はRNAのいずれかを含み得る。殆どの生物はDNAゲノムを有するが、一部のウイルスはRNAゲノムを有する。本明細書で使用される場合、「ゲノム」という用語は、完全な遺伝情報集合を含む必要はない。この用語は、少なくともゲノムの大部分、例えば全ゲノムの少なくとも50%~100%、又はその間の任意の整数若しくは分数のパーセンテージを指す場合もある。
【0160】
「ゲノム配列データ」という用語は、テキスト又はコンピューターによる表現を含む、ゲノムに関するデータを指し、この場合もゲノム配列データは、ゲノム、好ましくはゲノムの大部分、例えば全ゲノムの少なくとも50%~100%、又はその間の任意の整数若しくは分数のパーセンテージに関連し得る。
【0161】
ゲノム配列データの提供は、対象の細胞型のゲノムの実際のシークエンシング、又はNational Center for Genome Resources(NCGR)が運営する注釈付きゲノム配列データベース(GSDB)等のゲノム配列データに関する公開されているデータベースへの依存を含み得る。多数の種についてのゲノム配列データの提供は、UC Santa Cruz(CA,USA)のUCSC Genome Browser Groupによって作成されたUCSCGenome Browserにより公開されている。
【0162】
「ゲノム領域」という用語は、本明細書で使用される場合、概してゲノムの領域を指す。通例、ゲノム領域は、少なくとも1つの遺伝子を含む対象の細胞型のゲノムの連続した核酸配列ストレッチを指す。
【0163】
「ゲノム小領域」という用語は、本明細書に記載されるように遺伝子発現プロファイル(複数の場合もある)に基づいてシグネチャー遺伝子として特定された転写因子の1つ以上についての1つ以上の結合部位を含むことが特定されたゲノム領域の一部分を指す。
【0164】
「核酸」という用語は、限定されるものではないが、DNA、RNA、並びに一本鎖形態又は二本鎖形態のいずれかのそのハイブリッド又は修飾変異体及びポリマー(「ポリヌクレオチド」)を含む任意の核酸分子を指す。特に限定されない限り、この用語は、参照核酸と同様の結合特性を有し、天然に存在するヌクレオチドと同様の方法で代謝される天然のヌクレオチドの既知の類似体を含有する核酸を包含する。他に指定のない限り、特定の核酸分子/ポリヌクレオチドは、その保存的に修飾された変異体(例えば縮重コドン置換)及び相補配列、並びに明示的に示される配列も暗示的に包含する。特に、縮重コドン置換は、1つ以上の選択される(又は全ての)コドンの3番目の位置が混合塩基及び/又はデオキシイノシン残基で置換された配列を生成することによって達成することができる(Batzer et al., Nucleic Acid Res. 19: 5081 (1991)、Ohtsuka et al., J. Biol. Chem. 260: 2605-2608 (1985)、Rossolini et al., Mol. Cell. Probes 8: 91-98 (1994))。ヌクレオチドは、以下の標準的な略語により、それらの塩基で示される:アデニン(A)、シトシン(C)、チミン(T)及びグアニン(G)。
【0165】
「外来核酸」又は「外来遺伝要素」は、細胞の「元の」又は「天然の」ゲノムの構成要素ではない細胞に導入された任意の核酸に関する。外来核酸は、組み込まれていても若しくは組み込まれていなくてもよく、又は安定してトランスフェクトされた核酸に関する。
【0166】
「機能的変異体」又は「機能的類似体」は、好ましくは参照配列と「同一の」、「本質的に同一の」、「実質的に同一の」、「相同の」又は「同様の」ヌクレオチド配列又はアミノ酸配列をそれぞれ有する核酸又はタンパク質を指し、非限定的な例としては、単離核酸若しくはタンパク質の配列、又は2つ以上の関連の核酸若しくはタンパク質の比較によって得られるコンセンサス配列、又は所与の核酸若しくはタンパク質のアイソフォームの群であり得る。アイソフォームのタイプの非限定的な例としては、例えば選択的RNAスプライシング又はタンパク質分解的切断の結果として生じる異なる分子量のアイソフォーム、及びグリコシル化等の異なる翻訳後修飾を有するアイソフォーム等が挙げられる。
【0167】
本明細書で使用される場合、「変異体」又は「類似体」という用語は、参照核酸又はポリペプチドとは異なるが、その必須の特性を保持する核酸又はポリペプチドを指す。概して、変異体は、全体的に極めて類似し、多くの領域で参照核酸又はポリペプチドと同一である。このため、転写因子の「変異体」形態は、全体的に極めて類似し、DNAに結合して遺伝子転写を活性化することが可能である。
【0168】
本明細書で使用される場合、「センス鎖」という用語は、タンパク質へと翻訳される又は翻訳可能な遺伝子のDNA鎖を指す。遺伝子が核酸配列中でプロモーターに対して「センス方向」に配向する場合、「センス鎖」は、プロモーターの下流の5'末端に位置し、タンパク質の最初のコドンがプロモーターの近位にあり、最後のコドンがプロモーターの遠位にある。その逆は、「アンチセンス」鎖と称される。
【0169】
本明細書で使用される場合、「操作可能に連結した」という用語は、核酸構築物中の調節要素が調節要素と遺伝子との間の機能的カップリングを可能にし、遺伝子の発現をもたらすように構成され、すなわち調節要素が好ましくはタンパク質又はペプチドをコードする核酸とインフレームであることを指す。
【0170】
本明細書で使用される場合、「含む」("comprising" or "comprises")という用語は、特記していない要素が含まれていてもよい発現カセット、レポーターベクター及びそれらのそれぞれの構成要素(複数の場合もある)に関して使用される。
【0171】
「からなる(consisting of)」という用語は、その実施形態の説明に列挙されない任意の要素を含まない、本明細書に記載される発現カセット、レポーターベクター及びそれらのそれぞれの構成要素(複数の場合もある)を指す。
【0172】
「シグネチャー遺伝子」という用語は、対象の細胞型の遺伝子から選択される遺伝子であり、該対象の細胞型の発現プロファイルに特徴的な遺伝子に関する。差次的に調節されるシグネチャー遺伝子は、例えば参照細胞型における発現レベルと比較して上方調節若しくは下方調節される遺伝子を特定するか、又は対象の細胞型についての遺伝子発現レベルをランク付けし、閾値レベル若しくは所定数の遺伝子(例えば、最も高度に又は最も低く発現された)に基づいてシグネチャー遺伝子を選択することによって選択することができる。
【0173】
本明細書で使用される場合、「転写因子」という用語は、特定のDNA配列に結合し、それによりDNAからmRNAへの遺伝情報の移入(又は転写)を制御するタンパク質を指す。転写因子の機能は、主に遺伝子の発現を調節することである。転写因子は、特定の遺伝子へのRNAポリメラーゼの動員を促進するか(活性化因子として)、又は阻止する(抑制因子として)ことによって、単独で又は更なるタンパク質と組み合わせて複合体で機能し得る。転写因子は、通常はそれらが調節する遺伝子に隣接した特定のDNA配列(「結合部位」)に付着するDNA結合ドメインを少なくとも含有する。
【0174】
「顕微鏡装置」という用語は、細胞の顕微鏡的分析のための手段を備える装置に関する。顕微鏡的分析は、限定されるものではないが、光学顕微鏡、双眼実体顕微鏡、明視野顕微鏡、偏光顕微鏡、位相差顕微鏡、微分干渉顕微鏡、自動顕微鏡、蛍光顕微鏡、共焦点顕微鏡、全反射照明蛍光顕微鏡、レーザー顕微鏡(レーザースキャニング共焦点顕微鏡)、多光子励起顕微鏡、構造化照明顕微鏡、透過型電子顕微鏡(TEM)、走査型電子顕微鏡(SEM)、原子間力顕微鏡(AFM)、走査型近接場光学顕微鏡(SNOM)、X線顕微鏡、超音波顕微鏡によって行うことができる。顕微鏡装置は、例えば細胞の画像を記録するカメラ及び/又は検出器と、顕微鏡装置を制御するコンピューターシステムとを付加的に備えていてもよい。
【0175】
レポーター遺伝子によって生じるシグナルの存在及び/又は強度は、顕微鏡装置だけでなく、限定されるものではないが、フローサイトメーター、照度計、分光計、光度計又は比色計等のレポーター遺伝子が生成するシグナルを検出することができる他の装置を用いて決定することができる。
【0176】
本明細書で使用される場合、「トポロジカル関連ドメイン」という用語は、好ましくは自己相互作用ゲノム領域を指し、トポロジカル関連ドメイン内のDNA配列が、トポロジカル関連ドメインの外側の配列よりも頻繁に互いに物理的に相互作用し、それにより三次元染色体構造を形成することを意味する。トポロジカル関連ドメインは、数千個から数百万個のDNA塩基と様々なサイズであり得る。タンパク質CTCF及びタンパク質複合体コヒーシンを含む多数のタンパク質がトポロジカル関連ドメインの形成と関連することが知られている。好ましい実施形態では、トポロジカル関連ドメインは、2つのCTFC又はコヒーシン結合部位間のゲノム配列を指す。
【0177】
本明細書で使用される場合、「細胞型特異的発現カセットを生成する」という用語は、幾つかの実施形態では、対応する核酸分子を物理的に作製することのない細胞型特異的発現カセットの設計に関し、例えば方法がコンピューターによって実行される方法であっても、又は方法の1つ以上のコンピューターによって実行される工程を含んでいてもよい。
【0178】
本明細書で使用される場合、「細胞型特異的発現カセットを生成する」という用語は、幾つかの実施形態では、好ましくは核酸分子のde novo合成による核酸分子の設計及び物理的作製に関する。
【0179】
人工遺伝子合成(又はde novo合成)は、本発明のカセットを生成する好ましい方法であり、任意の所与の核酸配列を作り出すために合成生物学において用いられる方法に関する。固相DNA合成に基づく幾つかの場合では、人工合成は、ユーザーが既存のDNA配列から始める必要がないという点で分子クローニング及びポリメラーゼ連鎖反応(PCR)とは異なる。したがって、ヌクレオチド配列又はサイズのいずれも大きく制限されない完全合成二本鎖DNA分子を作製することが可能である。遺伝子合成アプローチは、有機化学と分子生物学的手法との組合せに基づいていてもよく、前駆体鋳型DNAを必要とせずに全遺伝子を「de novo」合成することができる。この方法は、およそ100万個の塩基対を含有する機能的細菌染色体を生成するために用いられている。遺伝子合成は、異種遺伝子発現、ワクチン開発、遺伝子療法、ベクター構築及び様々な形態の分子工学を含む組み換えDNA技術の多くの分野で重要なツールとなっている。核酸配列の合成は、古典的なクローニング及び突然変異誘発手順よりも経済的であることが多い。多様な手法が十分に確立されており、当業者に既知である。
【0180】
「遺伝子療法」という用語は、好ましくは疾患を治療するための被験体へのDNAの移入を指す。遺伝子療法ベクターを用いて遺伝子療法を行う戦略が当業者には知られている。かかる遺伝子療法ベクターは、外来DNAを被験体の宿主細胞に送達するように最適化されている。好ましい実施形態では、遺伝子療法ベクターは、ウイルスベクターであり得る。ウイルスは、DNAを宿主細胞のゲノムに組み込むための自然に開発された戦略を有し、したがって有利に用いることができる。好ましいウイルス遺伝子療法ベクターとしては、モロニーマウス白血病ウイルス(MMLV)等のレトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、アデノウイルス随伴ウイルス(AAV)ベクター、ポックスウイルスベクター、単純ヘルペスウイルスベクター又はヒト免疫不全ウイルスベクター(HIV-1)を挙げることができるが、これらに限定されない。しかしながら、好ましくは、真核生物プロモーターによって駆動されるプラスミドDNA発現ベクター又は宿主ゲノムと相同性を有するプラスミドDNA配列等の非ウイルスベクターを、発現カセットを対象のゲノムの好ましい位置に直接組み入れるために遺伝子療法に用いることもできる。DNA移入は、リポソーム又は同様の細胞外小胞を用いて行うこともできる。さらに、好ましい遺伝子療法ベクターは、エレクトロポレーション又は被験体への核酸の直接注射等のDNAの移入方法を指す場合もある。用途の必要性に応じて好ましい遺伝子療法ベクターを選ぶ方法及び本明細書に記載の発現カセット等の核酸構築物を遺伝子療法ベクターに組み入れる方法が当業者には知られている(P. Seth et al., 2005、N. Koostra et, al.2009.、W. Walther et al. 2000、Waehleret al. 2007)。
【0181】
本発明の方法、システム又は他のコンピューターによって実行される態様は、幾つかの実施形態では、プロセッサ、キーボード又はマウス等の入力装置、ハードドライブ及び揮発性又は不揮発性メモリ等のメモリ、並びに本発明の機能のためのコンピューターコード(ソフトウェア)を有する1つ以上の従来のコンピューターデバイスを含む及び/又は用いる場合がある。
【0182】
システムは、必要とされるコンピューターコード若しくはソフトウェアが予め組み込まれた1つ以上の従来のコンピューターデバイスを備えていても、又は特注設計のソフトウェア及び/又はハードウェアを備えていてもよい。システムは、本発明の工程を行う複数のコンピューターデバイスを備えていてもよい。或る特定の実施形態では、例えば複数のユーザーが方法の種々の工程でデータを提供するか又は計算を行うことができるように、デスクトップ、ラップトップ又はタブレットコンピューター等の複数のクライアントがサーバーに接続され得る。コンピューターシステムは、ローカルエリアネットワーク(LAN)接続で又はインターネット接続によって他のコンピューター、又はゲノムデータベース等の必要なデータベースとネットワーク化されていてもよい。システムはまた、本発明によって得られるデータのコピーを保持するバックアップシステムを備えていてもよい。方法の様々な工程間で必要とされるデータ接続は、任意の好適なデータ伝送手段によって、例えばローカルエリアネットワーク(LAN)接続で又はインターネット接続によって有線又は無線のいずれかで行われるか又は構成され得る。
【0183】
クライアント又はユーザーコンピューターは、それ自身のプロセッサ、キーボード、マウス若しくはタッチスクリーン等の入力手段、及びメモリを有していてもよく、又はそれ自身の独立した処理能力を有しないが、それが接続若しくはネットワーク化されたサーバー等の別のコンピューターの計算資源に依存する端末であってもよい。本発明の特定の実装形態に応じて、クライアントシステムは、かかる必要性が生じた場合にシステムを支配するのに必要なコンピューターコードを含み得る。一実施形態では、クライアントシステムは、タブレット又はラップトップである。
【0184】
方法を行うためのコンピューターシステムのコンポーネントは、従来のものであってもよいが、システムは、各々の特定の実装形態のためにカスタム構成されていてもよい。コンピューターによって実行される方法工程又はシステムは、任意の特定のアーキテクチャ、例えばパーソナル/マイクロコンピューター、ミニコンピューター、又はメインフレームシステムで実行することができる。例示的なオペレーティングシステムとしては、Apple Mac OS X及びiOS、MicrosoftWindows及びUNIX(登録商標)/Linux(登録商標);SPARC、POWER及びItaniumベースのシステム;並びにz/Architectureが挙げられる。本発明を行うコンピューターコードは、限定されるものではないが、C/C++、C#、Objective-C、Java、Basic/VisualBasic、MATLAB(登録商標)、R、Simulink、StateFlow、Lab View又はアセンブラ等の任意のプログラミング言語又はモデルベース開発環境で書くことができる。コンピューターコードは、回路基板、コントローラー、又は本発明とともに使用される他のコンピューターハードウェアコンポーネントの製造業者に特有の独自のコンピューター言語で書かれたサブルーチンを含んでいてもよい。
【0185】
方法によって処理される及び/又は生み出される情報、すなわち核酸配列、遺伝子発現プロファイル、遺伝子及び/又はTF結合部位等の特定の配列要素のリストのデジタル表現としての情報には、業界内で使用される任意の種類のファイルフォーマットを用いることができる。例えば、デジタル表現は、独自のフォーマット、DXFフォーマット、XMLフォーマット、又は本発明に使用される他のフォーマットで保存することができる。任意の好適なコンピューター可読媒体を利用することができる。コンピューターに使用可能な又はコンピューター可読の媒体は、例えば電子、磁気、光学、電磁、赤外線又は半導体システム、装置、デバイス又は伝搬媒体であり得るが、これらに限定されない。コンピューター可読媒体のより具体的な例(包括的でないリスト)には、以下のものが含まれる:1つ以上のケーブルを有する電気的接続、ポータブルコンピューターディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、インターネット又はイントラネットを支持する伝送媒体等の伝送媒体、クラウドストレージ又は磁気記憶装置。
【0186】
表1に、細胞型特異的レポーターベクターのためのゲノム小領域(すなわち合成遺伝子座領域)の最小セットの好ましい実施形態のヌクレオチド配列を挙げる。
【0187】
表1:細胞型特異的レポーターのための好ましい合成遺伝子座領域のヌクレオチド配列:
【表1-1】
【表1-2】
【表1-3】
【表1-4】
【0188】
したがって、一実施形態では、本発明は、
a)配列番号1~6によるヌクレオチド配列を含むか又はそれからなる核酸分子、
b)a)によるヌクレオチド配列に相補的な核酸分子、
c)好ましくは少なくとも70%、80%、好ましくは90%、より好ましくは95%のa)又はb)によるヌクレオチド配列との配列同一性を有するa)又はb)によるヌクレオチド配列と機能的に類似した/同等となるのに十分な配列同一性を有するヌクレオチド配列を含む核酸分子、
d)欠失、付加、置換、転座、逆位及び/又は挿入によって修飾され、a)~c)によるヌクレオチド配列と機能的に類似した/同等のa)~c)のヌクレオチド配列による核酸分子、
からなる群から選択される核酸分子を含むベクターを包含する。
【0189】
機能的に類似した配列は、好ましくは対象の細胞型における操作可能に連結したレポーター遺伝子又はエフェクター遺伝子の転写を促進する合成調節領域の能力を指す。
【0190】
一実施形態では、本発明は、
a)配列番号1~6によるヌクレオチド配列を含むか又はそれからなる核酸分子、
b)a)によるヌクレオチド配列に相補的な核酸分子、
c)好ましくは少なくとも70%、80%、好ましくは90%、より好ましくは95%のa)又はb)によるヌクレオチド配列との配列同一性を有するa)又はb)によるヌクレオチド配列と機能的に類似した/同等となるのに十分な配列同一性を有するヌクレオチド配列を含む核酸分子、
d)欠失、付加、置換、転座、逆位及び/又は挿入によって修飾され、a)~c)によるヌクレオチド配列と機能的に類似した/同等のa)~c)のヌクレオチド配列による核酸分子、
e)方法に従って生成された核酸分子、
からなる群から選択される核酸分子を含む腫瘍溶解性ウイルス療法のためのベクターを包含する。
【0191】
機能的に類似した配列は、好ましくは非罹患細胞ではなく、対象の疾患の標的細胞において共刺激分子(例えばサイトカイン/ケモカイン)等のウイルス必須遺伝子及び/又はエフェクター遺伝子の転写を促進する合成調節領域の能力を指す。
【0192】
図面の詳細な説明:
図1:合成遺伝子座制御領域(sLCR)の生成及び検証。a)差次的に調節される遺伝子(DRG)から開始したsLCR生成の概略図。b)ゲノムGBMサブタイプ特異的遺伝子座で有意性をもって検出されたTFBSモチーフのペアワイズ相関ヒートマップ。分析時のTFBS及びDRGの数を各パネルの上に示す。c)報告される神経膠腫始原細胞(GIC)を生成するためのsLCR及び実験工程の概略図。d)左;MGT#1をトランスフェクトした293Tの共焦点像、又は(右)レンチウイルスにより形質導入したMES-hGICニューロスフェアの凍結切片。スケール=10 μM。e)sLCRで修飾し、H2B-CFPについてFACS選別したMES-hGIC及びPN-hGICの代表的なmVenus FACSプロファイル。MES-hGICは、より高レベルのMGT#1を発現する(矢印)。f)指定のGICにおける腫瘍壊死因子α(TNFa)処理に対する応答の代表的な定量化。MES-hGICは、より高レベルのMGT#1を発現する(矢印)。MES=間葉;PN=前神経;CL=古典的。MGT#1-2=MES遺伝子追跡#1-2。tmd=PDRGFRa膜貫通ドメイン。g)二重IF及びsmRNA-FISH。マージした(左)及び別個のチャネル(右)の画像を示す。黄色及び矢印の重複シグナルは、MED1とMGT#1により誘導されるmVenusとの共局在化を示す。h)指定のsLCRで形質導入し、H2B-CFPについてFACS選別したMES-hGIC及びPN-hGICのmVenus FACSプロファイル。ゲーティング及び矢印は、PN-hGICよりも高レベルのMGT#1を発現するMES-hGICを示す。
【0193】
図2:sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答。a)TFNaは、間葉GBM表現型に寄与する主要なシグナル伝達である。左、最長48時間の指定のサイトカインを用いた適応応答スクリーニングによってMES-hGICにおいて独立して設計された2つのMES-GBMレポーター(MGT#1-MGT#2)の活性化因子としての上位の調節因子として特定されたTNFa。データを対照に対して正規化する。MES-hGICは、PN-hGICと比較してより高い基礎レベルのMGT#1を発現する。b)MGT#1誘導におけるIL-6とミクログリア細胞との協調。指定の処理後のMES-hGICにおけるMGT#1発現の生細胞イメージング。c)指定の条件及び抗体の免疫ブロット法。d及びe)差次的MGT#1活性化は、TNFaに対する差次的適応応答についての情報を与える。RNA-seq及び階層的サンプルクラスタリングによって測定されるMES-hGIC又はPN-hGICのいずれかにおけるTNFaによって調節される遺伝子の発現変化。f)指定のGICにおける腫瘍壊死因子α(TNFa)処理に応答した指定の遺伝子のRT-qPCR検証。n=3の生物学的に独立したサンプル、ANOVA検定;
****P<0.0001;g)MGT#1発現によって明らかになったTNFa及び療法により誘導される間葉コミットメントの間の協同性。指定の刺激後の間葉分化転換のFACS定量化。h)指定の条件及び抗体の免疫ブロット法。MES=間葉;PN=前神経;CL=古典的。MGT#1-2=MES遺伝子追跡#1-2。FBS=ウシ胎仔血清、CBD=カンナビジオール。IRR=電離放射線
【0194】
図3:sLCRを用いたGBMサブタイピング及びリプログラミング。a)細胞リプログラミング又は外部シグナル伝達を用いて固有のGBMサブタイプを決定し、サブタイプ同一性を増強するためのGBMサブタイプ特異的sLCRの使用の概略図。b)従来の神経膠腫細胞株における前神経同一性の増強。T98細胞に、レポーターとしてmCherryを誘導する前神経sLCR又は間葉sLCRのいずれかを形質導入し、PNサブタイプ同一性の指定のマスター調節因子をトランスフェクトするか
50、又は空トランスフェクトした。T98細胞においてPNGT#2の高い固有のTF誘導された発現を示すが、MGT#2レポーターを示さないT98細胞の代表的な顕微鏡写真(左)及びFACSプロット(右);スケール=100 μM
【0195】
図4:sLCRによって明らかになった組織非依存性上皮-間葉恒常性。a)MGT#1により、乳癌細胞における固有の細胞運命差が明らかになる。左、上皮(上)及び間葉(下)乳癌細胞に形質導入したMES-GBMレポーターMGT#1の代表的な発現。MDA-231においてMCF7細胞よりも高いレポーターの固有の発現を示すFACSプロット。レポーター発現が間葉誘導因子である10pM TGFβ2とは独立していることに留意されたい。スケール=100 μM。b)MGT#1により、肺癌細胞における化学物質/モルフォゲンに対する適応応答が明らかになる。左、96ウェルに播種し、指定の時間にわたって増殖させたA549細胞における代表的なMGT#1発現。300000細胞/プレートをRPMI培地で増殖させた。10pM TGFβ1+2及び5 μM GSK126を0時間及び48時間の時点で添加した。蛍光を測定し、代表的な顕微鏡写真(右)をIncuCyteイメージングシステムによって撮影した。エラーバーは、独立したウェルの標準偏差を表す(n=3)。c)CRISPRi及びMGT#1により、肺癌EMTの機構的調節因子が明らかになる。スクリーニングを示す概要図。Dox、ドキシサイクリン。d)CRISRPiスクリーニングの代表的な中間時点の免疫ブロット法。MGT#1蛍光顕微鏡写真を溶解前に撮影した。e)MGT#1高及び低集団の精製のためのFACS選別ゲーティング戦略。f)MGT#1高-MGT#1CRISPRiスクリーニングにおけるgRNAの相対富化を示すMAプロット。EMTの既知及び新規の調節因子を特定する2つのドロップアウトgRNAに留意されたい。g)2つの独立したgRNAを用いたARID1A及びCNKSR2のCRISPR媒介ノックアウトに続くMGT#1発現のFACS検証。h)野生型及びARID1A及びCNKSR2 KO細胞におけるEMTマーカーの免疫ブロット法。
【0196】
図5:in vivoでsLCRによって明らかになった不均一な間葉分化転換。a)ヒトエンドポイントでのNSGマウス(n=10)におけるMES-hGIC;MGT#1-mVenus
dim異種移植片の代表的な冠状前脳画像。左、HE染色;右、GFP、チューブリン及びDAPI対比染色組織の拡大を示す漸進的差し込み図(insets)。均一にMGT#1-mVenus
highである浸潤神経膠腫先進部に留意されたい。b)代表的な混合MGT#1-mVenus
high/MGT#1-mVenus
neg病変。c及びd)それぞれMGT#1陽性及び陰性病変における代表的なH2B-CFP発現(矢印)。e)NSGマウス又はin vitroでMES-hGIC;MGT#1-mVenus
dim異種移植片においてCD133及びMGT#1-mVenus発現を示す代表的なフローサイトメトリープロット(左)。個々の構成要素を右側に示す。in vitroからin vivoへのプロファイルシフトに留意されたい。f)a~eで与えられるデータの概略図。
【0197】
図6:MES GBMサブタイプのサブタイプ特異的遺伝子の選択。a)指定のペアワイズ比較についてのTCGA順位付けマイクロアレイ有意性分析(SAM)リストから選択された遺伝子についての倍率変化を表すヒートマップ。下、メタデータに関連付けられるGBMサブタイプ発現プロファイルを示すカラーコード。b)一次生検及びそれに由来する神経膠腫幹様細胞(GSC)における発現及び倍率変化を示す、選択された遺伝子についての発現レベルを表すヒートマップ。下、メタデータに関連付けられるGBMサブタイプ発現プロファイルを示すカラーコード。全ての遺伝子が4を超える絶対CPMを有し、殆どの遺伝子がGSCにおいて倍率変化を示し、それらの発現に細胞自律的にも寄与することが示唆される。スピアマン順位相関をサンプルに用い、ピアソン相関を遺伝子に用いた。
【0198】
図7:自動化された合成遺伝子座制御領域(sLCR)生成。a)左上(I)、特定の遺伝子シグネチャーと関連するシス調節要素(CRE)の特定の概略図;右上(II)、ゲノム位置に対するCREの注釈;下(III)、TFBS多様性及びスコア[Σ-log10(p値)+TFBS数]に基づく150 bpのCREの繰り返し選択。sLCR生成は、TFBS多様性の最大で50%を超える、天然TSSに最も近いCREから最も遠い末端のCREまでのn個のCREの組立てを含む(実施例のMES-GBM)。b)TFBSスコア/多様性に基づく個々のsLCRのスピアマン相関。(A)は、自動化アルゴリズムによって生成したsLCRを示す。
【0199】
図8:sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答。
図2aからのGICにおけるMGT#1発現の代表的な生細胞イメージング。
【0200】
図9:MGT#1シス調節DNAに結合する転写因子。a)上、MGT#1 sLCRの概略図。下、使用した細胞株のいずれかでENCODE公開データベースにおいてChIP-seqシグナルを観察することができるTFのリスト。
【0201】
図10:乳癌細胞におけるMGT#1発現の恒常性維持。a)試験される2つの仮説の概略図:MGT#1が細胞状態を静的に反映するか、又はMGT#1が細胞恒常性を動的に反映し、in vitro恒常性調節が摂動後に再構築される(すなわちMGT#1dim集団のFACS精製)。緑色の破線の円は、MCF7及びMDA-231が、それらの細胞同一性のために、それぞれ固有の低又は高MGT#1発現を有することが示される、
図4aの結果を強調する。b)MCF7及びMDA231を最良の同等のMGT#1強度に基づいてFACS選別し、4aに示すFACS分析の前にin vitroで増殖させた。
【0202】
図11:MGT#1は、EMTへのTGFB及びGSK126の単独及び組合せでの寄与を反映する。a)指定の処理に5日間曝露したA549細胞におけるMGT#1発現のFACSプロファイル。1サンプル当たり最低10000個の細胞を取得した。b)指定の処理に5日間曝露したA549細胞におけるMGT#1発現及び細胞形態のFACSプロファイル。TGFB1+2とGSK126との間の細胞形状及び協同性におけるTGFB依存性変化を留意されたい。
【0203】
図12:MGT#1は、外部シグナル伝達及び/又は化学的摂動によって誘導される細胞運命転換のスクリーニングを可能にする。スクリーニングから得られたデータの主成分分析(PCA)を示す。2つの成分PC1及びPC2により実験における最大の変動が説明される。データを生成するために、A549-MGT#1細胞を増殖させ、ナイーブ上皮A549-MGT#1及びGSK126処理細胞について手順の終了時に細胞画像を撮影した。以前に公開されたデータと一致する間葉転換に留意されたい。増殖させたA549-MGT#1細胞からの正規化蛍光データの階層的クラスタリングを行い、SPARM20M TECANプレートリーダーを用いて蛍光ボトム読み取りをスキャンした。クラスタリングにはピアソン相関を用いた。カラーコードは、蛍光強度の倍率変化(青色-白色-赤色)及び生物学的反復試験(replicas)(黄色/橙色=ビヒクル、緑色=GSK126)を示す。GSK126処理及び対照A549-MGT#1細胞におけるLPSに対する応答を示す生細胞イメージングを行った。
【0204】
図13:sLCRによって明らかになったMES-GIC及びPN-GICにおける固有応答及び適応応答。a)sLCRを用いた表現型スクリーニングの概略図(上)及び結果のバブルプロット可視化(下)。各々のGIC及びsLCRについて、バブルのサイズは、対照に対する各処理の変化の大きさを示し(log2-倍率変化)、バブルの色は、変化の兆候を示す(富化では赤色又は橙色、枯渇では薄青色)。b)表現型スクリーニングのFACS検証。CD133及びPNGT#2の表面発現は、細胞同一性の内因性マーカーであった。PN-hGICと比較して高いMES-hGIC MGT#1発現に留意されたい。c)指定の刺激後の間葉分化転換の代表的なFACS定量化。d)MGT#1活性化の機能的分析のための実験的設計。e)dにおけるスクリーニングからの薬物関連sgRNAのボルケーノプロット(赤色、陽性調節因子;青色、陰性調節因子;灰色、有意でない)。全てのMGT#1
high画分についての倍率変化(n=3、ナイーブ、TMZ+IR、TNFa+FBSの平均)を全てのMGT#1
low画分及び未ソート対照(n=6)に対して算出した。PadjをDeSeq2によって算出した(方法を参照されたい)。選択されたsgRNA-化合物対を強調する。f)指定の処理及びTNFaによる連続処理後の指定の遺伝子のRT-qPCR。Padjを代表的な比較について示し、全体的2-way ANOVA及びダネットの多重比較による結果を示す。MES=間葉;PN=前神経;MGT#1-2=MES遺伝子追跡#1-2。FBS=ウシ胎仔血清、TNFa=腫瘍壊死因子-α。IR=電離放射線。TMZ=テモゾロミド。
【0205】
図14:sLCRによって明らかになったinvivoでの不均一な間葉分化転換。a)5e)の黄色及び青色のボックスによって示される指定の条件についてのATAC-seqプロファイルの散布図。TNF受容体スーパーファミリー(TNFRS)遺伝子座でのオープンクロマチンを強調する。b)FADD/TNFRS6遺伝子座のUCSCゲノムブラウザビュー。in vitro及びin vivoでのMGT#1
high細胞間のアクセシビリティの変化を矢印及び色によって示す(赤色-上方、灰色-中立)。c)PanCancerデータセット及び指定の条件のATAC-seqプロファイリングについての教師なしt-SNE。各ドットは、所与のサンプル又は利用可能な場合に全ての技術的反復試験のマージを表す。分析は、全サンプルの中で最も変動する250000個のピークについての上位の主成分を含む。灰色のドットは、GBM/LGGを除く全てのTCGA癌型であり、(Park et al., 2017, Cell Stem Cell21, 209-224 August 3, 2017)からの神経膠腫幹細胞及び本研究からのGICとともに色を付ける。円は、初代GBM/LGG及びGIC/GSCが占める次元を示す。d)神経膠腫の次元内のサンプルに限定されたATAC-seqプロファイリングについての教師なしt-SNE。
【0206】
図15:sLCRは、腫瘍と免疫細胞との間の細胞非自律的クロストークの治療との関連の発見を容易にする。a)不死化ヒトミクログリア(hMG;それぞれ上及び下のパネル)を含むスフェロイド又はオルガノイドとして増殖させた指定のレポーターを有する代表的なMES-hGICの明視野図及びIF。スケールバー=50 μm。b)非接触hGIC-hMG共培養の概略図。左;共培養時のhGIC及びMGの明視野画像。c)単独での又はTNFa若しくはhMG共培養で刺激したMES-hGIC-MGT#1
highの代表的なFACSプロファイル及びゲーティング戦略。下、指定の条件についてのDRGのIngenuity Pathway AnalysisによるNFkB関連遺伝子のベン図。DRGは、対照GICと比較して富化される(FC>1、padj<0.05)。d)患者のものと重複したhMGにより誘導されるMES GBMシグネチャーのベン図。他と比較して高度のNeftel et al.との重複に留意されたい。e)指定の条件についてのDRGのヒートマップ。RNA-seqリードをLog2変換及びZスコア化した100万当たりの転写物として正規化した。統計的有意性は、RパッケージLIMMAを用いて評価した(対照、n=3、hMG、n=3;TNFa n=2;padj<0.05)。f)指定の比較についてのMAプロット。有意なDRGを強調し、カラーコード化する。g)MES-hGIC-MGT#1
highにおいてTNFaと比較してhMG共培養によって上方調節された遺伝子のIngenuity Upstream Regulator Analysis。h)左、sLCR高及び低状態についての化学的感受性プロファイリングアッセイの概略図。右、漸増濃度の指定の薬物に応答した、FACS選別されたMES-hGIC-MGT#1
high及びMES-hGIC-MGT#1
low画分の生存性について算出したlogIC50値。
【0207】
図16:合成遺伝子座制御領域(sLCR)の詳細な特性評価。MGT#1及びPGKにより誘導される遺伝子発現の単一分子RNA FISH定量化。矢印/黄色は、細胞質共局在化を示す。
【0208】
図17:sLCRによって明らかになった適応応答の更なる例。指定の刺激後の代表的なMGT#1活性化。
【0209】
図18:GICにおけるsLCRによって測定されたMES-GBM状態の誘導が特異的かつ可逆的である。a及びb)48時間の誘導後の指定の因子/sLCRに対する個々の応答を示す棒グラフ。c及びd)指定の因子/sLCRの縦断的発現を示す折れ線グラフ。
【0210】
図19:MES-GBMにおける電離放射線及びNFkBシグナル伝達の役割を分析するためのMES-sLCR。a)右、IRとMGT#1活性化との間の用量応答。実験的設定の一例を左側に示す。b)指定の刺激後の間葉分化転換の代表的なFACS定量化。
【0211】
図20:表現型CRISPR/Cas9フォワード遺伝子スクリーニングにおけるsLCRの使用を支持する更なる証拠。a)ゲノムワイドCRISPRスクリーニングによる、gRNA増幅のためにMGT#1
high及びMGT#1
lowを選別する前の指定の条件についてのFACSプロット。b)未ソートスクリーニング条件における非常に有益な必須のgRNA及び全ての非必須又は非標的gRNAの分布を比較することによるデータ品質評価を示す箱ひげ図(P値=スチューデントt検定)。c)指定のgRNAセットについてのBrunelloライブラリーと未ソートMES-hGIC+Brunello条件との間のsgRNAの倍率変化値の分布(方法を参照されたい)。d)sgRNA存在量(X軸)及び倍率変化(y軸)の代表的なMAプロット。Brunelloライブラリーを保有するナイーブMES-hGICをMGT#1
high及びMGT#1
lowにFACS選別し、gRNAを最大のデータセットに対して正規化し、Log2変換した(方法を参照されたい)。指定のgRNAがMGT#1
high画分と比較して枯渇する。e)CRISPR/Cas9 KOスクリーニングによる全てのヒットのIngenuity Pathway Analysis(IPA)の上位25の毒性カテゴリー(FC±1.5;padj<0.05)。「陽性調節因子」のみが統計的カットオフを超える。太字のカテゴリーは、レチノイン酸受容体シグナル伝達と関連する。CRISPR/Cas9 KOスクリーニングによる全てのヒットのIPA UpstreamRegulator Analysis(FC±1.5;padj<0.05)。MES-GBM表現型の陽性及び陰性調節因子をそれぞれ水色及び赤色にした。灰色は、指向性の富化のない有意なカテゴリーを示す。f)eのスクリーニングによる上位の調節されるsgRNAのボルケーノプロット。全てのMGT#1
high画分(n=3、ナイーブ、TMZ+IR、TNFa+FBSの平均)についての倍率変化を、全てのMGT#1
low画分及び未ソート対照(n=6)に対して算出した。PadjをDESeq2によって算出し、選択されるsgRNAのFDAにより承認される化合物対を強調する(方法を参照されたい)。
【0212】
図21:hGICにおいてMGT#1発現を誘導するhMG細胞、並びに治療法及びhMG細胞に対する感受性差を支持する更なる証拠。a)
図4の共培養実験の詳細な概略図;詳細な培地組成については方法を参照されたい。b)単独での又はヒトミクログリア(hMG)若しくはヒトCD34+由来の骨髄由来サプレッサー細胞(MDSC)と共培養したMES-hGIC-MGT又はPN-hGIC-MGT#1
highのFACSプロファイル。c)指定のRNA-seqプロファイルの主成分分析。距離は、Gosselin et al 2017から得た選択ヒトMGマーカーの平均発現レベルに基づいて算出した。d)漸増濃度の指定の薬物に応答した、FACS選別したMES-hGIC-MGT#1
high及びMES-hGIC-MGT#1
low画分の生存性。e)hMG細胞がMES-GBMを誘導し、DNA損傷転写シグネチャー遺伝子を抑制することを示す、指定の遺伝子リストについての散布図及び遺伝子セット富化分析(GSEA)。
【0213】
図22:表現型CRISPRiスクリーニングにおけるsLCRの使用を支持する更なる証拠。a)技術的反復試験及び生物学的条件を含むキノームスクリーニングにおける全てのサンプル(n=42)についての累積プロット分布:それぞれプラスミドライブラリー、A549-H1944インプット、A549-H1944+GSK126 high、med、low-対照-A549-H1944+GSK126+dox high、med、low及びA549-H1944+doxhigh、med、low-GSK126により誘導されるEMT及び恒常性EMTのスクリーニング。全てのgRNA(n=6615)を100万リード当たりの総数によって正規化し、パーセンタイル正規化(75パーセンタイル)によってlog変換し、zスコアへの換算によって変換した。b及びc)
図3c~
図3fのスクリーニングにおける全てのgRNA(n=6615)についての散布図、並びに非必須sgRNA(n=483)及び必須遺伝子(n=352)のそれぞれについてのGSEA。必須遺伝子の枯渇は、t検定及びコルモゴロフ-スミルノフによってFC<-1及びpadj<0.001で有意である。d及びe)組み合わせA549+H1944+GSK126+doxスクリーニングにおける全てのgRNA(n=6615)についての散布図、並びに非必須sgRNA(n=483)及び必須遺伝子(n=352)のそれぞれについてのGSEA。必須遺伝子の枯渇は、t検定及びコルモゴロフ-スミルノフによってFC<-0.5及びpadj<0.001で有意である。
【実施例0214】
本発明を以下の実施例によって更に説明する。これらは、本発明の範囲を限定することを意図したものではなく、本明細書に記載される本発明の更なる説明のために提示される好ましい実施形態を示す。実施例により、本明細書に記載の方法及びレポーターベクターが対象の様々な細胞型におけるレポーター及びエフェクターの遺伝子の細胞型特異的発現を可能にすることが示される。
【0215】
実施例に使用される材料及び方法:
sLCRの生成及びTFBSの発見:規定のゲノム領域(DRG遺伝子座;表X)における高親和性TF結合部位を、FIMO(PMID:21330290)を用いて--output-pthresh 1e-4 --no-qvalueで特定した。既知の転写因子結合優先度(位置重み行列、PWM)を表す1818個のモデルのデータベースを文献から生成した(Portales-Casamar et al., 2010、Badis et al.,2009、Berger et al., 2008、Bucher,1990、Jolma et al., 2010)。PWMをサブタイプ特異的TFに基づいて予め選択した。DRGに対応する領域をUCSCゲノムブラウザ(hg19;2012年10月5日にダウンロードしたRefseq表)から検索し、150 bp及び50 bpステップのウィンドウでスキャンした(以下、シス単位と称する)。各シグネチャー遺伝子の周囲のスキャンした領域を、TSS又はTESから10 kb超離れて位置する2つの遠位CTCF部位によって区切った。サブタイプ特異的PWMを、FIMOを用いてゲノム領域にマッピングした。PWMは、最も有意に大きな比率を占める領域である(調整p値<0.01;複数のバックグラウンド)。各ウィンドウについて、同じPWMで複数のマッチングが特定された場合には、最良のマッチングのp値を、その領域にわたるそのTFの親和性の代理とみなした。領域を所与として、全体的スコアを、検討される各PWMについて最良の-log10(p値)の和に基づいて算出した。有意に大きな比率を占める領域(複数のバックグラウンド)を、モチーフ/バックグラウンドを比較することによって決定した(経験的p値<0.01)。
図1aのTFBSペアワイズ相関ヒートマップでは、上で定義したスコアに関して上位500個の領域を使用した。
図1aの代表的なものを含むゲノミクス座標対TFBS相関ヒートマップを、上位100個のスコアリング領域を用いて生成した。
【0216】
sLCR生成の自動化:細胞固有の遺伝子シグネチャーに焦点を合わせるために、パイロットアプローチでは、本発明者らの以前の実験からのGBM幹様細胞(GSC)において低発現の遺伝子を除外したが、方法の現在の実装形態は、検証された神経膠腫固有のシグネチャーに焦点を合わせることを含む
20。最初のsLCRは、PWMスコア及び多様性に基づくトップスコアのシス単位の手動選択によって設計した。また、TSS含有領域の選択を手動で行った。自動化sLCR生成は、pythonで書かれている(URL GitHub/GitLab)。このスクリプトはTF、PWM及び表現型遺伝子シグネチャーのリストをインプットとする。これらを用いて、規定のシス調節領域からシス単位が生成される(デフォルトパラメーター:150 bpウィンドウ/50 bpステップ)。任意の所与の表現型についての最良のシス単位の選択は、規定の選択規則に基づくアルゴリズムを用いて生成される。このアルゴリズムでは、最初に以下の式を適用することによってランク付け及び最良のシス単位の選択を生成する:[スコア-log10(p値)の和×多様性(異なるTFBSの数)]。反復して、選択されるシス単位に含まれるTFBSを除外する。転写発火(firing)の成功の可能性を高めるために、このアルゴリズムにより、シス単位を5'CAGEデータに基づいてもランク付けする。ランク付けしたリストがアルゴリズムのアウトプットである。自動化手順により重複結果を手動選択によって戻した(
図7)。
図1a及び
図1bのヒートマップは、gplots Rパッケージからヒートマップ.2機能を用いて生成した。
【0217】
RNA-seqの生成:RNAを、トリゾール(Invitrogen)を用いて抽出し、イソプロパノールを用いて沈殿させ、RNACleanXPビーズを用いて精製した。この研究のために生成されるRNA-seqライブラリーは、TruSeq Stranded Total RNA library prep kitを用いて構築した。ビーズベースのアプローチをrRNA枯渇に用い(Ribo-Zero Gold;Illumina)、PCR増幅を製造業者のプロトコルに従って行った。最終ライブラリーをBioanalyzer又はTapeStationで分析し、バーコード化ライブラリーをプールし、Illumina HiSeq2500又はHiSeq4000プラットホームでシングルリード51 bp又はペアエンド100塩基プロトコルのいずれかを用いてシークエンシングした。Illuminaアダプターを、生リードを用いてCutadaptでトリミングし、生リードをTopHatでヒトゲノム(Hg19又はHg38)に対してアラインメントした。HTSeqを用いて、各遺伝子について独自に割り当てられたリードの数を評価した。次いで、発現値を107個の全リードに対して正規化し、log2変換して、100万当たりのカウント(counts per millions;CPM)を得た。
【0218】
分析:
図2dのヒートマップについては、Seqmonk v1.42を使用した。簡潔に述べると、BAMファイルを、HISAT2を用いてHg38に対してアラインメントし、転写物を、特徴長さを修正するエクソンにわたる転写物カウントリードでのRNA-Seqパイプライン定量化によって定量化した。定量化、log変換及びアラインメントを用いたグラフ表示に続くマッチング分布によって補足されるパーセンタイル正規化により、反対鎖特異的ライブラリーが想定された。
【0219】
図15eでは、SeqMonkを用いてデータを分析し、標準的な分析パイプラインによってリードを正規化し、DNA混入を修正し、生カウントを生成して、DESeq2差分分析を行った。log変換による同じパイプラインを可視化に用いた。標準的なSeqMonk設定:独立強度フィルタリングを適用したBenjamimi(Benjamini) and Hochberg補正後のp<0.05を用いて有意性を決定した。定量化を上記のように行った。MG対GIC及びTNFa対GICにおけるNFKB関連遺伝子を、IPAを用いて決定し、MES GBMシグネチャーをそれぞれの刊行物によって得て、Vennyを用いてプロットを生成した。GSEA有意性を、MES-GBMについてはpadj=0でFC>0.5倍、PNについてはFC<-0.4、padj=0、SREBPについてはpadj=0でFC>1倍と決定した。
図15eの相互作用マップは、MGT#1High TNFa対MGT#1High C20MG共培養の比較のためにIPAの機能Ingenuity upstream regulatorを用いて生成した。
【0220】
ATAC-seq:FACS選別した集団に対するATAC-seqは、in vivo実験からの20個~50000個及びin vitro実験からの50個~100000個の細胞で行った。細胞をPBS中で遠心分離し、ペレットを50 μlのマスターミックス(25 μLの2×TDバッファー、2.5 μLのトランスポザーゼ及び22.5 μLのヌクレアーゼフリー水、NexteraDNA Library Prep、Illumina)に静かに再懸濁し、適度に振盪しながら(500 rpm~800 rpm)、37℃で60分間インキュベートした。転位を5 μlのプロテイナーゼK及び50 μlのALバッファー(Quiagen(Qiagen))で停止させ、56℃で10分間インキュベートし、1.8xvol/vol AMPure XP ビーズを用いてDNAを精製し、18 μl溶出させた。ライブラリー増幅に最適なPCRサイクルの回数を各サンプルにつき2 μlの鋳型を用いて決定し、続いて熱活性化Kappa Hifiポリメラーゼ及びEvaGreen 1xを用いてqPCR増幅を行った。最終増幅は、50 μlのqPCR容量及び8 μl~12 μlの鋳型DNAで行った。プライマーは以前に記載されている(Buenrostro et al. 201)。ライブラリーを、Qubit(Life Technologies)を用いて個別に定量化し、適切なラダー分布を、HighSensitivity D1000 ScreenTapesを用いてTapeStation(Agilent)で決定した。シークエンシングを、V2 chemistryを用いてIllumina NextSeq 500で150サイクル行った(ペアエンド75nt)。
図14aのATAC-seq分散分析は、プローブとしてのTSS±5 kb、ENSEMBLmRNAでの最終注釈を用いるSeqMonkを用いて行った。正規化にはRead Count Quantitationを用い、リードを100万リード当たりのプローブのみでの総カウントに対して補正し、log変換したsnfを寸法因子正規化によって更に変換した。
【0221】
ATAC-seq分析:リードを、trim-galore v0.6.2 --nexteraを用いてアダプター除去した後、bowtie2 v2.3.5(参照)デフォルトパラメーターを用いてマッピングした。ATAC-seq分析を、プローブTSS±5 kb、ENSEMBLmRNAでの最終注釈を用いるSeqMonkを用いて行った(2019アセンブリ)。カウントを、Read Count Quantitation機能を用いて正規化し、リードを100万リード当たりのプローブのみでの総カウントに対して補正し、log変換し、寸法因子正規化によって更に変換した。
図14cのsLCR ATAC-seq及びTCGA ATAC-seqの統合を、確立されたプロトコルに従って生成した。
【0222】
ベクター生成:sLCRを初めにIDT、後にGenScriptで合成した。MGT#1-mVenusを哺乳動物発現、レンチウイルスFUGW(David Baltimore寄贈;Addgene#14883)のPacI-BsrGIフラグメントにクローニングした。mVenusとmCherryとの交換等の付加的な修飾、又は他の全てのsLCRを有するMGT#1には、制限酵素消化又はGibsonクローニングのいずれかを使用した。sLCRベクターは、第3世代レンチウイルス系であり、pCMV-G(Addgene#8454)、pRSV-REV(Addgene#12253)及びpMDLG/pRRE(Addgene#12251)とともに使用されている。Sall2(ccsbBroad304_11117)及びPou3f2(ccsbBroad304_14774)は、CCSB-Broad Lentiviral Expression Libraryから得た。
【0223】
細胞株:MES-hGIC及びPN-hGICは、本発明者らの研究室によって生成され、他の部分で説明する。簡潔に述べると、PN-hGICは、pLenti6.2/V5-IDH1-R132H、TP53R173H及びTP53R273H(CCSB-Broad Lentiviral Expression LibraryからのTP53ccsbBroad304_07088に導入した点突然変異)及びpRS-Puro-sh-PTEN(#1)を用いてヒトNPCを形質転換することによって生成した。MES-hGICは、ヒトNPC pRSPURO-sh-PTEN(#1)、pLKO.1-sh-TP53(TRCN0000003754)及びpRS-shNF1を形質転換することによって生成した。これらの株については、遺伝的、転写及びエピジェネティック特性評価、並びにin vivo腫瘍形成及び表現型模倣能の評価を行った。in vitroでは、GICを、1箇所修飾を加えて記載のように増殖させた76。EGF(20ng/ml;R&D)、bFGF(20 ng/ml;R&D)、ヘパリン(1 μg/ml;Sigma)、並びに5%ペニシリン及びストレプトマイシンに加えて、PDGF-AA(20 ng/ml;R&D)もRHB-A(タカラバイオ株式会社)に添加する。この培地組成物をRHB-A完全培地と称する。hGICは、5%CO2、3%O2及び95%湿度のインキュベーター内にて37℃で培養した。
【0224】
T98G及びU87MG(vanTellingen lab、NKIの厚意により提供)は、EMEM培地中で増殖させた。
図13aの実験については、T98GをEGF(20 ng/ml)、bFGF(20 ng/ml)、ヘパリン(1 μg/ml)、並びに5%ペニシリン及びストレプトマイシンを添加したRHB-Aに交換し、初めに標準的な組織培養処理プラスチック上、続いて超低結合プラスチック(CORNING)内で増殖させた。
【0225】
MCF7、MDA-231、A549及びH1944細胞株(Rene Bernards lab、NKIの厚意により提供)は、RPMI培地中で培養した。全ての細胞株に、10%FBS並びに5%ペニシリン及びストレプトマイシンを5%CO2-95%空気のインキュベーター内にて37℃で添加した。
【0226】
不死化初代ヒトミクログリアC20は、1%FBS、2.5 mMグルタミン(Thermofisher;35050038)、1 μMデキサメタゾン(Sigma;D1756)、並びに1%ペニシリン及びストレプトマイシンを添加したRHB-A培地(タカラバイオ株式会社)中、5%CO2、19%O2及び95%湿度のインキュベーター内にて37℃で培養した。
【0227】
ドナー由来CD34細胞は、SFEM II(StemCell)、SCF、FLT3-L、TPO、IL6(全て100 ng/ml;easyexperiments.com)、UM171(Selleck、0.035 μM)、SR1(Selleck、0.75 μM)、19-デオキシ-9-メチレン-16,16-ジメチルPGE2(Cayman、10 μM)中で増殖させた。
【0228】
ゲノムワイドCRISPRノックアウトin vitroスクリーニング:ゲノムワイドプールCRISPRノックアウトスクリーニングについては、19114個の遺伝子を標的とする77441個のsgRNA(1遺伝子当たり平均4個のsgRNA)及び1000個の非標的対照からなるBrunelloライブラリーを利用した。100倍を超えるライブラリー表示を達成するために、合計16×106個のMES-hGIC-MGT#1low細胞に約0.5のMOIで形質導入し、処理の導入前に細胞を10日間増殖させた。10日目に、細胞をTNFa(10 ng/ml)及びFBS(0.5%)、テモゾロミド(50 μM)及び照射(20 Gy)で処理するか、又は処理しないままにした。gDNA抽出の前に各条件のFACs選別を行い、MES-hGIC-MGT#1low、MES-hGIC-MGT#1high及び未ソート集団を集めた。ゲノムDNAを、プロテイナーゼK(Invitrogen)及びRNase A(Thermo Scientific)を添加したALバッファー(Qiagen)中で細胞ペレットを56℃で10分間溶解させることによって抽出し、続いてAMPureビーズで精製し、EBバッファー(Qiagen)中で溶出させた。NGSライブラリーを2工程PCRセットアップで構築した。ここで、PCR1は、sgRNAスキャフォールドを増幅し、スタガ(stagger)配列を挿入してフローセルにわたるライブラリーの複雑性を増大させるために用いられ、PCR2により、特有のP7バーコードを有するIllumina適合性アダプターを導入し、サンプル多重性(multiplexity)を可能にした。PCR1については、5 μgの各gDNAサンプルを5つの並行反応に分け、これを続いてプールし、AMPureビーズを用いて精製した。PCR2に最適なサイクル数は、KAPA HiFi HotStart Ready Mix(Roche)及び1x EvaGreen(Biotium)を用いてqPCR増幅を行うことによって1 μlの各PCR1について個別に決定した。各サンプルの10 μlの精製PCR1を最終PCR2のインプットとして使用した。PCR1及びPCR2は、どちらもKAPAHiFi HotStart Ready Mixを用いて行った。プライマーは、要請に応じて利用可能である。最終ライブラリーの品質管理は、定量化にQubit dsDNA HSキット(Invitrogen)、PCRフラグメントサイズの決定にTapeStation High SensitivityD1000 ScreenTape(Agilent)を用いて行った。バーコード化ライブラリーを等モル濃度でプールし、75サイクルのV2 chemistry(1×75 ntシングルリードモード)を用いてIllumina NextSeq500でシークエンシングした。
【0229】
Transwell共培養:hGIC及び不死化初代ヒトミクログリアC20の共培養は、細孔径0.4 μmの親水性PTFE 6ウェル細胞培養インサート(Merck)を用いて設定した。ヒトミクログリアを1.5×105細胞/ウェルで6ウェルプレート上のそれぞれの培地に24時間にわたって播種した。培地を吸引し、細胞をPBSで1回洗浄した後、1 mlのRHB-A完全培地を添加した。Transwellインサートをプレートに配置し、総容量1 mlのRHB-A完全培地中の5×105個の単一hGICをインサート表面上にプレーティングした。hGIC及びC20ヒトミクログリアを48時間の共培養後に更なる分析のために採取した。
【0230】
トランスフェクション-形質導入:トランスフェクション及び形質導入は、以前に詳細に記載されている。簡潔に述べると、12 μgのDNAミックス(レンチベクター(lentivector)、pCMV-G、pRSV-REV、pMDLG/pRRE)をFuGENE-DMEM/F12ミックスとともに室温で15分間インキュベートし、293T細胞をカバーする抗生物質フリー培地に添加し、ウイルス上清の最初のタップ(first-tap)をトランスフェクションの40時間後に回収した。力価を、Lenti-X p24 Rapid Titer Kit(タカラバイオ株式会社)を製造業者の使用説明書に従って用いて評価した。ウイルス粒子を、2.5 μg/ml硫酸プロタミンを添加した適切な完全培地中の標的細胞に適用した。ウイルス上清との12時間~14時間のインキュベーション後に、培地を適切な完全培地で更新した。
【0231】
凍結切片の作製:腫瘍様塊を重力によって沈降させ、新たに調製したPBS中のホルムアルデヒド(1.0%)で固定し、これを140 mMグリシン2Mでブロッキングし、30%スクロースですすぎ、続いて凍結培地(O.C.T/cryomold)を添加した。凍結ブロックをドライアイス凍結によって得て、使用するまで-80℃で保管した。ブロックをLeica CM 1950で切断した。
【0232】
免疫組織化学:組織又は腫瘍様塊を4%PFA中で20分間固定した。固定後に脱水を70%~100%の漸増EtOH、キシレン及び一晩のパラフィンインキュベーションによって行った。パラフィン包埋サンプル(PES)を、HM 355Sミクロトーム(ThermoScientific)を用いて切断した。ヘマトキシリン/エオシン(HE)染色を標準により行い、スライドの画像を自動化顕微鏡(株式会社キーエンス)で取得した。
【0233】
免疫蛍光:室温で細胞をカバースリップ上で成長させるか、又はスフェロイドをガラス上で遠沈し、続いてPBS中の4%パラホルムアルデヒド(PFA、16005-Sigma Aldrich)で10分間固定し、PBS中で5分間洗浄し(3回)、PBS中の0.5%triton X100で5分間透過処理し、4%BSA(3854.4ROTH)で15分間ブロッキングし、一次抗体及び二次抗体並びに20μm/ml Hoechst 33258(16756-50、Cayman)で染色し、マニキュア液及びVectashield(H1000-Linaris)を用いてスライドガラス上にマウントした。パラフィン包埋組織に対し、脱パラフィン及びクエン酸塩抗原賦活化を標準的なプロトコルにより行った。透過処理をPBS中のTriton 0.25%で行い、適切な場合には内因性ペルオキシダーゼを水中の3%H2O2でブロッキングした。通例、5%正常ヤギ血清(NGS)によるブロッキングを行った。一次抗体は、抗GFP(Anti-GFP ab6556、1:000)、抗MED1(Abcam ab64965 1:500)、抗チューブリン(BD T5168、1:2000)とし、二次抗体は、A31573、A11055及びA31571 Alexa Fluor 647、A21206 Alexa Fluor 488、A31570 Alexa Fluor555とした。
【0234】
RNA FISH及び二重FISH-IF:細胞を70%エタノール(RNA FISHのみ)又は0.5%triton X-100(二重IF-RNA FISH)で透過処理した、RNaseフリーPBS(1x、Life Technologies、AM9932)、20%Stellaris RNA FISH Wash Buffer A(BiosearchTechnologies, Inc.、SMF-WA1-60)及びRNaseフリーPBS中の10%脱イオンホルムアミド(EMD Millipore、S4117)によって室温で5分間固定した。IgK-MGT#1-mVenus及びH2B-CFPを、カバーガラスに転写した100 μL中の31.5 μMの10%脱イオンホルムアミド、90% Stellaris RNA FISHHybridization Buffer(Biosearch Technologies、SMF-HB1-10)中のSMF-1084-5 CAL Fluor(商標) Red 635及びSMF-1063-5 Quasar(商標) 570 custom Stellaris(商標) FISH Probe(要請に応じて利用可能なオリゴ配列)を用いてプローブし、暗所にて37℃でハイブリダイズさせた。一晩のインキュベーション後に、スライドをRNaseフリーPBSで5分間洗浄した(3回)。一次/二次染色が起こった場合、記載の通りにした。
【0235】
イメージング:使用した顕微鏡は、Zeiss LSM800、Leica SP5-7-8、Nikon Spinning Diskであった。
図S41(?)の共焦点像は、Leica SP5で取得した。mVenus蛍光は、Ex=488 nm、Em=535 nmを用いて取得し、
図1dの画像は、Zeiss LSM800を用い、それぞれmVenus-QUASAR570についてはEx=558 nm、Em=575 nm、BRD4-AF647又はMED1-AF647についてはEx=653、Em=668を用いて取得した。H2B-CFP-QUASAR670については、Ex=631、Em=670を用いた。ImageJ又はPhotoshopを用いて画像を処理した。
【0236】
表現型スクリーニング:腫瘍細胞をスクリーニングまで上記のように増殖させた。次いで、適切な成長因子を添加したGibco FluoroBrite DMEM培地中で15000個/50 μl/ウェルを384ウェルプレート(Corning)に播種した。細胞を、SPARK20M Injectorシステム(50 μlの注入量;100 μl/秒の注入速度)を用いて50 μlの懸濁液として各ウェルに分注した。非接着性細胞(例えばGIC)については、細胞を37℃、1500rpmで1時間30分更に遠心分離した。蛍光ボトム読み取りは、SPARM 20M TECANプレートリーダーを用い、加湿カセット内の5%CO2-95%空気(GICについては3%)中37℃で、mVenusについては以下の設定:モノクロメーター、Ex 505 nm±20 nm、Em535 nm±7.5 nm、手動ゲイン:198、フラッシュ:35、積分時間:40 μsでスキャンした。独立反復試験では、細胞生存性をFluoroBrite培地中の0.02%AlamarBlue溶液を用いて、以下の設定:蛍光トップ読み取り、モノクロメーター、Ex 565 nm±10 nm、Em592 nm±10 nm、手動ゲイン:88、フラッシュ:30、積分時間:40 μsで測定した。
【0237】
GSK126等のDMSO可溶性化合物は、D300eを用いてロボット制御で分取し、サイトカインは、Andrewピペッティングロボット(AndrewAlliance)を用いて各ウェルにロボット制御で分取した。以下の濃度を用いる。
【0238】
【0239】
データをPRISM7(GraphPad)にインポートした。対照死細胞の蛍光強度をバックグラウンドとして全ての値から減算した。個々の値を対照の平均に対して正規化し、倍率変化として表した。
【0240】
薬物用量応答スクリーニング:transwell共培養実験からの形質導入したhGICを単一細胞懸濁液に採取し、BD FACS Aria IIIを用いてmVenus高及び低集団に選別した。細胞を計数し、7000細胞/50 μl/ウェルを、SPARK20M Injectorシステム(50 μlの注入量;100 μl/秒の注入速度)を用いて384ウェル黒壁プレート上のRHB-A完全培地に播種した。薬物は通例、DMSO中に10 mMストックとして溶解し、プレート無作為化及びDMSO正規化による標的化用量応答のためにD300e複合プリンタ(TECAN)を用いて分注した。72時間のインキュベーション後、細胞生存性を、10 μlのCell-Titer-Blu(Blue)(Promega)アッセイ試薬との2時間~6時間インキュベーション後に以下の設定:蛍光トップ読み取り、モノクロメーター、Ex 565 nm±10 nm、Em592 nm±10 nm、ゲイン設定:最適スキャニング、フラッシュ:30、積分時間:40 μsで測定した。データをPRISM7(GraphPad)にインポートした。空ウェルの蛍光強度をバックグラウンドとして全ての値から減算した。濃度をlog[M]スケールにlog10変換し、個々の値を非処理陽性及びSDS処理陰性対照条件の平均に対して正規化した。非線形回帰モデル(log(阻害剤)対正規化応答--可変傾斜)を用いて用量応答曲線及びIC50値を導いた。
【0241】
【0242】
hGICの照射:照射は、標的化照射のための225 kV X線管を備えるXenX照射装置プラットホーム(XStrahl Life Sciences)を用いて行った。6ウェルプレート又は96ウェルプレートのいずれかで培養したhGICをビームラインの焦点面に配置し、内蔵計算ソフトウェアを用いて算出される標的線量に応じた特定時間にわたって照射に曝露した。
【0243】
マトリゲルオルガノイドの生成:C20ヒトミクログリアとhGICとの共培養によってオルガノイドを生成するために、成長因子を減少させ、フェノールレッドを含まないマトリゲル(BD;734-1101)小滴を細胞外基質支持体として使用した。標的細胞を採取し、500 μlの容量で1.5×105個のC20ヒトミクログリア及び3.5×105個のhGICを含む単一細胞懸濁液を調製した。予め冷却した消耗品及びピペットチップを用いて、氷上で解凍した30 μlのマトリゲルを冷60ウェルMinitrays(Thermofisher;439225)の各ウェルに添加した。1小滴当たり5000個の細胞を、5 μlの調製細胞懸濁液を用いて各オルガノイドに注入し、ピペッティングによって混合した。小滴を5%CO2、3%O2及び95%湿度のインキュベーター内にて37℃で最長14日間培養し、RHB-A完全培地を2、3日に1回交換した。ライブセルイメージングを10日目にLeica SP8共焦点顕微鏡を用いて行った。
【0244】
RT-qPCR:cDNAを、20 μLのSuperScript(商標)VILO(商標)MasterMix RNA(0.5 μg~2.5 μg)を用い、25℃で10分間、42℃で60分間及び85℃で5分間インキュベートして生成した。RT-qPCRを、384ウェルViiA(商標) 7 Systemにおいて10 μl/ウェルの1×PowerUp SYBR Green Master Mix(Applied Biosystems)を用いて10 ngのcDNA/ウェルで行った。プライマーは、要請に応じて利用可能である。
【0245】
組織解剖及び細胞表面染色:脳腫瘍解剖は、以前に詳細に説明されている77。簡潔に述べると、組織を外科用メスで解剖し、Accutase/DNaseI(947 μlのAccutase、50 μlのDNase Iバッファー、3 μlのDNase I)中、37℃で必要とされるまで消化した。初めに120 μmセルストレーナーを通して濾過し、RBC溶解(NH4Cl、155 mM;KHCO3、10 mM;EDTA、pH 7.4、0.1 mM)の前に40 μmセルストレーナーを通して濾過した。冷PBS中で洗浄した後、生存性及び細胞数を、TECAN SPARK20Mを用いて0.4%トリパンブルー染色によって自動的に評価した。
【0246】
表面マーカーを評価した後、通例、200000個の細胞/抗体を15 ml容Falconで使用した。染色容量は氷上、暗所で30分間の一次抗体(例えば、CD133-APC;Miltenyi)を含むRHB-A培地中50μlであった。非結合抗体を2回のPBS洗浄によって除去した。細胞を分析するか又は選別するかに応じて、データ取得をBDLSRFortessaで行うか、又はBD Aria II若しくはAstrios Mofloを用いて細胞を選別した。分析されるフルオロフォアに応じて適切なレーザー-フィルタの組合せを選んだ。通例、死細胞を除去するために、イベントを初めに形状及び粒度に基づいてゲーティングし(FSC-SSC)、生存性色素としてAnnexinV又はLIVE/DEAD Fixable Aqua Dead Cell Stain Kitのいずれかを使用した(分析されるフルオロフォアに応じて)。分析をFlowJo_V10で行った。
【0247】
FACS分析:分析をFlowJo_V10で行った。
【0248】
FACS選別:形質導入されたhGICを単一細胞懸濁液に採取し、冷RHB-A完全培地(complete)に再懸濁し、FACSチューブに濾過した。BD FACS Aria III又はFusionを用いて選別を行った。選別されるフルオロフォアに応じて適切なレーザー-フィルタの組合せを選んだ。通例、死細胞を除去するために、イベントを初めに形状及び粒度に基づいてゲーティングし(FSC-A対SSC-A)、ダブレットを除外した(FSC-A対FSC-H)。正のゲートを選別レポーターとしてPGKによって誘導され、構成的に発現されたH2B-CFPで確立し、低強度から中程度の強度のsLCR依存性フルオロフォア発現を有する集団を選別した。
【0249】
免疫ブロット:細胞ペレットを、1xプロテアーゼ阻害剤カクテル(Roche)、10 mM NaPPi、10 mM NaF及び1 mMオルトバナジン酸ナトリウムを添加したRIPAバッファー(20 mM Tris-HCl(pH 7.5)、150 mM NaCl、1 mM EDTA、1 mM EGTA、1%NP-40)に溶解させた。溶解物を必要に応じて超音波処理し、NuPAGE MOPS SDS Running Buffer(50 mM MOPS、50 mM Tris塩基、0.1%SDS、1 mM EDTA)中でNuPAGE Bis-Trisプレキャストゲル(Life Technologies)を用いて電気泳動を行った。タンパク質をニトロセルロース膜に転写バッファー(25 mM Tris-HCl(pH 7.5)、192 mMグリシン、20%メタノール)中にて120 mAで1時間転写した。タンパク質転写を、ポンソーレッドで5分間染色し、続いて2回のTBS-Tで洗浄することによって評価した。膜のブロッキングは、PBS中の5%BSAにより室温で1時間行った。一次抗体の希釈物をPBS+5%BSA中で調製し、膜を4℃で一晩インキュベートした。TBS-Tで5分間にわたって3回洗浄した後、適切なHRP結合二次抗体の希釈物をPBS+5%BSA中で調製し、膜を室温で45分間インキュベートした。TBS-Tで5分間にわたって3回洗浄した後、ECL 検出試薬(Sigma;RPN2209)を適用し、膜をECL Hyperfilm(Sgima(Sigma);GE28-9068-37)に曝露し、化学発光シグナルを検出した。
【0250】
【0251】
IncuCyte:IncuCyte自動化縦断的イメージングを96ウェル黒壁プレート(Greiner)で行った。1プレート当たり300000個の細胞を実験の終了時に最適なコンフルエンスに達するように播種した。GSK126はD300eを用いて分取し、TGFB1+2は手動で各ウェルに分取した。どちらも2日に1回更新した。プレートリーダー(BMC(BMG)Clariostar)を用いて最後の時点を独立して検証した。
【0252】
CRISPRiスクリーニング:CRISPRiスクリーニングのために、A549-MGT#1±GSK126±Dox細胞をAstrios Mofloで選別した。各集団内の下位10%(dim)及び上位10%(bright)の細胞における1000x(600万個超の細胞)のライブラリー表示を目指した。中間の集団も選別し、対照としてスクリーニング分析に含めた。細胞をAL+ProteinaseKバッファー(Quiagen)中にて56℃で10分間溶解させ、続いてAMPureビーズ(Agencourt)及びRNase A処理を用いてDNA抽出物を抽出した。CRISPRiライブラリーのPCR増幅及びバーコードタグ付けは、PCRバッファーの組成を含めて基本的に記載のように行った77。PCR1の各サンプルについては、インプット対照からのものを含む10回の並行反応で分割された20 μgのDNAを使用し、PCR1のプラスミドライブラリーには0.1 ngのDNAが必要であった。並行PCR1反応物を混合し、5 μlをPCR2の鋳型として使用した。PCR1及びPCR2の両方でPhusionポリメラーゼ(NEB)、GCバッファー及び3%DMSOを使用した。プライマーは、要請に応じて利用可能である。
【0253】
ライブラリー濃度を測定し、バーコード化ライブラリーをプールし、Illumina HiSeq2500シークエンシングでシークエンシングした。カスタムスクリプト(要請に応じて利用可能)を用いてリードをコンピューターによるライブラリーにマッピングして、リード数を生成し、これを続いてSeqmonkのインプットとして使用した。カスタムゲノムをSeqmonk分析(要請に応じて利用可能)に使用し、サンプルをRPMに対して正規化し、Log変換してMAプロットを生成し、padj<0.001でのDEseq2を生リード数に対して行った。A549での2回の独立したCRISPRiスクリーニング及びH1944での1回の付加的なスクリーニングを行った。
【0254】
CRISPR/Cas9 KO:A549-MGT#1をCNKSR2及びARID1AについてCas9RNP Synthegoキットを使用説明書に従って用いてノックアウトした。エレクトロポレーションを、A549細胞に対してPBS中でBioRad XCellを用い、標準パルスを用いて行った。キットからの最適なgRNAを、初めにT7E1及びTIDE計算を用いて評価した(https://tide.nki.nl/)。その後、フローサイトメトリー、並びに低コンフルエンスプレーティング及び手動クローニング選別を用いてMGT#1蛍光のバルク評価を行った。
【0255】
動物実験:全てのマウス研究を動物実験委員会によって承認されたプロトコルに準拠し、欧州連合による規則に従って行った。同所性神経膠腫異種移植片研究は、修正を加えて以前に記載されているように行った76。NOD-SCID-IL2Rg/(NSG)マウスをThe Jackson Laboratoryから購入し、特定病原体除去(SPF)条件で維持した。7週齢~12週齢の雄性及び雌性マウスを使用した。
【0256】
遺伝子ノックアウト:遺伝子ノックアウトは、Synthego Gene Knockout Kitを用いて行った。sgRNAをヌクレアーゼフリー1X Teバッファーに30 μMのストック濃度まで溶解した。Cas9ヌクレアーゼ-gRNAを6:1の比率で混合することによってRNP複合体を形成した。各RNP複合体を、Biorad GenePulser xCell(150ボルト、10 ms)を用いて2 mmキュベットにて1x PBS中で250K A549-MGT1#1にエレクトロポレーションした。エレクトロポレーション後に、10%ウシ胎仔血清及び1%ペニシリン/ストレプトマイシンを添加したRPMI中で細胞を培養した。エレクトロポレーションのおよそ7日後に、Invisorbスピン組織単離キット(Stratec)を用いてgDNAを抽出し、50 μlの溶出バッファー中で溶出させ、gRNA標的遺伝子座を中心とする800 bp~1200 bpの産物を用いて対象の標的遺伝子に対するPCRを行った(要請に応じて利用可能なプライマー)。ノックアウト効率を、TIDE(NKI)及びT7EIアッセイを用いて算出した。個々のクローンを確立するか、又はBD LSRFortessa及びFlowJoプログラムを用いたFACSによってバルクKO細胞を直接アッセイした。
【0257】
実施例1:多形性膠芽腫(GBM)腫瘍細胞についてのサブタイプ特異的合成遺伝子座制御領域(sLCR)を含む発現カセットの設計
高度の細胞及び分子の異質性は、固形腫瘍における標準療法に対する耐性に寄与すると考えられ、標的化アプローチの開発に対する障害を引き起こす。多形性膠芽腫(GBM)は、最も一般的な原発性成人脳腫瘍であり、極めて不均一であり、療法に耐性を示す13。GBMも最も高度のゲノム及びエピゲノムの特性評価を有する癌の1つである14~16。トランスクリプトームに基づいて、GBM腫瘍が反復的に3つのサブタイプに分類され、間葉及び前神経が大抵は交差検証された52,53,54。幾つかの研究で、サブタイプ特異的遺伝子発現シグネチャー及び療法に対する応答差並びに患者の全体的生存の間の相関に関して議論されている。これにより、GBMサブタイプ同一性及び運命変化が治療可能性を有し得ることが示唆される。GBM腫瘍内で、主要サブタイプ及び異なるサブタイプ同一性を有する腫瘍細胞が共存し得る17,18。さらに、腫瘍は、再発時に優性発現プロファイルが変化し得る19,20。
【0258】
以前の系統追跡は、本発明者らのマウスモデルにおけるGBM生物学の理解に大きな影響を与え、特に個々のサブタイプの細胞起源5、及び異常な恒常性調節がin vivoでの標準治療に対する応答にどのような影響を及ぼし得るか10に関して情報を与えた。
【0259】
本実施例では、ヒトGBMの分子サブタイプの根底にある生物学的原理を達成するために、複雑な発生状況及び疾患状況における任意の細胞状態又は転換を遺伝的に標識し、この系を試験するための合成系を設計するシステム生物学アプローチを説明する。
【0260】
初めに、サブタイプ特異的GBM遺伝子がサブタイプ同一性を特定するために必要とされる調節活性(すなわちシス調節要素)を実質的に有すると想定した。各サブタイプにおいて発現された転写因子遺伝子(TF)が主にサブタイプ同一性の確立及び維持に関与することを更に想定した。
【0261】
最小シグナル伝達及び調節情報を妨害する遺伝子カセットを設計するために、TCGAデータセットの他の全てのサブタイプと比較して最高の倍率変化を有するサブタイプ特異的GBM遺伝子を決定した
16。MES、CL及びPNサブタイプ特異的遺伝子のコーリングは、任意の厳しいカットオフを用いて達成することができる(すなわち6超のLog2 FC;
図6)。同様に、あまり厳しくないカットオフ(すなわち0超のLog2 FC)及び標準的な経路分析ツール(例えばIngenuity Pathway Analysis、DAVID等)を用いてTFを特定することができる。初めに、細胞の自律的調節に焦点を合わせるための尺度として、本発明者らの以前の実験からのGBM幹様細胞(GSC)において低発現の遺伝子(例えば100万当たり4未満のカウント(CPM))を捨てた(
図6)。方法の現在の実装形態では、例えば神経膠腫固有のシグネチャーとしてシングルセルRNA-seqプロファイルを用いる
14。
【0262】
サブタイプで差次的に調節される遺伝子(DGR)において高い固有のシス調節能を有するゲノム領域を特定するために、各サブタイプにおいて発現されたTFと関連する最良の位置重み行列(PWM)について全てのペア頻度を計算した(
図1a)。シス調節DNAがヌクレオソームフリー領域(NFR;147 bp超)であることが多く、平均して約1000 bpを含むことから
21、これらの要素を正確に位置付けるために、150 bpステップで1 kbのスライディングウィンドウアプローチを設定した。DRGを潜在的に調節するシス単位の検索を、遺伝子開始/終了からの距離を任意に10 kb超に設定して、ENCODEコンソーシアムによって決定された2つの外部CTCF結合部位によって区切った
22,23。これらの基準により、所与の遺伝子座についてのシス調節要素内の接点の大部分を含有すると考えられ、CTCFを境界タンパク質として使用するトポロジカル関連ドメイン(TAD)の機能定義を近似する
24。
【0263】
上記のTFBS分析を用いてサブタイプ特異的発現を誘導する合成シス調節要素を組み立てるために、かかる合成遺伝子座制御領域(sLCR)は、理想的にはシス単位の最小セットを最大数(i)及び多様性(ii)で含むものとする。理想的には、1つのsLCRを構成する少なくとも1つのシス単位は、天然の転写開始部位(TSS)も含み、報告される要素のすぐ上流に配置される(
図1a)。これらの基準を用いて、MES、CL及びPN GBMの遺伝子追跡のためのsLCR、以下、MGT、CLGT及びPNGTを生成した。アルゴリズムを用いて決定を最小限に抑え、sLCR生成を自動化することができる(
図7a)。これらの遺伝子を潜在的に調節するTFBSのペアワイズ相関から、幾つかのTFが他のTFBSクラスターから離れてクラスター化することが明らかになる(
図1b)。この観察は、ChIP-seq実験からの実験的観察と一致し、本発明者らの手順が機能的に及び構造的に関連したゲノム調節の原理と同調した結果を返したことが示される。さらに、複数の細胞株におけるENCODE ChIP-seqデータも個々のシス単位に対する実際のTFの結合を支持する(
図9)。重要なことには、主に独立した個々のシス単位によって組み立てられた、それぞれ長さが僅か827 pb及び1015 bpの異なるMGT#1及びMGT#2 sLCRは、全体的調節能の最大60%を占めることができる。
【0264】
実施例2:sLCRとしてMGT#1を含むレンチウイルスベクターを用いたヒト神経膠腫始原細胞における間葉運命の遺伝的追跡
MGT#1等のsLCRを保有する典型的なレンチウイルスベクターは、蛍光レポーターmVenus又はmCherryのサブタイプ発現を誘導する。in vivoでの遺伝子追跡を容易にするために、mVenusを細胞膜に指向し(Igkリーダー及び血小板由来成長因子受容体(PDGFR)膜貫通配列タグ付けによる;
図1c)、mCherryをNLSによって核に移行させる。レポーター発現とは独立してsLCRの蛍光可視化及び選別を可能にするために、ユビキタスPGKプロモーターによってH2B-CFP融合を発現する第2のカセットも含めた(
図1c)。
【0265】
プロトタイプ試験として、MGT#1-mVenus sLCRを用いてHEK293T細胞においてレンチウイルス粒子を作製し、ウイルス粒子を用いてMES遺伝子型を有するヒト神経膠腫始原細胞(MES-hGIC)に感染させた。膜mVenus発現が一過性トランスフェクション及び安定して形質導入した腫瘍様塊の凍結切片の両方で観察された(
図1d)。
【0266】
次に、準同質遺伝子の特性評価されたMES-hGIC及びPN-hGICにMGT#1レンチウイルス粒子を形質導入した。PN-hGICは、PN GBMにのみ見られるIDH1及びTP53点突然変異の組合せを有し、MES-hGICは、MES GBMバックグラウンドを特徴付けるTP53、PTEN及びNF1の三重ノックダウンを有する。興味深いことに、MES-hGICにおける基礎蛍光の軽微であるが測定可能な増大が観察され、MGT#1がこれらの細胞におけるより高い固有の基礎シグナル伝達を反映することが示唆された(
図1e)。TNFαは、重要なMES-GBMシグナル伝達経路とみなされ、PNからMESへの転換を誘導することができるため
20、次に、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
lowのいずれかをTNFαに曝露することによってMGT#1がMES GBMシグナル伝達を忠実に再現するかを試験した。TNFの存在下では、MGT#1 sLCRの少なくとも2つのシス単位がTNFにより誘導されるNFkBTFに直接関与することが以前に示されている。TNFαが各親対照と比較して両方の細胞型において蛍光の増大を誘導することが再確認された。興味深いことに、FACS選別工程により同一のMGT#1発現の基礎レベルが両方の細胞型に存在することが確認されたにも関わらず、MES-hGIC-MGT#1
lowがMES-hGIC-MGT#1
highに変わり、PN-hGIC-MGT#1
lowは、PN-hGIC-MGT#1
medレベルにしか達さず(
図1e及び
図1f)、MES GBMサブタイプ特異的発現のMGT#1レポーターが実証され、この系を活用してhGICの適応応答がそれらの腫瘍遺伝子型に刻まれることの証拠が提供された。
【0267】
ヒトGIC及びGSCを、塩基性FGF及びEGFを添加した無血清Neurobasal培地を表す「NBE」条件下で一貫して増殖させる
25。PDGF-AAがGBMにおいて遺伝子増幅することが最も多いシグナル伝達経路であることから、GICにPDGF-AAを更に添加する
26。本発明者らの遺伝学的戦略を用いてMES-GBMシグナル伝達の基底状態を調査するために、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞においてミディアムスループットサイトカインスクリーニングを行った。GICを標準条件下で増殖させ、それらを384ウェルフォーマットで再播種した。次に、GICを生物学的及び技術的複製での個々のサイトカインで刺激し、続いて所定の経時的実験において連続的蛍光ボトム読み取りを行った。典型的な実験では、刺激による最長48時間のMGT#1蛍光発光を縦断的に取得した後、蛍光をナイーブGICに対して正規化した。以前の報告及び上述の実験と一致して、MES-hGIC-MGT#1
lowは、TNFαシグナル伝達の存在下でMES-hGIC-MGT#1
highに変わった(
図2a、
図8)。このため、MGT#1は、異なる遺伝子型を有する腫瘍細胞間での外部シグナル伝達に対する応答差についての情報を与える。さらに、MGT#1は、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞の成長及びサブタイプ同一性を支持する関連のシグナル伝達を特定するスクリーニング構成の確固たる根拠である。
【0268】
実施例3:GICにおける固有応答及び適応応答を調査するための読み出しとしてのMGT#1及びMGT#2 sLCRの使用
同じ実験条件下で、第2の独立したレポーター(MGT#2)は、遺伝子発現プロファイルから開始して機能的なsLCRを生成する能力を支持する一貫した結果を示した(
図2a)。興味深いことに、MGT#1及びMGT#2レポーターの両方が、FBSが間葉分化を誘導することが可能であり、これがTNFαの場合とは異なり、目視検査及びフローサイトメトリーによって判断されるようにGIC分化を伴っていたことを示した(データは示さない)。この発見は、実際にFBSの既知の構成要素であるTGFB1の存在によっては部分的にしか説明することができない。実際に、TGFB1は、間葉誘導因子であるが、MGT#1を強く誘導せず、同じ時間枠で精製サイトカインとして使用した場合に分化を促進しない(
図2a)。おそらくは、より興味深いことに、このFBSについての観察は、MES GBMシグネチャーがマウス脳細胞のいずれにおいても見られず、FBS培養された星状膠細胞においてのみ見られるというTCGA報告と極めて一致する
16。
【0269】
神経膠腫のマウスモデルにおけるTNFαのin vivo供給源は、腫瘍微小環境(TME)、特に膠芽腫関連ミクログリア/単球(GAM)と考えられる
27。TNFα発現は、hGAMにおいても観察されている
28。興味深いことに、GAMによるIDH1野生型GBM浸潤は近年、NF1欠損及びMEG GBMサブタイプ同一性と関連付けられている
14。GBMに動員されるGAMがNF欠損GBM細胞におけるMES分化を誘導するという仮定に対する実験的確証を得るために、GBMの患者から精製したMACS精製CD11b細胞とのIDH1野生型及びNF1枯渇MES-hGIC-MGT#1dim細胞のin vitro共培養を行った。際だったことに、CD11b+hGAMとのhGIC-MGT#1dim細胞の共培養により、IL-6刺激の存在下でMGT#1発現が誘導された(
図2b)。IL-6は、GAM
29を刺激することが以前に示されており、GSC
30又はTMEに由来する間葉幹細胞
31のいずれかによって産生され得る。注目すべきことに、hGAMは、非刺激の場合にも、別のGSC由来炎症誘発性因子であるTLR4内因性リガンドのテネイシン-C(TNC
32)に曝露した場合にも、MES-hGICにおいてMGT#1発現を誘導するには不十分であった
33。さらに、TNFαは、hGAMの存在に関わらずMES-hGICにおいてMGT#1誘導を誘導した(
図2b)。このため、本発明者らのデータにより、IL6シグナル伝達を中心に展開し、MES GBM特異化をもたらすGBM TMEにおける潜在的な細胞クロストークが明らかになる。これらのデータにより、ex vivoで細胞非自律的相互作用を機構的に分析するsLCRの可能性も強調される。
【0270】
本発明者らのデータから、GICにおける固有応答及び適応応答を調査するための有効な読み出しとしてのsLCRが支持されるが、この読み出しがレポーターの単独調節に大いに制限されるという可能性は排除されない。レポーター調節が細胞同一性の差を伴うかを理解するために、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞において免疫ブロット法、包括的遺伝子発現プロファイリング及び標的化mRNA検証を行った。試験した全ての実験手段によって、同じ実験条件下で増殖させたにも関わらず、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞は、限定されているが測定可能なシグナル伝達経路活性化及び遺伝子発現の基本的な差を一貫して示した(
図2c-d-e-f)。注目すべきことに、TNFα刺激は、両方の細胞型でNFkB-p65、STAT3及びp38-MAPKのリン酸化を誘導したが、これにより著しく異なる遺伝子発現アウトプットが生じた(
図2c-d-e-f)。このため、MGT#1は、活性シグナル伝達(例えばTNFα)の影響についての情報を与え、既存の状況に依存する差が適所にある場合であっても同様の細胞運命転換を反映する(例えば、間葉シグナル伝達増幅又は転換)。興味深いことに、包括的及び標的化の両方の遺伝子発現プロファイリングにより、TNFαがPN-hGICをナイーブ状態のMES-hGICにより近い状態に指向することが示唆された(
図2c-d-e-f)。
【0271】
実施例4:外界からの刺激(例えば電離放射線)がGBM細胞自律的に間葉分化転換を誘導し得るかを機能的に試験するためのMGT#1の使用
GBMにおける間葉分化は、当初は放射線療法後の再発時の主要なイベントとして記載されており
19、後にTNFにより誘導されるNFKB活性化による獲得放射線耐性と関連付けられている
20。相関的証拠により炎症性シグナル伝達、EMT及び放射線耐性の間の関連性が繰り返し支持される
34。照射が間葉分化転換を細胞自律的に誘導し得るかを機能的に試験するために、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞を単独で又はTNFαと組み合わせて電離放射線(IR)に曝露した。この実験については、2つの理由:(i)これが亜致死的であることが実験的に決定されたこと(単独で、及びTNFα又はテモゾロミドを含む他の処理と組み合わせて;データは示さない)、及び(ii)10 Gyが、複数のヒトGSCにおいて固有の放射線耐性及び修復能の増強の手段として二次応答を引き起こすことが実験的に証明された線量に近いことから10 Gyの単一放射線量を照射することを中心に展開した
34,35。照射の24時間後の残存DNA損傷マーカーH2Aのリン酸化から、二重鎖切断及び修復の両方の発生が確認された。しかしながら、少数のGICしかいずれかの遺伝的背景からMGT#1
high状態に変わらなかった(
図2g及び
図2h)。むしろ、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞の両方が、TNFαと組み合わせて間葉分化の増強を示し、TNFシグナル伝達及びIRがこの細胞運命特異化を協調的に誘導することが示された。まとめると、これらのデータにより、亜致死的IRが他の機構と協調してGBMにおける間葉転換を誘導するという結論が支持される。データにより、NFKB活性化が遺伝毒性ストレスによって引き起こされる非標準シグナル伝達の結果として増強されるという推測も支持される
36。
【0272】
実施例5:sLCRを用いたGBMサブタイピング及びリプログラミング
前神経GBMは、一般的なGBM祖先サブタイプであり、またオリゴデンドロサイトの起始細胞を反映すると考えられている
26,37。以前の研究から、FBS中での長期にわたる増殖が個々の細胞株の表現型同一性に影響を及ぼすことが明らかになった
25,16。PN sLCRが前神経状態を反映するかを試験するために、PN同一性の原因となるマスターTFを用いてFBSにより誘導される従来の細胞株のPN-GICへのリプログラミングを誘導することにした
38。この目的で、MGT#1又はPNGT#2のいずれかを、PN表現型と関連する可能性が高いTP53突然変異を特徴とするT98G細胞株(https://portals.broadinstitute.org/ccle)に形質導入した
16。遺伝子型による予測と一致して、FBSからNBE増殖条件へと切り替えた場合に、T98細胞はPNGT#2の基礎発現を示したが、MGT#1の発現は示さなかった(
図3a及び
図3b)。重要なことには、SALL3、SOX2及びPOU3F2の一過性過剰発現は、PNGT#2活性化を更に増強したが、MGT#1発現に対して中立的であった(
図3b)。注目すべきことに、これらの一連の実験は、核局在シグナル伝達を有するmCherry蛍光タンパク質を用いて行われ、蛍光タンパク質強度(mCherryはmVenusよりも明るい)、局在化及び安定性(mVenusは膜貫通型であり、安定化している)が観察される表現型転換において主要な役割を果たすことが排除された。
【0273】
全体的に見ると、これらの実験から、GBM生物学において重要な役割を果たすことが知られる複数の内因性トリガー及び外部トリガーが、本明細書に記載のシステム及び合成生物学アプローチを用いることでGBM細胞における個々のsLCRによって妨害され得ることが示される。
【0274】
実施例6:MGT#1を用いた乳癌細胞及び肺癌細胞における上皮間葉転換の分析
間葉分化転換は、上皮起源の複数の腫瘍に乗っ取られる生理学的過程である39。本発明者らの遺伝子追跡戦略がGBM恒常性を逸脱するかを調査するために、次にMGT#1を十分に特性評価された上皮及び間葉乳癌細胞に形質導入する。
【0275】
腫瘍サブタイプは、乳癌細胞において遺伝子学的に刻み込まれる
40。1回目のレンチウイルス形質導入の後、上皮MCF7細胞は、EMTを経たと考えられるMDA-231細胞と比較してより低いMGT#1発現を一貫して示した(
図10a及び
図10b)。MGT#1発現がその実際の乳癌サブタイプ同一性を反映することを確認するために、上位のMCF7-MGT#1発現細胞及び中間のMDA-231-MGT#1発現細胞をFACS選別し、サブクローニングした。それにもかかわらず、FACS選別集団の更なる増殖は、恒常性の事前選別を再構築し、MCF7がMDA-231よりも低レベルのMGT#1を発現した。EMT誘導因子TGFB2による短期処理がMCF7とMDA-231とのどちらにおいても基礎MGT#1蛍光を強く変更しなかったことから、かかるレベルは安定しているように思われた(
図4a)。
【0276】
Ezh2阻害は、幾つかのマウス及びヒト肺癌細胞においてKrasにより誘導されるEMTを支持し得る
41。この状況で、生物学的及び化学的刺激に対する細胞応答及び分子応答を反映するsLCRの使用を試験した。以前の発見と一致して、上皮A549細胞における縦断的測定により、高いMGT#1蛍光がEzh2阻害剤GSK126及びTFGBシグナル伝達によって協調的に誘導されることが明らかになった(
図4b)。
【0277】
TGFBシグナル伝達に曝露した上皮肺癌細胞は、それらの形態を容易に変化するとともに、フローサイトメトリーによって判断されるように高レベルのMGT#1を発現し始めた(
図11a及び
図11b)。興味深いことに、初期の時点では、フローサイトメトリーにより、TFGBシグナル伝達及びGSK126によるEzh2阻害が分子転換を同程度まで誘導するが、GSK126が細胞形態の変化を誘導しないことが明らかになった。組合せ状況では、TFGBシグナル伝達及びGSK126は、MGT#1活性化を相乗的に誘導し、中程度の形態変化も観察され(
図11a及び
図11b)、GSK126がTGFBシグナル伝達以上の増幅因子として以外の付加的な機構によってEMTに寄与するという興味深い可能性が高まった。
【0278】
実施例7:NSCLC細胞における上皮間葉転換のシグナル伝達及び遺伝的基礎の調査のためのEzh2阻害及びMGT#1の使用
NSCLC細胞におけるEMTのシグナル伝達の基礎を明確にする枠組みとしてEzh2阻害及びMGT#1を利用するために、次に、GSK126及びビヒクルで処理したA549-MGT#1
low細胞においてサイトカインスクリーニングを行った。上述のデータ及び近年公開された本発明者らの観察結果(Serresi et al., J. Exp. Med, 2018, doi:10.1084/jem.20180801)と一致して、TNFαは、上皮肺癌細胞においてもMGT#1発現に対する主要なシグナル伝達であることが証明され、縦断的ミディアムスループットマイクロプレートリーダースクリーニングにおいて測定される高い全体的蛍光アウトプットに対するGSK126の適度な相加効果が見られた。同時に、GSK126が存在する場合にA549細胞が細菌LPSによるTLR刺激に異なって応答することが確認され、これらの実験条件下でも、TGFB1がGSK126と組み合わせた場合により実質的にMGT#1を誘導することが示される。幾つかのサイトカイン及びそれらの組合せを用いたスクリーニングの体系的分析から、Ezh2阻害がEMTへの外部シグナル伝達に対する転写応答を増強することが明らかになる(
図12)。まとめると、MGT#1応答により、複数のシグナル伝達経路がEMT中に合流し得ることが示され、転写阻害が細胞準安定性を制御することが示唆される。
【0279】
次に、NSCLC細胞におけるEMTの遺伝的基礎を明確にするハイスループットスクリーニングの枠組みとしてEzh2阻害及びMGT#1を利用しようとした。初めに、A549及びH1944 Kras誘導NSCLC細胞にMGT#1レポーターを形質導入した。続いて、両方の細胞株にTet誘導性KRAB-dCas9、及び全部のヒトキノーム(合計で543個の遺伝子、5901個のgRNA;約5個のgRNA/遺伝子)を標的とするsgRNAのライブラリーを導入した。さらに、スクリーニング手順の対照として働く必須及び非必須遺伝子を標的とするgRNAも含めた。この系は、個々の細胞における個々の遺伝子の系統的ノックダウンを可能にする(
図4c)。以前に記載されているようにGSK126処理を適用することで、蛍光レポーターの発現を支持する能力が改善又は低下し、上皮又は間葉表現型を示したNSCLC細胞をFACS精製した(
図4d及び
図4e)。遺伝子セット富化分析により、非必須遺伝子ではなく必須遺伝子がインプット集団と比較して両方の細胞株においてin vitroで顕著に枯渇していることによって判断されるスクリーニングの全体的品質が支持された(データは示さない)。A549-MGT#1
low及びH1944-MGT#1
lowを、それらのMGT#1
high対応物と比較することで、両方の細胞株において2つの状態のいずれか1つで統計的に異なって富化又は枯渇した少数のgRNAのみを検索し(14/5912、0.24%)、殆どのヒトキナーゼがGSK126により誘導されるEMTに不必要であることが示された。しかしながら、2つのgRNAは、どちらも統計的に有意であり、高い倍率変化とA549-MGT#1
low及びH1944-MGT#1
low細胞との関連を示し、それらの発現がEzh2阻害時の肺癌細胞EMTを可能にするキナーゼ関連遺伝子の転写抑制をもたらし得ることが示された(
図4e)。興味深いことに、或るgRNAが、NF-kBにより誘導されるEMTを増強することが以前に報告されているACVR1受容体を標的とし
42、或るgRNAが、肺癌におけるEMTの制御の明白ではない候補であったRAS依存性シグナル伝達に関与する足場タンパク質であるCNKSR2を標的とする。従来のCRISPR/Cas9技術を用いてスクリーニングの結果を検証し、2つの独立したクローンであるCNKSR2 KOクローンが、親対照と比較して、Ezh2機能喪失表現型に必要とされることが予想されるARID1A KOと同様の上皮特徴の増強を示した(
図4f)。RASにより誘導されるEMTは、Hippo経路によって生じることが以前に示されている
43。sLCRの能力を用いて生成した本発明者らのデータから、RAS/MAPK依存性シグナル伝達によってEMTに直接寄与し得る付加的な機構が明らかになる。
【0280】
まとめると、3つの異なる癌型における上皮間葉転換によって得られた結果から、腫瘍のかかる恒常系を明らかにする本発明者らのsLCRの組織非依存性の能力が強調される。
【0281】
実施例6:in vivoでの腫瘍恒常系の遺伝子追跡レポーターとしてのMGT#1
ex vivoでの細胞状態及び分子状態の分析におけるsLCRの有用性が実証されたため、次に、in vivoでの腫瘍恒常系の遺伝子追跡レポーターとしてのMGT#1の役割を試験しようとした。MES-hGIC-MGT#1
dim細胞をNSGマウスの頭蓋内に移植し、腫瘍形成を縦断的にモニタリングした。高悪性度病期の神経学的兆候の発現時に、動物を屠殺し、組織化学的及び免疫組織化学的並びに内因性及び表面マーカー分析を行った。組織学的には、全ての腫瘍がグレードIVのGBMとして現れ、マウス脳の大部分に悪性細胞が浸潤し、広範な増殖及び浸潤が示された(
図5a)。各動物(n=10)について、画像誘導下腫瘍切除を用いて、浸潤した脳組織を保持しながら単一細胞調製物を生成した。免疫組織化学的染色により、MGT#1発現細胞が腫瘍塊において作為的に分散するが、浸潤先進部(invasivefront)にかなりよく制限されることが明らかになった(
図5a及び
図5b)。
【0282】
ウイルスに対する応答、クロマチン修飾及び遺伝子サイレンシングが、全てsLCR発現に潜在的に影響し得ると仮定して、MGT#1が機能的な腫瘍内異質性を反映することを確認し、MGT#1発現細胞が単にエスケーパー(escapers)であることを排除するために、2つのアプローチを用いた。初めに、他のマーカー及びMGT#1非依存性H2B-CFPの発現に対するMES GBMシグナル伝達が存在しない全ての高密度領域を検査した。チューブリン染色を用いた免疫染色において染色された腫瘍組織の大部分に抗原がアクセス可能であることが確認され、クロマチン凝縮によって活性増殖が推定され得る幾つかのMGT#1「暗」細胞が実際にH2B-CFP陽性であることが確認された(
図5c及び
図5d)。第2に、フローサイトメトリーによって並行in vitro/in vitro表面マーカー及び内因性分析を行った。免疫組織化学的染色と一致して、内因性mVenus蛍光発現は、in vivoで顕著な異質性レベルを示した。in vitroで増殖させたMES-hGIC-MGT#1
dim細胞と比較して、異種移植片由来腫瘍細胞は、明るいMES-hGIC-MGT#1細胞の小さな集団を示し、腫瘍細胞の大部分がMGT#1
low又は暗状態へと切り替えられた(
図5e)。患者由来異種移植片の腫瘍増殖細胞を標識するために日常的に使用される細胞表面受容体CD133は、in vitroでの全体的CD133
high集団から低い又は陰性の状態への同様の切り替えを示した。注目すべきことに、CD133発現細胞は、同等の割合のMGT#1発現及び非発現細胞を含み、機能的異質性を示すMGT#1の能力が支持された(
図5e)。
【0283】
全体的に見ると、本発明者らの実験から、腫瘍内異質性を説明するsLCRの能力が強調される(
図5f)。
【0284】
本発明の実現可能性及び実装形態を実証する更なる実験:
実施例7:合成遺伝子座制御領域(sLCR)の更なる特性評価
sLCRは、位置非依存性の細胞型及び発生段階特異的発現を示し、転写工場に関与するα-グロビンLCR等の内因性CREを模倣するように設計される。これらの要素は、スーパーエンハンサーとして定義されることが多く、活性化補助因子点に凝縮する。sLCRが内因性LCRと特徴を共有するかを試験するために、RNA-FISHによってMGT#1形質導入細胞中の新生RNAを測定し、IFを用いてBRD4又はMED1凝縮物を検索した。二重IF及びRNA-FISHにより、固定されたMGT#1発現腫瘍細胞においてBRD4又はMED1とMGT#1の新生RNAとの間の共局在化が特定された(
図1g)。さらに、誘導性MGT#1により誘導されるmVenus及び「ハウスキーピング」PGKにより誘導されるH2B-CFP mRNAの両方が腫瘍細胞の細胞質に存在していたが、mVenusのみが核内で検出可能であり(
図16)、2つのCREの強度差が示された。
【0285】
次に、高コピー数のPDGFRA、c-Myc及びCDK4を獲得した前神経(PNGT#1-2)及び間葉(MGT#1-2)sLCRレンチウイルス粒子を自発的に不死化したヒト神経前駆細胞に形質導入した。共通のPN及びMES GBM遺伝的背景を要約するために、PTENが枯渇し、IDH1
R132及びTP53
R273H点突然変異を有するか、又はTP53及びNF1が更に枯渇するようにhGICを更に改変することで、PN-hGIC及びMES-hGICをそれぞれ生成した。これらの細胞は、GBM患者と同様のDNAメチル化プロファイルを示し、in vivoでサブタイプ特異的遺伝子発現を獲得し、したがって2つの異なるGBMサブタイプを表す。in vitroで成長因子によって規定される条件下で、PNGT#1-2が両方の細胞型で強い発現を示し、MGT#1-2が両方の遺伝子型で低い全体的発現を示し、異なる調節ネットワークに対する設計特異性が強調される。注目すべきことに、MGT#1は、MES-hGICにおいてPN-hGICと比較してより高い基礎発現を有し、遺伝子型特異的応答が示された(
図1h)。
【0286】
これにより、内因性CREの重要な特徴を保持しながら所与の細胞同一性を反映する合成LCRを系統的に生成する方法を考案した。
【0287】
実施例8:sLCRによる機能的レポーター活性を支持する付加的な証拠
MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞における外部シグナル伝達に対する適応応答を調査するために、次に表現型スクリーニングを行った。NBEで増殖させたhGICを、選択された因子(サイトカイン、成長因子、化合物)で刺激し、刺激の48時間後にFACS分析した(
図13b)。ナイーブhGICに対して正規化すると、sLCRは、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
lowにおいて、並びにヒト血清又はFBS及びMES-GBM調節因子としてのアクチビンAに対して共通及び個別の応答を示し、TNFαシグナル伝達が強調された。この結果は、2つの独立したMES-GBM sLCR(MGT#1-2)及び追跡検証において再現可能であった。代わりに、PN表現型は、外部シグナル伝達によって誘導される変化に対する反応性が低いようであった(
図13b及び
図13c及び
図17)。MES GBM特異化は、CD133及びPNGT#2の表面発現によって判断されるように既存の内因性表現型に対して相加的であるようであった。実際に、TNFαは、重要なMES-GBMシグナル伝達経路及びPNからMESへの転換の誘導因子として以前に報告されている。さらに、NFkB(既知のTNF誘導TF)は、TNFα刺激時にMGT#1 sLCRに含まれるCREの少なくとも2つに関与することが見出された(
図9b)。MES-hGIC-MGT#1
lowと同等のレベルのMGT#1発現を有する、FACSにより選別されたPN-hGIC-MGT#1
lowは、依然としてTNFαに対する同様の応答に達しなかった(
図2g及び
図8及び
図13a)。一貫して、同じシグナル伝達条件下で増殖したにも関わらず、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞は、内因性発現及び選択されたシグナル伝達経路の活性化の差を示した(
図2)。TNFα刺激により、両方の細胞型においてNFkB-p65、STAT3及びp38-MAPKのリン酸化が誘導されたが、これにより著しく異なる遺伝子発現アウトプットが得られた(
図2d)。これらの分析から、TNFαがMES-hGICにおいてMES GBMシグネチャーを誘導するが、PN-hGICがナイーブMES-hGICに類似した状態を生じることが示唆される(
図2e及び
図2f)。まとめると、本発明者らの結果から、sLCR MGT#1-2が内因性間葉GBM遺伝子発現プログラムを反映し、シグナル伝達経路(例えばTNFα)の活性化状態、及び任意の既存の状況依存性の差(例えばMES対PNのバックグラウンド)を捕捉することが示される。
【0288】
分化促進シグナル伝達(すなわちヒト血清又はFBS)がレポーター活性化を誘導するという観察結果は、MES-GBMシグネチャーがマウス脳細胞のいずれかではなくFBSで培養された星状膠細胞によって生じ得ることを示す以前の発見と一致する。注目すべきことに、ウォッシュアウト実験により、MES-GBM状態が数日間の時間枠で可逆的であることが示唆され(
図18)、MES GBM状態が獲得及び逆転し得ることが示される。
【0289】
GBMにおける間葉分化転換は、標準治療後の再発時の主要なイベントとして発見され、TNFにより誘導されるNFkB活性化による獲得放射線耐性と関連付けられている。炎症性シグナル伝達、EMT、自然免疫細胞浸潤及び放射線耐性の間の関連性が実質的な相関的証拠により支持される。照射が間葉分化転換を細胞自律的に誘導し得るかを実験的に試験するために、MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
low細胞を単独で又はTNFαと組み合わせて電離放射線(IR)に曝露した。MGT#1活性化は、単一線量又は分割線量を問わず、漸増IRに対して用量応答を示した(
図2g及び
図19)。MES-hGIC-MGT#1
low及びPN-hGIC-MGT#1
lowの両方の細胞が、TNFαと組み合わせて間葉分化転換の増強を示した。10 Gyの単一放射線量は、複数のヒトGSCにおいて亜致死的である。同様に、単独であるか、又は他の処理(例えばTNFα又はテモゾロミド)と組み合わせるかに関わらず、本発明者らのGICは、照射の24時間後に適合性を保持し、残存DNA損傷マーカーγH2AXのリン酸化を示し、二重鎖切断が生じ、修復下であることが確認された(
図2h)。
【0290】
標準NFkB活性化は、下流のTNFαシグナル伝達に、また非標準遺伝毒性ストレスによって生じ得る。固有の及び獲得されたMES-GBM状態におけるNFkBの重要性に対する実験的確証を与えるために、MES-hGICにおいてCRISPR/Cas9を用いてp65/RELAを欠失させ、固有のMGT#1発現の顕著な下方調節をもたらした(
図13c)。注目すべきことに、ポリクローナル及びモノクローナルRELA KO細胞においてMES-GBMシグナル伝達を誘導するTNFαの能力が著しく損なわれたが、IkBキナーゼ(IKK)阻害剤-16によりTNFαに対する適応応答が更に制限された。モノクローナルRELA KO GICでは、補償がRELA KOエスケーパーの結果として生じることが排除され、RELA KO細胞における他のNFkB転写因子がTNFシグナル伝達を形質導入し得ることが示唆された(
図19b)。
【0291】
患者においては、GBM幹細胞状態は、腫瘍恒常性の維持において遺伝子レパートリーに対して支配的である。次に、ゲノムワイドプールCRISPR/Cas9スクリーニングを行うことによってMES GBM状態を調節する遺伝子の発見にsLCRを使用することができるかを試験しようとした。MES-hGIC-MGT#1
lowにおける遺伝子スクリーニングは、それらのナイーブ状態で又は外部シグナル伝達若しくは遺伝毒性ストレスによってMES-GBM状態が誘導された場合に行った(すなわち、それぞれFBS+TNFα又はTNZ+IR;
図13d)。73179個のgRNAのうち、表現型スクリーニングにより、それぞれMGT#1高及び低群(factions)と関連する333個及び1164個のgRNAが返された(
図13e)。MGT#1発現に対するライブラリー及び処理の効果、適合性と関連するが、対照のものではない遺伝子の平均統計的枯渇、並びにナイーブ状態でのRELAを標的とする2つのsgRNAの枯渇(
図20a~
図20d)は全て、このスクリーニングによって機能的遺伝子を明らかにすることができることを示唆した。興味深いことに、PARP1及びEED等の幾つかの臨床的に関連する薬物標的は、全条件でMGT#1活性化の主要な調節因子であるが、増殖には重要でないようであった。PARP1活性は、IR誘導NF-kB活性化に必要であると報告され、ポリコーム抑制複合体2足場EED阻害は、他の状況でEMTを促進する。このアプローチが細胞運命の変化をもたらす薬理学的処理の優先順位を決めるために用いられ得るかを試験するために、ヒットの上流の調節因子を検索した。特に、幾つかのgRNAが、それぞれMGT#1低及び高画分の富化の統計的傾向を有する下流のRAR/RXRアゴニスト及びMEK1阻害剤の標的と以前に関連付けられている(
図13e及び
図20)。両方の薬物が細胞運命の決定に対して効果を有し得るという予測を確認するために、MES-hGIC-MGT#1をMEK1選択的阻害剤TAK-733又はAll-trans-レチノイン酸(ATRA)に曝露した。どちらの場合も、MES-hGIC-MGT#1は、短期TNFα刺激(4時間)に対して応答し、両方のMGT#1及びMES-GBM内因性マーカーの上方調節がTNFα単独と比較してより高く(
図13f)、前処理により、これらの細胞がMES GBMプログラム活性化に対して感作されることが示された。ATRA及びTAK-733により、MGT#1がEED/EZH2阻害剤GSK126よりも感作され、処理の特異性が支持される。このため、sLCRにより、適合性単独に基づく以前の大規模研究よりも優れたゲノム薬理学情報の表現型レイヤーが提供される。
【0292】
全体的に見ると、これらの結果から、一過性かつ可逆的な細胞状態であり、表現型スクリーニング用途における設計されたsLCRのロバスト性及び有効性を支持する間葉GBMの実験的証拠が与えられる。
【0293】
実施例9:sLCRは、分子的に多様な実体の識別を可能にする
原発性癌型は、それらの分子プロファイルに基づいてグループ分けすることができる。クロマチンアクセシビリティは、癌型類似性の最も強い予測因子であり、個々の癌型の共通次元空間におけるサブタイプ同一性の特定に用いることができる。sLCRによって示される獲得された異質性がゲノムワイドクロマチンアクセシビリティの変化を伴うかを調査するために、in vitro及びin vivoでMES-hGIC-MGT#1
high細胞に対してATAC-seqを行った。クロマチンアクセシビリティの示差分析により、特にPNからMESへの転換のドライバーWWTR1(TAZ)及び幾つかのTNF受容体遺伝子遺伝子座でリモデリングを受ける多くの遺伝子が明らかになり、生理学的に関連する腫瘍微小環境においてのみ生じるリモデリングイベントの遺伝子追跡が示された(
図14a及び
図14b)。TCGA及び神経膠腫幹細胞からのATAC-seqデータの統合により、MES-hGIC-MGT#1
high細胞が共通の神経膠腫空間内の特定の実体を表すことが更に明らかになった(
図14c)。重要なことには、MGT#1高及び低発現で除算されるGICの教師なしクロマチンプロファイリングにより、サンプルが規定のクラスターにグループ分けされ(
図14d)、MGT#1発現によりクロマチンアクセシビリティにおける特有のパターンの獲得が強調されることが示される。これらの結果により、腫瘍内異質性を明らかにし、原発性癌データとともに腫瘍モデルの徹底的な細胞及び分子の特性解析を可能にするsLCRの有効性が強調される。
【0294】
実施例10:sLCRは、腫瘍細胞と免疫細胞との間の細胞非自律的クロストークの治療との関連の発見を容易にする
膠芽腫関連ミクログリア/単球(GAM)によるIDH1野生型GBM浸潤は、近年、NF1欠損及びMES-GBMサブタイプ同一性と関連付けられているが、GAMとMES-GBMとの間に因果関係があるのかについては依然として解決されていない。自然免疫細胞がNF1欠損GBM細胞におけるMES分化転換によって動員されるのではなく、その原因となるという仮定を実験的に試験するために、IDH1野生型及びNF1枯渇MES-hGIC-MGT#1low細胞と不死化ヒトミクログリア細胞株(hMG;cl.C20)とのinvitro共培養を行った。
【0295】
初めに、GBM腫瘍様塊及び多細胞オルガノイド培養条件での単一細胞によるPN-sLCRの発現及びMES-sLCR発現の両方を比較した。スフェロイド培養が自発的分化及び細胞死が限定された幹細胞及び前駆細胞の増殖を支持するのに対し
50,51、神経膠腫オルガノイドは、表現型的に多様な細胞集団を生じる。in vivo発現パターンと類似して(
図14a)、MES-hGICがオルガノイド条件下及びヒトミクログリア細胞の存在下で、純粋なスフェロイド培養物におけるそれらの均一な発現とは対照的に、不均一なPN-sLCR及びMES-sLCR発現パターンを示すことが見出された(
図15a)。
【0296】
次に、trans-wellインサートを用いた均一なGBM腫瘍様塊とhMG細胞との共培養を設定した。著しいことに、hMG細胞は、MES-hGICにおいてMGT#1誘導をTNFαと同程度までもたらした(
図15b及び
図15c及び
図21)。以前の実験と一致して、hMGは、MGT#1をPN-hGICにおいてもより少ない程度で活性化した。対照的に、in vitroでヒトCD34+によって得られる骨髄由来サプレッサー細胞(MDSC)は、両方の株においてMGT#1発現を軽くしか刺激しなかった(
図21)。両方の条件によるMES-hGIC-MGT#1
high細胞の包括的トランスクリプトーム分析から、共通及び個別のNFκB関連遺伝子活性化が明らかになり、適応免疫細胞が、患者のシグネチャーと標的を大幅に共有する特定のMES-GBM状態を誘導するという証拠が得られた(
図15d)。興味深いことに、いずれかの細胞型によるTNFα発現の証拠は見出されなかった。むしろ、コレステロール生合成経路における遺伝子を特徴付ける代謝トランスクリプトームリモデリングは、hMG細胞との共培養に特異的なMES-hGICシグネチャーを構成するようであった(
図15e~
図15g)。これらのデータから、腫瘍細胞におけるNFkBの活性化が主に自然免疫細胞に起因することが示される。実際に、適応免疫系に由来する炎症性メディエーターIFNγ及びIL-2、並びに間質由来IL-6は、直接的なMGT#1活性化を同程度まで誘発しなかった(
図17)。まとめると、in vivoでMES-GBM状態をもたらすイベントのカスケードについての実験的洞察が得られる。
【0297】
EMTは、化学療法に対する耐性と関連付けられているが、治療機会ももたらす。DNA損傷ストレスは、Stuppプロトコルとも称されるGBMにおける標準治療の主要な治療成分である。GBMにおけるTNF-NFkBシグネチャーは、大きな患者コホート及びPDXモデルにおける間葉状態及び放射線耐性と以前に関連付けられている。このため、次に、ミクログリアにより誘導されるGBM状態の治療との関連を検証するためにMES恒常系を特定するsLCRの能力を利用した。
【0298】
この目的で、hMGにより誘導される変換後にMGT#1-2
high及びMGT#1-2
lowMES-hGIC及びPN-hGIC細胞をFACS選別し、これらの細胞を選択される一連の標準的な及び標的化化学療法剤に曝露した。著しいことに、それらのsLCR低対応物とは対照的に、MES-hGIC-MGT#1
high又はMES-hGIC-MGT#2
high細胞の両方が、DNA損傷ベースの治療剤(オラパリブ、ATR阻害剤VE-821、トポテカン、マイトマイシンC)及びコレステロール流出を調節するLXRアゴニストであるLXR623に対してより耐性を示すことが証明された(
図15h及び
図21)。重要なことには、MES-hGIC-MGT#1
high細胞は、BAY11-7085(IκB)、WP1066(STAT3;
図15h及び
図21)等の標的化剤に対する同様の感度プロファイルを保持した。MES-hGIC-MGT#1
highの化学的感受性プロファイルの変化は、MES-hGIC-MGT#1
high細胞におけるDNA損傷遺伝子シグネチャー発現の低下を含むhMG細胞によって誘導される遺伝子発現の変化と一致し、細胞周期プロファイルは、患者由来MES-GBMの過剰発現及びコレステロール生合成シグネチャーとともにシフトする(
図21)。同様の結果が前神経遺伝子型によって得られ、hMG細胞がhGICを2つの機能的かつ治療的に異なる状態に分けることができ、腫瘍異質性と関連する複雑な応答をまとめる標的発見プラットホームにおけるsLCRの使用が支持されることが示された。
【0299】
まとめると、本発明者らの結果から、自然免疫細胞とMES-GBM状態とが偶然に関連付けられ、in vivo及びex vivoで関連の細胞非自律的相互作用を機構的に分析するsLCRの可能性が強調される。
【0300】
本発明の更なる利点及び実装形態:
生物レベルでの複雑な細胞機構及び分子機構の理解は現在、in vivo実験に大いに依存し、遺伝子追跡に利用可能な技術によって限定される。細胞固有及び細胞非自律的シグナル伝達を妨害することができる合成レポーターの生成を可能にするシステム生物学の枠組みを確立した。これらのsLCRを用いて、in vitro及びinvivoでの遺伝子型対分子及び細胞表現型転換を説明することができる。実験的には、sLCRは、化学的及びフォワード遺伝子スクリーニングによるものを含む生物学的、化学的及び環境的刺激と細胞運命転換とを関連付ける分子機構の特性評価に用いることができる。
【0301】
GBMサブタイプ発現プロファイルの細胞特徴及び分子特徴を調査するために、このアプローチを適用した。前神経及び間葉GBMサブタイプの特定は、発現プラットホーム(マイクロアレイ、RNA-seq)、読み出し(遺伝子発現、DNAメチル化)及び患者の集団(欧米人及び中国人)で一貫していた。このように大きな努力にも関わらず、GBMサブタイプの有意性は、それらの起源、位置又は時空間的進化に関しては分かりにくいままである。
【0302】
準同質遺伝子モデルとMES sLCRとを組み合わせることによって、MES-GBM特異化に対して最も顕著な構成要素が実際に適応可能であることが示される。MES-hGICによって例示される遺伝子型によって指示される固有のMESシグナル伝達が、PN-hGICと比較した場合に測定可能であるが、中程度のMES sLCRの発現の差を示すにも関わらず、TNFシグナル伝達及び分化促進刺激(例えばFBS)は、MESシグナル伝達の大きな要因である。興味深いことに、TNFα及びFBSは、どちらも細胞形態に差次的に影響を与えることによってMES分化転換を誘発する。どちらの種類の応答も、MGT#1発現における異質性の程度及び未分化の自己複製腫瘍細胞のマーカーによって推論されるようにin vivoで刻み込まれるようである。本発明者らの実験により、GBM細胞におけるMGT#1読み出しとCD44等の遊走関連マーカーの発現、炎症誘発性微小環境に対する応答及び亜致死量の遺伝毒性ストレスに対する耐性とが関連付けられ、これらは全て単一細胞レベルでのGBMにおけるものを含む腫瘍進行の特徴を表す18。これらの発見により、GBMにおける細胞機構及び分子機構を解明するMGT#1の能力が説明される。
【0303】
この技術によって、細胞及び分子のプロファイリングを表現型マップに変換することが可能になり、単一細胞レベルのものを含む健康及び疾患における細胞特徴及び分子特徴の連続マッピングと関連する実験的必要性を満たすことができる。実際に、sLCRにより、生物レベルでの複雑な細胞機構及び分子機構の十分な理解のための必須の工程を依然として表すin vivo表現型アッセイが改善される。その結果、大きなex vivo機会が与えられる。
【0304】
in vivo調節ネットワークを反映するsLCRが細胞固有及び細胞非自律的シグナル伝達を正確に妨害し、in vitro及びin vivoでの遺伝子型対分子及び細胞表現型転換の分析に首尾よく適用されたことが示される。GBMサブタイプ発現プロファイルの細胞基盤及び分子基盤を調査することによって、この系の有用性を実証する。前神経及び間葉GBMサブタイプの特定は、発現プラットホーム(マイクロアレイ、RNA-seq及びシングルセルRNA-seq)、読み出し(遺伝子発現、DNAメチル化)及び患者の民族性(欧米人及び中国人)で一貫していた。このように大きな努力にも関わらず、GBMサブタイプの有意性は、それらの起源、位置又は時空間的進化、より重要なことにはそれらの治療的意義に関しては分かりにくいままである。
【0305】
前神経及び間葉GBMプログラムは、特定の転写因子の活性に依存する。ここで、準同質遺伝子モデル及び細胞株とsLCRとを一体化したが、結果は、RTKシグナル伝達に強く依存し、したがって神経幹細胞培養条件によって促進される規定のGBM実体であるPN-GBMと一致する。代わりに、MES-GBM特異化に対して最も顕著な構成要素が実際に適応可能であることが示される。腫瘍微小環境の非存在下では、PN状態は、MEG-GBM遺伝子型(例えばNF1枯渇)を有する細胞であっても固有のようであるが、MES同一性は、急性炎症刺激及び分化促進刺激(例えば、TNFシグナル伝達及びウシ又はヒト血清)によって急速に増幅する。興味深いことに、異なる細胞型では、sLCRによって測定されるMES分化転換は、差次的に影響を及ぼす細胞形態とともに生じ得る。本発明者らの実験により、GBM細胞におけるMES-sLCR読み出し、炎症誘発性微小環境に対するフィードフォワード応答、亜致死量の遺伝毒性ストレスに対する耐性及びCD44等の遊走関連マーカーの発現が関連付けられ、これらは全て単一細胞レベルでのGBMにおけるものを含むヒト癌における進行の特徴を表す。これらの特徴は、in vivo及びex vivoでの腫瘍モデルにおけるクラスター細胞発現パターン(「恒常性」)及び異質性によって推論されるように、組織恒常性に刻み込まれるようである。
【0306】
3つの異なる癌型におけるMES-GBMの主要構成要素の遺伝子追跡により、腫瘍恒常系を明らかにする本発明者らのsLCRの組織非依存性の能力が強調され、EMTが発生細胞過程の乗っ取りを表すという更なる証拠が与えられる。これらの発見により、多因子疾患における細胞機構及び分子機構を解明するsLCRの多用途性が説明される。さらに、ゲノム薬理学におけるsLCRの使用は、表現型特異的依存性及び耐性を明らかにすることによってトランスレーショナル医療を顕著に加速し得る。
【0307】
最後に、sLCRにより、自然免疫細胞と腫瘍細胞との間の病態生理学的に関連する細胞非自律的相互作用の機構的分析が可能となった。GAMは、神経膠腫マウスモデル及びヒト腫瘍の両方においてTNFαの供給源を構成すると考えられる。本発明者らの結果から、MES-GBMサブタイプと特定の免疫状況との臨床的関連性に実験的確証が得られ、MESGBMへのTNFα非依存性経路が明らかになる。重要なことには、これにより特定されたGAMにより誘導されるMES-GBM状態は、個々の患者のシグネチャー自体と同等である患者のシグネチャーと或る程度の重複を示す。
【0308】
要約すると、sLCRは、化学的及び遺伝子スクリーニングによるものを含む生物学的、化学的及び環境的刺激と細胞運命転換とを関連付けることによる分子機構の特性評価に有用であることが示された。超並列シークエンシング又は混合モデルを用いて合成レポーターを生成する以前の試みから、このアプローチの潜在的用途及び設計制御の制限と関連する制約が明らかになった。本発明者らの方法は、この問題に実質的に対処し、基本設計の構成要素の線形改善(例えば、キュレートしたTFBS及びシス要素のリソースを用いる)から多数のsLCRの系統的生成及び検証に続く上首尾の特徴の機械学習に及ぶ今後の開発の基盤となる。同時に、ロバストな細胞型特異性又は状態特異性及び粒度は、sLCRとDNAバーコーディングとを組み合わせることによって拡張され得る。調節可能な操作は、sLCR転写インプットとブール論理アウトプットを可能にする合成エフェクタータンパク質とを合わせることで達成することができる。これにより、sLCRによる遺伝子追跡は、拡張可能であり、実質的に任意の所与の系にまで拡張し、exvivo又はin vivoを問わず、正常及び異常な恒常性を制御する細胞固有及び細胞非自律的機構を分析することができる。
引用文献
1. Kretzschmar, K.& Watt, F. M. Lineage tracing. Cell 148, 33-45 (2012).
2. Barker, N. etal. Identification of stem cells in small intestine and colon by markergene Lgr5. Nature 449, 1003-1007 (2007).
3. Barker, N., Tan, S.& Clevers, H. Lgr proteins in epithelial stem cell biology. Development140, 2484-2494 (2013).
4. Livet, J. et al.Transgenic strategies for combinatorial expression of fluorescent proteins inthe nervous system. Nature 450, 56-62 (2007).
5. Liu, C. et al.Mosaic analysis with double markers reveals tumor cell of origin in glioma. Cell146, 209-221 (2011).
6. Schwitalla, S. etal. Intestinal Tumorigenesis Initiated by Dedifferentiation and Acquisitionof Stem-Cell-like Properties. Cell (2012).doi:10.1016/j.cell.2012.12.012
7. Schepers, A. G. etal. Lineage tracing reveals Lgr5+ stem cell activity in mouse intestinaladenomas. 337, 730-735 (2012).
8. Driessens, G.,Beck, B., Caauwe, A., Simons, B. D. & Blanpain, C. Defining the mode oftumour growth by clonal analysis. Nature (2012). doi:10.1038/nature11344
9. Oshimori, N. &Fuchs, E. Paracrine TGF-β Signaling Counterbalances BMP-Mediated Repression inHair Follicle Stem Cell Activation. Cell Stem Cell 10, 63-75(2012).
10. Chen, J. et al.A restricted cell population propagates glioblastoma growth after chemotherapy.Nature (2012). doi:10.1038/nature11287
11. Zhu, L. et al.Multi-organ Mapping of Cancer Risk. Cell 166, 1132-1146.e7(2016).
12. Church, G. M.,Elowitz, M. B., Smolke, C. D., Voigt, C. A. & Weiss, R. Realizing thepotential of synthetic biology. Nat Rev Mol Cell Biol 15, 289-294(2014).
13. Stupp, R. etal. Effects of radiotherapy with concomitant and adjuvant temozolomideversus radiotherapy alone on survival in glioblastoma in a randomised phase IIIstudy: 5-year analysis of the EORTC-NCIC trial. Lancet Oncol. 10,459-466 (2009).
14. Wang, Q. et al.Tumor Evolution of Glioma-Intrinsic Gene Expression Subtypes Associates withImmunological Changes in the Microenvironment. Cancer Cell 32,42-56.e6 (2017).
15. Noushmehr, H. etal. Identification of a CpG island methylator phenotype that defines adistinct subgroup of glioma. Cancer Cell 17, 510-522 (2010).
16. Verhaak, R. G. W. etal. Integrated genomic analysis identifies clinically relevant subtypes ofglioblastoma characterized by abnormalities in PDGFRA, IDH1, EGFR, and NF1. CancerCell 17, 98-110 (2010).
17. Sottoriva, A. etal. Intratumor heterogeneity in human glioblastoma reflects cancerevolutionary dynamics. Proc Natl Acad Sci USA 110, 4009-4014(2013).
18. Lee, J.-K. etal. Spatiotemporal genomic architecture informs precision oncology inglioblastoma. Nature Genetics 49, 594-599 (2017).
19. Phillips, H. S. etal. Molecular subclasses of high-grade glioma predict prognosis, delineatea pattern of disease progression, and resemble stages in neurogenesis. CancerCell 9, 157-173 (2006).
20. Bhat, K. P. etal. Mesenchymal Differentiation Mediated by NF-κB Promotes RadiationResistance in Glioblastoma. Cancer Cell 24, 331-346 (2013).
21. ENCODE ProjectConsortium et al. Identification and analysis of functional elements in1% of the human genome by the ENCODE pilot project. Nature 447,799-816 (2007).
22. Thurman, R. E.,Day, N., Noble, W. S. & Stamatoyannopoulos, J. A. Identification ofhigher-order functional domains in the human ENCODE regions. Genome Res 17,917-927 (2007).
23. Kim, T. H. etal. Analysis of the vertebrate insulator protein CTCF-binding sites in thehuman genome. Cell 128, 1231-1245 (2007).
24. Ong, C.-T. &Corces, V. G. CTCF: an architectural protein bridging genome topology andfunction. Nat Rev Genet 15, 234-246 (2014).
25. Lee, J. et al.Tumor stem cells derived from glioblastomas cultured in bFGF and EGF moreclosely mirror the phenotype and genotype of primary tumors than doserum-cultured cell lines. Cancer Cell 9, 391-403 (2006).
26. Ozawa, T. etal. Most Human Non-GCIMP Glioblastoma Subtypes Evolve from a CommonProneural-like Precursor Glioma. Cancer Cell 26, 288-300 (2014).
27. Quail, D. F. etal. The tumor microenvironment underlies acquired resistance to CSF-1Rinhibition in gliomas. Science 352, aad3018 (2016).
28. Szulzewsky, F. etal. Human glioblastoma-associated microglia/monocytes express a distinctRNA profile compared to human control and murine samples. Glia 64,1416-1436 (2016).
29. a Dzaye, O. D. etal. Glioma Stem Cells but Not Bulk Glioma Cells Upregulate IL-6 Secretionin Microglia/Brain Macrophages via Toll-like Receptor 4 Signaling. J.Neuropathol. Exp. Neurol. 75, 429-440 (2016).
30. Inda, M.-D.-M. etal. Tumor heterogeneity is an active process maintained by a mutant EGFR-inducedcytokine circuit in glioblastoma. Genes Dev 24, 1731-1745 (2010).
31. Hossain, A. etal. Mesenchymal Stem Cells Isolated From Human Gliomas IncreaseProliferation and Maintain Stemness of Glioma Stem Cells Through theIL-6/gp130/STAT3 Pathway. Stem Cells 33, 2400-2415 (2015).
32. Midwood, K. etal. Tenascin-C is an endogenous activator of Toll-like receptor 4 that isessential for maintaining inflammation in arthritic joint disease. Nat Med15, 774-780 (2009).
33. Jachetti, E. etal. Tenascin-C Protects Cancer Stem-like Cells from Immune Surveillance byArresting T-cell Activation. Cancer Res 75, 2095-2108 (2015).
34. Stanzani, E. etal. Radioresistance of mesenchymal glioblastoma initiating cells correlateswith patient outcome and is associated with activation of inflammatory program.Oncotarget 8, 73640-73653 (2017).
35. Bao, S. et al.Glioma stem cells promote radioresistance by preferential activation of the DNAdamage response. Nature 444, 756-760 (2006).
36. Hinz, M. et al.A cytoplasmic ATM-TRAF6-cIAP1 module links nuclear DNA damage signaling toubiquitin-mediated NF-κB activation. Mol Cell 40, 63-74 (2010).
37. Lei, L. et al.Glioblastoma models reveal the connection between adult glial progenitors andthe proneural phenotype. PLoS ONE 6, e20041 (2011).
38. Rheinbay, E. etal. An Aberrant Transcription Factor Network Essential for Wnt Signalingand Stem Cell Maintenance in Glioblastoma. Cell Rep (2013).doi:10.1016/j.celrep.2013.04.021
39. Kalluri, R. &Weinberg, R. A. The basics of epithelial-mesenchymal transition. Journal ofClinical Investigation 119, 1420-1428 (2009).
40. Baird, R. D. &Caldas, C. Genetic heterogeneity in breast cancer: the road to personalizedmedicine? BMC Med 11, 151 (2013).
41. Serresi, M. etal. Polycomb Repressive Complex 2 Is a Barrier to KRAS-Driven Inflammationand Epithelial-Mesenchymal Transition in Non-Small-Cell Lung Cancer. CancerCell 29, 17-31 (2016).
42. Wamsley, J. J. etal. Activin upregulation by NF-κB is required to maintain mesenchymal featuresof cancer stem-like cells in non-small cell lung cancer. Cancer Res 75,426-435 (2015).
43. Shao, D. D. etal. KRAS and YAP1 converge to regulate EMT and tumor survival. Cell 158,171-184 (2014).
44. Ohinata, Y., Sano,M., Shigeta, M., Yamanaka, K. & Saitou, M. A comprehensive, non-invasivevisualization of primordial germ cell development in mice by the Prdm1-mVenusand Dppa3-ECFP double transgenic reporter. Reproduction 136,503-514 (2008).
45. Gargiulo, G. etal. In vivo RNAi screen for BMI1 targets identifies TGF-β/BMP-ER stresspathways as key regulators of neural- and malignant glioma-stem cellhomeostasis. Cancer Cell 23, 660-676 (2013).
46. Gargiulo, G.,Serresi, M., Cesaroni, M., Hulsman, D. & Van Lohuizen, M. In vivo shRNAscreens in solid tumors. Nat Protoc 9, 2880-2902 (2014).
47. Li, P., Markson,J.S., Wang, S., Chen, S., Vachharajani, V., and Elowitz, M.B. (2018). Morphogengradient reconstitution reveals Hedgehog pathway design principles. Science 360,543-548.
48. Blankvoort, S., Witter, M.P.,Noonan, J., Cotney, J., and Kentros, C. (2018). Marked Diversity of UniqueCortical Enhancers Enables Neuron-Specific Tools by Enhancer-Driven GeneExpression. Curr Biol 28, 2103-2114.e2105.
49. Takahashi, K., and Yamanaka,S. (2006). Induction of pluripotent stem cells from mouse embryonic and adultfibroblast cultures by defined factors. Cell 126, 663-676.
50. Suva, M.-L., Rheinbay, E.,Gillespie, S.M., Patel, A.P., Wakimoto, H., Rabkin, S.D., Riggi, N., Chi, A.S.,Cahill, D.P., Nahed, B.V., et al. (2014). Reconstructing and Reprogramming theTumor-Propagating Potential of Glioblastoma Stem-like Cells. Cell
51. Frith, M.C., Fu, Y., Yu,L., Chen, J.-F., Hansen, U., and Weng, Z. (2004). Detection of functional DNA motifsvia statistical over-representation. Nucleic Acids Res 32, 1372-1381.
52. Phillips, H.S., Kharbanda,S., Chen, R., Forrest, W.F., Soriano, R.H., Wu, T.D., Misra, A., Nigro, J.M.,Colman, H., Soroceanu, L., et al. (2006). Molecular subclasses of high-gradeglioma predict prognosis, delineate a pattern of disease progression, andresemble stages in neurogenesis. Cancer Cell 9, 157-173.
53. Verhaak, R.G.W., Hoadley,K.A., Purdom, E., Wang, V., Qi, Y., Wilkerson, M.D., Miller, C.R., Ding, L.,Golub, T.R., Mesirov, J.P., et al. (2010). Integrated genomic analysisidentifies clinically relevant subtypes of glioblastoma characterized byabnormalities in PDGFRA, IDH1, EGFR, and NF1. Cancer Cell 17, 98-110.
54. Sturm, D., Witt, H.,Hovestadt, V., Khuong-Quang, D.-A., Jones, D.T.W., Konermann, C., Pfaff, E.,Tonjes, M., Sill, M., Bender, S., et al. (2012). Hotspot Mutations in H3F3A andIDH1 Define Distinct Epigenetic and Biological Subgroups of Glioblastoma.Cancer Cell 22, 425-437.