(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-09-14
(54)【発明の名称】細胞培養方法および組成物
(51)【国際特許分類】
C12N 5/071 20100101AFI20220907BHJP
C12N 5/077 20100101ALI20220907BHJP
C12N 5/079 20100101ALI20220907BHJP
C12N 5/0793 20100101ALI20220907BHJP
C12Q 1/02 20060101ALN20220907BHJP
C12Q 1/68 20180101ALN20220907BHJP
C12N 15/09 20060101ALN20220907BHJP
【FI】
C12N5/071
C12N5/077
C12N5/079
C12N5/0793
C12Q1/02
C12Q1/68
C12N15/09 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021576869
(86)(22)【出願日】2020-06-26
(85)【翻訳文提出日】2022-02-17
(86)【国際出願番号】 AU2020050656
(87)【国際公開番号】W WO2020257867
(87)【国際公開日】2020-12-30
(31)【優先権主張番号】10201905939W
(32)【優先日】2019-06-26
(33)【優先権主張国・地域又は機関】SG
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】507335687
【氏名又は名称】ナショナル ユニヴァーシティー オブ シンガポール
(71)【出願人】
【識別番号】518224495
【氏名又は名称】モグリファイ リミテッド
(71)【出願人】
【識別番号】594202523
【氏名又は名称】モナシュ ユニバーシティ
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100157923
【氏名又は名称】鶴喰 寿孝
(72)【発明者】
【氏名】ラッカム,オーウェン
(72)【発明者】
【氏名】ペトレット,エンリコ
(72)【発明者】
【氏名】カマラジ,ウマ
(72)【発明者】
【氏名】ポロ,ジョセ
(72)【発明者】
【氏名】チェン,ジョセフ
【テーマコード(参考)】
4B063
4B065
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA18
4B063QQ08
4B063QQ43
4B063QR51
4B063QS10
4B063QS14
4B063QS28
4B063QS32
4B063QS39
4B065AA90X
4B065AB10
4B065AC20
4B065BA21
4B065CA46
(57)【要約】
本発明は、細胞維持および細胞変換のための細胞培養因子を同定するための方法に関する。
【特許請求の範囲】
【請求項1】
in vitroで細胞を維持するための方法であって、
- 細胞培養中に目的の細胞を提供するステップと、
- 前記細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定するステップと、
- 前記細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップと、
- 前記DBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて前記細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップと、
- 前記DBSおよびネットワークスコアの組合せに基づいて前記細胞における各タンパク質コード遺伝子についての細胞同一性スコア(RegDBS)を決定するステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付け、それによって前記細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、前記目的の細胞の前記細胞同一性と関連付けられた因子をコードする、ステップと、
- 前記目的の細胞を、前記細胞の前記細胞同一性と関連付けられた前記因子の1つまたは複数と接触させるステップと、
- 前記細胞培養中に前記細胞の維持を可能にするのに十分な時間および条件下で前記目的の細胞を培養するステップと
を含み、それによってin vitroで前記目的の細胞を維持する、方法。
【請求項2】
in vitroで細胞を維持する方法であって、
i.細胞培養中に目的の細胞を提供するステップと、
ii.前記細胞の維持を促進する因子またはそのバリアントをコードするタンパク質コード遺伝子を同定するステップであって、前記タンパク質コード遺伝子は、少なくとも1つのH3K4me3修飾領域を含む、ステップと、
iii.前記細胞の少なくとも1つの特徴の維持を促進するために、前記目的の細胞を少なくとも2つの因子またはそのバリアントと接触させるステップと、
iv.前記細胞培養中に前記細胞の維持を可能にするのに十分な時間および条件下で前記目的の細胞を培養するステップと
を含み、それによってin vitroで前記目的の細胞を維持する、方法。
【請求項3】
in vitroで細胞を維持する方法であって、
i.細胞培養中に目的の細胞を提供するステップと、
ii.前記細胞の維持を促進する因子またはそのバリアントをコードするタンパク質コード遺伝子を同定するステップであって、前記タンパク質コード遺伝子は、少なくとも1つのH3K4me3修飾領域を含む、ステップと、
iii.前記細胞の少なくとも1つの特徴の維持を促進するために、前記目的の細胞を1つもしくは複数の因子またはそのバリアントと接触させるステップと、
iv.前記細胞培養中に前記細胞の維持を可能にするのに十分な時間および条件下で前記目的の細胞を培養するステップと
を含み、それによってin vitroで前記目的の細胞を維持する、方法。
【請求項4】
前記目的の細胞が、分化した細胞、分化している細胞、未分化細胞または分化転換した細胞である、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記目的の細胞が組織である、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記目的の細胞が、外胚葉、中胚葉および内胚葉の胚葉に由来する細胞から選択される、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記目的の細胞が、星状膠細胞、ニューロスフェア、心筋細胞、平滑筋細胞、内皮細胞、筋細胞、線維芽細胞、メラニン細胞、上皮細胞、ケラチノサイト、メラニン細胞、および単核細胞、または表2に記載された細胞もしくは組織のいずれかからなる群から選択される、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記細胞同一性に関連付けられた前記因子が、表2に記載された前記因子のいずれか1つまたは複数である、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記目的の細胞が、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30日またはそれ以上の間、前記細胞を培養することを含む、前記細胞の維持を可能にするのに十分な時間および条件下で、培養される、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記H3K4me3修飾領域の前記微分幅が、
- 前記目的の細胞における各タンパク質コード遺伝子についての前記H3K4me3修飾領域の幅に関する情報を得て、前記細胞における各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を得るステップと、
- 前記細胞における各遺伝子の遺伝子幅スコアと、異なる型の細胞の集団にわたる同じ遺伝子についての平均遺伝子ピーク幅スコアとの差を計算し、それによって前記目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップと
によって決定される、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記遺伝子ピーク幅スコア(B)を決定するステップが、有意なH3K4me3修飾が存在するゲノムの領域を最初に定義し、それらの領域をヒストン修飾参照ピーク遺伝子座(RPL)と定義することを含む、請求項10に記載の方法。
【請求項12】
前記RPLが、全ての細胞型にわたって、得られたChIP-seqピーク領域をマージすることによって得られ、好ましくは、マージされる前記ピーク領域が重複するピーク領域である、請求項10に記載の方法。
【請求項13】
各タンパク質コード遺伝子についての前記遺伝子ピーク幅スコア(B)が、H3K4me3およびH3K27me3修飾領域が同定される遺伝子を除外することを含み、前記遺伝子がポイズド遺伝子として同定される、請求項9から12のいずれか一項に記載の方法。
【請求項14】
前記細胞同一性スコア(RegDBS)を決定するステップが、調節因子をコードするタンパク質コード遺伝子を優先的に加重することを含む、請求項1から13のいずれか一項に記載の方法。
【請求項15】
in vitroで前記目的の細胞を維持するための前記因子が、細胞シグナル伝達に関与する受容体-リガンド対、好ましくは前記受容体-リガンド対のリガンド、転写因子、およびエピジェネティックリモデリング因子からなる群から選択される、請求項1から14のいずれか一項に記載の方法。
【請求項16】
細胞シグナル伝達に関与する受容体-リガンド対をコードする前記細胞同一性遺伝子を選択し、それによってin vitroで前記目的の細胞を維持するのに必要なシグナル伝達分子を同定するステップを含む、請求項1から15のいずれか一項に記載の方法。
【請求項17】
細胞表面受容体をコードする各タンパク質コード遺伝子が、そのRegDBSスコアに従ってランク付けされ、前記受容体に関連付けられた各リガンドが、そのDBSスコアに従ってランク付けされて、受容体およびリガンドの組み合わせたランク付けを得、前記組み合わせたランク付けは、in vitroで前記目的の細胞を維持するための培養培地を補充する際に使用するための前記リガンドを同定する、請求項16に記載の方法。
【請求項18】
前記細胞同一性遺伝子が、WNT、NOTCH、Hegdehog、Hippo、GPCR、インテグリン、TGFBファミリー(BMP、アクチビン、TGFB受容体)、受容体チロシンキナーゼ(EGFR、FGFR、VEGF、PDGF、MET、MST、SCF-KIT、インスリン受容体、ERBB2、NTRKなど)、非受容体チロシンキナーゼ(PTK6)、MTOR、およびレチノイン酸によるシグナル伝達などの細胞シグナル伝達経路に関与する受容体-リガンド対をコードする、請求項16または17に記載の方法。
【請求項19】
転写因子をコードする前記細胞同一性遺伝子を選択し、それによってin vitroで前記目的の細胞を維持するのに必要な前記転写因子を同定するステップをさらに含む、請求項1から18のいずれか一項に記載の方法。
【請求項20】
前記ネットワークスコアを決定するステップが、関連付けられたピークH3K4me3幅を有しないタンパク質コード遺伝子をタンパク質間相互作用ネットワークから除去することを含む、請求項1から19のいずれか一項に記載の方法。
【請求項21】
前記細胞を、2つ以上の因子の発現を増加させる作用物質と接触させることによって、前記目的の細胞が因子の2つ以上と接触する、請求項1から20のいずれか一項に記載の方法。
【請求項22】
作用物質が、ヌクレオチド配列、タンパク質、アプタマーおよび小分子ならびにそれらの類似体またはバリアントからなる群から選択される、請求項21に記載の方法。
【請求項23】
請求項1から22のいずれか一項に記載の方法を実施することによってin vitroで細胞の集団を維持する方法。
【請求項24】
細胞の少なくとも5%が前記目的の細胞の少なくとも1つの特徴を示し、それらの細胞が、請求項1から22のいずれか一項に記載の方法によって産生される、細胞の集団。
【請求項25】
前記集団における前記細胞の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%が、前記目的の細胞の少なくとも1つの特徴を示す、請求項24に記載の細胞の集団。
【請求項26】
前記目的の細胞を個体に投与するステップ、または請求項22もしくは23に記載の細胞の集団を個体に投与するステップをさらに含む、請求項1から23のいずれか一項に記載の方法。
【請求項27】
標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換する方法であって、
- ソース細胞を準備するステップと、
- ソース細胞および標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定して、前記ソース細胞および標的細胞型における各タンパク質コード遺伝子(DBS)についての前記H3K4me3修飾のスコアを得るステップと、
- 前記ソース細胞の前記DBSと前記標的細胞の前記DBSとの差を計算して、各タンパク質コード遺伝子についての前記ソース細胞と標的細胞との間のH3K4me3修飾における前記差の尺度(細胞変換ΔDBS)を得るステップと、
- 前記細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて前記ソース細胞型から前記標的細胞型への変換についてのネットワークスコアを決定するステップであって、前記ネットワークが、細胞における各タンパク質コード遺伝子産物と他の遺伝子産物との相互作用の情報を含む、ステップと、
- 前記細胞変換ΔDBSとネットワークスコアの組合せに基づいて前記標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコアを決定するステップと、
- その細胞同一性変換スコアに従って各タンパク質コード遺伝子に優先順位を付けて、前記標的細胞についての前記細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、前記標的細胞の前記細胞同一性に関連付けられた因子をコードする、ステップと、
- 標的細胞型の少なくとも1つの特徴を示す細胞への前記ソース細胞の変換を可能にするのに十分な時間および条件下で前記ソース細胞を培養するステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換し、任意選択により、1つまたは複数の因子の量を増加させることは、i)前記ソース細胞を、因子もしくは前記細胞によって前記因子の発現を増加させる作用物質と接触させること、またはii)前記因子をコードする核酸を前記ソース細胞にトランスフェクトし、前記細胞において前記核酸を発現させることを含む、方法。
【請求項28】
変換する方法が、分化、再プログラミングまたは分化転換する方法である、請求項27に記載の方法。
【請求項29】
ソース細胞が、分化した細胞、分化している細胞、未分化細胞または分化転換した細胞である、請求項27に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞維持および細胞変換についての細胞培養因子を同定するための方法に関する。
関連出願
本出願は、シンガポール特許出願10201905939Wからの優先権を主張し、その内容はそれらの全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
胚性幹細胞が最初に単離されて以来、細胞状態を培養し、制御する能力が高まっている。しかしながら、この分野において最も困難な領域の1つは、in vitroで細胞を維持するための理想的な細胞培養条件を見つけることである。正確な条件が利用されない場合、細胞は異なる細胞状態に形質転換するか、または死滅する。したがって、in vitroで可能な限り厳密にin vivo微小環境条件を模倣するための重要な必要性が存在する。細胞型に対する培地の特異性を増加させるために、細胞外マトリクス(ECM)の成分、成長因子および他の環境要因のような細胞特異的因子の付加が必要とされる。
【0003】
さらに、細胞療法の進歩における主要な課題は、化学的に定義された細胞培養条件についての要件であり、様々な細胞型を維持するための無血清培地を開発するための試みが行われている。同様に、分化に関して、細胞療法のための細胞を得るために無血清の化学的に定義されたプロトコールを決定するための多くの試みがなされている。これらのプロトコールは、自然な発達過程、例えば、内皮細胞、ミクログリアおよび心筋細胞の分化を模倣するシグナル伝達分子のような外部要因を使用する。さらに、VEGFのようなシグナル伝達分子は、内皮分化においてマスター調節遺伝子の遺伝子座でエピジェネティックランドスケープを再構築することが示されている。このことは、シグナル伝達分子が、細胞状態を維持するか、または分化するためにエピジェネティック調節を開始できることを示唆している。
【発明の概要】
【発明が解決しようとする課題】
【0004】
400を超える公知のヒト細胞型が存在し、単一細胞シークエンシング技術の最近の進歩により、感覚ニューロン型および血液細胞型などの、より多くの新しい細胞型が胚発生の間に同定されている。したがって、任意のヒト細胞型についての細胞培養条件および/または分化刺激を体系的に同定するための満たされていない必要性が存在している。転写因子(TF)媒介性分化転換は十分に研究された分野であり、CellNet、D’Alessio ACらおよびMogrifyなどの遺伝子発現データを使用してTFを予測するために開発されたデータ駆動型計算アプローチがますます増えている。しかしながら、現在、in vitroでの細胞維持または多数の細胞型にわたる細胞変換についてのシグナル伝達分子を体系的に同定するための計算アプローチは存在しない。
【0005】
培養中の細胞を維持し、細胞を異なる細胞型に変換するための因子を同定するための新たな方法についての必要性が存在する。
本明細書におけるあらゆる先行技術への言及は、この先行技術が、任意の管轄において共通の一般知識の一部を形成すること、またはこの先行技術が、当業者によって理解されるか、先行技術の他の部分に関連するとみなされるか、および/もしくは他の部分と組み合わされることが合理的に予測され得るとの承認または示唆ではない。
【課題を解決するための手段】
【0006】
本発明は、目的の細胞についての細胞同一性遺伝子を決定する方法であって、
- 目的の細胞におけるタンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅(differential breadth)を決定するステップと、
- H3K4me3修飾領域の微分幅および少なくとも1つのネットワーク上のタンパク質コード遺伝子の各々のタンパク質産物間の相互作用に基づいてタンパク質コード遺伝子の各々についてのネットワークスコアを決定するステップであって、ネットワークは、タンパク質コード遺伝子の産物間の相互作用の情報を含む、ステップと、
- 微分幅およびネットワークスコアの組合せに基づいてタンパク質コード遺伝子の各々についての細胞同一性スコアを決定するステップと、
- その細胞同一性スコアに従ってタンパク質コード遺伝子の各々に優先順位を付けるステップと
を含み、それによって目的の細胞についての細胞同一性遺伝子を同定する、方法を提供する。
【0007】
本発明は、目的の細胞についての細胞同一性遺伝子を決定する方法であって、
- 目的の細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定するステップと、
- H3K4me3修飾領域の微分幅および少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、タンパク質コード遺伝子の産物間の相互作用の情報を含む、ステップと、
- 微分幅およびネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子についての細胞同一性スコアを決定するステップと、
- その細胞同一性スコアに従って各タンパク質コード遺伝子に優先順位を付けるステップと
を含み、それによって目的の細胞についての細胞同一性遺伝子を同定する、方法を提供する。
【0008】
本発明はまた、目的の細胞についての細胞同一性遺伝子を決定する方法であって、
- 目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(differential broadness score)(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- DBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子の産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、細胞におけるタンパク質コード遺伝子の産物間の相互作用の情報を含む、ステップと、
- DBSおよびネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子についての細胞同一性スコア(RegDBS)を決定するステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付けるステップと
を含み、それによって目的の細胞についての細胞同一性遺伝子を同定する、方法を提供する。
【0009】
本発明はまた、in vitroで細胞型を維持するのに必要な因子を決定する方法であって、
- 目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- DBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物と他のタンパク質コード遺伝子産物との間の相互作用の情報を含む、ステップと、
- DBSおよびネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子についての細胞同一性スコア(RegDBS)を決定するステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付け、それによって目的の細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、目的の細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによってin vitroで目的の細胞を維持するのに必要な因子を同定する、方法を提供する。
【0010】
任意の実施形態では、H3K4me3修飾領域の微分幅は、細胞における各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を得るために目的の細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の幅に関する情報を得、細胞における各遺伝子の遺伝子幅スコアと、異なる型の細胞の集団にわたる同じ遺伝子についての遺伝子幅スコアの中央値との差を計算し、それによって目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定することによって決定され得る。
【0011】
H3K4me3修飾領域の幅は、ChIP-seq情報に基づいて決定され得、より好ましくは、情報は、エピゲノムRoadmap、BLUEPRINTまたはENCODEデータベースのいずれかから得られる。任意の実施形態では、遺伝子ピーク幅スコア(B)を決定することは、最初に、有意なH3K4me3修飾(ヒストン修飾参照ピーク遺伝子座、またはRPL)が存在するゲノムの領域を定義することを含む。好ましくは、RPLは、全ての細胞型にわたって、得られたChIP-seqピーク領域をマージすることによって得られる。好ましくは、マージされるピーク領域は、重複するピーク領域である。
【0012】
好ましくは、H3K4me3修飾領域の幅は、ChIP-seq情報に基づいて決定され、任意選択により、情報は、CUT&RUN、scChIC-seqなどのH3K4me3プロファイリング方法から導かれ、より好ましくは、情報は、ENCODEデータベースから得られる。
【0013】
好ましい実施形態では、各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を決定することは、H3K4me3およびH3K27me3修飾領域が同定される遺伝子(すなわち、ポイズド遺伝子(poised gene))を除外することを含み得る。
【0014】
任意の実施形態では、DBSを決定することは、各タンパク質コード遺伝子についての(対照/バックグラウンド細胞と比較した)H3K4me3修飾領域の幅の差に関する情報を、幅のその差の有意性と組み合わせることを含み得る。ある特定の実施形態では、DBSを決定することは、幅の差および差の有意性を乗算、正規化または加算することを含み得、好ましくは、DBSは、ピーク幅の差と差の有意性とを加算することによって決定される。より好ましくは、DBSは、H3K4me3ピーク幅の差と有意性の-log10値とを加算することによって決定される。
【0015】
H3K4me3修飾領域の幅の差の有意性は、任意の標準的な統計的方法によって決定され得る。一例では、使用される方法は一標本ウィルコクソン検定である。
任意の実施形態では、目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定することは、各タンパク質コード遺伝子についてのDBSに関する情報、遺伝子の出次数ノードの数、およびネットワークにおける遺伝子の関連性のレベルを組み合わせることを含む。好ましい実施形態では、ネットワークスコアは、関連する遺伝子のDBSを合計することによって決定され、ネットワークにおける関連するタンパク質コード遺伝子についてのDBSの加重和を得るために、遺伝子の出次数ノードの数および関連性のレベルについて加重される。
【0016】
典型的に、タンパク質間相互作用ネットワークは、STRINGデータベースであるが、所与の細胞型内のタンパク質の相互作用に関連する情報を含む、本明細書で言及される任意のサブネットワークが使用されてもよい。
【0017】
細胞同一性スコア(RegDBS)は、細胞の同一性に対する各タンパク質コード遺伝子の調節作用の指標であることは理解される。
任意の実施形態では、RegDBSを決定することは、調節因子をコードするタンパク質コード遺伝子を優先的に加重することを含み得る。
【0018】
任意の実施形態では、各タンパク質コード遺伝子についてのRegDBSを決定することは、DBSスコアと、目的の細胞における全ての遺伝子にわたって正規化されたネットワークスコアとを加算することを含み得る。好ましくは、DBSとネットワークスコアとの加算は、2:1、1:1、3:1、4:1、5:1、および1:2の係数でネットワークスコアに対してDBSを加重することをさらに含む。より好ましくは、RegDBSは、ネットワークスコアに対して2の係数でDBSスコアを加重することによって決定される。
【0019】
任意の実施形態では、そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付けるステップは、RegDBS値に基づいて遺伝子を順序付けすることを含み得る。
好ましい実施形態では、方法は、受容体-リガンド対をコードする細胞同一性遺伝子を選択し、それによってin vitroで目的の細胞を維持するのに必要なシグナル伝達分子を同定するステップを含む。好ましくは、in vitroで目的の細胞を維持するのに必要な因子は、細胞シグナル伝達に関与する細胞表面受容体またはリガンドからなる群から選択される。好ましくは、in vitroで目的の細胞を維持するのに必要な因子を決定することは、そのRegDBSスコアに従って細胞表面受容体をコードする各タンパク質コード遺伝子をランク付けすることを含む。この方法は、各リガンドについてのDBSスコアに基づいて受容体に関連付けられたリガンドに優先順位を付けて、受容体およびリガンドの組み合わせたランク付けを得るステップであって、組み合わせたランク付けは、in vitroで目的の細胞を維持するための培養培地を補充する際に使用するためのリガンドを同定する、ステップをさらに含み得る。
【0020】
さらなる実施形態では、in vitroで目的の細胞を維持するための因子は、転写因子、またはエピジェネティックリモデリング因子を含み得る。したがって、方法は、転写因子をコードする細胞同一性遺伝子を選択し、それによってin vitroで目的の細胞を維持するのに必要な転写因子を同定するステップをさらに含み得る。
【0021】
したがって、本発明はまた、目的の細胞についての細胞同一性遺伝子を決定する方法であって、
- 目的の細胞(x)における各タンパク質コード遺伝子(g)についてのH3K4me3遺伝子ピーク幅スコア(B)を決定するステップであって、遺伝子ピーク幅スコアは、H3K4me3修飾を含む各タンパク質コード遺伝子のプロモーターにおける領域の長さの合計である、ステップと、
- 目的の細胞と、バックグラウンド遺伝子ピーク幅スコアを表す細胞の集団の遺伝子ピーク幅スコアの中央値との間の遺伝子ピーク幅スコア(Δピーク幅x
g)の正規化された差、およびその差の有意性(Pval)を決定するステップと、
- Δピーク幅とPval値とを加算して、細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBSx
g)を得るステップと、
- ネットワークにおける関連する遺伝子(r)の微分幅広スコア(DBSx
g)に関する情報を組み合わせることによって目的の細胞における各タンパク質コード遺伝子についてのネットワークスコア(Nx
g)を決定するステップであって、ネットワークは、各タンパク質コード遺伝子の産物と、細胞における他のタンパク質コード遺伝子産物との間の相互作用の情報を含み、微分幅広スコアは、遺伝子の出次数ノードの数(O)および遺伝子の関連性のレベル(L)を補正され、好ましくは、微分幅広スコア(DBSx
g)の加重和は、関連性の第3のレベルまで計算される、ステップと、
- 目的の細胞(x)における全てのタンパク質コード遺伝子(g)にわたってネットワークスコアNetx
gを正規化するステップと、
- 微分幅広スコア(DBSx
g)およびネットワークスコア(Netx
g)の組合せに基づいて目的の細胞における各タンパク質コード遺伝子をスコア付けし、それによって目的の細胞における各タンパク質コード遺伝子についての調節微分幅広スコア(RegDBSx
g)を決定するステップであって、RegDBSx
gは、細胞の同一性に対する各タンパク質コード遺伝子の調節作用の指標である、ステップと、
- そのRegDBSx
gに従って各遺伝子に優先順位を付けるステップと
を含み、それによって目的の細胞についての細胞同一性遺伝子を同定する、方法を提供する。
【0022】
好ましくは、ネットワークにおける実験スコアがゼロより大きく、組み合わせたスコアが500より大きい場合、遺伝子ノード間の相互作用が選択される。
さらなる実施形態では、ネットワークスコアを決定することは、関連付けられたピークH3K4me3幅を有しないタンパク質コード遺伝子をタンパク質間相互作用ネットワークから除去することを含む。
【0023】
好ましくは、目的の細胞における各タンパク質コード遺伝子をスコア付けすることは、微分幅広スコア(DBSx
g)と遺伝子についての正規化されたネットワークスコア(Netx
g)とを加算することを含み、より好ましくは、微分幅広スコア(DBSx
g)は、正規化されたネットワークスコア(Netx
g)に対して少なくとも2の係数によって加重される。
【0024】
本発明はまた、標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- ソース細胞および標的細胞型におけるタンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定して、ソースおよび標的細胞型におけるタンパク質コード遺伝子についてのH3K4me3修飾のスコア(DBS)を得るステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、タンパク質コード遺伝子の各々についてのソース細胞と標的細胞との間のH3K4me3修飾の差の尺度(細胞変換DBS)を得るステップと、
- 細胞変換DBSおよび少なくとも1つのネットワーク上のタンパク質コード遺伝子の各々のタンパク質産物間の相互作用に基づいてソース細胞型から標的細胞型へ変換するためのネットワークスコアを決定するステップであって、ネットワークは、細胞におけるタンパク質コード遺伝子の産物間の相互作用の情報を含む、ステップと、
- 細胞変換ΔDBSとネットワークスコアの組合せに基づいて標的細胞におけるタンパク質コード遺伝子の各々についての細胞同一性変換スコアを決定するステップと、
- その細胞同一性変換スコアに従ってタンパク質コード遺伝子の各々に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する、方法を提供する。
【0025】
本発明はまた、標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- ソース細胞および標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定して、ソースおよび標的細胞型における各タンパク質コード遺伝子(DBS)についてのH3K4me3修飾のスコアを得るステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、各タンパク質コード遺伝子についてのソース細胞と標的細胞との間のH3K4me3修飾の差の尺度(細胞変換ΔDBS)を得るステップと、
- 細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいてソース細胞型から標的細胞型へ変換するためのネットワークスコアを決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子産物と他の遺伝子産物との間の相互作用の情報を含む、ステップと、
- 細胞変換ΔDBSとネットワークスコアの組合せ基づいて標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコアを決定するステップと、
- その細胞同一性変換スコアに従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する、方法を提供する。
【0026】
本発明はまた、標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- ソース細胞および標的細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、各タンパク質コード遺伝子について細胞変換ΔDBSを得るステップと、
- 細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各遺伝子のタンパク質産物間の相互作用に基づいて、ソース細胞型から標的細胞型への細胞変換についてのネットワークスコアを決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物と他のタンパク質コード遺伝子産物との間の相互作用の情報を含む、ステップと、
- 細胞変換ΔDBSとネットワークスコアの組合せに基づいて標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコア(RegΔDBS)を決定するステップと、
- その細胞変換RegΔDBSに従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する、方法を提供する。
【0027】
任意の実施形態では、H3K4me3修飾領域の微分幅は、各細胞型における各遺伝子についての遺伝子ピーク幅スコア(B)を得るためにソース細胞および標的細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の幅に関する情報を得ること、ならびに細胞型における各タンパク質コード遺伝子の遺伝子ピーク幅スコアと、異なる型の細胞の集団にわたる同じ遺伝子についての遺伝子ピーク幅スコアの中央値との差を計算することによって決定され、それによってソースおよび標的細胞の両方における各遺伝子についての微分幅広スコア(DBS)を決定する。
【0028】
H3K4me3修飾領域の幅はChIP-seq情報に基づいて決定され得、より好ましくは、その情報は、エピゲノムRoadmap、BLUEPRINTまたはENCODEデータベースのいずれかから得られる。任意の実施形態では、遺伝子ピーク幅スコア(B)を決定することは、最初に、有意なH3K4me3修飾(ヒストン修飾参照ピーク遺伝子座、またはRPL)が存在するゲノムの領域を定義することを含む。好ましくは、RPLは、全てに細胞型にわたって、得られたChIP-seqピーク領域をマージすることによって得られる。好ましくは、マージされるピーク領域は、重複するピーク領域である。
【0029】
好ましくは、H3K4me3修飾領域の幅はChIP-seq情報に基づいて決定され、より好ましくは、その情報はENCODEデータベースから得られる。
好ましい実施形態では、各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を決定することは、H3K4me3およびH3K27me3修飾領域が同定される遺伝子(すなわち、ポイズド遺伝子)を除外することを含む。
【0030】
任意の実施形態では、ソース細胞および標的細胞における各タンパク質コード遺伝子についてのDBSを決定することは、各タンパク質コード遺伝子についてのH3K4me3幅の差(バックグラウンドH3K4me3幅と比較した)に関する情報を、その差の有意性と組み合わせることを含み得る。ある特定の実施形態では、DBSを決定することは、ピーク幅の差とその差の有意性とを乗算、正規化または加算することを含み得、好ましくは、DBSは、ピーク幅の差とその差の有意性とを加算することによって決定される。より好ましくは、DBSは、ピーク幅の差と有意性の-log10値とを加算することによって決定される。
【0031】
H3K4me3修飾領域の幅の差の有意性は、任意の標準的な統計的方法によって決定され得る。一例では、使用される方法は一標本ウィルコクソン検定である。
好ましい実施形態では、ソース細胞のDBSと標的細胞のDBSとの差を計算して、各遺伝子についての細胞変換ΔDBSを得ることは、各タンパク質コード遺伝子についてのソース細胞のDBSを、各遺伝子についての標的細胞のDBSから減算して、各遺伝子についての細胞変換ΔDBSを得ることを含む。各タンパク質コード遺伝子についての細胞変換ΔDBSは、ソース細胞と標的細胞との間の所与のタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差の尺度を提供する。
【0032】
好ましくは、ソース細胞から標的細胞への細胞変換についてのネットワークスコアは、ネットワークにおける関連する遺伝子の細胞変換ΔDBSの加重された組合せである。例えば、細胞変換についてのネットワークスコアを決定することは、各遺伝子についての細胞変換ΔDBS、遺伝子の出次数ノードの数、およびネットワークにおける遺伝子の関連性のレベルに関する情報を組み合わせることを含み得る。好ましい実施形態では、ネットワークスコアは、関連する遺伝子の細胞変換ΔDBSを合計することによって決定され、ネットワークにおける関連する遺伝子についての細胞変換ΔDBSの加重和を得るために、遺伝子の出次数ノードの数および関連性のレベルについて加重される。
【0033】
典型的に、タンパク質間相互作用ネットワークは、STRINGデータベースであるが、所与の細胞型内のタンパク質の相互作用に関する情報を含む、本明細書で言及される任意のサブネットワークが使用されてもよい。
【0034】
細胞変換同一性スコア(細胞変換RegΔDBS)は、細胞の同一性の変化に対する各タンパク質コード遺伝子の調節作用の指標であると理解される。
任意の実施形態では、細胞変換RegΔDBSを決定することは、調節因子をコードするタンパク質コード遺伝子を優先的に加重することを含み得る。
【0035】
任意の実施形態では、各タンパク質コード遺伝子についての細胞変換RegΔDBSを決定することは、細胞変換ΔDBSスコアと、全てのタンパク質コード遺伝子にわたる正規化された細胞変換ネットワークスコアとを加算することを含む。好ましくは、細胞変換ΔDBSと細胞変換ネットワークスコアとを加算することは、2:1、1:1、3:1、4:1、5:1、および1:2の係数によって細胞変換ネットワークスコアに対して細胞変換ΔDBSを加重することをさらに含む。より好ましくは、細胞変換RegΔDBSは、ネットワークスコアに対して2の係数によって細胞変換ΔDBSスコアを加重することによって決定される。
【0036】
任意の実施形態では、その細胞変換RegΔDBSに従って各タンパク質コード遺伝子に優先順位を付けるステップは、細胞変換RegΔDBS値に基づいて遺伝子を順序付けることを含む。
【0037】
好ましい実施形態では、細胞変換因子は、転写因子、またはエピジェネティックリモデリング因子を含む。したがって、方法は、転写因子をコードする遺伝子を選択し、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な転写因子を同定するステップをさらに含み得る。好ましくは、変換は、分化した標的細胞への分化したソース細胞の分化転換である。
【0038】
代替の実施形態では、方法は、受容体-リガンド対をコードするタンパク質コード遺伝子を選択し、それによって標的細胞へのソース細胞の変換に必要なシグナル伝達分子を同定するステップを含む。好ましくは、標的細胞へのソース細胞の変換に必要な因子は、細胞表面受容体または細胞シグナル伝達に関与するリガンドからなる群から選択される。好ましくは、標的細胞へのソース細胞の変換に必要な因子を決定することは、その細胞変換RegΔDBSスコアに従って細胞表面受容体をコードする各遺伝子をランク付けすることを含む。方法は、各リガンドについての細胞変換ΔDBSスコアに基づいて受容体に関連付けられたリガンドに優先順位を付けて、受容体およびリガンドの組み合わせたランク付けを得るステップであって、組み合わせたランク付けは、標的細胞へのソース細胞の変換のための培養培地を補充する際に使用するためのリガンドを同定する、ステップをさらに含み得る。好ましくは、変換は、多能性ソース細胞から分化した標的細胞への指向性分化である。
【0039】
したがって、本発明はまた、標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- 目的の細胞(S)、および標的細胞(T)における各タンパク質コード遺伝子(g)についてのH3K4me3遺伝子ピーク幅スコア(B)を決定するステップであって、遺伝子ピーク幅スコアは、H3K4me3修飾を含む各タンパク質コード遺伝子のプロモーターにおける領域の長さの合計である、ステップと、
- ソース細胞と、バックグラウンド遺伝子ピーク幅スコアを示す細胞の集団の遺伝子ピーク幅スコアの中央値との間の遺伝子ピーク幅スコアの正規化された差(Δピーク幅S
g)、およびその差の有意性(PvalS
g)を決定するステップと、
- 標的細胞と、バックグラウンド遺伝子幅スコアを表す細胞の集団の遺伝子幅スコアの中央値との間の遺伝子幅スコアの正規化された差(Δピーク幅T
g)、およびその差の有意性(PvalT
g)を決定するステップと、
- Δピーク幅S
gとPvalS
g値とを加算して、ソース細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBSS
g)を得るステップと、
- Δピーク幅T
gとPvalT
g値とを加算して、標的細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBST
g)を得るステップと、
- 標的細胞における同じ遺伝子についての微分幅広スコア(DBST
g)からソース細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBSS
g)を減算して、標的細胞における各タンパク質コード遺伝子についての細胞変換ΔDBS(ΔDBST-S
g)を得るステップと、
- ネットワークにおける関連する遺伝子(r)の細胞変換微分幅広スコア(ΔDBST-S
g)を組み合わせることによって標的細胞における各遺伝子についてのネットワークスコア(NT-S
g)を決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物間の相互作用の情報を含み、微分幅広スコアは、遺伝子の出次数ノードの数(O)および遺伝子の関連性のレベル(L)を補正され、好ましくは、細胞変換微分幅広スコア(ΔDBST-S
g)の加重和が、関連性の第3のレベルまで計算される、ステップと、
- 全てのタンパク質コード遺伝子にわたって細胞変換ネットワークスコアNetT-S
gを正規化するステップと、
- 細胞変換微分幅広スコア(ΔDBST-S
g)と細胞変換ネットワークスコア(NetT-S
g)の組合せに基づいて各タンパク質コード遺伝子をスコア付けし、それによって各タンパク質コード遺伝子についての細胞変換調節微分幅広スコア(RegΔDBST-S
g)を決定するステップであって、RegΔDBST-S
gは、ソース細胞と比較した標的細胞に対する各タンパク質コード遺伝子の調節作用の差の指標である、ステップと、
- そのRegΔDBST-S
gに従って各タンパク質コード遺伝子に優先順位を付けるステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を同定する、方法を提供する。
【0040】
好ましくは、ネットワークにおける実験スコアがゼロより大きく、組み合わせたスコアが500より大きい場合、遺伝子ノード間の相互作用が選択される。
さらなる実施形態では、ネットワークスコアを決定することは、関連付けられたピークH3K4me3幅を有しない遺伝子を、タンパク質間相互作用ネットワークから除去することを含む。
【0041】
好ましくは、目的の細胞における各タンパク質コード遺伝子をスコア付けすることは、微分幅広スコア(ΔDBST-S
g)と、遺伝子についてのネットワークスコア(NetT-S
g)とを加算することを含み、より好ましくは、微分幅広スコア(ΔDBST-S
g)は、ネットワークスコア(NetT-S
g)に対して少なくとも2の係数によって加重される。
【0042】
上記の態様の任意の実施形態では、方法は、転写因子をコードするタンパク質コード遺伝子のサブセットを選択し、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な転写因子を同定するステップを含む。好ましくは、同定される因子は、分化した標的細胞への分化したソース細胞の分化転換のためである。
【0043】
上記の態様のさらなる実施形態では、方法は、受容体-リガンド対をコードするタンパク質コード遺伝子を選択し、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要なシグナル伝達分子を同定するステップを含む。好ましくは、同定される因子は、分化した標的細胞への多能性ソース細胞の指向性分化のためである。
【0044】
さらなる実施形態では、方法は、受容体をコードする遺伝子および受容体-リガンド対における受容体リガンドをコードする遺伝子の組み合わせたランクを決定するステップであって、ランク付けは、受容体およびリガンドのそれぞれについてのRegDBS、およびDBSに基づき、それによって細胞維持に必要な受容体-リガンド対を同定する、ステップをさらに含む。
【0045】
上記の態様のさらなる実施形態では、方法は、転写的に冗長なTFを、各細胞型からのランク付けしたリストから除去するステップをさらに含む。
なおさらに、上記の方法のいずれかにおいて、方法は、続いて、in vitroで目的の細胞を維持するか、または標的細胞の少なくとも1つの特徴を示す細胞へソース細胞を変換するように、目的の細胞の集団、またはソース細胞を、同定された因子の1つまたは複数と接触させるステップを含み得る。あるいは、方法は、in vitroで目的の細胞を維持するか、または標的細胞の少なくとも1つの特徴を示す細胞へソース細胞を変換するように、目的のソース細胞の細胞に、1つまたは複数の因子をコードする核酸をトランスフェクトするステップを含み得る。
【0046】
本発明はまた、in vitroで細胞の集団を維持する方法であって、
- 細胞培養中に目的の細胞の集団を提供するステップと、
- 目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じ遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- DBSおよび少なくとも1つのネットワーク上の各遺伝子のタンパク質産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、各タンパク質コード遺伝子の産物と、細胞における他のタンパク質コード遺伝子産物との間の相互作用の情報を含む、ステップと、
- DBSとネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子をスコア付けし、それによって目的の細胞における各タンパク質コード遺伝子についてのRegDBSを決定するステップであって、RegDBSは細胞同一性についての各タンパク質コード遺伝子の重要性の指標である、ステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付け、それによって目的の細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、目的の細胞の細胞同一性に関連付けられた因子をコードするステップと、
- 目的の細胞の集団を、目的の細胞の細胞同一性に関連付けられた因子のうちの1つまたは複数と接触させるステップと、
- 細胞培養中に目的の細胞の維持を可能にするのに十分な時間および条件下で細胞の集団を培養するステップと
を含み、それによってin vitroで細胞の集団を維持する、方法を提供する。
【0047】
ある特定の実施形態では、細胞を因子と接触させることは、因子をコードする1つまたは複数の核酸分子を細胞にトランスフェクトし、細胞内で因子を発現することを含み得る。あるいは、接触させることは、細胞を、1つまたは複数の因子の発現を増加させる作用物質と接触させることを含み得る。
【0048】
本発明はまた、in vitroで星状膠細胞の集団を維持する方法であって、順に以下のステップ:
- 細胞培養中に星状膠細胞の集団を提供するステップと、
- 星状膠細胞の少なくとも1つの特徴を維持するために、星状膠細胞の集団を、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントから選択される因子のセットと接触させるステップと、
- 細胞培養中に星状膠細胞の維持を可能にするのに十分な時間および条件下で星状膠細胞の集団を培養するステップと
を含み、それによってin vitroで星状膠細胞の集団を維持する、方法を提供する。
【0049】
好ましくは、因子は、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3を含むか、それらからなるか、またはそれらから本質的になる。
【0050】
ある特定の実施形態では、方法は、星状膠細胞を、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3のうちの1つもしくは複数、2つ以上、3つ以上、4つ以上、5つ以上、または6つと接触させるステップを含む。
【0051】
好ましい実施形態では、方法は、星状膠細胞を、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3と接触させるステップを含む。
【0052】
一実施形態では、方法は、星状膠細胞を、少なくともFN1、LAMB1またはCOL1A2と接触させるステップ(任意選択により、星状膠細胞を、FN1およびLAMB1またはFN1およびCOL1A2またはFN1、LAMB1およびCOL1A2の3つ全てと接触させるステップ)を含む。任意選択により、COL4A1、ADAM12、およびEDIL3のうちの1つまたは複数もまた、星状膠細胞と接触させるために使用される。
【0053】
任意の実施形態では、因子、例えば、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3のいずれか1つの機能的バリアントが使用されてもよい。
【0054】
本明細書に記載される任意の方法では、その方法は、本方法に従って作製された星状膠細胞、または細胞集団を個体に投与するステップをさらに含み得る。
本発明はまた、in vitroで心筋細胞の集団を維持する方法であって、
- 細胞培養中に心筋細胞の集団を提供するステップと、
- 心筋細胞の少なくとも1つの特徴を維持するために、心筋細胞の集団を、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12から選択される1つまたは複数の因子と接触させるステップと、
- 細胞培養中に心筋細胞を維持するのに十分な時間および好適な条件下で心筋細胞の集団を培養するステップと
を含み、それによってin vitroで心筋細胞の集団を維持する、方法を提供する。
【0055】
好ましくは、因子は、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12を含むか、それらからなるか、またはそれらから本質的になる。
【0056】
ある特定の実施形態では、方法は、心筋細胞を、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12のうちの1つまたは複数、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上または9つと接触させるステップを含む。
【0057】
好ましい実施形態では、方法は、心筋細胞を、少なくともFN1、COL3A1(コラーゲンIII)、TFP1、FGF7およびAPOE、またはそれらの機能的バリアントと接触させるステップを含む。
【0058】
さらなる好ましい実施形態では、方法は、心筋細胞を、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3およびCXCL12と接触させるステップを含む。
【0059】
任意の実施形態では、因子、例えば、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3およびCXCL12のいずれか1つの機能的バリアントが使用されてもよい。
【0060】
本明細書に記載される任意の方法では、その方法は、本方法に従って作製された心筋細胞、または細胞集団を個体に投与するステップをさらに含み得る。
本発明はまた、in vitroで平滑筋細胞の集団を維持する方法であって、
- 細胞培養中に平滑筋細胞の集団を提供するステップと、
- 平滑筋細胞の少なくとも1つの特徴を維持するために、平滑筋細胞の集団を、LAMA5、COL4A1、LAMA4、NID1、COL6A3、COL4A6、COL4A5、FGF10、FGF7、GNAS、COL7A1、COL1A1およびTHBS1から選択される1つまたは複数の因子と接触させるステップと、
- 細胞培養中に平滑筋細胞を維持するのに十分な時間および好適な条件下で平滑筋細胞の集団を培養するステップと
を含み、それによってin vitroで平滑筋細胞の集団を維持する、方法を提供する。
【0061】
好ましくは、因子は、LAMA5、COL4A1、LAMA4、NID1、COL6A3、COL4A6、COL4A5、FGF10、FGF7、GNAS、COL7A1、COL1A1およびTHBS1を含むか、それらからなるか、またはそれらから本質的になる。
【0062】
ある特定の実施形態では、方法は、平滑筋細胞を、LAMA5、COL4A1、LAMA4、NID1、COL6A3、COL4A6、COL4A5、FGF10、FGF7、GNAS、COL7A1、COL1A1およびTHBS1のうちの1つまたは複数、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、または9つ以上と接触させるステップを含む。
【0063】
好ましい実施形態では、方法は、平滑筋細胞を、コラーゲン4、NID1、コラーゲン6、FGF10、FGF7、コラーゲン1およびTHBS1と接触させるステップを含む。
【0064】
任意の実施形態では、因子、例えば、LAMA5、COL4A1、LAMA4、NID1、COL6A3、COL4A6、COL4A5、FGF10、FGF7、GNAS、COL7A1、COL1A1およびTHBS1のいずれか1つの機能的バリアントが使用されてもよい。
【0065】
本明細書に記載される任意の方法では、その方法は、本方法に従って作製された平滑筋細胞、または細胞集団を個体に投与するステップをさらに含み得る。
本発明はまた、in vitroで、内皮細胞、好ましくは大動脈内皮細胞の集団を維持する方法であって、
- 細胞培養中に内皮細胞の集団を提供するステップと、
- 内皮細胞の少なくとも1つの特徴を維持するために、内皮細胞の集団を、BMP6、ADAM9、LAMB1、LAMA4、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61から選択される1つまたは複数の因子と接触させるステップと、
- 細胞培養中に内皮細胞を維持するのに十分な時間および好適な条件下で内皮細胞の集団を培養するステップと
を含み、それによってin vitroで内皮細胞の集団を維持する、方法を提供する。
【0066】
好ましくは、因子は、BMP6、ADAM9、LAMB1、LAMA4、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61を含むか、それらからなるか、またはそれらから本質的になる。
【0067】
ある特定の実施形態では、方法は、内皮細胞を、BMP6、ADAM9、LAMB1、LAMA4、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61のうちの1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、または9つ以上と接触させるステップを含む。
【0068】
好ましい実施形態では、方法は、内皮細胞を、BMP6、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61と接触させるステップを含む。
任意の実施形態では、因子、例えば、MP6、ADAM9、LAMB1、LAMA4、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61のいずれか1つの機能的バリアントが使用されてもよい。
【0069】
本明細書に記載される任意の方法では、その方法は、本方法に従って作製された内皮細胞、または細胞集団を個体に投与するステップをさらに含み得る。
目的の細胞を維持するための上記の方法のいずれかにおいて、その方法は、分化転換している細胞、未分化細胞、分化した細胞および分化転換した細胞を維持する方法を含み得る。
【0070】
本発明はまた、標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換方法であって、
- 本明細書に記載される任意の方法によって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を同定するステップと、
- ソース細胞を準備するステップと、
- ソース細胞を、標的細胞へのソース細胞の変換のために同定された因子の1つまたは複数と接触させるステップと、
- 標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換を可能にするのに十分な時間および条件下でソース細胞を培養するステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換する、方法を提供する。
【0071】
本発明はまた、標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換方法であって、
- 本明細書に記載される任意の方法によって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を同定するステップと、
- ソース細胞を準備するステップと、
- ソース細胞を、標的細胞へのソース細胞の変換のための同定された1つまたは複数の因子と接触させるか、またはそれらの因子の量を増加させるステップと、
- 標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換を可能にするのに十分な時間および条件下でソース細胞を培養するステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換する、方法を提供する。
【0072】
好ましい実施形態では、ソース細胞はH9胚性幹細胞であり、標的細胞型は表3に記載された細胞型のいずれかである。
量を「増加させる」は、ソース細胞において1つまたは複数の因子をコードする核酸を発現させること、またはソース細胞を、細胞によって因子の発現を増加させるための作用物質と接触させることを含み得る。
【0073】
本発明は、ソース細胞を分化させるための方法であって、ソース細胞を、1つもしくは複数の因子またはそのバリアントと接触させるステップ、あるいはソース細胞において1つもしくは複数の因子またはそのバリアントのタンパク質発現を増加させるステップであって、ソース細胞は標的細胞の少なくとも1つの特徴を示すように分化する、ステップを含み、
- ソース細胞は多能性幹細胞または前駆細胞であり、標的細胞は表3に記載された細胞のいずれかであり、
- 因子は、所与の標的細胞型についての表3に記載された因子から選択される、方法を提供する。任意選択により、表3に記載された因子の2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、または9つ以上、または10個以上、または11個以上、または12個以上、または13個以上、または14個以上が、この方法に使用される。
【0074】
本発明は、ソース細胞を分化させるための方法であって、ソース細胞において1つもしくは複数の因子またはそのバリアントのタンパク質発現を増加させるステップであって、ソース細胞は標的細胞の少なくとも1つの特徴を示すように分化する、ステップを含み、
- ソース細胞は多能性幹細胞または前駆細胞であり、標的細胞は星状膠細胞であり、
- 因子は、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3から選択される、方法を提供する。
【0075】
本発明は、多能性幹細胞または前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成する方法であって、
- ソース細胞において、多能性幹細胞または前駆細胞を、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントから選択される因子の1つまたは複数と接触させるステップと、
- 星状膠細胞への分化を可能にするのに十分な時間および条件下で多能性幹細胞または前駆細胞を培養し、それによって多能性幹細胞または前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成するステップと
を含む、方法を提供する。
【0076】
本発明はまた、多能性幹細胞、好ましくは胚性幹細胞、または前駆細胞を分化するための方法であって、幹細胞において、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントのうちの1つまたは複数のタンパク質発現を増加させるステップであって、幹細胞は、星状膠細胞の少なくとも1つの特徴を示すように分化する、ステップを含む、方法を提供する。
【0077】
本発明は、多能性幹細胞、好ましくは胚性幹細胞、または前駆細胞を、星状膠細胞の少なくとも1つの特徴を示す細胞に分化するための方法であって、i)多能性幹細胞もしくは前駆細胞、または多能性幹細胞もしくは前駆細胞を含む細胞集団を準備するステップと、ii)前記多能性幹細胞に、星状膠細胞の細胞同一性に重要な1つまたは複数の因子をコードするヌクレオチド配列を含む1つまたは複数の核酸をトランスフェクトするステップと、iii)前記細胞または細胞集団を培養し、任意選択により、星状膠細胞の少なくとも1つの特徴について細胞または細胞集団をモニタリングするステップであって、好ましくは、多能性幹細胞もしくは前駆細胞を星状膠細胞に分化するための因子、または星状膠細胞の少なくとも1つの特徴を示す細胞を生成するための因子は、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3を含むか、それらからなるか、またはそれらから本質的になる、ステップとを含む、方法を提供する。
【0078】
ある特定の実施形態では、前駆細胞は、好ましくは、神経前駆細胞または神経前駆細胞の集団から得られた細胞である。
好ましくは、多能性幹細胞は胚性幹細胞である。
【0079】
本発明は、胚性幹細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成する方法であって、
- 胚性幹細胞において、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントのうちのいずれか1つまたは複数の量を増加させるステップと、
- 星状膠細胞に分化するのに十分な時間および条件下で胚性幹細胞を培養し、それによって胚性幹細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成するステップと
を含む、方法を提供する。
【0080】
ある特定の実施形態では、上記に列挙した因子の1つまたは複数の量を増加させることは、ソース細胞(すなわち、幹細胞)において因子の1つまたは複数をコードする核酸を発現させることを含む。あるいは、因子は、細胞培養培地によって細胞に直接提供され得る。
【0081】
典型的に、細胞分化を標的とするのに好適な条件は、十分な時間および好適な培地中で細胞を培養することを含む。培養の十分な時間は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30日であり得る。好適な培地は表4に示されるものであり得る。
【0082】
好ましくは、星状膠細胞の少なくとも1つの特徴は、任意の1つもしくは複数の星状膠細胞マーカーの上方制御および/または細胞形態の変化である。関連するマーカーは、本明細書に記載され、当業者に公知である。星状膠細胞についての例示的なマーカーには、GFAP、S100B、ALDH1L1、CD44およびGLAST1、または表1に記載されたマーカーのいずれかが含まれる。
【0083】
好ましくは、心筋細胞の少なくとも1つの特徴は、任意の1つもしくは複数の心筋細胞マーカーの上方制御および/または細胞形態の変化である。関連するマーカーは、本明細書に記載され、当業者に公知である。心筋細胞についての例示的なマーカーには、NKX2.5、GATA4、GATA6、MEF2C、MYH6、ACTN1、CDH2およびGJA1、または表1に記載されたマーカーのいずれかが含まれる。
【0084】
好ましくは、平滑筋細胞の少なくとも1つの特徴は、任意の1つもしくは複数の平滑筋細胞マーカーの上方制御および/または細胞形態の変化である。関連するマーカーは、本明細書に記載され、当業者に公知である。平滑筋細胞についての例示的なマーカーには、SM22およびα-SMA、または表1に記載されたマーカーのいずれかが含まれる。
【0085】
好ましくは、内皮細胞の少なくとも1つの特徴は、任意の1つもしくは複数の内皮細胞マーカーの上方制御および/または細胞形態の変化である。関連するマーカーは、本明細書に記載され、当業者に公知である。内皮細胞についての例示的なマーカーには、CD31およびVWF、または表1に記載されたマーカーのいずれかが含まれる。
【0086】
本発明はまた、本明細書に記載される方法によって産生された、星状膠細胞、心筋細胞、平滑筋細胞、または内皮細胞のうちの少なくとも1つの特徴を示す細胞を提供する。
本明細書に記載される任意の方法において、その方法は、星状膠細胞の少なくとも1つの特徴を示す細胞を増殖させて、星状膠細胞の少なくとも1つの特徴を示す集団における細胞の割合を増加させるステップをさらに含み得る。細胞を増殖させるステップは、以下に記載されるように細胞の集団を生成するのに十分な時間および条件下で培養中であり得る。
【0087】
本明細書に記載される任意の方法において、その方法は、心筋細胞の少なくとも1つの特徴を示す細胞を増殖させて、心筋細胞の少なくとも1つの特徴を示す集団における細胞の割合を増加させるステップをさらに含み得る。細胞を増殖させるステップは、以下に記載されるように細胞の集団を生成するのに十分な時間および条件下で培養中であり得る。
【0088】
本明細書に記載される任意の方法において、その方法は、星状膠細胞、心筋細胞、平滑筋細胞または内皮細胞の少なくとも1つの特徴を示す細胞、または細胞を含む細胞集団を個体に投与するステップをさらに含み得る。
【0089】
本発明はまた、(i)in vitroで星状膠細胞の集団を維持するため、または(ii)多能性幹細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成するための因子のセットを含む組成物を提供する。好ましくは、組成物は、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントから選択される因子のセットを含む。好ましくは、因子のセットは、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントを含むか、それらからなるか、またはそれらから本質的になる。ある特定の実施形態では、組成物は、FN1、COL4A1、LAMB1、ADAM12、WNT5A、COL1A2およびEDIL3、またはそれらのバリアントのうちの1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、または6つを含み得る。一実施形態では、組成物は、少なくともFN1、LAMB1またはCOL1A2(任意選択により、FN1およびLAMB1またはFN1およびCOL1A2または3つ全て)を含む。任意選択により、組成物は、COL4A1、ADAM12、およびEDIL3のうちの1つまたは複数をさらに含む。
【0090】
本発明はまた、in vitroで心筋細胞の集団を維持するための因子のセットを含む組成物を提供する。好ましくは、組成物は、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12、またはそれらのバリアントから選択される因子のセットを含む。好ましくは、因子のセットは、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12、またはそれらのバリアントを含むか、それらからなるか、またはそれらから本質的になる。ある特定の実施形態では、組成物は、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12、またはそれらのバリアントのうちの1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、または9つを含み得る。最も好ましくは、因子は、FN1、COL3A1(コラーゲンIII)、TFP1、FGF7およびAPOEを含むか、それらからなるか、またはそれらから本質的になる。
【0091】
任意の態様では、組成物は、in vitroで培養中の細胞の成長または維持を支持するための1つまたは複数の成分をさらに含み得る。
任意の態様では、組成物は、細胞培養培地であってもよい。
【0092】
任意の態様では、組成物は、因子(すなわちタンパク質)または因子をコードする核酸を含み得る。
本発明はまた、(i)in vitroで星状膠細胞の集団を維持するため、(ii)多能性幹細胞もしくは前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成するため、または(iii)in vitroで心筋細胞の集団を維持するため、(iv)in vitroで平滑筋細胞の集団を維持するため、または(v)in vitroで内皮細胞の集団を維持するための細胞培養培地を産生する方法であって、
本明細書に記載される組成物を細胞培養培地に添加するステップを含む、方法を提供する。
【0093】
本発明はまた、細胞の少なくとも5%が心筋細胞の少なくとも1つの特徴を示し、それらの細胞が本明細書に記載される方法によって産生される、細胞の集団を提供する。好ましくは、集団内の細胞の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%は、心筋細胞の少なくとも1つの特徴を示す。
【0094】
本発明はまた、細胞の少なくとも5%が、星状膠細胞の少なくとも1つの特徴を示し、それらの細胞が本明細書に記載される方法によって産生される、細胞の集団を提供する。好ましくは、集団内の細胞の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%は、星状膠細胞の少なくとも1つの特徴を示す。
【0095】
本発明はまた、細胞の少なくとも5%が、平滑筋細胞の少なくとも1つの特徴を示し、それらの細胞が本明細書に記載される方法によって産生される、細胞の集団を提供する。好ましくは、集団内の細胞の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%は、平滑筋細胞の少なくとも1つの特徴を示す。
【0096】
本発明はまた、細胞の少なくとも5%が、内皮細胞の少なくとも1つの特徴を示し、それらの細胞が本明細書に記載される方法によって産生される、細胞の集団を提供する。好ましくは、集団内の細胞の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%は、内皮細胞の少なくとも1つの特徴を示す。
【0097】
本発明はまた、本明細書に開示されるようにin vitroで細胞を維持する際に使用するためのキットに関する。一部の実施形態では、キットは、本明細書に記載される因子またはそのバリアントをコードする1つまたは複数の核酸配列を有する1つまたは複数の核酸を含む。あるいは、キットは、本明細書に記載される使用のための細胞培養培地を補充するための1つまたは複数のタンパク質因子を含む。好ましくは、キットは、培養中に星状膠細胞、心筋細胞、平滑筋細胞または内皮細胞を維持するために使用され得る。一部の実施形態では、キットは、in vitroで、細胞、好ましくは、星状膠細胞、心筋細胞、平滑筋細胞または内皮細胞を維持するための使用説明書をさらに含む。
【0098】
本発明はまた、標的細胞、好ましくは、本明細書に開示される星状膠細胞または心筋細胞の少なくとも1つの特徴を示す細胞を産生するためのキットに関する。一部の実施形態では、キットは、本明細書に記載される因子またはそのバリアントをコードする1つまたは複数の核酸配列を有する1つまたは複数の核酸を含む。あるいは、キットは、本明細書に記載される指向性分化に使用するための培地を補充するための1つまたは複数のタンパク質を含み得る。好ましくは、キットは、星状膠細胞の少なくとも1つの特徴または心筋細胞の少なくとも1つの特徴を示す細胞を産生するために使用され得る。好ましくは、キットは、胚性幹細胞と共に使用され得る。一部の実施形態では、キットは、本明細書に開示される方法に従って標的細胞の少なくとも1つの特徴を示す細胞へソース細胞を変換するための使用説明書をさらに含む。好ましくは、本発明は、本明細書に記載される本発明の方法に使用される場合にキットを提供する。
【0099】
好ましい実施形態
以下の記述は本発明の好ましい実施形態に関する。
1.in vitroで細胞を維持するための方法であって、
- 細胞培養中に目的の細胞を提供するステップと、
- 前記細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定するステップと、
- 前記細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップと、
- DBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて前記細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップと、
- DBSおよびネットワークスコアの組合せに基づいて前記細胞における各タンパク質コード遺伝子についての細胞同一性スコア(RegDBS)を決定するステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付け、それによって前記細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、目的の細胞の細胞同一性と関連付けられた因子をコードする、ステップと、
- 前記目的の細胞を、前記細胞の細胞同一性と関連付けられた因子の1つまたは複数と接触させるステップと、
- 細胞培養中に前記細胞の維持を可能にするのに十分な時間および条件下で前記目的の細胞を培養するステップと
を含み、それによってin vitroで目的の細胞を維持する、方法。
【0100】
2.in vitroで細胞を維持する方法であって、
i.細胞培養中に目的の細胞を提供するステップと、
ii.前記細胞の維持を促進する因子またはそのバリアントをコードするタンパク質コード遺伝子を同定するステップであって、タンパク質コード遺伝子は、少なくとも1つのH3K4me3修飾領域を含む、ステップと、
iii.前記細胞の少なくとも1つの特徴を維持するために、前記目的の細胞を少なくとも2つの因子またはそのバリアントと接触させるステップと、
iv.細胞培養中に前記細胞の維持を可能にするのに十分な時間および条件下で前記目的の細胞を培養するステップと
を含み、それによってin vitroで目的の細胞を維持する、方法。
【0101】
3.in vitroで細胞を維持する方法であって、
i.細胞培養中に目的の細胞を提供するステップと、
ii.前記細胞の維持を促進する因子またはそのバリアントをコードするタンパク質コード遺伝子を同定するステップであって、タンパク質コード遺伝子は、少なくとも1つのH3K4me3修飾領域を含む、ステップと、
iii.前記細胞の少なくとも1つの特徴を維持するために、前記目的の細胞を1つもしくは複数の因子またはそのバリアントと接触させるステップと、
iv.細胞培養中に前記細胞の維持を可能にするのに十分な時間および条件下で前記目的の細胞を培養するステップと
を含み、それによってin vitroで目的の細胞を維持する、方法。
【0102】
4.目的の細胞が、分化した細胞、分化している細胞、未分化細胞または分化転換した細胞である、記述1から3のいずれか一つに記載の方法。
5.目的の細胞が組織である、記述1から4のいずれか一つに記載の方法。
【0103】
6.目的の細胞が、外胚葉、中胚葉および内胚葉の胚葉に由来する細胞から選択される、記述1から5のいずれか一つに記載の方法。
7.目的の細胞が、星状膠細胞、ニューロスフェア、心筋細胞、平滑筋細胞、内皮細胞、筋細胞、線維芽細胞、メラニン細胞、上皮細胞、ケラチノサイト、メラニン細胞、および単核細胞、または表2に記載された細胞もしくは組織のいずれかからなる群から選択される、記述1から6のいずれか一つに記載の方法。
【0104】
8.細胞同一性に関連付けられた因子が、表2に記載された因子のいずれか1つまたは複数である、記述1から7のいずれか一つに記載の方法。
9.目的の細胞が、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30日またはそれ以上の間、細胞を培養することを含む、前記細胞の維持を可能にするのに十分な時間および条件下で培養される、記述1から8のいずれか一つに記載の方法。
【0105】
10.H3K4me3修飾領域の微分幅が、
- 目的の細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の幅に関する情報を得て、細胞における各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を得るステップと、
- 細胞における各遺伝子の遺伝子幅スコアと、異なる型の細胞の集団にわたる同じ遺伝子についての平均遺伝子ピーク幅スコアとの差を計算し、それによって目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップと
によって決定される、記述1から9のいずれか一つに記載の方法。
【0106】
11.遺伝子ピーク幅スコア(B)を決定するステップが、有意なH3K4me3修飾が存在するゲノムの領域を最初に定義し、それらの領域をヒストン修飾参照ピーク遺伝子座(RPL)と定義することを含む、記述10に記載の方法。
【0107】
12.RPLが、全ての細胞型にわたって、得られたChIP-seqピーク領域をマージすることによって得られ、好ましくは、マージされるピーク領域が重複するピーク領域である、記述10に記載の方法。
【0108】
13.各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)が、H3K4me3およびH3K27me3修飾領域が同定される遺伝子を除外することを含み、遺伝子がポイズド遺伝子として同定される、記述9から12のいずれか一つに記載の方法。
【0109】
14.細胞同一性スコア(RegDBS)を決定するステップが、調節因子をコードするタンパク質コード遺伝子を優先的に加重することを含む、記述1から13のいずれか一つに記載の方法。
【0110】
15.in vitroで目的の細胞を維持するための因子が、細胞シグナル伝達に関与する受容体-リガンド対、好ましくは受容体-リガンド対のリガンド、転写因子、およびエピジェネティックリモデリング因子からなる群から選択される、請求項1から14のいずれか一項に記載の方法。
【0111】
16.細胞シグナル伝達に関与する受容体-リガンド対をコードする細胞同一性遺伝子を選択し、それによってin vitroで目的の細胞を維持するのに必要なシグナル伝達分子を同定するステップを含む、記述1から15のいずれか一つに記載の方法。
【0112】
17.細胞表面受容体をコードする各タンパク質コード遺伝子が、そのRegDBSスコアに従ってランク付けされ、受容体に関連付けられた各リガンドが、そのDBSスコアに従ってランク付けされて、受容体およびリガンドの組み合わせたランク付けを得、組み合わせたランク付けは、in vitroで目的の細胞を維持するための培養培地を補充する際に使用するためのリガンドを同定する、記述16に記載の方法。
【0113】
18.細胞同一性遺伝子が、WNT、NOTCH、Hegdehog、Hippo、GPCR、インテグリン、TGFBファミリー(BMP、アクチビン、TGFB受容体)、受容体チロシンキナーゼ(EGFR、FGFR、VEGF、PDGF、MET、MST、SCF-KIT、インスリン受容体、ERBB2、NTRKなど)、非受容体チロシンキナーゼ(PTK6)、MTOR、およびレチノイン酸によるシグナル伝達などの細胞シグナル伝達経路に関与する受容体-リガンド対をコードする、記述16または17に記載の方法。
【0114】
19.転写因子をコードする細胞同一性遺伝子を選択し、それによってin vitroで目的の細胞を維持するのに必要な転写因子を同定するステップをさらに含む、記述1から18のいずれか一つに記載の方法。
【0115】
20.ネットワークスコアを決定するステップが、タンパク質間相互作用ネットワークからの関連付けられたピークH3K4me3幅を有しないタンパク質コード遺伝子を除去することを含む、記述1から19のいずれか一つに記載の方法。
【0116】
21.細胞を、2つ以上の因子の発現を増加させる作用物質と接触させることによって、目的の細胞が因子の2つ以上と接触する、記述1から20のいずれか一つに記載の方法。
【0117】
22.作用物質が、ヌクレオチド配列、タンパク質、アプタマーおよび小分子ならびにそれらの類似体またはバリアントからなる群から選択される、記述21に記載の方法。
23.記述1から22のいずれか一つに記載の方法を実施することによってin vitroで細胞の集団を維持する方法。
【0118】
24.細胞の少なくとも5%が目的の細胞の少なくとも1つの特徴を示し、それらの細胞が、記述1から22のいずれか一つに記載の方法によって産生される、細胞の集団。
25.集団における細胞の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%が、目的の細胞の少なくとも1つの特徴を示す、記述24に記載の細胞の集団。
【0119】
26.目的の細胞を個体に投与するステップ、または請求項22もしくは23に記載の細胞の集団を個体に投与するステップをさらに含む、記述1から23のいずれか一つに記載の方法。
【0120】
27.標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換する方法であって、
- ソース細胞を準備するステップと、
- ソース細胞および標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定して、ソースおよび標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾のスコア(DBS)を得るステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、各タンパク質コード遺伝子についてのソース細胞と標的細胞との間のH3K4me3修飾における差の尺度(細胞変換ΔDBS)を得るステップと、
- 細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいてソース細胞型から標的細胞型への変換についてのネットワークスコアを決定するステップであって、ネットワークが、細胞における各タンパク質コード遺伝子産物と他の遺伝子産物との相互作用の情報を含む、ステップと、
- 細胞変換DBSとネットワークスコアの組合せに基づいて標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコアを決定するステップと、
- その細胞同一性変換スコアに従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと、
- 標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換を可能にするのに十分な時間および条件下でソース細胞を培養するステップと、
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換し、任意選択により、1つまたは複数の因子の量を増加させることは、i)ソース細胞を、因子もしくは細胞によって因子の発現を増加させる作用物質と接触させること、またはii)因子をコードする核酸をソース細胞にトランスフェクトし、細胞において核酸を発現させることを含む、方法。
【0121】
28.変換する方法が、分化、再プログラミングまたは分化転換する方法である、記述27に記載の方法。
29.ソース細胞が、分化した細胞、分化している細胞、未分化細胞または分化転換した細胞である、記述27に記載の方法。
【0122】
30.ソース細胞が胚性幹細胞であり、標的細胞が表3に記載された細胞の1つである、記述27に記載の方法。
31.ソース細胞が胚性幹細胞であり、ソース細胞を変換するための因子が表3に記載されている、記述30に記載の方法。
【0123】
本明細書で使用される場合、文脈上別段の必要がある場合を除いて、「含む(comprise)」という用語および「含んでいる(comprising)」、「含む(comprises)」および「含まれる(comprised)」などのその用語の変形は、さらなる付加物、構成要素、整数またはステップを除外することを意図しない。
【0124】
本発明のさらなる態様および前述の段落に記載される態様のさらなる実施形態は、例として、および添付の図面を参照して与えられた以下の説明から明らかになる。
【図面の簡単な説明】
【0125】
【
図1-1】H3K4me3ヒストン修飾により細胞同一性遺伝子をマークする。(A)この研究に使用した細胞型の数を示すベン図である。H3K4me3およびH3K27me3 ChIP-seqによるヒストン修飾データならびにENCODEリポジトリから得たRNA-seqによる遺伝子発現データ。(B)ChIP-seqピーク幅およびピーク高さを定義する図である。(C)細胞型の代表的なChIP-seqプロファイルに対する遺伝子注釈の図である。ChIP-seqプロファイルをヒトゲノム(GRCh38)にマッピングし、細胞型間のピークを比較するために、本発明者らは、全ての細胞型にわたってChIP-seqプロファイルをマージすることによって参照ピーク遺伝子座(RPL)を定義した。この表は、各RPLに割り当てられた遺伝子ならびに各遺伝子座における計算したピーク幅(B)および高さ(H)の値をまとめている。(D)40の共通の細胞型にわたる関連付けられたH3K4me3ピーク幅および遺伝子発現によって順序付けられた遺伝子による細胞同一性およびハウスキーピング遺伝子セットについてのエンリッチメントの図である。x軸は、H3K4me3幅の値または降順でランク付けされた遺伝子発現レベルによる遺伝子の累積ビンからなり、累積ビンは1パーセンタイル間隔で増加する。エンリッチメントスコアは、FET(フィッシャーの正確検定)を使用してコンピューターで計算する。(E)同様に、111の細胞型にわたって、細胞同一性遺伝子セットについての最も高いエンリッチメントスコアが、H3K4me3幅の値によってランク付けされ、ピーク幅分布の87%超の関連付けられたH3K4me3幅を有する遺伝子について達成される図である。nは細胞型の数を指す。
【
図1-2】H3K4me3ヒストン修飾により細胞同一性遺伝子をマークする。(A)この研究に使用した細胞型の数を示すベン図である。H3K4me3およびH3K27me3 ChIP-seqによるヒストン修飾データならびにENCODEリポジトリから得たRNA-seqによる遺伝子発現データ。(B)ChIP-seqピーク幅およびピーク高さを定義する図である。(C)細胞型の代表的なChIP-seqプロファイルに対する遺伝子注釈の図である。ChIP-seqプロファイルをヒトゲノム(GRCh38)にマッピングし、細胞型間のピークを比較するために、本発明者らは、全ての細胞型にわたってChIP-seqプロファイルをマージすることによって参照ピーク遺伝子座(RPL)を定義した。この表は、各RPLに割り当てられた遺伝子ならびに各遺伝子座における計算したピーク幅(B)および高さ(H)の値をまとめている。(D)40の共通の細胞型にわたる関連付けられたH3K4me3ピーク幅および遺伝子発現によって順序付けられた遺伝子による細胞同一性およびハウスキーピング遺伝子セットについてのエンリッチメントの図である。x軸は、H3K4me3幅の値または降順でランク付けされた遺伝子発現レベルによる遺伝子の累積ビンからなり、累積ビンは1パーセンタイル間隔で増加する。エンリッチメントスコアは、FET(フィッシャーの正確検定)を使用してコンピューターで計算する。(E)同様に、111の細胞型にわたって、細胞同一性遺伝子セットについての最も高いエンリッチメントスコアが、H3K4me3幅の値によってランク付けされ、ピーク幅分布の87%超の関連付けられたH3K4me3幅を有する遺伝子について達成される図である。nは細胞型の数を指す。
【
図2-1】細胞同一性遺伝子の同定および細胞維持についてのシグナル伝達分子の予測。(A)関連付けられた幅広いH3K4me3ピークを使用して細胞同一性遺伝子をモデル化するために開発されたデータ駆動型方法の概略図である。各遺伝子について、微分幅広スコア(DBS)を、目的の標的細胞型とバックグラウンド細胞型との間の幅広いH3K4me3幅の値を比較することによってコンピューターで計算する。DBSは、関連付けられた幅の値の差(Δピーク幅)およびこの差の有意性(P値)として計算された集成値である。タンパク質コード遺伝子をDBSによってランク付けする。(B)調節作用を用いて遺伝子に優先順位を付けるために、各遺伝子について、調節微分幅広スコア(RegDBS)を、遺伝子のDBSおよびタンパク質間相互作用(PPI)ネットワークにおける関連する遺伝子のDBSの加重和としてコンピューターで計算する図である。(i)細胞同一性遺伝子および(ii)細胞維持についてのシグナル伝達分子を予測するために細胞特異的RegDBSを使用する。(C)ピーク幅の値(ピーク幅)、DBSおよびRegDBSによってランク付けされた遺伝子などの異なるスコアリングメトリックによる細胞同一性遺伝子セットについてのエンリッチメントを、GSEA(遺伝子セットエンリッチメント分析)によってコンピューターで計算する図である。各スコアリングメトリックについて、全ての細胞型にわたるGSEAエンリッチメントスコアの合計(NES
*-log10p値)を示す。(D)in vitroでの細胞維持についての受容体およびリガンドのようなシグナル伝達分子のEpiMogrifyの予測の図である。受容体は目的の細胞型によって産生されるが、リガンドは、細胞型自体または支持細胞型によって産生され得る。受容体およびリガンド対を、受容体のRegDBSおよび対応するリガンドのDBS値に基づいてランク付けする。ランク付けした受容体-リガンド対からの上位の予測リガンドを、in vitroでの細胞維持のために培養条件に加える。
【
図2-2】細胞同一性遺伝子の同定および細胞維持についてのシグナル伝達分子の予測。(A)関連付けられた幅広いH3K4me3ピークを使用して細胞同一性遺伝子をモデル化するために開発されたデータ駆動型方法の概略図である。各遺伝子について、微分幅広スコア(DBS)を、目的の標的細胞型とバックグラウンド細胞型との間の幅広いH3K4me3幅の値を比較することによってコンピューターで計算する。DBSは、関連付けられた幅の値の差(Δピーク幅)およびこの差の有意性(P値)として計算された集成値である。タンパク質コード遺伝子をDBSによってランク付けする。(B)調節作用を用いて遺伝子に優先順位を付けるために、各遺伝子について、調節微分幅広スコア(RegDBS)を、遺伝子のDBSおよびタンパク質間相互作用(PPI)ネットワークにおける関連する遺伝子のDBSの加重和としてコンピューターで計算する図である。(i)細胞同一性遺伝子および(ii)細胞維持についてのシグナル伝達分子を予測するために細胞特異的RegDBSを使用する。(C)ピーク幅の値(ピーク幅)、DBSおよびRegDBSによってランク付けされた遺伝子などの異なるスコアリングメトリックによる細胞同一性遺伝子セットについてのエンリッチメントを、GSEA(遺伝子セットエンリッチメント分析)によってコンピューターで計算する図である。各スコアリングメトリックについて、全ての細胞型にわたるGSEAエンリッチメントスコアの合計(NES
*-log10p値)を示す。(D)in vitroでの細胞維持についての受容体およびリガンドのようなシグナル伝達分子のEpiMogrifyの予測の図である。受容体は目的の細胞型によって産生されるが、リガンドは、細胞型自体または支持細胞型によって産生され得る。受容体およびリガンド対を、受容体のRegDBSおよび対応するリガンドのDBS値に基づいてランク付けする。ランク付けした受容体-リガンド対からの上位の予測リガンドを、in vitroでの細胞維持のために培養条件に加える。
【
図2-3】細胞同一性遺伝子の同定および細胞維持についてのシグナル伝達分子の予測。(A)関連付けられた幅広いH3K4me3ピークを使用して細胞同一性遺伝子をモデル化するために開発されたデータ駆動型方法の概略図である。各遺伝子について、微分幅広スコア(DBS)を、目的の標的細胞型とバックグラウンド細胞型との間の幅広いH3K4me3幅の値を比較することによってコンピューターで計算する。DBSは、関連付けられた幅の値の差(Δピーク幅)およびこの差の有意性(P値)として計算された集成値である。タンパク質コード遺伝子をDBSによってランク付けする。(B)調節作用を用いて遺伝子に優先順位を付けるために、各遺伝子について、調節微分幅広スコア(RegDBS)を、遺伝子のDBSおよびタンパク質間相互作用(PPI)ネットワークにおける関連する遺伝子のDBSの加重和としてコンピューターで計算する図である。(i)細胞同一性遺伝子および(ii)細胞維持についてのシグナル伝達分子を予測するために細胞特異的RegDBSを使用する。(C)ピーク幅の値(ピーク幅)、DBSおよびRegDBSによってランク付けされた遺伝子などの異なるスコアリングメトリックによる細胞同一性遺伝子セットについてのエンリッチメントを、GSEA(遺伝子セットエンリッチメント分析)によってコンピューターで計算する図である。各スコアリングメトリックについて、全ての細胞型にわたるGSEAエンリッチメントスコアの合計(NES
*-log10p値)を示す。(D)in vitroでの細胞維持についての受容体およびリガンドのようなシグナル伝達分子のEpiMogrifyの予測の図である。受容体は目的の細胞型によって産生されるが、リガンドは、細胞型自体または支持細胞型によって産生され得る。受容体およびリガンド対を、受容体のRegDBSおよび対応するリガンドのDBS値に基づいてランク付けする。ランク付けした受容体-リガンド対からの上位の予測リガンドを、in vitroでの細胞維持のために培養条件に加える。
【
図3-1】in vitroでの星状膠細胞の細胞維持。A)星状膠細胞の初代細胞培養および神経幹細胞に由来する星状膠細胞の予測リガンドを補充してから3日後の細胞数の図である。対照は補充なしであり、マトリゲルをゴールデンスタンダードとして使用する。B)予測因子を補充してから3日後に細胞増殖アッセイ(BrdU)によって検出した、初代星状膠細胞および神経幹細胞に由来する星状膠細胞の細胞増殖率の図である。C)指定した培養条件下での初代星状膠細胞上のGFAP(赤)およびS100b(緑)などの星状膠細胞特異的マーカーについての免疫蛍光(IF)画像である。(D)同様に、指定した培養条件下での神経幹細胞に由来する星状膠細胞上の星状膠細胞特異的マーカーについてのIF画像である。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図3-2】in vitroでの星状膠細胞の細胞維持。A)星状膠細胞の初代細胞培養および神経幹細胞に由来する星状膠細胞の予測リガンドを補充してから3日後の細胞数の図である。対照は補充なしであり、マトリゲルをゴールデンスタンダードとして使用する。B)予測因子を補充してから3日後に細胞増殖アッセイ(BrdU)によって検出した、初代星状膠細胞および神経幹細胞に由来する星状膠細胞の細胞増殖率の図である。C)指定した培養条件下での初代星状膠細胞上のGFAP(赤)およびS100b(緑)などの星状膠細胞特異的マーカーについての免疫蛍光(IF)画像である。(D)同様に、指定した培養条件下での神経幹細胞に由来する星状膠細胞上の星状膠細胞特異的マーカーについてのIF画像である。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図3-3】in vitroでの星状膠細胞の細胞維持。A)星状膠細胞の初代細胞培養および神経幹細胞に由来する星状膠細胞の予測リガンドを補充してから3日後の細胞数の図である。対照は補充なしであり、マトリゲルをゴールデンスタンダードとして使用する。B)予測因子を補充してから3日後に細胞増殖アッセイ(BrdU)によって検出した、初代星状膠細胞および神経幹細胞に由来する星状膠細胞の細胞増殖率の図である。C)指定した培養条件下での初代星状膠細胞上のGFAP(赤)およびS100b(緑)などの星状膠細胞特異的マーカーについての免疫蛍光(IF)画像である。(D)同様に、指定した培養条件下での神経幹細胞に由来する星状膠細胞上の星状膠細胞特異的マーカーについてのIF画像である。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図4】in vitroでの星状膠細胞の細胞維持。A)心筋細胞の予測リガンドを補充してから3日後の細胞数の図である。陰性対照は追加のリガンドを有しない条件であり、陽性対照はゲルトレックス(Geltrex)のみを有する条件である。B)予測リガンドを補充してから3日後の細胞増殖アッセイ(BrdU)によって検出した心筋細胞の細胞増殖率の図である。C)全ての条件についての心筋細胞マーカーGATA4+およびNKX2.5+細胞についての蛍光活性化細胞分類(FACS)の図である。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図5-1】in vitroでのHPASMC平滑筋細胞の細胞維持。(A)HPASMC平滑筋細胞の予測リガンドを補充してから3日および6日後の細胞数の図である。陰性対照は追加のリガンドを有しない条件であり、陽性対照はゲルトレックスのみを有する条件である。(B)予測リガンドを補充してから3日後の細胞増殖アッセイ(BrdU)によって検出した平滑筋細胞の細胞増殖率の図である。(C)全ての条件についての平滑筋細胞特異的マーカーα-SMA+細胞についての蛍光活性化細胞分類(FACS)の図である。(D)指定した培養条件下での平滑筋細胞上のSM22(緑)などの平滑筋細胞特異的マーカーについての免疫蛍光画像である。細胞をHoechstで対比染色した。スケール=50μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図5-2】in vitroでのHPASMC平滑筋細胞の細胞維持。(A)HPASMC平滑筋細胞の予測リガンドを補充してから3日および6日後の細胞数の図である。陰性対照は追加のリガンドを有しない条件であり、陽性対照はゲルトレックスのみを有する条件である。(B)予測リガンドを補充してから3日後の細胞増殖アッセイ(BrdU)によって検出した平滑筋細胞の細胞増殖率の図である。(C)全ての条件についての平滑筋細胞特異的マーカーα-SMA+細胞についての蛍光活性化細胞分類(FACS)の図である。(D)指定した培養条件下での平滑筋細胞上のSM22(緑)などの平滑筋細胞特異的マーカーについての免疫蛍光画像である。細胞をHoechstで対比染色した。スケール=50μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図5-3】in vitroでのHPASMC平滑筋細胞の細胞維持。(A)HPASMC平滑筋細胞の予測リガンドを補充してから3日および6日後の細胞数の図である。陰性対照は追加のリガンドを有しない条件であり、陽性対照はゲルトレックスのみを有する条件である。(B)予測リガンドを補充してから3日後の細胞増殖アッセイ(BrdU)によって検出した平滑筋細胞の細胞増殖率の図である。(C)全ての条件についての平滑筋細胞特異的マーカーα-SMA+細胞についての蛍光活性化細胞分類(FACS)の図である。(D)指定した培養条件下での平滑筋細胞上のSM22(緑)などの平滑筋細胞特異的マーカーについての免疫蛍光画像である。細胞をHoechstで対比染色した。スケール=50μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図6-1】in vitroでのHAoEC内皮細胞の細胞維持。HAoEC内皮細胞の予測リガンドを補充してから3日および6日後の細胞数の図である。陰性対照は追加のリガンドを有しない条件であり、陽性対照はゲルトレックスのみを有する条件である。(B)予測リガンドを補充してから3日後の細胞増殖アッセイ(BrdU)によって検出した内皮細胞の細胞増殖率の図である。(C)全ての条件についての内皮細胞特異的マーカーVWF+細胞についてのFACSの図である。(D)全ての条件についての内皮細胞特異的マーカーCD31(緑)についてのIFの図である。細胞をHoechstで対比染色した。スケール=50μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図6-2】in vitroでのHAoEC内皮細胞の細胞維持。HAoEC内皮細胞の予測リガンドを補充してから3日および6日後の細胞数の図である。陰性対照は追加のリガンドを有しない条件であり、陽性対照はゲルトレックスのみを有する条件である。(B)予測リガンドを補充してから3日後の細胞増殖アッセイ(BrdU)によって検出した内皮細胞の細胞増殖率の図である。(C)全ての条件についての内皮細胞特異的マーカーVWF+細胞についてのFACSの図である。(D)全ての条件についての内皮細胞特異的マーカーCD31(緑)についてのIFの図である。細胞をHoechstで対比染色した。スケール=50μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001、
****P<0.0001およびnsは有意ではない。
【
図7-1】EpiMogrify:細胞変換因子の予測。(A)ソース細胞型から標的細胞型への細胞変換に関して、細胞同一性の変化を、ソース細胞型と標的細胞型との間のDBS値の差としてコンピューターで計算する図である。次いで細胞変換RegΔDBSを、遺伝子のΔDBSとタンパク質間相互作用ネットワークスコアの合計として計算する。(i)指向性分化または細胞変換についてのシグナル伝達分子および(ii)分化転換についての転写因子を予測するために遺伝子を細胞変換RegΔDBSによってランク付けする。(B)x数の細胞変換について、(i)JSDによって予測された上位100のTF、(ii)Mogrifyによる冗長なTFセットならびに(iii)JSDおよびMogrifyの両方によって予測された共通のTFに対するTFのEpiMogrifyの予測リストのエンリッチメントを、GSEAを使用して計算する図である。グラフは、各場合、有意なエンリッチメントを伴う細胞変換のパーセンテージを示す。(C)線維芽細胞(ソース細胞型)から、選択された10種の標的細胞型への分化転換に関して、表が、同じin vitro分化転換についてのEpiMogrifyの予測TFと、以前に公開されたTFとの重複をまとめている図である。各分化転換について、公開されたTFのリコールのパーセンテージおよびそれらのそれぞれのランクを示す。
【
図7-2】EpiMogrify:細胞変換因子の予測。(A)ソース細胞型から標的細胞型への細胞変換に関して、細胞同一性の変化を、ソース細胞型と標的細胞型との間のDBS値の差としてコンピューターで計算する図である。次いで細胞変換RegΔDBSを、遺伝子のΔDBSとタンパク質間相互作用ネットワークスコアの合計として計算する。(i)指向性分化または細胞変換についてのシグナル伝達分子および(ii)分化転換についての転写因子を予測するために遺伝子を細胞変換RegΔDBSによってランク付けする。(B)x数の細胞変換について、(i)JSDによって予測された上位100のTF、(ii)Mogrifyによる冗長なTFセットならびに(iii)JSDおよびMogrifyの両方によって予測された共通のTFに対するTFのEpiMogrifyの予測リストのエンリッチメントを、GSEAを使用して計算する図である。グラフは、各場合、有意なエンリッチメントを伴う細胞変換のパーセンテージを示す。(C)線維芽細胞(ソース細胞型)から、選択された10種の標的細胞型への分化転換に関して、表が、同じin vitro分化転換についてのEpiMogrifyの予測TFと、以前に公開されたTFとの重複をまとめている図である。各分化転換について、公開されたTFのリコールのパーセンテージおよびそれらのそれぞれのランクを示す。
【
図8-1】in vitroでの星状膠細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの星状膠細胞のin vitroでの分化の概略図である。14日後、神経細胞接着分子(NCAM)+神経前駆細胞を選択し、細胞を異なる予測条件下で播種した。免疫蛍光(IF)、蛍光活性化細胞分類(FACS)およびRNA-seq分析を実施した。(B)全ての条件についての星状膠細胞マーカーCD44+細胞についてのFACSの図である。(C)マトリゲルのみおよび全てのリガンド条件での21日目のGFAP(赤)およびS100b(緑)のIFの図である。(D)IFを実施して、全ての条件においてGFAPおよびS100b星状膠細胞マーカーを有するDAPI+細胞のパーセンテージを得た図である。ε星状膠細胞特異性(星状膠細胞転写シグネチャー)を示す遺伝子の群について、TPMにおける遺伝子発現プロファイルの平均zスコアを、各時点および条件で配列決定した3つの試料にわたって計算する。星状膠細胞転写シグネチャーは、(i)H9 ESCと本発明者らのRNA-seqデータから得た初代星状膠細胞との間の有意に上方制御した遺伝子、(ii)H9 ESCと、FANTOM5(F5)データベースから得た大脳皮質由来の星状膠細胞との間の有意に上方制御した遺伝子、(iii)H9 ESCと、F5データベースから得た小脳由来の星状膠細胞との間の有意に上方制御した遺伝子であり、(iv)EpiMogrify GRN(遺伝子調節ネットワーク)は、正のRegDBSスコアを有する初代星状膠細胞の細胞同一性遺伝子および調節される最初の隣接までのSTRINGネットワーク上の関連する遺伝子を含む遺伝子セットであり、(v)HumanBase GRNは、HumanBaseデータベースから得た星状膠細胞特異的ネットワークである。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001およびnsは有意ではない。
【
図8-2】in vitroでの星状膠細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの星状膠細胞のin vitroでの分化の概略図である。14日後、神経細胞接着分子(NCAM)+神経前駆細胞を選択し、細胞を異なる予測条件下で播種した。免疫蛍光(IF)、蛍光活性化細胞分類(FACS)およびRNA-seq分析を実施した。(B)全ての条件についての星状膠細胞マーカーCD44+細胞についてのFACSの図である。(C)マトリゲルのみおよび全てのリガンド条件での21日目のGFAP(赤)およびS100b(緑)のIFの図である。(D)IFを実施して、全ての条件においてGFAPおよびS100b星状膠細胞マーカーを有するDAPI+細胞のパーセンテージを得た図である。ε星状膠細胞特異性(星状膠細胞転写シグネチャー)を示す遺伝子の群について、TPMにおける遺伝子発現プロファイルの平均zスコアを、各時点および条件で配列決定した3つの試料にわたって計算する。星状膠細胞転写シグネチャーは、(i)H9 ESCと本発明者らのRNA-seqデータから得た初代星状膠細胞との間の有意に上方制御した遺伝子、(ii)H9 ESCと、FANTOM5(F5)データベースから得た大脳皮質由来の星状膠細胞との間の有意に上方制御した遺伝子、(iii)H9 ESCと、F5データベースから得た小脳由来の星状膠細胞との間の有意に上方制御した遺伝子であり、(iv)EpiMogrify GRN(遺伝子調節ネットワーク)は、正のRegDBSスコアを有する初代星状膠細胞の細胞同一性遺伝子および調節される最初の隣接までのSTRINGネットワーク上の関連する遺伝子を含む遺伝子セットであり、(v)HumanBase GRNは、HumanBaseデータベースから得た星状膠細胞特異的ネットワークである。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001およびnsは有意ではない。
【
図8-3】in vitroでの星状膠細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの星状膠細胞のin vitroでの分化の概略図である。14日後、神経細胞接着分子(NCAM)+神経前駆細胞を選択し、細胞を異なる予測条件下で播種した。免疫蛍光(IF)、蛍光活性化細胞分類(FACS)およびRNA-seq分析を実施した。(B)全ての条件についての星状膠細胞マーカーCD44+細胞についてのFACSの図である。(C)マトリゲルのみおよび全てのリガンド条件での21日目のGFAP(赤)およびS100b(緑)のIFの図である。(D)IFを実施して、全ての条件においてGFAPおよびS100b星状膠細胞マーカーを有するDAPI+細胞のパーセンテージを得た図である。ε星状膠細胞特異性(星状膠細胞転写シグネチャー)を示す遺伝子の群について、TPMにおける遺伝子発現プロファイルの平均zスコアを、各時点および条件で配列決定した3つの試料にわたって計算する。星状膠細胞転写シグネチャーは、(i)H9 ESCと本発明者らのRNA-seqデータから得た初代星状膠細胞との間の有意に上方制御した遺伝子、(ii)H9 ESCと、FANTOM5(F5)データベースから得た大脳皮質由来の星状膠細胞との間の有意に上方制御した遺伝子、(iii)H9 ESCと、F5データベースから得た小脳由来の星状膠細胞との間の有意に上方制御した遺伝子であり、(iv)EpiMogrify GRN(遺伝子調節ネットワーク)は、正のRegDBSスコアを有する初代星状膠細胞の細胞同一性遺伝子および調節される最初の隣接までのSTRINGネットワーク上の関連する遺伝子を含む遺伝子セットであり、(v)HumanBase GRNは、HumanBaseデータベースから得た星状膠細胞特異的ネットワークである。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001およびnsは有意ではない。
【
図8-4】in vitroでの星状膠細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの星状膠細胞のin vitroでの分化の概略図である。14日後、神経細胞接着分子(NCAM)+神経前駆細胞を選択し、細胞を異なる予測条件下で播種した。免疫蛍光(IF)、蛍光活性化細胞分類(FACS)およびRNA-seq分析を実施した。(B)全ての条件についての星状膠細胞マーカーCD44+細胞についてのFACSの図である。(C)マトリゲルのみおよび全てのリガンド条件での21日目のGFAP(赤)およびS100b(緑)のIFの図である。(D)IFを実施して、全ての条件においてGFAPおよびS100b星状膠細胞マーカーを有するDAPI+細胞のパーセンテージを得た図である。ε星状膠細胞特異性(星状膠細胞転写シグネチャー)を示す遺伝子の群について、TPMにおける遺伝子発現プロファイルの平均zスコアを、各時点および条件で配列決定した3つの試料にわたって計算する。星状膠細胞転写シグネチャーは、(i)H9 ESCと本発明者らのRNA-seqデータから得た初代星状膠細胞との間の有意に上方制御した遺伝子、(ii)H9 ESCと、FANTOM5(F5)データベースから得た大脳皮質由来の星状膠細胞との間の有意に上方制御した遺伝子、(iii)H9 ESCと、F5データベースから得た小脳由来の星状膠細胞との間の有意に上方制御した遺伝子であり、(iv)EpiMogrify GRN(遺伝子調節ネットワーク)は、正のRegDBSスコアを有する初代星状膠細胞の細胞同一性遺伝子および調節される最初の隣接までのSTRINGネットワーク上の関連する遺伝子を含む遺伝子セットであり、(v)HumanBase GRNは、HumanBaseデータベースから得た星状膠細胞特異的ネットワークである。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、
***P<0.001およびnsは有意ではない。
【
図9-1】in vitroでの心筋細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの心筋細胞のin vitroでの分化の概略図である。3日後、H9 ESCを、異なる予測条件および陽性対照マトリゲルのみの下で播種した。免疫蛍光(IF)および蛍光活性化細胞分類(FACS)を12日および20日に実施した。(B)全ての条件についての心臓マーカーCD82+およびCD13+細胞についてのFACSの図である。(C)IFを実施して、cTnT心臓マーカーを有するDAPI+領域のパーセンテージを得た図である。(D)全ての条件についての21日目のcTnT(緑)のIFの図である。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、およびnsは有意ではない。
【
図9-2】in vitroでの心筋細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの心筋細胞のin vitroでの分化の概略図である。3日後、H9 ESCを、異なる予測条件および陽性対照マトリゲルのみの下で播種した。免疫蛍光(IF)および蛍光活性化細胞分類(FACS)を12日および20日に実施した。(B)全ての条件についての心臓マーカーCD82+およびCD13+細胞についてのFACSの図である。(C)IFを実施して、cTnT心臓マーカーを有するDAPI+領域のパーセンテージを得た図である。(D)全ての条件についての21日目のcTnT(緑)のIFの図である。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、およびnsは有意ではない。
【
図9-3】in vitroでの心筋細胞の指向性分化。(A)H9胚性幹細胞(H9 ESC)からの心筋細胞のin vitroでの分化の概略図である。3日後、H9 ESCを、異なる予測条件および陽性対照マトリゲルのみの下で播種した。免疫蛍光(IF)および蛍光活性化細胞分類(FACS)を12日および20日に実施した。(B)全ての条件についての心臓マーカーCD82+およびCD13+細胞についてのFACSの図である。(C)IFを実施して、cTnT心臓マーカーを有するDAPI+領域のパーセンテージを得た図である。(D)全ての条件についての21日目のcTnT(緑)のIFの図である。細胞をDAPIで対比染色した。スケール=25μm。予測条件を対照と比較するために対応のない片側t検定を使用した。
*P<0.05、
**P<0.01、およびnsは有意ではない。
【
図10】本明細書に記載される方法の実施形態および/または特徴を実装するための1つの種類のコンピューター処理システム600のブロック図である。
【発明を実施するための形態】
【0126】
本明細書に開示され、定義される本発明は、言及されたまたは本文もしくは図面から明らかな個々の特徴の2つ以上の全ての代替の組合せに及ぶことは理解される。これらの異なる組合せの全ては本発明の様々な代替の態様を構成する。
【0127】
ここで、参照が本発明のある特定の実施形態に対して詳細になされる。本発明は実施形態と併せて記載されるが、その意図は、本発明をそれらの実施形態に限定することではないことは理解される。それどころか、本発明は、特許請求の範囲によって定義される本発明の範囲内に含まれ得る、全ての代替、修飾、および等価物を包含することを意図する。
【0128】
当業者は、本発明の実施に使用され得る、本明細書に記載されるものと同様または等価の多くの方法および材料を認識する。本発明は、記載される方法および材料に決して限定されない。本明細書に開示され、定義される本発明は、言及されたまたは本文もしくは図面から明らかな個々の特徴の2つ以上の全ての代替の組合せに及ぶことは理解される。これらの異なる組合せの全ては本発明の様々な代替の態様を構成する。
【0129】
本明細書を説明する目的のために、単数形で使用される用語は複数形も含み、逆も同様である。
本発明者らは、無血清の化学的に定義された細胞維持および分化培地の開発を容易にする因子を体系的に同定することを目的とした。細胞維持または細胞変換のための因子を同定するために、細胞の同一性または細胞性の同一性の変化をそれぞれモデル化する必要があった。
【0130】
本発明は、利用可能なエピジェネティックデータベース(例えば、ENCODEおよびRoadmapコンソーシアムによる)を利用し、H3K4me3およびH3K27me3ヒストン修飾を使用して細胞のエピジェネティック状態をモデル化する新たなコンピューターによる計算アプローチ(EpiMogrify)を提供する。EpiMogrifyは、データ駆動型の閾値、統計を使用し、細胞性の同一性を調節する(それによって所与の細胞についての細胞同一性遺伝子を同定する)重要な遺伝子に優先順位を付けるためにタンパク質間相互作用ネットワーク情報を組み込む。本発明の方法は、多数の細胞型における細胞維持および指向性分化についてのシグナル伝達分子を体系的に予測する。さらに、本発明の方法はまた、細胞維持または細胞変換についての転写因子(TF)またはエピジェネティックリモデラーなどの他のタンパク質クラスに優先順位を付けることができる。
【0131】
EpiMogrifyアルゴリズム
本発明は、細胞型についての細胞同一性遺伝子を決定する方法であって、
- 細胞同一性に対するタンパク質コード遺伝子の作用に従って細胞型におけるタンパク質コード遺伝子の優先順位に基づいてタンパク質コード遺伝子のサブセットを選択するステップ
を含み、所与のタンパク質コード遺伝子についての優先順位は、各タンパク質コード遺伝子のH3K4me3修飾領域の幅に関する情報と、タンパク質コード遺伝子産物と、細胞における他のタンパク質コード遺伝子産物との調節作用に関する情報との組合せに基づく、方法を提供する。
【0132】
本発明の方法(本明細書では「EpiMogrify」と記載される)は、細胞同一性、細胞維持および細胞変換に重要な因子を予測するために細胞のエピジェネティック状態をモデル化する。アルゴリズムの主なセクションは、
(i)ヒストン修飾参照ピーク遺伝子座を定義すること、
(ii)細胞同一性および細胞維持因子の同定、
(iii)指向性分化および分化転換についての細胞変換因子の同定
を含む。
【0133】
このアプローチは、エピジェネティックヒストン修飾、例えば、周知の転写活性化因子マークである、H3K4me3修飾を活用することによって細胞状態をモデル化することを目的とする。H3K4me3およびH3K27me3(リプレッサーマーク)ヒストン修飾プロファイルについてのChIP-seqデータは、ENCODEおよびRoadmapコンソーシアムデータリポジトリからを含む、様々なヒト細胞型に利用可能である。
【0134】
ChIP-seqピークの幅は、塩基対(bp)でのヒストン修飾デポジション(histone modification deposition)を伴うゲノム領域の長さとして定義され得、ChIP-seqピークの高さは、ヒストン修飾またはシグナル値の平均エンリッチメントとして定義され得る。ChIP-seqピーク幅は、狭いピークから広いピークまでの範囲であり得、ChIP-seqピーク高さは、短いピークから高いピークの範囲であり得ることは理解される。
【0135】
(i)ヒストン修飾参照ピーク遺伝子座の定義
各細胞型について、試料を、細胞型を表すChIP-seqプロファイルを得るために一緒にプールすることができる。細胞型を表すChIP-seqピーク幅は、典型的に、試料にわたるピーク領域と、全ての試料にわたる最大ピーク高さによって計算されたピーク高さとをマージすることによって計算される。様々な細胞型にわたるChIP-seqを比較するために、本発明者らは、全ての細胞型にわたる代表的なピークを組み合わせることによって得られる領域のセットである参照ピーク遺伝子座(RPL)を定義した。
【0136】
nを細胞型の数とする。x1、x2、..xnの範囲の各細胞型について、bを細胞型のChIP-seqピーク幅とし、hをChIP-seqピーク高さとする。参照ピーク遺伝子座(RPL)のゲノム位置は、全ての細胞型にわたるピーク領域をマージすることによって得られる。RPLにおける各遺伝子座R1、R2、..Rnについて、ピーク幅(b)は、細胞型にわたる重複するピークをマージすることによって計算され、ピーク高さ(h)は、重複するピークの最大ピーク高さによって与えられる。
【0137】
【0138】
タンパク質コード遺伝子は、ピークのゲノム位置および遺伝子の転写開始部位(TSS)に基づいてRPLに割り当てられ得る。H3K4me3ヒストン修飾は周知のプロモーターマークであるため、ピークが遺伝子のプロモーター領域(TSSから500bp)と重複する場合、遺伝子は典型的にピーク遺伝子座に割り当てられる。しかしながら、RPLは、そのTSSに対して遺伝子の別の領域に位置することができる(TSSから1000bp、2000bpまたはそれ以上を含む、TSSから500bpを超えて領域を拡大することを含む)ことは理解される。
【0139】
好ましくは、各細胞型(x)において、遺伝子(g)のピーク幅スコア(B)は、遺伝子に注釈が付けられたn個のピークのピーク幅の合計として計算される。一方、遺伝子のピーク高さの値は、遺伝子に注釈が付けられたn個のピークの最大高さとして計算される。
【0140】
【0141】
は、RPL(参照ピーク遺伝子座)での所与の細胞型xのピーク幅プロファイルである。
【0142】
【0143】
(ii)細胞同一性遺伝子および細胞維持因子の同定
EpiMogrifyは、細胞状態をモデル化するためにH3K4me3 ChIP-seqピーク幅を利用する。
【0144】
EpiMogrifyは、細胞型に特異的な因子を同定するために3段階のアプローチを使用する。第1に、微分幅広スコアが、H3K4me3 ChIP-seqピーク幅に基づいて各RPLにおいてコンピューターで計算される。第2に、各遺伝子の調節作用が、タンパク質間相互作用ネットワーク上の関連する遺伝子の値に基づいて決定される。最後に、細胞同一性遺伝子が、ランク付けされたタンパク質コード遺伝子に基づいて予測され、EpiMogrifyは、細胞状態維持についてのシグナル伝達分子を予測する。
【0145】
本明細書で使用される場合、タンパク質コード遺伝子に関して「各」という用語は、所与の細胞型における複数のタンパク質コード遺伝子を指す場合がある。複数は、細胞型における全てのタンパク質コード遺伝子を含み得る。あるいは、複数は、細胞型におけるタンパク質コード遺伝子のサブセットを含み得る。したがって、「各タンパク質コード遺伝子」は、「細胞型における各タンパク質コード遺伝子」または「遺伝子のサブセットのみを含むようにさらに改良された細胞型における各タンパク質コード遺伝子」を含み得る。
【0146】
さらに、本発明の方法が、「目的の細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定すること」を必要とし、遺伝子がH3K4me3修飾領域を含まない場合、関係のある遺伝子は、さらなる分析から除外されることは理解される。したがって、本発明は、少なくともH3K4me3修飾が存在する遺伝子の評価に限定される。
【0147】
ある特定の実施形態では、複数のタンパク質コード遺伝子のサブセットは、方法のステップの1つまたは複数において除外され得る。例えば、遺伝子のTSSにおいてH3K4me3およびH3K27me3の両方のChIP-seqピークが存在するポイズド遺伝子は、好ましくは、DBSを計算する前にモデルから取り除かれる。
【0148】
当業者は、分析に含まれるタンパク質コード遺伝子の数が多くなるほど、細胞同一性因子の予測がより強固になることを理解する。さらに、当業者は、これと、また、細胞同一性に関する最大の情報を提供するタンパク質コード遺伝子(TSSにおいて、またはTSS付近にH3K4me3修飾のみを含むそれらのタンパク質コード遺伝子など)を含めることを考慮する必要性とのバランスを取る必要性を認識する。
【0149】
さらに、EpiMogrify法の後のステップにおいて、微分H3K4me3幅が決定されるそれらの遺伝子もまた、後のネットワーク分析に含まれることは理解される。言い換えると、方法の最初のステップ(微分幅広スコアを決定するステップ)において考慮された遺伝子は、典型的に、後のネットワークスコアの計算においても考慮される。
【0150】
ステップ1:微分幅広スコアの計算
標的細胞型特異的ChIP-seqプロファイルを得るために、目的の標的細胞型が、群内のバックグラウンド細胞型のセットと比較され得る。例えば、目的の標的細胞型が初代細胞型である場合、バックグラウンドにおける細胞型は初代および幹細胞型のままである。
【0151】
バックグラウンドセットにおける細胞型が標的細胞型と類似していない場合、モデリングの統計的有意性が改善される。したがって、好ましい実施形態では、ChIP-seqプロファイルと標的細胞型とのスピアマンの相関が0.9未満である場合にのみ、バックグラウンド細胞型が選択される。
【0152】
目的の標的細胞型(x)において、1つより多い参照ピーク遺伝子座(RPL)が遺伝子(g)に割り当てられる場合、遺伝子ピーク幅スコア(B)が、割り当てられたRPLのピーク幅(b)の値の和集合によって与えられる。BGx
gは、遺伝子gにおけるバックグラウンド細胞型の遺伝子ピーク幅スコアのセットであり、バックグラウンド細胞型は、標的細胞型(x)との弁別性に基づいて選択される。Δピーク幅x
gは、標的細胞型と、バックグラウンド細胞型の平均遺伝子ピーク幅スコアとの間の遺伝子幅スコアの正規化された差である。アプローチの数は、Δピーク幅x
gを決定するために遺伝子ピーク幅スコアを平均化するために採用され得ることは理解される。中央値がこの例で使用されるが、当業者は、また、平均、最頻値または平均の他の指標を使用することができる場合もあることを理解する。
【0153】
この差の有意性(p値)は、当業者に公知の任意の好適な統計的方法によって推定され得る(1つの例は一標本ウィルコクソン検定である)。細胞型(x)および遺伝子(g)の微分幅広スコア(DBS)は、以下に示されるように、正規化されたΔピーク幅およびPvalの合計として測定され得るが、ピーク幅の差、およびその差の有意性を組み合わせるための任意の数の方法が使用され得ることは理解される(乗算、減算、正規化またはそれらの組合せを含む)。
【0154】
【0155】
ステップ2:調節微分幅広スコアの計算
細胞型の細胞同一性遺伝子、STRING V10、タンパク質間相互作用ネットワークに対する遺伝子の調節作用をコンピューターで計算するために、情報が含まれる。
【0156】
STRINGなどのタンパク質間相互作用ネットワークは、相互作用を予測する情報の供給源に関する情報を提供する。例えば、相互作用は、実験データもしくはin silicoデータ、またはそれらの両方に基づき得る。STRINGでは、これらの相互作用もスコア付けされ、予測された相互作用の信頼性の尺度を提供する。本発明のある特定の実施形態では、ネットワークにおいて提供される実験スコアがゼロより大きく、組み合わされたスコアが500より大きい場合、遺伝子ノード間の相互作用が選択される。これにより、実験的証拠がある高品質のネットワークを使用して、遺伝子の調節作用を決定することが確実にされる。
【0157】
STRINGネットワークにおける全ての遺伝子(V)について、ネットワークスコアは、遺伝子のサブネットワーク(Vg)における関連する遺伝子(r)のDBSの組合せに基づいてコンピューターで計算され得、遺伝子の出次数ノードの数(O)および関連性のレベル(L)を補正され得る。細胞特異的ネットワークを得るために、STRINGネットワークからの関連付けられた幅広いH3K4me3ピークを有しない遺伝子は取り除かれ得る。関連する遺伝子のDBSスコアの加重和は、関連性の第3のレベルまで計算され得る。
【0158】
【0159】
細胞型xにおける全てのタンパク質コード遺伝子Gにわたる正規化されたネットワークスコア(Net)
【0160】
【0161】
DBSとNetスコアの異なる組合せが、細胞同一性スコア(RegDBS)を決定するために使用され得る。好ましい実施形態では、以下に示されるように、2:1の比のDBS対ネットワークスコア(Net)が使用される。
【0162】
【0163】
ステップ3:細胞同一性遺伝子および細胞維持因子の予測
EpiMogrifyは、細胞同一性スコア(RegDBS)に基づいて遺伝子をランク付けすることによって細胞の同一性を示すタンパク質コード遺伝子を予測する。
【0164】
タンパク質間相互作用ネットワークが、遺伝子それ自体の連結性よりむしろ、タンパク質コード遺伝子の産物(すなわち、タンパク質)の連結性に関する情報を提供することは理解される。さらに、当業者は、タンパク質コード遺伝子の1つより多い「産物」が存在し得ることを理解する。したがって、本発明の方法において、タンパク質コード遺伝子の産物は、所与のタンパク質コード遺伝子からの全ての産物のいずれか一つ、または全ての組合せを含むと理解される。
【0165】
細胞維持に関して、EpiMogrifyは、細胞成長および生存に不可欠な受容体およびリガンドなどのシグナル伝達分子を予測する。本発明者らは、リガンドの約3分の2が自己分泌様式で細胞によって産生され、リガンドの残りが、微小環境を模倣するために支持細胞型によって産生されることを認識している。したがって、これを現在のモデルに組み込むために、細胞特異的RegDBSに基づいて受容体に優先順位を付けることができる。なぜならそれらは、細胞特異的であるはずであり、目的の細胞型に対する調節作用を有するはずの両方であるからである。次いでDBSに基づいて目的の細胞型および支持細胞型からのリガンドに優先順位を付けることができる。最後に、受容体-リガンド対は次に、受容体およびリガンドの組み合わせたランクによって優先順位を付けることができる。このアプローチにより、細胞培養条件を補充する際に使用するための予測される受容体-リガンド対のリガンドの同定および優先順位付けが可能になる。
【0166】
(iii)指向性分化および分化転換についての細胞変換因子の同定
EpiMogrifyは、細胞変換因子を同定するために3段階アプローチを利用する。第1に、ソース細胞型から標的細胞型への細胞変換に関して、微分幅広スコアの変化がコンピューターで計算される。次いで細胞状態の変化に及ぼす遺伝子の調節作用が決定される。最後に、転写因子が分化転換について予測され、シグナル伝達分子が指向性分化について予測される。
【0167】
簡潔に記載すると、細胞変換微分幅広スコアは以下によって計算される。
【0168】
【0169】
式中、Sはソース細胞型であり、Tは標的細胞型である。第1に、微分幅広スコア(DBS)は、ソース細胞型および標的細胞型の両方についてコンピューターで計算される。次いで、細胞変換ΔDBSを得るために、ソースDBSスコアと標的DBSスコアとの差がコンピューターで計算される。
【0170】
次に、ソース細胞型から標的細胞型への細胞変換についての調節ネットワークスコア(N)が、関連するノードの細胞変換ΔDBSスコアの加重和としてコンピューターで計算される。細胞特異的RegDBSの計算と同様に、細胞変換RegDBSは、2:1の比で細胞変換ΔDBSおよび正規化されたネットワークスコア(Net)の集成値として計算される。
【0171】
【0172】
各細胞変換について、タンパク質コード遺伝子は、RegΔDBS値によってランク付けされる。分化転換について、EpiMogrifyは、TFClass分類に基づいて定義されたタンパク質コード遺伝子のサブセットである転写因子(TF)を予測する。指向性分化について、EpiMogrifyは、受容体およびリガンド対などのシグナル伝達分子を予測する。受容体は細胞変換RegΔDBSによって優先順位を付けられ、対応するリガンドは細胞変換ΔDBSによって優先順位を付けられる。最後に、受容体-リガンド対は、受容体およびリガンドの組み合わせたランクによって優先順位を付けられる。予測される受容体-リガンド対におけるリガンドは分化プロトコールに補充され得る。
【0173】
要約すると、EpiMogrifyは、幅広いH3K4me3ヒストン修飾特性をモデル化し、細胞同一性タンパク質コード遺伝子、細胞維持についてのシグナル伝達分子、指向性分化についてのシグナル伝達分子、および分化転換についてのTFを予測する。
【0174】
定義
本明細書で使用される場合、培養中の細胞を維持するための「因子」またはソース細胞を標的細胞へ変換するための因子は、タンパク質、小分子または細胞培養培地を補充する際に使用するための他の作用物質を含み得る。好ましくは、因子はタンパク質である。タンパク質は、同種受容体に、好ましくは細胞表面上で結合し、細胞型の少なくとも1つの特徴を維持するために、細胞内でシグナル伝達カスケードを誘発するリガンドを含む、シグナル伝達分子であり得る。あるいは、因子は、細胞同一性に関連付けられた遺伝子の発現を促進し、それによってin vitroで細胞型の維持を容易にする転写因子であり得る。因子が転写因子である場合、転写因子は、細胞に直接提供され得るか、または代替として、核酸発現ベクターなどによって細胞内で発現され得る。
【0175】
ある特定の実施形態では、本発明の方法は、本明細書で同定された因子の動作を複製するか、または本明細書に記載される因子の量を増加させるため(例えば、因子をコードする遺伝子の転写を増加させるため)に細胞に対して動作する小分子の使用を含む。
【0176】
ある特定の実施形態では、因子は、例えば、培養培地に補充するために組換えタンパク質または合成タンパク質/ペプチドの形態で、外因的に提供され得る。さらなる実施形態では、因子はパラクリン様式で提供されてもよく、例えば、因子は、異なる細胞から目的の細胞に分泌される。なおさらに、因子は自己分泌形式で提供されてもよく、目的の細胞は、因子の発現/産生(例えば、場合によっては、目的の細胞またはソース細胞による、因子をコードする核酸分子またはベクターの発現)を誘導するように処理される。因子を提供するための外因性、パラクリンおよび自己分泌アプローチの組合せが利用されてもよいことも理解される。
【0177】
本明細書で使用される場合、「H3K4」修飾とは、遺伝子発現の調節に影響を及ぼすクロマチンのエピジェネティック修飾を指す。H3K4とは、ヒストンH3タンパク質上のリジン4へのメチル基の付加を指す。したがって、H3K4me3とは、3メチル基の付加(同じリジン残基でのトリメチル化)を指す。ヒストンH3タンパク質は、真核細胞においてDNAをパッケージ化するために使用され、ヒストンに対する修飾は、転写のための遺伝子の接近性を変更する。H3K4me3は、通常、近くの遺伝子の転写の活性化に関連付けられる。H3K4トリメチル化は、NURF複合体によるクロマチンリモデリングを介して遺伝子発現を調節する。二価クロマチンにおいて、H3K4me3は、遺伝子調節を制御するために抑制性修飾H3K27me3と共局在化し得る。
【0178】
本発明の方法は、目的の細胞の細胞維持もしくは目的の細胞の収集、分化転換、再プログラミング、指向性分化および/または標的細胞へのソース細胞の変換に使用するための因子を同定する際に有用性が見られる。
【0179】
「in vitroで目的の細胞を維持すること」は、細胞が主要な形態学的および生物物理学的特徴を保持するような細胞培養条件で細胞を培養することを含み得ることは理解される。これは、例えば、目的の細胞に関連付けられたマーカーが、細胞培養の数回の継代後に保持されることを確認することによって測定され得る。「目的の細胞を維持すること」および「主要な形態学的および生物物理学的特徴を保持すること」は、培養中の細胞の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%またはそれ以上の生存率を維持することを含み得ることは理解される。好ましくは、細胞は、少なくとも2日間、少なくとも5日間、少なくとも10日間、少なくとも20日間、少なくとも30日間、少なくとも60日間、またはそれ以上の間、維持される。さらに、「主要なおよび生物物理学的特徴を保持すること」は、本発明の方法に従って培養中に維持される細胞が、目的の細胞と関連付けられたマーカーの少なくとも90%、少なくとも80%、少なくとも70%、少なくとも60%、または少なくとも50%を保持することを意味すると理解され得る。好ましくは、細胞は、培養期間の間、マーカーの少なくとも70%を保持する。さらに、「主要なおよび生物物理学的特徴を保持すること」はまた、本発明の方法に従って培養中に維持される細胞が、目的の細胞と関連付けられた形態学的特性の少なくとも90%、少なくとも80%、少なくとも70%、少なくとも60%、または少なくとも50%を保持することを意味すると理解され得る。好ましくは、細胞は、培養期間の間、目的の細胞と関連付けられた形態学的特性の少なくとも70%を保持する。
【0180】
「細胞変換」(例えば、ソース細胞から標的細胞への)という用語は、脱分化、分化転換、再プログラミングまたは指向性分化を指すことができると理解される。
本明細書で使用される場合、脱分化とは、最終的に分化した細胞を、それ自体の系統内からのより未分化の段階に戻し、これによりそれを増殖させることを可能にする方法を指す。指向性分化とは、多能性細胞状態(例えば、幹細胞)から特定の型の分化した標的細胞への分化を指す。
【0181】
分化転換とは、典型的に、細胞が、系統を切り替えることができるか、または2つの異なる細胞型の間で直接発生することもできる時点に修飾されるプロセスを指す。
細胞の再プログラミングとは、典型的に、成熟した特殊化した細胞を人工多能性幹細胞に戻すプロセスを指す。
【0182】
本明細書で使用される場合、目的の細胞は、in vitroで細胞を維持するための因子(受容体/リガンド対、リガンド、転写因子または他の作用物質を含む)を同定する必要がある任意の細胞である。目的の細胞は、3つの胚性胚葉、すなわち、外胚葉、中胚葉および内胚葉の胚葉のいずれかに見出される任意の細胞であり得る。本明細書で使用される場合、外胚葉とは、皮膚、爪などの体外組織を指し、中胚葉とは、筋肉などの組織を指すが、血液も含まれ、内胚葉とは、消化管細胞などの内側内層を指す。様々な目的の細胞の例は表2に提供される。中胚葉に由来する目的の細胞の例には、骨格筋、骨格、皮膚の真皮、結合組織、泌尿生殖器系、心臓、血液(リンパ細胞)、および脾臓の細胞が含まれる。内胚葉に由来する細胞の例には、胃、結腸、肝臓、膵臓、膀胱の細胞;尿道、気管の上皮部分、肺、咽頭、甲状腺、副甲状腺、腸の内層が含まれる。外胚葉に由来する細胞の例には、中枢神経系、網膜および水晶体、頭蓋および感覚、神経節および神経、色素細胞、頭部結合組織、表皮、毛髪、および乳腺の細胞が含まれる。
【0183】
「目的の細胞」は、組織培養中に維持するのに好適な任意の細胞を含み得る。目的の細胞の非限定的な例には、表2に記載された細胞が含まれる。より具体的には、本明細書で使用される場合、「目的の細胞」または「ソース細胞」は、初代細胞(非不死化細胞)であり得るか、または細胞株に由来する細胞(不死化細胞)であり得るか、または個体から単離された組織であり得る。目的の細胞はまた、前駆細胞、例えば、神経前駆細胞、造血前駆細胞、筋原性前駆細胞、内皮前駆細胞、および一般的なリンパ球または骨髄性前駆細胞であり得る。目的の細胞は、細胞の集団、例えば、組織または組織から得られた細胞などの細胞の混合集団を指す場合もある。一部の実施形態では、目的の細胞またはソース細胞は未分化細胞である。他の実施形態では、目的の細胞またはソース細胞は、分化転換した細胞または分化転換している細胞である。分化転換した細胞は、分化転換の過程、すなわち、体細胞の表現型を別の体細胞に変化させる過程から生成された細胞である。本明細書で使用される場合、「体細胞」は、胚葉(外胚葉、内胚葉または中胚葉)の1つに由来する細胞である。分化転換している細胞は分化転換の過程を経ている細胞である。すなわち、体細胞の表現型が別の体細胞の表現型に対して変化しており、最終的な体細胞のマーカーがまだ完全に確立されていない。他の実施形態では、目的の細胞またはソース細胞は、特殊化した細胞型である分化した細胞である。
【0184】
本明細書で使用される場合、ソース細胞または目的の細胞は、体細胞または罹患細胞を含む、本明細書に記載される任意の細胞型であり得る。体細胞は、成体細胞、または成体もしくは非胚性細胞の1つもしくは複数の検出可能な特徴を示す成体に由来する細胞であり得る。ソース細胞の他の例には、造血細胞、例えば、リンパ球、骨髄細胞などの前駆細胞;頬粘膜細胞、表皮細胞、間葉細胞、ケラチノサイト、肝細胞、胚性細胞、幹細胞または幹細胞の1つもしくは複数の特徴を有するように処理されている細胞が含まれる。罹患細胞の場合、罹患細胞は、疾患または状態の1つまたは複数の検出可能な特徴を示す細胞であり得、例えば、罹患細胞は、がんの1つまたは複数の臨床的または生化学的マーカーを示すがん細胞であり得る。
【0185】
ソース細胞または目的の細胞はまた、多能性幹細胞、好ましくは人工多能性幹細胞(iPSC)を含む、幹細胞であり得る。
本明細書で使用される場合、「体細胞」という用語は、生殖系列細胞とは対照的に、生物の体を形成する任意の細胞を指す。哺乳動物では、生殖系列細胞(「配偶子」としても知られている)は、受精中に融合して、接合子と呼ばれる細胞を産生し、そこから哺乳動物の胚全体が発達する精子および卵子である。精子および卵子、それらが生成される細胞(生殖母細胞)および未分化の幹細胞を除いて、哺乳動物の体における全ての他の細胞型は、体細胞:内臓器官、皮膚、骨、血液、および結合組織であり、これらの全ては体細胞から構成されている。一部の実施形態では、体細胞は、「非胚性体細胞」であり、これは、胚に存在しないか、または胚から得られず、in vitroでこのような細胞の増殖から生じない体細胞を意味する。一部の実施形態では、体細胞は、「成体体細胞」であり、これは、胚もしくは胎児以外の生物に存在するか、もしくはその生物から得られるか、またはin vitroでこのような細胞の増殖から生じる細胞を意味する。体細胞は、例えば、テロメラーゼ逆転写酵素(TERT)のレベルを増加させることによって、細胞の無制限供給を提供するために不死化され得る。例えば、TERTのレベルは、内因性遺伝子からTERTの転写を増加させることによって、または任意の遺伝子送達方法もしくはシステムを介して導入遺伝子を導入させることによって増加され得る。
【0186】
別段の指示がない限り、体細胞を変換するための方法は、in vivoおよびin vitroの両方で実施され得る(in vivoの場合、体細胞が対象内に存在する場合に実施され、in vitroの場合、培養中に維持される単離された体細胞を使用して実施される)。
【0187】
胚性幹細胞などの胚性細胞は、胚性細胞株に由来する細胞であり得、胚または胎児に直接由来しない細胞であり得る。あるいは、胚性細胞は胚または胎児に由来し得るが、その細胞は、胚もしくは胎児を破壊せずに、または胚もしくは胎児の発達に悪影響を与えずに得られるか、または単離される。
【0188】
本発明はまた、人工多能性幹細胞(iPSC)の使用を企図する。
ヒト、個体を含む、胎児、新生児、若年または成体の霊長類由来の細胞を含む、分化した体細胞は、本発明の方法における好適なソース細胞(または目的の細胞)である。好適な体細胞には、骨髄細胞、上皮細胞、内皮細胞、線維芽細胞、造血細胞、ケラチノサイト、肝細胞、腸細胞、間葉細胞、骨髄前駆細胞および脾臓細胞が含まれるが、これらに限定されない。あるいは、体細胞は、それ自体で増殖し、血液幹細胞、筋肉/骨幹細胞、脳幹細胞および肝幹細胞を含む、他の細胞型に分化することができる細胞であり得る。好適な体細胞は、転写因子をコードする遺伝物質を含む転写因子の取り込みに対して、受容性であるか、または科学文献において一般に公知の方法を使用して受容性にすることができる。取り込みを増強する方法は細胞型および発現系に応じて異なり得る。好適な形質導入効率を有する受容性のある体細胞を調製するために使用される例示的な条件は当業者に周知である。開始体細胞は約24時間の倍加時間を有し得る。
【0189】
本明細書で使用される場合、「単離された細胞」という用語は、最初に見出された生物またはそのような細胞の子孫から除去された細胞を指す。任意選択により、細胞は、例えば、他の細胞の存在下で、in vitroで培養されている。任意選択により、細胞は、後で第2の生物に導入されるか、またはそれが単離された生物(またはそれが由来する細胞)に再導入される。
【0190】
本明細書で使用される場合、細胞の単離された集団に関して「単離された集団」という用語は、混合または不均一な細胞の集団から除去され、分離された細胞の集団を指す。一部の実施形態では、単離された集団は、細胞が単離または濃縮された不均一な集団と比較して実質的に純粋な細胞の集団である。
【0191】
特定の細胞集団に関して、「実質的に純粋」という用語は、全細胞集団を構成する細胞に対して、少なくとも約75%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%純粋である細胞の集団を指す。これに対して、標的細胞の集団に関して、「実質的に純粋」または「本質的に精製された」という用語は、約20%未満、より好ましくは約15%、10%、8%、7%未満、最も好ましくは約5%、4%、3%、2%、1%未満、または1%未満の、本明細書の用語によって定義される標的細胞またはそれらの子孫ではない細胞を含有する細胞の集団を指す。
【0192】
本明細書で使用される場合、「標的細胞」に対する言及は、標的細胞または標的細胞型と本明細書で称される細胞のいずれか1つまたは複数に対する言及であり得る。
標的細胞は、3つの胚性胚葉、すなわち、内胚葉、中胚葉、および外胚葉のいずれかを表す細胞であり得る。例えば、標的細胞は、典型的に、骨格筋、骨格、皮膚の真皮、結合組織、泌尿生殖器系、心臓、血液(リンパ細胞)、および脾臓(中胚葉);胃、結腸、肝臓、膵臓、膀胱;尿道、気管の上皮部分、肺、咽頭、甲状腺、副甲状腺、腸の内層(内胚葉);または中枢神経系、網膜および水晶体、頭蓋および感覚、神経節および神経、色素細胞、頭部結合組織、表皮、毛髪、乳腺(外胚葉)に見出される細胞である。
【0193】
ソース細胞は、それが標的細胞型の少なくとも1つの特徴を示す場合、本発明の方法によって、標的細胞に変換されるか、または標的様細胞になると決定される。例えば、ヒト線維芽細胞は、細胞が標的細胞型の少なくとも1つの特徴を示す場合、ケラチノサイト用細胞に変換されると同定される。典型的に、細胞は、標的細胞型の1、2、3、4、5、6、7、8またはそれ以上の特徴を示す。例えば、標的細胞がケラチノサイト細胞である場合、細胞は、いずれか1つもしくは複数のケラチノサイトマーカーの上方制御および/または細胞形態の変化が検出可能である場合、ケラチノサイト様細胞であると同定されるか、または決定され、好ましくは、ケラチノサイトマーカーには、ケラチン1、ケラチン14およびインボルクリンが含まれ、細胞形態は敷石様外観である。本発明のいずれかの態様において、標的細胞の特徴は、細胞形態、遺伝子発現プロファイル、活性アッセイ、タンパク質発現プロファイル、表面マーカープロファイル、または分化能の分析によって決定され得る。特徴またはマーカーの例には、本明細書に記載されるものおよび当業者に公知のものが含まれる。関連するマーカーの他の例には、例えば、造血幹細胞(HSC)へのケラチノサイトの変換に関して:CD45(汎造血マーカー)、CD19/20(B細胞マーカー)、CD14/15(骨髄)、CD34(前駆細胞/SCマーカー)、CD90(SC)およびアルファ-インテグリン(HSCによって発現されないケラチノサイトマーカー);造血幹細胞へのヒト胚性幹細胞に関して:Runx1(GFP)、CD45(汎造血マーカー)、CD19/20(B細胞マーカー)、CD14/15(骨髄)、CD34(前駆細胞/SCマーカー)、CD90(SC)、Tra-1-160(HSCにおいて発現されないESCマーカー);高齢または成体HSCの若返りに関して:若いおよび高齢のヒトHSCの転写シグネチャーの比較(例えば、RNA-seqの使用)、ならびに若返った細胞を動物に移植し、次いで1、3および6カ月後に評価して、骨髄バイアスを決定することによる「若返ったHSC」の機能的特徴(骨髄バイアスの消失は「若返った」HSCを示す)が含まれる。本明細書に記載される変換の多くについてのマーカーの例は以下の表1に示される。
【0194】
【0195】
【0196】
【0197】
【0198】
【0199】
【0200】
【0201】
【0202】
【0203】
特定の実施形態では、in vitroで目的の細胞を維持するために、表2に記載された因子(リガンド)の1つ、2つ、3つ、4つ、または5つ、またはそれ以上が、目的の細胞に加えられるか、または目的の細胞と接触させるために使用される。他の実施形態では、表2に記載された因子(リガンド)の6つ、7つ、8つ、9つ、10個、11個、12個、13個、14個、15個もしくはそれ以上、20個もしくはそれ以上、25個もしくはそれ以上、30個もしくはそれ以上、または35個もしくはそれ以上が、目的の細胞に加えられるか、または目的の細胞と接触させるために使用される。
【0204】
本発明はまた、標的細胞へソース細胞を変換するための方法を提供する。このような変換に使用するための因子を同定するための方法は本明細書でさらに説明される。本文書のいずれかの箇所で概説されている実施形態に加えて、ある特定の実施形態では、ソース細胞は胚性幹細胞であり、標的細胞へ胚性幹細胞を変換するための因子は以下の表に提供される通りである:
【0205】
【0206】
【0207】
【0208】
【0209】
【0210】
特定の実施形態では、in vitroで標的細胞へソース細胞を変換するために、表3に記載された因子の1つ、2つ、3つ、4つ、または5つ、またはそれ以上が、ソース細胞に加えられるか、またはソース細胞と接触させるために使用される。代替の実施形態では、例えば、本明細書にさらに記載されるように、細胞を、上記因子の1つまたは複数の発現を増加させるために作用物質と接触させる。他の実施形態では、表3に記載された因子(リガンド)の6つ、7つ、8つ、9つ、10個、11個、12個、13個、14個、15個もしくはそれ以上、20個もしくはそれ以上、25個もしくはそれ以上、30個もしくはそれ以上、または35個もしくはそれ以上が、標的細胞へ変換するために、ソース細胞に加えられるか、またはソース細胞と接触させるために使用される。
【0211】
当業者は、上記の表2および3に示されるリガンド/因子の各々に精通している。いくつかの特に好ましい例を以下にさらに提供する。
本明細書で使用される場合、FN1とは、インテグリンと呼ばれる膜貫通受容体タンパク質に結合する細胞外マトリクスの高分子量(約440kDa)糖タンパク質である、タンパク質フィブロネクチンを指す。FN1はまた、CIG、ED-B、FINC、FN、FNZ、GFND、GFND2、LETS、MSF、フィブロネクチン1、SMDCFとしても知られている。フィブロネクチンの例示的なアミノ酸配列は、UniprotアクセッションP02751に提供され、アクセッションENSG00000115414によって例示される核酸配列によってコードされる。
【0212】
本明細書で使用される場合、COL4A1とは、コラーゲンアルファ-1(IV)鎖(HANAC、ICH、POREN1、アレステン、BSVD、RATOR、コラーゲンIV型アルファ1、コラーゲンIV型アルファ1鎖、BSVD1としても知られている)を指す。COL4A1の例示的なアミノ酸配列は、UniprotアクセッションP02462に提供され、アクセッションENSG00000187498によって例示される核酸配列によってコードされる。
【0213】
本明細書で使用される場合、COL1A2とは、コラーゲンアルファ-2(I)鎖(OI4、コラーゲンI型アルファ2、コラーゲンI型アルファ2鎖、EDSCV、EDSARTH2としても知られている)を指す。COL1A2の例示的なアミノ酸配列は、UniprotアクセッションP08123に提供され、アクセッションENSG00000164692によって例示される核酸配列によってコードされる。
【0214】
本明細書で使用される場合、EDIL3とは、ヒトにおいてEDIL3遺伝子によってコードされるタンパク質である、「EGF様リピートおよびジスコイジンドメイン3」を指す。この遺伝子によってコードされるタンパク質はインテグリンリガンドである。これは、血管新生を媒介するのに重要な役割を果たし、血管壁の再構築および発達に重要であり得る。これはまた、内皮細胞の挙動にも影響を及ぼす。EDIL3の例示的なアミノ酸配列は、UniprotアクセッションO43854に提供され、アクセッションENSG00000164176によって例示される核酸配列によってコードされる。
【0215】
本明細書で使用される場合、ADAM12とは、ヒトにおいてADAM12遺伝子によってコードされる酵素である、ジスインテグリンおよびメタロプロテイナーゼドメイン含有タンパク質12(以前はメルトリン)を指す。ADAM12は2つのスプライスバリアントを有し、長い形態のADAM12-Lは膜貫通領域を有し、短いバリアントのADAM12-Sは可溶性であり、膜貫通および細胞質ドメインを欠く。ADAM12はまた、ADAM12-OT1、CAR10、MCMP、MCMPMltna、MLTN、MLTNA、ADAMメタロペプチダーゼドメイン12としても知られている。ADAM12の例示的なアミノ酸配列は、UniprotアクセッションO43184に提供され、アクセッションENSG00000148848によって例示される核酸配列によってコードされる。
【0216】
本明細書で使用される場合、WNT5A(hWntファミリーメンバー5Aとしても知られている)は、ヒトにおいてWNT5A遺伝子によってコードされるタンパク質である。Wnt5aの例示的なアミノ酸配列は、UniprotアクセッションP41221に提供され、アクセッションENSG00000114251によって例示される核酸配列によってコードされる。
【0217】
本明細書で使用される場合、LAMB1とは、ラミニンサブユニットベータ-1をコードする遺伝子を指す。このタンパク質はまた、CLM、LIS5、およびラミニン、ベータ1としても知られている。細胞外マトリクス糖タンパク質のファミリーである、ラミニンは、基底膜の主要な非コラーゲン構成成分である。それらは、細胞接着、分化、遊走、シグナル伝達、神経突起伸長および転移を含む、多種多様な生物学的プロセスに関与している。ラミニンは、3つの同一ではない鎖である、ラミニンアルファ、ベータおよびガンマ(以前はそれぞれA、B1、およびB2)から構成され、それらは、各々異なる鎖によって形成される3つの短いアーム、および全て3つの鎖から構成される長いアームからなる十字構造を形成する。LAMB1の例示的なアミノ酸配列は、UniprotアクセッションP07942に提供され、アクセッションENSG00000091136によって例示される核酸配列によってコードされる。
【0218】
本明細書で使用される場合、COL3A1とは、ホモトリマー、または各々がIII型コラーゲンのアルファ1鎖と呼ばれる3つの同一のペプチド鎖(モノマー)から構成されるタンパク質である、III型コラーゲンを指す。正式には、モノマーは、コラーゲンIII型、アルファ-1鎖と呼ばれ、ヒトにおいてCOL3A1遺伝子によってコードされる。III型コラーゲンは、タンパク質が、長く、柔軟性がない、三重らせんドメインを有する線維状コラーゲンの1つである。COL3A1はまた、識別子によってEDS4A、コラーゲンIII型アルファ1、コラーゲンIII型アルファ1鎖、EDSVASC、およびPMGEDSVとも称される。COL3A1の例示的なアミノ酸配列は、UniprotアクセッションP02461に提供され、アクセッションENSG00000168542によって例示される核酸配列によってコードされる。
【0219】
本明細書で使用される場合、TFPIとは、第Xa因子(Xa)を可逆的に阻害することができる一本鎖ポリペプチドである、組織因子経路阻害剤を指す。Xaは阻害されるが、Xa-TFPI複合体は、その後、FVIIa-組織因子複合体も阻害することができる。TFPIはまた、識別子によってEPI、LACI、TFI、TFPI1とも称される。TFPIの例示的なアミノ酸配列は、UniprotアクセッションP10646に提供され、アクセッションENSG00000003436によって例示される核酸配列によってコードされる。
【0220】
本明細書で使用される場合、FGF7(HBGF-7またはKGFとしても知られている)とは、ヒトにおいてFGF7遺伝子によってコードされるタンパク質である、ケラチノサイト成長因子を指す。FGFファミリーのメンバーは、広範な分裂促進的および細胞生存活性を有し、胚発生、細胞成長、形態形成、組織修復、腫瘍成長および浸潤を含む、様々な生物学的プロセスに関与する。このタンパク質は強力な上皮細胞特異的成長因子であり、その分裂促進的活性は、ケラチノサイトにおいて主に示されるが、線維芽細胞および内皮細胞では示されない。FGF7の例示的なアミノ酸配列は、UniprotアクセッションP21781に提供され、アクセッションENSG00000140285によって例示される核酸配列によってコードされる。
【0221】
本明細書で使用される場合、FGF10とは、ヒトにおいてFGF10遺伝子によってコードされるタンパク質である、線維芽細胞成長因子10を指す。FGFファミリーのメンバーは、広範な分裂促進的および細胞生存活性を有し、胚発生、細胞成長、形態形成、組織修復、腫瘍成長および浸潤を含む、様々な生物学的プロセスに関与する。線維芽細胞成長因子10は、肢芽および器官形成の発達において最初に見られるパラクリンシグナル伝達分子である。FGF10シグナル伝達は上皮分岐に必要とされる。したがって、肺、皮膚、耳および唾液腺などの全ての分岐モルフォゲン器官は、FGF10の一定の発現を必要とした。このタンパク質は、表皮細胞を角質化するための分裂促進的活性を示すが、本質的に線維芽細胞に対する活性はなく、これはFGF7の生物活性と同様である。FGF10の例示的なアミノ酸配列は、UniprotアクセッションO15520に提供され、アクセッションCCDS3950.1によって例示される核酸配列によってコードされる。
【0222】
本明細書で使用される場合、APOEとは、体内の脂肪の代謝に関与するタンパク質である、アポリポタンパク質E(AD2、APO-E、LDLCQ5、LPG、ApoE4としても知られている)を指す。APOEの例示的なアミノ酸配列は、UniprotアクセッションP02649に提供され、アクセッションENSG00000130203によって例示される核酸配列によってコードされる。
【0223】
本明細書で使用される場合、C3とは、補体系において中心的な役割を果たし、先天性免疫に寄与するタンパク質である、補体成分3を指す。このタンパク質はまた、識別子によってAHUS5、ARMD9、ASP、C3a、C3b、CPAMD1、HEL-S-62p、および補体成分3とも称され得る。C3の例示的なアミノ酸配列は、UniprotアクセッションP01024に提供され、アクセッションENSG00000125730によって例示される核酸配列によってコードされる。
【0224】
本明細書で使用される場合、SERPINE1とは、ヒトにおいてSERPINE1遺伝子によってコードされるタンパク質である、内皮プラスミノーゲンアクチベーターインヒビターまたはセルピンE1としても知られているプラスミノーゲンアクチベーターインヒビター-1(PAI-1)を指す。PAI-1は、組織プラスミノーゲンアクチベーター(tPA)およびウロキナーゼ(uPA)、プラスミノーゲンのアクチベーター、したがって線維素溶解(血栓の生理学的分解)の主要な阻害剤として機能するセリンプロテアーゼ阻害剤(セルピン)である。これはセリンプロテアーゼ阻害剤(セルピン)タンパク質(SERPINE1)である。SERPINE1の例示的なアミノ酸配列は、UniprotアクセッションP05121に提供され、アクセッションENSG00000106366によって例示される核酸配列によってコードされる。
【0225】
本明細書で使用される場合、COL6A3とは、ヒトにおいてCOL6A3遺伝子によってコードされるタンパク質である、コラーゲンアルファ-3(VI)鎖を指す。この遺伝子は、ほとんどの結合組織に見出されるビーズ状のフィラメントコラーゲンである、VI型コラーゲンの3つのアルファ鎖のうちの1つである、アルファ3鎖をコードする。VI型コラーゲンのアルファ3鎖は、アルファ1および2鎖よりもはるかに大きい。このサイズの違いは、大部分は、全てのアルファ鎖のアミノ末端球状ドメインに見出される、フォンヴィレブランド因子A型ドメインと同様にサブドメインの数の増加に起因する。完全長の転写産物に加えて、様々なサイズのN末端球状ドメインを有するタンパク質をコードする4つの転写産物バリアントが同定されている。COL6A3の例示的なアミノ酸配列は、UniprotアクセッションP12111に提供され、アクセッションENSG00000163359によって例示される核酸配列によってコードされる。
【0226】
本明細書で使用される場合、CXCL12とは、C-X-Cモチーフケモカイン12、IRH、PBSF、SCYB12、SDF1、TLSF、TPAR1、およびC-X-Cモチーフケモカインリガンド12としても知られている、ストロマ細胞由来因子1(SDF1)を指す。CXCL12をコードする遺伝子は、選択的スプライシングによって7つのアイソフォームを産生する。CXCL12の例示的なアミノ酸配列は、UniprotアクセッションP48061に提供され、アクセッションENSG00000107562によって例示される核酸配列によってコードされる。
【0227】
本明細書で使用される場合、TGFB2およびTGFB3とは、それぞれ、トランスフォーミング成長因子ベータ2およびトランスフォーミング成長因子ベータ3を指す。両方のタンパク質は、細胞分化、胚形成および発生に関与するサイトカインである。TGFB2についての例示的なアクセッション番号はP61812である。TGFB3についての例示的なアクセッション番号はP10600である。
【0228】
本明細書で使用される場合、GDF5とは、成長/分化因子5を指し、GDF5遺伝子によってコードされる。この遺伝子によってコードされるタンパク質は、骨形成タンパク質(BMP)ファミリーに密接に関連しており、TGF-ベータスーパーファミリーのメンバーである。GDF5についての例示的なアクセッション番号はP43026である。
【0229】
本明細書で使用される場合、NID1とは、以前はエンタクチンとして知られている、ニドゲン-1(NID-1)を指し、ヒトにおいてNID1遺伝子によってコードされるタンパク質である。ニドゲン-1およびニドゲン-2の両方は、IV型コラーゲン、プロテオグリカン(ヘパラン硫酸およびグリコサミノグリカン)、ラミニンおよびフィブロネクチンなどの他の成分と並んで基底膜の必須成分である。NID1についての例示的なアクセッション番号はP14543である。
【0230】
本明細書で使用される場合、THBS1とは、THBS1と略されるトロンボスポンジン1を指し、ヒトにおいてTHBS1遺伝子によってコードされるタンパク質である。トロンボスポンジン1は、ジスルフィド結合したホモトリマータンパク質のサブユニットである。このタンパク質は、細胞間および細胞-マトリクス間の相互作用を媒介する接着性糖タンパク質である。このタンパク質は、フィブリノーゲン、フィブロネクチン、ラミニン、コラーゲンV型およびVII型ならびにインテグリンアルファ-V/ベータ-1に結合することができる。THBS1についての例示的なアクセッション番号はP07996である。
【0231】
本明細書で使用される場合、BMP4およびBMP6とは、それぞれ、骨形成タンパク質4および骨形成タンパク質6を指す。これらの遺伝子によってコードされるタンパク質は、TGFβスーパーファミリーのメンバーである。骨形成タンパク質は、骨および軟骨の成長を誘導するそれらの能力について知られている。BMP4は進化的に高度に保存されている。BMP4は、腹側辺縁帯ならびに眼、心臓血液および耳胞における初期胚発生に見出される。BMP6は、間葉幹細胞において全ての骨形成マーカーを誘導することができる。BMP6についての例示的なアクセッション番号はP12644である。BMP6についての例示的なアクセッション番号はP22004である。
【0232】
本明細書で使用される場合、CTGFとは、CCN2または結合組織成長因子としても知られていると称され、細胞外マトリクス関連ヘパリン結合タンパク質のCCNファミリーのマトリクス細胞タンパク質である(CCN細胞間シグナル伝達タンパク質も参照のこと)。CTGFは、細胞接着、遊走、増殖、血管新生、骨格の発達、および組織創傷修復を含む、多くの生物学的プロセスにおいて重要な役割を果たし、線維症およびがんのいくつかの形態に決定的に関与する。CTGFについての例示的なアクセッション番号はP29279である。
【0233】
本明細書で使用される場合、PDGFBとは、血小板由来成長因子サブユニットBを指し、ヒトにおいてPDGFB遺伝子によってコードされるタンパク質である。この遺伝子によってコードされるタンパク質は、血小板由来成長因子ファミリーのメンバーである。このファミリーの4つのメンバーは、間葉起源の細胞についての分裂促進因子であり、8つのシステインのモチーフによって特徴付けられる。この遺伝子産物は、ホモ二量体(PDGF-BB)として、または血小板由来成長因子アルファ(PDGFA)ポリペプチドとのヘテロ二量体(PDGF-AB)として存在することができ、二量体はジスルフィド結合によって連結されている。PDGFBについての例示的なアクセッション番号はP01127である。
【0234】
好ましい例では、目的の細胞を維持するための関連する因子(リガンド)は、細胞が関連する因子と「接触される」ように細胞に直接提供され得ることは理解される。さらに、本明細書で使用される場合、「接触する」、「接触される」、「接触している」、「処理する」、「処理している」、または「導入している」という用語は、交換可能に使用することができ、細胞を、外因性DNAのトランスフェクションまたは細胞への作用物質の導入などの任意の種類のプロセスまたは条件に供することを意味する。
【0235】
例えば、培養培地に、関連する因子を直接補充することができる。代替の実施形態では、関連する因子をコードする核酸分子(または関連する因子の1つもしくは複数をコードするベクター)を細胞にトランスフェクトすることができ、それによってその後、因子は細胞によって発現される。
【0236】
さらに、細胞は、細胞において関連する因子の量を増加させるような方法で処理され得る。再び、これは、細胞培養培地の直接補充によってもよいか、または細胞において内因性遺伝子の発現を増加させるための組換え方法によってもよいか、または関連する因子をコードする核酸の外因性供給源を提供し、核酸を発現させ、それによって細胞において因子の量を増加させることによってもよい。
【0237】
同様に、細胞を変換する方法に関して(分化転換および指向性分化の方法に関する場合を含む)、変換するための因子は、培養中に直接提供されてもよいか、または代替として、標的細胞への変換を促進するためにソース細胞において発現されてもよい。
【0238】
タンパク質である因子(転写因子および他の調節因子を含む)は、本明細書に記載される方法に従って細胞に提供され得ることが理解される。あるいは、因子のバリアントが、同じ結果を達成するように提供され得る。
【0239】
ポリペプチドに言及した際の「バリアント」という用語は、全長ポリペプチドに対して、少なくとも70%、80%、85%、90%、95%、98%、または99%同一である。本発明は、本明細書に記載される因子のバリアントの使用を企図する。バリアントは、全長ポリペプチドの断片または天然に存在するスプライスバリアントであってもよい。バリアントは、ポリペプチドの断片に対して、少なくとも70%、80%、85%、90%、95%、98%、または99%同一であるポリペプチドであってもよく、断片は、全長野生型ポリペプチドまたはそのドメインが、標的細胞型へのソース細胞型の変換を促進する能力などの目的の機能的活性を有する限り、少なくとも50%、60%、70%、80%、85%、90%、95%、98%、または99%である。一部の実施形態では、ドメインは、配列のいずれかのアミノ酸位置から始まって、C末端に伸長し、長さが少なくとも100、200、300、または400アミノ酸である。タンパク質の活性を排除するか、または実質的に減少させるような当該技術分野において知られる変動は、好ましくは回避される。一部の実施形態では、バリアントは、全長ポリペプチドのNおよび/またはC末端部分を欠き、例えば、いずれかの末端から、最大10、20、または50アミノ酸を欠く。一部の実施形態では、ポリペプチドは、成熟(全長)ポリペプチドの配列を有し、これは、正常な細胞内タンパク質分解プロセシング中に(例えば、同時翻訳または翻訳後プロセシング中に)除去されたシグナルペプチドなどの1つまたは複数の部分を有するポリペプチドを意味する。天然に発現する細胞から精製することによる以外で、タンパク質が産生される一部の実施形態では、タンパク質はキメラポリペプチドであり、これは、そのタンパク質が2つまたはそれ以上の異なる種に由来する部分を含有することを意味する。天然に発現する細胞から精製することによる以外で、タンパク質が産生されるいくつかの実施形態では、タンパク質は誘導体であり、これは、これらの配列がタンパク質の生物活性を実質的に減少させない限り、タンパク質に関連しないさらなる配列を、タンパク質が含むことを意味する。当業者は、特定のポリペプチドバリアント、断片、または誘導体が、当該技術分野において公知のアッセイを使用して機能的であるかどうかについて知るか、または容易に確認することができる。例えば、実施例において本明細書に開示されるようなアッセイを使用して、転写因子のバリアントが、ソース細胞を標的細胞型に変換する能力が評価され得る。他の簡便なアッセイには、ルシフェラーゼなどの検出可能なマーカーをコードする核酸配列に作動可能に連結された転写因子結合部位を含有するレポーター構築物の転写を活性化する能力を測定することが含まれる。本発明のある特定の実施形態では、機能的バリアントまたは断片は、全長野生型ポリペプチドの活性の少なくとも50%、60%、70%、80%、90%、95%またはそれ以上を有する。
【0240】
因子の量を増加させることに関して「の量を増加させる」という用語は、目的の細胞(例えば、星状膠細胞、心筋細胞、平滑筋細胞、内皮細胞または標的細胞へ変換するためのソース細胞など)において因子の量を増加させることを指す。一部の実施形態では、因子の量が、対照(例えば、前記発現カセットのいずれも導入されていない細胞)に対して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、またはそれ以上である場合、因子の量は、目的の細胞(例えば、1つまたは複数の転写因子をコードするポリヌクレオチドの発現を指示する発現カセットが導入されている細胞)において「増加している」。しかしながら、転写因子(またはそれをコードするプレmRNAもしくはmRNA)の転写、翻訳、安定性または活性の量、割合または効率を増加させるいずれかの方法を含む、転写因子の量を増加させるいずれかの方法が企図される。さらに、転写発現の負の調節因子の下方制御または干渉、存在する転写の効率の増加(例えば、SINEUP)も考慮される。
【0241】
細胞または生物におけるタンパク質、遺伝子、核酸、またはポリヌクレオチドに関連して使用される場合、「外因性」という用語は、人工的もしくは天然手段によって、細胞もしくは生物内に導入されているタンパク質、遺伝子、核酸、もしくはポリヌクレオチドを指すか、または細胞に関連して使用される場合、人工的もしくは天然手段によって、単離され、続いて他の細胞もしくは生物に導入されている細胞を指す。外因性核酸は、異なる生物もしくは細胞に由来していてもよいか、または生物もしくは細胞内に天然に存在する1つもしくは複数のさらなる核酸のコピーであってもよい。外因性細胞は、異なる生物由来であってもよいか、または同じ生物由来であってもよい。非限定的な例として、外因性核酸は、天然細胞のものと異なる染色体位置にあるものであるか、またはそうでなければ、天然に見られるものとは異なる核酸配列によって隣接されている。外因性核酸はまた、エピソームベクターなどの染色体外であってもよい。
【0242】
本開示の方法は、プレートあたり24、48、96または384ウェルなどのマルチウェルプレート、マイクロチップまたはスライドを含むが、これらに限定されない、小型化のいずれかの許容可能な方法を通じて、アッセイ系において「小型化」されてもよい。アッセイは、マイクロチップ支持体上で行えるようにサイズを減少させてもよく、これには、有利には、より少ない量の試薬および他の材料が含まれる。ハイスループットスクリーニングにつながるプロセスのいかなる小型化も本発明の範囲内である。
【0243】
本発明のいずれかの方法において、標的細胞は、ソース細胞が得られた同じ哺乳動物内に移行されてもよい。言い換えると、本発明の方法に使用されるソース細胞は、自己細胞であってもよく、すなわち、標的細胞が投与される同じ個体から得られてもよい。あるいは、標的細胞は、別の個体内に同種間で移行されてもよい。好ましくは、細胞は、個体における医学的状態を治療するか、または予防する方法において、対象に対して自己である。
【0244】
本明細書で言及される場合、「細胞培養培地」(本明細書において「培養培地」または「培地」とも称される)という用語は、細胞生存性を維持し、増殖を補助する栄養素を含有する、細胞を培養するための培地である。細胞培養培地は、適切な組合せで以下のいずれかを含有してもよい:塩、緩衝剤、アミノ酸、グルコースまたは他の糖、抗生物質、血清または血清置換物、およびペプチド成長因子などの他の構成要素。特定の細胞型に通常使用される細胞培養培地は当業者に公知である。本発明の方法に使用するための例示的な細胞培養培地は表4に示される。
【0245】
「発現」という用語は、適用可能である場合、例えば、転写、翻訳、フォールディング、修飾およびプロセシングを含むが、これらに限定されない、RNAおよびタンパク質を産生し、必要に応じて、タンパク質を分泌する際に関与する細胞プロセスを指す。
【0246】
本明細書で使用される場合、「単離された」または「部分的に精製された」という用語は、核酸またはポリペプチドの場合、天然供給源に見られるような核酸もしくはポリペプチドと共に存在し、および/または細胞によって発現されるか、もしくは分泌ポリペプチドの場合、分泌される場合に、核酸もしくはポリペプチドと共に存在するであろう、少なくとも1つの他の構成要素(例えば、核酸またはポリペプチド)から分離された核酸またはポリペプチドを指す。化学的に合成された核酸もしくはポリペプチド、またはin vitroでの転写/翻訳を使用して合成されたものは、「単離された」と見なされる。
【0247】
「ベクター」という用語は、宿主またはソース細胞内に導入するためにDNA配列が挿入され得るキャリアDNA分子を指す。好ましいベクターは、連結されている核酸の自律複製および/または発現が可能であるものである。これらが機能可能に連結されている遺伝子の発現を指示することが可能なベクターは、本明細書において、「発現ベクター」と称される。したがって、「発現ベクター」は、宿主細胞において、目的の遺伝子の発現に必要とされる必要な調節領域を含有する特殊化ベクターである。一部の実施形態では、目的の遺伝子は、ベクター中の別の配列に作動可能に連結されている。ベクターはウイルスベクターまたは非ウイルスベクターであってもよい。ウイルスベクターが使用される場合、ウイルスベクターは複製欠損であることが好ましく、これは例えば、複製のためにコードする全てのウイルス核酸を除去することによって達成され得る。複製欠損ウイルスベクターは、なおその感染特性を保持し、複製するアデノウイルスベクターと類似の様式で細胞に侵入するが、一度細胞に受け入れられたら、複製欠損ウイルスベクターは、複製も増殖もしない。ベクターはまた、リポソームおよびナノ粒子、ならびにDNA分子を細胞に送達する他の手段も包含する。
【0248】
「作動可能に連結された」という用語は、コード配列の発現に必要な調節配列が、コード配列の発現を達成するように、コード配列に関して適切な位置でDNA分子中に配置されることを意味する。この同じ定義はときに、発現ベクターにおけるコード配列および転写制御エレメント(例えばプロモーター、エンハンサー、および終結エレメント)の配置に適用される。「機能可能に連結された」という用語には、発現しようとするポリヌクレオチド配列の直前に適切な開始シグナル(例えば、ATG)を有し、発現制御配列の制御下でのポリヌクレオチド配列の発現、およびポリヌクレオチド配列によってコードされる所望のポリペプチドの産生を可能にする正しいリーディングフレームを維持することが含まれる。
【0249】
「ウイルスベクター」という用語は、細胞への核酸構築物の担体としての、ウイルス、またはウイルス関連ベクターの使用を指す。構築物は、感染または細胞内への形質導入のための、レトロウイルスおよびレンチウイルスベクターを含む、アデノウイルス、アデノ随伴ウイルス(AAV)、または単純ヘルペスウイルス(HSV)またはその他のような非複製性の欠損ウイルスゲノム内に、組み込まれ、パッケージングされてもよい。ベクターは、細胞のゲノム内に取り込まれてもよく、または取り込まれなくてもよい。構築物には、所望の場合、トランスフェクションのためのウイルス配列も含まれてもよい。あるいは、構築物は、エピソーム複製可能なベクター、例えば、EPVおよびEBVベクター内に取り込まれてもよい。
【0250】
本明細書で使用される場合、「アデノウイルス」という用語は、アデノウイルス科のウイルスを指す。アデノウイルスは、ヌクレオカプシドおよび二本鎖直鎖DNAゲノムから構成される、中程度の大きさ(90~100nm)の非エンベロープ(裸の)正二十面体ウイルスである。
【0251】
本明細書で使用される場合、「非組込みウイルスベクター」という用語は、宿主ゲノム内に組み込まれないウイルスベクターを指し、ウイルスベクターによって送達される遺伝子の発現は一時的である。宿主ゲノム内への組込みはほとんどまたはまったくないため、非組込みウイルスベクターは、ゲノムにおいて、ランダムな点で挿入することによるDNA突然変異を産生しない利点を有する。例えば、非組込みウイルスベクターは、染色体外に留まり、その遺伝子を宿主ゲノム内に挿入せず、潜在的に内因性遺伝子の発現を破壊することがない。非組込みウイルスベクターには、以下:アデノウイルス、アルファウイルス、ピコルナウイルス、およびワクシニアウイルスが含まれ得るが、これらに限定されない。これらのウイルスベクターは、これらのいずれも、一部の稀な状況においては、ウイルス核酸を宿主細胞のゲノム内に組み込み得る可能性があるにもかかわらず、この用語が本明細書で使用される場合、「非組込み」ウイルスベクターである。重要なことは、本明細書に記載される方法で使用されるウイルスベクターは、利用される条件下で、一般に、またはそれらの生活環の主な部分として、宿主細胞のゲノム内にそれらの核酸を組み込まないことである。
【0252】
療法において使用するための安全性を増加させ、所望の場合、選択および濃縮マーカーを含み、含有するヌクレオチド配列の発現を最適化するために、科学文献に一般的に知られる方法を使用して、本明細書に記載されるベクターを構築し、操作することができる。ベクターには、ベクターがソース細胞型において自己複製することを可能にする、構造的構成要素が含まれなければならない。例えば、公知のエプスタイン・バーoriP/核抗原-1(EBNA-I)の組合せ(例えば、その全体が本明細書に示されたかのように参照により組み込まれる、Lindner,S.E.およびB.Sugden、The plasmid replicon of Epstein-Barr virus:mechanistic insights into efficient,licensed,extrachromosomal replication in human cells、Plasmid 58:1(2007)を参照されたい)は、ベクター自己複製を支持するために十分であり、哺乳動物、特に霊長類の細胞において機能することが知られている他の組み合わせも利用されてもよい。本発明で使用するために適した発現ベクターの構築のための標準的な技術は、当業者に周知であり、その全体が示されるかのように参照により本明細書に組み込まれる、Sambrook Jら、「Molecular cloning:a laboratory manual」、(第3版 Cold Spring harbor Press、Cold Spring Harbor、N.Y.2001)などの刊行物に見出され得る。
【0253】
本発明の方法において、変換に必要な関連する因子をコードする遺伝材料は、1つまたは複数の細胞変換ベクターを介してソース細胞内に送達される。各因子は、ソース細胞におけるポリヌクレオチドの発現を駆動し得る異種プロモーターに作動可能に連結された因子をコードするポリヌクレオチド導入遺伝子として、ソース細胞内に導入され得る。
【0254】
好適な細胞変換ベクターは、感染性または複製適合性ウイルスを生じさせるために十分なウイルスゲノムの全てまたは一部をコードしない、プラスミドなどのエピソームベクターを含む、本明細書に記載されるいずれかのものであるが、ベクターは、1つまたは複数のウイルスから得られる構造エレメントを含有してもよい。1つまたは複数の細胞変換ベクターが単一のソース細胞内に導入されてもよい。1つまたは複数の導入遺伝子が、単一の細胞変換ベクター上に提供されてもよい。1つの強い構成的転写プロモーターが、発現カセットとして提供されてもよい、複数の導入遺伝子のための転写制御を提供してもよい。ベクター上の別個の発現カセットが、別個の強い構成的プロモーターの転写制御下にあってもよく、これらのプロモーターは、同じプロモーターのコピーであってもよく、または異なるプロモーターであってもよい。様々な異種プロモーターが当該技術分野において公知であり、転写因子の所望の発現レベルなどの要因に応じて使用されてもよい。以下に例示されるように、ソース細胞において、異なる強度を有する異なるプロモーターを使用して、別個の発現カセットの転写を制御することが有利であり得る。転写プロモーターの選択における別の考慮は、プロモーターをサイレンシングする割合である。当業者は、遺伝子の産物が、細胞変換法において、その役割を完了したか、または実質的に完了した後、1つまたは複数の導入遺伝子または導入遺伝子発現カセットの発現を減少させることが有利であり得ることを理解する。例示的なプロモーターは、ヒトEF1α伸長因子プロモーター、CMVサイトメガロウイルス前初期プロモーターおよびCAGニワトリアルブミンプロモーター、ならびに他の種由来の対応する相同プロモーターである。ヒト体細胞において、EF1αおよびCMVはどちらも、強いプロモーターであるが、CMVプロモーターの制御下での導入遺伝子の発現が、EF1αプロモーターの制御下での導入遺伝子の発現よりも早期に停止されるように、前者は後者よりも効率的にサイレンシングされる。転写因子は、細胞変換効率をモジュレートするために変動され得る相対比で、ソース細胞内で発現され得る。好ましくは、複数の導入遺伝子が単一の転写産物上にコードされる場合、内部リボソーム侵入部位が、転写プロモーターから遠位の、導入遺伝子の上流に提供される。因子の相対比は、送達される因子に応じて変動し得るが、本開示を把握している当業者は、因子の最適な比を決定することができる。
【0255】
当業者は、複数のベクターを介するよりも、単一のベクターを介して、全ての因子を導入する方が有利に効率的であることを理解する。したがって、本発明は、単一のベクター(または少ない数のベクター)の使用を企図し、単一または少ない数のベクターは、場合により、変換、または細胞維持に必要な複数の因子をコードする。
【0256】
変換ベクターを導入した後、かつソース細胞が変換されている間、ベクターは標的細胞中に存在し続けることが可能であり、この間、導入された導入遺伝子が転写され、翻訳される。導入遺伝子発現は、標的細胞型に変換されている細胞においては、有利に下方制御されるか、または停止されてもよい。細胞変換ベクターは、染色体外に留まってもよい。極端に低い効率で、ベクターは、細胞のゲノム内に組み込まれ得る。以下の例は、本発明を例示することを意図し、いかなる意味でも限定することを意図しない。
【0257】
本発明と共に使用するための、細胞、組織または生物の形質転換のための核酸送達に好適な方法には、本明細書に記載されるような、または当業者に公知であるような、核酸(例えば、DNA)が細胞、組織または生物内に導入され得る、実質的にいずれかの方法が含まれると考えられる(例えば、StadtfeldおよびHochedlinger、Nature Methods 6(5):329~330(2009);Yusaら、Nat.Methods 6:363~369(2009);Woltjenら、Nature 458、766~770(2009年4月9日))。このような方法には、限定されないが、ex vivoトランスフェクションによるなどのDNAの直接送達(Wilsonら、Science、244:1344~1346、1989、NabelおよびBaltimore、Nature 326:711~713、1987)が含まれ、任意選択的に、脂質に基づくトランスフェクション試薬、例えば、Fugene6(Roche)またはリポフェクタミン(Invitrogen)を用いても、注入(各々、本明細書に参照により組み込まれる、米国特許第5,994,624号、第5,981,274号、第5,945,100号、第5,780,448号、第5,736,524号、第5,702,932号、第5,656,610号、第5,589,466号および第5,580,859号)によってもよく、これにはマイクロインジェクション(本明細書に参照により組み込まれる、HarlandおよびWeintraub、J.Cell Biol.、101:1094~1099、1985;米国特許第5,789,215号)が含まれ;エレクトロポレーション(本明細書に参照により組み込まれる、米国特許第5,384,253号;Tur-Kaspaら、Mol.Cell Biol.、6:716~718、1986;Potterら、Proc.Nat’l Acad.Sci.USA、81:7161~7165、1984)によってもよく;リン酸カルシウム沈殿(GrahamおよびVan Der Eb、Virology、52:456~467、1973;ChenおよびOkayama、Mol.Cell Biol.、7(8):2745~2752、1987;Rippeら、Mol.Cell Biol.、10:689~695、1990)によってもよく;DEAE-デキストランを使用した後、ポリエチレングリコールを使用することによってもよく(Gopal、Mol.Cell Biol.、5:1188~1190、1985);直接超音波装填(Fechheimerら、Proc.Nat’l Acad.Sci.USA、84:8463~8467、1987)によってもよく;リポソーム媒介性トランスフェクション(NicolauおよびSene、Biochim.Biophys.Acta、721:185~190、1982;Fraleyら、Proc.Nat’l Acad.Sci.USA、76:3348~3352、1979;Nicolauら、Methods Enzymol.、149:157~176、1987;Wongら、Gene、10:87~94、1980;Kanedaら、Science、243:375~378、1989;Katoら、J Biol.Chem.、266:3361~3364、1991)、および受容体媒介性トランスフェクション(WuおよびWu、Biochemistry、27:887~892、1988;WuおよびWu、J.Biol.Chem.、262:4429~4432、1987)によってもよく;ならびにこのような方法のいずれかの組合せによってもよく、これらの各々は本明細書に参照により組み込まれる。
【0258】
会合する分子の細胞内への導入を媒介することができるいくつかのポリペプチドが以前に記載されており、本発明に適応可能である。例えば、Langel(2002)Cell Penetrating Peptides:Processes and Applications、CRC Press、Pharmacology and Toxicology Seriesを参照のこと。膜を渡る輸送を増進するポリペプチド配列の例には、限定されないが、ショウジョウバエホメオタンパク質のアンテナペディア転写タンパク質(AntHD)(Joliotら、New Biol.3:1121~34、1991;Joliotら、Proc.Natl.Acad.Sci.USA、88:1864~8、1991;Le Rouxら、Proc.Natl.Acad.Sci.USA、90:9120~4、1993)、単純ヘルペスウイルス構造タンパク質VP22(ElliottおよびO’Hare、Cell 88:223~33、1997);HIV-1転写活性化因子TATタンパク質(GreenおよびLoewenstein、Cell 55:1179~1188、1988;FrankelおよびPabo、Cell 55:1 289~1193、1988);カポジFGFシグナル配列(kFGF);タンパク質形質導入ドメイン-4(PTD4);ペネトラチン、M918、トランスポータン-10;核局在化配列、PEP-Iペプチド;両親媒性ペプチド(例えば、MPGペプチド);米国特許第6,730,293号に記載されるような送達増進輸送体(限定されないが、少なくとも5~25もしくはそれ以上の連続アルギニン、または30、40、もしくは50アミノ酸の連続セット中に5~25またはそれ以上のアルギニンを含むペプチド配列を含む;限定されないが、十分な、例えば少なくとも5つのグアニジノまたはアミジノ部分を有するペプチドを含む);ならびに商業的に入手可能なペネトラチン(商標)1ペプチド、およびフランス、パリのDaitos S.A.より入手可能なVectocell(登録商標)プラットホームのDiatosペプチドベクター(「DPV」)が含まれる。WO/2005/084158およびWO/2007/123667、ならびにそれらに記載されているさらなる輸送体もまた参照のこと。これらのタンパク質は細胞膜を通過可能であるだけでなく、本明細書に記載される転写因子などの他のタンパク質を付着させると、これらの複合体の細胞取り込みを刺激するのに十分である。
【0259】
【0260】
【0261】
分化方法に関して、上記の関連する細胞型培地が分化を容易にするために使用され得る。細胞維持に関して、細胞維持のために本明細書に同定される因子のみを使用して細胞を培養することが可能である。例えば:
- 正常ヒト星状膠細胞(NHA)(Lonza Bioscience)を解凍し、1継代をマトリゲル中に維持する。(マトリゲルは、Corning Life Sciences and BD Biosciencesによって製造され、販売されているEngelbreth-Holm-Swarm(EHS)マウス肉腫細胞によって分泌されるゼラチン状タンパク質混合物についての商標名である。Trevigen,Inc.は、Cultrex BMEという商標名でそれらの独自のバージョンを販売している。マトリゲルは多くの組織に見出される複雑な細胞外環境に似ており、細胞を培養するための基質(基底膜マトリクス)として細胞生物学者によって使用される)。続いてAccutaseを使用して細胞を継代し、それぞれの条件で播種する:基質なし、マトリゲル、FN1(フィブロネクチン)、COL4A1(コラーゲン4)、LAMB1(LN221)、ADAM12、COL1A2(コラーゲンI)、EDIL3および全ての因子(マトリゲルを含まない上述の基質と成長因子の組合せ)。
【0262】
- 初代ヒト心筋細胞の細胞培養物の解凍および維持培地は、PromoCell(Heidelberg、ドイツ)から購入することができる。細胞を、2%のウシ胎仔血清、EGF(5ng/ml)、FGF2(2ng/ml)、EGF(0.5ng/ml)およびインスリン(0.5μg/ml)を補充した筋細胞成長培地(PromoCell、C-22011)中で培養する。続いて0.04%のトリプシン/0.03%のEDTA(Promocell)を使用して細胞を継代し、それぞれの条件で播種する:基質なし、ゲルトレックス(Life technologies)、FN1(フィブロネクチン)(Sigma Aldrich)、COL1A2(コラーゲンI)(Sigma Aldrich)、TFPI(組織因子経路阻害剤)(Prospec-Tany TechnoGene Ltd)、ApoE(アポリポタンパク質E)(Novus Biologicals)、FGF7(線維芽細胞成長因子-7)(Stemcell Technologies)および全てのリガンド(ゲルトレックスを含まない上述の基質とリガンドの組合せ)。ReN VM細胞(Millipore)を、B27サプリメント(Gibco)、1%のヘパリン(Stem Cell Technologies)、1%のペニシリンおよびストレプトマイシン(Gibco)、20ng/mlのEFG(Peprotech)および20ng/mlのFGF2(Miltenyi Biotec)を含むDMEM/F12(Gibco)中に維持した。Accutase(Stem Cell Technologies)を使用して細胞を継代し、マトリゲル(Corning)で被覆したフラスコに播種した。星状膠細胞に分化させるために、培養物を星状膠細胞培地(DMEM高グルコース、N2、10%FBS;Gibco)に2週間移行する。表面マーカーCD44(103028、Biolegend)を使用して細胞を単離し、それぞれの条件で再び播種する:基質なし、マトリゲル、FN1(フィブロネクチン)(Sigma Aldrich)、COL4A1(コラーゲンIV)(Sigma Aldrich)、LAMB1(ラミニン221)(Biolamina)、ADAM12(Sigma Aldrich)、COL1A2(コラーゲンI)(Sigma Aldrich)、EDIL3(R&D Systems)および全てのリガンド(マトリゲルを含まない上述の基質と分泌リガンドの組合せ)。細胞を継代2(継代の3および6日目)で分析する。
【0263】
- 初代肺動脈平滑筋細胞(HPASMC)およびヒト大動脈内皮細胞(HAoEC)培養物の解凍および維持培地は、それぞれ、Gibco(C0095C、Life technologies、USA)およびPromoCell(C-12271、Heidelberg、ドイツ)から購入することができる。平滑筋細胞を、ウシ胎仔血清:4.9%v/v、ヒト塩基性線維芽細胞成長因子(2ng/ml)、ヒト表皮成長因子(0.5ng/ml)、ヘパリン(5ng/ml)、組換えヒトインスリン様成長因子-I(0.01μg/ml)およびBSA(0.2μg/ml)を補充した培地231(Life Technologies、USA)中で培養する。続いてTrypLE Express(Life Technologies)を使用して細胞を継代し、それぞれの条件で播種する:基質なし、ゲルトレックス(Life Technologies)、NID1(ニドゲン-1)(Merck)、COL1A1(コラーゲンI)(Southern Biotech)、COL4A1(コラーゲン4)(Merck)、COL6A1(コラーゲン6)(Rockland)、THBS1(トロンボスポンジン1)(Merck)、FGF10(線維芽細胞成長因子-10)(Stemcell Technologies)、FGF7(線維芽細胞成長因子-7)(Stemcell Technologies)および全てのリガンド(ゲルトレックスを含まない上述の基質とリガンドの組合せ)。
【0264】
- 内皮細胞を、ウシ胎仔血清(0.05ml/ml)、表皮成長因子(組換えヒト)(5ng/ml)、塩基性線維芽細胞成長因子(組換えヒト)(10ng/ml)、インスリン様成長因子(Long R3 IGF)(20ng/ml)、血管内皮成長因子(組換えヒト)(0.5ng/ml)、アスコルビン酸(1μg/ml)およびヒドロコルチゾン(0.2μg/ml)を含有するサプリメントミックスを補充した内皮細胞成長培地MV2(PromoCell、C-22022)中で培養する。続いてTrypLE Express(Life Technologies)を使用して細胞を継代し、それぞれの条件で播種する:基質なし、ゲルトレックス(Life Technologies)、FN1(フィブロネクチン)(Merck)、THBS1(トロンボスポンジン1)(Merck)、CTGF(結合組織成長因子)(Life Technologies)、PDGFB(血小板由来成長因子サブユニットB)(Stemcell Technologies)、CYR61(システインリッチ血管新生誘導因子61)(Novus)、BMP4(骨形成タンパク質4)(Life Technologies)、BMP6(骨形成タンパク質6)(Merck)および全てのリガンド(ゲルトレックスを含まない上述の基質とリガンドの組合せ)。
【0265】
- H9胚性幹細胞を、ビトロネクチン(Gibco)で被覆したフラスコ内に維持し、Essential8培地(Gibco)中で培養する。
- H9幹細胞から神経前駆細胞を介した星状膠細胞の分化のために、細胞を、DMEM/F12、ビタミンAサプリメントを含まないB27(Gibco)、N2サプリメント(Gibco)、0.1%の2-メルカプトエタノール(Gibco)、0.66%のウシ血清アルブミン(Gibco)、1%のピルビン酸ナトリウム(Gibco)、1%の非必須アミノ酸(Gibco)、1%のペニシリンおよびストレプトマイシン、100ng/mlのLDN193189(Tocris Bioscience)を含有する神経系誘導培地中で5×104細胞/cm2の密度にてマトリゲルで被覆したフラスコに14日間播種する。続いて細胞をNCAM+細胞(抗pSA-NCAM抗体、130-115-809、Miltenyi Biotecを含む)について選別し、マトリゲルで被覆したフラスコにさらに7日間、再び播種する。1週間の増殖後、細胞を継代し、星状膠細胞培地(Gibco)中でそれぞれの条件で再び播種する:マトリゲル、FN1(フィブロネクチン)(Sigma Aldrich)、COL4A1(コラーゲン4)(Sigma Aldrich)、LAMB1(LN221)(Biolamina)、マトリゲル+ADAM12(Sigma Aldrich)、COL1A2(コラーゲンI)(Sigma Aldrich)、マトリゲル+EDIL3(R&D Systems)および全ての因子(マトリゲルを含まない上述の基質と成長因子の組合せ)。次いで細胞を14日目および21日目に分析する。
【0266】
- 心臓分化のために、細胞を、条件に応じてマトリゲルまたはCOL1A2で被覆したプレートにEssential8培地(Gibco)中で5×104細胞/cm2の密度にて-3日目に播種する。0日目に、培地を、インスリンを含まないB27サプリメント(Gibco)、1%のペニシリンおよびストレプトマイシン(Gibco)、213g/mlのアスコルビン酸(Sigma-Aldrich)、0.66%のウシ血清アルブミン(Gibco)を補充したRPMI1640(Gibco)と、毎日培地を交換しながら5日間置き換える。0~2日目に、3μMのCHIRも培養物に補充する。3日目に、CHIRを回収する。4および5日目に、5μMのIWRを培養物に補充する。5日後、続いて培養培地を、B27サプリメント(Gibco)、1%のペニシリンおよびストレプトマイシン(Gibco)、213g/mlのアスコルビン酸(Sigma-Aldrich)、0.66%のウシ血清アルブミン(Gibco)を補充したRPMI1640(Gibco)に、毎日培地を交換しながら2日ごとに交換する。分化の間、細胞を、分化培地を用いてそれらのそれぞれの条件に供する:マトリゲル(対照)、FGF7(Peprotech、10ng/ml)(Miyashitaら、2013)、TGFB3(Stemcell Technologies、10ng/ml)(Dahlinら、2014)、TGFB2(Stemcell Technologies、10ng/ml)、GDF5(Stemcell Technologies、50ng/ml)、COL1A2(コラーゲンI)(Sigma Aldrich)および全てのリガンド(COL1A2被覆プレートを含む上述の基質と分泌リガンドの組合せ)。別段の言及がない限り、基質およびリガンドは製造業者の推奨に基づいて適用される。
【0267】
コンピューター実装方法
本明細書に記載される方法の実施形態は、コンピューター処理システムに実装され得る。したがって、さらなる態様では、本発明は、本明細書に開示される方法のいずれか1つの実施形態を実施するのに適応されたコンピューター処理システムを提供する。
【0268】
図10は、本明細書に記載される方法の実施形態および/または特徴を実装するためのコンピューター処理システム600の1つの種類のブロック図を提供する。システム600は汎用コンピューター処理システムである。
図10は、コンピューター処理システムの全ての機能的または物理的構成要素を例示しているわけではないことは理解される。例えば、電源または電源インターフェースは示されていない。しかしながら、システム600は、電源を搭載しているか、または電源に接続するように構成されているかのいずれか(または両方)である。また、特定の種類のコンピューター処理システムが、適切なハードウェアおよびアーキテクチャを決定し、本発明の態様を実装するに好適な代替のコンピューター処理システムが、追加、代替、または示されたものよりも少ない構成要素を有してもよいことは理解される。
【0269】
コンピューター処理システム600は、少なくとも1つの処理ユニット602を備える。処理ユニット602は、単一のコンピューター処理デバイス(例えば、中央処理ユニット、グラフィック処理ユニット、または他のコンピューター計算デバイス)であってもよいか、または複数のコンピューター処理デバイスを備えてもよい。一部の例では、全ての処理は処理ユニット602によって実施されるが、他の例では、処理はまた、システム600によってアクセス可能で使用可能な(共有または専用のいずれかの様式で)リモート処理デバイスによって実施されてもよい。
【0270】
通信バス604を介して、処理ユニット602は、処理システム600の動作を制御するための命令および/またはデータを格納する1つまたは複数の機械可読ストレージ(メモリ)デバイスとデータ通信する。この場合、システム600は、システムメモリ606(例えば、BIOS)、揮発性メモリ608(例えば、1つまたは複数のDRAMモジュールなどのランダムアクセスメモリ)、および不揮発性メモリ610(例えば、1つまたは複数のハードディスクまたはソリッドステートドライブ)を備える。一部の実施形態では、本明細書に記載される方法に使用されるデータソースのいずれか1つまたは複数は不揮発性メモリ(例えば、ChIP-seq情報を格納するデータベース、タンパク質間相互作用ネットワークデータ、遺伝子配列データベース)に格納され得る。
【0271】
システム600はまた、概して612によって示される1つまたは複数のインターフェースを備え、それを介してシステム600は様々なデバイスおよび/またはネットワークと連結する。一般的に言えば、他のデバイスは、システム600と一体であってもよく、または別個であってもよい。デバイスがシステム600から分離されている場合、デバイスとシステム600との間の接続は、有線または無線のハードウェアおよび通信プロトコールを介してであってもよく、直接または間接(例えば、ネットワーク化された)接続であってもよい。
【0272】
他のデバイス/ネットワークとの有線接続は、任意の適切な標準または独自のハードウェアおよび接続プロトコールによってでもよい。例えば、システム600は、USB;FireWire;eSATA;Thunderbolt;Ethernet;OS/2;Parallel;Serial;HDMI(登録商標);DVI;VGA;SCSI;AudioPortのうちの1つまたは複数による他のデバイス/通信ネットワークとの有線接続のために構成されてもよい。もちろん、他の有線接続も可能である。
【0273】
他のデバイス/ネットワークとの無線接続も同様に、任意の適切な標準または独自のハードウェアおよび通信プロトコールによってでもよい。例えば、システム600は、赤外線;BlueTooth;WiFi;近距離無線通信(NFC);Global System for Mobile Communications(GSM)、Enhanced Data GSM Environment(EDGE)、ロングタームエボルーション(LTE)、広帯域符号分割多元接続(W-CDMA)、符号分割多元接続(CDMA)のうちの1つまたは複数を使用して他のデバイス/通信ネットワークとの無線接続のために構成されてもよい。もちろん、他の無線接続も可能である。
【0274】
一般的に言えば、有線または無線手段であるかにかかわらず、システム600が接続するデバイスは、処理ユニット602によって処理するためにデータをシステム600に入力/システム600によって受信することができる1つまたは複数の入力デバイス、およびデータをシステム600によって出力することができる1つまたは複数の出力デバイスを備える。デバイスの例を以下に記載するが、全てのコンピューター処理システムが言及された全てのデバイスを含むわけではないこと、ならびに言及されたものに対する追加および代替のデバイスが十分に使用されてもよいことは理解される。
【0275】
例えば、システム600は1つまたは複数の入力デバイスを備えてもよいか、またはそれらに接続されてもよく、それらによって情報/データがシステム600に入力(システム600によって受信)される。このような入力デバイスには、キーボード、マウス、トラックパッド、マイクロホン、加速度計、近接センサ、GPSデバイスなどが含まれ得る。システム600はまた、情報を出力するためにシステム600によって制御される1つまたは複数の出力デバイスを備えてもよいか、またはそれらに接続されてもよい。このような出力デバイスには、CRTディスプレイ、LCDディスプレイ、LEDディスプレイ、プラズマディスプレイ、タッチスクリーンディスプレイ、スピーカー、振動モジュール、LED/他のライト、および同様のものなどのデバイスが含まれ得る。システム600はまた、入力および出力デバイスの両方として作動することができるデバイス、例えば、システム600がデータを読み取ることができ、および/またはデータを書き込むことができるメモリデバイス(ハードドライブ、ソリッドステートドライブ、ディスクドライブ、コンパクトフラッシュ(登録商標)カード、SDカードなど)、ならびにデータを表示し(出力し)、タッチシグナルを受信(入力)することの両方ができるタッチスクリーンディスプレイを備えてもよいか、またはそれらに接続されてもよい。
【0276】
システム600はまた、ネットワークデバイスにデータを通信し、ネットワークデバイスからデータを受信するために1つまたは複数の通信ネットワーク(例えば、インターネット、ローカルエリアネットワーク、広域ネットワーク、パーソナルホットスポットなど)に接続することができ、そのネットワークデバイスは、それ自体で他のコンピューター処理システムであってもよい。
【0277】
システム600は、非限定的な例として、サーバーコンピューターシステム、デスクトップコンピューター、ラップトップコンピューター、ネットブックコンピューター、タブレットコンピューターデバイス、モバイル/スマートフォン、パーソナルデジタルアシスタント、パーソナルメディアプレーヤー、セットトップボックス、ゲームコンソールなどの任意の好適なコンピューター処理システムであってもよい。
【0278】
典型的には、システム600は、少なくともユーザー入力および出力デバイス614(タッチスクリーンディスプレイなど)およびネットワーク150と通信するための通信インターフェース616を備える。
【0279】
システム600は、処理ユニット602によって実行されると、データを受信、処理、および出力するようにシステム600を構成する、コンピュータープログラム/ソフトウェア(例えば、命令およびデータ)を格納するか、またはそれらにアクセスできる。このようなプログラムには、典型的に、Microsoft Windows(登録商標)、Apple OSX、Apple IOS、Android、Unix、またはLinux(登録商標)などのオペレーティングシステムが含まれる。
【0280】
システム600はまた、処理ユニット602によって実行されると、上記の様々な実施形態に従って様々なコンピューター実装プロセス/方法を実施するようにシステム600を構成する、命令およびデータ(すなわち、ソフトウェアアプリケーション)を格納するか、またはそれらにアクセスできる。一部の場合、所与のコンピューター実装方法の一部または全ては、システム600自体によって実施されるが、他の場合、処理は、システム600とのデータ通信において他のデバイスによって実施されてもよいことは理解される。
【0281】
命令およびデータは、システム600にアクセス可能な非一時的機械可読媒体に格納される。例えば、命令およびデータは、非一時的メモリ610に格納されてもよい。命令は、(例えば)有線または無線ネットワーク接続によって有効にされた送信チャネルにおいてデータ信号を介してシステム600に送信/システム600によって受信されてもよい。一部の実施形態では、本明細書に記載される方法に使用されるデータソースのいずれか1つまたは複数は、リモートデータストレージまたはサーバーシステムに格納されてもよい。このような場合、データは、有線または無線ネットワーク接続によって有効にされた送信チャネルにおいてデータ信号を介してシステム600に提供されてもよい。例えば、ChIP-seq情報を格納するデータベース、タンパク質間相互作用ネットワークデータ、遺伝子配列データベースは、システム600から離れて位置してもよく、コンピューターネットワーク、例えば、本明細書に記載される方法の実施を可能にするインターネットを介してアクセスされてもよい。
【0282】
本発明は以下の非限定的な実施例を含む。
【実施例】
【0283】
実施例1
データ前処理:ヒストン修飾ChIP-seqおよびRNA-seqデータ
初代細胞、幹細胞および組織からなる全ての利用可能なヒト細胞型のヒストン修飾データを、ENCODEリポジトリから得た。2017年4月20日に116種の細胞型を表す316個の試料のH3K4me3 ChIP-seqデータをダウンロードし、2018年1月20日に91種の細胞型を表す208個の試料のH3K27me3 ChIP-seqデータをダウンロードした。ENCODEにデポジットした処理したChIP-seqデータを、異なる処理パイプラインパラメーターを使用することによって得たか、または異なるヒトゲノムバージョン(hg19またはhg38)にマッピングした。したがって、一貫性およびまとまりのあるChIP-seqデータ処理を確実にするために、ヒストンChIP-seqおよび対応する制御/入力ChIP-seqシークエンシングファイルを、bamフォーマットでダウンロードし、BWAを使用してシークエンシングリードをhg38ヒトゲノムおよびアノテーションバージョンV25と再整列させた。Roadmapプロジェクトによって利用可能になったデータセットに関して、tagAlign FASTAフォーマット済みファイルをbamファイルの代わりに提供し、tagAlign FASTAファイルをhg38ヒトゲノムと整列させた。試料の品質および断片サイズを、ファントムピーククアルツール(phantompeakqualtools)を使用して決定した。ChIP-seqピークを、入力(抗体を含まない対照)に対する試料(H3K4me3またはH3K27me3抗体による処理)におけるシークエンシングリードの相対的エンリッチメントに基づいて検出した。H3K4me3およびH3K27me3 ChIP-seqデータの両方に関して、入力試料と比較したヒストン抗体による試料におけるリードのエンリッチメントについての0.1のq値の閾値でMACS2を使用して広いピークを呼び出した。H3K4me3 ChIP-seqデータに関して、体系的なピーク品質フィルタリング閾値を、q値のストリンジェンシーの増加を伴う破棄されたピークの割合に基づいて特定し、10
-5のq値において破棄されたピークの割合は全ての試料にわたって10%未満に低下したことが見出された。したがって、10
-5のq値を使用して、H3K4me3 ChIP-seqデータの低品質のピークを除去した。H3K27me3 ChIP-seqデータに関して、q値のストリンジェンシーが0.01に増加すると、多くの試料が破棄されたので、0.1のデフォルトのq値の閾値を使用した。さらに、10,000個未満のピークを有する低品質の試料も取り除かれて、高品質の試料が細胞型をモデル化するために使用されることを確実にした。H3K4me3およびH3K27me3 ChIP-seqデータのそれぞれについて111および81種の細胞型が存在した(
図1A)。
【0284】
実施例2
EpiMogrifyアルゴリズム
「EpiMogrify」と呼ばれるコンピューターによる計算方法が開発された。この方法は、細胞同一性、細胞維持および細胞変換に重要な因子を予測するために細胞のエピジェネティック状態をモデル化する。アルゴリズムの主なセクションは以下の通りである:
(i)ヒストン修飾参照ピーク遺伝子座の定義
(ii)細胞同一性および細胞維持因子の同定
(iii)指向性分化および分化転換についての細胞変換因子の同定
(i)ヒストン修飾参照ピーク遺伝子座の定義
各細胞型について、試料を一緒にプールして、細胞型を表すChIP-seqプロファイルを得た。細胞型を表すChIP-seqピーク幅を、試料にわたるピーク領域をマージすることによって計算し、ピーク高さを、全ての試料にわたる最大ピーク高さによって計算した。様々な細胞型にわたるChIP-seqピークを比較するために、定義した参照ピーク遺伝子座(RPL)を、全ての細胞型にわたる代表的なピークを組み合わせることによって得られる領域のセットであると定義した(
図1C)。nを細胞型の数とする。x1、x2、...xnの範囲の各細胞型について、bを細胞型のChIP-seqピーク幅とし、hをChIP-seqピーク高さとする。参照ピーク遺伝子座(RPL)のゲノム位置を、全ての細胞型にわたるピーク領域をマージすることによって得る。RPLにおける各遺伝子座R1、R2...Rnについて、ピーク幅(b)を、細胞型にわたる重複するピークをマージすることによって計算し、ピーク高さ(h)を、重複するピークの最大ピーク高さによって与える。
【0285】
【0286】
タンパク質コード遺伝子を、ピークのゲノム位置および遺伝子の転写開始部位(TSS)に基づいてRPLに割り当てることができる。H3K4me3ヒストン修飾は周知のプロモーターマークであるため、ピークが遺伝子のプロモーター領域(TSSから500bp)と重複する場合、遺伝子は典型的にピーク遺伝子座に割り当てられる。しかしながら、RPLは、そのTSSに対して遺伝子の別の領域に位置することができる(TSSから1000bp、2000bpまたはそれ以上を含む、TSSから500bpを超えて領域を拡大することを含む)ことは理解される。
【0287】
好ましくは、各細胞型(x)において、遺伝子(g)のピークピーク幅の値(B)は、遺伝子に注釈が付けられたn個のピークのピーク幅の合計として計算される。一方、遺伝子のピーク高さの値は、遺伝子に注釈が付けられたn個のピークの最大高さとして計算される。
【0288】
【0289】
は、RPL(参照ピーク遺伝子座)での所与の細胞型xのピーク幅プロファイルである。
【0290】
【0291】
(ii)細胞同一性遺伝子および細胞維持因子の同定
広いH3K4me3ChIP-seq幅に関連付けられた遺伝子は、細胞同一性遺伝子が豊富にあることが観察されたので、EpiMogrifyは、細胞状態をモデル化するためにH3K4me3 ChIP-seqピーク幅を利用する。遺伝子のTSSにおいてH3K4me3およびH3K27me3の両方のChIP-seqピークが存在するポイズド遺伝子は、このモデルから取り除く。EpiMogrifyは、細胞型に特異的な因子を同定するために3段階のアプローチを使用する(
図2)。第1に、微分幅広スコアを、H3K4me3 ChIP-seqピーク幅に基づいて各RPLにおいてコンピューターで計算する。第2に、遺伝子の調節作用を、タンパク質間相互作用ネットワーク上の関連する遺伝子の値に基づいて決定する。最後に、細胞同一性遺伝子を、ランク付けしたタンパク質コード遺伝子に基づいて予測し、EpiMogrifyは、細胞状態維持についてのシグナル伝達分子を予測する。
【0292】
ステップ1:微分幅広スコアの計算
初代細胞および幹細胞は均一な細胞集団であるが、組織は不均一な細胞集団から構成されている。したがって、比較のために、初代細胞および幹細胞を1つの群として処理し、組織細胞型を別の群として処理した。標的細胞型特異的ChIP-seqプロファイルを得るために、標的細胞型を群内のバックグラウンド細胞型のセットと比較した。例えば、標的細胞が初代細胞型である場合、バックグラウンドにおける細胞型は残りの初代および幹細胞型になる。バックグラウンドセットにおける細胞型は標的細胞型と類似してはならないので、ChIP-seqプロファイルと標的細胞型とのスピアマンの相関が0.9未満である場合にのみ、バックグラウンド細胞型を選択した。
【0293】
目的の標的細胞型(x)において、1つより多い参照ピーク遺伝子座(RPL)が遺伝子(g)に割り当てられる場合、遺伝子ピーク幅スコア(B)が、割り当てられたRPLのピーク幅(b)の値の合計によって与えられる。BGx
gは、遺伝子gにおけるバックグラウンド細胞型の遺伝子ピーク幅スコアのセットであり、バックグラウンド細胞型を、標的細胞型(x)との弁別性に基づいて選択する。Δピーク幅x
gは、標的細胞型と、バックグラウンド細胞型の遺伝子ピーク幅スコアの中央値との間の遺伝子ピーク幅スコアの正規化された差である。この差の有意性(p値)を、一標本ウィルコクソン検定によって推定する。細胞型(x)および遺伝子(g)の微分幅広スコア(DBS)を、正規化されたΔピーク幅およびPvalの合計として測定する。
【0294】
【0295】
ステップ2:調節微分幅広スコアの計算
次に、細胞型の細胞同一性遺伝子、STRING V10、タンパク質間相互作用ネットワークに対する遺伝子の調節作用をコンピューターで計算するために、情報を含めた。実験スコアがゼロより大きく、組み合わせたスコアが500より大きい場合、遺伝子ノード間の相互作用を選択した。これにより、実験的証拠がある高品質のネットワークを使用して、遺伝子の調節作用を決定することを確実にする。Mogrifyで使用したように、類似のネットワークスコア(Net)の計算を使用した。STRINGネットワークにおける全ての遺伝子(V)について、ネットワークスコアを、遺伝子のサブネットワーク(Vg)における関連する遺伝子(r)のDBSの合計に基づいてコンピューターで計算し、遺伝子の出次数ノードの数(O)および関連性のレベル(L)を補正した。細胞特異的ネットワークを得るために、STRINGネットワークからの関連付けられた幅広いH3K4me3ピークを有しない遺伝子を取り除いた。関連する遺伝子のDBSスコアの加重和を、関連性の第3のレベルまで計算した。
【0296】
【0297】
細胞型xにおける全てのタンパク質コード遺伝子Gにわたる正規化されたネットワークスコア(Net)
【0298】
【0299】
細胞型特異的ネットワークを構築するために、ピーク幅が、その幅の閾値(87%)未満である遺伝子を取り除いた(
図1E)。DBSとNetスコアの異なる組合せを細胞同一性遺伝子のエンリッチメントについて試験し、2:1の比のDBS対ネットワークスコア(Net)が、細胞同一性遺伝子について最も高いエンリッチメントを示すことを決定した。
【0300】
【0301】
ステップ3:細胞同一性遺伝子および細胞維持因子の予測
EpiMogrifyは、RegDBSに基づいて遺伝子をランク付けすることによって細胞の同一性を示すタンパク質コード遺伝子を予測する。細胞維持に関して、EpiMogrifyは、細胞成長および生存に不可欠な受容体およびリガンドなどのシグナル伝達分子を予測する。受容体-リガンド相互作用対を研究から得、これらの対を異なる細胞型にわたる遺伝子発現に基づいて同定した。リガンドの約3分の2が自己分泌様式で細胞によって産生され、リガンドの残りが、微小環境を模倣するために支持細胞型によって産生されることがわかった。したがって、これを現在のモデルに組み込むために、細胞特異的RegDBSに基づいて受容体に優先順位を付けた。なぜならそれらは、細胞特異的であるはずであり、目的の細胞型に対する調節作用を有するはずの両方であるからである。次いでDBSに基づいて目的の細胞型および支持細胞型からのリガンドに優先順位を付けた。最後に、受容体-リガンド対を、受容体およびリガンドの組み合わせたランクによって優先順位を付けた。予測された受容体-リガンド対のリガンドを細胞培養条件に補充することができる。
【0302】
(iii)指向性分化および分化転換についての細胞変換因子の同定
EpiMogrifyは、細胞変換因子を同定するために3段階アプローチを利用する。第1に、ソース細胞型から標的細胞型への細胞変換に関して、微分幅広スコアの変化をコンピューターで計算する。次いで細胞状態の変化に及ぼす遺伝子の調節作用を決定する。最後に、転写因子を分化転換について予測し、シグナル伝達分子を指向性分化について予測する。
【0303】
ステップ1:細胞変換微分幅広スコアの計算
細胞変換に関して、Sをソース細胞型とし、Tを標的細胞型とする。第1に、微分幅広スコア(DBS)をソース細胞型および標的細胞型の両方についてコンピューターで計算する。次いで、細胞変換ΔDBSを得るために、ソースDBSスコアと標的DBSスコアとの差をコンピューターで計算する。
【0304】
【0305】
ステップ2:細胞変換調節微分幅広スコアの計算
次に、ソース細胞型から標的細胞型への細胞変換についての調節ネットワークスコア(N)を、関連するノードの細胞変換ΔDBSスコアの加重和としてコンピューターで計算する。細胞特異的RegDBSの計算と同様に、細胞変換RegΔDBSを、2:1の比で細胞変換ΔDBSおよび正規化されたネットワークスコアの集成値として計算する。
【0306】
【0307】
ステップ3:指向性分化および分化転換についての細胞変換因子の予測
各細胞変換について、タンパク質コード遺伝子を、RegΔDBS値によってランク付けする。分化転換について、EpiMogrifyは、TFClass分類に基づいて定義されたタンパク質コード遺伝子のサブセットである転写因子(TF)を予測する。指向性分化について、EpiMogrifyは、受容体およびリガンド対などのシグナル伝達分子を予測する。細胞変換RegΔDBSによって受容体に優先順位を付け、細胞変換ΔDBSによって対応するリガンドに優先順位を付ける。最後に、受容体およびリガンドの組み合わせたランクによって受容体-リガンド対に優先順位を付ける。予測される受容体-リガンド対のリガンドを分化プロトコールに補充することができる。
【0308】
要約すると、EpiMogrifyは、幅広いH3K4me3ヒストン修飾特性をモデル化し、細胞同一性タンパク質コード遺伝子、細胞維持についてのシグナル伝達分子、指向性分化についてのシグナル伝達分子、および分化転換についてのTFを予測する。
【0309】
実施例3
H3K4me3およびH3K27me3ヒストン修飾の特徴
エピジェネティックヒストン修飾、すなわち、それぞれ周知の転写活性化因子およびリプレッサーマークである、H3K4me3およびH3K27me3修飾を利用することによって細胞状態をモデル化することができる。様々なヒト細胞型のH3K4me3およびH3K27me3ヒストン修飾プロファイルについてのChIP-seqデータを、ENCODEおよびRoadmapコンソーシアムデータリポジトリから得た。異なる試料および実験にわたるChIP-seqデータセットの一貫した下流処理を確実にするために、分析パイプラインを実装し、必要に応じて、データ駆動型閾値を使用して、H3K4me3およびH3K27me3プロファイルにおける有意なピークを呼び出した。低品質のピークをフィルタリングした後、H3K4me3プロファイルを有する111種の異なる細胞型(51個の初代細胞、53個の組織、7個の幹細胞)およびH3K27me3プロファイルを有する81種の細胞型(28個の初代細胞、45個の組織、8個の幹細胞)を表す試料(
図1A)を保持した。転写状態に対するヒストン修飾の効果を調査するために、137種の細胞型(64個の初代細胞、68個の組織、5個の幹細胞)からなるENCODEからの遺伝子発現プロファイルを使用した。エピジェネティック(H3K4me3およびH3K27me3 ChIP-seqによる)および転写(RNA-seqによる)データが利用可能な40種の共通の細胞型が存在する。ChIP-seqピークの幅を、塩基対(bp)でのヒストン修飾デポジションを伴うゲノム領域の長さと定義し、ChIP-seqピークの高さを、ヒストン修飾またはシグナル値の平均エンリッチメントとして定義した(
図1B)。ChIP-seqピーク幅は、狭いピークから広いピークまでの範囲であり、ChIP-seqピーク高さは、短いピークから高いピークまでの範囲であり、分布は全ての細胞型にわたる。さらに、H3K4me3と比較して、H3K27me3は、より多くの数の狭いおよび広いChIP-seqピークを有し、H3K27me3は、遺伝子間領域およびサイレント遺伝子に存在することが知られている。
【0310】
次に、H3K4me3およびH3K27me3のChIP-seqプロファイルのゲノム位置の優先度を全ての細胞型にわたって決定した。タンパク質コード遺伝子の転写開始部位(TSS)周辺の2000bpのウィンドウ内のChIP-seqピークの頻度を評価した。H3K27me3マークとは対照的に、H3K4me3は、TSSから500bp内により高い頻度のピークを有したことがわかった。
【0311】
次に、H3K4me3およびH3K27me3のChIP-seqプロファイルについてタンパク質コード遺伝子に注釈をつけ、この目的のために、関連付けられたChIP-seqピーク幅または高さに基づいて遺伝子の値を割り当てた。
図1Cは、タンパク質コード遺伝子の注釈および割り当てられた遺伝子の値の詳細な概略図を示す。各細胞型について、細胞型を表すH3K4me3およびH3K27me3のChIP-seqピークプロファイルを、複数の試料または複製をマージすることによって得た(詳細については方法を参照のこと)。次に、参照ピーク遺伝子座(RPL)と呼ばれる参照ChIP-seqピーク領域を定義し、これは、細胞型にわたる重複するピークをマージすることによって得た。各RPLについて、遺伝子のプロモーター領域が遺伝子座と重複する場合、遺伝子座に対するタンパク質コード遺伝子に注釈を付けた。H3K4me3マークに関して、プロモーター領域を遺伝子のTSSから500bpと定義した。なぜならこの領域により高い頻度のH3K4me3のChIP-seqピークの存在が見られたからである。H3K27me3マークに関して、遺伝子イントロンでのH3K27me3マークを考慮することを除外するために、プロモーター領域を遺伝子のTSSから-500bpと定義した。
図1Cの表は、RPLに対する遺伝子注釈の例ならびに各細胞型についてのChIP-seqピーク幅および高さに基づくそれぞれの遺伝子の値を示す。
【0312】
実施例4
H3K4me3プロファイルをモデル化して細胞同一性遺伝子を同定するためのデータ駆動型アプローチ
細胞の同一性をモデル化するための最適な特性を決定するために、ChIP-seqピーク幅および高さのようなヒストン修飾特性、ならびに遺伝子発現レベルのような転写特性を試験した。まず、タンパク質コード遺伝子を、H3K4me3およびH3K27me3のChIP-seqピーク幅および高さの分布、ならびに遺伝子発現に基づいて5パーセンタイルビンに分類した。次に、ヒストン修飾または遺伝子発現特性のいずれかが、細胞同一性遺伝子のみに豊富にあるかどうかを推定した。細胞同一性遺伝子を、細胞型に関連するGO生物学的プロセスのテキストマイニングによって定義し、エンリッチメントの有意性をフィッシャーの正確検定(FET)によって計算した。全ての細胞型にわたって、遺伝子発現が高いビンは、細胞同一性遺伝子およびハウスキーピング遺伝子の両方についてエンリッチメントのより高い有意性を示したことを観察した。高いH3K4me3のChIP-seqピークはハウスキーピング遺伝子が豊富にあるが、広いH3K4me3のChIP-seqピークは、以前の研究に示されるように、細胞同一性遺伝子が顕著に豊富にあることが見出された。予想されるように、H3K27me3リプレッサーマークでは、全ての細胞型にわたって細胞同一性またはハウスキーピング遺伝子が豊富になかった。遺伝子発現が高いまたは広いH3K4me3のChIP-seqピークを有する遺伝子には、細胞同一性遺伝子が顕著に豊富にあるので、これらの特性を、最適なメトリック(H3K4me3、RNA-seq発現またはその両方)を同定して細胞同一性遺伝子をモデル化するためにさらに調べた。40種の共通の細胞型に関して、それらの遺伝子発現またはH3K4me3のChIP-seqピーク幅に基づいて遺伝子を降順に並べ、遺伝子を1パーセンタイルずつ増加する累積ウィンドウに分類した(
図1D)。各累積ウィンドウに関して、共通の細胞型にわたる細胞同一性およびハウスキーピング遺伝子についてのエンリッチメントの有意性をコンピューターで計算した。高い遺伝子発現は細胞同一性およびハウスキーピング遺伝子の両方と関連付けられ、一方、広いH3K4me3のChIP-seqピークによって示される遺伝子には、細胞同一性遺伝子のみが豊富であったことが見出された(
図1D)。次に、細胞同一性遺伝子を効率的に同定することができるH3K4me3のChIP-seqピーク幅の閾値を決定するために、細胞同一性遺伝子についてのエンリッチメントの有意性を調べた。ピーク幅の分布の87パーセンタイルを超えるH3K4me3のChIP-seqピーク幅は、111種の細胞型にわたってエンリッチメントの最も高い有意性を有することが見出された(
図1E)。各細胞型に関して、この閾値(87パーセンタイル)は、3,611~15,035塩基対の範囲のChIP-seqピーク幅に対応する。まとめると、これらの分析により、広いH3K43のChIP-seqピーク幅は、細胞性の同一性に関連付けられる特性があることが示唆される。
【0313】
次に、広いH3K4me3のChIP-seqピーク特性を体系的に分析することによって細胞状態をモデル化し、細胞特異的遺伝子を同定するためにデータ駆動型方法および「遺伝子スコア」を開発した。細胞特異的遺伝子を同定するために、目的の標的細胞型をバックグラウンド細胞型と比較した。バックグラウンド細胞型を、スピアマンの相関によって計算した標的細胞型との弁別性に基づいて選択した。
図2Aは、細胞特異的遺伝子に優先順位を付けるために使用したアプローチの概略図を示す。各細胞型およびタンパク質コード遺伝子に関して、微分幅広スコア(DBS)をコンピューターで計算した。これは、標的細胞型とバックグラウンドとの間のChIP-seqピーク幅の差、およびこの差の有意性によって計算した集成値である。DBSによってランク付けしたタンパク質コード遺伝子は細胞特異的遺伝子であり、細胞に対して調節作用を与える細胞特異的遺伝子に優先順位を付けるために、調節微分幅広スコア(RegDBS)をコンピューターで計算した(
図2B)。RegDBSは、遺伝子のDBSおよびタンパク質間相互作用ネットワークスコアによって計算した集成値である。このアプローチを使用すると、111種の細胞型について細胞特異的タンパク質コード遺伝子に体系的に優先順位を付けることが可能であり、各遺伝子をRegDBSスコアによってランク付けした。
【0314】
この方法は、以前の研究と比較して細胞同一性遺伝子を検出する精度を改善するかどうかが求められた。H3K4me3 ChIP-seqピーク幅をモデル化する異なるスコアリングメトリックを、GSEA(遺伝子セットエンリッチメント分析(Gene Set Enrichment Analysis))を使用して細胞同一性遺伝子についてのエンリッチメントを測定することによって比較した(
図2C)。H3K4me3のChIP-seqピーク幅のみによるタンパク質コード遺伝子のランク付けと比較すると、DBSは、細胞同一性遺伝子についてそれぞれ、2.5、3.5および3.5倍高いエンリッチメントを示すことが見出された。RegDBSは、全ての細胞型にわたって細胞同一性遺伝子について最も高いエンリッチメントを有し、ピーク幅によって順序を付けた遺伝子と比較してエンリッチメントが約5.3倍増加し、DBSと比較して1.5倍増加した。これにより、本発明の方法が、細胞性の同一性に関連付けられたオントロジーを有する遺伝子を同定する際により精度が高いことが確認される。特に、調節ネットワーク情報を利用するRegDBSスコアを使用して細胞特異的遺伝子に優先順位を付けることができる。
【0315】
実施例5
EpiMogrifyは、細胞維持、例えば星状膠細胞についての因子を予測する
本発明の方法は細胞同一性遺伝子に効率的に優先順位を付けることができるので、受容体およびリガンドのような優先順位を付けたシグナル伝達分子は、細胞生存および細胞状態の維持に不可欠であると仮定した。細胞維持についてのシグナル伝達分子を予測するためのEpiMogrifyのアプローチを
図2Dに示す。RegDBSメトリックに基づいて受容体に優先順位を付けることによって、これらの受容体はそれらの調節作用によって加重されるので、細胞同一性遺伝子の活性化を誘発することができる受容体を同定することが可能であると仮定した。一方、これらの受容体で活性化するのに必要とされるリガンドは、自己分泌様式で標的細胞型によって、またはパラクリン様式で支持細胞型によって産生することができる。したがって、DBSによって対応するリガンドに優先順位を付け、標的細胞型に重要なランク付けした受容体-リガンド対を得た(
図2D)。細胞をin vivo系からin vitro条件に移行すると、それらの細胞は必要な受容体を発現する。しかしながら、これらの受容体を活性化するのに必要なリガンドは喪失する可能性がある。したがって、in vitroでの細胞維持に関して、EpiMogrifyは、細胞維持培養培地に加えられ得るリガンドを予測することができると仮定した。EpiMogrifyの予測の精度を評価するために、成長および維持についての予測リガンドを、in vitroで星状膠細胞に対して試験した。星状膠細胞は、ニューロンについての代謝的および構造的支持を提供し、ニューロン新生および脳の神経経路を調節する多機能細胞型であり、星状膠細胞のいくらかの機能障害は主要な神経疾患を引き起こす可能性がある。したがって、神経疾患を研究するために、星状膠細胞を増やし、維持する能力を改善することが不可欠である。
【0316】
星状膠細胞の細胞維持に関して、EpiMogrifyによって予測される上位7つのシグナル伝達分子は、FN1、COL4A1、LAMB1およびCOL1A2のような細胞外マトリクス(ECM)の構成要素、ならびにADAM12およびEDIL3のような分泌リガンドである。LAMB1はラミニン三量体の一部であるので、LAMA2からなる星状膠細胞特異的ラミニン211複合体を使用し、LAMB1を予測し、LAMC1を予測した。予測された因子を、2つの異なる供給源から得た星状膠細胞:神経幹細胞から分化した星状膠細胞および初代星状膠細胞において試験した。星状膠細胞を、予測されたシグナル伝達分子を個々に、および一緒に補充することによって培養条件で培養した。追加のリガンドを含まなかった培養培地を、陰性対照として使用し、また、陽性対照としてマトリゲルと比較した。
【0317】
マトリゲルと比較してEpiMogrify予測因子での培養条件において細胞成長の有意な増加が見出された(
図3Aおよび3B)。次に、S100bおよびGFAPなどの星状膠細胞マーカーについての免疫蛍光を実施し、成長速度の増加が、神経幹細胞から分化した星状膠細胞および初代星状膠細胞において両方のマーカーを発現する細胞で細胞性の同一性に影響を与えないことを確認した(
図3Cおよび3D)。少しのシグナル伝達分子(FN1、COL1A2またはLAMB1など)のみを使用して、細胞維持を達成し、一部の場合、成長効率が、化学的に定義されていない複合体であるマトリゲルの使用と同等であることが示された。
【0318】
実施例6
EpiMogrifyは、細胞維持、例えば、心筋細胞についての因子を予測する
心筋細胞(心臓細胞)維持に関して、EpiMogrifyによって予測された上位7つのシグナル伝達分子は、FN1、COL3A1、TFPI、FGF7およびAPOEであった。心筋細胞を、予測されたシグナル伝達分子を個々に、および一緒に補充することによって培養条件で培養した。追加のリガンドを含まなかった培養培地を陰性対照として使用し、また、陽性対照としてゲルトレックスと比較した。
【0319】
ゲルトレックスと比較してEpiMogrify予測因子での培養条件において細胞成長の有意な増加が見出された(
図4Aおよび4B)。次に、GATA4およびNKX2.5などの心筋細胞マーカーについての免疫蛍光を実施し、成長速度の増加が、両方のマーカーを発現する細胞で細胞性の同一性に影響を与えないことを確認した(
図4C)。
【0320】
実施例7
EpiMogrifyは、細胞維持、例えば、平滑筋細胞についての因子を予測する
次に、EpiMogrify予測条件を、それらがin vitroでの平滑筋細胞維持を促進することができるかどうかを決定するために試験した。平滑筋細胞における予測を試験するために、ヒト肺動脈平滑筋細胞(HPASMC)をin vitroで培養した。
【0321】
HPASMCについてのH3K4me3のChIP-seqデータが利用できなかったので、最も近い利用可能な細胞型である「組織:胃の平滑筋」のH3K4me3プロファイルを使用して、平滑筋細胞維持についてのリガンドを予測した。平滑筋細胞維持についてEpiMogrifyによって予測される上位13個のリガンドは、LAMA5、COL4A1、LAMA4、NID1、COL6A3、COL4A6、COL4A5、FGF10、FGF7、GNAS、COL7A1、COL1A1およびTHBS1である。これらの予測のいくつかは、予測されたサブユニットCOL4A1、COL4A6およびCOL4A5を含む、コラーゲン4のような複合タンパク質のサブユニットであり、コラーゲン6はCOL6A3から構成され、コラーゲン1はCOL1A1から構成される。したがって、コラーゲン4、NID1、コラーゲン6、FGF10、FGF7、コラーゲン1およびTHBS1を、平滑筋細胞の維持について試験した。平滑筋細胞を、予測されたリガンドを個々に、または全て一緒に補充することによって培養条件で培養し、追加のリガンドを含まなかった培養条件を陰性対照とし、化学的に定義されていない複合混合物(ゲルトレックス)を有する培養条件を陽性対照とした。
【0322】
予測の有効性を評価するために、各条件において細胞成長の代わりとして増殖率の評価と一緒に細胞の数をカウントした。陰性対照と比較して、EpiMogrify予測リガンド(全てのリガンドを合わせもの、コラーゲン6、コラーゲン1、NID1およびFGF7など)を用いた培養条件の間で増殖率の有意な増加が観察された(
図5Aおよび5B)。さらに、全てのEpiMogrify予測を含有する維持条件における平滑筋細胞は、陰性対照と比較して有意に高いパーセンテージの平滑筋マーカーα-SMAを発現した(
図5C)。次に、平滑筋マーカーSM22についての免疫蛍光を実施して、EpiMogrify予測条件が細胞の同一性を保持することを示した(
図5D)。
【0323】
実施例8:Epimogrifyは、細胞維持、例えば、内皮細胞についての因子を予測する
内皮細胞における予測を試験するために、本発明者らは、in vitroで初代ヒト大動脈内皮細胞(HAoEC)を培養した。HAoECについてのH3K4me3のChIP-seqデータが利用できなかったので、最も近い利用可能な細胞型である「初代細胞:臍静脈の内皮細胞」のH3K4me3プロファイルを使用して、内皮細胞維持についてのリガンドを予測した。内皮細胞維持についてEpiMogrifyによって予測される上位10個のリガンドは、BMP6、ADAM9、LAMB1、LAMA4、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61である。これらのうち、BMP6、THBS1、CTGF、BMP4、PDGFB、FN1およびCYR61を、HAoEC内皮細胞維持について試験した。
【0324】
平滑筋細胞について使用したものと同様の実験設計を利用して、EpiMogrify予測条件(組合せおよび個々)において内皮細胞を維持し、陰性および陽性対照(ゲルトレックス)の両方と比較した。EpiMogrify予測条件(全てのリガンドを合わせたもの、ならびにPDGFB、THBS1、CTGF、BMP4、PDGFBおよびCYR61などの個々の因子)は、陰性対照と比較して有意に向上した細胞数および増殖率を維持することができた(
図6AおよびB)。さらに、EpiMogrify予測条件は、内皮マーカーCD31およびVWFを発現した(
図6CおよびD)。陰性対照と比較してVWFマーカーを発現した細胞の有意な増加はなかったが、EpiMogrifyで定義した条件(個々のリガンドおよび全てのリガンドを合わせたものを含む条件)において化学的に定義されていない複合体(ゲルトレックス)と比較してそのマーカーを発現する細胞の有意な増加があった。
【0325】
実施例9
EpiMogrifyは、細胞変換、例えば、星状膠細胞についての因子を予測する
EpiMogrifyは細胞状態を維持することができる因子を予測するので、細胞状態の変化をモデル化することによって、細胞変換に必要な因子を同定することができると仮定した。
図7Aは、ソース細胞型から標的細胞型への細胞状態の変化についての細胞変換スコア計算の詳細な概略図を示す。標的細胞型とソース細胞型との間の遺伝子のDBSの差に基づいて細胞状態の変化に特異的な遺伝子に優先順位を付けることができる。次に、細胞状態の変化に影響を与える調節作用に基づいて各遺伝子を加重して、各遺伝子についてのRegΔDBSスコアを導き出す。各細胞変換について、EpiMogrifyは、RegΔDBSによってランク付けされるタンパク質コード遺伝子(TFおよびシグナル伝達分子を含む)に優先順位を付ける。CellNet、D’Alessio ACら(Jensen-Shannonダイバージェンス統計を使用するので本明細書では「JSD」とも称される)およびMogrifyを含む、細胞の転写状態(または転写状態の変化)をモデル化し、細胞変換についてのTFを同定するための実験的に検証された少しの方法が存在する。エピジェネティックに基づくEpiMogrifyの予測を、転写に基づくコンピューターによる計算方法の予測と比較した。EpiMogrifyとJSDとの間に29種、EpiMogrifyとMogrifyとの間に43種、および3つ全ての方法の間に25種の共通の細胞型が存在した。GSEAを使用すると、共通の細胞変換について、EpiMogrifyによって予測されたTFは、JSD(全ての変換の76.4%)、Mogrify(60.7%)、またはJSDとMogrifyの両方(69.3%)によって予測されたTFに対して有意なエンリッチメントを有することが見出された(
図7B)。EpiMogrify予測TFと他の方法との間の有意な重複が見出された。EpiMogrifyによって予測された上位10個の中で公開されたTFの高い発生率により(
図7C)、細胞変換についてTFを同定する際のEpiMogrifyの高い精度が示される。
【0326】
次に、EpiMogrifyを適用して、胚性幹細胞から星状膠細胞への指向性分化についてシグナル伝達分子に優先順位を付けた。予測されたシグナル伝達分子を分化プロトコールにおいて試験した。
【0327】
EpiMogrify予測を、星状膠細胞分化について評価し、FN1、COL4A1、LAMB1、COL1A2、EDIL3、ADAM12およびWNT5Aなどの因子を同定した。星状膠細胞分化プロトコールをH9胚性幹細胞に適用し(
図8A)、分化の35日目に、星状膠細胞マーカーCD44に陽性の細胞の有意な増加を、「全てのリガンド」条件(全ての予測因子の組合せ)において観察した。その後42日目に、マトリゲル対照と比較して、FN1、COL4A1、LAMB1、COL1A2および「全てのリガンド」で処理したH9細胞においてCD44を発現する細胞の有意な増加を観察した(
図8B)。免疫蛍光を実施して、全ての条件においてGFAPおよびS100b星状膠細胞マーカーを有するDAPI+細胞のパーセンテージを得た(
図8D)。予測された条件下で、培養物はまた、42日目に星状膠細胞マーカーS100bおよびGFAPを発現し(
図8C)、予測された因子が星状膠細胞分化の効率を増加させることが示唆される。
【0328】
星状膠細胞特異性(星状膠細胞転写シグネチャー)を示す遺伝子の群について、TPMにおける遺伝子発現プロファイルの平均zスコアを、各時点および条件でシークエンスした3つの試料にわたって計算する。星状膠細胞転写シグネチャーは、(i)H9 ESCと本発明者らのRNA-seqデータから得た初代星状膠細胞との間の有意に上方制御した遺伝子、(ii)H9 ESCと、FANTOM5(F5)データベースから得た大脳皮質由来の星状膠細胞との間の有意に上方制御した遺伝子、(iii)H9 ESCと、F5データベースから得た小脳由来の星状膠細胞との間の有意に上方制御した遺伝子であり、(iv)EpiMogrify GRN(遺伝子調節ネットワーク)は、正のRegDBSスコアを有する初代星状膠細胞の細胞同一性遺伝子および調節される最初の隣接までのSTRINGネットワーク上の関連する遺伝子を含む遺伝子セットであり、(v)HumanBase GRNは、HumanBaseデータベースから得た星状膠細胞特異的ネットワークである(
図8D)。
【0329】
実施例10
EpiMogrifyは、細胞変換、例えば、心筋細胞についての因子を予測する
次に、EpiMogrifyにより予測された変換条件を心筋細胞分化(FGF7(線維芽細胞成長因子7)、COL1A2(コラーゲンI)、TGFB3(トランスフォーミング成長因子ベータ3)、COL6A3(コラーゲンVI)、EFNA1(エフリンA1)、TGFB2(トランスフォーミング成長因子ベータ2)およびGDF5(成長分化因子5))について試験した。これを行うために、対照としてマトリゲルを使用して、リガンドを、分化の間、H9 ESCに対して個々に、および一緒に培養培地に補充した(
図9A)。分化の12日目に、予測された条件(
図9B)において初期心臓系統マーカーCD82およびCD13を発現する細胞の有意な増加を観察した。20日目までに、残りの条件もまた、初期心臓系統マーカー発現を発現する細胞を生じたが、予測された条件は、マトリゲル対照と比較して12および20日目の両方において後期心臓マーカーであるcTNTの有意に高い発現を示した(
図9C、D)。さらに、分化した心筋細胞の表現型を、分化した細胞が拍動する可能性に基づいて決定し、マトリゲルと比較して、EpiMogrifyにより予測した条件(全ての予測因子の組合せ)を使用した場合、拍動する細胞を含むより多くの割合のプレートが存在することが示された。まとめると、これらのデータは、心臓の分化効率が増加し、より高い割合の機能的心筋細胞が生じることを示す。
【0330】
実施例11
実験方法
細胞カウントアッセイ
ReN星状膠細胞および初代星状膠細胞の5×103細胞を、それぞれの条件で48ウェルプレートに播種した:基質なし、マトリゲル、FN1(フィブロネクチン)(Sigma Aldrich)、COL4A1(コラーゲンIV)(Sigma Aldrich)、LAMB1(ラミニン221)(Biolamina)、ADAM12(Sigma Aldrich)、COL1A2(コラーゲンI)(Sigma Aldrich)、EDIL3(R&D Systems)および全てのリガンド(マトリゲルを含まない上述の基質と成長因子の組合せ)。3日後、トリプシン/EDTA溶液(TE)(Gibco)を使用して細胞を解離し、EVE自動セルカウンター(NanoEnTek Inc.)を使用してカウントした。
【0331】
初代心筋細胞について、5×104細胞/ウェルを、それぞれの条件で12ウェルプレートに播種した:基質なし、ゲルトレックス、FN1(フィブロネクチン)、COL1A2(コラーゲンI)、TFPI(組織因子経路阻害剤)、ApoE(アポリポタンパク質E)、FGF7(線維芽細胞成長因子-7)および全てのリガンド(ゲルトレックスを含まない上述の基質とリガンドの組合せ。72時間後、0.04%トリプシン/0.03%EDTA(Promocell)を使用して細胞を解離し、LUNA-II(商標)自動セルカウンター(Logos Biosystem,Inc.)を使用してカウントした。
【0332】
平滑筋細胞について、5×104細胞/ウェルを、それぞれの条件で12ウェルプレートに播種した:基質なし、ゲルトレックス、NID1(ニドゲン-1)、COL1A1(コラーゲンI)、COL4A1(コラーゲン4)、COL6A1(コラーゲン6)、THBS1(トロンボスポンジン1)、FGF10(線維芽細胞成長因子-10)、FGF7(線維芽細胞成長因子-7)および全てのリガンド(ゲルトレックスを含まない上述の基質とリガンドの組合せ。内皮細胞について:基質なし、ゲルトレックス、FN1(フィブロネクチン)、THBS1(トロンボスポンジン1)、CTGF(結合組織成長因子)、PDGFB(血小板由来成長因子サブユニットB)、CYR61(システインリッチ血管新生誘導因子61)、BMP4(骨形成タンパク質4)、BMP6(骨形成タンパク質6)および全てのリガンド(ゲルトレックスを含まない上述の基質とリガンドの組合せ。72時間後、TrypLE Express(Life Technologies)を使用して細胞を解離し、LUNA-II(商標)自動セルカウンター(Logos Biosystem,Inc.)を使用してカウントした。
【0333】
BrdU増殖アッセイ
ReN星状膠細胞および初代星状膠細胞の5×103細胞を、底が透明な96ウェル黒色プレート(Corning)に播種した。12時間後、BrdU標識を、製造業者の推奨(Cell Proliferation ELISA、BrdU(化学発光)、Roche)に従ってウェルに加えた。72時間後、細胞を固定し、抗BrdU抗体で標識化し、続いて基質反応を行い、PHERAstar FSXマイクロプレートリーダー(BMG Labtech)を使用して分析した。初代心筋細胞について、BrdU Cell Proliferation Assay Kit(BioVision Inc.)を、製造業者の説明書に従って使用した。簡潔に説明すると、示した細胞を、5×103細胞/ウェルで96ウェル組織培養処理プレート(Costar)に播種した。72時間後、BrdU溶液を各アッセイウェルに加え、37℃で3時間インキュベートした。増殖細胞によって取り込まれたBrdUを、酵素結合免疫吸着測定法によって検出した。
【0334】
平滑筋細胞および内皮細胞の両方について、BrdU Cell Proliferation Assay Kit(BioVision Inc.)を、製造業者の説明書に従って使用した。簡潔に説明すると、示した細胞を、5×103細胞/ウェルで96ウェル組織培養処理プレート(Costar)に播種した。72時間後、BrdU溶液を各アッセイウェルに加え、37℃で4時間インキュベートした。増殖細胞によって取り込まれたBrdUを、酵素結合免疫吸着測定法によって検出した。
【0335】
フローサイトメトリー
分化実験について、Accutase(Stem Cell Technologies)を使用して培養物を解離し、400×gで5分間ペレット化した。次いで細胞を、2%ウシ胎仔血清(FBS)(Gibco)およびリン酸緩衝生理食塩水(PBS)(Gibco)中のAPC-Cy7 CD44抗体(103028、Biolegend);またはPE-Cy7 CD13(56159、BD Biosciences)およびPE CD82(342104、Biolegend)に再懸濁し、4℃で15分間インキュベートした。細胞懸濁液をPBSで洗浄し、分析のために400×gで5分間ペレット化した。4’,6-ジアミジノ-2-フェニルインドール(DAPI)(Life Technologies)を使用して細胞の生存率を決定した。BD FACSDivaソフトウェア(BD Bioscience)を使用したLSR IIaアナライザー(BD Biosciences)を使用して試料を分析した。
【0336】
初代心筋細胞、平滑筋細胞および内皮細胞について、0.04%トリプシン/0.03%EDTA(Promocell)を使用して細胞を解離し、300×gで5分間ペレット化した。次いで細胞を室温で4%パラホルムアルデヒド(PFA)中で懸濁して固定し、FACS緩衝液(1×PBS、0.2%BSA)中で2回洗浄し、0.1%Triton X-100で透過処理した。心筋細胞についての一次抗体は、ウサギ抗ヒトNkx2.5(Cell Signaling)およびウサギ抗ヒトGATA-4(Novus Biologicals)であった。平滑筋細胞および内皮細胞に使用した一次抗体は、それぞれ、アルファ平滑筋アクチンに対するマウスモノクローナル(Abcam)およびフォンヴィレブランド因子に対するウサギポリクローナル(Abcam)であった。使用した二次抗体には、Alexa Fluor 488ヤギ抗ウサギ(Life Technologies)およびAlexa Fluor 647ヤギ抗ウサギ(Life technologies)が含まれる。細胞を、30分間室温で、一次抗体で染色した。2回洗浄した後、細胞を二次抗体とインキュベートし、2回洗浄し、BD FACS-Fortessa機器(BD Biosciences)を使用したフローサイトメトリー分析のためにFACS緩衝液中で再懸濁した。
【0337】
免疫蛍光
培養細胞を、PBS中の4%PFA(Sigma Aldrich)で10分間固定し、次いで0.3%Triton X-100(Sigma Aldrich)を含有するPBS中で透過処理した。次いで培養物を、一次抗体、続いて二次抗体とインキュベートした(以下の希釈を参照のこと)。4’,6-ジアミジノ-2-フェニルインドール(DAPI)(1:1000)(Life Technologies)を加えて、細胞核を可視化した。画像を倒立蛍光顕微鏡および付属カメラ(Nikon Eclipse Ti)で撮影した。この研究に使用した一次抗体は、抗S100b(6673、Sigma Aldrich、1:200)、抗GFAP(ab7260、Abcam、1:500)、cTNT(MS-295-P1、Thermo Fisher、1:100)であった。この研究に使用した二次抗体(全て1:400)は、Alexa Fluor488ロバ抗マウスIgG(A21202、Life Technologies)、Alexa Fluor 555ロバ抗ウサギIgG(A31572、Life Technologies)、Alexa Fluor 488ヤギ抗マウスIgG(A28175、Life Technologies)であった。
【0338】
内皮細胞および平滑筋細胞について、培養細胞を、PBS中の4%PFA(Sigma Aldrich)で10分間固定し、次いで0.1%Triton X-100(Sigma Aldrich)を含有するPBS中で透過処理した。次いで培養物を、一次抗体、続いて二次抗体とインキュベートした(以下の希釈を参照のこと)。Hoechst 33342(1:1000)(Life Technologies)を加えて、細胞核を可視化した。画像を倒立蛍光顕微鏡で撮影した。内皮細胞および平滑筋細胞に使用した一次抗体は、それぞれ、抗CD31(Abcam、1:200)および抗-Anti-TAGLN/トランスジェリン(Abcam、1:200)であった。この研究に使用した二次抗体(全て1:400)は、Alexa Fluor 488ヤギ抗マウス(Life Technologies)およびAlexa Fluor 488ロバ抗ヤギ(Life technologies)であった。
【0339】
RNA-seqライブラリー調製および分析
TRIzol(商標)試薬(Thermo Fisher Scientific)を使用して27個の試料(H9 ESC、初代星状膠細胞ならびに星状膠細胞分化の間の7、14および21日目からの細胞)から全RNAを単離した。8.5~10のRINを有する100~200ngの全RNAを、製造業者のプロトコールに従ってポリA mRNAエンリッチメントおよびNEBNext(登録商標)Multiplex Oligos for Illumina(登録商標)(96 Unique Dual Index Primer Pairs)と組み合わせたNEBNext Ultra IIディレクショナルRNAライブラリー調製キットを使用してRNA-seqライブラリー調製のために誘導した。過剰なプライマーおよびアダプター二量体を取り除くために、SPRIビーズ(Beckman Coulter)を使用してPCR産物を2回精製した。Agilent Bioanalyzer DNA 1000チップ(Duke-NUS Genome Facility)を使用してライブラリーの品質を評価し、KAPAライブラリー定量化キット(Roche)を使用して各ライブラリーのモル濃度を決定した。3つのプールしたライブラリー(各々30uL中に8nMのプールした濃度で9個の試料を含有する)を、Illumina HiSeq4000(NovogeneAIT Genomics Singapore)でのシークエンシングのために送った。
【0340】
H9 ESC、初代星状膠細胞からの上記のRNA-seqデータについて、星状膠細胞分化の間の異なる時点(7、14および21日目)ならびに対照マトリゲルおよびEpiMogrifyによって予測された全てのリガンドを含む条件での遺伝子発現解析。Trimmomatic v0.39を使用してシークエンシングリードをトリミングし、このリードを、STAR v2.7.3を使用してGRCh38ヒトゲノムに整列させた。featureCounts v1.6.0を使用して試料についての遺伝子発現プロファイルを生成し、DESeq2 v1.26.0を使用して差次的遺伝子発現プロファイルをコンピューターで計算した。本発明者らのRNA-seqデータの遺伝子発現プロファイルを星状膠細胞転写シグネチャーと比較するために、Transcripts Per Million(TPM)正規化を使用してデータを正規化した。次に、初代星状膠細胞において発現した5,475個の遺伝子(TPM>1)を選択し、これらの遺伝子について本発明者らは、全ての試料(異なる時点および条件でのH9 ESC、初代星状膠細胞および分化した星状膠細胞)にわたって遺伝子zスコアを計算した。星状膠細胞転写シグネチャーを得るために、H9 ESCと小脳における星状膠細胞との間、およびH9と大脳皮質における星状膠細胞との間の差次的遺伝子発現プロファイルを、FANTOM5遺伝子発現アトラスから得た。EpiMogrify GRNは、正のRegDBSスコアを有する遺伝子である星状膠細胞の細胞同一性遺伝子、およびSTRINGネットワーク上のこれらの細胞同一性遺伝子と直接関連する遺伝子からなる。HumanBase星状膠細胞特異的GRNをデータベースから得た。
【0341】
本明細書に開示され、定義される本発明は、言及されたまたは本文もしくは図面から明らかな個々の特徴の2つ以上の全ての代替の組合せに及ぶことは理解される。これらの異なる組合せの全ては本発明の様々な代替の態様を構成する。
【0342】
本発明の記述および実施形態
i.目的の細胞についての細胞同一性遺伝子を決定する方法であって、
- 目的の細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定するステップと、
- H3K4me3修飾領域の微分幅および少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、タンパク質コード遺伝子の産物間の相互作用の情報を含む、ステップと、
- 微分幅とネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子についての細胞同一性スコアを決定するステップと、
- その細胞同一性スコアに従って各タンパク質コード遺伝子に優先順位を付けるステップと
を含み、それによって目的の細胞についての細胞同一性遺伝子を同定する、方法。
【0343】
ii.H3K4me3修飾領域の微分幅を決定するステップが、目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定することを含み、DBSは、異なる細胞型の集団における同じ遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、記述iに記載の方法。
【0344】
iii.ネットワークスコアを決定するステップが、DBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子の産物間の相互作用に基づく、記述iiに記載の方法。
【0345】
iv.in vitroで細胞型を維持するのに必要な因子を決定する方法であって、
- 目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- DBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物と他のタンパク質コード遺伝子産物との間の相互作用の情報を含む、ステップと、
- DBSとネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子についての細胞同一性スコア(RegDBS)を決定するステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付け、それによって目的の細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、目的の細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによってin vitroで目的の細胞を維持するのに必要な因子を同定する、方法。
【0346】
v.H3K4me3修飾領域の微分幅が、
- 目的の細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の幅に関する情報を得て、細胞における各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を得るステップと、
- 細胞における各遺伝子の遺伝子幅スコアと、異なる型の細胞の集団にわたる同じ遺伝子についての遺伝子幅スコアの中央値との差を計算し、それによって目的の細胞における各タンパク質コード遺伝子についての微分ピーク幅広スコア(DBS)を決定するステップと
によって決定される、記述iからivのいずれか一つに記載の方法。
【0347】
vi.H3K4me3修飾領域の幅がChIP-seq情報に基づいて決定され、好ましくは、情報はENCODEデータベースから得られる、記述iからvのいずれか一つに記載の方法。
【0348】
vii.遺伝子ピーク幅スコア(B)を決定するステップが、有意なH3K4me3修飾が存在するゲノムの領域を最初に定義し、それらの領域をヒストン修飾参照ピーク遺伝子座(RPL)と定義することを含む、記述vまたはviに記載の方法。
【0349】
viii.RPLが、全ての細胞型にわたって、得られたChIP-seqピーク領域をマージすることによって得られ、好ましくは、マージされるピーク領域は重複するピーク領域である、記述viiに記載の方法。
【0350】
ix.各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)が、H3K4me3およびH3K27me3修飾領域が同定される遺伝子を除外することを含み、遺伝子がポイズド遺伝子として同定される、記述vからviiiのいずれか一つに記載の方法。
【0351】
x.H3K4me3修飾が、H3K4me3修飾を含む、記述iからixのいずれか一つに記載の方法。
xi.H3K4me3修飾領域の微分幅(DBS)を決定するステップが、各タンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に関する情報を、幅のその差の有意性と組み合わせることを含む、記述iiからixのいずれか一つに記載の方法。
【0352】
xii.DBSが、ピーク幅の差と、差の有意性とを加算することによって決定され、好ましくは、DBSが、H3K4me3ピーク幅の差と、有意性の-log10P値とを加算することによって決定される、記述xiに記載の方法。
【0353】
xiii.目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップが、各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅(DBS)に関する情報、遺伝子の出次数ノードの数、およびネットワークにおける遺伝子の関連性のレベルを組み合わせることを含む、記述iからxiiのいずれか一つに記載の方法。
【0354】
xiv.ネットワークスコアが、関連する遺伝子のDBSを合計することによって決定され、遺伝子の出次数ノードの数および関連性のレベルについて加重されて、ネットワークにおける関連するタンパク質コード遺伝子についてのDBSの加重和を得る、記述xiiiに記載の方法。
【0355】
xv.タンパク質間相互作用ネットワークがSTRINGデータベースである、記述iからxivのいずれか一つに記載の方法。
xvi.細胞同一性スコア(RegDBS)が、細胞の同一性に対する各タンパク質コード遺伝子の調節作用の指標である、記述iからxvのいずれか一つに記載の方法。
【0356】
xvii.細胞同一性スコア(RegDBS)を決定するステップが、調節因子をコードするタンパク質コード遺伝子を優先的に加重することを含む、記述iからxviのいずれか一つに記載の方法。
【0357】
xviii.各タンパク質コード遺伝子についての細胞同一性スコア(RegDBS)を決定するステップが、H3K4me3修飾領域の微分幅(DBS)スコアと、目的の細胞における全ての遺伝子にわたって正規化されたネットワークスコアとを加算することを含む、記述iからxviiのいずれか一つに記載の方法。
【0358】
xix.DBSとネットワークスコアとの加算が、2:1の係数によってネットワークスコアに対してDBSを加重することを含む、記述xviiiに記載の方法。
xx.その細胞同一性スコア(RegDBS)に従って各タンパク質コード遺伝子に優先順位を付けるステップが、RegDBS値に基づいて遺伝子を順序付けすることを含む、記述iからxixのいずれか一つに記載の方法。
【0359】
xxi.in vitroで目的の細胞を維持するための因子が、細胞シグナル伝達に関与する受容体-リガンド対、好ましくは、受容体-リガンド対のリガンド、転写因子、およびエピジェネティックリモデリング因子からなる群から選択される、記述iからxxのいずれか一つに記載の方法。
【0360】
xxii.細胞シグナル伝達に関与する受容体-リガンド対をコードする細胞同一性遺伝子を選択し、それによってin vitroで目的の細胞を維持するのに必要なシグナル伝達分子を同定するステップを含む、記述iからxxiのいずれか一つに記載の方法。
【0361】
xxiii.細胞表面受容体をコードする各タンパク質コード遺伝子が、そのRegDBSスコアに従ってランク付けされ、受容体に関連付けられた各リガンドが、そのDBSスコアに従ってランク付けされて、受容体およびリガンドの組み合わせたランク付けを得、組み合わせたランク付けは、in vitroで目的の細胞を維持するための培養培地を補充する際に使用するためのリガンドを同定する、記述xxiiに記載の方法。
【0362】
xxiv.転写因子をコードする細胞同一性遺伝子を選択し、それによってin vitroで目的の細胞を維持するのに必要な転写因子を同定することをさらに含む、記述iからxxiのいずれか一つに記載の方法。
【0363】
xxv.目的の細胞についての細胞同一性遺伝子を決定する方法であって、
- 目的の細胞(x)における各タンパク質コード遺伝子(g)についてのH3K4me3遺伝子ピーク幅スコア(B)を決定するステップであって、遺伝子ピーク幅スコアは、H3K4me3修飾を含む各タンパク質コード遺伝子のプロモーターにおける領域の長さの合計である、ステップと、
- 目的の細胞と、バックグラウンド遺伝子ピーク幅スコアを表す細胞の集団の遺伝子ピーク幅スコアの中央値との間の遺伝子ピーク幅スコア(Δピーク幅x
g)の正規化された差、およびその差の有意性(Pval)を決定するステップと、
- Δピーク幅とPval値とを加算することによって、細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBSx
g)を決定するステップと、
- ネットワークにおける関連する遺伝子(r)の微分幅広スコア(DBSx
g)に関する情報を組み合わせることによって目的の細胞における各タンパク質コード遺伝子についてのネットワークスコア(Netxg)を決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物と他のタンパク質コード遺伝子産物との間の相互作用の情報を含み、微分幅広スコアは、遺伝子の出次数ノードの数(O)および遺伝子の関連性のレベル(L)を補正され、好ましくは、微分幅広スコア(DBSx
g)の加重和は、関連性の第3のレベルまで計算される、ステップと、
- 目的の細胞(x)における全てのタンパク質コード遺伝子(G)にわたってネットワークスコアNetx
gを正規化するステップと、
- 微分幅広スコア(DBSx
g)とネットワークスコア(Netx
g)の組合せに基づいて目的の細胞における各タンパク質コード遺伝子をスコア付けすることによって目的の細胞における各タンパク質コード遺伝子についての調節微分幅広スコア(RegDBSx
g)を決定するステップであって、RegDBSx
gは、細胞の同一性に対する各タンパク質コード遺伝子の調節作用の指標である、ステップと、
- そのRegDBSx
gに従って各遺伝子に優先順位を付けるステップと
を含み、それによって目的の細胞についての細胞同一性遺伝子を同定する、方法。
【0364】
xxvi.タンパク質間ネットワークにおける実験スコアがゼロより大きく、組み合わせたスコアが500より大きい場合、タンパク質コード遺伝子産物のノード間の相互作用が、ネットワークスコアの計算に含まれるように選択される、記述iからxxvのいずれか一つに記載の方法。
【0365】
xxvii.ネットワークスコアを決定するステップが、関連付けられたピークH3K4me3幅を有しないタンパク質コード遺伝子をタンパク質間相互作用ネットワークから除去することを含む、記述iからxxviのいずれか一つに記載の方法。
【0366】
xxviii.標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- ソース細胞および標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定して、ソースおよび標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾のスコア(DBS)を得るステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、各タンパク質コード遺伝子についてのソース細胞と標的細胞との間のH3K4me3修飾の差の尺度(細胞変換ΔDBS)を得るステップと、
- 細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいてソース細胞型から標的細胞型へ変換するためのネットワークスコアを決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子産物と他の遺伝子産物との間の相互作用の情報を含む、ステップと、
- 細胞変換ΔDBSとネットワークスコアの組合せに基づいて標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコアを決定するステップと、
- その細胞同一性変換スコアに従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する、方法。
【0367】
xxix.標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- ソース細胞および標的細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、各タンパク質コード遺伝子についての細胞変換ΔDBSを得るステップと、
- 細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各遺伝子のタンパク質産物間の相互作用に基づいてソース細胞型から標的細胞型への細胞変換のためのネットワークスコアを決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物と他のタンパク質コード遺伝子産物との間の相互作用の情報を含む、ステップと、
- 細胞変換ΔDBSとネットワークスコアの組合せに基づいて標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコア(RegΔDBS)を決定するステップと、
- その細胞変換RegΔDBSに従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する、方法。
【0368】
xxx.H3K4me3修飾領域の微分幅が、
- ソース細胞および標的細胞における各タンパク質コード遺伝子についてのH3K4me3修飾領域の幅に関する情報を得て、各細胞型における各遺伝子についての遺伝子ピーク幅スコア(B)を得るステップと、
- 細胞型における各タンパク質コード遺伝子の遺伝子ピーク幅スコアと、異なる型の細胞の集団にわたる同じ遺伝子についての遺伝子ピーク幅スコアの中央値との差を計算し、それによってソース細胞および標的細胞の両方における各遺伝子についての微分幅広スコア(DBS)を決定するステップと
によって決定される、記述xxviiiからxxixのいずれか一つに記載の方法。
【0369】
xxxi.H3K4me3修飾領域の幅がChIP-seq情報に基づいて決定され、好ましくは、情報がENCODEデータベースから得られる、記述xxviiからxxxのいずれか一つに記載の方法。
【0370】
xxxii.遺伝子ピーク幅スコア(B)を決定するステップが、有意なH3K4me3修飾(ヒストン修飾参照ピーク遺伝子座、またはRPL)が存在するゲノムの領域を最初に定義することを含む、記述xxxからxxxiのいずれか一つに記載の方法。
【0371】
xxxiii.RPLが、全ての細胞型にわたって、得られたChIP-seqピーク領域をマージすることによって得られ、好ましくは、ピーク領域は重複するピーク領域である、記述xxxiiに記載の方法。
【0372】
xxxiv.各タンパク質コード遺伝子についての遺伝子ピーク幅スコア(B)を決定するステップが、H3K4me3およびH3K27me3修飾領域が同定される遺伝子を除外することを含み、遺伝子はポイズド遺伝子として同定される、記述xxxからxxxiiiのいずれか一つに記載の方法。
【0373】
xxxv.H3K4me3修飾が、H3K4me3修飾を含む、記述xxviiiからxxxivのいずれか一つに記載の方法。
xxxvi.ソース細胞および標的細胞における各タンパク質コード遺伝子についてのDBSを決定するステップが、各タンパク質コード遺伝子についてのH3K4me3幅の差に関する情報を、その差の有意性と組み合わせることを含む、記述xxviiiからxxxvのいずれか一つに記載の方法。
【0374】
xxxvii.DBSを決定するステップが、ピーク幅の差および差の有意性を乗算、正規化または加算することを含み、好ましくは、DBSは、ピーク幅の差と差の有意性とを加算することによって決定される、記述xxxviに記載の方法。
【0375】
xxxviii.ソース細胞のDBSと標的細胞のDBSとの差を計算して、各遺伝子についての細胞変換ΔDBSを得るステップは、各タンパク質コード遺伝子についてのソース細胞のDBSを、各遺伝子についての標的細胞のDBSから減算して、各遺伝子についての細胞変換ΔDBSを得ることを含み、各タンパク質コード遺伝子についての細胞変換ΔDBSは、ソース細胞と標的細胞との間の所与のタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差の尺度を提供する、記述xxviiiからxxxviiのいずれか一つに記載の方法。
【0376】
xxxix.ソース細胞から標的細胞への細胞変換についてのネットワークスコアが、ネットワークにおける関連する遺伝子の細胞変換ΔDBSの加重された組合せである、記述xxviiiからxxxviiiのいずれか一つに記載の方法。
【0377】
xxxx.細胞変換についてのネットワークスコアを決定するステップが、各遺伝子についての細胞変換ΔDBSに関する情報、遺伝子の出次数ノードの数、およびネットワークにおける遺伝子の関連性のレベルを組み合わせることを含む、記述xxxixに記載の方法。
【0378】
xli.ネットワークスコアが、関連する遺伝子の細胞変換ΔDBSを合計することによって決定され、遺伝子の出次数ノードの数および関連性のレベルについて加重されて、ネットワークにおける関連する遺伝子についての細胞変換ΔDBSの加重和を得る、記述xlに記載の方法。
【0379】
xlii.タンパク質間相互作用ネットワークがSTRINGデータベースである、記述xxviiiからxliのいずれか一つに記載の方法。
xliii.細胞変換RegΔDBSを決定するステップが、調節因子をコードするタンパク質コード遺伝子を優先的に加重することを含む、記述xxviiiからxliiのいずれか一つに記載の方法。
【0380】
xliv.各タンパク質コード遺伝子についての細胞変換RegΔDBSを決定するステップが、細胞変換ΔDBSスコアと、全てのタンパク質コード遺伝子にわたって正規化された細胞変換ネットワークスコアとを加算することを含む、記述xxviiiからxliiのいずれか一つに記載の方法。
【0381】
xlv.細胞変換ΔDBSおよび細胞変換ネットワークスコアの加算が、2:1の係数によって細胞変換ネットワークスコアに対して細胞変換ΔDBSを加重することをさらに含む、記述xlivに記載の方法。
【0382】
xlvi.その細胞変換RegΔDBSに従って各タンパク質コード遺伝子に優先順位を付けるステップが、細胞変換RegΔDBS値に基づいて遺伝子を順序付けすることを含む、記述xxviiiからxlvのいずれか一つに記載の方法。
【0383】
xlvii.細胞変換因子が、受容体-リガンド対、転写因子、またはエピジェネティックリモデリング因子からなる群から選択される、記述xxviiiからxlviのいずれか一つに記載の方法。
【0384】
xlviii.転写因子である因子のサブセットを選択し、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な転写因子を同定するステップであって、好ましくは、変換は、分化した標的細胞への分化したソース細胞の分化転換である、ステップをさらに含む、記述xxviiiからxlviiのいずれか一つに記載の方法。
【0385】
xlix.細胞シグナル伝達に関与する受容体-リガンド対である因子のサブセットを選択し、それによって標的細胞へのソース細胞の変換に必要なシグナル伝達分子を同定するステップであって、好ましくは、同定される因子は、分化した標的細胞への多能性ソース細胞の指向性分化のためである、ステップを含む、記述xxviiiからxlviiのいずれか一つに記載の方法。
【0386】
l.細胞表面受容体をコードする各タンパク質コード遺伝子が、そのRegDBSスコアに従ってランク付けされ、受容体に関連付けられた各リガンドは、そのDBSスコアに従ってランク付けされて、受容体およびリガンドの組み合わせたランク付けを得、組み合わせたランク付けは、in vitroで目的の細胞を維持するための培養培地を補充する際に使用するためのリガンドを同定する、記述xlixに記載の方法。
【0387】
li.標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を決定する方法であって、
- 目的のソース細胞(S)、および標的細胞(T)における各タンパク質コード遺伝子(g)についてのH3K4me3遺伝子ピーク幅スコア(B)を決定するステップであって、遺伝子幅スコアは、H3K4me3修飾を含む各タンパク質コード遺伝子のプロモーターにおける領域の長さの合計である、ステップと、
- ソース細胞と、バックグラウンド遺伝子ピーク幅スコアを表す細胞の集団の遺伝子ピーク幅スコアの中央値との間の遺伝子ピーク幅スコアの正規化された差(Δピーク幅S
g)、およびその差の有意性(PvalS
g)を決定するステップと、
- 標的細胞と、バックグラウンド遺伝子ピーク幅スコアを表す細胞の集団の遺伝子幅スコアの中央値との間の遺伝子ピーク幅スコアの正規化された差(Δピーク幅T
g)、およびその差の有意性(PvalS
g)を決定するステップと、
- Δピーク幅S
gとPvalT
g値とを加算して、ソース細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBSS
g)を得るステップと、
- Δピーク幅T
gとPvalT
g値とを加算して、標的細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBST
g)を得るステップと、
- 標的細胞における同じ遺伝子についての微分幅広スコア(DBST
g)からソース細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBSS
g)を減算して、標的細胞における各タンパク質コード遺伝子についての細胞変換ΔDBS(ΔDBST-S
g)を得るステップと、
- ネットワークにおける関連する遺伝子(r)の細胞変換微分幅広スコア(ΔDBST-S
g)を組み合わせることによって標的細胞における各遺伝子についてのネットワークスコア(NetT-S
g)を決定するステップであって、ネットワークは、細胞における各タンパク質コード遺伝子の産物間の相互作用の情報を含み、微分幅広スコアは、遺伝子の出次数ノードの数(O)および遺伝子の関連性のレベル(L)を補正され、好ましくは、細胞変換微分幅広スコア(ΔDBST-S
g)の加重和が、関連性の第3のレベルまで計算される、ステップと、
- 全てのタンパク質コード遺伝子にわたって細胞変換ネットワークスコアNetT-S
gを正規化するステップと、
- 細胞変換微分幅広スコア(ΔDBST-S
g)と細胞変換ネットワークスコア(NetT-S
g)の組合せに基づいて各タンパク質コード遺伝子をスコア付けし、それによって各タンパク質コード遺伝子についての細胞変換調節微分幅広スコア(RegΔDBST-S
g)を決定するステップであって、RegΔDBST-S
gは、ソース細胞と比較した標的細胞に対する各タンパク質コード遺伝子の調節作用の差の指標である、ステップと、
- その細胞同一性スコア、RegΔDBST-S
g細胞に従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換に必要な因子を同定する、方法。
【0388】
lii.ネットワークにおける実験スコアがゼロより大きく、組み合わせたスコアが500より大きい場合、タンパク質間相互作用ネットワークにおけるタンパク質コード遺伝子産物のノード間の相互作用が選択される、記述xxviiiからliのいずれか一つに記載の方法。
【0389】
liii.ネットワークスコアを決定するステップが、関連付けられたピークH3K4me3幅を有しない遺伝子をタンパク質間相互作用ネットワークから除去することを含む、記述xxviiiからliiのいずれか一つに記載の方法。
【0390】
liv.転写的に冗長なTFを、各細胞型からのランク付けしたリストから除去するステップをさらに含む、記述xlviiiに記載の方法。
lv.in vitroで細胞の集団を維持する方法であって、
- 細胞培養中に目的の細胞の集団を提供するステップと、
- 目的の細胞における各タンパク質コード遺伝子についての微分幅広スコア(DBS)を決定するステップであって、DBSは、異なる細胞型の集団における同じ遺伝子についてのH3K4me3修飾領域の幅の中央値と比較した全てのタンパク質コード遺伝子についてのH3K4me3修飾領域の幅の差に基づく、ステップと、
- DBSおよび少なくとも1つのネットワーク上の各遺伝子のタンパク質産物間の相互作用に基づいて目的の細胞における各タンパク質コード遺伝子についてのネットワークスコアを決定するステップであって、ネットワークは、各タンパク質コード遺伝子の産物と、細胞における他のタンパク質コード遺伝子産物との間の相互作用の情報を含む、ステップと、
- DBSとネットワークスコアの組合せに基づいて目的の細胞における各タンパク質コード遺伝子をスコア付けし、それによって目的の細胞における各タンパク質コード遺伝子についてのRegDBSを決定するステップであって、RegDBSは細胞同一性についての各タンパク質コード遺伝子の重要性の指標である、ステップと、
- そのRegDBSに従って各タンパク質コード遺伝子に優先順位を付け、それによって目的の細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、目的の細胞の細胞同一性に関連付けられた因子をコードする、ステップと、
- 目的の細胞の集団を、目的の細胞の細胞同一性に関連付けられた因子のうちの1つまたは複数と接触させるステップと、
- 細胞培養中に目的の細胞の維持を可能にするのに十分な時間および条件下で細胞の集団を培養するステップと
を含み、それによってin vitroで細胞の集団を維持する、方法。
【0391】
lvi.in vitroで星状膠細胞の集団を維持する方法であって、順に以下のステップ:
- 細胞培養中に星状膠細胞の集団を提供するステップと、
- 星状膠細胞の少なくとも1つの特徴を維持するために、星状膠細胞の集団を、1つまたは複数の因子と接触させるステップと、
- 細胞培養中に星状膠細胞の維持を可能にするのに十分な時間および条件下で星状膠細胞の集団を培養するステップと
を含み、
因子は、FN1、COL4A1、EDIL3、WNT5A、LAMB1、ADAM12およびCOL1A2から選択され、
それによってin vitroで星状膠細胞の集団を維持する、方法。
【0392】
lvii.因子が、FN1、COL4A1、EDIL3、WNT5A、LAMB1、ADAM12およびCOL1A2を含むか、それらからなるか、またはそれらから本質的になる、記述lviに記載の方法。
【0393】
lviii.星状膠細胞を、FN1、COL4A1、EDIL3、WNT5A、LAMB1、ADAM12およびCOL1A2のうちの1つまたは複数、2つ以上、3つ以上、4つ以上、5つ以上と接触させるステップを含む、記述lviまたはlviiに記載の方法。
【0394】
lix.星状膠細胞を個体に投与するステップをさらに含む、記述lviからlixのいずれか一つに記載の方法。
lx.in vitroで心筋細胞の集団を維持する方法であって、
- 細胞培養中に心筋細胞の集団を提供するステップと、
- 心筋細胞の少なくとも1つの特徴を維持するために、心筋細胞の集団を、1つまたは複数の因子と接触させるステップと、
- 細胞培養中に心筋細胞を維持するのに十分な時間および好適な条件下で心筋細胞の集団を培養するステップと
を含み、
因子は、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3およびCXCL12から選択され、
それによってin vitroで心筋細胞の集団を維持する、方法。
【0395】
lxi.因子が、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3およびCXCL12を含むか、それらからなるか、またはそれらから本質的になる、記述lxに記載の方法。
【0396】
lxii.心筋細胞を、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3およびCXCL12のうちの1つまたは複数、任意選択により、FN1、COL3A1、TFPI、FGF7、APOE、C3、COL1A2、SERPINE1、COL6A3、CXCL12のうちの2つ以上、3つ以上、4つ以上、5つ以上、または6つ以上と接触させるステップであって、好ましくは、因子は、FN1、COL3A1、TFP1、FGF7およびAPOEである、ステップを含む、記述lxまたはlxiに記載の方法。
【0397】
lxiii.心筋細胞、または細胞集団を個体に投与するステップをさらに含む、記述lxからlxiiのいずれか一つに記載の方法。
lxiv.標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換する方法であって、
- ソース細胞を準備するステップと、
- ソース細胞および標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾領域の微分幅を決定して、ソースおよび標的細胞型における各タンパク質コード遺伝子についてのH3K4me3修飾のスコア(DBS)を得るステップと、
- ソース細胞のDBSと標的細胞のDBSとの差を計算して、各タンパク質コード遺伝子についてのソース細胞と標的細胞との間のH3K4me3修飾における差の尺度(細胞変換ΔDBS)を得るステップと、
- 細胞変換ΔDBSおよび少なくとも1つのネットワーク上の各タンパク質コード遺伝子のタンパク質産物間の相互作用に基づいてソース細胞型から標的細胞型への変換についてのネットワークスコアを決定するステップであって、ネットワークが、細胞における各タンパク質コード遺伝子産物と他の遺伝子産物との相互作用の情報を含む、ステップと、
- 細胞変換ΔDBSとネットワークスコアの組合せに基づいて標的細胞における各タンパク質コード遺伝子についての細胞同一性変換スコアを決定するステップと、
- その細胞同一性変換スコアに従って各タンパク質コード遺伝子に優先順位を付けて、標的細胞についての細胞同一性遺伝子を同定するステップであって、各細胞同一性遺伝子は、標的細胞の細胞同一性に関連付けられた因子をコードする、ステップと、
- 標的細胞型の少なくとも1つの特徴を示す細胞へのソース細胞の変換を可能にするのに十分な時間および条件下でソース細胞を培養するステップと
を含み、それによって標的細胞型の少なくとも1つの特徴を示す細胞へソース細胞を変換し、任意選択により、1つまたは複数の因子の量を増加させることは、i)ソース細胞を、因子もしくは細胞によって因子の発現を増加させる作用物質と接触させること、またはii)因子をコードする核酸をソース細胞にトランスフェクトし、細胞において核酸を発現させることを含む、方法。
【0398】
lxv.ソース細胞を分化するための方法であって、ソース細胞において、1つもしくは複数の因子またはそのバリアントのタンパク質発現を増加させるステップであって、ソース細胞は、標的細胞の少なくとも1つの特徴を示すように分化される、ステップを含み、
- ソース細胞は多能性幹細胞であり、標的細胞は星状膠細胞であり、
- 因子は、FN1、COL4A1、COL1A2、EDIL3、ADAM12、LAMB1およびWNT5Aのうちの1つまたは複数である、方法。
【0399】
lxvi.多能性幹細胞または神経前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成する方法であって、
- ソース細胞において、多能性幹細胞または神経前駆細胞を、因子FN1、COL4A1、COL1A2、EDIL3、ADAM12、LAMB1およびWNT5Aのうちの1つもしくは複数、またはそれらのバリアントと接触させるステップと、
- 星状膠細胞への分化を可能にするのに十分な時間および条件下で多能性幹細胞または神経前駆細胞を培養し、それによって多能性幹細胞または神経前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成するステップと
を含む、方法。
【0400】
lxvii.多能性幹細胞、好ましくは、胚性幹細胞または神経前駆細胞を、星状膠細胞の少なくとも1つの特徴を示す細胞に分化するための方法であって、i)多能性幹細胞、または多能性幹細胞もしくは神経前駆細胞を含む細胞集団を準備するステップと、ii)前記多能性幹細胞または神経前駆細胞に、星状膠細胞の細胞同一性に重要な1つまたは複数の因子をコードするヌクレオチド配列を含む1つまたは複数の核酸をトランスフェクトするステップと、iii)前記細胞または細胞集団を培養し、任意選択により、星状膠細胞の細胞の少なくとも1つの特徴について細胞または細胞集団をモニタリングするステップとを含み、
多能性幹細胞を星状膠細胞へ分化するための因子、または星状膠細胞の少なくとも1つの特徴を示す細胞を生成するための因子は、FN1、COL4A1、COL1A2、EDIL3、ADAM12、LAMB1およびWNT5Aを含むか、それらからなるか、またはそれらから本質的になる、方法。
【0401】
lxviii.胚性幹細胞または神経前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成する方法であって、
- 胚性幹細胞または神経前駆細胞において、FN1、COL4A1、COL1A2、EDIL3、ADAM12、LAMB1およびWNT5A、またはそれらのバリアントのうちのいずれか1つまたは複数の量を増加させるステップと、
- 星状膠細胞に分化するのに十分な時間および条件下で胚性幹細胞を培養し、それによって胚性幹細胞または神経前駆細胞から星状膠細胞の少なくとも1つの特徴を示す細胞を生成するステップと
を含む、方法。
【0402】
lxix.因子の1つまたは複数の量を増加させるステップが、ソース細胞において因子の1つまたは複数をコードする核酸を発現させることを含む、記述lxviiiに記載の方法。
【0403】
lxx.星状膠細胞の少なくとも1つの特徴が、いずれか1つもしくは複数の星状膠細胞マーカーの上方制御および/または細胞形態の変化であり、好ましくは、星状膠細胞マーカーは、GFAP、S100B、ALDH1L1、CD44およびGLAST1から選択される、記述lxivからlxixのいずれか一つに記載の方法。
【国際調査報告】