IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ブルースター ジェノミクス, インコーポレイテッドの特許一覧

特開2024-107255起源組織を割り当てるための無細胞核酸サンプルのヒドロキシメチル化分析および関連する使用方法
<>
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024107255
(43)【公開日】2024-08-08
(54)【発明の名称】起源組織を割り当てるための無細胞核酸サンプルのヒドロキシメチル化分析および関連する使用方法
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20240801BHJP
   C12Q 1/6869 20180101ALI20240801BHJP
   G01N 33/50 20060101ALI20240801BHJP
   C12N 15/11 20060101ALN20240801BHJP
   C12N 9/10 20060101ALN20240801BHJP
【FI】
C12Q1/68
C12Q1/6869 Z
G01N33/50 P
C12N15/11 Z
C12N9/10
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024093656
(22)【出願日】2024-06-10
(62)【分割の表示】P 2020571408の分割
【原出願日】2019-06-24
(31)【優先権主張番号】62/688,975
(32)【優先日】2018-06-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/746,237
(32)【優先日】2018-10-16
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520306875
【氏名又は名称】クリアノート ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】チン-ジェン ク
(72)【発明者】
【氏名】フランソワ コリン
(72)【発明者】
【氏名】パトリック エー. アレンスドルフ
(72)【発明者】
【氏名】サミュエル レヴィ
(57)【要約】
【課題】起源組織を割り当てるための無細胞核酸サンプルのヒドロキシメチル化分析および関連する使用方法の提供。
【解決手段】起源組織を、サンプル中の核酸、例えばヒト対象から得た無細胞流体サンプル中のDNAに確率論的に割り当てるための方法が提供される。ヒドロキシメチル化プロファイルが、前記サンプルDNAについて作成され、次いでヒドロキシメチル化プロファイルベクトルの参照データセット全体にわたって比較され、ここで各ヒドロキシメチル化プロファイルベクトルは、特定の参照遺伝子座における前記ヒドロキシメチル化プロファイル、前記参照遺伝子座に関連する組織特異的遺伝子、および前記遺伝子および参照遺伝子座と関連する前記組織を識別する。起源組織は、前記比較の結果を用いて、前記サンプル核酸に確率論的に割り当てることができる。他の使用方法も提供される。
【選択図】なし
【特許請求の範囲】
【請求項1】
明細書に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本発明は、一般に、バイオテクノロジーに関し、より具体的には、無細胞DNAのエピジェネティック分析の利用方法に関する。本発明は、ゲノム学、医学、診断、およびエピジェネティック研究の分野で使用することができる。
【背景技術】
【0002】
背景
医学に関連する多くの分野、例えば診断、セラノスティクス、および患者モニタリングにおいて、生物学的サンプルを分析し、その分析から有用な情報を抽出する、より高精度な方法が現在も要求されているが、この要求は、多くの場合に正確度(accuracy)および効率という目的と競合する。分析方法は、高速処理および自動化に適し、迅速かつコストパフォーマンスよく必要な結果が得られ、また高い感受性と特異性を実現すべきである。さらに、分析方法によって得られる情報は、最大限に有用であるべきである。患者のDNAを分析するための方法において、例えば、病理学的段階の存在を診断するのに十分な情報を迅速に提供することができれば理想的であろう。
【0003】
近時、エピジェネティクス分野の研究者は、DNAが特定の組織または器官に由来するものである可能性を突き止めるために、患者のDNAのメチル化状態を用いる試験方法を提案している。例えば、種々の組織のメチル化プロファイルを得るためにゲノム範囲にわたるバイサルファイトシーケンシングを使用することを記述しているSunら(2015)Proc.Natl.Acad.Sci.112(40):E5503-E5512、および腫瘍由来のDNAの起源組織を識別するためにDNAメチル化パターンを使用することを記述しているKangら(2017)Genome Biology 18:53を参照のこと。
【0004】
無細胞DNA分析は、非侵襲的で、手術を必要とせずに患者サンプルを評価することを可能にするという利点を有する、比較的最近のものである。しかしながら、特に無細胞DNAはとても少量で、概して血漿1mLあたり数ナノグラムのDNAしか含まれていないため、無細胞DNAの分析には固有の問題もある。この問題は、比較的まれなDNA修飾(例えば5-メチルシトシンと、さらにまれな5-ヒドロキシメチルシトシン)を検出しなければならないエピジェネティック分析に関連して無細胞DNAを用いるとき、いっそう大きなものとなる。
よって、得られる情報に特定の遺伝子本体(gene body)またはそのフラグメントの起源である組織または器官が含まれる、無細胞DNAに利用できるエピジェネティック分析方法の技術分野における必要性が現在も存在している。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Sunら(2015)Proc.Natl.Acad.Sci.112(40):E5503-E5512
【非特許文献2】Kangら(2017)Genome Biology 18:53
【発明の概要】
【課題を解決するための手段】
【0006】
発明の要旨
エピジェネティクス分野が発展するにつれて、まれなDNA修飾である5-ヒドロキシメチルシトシン(5hmC)の検出が、メチル化されたアナログ、すなわち5-メチルシトシンの検出と同じくらい重要である可能性が明らかとなった。
【化1】
【0007】
5hmCの出現頻度は、5mCよりも大幅に低く、組織タイプによるが、典型的な比率は約10:1であり(Nestorら(2012)Genome Biology 13:R84参照)、5mCは、全DNA塩基の約1%に相当する。バイサルファイトシーケンシングでは、5mCと5hmCとを識別できず、よって、5mCおよび5hmC残基を個別に検出できる他の方法が必要である。5hmCは、5mCよりも非常に少ないことが多いため、どのような5hmC検出方法にせよ、識別される全5hmC残基の割合に関して、高い効率ならびに高い選択性を発揮する必要がある。これは、実際上、5hmCとして識別される実質的に全ての残基が5hmC残基であるべきであることを意味する。5hmCが転写、DNA脱メチル化などの種々のプロセスに関係し、異常な5hmCパターンの場合は腫瘍発生に関係することは確立されているにも関わらず、5hmCの分子的機能は、理解され始めたばかりである。Tahilianiら(2009)Science 324(5929):930-035(2009);Guoら(2011)Cell 145:423-434;Wuら(2011)Genes&Development 25:679-684;Koら(2010)Nature 468:839-843;およびRobertsonら(2011)Biochem.Biophys.Res.Comm.411(1):40-3を参照のこと。5hmCは、安定的なDNA修飾であり、TET1などのTET(Ten-Eleven Translocation)酵素による5mCの酵素的酸化から生じることも知られている。
【0008】
本発明は、5-ヒドロキシメチル化(「ヒドロキシメチル化」)プロファイルを使用して、起源組織を、サンプル中の核酸、一般的にはヒト対象から得たサンプル液中のDNAに、確率論的に割り当てることに基づいている。本方法は、サンプル核酸について作成されたヒドロキシメチル化プロファイルと、複数の参照遺伝子座のそれぞれにおける参照ヒドロキシメチル化プロファイルを含む参照データセットとの比較を含む。各参照遺伝子座は、組織特異的遺伝子に関連するゲノム領域内に含まれる。前記した部位は、本明細書において、「バイオマーカー部位」、「ヒドロキシメチル化バイオマーカー部位」、または「ヒドロキシメチル化バイオマーカー」と呼ばれることがある。
【0009】
ヒドロキシメチル化状態が決定される各部位は、ちょうど説明したように、それぞれが特定の組織に関連するゲノム領域内に含まれるヒドロキシメチル化バイオマーカー部位であり、それぞれの相関性の程度(すなわち特異性)は異なっている。すなわち、ある特定の遺伝子は、全ての細胞において類似したヒドロキシメチル化パターンを示す(すなわち、ハウスキーピング遺伝子)が、他の遺伝子は、全身の種々の組織において異なって表現されるヒドロキシメチル化パターンを示し、ここでは、主に、これらの「異なって表現される」(DR)遺伝子に関連する参照遺伝子座が重要である。その理由は、特定の組織で高度に表現される遺伝子に関連するヒドロキシメチル化パターンが、組織の確定に最も有用だからである。
【0010】
いくつかの実施形態において、参照遺伝子座は、DR遺伝子と関連しており、このDR遺伝子は、遺伝子発現レベルもまた特定の組織に対して特異性がある。すなわち、DR遺伝子は、同時に「異なって発現され」(DE)ている、異なって表現される遺伝子である。
【0011】
参照データセット中の情報は、複数のヒドロキシメチル化ベクトルの形態である(各ヒドロキシメチル化ベクトルによって、少なくとも以下のもの、すなわち特定の参照遺伝子座におけるヒドロキシメチル化状態;前記参照遺伝子座に関連する組織特異的遺伝子;および前記遺伝子および参照遺伝子座と関連する組織が識別される)。したがって、本発明は、まず核酸のヒドロキシメチル化プロファイルを作成し、次いで参照データセットを構成する幅広いヒドロキシメチロームデータセット全体にわたって類似性をアセスメントすることによって、サンプル中の核酸を分析することを含む。参照データセット中のヒドロキシメチル化ベクトル全体にわたってサンプルのヒドロキシメチル化プロファイルを詳細に比較することによって、組織タイプに関する情報が得られる。この情報は、その核酸が特定の組織タイプに由来する確率でありうる、または分析した核酸が、2またはそれを超える対応する組織タイプを起源とすることを示す2またはそれを超える確率の形態でありうる。対象から得た無細胞流体サンプル中のDNAフラグメントの場合のように、複数の核酸を分析する場合、情報は、分析するDNAフラグメントに対応する組織タイプの全体的な比率の推定を含んでいてもよい。
【0012】
そして、一実施形態において、起源組織を、ヒト対象から得た無細胞流体サンプル中の核酸に確率論的に割り当てるための方法が提供される。この方法は、以下の(a)~(d)を含む。
【0013】
(a)前記核酸のヒドロキシメチル化プロファイルを作成すること;
【0014】
(b)前記核酸のヒドロキシメチル化プロファイルを、参照データセット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連するゲノム領域内に含まれる参照遺伝子座に対応する);
【0015】
(c)(a)において検出されたヒドロキシメチル化プロファイルと実質的に類似する参照ヒドロキシメチル化プロファイルを有する少なくとも1つの参照遺伝子座を識別すること;および
【0016】
(d)(c)において識別された少なくとも1つの参照遺伝子座および対応する組織特異的遺伝子に基づいて、少なくとも1つの起源組織を前記核酸に確率論的に割り当てること。
【0017】
実施形態の一態様において、前記方法は、少なくとも1つの起源組織を、無細胞流体サンプル中の複数のDNAフラグメントのそれぞれに確率論的に割り当てることを含む。
【0018】
本実施形態の別の態様において、前記参照データセットは、複数の組織特異的遺伝子に関連する参照遺伝子座のヒドロキシメチル化プロファイルを含む。
【0019】
実施形態の別の態様において、各参照遺伝子座は、組織特異的遺伝子に関連するヒドロキシメチル化可変ゲノム領域内に含まれる。異なってヒドロキシメチル化された複数の領域は、ヒドロキシメチル化プロファイルに関して、例えば密度、パターンなどの1またはそれを超える点に関して互いに異なっていてもよく、また、一般的に、対応する組織特異的遺伝子と機能的に関連する。
【0020】
実施形態の追加の態様において、少なくとも1つの参照遺伝子座は、遺伝子本体またはその構成要素の中に含まれる。
【0021】
実施形態の追加の態様において、少なくとも1つの参照遺伝子座は、遺伝子の外にあるゲノムアノテーション特徴(例えば、プロモーター、エンハンサー、転写開始部位、転写停止部位、DNA結合部位(発現抑制領域(例えば、STRまたはERV領域)など)、または転写因子結合部位(例えば、転写抑制因子結合部位または転写促進因子結合部位))の中に含まれる。
【0022】
実施形態のさらなる態様において、参照セット中の参照遺伝子座のうちの少なくとも1つは、CTCF結合部位の中に含まれる。
【0023】
実施形態のさらなる態様において、前記参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連する少なくとも1つの参照遺伝子座のヒドロキシメチル化プロファイルを含み、前記組織特異的遺伝子は、ヒト組織タイプ(すなわち、消化器、脳、および骨髄またはリンパ由来などの種類の、機能的な、器官の、解剖学的な、および関連する細胞系統グループ)に関連し、前記ヒト組織タイプには、脂肪;副腎;膀胱;骨髄;脳;胸;結腸;大脳皮質;頸部;子宮;消化器;子宮内膜;精巣上体;食道;卵管;胆嚢;胃腸;心筋;視床下部;腎臓;肝臓;肺;リンパ節;卵巣;膵臓;副甲状腺;胎盤;前立腺;唾液腺;精嚢;骨格筋;平滑筋;皮膚;脾臓;胃;精巣;甲状腺;および扁桃が含まれる。
【0024】
実施形態の別の態様において、各参照遺伝子座は、AARD、ADARB1、AKR1B10、ANAPC7、APCDD1L-AS1、APOA1BP、CALHM2、CASC3、CLEC2L、COL4A5、CRYM-AS1、EPHA3、FAHD2B、FKBP9L、FOPNL、GNG11、GSN、GSTTP2、GTSF1、IAH1、KCNMB1、KIAA1644、LAMC1、LINC00310、LOC100506394、LOC100507066、LOC493754、MAP1B、MGC27382、MIR5695、NENF、NT5DC3、P2RX1、PCP4、PGM5、PLCD4、PTGFR、RBFOX3、RPL30、SCARA3、SLIT3、SNX29P1、SPATA4、ST8SIA1、TBX4、TXNRD1、VCL、VPS72、WFDC3、ZNF791、ADAMTS20、AFF2、ANKRD18B、ANKRD18DP、ANKRD20A5P、ANKRD20A8P、ANKRD26P1、ANKRD30BP2、ANKRD34B、ANKRD34C、ATP6V0B、AVPR1A、BLOC1S3、BOLL、BRIP1、C5orf63、CA1、CALB1、CALCR、CCDC39、CCDC96、CDCA5、CDH12、CDH9、CEACAM8、CENPE、CENPK、CFL1、CHAT、COMMD5、COMMD8、CRISP1、CRISP2、CSN1S1、CSN1S2AP、CT64、CXCR2、CXorf30、DAZL、DCDC1、DRGX、DSG1、DUT、DUX2、DUX4L2、DUX4L3、DYTN、EDA2R、EFCAB3、EPOR、EVX2、F13A1、FCAR、FCER1A、FKBP1B、FOXA2、GABPB1-AS1、GABRA1、GABRA4、GABRG1、GALNTL6、GFER、GFI1、GPR152、GPR158-AS1、GPRC6A、GRM1、GRP、GRXCR1、GYPA、HAGHL、HCRTR2、HEPHL1、HJURP、HK3、HMBS、HORMAD2、ID4、IL17RA、IL18RAP、KCNC2、KCNK18、KIF18A、KIF20B、KLHL1、LEF1-AS1、LHX1、LHX3、LHX8、LINC00273、LINC00558、LINC00645、LINC00648、LLPH、LOC100129620、LOC100270679、LOC100505776、LOC100506422、LOC284801、LOC392232、LOC399815、LOC401074、LOC401134、LOC440040、LOC440970、LOC642236、LOC727924、LOC728012、LPO、LRRIQ1、MAGEA11、MAGOHB、MEFV、MIF4GD、MIR548A3、MIR5692A1、MMP8、MMP9、MMRN1、MRGPRE、MS4A3、MSRB1、MYO3A、NCOR1P1、NDST3、NDST4、NHLRC4、NOXRED1、NPAP1、NUF2、OR8G1、OR8U8、ORC6、OSM、OTX2、PAX3、PBK、PCDH8、PDCL2、POTEA、PROK2、PRR7、RAB24、RAX、RBM46、RGS18、RGS19、RIMS2、RNF175、RRM2、SATB2-AS1、SCN11A、SCRT2、SERPINB10、SGOL2、SIX1、SKA3、SKOR1、SLC22A16、SLC4A10、SLC5A7、SLC5A8、SLCO6A1、SNAP91、SPAG16、SPATA16、SPDL1、SPINK13、STPG2、STXBP5L、TARM1、TDRD5、TEX15、THSD7B、TMPRSS11A、TMPRSS11B、TMPRSS11D、TRIM58、TUBB4B、UNC13C、USP6、VRK1、VSTM1、VWDE、WDR49、WFDC8、WFDC9、ZIC5、ZNF230、ZNF300P1、ZNF470、ZNF502、ZNF599、ZPBP、C1orf159、CCDC42B、CCDC8、CD248、CERCAM、CNTN2、CRB2、EVI5L、FZD9、HAPLN2、HPDL、LINC00575、LOC284950、LOC339666、LRIT1、PLEKHH1、SHISA2、SLC46A2、TFAP2E、TMEM235、TNFRSF18、ZFP36、結腸UR:C1orf109、CACNA1F、COX7B、EFNB1、FGL2、FLJ34208、GNRH1、GSTT1、IL12A、KCND1、KDELR1、LAT、LOC100130992、LOC100287042、LOC401242、MRPL10、NT5C3B、PDZD4、PPYR1、RAD51D、RBMXL3、RENBP、SCNN1B、SERPINB5、SLC9A6、XBP1、ZNF189、ABR、ADPRHL1、ASB18、ATP1A3、CCDC74A、CDH13、CHRNA10、CORO6、FSD2、GALNT16、GDAP1L1、GJA3、GLUD1P3、GPRC5B、LOC100506343、LRRC37A6P、LRRC4、MUL1、MYOM2、NDUFB8、NT5DC2、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB4、PCDHGB5、PCDHGB6、PCDHGB7、PXDNL、RHPN1-AS1、RPL3L、SGCG、TIMM21、TNNT1、TOR4A、UBAC1、WDR37、ZNF12、ZNF213、ZNF550、ZNF843、ZNF844、AGAP6、ASTN1、BBS2、C18orf56、C19orf45、CINP、DGKI、DPY30、DROSHA、FAM169A、FAM66D、FONG、GALNT15、GDAP1、GHRH、GUSBP4、HIF1AN、IFIT1B、INTS2、JAKMIP2-AS1、KGFLP2、LINC00297、LINC00707、LOC100288069、LOC100507140、LPHN3、LYPD1、LZIC、MIR548T、MRAP、NTRK3、PDE6D、PPP1R17、PRSS54、PRSS55、PTPRA、RGS7、SNRNP35、SUGT1P1、UBE2Z、WDR47、WDYHV1、ZNF114、ZNF556、ZNF610、ABP1、AGPAT9、APH1B、ASAP2、ATP4B、ATP6V1A、BBOX1、BCRP3、C11orf63、C13orf35、C16orf96、C19orf21、CA12、CCDC64、COL4A3、CXCL14、CYS1、EIF4E2、EPB41L1、EVC、FIGNL2、FUT3、GALNT14、GLIS2、GUSBP11、HAVCR1、HOXC5、INADL、KATNA1、L2HGDH、LOC100130238、LOC100506305、LOC284100、LOC654433、LYG1、MORN4、MTNR1A、PAQR5、PARG、PAX2、PAX8、PLA2G15、POU5F1、PRKAB1、RNF113B、SENP8、SETD3、SLC22A2、SLC25A30、SLC9A3、SULT1C2、TBC1D7、TSPAN33、ABCB4、ABCC11、ABCC2、ABCG5、ABCG8、ACADSB、ACSM5、AGMO、AGXT2L1、AKR1C2、AKR1C4、AKR1D1、AMDHD1、APOB、APOH、APOM、AQP9、ARHGEF40、ASGR2、ASPG、ATP2B2、BCO2、BDH1、C3、C3P1、C5、C8A、C8B、C8orf74、CA5A、CABP2、CALR3、CD7、CDK10、CEACAM16、CES1、CFH、CFHR4、CHP1、CIDEB、CLPTM1L、CLRN3、CPN2、CREB3L3、CROCCP2、CYP2B6、CYP2C18、CYP2C19、CYP2C9、CYP2E1、CYP3A5、CYP7A1、DGAT2、DHODH、DPYS、DRG2、ECHS1、EDC4、EI24、ENO1、F13B、F2、F7、F9、FASN、FETUB、GCH1、GCKR、GDPD4、GFRA1、GHR、GLT1D1、GPAM、GSDMB、HAL、HAO1、HAPLN4、HPD、HPX、HYLS1、IGF2、IGF2-AS、IGFBP1、ISY1-RAB43、ITIH1、ITIH2、ITIH4、IVD、KLC4、LBP、LEFTY1、LIPG、LOC100288122、LOC284865、LPAL2、LRRC16B、MASP1、MGMT、MST1、MTTP、NAT9、NBR2、NELFE、NR1I2、NUP88、OSGIN1、PAH、PARD6A、PCSK9、PEX19、PGLYRP2、PHGDH、PHYH、PKLR、PLA2G12B、PLG、PNPLA3、POFUT1、POLR1E、PON1、PPL、PRAP1、PRKAG3、PROC、PUS3、RANBP10、RCE1、RND1、RNF123、RORC、RPUSD4、SAA2-SAA4、SCP2、SEC16B、SERPINA6、SERPINC1、SKIV2L、SLC13A5、SLC22A25、SLC25A20、SLC27A5、SLC30A10、SLCO1B3、SMLR1、SNAPC5、SPP2、SRD5A1、STAT2、STEAP3、SULT2A1、TFR2、THNSL2、TIAF1、TM6SF2、TMEM45A、TMPRSS6、TTC31、TTC38、UROC1、XYLB、ZCCHC9、ZSCAN22、ADAM9、ANKRD50、ARGLU1、ARL6、ARSJ、BMP5、BMPR2、BTG3、C1orf140、CALM2、CCDC102B、CCNL1、CCR5、CD36、CHN1、CLIC2、CPEB2、CRBN、CYP4Z2P、CYYR1、DACH1、DGKE、DGKH、DISP1、DOCK4、ETV1、EXOC1、FAM204A、FAT4、FGD5-AS1、FLJ34503、FRYL、GBP1P1、GNB4、GPR110、GPR116、HMCN1、HMGN1、IFI44、IL15、ITGA2、KAL1、KDR、KITLG、KLHL41、LDB2、LINC00032、LINC00240、LINC00551、LINC00657、LOC100131234、LOC100505495、LOC100507217、LOC643733、LPAR6、MGP、ODF2L、PEAK1、PKIA、PLEKHA1、PLEKHG7、PTPRB、QKI、RAD21、RALA、RAP2A、RCC1、SAMD12、SESTD1、SH3GLB1、SKAP2、SLC35A5、SMURF2、SPRED1、SRSF1、TCF4、TIGD4、TMEM207、TMOD3、UHMK1、VEGFC、XIST、YIPF5、ZC2HC1A、ZEB1、AKNA、ANKRD34A、C14orf183、CCDC107、CD180、CD3G、CD74、CDC42SE2、CHMP7、COTL1、CYTH1、FAIM3、FAM65B、GPX4、GSTP1、HLA-DMA、HLA-DOA、HLA-DPB1、HVCN1、ICAM2、ICOS、IL6、ITGB7、LOC100130557、MDM4、METTL21D、MGC16275、MIR548AN、NAPSB、RPL39L、RPS11、SEPT6、SH2D3C、TAP1、TEAD2、TMEM60、TNFRSF9、TRAF1、UBAC2、UCP2、WDR87、ACTA2、ADAMTS5、AQP11、ATP1B2、BICD1、C7、CDH3、CDON、COL14A1、HS3ST1、KLF4、LEMD1-AS1、LINC00672、LOC100129617、LOC3392


98、LRRC17、NDP、NTF3、OMD、PDGFRA、PGR、ROBO4、RWDD4、SCD5、SERPINE2、SLC25A17、SNCAIP、SYTL4、TENM4、TSPAN5、UBXN8、ZNF93、ALDH1L2、ANKEF1、ASUN、B3GALNT2、BBIP1、C6orf201、CASP9、CCDC110、CCDC65、CDK14、CELA2B、CELA3B、CFTR、CHMP4C、CHRNA7、CLCN3、CLDN1、CPA3、CUZD1、DNAJC10、DNAJC3、EIF2S1、EIF4EBP1、ERO1LB、FAIM、FAM160A1、FAM162A、FAM221A、FAM24B-CUZD1、GARS、GUCA1C、HSPA13、IFRD1、INTS6、KCTD16、LINC00339、LMAN1、LOC154092、LOC201651、LOC644838、LYPD6B、MAN1A2、MGC72080、MKNK1、MPP6、MSRB2、NAA16、NOMO2、OSTC、PEX7、PGRMC2、PIK3CB、PLA2G12A、PM20D1、PPP1R9A、PRRC1、PRSS3、RNPC3、SCFD1、SCRN3、SERPINI2、SH3YL1、SLC16A7、SLC33A1、SLC4A4、SORBS2、SRBD1、SSR1、TDH、TDP2、TMEM51-AS1、TMEM65、TRHDE、TRIM44、UGT2A3、UMOD、WDFY2、WHAMM、XPOT、ACER2、ADAM12、ADCY10、ADCY7、ADORA2B、AIM1L、AKNAD1、ALDH3B2、AMOT、ANGPT2、APOLD1、ATF3、ATG9B、ATP6V1C2、ATRIP、BCAR3、BCAR4、BEAN1、BPGM、BTBD19、C11orf70、C16orf46、C16orf74、C17orf98、C1QTNF6、C2orf62、C2orf83、C3orf52、C4orf26、C4orf51、C6orf99、C7orf71、C9orf129、CACNA2D3-AS1、CAPN6、CCDC125、CEP41、CLEC7A、CPA4、CSF3R、CTSL3P、CXorf56、CYP19A1、DACT2、DDX59、DLX3、DLX5、DLX6-AS1、DNMT1、DUSP4、EBI3、EDARADD、EPAS1、EPS8L1、ERVFRD-1、ERVMER34-1、ETV3、ETV4、EXTL1、EZR、FAM184A、FAM89A、FANCE、FBLN1、FBN2、FHDC1、FOLR1、GATA2、GATA3、GBA、GCM1、GDPD3、GLDN、GM2A、GPR156、GSG1、GSTA3、GSTA4、HELLS、HOPX、HSD11B2、HSPBAP1、IGF2BP3、IGSF5、ISM2、KATNBL1、KIAA1467、KIAA1609、KISS1、KLRG2、L1TD1、LCMT1、LCTL、LIN28B、LINC00439、LOC100131564、LOC100506746、LOC100527964、LOC151475、LOC152578、LOC284551、LOC643441、MB21D2、MED12、METTL21C、MFSD2B、MGC16121、MINA、MORC4、MSANTD3、MUTYH、NOS3、NVL、NXF1、OLR1、OSCP1、OSTCP1、P2RY6、PCBP1-AS1、PDE6A、PGC、PGF、PLA1A、PLAC4、PPP1R14D、PSG11、PSG2、PSG6、PSG7、PSG8、PTGES、PVRL3-AS1、PVRL4、PWWP2B、RAB36、RHO、RNF222、RPSAP58、RS1、SBF2-AS1、SCIN、SDC1、SEMA3F、SEMA6D、SEPT12、SH2D7、SH3GLB2、SLC13A4、SLC26A2、SLC2A1-AS1、SMAGP、SMARCB1、SMIM13、SNX12、SP6、SPESP1、SPIRE2、ST3GAL6-AS1、SVEP1、SYT8、TENM3、TLR3、TMEM216、TMEM218、TMEM52B、TMPRSS7、TP63、TPRXL、TRIM29、TRPV5、TUFT1、USHBP1、VAMP5、VGLL1、WBP2NL、XRCC2、ZDHHC1、ZNF320、ZNF331、ZNF354B、ZNF468、ZNF525、ZNF702P、ZNF90、ZP3、ZSWIM2、ZSWIM7、ABCC4、ACPP、ALDH1A2、ANKRD66、AP1B1P1、ARG2、BEND4、C1orf85、C6orf132、C6orf52、CHRNA2、COQ7、EVX1、EYA2、FLJ39080、GDEP、HMGN2P46、ISX、KLKP1、MCCC2、MEAF6、MFSD4、MRPS23、NCAPD3、OACYLP、OAZ3、OR51E2、PAK1IP1、PCAT1、PI15、PPP1R7、PSMA4、SCNN1G、SLC14A1、SLC26A3、SLC2A12、SLC30A4、SLC35F2、TMEM79、TPM3P9、TTC12、USP50、ZNF350、ZNF532、ZNF589、AKIP1、ARHGEF26-AS1、ATG4A、BOLA3、CHMP4A、DHH、EPPK1、FCHSD1、GADL1、GCC1、GIPC3、HIGD2B、HTR3C、LINC00654、LOC91948、OLFML3、PTGES3L、WSCD2、ZNF202、ZNF205-AS1、ZNF426、ACOT1、C12orf54、CREB3、DDN、FAM50A、FNDC4、GORASP1、GUCA1B、IMPDH2、LINC00284、LOC100128076、LOC100128682、LOC100131434、LRP10、LRRC55、LRRC73、NOTO、RNF112、RTBDN、SIGLEC8、TNN、TRIM50、UBE2T、ZNF391、ZNF792、ALX4、AQP2、ATAD3B、C11orf85、CABLES2、CCDC114、CCDC27、CCNF、CD300C、CILP、DES、DMRT1、DNAJB8-AS1、DRD4、EFCAB6-AS1、FAM153B、FAM163B、FGD2、HSD17B3、IFI27L1、IGFN1、ITPR3、KCNK15、KIFC2、KRT78、KRT82、LOC100506385、LOC283914、LOC284661、LOC399829、LOC653712、LOC728716、MAGED2、MYH16、MYLK2、NPTX2、PLK5、PMS2CL、PNPLA1、PODNL1、POLD1、PRMT8、PTPRVP、RD3、RIMS4、RNU6-81、RPL26L1、SALL4、SERPINA10、SPATA31E1、STAB1、SULT4A1、TCERG1L、TEKT4P2、THEG、TMEM130、TPO、UPK3B、WASH3P、WRAP53、ZNF280B、またはZNF793を含む、異なって表現される遺伝子の中に含まれる。
【0025】
関連する態様において、各参照遺伝子座は、AARD、ADARB1、AKR1B10、CRYM-AS1、EPHA3、GTSF1、KCNMB1、MAP1B、NT5DC3、P2RX1、PCP4、PGM5、PLCD4、PTGFR、RBFOX3、SCARA3、SLIT3、SNX29P1、ST8SIA1、TBX4、TXNRD1、VCL、WFDC3、ABCA13、AZU1、CA1、CEACAM8、CLEC6A、DAZL、DRGX、DYTN、ELANE、FCAR、GFI1、GYPA、HK3、IL18RAP、LINC00333、LINC00550、LINC00558、LIPN、LOC100129620、LOC442028、LPO、MEFV、MMP8、MMP9、MPO、MS4A3、MYB、MYO1F、NCOR1P1、NME8、OR8U8、OSCAR、PARPBP、PAX3、PDCL2、PRDM13、PROK2、RGS18、RGS21、RRM2、RXFP2、SERPINB10、SLC22A16、SPATA16、SPI1、SPTA1、TARM1、TMPRSS15、TRIM58、VSTM1、XKR3、ASPHD1、BRSK1、CCDC177、CNTN2、HAPLN2、KCNJ10、KIF1A、LGI3、NCAN、NR2E1、RHBDL3、TMEM151A、TMEM235、TMEM59L、ZNF488、FGL2、SCNN1B、ADPRHL1、ASB18、ATP1A3、CDH13、CORO6、FSD2、GALNT16、GJA3、MYOM2、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB5、PCDHGB6、PCDHGB7、PXDNL、RPL3L、SGCG、TNNT1、ASTN1、DGK1、 BBOX1、BCRP3、CA12、COL4A3、CXCL14、CYS1、EVC、FIGNL2、GALNT14、GLIS2、HAVCR1、LOC100130238、PAQR5、PAX2、PAX8、PLA2G15、SLC22A2、SLC9A3、SULT1C2、TSPAN33、ABCC2、ABCG5、ABCG8、AHSG、AKR1C4、AMDHD1、APOH、ASGR1、ASGR2、C3P1、C8A、C8B、C9、CA5A、CFHR4、CPN2、CREB3L3、CYP2B6、CYP2C9、CYP2E1、CYP3A4、DHODH、F12、F2、F7、GC、HAL、HPD、HPX、INHBC、ITIH1、ITIH2、ITIH3、KNG1、LBP、PGLYRP2、PLG、PROC、PRODH2、SERPINA6、SERPINC1、SLC13A5、SLC22A1、SLC25A47、SLC27A5、SULT2A1、TFR2、TMPRSS6、UROC1、ANXA3、BMP5、CYP4Z2P、DRAM1、FMO2、GNA15、IDO1、KCNS3、LIMCH1、MBIP、PAPSS2、PCDH17、RSPH4A、RTKN2、TRPC6、ACAP1、AKNA、ARHGAP9、BCL11B、BIRC3、CARD11、CD180、CD37、CD3E、CD3G、CD40、CETP、CIITA、CLEC2D、CNR2、CXCR5、DOCK10、ETS1、GPR132、GPR18、ICAM2、ICOS、ITGB7、ITK、KIAA1551、KLHL6、LCK、LINC00426、LY86、MDS2、MEOX2、MX2、NAPSB、PATL2、PCED1B-AS1、PIK3CD、PLVAP、POU2F2、SCIMP、SCML4、SLFN12L、SMAP2、SP110、SPIB、TLR10、TMC8、TMEM156、TNFAIP8、TNFRSF9、TNFSF11、TRAF1、TRIM22、UCP2、ZC3H12D、ABCA10、ACSS3、ADAMTS5、AQP11、C7、CDH3、CDON、CLDN11、COL14A1、COLEC11、ESR2、FAM198B、FZD3、GALNT10、GLI2、GSTM5、HS3ST1、LEMD1-AS1、LHX9、LRRC17、MCHR1、MRC2、NTF3、OMD、PDGFRA、PGR、PKNOX2、PTCH2、RWDD4、SCD5、SERPINE2、SIMC1、SLC25A17、SNCAIP、SULF2、TENM4、TSPAN5、TTC8、UBXN8、ALDH1L2、ANKEF1、ASNS、B3GALNT2、BCAT1、CASP9、CCDC110、CELA2B、CELA3B、CFTR、CHMP4C、CLDN1、CNIH3、COCH、CUZD1、DEFB1、EGF、EIF4EBP1、ERP27、FAM24B-CUZD1、FBXW12、GUCA1C、KCTD16、KIAA1324、LINC00339、LNX2、MKNK1、NAA16、NPHS1、PAIP2B、PM20D1、PRSS3、SCGN、SEL1L、SERPINI2、SH3YL1、SLC33A1、SLC4A4、TC2N、TDH、TMEM51-AS1、TRHDE、UMOD、ADAM12、ATG9B、ATP6V1C2、BCAR4、BMP1、BPGM、CSF3R、CYP11A1、CYP19A1、DACT2、DEPDC1B、DLX5、EBI3、GCM1、GPR78、GSTA3、IGF2BP3、IGSF5、ISM2、KISS1、KRT23、LIN28B、MMP11、PGF、PSG11、PSG2、PSG3、PSG6、PSG7、PSG8、SPTLC3、TPRXL、ZFAT、ZNF554、ABCC4、ACPP、ALOX15B、ANO7、AP1B1P1、ARG2、BEND4、C6orf132、C6orf52、CANT1、CASZ1、CBFA2T2、CHRM1、CHRNA2、COL26A1、EVX1、EYA2、FAM135A、HMGN2P46、KLK2、KLKP1、MME、MPPED2、MUC12、NANS、NCAPD3、NEFH、NIPAL3、OACYLP、OR51E2、PAK1IP1、PDE9A、PI15、PMEPA1、POTEF、RDH11、SCNN1G、SIM2、SLC14A1、SLC22A3、SLC2A12、SLC30A4、SLC35F2、SLC37A1、SLC39A6、SPDEF、STEAP2、THSD4、TMEM79、TPM3P9、TXNDC16、URB1、VIPR1、ZNF350、ZNF532、ZNF613、ZNF649、ZNF761、ZNF827、GADL1、GIPC3、PTGES3L、WSCD2、CCDC27、DMRT1、DNAJC5G、FBXO24、IGLL1、MOV10L1、SEPT14、THEG、またはTTC16を含む、異なって表現され、異なって発現される遺伝子の中に含まれる。
【0026】
実施形態の関連する態様において、前記参照セット中の複数の参照ヒドロキシメチル化プロファイルは、複数のヒト組織タイプのそれぞれについて、前記ヒト組織タイプに関連する複数の組織特異的遺伝子ごとに、少なくとも1つの参照遺伝子座を含む。
【0027】
核酸サンプルについて作成されたヒドロキシメチル化プロファイルおよび参照ヒドロキシメチル化プロファイルは、上述したように、一般的にはヒドロキシメチル化密度を含み、前記ヒドロキシメチル化密度は、全シトシン(修飾シトシンと非修飾シトシンの両方を含む)に対する5hmC残基の比率として算出してもよい。上記の比較は、検出された5hmC密度と参照5hmC密度の類似性の程度に着目して行ってもよい。検出された5hmC密度が、当技術分野で知られているか用いられている確立した基準で決定して、1またはそれを超える組織特異的部位において参照5hmC密度と十分に類似している場合、起源組織は確率論的に前記核酸に割り当てられる。分析を精緻化し、算出された組織割り当てに内在する不確実性を減らすために、サンプルと参照とのさらなる比較を、他のヒドロキシメチル化構造に関して行ってもよい。例えば、検出されたヒドロキシメチル化プロファイルと参照ヒドロキシメチル化プロファイルは、5hmC出現パターンに関しても行ってもよく、このパターンは、前記部位内の2またはそれを超える5hmC残基の相対位置および/または前記部位内の5hmC残基の個別の位置であってもよい。さらに、5mC残基の総数、2またはそれを超える5hmC残基の相対位置、および/または5hmC部位が半ヒドロキシメチル化か完全ヒドロキシメチル化かという識別に関して、前記プロファイル同士を比較してもよい。
【0028】
本発明の別の実施形態において、ヒト対象における組織または器官の状態を検出するための方法が提供され、前記組織または器官の状態は、対象から採取された無細胞流体サンプル中のDNAのヒドロキシメチル化プロファイルに関連する。すなわち、前記組織または器官の状態は、前記ヒドロキシメチル化プロファイルに由来しうる。この方法は、以下の(a)~(c)を含む。
【0029】
(a)前記ヒト対象から得た無細胞流体サンプル中のDNAについてのヒドロキシメチル化プロファイルを作成すること;
【0030】
(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、(i)組織特異的遺伝子に関連する参照遺伝子座、および(ii)特定の組織または器官の状態に対応する);および
【0031】
(c)前記サンプルについて作成されたヒドロキシメチル化プロファイルと、前記参照ヒドロキシメチル化プロファイルとの比較に基づいて、前記対象における前記特定の組織または器官の状態を識別すること。
【0032】
さらなる実施形態において、ヒト対象における組織または器官の状態の変化をモニタリングするための方法が提供される。この方法は、以下の(a)~(c)を含む。
【0033】
(a)前記ヒト対象から得た無細胞流体サンプル中のDNAフラグメントの1またはそれを超える遺伝子座における初期ヒドロキシメチル化プロファイルを作成すること(前記ヒドロキシメチル化プロファイルは、組織または器官の初期状態に関連する);
【0034】
(b)その後の時点において、前記対象から得た無細胞流体サンプル中の前記と同一の1またはそれを超える遺伝子座における、その後のヒドロキシメチル化プロファイルを作成すること;および
【0035】
(c)前記その後のヒドロキシメチル化プロファイルを前記初期ヒドロキシメチル化プロファイルと比較して、組織または器官の状態の変化を検出すること。
【0036】
本実施形態の一態様において、組織または器官の状態の変化は、改善または低下でありうる。
【0037】
本実施形態の別の態様において、組織または器官の状態の変化は、治療的介入の有効性をアセスメントする過程で評価してもよい。
【0038】
本実施形態のさらなる態様において、組織または器官の状態の変化は、経時的な遺伝子発現の変化に関連していてもよい。
【0039】
実施形態の関連する態様において、前記方法は、延長された評価期間中の別々の時点で評価を繰り返すことをさらに含む。すなわち、組織または器官に関する状態、疾患、または障害の進行をモニタリングするように、ステップ(b)は、追加して、1またはそれを超える回数繰り返される。
【0040】
実施形態の別の関連する態様において、前記方法は、検出された状態の変化に基づいて、診断、処置の判断、または予後を行うことをさらに含む。
【0041】
実施形態の別の関連する態様において、前記方法は、初期ヒドロキシメチル化プロファイル、その後のヒドロキシメチル化プロファイル、または初期およびその後のヒドロキシメチル化プロファイルの両方を、参照データセット中の複数の参照ヒドロキシメチル化プロファイルと比較することをさらに含み、各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連するヒドロキシメチル化可変ゲノム領域内に含まれる参照遺伝子座に対応する。
【0042】
本発明の別の実施形態において、ヒト血漿から得た無細胞DNAサンプルを分析するための改善された方法が提供され、前記サンプル中の無細胞DNAフラグメントは、単離、増幅、およびシーケンシングされる。前記改善は、以下の(a)~(c)によって、サンプルへの末梢血単核球(PBMC、peripheral blood mononuclear cell)を起源とするゲノム材料のコンタミネーションを識別することを含む。
【0043】
(a)無細胞サンプル中のDNAフラグメントのヒドロキシメチル化プロファイルを作成すること;
【0044】
(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に対応する参照遺伝子座に関連する)を含み、前記参照ヒドロキシメチル化プロファイルは、少なくとも1つのPBMCヒドロキシメチル化プロファイルを含む;および
【0045】
(c)前記比較から、PBMCを起源とするゲノム材料の存在を識別すること。
【0046】
実施形態の一態様において、前記方法は、ステップ(b)における比較から、PBMCゲノムコンタミネーションレベルを推定することをさらに含む。PBMCゲノムコンタミネーションは、ex vivo採取後(すなわちサンプル採取後の)PBMC溶解の結果として、無細胞サンプル中に見られうることが理解されよう。よって、本方法は、サンプル品質の測定方法、および特定のサンプルが無細胞DNA分析に用いるのに適しているか否かに関するアセスメント方法として有用である。
【0047】
実施形態の別の態様において、前記方法は、知られているPBMC DNAについてのヒドロキシメチル化ベクトル基づいて、無細胞DNA分析についての修正ベクトルを提供することをさらに含み、前記ヒドロキシメチル化ベクトルは、PBMC DNAに対応する複数の参照ヒドロキシメチル化プロファイルを含む。前記修正ベクトルは、例えば採取後のPBMC溶解による、PBMC DNAコンタミネーションによる低いサンプル品質を、オフセットするため、低減させるため、または減じるために使用しうる。前記修正ベクトルは、そのベクトルにPBMCサブタイプヒドロキシメチル化データが含まれる場合は、無細胞DNAコンタミネーション中のPBMCサブタイプの割合、ならびにその活性化または状態を特異的に識別するために使用することもできる。
【0048】
実施形態の追加の態様において、上述の修正ベクトルは、計数したままの量(例えば、変異負荷またはフラグメントカウントなど)を、キャリブレーションおよび正規化するために使用される。
【0049】
実施形態のさらなる態様において、前記修正ベクトルは、特定の分子種の相対的な割合をキャリブレーションおよび正規化するために、例えば、循環腫瘍DNA(ctDNA、circulating tumor DNA)、胎児DNA、または病原体DNAについて決定されたバリアントアレル頻度(VAF、variant allele frequency)およびマイナーアレル頻度(MAF、minor allele frequency)値を調節するため使用される。
【0050】
別の実施形態において、本発明は、起源組織を、ヒト対象から得たサンプル中の無細胞DNAに確率論的に割り当てるための方法を提供し、前記方法は、以下の(a)~(d)を含む。
【0051】
(a)以下の(i)~(iii)によって、サンプル中のDNAのヒドロキシメチル化プロファイルを作成すること、
【0052】
(i)無細胞DNA中の5-ヒドロキシメチルシトシン残基のみにアフィニティータグを付加すること、
【0053】
(ii)支持体に結合させることによって、前記アフィニティータグでタグづけされたDNA分子を富化すること、および
【0054】
(iii)前記富化されたDNA分子をシーケンシングし、各5-ヒドロキシメチルシトシン部位が識別されたマップを提供すること;
【0055】
(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照データセット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連するヒドロキシメチル化可変ゲノム領域中の参照遺伝子座に関連する);
【0056】
(c)前記の作成されたヒドロキシメチル化プロファイルと実質的に類似する参照ヒドロキシメチル化プロファイルを有する参照データセット中の少なくとも1つの参照遺伝子座を識別すること;および
【0057】
(d)少なくとも1つの起源組織を、(c)において識別された少なくとも1つの参照遺伝子座および対応する組織特異的遺伝子に基づいて、シーケンシングされた各DNA分子に割り当てること。
【0058】
本発明の別の実施形態において、ヒト対象が、組織または器官の異常な状態を生じやすいか否かを判定するために記載の方法が提供され、前記組織または器官の異常な状態は、核酸のヒドロキシメチル化プロファイルに関連する。こに記載の方法は、以下の(a)~(c)を含む。
【0059】
(a)前記ヒト対象から得た無細胞流体サンプル中のDNAフラグメントの1またはそれを超える遺伝子座におけるヒドロキシメチル化プロファイルを作成すること;
【0060】
(b)検出されたヒドロキシメチル化プロファイルを、それぞれ(i)組織特異的遺伝子上の参照遺伝子座、および(ii)特定の組織または器官の異常な状態の生じやすさを示す組織の状態に関連する、参照セット中の複数の参照ヒドロキシメチル化プロファイルと比較すること;および
【0061】
(c)(b)における比較から、前記組織の異常な状態の生じやすさを識別すること。
【0062】
本発明のさらなる実施形態において、ヒト対象から得た無細胞DNAのサンプル中の、異なる起源組織に関連するDNAフラグメントを区別するための方法が提供される。この方法は、以下の(a)~(c)を含む。
【0063】
(a)無細胞DNAサンプル中の、複数の核酸のそれぞれのヒドロキシメチル化プロファイルを作成すること;
【0064】
(b)各ヒドロキシメチル化プロファイルを、それぞれが組織特異的遺伝子上の特定の参照遺伝子座に関連する、参照セット中の複数の参照ヒドロキシメチル化プロファイルと比較すること;および
【0065】
(c)(b)における比較に基づいて、異なる組織を起源とする核酸を鑑別すること。
【0066】
上述の実施形態の例示的な態様において、前記参照セットは、以下の表1~19に記載する、セット3A、セット3B、セット3C、セット3D、セット3E、セット3F、セット3G、セット3H、セット3I、セット3J、セット3K、セット3L、セット3M、セット3N、セット3O、セット3P、セット3Q、セット3R、およびセット3Sから選択される2またはそれを超える参照セットを含む。
【0067】
さらなる実施形態において、上述のいずれの方法も、さらに、核酸の長さ;核酸フラグメント分布;メチル化パターン;およびヌクレオソームの位置のうちの少なくとも1つを決定することを含む。
【発明を実施するための形態】
【0068】
発明の詳細な説明
本発明は、起源組織を、無細胞流体サンプル、例えばヒト患者から得た無細胞DNAサンプル中の核酸に確率論的に割り当てるための方法を提供する。診断、予後、患者モニタリング、およびその他の方法を含む、関連する方法およびシステムもまた提供される。本発明は、複数の組織タイプについて、幅広いヒドロキシメチル化プロファイルの参照セット全体にわたって、すなわち、複数の組織特異的遺伝子のそれぞれにおける複数の部位に関するヒドロキシメチル化データを含むヒドロキシメチロームデータセット全体にわたって、検出された核酸のヒドロキシメチル化プロファイルの類似性をアセスメントする。
【0069】
1.用語
別段の定めがないかぎり、本明細書で使用される全ての技術的および科学的用語は、本発明が属する技術分野の当業者によって通常理解される意味を有する。本発明を説明するために特に重要な特定の用語は、以下に定義する。その他の関連用語は、国際特許出願公開WO2017/176630(Quakeら、発明の名称「Noninvasive Diagnostics by Sequencing 5-Hydroxymethylated Cell-Free DNA」)に定義されている。本明細書で参照されている上記の特許公報ならびに他の全ての特許文献および刊行物は、参照により明示的に援用される。
【0070】
本明細書および添付の特許請求の範囲において、単数形「a」、「an」、および「the」は、明らかに文脈に反しないかぎり、複数形への言及を含む。よって、例えば、「部位(a locus)」は、1つの部位(locus)だけではなく、2またはそれを超える異なる部位(loci)も指し、「構成要素(a component)」は、1つの構成要素、ならびに2またはそれを超える構成要素の組み合わせも指す、などである。
【0071】
数値範囲には、その範囲を規定している数値が含まれる。別段の定めがないかぎり、それぞれ、核酸は、5’から3’の方向に、左から右に記述され;アミノ酸配列は、アミノ末端からカルボキシ末端の方向に、左から右に記述される。
【0072】
本明細書に示される見出しは、本発明の種々の態様または実施形態を限定するものではない。したがって、このすぐ後に定義されている用語は、明細書を全体として参照することによって、より完全に定義される。
【0073】
用語「ヒドロキシメチル化」は、核酸に、少なくとも1つの5-ヒドロキシメチルシトシン(5hmC)残基が存在すること、すなわち5’炭素にヒドロキシメチル基が付加されたシトシン残基が存在することを指す。
【0074】
用語「ヒドロキシメチル化プロファイル」は、核酸、核酸フラグメント、または核酸領域中の、5-ヒドロキシメチルシトシンの密度、位置、相対配置、および/またはパターンを指す。
【0075】
用語「サンプル」は、本明細書で用いられる場合、ヒト対象の体液、細胞、組織、または器官に由来するサンプルに関し、核酸または核酸の混合物を含む。必ずではないが、前記サンプルは、一般に、全血サンプル、血清サンプル、または血漿サンプルなどの血液サンプルである。本明細書において、核酸サンプルは、核酸配列を含有する複数の異なる分子を含んでいてもよいという点で、複合的であってもよい。
【0076】
用語「サンプル」は、本明細書で用いる場合、物質または複数の物質の混合物を指し、必ずではないが、典型的には液状であり、関心のある1またはそれを超える分析対象物を含む。
【0077】
用語「生物学的サンプル」は、本明細書で用いる場合、ヒト対象の体液、細胞、組織、または器官に由来するサンプルを指し、生体分子(タンパク質、ペプチド、脂質、核酸などが含まれる)の混合物を含む。必ずではないが、前記サンプルは、一般に、全血サンプル、血清サンプル、または血漿サンプルなどの血液サンプルである。
【0078】
用語「核酸サンプル」は、本明細書で用いられる場合、核酸を含有する生物学的サンプルを指す。核酸サンプルは、ヌクレオソームを含む無細胞核酸サンプルであってもよく、その場合、核酸サンプルは、本明細書において、「ヌクレオソームサンプル」と呼ばれることがある。核酸サンプルは、サンプル中にヒストンおよび他のタンパク質を実質的に含まない無細胞DNAから構成されていてもよく、例えば無細胞DNA精製後の場合があてはまるであろう。核酸サンプルは、本明細書において、無細胞RNAも含んでいてもよい。
【0079】
「サンプルフラクション」は、元の生物学的サンプルのサブセットを指し、血液サンプルを複数の等しいフラクションに分けた場合のように、その生物学的サンプルの組成的に等しい部分であってもよい。あるいは、サンプルフラクションは、組成的に異なっていてもよく、例えば、生物学的サンプルのある特定の成分を除去した場合(無細胞核酸の抽出がその一例である)があてはまるであろう。
【0080】
本明細書で用いられる場合、用語「無細胞核酸」は、無細胞DNAと無細胞RNAの両方を包含し、この無細胞DNAおよび無細胞RNAは、体液を含む生物学的サンプルの無細胞フラクション中に存在していてもよい。前記体液は、全血、血清、もしくは血漿を含む血液であってもよく、または尿、嚢胞液、もしくは別の体液であってもよい。多くの例において、生物学的サンプルは血液サンプルであり、無細胞核酸サンプルは、それらのサンプルから、当業者に知られている、および/または関連する書籍および文献に説明されている、現在普通に用いられている手段で抽出され、無細胞核酸抽出を行うためのキットは市販されている(例えば、AllPrep(登録商標)DNA/RNA MiniキットおよびQIAmp DNA Blood Miniキット(両方ともQiagen社から入手できる)、またはMagMAX無細胞全核酸キット(Cell-Free Total Nucleic acid Kit)およびMagMAX DNA単離キット(DNA Isolation Kit)(Thermo Fisher Scientific社から入手できる))。例えば、Huiら、Fongら(2009)Clin.Chem.55(3):587-598も参照のこと。
【0081】
本明細書で用いられる場合、用語「無細胞DNA」(cfDNA)は、無細胞フラクション中のDNA、または体液を含む生物学的サンプルの抽出物中のDNAを指す。無細胞DNAは、高度に断片化されていてもよく、その大きさの中央値は、一般に、1kb未満(例えば、50bp~500bp、80bp~400bp、または100bp~1,000bpの範囲内)であるが、大きさの中央値がこの範囲外であるフラグメントも存在しうる(Newmanら(2014)Nat.Med.20:548-54には、大きさが165bp~250bpのフラグメントが報告されている)。無細胞DNAは、循環腫瘍DNA(ctDNA、circulating tumor DNA)、すなわちがん患者の血液中を自由に循環している腫瘍DNA、または循環している胎児DNA(対象が妊婦の場合)を含んでいてもよい。cfDNAは、全血を遠心分離にかけて全細胞を除去し、次いで、残った血漿または血清からDNAを単離することによって得ることができる。このような方法は周知である(例えば、Loら(1998)Am.J.Hum.Genet.162:768-75を参照のこと)。無細胞DNAは、大部分が二本鎖であるが、変性によって一本鎖にすることができる。
【0082】
用語「ヌクレオチド」は、知られているプリンおよびピリミジン塩基だけではなく、他の修飾された複素環塩基も含有するような部分を含むことを意図している。このような修飾は、メチル化プリンまたはピリミジン、アシル化プリンまたはピリミジン、アルキル化リボース、または他のアルキル化複素環を含む。また、用語「ヌクレオチド」は、ハプテンまたは蛍光標識を含有し、通常のリボース糖およびデオキシリボース糖だけではなく、他の糖も含有するような部分を含む。修飾ヌクレオシドまたはヌクレオチドには、糖部位の修飾も含まれ、糖部位の修飾においては、例えば、1またはそれを超えるヒドロキシル基が、ハロゲン原子または脂肪族基で置換されているか、エーテル、アミンなどとして官能基化されている。本明細書において特に重要なものは、5-メチルシトシンおよびその酸化形態(例えば、5-ヒドロキシメチルシトシン、5-ホルミルシトシン、および5-カルボキシメチルシトシン)を含む、修飾シトシン残基である。
【0083】
用語「核酸」および「ポリヌクレオチド」は、本明細書において、ヌクレオチド、例えばデオキシリボヌクレオチドまたはリボヌクレオチドからなる、任意の長さ、例えば、約2塩基超、約10塩基超、約100塩基超、約500塩基超、1000塩基超、および最長で約10,000またはそれを超える塩基数のポリマーを記述するために、互換的に用いられる。核酸は、酵素的に生成されたものでもよく、化学的に合成したものでもよく、天然に生じたものでもよい。
【0084】
用語「オリゴヌクレオチド」は、本明細書で用いる場合、長さが約2~200ヌクレオチド、最長で500ヌクレオチドの、ヌクレオチドの一本鎖マルチマーを表す。
【0085】
オリゴヌクレオチドは、合成でも、酵素的に合成してもよく、いくつかの実施形態において、長さは30~150ヌクレオチドである。オリゴヌクレオチドは、リボヌクレオチドモノマーを含んでいてもよく(すなわち、オリゴリボヌクレオチドであってもよい)、および/またはデオキシリボヌクレオチドモノマーを含んでいてもよい。オリゴヌクレオチドは、例えば、長さが10~20、21~30、31~40、41~50、51~60、61~70、71~80、80~100、100~150、または150~200ヌクレオチドである。
【0086】
用語「ハイブリダイゼーション」は、当該技術分野で知られているように、塩基対形成によって核酸鎖を相補鎖と接合させるプロセスを指す。ある核酸と参照核酸配列が、中程度から高いストリンジェンシーのハイブリダイゼーションおよび洗浄条件において、互いに特異的にハイブリダイズする場合、その核酸は、前記参照核酸配列と「選択的にハイブリダイズできる」ものとみなされる。中程度から高いストリンジェンシーのハイブリダイゼーション条件は知られている(例えば、Ausubelら、Short Protocols in Molecular Biology,3rd ed.,Wiley &
Sons 1995、およびSambrookら、Molecular Cloning:A Laboratory Manual,Third Edition,2001
Cold Spring Harbor,N.Y.を参照のこと)。
【0087】
用語「二本鎖(duplex)」および「二重化した(duplexed)」は、本明細書において、塩基対を形成した、すなわち互いにハイブリダイズした2つの相補的ポリヌクレオチドを記述するために、互換的に用いられる。DNA二本鎖は、本明細書において、「二本鎖DNA」または「dsDNA」と呼ばれ、インタクトな分子または分子のセグメントでありうる。例えば、本明細書において、バーコード化およびアダプター結合と呼ばれるdsDNAは、インタクトな分子であるのに対し、近接伸長アッセイにおける各近接プローブの核酸末端配列間に形成されるdsDNAは、dsDNAセグメントである。
【0088】
用語「鎖(strand)」は、本明細書で用いる場合、共有結合、例えばホスホジエステル結合によって互いに共有結合したヌクレオチドからなる核酸の1本の鎖を指す。細胞において、DNAは、たいてい二本鎖形態で存在し、それ自体は、本明細書において「トップ」および「ボトム」鎖と呼ばれる2つの相補鎖を有する。ある特定のケースにおいて、染色体領域の相補鎖は、「プラス」および「マイナス」鎖、「ポジティブ」および「ネガティブ」鎖、「第1」および「第2」鎖、「コード」および「非コード」鎖、「ワトソン」および「クリック」鎖、または「センス」および「アンチセンス」鎖と呼ばれることがある。ある鎖をトップまたはボトム鎖のどちらと定めるかは任意であり、何らかの特定の向き、機能、または構造を意味するものではない。いくつかの例示的な哺乳類の染色体領域(例えば、BAC、アセンブリー、染色体など)の第1鎖のヌクレオチド配列が知られており、例えばNCBIのGenbankデータベース中に存在することがある。
【0089】
用語「プライマー」は、合成オリゴヌクレオチドを指し、プライマーがポリヌクレオチドテンプレートと二本鎖を形成すると、核酸合成の開始点として働くことができ、3’末端からテンプレートに沿って伸長して、伸長した二本鎖を形成することができる。伸長プロセスの間に付加されるヌクレオチドの配列は、テンプレートポリヌクレオチドの配列によって決定される。通常、プライマーは、DNAポリメラーゼによって伸長する。プライマーは、一般に、プライマー伸長産物の合成における使用に適合する長さを有し、通常の長さは8~100ヌクレオチドの範囲内、例えば10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40ヌクレオチドといった範囲内である。典型的なプライマーの長さは、10~50ヌクレオチドの範囲内、例えば15~45、18~40、20~30、21~25といった範囲内であってもよく、上記した範囲内のどのような長さであってもよい。いくつかの実施形態において、プライマーの長さは、通常、約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、または70ヌクレオチドを超えない。
【0090】
DNA複製反応の開始に用いられる「プライマー」のように、「アダプター」も、生物学的分析における特定の目的にかなう、短い合成オリゴヌクレオチドである。アダプターは一本鎖または二本鎖でありうるが、本明細書において好ましいアダプターは二本鎖である。一実施形態において、アダプターは、ヘアピンアダプター(すなわち、分子内で塩基対を形成して二本鎖ステムとループを有する構造を形成する1つの分子であり、この分子の3’および5’末端は、それぞれ、二本鎖DNA分子の5’および3’末端に結合する)であってもよい。別の実施形態において、アダプターは、Y字アダプターであってもよい。別の実施形態において、アダプターは、それ自体が、互いに塩基対を形成している2つの異なるオリゴヌクレオチド分子から形成されていてもよい。明らかであろうが、アダプターの結合可能な末端は、制限酵素による切断で形成されるオーバーハングに適合するように設計されていてもよく、または平滑末端もしくは5’T突出末端を有していてもよい。用語「アダプター」は、二本鎖ならびに一本鎖の分子を指す。アダプターは、DNAもしくはRNA、またはこれら2つの混合物であってもよい。RNAを含むアダプターは、RNase処理またはアルカリ加水分解によって切断されうる。アダプターは、15~100塩基、例えば50~70塩基であってもよいが、この範囲外のアダプターも考えられる。
【0091】
用語「アダプター結合」は、本明細書で用いられる場合、アダプターに結合した核酸を指す。アダプターは、核酸分子の5’末端および/または3’末端に結合しうる。本明細書で用いられる場合、用語「アダプター配列付加」は、アダプターを、サンプル中のフラグメントの末端に付加する行為を指す。これは、ポリメラーゼを用いてフラグメントの末端を充填すること、末端A配列を付加すること、次いでこの末端A配列を有するフラグメントにT突出を含むアダプターを結合させることによって行われうる。アダプターは、通常、リガーゼを用いてDNA二本鎖に結合されるが、RNAでは、cDNA二本鎖の少なくとも1つの末端に、好ましくはリガーゼ不存在下で、共有結合または他の形で結合される。用語「アダプター結合サンプル」は、cfDNAがアダプターに結合しているサンプルを指す。上記の定義を考慮すれば理解されるであろうが、非対称アダプターに結合したサンプルは、5’および3’末端に非相補配列を有する鎖を含む。
【0092】
用語「非対称アダプター」は、本明細書で用いられる場合、二本鎖核酸フラグメントの両末端に結合された場合に、3’末端のタグ配列と同じではない、または相補的ではない5’タグ配列を含むトップ鎖を生じさせるであろうアダプターを指す。非対称アダプターの例は、米国特許第5,712,126号および第6,372,434号(Weissmanら)、および国際特許出願公開WO2009/032167(Bignellら)に記載されている。非対称にタグがつけられたフラグメントは、2つのプライマー、すなわち鎖の3’末端に付加された第1のタグ配列とハイブリダイズする第1のプライマー;およびもう一方の、鎖の5’末端に付加された第2のタグ配列の相補鎖とハイブリダイズする第2のプライマーによって増幅されうる。Y字アダプターおよびヘアピンアダプター(ヘアピンアダプターは、ライゲーション後に切断することによって、「Y字アダプター」を生じうる)は、非対称アダプターの例である。
【0093】
用語「Y字アダプター」は、二本鎖領域と、対向する配列が相補的ではない一本鎖領域とを含むアダプターを指す。二本鎖領域の末端は、例えばライゲーションまたはトランスポザーゼ触媒反応によって、ゲノムDNAの二本鎖フラグメントなどの標的分子に結合できる。Y字アダプターに結合した、アダプタータグがついた二本鎖DNAのそれぞれの鎖は、一方の末端にY字アダプターの一方の鎖の配列を有し、他方の末端にY字アダプターの他方の鎖の配列を有するという点で、非対称にタグがつけられている。両方の末端がY字アダプターに結合した核酸分子を増幅することによって、非対称にタグがつけられた核酸、すなわち、あるタグ配列を含む5’末端と、別のタグ配列を含む3’末端とを有する核酸が生じる。
【0094】
用語「ヘアピンアダプター」は、ヘアピン形状のアダプターを指す。一実施形態において、ライゲーション後に、ヘアピンループを切断し、各末端に非相補タグを有する鎖を生じさせることができる。いくつかのケースにおいて、ヘアピンアダプターのループは、ウラシル残基を含んでいてもよく、そのようなループは、他の方法も知られているが、ウラシルDNAグリコシラーゼおよびエンドヌクレアーゼVIIIによって切断することができる。
【0095】
用語「増幅」は、本明細書で用いられる場合、テンプレート核酸の1またはそれを超えるコピーまたは「アンプリコン」を作成することを指し、任意の核酸増幅技術を用いて実施することができる。核酸増幅技術は、例えば、PCR(polymerase chain reaction)増幅法(ネステッドPCR法およびマルチプレックスPCR法を含む)、RCA法(rolling circle amplification)、NASBA法(nucleic acid sequence-based amplification)、TMA法(transcript mediated amplification)、およびSDA法(strand displacement amplification)などの技術である。複数の増幅技術の組み合わせ、例えば、RCAと組み合わせたマルチプレックスPCR法(例えば、Gongら(2018)RSC
Adv.8:27375を参照のこと)、定量的PCR(qPCR)と組み合わせたRCA法(例えば、Liuら(2016)Anal Sci.32:963-968を参照のこと)などが、ある状況において有利に用いられうることが理解されるであろう。
【0096】
用語「富化する」および「富化」は、ある特定の特徴を有するテンプレート分子(例えば、5-ヒドロキシメチルシトシンを含む核酸)を、そのような特徴を持たない分析対象物(例えば、5-ヒドロキシメチルシトシンを含まない核酸)から部分精製することを指す。富化は、典型的には、前記の特徴を有する分析対象物の濃度を、前記特徴を持たない分析対象物に対して、少なくとも2倍、少なくとも5倍、または少なくとも10倍高める。富化後、サンプル中の分析対象物の少なくとも10%、少なくとも20%、少なくとも50%、少なくとも80%、または少なくとも90%が、富化に用いた特徴を有しうる。例えば、富化した組成物中の核酸分子の少なくとも10%、少なくとも20%、少なくとも50%、少なくとも80%、または少なくとも90%は、キャプチャータグを含むように修飾された1またはそれを超える5-ヒドロキシメチルシトシンを有する鎖を含んでいてもよい。
【0097】
用語「シーケンシング」は、本明細書で用いられる場合、その方法によって、ポリヌクレオチドの少なくとも10個の連続したヌクレオチドが識別される(例えば、少なくとも20、少なくとも50、少なくとも100、もしくは少なくとも200、またはそれを超える連続したヌクレオチドが識別される)ような方法を指す。
【0098】
用語「次世代シーケンシング(NGS、next-generation sequencing)」または「ハイスループットシーケンシング」は、本明細書で用いられる場合、現在Illumina社、Life Technologies社、Roche社などによって採用されている、いわゆるパラレルSBS(sequencing-by-synthesis)またはSBL(sequencing-by-ligation)プラットフォームを指す。次世代シーケンシング法としては、Oxford Nanopore Technologies社によって商業化された方法などのナノポアシーケンシング法、Life Technologies社によって商業化されたIon Torrent技術などの電子的検出方法、およびPacific Biosciences社によって商業化された方法などの単分子蛍光に基づく方法などもあげられうる。
【0099】
用語「読み取りデータ(read)」は、本明細書で用いられる場合、シーケンシングシステム(例えば、超並列シーケンシングなど)の生の出力または加工された出力を指す。いくつかの実施形態において、本明細書に記載されている方法の出力は、読み取りデータである。いくつかの実施形態において、それらの読み取りデータは、トリミング、フィルター、およびアライメントが必要であることがあり、結果として、生の読み取りデータ、トリミングされた読み取りデータ、アライメントされた読み取りデータが得られる。
【0100】
「UFI」は、核酸分子のグループを特徴づける固有特性識別子(unique feature identifier)である。UFIは、「バーコード」(本明細書において、「UFI配列」または「UFIバーコード」と呼ばれることがある)と呼ばれることがある核酸の特定の配列であってもよく、または、グリコシル化、ビオチン化などの結果として生じるであろうような化学的タグであってもよい。UFIは、追加された、または組み込まれた部分などの特定の特徴の欠如であってもよく、例えば、UFIは、特定のバーコードの欠如であってもよく、グリコシル化またはビオチン化された部分の欠如などであってもよい。UFI配列は、典型的には、核酸分子の特徴を識別するために有用な比較的短い核酸配列である。UFIを含有する核酸テンプレート分子およびそのアンプリコンは、本明細書において、「バーコード化」テンプレート分子またはアンプリコンと呼ばれることがある。UFI配列の種類としては、限定するものではないが、例えば以下のものがあげられる。
【0101】
「分子UFI配列」(または「分子バーコード」)は、サンプル中のあらゆる核酸テンプレート分子に追加される、核酸の短い配列であり、UFI配列の長さが十分である場合は、全ての核酸テンプレート分子は固有のUFI配列に結合する。分子UFI配列は、通常、不規則なヌクレオチド、部分的に変性したヌクレオチド、または、いくつかの場合、すなわちテンプレート分子の数が限られている場合には、所定のヌクレオチドの連続として設計される。分子UFI配列は、当該技術分野で知られているように、増幅エラーおよびシークエンサーエラーを補償およびオフセットするため、ユーザーが重複を追跡して下流の分析から除外することを可能にするため、分子数の計測とそれに続く分析対象物濃度の決定を可能にするために使用することができる。例えば、Casbonら(2011)Nuc.Acids Res.39(12):1-8を参照のこと。
【0102】
「サンプルUFI配列」(または「サンプルバーコード」もしくは「インデックス化UFI」)は、複数のサンプルが、組み合わされ、処理され、一緒にシーケンシングされるように、サンプル中のあらゆる核酸テンプレート分子に追加される核酸配列であり、サンプルUFI配列は、サンプルによる読み取りデータの分類およびグループ分け(すなわち多重分離)を可能にする。サンプルUFI配列によって、サンプルを採取した個体が識別される。
【0103】
「ソース識別子配列」(または「ソースUFI」もしくは「ソースバーコード」)によって、起源のソースが識別される。ソースUFIは、通常はサンプルUFIであろう。しかしながら、ある特定の例では、例えば異なる種類のサンプルを同じ個体から得た場合(例えば、血液サンプル、嚢胞液など)は、ソースUFIは、そのサンプルを採取した患者ではなくて、そのサンプルの生理学的なソースを示すであろう。1つの個体から得た2またはそれを超える種類のサンプルを含む複数のサンプルが組み合わされている場合、サンプルバーコードとソースバーコードの両方を使用すべきである。
【0104】
「フラグメント識別子配列」(または「フラグメントUFI」もしくは「フラグメントバーコード」)とは、以下のようなものである。すなわち、核酸が多くのフラグメントの集団を含む核酸サンプル(無細胞DNAにおいて天然に存在するような核酸サンプル、または多くのすでに知られている断片化技術(例えば、物理的方法、超音波処理法、酵素的方法など)によって作成された核酸サンプル)において、サンプル中の各フラグメントは、対応するフラグメント識別子配列によってバーコード化される。互いに重なり合わないフラグメント識別子配列を有する複数の配列読み取りデータは、核酸テンプレート分子の起源が異なることを示すのに対し、同じフラグメント識別子配列、または実質的に重なり合うフラグメント識別子配列を有する複数の読み取りデータは、同じテンプレート分子のフラグメントを示す可能性がある。ここで識別される固有の特徴は、フラグメントの起源であるテンプレート核酸分子である。
【0105】
「鎖識別子配列」(または「鎖UFI」もしくは「鎖バーコード」)によって、DNA二本鎖の2つの鎖がそれぞれ独立してタグづけされ、それによって読み取りデータの起源である鎖が判定できる(すなわち、WストランドまたはCストランドとして判定できる)。
【0106】
「5hmC識別子配列」(または「5hmCバーコード」)によって、サンプル中の5hmC含有無細胞DNAテンプレート分子を起源とするDNAフラグメント、すなわち「ヒドロキシメチル化」DNAが識別される。
【0107】
「5mC識別子配列」(または「5mCバーコード」)によって、5hmCを含まない5mC含有無細胞DNAテンプレート分子を起源とするDNAフラグメントが識別される。
【0108】
いくつかの実施形態において、UFIの長さは、1~約35ヌクレオチドの範囲内、例えば2~30ヌクレオチド、4~30ヌクレオチド、4~24ヌクレオチド、4~16ヌクレオチド、4~12ヌクレオチド、6~20ヌクレオチド、6~16ヌクレオチド、6~12ヌクレオチドなどであってもよい。ある特定のケースでは、上述したように、UFIはエラー検出性および/またはエラー訂正性であってもよく、これは、たとえエラーが存在したとしても(例えば、分子バーコード配列に合成ミスがある場合、分子バーコード配列の読み取りミスがある場合、または分子バーコード配列を決定するための種々の処理工程のいずれかの間に分子バーコード配列が歪められた場合)、それにもかかわらず、そのコードが正しく解釈されうることを意味する。エラー訂正性配列の使用については、文献に記載されている(例えば、米国特許出願公開第2010/0323348号(Hamatiら)および米国特許出願公開第2009/0105959号(Bravermanら)(どちらも、参照により本明細書に援用される)を参照のこと)。
【0109】
本明細書におけるUFI配列として働くオリゴヌクレオチドは、任意の有効な方法によってDNA分子中に組み込まれてもよく、「~の中に組み込まれる(incorporated into)」は、本明細書において、前記UFIがDNA分子の末端、DNA分子の末端付近、またはDNA分子内に設けられるかぎり、「~に付加される(added
to)」および「~に追加される(appended to)」と互換的に用いられる。例えば、複数のUFIが、選ばれたリガーゼを用いてDNAの末端に結合されてもよく、この場合、最後に結合されたUFIだけが分子の「末端」に存在する。
【0110】
より一般的には、用語「検出」は、任意の形態の測定を指すために、用語「決定すること(determining)」、「測定すること(measuring)」、「評価すること(evaluating)」、「アセスメントすること(assessing)」、「アッセイすること(assaying)」、および「分析すること(analyzing)」と互換的に用いられ、ある要素が存在するか否かを決定することも含まれる。これらの用語は、定量的および/または定性的決定の両方を含む。アセスメントすることは、相対的であっても絶対的であってもよい。よって、「~の存在をアセスメントすること」には、存在する部分の量を決定することも、その部分が存在するか存在しないかを決定することも含まれる。ヒドロキシメチル化バイオマーカー部位におけるレベルをアセスメントすることとは、そのような部位におけるヒドロキシメチル化の程度を決定することを指す。
【0111】
「正確度(accuracy)」は、測定または算出された量(試験で記録された値)と、その正確な(または真の)値との一致度を指す。臨床的な正確度は、誤って分類された結果(偽陽性(FP、false positive)または偽陰性(FN、false negative))に対する、真の結果(真陽性(TP、true positive)または真陰性(TN、true negative))の割合に関し、感受性、特異性、陽性予測値(PPV、positive predictive value)、もしくは陰性予測値(NPV、negative predictive value)と呼ばれることがあり、または、確からしさ、もしくは、他の尺度もあるが、オッズ比と呼ばれることもある。
【0112】
本明細書で用いられる場合、フラグメントの特定の鎖(例えば、トップまたはボトム鎖)「に対応する」配列読み取りデータに関して、用語「~に対応する」は、前記の鎖またはその増幅産物に由来する配列読み取りデータを指す。
【0113】
用語「相関性」は、本明細書で変数(例えば、ある値、値のセット、疾病段階、疾病段階に関連するリスクなど)について用いられる場合、2またはそれを超える変数が互いに変動する程度の尺度である。
【0114】
「ヒドロキシメチル化レベル」または「ヒドロキシメチル化状態」は、ヒドロキシメチル化バイオマーカー部位内のヒドロキシメチル化の程度である。ヒドロキシメチル化の程度は、通常、ヒドロキシメチル化密度、例えば、核酸領域内の、全シトシン(修飾と非修飾の両方)に対する5hmC残基の比として測定される。ヒドロキシメチル化密度の他の尺度、例えば、核酸領域中の全ヌクレオチドに対する5hmC残基の比率もありうる。
【0115】
「ヒドロキシメチル化プロファイル」または「ヒドロキシメチル化シグネチャー」は、複数のヒドロキシメチル化バイオマーカー部位のそれぞれにおけるヒドロキシメチル化レベルを含むデータセットを指す。ヒドロキシメチル化プロファイルは、少なくとも1つの共通する特徴を有する個体集団、例えば、がんと診断されたことがない個体群、画像走査で識別される病変を生じたことがない個体群、65歳を超える個体群、女性の個体群などについての混成されたヒドロキシメチル化プロファイルを含む参照ヒドロキシメチル化プロファイルであってもよい。
【0116】
「式」、「アルゴリズム」、または「モデル」は、1またはそれを超える連続的またはカテゴライズされた入力を受け取って出力値を算出する、任意の数学的な等式、アルゴリズム的な、分析的な、もしくはプログラムされたプロセス、または統計的手法であり、「インデックス」、「インデックス値」、「予測変数(predictor)」、「予測値」、「確率」、または「確率スコア」と呼ばれることがある。「式」の非限定的な例としては、合計、比、および回帰演算子(例えば、係数または指数)、バイオマーカー値の変換または正規化(限定するものではないが、臨床的パラメーター、例えば性別、年齢、または民族性に基づく正規化スキーム)、ルールおよびガイドライン、統計的分類モデル、歴史的集団で学習させたニューラルネットワークなどがあげられる。パネルおよび組み合わせの構成において、特に重要なものは、なかでも、構造的および構文的な統計的分類アルゴリズム、ならびにパターン認識特性を利用したリスクインデックス構成方法であり、確立された技術、例えば、相互相関、主成分分析(PCA、Principal Components Analysis)、因子回転、ロジスティック回帰(LogReg)、線形判別分析(LDA)、Eigengene線形判別分析(ELDA)、サポートベクトルマシン(Support Vector Machine)(SVM)、ランダムフォレスト(RF)、再帰的パーティショニングツリー(RPART)、ならびに、他にもあるが、その他の関連するディシジョンツリー分類技術、収縮重心法(SC、Shrunken Centroids)、StepAIC、K近傍、ブースティング、ディシジョンツリー、ニューラルネットワーク、ベイジアンネットワーク、サポートベクトルマシン(Support Vector Machine)、および隠れマルコフモデルが含まれる。多くのこのようなアルゴリズム技法が、特徴(部位)選択と正則化(例えば、他にもあるが、Ridge回帰、Lasso、およびelastic netにおいて)の両方を実行するためにさらに実装されている。当業者に周知のCoxモデル、WeibullモデルKaplan-Meierモデル、およびGreenwoodモデルを含むその他の技術が、生存およびイベントまでの時間のハザード分析に用いられてもよい。多くのこのような技術が有用であり、ヒドロキシメチル化バイオマーカー選択技術(例えば、変数増加法、変数減少法、または変数増減法)、所定のサイズの全潜在的バイオマーカーセットまたはパネルの完全調査、遺伝的アルゴリズムと組み合わされるか、あるいはこのような技術自体がバイオマーカー選択技法を含む。これらの方法は、追加のバイオマーカーとモデルの改善の間のトレードオフを定量するために、および過剰適合を最小にするために、情報規準、例えば赤池情報量規準(AIC、Akaike’s Information Criterion)またはベイズ情報量規準(BIC、Bayes Information Criterion)と組み合わせてもよい。得られる予見モデルは、Bootstrap、LOO(Leave-One-Out)、および10-Fold CV(10-Fold cross-validation)などの技術を用いて、他の研究において検証してもよく、またはもともとそれらを学習させた研究において交差検証してもよい。種々のステップにおいて、当該技術分野で知られている技術による値置換によって、FDR(false discovery rate)を推定してもよい。
【0117】
種々のタイプのアルゴリズムが、本明細書において、有意義なセット(例えば、特定の組織タイプにおいてより一般に表現され、またはより一般に表現およびより一般に発現される遺伝子のグループなど)を導くために用いられる。2またはそれを超えるデータセット(例えば1またはそれを超える標準的な(または「正常な」)ヒドロキシメチル化プロファイルと、患者サンプルからのヒドロキシメチル化プロファイルなど)の間の統計的相関性を決定するために、同じまたは異なるアルゴリズムを用いてもよい。回帰分析は、種々の比較アルゴリズムの基礎となる一般的な統計的手法であり、一般に用いられる回帰モデルとしては、例えばRidge、Lasso、およびElastic Netがあげられる。線形単回帰(通常の最小二乗法(ordinary least squares)、または「OLS」)は、変数間に関係性があるために、一般的に不十分であり、代わりに、関係性を補償およびオフセットするためにペナルティを追加する(L1正則化(Lasso回帰)、L2正則化(Ridge回帰)、または両方)。glmnetモデル(LassoおよびElastic Net正則化一般化線型モデル)は、ペナルティの重み付けとL1およびL2寄与の両方を変化させる、デフォルトの最適化した適合度を与え、この最適化適合度がL2に優先的に重み付けする場合、予測変数は複数の特性によってサポートされる傾向になるであろう。glmnet2は、L1だけがペナルティに寄与するLasso適合を指し、典型的には、少数の特徴によってサポートされる低密度モデルをもたらす。Elastic Netは、L1およびL2正則化の両方からのペナルティを、L1とL2の関係が最適化された比率で組み込む。本明細書において例示的な手法(本明細書においてglmnet1Aと呼ばれることがある)は、L1とL2が55/45の比率で重み付けされた修正glmnetモデルを使用することを含む。
【0118】
2.起源組織の割り当て
一実施形態において、起源組織を、ヒト対象から得た無細胞流体サンプル中の核酸に確率論的に割り当てるための方法が提供され、起源組織の「確率論的」割り当ては、核酸が特定の組織を起源とする確率の決定を含む。起源組織とは、核酸のソースとなる組織であり、用語「組織」は、同じ種類かつ、器官に関係する場合は、同じ器官の細胞のグループまたは集団を記述するために用いられる。すなわち、未知の組織由来のDNAなどの核酸を含有する、ヒト対象からの無細胞流体サンプルの場合、本方法は組織特異的なデータを生成するために使用することができ、また、起源組織のサンプルDNAへの確率論的割り当てを可能にする。本方法は、サンプル核酸についてのヒドロキシメチル化プロファイルを作成し、次いでそのヒドロキシメチル化プロファイルを、参照データセット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較することを含み、各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連するゲノム領域内に含まれる参照遺伝子座に対応する。参照遺伝子座を含むゲノム領域は、特異的にヒドロキシメチル化された領域(DhMR、differentially hydroxymethylated region)であり、このDhMRは、ここでは基本的にバイオマーカーとして働き、特定の起源組織、組織タイプ、組織状態、およびその他の要因に応じて変化する傾向があるヒドロキシメチル化プロファイルを有するものとして選択される。各参照ヒドロキシメチル化プロファイルは、特定の参照遺伝子座またはバイオマーカーについての以下の情報を有するヒドロキシメチル化ベクトルの中に含まれており、前記情報とは、特定の参照遺伝子座における、正常な、または対照のヒドロキシメチル化プロファイル;前記参照遺伝子座に関連する組織特異的遺伝子;ならびに前記遺伝子および参照遺伝子座と関連する組織である。
【0119】
(a)ヒドロキシメチル化プロファイルの検出
【0120】
前記方法の最初のステップは、サンプル(典型的には、ヒト対象から得た無細胞DNAサンプル)中の核酸のヒドロキシメチル化プロファイルを検出することを含み、前記「核酸」は、1またはそれを超える核酸分子、核酸フラグメント、もしくは核酸領域、またはそれらの組み合わせであってもよく、前記「ヒドロキシメチル化プロファイル」は、ヒドロキシメチル化密度、例えば、核酸領域内の、全シトシン(修飾シトシンと非修飾シトシンの両方)に対する5hmC残基の比率でありうる。5hmC密度の他の尺度、例えば部位内における、全ヌクレオチドに対する5hmC残基の比率も考えられ、さらに他の種類の評価、例えば部位内における、5mCに対する5hmCの比率も有用でありうる。
【0121】
5hmC密度に加えて、ヒドロキシメチル化プロファイルは、ヒドロキシメチル化情報(例えばヒドロキシメチル化パターン、核酸領域内の全5hmC残基、核酸領域内の5hmC残基の位置、核酸領域内の5hmC残基の相対位置、および/または半ヒドロキシメチル化または完全ヒドロキシメチル化としてのヒドロキシメチル化部位の識別など)も含んでいてもよい。5hmCは、哺乳動物システムのエピジェネティック制御における基礎的な役割を果たす、鍵となるエピジェネティック修飾として最近になって識別されたところであるため、研究者は、核酸、核酸フラグメント、および核酸領域(すなわち、核酸またはフラグメント内の部位)のヒドロキシメチル化プロファイルを突き止めるための技術の開発に取り組んできた。
【0122】
核酸のヒドロキシメチル化プロファイルを検出するための好ましい方法は、国際特許出願公開WO2017/176630(Quakeら)に記載されており、その全体が参照により本明細書に援用される。この方法は、シーケンシングスキームの過程のうちで、無細胞DNA中の5-ヒドロキシメチルシトシンパターンの検出に関わる。アフィニティータグは、無細胞DNAのサンプル中の5hmC残基に付加され、このタグがつけられたDNA分子は、次いで富化およびシーケンシングされ、5hmCの位置が識別される。この方法の例は、Quakeらの文献に記載されているように、まず無細胞サンプル中の末端が平滑で、アダプターが結合した二本鎖DNAフラグメントを修飾して、アフィニティータグとしてビオチンを5hmC残基に共有結合で結合することを含む。これは、6位がアジド基で官能基化されたウリジン二リン酸(UDP)グルコースで、5hmC残基を選択的にグルコシル化することによって行われてもよく、このステップの後に「クリックケミストリー」反応によるアルキン官能化ビオチンの自発的な1,3-環化付加反応が起こる。これらのビオチン化5hmC残基を含む前記DNAフラグメントは、「富化」ステップにおいて、ストレプトアビジンビーズによって捕獲されうる。
【0123】
富化されたDNAサンプルは、付加されたアダプターまたはその相補鎖にハイブリダイズする1またはそれを超えるプライマーを用いて増幅されてもよい。Y字アダプターが付加された実施形態において、このアダプター結合核酸は、2つのプライマー、すなわちアダプターのトップ鎖の一本鎖領域にハイブリダイズする第1のプライマーと、Y字アダプター(または、ループ切断後のヘアピンアダプター)のボトム鎖の一本鎖領域の相補鎖にハイブリダイズする第2のプライマーを用いて、PCRによって増幅されてもよい。例えば、いくつかの実施形態において、使用されるY字アダプターは、P5およびP7アーム(それらの配列は、Illumina社のシーケンシングプラットフォームに適合している)を有していてもよく、その増幅産物は、一方の端部にP5配列、他方にP7配列を有するであろう。これらの増幅産物は、Illuminaシーケンシング基質にハイブリダイズし、シーケンシングされうる。別の実施形態において、増幅に用いられる前記の一対のプライマーは、Y字アダプターにハイブリダイズする3’末端、およびP5配列またはP7配列のいずれかを有する5’テールを有していてもよい。これらの実施形態において、その増幅産物もまた、一方の端部にP5配列、他方にP7配列を有するであろう。これらの増幅産物は、Illuminaシーケンシング基質にハイブリダイズし、シーケンシングされうる。この増幅ステップは、制限された回数のPCR(例えば、5~20サイクル)によって行われてもよい。
【0124】
シーケンシングステップは、任意の使いやすい次世代シーケンシング法を用いて行ってもよく、その結果、少なくとも10,000、少なくとも50,000、少なくとも100,000、少なくとも500,000、少なくとも1M、少なくとも10M、少なくとも25M、少なくとも50M、少なくとも100M、または少なくとも1Bの配列読み取りデータが得られうる。多くのケースにおいて、前記読み取りデータは、paired-endの読み取りデータである。増幅に用いられるプライマーは、プライマー伸長が用いられる任意の次世代シーケンシングプラットフォーム、例えば、Illumina社のreversible terminator法、Roche社(454社)のパイロシーケンシング法、Life Technologies社のライゲーションによるシーケンシング法(SOLiDプラットフォーム)、Life Technologies社のIon Torrentプラットフォーム、またはPacific Biosciences社のfluorescent base-cleavage法における使用に適合していてもよい。このような方法の例は以下の文献、すなわちMarguliesら(2005)Nature 437:376-80;Ronaghiら(1996)Analytical Biochemistry 242:84-9;Shendure(2005)Science 309:1728);Imelfortら(2009) Brief
Bioinform.10:609-18;Foxら(2009)Methods Mol Biol.553:79-108;Applebyら(2009)Methods
Mol Biol.513:19-39;English(PLoS One.2012 7:e47768);およびMorozova(2008)Genomics 92:255-64)に記載されており、これらは、その方法および方法の特定のステップ(各ステップの全ての出発原料、試薬、および最終産物を含む)の全般的な説明について、参照によって援用される。
【0125】
ある特定の実施形態において、シーケンシングされるサンプルは、複数のサンプルからのDNA分子のプールを含んでいてもよく、この場合、サンプル中の核酸は、それらのソースを示す分子バーコードを有する。いくつかの実施形態において、分析される核酸は、単一のソース(例えば、1つの生物体、ウイルス、組織、細胞、対象など)に由来してもよいが、別の実施形態においては、核酸サンプルは、複数のソースからの核酸のプール(例えば、複数の生物体、組織、細胞、対象などからの核酸のプール)であってもよい。したがって、ある特定の実施形態において、無細胞核酸サンプルは、最小で2またはそれを超えるソース、3またはそれを超えるソース、5またはそれを超えるソース、10またはそれを超えるソース、50またはそれを超えるソース、100またはそれを超えるソース、500またはそれを超えるソース、1000またはそれを超えるソース、5000またはそれを超えるソース、最大で約10,000またはそれを超えるソース(この値を含む)からの核酸を含んでいてもよい。分子バーコードによって、異なるソースからの配列を、分析後に識別することが可能になりうる。
【0126】
配列読み取りデータは、コンピューターで解析されてもよく、したがって、以下に記載するステップを実行するための指示は、適切なコンピューター可読記憶媒体に記録することができるプログラムとして記述されてもよい。
【0127】
いくつかの実施形態において、配列読み取りデータを分析して、cfDNAにおけるヒドロキシメチル化されている配列を定量的に決定してもよい。これは、配列読み取りデータをカウントすることによって、または、それに代えて、増幅の前に、配列の断片化切断点および/または配列が同様のインデクサ-配列を有するかどうかに基づいて、元の出発分子の数をカウントすることによって行ってもよい。分子バーコードを、フラグメントの他の特徴(例えば、切断点を規定する、フラグメントの末端配列)と共に用いた、各フラグメントの識別が知られている。分子バーコードおよび個々の分子をカウントするための例示的な方法は、他にもあるが、Casbon(2011)Nucl.Acids Res.22 e81およびFuら(2011)Proc.Natl Acad.Sci.USA 108:9026-31に記載されている。分子バーコードは、米国特許出願公開第2015/0044687号、第2015/0024950号、および第2014/0227705号、および米国特許第8,835,358号および第7,537,897号、ならびに他の種々の刊行物に記載されている。
【0128】
5hmCの位置が識別されているシーケンシングされた核酸は、その核酸のヒドロキシメチル化プロファイルに関して必要とされる情報を提供する。
【0129】
無細胞サンプル中のDNAのヒドロキシメチル化プロファイルを確認するための他の方法は、2018年2月14日に出願された米国特許仮出願第62/630,798号(Arensdorf、発明の名称「Methods for the Epigenetic analysis of DNA,particularly Cell-Free
DNA」)、および米国特許出願公開第2017/0298422号(Songら)に記載されており、どちらも参照により本明細書に援用される。これらの参考文献は、本方法がサンプルDNAメチル化プロファイルの検出をさらに含む場合の本発明の実施形態、および拡張された比較におけるその使用に関しても有用であり、この拡張された比較においては、ヒドロキシメチル化分析に加えて、メチル化プロファイルもまた、ヒドロキシメチル化プロファイル参照セットに類似したメチル化プロファイルの参照セットを用いて、比較される。すなわち、これらの参考文献には、1つのDNAサンプルからの、メチル化プロファイルとヒドロキシメチル化プロファイルの作成が記載されている。
【0130】
(b)参照データセット
【0131】
サンプル核酸のヒドロキシメチル化プロファイルの作成に続いて、その検出されたヒドロキシメチル化プロファイルは、参照データセット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較される。ここで、各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連する参照遺伝子座に関連する。好ましい実施形態において、前記参照セットは、幅広いヒドロキシメチロームデータセットであり、複数の組織特異的遺伝子のそれぞれに関連する複数の参照遺伝子座のそれぞれについてのヒドロキシメチル化ベクトルを含む。すなわち、前記ヒドロキシメチロームデータセットは、少なくとも3つ、少なくとも5つ、少なくとも10、または少なくとも30の組織タイプと、典型的には、組織タイプあたり少なくとも3つの遺伝子、または組織タイプあたり少なくとも10、少なくとも20、少なくとも25、またはそれを超える遺伝子についての情報を含んでいてもよい。前記ヒドロキシメチル化ベクトルは、各参照遺伝子座について、少なくとも下記の情報、すなわち参照遺伝子座の識別;前記部位に関連する組織特異的遺伝子;前記組織特異的遺伝子に対応する起源組織;および前記ヒドロキシメチル化プロファイルの情報を含む。前記したヒドロキシメチル化プロファイルは、参照遺伝子座内のヒドロキシメチル化密度、ならびに他の項目の情報、例えば、前記部位内の全5hmC残基、前記部位内の5hmC残基の位置、前記部位内の5hmC残基の相対位置、および半ヒドロキシメチル化または完全ヒドロキシメチル化としてのヒドロキシメチル化部位の識別を含む。
【0132】
前記参照遺伝子座は、遺伝子本体またはその構成要素内、例えば、イントロンまたはエクソンの中に含まれていてもよい。前記参照遺伝子座は、遺伝子本体の外にあるゲノムアノテーション特徴の中、例えば、プロモーター、エンハンサー、転写開始部位、転写停止部位、DNA結合部位、またはそれらの組み合わせの中に含まれていてもよい。1またはそれを超える参照遺伝子座を含んでいてもよいDNA結合部位は、例えば、発現抑制領域、転写因子結合部位、転写抑制因子結合部位、およびCTCF結合部位(トランスポゾン反復領域)を含む。CTCF結合部位内の参照遺伝子座は、そのCTCF遺伝子が転写抑制因子CTCF(11ジンクフィンガータンパク質またはCCCTC結合因子としても知られている)をコードしており、その転写抑制因子CTCFが、さらに、転写制御およびクロマチン構造の制御を含む多くの細胞プロセス関係しているかぎり、特に重要である。例えば、Juanら(2016)Cell Reports 14(5):1246-1257;およびEscediら(2018)Epigenomes 2(1):3を参照のこと。
【0133】
よって、参照データセット中の各参照ヒドロキシメチル化プロファイルは、特定の組織タイプを起源とする少なくとも1つの遺伝子に関連する参照遺伝子座に対応する。一実施形態において、前記参照セット中の各参照ヒドロキシメチル化プロファイルは、ある種類のヒト組織(すなわち、例えば消化器系、脳、および骨髄またはリンパ由来など、機能的、器官的、解剖学的、および関連する種々の細胞系統グループ)を起源とする少なくとも1つの遺伝子に関連する参照遺伝子座に対応し、前記ヒト組織には、脂肪;副腎;骨髄;脳;胸;結腸;大脳皮質;頸部;子宮;消化;子宮内膜;精巣上体;食道;卵管;胆嚢;心筋;視床下部;腎臓;肝臓;肺;リンパ節;卵巣;膵臓;副甲状腺;胎盤;前立腺;唾液腺;精嚢;骨格筋;平滑筋;皮膚;脾臓;胃;精巣;甲状腺;扁桃;膀胱;およびそれらの組み合わせが含まれる。前記のリストは例示にすぎず、限定することを意図するものではない。
【0134】
多くのヒト組織(上に列挙したものを含む)は、2またはそれを超えるサブタイプからなり、前記のリストは、任意のおよび全てのそのようなサブタイプを含むことを意図している。例えば、脂肪組織は、褐色脂肪組織(BAT)または白色脂肪組織(WAT)であってもよく、白色脂肪組織である場合、皮下白色脂肪組織(SWAT)または腹腔内内臓白色脂肪組織(VWAT)であってもよい(Gilら(2011)Int.J.Pediatr.Obes.6 Suppl.1:13-20を参照のこと)。副腎組織は、副腎髄質または副腎皮質起源でありうる。骨髄には、骨髄組織、すなわち赤色骨髄および脂肪骨髄すなわち黄色骨髄が含まれ、本発明の方法は、血液細胞の骨髄由来系統と血液細胞のリンパ由来系統の識別において、潜在的に有用である。
【0135】
消化器組織は、主要な4種の組織タイプ、すなわち上皮組織、結合組織、筋肉組織、および神経組織を全て含み、これには粘膜下の結合組織、食道の横紋筋組織、および杯細胞組織、すなわち消化器全面を覆う粘液分泌上皮細胞が含まれる。多くのさらなる組織のサブタイプが、当該技術分野で知られており、および/または関連する書籍および文献を参照して容易に識別することができる。
【0136】
参照遺伝子座と関連する組織特異的遺伝子は、さまざまな程度の相関性または特異性で、特定の組織と相関する遺伝子である。ある特定の遺伝子は、全ての細胞において類似したヒドロキシメチル化プロファイルを示す(すわわち、ハウスキーピング遺伝子)が、他の遺伝子は、人体全体にわたる種々の組織において、異なって表現されるヒドロキシメチル化パターンを示す。特定の組織において高い表現を示す遺伝子に関連するヒドロキシメチル化パターンが組織確定において最も有用であるため、異なって発現される遺伝子に関連する参照遺伝子座が最も重要である。さらに重要なのは異なって表現されるヒドロキシメチル化された遺伝子であり、その表現は特定の組織に対する特異性も有する遺伝子発現レベルと相関があり、さまざまな程度の相関性または特異性で、前記組織中で異なって発現される。異なって発現される遺伝子に関する情報は、当業者に知られているであろうし、関連する書籍および文献に記載されており、膨大な遺伝子-組織発現データベースも利用可能である。例えば、www.preoteinatlas.orgのHuman Protein Atlasの「human tissue proteome」を参照し、またUhlenら(2015),“Tissue-based map of the
human proteome”,Science 347(6220)も参照のこと。前記Human Protein Atlasにおいて、組織特異的遺伝子は、他の組織と比較した、特定の組織で観察されるmRNAレベルの比率によって以下のように分類されている:ある限られた数の組織中で発現され、他の全ての組織に対して少なくとも5倍高いmRNAレベルを示す「tissue enriched」遺伝子、ある遺伝子グループ内で、他の2~7個の遺伝子に対して少なくとも5倍高いmRNAレベルを示す「group enriched」遺伝子、および全ての組織の平均レベルに対して、特定の組織中で少なくとも5倍高いmRNAレベルを示す「tissue enhanced」遺伝子。
【0137】
組織特異的遺伝子の例を、以下のセクション(c)、(d)、および(e)に示す。セクション(c)中の遺伝子、すなわちセット1は、それぞれ5個体から得た17の組織タイプを分析することによって得られた。異なって表現される組織特異的遺伝子を識別するために、Songら(2011)Nature Biotechnology 29:68-72の「5hmC Seal」法を用いて処理を行った。セクション(d)中の、異なって表現され、異なって発現される組織特異的遺伝子、すなわちセット2を識別するために、RNAseqを用いてさらに処理を行った。Log-CPM変換を行い、(1)対象の組織と、他の全ての組織全体の最大値の間のLog-CPMの差、および(2)対象の組織と、他の全ての組織全体の最大値について得たLog-CPMの比、の両方について分析を行った。セクション(e)中の組織特異的遺伝子、すなわちセット3は、複数の個体から得た19の組織タイプ(S字および横行結腸、6ドナーのサンプル;視床下部、4ドナーのサンプル;および他の全ての組織、それぞれ5ドナーのサンプル)を用いて識別し、本明細書中で前に説明したglmnet1A法によって分析した。
【0138】
(c)異なって表現される組織特異的遺伝子-セット1:
【0139】
既に説明したように、参照遺伝子座と関連する組織特異的遺伝子は異なって表現されるので、分かっている組織の参照ヒドロキシメチル化プロファイルと比較することによって、起源が未知の組織または細胞サンプルが識別されうる。ここで、「識別される」とは、起源組織が、例えば、無細胞流体サンプル中の核酸に、確率論的に割り当てられることを指す。異なって発現される遺伝子の第1のセットが、前述した方法、すなわち、RNAseqと、それに続くlog-CPM変換および比較によって識別された。セット1の遺伝子は、起源組織を、起源が未知の組織または細胞サンプルに確率論的に割り当てるための参照セットにおいて特に有用である。
【0140】
セット1:
【0141】
膀胱:AARD、ADARB1、AKR1B10、ANAPC7、APCDD1L-AS1、APOA1BP、CALHM2、CASC3、CLEC2L、COL4A5、CRYM-AS1、EPHA3、FAHD2B、FKBP9L、FOPNL、GNG11、GSN、GSTTP2、GTSF1、IAH1、KCNMB1、KIAA1644、LAMC1、LINC00310、LOC100506394、LOC100507066、LOC493754、MAP1B、MGC27382、MIR5695、NENF、NT5DC3、P2RX1、PCP4、PGM5、PLCD4、PTGFR、RBFOX3、RPL30、SCARA3、SLIT3、SNX29P1、SPATA4、ST8SIA1、TBX4、TXNRD1、VCL、VPS72、WFDC3、およびZNF791。
【0142】
骨髄:ADAMTS20、AFF2、ANKRD18B、ANKRD18DP、ANKRD20A5P、ANKRD20A8P、ANKRD26P1、ANKRD30BP2、ANKRD34B、ANKRD34C、ATP6V0B、AVPR1A、BLOC1S3、BOLL、BRIP1、C5orf63、CA1、CALB1、CALCR、CCDC39、CCDC96、CDCA5、CDH12、CDH9、CEACAM8、CENPE、CENPK、CFL1、CHAT、COMMD5、COMMD8、CRISP1、CRISP2、CSN1S1、CSN1S2AP、CT64、CXCR2、CXorf30、DAZL、DCDC1、DRGX、DSG1、DUT、DUX2、DUX4L2、DUX4L3、DYTN、EDA2R、EFCAB3、EPOR、EVX2、F13A1、FCAR、FCER1A、FKBP1B、FOXA2、GABPB1-AS1、GABRA1、GABRA4、GABRG1、GALNTL6、GFER、GFI1、GPR152、GPR158-AS1、GPRC6A、GRM1、GRP、GRXCR1、GYPA、HAGHL、HCRTR2、HEPHL1、HJURP、HK3、HMBS、HORMAD2、ID4、IL17RA、IL18RAP、KCNC2、KCNK18、KIF18A、KIF20B、KLHL1、LEF1-AS1、LHX1、LHX3、LHX8、LINC00273、LINC00558、LINC00645、LINC00648、LLPH、LOC100129620、LOC100270679、LOC100505776、LOC100506422、LOC284801、LOC392232、LOC399815、LOC401074、LOC401134、LOC440040、LOC440970、LOC642236、LOC727924、LOC728012、LPO、LRRIQ1、MAGEA11、MAGOHB、MEFV、MIF4GD、MIR548A3、MIR5692A1、MMP8、MMP9、MMRN1、MRGPRE、MS4A3、MSRB1、MYO3A、NCOR1P1、NDST3、NDST4、NHLRC4、NOXRED1、NPAP1、NUF2、OR8G1、OR8U8、ORC6、OSM、OTX2、PAX3、PBK、PCDH8、PDCL2、POTEA、PROK2、PRR7、RAB24、RAX、RBM46、RGS18、RGS19、RIMS2、RNF175、RRM2、SATB2-AS1、SCN11A、SCRT2、SERPINB10、SGOL2、SIX1、SKA3、SKOR1、SLC22A16、SLC4A10、SLC5A7、SLC5A8、SLCO6A1、SNAP91、SPAG16、SPATA16、SPDL1、SPINK13、STPG2、STXBP5L、TARM1、TDRD5、TEX15、THSD7B、TMPRSS11A、TMPRSS11B、TMPRSS11D、TRIM58、TUBB4B、UNC13C、USP6、VRK1、VSTM1、VWDE、WDR49、WFDC8、WFDC9、ZIC5、ZNF230、ZNF300P1、ZNF470、ZNF502、ZNF599、およびZPBP。
【0143】
脳組織:C1orf159、CCDC42B、CCDC8、CD248、CERCAM、CNTN2、CRB2、EVI5L、FZD9、HAPLN2、HPDL、LINC00575、LOC284950、LOC339666、LRIT1、PLEKHH1、SHISA2、SLC46A2、TFAP2E、TMEM235、TNFRSF18、およびZFP36。
【0144】
結腸:C1orf109、CACNA1F、COX7B、EFNB1、FGL2、FLJ34208、GNRH1、GSTT1、IL12A、KCND1、KDELR1、LAT、LOC100130992、LOC100287042、LOC401242、MRPL10、NT5C3B、PDZD4、PPYR1、RAD51D、RBMXL3、RENBP、SCNN1B、SERPINB5、SLC9A6、XBP1、およびZNF189。
【0145】
心筋組織:ABR、ADPRHL1、ASB18、ATP1A3、CCDC74A、CDH13、CHRNA10、CORO6、FSD2、GALNT16、GDAP1L1、GJA3、GLUD1P3、GPRC5B、LOC100506343、LRRC37A6P、LRRC4、MUL1、MYOM2、NDUFB8、NT5DC2、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB4、PCDHGB5、PCDHGB6、PCDHGB7、PXDNL、RHPN1-AS1、RPL3L、SGCG、TIMM21、TNNT1、TOR4A、UBAC1、WDR37、ZNF12、ZNF213、ZNF550、ZNF843、およびZNF844。
【0146】
視床下部:AGAP6、ASTN1、BBS2、C18orf56、C19orf45、CINP、DGKI、DPY30、DROSHA、FAM169A、FAM66D、FONG、GALNT15、GDAP1、GHRH、GUSBP4、HIF1AN、IFIT1B、INTS2、JAKMIP2-AS1、KGFLP2、LINC00297、LINC00707、LOC100288069、LOC100507140、LPHN3、LYPD1、LZIC、MIR548T、MRAP、NTRK3、PDE6D、PPP1R17、PRSS54、PRSS55、PTPRA、RGS7、SNRNP35、SUGT1P1、UBE2Z、WDR47、WDYHV1、ZNF114、ZNF556、およびZNF610。
【0147】
腎臓:ABP1、AGPAT9、APH1B、ASAP2、ATP4B、ATP6V1A、BBOX1、BCRP3、C11orf63、C13orf35、C16orf96、C19orf21、CA12、CCDC64、COL4A3、CXCL14、CYS1、EIF4E2、EPB41L1、EVC、FIGNL2、FUT3、GALNT14、GLIS2、GUSBP11、HAVCR1、HOXC5、INADL、KATNA1、L2HGDH、LOC100130238、LOC100506305、LOC284100、LOC654433、LYG1、MORN4、MTNR1A、PAQR5、PARG、PAX2、PAX8、PLA2G15、POU5F1、PRKAB1、RNF113B、SENP8、SETD3、SLC22A2、SLC25A30、SLC9A3、SULT1C2、TBC1D7、およびTSPAN33。
【0148】
肝臓:ABCB4、ABCC11、ABCC2、ABCG5、ABCG8、ACADSB、ACSM5、AGMO、AGXT2L1、AKR1C2、AKR1C4、AKR1D1、AMDHD1、APOB、APOH、APOM、AQP9、ARHGEF40、ASGR2、ASPG、ATP2B2、BCO2、BDH1、C3、C3P1、C5、C8A、C8B、C8orf74、CA5A、CABP2、CALR3、CD7、CDK10、CEACAM16、CES1、CFH、CFHR4、CHP1、CIDEB、CLPTM1L、CLRN3、CPN2、CREB3L3、CROCCP2、CYP2B6、CYP2C18、CYP2C19、CYP2C9、CYP2E1、CYP3A5、CYP7A1、DGAT2、DHODH、DPYS、DRG2、ECHS1、EDC4、EI24、ENO1、F13B、F2、F7、F9、FASN、FETUB、GCH1、GCKR、GDPD4、GFRA1、GHR、GLT1D1、GPAM、GSDMB、HAL、HAO1、HAPLN4、HPD、HPX、HYLS1、IGF2、IGF2-AS、IGFBP1、ISY1-RAB43、ITIH1、ITIH2、ITIH4、IVD、KLC4、LBP、LEFTY1、LIPG、LOC100288122、LOC284865、LPAL2、LRRC16B、MASP1、MGMT、MST1、MTTP、NAT9、NBR2、NELFE、NR1I2、NUP88、OSGIN1、PAH、PARD6A、PCSK9、PEX19、PGLYRP2、PHGDH、PHYH、PKLR、PLA2G12B、PLG、PNPLA3、POFUT1、POLR1E、PON1、PPL、PRAP1、PRKAG3、PROC、PUS3、RANBP10、RCE1、RND1、RNF123、RORC、RPUSD4、SAA2-SAA4、SCP2、SEC16B、SERPINA6、SERPINC1、SKIV2L、SLC13A5、SLC22A25、SLC25A20、SLC27A5、SLC30A10、SLCO1B3、SMLR1、SNAPC5、SPP2、SRD5A1、STAT2、STEAP3、SULT2A1、TFR2、THNSL2、TIAF1、TM6SF2、TMEM45A、TMPRSS6、TTC31、TTC38、UROC1、XYLB、ZCCHC9、およびZSCAN22。
【0149】
肺:ADAM9、ANKRD50、ARGLU1、ARL6、ARSJ、BMP5、BMPR2、BTG3、C1orf140、CALM2、CCDC102B、CCNL1、CCR5、CD36、CHN1、CLIC2、CPEB2、CRBN、CYP4Z2P、CYYR1、DACH1、DGKE、DGKH、DISP1、DOCK4、ETV1、EXOC1、FAM204A、FAT4、FGD5-AS1、FLJ34503、FRYL、GBP1P1、GNB4、GPR110、GPR116、HMCN1、HMGN1、IFI44、IL15、ITGA2、KAL1、KDR、KITLG、KLHL41、LDB2、LINC00032、LINC00240、LINC00551、LINC00657、LOC100131234、LOC100505495、LOC100507217、LOC643733、LPAR6、MGP、ODF2L、PEAK1、PKIA、PLEKHA1、PLEKHG7、PTPRB、QKI、RAD21、RALA、RAP2A、RCC1、SAMD12、SESTD1、SH3GLB1、SKAP2、SLC35A5、SMURF2、SPRED1、SRSF1、TCF4、TIGD4、TMEM207、TMOD3、UHMK1、VEGFC、XIST、YIPF5、ZC2HC1A、およびZEB1。
【0150】
リンパ節:AKNA、ANKRD34A、C14orf183、CCDC107、CD180、CD3G、CD74、CDC42SE2、CHMP7、COTL1、CYTH1、FAIM3、FAM65B、GPX4、GSTP1、HLA-DMA、HLA-DOA、HLA-DPB1、HVCN1、ICAM2、ICOS、IL6、ITGB7、LOC100130557、MDM4、METTL21D、MGC16275、MIR548AN、NAPSB、RPL39L、RPS11、SEPT6、SH2D3C、TAP1、TEAD2、TMEM60、TNFRSF9、TRAF1、UBAC2、UCP2、およびWDR87。
【0151】
卵巣組織:ACTA2、ADAMTS5、AQP11、ATP1B2、BICD1、C7、CDH3、CDON、COL14A1、HS3ST1、KLF4、LEMD1-AS1、LINC00672、LOC100129617、LOC339298、LRRC17、NDP、NTF3、OMD、PDGFRA、PGR、ROBO4、RWDD4、SCD5、SERPINE2、SLC25A17、SNCAIP、SYTL4、TENM4、TSPAN5、UBXN8、およびZNF93。
【0152】
膵臓:ALDH1L2、ANKEF1、ASUN、B3GALNT2、BBIP1、C6orf201、CASP9、CCDC110、CCDC65、CDK14、CELA2B、CELA3B、CFTR、CHMP4C、CHRNA7、CLCN3、CLDN1、CPA3、CUZD1、DNAJC10、DNAJC3、EIF2S1、EIF4EBP1、ERO1LB、FAIM、FAM160A1、FAM162A、FAM221A、FAM24B-CUZD1、GARS、GUCA1C、HSPA13、IFRD1、INTS6、KCTD16、LINC00339、LMAN1、LOC154092、LOC201651、LOC644838、LYPD6B、MAN1A2、MGC72080、MKNK1、MPP6、MSRB2、NAA16、NOMO2、OSTC、PEX7、PGRMC2、PIK3CB、PLA2G12A、PM20D1、PPP1R9A、PRRC1、PRSS3、RNPC3、SCFD1、SCRN3、SERPINI2、SH3YL1、SLC16A7、SLC33A1、SLC4A4、SORBS2、SRBD1、SSR1、TDH、TDP2、TMEM51-AS1、TMEM65、TRHDE、TRIM44、UGT2A3、UMOD、WDFY2、WHAMM、およびXPOT。
【0153】
胎盤:ACER2、ADAM12、ADCY10、ADCY7、ADORA2B、AIM1L、AKNAD1、ALDH3B2、AMOT、ANGPT2、APOLD1、ATF3、ATG9B、ATP6V1C2、ATRIP、BCAR3、BCAR4、BEAN1、BPGM、BTBD19、C11orf70、C16orf46、C16orf74、C17orf98、C1QTNF6、C2orf62、C2orf83、C3orf52、C4orf26、C4orf51、C6orf99、C7orf71、C9orf129、CACNA2D3-AS1、CAPN6、CCDC125、CEP41、CLEC7A、CPA4、CSF3R、CTSL3P、CXorf56、CYP19A1、DACT2、DDX59、DLX3、DLX5、DLX6-AS1、DNMT1、DUSP4、EBI3、EDARADD、EPAS1、EPS8L1、ERVFRD-1、ERVMER34-1、ETV3、ETV4、EXTL1、EZR、FAM184A、FAM89A、FANCE、FBLN1、FBN2、FHDC1、FOLR1、GATA2、GATA3、GBA、GCM1、GDPD3、GLDN、GM2A、GPR156、GSG1、GSTA3、GSTA4、HELLS、HOPX、HSD11B2、HSPBAP1、IGF2BP3、IGSF5、ISM2、KATNBL1、KIAA1467、KIAA1609、KISS1、KLRG2、L1TD1、LCMT1、LCTL、LIN28B、LINC00439、LOC100131564、LOC100506746、LOC100527964、LOC151475、LOC152578、LOC284551、LOC643441、MB21D2、MED12、METTL21C、MFSD2B、MGC16121、MINA、MORC4、MSANTD3、MUTYH、NOS3、NVL、NXF1、OLR1、OSCP1、OSTCP1、P2RY6、PCBP1-AS1、PDE6A、PGC、PGF、PLA1A、PLAC4、PPP1R14D、PSG11、PSG2、PSG6、PSG7、PSG8、PTGES、PVRL3-AS1、PVRL4、PWWP2B、RAB36、RHO、RNF222、RPSAP58、RS1、SBF2-AS1、SCIN、SDC1、SEMA3F、SEMA6D、SEPT12、SH2D7、SH3GLB2、SLC13A4、SLC26A2、SLC2A1-AS1、SMAGP、SMARCB1、SMIM13、SNX12、SP6、SPESP1、SPIRE2、ST3GAL6-AS1、SVEP1、SYT8、TENM3、TLR3、TMEM216、TMEM218、TMEM52B、TMPRSS7、TP63、TPRXL、TRIM29、TRPV5、TUFT1、USHBP1、VAMP5、VGLL1、WBP2NL、XRCC2、ZDHHC1、ZNF320、ZNF331、ZNF354B、ZNF468、ZNF525、ZNF702P、ZNF90、ZP3、ZSWIM2、およびZSWIM7。
【0154】
前立腺組織:ABCC4、ACPP、ALDH1A2、ANKRD66、AP1B1P1、ARG2、BEND4、C1orf85、C6orf132、C6orf52、CHRNA2、COQ7、EVX1、EYA2、FLJ39080、GDEP、HMGN2P46、ISX、KLKP1、MCCC2、MEAF6、MFSD4、MRPS23、NCAPD3、OACYLP、OAZ3、OR51E2、PAK1IP1、PCAT1、PI15、PPP1R7、PSMA4、SCNN1G、SLC14A1、SLC26A3、SLC2A12、SLC30A4、SLC35F2、TMEM79、TPM3P9、TTC12、USP50、ZNF350、ZNF532、およびZNF589。
【0155】
平滑筋組織:AKIP1、ARHGEF26-AS1、ATG4A、BOLA3、CHMP4A、DHH、EPPK1、FCHSD1、GADL1、GCC1、GIPC3、HIGD2B、HTR3C、LINC00654、LOC91948、OLFML3、PTGES3L、WSCD2、ZNF202、ZNF205-AS1、およびZNF426。
【0156】
胃:ACOT1、C12orf54、CREB3、DDN、FAM50A、FNDC4、GORASP1、GUCA1B、IMPDH2、LINC00284、LOC100128076、LOC100128682、LOC100131434、LRP10、LRRC55、LRRC73、NOTO、RNF112、RTBDN、SIGLEC8、TNN、TRIM50、UBE2T、ZNF391、およびZNF792。
【0157】
精巣:ALX4、AQP2、ATAD3B、C11orf85、CABLES2、CCDC114、CCDC27、CCNF、CD300C、CILP、DES、DMRT1、DNAJB8-AS1、DRD4、EFCAB6-AS1、FAM153B、FAM163B、FGD2、HSD17B3、IFI27L1、IGFN1、ITPR3、KCNK15、KIFC2、KRT78、KRT82、LOC100506385、LOC283914、LOC284661、LOC399829、LOC653712、LOC728716、MAGED2、MYH16、MYLK2、NPTX2、PLK5、PMS2CL、PNPLA1、PODNL1、POLD1、PRMT8、PTPRVP、RD3、RIMS4、RNU6-81、RPL26L1、SALL4、SERPINA10、SPATA31E1、STAB1、SULT4A1、TCERG1L、TEKT4P2、THEG、TMEM130、TPO、UPK3B、WASH3P、WRAP53、ZNF280B、およびZNF793。
【0158】
(d)異なって表現され、異なって発現される組織特異的遺伝子-セット2:
【0159】
いくつかの実施形態において、参照遺伝子座と関連する組織特異的遺伝子は、異なって発現されるだけでなく、異なって表現される。これらの遺伝子も、起源組織を、起源が未知の組織または細胞サンプルに確率論的に割り当てる際に有用であり、例えばヒト対象から得た無細胞流体サンプルの場合があてはまりうる。代表的な異なって表現され、異なって発現される組織特異的遺伝子、すなわちセット2は、以下の通りである。
【0160】
膀胱:AARD、ADARB1、AKR1B10、CRYM-AS1、EPHA3、GTSF1、KCNMB1、MAP1B、NT5DC3、P2RX1、PCP4、PGM5、PLCD4、PTGFR、RBFOX3、SCARA3、SLIT3、SNX29P1、ST8SIA1、TBX4、TXNRD1、VCL、およびWFDC3。
【0161】
骨髄:ABCA13、AZU1、CA1、CEACAM8、CLEC6A、DAZL、DRGX、DYTN、ELANE、FCAR、GFI1、GYPA、HK3、IL18RAP、LINC00333、LINC00550、LINC00558、LIPN、LOC100129620、LOC442028、LPO、MEFV、MMP8、MMP9、MPO、MS4A3、MYB、MYO1F、NCOR1P1、NME8、OR8U8、OSCAR、PARPBP、PAX3、PDCL2、PRDM13、PROK2、RGS18、RGS21、RRM2、RXFP2、SERPINB10、SLC22A16、SPATA16、SPI1、SPTA1、TARM1、TMPRSS15、TRIM58、VSTM1、およびXKR3。
【0162】
脳組織:ASPHD1、BRSK1、CCDC177、CNTN2、HAPLN2、KCNJ10、KIF1A、LGI3、NCAN、NR2E1、RHBDL3、TMEM151A、TMEM235、TMEM59L、およびZNF488。
【0163】
結腸:FGL2およびSCNN1B。
【0164】
心筋組織:ADPRHL1、ASB18、ATP1A3、CDH13、CORO6、FSD2、GALNT16、GJA3、MYOM2、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB5、PCDHGB6、PCDHGB7、PXDNL、RPL3L、SGCG、およびTNNT1。
【0165】
視床下部:ASTN1およびDGK1。
【0166】
腎臓:BBOX1、BCRP3、CA12、COL4A3、CXCL14、CYS1、EVC、FIGNL2、GALNT14、GLIS2、HAVCR1、LOC100130238、PAQR5、PAX2、PAX8、PLA2G15、SLC22A2、SLC9A3、SULT1C2、およびTSPAN33。
【0167】
肝臓:ABCC2、ABCG5、ABCG8、AHSG、AKR1C4、AMDHD1、APOH、ASGR1、ASGR2、C3P1、C8A、C8B、C9、CA5A、CFHR4、CPN2、CREB3L3、CYP2B6、CYP2C9、CYP2E1、CYP3A4、DHODH、F12、F2、F7、GC、HAL、HPD、HPX、INHBC、ITIH1、ITIH2、ITIH3、KNG1、LBP、PGLYRP2、PLG、PROC、PRODH2、SERPINA6、SERPINC1、SLC13A5、SLC22A1、SLC25A47、SLC27A5、SULT2A1、TFR2、TMPRSS6、およびUROC1。
【0168】
肺:ANXA3、BMP5、CYP4Z2P、DRAM1、FMO2、GNA15、IDO1、KCNS3、LIMCH1、MBIP、PAPSS2、PCDH17、RSPH4A、RTKN2、およびTRPC6。
【0169】
リンパ節:ACAP1、AKNA、ARHGAP9、BCL11B、BIRC3、CARD11、CD180、CD37、CD3E、CD3G、CD40、CETP、CIITA、CLEC2D、CNR2、CXCR5、DOCK10、ETS1、GPR132、GPR18、ICAM2、ICOS、ITGB7、ITK、KIAA1551、KLHL6、LCK、LINC00426、LY86、MDS2、MEOX2、MX2、NAPSB、PATL2、PCED1B-AS1、PIK3CD、PLVAP、POU2F2、SCIMP、SCML4、SLFN12L、SMAP2、SP110、SPIB、TLR10、TMC8、TMEM156、TNFAIP8、TNFRSF9、TNFSF11、TRAF1、TRIM22、UCP2、およびZC3H12D。
【0170】
卵巣:ABCA10、ACSS3、ADAMTS5、AQP11、C7、CDH3、CDON、CLDN11、COL14A1、COLEC11、ESR2、FAM198B、FZD3、GALNT10、GLI2、GSTM5、HS3ST1、LEMD1-AS1、LHX9、LRRC17、MCHR1、MRC2、NTF3、OMD、PDGFRA、PGR、PKNOX2、PTCH2、RWDD4、SCD5、SERPINE2、SIMC1、SLC25A17、SNCAIP、SULF2、TENM4、TSPAN5、TTC8、およびUBXN8。
【0171】
膵臓:ALDH1L2、ANKEF1、ASNS、B3GALNT2、BCAT1、CASP9、CCDC110、CELA2B、CELA3B、CFTR、CHMP4C、CLDN1、CNIH3、COCH、CUZD1、DEFB1、EGF、EIF4EBP1、ERP27、FAM24B-CUZD1、FBXW12、GUCA1C、KCTD16、KIAA1324、LINC00339、LNX2、MKNK1、NAA16、NPHS1、PAIP2B、PM20D1、PRSS3、SCGN、SEL1L、SERPINI2、SH3YL1、SLC33A1、SLC4A4、TC2N、TDH、TMEM51-AS1、TRHDE、およびUMOD。
【0172】
胎盤:ADAM12、ATG9B、ATP6V1C2、BCAR4、BMP1、BPGM、CSF3R、CYP11A1、CYP19A1、DACT2、DEPDC1B、DLX5、EBI3、GCM1、GPR78、GSTA3、IGF2BP3、IGSF5、ISM2、KISS1、KRT23、LIN28B、MMP11、PGF、PSG11、PSG2、PSG3、PSG6、PSG7、PSG8、SPTLC3、TPRXL、ZFAT、およびZNF554。
【0173】
前立腺:ABCC4、ACPP、ALOX15B、ANO7、AP1B1P1、ARG2、BEND4、C6orf132、C6orf52、CANT1、CASZ1、CBFA2T2、CHRM1、CHRNA2、COL26A1、EVX1、EYA2、FAM135A、HMGN2P46、KLK2、KLKP1、MME、MPPED2、MUC12、NANS、NCAPD3、NEFH、NIPAL3、OACYLP、OR51E2、PAK1IP1、PDE9A、PI15、PMEPA1、POTEF、RDH11、SCNN1G、SIM2、SLC14A1、SLC22A3、SLC2A12、SLC30A4、SLC35F2、SLC37A1、SLC39A6、SPDEF、STEAP2、THSD4、TMEM79、TPM3P9、TXNDC16、URB1、VIPR1、ZNF350、ZNF532、ZNF613、ZNF649、ZNF761、およびZNF827。
【0174】
平滑筋:GADL1、GIPC3、PTGES3L、およびWSCD2。
【0175】
精巣:CCDC27、DMRT1、DNAJC5G、FBXO24、IGLL1、MOV10L1、SEPT14、THEG、およびTTC16。
【0176】
(e)異なって表現される組織特異的遺伝子-セット3:
【0177】
セット3中の遺伝子は、識別された(glmnet1Aを用いて決定された)相対的寄与率と合わせて、組織タイプに応じてセット3A~3Sとして表1~19にまとめられており、各遺伝子は、名称および染色体位置によって特定されている。セット1および2の遺伝子が、ヒドロキシメチル化プロファイルに由来する適合モデルを用いて未知の組織または細胞サンプルを識別するための例であったのに対し、これらセット3の遺伝子は、複数の組織入手源からのヒドロキシメチル化プロファイルのセットを用いた、組織タイプ間の識別に最も有用である。
【0178】
セット3:
表1-セット3A:
【表1】
【0179】
表2-セット3B:
【表2-1】
【表2-2】
【0180】
表3-セット3C:
【表3-1】
【表3-2】
【0181】
表4-セット3D:
【表4】
【0182】
表5-セット3E:
【表5-1】
【表5-2】
【0183】
表6-セット3F:
【表6-1】
【表6-2】
【0184】
表7-セット3G:
【表7】
【0185】
表8-セット3H:
【表8-1】
【表8-2】
【0186】
表9-セット3I:
【表9】
【0187】
表10-セット3J:
【表10-1】
【表10-2】
【0188】
表11-セット3K:
【表11】
【0189】
表12-セット3L:
【表12-1】
【表12-2】
【0190】
表13-セット3M:
【表13】
【0191】
表14-セット3N:
【表14】
【0192】
表15-セット3O:
【表15】
【0193】
表16-セット3P:
【表16-1】
【表16-2】
【0194】
表17-セット3Q:
【表17-1】
【表17-2】
【0195】
表18-セット3R:
【表18】
【0196】
表19-セット3S:
【表19-1】
【表19-2】
【0197】
(f)サンプルヒドロキシメチル化プロファイルと参照プロファイルとの比較:
【0198】
組織割り当て方法は、次に(a)において検出されたヒドロキシメチル化プロファイルと、参照データセット中の参照プロファイルとを比較することを含む。比較を容易にするために、検出されたヒドロキシメチル化プロファイルは、プロファイル中のデータの種類、量、およびフォーマットに関して、参照ヒドロキシメチル化プロファイルの形式と同じ形式で作成するべきである。
【0199】
サンプルDNAのヒドロキシメチル化プロファイルと、参照データセット中のヒドロキシメチル化プロファイルの比較は、データセット中の複数のヒドロキシメチル化ベクトル全体にわたるサンプルヒドロキシメチル化プロファイルの分析を含む。個々のデータポイントは、例えば、サンプルおよび1またはそれを超える参照ヒドロキシメチル化プロファイルの両方における、特定の部位におけるヒドロキシメチル化の存在または不存在;サンプル中の特定の部位におけるヒドロキシメチル化密度が、1またはそれを超える参照ヒドロキシメチル化プロファイルと比較して高いまたは低いこと;などである。
【0200】
参照データセット中の複数の参照ヒドロキシメチル化プロファイル全体にわたるサンプルヒドロキシメチル化プロファイルの比較は、当該術分野で認識されている、複数の特性全体にわたって類似性をアセスメントする方法を用いて行うことができ、任意の適切な最新の数学的方法を使用することができる。データセット間の相関性を立証するための周知の数学的方法は、本明細書中で前に説明したように、判別分析(DA)(例えば、線形判別分析、2次判別分析、および正則化判別分析)、判別関数分析(DFA)、カーネル法(例えば、SVM)、多次元尺度構成法(MDS、Multidimensional Scaling)、ノンパラメトリックな方法(例えば、k近傍判別法(k-Nearest-Neighbor Classifier))、PLS(部分的最小二乗法)、ツリーに基づく方法(例えば、論理回帰、CART、ランダムフォレスト法、ブースティング/バギング法)、一般化線型モデル(例えば、ロジスティック回帰)、主成分分析に基づく方法(例えば、SIMCA)、一般化加法モデル、ファジー論理に基づく方法、ニューラルネットワークおよび遺伝的アルゴリズムに基づく方法のような方法を採用している。参照ヒドロキシメチル化ベクトルの幅広い参照セット全体にわたる比較において検出されたヒドロキシメチル化プロファイルを評価するための適切な数学的方法の選択は、当該技術分野の技術の範囲内であり、よって、詳細な説明は省く。
【0201】
これらの統計的方法に関する詳細は、以下の参考文献、すなわちRuczinskiら(2003)J.Computational and Graphical Statistics 12:475-511(2003);Friedman(1989)J.Amer.Statistical Assoc.84:165-175;Hastieら、The Elements of Statistical Learning,Springer Series in Statistics(2001);Breimanら、Classification and Regression Trees(Wadsworth Publishing,1984);Breiman(2001)Machine Learning 45:5-32;Pepe、The Statistical Evaluation of Medical Tests for Classification and Prediction,Oxford Statistical Science Series,28(2003);およびDudaら、Pattern Classification(Wiley Interscience,2nd Edition,2001)中に見いだされる。いくつかの技術において、DNAサンプルのヒドロキシメチル化プロファイルと、複数の参照ヒドロキシメチル化プロファイルのそれぞれとの間で識別される差異を含む、ヒドロキシメチル化差異データセットを作成することが望ましい。
【0202】
このようにして、DNAサンプルのヒドロキシメチル化プロファイルと、参照ヒドロキシメチル化プロファイルのセットとの間の類似性および差異が分析され、その分析に基づいて、起源組織がサンプルDNAに確率論的に割り当てられる。結果は、起源組織が特定の組織、例えば骨髄組織、肺組織などであるという尤度(%)の形式の確率であってもよい。結果は、それぞれ起源組織が異なる組織に由来するといいう尤度(%)の形式の、2またはそれを超える確率の形式であってもよい。後者の結果は、組織と、対応する対応する確率のリストの形式をとっていてもよく、例えば、1つのDNAサンプルについての結果は、以下のように、すなわち胸部組織、79%;子宮組織、11%;子宮内膜組織、10%、と記述されていてもよい。得られた結果(単数または複数)を示すための他の方法も、特定の目的のために、当業者によって考えられ、かつ適合されうる。
【0203】
参照データセット中のヒドロキシメチル化プロファイルが十分に組織特異的である場合、および/またはヒドロキシメチル化プロファイルの組み合わせが、サンプルDNAヒドロキシメチル化プロファイルとの比較によって統計的に有意な結果をもたらす場合、本発明の方法は、高い感受性かつ高い特異性で、起源組織を特徴づける。
【0204】
3.関連する使用方法
参照セット内のヒドロキシメチル化ベクトルは、「正常な」ヒドロキシメチル化プロファイル、すなわち特定の参照遺伝子座と関連する特定の組織または器官に関して、いかなる病変も示していない対象における組織特異的遺伝子に関連する参照遺伝子座についてのヒドロキシメチル化プロファイルを含んでいてもよい。前記ヒドロキシメチル化ベクトルは、以下のものに関連するヒドロキシメチル化プロファイルも含んでいてもよい:
【0205】
特定の組織の有害な状態、障害、または疾患、例えば腫瘍、新生物、またはがんの存在;
【0206】
特定の組織の有害な状態、障害、または疾患、例えば腫瘍、新生物、またはがんを発症する可能性(この場合、本方法は、前癌状態を検出するために実施されうる);
【0207】
特定の状態、疾患、または障害による有害な影響を受けている対象が、特定のコースの処置に対するレスポンダーである可能性;および/または
【0208】
特定の状態、疾患、または障害による有害な影響を受けている対象が、特定のコースの処置に対して反応を示している可能性。
【0209】
よって、本発明のさらなる実施形態において、ヒト対象における組織または器官の状態を検出するための方法が提供され、前記方法は、(a)前記ヒト対象から得た無細胞流体サンプル中のDNAのヒドロキシメチル化プロファイルを作成すること;(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、(i)組織特異的遺伝子に関連する参照遺伝子座、および(ii)特定の組織または器官の状態に関連する);および(c)前記対象について作成されたヒドロキシメチル化プロファイルと、前記参照ヒドロキシメチル化プロファイルとの比較に基づいて、前記対象における特定の組織または器官の状態を識別することを含む。
【0210】
この方法は、前記対象における特定の組織または器官の識別された状態に基づいて、診断、処置の判断、予後を行うことをさらに含んでいてもよい。
【0211】
関連する実施形態において、本発明は、ヒト対象における組織または器官の状態の変化を検出するための方法を提供し、前記方法は、(a)前記ヒト対象から得た無細胞流体サンプル中のDNAフラグメントの1またはそれを超える遺伝子座における初期ヒドロキシメチル化プロファイルを作成すること(前記ヒドロキシメチル化プロファイルは、組織または器官の初期状態に関連する);(b)その後の時点において、前記対象から得た無細胞流体サンプル中の前記と同一の1またはそれを超える遺伝子座における、その後のヒドロキシメチル化プロファイルを作成すること;および(c)前記その後のヒドロキシメチル化プロファイルを前記初期ヒドロキシメチル化プロファイルと比較して、組織または器官の状態の変化を検出することを含む。
【0212】
前記の方法は、前記組織または器官に関連する状態、疾患、または障害の進行をモニターするために、すなわち進行性の患者に関して、ステップ(b)をさらに1またはそれを超える回数繰り返すことを含んでいてもよい。この方法は、罹患した組織または器官の状態、疾患、または障害に対する治療的介入(例えば継続中の薬物療法など)の有効性に関する素早いアセスメントを可能にする。この方法は、経時的に、すなわち患者評価期間を通して、遺伝子発現の変化をモニタリングすることも含んでいてもよい。
【0213】
別の関連する実施形態において、本発明は、対象が特定の組織または器官の有害な状態、疾患、または障害を生じる可能性を判定するための方法を提供し、前記方法は、(a)前記対象から得た無細胞流体サンプル中のDNAフラグメントの1またはそれを超える遺伝子座におけるヒドロキシメチル化プロファイルを作成すること(前記ヒドロキシメチル化プロファイルは、特定の組織または器官の有害な状態、疾患、または障害が生じる可能性に関連する);(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、(i)組織特異的遺伝子に関連する参照遺伝子座、および(ii)特定の組織または器官の有害な状態、疾患、または障害が生じる可能性に関連する);および(c)対象について作成されたヒドロキシメチル化プロファイルと、前記参照ヒドロキシメチル化プロファイルとの比較に基づいて、前記対象が前記特定の組織または器官の有害な状態、疾患、または障害を生じる可能性を識別することを含む。
【0214】
特に重要な用途としては、米国特許出願公開第2017/0298422号(Songら)(すでに参照により本明細書に援用されている)に詳述されているように、特定の組織のがんを、癌腫、肉腫、リンパ腫、白血病、胚細胞腫瘍、芽細胞腫などとして特徴づけることを含む。
【0215】
癌腫としては、限定するものではないが、上皮新生物、扁平上皮新生物扁平上皮癌、基底細胞新生物基底細胞癌、移行上皮乳頭腫および癌、腺腫および腺癌(腺)、腺腫、腺癌、linitis plastica型インスリノーマ、グルカゴン産生腫瘍、ガストリン産生腫瘍、ビポーマ、肝内胆管癌、肝細胞癌、腺様嚢胞癌、虫垂のカルチノイド腫瘍、プロラクチン産生腫瘍、膨大細胞腫、ヒュルトレ細胞腺腫、腎細胞癌、グラウィッツ腫瘍、多発性内分泌腺腫、類内膜腺腫、付属器および皮膚付属器新生物、粘膜表皮新生物、嚢腫性、粘液性および漿液性新生物、嚢腺腫、腹膜偽粘液腫、管、小葉および髄様新生物、腺房細胞新生物、複合上皮性新生物、ワルティン腫瘍、胸腺腫、特殊性腺新生物、性索間質性腫瘍、莢膜細胞腫、顆粒膜細胞腫瘍、男性化細胞腫、セルトリ・ライディッヒ細胞腫、グロムス腫瘍、傍神経節腫、褐色細胞腫、グロムス腫瘍、母斑および黒色腫、色素性母斑、悪性黒色腫、黒色腫、結節型黒色腫、異型母斑、悪性黒子型黒色腫、表在拡大型黒色腫、ならびに悪性末端黒子型黒色腫があげられる。肉腫としては、限定するもではないが、アスキン腫瘍、ブドウ状肉腫、軟骨肉腫、ユーイング肉腫、悪性血管内皮腫、悪性シュワン腫、骨肉腫、軟部組織肉腫(胞巣状軟部肉腫を含む)、血管肉腫、葉状嚢肉腫、皮膚線維肉腫、類腱腫、線維形成型小円形細胞腫瘍、類上皮肉腫、骨外性軟骨肉腫、骨外性骨肉腫、線維肉腫、血管外皮細胞腫、血管肉腫、カポジ肉腫、平滑筋肉腫、脂肪肉腫、リンパ管肉腫、リンパ肉腫、悪性線維性組織球腫、神経線維肉腫、横紋筋肉腫、ならびに滑膜肉腫があげられる。リンパ腫および白血病としては、限定するものではないが、慢性リンパ性白血病/小リンパ球性リンパ腫、B細胞前リンパ球性白血病、リンパ形質細胞性リンパ腫(ワルデンストレームマクログロブリン血症など)、脾臓辺縁層リンパ腫、形質細胞性骨髄腫、形質細胞腫、単クローン性免疫グロブリン沈着症、重鎖病、節外性辺縁帯B細胞リンパ腫(MALTリンパ腫とも呼ばれる)、結節性辺縁帯B細胞リンパ腫(nmzl)、濾胞性リンパ腫、マントル細胞リンパ腫、びまん性大細胞型B細胞リンパ腫、縦隔(胸腺)大細胞型B細胞リンパ腫、血管内大細胞型B細胞リンパ腫、原発性滲出性リンパ腫、バーキットリンパ腫/白血病、T細胞前リンパ球性白血病、T細胞大顆粒リンパ球性白血病、急性進行性NK細胞白血病、成人T細胞白血病/リンパ腫、節外性NK/T細胞リンパ腫、鼻型、腸症型T細胞リンパ腫、脾臓T細胞リンパ腫、芽球性NK細胞リンパ腫、菌状息肉症、セザリー症候群、原発性皮膚CD30陽性リンパ増殖性障害、原発性皮膚未分化大細胞型リンパ腫、リンパ腫様丘疹症、血管免疫芽球性T細胞リンパ腫、末梢T細胞性リンパ腫、不特定未分化大細胞リンパ腫、古典的ホジキンリンパ腫(結節硬化型、混合細胞型、リンパ球豊富型、リンパ球減少型、またはリンパ球非減少型)、ならびに結節性リンパ球優位型ホジキンリンパ腫があげられる。胚細胞腫瘍としては、限定するものではないが、胚細胞腫、未分化胚細胞腫、セミノーマ、非ジャーミノーマ胚細胞腫瘍、胎児性癌、内胚葉洞腫瘍、絨毛癌、奇形腫、多胚腫、および性腺芽細胞腫があげられる。芽細胞腫としては、限定するものではないが、腎芽細胞腫、髄芽細胞腫、および網膜芽細胞腫があげられる。他のがんとしては、限定するものではないが、口唇癌、喉頭癌、下咽頭癌、舌癌、唾液腺癌、胃癌、腺癌、甲状腺がん(甲状腺髄様癌および乳頭状癌)、腎癌、腎臓実質癌、子宮頚癌、子宮体部癌、子宮内膜癌、絨毛癌、精巣癌、泌尿器癌、黒色腫、脳腫瘍(膠芽腫、星状細胞腫、硬膜腫、髄芽細胞腫、および末梢神経外胚葉性腫瘍など)、胆嚢癌、気管支癌、多発性骨髄腫、基底細胞腫、奇形腫、網膜芽細胞腫、脈絡膜黒色腫、セミノーマ、横紋筋肉腫、頭蓋咽頭腫(craniopharyngeoma)、骨肉腫、軟骨肉腫、筋肉腫、脂肪肉腫、線維肉腫、ユーイング肉腫、および形質細胞腫があげられる。
【0216】
さらなる実施形態において、分析されるがんは、肺がん(非小細胞肺癌および小細胞肺がん(小細胞癌(燕麦細胞がん)、混合型小細胞癌/大細胞癌、および混合型小細胞癌を含む)を含む)、大腸がん、乳がん、前立腺がん、肝臓がん、脳がん、腎臓がん、卵巣がん、胃がん、皮膚がん、骨がん、胃がん、乳がん、膵臓がん、神経膠腫、膠芽腫、肝細胞癌、乳頭状腎癌、頭頸部扁平上皮癌、白血病、リンパ腫、骨髄腫、または固形腫瘍であってもよい。
【0217】
がんは、急性リンパ性白血病;急性骨髄性白血病;副腎皮質癌;AIDS関連がん;AIDS関連リンパ腫;肛門がん;虫垂がん;星状細胞腫;異型性テラトイド/ラブドイド腫瘍;基底細胞癌;膀胱がん;脳幹膠腫;脳腫瘍(脳幹膠腫、中枢神経性異型性テラトイド/ラブドイド腫瘍、中枢神経系胎児性腫瘍、星状細胞腫、頭蓋咽頭腫、上衣芽細胞腫、上衣腫、髄芽細胞腫、髄上皮腫、中分化型松果体実質腫瘍、テント上未分化神経外胚葉性腫瘍、および松果体芽細胞腫);乳がん;気管支腫瘍;バーキットリンパ腫;原発部位不明のがん;カルチノイド腫瘍;原発部位不明の癌腫;中枢神経性異型性テラトイド/ラブドイド腫瘍;中枢神経系胎児性腫瘍;子宮頚がん;小児がん;脊索腫;慢性リンパ性白血病;慢性骨髄性白血病;慢性骨髄増殖性疾患;大腸がん;結腸直腸がん;頭蓋咽頭腫;皮膚T細胞リンパ腫;内分泌性膵島細胞腫瘍;子宮内膜がん;上衣芽細胞腫;上衣腫;食道がん;鼻腔神経芽細胞腫;ユーイング肉腫;頭蓋外胚細胞腫瘍;性腺外胚細胞腫瘍;肝臓外胆管がん;胆嚢癌;胃がん(gastric(stomach)cancer);胃腸カルチノイド腫瘍;消化管間葉系細胞腫瘍;胃腸管間質性腫瘍(GIST);妊娠性栄養膜腫瘍;神経膠腫;ヘアリー細胞白血病;頭頸部がん;心臓がん;ホジキンリンパ腫;下咽頭がん;眼球内黒色腫;膵島細胞腫瘍;カポジ肉腫;腎臓がん;ランゲルハンス細胞組織球症;喉頭がん;口唇がん;肝臓がん;悪性線維性組織球腫骨腫;髄芽細胞腫;髄上皮腫;黒色腫;メルケル細胞がん;メルケル細胞皮膚癌;中皮腫;原発不明の頸部転移性扁平上皮がん;口腔がん;多発性内分泌腫瘍症候群;多発性骨髄腫;多発性骨髄腫/形質細胞新生物;菌状息肉症;骨髄異形成症候群;骨髄増殖性新生物;鼻腔がん;鼻咽腔がん;神経芽細胞腫;非ホジキンリンパ腫;非黒色腫皮膚がん;非小細胞肺癌;口腔がん;口腔がん;中咽頭がん;骨肉腫;他の脳脊髄腫瘍;卵巣がん;卵巣上皮がん;卵巣胚細胞腫瘍;低悪性度卵巣腫瘍;膵臓がん;乳頭腫症;副鼻腔がん;副甲状腺がん;骨盤がん;陰茎がん;咽頭がん;中分化型松果体実質腫瘍;松果体芽細胞腫;下垂体腫瘍;形質細胞新生物/多発性骨髄腫;胸膜肺芽腫;原発性中枢神経系(CNS)リンパ腫;原発性肝細胞がん;前立腺がん;直腸がん;腎臓がん;腎細胞(腎臓)がん;腎細胞がん;気道がん;網膜芽細胞腫;横紋筋肉腫;唾液腺がん;セザリー症候群;小細胞肺がん;小腸がん;軟部組織肉腫;扁平上皮癌;頸部扁平上皮がん;胃がん(stomach(gastric)cancer);テント上未分化神経外胚葉性腫瘍;T細胞リンパ腫;精巣がん;咽頭がん;腺癌;胸腺腫;甲状腺がん;移行上皮がん;腎盂および尿管の移行上皮がん;栄養膜腫瘍;尿管がん;尿道がん;子宮がん;子宮肉腫;腟がん;外陰がん;ワルデンストレームマクログロブリン血症;またはウィルムス腫瘍でありうる。本発明の方法は、対象のヒドロキシメチル化プロファイルが1またはそれを超える上述のがんを表す可能性を定めるために使用することができる。
【0218】
本実施形態の一態様は、原発不明癌腫(CUP、Carcinoma of Unknown Primary)、すなわち、体内に悪性細胞が観察される(すなわち、転移が起きている)が、原発がんの起源組織が不明である疾患に適する。本発明の方法は、起源組織が、CUPに確率論的に割り当てられるため、このような関係において有用である。
【0219】
サンプルDNAのヒドロキシメチル化プロファイルと、参照データセット中の組織特異的ヒドロキシメチル化プロファイルとの比較は、心血管系疾患、例えばアテローム性動脈硬化症、うっ血性心不全、不安定プラーク、卒中、または虚血についての情報ももたらしうる。前記心血管系疾患または状態は、高血圧、狭窄症、血管閉塞、または血栓性イベントでありうる。前記比較によって、器官毒性学に関する情報ももたらされる。一例として、肝臓または腎臓におけるUR遺伝子の存在は、薬理学的に活性な特定の薬剤の毒性を示しうる。別の例として、UR遺伝子は、器官内の細胞死の程度を確認するために有用である。追加の例として、UR遺伝子とDE遺伝子の組み合わせは、器官内の細胞機能障害の識別に有用である。
【0220】
組織特異的なその他の有害な状態、障害、および疾患もまた、本明細書において重要であり、そのようなものとしては、限定するものではないが、米国特許出願公開第2017/0298422号(Songら)に記載されている炎症性疾患、免疫病、自己免疫疾患、神経系疾患、および感染症があげられる。
【0221】
さらなる実施形態において、上述の任意の方法を、メチル化分析と組み合わせうる。メチル化プロファイルを決定するための方法は知られている。この実施形態には、拡張された比較における、サンプルDNAメチル化プロファイルの決定およびその使用が含まれ、その場合、ヒドロキシメチル化分析に加えて、ヒドロキシメチル化プロファイル参照セットに類似したメチル化プロファイルの参照セットを用いて、メチル化プロファイルもまた比較される。好ましい方法としては、米国特許仮出願第62/630,798(Arensdorf)および米国特許出願公開第2017/0298422号(Songら)(すでに参照により本明細書に援用されている)に記載されているように、1つのDNAサンプルからDNAメチル化プロファイルおよびヒドロキシメチル化プロファイルを作成することがあげられる。
【0222】
別の実施形態において、ヒト血漿から得た無細胞DNAサンプルを分析するための改良された方法が提供され、その際、サンプル中の無細胞DNAフラグメントは、単離され、増幅され、およびシーケンシングされる。前記改良には、サンプルへの末梢血単核球(PBMC、peripheral blood mononuclear cell)を起源とするゲノム材料のコンタミネーションを識別することが含まれ、前記識別は、以下の(a)~(c)、すなわち(a)無細胞サンプル中のDNAフラグメントのヒドロキシメチル化プロファイルを作成すること;(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較すること(各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に対応する参照遺伝子座に関連し、前記参照ヒドロキシメチル化プロファイルは、少なくとも1つのPBMCヒドロキシメチル化プロファイルを含む);および(c)前記比較から、PBMCを起源とするゲノム材料の存在を識別すること、によって行われる。前記方法は、(b)および(c)からPBMCゲノムコンタミネーションのレベルを推定すること、および前記PBMCゲノムコンタミネーションのレベル基づいて、サンプルが無細胞DNA分析に適しているか否かについて判定することを含んでいてもよい。この実施形態において、前記参照セットは、必要に応じて、それぞれがPBMCサブタイプ(すなわち、T細胞、B細胞、およびNK細胞を含むリンパ球;単球;ならびに樹状細胞)に関連する遺伝子部位に対応する、複数の参照ヒドロキシメチル化プロファイルのベクトルを含む。
本発明は、例えば以下の項目を提供する。
(項目1)
起源組織を、ヒト対象から得た無細胞流体サンプル中の核酸に確率論的に割り当てるための方法であって、
(a)核酸のヒドロキシメチル化プロファイルを作成すること;
(b)前記核酸のヒドロキシメチル化プロファイルを、参照データセット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較することであって、各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連するゲノム領域内に含まれる参照遺伝子座に対応すること;
(c)(a)において検出されたヒドロキシメチル化プロファイルと実質的に類似する参照ヒドロキシメチル化プロファイルを有する少なくとも1つの参照遺伝子座を識別すること;および
(d)(c)において識別された少なくとも1つの参照遺伝子座および対応する組織特異的遺伝子に基づいて、少なくとも1つの起源組織を前記核酸に割り当てること
を含む、方法。
(項目2)
各参照遺伝子座が、組織特異的遺伝子に関連するヒドロキシメチル化可変ゲノム領域内に含まれる、項目1に記載の方法。
(項目3)
前記参照セットが、複数の組織特異的遺伝子に関連する参照遺伝子座のヒドロキシメチル化プロファイルを含む、項目2に記載の方法。
(項目4)
(c)と(d)の間に、(C’)前記実質的な類似性から、前記核酸が、前記少なくとも1つの参照遺伝子座に対応する起源組織を有する確率を決定することをさらに含む、項目3に記載の方法。
(項目5)
前記実質的な類似性が、前記作成された核酸のヒドロキシメチル化プロファイルと、前記複数の参照ヒドロキシメチル化プロファイルのそれぞれとの間で識別される差異を含むヒドロキシメチル化差異データセットから検出される、項目4に記載の方法。
(項目6)
前記ヒドロキシメチル化可変ゲノム領域が、前記対応する組織特異的遺伝子と機能的に関連する、項目1に記載の方法。
(項目7)
前記参照セットが、少なくとも、特定の参照遺伝子座における前記ヒドロキシメチル化プロファイル;前記参照遺伝子座に関連する前記組織特異的遺伝子;および前記遺伝子および参照遺伝子座と関連する前記組織を識別する、ヒドロキシメチル化ベクトルを含む、項目1~6のいずれか1項に記載の方法。
(項目8)
各参照遺伝子座における前記ヒドロキシメチル化プロファイルが、
前記参照遺伝子座内のヒドロキシメチル化密度;
前記参照遺伝子座内の全5-ヒドロキシメチルシトシン残基;
前記参照遺伝子座内の前記5-ヒドロキシメチルシトシン残基の位置;
半ヒドロキシメチル化または完全ヒドロキシメチル化としてのヒドロキシメチル化部位の識別;および
前記参照遺伝子座内の5-ヒドロキシメチルシトシン残基の相対位置
のうちの少なくとも1つを含む、項目7に記載の方法。
(項目9)
各参照遺伝子座における前記ヒドロキシメチル化プロファイルが、ヒドロキシメチル化密度を含む、項目8に記載の方法。
(項目10)
前記ヒドロキシメチル化密度が、前記参照遺伝子座内の、全修飾シトシン残基および非修飾シトシン残基に対する5-ヒドロキシメチルシトシン残基の比率を含む、項目9に記載の方法。
(項目11)
前記ヒドロキシメチル化密度が、ヒドロキシメチル化されるCpG部位におけるシトシンの割合を含む、項目9に記載の方法。
(項目12)
前記少なくとも1つの参照遺伝子座が、遺伝子本体またはその構成要素の中に含まれる、項目8に記載の方法。
(項目13)
前記少なくとも1つの参照遺伝子座が、イントロンまたはエクソンの中に含まれる、項目12に記載の方法。
(項目14)
前記少なくとも1つの参照遺伝子座が、前記遺伝子本体の外にあるゲノムアノテーション特徴の中に含まれる、項目8に記載の方法。
(項目15)
前記少なくとも1つの参照遺伝子座が、プロモーター、エンハンサー、転写開始部位、転写停止部位、DNA結合部位、またはそれらの組み合わせの中に含まれる、項目14に記載の方法。
(項目16)
前記少なくとも1つの参照遺伝子座が、DNA結合部位を含む、項目12に記載の方法。(項目17)
前記DNA結合部位が、発現抑制領域を含む、項目16に記載の方法。
(項目18)
前記DNA結合部位が、転写因子結合部位を含む、項目16に記載の方法。
(項目19)
前記転写因子結合部位が、転写抑制因子結合部位を含む、項目18に記載の方法。
(項目20)
前記DNA結合部位が、CTCF結合部位を含む、項目19に記載の方法。
(項目21)
核酸の長さ;核酸フラグメント分布;メチル化プロファイル;およびヌクレオソームの位置のうちの少なくとも1つを決定することをさらに含む、項目1に記載の方法。
(項目22)
前記参照セット中の前記複数の参照ヒドロキシメチル化プロファイルが、脂肪;副腎;膀胱;骨髄;脳;胸;結腸;大脳皮質;頸部;子宮;消化;子宮内膜;精巣上体;食道;卵管;胆嚢;胃腸;心筋;視床下部;腎臓;肝臓;肺;リンパ節;卵巣;膵臓;副甲状腺;胎盤;前立腺;唾液腺;精嚢;骨格筋;平滑筋;皮膚;脾臓;胃;精巣;甲状腺;扁桃;またはそれらの組み合わせを含むヒト組織タイプを起源とする少なくとも1つの遺伝子に関連する少なくとも1つの参照遺伝子座のヒドロキシメチル化プロファイルを含む、項目1に記載の方法。
(項目23)
前記参照セット中の前記複数の参照ヒドロキシメチル化プロファイルが、膀胱;骨髄;脳;胸;結腸;胃腸;心筋;視床下部;腎臓;肝臓;肺;リンパ節;卵巣;膵臓;胎盤;前立腺;皮膚;平滑筋;精巣;またはそれらの組み合わせを含むヒト組織タイプを起源とする少なくとも1つの遺伝子に関連する少なくとも1つの参照遺伝子座のヒドロキシメチル化プロファイルを含む、項目22に記載の方法。
(項目24)
前記参照セット中の前記複数の参照ヒドロキシメチル化プロファイルが、複数のヒト組織タイプのそれぞれについて、複数の組織特異的遺伝子のそれぞれに関連する少なくとも1つの参照遺伝子座を含む、項目22または23に記載の方法。
(項目25)
前記参照セットが、少なくとも3つの組織タイプについてのヒドロキシメチル化ベクトルを含む、項目7に記載の方法。
(項目26)
前記参照セットが、少なくとも5つの組織タイプについてのヒドロキシメチル化ベクトルを含む、項目25に記載の方法。
(項目27)
前記参照セットが、少なくとも10の組織タイプについてのヒドロキシメチル化ベクトルを含む、項目26に記載の方法。
(項目28)
前記参照セットが、少なくとも30の組織タイプについてのヒドロキシメチル化ベクトルを含む、項目27に記載の方法。
(項目29)
前記参照セットが、組織タイプあたり、少なくとも5つの遺伝子についてのヒドロキシメチル化ベクトルを含む、項目24に記載の方法。
(項目30)
前記参照セットが、組織タイプあたり、少なくとも20の遺伝子についてのヒドロキシメチル化ベクトルを含む、項目29に記載の方法。
(項目31)
各参照遺伝子座が、AARD、ADARB1、AKR1B10、ANAPC7、APCDD1L-AS1、APOA1BP、CALHM2、CASC3、CLEC2L、COL4A5、CRYM-AS1、EPHA3、FAHD2B、FKBP9L、FOPNL、GNG11、GSN、GSTTP2、GTSF1、IAH1、KCNMB1、KIAA1644、LAMC1、LINC00310、LOC100506394、LOC100507066、LOC493754、MAP1B、MGC27382、MIR5695、NENF、NT5DC3、P2RX1、PCP4、PGM5、PLCD4、PTGFR、RBFOX3、RPL30、SCARA3、SLIT3、SNX29P1、SPATA4、ST8SIA1、TBX4、TXNRD1、VCL、VPS72、WFDC3、ZNF791、ADAMTS20、AFF2、ANKRD18B、ANKRD18DP、ANKRD20A5P、ANKRD20A8P、ANKRD26P1、ANKRD30BP2、ANKRD34B、ANKRD34C、ATP6V0B、AVPR1A、BLOC1S3、BOLL、BRIP1、C5orf63、CA1、CALB1、CALCR、CCDC39、CCDC96、CDCA5、CDH12、CDH9、CEACAM8、CENPE、CENPK、CFL1、CHAT、COMMD5、COMMD8、CRISP1、CRISP2、CSN1S1、CSN1S2AP、CT64、CXCR2、CXorf30、DAZL、DCDC1、DRGX、DSG1、DUT、DUX2、DUX4L2、DUX4L3、DYTN、EDA2R、EFCAB3、EPOR、EVX2、F13A1、FCAR、FCER1A、FKBP1B、FOXA2、GABPB1-AS1、GABRA1、GABRA4、GABRG1、GALNTL6、GFER、GFI1、GPR152、GPR158-AS1、GPRC6A、GRM1、GRP、GRXCR1、GYPA、HAGHL、HCRTR2、HEPHL1、HJURP、HK3、HMBS、HORMAD2、ID4、IL17RA、IL18RAP、KCNC2、KCNK18、KIF18A、KIF20B、KLHL1、LEF1-AS1、LHX1、LHX3、LHX8、LINC00273、LINC00558、LINC00645、LINC00648、LLPH、LOC100129620、LOC100270679、LOC100505776、LOC100506422、LOC284801、LOC392232、LOC399815、LOC401074、LOC401134、LOC440040、LOC440970、LOC642236、LOC727924、LOC728012、LPO、LRRIQ1、MAGEA11、MAGOHB、MEFV、MIF4GD、MIR548A3、MIR5692A1、MMP8、MMP9、MMRN1、MRGPRE、MS4A3、MSRB1、MYO3A、NCOR1P1、NDST3、NDST4、NHLRC4、NOXRED1、NPAP1、NUF2、OR8G1、OR8U8、ORC6、OSM、OTX2、PAX3、PBK、PCDH8、PDCL2、POTEA、PROK2、PRR7、RAB24、RAX、RBM46、RGS18、RGS19、RIMS2、RNF175、RRM2、SATB2-AS1、SCN11A、SCRT2、SERPINB10、SGOL2、SIX1、SKA3、SKOR1、SLC22A16、SLC4A10、SLC5A7、SLC5A8、SLCO6A1、SNAP91、SPAG16、SPATA16、SPDL1、SPINK13、STPG2、STXBP5L、TARM1、TDRD5、TEX15、THSD7B、TMPRSS11A、TMPRSS11B、TMPRSS11D、TRIM58、TUBB4B、UNC13C、USP6、VRK1、VSTM1、VWDE、WDR49、WFDC8、WFDC9、ZIC5、ZNF230、ZNF300P1、ZNF470、ZNF502、ZNF599、ZPBP、C1orf159、CCDC42B、CCDC8、CD248、CERCAM、CNTN2、CRB2、EVI5L、FZD9、HAPLN2、HPDL、LINC00575、LOC284950、LOC339666、LRIT1、PLEKHH1、SHISA2、SLC46A2、TFAP2E、TMEM235、TNFRSF18、ZFP36、C1orf109、CACNA1F、COX7B、EFNB1、FGL2、FLJ34208、GNRH1、GSTT1、IL12A、KCND1、KDELR1、LAT、LOC100130992、LOC100287042、LOC401242、MRPL10、NT5C3B、PDZD4、PPYR1、RAD51D、RBMXL3、RENBP、SCNN1B、SERPINB5、SLC9A6、XBP1、ZNF189、ABR、ADPRHL1、ASB18、ATP1A3、CCDC74A、CDH13、CHRNA10、CORO6、FSD2、GALNT16、GDAP1L1、GJA3、GLUD1P3、GPRC5B、LOC100506343、LRRC37A6P、LRRC4、MUL1、MYOM2、NDUFB8、NT5DC2、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB4、PCDHGB5、PCDHGB6、PCDHGB7、PXDNL、RHPN1-AS1、RPL3L、SGCG、TIMM21、TNNT1、TOR4A、UBAC1、WDR37、ZNF12、ZNF213、ZNF550、ZNF843、ZNF844、AGAP6、ASTN1、BBS2、C18orf56、C19orf45、CINP、DGKI、DPY30、DROSHA、FAM169A、FAM66D、FONG、GALNT15、GDAP1、GHRH、GUSBP4、HIF1AN、IFIT1B、INTS2、JAKMIP2-AS1、KGFLP2、LINC00297、LINC00707、LOC100288069、LOC100507140、LPHN3、LYPD1、LZIC、MIR548T、MRAP、NTRK3、PDE6D、PPP1R17、PRSS54、PRSS55、PTPRA、RGS7、SNRNP35、SUGT1P1、UBE2Z、WDR47、WDYHV1、ZNF114、ZNF556、ZNF610、ABP1、AGPAT9、APH1B、ASAP2、ATP4B、ATP6V1A、BBOX1、BCRP3、C11orf63、C13orf35、C16orf96、C19orf21、CA12、CCDC64、COL4A3、CXCL14、CYS1、EIF4E2、EPB41L1、EVC、FIGNL2、FUT3、GALNT14、GLIS2、GUSBP11、HAVCR1、HOXC5、INADL、KATNA1、L2HGDH、LOC100130238、LOC100506305、LOC284100、LOC654433、LYG1、MORN4、MTNR1A、PAQR5、PARG、PAX2、PAX8、PLA2G15、POU5F1、PRKAB1、RNF113B、SENP8、SETD3、SLC22A2、SLC25A30、SLC9A3、SULT1C2、TBC1D7、TSPAN33、ABCB4、ABCC11、ABCC2、ABCG5、ABCG8、ACADSB、ACSM5、AGMO、AGXT2L1、AKR1C2、AKR1C4、AKR1D1、AMDHD1、APOB、APOH、APOM、AQP9、ARHGEF40、ASGR2、ASPG、ATP2B2、BCO2、BDH1、C3、C3P1、C5、C8A、C8B、C8orf74、CA5A、CABP2、CALR3、CD7、CDK10、CEACAM16、CES1、CFH、CFHR4、CHP1、CIDEB、CLPTM1L、CLRN3、CPN2、CREB3L3、CROCCP2、CYP2B6、CYP2C18、CYP2C19、CYP2C9、CYP2E1、CYP3A5、CYP7A1、DGAT2、DHODH、DPYS、DRG2、ECHS1、EDC4、EI24、ENO1、F13B、F2、F7、F9、FASN、FETUB、GCH1、GCKR、GDPD4、GFRA1、GHR、GLT1D1、GPAM、GSDMB、HAL、HAO1、HAPLN4、HPD、HPX、HYLS1、IGF2、IGF2-AS、IGFBP1、ISY1-RAB43、ITIH1、ITIH2、ITIH4、IVD、KLC4、LBP、LEFTY1、LIPG、LOC100288122、LOC284865、LPAL2、LRRC16B、MASP1、MGMT、MST1、MTTP、NAT9、NBR2、NELFE、NR1I2、NUP88、OSGIN1、PAH、PARD6A、PCSK9、PEX19、PGLYRP2、PHGDH、PHYH、PKLR、PLA2G12B、PLG、PNPLA3、POFUT1、POLR1E、PON1、PPL、PRAP1、PRKAG3、PROC、PUS3、RANBP10、RCE1、RND1、RNF123、RORC、RPUSD4、SAA2-SAA4、SCP2、SEC16B、SERPINA6、SERPINC1、SKIV2L、SLC13A5、SLC22A25、SLC25A20、SLC27A5、SLC30A10、SLCO1B3、SMLR1、SNAPC5、SPP2、SRD5A1、STAT2、STEAP3、SULT2A1、TFR2、THNSL2、TIAF1、TM6SF2、TMEM45A、TMPRSS6、TTC31、TTC38、UROC1、XYLB、ZCCHC9、ZSCAN22、ADAM9、ANKRD50、ARGLU1、ARL6、ARSJ、BMP5、BMPR2、BTG3、C1orf140、CALM2、CCDC102B、CCNL1、CCR5、CD36、CHN1、CLIC2、CPEB2、CRBN、CYP4Z2P、CYYR1、DACH1、DGKE、DGKH、DISP1、DOCK4、ETV1、EXOC1、FAM204A、FAT4、FGD5-AS1、FLJ34503、FRYL、GBP1P1、GNB4、GPR110、GPR116、HMCN1、HMGN1、IFI44、IL15、ITGA2、KAL1、KDR、KITLG、KLHL41、LDB2、LINC00032、LINC00240、LINC00551、LINC00657、LOC100131234、LOC100505495、LOC100507217、LOC643733、LPAR6、MGP、ODF2L、PEAK1、PKIA、PLEKHA1、PLEKHG7、PTPRB、QKI、RAD21、RALA、RAP2A、RCC1、SAMD12、SESTD1、SH3GLB1、SKAP2、SLC35A5、SMURF2、SPRED1、SRSF1、TCF4、TIGD4、TMEM207、TMOD3、UHMK1、VEGFC、XIST、YIPF5、ZC2HC1A、ZEB1、AKNA、ANKRD34A、C14orf183、CCDC107、CD180、CD3G、CD74、CDC42SE2、CHMP7、COTL1、CYTH1、FAIM3、FAM65B、GPX4、GSTP1、HLA-DMA、HLA-DOA、HLA-DPB1、HVCN1、ICAM2、ICOS、IL6、ITGB7、LOC100130557、MDM4、METTL21D、MGC16275、MIR548AN、NAPSB、RPL39L、RPS11、SEPT6、SH2D3C、TAP1、TEAD2、TMEM60、TNFRSF9、TRAF1、UBAC2、UCP2、WDR87、ACTA2、ADAMTS5、AQP11、ATP1B2、BICD1、C7、CDH3、CDON、COL14A1、HS3ST1、KLF4、LEMD1-AS1、LINC00672、LOC100129617、LOC339298、LRRC17、ND
P、NTF3、OMD、PDGFRA、PGR、ROBO4、RWDD4、SCD5、SERPINE2、SLC25A17、SNCAIP、SYTL4、TENM4、TSPAN5、UBXN8、ZNF93、ALDH1L2、ANKEF1、ASUN、B3GALNT2、BBIP1、C6orf201、CASP9、CCDC110、CCDC65、CDK14、CELA2B、CELA3B、CFTR、CHMP4C、CHRNA7、CLCN3、CLDN1、CPA3、CUZD1、DNAJC10、DNAJC3、EIF2S1、EIF4EBP1、ERO1LB、FAIM、FAM160A1、FAM162A、FAM221A、FAM24B-CUZD1、GARS、GUCA1C、HSPA13、IFRD1、INTS6、KCTD16、LINC00339、LMAN1、LOC154092、LOC201651、LOC644838、LYPD6B、MAN1A2、MGC72080、MKNK1、MPP6、MSRB2、NAA16、NOMO2、OSTC、PEX7、PGRMC2、PIK3CB、PLA2G12A、PM20D1、PPP1R9A、PRRC1、PRSS3、RNPC3、SCFD1、SCRN3、SERPINI2、SH3YL1、SLC16A7、SLC33A1、SLC4A4、SORBS2、SRBD1、SSR1、TDH、TDP2、TMEM51-AS1、TMEM65、TRHDE、TRIM44、UGT2A3、UMOD、WDFY2、WHAMM、XPOT、ACER2、ADAM12、ADCY10、ADCY7、ADORA2B、AIM1L、AKNAD1、ALDH3B2、AMOT、ANGPT2、APOLD1、ATF3、ATG9B、ATP6V1C2、ATRIP、BCAR3、BCAR4、BEAN1、BPGM、BTBD19、C11orf70、C16orf46、C16orf74、C17orf98、C1QTNF6、C2orf62、C2orf83、C3orf52、C4orf26、C4orf51、C6orf99、C7orf71、C9orf129、CACNA2D3-AS1、CAPN6、CCDC125、CEP41、CLEC7A、CPA4、CSF3R、CTSL3P、CXorf56、CYP19A1、DACT2、DDX59、DLX3、DLX5、DLX6-AS1、DNMT1、DUSP4、EBI3、EDARADD、EPAS1、EPS8L1、ERVFRD-1、ERVMER34-1、ETV3、ETV4、EXTL1、EZR、FAM184A、FAM89A、FANCE、FBLN1、FBN2、FHDC1、FOLR1、GATA2、GATA3、GBA、GCM1、GDPD3、GLDN、GM2A、GPR156、GSG1、GSTA3、GSTA4、HELLS、HOPX、HSD11B2、HSPBAP1、IGF2BP3、IGSF5、ISM2、KATNBL1、KIAA1467、KIAA1609、KISS1、KLRG2、L1TD1、LCMT1、LCTL、LIN28B、LINC00439、LOC100131564、LOC100506746、LOC100527964、LOC151475、LOC152578、LOC284551、LOC643441、MB21D2、MED12、METTL21C、MFSD2B、MGC16121、MINA、MORC4、MSANTD3、MUTYH、NOS3、NVL、NXF1、OLR1、OSCP1、OSTCP1、P2RY6、PCBP1-AS1、PDE6A、PGC、PGF、PLA1A、PLAC4、PPP1R14D、PSG11、PSG2、PSG6、PSG7、PSG8、PTGES、PVRL3-AS1、PVRL4、PWWP2B、RAB36、RHO、RNF222、RPSAP58、RS1、SBF2-AS1、SCIN、SDC1、SEMA3F、SEMA6D、SEPT12、SH2D7、SH3GLB2、SLC13A4、SLC26A2、SLC2A1-AS1、SMAGP、SMARCB1、SMIM13、SNX12、SP6、SPESP1、SPIRE2、ST3GAL6-AS1、SVEP1、SYT8、TENM3、TLR3、TMEM216、TMEM218、TMEM52B、TMPRSS7、TP63、TPRXL、TRIM29、TRPV5、TUFT1、USHBP1、VAMP5、VGLL1、WBP2NL、XRCC2、ZDHHC1、ZNF320、ZNF331、ZNF354B、ZNF468、ZNF525、ZNF702P、ZNF90、ZP3、ZSWIM2、ZSWIM7、ABCC4、ACPP、ALDH1A2、ANKRD66、AP1B1P1、ARG2、BEND4、C1orf85、C6orf132、C6orf52、CHRNA2、COQ7、EVX1、EYA2、FLJ39080、GDEP、HMGN2P46、ISX、KLKP1、MCCC2、MEAF6、MFSD4、MRPS23、NCAPD3、OACYLP、OAZ3、OR51E2、PAK1IP1、PCAT1、PI15、PPP1R7、PSMA4、SCNN1G、SLC14A1、SLC26A3、SLC2A12、SLC30A4、SLC35F2、TMEM79、TPM3P9、TTC12、USP50、ZNF350、ZNF532、ZNF589、AKIP1、ARHGEF26-AS1、ATG4A、BOLA3、CHMP4A、DHH、EPPK1、FCHSD1、GADL1、GCC1、GIPC3、HIGD2B、HTR3C、LINC00654、LOC91948、OLFML3、PTGES3L、WSCD2、ZNF202、ZNF205-AS1、ZNF426、ACOT1、C12orf54、CREB3、DDN、FAM50A、FNDC4、GORASP1、GUCA1B、IMPDH2、LINC00284、LOC100128076、LOC100128682、LOC100131434、LRP10、LRRC55、LRRC73、NOTO、RNF112、RTBDN、SIGLEC8、TNN、TRIM50、UBE2T、ZNF391、ZNF792、ALX4、AQP2、ATAD3B、C11orf85、CABLES2、CCDC114、CCDC27、CCNF、CD300C、CILP、DES、DMRT1、DNAJB8-AS1、DRD4、EFCAB6-AS1、FAM153B、FAM163B、FGD2、HSD17B3、IFI27L1、IGFN1、ITPR3、KCNK15、KIFC2、KRT78、KRT82、LOC100506385、LOC283914、LOC284661、LOC399829、LOC653712、LOC728716、MAGED2、MYH16、MYLK2、NPTX2、PLK5、PMS2CL、PNPLA1、PODNL1、POLD1、PRMT8、PTPRVP、RD3、RIMS4、RNU6-81、RPL26L1、SALL4、SERPINA10、SPATA31E1、STAB1、SULT4A1、TCERG1L、TEKT4P2、THEG、TMEM130、TPO、UPK3B、WASH3P、WRAP53、ZNF280B、またはZNF793を含む、異なって表現される遺伝子の中に含まれる、項目1に記載の方法。
(項目32)
各参照遺伝子座が、AARD、ADARB1、AKR1B10、CRYM-AS1、EPHA3、GTSF1、KCNMB1、MAP1B、NT5DC3、P2RX1、PCP4、PGM5、PLCD4、PTGFR、RBFOX3、SCARA3、SLIT3、SNX29P1、ST8SIA1、TBX4、TXNRD1、VCL、WFDC3、ABCA13、AZU1、CA1、CEACAM8、CLEC6A、DAZL、DRGX、DYTN、ELANE、FCAR、GFI1、GYPA、HK3、IL18RAP、LINC00333、LINC00550、LINC00558、LIPN、LOC100129620、LOC442028、LPO、MEFV、MMP8、MMP9、MPO、MS4A3、MYB、MYO1F、NCOR1P1、NME8、OR8U8、OSCAR、PARPBP、PAX3、PDCL2、PRDM13、PROK2、RGS18、RGS21、RRM2、RXFP2、SERPINB10、SLC22A16、SPATA16、SPI1、SPTA1、TARM1、TMPRSS15、TRIM58、VSTM1、XKR3、ASPHD1、BRSK1、CCDC177、CNTN2、HAPLN2、KCNJ10、KIF1A、LGI3、NCAN、NR2E1、RHBDL3、TMEM151A、TMEM235、TMEM59L、ZNF488、FGL2、SCNN1B、ADPRHL1、ASB18、ATP1A3、CDH13、CORO6、FSD2、GALNT16、GJA3、MYOM2、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB5、PCDHGB6、PCDHGB7、PXDNL、RPL3L、SGCG、TNNT1、ASTN1、DGK1、BBOX1、BCRP3、CA12、COL4A3、CXCL14、CYS1、EVC、FIGNL2、GALNT14、GLIS2、HAVCR1、LOC100130238、PAQR5、PAX2、PAX8、PLA2G15、SLC22A2、SLC9A3、SULT1C2、TSPAN33、ABCC2、ABCG5、ABCG8、AHSG、AKR1C4、AMDHD1、APOH、ASGR1、ASGR2、C3P1、C8A、C8B、C9、CA5A、CFHR4、CPN2、CREB3L3、CYP2B6、CYP2C9、CYP2E1、CYP3A4、DHODH、F12、F2、F7、GC、HAL、HPD、HPX、INHBC、ITIH1、ITIH2、ITIH3、KNG1、LBP、PGLYRP2、PLG、PROC、PRODH2、SERPINA6、SERPINC1、SLC13A5、SLC22A1、SLC25A47、SLC27A5、SULT2A1、TFR2、TMPRSS6、UROC1、ANXA3、BMP5、CYP4Z2P、DRAM1、FMO2、GNA15、IDO1、KCNS3、LIMCH1、MBIP、PAPSS2、PCDH17、RSPH4A、RTKN2、TRPC6、ACAP1、AKNA、ARHGAP9、BCL11B、BIRC3、CARD11、CD180、CD37、CD3E、CD3G、CD40、CETP、CIITA、CLEC2D、CNR2、CXCR5、DOCK10、ETS1、GPR132、GPR18、ICAM2、ICOS、ITGB7、ITK、KIAA1551、KLHL6、LCK、LINC00426、LY86、MDS2、MEOX2、MX2、NAPSB、PATL2、PCED1B-AS1、PIK3CD、PLVAP、POU2F2、SCIMP、SCML4、SLFN12L、SMAP2、SP110、SPIB、TLR10、TMC8、TMEM156、TNFAIP8、TNFRSF9、TNFSF11、TRAF1、TRIM22、UCP2、ZC3H12D、ABCA10、ACSS3、ADAMTS5、AQP11、C7、CDH3、CDON、CLDN11、COL14A1、COLEC11、ESR2、FAM198B、FZD3、GALNT10、GLI2、GSTM5、HS3ST1、LEMD1-AS1、LHX9、LRRC17、MCHR1、MRC2、NTF3、OMD、PDGFRA、PGR、PKNOX2、PTCH2、RWDD4、SCD5、SERPINE2、SIMC1、SLC25A17、SNCAIP、SULF2、TENM4、TSPAN5、TTC8、UBXN8、ALDH1L2、ANKEF1、ASNS、B3GALNT2、BCAT1、CASP9、CCDC110、CELA2B、CELA3B、CFTR、CHMP4C、CLDN1、CNIH3、COCH、CUZD1、DEFB1、EGF、EIF4EBP1、ERP27、FAM24B-CUZD1、FBXW12、GUCA1C、KCTD16、KIAA1324、LINC00339、LNX2、MKNK1、NAA16、NPHS1、PAIP2B、PM20D1、PRSS3、SCGN、SEL1L、SERPINI2、SH3YL1、SLC33A1、SLC4A4、TC2N、TDH、TMEM51-AS1、TRHDE、UMOD、ADAM12、ATG9B、ATP6V1C2、BCAR4、BMP1、BPGM、CSF3R、CYP11A1、CYP19A1、DACT2、DEPDC1B、DLX5、EBI3、GCM1、GPR78、GSTA3、IGF2BP3、IGSF5、ISM2、KISS1、KRT23、LIN28B、MMP11、PGF、PSG11、PSG2、PSG3、PSG6、PSG7、PSG8、SPTLC3、TPRXL、ZFAT、ZNF554、ABCC4、ACPP、ALOX15B、ANO7、AP1B1P1、ARG2、BEND4、C6orf132、C6orf52、CANT1、CASZ1、CBFA2T2、CHRM1、CHRNA2、COL26A1、EVX1、EYA2、FAM135A、HMGN2P46、KLK2、KLKP1、MME、MPPED2、MUC12、NANS、NCAPD3、NEFH、NIPAL3、OACYLP、OR51E2、PAK1IP1、PDE9A、PI15、PMEPA1、POTEF、RDH11、SCNN1G、SIM2、SLC14A1、SLC22A3、SLC2A12、SLC30A4、SLC35F2、SLC37A1、SLC39A6、SPDEF、STEAP2、THSD4、TMEM79、TPM3P9、TXNDC16、URB1、VIPR1、ZNF350、ZNF532、ZNF613、ZNF649、ZNF761、ZNF827、GADL1、GIPC3、PTGES3L、WSCD2、CCDC27、DMRT1、DNAJC5G、FBXO24、IGLL1、MOV10L1、SEPT14、THEG、またはTTC16を含む、異なって表現され、異なって発現される遺伝子の中に含まれる、項目1に記載の方法。
(項目33)
前記無細胞流体サンプル中の複数のDNAフラグメントの起源組織を決定することをさらに含む、項目1に記載の方法。
(項目34)
(a)ヒト対象から得た無細胞流体サンプル中のDNAのヒドロキシメチル化プロファイルを作成すること;
(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較することであって、各参照ヒドロキシメチル化プロファイルは、(i)組織特異的遺伝子に関連する参照遺伝子座、および(ii)特定の組織または器官の状態に関連すること;および
(c)前記参照ヒドロキシメチル化プロファイルと比較した、前記対象について作成されたヒドロキシメチル化プロファイル基づいて、前記対象における特定の組織または器官の状態を識別すること
を含む、前記ヒト対象における組織または器官の状態を検出するための方法。
(項目35)
前記参照セットが、複数の組織特異的遺伝子のそれぞれにおける少なくとも1つの参照遺伝子座を含む、項目34に記載の方法。
(項目36)
検出された状態に基づいて、診断、処置の判断、または予後を行うことをさらに含む、項目35に記載の方法。
(項目37)
(a)ヒト対象から得た無細胞流体サンプル中のDNAフラグメントの1またはそれを超える遺伝子座における初期ヒドロキシメチル化プロファイルを作成することであって、前記ヒドロキシメチル化プロファイルは、組織または器官の初期状態に関連すること;
(b)その後の時点において、前記対象から得た無細胞流体サンプル中の前記と同一の1またはそれを超える遺伝子座における、その後のヒドロキシメチル化プロファイルを作成すること;および
(c)前記その後のヒドロキシメチル化プロファイルを前記初期ヒドロキシメチル化プロファイルと比較して、組織または器官の状態の変化を検出すること
を含む、前記ヒト対象における組織または器官の状態の変化を検出するための方法。
(項目38)
前記組織または器官に関連する状態、疾患、または障害の進行をモニタリングするために、ステップ(b)を、さらに1またはそれを超える回数繰り返すことを含む、項目37に記載の方法。
(項目39)
治療的介入の有効性をアセスメントすることを含む、項目38に記載の方法。
(項目40)
経時的に遺伝子発現の変化をモニタリングすることを含む、項目38に記載の方法。
(項目41)
検出された状態の変化に基づいて、診断、処置の判断、または予後を行うことをさらに含む、項目40に記載の方法。
(項目42)
ヒト血漿から得た無細胞DNAサンプルを分析するための改良された方法であって、前記サンプル中の無細胞DNAフラグメントが、単離、増幅、およびシーケンシングされ、前記改良が、
(a)前記無細胞サンプル中のDNAフラグメントのヒドロキシメチル化プロファイルを作成すること;および
(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照セット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較することであって、各参照ヒドロキシメチル化プロファイルは組織特異的遺伝子に対応する参照遺伝子座に関連し、前記参照ヒドロキシメチル化プロファイルは少なくとも1つの末梢血単核球(PBMC)ヒドロキシメチル化プロファイルを含むこと;および
(c)前記比較から、PBMCを起源とするゲノム材料の存在を識別すること
によって、PBMCを起源とするゲノム材料の存在を識別することを含む、改良された方法。
(項目43)
(b)および(c)から、PBMCゲノムコンタミネーションのレベルを推定することをさらに含む、項目42の改良された方法。
(項目44)
前記PBMCゲノムコンタミネーションのレベルに基づいて、前記サンプルが無細胞DNA分析に適しているか否かについて判定することをさらに含む、項目43の改良された方法。
(項目45)
前記参照セットが、それぞれがPBMCサブタイプに関連する遺伝子座に対応する、複数の参照ヒドロキシメチル化プロファイルのベクトルを含む、項目42の改良された方法。(項目46)
前記無細胞サンプル中のPBMCコンタミネーションをオフセットするために、前記ベクトルを使用することをさらに含む、項目45の改良された方法。
(項目47)
前記無細胞サンプル中のPBMCコンタミネーションのオフセットが、修正ベクトルを使用して、変異負荷、フラグメントカウント、バリアントアレル頻度、およびマイナーアレル頻度のうちの少なくとも1つをキャリブレーションおよび正規化することを含む、項目46の改良された方法。
(項目48)
起源組織を、ヒト対象から得たサンプル中の無細胞DNAに確率論的に割り当てるための方法であって、
(a)
(i)前記無細胞DNA中の5-ヒドロキシメチルシトシン残基のみにアフィニティータグを付加すること;
(ii)支持体に結合させることによって、アフィニティータグでタグづけされたDNA分子を富化すること;
(iii)前記富化されたDNA分子をシーケンシングし、各5-ヒドロキシメチルシトシン部位が識別されたマップを提供すること
によって、前記サンプル中のDNAのヒドロキシメチル化プロファイルを作成すること;
(b)(a)において作成された前記ヒドロキシメチル化プロファイルを、参照データセット中の複数の参照ヒドロキシメチル化プロファイルのそれぞれと比較することであって、各参照ヒドロキシメチル化プロファイルは、組織特異的遺伝子に関連するヒドロキシメチル化可変ゲノム領域中の参照遺伝子座に関連すること;
(c)前記作成されたヒドロキシメチル化プロファイルと実質的に類似する参照ヒドロキシメチル化プロファイルを有する前記参照データセット中の少なくとも1つの参照遺伝子座を識別すること;および
(d)少なくとも1つの起源組織を、(c)において識別された少なくとも1つの参照遺伝子座および前記対応する組織特異的遺伝子に基づいて、シーケンシングされた各DNA分子に割り当てること
を含む、方法。
(項目49)
前記参照セットが、複数の組織特異的遺伝子のそれぞれに関連する少なくとも1つの参照遺伝子座を含む、項目48に記載の方法。
(項目50)
前記アフィニティータグが、ビオチンである、項目48または項目49に記載の方法。
(項目51)
前記DNAの末端にアダプター配列を付加すること;前記アダプター結合DNAを、DNAβーグルコシルトランスフェラーゼ、および化学選択的基で修飾されたUDPグルコースとインキュベートし、それによって前記DNA中のヒドロキシメチル化DNA分子を、前記化学選択的基で共有結合により標識すること;付加環化反応によって、ビオチン部分を前記化学選択的に修飾されたDNAに結合すること;ビオチン結合支持体によって前記ビオチン化DNA分子を富化すること;前記アダプターに結合するプライマーを用いて、前記富化されたDNAを増幅すること;および前記増幅されたDNAをシーケンシングし、複数の配列読み取りデータを得ること、を含む、項目50に記載の方法。
(項目52)
(a)(ii)の前に、さらに、前記サンプルから、非修飾DNAおよび非修飾5-メチルシトシン残基を含むDNAを残して、前記タグづけされた5-ヒドロキシメチルシトシン含有DNAを除去する、項目51に記載の方法。
(項目53)
前記非修飾5-メチルシトシン残基を含むDNAのメチル化状態を確認することをさらに含む、項目52に記載の方法。
(項目54)
ヒト対象が、組織または器官の異常な状態を生じやすいか否かを判定するための方法であって、
(a)前記ヒト対象から得た無細胞流体サンプル中のDNAフラグメントの1またはそれを超える遺伝子座におけるヒドロキシメチル化プロファイルを作成すること;
(b)前記検出されたヒドロキシメチル化プロファイルを、それぞれ(i)組織特異的遺伝子上の参照遺伝子座、および(ii)前記特定の組織または器官の異常な状態の生じやすさを示す前記組織の状態に関連する、参照セット中の複数の参照ヒドロキシメチル化プロファイルと比較すること;および
(c)(b)における比較から、前記組織の異常な状態の生じやすさを識別すること
を含む、方法。
(項目55)
ヒト対象から得た無細胞DNAのサンプル中の、異なる起源組織に関連する核酸を鑑別するための方法であって、
(a)前記無細胞DNAサンプル中の、複数の核酸のそれぞれのヒドロキシメチル化プロファイルを作成すること;
(b)各ヒドロキシメチル化プロファイルを、それぞれが組織特異的遺伝子上の特定の参照遺伝子座に関連する、参照セット中の複数の参照ヒドロキシメチル化プロファイルと比較すること;および
(c)(b)における比較に基づいて、異なる組織を起源とする核酸を鑑別すること
を含む、方法。
(項目56)
前記参照セットが、セット3A、セット3B、セット3C、セット3D、セット3E、セット3F、セット3G、セット3H、セット3I、セット3J、セット3K、セット3L、セット3M、セット3N、セット3O、セット3P、セット3Q、セット3R、およびセット3Sから選択される、2またはそれを超える参照セットを含む、項目55の方法。
【外国語明細書】