(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-18
(45)【発行日】2023-08-28
(54)【発明の名称】妊娠高血圧腎症に特異的な循環RNAシグネチャー
(51)【国際特許分類】
C12Q 1/6883 20180101AFI20230821BHJP
C12Q 1/6837 20180101ALI20230821BHJP
C12Q 1/6851 20180101ALI20230821BHJP
C12Q 1/686 20180101ALI20230821BHJP
【FI】
C12Q1/6883 Z
C12Q1/6837 Z
C12Q1/6851 Z
C12Q1/686 Z
(21)【出願番号】P 2019566953
(86)(22)【出願日】2019-05-24
(86)【国際出願番号】 US2019033964
(87)【国際公開番号】W WO2019227015
(87)【国際公開日】2019-11-28
【審査請求日】2019-12-24
(32)【優先日】2018-05-25
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-05-15
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】サラ・イー・シュルツァベルガー
(72)【発明者】
【氏名】フィオナ・ケイパー
(72)【発明者】
【氏名】サラ・キニングス
(72)【発明者】
【氏名】スザンヌ・ローバック
(72)【発明者】
【氏名】カルロ・ランディーズ-ヒンチリフ
【審査官】斉藤 貴子
(56)【参考文献】
【文献】特表2008-524993(JP,A)
【文献】特表2006-515517(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-1/70
CAplus/MEDLINE/EMBASE/BIOSIS/WPIDS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
妊婦の妊娠高血圧腎症を検出し、及び/又は妊娠高血圧腎症のリスクの増加を決定する方法であって、
前記妊婦から採取された生体試料中で、複数の循環RNA(C-RNA)分子を同定する工程を含み;
ここで、複数のC-RNA分子が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか70個以上、又は75個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか75個以上、いずれか100個以上、又はいずれか122個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全てから選択されるタンパク質をコードする複数のC-RNA分子;又は
(i)CLEC4C、ARHGEF25、ADAMTS2、ARRDC2、SKIL、VSIG4、ARRDC4、及びNESのうちのいずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、または8つ全てから選択されるタンパク質をコードする複数のC-RNA分子
から選択され、
前記複数のC-RNA分子が、前記妊婦の妊娠高血圧腎症及び/又は妊娠高血圧腎症のリスクの増加を示す、方法。
【請求項2】
妊婦の妊娠高血圧腎症を検出し、及び/又は妊娠高血圧腎症のリスクの増加を決定する方法であって、
前記妊婦から得られた生体試料から循環RNA(C-RNA)分子の集団を精製する工程と;
C-RNA分子の前記精製された集団内の前記C-RNA分子によってコードされるタンパク質コード配列を同定する工程を含み;
ここで、前記C-RNA分子によってコードされる前記タンパク質コード配列が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか70個以上、又は75個全て;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全て;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか75個以上、いずれか100個以上、又はいずれか122個全て;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全て;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全て;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全て;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て;又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全て;又は
(i)CLEC4C、ARHGEF25、ADAMTS2、ARRDC2、SKIL、VSIG4、ARRDC4、及びNESのうちのいずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、または8つ全てから選択されるタンパク質をコードする複数のC-RNA分子
から選択されるタンパク質をコードし、
前記C-RNA分子によってコードされるタンパク質コード配列が、前記妊婦の妊娠高血圧腎症及び/又は妊娠高血圧腎症のリスクの増加を示す、方法。
【請求項3】
前記生体試料内のC-RNA分子によってコードされるタンパク質コード配列を同定する工程が、ハイブリダイゼーション、逆転写PCR、マイクロアレイチップ分析、又はシーケンシングを含む、請求項1に記載の方法。
【請求項4】
前記生体試料内の前記C-RNA分子によってコードされるタンパク質コード配列を同定する工程が、シーケンシングを含む、請求項1に記載の方法。
【請求項5】
シーケンシングが、クローン増幅された分子の超並列シーケンシングを含む、請求項4に記載の方法。
【請求項6】
シーケンシングが、RNAシーケンシングを含む、請求項4又は5に記載の方法。
【請求項7】
前記循環RNA(C-RNA)分子によってコードされるタンパク質コード配列を同定する前に、
前記生体試料から無傷の細胞を除去する工程;
前記生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程;
前記生体試料中のC-RNA分子から相補的DNA(cDNA)を合成する工程;及び/又は
エクソームエンリッチメントによって、タンパク質をコードするDNA配列について前記cDNA配列をエンリッチする工程
をさらに含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
妊婦の妊娠高血圧腎症を検出し、及び/又は妊娠高血圧腎症のリスクの増加を決定する方法であって、
前記妊婦から得られた生体試料から無傷の細胞を除去する工程と;
前記生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程と;
前記生体試料中のRNA分子から相補的DNA(cDNA)を合成する工程と;
タンパク質をコードするDNA配列について前記cDNA配列をエンリッチする工程(エクソームエンリッチメント)と;
前記得られたエンリッチされたcDNA配列をシーケンシングする工程と;
エンリッチされたC-RNA分子によってコードされるタンパク質コード配列を同定する工程と
を含み;
前記C-RNA分子によってコードされるタンパク質コード配列が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか70個以上、又は75個全て;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全て;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか75個以上、いずれか100個以上、又はいずれか122個全て;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全て;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全て;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全て;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て;又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全て;又は
(i)CLEC4C、ARHGEF25、ADAMTS2、ARRDC2、SKIL、VSIG4、ARRDC4、及びNESのうちのいずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、または8つ全てから選択されるタンパク質をコードする複数のC-RNA分子
から選択されるタンパク質をコードし、
前記C-RNA分子によってコードされるタンパク質コード配列が、前記妊婦の妊娠高血圧腎症及び/又は妊娠高血圧腎症のリスクの増加を示す、方法。
【請求項9】
妊婦から得られた生体試料から無傷の細胞を除去する工程と;
前記生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程と;
前記生体試料中のRNA分子から相補的DNA(cDNA)を合成する工程と;
タンパク質をコードするDNA配列について前記cDNA配列をエンリッチする工程(エクソームエンリッチメント)と;
前記得られたエンリッチされたcDNA配列をシーケンシングする工程と;
前記エンリッチされたC-RNA分子によってコードされるタンパク質コード配列を同定する工程と
を含む方法であって;
ここで、前記C-RNA分子によってコードされるタンパク質コード配列が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか70個以上、又は75個全て;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全て;
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか75個以上、いずれか100個以上、又はいずれか122個全て;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全て;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全て;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全て;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て;又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全て;又は
(i)CLEC4C、ARHGEF25、ADAMTS2、ARRDC2、SKIL、VSIG4、ARRDC4、及びNESのうちのいずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、または8つ全てから選択されるタンパク質をコードする複数のC-RNA分子
から選択されるタンパク質を含む、方法。
【請求項10】
前記生体試料が血漿を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記生体試料が、妊娠16週未満又は妊娠20週未満の妊婦から採取される、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記生体試料が、妊娠20週を超える妊婦から採取される、請求項1~10のいずれか一項に記載の方法。
【請求項13】
試料が血液試料であり、前記血液試料は、前記血液試料を血漿へと処理する前に、細胞及びDNA安定化特性を有する管中に、採取され、輸送され、及び/又は貯蔵されている、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記管が、Streck Cell-Free DNA BCT(登録商標)採血管を含む、請求項
13に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
継続出願データ
本出願は、2018年5月25日に出願された米国仮特許出願第62/676,436号、及び2019年5月15日に出願された米国仮特許出願第62/848,219号の利益を主張するものであり、これらの仮特許出願はそれぞれ、全体が参照により本明細書に援用される。
【0002】
本発明は、一般に、妊娠合併症である妊娠高血圧腎症の検出及び早期のリスク評価に使用するための方法及び材料に関する。
【背景技術】
【0003】
妊娠高血圧腎症は、妊娠中のみに発生する疾患であり、全妊娠のうち5%~8%に発症する。妊娠高血圧腎症は、母体死亡の10%~15%及び胎児死亡の40%の直接の原因である。妊娠高血圧腎症の3つの主な症状としては、高血圧、手足の浮腫み、及び尿中の過剰なタンパク質(タンパク尿)が挙げられ、これらは、妊娠20週以降に発生する。妊娠高血圧腎症の他の兆候及び症状としては、激しい頭痛、視力変化(一時的な視力低下、目のかすみ又は光に対する過敏症を含む)、吐き気又は嘔吐、尿量の減少、血小板値の減少(血小板減少症)、肝機能障害、及び肺内部の液体に起因する息切れが挙げられる。
【0004】
妊娠高血圧腎症が重症であるほど、及びそれが妊娠中の早期に発生するほど、母体及び赤ん坊のリスクが高くなる。妊娠高血圧腎症は、誘発分娩又は帝王切開による分娩を必要とし得る。治療せずに放置すると、妊娠高血圧腎症は、母体及び赤ん坊の両方に、深刻な、命にさえ関わる合併症を引き起こし得る。妊娠高血圧腎症の合併症としては、胎児発育不全、低い出生時体重、早産、胎盤早期剥離、HELLP症候群(溶血、肝酵素の上昇、及び低血小板数症候群)、子癇(発作を引き起こす、妊娠高血圧腎症の重症型)、臓器障害(腎臓、肝臓、肺、心臓、又は眼の障害を含む)、脳卒中又は他の脳損傷が挙げられる。例えば、mayoclinic.org/diseases-conditions/preeclampsia/symptoms-causes/syc-20355745においてインターネット上で入手可能な(非特許文献1)を参照されたい。
【0005】
早期の検出及び治療により、大部分の女性は、妊娠高血圧腎症が早期に検出され、定期的な妊婦検診で処置される場合、健常児を産むことができる。様々なタンパク質バイオマーカーが、発症前の段階で、母体血清中で変化したレベルを示すが、これらのバイオマーカーには、個々の患者において区別して予測する能力はない(非特許文献2)。したがって、妊娠高血圧腎症の早期検出のためのバイオマーカーの同定は、妊娠高血圧腎症の早期の診断及び治療にとって重要である。
【先行技術文献】
【非特許文献】
【0006】
【文献】“Preeclampsia-Symptoms and causes-Mayo Clinic,”April 3,2018
【文献】Karumanchi and Granger,2016,Hypertension;67(2):238-242
【発明の概要】
【課題を解決するための手段】
【0007】
本発明は、妊婦の妊娠高血圧腎症を検出し、及び/又は妊娠高血圧腎症のリスクの増加を決定する方法であって、
妊婦から採取された生体試料中で、複数の循環RNA(C-RNA)分子を同定する工程を含み;
ここで、複数のC-RNA分子が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、最大で75個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、最大で122個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て(いくつかの実施形態において、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、及びVSIG4の7つ;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、及びVSIG4の10個;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、及びSKILの6つ;又はADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、及びSKILの8つを含む)から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子;又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全てから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子
から選択され、
妊婦の妊娠高血圧腎症及び/又は妊娠高血圧腎症のリスクの増加を示す、方法を含む。
【0008】
本発明は、妊婦の妊娠高血圧腎症を検出し、及び/又は妊娠高血圧腎症のリスクの増加を決定する方法であって、
妊婦から生体試料を採取する工程と;
生体試料から循環RNA(C-RNA)分子の集団を精製する工程と;
C-RNA分子の精製された集団内のC-RNA分子によってコードされるタンパク質コード配列を同定する工程を含み;
タンパク質の少なくとも一部をコードするC-RNA分子によってコードされるタンパク質コード配列が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか70個以上、又は75個全て;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全て;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか75個以上、いずれか100個以上、又はいずれか122個全て;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全て;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全て;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全て;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て(いくつかの実施形態において、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、及びVSIG4の7つ;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、及びVSIG4の10個;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、及びSKILの6つ;又はADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、及びSKILの8つを含む);又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全て
から選択され、
妊婦の妊娠高血圧腎症及び/又は妊娠高血圧腎症のリスクの増加を示す、方法を含む。
【0009】
いくつかの態様において、生体試料内のC-RNA分子によってコードされるタンパク質コード配列を同定する工程は、ハイブリダイゼーション、逆転写PCR、マイクロアレイチップ分析、又はシーケンシングを含む。
【0010】
いくつかの態様において、生体試料内のC-RNA分子によってコードされるタンパク質コード配列を同定する工程は、例えば、クローン増幅された分子の超並列シーケンシング及び/又はRNAシーケンシングを含むシーケンシングを含む。
【0011】
いくつかの態様において、本方法は、循環RNA(C-RNA)分子によってコードされるタンパク質コード配列を同定する前に、生体試料から無傷の細胞を除去する工程;生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程;生体試料中のC-RNA分子から相補的DNA(cDNA)を合成する工程;及び/又はエクソームエンリッチメントによって、タンパク質をコードするDNA配列についてcDNA配列をエンリッチする工程をさらに含む。
【0012】
本発明は、妊婦の妊娠高血圧腎症を検出し、及び/又は妊娠高血圧腎症のリスクの増加を決定する方法であって、
妊婦から生体試料を採取する工程と;
生体試料から無傷の細胞を除去する工程と;
生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程と;
生体試料中のRNA分子から相補的DNA(cDNA)を合成する工程と;
タンパク質をコードするDNA配列についてcDNA配列をエンリッチする工程(エクソームエンリッチメント)と;
得られたエンリッチされたcDNA配列をシーケンシングする工程と;
エンリッチされたC-RNA分子によってコードされるタンパク質コード配列を同定する工程と
を含み;
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、最大で75個全て;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全て;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、最大で122個全て;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全て;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全て;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全て;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て(いくつかの実施形態において、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、及びVSIG4の7つ;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、及びVSIG4の10個;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、及びSKILの6つ;又はADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、及びSKILの8つを含む);又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全て
から選択されるタンパク質の少なくとも一部をコードするC-RNA分子によってコードされるタンパク質コード配列が、妊婦の妊娠高血圧腎症及び/又は妊娠高血圧腎症のリスクの増加を示す、方法を含む。
【0013】
本発明は、妊娠高血圧腎症のリスクの増加に関連する循環RNAシグネチャーを同定する方法であって、妊婦から生体試料を採取する工程と;生体試料から無傷の細胞を除去する工程と;生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程と;生体試料中のRNA分子から相補的DNA(cDNA)を合成する工程と;タンパク質をコードするDNA配列についてcDNA配列をエンリッチする工程(エクソームエンリッチメント)と;得られたエンリッチされたcDNA配列をシーケンシングする工程と;エンリッチされたC-RNA分子によってコードされるタンパク質コード配列を同定する工程とを含む、方法を含む。
【0014】
本発明は、
妊婦から生体試料を採取する工程と;
生体試料から無傷の細胞を除去する工程と;
生体試料を、デオキシヌクレアーゼ(DNase)で処理して、セルフリーDNA(cfDNA)を除去する工程と;
生体試料中のRNA分子から相補的DNA(cDNA)を合成する工程と;
タンパク質をコードするDNA配列についてcDNA配列をエンリッチする工程(エクソームエンリッチメント)と;
得られたエンリッチされたcDNA配列をシーケンシングする工程と;
エンリッチされたC-RNA分子によってコードされるタンパク質コード配列を同定する工程と
を含む方法であって;
ここで、タンパク質コード配列が、
(a)ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個、最大で75個全て;又は
(b)TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全て;又は
(c)CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、最大で122個全て;又は
(d)VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全て;又は
(e)ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全て;又は
(f)ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全て;又は
(g)CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て(いくつかの実施形態において、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、及びVSIG4の7つ;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、及びVSIG4の10個;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、及びSKILの6つ;又はADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、及びSKILの8つを含む);又は
(h)LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全て
から選択されるタンパク質の少なくとも一部を含む、方法を含む。
【0015】
いくつかの態様において、生体試料は血漿を含む。
【0016】
いくつかの態様において、生体試料は、妊娠16週未満又は妊娠20週未満の妊婦から採取される。
【0017】
いくつかの態様において、生体試料は、妊娠20週を超える妊婦から採取される。
【0018】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか50個以上、いずれか70個以上、最大で75個全ての少なくとも一部をコードするC-RNAシグネチャーを含む。
【0019】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、又は27個全ての少なくとも一部をコードするC-RNAシグネチャーを含む。
【0020】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、複数のCYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5の少なくとも一部をコードするC-RNAシグネチャーを含む。
【0021】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、いずれか26個以上、いずれか27個以上、いずれか28個以上、いずれか29個以上、又は30個全ての少なくとも一部をコードするC-RNAシグネチャーを含む。
【0022】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、いずれか24個以上、いずれか25個以上、又は26個全ての少なくとも一部をコードするC-RNAシグネチャーを含む。
【0023】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、又は22個全ての少なくとも一部をコードするC-RNAシグネチャーを含む。
【0024】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESのうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、又は11個全て(いくつかの実施形態において、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、及びVSIG4の7つ;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、及びVSIG4の8つ;ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、及びVSIG4の10個;ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、及びSKILの6つ;又はADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、及びSKILの8つを含む)の少なくとも一部をコードするC-RNAシグネチャーを含む。
【0025】
本発明は、妊娠高血圧腎症のリスクの増加についての循環RNA(C-RNA)シグネチャーであって、LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1のうちのいずれか1つ以上、いずれか2つ以上、いずれか3つ以上、いずれか4つ以上、いずれか5つ以上、いずれか6つ以上、いずれか7つ以上、いずれか8つ以上、いずれか9つ以上、いずれか10個以上、いずれか11個以上、いずれか12個以上、いずれか13個以上、いずれか14個以上、いずれか15個以上、いずれか16個以上、いずれか17個以上、いずれか18個以上、いずれか19個以上、いずれか20個以上、いずれか21個以上、いずれか22個以上、いずれか23個以上、又は24個全ての少なくとも一部をコードするC-RNAシグネチャーを含む。
【0026】
本発明は、本明細書に記載されるC-RNAシグネチャーに結合し、及び/又はそれを同定することが可能な複数の薬剤を含む固体担体アレイを含む。
【0027】
本発明は、本明細書に記載されるC-RNAシグネチャーに結合し、及び/又はそれを同定することが可能な複数のプローブを含むキットを含む。
【0028】
本発明は、本明細書に記載されるC-RNAシグネチャーを選択的に増幅するための複数のプライマーを含むキットを含む。
【0029】
本明細書で使用される場合、用語「核酸」は、当技術分野におけるその使用と一致することが意図され、天然に存在する核酸又はその機能的類似体を含む。特に有用な機能的類似体は、配列特異的な様式で核酸にハイブリダイズすることができ、又は特定のヌクレオチド配列の複製のための鋳型として使用することができる。天然に存在する核酸は、一般に、ホスホジエステル結合を含有する骨格を有する。類似体構造は、当技術分野で既知の種々の任意のものを含む、代替の骨格結合を有し得る。天然に存在する核酸は、一般に、デオキシリボース糖(例えば、デオキシリボ核酸(DNA)中に見出される)又はリボース糖(例えば、リボ核酸(RNA)中に見出される)を有する。核酸は、当技術分野で既知のこれらの糖部分の様々な類似体のいずれかを含むことができる。核酸は、天然又は非天然塩基を含むことができる。この点に関して、天然デオキシリボ核酸は、アデニン、チミン、シトシン又はグアニンからなる群から選択される1つ以上の塩基を有することができ、リボ核酸は、ウラシル、アデニン、シトシン又はグアニンからなる群から選択される1つ以上の塩基を有することができる。核酸に含まれ得る有用な非天然塩基は、当技術分野で既知である。用語「鋳型」及び「標的」は、核酸に関して使用される場合、本明細書に記載される方法又は組成物の文脈における核酸の意味識別子として意図され、さもなければ明示的に示されるものを超えて核酸の構造又は機能を必ずしも限定しない。
【0030】
本明細書で使用される場合、「増幅する」、「増幅」又は「増幅反応」及びそれらの派生語は、一般に、核酸分子の少なくとも一部が、少なくとも1つの追加の核酸分子に複製又はコピーされる、任意の作用又はプロセスを指す。追加の核酸分子は、場合により、標的核酸分子の少なくともいくつかの部分と実質的に同一又は実質的に相補的である配列を含む。標的核酸分子は、一本鎖又は二本鎖であり得、追加の核酸分子は、独立して、一本鎖又は二本鎖であり得る。増幅は、場合により、核酸分子の線形又は指数関数的複製を含む。いくつかの実施形態では、そのような増幅は、等温条件を使用して行うことができ、別の実施形態では、そのような増幅は、熱サイクルを含むことができる。いくつかの実施形態では、増幅は、単一の増幅反応における複数の標的配列の同時増幅を含む多重増幅である。いくつかの実施形態では、「増幅」は、DNA及びRNAベースの核酸の少なくともいくつかの部分の単独又は組み合わせでの増幅を含む。増幅反応は、当業者に既知の増幅プロセスのいずれかを含むことができる。いくつかの実施形態では、増幅反応は、ポリメラーゼ連鎖反応(PCR)を含む。
【0031】
本明細書で使用される場合、「増幅条件」及びその派生語は、一般に、1つ以上の核酸配列を増幅するために適切な条件を指す。このような増幅は、線形又は指数関数的であり得る。いくつかの実施形態では、増幅条件は等温条件を含むことができ、或いは、熱サイクル条件、又は等温条件と熱サイクル条件の組み合わせを含むことができる。いくつかの実施形態では、1つ以上の核酸配列を増幅するために適切な条件は、ポリメラーゼ連鎖反応(PCR)条件を含む。典型的には、増幅条件は、1つ以上の標的配列のような核酸を増幅するのに、又は1つ以上のアダプター、例えばアダプター連結増幅標的配列に連結された増幅標的配列を増幅するのに十分な反応混合物を指す。一般に、増幅条件は、増幅又は核酸合成のための触媒、例えば、ポリメラーゼ;増幅される核酸に対してある程度の相補性を有するプライマー;及び核酸にハイブリダイズした後にプライマーの伸長を促進するためのヌクレオチド、例えばデオキシリボヌクレオチド三リン酸(dNTP)を含む。増幅条件は、核酸へのプライマーのハイブリダイゼーション又はアニーリング、プライマーの伸長、及び伸長されたプライマーが増幅を受ける核酸配列から分離される変性工程を必要とし得る。典型的には、増幅条件は熱サイクルを含むことができるが、必ずしもその必要はなく、いくつかの実施形態では、増幅条件はアニーリング、伸長、及び分離の工程が繰り返される複数のサイクルを含む。典型的には、増幅状態は、Mg++又はMn++などのカチオンを含み、イオン強度の様々な調整剤を含むこともできる。
【0032】
本明細書で使用される場合、用語「ポリメラーゼ連鎖反応」(PCR)は、K.B.Mullis米国特許第4,683,195号明細書及び同第4,683,202号明細書の方法を指し、これらは、クローニング又は精製なしにゲノムDNAの混合物中の目的のポリヌクレオチドのセグメントの濃度を増加させるための方法を記載する。目的のポリヌクレオチドを増幅するためのこのプロセスは、目的の所望のポリヌクレオチドを含むDNA混合物に大過剰の2つのオリゴヌクレオチドプライマーを導入し、続いてDNAポリメラーゼの存在下で一連の熱サイクルを行うことからなる。2つのプライマーは、目的の二本鎖ポリヌクレオチドの各々の鎖に相補的である。混合物は、最初に、より高い温度で変性され、次いでプライマーが、目的のポリヌクレオチド分子内の相補的配列にアニーリングされる。アニーリング後、プライマーをポリメラーゼで伸長させて、相補鎖の新しい対を形成する。変性、プライマーアニーリング及びポリメラーゼ伸長の工程は、目的の所望のポリヌクレオチドの増幅セグメントの高濃度を得るために、何度も繰り返され得る(サーモサイクリングと呼ばれる)。目的の所望のポリヌクレオチドの増幅セグメント(アンプリコン)の長さは、互いに対するプライマーの相対位置によって決定され、従って、この長さは、制御可能なパラメータである。このプロセスを繰り返すことにより、本方法は、「ポリメラーゼ連鎖反応」(以下、「PCR」)と呼ばれる。目的のポリヌクレオチドの所望の増幅セグメントは、混合物中の(濃度に関して)優勢な核酸配列になるので、それらは、「PCR増幅された」と言われる。上記の方法に対する改変において、標的核酸分子は、複数の異なるプライマー対、場合によっては、目的の標的核酸分子あたり1つ以上のプライマー対を使用してPCR増幅され得、それによって、多重PCR反応を形成する。
【0033】
本明細書で使用される場合、用語「プライマー」及びその派生語は、一般に、目的の標的配列にハイブリダイズし得る任意のポリヌクレオチドを指す。典型的には、プライマーは、ヌクレオチドがポリメラーゼによって重合され得る基質として機能するが、いくつかの実施形態では、プライマーは、合成された核酸鎖に組み込まれ、別のプライマーがハイブリダイズして合成核酸分子に相補的である新しい鎖をプライム合成し得る部位を提供し得る。プライマーは、ヌクレオチド又はその類似体の任意の組み合わせを含み得る。いくつかの実施形態では、プライマーは、一本鎖オリゴヌクレオチド又はポリヌクレオチドである。用語「ポリヌクレオチド」及び「オリゴヌクレオチド」は、本明細書では、任意の長さのヌクレオチドのポリマー形態を指すために互換的に使用され、リボヌクレオチド、デオキシリボヌクレオチド、それらの類似体、又はそれらの混合物を含み得る。この用語は、等価物として、DNA、又はヌクレオチド類似体から作製されたRNAのいずれかの類似体を含み、一本鎖(例えば、センス又はアンチセンス)及び二本鎖ポリヌクレオチドに適用可能であると理解されるべきである。本明細書で使用される用語はまた、例えば逆転写酵素の作用によってRNA鋳型から産生される相補的又はコピーDNAであるcDNAを包含する。この用語は、分子の一次構造のみを指す。従って、この用語は、三本鎖、二本鎖及び一本鎖デオキシリボ核酸(「DNA」)、並びに三本鎖、二本鎖及び一本鎖リボ核酸(「RNA」)を含む。
【0034】
本明細書で使用される場合、用語「ライブラリー」及び「配列決定ライブラリー」は、それらの5’末端で共通の配列及びそれらの3’末端で共通の配列を共有する、コレクション又は複数の鋳型分子を指す。3’及び5’末端に既知の共通配列を含む鋳型分子のコレクションは、3’及び5’修飾ライブラリーとも呼ばれる。
【0035】
本明細書で使用される「フローセル」という用語は、そこを横切って1つ以上の流体試薬を流すことができる固体表面を含むチャンバを指す。本開示の方法において容易に使用され得るフローセル並びに関連する流体システム及び検出プラットフォームの例は、例えば、Bentley et al.、Nature 456:53-59(2008)、国際公開第04/018497号パンフレット;米国特許第7,057,026号パンフレット;国際公開第91/06678号パンフレット;国際公開第07/123744号パンフレット;米国特許第7,329,492号明細書;米国特許第7,211,414号明細書;米国特許第7,315,019号明細書;米国特許第7,405,281号明細書;及び米国特許出願公開第2008/01082号明細書に記載されている。
【0036】
本明細書で使用される「アンプリコン」という用語は、核酸に関して使用される場合、核酸をコピーする生成物を意味し、この生成物は、核酸のヌクレオチド配列の少なくとも一部と同じか又は相補的であるヌクレオチド配列を有する。アンプリコンは、例えば、PCR、ローリングサークル増幅(RCA)、連結伸長、又は連結連鎖反応を含む、核酸又はそのアンプリコンを鋳型として使用する種々の増幅方法のいずれかによって産生され得る。アンプリコンは、特定のヌクレオチド配列の単一コピー(例えば、PCR産物)又はヌクレオチド配列の複数コピー(例えば、RCAのコンカテマー生成物)を有する核酸分子であり得る。標的核酸の第1のアンプリコンは、典型的には、相補的コピーである。後続のアンプリコンは、第1のアンプリコンの生成後に、標的核酸から、又は第1のアンプリコンから作製されるコピーである。後続のアンプリコンは、標的核酸に実質的に相補的であるか、又は標的核酸に実質的に同一である配列を有することができる。
【0037】
本明細書で使用される場合、用語「アレイ」は、相対的位置に従って互いに区別され得る部位の集団を指す。アレイの異なる部位にある異なる分子は、アレイ内の部位の位置に従って互いに区別することができる。アレイの個々の部位は、特定の型の1つ以上の分子を含み得る。例えば、部位は、特定の配列を有する単一の標的核酸分子を含み得るか、又は部位は、同じ配列(及び/又はその相補的配列)を有するいくつかの核酸分子を含み得る。アレイの部位は、同じ基質上に配置された異なるフィーチャとすることができる。例示的なフィーチャとしては、基質内のウェル、基質内若しくは基質上のビーズ(又は他の粒子)、基質からの突起、基質上のリッジ、又は基質内のチャネルが挙げられるが、これらに限定されない。アレイの部位は、各々が異なる分子を有する別個の基質であり得る。別個の基質に付着した異なる分子は、基質が関連した表面上の基質の位置に従って、又は液体若しくはゲル中の基質の位置に従って同定することができる。別個の基質が表面上に位置する例示的なアレイには、ウェル中にビーズを有するものが含まれるが、これに限定されない。
【0038】
本明細書における「次世代シーケンシング(NGS)」という用語は、クローン増幅された分子及び単一の核酸分子の超並列シーケンシングを可能にするシーケンシング方法を指す。NGSの非限定的な例としては、リバーシブルダイターミネーター(reversible dye terminator)を用いた合成によるシーケンシング(sequencing-by-synthesis)、及びライゲーションによるシーケンシング(sequencing-by-ligation)が挙げられる。
【0039】
本明細書で使用される「感度」という用語は、真陽性の数を真陽性及び偽陰性の合計で除算した値に等しい。
【0040】
本明細書で使用される「特異度」という用語は、真陰性の数を真陰性及び偽陽性の合計で除算した値に等しい。
【0041】
本明細書における「エンリッチする」という用語は、試料の一部に含まれる核酸を増幅する方法を指す。エンリッチメントとしては、特定の配列、例えば多型配列を標的にする特異的エンリッチメント、及び試料のDNA断片の全ゲノムを増幅する非特異的エンリッチメントが挙げられる。
【0042】
本明細書で使用される場合、用語「各々」は、項目の集合体に関連して使用される場合、集合体内の個々の項目を識別することを意図するが、文脈が別段に明確に指示しない限り、必ずしも集合体内の全ての項目を指すわけではない。
【0043】
本明細書で使用される場合、組成物、物品、核酸、又は核の文脈における「提供する」は、組成物、物品、核酸、若しくは核を作製すること、組成物、物品、核酸、若しくは核を購入すること、又はそれ以外で化合物、組成物、物品、物品、若しくは核を得ることを意味する。
【0044】
「及び/又は」という用語は、列挙された要素のうちの1つ若しくは全て、又は列挙された要素のうちの任意の2つ以上の組み合わせを意味する。
【0045】
「好ましい」及び「好ましくは」という単語は、特定の状況下で、特定の利益を与え得る本開示の実施形態を指す。しかしながら、同じ又は別の状況下で、別の実施形態も好ましい場合がある。さらに、1つ以上の好ましい実施形態の記載は、別の実施形態が有用ではないことを示唆しておらず、別の実施形態を本開示の範囲から除外することを意図していない。
【0046】
用語「含む」及びその変形は、これらの用語が明細書及び特許請求の範囲に現れる場合、限定的な意味を有さない。
【0047】
「含む」又は「含んでいる」などの言葉で本明細書に記載される実施形態は、どこでも、「からなる」及び/又は「本質的にからなる」という用語で記載される他の点で類似の実施形態も提供されることが理解される。
【0048】
別段の指定がない限り、「a」、「an」、「the」、及び「少なくとも1つ」は、互換的に使用され、1つ又は複数を意味する。
【0049】
また、本明細書において、終点による数値範囲の記載は、その範囲内に包含される全ての数を含む(例えば、1~5は、1、1.5、2、2.75、3、3.80、4、5などを含む)。
【0050】
本明細書全体を通して、「一実施形態」、「実施形態」、「特定の実施形態」、又は「いくつかの実施形態」などへの言及は、実施形態に関連して記載された特定の特徴、構成、組成、又は特性が本開示の少なくとも1つの実施形態に含まれることを意味する。従って、本明細書全体の様々な箇所におけるこのような語句の出現は、必ずしも本開示の同じ実施形態を参照しているわけではない。さらに、特定の特徴、構成、組成、又は特性は、1つ以上の実施形態において任意の適切な方法で組み合わせることができる。
【0051】
別個の工程を含む本明細書に開示される任意の方法について、工程は、任意の実現可能な順序で行ってもよい。また、必要に応じて、2つ以上の工程の任意の組み合わせを同時に行ってもよい。
【0052】
本開示の上記の発明の概要は、本開示の開示された各実施形態又は全ての実施を説明することを意図したものではない。以下の記載は、具体的な実施形態をより詳細に例示するものである。本出願全体のいくつかの場所において、例のリストによりガイダンスが提供され、これらの例は、様々な組み合わせで使用され得る。各場合において、列挙されたリストは、単に代表的なグループとしての役割を果たし、排他的なリストとして解釈されるべきではない。
【図面の簡単な説明】
【0053】
【
図1】胎盤の健康、母体応答、及び胎児応答の関係の概略図。
【
図3】C-RNAのためのライブラリー作製ワークフロー。
【
図4】妊娠後期の妊娠試料及び非妊娠試料を比較するC-RNA手法の検証。
【
図5】縦断的な(longitudinal)妊娠試料を用いたC-RNA手法の検証。
【
図8】全データセットに依存して、遺伝子の選択を伴わないPEの分類。
【
図10】ブートストラップ法を用いた妊娠高血圧腎症試料の分類。
【
図13】独立したコホートが、妊娠高血圧腎症シグネチャーのさらなる検証を可能にする。
【
図14】妊娠高血圧腎症の分類における標準的なadaboostモデルの性能。
【
図15】標準的なDEX TREAT分析を用いた妊娠高血圧腎症の分類。
【
図16】遺伝子の選択、及びジャックナイフ法を用いた妊娠高血圧腎症の分類。
【
図17】独立したPEARLバイオバンクコホートにおけるTREAT、ブートストラップ法、及びジャックナイフ法の検証。
【
図18】AdaBoost Refinedモデルを構築するためのバイオインフォマティクス手法の略図。
【
図19】AdaBoost Refinedモデルによって用いられる遺伝子の相対存在量及び独立したデータセットにおけるそれらの予測能力。
【
図20】標準的なTREAT分析及びジャックナイフ法を用いてNextera Flexで生成したライブラリーにおける、妊娠高血圧腎症に特異的なC-RNAシグネチャーの同定。
【
図21】Nextera Flexで生成したライブラリーにおいてAdaBoost Refinedモデルによって用いられる遺伝子の相対存在量及びRGH14データセットにおけるそれらの予測能力。
【
図22A-22D】臨床にやさしい(clinic-friendly)全エクソームC-RNA分析方法の検証。
図22Aは、シーケンシングライブラリー作製方法の概略図であり;採血後の全ての工程が、集中型の処理実験室において行われ得る。転写産物の経時変化が、妊娠期間を通じて改変された(
図22B)。C-RNA妊娠進行試験において同定される遺伝子の重複(
図22C)。妊娠期間試験に特有の91の遺伝子を発現する組織(
図22D)。
【
図23A-23C】PE臨床試験のための試料採取。パネルは、iPC試験(
図23A)及びPEARL試験(
図23B)における各個体についての採血の時間(三角形)及び出生時の妊娠期間(四角形)を示す。赤色の線は、正期産の閾値を示す。早産率は、早発型PEコホートにおいて有意に高い(
図23C)。フィッシャーの正確確率検定による
***p<0.001。
【
図24A-24G】C-RNAの差分解析により、妊娠高血圧腎症バイオマーカーが同定される。転写産物の倍率変化及び存在量が、PEにおいて改変された(
図24A)。片側信頼p値区間を、標準的な分析方法によって検出された各遺伝子についてジャックナイフ法の後に計算した(
図24B)。(21)遺伝子について全エクソームシーケンシング及びqPCRによって決定された転写産物存在量倍率変化(
図24C)。スチューデントT検定による
*p<0.05。疾患遺伝子の組織分布(
図24D)。iPC試料(平均連結、平方ユークリッド距離)の階層的クラスタリング(
図24E)。PEARL試験からの早発型PE(
図24F)及び遅発型PE(
図24G)試料のクラスタリング。
【
図25A-25E】AdaBoostは、コホートにわたる妊娠高血圧腎症試料を分類する。各コホートにおける機械学習によって使用される転写産物の相対存在量を示すヒートマップ(
図25A)。各ブロックの高さは、各遺伝子の重要度を反映している。各データセットについてのROC曲線(
図25B)。AdaBoostスコアの分布(KDE)。オレンジ色の線は、PE及び対照試料を区別するための最適境界を示す(
図25C)。差分解析によって同定される遺伝子と、AdaBoostにおいて使用されるものとの一致(
図25D)。AdaBoost遺伝子の組織分布(
図25E)。
【
図26A-26C】血液が異なる採血管中に貯蔵される場合のC-RNAデータ完全性。異なる管タイプにおいて一晩貯蔵された血液からの予め検出されたC-RNA妊娠マーカーの存在量を、EDTA管への採取後の即座の処理と比較する(
図26A)。異なる血液貯蔵期間後に同じ個体から調製されたC-RNAについての転写産物FPKM値を比較する散布図(
図26B)。ピアソンの相関係数Rは、EDTA管を用いた場合により可変である(cf、セルフリー)(
図26C)。
【
図27A-27B】C-RNAデータ品質に対する血漿体積の影響。プロトコルのための適切な血漿インプットを決定するために、9つの独立した試験からのデータを用いて、メタ分析を行った。ノイズ(生物学的変動係数、EdgeR)を、各試験内の生物学的複製から計算した(
図27A)。ライブラリー複雑性(境界集団、Preseq)を、各試料について計算した(
図27B)。試験を阻止変数として用いた、テューキーのHSD補正を用いたANOVAによる
**p<0.01、
***p<0.001。
【
図28A-28C】妊娠マーカー組織特異度。改変された遺伝子一式(
図28A)、各試験に特有の転写産物(
図28B)、又は交差遺伝子セット(
図28C)のいずれかを用いた、3つの独立した試験によって妊娠中に検出される遺伝子の組織特異度を示す円グラフ。
【
図29A-29E】ジャックナイフ法は、妊娠高血圧腎症において広く改変されていない遺伝子を除外する。いかに一貫して転写産物がPE試料にわたって改変されたかを決定するのに使用されるジャックナイフ法の概略図(
図29A)。各差次的に豊富な遺伝子についての平均存在量及びノイズ(
図29B)。影響された各転写産物の曲線下のROC面積値は、いかに分離したC-RNA転写産物存在量分布が対照及びPE試料について存在するかの指標を示す(
図29C)。マン・ホイットニーのU検定による
*p<0.05。ジャックナイフ法の後に除外された遺伝子を用いたiPC試料の階層的クラスタリング(
図29D)。除外された転写産物の組織分布(
図29E)。胎児及び胎盤の寄与の減少は、PEの母体構成要素が、個体間で最も可変であることを示唆し得る。
【
図30A-30D】AdaBoostモデル開発戦略。RGH014データセットを、6つのピースに分けた(
図30A)。「ホールドアウトサブセット」は、10%の試料(ランダムに選択された)並びに差次的に豊富な遺伝子を用いた場合に不正確にクラスタリンスされた3つの試料(
図24Cにあるように)を含み、モデル構築から完全に除外された。残りの試料を、5つの均一なサイズの「テストサブセット」にランダムに分けた。各テストサブセットについて、トレーニングデータは、全ての非ホールドアウト及び非テスト試料から構成されていた。トレーニング及びテストデータについての遺伝子カウントを、edgeRにおいてTMM正規化し、次に、各遺伝子について平均0及び標準偏差1に対して標準化した。各トレーニング/テスト試料セットについて、AdaBoostモデル(90の推定量、1.6の学習率)を、トレーニングデータから10回構築した(
図30B)。特徴プルーニングを行い、重要度閾値を徐々に増加させる以下の遺伝子を除去し、テストデータを予測するときにマシューズ相関係数によって性能を評価した。最良の性能(及び同点の場合、最も少ない遺伝子)を有するモデルを保持した。全ての50の独立したモデルからの推定量を単一のAdaBoostモデルに統合した(
図30C)。特徴プルーニングを、今度は、遺伝子を使用したモデルのパーセントを用いて、得られたアンサンブルに対して行って、テストサブセットにわたって平均log loss値によって測定される閾値及び性能を設定した。最終的なAdaBoostモデルをホールドアウトデータに適用した後のROC曲線(
図30D)。全ての試料は、3つの試料のうちの2つがHCAによって同様にミスクラスタリングされたことを除いて、正確に分離された。
【
図31A-31E】機械学習性能に対するハイパーパラメータ選択及び特徴プルーニングの影響。AdaBoostのための最適なハイパーパラメータを同定するためのグリッド検索のヒートマップ(
図31A)。マシューズ相関係数を、性能の指標として使用した。各ハイパーパラメータについての平坦化された図(
図31B)。矢印は、モデル構築のために選択された値を示す。
図31Cは、性能に対する個々のAdaBoostモデルのプルーニングの影響を示す(
図30Bにあるように)。実線は、全ての10のモデルの平均であり、網掛け領域は、標準偏差を示す。予めプルーニングされたアンサンブルにおいて観察された各遺伝子を用いたAdaBoostモデルの数(
図31D)。組み合わされたAdaBoostアンサンブルをプルーニングする場合のモデル性能(
図31E)。
図31D及び
図31E中のオレンジ色の線は、最終的なAdaBoostモデルを生成するために適用される閾値を示す。
【発明を実施するための形態】
【0054】
概略図は必ずしも等尺ではない。図面で使用される同様の番号は、同様の構成要素を指すことがある。しかしながら、所定の図において構成要素を指すための番号の使用は、同じ番号で標識される別の図における構成要素を限定することを意図しないことが理解されるであろう。さらに、構成要素を指すための異なる番号の使用は、異なる番号の構成要素が他の番号の構成要素と同一又は類似であり得ないことを示すことを意図していない。
【0055】
妊娠高血圧腎症に特異的な、母体循環系に見られる循環RNAのシグネチャー、並びに及び妊娠高血圧腎症の診断及び妊娠高血圧腎症を発症するリスクのある妊婦の同定のための非侵襲的方法におけるこのようなシグネチャーの使用が、本明細書に提供される。
【0056】
体内のDNA及びRNAの大部分は、細胞内に位置するが、血液中で自由に循環している細胞外核酸も見られる。本明細書において「C-RNA」とも呼ばれる循環RNAは、血流中で見られるRNAの細胞外セグメントを指す。C-RNA分子は、主に2つの源に由来し:1つ目は、アポトーシスを起こした死細胞から循環中に放出されるもの、2つ目は、循環中に生存細胞によって出されるエクソソーム内に含まれるものである。エクソソームは、多くの細胞型から細胞外空間中に放出され、様々な体液(血清、尿、及び母乳を含む)及び運搬タンパク質、mRNA、及びマイクロRNA中で見られる、直径約30~150nmの小さい膜質の小胞である。エクソソームの脂質二重層構造は、中に含まれるRNAをRNasesによる分解から保護し、血液中での安定性を提供する。例えば、Huang et al.,2013,BMC Genomics;14:319;及びLi et al.,2017,Mol Cancer;16:145)を参照されたい。エクソソームが、特殊化された機能を有し、凝固、細胞間シグナル伝達、及び排出物管理のようなプロセスに役割を果たすというエビデンスは増加している(van der Pol et al.,2012,Pharmacol Rev;64(3):676-705)。Samos et al.,2006,Ann N Y Acad Sci;1075:165-173;Zernecke et al.,2009,Sci Signal;2:ra81;Ma et al.,2012,J Exp Clin Cancer Res;31:38;及びSato-Kuwabara et al.,2015,Int J Oncol;46:17-27も参照されたい。
【0057】
本明細書に記載される方法では、母体循環系中に見られるC-RNA分子は、胎児、胎盤、及び母体の健康のバイオマーカーとして機能し、妊娠の進行を知る手段を提供する。妊娠を示す、母体循環系内のC-RNAシグネチャー、妊娠期間と時間的に関連する母体循環系内のC-RNAシグネチャー、及び妊娠合併症である妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーが、本明細書に記載される。
【0058】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17、ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3から選択される複数のタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(a)」又は「(a)」とも呼ばれる、以下の表1に示されるTruSeqライブラリー作製方法を用いて得られるAdaboost Generalシグネチャーである。
【0059】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4から選択される複数のタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(b)」又は「(b)」とも呼ばれる、以下の表1に示されるTruSeqライブラリー作製方法を用いて得られるブートストラップ法シグネチャーである。
【0060】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(c)」又は「(c)」とも呼ばれる、以下の表1に示されるTruSeqライブラリー作製方法を用いて得られる標準的なDEX Treatシグネチャーである。
【0061】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、及びHTRA4から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(d)」又は「(d)」とも呼ばれる、以下の表1に示されるTruSeqライブラリー作製方法を用いて得られるジャックナイフ法シグネチャーである。
【0062】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(e)」又は「(e)」とも呼ばれる、以下の表1に示されるNextera Flex for Enrichmentライブラリー作製方法を用いて得られる標準的なDEX Treatシグネチャーである。
【0063】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、及びVSIG4から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(f)」又は「(f)」とも呼ばれる、以下の表1に示されるNextera Flex Enrichmentライブラリー作製方法を用いて得られるジャックナイフ法シグネチャーである。
【0064】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH、及びNESから選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「AdaBoost Refined 1」、「リスト(g)」又は「(g)」とも呼ばれる、以下の表1に示されるTruSeqライブラリー作製方法を用いて得られるAdaboost Refined TruSeqシグネチャーである。
【0065】
いくつかの実施形態において、妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、及びVSIG4(本明細書において「AdaBoost Refined 2」とも呼ばれる)、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、及びVSIG4(本明細書において「AdaBoost Refined 3」とも呼ばれる)、ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、及びVSIG4(本明細書において「AdaBoost Refined 4」とも呼ばれる)、ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、及びVSIG4(本明細書において「AdaBoost Refined 5」とも呼ばれる)、ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、及びSKIL(本明細書において「AdaBoost Refined 6」とも呼ばれる)、又はADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、及びSKIL(本明細書において「AdaBoost Refined 7」とも呼ばれる)から選択されるタンパク質の少なくとも一部をコードするC-RNA分子を含む。
【0066】
妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMA3G、TIPARP、LRRC26、PHEX、LILRA4、及びPER1から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。このC-RNAシグネチャーは、本明細書において「リスト(h)」又は「(h)」とも呼ばれる、以下の表1に示されるNextera Flex for Enrichmentライブラリー作製方法を用いて得られるAdaboost Refined Nextera Flexシグネチャーである。
【0067】
いくつかの実施形態において、妊娠高血圧腎症を示す、母体循環系内のC-RNAシグネチャーは、(a)、(b)、(c)、(d)、(e)、(f)、(g)、及び/又は(h)のいずれかのうちのいずれか1つ以上と組み合わせた、(a)、(b)、(c)、(d)、(e)、(f)、(g)、及び/又は(h)のいずれかのうちのいずれか1つ以上から選択されるタンパク質の少なくとも一部をコードする複数のC-RNA分子を含む。
【0068】
本明細書に提供される実施例は、妊娠高血圧腎症及び対照の妊娠を区別する、上にまとめられた8つの遺伝子リストを説明する。それぞれは、様々な分析方法及び/又は異なるデータセットを用いることによって同定された。しかしながら、これらの遺伝子セットの多くの間に高度の一致がある。複数の手法を用いて妊娠高血圧腎症C-RNAにおいて改変されていると転写産物を同定することは、前記転写産物が、この疾患の分類のためのより高い予測値を有することを示す。したがって、全ての発現差異解析及び全てのAdaBoostモデルによって同定された転写産物の重要度を組み合わせて、ランク付けした。より低いランクに割り当てられた遺伝子は、重要でなく又は情報を与えず、それらは、コホート及び試料調製にわたって妊娠高血圧腎症の分類のためにあまりロバストでない可能性がある。
【0069】
まず、両方のライブラリー作製方法(TruSeq及びNextera Flex for Enrichment)のために全ての発現差異解析(標準的なDEX Treat、ブートストラップ法及びジャックナイフ法)を用いた場合に同定された転写産物を組み合わせた。以下の表2は、異なる分析方法によって同定される125の転写産物の全てについての相対的重要度を示す。全ての分析方法及び両方のライブラリー作製にわたって同定された転写産物は、最も強力な分類子であり、1の重要度ランキングを割り当てられる。3つ以上の分析方法によって同定され、両方のライブラリー作製で検出された転写産物は、2の重要度ランキングを与えられた。ライブラリー作製の一方のみのほかに最もストリンジェントな分析方法であるジャックナイフ法によって同定された転写産物は、3の重要度ランキングを割り当てられた。5つの分析方法のうちの2つによって同定された転写産物は、4の重要度ランキングを与えられた。最も広く且つ包括的な分析である標準的なDEX Treat方法のみで同定された転写産物は、5の最低の重要度ランキングを与えられた。
【0070】
次に、全てのAdaBoostモデル(AdaBoost General及びAdaBoost Refined)及び両方のライブラリー作製(以下の表3)にわたって同定された91の転写産物を組み合わせた。各ライブラリー作製について精密化されたAdaBoostモデルを生成する場合、モデルを同じデータから構築するたびに、得られる遺伝子セットにおいて、観察されるわずかな変化が、観察された。これは、大きい全エクソームC-RNAデータを通して検索するためにAdaBoostによって使用される乱数性による自然な結果である。遺伝子の代表的なリストを得るために、精密化されたAdaBoostのためのモデル構築を、最小で9回別個に行い、1つ以上のモデルによって使用される全ての遺伝子を報告した。各転写産物を含んでいたモデルのパーセントが表3中に報告される(AdaBoostによって使用される頻度)。AdaBoostは、それ自身の「重要度」値を各転写産物に割り当て、これは、試料が妊娠高血圧腎症患者に由来するかどうかの決定に、その転写産物の存在量がどの程度影響を与えるかを反映する。これらのAdaBoost重要度値は、所与の転写産物を使用した精密化された各AdaBoostモデルにわたって平均された(表3、平均AdaBoostモデル重要度)。
【0071】
全てのAdaBoost分析及びライブラリー作製にわたって同定された転写産物は、1の最高の重要度ランキングを割り当てられた。AdaBoostによって使用される90%超の頻度で単一のライブラリー作製方法のために精密化されたAdaBoostモデルにおいて同定された転写産物は、2の重要度ランキングを割り当てられた。一般に、これらの転写産物は、向上された予測能力と一致する、より高いAdaBoostモデル重要度を有する。単一のライブラリー作製方法のための精密化されたAdaBoostモデルで同定されるが、90%未満のAdaBoostモデルによって使用される転写産物は、3の重要度ランキングを割り当てられた。単一のライブラリー作製のための一般的なAdaBoostモデルのみにおいて同定された転写産物は、4の最低の重要度ランキングを与えられた。
【0072】
表2は、全ての分析手法及びライブラリー作製にわたってDEX分析によって同定された全ての遺伝子を列挙している。ランク1=全ての分析方法及びライブラリー作製方法にわたって同定された転写産物。ランク2=両方のライブラリー作製、及び3/5分析方法において同定された転写産物。ランク3=1つのライブラリー作製方法、最もストリンジェントな分析であるジャックナイフ法において同定された。ランク4=2/5分析において同定された。そして、ランク5=最も緩い分析方法である標準的なDEX Treat方法のみで同定された。
【0073】
表3は、両方のライブラリー作製にわたってAdaboost分析によって同定された全ての遺伝子を列挙している。ランク1=両方のライブラリー作製方法及び精密化されたadaboostモデルにおいて同定された。ランク2=高いモデル重要度及び頻度で精密化されたadaboostモデルに存在する、1つのライブラリー作製方法において同定された。ランク3=中程度のモデル重要度及び頻度で、精密化されたadaboostモデルに存在する、1つのライブラリー作製方法おいて同定された。そして、ランク4=精密化されたadaboostモデルに存在しない、1つのライブラリー作製において同定された。
【0074】
以下の表4は、本明細書において列挙される様々な遺伝子の全ての用語集である。この情報は、欧州バイオインフォマティクス研究所(European Bioinformatics Institute)のHUGO遺伝子命名委員会(HUGO Gene Nomenclature Committee)から入手した。
【0075】
【0076】
【0077】
【0078】
【0079】
【0080】
【0081】
【0082】
【0083】
【0084】
【0085】
【0086】
【0087】
「複数」という用語は、2つ以上の要素を指す。例えば、この用語は、妊娠高血圧腎症を示すシグネチャーとして働くいくつかのC-RNA分子への言及において本明細書で使用される。
【0088】
複数は、本明細書に記載されるリストに列挙される分子のうちのいずれか2つ、いずれか3つ、いずれか4つ、いずれか5つ、いずれか6つ、いずれか7つ、いずれか8つ、いずれか9つ、いずれか10個、いずれか11個、いずれか12個、いずれか13個、いずれか14個、いずれか15個、いずれか16個、いずれか17個、いずれか18個、いずれか19個、いずれか20個、いずれか21個、いずれか22個、いずれか23個、いずれか24個、いずれか25個、いずれか26個、いずれか27個、いずれか28個、いずれか29個、いずれか30個、いずれか31個、いずれか32個、いずれか33個、いずれか34個、いずれか35個、いずれか36個、いずれか37個、いずれか38個、いずれか39個、いずれか40個、いずれか41個、いずれか42個、いずれか43個、いずれか44個、いずれか45個、いずれか46個、いずれか47個、いずれか48個、いずれか49個、いずれか50個、いずれか51個、いずれか52個、いずれか53個、いずれか54個、いずれか55個、いずれか56個、いずれか57個、いずれか58個、いずれか59個、いずれか60個、いずれか61個、いずれか62個、いずれか63個、いずれか64個、いずれか65個、いずれか66個、いずれか67個、いずれか68個、いずれか69個、いずれか70個、いずれか71個、いずれか72個、いずれか73個、いずれか74個、いずれか75個、いずれか76個、いずれか77個、いずれか78個、いずれか79個、いずれか80個、いずれか81個、いずれか82個、いずれか83個、いずれか84個、いずれか85個、いずれか86個、いずれか87個、いずれか88個、いずれか89個、いずれか90個、いずれか91個、いずれか92個、いずれか93個、いずれか94個、いずれか95個、いずれか96個、いずれか97個、いずれか98個、いずれか99個、いずれか100個、いずれか101個、いずれか102個、いずれか103個、いずれか104個、いずれか105個、いずれか106個、いずれか107個、いずれか108個、いずれか109個、いずれか110個、いずれか111個、いずれか112個、いずれか113個、いずれか114個、いずれか115個、いずれか116個、いずれか117個、いずれか118個、いずれか119個、いずれか120個、いずれか121個、又はいずれか122個を含み得る。複数は、上に列挙される数値の少なくともいずれかを含み得る。複数は、上に列挙される数値のいずれかを超える数値を含み得る。複数は、上に列挙されるもののいずれかの範囲を含み得る。いくつかの実施形態において、妊娠高血圧腎症を示すC-RNAシグネチャーは、上に列挙されるバイオマーカーの1つのみを含む。
【0089】
対象から採取される試料中のこれらのC-RNAシグネチャーの1つの同定及び/又は定量を用いて、対象が、妊娠高血圧腎症に罹患しているか、又は妊娠高血圧腎症を発症するリスクがあることを決定することができる。
【0090】
試料は、限定はされないが、血液、血清、血漿、汗、涙、尿、喀痰、リンパ液、唾液、羊水、組織生検、スワブ検体、又は塗抹(例えば、限定はされないが、胎盤組織試料を含む)を含む生体試料(biological sample又はbiosample)であり得る。いくつかの好ましい実施形態において、生体試料は、セルフリー血漿試料である。生体試料は、妊婦対象から採取される母体試料であり得る。
【0091】
本明細書で使用される際、「対象」という用語は、ヒト対象並びに非ヒト哺乳動物対象を指す。本明細書における例は、ヒトに関し、この用語は、主にヒトの問題に関するが、本開示の概念は、任意の哺乳動物に適用可能であり、獣医学、動物科学の分野、研究所などにおいて有用である。
【0092】
対象は、任意の妊娠期間の妊婦を含む妊婦であり得る。妊娠期間は、例えば、妊娠初期、妊娠中期(妊娠中期後半を含む)、又は妊娠後期(妊娠後期前半を含む)であり得る。妊娠期間は、例えば、妊娠16週以前、妊娠20週以前、又は妊娠20週以降であり得る。妊娠期間は、例えば、妊娠8~18週、妊娠10~14週、妊娠11~14週、11~13週、又は妊娠12~13週であり得る。
【0093】
母体血漿中のセルフリー胎児核酸の発見は、非侵襲的出生前診断に新たな可能性を切り開いた。ここ数年にわたって、このような循環胎児核酸が染色体異数性の出生前検出に使用されるのを可能にするためのいくつかの手法が実証された。例えば、Poon et al.,2000,Clin Chem;1832-4;Poon et al.,2001,Ann N Y Acad Sci;945:207-10;Ng et al.,2003,Clin Chem;49(5):727-31;Ng et al.,2003,Proc Natl Acad Sci U S A.;100(8):4748-53;Tsui et al.,2004,J Med Genet;41(6):461-7;Go et al.,2004,Clin Chem;50(8):1413-4;Smets et al.,2006,Clin Chim Acta;364(1-2):22-32;Tsui et al.,2006,Methods Mol Biol;336:123-34;Purwosunu et al.,2007,Clin Chem;53(3):399-404;Chim et al.,2008,Clin Chem;54(3):482-90;Tsui and Lo,2008,Methods Mol Biol;444:275-89;Lo,2008,Ann N Y Acad Sci;1137:140-143;Miura et al.,2010,Prenat Diagn;30(9):849-61;Li et al.,2012,Clin Chim Acta;413(5-6):568-76;Williams et al.,2013,Proc Natl Acad Sci U S A;110(11):4255-60;Tsui et al.,2014,Clin Chem;60(7):954-62;Tsang et al.,2017,Proc Natl Acad Sci U S A;114(37):E7786-E7795、及び米国特許出願公開第2014/0243212号明細書に記載される方法のいずれかが、本明細書に記載される方法に使用され得る。
【0094】
妊娠高血圧腎症又は妊娠高血圧腎症を発症するリスクを示す、母体循環系内のC-RNAシグネチャーのバイオマーカーの検出及び同定は、様々な技術のいずれかを含み得る。例えば、バイオマーカーは、ラジオイムノアッセイ法によって血清中で検出されてもよく、又はポリメラーゼ連鎖反応(PCR)技術が使用され得る。
【0095】
様々な実施形態において、妊娠高血圧腎症又は妊娠高血圧腎症を発症するリスクを示す、母体循環系内のC-RNAシグネチャーのバイオマーカーの同定は、C-RNA分子をシーケンシングすることを含み得る。限定はされないが、様々なハイスループットシーケンシング技術のいずれかを含むいくつかのシーケンシング技術のいずれかが用いられ得る。
【0096】
いくつかの実施形態において、母体生体試料中のC-RNA集団は、シーケンシングの前にタンパク質コード配列を含むRNA配列のエンリッチメントに供され得る。限定はされないが、the Agilent SureSelect Human All Exonプラットフォーム(Chen et al.,2015a,Cold Spring Harb Protoc;2015(7):626-33.doi:10.1101/pdb.prot083659);the Roche NimbleGen SeqCap EZ Exome Library SRプラットフォーム(Chen et al.,2015b,Cold Spring Harb Protoc;2015(7):634-41.doi:10.1101/pdb.prot084855);又はthe Illumina TruSeq Exome Enrichmentプラットフォーム(Chen et al.,2015c,Cold Spring Harb Protoc;2015(7):642-8.doi:10.1101/pdb.prot084863)を含む、全エクソームエンリッチメント及びシーケンシングに利用可能な様々なプラットフォームのいずれかが使用され得る。“TruSeq(商標)Exome Enrichment Guide”,Catalog # FC-930-1012 Part # 15013230 Rev.B November 2010及びIllumina’s“TruSeq(商標)RNA Sample Preparation Guide”,Catalog #RS-122-9001DOC Part # 15026495 Rev.F March 2014も参照されたい。
【0097】
特定の実施形態において、妊娠高血圧腎症又は妊娠高血圧腎症を発症するリスクを示す、母体循環系内のC-RNAシグネチャーのバイオマーカーは、マイクロアレイ技術を用いて検出され、同定され得る。この方法では、対象とするポリヌクレオチド配列は、マイクロチップ基板上に配置又は配列される。次に、配列された配列は、母体生体試料、又はその精製及び/又はエンリッチされた部分とハイブリダイズされる。マイクロアレイは、限定はされないが、ビーズ、顕微鏡スライドガラス、ガラスウエハー、金、ケイ素、マイクロチップ、及び他のプラスチック、金属、セラミック、又は生体表面を含む様々な固体担体を含み得る。マイクロアレイ分析は、Illuminaの技術を用いることなどによって、製造業者のプロトコルにしたがって、市販の機器によって行われ得る。
【0098】
循環RNAの調製のための血液試料の採取、輸送、貯蔵、及び/又は処理に関して、試料を安定化させ、及び/又は試料中への細胞RNAの放出をもたらす細胞膜の破壊を防ぐための措置が講じられてもよい。例えば、いくつかの実施形態において、血液試料は、血漿へと処理される前に、Streck Cell-Free DNA BCT(登録商標)採血管などの、細胞及びDNA安定化特性を有する管中に、採取され、輸送され、及び/又は貯蔵され得る。いくつかの実施形態において、血液試料は、EDTAに曝されない。例えば、Qin et al.,2013,BMC Research Notes;6:380及びMedina Diaz et al.,2016,PLoS ONE;11(11):e0166354を参照されたい。
【0099】
いくつかの実施形態において、血液試料は、採血の約24~約72時間以内、及びいくつかの実施形態において、採血の約24時間以内に、血漿へと処理される。いくつかの実施形態において、血液試料は、血漿へと処理される前に、室温で維持され、貯蔵され、及び/又は輸送される。
【0100】
いくつかの実施形態において、血液試料は、血漿へと処理される前に、(例えば、氷上で)低温に曝さずに又は凍結させずに、維持され、貯蔵され、及び/又は輸送される。
【0101】
本開示は、妊娠高血圧腎症の診断及び妊娠高血圧腎症を発症するリスクのある妊婦の同定に使用するためのキットを含む。キットは、妊娠高血圧腎症又は妊娠高血圧腎症を発症するリスクを示す、本明細書に記載される母体循環系内のC-RNAシグネチャーを特異的に検出するための少なくとも1つの試薬、例えばプローブを含む任意の製品(例えばパッケージ又は容器)である。キットは、本開示の方法を実施するためのユニットとして、販売促進され、流通され、又は販売され得る。
【0102】
妊娠高血圧腎症の診断及び妊娠高血圧腎症を発症するリスクのある妊婦の同定のための非侵襲的方法における、妊娠高血圧腎症に特異的な、母体循環系に見られる循環RNAのシグネチャーの使用は、適切なモニタリング及び医学的管理と組み合わされ得る。例えば、さらなる検査が、指示され得る。このような検査としては、例えば、肝機能、腎機能、及び/又は血小板及び様々な凝固タンパク質を測定するための血液検査、タンパク質又はクレアチニン値を測定するための尿分析、胎児の成長、体重、及び羊水をモニター測定するための胎児超音波検査、胎児の運動による胎児心拍数がどのくらいかを測定するためのノンストレス試験が挙げられ、及び/又は胎児の呼吸、筋緊張、及び運動及び羊水の体積を測定するための超音波検査を用いた生物物理学的プロファイルが指示され得る。治療的介入は、例えば、出産前の診察の頻度の増加、血圧を低下させるための降圧薬、コルチコステロイド薬、抗けいれん薬、床上安静、入院、及び/又は早期分娩を含み得る。例えば、Townsend et al.,2016“Current best practice in the management of hypertensive disorders in pregnancy”,Integr Blood Press Control;9:79-94を参照されたい。
【0103】
治療的介入は、妊娠高血圧腎症を発症するリスクがあると同定された妊婦への低用量アスピリンの投与を含み得る。最近の多施設二重盲検比較試験により、低用量アスピリンによる、早期妊娠高血圧腎症の高いリスクを有する女性の治療が、プラセボと比較してこの診断の発生を低下させたことが実証された(Rolnik et al.,2017,“Aspirin versus Placebo in Pregnancies at High Risk for Preterm Preeclampsia”,N Engl J Med;377(7):613-622)。低用量アスピリンの投与量としては、限定はされないが、一日当たり約50~約150mg、一日当たり約60~約80mg、一日当たり約100mg以上、又は一日当たり約150mgが挙げられる。投与は、例えば、妊娠16週若しくはそれ以前又は妊娠11~14週に開始され得る。投与は、妊娠36週まで継続され得る。
【0104】
本発明は、以下の実施例によって例示される。特定の例、材料、量、及び手順は、本明細書に記載される発明の範囲及び趣旨に従って広く解釈されるべきであることを理解するべきである。
【実施例】
【0105】
実施例1
妊娠に特有のC-RNAシグネチャー
母体血漿中の循環核酸の存在は、胎児及び胎盤の進行及び健康を知る手段を提供する(
図1)。循環RNA(C-RNA)は、母体循環系中で検出され、2つの主な源に由来する。C-RNAのかなりの割合が、C-RNAを含有する小胞を血流中に放出するアポトーシス細胞に由来する。C-RNAはまた、様々な細胞型からのエクソソーム及び微小胞などの活性なシグナル伝達小胞の放出によって母体循環系に入る。
図2に示されるように、したがって、C-RNAは、細胞死の副産物並びに活性なシグナル伝達産物から構成される。C-RNAの特性は、共通のプロセスによる産生、全身にわたる細胞からの放出、及び安定しており、小胞に含まれることが挙げられる。それは、遺伝子発現、シグナル伝達、及び細胞死における組織特異的な変化を反映する循環トランスクリプトームを表す。
【0106】
C-RNAは、少なくとも以下の理由のために、優れたバイオマーカーである可能性を有する:
1)全てのC-RNAは、分解からC-RNAを保護する膜結合小胞内に含まれるため、血液中でかなり安定している。
2)C-RNAは、全ての細胞型に由来する。例えば、C-RNAは、胎盤及び発育中の胎児の両方からの転写産物を含むことが示されている。C-RNAの多様な起源は、胎児及び全体的な母体の健康の両方についての情報を得るための宝庫である可能性をC-RNAに与える。
【0107】
C-RNAライブラリーを、標準的なIlluminaライブラリー作製及び全エクソームエンリッチメント技術を用いて、血漿試料から作製した。これが、
図3に示される。具体的には、Illumina TruSeq(商標)ライブラリー作製及びRNA Access Enrichmentを使用した。この手法を用いて、ヒトコード領域にアライメントする90%のリードを有するライブラリーを作製した(
図3及び
図7)。試料を、50Mのリードにダウンサンプリングし、40M以上のマッピングされたリードを、下流の分析に使用した。試料を、
図3に示されるC-RNAワークフローを用いて処理した。デュアルインデックス付きライブラリー。Hiseq2000において50×50でシーケンシングした。
【0108】
図4に示されるように、妊娠後期妊婦からの血漿試料による結果を、非妊婦からの血漿試料と比較することにより、妊娠に特有の明らかなシグネチャーが示される。このシグネチャーの上位20の差次的存在量遺伝子は、CSHL1、CSH2、KISS1、CGA、PLAC4、PSG1、GH2、PSG3、PSG4、PSG7、PSG11、CSH1、PSG2、HSD3B1、GRHL2、LGALS14、FCGR1C、PSG5、LGALS13、及びGCM1である。妊娠シグネチャー中で同定される遺伝子の大部分は、胎盤で発現され、公開されたデータとも相関している。これらの結果はまた、胎盤RNAが母体循環系中で入手され得ることを確認する。
【0109】
実施例2
妊娠期間にわたるC-RNAシグネチャー
この実施例は、妊娠を通して異なる妊娠期間にわたるC-RNAシグネチャーを特徴付けた。妊娠にわたる縦断的に異なる時点でのC-RNAシグネチャーの変化が、実施例1において示される妊娠及び非妊娠試料のC-RNAシグネチャー間の差よりわずかであることが予測される。
図5に示されるように、シグネチャー遺伝子のC-RNAプロファイルの明らかな経時変化が、妊娠初期に上方制御される遺伝子の明らかな群及び妊娠後期に増加する遺伝子の明らかな群と共に、妊娠が進行するにつれて観察された。
【0110】
これらの遺伝子は、
図5に列挙されるように、CGB8、CGB5、ZSCAN23、HSPA1A、PMAIP1、C8orf4、ITM2B、IFIT2、CD74、HSPA6、TFAP2A、TRPV6、EXPH5、CAPN6、ALDH3B2、RAB3B、MUC15、GSTA3、GRHL2、及びCSHL1を含む。
【0111】
これらの遺伝子は、CSHL1、CSH2、KISS1、CGA、PLAC4、PSG1、GH2、PSG3、PSG4、PSG7、PSG11、CSH1、PSG2、HSD3B1、GRHL2、LGALS14、FCGR1C、PSG5、LGALS13、及びGCM1も含み得る。
【0112】
妊娠期間を通じたこれらの変化は、Steve Quake及びDennis Loの両方から公開されたデータと相関している。例えば、Maron et al.,2007,“Gene expression analysis in pregnant women and their infants identifies unique fetal biomarkers that circulate in maternal blood”,J Clin Invest;117(10):3007-3019;Koh et al.,2014,“Noninvasive in vivo monitoring of tissue-specific global gene expression in humans”,Proc Natl Acad Sci U S A;111(20):7361-6;及びNgo et al.,2018,“Noninvasive blood tests for fetal development predict gestational age and preterm delivery”,Science;360(6393):1133-1136を参照されたい。胎盤の遺伝子発現のパターンと相関するC-RNAシグネチャーが見られた。したがって、この手法は、妊娠中のわずかな変化を検出することができ、胎盤の健康をモニターするための非侵襲的手段を提供する。
【0113】
実施例3
妊娠高血圧腎症のC-RNAシグネチャー
この実施例では、妊娠高血圧腎症に特有のC-RNAシグネチャーを同定した。C-RNAシグネチャーを、2つの試験、RGH14試験(clinical trials.gov as NCT0208494に登録されている)及びPearl試験(本明細書においてPearl Biobankとも呼ばれる;clinical trials.gov as NCT02379832に登録されている))から妊娠高血圧腎症であると診断された妊婦から採取された試料において決定し、アッセイした(
図6)。2つの管の血液を、妊娠高血圧腎症の診断時に採取した。妊娠高血圧腎症の病態に関連しない転写変動性を最小限に抑え、C-RNAシグネチャーにおける妊娠期間の差を制御するために、妊娠期間を適合させた80の対照試料を採取した。RGH14試験からの試料を用いて、一連の生物学的に関連する遺伝子を同定し、これらのバイオマーカーの予測値を、Pearl Biobankからの試料の独立したコホートにおいて検証した。
【0114】
RGH14データの分析において、妊娠高血圧腎症(PE)に特有のC-RNAシグネチャーを、4つの異なる方法、TREAT方法、ブートストラップ法、ジャックナイフ法、及びAdaboost方法を用いて同定した。実施例3は、最初の3つの分析方法に焦点を合わせ、実施例4は、Adaboost方法に焦点を合わせている。
【0115】
EDGRプログラムを用いる閾値に対するt検定(t-test relative to threshold)(TREAT)統計方法は、研究者が、マイクロアレイ実験における発現差が所与の(生物学的に有意な)閾値より大きいかどうかを(関連するp値を用いて)正式に試験することを可能にする。TREAT統計方法のより詳細な説明については、McCarthy and Smyth,2009“Testing significance relative to a fold-change threshold is a TREAT”,Bioinformatics;25(6):765-71を参照し、EDGRプログラムのより詳細な説明については、Robinson et al.,2010,“edgeR:a Bioconductor package for differential expression analysis of digital gene expression data”,Bioinformatics;26:139-140を参照されたい。Adaboost方法のより詳細な説明については、Freund and Schapire,1997,“A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting”,Journal of Computer and Systems Sciences;55(1):119-139及びPedregosa et al.,2011,“Scikit-learn:Machine Learning in Python”,JMLR;12:2825-2830を参照されたい。Adaboost方法は、実施例4において説明される。
【0116】
第1の方法では、標準的な統計試験(TREAT方法)を用いて、適合対照のサブセット(40人の患者)と比較して40人の患者のRGH14妊娠高血圧腎症コホートにおいて統計的に異なる遺伝子を同定した。122の遺伝子が、適合対照のサブセット(40人の患者)と比較して妊娠高血圧腎症コホート(40人の患者)において統計的に異なると同定された(
図8、右側パネル)。これらの遺伝子は、CYP26B1、IRF6、MYH14、PODXL、PPP1R3C、SH3RF2、TMC7、ZNF366、ADCY1、C6、FAM219A、HAO2、IGIP、IL1R2、NTRK2、SH3PXD2A、SSUH2、SULT2A1、FMO3、FSTL3、GATA5、HTRA1、C8B、H19、MN1、NFE2L1、PRDM16、AP3B2、EMP1、FLNC、STAG3、CPB2、TENC1、RP1L1、A1CF、NPR1、TEK、ERRFI1、ARHGEF15、CD34、RSPO3、ALPK3、SAMD4A、ZCCHC24、LEAP2、MYL2、NRG3、ZBTB16、SERPINA3、AQP7、SRPX、UACA、ANO1、FKBP5、SCN5A、PTPN21、CACNA1C、ERG、SOX17、WWTR1、AIF1L、CA3、HRG、TAT、AQP7P1、ADRA2C、SYNPO、FN1、GPR116、KRT17、AZGP1、BCL6B、KIF1C、CLIC5、GPR4、GJA5、OLAH、C14orf37、ZEB1、JAG2、KIF26A、APOLD1、PNMT、MYOM3、PITPNM3、TIMP4、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、VSIG4、HBG2、CADM2、LAMP5、PTGDR2、NOMO1、NXF3、PLD4、BPIFB3、PACSIN1、CUX2、FLG、CLEC4C、及びKRT5を含む。
【0117】
TREAT方法は、妊娠高血圧腎症患者を別個の群へと100%正確に分類する一連の遺伝子を同定しなかった(
図15)。しかしながら、これらの同定された遺伝子に焦点を合わせることは、全ての測定される遺伝子の全データセットを用いるのと比較して分類を向上させた(
図8、左側パネル)。これは、予測のための遺伝子のサブセットに焦点を合わせることの価値を強調している。しかしながら、TREAT方法では、対照の選択に応じて、かなりの量の変動が同定された遺伝子において観察された。この生物学的変動性に対処し、本発明者らの遺伝子リストの予測値をさらに向上させるために、第2のブートストラップ法を開発した。
【0118】
RGH14試験では、妊娠高血圧腎症患者試料(40)より多い対照試料(80)が利用可能である。したがって、40の妊娠高血圧腎症患者試料のRGH14コホートを、ランダムに選択した40の対照試料(やはり妊娠期間を適合させた)と比較し、妊娠高血圧腎症コホートにおいて統計的に異なる遺伝子リストを同定した。
図9に示されるように、次に、これを1,000回繰り返して、一連の遺伝子を同定した頻度を同定した。かなりの遺伝子サブセットが、1,000の反復のうち10回未満(1,000の反復のうちの1%未満)現れるに過ぎない。これらの低頻度の遺伝子は、生物学的ノイズに起因する可能性が最も高く、広く妊娠高血圧腎症に特異的な遺伝子を反映しないことがある。そのため、行われる1,000の反復のうちの50%において同定される場合のみ、遺伝子が妊娠高血圧腎症コホートにおいて統計的に異なると見なされることを必要とすることによって、遺伝子リストの選択範囲をさらに狭めた(
図9、右側パネル)。
図10に示されるように、さらなるブートストラップ選択による差次的な転写産物存在量が、妊娠高血圧腎症試料を健康な対照と区別する。このさらなる要件を用いることは、生物学的変動性に対処するのに役立ち、妊娠高血圧腎症試料を正確に分類する能力をさらに向上させた。
【0119】
このブートストラップ法を用いて、27の遺伝子を、妊娠高血圧腎症と統計的に関連すると同定した。これらの遺伝子は、TIMP4、FLG、HTRA4、AMPH、LCN6、CRH、TEAD4、ARMS2、PAPPA2、SEMA3G、ADAMTS1、ALOX15B、SLC9A3R2、TIMP3、IGFBP5、HSPA12B、CLEC4C、KRT5、PRG2、PRX、ARHGEF25、ADAMTS2、DAAM2、FAM107A、LEP、NES、及びVSIG4を含む。このブートストラップ法で同定された遺伝子は、公開されたデータとの優れた一致を有していた。これらの遺伝子の約75%が、胎盤によって発現される。
図11に示されるように、PAPPA及びCRHを含む、妊娠高血圧腎症の公知のマーカーとの重複がある。そして、かなりの数のこれらの遺伝子が、胚発生、細胞外基質再構築、免疫調節、及び心血管機能、妊娠高血圧腎症において無調節であることが知られている全ての経路に関与している。
【0120】
第3のジャックナイフ法も、最も高い予測値を有する遺伝子のサブセットを捕捉するために開発された。この手法は、ブートストラップ法と類似している。妊娠高血圧腎症及び対照群の両方からの患者を、ランダムにサブサンプリングし、差次的に豊富な遺伝子を1,000回同定した。遺伝子が統計的に異なると同定される頻度を用いる代わりに、ジャックナイフ法は、各転写産物のp値について信頼区間(95%、片側)を計算した。この信頼区間が0.05を超えた遺伝子を除外した。(
図16、左側パネル)。
【0121】
ジャックナイフ法を用いて、30の遺伝子を、妊娠高血圧腎症の予測として同定した:VSIG4、ADAMTS2、NES、FAM107A、LEP、DAAM2、ARHGEF25、TIMP3、PRX、ALOX15B、HSPA12B、IGFBP5、CLEC4C、SLC9A3R2、ADAMTS1、SEMA3G、KRT5、AMPH、PRG2、PAPPA2、TEAD4、CRH、PITPNM3、TIMP4、PNMT、ZEB1、APOLD1、PLD4、CUX2、HTRA4。
【0122】
図16の右側パネルに示されるように、この手法は、RGH14データセットにおける妊娠高血圧腎症患者の良好な分類を与えた(
図15(TREAT)、
図10(ブートストラップ法)及び
図16(ジャックナイフ法)を比較する)。各同定された遺伝子リストを、独立したPearl Biobankデータセットにおいて妊娠高血圧腎症試料を分類するのにも使用した。
図17に示されるように、各遺伝子リストは、妊娠高血圧腎症試料を分類することができた。
【0123】
ブートストラップ法及びジャックナイフ法によって同定された全ての遺伝子が、122のTREAT方法遺伝子(表2、DEX分析、TruSeqライブラリー作製方法)に示される。ブートストラップ法及びジャックナイフ法遺伝子リストは、非常に一致しており、70%超の遺伝子が共通である。いずれかの手法によって同定された約90%の転写産物が、妊娠高血圧腎症患者において増加した転写産物存在量を示し、これは、この疾患における増加したシグナル伝達及び/又は細胞死と一致する。
【0124】
実施例4
Adaboostを用いたC-RNAシグネチャーの同定
この実施例では、代替的な手法である、adaboostと呼ばれる公表された機械学習アルゴリズムを用いて、妊娠高血圧腎症に関連する特異的なC-RNAシグネチャーを同定した。
図12に示されるように、この手法は、妊娠高血圧腎症(PE)又は正常であると試料を分類するのに最も高い予測能力を有する一連の遺伝子を同定する。この遺伝子リストを用いて、健康な対照からの妊娠高血圧腎症コホートの最も明らかな分離が観察された。しかしながら、この手法はまた、モデルを構築するのに使用される試料に対する過学習を非常に起こしやすいことがある。したがって、PEARL試験からの完全に独立したデータセットを用いて、予測モデルを検証した(
図13)。このAdaboost遺伝子リストを用いて、85%の妊娠高血圧腎症試料を、85%の特異度で正確に分類した(
図14)。全体的に、Adaboost機械学習手法は、妊娠高血圧腎症についての最も正確な予測モデルを構築する。
【0125】
Adaboost方法を用いて、75の遺伝子を、妊娠高血圧腎症と統計的に関連すると同定した(表3、AdaBoost分析、TruSeqライブラリー作製方法)。これらの遺伝子は、ARRDC2、JUN、SKIL、ATP13A3、PDE8B、GSTA3、PAPPA2、TIPARP、LEP、RGP1、USP54、CLEC4C、MRPS35、ARHGEF25、CUX2、HEATR9、FSTL3、DDI2、ZMYM6、ST6GALNAC3、GBP2、NES、ETV3、ADAM17,ATOH8、SLC4A3、TRAF3IP1、TTC21A、HEG1、ASTE1、TMEM108、ENC1、SCAMP1、ARRDC3、SLC26A2、SLIT3、CLIC5、TNFRSF21、PPP1R17、TPST1、GATSL2、SPDYE5、HIPK2、MTRNR2L6、CLCN1、GINS4、CRH、C10orf2、TRUB1、PRG2、ACY3、FAR2、CD63、CKAP4、TPCN1、RNF6、THTPA、FOS、PARN、ORAI3、ELMO3、SMPD3、SERPINF1、TMEM11、PSMD11、EBI3、CLEC4M、CCDC151、CPAMD8、CNFN、LILRA4、ADA、C22orf39、PI4KAP1、及びARFGAP3を含む。
【0126】
精密化されたAdaBoostモデルも、PE試料のロバストな分類のために開発された。新たな試料を正確に予測し得る一般化機械学習モデルを生成するために、本発明者らは、単一のデータセットとの過剰適合を回避する厳密な手法を使用し、モデル構築に使用されない試料を用いて最終的な分類子を検証した。
図18に示されるように、RGH14データセットを、ランダムな選択によって6つのピースに分けた:モデル構築から除外された12%の試料を含むホールドアウトサブセット、及び5つの均一なサイズのテストサブセット。各反復について、サブセットを、トレーニングデータ又はテスト試料と示した。AdaBoostモデルを構築することから開始するこのプロセスを、このデータサブセットについて最小で10回繰り返した。50の高性能モデルを、5つのテスト-トレーニングサブセットについて構築した後、全てのモデルからの推定量を、単一のAdaBoostモデルに統合した。
【0127】
精密化されたAdaBoostモデルを用いて、11の遺伝子を、妊娠高血圧腎症と統計的に関連すると同定した。これらの遺伝子は、CLEC4C、ARHGEF25、ADAMTS2、LEP、ARRDC2、SKIL、PAPPA2、VSIG4、ARRDC4、CRH及びNESを含む。この予測モデルの性能を、RGH14からの並びに完全に独立したPearl Biobankコホートにおけるホールドアウトデータセットを用いて検証した(
図19)。
【0128】
AdaBoostモデル生成の説明。
図18にも示される以下の手法によって、AdaBoost分類手法を、より特異的な遺伝子セットを得るために精密化した(AdaBoost Refined 1~7)。RGH14データセットを、ランダムな選択によって6つのピースに分けた:モデル構築から除外された12%の試料を含むホールドアウトサブセット、及び5つの均一なサイズのテストサブセット。
【0129】
テストサブセットのそれぞれについて、トレーニングデータを、ホールドアウト又はテスト試料のいずれでもない全ての試料として割り当てた。テスト及びトレーニング試料についての遺伝子カウントを、edgeRにおいてTMM正規化し、次に、トレーニングデータが、各遺伝子について0の平均及び1の標準偏差を有するように標準化した。次に、90の推定量及び1.6の学習率を有するAdaBoostモデルを、トレーニングデータにフィットさせた。次に、モデルにおける各遺伝子の特徴重要度を決定し、閾値未満の重要度を有する遺伝子を用いて推定量を除外する影響を試験することによって、特徴プルーニングを行った。最も少ない遺伝子で最良の性能(テストデータ分類についてマシューズ相関係数によって測定した際に)をもたらす閾値を選択し、そのモデルを保持した。AdaBoostモデルを構築することから開始するこのプロセスを、このデータサブセットについて最小で10回繰り返した。
【0130】
全ての50プラスモデルを、5つのテスト-トレーニングサブセットについて構築した後、全てのモデルからの推定量を、単一のAdaBoostモデルに統合した。特徴プルーニングを再度行い、今度は、閾値のために遺伝子を組み込んだモデルのパーセントを使用し、各テストサブセットの分類のために平均陰性log loss値を用いて性能を評価した。最も少ない遺伝子で最大陰性log loss値を得たモデルを、最終的なAdaBoostモデルとして選択した。
【0131】
AdaBoost遺伝子リスト。このプロセスの反復により、わずかな変動が、AdaBoostアルゴリズム実装における固有のランダム化のため、最終的なモデルのために選択された遺伝子において観察されたが、テストデータ、ホールドアウトデータ、及び独立した(Pearl)データセットを予測するための性能は高いままであった。
【0132】
合計で11の遺伝子が、生成された14のAdaBoost Refinedモデル:ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、NES、PAPPA2、SKIL、VSIG4(AdaBoost Refined 1)の少なくとも1つにおいて観察されたが、全てを同時に含むモデルは生成されなかった。
【0133】
2つの観察された遺伝子セットが、独立したデータの分類について最も高い性能を与えた。これらは、AdaBoost Refined 2:ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、VSIG4及びAdaBoost Refined 3:ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、PAPPA2、SKIL、VSIG4である。
【0134】
4つのさらなる遺伝子セットが、AdaBoost Refined 2~3とほぼ同程度に高い性能を示した。これらは、AdaBoost Refined 4:ADAMTS2、ARHGEF25、ARRDC4、CLEC4C、LEP、NES、SKIL、VSIG4;AdaBoost Refined 5:ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、CRH、LEP、PAPPA2、SKIL、VSIG4;AdaBoost Refined 6:ADAMTS2、ARHGEF25、ARRDC2、CLEC4C、LEP、SKIL;及びAdaBoost Refined 7:ADAMTS2、ARHGEF25、ARRDC2、ARRDC4、CLEC4C、LEP、PAPPA2、SKILである。
【0135】
実施例5
トランスポソームに基づくライブラリー作製を用いたC-RNAシグネチャーの同定
RGH14試料がまた、Illumina Nextera Flex for Enrichmentプロトコルによって処理され、全エクソームについてエンリッチされ、4000万を超えるリードまでシーケンシングされた。この手法は、低いインプットでより高感度で且つロバストであり、したがって、妊娠高血圧腎症を予測するさらなる遺伝子を同定する可能性が高い。このデータセットを、3つの分析方法、標準的な発現差異解析(TREAT)、ジャックナイフ法、及び精密化されたAdaboostモデルによって実行した。これらの分析方法の詳細な説明については、実施例3及び実施例4を参照されたい。
【0136】
ライブラリーを作製するための方法を変更することにより、全ての3つの分析方法において検出される遺伝子が変化した。TREAT方法については、26の遺伝子を、妊娠高血圧腎症において差次的に豊富であると同定し、その大部分が、妊娠高血圧腎症において増加された存在量も示す(表2、DEX分析、Nextera Flex for Enrichmentライブラリー作製方法を参照)。これらの遺伝子は、ADAMTS1、ADAMTS2、ALOX15B、AMPH、ARHGEF25、CELF4、DAAM2、FAM107A、HSPA12B、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PACSIN1、PAPPA2、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、VSIG4を含む。
図20は、この遺伝子リスト内のRGH14試料の分類を示す。
【0137】
ジャックナイフ分析方法を適用することにより、TREATリストの選択範囲を、妊娠高血圧腎症において差次的に豊富であると同定された22の遺伝子へと狭めた。これらの遺伝子は、ADAMTS1、ADAMTS2、ALOX15B、ARHGEF25、CELF4、DAAM2、FAM107A、HTRA4、IGFBP5、KCNA5、KRT5、LCN6、LEP、LRRC26、NES、OLAH、PRX、PTGDR2、SEMA3G、SLC9A3R2、TIMP3、VSIG4を含んでいた。このリストの向上した性能が、
図20に示される。
【0138】
精密化されたAdaBoostモデル手法を、実施例4に記載されるように、このデータに適用した。この方法を用いて、24の遺伝子を、妊娠高血圧腎症と統計的に関連すると同定する(表3、AdaBoost分析、Nextera Flex for Enrichmentライブラリー作製方法)。これらの遺伝子は、LEP、PAPPA2、KCNA5、ADAMTS2、MYOM3、ATP13A3、ARHGEF25、ADA、HTRA4、NES、CRH、ACY3、PLD4、SCT、NOX4、PACSIN1、SERPINF1、SKIL、SEMAG3、TIPARP、LRRC26、PHEX、LILRA4、及びPER1を含む。この予測モデルの性能が、
図21に示される。
【0139】
実施例6
母体血液からの循環トランスクリプトーム測定が、早発型妊娠高血圧腎症シグネチャーを検出する
受胎から出産まで妊婦の健康を非侵襲的にモニターするための分子ツールは、有害転帰のリスクがある妊婦の正確な検出を可能にするであろう。循環RNA(C-RNA)は、全ての組織によって、血流中に放出されて、胎盤、胎児及び母体の健康の利用しやすい包括的な測定を提供する(Koh et al.,2014,Proceedings of the National Academy of Sciences;111:7361-7366;及びTsui et al.,2014,Clinical Chemistry;60:954-962)。一般的な、命に関わる可能性のある妊娠合併症である妊娠高血圧腎症(PE)は、胎盤が起源であるが、疾患が進行するにつれてかなりの母体構成要素に広がる(Staff et al.,2013,Hypertension;61:932-942;及びChaiworapongsa et al.,2014,Nature Reviews Nephrology;10,466-480)。未だに、バイオマーカーは、限られた臨床的有用性を示したとされている(Poon and Nicolaides,2014,Obstetrics and Gynecology International;2014:1-11;Zeisler et al.,2016,N Engl J Med;374:13-22;及びDuhig etal.,2018,F1000Research;7:242)。循環トランスクリプトームの特徴付けがより良好なバイオマーカーを同定し得ると仮定して、C-RNAを、113人の妊婦から(40は早発型PE診断の時点で)分析した。新規なワークフローを用いて、PEの生物学と一致し、胎盤、胎児、及び母体寄与を表す、30の転写産物の存在量の差を同定した。さらに、機械学習モデルを開発し、7つのみのC-RNA転写産物が、2つの独立したコホートにおいてPEを分類するのに必要とされることを実証した(92~98%の正確性)。この実施例に開示されるC-RNAの全体的な測定は、母体及び胎児健康の両方をモニターする際の有用性を強調し、リスクのある妊娠の診断及び予測にかなり有望である。
【0140】
いくつかの試験が、様々な妊娠合併症のための、C-RNAにおける潜在的なバイオマーカーを調査及び同定するために開始されている(Pan et al.,2017,Clinical Chemistry;63:1695-1704;Whitehead et al.,2016,Prenatal Diagnosis;36:997-1008;Tsang et al.,2017,Proc Natl Acad Sci USA;114:E7786-E7795;及びNgo et al.,2018、Science;360:1133-1136)。しかしながら、これらの試験は、ごくわずかな患者に関与しており、少数の遺伝子-ほぼ胎盤及び胎児由来の転写産物のみのモニターに限られている。全循環トランスクリプトームの測定は、変動性及び細胞溶解からの汚染を最小限に抑えるために、特定の予めの試料採取及び処理を必要とするため、行うのが難しい(Chiu et al.,2001,Clinical Chemistry;47:1607-1613;及びPage et al.,2013,PLoS ONE;8:e77963)。この複雑なワークフローは、大規模な臨床的試料採取を行うのを困難にするが、その理由は、血液試料の即座の処理に必要とされる作業を、多くの診療所において実行できないためである(Marton and Weiner,2013,BioMed Research International;2013:891391)。したがって、この実施例では、試料調製の全ての工程を制御された環境で行う処理実験室への血液の一晩の輸送を可能にする方法が確立され、臨床試験レベル評価に拡張可能なプラットフォームを提供する(
図22A)。
【0141】
この方法の柱は、血液を処理実験室に一晩で輸送する能力である。C-RNA妊娠シグナルを、いくつかの管タイプにおける一晩の室温での輸送の後に評価した(
図26A~26C)。以前のC-RNA試験によって使用される代表的存在であるEDTA管中で貯蔵された血液は、妊娠に関連する転写産物の存在量の減少及び転写学プロファイルの全体的な不安定性を示した(Qin et al.,2013,BMC Research Notes;6:380)。対照的に、非侵襲的出生前診断(Non-Invasive Prenatal Testing)(NIPT)に使用される主要な管タイプであるCell-Free DNA BCT(Streck)は、胎盤転写産物からのシグナルを保持し、向上した技術的再現性を有していた(
図26B)(Medina Diaz et al.,2016,PLoS ONE;11:e0166354)。
【0142】
血液の輸送は、単一の管の血液から患者当たり平均で5mLの血漿を容易に採取することを可能にした。C-RNAデータ品質の差を、可変の血漿体積を用いる場合に評価し、2mL未満の血漿の使用が、ノイズを有意に増加させ、ライブラリー複雑性を減少させたことを決定した(
図27A及び27B)。したがって、4mLの血漿を、データ品質の信頼性を最大にするためにこの実施例の試験に使用した。
【0143】
この新規なワークフローを、妊娠初期から妊娠後期までの健康な妊婦当たり10,000を超える転写産物のC-RNA動態をモニターする過去の研究を反復することによって実証した。45人の健康な妊婦から連続して採取された152の試料(Pre-Eclampsia and Growth Restriction Longitudinal Study Control Cohort-PEARL;NCT02379832;表5)を用いて、156の有意に改変された転写産物を同定し、その大部分が、妊娠が進行するにつれて存在量が増加した(
図22B)。改変された遺伝子の42%が、以前のC-RNA試験(
図22C)(Koh et al.,2014,Proceedings of the National Academy of Sciences;111:7361-7366;及びTsui et al.,2014,Clinical Chemistry;60:954-962)において同定された。この試験のみで同定された91の転写産物のうち、64%が、胎盤及び/又は胎児組織によって発現される(
図22D及び28A~28C)。おそらく、残りの遺伝子が、妊娠に対する母体応答を反映する。
【0144】
試験設計
調査の次の段階では、ワークフローを、臨床試料に適用して、PEにおけるC-RNA変化を測定した(iPC、Illumina妊娠高血圧腎症コホート)。PEは、異質性疾患であり、様々な重症度に関連し、患者の転帰は、PEが妊娠34週以前(早発型)に現れるか又は妊娠34週以降(遅発型)に現れるかに基づいている(Staff et al.,2013,Hypertension;61:932-942;Chaiworapongsa et al.,2014,Nature Reviews Nephrology;10,466-4803;及びDadelszen et al.,2003,Hypertension in Pregnancy;22:143-148)。この試験は、より重症のPEの早発型に焦点を合わせ、クリーンなコホートを得るために、明確な選択及び除外要件(慢性高血圧歴のある個体を最も厳密に除外する)で厳しい診断基準を定義した(表6)(Nakanishi et al.,2017,Pregnancy Hypertension;7:39-43;及びHiltunen et al.,2017,PLoS ONE;12:e0187729)。母体特性、妊娠結果、及び使用する薬剤を、試験を通して記録した(表7)。113の試料を、8つの場所にわたって採取し(表8)、40はPE診断の時点で採取し、妊娠期間を適合させた73の対照を1週間以内に採取した(
図23A)。対照の9.5%に対して、一人を除く全てのPEの女性が、早産し、これらの診断基準が、この疾患によって深刻な影響を受ける個体を同定するものであると確認した(
図23C)。
【0145】
全ての試料を、複数の処理バッチにわたってランダムに分配し、次に、40M以上のリードにシーケンシングした。全コホートを用いた標準的な発現差異解析は、42の改変された転写産物を同定し、37がPEにおいて増加された
図24A、青色及びオレンジ色)。しかしながら、対照の様々なサブセットを分析のために選択した場合、改変されていることが検出された遺伝子において観察される高い変動性が懸念される。
【0146】
この相違に対処するために、最も一貫して改変される遺伝子の同定を可能にするジャックナイフ法を組み込んだ(
図24A及び24B、オレンジ色)。ランダムに選択された試料サブセットによる差分解析の1,000回の反復を行い、これは、改変されたと推定される各転写産物に関連するp値の信頼区間の構築を可能にした(
図29A)。信頼区間が0.05を超えた12の遺伝子を除外した(
図24B)。これらの遺伝子は、ベースライン存在量又は生物学的変動の閾値を単に設定することによって除外されなかったが(
図29B)、これらの転写産物がより低い予測値を有することが観察された(
図29C)。階層的クラスタリングは、これらの遺伝子が、PEコホートにおいて広く改変されていないこと、ひいてはこの条件の正確な分類のための感度を欠いている(73%)ことを示す(
図29D)。
【0147】
次に、分析は、精密化された30の遺伝子セットに焦点を合わせ、そのうちの60%が、以前にPEに関連しているとされていた(Namli et al.,2018,Hypertension in Pregnancy;37:9-17;Than et al.,2018,Frontiers in Immunology;9:1661;Kramer et al.,2016,Placenta;37:19-25;Winn et al.,2008,Endocrinology;150:452-462;及びLiu et al.,2018,Molecular Medicine Reports;18:2937-2944)。qPCR分析は、20のうち19の遺伝子がPEにおいて有意に改変されていることを確認した(
図24C、表9)。著しくは、これらの遺伝子の40%は、細胞外又は分泌されたタンパク質産物をコードする。さらに、ほぼ全ての遺伝子が、細胞外基質(ECM)再構築、妊娠期間、胎盤/胎児発達、血管新生、及び低酸素応答を含むPE関連過程に関与している(表10)。これらの転写産物の67%が、胎盤及び/又は胎児によって発現された(
図24D)。残りの母体で発現した転写産物において、心血管及び免疫機能がよく表された(表10)。これらの遺伝子の階層的クラスタリングは、98%の感度及び97%の特異度で、PE及び対照試料を効果的に分離した(
図24E)。興味深いことに、2つの誤同定された対照についての臨床データは、これらの対照による高血圧の薬の使用によって示唆されるように、潜在的に交絡する健康問題を示した(表7)。
【0148】
iPCにおいて同定された遺伝子を用いて、独立したバイオバンクから入手された試料のコホートをクラスタリングする能力を評価した-Pre-Eclampsia及びGrowth Restriction Longitudinal Study(PEARL;NCT02379832;
図23B及び23C、表11)。このコホートは、妊娠期間を適合させた対照と共に、早発型PE(34週未満で診断された);及び遅発型PEからなっていた。早発型PE試料は、83%の感度及び92%の特異度で、適合対照から別々にクラスタリングされ、これらの転写産物の関連性をさらに検証した(
図24F)。対照的に、遅発型PE及び適合対照試料についてのクラスタリングは観察されなかった(
図24G)。
【0149】
次に、iPCデータを用いて、PE試料のロバストな分類のためのAdaBoostモデルを構築した。新たな試料を正確に予測し得る一般化機械学習モデルを生成するために、単一のデータセットとの過剰適合を回避する厳密な手法を使用し、モデル構築に使用されない試料を用いて最終的な分類子を検証した(
図30A~30D及び
図31A~31E)。意外にも、最終的なモデルは、7つの遺伝子のみを用い、そのうちの3つは、以前に報告されていない(
図25A)。全iPCコホートについて、このモデルは、極めて高い正確性で試料を分類した(AUC=0.99、感度=98%、特異度=99%;
図25B及び25C、青色)。早発型PE PEARL試料も正確に分類された(AUC=0.88、感度=100%、特異度=83%;
図25B及び25C、ピンク色)。予想外にも、遅発型PE PEARL試料も、妥当な正確性で分類された(AUC=0.74、感度=75%、特異度=67%;
図25B及び25C、緑色)。
【0150】
この遺伝子セットは、差次的存在量分析によって同定された転写産物と非常に一致していた(
図25D;表10)。分類子は、胎盤で及び母体で発現した転写産物の両方に依存していた(
図25E)。モデルによって使用される全ての遺伝子は、細胞外又は膜結合性のいずれかであるタンパク質産物を形成する。AdaBoostによって選択される少数の遺伝子にもかかわらず、多様なPE関連機能、特に、心血管機能及び血管新生、免疫調節、胎児発達、及びECM再構築が観察された。
【0151】
方法
前向き臨床試料採取。良き臨床上の基準(Good Clinical Practice)についての医薬品規制調和国際会議(International Conference on Harmonization)に準拠して、Illuminaが後援する臨床試験プロトコルにおいて、妊娠患者を採用した。インフォームド・コンセントの後、ACOGガイドラインにしたがって定義される重度の特徴を有する妊娠34週以前に妊娠高血圧腎症の診断を受けた40人の妊婦から、20mLの全血試料を採取した(表6)。76人の健康な妊婦からの試料も採取し、妊娠高血圧腎症群に妊娠期間を適合させた。3つの対照試料が、採血後に後期妊娠高血圧腎症を発症し、データ分析から除外された。詳細な選択及び除外基準については、表6を参照されたい。患者病歴、治療及び出産結果情報も記録した(表7)。
【0152】
テキサス大学医学部(University of Texas Medical Branch)(Galveston,Texas)、タフツ医療センター(Tufts Medical Center)(Boston,MA)、コロンビア大学アービングメディカルセンター(Columbia University Irving Medical Center)(New York,NY)、ウィンスロップ大学病院(Winthrop University Hospital)(Mineola,NY)、セントピーターズ大学病院(St.Peter’s University Hospital)(New Brunswick,NJ)、クリスティアナケア(Christiana Care)(Newark,DE)、ラトガーズ大学ロバートウッドジョンソンメディカルスクール(Rutgers University Robert Wood Johnson Medical School)(New Brunswick,NJ)及びニューヨーク長老派教会病院/クイーンズ(New York Presbyterian/Queens)(New York,NY)を含む8つの異なる臨床場所にわたって患者を採用した。臨床プロトコル及びインフォームド・コンセントは、各臨床場所の治験審査委員会(Institutional Review Board)によって承認された。臨床場所にわたる患者分布については表8を参照されたい。
【0153】
PEARL検証コホート試験設計。Illuminaは、妊娠高血圧腎症からの血漿試料を採取し、Growth Restriction Longitudinal試験(PEARL;NCT02379832)を、独立した検証コホートとして使用した。血漿試料を、試験が完了した後に採取した。PEARL試料を、主任研究員Emmanual Bujold、MD、MScと共に、ユニヴェルシテール・ド・ケベック総合病院(Centre hospitalier universitaire de Quebec)(CHU de Quebec)において採取した。45人の対照妊婦及び45人の症例妊婦の群を、この試験に採用し、書面によるインフォームド・コンセントを、全ての患者について得た。18歳を超える参加者のみが適格であり、全ての妊婦は単胎妊娠であった。
【0154】
妊娠高血圧腎症群。妊娠高血圧腎症の基準は、20~41週の妊娠期間の採用を含め、妊娠高血圧腎症のためのSociety of Obstetricians and Gynecologists of Canada(SOGC)June 2014基準に基づいて定義された。血液試料を、診断時に1回採取した。
【0155】
対照群。妊娠期間11~13週の、正常な妊娠を有すると予測された45人の妊婦を採用した。各登録患者を、出産まで妊娠中を通じて4つの時点で採取される血液により縦断的に追跡した。対照女性を、3つのサブグループに分け、その後のフォローアップ採血は、妊娠中を通じて妊娠期間の全体範囲をカバーするように時間をずらした(表5)。
【0156】
PEARL対照試料を、2つの目的のために使用した。45人の個体女性からの153の縦断的な試料を用いて、妊娠中を通じて胎盤動態をモニターした。さらに、対照試料を、妊娠高血圧腎症コホートとの比較のために選択し、対照試料は、妊娠期間について適合され、モデルを検証するのに使用される。
【0157】
試験試料処理。Illumina前向き採取からの全ての試料及びPEARL試料を、病態を知らされていない調査者によって同様に処理した。患者当たり2つの管の血液を、製造業者の指示にしたがって、Cell-Free DNA BCT管(Streck)中に採取した。血液試料を貯蔵し、室温で一晩輸送し、72時間以内に処理した。血液を、室温で20分間にわたって1,600×gで遠心分離し、血漿を新しい管に移し、16,000×gでさらに10分間遠心分離して、残存細胞を除去した。血漿を、使用するまで約80℃で貯蔵した。循環RNAを、製造業者の指示にしたがって、Circulating Nucleic Acid Kit(Qiagen)、続いてDNAse I digestion(Thermofisher)を用いて、4.5mLの血漿から抽出した。
【0158】
cDNA合成及びライブラリー作製。循環RNAを、94℃で8分間断片化した後、Illumina TruSight Tumor 170 Library Prep kit(Illumina)を用いて、ランダム六量体プライミングcDNA合成を行った。Illuminaシーケンシングライブラリー作製を、RNAのためのTST170 Tumor Library Prep Kitにしたがって行い、低いRNAインプットに対応するように以下の変更を加えた。全ての反応を、元の体積の25%まで減少させ、ライゲーションアダプターを、10分の1の希釈で使用した。ライブラリー品質を、Agilent Bioanalzyer 2100(Agilent)において高感度DNA分析キットを用いて評価した。
【0159】
全エクソームエンリッチメント。シーケンシングライブラリーを、Quant-iT PicoGreen dsDNA Kit(ThermoFisher Scientific)を用いて定量し、200ngのインプットに対して正規化し、エンリッチメント反応当たり4つの試料にプールした。全エクソームエンリッチメントを、TruSeq RNA Access Library Prep guide(Illumina)にしたがって行った。ヘモグロビン遺伝子HBA1、HBA2、及びHBBに対して設計された5’ビオチンを欠くさらなるブロッキングオリゴが、シーケンシングライブラリーにおけるこれらの遺伝子のエンリッチメントを低減するために、エンリッチメント反応に含まれていた。最終的なエンリッチメントライブラリーを、Quant-IT Picogreen dsDNA Kit(ThermoFisher Scientific)を用いて定量し、正規化し、試料当たり4000万のリードの最小深度のために、Illumina HiSeq 2000プラットフォームにおけるペアエンド50×50シーケンシングのためにプールした。
【0160】
データ分析。特に断りのない限り、全ての統計試験は、両側であった。データが正規分布していない場合、ノンパラメトリック検定を使用した。シーケンシングリードを、tophat(v2.0.13)によりヒト参照ゲノム(hg19)にマッピングし、転写産物存在量を、RefGene座標(10/27/2014に取得した)に対してfeatureCounts(サブリード-1.4.6)により定量した。組織発現データを、Body Atlas(CorrelationEngine,BaseSpace,Illumina,Inc)から入手した(Kupershmidt,et al.,2010,PLoS ONE 5;10.1371/journal.pone.0013066)。胎盤又は胎児組織(脳、肝臓、肺、及び甲状腺)のいずれかにおける全ての組織にわたる中央発現より2倍以上高い発現を有するv遺伝子を、該当する群に割り当てた。細胞内局在性を、UniProtから得た。
【0161】
25%未満の試料においてCPM≦0.5を有する遺伝子の除外の後、発現差異解析を、edgeR(v3.20.9)を用いてR(v3.4.2)において行った。データセットを、TMM方法によって正規化し、差次的に豊富な遺伝子を、log倍率変化≧1についてglmTreat試験、続いてボンフェローニ-ホルムp値補正によって同定した。置換なしでランダムサンプリングによって選択された各群における試料の90%を用いて、同じプロセスを各ジャックナイフ法反復に使用した。1,000回のジャックナイフ法の反復の後、遺伝子ワイズp値のための片側95%信頼区間を、statsmodels(v0.8.0)により計算した。階層的クラスタリング分析を、平方ユークリッド距離及び平均連結を用いて行った。
【0162】
AdaBoostを、scikit-learn(v0.19.1、sklearn.ensemble.AdaBoostClassifier)と共にpythonにおいて行った。最適ハイパーパラメータ値(90の推定量、1.6の学習率)を、マシューズ相関係数を用いて、グリッド検索によって決定して、性能を定量した。全体的なAdaBoostモデル開発戦略は、
図31A~31Eに示される。データセット(25%未満の試料においてCPM≦0.5を有する遺伝子のTMM正規化されたlog CPM値)を、分類子をフィットさせる前に、標準化した(sklearn.preprocessing.StandardScaler)。トレーニングデータにおける同じスケーラーフィットを、対応するテストデータセットに適用し;5つのトレーニングデータセットのための全ての5つのスケーラーを、最終的なモデルでの使用のために平均した。decision_functionスコアを用いて、ROC曲線を構築し、試料分類を決定した。
【0163】
RT-qPCR検証アッセイ及び分析。C-RNAを単離し、ランダムに選択された、19の妊娠高血圧腎症(PE)及び19の適合対照試料からの2mlの血漿からcDNAに変換した。cDNAを、16サイクルにわたってTaqMan Preamp master Mix(cat:4488593)を用いて前増幅し、500μLの最終体積になるまで10倍に希釈した。qPCRについては、製造業者の指示を用いて、反応混合物は、5μLの希釈された前増幅されたcDNA、10μLのTaqMan遺伝子発現マスターミックス(cat:4369542)、1μLのTaqMan Probe、及び4μLの水を含有していた。各TaqManプローブ(表9)については、希釈されたcDNA試料当たり3つのqPCR反応を行い、Cq値を、Bio-Rad CFXマネージャソフトウェアを用いて決定した。各標的遺伝子についての遺伝子存在量を決定するために、ΔΔCq=2^-(標的Cq-ref Cqavg)を、5つの基準遺伝子プローブ(ref Cqavg)の間の平均Cq値を用いて計算した。各プローブについての倍率変化(PE/CTRL)を決定するために、各試料についてのΔΔCq値を、適合対照群についての平均ΔΔCq値で除算した。
【0164】
管タイプ試験。循環RNA品質に対する管タイプ及び一晩の輸送の影響を評価するために、以下の管タイプ:K2 EDTA(Beckton Dickinson)、ACD(Beckton Dickinson)、Cell-Free RNA BCT管(Streck)、及び1つのCell-Free DNA BCT管(Streck)において妊婦及び非妊婦から血液を採取した。8mLの血液を各管に採取し、氷嚢上で一晩輸送するか(EDTA及びACD)又は室温で輸送する(Cell-Free RNA及びDNA BCT管)。全ての輸送される血液管を、採血の24時間以内に血漿へと処理した。対照として、8mLの血液を、K2 EDTA管中に採取し、その場で4時間以内に血漿へと処理し、ドライアイス上で血漿として輸送した。全ての血漿処理及び循環RNA抽出を、方法の節に記載されるように行った。条件当たり3mLの血漿を用いて、記載されるようなIlluminaプロトコルを用いて、エンリッチメントのためのシーケンシングライブラリーを作製した。
【0165】
再現性試験。血漿を、10人の個体から採取し、各体積について3つの複製を伴い、4mL、1mL、及び0.5mLの体積に分割した。循環RNA抽出(Qiagen Circulating Nucleic Acid Kit)及びランダムプライミングcDNA合成を、上述される全て試料において行った。4.5mLの血漿インプットを用いたライブラリーについては、シーケンシングライブラリーを、上述されるTST170 Tumor Library Prep Kitを用いて作製した。1mL及び0.5mLのインプットについて、Accel-NGS 1S Plus DNA Library Kit(Swift Biosciences)を用いて、ライブラリーを作製した。全エクソームエンリッチメント及びシーケンシングを、上述されるように用いて全ての試料において行った。
【0166】
説明
この試験は、早発型PEに広く存在する差の同定に焦点を合わせ、これは、臨床的に実施可能なバイオマーカー発見の最終的な目標を補助する。これは、データにおいて観察される変動性を説明するために分析方法を調整することを必要とした。この変動は、C-RNA測定におけるかなりの生物学的ノイズ並びにPEの表現型多様性の両方に由来する。C-RNAは、本質的に、単一の組織転写学より可変であり、これは、C-RNAが、全ての器官にわたる細胞死、シグナル伝達、及び遺伝子発現の組合せを表すためである。さらに、PEは、様々な根底にある分子の原因に関連し得る広範囲の母体及び胎児結果を示す。除去される遺伝子が、PEにおいて生物学的に関連し得る一方、それらは、コホートにおいて広く存在していない。興味深いことに、除外された転写産物が、PEの分子サブセットを表し得る特定の女性において増加された。より大きいコホートは、C-RNAがPEサブタイプを明らかにし得るかどうかを解明するのに役立ち、これは、この条件の多様な病態生理学の理解にとって重要である。
【0167】
転写産物の最も広いセットを、AdaBoostによって同定した。この方法の成功は、独立した早発型PEコホートの非常に正確な分類(PEARL)によって理解された。例えば慢性高血圧、妊娠糖尿病、又はアルポート症候群を有していた対照群(そのうちのいずれもPEを有すると誤同定されなかった)の女性を含む、かなり緩い選択及び除外基準で、様々な集団からこれらの試料を採取した。階層的クラスタリングと対照的に、遅発型PEコホートからの24人のうち17人の個体を、この実施例の機械学習モデルによって適切に分類し、これは、早発型及び遅発型PEが異なる条件であるという示唆を考えると意外であった。この実施例の知見は、全てのPEにおいて広く改変されるいくつかの経路が存在し得ることを示唆している。
【0168】
全ての評価において、C-RNAは、胎盤、胎児、及び母体で発現した転写産物の変化を示した。PE試料において観察された最も著しい傾向の1つは、機能不全の絨毛外栄養膜浸潤及びこの疾患における母体血管特性の再構築を伴う、無数のECM再構築及び細胞移動/浸潤タンパク質(FAM107A、SLC9A3R2、TIMP4、ADAMTS1、PRG2、TIMP3、LEP、ADAMTS2、ZEB1、HSPA12B)の増加した存在量である。早発型PEの母方が心血管機能障害、炎症、及び早産(PNMT、ZEB1、CRH)として現れ、これらは全て、この実施例のデータにおける異常な挙動の分子的兆候を示す。
【0169】
【0170】
【0171】
【0172】
【0173】
【0174】
【0175】
【0176】
本明細書に引用した全ての特許、特許出願、及び刊行物、及び電子的に利用可能な材料(例えば、GenBank及びRefSeqにおけるヌクレオチド配列提出、並びに例えば、SwissProt、PIR、PRF、PDBにおけるアミノ酸配列提出、並びにGenBank及びRefSeqにおける注釈付きコード領域からの翻訳を含む)の完全な開示は、それらの全体が参照により本明細書に組み込まれる。刊行物で参照される補足資料(補足表、補足図、補足材料及び方法、並びに/又は補足実験データなど)も同様に、それらの全体が参照により組み込まれる。本出願の開示と、参照により本明細書に組み込まれる任意の文書の開示との間に何らかの不一致が存在する場合、本出願の開示が適用されるものとする。前述の詳細な説明及び実施例は、理解を明確にするためにのみ与えられたものである。不必要な限定は、それらから理解されるべきではない。本開示は、図示され、説明された正確な詳細に限定されず、当業者に明らかな変形例が特許請求の範囲によって定義される開示内に含まれる。
【0177】
特に断らない限り、本明細書及び特許請求の範囲で使用される成分の量、分子量などを表す全ての数字は、全ての場合において「約」という用語によって修飾されていると理解されるべきである。従って、特に断らない限り、本明細書及び特許請求の範囲に記載の数値パラメータは、本開示によって得ようとする所望の特性に応じて変化し得る近似値である。最低限でも、特許請求の範囲に均等論を限定する試みとしてではなく、各数値パラメータは、少なくとも、報告された有効数字の数字を考慮して、通常の四捨五入技法を適用することによって解釈されるべきである。
【0178】
本開示の広い範囲を記載する数値範囲及びパラメータは近似値であるにもかかわらず、特定の例に記載される数値は、可能な限り正確に報告される。しかしながら、全ての数値は、本質的に、各々の試験測定において見出される標準偏差から必然的に生じる範囲を含む。
【0179】
全ての見出しは読者の便宜のためであり、そのように指定されない限り、見出しに続く文章の意味を限定するために使用されるべきではない。