(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-11
(54)【発明の名称】がんの進行を予測する方法
(51)【国際特許分類】
C12Q 1/6886 20180101AFI20230704BHJP
C12Q 1/6827 20180101ALI20230704BHJP
C12N 15/11 20060101ALN20230704BHJP
C12M 1/34 20060101ALN20230704BHJP
A61K 45/00 20060101ALN20230704BHJP
A61P 35/00 20060101ALN20230704BHJP
G16B 30/00 20190101ALN20230704BHJP
【FI】
C12Q1/6886 Z
C12Q1/6827 Z
C12N15/11 Z
C12M1/34 B
A61K45/00
A61P35/00
G16B30/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023516635
(86)(22)【出願日】2021-06-01
(85)【翻訳文提出日】2023-01-27
(86)【国際出願番号】 AU2021050535
(87)【国際公開番号】W WO2021243401
(87)【国際公開日】2021-12-09
(32)【優先日】2020-06-01
(33)【優先権主張国・地域又は機関】AU
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】522468009
【氏名又は名称】ジーエムディーエックス・カンパニー・プロプライエタリー・リミテッド
【氏名又は名称原語表記】GMDx Co Pty Ltd
(74)【代理人】
【識別番号】100145403
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100122301
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100157956
【氏名又は名称】稲井 史生
(74)【代理人】
【識別番号】100170520
【氏名又は名称】笹倉 真奈美
(74)【代理人】
【識別番号】100221545
【氏名又は名称】白江 雄介
(72)【発明者】
【氏名】リンドリー,ロビン エイ
(72)【発明者】
【氏名】ホール,ネイサン イー
(72)【発明者】
【氏名】マムロット,ジャレッド
【テーマコード(参考)】
4B029
4B063
4C084
【Fターム(参考)】
4B029AA07
4B029BB11
4B029BB20
4B029FA00
4B029FA15
4B063QA01
4B063QA17
4B063QA19
4B063QQ03
4B063QQ08
4B063QQ42
4B063QQ52
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QX02
4C084AA17
4C084NA20
4C084ZB26
(57)【要約】
本発明は、概して、がんの進行または再発の可能性を予測するシステムおよび方法に関する。より具体的には、本発明は、がんの再発または進行の可能性と相関する核酸突然変異シグネチャーを同定するシステムおよび方法、ならびにそのようなシグネチャーを使用する方法に関する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
対象におけるがんが進行または再発する可能性を判定するための方法であって、
がんを有する対象由来の核酸分子の配列を解析して、前記核酸分子内の一塩基多様性(SNV)を検出することと、
メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて複数のメトリックを決定することと、
メトリックの前記対象プロファイルと参照プロファイルとの間の比較に基づいて、前記がんが進行または再発する可能性を判定することと
を含み、
前記複数のメトリックが、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリックを含む、方法。
【請求項2】
前記参照プロファイルが、進行または再発する可能性が高いがんを表す、請求項1に記載の方法。
【請求項3】
前記参照プロファイルが、進行または再発する可能性が低いがんを表す、請求項1に記載の方法。
【請求項4】
前記複数のメトリックが、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される少なくとも10、15、20、35、30、40、45または50個のメトリックを含む、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記がんが、副腎がん、乳がん、脳がん、前立腺がん、肝がん、結腸がん、胃がん、膵がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、直腸がん、卵巣がん、子宮がん、頭頸部がん、中皮腫および肉腫の中から選択される、請求項1から4のいずれか一項に記載の方法。
【請求項6】
(a)前記がんが中皮腫であり、前記複数のメトリックが、cds:A3Bf_ST-C-G Ti %;g:3Gen2_T-C-G C>T + G>A g %;cds:2Gen1_-C-C C>T at MC1 %;cds:All C Ti/Tv %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen2_C-C-C MC3 %;cds:A3Gn_YYC-C-S C>T %;cds:A3G_C-C- MC3 %;cds:3Gen3_GG-C- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;cds:4Gen3_TT-C-C %;cds:3Gen2_C-C-T MC3 %;g:2Gen1_-C-T C>G + G>C g %;cds:Primary Deaminase %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:4Gen3_CA-C-C %;cds:A3G_C-C- G>T %;cds:A3Gi_SG-C-G non-syn %;g:C>G + G>C %;cds:Other MC3 %;cds:A3B_T-C-W G>A motif %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
(b)前記がんが副腎皮質癌であり、前記複数のメトリックが、cds:All G total;cds:3Gen1_-C-TG G non-syn %;g:A3F_T-C- Hits;cds:3Gen3_GG-C- non-syn %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;cds:3Gen2_C-C-T MC3 %;nc:A3G_C-C- C>T + G>A nc %;cds:AIDd_WR-C-Y %;cds:3Gen1_-C-TC C>T cds %;cds:A3B_T-C-W G>A motif %;g:CG total;cds:A3G_C-C- MC3 %;cds:AIDb_WR-C-G G non-syn %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen3_TG-C- G>A %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen2_A-C-G MC2 non-syn %;cds:3Gen3_CT-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;g:AIDh_WR-C-T C>A + G>T g %;cds:A3B_T-C-W MC3 non-syn %;cds:2Gen1_-C-C C>A %;cds:A1_-C-A G>A at MC3 cds %;cds:3Gen1_-C-CA Ti C:G %;cds:ADAR_W-A- non-syn %;cds:3Gen1_-C-CA Ti %;cds:All G %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gb_-C-G MC1 %;cds:A3B_T-C-W G non-syn %;nc:2Gen2_A-C- C>T + G>A nc %;cds:A3Gi_SG-C-G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:A3B_T-C-W Ti %;およびg:2Gen1_-C-T %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
(c)前記がんが脳がんであり、前記複数のメトリックが、g:CG total;cds:AIDd_WR-C-Y %;variants in VCF;cds:4Gen3_TA-C-C non-syn %;cds:3Gen2_C-C-T MC3 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gb_-C-G MC1 %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W G non-syn %;g:3Gen3_GA-C- C>A + G>T g %;cds:2Gen2_G-C- Hits;cds:AIDc_WR-C-GS MC3 %;cds:All G total;cds:All A non-syn %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_A-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;g:ADARk_CW-A- A>G + T>C g %;nc:ADARb_W-A-Y A>G + T>C nc %;g:2Gen1_-C-T %;cds:Other MC3 C %;g:2Gen1_-C-T C>G + G>C g %;cds:ADAR_W-A- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen1_-C-GC MC2 %;cds:3Gen2_G-C-T %;cds:A3F_T-C- G>C %;g:4Gen3_GG-C-G C>T + G>A g %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3F_T-C- Hits;cds:3Gen2_T-C-C MC1 %;cds:A3B_T-C-W Ti %;cds:ADAR_3Gen1_-A-AT Ti %;cds:ADARh_W-A-S T>C %;cds:A3Gn_YYC-C-S C>T %;cds:A3Ge_SC-C-GS %;cds:2Gen2_A-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:Primary Deaminase %;g:C>G + G>C %;cds:A3Bf_ST-C-G Ti %;cds:3Gen3_CT-C- MC3 %;cds:A3Gi_SG-C-G non-syn %;cds:Other MC3 %;cds:ADAR_3Gen1_-A-CA %;cds:A3F_T-C- C>A %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3Gc_C-C-GW C>T motif %;cds:AIDc_WR-C-GS %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:2Gen1_-C-C C>A %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;g:3Gen1_-C-TC C>T + G>A g %;g:C>A + G>T %;cds:3Gen2_A-C-C MC2 %;cds:2Gen1_-C-C MC2 %;g:3Gen2_G-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:3Gen1_-C-TG G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A MC2 Hits;cds:3Gen1_-C-TC C>T cds %;cds:2Gen1_-C-T MC3 non-syn %;cds:AIDb_WR-C-G G non-syn %;g:AIDc_WR-C-GS Hits;cds:3Gen2_T-C-C MC3 %;cds:3Gen2_T-C-G Ti/Tv %;cds:A1_-C-A G>A at MC3 cds %;nc:A3G_C-C- C>T + G>A nc %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen3_TG-C- G Ti/Tv %;cds:3Gen1_-C-CA Ti %;cds:3Gen3_TG-C- G>A %;cds:3Gen3_CT-C- G non-syn %;cds:All C Ti/Tv %;cds:A3G_C-C- MC3 %;cds:ADARc_SW-A-Y MC2 %;およびcds:3Gen3_GG-C- non-syn %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
(d)前記がんが肉腫であり、前記複数のメトリックが、cds:Other MC3 C %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:4Gen3_TT-C-T %;g:ADARk_CW-A- A>G + T>C g %;g:ADARn_-A-WA A>G + T>C %;cds:A3G_C-C- G>T %;cds:A3Gb_-C-G MC1 %;nc:ADARb_W-A-Y %;cds:A3Ge_SC-C-GS %;cds:Primary Deaminase %;cds:ADAR_2Gen2_G-T- MC2 %;g:4Gen3_GG-C-G C>T + G>A g %;cds:2Gen1_-C-C MC2 %;cds:3Gen1_-C-GT G>A motif %;cds:A3Gn_YYC-C-S C>T %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3B_T-C-W MC3 non-syn %;cds:AIDd_WR-C-Y %;g:3Gen3_CA-C- C>T + G>A g %;cds:All A non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3Bj_RT-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:A3B_T-C-W G non-syn %;cds:A3G_C-C- MC3 %;cds:All G total;cds:CDS Variants;g:CG total;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:AIDc_WR-C-GS %、およびそれらに関連メトリックから選択される少なくとももしくは約5個のメトリックを含む、
(e)前記がんが肺がんであり、前記複数のメトリックが、cds:3Gen1_-C-CC C>T at MC1 motif %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:ADARp_-A-WT A>G at MC2 cds %;cds:Other MC3 C %;cds:Other MC3 %;cds:A3Gb_-C-G MC1 %;g:3Gen1_-C-TC C>T + G>A g %;cds:ADAR_W-A- A>G at MC3 %;cds:ADAR_W-A- non-syn %;cds:ADAR_3Gen3_AC-A- A>G cds %;cds:2Gen1_-C-C C>A %;cds:ADARf_SW-A- MC2 %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:4Gen3_GC-C-A %;cds:A3Go_TC-C-G MC1 non-syn %;g:3Gen2_G-C-T %;cds:A3G_C-C- C>T at MC1 %;cds:AIDc_WR-C-GS MC3 %;cds:3Gen1_-C-GT G>A motif %;nc:2Gen1_-C-T C>A + G>T nc %;cds:ADARc_SW-A-Y MC2 %;cds:ADARh_W-A-S T>C %;cds:2Gen1_-C-C C>T at MC1 %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:AIDd_WR-C-Y C>A cds %;nc:A3G_C-C- C>T + G>A nc %;cds:A3Gc_C-C-GW C>T motif %;cds:ADAR_3Gen1_-A-AT Ti %;cds:3Gen3_CT-C- MC3 %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:3Gen2_T-C-C MC1 %;cds:A3G_C-C- G>T %;cds:3Gen1_-C-CA Ti %;cds:3Gen1_-C-TG G non-syn %;cds:3Gen2_A-C-C non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:All A non-syn %;cds:A3Gi_SG-C-G MC2 %;cds:Primary Deaminase %;cds:4Gen3_TT-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;cds:3Gen2_T-C-C MC3 %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CA Ti C:G %;cds:A1_-C-A G>A at MC3 cds %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_G-C-T C:G %;cds:A3Ge_SC-C-GS %;cds:3Gen3_TG-C- G>A %;g:C>A + G>T %;cds:4Gen3_CA-C-C %;cds:AIDd_WR-C-Y G>C %;cds:All G %;cds:3Gen3_TT-C- C>A at MC1 motif %;g:AIDh_WR-C-T C>A + G>T g %;g:4Gen3_GG-C-G C>T + G>A g %;cds:3Gen2_G-C-T C>A motif %;nc:ADARc_SW-A-Y A>G + T>C nc %;g:3Gen2_A-C-C C>A + G>T g %;cds:A3B_T-C-W Ti %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen3_CT-C- C>T at MC1 motif %;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:3Gen1_-C-TC C>T cds %;cds:4Gen3_CA-C-C MC1 %;cds:3Gen2_G-C-T %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen2_A-C-C MC2 %;cds:A3F_T-C- C>A %;cds:CDS Variants;cds:ADAR_3Gen3_CA-A- Ti %;cds:3Gen3_GG-C- non-syn %;cds:ADARb_W-A-Y MC2 %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:2Gen1_-C-C G>T at MC1 %;cds:A3G_C-C- MC3 %;cds:3Gen2_C-C-C MC3 %;cds:A3B_T-C-W G>A motif %;cds:A3F_T-C- G>C %;cds:ADAR_2Gen2_G-T- MC2 %;cds:3Gen1_-C-AG G Ti/Tv %;cds:A3Bj_RT-C-G Ti %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:ADAR_2Gen2_T-T- %;g:2Gen1_-C-T %;cds:4Gen3_AC-C-T Ti/Tv %;cds:A3Gi_SG-C-G non-syn %;cds:A3Bf_ST-C-G Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;g:3Gen3_CA-C- C>T + G>A g %;cds:2Gen2_A-C- MC3 %;variants in VCF;cds:4Gen3_AG-C-T MC1 non-syn %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:ADAR_3Gen1_-A-CA %;cds:4Gen3_TA-C-C non-syn %;cds:All C Ti/Tv %;cds:ADARc_SW-A-Y、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、または
(f)前記がんが皮膚がんであり、前記複数のメトリックが、cds:4Gen3_AG-C-T MC1 non-syn %;cds:3Gen1_-C-CG G>A at MC3 %;cds:4Gen3_AC-C-T Ti/Tv %;g:C>G + G>C %;cds:A3B_T-C-W MC3 non-syn %;cds:All A non-syn %;cds:3Gen3_AG-C- MC2 %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %;cds:3Gen1_-C-TC C>T at MC3 %;cds:4Gen3_GC-C-C C>T at MC2 %;cds:All C Ti/Tv %;cds:A3Bj_RT-C-G Ti %;cds:AIDh_WR-C-T G>A at MC2 cds %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CC C>T at MC1 motif %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_T-C-C MC1 %;cds:All G %;cds:ADAR_W-A- A>G at MC3 %;cds:A3G_C-C- MC3 %;cds:Other MC3 C %;g:3Gen2_A-C-C C>A + G>T g %;cds:ADARc_SW-A-Y MC2 %;cds:3Gen1_-C-CA Ti C:G %;cds:3Gen1_-C-TC C>T cds %;cds:3Gen2_C-C-C MC3 %;cds:3Gen3_CT-C- C>T at MC1 motif %;g:ADAR_4Gen3_AG-A-G A>C + T>G %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_A-C-C non-syn %;cds:2Gen2_A-C- MC3 %;cds:3Gen2_A-C-C MC2 %;g:3Gen1_-C-TC C>T + G>A g %;cds:3Gen2_T-C-T G>A at MC2 %;cds:2Gen1_-C-C C>T at MC1 %;cds:AIDb_WR-C-G G non-syn %;cds:A3Gb_-C-G MC1 %;cds:2Gen1_-C-C C>A %;cds:A3Ge_SC-C-GS %;g:ADARn_-A-WA A>G + T>C %;g:ADAR_W-A- A>G + T>C %;g:ADAR_2Gen2_G-T- A>T + T>A %;g:AIDh_WR-C-T C>A + G>T g %;cds:4Gen3_TG-C-T Ti C:G %;cds:3Gen2_G-C-T C:G %;cds:3Gen2_T-C-C MC3 %;nc:ADARb_W-A-Y %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:ADAR_3Gen1_-A-AT Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;cds:4Gen3_TA-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen1_-C-AG G Ti/Tv %;cds:AIDc_WR-C-GS %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:2Gen1_-C-C MC2 %;cds:3Gen3_GG-C- non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:A1_-C-A G>A at MC3 cds %;cds:A3G_C-C- C>T at MC1 %;nc:ADARc_SW-A-Y A>G + T>C nc %;cds:ADAR_W-A- T>C at MC2 %;cds:A3Go_TC-C-G MC1 non-syn %;cds:3Gen3_AT-C- C:G %;cds:ADARh_W-A-S T>C %;cds:A3G_C-C- G>T %;cds:ADARf_SW-A- MC2 %;cds:ADAR_W-A- non-syn %;cds:ADARp_-A-WT T>A motif %;cds:4Gen3_AG-C-T G>A at MC1 motif %;cds:ADAR_3Gen1_-A-CA %;cds:3Gen2_C-C-T MC3 %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:A3B_T-C-W Ti %;g:2Gen1_-C-T %;cds:AIDc_WR-C-GS MC3 %;cds:AIDe_WR-C-GW Hits;cds:AIDd_WR-C-Y C>A cds %;cds:ADARb_W-A-Y MC2 %;cds:A3Gc_C-C-GW C>T motif %;cds:2Gen1_-C-C G>T at MC1 %;cds:3Gen1_-C-CA Ti %;cds:Other G MC3 Ti/Tv %;cds:CDS Variants;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:A3Gn_YYC-C-S C>T %;cds:A3Bf_ST-C-G Ti %;cds:2Gen2_G-C- Hits;cds:AIDd_WR-C-Y %;cds:A3F_T-C- G>C %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gi_SG-C-G MC2 %;cds:Other MC3 %;nc:2Gen1_-C-T C>A + G>T nc %;cds:3Gen2_G-C-T %;g:3Gen2_T-C-G C>T + G>A g %;cds:ADARc_SW-A-Y T>C cds %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
請求項1から5のいずれか一項に記載の方法。
【請求項7】
生体試料が、前記がんに罹患した組織型から得られている、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記生体試料が、卵巣、乳房、前立腺、肝臓、結腸、胃、膵臓、皮膚、甲状腺、頸部、リンパ球、造血器、膀胱、肺、腎臓、直腸、子宮、および頭頸部の組織または細胞を含む、請求項7に記載の方法。
【請求項9】
がんを有する対象を処置するための方法であって、請求項1から8のいずれか一項に記載の方法に従った、前記がんまたは腫瘍が進行または再発する可能性が高いという判定に基づいてがん治療を前記対象に曝露することを含む、方法。
【請求項10】
対象におけるがんを処置する方法であって、
(i)請求項1から8のいずれか一項に記載の方法を実施することと、
(ii)前記がんが進行または再発する可能性が高いことを判定することと、
(iii)がん治療に前記対象を曝露することと
を含む、方法。
【請求項11】
前記治療が、放射線療法、手術、化学療法、ホルモン療法、免疫療法および標的療法の中から選択される、請求項9または10に記載の方法。
【請求項12】
対象におけるがんの進行または再発の可能性を評価する際に使用するための進行指標を生成するためのシステムであって、
a)前記対象由来の核酸分子の配列を示す対象データを取得する、
b)前記対象データを解析して、前記核酸分子内の一塩基多様性(SNV)を同定する、
c)同定されたSNVを使用して、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリックを含む、複数のメトリックを決定する、
d)がんの進行または再発の可能性と前記複数のメトリックとの間の関係を具体化し、がんの既知の進行または再発を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、前記複数のメトリックを適用して、がんの進行または再発の可能性を示す進行指標を決定する、
1つまたは複数の電子処理デバイスを含む、システム。
【請求項13】
前記複数のメトリックが、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される少なくとも10、15、20、35、30、40、45または50個のメトリックを含む、請求項12に記載のシステム。
【請求項14】
前記がんが、副腎がん、乳がん、脳がん、前立腺がん、肝がん、結腸がん、胃がん、膵がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、直腸がん、卵巣がん、子宮がん、頭頸部がん、中皮腫および肉腫の中から選択される、請求項12または請求項13に記載のシステム。
【請求項15】
a)前記がんが中皮腫であり、前記複数のメトリックが、cds:A3Bf_ST-C-G Ti %;g:3Gen2_T-C-G C>T + G>A g %;cds:2Gen1_-C-C C>T at MC1 %;cds:All C Ti/Tv %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen2_C-C-C MC3 %;cds:A3Gn_YYC-C-S C>T %;cds:A3G_C-C- MC3 %;cds:3Gen3_GG-C- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;cds:4Gen3_TT-C-C %;cds:3Gen2_C-C-T MC3 %;g:2Gen1_-C-T C>G + G>C g %;cds:Primary Deaminase %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:4Gen3_CA-C-C %;cds:A3G_C-C- G>T %;cds:A3Gi_SG-C-G non-syn %;g:C>G + G>C %;cds:Other MC3 %;cds:A3B_T-C-W G>A motif %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
b)前記がんが副腎皮質癌であり、前記複数のメトリックが、cds:All G total;cds:3Gen1_-C-TG G non-syn %;g:A3F_T-C- Hits;cds:3Gen3_GG-C- non-syn %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;cds:3Gen2_C-C-T MC3 %;nc:A3G_C-C- C>T + G>A nc %;cds:AIDd_WR-C-Y %;cds:3Gen1_-C-TC C>T cds %;cds:A3B_T-C-W G>A motif %;g:CG total;cds:A3G_C-C- MC3 %;cds:AIDb_WR-C-G G non-syn %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen3_TG-C- G>A %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen2_A-C-G MC2 non-syn %;cds:3Gen3_CT-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;g:AIDh_WR-C-T C>A + G>T g %;cds:A3B_T-C-W MC3 non-syn %;cds:2Gen1_-C-C C>A %;cds:A1_-C-A G>A at MC3 cds %;cds:3Gen1_-C-CA Ti C:G %;cds:ADAR_W-A- non-syn %;cds:3Gen1_-C-CA Ti %;cds:All G %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gb_-C-G MC1 %;cds:A3B_T-C-W G non-syn %;nc:2Gen2_A-C- C>T + G>A nc %;cds:A3Gi_SG-C-G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:A3B_T-C-W Ti %;およびg:2Gen1_-C-T %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
c)前記がんが脳がんであり、前記複数のメトリックが、g:CG total;cds:AIDd_WR-C-Y %;variants in VCF;cds:4Gen3_TA-C-C non-syn %;cds:3Gen2_C-C-T MC3 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gb_-C-G MC1 %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W G non-syn %;g:3Gen3_GA-C- C>A + G>T g %;cds:2Gen2_G-C- Hits;cds:AIDc_WR-C-GS MC3 %;cds:All G total;cds:All A non-syn %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_A-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;g:ADARk_CW-A- A>G + T>C g %;nc:ADARb_W-A-Y A>G + T>C nc %;g:2Gen1_-C-T %;cds:Other MC3 C %;g:2Gen1_-C-T C>G + G>C g %;cds:ADAR_W-A- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen1_-C-GC MC2 %;cds:3Gen2_G-C-T %;cds:A3F_T-C- G>C %;g:4Gen3_GG-C-G C>T + G>A g %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3F_T-C- Hits;cds:3Gen2_T-C-C MC1 %;cds:A3B_T-C-W Ti %;cds:ADAR_3Gen1_-A-AT Ti %;cds:ADARh_W-A-S T>C %;cds:A3Gn_YYC-C-S C>T %;cds:A3Ge_SC-C-GS %;cds:2Gen2_A-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:Primary Deaminase %;g:C>G + G>C %;cds:A3Bf_ST-C-G Ti %;cds:3Gen3_CT-C- MC3 %;cds:A3Gi_SG-C-G non-syn %;cds:Other MC3 %;cds:ADAR_3Gen1_-A-CA %;cds:A3F_T-C- C>A %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3Gc_C-C-GW C>T motif %;cds:AIDc_WR-C-GS %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:2Gen1_-C-C C>A %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;g:3Gen1_-C-TC C>T + G>A g %;g:C>A + G>T %;cds:3Gen2_A-C-C MC2 %;cds:2Gen1_-C-C MC2 %;g:3Gen2_G-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:3Gen1_-C-TG G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A MC2 Hits;cds:3Gen1_-C-TC C>T cds %;cds:2Gen1_-C-T MC3 non-syn %;cds:AIDb_WR-C-G G non-syn %;g:AIDc_WR-C-GS Hits;cds:3Gen2_T-C-C MC3 %;cds:3Gen2_T-C-G Ti/Tv %;cds:A1_-C-A G>A at MC3 cds %;nc:A3G_C-C- C>T + G>A nc %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen3_TG-C- G Ti/Tv %;cds:3Gen1_-C-CA Ti %;cds:3Gen3_TG-C- G>A %;cds:3Gen3_CT-C- G non-syn %;cds:All C Ti/Tv %;cds:A3G_C-C- MC3 %;cds:ADARc_SW-A-Y MC2 %;およびcds:3Gen3_GG-C- non-syn %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
d)前記がんが肉腫であり、前記複数のメトリックが、cds:Other MC3 C %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:4Gen3_TT-C-T %;g:ADARk_CW-A- A>G + T>C g %;g:ADARn_-A-WA A>G + T>C %;cds:A3G_C-C- G>T %;cds:A3Gb_-C-G MC1 %;nc:ADARb_W-A-Y %;cds:A3Ge_SC-C-GS %;cds:Primary Deaminase %;cds:ADAR_2Gen2_G-T- MC2 %;g:4Gen3_GG-C-G C>T + G>A g %;cds:2Gen1_-C-C MC2 %;cds:3Gen1_-C-GT G>A motif %;cds:A3Gn_YYC-C-S C>T %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3B_T-C-W MC3 non-syn %;cds:AIDd_WR-C-Y %;g:3Gen3_CA-C- C>T + G>A g %;cds:All A non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3Bj_RT-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:A3B_T-C-W G non-syn %;cds:A3G_C-C- MC3 %;cds:All G total;cds:CDS Variants;g:CG total;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:AIDc_WR-C-GS %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
e)前記がんが肺がんであり、前記複数のメトリックが、cds:3Gen1_-C-CC C>T at MC1 motif %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:ADARp_-A-WT A>G at MC2 cds %;cds:Other MC3 C %;cds:Other MC3 %;cds:A3Gb_-C-G MC1 %;g:3Gen1_-C-TC C>T + G>A g %;cds:ADAR_W-A- A>G at MC3 %;cds:ADAR_W-A- non-syn %;cds:ADAR_3Gen3_AC-A- A>G cds %;cds:2Gen1_-C-C C>A %;cds:ADARf_SW-A- MC2 %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:4Gen3_GC-C-A %;cds:A3Go_TC-C-G MC1 non-syn %;g:3Gen2_G-C-T %;cds:A3G_C-C- C>T at MC1 %;cds:AIDc_WR-C-GS MC3 %;cds:3Gen1_-C-GT G>A motif %;nc:2Gen1_-C-T C>A + G>T nc %;cds:ADARc_SW-A-Y MC2 %;cds:ADARh_W-A-S T>C %;cds:2Gen1_-C-C C>T at MC1 %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:AIDd_WR-C-Y C>A cds %;nc:A3G_C-C- C>T + G>A nc %;cds:A3Gc_C-C-GW C>T motif %;cds:ADAR_3Gen1_-A-AT Ti %;cds:3Gen3_CT-C- MC3 %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:3Gen2_T-C-C MC1 %;cds:A3G_C-C- G>T %;cds:3Gen1_-C-CA Ti %;cds:3Gen1_-C-TG G non-syn %;cds:3Gen2_A-C-C non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:All A non-syn %;cds:A3Gi_SG-C-G MC2 %;cds:Primary Deaminase %;cds:4Gen3_TT-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;cds:3Gen2_T-C-C MC3 %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CA Ti C:G %;cds:A1_-C-A G>A at MC3 cds %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_G-C-T C:G %;cds:A3Ge_SC-C-GS %;cds:3Gen3_TG-C- G>A %;g:C>A + G>T %;cds:4Gen3_CA-C-C %;cds:AIDd_WR-C-Y G>C %;cds:All G %;cds:3Gen3_TT-C- C>A at MC1 motif %;g:AIDh_WR-C-T C>A + G>T g %;g:4Gen3_GG-C-G C>T + G>A g %;cds:3Gen2_G-C-T C>A motif %;nc:ADARc_SW-A-Y A>G + T>C nc %;g:3Gen2_A-C-C C>A + G>T g %;cds:A3B_T-C-W Ti %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen3_CT-C- C>T at MC1 motif %;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:3Gen1_-C-TC C>T cds %;cds:4Gen3_CA-C-C MC1 %;cds:3Gen2_G-C-T %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen2_A-C-C MC2 %;cds:A3F_T-C- C>A %;cds:CDS Variants;cds:ADAR_3Gen3_CA-A- Ti %;cds:3Gen3_GG-C- non-syn %;cds:ADARb_W-A-Y MC2 %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:2Gen1_-C-C G>T at MC1 %;cds:A3G_C-C- MC3 %;cds:3Gen2_C-C-C MC3 %;cds:A3B_T-C-W G>A motif %;cds:A3F_T-C- G>C %;cds:ADAR_2Gen2_G-T- MC2 %;cds:3Gen1_-C-AG G Ti/Tv %;cds:A3Bj_RT-C-G Ti %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:ADAR_2Gen2_T-T- %;g:2Gen1_-C-T %;cds:4Gen3_AC-C-T Ti/Tv %;cds:A3Gi_SG-C-G non-syn %;cds:A3Bf_ST-C-G Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;g:3Gen3_CA-C- C>T + G>A g %;cds:2Gen2_A-C- MC3 %;variants in VCF;cds:4Gen3_AG-C-T MC1 non-syn %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:ADAR_3Gen1_-A-CA %;cds:4Gen3_TA-C-C non-syn %;cds:All C Ti/Tv %;cds:ADARc_SW-A-Y、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、または
f)前記がんが皮膚がんであり、前記複数のメトリックが、cds:4Gen3_AG-C-T MC1 non-syn %;cds:3Gen1_-C-CG G>A at MC3 %;cds:4Gen3_AC-C-T Ti/Tv %;g:C>G + G>C %;cds:A3B_T-C-W MC3 non-syn %;cds:All A non-syn %;cds:3Gen3_AG-C- MC2 %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %;cds:3Gen1_-C-TC C>T at MC3 %;cds:4Gen3_GC-C-C C>T at MC2 %;cds:All C Ti/Tv %;cds:A3Bj_RT-C-G Ti %;cds:AIDh_WR-C-T G>A at MC2 cds %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CC C>T at MC1 motif %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_T-C-C MC1 %;cds:All G %;cds:ADAR_W-A- A>G at MC3 %;cds:A3G_C-C- MC3 %;cds:Other MC3 C %;g:3Gen2_A-C-C C>A + G>T g %;cds:ADARc_SW-A-Y MC2 %;cds:3Gen1_-C-CA Ti C:G %;cds:3Gen1_-C-TC C>T cds %;cds:3Gen2_C-C-C MC3 %;cds:3Gen3_CT-C- C>T at MC1 motif %;g:ADAR_4Gen3_AG-A-G A>C + T>G %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_A-C-C non-syn %;cds:2Gen2_A-C- MC3 %;cds:3Gen2_A-C-C MC2 %;g:3Gen1_-C-TC C>T + G>A g %;cds:3Gen2_T-C-T G>A at MC2 %;cds:2Gen1_-C-C C>T at MC1 %;cds:AIDb_WR-C-G G non-syn %;cds:A3Gb_-C-G MC1 %;cds:2Gen1_-C-C C>A %;cds:A3Ge_SC-C-GS %;g:ADARn_-A-WA A>G + T>C %;g:ADAR_W-A- A>G + T>C %;g:ADAR_2Gen2_G-T- A>T + T>A %;g:AIDh_WR-C-T C>A + G>T g %;cds:4Gen3_TG-C-T Ti C:G %;cds:3Gen2_G-C-T C:G %;cds:3Gen2_T-C-C MC3 %;nc:ADARb_W-A-Y %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:ADAR_3Gen1_-A-AT Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;cds:4Gen3_TA-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen1_-C-AG G Ti/Tv %;cds:AIDc_WR-C-GS %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:2Gen1_-C-C MC2 %;cds:3Gen3_GG-C- non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:A1_-C-A G>A at MC3 cds %;cds:A3G_C-C- C>T at MC1 %;nc:ADARc_SW-A-Y A>G + T>C nc %;cds:ADAR_W-A- T>C at MC2 %;cds:A3Go_TC-C-G MC1 non-syn %;cds:3Gen3_AT-C- C:G %;cds:ADARh_W-A-S T>C %;cds:A3G_C-C- G>T %;cds:ADARf_SW-A- MC2 %;cds:ADAR_W-A- non-syn %;cds:ADARp_-A-WT T>A motif %;cds:4Gen3_AG-C-T G>A at MC1 motif %;cds:ADAR_3Gen1_-A-CA %;cds:3Gen2_C-C-T MC3 %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:A3B_T-C-W Ti %;g:2Gen1_-C-T %;cds:AIDc_WR-C-GS MC3 %;cds:AIDe_WR-C-GW Hits;cds:AIDd_WR-C-Y C>A cds %;cds:ADARb_W-A-Y MC2 %;cds:A3Gc_C-C-GW C>T motif %;cds:2Gen1_-C-C G>T at MC1 %;cds:3Gen1_-C-CA Ti %;cds:Other G MC3 Ti/Tv %;cds:CDS Variants;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:A3Gn_YYC-C-S C>T %;cds:A3Bf_ST-C-G Ti %;cds:2Gen2_G-C- Hits;cds:AIDd_WR-C-Y %;cds:A3F_T-C- G>C %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gi_SG-C-G MC2 %;cds:Other MC3 %;nc:2Gen1_-C-T C>A + G>T nc %;cds:3Gen2_G-C-T %;g:3Gen2_T-C-G C>T + G>A g %;cds:ADARc_SW-A-Y T>C cds %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
請求項12から14のいずれか一項に記載のシステム。
【請求項16】
前記少なくとも1つの計算モデルが、決定木を含む、請求項12から15のいずれか一項に記載のシステム。
【請求項17】
前記少なくとも1つの計算モデルが、複数の決定木を含み、治療指標が、前記複数の決定木からの結果を集めることによって生成される、請求項12から16のいずれか一項に記載のシステム。
【請求項18】
少なくとも1つの計算モデルを計算する際に使用するためのシステムであって、前記少なくとも1つの計算モデルが、対象におけるがんの進行または再発の可能性を評価する際に使用するための進行指標を生成するために使用され、前記システムが、
a)複数の参照対象の各々について、
i)(1)前記参照対象由来の核酸分子の配列、および
(2)がんの進行または再発
を示す参照対象データを取得する、
ii)前記参照対象データを解析して、前記核酸分子内の一塩基多様性(SNV)を同定する、
iii)同定されたSNVを使用して、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリックを含む複数のメトリックを決定する、ならびに
b)複数の参照メトリックおよび参照対象のがんの既知の進行または再発を使用して、がんの進行または再発と前記複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、
1つまたは複数の電子処理デバイスを含む、システム。
【請求項19】
前記複数のメトリックが、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される少なくとも10、15、20、35、30、40、45または50個のメトリックを含む、請求項18に記載のシステム。
【請求項20】
前記がんが、副腎がん、乳がん、脳がん、前立腺がん、肝がん、結腸がん、胃がん、膵がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、直腸がん、卵巣がん、子宮がん、頭頸部がん、中皮腫および肉腫の中から選択される、請求項18または請求項19に記載のシステム。
【請求項21】
a)前記がんが中皮腫であり、前記複数のメトリックが、cds:A3Bf_ST-C-G Ti %;g:3Gen2_T-C-G C>T + G>A g %;cds:2Gen1_-C-C C>T at MC1 %;cds:All C Ti/Tv %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen2_C-C-C MC3 %;cds:A3Gn_YYC-C-S C>T %;cds:A3G_C-C- MC3 %;cds:3Gen3_GG-C- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;cds:4Gen3_TT-C-C %;cds:3Gen2_C-C-T MC3 %;g:2Gen1_-C-T C>G + G>C g %;cds:Primary Deaminase %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:4Gen3_CA-C-C %;cds:A3G_C-C- G>T %;cds:A3Gi_SG-C-G non-syn %;g:C>G + G>C %;cds:Other MC3 %;cds:A3B_T-C-W G>A motif %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
b)前記がんが副腎皮質癌であり、前記複数のメトリックが、cds:All G total;cds:3Gen1_-C-TG G non-syn %;g:A3F_T-C- Hits;cds:3Gen3_GG-C- non-syn %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;cds:3Gen2_C-C-T MC3 %;nc:A3G_C-C- C>T + G>A nc %;cds:AIDd_WR-C-Y %;cds:3Gen1_-C-TC C>T cds %;cds:A3B_T-C-W G>A motif %;g:CG total;cds:A3G_C-C- MC3 %;cds:AIDb_WR-C-G G non-syn %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen3_TG-C- G>A %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen2_A-C-G MC2 non-syn %;cds:3Gen3_CT-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;g:AIDh_WR-C-T C>A + G>T g %;cds:A3B_T-C-W MC3 non-syn %;cds:2Gen1_-C-C C>A %;cds:A1_-C-A G>A at MC3 cds %;cds:3Gen1_-C-CA Ti C:G %;cds:ADAR_W-A- non-syn %;cds:3Gen1_-C-CA Ti %;cds:All G %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gb_-C-G MC1 %;cds:A3B_T-C-W G non-syn %;nc:2Gen2_A-C- C>T + G>A nc %;cds:A3Gi_SG-C-G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:A3B_T-C-W Ti %;およびg:2Gen1_-C-T %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
c)前記がんが脳がんであり、前記複数のメトリックが、g:CG total;cds:AIDd_WR-C-Y %;variants in VCF;cds:4Gen3_TA-C-C non-syn %;cds:3Gen2_C-C-T MC3 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gb_-C-G MC1 %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W G non-syn %;g:3Gen3_GA-C- C>A + G>T g %;cds:2Gen2_G-C- Hits;cds:AIDc_WR-C-GS MC3 %;cds:All G total;cds:All A non-syn %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_A-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;g:ADARk_CW-A- A>G + T>C g %;nc:ADARb_W-A-Y A>G + T>C nc %;g:2Gen1_-C-T %;cds:Other MC3 C %;g:2Gen1_-C-T C>G + G>C g %;cds:ADAR_W-A- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen1_-C-GC MC2 %;cds:3Gen2_G-C-T %;cds:A3F_T-C- G>C %;g:4Gen3_GG-C-G C>T + G>A g %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3F_T-C- Hits;cds:3Gen2_T-C-C MC1 %;cds:A3B_T-C-W Ti %;cds:ADAR_3Gen1_-A-AT Ti %;cds:ADARh_W-A-S T>C %;cds:A3Gn_YYC-C-S C>T %;cds:A3Ge_SC-C-GS %;cds:2Gen2_A-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:Primary Deaminase %;g:C>G + G>C %;cds:A3Bf_ST-C-G Ti %;cds:3Gen3_CT-C- MC3 %;cds:A3Gi_SG-C-G non-syn %;cds:Other MC3 %;cds:ADAR_3Gen1_-A-CA %;cds:A3F_T-C- C>A %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3Gc_C-C-GW C>T motif %;cds:AIDc_WR-C-GS %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:2Gen1_-C-C C>A %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;g:3Gen1_-C-TC C>T + G>A g %;g:C>A + G>T %;cds:3Gen2_A-C-C MC2 %;cds:2Gen1_-C-C MC2 %;g:3Gen2_G-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:3Gen1_-C-TG G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A MC2 Hits;cds:3Gen1_-C-TC C>T cds %;cds:2Gen1_-C-T MC3 non-syn %;cds:AIDb_WR-C-G G non-syn %;g:AIDc_WR-C-GS Hits;cds:3Gen2_T-C-C MC3 %;cds:3Gen2_T-C-G Ti/Tv %;cds:A1_-C-A G>A at MC3 cds %;nc:A3G_C-C- C>T + G>A nc %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen3_TG-C- G Ti/Tv %;cds:3Gen1_-C-CA Ti %;cds:3Gen3_TG-C- G>A %;cds:3Gen3_CT-C- G non-syn %;cds:All C Ti/Tv %;cds:A3G_C-C- MC3 %;cds:ADARc_SW-A-Y MC2 %;およびcds:3Gen3_GG-C- non-syn %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
d)前記がんが肉腫であり、前記複数のメトリックが、cds:Other MC3 C %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:4Gen3_TT-C-T %;g:ADARk_CW-A- A>G + T>C g %;g:ADARn_-A-WA A>G + T>C %;cds:A3G_C-C- G>T %;cds:A3Gb_-C-G MC1 %;nc:ADARb_W-A-Y %;cds:A3Ge_SC-C-GS %;cds:Primary Deaminase %;cds:ADAR_2Gen2_G-T- MC2 %;g:4Gen3_GG-C-G C>T + G>A g %;cds:2Gen1_-C-C MC2 %;cds:3Gen1_-C-GT G>A motif %;cds:A3Gn_YYC-C-S C>T %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3B_T-C-W MC3 non-syn %;cds:AIDd_WR-C-Y %;g:3Gen3_CA-C- C>T + G>A g %;cds:All A non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3Bj_RT-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:A3B_T-C-W G non-syn %;cds:A3G_C-C- MC3 %;cds:All G total;cds:CDS Variants;g:CG total;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:AIDc_WR-C-GS %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
e)前記がんが肺がんであり、前記複数のメトリックが、cds:3Gen1_-C-CC C>T at MC1 motif %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:ADARp_-A-WT A>G at MC2 cds %;cds:Other MC3 C %;cds:Other MC3 %;cds:A3Gb_-C-G MC1 %;g:3Gen1_-C-TC C>T + G>A g %;cds:ADAR_W-A- A>G at MC3 %;cds:ADAR_W-A- non-syn %;cds:ADAR_3Gen3_AC-A- A>G cds %;cds:2Gen1_-C-C C>A %;cds:ADARf_SW-A- MC2 %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:4Gen3_GC-C-A %;cds:A3Go_TC-C-G MC1 non-syn %;g:3Gen2_G-C-T %;cds:A3G_C-C- C>T at MC1 %;cds:AIDc_WR-C-GS MC3 %;cds:3Gen1_-C-GT G>A motif %;nc:2Gen1_-C-T C>A + G>T nc %;cds:ADARc_SW-A-Y MC2 %;cds:ADARh_W-A-S T>C %;cds:2Gen1_-C-C C>T at MC1 %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:AIDd_WR-C-Y C>A cds %;nc:A3G_C-C- C>T + G>A nc %;cds:A3Gc_C-C-GW C>T motif %;cds:ADAR_3Gen1_-A-AT Ti %;cds:3Gen3_CT-C- MC3 %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:3Gen2_T-C-C MC1 %;cds:A3G_C-C- G>T %;cds:3Gen1_-C-CA Ti %;cds:3Gen1_-C-TG G non-syn %;cds:3Gen2_A-C-C non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:All A non-syn %;cds:A3Gi_SG-C-G MC2 %;cds:Primary Deaminase %;cds:4Gen3_TT-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;cds:3Gen2_T-C-C MC3 %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CA Ti C:G %;cds:A1_-C-A G>A at MC3 cds %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_G-C-T C:G %;cds:A3Ge_SC-C-GS %;cds:3Gen3_TG-C- G>A %;g:C>A + G>T %;cds:4Gen3_CA-C-C %;cds:AIDd_WR-C-Y G>C %;cds:All G %;cds:3Gen3_TT-C- C>A at MC1 motif %;g:AIDh_WR-C-T C>A + G>T g %;g:4Gen3_GG-C-G C>T + G>A g %;cds:3Gen2_G-C-T C>A motif %;nc:ADARc_SW-A-Y A>G + T>C nc %;g:3Gen2_A-C-C C>A + G>T g %;cds:A3B_T-C-W Ti %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen3_CT-C- C>T at MC1 motif %;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:3Gen1_-C-TC C>T cds %;cds:4Gen3_CA-C-C MC1 %;cds:3Gen2_G-C-T %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen2_A-C-C MC2 %;cds:A3F_T-C- C>A %;cds:CDS Variants;cds:ADAR_3Gen3_CA-A- Ti %;cds:3Gen3_GG-C- non-syn %;cds:ADARb_W-A-Y MC2 %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:2Gen1_-C-C G>T at MC1 %;cds:A3G_C-C- MC3 %;cds:3Gen2_C-C-C MC3 %;cds:A3B_T-C-W G>A motif %;cds:A3F_T-C- G>C %;cds:ADAR_2Gen2_G-T- MC2 %;cds:3Gen1_-C-AG G Ti/Tv %;cds:A3Bj_RT-C-G Ti %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:ADAR_2Gen2_T-T- %;g:2Gen1_-C-T %;cds:4Gen3_AC-C-T Ti/Tv %;cds:A3Gi_SG-C-G non-syn %;cds:A3Bf_ST-C-G Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;g:3Gen3_CA-C- C>T + G>A g %;cds:2Gen2_A-C- MC3 %;variants in VCF;cds:4Gen3_AG-C-T MC1 non-syn %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:ADAR_3Gen1_-A-CA %;cds:4Gen3_TA-C-C non-syn %;cds:All C Ti/Tv %;cds:ADARc_SW-A-Y、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、または
f)前記がんが皮膚がんであり、前記複数のメトリックが、cds:4Gen3_AG-C-T MC1 non-syn %;cds:3Gen1_-C-CG G>A at MC3 %;cds:4Gen3_AC-C-T Ti/Tv %;g:C>G + G>C %;cds:A3B_T-C-W MC3 non-syn %;cds:All A non-syn %;cds:3Gen3_AG-C- MC2 %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %;cds:3Gen1_-C-TC C>T at MC3 %;cds:4Gen3_GC-C-C C>T at MC2 %;cds:All C Ti/Tv %;cds:A3Bj_RT-C-G Ti %;cds:AIDh_WR-C-T G>A at MC2 cds %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CC C>T at MC1 motif %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_T-C-C MC1 %;cds:All G %;cds:ADAR_W-A- A>G at MC3 %;cds:A3G_C-C- MC3 %;cds:Other MC3 C %;g:3Gen2_A-C-C C>A + G>T g %;cds:ADARc_SW-A-Y MC2 %;cds:3Gen1_-C-CA Ti C:G %;cds:3Gen1_-C-TC C>T cds %;cds:3Gen2_C-C-C MC3 %;cds:3Gen3_CT-C- C>T at MC1 motif %;g:ADAR_4Gen3_AG-A-G A>C + T>G %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_A-C-C non-syn %;cds:2Gen2_A-C- MC3 %;cds:3Gen2_A-C-C MC2 %;g:3Gen1_-C-TC C>T + G>A g %;cds:3Gen2_T-C-T G>A at MC2 %;cds:2Gen1_-C-C C>T at MC1 %;cds:AIDb_WR-C-G G non-syn %;cds:A3Gb_-C-G MC1 %;cds:2Gen1_-C-C C>A %;cds:A3Ge_SC-C-GS %;g:ADARn_-A-WA A>G + T>C %;g:ADAR_W-A- A>G + T>C %;g:ADAR_2Gen2_G-T- A>T + T>A %;g:AIDh_WR-C-T C>A + G>T g %;cds:4Gen3_TG-C-T Ti C:G %;cds:3Gen2_G-C-T C:G %;cds:3Gen2_T-C-C MC3 %;nc:ADARb_W-A-Y %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:ADAR_3Gen1_-A-AT Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;cds:4Gen3_TA-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen1_-C-AG G Ti/Tv %;cds:AIDc_WR-C-GS %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:2Gen1_-C-C MC2 %;cds:3Gen3_GG-C- non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:A1_-C-A G>A at MC3 cds %;cds:A3G_C-C- C>T at MC1 %;nc:ADARc_SW-A-Y A>G + T>C nc %;cds:ADAR_W-A- T>C at MC2 %;cds:A3Go_TC-C-G MC1 non-syn %;cds:3Gen3_AT-C- C:G %;cds:ADARh_W-A-S T>C %;cds:A3G_C-C- G>T %;cds:ADARf_SW-A- MC2 %;cds:ADAR_W-A- non-syn %;cds:ADARp_-A-WT T>A motif %;cds:4Gen3_AG-C-T G>A at MC1 motif %;cds:ADAR_3Gen1_-A-CA %;cds:3Gen2_C-C-T MC3 %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:A3B_T-C-W Ti %;g:2Gen1_-C-T %;cds:AIDc_WR-C-GS MC3 %;cds:AIDe_WR-C-GW Hits;cds:AIDd_WR-C-Y C>A cds %;cds:ADARb_W-A-Y MC2 %;cds:A3Gc_C-C-GW C>T motif %;cds:2Gen1_-C-C G>T at MC1 %;cds:3Gen1_-C-CA Ti %;cds:Other G MC3 Ti/Tv %;cds:CDS Variants;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:A3Gn_YYC-C-S C>T %;cds:A3Bf_ST-C-G Ti %;cds:2Gen2_G-C- Hits;cds:AIDd_WR-C-Y %;cds:A3F_T-C- G>C %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gi_SG-C-G MC2 %;cds:Other MC3 %;nc:2Gen1_-C-T C>A + G>T nc %;cds:3Gen2_G-C-T %;g:3Gen2_T-C-G C>T + G>A g %;cds:ADARc_SW-A-Y T>C cds %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、請求項18から20のいずれか一項に記載のシステム。
【請求項22】
前記1つまたは複数の処理デバイスが、前記少なくとも1つの計算モデルを試験して、前記モデルの識別性能を判定する、請求項18から21のいずれか一項に記載のシステム。
【請求項23】
前記識別性能が、
a)受信者動作特性曲線下の面積、
b)精度、
c)感度、および
d)特異度
のうちの少なくとも1つに基づく、請求項22に記載のシステム。
【請求項24】
前記識別性能が、少なくとも60%である、請求項22または請求項23に記載のシステム。
【請求項25】
前記1つまたは複数の処理デバイスが、前記複数の参照対象のサブセットからの参照対象データを使用して前記少なくとも1つの計算モデルを試験する、請求項18から24のいずれか一項に記載のシステム。
【請求項26】
前記1つまたは複数の処理デバイスが、
a)複数の参照メトリックを選択する、
b)前記複数の参照メトリックを使用して少なくとも1つの計算モデルを訓練する、
c)前記少なくとも1つの計算モデルを試験して、前記モデルの識別性能を判定する、ならびに
d)前記モデルの前記識別性能が閾値よりも下に下がる場合には、
i)異なる複数の参照メトリックを使用して、前記少なくとも1つの計算モデルを選択的に再訓練する、および
ii)異なる計算モデルを訓練する、
のうちの少なくとも1つを行う、
請求項18から25のいずれか一項に記載のシステム。
【請求項27】
前記1つまたは複数の処理デバイスが、
a)複数の参照メトリックの組合せを選択する、
b)前記組合せの各々を使用して複数の計算モデルを訓練する、
c)各々の計算モデルを試験して、前記モデルの識別性能を判定する、および
d)前記進行指標を決定する際に使用するために、最高の識別性能を有する前記少なくとも1つの計算モデルを選択する、
請求項18から26のいずれか一項に記載のシステム。
【請求項28】
対象におけるがんの進行または再発の可能性を評価する際に使用するための進行指標を生成するための方法であって、1つまたは複数の電子処理デバイスにおいて、
a)前記対象由来の核酸分子の配列を示す対象データを取得することと、
b)前記対象データを解析して、前記核酸分子内の一塩基多様性(SNV)を同定することと、
c)同定されたSNVを使用して、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリックを含む複数のメトリックを決定することと、
d)がんの進行または再発と前記複数のメトリックとの間の関係を具体化し、がんの既知の進行または再発を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、前記複数のメトリックを適用して、がんの進行または再発を示す進行指標を決定することと
を含む、方法。
【請求項29】
前記複数のメトリックが、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される少なくとも10、15、20、35、30、40、45または50個のメトリックを含む、請求項28に記載の方法。
【請求項30】
前記がんが、副腎がん、乳がん、脳がん、前立腺がん、肝がん、結腸がん、胃がん、膵がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、直腸がん、卵巣がん、子宮がん、頭頸部がん、中皮腫および肉腫の中から選択される、請求項28または29に記載の方法。
【請求項31】
a)前記がんが中皮腫であり、前記複数のメトリックが、cds:A3Bf_ST-C-G Ti %;g:3Gen2_T-C-G C>T + G>A g %;cds:2Gen1_-C-C C>T at MC1 %;cds:All C Ti/Tv %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen2_C-C-C MC3 %;cds:A3Gn_YYC-C-S C>T %;cds:A3G_C-C- MC3 %;cds:3Gen3_GG-C- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;cds:4Gen3_TT-C-C %;cds:3Gen2_C-C-T MC3 %;g:2Gen1_-C-T C>G + G>C g %;cds:Primary Deaminase %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:4Gen3_CA-C-C %;cds:A3G_C-C- G>T %;cds:A3Gi_SG-C-G non-syn %;g:C>G + G>C %;cds:Other MC3 %;cds:A3B_T-C-W G>A motif %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
b)前記がんが副腎皮質癌であり、前記複数のメトリックが、cds:All G total;cds:3Gen1_-C-TG G non-syn %;g:A3F_T-C- Hits;cds:3Gen3_GG-C- non-syn %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;cds:3Gen2_C-C-T MC3 %;nc:A3G_C-C- C>T + G>A nc %;cds:AIDd_WR-C-Y %;cds:3Gen1_-C-TC C>T cds %;cds:A3B_T-C-W G>A motif %;g:CG total;cds:A3G_C-C- MC3 %;cds:AIDb_WR-C-G G non-syn %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen3_TG-C- G>A %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen2_A-C-G MC2 non-syn %;cds:3Gen3_CT-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;g:AIDh_WR-C-T C>A + G>T g %;cds:A3B_T-C-W MC3 non-syn %;cds:2Gen1_-C-C C>A %;cds:A1_-C-A G>A at MC3 cds %;cds:3Gen1_-C-CA Ti C:G %;cds:ADAR_W-A- non-syn %;cds:3Gen1_-C-CA Ti %;cds:All G %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gb_-C-G MC1 %;cds:A3B_T-C-W G non-syn %;nc:2Gen2_A-C- C>T + G>A nc %;cds:A3Gi_SG-C-G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:A3B_T-C-W Ti %;およびg:2Gen1_-C-T %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
c)前記がんが脳がんであり、前記複数のメトリックが、g:CG total;cds:AIDd_WR-C-Y %;variants in VCF;cds:4Gen3_TA-C-C non-syn %;cds:3Gen2_C-C-T MC3 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gb_-C-G MC1 %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W G non-syn %;g:3Gen3_GA-C- C>A + G>T g %;cds:2Gen2_G-C- Hits;cds:AIDc_WR-C-GS MC3 %;cds:All G total;cds:All A non-syn %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_A-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;g:ADARk_CW-A- A>G + T>C g %;nc:ADARb_W-A-Y A>G + T>C nc %;g:2Gen1_-C-T %;cds:Other MC3 C %;g:2Gen1_-C-T C>G + G>C g %;cds:ADAR_W-A- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen1_-C-GC MC2 %;cds:3Gen2_G-C-T %;cds:A3F_T-C- G>C %;g:4Gen3_GG-C-G C>T + G>A g %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3F_T-C- Hits;cds:3Gen2_T-C-C MC1 %;cds:A3B_T-C-W Ti %;cds:ADAR_3Gen1_-A-AT Ti %;cds:ADARh_W-A-S T>C %;cds:A3Gn_YYC-C-S C>T %;cds:A3Ge_SC-C-GS %;cds:2Gen2_A-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:Primary Deaminase %;g:C>G + G>C %;cds:A3Bf_ST-C-G Ti %;cds:3Gen3_CT-C- MC3 %;cds:A3Gi_SG-C-G non-syn %;cds:Other MC3 %;cds:ADAR_3Gen1_-A-CA %;cds:A3F_T-C- C>A %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3Gc_C-C-GW C>T motif %;cds:AIDc_WR-C-GS %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:2Gen1_-C-C C>A %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;g:3Gen1_-C-TC C>T + G>A g %;g:C>A + G>T %;cds:3Gen2_A-C-C MC2 %;cds:2Gen1_-C-C MC2 %;g:3Gen2_G-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:3Gen1_-C-TG G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A MC2 Hits;cds:3Gen1_-C-TC C>T cds %;cds:2Gen1_-C-T MC3 non-syn %;cds:AIDb_WR-C-G G non-syn %;g:AIDc_WR-C-GS Hits;cds:3Gen2_T-C-C MC3 %;cds:3Gen2_T-C-G Ti/Tv %;cds:A1_-C-A G>A at MC3 cds %;nc:A3G_C-C- C>T + G>A nc %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen3_TG-C- G Ti/Tv %;cds:3Gen1_-C-CA Ti %;cds:3Gen3_TG-C- G>A %;cds:3Gen3_CT-C- G non-syn %;cds:All C Ti/Tv %;cds:A3G_C-C- MC3 %;cds:ADARc_SW-A-Y MC2 %;およびcds:3Gen3_GG-C- non-syn %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
d)前記がんが肉腫であり、前記複数のメトリックが、cds:Other MC3 C %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:4Gen3_TT-C-T %;g:ADARk_CW-A- A>G + T>C g %;g:ADARn_-A-WA A>G + T>C %;cds:A3G_C-C- G>T %;cds:A3Gb_-C-G MC1 %;nc:ADARb_W-A-Y %;cds:A3Ge_SC-C-GS %;cds:Primary Deaminase %;cds:ADAR_2Gen2_G-T- MC2 %;g:4Gen3_GG-C-G C>T + G>A g %;cds:2Gen1_-C-C MC2 %;cds:3Gen1_-C-GT G>A motif %;cds:A3Gn_YYC-C-S C>T %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3B_T-C-W MC3 non-syn %;cds:AIDd_WR-C-Y %;g:3Gen3_CA-C- C>T + G>A g %;cds:All A non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3Bj_RT-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:A3B_T-C-W G non-syn %;cds:A3G_C-C- MC3 %;cds:All G total;cds:CDS Variants;g:CG total;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:AIDc_WR-C-GS %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
e)前記がんが肺がんであり、前記複数のメトリックが、cds:3Gen1_-C-CC C>T at MC1 motif %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:ADARp_-A-WT A>G at MC2 cds %;cds:Other MC3 C %;cds:Other MC3 %;cds:A3Gb_-C-G MC1 %;g:3Gen1_-C-TC C>T + G>A g %;cds:ADAR_W-A- A>G at MC3 %;cds:ADAR_W-A- non-syn %;cds:ADAR_3Gen3_AC-A- A>G cds %;cds:2Gen1_-C-C C>A %;cds:ADARf_SW-A- MC2 %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:4Gen3_GC-C-A %;cds:A3Go_TC-C-G MC1 non-syn %;g:3Gen2_G-C-T %;cds:A3G_C-C- C>T at MC1 %;cds:AIDc_WR-C-GS MC3 %;cds:3Gen1_-C-GT G>A motif %;nc:2Gen1_-C-T C>A + G>T nc %;cds:ADARc_SW-A-Y MC2 %;cds:ADARh_W-A-S T>C %;cds:2Gen1_-C-C C>T at MC1 %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:AIDd_WR-C-Y C>A cds %;nc:A3G_C-C- C>T + G>A nc %;cds:A3Gc_C-C-GW C>T motif %;cds:ADAR_3Gen1_-A-AT Ti %;cds:3Gen3_CT-C- MC3 %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:3Gen2_T-C-C MC1 %;cds:A3G_C-C- G>T %;cds:3Gen1_-C-CA Ti %;cds:3Gen1_-C-TG G non-syn %;cds:3Gen2_A-C-C non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:All A non-syn %;cds:A3Gi_SG-C-G MC2 %;cds:Primary Deaminase %;cds:4Gen3_TT-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;cds:3Gen2_T-C-C MC3 %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CA Ti C:G %;cds:A1_-C-A G>A at MC3 cds %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_G-C-T C:G %;cds:A3Ge_SC-C-GS %;cds:3Gen3_TG-C- G>A %;g:C>A + G>T %;cds:4Gen3_CA-C-C %;cds:AIDd_WR-C-Y G>C %;cds:All G %;cds:3Gen3_TT-C- C>A at MC1 motif %;g:AIDh_WR-C-T C>A + G>T g %;g:4Gen3_GG-C-G C>T + G>A g %;cds:3Gen2_G-C-T C>A motif %;nc:ADARc_SW-A-Y A>G + T>C nc %;g:3Gen2_A-C-C C>A + G>T g %;cds:A3B_T-C-W Ti %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen3_CT-C- C>T at MC1 motif %;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:3Gen1_-C-TC C>T cds %;cds:4Gen3_CA-C-C MC1 %;cds:3Gen2_G-C-T %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen2_A-C-C MC2 %;cds:A3F_T-C- C>A %;cds:CDS Variants;cds:ADAR_3Gen3_CA-A- Ti %;cds:3Gen3_GG-C- non-syn %;cds:ADARb_W-A-Y MC2 %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:2Gen1_-C-C G>T at MC1 %;cds:A3G_C-C- MC3 %;cds:3Gen2_C-C-C MC3 %;cds:A3B_T-C-W G>A motif %;cds:A3F_T-C- G>C %;cds:ADAR_2Gen2_G-T- MC2 %;cds:3Gen1_-C-AG G Ti/Tv %;cds:A3Bj_RT-C-G Ti %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:ADAR_2Gen2_T-T- %;g:2Gen1_-C-T %;cds:4Gen3_AC-C-T Ti/Tv %;cds:A3Gi_SG-C-G non-syn %;cds:A3Bf_ST-C-G Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;g:3Gen3_CA-C- C>T + G>A g %;cds:2Gen2_A-C- MC3 %;variants in VCF;cds:4Gen3_AG-C-T MC1 non-syn %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:ADAR_3Gen1_-A-CA %;cds:4Gen3_TA-C-C non-syn %;cds:All C Ti/Tv %;cds:ADARc_SW-A-Y、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、または
f)前記がんが皮膚がんであり、前記複数のメトリックが、cds:3Gen1_-C-CG G>A at MC3 %;cds:4Gen3_AC-C-T Ti/Tv %;g:C>G + G>C %;cds:A3B_T-C-W MC3 non-syn %;cds:All A non-syn %;cds:3Gen3_AG-C- MC2 %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %;cds:3Gen1_-C-TC C>T at MC3 %;cds:4Gen3_GC-C-C C>T at MC2 %;cds:All C Ti/Tv %;cds:A3Bj_RT-C-G Ti %;cds:AIDh_WR-C-T G>A at MC2 cds %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CC C>T at MC1 motif %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_T-C-C MC1 %;cds:All G %;cds:ADAR_W-A- A>G at MC3 %;cds:A3G_C-C- MC3 %;cds:Other MC3 C %;g:3Gen2_A-C-C C>A + G>T g %;cds:ADARc_SW-A-Y MC2 %;cds:3Gen1_-C-CA Ti C:G %;cds:3Gen1_-C-TC C>T cds %;cds:3Gen2_C-C-C MC3 %;cds:3Gen3_CT-C- C>T at MC1 motif %;g:ADAR_4Gen3_AG-A-G A>C + T>G %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_A-C-C non-syn %;cds:2Gen2_A-C- MC3 %;cds:3Gen2_A-C-C MC2 %;g:3Gen1_-C-TC C>T + G>A g %;cds:3Gen2_T-C-T G>A at MC2 %;cds:2Gen1_-C-C C>T at MC1 %;cds:AIDb_WR-C-G G non-syn %;cds:A3Gb_-C-G MC1 %;cds:2Gen1_-C-C C>A %;cds:A3Ge_SC-C-GS %;g:ADARn_-A-WA A>G + T>C %;g:ADAR_W-A- A>G + T>C %;g:ADAR_2Gen2_G-T- A>T + T>A %;g:AIDh_WR-C-T C>A + G>T g %;cds:4Gen3_TG-C-T Ti C:G %;cds:3Gen2_G-C-T C:G %;cds:3Gen2_T-C-C MC3 %;nc:ADARb_W-A-Y %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:ADAR_3Gen1_-A-AT Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;cds:4Gen3_TA-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen1_-C-AG G Ti/Tv %;cds:AIDc_WR-C-GS %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:2Gen1_-C-C MC2 %;cds:3Gen3_GG-C- non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:A1_-C-A G>A at MC3 cds %;cds:A3G_C-C- C>T at MC1 %;nc:ADARc_SW-A-Y A>G + T>C nc %;cds:ADAR_W-A- T>C at MC2 %;cds:A3Go_TC-C-G MC1 non-syn %;cds:3Gen3_AT-C- C:G %;cds:ADARh_W-A-S T>C %;cds:A3G_C-C- G>T %;cds:ADARf_SW-A- MC2 %;cds:ADAR_W-A- non-syn %;cds:ADARp_-A-WT T>A motif %;cds:4Gen3_AG-C-T G>A at MC1 motif %;cds:ADAR_3Gen1_-A-CA %;cds:3Gen2_C-C-T MC3 %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:A3B_T-C-W Ti %;g:2Gen1_-C-T %;cds:AIDc_WR-C-GS MC3 %;cds:AIDe_WR-C-GW Hits;cds:AIDd_WR-C-Y C>A cds %;cds:ADARb_W-A-Y MC2 %;cds:A3Gc_C-C-GW C>T motif %;cds:2Gen1_-C-C G>T at MC1 %;cds:3Gen1_-C-CA Ti %;cds:Other G MC3 Ti/Tv %;cds:CDS Variants;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:A3Gn_YYC-C-S C>T %;cds:A3Bf_ST-C-G Ti %;cds:2Gen2_G-C- Hits;cds:AIDd_WR-C-Y %;cds:A3F_T-C- G>C %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gi_SG-C-G MC2 %;cds:Other MC3 %;nc:2Gen1_-C-T C>A + G>T nc %;cds:3Gen2_G-C-T %;g:3Gen2_T-C-G C>T + G>A g %;cds:ADARc_SW-A-Y T>C cds %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む、
請求項28から30のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2020年6月1に出願された「Methods of predicting cancer progression」という題名のオーストラリア特許仮出願第2020901790号の優先権を主張し、その内容は全体が参照により本明細書に組み込まれる。
【0002】
本発明は、概して、がんの進行または再発の可能性を予測するシステムおよび方法に関する。より具体的には、本発明は、がんの再発または進行の可能性と相関する核酸突然変異シグネチャーを同定するシステムおよび方法、ならびにそのようなシグネチャーを使用する方法に関する。
【背景技術】
【0003】
がんの進行および/または再発の可能性を正確に予測することは、特定の患者にどの治療剤を投与するか、それらをいつ投与するか、およびそれらをいくらの用量で投与するかを含む、適切な処置プロトコールを開発する際の重要な工程である。この目的のために、様々な研究が、がんの進行に関連する遺伝子シグネチャー(本明細書ではがん進行関連シグネチャー、またはCPASと称される)を同定するために実施されてきた。これらの研究の多くは、予後マーカーとして一塩基多型(SNP)の同定を伴う、遺伝子中心のアプローチに基づいていると考慮され得る。
【0004】
これらの研究の多くの結果は、COSMICデータベースにおいてキュレートされる。例えば、Li Mら(2017)による主要な研究では、膀胱癌、腺癌、ユーイング肉腫、胚細胞腫瘍、悪性黒色腫および乳がんを含む多くの異なるがん種の進行に関連することが見出されている、例えば、FOXM1、E2F1およびPYGM遺伝子の変異体を含む、いくつかの既知のがん遺伝子の変異体が同定されている。
【0005】
これまでの多くの例において、同定されたがん進行予測マーカーは、単一の変異体(または単一の変異体の組合せ)の遺伝子バイオマーカーであり、そのため、各々が、がん患者集団のごく一部(すなわち、1%~5%)に見出されているだけである。したがって、異種集団におけるこれらの有用性は限られていることがある。さらに、マーカーは、将来の診断および治療の開発に有効であり得る知識である、変形形態または突然変異の原因の可能性の指標を提供しない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
さらなるがん進行関連のシグネチャーの同定、ならびにがんを有する患者におけるがんの進行および/または再発の可能性を判定するためのさらなる方法の開発に対する必要性が依然として存在する。
【課題を解決するための手段】
【0007】
本発明は、がんの進行に関連する遺伝子シグネチャー(本明細書ではがん進行関連シグネチャー、またはCPASと称される)の同定、ならびにがんを有する患者におけるがんの進行および/または再発の可能性または蓋然性を予測または判定するための方法に部分的に基づいている。したがって、この方法の1つの利点は、がんが進行または再発する可能性の判定に基づいて処方される、がんを有する、または有したことのある対象のための処置レジメンを可能にすることである。例えば、がんが、対象において進行または再発する可能性が高いと判定された場合、対象は、抗がん治療の厳しい過程を継続し得るか、または抗がん治療のより積極的な過程を施され得る。逆に、がんが対象において再発する可能性が低いと判定された場合、対象は、既存の抗がん治療を中止、低減、または変更することができる。
【0008】
したがって、一態様では、対象におけるがんが進行または再発する可能性を判定するための方法であって、がんを有する対象由来の核酸分子の配列を解析して、核酸分子内の一塩基多様性(SNV)を検出することと、メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて複数のメトリックを決定することと、メトリックの対象プロファイルと参照プロファイルとの間の比較に基づいて、がんが進行または再発する可能性を判定することとを含み、複数のメトリックが、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリック(例えば、少なくとも5、10、15、20、35、30、40、45または50個のメトリック)を含む、方法が提供される。一部の例では、参照プロファイルは、進行または再発する可能性が高いがんを表す。他の例では、参照プロファイルは、進行または再発する可能性が低いがん(またはがんを有する対象)を表す。
【0009】
がんを有する対象を処置するための方法であって、上記および本明細書に記載される方法に従った、がんまたは腫瘍が進行または再発する可能性が高いという判定に基づいてがん治療を対象に曝露することを含む、方法も提供される。
【0010】
別の態様では、対象におけるがんを処置する方法であって、(i)上記および本明細書に記載される対象におけるがんが進行または再発する可能性を判定するための方法を実施することと、(ii)がんが進行または再発する可能性が高いことを判定することと、(iii)がん治療(例えば、放射線療法、手術、化学療法、ホルモン療法、免疫療法または標的療法)に対象を曝露することとを含む、方法が提供される。
【0011】
さらなる態様では、対象におけるがんの進行または再発の可能性を評価する際に使用するための進行指標を生成するためのシステムであって、a)対象由来の核酸分子の配列を示す対象データを取得する、b)対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する、c)同定されたSNVを使用して、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリック(例えば、少なくとも5、10、15、20、35、30、40、45または50個のメトリック)を含む、複数のメトリックを決定する、d)がんの進行または再発の可能性と複数のメトリックとの間の関係を具体化し、がんの既知の進行または再発を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がんの進行または再発の可能性を示す進行指標を決定する、1つまたは複数の電子処理デバイスを含むシステムが提供される。一部の例では、少なくとも1つの計算モデルは、決定木を含む。特定の例では、少なくとも1つの計算モデルは、複数の決定木を含み、治療指標が、複数の決定木からの結果を集めることによって生成される。
【0012】
別の態様では、少なくとも1つの計算モデルを計算する際に使用するためのシステムであって、少なくとも1つの計算モデルが、対象におけるがんの進行または再発の可能性を評価する際に使用するための進行指標を生成するために使用され、システムが、a)複数の参照対象の各々について、i)(1)参照対象由来の核酸分子の配列、および(2)がんの進行または再発を示す参照対象データを取得する、ii)参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する、iii)同定されたSNVを使用して、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリック(例えば、少なくとも5、10、15、20、35、30、40、45または50個のメトリック)を含む複数のメトリックを決定する、ならびにb)複数の参照メトリックおよび参照対象のがんの既知の進行または再発を使用して、がんの進行または再発と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、1つまたは複数の電子処理デバイスを含む、システムが提供される。
【0013】
このようなシステムの一部の実施形態では、1つまたは複数の処理デバイスが、少なくとも1つの計算モデルを試験して、モデルの識別性能を判定する。一部の例では、識別性能が、a)受信者動作特性曲線下の面積、b)精度、c)感度、およびd)特異度のうちの少なくとも1つに基づく。一例では、識別性能が、少なくとも60%である。
【0014】
一部の実施形態では、1つまたは複数の処理デバイスが、複数の参照対象のサブセットからの参照対象データを使用して少なくとも1つの計算モデルを試験する。一部の実施形態では、1つまたは複数の処理デバイスが、a)複数の参照メトリックを選択する、b)複数の参照メトリックを使用して少なくとも1つの計算モデルを訓練する、c)少なくとも1つの計算モデルを試験して、モデルの識別性能を判定する、ならびにd)モデルの識別性能が閾値よりも下に下がる場合には、i)異なる複数の参照メトリックを使用して、少なくとも1つの計算モデルを選択的に再訓練する、およびii)異なる計算モデルを訓練する、のうちの少なくとも1つを行う。さらなる実施形態では、1つまたは複数の処理デバイスが、a)複数の参照メトリックの組合せを選択する、b)組合せの各々を使用して複数の計算モデルを訓練する、c)各々の計算モデルを試験して、モデルの識別性能を判定する、およびd)進行指標を決定する際に使用するために、最高の識別性能を有する少なくとも1つの計算モデルを選択する。
【0015】
別の態様では、対象におけるがんの進行または再発の可能性を評価する際に使用するための進行指標を生成するための方法であって、1つまたは複数の電子処理デバイスにおいて、a)対象由来の核酸分子の配列を示す対象データを取得することと、b)対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定することと、c)同定されたSNVを使用して、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個以上のメトリック(例えば、少なくとも5、10、15、20、35、30、40、45または50個のメトリック)を含む複数のメトリックを決定することと、d)がんの進行または再発と複数のメトリックとの間の関係を具体化し、がんの既知の進行または再発を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がんの進行または再発を示す進行指標を決定することとを含む、方法が提供される。
【0016】
本開示の方法およびシステムの一部の実施形態では、がんが、副腎がん、乳がん、脳がん、前立腺がん、肝がん、結腸がん、胃がん、膵がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、直腸がん、卵巣がん、子宮がん、頭頸部がん、中皮腫および肉腫の中から選択される。
【0017】
特定の実施形態では、がんが中皮腫であり、複数のメトリックが、cds:A3Bf_ST-C-G Ti %;g:3Gen2_T-C-G C>T + G>A g %;cds:2Gen1_-C-C C>T at MC1 %;cds:All C Ti/Tv %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen2_C-C-C MC3 %;cds:A3Gn_YYC-C-S C>T %;cds:A3G_C-C- MC3 %;cds:3Gen3_GG-C- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;cds:4Gen3_TT-C-C %;cds:3Gen2_C-C-T MC3 %;g:2Gen1_-C-T C>G + G>C g %;cds:Primary Deaminase %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:4Gen3_CA-C-C %;cds:A3G_C-C- G>T %;cds:A3Gi_SG-C-G non-syn %;g:C>G + G>C %;cds:Other MC3 %;cds:A3B_T-C-W G>A motif %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む。
【0018】
他の実施形態では、がんが副腎皮質癌であり、複数のメトリックが、cds:All G total;cds:3Gen1_-C-TG G non-syn %;g:A3F_T-C- Hits;cds:3Gen3_GG-C- non-syn %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;cds:3Gen2_C-C-T MC3 %;nc:A3G_C-C- C>T + G>A nc %;cds:AIDd_WR-C-Y %;cds:3Gen1_-C-TC C>T cds %;cds:A3B_T-C-W G>A motif %;g:CG total;cds:A3G_C-C- MC3 %;cds:AIDb_WR-C-G G non-syn %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen3_TG-C- G>A %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen2_A-C-G MC2 non-syn %;cds:3Gen3_CT-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;g:AIDh_WR-C-T C>A + G>T g %;cds:A3B_T-C-W MC3 non-syn %;cds:2Gen1_-C-C C>A %;cds:A1_-C-A G>A at MC3 cds %;cds:3Gen1_-C-CA Ti C:G %;cds:ADAR_W-A- non-syn %;cds:3Gen1_-C-CA Ti %;cds:All G %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gb_-C-G MC1 %;cds:A3B_T-C-W G non-syn %;nc:2Gen2_A-C- C>T + G>A nc %;cds:A3Gi_SG-C-G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:A3B_T-C-W Ti %;およびg:2Gen1_-C-T %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む。
【0019】
さらなる実施形態では、がんが脳がんであり、複数のメトリックが、g:CG total;cds:AIDd_WR-C-Y %;variants in VCF;cds:4Gen3_TA-C-C non-syn %;cds:3Gen2_C-C-T MC3 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gb_-C-G MC1 %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W G non-syn %;g:3Gen3_GA-C- C>A + G>T g %;cds:2Gen2_G-C- Hits;cds:AIDc_WR-C-GS MC3 %;cds:All G total;cds:All A non-syn %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_A-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;g:ADARk_CW-A- A>G + T>C g %;nc:ADARb_W-A-Y A>G + T>C nc %;g:2Gen1_-C-T %;cds:Other MC3 C %;g:2Gen1_-C-T C>G + G>C g %;cds:ADAR_W-A- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen1_-C-GC MC2 %;cds:3Gen2_G-C-T %;cds:A3F_T-C- G>C %;g:4Gen3_GG-C-G C>T + G>A g %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3F_T-C- Hits;cds:3Gen2_T-C-C MC1 %;cds:A3B_T-C-W Ti %;cds:ADAR_3Gen1_-A-AT Ti %;cds:ADARh_W-A-S T>C %;cds:A3Gn_YYC-C-S C>T %;cds:A3Ge_SC-C-GS %;cds:2Gen2_A-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:Primary Deaminase %;g:C>G + G>C %;cds:A3Bf_ST-C-G Ti %;cds:3Gen3_CT-C- MC3 %;cds:A3Gi_SG-C-G non-syn %;cds:Other MC3 %;cds:ADAR_3Gen1_-A-CA %;cds:A3F_T-C- C>A %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3Gc_C-C-GW C>T motif %;cds:AIDc_WR-C-GS %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:2Gen1_-C-C C>A %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;g:3Gen1_-C-TC C>T + G>A g %;g:C>A + G>T %;cds:3Gen2_A-C-C MC2 %;cds:2Gen1_-C-C MC2 %;g:3Gen2_G-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:3Gen1_-C-TG G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A MC2 Hits;cds:3Gen1_-C-TC C>T cds %;cds:2Gen1_-C-T MC3 non-syn %;cds:AIDb_WR-C-G G non-syn %;g:AIDc_WR-C-GS Hits;cds:3Gen2_T-C-C MC3 %;cds:3Gen2_T-C-G Ti/Tv %;cds:A1_-C-A G>A at MC3 cds %;nc:A3G_C-C- C>T + G>A nc %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen3_TG-C- G Ti/Tv %;cds:3Gen1_-C-CA Ti %;cds:3Gen3_TG-C- G>A %;cds:3Gen3_CT-C- G non-syn %;cds:All C Ti/Tv %;cds:A3G_C-C- MC3 %;cds:ADARc_SW-A-Y MC2 %;およびcds:3Gen3_GG-C- non-syn %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む。
【0020】
他の実施形態では、がんが肉腫であり、複数のメトリックが、cds:Other MC3 C %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:4Gen3_TT-C-T %;g:ADARk_CW-A- A>G + T>C g %;g:ADARn_-A-WA A>G + T>C %;cds:A3G_C-C- G>T %;cds:A3Gb_-C-G MC1 %;nc:ADARb_W-A-Y %;cds:A3Ge_SC-C-GS %;cds:Primary Deaminase %;cds:ADAR_2Gen2_G-T- MC2 %;g:4Gen3_GG-C-G C>T + G>A g %;cds:2Gen1_-C-C MC2 %;cds:3Gen1_-C-GT G>A motif %;cds:A3Gn_YYC-C-S C>T %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3B_T-C-W MC3 non-syn %;cds:AIDd_WR-C-Y %;g:3Gen3_CA-C- C>T + G>A g %;cds:All A non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3Bj_RT-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:A3B_T-C-W G non-syn %;cds:A3G_C-C- MC3 %;cds:All G total;cds:CDS Variants;g:CG total;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:AIDc_WR-C-GS %、およびそれらに関連メトリックから選択される少なくとももしくは約5個のメトリックを含む。
【0021】
さらなる実施形態では、がんが肺がんであり、複数のメトリックが、cds:3Gen1_-C-CC C>T at MC1 motif %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:ADARp_-A-WT A>G at MC2 cds %;cds:Other MC3 C %;cds:Other MC3 %;cds:A3Gb_-C-G MC1 %;g:3Gen1_-C-TC C>T + G>A g %;cds:ADAR_W-A- A>G at MC3 %;cds:ADAR_W-A- non-syn %;cds:ADAR_3Gen3_AC-A- A>G cds %;cds:2Gen1_-C-C C>A %;cds:ADARf_SW-A- MC2 %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:4Gen3_GC-C-A %;cds:A3Go_TC-C-G MC1 non-syn %;g:3Gen2_G-C-T %;cds:A3G_C-C- C>T at MC1 %;cds:AIDc_WR-C-GS MC3 %;cds:3Gen1_-C-GT G>A motif %;nc:2Gen1_-C-T C>A + G>T nc %;cds:ADARc_SW-A-Y MC2 %;cds:ADARh_W-A-S T>C %;cds:2Gen1_-C-C C>T at MC1 %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:AIDd_WR-C-Y C>A cds %;nc:A3G_C-C- C>T + G>A nc %;cds:A3Gc_C-C-GW C>T motif %;cds:ADAR_3Gen1_-A-AT Ti %;cds:3Gen3_CT-C- MC3 %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:3Gen2_T-C-C MC1 %;cds:A3G_C-C- G>T %;cds:3Gen1_-C-CA Ti %;cds:3Gen1_-C-TG G non-syn %;cds:3Gen2_A-C-C non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:All A non-syn %;cds:A3Gi_SG-C-G MC2 %;cds:Primary Deaminase %;cds:4Gen3_TT-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;cds:3Gen2_T-C-C MC3 %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CA Ti C:G %;cds:A1_-C-A G>A at MC3 cds %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_G-C-T C:G %;cds:A3Ge_SC-C-GS %;cds:3Gen3_TG-C- G>A %;g:C>A + G>T %;cds:4Gen3_CA-C-C %;cds:AIDd_WR-C-Y G>C %;cds:All G %;cds:3Gen3_TT-C- C>A at MC1 motif %;g:AIDh_WR-C-T C>A + G>T g %;g:4Gen3_GG-C-G C>T + G>A g %;cds:3Gen2_G-C-T C>A motif %;nc:ADARc_SW-A-Y A>G + T>C nc %;g:3Gen2_A-C-C C>A + G>T g %;cds:A3B_T-C-W Ti %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen3_CT-C- C>T at MC1 motif %;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:3Gen1_-C-TC C>T cds %;cds:4Gen3_CA-C-C MC1 %;cds:3Gen2_G-C-T %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen2_A-C-C MC2 %;cds:A3F_T-C- C>A %;cds:CDS Variants;cds:ADAR_3Gen3_CA-A- Ti %;cds:3Gen3_GG-C- non-syn %;cds:ADARb_W-A-Y MC2 %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:2Gen1_-C-C G>T at MC1 %;cds:A3G_C-C- MC3 %;cds:3Gen2_C-C-C MC3 %;cds:A3B_T-C-W G>A motif %;cds:A3F_T-C- G>C %;cds:ADAR_2Gen2_G-T- MC2 %;cds:3Gen1_-C-AG G Ti/Tv %;cds:A3Bj_RT-C-G Ti %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:ADAR_2Gen2_T-T- %;g:2Gen1_-C-T %;cds:4Gen3_AC-C-T Ti/Tv %;cds:A3Gi_SG-C-G non-syn %;cds:A3Bf_ST-C-G Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;g:3Gen3_CA-C- C>T + G>A g %;cds:2Gen2_A-C- MC3 %;variants in VCF;cds:4Gen3_AG-C-T MC1 non-syn %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:ADAR_3Gen1_-A-CA %;cds:4Gen3_TA-C-C non-syn %;cds:All C Ti/Tv %;cds:ADARc_SW-A-Y、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む。
【0022】
一部の実施形態では、がんが皮膚がんであり、複数のメトリックが、cds:4Gen3_AG-C-T MC1 non-syn %;cds:3Gen1_-C-CG G>A at MC3 %;cds:4Gen3_AC-C-T Ti/Tv %;g:C>G + G>C %;cds:A3B_T-C-W MC3 non-syn %;cds:All A non-syn %;cds:3Gen3_AG-C- MC2 %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %;cds:3Gen1_-C-TC C>T at MC3 %;cds:4Gen3_GC-C-C C>T at MC2 %;cds:All C Ti/Tv %;cds:A3Bj_RT-C-G Ti %;cds:AIDh_WR-C-T G>A at MC2 cds %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CC C>T at MC1 motif %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_T-C-C MC1 %;cds:All G %;cds:ADAR_W-A- A>G at MC3 %;cds:A3G_C-C- MC3 %;cds:Other MC3 C %;g:3Gen2_A-C-C C>A + G>T g %;cds:ADARc_SW-A-Y MC2 %;cds:3Gen1_-C-CA Ti C:G %;cds:3Gen1_-C-TC C>T cds %;cds:3Gen2_C-C-C MC3 %;cds:3Gen3_CT-C- C>T at MC1 motif %;g:ADAR_4Gen3_AG-A-G A>C + T>G %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_A-C-C non-syn %;cds:2Gen2_A-C- MC3 %;cds:3Gen2_A-C-C MC2 %;g:3Gen1_-C-TC C>T + G>A g %;cds:3Gen2_T-C-T G>A at MC2 %;cds:2Gen1_-C-C C>T at MC1 %;cds:AIDb_WR-C-G G non-syn %;cds:A3Gb_-C-G MC1 %;cds:2Gen1_-C-C C>A %;cds:A3Ge_SC-C-GS %;g:ADARn_-A-WA A>G + T>C %;g:ADAR_W-A- A>G + T>C %;g:ADAR_2Gen2_G-T- A>T + T>A %;g:AIDh_WR-C-T C>A + G>T g %;cds:4Gen3_TG-C-T Ti C:G %;cds:3Gen2_G-C-T C:G %;cds:3Gen2_T-C-C MC3 %;nc:ADARb_W-A-Y %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:ADAR_3Gen1_-A-AT Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;cds:4Gen3_TA-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen1_-C-AG G Ti/Tv %;cds:AIDc_WR-C-GS %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:2Gen1_-C-C MC2 %;cds:3Gen3_GG-C- non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:A1_-C-A G>A at MC3 cds %;cds:A3G_C-C- C>T at MC1 %;nc:ADARc_SW-A-Y A>G + T>C nc %;cds:ADAR_W-A- T>C at MC2 %;cds:A3Go_TC-C-G MC1 non-syn %;cds:3Gen3_AT-C- C:G %;cds:ADARh_W-A-S T>C %;cds:A3G_C-C- G>T %;cds:ADARf_SW-A- MC2 %;cds:ADAR_W-A- non-syn %;cds:ADARp_-A-WT T>A motif %;cds:4Gen3_AG-C-T G>A at MC1 motif %;cds:ADAR_3Gen1_-A-CA %;cds:3Gen2_C-C-T MC3 %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:A3B_T-C-W Ti %;g:2Gen1_-C-T %;cds:AIDc_WR-C-GS MC3 %;cds:AIDe_WR-C-GW Hits;cds:AIDd_WR-C-Y C>A cds %;cds:ADARb_W-A-Y MC2 %;cds:A3Gc_C-C-GW C>T motif %;cds:2Gen1_-C-C G>T at MC1 %;cds:3Gen1_-C-CA Ti %;cds:Other G MC3 Ti/Tv %;cds:CDS Variants;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:A3Gn_YYC-C-S C>T %;cds:A3Bf_ST-C-G Ti %;cds:2Gen2_G-C- Hits;cds:AIDd_WR-C-Y %;cds:A3F_T-C- G>C %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gi_SG-C-G MC2 %;cds:Other MC3 %;nc:2Gen1_-C-T C>A + G>T nc %;cds:3Gen2_G-C-T %;g:3Gen2_T-C-G C>T + G>A g %;cds:ADARc_SW-A-Y T>C cds %、およびそれらに関連するメトリックから選択される少なくとももしくは約5個のメトリックを含む。
【0023】
生体試料は、がんに罹患した組織型から得られ得る。一部の例では、生体試料は、卵巣、乳房、前立腺、肝臓、結腸、胃、膵臓、皮膚、甲状腺、頸部、リンパ球、造血器、膀胱、肺、腎臓、直腸、子宮、および頭頸部の組織または細胞を含む。
【0024】
本発明の実施例を、添付の図面を参照してここで説明するが、図面の内容は以下の通りである。
【図面の簡単な説明】
【0025】
【
図1】
図1は、対象におけるがんの進行または再発の可能性を評価するための進行指標を生成するための方法の例のフローチャートである。
【
図2】
図2は、計算モデルを訓練するためのプロセスの例のフローチャートである。
【
図3】
図3は、ネットワーク構造の例の模式図である。
【
図5】
図5は、クライアントデバイスの例の模式図である。
【
図6】
図6は、対象におけるがんの進行または再発の可能性を評価するための進行指標を生成する方法の具体的な例のフローチャートである。
【
図7】
図7は、中皮腫(MESO)検証データセットにおける患者の転帰を予測するためのモデルの適用の結果を示す。A)11人の患者を「高PFS」(すなわち、がんが12ヶ月間の前に進行しなかった患者)または「低PFS」(すなわち、がんが12ヶ月間の前に進行した患者)のいずれかとして分類した。検証データセットにおける全ての患者が「高PFS」または「低PFS」として正確に分類された。予測の全体的な精度は100%(精度:100%、感度:1、特異度:1)であった。検証用患者の100%が「高PFS」として正確に分類され(3/3)、100%が「低PFS」として正確に分類された(8/8)。B)PFS分布の比較のためのログランク統計検定を含む、カプラン・マイヤー曲線。
【
図8】
図8は、副腎皮質癌(ADCC)検証データセットにおける患者の転帰を予測するためのモデルの適用の結果を示す。A)13人の患者を「高PFS」(すなわち、がんが24ヶ月間の前に進行しなかった患者)または「低PFS」(すなわち、がんが24ヶ月間の前に進行した患者)のいずれかとして分類した。予測の全体的な精度は100%(精度:100%、感度:1.00、特異度:1.00)であり、検証用患者の100%が「高PFS」として正確に分類され(7/7)、100%が「低PFS」として正確に分類された(6/6)。B)PFS分布の比較のためのログランク統計検定を含む、カプラン・マイヤー曲線。
【
図9】
図9は、低悪性度グリオーマ(BLGG)検証データセットにおける患者の転帰を予測するためのモデルの適用の結果を示す。A)44人の患者を「高PFS」(すなわち、がんが24ヶ月間の前に進行しなかった患者)または「低PFS」(すなわち、がんが24ヶ月間の前に進行した患者)のいずれかとして分類した。予測の全体的な精度は84%(精度:84.09%、感度:0.8846、特異度:0.7778)であり、検証用患者の88%が「高PFS」として正確に分類され(23/26)、77%が「低PFS」として正確に分類された(14/18)。B)PFS分布の比較のためのログランク統計検定を含む、カプラン・マイヤー曲線。
【
図10】
図10は、肉腫(SARC)検証データセットにおける患者の転帰を予測するためのモデルの適用の結果を示す。A)31人の患者を「高PFS」(すなわち、がんが18ヶ月間の前に進行しなかった患者)または「低PFS」(すなわち、がんが18ヶ月間の前に進行した患者)のいずれかとして分類した。予測の全体的な精度は81%(精度:80.65%、感度:0.9500、特異度:0.5455)であり、検証用患者の95%が「高PFS」として正確に分類され(19/20)、54.55%が「低PFS」として正確に分類された(6/11)。B)PFS分布の比較のためのログランク統計検定を含む、カプラン・マイヤー曲線。
【
図11】
図11は、肺扁平上皮癌(LUSC)検証データセットにおける患者の転帰を予測するためのモデルの適用の結果を示す。43人の患者を「高PFS」(すなわち、がんが36ヶ月間の前に進行しなかった患者)または「低PFS」(すなわち、がんが36ヶ月間の前に進行した患者)のいずれかとして分類した。予測の全体的な精度は67%(精度:67.44%、感度:0.7586、特異度:0.500)であり、検証用患者の75.86%が「高PFS」として正確に分類され(22/29)、50%が「低PFS」として正確に分類された(7/14)。B)PFS分布の比較のためのログランク統計検定を含む、カプラン・マイヤー曲線。
【
図12】
図12は、黒色腫(SKCM)検証データセットにおける患者の転帰を予測するためのモデルの適用の結果を示す。56人の患者を「高PFS」(すなわち、がんが30ヶ月間の前に進行しなかった患者)または「低PFS」(すなわち、がんが30ヶ月間の前に進行した患者)のいずれかとして分類した。予測の全体的な精度は73%(精度:73.21%、感度:0.8485、特異度:0.5652)であり、検証用患者の84.85%が「高PFS」として正確に分類され(28/33)、56.52%が「低PFS」として正確に分類された(13/23)。B)PFS分布の比較のためのログランク統計検定を含む、カプラン・マイヤー曲線。
【発明を実施するための形態】
【0026】
1.定義
別段の定義がない限り、本明細書で使用される全ての技術用語および科学用語は、本発明が属する技術分野における当業者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様または等価の任意の方法および材料を、本発明の実施または試験において使用することができるが、好ましい方法および材料を説明する。本発明の目的のために、以下の用語を下記に定義する。
【0027】
「1つの(a)」および「1つの(an)」という冠詞は、冠詞の文法上の目的語の1つまたは1つよりも多く(すなわち、少なくとも1つ)を指すように本明細書で使用される。例として、「糖種(glycospecies)バイオマーカー」は、1つの糖種バイオマーカーまたは1つより多い糖種バイオマーカーを意味する。
【0028】
本明細書で使用される場合、「および/または」とは、付随する列記された項目のうちの1つまたは複数の任意のおよび全ての可能な組合せ、ならびに選択的に解釈される場合(または)は組合せの欠如を指し、かつそれを包含する。
【0029】
本明細書で使用される場合、「約」という用語は、およそ、ほぼ、大まかに、または付近を意味する。「約」という用語が数値範囲と共に使用される場合、それは、示される数値の上および下の境界を拡張することによって、その範囲を改変する。概して、「約」という用語は、10%の分散によって述べられた値の上および下の数値を改変するように、本明細書で使用される。したがって、約50%は、45%~55%の範囲を意味する。終点によって本明細書で列挙される数値範囲は、その範囲内に包摂される全ての数および分数を含む(例えば、1~5は、1、1.5、2、2.75、3、3.90、4、および5を含む)。全ての数およびその分数は、「約」という用語によって改変されるように推定されることもまた、理解されるべきである。
【0030】
本明細書で使用される場合、「生体試料」という用語は、対象または患者から抽出され、処理されず、処理され、希釈され、または濃縮され得る試料を指す。好適には、生体試料は、毛髪、皮膚、爪、組織または体液、例えば唾液および血液を含むが、それらに限定されない、患者の身体の任意の部分から選択される。本開示の目的のために、生体試料は、典型的には、がんまたは腫瘍の細胞または組織を含む。
【0031】
本明細書で使用される場合、SNVに関する「コドンコンテキスト」という用語は、SNVが起こるコドン内のヌクレオチド位置を指す。本開示の目的のために、影響を受けたコドン(MC;すなわち、SNVを含有するコドン)内のヌクレオチド位置は、MC-1、MC-2およびMC-3と注釈を付けられ、コドンの配列が5’から3’へ読まれる場合、それぞれ、第1、第2および第3のヌクレオチド位置を指す。したがって、「SNVのコドンコンテキストを決定する」という語句または同様の語句は、SNVが起こる、影響を受けたコドン内のヌクレオチド位置、すなわち、MC-1、MC-2またはMC-3を決定することを意味する。
【0032】
本明細書および添付の特許請求の範囲を通して、別段文脈が必要としない限り、「含む(comprise)」という単語、ならびに「含む(comprises)」および「含むこと(comprising)」などの変形形態は、述べられた整数もしくは工程または整数もしくは工程の群の包含を含意するが、任意の他の整数もしくは工程または整数もしくは工程の群の除外を含意しないように理解される。「からなる」とは、「からなる」という語句に続くものは何でも、それを含み、かつそれに限定されることを意味する。したがって、「からなる」という語句は、列記された要素が必要とされるかまたは必須であること、およびいかなる他の要素も存在し得ないことを示す。「から本質的になる」とは、語句の後に列記された任意の要素を含み、かつ列記された要素についての開示において特定される活性または作用を干渉しないかまたはそれに寄与する他の要素に限定されることを意味する。
【0033】
本開示の文脈で使用される場合、「対照対象」または「参照対象」という用語は、がんの進行もしくは再発が知られている、例えば、進行もしくは再発しなかったがんを有するもしくは有していた、または進行もしくは再発したがんを有するもしくは有していた対象を指す。対照または参照対象は、多数の研究についての標準としての使用のためにデータを取得するのに使用することができ、すなわち、それは、多数の異なる対象について何度も使用することができると理解される。換言すると、例えば、対象試料を対照または参照試料と比較する場合、対照または参照試料由来のデータは、異なる実験のセットにおいて得られていることがあり、例えば、それは、多くの対象から得られた平均であり、試験対象についてのデータが得られた時に実際には得られていないことがある。
【0034】
「相関させること」という用語は、概して、1つのタイプのデータと、別のものまたは状態との間の関係を決定することを指す。様々な実施形態では、プロファイルを、対象が進行もしくは再発するがんを有する可能性と相関させることは、対象における本明細書に記載されるメトリックを評価することと、これらのメトリックのレベルと、進行もしくは再発した、または進行もしくは再発しなかったがんを有するまたは有していたことが知られているヒト(例えば参照プロファイルによって表される)におけるメトリックと比較することとを含む。
【0035】
「遺伝子」とは、ゲノム上の特定の遺伝子座を占有し、転写および/もしくは翻訳制御配列ならびに/またはコード領域および/もしくは非翻訳配列(すなわち、イントロン、5’および3’非翻訳配列)を含む、遺伝物の単位を意味する。
【0036】
本明細書で使用される場合、「可能性」という用語または文法的変形形態は、対象が、特定の時間枠内におよび/または特定の程度によってなどで、進行または再発するがんを有するかどうかの尺度として使用される。可能性の増加は、例えば、相対的または絶対的であってもよく、かつ、定性的または定量的に表されてもよい。例えば、がんが進行もしくは再発する可能性の増加は、対象が、参照プロファイルと本質的に同じまたは異なるメトリックのプロファイルを有するかどうかを決定することと、試験対象を、「可能性の増加」のカテゴリーまたは「可能性の低下」のカテゴリーに置くことによって表され得る。
【0037】
一部の実施形態では、この方法は、所定の範囲の間隔の外側にある、または「閾値スコア」に対するカットオフを上回るもしくは下回るメトリックセットにおけるメトリックの数に基づいてスコアを比較することを含む。閾値スコアは、対象を進行または再発する可能性が高いがんを有するとして、および対象を進行または再発する可能性が低いがんを有するとして同定するための、許容される能力を提供するものであり、任意の許容される手段を使用して当業者によって決定され得る。
【0038】
一部の例では、可能性を決定する場合、受信者動作特性(ROC)曲線は、第1の集団が第1の表現型またはリスクを有し、第2の集団が第2の表現型またはリスクを有する2つの集団において、変数の値対その相対頻度をプロットすることによって算出される。がんが進行または再発する対象、およびがんが進行または再発しない対象において、特定のメトリックの値、または所定の範囲の間隔の外側である、もしくはカットオフを上回るもしくは下回るメトリックの数の分布は、重複してもよい。そのような条件下で、試験は、100%の精度で、2つの群の間を絶対に区別するわけではない。閾値を選択することができ、その上で試験が「陽性」とみなされ、その下で試験が「陰性」とみなされる。ROC曲線下の面積(AUC)は、C統計値を提供し、これは、認識された測定が条件の正確な同定を可能にする蓋然性の尺度である[例えば、Hanley et al, Radiology 143:29-36(1982)を参照のこと]。「曲線下の面積」または「AUC」という用語は、受信者動作特性(ROC)曲線の曲線下面積を指し、その両方が、当該技術分野において周知である。AUC尺度は、完全なデータ範囲にわたって分類子の精度を比較するために有用である。より大きなAUCを有する分類子は、未知のものを目的の2つの群の間で正しく分類する、より大きな能力を有する。ROC曲線は、2つの集団の間を区別するかまたは識別する際の特定の特徴の性能をプロットするために有用である。典型的には、集団全体にわたる特徴データ(例えば、事例および対照)は、単一の特徴の値に基づいて昇順で選別される。次いで、その特徴の各値について、データの真陽性率および偽陽性率が算出される。感度は、その特徴の値を上回る事例の数を計数すること、次いで事例の総数で割ることによって決定される。特異度は、その特徴の値を下回る対照の数を計数すること、次いで対照の総数で割ることによって決定される。この定義は、特徴が対照と比較して事例において上昇しているシナリオを指すが、この定義はまた、特徴が対照と比較して事例においてより低いシナリオにも当てはまる(そのようなシナリオにおいては、その特徴の値を下回る試料が計数される)。ROC曲線は、単一の特徴について、および他の単一の出力について生成させることができ、例えば、単一の値を生じるために、2つ以上の特徴の組合せを、数学的に組み合わせる(例えば、加算する、減算する、乗算するなど)ことができ、この単一の値を、ROC曲線においてプロットすることができる。さらに、組合せが単一の出力値を導く、多数の特徴(例えば、1つまたは複数の他の後成的マーカー)の任意の組合せを、ROC曲線においてプロットすることができる。これらの特徴の組合せは、試験を含んでもよい。ROC曲線は、試験の特異度に対する試験の感度のプロットであり、感度は、従来的に垂直軸上に示され、特異度は、従来的に水平軸上に示される。したがって、「AUC ROC値」は、分類子が、ランダムに選択された陽性の例を、ランダムに選択された陰性のものよりも高くにランク付けする蓋然性と同等である。AUC ROC値は、群が連続的データのものである場合に考慮される2つの群において得られるスコア間の差の中央値について検定する、マン・ホイットニーのU検定、またはウィルコクソン順位検定と等価であると考えられ得る。
【0039】
本明細書で使用される場合、SNVまたはメトリックに関する「レベル」とは、SNVまたはメトリックの数、パーセンテージ、量または比を指す。
【0040】
本明細書で使用される場合、「メトリック」とは、一塩基多様性(SNV)の数、パーセンテージ、比および/またはタイプを指す。本開示のメトリックは、特定のSNV、例えば、核酸分子のコード領域におけるSNV;核酸分子の非コード領域におけるSNV;核酸分子のコード領域および非コード領域の両方におけるSNV;SNVのコードコンテキストが評価されているSNV;転位または転換であると決定されているSNV;同義または非同義であると決定されているSNV;鎖バイアスに起因するかまたは関連するSNV;アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNV;特定のモチーフ(例えば、デアミナーゼまたは3量体モチーフ)中に存在するSNV;ならびにモチーフ中に存在するまたはしないいずれかのSNV(すなわち、モチーフ非依存的メトリック群)の数、パーセンテージまたは比に関連するか、それを反映するか、またはそれを示す。
【0041】
本明細書で使用される場合、「SNVタイプ」とは、SNVを含む特定のヌクレオチド置換を指し、CからT、CからA、CからG、GからT、GからA、GからC、AからT、AからC、AからG、TからA、TからC、およびTからGへのSNVの中から選択される。このように、例えば、CからTへのSNVは、標的とされているヌクレオチドCが、代わりになるヌクレオチドTで置き換えられているSNVを指す。
【0042】
本明細書で使用される場合、「核酸」は、DNA、cDNA、mRNA、RNA、rRNAまたはcRNAを指定する。この用語は、典型的には、長さが30ヌクレオチド残基よりも長いポリヌクレオチドを指す。
【0043】
本明細書で使用される場合、「所定の範囲の間隔」とは、メトリックについての「正常な」値の範囲を表すメトリックについての上限および下限を伴う値の範囲を指す。所定の範囲の間隔は、2人以上の対照対象におけるメトリックを評価することによって決定され得る。次いで、範囲の間隔を算出して、その対照対象におけるそのメトリックについての正常な値と考えられるものの上限および下限を設定する。特定の例において、範囲の間隔は、平均プラスまたはマイナスnの標準偏差を測定することによって算出され、それにより、範囲の間隔の下限は、平均マイナスnの標準偏差であり、範囲の間隔の上限は、平均プラスnの標準偏差である。なおさらなる例では、所定の範囲の間隔の上限および下限は、受信者動作特性(ROC)曲線を使用して確立される。所定の範囲の間隔を決定するために使用される対象は、任意の年齢、性別もしくは背景であってもよいか、または特定の年齢、性別、民族的背景もしくは他の亜集団であってもよい。したがって、一部の実施形態では、2つ以上の範囲の間隔を同じメトリックについて算出することができ、それにより、各範囲の間隔は、特定の亜集団、例えば、特定の性別、年齢群、民族的背景および/または他の亜集団に特異的である。所定の範囲の間隔は、手動の算出法、アルゴリズム、ニューラルネットワーク、サポートベクターマシン、深層学習、線形モデルでのロジスティック回帰、機械学習、人工知能および/またはベイジアンネットワークを含む、当業者に公知の任意の技術を使用して決定することができる。
【0044】
本明細書で使用される場合、メトリックに関して「カットオフ」とは、メトリックについての値の上限または下限を指し、それより上または下は、その表現型についての(例えば、進行または再発する可能性が高いがん、および進行または再発する可能性が低いがんについての)メトリックについての「正常な」値の範囲を表す。カットオフは、2人以上の対照対象におけるメトリックを評価することによって決定され得る。次いで、カットオフを算出して、そのメトリックについての正常な値と考えられるものの上限または下限を設定する。特定の例では、カットオフは、平均プラスまたはマイナスnの標準偏差を測定することによって算出され、それにより、カットオフの下限は、平均マイナスnの標準偏差であり、カットオフの上限は、平均プラスnの標準偏差である。なおさらなる例では、カットオフは、受信者動作特性(ROC)曲線を使用して確立される。カットオフを決定するために使用される対象は、任意の年齢、性別もしくは背景であってもよいか、または特定の年齢、性別、民族的背景もしくは他の亜集団であってもよい。したがって、一部の実施形態では、2つ以上のカットオフを同じメトリックについて算出することができ、それにより、各カットオフは、特定の亜集団、例えば、特定の性別、年齢群、民族的背景および/または他の亜集団に特異的である。カットオフは、手動の算出法、アルゴリズム、ニューラルネットワーク、サポートベクターマシン、深層学習、線形モデルでのロジスティック回帰、機械学習、人工知能および/またはベイジアンネットワークを含む、当業者に公知の任意の技術を使用して決定することができる。
【0045】
本明細書で使用される場合、「再発する」、「再発」などの用語は、がんまたは腫瘍に対する一次処置が首尾よく施された後(すなわち、一次処置の結果、一定の期間、がんまたは腫瘍の部分的または完全な退縮をもたらした後)の対象における腫瘍またはがん性細胞の再成長を表す。腫瘍は、元の部位においてまたは身体の別の部分において再発し得る。一実施形態では、再発する腫瘍は、対象が処置された元の腫瘍と同じ種類のものである。例えば、対象が卵巣がん腫瘍を有しており、処置され、その後に別の卵巣がん腫瘍を発症した場合、腫瘍は再発している。加えて、がんは、それが当初発生した臓器もしくは組織とは異なる臓器もしくは組織において再発し得るか、またはそのような臓器もしくは組織に転移し得る。
【0046】
本明細書で使用される場合、「進行する」、「進行」などの用語は、転移を含む、がんの成長、発生、および/または成熟の任意の尺度を指す。がんの進行には、例えば、がん細胞の数、がん細胞のサイズ、腫瘍のサイズ、および腫瘍の数の増加、ならびに形態学的変化、ならびに他の細胞および分子の変化、ならびに他の特徴が含まれ、一次処置またはその後の処置の前、間、または後に発生し得る。進行は、任意の適切な方法で評価および表現することができ、絶対的であってもよいか(例えば、がんが進行もしくは再発している、またはがんが進行もしくは再発する)、または時間枠の観点であってもよい(例えば、所与の時間枠内にがんが進行もしくは再発している、または所与の時間枠内にがんが進行もしくは再発する)。一例では、進行は、無増悪生存(PFS)期間、例えば、がんが進行していない、または患者が死んでいない時間の長さ(一部の場合、がんの処置の間および後)として表現される。そのような例では、対象が、進行する可能性が高いがんを有するという判定は、対象が比較的短い(例えば、設定された月数または年数)PFS期間を有するという判定であり得るが、対象が、進行する可能性が低いがんを有するという判定は、対象が比較的長いPFS期間を有するという判定であり得る。
【0047】
本明細書で使用される場合、「感度」という用語は、本開示の予測方法またはキットが、例えば、予測された診断を有する、生体試料が陽性である場合に、陽性の結果を与える蓋然性を指す。感度は、真陽性および偽陰性の合計で割った、真陽性の結果の数として算出される。感度は、本質的には、本開示がいかに良好に、予測された診断を有する人々を予測された診断を有しない人々から正しく特定するかの尺度である。感度が、少なくとも約50%であり、例えば、少なくとも約55%、60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%であり得るように、統計学的方法およびモデルを選択することができる。
【0048】
本明細書で使用される場合、「特異度」という用語は、本開示の予測方法またはキットが、陽性結果と陰性結果とを区別する、例えば、2つの診断を区別することができる蓋然性を指す。特異度は、真陰性および偽陽性の合計で割った、真陰性の結果の数として算出される。特異度が、少なくとも約50%であり、例えば、少なくとも約55%、60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%であり得るように、統計学的方法およびモデルを選択することができる。
【0049】
本明細書で使用される場合、「一塩基多様性」、「SNV」または「変異体」とは、核酸分子(例えば、対象核酸分子)の配列において別の核酸分子(例えば、参照核酸分子または配列)と比較して起こる多様性を指し、多様性は、単一ヌクレオチド(例えば、A、T、CまたはG)の同一性における相違である。例えば、「A変異体」または「A SNV」への言及は、Aが変異ヌクレオチドまたは標的とされたヌクレオチドである、変異体またはSNVを意味する。例えば、「A>G変異体」または「A>G SNV」への言及は、AがGで置き換えられた変異体またはSNVを意味する。
【0050】
本明細書において互換的に使用される「対象」、「個体」または「患者」という用語は、任意の動物対象、特に哺乳動物対象を指す。例証となる例として、適している対象は、ヒトである。
【0051】
本明細書で使用される場合、「処置する」および「処置すること」という用語は、別段の指示がない限り、治療的処置および予防的もしくは防止的措置の両方を指し、目的は、例えば、腫瘍もしくはがん細胞のサイズもしくは数、またはがんもしくは腫瘍の成長もしくは広がりの速度を減少させるために、障害もしくは状態、例えば、がんに関連する1つもしくは複数の症状を、部分的にまたは完全に、のいずれかで、抑制する、改善する、または減速させる(少なくする)ことである。本明細書で使用される場合、「処置」という用語は、別段の指示がない限り、処置する行為を指す。
【0052】
本明細書で使用される場合、「処置レジメン」という用語は、治療的レジメン(すなわち、がんの診断、またはがんの進行もしくは再発後)を指す。「処置レジメン」という用語は、天然物質および薬学的作用物質、ならびに任意の他の処置レジメンを包含する。
【0053】
【0054】
当業者は、本明細書に記載された態様および実施形態が、具体的に記載されたもの以外の変形形態および改変を受けやすいことを理解するであろう。本開示は、そのような変形形態および改変を全て含むことを理解されたい。本開示はまた、本明細書で個別にまたは集合的に参照または指示される工程、特徴、組成物および化合物の全て、ならびに前記工程または特徴の任意の2つ以上の任意および全ての組合せを含む。
【0055】
2.メトリック
本明細書で記載される場合、核酸分子において同定されたSNVは、複数のメトリックを決定するために使用され得る。本開示の目的のために、特定のメトリックは、結果としてCPASであると決定され、これらのCPASは、がんが進行または再発する可能性が高い対象と、がんが進行または再発する可能性が低い対象とを区別するために使用され得るプロファイルを開発するために使用され得る。
【0056】
以下の記載から認識されるように、メトリックは、核酸分子の任意の1つまたは複数の領域におけるSNVの数またはパーセンテージに基づいて決定され、標的とされたヌクレオチド(すなわち、標的とされたヌクレオチドが、A、T、CまたはGであるかどうか)、SNVのタイプ(例えば、標的とされたヌクレオチドが、現在、A、T、GまたはCであるかどうか)、SNVが、転位もしくは転換SNVであるかどうか、および/またはSNVが、同義もしくは非同義であるかどうか、標的とされたヌクレオチドが存在するモチーフ、SNVのコドンコンテキスト、ならびに/またはSNVが起こる鎖の評価を含むことができる。したがって、任意の単一のSNVが、1つまたは複数のメトリックを生成するために使用され得、多数のSNVが、もう2つのメトリック、典型的には、少なくとも10、20、30、40、50、60、70、80、90、100個、またはそれよりも多くのメトリックを生成するために使用され得る。この複数のメトリックに基づいてプロファイルを作ることができ、そこでは、進行または再発する可能性が高いがんを有する対象は、典型的には、進行または再発する可能性が低いがん(例えば、同じタイプのがん)を有する対象と異なるプロファイルを有する。
【0057】
本明細書における開示から明らかであるように、メトリックは、デアミナーゼ活性に関連しているか、またはそれを示すことができ、すなわち、メトリックは、1つまたは複数の内在性デアミナーゼ、例えば、ADAR、AIDまたはAPOBECデアミナーゼ(例えば、APOBEC1、APOBEC3B、APOBEC3FまたはAPOBEC3G)の活性を示し得る、SNVの数、パーセンテージ、比、および/またはタイプを反映する。
【0058】
メトリックの任意の1つまたは複数は、本開示の方法のために評価され得る。典型的には、多数のメトリック、例えば、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100個、またはそれよりも多くが評価される。
【0059】
2.1 モチーフ
メトリックが特定のモチーフ内で同定されたSNVを使用して決定される例(すなわち、モチーフメトリック群におけるメトリック)において、モチーフは、フォワードモチーフおよび等価のリバース相補モチーフのペアで解析されてもよい。例えば、フォワードモチーフACGは、下線を引いたCが標的とされている(または改変されている)モチーフを表し、リバースモチーフは、CGTであり、配列中、下線を引いたGが標的とされている(または改変されている)。理解されるように、リバース相補モチーフを同定することは、リバース相補DNA鎖上のフォワードモチーフを同定することと等価である。本明細書の目的のために、前の節で下線を引いた標的とされた/突然変異されたヌクレオチドは、両側のハイフンの存在によっても同定することができ、すなわち、「ACG」は「A-C-G」と等価であり(標的とされたCは、下線が引かれているか、またはハイフンが付けられているかのいずれかである)、「CGT」は、「CG-T-」と等価である(標的とされたTは、下線が引かれているか、またはハイフンが付けられているかのいずれかである)。
【0060】
モチーフには、公知のまたは示唆されるデアミナーゼモチーフであるものが含まれる。したがって、メトリックは、1つまたは複数のデアミナーゼモチーフにおけるSNVに関連し得る。したがって、そのようなメトリックはまた、デアミナーゼ活性の遺伝学的指標とも称され得る。
【0061】
表Bは、本開示のメトリックの決定に利用される例示的なデアミナーゼモチーフを示す。AIDについての一次モチーフは、WR-C-/-G-YWであり、二次モチーフには、例えば、AIDb、c、d、e、f、gおよびhが含まれる。ADARについての一次モチーフは、W-A-/-T-Wであり(突然変異された/標的とされた塩基は、AまたはTである)、二次モチーフには、ADARb、c、d、e、f、g、h、I、j、k、nおよびpが含まれる。APOBEC3G(A3G)についての一次モチーフは、C-C-/-G-Gであり(突然変異された/標的とされた塩基は、CまたはGである)、二次モチーフには、A3Gb、c、d、e、f、g、h、i、n、およびoが含まれる。APOBEC3B(A3B)についての一次モチーフは、T-C-W/W-G-Aであり(突然変異された/標的とされた塩基は、CまたはGである)、二次モチーフには、例えば、A3Bb、c、d、e、f、g、h、およびjが含まれる。APOBEC3F(A3F)についてのモチーフは、T-C-/-G-Aであり(突然変異された/標的とされた塩基は、CまたはGである)、APOBEC1(A1)についてのモチーフは、-C-A/T-G-である(突然変異された/標的とされた塩基は、CまたはGである)。
【0062】
したがって、本明細書における「一次モチーフ」への言及は、WR-C-/-G-YW、W-A-/-T-W、C-C-/-G-G、およびT-C-W/W-G-A(すなわち、以下の表Bの最初の4つのモチーフ)のうちのいずれか1つへの言及である。一次モチーフにはない任意のSNVは、「他の」SNVとみなされる(すなわち、「他の」SNVには、いずれのモチーフにもないSNV、および二次または他のモチーフにあるSNVを含む、4つの一次モチーフのうちの1つにはない任意のSNVが含まれる)。
【0063】
【0064】
さらなる例では、モチーフは必ずしもデアミナーゼモチーフではない。そのようなモチーフの中には、SNVが2量体の位置:M1またはM2のうちの1つにおいて検出される一般的な2量体モチーフが含まれる。また、このようなモチーフの中には、SNVが3量体の位置:M1、M2またはM3のうちの1つにおいて検出される一般的な3量体モチーフも含まれる。また、SNVが4量体の位置:M1、M2、M3またはM4のうちの1つにおいて検出される一般的な4量体モチーフも含まれる。デアミナーゼ酵素と特異的に関連することが知られていないモチーフは、本明細書では「Gen」モチーフとして標識され、「ADAR_Gen」は、AまたはTが標的とされた(または突然変異された)ヌクレオチドであるモチーフを同定するために使用される。第1、第2または第3のヌクレオチド(すなわち、M1、M2またはM3)は、典型的には、標的とされたヌクレオチドである。本明細書での目的のために、「2Gen1」は、第1の位置が標的とされたヌクレオチドである2つのヌクレオチドモチーフを示し、例えば、「2Gen_-G-T」は、第1の位置におけるGが標的とされたヌクレオチド(またはリバースモチーフではC)である2量体モチーフである。「3Gen1」は、第1の位置が標的とされたヌクレオチドである3量体モチーフであり、例えば、「3Gen1_-C-TA」は、第1の位置におけるCが標的とされたヌクレオチド(またはリバースモチーフではG)である3つのヌクレオチドモチーフである。「3Gen2」は、第2の位置が標的とされたヌクレオチドである3量体モチーフであり、例えば、「ADAR_3Gen2_G-A-T」は、第2の位置におけるAが標的とされたヌクレオチド(またはリバースモチーフではT)である3量体モチーフである。「3Gen3」は、第3の位置が標的とされたヌクレオチドである3量体モチーフであり、例えば、「3Gen3_GA-C」は、第3の位置におけるCが標的とされたヌクレオチド(またはリバースモチーフではG)である3量体モチーフである。「4Gen3」は、第3の位置が標的とされたヌクレオチドである4量体モチーフであり、例えば、「ADAR_4Gen3_AT-A-T」は、第3の位置におけるAが標的とされたヌクレオチド(またはリバースモチーフではT)である4量体モチーフである。
【0065】
一般的なモチーフの非限定的な例には、以下の表Cに示すものが含まれる。
【0066】
【0067】
モチーフメトリックは、特定のモチーフにある核酸分子における総SNVの数またはパーセンテージを反映し得る(したがって、それを評価することによって生成される)。さらなる実施形態では、モチーフメトリックは、標的とされたヌクレオチドでのSNVの特定のタイプ、例えば、標的とされたGの代わりになるA、CまたはTがあるかどうかを検出することによって生成することができ、したがって、それを示すことができる。さらに、メトリックは、標的とされたヌクレオチドが、コドン内のいずれかの位置(すなわち、下記のようなMC-1、MC-2またはMC-3)にあるかどうかを示すことができる。したがって、一部の例では、モチーフメトリックは、モチーフ(例えば、デアミナーゼモチーフ)において標的とされた位置でのいずれかのSNVの数、パーセンテージまたは比を表すことができ、標的とされたヌクレオチドは、コドン内のいずれかの位置にある。したがって、モチーフでのSNVのパーセンテージは、(突然変異のタイプまたは突然変異のコドンコンテキストにかかわらず)モチーフでのSNVの総数を核酸分子におけるSNVの総数で割ることによって算出される。しかしながら、他の例では、モチーフでの、転位SNV(すなわち、C>T、G>A、T>CおよびA>G)などの特定のタイプのSNVであるSNVのみが、評価において考慮され、メトリックは、そのようなSNVのパーセンテージ、数または比を反映する。なおさらなる例では、同義突然変異をもたらすか、または非同義突然変異をもたらすSNVのみが考慮される。なおさらなる実施形態では、コドンコンテキストおよびSNVのタイプの両方が、下記のように評価される。
【0068】
2.2 コドンコンテキスト
デアミナーゼを含む突然変異原は、(例えば、WO2014/066955およびLindley et al. (2016) Cancer Med. 2016 Sep; 5(9): 2629-2640に記載されているように)コドンコンテキスト様式でヌクレオチドを標的とすることができる。具体的には、突然変異誘発は、コドン内の特定の位置に存在する標的とされたヌクレオチドで発生し得る。本開示の目的のために、影響を受けたコドン(MC;すなわち、SNVを含有するコドン)内のヌクレオチド位置は、MC-1、MC-2およびMC-3と注釈を付けられ、コドンの配列を5’から3’へ読んだ場合に、コドンのそれぞれ、第1、第2および第3のヌクレオチド位置を指す。
【0069】
本開示のメトリックは、SNVのコドンコンテキストの決定、すなわち、SNVが、影響を受けたコドンにおいて第1、第2または第3の位置、すなわち、MC-1、MC-2またはMC-3部位にあるかどうかに、少なくとも部分的に基づくことができる。上記で指摘したように、多くのデアミナーゼは、影響を受けたコドン内の特定の位置のヌクレオチドを標的とする選択性を有する。したがって、MC-1、MC-2またはMC-3部位において発生するSNVの数および/またはパーセンテージは、デアミナーゼ活性の遺伝学的指標であり得る。認識されるように、コドンコンテキストメトリックは、核酸分子のコード領域においてのみ評価される。
【0070】
SNVのコドンコンテキストの評価に基づくメトリックは、モチーフ非依存的であり得る(すなわち、標的とされたヌクレオチドが特定のモチーフ内にあるか否かにかかわらず、特定のコドンでのSNVの数および/またはパーセンテージの評価)。したがって、これらのメトリックは、MC-1部位において発生する総SNVの数および/またはパーセンテージ;MC-2部位において発生する総SNVの数および/またはパーセンテージ;ならびにMC-3部位において発生する総SNVの数および/またはパーセンテージを含む。
【0071】
他の実施形態では、SNVが、(上記のような)デアミナーゼモチーフ、3量体モチーフまたは5量体モチーフなどのモチーフにあるかどうかの同時評価もまた行われる。したがって、メトリックは、特定のモチーフ内、ならびにMC-1部位、MC-2部位および/またはMC-3部位でのSNVの数および/またはパーセンテージに基づく、コドンコンテキスト、モチーフ依存的メトリックを含む。モチーフがデアミナーゼモチーフである場合、メトリックは、デアミナーゼ活性の遺伝学的指標とみなされることができ、MC-1部位、MC-2部位および/またはMC-3部位で特定のモチーフに寄与し得るSNVの数および/またはパーセンテージ、例えば、AIDに寄与し得る(すなわち、AIDモチーフにある)、かつMC-1部位、MC-2部位および/またはMC-3部位において発生するSNVの数および/またはパーセンテージ;ADARに寄与し得る(すなわち、ADARモチーフにある)、かつMC-1部位、MC-2部位および/またはMC-3部位において発生するSNVの数および/またはパーセンテージ;APOBECデアミナーゼに寄与し得る(すなわち、APOBECモチーフ、例えば、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3GもしくはAPOBEC3Hモチーフにある)、かつMC-1部位、MC-2部位および/またはMC-3部位において発生するSNVの数および/またはパーセンテージを含む。
【0072】
コドンコンテキストメトリックはまた、コドンコンテキストだけではなく、標的とされるヌクレオチドも考慮に入れるものも含む。したがって、メトリックは、MC1位置、MC2位置および/またはMC3位置にあるアデニンに起因するSNVの数またはパーセンテージを含む。例えば、アデニンに起因するSNVの数を決定してもよく、次いでMC-1部位、MC-2部位および/またはMC-3部位にあるこれらのパーセンテージを決定して、メトリックを生成する。同様に、MC1位置、MC2位置および/またはMC3位置において発生したチミンに起因するSNVの数またはパーセンテージ;MC1位置、MC2位置および/またはMC3位置において発生したシトシンに起因するSNVの数またはパーセンテージ;MC1位置、MC2位置および/またはMC3位置において発生したグアニンに起因するSNVの数またはパーセンテージを、メトリックを生成するために評価することができる。
【0073】
さらなる実施形態では、MC-1、MC-2またはMC-3部位での特定のタイプのSNVの数またはパーセンテージを決定するために、SNVのタイプ(例えば、C>A、C>T、C>G、G>C、G>T、G>A、A>T、A>G、A>C、T>A、T>CまたはT>G)およびSNVのコドンコンテキストの両方が評価される。再び、一部の実施形態では、これは、SNVが特定のデアミナーゼに関連するモチーフにあるかどうかの同時評価を伴わずに行われる。したがって、メトリックは、例えば、(典型的には、AID、APOBEC3BまたはAPOBEC3G活性を示す)MC1部位でのC>T SNVの数またはパーセンテージ;(典型的には、AID、APOBEC3BまたはAPOBEC3G活性を示す)MC2部位でのC>T SNVの数またはパーセンテージ;(典型的には、AID、APOBEC3BまたはAPOBEC3G活性を示す)MC3部位でのC>T SNVの数またはパーセンテージ;(典型的には、AID、APOBEC3BまたはAPOBEC3G活性を示す)MC1部位でのG>A SNVの数またはパーセンテージ;(典型的には、AID、APOBEC3BまたはAPOBEC3G活性を示す)MC2部位でのG>A SNVの数またはパーセンテージ;(典型的には、AID、APOBEC3BまたはAPOBEC3G活性を示す)MC3部位でのG>A SNVの数またはパーセンテージ;(典型的には、ADAR活性を示す)MC1部位でのT>C SNVの数またはパーセンテージ;(典型的には、ADAR活性を示す)MC2部位でのT>C SNVの数またはパーセンテージ;(典型的には、ADAR活性を示す)MC3部位でのT>C SNVの数またはパーセンテージ;(典型的には、ADAR活性を示す)MC1部位でのA>G SNVの数またはパーセンテージ;(典型的には、ADAR活性を示す)MC2部位でのA>G SNVの数またはパーセンテージ;および(典型的には、ADAR活性を示す)MC3部位でのA>G SNVの数またはパーセンテージを含むことができる。
【0074】
他の実施形態では、SNVがモチーフ(例えば、デアミナーゼまたは3量体)にあるかどうか、どのタイプのSNVが同定されているかどうか、およびまた、SNVのコドンコンテキストの評価が、メトリックを生成するために行われる。
【0075】
2.3 転位/転換
転位(Ti)は、プリンからプリンへ、またはピリミジンからピリミジンへの任意の変異体(すなわち、C>T、G>A、T>CおよびA>G)として定義され、転換(Tv)は、ピリミジンからプリンへ、またはプリンからピリミジンへの任意の変異体(すなわち、C>A、C>G、G>T、G>C、T>G、A>T、T>CおよびT>A)として定義される。したがって、転位または転換であるSNVから決定されるか、またはそれに関連するメトリックを決定することができ、例えば、転位もしくは転換であるSNVの数もしくはパーセンテージ、または転位対転換もしくは転換対転位の比を含む)。一部の実施形態では、モチーフ、コドンコンテキストおよび/または特異的SNVのタイプも評価される。
【0076】
2.4 鎖特異性
メトリックはまた、DNAのただ1本の鎖、すなわち、非転写(またはセンスもしくはコード)鎖または転写(またはアンチセンスもしくは鋳型)鎖上で同定されたSNVに基づくものも含むことができる。非転写(またはセンスもしくはコード)鎖はまた、Cの/からのSNVを評価する場合、「C」鎖、またはAの/からのSNVを評価する場合、「A鎖」とも称され得るが、転写(またはアンチセンスもしくは鋳型)鎖はまた、Gの/からのSNVを評価する場合、「G」鎖、またはTの/からのSNVを評価する場合、「T」鎖とも称され得る。これらの鎖特異的メトリックは、典型的には、所与の鎖上の特定の標的とされたヌクレオチド(例えば、A、T、CまたはG)からの(またはその)SNVの数またはパーセンテージの評価を含む。特定のデアミナーゼは、核酸分子における特定のヌクレオチドを標的とする選択性を有することができることを考慮して、そのようなメトリックは、デアミナーゼ活性の遺伝学的指標とみなされ得る。例えば、アデニンは、多くの場合、ADARの標的であり、他方、シトシンは、多くの場合、AIDまたはAPOBECデアミナーゼの標的である。したがって、メトリックは、(例えば、A>C、A>TおよびA>GのSNVの総数を検出し、この合計を検出されるSNVの総数のパーセンテージとして表現する)アデニンヌクレオチドに起因するSNVの数もしくはパーセンテージ;(例えば、T>C、T>AおよびT>GのSNVの総数を検出し、この合計を検出されるSNVの総数のパーセンテージとして表現する)チミンヌクレオチドに起因するSNVの数もしくはパーセンテージ;(例えば、C>A、C>TおよびC>GのSNVの総数を検出し、この合計を検出されるSNVの総数のパーセンテージとして表現する)シトシンヌクレオチドに起因するSNVの数もしくはパーセンテージ;ならびに/または(例えば、G>C、G>TおよびG>AのSNVの総数を検出し、この合計を検出されるSNVの総数のパーセンテージとして表現する)グアニンヌクレオチドに起因するSNVの数またはパーセンテージを表すことができる。これらはまた、A、T、GまたはCヌクレオチドのSNVの総数における不均衡を示し得るため、鎖バイアスの指標であり得る。さらなる例では、標的とされたヌクレオチドがなるヌクレオチドもまた、評価される。例えば、メトリックは、A>C SNVであるAを標的とする全てのSNVの数またはパーセンテージを表すことができる。
【0077】
2.5 ATおよびGC SNV
メトリックはまた、アデニンおよびチミン(AT)を標的とする組み合わされたSNV、ならびに/またはグアニンおよびシトシン(GC)を標的とする組み合わされたSNVの評価を含むこともできる。ATまたはGCでのSNVの数および/またはパーセンテージを評価することができる。さらなる例では、比が算出され、例えば、アデニンまたはチミンヌクレオチドを含むSNVの数またはパーセンテージ対シトシンまたはグアニンヌクレオチドを含むSNVの数またはパーセンテージの比(AT:GC比)が決定される。さらなる例では、ATまたはGC SNVのコドンコンテキストを、メトリックを生成するために考慮に入れることができる。
【0078】
2.6 コード領域およびゲノムメトリック
メトリックは、核酸分子のちょうどコード領域(コード配列またはcdsとも称される)において同定されたSNVを使用して決定することができる。他の例示的なメトリックには、ゲノム核酸配列の全ての領域にわたって決定されるものが含まれ、すなわち、配列が非コード領域のものであるかコード領域のものであるかにかかわらず評価される。したがって、理解されるように、これらのメトリックは、(例えば、エクソーム全体の配列決定によって)核酸の一部のみの配列が評価される場合、または(例えば、ゲノム全体の配列決定によって)全核酸の配列が評価されるかどうかにかかわらず、決定および/または使用することができる。
【0079】
3.CPASである例示的なメトリック
本明細書で決定されるように、多くのメトリックはCPASであり、本明細書に記載される方法において使用して、対象におけるがんが進行または再発するか否かを予測するプロファイルまたはモデルを生成することができる。表Dは、本開示の方法およびシステムに従って使用するための例示的なCPASを示す。この表は、メトリック名、メトリック決定に基づく領域、メトリックに関連するモチーフ(適用可能な場合)、ならびにメトリックの説明およびメトリックを生成するために行った算出を提供する。
【0080】
したがって、CPASは、cdsに特異的なこれらのメトリック(すなわち、cdsにおけるSNVに基づいて算出される、例えば、cdsにおけるSNVの総数である「cds:CDS Variants」);非コード領域におけるSNVに基づいて算出されるもの(表Dの「nc」);およびSNVゲノムワイドに基づいて算出されるもの(表Dの「g」)、例えば、ゲノムにおけるSNVの総数である「variants in VCF」を含む。表D中の定義が「モチーフ」を指している場合、それは、表Dのメトリック名および「モチーフ」の列に示されているモチーフであり、「motif SNVs」は、その特定のモチーフにおけるSNVを意味する。例えば、「cds:ADAR_W-A- A>G at MC3 %」は、MC3にあるW-A-モチーフにおけるA>G SNV、すなわち、W-A-モチーフにおけるA>G SNVの全てのパーセンテージ、MC3にあるパーセンテージである。したがって、本明細書に提示される表のいずれかの定義の列における「モチーフ」への言及は、メトリック名において言及されるモチーフを意味する。例えば、「cds:3Gen2_C-C-C MC3 %」メトリックについての「MC3にあるモチーフ変異体の%」という定義は、MC3にあるC-C-Cまたは逆相補体G-G-G変異体(またはC-C-C/G-G-Gモチーフにおける変異体)のパーセンテージを意味する。メトリック名における「cds」への言及は、それが、コドンコンテキストの評価を含むメトリックについて予想されるように、このメトリックについて評価されるCDSにおけるSNVであることを示す。別の例では、「cds:ADAR_W-A- non-syn %」は、非同義変化に対応する(または非同義変化である)cdsのW-A-/-T-WモチーフにおけるSNVのパーセンテージである。さらなる例では、cds:A3G_C-C- G>T %とは、G>T突然変異である「G motif SNVs」(すなわち、-G-Gモチーフにおける逆鎖上の「G」におけるSNV)のパーセンテージを指す。一次モチーフにはない任意のSNVは、「他の」SNVとみなされる(すなわち、「他の」SNVは、いずれのモチーフにもないSNVおよび二次または他のモチーフにあるSNVを含む、4つの一次モチーフのうちの1つにはない任意のSNVを含む)。したがって、例えば、cds:Other MC3 %は、MC3にあるcdsにおける「他の」SNV(すなわち、CDSにおける一次モチーフにはないSNV)のパーセンテージである。
【0081】
表Dにおいて、#CDS=CDSにおけるSNVの数;#SNV=ゲノム領域におけるSNVの数;#motif=列挙されたモチーフにおけるSNVの数;#motif_Gstrand=G鎖上の列挙されたモチーフにおけるSNVの数;#other=一次デアミナーゼモチーフにないSNVの数である。N/A=該当なし。
【0082】
【0083】
一部の場合では、表Dに示すメトリックは、1つまたは複数の関連するメトリックを有する。本明細書で使用される関連するメトリックは、本開示の方法における別のメトリックのための代理として使用され得るものである。関連するメトリックは、典型的には、当該メトリックが関連する、同一のタイプのまたは類似の情報を表す。
【0084】
例えば、メトリックは、1つのメトリックが別のメトリックのサブセットに対応する場合に、関連しているとすることができる。非限定的な例としては、他のモチーフメトリックのサブセットであるモチーフメトリックが含まれ、例えば、CT-C-A SNVsは、T-C-A SNVsのサブセットであり、したがって関連している。また、G-G-メトリックは、「All G」メトリックのサブセットであり、したがって関連している。
【0085】
他の例では、コドン文脈の評価を包含するメトリックが関連していてよく、例えば、MC1%、MC2%、およびMC3%メトリック全ての合計が100%であるため、MC1%メトリックは、MC2%およびMC3%に関連している。したがって、例えば、cds:4Gen3_CA-C-C MC1%は、cds:4Gen3_CA-C-C MC2%およびcds:4Gen3_CA-C-C MC3%に関連している。
【0086】
さらなる例では、突然変異タイプのメトリックが関連していてよく、例えば、C>Tメトリックは、C>T SNVの割合を、全てのSNV、コード領域内の全てのSNV、特定のモチーフ内の全てのSNV、またはC鎖モチーフのSNVに対するパーセンテージとして測定することができる。結果として、C>A%はC>T%およびC>G%に関連する。
【0087】
他の例では、GおよびC鎖のメトリックが関連していてよい。例えば、C鎖およびG鎖モチーフのメトリックは、モチーフに関連するメトリックのサブセットであり、例えば、Motif G-strand MC1%はMotif MC1%に関連し、Motif C-strand MC1%はmotif Ti%に関連する。
【0088】
他の例では、モチーフの転位SNVの測定値である「motif Ti%」メトリックは、全てのモチーフSNVをカウントする「motif %」のサブセットである。結果として、motif Ti%およびmotif %は、関連したメトリックである。
【0089】
さらなる例では、パーセンテージメトリックはHit/Countメトリックに関連し、それは、パーセンテージメトリックが、例えば全てのSNV、コード領域内の全てのSNV、特定のモチーフ内の全てのSNV、または全てのC鎖モチーフSNVなどの分母で割られたHit/Countsによって計算されるためである。
【0090】
他の例では、CDSメトリック、非コードメトリック、およびゲノム領域メトリックが関連していてよい。例えば、非コードSNVはゲノムSNVのサブセットであり、したがって関連している。また、CDS SNVはゲノムSNVのサブセットであり、したがって、カウントベースのメトリックおよび転位/トランスバージョンメトリックが関連している。
【0091】
さらなる例では、非同義メトリックは、MC1、MC2、およびMC3のパーセンテージに関連しており、それは、MC3突然変異が、非同義アミノ酸変化をコードする可能性がそれほど高くはなく、MC1 SNVおよびMC2 SNVが、非同義アミノ酸変化をコードする可能性がより高いためである。
【0092】
他の例では、同一のカウントに基づくが異なる分母を使用するメトリックが関連している。例えば、motif C>A SNVsは、C鎖モチーフSNV、全てのモチーフSNV、または全てのCDS SNVに対するパーセンテージとして表すことができ、結果として、それぞれが関連している。
【0093】
さらなる例では、全ての「Primary」モチーフメトリックは、AID、ADAR、APOBEC3G、およびAPOBEC3Bの他のメトリックに関連しており、それは、一次モチーフメトリックがこれら4つのモチーフの合計に関連しているためである。
【0094】
他の実施例では、全ての「other」モチーフメトリックは「all」メトリックのサブセットであり、したがって関連しており、例えば、All G SNVs=Other G SNVs(一次デアミナーゼモチーフにはないG SNV)+Primary G SNV(すなわち、一次デアミナーゼモチーフにあるG SNV)である。
【0095】
上記に基づいて、当業者は、どのメトリックが表Dに示されるメトリックに関連し得るかを判定することができる。非限定的な例では、ゲノム内のCまたはGにある変異体の数の計算であるメトリックg:CG totalは、例えば、total variants in VCF、total SNVs in VCF、g:variant total、cds:CDS Variants、CDS total、cds:All G total、cds:All C total、cds:Other G total、aa synonymous、cds:Other C total、aa non-synonymousを含む、同一のタイプのまたは類似の情報を表す、複数の関連するメトリックを有する。
【0096】
別の例では、g:A3Bj_RT-C-G C>T + G>A g %についての関連するメトリックとしては、cds:A3F_T-C- MC1 %、cds:3Gen3_TC-C- %、cds:3Gen2_T-C-G C:G %、g:3Gen2_T-C-G C>T + G>A %、g:3Gen2_T-C-G C>T + G>A g %、cds:3Gen2_T-C-G C>T %、cds:3Gen2_T-C-G C>T motif %、およびcds:3Gen2_T-C-G C>T cds %が含まれる。
【0097】
さらなる例では、g:A3F_T-C- Hitsについての関連するメトリックとしては、cds:A3F_T-C- MC3 non-syn %、cds:A3F_T-C- Hits、g:A3B_T-C-W Hits、g:3Gen3_CT-C- Hits、cds:3Gen3_TT-C- G non-syn %、cds:A3B_T-C-W Hits、g:3Gen3_TT-C- Hits、g:A3Gh_S-C-GS Hits、g:A3B_T-C-W %、cds:3Gen2_T-C-T G non-syn %、g:3Gen3_AT-C- Hits、cds:A3B_T-C-W MC3 non-syn %、nc:3Gen3_CT-C- %、g:3Gen2_T-C-A Hits、cds:3Gen2_T-C-G G non-syn %、cds:3Gen3_AT-C- Hits、nc:3Gen3_CT-C- Hits、cds:3Gen2_T-C-G MC1 non-syn % およびg:3Gen2_T-C-T Hitsが含まれる。
【0098】
4.SNVについての核酸分子の評価
核酸分子の配列を獲得および評価するための、当技術分野において公知のあらゆる方法を、本開示の方法およびシステムに従って使用することができる。本開示のシステムおよび方法を使用して分析される核酸分子は、あらゆる核酸分子であり得るが、一般にはDNA(cDNAを含む)である。典型的には、核酸は、哺乳動物の核酸、例えばヒトの核酸である。
【0099】
核酸は、任意の生体試料から得ることができる。生体試料は、体液、組織、または細胞を含み得る。特定の例では、生体試料は、唾液または血液などの体液である。他の例では、生体試料は組織生検である。組織または細胞を含む生体試料は、身体のあらゆる箇所に由来し得、また、あらゆるタイプの細胞または組織を含み得る。典型的には、試料は、がんまたは腫瘍細胞を含む。結果として、一部の例では、試料は、がんまたは腫瘍が存在している対象内の特定の領域または位置に由来し、したがって、例えば、乳房、前立腺、肝臓、結腸、胃、膵臓、皮膚、甲状腺、頚部、リンパ、造血系、膀胱、肺、腎臓、直腸、卵巣、子宮、および頭部または頸部の組織または細胞を含む。特定の例では、がんの進行または再発の可能性を検出するために使用される生体試料は、がんのタイプに適合している。説明として、卵巣がんに罹患しているかまたは罹患していた対象であれば、試料は、卵巣の組織または細胞に由来する。
【0100】
核酸分子は、1つの遺伝子の一部もしくは全て、または2つ以上の遺伝子の一部もしくは全てを有し得る。最も典型的には、核酸分子は全ゲノムまたは全エクソームを含み、全ゲノムまたは全エクソームの配列が、本開示の方法において分析される。全ゲノムまたは全エクソームが分析に使用される場合、コード領域、非コード領域、または全領域(「ゲノム」と呼ばれる)内にあるSNVが評価され得る。
【0101】
本開示の方法を行う場合、核酸分子の配列は事前に決定されていてよい。例えば、配列はデータベースまたは他の保存メディアに保存されていてよく、この配列が、本開示の方法に従って分析される。他の場合には、核酸分子の配列は、本開示の方法を利用する前にまず決定されなければならない。特定の例では、核酸分子はまた、生体試料からまず単離されなければならない。したがって、一部の実施形態では、本開示の方法は、本明細書において記載されるように、対象から生体試料を得る工程、適宜、試料から核酸を単離する工程、核酸をシーケンシングする工程、次いで、核酸を分析してSNVを検出する工程を含む。他の実施形態では、生体試料は対象から既に得られており、方法は、核酸を単離する工程、核酸をシーケンシングする工程、次いで、核酸を分析してSNVを検出する工程を含む。さらなる実施形態では、生体試料は対象から既に得られており、核酸は既に単離されており、そして方法は、核酸をシーケンシングする工程、次いで、核酸を分析してSNVを検出する工程を含む。またさらなる実施形態では、本開示の方法を行う前に、生体試料は対象から既に得られており、核酸は既に単離およびシーケンシングされている。
【0102】
核酸を得るおよび/または核酸をシーケンシングするための方法は、当技術分野において周知であり、任意のこのような方法を、本明細書において記載される方法に利用することができる。一部の場合では、方法は、単離された核酸の増幅をシーケンシングの前に含み、適切な核酸増幅技術は当業者に周知である。核酸シーケンシング技術は当技術分野において周知であり、単一のもしくは複数の遺伝子、または全エクソーム、全トランスクリプトーム、もしくは全ゲノムに適用することができる。これらの技術としては、例えば、「サンガーシーケンシング」に依拠するキャピラリーシーケンシング方法(Sanger et al. (1977) Proc Natl Acad Sci USA 74: 5463-5467)(すなわち、連鎖停止シーケンシングを伴う方法)、および数千個から数百万個の分子を一度にシーケンシングすることを容易にする「次世代シーケンシング」技術が含まれる。このような方法としては、限定はしないが、個々のヌクレオチドがDNA鋳型に付加されるにつれてシグナルを読み取るためにルシフェラーゼを利用するパイロシーケンシング、各サイクルにおいて単一のヌクレオチドをDNA鋳型に付加する可逆のダイターミネーター技術を使用する「合成によるシーケンシング」技術(Illumina)、および長さが一定のオリゴヌクレオチドの優先的ライゲーションによってシーケンシングするSOLiD(商標)シーケンシング(オリゴヌクレオチドのライゲーションおよび検出によるシーケンシング、Life Technologies)が含まれる。これらの次世代シーケンシング技術は、全エクソームおよび全ゲノムのシーケンシングに特に有用である。他の典型的なシーケンシングプラットフォームとしては、第3世代(またはロングリード)シーケンシングプラットフォーム、例えば、MiniION(商標)シーケンサーもしくはGridION(商標)シーケンサー(Oxford Nanoporeによって開発され、DNA分子をナノスケールの孔構造に通し、次いで、孔の周りにある電界の変化を測定することを伴う)を使用する一分子ナノポアシーケンシング、または、Pacific Biosciencesによって開発されたものなどの、ゼロモード導波路(ZMW)を利用する一分子リアルタイムシーケンシング(SMRT)が含まれる。
【0103】
核酸分子の配列が得られると、SNVが次いで同定される。SNVは、配列を参照配列と比較することによって同定することができる。参照配列は、参照ゲノムなどの、データベースの核酸分子配列であり得る。特定の例では、参照配列は、GRCh38(hg38)、GRCh37(hg19)、NCBI Build 36.1(hg18)、NCBI Build 35(hg17)、およびNCBI Build 34(hg16)などの参照ゲノムである。一部の実施形態では、SNVを再調査して、公開されている様々なSNPデータベースにおいて同定されているものなどの公知の一塩基多型(SNP)をさらなる分析から排除する。さらなる実施形態では、ENSEMBL遺伝子のコード領域内にあるSNVのみが、さらなる分析に選択される。SNVの同定に加えて、SNVを有するコドンおよびコドン内でのSNVの位置(MC-1、MC-2、またはMC-3)が同定され得る。モチーフを同定するために、隣接する5’コドンおよび3’コドン内のヌクレオチドを同定してもよい。本開示の方法の一部の場合では、核酸分子の転写されていない鎖(cDNA配列に等しい)の配列が分析される。他の場合では、転写された鎖の配列が分析される。さらなる場合では、両鎖の配列が分析される。
【0104】
核酸分子内の1つまたは複数のSNVが同定されると、1つまたは複数のメトリック(またはCPAS)を、上記に示したように、適切な計算を行うことによって決定することができる。
【0105】
5.SNVを検出するためおよびメトリックを決定するためのキットおよびシステム
SNVの検出に必要な全ての必須の材料および試薬を共に集めてキットとすることができる。例えば、本開示の方法が分析対象の核酸の最初の単離および/またはシーケンシングを含む場合、その単離および/またはシーケンシングを容易にするための試薬を含むキットが構想される。このような試薬としては、例えば、DNAを増幅するためのプライマー、ポリメラーゼ、dNTP(標識されたdNTPを含む)、陽性対照および陰性対照、ならびにバッファーおよび溶液が含まれ得る。このようなキットはまた、各々の試薬のための異なる容器を適切な手段で一般に含む。キットはまた、様々なデバイス、および/またはキットを使用するための印刷された指示を有していてもよい。
【0106】
一部の実施形態では、本明細書を通して記載される方法は、少なくとも部分的には、適切にプログラムされたコンピュータシステムなどの処理システムによって行われる。例えば、処理システムは、核酸配列を分析するため、SNVを同定するため、および/またはメトリックを決定するために使用することができる。上記の方法の実行を可能にするアプリケーションソフトウェアを実行するマイクロプロセッサを有するスタンドアローンのコンピュータを使用することができる。あるいは、方法は、少なくとも部分的に、分散型構造の一部として作動する1つまたは複数の処理システムによって行うことができる。例えば、処理システムを使用して、SNVのタイプ、SNVのコドン文脈、および/または1つもしくは複数の核酸配列内のモチーフを同定して、本明細書において記載されるメトリックを生成することができる。一部の例では、ユーザーによって処理システムに入力されるコマンドは、処理システムによるこれらの決定を助ける。
【0107】
一例では、処理システムは、バスを介して接続されている、少なくとも1つのマイクロプロセッサ、メモリ、キーボードおよび/またはディスプレイなどの入力/出力デバイス、ならびに外部インターフェースを含む。外部インターフェースは、処理システムを、コミュニケーションネットワーク、データベース、またはストレージデバイスなどの末端のデバイスに繋ぐために利用することができる。マイクロプロセッサは、メモリに保存されたアプリケーションソフトウェアの形態で指示を実行して、本開示の方法の実施およびあらゆる他の所要のプロセスの実施、例えばコンピュータシステムとのコミュニケーションの実施を可能にし得る。アプリケーションソフトウェアは1つまたは複数のソフトウェアモジュールを含み得、また、オペレーティングシステム環境またはそれに類するものなどの適切な実行環境で実行され得る。
【0108】
6.進行指標を生成するためのシステム
また、本開示は、がんが進行または再発する可能性を評価するための進行指標を生成するためのシステムおよびプロセスを提供する。
【0109】
がんが進行または再発する可能性を評価するための進行指標を生成するためのプロセスの一例を、ここで、
図1を参照して説明する。
【0110】
この例の目的のために、方法は、少なくとも部分的に、サーバー、パーソナルコンピュータなどなどの1つまたは複数の処理システムの部分を典型的に形成し、適宜、以下により詳細に説明されるようにネットワーク・アーキテクチャを介して1つまたは複数の処理システム、データソースなどに接続され得る1つまたは複数の電子処理デバイスを使用して行われることが想定される。
【0111】
説明の目的のために、「参照対象」という用語は、試料集団中の1つまたは複数の個体を指すために使用され、「参照対象データ」は、参照対象から収集されたデータを指すために使用される。「対象」という用語は、がんの進行または再発の可能性を判定する目的のために評価される任意の個体を指し、「対象データ」は、対象から収集されたデータを指すために使用される。参照対象および対象は、哺乳動物、より具体的にはヒトであるが、このことは限定であるとは意図されず、技術は、他の脊椎動物および哺乳動物に、より広範に適用することができる。
【0112】
この例において、工程100にて、対象由来の核酸分子の配列を少なくとも部分的に示す対象データを取得する。対象データは、上記に説明されるように、例えば、対象由来の生体試料の全エクソーム配列決定または全ゲノム配列決定などの、任意の適切な様式において取得することができる。
【0113】
また、対象データは、以下により詳細に説明されるように、対象の属性または対象から測定される他の生理シグナル、例えば、身体活動もしくは精神活動の測定値などについてのデータなどの、追加のデータを含んでもよい。
【0114】
工程110において、対象データを、上記に説明されるように、解析して、核酸分子内のSNVを同定する。
【0115】
工程120において、同定されたSNVを使用して、表Dに示すメトリックまたは表Dに示すメトリックに関連するメトリックのうちの少なくとも5、10、15、20、25、30、40、50、60、70、80、90、100、120、130または140個のような複数のメトリックを決定する。使用されるメトリックは、以下により詳細に説明されるように、ある範囲の因子、例えば、使用される計算モデル、対象の属性、評価されるがんの特定のタイプなどに依存して変動し得る。
【0116】
工程130において、2つ以上のメトリックを、1つまたは複数の計算モデルに適用する。計算モデルは、典型的に、がんの進行または再発と複数のメトリックとの間の関係を具体化し、がんの既知の進行または再発を有する参照対象から得られた複数の参照メトリックに由来する参照メトリックに、1つまたは複数の解析技術、例えば、機械学習、従来型クラスタリング、線形回帰もしくはベイズ法、または当技術分野において公知のもしくは以下に説明される他の技術のうちのいずれかを適用することによって取得することができる。
【0117】
したがって、実際に、対象データと同等の参照対象データは、がんの異なる進行または再発を有する複数の参照対象について収集されることが理解される。収集された参照対象データを使用して、参照メトリックを計算し、次に、参照メトリックを使用して、対象のSNVに由来するメトリックに基づいて、計算モデルが、異なる進行または再発を識別することができるように計算モデルを訓練する。計算モデルの性質は、インプリメンテーションに依存して変動し、例は、以下により詳細に説明される。
【0118】
工程140において、計算モデルを使用して、がんの進行または再発の可能性を示す進行指標を決定する、すなわち、進行指標は、対象が、進行または再発しそうながんを有するかどうかを示す。これは、監督する臨床医または他の医療従事者が、対象について適切な治療または介入を評価することを可能にする。
【0119】
一例において、進行指標は、例えば、対象が、進行または再発する可能性が高いがんを有する60%、70%、80%、90%または95%の見込みがある(または言い換えると、対象におけるがんが進行または再発する60%、70%、80%、90%または95%の見込みがある)ことを示す数値を含み得る。しかしながら、このことは必ずしも必須ではなく、任意の好適な形態の指標を使用してもよいことが理解される。
【0120】
したがって、上記に説明される方法は、ある特定の規定のメトリックを利用して、がんの進行または再発を評価するために、機械学習技術などの解析技術を利用することが理解される。
【0121】
一例において、70%超の、精度、感度、特異度または受信者動作特性曲線下の面積(AUROC)などの識別性能を有する計算モデルを提供するために、特定のメトリックが、様々な組合せにおいて使用される。
【0122】
上記に説明される手法は、最も有効な治療および/または治療の必要性を同定することにおいて支援し得る、対象のがんの進行または再発の可能性を客観的に評価するための機構を提供する。
【0123】
いくつかのさらなる特性を、ここで説明する。
【0124】
一例において、モチーフメトリック群は、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される少なくとも5、10、15、20、25、30、40、50、60、70、80、90、100、120、130または140個のメトリックを含む。
【0125】
システムは、例えば、モデルの特定の識別性能能力および目的の特定のがん治療に依存して、計算モデルのいくつかの異なる組合せを使用することができる。
【0126】
一例において、システムは、多数の異なる計算モデルを使用し、このことは、がんの進行または再発を正確に評価する能力を改善し得る。この場合において、処理デバイスは、各々のメトリックを各々のモデルに適用して、個々のスコアを決定し、次に、個々のスコアは集められて、進行指標を決定する。
【0127】
モデルの性質は、インプリメンテーションに依存して変動し、例において、モデルは、決定木または類似物を含んでもよく、1つの好ましい例において、多数の決定木が使用され、結果が集められる。しかしながら、このことは必須ではなく、他のモデルを使用してもよいことが理解される。
【0128】
前述のように、計算モデルの精度を増大させるために、多数のメトリックが使用され、これらは、計算モデルの識別性能の有効性を最大限にするために、典型的に、群にわたって選択される。
【0129】
一般的に、使用されるメトリックの数は、インプリメンテーションおよび訓練のアウトカムに依存して変動する。一例において、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される少なくとも5、10、15、20、25、30、40、50、60、70、80、90、100、120、130または140個のメトリックが使用される。WO2019095017において記載される任意のメトリックなどの追加のメトリックを使用してもよい。
【0130】
また、解析は、対象の属性、例えば、対象の特徴、対象が罹患する可能性のある医学的状態、実施される可能性のある介入などを考慮するように実施され得る。この例において、1つまたは複数の処理デバイスは、1つまたは複数の対象の属性を使用して、メトリックが、対象の属性と類似する属性を有する1つまたは複数の参照対象について導かれた参照メトリックに基づいて評価されるように、計算モデルを適用することができる。このことは、好ましいインプリメンテーションに依存して、様々な方法において達成することができ、少なくとも部分的に対象の属性に依存して、メトリックおよび/またはいくつかの異なる計算モデルのうちの1つを選択することを含み得る。このことがどのように達成されるかにかかわらず、対象の属性を考慮することは、異なる属性を有する対象ががんの異なる進行または再発を有し得ることを考慮することによって識別性能をさらに改善し得ることが理解される。
【0131】
対象の属性は、対象の特徴、例えば、対象の年齢、身長、体重、性別もしくは民族性、身体の状態、例えば、健康なもしくは不健康な身体の状態、または1つもしくは複数の疾患状態、例えば対象が肥満であるかどうかを含み得る。対象の属性は、1つまたは複数の医学的症状、例えば、発熱、心拍または血圧、対象が吐き気を有するかどうか、その他を含み得る。最後に、対象の属性は、食事情報、例えば、消費された任意の食物もしくは飲料の詳細、または医学レジメンの部分もしくはそれ以外のいずれかとして摂取された任意の薬物の詳細を含む医学的情報を含み得る。
【0132】
対象の属性は、いくつかの方法のうちのいずれか1つにおいて、例えば、臨床評価の方法によって、ユーザー入力コマンドに基づいて患者の医学的記録を問い合わせることによって、またはセンサー、例えば体重もしくは心臓活動センサーからのセンサーデータを受容することなどによって決定され得る。
【0133】
一例において、1つまたは複数の処理デバイスは、進行指標の表示を表示するか、次なる検索のために進行指標を保存するか、または表示のためのクライアントデバイスに進行指標を提供する。したがって、進行指標は、好ましいインプリメンテーションに依存して、様々な様式において使用され得ることが理解される。
【0134】
進行指標を決定するために、上記に説明される手法は、1つまたは複数の計算モデルを使用し、そのようなモデルを生成するためのプロセスの一例を、ここで、
図2を参照して説明する。
【0135】
この例において、工程200において、参照対象に由来する核酸分子の配列、およびがんの進行もしくは再発(または非進行もしくは非再発)を示す参照対象データを取得する。工程210において、参照対象データを解析して、核酸分子内のSNVを同定する。工程220において、参照対象データを解析して、参照メトリックを決定する。
【0136】
工程200~220は、対象の対象データを取得および解析することについて説明される工程100~120に大部分は類似しており、それゆえ、これらは、大部分は同様の様式において実施することができ、そのため、さらに詳細に説明されないことが理解される。
【0137】
しかしながら、対象データとは対照的に、参照対象データは計算モデルを訓練することにおいて使用されるので、参照対象データは、単にメトリックのうちの選択された1つではなく、典型的に、全ての使用可能なメトリックについて参照メトリックを決定することであり、メトリックのうちのどれが、がんの進行または再発を有する可能性が高い個体を識別することにおいて最も有用であるかを確認するためにこれが使用されることを可能にする。
【0138】
工程230において、参照メトリックと1つまたは複数の一般計算モデルとの組合せを選択し、工程240において、参照メトリックおよびがんの進行もしくは再発(または非進行もしくは非再発)を使用して、モデルを訓練する。モデルの性質および実施される訓練は、任意の適切な形態の性質および訓練であってもよく、決定木学習、ランダムフォレスト、ロジスティック回帰、アソシエーションルール学習、人工ニューラルネットワーク、深層学習、帰納的論理プログラミング、サポートベクターマシン、クラスタリング、ベイジアンネットワーク、強化学習、表現学習、類似度およびメトリック学習、遺伝的アルゴリズム、ルールベース機械学習、学習分類子システムなどのうちの任意の1つまたは複数を含み得る。そのようなスキームは公知であるので、これらは、さらに詳細には説明しない。
【0139】
したがって、上記に説明されるプロセスは、
図1について上記に説明されるプロセスを使用して進行指標を生成することにおいて使用され得る計算モデルを開発するための機構を提供する。
【0140】
単にモデルを生成することに加えて、工程250において、プロセスは、典型的に、モデルを試験して、訓練されたモデルの識別性能を評価することを含む。そのような試験は、モデルの偏りを避けるために、典型的に、1サブセットの参照対象データ、特に、モデルを訓練するために使用された参照対象データとは異なる参照対象データを使用して行われる。試験を使用して、計算モデルが十分な識別性能を提供することを確実にする。この点において、識別性能は、典型的に、精度、感度、特異度およびAUROCに基づいており、モデルが使用されるためには、少なくとも70%の識別性能が必要とされる。
【0141】
モデルが識別性能に適合する場合、次に、それは、
図1について上記に概略されるプロセスを使用して進行指標を決定することにおいて使用され得ることが理解される。そうでなければ、プロセスは、工程230に戻り、異なるメトリックおよび/またはモデルが選択されることを可能にし、次に、訓練および試験は、必要に応じて繰り返される。
【0142】
したがって、一例において、1つまたは複数の処理デバイスは、典型的に上記に列挙される使用可能なメトリックの各々の1サブセットとして選択される複数の参照メトリックを選択し、複数の参照メトリックを使用して1つまたは複数の計算モデルを訓練し、計算モデルを試験してモデルの識別性能を判定し、モデルの識別性能が閾値よりも下に下がる場合には、複数の異なる参照メトリックおよび/または異なる参照対象データに由来する複数のメトリックを使用して計算モデルを選択的に再訓練し、かつ/または異なる計算モデルを訓練する。したがって、上記に説明されるプロセスは、必要とされる程度の識別力が取得されるまで、異なるメトリックおよび/または異なる計算モデルを反復的に利用して行われ得ることが理解される。
【0143】
したがって、一例において、1つまたは複数の処理デバイスは、少なくとも20、40、60、80、100、200、400、600、800、1000、2000個またはそれ以上のメトリックを使用してモデルを訓練し、得られるモデルは、典型的に、100個未満などの有意に少ないメトリックを使用する。
【0144】
加えておよび/またはあるいは、1つまたは複数の処理デバイスは、参照メトリックの複数の組合せを選択し、組合せの各々を使用して複数の計算モデルを訓練し、各計算モデルを試験してモデルの識別性能を判定し、進行指標を決定することにおける使用のための最も高い識別性能を有する計算モデルのうちの1つまたは複数を選択することができる。
【0145】
メトリックを使用してモデルを訓練することに加えて、また、訓練は、モデルが各々の参照対象の属性に特異的であるように参照対象の属性を考慮して実施してもよく、またはがんの進行または再発の可能性を判定する場合に対象の属性を考慮してもよい。一例において、このプロセスは、例えば、k-meansクラスタリングなどのクラスタリング技術を使用して、参照対象の属性を使用して1つまたは複数の処理デバイスにクラスタリングを行わせて、類似する参照対象の属性を有する参照対象のクラスターを決定し、次に、少なくとも部分的に参照対象クラスターを使用して計算モデルを訓練することを含む。例えば、特定の形態のがんに罹患している参照個体のクラスターを同定してもよく、これを使用して、起こり得る進行または再発を同定するために計算モデルを訓練する。
【0146】
したがって、上記に説明される技術は、様々な異なるメトリックを使用して、がんの進行または再発の可能性を判定するための1つまたは複数の計算モデルを訓練し、次に、モデルを使用してがんの進行または再発の可能性を示す進行指標を生成するための機構を提供する。
【0147】
モニタリングシステムの一例を、ここで、
図3を参照してより詳細に説明する。
【0148】
この例において、インターネットおよび/またはいくつかのローカルエリアネットワーク(LAN)などの1つまたは複数の通信ネットワーク340を介して、1つまたは複数のクライアントデバイス330にカップリングされた1つまたは複数の処理システム310が提供される。いくつかの配列決定デバイス320が提供され、これらは、通信ネットワーク340を介して処理システム310に直接的に接続してもよく、またはより典型的には、これらは、クライアントデバイス330にカップリングされる。
【0149】
任意の数の処理システム310、配列決定デバイス320およびクライアントデバイス330を提供してもよく、現在の表示は、単に例示の目的のためである。また、ネットワーク340の配置は、単に例の目的のためであり、実際には、処理システム310、配置決定デバイス320およびクライアントデバイス330は、任意の適切な機構を介して、例えば、非限定的に、モバイルネットワーク、プライベートネットワーク、例えば、802.11ネットワーク、インターネット、LAN、WANなどを含む有線またはワイヤレス接続を介して、および直接接続または二地点間接続、例えばブルートゥースなどを介して通信してもよい。
【0150】
この例において、処理システム310は、配列決定デバイス320および/またはクライアントデバイス330から受容した対象データを受容および解析するように適合され、計算モデルが生成および使用されて、進行指標を決定することを可能にし、次に、進行指標は、クライアントデバイス330を介して表示され得る。処理システム310は、単一の実体として示されるが、それらは、例えばクラウドベースの環境の部分として、いくつかの地理的に分離した場所にわたり分布されるいくつかの処理システムを含み得ることが理解される。したがって、上記に説明される配置は必須ではなく、他の好適な配置を使用してもよい。
【0151】
好適な処理システム310の一例を、
図4に示す。この例において、処理システム310は、示されるようにバス404を介して相互接続される、少なくとも1つのマイクロプロセッサ400、メモリ401、適宜の入力/出力デバイス402、例えば、キーボードおよび/またはディスプレイ、ならびに外部インターフェース403を含む。この例において、外部インターフェース403は、処理システム310を周辺デバイス、例えば、通信ネットワーク340、データベース411、他の保存デバイスなどに接続するために利用され得る。単一の外部インターフェース403が示されるが、これは単に例の目的のためであり、実際には、様々な方法(例えば、イーサネット、シリアル、USB、ワイヤレスなど)を使用する多数のインターフェースが提供され得る。
【0152】
使用において、マイクロプロセッサ400は、メモリ401において保存されているアプリケーションソフトウェアの形態の命令を実行して、必要なプロセスが実施されることを可能にする。アプリケーションソフトウェアは、1つまたは複数のソフトウェアモジュールを含んでもよく、好適な実行環境、例えばオペレーティングシステム環境などにおいて実行され得る。
【0153】
したがって、処理システム310は、任意の好適な処理システム、例えば好適にプログラムされたPC、ウェブサーバー、ネットワークサーバーなどから形成され得ることが理解される。特定の例において、処理システム310は、標準の処理システム、例えばインテル・アーキテクチャベースの処理システムであり、標準の処理システムは、不揮発性(例えば、ハードディスク)ストレージに保存されるソフトウェアアプリケーションを実行するが、これは必須ではない。しかしながら、また、処理システムは、任意の電子処理デバイス、例えばマイクロプロセッサ、マイクロチッププロセッサ、論理ゲート構成、適宜インプリメンティング論理、例えばFPGA(フィールドプログラマブルゲートアレイ)と関連付けられるファームウェア、または他の任意の電子デバイス、システムもしくは配置であり得ることが理解される。
【0154】
図5において示されるように、一例において、クライアントデバイス330は、示されるようにバス504を介して相互接続される、少なくとも1つのマイクロプロセッサ500、メモリ501、入力/出力デバイス502、例えば、キーボードおよび/またはディスプレイ、外部インターフェース503を含む。この例において、外部インターフェース503は、クライアントデバイス330を周辺デバイス、例えば、通信ネットワーク340、データベース、他の保存デバイスなどに接続するために利用され得る。単一の外部インターフェース503が示されるが、これは単に例の目的のためであり、実際には、様々な方法(例えば、イーサネット、シリアル、USB、ワイヤレスなど)を使用する多数のインターフェースが提供され得る。カードリーダー504は、任意の好適な形態のカードリーダーであってもよく、磁気カードリーダー、またはスマートカードを読み取るための非接触リーダーなどを含み得る。
【0155】
使用において、マイクロプロセッサ500は、メモリ501において保存されているアプリケーションソフトウェアの形態の、処理システム310および/または配列決定デバイス320のうちの1つとの通信を可能にする命令を実行する。
【0156】
したがって、クライアントデバイス330は、任意の好適にプログラムされた処理システムから形成され、好適にプログラムされたPC、インターネット端末、ラップトップまたはハンドヘルドPC、タブレット、スマートフォンなどを含み得ることが理解される。しかしながら、また、クライアントデバイス330は、任意の電子処理デバイス、例えば、マイクロプロセッサ、マイクロチッププロセッサ、論理ゲート構成、適宜インプリメンティング論理、例えばFPGA(フィールドプログラマブルゲートアレイ)と関連付けられるファームウェア、または他の任意の電子デバイス、システムもしくは配置であり得ることが理解される。
【0157】
進行指標を生成するためのプロセスの例を、ここで、さらに詳細に説明する。これらの例の目的のために、1つまたは複数の各々の処理システム310は、対象データを受容および解析し、進行指標を生成し、進行指標へのアクセスを提供するように適合されたサーバーであることが想定される。サーバー310は、典型的に、処理デバイスソフトウェアを実行し、関連動作が実施されることを可能にし、サーバー310によって実施される動作は、メモリ401においてアプリケーションソフトウェアとして保存されている命令および/またはI/Oデバイス402を介してユーザーから受容した入力コマンドに従って、プロセッサ400によって実施される。また、クライアントデバイス330によって実施される動作は、メモリ501においてアプリケーションソフトウェアとして保存されている命令および/またはI/Oデバイス502を介してユーザーから受容した入力コマンドに従って、プロセッサ500によって実施されることが想定される。
【0158】
しかしながら、以下の例の目的のために想定される上記に説明される構成は必須ではなく、多くの他の構成を使用してもよいことが理解される。また、異なる処理システム間の機能性の分割は、特定のインプリメンテーションに依存して変動し得ることが理解される。
【0159】
個体についての対象データを解析するためのプロセスの一例を、ここで、
図6を参照してより詳細に説明する。
【0160】
この例において、工程600において、サーバー310は、好ましいインプリメンテーションに依存して、適宜クライアントデバイス330を介して、保存された記録から対象データを検索するかまたは配列決定デバイスから対象データを受容して、対象データを取得する。
【0161】
工程605において、サーバー310は、例えばデータベースから対象の属性を検索することまたは対象データの部分として対象の属性を取得することによって、対象の属性を決定する。対象の属性は、使用される1つまたは複数の計算モデルを選択するために使用してもよく、かつ/または計算モデルが適用されることを可能にするためにメトリックと組み合わせてもよい。この点において、対象についてのメトリックは、典型的に、対象と類似する属性を有する参照対象についての参照メトリックに基づいて解析される。これは、属性の異なる組合せについて異なる計算モデルを使用することによって、または属性を計算モデルへの入力として使用することによって、達成することができる。
【0162】
工程610において、サーバー310は、対象が罹患しているがんのがんタイプを決定し、工程615において、これを使用して1つまたは複数の計算モデルを選択する。この点において、異なる計算モデルは、典型的に、異なるタイプのがんについての進行または再発の可能性を評価するために使用される。
【0163】
モデルを選択すると、次に、工程620において、サーバー310は、モデルによって必要とされる関連メトリックを計算する。
【0164】
工程625において、適宜1つまたは複数の対象の属性と共に、例えば関連メトリックを使用することによって、メトリックを計算モデルに適用して、決定木評価を実施し、工程630において、がんの進行または再発の可能性を示す指標の生成をもたらす。
【0165】
工程635において、サーバー310は、典型的に対象データの部分として、進行指標を保存し、適宜、例えばこれを表示のためのクライアントデバイスへ転送することによって、進行指標が表示されることを可能にする。
【0166】
機械学習手法の特定の例を、ここで、より詳細に説明する。
【0167】
この例において、配列決定データを、上記に説明されるプロセスに通し、目的のメトリックを同定および定量し、これらを、プロファイルを構築するために患者と照合する。
【0168】
次に、これを使用して、例えば、「高PFS」(例えば、がんが進行しない特定の期間を達成する患者)、および「低PFS」(例えば、がんが進行しない特定の期間を達成しない患者、または言い換えると、がんが特定の期間内に進行した患者)である患者プロファイルを同定する。データを解析し得る多くの方法があり、本明細書で説明される以下の手法は、がんの進行に適応される。
【0169】
最初に、配列データを収集し、各患者についてのメトリックを産生するために使用する。未処理の結果をエクスポートし、データをクリーニングする(例えば、解析に必要とされないメタデータを除去する)ことによって解析してもよく、その後、患者を解析のためにグループ化する。
【0170】
プロセスの有効性を証明するために、いくつかのがん患者が解析されており、患者は、3つのカテゴリーである訓練データ、チューニングデータおよび検証データにグループ化される。訓練データセットおよびチューニングデータセットは、多数の患者からなり、患者は各群にランダムに分けられる。検証データセットは、データが訓練データセットおよびチューニングデータセットを含んでいない患者からなる。
【0171】
典型的な実験手法は、検証データセット(予測されるデータ)を「取り置きし(set aside)」、残りの患者をまとめて照合することである。次に、照合された患者は、75:25(レスポンダー/非レスポンダーのおよその等しい割合を有する)で訓練データセット(約75%)とチューニングデータセット(約25%)に分けられる。
【0172】
データをグループ化すると、高PFSおよび低PFSは、検証データセットにおける患者についての各メトリックについてプロットされ得る。データをプロットすることは、機械学習解析によって重要であると同定されるメトリックをさらに調査するための方法を提供するが、計算/解析のいずれかに直接的には関係しない。
【0173】
データをグループ化し、適切にフォーマット化すると、機械学習アルゴリズムを適用して、計算モデルを生成する。一例において、使用されるアルゴリズムは、XGBoostであり、これは、大きなデータセット(数百万個のデータ点)に対するスピードおよび性能のために特別に設計される「勾配ブースティング決定木」のインプリメンテーションである。
【0174】
この手法は、多数の決定木を計算し、各決定木をチェックして、訓練データセットについて予測スコアを最大限にする決定木を見つける。次に、予測モデルは、予測目的のために適用され得る。実際に、好ましい手法は、各決定木がメトリックの異なる組合せを使用する、決定木の「アンサンブル」を使用して予測を行い、これによって、精度を増大させる。
【0175】
この手法は、非常に計算コストが高い場合があり、何百万個の可能な木および多くの可能なアンサンブルをもたらし得る。一般的に、この手法を最適化するために、各モデルは、典型的に各場合において100個超の、1サブセットのメトリックを使用して訓練されるが、一方で単一のメトリックを使用してもよく、実際には、一般的に、合理的なレベルの精度を有するモデルについて10個超、20個超または30個超が存在する。
【0176】
XGBoostモデルを構築する場合に調節され得るいくつかのパラメータがあり、そのため、設定を最適化するために多数のパスが行われる場合があり、次に最適化設定が使用される。最適化は、人為的干渉を伴わずに行われ(設定の様々な組合せが試験され、コンピュータはどの設定が最適であるかを同定する)、この手法を、一貫性があり、再現性があるものにし、実験者バイアスからの影響を最小限にする。
【0177】
モデルを構築、チューニングし、データへ適用すると、どのメトリックが、行われる予測にとって重要であるかを決定することが可能である。各メトリックの、予測全体への寄与は累積的であり、特定の変数についてのスコアは、予測全体に「重み付けされた」様式において寄与する(すなわち、1つのメトリックについてのスコアは、対象がレスポンダーであることを示し得るが、別のメトリックについてのスコアは、対象がレスポンダーではないことを示し得る)。
【0178】
この機械学習手法を使用して、「現実世界の」データセットに適用した場合(実施例2および3を参照されたい)、患者アウトカムは、優れた精度により予測され得る。
【0179】
7.診断および治療適用
本明細書で説明される方法およびシステムを使用して、対象の核酸分子におけるSNVを検出し、1つまたは複数のメトリック(またはCPAS)を生成して、対象におけるがんが進行または再発する可能性を判定することができる。したがって、また、本明細書で説明される方法を使用して、対象のための管理プログラムまたは処置レジメンの処方を促進することができる。例えば、対象のがんが進行または再発する可能性が高いと判定された場合、適切な治療(例えば、異なるおよび/またはより積極的な治療)による患者の処置が開始され得るか、または現在の治療が維持され得る。あるいは、患者のがんが進行または再発する可能性が低いと判定された場合、患者の処置は、停止、低減または維持され得る。
【0180】
以下の例において実証されるように、進行または再発する可能性が高いがんを有する対象は、進行または再発する可能性が低いがんを有する対象のメトリックのプロファイルと比較して、メトリックの異なるプロファイル(またはCPAS)を有する。それゆえ、対象が進行または再発する可能性が高いまたは低いがんを有するかどうかを判定するために、対象についてのメトリックのプロファイル、すなわち、試料プロファイルが生成され、参照のメトリックのプロファイルと比較され得る。本開示のプロファイルは、上記に説明されるように少なくとも任意の1、2、3、4、5、6、7、8、9、10、20、30、40個またはそれ以上のメトリック(またはCPAS)の評価を反映する。参照プロファイルは、進行または再発する可能性が高いがんを有する対象と相関するか、または進行または再発する可能性が高いがんを有する対象を表す場合があり、かつ/または進行または再発する可能性が低いがんを有する対象と相関するか、または進行または再発する可能性が低いがんを有する対象を表す場合がある。試料プロファイルと参照プロファイルとの間の比較を行う場合、プロファイルにおける類似性または相違は、対象が再発または進行する可能性が高いまたは低いがんを有することを示し得る。例えば、参照プロファイルが、進行または再発する可能性が高いがんを有する対象と相関するか、または進行または再発する可能性が高いがんを有する対象を表し(例えば、特定のPFS時間、例えば比較的低いPFS時間によって表される)、試料プロファイルが、その参照プロファイルと同様であるかまたは本質的に同じである場合、試料プロファイルが由来する対象は進行または再発する可能性が高いがんを有するという判定がなされ得る。逆に、参照プロファイルが、進行または再発する可能性が低いがんを有する対象と相関するか、または進行または再発する可能性が低いがんを有する対象を表し(例えば、特定のPFS時間、例えば比較的高いPFS時間によって表される)、試料プロファイルが、その参照プロファイルと同様であるかまたは本質的に同じである場合、試料プロファイルが由来する対象は進行または再発する可能性が低いがんを有するという判定がなされ得る。理解され得るように、進行しないがんと比較して進行するがんを区別し得る、プロファイル中のメトリックのセットは、異なるタイプのがんについて異なり得る。例えば、進行する可能性が低い乳がんから、進行する可能性が高い乳がんを区別し得る、プロファイル中のメトリックのセットは、進行する可能性が低い皮膚がんから、進行する可能性が高い皮膚がんを区別し得る、プロファイル中のメトリックのセットとは異なり得る。重複する(すなわち、乳がんおよび皮膚がんプロファイルの両方を生成するために使用される)一部のメトリックが存在し得るが、一部のメトリックは、プロファイルのうちの1つのみにおいて使用され得る。その結果、本開示の方法において生成および/または利用される参照プロファイルは、典型的に、評価される対象のがんのタイプと同じタイプのがんである、特定のタイプのがんについて特異的である、すなわち、評価される対象が乳がんを有する場合、参照プロファイルは、進行または再発する可能性が低いまたは高い乳がんを有する対象と相関するか、または進行または再発する可能性が低いまたは高い乳がんを有する対象を表す。
【0181】
参照プロファイルは、既知の表現型、疾患状態または疾患を発症するリスクを有する個体における参照メトリックまたはCPASの評価において取得されたデータに基づいて決定される。したがって、例えば、参照プロファイルは、進行または再発しなかったがんを有するかまたは有した個体におけるメトリックの評価において取得されたデータに基づき得る。そのような場合、参照プロファイルは、進行または再発する可能性が低いがんを有する対象と相関するか、進行または再発する可能性が低いがんを有する対象を表す。他の例において、参照プロファイルは、進行または再発したがんを有するかまたは有した個体におけるメトリックの評価において取得されたデータに基づく。そのような場合、参照プロファイルは、進行または再発する可能性が低いがんを有する対象と相関するか、進行または再発する可能性が低いがんを有する対象を表す。参照プロファイルを生成するために使用される個体は、年齢、性別および/または民族性が適合していてもよく、適合していなくてもよい。理解されるように、がんのタイプは、典型的に、適合される、すなわち、参照プロファイルは、本開示の方法を使用して評価される対象のがんのタイプと同じタイプのがんを有する参照対象または対照対象から取得されたデータに基づいて決定される。
【0182】
特定の実施形態において、参照プロファイルは、計算モデル、例えば機械学習技術などの様々な解析技術を使用して形成される計算モデルを使用して産生され、計算モデルを包含する。計算モデルは、データの本体をデータ中に存在する目的パラメータに基づいてクラスに分離するよう試みる任意の好適な統計分類または学習方法を使用して形成することができる。分類方法は、監督されてもよく、監督されなくてもよい。監督されたおよび監督されていない分類プロセスの例は、Jain, "Statistical Pattern Recognition: A Review", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, January 2000において説明されており、その教示は参照により組み込まれる。分類モデルを産生するために使用され得る技術の非限定的な例には、深層学習技術、例えば、Deep Boltzmann Machine、Deep Belief Networks、Convolutional Neural Networks、Stacked Auto Encoders;アンサンブル技術、例えば、Random Forest、Gradient Boosting Machines、Boosting、Bootstrapped Aggregation、AdaBoost、Stacked Generalization、Gradient Boosted Regression Trees;ニューラルネットワーク技術、例えば、Radial Basis Function Network、Perceptron、Back-Propagation、Hopfield Network;正則化法、例えば、Ridge Regression、Least Absolute Shrinkage and Selection Operator、Elastic Net、Least Angle Regression;回帰法、例えば、Linear Regression、Ordinary Least Squares Regression、Multiple Regression、Probit Regression、Stepwise Regression、Multivariate Adaptive Regression Splines、Locally Estimated Scatterplot Smoothing、Logistic Regression、Support Vector Machines、Poisson Regression、Negative Binomial Regression、Multinomial Logistic Regression;ベイズ技術、例えば、Naive Bayes、Average One-Dependence Estimators、Gaussian Naive Bayes、Multinomial Naive Bayes、Bayesian Belief Network、Bayesian Network;決定木、例えば、Classification and Regression Tree、Iterative Dichotomiser、C4.5、C5.0、Chi-squared Automatic Interaction Detection、Decision Stump、Conditional Decision Trees、M5;次元削減、例えば、Principle Component Analysis、Partial Least Squares Regression、Sammon Mapping、Multidimensional Scaling、Projection Pursuit、Principle Component Regression、Partial Least Squares Discriminant Analysis、Mixture Discriminant Analysis、Quadratic Discriminant Analysis、Regularized Discriminant Analysis、Flexible Discriminant Analysis、Linear Discriminant Analysis、t-Distributed Stochastic Neighbour Embedding;インスタンスベース技術、例えば、K-Nearest Neighbour、Learning Vector Quantization、Self-Organizing Map、Locally Weighted Learning;クラスタリング法、例えば、k-Means、k-Modes、k-Medians、DBSCAN、Expectations Maximization、Hierarchical Clustering;前述の手法の適合、延長および組合せが挙げられる。
【0183】
進行または再発していないがんを有することが既知の個体からのデータ、および/または進行または再発したがんを有することが既知の個体からのデータは、計算モデルを訓練するために使用することができる。そのようなデータは、典型的に、訓練データセットと称される。訓練されると、計算モデルは、未知の試料を使用して生成されたデータ、例えば、試料プロファイルを生成するために使用された、がんを有する患者からのデータ中のパターンを認識することができる。次に、試料プロファイルを、計算モデルに適用して、試料プロファイルを、例えば、進行または再発する可能性が高いかまたは進行または再発する可能性が低いがんを有する、クラスに分類することができる。
【0184】
一部の実施形態において、参照プロファイルは、評価される各メトリックについての所定の範囲間隔またはカットオフに基づいて生成される。例えば、参照スコアは、所定の範囲間隔外であるかまたは所定のカットオフ超または未満である各メトリックに帰し、次に、参照スコア合計は、全てのスコアを合計することによって計算される。次に、この参照スコア合計を使用して、所定の閾値スコアを生成し、この閾値スコア超または未満は、特定の既知の表現型、疾患状態または疾患を発症するリスクを表し、例えば、閾値未満は、がんが再発または進行する可能性が低い対象を表し、閾値超は、がんが再発または進行する可能性が高い対象を表す。それゆえ、閾値スコアは、がんが進行または再発する可能性が高い者と、がんが進行または再発する可能性が低い者とを区別するスコアを表し、対照対象(例えば、進行または再発するがんを有するかまたは有したことが既知の対照対象、および/または進行または再発しないがんを有するかまたは有したことが既知の対照対象)を使用して取得された値およびスコアに基づいて当業者によって容易に確立され得る。各メトリックについてのスコアは、同じであってもよく、異なっていてもよい(例えば、所定の範囲間隔外またはカットオフ超もしくは未満である1つのメトリックが、別のメトリック超または未満であるスコアを与えられ得るように「重み付け」してもよい)。特定の例において、所定の範囲間隔外またはカットオフ超もしくは未満である各メトリックは、1のスコアを与えられる。
【0185】
メトリックについての所定の範囲間隔またはカットオフは、進行または再発するがんを有するかまたは有したことが既知の2つまたはそれ以上の対象、および/または進行または再発しないがんを有するかまたは有したことが既知の2つまたはそれ以上の対象においてメトリックを評価することによって決定することができる。次に、メトリックについての範囲間隔を計算して、そのメトリックについての標的値と考えられ得る値の上限および下限を設定する。同様に、メトリックについてのカットオフを計算して、そのメトリックについての標的値と考えられ得る値の上限または下限を設定する。一部の例において、範囲間隔は、メトリックの平均値プラスまたはマイナスn標準偏差を測定することによって計算され、これによって、範囲間隔の下限は、平均値マイナスn標準偏差であり、範囲間隔の上限は、平均値プラスn標準偏差である。同様に、カットオフを計算することができる。そのような例において、nは、1または1超もしくは1未満、例えば、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5などであり得る。またさらなる例において、所定の範囲間隔またはカットオフの上限および下限は、受信者動作特性(ROC)曲線を使用して確立される。所定の範囲間隔またはカットオフを決定するために使用される対象は、任意の年齢、性別またはバックグラウンドの対象であってもよく、特定の年齢、性別、民族バックグラウンドまたは他のサブ集団の対象であってもよい。したがって、一部の実施形態において、2つまたはそれ以上の所定の正常範囲間隔またはカットオフを、同じメトリックについて計算してもよく、これによって、各範囲間隔またはカットオフは、特定のサブ集団、例えば、特定の性別、年齢群、民族バックグラウンドおよび/または他のサブ集団について特異的である。所定の範囲間隔またはカットオフは、手動の計算法、アルゴリズム、ニューラルネットワーク、サポートベクターマシン、深層学習、直線モデルによるロジスティック回帰、機械学習、人工知能および/またはベイジアンネットワークを含む、当業者に公知の任意の技術を使用して決定することができる。
【0186】
一部の例において、参照および試料プロファイルは、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される5個またはそれ以上のメトリックを含む複数のメトリックを含む。特定の例において、プロファイルは、表Dに示すメトリックおよび表Dに示すメトリックに関連するメトリックから選択される約10、15、20、35、30、40、45、50、55、60、65、70、75、80、85、90、95、100個またはそれ以上のメトリックを含む複数のメトリックを含む。
【0187】
中皮腫の進行または再発が評価されているような一部の例において、プロファイルは、cds:3Gen2_C-C-C MC3 %、g:A3Bj_RT-C-G C>T + G>A g %、cds:3Gen3_GG-C- non-syn %、cds:A3Gb_-C-G G>A at MC2 motif %、cds:A3B_T-C-W MC1 %、cds:3Gen1_-C-GC MC2 %、cds:A3Gb_-C-G G>A MC2 Hits、cds:A1_-C-A G>A at MC3 cds %、cds:3Gen3_AG-C- MC2 %、cds:ADAR_W-A- non-syn %、cds:A3Bj_RT-C-G Ti %、g:3Gen2_T-C-G C>T + G>A g %、cds:AIDe_WR-C-GW Hits、cds:3Gen2_A-C-G MC2 non-syn %、cds:A3Gi_SG-C-G non-syn %、g:ADAR_W-A- A>G + T>C %、cds:2Gen1_-C-C G>T at MC1 %、cds:A3Gi_SG-C-G MC2 %、cds:A3Bf_ST-C-G Ti %、cds:ADAR_3Gen2_G-A-C non-syn %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。中皮腫の進行または再発が評価されているさらなる例において、プロファイルは、cds:A3Bf_ST-C-G Ti %;g:3Gen2_T-C-G C>T + G>A g %;cds:2Gen1_-C-C C>T at MC1 %;cds:All C Ti/Tv %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen2_C-C-C MC3 %;cds:A3Gn_YYC-C-S C>T %;cds:A3G_C-C- MC3 %;cds:3Gen3_GG-C- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;cds:4Gen3_TT-C-C %;cds:3Gen2_C-C-T MC3 %;g:2Gen1_-C-T C>G + G>C g %;cds:Primary Deaminase %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:4Gen3_CA-C-C %;cds:A3G_C-C- G>T %;cds:A3Gi_SG-C-G non-syn %;g:C>G + G>C %;cds:Other MC3 %;cds:A3B_T-C-W G>A motif %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。
【0188】
副腎皮質癌の進行または再発が評価されているような一部の例において、プロファイルは、g:A3F_T-C- Hits、cds:3Gen1_-C-TG G non-syn %、cds:3Gen2_C-C-T MC3 %、cds:All G total、g:3Gen1_-C-TC C>T + G>A g %、cds:3Gen3_CT-C- MC3 %、cds:All G %、nc:A3G_C-C- C>T + G>A nc %、cds:A3B_T-C-W G>A motif %、cds:AIDc_WR-C-GS %、cds:3Gen1_-C-GT G>A motif %、cds:A3B_T-C-W MC3 non-syn %、cds:3Gen3_TG-C- G>A %、cds:ADAR_2Gen2_G-T- MC2 %、cds:3Gen3_TG-C- G Ti/Tv %、cds:4Gen3_TT-C-C %、cds:2Gen1_-C-C C>A %、cds:A3G_C-C- C>T at MC1 %、cds:AIDb_WR-C-G G non-syn %、cds:A3G_C-C- MC3 %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。副腎皮質癌の進行または再発が評価されているさらなる例において、プロファイルは、cds:All G total;cds:3Gen1_-C-TG G non-syn %;g:A3F_T-C- Hits;cds:3Gen3_GG-C- non-syn %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;cds:3Gen2_C-C-T MC3 %;nc:A3G_C-C- C>T + G>A nc %;cds:AIDd_WR-C-Y %;cds:3Gen1_-C-TC C>T cds %;cds:A3B_T-C-W G>A motif %;g:CG total;cds:A3G_C-C- MC3 %;cds:AIDb_WR-C-G G non-syn %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen3_TG-C- G>A %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen2_A-C-G MC2 non-syn %;cds:3Gen3_CT-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;g:AIDh_WR-C-T C>A + G>T g %;cds:A3B_T-C-W MC3 non-syn %;cds:2Gen1_-C-C C>A %;cds:A1_-C-A G>A at MC3 cds %;cds:3Gen1_-C-CA Ti C:G %;cds:ADAR_W-A- non-syn %;cds:3Gen1_-C-CA Ti %;cds:All G %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gb_-C-G MC1 %;cds:A3B_T-C-W G non-syn %;nc:2Gen2_A-C- C>T + G>A nc %;cds:A3Gi_SG-C-G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:A3B_T-C-W Ti %;およびg:2Gen1_-C-T %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35個または全てのメトリックを含む複数のメトリックを含む。
【0189】
脳腫瘍(例えば、低悪性度神経膠腫)の進行または再発が評価されているような他の例において、プロファイルは、g:CG total、cds:AIDc_WR-C-GS MC3 %、cds:A3B_T-C-W G non-syn %、cds:AIDd_WR-C-Y %、g:AIDc_WR-C-GS Hits、cds:3Gen2_A-C-C non-syn %、g:3Gen3_GA-C- C>A + G>T g %、cds:2Gen2_G-C- Hits、cds:4Gen3_TA-C-C non-syn %、nc:2Gen2_A-C- C>T + G>A nc %、cds:Other MC3 C %、cds:3Gen2_T-C-G Ti/Tv %、g:3Gen2_A-C-C C>A + G>T g %、g:3Gen3_CA-C- C>T + G>A g %、cds:3Gen2_T-C-C MC1 %、g:ADAR_2Gen1_-T-T A>T + T>A %、g:ADAR_2Gen2_G-T- A>T + T>A %、g:2Gen1_-C-T %、cds:ADAR_3Gen1_-A-CA %、cds:ADAR_2Gen2_T-T- %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。脳腫瘍(例えば、低悪性度神経膠腫)の進行または再発が評価されている他の例において、プロファイルは、g:CG total;cds:AIDd_WR-C-Y %;variants in VCF;cds:4Gen3_TA-C-C non-syn %;cds:3Gen2_C-C-T MC3 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gb_-C-G MC1 %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W G non-syn %;g:3Gen3_GA-C- C>A + G>T g %;cds:2Gen2_G-C- Hits;cds:AIDc_WR-C-GS MC3 %;cds:All G total;cds:All A non-syn %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_A-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;g:ADARk_CW-A- A>G + T>C g %;nc:ADARb_W-A-Y A>G + T>C nc %;g:2Gen1_-C-T %;cds:Other MC3 C %;g:2Gen1_-C-T C>G + G>C g %;cds:ADAR_W-A- non-syn %;g:3Gen2_A-C-C C>A + G>T g %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:A3G_C-C- C>T at MC1 %;cds:3Gen1_-C-GC MC2 %;cds:3Gen2_G-C-T %;cds:A3F_T-C- G>C %;g:4Gen3_GG-C-G C>T + G>A g %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3F_T-C- Hits;cds:3Gen2_T-C-C MC1 %;cds:A3B_T-C-W Ti %;cds:ADAR_3Gen1_-A-AT Ti %;cds:ADARh_W-A-S T>C %;cds:A3Gn_YYC-C-S C>T %;cds:A3Ge_SC-C-GS %;cds:2Gen2_A-C- MC3 %;cds:ADAR_2Gen2_G-T- MC2 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:Primary Deaminase %;g:C>G + G>C %;cds:A3Bf_ST-C-G Ti %;cds:3Gen3_CT-C- MC3 %;cds:A3Gi_SG-C-G non-syn %;cds:Other MC3 %;cds:ADAR_3Gen1_-A-CA %;cds:A3F_T-C- C>A %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3Gc_C-C-GW C>T motif %;cds:AIDc_WR-C-GS %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:2Gen1_-C-C C>A %;cds:3Gen1_-C-GT G>A motif %;cds:A3Bj_RT-C-G Ti %;g:3Gen1_-C-TC C>T + G>A g %;g:C>A + G>T %;cds:3Gen2_A-C-C MC2 %;cds:2Gen1_-C-C MC2 %;g:3Gen2_G-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:3Gen1_-C-TG G non-syn %;cds:Other G MC3 Ti/Tv %;cds:A3Gb_-C-G G>A MC2 Hits;cds:3Gen1_-C-TC C>T cds %;cds:2Gen1_-C-T MC3 non-syn %;cds:AIDb_WR-C-G G non-syn %;g:AIDc_WR-C-GS Hits;cds:3Gen2_T-C-C MC3 %;cds:3Gen2_T-C-G Ti/Tv %;cds:A1_-C-A G>A at MC3 cds %;nc:A3G_C-C- C>T + G>A nc %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen3_TG-C- G Ti/Tv %;cds:3Gen1_-C-CA Ti %;cds:3Gen3_TG-C- G>A %;cds:3Gen3_CT-C- G non-syn %;cds:All C Ti/Tv %;cds:A3G_C-C- MC3 %;cds:ADARc_SW-A-Y MC2 %;およびcds:3Gen3_GG-C- non-syn %、ならびにそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80個または全てのメトリックを含む複数のメトリックを含む。
【0190】
肉腫の進行または再発が評価されているようなさらなる例において、プロファイルは、nc:ADARb_W-A-Y A>G + T>C nc %、g:ADARk_CW-A- A>G + T>C g %、cds:ADAR_3Gen3_CA-A- Ti %、cds:A3G_C-C- G>T %、cds:4Gen3_TT-C-T %、cds:ADARc_SW-A-Y T>C cds %、nc:ADARc_SW-A-Y A>G + T>C nc %、cds:A3F_T-C- G>C %、g:C>A + G>T %、cds:2Gen1_-C-T MC3 non-syn %、nc:ADARb_W-A-Y %、cds:AIDd_WR-C-Y C>A cds %、cds:Primary Deaminase %、cds:4Gen3_CA-C-C MC1 %、g:C>G + G>C %、g:2Gen1_-C-T C>G + G>C g %、g:AIDh_WR-C-T C>A + G>T g %、cds:A3Ge_SC-C-GS %、cds:ADAR_3Gen3_CT-A- A>G motif %、cds:ADARf_SW-A- MC2 %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。肉腫の進行または再発が評価されているさらなる例において、プロファイルは、cds:Other MC3 C %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:4Gen3_TT-C-T %;g:ADARk_CW-A- A>G + T>C g %;g:ADARn_-A-WA A>G + T>C %;cds:A3G_C-C- G>T %;cds:A3Gb_-C-G MC1 %;nc:ADARb_W-A-Y %;cds:A3Ge_SC-C-GS %;cds:Primary Deaminase %;cds:ADAR_2Gen2_G-T- MC2 %;g:4Gen3_GG-C-G C>T + G>A g %;cds:2Gen1_-C-C MC2 %;cds:3Gen1_-C-GT G>A motif %;cds:A3Gn_YYC-C-S C>T %;cds:2Gen1_-C-C C>T at MC1 %;cds:A3B_T-C-W MC3 non-syn %;cds:AIDd_WR-C-Y %;g:3Gen3_CA-C- C>T + G>A g %;cds:All A non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:ADARb_W-A-Y MC2 %;cds:All G %;g:A3Bj_RT-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:A3B_T-C-W G non-syn %;cds:A3G_C-C- MC3 %;cds:All G total;cds:CDS Variants;g:CG total;g:3Gen2_T-C-G C>T + G>A g %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen3_CA-A- Ti %;cds:AIDc_WR-C-GS %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30個または全てのメトリックを含む複数のメトリックを含む。
【0191】
肺がん(例えば、肺の扁平上皮癌)の進行または再発が評価されているような他の例において、プロファイルは、cds:ADARp_-A-WT A>G at MC2 cds %、cds:3Gen1_-C-TC C>T cds %、cds:AIDd_WR-C-Y G>C %、cds:ADAR_3Gen3_AC-A- A>G cds %、cds:3Gen1_-C-CT C>T at MC2 cds %、cds:A3Go_TC-C-G MC1 non-syn %、cds:3Gen2_G-C-T C>A motif %、nc:2Gen1_-C-T C>A + G>T nc %、cds:ADAR_2Gen2_A-T- A>C at MC1 motif %、cds:4Gen3_CA-C-C %、cds:A3Gn_YYC-C-S C>T at MC3 cds %、cds:3Gen1_-C-AG G Ti/Tv %、cds:ADARh_W-A-S T>C %、cds:3Gen1_-C-CC C>T at MC1 motif %、cds:2Gen1_-C-C C>T at MC1 %、g:ADAR_4Gen3_AG-A-G A>C + T>G %、cds:4Gen3_CT-C-C C>T at MC1 %、cds:ADAR_3Gen1_-A-CC A>G cds %、cds:A3Gn_YYC-C-S C>T %、cds:ADAR_W-A- T>C at MC2 %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。肺がん(例えば、肺の扁平上皮癌)の進行または再発が評価されているさらなる例において、プロファイルは、MC1モチーフ%におけるcds:3Gen1_-C-CC C>T at MC1 motif %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:ADARp_-A-WT A>G at MC2 cds %;cds:Other MC3 C %;cds:Other MC3 %;cds:A3Gb_-C-G MC1 %;g:3Gen1_-C-TC C>T + G>A g %;cds:ADAR_W-A- A>G at MC3 %;cds:ADAR_W-A- non-syn %;cds:ADAR_3Gen3_AC-A- A>G cds %;cds:2Gen1_-C-C C>A %;cds:ADARf_SW-A- MC2 %;g:ADAR_2Gen2_G-T- A>T + T>A %;cds:4Gen3_GC-C-A %;cds:A3Go_TC-C-G MC1 non-syn %;g:3Gen2_G-C-T %;cds:A3G_C-C- C>T at MC1 %;cds:AIDc_WR-C-GS MC3 %;cds:3Gen1_-C-GT G>A motif %;nc:2Gen1_-C-T C>A + G>T nc %;cds:ADARc_SW-A-Y MC2 %;cds:ADARh_W-A-S T>C %;cds:2Gen1_-C-C C>T at MC1 %;g:ADAR_2Gen1_-T-T A>T + T>A %;cds:AIDd_WR-C-Y C>A cds %;nc:A3G_C-C- C>T + G>A nc %;cds:A3Gc_C-C-GW C>T motif %;cds:ADAR_3Gen1_-A-AT Ti %;cds:3Gen3_CT-C- MC3 %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:3Gen2_T-C-C MC1 %;cds:A3G_C-C- G>T %;cds:3Gen1_-C-CA Ti %;cds:3Gen1_-C-TG G non-syn %;cds:3Gen2_A-C-C non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:All A non-syn %;cds:A3Gi_SG-C-G MC2 %;cds:Primary Deaminase %;cds:4Gen3_TT-C-T %;g:A3Bj_RT-C-G C>T + G>A g %;cds:3Gen2_T-C-C MC3 %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CA Ti C:G %;cds:A1_-C-A G>A at MC3 cds %;cds:A3Gb_-C-G G>A at MC2 motif %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_G-C-T C:G %;cds:A3Ge_SC-C-GS %;cds:3Gen3_TG-C- G>A %;g:C>A + G>T %;cds:4Gen3_CA-C-C %;cds:AIDd_WR-C-Y G>C %;cds:All G %;cds:3Gen3_TT-C- C>A at MC1 motif %;g:AIDh_WR-C-T C>A + G>T g %;g:4Gen3_GG-C-G C>T + G>A g %;cds:3Gen2_G-C-T C>A motif %;nc:ADARc_SW-A-Y A>G + T>C nc %;g:3Gen2_A-C-C C>A + G>T g %;cds:A3B_T-C-W Ti %;g:3Gen3_GA-C- C>A + G>T g %;cds:3Gen3_CT-C- C>T at MC1 motif %;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:3Gen1_-C-TC C>T cds %;cds:4Gen3_CA-C-C MC1 %;cds:3Gen2_G-C-T %;nc:2Gen2_A-C- C>T + G>A nc %;cds:3Gen2_A-C-C MC2 %;cds:A3F_T-C- C>A %;cds:CDS Variants;cds:ADAR_3Gen3_CA-A- Ti %;cds:3Gen3_GG-C- non-syn %;cds:ADARb_W-A-Y MC2 %;g:ADAR_W-A- A>G + T>C %;cds:3Gen3_AT-C- C:G %;cds:2Gen1_-C-C G>T at MC1 %;cds:A3G_C-C- MC3 %;cds:3Gen2_C-C-C MC3 %;cds:A3B_T-C-W G>A motif %;cds:A3F_T-C- G>C %;cds:ADAR_2Gen2_G-T- MC2 %;cds:3Gen1_-C-AG G Ti/Tv %;cds:A3Bj_RT-C-G Ti %;nc:ADARb_W-A-Y A>G + T>C nc %;cds:ADAR_2Gen2_T-T- %;g:2Gen1_-C-T %;cds:4Gen3_AC-C-T Ti/Tv %;cds:A3Gi_SG-C-G non-syn %;cds:A3Bf_ST-C-G Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;g:3Gen3_CA-C- C>T + G>A g %;cds:2Gen2_A-C- MC3 %;variants in VCF;cds:4Gen3_AG-C-T MC1 non-syn %;g:3Gen2_T-C-G C>T + G>A g %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:ADAR_3Gen1_-A-CA %;cds:4Gen3_TA-C-C non-syn %;cds:All C Ti/Tv %;cds:ADARc_SW-A-Y、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90個または全てのメトリックを含む複数のメトリックを含む。
【0192】
皮膚がん(例えば、黒色腫)の進行または再発が評価されているような他の例において、プロファイルは、cds:4Gen3_AG-C-T MC1 non-syn %、cds:All A non-syn %、cds:3Gen1_-C-CG G>A at MC3 %、cds:3Gen3_TT-C- C>A at MC1 motif %、cds:A3Gc_C-C-GW C>T motif %、cds:ADAR_W-A- A>G at MC3 %、cds:ADARp_-A-WT T>A motif %、cds:3Gen3_CT-C- G non-syn %、cds:3Gen2_T-C-T G>A at MC2 %、cds:ADAR_3Gen1_-A-AT Ti %、cds:All C Ti/Tv %、cds:3Gen1_-C-TC C>T at MC3 %、cds:4Gen3_AG-C-T G>A at MC1 motif %、cds:3Gen1_-C-CA Ti C:G %、cds:3Gen3_AT-C- G>A at MC2 %、cds:4Gen3_TG-C-T Ti C:G %、cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %、cds:4Gen3_GC-C-C C>T at MC2 %、cds:4Gen3_AC-C-T Ti/Tv %、cds:AIDh_WR-C-T G>A at MC2 cds %、およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19個または全てのメトリックを含む複数のメトリックを含む。皮膚がん(例えば、黒色腫)の進行または再発が評価されているさらなる例において、プロファイルは、cds:4Gen3_AG-C-T MC1 non-syn %;cds:3Gen1_-C-CG G>A at MC3 %;cds:4Gen3_AC-C-T Ti/Tv %;g:C>G + G>C %;cds:A3B_T-C-W MC3 non-syn %;cds:All A non-syn %;cds:3Gen3_AG-C- MC2 %;cds:A3B_T-C-W MC1 %;cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %;cds:3Gen1_-C-TC C>T at MC3 %;cds:4Gen3_GC-C-C C>T at MC2 %;cds:All C Ti/Tv %;cds:A3Bj_RT-C-G Ti %;cds:AIDh_WR-C-T G>A at MC2 cds %;cds:4Gen3_TT-C-C %;cds:3Gen1_-C-CC C>T at MC1 motif %;cds:ADAR_2Gen2_T-T- %;cds:3Gen2_T-C-C MC1 %;cds:All G %;cds:ADAR_W-A- A>G at MC3 %;cds:A3G_C-C- MC3 %;cds:Other MC3 C %;g:3Gen2_A-C-C C>A + G>T g %;cds:ADARc_SW-A-Y MC2 %;cds:3Gen1_-C-CA Ti C:G %;cds:3Gen1_-C-TC C>T cds %;cds:3Gen2_C-C-C MC3 %;cds:3Gen3_CT-C- C>T at MC1 motif %;g:ADAR_4Gen3_AG-A-G A>C + T>G %;cds:3Gen3_CT-C- G non-syn %;cds:3Gen2_A-C-C non-syn %;cds:2Gen2_A-C- MC3 %;cds:3Gen2_A-C-C MC2 %;g:3Gen1_-C-TC C>T + G>A g %;cds:3Gen2_T-C-T G>A at MC2 %;cds:2Gen1_-C-C C>T at MC1 %;cds:AIDb_WR-C-G G non-syn %;cds:A3Gb_-C-G MC1 %;cds:2Gen1_-C-C C>A %;cds:A3Ge_SC-C-GS %;g:ADARn_-A-WA A>G + T>C %;g:ADAR_W-A- A>G + T>C %;g:ADAR_2Gen2_G-T- A>T + T>A %;g:AIDh_WR-C-T C>A + G>T g %;cds:4Gen3_TG-C-T Ti C:G %;cds:3Gen2_G-C-T C:G %;cds:3Gen2_T-C-C MC3 %;nc:ADARb_W-A-Y %;cds:ADAR_3Gen2_G-A-C non-syn %;cds:ADAR_3Gen1_-A-AT Ti %;g:ADARk_CW-A- A>G + T>C g %;cds:3Gen1_-C-GC MC2 %;cds:4Gen3_TA-C-C non-syn %;g:3Gen3_CA-C- C>T + G>A g %;cds:3Gen1_-C-AG G Ti/Tv %;cds:AIDc_WR-C-GS %;cds:A3Gn_YYC-C-S C>T at MC3 cds %;cds:2Gen1_-C-C MC2 %;cds:3Gen3_GG-C- non-syn %;g:2Gen1_-C-T C>G + G>C g %;cds:A1_-C-A G>A at MC3 cds %;cds:A3G_C-C- C>T at MC1 %;nc:ADARc_SW-A-Y A>G + T>C nc %;cds:ADAR_W-A- T>C at MC2 %;cds:A3Go_TC-C-G MC1 non-syn %;cds:3Gen3_AT-C- C:G %;cds:ADARh_W-A-S T>C %;cds:A3G_C-C- G>T %;cds:ADARf_SW-A- MC2 %;cds:ADAR_W-A- non-syn %;cds:ADARp_-A-WT T>A motif %;cds:4Gen3_AG-C-T G>A at MC1 motif %;cds:ADAR_3Gen1_-A-CA %;cds:3Gen2_C-C-T MC3 %;cds:3Gen1_-C-CT C>T at MC2 cds %;cds:A3B_T-C-W Ti %;g:2Gen1_-C-T %;cds:AIDc_WR-C-GS MC3 %;cds:AIDe_WR-C-GW Hits;cds:AIDd_WR-C-Y C>A cds %;cds:ADARb_W-A-Y MC2 %;cds:A3Gc_C-C-GW C>T motif %;cds:2Gen1_-C-C G>T at MC1 %;cds:3Gen1_-C-CA Ti %;cds:Other G MC3 Ti/Tv %;cds:CDS Variants;cds:ADAR_3Gen1_-A-CC A>G cds %;cds:A3Gn_YYC-C-S C>T %;cds:A3Bf_ST-C-G Ti %;cds:2Gen2_G-C- Hits;cds:AIDd_WR-C-Y %;cds:A3F_T-C- G>C %;cds:4Gen3_CT-C-C C>T at MC1 %;cds:AIDd_WR-C-Y G>C %;cds:A3Gi_SG-C-G MC2 %;cds:Other MC3 %;nc:2Gen1_-C-T C>A + G>T nc %;cds:3Gen2_G-C-T %;g:3Gen2_T-C-G C>T + G>A g %;cds:ADARc_SW-A-Y T>C cds %;およびそれらに関連するメトリックから選択される少なくとももしくは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90個または全てのメトリックを含む複数のメトリックを含む。
【0193】
また、本発明の方法は、治療プロトコールまたは予防プロトコールに延長される。がんが、進行または再発する可能性が低いと判定された場合、処置プロトコールは、処置の強度を低減するように、または対象を処置レジメンから完全に除去するように修正され得る。がんが、進行または再発する可能性が高いと判定された場合、その可能性を低減するように設計されたプロトコールが設計され、対象に適用され得る。例えば、適切な治療プロトコールを、対象について設計し、施行してもよい。これは、例えば、放射線療法、手術、化学療法、ホルモン除去療法、プロアポトーシス療法および/または免疫療法を含み得る。一部の例において、さらなる診断試験を、治療前に診断を確認するために行ってもよい。
【0194】
放射線療法は、DNA損傷を誘導する放射線および波動、例えば、γ-照射、X線、UV照射、マイクロ波、電子放出、放射性同位体などを含む。治療は、上記に説明される形態の放射線により限局性腫瘍部位を照射することによって達成され得る。これらの因子の全ては、DNAの前駆体、DNAの複製および修復、ならびに染色体のアセンブリおよび維持について広範囲の損傷DNAをもたらす可能性が高い。
【0195】
X線についての放射線量範囲は、長期間(3~4週間)の50~200レントゲンの毎日の線量から、2000~6000レントゲンの単回線量までに及ぶ。放射性同位体についての放射線量範囲は、広く変動し、同位体の半減期、放射される放射線の強度および種類、ならびに腫瘍性細胞による取り込みに依存する。
【0196】
放射線療法の非限定的な例には、単回ショットまたは分割のコンフォーマル外部照射療法[4~8週間にわたるフラクションとして照射される50~100グレイ(Grey)]、高線量率近接照射療法、密封組織内近接照射療法、全身性放射性同位体(例えば、ストロンチウム89)が含まれる。一部の実施形態において、放射線療法は、放射線増感剤と組み合わせて施行され得る。放射線増感剤の例示的な例には、エファプロキシラル、エタニダゾール、フルオソル(fluosol)、ミソニダゾール、ニモラゾール、テモポルフィンおよびチラパザミンが含まれるが、これらに限定されない。
【0197】
化学療法剤は、以下のカテゴリー(i)~(viii)のうちの任意の1つまたは複数から選択してもよい。
【0198】
(i)腫瘍内科学において使用される抗増殖薬/抗腫瘍薬およびそれらの組合せ、例えば、アルキル化剤(例えば、シスプラチン、カルボプラチン、シクロホスファミド、ナイトロジェンマスタード、メルファラン、クロラムブシル、ブスルファンおよびニトロソウレア);代謝拮抗薬(例えば、葉酸代謝拮抗薬、例えば、5フルオロウラシルおよびテガフールのようなフルオロピリジン、ラルチトレキセド、メトトレキセート、シトシンアラビノシドならびにヒドロキシウレア;抗腫瘍抗生物質(例えば、アドリアマイシン、ブレオマイシン、ドキソルビシン、ダウノマイシン、エピルビシン、イダルビシン、マイトマイシン-C、ダクチノマイシンおよびミトラマイシンのようなアントラサイクリン);抗有糸分裂薬(例えば、ビンクリスチン、ビンブラスチン、ビンデシンおよびビノレルビンのようなビンカアルカロイド、ならびにパクリタキセルおよびドセタキセルのようなタキソイド;ならびにトポイソメラーゼ阻害剤(例えば、エトポシドおよびテニポシドのようなエピポドフィロトキシン、アムサクリン、トポテカンならびにカンプトテシン)。
【0199】
(ii)細胞分裂阻害剤、例えば、抗エストロゲン[例えば、タモキシフェン、トレミフェン、ラロキシフェン、ドロロキシフェンおよびイドキシフェン(iodoxyfene)]、エストロゲン受容体ダウンレギュレーター(例えば、フルベストラント)、抗アンドロゲン(例えば、ビカルタミド、フルタミド、ニルタミドおよび酢酸シプロテロン)、UHアンタゴニストまたはLHRHアゴニスト(例えば、ゴセレリン、リュープロレリンおよびブセレリン)、プロゲストーゲン(例えば、酢酸メゲストロール)、アロマターゼ阻害剤[例えば、アナストロゾール、レトロゾール、ボラゾール(vorazole)およびエキセメスタン]ならびに5α-レダクターゼの阻害剤、例えば、フィナステリド。
【0200】
(iii)がん細胞浸潤を阻害する薬剤(例えば、マリマスタットのようなメタロプロテイナーゼ阻害剤、およびウロキナーゼプラスミノーゲンアクチベーター受容体機能の阻害剤)。
【0201】
(iv)増殖因子機能の阻害剤、例えば、そのような阻害剤は、増殖因子抗体、増殖因子受容体抗体(例えば、抗erbb2抗体トラスツズマブ[ハーセプチン(商標)]および抗erbb1抗体セツキシマブ[C225])、ファルネシルトランスフェラーゼ阻害剤、MEK阻害剤、チロシンキナーゼ阻害剤およびセリン/トレオニンキナーゼ阻害剤、例えば、上皮増殖因子ファミリーの他の阻害剤[例えば、他のEGFRファミリーチロシンキナーゼ阻害剤、例えば、N-(3-クロロ-4-フルオロフェニル)-7-メトキシ-6-(3-モルホリノプロポキシ)キナゾリン-4-アミン(ゲフィチニブ、AZD1839)、N-(3-エチニルフェニル)-6,7-ビス(2-メトキシエトキシ)キナゾリン-4-アミン(エルロチニブ、OSI-774)および6-アクリルアミド-N-(3-クロロ-4-フルオロフェニル)-7-(3-モルホリノプロポキシ)キナゾリ-n-4-アミン(CI 1033)]、例えば、血小板由来増殖因子ファミリーの阻害剤ならびに例えば、肝細胞増殖因子ファミリーの阻害剤を含む。
【0202】
(v)抗血管新生薬、例えば、血管内皮増殖因子の効果を阻害する薬剤(例えば、抗血管内皮細胞増殖因子抗体ベバシズマブ[アバスチン(商標)]、国際特許出願WO97/22596、WO97/30035、WO97/32856およびWO98/13354に開示される化合物などの化合物)ならびに他の機構によって作用する化合物(例えば、リノミド、インテグリンαvβ3機能の阻害剤およびアンジオスタチン)。
【0203】
(vi)血管損傷剤、例えば、コンブレタスタチンA4、ならびに国際特許出願WO99/02166、WO00/40529、WO00/41669、WO01/92224、WO02/04434およびWO02/08213に開示される化合物。
【0204】
(vii)アンチセンス療法、例えば、上記に列挙される標的を対象とするアンチセンス療法、例えば、ISIS 2503、抗rasアンチセンス。
【0205】
(viii)遺伝子療法手法、例えば、異常遺伝子、例えば異常p53を置換する手法、またはシトシンデアミナーゼ、チミジンキナーゼもしくは細菌ニトロレダクターゼ酵素を使用する手法などの異常(aberrant)GDEPT(遺伝子指向性酵素プロドラッグ療法)手法、および化学療法または放射線療法への患者耐容性を増大させる手法、例えば、多剤耐性遺伝子療法。
【0206】
免疫療法手法は、例えば、患者腫瘍細胞の免疫原性を増大させるエクスビボ(ex-vivo)およびインビボ(in-vivo)手法、例えば、インターロイキン2、インターロイキン4または顆粒球-マクロファージコロニー刺激因子などのサイトカインのトランスフェクション、T細胞アネルギーを減少させる手法、サイトカインをトランスフェクトした樹状細胞などのトランスフェクトした免疫細胞を使用する手法、サイトカインをトランスフェクトした腫瘍細胞系を使用する手法、ならびに抗イディオタイプ抗体を使用する手法を含む。これらの手法は、一般的に、がん細胞を標的化および破壊する免疫エフェクター細胞および分子の使用に頼る。免疫エフェクターは、例えば、悪性細胞の表面上の一部のマーカーに特異的な抗体であり得る。抗体単独は、治療のエフェクターとして働き得るか、またはそれは、他の細胞を動員して、実際に細胞死滅を促進し得る。また、抗体は、薬物または毒素(化学療法薬、放射性核種、リシンA鎖、コレラ毒素、百日咳毒素など)にコンジュゲートされ、単に標的化剤として働き得る。あるいは、エフェクターは、悪性細胞標的と直接的または間接的に相互作用する表面分子を有するリンパ球であり得る。様々なエフェクター細胞は、細胞傷害性T細胞およびNK細胞を含む。
【0207】
他のがん治療の例には、光線療法、凍結療法、毒素療法またはプロアポトーシス療法が含まれる。当業者には、このリストが、がんおよび他の過形成病変に使用可能な処置治療法の種類の網羅ではないことが分かるであろう。
【0208】
メトリックがデアミナーゼの活性を示す一部の場合には、治療または予防測定は、そのデアミナーゼの阻害剤の、対象への投与を含み得る。阻害剤は、例えば、siRNA、miRNA、タンパク質アンタゴニスト(例えば、突然変異誘発物質のドミナントネガティブ突然変異体)、小分子阻害剤、抗体およびその断片を含み得る。例えば、APOBECシチジンデアミナーゼおよびAIDに特異的な市販されているsiRNAおよび抗体は、広く入手可能であり、当業者に公知である。APOBEC3G阻害剤の他の例は、Liら[ACS. Chem. Biol., (2012) 7(3): 506-517]によって説明される小分子を含み、そのうちの多くは、オルトキノンへの酸化後にスルフヒドリル反応性であることが公知のカテコール部分を含有する。また、APOBEC1阻害剤は、ドミナントネガティブ突然変異体APOBEC1ポリペプチド、例えば、mu1(H61K/C93S/C96S)突然変異体を含むが、これらに限定されない[Oka et al., (1997) J. Biol. Chem. 272: 1456-1460]。
【0209】
典型的に、治療剤は、薬学的に許容される担体と共に医薬組成物において、かつそれらの意図される目的を達成するのに有効な量において投与される。対象へ投与される活性化合物の用量は、経時的に対象において、がんの症状における低減もしくはがんの症状からの軽減、および/または腫瘍もしくはがん細胞の低減、退縮もしくは除去などの、有益な応答を達成するのに十分であるべきである。投与される薬学的に活性な化合物の量は、対象の年齢、性別、体重および全身の健康状態を含めて、処置される対象に依存し得る。この点において、投与のための活性化合物の正確な量は、実施者の判断に依存し、当業者は、過度の実験を伴わずに、治療剤の好適な投与量、および好適な処置レジメンを容易に決定し得る。
【0210】
本発明は、対象においてがんまたは腫瘍の進行または再発を予測する目的のための予測医学の分野において実施することができる。
【0211】
任意の先行の出版物(もしくはそれに由来する情報)についてのまたは公知の任意の事柄についての本明細書における参照は、その先行の出版物(もしくはそれに由来する情報)または公知の事柄が、本明細書が関連する努力分野における共通一般知識の部分を形成するという認定もしくは承認または任意の形態の示唆ではなく、そのように解釈すべきではない。
【0212】
本発明が容易に理解および実行され得るように、特定の好ましい実施形態を、ここで、以下の非限定的な例によって説明する。
【実施例】
【0213】
[実施例1]
【0214】
患者のデータの分析
A.患者のデータ
がんゲノムアトラス(TCGA)は、米国国立がん研究所(NCI)とアメリカ国立ヒトゲノム研究所(NHGRI)との間の共同プロジェクト(collaboration)である。TCGAの目的は、がんの病因を我々がさらに理解するために、大規模な患者コホートにおいて様々ながんタイプの包括的な特徴付けを行うことである。重要な科学的発見の拡大しつつあるコレクションは、この共同プロジェクトから得られており(例えば、https://cancergenome.nih.gov/publications)、この注目すべきリソースのさらなる分析が進行中である。TCGAの際立つ取り組みは、Multi-Center Mutation-Calling in Multiple Cancers(MC3)ネットワークによって行われる「PanCancer Atlas」プロジェクトである。PanCancer Atlasは、TCGAデータセットにおいて最も多く見られるがん形態のうちの33種からの10,437の腫瘍の再分析である。
【0215】
TCGA PanCancer Atlasのゲノムデータは、NIH Genomic Data Commonsによって保存および維持されており(https://gdc.cancer.gov/access-data/data-access-processes-and-tools)、がんゲノミクスのためにcBioPortalを介してアクセスおよび視覚化される(https://www.cbioportal.org/)(Cerami et al., 2012、Gao et al., 2013)。患者を募集し、生体標本を、Bailey et al. (2018)によって記載されているように処理した。PanCancer Atlasに含まれるがんのタイプとしては、例えば、副腎皮質癌(ADCC)、脳低悪性度グリオーマ(BLGG)、肺扁平上皮癌(LUSC)、中皮腫(MESO)、膵臓腺癌(PAAD)、肉腫(SARC)、および皮膚黒色腫(SKCM)が含まれる。ゲノムデータを、TCGA PanCancer Atlasの全ての患者について得た。
【0216】
無増悪生存期間(PFS)が記録された、TCGA PanCancer Atlasコホートの患者を分析した。PFSが分かっていない患者は分析から除外した。各がんタイプで、患者を「PFS_低」:事前に決定されたがんタイプ特異的なカットオフの前に進行した患者および「PFS_高」:カットオフの前に進行しなかった患者とカテゴライズした。各がんタイプで、群を次いで、少なくとも1つの計算モデルを使用して比較した。
【0217】
メトリックを以下で論じるように決定し、様々なメトリックを使用する計算モデルを、患者のIIFプロファイルの約75%を使用して訓練し、ハイパーパラメータを、プロファイルの約10%を使用してチューニングし、そして「ブラインド」予測をプロファイルの約15%で行った(分析の前に隔離された)。モデルの訓練またはチューニングから除外された患者で行われた予測についての全体的な精度、感度、および特異度を報告した。計算モデルに寄与するIIFメトリックを得、視覚化し、比較し、そして検証した。合致するメトリックを保持し、「ブラインド」患者予測を評価するために使用した。
【0218】
これらの実施例では、モデルは、弱い予測モデル(決定木)と、最適化に使用される確率的勾配降下法との組合せである。「XGBoost」アルゴリズムがこれらの実施例で使用された(Chen, T., & Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785-794). ACM)。
【0219】
XGBoostモデルを訓練するために使用されるパラメータを、「MLR」ソフトウェアパッケージを利用する標準的な方法を使用して最適化した(Bischl B, Lang M, Kotthoff L, Schiffner J, Richter J, Studerus E, Casalicchio G, Jones Z (2016). “mlr: Machine Learning in R.” Journal of Machine Learning Research, 17(170), 1-5. http://jmlr.org/papers/v17/15-066.html)。
【0220】
B.メトリックの決定
患者の全ゲノム配列を分析して、一塩基変異体(SNV)を同定した。簡潔に述べると、hg37ゲノム座標を参照として使用して、配列を.vcfファイルにフォーマットした。
【0221】
.vcfファイルにおける各変異体を分析および選択して、それが単純な一塩基置換であったかどうかおよび挿入でも欠失でもなかったかどうかについてさらに検討した。モチーフおよび/またはコドン文脈におけるSNVを評価する場合には、以下の工程を次いで行った:
a)突然変異したコドン(MC)の構造内のコドン文脈を決定し、すなわち、コードトリプレット内のSNVの位置を決定し、ここで、最初の位置(5’から3’に読む)をMC1(もしくはMC-1部位)と呼び、第2の位置をMC2(もしくはMC-2部位)と呼び、そして第3の位置をMC3(もしくはMC-3部位)と呼ぶ;
b)3つの完全なコドンからなる配列を得るために、9塩基のウィンドウを周辺のゲノム配列から抽出した。遺伝子の方向を使用して、5’および3’方向を決定し、また、9塩基からなる正確な鎖を決定した。9塩基のウィンドウは常に、ゲノムのリバース鎖上の遺伝子内の変異体の周辺のウィンドウ内の塩基がゲノムに対して逆相補となるが遺伝子に対してはフォワード方向となるように、遺伝子の方向に従って報告された。慣例により、この文脈は、遺伝子の同じ鎖において常に報告される。プラス鎖の遺伝子は、参照ゲノムのプラス鎖からのコドン文脈塩基を有し、マイナス鎖の遺伝子は、参照ゲノムのマイナス鎖からのコドン文脈を有する;かつ/または
c)表Bおよび表Cにおいて記載されているものなどのモチーフを使用してモチーフのサーチを行って、変形形態がこのようなモチーフ内にあるかどうかを決定した。
【0222】
C.メトリックの定義
1.領域
分析を可能にするために、全てのSNVをコード(cds)または非コード(nc)として分類し、ここで、cds SNVは、任意の公知のタンパク質アイソフォーム内のアミノ酸をコードする核酸におけるものであり、nc SNVは、タンパク質をコードしない、ゲノムのあらゆる他の領域に存在する。これは、5’もしくは3’UTR、イントロン領域、遺伝子間領域、非コードRNA領域、またはあらゆる他の非コード領域であり得る。「ゲノム領域(g)」は、全てのSNV、すなわち、コードSNVおよび非コードSNVを含む。
【0223】
2.モチーフメトリック
全てのモチーフを、フォワードモチーフおよび同等のリバース相補モチーフの対で分析した。リバース相補モチーフのサーチは、リバース相補DNA鎖上のフォワードモチーフのサーチに等しい。脱アミノ化はCまたはAヌクレオチドのいずれかのみで生じるため、慣例上、CおよびA変異体モチーフはフォワードモチーフとして、またGおよびT変異体モチーフはリバース相補モチーフとして定義される。
【0224】
2つの命名スキームを利用した。特異的デアミナーゼに関連するモチーフを適切に標識した。遍在的デアミナーゼとして知られている(すなわち、全てのまたはほとんどの組織タイプで発現することが分かっている)主なデアミナーゼは、AID、ADAR、APOBEC3G(A3Gと省略される)、およびAPOBEC3B(A3Bと省略される)である。
【0225】
4つの一次デアミナーゼモチーフは以下の通りである:
AID:WR-C-/-G-YW(AID_WR-C-と記載される)、
ADAR:W-A-/-T-W(ADAR_W-A-と記載される)、
APOBEC3G(A3G):C-C-/-G-G(A3G_C-C-と記載される)、および
APOBEC3B(A3B):T-C-W/W-G-A(A3B_T-C-Wと記載される)。
【0226】
二次デアミナーゼモチーフにあるSNVもまた評価した。これらの二次デアミナーゼモチーフとしては、AIDb:WR-C-G/C-G-YW、AIDc:WR-C-GS/SC-G-YW、AIDd:WR-C-Y/R-G-YW、AIDe:WR-C-GW/WC-G-YW、AIDh:WR-C-T/A-G-YW、ADARb:W-A-Y/R-T-W、ADAR:SW-A-Y/R-T-WS、ADARf:SW-A-/-T-WS、ADARh:W-A-S/S-T-W、ADARk:CW-A-/-T-WG、ADARn:-A-WA/TW-T-、ADARp:-A-WT/AW-T-、A3Gb:-C-G/C-G-、A3Gc:C-C-GW/WC-G-G、A3Ge:SC-C-GS/SC-G-GS、A3Gi:SG-C-G/C-G-CS、A3Gn:YYC-C-S/S-G-GRR、A3Go:TC-C-G/C-G-GA、A3Bf:ST-C-G/C-G-AS、A3BJ:RT-C-G/C-G-AY、A3F:T-C-/-G-A、およびA1:-C-A/T-G-が含まれる。
【0227】
デアミナーゼ酵素と特異的に関連することが分かっていないモチーフを「Gen」モチーフとして標識し、ADAR_Genを使用して、AまたはTが標的化ヌクレオチドまたは突然変異ヌクレオチドであるモチーフを同定する(こうして、変異体またはSNVが得られる):
2Gen1 - 最初の位置が変異体である2塩基のモチーフ、例えば、2Gen1_-C-T
3Gen1 - 最初の位置が変異体である3塩基のモチーフ。例えば、3Gen1_-C-TA
3Gen2 - 2番目の位置が変異体である3塩基のモチーフ、例えば、ADAR_3Gen2_G-A-T
3Gen3 - 3番目の位置が変異体である3塩基のモチーフ、例えば、3Gen3_GA-C-
4Gen3 - 3番目の位置が変異体である4塩基のモチーフ、例えば、ADAR_4Gen3_AT-A-T。
【0228】
モチーフに関連するメトリックを決定するために、標的ヌクレオチドの評価(すなわち、標的ヌクレオチドがAであるか、Tであるか、Cであるか、もしくはGであるか)、SNVのタイプの評価(例えば、標的ヌクレオチドが現在はAであるか、Tであるか、Gであるか、もしくはCであるか)、SNVが転位SNVであるかもしくはトランスバージョンSNVであるかの評価、SNVが同義であるかもしくは非同義であるかの評価、標的ヌクレオチドが存在するモチーフの評価、SNVのコドン文脈の評価、および/またはSNVが生成している鎖の評価もまた行った。
【0229】
3.非モチーフメトリック
モチーフと関連していないメトリックもまた評価した。これらとしては、cds内のSNVに基づくメトリック、およびゲノム全体でのSNVに基づくメトリック(すなわち、cds SNVおよびnc SNV)が含まれる。このようなメトリックは、典型的には、メトリック名に「全ての」または「他の」を含む。
【0230】
[実施例2]
【0231】
最も重要なメトリックを使用してのがん進行の予測
予備のモデリングを行って、各がん(ADCC、BLGG、LUSC、MESO、SARC、およびSKCM)について、無増悪生存期間(PFS)時間が比較的短い患者とPFSが比較的高い患者とを区別し得た様々なモデルに最も寄与した20のメトリックを同定した。これらとしては:
(1)MESOでは:cds:3Gen2_C-C-C MC3 %、g:A3Bj_RT-C-G C>T + G>A g %、cds:3Gen3_GG-C- non-syn %、cds:A3Gb_-C-G G>A at MC2 motif %、cds:A3B_T-C-W MC1 %、cds:3Gen1_-C-GC MC2 %、cds:A3Gb_-C-G G>A MC2 Hits、cds:A1_-C-A G>A at MC3 cds %、cds:3Gen3_AG-C- MC2 %、cds:ADAR_W-A- non-syn %、cds:A3Bj_RT-C-G Ti %、g:3Gen2_T-C-G C>T + G>A g %、cds:AIDe_WR-C-GW Hits、cds:3Gen2_A-C-G MC2 non-syn %、cds:A3Gi_SG-C-G non-syn %、g:ADAR_W-A- A>G + T>C %、cds:2Gen1_-C-C G>T at MC1 %、cds:A3Gi_SG-C-G MC2 %、cds:A3Bf_ST-C-G Ti %、cds:ADAR_3Gen2_G-A-C non-syn %;
(2)ADCCでは:g:A3F_T-C- Hits、cds:3Gen1_-C-TG G non-syn %、cds:3Gen2_C-C-T MC3 %、cds:All G total、g:3Gen1_-C-TC C>T + G>A g %、cds:3Gen3_CT-C- MC3 %、cds:All G %、nc:A3G_C-C- C>T + G>A nc %、cds:A3B_T-C-W G>A motif %、cds:AIDc_WR-C-GS %、cds:3Gen1_-C-GT G>A motif %、cds:A3B_T-C-W MC3 non-syn %、cds:3Gen3_TG-C- G>A %、cds:ADAR_2Gen2_G-T- MC2 %、cds:3Gen3_TG-C- G Ti/Tv %、cds:4Gen3_TT-C-C %、cds:2Gen1_-C-C C>A %、cds:A3G_C-C- C>T at MC1 %、cds:AIDb_WR-C-G G non-syn %、cds:A3G_C-C- MC3 %;
(3)BLGGでは:g:CG total、cds:AIDc_WR-C-GS MC3 %、cds:A3B_T-C-W G non-syn %、cds:AIDd_WR-C-Y %、g:AIDc_WR-C-GS Hits、cds:3Gen2_A-C-C non-syn %、g:3Gen3_GA-C- C>A + G>T g %、cds:2Gen2_G-C- Hits、cds:4Gen3_TA-C-C non-syn %、nc:2Gen2_A-C- C>T + G>A nc %、cds:Other MC3 C %、cds:3Gen2_T-C-G Ti/Tv %、g:3Gen2_A-C-C C>A + G>T g %、g:3Gen3_CA-C- C>T + G>A g %、cds:3Gen2_T-C-C MC1 %、g:ADAR_2Gen1_-T-T A>T + T>A %、g:ADAR_2Gen2_G-T- A>T + T>A %、g:2Gen1_-C-T %、cds:ADAR_3Gen1_-A-CA %、cds:ADAR_2Gen2_T-T- %;
(4)SARCでは:nc:ADARb_W-A-Y A>G + T>C nc %、g:ADARk_CW-A- A>G + T>C g %、cds:ADAR_3Gen3_CA-A- Ti %、cds:A3G_C-C- G>T %、cds:4Gen3_TT-C-T %、cds:ADARc_SW-A-Y T>C cds %、nc:ADARc_SW-A-Y A>G + T>C nc %、cds:A3F_T-C- G>C %、g:C>A + G>T %、cds:2Gen1_-C-T MC3 non-syn %、nc:ADARb_W-A-Y %、cds:AIDd_WR-C-Y C>A cds %、cds:Primary Deaminase %、cds:4Gen3_CA-C-C MC1 %、g:C>G + G>C %、g:2Gen1_-C-T C>G + G>C g %、g:AIDh_WR-C-T C>A + G>T g %、cds:A3Ge_SC-C-GS %、cds:ADAR_3Gen3_CT-A- A>G motif %、cds:ADARf_SW-A- MC2 %;
(5)LUSCでは:cds:ADARp_-A-WT A>G at MC2 cds %、cds:3Gen1_-C-TC C>T cds %、cds:AIDd_WR-C-Y G>C %、cds:ADAR_3Gen3_AC-A- A>G cds %、cds:3Gen1_-C-CT C>T at MC2 cds %、cds:A3Go_TC-C-G MC1 non-syn %、cds:3Gen2_G-C-T C>A motif %、nc:2Gen1_-C-T C>A + G>T nc %、cds:ADAR_2Gen2_A-T- A>C at MC1 motif %、cds:4Gen3_CA-C-C %、cds:A3Gn_YYC-C-S C>T at MC3 cds %、cds:3Gen1_-C-AG G Ti/Tv %、cds:ADARh_W-A-S T>C %、cds:3Gen1_-C-CC C>T at MC1 motif %、cds:2Gen1_-C-C C>T at MC1 %、g:ADAR_4Gen3_AG-A-G A>C + T>G %、cds:4Gen3_CT-C-C C>T at MC1 %、cds:ADAR_3Gen1_-A-CC A>G cds %、cds:A3Gn_YYC-C-S C>T %、cds:ADAR_W-A- T>C at MC2 %;および
(6)SKCMでは:cds:4Gen3_AG-C-T MC1 non-syn %、cds:All A non-syn %、cds:3Gen1_-C-CG G>A at MC3 %、cds:3Gen3_TT-C- C>A at MC1 motif %、cds:A3Gc_C-C-GW C>T motif %、cds:ADAR_W-A- A>G at MC3 %、cds:ADARp_-A-WT T>A motif %、cds:3Gen3_CT-C- G non-syn %、cds:3Gen2_T-C-T G>A at MC2 %、cds:ADAR_3Gen1_-A-AT Ti %、cds:All C Ti/Tv %、cds:3Gen1_-C-TC C>T at MC3 %、cds:4Gen3_AG-C-T G>A at MC1 motif %、cds:3Gen1_-C-CA Ti C:G %、cds:3Gen3_AT-C- G>A at MC2 %、cds:4Gen3_TG-C-T Ti C:G %、cds:ADAR_3Gen2_C-A-C T>G at MC3 cds %、cds:4Gen3_GC-C-C C>T at MC2 %、cds:4Gen3_AC-C-T Ti/Tv %、cds:AIDh_WR-C-T G>A at MC2 cds %
が含まれる。
【0232】
各がんについての一番のメトリックを組み合わせて、典型的なCPASメトリックパネルを作成した。142のメトリックからなるこのパネルは、上記の表Dで示されている。
【0233】
この分析のためにPanCancer Atlasから得た患者コホートには、副腎皮質癌(ADCC)、脳低悪性度グリオーマ(BLGG)、肺扁平上皮癌(LUSC)、中皮腫(MESO)、肉腫(SARC)、および皮膚黒色腫(SKCM)が含まれていた。無増悪生存期間(PFS)が記録された患者(全部でn=1295、PFSが記録されなかった患者は除外した)についてゲノムデータを得た。ゲノムデータを上記のように分析し、各患者について、表Dで示す142メトリックのパネルについての出力物を作成した。各がんタイプ(n=6)について、患者を「PFS_低」患者または「PFS_高」患者とカテゴライズした。「PFS_低」カテゴリーの患者は、所定の期間(例えば<24ヶ月間)の前に再発またはがんの進行を有していた。「PFS_高」カテゴリーの患者は、その期間(例えば>24ヶ月間)の前に再発も進行もなかった。各患者コホートについて、計算モデルを訓練して、142のメトリックからなるパネルの出力物を使用して、患者の転帰(「PFS_低」または「PFS_高」)を予測した。
【0234】
計算モデルを各コホートの患者の約75%で訓練し(「訓練データ」)、患者の約10%を使用してハイパーパラメータをチューニングし(「チューニングデータ」)、そして、分析前に隔離された、患者の残り約15%で予測を行った(「検証データ」)。XGBoostモデリングを本研究で使用したが、モデルおよび行った訓練の性質は任意の適切な形態のものであり得、決定木学習、ランダムフォレスト、ロジスティック回帰、アソシエーション・ルール・ラーニング、人工ニューラルネットワーク、ディープラーニング、帰納論理プログラミング、サポートベクターマシン、クラスタリング、ベイジアンネットワーク、強化学習、表現学習、類似度学習および距離学習、遺伝的アルゴリズム、ルールベース機械学習、学習分類システム、またはこれらに類するもののいずれか1つまたは複数を含み得る。
【0235】
「検証」患者(モデルの訓練またはチューニングに使用されなかった患者)で行った予測についての全体的な精度、感度、および特異度を、各患者コホート(ADCC、BLGG、LUSC、MESO、SARC、およびSKCM)について表す。無増悪生存期間(PFS)を有していた患者のゲノムデータを得た。PFSの分布を比較するためのログランク統計検定を含むカプラン・マイヤー曲線もまた、各コホートについて表す(有意性:p<0.05)。
【0236】
A.MESO患者のためのモデリング
TCGA PanCancer Atlas中皮腫コホート(MESO)は、12ヶ月未満で「進行している」と分類された32人の患者(PFS<12ヶ月であり、PFS状態=「進行している」)、および12ヶ月以上のPFSを有している38人の患者(PFS≧12ヶ月)を有している。勾配ブースティング決定木アンサンブルを作成し、「ブラインド」検証データセットにおいて患者の転帰を予測するために使用した。表1は、このモデルにおいて使用された21のメトリックを示している。
【0237】
予測の全体的な精度は100%であった(精度:100%、感度:1.00、特異度:1.00):検証患者の100%が「高PFS」として正確に分類され(3/3)、100%が「低PFS」として正確に分類された(8/8)。検証データはモデルの訓練にもチューニングにも使用しなかった。PFS分布の比較のためのログランク統計検定(有意性:p<0.05)を含むカプラン・マイヤー曲線を
図7に示す。
【0238】
B.ADCC患者のためのモデリング
TCGA PanCancer Atlas副腎皮質癌コホート(ADCC)は、24ヶ月未満で「進行している」と分類された39人の患者(PFS<24ヶ月であり、PFS状態=「進行している」)、および24ヶ月以上のPFSを有している46人の患者(PFS≧24ヶ月)を有している。勾配ブースティング決定木アンサンブルを作成し、「ブラインド」検証データセットにおいて患者の転帰を予測するために使用した。表1は、このモデルにおいて使用された38のメトリックを示している。
【0239】
予測の全体的な精度は100%であった(精度:100%、感度:1.00、特異度:1.00):検証患者の100%が「高PFS」として正確に分類され(7/7)、100%が「低PFS」として正確に分類された(6/6)。検証データはモデルの訓練にもチューニングにも使用しなかった。検証データはモデルの訓練にもチューニングにも使用しなかった。PFS分布の比較のためのログランク統計検定(有意性:p<0.05)を含むカプラン・マイヤー曲線を
図8に示す。
【0240】
C.BLGG患者のためのモデリング
TCGA PanCancer Atlas低悪性度グリオーマコホート(BLGG)は、24ヶ月未満で「進行している」と分類された122人の患者(PFS<24ヶ月であり、PFS状態=「進行している」)、および24ヶ月以上のPFSを有している168人の患者(PFS≧24ヶ月)を有している。勾配ブースティング決定木アンサンブルを作成し、「ブラインド」検証データセットにおいて患者の転帰を予測するために使用した。表1は、このモデルにおいて使用された88のメトリックを示している。
【0241】
予測の全体的な精度は84%であった(精度:84.09%、感度:0.8846、特異度:0.7778):検証患者の88%が「高PFS」として正確に分類され(23/26)、77%が「低PFS」として正確に分類された(14/18)。検証データはモデルの訓練にもチューニングにも使用しなかった。PFS分布の比較のためのログランク統計検定(有意性:p<0.05)を含むカプラン・マイヤー曲線を
図9に示す。
【0242】
D.SARC患者のためのモデリング
TCGA PanCancer Atlas肉腫コホート(SARC)は、18ヶ月未満で「進行している」と分類された87人の患者(PFS<18ヶ月であり、PFS状態=「進行している」)、および18ヶ月以上のPFSを有している98人の患者(PFS≧18ヶ月)を有している。勾配ブースティング決定木アンサンブルを作成し、「ブラインド」検証データセットにおいて患者の転帰を予測するために使用した。表1は、このモデルにおいて使用された34のメトリックを示している。
【0243】
予測の全体的な精度は81%であった(精度:80.65%、感度:0.9500、特異度:0.5455):検証患者の95%が「高PFS」として正確に分類され(19/20)、54.55%が「低PFS」として正確に分類された(6/11)。検証データはモデルの訓練にもチューニングにも使用しなかった。PFS分布の比較のためのログランク統計検定(有意性:p<0.05)を含むカプラン・マイヤー曲線を
図10に示す。
【0244】
E.LUSC患者のためのモデリング
TCGA PanCancer Atlas肺扁平上皮癌コホート(LUSC)は、36ヶ月未満で「進行している」と分類された109人の患者(PFS<36ヶ月であり、PFS状態=「進行している」)、および36ヶ月以上のPFSを有している125人の患者(PFS≧36ヶ月)を有している。勾配ブースティング決定木アンサンブルを作成し、「ブラインド」検証データセットにおいて患者の転帰を予測するために使用した。表1は、LUSCモデルにおいて使用された102のメトリックを示している。
【0245】
予測の全体的な精度は67%であった(精度:67.44%、感度:0.7586、特異度:0.500):検証患者の75.86%が「高PFS」として正確に分類され(22/29)、50%が「低PFS」として正確に分類された(7/14)。検証データはモデルの訓練にもチューニングにも使用しなかった。PFS分布の比較のためのログランク統計検定(有意性:p<0.05)を含むカプラン・マイヤー曲線を
図11に示す。
【0246】
F.SKCM患者のためのモデリング
TCGA PanCancer Atlas皮膚黒色腫(SKCM)は、30ヶ月未満で「進行している」と分類された178人の患者(PFS<30ヶ月であり、PFS状態=「進行している」)、および30ヶ月以上のPFSを有している180人の患者(PFS≧30ヶ月)を有している。勾配ブースティング決定木アンサンブルを作成し、「ブラインド」検証データセットにおいて患者の転帰を予測するために使用した。表1は、SKCMモデルにおいて使用された100のメトリックを示している。
【0247】
予測の全体的な精度は73%であった(精度:73.21%、感度:0.8485、特異度:0.5652):検証患者の84.85%が「高PFS」として正確に分類され(28/33)、56.52%が「低PFS」として正確に分類された(13/23)。検証データはモデルの訓練にもチューニングにも使用しなかった。PFS分布の比較のためのログランク統計検定(有意性:p<0.05)を含むカプラン・マイヤー曲線を
図12に示す。
【0248】
本明細書において引用される全ての特許、特許出願、および刊行物の開示は、ここで参照によってその全体が本明細書に組み込まれる。
【0249】
本明細書におけるあらゆる参考文献の引用は、このような参考文献が本願の「先行技術」として利用可能であるということを承認するものであるとは解釈されるべきではない。
【0250】
明細書の全体を通して、本発明をいずれか1つの実施形態にまたは特徴の具体的な集合体に限定することなく本発明の好ましい実施形態を説明するために、目的が記載されている。当業者には、したがって、本開示に照らして、例示されている特定の実施形態において、本発明の範囲から逸脱することなく様々な修正および変更を行うことができることが理解されよう。全てのこのような修正および変更は、添付の特許請求の範囲に含まれるものである。
【0251】
【国際調査報告】