IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユニバーシティ オブ サザン カリフォルニアの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-16
(54)【発明の名称】無細胞DNAメチル化試験
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240208BHJP
   C12Q 1/6844 20180101ALI20240208BHJP
   C12Q 1/6886 20180101ALI20240208BHJP
   C12Q 1/02 20060101ALI20240208BHJP
【FI】
C12Q1/6869 Z
C12Q1/6844 Z
C12Q1/6886 Z
C12Q1/02
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023548860
(86)(22)【出願日】2022-02-17
(85)【翻訳文提出日】2023-10-13
(86)【国際出願番号】 US2022016769
(87)【国際公開番号】W WO2022178108
(87)【国際公開日】2022-08-25
(31)【優先権主張番号】63/150,207
(32)【優先日】2021-02-17
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】504043048
【氏名又は名称】ユニバーシティ オブ サザン カリフォルニア
(74)【代理人】
【識別番号】110000659
【氏名又は名称】弁理士法人広江アソシエイツ特許事務所
(72)【発明者】
【氏名】サルヒア,ブドゥール
(72)【発明者】
【氏名】グッデン,ジェラルド クリストファー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA19
4B063QQ03
4B063QQ08
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS32
4B063QX02
(57)【要約】
本開示は、特定の標的ゲノム領域のメチル化レベルを調べることによって、卵巣がんの有無、卵巣がんの重症度、卵巣がんの組織学的サブタイプ、又は卵巣がんに対する感受性を決定する特定のアッセイ及び方法を提供する。
【選択図】図2
【特許請求の範囲】
【請求項1】
対象が、対象における上皮性卵巣がんを有するか、又は発症する可能性があるかを決定するための方法であって、
(a)前記対象からの無細胞核酸試料から、表1に列挙される複数の標的ゲノム領域の核酸メチル化レベルを測定することと、
(b)前記試料中の前記複数の標的ゲノム領域の前記核酸メチル化レベルを、無がん対象から単離された試料中の前記複数の標的ゲノム領域の前記核酸メチル化レベル、無がん参照標準、又は無がん参照カットオフ値と比較することと、
(c)前記対象に由来する前記試料中の前記複数の標的ゲノム領域における前記核酸メチル化レベルの変化に基づいて、前記対象が上皮性卵巣がんを有するか、又は発症することを好むことを決定することであって、前記変化が、無がん対象から単離された前記試料中の前記標的ゲノム領域の前記核酸メチル化レベル、正常参照標準、又は正常参照カットオフ値よりも多いか、又は少ない、決定することと、を含む、方法。
【請求項2】
前記方法が、任意の上皮組織学的サブタイプのステージ1、ステージII、ステージIII、又はステージIVの上皮性卵巣がんの存在を決定する、請求項1に記載の方法。
【請求項3】
前記上皮組織学的サブタイプが、類内膜性卵巣がん、粘液性卵巣がん、明細胞卵巣がん、及び漿液性卵巣がんからなる群から選択される、請求項2に記載の方法。
【請求項4】
前記メチル化レベルが、酵素処理、亜硫酸水素塩アンプリコン配列決定(BSAS)、DNAの亜硫酸水素塩処理、メチル化感受性PCR、亜硫酸水素塩制限分析と組み合わせた亜硫酸水素塩変換、ポスト全ゲノムライブラリハイブリッドプローブキャプチャ、及びTRollCamp配列決定のうちの1つ以上を使用して決定される、請求項1に記載の方法。
【請求項5】
前記標的ゲノムの前記メチル化レベルが、ハイブリッドプローブキャプチャを使用して決定される、請求項4に記載の方法。
【請求項6】
前記1つ以上の標的ゲノム領域にハイブリダイズする1つ以上のプローブを含み、前記1つ以上の標的ゲノム領域が、DNA分子中の非メチル化シトシンに対応する各位置にウラシルを含む、請求項5に記載の方法。
【請求項7】
前記1つ以上のプローブの各々が、
a)核酸分子のCpG部位のシトシンに対応する各位置にウラシルを含む、前記1つ以上の標的ゲノム領域のヌクレオチド配列、又は
b)前記核酸分子のCpG部位のシトシンに対応する各位置にシトシンを含む、前記1つ以上の標的ゲノム領域のヌクレオチド配列、にハイブリダイズするように構成される、請求項6に記載の方法。
【請求項8】
前記1つ以上のプローブの各々が、リボ核酸を含み、前記1つ以上のプローブの各々が、ビオチン及びストレプトアビジンからなる群から選択される親和性タグを含む、請求項6に記載の方法。
【請求項9】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも10%で含む、請求項1に記載の方法。
【請求項10】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも20%で含む、請求項1に記載の方法。
【請求項11】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも30%を含む、請求項1に記載の方法。
【請求項12】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも40%を含む、請求項1に記載の方法。
【請求項13】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも50%を含む、請求項1に記載の方法。
【請求項14】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも60%を含む、請求項1に記載の方法。
【請求項15】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも70%を含む、請求項1に記載の方法。
【請求項16】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも80%を含む、請求項1に記載の方法。
【請求項17】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも90%を含む、請求項1に記載の方法。
【請求項18】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の少なくとも95%を含む、請求項1に記載の方法。
【請求項19】
前記複数の標的ゲノム領域が、表1の前記標的ゲノム領域の95%超を含む、請求項1に記載の方法。
【請求項20】
前記複数の標的ゲノム領域が、前記ゲノム標的領域Chr2:38323997~38324203、Chr2:113712408~113712611、Chr3:20029245~20029704、Chr8:58146211~58146673、Chr8:124995553~124995624、Chr9:89438825~89439085、Chr11:63664463~63664769、Chr11:120496972~120497256、及びChr20:5452392~5452552を除外する、請求項9~18のいずれか一項に記載の方法。
【請求項21】
前記無細胞核酸試料が、全血、血漿、血清、又は尿からである、請求項1に記載の方法。
【請求項22】
前記対象における前記上皮性卵巣がんを治療することを更に含み、治療が、放射線療法、前記がんを除去する手術、及び前記患者に治療剤を投与することのうちの1つ以上を含む、請求項1に記載の方法。
【請求項23】
前記対象が、前記上皮性卵巣がんを有するか、又は発症する可能性があるかを決定するために訓練された機械学習アルゴリズムの使用を含む、請求項1に記載の方法。
【請求項24】
前記機械学習アルゴリズムが、ランダムフォレスト、サポートベクトルマシン(SVM)、ニューラルネットワーク、又は深層学習アルゴリズムを含む、請求項23に記載の方法。
【請求項25】
前記訓練された機械学習アルゴリズムが、既知の上皮性卵巣がん試料並びに既知の無がん卵巣及び/又は卵管試料を含む試料を使用して訓練され、各試料について表1の前記標的ゲノム領域が、差次的メチル化について検査される、請求項23に記載の方法。
【請求項26】
対象における高悪性度漿液性上皮性卵巣がんを検出するための方法であって、
(a)前記対象からの無細胞核酸試料から、表1に列挙される複数の標的ゲノム領域の核酸メチル化レベルを測定することと、
(b)前記試料中の前記複数の標的ゲノム領域の前記核酸メチル化レベルを、無がん対象から単離された試料中の前記複数の標的ゲノム領域の前記核酸メチル化レベル、無がん参照標準、又は無がん参照カットオフ値と比較することと、
(c)前記対象に由来する前記試料中の前記複数の標的ゲノム領域における前記核酸メチル化レベルの変化に基づいて、前記対象が高悪性度漿液性上皮性卵巣がんを有するかを決定することであって、前記変化が、無がん対象から単離された前記試料中の前記標的ゲノム領域の前記核酸メチル化レベル、正常参照標準、又は正常参照カットオフ値よりも多いか、又は少ない、決定することと、を含む、方法。
【請求項27】
対象における高悪性度漿液性卵巣がんを非高悪性度漿液性上皮性がんから区別するための方法であって、
(a)前記対象からの無細胞核酸試料から、表1に列挙される複数の標的ゲノム領域の核酸メチル化レベルを測定することと、
(b)前記試料中の前記複数の標的ゲノム領域の前記核酸メチル化レベルを、非高悪性度漿液性上皮性卵巣がん対象から単離された試料中の前記複数の標的ゲノム領域の核酸メチル化レベルと比較することと、
(c)前記対象に由来する前記試料中の前記複数の標的ゲノム領域における前記核酸メチル化レベルの変化に基づいて、前記対象が高悪性度漿液性上皮性卵巣がんを有することを決定することであって、前記変化が、非高悪性度漿液性上皮性卵巣がん対象から単離された前記試料中の前記標的ゲノム領域の前記核酸メチル化レベルよりも多いか又は少ない、決定することと、を含む、方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年2月17日に出願された米国仮特許出願第63/150,207号の優先権を米国特許法第119条(e)に基づき主張し、参照によりその全体が本明細書に組み込まれる。
【背景技術】
【0002】
上皮性卵巣がん(EOC)は、50%未満の5年生存率を有する最も致死的な婦人科悪性腫瘍である。EOCの組織学的サブタイプには、類内膜性、粘液性、明細胞、及び漿液性が含まれる。これらのうち、高悪性度漿液性卵巣がん(HGSOC)が、最も一般的なサブタイプである。臨床的に、それは他のサブタイプと比較して最も悪性度が高く、しばしば後期ステージに現れる。2020年に予想される22,240人の卵巣がんの新規症例のうち、これらの患者の75%が進行ステージを示し、治癒する可能性は低く、再発が一般的である。対照的に、15%の女性のみがステージ1のがんを示し、疾患は卵巣に限定され、5年生存率は90%を超える。
【0003】
試験は、腫瘍細胞縮小技術で以前の訓練を受けている婦人科腫瘍医による手術を受けた卵巣がんを有する患者は、一般婦人科医又は一般外科医によって治療された患者と比較して、より良い外科的ステージ分類を有し、進行ステージにおけるより高い完全な腫瘍細胞縮小率を達成し、より良い全体的な転帰を有する可能性がより高いことを示している。しかしながら、婦人科がんの疑いのある女性のための婦人科腫瘍医へのアクセス及び紹介は乏しい。したがって、適切な紹介パターンに対する主な障害は、骨盤内腫瘤を有するどのサブグループの女性がEOCを有する可能性が最も高いかを特定するという課題である。がん抗原125試験(CA125)は、現在、EOCのマーカーとして利用されている。しかしながら、それは非特異的であり、高い偽陽性率を有し、月経、妊娠、子宮筋腫、子宮内膜症、虫垂炎、及び他の悪性腫瘍を含む多くの異なる状態で上昇する。CA125の特異性を改善するために多くの試みがなされてきている。アプローチには、OVA1試験(Vermillion labs)におけるベータ2マイクログロブリンなどの他の血清タンパク質を追加すること、又は卵巣評価(悪性腫瘍指数のリスク(Risk of Malignancy Index))のための経膣超音波検査を追加することが含まれている。それにもかかわらず、これらの血清タンパク質及び画像検査ベースのアプローチは、大部分が不十分であり、それらは特に初期ステージで、EOCの診断に変化をもたらしていない。加えて、それらは、スクリーニングに使用される感度及び特異性を欠いている。
【0004】
したがって、EOCを良性の骨盤内腫瘤から区別する新規方法、及び以前の方法よりも感度が高く、高い特異性を有する無症候性女性におけるEOCのスクリーニングのための新規方法が必要とされている。本開示は、これらのニーズを満たす。
【発明の概要】
【発明が解決しようとする課題】
【0005】
骨盤内腫瘤を発症する女性は、卵巣がんの恐怖及び不確実性に直面する。毎年、何万人もの女性が骨盤内腫瘤を摘出する手術-卵巣がんを確認する唯一の方法、を受けている。骨盤内腫瘤の80%が良性であるため、多くの手術は不必要であるか、又は遅延され得る。加えて、EOCを有するほとんどの女性は、より良い全体的な転帰につながる適切な細胞縮小技術を適用することを含む、患者がEOCの適切な外科的管理を得るために必要とされる婦人科腫瘍医に紹介されない。現在の診断基準では、手術のために女性を適切に紹介するための主な課題は、卵巣がんを有する可能性が最も高く、手術から利益を受ける、骨盤内腫瘤を有するサブグループを特定することである。がん抗原125試験(CA125)は、現在、卵巣がんのマーカーとして利用されている。しかしながら、それは非特異的であり、高い偽陽性率(特にがんが治癒可能な初期ステージ)を有し、子宮筋腫及び子宮内膜症を含む多くの異なる状態で上昇する。
【0006】
術前に悪性骨盤内腫瘤から良性を区別する能力、及び無症候性女性におけるEOCを特に初期ステージで検出することは、重要な臨床的利益のものである。この問題を解決するために、腫瘍原性の指標として特定の遺伝子のDNAメチル化レベルを測定することによって、既知の骨盤内腫瘤を有する女性において卵巣がんを術前に決定的に診断するように、最小限侵襲的な腫瘍特異的無細胞(cf)DNAメチル化試験を設計した。DNAメチル化は、大きなゲノムの維持のための中心的に重要な修飾である。異常なDNAメチル化を利用することは、点変異などの他の分子変化又は血清ベースのタンパク質マーカーを超えるいくつかの利点がある。第一に、DNAメチル化変化は、腫瘍形成の早期に生じ、非常に化学的に安定なマークである。第二に、異常にメチル化されたDNAの検出感度の向上が、その頻度及び分布によってもたらされる。第三に、DNAメチル化測定は、各々が複数のCpG位置を有する多数の領域を組み込み、タンパク質ベースのマーカー又はDNA変異よりも良好な検出限界を可能にする。第四に、異常なCpG島高メチル化は、正常細胞ではめったに生じない。したがって、DNAメチル化シグナルは、正常細胞に由来するバックグラウンドメチル化の存在下でさえ、顕著な程度の感度で検出することができる。第五に、大規模なDNAメチル化変化は、組織-及びがん-タイプ特異的であり、したがって、潜在的に、早期ステージ病変を有する患者におけるがんを検出及び分類するより高い能力を有する。この液体生検アッセイの開発及び実施は、臨床的に満たされていない必要性の空隙を埋め、EOCスクリーニング及び診断を大幅に増強するであろう。したがって、本開示は、手術のために骨盤内腫瘤を有する女性を適切に選択するために必要とされるツールを医師に提供する。
【0007】
したがって、本開示は、上皮性卵巣がんを有するか又は発症する可能性、上皮性卵巣がんの有無を決定する、高悪性度漿液性上皮性卵巣がんの存在を決定する、上皮性卵巣がんの重症度を決定する、上皮性卵巣がんの組織学的サブタイプの決定する、高悪性度漿液性上皮性卵巣がんと非高悪性度漿液性上皮性卵巣がんとを区別するための実施形態を提供する。
【課題を解決するための手段】
【0008】
一実施形態において、対象が対象における上皮性卵巣がんを有するか又は発症する可能性があるかを決定するための方法は、対象からの無細胞核酸試料から、表1に列挙される複数の標的ゲノム領域の核酸メチル化レベルを測定することと、試料中の複数の標的ゲノム領域の核酸メチル化レベルを、無がん対象から単離された試料中の複数の標的ゲノム領域の核酸メチル化レベル、無がん参照標準、又は無がん参照カットオフ値と比較することと、対象に由来する試料中の複数の標的ゲノム領域における核酸メチル化レベルの変化に基づいて、対象が上皮性卵巣がんを有するか又は発症することを好むことを決定することであって、変化が、無がん対象から単離された試料中の標的ゲノム領域の核酸メチル化レベル、正常参照標準、又は正常参照カットオフ値より大きいか又は小さい、決定することと、を含む。
【0009】
いくつかの実施形態において、方法は、任意の上皮組織学的サブタイプのステージ1、ステージII、ステージIII、又はステージIVの上皮性卵巣がんの存在を決定する。いくつかの実施形態において、上皮組織学的サブタイプは、類内膜性卵巣がん、粘液性卵巣がん、明細胞卵巣がん、及び漿液性卵巣がんからなる群から選択される。
【0010】
いくつかの実施形態において、メチル化レベルは、酵素処理、亜硫酸水素塩アンプリコン配列決定(BSAS)、DNAの亜硫酸水素塩処理、メチル化感受性PCR、亜硫酸水素塩制限分析と組み合わせた亜硫酸水素塩変換、ポスト全ゲノムライブラリハイブリッドプローブキャプチャ、及びTRollCamp配列決定のうちの1つ以上を使用して決定される。
【0011】
いくつかの実施形態において、標的ゲノム領域のメチル化レベルは、ハイブリッドプローブキャプチャを使用して決定される。ハイブリッドプローブキャプチャは、1つ以上の標的ゲノム領域にハイブリダイズする1つ以上のプローブを含み得、1つ以上の標的ゲノム領域は、DNA分子中の非メチル化シトシンに対応する各位置にウラシルを含む。プローブは、a)核酸分子のCpG部位のシトシンに対応する各位置にウラシルを含む1つ以上の標的ゲノム領域のヌクレオチド配列、又はb)核酸分子のCpG部位のシトシンに対応する各位置にシトシンを含む1つ以上の標的ゲノム領域のヌクレオチド配列、にハイブリダイズするように構成することができる。
【0012】
いくつかの実施形態において、ハイブリッドキャプチャプローブは、リボ核酸を含み、各プローブはまた、ビオチン又はストレプトアビジンなどの親和性タグを含み得る。
【0013】
いくつかの実施形態において、複数の標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は95%超を含む。
【0014】
いくつかの実施形態において、複数の標的ゲノム領域は、ゲノム標的領域Chr2:38323997~38324203、Chr2:113712408~113712611、Chr3:20029245~20029704、Chr8:58146211~58146673、Chr8:124995553~124995624、Chr9:89438825~89439085、Chr11:63664463~63664769、Chr11:120496972~120497256、及びChr20:5452392~5452552を除外する。
【0015】
いくつかの実施形態において、本明細書に開示される方法は、対象の上皮性卵巣がんを治療することを更に含み、治療は、放射線療法、がんを除去する手術、及び治療薬を患者に投与することのうちの1つ以上を含む。
【0016】
いくつかの実施形態において、訓練された機械学習アルゴリズムを使用して、対象が上皮性卵巣がんを有するか又は発症する可能性、上皮性卵巣がんの有無を決定する、高悪性度漿液性上皮性卵巣がんの存在を決定する、上皮性卵巣がんの重症度を決定する、上皮性卵巣がんの組織学的サブタイプの決定する、高悪性度漿液性上皮性卵巣がんと非高悪性度漿液性上皮性卵巣がんとを区別する。
【0017】
いくつかの実施形態において、機械学習アルゴリズムは、ランダムフォレスト、サポートベクトルマシン(SVM)、ニューラルネットワーク、又は深層学習アルゴリズムを含む。
【0018】
いくつかの実施形態において、訓練された機械学習アルゴリズムは、既知の上皮性卵巣がん試料並びに既知の無がん卵巣及び/又は卵管試料を含む試料を使用して訓練され、表1に列挙されている標的ゲノム領域を調べてアルゴリズムを訓練する。
【0019】
本開示のこれら及び他の特徴及び利点は、添付の特許請求の範囲と併せて本開示の以下の詳細な説明からより完全に理解されるであろう。特許請求の範囲は、本明細書に示された特徴及び利点の具体的な考察によってではなく、その記載によって定義されることに留意されたい。
【図面の簡単な説明】
【0020】
以下の図面は、本明細書の一部を形成し、本発明の特定の実施形態又は様々な態様を更に実証するために含まれる。場合によっては、本発明の実施形態は、添付の図面を本明細書に提示される詳細な説明と組み合わせて参照することによって最もよく理解することができる。説明及び添付の図面は、本発明の特定の具体的な実施例、又は特定の態様を強調し得る。しかしながら、当業者は、実施例又は態様の一部は、本発明の他の実施例又は態様と組み合わせて使用され得ることを理解するであろう。
【0021】
図1】多変量データを二次元平面に簡素化する、多次元尺度構成法(MDS)の形態である一様多様体の近似及び投影(UMAP)を使用した次元削減。UMAPは、検討中のクラスが選択した特性群に関して、いかに分離できるかを視覚的に示す。これは2Dプロットであり、各クラスを独自の形状で点のクラスタとして表す。各点は、還元型亜硫酸水素塩配列決定(RRBS)からの1つの試料のメチル化プロファイルを表す。UMAPは、DMR分析によって特定された1677の領域にわたって各RRBS試料から抽出された平均(中間)ベータ値から生成された。
図2】選択されたDMRのcfDNAメチル化レベルから構築された分類子モデルは、卵巣がんの状態を予測する。(A)血漿cfDNAのDNAメチル化値を35個のアンプリコンでアッセイした。試料を、機械学習分類のための訓練(70%)及び試験(30%)データセットにランダムに分割した。C5.0決定木アルゴリズムを使用して、訓練データセットから予測モデルを構築した。次いで、モデルを使用して、試験セットにおける卵巣がんを有する確率を予測した。ドットプロットは、ステージに基づいた訓練及び試験の両方のセットから集計された予測を示す。最終モデルは、選択された領域の20/35を利用した。試料の2/4は、正しく分類されなかった偽陽性(赤丸)であり、他のがんの病歴を有したか、又は時期的に遅れて発症していた。(B)2つの偽陽性試料を取り除き、分類子モデルを再構築した。ドットプロットは、更新したモデルからの新たな予測を示す。34cm粘液性嚢胞腺腫を有する2_8_GTFR_632-54yo(2013)は、興味深いことに、当時(2013年の試料取得時)VIN3を有し、2017年までにステージIA SCC外陰を、最近NEDを発症した。1a_65_139369A3_Dx-Benign-53yo漿液性嚢胞腺腫(サイズは含まれない)は、元の情報シートを見ると、彼女は「子宮の悪性腫瘍」の病歴があり、medリストに化学療法薬が報告されている。
図3】分類子モデルのパフォーマンスメトリックは、高い予測精度を示す。分類子モデルの受信者動作特性(ROC)曲線及び性能メトリックは、血漿cfDNAで実行される。ROC曲線及びメトリックは、(A)全ての試料を含む初期モデル、又は(B)2つの偽陽性試料を除去した更新モデルのいずれかの予測から導き出された。ROC曲線から計算した曲線下面積(AOC)が高く、本発明者らのモデルが卵巣がん状態の強力な予測因子であることを示した。略語:PPV-陽性予測値、NPV-陰性予測値。
図4】亜硫酸水素塩アンプリコン配列決定(A)及びハイブリッドプローブキャプチャ(B)の再現性。A)2つの異なる試料(上部及び下部パネル)における2つの生物学的反復にわたる各領域の平均メチル化(ベータ)レベルの相関を示す亜硫酸水素塩アンプリコン配列決定データの散布図。反復は高い相関を示し、ピアソン相関は0.99に等しい。B)複数回キャプチャした試料を比較する散布図。ハイブリッドプローブキャプチャは、異なるキャプチャ(x及びy)間でベータ値の高い一貫性を示す。R2値が高いことは、表された8つの異なる試料における異なるキャプチャ間の高い再現性を示す(各パネルは一意の試料である)。
【発明を実施するための形態】
【0022】
定義
本明細書及び特許請求の範囲の明確かつ一貫した理解を提供するために、以下の定義が含まれる。本明細書で使用される場合、列挙される用語は以下の意味を有する。本明細書で使用される他の全ての用語及び語句は、当業者が理解するように、それらの通常の意味を有する。かかる通常の意味は、Hawley’s Condensed Chemical Dictionary 14th Edition,by R.J.Lewis,John Wiley&Sons,New York,N.Y.,2001などの専門辞書を参照することによって得ることができる。
【0023】
本明細書における「一実施形態」、「実施形態」などへの言及は、記載される実施形態が特定の態様、特性、構造、部分、又は特徴を含み得るが、全ての実施形態がその態様、特性、構造、部分、又は特徴を必ずしも含むわけではないことを示す。更に、かかる語句は、本明細書の他の部分で言及されている同じ実施形態を指し得るが、必ずしもそうではない。更に、特定の態様、特性、構造、部分、又は特徴が実施形態に関連して説明されるとき、明示的に説明されるか又はされないかにかかわらず、かかる態様、特性、構造、部分、又は特徴が他の実施形態に影響を与えるか、又は関連することは、当業者の知識の範囲内である。
【0024】
単数形「a」、「an」、及び「the」は、文脈が別途明確に指示しない限り、複数形の言及を含む。したがって、例えば、「化合物」への言及は、複数のかかる化合物を含み、そのため化合物Xは複数の化合物Xを含む。更に、特許請求の範囲は、いずれの任意選択的な要素も除外するように起草され得ることに留意されたい。したがって、この記述は、本明細書に記載の任意の要素と関連した、「単に」、「のみ」などの排他的な用語の使用、及び/又は特許請求の範囲の列挙若しくは「否定的」な限定の使用のために、先行詞ベースとして機能することが意図される。
【0025】
「及び/又は」という用語は、項目のうちのいずれか1つ、項目の任意の組み合わせ、又はこの用語が関連付けられる全ての項目を意味する。「1つ以上」及び「少なくとも1つ」という語句は、特にその使用の文脈で読まれる場合、当業者によって容易に理解される。例えば、語句は、列挙された下限よりもおよそ10、100、又は1000倍高い1、2、3、4、5、6、10、100、又は任意の上限を意味することができる。例えば、フェニル環上の1つ以上の置換基は、環上の1~5個の置換基を指す。
【0026】
当業者によって理解されるであろうように、成分の量、分子量などの特性、反応条件などを表すものを含む全ての数は、近似値であり、全ての例で「約」という用語によって任意選択的に修飾されるものとして理解される。これらの値は、本明細書の説明の教示を利用して、当業者によって得られることが求められる所望の特性に応じて変化し得る。また、かかる値は、それらのそれぞれの試験測定に認められる標準偏差から必然的に生じる変動を固有に含むことが理解される。値が、先行詞「約」の使用によって近似値として表される場合、修飾語「約」を伴わない特定の値もまた更なる態様を形成することを理解されたい。
【0027】
「約」及び「およそ」という用語は、互換的に使用される。両方の用語は、明示された値の±5%、±10%、±20%、又は±25%の変動を指すことができる。例えば、「約50」パーセントは、いくつかの実施形態において、45~55パーセントの変動、又は特定の特許請求の範囲によって別に定義されるように有することができる。整数範囲について、「約」という用語は、範囲の各末端に列挙された整数よりも大きい及び/又は小さい1つ又は2つの整数を含むことができる。本明細書に別段の指示がない限り、「約」及び「およそ」という用語は、個々の成分、組成物、又は実施形態の機能性に関して同等である、列挙された範囲に近接する値、例えば、重量パーセンテージを含むことが意図される。「約」及び「およそ」という用語はまた、このパラグラフで上で考察されるように、列挙された範囲の末端を修飾することができる。
【0028】
当業者によって理解されるであろうように、いずれか及び全ての目的のために、特に書面による説明を提供することに関して、本明細書に列挙される全ての範囲はまた、いずれか及び全ての可能な下位範囲並びにそれらの下位範囲の組み合わせ、並びに範囲、特に整数範囲を構成する個々の値を包含する。したがって、2つの特定の単位間の各単位も開示されることを理解されたい。したがって、10~15が開示される場合、11、12、13、及び14も個別に、及び範囲の一部として開示される。列挙される範囲(例えば、重量パーセンテージ又は炭素基)は、範囲内の各特定の値、整数、小数、又は同一性を含む。任意の列挙された範囲は、同じ範囲が少なくとも等しい、半分、3分の1、4分の1、5分の1、又は10分の1に分解されることを十分に説明し、それを可能にするものとして容易に認識することができる。非限定的な例として、本明細書で考察される各範囲は、下位3分の1、中位3分の1、及び上位3分の1などに容易に分解することができる。当業者によっても理解されるであろうように、「最大」、「少なくとも」、「より大きい」、「未満」、「超」、「以上」などの全ての言語は、列挙された数を含み、かかる用語は、上記で考察されるように、続いて下位範囲に分解することができる範囲を指す。同様な方式で、本明細書に列挙される全ての比率もまた、より広い比率内に収まる全ての下位比率を含む。したがって、ラジカル、置換基、及び範囲について列挙された特定の値は、説明のためだけのものであり、それらは他の定義された値又はラジカル及び置換基について定義された範囲内の他の値を除外しない。更に、範囲の各終点は、他の終点と関連して、及び他の終点とは独立して、両方とも重要であることが理解されよう。
【0029】
本開示は、体積、質量、パーセンテージ、比率などの変数に対する範囲、限度、及び偏差を提供する。「数1」から「数2」までなどの範囲は、整数及び分数を含む連続した数の範囲を意味することが理解されよう。例えば、1~10は、1、2、3、4、5、…9、10を意味する。それはまた、1.0、1.1、1.2.1.3、…、9.8、9.9、10.0、及び1.01、1.02、1.03なども意味する。開示された変数が「数10」未満の数である場合、それは、上で考察されたように、数10未満の整数及び分数を含む連続範囲を意味する。同様に、開示された変数が「数10」を超える数である場合、それは、数10を超える大きい整数及び分数を含む連続範囲を意味する。これらの範囲は、「約」という用語によって修飾することができ、その意味は上記に記載されている。
【0030】
当業者はまた、メンバーが、マーカッシュ群などの共通の方式で一緒に群分けされる場合、本発明が、全体として列挙された群全体だけでなく、群の各メンバーを個別に、及び主群の全ての可能性のある下位群を包含することを容易に認識するであろう。加えて、全ての目的のために、本発明は、主群だけでなく、群メンバーのうちの1つ以上が存在しない主群も包含する。したがって、本発明は、列挙された群のメンバーのうちのいずれか1つ以上の明示的な除外を想定する。したがって、但し書きが開示されるカテゴリ又は実施形態のいずれかに適用され得、それによって、列挙された要素、種、又は実施形態のうちのいずれか1つ以上が、かかるカテゴリ又は実施形態から、例えば、明示的な否定的制限での使用のために除外され得る。
【0031】
「接触すること」という用語は、例えば、溶液中、反応混合物中、インビトロ、又はインビボで、例えば、生理学的反応、化学反応、又は物理的変化をもたらすために、細胞又は分子レベルなどで、触れる、接触させる、又は直接若しくは近くに近接させる行為を指す。
【0032】
「有効量」は、疾患、障害、及び/若しくは状態を治療するために、又は列挙された効果をもたらすために有効な量を指す。例えば、有効量は、治療されている状態又は症状の進行若しくは重症度を低減するのに有効な量であることができる。治療有効量の決定は、十分に当業者の能力の範囲内にある。「有効量」という用語は、例えば、宿主における疾患若しくは障害を治療若しくは予防するため、又は疾患若しくは障害の症状を治療するために有効である、本明細書に記載される化合物の量、又は本明細書に記載される化合物の組み合わせの量を含むことが意図される。したがって、「有効量」は一般に、所望の効果を提供する量を意味する。
【0033】
代替的に、本明細書で使用される「有効量」又は「治療有効量」という用語は、治療されている疾患又は状態の症状のうちの1つ以上をある程度緩和する、投与されている薬剤又は組成物若しくは組成物の組み合わせの十分な量を指す。結果は、疾患の徴候、症状、若しくは原因の低減及び/又は緩和、あるいは生物システムの任意の他の所望の変化であり得る。例えば、治療的使用のための「有効量」は、疾患症状における臨床的に著しい低減を提供するのに必要とされる、本明細書に開示される化合物を含む組成物の量である。任意の個々の症例における適切な「有効」量は、用量漸増試験などの技術を使用して決定され得る。用量は、1回以上の投与で投与され得る。しかしながら、有効用量と考えられるものの正確な決定は、患者の年齢、サイズ、疾患のタイプ又は範囲、疾患のステージ、組成物の投与経路、使用される補助療法のタイプ又は範囲、進行中の疾患プロセス、及び所望の治療のタイプ(例えば、侵襲的対従来型治療)を含むが、これらに限定されない、各患者に個別の要因に基づき得る。
【0034】
「治療すること」、「治療する」、及び「治療」という用語は、(i)疾患、病理学的若しくは医学的状態を発生することから防止すること(例えば、予防)、(ii)疾患、病理学的若しくは医学的状態を阻害すること、又はその発症を阻止すること、(iii)疾患、病理学的若しくは医学的状態を緩和すること、及び/あるいは(iv)疾患、病理学的若しくは医学的状態に関連する症状を軽減することを含む。したがって、「治療する」、「治療」、及び「治療すること」という用語は、予防に拡張することができ、治療される状態又は症状の進行又は重症度を防止する、防止、防止すること、低下すること、停止すること、又は逆転することを含むことができる。そのため、「治療」という用語は、必要に応じて、医学的、治療的、及び/又は予防的投与を含むことができる。
【0035】
本明細書で使用される場合、「対象」又は「患者」は、疾患若しくは他の悪性腫瘍の症状を有するか、又はそのリスクにある個体を意味する。患者は、ヒト又は非ヒトであり得、例えば、本明細書に記載されるマウスモデルなどの研究目的のために「モデル系」として使用される動物系統又は種を含み得る。同様に、患者は、成人又は若年者(例えば、小児)のいずれかを含み得る。その上、患者は、本明細書に企図される組成物の投与から利益を受け得る任意の生存生物、好ましくは哺乳動物(例えば、ヒト又は非ヒト)を意味し得る。哺乳動物の例としては、哺乳動物網の任意のメンバー:ヒト、チンパンジー並びに他の類人猿及びサル種などの非ヒト霊長類、ウシ、ウマ、ヒツジ、ヤギ、ブタなどの家畜、ウサギ、イヌ、及びネコなどの愛玩動物、ラット、マウス、及びモルモットなどのげっ歯類を含む実験動物などが挙げられるが、これらに限定されない。非哺乳動物の例としては、鳥類、魚類などが挙げられるが、これらに限定されない。本明細書に提供される方法の一実施形態において、哺乳動物は、ヒトである。
【0036】
本明細書で使用される場合、「提供すること」、「投与すること」、「導入すること」という用語は、本明細書で互換的に使用され、所望の部位への化合物の少なくとも部分的な局在をもたらす方法又は経路による本開示の化合物の対象への配置を指す。化合物は、対象における所望の位置への送達をもたらす任意の適切な経路によって投与することができる。
【0037】
「阻害する」、「阻害すること」、及び「阻害」という用語は、疾患、感染症、状態、又は細胞群の成長又は進行を遅延すること、停止すること、又は逆転することを指す。阻害は、例えば、治療又は接触の非存在下で生じる成長又は進行と比較して、約20%、40%、60%、80%、90%、95%、又は99%超であることができる。
【0038】
「遺伝子」という用語は、転写及び翻訳された後に特定のポリペプチド又はタンパク質をコードし得るRNA(例えば、miRNA、siRNA、mRNA、tRNA、及びrRNA)に転写され得る少なくとも1つのオープンリーディングフレーム(ORF)を含むポリヌクレオチドを指す。本明細書に記載されるポリヌクレオチド又はポリペプチド配列のいずれかを使用して、それらが関連する遺伝子のより大きな断片又は全長コード配列を特定し得る。より大きな断片配列を単離する方法は、当業者に既知である。
【0039】
「無症候性」という用語は、上皮性卵巣がん若しくは悪性腫瘍を有するが、上皮性卵巣がん若しくは悪性腫瘍の存在に気付いていない対象、又は上皮性卵巣がんを有していないが将来的に上皮性卵巣がんを発症するであろう対象を指す。
【0040】
「アンプリコン」という用語は、標的核酸配列の増幅から生じる核酸産物を指す。増幅は、しばしばPCRによって行われる。アンプリコンのサイズは、長距離PCRの場合、20塩基対~15000塩基対の範囲であることができ、より一般的には、メチル化分析に使用される亜硫酸水素塩処理DNAのための100~1000塩基対である。
【0041】
「増幅」という用語は、核酸分子のコピー数における増加を指す。得られる増幅産物は、「アンプリコン」と呼ばれる。核酸分子(DNA又はRNA分子など)の増幅は、試料中の核酸分子のコピーの数を増加させる技術の使用を指す。増幅の例は、ポリメラーゼ連鎖反応(PCR)であり、試料中の核酸鋳型とのプライマーのハイブリダイゼーションを可能にする条件下で、試料をオリゴヌクレオチドプライマー対と接触させる。増幅産物は、電気泳動、制限エンドヌクレアーゼ切断パターン、オリゴヌクレオチドハイブリダイゼーション若しくはライゲーション、及び/又は核酸配列決定などの技術によって特徴付けることができる。いくつかの実施形態において、本明細書で提供される方法は、等温又は熱可変条件下で増幅された核酸を産生するステップを含むことができる。
【0042】
「生体試料」という用語は、個体から得られた試料を指す。本明細書で使用される場合、生体試料は、がん診断及び予後に有用なゲノムDNA(無細胞ゲノムDNAなど)を含有する全ての臨床試料を含み、血液、血液の誘導体及び画分(血清又は血漿など)、頬上皮、唾液、尿、便、気管支吸引液、痰、生検(腫瘍生検など)、及びCVS試料などの細胞、組織、及び体液を含むが、これらに限定されない。個体から得られたか、又はそれに由来する「生体試料」は、個体から得られた後に任意の好適な手段で処理されている(例えば、亜硫酸水素塩処理のためにゲノムDNAを単離するように処理された)任意のかかる試料を含む。
【0043】
「亜硫酸水素塩処理」という用語は、亜硫酸水素ナトリウム(NaHSO)などの亜硫酸水素塩又はその塩によるDNAの処理を指す。亜硫酸水素塩は、シトシンの5,6-二重結合と容易に反応するが、メチル化シトシンとは不十分である。シトシンは、亜硫酸水素イオンと反応して、脱アミノ化を受け易いスルホン化シトシン反応中間体を形成し、スルホン化ウラシルを生じさせる。スルホン酸基は、アルカリ性条件下で除去することができ、ウラシルの形成をもたらす。ウラシルは、ポリメラーゼによってチミンとして認識され、増幅は、シトシン-グアニン塩基対の代わりにアデニン-チミン塩基対をもたらす。
【0044】
「がん」という用語は、悪性腫瘍又は他の新生物が、分化の喪失、増殖率の増加、周囲組織の浸潤を伴う特徴的な不形成を受けており、転移することができる生物学的状態を指す。新生物は、新たな異常な増殖、特に、増殖が制御されず、進行性である組織又は細胞の新たな増殖である。腫瘍は、新生物の例である。がんのタイプの非限定的な例としては、肺がん、胃がん、結腸がん、乳がん、子宮がん、膀胱、頭頸部、腎臓、肝臓、卵巣、膵臓、前立腺、及び直腸のがんが挙げられる。いくつかの実施形態において、がんは、卵巣がんのタイプであり、より具体的には、上皮性卵巣がんである。例示的な上皮性卵巣がんとしては、高悪性度漿液性卵巣がん(HGSOC)、高悪性度漿液性がん、低悪性度漿液性がん、原発性腹膜がん、卵管がん、明細胞がん、類内膜性がん、扁平上皮性がん、及び粘液性がんが挙げられるが、これらに限定されない。
【0045】
「DNA(デオキシリボ核酸)」という用語は、ほとんどの生存生物の遺伝子材料を含む長鎖ポリマーを指す。DNAポリマーにおける反復単位は、4つの異なるヌクレオチドであり、各々が、リン酸基が結合しているデオキシリボース糖に結合した4つの塩基である、アデニン、グアニン、シトシン、及びチミンのうちの1つを含む。ヌクレオチドのトリプレット(コドンと称される)は、ポリペプチド内の各アミノ酸、又は終止シグナルをコードする。コドンという用語はまた、DNA配列が転写されるmRNA中の3つのヌクレオチドの対応する(及び相補的な)配列についても使用される。
【0046】
「無細胞核酸」又は「無細胞ポリヌクレオチド」という用語は、互換的に使用され、細胞に結合していない任意の細胞外核酸を指す。無細胞核酸は、血液中を循環する核酸であることができる。代替的に、無細胞核酸は、本明細書に開示される他の体液、例えば、尿中の核酸であることができる。無細胞核酸は、デオキシリボ核酸(「DNA」)、例えば、ゲノムDNA、ミトコンドリアDNA、又はそれらの断片であることができる。無細胞核酸は、リボ核酸(「RNA」)、例えば、mRNA、短干渉RNA(siRNA)、マイクロRNA(miRNA)、循環RNA(cRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、核小体小分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長非コードRNA(長ncRNA)、又はそれらの断片であることができる。いくつかの場合では、無細胞核酸は、DNA/RNAハイブリッドである。無細胞核酸は、二本鎖、一本鎖、又はそれらのハイブリッドであることができる。無細胞核酸は、分泌又は細胞死プロセス、例えば、細胞壊死及びアポトーシスを通じて体液中に放出され得る。
【0047】
無細胞核酸は、1つ以上のエピジェネティック修飾を含むことができる。例えば、無細胞核酸は、アセチル化、メチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、及び/又はシトルリン化され得る。例えば、無細胞核酸は、メチル化された無細胞DNAであることができる。
【0048】
「ポリヌクレオチド」という用語は、任意の長さのヌクレオチドのポリマー形態を指し、デオキシリボヌクレオチド若しくはリボヌクレオチド、又はそれらの類似体のいずれかである。ポリヌクレオチドは、任意の三次元構造を有することができ、既知又は未知の任意の機能を行い得る。以下は、ポリヌクレオチドの非限定的な例である:遺伝子又は遺伝子断片(例えば、プローブ、プライマー、又はEST)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、RNAi、siRNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、及びプライマー。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含むことができる。存在する場合、ヌクレオチド構造への修飾は、ポリヌクレオチドの組み立ての前又は後に付与することができる。ヌクレオチドの配列は、非ヌクレオチド成分によって中断することができる。ポリヌクレオチドは、標識成分とのコンジュゲーションなどによる重合後に、更に修飾することができる。本用語はまた、二本鎖分子及び一本鎖分子の両方を指す。別段の指定又は要求がない限り、ポリヌクレオチドである本発明の任意の実施形態は、二本鎖形態、及び二本鎖形態を作り上げることが知られているか又は予想される2つの相補的な一本鎖形態の各々の両方を包含する。ポリヌクレオチドは、ポリヌクレオチドがRNAである場合、4つのヌクレオチド塩基:アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、及びチミンではウラシル(U)の特定の配列からなる。したがって、「ポリヌクレオチド配列」という用語は、ポリヌクレオチド分子のアルファベットの表現である。このアルファベットの表現は、中央処理装置を有するコンピュータにおけるデータベースに入力することができ、機能ゲノミクス及びホモロジー検索などのバイオインフォマティクスアプリケーションのために使用することができる。
【0049】
「メチル化レベル」という用語は、ゲノム配列内の1つ以上のCpG部位のシトシンヌクレオチドのDNAメチル化の状態(メチル化されているか、又はメチル化されていない)を指す。
【0050】
「CpG島」という用語は、CpG部位の高い頻度及び/又は濃縮を有するDNAの領域を指す。アルゴリズムは、CpG島を特定するために使用することができる(Han,L.et al.(2008)Genome Biology,9(5):R79)。一般に、濃縮は、約40%、約50%、約60%、約70%、約80%、又は約90~100%を超える所与のDNA配列についての観察されたCpG対予想されるCpGの比率として定義される。「CpG部位」という用語は、シトシンに続いて5’から3’方向にグアニンを含むジヌクレオチドDNA配列を指す。ゲノムDNA中のCpG部位のシトシンヌクレオチドは、細胞内メチルトランスフェラーゼの標的であり、メチル化されたか又はメチル化されていないメチル化状態を有することができる。「メチル化CpG部位」又は同様の言語への言及は、5-メチルシトシンヌクレオチドを有するゲノムDNA中のCpG部位を指す。
【0051】
「相同性」又は「同一性」又は「類似性」は、同義であり、2つのペプチド間又は2つの核酸分子間の配列類似性を指す。相同性は、比較目的のために整列され得る各配列内の位置を比較することによって決定することができる。比較した配列内の位置が同じ塩基又はアミノ酸によって占有されている場合、分子はその位置で相同である。配列間の相同性の程度は、配列によって共有される一致するか又は相同的な位置の数の関数である。「非関連の」又は「非相同的」配列は、本発明の配列のうちの1つと、40%未満の同一性、又は代替的に25%未満の同一性を共有する。
【0052】
ポリヌクレオチド又はポリヌクレオチド領域(又はポリペプチド若しくはポリペプチド領域)は、別の配列に対して特定のパーセンテージ(例えば、60%、65%、70%、75%、80%、85%、90%、95%、98%、又は99%)の「配列同一性」を有し、整列させたとき、そのパーセンテージの塩基(又はアミノ酸)が、2つの配列を比較する際に同じであることを意味する。このアラインメント及び相同性パーセント又は配列同一性は、当該技術分野で既知のソフトウェアプログラム、例えば、Ausubel et al.eds.(2007)Current Protocols in Molecular Biologyに記載されるものを使用して決定することができる。好ましくは、デフォルトパラメータがアラインメントのために使用される。1つのアラインメントプログラムは、BLASTであり、デフォルトパラメータを使用する。特に、プログラムはBLASTN及びBLASTPであり、以下のデフォルトパラメータを使用する:遺伝子コード=標準、フィルタ=なし、鎖=両方、カットオフ=60、期待=10、マトリックス=BLOSUM62、記述=50配列、ソート=HIGH SCORE、データベース=非冗長、GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+SwissProtein+SPupdate+PIR。これらのプログラムの詳細は、インターネットアドレス:www.ncbi.nlm.nih.goviblast/Blast.cgiで見出すことができる。生物学的に等価なポリヌクレオチドは、指定された相同性パーセントを有し、同じか又は類似の生物学的活性を有するポリペプチドをコードするものである。
【0053】
本明細書で使用される「相補体」という用語は、標準的なワトソン/クリック塩基対形成規則に従って、核酸に対して相補的な配列を意味する。相補体配列はまた、DNA配列又はその相補体配列に対して相補的なRNAの配列であることができ、またcDNAであることができる。本明細書で使用される「実質的に相補的な」という用語は、2つの配列がストリンジェントなハイブリダイゼーション条件下でハイブリダイズすることを意味する。当業者は、実質的に相補的な配列が、それらの全長に沿ってハイブリダイズする必要はないことを理解するであろう。特に、実質的に相補的な配列は、ストリンジェントなハイブリダイゼーション条件下で標的又はマーカー配列にハイブリダイズする塩基の連続した配列に3’又は5’に位置する、標的又はマーカー配列にハイブリダイズしない塩基の連続した配列を含む。
【0054】
「ハイブリダイゼーション」は、1つ以上のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合を介して安定化した複合体を形成する反応を指す。水素結合は、ワトソン-クリック塩基対形成、Hoogstein結合によって、又は任意の他の配列特異的手段で生じ得る。複合体は、二本鎖構造を形成する2本の鎖、複数鎖複合体を形成する3本以上の鎖、単一の自己ハイブリダイズ鎖、又はこれらの任意の組み合わせを含み得る。ハイブリダイゼーション反応は、PC反応の開始、又はリボザイムによるポリヌクレオチドの酵素的切断などのより広範なプロセスにおけるステップを構成し得る。
【0055】
ストリンジェントなハイブリダイゼーション条件の例としては、約25℃~約37℃のインキュベーション温度、約6×SSC~約10×SSCのハイブリダイゼーション緩衝液濃度、約0%~約25%のホルムアミド濃度、及び約4×SSC~約8×SSCの洗浄液が挙げられる。中度のハイブリダイゼーション条件の例としては、約40℃~約50℃のインキュベーション温度、約9×SSC~約2×SSCの緩衝液濃度、約30%~約50%のホルムアミド濃度、及び約5×SSC~約2×SSCの洗浄液が挙げられる。高度にストリンジェントな条件の例としては、約55℃~約68℃のインキュベーション温度、約1×SSC~約0.1×SSCの緩衝液濃度、約55%~約75%のホルムアミド濃度、及び約1×SSC、0.1×SSC、又は脱イオン水の洗浄液が挙げられる。一般に、ハイブリダイゼーションのインキュベーション時間は、5分から24時間であり、1、2、又はそれ以上の洗浄ステップを伴い、洗浄インキュベーション時間は、約1、2、又は15分である。SSCは、0.15MのNaCl及び15mMのクエン酸緩衝液である。他の緩衝液系を使用するSSCの等価物を用いることができることが理解されよう。
【0056】
「ゲノム領域」という用語は、対象のゲノム内の特定の遺伝子座を指す。いくつかの実施形態において、ゲノム領域のサイズは、長さが1塩基対~10塩基対の範囲であることができる。特定の実施形態において、ゲノム領域のサイズは、10塩基対~10,000塩基対である。
【0057】
本明細書で使用される場合、「参照ゲノム」という用語は、対象からの特定された配列を参照するために使用され得る任意の生物又はウイルスの、任意の特定の既知の、部分的若しくは完全に、配列決定されたか、又は特徴付けられたゲノムを指す。ヒト対象並びに多くの他の生物に使用される例示的な参照ゲノムは、National Center for Biotechnology Information(「NCBI」)又はUniversity of California,Santa Cruz(UCSC)によって主催されるオンラインゲノムブラウザに提供されている。「ゲノム」は、核酸配列で発現される生物又はウイルスの完全な遺伝情報を指す。本明細書で使用される場合、参照配列又は参照ゲノムは、しばしば、1つ以上の個体から組み立てられたか、又は部分的に組み立てられたゲノム配列である。いくつかの実施形態において、参照ゲノムは、1つ以上のヒト個体から組み立てられたか、又は部分的に組み立てられたゲノム配列である。参照ゲノムは、種の遺伝子セットの代表的な例とみなすことができる。いくつかの実施形態において、参照ゲノムは、染色体に割り当てられた配列を含む。1つの例示的なヒト参照ゲノムは、GRCh38(UCSC相当語句:hg38)である。
【0058】
本明細書で使用される場合、「正常参照標準」という用語は、がんに関連していない試料中の特定のゲノム領域又は遺伝子におけるDNAメチル化の対照レベル、程度、又は範囲を意図する。「正常参照カットオフ値」という用語は、特定のゲノム領域又は遺伝子におけるDNAメチル化の対照閾値レベル、又は差次的メチル化値(DMV)を指す。いくつかの実施形態において、正常参照カットオフ値を上回って濃縮されたDNAメチル化レベルは、がんを有するか、又はがんを発症することに関連付けられる。いくつかの実施形態において、正常参照カットオフ値以下のDNAメチル化レベルは、がんを有しないか、又はがんを発症しないことに関連付けられる。
【0059】
本明細書で使用される「検出すること」とは、試料中の目的の核酸におけるメチル化の存在及び/又は程度を決定することを指す。検出は、100%の感度及び/又は100%の特異性を提供する方法を必要としない。
【0060】
本明細書で使用される場合、「実質的に」という用語は、広範な用語であり、その通常の意味で使用され、限定されず、大部分であるが、必ずしも特定されるものが全てではないことを含む。例えば、用語は、全数値の100%ではない可能性のある数値を指すことができる。全数値は、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約15%、又は約20%少なくあり得る。
【0061】
「含む(comprising)」という用語が本明細書で使用される場合はいつでも、「からなる(consisting of)」又は「から本質的になる(consisting essentially of)」という用語が代わりに使用される、選択肢が企図される。本明細書で使用される場合、「含むこと(comprising)」は、「含むこと(including)」、「含有すること(containing)」、又は「を特徴とする(characterized by)」と同義であり、包括的又は非限定的であり、追加の、列挙されない要素又は方法ステップを除外しない。本明細書で使用される場合、「からなる」とは、態様要素で特定されていないあらゆる要素、ステップ、又は成分を除外する。本明細書で使用される場合、「から本質的になる」という用語は、態様の基本的及び新規特徴に実質的に影響を及ぼさない材料又はステップを除外しない。本明細書の各例において、「含む(comprising)」、「から本質的になる」、及び「からなる」という用語のいずれも、他の2つの用語のいずれかで置き換えられ得る。本明細書に例示的に記載された開示は、本明細書に具体的に開示されていない任意の1つ以上の要素、又は1つ以上の限定がなくても好適に行われ得る。
【0062】
本発明の実施形態
本開示は、標的ゲノム領域のメチル化レベルにおける変化を検出するためのパネルアッセイ及び様々な方法を提供し、対象での試料のメチル化レベルの変化が、がん性及び非がん性対照試料の差次的にメチル化された標的ゲノム領域を使用して訓練されている訓練された機械学習アルゴリズムを使用して分析される。試料の標的ゲノム配列のメチル化レベルにおける差は、例えば、上皮性卵巣がんの有無、上皮性卵巣がんの重症度、上皮性卵巣がんの組織学的サブタイプ、上皮性卵巣がんに対する感受性を示し、高悪性度漿液性上皮性卵巣がんと非高悪性度漿液性上皮性卵巣がんとを区別し、良性腫瘍と上皮性卵巣がんとを区別し、かつ無症候性対象又はがんのタイプに遺伝的に素因を有する対象における上皮性卵巣がんの存在を示すことができる。一般に、本開示の実施形態は、例えば、減少表現亜硫酸水素塩配列決定(RBSS)又はハイブリッドプローブキャプチャを使用して、対象の無細胞核酸試料からの核酸の亜硫酸水素塩変換のステップと、変換して濃縮した核酸を次世代配列決定するステップと、標的ゲノム領域(例えば、表1に列挙される標的ゲノム領域)からの差次的メチル化パターンデータを収集するステップと、訓練された機械学習アルゴリズムを使用して、例えば、上皮性卵巣がんの有無、上皮性卵巣がんの重症度、上皮性卵巣がんの組織学的サブタイプ、又は上皮性卵巣がんに対する感受性を決定するステップと、を含む。
【0063】
いくつかの実施形態において、メチル化レベルについて検査され得るDNA又は他の核酸を含む生体試料は、例えば、腫瘍若しくは腫瘤を有するか、又は腫瘍若しくは腫瘤を有することが疑われる患者から収集される。好ましくは、生体試料は、標準生検又は液体生検を通して収集され、液体生検中の核酸は、腫瘍/腫瘤由来の無細胞核酸(例えば、無細胞DNA)である。無細胞核酸は、全血、血漿、血清、又は尿から収集され得る。
【0064】
無細胞核酸の単離及び抽出は、様々な技術を使用した体液の収集を通して行われ得る。いくつかの場合では、収集は、注射器を使用した対象からの体液の吸引を含み得る。他の場合では、収集は、ピペッティング又は収集容器への流体の直接収集を含み得る。
【0065】
体液の収集後、無細胞核酸は、当業者に既知の様々な技術を使用して単離され、抽出され得る。いくつかの場合では、無細胞核酸は、Qiagen Qiamp(登録商標)Circulating Nucleic Acid Kitプロトコルなどの市販のキットを使用して単離、抽出、及び調製され得る。他の場合では、Qiagen Qubit(商標)dsDNA HSアッセイキットプロトコル、Agilent(商標)DNA1000キット、又はTruSeq(商標)配列ライブラリ調製、低スループット(LT)プロトコル。
【0066】
代替的に、無細胞核酸は、溶液中に見出されるような、例えば、無細胞DNAが、細胞及び体液の他の不溶性成分から分離される分割ステップを介して、体液から抽出及び単離され得る。分割には、遠心分離又は濾過などの技術が含まれ得るが、これらに限定されない。他の場合では、細胞は、最初に無細胞DNAから分割され得ず、むしろ溶解され得る。例えば、インタクト細胞のゲノムDNAは、選択的沈殿によって分割され得る。
【0067】
いくつかの実施形態において、1つ以上の標的核酸のメチル化レベルを決定するために使用される方法は、メチル化配列決定を含む。
【0068】
例えば、表1に列挙される標的ゲノム領域内のCpG部位のメチル化レベルは、DNAメチル化配列決定を使用して検出され得る。DNAメチル化配列決定は、例えば、試料からのDNAを亜硫酸水素塩で処理して、非メチル化シトシンをウラシルに変換し、続いて、処理したゲノムDNA内の標的核酸の増幅(PCR増幅など)、及び得られるアンプリコンの配列決定を含むことができる。配列決定は、アンプリコン内の全てのCpGのメチル化レベルを定量するために使用され得る、ゲノム参照配列に整列され得るヌクレオチドリードを生じる。非CpG状況におけるシトシンを使用して、各個別試料について亜硫酸水素塩変換効率を追跡し得る。手順は、時間及び費用の両方の効果があり、複数の試料が96ウェルプレートを使用して並列に配列決定され得、独立した実験でアッセイしたときにメチル化の再現可能な測定を生じる。
【0069】
核酸分子は、核酸分子中の非メチル化シトシンをウラシルに変換するのに十分な条件に供され得る(例えば、試料から抽出した後)。例えば、核酸分子は亜硫酸水素塩処理に供され得る。核酸分子の亜硫酸水素塩処理は、非メチル化シトシン塩基を脱アミノ化し、それらをウラシル塩基に変換する。この亜硫酸水素塩変換プロセスは、メチル化又はヒドロキシメチル化シトシンを脱アミノ化しない(例えば、5mC又は5hmCなどの5位で)。核酸分子は、亜硫酸水素塩変換を受ける前に酸化されて、ヒドロキシメチル化シトシン(例えば、5hmC)をホルミルシトシン及びカルボキシルシトシン(例えば、5-ホルミルシトシン及び5-カルボキシルシトシン)に変換し得る。これらの酸化生成物は、亜硫酸水素塩変換に高感度であり得る。核酸分子はまた、他の誘導体化プロセスを含む更なる処理(例えば、1つ以上の配列、タグ、又は標識を組み込む、修飾する、かつ/又は削除する)に供され得る。いくつかの場合では、機能的配列(例えば、配列決定アダプタ、フローセルアダプタ、配列決定プライマーなど)を核酸分子に添加して、核酸配列決定を容易にし得る。したがって、試料からの核酸分子の誘導体は、亜硫酸水素塩修飾核酸分子、逆転写核酸分子、タグ付き核酸分子、バーコード化核酸分子、及び他の修飾核酸分子を含む処理された核酸分子を含み得る。
【0070】
いくつかの実施形態において、標的遺伝子又は遺伝子の標的領域のメチル化レベルは、ハイブリッドプローブキャプチャ、標的化亜硫酸水素塩アンプリコン配列決定、亜硫酸水素塩DNA処理、全ゲノム亜硫酸水素塩配列決定、亜硫酸水素塩制限分析と組み合わせた亜硫酸水素塩変換(COBRA)、亜硫酸水素塩PCR、亜硫酸水素塩修飾、亜硫酸水素塩パイロ配列決定、メチル化CpG島増幅、CpG島のCpG結合カラムベースの単離、差次的メチル化ハイブリダイゼーションを有するCpG島アレイ、高速液体クロマトグラフィー、DNAメチルトランスフェラーゼアッセイ、メチル化感受性PCR、クローニング差次的メチル化配列、制限後のメチル化検出、制限ランドマークゲノムスキャニング、メチル化感受性制限フィンガープリント、又はサザンブロット分析のうちの1つ以上を使用して決定され得る。
【0071】
いくつかの実施形態において、1つ以上の標的核酸のメチル化レベルを決定するために使用される方法は、標的化ローリングサークルアンプリコン(TRollCAmp)配列決定である。TrollCAmp配列決定は、標準的な標的化亜硫酸水素塩アンプリコン配列決定を増強及び改善する技術である。それは、全ゲノム亜硫酸水素塩配列決定(WGBS)又は減少表現亜硫酸水素塩配列決定(RRBS)などの標的化又はゲノムワイド亜硫酸水素塩アプローチ技術を増強するために使用することができる。簡潔には、それは、亜硫酸水素塩変換、環状ライゲーション、全ゲノム増幅/DnaseI消化、多重PCR、ライブラリ調製、及び配列決定を包含する。
【0072】
TRollCAmp配列決定は、亜硫酸水素塩変換に3ng以下の入力DNAを必要とする。TrollCAmpは、1000を超える別個の多重PCR反応を実行するのに十分な増幅産物を生成することができ、他の方法よりもはるかに優れている、5,000~20,000個の個々のアンプリコンに関するデータを生成する。更に、TRollCAmp-seqは、広いダイナミックレンジを示し、他の方法で観察されるものをより忠実に再現するメチル化値を生成する。結果的に、TRollCAmp-seqは、他の方法によって示される比率圧縮のために失われるであろう小さな、統計的に有意な変化を拾い上げることができる。多くの場合、バイオマーカー及び疾患特異的シグネチャは、多くの小さな変化の存在に依存し、そのため、いくつかの場合では、TRollCAmpは、アッセイ開発及び臨床的置き換えにとって好ましい選択肢である。
【0073】
CpG部位のメチル化状態をアッセイする他の方法も使用することができる。多くのDNAメチル化検出方法が従来技術で知られており、ハイブリッドプローブキャプチャ(REF)、メチル化特異的酵素消化(Singer-Sam et al.,Nucleic Acids Res.18(3):687,1990、Taylor et al.,Leukemia15(4):583-9,2001)、メチル化特異的PCR(MSP又はMSPCR)(Herman et al.,Proc Natl Acad Sci USA93(18):9821-6,1996)、メチル化-感受性単一ヌクレオチドプライマー伸長(MS-SnuPE)(Gonzalgo et al.,Nucleic Acids Res.25(12):2529-31,1997)、制限ランドマークゲノムスキャニング(RLGS)(Kawai,Mol Cell Biol.14(11):7421-7,1994、Akama,et al.,Cancer Res.57(15):3294-9,1997)、全ゲノム亜硫酸水素塩配列決定(Frommer et al.,Proc Natl Acad Sci USA89(5):1827-31,1992)、及び差次的メチル化ハイブリダイゼーション(DMH)(Huang et al.,Hum Mol Genet.8(3):459-70,1999)が含まれるが、これらに限定されない。いくつかの実施形態において、メチル化レベルは、DNAの亜硫酸水素塩処理の有無にかかわらず、1つ以上のDNAメチル化配列決定アッセイを使用して決定され得る。
【0074】
一実施形態において、減少表現亜硫酸水素塩配列決定を使用して、標的領域のメチル化レベルを測定する。一般に、RRBSは、全ての非メチル化シトシンをウラシルに変換するための亜硫酸水素塩による核酸の処理から開始し、制限酵素消化(例えば、MspIなどのCG配列を含む部位を認識する酵素による)及びアダプタリガンドとのカップリング後の完全な断片配列決定が続く。制限酵素の選択は、CpG中の高密度領域の断片を濃縮し、分析中に遺伝子の複数の位置をマッピングすることができる冗長配列の数を減少させる。したがって、RRBSは、配列決定のために制限断片のサブセットを選択することによって(例えば、分取ゲル電気泳動を使用したサイズ選択による)、核酸試料の試料複雑性を低減する。亜硫酸水素塩による完全なゲノムの配列決定とは対照的に、制限酵素消化によって生成された各断片は、少なくとも1つのCpGジヌクレオチドについてDNAメチル化に関する情報を含む。したがって、RRBSは、プロモーター、CpG島、及びこれらの領域内の制限酵素切断部位の高頻度を有する他のゲノム特性において試料を濃縮し、したがって、1つ以上のゲノム遺伝子座のメチル化状態を評価するアッセイを提供する。
【0075】
RRBSのための典型的なプロトコルは、Msplなどの制限酵素で核酸の試料を消化するステップと、プロジェクション及びAテイルで満たすステップと、アダプタをライゲーションするステップと、亜硫酸水素塩での変換のステップと、PCRのステップと、を含む。例えば、Gu et al.(2010),Nat Methods7:133-6、Meissner et al(2005),Nucleic Acids Res.33:5868-77を参照されたい。
【0076】
別の実施形態において、標的増幅及び対立遺伝子特異的リアルタイムシリアル(QuARTS)のための定量的アッセイを使用して、メチル化状態を評価する。各QuARTSアッセイにおいて、一次反応における標的プローブの増幅(反応1)及び切断(反応2)、並びに二次反応におけるFRET切断及び蛍光シグナルの生成(反応3)を含む、3つの反応が順次生成される。標的核酸が特異的プライマーを用いて増幅されるとき、フィン(fin)配列を有する特異的検出プローブがアンプリコンに緩く結合する。標的と結合する部位における特異的侵襲性オリゴヌクレオチドの存在は、検出プローブとフィン配列との間を切断することによって、フィン配列を放出する切断を引き起こす。フィン配列は、対応するFRETカセットの非フォーク部分と相補的である。したがって、フィン配列は、FRETカセットの侵襲性オリゴヌクレオチドとして機能し、FRETカセットのフルオロフォアと不活性化因子との間で切断を行い、蛍光シグナルを生成する。分割反応は、標的ごとに複数のプローブを切断することができ、したがって、フィンごとに複数のフルオロフォアを放出し、指数関数的シグナル増幅を提供する。QuARTSは、異なる色素を有するFRETカセットを使用して、単一の反応ウェル内で複数の標的を検出することができる。例えば、Zou et al.(2010)Clin Chem56:A199、米国特許出願第12/946,737号、同第12/946,745号、及び同第12/946,752号を参照されたい。
【0077】
いくつかの実施形態において、対象における卵巣がんの存在及び/又は重症度を特定することは、核酸分子(例えば、DNA又はRNA分子)又はその配列を選択的に濃縮するように構成されたハイブリッドキャプチャプローブを使用することを含み得る。かかるプローブは、プルダウンプローブ(例えば、ベイトセット)であり得る。選択的に濃縮された核酸分子又はその配列は、データセットのメチル化プロファイルにおける1つ以上のゲノム領域に対応し得る。選択的に濃縮された核酸分子又はその配列における特定の配列、修飾(例えば、メチル化状態)、欠失、付加、一塩基多型、コピー数変異、又は他の特性の存在は、卵巣がんの存在及び/又は重症度を示し得る。プローブは、無細胞生体試料中の表1の特定の標的ゲノム領域のサブセットに対して、及び/又は差次的なメチル化された領域(例えば、CpG部位、CpA部位、CpT部位、及び/又はCpC部位)に対して選択的であり得る。プローブは、無細胞生体試料中の1つ以上のゲノム領域のサブセット及び/又は差次的メチル化領域(例えば、CpG部位、CpA、部位、CpT部位、及び/又はCpC部位)などの標的ゲノム配列の複数の標的核酸に対応する核酸分子(例えば、DNA又はRNA分子)又はその配列を選択的に濃縮するように構成され得る。プローブは、標的核酸配列と配列相補性を有する核酸分子(例えば、DNA又はRNA分子)であり得る。これらの核酸分子は、プライマー又は濃縮配列であり得る。標的核酸配列に対して選択されるプローブを使用した試料(例えば、無細胞生体試料)の核酸分子のアッセイは、アレイハイブリダイゼーション、ポリメラーゼ連鎖反応(PCR)、又は核酸配列決定(例えば、DNA配列決定又はRNA配列決定)の使用を含み得る。かかるスキームを使用して選択的に濃縮された標的核酸配列の数は、標的ゲノム領域の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも50、少なくとも100、少なくとも150、少なくとも200、少なくとも300、少なくとも500、又は500を超える異なる標的核酸配列を含み得る。標的核酸の濃縮のためのかかるプローブの使用は、「ハイブリッドキャプチャ」と称され得る。かかるハイブリッドキャプチャプローブの使用は、亜硫酸水素塩変換の前又は後に行われ得る(適用される場合)。標的核酸配列の例には、表1に含まれるゲノム領域に関連するものが含まれる。
【0078】
いくつかの実施形態において、核酸試料は、卵巣がんを有するか、若しくはその疑いのあるか、又は良性骨盤内腫瘤を有する対象の血漿試料から収集され得る。抽出された核酸は亜硫酸水素塩化合物と接触され、亜硫酸水素塩変換を受ける。次いで、ゲノムライブラリが、亜硫酸水素塩変換された核酸から調製され得る。次に、ゲノムライブラリの一部が、キャプチャプローブが標的ゲノム領域の1つ以上のDNA鎖に相補的であるか、又はCpG島などが亜硫酸水素塩変換のために修飾されている標的ゲノム配列に相補的である、様々なキャプチャプローブとハイブリダイズされ得る。
【0079】
ライブラリを調製するための方法の非限定的な例には、二重インデックス化を用いたトランスポソーム媒介性プロトコル、及び/又はキット(例えば、TruSeq Methyl Capture EPIC Library Prep Kit、Illumina、CA,USA、Kapa Hyper Prep Kit(Kapa Biosystems)を使用することが含まれる。TruSeq DNA LTアダプタ(Illumina)などのアダプタをインデックス化のために使用することができる。配列決定は、シーケンサプラットフォーム(例えば、MiSeq又はHiSeq、Illumina)を使用してライブラリで行われる。
【0080】
好ましくは、キャプチャプローブは、標的ゲノム領域の核酸配列の少なくとも一部分と相補的であるか、又は亜硫酸水素塩変換のために修飾される標的ゲノム領域の核酸配列の少なくとも一部分と相補的であるRNAプローブである。いくつかの実施形態において、各標的ゲノム領域の1つ以上の部分と重複する(すなわち、タイリング)いくつかのキャプチャプローブが使用され得る。このように、標的ゲノム領域を飽和させるために多数のキャプチャプローブを使用して、その標的ゲノム領域の濃縮を確実にすることができる。キャプチャプローブは、公的に入手可能なソフトウェアを使用して設計するか、又は商業的に購入し得る。
【0081】
いくつかの実施形態において、キャプチャプローブは、ビオチン、ストレプトアビジン、ジギトニン、又は当該技術分野で既知の他のタグなどの親和性タグでタグ付けされ得る。標的ゲノム領域とのハイブリダイゼーション後、ビオチン化キャプチャプローブは、ストレプトアビジンビーズ又は他のストレプトアビジンコーティング表面を使用してライブラリから「プルダウン」され得、したがって、標的ゲノム領域の濃縮を引き起こし得る。他の実施形態において、プローブは、ガラスマイクロアレイスライドなどの固体表面上に固定され得る。
【0082】
次いで、濃縮した標的ゲノム領域は、パイロ配列決定、単一分子リアルタイム配列決定、合成による配列決定、ライゲーションによる配列決定(SOLID配列決定)、及びナノポア配列決定などの次世代配列決定技術を使用して配列決定され得る。
【0083】
核酸分子(例えば、抽出された核酸分子)又はその誘導体を配列決定に供し、複数の配列決定リードを提供し得る。配列決定リードは、参照ゲノムと整列され得、かつ/又は参照ゲノムに関して分析され得る。配列決定リードに少なくとも部分的に基づいて、1つ以上のゲノム領域に対応する核酸分子の絶対量又は相対量(当該分子内のメチル化の絶対レベル又は相対レベルを含む)が測定され得る。代替的に、配列決定リードを使用せずに、核酸分子の量又は相対量を決定し得る。試料の1つ以上のゲノム領域のゲノムプロファイル(例えば、メチル化プロファイル)を含むデータセットは、配列決定リードに少なくとも部分的に基づいて生成され得る。配列決定リードは、1つ以上のゲノム領域の低メチル化及び/又は高メチル化領域などの差次的メチル化標的ゲノム領域を特定するために処理され得る。
【0084】
配列特定は、例えば、配列決定、アレイハイブリダイゼーション(例えば、Affymetrix)、又は核酸増幅(例えば、PCR)によって行われ得る。配列決定は、大規模並列配列決定(MPS)、ペアエンド配列決定、ハイスループット配列決定、次世代配列決定(NGS)、ショットガン配列決定、単一分子配列決定、ナノポア配列決定、メチル化状態の直接検出又は推論によるナノポア配列決定、半導体配列決定、パイロ配列決定、合成による配列決定(SBS)、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、及びRNA-Seq(Illumina)などの任意の好適な配列決定方法によって行われ得る。配列決定は、全ゲノム亜硫酸水素塩配列決定(WGBS)及び/又は酸化的亜硫酸水素塩配列決定(oxBS-Seq)などの亜硫酸水素塩配列決定(BS-Seq)を含み得る。
【0085】
配列決定及び/又は配列決定のための核酸試料の調製は、1つ以上の核酸増幅プロセス(例えば、DNA又はRNA分子の)などの1つ以上の核酸反応を行うことを含み得る。核酸増幅は、例えば、逆転写、プライマー伸長、非対称増幅、ローリングサークル増幅、リガーゼ連鎖反応、ポリメラーゼ連鎖反応(PCR)、及び多重置換増幅を含み得る。PCR方法の例としては、デジタルPCR(dPCR)、エマルションPCR(ePCR)、定量的PCR(qPCR)、リアルタイムPCR(RT-PCR)、ホットスタートPCR、多重PCR、非対称PCR、ネステッドPCR、及びアセンブリPCRが挙げられる。好適なラウンド数の核酸増幅(例えば、qPCR、RT-PCR、dPCRなどのPCR)を行って、初期量の核酸分子(例えば、DNA分子)又はその誘導体を、後続の配列決定のための所望の入力量まで十分に増幅し得る。いくつかの場合では、PCRは、核酸分子のグローバル増幅に使用され得る。これは、ユニバーサルプライマーを使用するPCR増幅が続く、最初に異なる分子にライゲーションされ得るアダプタ配列を使用することを含む。PCRは、例えば、Life Technologies、Affymetrix、Promega、Qiagenなどによって提供される、多数の市販キットのいずれかを使用して行われ得る。他の場合では、核酸の集団内の特定の標的核酸のみが増幅され得る。特定のプライマーを、おそらくアダプタライゲーションと併せて使用して、下流の配列決定のために特定の標的を選択的に増幅し得る。いくつかの場合では、ネステッドプライマーを使用して、特定のゲノム領域を標的にし得る。核酸増幅は、1つ以上の遺伝子座、ゲノム領域、又は差次的メチル化領域(例えば、CpG部位、CpA部位、CpT部位、及び/又はCpC部位)、及び特に表1(以下)に列挙される標的ゲノム領域の標的化増幅を含み得る。いくつかの場合では、核酸増幅は、亜硫酸水素塩変換後に行われる。かかる手順は、標的化亜硫酸水素塩アンプリコン配列決定(TBAS)と称され得る。核酸増幅は、1つ以上のプライマー、プローブ、酵素(例えば、ポリメラーゼ)、緩衝液、及びデオキシリボヌクレオチドの使用を含み得る。核酸増幅は、等温であり得るか、又はサーマルサイクリングを含み得る。サーマルサイクリングは、例えば、初期化、変性、アニーリング、及び伸長を含む核酸増幅の様々なプロセスに関連した温度に変更することを含み得る。配列決定は、Qiagen、NEB、Thermo Fisher Scientific、又はBio-RadによるOneStep RT-PCRキットプロトコルなどの同時逆転写(RT)及びPCRの使用を含み得る。
【0086】
核酸分子(例えば、DNA又はRNA分子)又はその誘導体は、複数の試料の多重化を可能にするために、例えば、識別可能なタグで標識又はタグ付けされ得る。例えば、所与の試料又は対象に関連する全ての核酸分子又はその誘導体は、タグ付け又は標識化され得る(例えば、核酸バーコード配列などのバーコード又は蛍光標識を用いて)。他の試料又は対象に関連付けられた核酸分子又はその誘導体は、核酸分子又はその誘導体が、それらが由来する試料又は対象に関連付けられ得るように、異なるタグ又は標識でタグ付け又は標識され得る。かかるタグ付け又は標識はまた、多重化を容易にし、それによって複数の試料及び/又は対象からの核酸分子若しくはその誘導体が同時に分析(例えば、配列決定)され得る。任意の数の試料が多重化され得る。例えば、多重化反応は、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、又は100を超える初期試料からの核酸分子又はその誘導体を含み得る。かかる試料は、同じか又は異なる対象に由来し得る。例えば、複数の試料は、各核酸分子(例えば、DNA分子)又はその誘導体が、核酸分子が由来する試料(及び/又は対象)にさかのぼって追跡され得るように、試料バーコード(例えば、核酸バーコード配列)でタグ付けされ得る。試料バーコードは、複数の対象からの試料が互いに区別されることを可能にし得、これは、プール中などの、かかる試料中の配列が同時に特定されることを可能にし得る。タグ、標識、及び/又はバーコードは、ライゲーション、プライマー伸長、核酸増幅、又は別のプロセスによって、核酸分子又はその誘導体に結合され得る。いくつかの場合では、特定の試料の核酸分子又はその誘導体は、異なるタグ、標識、又はバーコード(例えば、独自の分子識別子)でタグ付け、標識化、又はバーコード化され得、それによって、同じ試料に由来する異なる核酸分子又はその誘導体は、区別されるようにタグ付け、標識化、又はバーコード化され得る。いくつかの場合では、所与の試料からの核酸分子又はその誘導体は、異なる標識及び同一の標識の両方で標識され得、それによって、試料に関連付けられた各核酸分子又はその誘導体は、独自の標識及び共有標識の両方を含む。
【0087】
核酸分子又はその誘導体を配列決定に供した後、好適なバイオインフォマティクスプロセスを配列リードに対して行い、無細胞生体試料の1つ以上のゲノム領域のメチル化プロファイルを含むデータセットを生成し得る。例えば、配列リードは、1つ以上の参照ゲノム(例えば、ヒトゲノム)に整列され得る。整列された配列リードは、1つ以上のゲノム遺伝子座で定量化して、無細胞生体試料の1つ以上のゲノム領域のメチル化プロファイルを含むデータセットを生成し得る。配列の定量化は、非正規化値又は正規化した値として表され得る。
【0088】
いくつかの実施形態において、亜硫酸水素塩変換したDNAのアラインメントは、Bismark(Krueger et al.(2011)Bioinformatics,27(11):157171)などのソフトウェアプログラムを使用して行われる。Bismarkは、リードマッピング及びメチル化コールの両方を単一のステップで実行し、その出力は、CpG、CHG、及びCHH状況においてシトシン間を区別する。BismarkはGNU GPLv3+ライセンスでリリースされている。ソースコードは、bioinformatics.bbsrc.ac.uk/projects/bismark/から無料で入手可能である。いくつかの実施形態において、例えば、メチル化レベル又は標的ポリヌクレオチド領域を分析及び/又は決定する1つ以上の公的に利用可能なプログラムを使用して、差次的メチル化が特定の遺伝子座/領域について計算される。いくつかの実施形態において、標的ポリヌクレオチド領域のメチル化レベルを分析及び/又は決定するために使用される方法には、Metilene(Juhling et al.,Genome Res.,2016;26(2):256-262)、又はIllumina,Inc.からオンラインで入手可能なGenomeStudioソフトウェアが含まれる。差次的にメチル化された標的ポリヌクレオチド領域を決定する他の方法は、Hovestadt et al.,2014;Nature,510(7506),537-541に記載されている。
【0089】
いくつかの実施形態において、対象における卵巣がんの有無を決定するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0090】
いくつかの実施形態において、卵巣がんの重症度(すなわち、ステージI、ステージII、ステージIII、又はステージIVのがん)を決定するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0091】
いくつかの実施形態において、対象における骨盤内腫瘤ががん性か、又は良性であるかを手術前に決定するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0092】
いくつかの実施形態において、対象における卵巣がんの組織学的サブタイプを特定するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。いくつかの実施形態において、組織学的サブタイプは、組織学的類内膜性卵巣がん、粘液性卵巣がん、明細胞卵巣がん、及び漿液性卵巣がんを含むか、又はそれらからなる。
【0093】
いくつかの実施形態において、検査される標的ゲノム領域は、無症候性の対象又はがんを発症する高リスクの対象(すなわち、BRCA1、BRCA2、RB、P53、APC、PTENの1つ以上の変異体対立遺伝子、又はがんの強い家族歴を有するなど、これらに限定されない遺伝性素因を有する)における高悪性度漿液性卵巣がんを検出し、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0094】
いくつかの実施形態において、本明細書に記載の方法は、上皮性卵巣がんについて、対象の非侵襲的スクリーニングに有用である。例えば、標的ゲノム領域は、腫瘤を有するが、毎年の医師の訪問の際にがんの症状がない対象における上皮性卵巣がんをスクリーニングするために使用される。別の実施形態において、本明細書に記載の方法は、対象が腫瘤を有しないが、当該技術分野で既知の標準的な手段を使用して検出の標準レベル未満の上皮性卵巣がんを有する上皮性卵巣について対象をスクリーニングするのに有用である。本明細書に記載される方法を使用するスクリーニングはまた、がんの遺伝的素因又は強い家族歴のためにがんを発症するリスクが高い対象に有用である。
【0095】
いくつかの実施形態において、対象における高悪性度漿液性卵巣がんの存在を除外するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0096】
いくつかの実施形態を使用して、最小残存病変の存在を決定し得る。最小残存病変は、治療中、又は患者が寛解しているときに治療後に体に残存する少数のがん細胞に付与される名称である。これはがんの再発の主な原因である。
【0097】
対象における最小残存病変の存在を決定するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0098】
表1.標的ゲノム領域。染色体番号、開始及び終結位置、ウィルコクソン(wilcox)p値、差次的メチル化値(DMR値)、及び最も近い遺伝子を含む表1が、既知のヒト参照ゲノムhg38と比較して提供され、これはその全体が本明細書に組み込まれるGenome Refence Consortiumから参照番号GRCh38/hg38で利用可能であり、例えば、www.ncbi.nlm.nih.gov/grc/human又はwww.ncbi.nlm.nih.gov/genome/tools/remapでアクセス可能であり得る。
【表1】

【0099】
いくつかの実施形態において、対象における上皮性卵巣がんを良性腫瘍から区別するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0100】
いくつかの実施形態において、対象における高悪性度漿液性上皮性卵巣がんを非高悪性度漿液性上皮性卵巣がんから区別するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含む。
【0101】
いくつかの実施形態において、対象における高悪性度漿液性卵巣がんを検出するための方法は、(a)対象からの無細胞核酸試料から、表1に列挙される複数の標的ゲノム領域の核酸メチル化レベルを測定するステップと、(b)試料中の複数の標的ゲノム領域の核酸メチル化レベルを、無がん対象から単離された試料中の複数の標的ゲノム領域における核酸メチル化レベル、無がん参照標準、又は無がん参照カットオフ値と比較するステップと、(c)対象に由来する試料中の複数の標的ゲノム領域の核酸メチル化レベルの変化に基づいて、対象が高悪性度漿液性上皮性卵巣がんを有することを決定することであって、変化が無がん対象から単離された試料中の標的ゲノム領域の核酸メチル化レベル、正常参照標準、又は正常参照カットオフ値より大きいか又は低い、決定するステップと、を含むか、それらから本質的になるか、又はそれらからなる。
【0102】
いくつかの実施形態において、対象における高悪性度漿液性上皮性卵巣がんを非高悪性度漿液性上皮性がんから区別するための方法、対象における高悪性度漿液性上皮性卵巣がんを検出する方法は、(a)対象からの無細胞核酸試料から、表1に列挙される複数の標的ゲノム領域の核酸メチル化レベルを測定するステップと、(b)試料中の複数の標的ゲノム領域の核酸メチル化レベルを、無がん対象から単離された試料中の複数の標的ゲノム領域の核酸メチル化レベル、無がん参照標準、又は無がん参照カットオフ値と比較するステップと、(c)対象に由来する試料中の複数の標的ゲノム領域の核酸メチル化レベルの変化に基づいて、対象が高悪性度漿液性上皮性卵巣がんを有することを決定することであって、変化が非高悪性度漿液性上皮性がん対象から単離された試料中の標的ゲノム領域の核酸メチル化レベルより大きいか又は低い、決定するステップと、を含むか、それらから本質的になるか、又はそれらからなる。
【0103】
いくつかの実施形態において、対象における卵巣がんの有無、卵巣がんの重症度、卵巣がんの組織学的サブタイプ、及び本明細書に記載の他の方法を決定するために検査される標的ゲノム領域は、表1に列挙される標的ゲノム領域の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%を含むが、表2のゲノム配列を除外する。
【0104】
表2.いくつかの実施形態において除外される標的ゲノム領域。標的ゲノム領域は、既知のヒト参照ゲノムhg38に認められ得、Genome Refence Consortiumから参照番号GRCh38/hg38で入手可能である。
【表2】

【0105】
いくつかの実施形態において、標的領域の配列決定は、次世代配列決定によって達成される。いくつかの実施形態において、次世代配列決定は、パイロ配列決定、単一分子リアルタイム配列決定、合成による配列決定、ライゲーションによる配列決定(SOLID配列決定)、又はナノポア配列決定のうちの1つ以上を含む。
【0106】
いくつかの実施形態において、試料中のcfDNAの検出は、次世代配列決定からのDNA配列をヒト参照ゲノムに整列させることを更に含む。特定の実施形態において、ヒト参照ゲノムGRCh38(UCSCバージョンhg38)は、その全体が本明細書に組み込まれる。
【0107】
いくつかの実施形態において、核酸メチル化レベルについて検査されるヌクレオチド配列は、表1に列挙される標的ゲノム領域配列を含み、また表1に列挙される標的ゲノム領域の上流又は下流にすぐ隣の1~100、1~150、1~200、1~300、1~400、1~500、500~1000、1000~1500、1500~2000、2000~2500、2500~3000、3000~3500、又は3500~4000ヌクレオチドを含み得る。
【0108】
いくつかの実施形態において、核酸メチル化レベルは、選択された1つ以上の遺伝子内のゲノム領域で決定される。非限定的な例としては、選択された1つ以上の遺伝子の非翻訳領域(UTR)内のゲノム領域、選択された1つ以上の遺伝子の転写開始部位の1.5kb上流内のゲノム領域、及び選択された1つ以上の遺伝子の第1のエクソン内のゲノム領域が挙げられる。
【0109】
本明細書に記載の方法のいくつかの実施形態において、表1に開示される標的ゲノム領域のDNAメチル化レベルは、対照試料又は標準(既知の非がん試料)の同じ標的ゲノム領域のメチル化レベルと比較される。いくつかの実施形態において、対照試料は、患者又は患者のプールからの既知の非がん性細胞及び/又は既知のがん性細胞である。いくつかの実施形態において、対照試料又は参照標準からの同じ遺伝子領域のメチル化レベルと比較される、がんの指標である標的ゲノム領域のメチル化レベルの差は、約0.2~約0.65である(表1、「dmr値」と表示された列を参照されたい)。対照標的ゲノム領域と比較した各標的ゲノム領域の核酸メチル化における全体差に基づく確率スコアは、卵巣がんの有無、及び/又は卵巣がんのステージ、卵巣がんのタイプ、卵巣がんに対する感受性などを決定することができる。
【0110】
本明細書に記載の方法の実施形態はまた、様々な腫瘍に関与する特定の標的ゲノム領域のメチル化レベルを決定して、例えば、悪性腫瘍又は悪性腫瘍のステージを予測するために使用され得る。例示的な腫瘍には、白血病が含まれ、急性白血病(11q23陽性急性白血病、急性リンパ性白血病、急性骨髄球性白血病、急性骨髄性白血病、並びに骨髄芽球性、前骨髄球性、骨髄単球性、単球性、及び赤血白血病など)、慢性白血病(慢性骨髄球性(顆粒球性)白血病、慢性骨髄性白血病、及び慢性リンパ球性白血病)、真性赤血球増加症、リンパ腫、ホジキン病、非ホジキンリンパ腫(無痛性及び高悪性度型)、多発性骨髄腫、ワルデンストレーム高ガンマグロブリン血症、重鎖病、骨髄異形成症候群、有毛細胞白血病、及び脊髄形成異常症が含まれる。他の腫瘍は、肉腫及びがん腫を含み得、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、骨原性肉腫、及び他の肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、結腸がん、リンパ系悪性腫瘍、膵臓がん、乳がん(基底乳がん、乳管がん、及び小葉がんが含まれる)、肺がん、卵巣がん、前立腺がん、肝細胞がん、扁平上皮性がん、基底細胞がん、腺がん、汗腺がん、甲状腺髄様がん、甲状腺乳頭がん、褐色細胞腫皮脂腺がん、乳頭状がん、乳頭腺がん、髄様がん、気管支原性がん、腎細胞がん、肝臓腫、胆管がん、絨毛がん、ウィルムス腫瘍、子宮頸がん、精巣腫瘍、セミノーマ、膀胱がん、並びにCNS腫瘍(神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽腫、聴神経腫、乏突起神経膠腫、髄膜腫、黒色腫、神経芽細胞腫、及び網膜芽細胞腫など)が含まれる。
【0111】
例えば、表1に列挙される標的ゲノム領域を使用して、本発明の実施形態は、早期から後期ステージがん卵巣がんを検出する際に75%超の感度、早期から後期ステージ卵巣がんを検出する際に80%超の感度、早期から後期ステージ卵巣がんを検出する際に85%超の感度、早期から後期ステージ卵巣がんを検出する際に90%超の感度、早期から後期ステージ卵巣がんを検出する際に95%超の感度、早期から後期ステージ卵巣がんを検出する際に96%超の感度、早期から後期ステージ卵巣がんを検出する際に97%超の感度、早期から後期ステージ卵巣がんを検出する際に98%超の感度、早期から後期ステージ卵巣がんを検出する際に99%超の感度、又は早期から後期ステージ卵巣がんを検出する際に100%の感度を有することができる。本発明の実施形態はまた、早期から後期ステージ卵巣がんを検出する際に50%超の特異性、早期から後期ステージ卵巣がんを検出する際に60%超の特異性、早期から後期ステージ卵巣がんを検出する際に70%超の特異性、早期から後期ステージ卵巣がんを検出する際に75%超の特異性、早期から後期ステージ卵巣がんを検出する際に80%超の特異性、早期から後期ステージ卵巣がんを検出する際に85%超の特異性、早期から後期ステージ卵巣がんを検出する際に90%超の特異性、又は早期から後期ステージ卵巣がんを検出する際に95%超の特異性を有し得る。
【0112】
がん又はがん再発(例えば、卵巣がんのタイプ)を発症する可能性がある対象を特定すると、予防的処置又は療法を対象に施すことができる。例えば、予防措置としては、手術、タモキシフェン投与、及びラロキシフェン投与が挙げられるが、これらに限定されない。固形腫瘍では、外科的切除を行うことができる。
【0113】
対象を卵巣がん又は卵巣がん再発を有するとして特定すると、臨床処置又はがん療法を対象に施すことができる。卵巣がんでは、例示的な療法又は処置には、手術、放射線療法、化学療法、ホルモン療法、標的化療法、並びに/又はアビトレキサート(メトトレキサート)、アブラキサン(パクリタキセルアルブミン安定化ナノ粒子製剤)、アドトラスツズマブエムタンシン、アフィニトール(エベロリムス)、アナストロゾール、アレディア(パミドロン酸二ナトリウム)、アリミデックス(アナストロゾール)、アロマシン(エキセメスタン)、カペシタビン、クラフェン、(シクロホスファミド)、シクロホスファミド、シトキサン(シクロホスファミド)、ドセタキセル、ドキソルビシン塩酸塩、エレンス(エピルビシン塩酸塩)、エピルビシン塩酸塩、エリブリンメシラート、エベロリムス、エキセメスタン、5-FU(フルオロウラシル注射液)、フェアストン(トレミフェン)、フェソロデックス(フルベストラント)、フェマーラ(レトロゾール)、フルオロウラシル注射液、フォレックス(メトトレキサート)、フォレックスPFS(メトトレキサート)、フルベストラント、ゲムシタビン塩酸塩、ジェムザール(ゲムシタビン塩酸塩)、ゴセレリンアセタート、ハラヴェン(エリブリンメシラート)、ハーセプチン(トラスツズマブ)、イブランス(パルボシクリブ)、イクサベピロン、イグゼンプラ(イクサベピロン)、カドサイラ(アドトラスツズマブエムタンシン)、キスカリ(リボシクリブ)、ラパチニブトシラート、レトロゾール、メゲストロールアセタート、メトトレキサート、メトトレキサートLPF(メトトレキサート)、メキサート(メトトレキサート)、メキサート-AQ(メトトレキサート)、ネオサール(シクロホスファミド)、ネラチニブマレアート、ネルリンクス(ネラチニブマレアート)、ノルバデックス(タモキシフェンシトラート)、パクリタキセル、パクリタキセルアルブミン安定化ナノ粒子製剤、パルボシクリブ、パミドロン酸二ナトリウム、パージェタ(ペルツズマブ)、ペルツズマブ、リボシクリブ、タモキシフェンシトラート、タキソール(パクリタキセル)、タキソテール(ドセタキセル)、チオテパ、トレミフェン、トラスツズマブ、タイカーブ(ラパチニブトシラート)、ベルバン(ビンブラスチンスルファート)、ベルサール(ビンブラスチンスルファート)、ビンブラスチンスルファート、ゼローダ(カペシタビン)、及びゾラデックス(ゴセレリンアセタート)のうちの1つ以上の投与が含まれるが、これらに限定されない。
【0114】
一実施形態において、がんを治療するための方法は、薬学的に許容される担体と、表1に列挙される標的ゲノム領域に関連する遺伝子又は遺伝子のタンパク質産物を阻害する治療有効量の上記に列挙される化合物と、を含む医薬組成物を投与することを含み得る。
【0115】
いくつかの実施形態において、がんの治療方法は、単独で、又は適切な担体若しくはビヒクルと組み合わせて、細胞内タンパク質、小分子、又は核酸分子を標的とすることができる好適な物質を含み得、これには、抗体若しくはその機能的断片(例えば、Fab′、F(ab′)2、Fab、Fv、rlgG、及びscFv断片並びに細胞内抗体及びキメラ抗体などの免疫グロブリンの遺伝子操作されたか又は他の改変形態)、タンパク質の小分子阻害剤、キメラタンパク質若しくはペプチド、転写の阻害のための遺伝子療法、又は遺伝子発現及び/若しくは翻訳を阻害することができるRNA干渉(RNAi)関連分子若しくはモルフォリノ分子が含まれるが、これらに限定されない。一実施形態において、阻害剤は、翻訳の阻害のためのsiRNA又はshRNAなどのRNAi関連分子である。RNA干渉(RNAi)分子は、標的の発現レベルの低下を提供するように、標的遺伝子又はmRNAの一部に相補的に結合する、短干渉RNA(siRNA)、二本鎖RNA(dsRNA)、マイクロRNA(miRNA)、又は短ヘアピンRNA(shRNA)分子などの小さい核酸分子である。
【0116】
本明細書に開示される方法の様々な態様(例えば、対象における良性又は悪性の腫瘍又は腫瘤を特定するため)は、コンピュータベースの計算、機械学習(例えば、サポートベクトルマシン(SVM)、Lasso and Elastic-Net Regularized Generalized Linear Models(Glmnet)、ランダムフォレスト、勾配ブースト(ランダムフォレスト上)、C5.0決定木)、及び他のソフトウェアツールを使用して実施することができる。例えば、CpG部位でのメチル化状態は、配列決定アッセイからのアンプリコンの根拠となる配列リードに基づいて、コンピュータによって割り当てることができる。別の例では、DNA領域又はその一部分のメチル化値は、本明細書に記載されるように、コンピュータによって閾値と比較することができる。ツールは、従来設計の汎用コンピュータシステムによって実行可能なコンピュータプログラムの形態で有利に提供される。
【0117】
いくつかの実施形態において、標的ポリヌクレオチド領域のメチル化レベルを分析及び/又は決定するために使用される方法には、Metilene(Juhling et al.,Genome Res.,2016;26(2):256-262)、又はIllumina,Inc.からオンラインで入手可能か、若しくはHovestadt et al.,2014;Nature,510(7506),537-541に記載のようなGenomeStudioソフトウェアが含まれる。
【0118】
いくつかの実施形態において、対象における卵巣がん又はその重症度を特定する方法は、機械学習アルゴリズムの使用を含み得る。機械学習アルゴリズムは、訓練されたアルゴリズムであり得る。機械学習アルゴリズムは、1つ以上の特性について訓練され得、試料(例えば、無細胞生体試料)中の核酸分子をアッセイすることによって生成されたデータセットを処理するために使用されるように訓練され得、データセットは、無細胞生体試料の1つ以上のゲノム領域のメチル化プロファイルを含む。
【0119】
機械学習アルゴリズム(例えば、訓練された機械学習アルゴリズム)は、上皮性卵巣がんの存在を少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の精度で特定するように構成され得る。
【0120】
標的ゲノム領域は、(例えば、本明細書に提供される方法を使用して)、卵巣がんを有する対象からの試料中に差次的メチル化を有することが、卵巣がんを有しない対象からの試料と比較して特定され得る。他の実施形態において、メチル化レベル又は1つ以上の標的領域は、卵巣がんの第1ステージに関連付けられ得るが、卵巣がんの第2ステージに関連付けられ得ない。別の例では、メチル化レベル又は1つ以上の標的領域は、卵巣がんの第1ステージに関連付けられ得ないが、卵巣がんの第2ステージに関連付けられ得る。他の標的領域のメチル化レベルは、卵巣がんの第2ステージに関連付けられ得、同様に第1ステージにも関連付けられ得るか、又は関連付けられ得ない。
【0121】
いくつかの実施形態において、核酸分子は、ハイブリダイゼーションを可能にする条件下で、プローブのアレイと接触させ得る。核酸分子とのプローブのハイブリダイゼーションの程度は、多数の方法を使用して定量的事項でアッセイされ得る。プローブ位置でのハイブリダイゼーションの程度は、アッセイによって提供されるシグナルの強度に関連し得、したがって、試料中に存在する相補的核酸配列の量に関連する。ソフトウェアは、発現された遺伝子、エクソン、イントロン、及びmiRNAを含む、ヒトゲノム又はトランスクリプトームにわたるプローブからのアレイ強度データを、抽出、正規化、要約、及び分析するために使用することができる。がん性試料又は非がん性試料のいずれかにおける所与のプローブの強度を参照セットに対して比較して、試料中に差次的メチル化が生じているか決定し得る。発現配列に対応するアレイ上のマーカー位置での相対強度の増加又は減少は、対応するマーカー又は遺伝子のメチル化のそれぞれ増加又は減少を示し得る。配列決定アッセイはまた、特定の核酸配列(例えば、無細胞生体試料などの試料の核酸分子の核酸配列)の量又は相対量を決定するために使用され得る。かかる核酸配列は、目的の特定のゲノム領域(例えば、遺伝子及び/又はマーカーを含むゲノム領域)に関連付けられた核酸配列を含み得る。配列決定データを処理して、所与の核酸配列又はその特性(例えば、差次的メチル化領域に関連する配列)に値(例えば、強度値)を割り当て得る。
【0122】
試料について所与の核酸配列に関連付けられた値(例えば、強度値)は、データの固有の特質を見ることによって特性の関連性を評価するフィルタ技術、特性サブセット検索内にモデル仮説を埋め込むラッパー方法、及び最適な特性のセットの検索が分類子アルゴリズムに組み込まれる埋め込み技術を含む特性選択技術を使用して分析することができる。フィルタ技術は、二標本t検定、ANOVA分析、ベイズフレームワーク、ガンマ分布モデル、及び限定されないが、マンホイットニーU検定などの非パラメトリック方法の使用などのパラメトリック方法、ウィルコクソンランクサム検定、クラス間-内二乗和検定、ランク積法、又はランダム置換法の使用などのモデルフリー方法、並びに二変数法、相関に基づく特性選択法(CFS)、最小冗長性最大関連性法(MRMR)、マルコフブランケットフィルタ法、及び無関係な縮小重心法などの多変量法を含み得る。ラッパー方法は、逐次検索方法、遺伝的アルゴリズム、及び分布アルゴリズムの推定を含み得る。埋め込み方法は、ランダムフォレストアルゴリズム、サポートベクトルマシンアルゴリズムの加重ベクトル、及びロジスティック回帰アルゴリズムの加重を含み得る。
【0123】
選択された特性は、分類子アルゴリズムを使用して分類され得る。例示的なアルゴリズムは、主成分分析アルゴリズム、部分最小二乗法、及び独立した成分分析アルゴリズムなどの変数の数を減少させる方法を含む。例示的なアルゴリズムは、統計的方法及び機械学習技術に基づく方法などの多数の変数を直接的に扱い得る。統計的方法には、ペナルティロジスティック回帰、マイクロアレイの予測分析(PAM)、収縮重心に基づく方法、サポートベクトルマシン分析、及び正規化線形判別分析が含まれる。
【0124】
訓練された機械学習アルゴリズムは、教師付き機械学習アルゴリズムを含み得る。訓練された機械学習アルゴリズムは、分類及び回帰木(CART)アルゴリズムを含み得る。教師付き機械学習アルゴリズムは、例えば、ランダムフォレスト、サポートベクトルマシン(SVM)、ニューラルネットワーク、深層学習アルゴリズム、バギング手順、又はブースト手順を含み得る。訓練された機械学習アルゴリズムは、教師なし機械学習アルゴリズムを含み得る。訓練された機械学習アルゴリズムは、複数の入力変数を受け入れ、複数の入力変数に基づいて1つ以上の出力値を生成するように構成され得る。複数の入力変数は、1つ以上の無細胞生体試料の1つ以上のゲノム領域のメチル化プロファイルを含み得る。
【0125】
訓練された機械学習アルゴリズムは、1つ以上の出力値の各々が、分類子による無細胞生体試料の分類を示す可能な値の固定数(例えば、線形分類子、ロジスティック回帰分類子など)のうちの1つを含むように、分類子を含み得る。訓練された機械学習アルゴリズムは、1つ以上の出力値の各々が、分類子による無細胞生体試料の分類を示す2つの値(例えば、(0、1}、(陽性、陰性}、(卵巣がんについて陽性、卵巣がんについて陰性)のうちの1つを含むように、バイナリ分類子を含み得る。訓練された機械学習アルゴリズムは、1つ以上の出力値の各々が、分類子による無細胞生体試料の分類を示す2つ以上の値(例えば、(0、1、2}又は(陽性、陰性、又は不確定))のうちの1つを含むように、別のタイプの分類子であり得る。出力値は、記述ラベル、数値、又はそれらの組み合わせを含み得る。いくつかの記述ラベルは、例えば、「陽性」を1、及び「陰性」を0にマッピングすることによって、数値にマッピングされ得る。
【0126】
出力値のいくつかは、バイナリ、整数、又は連続値などの数値を含み得る。かかるバイナリ出力値は、例えば、(0、1}を含み得る。かかる整数出力値は、例えば、(0、1、2}を含み得る。かかる連続出力値は、例えば、少なくとも0で1以下の確率値を含み得る。かかる連続出力値は、例えば、少なくとも0の非正規化確率値を含み得る。かかる連続出力値は、例えば、少なくとも0の非正規化確率値を含み得る。かかる連続出力値は、対象の卵巣がんの存在、重症度、及び/又は予後を示し得る。かかる連続的な出力値は、対象の卵巣がんを治療するための治療レジメンの予測を示し得、例えば、治療レジメンの有効性の予想される持続時間の指標を含み得る。いくつかの数値は、例えば、1を「陽性」にマッピングし、0を「陰性」にマッピングすることによって、記述ラベルにマッピングされ得る。
【0127】
出力値のいくつかは、1つ以上のカットオフ値に基づいて割り当てられ得る。例えば、試料のバイナリ分類は、対象が卵巣がんを有する少なくとも50%の確率を有することを試料が示す場合、「陽性」又は1の出力値を割り当て得る。例えば、試料のバイナリ分類は、対象が卵巣がんを有する50%未満の確率を有することを試料が示す場合、「陰性」又は0の出力値を割り当て得る。この場合、50%の単一カットオフ値を使用して、試料を2つの可能なバイナリ出力値のうちの1つに分類する。単一カットオフ値の例には、約1%、2%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、及び99%が含まれ得る。例えば、単一カットオフ値は、約10%~約90%など、約10%~約75%など、約10%~約60%、約10%~約50%、約20%~約75%、約20%~約60%、約20%~約50%、約30%~約75%、約30%~約60%、約30%~約50%、40%~約75%、40%~約60%、40%~約50%、50%~約75%、又は約50%~約60%などの約1%~約99%であり得る。
【0128】
訓練された機械学習アルゴリズムは、複数の独立した訓練試料で訓練され得る。独立した訓練試料の各々は、対象からの生体試料(例えば、無細胞生体試料)、及び/又は生体試料(本明細書の他の箇所に記載されるような)を処理することによって得られる関連データ、及び/又は生体試料に対応する1つ以上の既知の出力値(例えば、対象の卵巣がんの臨床診断、予後、治療有効性、又は存在、不存在、若しくは重症度)を含み得る。独立した訓練試料は、生体試料(例えば、無細胞生体試料)及び/又は複数の異なる対象から得られた関連したデータ及び出力を含み得る。独立した訓練試料は、生体試料(例えば、無細胞生体試料)、及び同じ対象からの複数の異なる時点(例えば、対象の卵巣がんを治療するための治療過程の前、後、及び/又は期間中)で得られた関連したデータ及び出力を含み得る。独立した訓練試料は、卵巣がんの存在又は重症度に関連付けられ得る(例えば、無細胞生体試料及び関連するデータを含む訓練試料、並びに卵巣がん及び/又は卵巣がんの様々なステージ(例えば、ステージI上皮性卵巣がん、ステージII上皮性卵巣がん、ステージIII上皮性卵巣がん、及びステージIV上皮性卵巣がん)を有することが知られている複数の対象から得られた関連したデータ及び出力。これはまた、限定されないが、類内膜性卵巣がん、粘液性卵巣がん、明細胞卵巣がん、及び漿液性卵巣がんなどの上皮性卵巣がんの任意の組織学的サブタイプ、並びに上皮性卵巣がんの各組織学的サブタイプの様々なステージを含み得る。独立した訓練試料は、卵巣がんの非存在と関連付けられ得る(例えば、無細胞生体試料及び関連データを含む訓練試料、並びに卵巣がんの以前の診断を有しないことが知られているか、卵巣がんから回復しているか、又はそうでなければ卵巣がんに対して無症候性である複数の対象から得られた出力)。他の実施形態において、独立した訓練試料は、高悪性度漿液性上皮性卵巣がんと関連付けられ得る。他の実施形態において、訓練試料は、非高悪性度上皮性卵巣がんと関連付けられ得る。
【0129】
訓練された機械アルゴリズムは、少なくとも約20個、少なくとも約30個、少なくとも約40個、少なくとも約50個、少なくとも約60個、少なくとも約70個、少なくとも約80個、少なくとも約90個、少なくとも約100個、少なくとも約150個、少なくとも約200個、少なくとも約250個、少なくとも約300個、少なくとも約350個、少なくとも約400個、少なくとも約450個、少なくとも約500個、又はそれ以上の独立した訓練試料で訓練され得る。
【0130】
訓練された機械学習アルゴリズムは、組織試料(例えば、腫瘍性試料又は非腫瘍性試料)、無細胞試料(例えば、無細胞核酸試料)、又はそれらの組み合わせで訓練され得る。
【0131】
いくつかの実施形態において、機械学習アルゴリズムは、無がん/正常卵巣及び/又は卵管を有する対象から収集された複数の無細胞核酸を使用して訓練され得、表1の標的ゲノム領域のメチル化レベルが、上皮性卵巣がんを有する対象から得られた無細胞核酸からの表1の同じ標的ゲノム領域のメチル化と比較される。次に、対象由来の生体試料(例えば、無細胞DNA試料)を、表1の標的ゲノム領域のメチル化レベルについて調べる。訓練された機械学習アルゴリズムは、次いで、表Iの差次的にメチル化された領域に基づいて、対象由来の生体試料が、例えば、がん性又はがんの重症度である確率値を出力する。ユーザは、条件の最も強い分離に基づいて、条件を示す閾値確率値を設定し得る(例えば、図3aを参照)。
【0132】
他の実施形態において、機械学習アルゴリズムは、無がん/正常な卵巣及び/又は卵管組織試料から収集された複数の核酸試料を使用して訓練され得、表1の標的ゲノム領域のメチル化レベルが、既知の腫瘍性組織(例えば、既知の卵巣がん組織試料)の組織からの表1の同じ標的ゲノム領域のメチル化と比較される。訓練されると、機械学習アルゴリズムを使用して、対象における表1の標的ゲノム領域を分析し、対象における卵巣がんの不存在の存在、又は重症度を決定し得る。いくつかの実施形態において、表1の標的ゲノム領域のメチル化レベルが、既知の腫瘍性組織の組織からの表1の同じ標的ゲノム領域のメチル化と比較されている、無がん/正常卵巣及び/又は卵管組織試料から収集された複数の核酸試料を使用して訓練された機械学習アルゴリズムを、訓練された機械アルゴリズムとして使用して、例えば、上皮性卵巣がんの有無、上皮性卵巣がんの重症度、上皮性卵巣がんの組織学的サブタイプ、上皮性卵巣がんに対する感受性を決定し、高悪性度漿液性上皮性卵巣がんと非高悪性度漿液性上皮性卵巣がんとを区別し、良性腫瘍と上皮性卵巣がんとを区別し、かつ無症候性の対象又はがんのタイプに対して遺伝的素因のある対象における上皮性卵巣がんの存在を示し得る。
【0133】
いくつかの実施形態において、約10、約15、約18、約20、約22、約25、約30、約35、約40、約45、約50、約55、又は約60(パーセントスケールで)の差次的メチル化値(DMV)は、差次的メチル化遺伝子座(DML)又は差次的メチル化領域(DMR)とみなされる。いくつかの実施形態において、約20パーセントのDMVは、DML又はDMRとみなされる。いくつかの実施形態において、約0.05未満のP値は、DML又はDMRとみなされる。
【0134】
いくつかの実施形態において、DNAメチル化が、正常対照試料、参照標準、又はカットオフ値と比較して、選択されたゲノム標的領域で濃縮されている場合、対象は、がん又はがん再発を有するか、又は発症することが決定され得る。いくつかの実施形態において、参照カットオフ値は、約10、約15、約18、約20、約22、約25、約30、約35、約40、約45、約50、約55、又は約60(パーセントスケールで)のDMVである。いくつかの実施形態において、参照カットオフ値は、約40パーセントである。
【0135】
機械学習アルゴリズム(例えば、訓練された機械学習アルゴリズム)は、少なくとも約10、20、30、40、50、100、200、250、300、400、500、又はそれ以上の独立した試料について、少なくとも約50%、少なくとも約65%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の精度で、上皮性卵巣がんの有無、上皮性卵巣がんの重症度、上皮性卵巣がんの組織学的サブタイプ、上皮性卵巣がんに対する感受性を決定し、高悪性度漿液性上皮性卵巣がんと非高悪性度漿液性上皮性卵巣がんとを区別し、良性腫瘍と上皮性卵巣がんとを区別し、かつ無症候性対象又はがんのタイプに対して遺伝的素因のある対象における上皮性卵巣がんの存在を示すように構成され得る。訓練された機械学習アルゴリズムによって卵巣がんの存在又は重症度を特定する精度は、卵巣がんの重症度を有するか、又は有しないとして正確に特定又は分類されている独立した試験試料(例えば、卵巣がんの重症度を有することが知られている対象又は卵巣がんの重症度について陰性の臨床試験結果を有する明らかに健康な対象)のパーセンテージとして計算され得る。
【0136】
機械学習アルゴリズム(例えば、訓練された機械学習アルゴリズム)は、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.81、少なくとも約0.82、少なくとも約0.83、少なくとも約0.84、少なくとも約0.85、少なくとも約0.86、少なくとも約0.87、少なくとも約0.88、少なくとも約0.89、少なくとも約0.90、少なくとも約0.91、少なくとも約0.92、少なくとも約0.93、少なくとも約0.94、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、少なくとも約0.99、又はそれ以上の曲線下面積(AUC)で、上皮性卵巣がんの有無、上皮性卵巣がんの重症度、上皮性卵巣がんの組織学的サブタイプ、上皮性卵巣がんに対する感受性を決定し、高悪性度漿液性上皮性卵巣がんと非高悪性度漿液性上皮性卵巣がんとを区別し、良性腫瘍と上皮性卵巣がんとを区別し、かつ無症候性対象又はがんのタイプに対して遺伝的素因のある対象における上皮性卵巣がんの存在を示すように構成され得る。AUCは、無細胞生体試料を、疾患の重症度を有するか、又は有しないとして分類する際に、アルゴリズムに関連付けられた受信者動作特性(ROC)曲線(例えば、ROC曲線下の面積)の積分として計算され得る。
【0137】
本明細書に記載の方法はまた、コンピュータシステムの使用によって実施され得る。例えば、CpG部位のメチル化状態を決定するために配列リードを評価するための上記のステップのいずれかは、コンピュータ又は他の情報機器若しくはデジタルデバイスにロードされたソフトウェアコンポーネントによって行われ得る。そのようにできる場合、コンピュータ、機器、又はデバイスは、次いで1つ以上のCpG部位のメチル化に関連する値の分析を支援するために、又はかかる関連する値を比較するために、上記のステップの全て又はいくつかを行い得る。1つ以上のコンピュータプログラムに具現化された上記の特性は、かかるプログラムを実行する1つ以上のコンピュータによって行われ得る。
【0138】
いくつかの実施形態において、少なくとも1つのプロセッサを含むコンピュータは、腫瘤(例えば、骨盤内腫瘤)又は他の腫瘍を有する患者から本明細書に開示される1つ以上の遺伝子の領域のメチル化レベルを含み得るDNAメチル化配列決定反応からの複数の配列決定結果と、健康な対照試料からの同じ遺伝子の正常な対照メチル化レベルの配列決定結果とを受信し、腫瘤又は他の腫瘍を有する患者からの本明細書に開示される1つ以上の遺伝子のメチル化レベルを含むDNAメチル化配列決定からの複数の配列決定結果を、対照試料からの1つ以上の遺伝子の正常な対照メチル化レベルと比較して確率スコアを生成し、確率スコアに基づいて患者をランク付けするように構成され得る。確率スコアは、低確率スコアが骨盤内腫瘤ががん性である可能性が低いことを示し、高確率スコアが骨盤内腫瘍ががん性である可能性が高いことを示すような参照メチル化スケールに対応する。
【0139】
いくつかの実施形態において、確率スコアは、機械学習モデルに基づいて、未知の各試料について機械学習アルゴリズム(例えば、C5.0決定木)によって計算される。確率スコアは、特定の試料が、良性腫瘍ではなく、ステージI~IVの卵巣がんを有する個体に属する可能性を表す。例えば、高確率スコア(>0.45)は、個体が悪性腫瘍を有すると予測されることを示し、一方、低確率スコア(<0.45)は、個体が良性腫瘍を有すると予測されることを示す。いくつかの実施形態において、高確率スコア(>0.45)は、個体が高悪性度上皮性卵巣がんを有すると予測されることを示し、一方、低確率スコア(<0.45)は、個体が高悪性度上皮性卵巣がんを有しないと予測されることを示す。いくつかの実施形態において、高確率スコア(>0.45)は、個体が上皮性卵巣がんを有すると予測されることを示し、低確率スコア(<0.45)は、個体が良性腫瘍を有すると予測されることを示す。いくつかの実施形態において、高確率スコア(>0.45)は、個体が上皮性卵巣がんに感受性であると予測されることを示し、低確率スコア(<0.45)は、個体が上皮性卵巣がんに感受性ではないと予測されることを示す。いくつかの実施形態において、高確率スコア(<0.45)は、無症候性の対象又はがんのタイプに対する遺伝的素因がある対象における上皮性卵巣がんの存在を予測し、一方、低確率スコア(<0.45)は、無症候性の対象又はがんのタイプに対して遺伝的素因のある対象における上皮性卵巣がんの不存在を示す。
【0140】
本開示は、特定の腫瘍又は腫瘤(例えば、骨盤内腫瘤)が良性か又は悪性かの術前決定を可能にする方法を提供し、悪性診断におけるがん進行の様々なステージ間を区別するために使用され得る。例えば、腫瘍又は他の腫瘤が良性か又は悪性であるかを術前に決定するための方法は、a)患者から術前の生体試料を得るステップと、b)生体試料から1つ以上の標的ゲノム領域のメチル化レベルを決定するステップと、c)生体試料の1つ以上の標的ゲノム領域のメチル化レベルを、1つ以上の対照試料から得られた1つ以上の標的ゲノム領域の正常な対照メチル化レベルのメチル化レベルと比較するステップと、d)患者からの骨盤内腫瘤が良性又は悪性である確率を決定するステップであって、生体試料からの1つ以上の標的ゲノム領域のメチル化レベルに基づいて、0.5以上の確率スコアが、1つ以上の対照試料からの1つ以上の標的ゲノム領域の正常な対照メチル化レベルと比較して少なくとも10%高いか又は低いことが悪性を示す、決定するステップと、を含み得る。1つ以上の標的ゲノム領域は、表1に列挙される。腫瘍又は腫瘤が悪性であると決定されるとき、それは、例えば、放射線療法、治療用化合物(すなわち、抗がん化合物)の投与、患者からの腫瘍若しくは腫瘤の除去、又はそれらの組み合わせによって治療され得る。
【実施例
【0141】
実施例1.DNAメチル化試験方法の開発
発見段階中、高悪性度漿液性上皮性卵巣がん(HGSOC)と正常な卵管試料との間で10972の差次的メチル化領域(DMR)が特定された(図1)。このデータから、血漿由来のcfDNAの独立したコホートで標的化亜硫酸水素塩アンプリコン配列決定(bAmplicon-seq)を使用した検証のために35のDMRを選択した。この独立した検証コホートは、良性(n=21)、ステージI(n=27)、ステージII(n=3)、及びステージIII(n=31)の患者血漿試料から構成された。
【0142】
バイオマーカー発見のために、減少表現亜硫酸水素塩配列決定(RRBS)を、EOCを有する患者からの33例のステージI HGSOCからなる患者コホートからの組織、及び対側卵巣からの10例の正常な卵管組織試料で最初に行った。配列決定ライブラリは、亜硫酸水素塩変換したDNAで調製され、ペアエンド配列決定は、Illumina配列決定プラットフォームで行われた。Metileneソフトウェアを使用して、HGSOCと正常との間で10972の差次的メチル化領域(DMR)を特定した。これらの領域の教師なし階層的クラスタリング分析は、正常試料をHGSOC腫瘍から分離した。これらのデータから、血漿由来のcfDNAの独立したコホートで標的化亜硫酸水素塩アンプリコン配列決定(bAmplicon-seq)を使用した検証のために上位35のDMRを選択した。この独立した検証コホートは、良性(n=21)、ステージI(n=27)、ステージII(n=3)、及びステージIII(n=31)の患者血漿試料から構成された。
【0143】
無細胞DNAを亜硫酸水素化変換して、目的の領域について多重PCR反応で増幅した。次いで、増幅したDNAを配列決定ライブラリに変換し、Illumina MiSeqシステムを使用して配列決定した。配列リードを、Bowtie2アラインメントアルゴリズムを用いたオープンソースのBismark Bisulfite Read Mapperを使用して、ヒトゲノム(hg38)に整列させた。
【0144】
HGSOCを有する患者と良性卵巣病変を有する患者とを区別できる新規分類子を構築するために、機械学習モデルを35のDMRのbAmplicon-seqメチル化データに適用した。試料を、モデルを生成するために使用される訓練セット(試料の70%)と、モデルを検証するために使用される試験(試料の30%)セットにランダムに分けた。機械学習アルゴリズムは、最も情報価値のあるDMRからなるモデルを構築した。
【0145】
機械学習アルゴリズムは、最も情報価値のあるDMRからなるモデルを構築した。低スコアは、試料が良性の骨盤内腫瘤からであることを示し、一方、高スコアは、個体がステージI以上のEOCを有することを示す。本開示の実施形態は、ステージ1のEOC試料に由来するが、それが、ステージI~IIIのEOCに対して良性を層別化することができることを見出した(図2)。更に、他の多くのEOC診断試験は、ステージIのEOCを検出する際により低い精度を有するため、早期ステージ(ステージI)EOCを特定する能力は、極めて有利である。
【0146】
試験セットから得られたスコアを使用して、受信者動作特性(ROC)曲線を生成し、0.902の曲線下面積(AUC)を有した(図3a)。分類のための最適閾値スコアを使用して、モデルは、早期から後期ステージのEOCを診断する高い感度(100%)及び特異性(71.4%)を有した。この事例では、4つの偽陽性症例があったが、1つの試料は外陰上皮内新生物(VIN)を有する患者から採取され、4年後に外陰のステージ1明細胞を遅れて発症し、別の試料は子宮頸がんの既往のある患者から採取された。これらの試料を除去した後、特異性は94.7%に増加した(図3b)。亜硫酸水素塩アンプリコン配列決定及びハイブリッドプローブキャプチャは、再現性の高いアッセイである。これは、亜硫酸水素塩アンプリコン配列決定(図4a)又はハイブリッドプローブキャプチャ(図4b)について異なる時点で実行された生物学的反復の分析によって明らかである。生物学的反復間のベータ値を比較する相関係数(R2)は0.9を超え、強い直線関係及び再現可能なアッセイを示す。
【0147】
別のRRBSデータ解析において、HGSOCと正常な卵管試料及び正常な卵巣試料との間の多くのDMRを特定した。この演出では、ハイブリッドプローブキャプチャアプローチを用いた更なる分析のために、1677の固有DMRを選択した。ハイブリッドプローブキャプチャは、ビオチン化RNAプローブを使用する。目的の領域を代表するプローブを設計するために、所与の標的セットのための様々なCpGメチル化状態を合成した。次いで、長さが60~80ヌクレオチドのプローブ候補を、40ヌクレオチドごとに1プローブでこれらの標的にわたってタイル化した(約2×タイル化)。次いで、これらを、hg38の両方の鎖に対する特異性についてスクリーニングし、全てのCpHをTpHに変換した(すなわち、完全なCpGメチル化ゲノム参照)。約115,739の配列(93,483の固有)の最終プローブセットを設計した。
【0148】
次に、良性及び悪性の付属器腫瘤を有する患者から採取した血漿試料の大規模なコホートからcfDNAを抽出し、亜硫酸水素塩処理した。これには、ライブラリ調製及び独自のデュアル8bpインデックスプライマーを用いたインデックス増幅が続いた。各ライブラリを分析し、標準方法を使用して定量化した。標的濃縮は、ハイブリッドプローブキャプチャ設計を使用して実行した。亜硫酸水素塩変換したDNAライブラリを、ハイブリダイゼーション緩衝液中で、5’ビオチン化RNAプローブ及びブロッカーとともに一晩インキュベートした。プローブ結合したライブラリをストレプトアビジンビーズでプルダウンし、続いて洗浄及び増幅ステップを行った。濃縮されたライブラリを定量化し、次世代配列決定プラットフォームで配列決定した。
【0149】
本発明者らは、発見に基づくゲノムワイドメチル化分析、標的選択、及び臨床検証を伴う実験室検証を組み合わせた実験室ワークフローを開発してきている。したがって、循環中の最大1600の領域のDNAメチル化レベルは、良性及び悪性の骨盤内腫瘤を正確に区別することによってEOCの診断に使用することができるか、又は卵巣がんを有する無症候性女性をスクリーニングするために使用することができる。
【0150】
EOCの様々な組織学的サブタイプ。EOCの組織学的サブタイプには、類内膜性、粘液性、明細胞、及び漿液性が含まれる。HGSOCは、最も一般的な組織学的サブタイプであり、臨床的に最も悪性度が高い。ここでは、臨床検証試験からの試料に加えて、87の非HGSOC EOC腫瘍に対してbAmplicon-seqを行い、EOCの他の組織学的サブタイプを検出する特異性及び感度を評価する。これらの予測を使用して、各組織学的サブタイプについて、アッセイのAUC及び陽性/陰性予測値を別々に計算する。二標本二項検定を使用して、各サブタイプの結果をEOCの結果と比較する。これにより、EOCと比較して、各組織学的サブタイプについて統計的に有意に高いか又は低い感度/特異性が決定されるであろう。
【0151】
EOCの臨床的エピジェネティック下位分類。予備データは、臨床的意義が未決定であるEOCの少なくとも3つのエピジェネティックサブタイプが存在し得ること(図1)を示す。各サブタイプの関連性を定義するために、転帰、BRCA状態、年齢、閉経状態、及び再発などの臨床的相関を調べる。加えて、cfDNAで評価される変異及びコピー数変化などの共分子変量の重要性を決定する。最後に、これらのサブタイプが卵管又は卵巣から生じるEOCに関連しているか決定する。
【0152】
実施例2.機械学習アルゴリズム
機械学習モデル構築は、以前に特定された差次的メチル化領域(DMR)のハイブリダイゼーションベースのキャプチャから得られたDNAメチル化データで行った。DMRのメチル化値は、モデル構築のための特性として使用された。試料及び特性は、最初に配列決定カバレッジによってフィルタリングした。5分割交差検証を試料セット全体で行い、試料の20%を各ラウンドの試験セットとして使用した。ランダムフォレスト、C5.0決定木、サポートベクトルマシン(SVM)、一般化線形モデル(GLM)、及び勾配ブーストを含む様々な機械学習モデルを試験した。モデルは、受信者動作特性(ROC)曲線の曲線下面積(AUC)を使用して最適化した。より高度なモデルには、差次的メチル化サブ領域の特定などのモデル構築前の特性選択法が含まれた。次いで、完了したモデルを使用して、未知の試料を、それらのDMRのメチル化に基づいてスコア化及び分類する。
【0153】
実施例3.EOCの異なる組織学的サブタイプにわたる方法の一般化可能性
予備データは、本明細書に記載される標的ゲノム領域が、HGSOCに対する優れたバイオマーカーであることを示す。EOCには、HGSOC、明細胞、類内膜性、及び粘液性などの複数の組織学的サブタイプが含まれる。HGSOCは、卵巣がんの最も一般的な組織学的サブタイプであり、悪性度が高い挙動を示し、疾患の後期ステージに存在するため、発見コホートに選択された。しかしながら、臨床的には、本明細書に開示される方法が、EOCの他の組織学的サブタイプの検出にも機能するか知るために極めて有用であろう。
【0154】
全ての組織学的サブタイプのEOCを検出することができることは、これらの患者が適切な臨床ケアを受けることを確実にすることによって、これらの患者のために全体的な転帰を改善するであろう。この目的では、EOCの他の組織学的サブタイプに対するOvaPrint(商標)の一般化可能性を試験することを計画する。本発明者らは、表3に列挙されるように、GTFRから一連の粘液性、明細胞、類内膜性、及び混合組織学的HGSOC腫瘍を得ている。上記に記載されるように、ハイブリッドキャプチャを使用するか、又はbAmplicon-seqを用いて、選択された領域における各CpGのDNAメチル化を測定することによって、これらの追加の87例の腫瘍について試験を行う。
【表3】

【0155】
最初に、これらの領域におけるメチル化値が、HGSOCを含む全ての組織学的サブタイプにわたって類似しているか、及びそれらが良性試料とは異なるか決定する。階層クラスタリングを行い、HGSOC及び良性試料を含む全ての試料についてメチル化値のヒートマップを生成する。多次元尺度構成法(MDS)又は一様多様体の近似及び投影(UMAP)などのデータクラスタ化の他の方法も使用される。これらの方法は、良性クラスタが全ての組織学的サブタイプと十分に異なるか、又は良性試料とより類似した挙動を示す特定のサブタイプがあるかを評価することを可能にする。組織学的サブタイプがそれ自体の別個のクラスタを形成する場合、それは、それ自体の別個のメチル化シグネチャを有し、試験の恩恵を受け得ないことを示唆する。
【0156】
統計分析。上記のグラフィカルなアプローチに加えて、他のEOCサブタイプを検出する能力を公式に評価する。メチル化値は、以前にHGSOCデータを使用して構築された機械学習モデルに入力され、新たな試料の各々の予測スコアを生成する。予測を使用して、各組織学的サブタイプについて、アッセイの特異性、感度、並びに陰性及び陽性予測値を個別に計算する。二標本二項検定を使用して、各サブタイプにおける特異性及び陰性予測値をHGSOCについてのものと公式に比較し、HGSOCと比較して、各組織学的サブタイプについて統計的に有意に高いか又は低い特異性及び感度を決定する。これらの結果に基づいて、HGSOCについて生成された本開示のモデルが他の組織学的サブタイプに一般化できるかを評価することができるであろう。そうでない場合は、他のサブタイプのうちの1つ以上を包含するようにモデルを改良するか、予測からそれらを除外することを選択する。
【0157】
実施例4.標的化亜硫酸水素塩アンプリコン配列決定
標的化亜硫酸水素塩アンプリコン配列決定は、例えば、IlluminaのMiSeqプラットフォームで行われる。この初期のディープシーケンシング戦略は、血漿などの低入力試料中のDNAメチル化の高感度検出を可能にする。このアッセイを行うための例示的な方法は、Masser et al.(2015)J Vis Exp.(96):52488に記載されており、参照により本明細書に組み込まれる。
【0158】
簡潔に述べると、核酸は、試料から単離され、定量される。DNA(例えば、無細胞DNA)の亜硫酸水素塩変換は、例えば、EZ DNA Methylation(商標)キット(Zymo Research、Tustin,Calif.,USAから入手可能)、EpiMark(登録商標)亜硫酸水素塩変換キット(New England Biolabs,Inc.、Ipswich,Mass.,USAから入手可能)、及びEpitect亜硫酸水素塩キット(Qiagen、Germantown,Md.,USAから入手可能)などの市販のキットを使用して行われる。亜硫酸水素塩変換は、非メチル化シトシンをウラシルに変化させる。これらのウラシルは、その後のPCR増幅中にチミンに変換される。
【0159】
亜硫酸水素塩変換したDNAを、亜硫酸水素塩変換したDNAを増幅することができるポリメラーゼを使用した亜硫酸水素塩特異的PCRによって増幅する。表1に列挙される領域に対応する長さおよそ60~500bpのDNAを増幅する。アンプリコンは、PAGE電気泳動によって視覚化される。代替的に、DNAチップを用いたキャピラリー電気泳動を、製造業者のプロトコルに従って使用する。
【0160】
次世代配列決定ライブラリを、アンプリコンを用いて調製する。ライブラリを調製するための方法の非限定的な例には、二重インデックス化を用いるトランスポソーム媒介性プロトコル、及び/又はキット(例えば、TruSeq Methyl Capture EPIC Library Prep Kit、Illumina、CA,USA、Kapa Hyper Prep Kit(Kapa Biosystems)を使用することが含まれる。TruSeq DNA LTアダプタ(Illumina)などのアダプタをインデックス化のために使用することができる。配列決定は、シーケンサプラットフォーム(例えば、MiSeq又はHiSeq、Illumina)を使用してライブラリで行われる。
【0161】
亜硫酸水素塩修飾DNAリードは、アラインメントソフトウェア(例えば、Bismarkツールバージョン0.12.7)を使用して、参照ゲノムに整列させる。差次的メチル化は、特定の遺伝子座/領域について計算される。
【0162】
実施例5.ハイブリッドプローブキャプチャ
プローブセットを、表1に列挙される複数の差次的メチル化領域(DMR)を標的にするように設計した。プローブセットは、複数の方法を使用して設計された。いくつかのプローブセットでは、プローブ設計のための参照配列として、メチル化状態の範囲を示す試料のプールから生成されたRRBSリードデータを使用した。代替プローブセットには、コンピュータでシミュレートしたメチル化状態プローブ設計方法を使用した。簡潔に述べると、標的ゲノム領域を参照アセンブリ(hg38)から抽出し、次いで、両方のゲノム鎖の様々なメチル化状態の亜硫酸水素塩変換バージョンをシミュレートし、これらの一部をプローブ設計のために選択した。次いで、プローブを、だいたい2×タイル密度でこれらのシミュレーション変換した領域の各々にわたってタイル化した。全ての候補プローブが選択されると、それらは特異性についてフィルタリングした。
【0163】
患者及び対照DNA試料から抽出された試料を複数回実行して、キャプチャ間及びキャプチャ内の再現性を評価した。抽出されたcfDNAを、EZ DNA Methylation-Goldキット(Zymo Research)を使用して亜硫酸水素塩処理に使用し、続いてAccel-NGS Methyl-Seq DNA Library Kit(Swift Biosciences)を用いてライブラリ調製し、独自のデュアル8bpインデックスプライマーを使用してインデックス増幅した。総ライブラリ定量的PCRに基づいて、収量は123ng~4.1ugの範囲だった。各ライブラリを、Bioanalyzer装置(Agilent Technologies)を使用して分析して、23~90%の範囲である標的ゲノム領域(例えば、ライブラリ調製後200~650bp)から生じる可能性が高い全ライブラリ質量の一部を測定した。次いで、この推定された比率を使用して、標的濃縮に適切なライブラリ量の意図したインサート材料を得た。各濃縮反応について8つ以上のライブラリを、最大1.6ugのインサート含有鋳型の総ライブラリ質量でプールした。標的濃縮は、市販の設定で合成されたバイトを使用して実行した。簡潔に述べると、亜硫酸水素塩変換したDNAライブラリを、ハイブリダイゼーション緩衝液中の5’-ビオチン化プローブ及びブロッカーとともに、63℃で一晩インキュベートした。プローブ結合したライブラリを、ストレプトアビジンビーズでプルダウンし、続いて63℃で4回洗浄を行い、PCRサイクル14回で増幅した。次いで、第2ラウンドの一晩ハイブリダイゼーションを行って、高い標的キャプチャ効率を達成した。濃縮されたライブラリを、KAPA Library Quantification Kit(Roche)で定量化し、NovaSeqで2×150サイクルランを使用して配列決定した。いくつかのキャプチャも、v3 chemistryを使用したMiSeqを用いて、PE75及びPE300プロトコルを使用して配列決定した。
【0164】
ペアエンドFASTQファイルをMiSeq及びNovaSeqシーケンサ(Illumina)で生成した。逆多重化後、FASTQ品質は、FastQCを使用して評価した。FastQCの結果に基づいて、FASTQを、3’末端で300bpから100bpにハードトリミングした。QC後、TrimGaloreを使用してFASTQアダプタトリミングを行った。Read 2 FASTQを5’末端から10bpトリミングして、Swift Biosciencesのアダプターゼによって導入された低複雑度オリゴヌクレオチドを除去した。トリミング後、ペアードエンドリードを、Brabham BioinformaticsのBismark BS-seqアラインメントソフトウェアを使用してhg38にマッピングした。アラインメント後、重複読み取りをSamblasterを使用して削除した。CpG当たりのメチル化は、Bismarkのメチル化抽出ツールを使用して評価した。QCレポートは、MultiQCを使用して結合した。全ての下流解析は、bsseqパッケージを使用してRで行った。
【0165】
具体的な実施形態は、開示された実施形態及び実施例を参照して上に記載されてきたが、かかる実施形態は単に例示的であり、本発明の範囲を限定しない。変更及び修正は、以下の特許請求の範囲で定義されるように、本発明のより広い態様から逸脱することなく、当業者によって行うことができる。
【0166】
米国特許第10,525,148号、同第11,035,849号、米国特許公開第2020/0340062号、及びPCT特許公開第2020/150258号を含む、全ての刊行物、特許、及び特許文献は、個別に参照によって組み込まれるように、参照により本明細書に組み込まれる。本開示と矛盾する制限は、そこから理解されるべきではない。本発明は、様々な具体的及び好ましい実施形態並びに技術を参照して説明されてきた。しかしながら、本発明の趣旨及び範囲内に留まりながら、多くの変形及び修正が行われ得ることを理解されたい。
図1
図2
図3-1】
図3-2】
図4-1】
図4-2】
図4-3】
【図
【国際調査報告】