IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グレイル エルエルシーの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-02
(54)【発明の名称】生体液中の標的分子の分析方法
(51)【国際特許分類】
   C12Q 1/6809 20180101AFI20240925BHJP
   C12Q 1/6886 20180101ALI20240925BHJP
   G01N 33/574 20060101ALI20240925BHJP
   G01N 33/53 20060101ALI20240925BHJP
【FI】
C12Q1/6809 Z
C12Q1/6886 Z
G01N33/574 D
G01N33/53 M
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024509480
(86)(22)【出願日】2022-09-09
(85)【翻訳文提出日】2024-03-14
(86)【国際出願番号】 US2022076210
(87)【国際公開番号】W WO2023039529
(87)【国際公開日】2023-03-16
(31)【優先権主張番号】63/242,872
(32)【優先日】2021-09-10
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.VISUAL BASIC
(71)【出願人】
【識別番号】522105894
【氏名又は名称】グレイル インコーポレイテッド
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100174001
【弁理士】
【氏名又は名称】結城 仁美
(72)【発明者】
【氏名】マシュー ラーソン
(72)【発明者】
【氏名】ルース イー マウンツ
(72)【発明者】
【氏名】デイヴィッド ブルクハルト
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA18
4B063QA19
4B063QQ03
4B063QQ42
4B063QQ52
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS32
4B063QS34
4B063QX02
(57)【要約】
標的分子(例えば、ポリペプチド及び/又は無細胞リボ核酸)の亜集団を測定するための方法が提供される。いくつかの実施形態では、対象から得られた試験試料中の複数のRNA分子からシーケンシングライブラリを生成する方法、並びにシーケンシングライブラリを分析して、例えば、疾患の有無を検出するための方法が提供される。
【特許請求の範囲】
【請求項1】
対象における癌を検出する方法であって、
(a)前記対象の生体液中の複数の標的分子であって、表11のポリペプチドから選択される、複数の標的分子を測定することと、
(b)前記癌を検出することであって、前記癌を検出することが、閾値レベルを上回る前記標的分子のうちの1つ以上を検出することを含む、こととを含む、方法。
【請求項2】
前記複数の標的分子が、表8又は12~19のうちの1つ以上のポリペプチドから選択される、請求項1に記載の方法。
【請求項3】
前記複数の標的分子が、表8、11~14又は17~19の少なくとも5、10、15、又は20のポリペプチドから選択される、請求項1に記載の方法。
【請求項4】
前記複数の標的分子が、(i)表11、(ii)表2、5、及び12の各々、(iii)表3、4、6、及び13の各々、(iv)表14、(v)表8、又は(vi)表18及び19からの複数のポリペプチドを含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記複数の標的分子が、表11~15のうちの1つ以上の少なくとも30のポリペプチドを含む、請求項1~3のいずれか一項に記載の方法。
【請求項6】
前記複数の標的分子が、表14のポリペプチドから選択される、請求項1~3のいずれか一項に記載の方法。
【請求項7】
閾値を超えて検出される前記複数の標的分子が、ADAMTS15、AFP、AGR2、AIF1、ALPP、BPIFB2、CEACAM5、CGA、CHGA、CWC15、CXCL17、DXO、ERBB2、ERBB4、F7、FGFBP1、FGFR2、FKBPL、FOLR1、GDF15、GFRA1、GP2、INSL4、LAMA4、LEP、MIA、MMP12、PRSS8、SFRP1、SFTPA2、SPON1、TFF1、VTCN1、及びWFDC2からなる群から選択されるポリペプチドである、請求項1~3のいずれか一項に記載の方法。
【請求項8】
閾値を超えて検出される前記複数の標的分子が、表8のポリペプチドから選択される、請求項1~3のいずれか一項に記載の方法。
【請求項9】
閾値を超えて検出される前記複数の標的分子が、CEACAM5、RHOV、SFTA2、SCGB1D2、IGF2BP1、SFTPA1、CA12、SFTPB、CDH3、MUC6、SLC6A14、HOXC9、AGR3、TMEM125、TFAP2B、IRX2、POTEKP、ARHGEF38、GPR87、LMX1B、ATP10B、NELL1、MUC21、SOX9、LINC00993、STMND1、ERVH48-1、SCTR、MAGEA3、MB、LEMD1、SIX4、及びNXNL2からなる群から選択されるポリペプチドである、請求項1~3のいずれか一項に記載の方法。
【請求項10】
前記複数の標的分子が、(a)表11~14のうちの1つ以上のポリペプチド、及び(b)表1~6のうちの1つ以上のポリペプチドを含む、請求項1~3のいずれか一項に記載の方法。
【請求項11】
前記複数の標的分子が、(a)表8又は11~14のうちの1つ以上のポリペプチド、及び(b)表7のうちの1つ以上のポリペプチドを含む、請求項1~3のいずれか一項に記載の方法。
【請求項12】
(i)前記癌が肺癌であり、(ii)閾値を超えて検出された前記複数の標的分子が表18のポリペプチドから選択される、請求項1~3のいずれか一項に記載の方法。
【請求項13】
(i)前記癌が肺癌であり、(ii)閾値を超えて検出される前記複数の標的分子が、WFDC2、CXCL17、MMP12、GDF15、又はCEACAM5のうちの1つ以上のポリペプチドから選択される、請求項1~3のいずれか一項に記載の方法。
【請求項14】
(i)前記癌が乳癌であり、(ii)閾値を超えて検出された前記複数の標的分子が表19のポリペプチドから選択される、請求項1~3のいずれか一項に記載の方法。
【請求項15】
閾値を超えて検出される前記複数の標的分子が、ADAMTS15、LEP、ERBB2、ERBB4、又はCGAのうちの1つ以上のポリペプチドから選択される、請求項14に記載の方法。
【請求項16】
前記複数の標的分子が、表16A又は表16Bのポリペプチドを含む、請求項1~3のいずれか一項に記載の方法。
【請求項17】
前記複数の標的分子が、表17のポリペプチドを含む、請求項16に記載の方法。
【請求項18】
前記複数の標的分子が、AGR3、CA12、CEACAM5、CXCL17、GP2、IL20、MMP7、TFF1、VTCN1から選択されるポリペプチドを含む、請求項16に記載の方法。
【請求項19】
(a)前記複数の標的分子が、(i)前記ポリペプチドをコードする遺伝子由来の無細胞DNA(cfDNA)、及び/又は(ii)前記ポリペプチドをコードする前記遺伝子の無細胞RNA(cfRNA)転写物を含む無細胞ポリヌクレオチドを更に含み、
(b)閾値レベルを上回る前記標的分子のうちの1つ以上を検出することが、(i)第1の閾値レベルを上回るポリペプチドのうちの1つ以上を検出すること、及び(ii)前記第1の閾値レベルを上回って検出されたポリペプチドの各々について、第2の閾値レベルを上回る対応する無細胞ポリヌクレオチドを検出することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項20】
前記無細胞ポリヌクレオチドが、cfRNAを含む、請求項19に記載の方法。
【請求項21】
前記無細胞ポリヌクレオチドが、cfDNAを含む、請求項19に記載の方法。
【請求項22】
前記cfDNAが、メチル化cfDNAである、請求項21に記載の方法。
【請求項23】
前記測定することが、シーケンシング、マイクロアレイ分析、逆転写PCR、リアルタイムPCR、定量的リアルタイムPCR、デジタルPCR、デジタルドロップレットPCR、デジタルエマルジョンPCR、マルチプレックスPCR、ハイブリッド捕捉、オリゴヌクレオチドライゲーションアッセイ、又はそれらの任意の組合せを含む、請求項1~3のいずれか一項に記載の方法。
【請求項24】
前記測定することが、前記無細胞ポリヌクレオチドを配列決定して配列リードを生成することを含む、請求項19に記載の方法。
【請求項25】
前記配列決定することが、全トランスクリプトームシーケンシングを含む、請求項24に記載の方法。
【請求項26】
前記配列決定することが、cfRNAから逆転写されたcDNA分子を配列決定することを含む、請求項24に記載の方法。
【請求項27】
前記配列決定することが、cfRNA又はcfDNAの濃縮された集団を配列決定することを含む、請求項24に記載の方法。
【請求項28】
前記生体液が、血、血漿、漿液、尿、唾液、胸水、心嚢液、脳脊髄液(CSF)、腹水、又はそれらの任意の組合せを含む、請求項1~3のいずれか一項に記載の方法。
【請求項29】
前記生体液が、前記対象の血液、血液画分、血漿、又は血清を含む、請求項28に記載の方法。
【請求項30】
閾値レベルを上回る前記標的分子のうちの1つ以上を検出することが、(i)検出、(ii)バックグラウンドを上回る検出、又は(iii)前記癌を有さない対象における前記1つ以上の標的分子のレベルよりも高いレベルでの検出を含む、請求項1~3のいずれか一項に記載の方法。
【請求項31】
閾値レベルを上回る前記標的分子のうちの1つ以上を検出することが、前記癌を有さない対象におけるレベルよりも少なくとも約10倍高いレベルで前記1つ以上の標的分子を検出することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項32】
閾値レベルを上回る前記無細胞ポリヌクレオチドのうちの1つ以上を検出することが、0.5~5リード/100万(RPM)の閾値を上回る検出を含む、請求項24に記載の方法。
【請求項33】
前記無細胞ポリヌクレオチドがcfRNA転写物を含み、前記第2の閾値レベルを上回る前記cfRNA転写物のうちの1つ以上を検出することが、
(a)前記cfRNA転写物のそれぞれの発現レベルをRNA組織スコア行列と比較することによって、cfRNA転写物についての指標スコアを決定する工程と
(b)前記cfRNA転写物の各々について指標スコアを集計することと、
(c)前記指標スコアが閾値を超えたときに、前記癌を検出することとを含む、請求項19に記載の方法。
【請求項34】
閾値レベルを上回る前記無細胞ポリヌクレオチドのうちの1つ以上を検出することが、前記配列リードを機械学習又は深層学習モデルに入力することを含む、請求項24に記載の方法。
【請求項35】
前記機械学習又は深層学習モデルが、ロジスティック回帰、ランダムフォレスト、勾配ブースティングマシン、ナイーブベイズ、ニューラルネットワーク、又は多項式回帰を含む、請求項34に記載の方法。
【請求項36】
前記機械学習又は前記深層学習モデルが、学習された重みを含む関数を通じて、前記1つ以上の特徴の値を前記対象についての疾患状態予測に変換する、請求項34に記載の方法。
【請求項37】
前記癌が、
(i)癌、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞性腫瘍、又はそれらの任意の組合せ;
(ii)腺癌、扁平上皮癌、小細胞肺癌、非小細胞肺癌、鼻咽頭、結腸直腸癌、肛門癌、肝臓癌、膀胱、精巣癌、子宮頸部癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、黒色腫、及び乳癌からなる群から選択される癌;
(iii)ホルモン受容体陰性乳癌若しくはトリプルネガティブ乳癌;
(iv)骨肉種、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、膠腫、及び星状膠細胞腫からなる群から選択される肉腫;
(v)骨髄性白血病、顆粒球白血病、リンパ性白血病、リンパ球性白血病、及びリンパ芽球性白血病からなる群から選択される白血病;又は
(vi)ホジキンリンパ腫及び非ホジキンリンパ腫からなる群から選択されるリンパ腫を含む、請求項1~3のいずれか一項に記載の方法。
【請求項38】
前記癌を検出することが、癌のステージを判定すること、癌の進行を判定すること、癌のタイプを判定すること、起源の癌組織を判定すること、又はそれらの組合せを含む、請求項1~3のいずれか一項に記載の方法。
【請求項39】
検出された前記癌に基づいて治療を選択することを更に含む、請求項1~3のいずれか一項に記載の方法。
【請求項40】
前記治療が、外科的切除、放射線療法、又は抗癌剤の投与を含む、請求項39に記載の方法。
【請求項41】
前記選択された治療で前記対象を治療することを更に含む、請求項39に記載の方法。
【請求項42】
請求項1~3のいずれか一項に記載の方法における1つ以上の工程を実施するためのコンピュータシステム。
【請求項43】
請求項1~3のいずれか一項に記載の方法における1つ以上の工程を実施するためのコンピュータ可読命令を記憶した、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(相互参照)
本出願は、2022年9月10日に出願された米国仮特許出願第63/242872号の利益を主張し、この出願は、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
2017年現在、米国では毎年合計160万件を超える新規症例があり、癌は顕著な世界的公衆衛生問題である。Siegelら、2017年、「Cancer statistics」、CA Cancer J Clin.67(1):7-30を参照。スクリーニングプログラム及び早期診断は、癌患者における無病生存の改善及び死亡率の減少において重要な影響を有する。早期診断のための非侵襲的アプローチは患者のコンプライアンスを促進するので、それらはスクリーニングプログラムに含めることができる。
【0003】
無細胞核酸(cfNA)は、特定の疾患の循環画像である「液体生検」を表す血清、血漿、尿、及び他の体液中に見出すことができる(Chanら、「Clinical Sciences Reviews Committee of the Association of Clinical Biochemists Cell-free nucleic acids in plasma,serum and urine:a new tool in molecular diagnosis」、Ann Clin Biochem.2003年;40(Pt2):122-130)。De Mattos-Arruda及びCaldas、2016年、「Cell-free circulating tumour DNA as a liquid biopsy in breast cancer」、Mol Oncol.2016年;10(3):464-474を参照。同様に、無細胞RNAが、癌検出のための可能な分析物として提案されている。Tzimagiorgisら、「Recovering circulating extracellular or cell-free RNA from bodily fluids」、Cancer Epidemiology 2011年;35(6):580-589を参照。これらのアプローチは、癌などの様々な疾患をスクリーニングする潜在的な非侵襲的方法を表す。
【0004】
それにもかかわらず、癌は依然として世界中で頻繁に起こる死因である。過去数十年にわたって、治療選択肢は改善されているが、生存率は低いままである。外科的切除及び薬物ベースのアプローチによる治療の成功は、初期段階の腫瘍の特定に強く依存する。しかしながら、撮像及びバイオマーカーに基づくアプローチなどの現在の技術は、疾患のより進行した段階が始まるまで腫瘍を特定することができないことが多い。
【発明の概要】
【0005】
前述のことを考慮すると、治療的介入がより大きな成功の機会を有する場合、最も早い段階で疾患を特定することができる非侵襲的検出モダリティが依然として必要とされている。本開示の態様は、この必要性に対処し、他の利点も提供する。
【0006】
いくつかの態様では、本開示は、対象における癌を検出する方法を提供する。実施形態では、本方法は、(a)対象の生体液中の複数の標的分子を測定することであって、複数の標的分子が表11のポリペプチドから選択されること、及び/又は(b)癌を検出することであって、癌を検出することが、閾値レベルを上回る標的分子のうちの1つ以上を検出することを含む工程を含む。実施形態では、複数の標的分子は、表8又は12~19のうちの1つ以上のポリペプチド(例えば、表8、11~14又は17~19の少なくとも5、10、15、又は20のポリペプチド)から選択される。
【0007】
いくつかの実施形態では、(a)複数の標的分子は、(i)ポリペプチドをコードする遺伝子由来の無細胞DNA(cfDNA)、及び/又は(ii)ポリペプチドをコードする遺伝子の無細胞RNA(cfRNA)転写物を含む無細胞ポリヌクレオチドを更に含み、(b)閾値レベルを上回る標的分子のうちの1つ以上を検出することは、(i)第1の閾値レベルを上回るポリペプチドのうちの1つ以上を検出することと、(ii)第1の閾値レベルを上回って検出されたポリペプチドの各々について、第2の閾値レベルを上回る対応する無細胞ポリヌクレオチドを検出することとを含む。
【0008】
いくつかの態様では、本開示は、本明細書で開示される様々な態様のいずれかの方法における1つ以上の工程を実施するためのコンピュータシステムを提供する。
【0009】
いくつかの態様では、本開示は、本明細書で開示される様々な態様のいずれかの方法における1つ以上の工程を実施するためのコンピュータ可読命令を記憶した非一時的コンピュータ可読媒体を提供する。
【図面の簡単な説明】
【0010】
図1】一実施形態によるシーケンシングのための核酸試料を調製する方法のフローチャートである。
図2】本発明の一実施形態による、疾患状態を示す1つ以上のRNA配列を特定するための方法を示すフロー図である。
図3】本発明の一実施形態による、1つ以上の腫瘍由来RNA配列を特定するための方法を示すフロー図である。
図4】本発明の一実施形態による、対象における癌の存在を検出する、癌の状態を判定する、癌の進行をモニタリングする、及び/又は癌のタイプを判定する方法を示すフロー図である。
図5】本発明の一実施形態による、1つ以上の標的RNA分子に由来する1つ以上の配列リードから疾患状態を検出するための方法を示すフロー図である。
図6】本発明の一実施形態による、指標スコアに基づいて対象における癌の存在を検出するための方法を示すフロー図である。
図7】一実施形態による、試料分類スキームの感度及び特異度に関する例示的な結果を示す。
図8A】一実施形態による、試料分類スキームの感度及び特異度に関する例示的な結果を示す。
図8B】一実施形態による、試料分類スキームの感度及び特異度に関する例示的な結果を示す。
図8C】一実施形態による、試料分類スキームの感度及び特異度に関する例示的な結果を示す。
図9】癌性試料と非癌性試料との間で最も高い発現レベル比を有する、肺癌における20のダークチャネル遺伝子の発現レベルを示す。リード/100万(RPM)をダークチャネル遺伝子の関数としてプロットする。各プロットにおいて、左から右へのドットの列は、それぞれ、左から右への上部凡例に示される群(クラス、肛門直腸、乳房、結腸直腸、肺、及び非癌)に対応する。
図10】ダークチャネル遺伝子から集計された組織スコアを使用する決定木分類器のROC曲線である。
図11】いくつかの実施形態による方法を示すフローチャートである。
図12A】ステージIIIのTCGA(癌ゲノムアトラス(Cancer Genome Atlas))FFPE(ホルマリン固定パラフィン包埋)組織RNA配列データの例示的なPCA(主成分分析)の散布図である。遺伝子発現レベルは、リード/100万でプロットされる。
図12B】TCGA PCA軸上に投影された、CCGA(循環無細胞ゲノムアトラス(Circulating Cell-free Genome Atlas))腫瘍組織RNA配列データの例示的結果を示す散布図である。遺伝子発現レベルは、リード/100万でプロットされる。
図12C】TCGA PCA軸上に投影されたCCGA癌無細胞RNA(cfRNA)RNA配列データの例示的結果を示す散布図である。遺伝子発現レベルは、リード/100万でプロットされる。
図13】例示的なダークチャネルバイオマーカー遺伝子のヒートマップである。各列は1つのcfRNA試料を示し、各行は1つの遺伝子を示す。列の色は、組織特異度をコードする(上から下に、組織は、それぞれ、乳房、肺、及び非特異的である)。列の色は、試料群をコード化している(左から右へ、癌のタイプは、それぞれ、肛門直腸、乳房、結腸直腸、肺、及び非癌である)。
図14A】異なる試料:HER2+、HR+/HER2-、トリプルネガティブ乳癌(TNBC)、又は非癌試料における2つの例示的な乳房ダークチャネルバイオマーカー(DCB)遺伝子(FABP7及びSCGB2A2)のcfRNA発現レベル及び組織発現レベルを示す箱型図である。
図14B】異なる試料:腺癌、小細胞肺癌、扁平上皮癌、又は非癌試料における4つの例示的な肺DCB遺伝子(SLC34A2、ROS1、SFTPA2、及びCXCL17)のcfRNA発現レベル及び組織発現レベルを示す箱型図である。
図15A】一致腫瘍組織を有する乳癌試料についての2つの乳房DCB遺伝子(FABP7及びSCGB2A2)の検出可能性を示すフォレストプロットである。試料IDは、無細胞DNA(cfDNA)(95%CI)中のそれらの相対腫瘍画分に基づいてプロットされる。FABP7は、試料4653、4088、2037、3116、及び1202において検出された。SCGB2A2は、試料1656、2419、3911、2367、2037、1039、2139、及び3162において検出された。cfDNA中の腫瘍画分を、cfDNA濃縮アッセイからのSNV対立遺伝子画分から測定した。
図15B】一致腫瘍組織を有する乳癌試料についての2つの乳房DCB遺伝子(FABP7及びSCGB2A2)の検出可能性を示すフォレストプロットである。試料IDは、腫瘍含量(腫瘍画分腫瘍組織発現)の関数としてプロットされる。FABP7は、試料4088、1202、3116、及び2037において検出された。SCGB2A2は、試料1656、2419、2367、3911、1039、2139、3162、及び2037において検出された。cfDNA中の腫瘍画分を、cfDNA濃縮アッセイからのSNV対立遺伝子画分から測定した。組織発現を、一致腫瘍組織のRNA配列データから測定した。
図16A】乳癌、肺癌を有するか、又は癌を有さない(正常)対象についての、示された遺伝子についてのcfRNA及び対応する組織におけるDCB遺伝子発現についての例示的なシーケンシング結果を示す。リードカウント数は、y軸上に表される。
図16B】乳癌、肺癌を有するか、又は癌を有さない(正常)対象についての、示された遺伝子についてのcfRNA及び対応する組織におけるDCB遺伝子発現についての例示的なシーケンシング結果を示す。リードカウント数は、y軸上に表される。
図16C】乳癌、肺癌を有するか、又は癌を有さない(正常)対象についての、示された遺伝子についてのcfRNA及び対応する組織におけるDCB遺伝子発現についての例示的なシーケンシング結果を示す。リードカウント数は、y軸上に表される。
図16D】乳癌、肺癌を有するか、又は癌を有さない(正常)対象についての、示された遺伝子についてのcfRNA及び対応する組織におけるDCB遺伝子発現についての例示的なシーケンシング結果を示す。リードカウント数は、y軸上に表される。
図17A】例示的な分類器ワークフローを示す。
図17B】例示的な分類器ワークフローを示す。
図18A】例示的な分類スキームの感度及び特異度を示すROCプロットを示す。
図18B】例示的な分類スキームの感度及び特異度を示すROCプロットを示す。
図18C】例示的な分類スキームの感度及び特異度を示すROCプロットを示す。
図19】本発明の一実施形態による試料処理及びパラメータ決定方法を示す。
図20A】一実施形態による選択された乳房及び肺特異的バイオマーカーの分布を示し、乳癌及び肺癌由来(それぞれ)cfRNA対非癌由来cfRNAにおけるシグナルの増加を示す。全トランスクリプトーム試料を、乳癌、肺癌、及び非癌CCGA参加者のcfRNAから調製した。
図20B】一実施形態による選択された乳房及び肺特異的バイオマーカーの分布を示し、乳癌及び肺癌由来(それぞれ)cfRNA対非癌由来cfRNAにおけるシグナルの増加を示す。全トランスクリプトーム試料を、乳癌、肺癌、及び非癌CCGA参加者のcfRNAから調製した。
図21】全トランスクリプトームCCGA乳癌試料からの一致血漿及び組織遺伝子発現を示す。結果が示すように、組織における高い発現は、血漿への高い伝搬速度を必ずしも生じ得ない。
図22】CCGA血漿中のダークチャネル発現が乳癌についてのCCGA腫瘍組織発現と相関することを示す散布図である。ここで、0の平均血漿又は組織発現を有する遺伝子を、可視化目的のために1e-4に変換する。
図23】CCGA血漿中のダークチャネル発現が肺癌についてのCCGA腫瘍組織発現と相関することを示す散布図である。ここで、0の平均血漿又は組織発現を有する遺伝子を、可視化目的のために1e-4に変換する。
図24】CCGA血漿試料中の腫瘍特異的マーカーを示すグラフである。血漿対数オッズ比を、全ての癌血漿から全ての非癌血漿への観察に基づいて各遺伝子について計算した。示される遺伝子は、例示的なダークチャネルバイオマーカーを示す。
図25】供給源及び特定方法によってグループ分けされた表15のcfRNAバイオマーカーの分布を示すベン図である。図中の全てのグループ分けに存在する38のバイオマーカーを表14に提供する。遺伝子は、バイナリ検出のために最適化するために、及び起源組織(TOO)のために最適化するためにフィルタリングされる。バイナリ検出の最適化のためにフィルタリングされた遺伝子は、対数オッズ比>0.1でCCGA血漿において観察され、高いTCGA発現(>5RPM)を有する遺伝子は乳癌及び肺癌において観察された。TOOの最適化のためにフィルタリングされた遺伝子は、TCGA組織からマルチクラスランダムフォレスト法によって選択された遺伝子、及びヒトタンパク質アトラス(Human Protein Atlas)において乳房/肺腫瘍又は組織特異的としてアノテーションされた遺伝子であった。
図26A】ある実施形態による、非癌対象と比較した、乳癌及び/又は肺癌において検出された選択されたバイオマーカーのレベルを示す。結果は、乳癌及び/又は肺癌由来(それぞれ)cfRNA対非癌由来cfRNAにおいて増加したシグナルを示す。全トランスクリプトーム試料を、乳癌、肺癌、及び非癌CCGA参加者のcfRNAから調製した。
図26B】ある実施形態による、非癌対象と比較した、乳癌及び/又は肺癌において検出された選択されたバイオマーカーのレベルを示す。結果は、乳癌及び/又は肺癌由来(それぞれ)cfRNA対非癌由来cfRNAにおいて増加したシグナルを示す。全トランスクリプトーム試料を、乳癌、肺癌、及び非癌CCGA参加者のcfRNAから調製した。
図26C】ある実施形態による、非癌対象と比較した、乳癌及び/又は肺癌において検出された選択されたバイオマーカーのレベルを示す。結果は、乳癌及び/又は肺癌由来(それぞれ)cfRNA対非癌由来cfRNAにおいて増加したシグナルを示す。全トランスクリプトーム試料を、乳癌、肺癌、及び非癌CCGA参加者のcfRNAから調製した。
図26D】ある実施形態による、非癌対象と比較した、乳癌及び/又は肺癌において検出された選択されたバイオマーカーのレベルを示す。結果は、乳癌及び/又は肺癌由来(それぞれ)cfRNA対非癌由来cfRNAにおいて増加したシグナルを示す。全トランスクリプトーム試料を、乳癌、肺癌、及び非癌CCGA参加者のcfRNAから調製した。
図27A】非癌対象と比較した、乳癌対象の血漿中で検出された選択されたポリペプチドバイオマーカーのレベルを示す。結果は、乳癌由来対非癌由来の血漿試料中のタンパク質の正規化カウントを示す。検出されたポリペプチドのレベルは、近接伸長アッセイ(PEA)を使用して判定した。図27Aは、乳癌由来血漿試料対非癌由来血漿試料におけるポリペプチドバイオマーカーのレベルを示す。
図27B】非癌対象と比較した、乳癌対象の血漿中で検出された選択されたポリペプチドバイオマーカーのレベルを示す。結果は、乳癌由来対非癌由来の血漿試料中のタンパク質の正規化カウントを示す。検出されたポリペプチドのレベルは、近接伸長アッセイ(PEA)を使用して判定した。図27Bは、異なるコホートにわたる選択されたポリペプチドバイオマーカーのレベルを示す。
図27C】非癌対象と比較した、乳癌対象の血漿中で検出された選択されたポリペプチドバイオマーカーのレベルを示す。結果は、乳癌由来対非癌由来の血漿試料中のタンパク質の正規化カウントを示す。検出されたポリペプチドのレベルは、近接伸長アッセイ(PEA)を使用して判定した。図27Cは、乳癌由来、肺癌由来、及び非癌由来の血漿試料におけるポリペプチドバイオマーカーのレベルを示す。
図28A】非癌対象と比較した、肺癌対象の血漿中で検出された選択されたポリペプチドバイオマーカーのレベルを示す。結果は、肺癌由来対非癌由来の血漿試料におけるタンパク質の正規化カウントを示す。図28Aは、肺癌由来対非癌由来の血漿試料におけるポリペプチドバイオマーカーのレベルを示す。
図28B】非癌対象と比較した、肺癌対象の血漿中で検出された選択されたポリペプチドバイオマーカーのレベルを示す。結果は、肺癌由来対非癌由来の血漿試料におけるタンパク質の正規化カウントを示す。図28Bは、低シグナル肺癌由来血漿試料を非癌由来血漿試料から区別する際の性能の駆動因子として特定されたポリペプチドバイオマーカーのレベルを示す。
図28C】非癌対象と比較した、肺癌対象の血漿中で検出された選択されたポリペプチドバイオマーカーのレベルを示す。結果は、肺癌由来対非癌由来の血漿試料におけるタンパク質の正規化カウントを示す。図28Cは、異なるコホートにわたる選択されたポリペプチドバイオマーカーのレベルを示す。
【発明を実施するための形態】
【0011】
本発明をより詳細に説明する前に、本発明は、説明される特定の実施形態に限定されず、したがって、当然ながら、変動し得ることを理解されたい。本発明の範囲は添付の特許請求の範囲によってのみ限定されるため、本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、限定することを意図していないことも理解されたい。
【0012】
値の範囲が提供される場合、その範囲の上限と下限との間の下限の単位の10分の1までの各介在値、及びその述べられた範囲内の任意の他の述べられた値又は介在値、並びにその範囲の提供された終点のそれぞれが、本発明内に包含されることが理解される。これらのより小さい範囲の上限及び下限は、本発明に包含されるより小さい範囲内に独立して含まれてもよく、記載された範囲内の任意の具体的に除外された限界に従う。
【0013】
特段の規定がない限り、本明細書で用いられる科学技術用語は、本発明が属する技術分野における当業者が一般に理解するものと同じ意味を有する。Singletonら、Dictionary of Microbiology and Molecular Biology、第2版、J.Wiley&Sons(ニューヨーク州ニューヨーク、1994年)は、本出願において使用される用語の多くに対する一般的なガイドを当業者に提供し、以下も同様であり、これらの各々は、参照により全体を本明細書に組み込む:Kornberg及びBaker、DNA Replication、第2版、(W.H.Freeman、ニューヨーク、1992年);Lehninger,Biochemistry第2版(Worth Publishers、ニューヨーク、1975年);Strachan及びRead、Human Molecular Genetics第2版(Wiley-Liss,ニューヨーク、1999年);Abbasら、Cellular and Molecular Immunology第6版(Saunders、2007年)。
【0014】
本明細書で言及される全ての刊行物は、刊行物が引用される方法及び/又は材料を開示及び記載するために、参照により本明細書に明示的に組み込まれる。
【0015】
用語「ポリヌクレオチド」、「核酸」、及び「オリゴヌクレオチド」は、互換的に使用される。それらは、任意の長さのヌクレオチドのポリマー形態(デオキシリボヌクレオチド若しくはリボヌクレオチドのいずれか、又はそれらの類似体)を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知又は未知の任意の機能を果たし得る。以下は、ポリヌクレオチドの非限定的な例である:遺伝子又は遺伝子断片のコード領域又は非コード領域、連鎖解析から定義される遺伝子座(locus)、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離DNA、任意の配列の単離RNA、核酸プローブ、及びプライマー。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体などの1つ以上の修飾ヌクレオチドを含み得る。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリの前又は後に付与され得る。ヌクレオチドの配列は、非ヌクレオチド成分によって中断されてもよい。ポリヌクレオチドは、重合後に、標識成分とのコンジュゲーションなどによって更に修飾され得る。
【0016】
一般に、「標的ポリヌクレオチド」という用語は、その存在、量、及び/若しくはヌクレオチド配列、又はこれらのうちの1つ以上における変化が判定されることが望ましい標的配列を有する核酸分子の出発集団中の核酸分子又はポリヌクレオチドを指す。一般に、「標的配列」という用語は、核酸の一本鎖上の核酸配列を指す。標的配列は、遺伝子の一部、調節配列、ゲノムDNA、cDNA、mRNA、miRNA、rRNAを含むRNAなどであってもよい。標的配列は、試料由来の標的配列又は増幅反応の産物などの二次標的であり得る。標的ポリヌクレオチドによってコードされるポリペプチド又はその一部は、本明細書中で「標的ポリペプチド」と呼ばれる。標的ポリヌクレオチド及び標的ポリペプチドは、「標的分子」という用語に包含される。
【0017】
「マーカー」及び「バイオマーカー」という用語は、標的ポリヌクレオチド(例えば、遺伝子又はその特定可能な配列断片)、又はそれによってコードされるポリペプチドを指すために本明細書において互換的に使用され、その存在、レベル、又は濃度は、特定の生物学的状態(例えば、疾患状態、例えば、一般的な癌の存在、又は特定の癌型及び/若しくはステージ)に関連する。実施形態では、マーカーは、特定の遺伝子又はその一部によってコードされるポリペプチドである。実施形態では、マーカーは、特定の遺伝子のcfRNAであり、そのレベルの変化は、シーケンシングによって検出され得る。cfRNAバイオマーカーは、cfRNAが由来する遺伝子に関して本明細書で言及され得るが、遺伝子転写物全体の検出を必要としない。実施形態では、特定の遺伝子転写物の断片のみが検出される。実施形態では、特定の遺伝子の存在及び/又はレベルを検出することは、同じ「バイオマーカー」の一部として集合的にスコア化され得る、同じ遺伝子の転写物に由来する異なる配列断片(重複又は非重複)を含む1つ以上のcfRNA断片を検出することを含む。配列情報(例えば、DNA、RNA、及びアミノ酸配列)、遺伝子記号によって一般に特定される遺伝子のフルネームなどを含む、列挙された遺伝子名称に関する更なる情報は、当業者に既知の公的にアクセス可能なデータベース、例えば、GenBank(www.ncbi.nlm.nih.gov/genbank/)及びNCBIタンパク質データベース(www.ncbi.nlm.nih.gov/protein/)を含むNational Center for Biotechnology Information(www.ncbi.nlm.nih.gov/)から入手可能なデータベース、並びにUniProt(www.uniprot.org)において入手可能である。
【0018】
本明細書で使用される「アンプリコン」という用語は、ポリヌクレオチド増幅反応の産物、すなわち、1つ以上の開始配列から複製される、一本鎖又は二本鎖であり得るポリヌクレオチドのクローン集団を意味する。1つ以上の開始配列は、同じ配列の1つ以上のコピーであり得るか、又は異なる配列の混合物であり得る。好ましくは、アンプリコンは単一の開始配列の増幅によって形成される。アンプリコンは、その産物が1つ以上の出発核酸又は標的核酸の複製物を含む種々の増幅反応によって生成され得る。一態様では、アンプリコンを生成する増幅反応は、反応物(ヌクレオチド又はオリゴヌクレオチドのいずれか)の塩基対形成が、反応産物の作製に必要とされるテンプレートポリヌクレオチド中に相補体を有するという点で、「テンプレート駆動型」である。一態様では、テンプレート駆動反応は、核酸ポリメラーゼによるプライマー伸長、又は核酸リガーゼによるオリゴヌクレオチドライゲーションである。このような反応としては、ポリメラーゼ連鎖反応(PCR)、線形ポリメラーゼ反応、塩基配列に基づく増幅(NASBAs)、ローリングサークル増幅などが挙げられるが、これらに限定されず、これらは以下の文献に開示されており、これらの文献の各々は、参照によりその全体が本明細書に組み込まれる:Mullisら、米国特許第4683195号;同第4965188号;同第4683202号;同第4800159号(PCR);Gelfandら、米国特許第5210015号(「taqman」プローブを用いるリアルタイムPCR);Wittwerら、米国特許第6,174670号;Kacianら、米国特許第5399491号(「NASBA」);Lizardi、米国特許第5854033号;Aonoら、日本特許公開特開平4-262799号公報(ローリングサークル増幅);などである。一態様では、本発明のアンプリコンは、PCRによって生成される。増幅反応は、増幅反応が進行するにつれて反応産物が測定されることを可能にする検出化学が利用可能である場合、「リアルタイム」増幅、例えば、Leoneら、Nucleic Acids Research,26:2150-2155(1998年)及び類似の参考文献に記載されるような「リアルタイムPCR」又は「リアルタイムNASBA」)であり得る。
【0019】
「増幅する」という用語は、増幅反応を実行することを意味する。「反応混合物」は、反応を実行するために必要な全ての反応物を含有する溶液を意味し、反応中に選択されたレベルでpHを維持するための緩衝剤、塩、補因子、スカベンジャーなどを含んでもよいが、これらに限定されない。
【0020】
本明細書において互換的に使用される用語「断片」又は「セグメント」は、より大きな分子の一部を指す。例えば、ポリヌクレオチドは、例えば、生体試料内に天然に存在し得るcfDNA断片の場合のように、天然プロセスを介して、又はインビトロ操作を介して、複数のセグメントに分解又は断片化することができる。核酸を断片化する様々な方法が当技術分野で周知である。これらの方法は、例えば、本質的に化学的又は物理的又は酵素的のいずれかであり得る。酵素的断片化は、DNアーゼによる部分分解;酸による部分的に脱プリン化;制限酵素の使用;イントロンコードエンドヌクレアーゼ;切断剤を核酸分子中の特定の位置に局在化させるために核酸セグメントの特異的ハイブリダイゼーションに依存する、三重鎖及びハイブリッド形成法などのDNAベースの切断法;又は既知若しくは未知の位置でポリヌクレオチドを切断する他の酵素若しくは化合物を含み得る。物理的断片化方法は、ポリヌクレオチドを高せん断速度に供することを含み得る。高せん断速度は、例えば、ピット又はスパイクを有するチャンバ又はチャネルを通してDNAを移動させることによって、又は制限されたサイズの流路、例えば、ミクロン又はサブミクロン範囲の断面寸法を有する開口を通してDNA試料を押し進めることによって、生成され得る。他の物理的方法としては、超音波処理及び噴霧化が挙げられる。熱及びイオン媒介加水分解による断片化などの物理的及び化学的断片化方法の組合せも同様に使用することができる。例えば、Sambrookら、「Molecular Cloning:A Laboratory Manual」、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、ニューヨーク(2001年)(Sambrookら)を参照。これらの方法は、核酸を、選択されたサイズ範囲のフラグメントに消化するように最適化され得る。
【0021】
本明細書において互換的に使用される「ポリメラーゼ連鎖反応」又は「PCR」という用語は、DNAの相補鎖の同時プライマー伸長による特定のDNA配列のインビトロ増幅のための反応を意味する。言い換えれば、PCRは、プライマー結合部位に隣接する標的核酸の複数のコピー又は複製物を作製するための反応であり、そのような反応は、以下の工程:(i)標的核酸を変性させる工程、(ii)プライマーをプライマー結合部位にアニールさせる工程、及び(iii)ヌクレオシド三リン酸の存在下で核酸ポリメラーゼによってプライマーを伸長させる工程を含む。通常、反応は、サーマルサイクラー機器において、各工程について最適化された異なる温度を通して循環される。特定の温度、各工程での持続時間、及び工程間の変化率は、当業者に周知の多くの因子に依存し、例えば、以下の参考文献によって例示される:McPhersonら編、PCR:A Practical Approach及びPCR2:A Practical Approach(それぞれ、IRL Press、Oxford、1991年及び1995年)。例えば、Taq DNAポリメラーゼを使用する従来のPCRにおいて、二本鎖標的核酸は>90℃の温度で変性され得、プライマーは50~75℃の範囲の温度でアニールされ得、そしてプライマーは72~78℃の範囲の温度で伸長され得る。「PCR」という用語は、RT-PCR、リアルタイムPCR、ネステッドPCR、定量的PCR、マルチプレックスPCRなどを含むがこれらに限定されない、反応の派生形態を包含する。使用されるPCRの特定の形式は、適用の文脈から当業者によって認識される。反応量は、数百ナノリットル(例えば、200nL)から数百μL(例えば、200μL)の範囲であり得る。「逆転写PCR」又は「RT-PCR」は、標的RNAを相補的一本鎖DNAに変換し、次いで増幅される逆転写反応が先行するPCRを意味し、その例は、Tecottら、米国特許第5168038号に記載されており、その開示は参照によりその全体が本明細書に組み込まれる。「リアルタイムPCR」は、反応産物、すなわち、アンプリコンの量が、反応が進行するにつれてモニタリングされるPCRを意味する。反応産物をモニタリングするために使用される検出化学において主に異なる多くの形態のリアルタイムPCRが存在し、例えば、Gelfandら、米国特許第5210015号(「taqman」);Wittwerら、米国特許第6174670号及び同第6569627号(挿入色素);Tyagiら、米国特許第5925517号(分子ビーコン);これらの開示は、参照によりその全体が本明細書に組み込まれる。リアルタイムPCRのための検出化学は、Mackayら、Nucleic Acids Research,30:1292-1305(2002年)に概説されており、これも参照により本明細書に組み入れられる。「ネステッドPCR」は、2段階PCRを意味し、ここで、第1のPCRのアンプリコンは、プライマーの新しいセットを使用する第2のPCRのための試料となり、プライマーの少なくとも1つは、第1のアンプリコンの内部位置に結合する。本明細書中で使用される場合、ネステッド増幅反応に関する「初期プライマー」は、第1のアンプリコンを生成するために使用されるプライマーを意味し、「二次プライマー」は、第2のアンプリコン又はネステッドアンプリコンを生成するために使用される1つ以上のプライマーを意味する。「非対称PCR」は、反応が主に標的核酸の2つの鎖のうちの1つが優先的にコピーされる線形増幅であるように、使用される2つのプライマーのうちの1つが非常に過剰な濃度であるPCRを意味する。非対称PCRプライマーの過剰濃度は、濃度比として表され得る。典型的な比は、10~100の範囲である。「多重PCR」は、複数の標的配列(又は単一の標的配列及び1つ以上の参照配列)が同じ反応混合物中で同時に行われるPCRを意味する、例えば、Bernardら、Anal.,273:221-228(1999年)(2色リアルタイムPCR)。通常、増幅される各配列に対して別個のプライマーセットが使用される。典型的には、多重PCRにおける標的配列の数は、2~50、又は2~40、又は2~30の範囲である。「定量的PCR」は、試料又は標本中の1つ以上の特異的標的配列の存在量を測定するように設計されたPCRを意味する。定量的PCRは、このような標的配列の絶対的定量及び相対的定量の両方を含む。定量的測定は、標的配列と別々に又は一緒にアッセイされ得る1つ以上の参照配列又は内部標準を使用して行われる。参照配列は、試料又は標本に対して内因性又は外因性であってもよく、後者の場合、1つ以上の競合テンプレートを含み得る。典型的な内因性参照配列は、以下の遺伝子の転写物のセグメントを含む:β-アクチン、GAPDH、β-ミクログロブリン、リボソームRNAなど。定量的PCRのための技術は、参照により全体が本明細書に組み込まれる以下の参考文献に例示されるように、当業者に周知である:Freemanら、Biotechniques、26:112-126(1999年)。Becker-Andreら、Nucleic Acids Research、17:9437-9447(1989);Zimmermanら、Biotechniques,21:268-279(1996);Diviaccoら、Gene、122:3013-3020(1992);及びBecker-Andreら、Nucleic Acids Research、17:9437-9446(1989年)。
【0022】
本明細書中で使用される場合、用語「プライマー」は、ポリヌクレオチドテンプレートと二重鎖を形成する際に、核酸合成の開始点として作用し得、そして伸長された二重鎖が形成されるようにテンプレートに沿ってその3’末端から伸長され得る、天然又は合成のいずれかのオリゴヌクレオチドを意味する。プライマーの伸長は、通常、核酸ポリメラーゼ(例えば、DNAポリメラーゼ又はRNAポリメラーゼ)を用いて行われる。伸長プロセスにおいて付加されるヌクレオチドの配列は、テンプレートポリヌクレオチドの配列によって判定される。通常、プライマーは、DNAポリメラーゼによって伸長される。プライマーは、通常、14~40ヌクレオチドの範囲、又は18~36ヌクレオチドの範囲の長さを有する。プライマーは、種々の核酸増幅反応(例えば、単一プライマーを使用する線形増幅反応、又は2つ以上のプライマーを使用するポリメラーゼ連鎖反応)において使用される。特定の適用のためのプライマーの長さ及び配列を選択するためのガイダンスは、その全体が本明細書中に参考として援用される以下の参考文献によって証明されるように、当業者に周知である:Dieffenbach編、PCR Primer:A Laboratory Manual、第2版(Cold Spring Harbor Press、ニューヨーク、2003年)。
【0023】
「ポリペプチド」、「ペプチド」、及び「タンパク質」という用語は、本明細書において互換的に使用され、任意の長さのアミノ酸のポリマーを指す。これらの用語は、修飾されたアミノ酸ポリマー;例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、又は標識成分とのコンジュゲーションなどの任意の他の操作も包含する。本明細書中で使用される場合、「アミノ酸」という用語は、グリシン及びD光学異性体又はL光学異性体の両方、並びにアミノ酸類似体及びペプチド模倣物を含む、天然アミノ酸及び/又は非天然アミノ酸又は合成アミノ酸を含む。実施形態では、ポリペプチドは、標的ポリヌクレオチド又はその一部によってコードされる。
【0024】
「対象」及び「患者」という用語は、本明細書において互換的に使用され、例えば癌などの医学的状態又は障害を有するか、又は潜在的に有することが知られているヒト又は非ヒト動物を指す。
【0025】
本明細書で使用される「配列リード」という用語は、対象から得られた試料からの核酸分子の一部又は全部からの一連のヌクレオチドを指す。配列リードは、核酸断片から配列決定された一連の短いヌクレオチド(例えば、20~150)、核酸断片の一端若しくは両端の一連の短いヌクレオチド、又は生体試料中に存在する核酸断片全体のシーケンシングであってもよい。配列リードは、当技術分野で既知の様々な方法によって得ることができる。例えば、配列リードは、様々な方法で、例えば、シーケンシング技法を使用して、又は例えばハイブリダイゼーションアレイ若しくは捕捉プローブにおけるプローブを使用して、又は単一プライマー若しくは等温増幅を使用するポリメラーゼ連鎖反応(PCR)若しくは線形増幅などの増幅技法を使用して取得され得る。
【0026】
本明細書で使用される「リードセグメント」又は「リード」という用語は、対象から得られた配列リードを含む任意のヌクレオチド配列、及び/又は試料からの初期配列リードに由来するヌクレオチド配列を指す。例えば、リードセグメントは、アライメントされた配列リード、折り畳まれた配列リード、又はステッチされたリードを指すことができる。更に、リードセグメントは、単一ヌクレオチド変異体などの個々のヌクレオチド塩基を指すことができる。
【0027】
本明細書で使用される「濃縮する」という用語は、試料中の1つ以上の標的核酸の割合を増加させることを意味する。したがって、「濃縮された」試料又はシーケンシングライブラリは、1つ以上の標的核酸の割合が試料中の非標的核酸に対して増加している試料又はシーケンシングライブラリである。
【0028】
一般に、ポリヌクレオチドに適用される「無細胞」、「循環」、及び「細胞外」という用語(例えば、「無細胞RNA」及び「無細胞DNA」)は、最初に収集された試料に溶解工程を適用することなく(例えば、細胞又はウイルスからの抽出のための溶解におけるように)単離又は他の方法で操作することができる対象又はその一部からの試料中に存在するポリヌクレオチドを指すために互換的に使用される。したがって、無細胞ポリヌクレオチドは、対象の試料が収集される前であっても、それらが由来する細胞又はウイルスから被包されていないか、又は「遊離」している。無細胞ポリヌクレオチドは、細胞死(例えば、アポトーシス又は壊死)又は細胞脱落の副産物として産生され得、周囲の体液又は循環にポリヌクレオチドを放出する。したがって、無細胞ポリヌクレオチドは、血液の非細胞分画(例えば、血清又は血漿)から、他の体液(例えば、尿)から、又は他のタイプの試料の非細胞分画から単離することができる。「無細胞RNA」又は「cfRNA」という用語は、対象の体内(例えば、血流)を循環し、1つ以上の健常細胞及び/又は1つ以上の癌細胞に由来し得るリボ核酸断片を指す。同様に、「無細胞DNA」又は「cfDNA」は、対象の体内(例えば、血流)を循環し、1つ以上の健常細胞及び/又は1つ以上の癌細胞に由来し得るデオキシリボ核酸分子を指す。
【0029】
「循環腫瘍RNA」又は「ctRNA」という用語は、腫瘍細胞又は他のタイプの癌細胞に由来するリボ核酸断片を指し、死滅細胞のアポトーシス又は壊死などの生物学的プロセスの結果として対象の体内(例えば、血流)に放出され得るか、又は生存腫瘍細胞によって能動的に放出され得る。
【0030】
本明細書で使用される「ダークチャネルRNA」又は「ダークチャネルcfRNA分子」又は「ダークチャネル遺伝子」という用語は、健常細胞における発現が非常に低いか又は存在しないRNA分子又は遺伝子を指す。したがって、ダークチャネルRNA(cfRNA)分子の特定、検出、及び/又は定量化は、癌などの疾患状態の評価において、シグナル対ノイズを改善し、感度及び特異度を改善する。
【0031】
本明細書で使用される「治療すること」又は「治療」は、臨床結果を含む、対象の状態において有益な又は所望の結果を得るための任意のアプローチを含む。有益な又は所望の臨床結果としては、限定されないが、1つ以上の症状又は状態の緩和又は改善、疾患の程度の縮小、疾患の状態の安定化(すなわち、悪化させない)、疾患の伝染又は拡散の予防、疾患進行の遅延又は緩徐化、疾患状態の改善又は緩和、疾患の再発の減少、並びに寛解(部分的であれ全体的であれ、検出可能であれ検出不可能であれ)。言い換えれば、本明細書で使用される「治療」は、疾患の任意の治癒、改善、又は予防を含む。治療は、疾患の発生を予防し、疾患の拡散を抑制し、疾患の症状を軽減し、疾患の根本的な原因を完全に若しくは部分的に除去し、疾患の持続期間を短縮し、又はこれらのことの組合せを行い得る。
【0032】
本明細書で使用される「治療すること」及び「治療」は、予防的治療を含む。治療方法は、治療有効量の活性薬剤を対象に投与することを含む。投与工程は、単回投与からなり得るか、又は一連の投与を含み得る。治療期間の長さは、状態の重症度、患者の年齢、活性剤の濃度、治療に使用される組成物の活性、又はそれらの組合せなどの様々な要因に依存する。治療又は予防のために使用される薬剤の有効投薬量は、特定の治療又は予防レジメンの経過にわたって増加又は減少し得ることも理解される。投与量の変化は、当該技術分野で既知の標準的な診断アッセイによって生じ、自明となり得る。場合によっては、長期投与が必要な場合もある。例えば、組成物は、患者を治療するのに十分な量及び持続時間で対象に投与される。実施形態では、治療すること又は治療は、予防的治療ではない。
【0033】
「予防する」という用語は、対象の疾患又は状態に関して、対象における1つ以上の対応する症状の発生の減少を指す。上記に示したように、予防は、完全(検出可能な症状がない)であってもよいし、治療が行われない場合に起こる可能性があるよりも少ない症状が観察され、及び/又は発生率が低いように部分的であってもよい。
【0034】
「抗癌剤」及び「抗癌剤」は、それらの明白な通常の意味に従って使用され、抗腫瘍特性又は細胞の成長若しくは増殖を阻害する能力を有する組成物(例えば、化合物、薬物、アンタゴニスト、阻害剤、調節剤)を指す。いくつかの実施形態では、抗癌剤は化学療法剤である。いくつかの実施形態では、抗癌剤は、癌を治療する方法において有用性を有する、本明細書において特定される薬剤である。いくつかの実施形態では、抗癌剤は、癌を治療するために、FDA又は米国以外の国の同様の規制機関によって承認された薬剤である。抗がん剤の例には、限定するものではないが、以下が含まれる:MEK(例えば、MEK1、MEK2、又はMEK1及びMEK2)阻害剤(例えば、XL518、CI-1040、PD035901、セルメチニブ/AZD6244、GSK1120212/トラメチニブ、GDC-0973、ARRY-162、ARRY-300、AZD8330、PD0325901、U0126、PD98059、TAK-733、PD318088、AS703026、BAY869766)、アルキル化剤(例えば、シクロホスファミド、イホスファミド、クロラムブシル、ブスルファン、メルファラン、メクロレタミン、ウラムスチン、チオテパ、ニトロソ尿素、ナイトロジェンマスタード(例えば、メクロロエタミン、シクロホスファミド、クロラムブシル、マイファラン)、エチレンイミン及びメチルメラミン(例えば、ヘキサメチルメラミン、チオテパ)、スルホン酸アルキル(例えば、ブスルファン)、ニトロソ尿素(例えば、カルムスチン、ロムシチン、セムスチン、ストレプトゾシン)、トリアゼン(デカルバジン)、代謝拮抗物質(例えば、5-アザチオプリン、ロイコボリン、カペシタビン、フルダラビン、ゲムシタビン、ペメトレキセド、ラルチトレキセド、葉酸類似体(例えば、メトトレキサート)又はピリミジン類似体(例えば、フルオロウラシル、フロキソウリジン、シタラビン)、プリン類似体(例えば、メルカプトプリン、チオグアニン、ペントスタチンなど)、植物アルカロイド(例えば、ビンクリスチン、ビンブラスチン、ビノレルビン、ビンデシン、ポドフィロトキシン、パクリタキセル、ドセタキセルなど)、トポイソメラーゼ阻害剤(例えば、イリノテカン、トポテカン、アムサクリン、エトポシド(VP16)、リン酸エトポシド、テニポシドなど)、抗腫瘍抗生物質(例えば、ドキソルビシン、アドリアマイシン、ダウノルビシン、エピルビシン、アクチノマイシン、ブレオマイシン、マイトマイシン、ミトキサントロン、プリカマイシンなど)、白金系化合物(例えば、シスプラチン、オキサロプラチン、カルボプラチン)、アントラセンジオン(例えば、ミトキサントロン)、置換尿素(例えば、ヒドロキシ尿素)、メチルヒドラジン誘導体(例えば、プロカルバジン)、副腎皮質抑制剤(例えば、ミトタン、アミノグルテチミド)、エピポドフィロトキシン(例えば、エトポシド)、抗生物質(例えば、ダウノルビシン、ドキソルビシン、ブレオマイシン)、酵素(例えば、L-アスパラギナーゼ)、マイトジェン活性化タンパク質キナーゼシグナル伝達の阻害剤(例えば、U0126、PD98059、PD184352、PD0325901、ARRY-142886、SB239063、SP600125、BAY43-9006、ウォルトマンニン、又はLY294002、Syk阻害剤、mTOR阻害剤、抗体(例えば、リツキサン)、ゴシフェノール、ゲナセンス、ポリフェノールE、クロロフシン、全てのトランスレチノイン酸(ATRA)、ブリオスタチン、腫瘍壊死因子関連アポトーシス誘導リガンド(TRAIL)、5-アザ-2’-デオキシシチジン、全トランス型レチノイン酸、ドキソルビシン、ビンクリスチン、エトポシド、ゲムシタビン、イマチニブ(Gleevec.RTM.)、ゲルダナマイシン、17-N-アリルアミノ-17-デメトキシゲルダナマイシン(17-AAG)、フラボピリドール、LY294002、ボルテゾミブ、トラスツズマブ、BAY11-7082、PKC412、PD184352、20epi-1、25ジヒドロキシビタミンD3;5-エチニルウラシル;アビラテロン;アクラルビシン;アシルフルベン;アデシペノル;アドゼレシン;アルデスロイキン;ALL-TKアンタゴニスト;アルトレタミン;アンバムスチン;アミドックス;アミフォスチン;アミノレブリン酸;アムルビシン;アムサクリン;アナグレリド;アナストロゾール;アンドログラホリド;血管新生阻害剤;アンタゴニストD;アンタゴニストG;アンタレリクス;抗背側化形態形成タンパク質-1;抗アンドロゲン、前立腺癌;抗エストロゲン;抗腫瘍薬;アンチセンスオリゴヌクレオチド;アフィジコリングリシナート;アポトーシス遺伝子調節剤;アポトーシス調節因子;アプリン酸;ara-CDP-DL-PTBA;アルギニンデアミナーゼ;アスラクリン;アタメスタン;アトリムスチン;アキサスタチン1;アキサスタチン2;アキサスタチン3;アザセトロン;アザトキシン;アザチロシン;バッカチンIII誘導体;バラノール;バチマスタット;BCR/ABLアンタゴニスト;ベンゾクロリン;ベンゾイルスタウロスポリン;βラクタム誘導体;β-アレチン;ベタクラマイシンB;ベツリン酸;bFGF阻害剤;ビカルタミド;ビサントレン;ビスアジリジニルスペルミン;ビスナファイド;ビストラテンA;ビゼレシン;ブレフラート;ブロピリミン;ブドチタン;ブチオニンスルホキシミン;カルシポトリオール;カルホスチンC;カンプトテシン誘導体;カナリア痘IL-2;カペシタビン;カルボキサミド-アミノ-トリアゾール;カルボキシアミドトリアゾール;CaRest M3;CARN 700;軟骨由来阻害剤;カルゼレシン;カゼインキナーゼ阻害剤(ICOS);カスタノスペルミン;セクロピンB;セトロレリクス;クロリン;クロロキノキサリンスルホンアミド;シカプロスト;シス-ポルフィリン;クラドリビン;クロミフェン類似体;クロトリマゾール;コリスマイシンA;コリスマイシンB;コンブレタスタチンA4;コンブレタスタチン類似体;コナゲニン;クラムベシジン816;クリスナトール;クリプトフィシン8;クリプトフィシンA誘導体;クラシンA;シクロペントアントラキノン;シクロプラタム;シペマイシン;シタラビンオクホスファート;細胞溶解因子;サイトスタチン;ダクリキシマブ;デシタビン;デヒドロジデムニンB;デスロレリン;デキサメタゾン;デキシホスファミド;デクスラゾキサン;デクスベラパミル;ジアジコン;ジデムニンB;ジドックス;ジエチルノルスペルミン;ジヒドロ-5-アザシチジン;9-ジオキサマイシン;ジフェニルスピロムスチン;ドコサノール;ドラセトロン;ドキシフルリジン;ドロロキシフェン;ドロナビノール;デュオカルマイシンSA;エブセレン;エコムスチン;エデルフォシン;エドレコロマブ;エフロルニチン;エレメン;エミテフル;エピルビシン;エプリステリド;エストラムスチン類似体;エストロゲンアゴニスト;エストロゲンアンタゴニスト;エタニダゾール;リン酸エトポシド;エキセメスタン;ファドロゾール;ファザラビン;フェンレチニド;フィルグラスチム;フィナステリド;フラボピリドール;フレゼラスチン;フルアステロン;フルダラビン;塩酸フルオロダウノルニシン;ホルフェニメクス;ホルメスタン;ホストリエシン;フォテムスチン;ガドリニウムテキサフィリン;硝酸ガリウム;ガロシタビン;ガニレリクス;ゼラチナーゼ阻害剤;ゲムシタビン;グルタチオン阻害剤;ヘプスルファム;ヘレグリン;ヘキサメチレンビスアセトアミド;ヒペリシン;イバンドロン酸;イダルビシン;イドキシフェン;イドラマントン;イルモホシン;イロマスタット;イミダゾアクリドン;イミキモド;免疫刺激ペプチド;インスリン様成長因子-1受容体阻害剤;インターフェロンアゴニスト;インターフェロン;インターロイキン;イオベングアン;ヨードドキソルビシン;イボマノール、4-;イロプラクト;イルソグラジン;イソベンガゾール;イソホモハロコンドリンB;イタセトロン;ジャスプラキノリド;カハラリドF;ラメラリン-Nトリアセテート;ランレオチド;レイナマイシン;レノグラスチム;硫酸レンチナン;レプトルスタチン;レトロゾール;白血病阻害因子;白血球αインターフェロン;ロイプロリド+エストロゲン+プロゲステロン;リュープロレリン;レバミゾール;リアロゾール;直鎖ポリアミン類似体;親油性二糖ペプチド;親油性白金化合物;リソクリンアミド7;ロバプラチン;ロンブリシン;ロメトレキソール;ロニダミン;ロソキサントロン;ロバスタチン;ロキソリビン;ルルトテカン;ルテチウムテキサフィリン;リソフィリン;溶解ペプチド;マイタンシン;マンノスタチンA;マリマスタット;マソプロコール;マスピン;マトリライシン阻害剤;マトリックスメタロプロテイナーゼ阻害剤;メノガリル;メルバロン;メテルリン;メチオニナーゼ;メトクロプラミド;MIF阻害剤;ミフェプリストン;ミルテホシン;ミリモスチム;ミスマッチ二本鎖RNA;ミトグアゾン;ミトラクトール;マイトマイシン類似体;ミトナフィド;ミトトキシン線維芽細胞増殖因子-サポリン;ミトキサントロン;モファロテン;モルグラモスチム;モノクローナル抗体、ヒト絨毛性ゴナドトロピン;モノホスホリルリピドA+ミオバクテリウム細胞壁sk;モピダモール;多剤耐性遺伝子阻害剤;複数の腫瘍抑制因子1に基づく療法;マスタード抗癌剤;ミカペルオキシドB;マイコバクテリア細胞壁抽出物;ミリアポロン;N-アセチルジナリン;N-置換ベンズアミド;ナファレリン;ナグレスチップ;ナロキソン+ペンタゾシン;ナバビン;ナフトテルピン;ナルトグラスチム;ネダプラチン;ネモルビシン;ネリドロン酸;中性エンドペプチダーゼ;ニルタミド;ニサマイシン;一酸化窒素調節剤;ニトロキシド抗酸化剤;ニトルリン;O6-ベンジルグアニン;オクトレオチド;オキセノン;オリゴヌクレオチド;オナプリストン;オンダンセトロン;オンダンセトロン;オラシン;経口サイトカイン誘導剤;オルマプラチン;オサテロン;オキサリプラチン;オキサノマイシン;パラウアミン;パルミトイルリゾキシン;パミドロン酸;パナキシトリオール;パノミフェン;パラバクチン;パゼリプチン;ペガスパルガーゼ;ペルデシン;ペントサンポリ硫酸ナトリウム;ペントスタチン;ペントロゾール;ペルフルブロン;ペルホスファミド;ペリリルアルコール;フェナジノマイシン;フェニルアセテート;ホスファターゼ阻害剤;ピシバニール;塩酸ピロカルピン;ピラルビシン;ピリトレキシム;プラセチンA;プラセチンB;プラスミノゲン活性化阻害剤;白金錯体;白金化合物;白金-トリアミン錯体;ポルフィマーナトリウム;ポルフィロマイシン;プレドニゾン;プロピルビス-アクリドン;プロスタグランジンJ2;プロテアソーム阻害剤;タンパク質Aに基づく免疫調節剤;タンパク質キナーゼC阻害剤;タンパク質キナーゼC阻害剤、微細藻類;タンパク質チロシンホスファターゼ阻害剤;プリンヌクレオシドホスホリラーゼ阻害剤;プルプリン;ピラゾロアクリジン;ピリドキシル化ヘモグロビンポリオキシエチレンコンジュゲート;rafアンタゴニスト;ラルチトレキセド;ラモセトロン;rasファルネシルタンパク質トランスフェラーゼ阻害剤;ras阻害剤;ras-GAP阻害剤;脱メチル化レテエリプチン;レニウムRe186エチドロネート;リゾキシン;リボザイム;RIIレチナミド;ログレチミド;ロヒツキン;ロムルチド;ロキニメックス;ルビギノンB1;ルボキシル;サフィンゴール;サイトピン;SarCNU;サルコフィトールA;サルグラモスチム;Sdi 1模倣体;セムスチン;老化由来阻害剤1;センスオリゴヌクレオチド;シグナル伝達阻害剤;シグナル伝達調節剤;単鎖抗原結合タンパク質;シゾフィラン;ソブゾキサン;ボロカプテイトナトリウム;フェニル酢酸ナトリウム;ソルベロール;ソマトメジン結合タンパク質;ソネルミン;スパルフォシン酸;スピカマイシンD;スピロムスチン;スプレノペンチン;スポンギス
タチン1;スクアラミン;幹細胞阻害剤;幹細胞分裂阻害剤;スチピアミド;ストロメリシン阻害剤;スルフィノシン;超活性血管作用性腸管ペプチドアンタゴニスト;スラディスタ;スラミン;スワインソニン;合成グリコサミノグリカン;チアムスチン;タモキシフェンメチオジド;タウロムスチン;タザロテン;テコガランナトリウム;テガフール;テルラピリリウム;テロメラーゼ阻害剤;テモポルフィン;テモゾロマイド;テニポシド;テトラクロロデカオキシド;テトラゾミン;タリブラスチン;チオコラリン;トロンボポエチン;トロンボポエチン模倣体;チマルファシン;チモポイエチン受容体アゴニスト;チモトリン;甲状腺刺激ホルモン;スズエチルエチオプルプリン;チラパザミン;二塩化チタノセン;トプセンチン;トレミフェン;分化全能性幹細胞因子;翻訳阻害剤;トレチノイン;トリアセチルウリジン;トリシリビン;トリメトレキサート;トリプトレリン;トロピセトロン;ツロステリド;チロシンキナーゼ阻害剤;チルホスチン;UBC阻害剤;ウベニメクス;尿生殖洞由来成長阻害因子;ウロキナーゼ受容体アンタゴニスト;バプレオチド;バリオリンB;ベクター系、赤血球遺伝子治療;ベラレゾール;ベラミン;ベルジン;ベルテポルフィン;ビノレルビン;ビンキサルチン;ビタキシン;ボロゾール;ザノテロン;ゼニプラチン;ジラスコルブ;ジノスタチンスチマラマー、アドリアマイシン、ダクチノマイシン、ブレオマイシン、ビンブラスチン、シスプラチン、アシビシン;アクラルビシン;塩酸ピロカルピンアコダゾール;アクロニン;アドゼレシン;アルデスロイキン;アルトレタミン;アンボマイシン;酢酸アメタントロン;アミノグルテチミド;アムサクリン;アナストロゾール;アントラマイシン;アスパラギナーゼ;アスペルリン;アザシチジン;アゼテパ;アゾトマイシン;バチマスタット;ベンゾデパ;ビカルタミド;塩酸ビスアントレン;メシル酸ビスナフィド;ビゼレシン;硫酸ブレオマイシン;ブレキナルナトリウム;ブロピリミン;ブスルファン;カクチノマイシン;カルステロン;カラセミド;カルベチマー;カルボプラチン;カルムスチン;塩酸カルビシン;カルゼレシン;セデフィンゴル;クロラムブシル;シロレマイシン;クラドリビン;クリスナトールメシレート;シクロホスファミド;シタラビン;ダカルバジン;塩酸ダウノルビシン;デシタビン;デクソルマプラチン;デザグアニン;メシル酸デザグアニン;ジアジコン;ドキソルビシン;塩酸ドキソルビシン;ドロロキシフェン;クエン酸ドロロキシフェン;プロピオン酸ドロモスタノロン;デュアゾマイシン;エダトレキサート;塩酸エフロルニチン;エルサミトルシン;エンロプラチン;エンプロマート;エピプロピジン;塩酸エピルビシン;エルブロゾール;塩酸エソルビシン;エストラムスチン;リン酸エストラムスチンナトリウム;エタニダゾール;エトポシド;リン酸エトポシド;エトプリン;塩酸ファドロゾール;ファザラビン;フェンレチニド;フロクスウリジン;フルダラビンリン酸エステル;フルオロウラシル;フルオロシタビン;ホスキドン;ホストリエシンナトリウム;ゲムシタビン;塩酸ゲムシタビン;ヒドロキシ尿素;塩酸イダルビシン;イホスファミド;イイモホシン;インターロイキンI1(組換えインターロイキンII、又はrlL.sub.2を含む)、インターフェロンα-2a;インターフェロンα-2b;インターフェロンα-n1;インターフェロンα-n3;インターフェロンβ-1a;インターフェロンγ-1b;イプロプラチン;塩酸イリノテカン;酢酸ランレオチド;レトロゾール;酢酸ロイプロリド;塩酸リアロゾール;ロメトレキソールナトリウム;ロムスチン;塩酸ロソキサントロン;マソプロコール;メイタンシン;塩酸メクロレタミン;酢酸メゲストロール;酢酸メレンゲストロール;メルファラン;メノガリル;メルカプトプリン;メトトレキサート;メトトレキサートナトリウム;メトプリン;メツレデパ;ミチンドミド;ミトカルシン;ミトクロミン;マイトギリン;ミトマルシン;マイトマイシン;マイトスペル;ミトタン;塩酸ミトキサントロン;ミコフェノール酸;ノコダゾール;ノガラマイシン;オルマプラチン;オキシスラン;ペガスパルガーゼ;ペリオマイシン;ペンタムスチン;硫酸ペプロマイシン;ペルホスファミド;ピポブロマン;ピポスルファン;塩酸ピロキサントロン;プリカマイシン;プロメスタン;ポルフィマーナトリウム;ポルフィロマイシン;プレドニムスチン;塩酸プロカルバジン;ピューロマイシン;塩酸ピューロマイシン;ピラゾフリン;リボプリン;ログレチミド;サフィンゴール;塩酸サフィンゴール;セムスチン;シムトラゼン;スパルフォセート二ナトリウム;スパルソマイシン;塩酸スピロゲルマニウム;スピロムスチン;スピロプラチン;ストレプトニグリン;ストレプトゾシン;スロフェヌール;タリソマイシン;テコガランナトリウム;テガフール;テロキサントロン塩酸塩;テモポルフィン;テニポシド;テロキシロン;テストラクトン;チアミプリン;チオグアニン;チオテパ;チアゾフリン;チラパザミン;クエン酸トレミフェン;酢酸トレソロン;リン酸トリシリビン;トリメトレキサート;グルクロン酸トリメトレキサート;トリプトレリン;塩酸ツブロゾール;ウラシルマスタード;uredepa;バプレオチド;ベルテポルフィン;硫酸ビンブラスチン;硫酸ビンクリスチン;ビンデシン;硫酸ビンデシン;硫酸ビネピジン;硫酸ビングリシネート;硫酸ビンロイロシン;酒石酸ビノレルビン;硫酸ビンロシジン;硫酸ビンゾリジン;ボロゾール;ゼニプラチン;ジノスタチン;ドキソルビシン塩酸塩、G2-M期の細胞を停止させ、及び/又は微小管の形成又は安定性を調節する薬剤(例えば、Taxol.TM(すなわち、パクリタキセル)、タキソテール.TM、タキサン骨格を含む化合物、エルブロゾール(すなわち、R-55104)、ドラスタチン10(すなわち、DLS-10及びNSC-376128)、ミボブリンイセチオネート(すなわち、CI-980として)、ビンクリスチン、NSC-639829、ディスコデルモリド(すなわち、NVP-XX-A-296として)、ABT-751(Abbott、すなわち、E-7010)、オルトリルチン(例えば、オルトリルチンA及びオルトリルチンC)、スポンジスタチン(例えば、スポンジスタチン1、スポンジスタチン2、スポンジスタチン3、スポンジスタチン4、スポンジスタチン5、スポンジスタチン6、スポンジスタチン7、スポンジスタチン8、及びスポンジスタチン9)、セマドチン塩酸塩(すなわち、LU-103793及びNSC-D-669356)、エポチロン(例えば、エポチロンA、エポチロンB、エポチロンC(すなわち、デソキシエポチロンA又はdEpoA)、エポチロンD(すなわち、KOS-862、dEpoB、及びデソキシエポチロンB)、エポチロンE、エポチロンF、エポチロンBN-オキシド、エポチロンAN-オキシド、16-アザ-エポチロンB、21-アミノエポチロンB(すなわち、BMS-310705)、21-ヒドロキシエポチロンD(すなわち、デソキシエポチロンF及びdEpoF)、26-フルオロエポチロン、アウリスタチンPE(すなわち、NSC-654663)、ソブリドチン(すなわち、TZT-1027)、LS-4559-P(Pharmacia、すなわち、LS-4577)、LS-4578(Pharmacia、すなわち、LS-477-P)、LS-4477(Pharmacia)、LS-4559(Pharmacia)、RPR-112378(Aventis)、ビンクリスチン硫酸塩、DZ-3358(Daiichi)、FR-182877(Fujisawa、すなわち、WS-9885B)、GS-164(Takeda)、GS-198(Takeda)、KAR-2(Hungarian Academy of Sciences)、BSF-223651(BASF、すなわち、ILX-651及びLU-223651)、SAH-49960(Lilly/Novartis)、SDZ-268970(Lilly/Novartis)、AM-97(Armad/Kyowa Hakko)、AM-132(Armad)、AM-138(Armad/Kyowa Hakko)、IDN-5005(Indena)、クリプトフィシン52(すなわち、LY-355703)、AC-7739(Ajinomoto、すなわち、AVE-8063A及びCS-39HCl)、AC-7700(Ajinomoto、すなわち、AVE-8062、AVE-8062A、CS-39-L-Ser.HCl、及びRPR-258062A)、ビチレアミド、ツブリシンA、カナデンソール、セントレイジン(すなわち、NSC-106969)、T-138067(Tularik、すなわち、T-67、TL-138067及びTI-138067)、COBRA-1(Parker Hughes Institute、すなわち、DDE-261及びWHI-261)、H10(Kansas State University)、H16(Kansas State University)、オンコシジンA1(すなわち、BTO-956及びDIME)、DDE-313(Parker Hughes Institute)、フィジアノリドB、ラウリマライド、SPA-2(Parker Hughes Institute)、SPA-1(Parker Hughes Institute、すなわち、SPIKET-P)、3-IAABU(Cytoskeleton/Mt.Sinai School of Medicine、すなわち、MF-569)、ナルコシン(NSC-5366としても知られる)、ナスカピン、D-24851(Asta Medica)、A-105972(Abbott)、ヘミアスタリン、3-BAABU(Cytoskeleton/Mt.Sinai School of Medicine、すなわち、MF-191)、TMPN(Arizona State University)、バナドセンアセチルアセトネート、T-138026(Tularik)、モナストロール、イナノシン(すなわちNSC-698666)、3-IAABE(Cytoskeleton/Mt.Sinai School of Medicine)、A-204197(Abbott)、T-607(Tuiarik、すなわち、T-900607)、RPR-115781(Aventis)、エロイテロビン(例えば、デスメチルエロイテロビン、デスアエチルエロイテロビン、イソエロイテロビンA、及びZ-エロイテロビン)、カリベオシド、カリベオリン、ハリコンドリンB、D-64131(Asta Medica)、D-68144(Asta Medica)、ジアゾナミドA、A-293620(Abbott)、NPI-2350(Nereus)、タッカロノリドA、TUB-245(Aventis)、A-259754(Abbott)、ジオゾスタチン、(-)-フェニルアヒスチン(すなわち、NSCL-96F037)、D-68838(Asta Medica)、D-68836(Asta Medica)、ミオセベリンB、D-43411(Zentaris、すなわち、D-81862)、A-289099(Abbott)、A-318315(Abbott)、HTI-286(すなわち、SPA-110、トリフルオロ酢酸塩)(Wyeth)、D-82317(Zentaris)、D-82318(Zentaris)、SC-12983(NCI)、レスベラスタチンリン酸ナトリウム、BPR-OY-007(National Health Research Institutes)、及びSSR-250411(Sanofi))、ステロイド(例えば、デキサメタゾン)、フィナステリド、アロマターゼ阻害剤、ゴセレリン又はロイブロリドなどのゴナドトロビン放出ホルモンアゴニスト(GnRH)、副腎皮質ステロイド(例えば、プレドニゾン)、プロゲスチン(例えば、カプロン酸ヒドロキシプロゲステロン、酢酸メゲスト
ロール、酢酸メドロキシプロゲステロン)、エストロゲン(例えば、ジエチルスチルベストロール、エチニルエストラジオール)、抗エストロゲン(例えば、タモキシフェン)、アンドロゲン(例えば、プロピオン酸テストステロン、フルオキシメステロン)、抗アンドロゲン(例えば、フルタミド)、免疫刺激薬(例えば、無菌化ウシ型結核菌(BCG)、レバミゾール、インターロイキン-2、αインターフェロンなど)、モノクローナル抗体(例えば、抗CD20、抗HER2、抗CD52、抗HLA-DR、及び抗VEGFモノクローナル抗体)、免疫毒素(例えば、抗CD33モノクローナル抗体-カリケアマイシンコンジュゲート、抗CD22モノクローナル抗体-緑膿菌外毒素コンジュゲートなど)、放射免疫療法(例えば、111In、90Y、又は131Iなどにコンジュゲートされた抗CD20モノクローナル抗体)、トリプトリド、ホモハリングトニン、ダクチノマイシン、ドキソルビシン、エピルビシン、トポテカン、イトラコナゾール、ビンデシン、セリバスタチン、ビンクリスチン、デオキシアデノシン、セルトラリン、ピタバスタチン、イリノテカン、クロファジミン、5-ノニルオキシトリプタミン、ベムラフェニブ、ダブラフェニブ、エリロチニブ、ゲフィチニブ、EGFR阻害剤、上皮増殖因子受容体(EGFR)標的療法又は治療薬(例えば、ゲフィチニブ(Iressa(商標))、エルロチニブ(Tarceva(商標))、セツキシマブ(Erbitux(商標))、ラパチニブ(Tykerb(商標))、パニツムマブ(Vectibix(商標))、バンデタニブ(Caprelsa(商標))、アファチニブ/BIBW2992、CI-1033/カネルチニブ、ネラチニブ/HKI-272、CP-724714、TAK-285、AST-1306、ARRY334543、ARRY-380、AG-1478、ダコミチニブ/PF299804、OSI-420/デスメチルエルロチニブ、AZD8931、AEE788、ペリチニブ/EKB-569、CUDC-101、WZ8040、WZ4002、WZ3146、AG-490、XL647、PD153035、BMS-599626)、ソラフェニブ、イマチニブ、スニチニブ、ダサチニブなど。
【0035】
本明細書で使用される「エピジェネティック阻害剤」は、DNAメチル化(DNAメチル化阻害剤)又はヒストンの修飾(ヒストン修飾阻害剤)などのエピジェネティックプロセスの阻害剤を指す。エピジェネティック阻害剤は、ヒストンデアセチラーゼ(HDAC)阻害剤、DNAメチルトランスフェラーゼ(DNMT)阻害剤、ヒストンメチルトランスフェラーゼ(HMT)阻害剤、ヒストンデメチラーゼ(HDM)阻害剤、又はヒストンアセチルトランスフェラーゼ(HAT)であり得る。HDAC阻害剤の例としては、ボリノスタット、ロミデプシン、CI-994、ベリノスタット、パノビノスタット、ギビノスタット、エンチノスタット、モセチノスタット、SRT501、CUDC-101、JNJ-26481585、又はPCI24781が挙げられる。DNMT阻害剤の例としては、アザシチジン及びデシタビンが挙げられる。HMT阻害剤の例としては、EPZ-5676が挙げられる。HDM阻害剤の例としては、パルギリン及びトラニルシプロミンが挙げられる。HAT阻害剤の例としては、CCT077791及びガルシノールが挙げられる。
【0036】
「マルチキナーゼ阻害剤」は、チロシンタンパク質キナーゼ及びセリン/スレオニンキナーゼを含む少なくとも1つのタンパク質キナーゼの小分子阻害剤である。マルチキナーゼ阻害剤は、単一キナーゼ阻害剤を含んでもよい。マルチキナーゼ阻害剤は、リン酸化を遮断し得る。マルチキナーゼ阻害剤は、タンパク質キナーゼの共有結合調節剤として作用し得る。マルチキナーゼ阻害剤は、キナーゼ活性部位に、又はタンパク質キナーゼ活性を阻害する二次若しくは三次部位に結合し得る。マルチキナーゼ阻害剤は、抗癌マルチキナーゼ阻害剤であってもよい。例示的な抗癌マルチキナーゼ阻害剤としては、ダサチニブ、スニチニブ、エルロチニブ、ベバシズマブ、バタラニブ、ベムラフェニブ、バンデタニブ、カボザンチニブ、ポチニブ、アキシチニブ、ルキソリチニブ、レゴラフェニブ、クリゾチニブ、ボスチニブ、セツキシマブ、ゲフィニチブ、イマチニブ、ラパチニブ、レンバチニブ、ムブリチニブ、ニロチニブ、パニツムマブ、パゾパニブ、トラスツズマブ、又はソラフェニブが挙げられる。
【0037】
本明細書で使用される場合、「約」という用語は、指定された値を含む値の範囲を意味し、当業者は、指定された値に合理的に類似すると考えるであろう。実施形態では、約は、当該技術分野において一般的に許容される測定値を使用した標準偏差内を意味する。実施形態では、約は、指定された値の+/-10%に及ぶ範囲を意味する。実施形態では、約は、指定された値を含む。
【0038】
開示される主題の態様は、対象からの試料中の1つ以上の標的分子の分析に基づいて、対象における疾患状態(例えば、癌の有無)、及び/又は疾患の起源の組織を検出するための方法を含む。いくつかの実施形態では、対象における疾患状態を検出するための方法は、対象から生体試験試料を単離することであって、生体試験試料が複数のポリペプチドを含むことと、検出アッセイを実行して、複数の中の1つ以上の標的ポリペプチドの存在又は量を判定することとを含む。1つ以上の標的ポリペプチドの存在又は量に関する情報は、1つ以上の標的ポリペプチド又はその断片をコードする1つ以上の標的ポリヌクレオチドの存在又は量と組み合わせられ得る。いくつかの実施形態では、対象における疾患状態を検出するための方法は、複数の無細胞リボ核酸(cfRNA)分子を含む生体試験試料を対象から単離することと、生体試験試料からcfRNA分子を抽出することと、抽出されたcfRNA分子に対してシーケンシング手順を実行して複数の配列リードを生成することと、フィルタリング手順を実行して1つ以上の健常細胞に由来する配列リードの除外集団及び配列リードの非除外集団を生成することと、非除外配列リードに対して定量化手順を実行することとを含む。実施形態では、本方法は、定量化手順が閾値を超える値をもたらす場合に、対象における疾患状態を検出することを含む。実施形態では、閾値を上回る1つ以上の非除外配列リードを検出することは、(i)検出、(ii)バックグラウンドを上回る検出、及び/又は(iii)状態を有さない対象における対応する配列リードのレベルよりも高いレベルでの検出を含む。様々な実施形態では、閾値は、約若しくは正確に1から約若しくは正確に10までの範囲の整数、例えば、約若しくは正確に2、3、4、5、6、7、8、又は約若しくは正確に9である。いくつかの実施形態では、閾値は、約若しくは正確に0.1~約若しくは正確に0.9の範囲の非整数値、例えば、約若しくは正確に0.2、0.3、0.4、0.5、0.6、0.7、又は約若しくは正確に0.8である。実施形態実施形態では、標的ポリペプチド及び標的ポリヌクレオチドは、同じ試料に由来するか、又はほぼ同時に収集された異なる試料に由来する。
【0039】
いくつかの実施形態では、本方法は、生体試験試料から抽出されるcfRNA分子を検出及び定量化するための手順のシーケンシングの使用を含む。例えば、種々の実施形態では、シーケンシング手順は、cfRNA分子に対して逆転写手順を実施して複数のcDNA/RNAハイブリッド分子を生成すること、ハイブリッド分子のRNAを分解して複数の一本鎖cDNA分子テンプレートを生成すること、一本鎖cDNA分子テンプレートから複数の二本鎖DNA分子を合成すること、複数の二本鎖DNAアダプターを複数の二本鎖DNA分子にライゲーションしてシーケンシングライブラリを生成すること、及びシーケンシングライブラリの少なくとも一部に対してシーケンシング順を実施して、複数の配列リードを得ることを含む。種々の実施形態では、二本鎖DNA分子を合成することは、鎖置換逆転写酵素手順を行うことを含む。
【0040】
いくつかの実施形態では、本方法は、全トランスクリプトームシーケンシング手順を利用する。他の実施形態では、シーケンシング手順は、標的化シーケンシング手順を含み、ここで、cfRNA分子のうちの1つ以上が、シーケンシングライブラリを調製する前に生体試験試料から濃縮される。この実施形態によれば、疾患状態を示す1つ以上のcfRNA分子が濃縮の標的とされる。例えば、いくつかの実施形態では、1つ以上の標的cfRNA分子は、AGR2、BPIFA1、CASP14、CSN1S1、DISP2、EIF2D、FABP7、GABRG1、GNAT3、GRHL2、HOXC10、IDI2-AS1、KRT16P2、LALBA、LINC00163、NKX2-1、OPN1SW、PADI3、PTPRZ1、ROS1、S100A7、SCGB2A2、SERPINB5、SFTA3、SFTPA2、SLC34A2、TFF1、VTCN1、WFDC2、MUC5B、SMIM22、CXCL17、RNU1-1、及びKLK5からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組合せを含むことができる。いくつかの実施形態では、1つ以上の標的RNA分子は、ROS1、NKX2-1、GGTLC1、SLC34A2、SFTPA2、BPIFA1、SFTA3、GABRG1、AGR2、GNAT3、MUC5B、SMIM22、CXCL17、及びWFDC2からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組合せを含むことができる。いくつかの実施形態では、1つ以上の標的RNA分子は、SCGB2A2、CSN1S1、VTCN、FABP7、LALBA、RNU1-1、OPN1SW、CASP14、KLK5、及びWFDC2からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組合せを含むことができる。いくつかの実施形態では、1つ以上の標的RNA分子は、CASP14、CRABP2、FABP7、SCGB2A2、SERPINB5、TRGV10、VGLL1、TFF1、及びAC007563.5からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組合せを含むことができる。更に他の実施形態では、標的RNA分子は、AKR1B10、C3、及び/又はPIEXO2遺伝子(複数可)に由来する。
【0041】
開示される主題の態様は、健常対象の血漿におけるその発現が非常に低いか、又は存在しない、1つ以上のダークチャネルRNA分子、及び/又はそれによってコードされるポリペプチドの分析を含む。健常対象の血漿におけるそれらの低い発現レベルに起因して、ダークチャネルRNA分子は、本方法と組み合わせて使用され得る高いシグナル対ノイズ比を提供する。
【0042】
開示される主題のいくつかの態様は、1つ以上の健常細胞に由来する配列リードの除外集団、及び後続の分析において使用される配列リードの非除外集団を生成するために使用されるフィルタリング手順を含む。様々な実施形態では、フィルタリング手順は、生体試験試料から抽出されたcfRNA分子からの各配列リードをRNA配列の対照データセットと比較することと、RNA配列の対照データセット内の1つ以上の配列リードと一致する1つ以上の配列リードを特定することと、RNA配列の対照データセット内の1つ以上の配列リードと一致する各配列リードを配列リードの除外集団内に配置することとを含む。
【0043】
いくつかの実施形態では、標的分子(例えば、DNA又はRNA配列)の対照データセットは、1つ以上の健常対象から得られた複数の配列リードを含む。いくつかの実施形態では、RNA配列の対照データセットは、対象由来の複数の血液細胞から得られた複数の配列リードを含む。例えば、いくつかの実施形態では、複数の配列リードは、対象の白血球(WBC)から得られる。実施形態では、標的分子の対照データセットは、検査下の特定の状態を有することが知られている若しくは有していないことが既知である集団、又は異なる時点で(例えば、検査下の特定の状態を発症する前に)検査された所与の対象などの参照状態についての標的分子(例えば、ポリペプチド及び/又はポリヌクレオチド)の存在又は量についてのデータを含む。
【0044】
生体試料
様々な実施形態では、本開示は、試験試料、例えば、組織及び/又は体液試料などの生体試験試料を、その中の複数の標的分子(例えば、複数のポリペプチド、cfDNA、及び/又はcfRNA分子)を分析する目的で対象から得ることを含む。本発明の実施形態による試料は、任意の臨床的に許容可能な様式で収集することができる。複数の標的分子を含むことが疑われる任意の試料を、本発明の方法と併せて使用することができる。いくつかの実施形態、試料は、組織、体液、又はそれらの組合せを含むことができる。いくつかの実施形態では、生体試料は、健常対象から採取される。いくつかの実施形態では、生体試料は、特定の疾患又は障害(例えば、特定の癌又は腫瘍)を有することが既知である対象から収集される。いくつかの実施形態では、生体試料は、特定の疾患又は障害を有することが疑われる対象から採取される。
【0045】
本明細書で使用される場合、「組織」という用語は、接続された細胞及び/又は細胞外マトリックス材料(複数可)の塊を指す。本方法と併せて一般的に使用される組織の非限定的な例としては、例えば、ヒト又は非ヒト哺乳動物に由来する、皮膚、毛髪、指の爪、子宮内膜組織、鼻腔組織、中枢神経系(CNS)組織、神経組織、眼組織、肝臓組織、腎臓組織、胎盤組織、乳腺組織、胃腸組織、筋骨格組織、泌尿生殖器組織、骨髄などが挙げられる。本発明の実施形態による組織試料は、例えば、限定するものではないが、ホルマリン固定パラフィン包埋(FFPE)、新鮮な及び新鮮凍結された(FF)組織試料など、当技術分野で既知の任意の組織試料タイプの形態で調製及び提供することができる。
【0046】
本明細書中で使用される場合、「体液」及び「生体液」という用語は、対象(例えば、ヒト又は非ヒト哺乳動物)に由来する液体材料をいう。本方法と併せて一般的に使用される体液の非限定的な例としては、粘液、血液、血漿、血清、血清誘導体、滑液、リンパ液、胆汁、痰、唾液、汗、涙、痰、羊水、月経液、膣液、精液、尿、腰椎又は脳室CSFなどの脳脊髄液(CSF)、胃液、鼻、咽喉、又は頬スワブに由来する1つ以上の材料(複数可)を含む液体試料、腹膜、胃、胸部、又は乳管洗浄手順などの洗浄手順に由来する1つ以上の材料を含む液体試料などが挙げられる。
【0047】
いくつかの実施形態では、試料は、細針吸引物又は生検組織を含み得る。いくつかの実施形態では、試料は、細胞又は生体材料を含有する培地を含むことができる。いくつかの実施形態では、試料は、血餅、例えば、血清が除去された後に全血から得られた血餅を含むことができる。いくつかの実施形態では、試料は、糞便を含むことができる。好ましい一実施形態では、試料は、採取された全血である。一態様では、血漿、赤血球、白血球、及び血小板などの全血試料の一部のみが使用される。いくつかの実施形態では、試料は、本方法と併せて2つ以上の成分部分に分離される。例えば、いくつかの実施形態では、全血試料は、血漿、赤血球、白血球、及び血小板成分に分離される。
【0048】
いくつかの実施形態は、試料は、試料が採取された対象からだけでなく、サンプリング時に対象内に存在するウイルスDNA/RNAなどの1つ以上の他の生物からの複数のポリペプチド及び/又は核酸を含む。
【0049】
核酸及び/又はポリペプチドは、当該分野で既知の任意の適切な方法に従って試料から抽出され得、抽出された核酸は、本明細書中に記載される方法と組み合わせて利用され得る。例えば、Maniatisら、Molecular Cloning:A Laboratory Manual、Cold Spring Harbor、ニューヨーク、pp.280-281、1982年を参照されたく、その内容は全体が参照により本明細書に組み込まれる。好ましい一実施形態では、ポリペプチドは、試料から精製される。いくつかの実施形態は、無細胞核酸(例えば、cfRNA及び/又はcfDNA)は、試料から抽出される。
【0050】
実施形態では、試料は、「一致」又は「対」試料である。一般に、「一致試料」及び「対試料」という用語は、同じ対象から、好ましくはほぼ同時に(例えば、単一の手順若しくは来院の一部として、又は同じ日に)収集された異なるタイプの試料の対を指す。実施形態では、異なるタイプは、組織試料(例えば、切除又は生検試料におけるような癌組織)及び生体液試料(例えば、血液又は血液画分)である。これらの用語はまた、一致試料に由来するポリペプチド及び/若しくはポリヌクレオチド(例えば、一致生体液試料由来の無細胞ポリヌクレオチドと対になった、癌組織から抽出されたポリヌクレオチド)、又はそのシーケンシングリードを指すために使用され得る。実施形態では、癌バイオマーカーの特定などにおいて、複数の対試料が分析される。複数の対試料は、異なる時点で収集された同じ個体から(例えば、癌の初期段階からの対試料、及び癌の後期段階からの対試料におけるように)、同じ又は異なる時点での異なる個体から、又はこれらの組合せであってもよい。実施形態では、一致試料は、異なる対象に由来する。実施形態では、複数の一致試料は、同じ癌のタイプ、及び任意選択で同じ癌ステージを有する対象に由来する。
【0051】
例示的なアッセイプロトコル
図1は、一実施形態による、シーケンシングのための核酸試料を調製するための方法100のフローチャートである。方法100は、以下の工程を含むが、これらに限定されない。例えば、方法100の任意の工程は、品質管理又は当業者に既知の他の実験室アッセイ手順のための定量化サブ工程を含み得る。
【0052】
工程110では、リボ核酸(RNA)試料が対象から抽出される。RNA試料は、全ヒトトランスクリプトーム、又はヒトトランスクリプトームの任意のサブセットを含み得る。試料は、疾患(例えば、癌)を有することが既知であるか、又は有することが疑われる対象から抽出され得る。試料は、血液、血漿、血清、尿、糞便、唾液、他のタイプの体液、又はそれらの任意の組合せを含み得る。いくつかの実施形態では、血液試料を採取するための方法(例えば、シリンジ又は指穿刺)は、外科手術を必要とし得る組織生検を得るための手順よりも侵襲性が低い場合がある。抽出された試料は、cfDNAを更に含み得る。対象が疾患(例えば、癌)を有する場合、抽出された試料中のcfRNAは、診断のために検出可能なレベルで存在し得る。
【0053】
工程120では、RNA分子を含む核酸試料は、必要に応じて、DNアーゼ酵素で処理される。DNアーゼは、核酸試料からDNA分子を除去して、RNA分子のDNA汚染を低減し得る。RNA分子がDNAに変換された後、RNA変換されたDNAと、核酸試料中に元々見出されたゲノムDNAとを区別することは困難であり得る。DNアーゼを適用することにより、cfRNAに由来する分子の標的化増幅が可能になる。DNアーゼ工程は、DNアーゼバッファを添加する工程、DNアーゼが添加された試料を遠心分離機を用いて混合する工程、及びインキュベーションを含み得る。いくつかの実施形態では、工程120は、Qiagen QIAamp Circulating Nucleic Acid Handbookに記載されているDNアーゼ処理プロトコルに基づく1つ以上のプロセスを含む。
【0054】
工程130では、逆転写酵素を使用して、核酸試料中のRNA分子を相補的DNA(cDNA)に変換する。逆転写酵素プロセスは、第1鎖合成工程(逆転写によるcDNA鎖の生成)、一本鎖cDNA分子を生成するためのRNA鎖の分解、及びポリメラーゼを使用した一本鎖cDNA分子からの二本鎖DNA分子の合成を含み得る。第1鎖合成の間、プライマーはRNA分子の3’末端にアニールする。第2鎖合成の間、異なるプライマーがcDNA分子の3’末端にアニールする。
【0055】
工程140では、シーケンシングライブラリが調製される。例えば、当該分野で周知のように、アダプターは、dsDNA分子の一方又は両方の末端に連結されて、シーケンシングのためのライブラリを調製することができる。一実施形態では、利用されるアダプターは、その後のクラスター生成及び/又はシーケンシングにおける使用のための1つ以上のシーケンシングオリゴヌクレオチド(例えば、合成によるシーケンシング(SBS)(Illumina、カリフォルニア州サンディエゴ)において使用される既知P5及びP7配列)を含み得る。別の実施形態では、アダプターは、ライブラリ調製後に、ライブラリが個々の試料から調製された1つ以上の他のライブラリと組み合わせられ得、それによって多重シーケンシングを可能にするように、試料特異的インデックス配列を含む。試料特異的インデックス配列は、約又は正確に2nt~約又は正確に20nt、約又は正確に2nt~約又は正確に10nt、約又は正確に2~約又は正確に8nt、又は約又は正確に2~約又は正確に6ntの長さを有する短いオリゴヌクレオチド配列を含むことができる。別の実施形態では、試料特異的インデックス配列は、約又は正確に2、3、4、5、6、7、又は8ヌクレオチド(nt)長より長い短いオリゴヌクレオチド配列を含むことができる。
【0056】
必要に応じて、ライブラリ調製中に、ユニーク分子識別子(UMI)を、アダプターライゲーションを介して試料中の核酸分子に付加することができる。UMIは、アダプターライゲーション中に核酸断片の一端又は両端に付加される短い核酸配列(例えば、4~10塩基対)である。いくつかの実施形態では、UMIは、特定の核酸断片に由来する配列リードを特定するために使用することができる固有のタグとして機能する縮重塩基対である。アダプターライゲーション後のPCR増幅中に、UMIは、付着した核酸断片と共に複製され、これは、下流分析において同じ元の核酸分子に由来する配列リードを特定する方法を提供する。
【0057】
RNAの標的シーケンシングを含む実施形態では、工程150において、標的核酸配列がライブラリから濃縮される。濃縮中、ハイブリダイゼーションプローブ(本明細書において「プローブ」とも称される)は、疾患(例えば、癌)、疾患状態(例えば、癌状態)、又は疾患分類(例えば、癌のタイプ又は起源組織)の有無について情報を与える核酸断片を標的とし、プルダウンするために使用される。所与のワークフローについて、プローブは、標的(相補的)核酸鎖(例えば、RNAから変換されたDNA鎖)にアニールする(又はハイブリダイズする)ように設計され得る。プローブは、塩基対の10s、100s、又は1000sの長さの範囲であり得る。1つの実施形態では、プローブは、特定の癌又は他のタイプの疾患に対応することが疑われるゲノム(例えば、ヒト又は別の生物)の特定の標的領域を分析するために、遺伝子パネルに基づいて設計される。更に、プローブは、標的領域の重複部分をカバーし得る。他の実施形態では、標的RNA分子は、逆転写酵素を使用してRNA分子をcDNA鎖に変換する前に、ハイブリダイゼーションプローブを使用して濃縮することができる(示さず)。一般に、当技術分野で既知の任意の方法を使用して、プローブハイブリダイズされた標的核酸を単離し、濃縮することができる。例えば、当技術分野で周知のように、ビオチン部分をプローブの5’末端に付加して(すなわち、ビオチン化して)、ストレプトアビジン被覆表面(例えば、ストレプトアビジン被覆ビーズ)を使用してプローブにハイブリダイズした標的核酸の単離を容易にすることができる。
【0058】
更に、標的シーケンシングのために、工程160では、配列リードが、濃縮された核酸試料から生成される。シーケンシングデータは、当該分野で既知の手段によって、濃縮されたDNA配列(すなわち、RNA配列から誘導又は変換されたDNA配列)から獲得され得る。例えば、方法100は、合成技術(Illumina)、パイロシーケンシング(454 Life Sciences)、イオン半導体技術(Ion Torrent sequencing)、単一分子リアルタイムシーケンシング(Pacific Biosciences)、ライゲーションによるシーケンシング(SOLiD sequencing)、ナノポアシーケンシング(Oxford Nanopore Technologies)、又はペアエンドシーケンシングを含む次世代シーケンシング(NGS)技術を含み得る。いくつかの実施形態では、大規模並列シーケンシングは、可逆的ダイターミネーターを用いた合成によるシーケンシングを使用して行われる。
【0059】
他の実施形態では、例えば、全トランスクリプトームシーケンシングアプローチにおいて(例えば、標的シーケンシングの代わりに)、工程170では、豊富なRNA種が核酸試料から除去される。例えば、いくつかの実施形態において、リボソームRNA(rRNA)及び/又は転移RNA(tRNA)種を除去することができる。RiboMinus(商標)(ThermoFisher Scientific)又はAnyDeplete(NuGen)などの利用可能な市販のキットを、豊富なRNA種の除去のために使用することができる。一実施形態では、豊富なRNA分子に由来する核酸(例えば、変換されたDNA)の除去後、工程180で配列リードが生成される。
【0060】
いくつかの実施形態では、配列リードは、アライメント位置情報を判定するために、当技術分野において既知の方法を使用して参照ゲノムに対してアライメントされ得る。アライメント位置情報は、所与の配列リードの開始ヌクレオチド塩基及び終了ヌクレオチド塩基に対応する参照ゲノム内の領域の開始位置及び終了位置を示し得る。アライメント位置情報はまた、開始位置及び終了位置から判定され得る配列リード長を含むことができる。参照ゲノム中の領域は、遺伝子又は遺伝子のセグメントに関連し得る。参照ゲノムは、全トランスクリプトーム、又はその任意の部分(例えば、複数の標的転写物)を含み得る。別の実施形態では、参照ゲノムは、試験される生物由来の全ゲノムであってもよく、抽出されたRNA分子に由来する(又はそれから逆転写された)配列リードを参照ゲノムにアライメントさせて、位置、断片長、並びに/又は開始位置及び終了位置を判定する。例えば、一実施形態では、配列リードをヒト参照ゲノムhg19にアライメントされる。ヒト参照ゲノムhg19の配列は、Genome Reference Consortiumから参照番号GRCh37/hg19で入手可能であり、Santa Cruz Genomics Instituteによって提供されるGenome Browserからも入手可能である。アライメント位置情報は、所与の配列リードの開始ヌクレオチド塩基及び終了ヌクレオチド塩基に対応する参照ゲノム内の領域の開始位置及び終了位置を示し得る。アライメント位置情報はまた、開始位置及び終了位置から判定され得る配列リード長を含むことができる。参照ゲノム中の領域は、遺伝子又は遺伝子のセグメントに関連し得る。
【0061】
ダークチャネルRNA分子の特定
本開示の態様は、対象における疾患状態を示す1つ以上のRNA配列(又は「ダークチャネルRNA分子」)を特定するためのコンピュータ実行方法を含む。いくつかの実施形態では、本方法は、コンピュータシステムによって、疾患を有することが既知である対象から得られた第1の試験試料からの複数のRNA分子からの配列リードの第1のセット(第1の試験試料は、複数の無細胞RNA(cfRNA)分子を含む)、及び対照試料からの複数のRNA分子からの配列リードの第2のセットを得ることと、疾患状態を示す1つ以上のRNA配列を特定するために、配列リードの第1のセット中に存在し、配列リードの第2のセット中に存在しない1つ以上のRNA配列を検出することとを含む。いくつかの実施形態では、患者から得られた第1の試験試料は、体液(例えば、血、血漿、血漿、尿、唾液、胸水、心嚢液、脳脊髄液(CSF)、腹水、又はそれらの任意の組合せ)を含む。好ましい一実施形態では、患者から得られる試験試料は、血漿試料である。いくつかの実施形態では、対照試料は、対象由来の健常細胞(例えば、白血球)から得られた複数のRNA分子を含む。
【0062】
図2は、本開示の一実施形態による、疾患状態を示す1つ以上のRNA配列を特定するための方法を示すフロー図である。図2に示すように、工程210において、配列リードの第1のセットが、複数の無細胞RNA(cfRNA)分子を含む生体試験試料から得られる。無細胞含有生体試験試料は、血液、血漿、血清、尿、胸膜液、脳脊髄液、涙、唾液、又は腹水などの任意の体液とすることができる。この実施形態によれば、cfRNA生体試験試料は、疾患を有することが知られているか、又は疾患を有することが疑われる試験対象から得られ、cfRNA分子が試料から抽出され、配列リードが判定される(本明細書の他の箇所に記載される)。例えば、一実施形態では、cDNA/RNAハイブリッド分子を生成する逆転写工程を使用して相補的DNA鎖を合成し、RNA分子を分解し、ポリメラーゼを使用してcDNA鎖から二本鎖DNA分子を合成し、シーケンシングライブラリを調製し、シーケンシングプラットフォームを使用して配列リードを判定する。シーケンシング工程は、以前に記載されたように、合成によるシーケンシングプラットフォーム(例えば、IlluminaのHiSeq X)又はライゲーションによるシーケンシングプラットフォーム(例えば、Life Technologies SOLiDプラットフォーム)、Ion Torrent/Ion Proton、半導体シーケンシング、Roche 454、単一分子シーケンシングプラットフォーム(例えば、Helicos、Pacific Biosciences、及びナノポア)を含む、任意の超並列シーケンシングプラットフォームなどの、当技術分野で既知の任意のシーケンシングプラットフォームを使用して任意に実行することができる。あるいは、当業者が容易に理解するように、配列リードを検出及び定量化するための他の手段、例えば、アレイベースのハイブリダイゼーション、プローブベースの溶液中ハイブリダイゼーション、ライゲーションベースのアッセイ、プライマー伸長反応アッセイを使用して、DNA分子(例えば、RNA分子から変換された)からの配列リードを判定することができる。
【0063】
工程220では、配列リードの第2のセットが、健常対照試料から得られる。一実施形態では、健常対照試料は同じ対象に由来し、複数の細胞RNA分子を含む。例えば、対照試料は、白血球などの血液細胞であり得、複数の配列リードは、血液細胞から抽出されたRNA分子に由来する。この実施形態によれば、RNA分子は、健常対照試料(例えば、血液細胞)から抽出され、DNAに変換され、シーケンシングライブラリが調製され、配列リードの第2のセットが判定される(本明細書の他の箇所に記載されるように)。他の実施形態では、対照試料は、健常対象又は健常細胞から得られたRNA配列について判定された配列データのデータベースとすることができる。
【0064】
工程230では、配列リードの第1のセット及び配列リードの第2のセットからの配列リードを比較して、疾患状態を示す1つ以上のRNA分子を特定する。更に、配列リードの第1のセットに存在し、配列リードの第2のセットに存在しない1つ以上の配列リード(RNA分子に由来する)は、疾患状態を示すRNA分子に由来するものとして特定される。例えば、配列リードの第1のセットは、疾患(例えば、癌)を有することが既知であるか、又は有することが疑われる対象から得られた血漿試料からのcfRNA分子に由来する配列リードを含むことができる。そして、配列リードの第2のセットは、健常細胞(例えば、白血球)からのRNA分子に由来する配列リードを含むことができる。無細胞RNA試料に由来する配列リードの第1のセットから、健常細胞に由来する配列リードの第2のセットを比較し、除去することによって、疾患状態(例えば、癌)に由来する配列リードを特定することができる。
【0065】
いくつかの実施形態では、RNA配列の対照データセットは、1つ以上の健常対象から得られた複数の配列リードを含む。様々な実施形態では、配列リードの第2のセットは、公開データベースから得られたRNA配列情報を含む。本発明の実施形態に従って使用することができる公開データベースとしては、組織RNA配列データベースGTEx(gtexportal.org/homeで入手可能)が挙げられる。いくつかの実施形態では、RNA配列の対照データセットは、対象由来の複数の血液細胞から得られた複数の配列リードを含む。例えば、いくつかの実施形態では、複数の配列リードは、対象の白血球(WBC)から得られる。
【0066】
実施形態では、ダークチャネルRNA分子の特定は、対応するポリペプチドバイオマーカーを選択するために使用される。
【0067】
腫瘍由来RNA分子の検出
本開示の態様は、対象における1つ以上の腫瘍由来RNA分子を検出するためのコンピュータ実装方法を含む。いくつかの実施形態では、本方法は、コンピュータシステムによって、腫瘍を有することが知られている対象由来の第1の試験試料由来の複数のRNA分子から第1のセットの配列リードを得ることであって、第1の試験試料が複数の無細胞RNA(cfRNA)分子を含む、こと、コンピュータシステムによって、対象からの複数の血液細胞からの複数のRNA分子から配列リードの第2のセットを得ること、及び/又はコンピュータシステムによって、配列リードの第1のセットに存在し、配列リードの第2のセットに存在しない1つ以上のRNA配列を検出して、対象における1つ以上の腫瘍由来RNA分子を検出することを含む。
【0068】
いくつかの実施形態では、患者から得られた第1の試験試料は、血液、血漿、漿液、尿、唾液、胸水、心嚢液、脳脊髄液(CSF)、腹水、又はそれらの任意の組合せを含む。好ましい一実施形態では、患者から得られる試験試料は、血漿試料である。いくつかの実施形態では、対象から得られる複数の血液細胞は、白血球(WBC)である。
【0069】
図3は、本発明の一実施形態による、1つ以上の腫瘍由来RNA配列を特定するための方法を示すフロー図である。工程310では、配列リードの第1のセットが、複数の無細胞RNA(cfRNA)分子を含む生体試験試料から得られる。この実施形態によれば、cfRNA生体試験試料は、疾患を有することが知られているか、又は疾患を有することが疑われる試験対象から得られ、cfRNA分子が試料から抽出され、配列リードが判定される(本明細書の他の箇所に記載される)。例えば、一実施形態では、cDNA/RNAハイブリッド分子を生成する逆転写工程を使用して相補的DNA鎖を合成し、RNA分子を分解し、ポリメラーゼを使用してcDNA鎖から二本鎖DNA分子を合成し、シーケンシングライブラリを調製し、シーケンシングプラットフォームを使用して配列リードを判定する。シーケンシング工程は、以前に記載されたように、当技術分野において任意の既知のシーケンシングプラットフォームを使用して任意に実施することができる。あるいは、当業者が容易に理解するように、配列リードを判定するための他の手段、例えば、アレイベースのハイブリダイゼーション、プローブベースの溶液中ハイブリダイゼーション、ライゲーションベースのアッセイ、プライマー伸長反応アッセイを使用して、DNA分子から得られた(例えば、RNA分子から変換された)配列リードを検出及び/又は定量化することができる。
【0070】
工程315では、配列リードの第2のセットが、血液細胞(例えば、白血球又は軟膜)から得られる。一実施形態では、血液細胞は同じ対象から得られ、RNA分子がそこから抽出される。この実施形態によれば、RNA分子は血液細胞から抽出され、DNAに変換され、シーケンシングライブラリが調製され、配列リードの第2のセットが判定される(本明細書の他の箇所に記載される)。一般に、当該分野で既知の任意の方法を、試験試料から無細胞核酸を抽出及び精製するために使用することができる。例えば、無細胞核酸は、1つ以上の既知の市販のプロトコル又はキット(例えば、QIAamp circulating nucleic acid kit(Qiagen))を使用して抽出及び精製することができる。
【0071】
工程320では、1つ以上のRNA配列が配列リードの第1のセットに存在し、配列リードの第2のセットに存在しない場合、1つ以上の腫瘍由来RNA分子が検出される。更に、配列リードの第1のセットに存在し、配列リードの第2のセットに存在しない1つ以上の配列リード(RNA分子に由来する)は、疾患状態を示すRNA分子に由来するものとして特定される。例えば、配列リードの第1のセットは、疾患(例えば、癌)を有することが既知であるか、又は有することが疑われる対象から得られた血漿試料からのcfRNA分子に由来する配列リードを含むことができる。配列リードの第2のセットは、血液細胞(例えば、白血球)からのRNA分子に由来する配列リードを含み得る。無細胞RNA試料に由来する配列リードの第1のセットから、血液細胞に由来する配列リードの第2のセットを比較し、除去することによって、腫瘍に由来する配列リードを特定することができる。
【0072】
いくつかの実施形態では、腫瘍由来標的ポリペプチドが、cfRNA分子の代わりに、又はそれに加えて検出される。いくつかの実施形態では、標的ポリペプチド又は対応する標的ポリヌクレオチドの一方の検出は、他方の検出の精度又は信頼度を高めるために使用される。
【0073】
標的分子を用いた疾患状態の検出
図4は、本発明の一実施形態による、対象における癌の存在を検出し、癌の状態を判定し、癌の進行をモニタリングし、及び/又は癌のタイプを判定する方法を示すフロー図である。工程410において、生体試験試料が、対象から抽出される。前述のように、一実施形態では、試験試料は、複数の無細胞RNA分子を含む体液(例えば、血、血漿、漿液、尿、唾液、胸膜液、心嚢液、脳脊髄液(CSF)、腹水、又はそれらの任意の組合せ)とすることができる。
【0074】
工程415では、複数の無細胞RNA分子が試験試料から抽出され、シーケンシングイブラリが調製される。一般に、当該分野で既知の任意の方法を、試験試料から無細胞核酸を抽出及び精製するために使用することができる。例えば、無細胞核酸(cfRNA分子)は、1つ以上の既知の市販のプロトコル又はキット(例えば、QIAamp circulating nucleic acid kit(Qiagen))を使用して抽出及び精製することができる。抽出後、cfRNA分子を使用してシーケンシングライブラリを調製する。一実施形態では、逆転写工程を使用して複数のcDNA/RNAハイブリッド分子を生成し、RNA鎖を分解して一本鎖cDNA分子を生成し、第2の鎖を合成して一本鎖cDNA分子テンプレートから複数の二本鎖DNA分子を生成し、DNAアダプターを複数の二本鎖DNA分子にライゲーションしてシーケンシングライブラリを生成する。前述のように、DNAアダプターは、その後のクラスター生成及び/又はシーケンシングにおいて使用するための1つ以上のシーケンシングオリゴヌクレオチド(例えば、合成によるシーケンシング(SBS)(Illumina、カリフォルニア州サンディエゴ)において使用するための既知のP5及びP7配列)を含み得る。別の実施形態では、アダプターは、ライブラリ調製後に、ライブラリが個々の試料から調製された1つ以上の他のライブラリと組み合わせられ得、それによって多重シーケンシングを可能にするように、試料特異的インデックス配列を含む。別の実施形態では、固有分子識別子(UMI)は、アダプターライゲーションを介して付加される。
【0075】
工程420では、シーケンシング反応を実行して、複数の配列リードを生成する。一般に、当技術分野で公知の任意の方法を使用して、シーケンシングライブラリから配列データ又は配列リードを得ることができる。例えば、一実施形態では、シーケンシングライブラリからのシーケンシングデータ又は配列リードは、次世代シーケンシング(NGS)を使用して取得することができる。次世代シーケンシング法としては、例えば、合成技術によるシーケンシング(Illumina)、パイロシーケンシング(454)、イオン半導体技術(Ion Torrent sequencing)、単一分子リアルタイムシーケンシング(Pacific Biosciences)、ライゲーションによるシーケンシング(SOLiD sequencing)、及びナノポアシーケンシング(Oxford Nanopore Technologies)が挙げられる。いくつかの実施形態では、シーケンシングは、可逆的ダイターミネーターによる合成によるシーケンシングを使用する大規模並列シーケンシングである。他の実施形態では、シーケンシングは、ライゲーションによるシーケンシングである。更に他の実施形態では、シーケンシングは、単一分子シーケンシングである。更に別の実施形態では、シーケンシングは、ペアエンドシーケンシングである。必要に応じて、増幅工程は、シーケンシングの前に実行され得る。
【0076】
工程425では、cfRNA試料から得られた配列リードをフィルタリングして、非除外配列リードのリストを生成し、非除外配列リードを工程430において定量化する。例えば、本明細書の他の箇所に記載されているように、cfRNA試料から得られた配列リードをフィルタリングして、健常細胞に存在することが知られている配列を除外することができる。一実施形態では、健常細胞(例えば、白血球)から抽出されたRNA分子を配列決定して、cfRNA由来配列リードから除外される配列リードを得て、非除外配列リードを得る。別の実施形態では、データベース(例えば、公開データベース)からのRNAシーケンシングデータを使用して、健常細胞リード中に存在することが知られている配列を排除又は除外して、非除外配列リードを得ることができる。
【0077】
工程435では、疾患状態は、定量化された非除外配列リードが閾値を超える場合に検出される。様々な実施形態では、閾値は、約若しくは正確に1から約若しくは正確に10までの範囲の整数、例えば、約若しくは正確に2、3、4、5、6、7、8、又は約若しくは正確に9である。いくつかの実施形態では、閾値は、約若しくは正確に0.1~約若しくは正確に0.9の範囲の非整数値、例えば、約若しくは正確に0.2、0.3、0.4、0.5、0.6、0.7、又は約若しくは正確に0.8である。cfRNAを一例として図4に示す。実施形態では、標的分子は、ポリペプチド(例えば、ダークチャネルRNAによってコードされるポリペプチド)である。ポリペプチドは、閾値との比較のために、種々の検出方法のいずれかを使用して検出され得る。
【0078】
本開示の態様は、癌を有することが既知である、又は癌を有することが疑われる対象において、癌の存在を検出する、癌のステージを判定する、癌の進行をモニタリングする、及び/又は癌のタイプを判定するための方法に関する。いくつかの実施形態では、本方法は、(a)対象の生体液中の1つ以上の標的分子(例えば、ポリペプチド及び/又はcfRNA)の存在を定量的に検出して、腫瘍スコアを判定こと、並びに(b)腫瘍スコアが閾値を超える場合に、対象において癌の存在を検出すること、癌のステージを判定すること、癌の進行をモニタリングすること、及び/又は癌のタイプを判定することを含む。様々な実施形態では、閾値は、約若しくは正確に1から約若しくは正確に10までの範囲の整数、例えば、約若しくは正確に2、3、4、5、6、7、8、又は約若しくは正確に9である。いくつかの実施形態では、閾値は、約若しくは正確に0.1~約若しくは正確に0.9の範囲の非整数値、例えば、約若しくは正確に0.2、0.3、0.4、0.5、0.6、0.7、又は約若しくは正確に0.8である。
【0079】
標的分子がポリヌクレオチド(例えば、cfRNA及び/又はcfDNA)を含む実施形態では、本開示の実施形態による定量検出方法は、次世代シーケンシングなどの核酸シーケンシング手順を含むことができる。種々の実施形態では、シーケンシングは、全トランスクリプトームシーケンシングを含むことができる。種々の実施形態では、シーケンシングは、シーケンシング手順を行う前に、1つ以上の目的の標的RNA配列について試料を濃縮することを含むことができる。あるいは、当業者が容易に理解するように、配列リードを検出及び定量化するための他の手段、例えば、アレイベースのハイブリダイゼーション、プローブベースの溶液中ハイブリダイゼーション、ライゲーションベースのアッセイ、プライマー伸長反応アッセイを使用して、DNA分子(例えば、RNA分子から変換された)からの配列リードを判定することができる。
【0080】
図5は、本開示の別の実施形態による、1つ以上の標的RNA分子に由来する1つ以上の配列リードから疾患状態を検出するための方法を示すフロー図である。工程510において、複数の無細胞RNA分子を含む生体試験試料が得られる。一実施形態では、生体試験試料は、体液(例えば、血、血漿、漿液、尿、唾液、胸水、心嚢液、脳脊髄液(CSF)、腹水試料、又はそれらの任意の組合せ)である。
【0081】
工程515では、生体試験試料中の1つ以上の標的RNA分子に由来する1つ以上の核酸配列の存在が検出され、定量化されて、腫瘍RNAスコアが判定される。本明細書中の他の箇所に記載されるように、RNA分子に由来する核酸は、当該分野で既知の任意の手段を使用して検出及び定量化することができる。例えば、一実施形態によれば、RNA分子に由来する核酸は、次世代シーケンシングプラットフォーム(例えば、HiSeq又はNovaSeq、Illumina、カリフォルニア州サンディエゴ)などのシーケンシング手順を使用して検出及び定量化される。他の実施形態では、RNA分子に由来する核酸は、マイクロアレイ、逆転写PCR、リアルタイムPCR、定量的リアルタイムPCR、デジタルPCR、デジタルドロップレットPCR、デジタルエマルジョンPCR、マルチプレックスPCR、ハイブリッドキャプチャー、オリゴヌクレオチドライゲーションアッセイ、又はそれらの任意の組合せを使用して検出及び定量化される。他の箇所に記載されるように、一実施形態では、無細胞核酸(cfRNA分子)は、1つ以上の既知の市販のプロトコル又はキット、例えば、QIAamp circulating nucleic acid kit(Qiagen)を使用して、抽出及び精製することができる。抽出後、cfRNA分子を使用してシーケンシングライブラリを調製する。一実施形態では、逆転写工程を使用して複数のcDNA/RNAハイブリッド分子を生成し、RNA鎖を分解して一本鎖cDNA分子を生成し、第2の鎖を合成して一本鎖cDNA分子テンプレートから複数の二本鎖DNA分子を生成する。必要に応じて、1つの実施形態では、1つ以上の標的RNA分子(又はそれに由来するDNA分子)は、本明細書中の他の箇所に記載されるように、検出及び定量化の前に濃縮される。実施形態では、標的RNA分子を検出する代わりに、又はそれに加えて、標的RNA分子によってコードされる標的ポリペプチド検出され、これは、腫瘍スコアを判定するために同様に使用され得る。
【0082】
一実施形態では、腫瘍スコアは、検出された標的分子(又は、ポリヌクレオチドの場合、RNA若しくはDNA分子から得られた配列リード)の量又はカウントである。別の実施形態では、腫瘍スコアは、検出された標的分子(又は、ポリヌクレオチドの場合、RNA若しくはDNA分子から得られた配列リード)の総数を、検出のために標的化された提示された遺伝子の総数で割った平均値、最頻値、又は平均を含む。更に他の実施形態では、腫瘍スコアは、本明細書の他の箇所に記載されるように、配列リードを予測モデルに入力し、腫瘍スコアを尤度又は確率として出力することによって判定される。
【0083】
工程520では、腫瘍スコアが閾値を超えた場合に、対象において癌の存在が検出される、癌の状態が決定される、癌の進行がモニタリングされる、及び/又は癌のタイプが判定される。閾値は、約若しくは正確に1~約若しくは正確に10の範囲の整数、例えば、約若しくは正確に2、3、4、5、6、7、8、又は約若しくは正確に9とすることができる。いくつかの実施形態では、閾値は、約若しくは正確に0.1~約若しくは正確に0.9の範囲の非整数値、例えば、約若しくは正確に0.2、0.3、0.4、0.5、0.6、0.7、又は約若しくは正確に0.8である。あるいは、腫瘍スコアが予測モデルから出力される場合、出力は、単に、対象が癌を有する可能性若しくは確率、又は癌のタイプを示す尤度若しくは確率とすることができる。
【0084】
癌指標スコア
本開示の態様は、患者における癌の存在を検出するためのコンピュータ実装方法に関する。いくつかの実施形態では、方法は、プロセッサ及びコンピュータ可読媒体を含むコンピュータにおいてデータセットを受信することであって、データセットは、患者からの生体試験試料中の複数の標的リボ核酸(RNA)分子に由来する複数の核酸分子(例えば、DNA分子)を配列決定することによって得られる複数の配列リードを含み、コンピュータ可読媒体は、プロセッサによって実行されると、コンピュータに、生体試験試料からの複数の標的分子の発現レベルを判定させることと、標的分子の各々の発現レベルを組織スコア行列と比較して、各標的分子についての癌指標スコアを判定することと、各標的分子についての癌指標を集計して、生体試験試料についての癌指標スコアを生成することと、生体試験試料についての癌指標スコアが閾値を超える場合に、患者における癌の存在を検出することとを含む。実施形態では、発現レベルは、単独で、又は標的ポリペプチド若しくはその一部をコードする標的RNAのレベルと組み合わせて、試料中で検出された標的ポリペプチドの量から判定される。実施形態では、発現レベルは、少なくとも部分的に、標的ポリペプチド又は標的cfRNAをコードするcfDNAから決定される。例えば、閾値を上回る特定のバイオマーカー遺伝子についてのcfDNAのコピー数は、その遺伝子の発現の増加を示し得る。実施形態では、ポリペプチド、cfRNA、及びcfDNAのうちの2つ以上を組み合わせて、試料が所与の遺伝子の発現を真に増加させるという信頼度を高める。例えば、ポリペプチドレベルは、cfRNAレベル、及び任意選択でcfDNAレベルと組み合わされ得る。
【0085】
いくつかの実施形態では、標的分子は、既知の癌状態を有する患者において、健常患者における発現レベルを超える発現レベルを有する。ある特定の実施形態では、既知の癌状態を有する患者における標的分子の発現レベルは、健常患者における標的分子の発現レベルよりも約若しくは正確に2倍~約若しくは正確に10倍高い、例えば、約若しくは正確に3倍、4倍、5倍、6倍、7倍、8倍、又は約若しくは正確に9倍高い。種々の実施形態では、標的分子は、健康な患者由来の生体試験試料において検出可能ではなく、例えば、標的ポリペプチド及び/又は標的RNA分子は、検出不能な発現レベルを有する。
【0086】
いくつかの実施形態では、生体試験試料中の標的分子の数は、約若しくは正確に1~約若しくは正確に2000、約若しくは正確に10~約若しくは正確に1000、約若しくは正確に10~約若しくは正確に500、又は約若しくは正確に10~約若しくは正確に500の範囲である。他の実施形態では、標的分子の数は、約若しくは正確に1~約若しくは正確に50、約若しくは正確に1~約若しくは正確に40、約若しくは正確に1~約若しくは正確に30、又は約若しくは正確に1~約若しくは正確に20の範囲であり、例えば、約若しくは正確に2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は約若しくは正確に20である。実施形態では、標的分子は、ポリペプチドである。実施形態では、標的分子は、RNA分子である。実施形態では、標的分子は、同じ遺伝子に由来するポリペプチド及びRNA分子である。
【0087】
いくつかの実施形態では、癌指標スコアは、生体試験試料から検出された標的分子(又は、ポリヌクレオチドの場合、RNA若しくはDNA分子から得られた配列リード)の総数の総計を含む。別の実施形態では、癌指標スコアは、検出された標的分子(又は配列リード)の総数を検出のために標的化された提示された遺伝子の総数で割った平均値、最頻値、又は平均を含む。更に他の実施形態では、癌指標スコアは、検出結果(例えば、ポリペプチド検出及び/又は配列リード)を予測モデルに入力することによって決定され、癌指標スコアは、本明細書の他の箇所に記載されるように、尤度又は確率として出力される。
【0088】
いくつかの実施形態では、閾値は、約若しくは正確に1から約若しくは正確に10までの範囲の整数、例えば、約若しくは正確に2、3、4、5、6、7、8、又は約9である。いくつかの実施形態では、閾値は、約若しくは正確に0.1~約若しくは正確に0.9の範囲の非整数値、例えば、約若しくは正確に0.2、0.3、0.4、0.5、0.6、0.7、又は約若しくは正確に0.8である。他の実施形態では、標的分子が標的ポリヌクレオチド(例えば、RNA)である場合、閾値は、約若しくは正確に0.5~約若しくは正確に5リード/100万(RPM)、例えば、約若しくは正確に1、1.5、2、2.5、3、3.5、4、又は約若しくは正確に4.5RPMである。癌指標スコア閾値は、対照試料、例えば、健常対象又は既知の疾患状態を有する対象において検出された標的RNA分子(又はそれに由来する配列リード)の量に基づいて決定することができる。あるいは、癌指標スコアが予測モデルから出力される場合、出力は単純に、対象が癌を有する尤度若しくは確率、又は癌のタイプを示す尤度若しくは確率であり得る。
【0089】
図6は、本開示の一実施形態による、癌指標スコアに基づいて対象における癌の存在を検出するための方法を示すフロー図である。工程610では、生体試験試料中の複数のcfRNA分子に由来する複数の配列リードを含むデータセットが受け取られる。例えば、本明細書に記載されるように、生体試験試料から抽出された複数のcfRNA分子について、複数の配列リードを判定することができる。更に、cfRNA分子を逆転写してDNA分子を作製し、そのDNA分子を配列決定して配列リードを生成する。
【0090】
工程615では、生体試験試料中の複数の標的RNA分子について発現レベルが判定される。例えば、一実施形態では、標的RNA分子の発現レベルは、目的の1つ以上の標的RNA分子に由来する検出された配列リードの定量化に基づいて判定することができる。
【0091】
工程620では、各標的RNA分子の発現レベルをRNA組織スコア行列と比較して、各標的RNA分子の癌指標スコアを決定する。RNA組織スコア行列は、既知の癌状態を有する複数の癌訓練試料に由来する配列リードを含む訓練セットから判定することができる。
【0092】
工程625では、各標的RNA分子の癌指標スコアを集計して、癌指標スコアを生成する。いくつかの実施形態では、癌指標スコアは、生体試験試料から検出された標的RNA分子(又は標的RNA分子に由来するDNA分子から得られた配列リード)の総数の集計を含む。別の実施形態では、癌指標スコアは、検出された標的RNA分子(又は標的RNA分子に由来するDNA分子から得られた配列リード)の総数を、RNA分子が標的化される遺伝子の総数で割った平均値、最頻値、又は平均を含む。
【0093】
工程630では、試験試料についての癌指標スコアが閾値を超える場合、対象における癌の存在を検出する。上述したように、一実施形態では、閾値は、約若しくは正確に1から約若しくは正確に10までの範囲の整数、例えば、約若しくは正確に2、3、4、5、6、7、8、又は約若しくは正確に9である。いくつかの実施形態では、閾値は、約若しくは正確に0.1~約若しくは正確に0.9の範囲の非整数値、例えば、約若しくは正確に0.2、0.3、0.4、0.5、0.6、0.7、又は約若しくは正確に0.8である。他の実施形態では、閾値は、約若しくは正確に0.5~約若しくは正確に5リード/100万(RPM)の範囲、例えば、約若しくは正確に1、1.5、2、2.5、3、3.5、4、又は約若しくは正確に4.5RPMである。
【0094】
本開示の態様は、標的分子のうちの1つ以上の発現レベル、標的分子のうちの1つ以上についての癌指標スコア、生体試験試料についての癌指標スコア、又はそれらの任意の組合せに基づいて、患者における癌細胞タイプ又は癌の起源の組織を判定するための方法を含む。様々な実施形態では、本方法は、標的分子のうちの1つ以上の発現レベル、標的分子のうちの1つ以上についての癌指標スコア、生体試験試料についての癌指標スコア、又はそれらの任意の組合せに基づいて、患者を複数の治療カテゴリーのうちの1つ以上に治療的に分類することを更に含む。
【0095】
種々の実施形態では、コンピュータは、標的分子のうちの1つ以上の発現レベル、標的分子のうちの1つ以上についての癌指標スコア、生体試験試料についての癌指標スコア、患者における癌の有無の指標、患者における癌の起源の組織の癌細胞タイプの指標、患者についての治療分類、又はそれらの任意の組合せを含む報告を生成するように構成される。
【0096】
組織行列スコア
本開示の態様は、組織スコア行列を構築するための方法を含む。いくつかの実施形態では、本方法は、複数の患者から得られた複数のRNA配列リードをコンパイルして、RNA発現行列を生成することと、RNA発現行列を組織特異的RNA発現行列で正規化して、RNA組織スコア行列を構築することとを含む。様々な実施形態では、組織特異的RNA発現行列は、複数の参照ヒト組織を含む。様々な実施形態では、RNA配列リードを複数の健常患者から得て、健常RNA組織スコア行列を構築する。様々な実施形態では、RNA配列リードは、癌RNA組織スコア行列を構築するために、既知の癌のタイプを有する複数の患者から得られる。いくつかの実施形態では、本方法は、複数の患者について得られた複数の検出されたポリペプチドレベルをコンパイルして、発現行列を生成することと、発現行列を組織特異的発現行列で正規化して、組織スコア行列を構築することとを含む。様々な実施形態では、組織特異的発現行列は、複数の参照ヒト組織を含む。様々な実施形態では、検出されたポリペプチドレベルは、健常組織スコア行列を構築するために複数の健常患者から得られる。様々な実施形態では、検出されたポリペプチドレベルは、癌組織スコア行列を構築するために、既知の癌のタイプを有する複数の患者から得られる。いくつかの実施形態では、検出されたポリペプチドレベルをRNA発現レベルと組み合わせて、所与の発現行列を生成する。
【0097】
標的分子及び分析技術
いくつかの態様では、本開示は、対象における癌を検出する方法を提供する。本開示のいくつかの実施形態による方法は、ポリペプチド及び/又はポリヌクレオチド(例えば、cfRNA分子及び/又はctRNA分子)に対して行うことができる。いくつかの実施形態では、本方法において使用される標的分子は、癌性細胞及び非癌性細胞由来の標的分子を含む。いくつかの実施形態では、標的分子は、ポリペプチドを含む。実施形態では、標的分子は、ポリペプチドと、cfRNA及びcfDNAのうちの1つ以上とを含む。
【0098】
実施形態では、方法は、(a)対象の生体液中の複数の標的分子を測定することであって、複数の標的分子が、表11、及び任意選択で表8又は12~19のうちの1つ以上のポリペプチドから選択される、ことと、(b)癌を検出することであって、癌を検出することが、閾値レベルを上回る標的分子のうちの1つ以上を検出することを含む、こととを含む。実施形態では、複数の標的分子は、表8、11~14又は17のうちの1つ以上に列挙される少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50以上のポリペプチド及び/又は遺伝子の転写物から選択される。標的分子は、これらの表のいずれか1つ、又はそれらの任意の組合せから選択される遺伝子に由来し得る。実施形態では、表8、11~14、又は17の中から選択される表の数は、2、3、4、又は全ての表である。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。実施形態では、標的分子は、標的ポリペプチドである。実施形態では、標的分子は、標的ポリペプチド、及びそれをコードする無細胞ポリヌクレオチド(例えば、cfRNA及び/又はcfDNA)である。実施形態では、標的分子はcfRNAを含み、複数のcfRNA分子を測定することは、シーケンシングなどによって、検出又は測定の前に複数のcfRNA分子(又はそのcDNA分子)を濃縮することを含む。
【0099】
いくつかの実施形態では、1つ以上の標的分子は、表1に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表1からの少なくとも2、3、4、5、6、7、8、9、10、15、20、25、又は30の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表1からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表1からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表1からの遺伝子の全てに由来する。実施形態では、1つ以上の標的分子は、表1の最初の5つの遺伝子(AGR2、HOXC10、S100A7、BPIFA1、及び/又はIDI2-AS1)のうちの少なくとも1つ、及び任意選択で表1からの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、AGR2遺伝子のポリペプチド及び/又は転写物を含む。実施形態では、1つ以上の標的分子は、AGR2、HOXC10、S100A7、BPIFA1、及びIDI2-AS1のポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表1は、癌ダークチャネルバイオマーカーの例を提供する。
【0100】
【表1】
【0101】
いくつかの実施形態では、1つ以上の標的分子は、表2に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表2からの少なくとも2、3、4、5、6、7、8、9、又は10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表2からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表2からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表2からの遺伝子の全てに由来する。実施形態では、1つ以上の標的分子は、表2の最初の5つの遺伝子(ROS1、NKX2-1、GGTLC1、SLC34A2、及びSFTPA2)のうちの少なくとも1つ、及び任意選択で表2からのうちの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、ROS1遺伝子のポリペプチド及び/又は転写物を含む。実施形態では、1つ以上の標的分子は、ROS1、NKX2-1、GGTLC1、SLC34A2、及びSFTPA2のポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表2は、ダークチャネル肺癌バイオマーカーの例を提供する。
【0102】
【表2】
【0103】
いくつかの実施形態では、1つ以上の標的分子は、表3に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表3からの少なくとも2、3、4、5、6、7、8、又は9の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表3からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表3からの遺伝子の全てに由来する。実施形態では、1つ以上の標的分子は、表3の最初の5つの遺伝子(SCGB2A2、CSN1S1、VTCN1、FABP7、及びLALBA)のうちの少なくとも1つ、及び任意選択で表3からのうちの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、SCGB2A2遺伝子のポリペプチド及び/又は転写物を含む。実施形態では、1つ以上の標的分子は、SCGB2A2、CSN1S1、VTCN1、FABP7、及びLALBAのポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表3は、乳癌ダークチャネルバイオマーカーの例を提供する。
【0104】
【表3】
【0105】
いくつかの実施形態では、1つ以上の標的分子は、表4に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。複数の実施形態では、1つ以上の標的分子は、表4からの少なくとも2、3、4、又は5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表4からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表4からの遺伝子の全てに由来する。実施形態では、1つ以上の標的分子は、表4の最初の5つの遺伝子(CASP14、CRABP2、FABP7、SCGB2A2、及びSERPINB5)のうちの少なくとも1つ、及び任意選択で表4からの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、CASP14遺伝子のポリペプチド及び/又は転写物を含む。実施形態では、1つ以上の標的分子は、CASP14、CRABP2、FABP7、SCGB2A2、及びSERPINB5のポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表4は、本明細書に記載されるヘテロDE法を使用して特定された乳癌バイオマーカーの例を提供する。
【0106】
【表4】
【0107】
いくつかの実施形態では、1つ以上の標的分子は、表5に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表5からの少なくとも2、3、4、5、6、7、8、9、10、15、20、又は25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表5からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表5からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表5からの遺伝子の全てを含む。実施形態では、1つ以上の標的分子は、表5の最初の5つの遺伝子(PTPRZ1、AGR2、SHANK1、PON1、及びMYO16_AS1)のうちの少なくとも1つ、及び任意選択で表5からの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、PTPRZ1遺伝子のポリペプチド及び/又は転写物を含む。実施形態では、1つ以上の標的分子は、PTPRZ1、AGR2、SHANK1、PON1、及びMYO16_AS1のポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表5は、本明細書に記載される情報利得方法を使用して特定された肺癌バイオマーカーの例を提供する。
【0108】
【表5】
【0109】
いくつかの実施形態では、1つ以上の標的分子は、表6に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表6からの少なくとも2、3、4、5、6、7、8、9、10、15、20、又は25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表6からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表6からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表6からの遺伝子の全てに由来する。実施形態では、1つ以上の標的分子は、表6の最初の5つの遺伝子(ADARB2、HORMAD2、SPDYE18、RPS19、及びCYP4F35P)のうちの少なくとも1つ、及び任意選択で表6からの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、ADARB2遺伝子のポリペプチド及び/転写物を含む。実施形態では、1つ以上の標的分子は、ADARB2、HORMAD2、SPDYE18、RPS19、及びCYP4F35Pのポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表6は、本明細書に記載される情報獲得方法を使用して特定された乳癌バイオマーカーの例を提供する。
【0110】
【表6】
【0111】
いくつかの実施形態では、1つ以上の標的分子は、表7に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表7からの少なくとも2、3、4、5、6、7、8、9、又は10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表7からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表7からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表7からの遺伝子の全てに由来する。実施形態では、1つ以上の標的分子は、表7の最初の5つの遺伝子(S100A7、FOXA1、BARX2、MMP7、及びPLEKHG4B)のうちの少なくとも1つ、及び任意で表7からの1つ以上の追加の遺伝子に由来する。実施形態では、1つ以上の標的分子は、S100A7遺伝子のポリペプチド及び/又は転写物を含む。実施形態では、1つ以上の標的分子は、S100A7、FOXA1、BARX2、MMP7、及びPLEKHG4Bのポリペプチド及び/又は転写物を含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表7は、癌組織において比較的高レベルで発現されるダークチャネル癌バイオマーカーの例を提供する。
【0112】
【表7】
【0113】
いくつかの実施形態では、1つ以上の標的分子は、表11に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの少なくとも2、3、4、5、10、25、50、100、150、200、300、又は400の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの少なくとも100の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの少なくとも200の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの少なくとも300の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表11からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表11は、癌バイオマーカーの例を提供する。
【0114】
【表8-1】
【0115】
【表8-2】
【0116】
いくつかの実施形態では、1つ以上の標的分子は、表12に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表12からの少なくとも2、3、4、5、10、20、30、40、50、又は60の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表12からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表12からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表12からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表12からの少なくとも50の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表12からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表12は、肺癌バイオマーカーの例を提供する。
【0117】
【表9】
【0118】
いくつかの実施形態では、1つ以上の標的分子は、表18に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表18からの少なくとも2、3、4、5、10、15、又は19の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表18からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表18からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表18からの少なくとも15の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表18からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表18は、本明細書に記載される、血漿試料中のタンパク質を検出するためのPEAアッセイ法を使用して特定された肺癌バイオマーカーの例を提供する。
【0119】
【表10】
【0120】
種々の実施形態では、1つ以上の標的分子は、表13に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表13からの少なくとも2、3、4、5、10、20、30、40、50、60、又は70の遺伝子を含む。実施形態では、1つ以上の標的分子は、表13からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表13からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表13からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表13からの少なくとも50の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表13からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表13は、乳癌バイオマーカーの例を提供する。
【0121】
【表11】
【0122】
いくつかの実施形態では、1つ以上の標的分子は、表19に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表19からの少なくとも2、3、4、5、10又は12の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表19からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表19からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表19からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。以下の表19は、本明細書に記載されるように、血漿試料中のタンパク質を検出するためのPEAアッセイ法を用いて特定された乳癌バイオマーカーの例を提供する。
【0123】
【表12】
【0124】
いくつかの実施形態では、1つ以上の標的分子は、表14に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表14からの少なくとも2、3、4、5、10、15、20、又は30の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表14からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表14からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表14からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表14からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。実施形態では、閾値を超えて検出される複数の標的分子は、ADIPOQ、AGR3、ANKRD30A、AQP4、BFPIFA1、CA12、CEACAM5、CFTR、CXCL17、CYP4F8、FABP7、FOXI1、GGTLC1、GP2、IL20、ITIH6、LDLRAD1、LEMD1、LMX1B、MMP7、NKAIN1、NKX2-1、ROPN1、ROS1、SCGB1D2、SCGB2A2、SFTA2、SFTA3、SLC34A2、SOX9、STK32A、STMND1、TFAP2A、TFAP2B、TFF1、TRPV6、VGLL1、及びVTCN1からなる群から選択される複数の遺伝子に由来する分子である。以下の表14は、非常に有益な癌バイオマーカーの例を提供する。
【0125】
【表13】
【0126】
いくつかの実施形態では、1つ以上の標的分子は、表15に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの少なくとも2、3、4、5、10、25、50、100、150、200、300、又は400の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの少なくとも100の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの少なくとも200の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの少なくとも300の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表15からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0127】
【表14-1】
【0128】
【表14-2】
【0129】
実施形態では、1つ以上の標的分子は、表1~6のうちの1つ以上から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)と組み合わせた、表8又は11~14のうちの1つ以上から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、1つ以上の標的分子は、表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)と組み合わせた、表8又は11~14のうちの1つ以上から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、表8又は11~14から選択される表は、表11である。実施形態では、表8又は11~14から選択される表は、表12である。実施形態では、表8又は11~14から選択される表は、表13である。実施形態では、表8又は11~14から選択される表は、表14である。実施形態では、表8又は11~14から選択される表は、表8である。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0130】
実施形態では、癌は肺癌であり、閾値を超えて検出される複数の標的分子は、表2、5、12、又は18のうちの1つ以上(例えば、2、3、5、又はそれ以上の遺伝子)のポリペプチド及び/又は転写物から選択される。実施形態では、1つ以上の標的分子は、表2、5、12、及び18のそれぞれから選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。いくつかの実施形態では、癌は肺癌であり、閾値を超えて検出される複数の標的分子は、WFDC2、CXCL17、MMP12、GDF15、CEACAM5、PRSS8、TFF1、CWC15、ALPP、GP2、INSL4、CHGA、GFRA1、AGR2、SPON1、DXO、AIF1、FKBPL、SFTPA2、又はFOLR1のうちの1つ以上のポリペプチドから選択される。
【0131】
実施形態では、癌は乳癌であり、閾値を超えて検出される複数の標的分子は、表3、4、6、13、又は19のうちの1つ以上(例えば、2、3、5、又はそれ以上の遺伝子)のポリペプチド及び/又は遺伝子の転写物から選択される。実施形態では、1つ以上の標的分子は、表3、4、6、13、及び19のそれぞれから選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。いくつかの実施形態では、閾値を超えて検出される複数の標的分子は、ADAMTS15、LEP、ERBB2、ERBB4、CGA、AFP、F7、BPIFB2、SFRP1、FGFBP1、LAMA4、GP2、MIA、FGFR2、又はVTCN1のうちの1つ以上のポリペプチドから選択される。
【0132】
実施形態では、1つ以上の標的分子は、(a)表5又は表6から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)、及び/又は(b)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)と組み合わせて、表11から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0133】
実施形態では、1つ以上の標的分子は、(a)表5から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)、及び/又は(b)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)と組み合わせて、表12から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0134】
実施形態では、1つ以上の標的分子は、(a)表4から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)、(b)表6から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)、及び/又は(c)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)と組み合わせて、表13から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0135】
実施形態では、1つ以上の標的分子は、(a)表3から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)、(b)表6から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)、及び/又は(c)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)と組み合わせて、表4から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、又はそれ以上の遺伝子)に由来する。実施形態では、第1及び第2の表からの遺伝子の選択は、第1及び第2の表の両方における1つ以上の遺伝子を選択することを含む。実施形態では、第1及び第2の表からの遺伝子の選択は、第2の表にない第1の表からの1つ以上の遺伝子、及び第1の表にない第2の表からの1つ以上の遺伝子を選択することを含む。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0136】
いくつかの実施形態では、1つ以上の標的分子は、表8に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表8からの少なくとも2、3、4、5、10、15、20、又は30の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表8からの少なくとも5つの遺伝子(例えば、最初の5つの遺伝子、CEACAM5、RHOV、SFTA2、SCGB1D2、及びIGF2BP1)に由来する。実施形態では、1つ以上の標的分子は、表8からの少なくとも10の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表8からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表8からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。実施形態では、閾値を超えて検出される複数の標的分子は、CEACAM5、RHOV、SFTA2、SCGB1D2、IGF2BP1、SFTPA1、CA12、SFTPB、CDH3、MUC6、SLC6A14、HOXC9、AGR3、TMEM125、TFAP2B、IRX2、POTEKP、ARHGEF38、GPR87、LMX1B、ATP10B、NELL1、MUC21、SOX9、LINC00993、STMND1、ERVH48-1、SCTR、MAGEA3、MB、LEMD1、SIX4、及びNXNL2からなる群から選択される複数の遺伝子に由来する分子である。以下の表8は、非常に有益な癌バイオマーカーの例を提供する。
【0137】
【表15】
【0138】
いくつかの実施形態では、1つ以上の標的分子は、表16A又は16Bに列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表16A又は16Bからの少なくとも2、3、4、5、10、25、50、又は60の遺伝子に由来する分子を含む。実施形態では、1つ以上の標的分子は、表16A又は16Bからの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表16A又は16Bからの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表16A又は16Bからの少なくとも50の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表16A又は16Bからの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0139】
【表16】
【0140】
【表17】
【0141】
いくつかの実施形態では、1つ以上の標的分子は、表17に列挙される遺伝子から選択される1つ以上の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表17からの少なくとも2、3、4、5、10、25、又は50の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表17からの少なくとも5つの遺伝子に由来する。実施形態では、1つ以上の標的分子は、表17からの少なくとも25の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表17からの少なくとも50の遺伝子に由来する。実施形態では、1つ以上の標的分子は、表17からの遺伝子の全てに由来する。実施形態では、測定される標的分子は、500未満の遺伝子(例えば、400、300、200、100、又は50未満の遺伝子)に由来する。
【0142】
【表18】
【0143】
実施形態では、1つ以上の標的分子は、標的ポリペプチドを含み、検出は、ポリペプチド検出アッセイを含む。
【0144】
実施形態では、閾値レベルを上回る標的分子のうちの1つ以上を検出することは、(i)検出、(ii)バックグラウンドを上回る検出、又は(iii)状態を有さない対象における標的分子のレベルを上回るレベルでの検出を含む。実施形態では、閾値を超えて検出することは、検出を含む。実施形態では、閾値を上回って検出することは、閾値を上回る検出を含む。実施形態では、閾値を超えて検出することは、状態を有さない対象における標的分子のレベルよりも高いレベルでの検出を含む。
【0145】
実施形態では、閾値レベルを上回る標的分子のうちの1つ以上を検出することは、状態を有さない対象におけるレベルよりも少なくとも約又は正確に10倍高い(例えば、15倍、20倍、50倍、100倍、又はそれ以上高い)レベルで1つ以上の標的分子を検出することを含む。実施形態では、閾値を超える検出は、状態を有さない対象におけるレベルよりも少なくとも約又は正確に25倍高いレベルで1つ以上の標的分子を検出することを含む。実施形態では、閾値を超える検出は、状態を有さない対象におけるレベルよりも少なくとも約又は正確に50倍高いレベルで1つ以上の標的分子を検出することを含む。
【0146】
実施形態では、1つ以上の標的分子は、標的ポリヌクレオチド(例えば、cfRNA)を含み、閾値レベルを超える標的cfRNA分子のうちの1つ以上を検出することは、0.5~5リード/100万(RPM)、例えば、約1、1.5、2、2.5、3、3.5、4、又は約4.5RPMの閾値を超える検出を含む。実施形態では、閾値を超えて検出することは、1RPMを超える検出を含む。実施形態では、閾値を超えて検出することは、1RPMを超える検出を含む。実施形態では、閾値を超えて検出することは、2RPMを超える検出を含む。実施形態では、閾値を超えて検出することは、5RPMを超える検出を含む。
【0147】
疾患及び障害
本開示の実施形態による方法は、心血管疾患、肝疾患、又は癌を含むがこれらに限定されない様々な疾患又は状態のいずれかの有無を検出するために使用され得る。いくつかの実施形態では、本方法は、癌のステージを判定することを含む。いくつかの実施形態では、癌ステージは、ステージI癌、ステージII癌、ステージIII癌、又はステージIV癌である。
【0148】
いくつかの実施形態では、方法は、癌、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞性腫瘍、又はそれらの任意の組合せの有無を検出すること、ステージを決定すること、進行をモニタリングすること、及び/又は分類することを含む。いくつかの実施形態では、癌腫は、腺癌であってもよい。他の実施形態では、癌は、扁平上皮細胞癌であってもよい。更に他の実施形態では、癌腫は、小細胞肺癌、非小細胞肺癌、鼻咽頭癌、結腸直腸癌、肛門癌、肝臓癌、膀胱癌、子宮頸癌、精巣癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、黒色腫、及び乳癌からなる群から選択される。いくつかの実施形態では、乳癌は、ホルモン受容体陰性乳癌又はトリプルネガティブ乳癌である。
【0149】
いくつかの実施形態では、本方法は、肉腫の有無を検出すること、肉腫のステージを判定すること、肉腫の進行をモニタリングすること、及び/又は肉腫を分類することを含む。実施形態では、肉腫は、骨肉種、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、膠腫、及び星状膠細胞腫からなる群から選択され得る。更に他の実施形態では、本方法は、白血病の有無を検出すること、白血病のステージを判定すること、白血病の進行をモニタリングすること、及び/又は白血病を分類することを含む。様々な実施形態では、白血病は、骨髄性白血病、顆粒球白血病、リンパ性白血病、リンパ球性白血病、及びリンパ芽球性白血病からなる群から選択することができる。更に他の実施形態では、本方法は、リンパ腫の有無を検出すること、リンパ腫のステージを判定すること、リンパ腫の進行をモニタリングすること、及び/又はリンパ腫を分類することを含む。様々な態様では、リンパ腫は、ホジキンリンパ腫及び非ホジキンリンパ腫からなる群から選択することができる。
【0150】
本開示の態様は、疾患の起源の組織を決定するための方法を含み、起源の組織は、膵臓組織、肝胆道組織、肝臓組織、肺組織、脳組織、神経内分泌組織、子宮組織、腎臓組織、尿路上皮組織、腎臓組織、子宮頸部組織、乳房組織、脂肪、結腸組織、直腸組織、心臓組織、骨格筋組織、前立腺組織、及び甲状腺組織からなる群から選択される。
【0151】
本発明の態様は、癌細胞型を決定するための方法を含み、癌細胞のタイプは、膀胱癌、乳癌、子宮頸癌、結腸直腸癌、子宮内膜癌、食道癌、胃癌、頭部/頚部癌、肝胆道癌、血液癌、肝臓癌、肺癌、リンパ腫、メラノーマ、多発性ミエローマ、卵巣癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、尿道癌、及び子宮癌からなる群から選択される。
【0152】
いくつかの実施形態では、同じアッセイを適用して、複数の癌状態(例えば、本明細書に開示されている癌のタイプ及び/又は癌のステージ)のいずれかを検出する。例えば、一実施形態によるアッセイを使用して、両方の試料中の各状態についてのバイオマーカーの評価に基づいて、第1の対象からの試料中の乳癌の存在(及び任意選択でステージ)を検出し、アッセイを繰り返して、第2の対象からの試料中の肺癌の存在(及び任意選択でステージ)を検出することができる。実施形態では、同じアッセイを複数の試料にわたって繰り返して、少なくとも5、10、15、20、25、30、35、40、45、50、75、100、又はそれ以上の癌状態の存在を特定する。実施形態では、同じアッセイを複数の試料にわたって繰り返して、少なくとも10の癌状態の存在を特定する。実施形態では、同じアッセイを複数の試料にわたって繰り返して、少なくとも20の癌状態の存在を特定する。実施形態では、同じアッセイを複数の試料にわたって繰り返して、少なくとも30の癌状態の存在を特定する。実施形態では、同じアッセイを複数の試料にわたって繰り返して、少なくとも50の癌状態の存在を特定する。
【0153】
処理条件
本明細書に開示される方法は、治療の決定、指導、及びモニタリング、並びに癌療法の開発及び臨床試験を行う際に使用することができる。実施形態では、特定の治療は、本明細書に開示される方法に従って得られる結果に応じて選択される(及び任意選択で投与される)。実施形態では、方法は、特定の治療を受けるために、本明細書に記載される様々な実施形態のいずれかに従って、生体液中に複数の標的分子を有すると特定された対象を選択することと、その治療を施すこととを含む。
【0154】
例えば、治療有効性は、分子標的療法(モノクローナル薬)、化学療法薬、放射線プロトコルなど、又はこれらの組合せなどの特定の療法による治療前、治療中、及び治療後の試料中の患者標的分子(例えば、ポリペプチド及び/又はcfRNA)を比較することによってモニタリングすることができる。いくつかの実施形態では、標的分子は、特定の癌バイオマーカーが治療後に増加又は減少するかどうかを見るためにモニタリングされ、これは、医師が、従来の患者の症状を追跡するモニタリング方法によって提供されるよりもはるかに短い期間で治療を変更する(例えば、治療を継続、停止、又は変更する)ことを可能にし得る。いくつかの実施形態では、方法は、検出された標的分子に基づいて対象を診断する工程、例えば、検出されたバイオマーカーに関連する癌の特定のステージ若しくはタイプを有する対象を診断する工程、又は患者がそのような癌を有する若しくは発症する可能性を報告する工程を更に含む。実施形態では、本明細書に開示される方法は、検出された状態に基づいて治療を選択することを更に含む。実施形態では、選択された治療が、対象に施される。状態が癌、又は特定の癌のタイプ及び/若しくはステージである場合、適切な抗癌療法を選択することができる。抗癌療法の非限定的な例としては、放射線療法、外科的切除、抗癌剤(例えば、免疫療法剤、化学療法剤など)の投与、又はこれらの1つ以上の組合せが挙げられる。
【0155】
分類モデル
本開示の態様は、分類モデルに関する。例えば、機械学習又は深層学習モデル(例えば、疾患分類子)を使用して、1つ以上の標的分子(例えば、ポリペプチド及び/又はcfRNA)から判定される1つ以上の特徴の値に基づいて疾患状態を判定することができる。様々な実施形態では、機械学習又は深層学習モデルの出力は、疾患状態の予測スコア又は確率(例えば、予測癌スコア)である。したがって、機械学習又は深層学習モデルは、予測スコア又は確率に基づいて疾患状態分類を生成する。
【0156】
いくつかの実施形態では、機械学習モデルは、ロジスティック回帰分類器を含む。他の実施形態では、機械学習又は深層学習モデルは、決定木、アンサンブル(例えば、バギング、ブースティング、ランダムフォレスト)、勾配ブースティングマシン、イオン、ナイーブベイズ、サポートベクターマシン、又はニューラルネットワークのうちの1つとすることができる。疾患状態モデルは、訓練中に調整される特徴に対する学習された重みを含む。重みという用語は、本明細書では、どの特定の機械学習技法が使用されるかにかかわらず、モデルの任意の所与の特徴に関連する学習された量を表すために総称的に使用される。いくつかの実施形態では、癌指標スコアは、1つ以上の標的分子(例えば、ポリペプチド、cfRNA、又はそれらの配列リード)に由来する特徴についての値を機械学習又は深層学習モデルに入力することによって判定される。
【0157】
訓練中、訓練データは、疾患状態モデルの重みを訓練するために使用される特徴の値を生成するために処理される。例として、訓練データは、訓練試料から得られたcfRNAデータ及び/又はWBC RNAデータ、並びに出力標識を含むことができる。例えば、出力ラベルは、個体が特定の疾患を有することが既知である(例えば、癌を有することが既知である)か、又は健康であることが既知である(すなわち、疾患がない)かどうかについての指標とすることができる。他の実施形態では、モデルを使用して、疾患のタイプ、又は起源の組織(例えば、起源の癌組織)、又は疾患の重症度の指標(例えば、癌のステージ)を判定し、そのための出力ラベルを生成することができる。実施形態に応じて、疾患状態モデルは、検出アッセイから判定された特徴のうちの1つ以上についての値、及び訓練されるべきモデルに関連するコンピュータ分析を受け取る。一実施形態では、1つ以上の特徴は、ある量の1つ以上の標的分子(例えば、ポリペプチド、cfRNA、又はそれに由来する配列リード)を含む。訓練中モデルによって出力されたスコアと訓練データの出力ラベルとの間の差に応じて、予測癌モデルの重みは、疾患状態モデルがより正確な予測を行うことを可能にするように最適化される。種々の実施形態では、疾患状態モデルは、ノンパラメトリックモデル(例えば、k最近傍)であってもよく、したがって、予測癌モデルは、パラメータを最適化する必要なく、より正確に予測を行うように訓練することができる。
【0158】
訓練された疾患状態モデルは、コンピュータ可読媒体に記憶され、その後、必要に応じて、例えば、モデルの展開中に取り出すことができる。
【0159】
いくつかの実施形態では、本方法は、遺伝子発現行列(G)に組織特異度行列(TS)を乗算することによって、遺伝子発現行列(G)を組織スコア行列(S)に変換することを含む。Gm,nは、試料mにおける遺伝子nの発現レベルである。TSn,jは、組織jに対する遺伝子nの組織特異度である。遺伝子nが組織jに特異的でない場合、TSn,j=0である。いくつかの実施形態では、組織特異度行列は、組織RNA配列データベース(GTEx)を使用して計算される。組織スコアは、例えば、癌対非癌試料を分類するためのモデルを構築するための特徴として使用することができる。非限定的な一実施形態では、肺癌試料から特定されたダークチャネル遺伝子(SFTPA2、SLC39A4、NKX2_1、SFTPA1、BFPIFA1、SLC34A2、CXCL17、SFTA3、MUC1、AGR2、WFDC2、ABCA12、VSIG10、CRABP2)を使用して、肺癌を非癌生体液試料から区別するための決定木分類器を構築した。この分析の結果を図10に示す。
【0160】
シーケンシング及びバイオインフォマティクス
本開示の態様は、複数の配列リードを生成するための核酸分子のシーケンシング、及び主題の方法を実行するための配列リードのバイオインフォマティクス操作を含む。
【0161】
様々な実施形態では、試料、対象から収集され、その後、目的の遺伝子領域又は遺伝子断片について濃縮される。例えば、いくつかの実施形態では、試料は、目的の癌関連遺伝子又は遺伝子フラグメントを含むヌクレオチドアレイへのハイブリダイゼーションによって濃縮することができる。いくつかの実施形態では、試料は、ハイブリッド捕捉などの当技術分野で既知の他の方法を使用して、目的の遺伝子(例えば、癌関連遺伝子)について濃縮することができる。例えば、Lapidus(米国特許第7666593号)を参照されたく、その内容は参照により全体が本明細書に組み込まれる。1つのハイブリッド捕捉方法では、ビオチン化オリゴヌクレオチド及びストレプトアビジンでコーティングされた磁気ビーズの使用を含む溶液ベースのハイブリダイゼーション方法が使用される。例えば、Duncavageら、J Mol Diagn.13(3):325-333(2011年);及びNewmanら、Nat Med.20(5):548-554(2014年)を参照。本開示の方法による試料からの核酸の単離は、当技術分野で既知の任意の方法に従って行うことができる。
【0162】
シーケンシングは、当技術分野で既知の任意の方法又は方法の組合せによるものであり得る。例えば、既知の核酸シーケンシング技術としては、標識ターミネーター又はプライマー及びスラブ又はキャピラリーにおけるゲル分離を使用する古典的ジデオキシシーケンシング反応(Sanger法)、可逆的に終結した標識ヌクレオチドを使用する合成によるシーケンシング、パイロシーケンシング、454シーケンシング、標識オリゴヌクレオチドプローブのライブラリに対する対立遺伝子特異的ハイブリダイゼーション、標識クローンのライブラリに対する対立遺伝子特異的ハイブリダイゼーションを使用する合成によるシーケンシング(これに続くライゲーション、重合工程の間の標識ヌクレオチドの取り込みのリアルタイムモニタリング)、ポロニーシーケンシング、及びSOLiDシーケンシングが挙げられるが、これらに限定されない。分離された分子のシーケンシングは、より最近になって、ポリメラーゼ又はリガーゼを使用する連続的又は単一の伸長反応によって、並びにプローブのライブラリとの単一又は連続的な差次的ハイブリダイゼーションによって実証された。
【0163】
シーケンシングを実施するための1つの従来の方法は、連鎖停止及びゲル分離により、Sangerら、Proc Natl.Acad.Sci.USA、74(12):5463 67(1977年)に記載され、その内容は参照により全体が本明細書に組み込まれる。別の従来のシーケンシング方法は、核酸フラグメントの化学分解を含む。Maxamら、Proc.Natl.Acad.Sci.、74:560 564(1977年)を参照されたい。ハイブリダイゼーションによるシーケンシングに基づく方法も開発されている。例えば、Harrisら(米国特許出願第2009/0156412号)を参照されたく、その内容は、参照によりその全体が本明細書に組み込まれる。
【0164】
提供される開示の方法において使用され得るシーケンシング技術としては、例えば、Helicos True Single Molecule Sequencing(tSMS)(Harris T.D.ら(2008年)J.Science 320:106-109)が挙げられ、その内容はその全体が参照により本明細書に組み込まれる。tSMSの更なる説明は、例えば、Lapidusら(その内容全体が参照により本明細書に組み込まれる米国特許第7,169,560号)、Lapidusら(その内容全体が参照により本明細書に組み込まれる米国特許出願公開第2009/0191565号)、Quakeら(その内容全体が参照により本明細書に組み込まれる米国特許第6,818,395号)、Harris(その内容全体が参照により本明細書に組み込まれる米国特許第7,282,337号)、Quakeら(その内容全体が参照により本明細書に組み込まれる米国特許出願公開第2002/0164629号)、及びBraslavskyら、その内容全体が参照により本明細書に組み込まれるPNAS(USA),100:3960-3964(2003年)に示されている。
【0165】
提供される開示の方法において使用することができる核酸シーケンシング技術の別の例は、454シーケンシング(Roche)である(Margulies,Mら、2005年、Nature、437、376-380、その内容は参照により全体が本明細書に組み込まれる)。提供される開示の方法において使用することができるDNAシーケンシング技術の別の例は、SOLiD技術(Applied Biosystems)である。提供される開示の方法において使用され得るDNAシーケンシング技術の別の例は、Ion Torrentシーケンシングである(米国特許出願公開第2009/0026082号、同第2009/0127589号、同第2010/0035252号、同第2010/0137143号、同第2010/0188073号、同第2010/0197507号、同第2010/0282617号、同第2010/0300559号、同第2010/0300895号、同第2010/0301398号、及び同第2010/0304982号、これらの本明細書に組み込まれる)。
【0166】
いくつかの実施形態では、シーケンシング技術は、Illuminaシーケンシングである。Illuminaシーケンシングは、フォールドバックPCR及びアンカープライマーを使用する固体表面上でのDNAの増幅に基づく。ゲノムDNAは断片化することができ、又はcfDNAの場合には、すでに短い断片であるため断片化は必要ない。アダプターを断片の5’及び3’末端に連結する。フローセルチャネルの表面に付着したDNA断片は伸長され、ブリッジ増幅される。断片は二本鎖になり、二本鎖分子は変性される。複数サイクルの固相増幅とそれに続く変性は、フローセルの各チャネルにおいて、同じテンプレートの約1,000コピーの一本鎖DNA分子の数百万個のクラスターを作製することができる。プライマー、DNAポリメラーゼ、及び4つのフルオロフォア標識された可逆的に終結するヌクレオチドを使用して、連続シーケンシングを行う。ヌクレオチド取り込み後、レーザーを使用して蛍光体を励起し、画像を捕捉し、第1の塩基の同一性を記録する。取り込まれた各塩基から3’ターミネーター及び蛍光体を除去し、取り込み、検出及び特定工程を繰り返す。
【0167】
提供される開示の方法において使用され得るシーケンシング技術の別の例としては、Pacific Biosciencesの単一分子リアルタイム(SMRT)技術が挙げられる。提供される開示の方法において使用することができるシーケンシング技術の更に別の例は、ナノポアシーケンシングである(Soni G V and Meller A.(2007年)Clin Chem 53:1996-2001、その内容は全体が参照により本明細書に組み込まれる)。提供される開示の方法において使用することができるシーケンシング技術の別の例は、DNAを配列決定するために化学感受性電界効果トランジスタ(chemFET)アレイを使用することを含む(例えば、その内容全体が参照により本明細書に組み込まれる米国特許出願公開第20090026082号に記載されている)。提供される開示の方法において使用することができるシーケンシング技術の別の例は、電子顕微鏡の使用を含む(Moudrianakis E.N.and Beer M.Proc Natl Acad Sci USA.1965年3月;53:564-71、内容は参照により全体が本明細書に組み込まれる)。
【0168】
試料由来の核酸が分解されるか、又は最小量の核酸しか試料から得ることができない場合、シーケンシングのために十分な量の核酸を得るために、核酸に対してPCRを行うことができる(例えば、Mullisら、米国特許第4683195号を参照されたく、その内容はその全体が参照により本明細書に組み込まれる)。
【0169】
標的ポリペプチドの検出
1つ以上の標的ポリペプチドを検出するための種々の適切な方法が利用可能である。非限定的な例としては、競合及び非競合免疫アッセイ、酵素免疫測定法(EIA)、放射免疫アッセイ(RIA)、抗体捕捉アッセイ、二次抗体サンドイッチ法、ウェスタンブロット解析、酵素免疫吸着アッセイ(ELISA)、比色アッセイ、化学発光アッセイ、蛍光アッセイ、免疫組織化学アッセイ、クロマトグラフィ、液体クロマトグラフィ、サイズ排除クロマトグラフィ、高速液体クロマトグラフィ(HPLC)、ガスクロマトグラフィ、質量分析、タンデム質量分析、マトリックス支援レーザー脱着/イオン化-飛行時間型(MALDI-TOF)質量分析、エレクトロスプレイイオン化(ESI)質量分析、表面増強レーザー脱着/イオン化-飛行時間型(SELDI-TOF)質量分析、四重極飛行時間型(Q-TOF)質量分析、常圧光イオン化質量分析(APPI-MS)、フーリエ変換質量分析(FTMS)、マトリックス支援レーザー脱着/イオン化フーリエ変換-イオンサイクロトロン共鳴(MALDI-FT-ICR)質量分析、二次イオン質量分析(SIMS)、顕微鏡法、マイクロ流体チップベースのアッセイ、及び表面プラズモン共鳴が挙げられる。
【0170】
いくつかの実施形態では、近接伸長アッセイ(PEA)を使用して、1つ以上のポリペプチドが検出される(及び任意選択で、相対レベルが判定される)。実施形態では、PEAは、近接したバイオマーカーへの近接プローブ対の同時結合を含む。近接プローブの対がバイオマーカーに結合すると、核酸ドメインは相互作用して核酸二本鎖を形成することができ、これにより核酸ドメインの少なくとも1つがその3’末端から伸長することが可能になり得る。この伸長産物は、必要に応じて、例えばPCRによる増幅後に、検出可能な核酸検出産物を形成する。例示的なPEA法は、参照により本明細書に組み込まれる国際公開第2012/104261号及び米国特許出願公開第2015/0044674号により詳細に記載されている。標的ポリペプチドは、単独で検出され得るか、又はより好ましくは、複数の標的ポリペプチドが、多重検出フォーマットにおいて同時に検出され得る。
【0171】
いくつかの実施形態では、多重反応モニタリング(MRM)アッセイを使用して、1つ以上のポリペプチドが検出される(及び任意選択で、相対レベルが決定される)。様々なMRM方法が利用可能である。実施形態では、MRMアッセイは、液体クロマトグラフィに連結された三連四重極質量分析計を使用して、標的ポリペプチドを検出又は定量化する。第1の四重極(Q1)において、目的のタンパク質に対応するペプチドが選択される。次に、ペプチドを第2の四重極(Q2)で断片化し、フィルターを適用して特定の断片を第3の四重極(Q3)に入れ、そこでその強度を測定する。標的ポリペプチドは、単独で検出され得るか、又はより好ましくは、複数の標的ポリペプチドが、多重検出フォーマットにおいて同時に検出され得る。MRMの更なる非限定的な例は、参照により本明細書に組み込まれる米国特許第20190277846号及び米国特許第20180024108号に記載されている。
【0172】
いくつかの実施形態では、ナノ粒子(NP)タンパク質コロナを液体クロマトグラフィ-質量分析と統合する定量プラットフォームを使用して、1つ以上のポリペプチドが検出される(及び任意選択で、相対レベルが判定される)。実施形態では、プラットフォームは、Proteographプラットフォームである。実施形態では、タンパク質コロナは、生体液との接触時にNP上に吸着されるタンパク質層である。操作されたNPの物理化学的特性を変化させることは、生体試料の差次的かつ再現可能な調査を可能にする別個のタンパク質コロナパターンに変換される。実施形態では、Proteographプラットフォームは、マルチNPタンパク質コロナアプローチ及び質量分析を使用する。実施形態では、このアプローチは4つの工程を含む:(1)NP-生体試料インキュベーション及びタンパク質コロナ形成;(2)磁石によるNPタンパク質コロナ精製;(3)コロナタンパク質の消化;及び(4)LC-MS/MS分析。これに関連して、各生体試料-NPウェルは試料であり、プレート当たり合計96試料である。標的ポリペプチドは、単独で検出され得るか、又はより好ましくは、複数の標的ポリペプチドが、多重検出フォーマットにおいて同時に検出され得る。NPベースのタンパク質コロナ検出の非限定的な例は、参照により本明細書に組み込まれる国際公開第2020096631A2号に記載されている。
【0173】
コンピュータシステム及びデバイス
本明細書で説明する本開示の態様は、プロセッサ、例えば中央処理装置を含むコンピュータなどの任意のタイプのコンピューティングデバイス、又は各デバイスがプロセス若しくは方法の少なくとも一部を実行するコンピューティングデバイスの任意の組合せを使用して実行することができる。いくつかの実施形態では、本明細書に説明されるシステム及び方法は、ハンドヘルドデバイス、例えば、スマートタブレット、若しくはスマートフォン、又はシステムのために生産される特殊デバイスを用いて行われ得る。
【0174】
本開示の方法は、ソフトウェア、ハードウェア、ファームウェア、ハードワイヤリング、又はこれらのいずれかの組合せを使用して実行することができる。機能を実装する特徴はまた、機能の一部が異なる物理的場所(例えば、無線又は有線接続を用いて、ある部屋の撮像装置及び別の部屋又は別個の建物のホストワークステーション)で実行されるように分散されることを含めて、種々の位置に物理的に位置することができる。
【0175】
コンピュータプログラムの実行に適したプロセッサは、例として、汎用マイクロプロセッサ及び専用マイクロプロセッサの両方、並びに任意のタイプのデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般に、プロセッサは、読み出し専用メモリ若しくはランダムアクセスメモリ、又はその両方から命令及びデータを受信する。コンピュータの必須要素は、命令を実行するためのプロセッサ、並びに命令及びデータを記憶するための1つ以上のメモリデバイスである。一般に、コンピュータはまた、データを記憶するための1つ以上の大容量記憶装置、例えば、磁気ディスク、光磁気ディスク、又は光ディスクを含むか、又はそれらからデータを受信するか、それらにデータを転送するか、又はその両方を行うように動作可能に結合される。コンピュータプログラム命令及びデータを具現化するのに適した情報キャリアは、全ての形態の不揮発性メモリ、例として、半導体メモリデバイス(例えば、EPROM、EEPROM、ソリッドステートドライブ(SSD)、及びフラッシュメモリデバイス);磁気ディスク(例えば、内蔵ハードディスク又はリムーバブルディスク);光磁気ディスク;及び光ディスク(例えば、CD及びDVDディスク)を含む。プロセッサ及びメモリは、専用論理回路によって補完することができるか、又は専用論理回路に組み込むことができる。
【0176】
ユーザとの対話を提供するために、本明細書で説明される主題は、ユーザに情報を表示するためのI/Oデバイス、例えば、CRT、LCD、LED、又は投影デバイスと、ユーザがコンピュータに入力を提供することができるキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)などの入力又は出力デバイスとを有するコンピュータ上で実装され得る。ユーザとの対話を提供するために、他のタイプのデバイスも使用することができる。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)とすることができ、ユーザからの入力は、音響、音声、又は触覚入力を含む任意の形態で受信することができる。
【0177】
本明細書で説明される主題は、バックエンド構成要素(例えば、データサーバ)、ミドルウェア構成要素(例えば、アプリケーションサーバ)、又はフロントエンド構成要素(例えば、ユーザが本明細書で説明される主題の実装形態と対話することができるグラフィカルユーザインターフェース又はウェブブラウザを有するクライアントコンピュータ)、あるいはそのようなバックエンド、ミドルウェア、及びフロントエンド構成要素の任意の組合せを含むコンピューティングシステムにおいて実装され得る。システムの構成要素は、デジタルデータ通信の任意の形態又は媒体によるネットワーク、例えば、通信ネットワークを介して相互接続することができる。例えば、データの参照セットは、遠隔位置に記憶され得、コンピュータは、比較目的のために参照データセットにアクセスするためにネットワークを介して通信することができる。しかし、他の実施形態では、参照データセットをコンピュータ内にローカルに格納することができ、コンピュータは、比較のためにCPU内の参照データセットにアクセスする。通信ネットワークの例は、セルネットワーク(例えば、3G又は4G)、ローカルエリアネットワーク(LAN)、及び広域ネットワーク(WAN)、例えば、インターネットを含むが、それらに限定されない。
【0178】
本明細書で説明される主題は、データ処理装置(例えば、プログラム可能プロセッサ、コンピュータ、又は複数のコンピュータ)による実行のために、又はその動作を制御するために、情報キャリア(例えば、非一時的コンピュータ可読媒体)において有形に具現化される1つ以上のコンピュータプログラム等の1つ以上のコンピュータプログラム製品として実装され得る。コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリ、マクロ、又はコードとしても知られる)は、コンパイラ型言語又はインタープリタ型言語(例えば、C、C++、Perl)を含む任意の形態のプログラミング言語で書くことができ、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチン、若しくはコンピューティング環境での使用に適した他のユニットとしてなど、任意の形態で展開することができる。本開示のシステム及び方法は、限定ではないが、C、C++、Perl、Java(登録商標)、ActiveX、HTML5、Visual Basic、又はJavaScript(登録商標)を含む、当技術分野で既知の任意の好適なプログラミング言語で書かれた命令を含むことができる。
【0179】
コンピュータプログラムは、必ずしもファイルに対応しない。プログラムは、他のプログラム又はデータを保持するファイル又はファイルの一部に、問題のプログラム専用の単一ファイルに、又は複数の協調ファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの一部を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータ上で、若しくは1つの設置先における複数のコンピュータ上で実行されるように配設され得るか、又は複数の設置先にわたって配信されて、通信ネットワークによって相互接続され得る。
【0180】
ファイルは、例えば、ハードドライブ、SSD、CD、又は他の有形の非一時的媒体上に記憶されたデジタルファイルであり得る。ファイルは、(例えば、ネットワークインターフェースカード、モデム、無線カードなどを介してサーバからクライアントに送信されるパケットとして)ネットワークを介して1つのデバイスから別のデバイスに送信することができる。
【0181】
本開示によるファイルでファイルを書き込むことは、有形の非一時的コンピュータ可読媒体を、例えば、粒子を追加、除去、又は再配置することによって(例えば、正味電荷又は双極子モーメントを用いて、読取り/書込みヘッドによる磁化のパターンに)変換することを伴い、次いで、パターンは、ユーザによって所望され、ユーザにとって有用な客観的物理現象に関する情報の新しいコロケーションを表す。いくつかの実施形態では、書込みは、有形の非一時的コンピュータ可読媒体内の材料の物理的変換を伴う(例えば、光学読取り/書込みデバイスが、次いで、情報の新しく有用なコロケーションを読み取ることができるように、例えば、CD-ROMに焼くことができるように、ある光学特性を伴う)。いくつかの実施形態では、ファイルを書き込むことは、NANDフラッシュメモリデバイスなどの物理フラッシュメモリ装置を変換することと、フローティングゲートトランジスタから作られたメモリセルのアレイ内の物理要素を変換することによって情報を記憶することとを含む。ファイルを書き込む方法は当技術分野で周知であり、例えば、プログラムによって、又はソフトウェアからの保存コマンド若しくはプログラミング言語からの書込みコマンドによって、手動で又は自動的に呼び出すことができる。
【0182】
適切なコンピューティングデバイスは、通常、大容量メモリ、少なくとも1つのグラフィカルユーザインターフェース、少なくとも1つのディスプレイデバイスを含み、通常、デバイス間の通信を含む。大容量メモリは、あるタイプのコンピュータ可読媒体、すなわち、コンピュータ記憶媒体を示す。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、又は他のデータなどの情報を記憶するための任意の方法又は技術で実装された揮発性、不揮発性、取り外し可能、及び取り外し不可能な媒体を含むことができる。コンピュータ記憶媒体の例には、RAM、ROM、EEPROM、フラッシュメモリ、若しくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)若しくは他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置若しくは他の磁気記憶装置、無線周波数識別(RFID)タグ若しくはチップ、又は所望の情報を記憶するために使用することができ、コンピューティングデバイスによってアクセスすることができる任意の他の媒体が含まれる。
【0183】
本明細書で説明される機能は、ソフトウェア、ハードウェア、ファームウェア、ハードワイヤリング、又はこれらのいずれかの組合せを使用して実装することができる。ソフトウェアのいずれも、機能の一部が異なる物理的位置で実装されるように分散されることを含めて、様々な位置に物理的に配置することができる。
【0184】
当業者であれば、本開示の方法の実行に必要であるか又は最も適していると認識するように、説明される本発明の方法の一部又は全部を実施するためのコンピュータシステムは、バスを介して互いに通信する1つ以上のプロセッサ(例えば、中央処理装置(CPU)、グラフィックス処理装置(GPU)、又はその両方)、メインメモリ、及びスタティックメモリを含むことができる。
【0185】
プロセッサは、一般に、中央処理装置(CPU)を提供するために、シングルコア又はマルチコアチップなどのチップを含む。プロセスは、Intel又はAMDからのチップによって提供されてもよい。
【0186】
メモリは、開示されるコンピュータのうちのいずれか1つのプロセッサによって実行されると、本明細書に説明される方法又は機能の一部又は全部を達成することができる1つ以上の命令セット(例えば、ソフトウェア)が記憶される、1つ以上の機械可読デバイスを含むことができる。ソフトウェアはまた、コンピュータシステムによる実行中に、メインメモリ内及び/又はプロセッサ内に完全に又は少なくとも部分的に常駐し得る。好ましくは、各コンピュータは、ソリッドステートドライブ、フラッシュドライブ、ディスクドライブ、ハードドライブなどの非一時的メモリを含む。
【0187】
機械可読デバイスは、例示的な実施形態では単一の媒体であり得るが、「機械可読デバイス」という用語は、命令及び/又はデータの1つ以上のセットを記憶する単一の媒体又は複数の媒体(例えば、集中型又は分散型データベース、並びに/あるいは関連するキャッシュ及びサーバ)を含むと解釈されるべきである。これらの用語はまた、機械による実行のための命令のセットを記憶、符号化、又は保持することが可能であり、本開示の方法のうちの任意の1つ以上を機械に実行させる、任意の1つ以上の媒体を含むと解釈されるものとする。したがって、これらの用語は、1つ以上のソリッドステートメモリ(例えば、加入者識別モジュール(SIM)カード、セキュアデジタルカード(SDカード)、マイクロSDカード、又はソリッドステートドライブ(SSD))、光及び磁気媒体、及び/又は任意の他の有形記憶媒体を含むが、これらに限定されないと解釈されるものとする。
【0188】
本開示のコンピュータは、概して、例えば、ビデオディスプレイユニット(例えば、液晶ディスプレイ(LCD)又は陰極線管(CRT))、英数字入力デバイス(例えば、キーボード)、カーソル制御デバイス(例えば、マウス)、ディスクドライブユニット、信号生成デバイス(例えば、スピーカ)、タッチスクリーン、加速度計、マイクロホン、セルラー無線周波数アンテナ、及び例えば、ネットワークインターフェースカード(NIC)、Wi-Fiカード、又はセルラーモデムであり得るネットワークインターフェースデバイスのうちの1つ以上などの1つ以上のI/Oデバイスを含むであろう。
【0189】
ソフトウェアのいずれも、機能の一部が異なる物理的位置で実装されるように分散されることを含めて、様々な位置に物理的に配置することができる。
【0190】
更に、本開示のシステムは、参照データを含むように提供することができる。任意の適切なゲノムデータが、システム内での使用のために記憶され得る。例としては、The Cancer Genome Atlas(TCGA)からの癌の主要なタイプ及びサブタイプにおける重要なゲノム変化の包括的多次元マップ;国際癌ゲノムコンソーシアム(The International Cancer Genome Consortium:ICGC)からのゲノム異常のカタログ;COSMICからの癌における体細胞突然変異のカタログ;ヒトゲノム及び他の一般的なモデル生物の最新の構築;dbSNPからの最新の参照SNP;1000 Genomes Project及びBroad Instituteからのゴールドスタンダードインデル;Illumina、Agilent、Nimblegen、及びIon Torrentからのエクソーム捕捉キットアノテーション;転写物アノテーション;パイプラインで実験するための(例えば、新しいユーザのための)小さなテストデータが挙げられるが、これらに限定されない。
【0191】
いくつかの実施形態では、データは、システムに含まれるデータベースのコンテキスト内で利用可能にされる。リレーショナルデータベース、オブジェクト指向データベースなどを含む任意の適切なデータベース構造が使用され得る。いくつかの実施形態では、参照データは、「not-only SQL」(NoSQL)データベース等のリレーショナルデータベースに記憶される。様々な実施形態では、グラフデータベースは、本開示のシステム内に含まれる。本明細書で使用される「データベース」という用語は、単一のデータベースに限定されないことも理解されたい。むしろ、複数のデータベースをシステムに含めることができる。例えば、データベースは、本開示の実施形態による、任意の整数のデータベースを含む、2、3、4、5、6、7、8、9、10、15、20、又はそれ以上の個々のデータベースを含むことができる。例えば、1つのデータベースは公開参照データを含むことができ、第2のデータベースは患者からの試験データを含むことができ、第3のデータベースは健常対象からのデータを含むことができ、第4のデータベースは既知の状態又は障害を有する病気の対象からのデータを含むことができる。データベースに含まれるデータに関するデータベースの任意の他の構成もまた、本明細書に記載される方法によって企図されることを理解されたい。
【0192】
例示的な実施形態
本開示は、以下の例示的な実施形態を提供する。
【0193】
実施形態1.対象における癌を検出する方法であって、
(a)対象の生体液中の複数の標的分子であって、表11のポリペプチドから選択される、複数の標的分子を測定することと、
(b)癌を検出することであって、癌を検出することが、閾値レベルを上回る標的分子のうちの1つ以上を検出することを含む、こととを含む、方法。
【0194】
実施形態2.複数の標的分子が、表8又は12~19のうちの1つ以上のポリペプチドから選択される、実施形態1に記載の方法。
【0195】
実施形態3.複数の標的分子が、表8、11~14又は17~19の少なくとも5、10、15、又は20のポリペプチドから選択される、実施形態1に記載の方法。
【0196】
実施形態4.複数の標的分子が、(i)表11から、(ii)表2、5、及び12の各々、(iii)表3、4、6、及び13の各々、(iv)表14、(v)表8、又は(v)表18及び19からの複数のポリペプチドを含む、実施形態1~3のいずれか1つに記載の方法。
【0197】
実施形態5.複数の標的分子が、表11~15のうちの1つ以上の少なくとも30のポリペプチドを含む、実施形態1~4のいずれか1つに記載の方法。
【0198】
実施形態6.複数の標的分子が、表14のポリペプチドから選択される、実施形態1~5のいずれか1つに記載の方法。
【0199】
実施形態7.閾値を超えて検出される複数の標的分子が、ADAMTS15、AFP、AGR2、AIF1、ALPP、BPIFB2、CEACAM5、CGA、CHGA、CWC15、CXCL17、DXO、ERBB2、ERBB4、F7、FGFBP1、FGFR2、FKBPL、FOLR1、GDF15、GFRA1、GP2、INSL4、LAMA4、LEP、MIA、MMP12、PRSS8、SFRP1、SFTPA2、SPON1、TFF1、VTCN1、及びWFDC2からなる群から選択されるポリペプチドである、実施形態1~5のいずれか1つに記載の方法。
【0200】
実施形態8.閾値を超えて検出される複数の標的分子が、表8のポリペプチドから選択される、実施形態1~5のいずれか1つに記載の方法。
【0201】
実施形態9.閾値を超えて検出される複数の標的分子が、CEACAM5、RHOV、SFTA2、SCGB1D2、IGF2BP1、SFTPA1、CA12、SFTPB、CDH3、MUC6、SLC6A14、HOXC9、AGR3、TMEM125、TFAP2B、IRX2、POTEKP、ARHGEF38、GPR87、LMX1B、ATP10B、NELL1、MUC21、SOX9、LINC00993、STMND1、ERVH48-1、SCTR、MAGEA3、MB、LEMD1、SIX4、及びNXNL2からなる群から選択されるポリペプチドである、実施形態1~5のいずれか1つに記載の方法。
【0202】
実施形態10.複数の標的分子が、(a)表11~14のうちの1つ以上のポリペプチド、及び(b)表1~6のうちの1つ以上のポリペプチドを含む、実施形態1~9のいずれか1つに記載の方法。
【0203】
実施形態11.複数の標的分子が、(a)表8又は11~14のうちの1つ以上のポリペプチド、及び(b)表7のうちの1つ以上のポリペプチドを含む、実施形態1~10のいずれか1つに記載の方法。
【0204】
実施形態12.(i)癌が肺癌であり、(ii)閾値を超えて検出された複数の標的分子が表18のポリペプチドから選択される、実施形態1~5のいずれか1つに記載の方法。
【0205】
実施形態13.(i)癌が肺癌であり、(ii)閾値を超えて検出される複数の標的分子が、WFDC2、CXCL17、MMP12、GDF15、又はCEACAM5のうちの1つ以上のポリペプチドから選択される、実施形態1~5のいずれか1つに記載の方法。
【0206】
実施形態14.(i)癌が乳癌であり、(ii)閾値を超えて検出された複数の標的分子が表19のポリペプチドから選択される、実施形態1~5のいずれか1つに記載の方法。
【0207】
実施形態15.閾値を超えて検出される複数の標的分子が、ADAMTS15、LEP、ERBB2、ERBB4、又はCGAのうちの1つ以上のポリペプチドから選択される、実施形態14に記載の方法。
【0208】
実施形態16.複数の標的分子が、表16A又は表16Bのポリペプチドを含む、実施形態1~5のいずれか1つに記載の方法。
【0209】
実施形態17.複数の標的分子が、表17のポリペプチドを含む、実施形態16に記載の方法。
【0210】
実施形態18.複数の標的分子が、AGR3、CA12、CEACAM5、CXCL17、GP2、IL20、MMP7、TFF1、VTCN1から選択されるポリペプチドを含む、実施形態16に記載の方法。
【0211】
実施形態19.
(a)複数の標的分子が、(i)ポリペプチドをコードする遺伝子由来の無細胞DNA(cfDNA)、及び/又は(ii)ポリペプチドをコードする遺伝子の無細胞RNA(cfRNA)転写物を含む無細胞ポリヌクレオチドを更に含み、
(b)閾値レベルを上回る標的分子のうちの1つ以上を検出することが、(i)第1の閾値レベルを上回るポリペプチドのうちの1つ以上を検出すること、及び(ii)第1の閾値レベルを上回って検出されたポリペプチドの各々について、第2の閾値レベルを上回る対応する無細胞ポリヌクレオチドを検出することを含む、実施形態1~18のいずれか1つに記載の方法。
【0212】
実施形態20.無細胞ポリヌクレオチドが、cfRNAを含む、実施形態19に記載の方法。
【0213】
実施形態21.無細胞ポリヌクレオチドが、cfDNAを含む、実施形態19に記載の方法。
【0214】
実施形態22.cfDNAが、メチル化cfDNAである、実施形態21に記載の方法。
【0215】
実施形態23.測定することが、シーケンシング、マイクロアレイ分析、逆転写PCR、リアルタイムPCR、定量的リアルタイムPCR、デジタルPCR、デジタルドロップレットPCR、デジタルエマルジョンPCR、マルチプレックスPCR、ハイブリッドキャプチャー、オリゴヌクレオチドライゲーションアッセイ、又はそれらの任意の組合せを含む、実施形態1~22のいずれか1つに記載の方法。
【0216】
実施形態24.測定することが、無細胞ポリヌクレオチドを配列決定して配列リードを生成することを含む、実施形態19~23のいずれか1つに記載の方法。
【0217】
実施形態25.配列決定することが、全トランスクリプトームシーケンシングを含む、実施形態24に記載の方法。
【0218】
実施形態26.配列決定することが、cfRNAから逆転写されたcDNA分子を配列決定することを含む、実施形態24又は25に記載の方法。
【0219】
実施形態27.配列決定することが、cfRNA又はcfDNAの濃縮された集団を配列決定することを含む、実施形態24に記載の方法。
【0220】
実施形態28.生体液が、血、血漿、漿液、尿、唾液、胸水、心嚢液、脳脊髄液(CSF)、腹水、又はそれらの任意の組合せを含む、実施形態1~27のいずれか1つに記載の方法。
【0221】
実施形態29.生体液が、対象の血液、血液画分、血漿、又は血清を含む、実施形態28に記載の方法。
【0222】
実施形態30.閾値レベルを上回る標的分子のうちの1つ以上を検出することが、(i)検出、(ii)バックグラウンドを上回る検出、又は(iii)癌を有さない対象における1つ以上の標的分子のレベルよりも高いレベルでの検出を含む、実施形態1~29のいずれか1つに記載の方法。
【0223】
実施形態31.閾値レベルを上回る標的分子のうちの1つ以上を検出することが、癌を有さない対象におけるレベルよりも少なくとも約10倍高いレベルで1つ以上の標的分子を検出することを含む、実施形態1~29のいずれか1つに記載の方法。
【0224】
実施形態32.閾値レベルを上回る無細胞ポリヌクレオチドのうちの1つ以上を検出することが、0.5~5リード/100万(RPM)の閾値を上回る検出を含む、実施形態24~29のいずれか1つに記載の方法。
【0225】
実施形態33.無細胞ポリヌクレオチドが、cfRNA転写物を含み、第2の閾値レベルを上回るcfRNA転写物のうちの1つ以上を検出することが、
(a)cfRNA転写物の各々の発現レベルをRNA組織スコア行列と比較することによって、cfRNA転写物についての指標スコアを判定することと、
(b)各cfRNA転写物について指標スコアを集計することと、
(c)指標スコアが閾値を超えたときに癌を検出することとを含む、実施形態19~29のいずれか1つに記載の方法。
【0226】
実施形態34.閾値レベルを上回る1つ以上の無細胞ポリヌクレオチドを検出することが、配列リードを機械学習又は深層学習モデルに入力することを含む、実施形態24~33のいずれか1つに記載の方法。
【0227】
実施形態35.機械学習又は深層学習モデルが、ロジスティック回帰、ランダムフォレスト、勾配ブースティングマシン、ナイーブベイズ、ニューラルネットワーク、又は多項式回帰を含む、実施形態34に記載の方法。
【0228】
実施形態36.機械学習又は深層学習モデルが、学習された重みを含む関数を通じて、1つ以上の特徴の値を対象についての疾患状態予測に変換する、実施形態34に記載の方法。
【0229】
実施形態37.癌が、
(i)癌、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞性腫瘍、又はそれらの任意の組合せ;
(ii)腺癌、扁平上皮癌、小細胞肺癌、非小細胞肺癌、鼻咽頭、結腸直腸癌、肛門癌、肝臓癌、膀胱、精巣癌、子宮頸部癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、黒色腫、及び乳癌からなる群から選択される癌;
(iii)ホルモン受容体陰性乳癌若しくはトリプルネガティブ乳癌;
(iv)骨肉種、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、膠腫、及び星状膠細胞腫からなる群から選択される肉腫;
(v)骨髄性白血病、顆粒球白血病、リンパ性白血病、リンパ球性白血病、及びリンパ芽球性白血病からなる群から選択される白血病;又は
(vi)ホジキンリンパ腫及び非ホジキンリンパ腫からなる群から選択されるリンパ腫を含む、実施形態1~36のいずれか1つに記載の方法。
【0230】
実施形態38.癌を検出することが、癌のステージを判定すること、癌の進行を判定すること、癌のタイプを判定すること、起源の癌組織を判定すること、又はそれらの組合せを含む、実施形態1~37のいずれか1つに記載の方法。
【0231】
実施形態39.検出された癌に基づいて治療を選択することを更に含む、実施形態1~38のいずれか1つに記載の方法。
【0232】
実施形態40.治療が、外科的切除、放射線療法、又は抗癌剤の投与を含む、実施形態39に記載の方法。
【0233】
実施形態41.選択された治療で対象を治療することを更に含む、実施形態39又は40に記載の方法。
【0234】
実施形態42.実施形態1~41のいずれか1つに記載の方法における1つ以上の工程を実施するためのコンピュータシステム。
【0235】
実施形態43.実施形態1~41のいずれか1つに記載の方法における1つ以上の工程を実施するためのコンピュータ可読命令を記憶した、非一時的コンピュータ可読媒体。
【実施例
【0236】
本明細書中に記載される実施例及び実施形態は、例示目的のみのためであり、そしてそれらに照らして種々の改変又は変更が当業者に示唆され、本出願の精神及び範囲並びに添付の特許請求の範囲内に含まれるべきであることが理解される。
【0237】
実施例1:癌患者の血漿中の組織特異的RNAの検出
無細胞RNA(cfRNA)は、癌検出のための有望な分析物であるが、cfRNAの包括的評価が欠けている。血漿中の腫瘍由来RNAを特徴付けるために、本発明者らは、循環無細胞ゲノムアトラス(Circulating Cell-free Genome Atlas)(CCGA)サブ研究から探索的分析を実施して、癌を有する参加者及び癌を有さない参加者におけるcfRNA発現を調べた。この分析は、一般集団及びCCGAにおけるそれらの高い発生率のために、乳癌、肺癌、及び結腸直腸癌に焦点を当てた。
【0238】
本発明者らは、CCGA訓練セットから210人の参加者を選択した(Kleinら、ASCO、2018年)。合計98人の参加者が、採血時にステージIIIの癌と診断された(乳房(47人の患者)、肺(32人の患者)、結腸直腸(15人の患者)、及び肛門直腸(4人の患者))。ステージIIIの試料は、血液中のシグナルを最大化し、潜在的な二次転移からの交絡シグナルを回避するように選択した。癌群と頻度年齢が一致した112人の非癌参加者も含めた。各参加者について、腫瘍組織生検の軟膜、cfRNA、及びFFPEからの全トランスクリプトームライブラリを生成した。
【0239】
参加者の血漿から核酸を抽出し、試料をDNアーゼ処理して無細胞DNA(cfDNA)及びゲノムDNAを除去し、ランダムヘキサマープライマーを使用して逆転写を実施して、各研究参加者について全トランスクリプトームを捕捉した。得られたcDNAをDNAライブラリに変換し、増幅し、リボソーム、ミトコンドリア、及びグロビンなどの血液関連転写物から生じる豊富な配列を除去した。得られた全トランスクリプトームRNA配列ライブラリを、試料当たり約750Mペアエンドリードの深さで配列決定し、試料ごとに各遺伝子についてUMI-折畳みカウントを生成するカスタムバイオインフォマティクスパイプラインを使用して分析した。この同じ手順を使用して、利用可能な場合、一致した軟膜及び組織RNAからRNA配列ライブラリを作製し、分析した。残留DNA汚染の存在に起因して、全ての下流分析は、少なくとも1つのリードがエクソン-エクソン接合部と重複するリード対として本実施例において定義される厳密なRNAリードの使用に依存した。図11は、エンドツーエンドワークフローの概要を示す。表9は参加者試料の概要を提供する。
【0240】
【表19】
【0241】
本発明者らは、本発明者らのデータをTCGAからのRNA試料と比較した(図12A)。本発明者らが、CCGA腫瘍組織RNA配列データを、TCGA腫瘍組織RNA配列データに由来する主成分上に投影した場合、CCGA腫瘍組織試料は、癌のタイプによって分離可能であった(図12B)。これらの結果が示唆するように、CCGA及びTCGA腫瘍の発現プロファイルは、試料収集/取扱い/ライブラリ調製における差異にもかかわらず非常に類似しており、分析アプローチを検証する。TCGA腫瘍組織RNA配列データに由来する主成分へのCCGAコホートからの癌cfRNA試料の投影は、癌のタイプによる試料の分離を示さず(図12C)、癌のタイプがcfRNAにおける分散の主な源ではなかったことを示唆した。
【0242】
血漿中のcfRNAの大部分は、健常免疫細胞に由来すると考えられる。したがって、本発明者らは、これらの転写物をバックグラウンドノイズとして処理し、癌シグナルの供給源として腫瘍由来cfRNAに焦点を当てた。本発明者らの分析は、cfRNAデータにおいて2つのクラスの遺伝子:「ダークチャネル」及び「ダークチャネルバイオマーカー」を特定した。ダークチャネルは、非癌参加者のcfRNAにおいて検出されなかった遺伝子である。57783のアノテーションされた遺伝子のうち、39564(68%)がダークチャネルとして特定された。ダークチャネルバイオマーカー(DCB)遺伝子は、以下の3つの基準を満たした:1)非癌コホートにおける遺伝子の発現中央値が0であった、2)癌コホートの2人以上の参加者において遺伝子発現が検出された、及び3)癌群において遺伝子発現が上方制御された。
【0243】
14のDCB遺伝子:SLC34A2、GABRG1、ROS1、AGR2、GNAT3、SFTPA2、MUC5B、SFTA3、SMIM22、CXCL17、BPIFA1、WFDC2、NKX2-1、及びGGTLC1が、肺癌細胞について特定された(表2参照)。RNU1-1、CSN1S1、FABP7、OPN1SW、SCGB2A2、LALBA、CASP14、KLK5、WFDC2、及びVTCN1の10のDCB遺伝子が乳癌について特定された(表3参照)。結腸直腸癌についてはDCB遺伝子は特定されなかった。
【0244】
DCB遺伝子は、いくつかの異なる特徴を示した。最初に、DCB遺伝子を組織特異的遺伝子について濃縮した(図13)。57783のアノテーションされた遺伝子のうち、0.3%が肺特異的であり、0.2%が乳房特異的であった。比較すると、肺DCB遺伝子の50%が肺特異的であり、乳房DCB遺伝子の44%が乳房特異的であった(タンパク質アトラスデータベースによって定義された(Uhlenら、Science、2015年))。
【0245】
更に、いくつかのDCB遺伝子は、特定の癌のサブタイプにおいてのみ検出されたサブタイプ特異的バイオマーカーであった(図14A及び14B)。FABP7は、トリプルネガティブ乳癌(TNBC)試料においてのみ検出された。逆に、SCGB2A2はTNBCでは検出されなかったが、HER2+及びHR+/HER乳癌試料では検出された。SLC34A2、ROS1、SFTPA2、及びCXCL17遺伝子は、肺腺癌患者試料のcfRNAにおいて検出されたが、扁平上皮癌患者試料においては検出されなかった。これらのサブタイプ特異的遺伝子はまた、同じ器官に由来する癌の他のサブタイプと比較して、腫瘍組織においてより高い発現を有した。
【0246】
血液中の腫瘍関連転写物の供給源を判定するために、ダークチャネルバイオマーカー遺伝子についてのcfRNAと腫瘍組織RNAとの間の一致を評価した。cfRNAと腫瘍組織発現との間の高い一致が観察された(図15A)。腫瘍組織において検出されなかった遺伝子は、一致cfRNA試料において検出される可能性が低く、腫瘍組織において検出された遺伝子は、一致cfRNA試料において検出される可能性が高かった。更に、所与の患者についてのcfDNA腫瘍画分と一致腫瘍組織における遺伝子発現との積として測定される腫瘍含量は、乳癌患者のcfRNAにおけるDCB遺伝子の検出可能性の強力な予測因子であった(図15B)。
【0247】
非癌対象由来のcfRNAにおいて見出されなかった転写物であるダークチャネルバイオマーカー(DCB)は、癌患者において高いシグナル対ノイズ比の可能性を示した。DCBシグナルは、腫瘍含量(血液中の腫瘍画分と組織中のRNA発現との積として測定)と相関していた。cfRNA DCBは、組織及びサブタイプ特異的様式で癌参加者において特定された。本発明者らは、高い腫瘍組織発現がDCBシグナル増幅をもたらし、低いcfDNA腫瘍画分を有する患者における癌の検出を可能にする場合を観察した。まとめると、これらのデータは、組織特異的転写物が、血液ベースの複数癌検出における使用の可能性を有することを示唆する。
【0248】
実施例2:異種試料中のバイオマーカーの特定
本発明者らは、標準的な差次的発現(DE)分析を使用して、異種試料に対するバイオマーカー発見において、偽陽性の2つの共通の原因を観察した。第1に、遺伝子発現は、対照群及び癌群の両方における遺伝的不均一性又は遺伝子増幅ドロップアウトに起因する二峰性分布に従う。第2に、単一の影響力のある外れ値が、一般化線形モデル(GLM)の傾き及びp値を膨張させた。
【0249】
ヘテロDEと呼ばれる組織発現に基づくcfRNAなどの高度に不均一な試料において差次的に発現される遺伝子を特定するための方法が開発された。ヘテロDEモデルは、負の二項一般化線形モデル(NB-GLM)を使用する。偽陽性を減少させるために、ヘテロDEは、2つの更なる機能性を含む:(1)非癌群における遺伝子発現が、遺伝的異質性又は遺伝子増幅ドロップアウトに起因して双峰分布に従うかどうかをチェックする、及び(2)単一の外れ値試料のみがNB-GLMのp値に影響を及ぼしているかどうかをチェックする。外れ値試料は、クックの距離を使用して特定される。NB-GLMは、最大のクック距離を有する試料なしで2回目に実行される。
【0250】
従来の差次的発現(DE)法とは対照的に、ヘテロDEは、NG-GLMにおける共変量として腫瘍含量を使用する。非癌試料の腫瘍含量を0に設定した。cfRNA腫瘍バイオマーカー遺伝子についての仮説は、組織における遺伝子発現が高く、cfDNA中の腫瘍画分が大きいほど、cfRNA中のその遺伝子を検出する可能性が高いというものであった。本発明者らがこの方法を乳癌試料に適用した場合、本発明者らは、9つのcfRNAバイオマーカー:TRGV10、SCGB2A2、CASP14、FABP7、CRABP2、VGLL1、SERPINB5、TFF1、及びAC007563.5を特定した(表4を参照)。これらのバイオマーカーのうちの3つ(FABP7、SCGB2A2、CASP14)は、DCB遺伝子として特定された遺伝子と重複する。
【0251】
ヘテロDEに従った試料処理及びパラメータ判定を示す例示的なワークフローを図19に示す。腫瘍含量は、組織試料の欠如に起因して、非癌対象について0に制約された。ワークフローの例示的な実装形態は、以下によって与えられる。
i,j:患者jのcfRNAにおける遺伝子iについてのリードカウント;
μi,j:患者jのcfRNAにおける遺伝子iについての平均リードカウント;
α:遺伝子iの分散;
γ:遺伝子iについて血漿中に腫瘍内容物がない場合の平均リードカウント;
i,j:腫瘍含量、log10(一致したcfDNAにおける腫瘍画分一致腫瘍組織における遺伝子発現)
βi:腫瘍含有量の係数;
i,j~NB(μi,j,α
log(μi,j)=(γ+xi,jβ
【0252】
情報利得法を用いた特徴選択も試験した。情報利得は、二値化cfRNA遺伝子発現と癌/非癌標識との間の高い相互情報量を有する遺伝子を選択する方法である。遺伝子発現RPM行列をバイナリ行列に変換した。遺伝子がRPM>0を有する場合、それを1に変換した。遺伝子がRPM=0を有する場合、それを0に設定した。バイナリ発現値を使用して、癌のタイプ(例えば、肺癌)及び非癌標識が与えられた各遺伝子について情報利得を計算した。乳癌群の非癌群は性別とバランスがとれており、非癌群の女性対象のみを選択した。最も高い情報利得を有する上位100の遺伝子を、モデリングのための特徴として選択した。各遺伝子の値を、モデリングプロセスにおいてバイナリ値に変換した。これらの手順を、乳癌対非癌、及び結腸直腸癌対非癌について繰り返した。肺癌について最も高い情報利得を有する上位30の遺伝子を表5に示し、乳癌について最も高い情報利得を有する上位30の遺伝子を表6に示す。
【0253】
別の実施形態では、特徴選択を癌組織試料から実施して、癌組織試料で発現されるが非癌参加者では発現されない遺伝子を特定した。実施例1で上述したように、ライブラリを調製し配列決定した。各癌組織試料について、本発明者らは、ダークチャネル由来の癌組織(組織RPM>10)において比較的高レベルで発現された遺伝子を特定した。これらの遺伝子は「組織ブライトチャネル遺伝子」として分類された。特定された上位15の組織ブライトチャネル遺伝子を表7に示す。
【0254】
実施例3:別個のコホートにおけるDCBの検証
本発明者らは、商業ベンダー(Discovery Life Sciences、「DLS」)から得た乳癌試料(38)及び肺癌試料(18)の直交セットにおける本発明者らのCCGAコホートにおいて特定されたDCBを検証することに着手した。ステージI~IVの患者を選択して、疾患進行にわたるDCBの有病率を評価し、38人の年齢が一致した非癌試料を、癌を有さない患者におけるDCB発現の対照として含めた。感度を改善し、シーケンシング要件を低減するために、本発明者らは、本発明者らのCCGAコホートにおいて特定された23のDCBを選択するための標的化濃縮アプローチを開発した。本発明者らはまた、非癌血漿中に通常存在する33の陽性対照遺伝子を濃縮した。非癌試料の大部分はDCB転写物を含有しないため、これらの転写物は濃縮工程において担体材料として作用する。得られた標的RNA配列ライブラリを配列決定し、試料当たり100Mペアエンドリードの深さまでサブサンプリングし、厳密なRNAリードの数を標的遺伝子及びオフターゲット遺伝子の両方について定量化した。全トランスクリプトームアッセイと比較した場合、本発明者らは、標的化アプローチが標的cfRNA転写物の変換効率を2~3倍増加させることを見出した。
【0255】
本発明者らのCCGAコホートにおいて特定された23のDCBのうち、1つ(CRABP2)を除く全てが、非癌群において0の発現中央値(RPM)を有した。本発明者らのパネルにおける19のDCBは、検証コホートにおける少なくとも1つの癌試料において発現され(≧2のユニークフラグメント)、これらのDCBのうちの16は、非癌試料と比較して少なくとも1つの癌のタイプにおいて差次的に発現された。アッセイ効率及びステージが向上した状態で、本発明者らは、いくつかの組織特異的マーカーが乳癌及び肺癌の両方に存在するが、それらは2つの群間で差次的に発現されたままであることに気付いた。乳癌におけるSCGB2A2、並びに肺癌におけるROS1、SFTA3、及びSFTPA2のように、1つの癌のタイプにおいて排他的に発現されるいくつかのDCBもある。この検証コホートにおいて観察された全てのDCBについて、癌試料におけるDCB発現のレベルは、ステージと共に増加し、最も高い発現は、本発明者らのコホートにおけるステージIVの試料について見られ、癌の特異的マーカーとしてのこれらの特徴の妥当性を支持した。この傾向にもかかわらず、本発明者らはまた、本発明者らのコホート内の早期癌におけるDCB発現を観察し、これは、DCBを濃縮するアプローチを用いて早期癌を検出する機会を示唆している。例示的な結果を図16A~Dに示し、リードカウントの数をy軸に沿って示す。
【0256】
実施例4:分類結果
本発明者らは、ダークチャネルバイオマーカー(DCB)、ヘテロDE、及び情報利得(IG)を含む異なる特徴選択方法を使用して、一つ抜き(LOO)及び5分割交差検証分類を適用した。例示的なワークフローを図17A図17Bに示す。ヘテロDEは一致腫瘍組織を利用したので、この特徴選択方法は、肺組織試料の数が限られているため、肺癌/非癌分類には適用されなかった。全体として、LOOは、乳癌/非癌分類における5倍交差検証と比較して、LOOにおいて有意に良好な分類性能を有しており、これは、乳癌分類器が、各訓練セットにおけるより小さい試料サイズに起因して5倍分類において訓練されていることを暗示している。DCBは、肺癌/非癌分類器に対して最良の成績(98%特異度での感度:0.2±0.037)を有し、ヘテロDEは、乳房癌/非癌分類器に対して最良の成績(98%特異度での感度:0.303±0.046)を有した(表10)。
【0257】
【表20】
【0258】
例示的な結果も図18A~Cにプロットされており、これらは、一つ抜き交差検証を使用して生成された。図18Aは、ヘテロDE特徴選択法及びランダムフォレスト分類器を使用した乳癌対非癌についての一つ抜き(LOO)交差検証分類からの受信者動作特性(ROC)プロット及び変数重要度プロットを示す。入力データは、DESeq2 Rパッケージからのサイズ因子標準化(estimateSizeFactorsを使用)関数を使用して標準化された遺伝子当たりのカウントであった。表10に示すように、95%での感度は、0.394+/-0.049であった。
【0259】
図18Bは、ダークチャネル特徴選択法及びランダムフォレスト分類器を使用した、肺標識対非癌標識についての一つ抜き(LOO)交差検証分類からのROCプロットを示す。入力データは、リード/100万(rpm)で遺伝子当たりの正規化カウントであった。表10に示すように、95%特異度での感度は、0.3+/-0.042であった。
【0260】
図18Cは、ダークチャネル特徴選択法及びランダムフォレスト分類器を使用した、乳房対非癌標識のための一つ抜き(LOO)交差検証分類からのROCプロット及び変数重要度プロットを示す。入力データは、リード/100万(rpm)で遺伝子当たりの正規化カウントであった。表10に示すように、95%特異度での感度は、0.212+/-0.041であった。
【0261】
実施例5:材料及び方法
シーケンシングデータ処理
生リードを、STARバージョン2.5.3aを使用して、全ての転写物と共にgencode v19一次アセンブリにアライメントした。重複配列リードを検出し、ゲノムアラインメント位置及び非ランダムUMI配列に基づいて除去した。ペアエンドリードの大部分は、予想される配列と正確に一致するUMI配列を有していた。リードのサブセットはUMI配列中にエラーを含み、発見的エラー訂正を適用した。UMIが予想されるUMIから1のハミング距離内にあった場合、それをそのUMI配列に割り当てた。ハミング距離が1を超えた場合、又は複数の既知の配列が1のハミング距離内にあった場合、UMIエラーを有するリードを廃棄した。アライメント位置及び補正されたUMIを共有するリードのセットを、メンバーリードの複数の配列アライメントを介してエラー補正し、単一のコンセンサス配列/アライメントを生成した。リードアライメントを、gcode v19におけるアノテーションされた転写物と比較した。アノテーションされたエクソン-エクソン接合部にわたるリードのみをカウントして、DNA混入リードから生じる偽カウントを除去した。
【0262】
試料収集
全血をStreck Cell-free DNA BCTチューブに回収し、これを輸送し、血漿分離前に周囲温度で保存した。全血をスイングバケットロータにおいて4℃で10分間1600gで回転させて、血漿を分離した。血漿層を別のチューブに移し、4℃で12分間15000gで回転させて、細胞汚染物質を更に除去した。二重遠心血漿を-80℃で保存し、抽出前に室温で解凍して寒冷沈降物の形成を回避した。
【0263】
試料選択基準
本発明者らは、循環無細胞ゲノムアトラス研究(Circulating Cell-free Genome Atlas study)(CCGA、NCT02889978)からステージIIIの乳癌、肺癌、及び結腸直腸癌試料のサブセットを選択した。本発明者らは、選択された患者が、未処理グレード1~2血漿(溶血なし)の少なくとも2本のチューブを有し、患者あたり6~8mLの血漿を有することを必要とした。本発明者らは更に、選択された患者が以前の研究からの一致cfDNAシーケンシングデータを有することを必要とした。いったん癌患者が選択されたら、本発明者らは、年齢、性別、及び民族性について癌試料と一致する同数の非癌試料を選択した。この基準に基づいて、210の試料を選択した。これらの試料を、各バッチ内のタイプ(癌及び非癌試料)のランダムな混合物を確実にするRにおける無作為化関数を使用して、14のバッチに無作為化した。
【0264】
試料処理
無細胞核酸を、QIAamp Circulating Nucleic Acidsキット(Qiagen、55114)からの循環miRNAプロトコルを使用して、最大8mLの凍結血漿から抽出した。抽出した材料を、製造業者の説明書に従って、RNase-free DNase Set(Qiagen、79254)を使用してDNアーゼ処理し、High Sensitivity RNA Fragment Analyzer kit(Agilent、DNF-472)を使用して定量した。逆転写及びアダプターライゲーションを、TruSeq RNA Exomeキット(Illumina、20020189)を使用して行った。得られたライブラリから、ヒトrRNA用AnyDeplete及びミトコンドリアキット(Tecan、9132)を使用して豊富な配列を除去し、除去標的のカスタムセットを補充した。
【0265】
配列決定された試料をスクリーニングし、低い品質管理測定基準を示すものをその後の分析から除外した。1つのアッセイ測定基準及び3つのパイプライン測定基準を「レッドフラグ」として選択し、不十分な測定基準を有する試料を除外するために使用した。アッセイ測定基準は、試料がシーケンシングのために十分な材料を有するかどうかを測定し、パイプライン測定基準は、シーケンシング深度、RNA純度、及び試料間汚染であった。
【0266】
遺伝子発現定量化
データの最初の検査は、ライブラリ調製の間のDNアーゼ消化工程にもかかわらず、cfRNA試料中の残留DNAの様々なレベルを明らかにした。混入のレベルは最小であり(試料当たり<6ハプロイドゲノム当量)、消化前のcfDNAの量又はバッチ特異的問題と相関しなかった。むしろ、以前の報告と一致して確率的であるように思われる。
【0267】
QC測定基準、発現の第95分位以下の遺伝子の鎖特異度として定義される「分位95鎖特異度」を使用して、各試料中のDNA混入のレベルを評価した。UHR陽性対照試料は、高い分位95鎖特異度(>0.85)を示した。cfRNA quantile 95鎖特異度値は、広い範囲(0.52~0.89)に広がっていた。参照のために、cfDNA試料は、約0.5の分位95鎖特異度を有し、これは、いくつかのcfRNA試料が残留DNAからのシグナルによって支配されることを示唆する。リード鎖の色は、NC67におけるセンス及びアンチセンスリード対NC3におけるセンスリードのみの均一な分布を示す。更に、DNAの存在で予想されるように、NC67におけるイントロン及びエクソンの両方にわたって豊富なカバレッジが存在する。高レベルのDNA汚染を有する試料における断片長の分布は、それらがcfDNAの長さ分布(中央値約160)を模倣することを示し、未消化cfDNAが主要な汚染物質であることを強く示唆している。
【0268】
0.84未満の分位95鎖特異度を有する試料にフラグを立て、その後の分析から除去した。DNA汚染に起因するRNAカウントの増大に対して更に保護するために、本明細書で提示される遺伝子カウントは、2つのリードのうちの少なくとも1つがエクソン-エクソン接合部にわたってマッピングするリード対として定義される厳密なカウントを使用して生成される。cfRNA試料中にスパイクされたcfDNAの様々なレベルを使用して行われた実験は、厳密なカウントを使用したRNAレベルの推定が変化しないままであることを示し、遺伝子発現を定量化及び比較するためのパイロット研究試料における厳密なカウントの使用を支持した。
【0269】
ダークチャネル特徴選択
ダークチャネル遺伝子は以下の基準によって特定された:1)非癌群におけるこの遺伝子の発現中央値(RPM)は0であり、この遺伝子の標準偏差は0.1RPM未満である。各癌のタイプのダークチャネルバイオマーカー(DCB)を、以下の基準を用いて特定した。1)遺伝子が発現される特定の癌群には少なくとも2つの試料が存在し、2)2番目に高い発現試料のRPMは0.1より大きく、3)遺伝子は非癌群と比較して特定の癌群において差次的に発現される(肺癌についてはp値<2e-02及び乳癌についてはp値<2e-01)。2群差次的発現のp値をedgeRパッケージによって計算した。肺癌群と非癌群との間に、FDR<0.05を有する816の遺伝子が存在する。乳癌群と非癌群との間に、FDR<0.05を有する28の遺伝子が存在する。結腸直腸癌群と非癌群との間に、FDR<0.05を有する4つの遺伝子が存在する。箱型図及びヒートマップについて、本発明者らは、最も有意な差次的に発現された遺伝子のみを示した(肺癌及び乳癌についてはFDR<2e-06、並びに結腸直腸癌についてはFDR<2e-02)。
【0270】
組織特異的遺伝子のアノテーションを以下のように行った。肺癌、乳癌、及び結腸癌についての組織特異的遺伝子ファイルを、ヒトタンパク質アトラス(Human Protein Atlas)ウェブサイト(www.proteinatlas.org/)からダウンロードした。組織特異的遺伝子は、3つのカテゴリーに分けられる:1)組織濃縮:全ての他の組織と比較して、特定の組織において少なくとも4倍高いmRNAレベル、2)2~5組織の群において少なくとも4倍高いmRNAレベル、3)組織増強:全ての組織における平均レベルと比較して、特定の組織において少なくとも4倍高いmRNAレベル。3つのカテゴリーは全て、組織特異的遺伝子の本発明者らの定義に含まれた。
【0271】
組織特異的遺伝子の濃縮を試験するために、1)フィッシャーの正確検定を適用して、全てのアノテーションされたヒト遺伝子について肺DCBと肺特異的遺伝子との間の独立性を試験した。2)フィッシャーの正確検定を適用して、全てのアノテーションされたヒト遺伝子について乳房DCBと乳房特異的遺伝子との間の独立性を試験した。
【0272】
実施例6:cfRNA癌バイオマーカーのパネル
正常な非癌コホートとは異なる全トランスクリプトームから肺及び乳癌特異的cfRNAバイオマーカーを特定し、癌バイナリ検出及びプラズマからの起源組織(TOO)の特定に有用であり得る癌試料からのcfRNAにおいて特異的に表される生物学的シグナルを特定する研究を設計した。本発明者らは、初期段階で検出することが困難であり得る癌サブタイプ、すなわち、肺腺癌並びにHR+及びトリプルネガティブ(TNBC)乳癌に関連する遺伝子特徴を特定する研究に焦点を当てた。
【0273】
この分析を行うために使用されたデータは、1)CCGA及び商業ベンダーから配列決定された全トランスクリプトーム血漿データ、2)TCGAからの全トランスクリプトーム組織データ、及び3)ヒトタンパク質アトラス(Human Protein Atlas)(Uhlenら、Science 2015年)からの遺伝子アノテーションを含んだ。循環無細胞ゲノムアトラス(Circulating Cell-free Genome Atlas)研究(CCGA、NCT02889978)から、ステージIIIの乳癌及び肺癌試料のサブセットを選択し、配列決定した。ステージIIIの試料は、潜在的な二次転移からの交絡シグナルを回避しながら血液中のシグナルを最大化するように選択した。合計で、本発明者らは、CCGAからの47の乳癌、14の肺腺癌、及び93の非癌血漿試料を分析した。更に、本発明者らは、商業ベンダー(Conversant)から供給された全トランスクリプトーム試料の追加のセットを含めた。これは、血液中のバイオマーカーの後期シグナルを捕捉するために含まれた14のステージIV乳癌血漿試料のセットを含んでいた。これらの血漿由来データを使用して、どの遺伝子が健常血漿において発現され、どの遺伝子が癌血漿において差次的に発現されるかを定義し、これはこれらのサブタイプにおける癌の二元検出に有用であり得る。本発明者らは、各試料についての遺伝子発現を、RPM(リード/100万)正規化遺伝子特徴行列にコンパイルした。ここで、各試料は列であり、各行は遺伝子特徴である。
【0274】
この研究には、GDCポータルからダウンロードされた、TCGAコンソーシアムからの乳癌(BRCA)及び肺腺癌(LUAD)組織全トランスクリプトームデータも含まれる。合計で、これは、ステージI~IVにわたる533の肺腺癌及び1102の乳癌試料を含んだ。これらのデータを使用して、バイナリ検出のための高発現腫瘍由来遺伝子特徴を特定した。更に、この高次元データは、TOOに使用され得る組織特異的遺伝子特徴を特定するために有用であった。本発明者らは、各試料についての遺伝子発現を、RPM(リード/100万)正規化遺伝子特徴行列にコンパイルした。ここで、各試料は列であり、各行は遺伝子特徴である。
【0275】
最後に、本発明者らは、癌腫瘍試料及び健常組織からの様々なオミクス技術(トランスクリプトーム及び抗体ベース)のオープンアクセス編集であり、組織コンパートメント及び疾患アノテーションを提供する、ヒトタンパク質アトラス(Human Protein Atlas)に全ての遺伝子特徴を問い合わせた。本発明者らは、これらのアノテーションを使用して、診断時の腫瘍における発現レベル及び患者の全生存率に基づいて、遺伝子が癌のタイプに濃縮/増強されているかどうか、及び疾患予後にとって好ましい/好ましくないかどうかを捕捉した。
【0276】
バイナリ検出及びTOO分類のための標的のセットを確立するために、本発明者らはまず、GDCデータポータルからダウンロードされたTCGA組織発現データを使用して可能性のあるバイオマーカーを選択する可能性があるかどうかを評価した。各遺伝子について、本発明者らは、両方のコホートにおける試料にわたる平均遺伝子発現を計算し、コホートにわたるピアソン相関を計算した。一般的に、本発明者らは、TCGA組織における高い平均遺伝子発現が、CCGA血漿における高い平均遺伝子発現と大まかに相関することを見出した(乳癌については0.568、肺癌については0.509のスピアマンのrho)。したがって、本発明者らは、TCGA組織データが特徴選択に有益であり得ると推論した。本発明者らは、1rpmを超える平均TCGA組織発現を有する遺伝子特徴を、癌由来血漿において検出可能である可能性が高く、二元癌検出又は原発組織検出のいずれかについて潜在的に有益であるものとして優先付けた。可能性のある一般的なアーチファクト誘導転写物(HLA、IGH、IGL、及びリボソーム遺伝子にマッピングされる転写物)についてこれらをフィルタリングした後、これは、2898の潜在的な遺伝子特徴をもたらした。
【0277】
しかしながら、これらの遺伝子特徴がTCGA組織において高度に発現されたとしても、これらの遺伝子特徴が血漿中でどのように優勢に発現されたかは不明であった。血漿と比較した組織における平均RPMのプロットを、図22(乳癌)及び図23(肺癌)に示す。図21は、癌組織試料において高レベルで発現される遺伝子についての例示的な結果を提供し、血漿中に検出可能な転写物はほとんどないか全くない。遺伝子特徴選択もまた、CCGAからの血漿中の発現から得られた情報を活用して行った。本発明者らは、CCGA血漿試料において検出されたか又は検出されなかった遺伝子発現特徴を二値化し、検出されたのは、0.005リード/100万(RPM)以上の発現であった。次いで、本発明者らは、全ての癌血漿から全ての非癌血漿までの観察に基づいて、各遺伝子について血漿対数オッズ比(LOR)を計算した。これにより、遺伝子が非癌試料中に存在する可能性よりも、遺伝子が癌試料中に存在する可能性が定量化される。LOR>0は、非癌症例に対して癌症例において遺伝子が検出される可能性が高いことを示し、LOR<0は、癌症例に対して非癌症例において遺伝子が検出される可能性が高いことを示す。本発明者らは、LOR>0.1を有する血漿中の最も有益な遺伝子を選択し、281の遺伝子特徴をもたらした。cfRNAバイオマーカーについてのLORの例示的プロットを図24に示す。
【0278】
更に、本発明者らは、どの遺伝子特徴がTOO分類に特に有用であるかを評価することに着手した。cfRNAについてのCCGAデータセットは200未満の試料に限定されるため、本発明者らは、TCGA腫瘍遺伝子行列を使用し、再帰的特徴除去アルゴリズムを実施して、肺腺癌、乳房HR+、及び乳房TNBC癌を区別するのに重要な遺伝子特徴を特定することを決定した。ランダムフォレストマルチクラスモデルを使用して、全ての遺伝子特徴にわたる10倍交差検証を用いて、上位K個の遺伝子を再帰的に選択した。折畳み全体で精度を最適化することによって、反復にわたって特徴が排除される。交差検証モデルは、750の遺伝子特徴を使用した場合に96.7%の精度でTCGA試料を分類するため、本発明者らは、これらの上位750のバイオマーカーを、組織におけるサブタイプ分類にとって重要であると特定した。
【0279】
ヒトタンパク質アトラス(Human Protein Atlas)は、癌腫瘍試料並びに健常組織試料からのTCGAトランスクリプトミクス及び抗体ベースのタンパク質データをコンパイルして、本発明者らがバイナリ検出及びTOOのための遺伝子特徴を優先するために使用した2つの特異的アトラスを提供する。組織アトラス(Tissue Atlas)は、正常組織におけるmRNA及びタンパク質レベルに基づいて、組織濃縮された(他の組織と比較して組織において上昇した)及び組織増強された(低い特異度で組織において発現された)遺伝子についてのアノテーションを含む。更に、病理アトラス(Pathology Atlas)は、診断時の腫瘍における発現レベル及び患者の全生存率に基づいて、濃縮された(他の腫瘍と比較して腫瘍型において上昇した)又は増強された(低い特異度で腫瘍のタイプにおいて発現された)癌のタイプである遺伝子、並びに疾患予後にとって好ましい/好ましくない遺伝子についてのアノテーションを含む。本発明者らは、乳癌及び肺癌についてこれらのアノテーションを有する潜在的なバイオマーカーとして遺伝子をマークした(3028の遺伝子特徴)。
【0280】
血漿中に見出される転写物の大部分は、健常免疫細胞に由来すると考えられる。癌検出を混乱させ得る健常白血球中に存在しないバイオマーカーを選択するために、本発明者らは、CGMAコホートからの健常固体由来の血漿において低い発現を有する遺伝子特徴をフィルタリングした(中央値RPM<1、標準偏差RPM<0.1)。これらの得られた41391の遺伝子特徴は、「ダークチャネル」と呼ばれる。本発明者らは更に、バイナリ癌検出及びTOOバイオマーカーを特定する際に前述のアプローチを統合することによって、これらのダークチャネルをフィルタリングした。癌関連遺伝子特徴について遺伝子二値化LOR>0.1となるように、又は遺伝子がランダムフォレストモデルによって選択された750の遺伝子に含まれるように、ダークチャネルをフィルタリングした。これらの遺伝子を、ヒトタンパク質アトラス(Human Protein Atlas)によってアノテーションされるように、又は平均発現がTCGAコホートにおいて5RPMを超えるように、更にフィルタリングした。追加の陽性対照及び実施例1~4からのDCB遺伝子を、この更新されたバイオマーカーセットに加え、cfRNAバイオマーカーの総数を467にし、これを表15に列挙する(そのサブセットを表11に提供する)。表14の遺伝子は、特に有益なcfRNAバイオマーカーのサブセットを表す。乳癌及び肺癌について選択されたバイオマーカーについての例示的な結果を、それぞれ図10A及び20Bに示す。
【0281】
実施例7:ポリペプチドバイオマーカーの検出
CCGA研究からのcfDNA及びcfRNAデータを使用して、タンパク質ベースのアッセイにおいて目的の遺伝子を濃縮するようにタンパク質パネルを設計し、非癌血漿中のベースラインタンパク質レベルと比較した。特に、表16Bに列挙される選択された遺伝子のタンパク質産物を含む、CCGA研究において特定されたcfRNAマーカーに対応するポリペプチドを分析した。この分析に使用され得るタンパクベースの検出アッセイには、多重反応モニタリング(MRM)質量分析(例えば、Caprionによる)などの質量分析アッセイ、近接伸長アッセイ(例えば、Olinkによる)、又は磁気ナノ粒子タンパクコロナなどの親和標識アッセイとそれに続く質量分析(例えば、SEERによる)が含まれる。
【0282】
本実施例では、近接伸長アッセイ(PEA)によってポリペプチドを検出した。各バイオマーカーについて、近接プローブと呼ばれる、固有のオリゴヌクレオチドバーコードに連結された抗体の一致対が、それぞれのタンパク質標的に同時に結合する。タンパク質標的が試料中に存在する場合、近接プローブは近接して互いにハイブリダイズし、核酸ドメインの少なくとも1つがその3’末端から伸長することを可能にする核酸二本鎖を形成する。DNAポリメラーゼの添加は、プローブの1つに結合したハイブリダイズするオリゴの伸長をもたらし、これは、その後、定量的リアルタイムPCRによって検出及び定量することができるDNAアンプリコンを生成する。
【0283】
PEAアッセイのために、全血試料をStreck Cell-free DNA BCT(登録商標)チューブに採取し、これを輸送し、血漿分離前に周囲温度で保存した。試料は、3組の対象からのものであった:(1)CCGA研究からの対象の第1の組(「CCGA1」、n=38)、(2)CCGA研究からの対象の第2の組(「CCGA2」、n=393)、及び(3)Discovery Life Sciencesからの試料の組(「DLS」、n=42)。対象には、乳癌若しくは肺癌を有する対象、又は癌と診断されていない対象(「非癌」)が含まれた。いくつかの分析のために、試料を、0.3%未満の腫瘍画分を有するもの(「低TF」)、0.3%を上回る腫瘍画分を有するもの(「高TF」)、及び/又は対象が診断された癌のタイプ(例えば、乳癌又は肺癌)として更にサブグループ化した。全血を4℃で10分間1600×gで遠心分離して血漿を分離した。血漿層を別のチューブに移し、15000×g、4℃で12分間遠心分離して、細胞汚染物質を更に除去した。二重遠心血漿を、更なる使用まで-80℃で保存した。約40~80uLの二重遠心血漿を希釈し、近接伸長アッセイ(PEA)への入力として使用した。
【0284】
標的ペプチドのレベルを、各標的ペプチドに対応する配列決定されたバーコードリードの数に基づくカウントとして測定した。伸長対照カウントに対するタンパク質カウントの比を、伸長対照カウントに対するプレート対照タンパク質カウントの培地比で除算して、各標的ペプチドについて正規化カウントを生成した。正規化カウントの中央値は、各ペプチドについての正規化カウントを試料正規化カウントの中央値で割ることによって計算した。この試料主要正規化は、収集条件及び生体交絡因子(例えば、総タンパク質濃度の変動、収集された試料に対する個体の食事又は運動の影響など)を説明した。
【0285】
試料を、表16Bに列挙されるバイオマーカー遺伝子によってコードされるタンパク質について試験した。判定されたバイオマーカーポリペプチド発現レベルを、癌血漿試料と非癌血漿試料との間で比較して、癌の状態、特に乳癌及び肺癌を特徴付けるための閾値を定義した。この分析からの例示的な結果を、乳癌については図27A~27Cに、肺癌については図28A~28Cに示す。循環WFDC2、CXCL17、MMP12、GDF15、CEACAM5、PRSS8、TFF1、CWC15、ALPP、GP2、INSL4、CHGA、GFRA1、AGR2、SPON1、DXO、AIF1、FKBPL、SFTPA2、及びFOLR1タンパク質は、血漿試料において非癌状態と肺癌状態とを区別するのに有用であることが見出され、p<0.05レベルで統計的に有意であった(例えば、図28A~28Cを参照されたい)。循環ADAMTS15、LEP、ERBB2、ERBB4、CGA、AFP、F7、BPIFB2、SFRP1、FGFBP1、LAMA4、GP2、MIA、FGFR2、及びVTCN1タンパク質は、非癌対象と比較して乳癌対象の間でより高く、p<0.05レベルで統計的に有意であることが見出された(例えば、図27A~27Bを参照されたい)。比較すると、本実施例では、SCGB2A2としても知られるマモグロビンのポリペプチドレベルは、非癌対象試料と乳癌対象試料とをそれだけで区別することが見出されなかった(図27C)。
【0286】
これらの結果は、本明細書において特定された癌についてのダークチャネル無細胞RNAバイオマーカーが、癌についての循環ポリペプチドバイオマーカーを選択するのに有用であることを示しており、これはまた、腫瘍組織及び循環の両方においてより高度に豊富である可能性が高い。更に、cfRNAバイオマーカー、並びにそれらがコードするポリペプチドのレベルを使用して、対象における癌状態と非癌状態とを区別すること、並びに起源の癌組織又は癌サブタイプを特定することができる。
【0287】
実施例8:ポリペプチド、cfDNA、及びcfRNAを用いた癌のマルチオミクス検出
低い腫瘍画分は、血液中の初期段階の癌の検出を困難にする。cfDNA及びcfRNAと併せて、ポリペプチドなどの異なるタイプの腫瘍由来シグナルを活用するマルチオミクスアプローチは、感度及び組織起源特定を改善する。そのようなアプローチは、初期段階の癌に対する癌検出感度を向上させ、原発不明癌(CUP)に対する原発組織特定を解明し、以前に検証されたポリペプチドマーカーを使用して癌サブタイプの特定を助けるという利点を有する。
【0288】
ポリペプチドは、遺伝情報の流れにおける最終段階を表す。標的cfRNA分子は、cfDNAと比較して増幅される。標的ポリペプチドも増幅され、cfRNAよりも長寿命である。マンマグロビンの場合、ポリペプチドレベルは、cfRNAレベルと相関する。本明細書に記載されるcfRNAバイオマーカーについてのシグナルは、ポリペプチドバイオマーカー選択を導くために使用することができ、cfRNA及びポリペプチドの両方の検出は、検出精度を増加させるために一緒に使用される。
【0289】
実施例9:癌試料におけるcfRNAバイオマーカーの評価
表15に列挙される467のcfRNAバイオマーカーを、低腫瘍画分を有する検出困難な乳癌及び肺癌における癌を特定し、非癌を区別する能力について試験した。全ての試料を、試料中の任意の遺伝子において観察された最も高い証拠に基づいてスコア化した。本発明者らは、高シグナル癌におけるシグナルのいくつかの証拠を有する全ての遺伝子を選択した。各試料について、本発明者らは、全ての他の非癌よりもその試料において多くの証拠を有する全ての遺伝子を特定し、以下の基準を順に使用して、各試料における上位証拠遺伝子によって試料をランク付けした:(1)任意の非癌において観察された最大カウント(より低いものがより良好である)、(2)任意の高シグナル癌において観察された最大カウント(より高いものがより良好である)、及び(3)その試料において観察されたカウント。訓練及びホールドアウト試料セットにおいてこれらのバイオマーカーを使用して、一つ抜き分類器を評価した。結果を図7に示す。アスタリスクによって示されるように、検証コホート特異度は、訓練コホートと比較して有意な減少(p=.0.02)を有した。理論に束縛されることを望むものではないが、これは、この特定の実験における潜在的な過剰適合を示し得る。
【0290】
cfRNAバイオマーカーに基づく一つ抜き分類器を、DNAメチル化癌バイオマーカーについて低シグナル又は高シグナルを有する癌試料に適用した。試料は、肺癌及び乳癌試料を含んだ。分類器は、図8A~8Cに示すように、高い特異度性能を示した。
【0291】
いくつかの遺伝子は、特に有益なcfRNA癌バイオマーカーであることが証明されており、いくつかは乳癌又は肺癌に対する特異度を有し、いくつかは乳癌及び肺癌の両方において上昇している。これらの33の遺伝子を上記の表8に列挙する。結果を、図26A~26Dにおいて、厳密なリードカウントについてグラフで示す。これらの33の遺伝子についての結果に関する更なる詳細を、以下の表20に提供する。
【0292】
【表21】
厳密なRNA数が最大非癌数又は2のいずれか高い方を超えた場合、遺伝子が検出されたと呼んだ。
【0293】
参考文献
Kleinら、Development of a comprehensive cell-free DNA(cfDNA)assay for early detection of multiple tumor types:The Circulating Cell-free Genome Atlas(CCGA)study.ASCO(2018年)。
【0294】
Uhlenら、Tissue-based map of the human proteome(www.proteinatlas.org)。Science doi:10.1126/science.1260419(2015年)。
【0295】
A.M.Newmanら、An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage.Nat.Med.20、548-554(2014年)。
【0296】
E.Kirkizlarら、Detection of Clonal and Subclonal Copy-Number Variants in Cell-Free DNA from Patients with Breast Cancer Using a Massively Multiplexed PCR Methodology.Transl.Oncol.8、407-416(2015年)。
【0297】
S.Y.Shenら、Sensitive tumour detection and classification using plasma cell-free DNA methylomes.Nature 563、579-583(2018年)。
【0298】
C.Bettegwdaら、Detection of circulating tumor DNA in early-and late-stage human malignancies.Sci.Transl.Med.6、224ra24(2014年)。
【0299】
K.C.A.Chanら、Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberration by plasma DNA bisulfite sequencing.Proc.Natl.Acad.Sci.U.S.A.110、18761-18768(2013年)。
【0300】
I.S.Haque、O.Elemento、Challenges in Using ctDNA to Achieve Early Detection of Cancer.bioRxiv、237578(2017年)。
【0301】
K.C.Chanら、Cancer genome scanning in plasma:detection of tumor-associated copy number aberrations,single-nucleotide variants,and tumoral heterogeneity by massively parallel sequencing.Clin.Chem.59、211-224(2013年)。
【0302】
C.Abboshら、Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution.Nature 545、446-451(2017年)。
【0303】
K.-W.Loら、Analysis of Cell-free Epstein-Barr Virus-associated RNA in the Plasma of Patients with Nasopharyngeal Carcinoma.Clin.Chem.45、1292-1294(1999年)。
【0304】
M.S.Kopreski、F.A.Benko、L.W.Kwak,C.D.Gocke、Detection of tumor messenger RNA in the serum of patients with malignant melanoma.Clin.Cancer Res.Off.J.Am.Assoc.Cancer Res.5、1961-1965(1999年)。
【0305】
J.D.Arroyoら、Argonaute2 complexes carry a population of circulating microRNAs independent of vesicles in human plasma.Proc.Natl.Acad.Sci.U.S.A.108、5003-5008(2011年)。
【0306】
P.M.Godoyら、Large Differences in Small RNA Composition Between Human Biofluids.Cell Rep.25、1346-1358(2018年)。
【0307】
M.F.de Souzaら、Circulating mRNAs and miRNAs as candidate markers for the diagnosis and prognosis of prostate cancer.PLoS ONE 12(2017年)。
【0308】
G.Y.F.Hoら、Differential expression of circulating microRNAs according to severity of colorectal neoplasia.Transl.Res.166、225-232(2015年)。
【0309】
I.Lee、D.Baxter、M.Y.Lee、K.K.Scherler、K.Wang、The importance of standardization on analyzing circulating RNA.Mol.Diagn.Ther.21、259-268(2017年)。
【0310】
X.Q.Chenら、Telomerase RNA as a detection marker in the serum of breast cancer patients.Clin.Cancer Res.Off.J.Am.Assoc.Cancer Res.6、3823-3826(2000年)。
【0311】
17.R.C.Kamm,A.G.Smith、Ribonuclease activity in human plasma.Clin.Biochem.5、198-200(1972年)。
【0312】
T.El-Hefnawyら、Characterization of amplifiable,circulating RNA in plasma and its potential as a tool for cancer diagnostics.Clin.Chem.50、564-573(2004年)。
【0313】
N.B.Y.Tsui、E.K.O.Ng、Y.M.D.Lo、Stability of endogenous and added RNA in blood specimens,serum,and plasma.Clin.Chem.48、1647-1653(2002年)。
【0314】
J.D.Arroyoら、Argonaute2 complexes carry a population of circulating microRNAs independent of vesicles in human plasma.Proc.Natl.Acad.Sci.U.S.A.108、5003-5008(2011年)。
【0315】
G.J.S.Talhouarne、J.G.Gall、7SL RNA in vertebrate red blood cells.RNA 24、908-914(2018年)。
【0316】
L.A.Hancockら、Muc5b overexpression causes mucociliary dysfunction and enhances lung fibrosis in mice.Nat.Commun.9、1-10(2018年)。
【0317】
T.Handaら、Caspase14 expression is associated with triple negative phenotypes and cancer stem cell marker expression in breast cancer patients.J.Surg.Oncol.116、706-715(2017年)。
【0318】
Hrstkaら、The pro-metastatic protein anterior gradient-2 predicts poor prognosis in tamoxifen-treated breast cancers.Oncogene 29、4838-4847(2010年)。
【0319】
M.Pizziら、Anterior gradient 2 overexpression in lung adenocarcinoma.Appl.Immunohistochem.Mol.Morphol.AIMM 20、31-36(2012年)。
【0320】
H.Cho、A.B.Mariotto、L.M.Schwartz、J.Luo、S.Woloshin、When do changes in cancer survival mean progress? The insight from population incidence and mortality.J.Natl.Cancer Inst.Monogr.2014、187-197(2014年)。
【0321】
Y.M.Loら、Rapid clearance of fetal DNA from maternal plasma.Am.J.Hum.Genet.64、218-224(1999年)。
【0322】
M.A.Watson、T.P.Fleming、Mammaglobin,a mammary-specific member of the uteroglobin gene family,is overexpressed in human breast cancer.Cancer Res.56、860-865(1996年)。
【0323】
G.H.Lewisら、Relationship between molecular subtype of invasive breast carcinoma and expression of gross cystic disease fluid protein 15 and mammaglobin.Am.J.Clin.Pathol.135、587-591(2011年)。
【0324】
R.-Z.Liuら、A fatty acid-binding protein 7/RXRβpathway enhances survival and proliferation in triple-negative breast cancer.J.Pathol.228、310-321(2012年)。
【0325】
A.Corderoら、FABP7 is a key metabolic regulator in HER2+ breast cancer brain metastasis.Oncogene 38、6445-6460(2019年)。
【0326】
H.Zhangら、The proteins FABP7 and OATP2 are associated with the basal phenotype and patient outcome in human breast cancer.Breast Cancer Res.Treat.121、41-51(2010年)。
【0327】
J.Xiaoら、Eight potential biomarkers for distinguishing between lung adenocarcinoma and squamous cell carcinoma.Oncotarget 8、71759-71771(2017年)。
【0328】
M.Grageda、P.Silveyra、N.J.Thomas、S.L.DiAngelo、J.Floros、DNA methylation profile and expression of surfactant protein A2 gene in lung cancer.Exp.Lung Res.41、93-102(2015年)。
【0329】
Z.Zhangら、High expression of SLC34A2 is a favorable prognostic marker in lung adenocarcinoma patients.Tumour Biol.J.Int.Soc.Oncodevelopmental Biol.Med.39、1010428317720212(2017年)。
【0330】
F.Diehlら、Circulating mutant DNA to assess tumor dynamics.Nat.Med.14、985-990(2008年)。
【0331】
Liu M.C.ら、Sensitive and specific multi-cancer detection and localization using methylation signature in cell-free DNA.Ann Oncol.31(6)、745-59(2020年)。
【0332】
Anderson、N Leigh。「The clinical plasma proteome:a survey of clinical assays for proteins in plasma and serum」。Clinical chemistry vol.562(2010):177-85。doi:10.1373/clinchem.2009.126706.
【0333】
Zehentner,Barbara Kら「Mammaglobin as a novel breast cancer biomarker:multigene reverse transcription-PCR assay and sandwich ELISA」、Clinical chemistry vol.5011(2004年):2069-76.doi:10.1373/clinchem.2004.038687。
【0334】
本開示全体を通して、特許、特許出願、特許公開、雑誌、書籍、論文、ウェブコンテンツなどの他の文書への参照及び引用がなされている。全てのそのような文書は、全ての目的のためにその全体が参照により本明細書に組み込まれる。
【0335】
本発明の種々の改変及びその多くの更なる実施形態は、本明細書中に示され記載されるものに加えて、本明細書中に引用される科学文献及び特許文献への参照を含む、本文書の全内容から当業者に明らかになる。本明細書の主題は、その様々な実施形態及びその均等物において本発明の実施に適合させることができる重要な情報、例示、及びガイダンスを含む。本明細書を通して引用される全ての参考文献は、参照により本明細書に明示的に組み込まれる。
【0336】
実施形態の前述の詳細な説明は、本開示の特定の実施形態を示す添付の図面を参照する。異なる構造及び動作を有する他の実施形態は、本開示の範囲から逸脱しない。「本発明」という用語は、本明細書に記載される出願人の発明の多くの代替的な態様又は実施形態のいくつかの特定の例を参照して使用され、その使用もその不使用も、出願人の発明の範囲又は特許請求の範囲を限定するものではない。本明細書は、単に読者の便宜のためにセクションに分割される。見出しは、本発明の範囲を限定するものとして解釈されるべきではない。定義は、本発明の説明の一部として意図される。本発明の様々な詳細は、本発明の範囲から逸脱することなく変更され得ることが理解されるであろう。更に、前述の説明は、例示のみを目的としており、限定を目的としていない。
【0337】
本発明をその特定の実施形態を参照して説明してきたが、本発明の真の趣旨及び範囲から逸脱することなく、様々な変更を行うことができ、等価物を代用することができることを当業者は理解されたい。更に、本発明の目的、精神及び範囲に対して、特定の状況、材料、物質の組成、プロセス、プロセス工程(単数又は複数)に適合するように多くの改変がなされてもよい。全てのこのような改変は、本明細書に添付される特許請求の範囲内であることが意図される。
図1
図2
図3
図4
図5
図6
図7
図8A
図8B
図8C
図9
図10
図11
図12A
図12B
図12C
図13
図14A
図14B
図15A
図15B
図16A
図16B
図16C
図16D
図17A
図17B
図18A
図18B
図18C
図19
図20A
図20B
図21
図22
図23
図24
図25
図26A
図26B
図26C
図26D
図27A
図27B
図27C
図28A
図28B
図28C
【国際調査報告】