(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-26
(54)【発明の名称】結腸細胞増殖性障害を早期発見するためのマーカー
(51)【国際特許分類】
G01N 33/53 20060101AFI20231019BHJP
G01N 33/574 20060101ALI20231019BHJP
【FI】
G01N33/53 N
G01N33/574 A
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023520319
(86)(22)【出願日】2021-09-30
(85)【翻訳文提出日】2023-06-05
(86)【国際出願番号】 US2021052816
(87)【国際公開番号】W WO2022076237
(87)【国際公開日】2022-04-14
(32)【優先日】2020-10-05
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521040846
【氏名又は名称】フリーノム ホールディングス,インク.
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】オドノヴァン,ブライアン ディー.
(72)【発明者】
【氏名】マハジャン,シヴァニ
(57)【要約】
【解決手段】本明細書に開示されるシステム、液体媒体、組成物、方法およびキットは、大腸癌を含む結腸細胞増殖性障害を早期発見するための自己抗体バイオマーカーのパネルに関する。本明細書に記載される自己抗体パネルについて、生体試料中の自己抗体の存在またはレベルは、分類子生成のために、および集団中の対象を分類するのに有用な機械学習モデルにおける入力として結腸細胞増殖性障害の検出のために使用され得る。
【選択図】
図2
【特許請求の範囲】
【請求項1】
結腸細胞増殖性障害に特徴的である予め定められた自己抗体パネルであって、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む、自己抗体パネル。
【請求項2】
前記3つ以上の自己抗体は、IgG自己抗体、IgM自己抗体、またはそれらの組み合わせである、請求項1に記載の自己抗体パネル。
【請求項3】
健康な対象、良性大腸ポリープの対象、進行性腺腫の対象、または大腸癌の対象を鑑別するように構成されている、請求項1または2に記載の自己抗体パネル。
【請求項4】
進行性腺腫を示すように構成されており、かつ、1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含んでいる、請求項1~3のいずれか1つに記載の自己抗体パネル。
【請求項5】
大腸癌を示すように構成されており、かつ、
1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含んでいる、請求項1~3のいずれか1つに記載の自己抗体パネル。
【請求項6】
前記結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項1~3のいずれか1つに記載の自己抗体パネル。
【請求項7】
健康な対象の集団と結腸細胞増殖性障害の対象とを鑑別するように構成された分類子であって、
a)前記結腸細胞増殖性障害に特徴的である予め定められた自己抗体パネルの自己抗体を表す測定値のセット、
b)前記測定値が、健康な対象および結腸細胞増殖性障害を有する対象の自己抗体発現データから得られること、
c)前記測定値が、前記自己抗体の特性に対応する特徴のセットを生成するために使用され、前記特徴のセットが機械学習モデルまたは統計モデルに入力されること、および
d)前記モデルが、前記健康な対象の集団と前記結腸細胞増殖性障害を有する対象とを鑑別可能な分類子として有用である特徴ベクトルを提供すること
を含む、分類子。
【請求項8】
前記予め定められた自己抗体パネルは、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、PRDM8、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される抗原に対する自己抗体を含む、請求項7に記載の分類子。
【請求項9】
前記自己抗体は、IgG自己抗体、IgM自己抗体、またはそれらの組み合わせである、請求項7または8に記載の分類子。
【請求項10】
前記パネルは、健康な対象、良性大腸ポリープの対象、進行性腺腫の対象、または大腸癌の対象を鑑別するように構成されている、請求項7~9のいずれか1つに記載の分類子。
【請求項11】
前記パネルは、進行性腺腫を示すように構成されており、かつ、1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含む、請求項7~9のいずれか1つに記載の分類子。
【請求項12】
前記パネルは、大腸癌を示すように構成されており、かつ、1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含む、請求項7~9のいずれか1つに記載の分類子。
【請求項13】
前記結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項7~9のいずれか1つに記載の分類子。
【請求項14】
結腸細胞増殖性障害を検出するための機械学習モデル分類子を備えるシステムであって、
a)予め定められた自己抗体パネルに少なくとも部分的に基づいて対象を分類するように操作可能な分類子を備えるコンピュータ可読媒体と、
b)前記コンピュータ可読媒体に記憶される命令を実行するための1つ以上のプロセッサと
を備える、システム。
【請求項15】
コンピュータシステムのメモリにロードされた請求項7に記載の分類子を備えており、前記機械学習モデルは、訓練用の生体試料から得られた訓練ベクトルを用いて訓練され、前記訓練用の生体試料の第1のサブセットは結腸細胞増殖性障害を有していると識別され、および前記訓練用の生体試料の第2のサブセットは結腸細胞増殖性障害を有していないと識別される、請求項14に記載のシステム。
【請求項16】
前記予め定められた自己抗体パネルは、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、PRDM8、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む、請求項14または15に記載のシステム。
【請求項17】
前記分類子は、深層学習分類子、ニューラルネットワーク分類子、線形判別分析(LDA)分類子、二次判別分析(QDA)分類子、サポートベクターマシン(SVM)分類子、ランダムフォレスト(RF)分類子、K最近傍分類子、線形カーネルサポートベクターマシン分類子、1次または2次多項式カーネルサポートベクターマシン分類子、リッジ回帰分類子、エラスティックネットアルゴリズム分類子、逐次最小問題最適化アルゴリズム分類子、ナイーブベイズアルゴリズム分類子、および主成分分析分類子からなる群から選択される、請求項14または15に記載のシステム。
【請求項18】
対象の自己抗体プロファイルを判定するための方法であって、
a)対象から生体試料を得る工程と、
b)前記対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの自己抗体の量を測定する工程と
を含む、方法。
【請求項19】
前記自己抗体プロファイルは、結腸細胞増殖性障害に関連付けられ、かつ結腸細胞増殖性障害を有するものとして前記対象の分類を提供する、請求項18に記載の方法。
【請求項20】
前記対象から得られる前記生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、組織生検、およびそれらの組み合わせからなる群から選択される、請求項18または19に記載の方法。
【請求項21】
前記結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項18または19に記載の方法。
【請求項22】
対象の結腸細胞増殖性障害を検出するための方法であって、
a)前記対象から生体試料を得る工程と、
b)前記対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの自己抗体の量を測定する工程と、
c)健康な対象と前記結腸細胞増殖性障害の対象とを鑑別可能となることで前記結腸細胞増殖性障害の存在に関連する出力値を提供し、それにより前記対象の前記結腸細胞増殖性障害の存在を示すように訓練された機械学習モデルを使用して、前記自己抗体プロファイルを処理する工程と
を含む、方法。
【請求項23】
前記自己抗体プロファイルは、結腸細胞増殖性障害に関連付けられ、かつ前記結腸細胞増殖性障害を有するものとして前記対象の分類を提供する、請求項22に記載の方法。
【請求項24】
前記対象から得られる前記生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、組織生検、およびそれらの組み合わせからなる群から選択される、請求項22または23に記載の方法。
【請求項25】
前記結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項22または23に記載の方法。
【請求項26】
前記自己抗体パネルは、進行性腺腫を示すように構成されており、かつ、1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含む、請求項22~24のいずれか1つに記載の方法。
【請求項27】
前記自己抗体パネルは、大腸癌を示すように構成されており、かつ、1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含む、請求項22~24のいずれか1つに記載の方法。
【請求項28】
前記対象のメチル化プロファイルを提供するために、前記生体試料中の1つ以上の核酸分子のメチル化状態を検出する工程をさらに含む、請求項22~27のいずれか1つに記載の方法。
【請求項29】
前記機械学習モデルを使用して、前記メチル化プロファイルを処理する工程をさらに含む、請求項28に記載の方法。
【請求項30】
前記対象のタンパク質プロファイルを提供するために、前記生体試料中の1つ以上のタンパク質の量を測定する工程をさらに含む、請求項22~29のいずれか1つに記載の方法。
【請求項31】
前記機械学習モデルを使用して、前記タンパク質プロファイルを処理する工程をさらに含む、請求項30に記載の方法。
【請求項32】
対象の結腸細胞増殖性障害を検出するための方法であって、
a)前記対象から生体試料を得る工程と、
b)前記対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程と、
c)前記対象のメチル化プロファイルを提供するために前記生体試料中の1つ以上の核酸分子のメチル化状態を検出するか、または前記対象のタンパク質プロファイルを提供するために前記生体試料中の1つ以上のタンパク質の量を測定する工程と、
d)健康な対象と前記結腸細胞増殖性障害の対象とを鑑別可能となることで前記結腸細胞増殖性障害の存在に関連する出力値を提供し、それにより前記対象の前記結腸細胞増殖性障害の存在を示すように訓練された機械学習モデルを使用して、前記自己抗体プロファイルおよび前記メチル化プロファイルまたは前記タンパク質プロファイルを処理する工程と
を含む、方法。
【請求項33】
前記自己抗体プロファイルは、前記結腸細胞増殖性障害に関連付けられ、かつ前記結腸細胞増殖性障害を有するものとして前記対象の分類を提供する、請求項32に記載の方法。
【請求項34】
前記メチル化プロファイルは、前記結腸細胞増殖性障害に関連付けられ、かつ前記結腸細胞増殖性障害を有するものとして前記対象の分類を提供する、請求項32または33に記載の方法。
【請求項35】
前記タンパク質プロファイルは、前記結腸細胞増殖性障害に関連付けられ、かつ前記結腸細胞増殖性障害を有するものとして前記対象の分類を提供する、請求項32または33に記載の方法。
【請求項36】
健康な対象と前記結腸細胞増殖性障害の対象とを鑑別するために、前記メチル化プロファイルは前記機械学習モデルにおいて前記自己抗体プロファイルと組み合わされる、請求項32~35のいずれか1つに記載の方法。
【請求項37】
健康な対象と前記結腸細胞増殖性障害の対象とを鑑別するために、前記タンパク質プロファイルは前記機械学習モデルにおいて前記自己抗体プロファイルと組み合わされる、請求項32~35のいずれか1つに記載の方法。
【請求項38】
前記対象から得られる前記生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、組織生検、およびそれらの組み合わせからなる群から選択される、請求項32~37のいずれか1つに記載の方法。
【請求項39】
前記結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項32~38のいずれか1つに記載の方法。
【請求項40】
前記自己抗体パネルは、進行性腺腫を示すように構成されており、かつ、1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含む、請求項32~39のいずれか1つに記載の方法。
【請求項41】
前記自己抗体パネルは、大腸癌を示すように構成されており、かつ、1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含む、請求項32~40のいずれか1つに記載の方法。
【請求項42】
前記対象に前記結腸細胞増殖性障害の処置を施す工程をさらに含む、請求項22~41のいずれか1つに記載の方法。
【請求項43】
前記処置は、手術、高周波焼灼療法、化学療法、放射線療法、標的療法、および免疫療法からなる群から選択される、請求項42に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2020年10月5日に出願された、米国仮特許出願第62/835,281号の利益を主張し、これはその全体が引用により本明細書に組み込まれる。
【0002】
本開示は、進行性腺腫および大腸癌を含む直腸細胞増殖性障害の早期発見のためのバイオマーカーおよび方法に関する。
【背景技術】
【0003】
大腸癌は、欧米諸国における癌関連死亡の主な原因である。固形癌の中でも最も特徴づけられるものの一つですが、大腸癌は診断が遅いため、先進国の主要な死因の一つであり続けている。他の理由の中でも、患者の診断が遅れるのは、大腸内視鏡検査などの診断検査の実施時期が遅すぎることが原因となっている。大腸癌による死亡は、効果的なスクリーニングによって予防することができる。
【発明の概要】
【0004】
本開示は、大腸癌の検出および疾患の進行に関連する生体試料の自己抗体プロファイリングを対象とする方法およびシステムを提供する。
【0005】
一態様では、本開示は、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む結腸細胞増殖性障害に特徴的である予め定められた自己抗体パネルを提供する。
【0006】
いくつかの実施形態では、3つ以上の自己抗体は、IgG自己抗体、IgM自己抗体、またはそれらの組み合わせである。
【0007】
いくつかの実施形態では、パネルは、健康な対象、良性大腸ポリープの対象、進行性腺腫の対象、または大腸癌の対象を鑑別するように構成されている。
【0008】
いくつかの実施形態では、パネルは、進行性腺腫を示すように構成されており、および
1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0009】
いくつかの実施形態では、パネルは、大腸癌を示すように構成されており、および
1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0010】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0011】
他の態様では、本開示は、健康な対象の集団と結腸細胞増殖性障害を有する対象とを鑑別するように構成された分類子を提供し、該分類子は、結腸細胞増殖性障害に特徴的である予め定められた自己抗体パネルの自己抗体を表す測定値のセットを含み、測定値は、健康な対象および結腸細胞増殖性障害を有する対象の自己抗体発現データから得られ、測定値が、自己抗体の特性に対応する特徴のセットを生成するために使用され、特徴のセットが機械学習または統計モデルに入力され、およびモデルが、健康な対象の集団と結腸細胞増殖性障害を有する対象とを鑑別可能な分類子として有用である特徴ベクトルを提供する。
【0012】
いくつかの実施形態では、予め定められた自己抗体パネルは、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、PRDM8、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む。
【0013】
いくつかの実施形態では、3つ以上の自己抗体は、IgG自己抗体、IgM自己抗体、またはそれらの組み合わせである。
【0014】
いくつかの実施形態では、パネルは、健康な対象、良性大腸ポリープの対象、進行性腺腫の対象、または大腸癌の対象を鑑別するように構成されている。
【0015】
いくつかの実施形態では、パネルは進行性腺腫を示すように構成されており、および
1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0016】
いくつかの実施形態では、パネルは大腸癌を示すように構成されており、および1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0017】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0018】
他の態様では、本開示は、結腸細胞増殖性障害を検出するための機械学習モデル分類子を備えるシステムを提供しており、該システムは、予め定められた自己抗体パネルに少なくとも部分的に基づいて対象を分類するように作動可能な分類子を含むコンピュータ可読媒体、コンピュータ可読媒体に格納される命令を実行するための1つ以上のプロセッサとを含む。
【0019】
いくつかの実施形態では、分類子はコンピュータシステムのメモリにロードされ、機械学習モデルは、訓練用の生体試料から得られた訓練ベクトルを用いて訓練され、訓練用の生体試料の第1のサブセットが結腸細胞増殖性障害を有すると同定され、および訓練用の生体試料の第2のサブセットが結腸細胞増殖性障害を有していないと同定される。
【0020】
いくつかの実施形態では、予め定められた自己抗体パネルは、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、PRDM8、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む。
【0021】
いくつかの実施形態では、分類子は、深層学習分類子、ニューラルネットワーク分類子、線形判別分析(LDA)分類子、二次判別分析(QDA)分類子、サポートベクターマシン(SVM)分類子、ランダムフォレスト(RF)分類子、K最近傍分類子、線形カーネルサポートベクターマシンク分類子、1次または2次多項式カーネルサポートベクターマシン分類子、リッジ回帰分類子、エラスティックネットアルゴリズム分類子、逐次最小問題最適化アルゴリズム分類子、ナイーブベイズアルゴリズム分類子、主成分分析分類子からなる群から選択される。
【0022】
他の態様では、本開示は、対象の自己抗体プロファイルを決定するための方法を提供しており、該方法は、対象から生体試料を得る工程、および対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程を含む。
【0023】
いくつかの実施形態では、自己抗体プロファイルは、結腸細胞増殖性障害に関連付けられ、かつ結腸細胞増殖性障害を有するものとして対象の分類を提供する。
【0024】
いくつかの実施形態では、対象から得られる生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、組織生検、およびそれらの組み合わせからなる群から選択される。
【0025】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0026】
他の態様では、本開示は、対象において結腸細胞増殖性障害を検出するための方法を提供しており、該方法は、対象から生体試料を得る工程、対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程、および、健康な対象と結腸細胞増殖性障害を有する対象とを鑑別することができ、結腸細胞増殖性障害の存在に関連する出力値を提供し、それによって、対象の結腸細胞増殖性障害の存在を示すように訓練された機械学習モデルを使用して自己抗体プロファイルを処理する工程を含む。
【0027】
いくつかの実施形態では、自己抗体プロファイルは、結腸細胞増殖性障害に関連付けられ、かつ結腸細胞増殖性障害を有するものとして対象の分類を提供する。
【0028】
いくつかの実施形態では、方法は、メチル化プロファイルを提供するために、生体試料中の核酸分子のメチル化状態を検出する工程をさらに含む。
【0029】
いくつかの実施形態では、方法は、機械学習モデルを使用して、メチル化プロファイルを処理する工程をさらに含み、健康な対象と結腸細胞増殖性障害の対象とを鑑別するために、メチル化プロファイルは機械学習モデルにおいて自己抗体プロファイルと組み合わされる。
【0030】
いくつかの実施形態では、方法は、タンパク質プロファイルを提供するために、生体試料中の1つ以上タンパク質の量を測定する工程をさらに含む。
【0031】
いくつかの実施形態では、方法は、機械学習モデルを使用して、タンパク質プロファイルを処理する工程をさらに含み、健康な対象と結腸細胞増殖性障害の対象とを鑑別するために、タンパク質プロファイルは機械学習モデルにおいて自己抗体プロファイルと組み合わされる。
【0032】
いくつかの実施形態では、対象から得られる生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、組織生検、およびそれらの組み合わせからなる群から選択される。
【0033】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0034】
いくつかの実施形態では、パネルは進行性腺腫を示すように構成されており、および1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0035】
いくつかの実施形態では、パネルは大腸癌を示すように構成されており、および1)PELO、CDK4、MTP1、PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0036】
いくつかの実施形態では、方法は、対象において結腸細胞増殖性障害の処置を施す工程をさらに含む。いくつかの実施形態では、処置は、手術、高周波焼灼療法、化学療法、放射線療法、標的療法、および免疫療法からなる群から選択される。
【0037】
本開示のさらなる態様および利点は、以下の詳細な記載から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、記載されている。理解されるように、本開示は、他の実施形態および異なる実施形態においても可能であり、その様々な詳細は、そのすべてが本開示から逸脱することなく様々な明白な点で修正することができる。したがって、図面および説明は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。
【0038】
引用による組み込み
本明細書で言及されるすべての公開物、特許、および特許出願は、あたかも個々の公開物、特許、または特許出願がそれぞれ参照により本明細書に具体的かつ個別に組み込まれるのと同じ程度にまで、参照により本明細書に組み込まれている。引用により組み込まれる刊行物および特許または特許出願が、本明細書に含まれる開示に矛盾する程度まで、本明細書は、そのような矛盾のある題材に取って代わる、および/または、上記題材よりも優先するように意図される。
【図面の簡単な説明】
【0039】
本発明の新規な特徴は、とりわけ添付の請求項で説明される。本発明の特徴と利点は、本発明の原理が用いられる例示的な実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(“Figure”および“FIG.”)」とも称される)とを参照することにより、より良く理解されるであろう。
【
図1】本明細書に提供される方法を実施するために、機械学習モデルおよび分類子を用いてプログラムされるか、または他の方法で構成されるコンピュータシステムの概略図を提供する。
【
図2】CRC分類のための上位の5のAAb標的のCV係数を示すグラフを提供する。
【
図3】CRC分類のための再帰的特徴除去をCVで示すグラフを提供する。
【
図4】AA分類のための上位の10のAAb標的のCV係数を示すグラフを提供する。
【
図5】AA分類のための再帰的特徴除去をCVで示すグラフを提供する。
【
図6】NAA分類のための上位の5のAAb標的のCV係数を示すグラフを提供する。
【
図7】NAA分類のための再帰的特徴除去をCVで示すグラフを提供する。
【発明を実施するための形態】
【0040】
本発明の様々な実施形態が本明細書中で示され、記載されている一方、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。ここで、本発明から逸脱することなく、多数の変更、変化、および置換がなされることが、当業者によって理解され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。
【0041】
大腸癌は、欧米諸国における癌関連死亡の主な原因である。大腸癌は固形癌の中でも最も特徴づけられたものの一つであるが、大腸癌は診断が遅いため、先進国の主要な死因の一つであり続けている。他の理由のうち、大腸内視鏡検査などの診断検査の実施時期が遅いことが、患者の診断の遅れの原因となっている。大腸癌による死亡は、効果的なスクリーニングによって防ぐことができる。癌患者では、腫瘍関連抗原に対する特異的な抗体反応が確認されている。これらの抗体反応は、腫瘍細胞内の自己タンパク質の構造または発現の変化によって引き起こされ得るため、いくつかの抗体の存在は、癌の免疫学的マーカーとなる可能性がある。
【0042】
本開示は、一般的に、癌検出および疾患モニタリングに関する。より具体的には、本開示は、早期大腸癌などの結腸細胞増殖性障害における癌関連自己抗体検出および疾患モニタリングに関する。特に、大腸癌(CRC)および/または大腸腺腫(CA)、例えば、進行性大腸腺腫(AA)などの結腸細胞増殖性障害を有する、または発症するリスクのあるヒト対象を識別するための循環自己抗体シグネチャーパネルおよびその用途が提供される。
【0043】
本開示は、例えば、対象が大腸病変を有する場合に、結腸細胞増殖性障害の存在、または結腸細胞増殖性障害を発症する高いリスクを示す、対象における腫瘍抗原関連自己抗体(「tAAbs」または「自己抗体」)を記載する。癌検診およびモニタリングは、早期発見により癌が増殖および拡大する前に排除できるため、生存率を向上させる。例えば、大腸癌では、大腸内視鏡検査が早期診断の改善に役割を果たす。不運にも、患者の受診率は低く、侵襲性が高いため、定期的な受診は推奨されていない。
【0044】
本明細書に記載されるのは、結腸細胞増殖性障害を患う対象において発現が上方制御または過剰発現される自己抗体の発現プロファイルまたは存在量に少なくとも部分的に基づいて、結腸細胞増殖性障害を有する、または有するリスクのある対象をスクリーニングまたは識別する方法である。本明細書にさらに記載されるのは、対象、例えば、ヒトの対象における結腸細胞増殖性障害の診断に有用なデータを得るための方法である。
【0045】
結腸細胞増殖性障害は、任意の腫瘍段階(例えば、TX、T0、Tis、T1、T2、T3、T4)、任意の領域リンパ節または遠隔転移の段階(例えば、NX、N0、N1、M0、M1)、任意の段階(例えば、0期(Tis、N0、M0)、IA期(T1、N0、M0)、IIA期(T3、N0、M0)、IIB期(T1-3、N1、M0)、III期(T4、任意のN、M0)またはIV期(任意のT、任意のN、M1))、切除可能、 局所進行性(切除不能)、または転移性であってもよい。
【0046】
スクリーニングツールは、偽陽性および偽陰性の結果、ならびに特異度および感度が原因で損なわれることがある。理想的な癌スクリーニングツールは、不必要な検査を最小限に抑え(偽陽性が低い)、かつ大多数の癌を検出する(偽陰性が低い)、高い陽性予測値(PPV)を有し得る。もう一つの重要な妥協点は「検出感度」であり、これは検査感度とは異なる。検出感度とは、腫瘍のサイズに基づく検出の下限値である。腫瘍が、検出可能なレベルの循環腫瘍マーカーを放出するのに十分な大きさまで成長することを可能にすると、癌の早期発見および進行予防の目的が失われる。従って、大腸癌の早期診断のために、高感度で効果的な血液ベースのスクリーニングが必要とされる。
【0047】
「リキッドバイオプシー」と知られる循環腫瘍DNAの検出は、非侵襲的な方法で腫瘍の検出および情報調査を可能にする。これらのリキッドバイオプシーにおける腫瘍特異的な変異の同定は、結腸癌、乳癌、および前立腺癌の診断に使用されてきた。しかし、循環する正常な(すなわち、非腫瘍由来の)DNAのバックグラウンドが高いため、これらの技術は感度が制限される可能性がある。したがって、リスクのある集団の再発スクリーニングおよび一次スクリーニングのために、早期または低腫瘍負担の大腸癌腫瘍マーカーを検出するための、より高感度で特異的なスクリーニングツールの必要性が存在し続けている。腫瘍関連抗原に対する循環自己抗体は、本明細書に記載される機械学習モデルで使用され得る、リキッドバイオプシー試料中の有益なバイオマーカーの供給源を提供する。
【0048】
本開示は、結腸細胞増殖性障害およびその進行、例えば、大腸癌に関連する循環自己抗体のプロファイリングを対象とする方法およびシステムを提供する。結腸細胞増殖性障害の存在または結腸細胞増殖性障害を発症する高いリスクを示すそれらの自己抗体は、例えば、対象が大腸病変のみを有する場合、できるだけ早期に結腸細胞増殖性障害を診断、処置、または進行を防止するために使用され得る。本明細書においてさらに提供されるのは、対象において、特に、対象が大腸病変を有する場合に、結腸細胞増殖性障害を診断するため、または結腸細胞増殖性障害の発症リスクを評価するためのキットおよび方法である。
【0049】
一態様では、本明細書に提供されるのは、疾患状態に基づいて対象からの試料を鑑別するために自己抗体のパネルを使用する方法である。他の態様では、本明細書に提供されるのは、自己抗体のパネルを使用して結腸細胞増殖性障害を検出、識別、および鑑別することを対象とする方法、アッセイ、およびキットである。結腸細胞増殖性障害の非限定的な例は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫を含む。
【0050】
いくつかの実施形態では、本明細書で提供されるのは、結腸細胞増殖性障害の識別、検出、および鑑別のためのマーカーとして選択される1つ以上の自己抗体を使用する方法である。
【0051】
定義
本明細書および特許請求の範囲で使用されるように、単数形の「a」、「and」、および「the」は、内容が他に明確に示していない限り、複数の参照を含む。例えば、「核酸」という用語は複数の核酸を含み、その混合物も含む。
【0052】
本明細書で使用されるように、用語「対象」は、検査可能または検出可能な遺伝子情報を有する実体または媒体を意味する。対象は、人、個体、または患者であり得る。対象は脊椎動物、例えば、哺乳動物などであり得る。哺乳動物の非限定的な例としては、ヒト、サル、家畜動物、競技用動物、げっ歯類、およびペットが挙げられる。対象は、対象の疾患または障害などの対象の健康または生理的な状態または条件を示す症状を呈することがある。代替案として、対象は、そのような健康または生理的な状態または条件に関して無症状であり得る。
【0053】
本明細書で使用されるように、「試料」という用語は一般的に、1人以上の対象から得られた、または対象に由来する生体試料を指す。生体試料は、無細胞の生体試料または実質的に無細胞の生体試料であってもよく、または無細胞の生体試料を生成するために処理または分画されてもよい。例えば、無細胞の生体試料は無細胞のリボ核酸(cfRNA)、無細胞のデオキシリボ核酸(cfDNA)、無細胞の胎児DNA(cffDNA)、タンパク質、自己抗体、血漿、血清、尿、唾液、羊水およびそれらの誘導体を含むことがある。無細胞の生体試料は、エチレンジアミン四酢酸(EDTA)採取管、無細胞のRNA採取管(例えば、Streck(登録商標)RNA Complete BCT(登録商標))、または無細胞のDNA採取管(例えば、Streck(登録商標)Cell-Free BCT(登録商標))を用いて、対象から入手されることもあれば、導き出されることもある。無細胞の生体試料は、分画(例えば、差動遠心分離による)により全血試料から由来することがある。生体試料またはその誘導体は、細胞を含んでいてもよい。例えば、生体試料は、血液試料またはその誘導体(例えば、採血管または血液滴下により採取された血液)であってもよい。
【0054】
本明細書で使用されるように、用語「無細胞の試料」は、一般的に、無傷細胞を実質的に含まない生体試料を指す。無細胞の試料は、それ自体が実質的に細胞を含まない生体試料から得られる場合もあり、細胞が除去された試料から得られる場合もある。無細胞の試料の非限定的な例は、血液、血清、血漿、尿、精液、唾液、便、導管滲出液、リンパ、および回復した洗浄液に由来したものを含む。
【0055】
本明細書で使用されるように、用語「結腸細胞増殖性障害」は、一般的に、結腸または直腸の細胞の増殖の乱れまたは異常を含む疾患または疾病を指す。結腸細胞増殖性障害の非限定的な例は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫を含む。本明細書で使用されるように、略語「CRC」は大腸癌と診断された対象の生体試料を同定するために使用される。本明細書で使用されるように、略語「AA」は少なくとも1つの進行性腺腫と診断された対象の試料を同定するために使用される。本明細書で使用されるように、略語「NAA」は進行性腺腫または大腸癌ではなく良性大腸の腫瘍であると診断された対象の試料を同定するために使用される。
【0056】
本明細書で使用されるように、用語「大腸癌」は、小腸以下の腸管(大腸(colon)、例えば、盲腸、上行結腸、横行結腸、下行結腸、S状大腸)の細胞が癌化することを特徴とする疾病である。
【0057】
本明細書で使用されるように、用語「大腸腺腫」は、一般的に、腺腫性ポリープとも称され、良性であり大腸癌の前癌段階である大腸の腺腫を指す。大腸腺腫は、大腸癌への進行のリスクが高いことを示す場合がある。
【0058】
本明細書で使用されるように、用語「進行性大腸腺腫」は、大きさが10mm以上の腺腫、または組織学的に20%を超える高悪性度異形成または絨毛成分を有する腺腫を指す。
【0059】
本明細書で使用されるように、用語「結腸細胞増殖性障害を発症するリスク」または「結腸細胞増殖性障害を発症する高リスク」は、一般的に、結腸細胞増殖性障害を有していないまたは近い将来に結腸細胞増殖性障害を発症するリスクが低い対象と比較して、近い将来に結腸細胞増殖性障害を発症するリスクが増加する対象を指す。本明細書で使用されるように、「近い将来」という用語は、一般的に、約1ヶ月~約2年、約6ヶ月~約18ヶ月、または約1年の期間を指す。
【0060】
本明細書で使用されるように、一般的に、癌の「タイプ」および「サブタイプ」という用語は相対的に使用され、例えば、乳癌などの癌の1つの「タイプ」が、例えば、段階、形態、組織、遺伝子発現、受容体プロファイル、変異プロファイル、攻撃性、予後、および悪性特性に基づいて「サブタイプ」となり得る。同様に、「タイプ」および「サブタイプ」は、より細かいレベルで適用され得、例えば、1つの組織学的な「タイプ」を、例えば、変異プロファイルまたは遺伝子発現に従って定義される「サブタイプ」に識別することができる。癌「段階」は、疾患の進行に関連する組織学的および病理学的特徴に基づく癌のタイプの分類を指すためにさらに使用される。
【0061】
用語「新生物」は、一般的に、組織のあらゆる新しい異常な成長を指す。したがって、新生物は、前悪性新生物または悪性新生物であり得る。「新生物特異的マーカー」という用語は、新生物の存在を示すために使用され得る任意の生体材料を指す。生体材料の例としては、限定されないが、核酸、ポリペプチド、炭水化物、脂肪酸、細胞成分(例えば、細胞膜およびミトコンドリア)、および全細胞が挙げられる。大腸新生物特異的マーカー」という用語は、大腸新生物(例えば、前悪性大腸新生物;悪性大腸新生物)の存在を示すために使用され得る任意の生体材料を指す。
【0062】
本明細書で使用されるように、「健康」という用語は、一般的に、結腸細胞増殖性障害を有していない対象を指す。健康は動的な状態であるが、本明細書で使用されるように、この用語は、特定の陳述で言及されている疾患状態を欠く対象の病理学的状態を指す。一例では、大腸癌を有する対象を分類することができるシグネチャーパネルを指す場合、健康な個体、健康な試料、または健康な個体からの試料は、大腸癌(CRC)、進行性腺腫(AA)、または良性腺腫(NAA)を欠く個体を指す。本明細書で使用されるように、略語「NAA」は、大腸腫瘍が陰性であると評価された個体からの試料を識別するために使用され、そのため、ある実施形態では、NAAとして識別された試料は、健康試料の群に含まれる。他の疾患または健康状態がその対象に存在する可能性があるが、本明細書で使用されるように、「健康」という用語は、一般的に、議論される疾患状態を有する対象と有さない対象の間の比較または分類の目的で、述べられた疾患が存在しないことを示す。
【0063】
用語「微小残存病変」または「MRD」は、一般的に、癌治療後の対象の体内の少数の癌細胞を指す。MRD検査は、癌治療の有効性を判断し、さらなる治療計画を導くために実施されることがある。
【0064】
本明細書で使用されるように、用語「スクリーニング」は、一般的に、大腸癌または大腸腺腫に罹患する危険性のある対象の集団を検査または試験することを指し、健康な対象と未診断の大腸癌または大腸腺腫に罹っている対象、または前記適応症に罹患する危険性が高い対象を区別することを目的とする。
【0065】
本明細書で使用されるように、「侵襲性の低い生体試料」または「非侵襲性試料」という用語は、一般的に、対象から血液を採取するために使用する細い針以外の器具を必要とせずに患者の身体から採取されるあらゆる試料を指す。いくつかの実施形態では、侵襲性の低い生体試料は、血液、血清、または血漿の試料を含む。
【0066】
本明細書で使用されるように、用語「アップレギュレートされた」または「過剰発現された」は、一般的に、予め定められた「閾値」または「カットオフ値」に対して、少なくとも5%まで、少なくとも10%まで、少なくとも15%まで、少なくとも20%まで、少なくとも25%まで、少なくとも30%まで、少なくとも35%、少なくとも40%まで、少なくとも45%まで、少なくとも50%まで、少なくとも55%まで、少なくとも60%まで、少なくとも65%まで、少なくとも70%まで、少なくとも75%まで、少なくとも80%まで、少なくとも85%まで、少なくとも90%まで、少なくとも95%まで、少なくとも100%まで、少なくとも110%まで、少なくとも120%まで、少なくとも130%まで、少なくとも140%まで、少なくとも150%まで、または150%以上の発現レベルの上昇を指す。
【0067】
本明細書で使用されるように、発現レベルについて言及する場合、用語「閾値」または「カットオフ値」は、一般的に、対象の発現レベルが前記閾値またはカットオフもしくは参照レベルを上回る場合、対象が予め定められた感度および特異性で大腸癌または大腸腺腫を患う可能性があることを示す参照発現レベルを指す。
【0068】
本明細書で使用されるように、用語「キット」は、特定の装置に限定されることなく、一般的に、マイクロアレイ、バイオアレイ、バイオチップ、バイオチップアレイ、またはビーズベースアッセイなどの本発明を実施するのに適した任意の装置を含むが、これらに限定されない。
【0069】
試料のアッセイ
無細胞の生体試料は、ヒト対象から得られるか、またはヒト対象に由来することがある。無細胞の試料は、異なる温度(例えば、室温、冷蔵または冷凍庫条件下、例えば、25℃、4℃、-18℃、-20℃、または-80℃)または異なる懸濁液(例えば、EDTA収集管、無細胞のRNA収集管、または無細胞のDNA収集管)など、処理前に様々な保存条件で保存されてもよい。
【0070】
無細胞の生体試料は、癌を有する対象、癌を有することが疑われる対象、または癌を有さない若しくは有することが疑われない対象から得ることができる。
【0071】
無細胞の生体試料は、癌を患う対象の治療前および/または治療後に得ることができる。無細胞の生体試料は、処置中または処置レジメン中に対象から得られてもよい。複数の無細胞の生体試料は、経時的な処置の効果を監視するために対象から得られてもよい。無細胞の生体試料は、臨床検査を介して確定的な陽性または陰性診断が得られない癌を有することが知られている、または疑われている対象から採取される場合がある。試料は、癌を有することが疑われる対象から採取されてもよい。無細胞の生体試料は、疲労、吐き気、体重減少、痛みおよび疼痛、脱力感、または出血などの原因不明の症状を経験している対象から採取されてもよい。無細胞の生体試料は、説明された症状を有する対象から採取されてもよい。無細胞の生体試料は、家族歴、年齢、高血圧もしくは高血圧予備軍、糖尿病もしくは糖尿病予備軍、過体重もしくは肥満、環境曝露、生活様式危険因子(例えば、喫煙、アルコール摂取、または薬物使用)、または他の危険因子の存在などの要因によって癌を発症するリスクのある対象者から採取されてもよい。
【0072】
無細胞の生体試料は、トランスクリプトーム(transcriptomic)データを生成するためのアッセイに適した無細胞のリボ核酸(cfRNA)分子、ゲノムデータを生成するためのアッセイに適した無細胞のデオキシリボ核酸(cfDNA)分子、プロテオームデータを生成するためのアッセイに適したタンパク質分子(自己抗体含む)、またはそれらの混合物若しくは組み合わせなど、アッセイが可能な1つ以上の分析物が包含されてもよい。
【0073】
対象から無細胞の生体試料を得た後、対象の結腸細胞増殖性障害を示すデータセットを生成するために無細胞の生体試料は処理されてもよい。例えば、自己抗体のパネルにおいて無細胞の生体試料の抗体分子の存在、不在、または定量的評価である。対象から得られた無細胞の生体試料を処理することは、(i)無細胞の生体試料を、複数の自己抗体を分離、濃縮、または抽出するのに十分な条件にさらすこと、および(ii)データセットを生成するために複数の自己抗体分子をアッセイすることを含み得る
【0074】
生体試料は、試料の自己抗体プロファイルを生成するために、自己抗体のアッセイにおいて直接使用され得る。いくつかの実施形態では、生体試料は、アッセイ前に自己抗体のために(例えば、タンパク質結合マイクロビーズを使用して)濃縮され得る。1つの実施形態では、生体試料は、血漿試料であり、濃縮される。生体試料は、生体試料中の抗体の存在および/または濃度もしくはレベルを判定するために、様々な実験室の方法論でアッセイされ得る。様々な実施形態では、そのようなアプローチは、対象からの生体試料の自己抗体プロファイルを決定するための、タンパク質マイクロアレイ、高密度タンパク質マイクロアレイ(例えば、CDI)、ELISA、Meso Scale Discovery、ビーズベースの免疫アッセイ(例えば、Luminex(登録商標)磁気ビーズベースの捕捉アッセイ)、二次フルオロ抗体アッセイ、またはそれらの組合せを含んでもよいが、それらに限定はされない。
【0075】
シグネチャーパネル
本開示は、生体試料を分析して、試料中で同定された自己抗体分子の組み合わせから、結腸細胞増殖性障害の発症に関連する測定可能な特徴を得るための方法およびシステムを提供する。本明細書に記載の同定された自己抗体分子の収集物は、結腸細胞増殖性障害またはその段階を検出するための分類子の作成、およびそのモデルにおいて、情報価値を有する。同定された自己抗体分子は、個々に情報価値があり有益であり得るが、自己抗体分子は、本明細書に記載される組み合わせで使用され、シグネチャーが結腸細胞増殖性障害またはその段階の特徴であるシグネチャーパネルを形成し得る。シグネチャーパネルからの特徴は、訓練されたアルゴリズム(例えば、機械学習モデル)を使用して処理され、結腸細胞増殖性障害を有する対象の集団を層別化するように構成された分類子を作成し得る。本方法は、シグネチャーパネルに記載される1つ以上の自己抗体を使用することを特徴とする。1つの実施形態では、少なくとも3つの自己抗体のシグネチャーパネルは、本明細書に記載される分類子および方法に有用である。
【0076】
本明細書に記載される自己抗体シグネチャーパネルは、結腸細胞増殖性障害に関連する特定の自己抗体を迅速かつ特異的に分析することを可能にし得る。本明細書の方法に記載され、採用されるシグネチャーパネルは、結腸細胞増殖性障害の診断、予後、治療選択、およびモニタリング(例えば、治療モニタリング)の改善ために使用することができる。
【0077】
本シグネチャーパネルおよび方法は、全血、血漿、または血清などの体液試料から早期の結腸細胞増殖性障害を検出する現在のアプローチに比べ、大きな改善をもたらす。結腸細胞増殖性障害を検出および診断するために使用される現在の方法には、結腸内視鏡検査、S状結腸鏡検査、および便潜血結腸癌が含まれる。これらの方法と比較して、本明細書で提供される方法は、大腸内視鏡検査よりもはるかに侵襲性が低く、S状結腸鏡検査、便免疫化学検査(FIT)、および便潜血検査(FOBT)よりも、感度が高くないとしても同様に、高い場合がある。本明細書で提供される方法は、遺伝子パネルと高感度アッセイ技術との使用の有利な組み合わせによって、感度および特異性の点で大きな利点を提供する。
【0078】
本開示は、結腸細胞増殖性障害の検出および疾患の進行に関連する腫瘍抗原関連自己抗体(「tAAb」または「自己抗体」)の自己抗体プロファイリングを対象とする方およびシステムを提供する。本発明の特定の実施形態は、結腸細胞増殖性障害を有さない、または発症するリスクが低い対象の対応する試料と比較して、結腸細胞増殖性障害を有する、または発症するリスクが高い対象の試料において差次的に豊富に存在する自己抗体を提供する。1つの実施形態では、結腸細胞増殖性障害を発症するリスクが高い対象および結腸増殖性障害を発症するリスクが低い対象の各々は、大腸粘膜内に生じた非侵襲性の前駆病変(以下、大腸病変)を有する。健康な対象と結腸細胞増殖性障害を有する対象の試料中に異なる量で存在する自己抗体は、結腸細胞増殖性障害の診断、治療、および/または予防のためのバイオマーカーとして利用され得る。
【0079】
本明細書に記載される方法および分類子に情報価値のある自己抗体を同定するために、結腸細胞増殖性障害を有する患者の血漿および結腸細胞増殖性障害を有さない対象の血漿(対照血漿または参照血漿)を検査し、結腸細胞増殖性障害を有する患者が前記結腸細胞増殖性障害およびそのそれぞれの反応タンパク質に応答して産生する自己抗体のシグネチャーパネルを特定した。そのために、大腸細胞増殖性障害を有する患者さんの血漿と対照血漿を、高密度タンパク質マイクロアレイを用いて検査した。タンパク質マイクロアレイは、自己抗体の同定に使用される他のアプローチと比較して、i)アレイにプリントされるタンパク質があらかじめ既知であるため、その後の同定を防ぎ、ミモトープの選択の可能性をなくすことができる、 およびii)タンパク質がすべて同じような濃度でプリントされているため、どのタンパク質を選択するかという素因がない、という一連の利点を提供する。この因子の組み合わせによって、バイオマーカーを高感度に同定することができる。
【0080】
本明細書で同定された自己抗体は、結腸細胞増殖性障害を有する対象を結腸細胞増殖性障害を有さない対象と鑑別するように同定するために、または結腸細胞増殖性障害を発症するリスクが高い対象を結腸細胞増殖性障害を発症するリスクが低い対象と鑑別するために、または結腸細胞増殖性障害の前兆を有する対象を識別するために使用可能である。このように、これらの自己抗体は、結腸細胞増殖性障害のモニタリング、処置、および管理に関する決定を導く補助的なツールとして使用することができる。
【0081】
特定の実施形態にでは、本明細書に開示されるのは、結腸増殖性障害の早期検出に有用であり、大腸癌の早期検出に関連する血漿腫瘍抗原関連自己抗体(TAAb)バイオマーカーのパネルである。
【0082】
他の実施形態では、本明細書に開示されるのは、検出、診断、および治療関連の方法である。患者の血漿は結腸増殖性障害の表示として腫瘍由来のタンパク質に腫瘍抗原関連自己抗体(TAAb)のためにスクリーニングされる。
【0083】
一態様では、本開示は、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する免疫グロブリンを含む結腸細胞増殖性障害に特徴的である自己抗体パネルを提供する。
【0084】
1つの実施形態では、免疫グロブリンはIgG、IgM、またはそれらの組み合わせである。
【0085】
1つの実施形態では、自己抗体シグネチャーパネルは、健康な対象、良性大腸ポリープの対象、進行性腺腫の対象、または大腸癌の対象を鑑別することに有用である。
【0086】
1つの実施形態では、パネルは進行性の腺腫を示すのに役立ち、NME5、USP16、UBE2S、RNF41、SDCBPとCD20からなる群から選択された少なくとも3つの抗原に対するIgM自己抗体を含む。1つの実施形態では、パネルは、UBE2、NME5とCD20に対するIgM自己抗体を含む。1つの実施形態では、パネルは進行性の腺腫を示すのに役立ち、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7とASB9からなる群から選択された少なくとも3つの抗原に対するIgG自己抗体を含む。1つの実施形態では、パネルは、ASB9、NAT6、Supt6hとPRDM8に対するIgG自己抗体を含む。
【0087】
1つの実施形態では、パネルは進行性の腺腫を示すのに役立ち、次のものを含む:
1)NME5、USP16、UBE2S、RNF41、CD20、およびSDCBPからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)UBE2S、NME5、およびCD20からなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、PCOLCE、およびASB9からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)ASB9、NAT6、Supt6h、およびPRDM8からなる群から選択される少なくとも1つの抗原に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0088】
1つの実施形態では、パネルは良性ポリープを有する対象の試料を示すのに役立ち、NXN、EYA1、GSPT1とMLIPからなる群から選択された少なくとも3つの抗原に対するIgG自己抗体を含む。
【0089】
1つの実施形態では、パネルは良性ポリープを有する対象の試料を示すのに役立ち、ZBTB21に対するIgM自己抗体を含む。
【0090】
1つの実施形態では、パネルは大腸癌を示すのに役立ち、PELO、CDK4、MTCP1、PRMT6、PCOLCEとZBtb2からなる群から選択された少なくとも3つの抗原に対するIgM自己抗体を含む。1つの実施形態では、パネルは、TSSC4、BRD9、BCCIPとTP53に対するIgG自己抗体の少なくとも3つ枚を含む。1つの実施形態では、パネルは、CDK4、PRMT6とMTCP1に対するIgM自己抗体を含む。1つの実施形態では、パネルは、TP53とRBM38に対するIgG自己抗体を含む。
【0091】
1つの実施形態では、パネルは大腸癌を示すのに役立ち、次のものを含む:1)PELO、 CDK4、 MTP1、 PRMT6 ZBTB2、およびPCOLCEからなる群から選択される少なくとも3つの抗原に対するIgM自己抗体、2)CDK4、MTCP1、およびPCOLCEからなる群から選択される少なくとも1つの抗原に対するIgM自己抗体、3)TSSC4、BRD9、BCCIP、およびTP53からなる群から選択される少なくとも3つの抗原に対するIgG自己抗体、4)TP53に対するIgG自己抗体、またはこれらの組み合わせを含んでいる。
【0092】
いくつかの実施形態では、自己抗体の予め定められたセットは、本明細書に記載される抗原などの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、またはそれ以上の抗原に対する自己抗体を含む。いくつかの実施形態では、自己抗体の予め定められたセットは、本明細書に記載される抗原などの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ以上の抗原に対する自己抗体を含む。
【0093】
いくつかの実施形態では、予め定められたパネル中の自己抗体は、IgMおよびIgGの自己抗体である。1つの実施形態では、予め定められたパネル中の自己抗体はIgM自己抗体である。1つの実施形態では、予め定められたパネル中の自己抗体はIgG自己抗体である。
【0094】
分類子、機械学習モデルおよびシステム
機械学習アプローチは、対象から得られた生体試料に由来する自己抗体データを特徴付け、有益な自己抗体のパネルを同定するために使用される。結腸細胞増殖性障害に有益な自己抗体の同定されたパネルは、健康な対象からの試料と結腸細胞増殖性障害を有する対象の試料を鑑別するのに有用な分類子モデルの訓練に有用である。
【0095】
さらに本明細書で記載されるのは、健康な対象の血漿試料および結腸細胞増殖性障害を有する対象の血漿試料に発現する本明細書に記載される自己抗体で訓練した機械学習モデル分類子である。機械学習モデルを訓練することによって、健康な対象または結腸細胞増殖性障害を有する対象を分類するのに有用な自己抗体バイオマーカーの予め定められたセット(「自己抗体パネル」または「シグネチャーパネル」)を有する分類子が得られる。1つの例では、組織学的重症度を評価するために大腸病変を有する対象において使用され得る血液ベースの低侵襲性自己抗体アッセイのための方法が提供される。別の実施形態では、結腸細胞増殖障害を示す自己抗体は、対象からの無細胞の試料、例えば、全血、血漿、または血清などの対象からの体液試料において検出される。このように、本明細書に開示される自己抗体は、外科的切除、免疫療法、放射線療法、または化学療法などの処置および低リスク大腸病変のモニタリングを必要とする、結腸細胞増殖性障害、高リスク大腸病変、または低リスク大腸病変の有無とを鑑別するのに使用され得る。結腸細胞増殖性障害または病変の存在のモニタリングおよび確認は、例えば、大腸内視鏡検査、超音波検査、MM、またはCTスキャンによって実行することができる。
【0096】
様々な例では、自己抗体特徴は、自己抗体プロファイルと患者群との間の相関を発見するために、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類子)への入力データセットとして使用される。そのような患者群の例としては、疾患または疾病の存在、段階、サブタイプ、応答者対非応答者、および進行者対非進行者が挙げられる。様々な例では、既知の疾病または特徴を有する対象から得られた試料を比較するために、特徴マトリックスが生成される。いくつかの実施形態では、試料は、健康な対象または既知の適応症のいずれも有していない対象、および癌を有することが知られている患者からの試料から得られる。
【0097】
本明細書で使用されるように、機械学習およびパターン認識に関連するため、「特徴」という用語は、一般的に観察される現象の個々の測定可能な特性または特徴を指す。「特徴」の概念は、例えば、限定されないが、線形回帰およびロジスティック回帰などの統計的手法で使用される説明変数の概念と関連している。特徴は通常、数値であるが、文字列およびグラフなどの構造的特徴が構文パターン認識で使用される。
【0098】
本明細書で使用されるように、「入力特徴」(または「特徴」)という用語は、一般的に、訓練されたアルゴリズム(例えば、モデルまたは分類子)が、試料の出力分類(ラベル)、例えば、状態、自己抗体の同一性、抗体配列内容(例えば、変異)、示唆されるデータ収集操作、または示唆される治療法を予測するために使用する変数を指す。変数の値は試料のために決定され、分類を決定するために使用されることがある。
【0099】
複数のアッセイについては、システムは、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類子)に入力する特徴セットを識別する。システムは、各分子クラスについてアッセイを実行し、測定値から特徴ベクトルを形成する。システムは、機械学習モデルへと特徴ベクトルを入力し、生物試料が特定の特性を有するか否かの出力分類を得る。
【0100】
いくつかの実施形態では、機械学習モデルは、対象または対象の集団の特徴または集団の特徴の中の2以上の群またはクラスを鑑別可能な分類子を提供する。いくつかの実施形態では、分類子は、訓練された機械学習分類子である。
【0101】
いくつかの実施形態では、癌組織におけるバイオマーカーの情報量の多い遺伝子座または特徴をアッセイして、プロファイルを形成する。2つの集団(例えば、治療薬に反応する対象と反応しない個体)を鑑別する特定の特徴(例えば、本明細書に記載されたバイオマーカーのいずれか、および/または追加の生物医学的情報のいずれかの項目)のパフォーマンスをプロットすることによって、受信者操作特性(Receiver-operating characteristic)(ROC)曲線が生成され得る。いくつかの実施形態では、集団全体(例えば、症例および対照)の特徴データは、単一の特徴の値に基づいて昇順にソートされる。
【0102】
様々な例では、指定された特性は、健康対癌、疾患サブタイプ、疾患段階、進行者対非進行者、および応答者対非応答者から選択される。
【0103】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、大腸の異形成症、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸細胞腫、大腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0104】
A.データ分析
いくつかの例では、本開示は、ソフトウェアアプリケーション、コンピューティングハードウェア、またはその両方で実現されるデータ解析を有するシステム、方法、またはキットを提供する。様々な例では、解析アプリケーションまたはシステムは、少なくとも、データ受信モジュール、データ前処理モジュール、データ解析モジュール(これは、1以上のタイプのゲノムデータ上で動作することができる)、データ解釈モジュール、またはデータ可視化モジュールを含む。いくつかの実施形態では、データ受信モジュールは、実験室のハードウェアまたは器具類を実験室のデータを処理するコンピュータシステムに接続するコンピュータシステムを含む。いくつかの実施形態では、データ前処理モジュールは、解析の準備としてデータに対する操作を行うハードウェアシステムまたはコンピュータソフトウェアを含む。前処理モジュールでデータに適用され得る操作の例としては、アフィン変換、ノイズ除去操作、データクリーニング、再フォーマット、またはサブサンプリングが挙げられる。データ解析モジュールは、1以上のゲノム材料からのゲノムデータの解析に特化され得、例えば、組み立てられたゲノム配列を取り込んで、確率的および統計的な解析を行うことで、疾患、病理、状態、リスク、疾病、または表現型に関連する異常なパターンを特定することができる。データ解釈モジュールは、特定された異常パターンと健康状態、機能状態、予後、またはリスクとの間の関連性の理解を裏付けるために、例えば、統計学、数学、または生物学から得られた解析方法を使用することができる。データ可視化モジュールは、結果の理解または解釈を容易にすることができるデータの視覚的表現を作成するために、数学的モデリング、コンピュータグラフィックス、またはレンダリングの方法を使用ことができる。
【0105】
様々な例では、機械学習方法は、試料の集団中の試料を鑑別するために適用される。いくつかの実施形態では、機械学習法は、健康な試料と進行性疾患(例えば、腺腫)の試料とを鑑別するために適用される。
【0106】
いくつかの実施形態では、予測エンジンを訓練するために使用される1つ以上の機械学習操作は、一般化線形モデル、一般化加法モデル、ノンパラメトリック回帰演算、ランダムフォレスト分類子、空間回帰、ベイジアン回帰モデル、時系列分析、ベイジアンネットワーク、ガウスネットワーク、決定木学習演算、人工ニューラルネットワーク、リカレントニューラルネットワーク、強化学習演算、線形非線形回帰演算、サポートベクターマシン、クラスタリング演算、および遺伝的アルゴリズム演算の1つ以上を含む。
【0107】
様々な例では、コンピュータ処理方法は、ロジスティック回帰、多重線形回帰(MLR)、次元削減、部分的最小二乗(PLS)回帰、主成分回帰、オートエンコーダ、変分オートエンコーダ、特異値分解、フーリエ基底、ウェーブレット、判別分析、サポートベクターマシン、決定木、分類木と回帰木(CART)、ツリーベースの方法、ランダムフォレスト、勾配ブーストツリー、ロジスティック回帰、行列分解、多次元スケーリング(MDS)、次元削減方法、t分布型確率的近傍埋め込み法(t-SNE)、多層パーセプトロン(MLP)、ネットワーククラスタリング、ニューロファジィ、および人工ニューラルネットワークからなる群から選択される。
【0108】
いくつかの例では、本明細書に開示される方法は、対象からの、または複数の対象からの試料の核酸配列データに対する計算分析を含むことができる。
【0109】
B.分類子生成
一態様では、本明細書に開示されるシステムおよび方法は、自己抗体を含む生体試料からの自己抗体解析から得られる特徴情報に基づいて生成される分類子を提供する。分類子は、自己抗体などの生体試料で識別された特徴に基づいて、集団内の群を鑑別するための予測エンジンの一部を形成する。生体試料中の自己抗体情報の集合的な表現は、自己抗体プロファイルと称されることがある。
【0110】
いくつかの実施形態では、分類子は、自己抗体情報の類似部分を統一されたフォーマットおよび統一されたスケールにフォーマットすることによって自己抗体情報を正規化すること、正規化された自己抗体情報を列指向データベース(columnar database)に格納すること、格納された正規化された自己抗体情報に1つ以上の機械学習運用を適用することによって予測エンジンを訓練することであって、予測エンジンが、特定の集団に対して、1つ以上の特徴の組み合わせをマッピングする、こと、ある群に関連する対象を識別するために予測エンジンをアクセスされたフィールド情報に適用すること、および、対象をある群に分類することによって生成される。
【0111】
特異性は、本明細書で使用されるように、一般的に、「疾患を有していない人の中で陰性となる確率」を指す。特異性は、陰性と判定された疾患のない人の数を、疾患のない対象の総数で割った数値によって算出され得る。
【0112】
様々な例では、モデル、分類子、または予測試験は、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%の特異性を有する。
【0113】
本明細書で使用されるように、一般的に、「疾患を有する人の中で検査が陽性となる確率」を指す。感度は、陽性と判定された疾患のある対象の数を、疾患のある対象の総数で割った数値によって算出され得る。
【0114】
様々な例では、モデル、分類子、または予測試験は、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の感度を有する。
【0115】
C.デジタル処理装置
いくつかの実施形態では、本明細書に記載されるは、デジタル処理装置、またはその使用である。いくつかの例では、デジタル処理装置は、装置の機能を実行する、1つ以上のハードウェア中央処理装置(CPU)、グラフィック処理ユニット(GPU)、またはテンソル処理ユニット(TPU)を含み得る。いくつかの例では、デジタル処理装置は、実行可能な命令を実行するように構成されたオペレーティングシステムを含み得る。
【0116】
いくつかの例では、デジタル処理装置は、任意選択でコンピュータネットワークに接続され得る。いくつかの例では、デジタル処理装置は、任意選択でインターネットに接続され得る。いくつかの例では、デジタル処理装置は、任意選択でクラウドコンピューティングインフラストラクチャに接続され得る。いくつかの例では、デジタル処理装置は任意選択でイントラネットに接続され得る。いくつかの例では、デジタル処理装置は任意選択でデータ記憶装置に接続され得る。
【0117】
適切なデジタル処理装置の非限定的な例としては、サーバーコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、サブノートブックコンピュータ、ネットブックコンピュータ、ネットパッドコンピュータ、セットトップコンピュータ、ハンドヘルドコンピュータ、インターネットアプライアンス、モバイルスマートフォン、およびタブレットコンピュータが挙げられる。適切なタブレットコンピュータは、例えば、ブックレット、スレート、および転換可能な構成を含み得る。
【0118】
いくつかの例では、デジタル処理装置は、実行可能な命令を実行するように構成されたオペレーティングシステムを含み得る。例えば、オペレーティングシステムは、装置のハードウェアを管理し、アプリケーションの実行のためのサービスを提供する、プログラムとデータを含むソフトウェアを含み得る。オペレーティングシステムの非限定的な例は、Ubuntu、FreeBSD、OpenBSD、NetBSD(登録商標)、Linux(登録商標)、Apple(登録商標)Mac OS X Server(登録商標)、Oracle(登録商標)Solaris(登録商標)、Windows Server(登録商標)、およびNovell(登録商標)NetWare(登録商標)を含む。適切なパーソナルコンピュータオペレーティングシステムの非限定的な例は、Microsoft(登録商標)Windows(登録商標)、Apple(登録商標)Mac OS X(登録商標)、UNIX(登録商標)、およびUNIX(登録商標)のようなオペレーティングシステム、例えば、GNU/Linux(登録商標)を含む。いくつかの例では、オペレーティングシステムは、クラウドコンピューティングによって提供され得、クラウドコンピューティングリソースは、1つ以上のサービスプロバイダーによって提供され得る。
【0119】
いくつかの例では、装置は記憶装置および/またはメモリ装置を含み得る。記憶デバイスおよび/またはメモリデバイスは、一時的又は恒久的な基礎に基づいてデータまたはプログラムを記憶するために使用される1以上の物理的な装置であり得る。いくつかの例では、装置は揮発性メモリであり得、記憶した情報を維持するための電力を必要とする。いくつかの例では、装置は不揮発性メモリであり得、デジタル処理装置に電力が供給されないときに記憶した情報を保持する。いくつかの実施形態では、不揮発性メモリはフラッシュメモリを含み得る。いくつかの例では、不揮発性メモリは、ダイナミックランダムアクセスメモリ(DRAM)を含み得る。いくつかの例では、不揮発性メモリは、強誘電体ランダムアクセスメモリ(FRAM(登録商標))を含み得る。いくつかの例では、不揮発性メモリは、相変化ランダムアクセスメモリ(PRAM)を含み得る。
【0120】
いくつかの例では、装置は、例えば、CD-ROM、DVD、フラッシュメモリ装置、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、およびクラウドコンピューティングベースの記憶装置を含む、記憶装置であってもよい。いくつかの例では、記憶装置および/またはメモリ装置は、本明細書で開示されるものなどの装置の組み合わせであってもよい。いくつかの例では、デジタル処理装置は、ユーザーに視覚情報を送信するためのディスプレイを含み得る。いくつかの例では、ディスプレイは陰極線管(CRT)であってもよい。いくつかの例では、ディスプレイは液晶ディスプレイ(LCD)であってもよい。いくつかの例では、ディスプレイは、薄膜トランジスタ液晶ディスプレイ(TFT-LCD)であってもよい。いくつかの例では、ディスプレイは、有機発光ダイオード(OLED)ディスプレイであってもよい。いくつかの例では、OLEDディスプレイは、パッシブ-マトリックスOLED(PMOLED)またはアクティブ-マトリックスOLED(AMOLED)のディスプレイであってもよい。いくつかの例では、ディスプレイはプラズマディスプレイであってもよい。いくつかの例では、ディスプレイはビデオプロジェクタであってもよい。いくつかの例では、ディスプレイは本明細書で開示されるような装置の組み合わせであってもよい。
【0121】
いくつかの例では、デジタル処理装置は、ユーザーから情報を受け取るための入力装置を含み得る。いくつかの例では、入力装置はキーボードであってもよい。いくつかの例では、入力装置は、例えば、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含むポインティング装置であってもよい。いくつかの例では、入力装置はタッチスクリーンまたはマルチタッチスクリーンであってもよい。いくつかの例では、入力装置は、声または他の音声入力をキャプチャするマイクロホンであってもよい。いくつかの例では、入力装置は、動きまたは視覚入力をキャプチャするビデオカメラであってもよい。いくつかの例では、入力装置は、本明細書で開示されるような装置の組み合わせであってもよい。
【0122】
D.非一時的なコンピュータ可読記憶媒体
いくつかの例では、本明細書で開示される発明特定事項は、任意選択でネットワーク接続されたデジタル処理装置のオペレーティングシステムによって実行可能な命令を含むプログラムで符号化された1つ以上の非一時的なコンピュータ可読記憶媒体を含み得る。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理装置の有形の構成要素であってもよい。いくつかの例では、コンピュータ可読記憶媒体は、任意選択でデジタル処理装置から取り外し可能であり得る。いくつかの例では、コンピュータ可読記憶媒体は、例えば、CD-ROM、DVD、フラッシュメモリ装置、固体メモリ、磁気ディスク欲動、磁気テープドライブ、光ディスクドライブ、クラウドコンピューティングシステムおよびサービスなどを含み得る。いくつかの例では、プログラムおよび命令は、永続的に、ほぼ永続的に、半永続的に、または非一時的に、媒体上でコードされてもよい。
【0123】
E.コンピュータシステム
本開示は、本明細書に記載される方法を実施するようにプログラムされるコンピュータシステムを提供する。
図1は、患者データ、生体データ、生体配列、参照配列、および自己抗体プロファイルを保存、処理、識別、または解釈するようにプログラムされるか、または他の方法で構成されるコンピュータシステム(101)を示す。コンピュータシステム(101)は、本開示の患者データ、生体データ、生体配列、参照配列、および自己抗体プロファイルの様々な態様を処理し得る。コンピュータシステム(101)は、ユーザーまたはコンピュータシステムの電子デバイスであってもよく、電子デバイスに対して遠隔に位置付けられる。電子デバイスはモバイル電子デバイスであってもよい。
【0124】
コンピュータシステム(101)は、中央処理装置(CPU)、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも称される)(105)を含み、これは、シングルコアまたはマルチコアのプロセッサ、あるいは並行処理のための複数のプロセッサであり得る。コンピュータシステム(101)は、メモリまたは記憶場所(110)(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)、電子記憶装置(115)(例えば、ハードディスク)、1つ以上の他のシステムと通信するための通信インタフェース(120)(例えば、ネットワークアダプタ)、および周辺機器(125)、例えば、キャッシュ、他のメモリ、データ記憶装置、および/または電子ディスプレイアダプターをさらに含む。メモリ(110)、記憶装置(115)、インタフェース(120)および周辺機器(125)は、マザーボードなどの通信バス(実線)を通じて、CPU(105)と通信する。記憶装置(115)は、データを保存するためのデータ記憶装置(または、データレポジトリ)であってもよい。コンピュータシステム(101)は、通信インタフェース(120)の助けによってコンピュータネットワーク(「ネットワーク」)(130)に動作可能に接続され得る。ネットワーク(130)は、インターネットおよび/またはエクストラネット、インターネットと通信状態にあるイントラネットおよび/またはエクストラネットであってもよい。いくつかの例では、ネットワーク(130)は、電気通信および/またはデータのネットワークである。ネットワーク(130)は1つ以上のコンピュータサーバーを含み得、このコンピュータサーバーは、クラウドコンピューティングなどの分散コンピューティングを可能にし得る。ネットワーク(130)は、場合によっては、コンピュータシステム(101)の助けにより、ピアツーピア・ネットワークを実施することができ、これにより、コンピュータシステム(101)に連結されたデバイスが、クライアントまたはサーバーとして動くことを可能にし得る。
【0125】
CPU(105)は、プログラムまたはソフトウェアで統合可能な一連の機械可読命令を実行することができる。この命令は、メモリ(110)などの記憶場所に保存され得る。命令は、CPU(105)に方向付けられてもよく、これは後に、本開示の方法を実施するようにCPU(105)をプログラムするか、またはそれ以外の方法で構成し得る。CPU(105)により実行される動作の例としては、フェッチ、デコード、実行、およびライトバックが挙げられる。
【0126】
CPU(105)は、集積回路など回路の一部であってもよい。システム(101)の1つ以上の他のコンポーネントが、回路に含まれてもよい。いくつかの例では、回路は特定用途向け集積回路(ASIC)である。
【0127】
記憶装置(115)は、ドライバー、ライブラリ、およびセーブされたプログラムなどのファイルを保存することができる。記憶装置(115)は、ユーザーデータ、例えば、ユーザーの嗜好およびユーザーのプログラムを保存することができる。コンピュータシステム(101)は、いくつかの例では、イントラネットまたはインターネットを介してコンピュータシステム(101)と通信状態にあるリモートサーバー上に位置付けられるなどした、コンピュータシステム(101)の外部にある1つ以上の追加のデータ記憶装置を含み得る。
【0128】
コンピュータシステム(101)は、ネットワーク(130)を介して1つ以上のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム(101)はユーザーのリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、持ち運び可能なPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android-enabledデバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザーは、ネットワーク(130)を介してコンピュータシステム(101)にアクセスすることができる。
【0129】
本明細書に記載されるような方法は、例えば、メモリ(110)または電子記憶装置(115)上などの、コンピュータシステム(101)の電子記憶場所に保存された機械(例えば、コンピュータプロセッサ)実行可能コードによって実施されてもよい。機械実行可能コードまたは機械可読コードは、ソフトウェアの形態で提供され得る。使用中、コードはプロセッサ(105)により実行され得る。いくつかの例では、コードは、記憶装置(115)から検索され、プロセッサ(105)による容易なアクセスのためにメモリ(110)上に保存されてもよい。いくつかの例では、電子記憶装置(115)は除外されてもよく、機械実行可能命令がメモリ(110)に保存される。
【0130】
コードは、コードを実行するのに適したプロセッサを有する機械とともに使用されるようにあらかじめコンパイルされかつ構成され得るか、あるいは、実行時間中に解釈またはコンパイルされ得る。コードは、あらかじめコンパイルされた、解釈された、またはアズコンパイルされた(as-compiled)様式でコードを実行可能にするために選択され得る、プログラミング言語で供給され得る。
【0131】
コンピュータシステム(101)などの本明細書で提供されるシステムと方法の態様は、プログラミングの際に統合することができる。この技術の様々な態様は、典型的に、一種の機械可読媒体上で運ばれるまたはそれに埋め込まれる機械(またはプロセッサ)実行可能コードおよび/または関連データの形で、「製品」または「製造用品」として考慮され得る。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶することができる。「記憶」型の媒体は、様々な半導体メモリ、テープドライブ、ディスクドライブなどの、コンピュータやプロセッサの有形メモリ、あるいはその関連するモジュールのいずれかまたは全てを含むことができ、これらは、ソフトウェアのプログラミングのためにいかなる時も非一時的な記録媒体を提供し得る。ソフトウェアの全てまたは一部は、時々、インターネットまたは様々な他の電気通信ネットワークを介して通信される。そのような通信は、例えば、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへの、ソフトウェアのローディングを可能にし得る。ゆえに、ソフトウェア要素を持ち得る別のタイプの媒体は、有線および光地上通信線ネットワークを介した、および様々なエアリンク(air-links)上での、ローカルデバイス間の物理インタフェースにわたって使用されるものなどの、光波、電波、および電磁波を含む。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理要素はまた、ソフトウェアを持つ媒体と考えられ得る。本明細書で使用されるように、非一時的で有形の「記憶」媒体に制限されない限り、コンピュータまたは機械「可読媒体」などの用語は、一般的に実行のためにプロセッサに命令を提供することに関与する媒体を指す。
【0132】
従って、コンピュータ実行可能コードなどの機械可読媒体は、限定されないが、有形記憶媒体、キャリア波媒体、または物理送信媒体を含む、多くの形態をとってもよい。不揮発性ストレージ媒体には、例えば、データベースなどを実装するために使用し得るような、任意のコンピュータなどにおけるストレージデバイスのいずれかなどの光学ディスクまたは磁気ディスクが含まれる。揮発性記憶媒体は、ダイナミックメモリ、例えば、そのようなコンピュータプラットフォームのメインメモリを含む。有形送信媒体は、同軸ケーブル、コンピュータシステム内のバスを含むワイヤーを含む、銅線および光ファイバーを含んでいる。搬送波送信媒体は、無線周波(RF)および赤外線(IR)データ通信中に生成されたものなどの、電気信号または電磁気信号、あるいは音波または光波の形態をとり得る。それゆえ、コンピュータ可読媒体の共通の形態としては、例えば:フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の物理的な記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を伝達するケーブルもしくはリンク、またはコンピュータがプログラミングのコードおよび/またはデータを読み取り得る他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサに1つ以上の命令の1つ以上のシーケンスを運ぶことに関与し得る。
【0133】
コンピュータシステム(101)は、例えば、核酸配列、濃縮核酸試料、自己抗体プロファイル、発現プロファイル、およびRNA発現プロファイルの解析を提供するためのユーザーインタフェース(UI)(140)を備える電子ディスプレイ(135)を含み得るかまたはそれと通信状態である得る。UIの例は、限定されないが、グラフィカルユーザーインタフェース(GUI)およびウェブベースのユーザーインタフェースを含む。
【0134】
本開示の方法およびシステムは、1つ以上のアルゴリズムによって実施されてもよい。アルゴリズムは、中央処理装置(105)による実行の後にソフトウェアによって実施されてもよい。アルゴリズムは、例えば、患者データ、生体データ、生体配列、および参照配列を保存、処理、識別、または解釈することができる。
【0135】
本明細書では、方法およびシステムの特定の例が示され、および説明されてきた一方、当業者であれば、これらは例示としてのみ提供され、本明細書内で限定することを意図していないことを理解されるであろう。多数の変形、変更、および置換は、本明細書に記載される範囲から逸脱することなく、当業者によって現在想到されることとなる。さらに、記載される方法およびシステムのすべての態様は、様々な条件および変数に依存する本明細書に記載される特定の描写、構成または相対的な割合に限定されるものではなく、本記載は、そのような代替案、修正、変動または同等物を含むことを意図していることが理解されるものとする。
【0136】
いくつかの実施形態では、本明細書に開示された発明特定事項とは、少なくとも1つのコンピュータプログラム、またはコンピュータプログラムの使用を含み得る。コンピュータプログラムは、デジタル処理装置のCPU、GPU、またはTPUで実行可能な、特定のタスクを実行するために作成された命令のシーケンスとすることができる。コンピュータ可読命令は、特定のタスクを実行するか、または特定の抽出データタイプを実施する、機能、オブジェクト、アプリケーションプログラミングインタフェース(API)、データ構造などのプログラムモジュールとして実施されてもよい。本明細書で提供される開示に照らして、コンピュータプログラムは、様々な言語の様々なバージョンで記述されてもよい。
【0137】
コンピュータ可読命令の機能性は、様々な環境において必要に応じて組み合わせられ、または分配されることもある。いくつかの例では、コンピュータプログラムは1つの命令列を含み得る。いくつかの例では、コンピュータプログラムは複数の命令列を含み得る。いくつかの例では、コンピュータプログラムは1つの位置から提供されてもよい。いくつかの例では、コンピュータプログラムは多数の位置から提供されてもよい。いくつかの例では、コンピュータプログラムは、1つ以上のソフトウェアモジュールを含み得る。いくつかの例では、コンピュータプログラムは、一部または全体として、1つ以上のウェブアプリケーション、1つ以上のモバイルアプリケーション、1つ以上のスタンドアロンアプリケーション、1つ以上のウェブブラウザプラグイン、拡張、アドイン、またはアドオン、あるいはそれらの組み合わせを含み得る。
【0138】
いくつかの例では、コンピュータ処理は、統計学、数学、生物学、またはそれらの任意の組み合わせの方法であってよい。いくつかの例では、コンピュータ処理方法は、例えば、ロジスティック回帰、次元縮小、主成分分析、オートエンコーダ、特異値分解、フーリエベース、特異値分解、ウェーブレット、判別分析、サポートベクターマシン、ツリーベース法、ランダムフォレスト、勾配ブースト木、ロジスティック回帰、マトリックス因子分解、ネットワーククラスタリング、およびニューラルネットワークを含む次元縮小方法を含む。
【0139】
いくつかの例では、コンピュータ処理方法は、例えば、回帰、サポートベクターマシン、ツリーベース法、およびネットワークを含む教師あり機械学習方法である。
【0140】
いくつかの例では、コンピュータ処理方法は、例えば、クラスタリング、ネットワーク、主成分分析、およびマトリックス因数分解を含む教師なし機械学習方法である。
【0141】
F.データベース
いくつかの例では、本明細書に開示される発明特定事項は、1つ以上のデータベース、または患者データ、生体データ、生体配列、参照配列、または自己抗体プロファイルを保存するためのそれの使用を含み得る。参照配列は、データベースから導出され得る。本明細書で提供される開示を考慮すると、多くのデータベースが、配列情報の記憶および検索に適している可能性がある。いくつかの例では、適切なデータベースは、例えば、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関連モデルデータベース、連想データベース、およびXMLデータベースを含み得る。いくつかの例では、データベースはインターネットベースであってもよい。いくつかの例では、データベースはウェブベースであってもよい。いくつかの例では、データベースはクラウドコンピューティングベースであってもよい。いくつかの例では、データベースは1つ以上のローカルコンピュータ記憶装置に基づいてもよい。
【0142】
一態様では、本開示は、本明細書に開示される方法を実行するようにプロセッサを方向付ける命令を含む非一時的コンピュータ可読媒体を提供する。
【0143】
一態様では、本開示は、コンピュータ可読媒体を含むコンピューティングデバイスを提供する。
【0144】
他の態様では、本開示は、生体試料の分類を実行するためのシステムを提供し、該システムは、
a)複数の訓練用の試料を受け取るための受け取り容器であって、複数の訓練用の試料の各々は、分子の複数のクラスを有し、複数の訓練用の試料の各々は、1つ以上の既知の標識を含む、受け取り容器、
b)複数の訓練用の試料の各々に対して、機械学習モデルに入力されるように操作可能なアッセイに対応する特徴のセットを識別する特徴モジュールであって、特徴のセットは、複数の訓練用の試料中の分子の特性に対応し、複数の訓練用の試料の各々に対して、システムは、訓練用の試料中の分子の複数のクラスを複数の異なるアッセイに供して測定値のセットを得るように操作可能であり、ここで、測定値の各セットは、訓練用の試料中の分子のクラスに適用される1つのアッセイからの値であり、測定値の複数のセットは、複数の訓練用の試料のために得られる、特徴モジュール、
c)訓練用の試料のための訓練用のベクトルを得るために測定値のセットを解析するための解析モジュールであって、訓練用のベクトルは、対応するアッセイの特徴のNセットの特徴値を含み、各特徴値は特徴に対応し、1つ以上の測定値を含み、訓練用のベクトルは、複数の異なるアッセイの第1のサブセットに対応する特徴のNセットの少なくとも2つの特徴からの少なくとも1つの特徴を使用して形成される、解析モジュール、
d)複数の訓練用の試料の出力標識を得るために、機械学習モデルのパラメータを使用して訓練ベクトルをシステムに通知する標識化モジュール、
e)出力標識を訓練用の試料の既知の標識と比較するコンパレータモジュール、
f)出力標識と訓練用の試料の既知の標識との比較に基づいて機械学習モデルの訓練の一部として、パラメータの最適値を反復的に探索する訓練モジュール、および
g)機械学習モデルのパラメータ、および機械学習モデルのために特徴のセットを提供するための出力モジュールを含む。
【0145】
集団中の対象を分類する方法
開示された方法は、対象において発現自己抗体の分析を介して、結腸細胞増殖性障害に関連する自己抗体発現のパラメータを確認することを対象とする。本方法は、結腸細胞増殖性障害の診断、処置および監視の改善において使用するためのものであり、より具体的には、前記障害の段階またはサブクラスおよび前記障害に対する遺伝的素因の識別および鑑別の改善が可能になることによるものである。
【0146】
いくつかの実施形態では、本方法は、集団中の対象からの生体試料における自己抗体の差次的発現を分析する工程を含む。
【0147】
一般的に、本開示は、無細胞の試料に適用され得る結腸細胞増殖性障害の検出方法、例えば、結腸細胞増殖性障害を有する対象と有さない対象との間または異なる結腸細胞増殖性障害間の自己抗体の存在および特性を検出するための方法を提供する。本方法は、結腸細胞増殖性障害を有さない健康な対象と比較して、結腸細胞増殖性障害シグナルに対する基本的な「陽性」または「陰性」として、自己抗体の検出を利用する。
【0148】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、結腸直腸の異形成症、結腸直腸腺腫、大腸癌、結腸癌、直腸癌、結腸直腸細胞腫、結腸直腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0149】
第3の態様では、本開示は、対象の生体試料の自己抗体プロファイルを決定するための方法を提供し、該方法は、
a)対象から自己抗体を含有している生体試料を得る工程、および
b)対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程を含む。
【0150】
いくつかの実施形態では、自己抗体プロファイルは、結腸細胞増殖性障害に関連付けられ、かつ結腸細胞増殖性障害を有するものとして対象の分類を提供する。
【0151】
いくつかの実施形態では、対象から得られる生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、およびそれらの組み合わせからなる群から選択される。
【0152】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、結腸直腸の異形成症、結腸直腸腺腫、大腸癌、結腸癌、直腸癌、結腸直腸細胞腫、結腸直腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0153】
いくつかの実施形態では、結腸細胞増殖性障害は、1期大腸癌、2期大腸癌、3期大腸癌および4期大腸癌からなる群から選択される。
【0154】
いくつかの実施形態では、進行性腺腫は、管状腺腫、腺管絨毛腺腫、絨毛腺腫、腺癌、または過形成性ポリープである。
【0155】
第4の態様では、本開示は、対象において結腸細胞増殖性障害を検出する方法を提供し、該方法は、
a)対象から自己抗体を含有している生体試料を得る工程、
b)対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程、および、
c)健康な対象と結腸細胞増殖性障害を有する対象とを鑑別することができ、結腸細胞増殖性障害の存在に関連する出力値を提供し、それによって、対象の結腸細胞増殖性障害の存在を示すように訓練された機械学習モデルを使用して自己抗体プロファイルを処理する工程を含む。
【0156】
いくつかの実施形態では、対象から得られる生体試料は、体液、便、結腸流出物、尿、血漿、血清、全血、分離血球、血液から分離された細胞、およびそれらの組み合わせからなる群から選択される。
【0157】
他の態様では、本発明は、試料の自己抗体プロファイルを生成するために自己抗体のタンパク質への結合を検出するための方法に関し、該方法は、
a)生体試料を、自己抗体によって認識されやすいタンパク質またはその断片と接触させる工程、および
b)試料の自己抗体プロファイルを提供するために、抗体がタンパク質またはその断片に結合することによって形成される抗体・タンパク質複合体の形成を検出する工程であって、タンパク質はNME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される、工程を含む。
【0158】
他の態様では、本発明は、タンパク質に対する少なくとも3つの自己抗体を検出する工程を含む、対象からの生体試料においてデータを得る方法に関し、ここで、少なくとも3つの自己抗体は、UBE2Sタンパク質に対する自己抗体、CD20タンパク質に対する自己抗体、ASB9タンパク質に対する自己抗体、PRDM8タンパク質に対する自己抗体、CDK4タンパク質に対する自己抗体、MTCP1タンパク質に対する自己抗体、およびTP53タンパク質に対する自己抗体からなる群から選択される。いくつかの実施形態では、本方法は、試料中の自己抗体のレベルを決定する工程をさらに含む。
【0159】
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫様ポリープ)、ポリポシス障害、リンチ症候群、無茎性鋸歯状腺腫(SSA)、進行性腺腫、結腸直腸の異形成症、結腸直腸腺腫、大腸癌、結腸癌、直腸癌、結腸直腸細胞腫、結腸直腸腺癌、カルチノイド腫瘍、胃腸のカルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
【0160】
いくつかの実施形態では、結腸細胞増殖性障害は、1期大腸癌、2期大腸癌、3期大腸癌および4期大腸癌からなる群から選択される。
【0161】
他の態様では、本開示は、対象の生体試料の自己抗体プロファイルを決定するための方法を提供し、該方法は、
a)対象から自己抗体を含有している生体試料を得る工程、および
b)対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程を含む。
【0162】
別の態様では、本開示は、対象において結腸細胞増殖性障害を検出するための方法を提供し、該方法は、
a)対象から自己抗体を含有している生体試料を得る工程、
b)対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程、
c)結腸細胞増殖性障害を有さない対象と結腸細胞増殖性障害を有する対象とを鑑別するように訓練された機械学習モデルを使用して対象の自己抗体プロファイルを処理する工程、および
d)自己抗体プロファイルに少なくとも部分的に基づく機械学習モデルを使用して、結腸細胞増殖性障害を有する対象に関連する値を決定し、それによって対象において結腸細胞増殖性障害を検出する工程を含む。
【0163】
他の態様では、本開示は、予め疾患の処置を受けた対象において微小残存病変を監視する方法を提供しており、該方法は、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される抗原に対する自己抗体を含む自己抗体パネルを使用して対象からの生体試料の自己抗体プロファイルを決定し、それによってベースライン自己抗体状態を生成する工程、およびベースライン自己抗体状態を生成した後、1つ以上の時点で対象から得られた生体試料の自己抗体プロファイルを決定し、それによって現在の自己抗体状態を生成し、ベースライン自己抗体状態と現在の自己抗体状態との間の変化は、対象の微小残存病変の変化を示す工程を含む。
【0164】
本明細書に記載される訓練された機械学習方法、モデル、および識別分類子は、癌の検出、診断、および治療反応性を含む様々な医療用途に適用されてもよい。モデルは、対象のメタデータおよび分析物由来の特徴で訓練され得るため、適用は、集団中の対象を層別化し、それに応じて治療決定を導くように調整され得る。
【0165】
診断
本明細書で提供される方法およびシステムは、人工知能ベースのアプローチを使用して予測分析を実行し、対象(患者)からの取得されたデータを分析して、癌(例えば、大腸癌)を有する対象の診断の出力を生成し得る。例えば、アプリケーションは、癌を有する対象の診断を生成するために、取得されたデータに予測アルゴリズムを適用ことがある。予測アルゴリズムは、取得されたデータを処理して、癌を有する対象の診断を生成するように構成された、機械学習ベースの予測子などの人工知能ベースの予測子を含むことがある。
【0166】
機械学習予測子は、データセット、例えば、癌を有する患者のコホートの1つ以上のセットからの対象の生体試料に対して本明細書に記載されるシグネチャーパネルを用いた自己抗体アッセイを実行することによって生成されたデータセットを入力として用い、対象の既知の診断(例えば、病期分類および/または腫瘍率)結果を機械学習予測子への出力として用いることによって訓練されることがある。
【0167】
訓練用のデータセット(例えば、対象の生体試料に対して本明細書に記載されるシグネチャーパネルを使用して自己抗体アッセイを実行することにより生成されるデータセット)は、例えば、共通の特性(特徴)および結果(ラベル)を有する対象の1つ以上のセットから生成されることがある。訓練用のデータセットは、診断に関連する特徴に対応する特徴およびラベルのセットを含んでもよい。特徴は、例えば、健常者および疾患から得られた生体試料における自己抗体の存在または特性のような、自己抗体アッセイ測定値の特定の範囲またはカテゴリーなどの特徴を含み得る。例えば、所与の時点で予め定められた対象から収集された特徴のセットは、集合的に診断シグネチャーとして機能し、予め定められた時点における対象の同定された癌を示すことができる。特徴はさらに、1つ以上の癌など、対象の診断結果を示すラベルを含むことがある。
【0168】
ラベルは、例えば、対象の既知の診断(例えば、病期分類および/または腫瘍分画)の結果などの結果を含んでいてもよい。結果は、対象の癌に関連付けられる特性を含むことがある。例えば、特性は、対象が1つ以上の癌を有することを示す場合がある。
【0169】
訓練のセット(例えば、訓練のデータセット)は、対象の1つ以上のセット(例えば、1つ以上の癌を有するまたは有していない患者のレトロスペクティブおよび/またはプロスペクティブコホート)に対応するデータのセットのランダムサンプリングによって選択される場合がある。代替的に、訓練用のセット(例えば、訓練用のデータセット)は、対象の1つ以上のセット(例えば、1つ以上の癌を有するまたは有していない患者のレトロスペクティブおよび/またはプロスペクティブコホート)に対応するデータセットの比例サンプリングによって選択されてもよい。訓練用のセットは、対象の1つ以上のセット(例えば、異なる臨床施設または試験からの患者)に対応するデータのセット間でバランスを保たれることがある。機械学習予測器は、診断精度の尺度に対応する最小の所望の値を有するなど、精度または性能に関する特定の所定の条件が満たされるまで訓練されることがある。例えば、診断精度の尺度は、対象における1つ以上の癌の診断、病期分類、または腫瘍分率の予測に対応し得る。
【0170】
診断精度の尺度の例としては、感度、特異度、陽性予測値(PPV)、陰性予測値(NPV)、精度、および癌(例えば、大腸癌)を検出または予測する診断精度に対応する受信者動作特性(ROC)曲線の曲線下面積(AUC)を含むことがある。
【0171】
一態様では、本開示は、対象の集団を識別可能な分類子を使用する方法を提供しており、該方法は、
a)対象から自己抗体を含有している生体試料を得る工程、
b)対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、OTUD5、PNKP、SRSF7、ASB9、PRDM8、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程、
c)2つ以上の集団において鑑別するように訓練された機械学習モデルを使用して対象の自己抗体プロファイルを処理する工程、および
d)自己抗体プロファイルの少なくとも一部に基づいた機械学習モデルを使用して、集団に関連付けられる値を決定し、それにより対象の集団を鑑別する工程を含む。
【0172】
他の態様では、本開示は、対象の癌を識別するための方法を提供しており、該方法は、 a)対象から自己抗体を含有している生体試料を得る工程、
b)対象の自己抗体プロファイルを提供するために、NME5、USP16、UBE2S、RNF41、CD20、ANKHD1、TXNL1、NAT6、Supt6h、PRDM8、OTUD5、PNKP、SRSF7、ASB9、NXN、ZBTB21、EYA1、GSPT1、MLIP、RBM38、ARMC5、TP53、BRD9、CDK4、PRMT6、PCOLCE、およびSDCBPからなる群から選択される3つ以上の抗原に対する自己抗体を含む予め定められた自己抗体パネルからの抗体の量を測定する工程、および、
c)健康な対象と結腸細胞増殖性障害の対象とを鑑別可能であり、結腸細胞増殖性障害の存在に関連付けられる出力値を提供し、それにより前記対象が前記癌に罹患する可能性を生成するために対象の結腸細胞増殖性障害の存在を示すように訓練された機械学習モデルを使用して自己抗体プロファイルを処理する工程を含む。
【0173】
発現の閾値またはカットオフレベルを確立するための様々な統計的および数学的方法が使用されてもよい。特定のバイオマーカーに対する閾値またはカットオフ発現レベルは、例えば、本明細書に開示される実施例および図に記載されているように、受信者動作特性(ROC)プロットからのデータに基づいて選択されることがある。当業者であれば、これらの閾値またはカットオフ発現レベルは、例えば、特定のバイオマーカーまたはその組み合わせに対してROCプロットに沿って移動することにより、感度または特異性の異なる値を得て、それによって全体的なアッセイ性能に影響を与えるように変化させることができることを理解するであろう。例えば、臨床的な観点から堅牢な診断法を目指すのであれば、感度の高さを優先するべきである。しかし、費用対効果が高い方法を目指すのであれば、特異性の高さを優先すべきである。ベストカットオフとは、特定のバイオマーカーについてROCプロットから得られた値のうち、感度および特異性が最も高くなる値を指す。感度と特異性の値は、閾値(カットオフ)の範囲にわたって算出される。したがって、閾値またはカットオフ値は、感度および/または特異性が少なくとも約50%であるように選択され得、かつ、例えば、アッセイした患者集団の少なくとも60%において少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも100%、あるいはアッセイした患者集団の少なくとも65%、少なくとも70%、少なくとも75%、または少なくとも80%であり得る。
【0174】
その結果、本発明のいくつかの実施形態は、診断またはスクリーニングされる対象から単離された低侵襲試料において、少なくとも先に引用した自己抗体の存在および/またはレベルを決定し、自己抗体の存在および/またはレベルを予め定められた閾値またはカットオフ値と比較することによって実行され、ここで、予め定められた閾値またはカットオフ値は、大腸癌または大腸腺腫を患うリスクのある患者集団において決定された自己抗体の発現レベルに少なくとも部分的に基づいて算出されたROC曲線において、所望の感度で最高の特異性に相関する前記自己抗体の発現レベルに対応し、ここで、前記予め定められたカットオフ値に対する前記自己抗体の少なくとも1つの過剰発現は、対象が前記所望の感度で大腸癌または大腸腺腫を患っていることを示す。
【0175】
別の例として、そのような所定条件は、結腸細胞増殖性障害の予測の特異性が、例えば、少なくとも約50%の値、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含むことであってもよい。
【0176】
別の例として、そのような所定条件は、結腸細胞増殖性障害の予測の陽性的中率(PPV)が、例えば、少なくとも約50%の値、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含むことであってもよい。
【0177】
別の例として、そのような所定条件は、結腸細胞増殖性障害の予測の陰性的中率(NPV)が、例えば、少なくとも約50%の値、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含むことであってもよい。
【0178】
別の例として、そのような所定条件は、結腸細胞増殖性障害を予測する受信者動作特性(ROC)曲線の曲線下面積(AUC)が、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、または少なくとも約0.99の値を含むことであってもよい。
【0179】
大腸癌の監視
訓練されたアルゴリズムを使用してデータセットを処理した後、大腸癌は、対象において同定または監視され得る。同定は、大腸癌関連自己抗体のパネルにおけるデータセットの配列リードの定量的測定に少なくとも部分的に基づくことがある。
【0180】
いくつかの実施形態では、本明細書に開示される方法は、腫瘍の負荷を監視および/または予測するために適用され得る。
【0181】
いくつかの実施形態では、本明細書に開示される方法は、術後の残存腫瘍を検出および/または予測するために適用され得る。
【0182】
いくつかの実施形態では、本明細書に開示される方法は、処置後の微小残存病変を検出および/または予測するために適用され得る。
【0183】
いくつかの実施形態では、本明細書に開示される方法は、再発を検出および/または予測するために適用され得る。
【0184】
一態様では、本明細書に開示される方法は、二次スクリーニングとして適用されてもよい。
【0185】
一態様では、本明細書に開示される方法は、一次スクリーニングとして適用されてもよい。
【0186】
一態様では、本明細書に開示される方法は、癌の発生を監視するために適用されてもよい。
【0187】
一形態では、本明細書に開示される方法は、癌のリスクを監視および/または予測するために適用され得る。
【0188】
大腸癌は、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の精度で対象において同定され得る。訓練されたアルゴリズムによる大腸癌の同定精度は、大腸癌を有するまたは有さないものとして正確に同定または分類された独立した試験試料(例えば、大腸癌を有することが知られている対象、または大腸癌の臨床検査結果が陰性である対象)の割合として算出されてもよい。
【0189】
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陽性的中率(PPV)で、対象において同定され得る。訓練されたアルゴリズムを使用した大腸癌の同定のPPVは、大腸癌を有すると同定または分類された無細胞の生体試料のうち、実際に大腸癌を有する対象に対応する割合として算出されてもよい。
【0190】
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陰性的中率(NPV)で、対象において同定され得る。訓練されたアルゴリズムを使用した大腸癌の同定のNPVは、大腸癌を有さないと同定または分類された無細胞の生体試料のうち、実際に大腸癌を有さない対象に対応する割合として算出されてもよい。
【0191】
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的感度で対象において同定されることがある。訓練されたアルゴリズムを使用して、大腸癌を同定する臨床的感度は、大腸癌の存在に関連付けられる独立した試験試料(例えば、大腸癌を有することが知られている対象)のうち、大腸癌を有するものとして正確に同定または分類された割合として算出されてもよい。
【0192】
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的感度で対象において同定されることがある。訓練されたアルゴリズムを使用して、大腸癌を同定する臨床的感度は、大腸癌の不在に関連付けられる独立した試験試料(例えば、大腸癌の臨床試験の結果が陰性対象)のうち、大腸癌を有さないものとして正確に同定または分類された割合として算出されてもよい。
【0193】
いくつかの実施形態では、訓練されたアルゴリズムは、対象が、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の大腸癌のリスクであることを決定することがある。
【0194】
訓練されたアルゴリズムは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の精度で対象が大腸癌のリスクであることを決定することがある。
【0195】
対象が大腸癌を有することが同定されると、対象に治療的介入(例えば、対象の大腸癌を処置するための適切な処置の方針の処方)が任意選択で提供される場合がある。治療的介入は、有効量の薬剤の処方、大腸癌のさらなる検査または評価、大腸癌のさらなる監視、またはそれらの組合せを含むことがある。対象が現在、処置の方針で大腸癌の処置を受けている場合、治療介入は、その後の異なる処置の方針(例えば、現在の処置の方針の非有効性に起因する処置効果を高めるため)を含んでいてもよい。
【0196】
治療的介入は、大腸癌の診断を確定するための二次臨床検査に対象を推奨することを含ムことがある。この二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴撮像(MRI)スキャン、超音波スキャン、胸部X線、陽電子射出断層撮影法(PET)スキャン、PET-CTスキャン、無細胞生物細胞診、FIT検査、FOBT検査、またはこれらの組み合わせを含むことがある。
【0197】
対象の大腸癌は、対象の大腸癌を処置するための処置の方針を監視することによって、監視され得る。監視は、2つ以上の時点で対象の大腸癌を評価することを含むことがある。評価することは、少なくとも、2つ以上の時点のそれぞれで決定された大腸癌関連自己抗体のパネルの定量的測定値を含む大腸癌関連自己抗体のパネルにおけるデータセットの自己抗体の定量的測定値に基づくことがある。
【0198】
いくつかの実施形態では、2つ以上の時点の間で決定された、大腸癌関連自己抗体のパネルの定量的測定値を含むデータセットの配列リードの定量的測定値の差は、(i)対象の大腸癌の診断、(ii)対象の大腸癌の予後、(iii)対象の大腸癌のリスク増加、(iv)対象の大腸癌のリスク低下、(v)対象の大腸癌を処置するための処置の方針の有効性、および(vi)対象の大腸癌を処置するための処置の方針の非有効性などの1つ以上の臨床指標を示すことがある。
【0199】
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連自己抗体のパネルの定量的測定値を含む自己抗体の定量的測定値の差は、対象の大腸癌の診断を示すことがある。例えば、大腸癌が、より早い時点では対象者に検出されなかったが、より遅い時点で対象者に検出された場合、その差は、対象者の大腸癌の診断を示す。対象の大腸癌の診断のこの表示に少なくとも部分的に基づいて、例えば、対象に新しい治療的介入を処方するなどの臨床的行動または決定がされることがある。臨床的行動または決定は、大腸癌の診断を確認するための二次臨床検査に対象を推奨することを含んでもよい。この二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴撮像(MRI)スキャン、超音波スキャン、胸部X線、陽電子射出断層撮影法(PET)スキャン、PET-CTスキャン、無細胞生物細胞診、FIT検査、FOBT検査、またはこれらの組み合わせを含むことがある。
【0200】
いくつかの実施形態では、2つ以上の時点間の間で決定された大腸癌関連自己抗体のパネルの定量的測定値を含むデータセットの自己抗体の定量的測定値の差は、対象の大腸癌の予後を示すことがある。
【0201】
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連自己抗体のパネルの定量的測定値を含むデータセットの自己抗体の定量的測定値の差は、対象が大腸癌のリスクが増加することを示す可能性がある。例えば、大腸癌が、より早い時点およびより遅い時点の両方で対象において検出され、その差が正の差である場合(例えば、大腸癌関連自己抗体のパネルにおけるデータセットの自己抗体の定量的測定値が、より早い時点からより遅い時点まで増加した)、その差は、対象が大腸癌のリスクが増加していることを示すことがある。この大腸癌のリスク増加の表示に少なくとも部分的に基づいて、臨床的な行動または決定、例えば、対象に対する新たな治療的介入の処方または治療的介入の切り替え(例えば、現在の処置を終了して新たな処置を処方する)が行われることがある。臨床的行動または決定は、大腸癌のリスク増加を確認するための二次臨床検査に対象を推奨することを含んでもよい。この二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴撮像(MRI)スキャン、超音波スキャン、胸部X線、陽電子射出断層撮影法(PET)スキャン、PET-CTスキャン、無細胞生物細胞診、FIT検査、FOBT検査、またはこれらの組み合わせを含むことがある。
【0202】
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連自己抗体のパネルの定量的測定値を含む大腸癌関連自己抗体のパネルの-データセットの配列リードの定量的測定値の差は、対象が大腸癌のリスクが低下することを示す可能性がある。例えば、大腸癌が、より早い時点とより遅い時点の両方で対象に検出され、その差が負の差である場合(例えば、大腸癌関連自己抗体のパネルの定量的測定値を含む大腸癌関連自己抗体のパネルのデータセットの自己抗体の定量的測定値が、より早い時点からより遅い時点まで減少した)、差は対象が大腸癌のリスクが低下したことを示すことがある。対象の大腸癌のリスク低下に関するこの表示に少なくとも部分的に基づいて、(例えば、現在の治療的介入の継続または終了)臨床的行動または決定がされる場合がある。臨床的行動または決定は、大腸癌のリスク低下を確認するための二次臨床検査を対象に推奨することを含んでもよい。この二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴撮像(MRI)スキャン、超音波スキャン、胸部X線、陽電子射出断層撮影法(PET)スキャン、PET-CTスキャン、無細胞生物細胞診、FIT検査、FOBT検査、またはこれらの組み合わせを含むことがある。
【0203】
いくつかの実施形態では、2つ以上の時点間の間で決定された大腸癌関連自己抗体のパネルの定量的測定値を含む大腸癌関連自己抗体でのパネルデータセットの配列リードの定量的測定値の差は、対象の大腸癌を処置するための処置の方針の有効性を示すことがある。例えば、大腸癌が、より早い時点では対象者に検出されたが、より遅い時点で対象者に検出されなかった場合、その差は、対象の大腸癌を処置するための処置の方針の有効性を示すことがある。対象の大腸癌を処置するための処置の方針の有効性に関するこの表示に少なくとも部分的に基づいて、臨床的行動または決定がされることがあり、例えば、対象に対する現在の治療的介入を継続または終了することになる。臨床的行動または決定は、大腸癌を処置するための処置の方針の有効性を確認するための二次臨床検査に対象を推薦することを含むことがある。この二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴撮像(MRI)スキャン、超音波スキャン、胸部X線、陽電子射出断層撮影法(PET)スキャン、PET-CTスキャン、無細胞生物細胞診、FIT検査、FOBT検査、またはこれらの組み合わせを含むことがある。
【0204】
いくつかの実施形態では、2つ以上の時点の間で決定された大腸癌関連自己抗体のパネルの定量的測定値を含む大腸癌関連自己抗体でのパネルデータセットの自己抗体の定量的測定値の差は、対象の大腸癌を処置するための処置の方針の非有効性を示すことがある。例えば、大腸癌が、より早い時点およびより遅い時点の両方で対象において検出され、かつその差が正またはゼロの差であり(例えば、大腸癌関連自己抗体のパネルの定量的測定値を含む大腸癌関連自己抗体のパネルのデータセットの自己抗体の定量的測定値が、より早い時点からより遅い時点にかけて増加したか、または一定のレベルにとどまった)、およびより早い時点で有効な処置が示されていた場合、その差は、対象の大腸癌を処置するための処置の方針の非有効性を示す可能性がある。対象の大腸癌を処置するための処置の方針の非有効性のこの表示に少なくとも部分的に基づいて、臨床的行動または決定が、例えば、現在の治療介入を終了することおよび/または対象に異なる新しい治療介入に切り替える(例えば、処方する)ことになることがある。臨床的行動または決定は、大腸癌を処置するための処置の方針の非有効性を確認するための二次臨床検査に対象を推薦することを含むことがある。この二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴撮像(MRI)スキャン、超音波スキャン、胸部X線、陽電子射出断層撮影法(PET)スキャン、PET-CTスキャン、無細胞生物細胞診、FIT検査、FOBT検査、またはこれらの組み合わせを含むことがある。
【0205】
キット
本開示は、対象の癌を同定するか、または監視するためのキットを提供する。キットは、対象の無細胞の生体試料中の複数の癌関連自己抗体のそれぞれにおいて配列の(例えば、存在、不在、または相対量を示す)定量的尺度を同定するためのプローブまたはプライマーを含み得る。無細胞の生体試料中の自己抗体のパネルの(例えば、存在、不在、または相対量を示す)定量的尺度は、1つ以上の癌を示すことがある。プローブは、無細胞の生体試料中の自己抗体に対して選択的であり得る。キットは、プローブを使用して無細胞の生体試料を処理し、対象の無細胞の生体試料中の自己抗体の(例えば、存在、不在、または相対量を示す)定量的尺度を示すデータセットを生成するための指示書を含み得る。
【0206】
キット中のプローブは、無細胞の生体試料中の複数の癌関連自己抗体における配列に対して選択的であってもよい。キット中のプローブは、複数の癌関連自己抗体に対応する自己抗体分子を選択的に濃縮するように構成されていてもよい。キット中のプローブは、自己抗体によって認識され、生体試料中の自己抗体との結合後に分離を可能にするようにタグ付けされるタンパク質であってもよい。
【0207】
キットの指示書は、無細胞の生体試料中の癌関連自己抗体に対して選択的であるプローブを使用して無細胞の生体試料をアッセイする指示を含むことがある。無細胞の生体試料中の複数の癌関連自己抗体のそれぞれにおける配列の(例えば、存在、不在、または相対量を示す)定量的尺度は、1つ以上の癌を示し得る。
【0208】
キットの指示書は、無細胞の生体試料中の複数の癌関連自己抗体のそれぞれにおける配列の(例えば、存在、不在、または相対量を示す)定量的尺度を示すデータセットを生成するために、複数の癌関連自己抗体のうちの1つ以上で定量化され得るアッセイリードアウトを測定および解釈する指示を含み得る。
【実施例】
【0209】
実施例1:患者血漿試料中の自己抗体分析。
【0210】
癌では、癌の新抗原または正準のタンパク質抗原に対する自己抗体が、大腸癌の早期診断のバイオマーカーの源を表す。自己抗体は、癌患者におけるタンパク質の過剰発現または変異に応答して生成される。いくつかの自己抗体は、乳癌、前立腺癌、大腸癌、肺癌、卵巣癌などに関連する自己抗体として同定された。
【0211】
本明細書に記載の方法および分類子に有益な自己抗体を同定するために、結腸細胞増殖性障害を有する患者の血漿および結腸細胞増殖性障害を有さない対象の血漿(対照血漿または基準血漿)を調べ、結腸細胞増殖性障害およびそれぞれの反応タンパク質に応答して結腸細胞増殖性障害を有する患者が産生する自己抗体のシグネチャーパネルを同定してきた。そこで、結腸細胞増殖性障害の患者の血漿と対照血漿を、高密度タンパク質マイクロアレイを使用して検査した。タンパク質マイクロアレイは、自己抗体を同定するために使用される他のアプローチと比較して、i)アレイにプリントされるタンパク質はあらかじめ知られているため、その後の同定を防ぐことができ、ミモトープの選択の可能性もなく、およびii)どのタンパク質も同じような濃度でプリントされているため、どのタンパク質を選ぶかという傾向はない、といった一連の利点を備えている。この因子の組み合わせにより、バイオマーカーを高感度に同定することができる。
【0212】
同定された抗体パネルにより、結腸細胞増殖性障害の対象の血漿および健康な対象の血漿を鑑別することが可能になった。
【0213】
方法
試料の分類
血漿試料中の自己抗体を検出するために、数千の腫瘍抗原候補を発現する高密度タンパク質マイクロアレイを、その後大腸癌(CRC)、進行性腺腫(AA)、良性ポリープ(NAA)、またはそのいずれでもない(NEG)と同定された対象から採取した血漿でプローブした。結合した免疫グロブリンを、蛍光標識した2次抗体(抗IgG/IgM)の強度によって測定した。
【0214】
年齢、性別、位置を一致させた一般集団の対照対象から、標準化された血清採取プロトコルを使用して血漿試料を入手し、使用するまで-80℃で保存した。癌の個人的な病歴を有する対象を、対照として除外した。治験審査委員会の承認のもと、すべての対象から書面による同意を得た。
【0215】
研究コホートの説明は、CRC実験に使用された健康および癌試料の数(段階、性別、および年齢別の)分類モデルを示す表1に提供する。
【0216】
【0217】
本研究の主な目的は、大腸癌を進行性腺腫、良性疾患、および健康な対照と鑑別する血清TAAbバイオマーカーを同定し、現行のバイオマーカーの感度を向上させて臨床判断を誘導することであった。我々は、21,000以上の(複製で測定された)ヒトタンパク質からTAAbバイオマーカーのパネルを同定するために、逐次スクリーニング方策を実施した。
【0218】
血漿をNEG、CRC、AA、NAAの各対象集団から分離し、タンパク質アレイでスクリーニングを行った。NEG、CRC、AA、およびNAAの対象集団の間で合計42,390の特徴を同定し、結腸細胞増殖性障害の対象からの血漿と健康な対象の血漿での差分発現について調査した。
【0219】
画像解析および定量化を、タンパク質アレイプラットフォーム用に予め記載された標準的な方法論を用いて行った。簡潔に言えば、スライドを2チャンネルのマイクロアレイスキャナーでスキャンし、スポットの前景(スポット領域)と背景(スポット周辺部)の強度を測定した。生の強度値を、以下の手順で正規化した。
1)アレイ上の全スポットの前景から背景強度の中央値を引くことで背景を除去する(背景補正強度)。
2)陰性対照スポットの前景強度を用いて、前景/背景の正規+(生の値は背景と前景の寄与の合計を表すと仮定する)指数畳み込みモデルのパラメータ(平均、分散)を推定する。
3)背景補強度から、対照スポットの平均強度および変動係数(対照スポットの分散をタンパク質の前景の平均で割ったもの)を差し引く。
4)背景補正されたタンパク質強度を、畳み込みモデルの最尤推定値として報告する。
【0220】
生の特徴値に対するフィルタリングを前もって行う。
【0221】
IgGおよびIgMチャンネルの両方の生の特徴値を、すべてのコホート試料について単一の特徴行列に連結させた。これは、(分類不能を含む)941試料にわたる合計42,390の特徴を包含する。
【0222】
前処理(背景補正、IQR中央値標準化、外れ値トリミング、およびバッチ正規化)の後、特徴空間を、10以上の試料において生の前景強度が2000(値の範囲は0~64000rfu)より大きいものだけに絞った。16570個のタンパク質/抗原がこの基準を満たした。
【0223】
各表示(CRC、AA、NAA、対NEG)に対して、以下の特徴選択基準を使用して、5つのランダムシードで4層の層化クロスバリデーションを(各層内に)実行した。
A)正規化された値は、特徴量の平均値から2標準偏差以上であるか否かに基づいて2値化された。
B)2値化したchi2 p値が0.01未満の場合、特徴を保持した(2値化はchi2比較にのみ使用)。
C)保持された特徴を、ロジスティック回帰の重み(logreg weight)による再帰的特徴除去にかけ、上位100個の特徴を各倍のCV分類に使用した。
【0224】
特徴を、すべての層/シードで選択された回数(最大20回)、およびすべてのロジスティック回帰の重みの平均と合計によってランク付けした。
【0225】
結果
CRC対NEG
全層の50%以上で、合計28個のタンパク質(補足)を選択した。表2に、28個のタンパク質のうち、CRC分類の上位の5のAAb標的を示す。
【0226】
【0227】
図2は、CRC分類のための潜在的な開発のために選択された上位の5のAAb標的のCV係数を示すグラフを提供する。
【0228】
図3は、CRC分類のための再帰的特徴除去の実績をCVで示すグラフを提供する。
【0229】
AA対NEG
全層の50%以上において、合計23個のタンパク質(補足)を選択した。表3は、23のタンパク質のAA分類の上位の5のAAb標的を示す。
【0230】
【0231】
図4は、AA分類のための上位の10のAAb標的のCV係数を示すグラフを提供する。
【0232】
図5は、AA分類のための再帰的特徴除去の実績をCVで示すグラフを提供する。
【0233】
NAA対NEG
13の標的が全層の50%以上において選択基準を満たした。表4は、13のタンパク質のNAA分類の上位の5のAAb標的を示す。
【0234】
【0235】
図6は、NAA分類のための上位の5のAAb標的のCV係数を示すグラフを提供する。
【0236】
図7は、NAA分類のための再帰的特徴除去の実績をCVで示すグラフを提供する。
【0237】
ともに、結果は、表5に示すように、CRC、AA、およびNAAの分類のためのAAbバイオマーカーのリストを提供する。
【0238】
【0239】
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを意味するものではない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本開示の発明の実施に際して利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその同等物の範囲内の方法、および構造がそれによって包含されるものであるということが意図されている。
【国際調査報告】