(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-08
(45)【発行日】2024-03-18
(54)【発明の名称】マイクロフローサイトメトリーを使用して疾患を診断する方法
(51)【国際特許分類】
G01N 33/574 20060101AFI20240311BHJP
G01N 33/53 20060101ALI20240311BHJP
G01N 33/573 20060101ALI20240311BHJP
G01N 33/483 20060101ALI20240311BHJP
G01N 21/64 20060101ALI20240311BHJP
G16H 50/00 20180101ALI20240311BHJP
【FI】
G01N33/574 A
G01N33/53 D
G01N33/53 P
G01N33/573 A
G01N33/483 C
G01N21/64 F
G16H50/00
(21)【出願番号】P 2020560403
(86)(22)【出願日】2019-04-26
(86)【国際出願番号】 CA2019050541
(87)【国際公開番号】W WO2019204940
(87)【国際公開日】2019-10-31
【審査請求日】2022-04-19
(32)【優先日】2018-04-27
(33)【優先権主張国・地域又は機関】CA
(73)【特許権者】
【識別番号】520413014
【氏名又は名称】ナノスティックス インコーポレイテッド
(74)【代理人】
【識別番号】110000855
【氏名又は名称】弁理士法人浅村特許事務所
(72)【発明者】
【氏名】ルイス、ジョン
(72)【発明者】
【氏名】パプロスキー、ロバート
(72)【発明者】
【氏名】ピンク、デズモンド
(72)【発明者】
【氏名】バスケス、カタリーナ
【審査官】三木 隆
(56)【参考文献】
【文献】国際公開第2018/075825(WO,A1)
【文献】米国特許出願公開第2016/0016978(US,A1)
【文献】米国特許第09934364(US,B1)
【文献】米国特許出願公開第2013/0095575(US,A1)
【文献】国際公開第2017/053592(WO,A1)
【文献】Abstract Book: ISEV2017,JOURNAL OF EXTRACELLULAR VESICLES,2017年05月15日,Vol.6 No.Sup.1,Page.1310414
【文献】Isev 2018 abstract book,JOURNAL OF EXTRACELLULAR VESICLES,2018年04月30日,Vol.7 No.sup.1,Page.1461450
【文献】Desmond Pink,Technical validation of a micro-flow cytometry platform for prostate cancer biomarker discovery,Cancer Res,2017年06月30日,Vol.77 No.13 Supplement,Page.3799
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/574
G01N 33/53
G01N 33/573
G01N 33/483
G01N 21/64
G16H 50/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
細胞外小胞を含む患者由来の試料を処理して、目的の疾患の疾患シグネチャーを識別する方法であって、
前記患者由来の試料を、前記細胞外小胞を前記目的の前記疾患についてのバイオマーカーに結合する1つ又は複数のプローブとインキュベートするステップと、
前記試料をマイクロフローサイトメトリーに供して、前記細胞外小胞を識別するステップと、
前記1つ又は複数のバイオマーカーについてのシグナル強度を得るステップ、及び前記試料に関連する1つ又は複数の光学特性を得るステップと、
前記シグナル強度、及び得られる場合、前記1つ又は複数の光学特性を処理して、前記試料中の異なる粒子表現型の濃度を計算するステップであって、前記シグナル強度を対数変換して変換したシグナル強度を生成する処理と、前記変換したシグナル強度が類似する粒子を、各関心領域は異なる粒子表現型である各光学特性について関心領域にビニングする処理とを含む、前記計算するステップと、
機械学習アルゴリズムのための入力として前記粒子表現型の前記濃度を使用して、臨床的に有意な前立腺がんを有する患者の確率を決定するステップと
を含む、方法。
【請求項2】
前記目的の疾患についての前記疾患シグネチャーに含まれる追加のバイオマーカーを識別するステップと、
前記1つ又は複数のバイオマーカーからの前記シグナル強度、及び存在する場合、前記1つ又は複数の光学特性を対数変換して、変換したシグナル強度を生成するステップと、
同様の変換したシグナル強度を有する粒子を、各バイオマーカーシグナルについての多くの異なる閾値を使用して関心領域内にビニングするステップと、
健康な対象由来の試料と、既知の疾患を有する対象由来の試料との間の各関心領域における前記粒子の濃度データを比較するステップと、
マーカーの各組合せから各関心領域についての受信者操作特性曲線下面積値を決定するステップと、
最も高い曲線下面積値を提供するバイオマーカーの組合せを選択して、前記疾患についての前記疾患シグネチャーを得るステップと
をさらに含む、請求項1に記載の方法。
【請求項3】
患者における臨床的に有意な前立腺癌の前記疾患シグネチャーを識別するために、患者サンプルを処理するステップと、
前記シグナル強度、及び得られる場合、前記1つ又は複数の光学特性を処理して、前記試料中の異なる粒子表現型の濃度を計算するステップであって、当該計算するステップは、シグナル強度を対数変換して変換したシグナル強度を生成することと、同様の変換したシグナル強度を有する粒子を各関心領域が異なる粒子表現型である各光学特性ついての関心領域内にビニングすることとを含む、前記計算するステップと、
機械学習アルゴリズムのための特徴または入力として前記粒子表現型の前記濃度を使用して、臨床的に有意な前立腺がんを有する患者の確率を決定するステップと
をさらに含む、請求項1に記載の方法。
【請求項4】
前記対数変換するステップ及びビニングするステップが同時に行われる、請求項1から3までのいずれか一項に記載の方法。
【請求項5】
前記対数変換するステップ及びビニングするステップが別々に行われる、請求項1から3のいずれか一項に記載の方法。
【請求項6】
前記粒子をビニングするステップが、光学特性当たりのセット数のビンを使用してビニングするステップを含む、請求項4または5に記載の方法。
【請求項7】
粒子表現型の前記決定が、
X軸に蛍光強度、Y軸に粒子密度をとり、すべてのバイオマーカー陽性粒子と陰性粒子の信号強度をプロットするカーネル密度推定の曲線を作成するステップと、
前記バイオマーカーの陰性粒子集団に対するカーネル密度推定のプロットにおけるY軸上の最も高い領域と交差するX軸上の蛍光値F1を識別するステップと、
F1から多くの異なるより高い蛍光シグナル強度について前記カーネル密度推定の曲線上の勾配を計算して、前記勾配がほとんど負である第2の蛍光値F2を識別するステップと、
F1+(2
*(F2-F1))+F3(式中、F3は、バイオマーカー陰性粒子がバイオマーカー陽性粒子として分類されないようにするために加えられる小さな任意の蛍光強度値である)に等しいバイオマーカー陽性粒子及びバイオマーカー陰性粒子を分離する蛍光強度の値(Fs)を計算するステップと、
前記粒子が前記蛍光強度の値(Fs)を上回るバイオマーカー陽性又は下回るバイオマーカー陰性であるバイオマーカーシグナルを有するかどうかに基づいて全ての粒子
のバイオマーカー陽性状態を決定するステップと、
前記粒子を、当該粒子の光散乱強度に基づいて異なる推定サイズグループにビニングするステップと、
前記バイオマーカー陽性状態及び
前記光散乱強度のグループの全ての可能の組合せによって粒子表現型を決定するステップと
によって、各患者における各粒子について前記バイオマーカー陽性状態を識別する動的蛍光閾値化アルゴリズムを使用して実施される、請求項1又は3に記載の方法。
【請求項8】
前記機械学習アルゴリズムが、個別/バギング/ブースト決定木アルゴリズム、線形/二次/三次/ガウスサポートベクターマシンアルゴリズム、ロジスティック回帰、線形/二次/部分空間判別分析、又はk近傍法アルゴリズムである、請求項1から7までのいずれか一項に記載の方法。
【請求項9】
前記機械学習アルゴリズムが、ブースト決定木アルゴリズムである、請求項8に記載の方法。
【請求項10】
前記ブースト決定木アルゴリズムが、エクストリーム勾配ブースト決定木アルゴリズムである、請求項9に記載の方法。
【請求項11】
前記エクストリーム勾配ブースト決定木アルゴリズムが、平均化された出力確率を有する少なくとも100個のモデルのアンサンブルを含む、請求項10に記載の方法。
【請求項12】
前記方法は、標準治療スコアを含む予測スコアを生成する、請求項3に記載の方法。
【請求項13】
前記1つ又は複数のバイオマーカーがSLC45A3、FOLH1、GHSR、JAG1、CDH11、SELE、MERTK、GABRA2、TNFRSF10B、ABCC5、LETMD1、CADM1、EMP2、ENTPD2、ABCB11、IL17RA、RNF122、ST14、SYPL1、LDLRAD3、HTR1F、EMP1、TRPV6、KCNN2、CLCN6、SLC17A3、SLC44A4、SLC22A23、C9orf91、RDH10、PNKD、TMEM229からなるグループから選択される、請求項1から3のいずれか一項に記載の方法。
【請求項14】
前記試料が血清試料である、請求項1から13までのいずれか一項に記載の方法。
【請求項15】
前記試料が血漿試料である、請求項1から13までのいずれか一項に記載の方法。
【請求項16】
前記試料が尿試料である、請求項1から13までのいずれか一項に記載の方法。
【請求項17】
前記試料が精液試料である、請求項1から13までのいずれか一項に記載の方法。
【請求項18】
組織特異的バイオマーカーに結合するプローブの混合物が使用される、請求項1又は3に記載の方法。
【請求項19】
前記組織特異的バイオマーカーが
、前立腺特異的バイオマーカー、がん特異的バイオマーカー、転帰特異的バイオマーカー、またはそれらの組み合わせである、請求項18に記載の方法。
【請求項20】
前記がん特異的バイオマーカーがグレリンである、または前記転帰特異的バイオマーカーがポリシアル酸である、請求項19に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
概して、本発明は、診断方法及びその診断方法において試験されるバイオマーカーに関する。より具体的には、本発明は、臨床的に有意な前立腺がん診断のための細胞外小胞及びその臨床的に有意な前立腺がんを予測するためのバイオマーカーの使用に関する。
【背景技術】
【0002】
細胞外小胞(EV:Extracellular vesicle)は、免疫学、神経学、心臓病学、及び腫瘍学などの様々な分野における診断及び予後に大きな可能性を秘めている。EVには、エキソソーム(30~100nm)、微小胞(50~2,000nm)、アポトーシス小体(500~4,000nm)、及び非常に大きなオンコソーム(oncosome)(1,000~10,000nm)が含まれる。正常細胞及び異常細胞は、それらの起源の細胞からmRNA、miRNA、及びタンパク質マーカーの多くを含有するEVを継続的に放出する。EVは、血液、尿、精液、及び脳脊髄液を含むほぼ全ての生体液中に見出されており、低侵襲性診断アッセイの有望な標的となっている。
【0003】
EV特性付けのための複数の方法が存在する(Szatenek Rら、Int J Mol Sci 18(6)、2017年)。電子顕微鏡法はEVの最高解像度の画像を提供するが、ハイスループットデータ収集を欠き、多くのマーカーを同時に容易に測定することができず、生データが画像であるため、時間がかかり、複雑なデータ分析を必要とし得る(Harris JR、Arch Biochem Biophys 581:3~18頁、2015年)。ナノ粒子追跡分析及び調整可能な抵抗パルス感知は、粒子の迅速な計数及びサイジングを可能にするが、EVマーカーを特性付けるためには理想的ではない(Gardiner Cら、J Extracell Vesicles 2、2013年;Vogel Rら、Anal Chem 83(9):3499-35-6、2011年)。ナノスケール又は高感度フローサイトメトリーとも称されるマイクロフローサイトメトリー(μFCM:Microflow cytometry)は、粒子の光学特性のハイスループット特性付けを可能にし、数百万のEVについての粒径、濃度、及びマーカー存在量の定量を数分で可能にする(Szatenek、上記)。これらの望ましい特性は、μFCMを高感度EVベースの臨床アッセイに非常に適したものにする。
【0004】
μFCMは、分析を複雑にする大量のデータを生成する。100倍に希釈された典型的な10μLの血漿試料は、1分の分析において、数十を超える光学特性を伴う各々5,000,000を超える事象を生じ得る。換言すれば、1μLの血漿は109を超える事象を有し得る。他の液体生検の種類は同様の濃度を有し得る。μFCMによるEVの分析は、試料分析当たり、ナノ粒子(NTA:Nanoparticle)又は電子顕微鏡法と比較して少なくとも500~50,000倍多い試料の事象を検査することができ、試料全体のより大きな代表的な分析を提供する。従来の細胞ベースのフローサイトメトリー分析は、典型的に、多くの細胞が同様のサイズを有し、マーカー陽性又は陰性として特性付けられるため、二変量散布図を生成し、4象限にわたってユーザが定義した関心領域(ROI:region of interest)内の事象濃度を定量することを含む。このような方法は、EVがサイズ、それ故、マーカー存在量に幅があるため、μFCMでは単純すぎ、それにより、非常に大きな複雑なデータセットを迅速に処理することができるμFCM分析ツールの開発を必要とする。
【0005】
EVベースの診断/予後アッセイを開発する場合、EVは、生体試料内で特性付けされるだけでなく、患者の幸福及び/又は医療経済を改善することができる臨床的に意味のある状態を予測するそれらの能力についても分析されなければならない。
【先行技術文献】
【非特許文献】
【0006】
【文献】Szatenek Rら、Int J Mol Sci 18(6)、2017年
【文献】Harris JR、Arch Biochem Biophys 581:3~18頁、2015年
【文献】Gardiner Cら、J Extracell Vesicles 2、2013年
【文献】Vogel Rら、Anal Chem 83(9):3499-35-6、2011年
【文献】Churm Rら、Obes Rev 18(2):140~148頁、2017年
【文献】Kasperzyk JLら、Cancer Epidemiol Biomarkers Prev 22(12):2354~63頁、2013年
【文献】Rodriguez A及びLaio A、Science 344(6191):1492~6頁、2014年
【文献】Bruggner RVら、Proc Natl Acad Sci USA 111(26):E2770~7頁、2014年
【発明の概要】
【課題を解決するための手段】
【0007】
本発明の一態様によれば、患者における疾患を診断する方法が提供される。この方法は、患者由来の血漿、血清、尿又は他の体液試料などの液体生検を、目的の疾患についてのバイオマーカーに結合する1つ又は複数のプローブとインキュベートするステップと、試料をマイクロフローサイトメトリーに供するステップと、1つ又は複数のバイオマーカーについてのシグナル強度を得るステップ、及び任意選択により、試料に関連する1つ又は複数の光学特性を得るステップと、シグナル強度、及び得られる場合、カスタムアルゴリズムを用いて処理した1つ又は複数の光学特性を処理して、試料中の異なる粒子表現型の濃度を計算するステップとを含む。これらの粒子表現型の濃度は、臨床的に有意な前立腺がんを有する患者の確率を決定するための機械学習アルゴリズムのための特徴(すなわち、入力)として使用される。
【0008】
本発明の別の態様によれば、疾患についての疾患シグネチャーを識別する方法が提供される。この方法は、健康な対象由来の試料及び既知の疾患を有する対象由来の試料を、バイオマーカーについての1つ又は複数のプローブとインキュベートするステップと、試料をマイクロフローサイトメトリーに供するステップと、1つ又は複数のバイオマーカーについてのシグナル強度を得るステップ、及び任意選択により、各試料に関連する1つ又は複数の光学特性を得るステップと、1つ又は複数のバイオマーカーからのシグナル強度、及び存在する場合、1つ又は複数の光学特性を対数変換して、変換したシグナル強度を生成するステップと、同様の変換したシグナル強度を有する粒子を関心領域(ROI)内にビニングするステップと、各ROIについて粒子の濃度を決定するステップと、健康な対象由来の試料と、既知の疾患を有する対象由来の試料との間の各ROIにおける粒子の濃度データを比較するステップと、マーカーの各組合せから各ROIについての受信者操作特性(ROC:receiver operator characteristic)曲線下面積(AUC:area under the curve)値を決定するステップと、最も高いAUC値を提供するバイオマーカーの組合せを選択して、疾患についての疾患シグネチャーを得るステップとを含む。
【0009】
本発明の更なる態様によれば、患者における臨床的に有意な前立腺がんを診断する方法が提供される。この方法は、患者由来の試料を、臨床的に有意な前立腺がんについての1つ又は複数のバイオマーカーに結合する1つ又は複数のプローブとインキュベートするステップと、試料をマイクロフローサイトメトリーに供するステップと、1つ又は複数のバイオマーカーについてのシグナル強度を得るステップ、及び任意選択により、試料に関連する1つ又は複数の光学特性を得るステップと、シグナル強度、及び得られる場合、異なる粒子表現型の濃度を決定するカスタムアルゴリズムを使用して1つ又は複数の光学特性を処理するステップと、機械学習アルゴリズムのための特徴(すなわち、入力)として粒子表現型の濃度を使用して、臨床的に有意な前立腺がんを有する患者の確率を決定するステップと、特定の確率閾値の使用に基づいて疾患を有する患者を診断するステップとを含む。
【0010】
一実施例では、処理するステップは、シグナル強度を対数変換して、変換したシグナル強度を生成するステップと、同様の変換したシグナル強度を有する粒子を、各関心領域(ROI)が異なる粒子表現型であるとみなされる、各光学特性についてのROI内にビニングするステップとを含む。他の実施例では、対数変換するステップ及びビニングするステップは同時又は別々に行われる。
【0011】
別の実施例では、粒子をビニングするステップは、光学特性当たりのセット数のビンを使用してビニングするステップを含む。
【0012】
更なる実施例では、この方法は複数のROIを含む。
【0013】
別の実施例では、粒子は、バイオマーカーに結合するプローブについてのそれらの陽性状態及びそれらの光散乱強度に基づいてビニングされる。粒子がバイオマーカーについて陽性であるかどうかを決定するために、カーネル密度推定(KDE:kernel density estimation)関数が、特定の患者についての特定のバイオマーカーについてのシグナルヒストグラムに適用される。蛍光値F1は、バイオマーカーの陰性粒子集団に対するKDEプロットにおける最も高い領域から識別される。次に、KDE曲線の勾配が、多くの異なるより高いシグナル強度について計算される。第2の蛍光値F2は、勾配が最も負である場所から識別され、これは陰性粒子集団の右側の下半分である。バイオマーカー陽性粒子及びバイオマーカー陰性粒子を分離する蛍光強度の値(Fs)は、F1+(2*(F2-F1))+F3(式中、F3は、バイオマーカー陰性粒子がバイオマーカー陽性粒子として分類されないことを保証するのに役立つように加えられる小さな任意の蛍光強度値である)に等しい。Fsを上回る又は下回る蛍光強度を有する粒子は、それぞれ、バイオマーカーについて陽性又は陰性である。動的シグナル閾値化のこの方法は、時間の経過に伴う、及び異なる患者に対するシグナルシフトに耐性がある。各患者についての全ての粒子が各バイオマーカーについて陽性/陰性として分類されると、粒径を推定するために使用される対数変換光散乱シグナルは、任意の数のグループにビニングされる。例えば、0~1の範囲のシグナル強度及び10のビンが存在する場合、0から0.1の間のシグナルはグループ1にあり、一方、0.9~1はグループ10にある。最後に、粒子表現型は、バイオマーカー状態(陰性/陽性)及び光散乱ビンの全ての可能な組合せに基づいて作成される。例えば、バイオマーカーA+及び光散乱ビン1/10粒子は、バイオマーカーA-及び光散乱ビン1/10粒子とは異なる。全ての粒子表現型の濃度が決定され、機械学習アルゴリズムのための入力特徴として使用される。
【0014】
なお更なる実施例では、機械学習アルゴリズムは、個別/バギング/ブースト決定木アルゴリズム、線形/二次/三次/ガウスサポートベクターマシンアルゴリズム、ロジスティック回帰、線形/二次/部分空間判別分析、又はk近傍法アルゴリズムである。一実施例では、機械学習アルゴリズムは、ブーストされ、アンサンブルされた決定木アルゴリズム、例えば、XGBoostアルゴリズムである。
【0015】
一実施例では、エクストリーム勾配ブースト決定木アルゴリズムは少なくとも100個のモデルのアンサンブルを含み、各モデルの確率は臨床的に有意な前立腺がんの単一の確率値を生じるように平均化される。
【0016】
別の実施例では、予測スコアは標準治療スコアを含む。
【0017】
更なる実施例では、1つ又は複数のバイオマーカーは表1又は表2から選択される。
【0018】
なお更なる実施例では、試料は血清試料である。
【0019】
これら及び他の実施例及び特徴は、以下の説明及び図面を参照することにより、より良く理解されるであろう。
【図面の簡単な説明】
【0020】
【
図1】本発明の一実施例による方法の概略図を表す図である。
【
図2】μFCMデータを使用した臨床的特徴の予測/関連付けを示す図である。A)LALS-PSMA、LALS-グレリン、及びPSMA-グレリンデータセットを使用して種々の臨床的特徴を予測するための受信者操作特性曲線下面積(ROC AUC:receiver operator characteristic area under the curve)マップ。各マップにおける最大の10%AUCを平均化し、比較した;B)LALS-PSMAデータセットを使用してPCaグレードグループ1+、2+、3+、4+及び5を予測するためのROC AUCマップ;C)LALS-グレリンデータセットを使用して糖尿病を予測するためのROC AUCマップ;並びにD)LALS-PSMAデータセットを使用したPSA(右)、腫瘍ステージ(中央)、及び体重(右)についての相関係数マップ。
【
図3】血漿試料からの粒子に対するPSMA/グレリンプローブ染色の変動性が従来の手動ゲーティング分析を複雑にすることを示す図である。A)、B)及びC)は、非臨床的に有意及び臨床的に有意なPCa患者についての大角度光散乱(LALS:large angle light scatter)及びPSMA(a)、LALS及びグレリン(b)、並びにPSMA及びグレリン(c)の代表的な散布図及びROC AUCマップである;D)手動ゲーティングによる患者の血漿中のPSMA/グレリンプローブ陽性粒子の定量;E)手動ROIデータを使用して臨床的に有意なPCa(グレードグループ3+)を予測するためのROC曲線。
【
図4】μFCMデータのviSNE分析を示す図である。A)臨床的に有意及び非臨床的に有意なPCa患者からの同数の粒子(30,000)をviSNEにより分析した;B)高速検索/密度ピークアルゴリズムを使用して粒子をクラスター化した;C)臨床的に有意なPCa粒子についてのviSNEクラスター純度。いくつかのクラスターは臨床的に有意なPCa患者に由来する粒子に対してエンリッチメントを示す(矢印)。
【
図5】PSMA-グレリンデータセットを使用して臨床的に有意なPCaを予測するためのμFCMデータの機械学習の最適化を示す図である;A)、B)、C)最適な機械学習アルゴリズム(a)、光学パラメーター当たりのビンの数(b)及びアンサンブルにおけるXG Boostモデルの数(c);D)モデル性能に対するグリッドサーチXGBoostパラメーター、特徴選択、及びアンサンブルの効果;E)臨床的に有意なPCaを予測するための手動ゲーティング、CITRUS、及びカスタムビニング-XGBoostアルゴリズムについてのROC曲線。プロットした値は、5倍交差検証の少なくとも10回の反復による±SEMを表す。
【
図6】臨床的に有意なPCaを予測するための臨床及びμFCMデータの統合を示す図である。A)μFCMベースのXGBoost予測並びにPSA、年齢、人種、DRE、以前の陰性生検、及びPCaの家族歴を含むSOC臨床的特徴を使用したロジスティック回帰モデルからの臨床的に有意なPCaの予測のウォーターフォールプロット;B)μFCMデータを伴う又は伴わないSOCのロジスティック回帰モデルの受信者操作特性曲線;C)がんと診断され、且つ異常DREを伴う前立腺肥大(≧40cm
3(40cc))を有する又は有さない患者の割合;D)、E)前立腺肥大を有する及び有さない男性におけるPSA(d)及びPSA密度(e)。プロットした値は平均±SEMである;F)μFCM+SOCロジスティック回帰モデルを使用した前立腺肥大を有する男性における臨床的に有意なPCaの予測;並びにG)前立腺肥大を有する男性が、μFCM+SOCモデルを使用した生検を受けるべきかどうかの推奨。
【
図7】LALS-PSMA-グレリンデータセットのviSNEプロットのクラスタリングアルゴリズムの比較を示す図である。A)、B)、及びC)クラスタリングアルゴリズムは、K平均(a)、期待値最大化ガウス混合モデル(b)、及び高速検索/密度ピーク(c)を含む。
【
図8】PSMA-グレリンデータセット変換後のXGBoostモデル性能のグラフ表示である。
【
図9】臨床的に有意なPCaを予測するためにPSMA-グレリンデータセットを使用したXGBoostモデルからの可変ゲインマップ(a)、並びにAUC(カラースケール)及び可変ゲイン(グレースケール)マップのオーバーレイ(b)を示す図である。
【
図10】マイクロフローサイトメトリー及び超音波を使用した単一のがん細胞の高感度検出からの方法及び結果を表す図である。
【
図11】シフトしたマイクロフローサイトメトリーデータに対する臨床的予測の向上した精度を示す方法及び結果を表す図である。
【
図12】Jagged 1についてのバイオマーカー結果を示す図である。
【
図13】カドヘリン11、2型、OBカドヘリンについてのバイオマーカー結果を示す図である。
【
図14】ポリシアル酸についてのバイオマーカー結果を示す図である。
【
図15】MERTKについてのバイオマーカー結果を示す図である。
【
図16】プロステインについてのバイオマーカー結果を示す図である。
【発明を実施するための形態】
【0021】
臨床的に有意な前立腺がんを含む、疾患を診断するためのバイオマーカーを例示する実施例;臨床的に有意な前立腺がんを含む、疾患を診断する方法;並びに疾患予測モデル及びそれを使用する診断検査を開発する方法が本明細書に記載される。本明細書に記載される実施例及び実例は、当業者のために意図された例示目的のためであり、決して限定することを意味しないことが理解される。開示全体にわたる実施例又は実例に対する全ての言及は、例示的で非限定的な実施例又は例示的で非限定的な実例に対する言及とみなされるべきである。
【0022】
別段に定義されない限り、本明細書に使用される全ての技術用語及び科学用語は、本発明が属する分野の当業者によって通常理解されるものと同じ意味を有する。また、本明細書及び添付の特許請求の範囲において使用される場合、単数形「1つの(a)」、「1つの(an)」及び「その(the)」は、文脈が明確に別様を指示しない限り、複数の指示対象を含むことに留意されなければならない。例えば、「抗原」又は「抗体」に対する言及は、複数の抗原分子又は抗体を含むことが意図される。
【0023】
患者における、臨床的に有意な前立腺がんなどの疾患を診断する方法が提供される。本論述の目的のために、「臨床的に有意な前立腺がん」は、グリーソングループ3又はそれ以上を有する前立腺がんを意味する。この方法は、患者由来の試料を、目的の疾患についての1つ又は複数のバイオマーカーに結合する1つ又は複数のプローブ及び/又は抗体とインキュベートするステップと、試料をマイクロフローサイトメトリーに供するステップと、1つ又は複数のバイオマーカーについてのシグナル強度を得るステップ、及び任意選択により、試料に関連する1つ又は複数の光学特性を得るステップと、シグナル強度、及び得られる場合、1つ又は複数の光学特性を、カスタムアルゴリズムを使用して処理して、患者試料中の異なる粒子表現型の濃度を決定するステップと、機械学習のための入力として患者試料からの粒子表現型の濃度データを使用して機械学習アルゴリズムの出力に基づいて疾患を有する患者を診断するステップとを含む。一実施例では、疾患は、がん、特に臨床的に有意な前立腺がんであり得、バイオマーカーは、がんバイオマーカー、特に臨床的に有意な前立腺がんバイオマーカーと相関する。
【0024】
疾患シグネチャーを識別する方法も提供される。この方法は、健康な対象由来の試料及び既知の疾患を有する対象由来の試料を、疾患についての1つ又は複数のバイオマーカーに結合する1つ又は複数のプローブとインキュベートするステップと、試料をマイクロフローサイトメトリーに供するステップと、1つ又は複数のバイオマーカーについてのシグナル強度を得るステップ、及び任意選択により、各試料に関連する1つ又は複数の光学特性を得るステップと、1つ又は複数のバイオマーカーからのシグナル強度、及び存在する場合、1つ又は複数の光学特性を対数変換して、変換したシグナル強度を生成するステップと、同様の変換したシグナル強度を有する粒子を関心領域(ROI)内にビニングするステップと、各ROIにおける粒子の濃度(各ROIにおける全粒子数を、データ収集の間に分析される試料体積で除算することによって計算される)を決定するステップと、健康な対象由来の試料と、既知の疾患を有する対象由来の試料との間の各ROIにおける粒子の濃度データを比較するステップと、マーカーの各組合せから各ROIについての受信者操作特性(ROC)曲線下面積(AUC)値を決定するステップと、最も高いAUC値を提供するバイオマーカーの組合せを選択して、疾患についての疾患シグネチャーを得るステップとを含む。
【0025】
本発明において有用な試料には、血液(又はその成分)、精液、乳などの生体試料が含まれるが、これらに限定されない。本発明において、細胞外小胞は、他の方法において要求されるように、単離及び精製される必要はない。代わりに、血清又は血漿は、標準的な臨床診断手順に従って血液から単離され得、更なる精製及び処理を必要とすることなく、本明細書に記載される方法において使用され得る。
【0026】
試料は、目的の疾患若しくは診断される疾患についてのバイオマーカー、又はこの場合、EVのような特定の種類の小粒子に関連するプローブとインキュベートされる。プローブには、特異的抗原に対する、F(ab)、F(ab’)2若しくはF(ab’)断片、ミニボディ(minibody)などのような全抗体若しくは抗体成分、又は特異的標的に対するペプチドが含まれ得るが、これらに限定されない。プローブはまた、試料中の特定の成分の識別を可能にする種々の色素を含んでもよい。例えば、膜結合小粒子を染色する親油性色素とのインキュベーションは、試料中の脂質結合粒子からのタンパク質凝集体の分離に役立ち得る。典型的に、プローブは、プローブ結合標的の検出に役立つ、蛍光コンジュゲートなどの直接的にコンジュゲートした二次成分を有する。
【0027】
PSMA陽性EVを検出するために、試料は、DyLight405などの色素と直接コンジュゲートしたPSMA特異的モノクローナル抗体J591(BZL Biologics、LLCから入手可能)とインキュベートされ得る。或いは、非コンジュゲートプローブ(例えば、PSMA特異的モノクローナル抗体J591)は、試料とのインキュベーション後、アッセイに使用される一次プローブを識別するために二次薬剤と更にインキュベートされ得る。例えば、Qdot565コンジュゲートロバ抗マウスIgG抗体とのインキュベーションは、その後のμFCMアッセイにおける検出を可能にする。典型的に、バイオマーカープローブは、目的の疾患によって影響される細胞又は組織においてのみ発現されるか、又は主に発現される生体分子に特異的である。しかしながら、バイオマーカーは特定の細胞型に対して特異的であってもよい。更に、1つより多いバイオマーカーを使用して、目的の疾患及び/又は細胞型の1つより多い特徴を識別することができる。
【0028】
バイオマーカープローブとの試料のインキュベーションは、単一試料+単一プローブフォーマットとして、又は単一試料+複数プローブフォーマットとして行われ得る。インキュベーションのフォーマットは、各バイオマーカープローブが試料中のEV集団に関する異なる情報を提供することができるので、異なる解決策を提供することができる。例えば、プローブは、脂質結合事象対非脂質結合事象、又は上皮粒子起源対非上皮粒子起源を示してもよい。他の場合には、プローブは、疾患の存在、疾患の存在及び侵襲性を示してもよい。インキュベーションにおける複数のプローブは、粒子起源、疾患の存在、及び疾患の侵襲性の同様の徴候を有し得る。したがって、プローブの組合せは疾患表現型の検出について有意な意味を有し得る。
【0029】
粒径及び計数は光散乱によって推定することができる。上記の蛍光強度と組み合わせた光散乱特性は、各粒子について固有の表現型を提供することができる。これらの粒子表現型は、単独で、又は複数のバイオマーカーと組み合わせて使用することができ、目的の疾患についての固有の疾患シグネチャーを提供することができる。
【0030】
試料は、これらに限定されないが、Apogee A50マイクロフローサイトメーター又はCytoFLEX又はDxFlexフローサイトメーターなどの市販の機械を使用してμFCMに供される。μFCM分析から得られた生データは、MATLAB、R、又はPythonで書かれたアルゴリズムを使用して抽出することができ、行として個々の粒子として、並びに列として光散乱及び蛍光強度として編成することができる。各粒子が記録された時間は別個の列に表すことができる。
【0031】
各粒子表現型についての光散乱/蛍光強度についての最小及び最大カットオフは、異なる光散乱/蛍光強度の範囲についての異なるカットオフの範囲を使用すること、及び以前に取得された患者データからの曲線下で最も高い受信者操作特性を提供するカットオフを識別することを含む、最適化実験によって決定することができる。
【0032】
各粒子表現型における粒子の数は、同様の光散乱及びマーカー強度を有する粒子をグループ化するカスタム処理スクリプトを使用して決定することができる。粒子表現型濃度は、粒子表現型数、試料を実施した時間の長さ、μFCMの試料流速、及び試料の希釈係数に基づいて計算される。患者が1つより多いμFCMデータファイル(すなわち、複数の複製)を有する場合、粒子表現型濃度は、全ての複製μFCMの日付のファイルにわたって平均化され得る。
【0033】
また、各患者における各粒子についてのバイオマーカー陽性状態を識別することによって動的蛍光閾値化アルゴリズム(Dynamic Fluorescence Thresholding algorithm)を使用して試料中の粒子表現型濃度を計算することも可能である。各患者試料についての粒子がバイオマーカーについて陽性であるかどうかを決定するために、カーネル密度推定(KDE)関数が、単一の患者試料からの単一のプローブシグナルのヒストグラムプロットに適用される。蛍光値F1は、KDEプロットの左側付近の最大ピークである、バイオマーカー陰性粒子集団についてのKDEプロットにおけるY軸上の最も高い領域(粒子密度)と交差するヒストグラムプロットのX軸上の領域(蛍光強度)として識別される。次に、KDE曲線の勾配が、F1からの多くの異なるより高いシグナル強度について計算される。第2の蛍光値F2は、勾配が最も負である場所から識別され、これは陰性粒子集団の右側の下半分である。バイオマーカー陽性粒子及びバイオマーカー陰性粒子を分離する蛍光強度値(Fs)は、F1+(2*(F2-F1))+F3(式中、F3は、バイオマーカー陰性粒子がバイオマーカー陽性粒子として分類されないことを保証するのに役立つように加えられる小さな任意の蛍光強度値である)に等しい。Fsを上回る又は下回る蛍光強度を有する粒子は、それぞれ、バイオマーカーについて陽性又は陰性である。各患者についての全ての粒子が各バイオマーカーについて陽性/陰性として分類されると、粒径を推定するために使用される対数変換光散乱シグナルは、任意の数のグループにビニングされる。最後に、粒子表現型は、バイオマーカー状態(陰性/陽性)及び光散乱ビンの全ての可能な組合せに基づいて作成される。
【0034】
上記で収集されたデータから、機械学習のためのデータセットが構築される。表は、全ての患者についての粒子表現型濃度を用いて作成することができる。1回の反復において、行は患者を表すことができ、列は粒子表現型濃度を表す。しかしながら、データは逆の様式で、又は何らかの他の表形式で表すことができることは当業者には明らかであろう。
【0035】
臨床的に関連するデータは、データセットが作成される方法に応じて、追加の列又は行として表に追加することができる。このデータは、機械学習についての付加的な特徴として使用することができるか(例えば、μFCMデータを用いたPSAは臨床的に有意な前立腺がんを有する人のより良い予測を提供するか?)、又は機械学習アルゴリズムが予測する必要があるラベルとして使用することができる(例えば、どの患者が臨床的に有意な前立腺がんを有するかの識別)。
【0036】
データセットが作成されると、臨床データを用いて又は用いずにμFCMから臨床状態を予測することができる最適化された機械学習モデルが生成される。機械学習のために使用されるソフトウェアには、R、MATLAB、KNIME、及びpythonが含まれ得るが、これらに限定されない。機械学習モデルには、単一決定木、サポートベクターマシン、k近傍法、線形回帰、ロジスティック回帰、判別分析、ランダムフォレスト、ニューラルネットワーク、及びXGBoostが含まれ得る。臨床状態を予測するために最も高いROC AUCを提供するアルゴリズムは、更に最適化することができる。全ての機械学習アルゴリズムは、データを5つの別個のグループに分割することを含む5倍交差検証を使用して分析される。モデルは5つのグループのうちの4つを使用して作成することができ、モデル精度はホールドアウトされたグループに対して決定することができる。グループはシャッフルされ、このプロセスは、全ての患者がホールドアウトされたグループで1回使用されるように更に4回反復される。これにより、モデルを作成するために使用されなかったデータに対してモデル精度が決定されることが保証される。
【0037】
機械学習アルゴリズム最適化は、再帰的特徴量削減を使用してモデル作成前にどのμFCM/臨床的特徴を保持/除去すべきかを識別することを含む。このアルゴリズムは全てのデータを使用してモデルから最も重要な特徴を識別する(例えば、Rにおけるxgb.重要度機能を使用したXGBoost特徴重要度)。上位10、20、30、40、50、60、70、80、90、又は100%の最も重要な特徴を含む複数のデータセットが作成され、5倍交差検証を使用して最も高いROC AUCを提供するデータセットは、最終的な機械学習モデルのために保持される特徴を含む。遺伝的アルゴリズム及び焼きなまし法を含む他の特徴選択アルゴリズムもまた、このステップで使用することができる。
【0038】
特徴選択の後、機械学習アルゴリズムの調整可能なパラメーターは、グリッドサーチによって最適化することができる。これは、各々の調整可能なアルゴリズムパラメーター(例えば、「nrounds」:100、200、及び300、並びに「max_depth」:3、4、及び5などのXGBoostパラメーター)についての複数の値を提供し、可能なパラメーター値のあらゆる組合せを試験することを含む。5倍交差検証を使用して最も高いROC AUCを提供するパラメーター値のセットが、最終的な機械学習モデルのために使用される。
【0039】
最終的な機械学習モデル最適化は、全てのモデルからの予測を平均化することによって、多く(典型的には100以上)のモデルを一緒にアンサンブルすることを含む。全てのモデルは上記の最適化された特徴及びパラメーターを使用するが、各モデルは、モデル作成のために、患者のわずかに異なるコホート(例えば、患者の無作為に選択した80%)を使用する。これにより、各モデルが固有になり、全てのモデルの予測の平均が、次いで完全なデータセットを有する単一のモデルを使用して、臨床状態のより正確且つ安定した予測を提供する。最終的に最適化されたアンサンブルモデルは将来の使用のためにコンピュータ上に保存される。
【0040】
最終的な機械学習モデルは、新しい患者の臨床状態を予測するために使用することができる。臨床データを伴う又は伴わない粒子表現型濃度を含む新しい患者データは、患者が特定の臨床状態を有する確率を予測するための最終的な機械学習モデルについての入力として使用することができる。
【0041】
上記の方法を使用して、以前に臨床的に有意な前立腺がんと診断された患者が、疾患と最も一般的に関連する粒子表現型/バイオマーカーを決定するために研究された。これらの粒子表現型/バイオマーカーを、
図12、13、14、15及び16における概念の更なる証拠と共に表1に示す。
【表1-1】
【表1-2】
【表1-3】
【0042】
「実例」
種々のサイズの異なるEVに起因して、目的はμFCMデータを多くの異なるROI(ここで各ROIは異なるEVの濃度を表す)に分離すること、及び臨床状態を予測するためにROIデータに関する機械学習を使用することであった(
図1)。このようなモデルを作成する前に、まず、どの臨床状態をμFCMデータが最適に予測することができるかを識別することが重要であった。自動分析スクリプトを使用して、PSMA及びグレリンプローブに関連する10の異なる臨床状態を予測するためのμFCMデータのAUCマップを作成した。
【0043】
LALS-PSMA、LALS-グレリン、及びPSMA-グレリンAUCマップ内のAUCのうちの最も高い10%を平均すると、PCaグレードグループ5及び4+の予測が、最も高い平均AUCを生じた(
図2a)。興味深いことに、3つ全ての二変量AUCマップは、グレードグループ5PCaの予測に関して0.8を超えるAUCを有するLALS-PSMAと共にこれらの高グレードPCaの予測に関して0.7を上回る上位10%のAUCを提供した。LALS-PSMA AUCマップは、異なるPCaグレードグループを比較した場合に興味深いパターンシフトを示した(
図2b)。LALSを使用して粒径を推定すると、グレードグループ1+の予測は、0.5を超えるAUCを有する比較的小さなPSMA陽性粒子を示し、全体的にこれらのROIにおける粒子濃度が、グレードグループ1+PCaを有する患者において、より高いことを意味し、一方、より大きなPSMA陽性粒子は主に0.5を下回るAUCを示し、全体的にこれらのROIにおける粒子濃度が、グレードグループ1+PCaを有する患者において、より低いことを意味する。より高いグレードグループについてのAUCマップは、より大きなPSMA陽性粒子に対して0.8超のAUC及び多くのより小さなPSMA陽性粒子に対して約0.3のAUCを有するグレードグループ5PCaでこの表現型の漸進的逆転を実証した。この表現型逆転はグレードグループ3+AUCマップでかなり目立つようになった。以前の臨床試験では、前立腺全摘出術を受けたグレードグループ3のPCa患者は、0.5以下の10年の無再発進行であり、グレードグループ2のPCaを有するこれらの患者についての0.75超より有意に低かった(28)。このことにより、グレードグループ3のPCaを有する男性のほとんどは、原発腫瘍の外科的切除によってPCaの患者が治癒しないため、診断時に転移性疾患を有することが示唆される。理論によって制限されないが、より高いグレードのPCa患者におけるより大きなPSMA陽性粒子のより多くの存在量は、局所腫瘍細胞からのより大きなEV(>300nm)が血管内への侵入を困難にするので、循環転移細胞に部分的に起因する可能性がある。
【0044】
エネルギー及びグルコース代謝におけるグレリンの役割(Churm Rら、Obes Rev 18(2):140~148頁、2017年)に起因して、糖尿病を予測するためのAUCマップを作成した。様々な異なるサイズのグレリン陽性粒子は0.7付近のAUCを示したことから、糖尿病男性はグレリン受容体のレベルの上昇を伴うEVを有することが示唆される(
図2c)。
【0045】
LALS-PSMAデータを使用して、PSA、腫瘍ステージ、及び体重についての相関マップを作成した(
図2d)。PSMAに対してわずかに陽性の比較的大きな粒子はPSAと最も高い正の相関を実証したが、強いPSMA陽性である大きな粒子は腫瘍ステージと最もよく相関した。このような相関は驚くことではない。なぜなら、1)前立腺PSMA発現が、診断時にPSAと相関すると示されており(Kasperzyk JLら、Cancer Epidemiol Biomarkers Prev 22(12):2354~63頁、2013年)、2)より高いグレードの腫瘍ほど、より広がる可能性が高く、より高いグレードのAUCマップと腫瘍ステージ相関マップとの間の類似性が説明されるからである。
【0046】
AUC/相関マップの結果を考慮して、μFCMデータを使用して、グレードグループ3+と定義された臨床的に有意なPCaを予測した。なぜなら、これらの患者はグレードグループ2及びより低いPCa患者よりも顕著に悪化した転帰を実証するからである。
【0047】
従来の分析のベンチマークを提供するために手動ゲーティングによってμFCMデータを分析した。特定の粒子集団の周囲に手動ゲートを作成することは重要なタスクである。なぜなら、異なる粒子集団が異なる患者散布図上に存在し、集団位置においていくらかのわずかなシフトを伴うからである(
図3a、b、c)。簡略化のために、全てのマーカー陽性粒子をグループ化したゲートを作成した。非臨床的に有意なPCaと比較した場合、臨床的に有意なPCaではグレリン陽性粒子の濃度のみが2.1倍有意に高かった(p<0.05、
図3d)。臨床的に有意なPCaを予測するためのPSMA-、グレリン-、及びPSMA/グレリン陽性粒子濃度のAUCは全て0.6を下回った(
図3e)。これらの低いAUCは、0.5を上回る及び下回るAUCを有する粒子を取り囲むゲートを示すAUCマップによって説明することができる(
図3a、b、c)。
【0048】
臨床的に有意及び非臨床的に有意な粒子の両方のviSNEプロットは、従来の散布図で見られたよりも多くの粒子集団を一緒に見出した(
図4a)。K平均、期待値最大化ガウス混合モデル、及び高速探索/密度ピークアルゴリズムを使用して粒子をクラスター化し、最後のアルゴリズムは不規則な形状を有する大きなクラスターを維持することができる唯一のものであった(
図4b及び
図8)。2つのクラスターは、臨床的に有意なPCaについて0.8超のクラスター純度を達成したことから、これらの粒子集団は臨床的に有意なPCa患者内でより高いレベルにあることが示唆される(
図4c)。これらの結果は臨床的に利用するのに有望であるように見えるが、viSNEの再現性のない性質は全てのデータを同時に分析することを必要とする。viSNEは100,000個までの事象しか扱うことができないため、215人の患者コホートにおける粒子の99.99%超は分析から除外される。
【0049】
μFCMデータからの臨床的に有意なPCaの予測を最適化するために、ROIからの粒子濃度を、24の異なる機械学習アルゴリズムのための訓練データとして使用した。LALS-PSMA、LALS-グレリン、及びPSMA-グレリンデータセットでは、XGBoostが0.61、0.62、及び0.66において最も高いAUCを提供した(
図5a)。その後の全ての分析は、XGBoostと共にPSMA-グレリンデータセットを使用した。
【0050】
決定木ベースのモデルについて予想されるように、μFCMデータの単調変換はXGBoostモデル性能を改善しなかった(
図9)。XGBoostモデルの精度に対して最も重要なROIを示すXGBoost可変ゲインマップは、多くの異なる粒子集団がXGBoostモデルにとって重要であることを示した(
図10a)。比較的高い可変ゲインを有するROIは、0.5を大きく上回る及び下回るAUCマップ上の領域とほとんど重なったことにより、臨床的に有意なPCa患者において、より高い及びより低い濃度を有する粒子集団がこのモデルにとって重要であることが示唆される(
図10b)。
【0051】
ビニングストラテジーを、32を上回る又は下回るように変化させると、AUCが減少したことにより、この解像度のレベルが臨床的に有意なPCaを予測するのに好ましいことが示唆される。ますます大きなXGBoostモデルのアンサンブルを作成することにより、モデルの性能が向上した(
図5c)。単一のXGBoostモデルと比較して、100個のモデルのアンサンブルはAUCにおいて5%の改善をもたらし、モデル変動性を95%低下させた。より大きなXGBoostアンサンブルはより大きなモデル性能のために作られ得るが、精度におけるこのような小さな利点はより大きな処理/メモリの要件も有する。グリッドサーチXGBoostパラメーター及び再帰的特徴量削減は、XGBoost AUCをそれぞれ3%及び5%増加させた(
図5d)。グリッドサーチ、特徴選択、アンサンブルを組み合わせると、XGBoost AUCが12%有意に増加したことから(p<0.05)、モデル最適化技法の間の相加的相互作用が示唆される。PSMA-グレリンデータセットのCitrus及び手動ゲーティング分析により、本発明者らの0.75において最適化したXGBoostモデルと比較して、それぞれ0.52及び0.59の有意に低いAUCが生じた(p<0.05)。この最適化したXGBoostモデルはまた、臨床的に有意なPCa患者と非臨床的に有意なPCa患者との間で有意に異なる唯一の臨床的特徴であるPSAより性能が優れていた(p=0.0015、表1)。
【0052】
この最適化したモデルを臨床的に有意なPCaを予測するためのSOCと比較するために、本発明者らのμFCMベースのXGBoostモデル予測を伴って又は伴わずにSOCを使用してロジスティック回帰モデルを作成した。SOC及びμFCMモデルからの患者予測のウォーターフォールプロットは、0.07332のカットオフ確率を使用した場合、89%の感度及び49%の特異性をもたらした(
図6a及び表1)。μFCM予測にSOCを加えると、AUCは0.76にわずかに増加し、これはSOC単独からの0.68のAUCよりも有意に大きく(p<0.05)、μFCMベースのXGBoostモデルの臨床的価値が実証された(
図6b)。
【表2】
【0053】
DRE、直腸指診;SOC、標準治療;CI、95%信頼区間;ROC AUC、受信者操作特性曲線下面積;PPV、陽性予測値;NPV、陰性予測値;
【0054】
215人の患者コホートを更に分析すると、前立腺肥大(>40cm
3(40cc))を有する男性はPCaを有する確率が有意に低いことが観察され、このことは、正常な大きさの前立腺を有する男性と比較して、前立腺肥大を有する、より多くのパーセンテージの男性が不必要な生検を受けていることを意味する。現在の臨床診療に基づくと、男性は主に高いPSAレベル及び/又は異常DREのために前立腺生検を受ける。異常DREを有する患者の割合は、正常な前立腺を有する男性と前立腺肥大を有する男性との間で同様であったが(
図6c)、PSAレベルは前立腺肥大を有する男性において有意に高く(p<0.05、
図6d)、PSAの上昇が不必要な生検の数の増加の原因であることが示唆される。PSA密度(前立腺体積で除算したPSA)を使用してPSAレベルを正規化することは理想的でないことがある。なぜなら、PSA密度は前立腺肥大を有する男性において有意に低かったからである(
図6e)。前立腺肥大を有する男性に関して、臨床的に有意なPCaについてのSOC+μFCM確率スコアは、非臨床的に有意なPCa患者と臨床的に有意なPCa患者との間で有意に異なり(p<0.0005、
図6f)、表2における以前に定義された確率カットオフ閾値を使用すると、臨床的に有意なPCa及び非臨床的に有意なPCaを有する患者のそれぞれ100%及び49%が生検を推奨され、不必要な生検の約半分が排除される一方で、臨床的に有意なPCaを検出するための感度は依然として100%を維持する(
図6g)。
【0055】
A.患者特性及び試料取得
生検前の血漿試料は、Alberta Prostate Cancer Research Initiative(APCaRI)バイオレポジトリーから取得した。組み入れ基準は、(1)前立腺の懸念のためにアルバータ州の泌尿器科クリニックを紹介され、前立腺生検を受ける予定であり、且つ(2)前立腺異常の診断又は処置のために経尿道的前立腺手術を受けたことがある、以前に前立腺がんと診断されていない成人男性であった。全ての患者には書面によるインフォームドコンセントが提供され、この研究は、Prostate Cancer Centre(Calgary、Alberta、カナダ)及びNorthern Alberta Urology Centre(Edmonton、Alberta、カナダ)における科学倫理委員会によって承認された。患者は2014年6月から2015年9月の間に登録された。経直腸的超音波ガイド下の前立腺生検を、患者当たり12コアの中央値で実施し、各病院のSOPに従って評価した。患者ケアのために臨床現場に検査結果を提供しなかった。患者試料を取得し、それらを用いて試験を実施した検査技師は、患者特性について盲検化された。血液を採取し、施設のSOPに従って血漿を採取するために処理し、治療群から-80℃の冷凍庫までの時間は2時間以下であった。特に、血液試料は臨床グレードのバキュテナーで採取した。血漿調製のために、試料を2段階遠心分離プロセスにかけた。最初に、他の血液成分から血漿の分離をもたらすために、標準的な1300×gを10分間、続いて、血小板をペレット化するために2回目の1300×g×10分間の遠心分離を行う。血清チューブに採取した血液を、最初に15~30分間凝固させ、次いで単一の1300×g×10分間の遠心分離ステップを実施する。
【0056】
B.μFCMアッセイ
凍結血漿試料を解凍し、16,000×gで30分間遠心分離して大きな残屑及び血小板粒子を除去し、400μg/mLのJ591抗体及び1/50最終希釈の二次Qdot565コンジュゲートロバ抗マウスIgG抗体とインキュベートした。また、試料を、グレリンの最初の18アミノ酸を含有する0.025mMのグレリンCy5プローブとインキュベートした。プローブインキュベーションの30分後、試料を二重濾過(0.22μm)したリン酸緩衝生理食塩水中で100倍希釈し、3.01μL/分の流速を使用してApogee A50マイクロフローサイトメーターで分析した。試料は、2分間まで、又は5,000,000の事象が記録されるまでのいずれか早い方まで実施した。各患者からの血漿は3連で実施した。μFCMデータの従来の手動ゲーティング分析は、Histogramバージョン255.0.0.80ソフトウェア(Apogee Flow Systems)を使用して実施した。
【0057】
C.μFCMデータの処理
患者μFCM fcsファイルを、カスタムMATLAB(バージョンR2017a)スクリプトを使用して分析した。各fcsファイル内で、全てのチャネルについてのシグナル強度を対数変換し、同様の光学特性を有する粒子を、別段に記載されない限り、光学特性当たり32ビンを使用してビニングした。粒子濃度の3つの異なる二変量ヒストグラムを作成した:1)大角度光散乱(LALS)及びPSMA染色強度、2)LALS及びグレリンプローブ染色強度、並びに3)PSMA及びグレリンプローブ染色強度。各二変量ヒストグラムは1024のROI(32×32ビン)を含んだ。各ROIにおける粒子濃度を患者当たり3回の反復にわたって平均した。
【0058】
D.μFCMデータを用いた臨床的特徴の予測及び関連付け
μFCMデータを使用して、バイナリ臨床的特徴(例えば、糖尿病を有する又は有さない患者、正常又は異常な直腸指診)を予測し、カスタムMATLABスクリプトを使用して順序又は区間の臨床的特徴(例えば、それぞれ腫瘍ステージ又はPSA)と関連付けた。自動分析に必要なコードを最小限にするために、μFCMデータが各臨床的特徴についてどのように分析されるべきかを記述するエクセル命令ファイルを作成した。命令ファイル内では、各臨床的特徴は別個の列であり、各行は特定の情報又は命令を含んだ。特定の情報には、データベース内の臨床的特徴の位置、各臨床的特徴に関するデータの種類(バイナリ又は順序/区間)、及びその臨床的特徴に関する欠測データを表す値が含まれた。命令は主に、特徴をバイナリ化する場合の値の閾値化、グリーソンスコアからのPCaグレードグループの導出、及び出生日からの年齢の決定を含む、臨床的特徴がどのように変換されるべきかを含んだ。臨床的特徴についてデータが欠落している患者は、その臨床的特徴について分析から除外した。
【0059】
臨床的特徴データを、全ての患者についてのデータベースから取り出し、変換してから、各ROIについてのμFCM粒子濃度データを使用して臨床的特徴を予測し又は関連付けた。バイナリ臨床的特徴について、受信者操作特性(ROC)曲線下面積(AUC)値を各ROIについて決定し、AUCマップを、LALS-PSMA、LALS-グレリン、及びPSMA-グレリンを含む各二変量データセットについて作成した。順序/区間の臨床的特徴について、ピアソン相関係数を各ROIについて決定し、相関マップを各二変量データセットについて作成した。各AUCマップにおけるAUC値の最も高い10%を平均化し、これらの値を臨床的特徴にわたって比較した。
【0060】
E.μFCMデータのviSNE分析
MATLAB(25)上で実行されるCytバージョン2.0ソフトウェアを使用してviSNEプロットを作成した。各患者の3連のfcsファイルを1つのfcsファイルに連結させた。2つの新たなfcsファイルを作成した:1つはグレードグループ2及びより低いPCa(非臨床的に有意なPCa)を有する患者からの事象を使用し、もう1つはグレードグループ3及びより高いPCa(臨床的に有意なPCa)を有する患者からの事象を使用した。これらの2つのfcsファイルは合計約100,000の事象を有し、それらのグループ内の各患者からの事象の数は等しかった。Cytソフトウェアを用いて、これらの2つのfcsファイルの両方からの30,000の事象を無作為にサブサンプリングし、マージして、LALS、PSMA、及びグレリンチャネルを使用したbh-SNE変換を使用してviSNEで可視化し、k平均及び期待値最大化ガウス混合モデルアルゴリズムでクラスター化した60,000の事象を作成した。viSNEの結果をCytからエクスポートし、また、MatlabについてのDensityClust関数(Rodriguez A及びLaio A、Science 344(6191):1492~6頁、2014年)を使用した高速検索/密度ピークアルゴリズムを使用してクラスター化した。事象と対になったユークリッド距離は、pdist2関数を使用して決定した。paraSet関数を使用してデルタ及びローパラメーターを設定するために、近傍変数パーセントを2%に設定し、ガウスカーネルを使用した。1.5から5の間のデルタ値及び200から1900の間のロー値を使用してクラスター中心を選択した。全てのクラスタリングアルゴリズムについて、60,000の事象にわたって248のクラスターを作成した。臨床的に有意なPCaについてのクラスター純度を、各クラスター内の事象の総数で除算した臨床的に有意なPCa事象の数と定義した。少なくとも60個の粒子(全粒子の0.1%)を有するクラスターのみを分析した。
【0061】
F.臨床的に重要なPCaを予測するための機械学習モデルの最適化
MATLABの分類学習アプリを使用して、23の異なる機械学習アルゴリズムを試験し、粒子濃度のμFCMデータを使用して臨床的に有意なPCaを予測した。これらのアルゴリズムには、個別/バギング/ブースト決定木、線形/二次/三次/ガウスサポートベクターマシン、ロジスティック回帰、線形/二次/部分空間判別分析、及びk近傍法が含まれた。XGBoostもまた、R(バージョン3.3.3)における「xgboost」パッケージを使用して試験した。全ての機械学習アルゴリズムはデフォルト設定を使用し、5倍交差検証を少なくとも10回反復し、反復の間に患者を無作為化した。
【0062】
次いで最も高いAUCを有する機械学習アルゴリズムを、1)μFCMデータを処理するときに2、4、8、16、32、64、及び128ビンを比較すること、2)同じ機械学習アルゴリズムを使用するが、訓練データとして患者の異なるサブセットを無作為に選択して、3、6、12、25、50、及び100個のモデルのアンサンブルを作成し、モデル予測を平均化すること、3)R「caret」パッケージと共に再帰的特徴量削減を使用してμFCM ROIの最適なサブセットを選択すること、並びに4)グリッドサーチアルゴリズムパラメーター(XGBoost:nrounds=50、100、150、200、250、300、400;max_depth=3、4、5、6;イータ=0.01、0.1;ガンマ=0;colsample_bytree=1;min_child_weight=1;subsample=1)によって最適化した。最も高いAUCを提供したビニング/アンサンブル/特徴/パラメーターを一緒に使用して、臨床的に有意なPCaを予測するための最終モデルを作成した。このモデルを、Histogramソフトウェアを使用して手動ゲーティング分析と比較し、R.Citrusを使用するデフォルト設定を用いたCitrusが、階層的クラスタリング及びlasso正規化ロジスティック回帰及び最短収縮重心法(nearest shrunken centroid method)(Bruggner RVら、Proc Natl Acad Sci USA 111(26):E2770~7頁、2014年)を使用することによってフローサイトメトリーデータから臨床状態を予測する。
【0063】
PSA、年齢、DRE、PCaの家族歴、以前の陰性生検、及び人種(黒人=1、その他の人種=0)を含む、標準治療(SOC)の臨床的特徴を最終的なμFCMモデル確率予測に組み込むために、これらの特徴の全てを使用してロジスティック回帰モデルを作成した。このモデルを、μFCMデータを使用していない同様のロジスティック回帰モデルと比較した。
【0064】
G.統計解析
別段に記載されない限り、エラーバーを有するバー/ドットプロットは平均±標準誤差を表す。2つのグループを比較する場合、対応のない両側t検定を区間データのために使用し、フィッシャーの正確確率検定を分割表のために使用した。テューキーの多重比較検定を使用して3以上のグループを比較するためにone-way ANOVAを使用した。Rにおける「pROC」パッケージを使用してDeLong法によってROC曲線を比較した。可能な場合、ROCカットオフ値を、約90%の感度を使用して決定し、得られた特異性及び陽性/陰性予測値を、GraphPad Prismバージョン6.01ソフトウェアを使用して決定した。
【0065】
マイクロフローサイトメトリーを使用して超音波処理した試料からEVを分析することによる循環腫瘍細胞検出のためのアッセイの開発
図10に示すように、アッセイ最適化のために、培地中の100,000個のHeLa-GFP細胞をインキュベートし、様々な量のマイクロバブル及び超音波に曝露した。超音波処理の前後に培地を蛍光Evについて分析した。アッセイ感度を試験するために、パルミトイル化したGFPを発現する0、1、5、10、100、及び1,000個のPC3前立腺がん細胞を、1,000,000個のHT1080細胞(バックグラウンド)と混合し、マイクロバブルにより超音波処理した。超音波処理前/後にマイクロフローサイトメトリーによって培地を分析した。
【0066】
このアッセイは、従来のフローサイトメトリーより高い理論的SNRを有する単一のがん細胞を検出する。15Mpa以上の圧力の超音波は最大EVを生成する。超音波媒介EV放出は超音波サイクル及びマイクロバブル濃度と共に直線的に増加する。
【0067】
光散乱シグナル及び蛍光シグナルを標準化するためのアルゴリズムの開発
図11に示すように、異なる電圧(+10Vで300~400V)下で較正ビーズから光散乱シグナルを記録した。光散乱ヒストグラムを作成し、350Vで実施したビーズに適合するように直線的にシフトした。各ビーズのヒストグラムピークを、350Vで実施したビーズの同じピークと適合するようにシフトした(非線形シフト)。
【0068】
281人の患者からの血漿試料を前立腺特異的膜抗原で染色した。データを、固定した16×16ビニング(LALS対PSMA)を用いて、又は動的蛍光閾値化を使用してPSMAについて陽性若しくは陰性の粒子を識別し、更にPSMA陽性の程度に基づいてグループを分離するアルゴリズムを使用して処理した。XGBoostモデルを作成して侵襲性前立腺がん(グリーソン4+3及びそれ以上)を有する患者を予測した。モデルを、修正した蛍光(×0.125~256)と共に同じデータ上で使用し、AUCを計算した。
【0069】
非線形光散乱較正アルゴリズムは試料中の光散乱変動を補正するのに役立ち得る。動的蛍光閾値を用いてデータを処理することは、シフトしたデータに対するモデルの信頼性を保証するのに役立つ。これらの標準化アルゴリズムは、多くの診療所において使用される場合、経時的に臨床アッセイ予測を改善する。