(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023087100
(43)【公開日】2023-06-22
(54)【発明の名称】測定分析物を使用して疾病診断を向上させる為のシステム及び方法
(51)【国際特許分類】
G16H 50/00 20180101AFI20230615BHJP
【FI】
G16H50/00
【審査請求】有
【請求項の数】15
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023076599
(22)【出願日】2023-05-08
(62)【分割の表示】P 2020507059の分割
【原出願日】2018-08-09
(31)【優先権主張番号】62/542,865
(32)【優先日】2017-08-09
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】518258216
【氏名又は名称】オートレイシーズ,インク.
【氏名又は名称原語表記】OTRACES,INC.
(74)【代理人】
【識別番号】100107364
【弁理士】
【氏名又は名称】斉藤 達也
(72)【発明者】
【氏名】クラシック,ガリナ
(72)【発明者】
【氏名】リンゲンフィルター,ケイス
(57)【要約】
【課題】 前立腺がん、乳がん、肺がん、卵巣がんなどの疾病とそのステージとを診断する為のシステム及び方法を提供する。
【解決手段】 或る実施形態において、開示されるシステム及び方法は、患者サンプルを収集し、バイオマーカーの濃度及び近接スコアを計算し、これらの計算を使用してバイオマーカー濃度及び近接スコアを疾病診断及び疾病状態(例:がんステージ)と相関させるのに使用される訓練事例集合モデルを作成する。或る実施形態において、使用される相関技術は、単純回帰、ROC曲線面積最大化、トポロジー安定化、又は空間的近接性相関性分析を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
疾病を診断する為のコンピュータ利用方法であって、
(a)第1患者サンプルからの第1バイオマーカーの一つ以上の濃度値による第1集合を受理するステップであって、前記第1患者サンプルが非疾病診断から成るステップと、
(b)第2患者サンプルからの前記第1バイオマーカーの一つ以上の濃度値による第2集合を受理するステップであって、前記第2患者サンプルが疾病診断から成るステップと、
(c)前記第1濃度値集合からの第1近接スコア集合と前記第2濃度値集合からの第2近接スコア集合とを計算するステップと、
(d)前記第1及び第2濃度値集合と前記第1及び第2近接スコア値集合とから前記第1マーカーと疾病診断との相関性を計算するステップであって、前記相関性が、単純回帰、ROC曲線面積最大化、トポロジー安定化、又は空間的近接性分析のうち一つであるステップと、
を包含するコンピュータ利用方法。
【請求項2】
ステップ(a)~(d)が5個までのバイオマーカーについて反復される、請求項1に記載のコンピュータ利用方法。
【請求項3】
前記関連性が、前記単純回帰と前記ROC曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、請求項1に記載のコンピュータ利用方法。
【請求項4】
前記第1及び第2患者サンプルが、血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、請求項1に記載のコンピュータ利用方法。
【請求項5】
診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項1に記載のコンピュータ利用方法。
【請求項6】
診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、請求項5に記載のコンピュータ利用方法。
【請求項7】
前記第1及び第2患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、請求項6に記載のコンピュータ利用方法。
【請求項8】
前記二値グループの各々がスコアリングされる、請求項7に記載のコンピュータ利用方法。
【請求項9】
前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、請求項1に記載のコンピュータ利用方法。
【請求項10】
前記第1バイオマーカーがVEGFである、請求項1に記載のコンピュータ利用方法。
【請求項11】
(a)第1患者サンプルからの第1バイオマーカーの一つ以上の濃度値による第1集合を受理することであって、前記第1患者サンプルが非疾病診断から成ることと、
(b)第2患者サンプルからの前記第1バイオマーカーの一つ以上の濃度値による第2集合を受理することであって、前記第2患者サンプルが疾病診断から成ることと、
(c)前記第1濃度値集合からの第1近接スコア集合と前記第2濃度値集合からの第2近接スコア集合とを計算することと、
(d)前記第1及び第2濃度値集合と前記第1及び第2近接スコア値集合とから前記第1バイオマーカーと疾病診断との相関性を計算することであって、前記相関性が、単純回帰、ROC曲線面積最大化、トポロジー安定化、空間的近接性分析のうち一つであることと、
を包含するプロセスをコンピュータに実行させるプログラムを記憶する非一時的コンピュータ可読媒体。
【請求項12】
ステップ(a)~(d)が5個までのバイオマーカーについて反復される、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項13】
前記相関性が、前記単純回帰と前記ROC曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項14】
前記第1及び第2患者サンプルが血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項15】
診断される前記疾病が前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項16】
診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、請求項15に記載の非一時的コンピュータ可読媒体。
【請求項17】
前記第1及び第2患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、請求項16に記載の非一時的コンピュータ可読媒体。
【請求項18】
前記二値グループの各々がスコアリングされる、請求項7に記載の非一時的コンピュータ可読媒体。
【請求項19】
前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項20】
前記第1バイオマーカーがVEGFである、請求項11に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2017年8月9日出願の米国仮出願番号第62/542,865号の優先権を主張し、その全体が参照により本願に援用される。
【0002】
関連特許出願である2014年3月13日出願の国際出願第2014/000041号(参照により全体が本願に援用)には、直接的な測定分析物の濃度ではなく、年齢ドリフトと、疾病状態が非疾病から疾病へ移行する際に生理学的パラメータ(例:年齢、閉経状態等)と共に濃度値がどのようにドリフト又はシフトするかの非線形性とを除去する為に、濃度から計算されるが或る年齢(又は他の生理学的パラメータ)について正規化も行われる「近接スコア」と呼ばれる計算値である関連性分析の為の独立変数を使用して疾病予測を向上させる為の方法が記載されている。
【0003】
本発明は、疾病診断の精度を向上させる為の方法と、測定分析物と二値結果(例:非疾病又は疾病)及び高次結果(例:幾つかの疾病段階のうち一つ)との相関性を含む関連の診断検査とに関する。
【背景技術】
【0004】
三つ以上の独立変数が使用されて(所与の疾病の有無のような)二値結果を相関させる相関方法は、空間的近接性相関方法(クラスタ又は近傍検索方法とも呼ばれる)と回帰方法とウェーブレット方法とを一般的に使用する。疾病予測の場合には、血液又は血清の共通成分が測定され、様々な疾病状態予測の為の独立変数としてこれらの濃度を使用して相関性が求められる。結果が「疾病」と「非疾病」のいずれかである所与の疾病状態の場合には、ロジスティック回帰方法が一般的に使用される。他の技術は、例えば遺伝的アルゴリズムを含む。これらの方法の予測力は、その方法の為に選択される構成分析物に大きく左右される。予測力を有するように思われる多くの分析物及びパラメータが実際には診断及び分析力を向上させないことを熟練者は認識している。
【0005】
回帰方法は、独立変数のトレンドを使用して結果と相関させる。線形方法は線形トレンドに基づくのに対して、ロジスティック回帰は対数トレンドに基づく。生物学的疾病予測では、最も一般的に、結果を判断するのにロジスティック回帰が使用される。
【0006】
グループ空間的近接性方法では、同様の結果のグルーピングの為の変数相関性トポロジーを調査する。空間的近接性方法は、トレンドが連続的ではないがトポロジー局所的反転がトレンドに見られるという利点を有する。だがこの方法は非線形度が高く、生物学的使用では予測性の高いわずかな測定エラーでも非常に局所的な変数結果を生じやすい。加えて、上記の両方法は、小規模で適用される空間的近接性方法と組み合わされると、統合による全回帰方法となり得る。
【0007】
しかしながら、論理的には相関性を持つように思われる幾つかの独立変数は、実際には予測によるトレンドを示さない。故に必要とされるのは、これまでは疾病状態の診断に寄与する有用な情報ではなかった患者固有及び母集団固有の変数を利用することにより診断精度を向上させるアプローチである。
【0008】
単独又は組み合わせにより臨床使用に充分な再現性と予測力で疾病状態を予測できるバイオマーカーを発見する為に多くの研究が行われてきた。この研究は限定的であるか成功していない。高含量タンパク質(HAPs)は、この予測を行うことのできる単一のタンパク質を発見する為に、重点的に研究されている。多数の例が発見されているが、マーカーにより疾病について患者をスクリーニングするのに充分に低いレベルの誤陰性レベルを有するものはない。
【0009】
その結果、このような単一のバイオマーカーは前立腺ガンのPSA(前立腺特異抗原)を例外として治療モニタリングのみに使用される。この検査は、生体組織検査を示す濃度が偽陰性を低下させるのに適切な程度の傾斜を持ち、その結果、非常に高い偽陽性レベルとすることを必要とする。生体組織検査の必要性を指示された男性の80%もが実際には前立腺がんについては陰性である。がんの亜型についての幾つかの事例ではDNAマーカーも非常に有効であることが判明しているが、上記のHAPsと同じ理由からスクリーニングには適していない。
【0010】
多数のタンパク質を使用して、プロテオミクスアプローチも研究されている。この研究は、やはりHAPs、又は高レベルのエフェクタータンパク質を中心とする。この研究では、免疫測定法、チップ、及びマス分光測定法のような複合的なタンパク質測定方法が優位にある。非常に初期の研究では、卵巣がんにおいて幾らかの成功例が見られる。しかしながら、これらの方法すべてに関わる問題は、選択されるタンパク質の多くが健康から疾病への進行との強い相関性を有していない(そして例えばマス分光法の場合に典型的であるように、多くが疾病状態との既知の生物学的関係を有していない)。更に、マス分光法は、タンパク質レベルについて分光光度計により全血清サンプルが照会されるという事実により、マス分光法では深刻なオーバーサンプリング問題が生じ、故に相関性アルゴリズムの訓練が困難である。マス分光法の事例では、全血清サンプルは200を超えるタンパク質と10,000のマス分光法ピークを有し得る。
【0011】
診断領域でやはり必要とされているのは、HAPSよりも診断目的には有用である低含量タンパク質を利用する技術と共に、低含量バイオマーカーの分析を行う分析技術である。
【0012】
がんを検出してそのがんが深刻であるか休止状態であるかを検出する単純で正確な血清ベース血液検査の為の診断薬が長年研究されている。例えば、現行の検査である前立腺がんの為の前立腺特異抗原(PSA)では非常に高い偽陽性率が見られ、正検出偽陰性率は10人の男性のうち1人と高い。この検査は約57%の予測力を有する。更に、低悪性度の前立腺がんと診断された男性が、何年間も、又は残りの人生を通して処置を必要としないことがある。この診断は今日、PCa生体組織検査によってのみ正確に得られる。現行のPSA検査では、PSAレベルが約4.0ng/mlのすべて(90%、10人中1人が該当せず)を生体組織検査に送り、約20%のみがグリソンスコアにも関わらず何らかのPCaを有している。その他に、低悪性度PCaの男性が残りの人生で高悪性度に転換するリスクがあり、これを正確に診断する唯一の確実な手法はより多くの生体組織検査を行うことである。モニタリングの為の追加生体組織検査は、コストの為医学界では受け入れ難く、患者にとっては痛みと副作用の為受け入れ難い。故に低悪性度PCaの男性の進行中のモニタリングは、デジタル直腸内診(DRE)と時にはCTスキャンを伴う定期的なPSA検査によって実施される。多くの場合、医学的に必要でない時には前立腺の除去という予防処置が行われる。この患者から、PCaではない男性を高悪性度と区別して、後の人生で転換が見られる低悪性度PCaの男性を検出できる新たな血清ベース検査が教示される。加えて、肺がん又は乳がんのような早期固形腫瘍がん又はがんステージを区別できる血液ベース検査が教示される。
【0013】
現行のPSAスクリーニング検査は1980年代中頃に承認され、現在は特許期限が切れている。OPKOにより「自家調製検査」として提供されている新しい所謂4Kスコア検査は規制当局の承認を得ていない。これは、高悪性度PCaの男性を検出してこの症状を低悪性度PCaから分離することを目的としている。概して、高悪性度PCaは7(4+3)又はそれ以上(8,9,10)のグリソンスコア(生体組織検査で取得)であると考えられ、一方で低悪性度は7(3+4)又はそれ以下であると考えられる。すべての悪性度のPCaである男性を検出する為のPSA検査は約57%の予測力であるか、90%の感度については、偽陽性率は約80%(4件の陽性のうち1件が実際には陰性)である。4Kスコア検査は約64%の予測力を有する。故に、10分の1の偽陰性率については、偽陽性率は約50%であり、つまり10人のうち約5人が実際に陰性である。これが現代医学におけるPCa診断検査の現状である。
【発明の概要】
【発明が解決しようとする課題】
【0014】
現在、肺がん及び乳がんのような疾病を簡易血液検査により検出する為の、規制当局の承認を受けた方法はない。更に、これらの疾病は生体組織検査による重症度のみについて判定され得る。活性サイトカインの代用として血清を使用する腫瘍マイクロ環境でこれらのタンパク質を使用して腫瘍ステージを判定する為の追加検査も、我々は提案する。
【課題を解決するための手段】
【0015】
当該技術でのこれら及び他の欠点を解消する為、活性サイトカインを腫瘍マイクロ環境で例として使用して血清がこれらのタンパク質の代用として機能する新たな検査が説明される。
【図面の簡単な説明】
【0016】
添付図と関連して検討すると以下の詳細な説明の参照により本発明及びその付随の利点の多くが良く理解できるので、より完全にこれを認識することが容易になるだろう。
【
図1】前立腺がんについてのグリソンスコアによるバイオマーカー濃度変動を表示する図である。
【
図2】肺がんについてのグリソンスコアによるバイオマーカー濃度変動を表示する図である。
【
図3】乳がんのステージに対応するバイオマーカー濃度の平均的上方制御を表示する図である。
【
図4】進行性前立腺がんと非がんについてのVEGF受信者動作特性(“ROC”)曲線を表示する図である。
【
図5】進行性前立腺がんと非がんについてのTNFα ROC曲線を表示する図である。
【
図6】進行性前立腺がんと非がんについてのPSA ROC曲線を表示する図である。
【
図7】進行性前立腺がんと非がんについてのIL6 ROC曲線を表示する図である。
【
図8】末期肺がんと初期肺がんについてのIL10 ROC曲線を表示する図である。
【
図9】末期肺がんと初期肺がんについてのIL6 ROC曲線を表示する図である。
【
図10】末期肺がんと初期肺がんについてのVEGF ROC曲線を表示する図である。
【
図11】開示の診断方法の実施形態による、トポロジー不安定性検査に不合格であって不一致アルゴリズムで修正された二つのサンプルによるブラインド検査結果を示す図である。
【
図12】開示の診断方法の実施形態による、乳がんの臨床研究結果を示す図であり、この場合には10個のバイマーカー平面を使用する訓練事例集合モデルIについての訓練事例集合がんスコアが示されている。
【
図13】開示の診断方法の実施形態による、乳がんの臨床研究結果を示す図であり、この場合には105個のバイマーカー平面を使用する訓練事例集合モデルIIについての訓練事例集合がんスコアが示されている。
【
図14】開示の診断方法の実施形態による臨床研究でのブラインドサンプル実施についての実際の診断結果を示す図である。
【
図15】10分の1のバイマーカー平面を示す図であり、このような平面は、開示の診断方法の実施形態により使用されるバイオマーカーのうち二つの近接性スコアを示す。
【
図16】開示の診断方法の実施形態による訓練事例集合データ点を含むバイマーカー平面を示す図である。
【
図17】開示の診断方法の実施形態による、訓練事例集合データ点を含まないバイマーカー平面を示す図である。
【
図18】開示の診断方法の実施形態による、免疫システム反応についての影響力が低下した陰影エリアを含むバイマーカー平面を示す図である。
【
図19】開示の診断方法の実施形態による、トポロジー安定性問題についての影響力が低下した陰影エリアを含むバイマーカー平面を示す図である。
【
図20】開示の診断方法の実施形態による、周知の分析物測定不確実性についての影響力が低下した陰影エリアを含むバイマーカー平面を示す図である。
【
図21】開示の診断方法の実施形態による、トポロジー不安定性検査に不合格であって不一致アルゴリズムで修正された二つのサンプルを含むブラインド検査結果を示す図である。
【
図22】例示的実施形態による、本発明のソフトウェアが辿る一般的な論理経路を示す流れ図である。
【
図23】疾病状態又は非疾病状態を有するリスクを判定するブラインドサンプルについての診断スコアを作成する訓練事例集合モデル(又は診断モデル)を構築するプロセスを表す流れ図である。
【
図24】サイトカイン、インターロイキン6(IL6)の場合に典型的な母集団分布を示す。
【
図25】バイオマーカー濃度から近接スコア(疑似濃度の一タイプ)への変換を示す図である。
【
図26】例示的実施形態による、本発明のソフトウェアの実行に使用されるハードウェアの代表図を示す。
【発明を実施するための形態】
【0017】
上記に限定されることなく、好適な実施形態において、本発明は、多変数(多変量)相関方法を使用して疾病状態を予測する為の方法の予測力及び診断精度を向上させることに関する。これらの方法は、プロテオミクスと、メタボロミクスと、体液及び組織のサンプルに見られる様々なバイオマーカーのレベルの判断を伴う他の技術を含む。
【0018】
発明者により考案され本出願に記される様々な実施形態は、測定されたバイオマーカー分析物の相関性スコアへの影響を調節する方法を特に使用するメタ変数の使用を含む。このようなメタ変数は、免疫システム反応についての専門知識と起こり得る測定エラーについての知識とに基づいて特定され得る。これらの方法は、訓練事例集合モデルの構築と診断対象のブラインドサンプルの何れかに適用され得る。
【0019】
一態様において、本発明は、(a)被験者からのブラインドサンプルにおける少なくとも三つの所定の分析物の濃度を判断するステップと、(b)被験者と関連する1つ以上のメタ変数を選択するステップであって、このメタ変数が、母集団の構成員が疾病を有するか有さないかが判明している被験者と関連の母集団において構成員ごとに変化するステップと、(c)一つ以上の母集団分布特性と一つ以上のメタ変数に応じて分析物の濃度を変換して各分析物を表す近接スコアを計算するステップと、(d)疾病を有するか有さないかが判明している母集団の構成員について判断された近接スコアの訓練事例集合モデルと近接スコアを比較するステップと、(e)被験者が疾病を有していることを比較が示しているかどうかを判断するステップとを包含する、疾病を診断する為の方法に関する。所定の分析物の濃度(又はレベル)を判断するステップ(a)が、方法の残りのステップとは別の時及び場所で実施されることが考えられる。同様に、方法の他のステップの全体又は一部が別々の時及び場所で実施されてもよい。したがって、本発明者らはステップ(b)~(f)のみを含む方法を自身の発明と考えている。
【0020】
図面に図示されている本発明の好適な実施形態を説明する際に、明瞭性の為特定の用語に頼ることになる。しかしながら、本発明は、こうして選択された特定の語に限定されることを意図しておらず、各々の特定の語が、同様に機能して同様の目的を達成するすべての技術的同等物を含むことが理解されるはずである。本発明の幾つかの好適な実施形態は例示目的で説明され、図には具体的に示されていない他の形で発明が具体化され得ることが理解されるはずである。
【0021】
本出願を目的として、発明の好適な実施形態をより良く説明するのに特定の用語が使用され、これは以下のように定義される。
【0022】
「分析感度」は、ゼロ校正物質を上回る三つの標準偏差として定義される。このレベルを下回る濃度について診断表示は正確とは考えられない。故に、このレベルを下回る臨床関連濃度は正確と考えられず、臨床検査室では診断目的で使用されない。
【0023】
「個人のベースライン分析物測定」は、ある時間にわたって多数回、一人の個人について測定された個々の患者の非疾病状態から疾病状態への移行についての当該のバイオマーカーの測定集合である。非疾病状態についてのベースライン分析物測定は個々の患者が疾病を有していない時に測定され、代わって疾病状態のベースライン分析物測定は個々の患者が疾病を有している時に判断される。これらのベースライン測定は個々の患者に独自であると考えられ、この個々の患者について非疾病から疾病への移行を診断するのに役立ち得る。疾病状態についてのベースライン分析物測定はこの個人における二回目又はより重度の疾病発生についてその疾病を診断するのに有用であり得る。
【0024】
「生物学的サンプル」は、被験者から採取される血液又は血漿のような組織又は体液を意味し、診断において情報価値のある分析物(マーカー又はバイオマーカーとも呼ばれる)の濃度又はレベルがこれから判断され得る。
【0025】
「バイオマーカー」又は「マーカー」は、被験者の生物学的サンプルの生物学的構成要素を意味し、典型的なのは血清タンパク質のような体液で測定されるタンパク質又はメタボロミクス分析物である。例は、サイトカイン、腫瘍マーカー、その他を含む。本発明では、身長、眼の色、地理的因子、環境的因子等を限定的ではなく含む、「バイオマーカー」及び「マーカー」のような他の指示手段も考えられる。概して、このような指示手段は、母集団の中で変化しても測定可能性、判断可能性、又は観察可能性を維持する何らかの測定値又は属性を含む。
【0026】
「ブラインドサンプル」は、所与の疾病についての既知の診断が下されておらず、疾病の有無の予測が望まれる被験者から採取される生物学的サンプルである。
【0027】
「疾病関連機能」は、持続又は悪化する疾病の作用と疾病の進行を止める身体作用のいずれかであるバイオマーカーの特性である。がんの場合には、血液循環増加の維持又は促進を要求することにより腫瘍が身体に作用し、免疫システムは腫瘍を消滅させる炎症誘発作用を高める。これらのバイオマーカーは、疾病関連機能を有していない腫瘍マーカーとは対照的であって、剥離して循環系に入るので測定が可能である。機能的バイオマーカーの例は、免疫システムの作用を引き起こすインターロイキン6、又は腫瘍が分泌して局所的血管増殖を起こすVEGFであろう。一方で、非機能的なものの例はCA125であろう。これは、眼と女性生殖器系に所在する構造タンパク質であり、身体が腫瘍を消滅させる作用も、腫瘍が腫瘍増殖を助ける作用も有していない。
【0028】
「検出限界」(LOD)は、「ゼロ」濃度校正物質の値を上回る濃度値の二つの標準偏差として定義される。通常、ゼロ校正物質は、測定の標準偏差の正確な表示を得る為20以上の複製物で実施される。このレベルを下回る濃度判断は、ゼロ、或いは例えばウイルス又は細菌の検出については存在しないと考えられる。本発明を目的として、サンプルが二つずつの複製物で実施される時には1.5の標準偏差が使用されるが、20個の複製物の使用が好適である。単一の濃度数を必要とする診断表示は概して、このレベルより下にならない。検出限界レベルの測定は統計的に信頼レベルが95%である。上記の方法を使用する疾病状態の予測は、単一の濃度に基づくものではなく、濃度ベースのLODを下回る測定レベルでの測定が可能であることが分かっている。
【0029】
「低含量タンパク質」は、非常に低いレベルで血清中にあるタンパク質である。このレベルの定義は文献に明白に記されていないが、本明細書で使用される際に、このレベルは、血清又は血漿とサンプルが採取される他の体液において約1ピコグラム/ミリリットル未満であろう。
【0030】
「メタ変数」は、分析物及びバイオマーカーの濃度又はレベルを除いて、所与の被験者に特有であるが必ずしもこの被験者に固有又は独自ではない情報を意味する。メタ変数の例は、被験者の年齢と、閉経状態(閉経前、閉経前後、閉経後)と、思春期、体重、患者の居住地の地理的位置又は地域、生物学的サンプルの地理的ソース、体脂肪率、年齢、人種又は人種ミックス、或いは時代のような他の条件及び特性を限定的にではなく含む。
【0031】
「母集団分布」は、所与の被験者母集団の生物学的サンプルでの特定の分析物の濃度範囲を意味する。特殊な「母集団」は、地域、特定の人種、特定の性別から選択される人々を限定的にではなく意味する。そして本出願で説明される使用の為に選択される母集団分布特性では更に、所与の疾病状態を有している(疾病部分母集団)、又は疾病状態を有していない(非疾病部分母集団)と診断された母集団の構成員であるこの大きな定義による母集団の中の二つの別々の部分母集団の使用が考えられる。母集団は、疾病予測が望まれるいかなる集団でもあり得る。また、適切な母集団は、他の疾病進行ステージよりも特定の臨床ステージまで進んだ疾病を有する被験者を含むと考えられる。
【0032】
「母集団分布特性」は、特定の分析物の濃度の平均値又はその中央濃度値又は濃度のダイナミックレンジのようなバイオマーカーの母集団分布において、或いは、非疾病から疾病状態への生物学的移行又は進行を患者が経験する際に疾病の発症及び進行により様々なバイオマーカー及び当該のメタ変数の上方及び下方制御の程度が影響を受ける際に個別ピークとして認識可能なグループに母集団分布がどのように分けられるかについて、判断可能である。
【0033】
「予測力」は、診断分析物又は検査の感度及び特異性の平均、或いは誤予測(偽陰性と偽陽性の両方)の総数をサンプルの総数で割って1から引いたものを意味する。
【0034】
「近接スコア」は、測定されたバイオマーカーの濃度についての代替又は置換値を意味し、実際には診断相関性分析で使用され得る新たな独立変数である。近接スコアは、測定されたバイオマーカー分析物の濃度と関係してこれから計算され、このような分析物は所与の疾病状態についての予測力を有する。国際公開第2017/127822号と国際公開第2014/158287号に開示されているように、近接スコアは、メタ変数で調節される当該の母集団分布特性を使用して計算されて、診断が望まれる所与の患者についての予測バイオマーカーの実際測定濃度を変化させる。「近接スコア」及び「疑似濃度」は同じ定義を有し、互換的に使用され得る。
【0035】
「特異性」は検査の真偽陽性率である。数学的には、検査の偽陽性測定数を測定される真陰性サンプルの総数で割って1から引いたものである。
【0036】
「不一致訓練事例集合モデル」(又は「二次アルゴリズム」)は、一次相関性訓練事例集合モデルとこの二次アルゴリズムの両方でバイマーカー平面の格子の個々の点が不安定にならないように異なる現象学的データ整理方法を使用する二次訓練事例集合モデルである。
【0037】
「空間的近接性相関方法」(或いは近似検索又はクラスタ分析)は、独立変数が直交軸線上に示される独立変数と二値結果との間の相関関係を判断する為の方法である。ブラインドサンプルの予測は、結果が判明しているいわゆる「訓練事例集合」データ点の数(3,4,5又はそれ以上)への近接性に基づく。二値結果スコアリングは、多次元のブラインド点から反対の結果の訓練事例集合点まで計算された総距離に基づく。最短距離から個々のブラインドデータ点のスコアリングが判断される。個々のバイマーカー平面スコアが他の平面のスコアと組み合わされて合計が求められる多次元格子を切り抜いたバイマーカー平面において、この同じ分析が行われ得る。この切り抜きつまり空間内での二次元直交射影の使用は、計算時間を短縮できる。
【0038】
「訓練事例集合」は、既知のバイオマーカー濃度と既知のメタ変数値と既知の診断による患者(統計的有意性を得る為一般的には200人以上)のグループである。個々のブラインドサンプルをスコアリングするのに使用される空間的近接性分析からのスコア格子点と共に「バイマーカー」平面の軸値「近接スコア」を判断するのに、訓練事例集合が使用される。
【0039】
「訓練事例集合モデル」は、被験者(又は患者)が疾病を有しているか疾病を有していないかの確率についての予測結果に関してブラインドサンプルの判定を可能にする訓練事例集合から構築されるアルゴリズム又はアルゴリズムグループである。そして「訓練事例集合モデル」は、臨床又は診断目的でブラインドサンプルについてのスコアを計算するのに使用される。この目的の為、疾病又は非疾病のパーセント可能性を指す任意の範囲、又は患者に診断を下す医療提供者により優先される他の幾つかの所定インジケータ表示値にわたってスコアが付与される。
【0040】
「受信者動作特性(ROC)曲線」は、偽陽性及び偽陰性の率と検出信号の強度との間にトレードオフが生じる際に決定を行うのに使用される信号送信方法の性能を表すグラフィック方法である。このグラフィック表示では、図の縦座標は検査方法の感度を含み、横座標は偽陽性率を示す。疾病トリップ点への上向動作を含むバイオマーカー(又は信号)については、図の原点(0,0)に始まり図の右上(1.0,1.0)までの45°ヌル線の上に曲線がある。曲線の下の面積は、予測を立てる時にバイオマーカーがどれほど有効であるかを指している。
【0041】
「ROC曲線『曲線下面積』(AUC)」は、バイオマーカー特性曲線及び横座標の下方の面積である。全く役に立たないバイオマーカーについては、AUCは0.5であり、その面積は上記の45°ヌル線の下方にある。完全な検査ではAUCは1.0であり、原点から縦座標上で100%感度点まで延び、それから右上の1.0,1.0点でROC曲線と交わる。
【0042】
「腫瘍マイクロ環境」は、腫瘍間質液(TIF)に浸漬され、周囲の血管、免疫細胞、線維芽細胞、骨髄由来の炎症細胞、リンパ球、シグナリング分子、及び細胞外マトリクスを含めて、腫瘍が存在する細胞環境である。
【0043】
「腫瘍マーカー」は、TME又は明白な機能を有していない血液供給物から剥離したタンパク質マーカーであり、腫瘍分泌による腫瘍の増殖と免疫システムによる腫瘍の抑制のいずれかである。
【0044】
近年、がん免疫療法研究では、新たな治療法の開発及び発展の為の理想的なR&Dプラットフォームとなり診断内容の潜在的に膨大な蓄積を表す腫瘍マイクロ環境(TME)に、ますます関心が集まっている。腫瘍間質液(TIF)に浸漬されるTMEは、周囲の血管、免疫細胞、線維芽細胞、骨髄由来の炎症細胞、リンパ球、シグナリング分子、細胞外マトリクスを含めて、腫瘍が存在する細胞環境である。
【0045】
TIFは、腫瘍(とTME)を血液供給源につなぐ輸送液でもあり、腫瘍を抑圧しようとするのに免疫システムが使用するか又は腫瘍がその増殖を促進する為に出す活性タンパク質の為の「戦場メッセンジャー」であるので、重要である。常に互いとの戦争状態にあるこれらの競合タンパク質又はサイトカインは、低レベルシグナリングタンパク質の幾つかの機能カテゴリ、つまり炎症誘発性及び抗炎症性、抗腫瘍発生性(又は細胞アポトーシス)、血管形成、そして血管新生に含まれる。
【0046】
豊富な診断情報の潜在的な情報源と認識されているが、この流体のサンプリングは非常に困難であって、これを行う為には腫瘍の位置が判明していて、腫瘍がすでに存在しているかどうかが判明していることを意味するので、がんスクリーニングモダリティとしてのTIF分析の開発は前進していない。更に難題なのは、TME/TIFの存在と、この知識なしで悪性腫瘍を検出することである。これは、疾病の有無と相関性があると推定され得るプロテオミクスとして知られる多数のタンパク質の分析と結合された血清のような臨床診断の為のより入手可能な液体を必要とする。活性TME(故に腫瘍)の存在を検出する直接的な経路よりも患者の身体症状が入り混じったものであるので、この点についての幾つかの問題が血清に現れる。
【0047】
本開示では、TME及びTIFにおいて活性であるタンパク質についての正確な代用物として血清に存在する特定のサイトカインを分析する為の方法を記す。この方法は、プロテオミクスノイズ抑圧及び多次元(又は空間的)相関性と呼ばれる二つの専用プロセスを含む幾つかのステップを必要とする。我々が説明する方法は、TIFに見られるタンパク質の作用についての正確な代用物を導出し、こうして生命体、故に腫瘍での活性TMEの存在を検出するのに有用である。本質的に、この方法は血清中のTMEの痕跡を隔離して、活性腫瘍が存在することを示す活性TMEの存在(又は不在)を指示する。その他に、この方法は、腫瘍の状態、進行作用の程度、ステージについての有益な情報と共に、免疫システムによる腫瘍抑圧の経過についての有益な情報をもたらすこれらのタンパク質の変調を測定する。
【0048】
当該のバイオマーカー
本開示の当該バイオマーカーは、炎症誘発性(インターロイキン6,IL6、その他)、抗炎症性(インターロイキン10,IL10、その他)、抗腫瘍性又は殺腫瘍性サイトカイン(腫瘍壊死因子アルファ、TNFα、その他)、血管形成(インターロイキン8,IL8、その他)と血管新生サイトカイン(血管内皮増殖因子,VEGF、その他)のような循環増殖因子である。これらは、腫瘍に対する免疫システムの反応又は身体に対する腫瘍の作用という直接関連する機能を備えるサイトカインである。血管新生因子VEGFは、増殖腫瘍の塊の中で循環系を増殖させる腫瘍の作用である。抗腫瘍発生因子のTNFαは腫瘍(アポトーシス)を消滅させる免疫システムの作用であり、炎症誘発因子のIL6は、免疫システム全体の作用のメディエータである。抗炎症性のIL10は、腫瘍により腫瘍間質液へ分泌されて免疫系を抑制する。そして最後に、IL8のような血管形成因子は、腫瘍により分泌されて周辺組織の血管新生を促進する。
【0049】
概して、がんは、IL‐6のような因子が上方制御される炎症誘発性の疾病である。しかしながら、本願に記載の三つの例において、末期の腫瘍は抗炎症性サイトカインを腫瘍間質液(故に血液)へ分泌する。この作用は、がんの末期、肺がん及び乳がんではステージ3又は4、前立腺がんでは高いグリソンスコア(グリソン8,9,10)で発生することが分かっている。この時点で、抗炎症作用は生命体の免疫システムの炎症誘発反応を下方制御する傾向がある。場合によるが、乳がんでは、末期に血管形成反応も抑制される。最後に、腫瘍のサイズが大きくなり、乳がん及び肺がんのステージ3又は4、前立腺がんではグリソンスコア8,9,10で予想されるように、腫瘍の血管新生作用が増加する。腫瘍マイクロ環境で発生するこれらの作用はすべて、生命体の血清をサンプリングし、参照される国際公報第2017/127822号及び第2014/158287号に記載の方法を適用することにより判別できる。
【0050】
特定のがん症例において、最近の治療研究対象は、処置モダリティの発展の為のいわゆる「腫瘍マイクロ環境」(TME)に高い割合で集中している。TME内で発見される腫瘍間質液(TIF)で作用するタンパク質の制御の抑制又は促進は、これらの処置の為の有益な開発ルートであると考えられる。良好なインジケータであることが判明しているTIF内のタンパク質は、概して、炎症誘発性又は抗炎症性、抗腫瘍発生性(又は細胞アポトーシス)、血管形成、血管新生という五つの機能的サイトカイングループからのものである。
【0051】
これらのタンパク質の活性の測定から、腫瘍活性及び治療効果に対する洞察が得られる。例えば、タンパク質活性を促進又は抑制する処置モダリティが、有効性を判断する為TIFでモニタリングされ得る。がんが存在することが判明している治療用途では適切であるが、診断目的でのTIFのサンプリングは追究されていない。TIFの(そしてTMEの)存在は定義上、患者が周知の部位に活性腫瘍を有していることを意味するので、診断ツールとしてのその使用は無意味である。その他に、血清又は尿のような他の体液に存在する時に診断の為これらのタンパク質にアクセスすることは、今日までプロテオミクスノイズ問題の為これらが使用不可能であった為、検討されていなかった。
【0052】
本願では、アクセス容易な代用流体―この場合には血清(尿のような他の流体が可能)―を使用してTIF内の活性タンパク質を使用するTME活性の為の正確な代用物を生成する為のシステム及び方法を説明している。血清は生命体全体の状態が混合されたたもの(「プロテオミクスノイズ」と呼ばれる)であって腫瘍に固有なものではないことに注意すべきである。我々が提案する方法論は、プロテオミクスノイズを除去して患者の症状の正確な判定を可能にする。
【0053】
概して、本願に開示されるシステム及び方法は、1)TME内の状態を示す活性TIFタンパク質を選択することと、2)血清代用物においてこれらのタンパク質を測定することと、3)プロテオミクスノイズを抑制してタンパク質内のがん関連活性を明確に特定することと、4)多次元マトリクスでこれらのタンパク質の作用を増幅する相関方法を実施することと、5)がんの有無と、存在する場合にその進行ステージを示す為タンパク質活性をスコアリングすることとを必要とする。これは、母集団全体を表して基準として作用する訓練事例集合を作成する為最初に行われ、この訓練事例集合と個々のサンプルが比較されてその状態―疾病状態又は非疾病状態―を判断する。
【0054】
バイオマーカー組み合わせの作用
これらのサイトカインバイオマーカーは高悪性度の前立腺がんでは非常に活性があり、「健康な」男性のレベルと比較すると大きく上方又は下方制御され、故に疾病状態についての非常に良好なインジケータである。肺がん及び乳がんで活性があることにも注意。
図1,2,3は腫瘍が進行する際のこれらの作用を示す。
図1及び2に示されている非小細胞性の肺がん及び前立腺がんでは、IL6が末期がん又は高グリソンスコア8,9,10を下方制御することを注意されたい。両方の症例で、低悪性度の肺がん又は低グリソンスコアの前立腺がんからの移行では、腫瘍により分泌されるインターロイキン10が増加する結果、IL6の下方制御が行われることにも注意されたい。腫瘍間質液、故に血液へのIL10の分泌は、患者の予後が良好でないことと関連していることにも注意。これは通常、末期肺がんが存在していることを意味する。こうして疾病状態の相関性分析におけるIL6とIL10の組み合わせは、炎症誘発性及び抗炎症性のサイトカインの組み合わせを使用することにより改良される。更に、腫瘍が末期になるか又はより進行するにつれて、血管新生サイトカインは概して上方制御され続けることに注意。
【0055】
これらのバイオマーカーのうち三つは、腫瘍バイオマーカーに共通していない独自のROC曲線特性を有する。これらの特性は、或る低レベルのバイオマーカー濃度について100%の感度でフラット部分を有する。またかなり広い曲線下面積(AUC)も有し、この疾病についての非常に良好なバイオマーカーであること、つまり高悪性度前立腺がん(PCa)と非PCaを示している。そのうち一つは、[0,0]からの縦座標を上行する直線状垂直区分を有し、この信号範囲のサンプルがPCaのゼロ偽陽性率を有するはずであることを示している。
【0056】
科学文献では、本明細書で言及される最適なバイオマーカーの幾つかについての公表は限定的である。そして高悪性度PCaと一般的な母集団つまりPCaでない患者との検出に関しては何も見られない。VEGFの場合には、バイオマーカーの上方制御を示す文献があるが、がんのステージ、とりわけグリソンスコアについては何も記されていない。文献のほとんどは、すでにPCaと診断された男性の処置についての予後因子としてのVEGFの使用に限定されている。TNFαも、腫瘍のステージ、とりわけグリソンスコアに関するバイオマーカー作用の相違に関係していない。インターロイキン6についての科学的調査でも同じ情報が得られる。事実、低悪性度PCaでは、バイオマーカーの若干の上方制御が文献に指摘されている。低悪性度PCaでは若干の下方制御が見られるので我々の測定はこれを裏付けるものではないが、高グリソンスコアのPCaでは非常に強い下方制御が見られ、このサイトカインは他と共に高悪性度PCaの存在を示す強力なインジケータである。文献の多くは、PCaの男性での予後因子とPCa細胞株からのタンパク質の生体外発現としてこれらのバイオマーカーを使用することと、処置目的での発現(特にVEGF)の抑制の為の方法を調べることとを必要とする。
【0057】
前立腺がんのROC曲線
VEGF
進行性のVEGF(グリソンスコア7(4+3),8,9,10)のROC曲線が
図4に示されている。感度が100%である上部でのROCの大きなフラット部分に注意すること。このレベルの感度又は約50pg/ml未満のVEGFの濃度レベルは高悪性度PCaではなく、何も検出されなかった。この疾病/非疾病についてのこのバイオマーカーのAUCは0.87である。加えて、50pg/mlレベルを下回る非偽陽性の独自形状により、約50pg/mlを下回る濃度レベルにはPCaが全く見られない為、高悪性度「PCa」と「非PCa」のバイオマーカーについての非常に良好な候補となる。
【0058】
TNFα
図5に示されているように、TNFαについてのコメントは、進行性(グリソンスコア7(4+3),8,9,10)のROC曲線の特性に関するものと同じである。この場合、AUCは0.85とやはり高く、トリップ点は約6.5pg/mlを下回る非偽陰性結果と同じである。TNFαは、約9.85pg/mlを上回るサンプルについてのゼロ偽陽性率(横座標)である曲線の部分も示している。この領域では偽陽性結果は生じない。
【0059】
PSA
図6に示されているようにPSAについてのコメントは、進行性(グリソンスコア7(4+3),8,9,10)についてのROC曲線の特徴と同じである。この場合、AUCは0.85とやはり高く、トリップ点は約2ng/mlを下回る非偽陰性結果と同じである。PCaのすべてのグリソンスコアに共通のPSA分析物についてのROC曲線が参照の為緑色で示されている(「全PCa」と図示)。
【0060】
IL6
対照的に、IL6は、進行性(グリソンスコア7(4+3),8,9,10)での強い下方制御を示し、
図7に示されているように、AUCは、一般的な母集団においてPCaの検出の為の現在のPSAの約2倍である(この下方制御を説明するには曲線が逆転されなければならない)。高悪性度PCaはおそらく免疫システムの抑制において有効であるという推論が成り立つだろうが、それはこの議論の論点ではない。事実は、このバイオマーカーが強い下方制御を示しているということである。限定的な文献では一般的なPCaでの若干の上方制御を指摘している。すべてのグリソンスコアのPCaについての我々の測定は、若干の下方制御を示している。それにもかかわらず、高いグリソンスコアでは、サイトカインが強い下方制御を示す。PCaの母集団全体は約80%が低悪性度であり、その為PCaのサンプリング時には、低悪性度がコホートの特性を支配するだろう。この下方制御は、腫瘍が進行性グリソンスコア7(4+3)かそれ以上まで進行した時に抗炎症性サイトカイン(IL10)の分泌により引き起こされる可能性がある。
【0061】
肺がんについてのROC曲線
IL10
図8は、低悪性度(ステージ1及び2)を末期のステージ3,4の非小細胞肺がんから分離する場合のインターロイキン10についてのROC曲線を示す。初期(1及び2)から末期(3及び4)への移行で上方制御されることに注意。これはインターロイキン6の下方制御に対応し、腫瘍マイクロ環境へ、続いて血流へIL10を分泌する腫瘍の抗炎症性作用により引き起こされる。
【0062】
IL6
やはり初期(1及び2)と末期(3及び4)の非小細胞肺がんの場合についてのIL6のROC曲線が、
図9に示されている。
図9から実証されるように、IL6のこの作用は腫瘍の抗炎症作用により抑制されている。
【0063】
VEGF
VEGFのROC曲線が
図10に示されており、腫瘍が増殖して末期まで進行する際に他のがんで見られる血管新生因子の上方制御が実証されている。
【0064】
進行性又は末期と非進行性又は初期のがんについての検査
高悪性度グリソンスコア7(4+3),8,9,10の高悪性度PCaへの移行について、低悪性度グリソンスコア5,6,7(3+4)の前立腺がんの男性をモニタリングする為の非常に簡単なプロテオミクスアルゴリズムを開発する為に、これらのバイオマーカーが組み合わされ得る。また、これらのバイオマーカーは初期がんのステージ1又は2をステージ3又は4から区別することができる。IL6及びIL10と反対の作用との組み合わせは(ロジスティック回帰のような単純相関方法により)80%の予測力を生じる。プロテオミクスノイズ抑制と空間的近接性相関方法との追加により90%の予測力を生じる。バイオマーカーパネルにVEGFの作用を追加すると、95%以上まで予測力を向上させる。
【0065】
進行性前立腺がん男性と非がん男性についての検査
実際、VEGFそのものにより、76%の予測力と100%の感度と76%の特異性(24%の偽陽性率)の検査が得られる。この簡易モデルは単に、ROC曲線から除かれる濃度範囲の非PCaを除外して、ROC曲線に含まれるこれらのゾーンのPCaを再び含有する。そして、単純なトリップ点カウントと、除外又は含有基準内ではない各バイオマーカーの陽性及び陰性のスコアリングのカウントとを使用する。事前に除外又は含有されないものについてカウントは4のうちの3を超えなければならない。この簡易モデルから、100の高グリソンスコア(7(4+3)以上と定義)PCaと100の非PCaサンプルによる代表サンプル集合が100%得られる。VEGF、IL6、TNFα、PSAの組み合わせにより、90%の予測力が生じる。加えてこの検査は、PSAが上昇したがサイトカインは上昇していない男性について「非がん」を予測する。これらの男性は、良性の前立腺肥大又は別の非悪性前立腺症状を有しており、前立腺がんについての現行のPSAスクリーニング検査の多数の偽陽性結果集団を構成する。これらのサイトカインを取り入れた検査は、この偽陽性問題を解決する。
【0066】
がんステージの予測
モスクワのゲルツェン研究所(Gertsen Institute)が監修した乳がん研究から得られるデータは、後述の機器及び試薬を使用して乳がんのステージを高精度で予測することが可能であった。189個の乳房サンプルがステージ情報(0から4)と共に取得された。測定は、腫瘍マーカーPSAと上記の四つのサイトカイン、炎症誘発性(IL6)、抗腫瘍発生性(TNFα)、血管形成(IL8)、血管新生(VEGF)についてであった。この場合、目標は、生体組織検査からの同様のステージ分類情報について各サンプルをスコアリングすることであった。相関方法は、性質上すべて二値であって、幾つかの操作がないと四つの異なる結果をスコアリングできない。故にステージグループがすべてのステージグループを表す二値グループと結合された。1プラス2,3,4、2プラス1,3,4、3プラス1,2,4、4プラス1,2,3。年齢正規化と、ノイズ抑制と、国際公開第2017/127822号及び国際公開第2014/158287号に記載の空間的近接性相関方法とを使用して、四つのグループすべてがモデリング及びスコアリングされた。そして、各サンプルの個々のグループスコアを使用して、そのグループ(1又は1/3)への各々の寄与度に基づく重み付けを追加して、個々のサンプルのスコアが計算された。このモデルは99%の精度を持つ。
【0067】
本明細書では、疾病を診断する為の従来のプロテオミクス相関方法の予測力を向上させる為の幾つかの方法が説明されている。これらは、1)相関性についてのメタ変数と近接スコアとを使用することと、2)訓練事例集合モデルでのバイマーカー平面の影響を調節する為トポロジー安定性と分析物測定特性についての特殊な知識を使用することを含む。また、不一致訓練事例集合モデルを使用して特定の訓練事例集合モデルに独自のブラインドサンプル安定性の問題を発見及び修正する為の方法が記載される。付加的に、所与の疾病状態についての訓練事例集合モデルと部分的に酷似している対応の非疾病条件を発見及び修正する為の方法が記載される。これらの方法すべては補完的であって共同で使用され得る。例えば、非安定性の可能性が高いエリアについての訓練事例集合モデルを調節しても、ブラインドサンプル予測計算からこの問題を完全に排除することはできず、故に予測力の向上の為に両方の方法が使用され得る。発明者らは、これらの方法を組み合わせると、95%を上回る予測力が得られ、下の例1に記される乳がん研究では98%を超える予測力(感度100%、特異性97.5%)が得られることを発見した。
【0068】
例1:乳がん血液検査を判定する臨床研究
オートレイシーズ(OTraces) BC セラ(Sera) Dx検査キットとオートレイシーズ CDx免疫化学計器システム(www.otraces.com)の性能が、乳がんの存在のリスクを判定する実験で評価された。検査キットは5個の非常に低レベルのサイトカインと組織マーカーの濃度を測定し、乳がんのリスクを判定する為スコアCSl及びCSqを計算する為上記のように開発された訓練事例集合モデルを使用する。測定されるタンパク質はIL‐6,IL‐8,VEGF,TNFα,PSAであった。実験は、生体組織検査により診断された乳がんの症例のうちの50%と、非疾病(又はこの場合には乳がんではない)と推定的に考えられる患者からの50%に大まかに分割される約300個の患者サンプルの測定から成る。このグループの内、200個のサンプルの生体組織検査結果は、非疾病の50%と乳がん疾病を有する50%とに正確に分割され、各グループは更に指定の年齢グルーピングに細分された。
【0069】
サンプル分析結果は、疾病状態を予測する訓練事例集合モデルを開発するのに使用された。そして残りのサンプル(約110個)が訓練事例集合モデルを通してブラインドサンプルとして処理されてがんリスク数値スコアが結果として求められ、これらのスコアがホスト臨床センターへ開示される。これらのブラインドサンプルスコアは続いて、結果の臨床精度を判定する為臨床センターにより分析された。
【0070】
二つの診断モデルがこの実験の為に開発され、本明細書では、アルゴリズムI及びアルゴリズムIIと呼ばれる。両方のアルゴリズムに空間的近接性分析方法が使用された。被験者の年齢が独立変数としてではなくメタ変数として使用され、測定された濃度は、本明細書では近接スコアと呼ばれる新たな独立変数に変換され、相関性分析ではこれが直接的に使用された。アルゴリズムIとアルゴリズムIIの相違は、相関に使用される新たな独立変数の数である。アルゴリズムIは10次元クラスタ空間で5個の近接スコア変数を使用する。アルゴリズムIの下限は二次元であり、特定の方法ではなく、相関が実施されるという事実に基づく。相関は本来、一つ超の次元を必要とする。アルゴリズムIの上限は理論的には無限であるが、実際的には計算時間及び出力により制限される。クラスタ空間は射影を介して人の眼で視認できるか、この多次元空間を切り取ると二次元バイマーカー平面を見ることができる。アルゴリズムIの例示的実施形態ではこのような平面が10個ある。
【0071】
アルゴリズムIIは10倍多く作られた独立変数を使用するので、約100個のバイマーカー平面が存在する。一般的母集団を妥当な近似度でモデリングするには訓練事例集合モデルでは200個のサンプルで充分であると予想される。二次又は不一致訓練事例集合モデルは、同じ200個のサンプルの訓練事例データ集合から展開された。訓練事例集合モデルは、本明細書で結果を説明するのに使用される一次スコアリング方法である。不安定であると考えられる一次訓練事例集合モデル計算によるがんスコアを処理するのに、不一致訓練事例集合モデルが使用される。すなわち、トポロジー不安定性のエリアに位置するスコアである。不一致訓練事例集合モデルはブラインドサンプルではいくらか正確性が低いが、それでも一次訓練事例集合モデルを処理することで予測力を向上させられる。
【0072】
上記の空間的近接性分析方法は、計算結果を求めるのに使用される独立変数の高い非線形トレンドに対応可能であるという点で、ロジスティック回帰に対して著しい利点を有している。結果は疾病又は非疾病(この場合にはがん又は非がん)であり、訓練事例集合モデル計算の近接スコアに基づく。この方法の短所は、非常に急なトポロジー勾配と関連する非線形性の高いエリアである。故に、未知の(又はブラインド)サンプルが急なピーク又は深く尖った谷に位置し、これが計算による近接スコアの細かいエラーを増幅させるという影響が見られる。我々は、proprietary安定性検査で計算されたスコアの安定性を判定し、それから安定性を示した例についてアルゴリズムIの調停にアルゴリズムIIを使用した。
【0073】
図11,12,13は、アルゴリズムIの訓練事例集合結果を示す。モデルそのものは、空間的近接性方法により非疾病と疾病(ここでは乳がん)について各々がスコアリングされた40,000個のトポロジー点による10個のバイマーカー平面から成る。非がんとがんの二つの集合を分離するモデルの能力が、これらの図に示されている。モデルは、50%‐50%に非常に近いか好ましくは正確に50%‐50%であるか、二つの結果状態の一つに非常に近いものから構築されなければならない。また、この方法は変換メタ変数として年齢を使用する。訓練事例集合サンプルは、当該のすべての年齢グループに分散されたサンプルを有していた。アルゴリズムIについてのモデル(
図12)は、100人の健康な女性と98人の乳がんの女性で構築されていた。
図12の集計表は数値結果を示し、N=198がサンプルの数である。CIは表記の正しいサンプルでFIは表記の間違ったサンプルであり、4個のサンプルが不確定と見なされた。一次訓練事例集合モデルの使用の結果得られる4個の不確定サンプルを区別する為、二次訓練事例集合モデルが展開された。このモデルは不一致訓練事例集合モデルである。この二次モデルは同じ訓練事例集合データを一次として使用する。
図13は、不一致訓練事例集合モデル計算の結果を示す。アルゴリズムIIは、60を超える分離点を含む100%の分離を示す。
【0074】
乳がん研究におけるブラインドサンプル検査結果
図14は、臨床研究で評価されるブラインドサンプルの結果を示す。この結果は100%の感度と97.5%の特異性を示す。臨床研究センターの腫瘍専門医は、乳がん陽性サンプルがすべて正確に識別されるように診断移行値を設定した。こうして二つの非疾病サンプルが、がん陽性とされた。陽性と判断されたサンプルはすべて次の診断ステップの撮像マンモグラフィを受けるので、これは臨床的に正しい。多くの女性は、医療機器を備えた施設の近隣に住んでいないので撮像マンモグラフィを受けていない。しかしながら、臨床検査室の遠隔地で血液が採取されて大都市の検査室へ冷蔵で輸送され得る。
【0075】
例2:診断精度を向上させる為のメタ変数「年齢」の使用
【0076】
表1(下記)は、868個の被験者サンプルによる乳がんの臨床研究の集計結果を示す。
【0077】
【0078】
表2(以下)は、相関性計算の為の様々な方法の比較を示す。標準的な方法であるロジスティック回帰では、わずか82%の予測力を示す。これに改良が加えられた標準的な空間的近接性分析は線形形式では約88%、対数形式では90%の予測力が得られた。メタ変数と重み付けアプローチ、トポロジー安定性調節、免疫システム反応グルーピング、及び分析性能の為の重み付け調節を使用する本明細書に記載の方法では―ブラインドサンプルの不安定性検査及び不一致アルゴリズム修正と結合されると―、97%より高い予測力が得られた。
【0079】
【0080】
例3:卵巣がん研究における診断精度を向上させる為のメタ変数「年齢」の使用
【0081】
表3(以下)は、本願の実施形態に記載のメタ変数方法を使用して、卵巣がんを持つか卵巣がんを有していない107人の女性の研究結果を示す。この研究は、本明細書に記載される予測力の向上のすべてを使用しているわけではないが、約95%と比較的優れた予測力を達成した。
【0082】
【0083】
例4:前立腺がんの診断精度を向上させる為のメタ変数「年齢」の使用
前立腺がん
【0084】
表4(以下)は、本明細書に記載のメタ変数方法を使用して前立腺がんを有するか良性前立腺肥大(BPH)のいずれかである259人の男性の研究結果を示す。この研究も本願に記載の予測力改良のすべてを使用しているわけではないが、それでも約94%と比較的優れた予測力を達成した。BPHは、現行の前立腺がんPSA検査で偽陽性結果を生じる、最も一般的な症状であることに注意。従来の前立腺がん診断においてBPHの男性は5件のうち約4件が陽性であり、その結果、大部分の前立腺がんの生体組織検査が陰性になる。メタ変数方法は、上記のようにこれらの間違った診断を修正することができる。
【0085】
【0086】
(それぞれ卵巣がん及び前立腺がんについての)例3及び4における上記の結果では、メタ変数又は影響調節方法(LOD,部分母集団グルーピング及び不安定性)もブラインドサンプル安定性方法も使用しなかった。
【0087】
予測力を更に向上させる為、これらの年齢及びグルーピング調節による濃度は、これらを正規化して、空間的近接性分析についての多次元グルーピングによるマーカープロットにおけるクラスタリングの間隔バイアス(空間バイアスとしても知られる)を減少又は除去するように調節される。例えば、IL6及びVEGFについてのバイマーカー平面が見られる
図15を参照すること。これらの平面のうち10個が5個のバイオマーカーによる乳がん検査パネルの為のものである。この場合に、計算による近接性スコア値が正規化及びシフトされてゼロと20の間の任意の値が得られ、濃度が大きく上方制御された異常値は高圧縮される。
【0088】
年齢/グルーピング分析による濃度にわたって同じ正規化間隔での多次元マーカー平面のバイマーカー射影の各々が、年齢(又は全母集団)調節によるサブグルーピングと共に年齢調節による手段に対して、圧縮及び正規化される。
【0089】
調節可能なバイマーカー平面影響レベルを使用する訓練事例集合モデルの予測力の向上
一般的に、バイマーカー平面は、非疾病と疾病についての二値数(例えば+1と-1)でスコアリングされる。本願に記載の近接スコアは、これら二つの二値数の影響レベルを選択的に調節することにより予測力のさらなる改良を受け得る。以下の方法は訓練事例集合モデルで開発され、モデルに固定される。
【0090】
図16及び17は、5個のマーカー、IL‐6,IL‐8,TNFα,VEGF,PSAを使用して、疾病状態、この場合は乳がんの存在を予測するのに使用される5個のバイオマーカーの場合についての一つのバイマーカー平面の射影を示す。
図16は、空間的近接性分析方法により図面上の格子点をスコアリングするのに使用されるデータを含む訓練事例集合モデルを示す。
図17は、データを含まない訓練事例集合モデルを示す。これは訓練事例集合モデルを構成する。40,000個の格子点の各々がスコアリングされて、格子上のどこに位置するかによりブラインドサンプルがスコアリングされるので、モデルを作成するのに使用される訓練事例集合データは必要ない。トポロジーではがんの陽性を赤色で示し、青色はがんの陰性である。この場合に全スコアを計算する際には、非疾病格子点は+1に設定され、疾病(がん)格子点は-1に設定される。この5バイオマーカー例での各バイマーカーが5直交空間で分析され、そのうち
図16は二次元の射影の一つである。この図には、免疫システム反応の様々なサブグルーピングのトポロジーが示されている。この場合、すべての格子スポット(この場合には2000×2000つまり40,000)が通常の手法でスコアリングされ、割り当てられる値は疾病状態陽性(乳がん)については-1で非疾病は+1である。このバイマーカー平面は、近接スコア間隔により、また上記のようにメタ変数の年齢について正規化される。
【0091】
図18は、同じバイマーカーモデルと、加えてグレイエリア内での免疫反応グルーピング(
図24参照)とを示す。各グレイブロックエリアは患者が非疾病であるか疾病である確率にいくらか異なる影響を与えるという事実を反映するように、グレイエリアの影響が調節されている。この調節は、訓練事例集合の確認による人的推定により、又は精密なコンピュータ多変数増分分析により行われ得る。これらの調節は訓練事例集合モデルを向上させる。二つの結果について二つの別々のバイマーカー平面が作成され、これは疾病と非疾病の状態である。この場合、免疫反応グループIVのブラインドデータ点は疾病である可能性がはるかに高く、その影響は(例えば-1から-1.1へスコアを変更することにより)若干増大する(絶対値)。この増分の実際の量は好ましくは、コンピュータ分析により、また可能であれば精密なマニュアル方法により判断されるだろう。この方法は、空間的近接性(疑似濃度としても知られる)相関性分析方法についても実施可能だが、他の手段が使用されても同じ効果が得られただろう。疾病の関連性に関する影響に重み付けするこれらの方法は、約1%の予測力の改良を果たす。95%を上回る予測力ではこれは非常に重要である。
【0092】
図19は、非線形で急速に変化する疾病と非疾病のトポロジーの複合エリアで丸く囲まれたグレイエリアを含む同じバイマーカー平面を再び示す。このようなエリアは、射影ノイズ(つまり+/-10%)の検査ブラインドサンプル値をモデルへ挿入してから測定によるノイズ量を導入することにより識別され得る。これらのブラインド点のほとんどは疾病(ここではがん)スコアでは実質的に変化しないだろう。しかしながら、この種のノイズ調節の後で非疾病から疾病スコアまで劇的に変化する幾つかの格子点が見られる。これらは、バイマーカー平面の大半又はすべてが、多次元のバイマーカー平面全体と重複する急速変化トポロジーを有するエリアである。これらのエリアでの影響を慎重に軽減することにより、近傍の境界で結果の変化を伴わずにノイズデータが広い平面に位置する少数の関連バイマーカー平面で重み付けが増大し得る。この方法は間違った予測を修正することが分かっている。上記の場合に、赤色のがんエリアの影響は例えば-1.0から-0.9へのシフトダウン(絶対値)であろう。或いは青色の非疾病エリアは+1.0から-0.9へシフトダウンするだろう。最適シフトのレベルは精密なコンピュータ分析により判断され得る。
【0093】
分析ノイズは相関性分析の精度に影響し得る。このノイズは、分析物の検出限界以下で特に問題となる。これらの不安定ゾーンにある個々のバイオマーカーについての測定点の影響を軽減することによっても、このノイズが解消され得る。
図20もやはり、乳がんパネルについてのPSA及びIL‐6のバイマーカー平面を示す。図の左下にあるグレイの矩形エリア内の面積はすべて、分析物の従来の検定物検出限界(LOD)を下回っている。従来、LODは、20個のゼロ校正物質の二つの標準偏差に20個のゼロ校正物質の値の平均を加えたものと定義される。このレベルの値の統計的確実性は、二つの標準偏差内では95%であり、言うまでもないが測定サンプルがLODより低くなると測定確実性が確実に下がる。データはやはり有益な情報を有しているが、影響の少ない分析に適用されるべきである。この場合、グレイエリア内のブラインドサンプルデータ点への影響は、グレイエリア内の訓練事例集合モデルの格子点について例えば+1.0から-0.9まで軽減される。これは、他のバイマーカー平面で検出限界を上回るこの検査サンプルについてのデータ点の影響を増大させる。上記の方法は補完的であり、相互協力的に実行され得る。
【0094】
不安定性についてブラインドサンプルを検査することにより予測力を向上させる為の方法
訓練事例集合モデルが完成して固定されると、ブラインド患者サンプルについてがんスコアを計算するのに使用される。発明者らはがんスコアを作成する為の二つの好適な方法を使用する。線形方法(CSl)と呼ばれる第一の方法では、トポロジー位置スコア(+1又は-1)にこのバイマーカー平面の予測力を掛ける。そしてこれらが加算、増減、シフトされて、0から200のスコアが得られる。qスコア(CSq)と呼ばれる第二のスコアは、同じこれらの値の二乗の和の平方根を使用することにより計算される。この第二の方法は、個々のバイマーカースコアの差を強調するものであって、医師の最終診断全般に有益である。
【0095】
空間的近接性相関方法の非常に非線形的な性質によりトポロジー不安定性がバイマーカー平面に残り、完全に解消されることはない。本発明の他の態様によれば、安定性検査と射影ノイズを伴う技術とがブラインドデータ集合に適用され得る。そしてがんスコアを調停又は修正するのに不一致訓練事例集合モデルが使用され得る。本発明のこの態様では、各ブラインド患者データ集合について一定レベルのノイズ(例えばプラス又はマイナス10%)が導入される。ブラインドサンプル集合が約100人の患者である場合には、実際の訓練事例集合モデルコンピュータ実施は、各々が3倍された(生データにノイズ及びマイナスノイズが加えられた)300個のサンプルによる集合についてのものになるだろう。その結果得られる3倍のデータ集合が安定性について検査される(aは-10%、bは+10%、c点は生データ)。表5(以下)は、臨床研究からのデータについての安定性検査の結果を示す。がんスコアでは三つのサンプルが非常に高い不安定性を示すことに注意。サンプル138,207,34,29はすべて非常に高い性能指数を示している。性能指数(低いほど良い)は、スコアシフトの程度と、特に、健康体とがん又はその逆を予測する為のスコアがシフトするかどうかの両方を含むべきである。ブライドサンプルからのこれらのデータ集合では、診断予測が間違っているリスクが高い。
【0096】
【表5-1】
表5-1:トポロジー不安定性検査
【表5-2】
表5-2:トポロジー不安定性検査
【0097】
不一致訓練事例集合モデルは、性能ノイズ検査に不合格であった「リスク」患者サンプルデータ集合を処理するのに使用され得る。微小摂動がスコアに大きな揺れをもたらすようにバイマーカー平面のすべてではないとしても大部分の非常に急な勾配にブラインドサンプルデータ点が位置するという事実により生じる極端なトポロジー不安定性と結合されたランダム又はシステマティックな不可避の測定ノイズの為に、これらの点はリスクを持つ。表5は、ノイズが導入されたサンプルを示す。各サンプルは三つの値、つまり1)プラスノイズと、2)マイナスノイズと、3)ノイズを含まない生データとを有する。これらのサンプルは、+-10%のノイズの導入により疾病から非疾病へ、そしてまた非疾病から疾病へ変化するがんスコアを示す。この場合に、これらのサンプルデータは不安定であると判断される。不安定性のレベルは正確に規定されず、様々なレベルのノイズ導入について調節が行われ得る。この場合、これらは+-10%のノイズと2000より大きい安定性スコアで修正される(安定性スコアとがんスコアとは意味の異なる別々の二つの数であることに注意)。
【0098】
測定ノイズはこの不一致な第2アルゴリズム(アルゴリズムII)で調停され得る。調停に使用される不一致アルゴリズムは、正しい点であるという見込みを向上させるので、主なアルゴリズムよりも予測力が若干低い場合でも、これらの「リスク」患者サンプル集合を修正するのに使用され得る。この場合には二つが修正された(
図21参照)。サンプル138は非疾病スコアが85で、不一致アルゴリズムで195に修正され(この点はアルゴリズムIでは安定していた)、サンプル34はスコアが102(線形方法)で、やはりアルゴリズムIIで198に修正された。サンプル29,207は不一致アルゴリズムにより変更されなかった。
【0099】
不一致訓練事例集合モデル(アルゴリズムII)は105個のバイマーカー平面を使用し、これらの同じサンプルがアルゴリズムIIの安定性検査のような安定性を示しているという点で一次訓練事例集合モデル(アルゴリズムI)と不一致である。不一致訓練事例集合モデルの検査は、一次訓練事例集合モデルと全く同じように行われる。これらのサンプルスコアを計算するのにロジスティック回帰方法も使用され得ることに注意。アルゴリズムIIは高い予測力を有するので使用された。不安定性を伴わずにおそらく正しい結果を有する限りは、主アルゴリズムよりも予測力が低い(好ましくは少なくとも50%の予測力だが)場合でも、処理訓練事例集合モデルが使用され得る。ノイズ検査に不合格であった当該のブラインドサンプルについて修正は顕著であることに注意。これらのサンプルは実際にはすべて高スコアのがんであった。これらのサンプルについての10個のバイマーカー平面のうち8個が非常に高不安定度の格子点を持つトポロジー上にあった。故にスコアにはリスクがあり、実際に不正確であった(一つは間違っており、一つは100/120のスコアで不確定であった)。この場合に、予測力を97%から98%へ向上させる為一つのサンプルが修正され、非常に高いエラー減少(50%)が見られた。一つのサンプルは、不確定であったががんに変化し、やはり修正された。
【0100】
一次疾病分析の結果状態の一つと部分的に酷似する単独の状態を除外することにより疾病状態修正二値結果予測力を向上させる為の方法
空間的近接性分析は通例、三つ以上の独立変数、たいていは患者の血清タンパク質濃度を使用する。相関アルゴリズムは非疾病又は疾病の二値結果のみに作用するが、実際の結果が二つの二値状態である確率に一層密接に関係する連続スコアリングが行われる。場合によっては、使用されるバイオマーカーの母集団分布内で疾病状態と部分的に酷似した、名目上は非疾病と分類される他の状態が見られる。これらの場合の幾つかでは、この非疾病「酷似」状態は、相関分析の偽陽性結果を生じる。この種の偽陽性結果を解決する方法は、非疾病又は疾病分析とは全く別の付加的で新たな相関分析を作り出すことである。この新たな相関分析は好ましくは非疾病又は疾病の相関性について全く同じバイオマーカー測定データを使用するか、異なるバイオマーカーの幾つか又は全てを使用する。この新たな相関分析は「非疾病酷似」又は「疾病」の結果を提供するか、少なくとも、患者の実情についての判断が行われることを可能にするスコアを付ける。非疾病酷似又は疾病相関性での非常に低いか高いスコアと結合された非疾病又は疾病分析の為の不確定又は近似移行スコアは、開業医が疾病状態判断を向上させて偽陽性スコアを低下させるのに役立ち得る。
【0101】
非疾病状態が疾病状態に酷似しているこの状況の例は、非悪性症状の良性前立腺肥大(BPH)である。この症状は通常、前立腺がんの診断に使用される少なくとも一つのバイオマーカーが高いレベルを示す。例えば、バイオマーカーである前立腺特異抗原(PSA)は、BHPと前立腺の両方の男性で上昇する。表4は、この付加的な相関分析方法がBHPと前立腺がんの男性を区別し、同様に同じバイオマーカーを使用するが異なる訓練事例集合モデルでは、非疾病状態と推定される男性と疾病状態で前立腺がんが確認された男性とを区別できることを示している。男性のうち僅かな割合で、偽陽性の結果、非疾病とがんの訓練事例集合モデルが生じるが、これはBHPとがんの訓練事例集合モデルにより区別される。これらの場合に、一方は推定非疾病とがん、一方はBHPとがんの二つのスコアは、医師又は他の医療関係者が次の診断ステップを決定するのに役立つ。例えば、両方のモデルについての0から200の総スコアリング(CSlとCSqのいずれか)では、「非前立腺がん又は前立腺がん」についての110のスコアは、がん陽性には低いスコアであるが、BHP又はがんについての30の第2スコアを検討すると、がんではなくBPHである可能性が高いとの指示が開業医に与えられる。開業医はこの追加情報を他の医療情報及び患者病歴と共に使用して、次の診断ステップを決定するだろう。
【0102】
各方法の詳細な記述
分析ステップ/アルゴリズム
本発明による分析モデルを開発する為のプロセスは、概して、
図22に例示されているように下記の論理経路を辿る。
【0103】
ステップ2200「患者サンプルを収集」では、既知の非疾病及び疾病患者サンプルの大きなグループをソフトウェアが収集する。サンプルは概して他のいかなる無関係の症状(がんでは非悪性)についてスクリーニングされず、サンプル集合が統計的に一般的母集団に見えるように収集される。
【0104】
ステップ2202「バイオマーカー濃度を測定」では、当該技術で周知の方法及び装置を使用して、ソフトウェアがバイオマーカーパラメータ濃度を測定する。
【0105】
ステップ2204「各バイオマーカーについて近接スコアを計算」では、
図25に示されているように、ソフトウェアが各バイオマーカーについての近接スコア曲線を計算し、各々のゾーンを設定する。
【0106】
ステップ2206「がん又は非がんとしてサンプルをスコアリング」では、ソフトウェアがモデルプラグラムを実行し、空間的近接性相関方法を使用してサンプルをスコアリングする。モデルは、4個のゾーンの各々に独自の圧縮又は再正規化方程式を使用する(以下の方程式1参照)。
【0107】
ステップ2208「スコアリングを検査及び修正」では、ソフトウェアがトポロジー安定性について個々のサンプルを検査し、不一致アルゴリズムに不合格であったものを修正する。第一に、測定された濃度レベルにプラスマイナスノイズを導入し、ディザリングされた近接スコアを計算し、一次空間的近接性モデルにこれらを適用することにより、すべてのがんスコアが通常の手法でトポロジー安定性について検査される。これらのディザリングがんスコアがシフトして所定の限界を超えた場合には、一次モデルを使用して計算されたがんスコアが却下される。そして不合格であった検査の最初の濃度レベルが、二次又は不一致モデルを使用して新たな近接スコアに移行する。そしてこれらの不合格サンプルについてのこれらの新たな近接スコアが空間的近接性相関モデルに適用される。そしてこれらの新たながんスコアが同じ手法で安定性について二次モデルと共に検査される。これらのサンプルが安定性検査に合格した場合には、不一致モデルにより分析されたと報告される。一次及び二次の両方のモデルが不安定である場合には、サンプルは不確定であると報告される。
【0108】
最後に、ステップ2210では、「訓練事例集合モデルで疾病又は非疾病を分類」でソフトウェアが上記の結果を出力する。
【0109】
乳がん確認研究に使用される装置及び試薬:検査プラットフォームの説明
OTraces CDx計器システム
以下に含まれ、作業の多くは上に記した検査データが、下記の試薬により装置で測定された。データはオートレイシーズ(OTraces)LIMSシステムで処理され、場合によってはPCベースソフトウェアで計算が完了した。計算ソフトウェアすべてがオートレイシーズ・・インコーポレイテッド(OTraces Inc.)により書き込み及び確認された。他の同等のハードウェア、装置、試薬が同様の結果を達成するのに使用され得ることは、当業者には容易に明白になるだろう。
【0110】
CDx計器システムは、ハミルトンマイクロラボスターレット(Hamilton MicroLab Starlet)システムに基づいている。これは、OTraces免疫測定法をHamilton高速ELISAロボットに転送するようにプログラミングでカスタマイズされている。ハミルトン社(Hamilton Company)は、マイクロラボスターレットを含む自動液体処理システムを世界規模で販売する評判の良い企業である。ハミルトン社によりユニットがオートレイシーズ用にカスタマイズされ、完全自動化を提供する。オートレイシーズCDxシステムは、一体的なマイクロプレートウォッシャシステム及びリーダ(Microplate Washer System and Reader)を含む。これら二つの追加装置により、初期設定後はオペレータの介入を伴わずに、システムが1回のシフトで検査パネルでの五つの免疫測定法すべてを一通り完了できる。設定されたシステムは毎日40個のがんスコアを完了する。改良には、一つの対象分析物を一度に実施するソフトウェアを含む。こうして、検査全体の実施中にエラーが発生した時には特定の検査を再実施可能であることが必要である。
【0111】
BC Sera DX検査キット
この検査キットは、緩衝液、ブロック溶液、洗浄液、抗体、校正物質をすべて含む、120個のがん検査スコアを実施する為の試薬及び使い捨て装置をすべて含む。この検査キットを完全商品化するのに必要な改良は、二つの対照サンプルを追加することである。これらの対照物により、「ブラインド」検査サンプルから適切ながんスコアが得られるという単独での確認が行われる。二つの対照物はそれぞれ50と150の近接スコアを生じるように設計される。LIMSシステム(以下参照)QCプログラムは、これらの対照物が正しいことを検証して、現場での個々の検査実施を確認する。検査キットはGMP工場で製作され、CEマークを受けている。マイクロタイタープレートは、工場において捕捉抗体及びタンパク質ブロッキング溶液でプレコートされる。
【0112】
臨床検査情報管理システム(LIMS)
例えばロシュ・アボット(Roche and Abbott)により現在販売されている臨床化学システムはすべて、患者データの管理に充分なソフトウェアとのグラフィカルインタフェースを含み、計器及び化学操作を品質制御し、検査サンプル識別と検査システムへの導入を容易にする。これらのメニューは、納品された化学システムと統合される。オートレイシーズのビジネスモデルは、オートレイシーズの米国施設に所在するオートレイシーズコンピュータサーバでのこれらの機能を含み、クラウドコンピューティングを使用し、インターネットを介して、CDx計器をこれらのサーバに一体的に接続する。これにより幾つかの重大な利点が得られる。1)現場に装備された各CDxシステムによるすべての実施検査からのデータがオートレイシーズサーバで実施されるように、LIMSソフトウェアがFDA準拠アーカイブソフトウェアを取り入れる。設置ベースからのフィードバックを適用すると、患者結果についての中心施設からの入力により、オートレイシーズは、米国拠点のFDA市場認可提出の為のFDAコンプライアントデータを収集できる。2)好ましくは、バーコード付きの試薬包装により、計器及びLIMSを工場QC検査からのすべてのQC検査結果に接続できる。これらのデータは、現場検査結果を更に確認する為、現場で検査が実施される際に実時間で入手可能である。3)CDxシステムはオートレイシーズ確認試薬のみに対して実施され、故にオートレイシーズ試薬以外を使用する検査実施が可能でない。このシステムは、オペレータには実時間で実施されるすべての機能を備える典型的なユーザインタフェースのような外観であり、検査実施が完了するとすぐに患者レポートが入手可能である。
【0113】
訓練事例集合モデルを展開してリスクスコアを計算する為の段階的プロセスが、
図23のフローチャートに示されている。このプロセスは、発明の或る実施形態においてソフトウェアで実行され得る。訓練事例集合モデルの構築が最初に行われ、その最終製品は、ブラインドサンプルと呼ばれる未知の患者サンプルについての診断結果の作成を可能にするが、それはこれらのブラインドサンプルについての分析の時点では正しい診断が判明していないからである。概して、本発明は、リスクスコアを他の患者因子と共に検討して所与の疾病状態の有無についての臨床判断を下す介護者にリスクスコアを提供する。
【0114】
ステップ2302から2318は、訓練事例集合モデルが作成されるプロセスの概要を示す。ステップ2302で、ソフトウェアは診断の必要性から訓練事例集合サンプル要件を規定するが、これは当業者により設定される所定の基準である。例えば、これらの基準は疾病と非疾病の状態、より具体的には例えば乳がんにおいては乳がん陽性と乳がんでないことが判明しているサンプルの比較である。
【0115】
ステップ2304で、ソフトウェアは、計算されるメタ変数と共に測定される独立変数(つまりバイオマーカー)を規定する。
【0116】
ステップ2306では、ステップ2302から2304で設定されたパラメータに従ってソフトウェアが訓練事例集合サンプルを収集する。ステップ2308で、ソフトウェアは、各訓練事例集合サンプルに適当な医療機器を使用して、測定による独立変数及びメタ変数と共にこれらの結果と関連する正しい疾病診断を判断する。ステップ2310で、ソフトウェアは訓練事例集合サンプルの各々についてバイマーカートポロジーを計算する。ステップ2312で、ソフトウェアは、以下について最適なバイマーカートポロジー重み付け又は影響調節を計算する。(1)検出限界の不確定性、例えば従来の検出限界を下回ると判断されるサンプル。(2)例えば[0070]段落に記載された方法により、また上記のトポロジー安定性に関して判断される極度のトポロジー不安定性。ステップ2314では、計算が完了したと考えられ、疾病(例えばがん)の診断について一次訓練事例モデルが凍結される。ステップ2316で、ソフトウェアは、本質的に不一致の相関性モデリング(例えば
図10参照)を使用して二次訓練事例モデルを展開する。ステップ2318では、疾病状態の診断の為の二次訓練事例モデルが作成されるので、計算が完了したと見なされて凍結される。このようにして、疾病の診断について訓練事例モデル集合が作成される。
【0117】
ステップ2320から2338は、がんのような疾病を診断するように開発された訓練事例モデルを本発明のソフトウェアがどのように使用するかを説明している。ステップ2320で、ソフトウェアは、訓練事例集合モデルの開発で使用されるものに類似した医療機器を使用してバイオマーカーのようなブラインドサンプル独立変数を測定する。ステップ2322で、ソフトウェアは、各ブラインドサンプルについてのメタ変数データを取得又は測定して計算する。ステップ2324で、ソフトウェアはこのデータを使用し、一次訓練事例集合モデルを使用してブラインドサンプルについての初期疾病状態リスクスコアを計算する。ステップ2326で、ソフトウェアはブラインド患者サンプルスコアのトポロジー安定性を判断する。ステップ2328で、ソフトウェアは、スコアがトポロジー安定性検査に合格するかどうかを点検する。合格/不合格の基準には、どれほど大きな不安定性誘発エラーであるかと、最も重要な、スコアが疾病陽性から陰性へ、又はその逆に変化するかどうかを判断することが付随する。ステップ2330で、スコアが安定性検査に合格したことが判明した場合、診断レポート及びリスクスコアが出力及び/又は公表される。スコアが合格しなかった場合には、ステップ2332で、ソフトウェアは更に上記の不一致方法アルゴリズム(アルゴリズムII)を使用して二次疾病状態リスクスコアを計算する。ステップ2334で、スコアがトポロジー安定性検査に合格したかどうかをソフトウェアが再び点検する。ステップ2336で、スコアが安定性検査に合格したことが判明した場合、診断レポート及びリスクスコアが出力及び/又は公表される。スコアがまだ合格しない場合には、ステップ2338で、ソフトウェアが診断レポート及び出力を準備する、及び/又は疾病状態が存在するかどうかについて不確定であると結果を公表する。
【0118】
本願で計算される一次スコアは幾つかの独自の特性を有する。或る実施形態では、タンパク質の平均値が、その年齢の患者について実際に測定された濃度との比として対数圧縮に埋め込まれる。本質的に、この方法では、例えば各々が患者母集団の年齢に独自である同様の方程式が扇状に作成される。未知の各サンプルには、サンプルの年齢について独自の方程式が与えられる。
【0119】
非疾病と疾病についての年齢調節平均値と以下の形の実際の患者サンプル濃度とを含む関係が使用され得る。
【0120】
方程式1
近接スコア=(K)*ln((Ci/C(c or h))-(Ch/Cc))2
K=比例定数
Ci=実際の患者分析物について測定された濃度
C(c or h)=この患者分析物の患者年齢調節濃度。患者が非疾病か疾病状態かについて値が調節される。
Ch=非疾病患者分析物の患者年齢調節平均濃度
Cc=疾病患者分析物の患者年齢調節平均濃度。
【0121】
この方程式1は、
図25に示されているように、上方制御グルーピングゾーンに応じて圧縮及び膨張を調節するように考案されている。近接スコアについての上記の式はこの要件を満たしている。しかしながら、当業者には明白であるように、この方程式の他の多くの形が実行され得る。例えば、C
i,C
h,C
cは、上記のように、サブグループ中央値又はダイナミックレンジのエッジからの平均、中間、距離による実際の濃度又は濃度距離であろう。この計算の他の変形例は、方程式2及び3として以下に再掲する。
【0122】
方程式2
近接スコア=K*ln(((未知のサンプルの濃度)/(未知のサンプルの年齢でのがんの平均値の濃度))-((未知のサンプルの年齢での非がんの平均値の濃度)/(未知のサンプルの年齢でのがんの平均値の濃度)))2。
【0123】
この方程式から、未知のサンプルが未知のサンプルの年齢での非がんの平均に等しい時に負の無限大(ゼロの自然対数)が得られる。
図25に示されているように、これは実際の詳細な方程式により設定値、例えば2に上書きされる。言い換えると、予設定範囲以外の値がソフトウェアにより検査されて予設定範囲の限界値に再設定されるのである。
【0124】
方程式3
近接スコア=K*ln(((未知のサンプルの濃度)/(未知のサンプルの年齢での非がんの平均値の濃度))-((未知のサンプルの年齢でのがんの平均値の濃度)/(未知のサンプルの年齢での非がんの平均値の濃度)))2。
【0125】
方程式3から、未知のサンプルが未知のサンプルの年齢についてのがん平均と等しい時に負の無限大であるゼロの自然対数が得られる。この方程式の実施形態は、未知のサンプルが未知のサンプルの年齢での非がんとがん平均との間の中間点濃度を上回る(がんと推定)時に使用される。この状況では、未知のサンプルがその年齢のがんの平均値である時に方程式全体が逆転されて正の無限大となる。この無限大は、実際の詳細方程式において設定値、例えば18に上書きされる。
図25のグラフは、当該の年齢範囲について得られる一連の方程式を示す。方程式は、
図25に示された4個のゾーンの各々で独立的に機能する。ゾーンは、1)非疾病母集団の平均値より下、(2)非疾病平均値より上で、非疾病と疾病平均値の間(非疾病/疾病の移行)で導出される中間点の下、(3)非疾病/疾病平均値の間で導出される中間点と、母集団疾病平均値との間、(4)疾病状態の平均値より上。これらのゾーンは、ゾーン内に位置するサンプルが疾病又は非疾病の状態であることを示していないことに注意。個々のサンプルの真の診断はいずれかであり、バイオマーカーに影響する別の症状の為に「正しくない」場合にはその位置である。我々はこれをプロテオミクスノイズと呼ぶ。ゾーンは単に個々のサンプルがどのように平均に関係しているかを指しており、方程式1により例示的に行われる圧縮又は再正規化の為の足場となる。各方程式が一つの年齢値のみを表すことと、各々が単一の年齢値を表す多数の方程式を集合全体が構成することとに注意。方程式の集合全体は、実際の濃度が正確に平均値と等しい時にすべての年齢について同じ所定の値に近接スコア値を設定するように考案される。示されている年齢は、35,50,65である。集合全体は扇のように見え、各未知のサンプルの年齢について一つの方程式が含まれる。
【0126】
近接スコア(無名数であるが故に濃度やレベルではない)は例示的に上述のように計算され、そして分析の為空間的近接性相関多次元図で使用される。また、図のすべては母集団分布に共通の特性、つまり非疾病及び疾病(年齢が調節されるかされない)の年齢平均値、中間値、又はサブグルーピングのダイナミックレンジに合わせて正規化される。これらの方法により、5以上のパーセントポイントの予測力の向上が得られる。
【0127】
本発明のシステム及び方法についての上記の例示的実施形態は、ネットワーク接続又は非ネットワーク接続の両方のハードウェアで機能するソフトウェアで実行され得る。発明を実行するのに使用されるハードウェアの例示的実施形態を
図26に関連して説明する。例示的システム2600では、1台以上の周辺装置2610がネットワーク2630を通して1台以上のコンピュータ2620に接続される。周辺装置2610の例は、スマートフォン、スマートウォッチ、タブレット、ウェアラブル電子装置、EKS及び血圧モニタのような医療装置、当該技術で周知のバイオマーカーデータを収集する他の装置を含む。ネットワーク2630は、インターネットのようなワイドエリアネットワーク又はイントラネットのようなローカルエリアネットワークであり得る。ネットワーク2630の為、周辺装置2610及びコンピュータ2620の物理的な位置は発明の機能に影響を及ぼさない。両方の実行例が本願に記載され、明記されないが、周辺装置2610とコンピュータ2620とが同じか異なる物理的位置にあることが考えられる。システムのハードウェアコンポーネントの間の通信は、多数の周知の手法、例えばモデムやイーサネット(登録商標)アダプタのようなネットワーク接続コンポーネントを使用して達成され得る。周辺装置2610とコンピュータ2620は共に通信機器を含むかこれに装着される。通信は、HTTPのような業界標準プロトコルで行われると考えられる。
【0128】
各コンピュータ2620は、中央処理ユニット2622と記憶媒体2624とユーザ入力装置2626とディスプレイ2628とから成る。使用され得るコンピュータの例は、市販のパーソナルコンピュータ、オープンソースのコンピューティング装置(例:ラズベリー(Raspberry) Pi)、市販のサーバ、市販のポータブル装置(例:スマートフォン、スマートウォッチ、タブレット)である。一実施形態において、システムの周辺装置2610の各々とコンピュータ2620の各々は、これに設置されるシステムに関連するソフトウェアを有する。このような実施形態では、ネットワーク接続されたコンピュータ2620に、或いはネットワーク2630を通してネットワーク接続コンピュータ2620のいずれかにアクセス可能な1台以上のリモートサーバ2640に、バイオマーカーデータが局所的に記憶され得る。代替的実施形態で、ソフトウェアは周辺装置2610でアプリケーションとして実施される。
【0129】
記載された実行例の或る特徴が本願に記載されるように例示されたが、多くの変形、代替物、変更、同等物が当業者には思い浮かぶだろう。故に、本発明は開示された特定の実施形態又は配置に限定されず、むしろ添付の請求項に規定される発明の範囲及び趣旨に内含されるいかなる変更、改変、又は変形も含むことが意図されている。本願に引用されるすべての引例が特許及び出願を含めてその全体が援用されることは明白である。
【符号の説明】
【0130】
2600 システム例
2610 周辺装置
2620 コンピュータ
2622 中央処理ユニット
2624 記憶媒体
2626 ユーザ入力装置
2628 ディスプレイ
2630 ネットワーク
2640 リモートサーバ
【手続補正書】
【提出日】2023-05-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
疾病を診断する為にコンピュータによって実行される方法であって、
(a)第1患者の代用流体からの第1バイオマーカーの一つ以上の濃度値による第1集合を受理するステップであって、前記第1患者サンプルが非疾病診断から成るステップと、
(b)第2患者の代用流体からの前記第1バイオマーカーの一つ以上の濃度値による第2集合を受理するステップであって、前記第2患者サンプルが疾病診断から成るステップと、
(c)濃度値の前記第1集合からの第1近接スコア集合と濃度値の前記第2集合からの第2近接スコア集合とを計算するステップと、
(d)濃度値の前記第1集合及び濃度値の前記第2集合と前記第1近接スコア集合及び前記第2近接スコア集合とから前記第1バイオマーカーと疾病診断との相関性を計算するステップであって、前記相関性は初期疾病状態リスクスコアとして計算されるステップと、
(e)不一致訓練事例集合モデルを用いることにより前記初期疾病状態リスクスコアを確認するステップと、
を含む方法。
【請求項2】
前記第1バイオマーカーが、腫瘍マイクロ環境において見つかる活性サイトカインである、請求項1に記載の方法。
【請求項3】
前記活性サイトカインの官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも一つである、請求項2に記載の方法。
【請求項4】
前記代用流体は、血液、尿、又は組織である、請求項1に記載の方法。
【請求項5】
診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項1に記載の方法。
【請求項6】
前記第1バイオマーカーが、低含量タンパク質である、請求項4に記載の方法。
【請求項7】
前記第1近接スコア及び前記第2近接スコアは、メタ変数で調節される当該の母集団分布特性を使用して計算される、請求項5に記載の方法。
【請求項8】
前記第1バイオマーカーが、サイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つであり、あるいは、前記第1バイオマーカーが、VEGFである、請求項1に記載の方法。
【請求項9】
(a)第1患者の代用流体からの第1バイオマーカーの一つ以上の濃度値による第1集合を受理するステップであって、前記第1患者サンプルが非疾病診断から成ることと、
(b)第2患者の代用流体からの前記第1バイオマーカーの一つ以上の濃度値による第2集合を受理するステップであって、前記第2患者サンプルが疾病診断から成ることと、
(c))濃度値の前記第1集合からの第1近接スコア集合と濃度値の前記第2集合からの第2近接スコア集合とを計算することと、
(d)濃度値の前記第1集合及び濃度値の前記第2集合と前記第1近接スコア集合及び前記第2近接スコア集合とから前記第1バイオマーカーと疾病診断との相関性を計算することであって、前記相関性は初期疾病状態リスクスコアとして計算されることと、
(e)不一致訓練事例集合モデルを用いることにより前記初期疾病状態リスクスコアを確認することと、
を含むプロセスをコンピュータに実行させるためのプログラムを記憶する非一時的コンピュータ可読媒体。
【請求項10】
前記第1バイオマーカーが、腫瘍マイクロ環境において見つかる活性サイトカインである、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項11】
前記活性サイトカインの官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも一つである、請求項10に記載の非一時的コンピュータ可読媒体。
【請求項12】
前記代用流体は、血液、尿、又は組織である、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項13】
診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項14】
前記第1バイオマーカーが、低含量タンパク質である、請求項9に記載の非一時的コンピュータ可読媒体。
【請求項15】
前記第1近接スコア及び前記第2近接スコアは、メタ変数で調節される当該の母集団分布特性を使用して計算される、請求項9に記載の非一時的コンピュータ可読媒体。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0129
【補正方法】変更
【補正の内容】
【0129】
記載された実行例の或る特徴が本願に記載されるように例示されたが、多くの変形、代替物、変更、同等物が当業者には思い浮かぶだろう。故に、本発明は開示された特定の実施形態又は配置に限定されず、むしろ添付の請求項に規定される発明の範囲及び趣旨に内含されるいかなる変更、改変、又は変形も含むことが意図されている。本願に引用されるすべての引例が特許及び出願を含めてその全体が援用されることは明白である。
〔付記1〕
疾病を診断する為のコンピュータ利用方法であって、
(a)第1患者サンプルからの第1バイオマーカーの一つ以上の濃度値による第1集合を受理するステップであって、前記第1患者サンプルが非疾病診断から成るステップと、
(b)第2患者サンプルからの前記第1バイオマーカーの一つ以上の濃度値による第2集合を受理するステップであって、前記第2患者サンプルが疾病診断から成るステップと、
(c)前記第1濃度値集合からの第1近接スコア集合と前記第2濃度値集合からの第2近接スコア集合とを計算するステップと、
(d)前記第1及び第2濃度値集合と前記第1及び第2近接スコア値集合とから前記第1マーカーと疾病診断との相関性を計算するステップであって、前記相関性が、単純回帰、ROC曲線面積最大化、トポロジー安定化、又は空間的近接性分析のうち一つであるステップと、
を包含するコンピュータ利用方法。
〔付記2〕
ステップ(a)~(d)が5個までのバイオマーカーについて反復される、付記1に記載のコンピュータ利用方法。
〔付記3〕
前記関連性が、前記単純回帰と前記ROC曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、付記1に記載のコンピュータ利用方法。
〔付記4〕
前記第1及び第2患者サンプルが、血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、付記1に記載のコンピュータ利用方法。
〔付記5〕
診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、付記1に記載のコンピュータ利用方法。
〔付記6〕
診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、付記5に記載のコンピュータ利用方法。
〔付記7〕
前記第1及び第2患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、付記6に記載のコンピュータ利用方法。
〔付記8〕
前記二値グループの各々がスコアリングされる、付記7に記載のコンピュータ利用方法。
〔付記9〕
前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、付記1に記載のコンピュータ利用方法。
〔付記10〕
前記第1バイオマーカーがVEGFである、付記1に記載のコンピュータ利用方法。
〔付記11〕
(a)第1患者サンプルからの第1バイオマーカーの一つ以上の濃度値による第1集合を受理することであって、前記第1患者サンプルが非疾病診断から成ることと、
(b)第2患者サンプルからの前記第1バイオマーカーの一つ以上の濃度値による第2集合を受理することであって、前記第2患者サンプルが疾病診断から成ることと、
(c)前記第1濃度値集合からの第1近接スコア集合と前記第2濃度値集合からの第2近接スコア集合とを計算することと、
(d)前記第1及び第2濃度値集合と前記第1及び第2近接スコア値集合とから前記第1バイオマーカーと疾病診断との相関性を計算することであって、前記相関性が、単純回帰、ROC曲線面積最大化、トポロジー安定化、空間的近接性分析のうち一つであることと、
を包含するプロセスをコンピュータに実行させるプログラムを記憶する非一時的コンピュータ可読媒体。
〔付記12〕
ステップ(a)~(d)が5個までのバイオマーカーについて反復される、付記11に記載の非一時的コンピュータ可読媒体。
〔付記13〕
前記相関性が、前記単純回帰と前記ROC曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、付記11に記載の非一時的コンピュータ可読媒体。
〔付記14〕
前記第1及び第2患者サンプルが血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、付記11に記載の非一時的コンピュータ可読媒体。
〔付記15〕
診断される前記疾病が前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、付記11に記載の非一時的コンピュータ可読媒体。
〔付記16〕
診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、付記15に記載の非一時的コンピュータ可読媒体。
〔付記17〕
前記第1及び第2患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、付記16に記載の非一時的コンピュータ可読媒体。
〔付記18〕
前記二値グループの各々がスコアリングされる、付記7に記載の非一時的コンピュータ可読媒体。
〔付記19〕
前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、付記11に記載の非一時的コンピュータ可読媒体。
〔付記20〕
前記第1バイオマーカーがVEGFである、付記11に記載の非一時的コンピュータ可読媒体。
【外国語明細書】