特開2023-87100 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ オートレイシーズ，インク．の特許一覧

特開2023-87100測定分析物を使用して疾病診断を向上させる為のシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023087100

(43)【公開日】2023-06-22

(54)【発明の名称】測定分析物を使用して疾病診断を向上させる為のシステム及び方法

(51)【国際特許分類】

G16H 50/00 20180101AFI20230615BHJP

【ＦＩ】

G16H50/00

【審査請求】有

【請求項の数】15

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023076599

(22)【出願日】2023-05-08

(62)【分割の表示】P 2020507059の分割

【原出願日】2018-08-09

(31)【優先権主張番号】62/542,865

(32)【優先日】2017-08-09

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】518258216

【氏名又は名称】オートレイシーズ，インク．

【氏名又は名称原語表記】ＯＴＲＡＣＥＳ，ＩＮＣ．

(74)【代理人】

【識別番号】100107364

【弁理士】

【氏名又は名称】斉藤達也

(72)【発明者】

【氏名】クラシック，ガリナ

(72)【発明者】

【氏名】リンゲンフィルター，ケイス

(57)【要約】

【課題】前立腺がん、乳がん、肺がん、卵巣がんなどの疾病とそのステージとを診断する為のシステム及び方法を提供する。
【解決手段】或る実施形態において、開示されるシステム及び方法は、患者サンプルを収集し、バイオマーカーの濃度及び近接スコアを計算し、これらの計算を使用してバイオマーカー濃度及び近接スコアを疾病診断及び疾病状態（例：がんステージ）と相関させるのに使用される訓練事例集合モデルを作成する。或る実施形態において、使用される相関技術は、単純回帰、ＲＯＣ曲線面積最大化、トポロジー安定化、又は空間的近接性相関性分析を含む。
【選択図】図１

【特許請求の範囲】

【請求項1】

疾病を診断する為のコンピュータ利用方法であって、
（ａ）第１患者サンプルからの第１バイオマーカーの一つ以上の濃度値による第１集合を受理するステップであって、前記第１患者サンプルが非疾病診断から成るステップと、
（ｂ）第２患者サンプルからの前記第１バイオマーカーの一つ以上の濃度値による第２集合を受理するステップであって、前記第２患者サンプルが疾病診断から成るステップと、
（ｃ）前記第１濃度値集合からの第１近接スコア集合と前記第２濃度値集合からの第２近接スコア集合とを計算するステップと、
（ｄ）前記第１及び第２濃度値集合と前記第１及び第２近接スコア値集合とから前記第１マーカーと疾病診断との相関性を計算するステップであって、前記相関性が、単純回帰、ＲＯＣ曲線面積最大化、トポロジー安定化、又は空間的近接性分析のうち一つであるステップと、
を包含するコンピュータ利用方法。

【請求項2】

ステップ（ａ）～（ｄ）が５個までのバイオマーカーについて反復される、請求項１に記載のコンピュータ利用方法。

【請求項3】

前記関連性が、前記単純回帰と前記ＲＯＣ曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、請求項１に記載のコンピュータ利用方法。

【請求項4】

前記第１及び第２患者サンプルが、血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、請求項１に記載のコンピュータ利用方法。

【請求項5】

診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項１に記載のコンピュータ利用方法。

【請求項6】

診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、請求項５に記載のコンピュータ利用方法。

【請求項7】

前記第１及び第２患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、請求項６に記載のコンピュータ利用方法。

【請求項8】

前記二値グループの各々がスコアリングされる、請求項７に記載のコンピュータ利用方法。

【請求項9】

前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、請求項１に記載のコンピュータ利用方法。

【請求項10】

前記第１バイオマーカーがＶＥＧＦである、請求項１に記載のコンピュータ利用方法。

【請求項11】

（ａ）第１患者サンプルからの第１バイオマーカーの一つ以上の濃度値による第１集合を受理することであって、前記第１患者サンプルが非疾病診断から成ることと、
（ｂ）第２患者サンプルからの前記第１バイオマーカーの一つ以上の濃度値による第２集合を受理することであって、前記第２患者サンプルが疾病診断から成ることと、
（ｃ）前記第１濃度値集合からの第１近接スコア集合と前記第２濃度値集合からの第２近接スコア集合とを計算することと、
（ｄ）前記第１及び第２濃度値集合と前記第１及び第２近接スコア値集合とから前記第１バイオマーカーと疾病診断との相関性を計算することであって、前記相関性が、単純回帰、ＲＯＣ曲線面積最大化、トポロジー安定化、空間的近接性分析のうち一つであることと、
を包含するプロセスをコンピュータに実行させるプログラムを記憶する非一時的コンピュータ可読媒体。

【請求項12】

ステップ（ａ）～（ｄ）が５個までのバイオマーカーについて反復される、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項13】

前記相関性が、前記単純回帰と前記ＲＯＣ曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項14】

前記第１及び第２患者サンプルが血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項15】

診断される前記疾病が前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項16】

診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、請求項１５に記載の非一時的コンピュータ可読媒体。

【請求項17】

前記第１及び第２患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、請求項１６に記載の非一時的コンピュータ可読媒体。

【請求項18】

前記二値グループの各々がスコアリングされる、請求項７に記載の非一時的コンピュータ可読媒体。

【請求項19】

前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項20】

前記第１バイオマーカーがＶＥＧＦである、請求項１１に記載の非一時的コンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０１７年８月９日出願の米国仮出願番号第６２／５４２，８６５号の優先権を主張し、その全体が参照により本願に援用される。

【0002】

関連特許出願である２０１４年３月１３日出願の国際出願第２０１４／００００４１号（参照により全体が本願に援用）には、直接的な測定分析物の濃度ではなく、年齢ドリフトと、疾病状態が非疾病から疾病へ移行する際に生理学的パラメータ（例：年齢、閉経状態等）と共に濃度値がどのようにドリフト又はシフトするかの非線形性とを除去する為に、濃度から計算されるが或る年齢（又は他の生理学的パラメータ）について正規化も行われる「近接スコア」と呼ばれる計算値である関連性分析の為の独立変数を使用して疾病予測を向上させる為の方法が記載されている。

【0003】

本発明は、疾病診断の精度を向上させる為の方法と、測定分析物と二値結果（例：非疾病又は疾病）及び高次結果（例：幾つかの疾病段階のうち一つ）との相関性を含む関連の診断検査とに関する。

【背景技術】

【0004】

三つ以上の独立変数が使用されて（所与の疾病の有無のような）二値結果を相関させる相関方法は、空間的近接性相関方法（クラスタ又は近傍検索方法とも呼ばれる）と回帰方法とウェーブレット方法とを一般的に使用する。疾病予測の場合には、血液又は血清の共通成分が測定され、様々な疾病状態予測の為の独立変数としてこれらの濃度を使用して相関性が求められる。結果が「疾病」と「非疾病」のいずれかである所与の疾病状態の場合には、ロジスティック回帰方法が一般的に使用される。他の技術は、例えば遺伝的アルゴリズムを含む。これらの方法の予測力は、その方法の為に選択される構成分析物に大きく左右される。予測力を有するように思われる多くの分析物及びパラメータが実際には診断及び分析力を向上させないことを熟練者は認識している。

【0005】

回帰方法は、独立変数のトレンドを使用して結果と相関させる。線形方法は線形トレンドに基づくのに対して、ロジスティック回帰は対数トレンドに基づく。生物学的疾病予測では、最も一般的に、結果を判断するのにロジスティック回帰が使用される。

【0006】

グループ空間的近接性方法では、同様の結果のグルーピングの為の変数相関性トポロジーを調査する。空間的近接性方法は、トレンドが連続的ではないがトポロジー局所的反転がトレンドに見られるという利点を有する。だがこの方法は非線形度が高く、生物学的使用では予測性の高いわずかな測定エラーでも非常に局所的な変数結果を生じやすい。加えて、上記の両方法は、小規模で適用される空間的近接性方法と組み合わされると、統合による全回帰方法となり得る。

【0007】

しかしながら、論理的には相関性を持つように思われる幾つかの独立変数は、実際には予測によるトレンドを示さない。故に必要とされるのは、これまでは疾病状態の診断に寄与する有用な情報ではなかった患者固有及び母集団固有の変数を利用することにより診断精度を向上させるアプローチである。

【0008】

単独又は組み合わせにより臨床使用に充分な再現性と予測力で疾病状態を予測できるバイオマーカーを発見する為に多くの研究が行われてきた。この研究は限定的であるか成功していない。高含量タンパク質（ＨＡＰｓ）は、この予測を行うことのできる単一のタンパク質を発見する為に、重点的に研究されている。多数の例が発見されているが、マーカーにより疾病について患者をスクリーニングするのに充分に低いレベルの誤陰性レベルを有するものはない。

【0009】

その結果、このような単一のバイオマーカーは前立腺ガンのＰＳＡ（前立腺特異抗原）を例外として治療モニタリングのみに使用される。この検査は、生体組織検査を示す濃度が偽陰性を低下させるのに適切な程度の傾斜を持ち、その結果、非常に高い偽陽性レベルとすることを必要とする。生体組織検査の必要性を指示された男性の８０％もが実際には前立腺がんについては陰性である。がんの亜型についての幾つかの事例ではＤＮＡマーカーも非常に有効であることが判明しているが、上記のＨＡＰｓと同じ理由からスクリーニングには適していない。

【0010】

多数のタンパク質を使用して、プロテオミクスアプローチも研究されている。この研究は、やはりＨＡＰｓ、又は高レベルのエフェクタータンパク質を中心とする。この研究では、免疫測定法、チップ、及びマス分光測定法のような複合的なタンパク質測定方法が優位にある。非常に初期の研究では、卵巣がんにおいて幾らかの成功例が見られる。しかしながら、これらの方法すべてに関わる問題は、選択されるタンパク質の多くが健康から疾病への進行との強い相関性を有していない（そして例えばマス分光法の場合に典型的であるように、多くが疾病状態との既知の生物学的関係を有していない）。更に、マス分光法は、タンパク質レベルについて分光光度計により全血清サンプルが照会されるという事実により、マス分光法では深刻なオーバーサンプリング問題が生じ、故に相関性アルゴリズムの訓練が困難である。マス分光法の事例では、全血清サンプルは２００を超えるタンパク質と１０，０００のマス分光法ピークを有し得る。

【0011】

診断領域でやはり必要とされているのは、ＨＡＰＳよりも診断目的には有用である低含量タンパク質を利用する技術と共に、低含量バイオマーカーの分析を行う分析技術である。

【0012】

がんを検出してそのがんが深刻であるか休止状態であるかを検出する単純で正確な血清ベース血液検査の為の診断薬が長年研究されている。例えば、現行の検査である前立腺がんの為の前立腺特異抗原（ＰＳＡ）では非常に高い偽陽性率が見られ、正検出偽陰性率は１０人の男性のうち１人と高い。この検査は約５７％の予測力を有する。更に、低悪性度の前立腺がんと診断された男性が、何年間も、又は残りの人生を通して処置を必要としないことがある。この診断は今日、ＰＣａ生体組織検査によってのみ正確に得られる。現行のＰＳＡ検査では、ＰＳＡレベルが約４．０ｎｇ／ｍｌのすべて（９０％、１０人中１人が該当せず）を生体組織検査に送り、約２０％のみがグリソンスコアにも関わらず何らかのＰＣａを有している。その他に、低悪性度ＰＣａの男性が残りの人生で高悪性度に転換するリスクがあり、これを正確に診断する唯一の確実な手法はより多くの生体組織検査を行うことである。モニタリングの為の追加生体組織検査は、コストの為医学界では受け入れ難く、患者にとっては痛みと副作用の為受け入れ難い。故に低悪性度ＰＣａの男性の進行中のモニタリングは、デジタル直腸内診（ＤＲＥ）と時にはＣＴスキャンを伴う定期的なＰＳＡ検査によって実施される。多くの場合、医学的に必要でない時には前立腺の除去という予防処置が行われる。この患者から、ＰＣａではない男性を高悪性度と区別して、後の人生で転換が見られる低悪性度ＰＣａの男性を検出できる新たな血清ベース検査が教示される。加えて、肺がん又は乳がんのような早期固形腫瘍がん又はがんステージを区別できる血液ベース検査が教示される。

【0013】

現行のＰＳＡスクリーニング検査は１９８０年代中頃に承認され、現在は特許期限が切れている。ＯＰＫＯにより「自家調製検査」として提供されている新しい所謂４Ｋスコア検査は規制当局の承認を得ていない。これは、高悪性度ＰＣａの男性を検出してこの症状を低悪性度ＰＣａから分離することを目的としている。概して、高悪性度ＰＣａは７（４＋３）又はそれ以上（８，９，１０）のグリソンスコア（生体組織検査で取得）であると考えられ、一方で低悪性度は７（３＋４）又はそれ以下であると考えられる。すべての悪性度のＰＣａである男性を検出する為のＰＳＡ検査は約５７％の予測力であるか、９０％の感度については、偽陽性率は約８０％（４件の陽性のうち１件が実際には陰性）である。４Ｋスコア検査は約６４％の予測力を有する。故に、１０分の１の偽陰性率については、偽陽性率は約５０％であり、つまり１０人のうち約５人が実際に陰性である。これが現代医学におけるＰＣａ診断検査の現状である。

【発明の概要】

【発明が解決しようとする課題】

【0014】

現在、肺がん及び乳がんのような疾病を簡易血液検査により検出する為の、規制当局の承認を受けた方法はない。更に、これらの疾病は生体組織検査による重症度のみについて判定され得る。活性サイトカインの代用として血清を使用する腫瘍マイクロ環境でこれらのタンパク質を使用して腫瘍ステージを判定する為の追加検査も、我々は提案する。

【課題を解決するための手段】

【0015】

当該技術でのこれら及び他の欠点を解消する為、活性サイトカインを腫瘍マイクロ環境で例として使用して血清がこれらのタンパク質の代用として機能する新たな検査が説明される。

【図面の簡単な説明】

【0016】

添付図と関連して検討すると以下の詳細な説明の参照により本発明及びその付随の利点の多くが良く理解できるので、より完全にこれを認識することが容易になるだろう。

【図1】前立腺がんについてのグリソンスコアによるバイオマーカー濃度変動を表示する図である。

【図2】肺がんについてのグリソンスコアによるバイオマーカー濃度変動を表示する図である。

【図3】乳がんのステージに対応するバイオマーカー濃度の平均的上方制御を表示する図である。

【図4】進行性前立腺がんと非がんについてのＶＥＧＦ受信者動作特性（“ＲＯＣ”）曲線を表示する図である。

【図5】進行性前立腺がんと非がんについてのＴＮＦα ＲＯＣ曲線を表示する図である。

【図6】進行性前立腺がんと非がんについてのＰＳＡＲＯＣ曲線を表示する図である。

【図7】進行性前立腺がんと非がんについてのＩＬ６ＲＯＣ曲線を表示する図である。

【図8】末期肺がんと初期肺がんについてのＩＬ１０ＲＯＣ曲線を表示する図である。

【図9】末期肺がんと初期肺がんについてのＩＬ６ＲＯＣ曲線を表示する図である。

【図10】末期肺がんと初期肺がんについてのＶＥＧＦＲＯＣ曲線を表示する図である。

【図11】開示の診断方法の実施形態による、トポロジー不安定性検査に不合格であって不一致アルゴリズムで修正された二つのサンプルによるブラインド検査結果を示す図である。

【図12】開示の診断方法の実施形態による、乳がんの臨床研究結果を示す図であり、この場合には１０個のバイマーカー平面を使用する訓練事例集合モデルＩについての訓練事例集合がんスコアが示されている。

【図13】開示の診断方法の実施形態による、乳がんの臨床研究結果を示す図であり、この場合には１０５個のバイマーカー平面を使用する訓練事例集合モデルＩＩについての訓練事例集合がんスコアが示されている。

【図14】開示の診断方法の実施形態による臨床研究でのブラインドサンプル実施についての実際の診断結果を示す図である。

【図15】１０分の１のバイマーカー平面を示す図であり、このような平面は、開示の診断方法の実施形態により使用されるバイオマーカーのうち二つの近接性スコアを示す。

【図16】開示の診断方法の実施形態による訓練事例集合データ点を含むバイマーカー平面を示す図である。

【図17】開示の診断方法の実施形態による、訓練事例集合データ点を含まないバイマーカー平面を示す図である。

【図18】開示の診断方法の実施形態による、免疫システム反応についての影響力が低下した陰影エリアを含むバイマーカー平面を示す図である。

【図19】開示の診断方法の実施形態による、トポロジー安定性問題についての影響力が低下した陰影エリアを含むバイマーカー平面を示す図である。

【図20】開示の診断方法の実施形態による、周知の分析物測定不確実性についての影響力が低下した陰影エリアを含むバイマーカー平面を示す図である。

【図21】開示の診断方法の実施形態による、トポロジー不安定性検査に不合格であって不一致アルゴリズムで修正された二つのサンプルを含むブラインド検査結果を示す図である。

【図22】例示的実施形態による、本発明のソフトウェアが辿る一般的な論理経路を示す流れ図である。

【図23】疾病状態又は非疾病状態を有するリスクを判定するブラインドサンプルについての診断スコアを作成する訓練事例集合モデル（又は診断モデル）を構築するプロセスを表す流れ図である。

【図24】サイトカイン、インターロイキン６（ＩＬ６）の場合に典型的な母集団分布を示す。

【図25】バイオマーカー濃度から近接スコア（疑似濃度の一タイプ）への変換を示す図である。

【図26】例示的実施形態による、本発明のソフトウェアの実行に使用されるハードウェアの代表図を示す。

【発明を実施するための形態】

【0017】

上記に限定されることなく、好適な実施形態において、本発明は、多変数（多変量）相関方法を使用して疾病状態を予測する為の方法の予測力及び診断精度を向上させることに関する。これらの方法は、プロテオミクスと、メタボロミクスと、体液及び組織のサンプルに見られる様々なバイオマーカーのレベルの判断を伴う他の技術を含む。

【0018】

発明者により考案され本出願に記される様々な実施形態は、測定されたバイオマーカー分析物の相関性スコアへの影響を調節する方法を特に使用するメタ変数の使用を含む。このようなメタ変数は、免疫システム反応についての専門知識と起こり得る測定エラーについての知識とに基づいて特定され得る。これらの方法は、訓練事例集合モデルの構築と診断対象のブラインドサンプルの何れかに適用され得る。

【0019】

一態様において、本発明は、（ａ）被験者からのブラインドサンプルにおける少なくとも三つの所定の分析物の濃度を判断するステップと、（ｂ）被験者と関連する１つ以上のメタ変数を選択するステップであって、このメタ変数が、母集団の構成員が疾病を有するか有さないかが判明している被験者と関連の母集団において構成員ごとに変化するステップと、（ｃ）一つ以上の母集団分布特性と一つ以上のメタ変数に応じて分析物の濃度を変換して各分析物を表す近接スコアを計算するステップと、（ｄ）疾病を有するか有さないかが判明している母集団の構成員について判断された近接スコアの訓練事例集合モデルと近接スコアを比較するステップと、（ｅ）被験者が疾病を有していることを比較が示しているかどうかを判断するステップとを包含する、疾病を診断する為の方法に関する。所定の分析物の濃度（又はレベル）を判断するステップ（ａ）が、方法の残りのステップとは別の時及び場所で実施されることが考えられる。同様に、方法の他のステップの全体又は一部が別々の時及び場所で実施されてもよい。したがって、本発明者らはステップ（ｂ）～（ｆ）のみを含む方法を自身の発明と考えている。

【0020】

図面に図示されている本発明の好適な実施形態を説明する際に、明瞭性の為特定の用語に頼ることになる。しかしながら、本発明は、こうして選択された特定の語に限定されることを意図しておらず、各々の特定の語が、同様に機能して同様の目的を達成するすべての技術的同等物を含むことが理解されるはずである。本発明の幾つかの好適な実施形態は例示目的で説明され、図には具体的に示されていない他の形で発明が具体化され得ることが理解されるはずである。

【0021】

本出願を目的として、発明の好適な実施形態をより良く説明するのに特定の用語が使用され、これは以下のように定義される。

【0022】

「分析感度」は、ゼロ校正物質を上回る三つの標準偏差として定義される。このレベルを下回る濃度について診断表示は正確とは考えられない。故に、このレベルを下回る臨床関連濃度は正確と考えられず、臨床検査室では診断目的で使用されない。

【0023】

「個人のベースライン分析物測定」は、ある時間にわたって多数回、一人の個人について測定された個々の患者の非疾病状態から疾病状態への移行についての当該のバイオマーカーの測定集合である。非疾病状態についてのベースライン分析物測定は個々の患者が疾病を有していない時に測定され、代わって疾病状態のベースライン分析物測定は個々の患者が疾病を有している時に判断される。これらのベースライン測定は個々の患者に独自であると考えられ、この個々の患者について非疾病から疾病への移行を診断するのに役立ち得る。疾病状態についてのベースライン分析物測定はこの個人における二回目又はより重度の疾病発生についてその疾病を診断するのに有用であり得る。

【0024】

「生物学的サンプル」は、被験者から採取される血液又は血漿のような組織又は体液を意味し、診断において情報価値のある分析物（マーカー又はバイオマーカーとも呼ばれる）の濃度又はレベルがこれから判断され得る。

【0025】

「バイオマーカー」又は「マーカー」は、被験者の生物学的サンプルの生物学的構成要素を意味し、典型的なのは血清タンパク質のような体液で測定されるタンパク質又はメタボロミクス分析物である。例は、サイトカイン、腫瘍マーカー、その他を含む。本発明では、身長、眼の色、地理的因子、環境的因子等を限定的ではなく含む、「バイオマーカー」及び「マーカー」のような他の指示手段も考えられる。概して、このような指示手段は、母集団の中で変化しても測定可能性、判断可能性、又は観察可能性を維持する何らかの測定値又は属性を含む。

【0026】

「ブラインドサンプル」は、所与の疾病についての既知の診断が下されておらず、疾病の有無の予測が望まれる被験者から採取される生物学的サンプルである。

【0027】

「疾病関連機能」は、持続又は悪化する疾病の作用と疾病の進行を止める身体作用のいずれかであるバイオマーカーの特性である。がんの場合には、血液循環増加の維持又は促進を要求することにより腫瘍が身体に作用し、免疫システムは腫瘍を消滅させる炎症誘発作用を高める。これらのバイオマーカーは、疾病関連機能を有していない腫瘍マーカーとは対照的であって、剥離して循環系に入るので測定が可能である。機能的バイオマーカーの例は、免疫システムの作用を引き起こすインターロイキン６、又は腫瘍が分泌して局所的血管増殖を起こすＶＥＧＦであろう。一方で、非機能的なものの例はＣＡ１２５であろう。これは、眼と女性生殖器系に所在する構造タンパク質であり、身体が腫瘍を消滅させる作用も、腫瘍が腫瘍増殖を助ける作用も有していない。

【0028】

「検出限界」（ＬＯＤ）は、「ゼロ」濃度校正物質の値を上回る濃度値の二つの標準偏差として定義される。通常、ゼロ校正物質は、測定の標準偏差の正確な表示を得る為２０以上の複製物で実施される。このレベルを下回る濃度判断は、ゼロ、或いは例えばウイルス又は細菌の検出については存在しないと考えられる。本発明を目的として、サンプルが二つずつの複製物で実施される時には１．５の標準偏差が使用されるが、２０個の複製物の使用が好適である。単一の濃度数を必要とする診断表示は概して、このレベルより下にならない。検出限界レベルの測定は統計的に信頼レベルが９５％である。上記の方法を使用する疾病状態の予測は、単一の濃度に基づくものではなく、濃度ベースのＬＯＤを下回る測定レベルでの測定が可能であることが分かっている。

【0029】

「低含量タンパク質」は、非常に低いレベルで血清中にあるタンパク質である。このレベルの定義は文献に明白に記されていないが、本明細書で使用される際に、このレベルは、血清又は血漿とサンプルが採取される他の体液において約１ピコグラム／ミリリットル未満であろう。

【0030】

「メタ変数」は、分析物及びバイオマーカーの濃度又はレベルを除いて、所与の被験者に特有であるが必ずしもこの被験者に固有又は独自ではない情報を意味する。メタ変数の例は、被験者の年齢と、閉経状態（閉経前、閉経前後、閉経後）と、思春期、体重、患者の居住地の地理的位置又は地域、生物学的サンプルの地理的ソース、体脂肪率、年齢、人種又は人種ミックス、或いは時代のような他の条件及び特性を限定的にではなく含む。

【0031】

「母集団分布」は、所与の被験者母集団の生物学的サンプルでの特定の分析物の濃度範囲を意味する。特殊な「母集団」は、地域、特定の人種、特定の性別から選択される人々を限定的にではなく意味する。そして本出願で説明される使用の為に選択される母集団分布特性では更に、所与の疾病状態を有している（疾病部分母集団）、又は疾病状態を有していない（非疾病部分母集団）と診断された母集団の構成員であるこの大きな定義による母集団の中の二つの別々の部分母集団の使用が考えられる。母集団は、疾病予測が望まれるいかなる集団でもあり得る。また、適切な母集団は、他の疾病進行ステージよりも特定の臨床ステージまで進んだ疾病を有する被験者を含むと考えられる。

【0032】

「母集団分布特性」は、特定の分析物の濃度の平均値又はその中央濃度値又は濃度のダイナミックレンジのようなバイオマーカーの母集団分布において、或いは、非疾病から疾病状態への生物学的移行又は進行を患者が経験する際に疾病の発症及び進行により様々なバイオマーカー及び当該のメタ変数の上方及び下方制御の程度が影響を受ける際に個別ピークとして認識可能なグループに母集団分布がどのように分けられるかについて、判断可能である。

【0033】

「予測力」は、診断分析物又は検査の感度及び特異性の平均、或いは誤予測（偽陰性と偽陽性の両方）の総数をサンプルの総数で割って１から引いたものを意味する。

【0034】

「近接スコア」は、測定されたバイオマーカーの濃度についての代替又は置換値を意味し、実際には診断相関性分析で使用され得る新たな独立変数である。近接スコアは、測定されたバイオマーカー分析物の濃度と関係してこれから計算され、このような分析物は所与の疾病状態についての予測力を有する。国際公開第２０１７／１２７８２２号と国際公開第２０１４／１５８２８７号に開示されているように、近接スコアは、メタ変数で調節される当該の母集団分布特性を使用して計算されて、診断が望まれる所与の患者についての予測バイオマーカーの実際測定濃度を変化させる。「近接スコア」及び「疑似濃度」は同じ定義を有し、互換的に使用され得る。

【0035】

「特異性」は検査の真偽陽性率である。数学的には、検査の偽陽性測定数を測定される真陰性サンプルの総数で割って１から引いたものである。

【0036】

「不一致訓練事例集合モデル」（又は「二次アルゴリズム」）は、一次相関性訓練事例集合モデルとこの二次アルゴリズムの両方でバイマーカー平面の格子の個々の点が不安定にならないように異なる現象学的データ整理方法を使用する二次訓練事例集合モデルである。

【0037】

「空間的近接性相関方法」（或いは近似検索又はクラスタ分析）は、独立変数が直交軸線上に示される独立変数と二値結果との間の相関関係を判断する為の方法である。ブラインドサンプルの予測は、結果が判明しているいわゆる「訓練事例集合」データ点の数（３，４，５又はそれ以上）への近接性に基づく。二値結果スコアリングは、多次元のブラインド点から反対の結果の訓練事例集合点まで計算された総距離に基づく。最短距離から個々のブラインドデータ点のスコアリングが判断される。個々のバイマーカー平面スコアが他の平面のスコアと組み合わされて合計が求められる多次元格子を切り抜いたバイマーカー平面において、この同じ分析が行われ得る。この切り抜きつまり空間内での二次元直交射影の使用は、計算時間を短縮できる。

【0038】

「訓練事例集合」は、既知のバイオマーカー濃度と既知のメタ変数値と既知の診断による患者（統計的有意性を得る為一般的には２００人以上）のグループである。個々のブラインドサンプルをスコアリングするのに使用される空間的近接性分析からのスコア格子点と共に「バイマーカー」平面の軸値「近接スコア」を判断するのに、訓練事例集合が使用される。

【0039】

「訓練事例集合モデル」は、被験者（又は患者）が疾病を有しているか疾病を有していないかの確率についての予測結果に関してブラインドサンプルの判定を可能にする訓練事例集合から構築されるアルゴリズム又はアルゴリズムグループである。そして「訓練事例集合モデル」は、臨床又は診断目的でブラインドサンプルについてのスコアを計算するのに使用される。この目的の為、疾病又は非疾病のパーセント可能性を指す任意の範囲、又は患者に診断を下す医療提供者により優先される他の幾つかの所定インジケータ表示値にわたってスコアが付与される。

【0040】

「受信者動作特性（ＲＯＣ）曲線」は、偽陽性及び偽陰性の率と検出信号の強度との間にトレードオフが生じる際に決定を行うのに使用される信号送信方法の性能を表すグラフィック方法である。このグラフィック表示では、図の縦座標は検査方法の感度を含み、横座標は偽陽性率を示す。疾病トリップ点への上向動作を含むバイオマーカー（又は信号）については、図の原点（０，０）に始まり図の右上（１．０，１．０）までの４５°ヌル線の上に曲線がある。曲線の下の面積は、予測を立てる時にバイオマーカーがどれほど有効であるかを指している。

【0041】

「ＲＯＣ曲線『曲線下面積』（ＡＵＣ）」は、バイオマーカー特性曲線及び横座標の下方の面積である。全く役に立たないバイオマーカーについては、ＡＵＣは０．５であり、その面積は上記の４５°ヌル線の下方にある。完全な検査ではＡＵＣは１．０であり、原点から縦座標上で１００％感度点まで延び、それから右上の１．０，１．０点でＲＯＣ曲線と交わる。

【0042】

「腫瘍マイクロ環境」は、腫瘍間質液（ＴＩＦ）に浸漬され、周囲の血管、免疫細胞、線維芽細胞、骨髄由来の炎症細胞、リンパ球、シグナリング分子、及び細胞外マトリクスを含めて、腫瘍が存在する細胞環境である。

【0043】

「腫瘍マーカー」は、ＴＭＥ又は明白な機能を有していない血液供給物から剥離したタンパク質マーカーであり、腫瘍分泌による腫瘍の増殖と免疫システムによる腫瘍の抑制のいずれかである。

【0044】

近年、がん免疫療法研究では、新たな治療法の開発及び発展の為の理想的なＲ＆Ｄプラットフォームとなり診断内容の潜在的に膨大な蓄積を表す腫瘍マイクロ環境（ＴＭＥ）に、ますます関心が集まっている。腫瘍間質液（ＴＩＦ）に浸漬されるＴＭＥは、周囲の血管、免疫細胞、線維芽細胞、骨髄由来の炎症細胞、リンパ球、シグナリング分子、細胞外マトリクスを含めて、腫瘍が存在する細胞環境である。

【0045】

ＴＩＦは、腫瘍（とＴＭＥ）を血液供給源につなぐ輸送液でもあり、腫瘍を抑圧しようとするのに免疫システムが使用するか又は腫瘍がその増殖を促進する為に出す活性タンパク質の為の「戦場メッセンジャー」であるので、重要である。常に互いとの戦争状態にあるこれらの競合タンパク質又はサイトカインは、低レベルシグナリングタンパク質の幾つかの機能カテゴリ、つまり炎症誘発性及び抗炎症性、抗腫瘍発生性（又は細胞アポトーシス）、血管形成、そして血管新生に含まれる。

【0046】

豊富な診断情報の潜在的な情報源と認識されているが、この流体のサンプリングは非常に困難であって、これを行う為には腫瘍の位置が判明していて、腫瘍がすでに存在しているかどうかが判明していることを意味するので、がんスクリーニングモダリティとしてのＴＩＦ分析の開発は前進していない。更に難題なのは、ＴＭＥ／ＴＩＦの存在と、この知識なしで悪性腫瘍を検出することである。これは、疾病の有無と相関性があると推定され得るプロテオミクスとして知られる多数のタンパク質の分析と結合された血清のような臨床診断の為のより入手可能な液体を必要とする。活性ＴＭＥ（故に腫瘍）の存在を検出する直接的な経路よりも患者の身体症状が入り混じったものであるので、この点についての幾つかの問題が血清に現れる。

【0047】

本開示では、ＴＭＥ及びＴＩＦにおいて活性であるタンパク質についての正確な代用物として血清に存在する特定のサイトカインを分析する為の方法を記す。この方法は、プロテオミクスノイズ抑圧及び多次元（又は空間的）相関性と呼ばれる二つの専用プロセスを含む幾つかのステップを必要とする。我々が説明する方法は、ＴＩＦに見られるタンパク質の作用についての正確な代用物を導出し、こうして生命体、故に腫瘍での活性ＴＭＥの存在を検出するのに有用である。本質的に、この方法は血清中のＴＭＥの痕跡を隔離して、活性腫瘍が存在することを示す活性ＴＭＥの存在（又は不在）を指示する。その他に、この方法は、腫瘍の状態、進行作用の程度、ステージについての有益な情報と共に、免疫システムによる腫瘍抑圧の経過についての有益な情報をもたらすこれらのタンパク質の変調を測定する。

【0048】

当該のバイオマーカー
本開示の当該バイオマーカーは、炎症誘発性（インターロイキン６，ＩＬ６、その他）、抗炎症性（インターロイキン１０，ＩＬ１０、その他）、抗腫瘍性又は殺腫瘍性サイトカイン（腫瘍壊死因子アルファ、ＴＮＦα、その他）、血管形成（インターロイキン８，ＩＬ８、その他）と血管新生サイトカイン（血管内皮増殖因子，ＶＥＧＦ、その他）のような循環増殖因子である。これらは、腫瘍に対する免疫システムの反応又は身体に対する腫瘍の作用という直接関連する機能を備えるサイトカインである。血管新生因子ＶＥＧＦは、増殖腫瘍の塊の中で循環系を増殖させる腫瘍の作用である。抗腫瘍発生因子のＴＮＦαは腫瘍（アポトーシス）を消滅させる免疫システムの作用であり、炎症誘発因子のＩＬ６は、免疫システム全体の作用のメディエータである。抗炎症性のＩＬ１０は、腫瘍により腫瘍間質液へ分泌されて免疫系を抑制する。そして最後に、ＩＬ８のような血管形成因子は、腫瘍により分泌されて周辺組織の血管新生を促進する。

【0049】

概して、がんは、ＩＬ‐６のような因子が上方制御される炎症誘発性の疾病である。しかしながら、本願に記載の三つの例において、末期の腫瘍は抗炎症性サイトカインを腫瘍間質液（故に血液）へ分泌する。この作用は、がんの末期、肺がん及び乳がんではステージ３又は４、前立腺がんでは高いグリソンスコア（グリソン８，９，１０）で発生することが分かっている。この時点で、抗炎症作用は生命体の免疫システムの炎症誘発反応を下方制御する傾向がある。場合によるが、乳がんでは、末期に血管形成反応も抑制される。最後に、腫瘍のサイズが大きくなり、乳がん及び肺がんのステージ３又は４、前立腺がんではグリソンスコア８，９，１０で予想されるように、腫瘍の血管新生作用が増加する。腫瘍マイクロ環境で発生するこれらの作用はすべて、生命体の血清をサンプリングし、参照される国際公報第２０１７／１２７８２２号及び第２０１４／１５８２８７号に記載の方法を適用することにより判別できる。

【0050】

特定のがん症例において、最近の治療研究対象は、処置モダリティの発展の為のいわゆる「腫瘍マイクロ環境」（ＴＭＥ）に高い割合で集中している。ＴＭＥ内で発見される腫瘍間質液（ＴＩＦ）で作用するタンパク質の制御の抑制又は促進は、これらの処置の為の有益な開発ルートであると考えられる。良好なインジケータであることが判明しているＴＩＦ内のタンパク質は、概して、炎症誘発性又は抗炎症性、抗腫瘍発生性（又は細胞アポトーシス）、血管形成、血管新生という五つの機能的サイトカイングループからのものである。

【0051】

これらのタンパク質の活性の測定から、腫瘍活性及び治療効果に対する洞察が得られる。例えば、タンパク質活性を促進又は抑制する処置モダリティが、有効性を判断する為ＴＩＦでモニタリングされ得る。がんが存在することが判明している治療用途では適切であるが、診断目的でのＴＩＦのサンプリングは追究されていない。ＴＩＦの（そしてＴＭＥの）存在は定義上、患者が周知の部位に活性腫瘍を有していることを意味するので、診断ツールとしてのその使用は無意味である。その他に、血清又は尿のような他の体液に存在する時に診断の為これらのタンパク質にアクセスすることは、今日までプロテオミクスノイズ問題の為これらが使用不可能であった為、検討されていなかった。

【0052】

本願では、アクセス容易な代用流体―この場合には血清（尿のような他の流体が可能）―を使用してＴＩＦ内の活性タンパク質を使用するＴＭＥ活性の為の正確な代用物を生成する為のシステム及び方法を説明している。血清は生命体全体の状態が混合されたたもの（「プロテオミクスノイズ」と呼ばれる）であって腫瘍に固有なものではないことに注意すべきである。我々が提案する方法論は、プロテオミクスノイズを除去して患者の症状の正確な判定を可能にする。

【0053】

概して、本願に開示されるシステム及び方法は、１）ＴＭＥ内の状態を示す活性ＴＩＦタンパク質を選択することと、２）血清代用物においてこれらのタンパク質を測定することと、３）プロテオミクスノイズを抑制してタンパク質内のがん関連活性を明確に特定することと、４）多次元マトリクスでこれらのタンパク質の作用を増幅する相関方法を実施することと、５）がんの有無と、存在する場合にその進行ステージを示す為タンパク質活性をスコアリングすることとを必要とする。これは、母集団全体を表して基準として作用する訓練事例集合を作成する為最初に行われ、この訓練事例集合と個々のサンプルが比較されてその状態―疾病状態又は非疾病状態―を判断する。

【0054】

バイオマーカー組み合わせの作用
これらのサイトカインバイオマーカーは高悪性度の前立腺がんでは非常に活性があり、「健康な」男性のレベルと比較すると大きく上方又は下方制御され、故に疾病状態についての非常に良好なインジケータである。肺がん及び乳がんで活性があることにも注意。図１，２，３は腫瘍が進行する際のこれらの作用を示す。図１及び２に示されている非小細胞性の肺がん及び前立腺がんでは、ＩＬ６が末期がん又は高グリソンスコア８，９，１０を下方制御することを注意されたい。両方の症例で、低悪性度の肺がん又は低グリソンスコアの前立腺がんからの移行では、腫瘍により分泌されるインターロイキン１０が増加する結果、ＩＬ６の下方制御が行われることにも注意されたい。腫瘍間質液、故に血液へのＩＬ１０の分泌は、患者の予後が良好でないことと関連していることにも注意。これは通常、末期肺がんが存在していることを意味する。こうして疾病状態の相関性分析におけるＩＬ６とＩＬ１０の組み合わせは、炎症誘発性及び抗炎症性のサイトカインの組み合わせを使用することにより改良される。更に、腫瘍が末期になるか又はより進行するにつれて、血管新生サイトカインは概して上方制御され続けることに注意。

【0055】

これらのバイオマーカーのうち三つは、腫瘍バイオマーカーに共通していない独自のＲＯＣ曲線特性を有する。これらの特性は、或る低レベルのバイオマーカー濃度について１００％の感度でフラット部分を有する。またかなり広い曲線下面積（ＡＵＣ）も有し、この疾病についての非常に良好なバイオマーカーであること、つまり高悪性度前立腺がん（ＰＣａ）と非ＰＣａを示している。そのうち一つは、［０，０］からの縦座標を上行する直線状垂直区分を有し、この信号範囲のサンプルがＰＣａのゼロ偽陽性率を有するはずであることを示している。

【0056】

科学文献では、本明細書で言及される最適なバイオマーカーの幾つかについての公表は限定的である。そして高悪性度ＰＣａと一般的な母集団つまりＰＣａでない患者との検出に関しては何も見られない。ＶＥＧＦの場合には、バイオマーカーの上方制御を示す文献があるが、がんのステージ、とりわけグリソンスコアについては何も記されていない。文献のほとんどは、すでにＰＣａと診断された男性の処置についての予後因子としてのＶＥＧＦの使用に限定されている。ＴＮＦαも、腫瘍のステージ、とりわけグリソンスコアに関するバイオマーカー作用の相違に関係していない。インターロイキン６についての科学的調査でも同じ情報が得られる。事実、低悪性度ＰＣａでは、バイオマーカーの若干の上方制御が文献に指摘されている。低悪性度ＰＣａでは若干の下方制御が見られるので我々の測定はこれを裏付けるものではないが、高グリソンスコアのＰＣａでは非常に強い下方制御が見られ、このサイトカインは他と共に高悪性度ＰＣａの存在を示す強力なインジケータである。文献の多くは、ＰＣａの男性での予後因子とＰＣａ細胞株からのタンパク質の生体外発現としてこれらのバイオマーカーを使用することと、処置目的での発現（特にＶＥＧＦ）の抑制の為の方法を調べることとを必要とする。

【0057】

前立腺がんのＲＯＣ曲線
ＶＥＧＦ
進行性のＶＥＧＦ（グリソンスコア７（４＋３），８，９，１０）のＲＯＣ曲線が図４に示されている。感度が１００％である上部でのＲＯＣの大きなフラット部分に注意すること。このレベルの感度又は約５０ｐｇ／ｍｌ未満のＶＥＧＦの濃度レベルは高悪性度ＰＣａではなく、何も検出されなかった。この疾病／非疾病についてのこのバイオマーカーのＡＵＣは０．８７である。加えて、５０ｐｇ／ｍｌレベルを下回る非偽陽性の独自形状により、約５０ｐｇ／ｍｌを下回る濃度レベルにはＰＣａが全く見られない為、高悪性度「ＰＣａ」と「非ＰＣａ」のバイオマーカーについての非常に良好な候補となる。

【0058】

ＴＮＦα
図５に示されているように、ＴＮＦαについてのコメントは、進行性（グリソンスコア７（４＋３），８，９，１０）のＲＯＣ曲線の特性に関するものと同じである。この場合、ＡＵＣは０．８５とやはり高く、トリップ点は約６．５ｐｇ／ｍｌを下回る非偽陰性結果と同じである。ＴＮＦαは、約９．８５ｐｇ／ｍｌを上回るサンプルについてのゼロ偽陽性率（横座標）である曲線の部分も示している。この領域では偽陽性結果は生じない。

【0059】

ＰＳＡ
図６に示されているようにＰＳＡについてのコメントは、進行性（グリソンスコア７（４＋３），８，９，１０）についてのＲＯＣ曲線の特徴と同じである。この場合、ＡＵＣは０．８５とやはり高く、トリップ点は約２ｎｇ／ｍｌを下回る非偽陰性結果と同じである。ＰＣａのすべてのグリソンスコアに共通のＰＳＡ分析物についてのＲＯＣ曲線が参照の為緑色で示されている（「全ＰＣａ」と図示）。

【0060】

ＩＬ６
対照的に、ＩＬ６は、進行性（グリソンスコア７（４＋３），８，９，１０）での強い下方制御を示し、図７に示されているように、ＡＵＣは、一般的な母集団においてＰＣａの検出の為の現在のＰＳＡの約２倍である（この下方制御を説明するには曲線が逆転されなければならない）。高悪性度ＰＣａはおそらく免疫システムの抑制において有効であるという推論が成り立つだろうが、それはこの議論の論点ではない。事実は、このバイオマーカーが強い下方制御を示しているということである。限定的な文献では一般的なＰＣａでの若干の上方制御を指摘している。すべてのグリソンスコアのＰＣａについての我々の測定は、若干の下方制御を示している。それにもかかわらず、高いグリソンスコアでは、サイトカインが強い下方制御を示す。ＰＣａの母集団全体は約８０％が低悪性度であり、その為ＰＣａのサンプリング時には、低悪性度がコホートの特性を支配するだろう。この下方制御は、腫瘍が進行性グリソンスコア７（４＋３）かそれ以上まで進行した時に抗炎症性サイトカイン（ＩＬ１０）の分泌により引き起こされる可能性がある。

【0061】

肺がんについてのＲＯＣ曲線
ＩＬ１０
図８は、低悪性度（ステージ１及び２）を末期のステージ３，４の非小細胞肺がんから分離する場合のインターロイキン１０についてのＲＯＣ曲線を示す。初期（１及び２）から末期（３及び４）への移行で上方制御されることに注意。これはインターロイキン６の下方制御に対応し、腫瘍マイクロ環境へ、続いて血流へＩＬ１０を分泌する腫瘍の抗炎症性作用により引き起こされる。

【0062】

ＩＬ６
やはり初期（１及び２）と末期（３及び４）の非小細胞肺がんの場合についてのＩＬ６のＲＯＣ曲線が、図９に示されている。図９から実証されるように、ＩＬ６のこの作用は腫瘍の抗炎症作用により抑制されている。

【0063】

ＶＥＧＦ
ＶＥＧＦのＲＯＣ曲線が図１０に示されており、腫瘍が増殖して末期まで進行する際に他のがんで見られる血管新生因子の上方制御が実証されている。

【0064】

進行性又は末期と非進行性又は初期のがんについての検査
高悪性度グリソンスコア７（４＋３），８，９，１０の高悪性度ＰＣａへの移行について、低悪性度グリソンスコア５，６，７（３＋４）の前立腺がんの男性をモニタリングする為の非常に簡単なプロテオミクスアルゴリズムを開発する為に、これらのバイオマーカーが組み合わされ得る。また、これらのバイオマーカーは初期がんのステージ１又は２をステージ３又は４から区別することができる。ＩＬ６及びＩＬ１０と反対の作用との組み合わせは（ロジスティック回帰のような単純相関方法により）８０％の予測力を生じる。プロテオミクスノイズ抑制と空間的近接性相関方法との追加により９０％の予測力を生じる。バイオマーカーパネルにＶＥＧＦの作用を追加すると、９５％以上まで予測力を向上させる。

【0065】

進行性前立腺がん男性と非がん男性についての検査
実際、ＶＥＧＦそのものにより、７６％の予測力と１００％の感度と７６％の特異性（２４％の偽陽性率）の検査が得られる。この簡易モデルは単に、ＲＯＣ曲線から除かれる濃度範囲の非ＰＣａを除外して、ＲＯＣ曲線に含まれるこれらのゾーンのＰＣａを再び含有する。そして、単純なトリップ点カウントと、除外又は含有基準内ではない各バイオマーカーの陽性及び陰性のスコアリングのカウントとを使用する。事前に除外又は含有されないものについてカウントは４のうちの３を超えなければならない。この簡易モデルから、１００の高グリソンスコア（７（４＋３）以上と定義）ＰＣａと１００の非ＰＣａサンプルによる代表サンプル集合が１００％得られる。ＶＥＧＦ、ＩＬ６、ＴＮＦα、ＰＳＡの組み合わせにより、９０％の予測力が生じる。加えてこの検査は、ＰＳＡが上昇したがサイトカインは上昇していない男性について「非がん」を予測する。これらの男性は、良性の前立腺肥大又は別の非悪性前立腺症状を有しており、前立腺がんについての現行のＰＳＡスクリーニング検査の多数の偽陽性結果集団を構成する。これらのサイトカインを取り入れた検査は、この偽陽性問題を解決する。

【0066】

がんステージの予測
モスクワのゲルツェン研究所(Gertsen Institute)が監修した乳がん研究から得られるデータは、後述の機器及び試薬を使用して乳がんのステージを高精度で予測することが可能であった。１８９個の乳房サンプルがステージ情報（０から４）と共に取得された。測定は、腫瘍マーカーＰＳＡと上記の四つのサイトカイン、炎症誘発性（ＩＬ６）、抗腫瘍発生性（ＴＮＦα）、血管形成（ＩＬ８）、血管新生（ＶＥＧＦ）についてであった。この場合、目標は、生体組織検査からの同様のステージ分類情報について各サンプルをスコアリングすることであった。相関方法は、性質上すべて二値であって、幾つかの操作がないと四つの異なる結果をスコアリングできない。故にステージグループがすべてのステージグループを表す二値グループと結合された。１プラス２，３，４、２プラス１，３，４、３プラス１，２，４、４プラス１，２，３。年齢正規化と、ノイズ抑制と、国際公開第２０１７／１２７８２２号及び国際公開第２０１４／１５８２８７号に記載の空間的近接性相関方法とを使用して、四つのグループすべてがモデリング及びスコアリングされた。そして、各サンプルの個々のグループスコアを使用して、そのグループ（１又は１／３）への各々の寄与度に基づく重み付けを追加して、個々のサンプルのスコアが計算された。このモデルは９９％の精度を持つ。

【0067】

本明細書では、疾病を診断する為の従来のプロテオミクス相関方法の予測力を向上させる為の幾つかの方法が説明されている。これらは、１）相関性についてのメタ変数と近接スコアとを使用することと、２）訓練事例集合モデルでのバイマーカー平面の影響を調節する為トポロジー安定性と分析物測定特性についての特殊な知識を使用することを含む。また、不一致訓練事例集合モデルを使用して特定の訓練事例集合モデルに独自のブラインドサンプル安定性の問題を発見及び修正する為の方法が記載される。付加的に、所与の疾病状態についての訓練事例集合モデルと部分的に酷似している対応の非疾病条件を発見及び修正する為の方法が記載される。これらの方法すべては補完的であって共同で使用され得る。例えば、非安定性の可能性が高いエリアについての訓練事例集合モデルを調節しても、ブラインドサンプル予測計算からこの問題を完全に排除することはできず、故に予測力の向上の為に両方の方法が使用され得る。発明者らは、これらの方法を組み合わせると、９５％を上回る予測力が得られ、下の例１に記される乳がん研究では９８％を超える予測力（感度１００％、特異性９７．５％）が得られることを発見した。

【0068】

例１：乳がん血液検査を判定する臨床研究
オートレイシーズ(OTraces) ＢＣセラ(Sera) Ｄｘ検査キットとオートレイシーズＣＤｘ免疫化学計器システム（ｗｗｗ．ｏｔｒａｃｅｓ．ｃｏｍ）の性能が、乳がんの存在のリスクを判定する実験で評価された。検査キットは５個の非常に低レベルのサイトカインと組織マーカーの濃度を測定し、乳がんのリスクを判定する為スコアＣＳｌ及びＣＳｑを計算する為上記のように開発された訓練事例集合モデルを使用する。測定されるタンパク質はＩＬ‐６，ＩＬ‐８，ＶＥＧＦ，ＴＮＦα，ＰＳＡであった。実験は、生体組織検査により診断された乳がんの症例のうちの５０％と、非疾病（又はこの場合には乳がんではない）と推定的に考えられる患者からの５０％に大まかに分割される約３００個の患者サンプルの測定から成る。このグループの内、２００個のサンプルの生体組織検査結果は、非疾病の５０％と乳がん疾病を有する５０％とに正確に分割され、各グループは更に指定の年齢グルーピングに細分された。

【0069】

サンプル分析結果は、疾病状態を予測する訓練事例集合モデルを開発するのに使用された。そして残りのサンプル（約１１０個）が訓練事例集合モデルを通してブラインドサンプルとして処理されてがんリスク数値スコアが結果として求められ、これらのスコアがホスト臨床センターへ開示される。これらのブラインドサンプルスコアは続いて、結果の臨床精度を判定する為臨床センターにより分析された。

【0070】

二つの診断モデルがこの実験の為に開発され、本明細書では、アルゴリズムＩ及びアルゴリズムＩＩと呼ばれる。両方のアルゴリズムに空間的近接性分析方法が使用された。被験者の年齢が独立変数としてではなくメタ変数として使用され、測定された濃度は、本明細書では近接スコアと呼ばれる新たな独立変数に変換され、相関性分析ではこれが直接的に使用された。アルゴリズムＩとアルゴリズムＩＩの相違は、相関に使用される新たな独立変数の数である。アルゴリズムＩは１０次元クラスタ空間で５個の近接スコア変数を使用する。アルゴリズムＩの下限は二次元であり、特定の方法ではなく、相関が実施されるという事実に基づく。相関は本来、一つ超の次元を必要とする。アルゴリズムＩの上限は理論的には無限であるが、実際的には計算時間及び出力により制限される。クラスタ空間は射影を介して人の眼で視認できるか、この多次元空間を切り取ると二次元バイマーカー平面を見ることができる。アルゴリズムＩの例示的実施形態ではこのような平面が１０個ある。

【0071】

アルゴリズムＩＩは１０倍多く作られた独立変数を使用するので、約１００個のバイマーカー平面が存在する。一般的母集団を妥当な近似度でモデリングするには訓練事例集合モデルでは２００個のサンプルで充分であると予想される。二次又は不一致訓練事例集合モデルは、同じ２００個のサンプルの訓練事例データ集合から展開された。訓練事例集合モデルは、本明細書で結果を説明するのに使用される一次スコアリング方法である。不安定であると考えられる一次訓練事例集合モデル計算によるがんスコアを処理するのに、不一致訓練事例集合モデルが使用される。すなわち、トポロジー不安定性のエリアに位置するスコアである。不一致訓練事例集合モデルはブラインドサンプルではいくらか正確性が低いが、それでも一次訓練事例集合モデルを処理することで予測力を向上させられる。

【0072】

上記の空間的近接性分析方法は、計算結果を求めるのに使用される独立変数の高い非線形トレンドに対応可能であるという点で、ロジスティック回帰に対して著しい利点を有している。結果は疾病又は非疾病（この場合にはがん又は非がん）であり、訓練事例集合モデル計算の近接スコアに基づく。この方法の短所は、非常に急なトポロジー勾配と関連する非線形性の高いエリアである。故に、未知の（又はブラインド）サンプルが急なピーク又は深く尖った谷に位置し、これが計算による近接スコアの細かいエラーを増幅させるという影響が見られる。我々は、proprietary安定性検査で計算されたスコアの安定性を判定し、それから安定性を示した例についてアルゴリズムＩの調停にアルゴリズムＩＩを使用した。

【0073】

図１１，１２，１３は、アルゴリズムＩの訓練事例集合結果を示す。モデルそのものは、空間的近接性方法により非疾病と疾病（ここでは乳がん）について各々がスコアリングされた４０，０００個のトポロジー点による１０個のバイマーカー平面から成る。非がんとがんの二つの集合を分離するモデルの能力が、これらの図に示されている。モデルは、５０％‐５０％に非常に近いか好ましくは正確に５０％‐５０％であるか、二つの結果状態の一つに非常に近いものから構築されなければならない。また、この方法は変換メタ変数として年齢を使用する。訓練事例集合サンプルは、当該のすべての年齢グループに分散されたサンプルを有していた。アルゴリズムＩについてのモデル（図１２）は、１００人の健康な女性と９８人の乳がんの女性で構築されていた。図１２の集計表は数値結果を示し、Ｎ＝１９８がサンプルの数である。ＣＩは表記の正しいサンプルでＦＩは表記の間違ったサンプルであり、４個のサンプルが不確定と見なされた。一次訓練事例集合モデルの使用の結果得られる４個の不確定サンプルを区別する為、二次訓練事例集合モデルが展開された。このモデルは不一致訓練事例集合モデルである。この二次モデルは同じ訓練事例集合データを一次として使用する。図１３は、不一致訓練事例集合モデル計算の結果を示す。アルゴリズムＩＩは、６０を超える分離点を含む１００％の分離を示す。

【0074】

乳がん研究におけるブラインドサンプル検査結果
図１４は、臨床研究で評価されるブラインドサンプルの結果を示す。この結果は１００％の感度と９７．５％の特異性を示す。臨床研究センターの腫瘍専門医は、乳がん陽性サンプルがすべて正確に識別されるように診断移行値を設定した。こうして二つの非疾病サンプルが、がん陽性とされた。陽性と判断されたサンプルはすべて次の診断ステップの撮像マンモグラフィを受けるので、これは臨床的に正しい。多くの女性は、医療機器を備えた施設の近隣に住んでいないので撮像マンモグラフィを受けていない。しかしながら、臨床検査室の遠隔地で血液が採取されて大都市の検査室へ冷蔵で輸送され得る。

【0075】

例２：診断精度を向上させる為のメタ変数「年齢」の使用

【0076】

表１（下記）は、８６８個の被験者サンプルによる乳がんの臨床研究の集計結果を示す。

【0077】

【表1】

表１：乳がんの診断精度の概要

【0078】

表２（以下）は、相関性計算の為の様々な方法の比較を示す。標準的な方法であるロジスティック回帰では、わずか８２％の予測力を示す。これに改良が加えられた標準的な空間的近接性分析は線形形式では約８８％、対数形式では９０％の予測力が得られた。メタ変数と重み付けアプローチ、トポロジー安定性調節、免疫システム反応グルーピング、及び分析性能の為の重み付け調節を使用する本明細書に記載の方法では―ブラインドサンプルの不安定性検査及び不一致アルゴリズム修正と結合されると―、９７％より高い予測力が得られた。

【0079】

【表2】

表２：疾病相関性計算の予測力の比較

【0080】

例３：卵巣がん研究における診断精度を向上させる為のメタ変数「年齢」の使用

【0081】

表３（以下）は、本願の実施形態に記載のメタ変数方法を使用して、卵巣がんを持つか卵巣がんを有していない１０７人の女性の研究結果を示す。この研究は、本明細書に記載される予測力の向上のすべてを使用しているわけではないが、約９５％と比較的優れた予測力を達成した。

【0082】

【表3】

表３：卵巣がん診断精度の概要

【0083】

例４：前立腺がんの診断精度を向上させる為のメタ変数「年齢」の使用
前立腺がん

【0084】

表４（以下）は、本明細書に記載のメタ変数方法を使用して前立腺がんを有するか良性前立腺肥大（ＢＰＨ）のいずれかである２５９人の男性の研究結果を示す。この研究も本願に記載の予測力改良のすべてを使用しているわけではないが、それでも約９４％と比較的優れた予測力を達成した。ＢＰＨは、現行の前立腺がんＰＳＡ検査で偽陽性結果を生じる、最も一般的な症状であることに注意。従来の前立腺がん診断においてＢＰＨの男性は５件のうち約４件が陽性であり、その結果、大部分の前立腺がんの生体組織検査が陰性になる。メタ変数方法は、上記のようにこれらの間違った診断を修正することができる。

【0085】

【表4】

表４：前立腺がんの診断精度の概要

【0086】

（それぞれ卵巣がん及び前立腺がんについての）例３及び４における上記の結果では、メタ変数又は影響調節方法（ＬＯＤ，部分母集団グルーピング及び不安定性）もブラインドサンプル安定性方法も使用しなかった。

【0087】

予測力を更に向上させる為、これらの年齢及びグルーピング調節による濃度は、これらを正規化して、空間的近接性分析についての多次元グルーピングによるマーカープロットにおけるクラスタリングの間隔バイアス（空間バイアスとしても知られる）を減少又は除去するように調節される。例えば、ＩＬ６及びＶＥＧＦについてのバイマーカー平面が見られる図１５を参照すること。これらの平面のうち１０個が５個のバイオマーカーによる乳がん検査パネルの為のものである。この場合に、計算による近接性スコア値が正規化及びシフトされてゼロと２０の間の任意の値が得られ、濃度が大きく上方制御された異常値は高圧縮される。

【0088】

年齢／グルーピング分析による濃度にわたって同じ正規化間隔での多次元マーカー平面のバイマーカー射影の各々が、年齢（又は全母集団）調節によるサブグルーピングと共に年齢調節による手段に対して、圧縮及び正規化される。

【0089】

調節可能なバイマーカー平面影響レベルを使用する訓練事例集合モデルの予測力の向上
一般的に、バイマーカー平面は、非疾病と疾病についての二値数（例えば＋１と－１）でスコアリングされる。本願に記載の近接スコアは、これら二つの二値数の影響レベルを選択的に調節することにより予測力のさらなる改良を受け得る。以下の方法は訓練事例集合モデルで開発され、モデルに固定される。

【0090】

図１６及び１７は、５個のマーカー、ＩＬ‐６，ＩＬ‐８，ＴＮＦα，ＶＥＧＦ，ＰＳＡを使用して、疾病状態、この場合は乳がんの存在を予測するのに使用される５個のバイオマーカーの場合についての一つのバイマーカー平面の射影を示す。図１６は、空間的近接性分析方法により図面上の格子点をスコアリングするのに使用されるデータを含む訓練事例集合モデルを示す。図１７は、データを含まない訓練事例集合モデルを示す。これは訓練事例集合モデルを構成する。４０，０００個の格子点の各々がスコアリングされて、格子上のどこに位置するかによりブラインドサンプルがスコアリングされるので、モデルを作成するのに使用される訓練事例集合データは必要ない。トポロジーではがんの陽性を赤色で示し、青色はがんの陰性である。この場合に全スコアを計算する際には、非疾病格子点は＋１に設定され、疾病（がん）格子点は－１に設定される。この５バイオマーカー例での各バイマーカーが５直交空間で分析され、そのうち図１６は二次元の射影の一つである。この図には、免疫システム反応の様々なサブグルーピングのトポロジーが示されている。この場合、すべての格子スポット（この場合には２０００×２０００つまり４０，０００）が通常の手法でスコアリングされ、割り当てられる値は疾病状態陽性（乳がん）については－１で非疾病は＋１である。このバイマーカー平面は、近接スコア間隔により、また上記のようにメタ変数の年齢について正規化される。

【0091】

図１８は、同じバイマーカーモデルと、加えてグレイエリア内での免疫反応グルーピング（図２４参照）とを示す。各グレイブロックエリアは患者が非疾病であるか疾病である確率にいくらか異なる影響を与えるという事実を反映するように、グレイエリアの影響が調節されている。この調節は、訓練事例集合の確認による人的推定により、又は精密なコンピュータ多変数増分分析により行われ得る。これらの調節は訓練事例集合モデルを向上させる。二つの結果について二つの別々のバイマーカー平面が作成され、これは疾病と非疾病の状態である。この場合、免疫反応グループＩＶのブラインドデータ点は疾病である可能性がはるかに高く、その影響は（例えば－１から－１．１へスコアを変更することにより）若干増大する（絶対値）。この増分の実際の量は好ましくは、コンピュータ分析により、また可能であれば精密なマニュアル方法により判断されるだろう。この方法は、空間的近接性（疑似濃度としても知られる）相関性分析方法についても実施可能だが、他の手段が使用されても同じ効果が得られただろう。疾病の関連性に関する影響に重み付けするこれらの方法は、約１％の予測力の改良を果たす。９５％を上回る予測力ではこれは非常に重要である。

【0092】

図１９は、非線形で急速に変化する疾病と非疾病のトポロジーの複合エリアで丸く囲まれたグレイエリアを含む同じバイマーカー平面を再び示す。このようなエリアは、射影ノイズ（つまり＋／－１０％）の検査ブラインドサンプル値をモデルへ挿入してから測定によるノイズ量を導入することにより識別され得る。これらのブラインド点のほとんどは疾病（ここではがん）スコアでは実質的に変化しないだろう。しかしながら、この種のノイズ調節の後で非疾病から疾病スコアまで劇的に変化する幾つかの格子点が見られる。これらは、バイマーカー平面の大半又はすべてが、多次元のバイマーカー平面全体と重複する急速変化トポロジーを有するエリアである。これらのエリアでの影響を慎重に軽減することにより、近傍の境界で結果の変化を伴わずにノイズデータが広い平面に位置する少数の関連バイマーカー平面で重み付けが増大し得る。この方法は間違った予測を修正することが分かっている。上記の場合に、赤色のがんエリアの影響は例えば－１．０から－０．９へのシフトダウン（絶対値）であろう。或いは青色の非疾病エリアは＋１．０から－０．９へシフトダウンするだろう。最適シフトのレベルは精密なコンピュータ分析により判断され得る。

【0093】

分析ノイズは相関性分析の精度に影響し得る。このノイズは、分析物の検出限界以下で特に問題となる。これらの不安定ゾーンにある個々のバイオマーカーについての測定点の影響を軽減することによっても、このノイズが解消され得る。図２０もやはり、乳がんパネルについてのＰＳＡ及びＩＬ‐６のバイマーカー平面を示す。図の左下にあるグレイの矩形エリア内の面積はすべて、分析物の従来の検定物検出限界（ＬＯＤ）を下回っている。従来、ＬＯＤは、２０個のゼロ校正物質の二つの標準偏差に２０個のゼロ校正物質の値の平均を加えたものと定義される。このレベルの値の統計的確実性は、二つの標準偏差内では９５％であり、言うまでもないが測定サンプルがＬＯＤより低くなると測定確実性が確実に下がる。データはやはり有益な情報を有しているが、影響の少ない分析に適用されるべきである。この場合、グレイエリア内のブラインドサンプルデータ点への影響は、グレイエリア内の訓練事例集合モデルの格子点について例えば＋１．０から－０．９まで軽減される。これは、他のバイマーカー平面で検出限界を上回るこの検査サンプルについてのデータ点の影響を増大させる。上記の方法は補完的であり、相互協力的に実行され得る。

【0094】

不安定性についてブラインドサンプルを検査することにより予測力を向上させる為の方法
訓練事例集合モデルが完成して固定されると、ブラインド患者サンプルについてがんスコアを計算するのに使用される。発明者らはがんスコアを作成する為の二つの好適な方法を使用する。線形方法（ＣＳｌ）と呼ばれる第一の方法では、トポロジー位置スコア（＋１又は－１）にこのバイマーカー平面の予測力を掛ける。そしてこれらが加算、増減、シフトされて、０から２００のスコアが得られる。ｑスコア（ＣＳｑ）と呼ばれる第二のスコアは、同じこれらの値の二乗の和の平方根を使用することにより計算される。この第二の方法は、個々のバイマーカースコアの差を強調するものであって、医師の最終診断全般に有益である。

【0095】

空間的近接性相関方法の非常に非線形的な性質によりトポロジー不安定性がバイマーカー平面に残り、完全に解消されることはない。本発明の他の態様によれば、安定性検査と射影ノイズを伴う技術とがブラインドデータ集合に適用され得る。そしてがんスコアを調停又は修正するのに不一致訓練事例集合モデルが使用され得る。本発明のこの態様では、各ブラインド患者データ集合について一定レベルのノイズ（例えばプラス又はマイナス１０％）が導入される。ブラインドサンプル集合が約１００人の患者である場合には、実際の訓練事例集合モデルコンピュータ実施は、各々が３倍された（生データにノイズ及びマイナスノイズが加えられた）３００個のサンプルによる集合についてのものになるだろう。その結果得られる３倍のデータ集合が安定性について検査される（ａは－１０％、ｂは＋１０％、ｃ点は生データ）。表５（以下）は、臨床研究からのデータについての安定性検査の結果を示す。がんスコアでは三つのサンプルが非常に高い不安定性を示すことに注意。サンプル１３８，２０７，３４，２９はすべて非常に高い性能指数を示している。性能指数（低いほど良い）は、スコアシフトの程度と、特に、健康体とがん又はその逆を予測する為のスコアがシフトするかどうかの両方を含むべきである。ブライドサンプルからのこれらのデータ集合では、診断予測が間違っているリスクが高い。

【0096】

【表5-1】

表５－１：トポロジー不安定性検査

【表5-2】

表５－２：トポロジー不安定性検査

【0097】

不一致訓練事例集合モデルは、性能ノイズ検査に不合格であった「リスク」患者サンプルデータ集合を処理するのに使用され得る。微小摂動がスコアに大きな揺れをもたらすようにバイマーカー平面のすべてではないとしても大部分の非常に急な勾配にブラインドサンプルデータ点が位置するという事実により生じる極端なトポロジー不安定性と結合されたランダム又はシステマティックな不可避の測定ノイズの為に、これらの点はリスクを持つ。表５は、ノイズが導入されたサンプルを示す。各サンプルは三つの値、つまり１）プラスノイズと、２）マイナスノイズと、３）ノイズを含まない生データとを有する。これらのサンプルは、＋－１０％のノイズの導入により疾病から非疾病へ、そしてまた非疾病から疾病へ変化するがんスコアを示す。この場合に、これらのサンプルデータは不安定であると判断される。不安定性のレベルは正確に規定されず、様々なレベルのノイズ導入について調節が行われ得る。この場合、これらは＋－１０％のノイズと２０００より大きい安定性スコアで修正される（安定性スコアとがんスコアとは意味の異なる別々の二つの数であることに注意）。

【0098】

測定ノイズはこの不一致な第２アルゴリズム（アルゴリズムＩＩ）で調停され得る。調停に使用される不一致アルゴリズムは、正しい点であるという見込みを向上させるので、主なアルゴリズムよりも予測力が若干低い場合でも、これらの「リスク」患者サンプル集合を修正するのに使用され得る。この場合には二つが修正された（図２１参照）。サンプル１３８は非疾病スコアが８５で、不一致アルゴリズムで１９５に修正され（この点はアルゴリズムＩでは安定していた）、サンプル３４はスコアが１０２（線形方法）で、やはりアルゴリズムＩＩで１９８に修正された。サンプル２９，２０７は不一致アルゴリズムにより変更されなかった。

【0099】

不一致訓練事例集合モデル（アルゴリズムＩＩ）は１０５個のバイマーカー平面を使用し、これらの同じサンプルがアルゴリズムＩＩの安定性検査のような安定性を示しているという点で一次訓練事例集合モデル（アルゴリズムＩ）と不一致である。不一致訓練事例集合モデルの検査は、一次訓練事例集合モデルと全く同じように行われる。これらのサンプルスコアを計算するのにロジスティック回帰方法も使用され得ることに注意。アルゴリズムＩＩは高い予測力を有するので使用された。不安定性を伴わずにおそらく正しい結果を有する限りは、主アルゴリズムよりも予測力が低い（好ましくは少なくとも５０％の予測力だが）場合でも、処理訓練事例集合モデルが使用され得る。ノイズ検査に不合格であった当該のブラインドサンプルについて修正は顕著であることに注意。これらのサンプルは実際にはすべて高スコアのがんであった。これらのサンプルについての１０個のバイマーカー平面のうち８個が非常に高不安定度の格子点を持つトポロジー上にあった。故にスコアにはリスクがあり、実際に不正確であった（一つは間違っており、一つは１００／１２０のスコアで不確定であった）。この場合に、予測力を９７％から９８％へ向上させる為一つのサンプルが修正され、非常に高いエラー減少（５０％）が見られた。一つのサンプルは、不確定であったががんに変化し、やはり修正された。

【0100】

一次疾病分析の結果状態の一つと部分的に酷似する単独の状態を除外することにより疾病状態修正二値結果予測力を向上させる為の方法
空間的近接性分析は通例、三つ以上の独立変数、たいていは患者の血清タンパク質濃度を使用する。相関アルゴリズムは非疾病又は疾病の二値結果のみに作用するが、実際の結果が二つの二値状態である確率に一層密接に関係する連続スコアリングが行われる。場合によっては、使用されるバイオマーカーの母集団分布内で疾病状態と部分的に酷似した、名目上は非疾病と分類される他の状態が見られる。これらの場合の幾つかでは、この非疾病「酷似」状態は、相関分析の偽陽性結果を生じる。この種の偽陽性結果を解決する方法は、非疾病又は疾病分析とは全く別の付加的で新たな相関分析を作り出すことである。この新たな相関分析は好ましくは非疾病又は疾病の相関性について全く同じバイオマーカー測定データを使用するか、異なるバイオマーカーの幾つか又は全てを使用する。この新たな相関分析は「非疾病酷似」又は「疾病」の結果を提供するか、少なくとも、患者の実情についての判断が行われることを可能にするスコアを付ける。非疾病酷似又は疾病相関性での非常に低いか高いスコアと結合された非疾病又は疾病分析の為の不確定又は近似移行スコアは、開業医が疾病状態判断を向上させて偽陽性スコアを低下させるのに役立ち得る。

【0101】

非疾病状態が疾病状態に酷似しているこの状況の例は、非悪性症状の良性前立腺肥大（ＢＰＨ）である。この症状は通常、前立腺がんの診断に使用される少なくとも一つのバイオマーカーが高いレベルを示す。例えば、バイオマーカーである前立腺特異抗原（ＰＳＡ）は、ＢＨＰと前立腺の両方の男性で上昇する。表４は、この付加的な相関分析方法がＢＨＰと前立腺がんの男性を区別し、同様に同じバイオマーカーを使用するが異なる訓練事例集合モデルでは、非疾病状態と推定される男性と疾病状態で前立腺がんが確認された男性とを区別できることを示している。男性のうち僅かな割合で、偽陽性の結果、非疾病とがんの訓練事例集合モデルが生じるが、これはＢＨＰとがんの訓練事例集合モデルにより区別される。これらの場合に、一方は推定非疾病とがん、一方はＢＨＰとがんの二つのスコアは、医師又は他の医療関係者が次の診断ステップを決定するのに役立つ。例えば、両方のモデルについての０から２００の総スコアリング（ＣＳｌとＣＳｑのいずれか）では、「非前立腺がん又は前立腺がん」についての１１０のスコアは、がん陽性には低いスコアであるが、ＢＨＰ又はがんについての３０の第２スコアを検討すると、がんではなくＢＰＨである可能性が高いとの指示が開業医に与えられる。開業医はこの追加情報を他の医療情報及び患者病歴と共に使用して、次の診断ステップを決定するだろう。

【0102】

各方法の詳細な記述
分析ステップ／アルゴリズム
本発明による分析モデルを開発する為のプロセスは、概して、図２２に例示されているように下記の論理経路を辿る。

【0103】

ステップ２２００「患者サンプルを収集」では、既知の非疾病及び疾病患者サンプルの大きなグループをソフトウェアが収集する。サンプルは概して他のいかなる無関係の症状（がんでは非悪性）についてスクリーニングされず、サンプル集合が統計的に一般的母集団に見えるように収集される。

【0104】

ステップ２２０２「バイオマーカー濃度を測定」では、当該技術で周知の方法及び装置を使用して、ソフトウェアがバイオマーカーパラメータ濃度を測定する。

【0105】

ステップ２２０４「各バイオマーカーについて近接スコアを計算」では、図２５に示されているように、ソフトウェアが各バイオマーカーについての近接スコア曲線を計算し、各々のゾーンを設定する。

【0106】

ステップ２２０６「がん又は非がんとしてサンプルをスコアリング」では、ソフトウェアがモデルプラグラムを実行し、空間的近接性相関方法を使用してサンプルをスコアリングする。モデルは、４個のゾーンの各々に独自の圧縮又は再正規化方程式を使用する（以下の方程式１参照）。

【0107】

ステップ２２０８「スコアリングを検査及び修正」では、ソフトウェアがトポロジー安定性について個々のサンプルを検査し、不一致アルゴリズムに不合格であったものを修正する。第一に、測定された濃度レベルにプラスマイナスノイズを導入し、ディザリングされた近接スコアを計算し、一次空間的近接性モデルにこれらを適用することにより、すべてのがんスコアが通常の手法でトポロジー安定性について検査される。これらのディザリングがんスコアがシフトして所定の限界を超えた場合には、一次モデルを使用して計算されたがんスコアが却下される。そして不合格であった検査の最初の濃度レベルが、二次又は不一致モデルを使用して新たな近接スコアに移行する。そしてこれらの不合格サンプルについてのこれらの新たな近接スコアが空間的近接性相関モデルに適用される。そしてこれらの新たながんスコアが同じ手法で安定性について二次モデルと共に検査される。これらのサンプルが安定性検査に合格した場合には、不一致モデルにより分析されたと報告される。一次及び二次の両方のモデルが不安定である場合には、サンプルは不確定であると報告される。

【0108】

最後に、ステップ２２１０では、「訓練事例集合モデルで疾病又は非疾病を分類」でソフトウェアが上記の結果を出力する。

【0109】

乳がん確認研究に使用される装置及び試薬：検査プラットフォームの説明
ＯＴｒａｃｅｓＣＤｘ計器システム
以下に含まれ、作業の多くは上に記した検査データが、下記の試薬により装置で測定された。データはオートレイシーズ(OTraces)ＬＩＭＳシステムで処理され、場合によってはＰＣベースソフトウェアで計算が完了した。計算ソフトウェアすべてがオートレイシーズ・・インコーポレイテッド(OTraces Inc.)により書き込み及び確認された。他の同等のハードウェア、装置、試薬が同様の結果を達成するのに使用され得ることは、当業者には容易に明白になるだろう。

【0110】

ＣＤｘ計器システムは、ハミルトンマイクロラボスターレット(Hamilton MicroLab Starlet)システムに基づいている。これは、ＯＴｒａｃｅｓ免疫測定法をＨａｍｉｌｔｏｎ高速ＥＬＩＳＡロボットに転送するようにプログラミングでカスタマイズされている。ハミルトン社(Hamilton Company)は、マイクロラボスターレットを含む自動液体処理システムを世界規模で販売する評判の良い企業である。ハミルトン社によりユニットがオートレイシーズ用にカスタマイズされ、完全自動化を提供する。オートレイシーズＣＤｘシステムは、一体的なマイクロプレートウォッシャシステム及びリーダ(Microplate Washer System and Reader)を含む。これら二つの追加装置により、初期設定後はオペレータの介入を伴わずに、システムが１回のシフトで検査パネルでの五つの免疫測定法すべてを一通り完了できる。設定されたシステムは毎日４０個のがんスコアを完了する。改良には、一つの対象分析物を一度に実施するソフトウェアを含む。こうして、検査全体の実施中にエラーが発生した時には特定の検査を再実施可能であることが必要である。

【0111】

ＢＣＳｅｒａＤＸ検査キット
この検査キットは、緩衝液、ブロック溶液、洗浄液、抗体、校正物質をすべて含む、１２０個のがん検査スコアを実施する為の試薬及び使い捨て装置をすべて含む。この検査キットを完全商品化するのに必要な改良は、二つの対照サンプルを追加することである。これらの対照物により、「ブラインド」検査サンプルから適切ながんスコアが得られるという単独での確認が行われる。二つの対照物はそれぞれ５０と１５０の近接スコアを生じるように設計される。ＬＩＭＳシステム（以下参照）ＱＣプログラムは、これらの対照物が正しいことを検証して、現場での個々の検査実施を確認する。検査キットはＧＭＰ工場で製作され、ＣＥマークを受けている。マイクロタイタープレートは、工場において捕捉抗体及びタンパク質ブロッキング溶液でプレコートされる。

【0112】

臨床検査情報管理システム（ＬＩＭＳ）
例えばロシュ・アボット(Roche and Abbott)により現在販売されている臨床化学システムはすべて、患者データの管理に充分なソフトウェアとのグラフィカルインタフェースを含み、計器及び化学操作を品質制御し、検査サンプル識別と検査システムへの導入を容易にする。これらのメニューは、納品された化学システムと統合される。オートレイシーズのビジネスモデルは、オートレイシーズの米国施設に所在するオートレイシーズコンピュータサーバでのこれらの機能を含み、クラウドコンピューティングを使用し、インターネットを介して、ＣＤｘ計器をこれらのサーバに一体的に接続する。これにより幾つかの重大な利点が得られる。１）現場に装備された各ＣＤｘシステムによるすべての実施検査からのデータがオートレイシーズサーバで実施されるように、ＬＩＭＳソフトウェアがＦＤＡ準拠アーカイブソフトウェアを取り入れる。設置ベースからのフィードバックを適用すると、患者結果についての中心施設からの入力により、オートレイシーズは、米国拠点のＦＤＡ市場認可提出の為のＦＤＡコンプライアントデータを収集できる。２）好ましくは、バーコード付きの試薬包装により、計器及びＬＩＭＳを工場ＱＣ検査からのすべてのＱＣ検査結果に接続できる。これらのデータは、現場検査結果を更に確認する為、現場で検査が実施される際に実時間で入手可能である。３）ＣＤｘシステムはオートレイシーズ確認試薬のみに対して実施され、故にオートレイシーズ試薬以外を使用する検査実施が可能でない。このシステムは、オペレータには実時間で実施されるすべての機能を備える典型的なユーザインタフェースのような外観であり、検査実施が完了するとすぐに患者レポートが入手可能である。

【0113】

訓練事例集合モデルを展開してリスクスコアを計算する為の段階的プロセスが、図２３のフローチャートに示されている。このプロセスは、発明の或る実施形態においてソフトウェアで実行され得る。訓練事例集合モデルの構築が最初に行われ、その最終製品は、ブラインドサンプルと呼ばれる未知の患者サンプルについての診断結果の作成を可能にするが、それはこれらのブラインドサンプルについての分析の時点では正しい診断が判明していないからである。概して、本発明は、リスクスコアを他の患者因子と共に検討して所与の疾病状態の有無についての臨床判断を下す介護者にリスクスコアを提供する。

【0114】

ステップ２３０２から２３１８は、訓練事例集合モデルが作成されるプロセスの概要を示す。ステップ２３０２で、ソフトウェアは診断の必要性から訓練事例集合サンプル要件を規定するが、これは当業者により設定される所定の基準である。例えば、これらの基準は疾病と非疾病の状態、より具体的には例えば乳がんにおいては乳がん陽性と乳がんでないことが判明しているサンプルの比較である。

【0115】

ステップ２３０４で、ソフトウェアは、計算されるメタ変数と共に測定される独立変数（つまりバイオマーカー）を規定する。

【0116】

ステップ２３０６では、ステップ２３０２から２３０４で設定されたパラメータに従ってソフトウェアが訓練事例集合サンプルを収集する。ステップ２３０８で、ソフトウェアは、各訓練事例集合サンプルに適当な医療機器を使用して、測定による独立変数及びメタ変数と共にこれらの結果と関連する正しい疾病診断を判断する。ステップ２３１０で、ソフトウェアは訓練事例集合サンプルの各々についてバイマーカートポロジーを計算する。ステップ２３１２で、ソフトウェアは、以下について最適なバイマーカートポロジー重み付け又は影響調節を計算する。（１）検出限界の不確定性、例えば従来の検出限界を下回ると判断されるサンプル。（２）例えば［００７０］段落に記載された方法により、また上記のトポロジー安定性に関して判断される極度のトポロジー不安定性。ステップ２３１４では、計算が完了したと考えられ、疾病（例えばがん）の診断について一次訓練事例モデルが凍結される。ステップ２３１６で、ソフトウェアは、本質的に不一致の相関性モデリング（例えば図１０参照）を使用して二次訓練事例モデルを展開する。ステップ２３１８では、疾病状態の診断の為の二次訓練事例モデルが作成されるので、計算が完了したと見なされて凍結される。このようにして、疾病の診断について訓練事例モデル集合が作成される。

【0117】

ステップ２３２０から２３３８は、がんのような疾病を診断するように開発された訓練事例モデルを本発明のソフトウェアがどのように使用するかを説明している。ステップ２３２０で、ソフトウェアは、訓練事例集合モデルの開発で使用されるものに類似した医療機器を使用してバイオマーカーのようなブラインドサンプル独立変数を測定する。ステップ２３２２で、ソフトウェアは、各ブラインドサンプルについてのメタ変数データを取得又は測定して計算する。ステップ２３２４で、ソフトウェアはこのデータを使用し、一次訓練事例集合モデルを使用してブラインドサンプルについての初期疾病状態リスクスコアを計算する。ステップ２３２６で、ソフトウェアはブラインド患者サンプルスコアのトポロジー安定性を判断する。ステップ２３２８で、ソフトウェアは、スコアがトポロジー安定性検査に合格するかどうかを点検する。合格／不合格の基準には、どれほど大きな不安定性誘発エラーであるかと、最も重要な、スコアが疾病陽性から陰性へ、又はその逆に変化するかどうかを判断することが付随する。ステップ２３３０で、スコアが安定性検査に合格したことが判明した場合、診断レポート及びリスクスコアが出力及び／又は公表される。スコアが合格しなかった場合には、ステップ２３３２で、ソフトウェアは更に上記の不一致方法アルゴリズム（アルゴリズムＩＩ）を使用して二次疾病状態リスクスコアを計算する。ステップ２３３４で、スコアがトポロジー安定性検査に合格したかどうかをソフトウェアが再び点検する。ステップ２３３６で、スコアが安定性検査に合格したことが判明した場合、診断レポート及びリスクスコアが出力及び／又は公表される。スコアがまだ合格しない場合には、ステップ２３３８で、ソフトウェアが診断レポート及び出力を準備する、及び／又は疾病状態が存在するかどうかについて不確定であると結果を公表する。

【0118】

本願で計算される一次スコアは幾つかの独自の特性を有する。或る実施形態では、タンパク質の平均値が、その年齢の患者について実際に測定された濃度との比として対数圧縮に埋め込まれる。本質的に、この方法では、例えば各々が患者母集団の年齢に独自である同様の方程式が扇状に作成される。未知の各サンプルには、サンプルの年齢について独自の方程式が与えられる。

【0119】

非疾病と疾病についての年齢調節平均値と以下の形の実際の患者サンプル濃度とを含む関係が使用され得る。

【0120】

方程式１
近接スコア＝（Ｋ）*ｌｎ（（Ｃ_ｉ／Ｃ_{（ｃｏｒｈ）}）－（Ｃ_ｈ／Ｃ_ｃ））^２
Ｋ＝比例定数
Ｃ_ｉ＝実際の患者分析物について測定された濃度
Ｃ_{（ｃｏｒｈ）}＝この患者分析物の患者年齢調節濃度。患者が非疾病か疾病状態かについて値が調節される。
Ｃ_ｈ＝非疾病患者分析物の患者年齢調節平均濃度
Ｃ_ｃ＝疾病患者分析物の患者年齢調節平均濃度。

【0121】

この方程式１は、図２５に示されているように、上方制御グルーピングゾーンに応じて圧縮及び膨張を調節するように考案されている。近接スコアについての上記の式はこの要件を満たしている。しかしながら、当業者には明白であるように、この方程式の他の多くの形が実行され得る。例えば、Ｃ_ｉ，Ｃ_ｈ，Ｃ_ｃは、上記のように、サブグループ中央値又はダイナミックレンジのエッジからの平均、中間、距離による実際の濃度又は濃度距離であろう。この計算の他の変形例は、方程式２及び３として以下に再掲する。

【0122】

方程式２
近接スコア＝Ｋ*ｌｎ（（（未知のサンプルの濃度）／（未知のサンプルの年齢でのがんの平均値の濃度））－（（未知のサンプルの年齢での非がんの平均値の濃度）／（未知のサンプルの年齢でのがんの平均値の濃度）））^２。

【0123】

この方程式から、未知のサンプルが未知のサンプルの年齢での非がんの平均に等しい時に負の無限大（ゼロの自然対数）が得られる。図２５に示されているように、これは実際の詳細な方程式により設定値、例えば２に上書きされる。言い換えると、予設定範囲以外の値がソフトウェアにより検査されて予設定範囲の限界値に再設定されるのである。

【0124】

方程式３
近接スコア＝Ｋ*ｌｎ（（（未知のサンプルの濃度）／（未知のサンプルの年齢での非がんの平均値の濃度））－（（未知のサンプルの年齢でのがんの平均値の濃度）／（未知のサンプルの年齢での非がんの平均値の濃度）））^２。

【0125】

方程式３から、未知のサンプルが未知のサンプルの年齢についてのがん平均と等しい時に負の無限大であるゼロの自然対数が得られる。この方程式の実施形態は、未知のサンプルが未知のサンプルの年齢での非がんとがん平均との間の中間点濃度を上回る（がんと推定）時に使用される。この状況では、未知のサンプルがその年齢のがんの平均値である時に方程式全体が逆転されて正の無限大となる。この無限大は、実際の詳細方程式において設定値、例えば１８に上書きされる。図２５のグラフは、当該の年齢範囲について得られる一連の方程式を示す。方程式は、図２５に示された４個のゾーンの各々で独立的に機能する。ゾーンは、１）非疾病母集団の平均値より下、（２）非疾病平均値より上で、非疾病と疾病平均値の間（非疾病／疾病の移行）で導出される中間点の下、（３）非疾病／疾病平均値の間で導出される中間点と、母集団疾病平均値との間、（４）疾病状態の平均値より上。これらのゾーンは、ゾーン内に位置するサンプルが疾病又は非疾病の状態であることを示していないことに注意。個々のサンプルの真の診断はいずれかであり、バイオマーカーに影響する別の症状の為に「正しくない」場合にはその位置である。我々はこれをプロテオミクスノイズと呼ぶ。ゾーンは単に個々のサンプルがどのように平均に関係しているかを指しており、方程式１により例示的に行われる圧縮又は再正規化の為の足場となる。各方程式が一つの年齢値のみを表すことと、各々が単一の年齢値を表す多数の方程式を集合全体が構成することとに注意。方程式の集合全体は、実際の濃度が正確に平均値と等しい時にすべての年齢について同じ所定の値に近接スコア値を設定するように考案される。示されている年齢は、３５，５０，６５である。集合全体は扇のように見え、各未知のサンプルの年齢について一つの方程式が含まれる。

【0126】

近接スコア（無名数であるが故に濃度やレベルではない）は例示的に上述のように計算され、そして分析の為空間的近接性相関多次元図で使用される。また、図のすべては母集団分布に共通の特性、つまり非疾病及び疾病（年齢が調節されるかされない）の年齢平均値、中間値、又はサブグルーピングのダイナミックレンジに合わせて正規化される。これらの方法により、５以上のパーセントポイントの予測力の向上が得られる。

【0127】

本発明のシステム及び方法についての上記の例示的実施形態は、ネットワーク接続又は非ネットワーク接続の両方のハードウェアで機能するソフトウェアで実行され得る。発明を実行するのに使用されるハードウェアの例示的実施形態を図２６に関連して説明する。例示的システム２６００では、１台以上の周辺装置２６１０がネットワーク２６３０を通して１台以上のコンピュータ２６２０に接続される。周辺装置２６１０の例は、スマートフォン、スマートウォッチ、タブレット、ウェアラブル電子装置、ＥＫＳ及び血圧モニタのような医療装置、当該技術で周知のバイオマーカーデータを収集する他の装置を含む。ネットワーク２６３０は、インターネットのようなワイドエリアネットワーク又はイントラネットのようなローカルエリアネットワークであり得る。ネットワーク２６３０の為、周辺装置２６１０及びコンピュータ２６２０の物理的な位置は発明の機能に影響を及ぼさない。両方の実行例が本願に記載され、明記されないが、周辺装置２６１０とコンピュータ２６２０とが同じか異なる物理的位置にあることが考えられる。システムのハードウェアコンポーネントの間の通信は、多数の周知の手法、例えばモデムやイーサネット（登録商標）アダプタのようなネットワーク接続コンポーネントを使用して達成され得る。周辺装置２６１０とコンピュータ２６２０は共に通信機器を含むかこれに装着される。通信は、ＨＴＴＰのような業界標準プロトコルで行われると考えられる。

【0128】

各コンピュータ２６２０は、中央処理ユニット２６２２と記憶媒体２６２４とユーザ入力装置２６２６とディスプレイ２６２８とから成る。使用され得るコンピュータの例は、市販のパーソナルコンピュータ、オープンソースのコンピューティング装置（例：ラズベリー(Raspberry) Ｐｉ）、市販のサーバ、市販のポータブル装置（例：スマートフォン、スマートウォッチ、タブレット）である。一実施形態において、システムの周辺装置２６１０の各々とコンピュータ２６２０の各々は、これに設置されるシステムに関連するソフトウェアを有する。このような実施形態では、ネットワーク接続されたコンピュータ２６２０に、或いはネットワーク２６３０を通してネットワーク接続コンピュータ２６２０のいずれかにアクセス可能な１台以上のリモートサーバ２６４０に、バイオマーカーデータが局所的に記憶され得る。代替的実施形態で、ソフトウェアは周辺装置２６１０でアプリケーションとして実施される。

【0129】

【符号の説明】

【0130】

２６００システム例
２６１０周辺装置
２６２０コンピュータ
２６２２中央処理ユニット
２６２４記憶媒体
２６２６ユーザ入力装置
２６２８ディスプレイ
２６３０ネットワーク
２６４０リモートサーバ

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【図24】

【図25】

【図26】

【手続補正書】

【提出日】2023-05-08

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

疾病を診断する為にコンピュータによって実行される方法であって、
（ａ）第１患者の代用流体からの第１バイオマーカーの一つ以上の濃度値による第１集合を受理するステップであって、前記第１患者サンプルが非疾病診断から成るステップと、
（ｂ）第２患者の代用流体からの前記第１バイオマーカーの一つ以上の濃度値による第２集合を受理するステップであって、前記第２患者サンプルが疾病診断から成るステップと、
（ｃ）濃度値の前記第１集合からの第１近接スコア集合と濃度値の前記第２集合からの第２近接スコア集合とを計算するステップと、
（ｄ）濃度値の前記第１集合及び濃度値の前記第２集合と前記第１近接スコア集合及び前記第２近接スコア集合とから前記第１バイオマーカーと疾病診断との相関性を計算するステップであって、前記相関性は初期疾病状態リスクスコアとして計算されるステップと、
（ｅ）不一致訓練事例集合モデルを用いることにより前記初期疾病状態リスクスコアを確認するステップと、
を含む方法。

【請求項2】

前記第１バイオマーカーが、腫瘍マイクロ環境において見つかる活性サイトカインである、請求項１に記載の方法。

【請求項3】

前記活性サイトカインの官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも一つである、請求項２に記載の方法。

【請求項4】

前記代用流体は、血液、尿、又は組織である、請求項１に記載の方法。

【請求項5】

診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項１に記載の方法。

【請求項6】

前記第１バイオマーカーが、低含量タンパク質である、請求項４に記載の方法。

【請求項7】

前記第１近接スコア及び前記第２近接スコアは、メタ変数で調節される当該の母集団分布特性を使用して計算される、請求項５に記載の方法。

【請求項8】

前記第１バイオマーカーが、サイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つであり、あるいは、前記第１バイオマーカーが、ＶＥＧＦである、請求項１に記載の方法。

【請求項9】

（ａ）第１患者の代用流体からの第１バイオマーカーの一つ以上の濃度値による第１集合を受理するステップであって、前記第１患者サンプルが非疾病診断から成ることと、
（ｂ）第２患者の代用流体からの前記第１バイオマーカーの一つ以上の濃度値による第２集合を受理するステップであって、前記第２患者サンプルが疾病診断から成ることと、
（ｃ））濃度値の前記第１集合からの第１近接スコア集合と濃度値の前記第２集合からの第２近接スコア集合とを計算することと、
（ｄ）濃度値の前記第１集合及び濃度値の前記第２集合と前記第１近接スコア集合及び前記第２近接スコア集合とから前記第１バイオマーカーと疾病診断との相関性を計算することであって、前記相関性は初期疾病状態リスクスコアとして計算されることと、
（ｅ）不一致訓練事例集合モデルを用いることにより前記初期疾病状態リスクスコアを確認することと、
を含むプロセスをコンピュータに実行させるためのプログラムを記憶する非一時的コンピュータ可読媒体。

【請求項10】

前記第１バイオマーカーが、腫瘍マイクロ環境において見つかる活性サイトカインである、請求項９に記載の非一時的コンピュータ可読媒体。

【請求項11】

前記活性サイトカインの官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも一つである、請求項１０に記載の非一時的コンピュータ可読媒体。

【請求項12】

前記代用流体は、血液、尿、又は組織である、請求項９に記載の非一時的コンピュータ可読媒体。

【請求項13】

診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、請求項９に記載の非一時的コンピュータ可読媒体。

【請求項14】

前記第１バイオマーカーが、低含量タンパク質である、請求項９に記載の非一時的コンピュータ可読媒体。

【請求項15】

前記第１近接スコア及び前記第２近接スコアは、メタ変数で調節される当該の母集団分布特性を使用して計算される、請求項９に記載の非一時的コンピュータ可読媒体。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】０１２９

【補正方法】変更

【補正の内容】

【0129】

記載された実行例の或る特徴が本願に記載されるように例示されたが、多くの変形、代替物、変更、同等物が当業者には思い浮かぶだろう。故に、本発明は開示された特定の実施形態又は配置に限定されず、むしろ添付の請求項に規定される発明の範囲及び趣旨に内含されるいかなる変更、改変、又は変形も含むことが意図されている。本願に引用されるすべての引例が特許及び出願を含めてその全体が援用されることは明白である。
〔付記１〕
疾病を診断する為のコンピュータ利用方法であって、
（ａ）第１患者サンプルからの第１バイオマーカーの一つ以上の濃度値による第１集合を受理するステップであって、前記第１患者サンプルが非疾病診断から成るステップと、
（ｂ）第２患者サンプルからの前記第１バイオマーカーの一つ以上の濃度値による第２集合を受理するステップであって、前記第２患者サンプルが疾病診断から成るステップと、
（ｃ）前記第１濃度値集合からの第１近接スコア集合と前記第２濃度値集合からの第２近接スコア集合とを計算するステップと、
（ｄ）前記第１及び第２濃度値集合と前記第１及び第２近接スコア値集合とから前記第１マーカーと疾病診断との相関性を計算するステップであって、前記相関性が、単純回帰、ＲＯＣ曲線面積最大化、トポロジー安定化、又は空間的近接性分析のうち一つであるステップと、
を包含するコンピュータ利用方法。
〔付記２〕
ステップ（ａ）～（ｄ）が５個までのバイオマーカーについて反復される、付記１に記載のコンピュータ利用方法。
〔付記３〕
前記関連性が、前記単純回帰と前記ＲＯＣ曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、付記１に記載のコンピュータ利用方法。
〔付記４〕
前記第１及び第２患者サンプルが、血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、付記１に記載のコンピュータ利用方法。
〔付記５〕
診断される前記疾病が、前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、付記１に記載のコンピュータ利用方法。
〔付記６〕
診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、付記５に記載のコンピュータ利用方法。
〔付記７〕
前記第１及び第２患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、付記６に記載のコンピュータ利用方法。
〔付記８〕
前記二値グループの各々がスコアリングされる、付記７に記載のコンピュータ利用方法。
〔付記９〕
前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、付記１に記載のコンピュータ利用方法。
〔付記１０〕
前記第１バイオマーカーがＶＥＧＦである、付記１に記載のコンピュータ利用方法。
〔付記１１〕
（ａ）第１患者サンプルからの第１バイオマーカーの一つ以上の濃度値による第１集合を受理することであって、前記第１患者サンプルが非疾病診断から成ることと、
（ｂ）第２患者サンプルからの前記第１バイオマーカーの一つ以上の濃度値による第２集合を受理することであって、前記第２患者サンプルが疾病診断から成ることと、
（ｃ）前記第１濃度値集合からの第１近接スコア集合と前記第２濃度値集合からの第２近接スコア集合とを計算することと、
（ｄ）前記第１及び第２濃度値集合と前記第１及び第２近接スコア値集合とから前記第１バイオマーカーと疾病診断との相関性を計算することであって、前記相関性が、単純回帰、ＲＯＣ曲線面積最大化、トポロジー安定化、空間的近接性分析のうち一つであることと、
を包含するプロセスをコンピュータに実行させるプログラムを記憶する非一時的コンピュータ可読媒体。
〔付記１２〕
ステップ（ａ）～（ｄ）が５個までのバイオマーカーについて反復される、付記１１に記載の非一時的コンピュータ可読媒体。
〔付記１３〕
前記相関性が、前記単純回帰と前記ＲＯＣ曲線面積最大化と前記トポロジー安定化と前記空間的近接性分析のうち二つ以上を組み合わせたものである、付記１１に記載の非一時的コンピュータ可読媒体。
〔付記１４〕
前記第１及び第２患者サンプルが血液サンプル、尿サンプル、又は組織サンプルのうち少なくとも一つを含む、付記１１に記載の非一時的コンピュータ可読媒体。
〔付記１５〕
診断される前記疾病が前立腺がん、乳がん、肺がん、又は卵巣がんのうち一つである、付記１１に記載の非一時的コンピュータ可読媒体。
〔付記１６〕
診断される前記疾病が、グリソンスコアに基づく前記前立腺がん、乳がん、肺がん、又は卵巣がんのステージである、付記１５に記載の非一時的コンピュータ可読媒体。
〔付記１７〕
前記第１及び第２患者サンプルががんステージデータを包含し、前記がんステージデータが複数の二値グループに分類される、付記１６に記載の非一時的コンピュータ可読媒体。
〔付記１８〕
前記二値グループの各々がスコアリングされる、付記７に記載の非一時的コンピュータ可読媒体。
〔付記１９〕
前記バイオマーカーがサイトカインの官能基から選択され、前記サイトカインの前記官能基が、炎症誘発性、抗炎症性、抗腫瘍発生性、細胞アポトーシス、及び血管新生のうち少なくとも三つである、付記１１に記載の非一時的コンピュータ可読媒体。
〔付記２０〕
前記第１バイオマーカーがＶＥＧＦである、付記１１に記載の非一時的コンピュータ可読媒体。

【外国語明細書】

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版