(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】手術リスクスコアを生成するシステムおよび方法ならびにそれらの使用
(51)【国際特許分類】
G01N 33/50 20060101AFI20240312BHJP
G01N 33/68 20060101ALI20240312BHJP
G16H 50/20 20180101ALI20240312BHJP
【FI】
G01N33/50 P
G01N33/68
G16H50/20
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023556770
(86)(22)【出願日】2022-03-18
(85)【翻訳文提出日】2023-11-10
(86)【国際出願番号】 US2022071226
(87)【国際公開番号】W WO2022198239
(87)【国際公開日】2022-09-22
(32)【優先日】2021-03-18
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】515158308
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ゴーディリエ, ブリス
(72)【発明者】
【氏名】アゲーポアー, ニマ
(72)【発明者】
【氏名】エドー, ジュリアン
(72)【発明者】
【氏名】ルーマー, クリステン
(72)【発明者】
【氏名】アングスト, マルティン エス.
【テーマコード(参考)】
2G045
5L099
【Fターム(参考)】
2G045AA40
2G045CA17
2G045CA20
2G045CA25
2G045CA26
2G045CB01
2G045CB03
2G045CB07
2G045DA13
2G045DA14
2G045DA36
2G045FA37
2G045FA40
2G045FB12
2G045FB20
2G045JA01
5L099AA04
(57)【要約】
本明細書の実施形態は、手術リスクスコアを生成するシステムおよび方法について記載する。様々な実施形態は、ゲノミクス、トランスクリプトミクス、およびプロテオミクスなどのマルチオミクスデータを個人から取得する。ある特定の実施形態では、機械アルゴリズムを使用して、マルチオミクスデータに基づいて手術リスクスコアを生成する。さらなる実施形態では、手術リスクスコアの決定で臨床データがさらに使用される。本発明は、手術結果を予測することに関し、より具体的には、機械学習モデルを使用して、臨床データおよびマルチオミクス(multi-omics)データから術後感染や手術部位合併症などの手術結果を予測することに関する。
【特許請求の範囲】
【請求項1】
手術後の個人について手術合併症のリスクを決定するための方法であって、
複数の特徴の値を取得するかまたはすでに取得しているステップであって、前記複数の特徴が、オミクス生物学的特徴および臨床的特徴を含む、ステップと、
機械学習技術を介して得られたモデルを使用して、前記複数の特徴に基づいて前記個人の手術リスクスコアを算出するステップと、
前記算出された手術リスクスコアに基づいて、手術合併症を発症する患者のリスクの査定を提供するステップと、を含む方法。
【請求項2】
複数の特徴の値を取得するかまたはすでに取得しているステップが、
手術を受ける前記個人から分析用のサンプルを取得するかまたはすでに取得しているステップと、
複数のオミクス生物学的特徴および臨床的特徴の値を測定するかまたはすでに測定しているステップと、
を含む、請求項1に記載の方法。
【請求項3】
前記複数の特徴が、人口統計学的特徴をさらに含む、請求項1または2に記載の方法。
【請求項4】
オミクス生物学的特徴が、ゲノミクス特徴、トランスクリプトミクス特徴、プロテオミクス特徴、サイトミクス特徴、およびメタボロミクス特徴からなる群の少なくとも1つの特徴を含む、請求項1~3のいずれかに記載の方法。
【請求項5】
機械学習モデルが、複数の個々のデータ層でブートストラップ手順を使用して訓練され、各データ層は、前記複数の特徴および少なくとも1つの人工特徴からの1種類のデータを表す、請求項1~4のいずれかに記載の方法。
【請求項6】
各種類が、ゲノミクス、トランスクリプトミクス、プロテオミクス、サイトミクス、メタボロミクス、臨床、および人口統計からなる群の中から選択される、請求項5に記載の方法。
【請求項7】
各データ層が、個人の集団についてのデータを含み、
各特徴は、前記個人の集団中のすべての個人の特徴値を含み、
それぞれのデータ層について、各人工特徴が、前記複数の特徴のうちの非人工特徴から、前記非人工特徴の特徴値に対して行われる数学的演算を介して取得される、請求項5または6に記載の方法。
【請求項8】
前記数学的演算が、置換、置き換えを伴うサンプリング、置き換えを伴わないサンプリング、組合せ、ノックオフ、および推論からなる群の中から選択される、請求項7に記載の方法。
【請求項9】
前記モデルが、選択された生物学的特徴および臨床的特徴または人口統計学的特徴のセットに対する重み(β
i)を含み、
機械学習中に各データ層について、前記ブートストラップの繰り返しごとに、初期統計的学習技術を使用して、そのデータ層に関連する前記複数の特徴および前記少なくとも1つの人工特徴に対して初期重み(w
j)が算出され、前記算出された初期重み(w
j)に依存する統計的基準に基づいて、少なくとも1つの選択された特徴が、各データ層に対して決定される、請求項5~8のいずれかに記載の方法。
【請求項10】
前記初期統計的学習技術が、回帰技術および分類技術から選択される、請求項9に記載の方法。
【請求項11】
前記初期統計的学習技術が、スパース技術および非スパース技術から選択される、請求項9または10に記載の方法。
【請求項12】
前記スパース技術が、Lasso技術およびElastic Net技術から選択される、請求項11に記載の方法。
【請求項13】
前記統計的基準が、前記算出された初期重み(w
j)のうちの有効な重みに依存する、請求項9~12のいずれかに記載の方法。
【請求項14】
前記初期統計的学習技術がスパース回帰技術である場合、前記有効な重みは、非ゼロの重みである、請求項13に記載の方法。
【請求項15】
前記初期統計的学習技術が非スパース回帰技術である場合、前記有効な重みは、事前に定められた重み閾値を上回る重みである、請求項13に記載の方法。
【請求項16】
前記初期重み(w
j)はさらに、ハイパーパラメータの複数の値について算出され、前記ハイパーパラメータは、学習プロセスを制御するために値が使用されるパラメータである、請求項9~15のいずれかに記載の方法。
【請求項17】
前記ハイパーパラメータが、スパース初期技術の文脈でそれぞれの数学的ノルムに従って使用される正則化係数である、請求項16に記載の方法。
【請求項18】
前記数学的ノルムがpノルムであり、pは整数である、請求項17に記載の方法。
【請求項19】
前記初期統計的学習技術が前記Lasso技術である場合、前記ハイパーパラメータは、前記初期重み(w
j)のL1ノルムの係数の上限であり、前記L1ノルムは、前記初期重みのすべての絶対値の和を指す、請求項11と併せた請求項16~18のいずれかに記載の方法。
【請求項20】
前記初期統計的学習技術が前記Elastic Net技術である場合、前記ハイパーパラメータは、前記初期重み(w
j)のL1ノルムの和と前記初期重み(w
j)のL2ノルムの和の両方の係数の上限であり、前記L1ノルムは、前記初期重みのすべての絶対値の和を指し、L2ノルムは、前記初期重みのすべての平方値の和の平方根を指す、請求項11と併せた請求項16~18のいずれかに記載の方法。
【請求項21】
前記統計的基準が、前記有効な重みの発生頻度に基づく、請求項13~20のいずれかに記載の方法。
【請求項22】
特徴ごとに、単位発生頻度が、各ハイパーパラメータ値について計算され、前記単位発生頻度は、連続したブートストラップ繰り返しについての前記特徴に関する前記有効な重みの数をブートストラップ繰り返しの回数で割った値に等しい、請求項16~20のいずれかと併せた請求項21に記載の方法。
【請求項23】
前記発生頻度が、複数の前記ハイパーパラメータ値に対して計算された単位発生頻度のうちの最も高い単位発生頻度に等しい、請求項22に記載の方法。
【請求項24】
前記統計的基準は、各特徴が、その発生頻度が頻度閾値より大きい場合に選択されるというものであり、前記頻度閾値は、前記人工特徴に対して得られた発生頻度に従って算出される、請求項21~23のいずれかに記載の方法。
【請求項25】
前記ブートストラップ繰り返しの回数が50~100,000の間である、請求項5~24のいずれかに記載の方法。
【請求項26】
前記複数のハイパーパラメータ値が、前記Lasso技術または前記Elastic Net技術には0.5~100の間である、請求項11と併せた請求項16~23のいずれかに記載の方法。
【請求項27】
前記機械学習中に、前記モデルの前記重み(β
i)が、前記選択された特徴のセットに関連するデータに対して最終統計的学習技術を使用してさらに算出される、請求項9~26のいずれかに記載の方法。
【請求項28】
前記最終統計的学習技術が、回帰技術および分類技術から選択される、請求項27に記載の方法。
【請求項29】
前記最終統計的学習技術が、スパース技術および非スパース技術から選択される、請求項27または28に記載の方法。
【請求項30】
前記スパース技術が、Lasso技術およびElastic Net技術から選択される、請求項29に記載の方法。
【請求項31】
前記機械学習に続く使用段階の間、前記手術リスクスコアが、前記選択された特徴のセットに対する前記個人の測定値に従って算出される、請求項9~30のいずれかに記載の方法。
【請求項32】
前記最終統計的学習技術が前記分類技術である場合、前記手術リスクスコアは、前記選択された特徴のセットについてのそれぞれの重み(β
i)を乗算した前記測定値の重み付き和に従って計算される確率である、請求項31に記載の方法。
【請求項33】
前記手術リスクスコアが、式
【数20】
に従って計算され、
ここで、Pは、前記手術リスクスコアを表し、
Oddは、前記重み付き和に依存する項である、請求項32に記載の方法。
【請求項34】
Oddが、前記重み付き和の指数である、請求項33に記載の方法。
【請求項35】
前記最終統計的学習技術が前記回帰技術である場合、前記手術リスクスコアは、前記選択された特徴のセットについての前記それぞれの重み(β
i)を乗算した前記測定値の重み付き和に依存する項である、請求項31に記載の方法。
【請求項36】
前記手術リスクスコアが、前記重み付き和の指数に等しい、請求項35に記載の方法。
【請求項37】
前記機械学習の間に、前記方法が、人工特徴を取得する前に、
前記取得された値に基づき、データ拡張技術を使用して前記複数の非人工特徴の追加的な値を生成するステップ、をさらに含み、
前記人工特徴は、その後、前記取得された値と前記生成された追加的な値の両方に従って取得される、請求項7~36のいずれか一項に記載の方法。
【請求項38】
前記データ拡張技術が、非合成技術および合成技術の中から選択される、請求項37に記載の方法。
【請求項39】
前記データ拡張技術が、SMOTE技術、ADASYN技術、およびSVMSMOTE技術からなる群の中から選択される、請求項37または38に記載の方法。
【請求項40】
所与の非人工特徴に対して、取得された値が少ないほど、より多くの追加的な値が生成される、請求項37~39のいずれか一項に記載の方法。
【請求項41】
前記オミクス生物学的特徴が、サイトミクス特徴、プロテオミクス特徴、トランスクリプトミクス特徴、およびメタボロミクス特徴のうちの1つまたは複数から選択される、請求項1~40のいずれかに記載の方法。
【請求項42】
前記サイトミクス特徴が、免疫細胞サブセット中の単一細胞レベルの表面タンパク質および細胞内タンパク質を含み、
前記プロテオミクス特徴が、循環細胞外タンパク質を含む、請求項41に記載の方法。
【請求項43】
前記サンプルが、手術前に取得された少なくとも1つのサンプルを含む、請求項2から42のいずれか一項に記載の方法。
【請求項44】
サンプルが、手術前の任意の時から、手術日の外科的切開が行われる前までの期間中に取得される、請求項42に記載の方法。
【請求項45】
前記サンプルが、手術後に取得された少なくとも1つのサンプルを含む、請求項2から44のいずれか一項に記載の方法。
【請求項46】
前記手術後のサンプルが、手術のおよそ24時間後に取得される、請求項45に記載の方法。
【請求項47】
前記サンプルが、血液サンプル、血液サンプルの末梢血単核細胞(PBMC)分画、血漿サンプル、血清サンプル、尿サンプル、唾液サンプル、または組織サンプルからの解離細胞である、請求項2から46のいずれか一項に記載の方法。
【請求項48】
前記サンプルが、ex vivoで、有効量の活性化剤に、前記サンプル中の免疫細胞を活性化させるのに十分な期間にわたって接触させられる、請求項2から47のいずれか一項に記載の方法。
【請求項49】
前記値を測定するかまたはすでに測定しているステップが、前記サンプルを、表面タンパク質または細胞内タンパク質に特異的な同位体標識または蛍光標識された親和性試薬に接触させることにより、免疫細胞サブセット中で単一細胞レベルの前記表面タンパク質または細胞内タンパク質を測定することを含む、請求項2~48のいずれか一項に記載の方法。
【請求項50】
免疫細胞サブセット中の前記単一細胞レベルの表面タンパク質または細胞内タンパク質が、フローサイトメトリーまたはマスサイトメトリーによって行われる、請求項49に記載の方法。
【請求項51】
前記値を測定するかまたはすでに測定しているステップが、前記サンプルを、細胞外タンパク質に特異的な同位体標識または蛍光標識された複数の親和性試薬に接触させることにより、循環タンパク質を分析することを含む、請求項2~50のいずれか一項に記載の方法。
【請求項52】
親和性試薬が抗体またはアプタマーである、請求項51に記載の方法。
【請求項53】
前記人口統計学的または臨床的特徴が、年齢、性別、体型指数(BMI)、機能的状態、緊急症例、米国麻酔科学会(ASA)クラス、慢性症状のためのステロイド使用、腹水、多発性がん、糖尿病、高血圧、うっ血性心不全、呼吸困難、喫煙歴、重症COPDの病歴、透析、急性腎不全からなる群から選択されるデータを含む、請求項1から52のいずれか一項に記載の方法。
【請求項54】
前記臨床的特徴が、機械学習アルゴリズムを使用して患者の医療記録から取得される、請求項1から53のいずれか一項に記載の方法。
【請求項55】
前記手術合併症が手術部位合併症(SSC)である、請求項1から54のいずれか一項に記載の方法。
【請求項56】
前記値を測定するかまたはすでに測定しているステップが、前記サンプルを、ex vivoで、有効量の活性化剤に、前記サンプル中の免疫細胞を活性化させるのに十分な期間にわたって接触させることを含み、前記活性化剤が、TLR4アゴニスト(LPSなど)、インターロイキン(IL)-2、IL-4、IL-6、IL-1β、TNFα、IFNα、PMA/イオノマイシンの1つまたは組合せである、請求項2~55のいずれか一項に記載の方法。
【請求項57】
前記期間が約5分から約240分である、請求項56に記載の方法。
【請求項58】
前記値を測定するかまたはすでに測定しているステップが、前記サンプルを、表面タンパク質または細胞内タンパク質に特異的な同位体標識または蛍光標識された親和性試薬に接触させることにより、免疫細胞サブセット中で単一細胞レベルの前記表面タンパク質または細胞内タンパク質を測定することを含む、請求項55から57のいずれか一項に記載の方法。
【請求項59】
免疫細胞が、CD235ab、CD61、CD45、CD66、CD7、CD19、CD45RA、CD11b、CD4、CD8、CD11c、CD123、TCRγδ、CD24、CD161、CD33、CD16、CD25、CD3、CD27、CD15、CCR2、OLMF4、HLA-DR、CD14、CD56、CRTH2、CCR2、およびCXCR4からなる群から選択される、単一細胞表面タンパク質または細胞内タンパク質マーカを使用して特定される、請求項58に記載の方法。
【請求項60】
前記単一細胞の細胞内タンパク質が、ホスホ(p)pMAPKAPK2(pMK2)、pP38、pERK1/2、p-rpS6、pNFκB、IκB、p-CREB、pSTAT1、pSTAT5、pSTAT3、pSTAT6、cPARP、FoxP3、およびTbetからなる群から選択される、請求項58または59に記載の方法。
【請求項61】
前記細胞内タンパク質レベルが、好中球、顆粒球、好塩基球、CXCR4
+好中球、OLMF4
+好中球、CD14
+CD16
-古典的単球(cMC)、CD14
-CD16
+非古典的単球(ncMC)、CD14
+CD16
+中間単球(iMC)、HLADR
+CD11c
+骨髄樹状細胞(mDC)、HLADR
+CD123
+形質細胞様樹状細胞(pDC)、CD14
+HLADR
-CD11b
+単球性骨髄由来サプレッサー細胞(M-MDSC)、CD3
+CD56
+ NK-T細胞、CD7
+CD19
-CD3
- NK細胞、CD7
+CD56loCD16hi NK細胞、CD7
+CD56
hiCD16
lo NK細胞、CD19
+ B細胞、CD19
+CD38
+形質細胞、CD19
+CD38-非形質B細胞、CD4
+CD45RA
+ナイーブT細胞、CD4
+CD45RA-記憶T細胞、CD4
+CD161
+ Th17細胞、CD4
+Tbet
+ Th1細胞、CD4
+CRTH2
+ Th2細胞、CD3
+TCRγδ
+ γδT細胞、Th17 CD4
+T細胞、CD3
+FoxP3
+CD25
+調節T細胞(Treg)、CD8
+ CD45RA
+ナイーブT細胞、およびCD8
+ CD45RA-記憶T細胞からなる群から選択される免疫細胞サブセット中で測定される、請求項58から60のいずれか一項に記載の方法。
【請求項62】
手術部位合併症を発症する前記患者のリスクが、手術前に収集されたサンプルのLPSによるex vivo活性化に応答した、好中球内の増加したpMAPKAPK2(pMK2)、mDC内の増加したprpS6、または好中球内の減少したIκB、CD7
+CD56
hiCD16
lo NK細胞内の減少したpNFκBと相関する、請求項55から61のいずれか一項に記載の方法。
【請求項63】
手術部位合併症を発症する前記患者のリスクが、手術前に収集されたサンプルのIL-2、IL-4、および/またはIL-6によるex vivo活性化に応答した、好中球、mDC、またはTreg内の増加したpSTAT3、CD56
hiCD16
lo NK細胞またはmDC内の増加したprpS6、mDCまたはpDC内の増加したpSTAT5、あるいはCD4
+Tbet
+ Th1細胞内の減少したIκB、pDC内の減少したpSTAT1と相関する、請求項55から62のいずれか一項に記載の方法。
【請求項64】
手術部位合併症を発症する前記患者のリスクが、手術前に収集されたサンプルのTNFαによるex vivo活性化に応答した、好中球またはmDC内の増加したprpS6、M-MDSCまたはncMC内の増加したpERK、γδT細胞内の増加したpCREB、あるいは好中球内の減少したIκB、pP38またはpERK、あるいはCD4
+Tbet
+ Th1細胞内の減少したpCREBまたはpMAPKAPK2、あるいはCD4
+CRTH2
+ Th2細胞内の減少したpERKと相関する、請求項55から63のいずれか一項に記載の方法。
【請求項65】
手術部位合併症を発症する前記患者のリスクが、手術前および/または手術後に収集された非刺激サンプル中での、好中球、M-MDSC、cMC、またはncMC内の増加したpSTAT3、TregまたはCD45RA
-記憶CD4
+T細胞内の増加したpSTAT5、mDC内の増加したpMAPKAPK2、CD4
+Tbet
+ Th1細胞内のpCREBまたはIκB、NKT細胞内の増加したpSTAT6、あるいはCD4
+Tbet
+ Th1細胞内の減少したpERKと相関する、請求項55から64のいずれか一項に記載の方法。
【請求項66】
手術部位合併症を発症する前記患者のリスクが、手術前および/または手術後に収集された、増加したM-MDSC、G-MDSC、ncMC、Th17細胞、または減少したCD4
+CRTH2
+ Th2細胞頻度と相関する、請求項55から65のいずれか一項に記載の方法。
【請求項67】
手術部位合併症を発症する前記患者のリスクが、手術前および/または手術後に収集された、増加したIL-1β、ALK、WWOX、HSPH1、IRF6、CTNNA3、CCL3、sTREM1、ITM2A、TGFα、LIF、ADA、または減少したITGB3、EIF5A、KRT19、NTproBNPと相関する、請求項55から66のいずれか一項に記載の方法。
【請求項68】
プロセッサと、命令を含んでいるメモリとを備えるシステムであって、前記命令は、前記プロセッサによって実行されたときに、請求項1、3~42、53~55、および62~67のいずれかの方法を行うように前記プロセッサに指示する、システム。
【請求項69】
命令を含んでいる非一時的な機械可読媒体であって、前記命令は、コンピュータプロセッサによって実行されたときに、請求項1、3~42、53~55、および62~67のいずれかの方法を行うように前記プロセッサに指示する、非一時的な機械可読媒体。
【請求項70】
手術部位合併症を発症する個人のリスクの査定に従って、手術が行われる前に前記個人を処置するステップをさらに含む、請求項1~67のいずれか一項に記載の方法。
【請求項71】
手術部位合併症を発症する個人のリスクの査定に従って、手術が行われた後に前記個人を処置するステップをさらに含む、請求項1~67および70のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
連邦政府による資金提供を受けた研究または開発に関する表明
本発明は、国立衛生研究所によって授与された契約GM137936およびGM138353の下で、政府の支援を受けてなされた。政府は、本発明に特定の権利を有する。
【0002】
関連出願への相互参照
本願は、2021年3月18日に出願された、Gaudilliereらによる「Systems and Methods to Generate a Surgical Risk Score and Uses Thereof」という名称の米国仮特許出願第63/162,912号に基づく優先権を主張し、同出願の開示は本明細書により開示の全体が援用される。
【0003】
発明の分野
本発明は、手術結果を予測することに関し、より具体的には、機械学習モデルを使用して、臨床データおよびマルチオミクス(multi-omics)データから術後感染や手術部位合併症などの手術結果を予測することに関する。
【背景技術】
【0004】
背景
毎年3億件を超える手術が世界中で行われており、この数字は増えるものと予測される。感染、長期の痛み、機能障害、および終末器官の損傷を含む手術合併症は、手術の10~60%で発生し、個人の苦痛、入院の長期化、再入院、および著しい社会経済的負担を引き起こす。大腹部手術の後、表在性または深部の創傷感染、臓器空間感染、吻合部リーク、筋膜裂開、および切開創ヘルニアを含む手術部位合併症(SSC:surgical site complication)は、最大で患者の25%に発生する、最も厳しく、費用がかかり、一般的である手術合併症の一部である。(例えば、本明細書に参考として開示の全体が本明細書に援用される、Healy MA et al. JAMA Surg 2016; 151(9):823-30を参照されたい。)
個々の患者についてのSSCリスクの正確な予測は、術前介入および手術のタイミングの最適化を含む、高品質な手術の意思決定を導くために極めて重要である。既存のリスク予測ツールは、臨床パラメータに基づいており、個々の患者のSSCのリスクを推定するには不十分である。(例えば、ここに参照により開示の全体が本明細書に援用される、Eamer G, et al. Am J Surg 2018; 216(3):585-594、およびCohen ME et al. J Am Coll Surg 2017; 224(5):787-795 e1を参照されたい。)そのため、当技術分野には、より高い精度でSSCを予測するロバストなツールに対する必要性がある。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Healy MA et al. JAMA Surg 2016; 151(9):823-30
【非特許文献2】Eamer G, et al. Am J Surg 2018; 216(3):585-594
【非特許文献3】Cohen ME et al. J Am Coll Surg 2017; 224(5):787-795 e1
【発明の概要】
【課題を解決するための手段】
【0006】
本発明の要旨
この要旨は、いくつかの例を提供するものであり、本発明の範囲を制限することは決して意図されない。例えば、この要旨の例の中に含まれるいかなる特徴も、請求項がその特徴について明示的に述べない限り、特許請求の範囲には必要とされない。本開示の他箇所に記載される様々な特徴およびステップが、ここに要約される例に含まれてよく、ここおよび他の箇所に記載される特徴およびステップは様々方法で組み合わせられ得る。
【0007】
一部の態様では、本明細書に記載される技術は、手術後の個人について手術合併症のリスクを決定するための方法に関し、この方法は、複数の特徴の値を取得するかまたはすでに取得しているステップであって、複数の特徴が、オミクス生物学的特徴および臨床的特徴を含む、ステップと、機械学習技術を介して得られたモデルを使用して、複数の特徴に基づいて個人の手術リスクスコアを算出するステップと、算出された手術リスクスコアに基づいて、手術合併症を発症する患者のリスクの査定を提供するステップと、を含む。
【0008】
一部の態様では、本明細書に記載される技術は方法に関し、複数の特徴の値を取得するかまたはすでに取得しているステップが、手術を受ける個人から分析用のサンプルを取得するかまたはすでに取得しているステップと、複数のオミクス生物学的特徴および臨床的特徴の値を測定するかまたはすでに測定しているステップと、を含む。
【0009】
一部の態様では、本明細書に記載される技術は方法に関し、複数の特徴は、人口統計学的特徴をさらに含む。
【0010】
一部の態様では、本明細書に記載される技術は方法に関し、オミクス生物学的特徴は、ゲノミクス特徴、トランスクリプトミクス特徴、プロテオミクス特徴、サイトミクス特徴、およびメタボロミクス特徴からなる群の少なくとも1つの特徴を含む。
【0011】
一部の態様では、本明細書に記載される技術は方法に関し、機械学習モデルは、複数の個々のデータ層でブートストラップ手順を使用して訓練され、各データ層は、複数の特徴および少なくとも1つの人工特徴からの1種類のデータを表す。
【0012】
一部の態様では、本明細書に記載される技術は方法に関し、各種類は、ゲノミクス、トランスクリプトミクス、プロテオミクス、サイトミクス、メタボロミクス、臨床、および人口統計の中から選択される。
【0013】
一部の態様では、本明細書に記載される技術は方法に関し、各データ層が、個人の集団についてのデータを含み、各特徴は、個人の集団中のすべての個人の特徴値を含み、それぞれのデータ層について、各人工特徴は、複数の特徴のうちの非人工特徴から、その非人工特徴の特徴値に対して行われる数学的演算を介して取得される。
【0014】
一部の態様では、本明細書に記載される技術は方法に関し、数学的演算は、置換、置き換えを伴うサンプリング、置き換えを伴わないサンプリング、組合せ、ノックオフ、および推論の中から選択される。
【0015】
一部の態様では、本明細書に記載される技術は方法に関し、モデルは、選択された生物学的特徴および臨床的特徴または人口統計学的特徴のセットに対する重み(βi)を含み、機械学習中に各データ層について、ブートストラップの繰り返しごとに、初期統計的学習技術を使用して、そのデータ層に関連する複数の特徴および少なくとも1つの人工特徴に対して初期重み(wj)が算出され、算出された初期重み(wj)に依存する統計的基準に基づいて、少なくとも1つの選択された特徴が各データ層に対して決定される。
【0016】
一部の態様では、本明細書に記載される技術は方法に関し、初期統計的学習技術は、回帰技術および分類技術から選択される。
【0017】
一部の態様では、本明細書に記載される技術は方法に関し、初期統計的学習技術は、スパース技術および非スパース技術から選択される。
【0018】
一部の態様では、本明細書に記載される技術は方法に関し、スパース技術は、Lasso技術およびElastic Net技術から選択される。
【0019】
一部の態様では、本明細書に記載される技術は方法に関し、統計的基準は、算出された初期重み(wj)のうちの有効な重みに依存する。
【0020】
一部の態様では、本明細書に記載される技術は方法に関し、初期統計的学習技術がスパース回帰技術である場合、有効な重みは、非ゼロの重みである。
【0021】
一部の態様では、本明細書に記載される技術は方法に関し、初期統計的学習技術が非スパース回帰技術である場合、有効な重みは、事前に定められた重み閾値を上回る重みである。
【0022】
一部の態様では、本明細書に記載される技術は方法に関し、初期重み(wj)はさらに、ハイパーパラメータの複数の値について算出され、ハイパーパラメータは、学習プロセスを制御するために値が使用されるパラメータである。
【0023】
一部の態様では、本明細書に記載される技術は方法に関し、ハイパーパラメータは、スパース初期技術の文脈でそれぞれの数学的ノルムに従って使用される正則化係数である。
【0024】
一部の態様では、本明細書に記載される技術は方法に関し、数学的ノルムはpノルムであり、pは整数である。
【0025】
一部の態様では、本明細書に記載される技術は方法に関し、初期統計的学習技術がLasso技術である場合、ハイパーパラメータは、初期重み(wj)のL1ノルムの係数の上限であり、L1ノルムは、初期重みのすべての絶対値の和を指す。
【0026】
一部の態様では、本明細書に記載される技術は方法に関し、初期統計的学習技術がElastic Net技術である場合、ハイパーパラメータは、初期重み(wj)のL1ノルムの和と初期重み(wj)のL2ノルムの和の両方の係数の上限であり、L1ノルムは、初期重みのすべての絶対値の和を指し、L2ノルムは、初期重みのすべての平方値の和の平方根を指す。
【0027】
一部の態様では、本明細書に記載される技術は方法に関し、統計的基準は、有効な重みの発生頻度に基づく。
【0028】
一部の態様では、本明細書に記載される技術は方法に関し、特徴ごとに、単位発生頻度が、各ハイパーパラメータ値について計算され、単位発生頻度は、連続したブートストラップ繰り返しについてのその特徴に関する有効な重みの数をブートストラップ繰り返しの回数で割った値に等しい。
【0029】
一部の態様では、本明細書に記載される技術は方法に関し、発生頻度は、複数のハイパーパラメータ値に対して計算された単位発生頻度のうちの最も高い単位発生頻度に等しい。
【0030】
一部の態様では、本明細書に記載される技術は方法に関し、統計的基準は、各特徴が、その発生頻度が頻度閾値より大きい場合に選択されるというものであり、頻度閾値は、人工特徴に対して得られた発生頻度に従って算出される。
【0031】
一部の態様では、本明細書に記載される技術は方法に関し、ブートストラップ繰り返しの回数は50~100,000の間である。
【0032】
一部の態様では、本明細書に記載される技術は方法に関し、複数のハイパーパラメータ値が、Lasso技術またはElastic Net技術には0.5~100の間である。
【0033】
一部の態様では、本明細書に記載される技術は方法に関し、機械学習中に、モデルの重み(βi)が、選択された特徴のセットに関連するデータに対して最終統計的学習技術を使用してさらに算出される。
【0034】
一部の態様では、本明細書に記載される技術は方法に関し、最終統計的学習技術は、回帰技術および分類技術から選択される。
【0035】
一部の態様では、本明細書に記載される技術は方法に関し、最終統計的学習技術は、スパース技術および非スパース技術から選択される。
【0036】
一部の態様では、本明細書に記載される技術は方法に関し、スパース技術は、Lasso技術およびElastic Net技術から選択される。
【0037】
一部の態様では、本明細書に記載される技術は方法に関し、機械学習に続く使用段階の間、手術リスクスコアは、選択された特徴のセットに対する個人の測定値に従って算出される。
【0038】
一部の態様では、本明細書に記載される技術は方法に関し、最終統計的学習技術が分類技術である場合、手術リスクスコアは、選択された特徴のセットについてのそれぞれの重み(βi)を乗算した測定値の重み付き和に従って計算される確率である。
【0039】
一部の態様では、本明細書に記載される技術は方法に関し、手術リスクスコアは、式
【数1】
に従って計算され、
ここで、Pは、手術リスクスコアを表し、Oddは、重み付き和に依存する項である。
【0040】
一部の態様では、本明細書に記載される技術は方法に関し、Oddは、重み付き和の指数である。
【0041】
一部の態様では、本明細書に記載される技術は方法に関し、最終統計的学習技術が回帰技術である場合、手術リスクスコアは、選択された特徴のセットについてのそれぞれの重み(βi)を乗算した測定値の重み付き和に依存する項である。
【0042】
一部の態様では、本明細書に記載される技術は方法に関し、手術リスクスコアは、重み付き和の指数に等しい。
【0043】
一部の態様では、本明細書に記載される技術は方法に関し、機械学習の間に、上記方法は、人工特徴を取得する前に、取得された値に基づき、データ拡張技術を使用して複数の非人工特徴の追加的な値を生成するステップをさらに含み、人工特徴は、その後、取得された値と生成された追加的な値の両方に従って取得される。
【0044】
一部の態様では、本明細書に記載される技術は方法に関し、データ拡張技術は、非合成技術および合成技術の中から選択される。
【0045】
一部の態様では、本明細書に記載される技術は方法に関し、データ拡張技術は、SMOTE技術、ADASYN技術、およびSVMSMOTE技術の中から選択される。
【0046】
一部の態様では、本明細書に記載される技術は方法に関し、所与の非人工特徴に対して、取得された値が少ないほど、より多くの追加的な値が生成される。
【0047】
一部の態様では、本明細書に記載される技術は方法に関し、オミクス生物学的特徴が、サイトミクス特徴、プロテオミクス特徴、トランスクリプトミクス特徴、およびメタボロミクス特徴のうちの1つまたは複数から選択される。
【0048】
一部の態様では、本明細書に記載される技術は方法に関し、サイトミクス特徴は、免疫細胞サブセット中の単一細胞レベルの表面タンパク質および細胞内タンパク質を含み、プロテオミクス特徴は、循環細胞外タンパク質を含む。
【0049】
一部の態様では、本明細書に記載される技術は方法に関し、サンプルは、手術前に取得された少なくとも1つのサンプルを含む。
【0050】
一部の態様では、本明細書に記載される技術は方法に関し、サンプルは、手術前の任意の時から、手術日の外科的切開が行われる前までの期間中に取得される。
【0051】
一部の態様では、本明細書に記載される技術は方法に関し、手術後のサンプルは、手術後に取得された少なくとも1つのサンプルを含む。
【0052】
一部の態様では、本明細書に記載される技術は方法に関し、手術後のサンプルは、手術のおよそ24時間後に取得される。
【0053】
一部の態様では、本明細書に記載される技術は方法に関し、サンプルは、血液サンプル、血液サンプルの末梢血単核細胞(PBMC)分画、血漿サンプル、血清サンプル、尿サンプル、唾液サンプル、または組織サンプルからの解離細胞である。
【0054】
一部の態様では、本明細書に記載される技術は方法に関し、サンプルは、ex vivoで、有効量の活性化剤に、サンプル中の免疫細胞を活性化させるのに十分な期間にわたって接触させられる。
【0055】
一部の態様では、本明細書に記載される技術は方法に関し、値を測定するかまたはすでに測定しているステップが、サンプルを、表面タンパク質または細胞内タンパク質に特異的な同位体標識または蛍光標識された親和性試薬に接触させることにより、免疫細胞サブセット中で単一細胞レベルの表面タンパク質または細胞内タンパク質を測定することを含む。
【0056】
一部の態様では、本明細書に記載される技術は方法に関し、免疫細胞サブセット中の単一細胞レベルの表面タンパク質または細胞内タンパク質は、フローサイトメトリーまたはマスサイトメトリーによって行われる。
【0057】
一部の態様では、本明細書に記載される技術は方法に関し、値を測定するかまたはすでに測定しているステップは、サンプルを、細胞外タンパク質に特異的な同位体標識または蛍光標識された複数の親和性試薬に接触させることにより、循環タンパク質を分析することを含む。
【0058】
一部の態様では、本明細書に記載される技術は方法に関し、親和性試薬は、抗体またはアプタマーである。
【0059】
一部の態様では、本明細書に記載される技術は方法に関し、人口統計学的または臨床的特徴は、年齢、性別、体型指数(BMI)、機能的状態、緊急症例、米国麻酔科学会(ASA)クラス、慢性症状のためのステロイド使用、腹水、多発性がん、糖尿病、高血圧、うっ血性心不全、呼吸困難、喫煙歴、重症COPDの病歴、透析、急性腎不全からなる群から選択されるデータを含む。
【0060】
一部の態様では、本明細書に記載される技術は方法に関し、臨床的特徴は、機械学習アルゴリズムを使用して患者の医療記録から取得される。
【0061】
一部の態様では、本明細書に記載される技術は方法に関し、手術合併症は手術部位合併症(SSC)である。
【0062】
一部の態様では、本明細書に記載される技術は方法に関し、値を測定するかまたはすでに測定しているステップは、サンプルを、ex vivoで、有効量の活性化剤に、サンプル中の免疫細胞を活性化させるのに十分な期間にわたって接触させることを含み、活性化剤は、TLR4アゴニスト(LPSなど)、インターロイキン(IL)-2、IL-4、IL-6、IL-1β、TNFα、IFNα、PMA/イオノマイシンの1つまたは組合せである。
【0063】
一部の態様では、本明細書に記載される技術は方法に関し、上記期間は、約5分から約240分である。
【0064】
一部の態様では、本明細書に記載される技術は方法に関し、値を測定するかまたはすでに測定しているステップは、サンプルを、表面タンパク質または細胞内タンパク質に特異的な同位体標識または蛍光標識された親和性試薬に接触させることにより、免疫細胞サブセット中で単一細胞レベルの表面タンパク質または細胞内タンパク質を測定することを含む。
【0065】
一部の態様では、本明細書に記載される技術は方法に関し、免疫細胞は、CD235ab、CD61、CD45、CD66、CD7、CD19、CD45RA、CD11b、CD4、CD8、CD11c、CD123、TCRγδ、CD24、CD161、CD33、CD16、CD25、CD3、CD27、CD15、CCR2、OLMF4、HLA-DR、CD14、CD56、CRTH2、CCR2、およびCXCR4からなる群から選択される、単一細胞表面タンパク質または細胞内タンパク質マーカを使用して特定される。
【0066】
一部の態様では、本明細書に記載される技術は方法に関し、単一細胞の細胞内タンパク質は、ホスホ(p)pMAPKAPK2(pMK2)、pP38、pERK1/2、p-rpS6、pNFκB、IκB、p-CREB、pSTAT1、pSTAT5、pSTAT3、pSTAT6、cPARP、FoxP3、およびTbetからなる群から選択される。
【0067】
一部の態様では、本明細書に記載される技術は方法に関し、細胞内タンパク質レベルは、好中球、顆粒球、好塩基球、CXCR4+好中球、OLMF4+好中球、CD14+CD16-古典的単球(cMC)、CD14-CD16+非古典的単球(ncMC)、CD14+CD16+中間単球(iMC)、HLADR+CD11c+骨髄樹状細胞(mDC)、HLADR+CD123+形質細胞様樹状細胞(pDC)、CD14+HLADR-CD11b+単球性骨髄由来サプレッサー細胞(M-MDSC)、CD3+CD56+ NK-T細胞、CD7+CD19-CD3- NK細胞、CD7+CD56loCD16hi NK細胞、CD7+CD56hiCD16lo NK細胞、CD19+ B細胞、CD19+CD38+形質細胞、CD19+CD38-非形質B細胞、CD4+CD45RA+ナイーブT細胞、CD4+CD45RA-記憶T細胞、CD4+CD161+ Th17細胞、CD4+Tbet+ Th1細胞、CD4+CRTH2+ Th2細胞、CD3+TCRγδ+ γδT細胞、Th17 CD4+T細胞、CD3+FoxP3+CD25+調節T細胞(Treg)、CD8+ CD45RA+ナイーブT細胞、およびCD8+ CD45RA-記憶T細胞、から選択される免疫細胞サブセット中で測定される。
【0068】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する患者のリスクは、手術前に収集されたサンプルのLPSによるex vivo活性化に応答した、好中球内の増加したpMAPKAPK2(pMK2)、mDC内の増加したprpS6、または好中球内の減少したIκB、CD7+CD56hiCD16lo NK細胞内の減少したpNFκBと相関する。
【0069】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する患者のリスクは、手術前に収集されたサンプルのIL-2、IL-4、および/またはIL-6によるex vivo活性化に応答した、好中球、mDC、またはTreg内の増加したpSTAT3、CD56hiCD16lo NK細胞またはmDC内の増加したprpS6、mDCまたはpDC内の増加したpSTAT5、あるいはCD4+Tbet+ Th1細胞内の減少したIκB、pDC内の減少したpSTAT1と相関する。
【0070】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する患者のリスクは、手術前に収集されたサンプルのTNFαによるex vivo活性化に応答した、好中球またはmDC内の増加したprpS6、M-MDSCまたはncMC内の増加したpERK、γδT細胞内の増加したpCREB、あるいは好中球内の減少したIκB、pP38またはpERK、あるいはCD4+Tbet+ Th1細胞内の減少したpCREBまたはpMAPKAPK2、あるいはCD4+CRTH2+ Th2細胞内の減少したpERKと相関する。
【0071】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する患者のリスクは、手術前および/または手術後に収集された非刺激サンプル中での、好中球、M-MDSC、cMC、またはncMC内の増加したpSTAT3、TregまたはCD45RA-記憶CD4+T細胞内の増加したpSTAT5、mDC内の増加したpMAPKAPK2、CD4+Tbet+ Th1細胞内のpCREBまたはIκB、NKT細胞内の増加したpSTAT6、あるいはCD4+Tbet+ Th1細胞内の減少したpERKと相関する。
【0072】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する患者のリスクは、手術前および/または手術後に収集された、増加したM-MDSC、G-MDSC、ncMC、Th17細胞、または減少したCD4+CRTH2+ Th2細胞頻度と相関する。
【0073】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する患者のリスクは、手術前および/または手術後に収集された、増加したIL-1β、ALK、WWOX、HSPH1、IRF6、CTNNA3、CCL3、sTREM1、ITM2A、TGFα、LIF、ADA、または減少したITGB3、EIF5A、KRT19、NTproBNPと相関する。
【0074】
一部の態様では、本明細書に記載される技術は、プロセッサと、命令を含んでいるメモリとを備えるシステムに関し、命令は、プロセッサによって実行されたときに、上述の方法のいずれかを行うようにプロセッサに指示する。
【0075】
一部の態様では、本明細書に記載される技術は、命令を含んでいる非一時的な機械可読媒体に関し、命令は、コンピュータプロセッサによって実行されたときに、上述の方法のいずれかを行うようにプロセッサに指示する。
【0076】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する個人のリスクの査定に従って、手術が行われる前に個人を処置するステップをさらに含む。
【0077】
一部の態様では、本明細書に記載される技術は方法に関し、手術部位合併症を発症する個人のリスクの査定に従って、手術が行われた後に個人を処置するステップをさらに含む。
【0078】
本発明の他の特徴および利点は、本発明の原理を例として示す添付図面と併せて読まれる、以下の詳細な説明から明らかになるであろう。
【0079】
説明および特許請求の範囲は、以下の図およびデータグラフを参照して、より完全に理解されるであろう。図およびデータグラフは、本発明の例示的実施形態として提示され、本発明の範囲の完全な詳述とは解釈されるべきでない。
【図面の簡単な説明】
【0080】
【
図1】
図1は、様々な実施形態による、マルチオミクス生物学的(例えば、単一細胞免疫反応および血漿プロテオミクスデータ)と臨床データとを統合する機械学習アルゴリズムを使用して手術後の患者の臨床結果を予測するための例示的な方法を示す。様々な実施形態は、マルチオミクスブートストラップ(MOB)機械学習アルゴリズムを使用して、患者が手術部位合併症(SSC)を発症する確率の予測モデルを生成することにより、外科医または医療従事者の臨床意思決定を導く方法を提供する。
【0081】
【
図2】
図2は、様々な実施形態による、手術結果を予測するために生物学的データと臨床データとを統合するMOB機械学習モデルの例示的な方法論を示す。
【0082】
【
図3A】
図3A~3Bは、様々な実施形態による、MOBアルゴリズムの例示的な擬似コードを示す。
【
図3B】
図3A~3Bは、様々な実施形態による、MOBアルゴリズムの例示的な擬似コードを示す。
【0083】
【
図4】
図4は、様々な実施形態による、腹部手術を受ける患者における手術部位合併症の予測モデルを特定するための例示的なワークフローを示す。
【0084】
【
図5】
図5A~5Cは、様々な実施形態による、腹部手術前に収集された患者サンプルの分析から導出されたSSCの例示的なMOB予測モデルを示す。
【0085】
【
図6】
図6は、様々な実施形態による、患者から収集されたマルチオミクス生物学的データの統合分析から導出されたSSCの例示的なMOB予測モデルを示す。
【0086】
【
図7】
図7は、様々な実施形態による、腹部手術の24時間後に収集された分析患者サンプルから導出されたSSCの例示的なMOB予測モデルを示す。
【0087】
【
図8A】
図8A~8Dは、様々な実施形態による、SSCのDOS MOB予測モデルに寄与する例示的な単一細胞免疫反応およびプロテオミクス特徴を示す。
【
図8B】
図8A~8Dは、様々な実施形態による、SSCのDOS MOB予測モデルに寄与する例示的な単一細胞免疫反応およびプロテオミクス特徴を示す。
【
図8C】
図8A~8Dは、様々な実施形態による、SSCのDOS MOB予測モデルに寄与する例示的な単一細胞免疫反応およびプロテオミクス特徴を示す。
【
図8D】
図8A~8Dは、様々な実施形態による、SSCのDOS MOB予測モデルに寄与する例示的な単一細胞免疫反応およびプロテオミクス特徴を示す。
【0088】
【
図9-1】
図9A~9Nは、本発明の様々な実施形態による、SSCのPOD1 MOB予測モデルに寄与する例示的な特徴を示す。
図9A~9Gは、単一細胞免疫反応特徴を示し、
図9H~9Nは血漿プロテオミクス特徴を示す。
【
図9-2】
図9A~9Nは、本発明の様々な実施形態による、SSCのPOD1 MOB予測モデルに寄与する例示的な特徴を示す。
図9A~9Gは、単一細胞免疫反応特徴を示し、
図9H~9Nは血漿プロテオミクス特徴を示す。
【
図9-3】
図9A~9Nは、本発明の様々な実施形態による、SSCのPOD1 MOB予測モデルに寄与する例示的な特徴を示す。
図9A~9Gは、単一細胞免疫反応特徴を示し、
図9H~9Nは血漿プロテオミクス特徴を示す。
【
図9-4】
図9A~9Nは、本発明の様々な実施形態による、SSCのPOD1 MOB予測モデルに寄与する例示的な特徴を示す。
図9A~9Gは、単一細胞免疫反応特徴を示し、
図9H~9Nは血漿プロテオミクス特徴を示す。
【0089】
【
図10】
図10は、本発明の様々な実施形態による、免疫細胞サブセットを特定するための例示的なゲーティング戦略を示す。
【0090】
【
図11】
図11A~11Bは、本発明の様々な実施形態による、手術前および後に差次的に発現する単一細胞免疫反応および血漿タンパク質の例示的なセットを示す。
【0091】
【
図12】
図12は、本発明の様々な実施形態による、CONSORT基準に従った例示的な患者登録を示す。
【0092】
【
図13】
図13は、本発明の一実施形態による、手術リスクスコアを生成するために使用され得るコンピューティングデバイス内の処理システムの構成要素のブロック図を示す。
【0093】
【
図14】
図14は、本発明の一実施形態による、手術リスクスコアを生成するための分散システムのネットワーク図を示す。
【発明を実施するための形態】
【0094】
詳細な説明
先に述べたように、既存のリスク予測ツールは、臨床パラメータに基づいており、個々の患者のSSCのリスクを推定するには不十分である。(例えば、上記で引用されたEamer G, et al.を参照されたい。)よって、SSCの発生原理を支配する生物学的パラメータ反映機構を組み込むことが、リスク予測の精度を上げるための可能性の高い手法である。
【0095】
手術は著しい組織外傷を伴い、それが、免疫系の先天分岐および適応分岐を関与させるプログラムされた炎症反応の引き金となる。外科的切開から数時間以内に、先天免疫細胞(単球、好中球、およびそれらのサブセットを含む)の非常に多様なネットワークが、循環DAMP(ダメージ関連分子パターン(damage-associated molecular pattern))および炎症サイトカイン(例えば、HMGB1、TNFα、およびIL-1β)に応答して活性化される。手術に対する初期の先天免疫反応に従って、代償性の抗炎症性適応免疫反応が従来説明されてきた。しかし、近年のトランスクリプトミクスおよびマスサイトメトリー分析は、適応免疫反応は先天免疫反応と連携して動員され、骨髄由来サプレッサー細胞(MDSC)などの特化した免疫抑制免疫細胞のサブセットの活性化と同時に起こることを示唆している。合併症を伴わない術後回復の文脈では、先天反応と適応反応とが相乗的に作用して、病原体防御組織のリモデリングおよび負傷後の痛みおよび炎症の解消のために必要とされる炎症促進過程および抗炎症(消散促進)過程を司る。(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Stoecklein VM et al. J Leukoc Biol 2012; Gaudilliere B et al. Sci Transl Med 2014; 6(255):255ra131を参照されたい。)
【0096】
感染、創傷裂開、そして最終的に末端器官の損傷を含む合併症は、炎症促進反応と免疫抑制反応のバランスが偏るときに生じる。よって、手術合併症のある患者とない患者との間で異なる免疫機構の詳細な特徴付けは、手術合併症に寄与し手術合併症の前に発生する術前および術後生物学的事象を特定するための非常に有望な手法である。SSCのリスクを予測する生物学的マーカを検出する以前の試みは、分泌される体液性因子、選択免疫細胞上の表面マーカ発現、または貯留された循環白血球の転写分析に着目していた。しかし、検出される関連付けは、個々の患者のSSCのリスクを正確に予測するためには不十分であった。
【0097】
主要な妨げの一つは、手術に対する複雑な複数細胞の炎症反応を単一細胞の分解能で特徴付けることが可能な高容量の機能するアッセイが欠如していることであった。加えて、単一細胞免疫データを他のオミクスおよび臨床データと統合してSSCの発症を予測することのできる分析ツールが欠如している。よって、手術後のSSCの診断、予後、処置、管理、および治療開発のための改良された措置に対する必要性がある。
【0098】
メタボロミクス、プロテオミクス、およびサイトメトリー免疫アッセイデータを含む高スループットのオミクスアッセイは、各生物学的サンプルに対して体系的に得られた数千個の測定値を提供することにより、疾患および生体プロセスの複雑な機構を潜在的に捉えられる可能性がある。
【0099】
マスサイトメトリー免疫アッセイならびに他のオミクスアッセイの分析には、通例、二分法によって分析される2つの関連する目標がある。第1の目標は、関心対象の結果を予測し、検討される結果の予測子の最良のセットであるバイオマーカを特定することであり、第2の目標は、基礎となる生態へのより深い理解を提供する、疾患に関係する潜在的経路を特定することである。第1の目標は、機械学習方法を展開し、数千の測定値の中から一般には最も情報の多いバイオマーカを少数だけ選択する予測モデルをフィッティングすることによって対処される。第2の目標は、各測定値の一変量分析を行い、そのp値を評価することによって結果に関するその測定値の有意性を決定し、次いでそのp値が複数の仮定検査のために調節されることにより、対処されるのが通常である。
【0100】
機械学習の文脈では、多数の特徴pおよびはるかに少ない数のサンプルnによって特徴付けられるオミクスデータは、p>>nであるシナリオに該当する。このシナリオのための代表的な機械学習方法論は、正則化回帰または分類方法、具体的には、Lasso(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Tibshirani, Robert. "Regression shrinkage and selection via the lasso." Journal of the Royal Statistical Society: Series B (Methodological) 58.1 (1996): 267-288を参照)およびElastic Net.(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Zou, Hui, and Trevor Hastie. "Regularization and variable selection via the elastic net." Journal of the royal statistical society: series B (statistical methodology) 67.2 (2005): 301-320を参照)などのスパース線形モデルの使用からなる。例えば、以下によって与えられる次の線形モデルを考える:
Y=Xβ+∈
ここで、
【数2】
および
【数3】
は、それぞれ入力および応答変数であり、
【数4】
は、独立した、同一に分散した成分を有するランダムノイズである。
【数5】
は、学習する必要がある各特徴に関連する係数である。スパース線形モデルは、モデル係数βの正則化を追加し、これは、バイアスと分散のトレードオフのバランスを取ることを可能にし、またモデルのオーバーフィッティングを防止する。LassoおよびElastic Netは、モデル内でL1正則化を使用して、係数βのフィットにスパース性を生じさせる。そのようなモデルの最適なフィットでは、最終的にサブセットS={β
k,β
k≠0}を決定することになり、ここでは係数βの多くがゼロになり、結果として、特徴のサブセットだけがモデル中で役割を果たす。
【0101】
不安定性は、機械学習モデルの特徴選択における本質的な問題である。モデルの学習段階は有限のデータサンプルを基に行われるため、データに何らかの摂動があれば、多少異なる選択された変数のセットをもたらす可能性がある。性能がクロス確認によって評価される状況では、これは、Lassoが多少異なる選択されたバイオマーカのセットをもたらし、結果の任意の生物学的解釈が不可能になることを示唆する。Lassoにおける一貫した特徴選択は、それが制約条件下でのみ達成されるため、困難である。Lassoなどの大半のスパース技術は、選択されたモデルが正しいモデルからどれほど遠いかの定量化を提供することができず、また選択された特徴の変動性を定量化することもできない。
【0102】
既存の方法のもう一つの主要な制限は、生物学的情報の種々のソースを統合することの難しさである。大半の機械学習アルゴリズムは、モデルの学習プロセスで入力データを非依存的に(agnostically)使用する。主要な課題は、学習プロセスにおいて、複数のデータソースを、それらのモダリティ、サイズ、および信号対雑音比の差異と統合することにある。学習プロセスにおいて、現在の手法は、通例、一意のデータセットとして並置されたときの個々のデータソースの寄与の査定の偏りによって制限される。最終的には、異なる各層からの特定された情報の多い特徴を一緒に使用して、そのようなアルゴリズムの予測力を最適化することが重要である。大半の方法は、個々のデータソースからの種々の結果をまとめる際に、関与する生物学的機構をモデル化するために重要である、特徴間の個々の相互作用を査定する能力も欠いている。
【0103】
ここで図面を見ると、手術リスクスコアを生成するシステムおよび方法ならびにそれらの使用が提供されている。多くの実施形態では、機械学習モデルを使用したマルチオミクス生物学的データと臨床データの統合に基づく、対象者における手術後の臨床結果の予測、分類、診断、および/または診断治療(theranosis)のための構成および方法が提供される(例えば、
図1)。多くの実施形態は、患者が手術部位合併症(SSC)を発症する確率の予測モデルを生成する方法を提供する。多くの実施形態では、予測モデルは、手術前または手術後に特定の生物学的および臨床的特徴を定量化することによって得られる。様々な実施形態は、少なくとも1つのオミクス(これらに限定されないが、ゲノミクス、サイトミクス、プロテオミクス、トランスクリプトミクス、メタボロミクスを含む)特徴を臨床データと組み合わせて使用して、予測モデルを生成する。様々な実施形態は、機械学習モデルを利用して、様々な臨床的特徴および/またはサイトミクス、プロテオミクス、トランスクリプトミクス、もしくはメタボロミクス特徴を統合して、予測モデルを生成する。一部の実施形態では、臨床結果は、SSC(手術部位感染、創傷裂開、膿瘍、または瘻形成を含む)の発症である。多くの実施形態に従う予測モデルは、SSCを発症する患者のリスクを示すことができる。
【0104】
分類または予後が行われると、それが患者または介護者に提供され得る。分類は、医療従事者や外科医の臨床意思決定を導くための予後情報を提供することができ、それは、例えば、手術のタイミングを遅らせるまたは調整する、手術手法を調整する、抗生剤および免疫調節療法の種類およびタイミングを調整する、プレリハビリテーション健康最適化プログラムを個人化または調整する、手術の前または後の病院でのより長い時間について計画を立てる、あるいは、管理された介護施設で時間を過ごすことについて計画を立てる、などである。適切な介護は、手術後の患者に対して、SSCの率、入院の長さ、および/または再入院の率を下げることができる。
【0105】
図1に示されるように、様々な実施形態は、手術を受ける個人(例えば患者)の臨床結果を予測する方法を対象とする。多くの実施形態は、102において患者サンプルを収集する。そのようなサンプルは、手術前または手術後の任意の時に収集され得る。一部の実施形態では、サンプルは、手術の前または後に最大1週間(7日間)収集される。ある特定の実施形態では、サンプルは、手術前の1日間、2日間、3日間、4日間、5日間、6日間、または7日間にわたり収集され、一部の実施形態は、手術後の1日間、2日間、3日間、4日間、5日間、6日間、または7日間、サンプルを収集する。追加的な実施形態は、手術の直前および/または直後を含む、手術の前および/または後を含む、手術日にサンプルを収集する。ある特定の実施形態は、手術、麻酔、および/または特定の外科的プロトコルもしくは手術プロトコルに含まれる任意の他の処置ステップの前、後、または前および後に、複数のサンプルを収集する。
【0106】
104において、多くの実施形態は、サンプルからオミクスデータ(例えば、プロテオミクス、サイトミクス、および/または任意の他のオミクスデータ)を取得する。ある特定の実施形態は、複数のオミクスデータ、例えば血漿プロテオミクス(例えば、血漿タンパク質発現レベルの分析)と単一細胞サイトミクス(例えば、循環免疫細胞頻度とシグナリング活動との単一細胞分析)を、マルチオミクスデータとして組み合わせる。ある特定の実施形態は、個人の臨床データを取得する。様々な実施形態に従う臨床データは、病歴、年齢、体重、体型指数(BMI)、性別(sex/gender)、現在の投薬/サプリメント、機能的状態、緊急症例、慢性症状のためのステロイド使用、腹水、多発性がん、糖尿病、高血圧、うっ血性心不全、呼吸困難、喫煙歴、重症慢性閉塞性肺疾患(COPD)の病歴、透析、急性腎不全および/または任意の他の該当する臨床データ、の1つまたは複数を含む。臨床データは、米国麻酔科学会(ASA)または米国外科学会(ACS)のリスクスコアなどの臨床リスクスコアから導出することもできる。
【0107】
追加的な実施形態は、106において、SSCなどの手術合併症の予測モデルを生成する。多くの実施形態は、本明細書に記載されるような機械学習モデルを利用する。様々な実施形態は、パイプライン方式で動作し、したがって、取得または収集されたデータが直ちに機械学習モデルに送られて、統合された手術リスクスコアを生成する。一部の実施形態は機械学習モデルをローカルに収容し、したがって、統合されたリスクスコアはネットワーク通信を伴わずに生成されるのに対し、一部の実施形態は機械学習モデルをサーバまたは他のリモートデバイス上で動作させ、したがって、臨床データおよびマルチオミクスデータはネットワークを介して送信され、統合された手術リスクスコアが、ローカルの組織、診療所、病院、および/または他の医療施設の医療専門家/従事者に戻される。
【0108】
108において、さらなる実施形態は、統合された手術リスクスコアに基づいて個人の処置を調節する。様々な実施形態において、この調節は、手術を遅らせること(例えば、改善した統合された手術リスクスコアが得られるまで)、感染を予防するために追加的な抗生剤を処方すること、および/または、統合された手術リスクスコアによって特定された増大したリスクを打ち消すように外科的処置を調節することを含み得る。この手法を用いて、患者がSSCを発症する予測確率に従って治療レジメンが個人化・適合され、それにより、個々に適切である療法を提供する。
【0109】
図1に示される実施形態は、様々な実施形態において実施され得る様々なステップ、特徴、および詳細を例示するものであり、網羅的なものでも、またすべての実施形態に対して制限的なものでもないことが留意されるべきである。加えて、様々な実施形態は、本明細書に記載されていない追加的なステップ、および/または図示・説明されるよりも少ないステップを含んでよい(例えば、ある特定のステップを省略してよい)。様々な実施形態はまた、個人においてリスクスコアまたはSSCが発症する可能性がより高いかまたはより低いかを特定するために予測モデルの生成106を繰り返すなど、ある特定のステップを繰り返してもよく、そこで、追加的なデータ、予測、または手順が個人に対して更新され得る。さらなる実施形態は、第三者から、協働する個人、部下、または他の個人から、サンプルもしくは臨床データを取得する、および/または、貯蔵されていた、もしくは以前に収集もしくは取得されたサンプルを取得してもよい。ある特定の実施形態は、さらには、図示もしくは説明されるものとは異なる順序である特定の動作もしくは機能を行う、および/または、一部の動作もしくは機能を同時に、比較的同時に行ってよい(例えば、別の動作が終了または完了する前にある動作が開始または始動してよい)。
【0110】
定義
本明細書で使用される単語の多くは、当業者によってそれらの単語にあるとみなされる意味を有する。本明細書において具体的に定義される単語は、本教示全体の文脈で与えられる意味を有し、また当業者によって通例理解される意味を有する。ある単語または語句の当分野で理解される定義と、本明細書の中で具体的に教示されるその単語または語句の定義との間に矛盾が生じる場合は、本明細書が優先されるものとする。
【0111】
本明細書で言及されるすべての文献、特許、および特許出願は、個々の文献、特許、または特許出願が参照によって組み込まれると明確にかつ個々に示された場合と同じ程度に、参照によって本明細書に組み込まれる。
【0112】
本明細書および添付の特許請求の範囲において使用される場合、単数形の「a」、「an」および「the」は、文脈が明らかに異なるように指示しない限り、複数形の対象を含むことが留意されるべきである。
【0113】
用語「対象者」、「個人」、および「患者」は、本明細書においては、脊椎動物、好ましくは哺乳動物、より好ましくはヒト、を指すために交換可能に使用される。分析用のサンプルを提供する哺乳類には、イヌ科の動物、ネコ科の動物、ウマ科の動物、ウシ科の動物、ヒツジ等、および霊長類、特にヒト、が含まれる。動物モデル、特に小哺乳動物、例えばネズミ、ウサギ等、が実験調査のために使用され得る。本発明の方法は、獣医学の目的に適用され得る。本発明の目的に関する用語「バイオマーカ」、「マーカ」、または「特徴」は、制限なく、タンパク質と、それらの関係する代謝物質、突然変異体、変異体、多型、リン酸化、修飾、断片、サブユニット、分解産物、元素、およびその他の被分析物またはサンプル由来の尺度を指す。マーカは、細胞内タンパク質または細胞外タンパク質の発現レベルを含み得る。マーカはまた、経時的傾向および差を含む、前述の測定値の任意の1つまたは複数の組合せを含み得る。広く使用される場合、マーカは、免疫細胞サブセットも指すことがある。
【0114】
本明細書で使用される場合、用語「オミクス」または「-オミクス」データは、生物分子のプール、または1つまたは複数の生体の構造、機能、および動態につながるプロセスを定量化するために生成されるデータを指す。オミクスデータの例には、(これらに限定されないが)中でもとりわけ、ゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクス、サイトミクスデータが含まれる。
【0115】
本明細書で使用される場合、用語「サイトミクス」データは、生物分子またはプロセスを単一細胞レベルで定量化することを可能にする技術または分析プラットフォームを使用して生成されるオミクスデータを指す。サイトミクスデータの例には、(これらに限定されないが)中でもとりわけ、フローサイトメトリー、マスサイトメトリー、単一細胞RNAシーケンシング、細胞画像化技術を使用して生成されるデータが含まれる。
【0116】
用語「炎症」反応は、体液性(抗体が仲介する)反応および/または細胞反応の発生であり、この細胞反応は、先天免疫細胞(好中球や単球など)によって、または抗原特異的T細胞もしくはその分泌生成物によって、仲介され得る。「免疫原」は、哺乳動物に投与されたときに、または自己免疫疾患に起因して、自らに対する免疫反応を引き起こすことが可能である。
【0117】
「分析する」ことは、サンプル中のマーカの測定(例えば、マーカの存在もしくは不在、または構成成分の発現レベルなど)によってサンプルに関連する値のセットを決定し、その測定結果を、同じ対象者または他の対照群対象者からの一サンプルまたはサンプルのセットにおける測定と比較することを含む。本教示のマーカは、当技術分野で公知の様々な従来の方法のいずれによっても分析され得る。「分析する」ことは、統計分析、例えば、データの正規化、統計的有意性の決定、統計的相関の決定、クラスタリングアルゴリズムなど、を行うことを含み得る。
【0118】
本教示の文脈における「サンプル」は、対象者から分離される任意の生物学的サンプル、一般には、循環免疫細胞を含む可能性のある血液または血漿サンプル、を指す。サンプルは、制限なく、体液、血漿、血清、全血のアリコート、PBMC(白血球(white blood)細胞または白血球(leucocytes))、組織生検、組織サンプルからの解離細胞、尿サンプル、唾液サンプル、滑液、リンパ液、腹水、および間質液または細胞外液を含み得る。「血液サンプル」は、全血、または血球、血漿、血清、白血球(white blood)細胞もしくは白血球(leucocytes)を含む、その分画を指し得る。サンプルは、これらに限定されないが、静脈穿刺、生検、針吸引、洗浄、擦過、外科的切開、もしくは介入、または当技術分野で公知の手段を含む手段により、対象者から取得することができる。
【0119】
「データセット」は、所望の条件下でサンプル(またはサンプルの集団)を評価することから得られる数値のセットである。データセットの値は、例えば、実験に基づいてサンプルから測定値を取得し、それら測定値からデータセットを構築することにより、または、代替的に、研究所などのサービス提供者から、もしくはデータセットが記憶されているデータベースやサーバからデータセットを取得することにより、取得され得る。同様に、用語「サンプルに関連するデータセットを取得すること」は、少なくとも1つのサンプルから決定されたデータのセットを取得することを包含する。データセットを取得することは、サンプルを取得し、例えば抗体結合の測定やシグナリング反応を定量化する他の方法でそのサンプルを処理して、実験に基づいてデータを決定することを包含する。この語句は、例えば、そのサンプルを処理して実験に基づいてデータセットを決定している第三者からデータのセットを受け取ることも包含する。
【0120】
本教示の文脈における「測定すること」または「測定」は、臨床サンプルもしくは対象者から導出されたサンプル中の物質の存在、不在、数量、量、もしくは有効量(そのような物質の存在、不在、もしくは濃度レベルを含む)を決定すること、および/または、対照群、例えばマーカの基準レベル、に基づいて、対象者の臨床パラメータの値もしくはカテゴリ分類を評価することを指す。
【0121】
分類は、サンプルが所与のクラスに属する確率を決定するための閾値を設定する予測モデリング方法に従って行われ得る。確率は、好ましくは、少なくとも50%、もしくは少なくとも60%、もしくは少なくとも70%、もしくは少なくとも80%またはそれよりも高い。分類は、得られたデータセットと参照データセットとの比較が統計的に有意な差をもたらすかどうかを決定することによって行うこともできる。有意な差をもたらす場合、データセットの取得元サンプルは、参照データセットクラスに属さないと分類される。逆に、そのような比較が参照データセットから統計的に有意に異ならない場合、データセットの取得元サンプルは、参照データセットクラスに属すると分類される。
【0122】
モデルの予測能力は、品質指標、例えば曲線下面積(AUC:Area Under the Curve)、または特定の値もしくは値の範囲の精度、を提供するその能力に従って評価され得る。一部の実施形態では、望まれる品質閾値は、サンプルを、少なくとも約0.7、少なくとも約0.75、少なくとも約0.8、少なくとも約0.85、少なくとも約0.9、少なくとも約0.95、またはそれよりも高い精度で分類する予測モデルである。代替の尺度として、望まれる品質閾値は、サンプルを、少なくとも約0.7、少なくとも約0.75、少なくとも約0.8、少なくとも約0.85、少なくとも約0.9、またはそれよりも高いAUCで分類する予測モデルを指し得る。
【0123】
当技術分野で公知であるように、予測モデルの相対感度と特異度とは、選択性指標または感度指標のどちらかに有利に働くように「チューニング」することができ、この2つの指標は逆関係を有する。上記で説明したようなモデルの制限を、行われている検査の特定の要件に応じて、選択された感度または特異度レベルを提供するように調節することができる。感度および特異度の一方または両方は、少なくとも約0.7、少なくとも約0.75、少なくとも約0.8、少なくとも約0.85、少なくとも約0.9、またはそれよりも高くあり得る。
【0124】
本明細書で使用される場合、用語「診断治療(theranosis)」は、治療療法の選択、維持、またはある治療療法への変更を導くための、予後方法または診断方法から得られた結果の使用を指し、それらには、これらに限定されないが、1つまたは複数の治療剤の選択、用量の変更、投与スケジュールの変更、服用モードの変更、および調合の変更が含まれる。診断治療に情報を提供するために使用される診断方法は、疾患、症状、または兆候の状態についての情報を提供する任意の方法を含み得る。
【0125】
用語「治療剤」、「治療可能薬剤」、または「治療薬剤」は、交換可能に使用され、対象者に投与されたときに何らかの有益な効果を与える分子、化合物、または任意の非薬理学的療法を指す。有益な効果には、診断の決定を可能にすること、疾患、兆候、障害、または病理学的症状の緩和、疾患、兆候、障害または症状の開始の低減または予防、および一般に疾患、兆候、障害、または病理学的症状を阻止することが含まれる。
【0126】
本明細書で使用される場合、「処置」もしくは「処置すること」、または「軽減すること」、または「緩和すること」は、交換可能に使用される。これらの用語は、これらに限定されないが、治療的利益および/または予防的利益を含む、有益なまたは望まれる結果を得るための手法を指す。治療的利益とは、治療を受けている1つまたは複数の疾患、症状、または兆候の何らかの治療に関連する改善またはそれに対する効果を意味する。予防的利益については、特定の疾患、症状、もしくは兆候が発症するリスクのある対象者、または、その疾患、症状、もしくは兆候がまだ顕在化していない可能性があっても、ある疾患の生理学的兆候の1つまたは複数を報告している対象者に、調合物が投与されてよい。
【0127】
用語「有効量」または「治療上有効な量」は、有益なまたは望まれる結果を実現させるのに十分な薬剤の量を指す。治療上有効な量は、対象者および治療対象の疾患症状、対象者の体重と年齢、疾患症状の重篤度、投与の方式等に応じて変動し、これらは、当業者によって容易に決定することが可能である。この用語は、本明細書に記載される画像化方法のいずれか1つによって検出用の画像を提供する用量にも当てはまる。具体的な用量は、選択される特定の薬剤、採用される服用療法、他の化合物との組合せで投与されるかどうか、投与のタイミング、画像化される組織、および薬剤が運ばれる身体的送達システムに応じて変動する。
【0128】
「適する条件」は、この用語が使用される文脈に応じた意味を有するものとする。すなわち、抗体との関連で使用される場合、この用語は、抗体がその対応する抗原に結合することを可能にする条件を意味するものとする。薬剤を細胞に接触させることに関連して使用される場合、この用語は、それを行うことが可能な薬剤が細胞に入り、その意図される機能を行うことを可能にする条件を意味するものとする。一実施形態では、本明細書で使用される用語「適する条件」は、生理学的条件を意味する。
【0129】
用語「抗体」は、全長抗体および抗体断片を含み、任意の生体からの天然抗体、改変された抗体、または下記でさらに定義されるように、実験、治療、もしくはその他の目的のために組換えによって生成された抗体を指し得る。当技術分野で公知の抗体断片の例には、全抗体の修飾によって生成される、または組換えDNA技術を使用してde novoで合成された、Fab、Fab’、F(ab’)2、Fv、scFv、または抗体のその他の抗原結合部分シーケンスがある。用語「抗体」は、モノクローナル抗体およびポリクローナル抗体を含む。抗体は、アンタゴニスト、アゴニスト、中和抗体、抑制抗体、または刺激抗体であり得る。それらは、ヒト化され、グリコシル化され、固体支持体に結合し得、他の変種を有する。
手術結果を予測するための機械学習方法
【0130】
手術後の臨床結果の予測モデルを得るために、多くの実施形態は、マスサイトメトリーを使用した免疫細胞反応の単一細胞分析を、手術前または手術後に患者から収集された血液サンプル中の炎症性血漿タンパク質の多重査定と統合する機械学習方法を用いる。多くの実施形態は、マルチオミクスブートストラップ(MOB)機械学習方法を用いて手術後のSSCの発症を予測する。MOBは、様々な実施形態に従い、各データ層から最もロバストな特徴を抽出した後にそれらの特徴を組み合わせることにより、1つまたは複数のオミクスデータカテゴリ(例えば、本明細書に記載されるカテゴリ)を統合し、オミクスデータセットの統計的モデリングの際に選択される特徴の安定性を保証する。
【0131】
安定性選択方法の開発(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Nicolai Meinshausen. Peter Buhlmann. Ann. Statist. 34 (3) 1436 - 1462, June 2006を参照)は、MOBアルゴリズムの開発における重要な要素である。変動性の問題は本質的なものであり、完全に克服することはできないが、安定性選択は、サブサンプリングされたデータに基づいて複数のLassoモデルが取得されるときに各特徴が選択される頻度を考慮することにより、この変動を特徴付けることができる。選択頻度は、生物学的観点から容易に解釈することが可能な、各特徴の重要度についての定量的な尺度を与える。安定性選択は、Lassoに比べて、漸近一定な変数選択のために必要とする仮定がはるかに弱いことが示されている。言い方を変えると、安定性選択は、1つのモデルを選択する代わりに、データを繰り返しサブサンプリングし、安定した変数、すなわち、結果として得られるモデルの大きい割合に出現する変数、を選択する。選択された安定した変数は、次のように、選択された閾値を上回る選択頻度を有することによって定義され、
【数6】
ここで、
【数7】
は、正則化パラメータλについての特徴kの選択頻度である。
【0132】
前の方法の困難の1つは、ノイズを査定するのが難しいことである。目標は、予測する変数からノイズの多い変数を区別することであるので、負の対照特徴を使用することが、学習プロセスで内部ノイズフィルタを開発するのに適切な手法である。負の対照特徴は、合成的に作られたノイズの多い特徴を言う。この作業の主要な寄与の一つは、適切に構築された場合、安定性選択プロセスにおいて、前に述べた閾値を人工特徴の分布から適合することが可能になることである。これらの人工特徴を生成する2つの方式が検討されている。両技術とも、初期入力を拡張して、最終的に入力行列
【数8】
を得、ここで、
【数9】
は、合成の負の対照の行列である。「デコイ」と呼ばれる第1の技術は、確率的構成に依拠する。各合成特徴は、その元の相当物のランダムな置換によって構築される(置換は合成特徴ごとに独立している)。このプロセスは、データの各サブサンプリングの前に行われる。すると、安定性選択においてデコイ特徴の挙動から閾値を定義することが可能となり、例えば:
【数10】
ここで、cは、ユーザによって設定される比であり、
【数11】
は、デコイ特徴の選択頻度の最大値の平均である。もう一方の技術は、モデルXノックオフ(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Candes, Emmanuel, et al. "Panning for gold: 'model-X'knockoffs for high dimensional controlled variable selection." Journal of the Royal Statistical Society: Series B (Statistical Methodology) 80.3 (2018): 551-577を参照)を使用して、合成された負の対照を構築する。この構成は、元のデータの分布を複製し(注目すべき点として、ノックオフ相関は元のものを模倣している)、
【数12】
であることを認識して
【数13】
の分布がYの分布に対して直交することを保証する。そして、安定性選択を行った後に真の変数/ノックオフ変数の各ペアを比較し、以下の場合に特徴kを選択することが可能である:
【数14】
ここで、
【数15】
および
【数16】
は、特徴kおよびそのノックオフ相当物の選択頻度であり、cstは、ユーザによって定義される正の定数である。
【0133】
機械学習モデルは、通例、複数の個々のデータ層に対して、他のステップの中でもとりわけブートストラップ手順を使用して訓練される。各データ層は、複数のあり得る特徴および少なくとも1つの人工特徴からの1つのタイプのデータを表す。各特徴は、例えば、ゲノミクス、トランスクリプトミクス、プロテオミクス、サイトミクス、メタボロミクス、臨床、および人口統計学的データからなる群の中から選択される。
【0134】
各データ層は、個人の集団についてのデータを含み、各特徴は、その個人の集団中のすべての個人の特徴値を含む。機械学習中に、データ層ごとに、個人の集団に対して得られた特徴値は通例、n行およびp列の行列Xに配置され、各行はそれぞれの個人に対応し、各列はそれぞれの特徴に対応する。言い換えると、行列Xは、p個のベクトルを連結したものであり、各ベクトルは、それぞれの特徴に関係し、n個の特徴値を含んでおり、通例は各個人に1つの特徴値がある。
【0135】
それぞれのデータ層について、各人工特徴は、複数の特徴のうちの非人工特徴から、その非人工特徴の特徴値に対して行われる数学的演算を介して取得される。数学的演算は、例えば、置換、サンプリング、組合せ、ノックオフ方法、および推論からなる群の中から選択される。置換は、例えば、特徴値の置き換えを伴わない全置換である。サンプリングは、通例、特徴値の一部の置き換えを伴うサンプリングまたは特徴値の置き換えを伴わないサンプリングである。組合せは、例えば、特徴値の線形組合せである。ノックオフ方法は、例えば、特徴値に適用されるモデルXノックオフである。推論は通例、正規分布、指数分布、一様分布、またはポアソン分布などの特徴値の統計的分布のフィットと、次いでそこからのランダムな推論サンプリングである。人工特徴の取得は、人工特徴のスパイクとも呼ばれ、
図3Aおよび
図3Bの擬似コード中の命令2に相当する。
【0136】
モデルは、選択された生物学的特徴および臨床的特徴または人口統計学的特徴のセットに対する重みβiを含み、このような重みβiは通例、モデルの機械学習中に繰り返し変更される初期重みwjから導出される。
【0137】
機械学習中に各データ層について、ブートストラップの繰り返しごとに、初期統計的学習技術を使用することにより、そのデータ層に関連する複数の特徴および少なくとも1つの人工特徴に対して初期重みw
jが算出される。ブートストラップサンプルの生成と、それぞれ係数とも呼ばれる初期重みw
jの推定は、
図3Aおよび
図3Bの擬似コード中の命令4およびそれぞれ命令5に相当する。
【0138】
初期統計的学習技術は、通例、スパース技術または非スパース技術である。初期統計的学習技術は、例えば回帰技術または分類技術である。そのため、初期統計的学習技術は、好ましくは、スパース回帰技術、スパース分類技術、非スパース回帰技術、および非スパース分類技術からなる群の中から選択される。
【0139】
一例として、初期統計的学習技術は、したがって、Lasso技術やElastic Net技術などのL1またはL2正則化を用いる線形またはロジスティック線形回帰技術(例えば、上記で引用されたTibshiraniおよびZou and Hastieを参照)、Bolasso技術などの、L1またはL2正則化を用いるモデル適合線形またはロジスティック線形回帰技術(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Bach, Francis R. "Bolasso: model consistent lasso estimation through the bootstrap." Proceedings of the 25th international conference on Machine learning. 2008を参照)、relaxed Lasso(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Meinshausen, Nicolai. "Relaxed lasso." Computational Statistics & Data Analysis 52.1 (2007): 374-393を参照)、ランダムLasso技術(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Wang, Sijian, et al. "Random lasso." The annals of applied statistics 5.1 (2011): 468を参照)、グループ化Lasso技術(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Friedman, Jerome, Trevor Hastie, and Robert Tibshirani. Applications of the lasso and grouped lasso to the estimation of sparse graphical models. Technical report, Stanford University, 2010を参照)、LARS技術(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Eyraud, Remi, Colin De La Higuera, and Jean-Christophe Janodet. "LARS: A learning algorithm for rewriting systems." Machine Learning 66.1 (2007): 7-31を参照)、L1またはL2正則化を用いない線形またはロジスティック線形回帰技術、L1またはL2正則化を用いる非線形回帰または分類技術、決定木技術、ランダムフォレスト技術、SVM技術とも呼ばれるサポートベクトルマシン技術、ニューラルネットワーク技術、およびカーネル平滑化技術、からなる群の中から選択される。
【0140】
次いで、算出された初期重みw
jに依存する統計的基準に基づいて、少なくとも1つの選択された特徴が各データ層に対して決定される。統計的基準は、算出された初期重みw
jのうちの有効な重みに依存する。有効な重みは、例えば、初期統計的学習技術がスパース回帰技術である場合、非ゼロの重みであり、または、初期統計的学習技術が非スパース回帰技術である場合、事前に定められた重み閾値を上回る重みである。有効な重みの決定は、
図3Aおよび
図3Bの擬似コード中の命令6に相当する。
【0141】
一例として、初期統計的学習技術が、Lasso技術やElastic Net技術などのL1またはL2正則化を用いる線形またはロジスティック線形回帰技術;Bolasso技術、relaxed Lasso、ランダムLasso技術、グループ化Lasso技術、LARS技術などのL1またはL2正則化を用いるモデル適合線形またはロジスティック線形回帰技術;L1またはL2正則化を用いる非線形回帰または分類技術;およびカーネル平滑化技術、からなる群の中から選択される場合、有効な重みは非ゼロの重みである。
【0142】
「非ゼロの重み」は、絶対値が、事前に定められた非常に低い閾値、例えば10-5(1e-5とも表記される)、よりも大きい重みを指す。そのため、「非ゼロの重み」は通例、絶対値が10-5よりも大きい重みを言う。
【0143】
代替として、初期統計的学習技術が、L1またはL2正則化を用いない線形またはロジスティック線形回帰技術、決定木技術、ランダムフォレスト技術、サポートベクトルマシン技術、およびニューラルネットワーク技術からなる群の中から選択される場合、有効な重みは、事前に定められた重み閾値を上回る重みである。ニューラルネットワーク技術の例では、有効な重みは、対応するニューラルネットワークの最初の層で事前に定められた重み閾値を上回る重みである。
【0144】
当業者は、サポートベクトルマシン技術は、サポートベクトルを用いるスパース技術と考えられ、この技術は、サポートベクトルだけを取っておくことにつながることを認識するであろう。当業者はまた、決定木技術の場合、前述の重みは特徴の重要度に対応すること、したがって、有効な重みは、決定木内での分割が不純度の一定程度の低下を引き起こす特徴であることにも気が付くであろう。
【0145】
必要に応じて、初期重みwjはさらに、ハイパーパラメータλの複数の値について算出され、ハイパーパラメータλは、学習プロセスを制御するために値が使用されるパラメータである。ハイパーパラメータλは、通例、スパース初期技術の文脈でそれぞれの数学的ノルムに従って使用される正則化係数である。数学的ノルムは例えばPノルムであり、Pは整数である。
【0146】
一例として、ハイパーパラメータλは、初期統計的学習技術がLasso技術である場合には、初期重みwjのL1ノルムの係数の上限であり、ここでL1ノルムは、初期重みのすべての絶対値の和を指す。
【0147】
別の例として、ハイパーパラメータλは、初期統計的学習技術がElastic Net技術である場合、初期重みwjのL1ノルムの和と初期重みwjのL2ノルムの和の両方の係数の上限であり、L1ノルムは上記で定義されており、L2ノルムは、初期重みのすべての平方値の和の平方根を指す。
【0148】
特徴選択に関して、統計的基準は、例えば、有効な重みの発生頻度に依存する。一例として、統計的基準は、各特徴が、その発生頻度が頻度閾値より大きい場合に選択されるというものである。
【0149】
特徴ごとに、発生頻度を決定するために、単位発生頻度が、ハイパーパラメータλの各値について計算され、単位発生頻度は、連続したブートストラップ繰り返しについての前記特徴に関係する有効な重みの数を前記特徴に対して使用されたブートストラップ繰り返しの回数で割った値に等しい。そして、発生頻度は通例、ハイパーパラメータλのすべての値に対して計算された単位発生頻度のうちの最も高い単位発生頻度に等しい。選択頻度とも呼ばれる、各特徴の発生頻度の決定は、
図3Aおよび
図3Bの擬似コード中の命令8および10に相当する。
【0150】
頻度閾値は、通例、人工特徴に対して得られた発生頻度に従って算出される。この頻度閾値は、例えば、人工特徴に対して得られた発生頻度の平均または中央値に対して2標準偏差である。代替として、頻度閾値は、人工特徴に対して得られた発生頻度の平均の3倍である。さらに代替として、頻度閾値は、計算された頻度閾値の上述の例のうち1つと、事前に定められた頻度閾値との間の最大値に等しい。頻度閾値の算出は、
図3Aおよび
図3Bの擬似コード中の命令11に相当する。
【0151】
最後に、特徴選択は、統計的基準に基づいて各層ごとに実施される。例えば、選択される特徴は、発生頻度が頻度閾値よりも大きい特徴である。特徴選択は、
図3Aおよび
図3Bの擬似コード中の命令12に相当する。
【0152】
一例として、ハイパーパラメータλの各値は、ハイパーパラメータλの選択された値範囲の下限と上限との間の値から事前に定められた方式に従って選択される。変形例として、ハイパーパラメータλの値は、ハイパーパラメータλの選択された値範囲の下限と上限との間に均等に分散される。初期統計的学習技術がLasso技術またはElastic Net技術である場合、ハイパーパラメータλは、通例、0.5~100の間である。
【0153】
ブートストラッピングプロセスについて、ブートストラップ繰り返しの回数は、通例、50~100000回の間、好ましくは500~10000の間、さらに好ましくは10000に等しい。
【0154】
機械学習中に、特徴選択の後、モデルの重みβiは、選択された特徴のセットに関連するデータに対して最終統計的学習技術を使用してさらに算出される。
【0155】
最終統計的学習技術は、通例、スパース技術または非スパース技術である。最終統計的学習技術は、例えば回帰技術または分類技術である。そのため、最終統計的学習技術は、好ましくは、スパース回帰技術、スパース分類技術、非スパース回帰技術、および非スパース分類技術からなる群の中から選択される。
【0156】
一例として、最終統計的学習技術は、したがって、Lasso技術やElastic Net技術などのL1またはL2正則化を用いる線形またはロジスティック線形回帰技術;bo-Lasso技術、soft-Lasso技術、ランダムLasso技術、グループ化Lasso技術、LARS技術などのL1またはL2正則化を用いるモデル適合線形またはロジスティック線形回帰技術;L1またはL2正則化を用いない線形またはロジスティック線形回帰技術;L1またはL2正則化を用いる非線形回帰または分類技術;決定木技術;ランダムフォレスト技術;SVM技術とも呼ばれるサポートベクトルマシン技術;ニューラルネットワーク技術;およびカーネル平滑化技術、からなる群の中から選択される。
【0157】
機械学習に続く使用段階の間、手術リスクスコアは、選択された特徴のセットに対する個人の測定値に従って算出される。
【0158】
一例として最終統計的学習技術がそれぞれの分類技術である場合、手術リスクスコアは、各測定値に、選択された特徴のセットについてのそれぞれの重みβiを乗算した値の重み付き和に従って計算される確率である。
【0159】
この例によると、手術リスクスコアは、通例、次の式で計算され、
【数17】
ここで、Pは、手術リスクスコアを表し、
Oddは、重み付き和に依存する項である。
【0160】
さらなる例として、Oddは、重み付き和の指数である。Oddは、例えば、次の式に従って計算され、
【数18】
ここで、expは、指数関数を表し、
β
0は、事前に定められた定数値を表し、
β
iは、選択された特徴のセットの中のそれぞれの特徴に関連する重みを表し、
X
iは、それぞれの特徴に関連する個人の測定値を表し、
iは、選択された各特徴に関連するインデックスであり、iは、1~p
stableの間の整数であり、p
stableは、それぞれの層の選択された特徴の数である。
【0161】
当業者は、上記式において、重みβiおよび測定値Xiは負の値であっても正の値であってもよいことに気付かれよう。
【0162】
別の例として、最終統計的学習技術がそれぞれの回帰技術である場合、手術リスクスコアは、各測定値に、選択された特徴のセットについてのそれぞれの重みβiを乗算した値の重み付き和に依存する項である。
【0163】
この別の例に従うと、手術リスクスコアは、通例は上記の式で計算される重み付き和の指数に等しい。
【0164】
必要に応じた追加として、機械学習の間に、人工特徴を取得する前に、取得された値に基づき、データ拡張技術を使用して複数の非人工特徴の追加的な値が生成される。この必要に応じた追加に従うと、人工特徴は、その後、取得された値と生成された追加的な値の両方に従って取得される。
【0165】
この必要に応じた追加に従うと、データ拡張技術は、通例、非合成技術または合成技術である。データ拡張技術は、例えば、SMOTE技術、ADASYN技術、およびSVMSMOTE技術からなる群の中から選択される。
【0166】
この必要に応じた追加に従うと、所与の非人工特徴に対して、取得された値が少ないほど、より多くの追加的な値が生成される。
【0167】
この必要に応じた追加に従うと、データ拡張技術を使用したこの追加的な値の生成は、ブートストラッププロセスの前の必要に応じた追加ステップである。上記に従うと、この生成は、初期入力行列Xおよび対応する出力ベクトルYをデータ拡張アルゴリズムで「拡張する」、すなわち、行列XおよびベクトルYのそれぞれの大きさを増大させることを可能にする。行列Xが大きさ(n,p)である場合、ベクトルYは大きさ(n)である。この生成ステップは、大きさ(n’,p)のXaugmentedおよび大きさ(n’)のYaugmentedにつながり、ここでn’>nである。
【0168】
この生成は、好ましくは、ブートストラッププロセスよりも精緻である。目標は、サンプルのランダムな複製ではなく、取得されたサンプルを使用して構築された合成サンプルを作成することにより、入力を「拡張」することである。実際、非人工特徴値を単に複製した場合、その拡張は、非人工特徴値がすでにオーバーサンプリングされているおよび/または複製されている可能性のあるブートストラッププロセスと実質的に異ならないものになる。必要に応じたデータ拡張の追加では、したがって、ブートストラッププロセスには、元のものに追加された新しいデータ点が供給されることになる。
【0169】
分類に関して、データ拡張技術は、例えば、SMOTEアルゴリズムまたはSMOTEとも呼ばれるSMOTE技術である。SMOTEは、まず少数派クラスインスタンスAをランダムに選択し、そのK個の最も近い少数派クラス近傍を見つける(K近傍法を使用する)。次いで、K個の最も近い近傍Bのうちの1つをランダムに選択し、AとBとを連結して特徴空間内に線分を形成することにより、合成インスタンスが作成される。合成インスタンスは、2つの選択されたインスタンスの凸結合として生成される。当業者は、この技術は、人工的にクラス間のバランスを取る手段でもあることに気付かれよう。変形例として、データ拡張技術は、ADASYN技術またはSVMSMOTE技術である。
【0170】
手術部位合併症の場合、すなわち、決定されるリスクがSSCである場合、アルゴリズムは、各層に独立して適用される。SSCを決定するために使用される層は、例えば以下のものである:免疫細胞頻度(24個の細胞頻度特徴を含んでいる)、各細胞サブセットの基底シグナリング活動(312個の基底シグナリング特徴)、各刺激条件に対するシグナリング反応能力(各々が312個の特徴を含んでいる6つのデータ層)、および血漿プロテオミクス(276個のプロテオミクス特徴)。
【0171】
一例として、各層につき、41個のサンプルがある。言い換えると、各特徴の特徴値の数nは、この例では41に等しい。そのため、免疫頻度層の場合、行列Xの次元は、41サンプル(n)×24特徴(p)である。基底シグナリングの場合、行列Xは、次元41×312である。Yは、結果値、すなわちSSCの発生、のベクトルである。このベクトルYは、この場合、長さ41のベクトルである。そのため、各サンプルに対して、1つのそれぞれの結果値、すなわち1つのSSC値、が決定される。
【0172】
この例では、Mは10000に等しく選択され、これは、人工特徴に対する選択頻度の推定値を導出するのに十分なサンプリングを可能にする。
【0173】
ハイパーパラメータλの選択された範囲値は、統計的学習技術がLasso技術またはElastic Net技術であるとき、0.5~100の間である。
【0174】
この例では、頻度閾値は、人工特徴に対して得られた発生頻度の平均の3倍に等しく選択され、それにより変動性を低減し、特徴の選択に対する厳格なコントロールを可能にする。
【0175】
以降の
図2、
図3A、および
図3Bの例で、当業者は、人工特徴を得るために使用される数学的演算は置換またはサンプリングであることに気付き、また、上記の説明で言及された他の数学的演算、すなわち、組合せ、ノックオフ、および推論、を含む他の数学的演算も適用可能であることを理解するであろう。同様に、これらの例では、初期重みを算出するために使用される統計的学習技術は、LassoやElastic Netなどのスパース回帰技術であり、当業者は、上記の説明で言及された他の統計的学習技術、すなわち非スパース技術および分類技術を含む、他の統計的学習技術も適用可能であり得ることも理解するであろう。これらの例では、有効な重みは非ゼロの重みであり、当業者は、上記で説明したように、初期統計的学習技術の種類に応じて、事前に定められた重み閾値を上回る重みなどの他の有効な重みも適用可能であることも理解するであろう。
【0176】
図2を見ると、多くの実施形態に従って使用されるMOBアルゴリズムが模式的に図示されている。そのような実施形態では、202において、個々のデータ層での置き換えを伴ってまたは伴わずに、繰り返されるサンプリングを使用する手順により、元のコホートからサブセットが取得される。多数の実施形態において、人工特徴は、元のサンプルの分布からのランダムサンプリングによってまたは置換によって含められ、元のデータセットに追加される。204において、サブセットの各々に対して、例えばLassoアルゴリズムを使用して、個々のモデルが算出され、モデル中での寄与に基づいて特徴が選択される(Lassoの場合、非ゼロの特徴が選択される)。206において、各モデルに対して選択された特徴を使用して、ハイパーパラメータにより、多くの実施形態は、各寄与特徴(人工特徴であってもそうでもなくても)の選択頻度を表示する安定性経路を取得する。次いで、人工特徴の選択の分布を使用して、データセット内のノイズの分布を推定する。関連する生物学的特徴または臨床的特徴のカットオフが、データセット中のノイズの推定分布に基づいて算出される。各層からの関連する特徴は、次いで、関連する手術結果の予測のために、最終モデルの中で使用され、組み合わされる。208において、モデルの最終的な統合が行われ、ここで、202~206で説明されたプロセスと同様の選択のプロセスにより、個々の層の各々が組み合わされる。208において、すべての上位の特徴が組み合わされ、最終層における予測子として使用される。
【0177】
図3A~3Bは、様々な実施形態のMOBアルゴリズムの例示的な擬似コードを示す。多くの実施形態では、MOBは、ブートストラップと呼ばれる、置き換えを伴うまたは伴わない複数のリサンプリングの手順を個々のデータ層に対して使用する。各データ層で、ブートストラップの繰り返しのたびに、シミュレーションされた特徴を元のデータセット中でスパイクして、人工特徴と比較して生物学的特徴を選択するロバスト性を推定する。生物学的特徴または臨床的特徴の最適なカットオフは、そのデータ層からの生物学的特徴または臨床的特徴のロバスト性に対するノイズの挙動を推定するために使用された人工特徴の分布を使用して選択される。そして、MOBアルゴリズムは、各層においてノイズの分布から計算された最適な閾値を上回る特徴を選択し、ロバスト性の最適な閾値に合格した各データ層からの特徴を用いて最終モデルを構築する。多くの実施形態では、性能がベンチマーク試験され、特徴選択についての安定性が、シミュレートされたデータおよび生物学的データに基づいて評価される。
【0178】
図3A~
図3Bに実証される実施形態では、そのような実施形態は、最初に、個々のデータ層での置き換えを伴うまたは伴わない、繰り返されるサンプリングを使用する手順で、元のコホートからサブセットを取得する。ブートストラップごとに、元のデータ行列の特徴(大きさpのベクトル)を1つずつ選択することにより、人工特徴が構築される。人工特徴を構築するために、そのような実施形態は、ランダム置換(ベクトルのすべての値は置き換えずにランダムに抜き出すことに相当する)、またはランダムサンプリング(元の特徴のp個の要素を置き換えて、ランダムに抜き出すことにより、大きさpの新しいベクトルを構築する)のいずれかを行う。このプロセスは、各特徴に対して独立に繰り返される。そのような実施形態は、人工特徴を本物の特徴と連結し、次いで、この連結されたデータセットから、サンプルの置き換えと共にまたは置き換えを伴わずに抜き出す。
【0179】
次に、サブセットの各々について、例えば、Lassoアルゴリズム(Tibshirani, R. (1996). Journal of the Royal Statistical Society: Series B (Methodological), 58(1), 267-288.)を使用して、個々のモデルが算出され、モデル中での寄与に基づいて特徴が選択される(Lassoの場合、非ゼロの特徴が選択される)。プロセスのこの段階で、寄与する特徴は、Lassoをフィッティングするときに非ゼロの係数を有する。これは、Elastic Netなどのスパース性を引き起こすどの他の技術でも同じである。非スパース回帰技術の場合には、任意の寄与閾値が定義される必要がある。このアルゴリズムは、使用される機械学習技術に合わせて適合可能である。Lassoは周知のスパース回帰技術であるが、元の特徴のサブセットを選択する他の技術が使用され得る。例えば、LassoとRidgeの組合せであるElastic Net(EN)も機能するであろう(Zou, H., & Hastie, T. (2005). Journal of the royal statistical society: series B (statistical methodology), 67(2), 301-320.)。
【0180】
さらに、各モデルに対して選択された特徴を使用して、ハイパーパラメータにより、安定性経路を得ることができ、これは各寄与特徴(人工のまたは本物の)の選択頻度を表示する。安定性経路は、任意の図形的な変換が行われる前には、プロセスの出力行列である。その大きさは、(p,#{Lambda})である。各値(feature_i,lambda_j)は、パラメータlambda_jを使用したfeature_iの選択の頻度に対応する。この行列から、そのような実施形態は、各特徴の経路を表示することが可能であり(例えば、
図2、206)、ここで、各行は、検査されるすべてのラムダにわたる各特徴の選択の頻度に対応する。次いで、人工特徴の選択の分布を使用して、データセット中のノイズの分布を推定する。関連する生物学的特徴または臨床的特徴のカットオフが、データセット中のノイズの推定分布に基づいて算出される。そして、各層からの関連する特徴だけが、関連する手術結果の予測のために、最終モデルの中で使用され、組み合わされる。
図3Bの実施形態では、最終モデルは、各データ層で得られた選択された特徴を使用する。したがって、最終モデルの入力は、大きさ(n,p_stable)であり、p_stableは、選択された特徴の数である(すべての層が含まれる)。p_stableは、元の特徴空間の次元よりも大幅に小さい。この縮小された行列が次いで結果の予測のために訓練される。
【0181】
図3Bに示される例示的実施形態は、より広い範囲のハイパーパラメータを提供する。例えば、
図3Aに示される例示的実施形態では、最適なパラメータの選択は、Leave-One-Out交差検証フィットに制約
【数19】
を加えて損失min_
β||Y-βX||_2を最小にすることにより、各ブートストラップにおけるパラメータの最適化に基づいて決定され、一方、
図3Bの例示的実施形態は、ラムダの様々な値を通じて結果をサンプリングし、したがって、「安定性経路」のプロットを可能にする。
【0182】
加えて、
図3Bの例示的実施形態は、すべての人工特徴の分布に基づく選択閾値の使用を可能にし、具体的には、カットオフは、人工特徴の全体分布に基づいて定義される。カットオフを定義するために、そのような実施形態は、各人工特徴の選択の確率の最大値を取り、次いでそれら最大値の平均を取る。この平均から、そのような実施形態は閾値を構築することができる(例えば、平均から3標準偏差)。対して、
図3Aに示される実施形態では、最大の選択頻度をもつ人工特徴だけが使用され得る。
【0183】
さらに、
図3Bの例示的実施形態は、アルゴリズムの複雑度を簡素化するために、人工的な生成とブートストラップ手順の組合せを可能にする。
【0184】
より詳細には、
図3Bに示されるような実施形態は以下を提供する。
1.人工特徴選択のサンプリング可能性の適正な評価を得るためのブートストラップ繰り返しの回数にわたる反復。インデックスを追跡して、元の分布からのまたは置換を介したサンプリングが複数の試行にわたってどのように振舞うかを調べる。これは、アルゴリズム中の最初のforループに相当し、行10~13で結果をもたらす。
2.置換またはランダムサンプリングは、元のデータセットから得られ、生成される行列は、元の行列と算出された人工特徴の新しい行列との並置である。人工特徴の数(p’)は、変動し得るが、通例は、アルゴリズムに含まれる元の特徴の数と一致するように選択される。計算の目的のために、pが非常に大きい場合、p’にはより小さい数を選択することができる。
3.選択されたアルゴリズムハイパーパラメータに対する選択の挙動を適正に調査するために、グリッド検索型の方式を用いて、ハイパーパラメータの種々の組合せを評価し、次いで「安定性経路」の曲線をプロットするために使用する(
図2参照)。このステップは、限られた量のハイパーパラメータだけが検査される場合には、欠損する情報を回避するための手段でもある。検査されるハイパーパラメータの範囲を徹底的に調査してアーチファクトを回避することができる(例えば、Lassoの場合にラムダ=0を検査すると、すべてのブートストラップ手順についてすべての特徴を選択することになり、選択の頻度の最大値がすべて1に等しくなる事例を招く)。
4~6.所与の数のスパイクで、ハイパーパラメータの選択された各値について、リサンプリング手順は、モデルフィット挙動の推定と、データセット中で小さい変化に対して最もロバストな特徴の選択とを可能にする。モデルフィット挙動により、モデルは、ハイパーパラメータの所与の値についてLassoによる選択の確率の査定を参照する。ブートストラップ(リサンプリング手順)は、元のデータセットにほとんど摂動を引き起こさないことを可能にし、よりロバストな特徴だけが、他と比べて高い頻度で選択される。ENまたはLassoアルゴリズムは、元のコホートの小さな変化に対して非常に変動しがちであり、特に、あまりロバストでない特徴を選びやすいという意味でそうであり、したがって、新しいコホートに対する生物学的解釈およびロバスト性を困難にする。この状況では、リサンプリングは、元のコホートを中心とする小さい変動を生み出す。この手順は、特徴選択におけるロバスト性を適正に調査することができる。
8.L1正則化によってスパース性を引き起こすことと併せた係数の抽出。この抽出では、非ゼロの係数(通例は絶対値が1e-5)の単純なカットオフを使用して、ブートストラップ手順の各ステップで上位成績の特徴を選択する。ブートストラップ手順の各反復におけるこの上位成績の特徴の選択は、モデルが、データセットの各特徴について選択の頻度を導出することを可能にする。
10~12.モデルはスパイクされた人工特徴を含んでいるので、モデルは、安定性経路の定義を使用して、データセット中の典型的な「ノイズ」の分布を推定し、その分布を使用して関連する特徴のカットオフを算出することができる。このカットオフは、通例、人工特徴の平均または中央値の安定性経路に対して2標準偏差、または人工特徴の選択の最大確率の平均の3倍である。構築された閾値と任意の固定の閾値との間の最大値を取るために、任意の固定の閾値が追加されることも可能である。一部の実施形態は、各人工特徴の選択の確率の最大値を取り、次いでそれら最大値の平均を取って閾値を構築する(2
*、3
*、またはこの閾値と任意の固定の閾値との組合せ)。
【0185】
図4を見ると、マルチオミクス生物学的データを生成し、マルチオミクス生物学的データと臨床データとを統合するSSCの予測MOBモデルを生成する例示的方法が示されている。402において、ある特定の実施形態は、個人から生物学的サンプルを取得する。
図4は採血(全血および血漿)を示しているが、様々な実施形態は、他の組織、流体、および/または別の生物学的ソースから生物学的サンプルを取得する。生物学的サンプルは、手術前(手術日または「DOS(day of surgery)」を含む)および/または手術後に取得され得る。手術前サンプルは、7日間、6日間、5日間、4日間、3日間、2日間、1日間、および/または0日間(すなわち、手術日の最初の切開の前)、取得することが可能であり、一方、手術後サンプルは、手術後0時間、1時間、3時間、6時間、8時間、10時間、12時間、16時間、18時間、および/または24時間(すなわち、術後一日目(POD(Post Operative Day)1))を含む、手術後24時間以内に取得することができる。多くの実施形態の404において、マルチオミクスデータが、生物学的サンプルから取得される。そのようなマルチオミクスデータは、マスサイトメトリーを用いて得られるサイトミクスデータおよび血漿タンパク質発現データを含み得る。さらなる実施形態は、追加的な形態のオミクスデータを利用して、特定の実施形態に適用可能な、サイトミクス、プロテオミクス、トランスクリプトミクス、および/またはゲノミクスデータを特定する。ある特定の実施形態では、406においてオミクス(マルチオミクスを含む)データに基づいて予測MOBモデルが生成され、および/または臨床データが生成され、そのようなモデルは、本明細書に記載される方法によって生成することができる。
【0186】
図5A~5Cを見ると、腹部手術後のSSCを予測する実施形態の有効性を示す例示的実施形態が示されている。具体的には、
図5Aは、手術後30日目の術後査定に結びつけられた、手術前に(DOSに)取得された生物学的サンプルを示している。使用されたデータの要約が表1に提供される。
図5Bは、マルチオミクスデータだけで訓練されたモデルについて、0.82のAUC(95%の信頼区間、CI[0.66~0.94]、マン・ホイットニーの順位和検定)を示す例示的データを示している。しかし、多くの実施形態は、マルチオミクスデータと臨床データを統合してSSCの予測モデルを導出する機械学習手法を実装する。
図5Cは、術前臨床変数を、DOSに収集されたサイトミクスおよび血漿プロテオミクス変数と統合する例示的なMOBモデルを示し、このMOBモデルは、生物学的データまたは臨床データ単独に基づいて構築されたモデルよりも優れた予測性能(AUC=0.92、95%のCI[0.84~0.99]、マン・ホイットニーの順位和検定)でSSCを予測する。
【0187】
加えて、
図6~
図7は、追加的な実施形態の例示的な性能データを示す。具体的には、
図6は、0.77のAUC、95%のCI[0.65~0.89]、n=93、マン・ホイットニーの順位和検定でSSCを予測する別の例示的DOSモデルを示し、
図6を生成するために使用されたデータの要約が表2に提供される。さらに、
図7は、0.86のAUCを有する、腹部手術から24時間後(POD1)に収集された分析患者サンプルから導出されたSSCの例示的MOB予測モデルを示す。
マルチオミクス生物学的データを生成するための方法
【0188】
多くの実施形態では、SSCなどの手術合併症の予測モデルを生成するための方法は、手術の前または後に個人から得られる生物学的サンプル(例えば、血液に基づくサンプル、腫瘍サンプル、および/または任意の他の好適な生物学的サンプル)のマルチオミクス分析に依拠して、例えば、免疫細胞サブセット頻度およびシグナリング活動、および血漿タンパク質の変化の決定を得る。
【0189】
生物学的サンプルは、1つまたは複数の細胞の分析を可能にする任意の好適な種類、タンパク質、好ましくは血液サンプルであり得る。サンプルは、個人から一回または複数回取得され得る。複数のサンプルが、個人の異なる部位から、個人から複数の異なるときに、またはそれらの任意の組合せで、取得され得る。
【0190】
ある特定の実施形態によると、少なくとも1つの生物学的サンプルが手術前に(手術日または「DOS」を含む)取得される。ある特定の実施形態によると、少なくとも1つの生物学的サンプルが手術後に取得される。ある特定の実施形態によると、少なくとも1つの生物学的サンプルが手術前に取得され、少なくとも1つの生物学的サンプルが手術後に取得される。手術前の生物学的サンプルは、7日間、6日間、5日間、4日間、3日間、2日間、1日間、および/または0日間(すなわち、手術日の最初の切開の前に)、収集され得る。手術後の生物学的サンプルは、手術後0時間、1時間、3時間、6時間、8時間、10時間、12時間、16時間、18時間、および/または24時間(すなわち、POD1)を含む、手術後24時間以内に取得され得る。
【0191】
生物学的サンプルは、免疫細胞を含んでいる任意のソースからのものであり得る。一部の実施形態では、免疫細胞反応を分析するための生物学的サンプルは血液である。しかし、血液サンプルのPBMC分画も利用可能である。一部の実施形態では、プロテオミクス分析のための生物学的サンプルは血液サンプルの血漿分画であるが、血清分画も利用可能である。
【0192】
一部の実施形態では、サンプルがex vivoで活性化され、これは、本明細書において使用される場合、サンプル、例えば血液サンプルまたはそこから導出された細胞、を身体外で刺激剤(その一例が
図4、404に示される)と接触させることを指す。一部の実施形態では、全血が好ましい。サンプルは、細胞の生存性を維持する好適な媒体、例えば最小培地、PBS等、で希釈されるかまたはその中に懸濁されてもよい。サンプルは、新鮮なものでも凍結されたものでもよい。関心対象の刺激剤には、先天細胞または適応細胞を活性化させる薬剤、例えば、LPSなどのTLR4アゴニスト、および/またはIL-1β、IL-2、IL-4、IL-6、TNFα、IFNα、またはPMA/イオノマイシンの1つまたは組合せ、が含まれる。一般に、ex vivoでの細胞の活性化は、負の対照、例えば、媒体のみ、または活性化を誘発させない薬剤、と比較される。細胞は、生物学的サンプル中で免疫細胞を活性化させるのに十分な期間にわたって培養される。例えば、活性化の時間は、最大約1時間、最大約45分、最大約30分、最大約15分であり得、最大約10分または最大約5分であってもよい。一部の実施形態では、期間は、最大約24時間、または約5~約240分である。活性化後、細胞は分析のために固定される。
【0193】
多くの実施形態では、サイトミクス特徴およびプロテオミクス特徴が親和性試薬を使用して検出される。「親和性試薬」または「特異的結合メンバー」は、本発明のタンパク質またはマーカに選択的に結合する、抗体、リガンド等の親和性試薬を指すために使用されることがある。用語「親和性試薬」は、任意の分子、例えばペプチド、核酸、小有機分子、を含む。一部の目的には、親和性試薬は、細胞表面または細胞内マーカ、例えばCD3、CD4、CD7、CD8、CD11b、CD11c、CD14、CD15、CD16、CD19、CD24、CD25、CD27、CD33、CD45、CD45RA、CD56、CD61、CD66、CD123、CD235ab、HLA-DR、CCR2、CCR7、TCRγδ、OLMF4、CRTH2、およびCXCR4等、に選択的に結合する。他の目的には、親和性試薬は、細胞のシグナリングタンパク質、特に、あるシグナリングタンパク質の別の活性化状態に対するそのシグナリングタンパク質の活性化状態を検出することが可能なもの、に選択的に結合する。関心対象のシグナリングタンパク質には、制限なく、pSTAT3、pSTAT1、pCREB、pSTAT6、pPLCγ2、pSTAT5、pSTAT4、pERK1/2、pP38、prpS6、pNF-κB(p65)、pMAPKAPK2(pMK2)、pP90RSK、IκB、cPARP、FoxP3、およびTbetが含まれる。
【0194】
一部の実施形態では、プロテオミクス特徴が測定され、循環細胞外タンパク質を測定することを含む。そのため、関心対象の他の親和性試薬が血漿タンパク質に結合する。特に関心対象となる血漿タンパク質標的には、IL-1β、ALK、WWOX、HSPH1、IRF6、CTNNA3、CCL3、sTREM1、ITM2A、TGFα、LIF、ADA、ITGB3、EIF5A、KRT19、およびNTproBNPが含まれる。
【0195】
一部の実施形態では、サイトミクス特徴が測定され、免疫細胞サブセットの中で単一細胞レベルの表面タンパク質または細胞内タンパク質を測定することを含む。免疫細胞サブセットは、例えば、好中球、顆粒球、好塩基球、単球、骨髄樹状細胞(mDC)や形質細胞様樹状細胞(pDC)などの樹状細胞(DC)、B細胞、または調節T細胞(Treg)、ナイーブT細胞、記憶T細胞、およびNK-T細胞などのT細胞を含む。免疫細胞サブセットは、より具体的には、好中球、顆粒球、好塩基球、CXCR4+好中球、OLMF4+好中球、CD14+CD16-古典的単球(cMC)、CD14-CD16+非古典的単球(ncMC)、CD14+CD16+中間単球(iMC)、HLADR+CD11c+骨髄樹状細胞(mDC)、HLADR+CD123+形質細胞様樹状細胞(pDC)、CD14+HLADR-CD11b+単球性骨髄由来サプレッサー細胞(M-MDSC)、CD3+CD56+ NK-T細胞、CD7+CD19-CD3- NK細胞、CD7+CD56loCD16hi NK細胞、CD7+CD56hiCD16lo NK細胞、CD19+ B細胞、CD19+CD38+形質細胞、CD19+CD38-非血漿B細胞、CD4+ CD45RA+ナイーブT細胞、CD4+ CD45RA-記憶T細胞、CD4+CD161+ Th17細胞、CD4+Tbet+ Th1細胞、CD4+CRTH2+ Th2細胞、CD3+TCRγδ+ γδT細胞、Th17 CD4+T細胞、CD3+FoxP3+CD25+調節T細胞(Treg)、CD8+ CD45RA+ナイーブT細胞、およびCD8+ CD45RA-記憶T細胞を含む。
【0196】
一部の実施形態では、プロテオミクス特徴とサイトミクス特徴の両方が生物学的サンプル中で測定される。
【0197】
一部の実施形態では、親和性試薬は、ペプチド、ポリペプチド、オリゴペプチド、またはタンパク質、特に抗体、またはオリゴヌクレオチド、特にアプタマーおよび特異的結合断片、ならびにそれらの変異体である。ペプチド、ポリペプチド、オリゴペプチド、またはタンパク質は、天然に発生するアミノ酸およびペプチド結合、または合成ペプチド擬態構造から構成され得る。よって、本明細書で使用される「アミノ酸」または「ペプチド残基」は、天然に発生するアミノ酸と合成アミノ酸の両方を含む。非天然発生のアミノ酸を含むタンパク質は、合成されるか、または場合によっては組換えによって作られ得る;van Hest et al., FEBS Lett 428:(l-2) 68-70 May 22, 1998、およびTang et al., Abstr. Pap Am. Chem. S218: U138 Part 2 Aug. 22, 1999を参照されたい。両文献は参照により明示的に本明細書に組み込まれる。
【0198】
タンパク質のリン酸化アイソフォームには特異的に結合するが、タンパク質の非リン酸化アイソフォームには特異的に結合しない多くの抗体が生産されており、その多くが市販されている(例えば、Cell Signaling Technology, www.cellsignal.comまたはBecton Dickinson, www.bd.comを参照されたい)。多くのそのような抗体が、可逆的にリン酸化されるシグナル伝達タンパク質の研究のために生産されている。特に、タンパク質および血漿タンパク質のリン酸化され、活性化されたアイソフォームに特異的に結合する多くのそのような抗体が生産されている。本明細書に記載される方法を用いて分析することが可能なタンパク質の例には、これらに限定されないが、ホスホ(p)rpS6、pNF-κB(p65)、pMAPKAPK2(pMK2)、pSTAT5、pSTAT1、pSTAT3等が含まれる。
【0199】
本発明の方法は、標識、標識要素、またはタグを含む親和性試薬を利用してよい。標識または標識要素とは、直接検出される(すなわち、一次標識)または間接的に検出される(すなわち、二次標識)ことが可能な分子を意味し、例えば、標識は、その存在または不在を知ることができるように、視覚化および/または測定される、もしくはその他の方法で特定され得る。
【0200】
化合物は、検出可能な信号を提供する標識に直接または間接的に共役し得、標識は、例えば、非放射性同位体、放射性同位体、蛍光体、酵素、抗体、オリゴヌクレオチド、磁気粒子などの粒子、化学発光分子、質量分析計によって検出可能な分子、または特異的結合分子等である。特異的結合分子は、ビオチンとストレプトアビジン、ジゴキシンと抗ジゴキシン等のペアを含む。標識の例には、これらに限定されないが、金属同位体、標識を含む光学蛍光および色素染料、標識酵素および放射性同位体が含まれる。本発明の一部の実施形態では、これらの標識を親和性試薬に共役させることができる。一部の実施形態では、1つまたは複数の親和性試薬が一意に標識される。
【0201】
標識は、蛍光染料や部分などの光学標識を含む。蛍光体は、「小分子」蛍光またはタンパク質蛍光(例えば、緑色蛍光タンパク質およびすべてのその変異体)のいずれであってもよい。一部の実施形態では、Chattopadhyay et al (2006) Nat. Med. 12, 972-977によって開示されるように、活性化状態に特異的な抗体が量子ドットで標識される。量子ドットで標識された抗体は単独で使用することができ、または有機蛍光色素共役抗体と併せて使用して利用可能な標識の総数を増やすことができる。標識された抗体の数が増すにつれて、既知の細胞集団を下位分類する能力も増す。
【0202】
抗体は、Erkki et al.(1988) J. Histochemistry Cytochemistry, 36:1449-1451および米国特許第7,018850号によって開示されるように、キレート化またはケージ化ランタニドを使用して標識することができる。他の標識は、Tanner et al. (2007) Spectrochimica Acta Part B: Atomic Spectroscopy 62(3):188-195に開示されるように、誘導結合プラズマ質量分析計(ICP-MS:Inductively Coupled Plasma Mass Spectrometer)に適したタグである。マスサイトメトリーに好適な同位体標識は、例えば、米国公開出願第2012-0178183号に記載されるように使用されてよい。
【0203】
代替として、FRETに基づく検出システムが使用され得る。FRETは、本発明において、例えば、2つのFRET標識の近接性が活性化に起因して変更される、クラスタリングまたは多量体化を伴う活性化状態を検出するために用途がある。一部の実施形態では、蛍光共鳴エネルギー移動(FRET)ペアのメンバーである少なくとも2つの蛍光標識が使用される。
【0204】
本発明の方法および構成において蛍光標識された成分を使用する場合、種々の蛍光モニタリングシステム、例えばサイトメトリー測定デバイスシステム、が本発明を実施するために使用され得ることが認識されるであろう。一部の実施形態では、フローサイトメトリーシステムが使用されるか、または高スループットスクリーニング専用のシステム、例えば96ウェルまたはそれを超えるマイクロタイタープレート、が使用される。蛍光物質にアッセイを行う方法は、当技術分野で周知であり、例えば、Lakowicz, J. R., Principles of Fluorescence Spectroscopy, New York: Plenum Press (1983); Herman, B., Resonance energy transfer microscopy, in: Fluorescence Microscopy of Living Cells in Culture, Part B, Methods in Cell Biology, vol. 30, ed. Taylor, D. L. & Wang, Y.-L., San Diego:Academic Press (1989), pp. 219-243; Turro, N. J., Modern Molecular Photochemistry, Menlo Park: Benjamin/Cummings Publishing Col, Inc. (1978), pp. 296-361に記載されている。
【0205】
本発明の方法の検出するステップ、ソートするステップ、または隔離するステップは、蛍光活性化細胞ソーティング(FACS:fluorescence-activated cell sorting)技術を伴う可能性があり、その場合、FACSを使用して、特定の表面マーカを含んでいる集団から細胞を選択し、または、選択ステップは、標的細胞捕捉および/もしくは背景除去のための回収可能な支持体として磁気的反応粒子の使用を伴う可能性がある。各種のFACSシステムが当技術分野で公知であり、本発明の方法で使用され得る(例えば、各々が参照により明示的に本明細書に組み込まれる、1999年4月16日に出願されたWO99/54494、および2001年7月5日に出願された米国第20010006787号を参照されたい)。
【0206】
一部の実施形態では、FACS細胞ソータ(例えば、FACSVantage(商標)細胞ソータ、Becton Dickinson Immunocytometry Systems、San Jose、Calif.)を使用して、調節物質に反応したシグナリングタンパク質内の活性化レベルの増大の存在または不在下での細胞の活性化プロファイルに基づいて、細胞(陽性細胞)をソートおよび収集する。市販されている他のフローサイロメータには、共にBecton Dickinson から入手可能なLSR IIおよびCanto IIが含まれる。フローサイロメータに関する追加的な情報については、Shapiro, Howard M., Practical Flow Cytometry, 4th Ed., John Wiley & Sons, Inc., 2003を参照されたい。
【0207】
一部の実施形態では、細胞は、まず、特定のシグナリングタンパク質の特定の活性化状態を対象とする、標識された活性化状態特異的親和性試薬(例えば抗体)に接触させられる。そのような実施形態では、細胞を含んでいる液滴を細胞ソータに通すことによって、各細胞で結合した親和性試薬の量を測定することができる。陽性細胞を含んでいる液滴に電磁荷を付与することにより、細胞を他の細胞から分離することができる。次いで、陽性として選択された細胞を無菌回収容器内に回収することができる。これらの細胞ソート手順については、例えば、ここに参照によりその全体が組み込まれる、FACSVantage(商標).Training Manualに詳細に説明されており、特に節3-11から3-28および10-1から10-17が参照される。検出システムに関しては、上記で参照され、組み込まれる特許、出願、および記事を参照されたい。
【0208】
一部の実施形態では、細胞内タンパク質の活性化レベルは、誘導結合プラズマ質量分析装置(ICP-MS)を使用して測定される。特定の要素で標識された親和性試薬は、関心対象のマーカに結合する。細胞がICPに入れられるとき、細胞は霧化され、イオン化される。シグナリングタンパク質に結合している標識された親和性試薬を含む細胞の元素組成が測定される。親和性試薬上の標識に対応する信号の存在および強度は、その細胞上のシグナリングタンパク質のレベルを示す(Tanner et al. Spectrochimica Acta Part B: Atomic Spectroscopy, 2007 Mar;62(3):188-195.)。
【0209】
マスサイトメトリーは、例えば本明細書に提供される実施例に記載されるように、分析に用途がある。マスサイトメトリー、またはCyTOF(DVS Sciences)は、フローサイトメトリーの変種の一つであり、抗体が、蛍光色素ではなく重金属イオンタグで標識される。読み出しは、飛行時間マススペクトロメトリーによる。これは、チャネル間の著しいスピルオーバーを伴わずに、単一のサンプル中でより多くの抗体特異性を組み合わせることを可能にする。例えば、Bodenmiller at a. (2012) Nature Biotechnology 30:858-867を参照されたい。
【0210】
1つまたは複数の細胞もしくは細胞タイプまたはタンパク質が、身体サンプルから隔離され得る。細胞は、赤血球溶解、遠心分離、エルトリエーション、密度勾配分離、アフェレーシス、親和性選択、パニング、FACS、Hypaqueを用いる遠心分離、抗体が付着した固体支持体(磁気ビーズ、カラム内のビーズ、または他の表面)等により、身体サンプルから分離され得る。特定の細胞タイプで特定されるマーカに特異的な抗体を使用することにより、比較的均質な細胞の集団を得ることができる。代替として、不均質な細胞集団、例えば循環末梢血単核細胞、が使用され得る。
【0211】
一部の実施形態では、細胞の集団の表現型プロファイルが、シグナリングタンパク質の活性化レベルを測定することによって決定される。本発明の方法および構成を用いて、細胞経路内の任意のシグナリングタンパク質またはそのようなシグナリングタンパク質の集まりの状態を調べ、プロファイルすることができる。単一または複数の個別の経路をプロファイルすることができ(順次もしくは同時に)、または、単一の経路内のもしくは複数の経路にまたがるシグナリングタンパク質のサブセットを調べることができる(順次もしくは同時に)。
【0212】
一部の実施形態では、細胞を分類する根拠は、1つまたは複数の特定のシグナリングタンパク質についての活性化レベルの分布は、異なる表現型ごとに異なるということである。ある特定の活性化レベル、またはより一般的には1つの細胞もしくは細胞の集団中で見られる1つまたは複数のシグナリングタンパク質の活性化レベルの範囲は、その細胞または細胞の集団が特有の表現型に属することを示す。シグナリングタンパク質の活性化レベルに加えて、シグナリングタンパク質を含んでいない可能性もある生体分子の細胞のレベル(例えば、発現レベル)などの他の測定も、細胞を分類するために使用することができ、これらのレベルも分布に従うことが認識されるであろう。よって、1つの細胞または細胞の集団の1つまたは複数のシグナリングタンパク質の1つまたは複数の活性化レベルを、必要に応じて、シグナリングタンパク質を含んでいることもいないこともある1つまたは複数の生体分子のレベルと併せて使用して、細胞または細胞の集団をクラスに分類することができる。活性化レベルは分布として存在し得ること、および、細胞を分類するために使用される特定の要素の活性化レベルは分布上の特定の点であり得るが、より一般的には分布の一部分であり得ることが理解される。細胞内シグナリングタンパク質の活性化レベルに加えて、細胞内または細胞外生体分子、例えばタンパク質、のレベルを単独でまたはシグナリングタンパク質の活性化状態と組み合わせて使用して、細胞を分類することができる。さらに、追加的な細胞要素、例えば、RNA、DNA、炭水化物、代謝産物等の生体分子または分子複合体を、ここに包含される細胞の分類で活性化状態または発現レベルと併せて使用することができる。
【0213】
本発明の一部の実施形態では、混合細胞集団のサンプル中で特定の細胞集団(例えばCD4
+ T細胞のみ)を分析するために、種々のゲーティング戦略が使用され得る。これらのゲーティング戦略は、1つまたは複数の特定の表面マーカの存在に基づき得る。続くゲートは、死細胞と生細胞を区別することができ、それに続く生細胞のゲーティングは、それらを、例えば骨髄芽球、単球、およびリンパ球に分類する。2次元輪郭プロット表現、2次元ドットプロット表現、および/またはヒストグラムを使用することにより、明確な比較を実施することができる。患者サンプルの分析に使用される例示的なゲーティング戦略が
図10に示される。
【0214】
免疫細胞は、関心対象のシグナリングタンパク質の活性化形態が存在するかについて分析される。関心対象のシグナリングタンパク質には、制限なしに、pMAPKAPK2(pMK2)、pP38、prpS6、pNF-κB(p65)、IκB、pSTAT3、pSTAT1、pCREB、pSTAT6、pSTAT5、pERKが含まれる。変化が有意であるかどうかを決定するために、患者の基準サンプル中の信号を、既知の結果を有する患者のコホートからの参照スケールと比較することができる。
【0215】
サンプルは、1つまたは複数の時間点に取得されてよい。単一の時間点のサンプルが使用される場合、特徴の参照「基準」レベルとの比較が行われ、この参照「基準」レベルは、一人の個人または個人の集団から得られた事前に決定されたレベルである正常な対照群から、ex vivo活性化のための負の対照群などから、得られてよい。
【0216】
一部の実施形態では、方法は、液体処理構成要素の使用を含む。液体処理システムは、任意の数の構成要素を含むロボットシステムを含み得る。加えて、本明細書に概説されるステップのいずれかまたはすべてを自動化することができ、よって、例えば、システムは完全にまたは部分的に自動化され得る。米国特許出願第61/048,657号を参照されたい。当業者に理解されるように、使用されることが可能な各種の構成要素があり、それらには、これらに限定されないが、1つまたは複数のロボットのアーム;マイクロプレートを配置するためのプレートハンドラ;非交差汚染プレート上のウェルの蓋を取り外し、再配置するための自動化された蓋またはキャップハンドラ;使い捨ての先端を有するサンプル分配用の先端アセンブリ;サンプル分配用の洗浄可能な先端アセンブリ;96個のウェル装填ブロック;冷却試薬ラック;マイクロタイタープレートピペット位置(必要に応じて冷却される);プレートおよび先端の積載タワー;およびコンピュータシステムが含まれる。
【0217】
完全にロボット式のまたはマイクロ流体システムは、スクリーニング用途の全ステップを行うための高スループットピペット動作を含む、自動化された液体、粒子、細胞、および生体処理を含む。これは、吸引、分注、混合、希釈、洗浄、正確な体積移動、取出し、およびピペット先端の廃棄、ならびに単一サンプル吸引からの複数の送達のための同一体積の反復的なピペット動作など、液体、粒子、細胞、および生体の操作を含む。これらの操作は、交差汚染のない液体、粒子、細胞、および生体の移動である。この機器は、フィルタ、膜、および/またはドーター(daughter)プレートへのマイクロプレートサンプルの自動化された複製、高密度移動、全プレート順次希釈、ならびに高用量動作を行う。
【0218】
一部の実施形態では、マルチウェルプレート、マルチチューブ、ホルダ、カートリッジ、ミニチューブ、深ウェルプレート、微量遠心チューブ、クライオバイアル、正方形ウェルプレート、フィルタ、チップ、光ファイバ、ビーズおよびその他の固相母材のためのプラットフォーム、または様々な容積をもつプラットフォームは、追加的な容積のためのアップグレード可能なモジュール式プラットフォームに収納される。このモジュール式プラットフォームは、可変速度のオービタルシェーカ、ならびにソースサンプル、サンプルおよび試薬希釈のための多位置作業デッキ、アッセイプレート、サンプルおよび試薬容器、ピペット先端、ならびに能動洗浄ステーションを含む。一部の実施形態では、本発明の方法は、プレートリーダの使用を含む。
【0219】
一部の実施形態では、単一または複数の磁気プローブ、親和性プローブ、またはピペッターを有する交換可能なピペットハンド(単一チャネルまたは複数チャネル)が、液体、粒子、細胞、および生体をロボット式に操作する。マルチウェルまたはマルチチューブの磁気分離器またはプラットフォームが、単一のまたは複数のサンプル形式の液体、粒子、細胞、および生体を操作する。
【0220】
一部の実施形態では、機器は検出器を含み、この検出器は、標識およびアッセイに応じて各種の異なる検出器であり得る。一部の実施形態では、有用な検出器には、複数の蛍光チャネルを有する顕微鏡:単一および二重の波長終点および動態能力、蛍光共鳴エネルギー移動(FRET)、ルミネセンス、クエンチング、二光子励起、および強度再分配を用いて、蛍光、紫外線および可視光の分光光度検出を提供するプレートリーダ;データおよび画像を撮影し、それを定量化可能な形式に変換するCCDカメラ;ならびにコンピュータワークステーションが含まれる。
【0221】
一部の実施形態では、ロボット装置は、バスを通じてメモリおよび入力/出力装置のセット(例えば、キーボード、マウス、モニタ、プリンタ等)と通信する中央演算処理装置を含む。ここでも、下記で概説されるように、これは、本発明の多重化デバイスのCPUに追加されるまたはそれに代わるものであり得る。中央演算処理装置、メモリ、入力/出力装置、およびバス間の一般的な相互作用は当技術分野で公知である。よって、行われる実験に応じて、様々な異なる手順がCPUメモリに記憶される。
【0222】
これらマーカの差次的存在は、労働の開始までに時間を有する個人を検出するための予後的評価を可能にすることが示される。一般に、そのような予後方法は、免疫細胞の個々のサンプル中で活性化したシグナリングタンパク質の存在またはレベルを決定することを伴う。検出は、1つまたはパネルの特異的結合メンバー、例えば、1つ、2つ、3つ、4つ、5つまたはそれよりも多くのマーカに特異的な結合メンバーのパネルまたはカクテル、を利用することができる。
【0223】
本発明は、他の出願およびテキストに開示される情報を組み込む。以下の特許および他の文献は、ここに参照によりそれぞれの全体が組み込まれる:Alberts et al., The Molecular Biology of the Cell, 4th Ed., Garland Science, 2002; Vogelstein and Kinzler, The Genetic Basis of Human Cancer, 2d Ed., McGraw Hill, 2002; Michael, Biochemical Pathways, John Wiley and Sons, 1999; Weinberg, The Biology of Cancer, 2007; Immunobiology, Janeway et al. 7th Ed., Garland, and Leroith and Bondy, Growth Factors and Cytokines in Health and Disease, A Multi Volume Treatise, Volumes 1A and IB, Growth Factors, 1996。
【0224】
文脈から明らかでない限り、本明細書に記載されるすべての要素、ステップ、または特徴は、他の要素、ステップ、または特徴との任意の組合せで使用され得る。
【0225】
分子および細胞の生物化学における一般的な方法は、以下のような標準的な教科書に見つけることができる:Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999); Protein Methods (Bollag et al., John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997);およびCell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)。本開示において参照される遺伝子操作のための試薬、クローニングベクター、およびキットは、BioRad、Stratagene、Invitrogen、Sigma-Aldrich、およびClonTechなどの商業ベンダから入手可能である。
データ分析
【0226】
多くの実施形態では、SSCなどの手術合併症の予測モデルを生成するための方法は、マルチオミクス生物学的データおよび/または臨床データを統合する、本明細書に記載されるMOBアルゴリズムを用いる。他の実施形態では、SSCなどの手術合併症、またはSSCなどの手術合併症に関連する署名パターンの予測モデルは、例えば下記で説明されるように、任意の利便なプロトコルを使用して生物学的サンプルから生成され得る。読み出しは、平均値、平均、中央値、もしくは分散、または測定に関連する他の統計的もしくは数学的に導出される値であり得る。マーカ読出し情報は、対応する参照または対照パターンと直接比較することにより、さらに精緻化され得る。結合パターンは、参照値と比べてデータ行列内のいずれかの点に統計的に有意な変化があるかどうか、その変化が結合の増加であるかそれとも減少であるか、その変化が1つまたは複数の生理学的状態に固有であるかどうかなどを決定するために、いくつかの点について評価され得る。同一の条件下で各マーカに対して得られる絶対値は、生きている生物系に固有である変動性を表示し、また個人間に固有の変動性も反映する。
【0227】
アッセイ対象のサンプルからの署名パターンの取得に続いて、署名パターンを、参照または基準プロファイルと比較して、サンプルが取得/導出された患者の表現型に関する予後を行うことができる。加えて、参照または対照の署名パターンは、正常な妊娠を有することが分かっている患者のサンプルから得られる署名パターンであり得る。
【0228】
ある特定の実施形態では、得られた署名パターンを単一の参照/対照プロファイルと比較して、アッセイ対象の患者の表現型に関する情報を得る。さらに他の実施形態では、得られた署名パターンを2つまたはそれよりも多くの異なる参照/対照プロファイルと比較して、患者の表現型に関するより詳しい情報を得る。例えば、得られた署名パターンを陽性および陰性の参照プロファイルと比較して、患者が関心対象の表現型を有するかどうかに関する確定された情報を得ることができる。
【0229】
サンプルは、個人の組織または体液から取得され得る。例えば、サンプルは、全血、組織生検、血清等から取得され得る。サンプルの他のソースは、リンパ液、髄液などの体液である。また、この用語には、そのような細胞および体液の由来物および分画も含まれる。
【0230】
反応性を示すプロファイルを特定するために、統計的検定が、その検定と参照プロファイルとの間のマーカのレベルの変化が有意とみなされるための信頼水準を提供することができる。未処理データは、最初に、各マーカについて、通常はマーカ当たり二倍、三倍、四倍、または5~10倍の複製特徴の中で、値を測定することによって分析され得る。検定データセットは、プロファイルのパラメータ値のうち1つまたは複数が、事前に定められた有意水準に対応する制限値を超える場合、参照データセットと異なるとみなされる。
【0231】
有意性の順序付けを提供するために、偽発見率(FDR:false discovery rate)が決定され得る。まず、非類似度値のヌル分布のセットが生成される。一実施形態では、観察されたプロファイルの値を置換して、偶然得られた相関係数の分布のシーケンスを作成し、それにより、相関係数のヌル分布の適切なセットを作成する(参照により本明細書に組み込まれる、Tusher et al. (2001) PNAS 98, 5116-21を参照されたい)。この分析アルゴリズムは、Significance Analysis of Microarrays(SAM)と呼ばれるMicrosoft Excel用のソフトウェア「プラグイン」として現在入手可能である。ヌル分布のセットは、すべての利用可能なプロファイルについて各プロファイルの値を置換し、すべてのプロファイルについてペアワイズ相関係数を計算し、この置換の相関係数の確率密度関数を計算し、この手順をN回繰り返すことによって得られ、Nは、大きい数、通常は300である。N個の分布を使用して、所与の有意性水準で実験に基づいて観察された類似度値の分布から得られる(類似度の)値をその値が超える相関係数値の数の適切な尺度(平均、中央値等)を計算する。
【0232】
FDRは、実験データの中でこの選択されたピアソン相関よりも大きい相関(有意相関)の数に対する、予測される偽の有意相関(ランダム化されたデータセットの中でこの選択されたピアソン相関よりも大きい相関から推定される)の数の比である。このカットオフ相関値は、実験プロファイル間の相関に適用され得る。
【0233】
SAMの場合、Zスコアが、データセット中の分散の別の尺度を表し、Zスコアは、Xの値からXの平均を引き、それを標準偏差で割った値に等しい。Zスコアは、どのように単一のデータ点が正常なデータ分布に相当するかを示す。Zスコアは、データ点が平均より上にあるか下にあるかだけでなく、その測定値がどれほど異常であるかも論証する。標準偏差は、データセット中の各値と、データセット中の値の平均との間の平均距離である。
【0234】
上述の分布を使用して、信頼度の水準が有意度に対して選択される。これを使用して、偶然得られた可能性のある結果を超える相関係数の最も低い値を決定する。この方法を使用して、正の相関、負の相関、または両方についての閾値を得る。この閾値を使用して、ユーザは、ペアワイズ相関係数の観察値をフィルタリングし、閾値を超えないものを排除することができる。さらに、偽陽性率の推定値を所与の閾値に対して得ることができる。個々の「ランダム相関」分布の各々について、いくつの観察値が閾値範囲の外側にあるかを知ることができる。この手順は、計数のシーケンスを提供する。このシーケンスの平均と標準偏差とは、潜在的な偽陽性の平均数およびその標準偏差を提供する。代替として、統計的検証の任意の利便な方法が使用され得る。
【0235】
データを教師なしの階層クラスタリングにかけて、プロファイル間の関係を明らかにすることができる。例えば、階層クラスタリングを行うことができ、そこではピアソン相関がクラスタリング指標として用いられる。1つの手法は、患者疾患のデータセットを「教師あり学習」の問題における「学習サンプル」とみなすことである。CARTは、医療への応用例における標準であり(Singer(1999) Recursive Partitioning in the Health Sciences, Springer)、これは、任意の質的特徴を量的特徴に変換し、それらを、ホテリニグのT2統計のためのサンプル再使用法によって評価された、達成された有意水準によってソートし、Lasso法の適切な適用により、変更を加えることができる。予測における問題は、回帰の品質を評価する際の分類にジニ基準を適切に利用することにより、予測の力を失うことなく回帰における問題に変えられる。
【0236】
使用され得る他の分析方法は、ロジスティック回帰を含む。ロジスティック回帰の1つの方法は、Ruczinski (2003) Journal of Computational and Graphical Statistics 12:475-512に記載されている。ロジスティック回帰は、その分類器が二分木として表示できる点でCARTに似ている。それは、各ノードが、CARTによって生成される単純な「and」文よりも一般的な特徴に関するブール文を有するという点で異なる。
【0237】
別の手法は、最近傍縮小重心(nearest shrunken centroids)(Tibshirani (2002) PNAS 99:6567-72)の手法である。この技術は、k平均に似ているが、クラスタ中心を縮小することにより、情報の多い少数の特徴に着目するように自動的に特徴を選択する(Lassoと同様に)という利点を有する。この手法は、Microsoft Excel用のソフトウェア「プラグイン」であるPrediction Analysis of Microarrays(PAM)ソフトウェアとして入手可能であり、広く使用されている。2つのさらなるアルゴリズムのセットは、ランダムフォレスト(Breiman (2001) Machine Learning 45:5-32)およびMART(Hastie (2001) The Elements of Statistical Learning, Springer)である。この2つの方法は、すでに「委員会の方法」である。よって、それらは、結果について「投票する」予測子を伴う。これらの方法のいくつかは、スタンフォード大学で開発された「R」ソフトウェアに基づき、「R」ソフトウェアは、継続的に常時改良され、更新されている統計的フレームワークを提供する。
【0238】
他の統計的分析手法には、主成分分析、再帰的分割、予測アルゴリズム、ベイズネットワーク、およびニューラルネットワークが含まれる。
【0239】
これらのツールおよび方法は、いくつかの分類問題に適用され得る。例えば、i)すべての場合とすべての対照、ii)すべての場合と非反応性の対照、iii)すべての場合と反応性の対照、の比較から方法が開発され得る。
【0240】
第2の分析手法では、横断分析で選択された変数が、予測子として別々に用いられる。具体的な結果、各患者が観察されるランダムな時間長、およびプロテオミクス特徴および他の特徴の選択を与えられたとき、反応性を分析するパラメトリック手法は、広く応用されている半パラメトリックCoxモデルよりも良好であり得る。Weibullの生存(survival)のパラメトリックフィットは、ハザード率を単調増加させる、減少させる、または一定にすることを可能にし、また比例的なハザード表現(Coxモデルと同様)および高速化された故障時間表現を有する。回帰係数の近似最大尤度推定器およびそれらの関数を得るのに利用することが可能なすべての標準的ツールは、このモデルと共に入手可能である。
【0241】
加えて、Coxモデルを使用することができる。この理由は特に、Lassoを用いた扱いやすい大きさへの共変量の数の低減が、分析を大幅に簡略化して、完全に非パラメトリックな生存の手法の可能性を可能にするからである。
【0242】
分析およびデータベース記憶は、ハードウェアもしくはソフトウェア、または両者の組合せで実装され得る。本発明の一実施形態では、機械可読記憶媒体が提供され、この媒体は、機械可読データが符号化されたデータ記憶材料を含み、機械可読データは、前記データを使用するための命令でプログラムされた機械を使用するときに、本発明のデータセットおよびデータ比較のいずれも表示することが可能である。そのようなデータは、患者モニタリング、初期診断などの各種の目的に使用され得る。好ましくは、本発明は、プロセッサと、データ記憶システム(揮発性および不揮発性メモリならびに/または記憶要素を含む)と、少なくとも1つの入力装置と、少なくとも1つの出力装置とを備える、プログラム可能コンピュータで実行されるコンピュータプログラムとして実施される。プログラムコードが入力データに適用されて、上記で説明された機能を行い、出力された情報を生成する。出力された情報は、1つまたは複数の出力装置に、公知の方式で適用される。コンピュータは、例えば、従来設計のパーソナルコンピュータ、マイクロコンピュータ、またはワークステーションであり得る。
【0243】
各プログラムは、好ましくは、コンピュータシステムと通信するために高水準の手続き型またはオブジェクト指向プログラミング言語で実施される。しかし、必要な場合、プログラムは、アセンブリ言語または機械言語で実施され得る。いずれの場合も、言語は、コンパイルまたは解釈される言語であり得る。各そのようなコンピュータプログラムは、好ましくは、記憶媒体またはデバイスがコンピュータによって読み出されたときに本明細書に記載される手順を行うようにコンピュータを構成し動作させるために、一般のまたは特殊目的のプログラム可能コンピュータによって読み取り可能な記憶媒体またはデバイスに記憶される。システムはまた、コンピュータプログラムによって構成されるコンピュータ可読記憶媒体として実装されることも考えることができ、その場合、そのように構成された記憶媒体は、本明細書に記載される機能を行うように、特定の事前に定められた方式でコンピュータを動作させる。
【0244】
入力手段および出力手段のための各種の構造形式が、本発明のコンピュータに基づくシステム内で情報を入力および出力するために使用され得る。出力手段のための1つの形式は、信頼できるプロファイルとの様々に異なる度合いの類似性を有するテストデータセットである。そのような提示は、当業者に類似度のランク付けを提供し、テストパターンに含まれている類似性の度合いを特定する。
【0245】
署名パターンおよびそのデータベースは、その使用を容易にするために各種媒体で提供され得る。「媒体」とは、本発明の署名パターン情報を含んでいる製造品を言う。本発明のデータベースは、コンピュータ可読媒体、例えばコンピュータによって直接読み出し、アクセスすることが可能な任意の媒体、に記録され得る。そのような媒体には、これらに限定されないが、フロッピー(登録商標)ディスク、ハードディスク記憶媒体および磁気テープなどの磁気記憶媒体、CD-ROMなどの光学記憶媒体、RAMおよびROMなどの電気記憶媒体、ならびに磁気/光学記憶媒体などこれらカテゴリの混成が含まれる。当業者は、現在公知のコンピュータ可読媒体のいずれかをどのように使用して、本発明のデータベース情報の記録を備えている製造品を作ることができるかを容易に認識することができる。「記録される」とは、当技術分野で公知の任意のそのような方法を使用して、情報をコンピュータ可読媒体に記憶するためのプロセスを言う。記憶された情報にアクセスするために使用される手段に基づいて、任意の利便なデータ記憶構造を選択することができる。例えば、ワードプロセッシングテキストファイル、データベース形式など、各種のデータプロセッサプログラムおよび形式が、記憶のために使用され得る。
コンピュータによって実行される実施形態
【0246】
一部の実施形態に従う、手術リスクスコアを生成するための方法およびシステムを提供するプロセスは、コンピューティングデバイスまたはコンピューティングシステム、例えば、デスクトップコンピュータ、タブレット、モバイルデバイス、ラップトップコンピュータ、ノートブックコンピュータ、サーバシステム、ならびに/または本明細書に記載される1つまたは複数の特徴、機能、方法、および/もしくはステップを行うことが可能な任意の他のデバイス、によって実行される。一部の実施形態に従うプロセスを行うことができる、コンピューティングデバイス内の関連する構成要素が
図13に示される。当業者は、コンピューティングデバイスまたはシステムは、記載される実施形態から逸脱することなく、簡潔のために省略されている他の構成要素を含んでよいことを認識するであろう。そのような実施形態に従うコンピューティングデバイス1300は、プロセッサ1302および少なくとも1つのメモリ1304を備える。メモリ1304は、不揮発性メモリおよび/または揮発性メモリであり得、プロセッサ1302は、メモリ1304に記憶された命令を実行する、プロセッサ、マイクロプロセッサ、コントローラ、またはプロセッサ、マイクロプロセッサ、および/もしくはコントローラの組合せである。メモリ1304に記憶されているそのような命令は、プロセッサによって実行されたとき、本明細書に記載される1つまたは複数の特徴、機能、方法、および/またはステップを行うようにプロセッサに指示することができる。任意の入力情報またはデータが、同じメモリまたは別のメモリのいずれかである、メモリ1304に記憶され得る。様々な他の実施形態に従い、コンピューティングデバイス1300は、命令を含むおよび/またはそれらプロセスを行うことのできる、ハードウェアおよび/またはファームウェアを有してよい。
【0247】
ある特定の実施形態は、ネットワーク、近距離通信、Bluetooth(登録商標)、赤外線、無線周波、および/または任意の他の好適な通信システムなどを通じて、別のデバイスとの通信(有線、無線等)を可能にするネットワーキングデバイス1306を含むことができる。そのようなシステムは、別のコンピューティングデバイスからデータ、情報、もしくは入力(例えば、オミクスデータおよび/または臨床データ)を受信する、および/または別のデバイスにデータ、情報、もしくは出力(例えば、手術リスクスコア)を送信するために有益であり得る。
【0248】
図14を見ると、分散コンピューティングデバイスを用いる実施形態が示されている。そのような実施形態は、演算能力がローカルレベルで可能でなく、中央のコンピューティングデバイス(例えば、サーバ)が本明細書に記載される1つまたは複数の特徴、機能、方法、および/またはステップを行う場合に有益であり得る。そのような実施形態では、コンピューティングデバイス1402(例えば、サーバ)が、ネットワーク1404(有線および/または無線)に接続され、それは、レコードデータベースもしくはリポジトリ1406からの臨床データを含む、1つまたは複数のコンピューティングデバイスからの入力、研究所コンピューティングデバイス1408から提供されるオミクスデータ、および/または1つまたは複数の他のリモートデバイス1410からの任意の他の関連する情報を受信することができる。コンピューティングデバイス1402が、本明細書に記載される1つまたは複数の特徴、機能、方法、および/またはステップを行うと、レコードに入力するため、(これらに限定されないが)プレハビリテーション、手術を遅らせる、抗生剤を与える、および/または手術リスクスコアに関連する任意の他の行為を含む医療行為を行うために、任意の出力が1つまたは複数のコンピューティングデバイス1406、1408、1410に送信され得る。そのような行為は、そのような行為のために医療専門家に(例えば、電子メール、SMS、声/音声警告などのメッセージ伝達を介して)直接送信される、および/または医療記録に入力され得る。
【0249】
さらに他の実施形態に従い、プロセスのための命令は、特定の用途に適する各種の非一時的なコンピュータ可読媒体の任意のものに記憶され得る。
例示的実施形態
【0250】
以下の実施形態は、本発明のある特定の実施形態についての詳細を提供するが、それらは例示的な性質に過ぎず、本発明の範囲を制限する意図はないことが理解されるべきである。
【実施例】
【0251】
(実施例1)
大腹部手術に対する宿主の免疫反応の血漿プロテオミクスと単一細胞プロテオミクスを組み合わせた分析
背景:この調査では、マスサイトメトリーを使用した免疫細胞サブセットの機能的分析と、炎症性血漿タンパク質の高度に多重化された査定とを組み合わせる統合的手法を用いて、大腹部手術の前および後における患者の2,388件を超える単一細胞および血漿プロテオミクスイベントの動的変化を定量化した。
【0252】
方法:包含基準を満たした腹部手術を受ける41人の患者が手術前に登録された(表1、
図4)。すべての患者は、腸の切除を伴う非がん大腹部手術を受けた。主要アウトカムは、手術部位感染(臓器空間、深部、表在性)、吻合部リーク、または創傷裂開を含む、手術後30日間以内の術後手術部位合併症(SSC)の存在であった。これら3つの手術部位合併症を1つの主要アウトカムに組み合わせる根拠は、吻合部リークと創傷裂開は手術部位感染の発生原理に密接に関係することである。術後アウトカムは、手術後30日間にわたり調査された。11人の患者(27%)が、表在性手術部位感染、ストーマ周辺の粘膜皮膚分離、およびストーマ周囲潰瘍を含むSSCを発症した。手術部位合併症を発症しなかった患者および発症した患者の臨床特性および手術特性を表1に見ることができる。SSCを発症した患者は、大幅に高いBMI、手術継続時間、および推定術中失血を有していた。
【0253】
各調査参加者について、手術日(DOS、全身麻酔の導入前)および術後第1日(POD1)に血液サンプルを収集した。血液サンプルは、血漿プロテオミクス(すなわち、Olinkプラットフォームを使用した274個の血漿タンパク質発現レベルの分析(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Assarsson E, et al. PLoS One 2014; 9(4):e95192を参照されたい))と、単一細胞プロテオミクス(すなわち、マスサイトメトリーによる循環免疫細胞の単一細胞分析、
図4)とを組み合わせたマルチモーダル手法を使用して分析された。マスサイトメトリー分析については、39パラメータの免疫アッセイを用いて、すべての主要な先天および適応免疫細胞の頻度および細胞内シグナリング活動を定量化した。単一細胞分析は、免疫細胞サブセットの頻度および内因性シグナリング活動を定量化するための非刺激の血液サンプルと、ならびに、外傷/負傷に対する宿主免疫反応に関係する主要な細胞内シグナリング反応を誘発させる一連の受容体特異的リガンドで刺激したサンプルとを使用して行った[リポ多糖(LPS)、PMA/イオノマイシン(PI)、インターロイキン(IL)-1β、インターフェロン(IFN)-α、腫瘍壊死因子(TNF)α、およびIL-2,4,6の組合せを含む]。
【0254】
ヒトの免疫系に対する大腹部手術の影響を推定するために、一変量分析を行って、手術の前および後の各血漿または単一細胞プロテオミクス特徴を比較した。POD1とDOSとの差を、血漿プロテオミクス特徴log-fold変化として、または単一細胞プロテオミクス特徴のArcsinh比として計算し、ボルケーノ・プロットとして視覚化した。血漿および単一細胞プロテオミクス特徴は、手術に対する反応の大きさに従ってランク付けした。
【0255】
結果:合計224個のプロテオミクス特徴および421個のマスサイトメトリー特徴が、手術後に大幅に異なった(FDR<0.05)(
図11A~
図11B)。具体的には、
図11A~
図11Bは、ボルケーノ・プロットとして示された、手術外傷に反応した血漿プロテオミクス(
図11A)および単一細胞マスサイトメトリー(
図11B)の先天免疫と適応免疫の組成および機能の変化を示している。DOSサンプルの方で発現が高かった個々の免疫特徴が左に示され(すなわち、負のlog2 fold変化)、POD1サンプルの方で発現が高かった特徴が右に示され(すなわち、正のlog2 fold変化)、偽発見率が5%未満の特徴は横方向の点線の上に示されている(緑色の点p<0.05、青色の点log2FC、または赤色の点p<0.05かつlog2FCの両方)。外傷に対するヒトの免疫反応の従来のトランスクリプトミクスおよびマスサイトメトリー分析と一致して、大腹部手術は、ヒトの免疫系の先天分岐と適応分岐を同時に動員させる結果となった。具体的には、上位%の差次的に規制された特徴の調査は、先天免疫反応の大きな活性化を明らかにし、それらには、先天骨髄細胞サブセット中での、TNFα、IL-6およびIL-1スーパーファミリーのメンバーなどの炎症促進性サイトカインの増加、走化性タンパク質の増加(CCL23およびCX3Cl1を含む)、ならびに正準炎症性シグナリング反応の増加(JAK/STATシグナリングなど)が含まれた。逆に、適応免疫細胞頻度(CD4+およびCD8+ T細胞サブセットを含む)、ならびに炎症性刺激に対する適応免疫反応(とりわけIL2/4/6の刺激に対するJAK/STATシグナリング反応)と、調節タンパク質(IL-10RAなど)の濃度は、DOSと比べてPOD1で低下した。また、悪性腫瘍、敗血症、および手術を含む重篤な外傷の文脈で蓄積する、免疫抑制性をもつ先天免疫細胞の集団である、単球性骨髄由来サプレッサー細胞(M-MDSC)の頻度およびJAK/STATシグナリング活動のロバストな増加も観察された。
【0256】
結論:全体として、手術前および手術から24時間後の患者の差次的免疫プロファイリングは、大腹部手術が、先天および適応免疫系の炎症促進性要素と免疫抑制要素の両方が関与する複雑な炎症反応を引き起こすことを示した。重要な点として、この免疫反応の大きさには著しい患者間変動性が存在し、そのことは、患者間の変動性が、手術合併症の発症を事前に決定し得る患者固有の差を反映するのかどうかについてのさらなる研究を促した。
【0257】
(実施例2)
手術前のマルチオミクス生物学的データと臨床データの統合されたモデリングで手術部位合併症(SSC)を予測する-調査1
背景:POD1対DOSの免疫反応の差分分析(実施例1)は、SSCの発生原理を支配し得る外傷に対するヒトの免疫反応の生物学的態様を強調する。しかし、どの患者がSSCを発症するかを手術前に(すなわちDOSに)特定する能力は、手術前のリスク層別化と術前介入の個人化を可能にするため、臨床的関心が最も高い。
【0258】
方法:
図12は、本調査で使用されたCONSORT基準に従う患者登録を示す。41人の患者が調査1に前向き登録され、11人の患者が手術から30日以内にSSCを発症し、30人の患者は発症しなかった。手術日(DOS)の切開の前および術後第1日目(POD1)に収集した全血サンプルを、リポ多糖(LPS)、腫瘍壊死因子(TNF)α、インターロイキン(IL)-2,4,6カクテル、PMA/イオノマイシン(P/I)、インターフェロン(IFN)α、IL-1βで刺激するか、または非刺激のままとした(「非刺激」)。全血サンプルを、47パラメータの単一細胞マスサイトメトリーアッセイを使用して分析して、すべての主要な先天および適応免疫細胞サブセットの存在度と、手術外傷に対する免疫反応に関係する主要なシグナリング反応の単一細胞の細胞内活動とを定量化した。血漿サンプルは、Olink多重プロテオミクスプラットフォーム(調査1、274種のタンパク質が分析された)を使用して分析した。表5は、本調査で使用された抗体パネルの一覧を提供する。
【0259】
SSCのある患者とない患者の免疫状態が手術前に異なるかどうかを決定するために、統合されたマルチオミクスブートストラップ(MOB)分析パイプライン(
図2~3)を、DOS免疫データセット(麻酔の導入および外科的切開の前に収集されたサンプルから導出された)に適用した。この手法は、血漿と単一細胞プロテオミクスの組み合わさったデータセットの相互接続性および多層性を活用し、ロバスト性に基づく選択による統合された特徴選択のフレームワークをもたらす。データセットは、次の9つの固有のデータ層を含んでいた:免疫細胞頻度(24個の細胞頻度特徴を含む)、各細胞サブセットの基底シグナリング活動(312個の基底シグナリング特徴)、各刺激条件に対するシグナリング反応能力(各々が312個の特徴を含む6つのデータ層)、および血漿プロテオミクス(276個のプロテオミクス特徴)の各データ層(
図2、
図4)。この方法は、いくつかのステップを使用してこの9つのデータ層を統合する。まず、各層で、元の特徴を置換することによって人工特徴を導入し、したがって、結果に関係しない特徴を作成する。次いで、置き換えを伴うまたは伴わないこのデータセットからのリサンプリングによって機械学習モデルのフィットを繰り返すブートストラップ手順を複数回行う。通例、使用される機械学習モデルは、一般にLasso、Ridge、またはElastic Netモデルと表される、L1またはL2正則化を用いるロジスティックまたは線形回帰である。この手順の繰り返しは、シミュレートされたノイズの分布の推定を可能にし、またその分布の記述を可能にする。各変数(人工であってもそうでもなくても)に、安定性経路を算出し、これは、非ゼロの特徴またはモデル中で最も高い重要度をもつ特徴(例えば、係数の絶対値が最も大きい)からの、モデル内での選択の頻度として定義される。生物学的特徴または臨床的特徴の最適なカットオフは、そのデータ層から生物学的特徴または臨床的特徴のロバスト性に対するノイズの挙動を推定するために使用された人工特徴の分布を使用して選択される。
【0260】
MOB分析に利用されたマルチオミクス生物学的特徴は、以下のように定義された。単一細胞プロテオミクス特徴:細胞頻度、内因性シグナリング、およびex vivo刺激に対するシグナリング反応を含む、2,116個の単一細胞プロテオミクス特徴を、先に説明されたようにマスサイトメトリーデータから導出した。免疫細胞サブセットごとに、非刺激サンプルから免疫細胞頻度特徴を計算した。単核細胞頻度は、生存しているシングレット単核細胞(cPAPR-CD45+CD66-)の割合として決定した。顆粒球頻度は、ゲートされた生存しているシングレット細胞(cPARP-)の割合として決定した。単一細胞シグナリング特徴については、細胞内シグナリングプロテオミクスマーカの中央値発現を、ホスホ(p)STAT-1、pSTAT-3、pSTAT4、pSTAT5、pSTAT6、pNfκB、全IκBα、pMAPKAPK2(pMK2)、pERK1/2、prpS6、pCREB、Ki67、およびPD-1について、細胞ごとに同時に定量化した。内因性シグナリング活動は、非刺激サンプルからのarcsinh変換した値として表した。ex vivo刺激に対するシグナリング反応は、内因性値からの刺激値のarcsinh変換された中央値の差として報告された(asinh比)。先に説明したように、知識に基づくペナルティ行列を、機構的な免疫学的知識に基づいて、マスサイトメトリーデータ中の細胞内シグナリング反応特徴に適用した。(例えば、ここに参照により開示の全体が本明細書に組み込まれる、N. Aghaeepour et al (2017). Sci Immunol 2を参照されたい。)重要な点として、ペナルティ行列で使用された機構的事前知識は、術後回復に関係する免疫学的知識とは独立している。血漿プロテオミクス特徴は、Olink免疫反応パネル、炎症性パネルを使用して定量化し、代謝パネルを使用して、272種の一意の血漿タンパク質の濃度を定量化した。血漿タンパク質の相対レベルは、内部対照群に合わせて正規化されたデータから計算された任意の単位で報告され、log2変換後に報告される。
【0261】
結果:SSCのある患者とSSCのない患者を正確に区別するロバストなMOBモデルが構築された(AUC=0.82、95%のCI[0.66~0.94]、MOBモデルの交差検証された値に対する非ペアのマン・ホイットニーの順位和検定、
図5B)。MOBモデルの予測性能は、臨床変数(ACS AUC=0.73)に基づくACS NSQIPリスク査定スコア(例えば、ここに参照により開示の全体が本明細書に組み込まれる、Bilimoria KY et al. J Am Coll Surg 2013; 217(5):833-42 e1-3を参照されたい)などの、既存の手術結果の予測モデルよりも優れていた。2つの患者グループ間で相違した臨床変数および人口統計学的変数を含む交絡因子分析は、MOBモデルは、年齢、BMI、術前診断特徴、および手術タイプの違いを加味したときにはるかに多くの情報を取り込むことを示した(表6)。MOB予測を伴うかまたは伴わない、一般化された線形モデルの比較では、MOB値を用いるモデルのフィットがはるかに良好になった(p=8e-05、フィット間の逸脱についてのカイ二乗検定)。最後に、DOSに収集された単一細胞および血漿プロテオミクス変数への、術前臨床変数(すなわち、年齢、性別、BMI、機能的状態、緊急症例、米国麻酔科学会(ASA)クラス、慢性症状のためのステロイド使用、腹水、多発性がん、糖尿病、高血圧、うっ血性心不全、呼吸困難、喫煙歴、重症COPDの病歴、透析、急性腎不全)の統合は、SSCの予測についてのDOSモデルの精度をさらに向上させた(AUC=0.92、95%のCI[0.84~0.99]、
図5C)。
【0262】
結論:総合して、これらの結果は、手術前に収集された免疫および臨床の情報の統合は、術後SSCのリスクがある患者を正確に特定するための強い潜在性を有することを示唆する。MOBモデルの予測性能は、充分に強力な予測モデルを開発して、個々の患者をリスク層別化し、患者に、SSCを発症するリスクを低減することを狙いとする患者固有の治療経路を割り当てることができることを示唆する。
【0263】
(実施例3)
手術前のマルチオミクス生物学的データの統合されたモデリングでSSCを予測する-調査2
背景:前向き調査1の結果は、SSC発症の正確なリスク推定は、手術前の患者の免疫状態の分析から導出できることを実証している。しかし、臨床的変数および人口統計学的変数が、患者の免疫状態に影響し、SSCの発症の交絡因子として働く。SSCの発症への患者の術前免疫状態の寄与を決定するために、後ろ向き調査(調査2)を行い、主要な臨床変数および人口統計学的変数に基づいてマッチングされた、大腹部手術を受けた2つの患者グループを比較した。この調査の主要アウトカムは、手術から30日間以内のSSCの発症であった。
【0264】
方法:スタンフォード外科バイオバンクに含まれている450人の患者からなる大きいコホートから、スタンフォード病院で大腹部手術を受ける93人の患者を選択した(表2)。16人の患者がSSCを発症しており(症例)、77人の患者は発症しなかった(対照)。症例と対照とは、年齢、性別、BMI、喫煙歴、手術手法、周術期の治療療法、という臨床変数および人口統計学的変数のグループ間の等しい分布を保証する、頻度マッチングアルゴリズムを使用してマッチングされた。DOSに手術前に収集された血液サンプルおよび血漿サンプルは、調査1で説明したように処理し、マスサイトメトリーと多重血漿プロテオミクスのマルチオミクス組合せを使用して分析した。調査2に使用された血漿プロテオミクスプラットフォームは、2400種を超える循環タンパク質の定量化を可能にする、アプタマーに基づくプラットフォームSomalogicである(例えば、ここに参照により開示の全体が本明細書に組み込まれる、L.Gold et al., PloS one 5, e15004, 2010を参照されたい)。MOB予測モデリングパイプラインを適用して、SSCのある患者とない患者を区別する予測モデルを構築した。
【0265】
結果:手術前に収集されたマスサイトメトリーと血漿プロテオミクスの組み合わされたDOSデータセットへのMOB方法の適用は、SSCを発症した患者を対照群から高精度に分類する多変量モデルを特定した(AUC=0.77、95%のCI[0.66~0.89]、MOBモデルの交差検証された値に対する非ペアのマン・ホイットニーの順位和検定、
図6)。
【0266】
結論:追加的な93人の患者に行われたこの独立した後ろ向き調査の結果は、先の結果(調査1)を裏付けるものであり、MOBを使用した術前免疫データの統合分析は、手術後にSSCを発症するリスクがある患者を特定できることを示唆する。加えて、マッチングされた症例と対照の後ろ向きコホートからのデータを使用して得られた結果は、患者の術前免疫状態は、SSCに関連する可能性のある主要な臨床変数および人口統計学的変数と無関係に、SSCを発症するリスクがある患者を区別することを示唆する。
【0267】
(実施例4)
手術後から24時間後の免疫反応の統合されたモデリングで術後SSCのある患者を正確に分類する
背景:この調査は、統合された予測モデリング手法を用いて、手術から24時間後であるPOD1に検出可能な免疫反応が、その時点でSSCを発症した患者を合併症のない術後回復をした患者から区別できるかどうかを決定した。
【0268】
方法:末梢血と血漿とのサンプルを、調査1に登録された患者から、腹部手術後のPOD1に収集した(
図4、
図7、表1)。サンプルは、実施例1で説明したように、マスサイトメトリー(免疫細胞頻度および細胞内シグナリング反応を分析する)と血漿プロテオミクスのマルチオミクス組合せを使用して分析した。SSCの予測モデリングは、MOBパイプラインを用いて行った。
【0269】
結果:POD1の免疫データセットを基に構築された予測MOBモデルは、SSCを発症した患者を非常に良好な性能で分類した(AUC=0.86、p=2.48e-04、交差検証MD予測値に対するマン・ホイットニーの非パラメトリック非ペア検定、
図7)。交絡する臨床変数および人口統計学的変数を加味するために、モデルの交差検証された予測値にポストホック(post-hoc)交絡因子分析を行った。MOB予測を伴うかまたは伴わない、一般化された線形モデルの比較は、SG値を用いるモデルのフィットがはるかに良好になった(p=2e-07、フィット間の逸脱についてのカイ二乗検定、表7)。加えて、線形モデルで一度に一つの交絡因子ずつ交絡因子と共に評価したところ、年齢、性別、手術タイプ、術前診断、または手術の長さのいずれかにおける患者変動性を加味したときに、SGモデルは依然としてSSCを高度に予測することを示した。
【0270】
結論:POD1における手術に対する免疫反応の分析は、SSCを発症した患者を発症しなかった患者から正確に分類し、それにより、SSCの発生原理を支配し得る外傷に対する反応の生物学的差異を強調する予測モデルを特定した。SSCの開始に先立つPOD1におけるSSCの予測MOBモデルを特定することは、SSCを予防する先制介入を可能にするため、臨床的に意味がある。
【0271】
(実施例5)
SSCの統合された予測モデルに寄与する単一細胞免疫反応および血漿プロテオミクス生物学的特徴
背景:多変量MOB予測パイプラインは、手術前に(DOSモデル)または手術後間もなく(POD1モデル)得られた生物学的データおよび臨床データの分析から、SSCのある患者とない患者を正確に分類した統計的にロバストなモデルをもたらした。高次元のMOBモデルの生物学的関連を理解するために、多変量モデルに最も寄与した個々のMOB特徴をより詳細に調査した。
【0272】
方法:反復的「ブートストラップ」手順(すなわち、置き換えを伴うデータのリサンプリングの1000回の反復)を使用して、個々のMOBモデル特徴を、多変量MOBモデルへの各自の相対的寄与に従ってランク付けした(
図2、
図3A、および
図3B)。特徴は、客観的な相対モデル寄与指数(MCI)を使用してランク付けし、最も情報の多い単一細胞免疫反応および血漿プロテオミクス特徴(MCI[特徴]>MCI[デコイ特徴])を客観的に選択した。
【0273】
結果:手術前に得られたマルチオミクス生物学的データ(調査1および調査2)への反復的ブートストラップMOB手順の適用は、多変量MOBモデルに最も寄与した55個の特徴を選択した(
図8A~8D、表3)。具体的には、
図8Aは、血漿プロテオミクスデータ層から選択された情報の多いDOS MODモデル単一細胞免疫特徴を示し、
図8Bは、LPSデータ層から選択された情報の多いDOS MODモデル単一細胞免疫特徴を示し、
図8Cは、IL2/4/6データ層から選択された情報の多いDOS MODモデル単一細胞免疫特徴を示し、
図8Dは、TNFαデータ層から選択された情報の多いDOS MODモデル単一細胞免疫特徴を示している。左側のグラフは、ブートストラップの反復のたびに本物のまたはデコイのデーセットから個々の特徴が選択される確率を表している。右側の箱ひげグラフは、各1つの細胞データ層について最も情報の多い特徴の例を示す。MODモデルの情報の多い特徴の一覧が表3(DOSモデル)および表4(POD1モデル)に提供される。
【0274】
血漿プロテオミクス特徴は、後にSSCを発症した患者において、増加した12種の血漿タンパク質(IL-1β、ALK、WWOX、HSPH1、IRF6、CTNNA3、CCL3、sTREM1、ITM2A、TGFα、LIF、ADA)、および減少した4種の血漿タンパク質(ITGB3、EIF5A、KRT19、NTproBNP)を含んでいた。単一細胞免疫反応特徴は、後にSSCを発症した患者を対照群から区別した、4種のLPS反応特徴(好中球内の増加したpMAPKAPK2(pMK2)、mDC内の増加したprpS6、および好中球内の減少したIκB、CD7+CD56hiCD16lo NK細胞内の減少したpNFκB)、9種のIL-2/IL-4/IL-6反応特徴(好中球、mDC、またはTreg内の増加したpSTAT3、CD56hiCD16lo NK細胞またはmDC内の増加したprpS6、mDCまたはpDC内の増加したpSTAT5、およびCD4+Tbet+ Th1細胞内の減少したIκB、pDC内の減少したpSTAT1)、11種のTNFα反応特徴(好中球またはmDC内の増加したprpS6、M-MDSCまたはncMC内の増加したpERK、γδT細胞内の増加したpCREB、あるいは好中球内の減少したIκB、pP38またはpERK、またはCD4+Tbet+ Th1細胞内の減少したpCREBもしくはpMAPKAPK2、またはCD4+CRTH2+ Th2細胞内の減少したpERK)、10種の非刺激特徴(好中球、M-MDSC、cMC、またはncMC内の増加したpSTAT3、TregまたはCD45RA-記憶CD4+T細胞内の増加したpSTAT5、mDC内の増加したpMAPKAPK2、CD4+Tbet+ Th1細胞内のpCREBまたはIκB、NKT細胞内の増加したpSTAT6、あるいはCD4+Tbet+ Th1細胞内の減少したpERK)、ならびに、5種の頻度特徴(増加したM-MDSC、G-MDSC、ncMC、Th17細胞、または減少したCD4+CRTH2+ Th2細胞)、を含んでいた。
【0275】
手術から24時間後に取得されたマルチオミクス生物学的データ(調査1)へのMOB手順の適用は、多変量POD1モデルに最も寄与した16個の特徴を選択した(
図9A~9N、表4)。具体的には、
図9A~
図9Gは、SSCのPOD1 MOB予測モデルに寄与する単一細胞免疫反応特徴を示し、一方、
図9H~
図9Nは、SSCのPOD1 MOB予測モデルに寄与する血漿プロテオミクス特徴を示す。
【0276】
結論:手術前および手術後間もなくの血漿に基づくおよび単一細胞の免疫イベントの分析は、SSCの発症に関連する外傷に関係する免疫機構のシステムレベルの見方を提供した。後にSCCを発症した患者における手術に対する初期の免疫反応を特徴付ける、次の2つの主要なテーマが浮上した:1)炎症促進性IL-6RおよびTLRに関係するシグナリング反応の激化、ならびに2)M-MDSCおよびTreg反応を含む、免疫抑制細胞反応の増大。
【0277】
POD1 SGモデルの主要要素は、SSCの素因を与える免疫機構に関する従来の知識とうまく統合する。以前の報告は、手術後早期の上昇したIL-6血漿濃度は、感染を含む術後合併症の増大したリスクと相関することを示している。従来の知見と一致して、cMC内の増加したSTAT3シグナリング活動(標準的にはIL-6によって活性化される)は、SSCに関連する最も情報の多い単一細胞特徴の1つであった。同様に、後にSSCを発症した患者における先天骨髄細胞内のLPSに対するMyD88シグナリング反応の激化は、従来の結果を繰り返すものであり、従来の結果は、手術部位の負傷に反応した炎症促進性先天免疫細胞の抑制されない全身的な活性化がSSCの発症に寄与する可能性があることを示している。そのため、炎症に対する過度の局所免疫反応が、MyD88に関係するTLRシグナリングの強化、バリアの破壊の誘発、および追加的な組織損傷というサイクルで、手術部位からのDAMPおよびPAMPの放出を増大させ得る。この文脈では、TLRシグナリングの過刺激は、エンドトキシン耐性の状態を生じさせることがあり、それが患者の感染への感受性を増大させ得ることも注目に値する。
【0278】
マスサイトメトリーによって与えられる単一細胞の分解能は、SSCの発症原理に寄与し得る細胞タイプに特異的な反応についての新しい洞察をもたらした。手術から24時間後のM-MDSC内の増加したSTAT3シグナリングおよび増加したM-MDSC頻度は、POD1モデルの最も情報の多い特徴の中に含まれていた。この結果は、MDSC内のSTAT3シグナリングと術後回復の遅れとの間の強い相関を示す、整形外科手術を受ける患者についての以前の研究と符合する。MDSCは、急性および慢性の炎症性疾患の文脈において動員される免疫抑制機能をもつ未熟骨髄細胞の不均質なサブセットである。外傷および敗血症に対する免疫反応の以前の調査では、MDSCは、適応免疫系を抑制する抗炎症性プログラム、特に抗原特異的CD8+およびCD4+ T細胞反応、における重要な役割として特定されていた。後にSSCを発症した患者では、MDSCの増殖および免疫抑制機能のために必要とされる上昇したSTAT3シグナリングが、MDSCの拡大を相乗的に促し、したがって免疫抑制の状態をさらに激化させ得る。
【0279】
我々はまた、SSCを発症した患者における免疫抑制Treg内の内因性STAT5シグナリングの上向き調節も観察した。対照的に、IL-2/4/6によるex vivo刺激に対するpSTAT5反応は、SSCを発症した患者の方が低く、これは、より高い内因性pSTAT5シグナリングトーンがさらなるex vivo活性化を防止し得ることを示す可能性がある。Treg内のSTAT5のIL-2Rに依存する活性化は、成熟TregがFoxP3発現レベルを維持し、その免疫抑制機能を発揮するために不可欠である。報告されるところによれば、FoxP3の発現とTregリネージに特異的な転写とは、IL-6ファミリーサイトカインLIFによってさらに促進される。Tregの発達および成熟の誘発におけるLIFの調節機能は、炎症および外傷の文脈におけるIL-6ファミリーサイトカインの両義的な役割を示す。全体に、過度の内因性Tregシグナリングは、観察された亢進されたMDSC反応と相乗的に作用し、SSCを発症する患者において侵入病原体への反応を鈍らせる持続的な免疫抑制状態を引き起こす可能性がある。
【0280】
POD1モデルは、SSCの発症原理に関係する手術によって誘発される機構に関する重要な情報を提供したのに対し、DOS SGモデルは、2つの患者グループを手術前に区別する単一細胞特徴および血漿プロテオミクス因子を示した。DOS SGモデルの最も情報の多い特徴は、プロテオミクス特徴IL-1β、sTREM1およびITM2Aであった。sTREM1が後にSSCを発症する患者においてDOSおよびPOD1に上昇することを示す我々の結果は、細菌感染および敗血症のある患者における増大したsTREM1血漿濃度を示す以前の研究を想起させる。機構的観点から、sTREM1は、骨髄細胞上のパターン認識受容体の増幅器である、膜結合TREM1のメタロプロテアーゼ分裂産物である。sTREM1は、TREM1に拮抗するデコイ受容体として機能することができる。しかし、LPSなどの微生物産物は、TREM1の膜発現を増大させると共に、sTREM1の放出を刺激し、それによりsTREM1血漿濃度を上昇させ得る。SSCのある患者における上昇したsTREM1が、骨髄細胞上でのTREM1の発現と同時に進行するのか、それとも結果としてTREM1の機能的抑制を生じることになるのかは、さらなる調査の根拠となる重要な問題である。
【0281】
DOSモデルの別のプロテオミクス特徴であるITM2Aは、PKA-CREBシグナリングによって上向き調節され、オートファゴソームの蓄積および自己リソソーム形成の抑制につながる。効果的なオートファジーは、組織分化、細胞周期調節、および免疫細胞の成熟化、特にTh細胞の発達を含む多くの生理機能のために不可欠である。DOSモデルのその他の情報の多い特徴は、好中球、pDC、およびTh2細胞など、複数の先天細胞および適応細胞サブセット間の差異を含んでいた。とりわけ、SSCを発症した患者では、複数の刺激(IL-1β、TNFα、およびIFNαを含む)に対するシグナリング反応が、CRTH2+ Th2様のCD4+ T細胞内で鈍くなり、これらは、細胞外病原体に対する防御免疫および組織修復において重要な役割を果たしている。我々の結果は、手術前の患者固有の免疫状態が、SSCを発症するリスクを増大する可能性があることを示唆している。そのため、特定の免疫マーカの術前査定は、SSCを発症するリスクを緩和するための介入を適用するのと併せて、患者をリスク層別化するのを助ける可能性がある。
【0282】
均等論
いくつかの実施形態を説明したが、本発明の主旨から逸脱することなく、様々な変更、代替の構成、および均等物が使用されてよいことが当業者により認識されるであろう。加えて、いくつかの周知の処理および要素については、本発明を不必要に不明瞭することを避けるために説明していない。したがって、上記の説明は、本発明の範囲を制限するものと解釈すべきではない。
【0283】
当業者は、本発明の様々な好ましい実施形態の上述の例および説明は、本発明全体を説明するものに過ぎないこと、ならびに本発明の主旨および範囲内で本発明の構成要素またはステップの変形例がなされてよいことを理解するであろう。したがって、本発明は、本明細書に記載される具体的な実施形態に制限されず、むしろ、添付の特許請求の範囲によって定められる。
【表1-1】
【表1-2】
【表2】
【表3-1】
【表3-2】
【表4】
【表5】
【表6】
【表7】
【国際調査報告】