IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オンコホスト リミテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-10
(54)【発明の名称】患者応答の予測
(51)【国際特許分類】
   G01N 33/68 20060101AFI20240903BHJP
【FI】
G01N33/68
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024508379
(86)(22)【出願日】2022-08-11
(85)【翻訳文提出日】2024-04-08
(86)【国際出願番号】 IL2022050881
(87)【国際公開番号】W WO2023017525
(87)【国際公開日】2023-02-16
(31)【優先権主張番号】63/231,770
(32)【優先日】2021-08-11
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/324,116
(32)【優先日】2022-03-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
(71)【出願人】
【識別番号】520466917
【氏名又は名称】オンコホスト リミテッド
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【弁理士】
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【弁理士】
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【弁理士】
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】ラハヴ,コーレン
(72)【発明者】
【氏名】セラ,イタマール
(72)【発明者】
【氏名】イロン,ヨナタン
(72)【発明者】
【氏名】ハレル,ミハル
(72)【発明者】
【氏名】ヤコブ,エヤル
【テーマコード(参考)】
2G045
【Fターム(参考)】
2G045AA40
2G045CA17
2G045CA18
2G045CA19
2G045CA20
2G045CA25
2G045CA26
2G045CA30
2G045DA36
2G045JA01
(57)【要約】
疾患に罹患している対象の療法に対する応答を予測する方法であって、前記対象によって発現された因子に対する抵抗スコアを計算すること、抵抗スコアに基づいて因子を抵抗性関連因子として分類することを含み、所定の閾値を超える数の抵抗性関連因子が、対象が前記療法に抵抗性であると予測されることを示す方法が提供される。抵抗性関連因子の数および少なくとも1つの臨床パラメータに基づいて応答を予測する方法も提供される。
【選択図】図4A

【特許請求の範囲】
【請求項1】
疾患に罹患している対象の療法に対する応答を予測する方法であって、
a.
i.前記疾患に罹患しており、前記療法に応答することが知られている対象(レスポンダー)の集団における、
ii.前記疾患に罹患しており、前記療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.前記対象における
複数の因子のタンパク質発現レベルを受け取ること、
b.前記複数の因子の因子に対して抵抗スコアを計算することであって、前記抵抗スコアが、前記レスポンダーにおける因子発現レベルに対する前記対象における前記因子発現レベルの類似性および前記ノンレスポンダーに対する前記対象における前記因子発現レベルの類似性に基づく、計算すること、ならびに
c.所定の閾値を超える抵抗スコアを有する前記複数の因子の因子を抵抗性関連因子として分類し、
所定の数を超える数の抵抗性関連因子を有する対象は、前記療法に抵抗性であると予測され、所定の数以下の数の抵抗性関連因子を有する対象は、前記療法に応答すると予測され、
それによって、療法に対する対象の応答を予測すること
を含む、方法。
【請求項2】
疾患に罹患している対象の療法に対する応答を予測する方法であって、
a.
i.前記疾患に罹患しており、前記療法に応答することが知られている対象(レスポンダー)の集団における、
ii.前記疾患に罹患しており、前記療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.前記対象における
複数の因子の因子発現レベルを受け取ること、
b.前記複数の因子の因子に対して抵抗スコアを計算することであって、前記抵抗スコアが、前記レスポンダーにおける前記因子発現レベルに対する前記対象における前記因子発現レベルの類似性および前記ノンレスポンダーに対する前記対象における前記因子発現レベルの類似性に基づく、計算すること、
c.所定の閾値を超える抵抗スコアを有する前記複数の因子の因子を抵抗性関連因子として分類し、
d.前記対象に存在する抵抗性関連因子の数を合計し、ならびに
e.訓練された機械学習アルゴリズムを前記抵抗性関連因子の数および前記対象の少なくとも1つの臨床パラメータに適用することであって、前記訓練された機械学習アルゴリズムが、最終抵抗スコアおよび所定の閾値を超える最終抵抗スコアを出力し、前記対象が前記療法に抵抗性であることを示す、適用すること、
それによって、療法に対する対象の応答を予測すること
を含む、方法。
【請求項3】
疾患に罹患している対象の療法に対する応答を予測する方法であって、
a.
i.前記疾患に罹患しており、前記療法に応答することが知られている対象(レスポンダー)の集団における、
ii.前記疾患に罹患しており、前記療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.前記対象における
複数の因子の因子発現レベルを受け取ること、
b.前記複数の因子の因子に対して抵抗スコアを計算することであって、前記抵抗スコアが、前記レスポンダーにおける前記因子発現レベルに対する前記対象における前記因子発現レベルの類似性、および前記ノンレスポンダーにおける前記因子発現レベルに対する前記対象における前記因子発現レベルの類似性に基づき、前記計算することが、レスポンダーおよびノンレスポンダーにおける前記受け取られた因子発現レベルと、前記レスポンダーおよびノンレスポンダーそれぞれの性別とを含む訓練セットで訓練された機械学習アルゴリズムを、前記対象および前記対象の性別からの個々の受け取られた因子発現レベルに適用することを含み、前記機械学習アルゴリズムが、前記抵抗スコアを出力する、計算すること、ならびに
c.前記計算された抵抗スコアを合計して総抵抗スコアを生成し、
所定の閾値を超える総抵抗スコアを有する対象が、前記療法に対して抵抗性であると予測され、
それによって、療法に対する対象の応答を予測すること
を含む、方法。
【請求項4】
方法であって、
訓練段階において、
(i)疾患に罹患しており、療法に対して応答性であることが知られている対象からの試料において発現される抵抗性関連因子の数、および前記疾患に罹患しており、前記療法に対して非応答性であることが知られている対象からの試料において発現される抵抗性関連因子の数、
(ii)応答性であることが知られている前記対象および非応答性であることが知られている前記対象の少なくとも1つの臨床パラメータ、ならびに
(iii)前記疾患に罹患している前記対象の前記応答性に関連する標識
を含む訓練セットで機械学習アルゴリズムを訓練し、
訓練された機械学習アルゴリズムを生成することを含み、前記訓練された機械学習アルゴリズムは、前記療法に対する前記疾患に罹患している対象の応答性を予測するように訓練される、
方法。
【請求項5】
方法であって、
訓練段階において、
(i)疾患に罹患しており、療法に対して応答性であることが知られている対象からの試料における抵抗性関連因子の因子発現レベル、および前記疾患に罹患しており、前記療法に対して非応答性であることが知られている対象からの試料における抵抗性関連因子の因子発現レベル、
(ii)応答性であることが知られている前記対象および非応答性であることが知られている前記対象の少なくとも1つの臨床パラメータ、ならびに
(iii)前記疾患に罹患している前記対象の前記応答性に関連する標識
を含む訓練セットで機械学習アルゴリズムを訓練し、
訓練された機械学習アルゴリズムを生成することを含み、前記訓練された機械学習アルゴリズムは、対象における抵抗性関連因子の活性を予測するように訓練される、
方法。
【請求項6】
前記抵抗性関連因子の数および前記少なくとも1つの臨床パラメータが、前記標識で標識される、請求項4または5に記載の方法。
【請求項7】
前記最終抵抗スコアの所定の閾値が0.2であり、0.2を超える抵抗スコアが、前記対象が前記療法に抵抗性があることを示すか、または前記最終抵抗スコアが式(1-最終抵抗スコア)によって応答スコアに変換され、所定の閾値を超える応答スコアが、前記対象が療法に応答していることを示し、任意選択で、前記応答スコアの所定の閾値が0.8である、請求項4~6のいずれか一項に記載の方法。
【請求項8】
各対象における前記抵抗性関連因子が、
a.
i.前記疾患に罹患しており、前記療法に応答することが知られている対象(レスポンダー)の集団における、
ii.前記疾患に罹患しており、前記療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.前記対象における
複数の因子の因子発現レベルを受け取ること、
b.前記複数のタンパク質の各因子について、抵抗スコアを計算することであって、前記抵抗スコアは、前記各対象における前記因子発現レベルと前記レスポンダーにおける前記因子発現レベルとの類似性、および前記対象における前記因子発現レベルと前記ノンレスポンダーとの類似性に基づく、計算すること、ならびに
c.所定の閾値を上回る抵抗スコアを有する前記複数の因子の因子を、抵抗性関連因子として分類すること
を含む方法によって決定される、請求項4~7のいずれか一項に記載の方法。
【請求項9】
(b)の前に、前記複数の因子のサブセットを選択することを含み、前記サブセットが、前記レスポンダーとノンレスポンダーとを最もよく区別する因子を含み、前記計算することが、前記サブセットの各因子に対するものである、請求項1~3および8のいずれか一項に記載の方法。
【請求項10】
前記選択することが、統計学的検定を前記受け取られた因子発現レベルに適用することを含み、任意選択で、前記統計学的検定がコルモゴロフ-スミルノフ検定である、請求項9に記載の方法。
【請求項11】
前記計算することが、レスポンダーおよびノンレスポンダーにおける前記受け取られた因子発現レベルを含む訓練セットで訓練された機械学習アルゴリズムを、前記対象からの個々の受け取られた因子発現レベルに適用することを含み、前記機械学習アルゴリズムが前記抵抗スコアを出力する、請求項1~3および8~10のいずれか一項に記載の方法。
【請求項12】
前記訓練セットが、各レスポンダーおよびノンレスポンダーの性別をさらに含み、前記機械学習アルゴリズムが、前記対象および前記対象の性別から受け取られた個々の因子発現レベルに適用される、請求項11に記載の方法。
【請求項13】
前記複数の因子の数を減らすために、前記複数の因子に関して次元縮小ステップを実行することをさらに含む、請求項11または12に記載の方法。
【請求項14】
前記次元縮小ステップは、主要因子のサブセットを識別し、前記訓練セットは、前記主要因子のサブセットの発現レベルのみを含み、任意選択で、前記主要因子のサブセットは、予測されたレスポンダーおよびノンレスポンダーの数を最も均一に均衡させる因子である、請求項13に記載の方法。
【請求項15】
前記所定の閾値は、前記訓練セット内で交差検証を実行することによって決定される、請求項13または14に記載の方法。
【請求項16】
前記計算することが、レスポンダーおよびノンレスポンダーにおける各因子について平均式を計算することを含み、前記抵抗スコアが、レスポンダーにおける前記計算された平均からの前記対象における前記因子発現の偏差とノンレスポンダーにおける前記計算された平均からの前記対象における前記因子発現の偏差との比に基づく、請求項1~3および8~8~10のいずれか一項に記載の方法。
【請求項17】
前記計算することが、レスポンダーおよびノンレスポンダーにおける各因子についての分布および標準偏差を計算することをさらに含み、前記偏差が、前記計算された標準偏差の倍数として測定される、請求項16に記載の方法。
【請求項18】
前記抵抗スコアが、単調関数の式
【数1】
によって計算され、式中、Zは、レスポンダーにおける前記計算された平均からの前記対象における前記因子発現の前記偏差であり、ZNRは、ノンレスポンダーにおける前記計算された平均からの前記対象における前記因子発現の前記偏差であり、cは定数である、請求項17に記載の方法。
【請求項19】
前記抵抗スコアの前記所定の閾値が約2.9であり、2.9を超える抵抗スコアは、因子が抵抗性関連因子であることを示す、請求項18に記載の方法。
【請求項20】
前記複数の因子が、少なくとも200の因子である、請求項1~19のいずれか一項に記載の方法。
【請求項21】
抵抗性関連因子の前記所定の数が3であり、3つを超える抵抗性関連因子を有する対象が前記療法に抵抗性であると予測される、請求項1~3および8~20のいずれか一項に記載の方法。
【請求項22】
複数の因子に対する因子発現レベルを前記受け取ることが、
a.前記レスポンダーの集団および前記ノンレスポンダーの集団における前記複数よりも大きい因子の群に対する因子発現レベルを受け取ること、
b.前記群の各因子について、レスポンダーおよびノンレスポンダーにおいて、前記受け取られた因子発現レベルに関して訓練された機械学習アルゴリズムを適用すること、
c.前記アルゴリズムが前記集団の対象をレスポンダーとノンレスポンダーに最も均一に分割するための因子のサブグループを選択すること、ならびに
d.前記因子のサブグループを前記複数の因子として指定すること、
を含む、請求項1~3および8~21のいずれか一項に記載の方法。
【請求項23】
前記因子発現レベルが、前記対象によって提供される生物学的試料中の因子発現レベルである、請求項1~3および8~22のいずれか一項に記載の方法。
【請求項24】
前記生物学的試料が、血漿、全血、血清または末梢血単核細胞から選択される、請求項23に記載の方法。
【請求項25】
前記生物学的試料が血漿である、請求項24に記載の方法。
【請求項26】
前記生物学的試料が、前記療法を受ける前に前記対象によって提供される、請求項23~25のいずれか一項に記載の方法。
【請求項27】
前が、最大で24時間前である、請求項26に記載の方法。
【請求項28】
前記生物学的試料が、前記療法を受けた後に前記対象によって提供される、請求項23~25のいずれか一項に記載の方法。
【請求項29】
前記療法を受けた後は、前記療法による第1の治療を受けた後である、請求項28に記載の方法。
【請求項30】
後が、少なくとも24時間後である、請求項28または29に記載の方法。
【請求項31】
集団の各対象によって提供される前記生物学的試料が、同じ種類の生物学的試料である、請求項23~30のいずれか一項に記載の方法。
【請求項32】
前記レスポンダーの集団、前記ノンレスポンダーの集団、および前記対象によって提供される前記生物学的試料が、すべて同じ種類の生物学的試料である、請求項23~31のいずれか一項に記載の方法。
【請求項33】
前記訓練された機械学習アルゴリズムは、請求項4、6、および7のいずれか一項に記載の方法によって訓練される、請求項2および8~32のいずれか一項に記載の方法。
【請求項34】
前記訓練された機械学習アルゴリズムは、請求項5~7のいずれか一項に記載の方法によって訓練される、請求項3および8~32のいずれか一項に記載の方法。
【請求項35】
前記疾患ががんである、請求項1~34のいずれか一項に記載の方法。
【請求項36】
前記療法が免疫チェックポイント阻害であり、任意選択で、前記免疫チェックポイント阻害がPD-1/PD-L1軸を阻害する、請求項1~35のいずれか一項に記載の方法。
【請求項37】
前記少なくとも1つの臨床パラメータが、対象の年齢、性別、治療ライン、および対象からの試料の中のバイオマーカーの発現から選択される、請求項2~36のいずれか一項に記載の方法。
【請求項38】
前記疾患ががんであり、前記療法が抗PD-1または抗PD-L1療法であり、試料の中の標的の発現が腫瘍試料のPD-L1の発現である、請求項37に記載の方法。
【請求項39】
推論段階において、入力として、前記疾患に罹患しており、前記療法に対する未知の応答性を有する対象からの試料において発現された前記抵抗性関連因子の数と、未知の応答性を有する前記対象の少なくとも1つの臨床パラメータとを受け取り、前記訓練された機械学習アルゴリズムを前記受け取られた入力に適用して、前記未知の応答性を有する対象の前記療法に対する応答性を予測することをさらに含む、請求項4~8、20、および25~38のいずれか一項に記載の方法。
【請求項40】
前記療法を施すこと、または前記療法に応答すると予測される前記対象に前記療法を施し続けることをさらに含む、請求項1~39のいずれか一項に記載の方法。
【請求項41】
前記療法を中止すること、または前記療法に抵抗性であると予測される前記対象に前記療法を施さないことをさらに含む、請求項1~40のいずれか一項に記載の方法。
【請求項42】
前記療法に抵抗性であると予測される前記対象に代替療法を施すことをさらに含む、請求項41に記載の方法。
【請求項43】
前記療法に抵抗性であると予測される前記対象に、前記療法を、前記抵抗性関連因子の少なくとも1つまたは前記少なくとも1つの抵抗性関連因子を含む機能的経路の因子を調節する薬剤と併用して投与することをさらに含み、
a.前記少なくとも1つの抵抗性関連因子は、前記ノンレスポンダーにおいて前記レスポンダーよりも高度に発現され、前記経路の活性を増加させ、前記薬剤は前記抵抗性関連因子もしくは前記経路を阻害するか、
b.前記少なくとも1つの抵抗性関連因子は、前記レスポンダーよりも前記ノンレスポンダーにおいてより高度に発現され、前記経路の活性を低下させ、前記薬剤は、前記抵抗性関連因子を阻害するか、もしくは前記経路を活性化するか、
c.前記少なくとも1つの抵抗性関連因子は、前記レスポンダーよりも前記ノンレスポンダーにおいてより低く発現され、前記経路の活性を増加させ、前記薬剤は、前記抵抗性関連因子もしくは前記経路を活性化するか、または
d.前記少なくとも1つの抵抗性関連因子は、前記ノンレスポンダーにおいて前記レスポンダーよりも低く発現され、前記経路の活性を低下させ、前記薬剤は前記抵抗性関連因子を活性化するか、もしくは前記経路を阻害する、
請求項1~39のいずれか一項に記載の方法。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2021年8月11日に出願された米国仮特許出願第63/231,770号および2022年3月27日に出願された米国仮特許出願第63/324,116号の優先権の利益を主張し、これらの内容はすべて参照によりその全体が本明細書に組み込まれる。
【0002】
本発明は、患者特異的な診断の分野にある。
【背景技術】
【0003】
腫瘍学における主要な合併症の1つは、療法に対する抵抗性である。多くの研究が、薬物抵抗性を付与する際の腫瘍細胞における突然変異およびエピジェネティックな変化の関与に焦点を当てている。しかしながら、近年、ほとんどの種類の抗がん療法に応答して、患者(すなわち、宿主)が腫瘍形成促進効果および転移促進効果を生じ得ることが研究により示されている。この現象は、宿主応答と呼ばれ、治療の抗腫瘍活性を潜在的に打ち消すがんの療法に対する患者の生理学的反応である。
【0004】
肺がんは、様々ながん型の中で最も高い死亡率を示し、世界中で2018年に約210万例の肺がん症例および180万例の死亡がある。肺がん症例の85%超が非小肺がん(NSCLC)に分類され、そのうち2つの最も一般的な組織学的サブタイプは肺腺癌および肺扁平上皮癌である。NSCLCの治療は、主に化学療法の使用からより個別化されたアプローチに移行している。現在、腫瘍細胞における患者特異的な遺伝子変化は、標的薬剤を受けるための適格性を決定する。特に、腫瘍におけるプログラム死リガンド-1(PD-L1)発現レベルの状態は、この免疫療法を受けるための適格性を決定する。
【0005】
免疫療法は、免疫応答調節に基づく治療の一種である。現在、最も一般的な免疫療法アプローチの1つは、免疫系を刺激するために免疫系の調節因子を標的とする免疫チェックポイント阻害剤(ICI)の使用である。現在、免疫チェックポイントタンパク質CTLA4、PD-1、およびPD-L1を標的とするモノクローナル抗体の形態のいくつかの承認されたICIが存在する。ICI治療は、メラノーマおよびNSCLCを含む複数のがん型の治療に承認されている。
【0006】
単剤療法として使用される場合、これらの治療剤にはいくつかの制限が存在し、客観的応答は患者の20~30%にしか観察されない。さらに、これらの治療的介入に対する応答に関与する免疫機構は、依然として十分に解明されていない。したがって、血液ベースのタンパク質バイオマーカーを発見するための容易で非侵襲的な手段を可能にする高度なプロテオミクス技術は、免疫療法応答/非応答に関連する宿主および腫瘍の変化を同定し、宿主関連一次抵抗性の根底にある生物学的機構を明らかにする見込みがある。療法、特に免疫療法に対する患者特異的な応答を決定する方法が大いに必要とされている。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、療法に対する対象の応答を予測する方法を提供する。疾患に罹患している対象の療法に対する応答を予測する方法であって、対象によって発現されたタンパク質に対する抵抗スコアを計算すること、抵抗スコアに基づいてタンパク質を抵抗性関連タンパク質(RAP)として分類することを含み、所定の閾値を超える数の抵抗性関連タンパク質が、対象が療法に抵抗性であると予測されることを示す方法が提供される。抵抗性関連因子の数および少なくとも1つの臨床パラメータに基づいて応答を予測する方法も提供される。
【課題を解決するための手段】
【0008】
第1の態様によれば、疾患に罹患している対象の療法に対する応答を予測する方法であって、
a.
i.疾患に罹患しており、療法に応答することが知られている対象(レスポンダー)の集団における、
ii.疾患に罹患しており、療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子のタンパク質発現レベルを受け取ること、
b.複数の因子の因子に対して抵抗スコアを計算し、抵抗スコアが、レスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性およびノンレスポンダーに対する対象における因子発現レベルの類似性に基づく、ならびに
c.所定の閾値を超える抵抗スコアを有する複数の因子の因子を抵抗性関連因子として分類し、
所定の数を超える数の抵抗性関連因子を有する対象は、療法に抵抗性であると予測され、所定の数以下の数の抵抗性関連因子を有する対象は、療法に応答すると予測され、
それによって、療法に対する対象の応答を予測すること
を含む方法が提供される。
【0009】
別の態様によれば、疾患に罹患している対象の療法に対する応答を予測する方法であって、
a.
i.疾患に罹患しており、療法に応答することが知られている対象(レスポンダー)の集団における、
ii.疾患に罹患しており、療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の因子発現レベルを受け取ること、
b.複数の因子の因子に対して抵抗スコアを計算し、抵抗スコアが、レスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性およびノンレスポンダーに対する対象における因子発現レベルの類似性に基づく、
c.所定の閾値を超える抵抗スコアを有する複数の因子の因子を抵抗性関連因子として分類し、
d.対象に存在する抵抗性関連因子の数を合計し、ならびに
e.訓練された機械学習アルゴリズムを数の抵抗性関連因子および対象の少なくとも1つの臨床パラメータに適用することであって、訓練された機械学習アルゴリズムが、最終抵抗スコアおよび所定の閾値を超える最終抵抗スコアを出力し、対象が療法に抵抗性であることを示す、適用すること、
それによって、療法に対する対象の応答を予測すること
を含む方法が提供される。
【0010】
別の態様によれば、疾患に罹患している対象の療法に対する応答を予測する方法であって、
a.
i.疾患に罹患しており、療法に応答することが知られている対象(レスポンダー)の集団における、
ii.疾患に罹患しており、療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の因子発現レベルを受け取ること、
b.複数の因子の因子に対して抵抗スコアを計算し、抵抗スコアが、レスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性、および対象における因子発現レベルの、ノンレスポンダーに対する類似性に基づき、計算が、レスポンダーおよびノンレスポンダーにおける受け取られた因子発現レベルと、レスポンダーおよびノンレスポンダーそれぞれの性別とを含む訓練セットで訓練された機械学習アルゴリズムを、対象および対象の性別からの個々の受け取られた因子発現レベルに適用することを含み、機械学習アルゴリズムが、抵抗スコアを出力する、ならびに
c.計算された抵抗スコアを合計して総抵抗スコアを生成する、
所定の閾値を超える総抵抗スコアを有する対象が、療法に対して抵抗性であると予測される、
それによって、療法に対する対象の応答を予測すること
を含む方法が提供される。
【0011】
別の態様によれば、方法であって、
訓練段階において、
(i)疾患に罹患しており、療法に対して応答性であることが知られている対象からの試料において発現される抵抗性関連因子の数、および疾患に罹患しており、療法に対して非応答性であることが知られている対象からの試料において発現される抵抗性関連因子の数、
(ii)応答性であることが知られている対象および非応答性であることが知られている対象の少なくとも1つの臨床パラメータ、ならびに
(iii)疾患に罹患している対象の応答性に関連する標識
を含む訓練セットで機械学習アルゴリズムを訓練し、
訓練された機械学習アルゴリズムを生成することを含み、訓練された機械学習アルゴリズムは、療法に対する疾患に罹患している対象の応答性を予測するように訓練される
方法が提供される。
【0012】
別の態様によれば、方法であって、
訓練段階において、
(i)疾患に罹患しており、療法に対して応答性であることが知られている対象からの試料における抵抗性関連因子の因子発現レベル、および疾患に罹患しており、療法に対して非応答性であることが知られている対象からの試料における抵抗性関連因子の因子発現レベル、
(ii)応答性であることが知られている対象および非応答性であることが知られている対象の少なくとも1つの臨床パラメータ、ならびに
(iii)疾患に罹患している対象の応答性に関連する標識
を含む訓練セットで機械学習アルゴリズムを訓練し、
訓練された機械学習アルゴリズムを生成することを含み、訓練された機械学習アルゴリズムは、対象における抵抗性関連因子の活性を予測するように訓練される、
方法が提供される。
【0013】
いくつかの実施形態によれば、抵抗性関連因子の数および少なくとも1つの臨床パラメータは、標識で標識される。
【0014】
いくつかの実施形態によれば、最終抵抗スコアの所定の閾値が0.2であり、0.2を超える抵抗スコアが、対象が療法に抵抗性があることを示すか、または最終抵抗スコアが式(1-最終抵抗スコア)によって応答スコアに変換され、所定の閾値を超える応答スコアが、対象が療法に応答していることを示し、任意選択で、応答スコアの所定の閾値が0.8である。
【0015】
いくつかの実施形態によれば、各対象における抵抗性関連因子が、
a.
i.疾患に罹患しており、療法に応答することが知られている対象(レスポンダー)の集団における、
ii.疾患に罹患しており、療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の因子発現レベルを受け取ること、
b.複数のタンパク質の各因子について、抵抗スコアを計算し、抵抗スコアは、各対象における因子発現レベルとレスポンダーにおける因子発現レベルとの類似性、および対象における因子発現レベルとノンレスポンダーとの類似性に基づく、ならびに
c.所定の閾値を上回る抵抗スコアを有する複数の因子の因子を、抵抗性関連因子として分類すること
を含む方法によって決定される。
【0016】
いくつかの実施形態によれば、方法は、(b)の前に、複数の因子のサブセットを選択することを含み、サブセットが、レスポンダーとノンレスポンダーとを最もよく区別する因子を含み、計算することが、サブセットの各因子に対するものである。
【0017】
いくつかの実施形態によれば、選択することが、統計学的検定を受け取られた因子発現レベルに適用することを含み、任意選択で、統計学的検定がコルモゴロフ-スミルノフ検定である。
【0018】
いくつかの実施形態によれば、計算することは、レスポンダーおよびノンレスポンダーにおける受け取られた因子発現レベルを含む訓練セットで訓練された機械学習アルゴリズムを、対象からの個々の受け取られた因子発現レベルに適用することを含み、機械学習アルゴリズムは、抵抗スコアを出力する。
【0019】
いくつかの実施形態によれば、訓練セットは、各レスポンダーおよびノンレスポンダーの性別をさらに含み、機械学習アルゴリズムは、対象および対象の性別から受け取られた個々の因子発現レベルに適用される。
【0020】
いくつかの実施形態によれば、方法は、複数の因子の数を減らすために、複数の因子に関して次元縮小ステップを実行することをさらに含む。
【0021】
いくつかの実施形態によれば、次元縮小ステップは、主要因子のサブセットを識別し、訓練セットは、主要因子のサブセットの発現レベルのみを含み、任意選択で、主要因子のサブセットは、予測されたレスポンダーおよびノンレスポンダーの数を最も均一に均衡させる因子である。
【0022】
いくつかの実施形態によれば、所定の閾値は、訓練セット内で交差検証を実行することによって決定される。
【0023】
いくつかの実施形態によれば、計算することが、レスポンダーおよびノンレスポンダーにおける各因子について平均式を計算することを含み、抵抗スコアが、レスポンダーにおける計算された平均からの対象における因子発現の偏差とノンレスポンダーにおける計算された平均からの対象における因子発現の偏差との比に基づく。
【0024】
いくつかの実施形態によれば、計算することが、レスポンダーおよびノンレスポンダーにおける各因子についての分布および標準偏差を計算することをさらに含み、偏差が、計算された標準偏差の倍数として測定される。
【0025】
いくつかの実施形態によれば、抵抗スコアが、単調関数の式
【数1】
によって計算され、式中、Zは、レスポンダーにおける計算された平均からの対象における因子発現の偏差であり、ZNRは、ノンレスポンダーにおける計算された平均からの対象における因子発現の偏差であり、cは定数である。
【0026】
いくつかの実施形態によれば、抵抗スコアの所定の閾値が約2.9であり、2.9を超える抵抗スコアは、因子が抵抗性関連因子であることを示す。
【0027】
いくつかの実施形態によれば、複数の因子は、少なくとも200の因子である。
【0028】
いくつかの実施形態によれば、抵抗性関連因子の所定の数が3であり、3つを超える抵抗性関連因子を有する対象が療法に抵抗性であると予測される。
【0029】
いくつかの実施形態によれば、複数の因子に対する因子発現レベルを受け取ることが、
a.レスポンダーの集団およびノンレスポンダーの集団における複数よりも大きい因子の群に対する因子発現レベルを受け取ること、
b.群の各因子について、レスポンダーおよびノンレスポンダーにおいて、受け取られた因子発現レベルに関して訓練された機械学習アルゴリズムを適用すること、
c.アルゴリズムが集団の対象をレスポンダーとノンレスポンダーに最も均一に分割するための因子のサブグループを選択すること、ならびに
d.因子のサブグループを複数の因子として指定すること、
を含む。
【0030】
いくつかの実施形態によれば、因子発現レベルは、対象によって提供される生物学的試料の因子発現レベルである。
【0031】
いくつかの実施形態によれば、生物学的試料は、血漿、全血、血清または末梢血単核細胞から選択される。
【0032】
いくつかの実施形態によれば、生物学的試料は血漿である。
【0033】
いくつかの実施形態によれば、生物学的試料は、療法を受ける前に対象によって提供される。
【0034】
いくつかの実施形態によれば、前は、最大で24時間前である。
【0035】
いくつかの実施形態によれば、生物学的試料は、療法を受けた後に対象によって提供される。
【0036】
いくつかの実施形態によれば、療法を受けた後は、療法による第1の治療を受けた後である。
【0037】
いくつかの実施形態によれば、後とは、少なくとも24時間後である。
【0038】
いくつかの実施形態によれば、集団の各対象によって提供される生物学的試料が、同じ種類の生物学的試料である。
【0039】
いくつかの実施形態によれば、レスポンダー集団、ノンレスポンダー集団、および対象によって提供される生物学的試料が、すべて同じ種類の生物学的試料である。
【0040】
いくつかの実施形態によれば、訓練された機械学習アルゴリズムは、本発明の方法によって訓練される。
【0041】
いくつかの実施形態によれば、疾患はがんである。
【0042】
いくつかの実施形態によれば、療法が免疫チェックポイント阻害であり、任意選択で、免疫チェックポイント阻害がPD-1/PD-L1軸を阻害する。
【0043】
いくつかの実施形態によれば、少なくとも1つの臨床パラメータが、対象の年齢、性別、治療ライン、および対象からの試料の中のバイオマーカーの発現から選択される。
【0044】
いくつかの実施形態によれば、疾患ががんであり、療法が抗PD-1または抗PD-L1療法であり、試料の中の標的の発現が腫瘍試料のPD-L1の発現である。
【0045】
いくつかの実施形態によれば、方法は、推論段階において、入力として、疾患に罹患しており、療法に対する未知の応答性を有する対象からの試料において発現された抵抗性関連因子の数と、未知の応答性を有する対象の少なくとも1つの臨床パラメータとを受け取り、訓練された機械学習アルゴリズムを受け取られた入力に適用して、未知の応答性を有する対象の療法に対する応答性を予測することをさらに含む。
【0046】
いくつかの実施形態によれば、方法は、療法を施すこと、または療法に応答すると予測される対象に療法を施し続けることをさらに含む。
【0047】
いくつかの実施形態によれば、方法は、療法を中止すること、または療法に抵抗性であると予測される対象に療法を施さないことをさらに含む。
【0048】
いくつかの実施形態によれば、方法は、療法に抵抗性であると予測される対象に代替療法を施すことをさらに含む。
【0049】
いくつかの実施形態によれば、方法は、療法に抵抗性であると予測される対象に、療法を、抵抗性関連因子または少なくとも1つの抵抗性関連因子を含む機能的経路の因子の少なくとも1つを調節する薬剤と併用して投与することをさらに含み、
a.少なくとも1つの抵抗性関連因子は、ノンレスポンダーにおいてレスポンダーよりも高度に発現され、経路の活性を増加させ、薬剤は抵抗性関連因子もしくは経路を阻害するか、
b.少なくとも1つの抵抗性関連因子は、レスポンダーよりもノンレスポンダーにおいてより高度に発現され、経路の活性を低下させ、薬剤は、抵抗性関連因子を阻害するか、もしくは経路を活性化するか、
c.少なくとも1つの抵抗性関連因子は、レスポンダーよりもノンレスポンダーにおいてより低く発現され、経路の活性を増加させ、薬剤は、抵抗性関連因子もしくは経路を活性化するか、または
d.少なくとも1つの抵抗性関連因子は、ノンレスポンダーにおいてレスポンダーよりも低く発現され、経路の活性を低下させ、薬剤は抵抗性関連因子を活性化するか、もしくは経路を阻害する。
【0050】
本発明のさらなる実施形態および適用可能性の全範囲は、以下に与えられる詳細な説明から明らかになるであろう。しかしながら、詳細な説明および特定の例は、本発明の好ましい実施形態を示しているが、本発明の精神および範囲内の様々な変更および修正がこの詳細な説明から当業者に明らかになるので、単なる例示として与えられていることを理解されたい。
【図面の簡単な説明】
【0051】
図1A】単一タンパク質レベルでのレスポンダー集団およびノンレスポンダー集団におけるタンパク質発現分布の図示。(1A~1C)レスポンダー集団およびノンレスポンダー集団についてのタンパク質発現の分布のコンピュータ生成例。集団発現分布データに基づいてRAPとみなされ得る(薄い灰色の破線)またはRAPではない(濃い灰色の破線)タンパク質発現レベルの例を示す。
図1B】単一タンパク質レベルでのレスポンダー集団およびノンレスポンダー集団におけるタンパク質発現分布の図示。(1A~1C)レスポンダー集団およびノンレスポンダー集団についてのタンパク質発現の分布のコンピュータ生成例。集団発現分布データに基づいてRAPとみなされ得る(薄い灰色の破線)またはRAPではない(濃い灰色の破線)タンパク質発現レベルの例を示す。
図1C】単一タンパク質レベルでのレスポンダー集団およびノンレスポンダー集団におけるタンパク質発現分布の図示。(1A~1C)レスポンダー集団およびノンレスポンダー集団についてのタンパク質発現の分布のコンピュータ生成例。集団発現分布データに基づいてRAPとみなされ得る(薄い灰色の破線)またはRAPではない(濃い灰色の破線)タンパク質発現レベルの例を示す。
図2】アルゴリズム1で実施された式2のRAPスコアの図示。RAPスコアは、合成データを使用して計算され、レスポンダー集団およびノンレスポンダー集団は、正規分布からのサンプリングによって生成された。合成集団の発現レベルをヒストグラムで示し、レスポンダー集団を暗灰色で示し、ノンレスポンダー集団を薄灰色で示す。これらの分布を考慮して、RAPスコアを各発現レベルについて計算した。得られたRAPスコアを青色の曲線にプロットし、値を右側の二次Y軸に示す。
図3A】RAPスコアの関数としてAUCに基づくRAPスコア閾値の決定。各RAPスコアでのAUCを計算し、得られた曲線のピークを、特定のタンパク質をRAPと決定するか否かの閾値(点線)として決定した。(3A~3B)(3A)T1および(3B)T0でのタンパク質測定のための数学的アプローチを使用したRAPスコア閾値の決定を記載するグラフ。(3C)機械学習手法を使用したRAPスコア閾値の決定を説明するグラフ。
図3B】RAPスコアの関数としてAUCに基づくRAPスコア閾値の決定。各RAPスコアでのAUCを計算し、得られた曲線のピークを、特定のタンパク質をRAPと決定するか否かの閾値(点線)として決定した。(3A~3B)(3A)T1および(3B)T0でのタンパク質測定のための数学的アプローチを使用したRAPスコア閾値の決定を記載するグラフ。(3C)機械学習手法を使用したRAPスコア閾値の決定を説明するグラフ。
図3C】RAPスコアの関数としてAUCに基づくRAPスコア閾値の決定。各RAPスコアでのAUCを計算し、得られた曲線のピークを、特定のタンパク質をRAPと決定するか否かの閾値(点線)として決定した。(3A~3B)(3A)T1および(3B)T0でのタンパク質測定のための数学的アプローチを使用したRAPスコア閾値の決定を記載するグラフ。(3C)機械学習手法を使用したRAPスコア閾値の決定を説明するグラフ。
図4A】(図4A)試験コホート(n=30)の各患者のRAP数を示す棒グラフ。レスポンダー-薄灰色;ノンレスポンダー-暗灰色。(4B)RAP分析のROC曲線。
図4B】(図4A)試験コホート(n=30)の各患者のRAP数を示す棒グラフ。レスポンダー-薄灰色;ノンレスポンダー-暗灰色。(4B)RAP分析のROC曲線。
図5】6人の患者において有意に富化されたがんの特徴のヒートマップ。富化分析は、フィッシャーの正確確率検定(FDR<0.05)に基づいた。各患者識別子の横には、患者のRAP数が括弧内に示されている。
図6】現在のコホートにおける重要なRAPのタンパク質-タンパク質ネットワーク。ネットワークは、STRINGデータベースに基づいている。各ノード(タンパク質)は、それが関連するがんの特徴に基づいて着色されている。黒い円形の枠は、標的とすることができるRAPを示す。各ノードのサイズは、検査したRAPを有する患者の数と相関する。各ノードの区画は中央に示されている(Human Protein Atlasに基づく)。I、細胞内。M、膜。S、可溶性。タンパク質は、2つ以上の区画を有することができる。
図7】19のRAPの中のがんの有意に富化された特徴のチャート。フィッシャーの正確確率検定を用いて分析を行った。1を超える富化因子は富化を示す。
図8】健常な組織における19のRAPのタンパク質発現レベルのヒートマップ。発現データは、Human Protein Atlas(HPA)データベースに基づく。
図9】NSCLCを含む様々ながん型の患者における中程度から高レベルの染色の割合のヒートマップ。発現データは、Human Protein Atlas(HPA)データベースに基づく。
図10A】分析に含まれる184人の患者の臨床的説明。(10A)患者の臨床的特徴を表すヒートマップ:治療に対する応答(ORR1、ORR2、1年DCB);治療に対する応答の予後マーカーである生検免疫染色におけるPD-L1を発現する細胞のパーセント;治療タイプ:ICIのみまたはICIと化学療法の併用治療;治療ライン:第1のラインは、NSCLCの最初の全身治療としてICI治療が行われたことを示し、高度ラインは、現在のICI治療が施される前に以前の非ICI治療が行われたことを示す。性別は、出生時の患者の性別を示す。組織学は、肺がん組織型(ADC-腺癌、SCC扁平上皮癌)を示す。(10B~10C)患者の年齢と各時点における応答との相関のバイオリンプロット:(10B)ORR1および(10C)ORR2。ORR1およびORR2は、それぞれ治療開始後3ヶ月および6ヶ月で決定された全応答である。(10D~10E)(10D)ORR1および(10E)ORR2における応答群のグラフ表示。NR=ノンレスポンダー。R=レスポンダー(部分奏効者または完全奏効者)。SD=安定(モデルでは、レスポンダー群に含まれる)。(10F)開発セットおよび検証セットへの集団の分割のグラフ表示。
図10B】分析に含まれる184人の患者の臨床的説明。(10A)患者の臨床的特徴を表すヒートマップ:治療に対する応答(ORR1、ORR2、1年DCB);治療に対する応答の予後マーカーである生検免疫染色におけるPD-L1を発現する細胞のパーセント;治療タイプ:ICIのみまたはICIと化学療法の併用治療;治療ライン:第1のラインは、NSCLCの最初の全身治療としてICI治療が行われたことを示し、高度ラインは、現在のICI治療が施される前に以前の非ICI治療が行われたことを示す。性別は、出生時の患者の性別を示す。組織学は、肺がん組織型(ADC-腺癌、SCC扁平上皮癌)を示す。(10B~10C)患者の年齢と各時点における応答との相関のバイオリンプロット:(10B)ORR1および(10C)ORR2。ORR1およびORR2は、それぞれ治療開始後3ヶ月および6ヶ月で決定された全応答である。(10D~10E)(10D)ORR1および(10E)ORR2における応答群のグラフ表示。NR=ノンレスポンダー。R=レスポンダー(部分奏効者または完全奏効者)。SD=安定(モデルでは、レスポンダー群に含まれる)。(10F)開発セットおよび検証セットへの集団の分割のグラフ表示。
図10C】分析に含まれる184人の患者の臨床的説明。(10A)患者の臨床的特徴を表すヒートマップ:治療に対する応答(ORR1、ORR2、1年DCB);治療に対する応答の予後マーカーである生検免疫染色におけるPD-L1を発現する細胞のパーセント;治療タイプ:ICIのみまたはICIと化学療法の併用治療;治療ライン:第1のラインは、NSCLCの最初の全身治療としてICI治療が行われたことを示し、高度ラインは、現在のICI治療が施される前に以前の非ICI治療が行われたことを示す。性別は、出生時の患者の性別を示す。組織学は、肺がん組織型(ADC-腺癌、SCC扁平上皮癌)を示す。(10B~10C)患者の年齢と各時点における応答との相関のバイオリンプロット:(10B)ORR1および(10C)ORR2。ORR1およびORR2は、それぞれ治療開始後3ヶ月および6ヶ月で決定された全応答である。(10D~10E)(10D)ORR1および(10E)ORR2における応答群のグラフ表示。NR=ノンレスポンダー。R=レスポンダー(部分奏効者または完全奏効者)。SD=安定(モデルでは、レスポンダー群に含まれる)。(10F)開発セットおよび検証セットへの集団の分割のグラフ表示。
図10D】分析に含まれる184人の患者の臨床的説明。(10A)患者の臨床的特徴を表すヒートマップ:治療に対する応答(ORR1、ORR2、1年DCB);治療に対する応答の予後マーカーである生検免疫染色におけるPD-L1を発現する細胞のパーセント;治療タイプ:ICIのみまたはICIと化学療法の併用治療;治療ライン:第1のラインは、NSCLCの最初の全身治療としてICI治療が行われたことを示し、高度ラインは、現在のICI治療が施される前に以前の非ICI治療が行われたことを示す。性別は、出生時の患者の性別を示す。組織学は、肺がん組織型(ADC-腺癌、SCC扁平上皮癌)を示す。(10B~10C)患者の年齢と各時点における応答との相関のバイオリンプロット:(10B)ORR1および(10C)ORR2。ORR1およびORR2は、それぞれ治療開始後3ヶ月および6ヶ月で決定された全応答である。(10D~10E)(10D)ORR1および(10E)ORR2における応答群のグラフ表示。NR=ノンレスポンダー。R=レスポンダー(部分奏効者または完全奏効者)。SD=安定(モデルでは、レスポンダー群に含まれる)。(10F)開発セットおよび検証セットへの集団の分割のグラフ表示。
図10E】分析に含まれる184人の患者の臨床的説明。(10A)患者の臨床的特徴を表すヒートマップ:治療に対する応答(ORR1、ORR2、1年DCB);治療に対する応答の予後マーカーである生検免疫染色におけるPD-L1を発現する細胞のパーセント;治療タイプ:ICIのみまたはICIと化学療法の併用治療;治療ライン:第1のラインは、NSCLCの最初の全身治療としてICI治療が行われたことを示し、高度ラインは、現在のICI治療が施される前に以前の非ICI治療が行われたことを示す。性別は、出生時の患者の性別を示す。組織学は、肺がん組織型(ADC-腺癌、SCC扁平上皮癌)を示す。(10B~10C)患者の年齢と各時点における応答との相関のバイオリンプロット:(10B)ORR1および(10C)ORR2。ORR1およびORR2は、それぞれ治療開始後3ヶ月および6ヶ月で決定された全応答である。(10D~10E)(10D)ORR1および(10E)ORR2における応答群のグラフ表示。NR=ノンレスポンダー。R=レスポンダー(部分奏効者または完全奏効者)。SD=安定(モデルでは、レスポンダー群に含まれる)。(10F)開発セットおよび検証セットへの集団の分割のグラフ表示。
図10F】分析に含まれる184人の患者の臨床的説明。(10A)患者の臨床的特徴を表すヒートマップ:治療に対する応答(ORR1、ORR2、1年DCB);治療に対する応答の予後マーカーである生検免疫染色におけるPD-L1を発現する細胞のパーセント;治療タイプ:ICIのみまたはICIと化学療法の併用治療;治療ライン:第1のラインは、NSCLCの最初の全身治療としてICI治療が行われたことを示し、高度ラインは、現在のICI治療が施される前に以前の非ICI治療が行われたことを示す。性別は、出生時の患者の性別を示す。組織学は、肺がん組織型(ADC-腺癌、SCC扁平上皮癌)を示す。(10B~10C)患者の年齢と各時点における応答との相関のバイオリンプロット:(10B)ORR1および(10C)ORR2。ORR1およびORR2は、それぞれ治療開始後3ヶ月および6ヶ月で決定された全応答である。(10D~10E)(10D)ORR1および(10E)ORR2における応答群のグラフ表示。NR=ノンレスポンダー。R=レスポンダー(部分奏効者または完全奏効者)。SD=安定(モデルでは、レスポンダー群に含まれる)。(10F)開発セットおよび検証セットへの集団の分割のグラフ表示。
図11A】分類モデルのパフォーマンス。ROC AUCを、T0およびT1両方についての3ヶ月ORR、6ヶ月ORR、および1年持続の臨床効果(DCB)での実際の全奏効評価と共に最終抵抗スコアを使用して計算した。(11A、上側のパネル)開発セットおよび(11A、下側のパネルおよび11B、上側のパネル)検証セットについてのT0での結果を示す。(11B、下側のパネル)T1に基づいて同様の分類モデルを生成した。
図11B】分類モデルのパフォーマンス。ROC AUCを、T0およびT1両方についての3ヶ月ORR、6ヶ月ORR、および1年持続の臨床効果(DCB)での実際の全奏効評価と共に最終抵抗スコアを使用して計算した。(11A、上側のパネル)開発セットおよび(11A、下側のパネルおよび11B、上側のパネル)検証セットについてのT0での結果を示す。(11B、下側のパネル)T1に基づいて同様の分類モデルを生成した。
図12A】(12A)T0でのタンパク質レベルに基づいて(1-抵抗スコアとして計算される)応答確率スコアで分類された患者。3ヶ月のORRで実際に観察された応答は、各患者について色で示されている。(12B)T0タンパク質発現に基づく予測応答確率と、3ヶ月、6ヶ月、または1年のいずれかで観察された応答確率との間の一致のドットプロット。グラフの各点は特定の患者を示し、異なる時点は異なる色相およびマーカタイプによって示される。黒の対角線はy=xの線を示し、赤の対角線はすべての点について適合した回帰直線を示し、回帰の適合度(R)を示す。横線は、検証セット全体にわたる3つの時点(色分けされている)についての平均観察応答確率を示す。
図12B】(12A)T0でのタンパク質レベルに基づいて(1-抵抗スコアとして計算される)応答確率スコアで分類された患者。3ヶ月のORRで実際に観察された応答は、各患者について色で示されている。(12B)T0タンパク質発現に基づく予測応答確率と、3ヶ月、6ヶ月、または1年のいずれかで観察された応答確率との間の一致のドットプロット。グラフの各点は特定の患者を示し、異なる時点は異なる色相およびマーカタイプによって示される。黒の対角線はy=xの線を示し、赤の対角線はすべての点について適合した回帰直線を示し、回帰の適合度(R)を示す。横線は、検証セット全体にわたる3つの時点(色分けされている)についての平均観察応答確率を示す。
図13A】(13A)PFSおよび(13B)OSについてのT0タンパク質測定に基づく3ヶ月でのORRについての予測結果に基づく生存分析。
図13B】(13A)PFSおよび(13B)OSについてのT0タンパク質測定に基づく3ヶ月でのORRについての予測結果に基づく生存分析。
図14A】(14A)この分析からのすべての潜在的なRAPの機能のネットワーク。各ノードはRAPを表し、ノード間のエッジは機能の関係を示す。より大きなサイズのノードおよび提供されたタンパク質名は、免疫療法と組み合わせた治験中の新薬(IND)を示す。ノードは、タンパク質の機能に基づいて色付けされている。(14B)2人の患者の機能のネットワーク、予測されたノンレスポンダー(上)および予測されたレスポンダー(下)。各患者について検出されたRAPは黒で輪郭が描かれている。ノンレスポンダー患者は44のRAPが検出され、レスポンダーは10のRAPが検出された。
図14B】(14A)この分析からのすべての潜在的なRAPの機能のネットワーク。各ノードはRAPを表し、ノード間のエッジは機能の関係を示す。より大きなサイズのノードおよび提供されたタンパク質名は、免疫療法と組み合わせた治験中の新薬(IND)を示す。ノードは、タンパク質の機能に基づいて色付けされている。(14B)2人の患者の機能のネットワーク、予測されたノンレスポンダー(上)および予測されたレスポンダー(下)。各患者について検出されたRAPは黒で輪郭が描かれている。ノンレスポンダー患者は44のRAPが検出され、レスポンダーは10のRAPが検出された。
図15】各応答群においてより高いRAP間の機能的差異。ボロノイプロットの各多角形はRAPを表し、大きさはレスポンダーとノンレスポンダーの差と相関する。ノンレスポンダーRAPはスプライシング、シグナル伝達、および細胞骨格関連プロセスに関与するが、レスポンダーRAPは主にタンパク質分解および細胞接着に関与した。各々の色は、異なる全体的な機能を示す。
図16】分析に含まれる339人の患者の臨床パラメータを説明する表。
図17】各時点での患者数の折れ線グラフを応答群(NR、ノンレスポンダー;R、レスポンダー)ごとに合計で示す。患者コホートを開発セットと検証セットに分けた。
図18A】臨床パラメータベースの予測モデルのパフォーマンス。(18A)PD-L1ベースの予測モデルの受信者操作特性(ROC)プロット。(18B)PD-L1、年齢および治療ラインに基づく予測モデルのROCプロット。曲線下面積(AUC)の値を各時点について示す。
図18B】臨床パラメータベースの予測モデルのパフォーマンス。(18A)PD-L1ベースの予測モデルの受信者操作特性(ROC)プロット。(18B)PD-L1、年齢および治療ラインに基づく予測モデルのROCプロット。曲線下面積(AUC)の値を各時点について示す。
図19A】(19A)RAPベースの予測モデルの開発。ICBベースの療法を受けているステージIVのNSCLC患者のコホートを集めた。治療前の血液試料を得て、血漿プロテオームをプロファイリングした。治療に対する臨床応答を、治療開始後3ヶ月、6ヶ月、および12ヶ月で評価し、一方、患者の追跡調査を2年まで続けた。各応答評価時点について、以下のようにICB応答の予測モデルを開発した:レスポンダーおよびノンレスポンダー(集合的に応答関連タンパク質と称される;RAP)において差次的血漿レベルを示すタンパク質を、統計学的検定を使用したモデルの訓練のために選択した。応答の予測モデルは、機械学習アルゴリズムを使用してRAPごとに開発された。各RAPから推論される応答予測を合計して、患者ごとのRAPスコアを得た。RAPスコアを0~1の値に線形にスケーリングし、所与の患者のRAPスコアを応答確率に変換することを可能にした。(19B)RAPベースのモデルの開発および検証。コホートを開発セットと検証セットに分割した(それぞれ75%および25%)。開発セットをさらにランダムに訓練セットと試験セットに分けた(それぞれ75%および25%)。RAP選択とそれに続くモデル訓練には訓練セットを使用し、RAPごとに予測モデルを得た。次いで、試験セットの各患者についてRAPごとに応答予測を生成した。すべての選択されたRAPからの応答予測を合計して、試験セットの患者ごとのRAPスコアを得た。このプロセスを80回繰り返し、その都度、開発セットの患者を訓練セットと試験セットにランダムに分割した。RAPスコアを開発セットの患者ごとに平均し、次いで線形にスケーリングし、所与の患者のRAPスコアを応答確率(0~1の値)に変換することを可能にした。次いで、モデルをロックし、独立した検証セットで試験した。
図19B】(19A)RAPベースの予測モデルの開発。ICBベースの療法を受けているステージIVのNSCLC患者のコホートを集めた。治療前の血液試料を得て、血漿プロテオームをプロファイリングした。治療に対する臨床応答を、治療開始後3ヶ月、6ヶ月、および12ヶ月で評価し、一方、患者の追跡調査を2年まで続けた。各応答評価時点について、以下のようにICB応答の予測モデルを開発した:レスポンダーおよびノンレスポンダー(集合的に応答関連タンパク質と称される;RAP)において差次的血漿レベルを示すタンパク質を、統計学的検定を使用したモデルの訓練のために選択した。応答の予測モデルは、機械学習アルゴリズムを使用してRAPごとに開発された。各RAPから推論される応答予測を合計して、患者ごとのRAPスコアを得た。RAPスコアを0~1の値に線形にスケーリングし、所与の患者のRAPスコアを応答確率に変換することを可能にした。(19B)RAPベースのモデルの開発および検証。コホートを開発セットと検証セットに分割した(それぞれ75%および25%)。開発セットをさらにランダムに訓練セットと試験セットに分けた(それぞれ75%および25%)。RAP選択とそれに続くモデル訓練には訓練セットを使用し、RAPごとに予測モデルを得た。次いで、試験セットの各患者についてRAPごとに応答予測を生成した。すべての選択されたRAPからの応答予測を合計して、試験セットの患者ごとのRAPスコアを得た。このプロセスを80回繰り返し、その都度、開発セットの患者を訓練セットと試験セットにランダムに分割した。RAPスコアを開発セットの患者ごとに平均し、次いで線形にスケーリングし、所与の患者のRAPスコアを応答確率(0~1の値)に変換することを可能にした。次いで、モデルをロックし、独立した検証セットで試験した。
図20A】モデル開発中のRAP同定。(20A)80回の反復にわたって選択された回数に従って群化された、識別されたRAPの数を示すヒストグラム。上、中央および下のヒストグラムは、それぞれ3ヶ月、6ヶ月および12ヶ月の時点に関するものである。(20B).時点ごとに特定されたRAPの総数。この方法によって定量されるいくつかのタンパク質は冗長である。全RAPおよび非冗長RAPの数は、それぞれ薄い灰色および中程度の灰色のバーで示されている)。合計80回の反復において少なくとも40回特定された非冗長RAPの数は、濃い灰色のバーで示されている。(20C)時点ごとに特定されたRAPの数を示すベン図。(20D)所与のタンパク質がRAPとして分類された反復回数を示す階層的クラスタリングがベースのヒートマップ。(20E)時点ごとのRAPの主要な生物学的機能を表示するボロノイプロット。各多角形はRAPを表し、サイズはタンパク質がRAPとして選択された回数と相関する。
図20B】モデル開発中のRAP同定。(20A)80回の反復にわたって選択された回数に従って群化された、識別されたRAPの数を示すヒストグラム。上、中央および下のヒストグラムは、それぞれ3ヶ月、6ヶ月および12ヶ月の時点に関するものである。(20B).時点ごとに特定されたRAPの総数。この方法によって定量されるいくつかのタンパク質は冗長である。全RAPおよび非冗長RAPの数は、それぞれ薄い灰色および中程度の灰色のバーで示されている)。合計80回の反復において少なくとも40回特定された非冗長RAPの数は、濃い灰色のバーで示されている。(20C)時点ごとに特定されたRAPの数を示すベン図。(20D)所与のタンパク質がRAPとして分類された反復回数を示す階層的クラスタリングがベースのヒートマップ。(20E)時点ごとのRAPの主要な生物学的機能を表示するボロノイプロット。各多角形はRAPを表し、サイズはタンパク質がRAPとして選択された回数と相関する。
図20C】モデル開発中のRAP同定。(20A)80回の反復にわたって選択された回数に従って群化された、識別されたRAPの数を示すヒストグラム。上、中央および下のヒストグラムは、それぞれ3ヶ月、6ヶ月および12ヶ月の時点に関するものである。(20B).時点ごとに特定されたRAPの総数。この方法によって定量されるいくつかのタンパク質は冗長である。全RAPおよび非冗長RAPの数は、それぞれ薄い灰色および中程度の灰色のバーで示されている)。合計80回の反復において少なくとも40回特定された非冗長RAPの数は、濃い灰色のバーで示されている。(20C)時点ごとに特定されたRAPの数を示すベン図。(20D)所与のタンパク質がRAPとして分類された反復回数を示す階層的クラスタリングがベースのヒートマップ。(20E)時点ごとのRAPの主要な生物学的機能を表示するボロノイプロット。各多角形はRAPを表し、サイズはタンパク質がRAPとして選択された回数と相関する。
図20D】モデル開発中のRAP同定。(20A)80回の反復にわたって選択された回数に従って群化された、識別されたRAPの数を示すヒストグラム。上、中央および下のヒストグラムは、それぞれ3ヶ月、6ヶ月および12ヶ月の時点に関するものである。(20B).時点ごとに特定されたRAPの総数。この方法によって定量されるいくつかのタンパク質は冗長である。全RAPおよび非冗長RAPの数は、それぞれ薄い灰色および中程度の灰色のバーで示されている)。合計80回の反復において少なくとも40回特定された非冗長RAPの数は、濃い灰色のバーで示されている。(20C)時点ごとに特定されたRAPの数を示すベン図。(20D)所与のタンパク質がRAPとして分類された反復回数を示す階層的クラスタリングがベースのヒートマップ。(20E)時点ごとのRAPの主要な生物学的機能を表示するボロノイプロット。各多角形はRAPを表し、サイズはタンパク質がRAPとして選択された回数と相関する。
図20E】モデル開発中のRAP同定。(20A)80回の反復にわたって選択された回数に従って群化された、識別されたRAPの数を示すヒストグラム。上、中央および下のヒストグラムは、それぞれ3ヶ月、6ヶ月および12ヶ月の時点に関するものである。(20B).時点ごとに特定されたRAPの総数。この方法によって定量されるいくつかのタンパク質は冗長である。全RAPおよび非冗長RAPの数は、それぞれ薄い灰色および中程度の灰色のバーで示されている)。合計80回の反復において少なくとも40回特定された非冗長RAPの数は、濃い灰色のバーで示されている。(20C)時点ごとに特定されたRAPの数を示すベン図。(20D)所与のタンパク質がRAPとして分類された反復回数を示す階層的クラスタリングがベースのヒートマップ。(20E)時点ごとのRAPの主要な生物学的機能を表示するボロノイプロット。各多角形はRAPを表し、サイズはタンパク質がRAPとして選択された回数と相関する。
図21】RAPベースの予測モデルのパフォーマンス。最低から最高までソートされた予測応答確率を示すウォーターフォールプロット。観察されたレスポンダーおよびノンレスポンダーは、それぞれ明るい灰色のバーおよび暗い灰色のバーとして示されている。
図22A】連続した時点における応答確率間の比較。各ドットはコホート内の患者を表す。ある時点における応答確率を、その後の時点における応答確率に対してプロットする。色は、各時点の患者応答標識、および応答標識が時点の間で変化したかどうかを示す。R、レスポンダー;NR、ノンレスポンダー。(22A).3ヶ月と6ヶ月との間の比較。(22B).3ヶ月と12ヶ月との間の比較。(22C).6ヶ月と12ヶ月との間の比較。(22D).経時的な応答標識の流れを表示するサンキープロット。R、レスポンダー;NR、ノンレスポンダー;NA、入手不可。
図22B】連続した時点における応答確率間の比較。各ドットはコホート内の患者を表す。ある時点における応答確率を、その後の時点における応答確率に対してプロットする。色は、各時点の患者応答標識、および応答標識が時点の間で変化したかどうかを示す。R、レスポンダー;NR、ノンレスポンダー。(22A).3ヶ月と6ヶ月との間の比較。(22B).3ヶ月と12ヶ月との間の比較。(22C).6ヶ月と12ヶ月との間の比較。(22D).経時的な応答標識の流れを表示するサンキープロット。R、レスポンダー;NR、ノンレスポンダー;NA、入手不可。
図22C】連続した時点における応答確率間の比較。各ドットはコホート内の患者を表す。ある時点における応答確率を、その後の時点における応答確率に対してプロットする。色は、各時点の患者応答標識、および応答標識が時点の間で変化したかどうかを示す。R、レスポンダー;NR、ノンレスポンダー。(22A).3ヶ月と6ヶ月との間の比較。(22B).3ヶ月と12ヶ月との間の比較。(22C).6ヶ月と12ヶ月との間の比較。(22D).経時的な応答標識の流れを表示するサンキープロット。R、レスポンダー;NR、ノンレスポンダー;NA、入手不可。
図22D】連続した時点における応答確率間の比較。各ドットはコホート内の患者を表す。ある時点における応答確率を、その後の時点における応答確率に対してプロットする。色は、各時点の患者応答標識、および応答標識が時点の間で変化したかどうかを示す。R、レスポンダー;NR、ノンレスポンダー。(22A).3ヶ月と6ヶ月との間の比較。(22B).3ヶ月と12ヶ月との間の比較。(22C).6ヶ月と12ヶ月との間の比較。(22D).経時的な応答標識の流れを表示するサンキープロット。R、レスポンダー;NR、ノンレスポンダー;NA、入手不可。
図23】各時点での応答確率および観察された割合についての富化分析。富化分析は、2D富化試験を使用して行った。X軸は、予測応答確率の富化因子を示す。Y軸は、観察された割合(±0.15の応答確率の範囲内でのレスポンダーの割合によって定義される)の富化因子を示す。陽性および陰性の値は、それぞれ、高いまたは低い応答確率または観察された割合における富化を示す。実線は、Y=Xの線を示す。
図24A】(24A)高応答確率群および低応答確率群に層別化された患者の全生存分析。各時点での応答確率の中央値を層別化閾値として使用した。(24B)高応答確率群および低応答確率群に層別化した患者の無増悪生存分析。各時点での応答確率の中央値を層別化閾値として使用した。HR、ハザード比。CI、信頼区間。
図24B】(24A)高応答確率群および低応答確率群に層別化された患者の全生存分析。各時点での応答確率の中央値を層別化閾値として使用した。(24B)高応答確率群および低応答確率群に層別化した患者の無増悪生存分析。各時点での応答確率の中央値を層別化閾値として使用した。HR、ハザード比。CI、信頼区間。
図25A】(25A)観察された応答率の関数としての予測応答確率。各ドットは患者を表す。各予測応答確率データポイントについての観察された応答率は、応答確率±0.15を割り当てられた患者群の中の観察されたレスポンダーの割合を指す。Y=Xを黒線で示す。適合度を示す。(25B)RAPベースのモデルの受信者操作特性(ROC)を各時点についてプロットする。曲線下面積(AUC)を示す。赤の破線はAUC=0.5を示す。
図25B】(25A)観察された応答率の関数としての予測応答確率。各ドットは患者を表す。各予測応答確率データポイントについての観察された応答率は、応答確率±0.15を割り当てられた患者群の中の観察されたレスポンダーの割合を指す。Y=Xを黒線で示す。適合度を示す。(25B)RAPベースのモデルの受信者操作特性(ROC)を各時点についてプロットする。曲線下面積(AUC)を示す。赤の破線はAUC=0.5を示す。
図26A】RAPベースのモデルは臨床パラメータベースのモデルよりも優れている。予測パフォーマンスを5つのモデルにわたって比較した:RAPベースのモデル(RAP);PD-L1ベースのモデル(PD-L1);臨床モデル(CM);統合RAP+PD-L1;統合RAP+CM。(26A)各時点での5つのモデルのROC曲線プロット。CM、臨床モデル。破線はAUC=0.5を示す。(26B)5つのモデルを比較するフォレストプロット。上、全生存(OS)データに基づくCox回帰分析。下、無増悪生存(PFS)データに基づくコックス回帰分析。
図26B】RAPベースのモデルは臨床パラメータベースのモデルよりも優れている。予測パフォーマンスを5つのモデルにわたって比較した:RAPベースのモデル(RAP);PD-L1ベースのモデル(PD-L1);臨床モデル(CM);統合RAP+PD-L1;統合RAP+CM。(26A)各時点での5つのモデルのROC曲線プロット。CM、臨床モデル。破線はAUC=0.5を示す。(26B)5つのモデルを比較するフォレストプロット。上、全生存(OS)データに基づくCox回帰分析。下、無増悪生存(PFS)データに基づくコックス回帰分析。
図27A】3ヶ月(27A)、6ヶ月(27B)、および1年(27C)でのRAPベースの臨床予測モデルのパフォーマンス。(27D)観測された応答率の関数としての予測応答確率。各ドットは患者を表す。各予測応答確率データポイントについての観察された応答率は、応答確率±0.15を割り当てられた患者群の中の観察されたレスポンダーの割合を指す。Y=Xを黒線で示す。適合度を示す。
図27B】3ヶ月(27A)、6ヶ月(27B)、および1年(27C)でのRAPベースの臨床予測モデルのパフォーマンス。(27D)観測された応答率の関数としての予測応答確率。各ドットは患者を表す。各予測応答確率データポイントについての観察された応答率は、応答確率±0.15を割り当てられた患者群の中の観察されたレスポンダーの割合を指す。Y=Xを黒線で示す。適合度を示す。
図27C】3ヶ月(27A)、6ヶ月(27B)、および1年(27C)でのRAPベースの臨床予測モデルのパフォーマンス。(27D)観測された応答率の関数としての予測応答確率。各ドットは患者を表す。各予測応答確率データポイントについての観察された応答率は、応答確率±0.15を割り当てられた患者群の中の観察されたレスポンダーの割合を指す。Y=Xを黒線で示す。適合度を示す。
図27D】3ヶ月(27A)、6ヶ月(27B)、および1年(27C)でのRAPベースの臨床予測モデルのパフォーマンス。(27D)観測された応答率の関数としての予測応答確率。各ドットは患者を表す。各予測応答確率データポイントについての観察された応答率は、応答確率±0.15を割り当てられた患者群の中の観察されたレスポンダーの割合を指す。Y=Xを黒線で示す。適合度を示す。
図28】異なる患者サブセットに対するRAPベースのモデルのパフォーマンス。
図29A】RAPベースのモデルは、併用療法から利益を得ることができる患者のPD-L1高サブセットを同定する。(29A)3つのPD-L1群のカプランマイヤープロット。左OS;右PFS。(29B)ICB(パートI)またはICB化学療法(パートII)の治療モダリティ下でのPD-L1高およびPD-L1低陰性サブグループの全生存分析。
図29B】RAPベースのモデルは、併用療法から利益を得ることができる患者のPD-L1高サブセットを同定する。(29A)3つのPD-L1群のカプランマイヤープロット。左OS;右PFS。(29B)ICB(パートI)またはICB化学療法(パートII)の治療モダリティ下でのPD-L1高およびPD-L1低陰性サブグループの全生存分析。
図30A】ICB(30A)またはICB化学療法(30B)の治療モダリティ下でのPD-L1高およびPD-L1低陰性サブグループの無増悪生存分析。
図30B】ICB(30A)またはICB化学療法(30B)の治療モダリティ下でのPD-L1高およびPD-L1低陰性サブグループの無増悪生存分析。
【発明を実施するための形態】
【0052】
本発明は、いくつかの実施形態において、療法に対する対象の応答を予測する方法を提供する。
【0053】
第1の態様により、療法に対する対象の応答を予測する方法であって、
a.
i.療法に応答することが知られている対象(レスポンダー)の集団における、
ii.療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の発現レベルを受け取ること、
b.複数の因子の少なくとも1つの因子に対して抵抗スコアを計算し、ならびに
c.閾値を超える抵抗スコアを有する因子を抵抗性関連因子として分類し、
所定の数を超える数の抵抗性関連因子を有する対象は、療法に抵抗性であると予測され、それによって、療法に対する対象の応答を予測すること
を含む、方法が提供される。
【0054】
別の態様により、療法に対する対象の応答を予測する方法であって、
a.
i.療法に応答することが知られている対象(レスポンダー)の集団における、
ii.療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の発現レベルを受け取ること、
b.複数の因子の少なくとも1つの因子に対して抵抗スコアを計算し、
c.閾値を超える抵抗スコアを有する因子を抵抗性関連因子として分類し、
d.抵抗性関連因子の数を合計し、ならびに
e.抵抗性関連因子の数および少なくとも1つの臨床パラメータに訓練された機械学習アルゴリズムを適用し、訓練された機械学習アルゴリズムが、最終抵抗スコアおよび所定の閾値を超える最終抵抗スコアを出力し、対象が療法に抵抗性があることを示し、
それによって、療法に対する対象の応答を予測すること
を含む方法が提供される。
【0055】
別の態様によって、対象の療法に対する応答を予測する方法であって、
a.
i.療法に応答することが知られている対象(レスポンダー)の集団における、
ii.療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の発現レベルを受け取ること、
b.複数の因子の因子に対して抵抗スコアを計算し、抵抗スコアが、レスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性、および対象における因子発現レベルの、ノンレスポンダーにおける因子発現レベル対する類似性に基づき、計算が、抵抗スコアを出力する訓練された機械学習アルゴリズムを適用することを含み、ならびに
c.計算された抵抗スコアを合計して総抵抗スコアを生成する、
所定の閾値を超える総抵抗スコアを有する対象が、療法に対して抵抗性であると予測される、
それによって、療法に対する対象の応答を予測すること
を含む方法が提供される。
【0056】
別の態様によって、方法であって、
訓練段階において、
(i)疾患に罹患しており、療法に対して応答性であることが知られている対象、および疾患に罹患しており、療法に対して非応答性であることが知られている対象からの試料において発現される抵抗性関連因子の数、
(ii)対象の少なくとも1つの臨床パラメータ、ならびに
(iii)対象の応答性に関連する標識
を含む訓練セットで機械学習アルゴリズムを訓練し、
訓練された機械学習アルゴリズムを生成すること
を含む、方法が提供される。
【0057】
別の態様によって、方法であって、
訓練段階において、
(i)疾患に罹患しており、療法に対して応答性であることが知られている対象、および疾患に罹患しており、療法に対して非応答性であることが知られている対象からの試料における抵抗性関連因子の因子発現レベル、
(ii)対象の少なくとも1つの臨床パラメータ、ならびに
(iii)対象の応答性に関連する標識
を含む訓練セットで機械学習アルゴリズムを訓練し、
訓練された機械学習アルゴリズムを生成すること
を含む、方法が提供される。
【0058】
いくつかの実施形態において、方法は診断方法である。いくつかの実施形態において、方法はインビトロの方法である。いくつかの実施形態において、方法はエクスビボの方法である。いくつかの実施形態において、方法はコンピュータ実装方法である。いくつかの実施形態において、方法は統計的方法である。いくつかの実施形態において、本方法は、人間の心の中で実行することができない方法である。いくつかの実施形態において、方法はコンピュータ化された方法である。いくつかの実施形態において、プロセッサはコンピュータプロセッサである。いくつかの実施形態において、プロセッサはコンピュータである。
【0059】
いくつかの実施形態において、方法は、療法に対する応答を予測するためのものである。いくつかの実施形態において、方法は、療法に対する応答を決定するためのものである。いくつかの実施形態において、方法は、応答スコアを決定するためのものである。いくつかの実施形態において、方法は、応答確率を決定するためのものである。いくつかの実施形態において、応答確率は応答スコアである。いくつかの実施形態によれば、抵抗スコアが決定される。他の実施形態によれば、抵抗性確率の予測が決定される。いくつかの他の実施形態によれば、20%未満の抵抗性確率は、対象が療法に応答性であることを示す。いくつかの実施形態によれば、応答スコアが決定される。他の実施形態によれば、応答確率の予測が決定される。いくつかの他の実施形態によれば、80%を超える応答確率は、対象が療法に応答性であることを示す。いくつかの実施形態において、「beyond」は「above(超、越、上方)」である。いくつかの実施形態において、「beyond」は「below(未満、下方)」である。スケールは、いずれかの方向に測定されるように設計することができ、そのため、上/下はスケールの構造に依存することが当業者に理解される。
【0060】
いくつかの実施形態において、方法は、対象が療法に対するレスポンダーであるかどうかを決定するためのものである。いくつかの実施形態において、方法は、対象が療法に対するノンレスポンダーであるかどうかを決定するためのものである。いくつかの実施形態において、方法は、療法に対する対象の応答を予測するためのものである。いくつかの実施形態において、方法は、療法に対する応答をモニターするためのものである。いくつかの実施形態において、方法は、療法を継続すべきかまたは調整すべきかを決定するためのものである(例えば、以下に提供されるRAP分析によって決定される薬剤を含むがこれらに限定されない追加の療法で対象をさらに治療することによる)。いくつかの実施形態において、方法は、対象を療法に対するレスポンダーまたは療法に対するノンレスポンダーとして決定するためのものである。いくつかの実施形態において、方法は、対象を、療法に対するレスポンダー、療法に対するノンレスポンダー、または安定した疾患状態を有するものとして決定するためのものである。いくつかの実施形態において、方法は、対象が療法に応答するか、または療法に応答しないかを予測するためのものである。
【0061】
いくつかの実施形態において、非応答は進行性疾患を含む。いくつかの実施形態において、非応答は、がんの進行を含む。いくつかの実施形態において、非応答は安定を含む。いくつかの実施形態において、非応答は疾患の症状の悪化を含む。いくつかの実施形態において、非応答は副作用の発症ではない。いくつかの実施形態において、非応答は、がんの成長、転移および/または継続した増殖を含む。いくつかの実施形態において、応答は安定である。いくつかの実施形態において、応答は寛解を含む。いくつかの実施形態において、寛解は最小の寛解である。いくつかの実施形態において、寛解は部分的な寛解である。いくつかの実施形態において、寛解は完全寛解である。いくつかの実施形態において、応答が、全奏効率(ORR)を使用して測定される。訓練を受けた医師は、応答、具体的にはORRを決定する方法に精通している。いくつかの実施形態において、応答が、固形腫瘍における応答評価基準(RECIST)を使用して測定される。いくつかの実施形態において、応答は生存を含む。いくつかの実施形態において、生存は全生存である。いくつかの実施形態において、生存は無増悪生存である。いくつかの実施形態において、応答は持続的臨床効果(DCB)を含む。
【0062】
いくつかの実施形態において、対象は哺乳動物である。いくつかの実施形態において、対象はヒトである。いくつかの実施形態において、対象は、疾患に罹患している。いくつかの実施形態において、疾患は療法によって治療可能である。いくつかの実施形態において、疾患はがんである。いくつかの実施形態において、疾患は、免疫チェックポイント阻害剤(ICI)によって治療可能である。いくつかの実施形態において、がんはPD-L1陽性がんである。いくつかの実施形態において、がんはPD-L1陰性がんである。いくつかの実施形態において、がんは固形がんである。いくつかの実施形態において、がんは腫瘍である。いくつかの実施形態において、がんが、肝胆管がん、子宮頸がん、泌尿生殖器がん(例えば、尿路上皮がん)、精巣がん、前立腺がん、甲状腺がん、卵巣がん、神経系がん、眼がん、肺がん、軟部組織がん、骨がん、膵臓がん、膀胱がん、皮膚がん、腸がん、肝がん、直腸がん、結腸直腸がん、食道がん、胃がん、胃食道がん、乳がん(例えば、トリプルネガティブ乳がん)、腎がん(例えば、腎癌)、皮膚がん、頭頸部がん、白血病およびリンパ腫から選択される。いくつかの実施形態において、がんは、皮膚がんおよび肺がんから選択される。いくつかの実施形態において、がんは皮膚がんである。いくつかの実施形態において、がんは肺がんである。いくつかの実施形態において、皮膚がんは、メラノーマである。いくつかの実施形態において、肺がんは小細胞肺がんである。いくつかの実施形態において、肺がんは非小細胞肺がんである。いくつかの実施形態において、対象は、第1の決定の前に療法に対してナイーブである。いくつかの実施形態において、対象は、第1の決定の前にその療法を受けていない。いくつかの実施形態において、対象は以前にその療法を受けたことがある。いくつかの実施形態において、対象は、その療法以外の療法によって以前に治療されている。いくつかの実施形態において、対象はいずれかの療法に対してナイーブである。いくつかの実施形態において、対象は免疫療法に対してナイーブである。いくつかの実施形態において、療法は第一の治療ラインである。いくつかの実施形態において、療法は進歩した治療ラインである。
【0063】
いくつかの実施形態において、療法は抗がん療法である。いくつかの実施形態において、抗がん療法は放射線である。いくつかの実施形態において、抗がん療法は化学療法である。いくつかの実施形態において、療法は免疫療法である。いくつかの実施形態において、抗がん療法は免疫療法である。いくつかの実施形態において、抗がん療法は標的療法である。いくつかの実施形態において、抗がん療法は、放射線、化学療法、免疫療法、標的療法、ホルモン療法、抗血管新生療法および光線力学療法、温熱療法、手術、およびそれらの組み合わせから選択される。いくつかの実施形態において、免疫療法は、免疫チェックポイント阻害、免疫チェックポイント調節、免疫チェックポイント遮断、養子細胞移入療法、腫瘍溶解性ウイルス療法、ワクチン療法、免疫系調節およびモノクローナル抗体を使用する療法から選択される。いくつかの実施形態において、免疫療法は、免疫チェックポイント阻害剤、免疫チェックポイント調節剤、免疫チェックポイント遮断薬、養子細胞移入療法、腫瘍溶解性ウイルス療法、治療ワクチン、免疫系調節剤およびモノクローナル抗体から選択される。いくつかの実施形態において、免疫療法は免疫チェックポイント阻害剤である。いくつかの実施形態において、免疫療法は免疫チェックポイント遮断である。いくつかの実施形態において、免疫療法は、化学療法、標的療法、ステロイド、および放射線療法を含む1つまたは複数の従来のがん療法と組み合わせて投与される。ICIと化学療法/放射線療法/標的療法との組み合わせは、複数の臨床試験で研究されている。本明細書に開示される予測タンパク質は、単剤療法としての免疫療法、ならびに併用療法の一部において予測的であることが当業者によって理解されるであろう。
【0064】
いくつかの実施形態において、免疫療法は複数の免疫療法である。いくつかの実施形態において、免疫療法は免疫チェックポイント遮断である。いくつかの実施形態において、免疫療法は免疫チェックポイントタンパク質阻害である。いくつかの実施形態において、免疫療法は免疫チェックポイントタンパク質調節である。いくつかの実施形態において、免疫療法は免疫チェックポイント阻害を含む。いくつかの実施形態において、免疫療法は免疫チェックポイント調節を含む。いくつかの実施形態において、免疫チェックポイント遮断および/または免疫チェックポイント阻害は、免疫チェックポイント阻害剤を対象に投与することを含む。いくつかの実施形態において、阻害は、免疫チェックポイント阻害剤を投与することを含む。いくつかの実施形態において、阻害剤はブロッキング抗体である。いくつかの実施形態において、免疫療法は免疫チェックポイント遮断を含む。いくつかの実施形態において、調節は、免疫チェックポイント調節剤を投与することを含む。いくつかの実施形態において、免疫チェックポイント調節は、免疫チェックポイント調節剤を対象に投与することを含む。
【0065】
本明細書で使用される場合、「免疫チェックポイント阻害剤(ICI)」という用語は、単一のICI、ICIの併用、およびICIと別のがんの療法との併用を指す。ICIは、免疫チェックポイントタンパク質の遮断、阻害または調節を対象としたモノクローナル抗体、二重特異性抗体、ヒト化抗体、完全ヒト抗体、融合タンパク質、またはそれらの組み合わせであり得る。いくつかの実施形態において、免疫チェックポイント阻害剤は免疫チェックポイント調節剤である。いくつかの実施形態において、免疫チェックポイント阻害剤は免疫チェックポイント遮断薬である。いくつかの実施形態において、免疫チェックポイントタンパク質は、PD-1(プログラム死-1)、PD-L1、PD-L2、CTLA-4(細胞傷害性Tリンパ球関連タンパク質4)、A2AR(アデノシンA2A受容体)、ADORA2Aとしても知られている、CD276とも呼ばれるB7-H3、VTCN1とも呼ばれるB7-H4、B7-H5、CD272とも呼ばれるBTLA(B and T Lymphocyte Attenuator)、IDO(インドールアミン2,3-ジオキシゲナーゼ)、KIR(キラー細胞免疫グロブリン様受容体)、LAG-3(リンパ球活性化遺伝子3)、TDO(トリプトファン2,3-ジオキシゲナーゼ)、TIM-3(T細胞免疫グロブリンドメインおよびムチンドメイン3)、VISTA(T細胞活性化のVドメインIg抑制因子)、NOX2(ニコチンアミドアデニンジヌクレオチドリン酸NADPHオキシダーゼアイソフォーム2)、SIGLEC7(シアル酸結合イムノグロブリン型レクチン7)、CD328とも呼ばれる、SIGLEC9(シアル酸結合イムノグロブリン型レクチン9)、CD329とも呼ばれる、CD134とも呼ばれるOX40(腫瘍壊死因子受容体スーパーファミリー、メンバー4)、およびTIGITから選択される。いくつかの実施形態において、免疫チェックポイントタンパク質は、PD-1、PD-L1、およびPD-L2から選択される。いくつかの実施形態において、免疫チェックポイントタンパク質は、PD-1およびPD-L1から選択される。いくつかの実施形態において、免疫チェックポイントタンパク質はCTLA-4である。いくつかの実施形態において、免疫チェックポイントタンパク質はPD-1である。いくつかの実施形態において、免疫チェックポイント遮断は、抗PD-1/PD-L1/PD-L2免疫療法を含む。いくつかの実施形態において、免疫チェックポイント遮断は抗PD-1免疫療法を含む。いくつかの実施形態において、免疫チェックポイント遮断は、抗PD-1および/または抗PD-L1免疫療法を含む。いくつかの実施形態において、免疫チェックポイント遮断は、抗CTLA-4免疫療法を含む。いくつかの実施形態において、免疫チェックポイント遮断は、抗PD-1および/または抗PD-L1免疫療法および抗CTLA-4免疫療法を含む。
【0066】
いくつかの実施形態において、抵抗性関連因子は、
a.
i.療法に応答することが知られている対象(レスポンダー)の集団における、
ii.療法に応答しないことが知られている対象(ノンレスポンダー)の集団における、および
iii.対象における
複数の因子の発現レベルを受け取ること、
b.複数の因子の少なくとも1つの因子に対して抵抗スコアを計算し、ならびに
c.閾値を超える抵抗スコアを有する因子を抵抗性関連因子として分類すること
を含む、方法により決定される。
【0067】
いくつかの実施形態において、抵抗性関連因子が各対象に存在する。いくつかの実施形態において、抵抗性関連因子がレスポンダーにある。いくつかの実施形態において、抵抗性関連因子はノンレスポンダーにある。いくつかの実施形態において、抵抗性関連因子は標識で標識される。いくつかの実施形態において、抵抗性関連因子は、抵抗性関連タンパク質である。
【0068】
いくつかの実施形態において、免疫療法はブロッキング抗体である。いくつかの実施形態において、免疫療法は対象へのブロッキング抗体の投与である。
【0069】
いくつかの実施形態において、ICIはPD-1またはPD-L1に対するモノクローナル抗体(mAb)である。いくつかの実施形態において、ICIは、PD-1経路を中和/遮断/阻害/調節するmAbである。いくつかの実施形態において、ICIはPD-1に対するmAbである。いくつかの実施形態において、抗PD-1mAbはペンブロリズマブ(キイトスギ;以前はラムブロリズマブと呼ばれていた)である。いくつかの実施形態において、抗PD-1mAbは、ニボルマブ(Opdivo)である。いくつかの実施形態において、抗PD-1mAbはピジリズマブ(CT0011)である。いくつかの実施形態において、抗PD-1mAbはセミプリマブ(Libtayo、REGN2810)である。いくつかの実施形態において、抗PD-1mAbは、AMP-224、MEDI0680、またはPDR001のいずれか1つである。いくつかの実施形態において、ICIはPD-L1に対するmAbである。いくつかの実施形態において、抗PD-L1mAbは、アテゾリズマブ(Tecentriq)、アベルマブ(Bavencio)、およびデュルバルマブ(Imfinzi)から選択される。いくつかの実施形態において、抗PD-L1mAbはアテゾリズマブである。いくつかの実施形態において、抗PD-L1mAbは、デュルバルマブである。いくつかの実施形態において、ICIは、CTLA-4に対するmAbである。いくつかの実施形態において、抗CTLA-4mAbはイピリムマブである。
【0070】
本明細書で使用される場合、「因子」という用語は、対象によって産生されるいずれかの測定可能な生物学的分子を指す。いくつかの実施形態において、因子はタンパク質である。いくつかの実施形態において、因子はRNAである。いくつかの実施形態において、因子は遺伝子である。いくつかの実施形態において、因子は分泌因子である。いくつかの実施形態において、分泌因子は、サイトカイン、ケモカイン、成長因子、可溶性受容体および酵素から選択される。いくつかの実施形態において、因子は可溶性因子である。いくつかの実施形態において、因子は細胞因子である。いくつかの実施形態において、因子は膜因子である。いくつかの実施形態において、因子は細胞接着分子である。いくつかの実施形態において、因子は血液中に見られる因子である。いくつかの実施形態において、因子は宿主生成因子である。いくつかの実施形態において、因子は抵抗因子である。
【0071】
いくつかの実施形態において、発現はタンパク質発現である。いくつかの実施形態において、発現は分泌タンパク質発現である。いくつかの実施形態において、タンパク質発現は可溶性タンパク質発現である。いくつかの実施形態において、発現は細胞タンパク質発現である。いくつかの実施形態において、発現は膜タンパク質発現である。いくつかの実施形態において、発現はmRNA発現である。いくつかの実施形態において、発現はタンパク質発現またはmRNA発現である。いくつかの実施形態において、発現レベルは、濃度である。いくつかの実施形態において、濃度は濃度レベルである。因子の存在が液体試料において測定される場合、発現は、因子の発現を決定する方法に従って、mg/mlなどの濃度として、または任意の単位で提供され得ることが当業者によって理解されるであろう。任意の単位は、相対蛍光単位(RFU)および正規化タンパク質発現(NPX)、または発現の測定として使用されるいずれかの他の任意の単位から選択することができる。「発現」および「発現レベル」という用語は、本明細書では互換的に使用され、試料に存在する遺伝子産物の量を指す。いくつかの実施形態において、遺伝子産物は、ポリヌクレオチド、例えば腫瘍DNA、循環腫瘍DNAまたは循環DNAを含む。いくつかの実施形態において、DNAは無細胞DNAである。いくつかの実施形態において、決定することは、発現レベルの定量化を含む。いくつかの実施形態において、決定することは、発現レベルの正規化を含む。因子の発現レベルの決定は、当技術分野で公知の任意の方法によって行うことができる。タンパク質発現を決定する方法には、例えば、抗体アレイ、免疫ブロット法、免疫組織化学、フローサイトメトリー(FACS)、ELISA、近接伸長アッセイ(PEA)、アプタマーベースアッセイ、プロテオミクスアレイ、プロテオーム配列決定、フローサイトメトリー(CyTOF)、マルチプレックスアッセイ、質量分析およびクロマトグラフィーが含まれる。いくつかの実施形態において、タンパク質発現レベルを決定することはELISAを含む。いくつかの実施形態において、タンパク質発現レベルを決定することは、タンパク質アレイハイブリダイゼーションを含む。いくつかの実施形態において、タンパク質発現レベルを決定することは、質量分析定量化を含む。いくつかの実施形態において、タンパク質発現レベルを決定することは、PEAを含む。いくつかの実施形態において、タンパク質発現レベルを決定することは、アプタマーを含む。mRNAの発現を決定する方法には、例えば、RT-PCR、定量的PCR、リアルタイムPCR、マイクロアレイ、ノーザンブロッティング、インサイチュハイブリダイゼーション、次世代シークエンシング、および大規模並列シークエンシングが含まれる。
【0072】
いくつかの実施形態において、受け取られる因子発現レベルは、因子発現レベルを提示している。いくつかの実施形態において、受け取られる因子発現レベルは、因子発現レベルを決定することである。いくつかの実施形態において、決定することは、測定することである。いくつかの実施形態において、測定は試料において行われる。いくつかの実施形態において、発現レベルが試料において検出された。いくつかの実施形態において、試料は生物学的試料である。いくつかの実施形態において、試料は対象によって提供される。いくつかの実施形態において、試料は対象によって提供されている。いくつかの実施形態において、試料はレスポンダーによって提供される。いくつかの実施形態において、試料はノンレスポンダーによって提供される。いくつかの実施形態において、レスポンダーの集団の各対象が試料を提供した。いくつかの実施形態において、ノンレスポンダーの集団の各対象が試料を提供した。いくつかの実施形態において、試料は、療法を受ける前に対象によって提供されている。いくつかの実施形態において、試料は、療法を受けた後で対象によって提供されている。いくつかの実施形態において、決定することは、試料において直接行われる。いくつかの実施形態において、決定することは、未処理の試料におけるものである。いくつかの実施形態において、決定することは、処理された試料におけるものである。いくつかの実施形態において、方法は、試料を処理することをさらに含む。いくつかの実施形態において、処理は、試料からタンパク質を単離することを含む。いくつかの実施形態において、処理は、試料から核酸を単離することを含む。いくつかの実施形態において、核酸はRNAである。いくつかの実施形態において、RNAはmRNAである。いくつかの実施形態において、プロセシングは、試料の細胞を溶解することを含む。
【0073】
本明細書で使用される場合、用語「ペプチド」、「ポリペプチド」および「タンパク質」は、アミノ酸残基のポリマーを指すために交換可能に使用される。別の実施形態では、本明細書で使用される「ペプチド」、「ポリペプチド」および「タンパク質」という用語は、天然ペプチド、ペプチド模倣物(典型的には非ペプチド結合または他の合成改変を含む)ならびにペプチド類似体、ペプトイドおよびセミペプトイドまたはそれらの任意の組み合わせを包含する。別の実施形態では、記載されるペプチド、ポリペプチド、およびタンパク質は、体内でより安定であるか、または細胞に浸透することがより可能になる改変を有する。一実施形態では、「ペプチド」、「ポリペプチド」および「タンパク質」という用語は、天然に存在するアミノ酸ポリマーに適用される。別の実施形態では、「ペプチド」、「ポリペプチド」、および「タンパク質」という用語は、1つまたは複数のアミノ酸残基が対応する天然アミノ酸の人工的な化学類似体であるアミノ酸ポリマーに適用される。
【0074】
いくつかの実施形態において、試料は生物学的試料である。いくつかの実施形態において、試料は組織である。いくつかの実施形態において、試料は流体である。いくつかの実施形態において、流体は生物学的流体である。いくつかの実施形態において、試料は対象に由来する。いくつかの実施形態において、試料は腫瘍試料ではない。いくつかの実施形態において、試料は腫瘍試料である。いくつかの実施形態において、試料は造血器がんではなく、試料は血液試料である。いくつかの実施形態において、試料は、がん細胞を含まない試料である。いくつかの実施形態において、血液試料は、末梢血試料、血清試料および血漿試料を含む。いくつかの実施形態において、試料は血漿試料である。いくつかの実施形態において、試料は血清試料である。いくつかの実施形態において、処理は、血漿を単離することを含む。いくつかの実施形態において、処理は血清を単離することを含む。いくつかの実施形態において、生体液は、血液、血漿、血清、リンパ液、脳脊髄液、尿、糞便、精液、腫瘍液、および胃液から選択される。いくつかの実施形態において、対象およびレスポンダーから得られた試料は、同じ種類の試料である。いくつかの実施形態において、対象およびレスポンダーから得られた試料は、異なる種類の試料である。いくつかの実施形態において、対象およびノンレスポンダーから得られる試料は、同じ種類の試料である。いくつかの実施形態において、対象およびノンレスポンダーから得られる試料は、異なる種類の試料である。いくつかの実施形態において、ノンレスポンダーおよびレスポンダーから得られる試料は、同じ種類の試料である。いくつかの実施形態において、ノンレスポンダーおよびレスポンダーから得られる試料は、異なる種類の試料である。いくつかの実施形態において、対象、ノンレスポンダーおよびレスポンダーから得られる試料は、同じ種類の試料である。いくつかの実施形態において、対象、ノンレスポンダーおよびレスポンダーから得られる試料は、血液試料である。いくつかの実施形態において、対象、ノンレスポンダーおよびレスポンダーから得られる試料は、血漿試料である。いくつかの実施形態において、対象、ノンレスポンダー、およびレスポンダーから得られる試料は、血清試料である。いくつかの実施形態において、対象、ノンレスポンダー、およびレスポンダーから得られる試料は、異なる種類の試料である。
【0075】
いくつかの実施形態において、因子は、複数の因子の因子である。いくつかの実施形態において、複数の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、100、150、200、250、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、10000、12000、15000、20000、25000、30000、35000、または40000因子の発現レベルが受け取られる。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、複数とは、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、100、150、200、250、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、10000、12000、15000、20000、25000、30000、35000、または40000である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、少なくとも200個の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも400個の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも1000個の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも5000個の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも6000個の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも7000個の因子の発現レベルが受け取られる。いくつかの実施形態において、少なくとも8000個の因子の発現レベルが受け取られる。
【0076】
いくつかの実施形態において、レスポンダーの集団は疾患に罹患している。いくつかの実施形態において、レスポンダーは全員同じ疾患を有している。いくつかの実施形態において、ノンレスポンダーの集団は疾患に罹患している。いくつかの実施形態において、ノンレスポンダーは全員同じ疾患に罹患している。いくつかの実施形態において、レスポンダーおよびノンレスポンダーの集団は全員同じ疾患に罹患している。いくつかの実施形態において、レスポンダーの集団および対象は同じ疾患に罹患している。いくつかの実施形態において、ノンレスポンダーの集団および対象は同じ疾患に罹患している。いくつかの実施形態において、ノンレスポンダーの集団、レスポンダーの集団および対象は、同じ疾患に罹患している。
【0077】
いくつかの実施形態において、発現レベルは、療法を受ける前の対象からのものである。いくつかの実施形態において、対象に対する発現レベルは、療法を受ける前に決定される。いくつかの実施形態において、発現レベルは時間T0からである。いくつかの実施形態において、試料は、療法を受ける前に対象によって提供される。いくつかの実施形態において、発現レベルは、療法の第1の治療を受ける前の対象からのものである。いくつかの実施形態において、治療は服薬である。いくつかの実施形態において、治療はレジメンである。
【0078】
いくつかの実施形態において、前とは、療法の、または療法を施す少なくとも1時間前、2時間前、3時間前、6時間前、8時間前、12時間前、1日前、2日前、3日前、5日前、1週間前、2週間前、3週間前、4週間前、1ヶ月前、2ヶ月前、3ヶ月前、4ヶ月前、5ヶ月前、または6ヶ月前である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、前とは少なくとも1時間前である。いくつかの実施形態において、前とは療法の直前または療法を施す直前である。いくつかの実施形態において、前とは、療法の、または療法を施す最大1時間前、2時間前、3時間前、4時間前、6時間前、9時間前、12時間前、18時間前、24時間前、2日前、3日前、5日前、1週間前、2週間前、3週間前、4週間前、1ヶ月前、2ヶ月前、3ヶ月前、4ヶ月前、5ヶ月前、または6ヶ月前である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、前とは、療法の、または療法を施す最大24時間前である。いくつかの実施形態において、療法を施すとは、最初に施す療法である。いくつかの実施形態において、療法を施すとは、いずれかに施す療法である。
【0079】
いくつかの実施形態において、発現レベルは、療法を受けた後の対象からのものである。いくつかの実施形態において、発現レベルは時間T1からである。いくつかの実施形態において、試料は、療法を受けた後で対象によって提供される。いくつかの実施形態において、発現レベルは、療法の第1の治療を受けた後の対象からのものである。いくつかの実施形態において、発現レベルは、療法による任意の治療を受けた後の対象からのものである。
【0080】
いくつかの実施形態において、後とは、療法の開始後の時点または療法を施した後であり、少なくとも1つの因子の発現の変化に十分である。いくつかの実施形態において、後とは、療法の開始後の時点、または療法の第1の治療を施した後である。いくつかの実施形態において、後とは、少なくとも1日後、2日後、3日後、4日後、5日後、6日後、1週間後、2週間後、3週間後、4週間後、6週間後、1ヶ月後、2ヶ月後、3ヶ月後、4ヶ月後、5ヶ月後、6ヶ月後、または1年後である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、後とは、少なくとも24時間後である。いくつかの実施形態において、後とは、少なくとも2週間後である。いくつかの実施形態において、後とは、少なくとも3週間後である。いくつかの実施形態において、後とは、少なくとも6週間後である。いくつかの実施形態において、後とは、療法の開始後または療法を施した後最大1週間、2週間、3週間、4週間、6週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、もしくは1年である。各可能性は、本発明の別個の実施形態を表す。
【0081】
いくつかの実施形態において、発現レベルを受け取ることは、複数の因子よりも大きい因子の群に対する因子発現レベルを受け取ることを含む。いくつかの実施形態において、より大きな群について受け取られた発現レベルは、レスポンダーおよびノンレスポンダーについて受け取られる。いくつかの実施形態において、タンパク質のサブグループが群から選択される。いくつかの実施形態において、サブグループは複数の因子が指定される。いくつかの実施形態において、方法は、指定することを含む。いくつかの実施形態において、受け取ることは、機械学習アルゴリズムを適用する群の各因子についてさらに含む。いくつかの実施形態において、アルゴリズムは、レスポンダーおよびノンレスポンダーから因子を分類する。いくつかの実施形態において、アルゴリズムは、測定された因子発現レベルを有する試料を提供した対象がレスポンダーまたはノンレスポンダーである場合に出力する。いくつかの実施形態において、受け取ることは、アルゴリズムが対象をレスポンダーとノンレスポンダーに最も均一に分割する因子のサブグループを選択することをさらに含む。いくつかの実施形態において、対象はレスポンダーおよびノンレスポンダーの集団におけるすべての対象である。いくつかの実施形態において、因子は、すべての対象、レスポンダーおよびノンレスポンダーを、レスポンダーおよびノンレスポンダーの群に最も均等に分割するアルゴリズムで処理され、(指定が正しくない場合でも)サブグループとして選択される。いくつかの実施形態において、アルゴリズムは、レスポンダーおよびノンレスポンダーにおける受け取られた因子発現レベルについて訓練される。いくつかの実施形態において、アルゴリズムは訓練セットで訓練される。いくつかの実施形態において、訓練は、発現レベル、および発現レベルがレスポンダー由来であったかノンレスポンダー由来であったかを示すタグに関する。いくつかの実施形態において、訓練は、発現レベル、臨床情報、および発現レベルがレスポンダー由来であったかノンレスポンダー由来であったかどうかを示すタグに関する。
【0082】
いくつかの実施形態において、サブグループは、そのアルゴリズムが対象を最も均一に分割する因子を含む。いくつかの実施形態において、均一に分割してレスポンダーとノンレスポンダーにする。いくつかの実施形態において、サブグループは、上位50、100、150、200、250、300、350、400、450、500、600、700、750、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、または5000である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、サブグループは、上位50である。いくつかの実施形態において、サブグループは、上位100である。いくつかの実施形態において、サブグループは、上位200である。いくつかの実施形態において、サブグループは、上位500である。
【0083】
いくつかの実施形態において、方法は、次元縮小ステップを実行することをさらに含む。いくつかの実施形態において、縮小は複数の因子に関するものである。いくつかの実施形態において、縮小は、複数の因子の数を減らすことである。いくつかの実施形態において、次元縮小ステップは、因子のサブグループまたはサブセットを識別する。いくつかの実施形態において、因子は主要因子である。いくつかの実施形態において、訓練セットは、因子のサブセット/サブグループの発現レベルのみを含む。いくつかの実施形態において、因子のサブグループまたはサブセットは、予測されたレスポンダーおよびノンレスポンダーの数のバランスを最も均一にする因子である。いくつかの実施形態において、予測は機械学習アルゴリズムによって予測される。いくつかの実施形態において、機械学習アルゴリズムは訓練された機械学習アルゴリズムである。いくつかの実施形態において、機械学習アルゴリズムは、訓練中の機械学習アルゴリズムである。
【0084】
いくつかの実施形態において、前処理段階を行って、受け取った発現レベルを前処理することができる。いくつかの実施形態において、前処理段階は、データクリーニングおよび正規化、特徴の選択、特徴の抽出、次元縮小、および/または任意の他の適切な前処理方法または技術のうちの少なくとも1つを含むことができる。特徴の選択は、コルモゴロフ-スミルノフ(KS)検定などの統計学的検定、または当技術分野で公知のいずれかの他の検定によって行うことができる。
【0085】
いくつかの実施形態において、各試料の中の因子の数を減らすために、および/または主要因子、例えば、有意な予測力を有し得る因子のセットを得るために、因子選択および/または次元縮小ステップを実行することができる。したがって、いくつかの実施形態において、因子選択および/または次元縮小ステップは、各試料および/または値のセットにおける因子の数の低減をもたらし得る。いくつかの実施形態において、次元縮小は、因子が所望の予測に関して生成する応答予測力のレベルに基づいて、主要因子、例えばタンパク質を選択する。特定の実施形態では、次元縮小は、すべてまたはいくつかの因子をベクトル成分とみなし、それらのノルムを計算することを含む。
【0086】
いくつかの実施形態において、限定はしないが、以下のような任意の適切な因子選択および/または次元縮小方法または技術を使用することができる。
・SパラメータによるANOVA:得られた試験p値および群間差平均に基づいて特徴の相対的重要性を制御する追加のパラメータ(S)による分散分析(例えば、Tusher,Tibshirani and Chu,PNAS 98,pp5116-21,2001を参照されたい)。
・Scalable EMpirical Bayes Model Selection(SEMMS):簡潔な混合モデルを適用して有意な予測子を識別する経験的ベイズ特徴選択方法(例えば、Bar,Booth,and Wells.A scalable empirical Bayes approach to variable selection in generalized linear models,2019を参照されたい)。
・L2N:3成分混合モデルを使用する示差的発現分析のための方法。このモデルは、差次的に発現される特徴については2つの対数正規成分(L2)からなり、一方の成分は過小発現される特徴についてであり、他方の成分は過剰発現される特徴についてであり、1つの正規成分(N)は非差次的に発現される特徴についてである(例えば、Bar and Schifano.Differential variation and expression analysis.Stat 8,e237,doi:10.1002/sta4.237,2019を参照されたい)。
・遺伝的アルゴリズム:最適な構成を達成するための方法として、ランダム突然変異、組換え、および自然選択などの有機進化技術を採用するヒューリスティック最適化アルゴリズムのファミリー(例えば、Popovic,Sifrim,Pavlopoulos,Moreau,and Bart De Moor.A Simple Genetic Algorithm for Biomarker Mining.2012を参照されたい)。
・ナイーブ分類器:ナイーブ分類器は、次元を単一のスコアに縮小することによって応答スコアを評価する。これは、すべての特徴(例えば、タンパク質発現レベルなどの特異的プロファイル)をベクトルの成分とみなし、そのノルムを計算することによって実行される。次元の縮小は、オーバーフィッティングの起こり得るリスクを低減する。いくつかの実施形態において、ベクトル成分は、正規化されたノルムが典型的なそれぞれのクラス値からの逸脱の量を定量化するように、同じ応答群(例えば、レスポンダー)に属する患者の間での典型的な成分の値に従って正規化される。さらなる実施形態では、ナイーブ分類器は、応答群の一部にのみ属する対象のデータを使用した訓練を可能にする。
【0087】
本明細書で使用される場合、「レスポンダー」または「応答することが知られている」対象という用語は互換的に使用され、療法が施された場合、療法によって治療されている疾患の少なくとも1つの基準の改善を示すか、または疾患の重症度の増加を示さない対象を指す。いくつかの実施形態において、レスポンダーは、療法が施されたとき、その療法によって治療されている疾患における改善を示す対象である。いくつかの実施形態において、レスポンダーは、療法が施されたときに疾患の重篤度における増大を示さない対象である。いくつかの実施形態において、増大は経時的な重症度である。いくつかの実施形態において、重症度の増大は安定であることを示さない。いくつかの実施形態において、レスポンダーは、療法が施されたときに混ざった応答を示す対象である。いくつかの実施形態において、レスポンダーは、療法が施されたときに混ざった応答を示す対象であり、ここで、混ざった応答は、疾患の少なくとも1つの基準における改善であるが、疾患の他の基準における改善を示さない。いくつかの実施形態において、混ざった応答は、新規または既存の病変の成長と組み合わされたいくつかの病変の縮小である。いくつかの実施形態において、レスポンダーは、療法が抗疾患応答をもたらす対象である。いくつかの実施形態において、がんを有する対象について、レスポンダーは、療法が抗がん応答を生じる対象である。いくつかの実施形態において、応答は副作用の軽減ではない。いくつかの実施形態において、応答は副作用の軽減である。いくつかの実施形態において、応答は疾患自体に対する応答である。いくつかの実施形態において、抗がん応答は抗腫瘍応答である。いくつかの実施形態において、抗腫瘍応答は腫瘍の退縮を含む。いくつかの実施形態において、抗腫瘍応答は、腫瘍の収縮を含む。いくつかの実施形態において、抗腫瘍応答は、腫瘍成長の欠如を含む。いくつかの実施形態において、抗腫瘍応答は腫瘍転移の欠如を含む。いくつかの実施形態において、抗腫瘍応答は、腫瘍の過剰増殖の欠如を含む。いくつかの実施形態において、改善は、疾患の少なくとも1つの症状におけるものである。いくつかの実施形態において、応答は完全な応答である。いくつかの実施形態において、応答は最小奏効である。いくつかの実施形態において、応答は部分奏効である。いくつかの実施形態において、応答は安定を含む。いくつかの実施形態において、レスポンダーは、療法に対して好ましい応答を有する対象である。いくつかの実施形態において、ノンレスポンダーは、療法に対して好ましくない応答を有する対象である。いくつかの実施形態において、好ましくない応答は腫瘍負荷量の増大である。腫瘍負荷量の増加は、腫瘍のサイズの増加、腫瘍拡大の増加、転移の増加、腫瘍細胞増殖の増加またはいずれかの他の増加など、腫瘍のサイズまたはがん細胞の総数のいずれかの増加を包含し得る。
【0088】
本明細書で使用される場合、がん患者の「好ましい応答」は、療法による治療に対するがん患者の「応答性」を示し、すなわち、療法による応答性がん患者の治療は、腫瘍の退縮、腫瘍縮小または腫瘍壊死、腫瘍負荷量の減少、免疫系による抗腫瘍応答、腫瘍再発、腫瘍の成長または腫瘍の転移を予防または遅延させることなどの所望の臨床転帰をもたらす。いくつかの実施形態において、対象は完全奏効者であり、またはがん療法による治療は安定をもたらす。いくつかの実施形態において、完全奏効者は、療法による治療後に検出可能ながんが存在しない対象である。この場合、療法による応答性がん患者の治療を継続することが可能であり、推奨されるか、または患者ががんに罹患していない場合、治療を中止することが可能である。いくつかの実施形態において、方法は、ノンレスポンダーではない対象に療法を施し続けることをさらに含む。いくつかの実施形態において、対象は、ノンレスポンダー、最小レスポンダー、部分レスポンダーであるか、または安定を有し、方法は、対象に療法を施し続けること、ならびに応答性を高めるために追加の療法(例えば、本明細書で提供される抵抗性関連タンパク質(RAP)分析を使用して決定される)で対象を治療することをさらに含む。いくつかの実施形態において、ノンレスポンダーではない対象はレスポンダーである。
【0089】
本明細書で使用される場合、「ノンレスポンダー」という用語および「応答しないことが知られている」対象は互換的に使用され、療法を施した場合に疾患の改善または安定化を示さない対象を指す。いくつかの実施形態において、ノンレスポンダーは、療法が施されたときに疾患の悪化を示す。いくつかの実施形態において、ノンレスポンダーは、療法の副作用を経験する対象ではない。いくつかの実施形態において、ノンレスポンダーは、疾患が進行する対象である。いくつかの実施形態において、ノンレスポンダーは、疾患が療法後に安定化しない対象である。いくつかの実施形態において、ノンレスポンダーは、疾患が療法後に改善しない対象である。いくつかの実施形態において、ノンレスポンダーは、本明細書の上部で定義されるようなレスポンダーではない対象である。いくつかの実施形態において、ノンレスポンダーは、療法に対して好ましくない応答を有する対象である。いくつかの実施形態において、ノンレスポンダーは療法に抵抗性の対象である。いくつかの実施形態において、ノンレスポンダーは療法に対して難治性の対象である。
【0090】
本明細書で使用される場合、がん患者の「好ましくない応答」は、療法による治療に対するがん患者の「非応答性」を示し、したがって療法による非応答性がん患者の治療は、所望の臨床転帰をもたらさず、潜在的に腫瘍の拡大、再発、または転移などの望ましくない転帰をもたらす。いくつかの実施形態において、方法は、ノンレスポンダーである対象へ療法を施すのを中止することをさらに含む。いくつかの実施形態において、方法は、追加の療法と組み合わせて、対象に療法を施し続けることをさらに含む。いくつかの実施形態において、追加の療法は、非応答性患者の応答性を高める。
【0091】
いくつかの実施形態において、方法は、応答が持続的応答(例えば、6ヶ月を超える無増悪生存)とみなされるかどうかを判定するためのものである。
【0092】
いくつかの実施形態において、方法は、療法に応答すると予測される対象に療法を施すことをさらに含む。いくつかの実施形態において、方法は、療法に応答すると予測される対象に療法を施し続けることをさらに含む。いくつかの実施形態において、方法は、療法に応答しないと予測される対象に療法を施さないことをさらに含む。いくつかの実施形態において、方法は、療法に応答しないと予測される対象に療法を中止することをさらに含む。いくつかの実施形態において、方法は、ノンレスポンダーであると予測される対象に代替療法を施すことをさらに含む。いくつかの実施形態において、代替療法は追加の療法である。いくつかの実施形態において、方法は、療法に抵抗性であると予測される対象における抵抗性関連因子の少なくとも1つを阻止するかまたは阻害する薬剤または療法と併用して、療法を施すこと、または療法を施し続けることをさらに含む。いくつかの実施形態において、抵抗性関連因子の少なくとも1つを遮断または阻害する薬剤または療法は、追加の療法である。いくつかの実施形態において、併用療法は、ノンレスポンダーであると予測される対象に投与される。
【0093】
いくつかの実施形態において、方法は、少なくとも1つの因子を調節する薬剤を対象(例えば、ノンレスポンダー)に投与することをさらに含む。いくつかの実施形態において、調節は、阻害、遮断および調節を含む。いくつかの実施形態において、調節は阻害をする。いくつかの実施形態において、方法は、対象(例えば、ノンレスポンダー)に、少なくとも1つの因子を含む経路を調節する薬剤を投与することをさらに含む。いくつかの実施形態において、少なくとも1つの因子を調節することは、少なくとも1つの因子を含む経路を調節することである。いくつかの実施形態において、経路を調節することは、少なくとも1つの因子を制御するドライバータンパク質/遺伝子を調節することを含む。いくつかの実施形態において、経路を調節することは、経路を制御するドライバータンパク質/遺伝子を調節することを含む。いくつかの実施形態において、少なくとも1つの因子を含む経路を調節することは、因子の受容体(例えば、1つまたは複数の受容体アゴニストを使用すること)、リガンドもしくは因子、因子のパラログ、またはそれらの組み合わせを調節することである。いくつかの実施形態において、調節することは、複数の因子を調節することである。いくつかの実施形態において、調節することは、シグネチャの複数の因子を調節することである。いくつかの実施形態において、調節は、シグネチャの各因子を変調することである。いくつかの実施形態において、調節は、療法に対するより良好な応答を達成する。いくつかの実施形態において、因子は、抵抗性関連因子である。
【0094】
いくつかの実施形態において、抵抗スコアは、RAPスコアである。いくつかの実施形態において、抵抗スコアは、応答スコアである。いくつかの実施形態において、抵抗スコアは1応答スコアである。いくつかの実施形態において、応答スコアは1-抵抗スコアである。いくつかの実施形態において、抵抗スコアは、総抵抗スコアである。いくつかの実施形態において、応答スコアは総応答スコアである。いくつかの実施形態において、RAPスコアは、総RAPスコアである。いくつかの実施形態において、抵抗スコアは、ノンレスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性に基づく。いくつかの実施形態において、抵抗スコアは、レスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性に基づく。いくつかの実施形態において、何かに基づくとは、何かに基づいて計算される。いくつかの実施形態において、類似性は類似性が欠如した状態である。いくつかの実施形態において、レスポンダーとの類似性は、ノンレスポンダーとの類似性が欠如している状態である。いくつかの実施形態において、ノンレスポンダーとの類似性は、レスポンダーとの類似性が欠如している状態である。いくつかの実施形態において、類似性は尺度で測定される。いくつかの実施形態において、スケールは0~1であり、1はノンレスポンダーに完全に類似したものであり、0はレスポンダーに完全に類似したものである。いくつかの実施形態において、抵抗スコアは0~1であり、1はノンレスポンダーに完全に類似したものであり、0はレスポンダーに完全に類似したものである。いくつかの実施形態において、抵抗スコアは、ノンレスポンダーにおける因子発現レベルおよびレスポンダーにおける因子発現レベルに対する対象における因子発現レベルの類似性に基づく。
【0095】
いくつかの実施形態において、方法は、ステップ(b)の前に因子のサブセットを選択することを含む。いくつかの実施形態において、ステップ(b)の前は計算することの前である。いくつかの実施形態において、サブセットは複数の因子の対象である。いくつかの実施形態において、対象は、レスポンダーとノンレスポンダーとを最もよく区別する因子を含む。いくつかの実施形態において、最良の区別をもたらす因子は、上位パーセンテージである。いくつかの実施形態において、上位パーセンテージは、因子の上位1、3、5、10、15、20、25、30、35、40、45または50%である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、上位パーセンテージは上位20%である。いくつかの実施形態において、上位の因子は、上位10、20、25、30、40、50、60、70、75、80、90または100因子である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、上位の因子は上位50因子である。いくつかの実施形態において、選択は、コルモゴロフ-スミルノフ検定を適用することを含む。いくつかの実施形態において、コルモゴロフ-スミルノフ検定を、受け取った因子発現レベルに適用する。いくつかの実施形態において、コルモゴロフ-スミルノフ検定は、因子がレスポンダーとノンレスポンダーとをどれだけ良好に区別するかを求める。いくつかの実施形態において、コルモゴロフ-スミルノフ検定は、因子がどれだけよく区別するかの尺度を出力し、最良の因子は、最高のスコアを有する因子である。いくつかの実施形態において、選択は、XGBoostアルゴリズムを適用することを含む。いくつかの実施形態において、計算することはサブセットについてである。いくつかの実施形態において、計算することは、サブセットの各因子に対するものである。
【0096】
いくつかの実施形態において、計算することは、機械学習アルゴリズムを適用することを含む。いくつかの実施形態において、計算することは、機械学習モデルを適用することを含む。いくつかの実施形態において、機械学習モデルは機械学習アルゴリズムである。いくつかの実施形態において、機械学習モデルは機械学習アルゴリズムを実装する。いくつかの実施形態において、アルゴリズムは分類器である。いくつかの実施形態において、アルゴリズムは回帰モデルである。いくつかの実施形態において、アルゴリズムは教師付きである。いくつかの実施形態において、アルゴリズムは教師なしである。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーにおける発現レベルについて訓練される。いくつかの実施形態において、機械学習アルゴリズムは、ノンレスポンダーにおける発現レベルについて訓練される。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーおよびノンレスポンダーにおける発現レベルについて訓練される。いくつかの実施形態において、機械学習アルゴリズムは訓練セットで訓練される。いくつかの実施形態において、機械学習アルゴリズムは、本発明の方法によって訓練される。いくつかの実施形態において、機械学習アルゴリズムが複数の因子の因子に適用される。いくつかの実施形態において、機械学習アルゴリズムは、複数の因子の各因子に適用される。いくつかの実施形態において、機械学習アルゴリズムがサブセットに適用される。いくつかの実施形態において、機械学習アルゴリズムが因子のサブセットに適用される。いくつかの実施形態において、機械学習アルゴリズムは、因子のサブセットの各因子に適用される。いくつかの実施形態において、各因子は別々に分析および計算され、機械学習アルゴリズムは訓練セットとして2つ以上の因子の発現レベルを使用しない。いくつかの実施形態において、訓練された機械学習アルゴリズムが、対象からの個々のタンパク質発現レベルに適用される。いくつかの実施形態において、レスポンダーおよびノンレスポンダーにおける特定因子の発現レベルについて訓練された機械学習アルゴリズムが、対象におけるその特定因子の発現レベルに適用される。当業者であれば、複数の因子の各因子について、異なるアルゴリズムが訓練され、次いで対象の各発現レベルに適用されることを理解するであろう。したがって、3つのアルゴリズムが、因子A、因子Bおよび因子Cについてレスポンダーおよびノンレスポンダーにおける発現について別々に訓練される場合、因子A発現レベルについて訓練されたアルゴリズムは、因子Aの対象の発現レベルに適用され、因子B発現レベルについて訓練されたアルゴリズムは、因子Bの対象の発現レベルに適用され、因子C発現レベルについて訓練されたアルゴリズムは、因子Cの対象の発現レベルに適用される。いくつかの実施形態において、訓練フェーズ中に、機械学習モデルは、クラス「レスポンダー」および「ノンレスポンダー」に従って因子発現データを予測または分類するために、「レスポンダー」または「ノンレスポンダー」の対応する注釈を使用して、レスポンダーおよびノンレスポンダーからの単一因子の発現データを含む訓練セットについて訓練される。いくつかの実施形態において、推論段階中に、機械学習モデルを対象からの単一因子の発現データに適用して、レスポンダーまたはノンレスポンダーと同様の因子の分類を予測する。いくつかの実施形態において、分類は抵抗スコアである。いくつかの実施形態において、分類は応答スコアである。いくつかの実施形態において、分類は、その因子がノンレスポンダーにどれだけ類似しているか、およびレスポンダーにどれだけ類似していないかの尺度である。
【0097】
いくつかの実施形態において、訓練された機械学習アルゴリズムは、疾患に罹患している対象の療法に対する応答性を予測するように訓練される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、抵抗スコアを出力するように訓練される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、抵抗確率を出力するように訓練される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、活性スコアを出力するように訓練される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、対象における抵抗性関連因子の活性を予測するように訓練される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、因子が対象における抵抗性関連因子であるかどうかを予測するように訓練される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、対象の因子が対象の抵抗性関連因子であるかどうかを予測するように訓練される。
【0098】
いくつかの実施形態において、訓練セットは、受け取られた因子発現レベルを含む。いくつかの実施形態において、訓練セットは、レスポンダーおよびノンレスポンダーの両方における受け取られた因子発現レベルを含む。いくつかの実施形態において、訓練セットは、ただ1つの因子についての受け取られた因子発現レベルを含む。いくつかの実施形態において、訓練セットは、試料で発現される抵抗性関連因子の数を含む。いくつかの実施形態において、試料は、疾患に罹患している対象に由来する。いくつかの実施形態において、試料はレスポンダー由来である。いくつかの実施形態において、試料はノンレスポンダー由来である。いくつかの実施形態において、訓練セットは、少なくとも1つの臨床パラメータを含む。いくつかの実施形態において、臨床パラメータは対象からのものである。いくつかの実施形態において、対象はレスポンダーおよびノンレスポンダーである。いくつかの実施形態において、訓練セットは標識を含む。いくつかの実施形態において、標識は、対象の応答性と関連付けられる。いくつかの実施形態において、標識はレスポンダーまたはノンレスポンダーである。いくつかの実施形態において、抵抗性関連因子は標識で標識される。いくつかの実施形態において、少なくとも1つの臨床パラメータは、標識で標識される。
【0099】
いくつかの実施形態によれば、訓練セットは、各レスポンダーおよびノンレスポンダーの少なくとも1つの臨床パラメータをさらに含み、機械学習アルゴリズムは、対象および対象の少なくとも1つの臨床パラメータから受け取られた個々の因子発現レベルに適用される。いくつかの実施形態において、少なくとも1つの臨床パラメータは、対象の性別である。いくつかの実施形態において、訓練セットは、対象の性別をさらに含む。いくつかの実施形態において、対象は各対象である。いくつかの実施形態において、性別はジェンダーである。いくつかの実施形態において、少なくとも1つの臨床パラメータは、性別である。いくつかの実施形態において、性別は、対象の性別である。いくつかの実施形態において、性別は男性または女性である。いくつかの実施形態において、性別は、出生時の性別である。いくつかの実施形態において、臨床パラメータは年齢である。いくつかの実施形態において、年齢は対象の年齢である。いくつかの実施形態において、臨床パラメータは治療ラインである。いくつかの実施形態において、治療ラインのパラメータは、療法が第一の治療ラインであったか高度な治療であったかである。いくつかの実施形態において、治療ラインは第一治療ラインである。いくつかの実施形態において、治療ラインは二次治療である。いくつかの実施形態において、二次治療は高度な治療である。高度な治療は、第1の治療、例えば、第2の治療、第3の治療、第4の治療、第5の治療などの後の任意の治療ラインであり得ることが当業者には理解されよう。いくつかの実施形態において、臨床パラメータは、治療が第1の治療であるか、高度な治療であるかである。いくつかの実施形態において、臨床パラメータはPD-L1の状態である。いくつかの実施形態において、PD-L1の状態は、がんのPD-L1の状態である。がん細胞(例えば、腫瘍)のPD-L1レベルを測定する方法は当技術分野で周知であり、任意のそのような方法を使用することができる。いくつかの実施形態において、PD-L1の状態は、高PD-L1または低PD-L1を含む。いくつかの実施形態において、PD-L1の状態は、高PD-L1、低PD-L1、またはPD-L1なしを含む。いくつかの実施形態において、PD-L1の状態は、高PD-L1、中PD-L1または低PD-L1を含む。いくつかの実施形態において、PD-L1の状態は、1%未満のがん細胞、1~49%のがん細胞、または50%以上のがん細胞におけるPD-L1の発現を含む。いくつかの実施形態において、1%未満のがん細胞におけるPD-L1の発現は、PD-L1の発現ではない。いくつかの実施形態において、1%未満のがん細胞におけるPD-L1の発現は、低いPD-L1の発現である。いくつかの実施形態において、1~49%のがん細胞におけるPD-L1の発現は、低いPD-L1の発現である。いくつかの実施形態において、1~49%のがん細胞におけるPD-L1の発現は、中程度のPD-L1の発現である。いくつかの実施形態において、がん細胞の50%以上におけるPD-L1の発現は、高いPD-L1の発現である。
【0100】
いくつかの実施形態において、臨床パラメータは、疾患の公知のバイオマーカーまたは疾患の公知のバイオマーカーにおける変異である。いくつかの実施形態において、バイオマーカーは、MYC、NOTCH、EGFR、HER2、BRAF、KRAS、MAP2K1、MET、NRAS、NTRK1、NTRK2、NTRK3、PIK3CA、RET、ROS1、TP53、ALK、CDKN2A、KIT、NF1、BFAST、FGFR、LDH、PTEN、RB1、PD-L1、MSI(マイクロサテライト不安定性)、TMB(腫瘍突然変異負荷)、またはそれらの組み合わせから選択される。いくつかの実施形態において、臨床パラメータはバイオマーカーの発現である。いくつかの実施形態において、発現は発現のパーセントである。いくつかの実施形態において、発現は、突然変異状態である。
【0101】
いくつかの実施形態において、訓練セットは、各レスポンダーおよびノンレスポンダーの性別、年齢およびPD-L1の状態をさらに含む。いくつかの実施形態において、訓練セットは、各レスポンダーおよびノンレスポンダーの性別をさらに含む。いくつかの実施形態において、訓練セットは、各レスポンダーおよびノンレスポンダーの年齢およびPD-L1の状態をさらに含む。いくつかの実施形態において、機械学習アルゴリズムは、対象および対象の性別からの個々の受け取られた因子発現レベルに適用される。いくつかの実施形態において、機械学習アルゴリズムは、対象ならびに対象の性別、年齢およびPD-L1の状態からの個々の受け取られた因子発現レベルに適用される。いくつかの実施形態において、計算することは、レスポンダーおよびノンレスポンダーにおける受け取られた因子発現レベルならびに少なくとも1つの臨床パラメータを含む訓練セットで訓練された機械学習アルゴリズムを、対象および対象の少なくとも1つの臨床パラメータからの発現レベルに適用することを含み、機械学習アルゴリズムは抵抗スコアを出力する。いくつかの実施形態において、訓練は、レスポンダーおよびノンレスポンダーにおける受け取られた因子発現レベルならびに各レスポンダーおよびノンレスポンダーの臨床パラメータを含み、機械学習アルゴリズムは、対象および対象の臨床パラメータからの個々の受け取られた因子発現レベルに適用され、機械学習アルゴリズムは応答予測を出力する。いくつかの実施形態において、訓練は、レスポンダーおよびノンレスポンダーにおける受け取られた因子発現レベル、ならびに各レスポンダーおよびノンレスポンダーの性別、年齢およびPD-L1の発現から選択される臨床パラメータ、またはそれらの任意の組み合わせを含み、機械学習アルゴリズムは、対象からの個々の受け取られた因子発現レベルおよび対象の臨床パラメータに適用され、機械学習アルゴリズムは応答予測を出力する。いくつかの実施形態において、訓練セットは、各レスポンダーおよびノンレスポンダーにおける抵抗性関連因子の数と、少なくとも1つの臨床パラメータとを含み、機械学習アルゴリズムは、対象および対象の少なくとも1つの臨床パラメータからの抵抗性関連因子の数に適用され、機械学習アルゴリズムは、応答予測を出力する。いくつかの実施形態において、訓練セットは、各レスポンダーおよびノンレスポンダーにおける抵抗性関連因子の数と、各レスポンダーおよびノンレスポンダーの性別とを含み、機械学習アルゴリズムは、対象および対象の性別からの抵抗性関連因子の数に適用され、機械学習アルゴリズムは、応答予測を出力する。いくつかの実施形態において、訓練セットは、各レスポンダーおよびノンレスポンダーにおける抵抗性関連因子の数、各レスポンダーおよびノンレスポンダーの年齢およびPD-L1の状態を含み、機械学習アルゴリズムは、対象および対象の年齢およびPD-L1の状態からの抵抗性関連因子の数に適用され、機械学習アルゴリズムは、応答予測を出力する。
【0102】
いくつかの実施形態において、臨床パラメータは治療のタイプである。いくつかの実施形態において、臨床パラメータは療法の標的の発現である。いくつかの実施形態において、臨床パラメータは、療法の標的であるプロセス内のタンパク質の発現である。いくつかの実施形態において、プロセスは、療法の標的を含むプロセスである。いくつかの実施形態において、発現は、対象における発現である。いくつかの実施形態において、発現は、疾患組織における発現である。いくつかの実施形態において、発現は、疾患組織試料における発現である。いくつかの実施形態において、発現は腫瘍における発現である。いくつかの実施形態において、発現は腫瘍試料における発現である。いくつかの実施形態において、腫瘍試料は生検である。いくつかの実施形態において、発現は腫瘍における発現ではない。いくつかの実施形態において、発現は腫瘍試料での発現ではない。いくつかの実施形態において、発現は液体生検における発現である。いくつかの実施形態において、発現は発現のパーセントである。いくつかの実施形態において、パーセントは細胞のパーセントである。いくつかの実施形態において、療法は抗PD-1療法であり、プロセスにおけるタンパク質はPD-L1である。いくつかの実施形態において、療法は抗PD-L1療法であり、標的タンパク質はPD-L1である。いくつかの実施形態において、臨床パラメータはPD-L1の発現である。いくつかの実施形態において、訓練セットは、治療ライン、PD-L1の発現、性別および年齢から選択される少なくとも1つの臨床パラメータを含む。いくつかの実施形態において、訓練セットは、タンパク質発現レベルおよび性別を含む。いくつかの実施形態において、訓練セットは、RAPの数、年齢、およびPD-L1の状態を含む。
【0103】
さらに、臨床パラメータも含まれ得る。当業者は、訓練セットに含めるために関連する臨床パラメータを選択することができるであろう。追加の臨床パラメータの例には、試料の組織型(例えば、腺癌、扁平上皮癌など)、転移部位、腫瘍部位、がん病期分類(例えば、腫瘍、リンパ節および転移、TNM、病期分類など)、パフォーマンスステータス(ECOGパフォーマンスステータスなど)、遺伝子変異、エピジェネティック状態、一般病歴、バイタルサイン、血液測定値、腎機能および肝機能、体重、身長、脈拍、血圧および喫煙歴が含まれるが、これらに限定されない。
【0104】
いくつかの実施形態において、推論段階において、訓練された機械学習アルゴリズムが適用される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、個々の受け取られた因子発現レベルに適用される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、個々の受け取られた因子発現レベルおよび少なくとも1つの臨床パラメータに適用される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、対象および対象の性別からの個々の受け取られた因子発現レベルに適用される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、いくつかの抵抗性関連タンパク質に適用される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、抵抗性関連因子の数に適用される。いくつかの実施形態において、訓練された機械学習アルゴリズムは、いくつかの抵抗性関連因子および少なくとも1つの臨床パラメータに適用される。
【0105】
いくつかの実施形態において、推論段階において入力が受け取られる。いくつかの実施形態において、入力は、試料に発現された抵抗性関連因子の数を含む。いくつかの実施形態において、試料は対象に由来する。いくつかの実施形態において、入力は少なくとも1つの臨床パラメータを含む。いくつかの実施形態において、対象は疾患に罹患している。いくつかの実施形態において、対象は、療法に対する未知の応答性を有する。いくつかの実施形態において、パラメータは、未知の応答性を有する対象のものである。いくつかの実施形態において、推論段階において、訓練された機械学習アルゴリズムが適用される。いくつかの実施形態において、適用は入力に適用される。いくつかの実施形態において、入力は受け取られた入力である。いくつかの実施形態において、推論段階は応答性を予測することである。いくつかの実施形態において、応答性は、未知の応答性を有する対象の療法に対する応答性である。
【0106】
いくつかの実施形態において、機械学習アルゴリズムは抵抗スコアを出力する。いくつかの実施形態において、出力された抵抗スコアは0から1にスケーリングされる。いくつかの実施形態において、1はノンレスポンダーに完全に類似したものであり、0はレスポンダーに完全に類似したものである。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、ノンレスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーおよびノンレスポンダーに対する類似性の数値を出力する。いくつかの実施形態において、タンパク質は、その抵抗スコアが特定の閾値を超える場合、RAPであるとみなされる。いくつかの実施形態において、抵抗スコアの閾値は、0~1の尺度で計算される。いくつかの実施形態において、特定のタンパク質の抵抗スコアに対する閾値は、0.2と0.95との間である。いくつかの実施形態において、特定のタンパク質の抵抗スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、抵抗スコアの閾値は0.25である。いくつかの実施形態において、抵抗スコアの閾値は0.42である。いくつかの実施形態において、抵抗スコアの閾値は0.6である。いくつかの実施形態において、機械学習アルゴリズムによって計算された場合の抵抗スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の抵抗スコアの閾値は0.25である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の抵抗スコアの閾値は0.42である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の抵抗スコアの閾値は0.6である。
【0107】
いくつかの実施形態において、応答確率が、計算(1-抵抗スコア)によって求められる。いくつかの実施形態において、1-抵抗スコアは、1-最終抵抗スコアである。いくつかの実施形態において、抵抗スコアは最終抵抗スコアである。いくつかの実施形態において、応答確率は応答スコアである。いくつかの実施形態において、機械学習アルゴリズムは応答スコアを出力する。いくつかの実施形態において、出力された応答スコアは0から1にスケーリングされる。いくつかの実施形態において、1はレスポンダーに完全に類似したものであり、0はノンレスポンダーに完全に類似したものである。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、ノンレスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーおよびノンレスポンダーに対する類似性の数値を出力する。いくつかの実施形態において、タンパク質は、その応答スコアが特定の閾値を超える場合、RAPであるとみなされる。いくつかの実施形態において、応答スコアの閾値は、0~1の尺度で計算される。いくつかの実施形態において、特定のタンパク質の応答スコアに対する閾値は、0.2~と0.95である。いくつかの実施形態において、特定のタンパク質の応答スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、応答スコアに対する閾値は、0.25である。いくつかの実施形態において、応答スコアに対する閾値は、0.42である。いくつかの実施形態において、応答スコアに対する閾値は、0.6である。いくつかの実施形態において、機械学習アルゴリズムによって計算された場合の応答スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の応答スコアの閾値は0.25である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の応答スコアの閾値は0.42である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の応答スコアの閾値は0.6である。いくつかの実施形態において、アルゴリズムは応答確率を出力し、応答確率は0~1の尺度で計算される。いくつかの実施形態において、アルゴリズムは応答確率を出力し、応答確率は0%~100%の尺度で計算され、それにおいては100%がレスポンダーであり、0%がノンレスポンダーである。
【0108】
いくつかの実施形態において、スコアは0~1である。いくつかの実施形態において、活性物質はがんにおいて活性である。いくつかの実施形態において、活性物質は対象において活性である。いくつかの実施形態において、活性物質は抵抗を促進するのに活性である。いくつかの実施形態において、閾値を超えることは、閾値を下回る。いくつかの実施形態において、閾値を超えることは、閾値を上回わる。いくつかの実施形態において、所定の閾値は、0.5、0.4、0.3、0.25、0.2、0.15、0.1、0.05、0.01、0.005、0.001、0.0005または0.0001である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、閾値は0.05である。いくつかの実施形態において、閾値は5%である。
【0109】
いくつかの実施形態において、機械学習アルゴリズムは抵抗スコアを出力する。いくつかの実施形態において、抵抗スコアは、RAPスコアである。いくつかの実施形態において、出力された抵抗スコアは0から1にスケーリングされる。いくつかの実施形態において、1はノンレスポンダーに完全に類似したものであり、0はレスポンダーに完全に類似したものである。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、ノンレスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーおよびノンレスポンダーに対する類似性の数値を出力する。いくつかの実施形態において、タンパク質は、その抵抗スコアが特定の閾値を超える場合、RAPであるとみなされる。いくつかの実施形態において、抵抗スコアの閾値は、0~1の尺度で計算される。いくつかの実施形態において、特定のタンパク質の抵抗スコアに対する閾値は、0.2と0.95との間である。いくつかの実施形態において、特定のタンパク質の抵抗スコアの閾値は、約0.01、0.05、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、抵抗スコアの閾値は0.25である。いくつかの実施形態において、抵抗スコアの閾値は0.42である。いくつかの実施形態において、抵抗スコアの閾値は0.6である。いくつかの実施形態において、機械学習アルゴリズムによって計算された場合の抵抗スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の抵抗スコアの閾値は0.25である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の抵抗スコアの閾値は0.42である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の抵抗スコアの閾値は0.6である。
【0110】
いくつかの実施形態において、応答確率が、計算(1-抵抗スコア)によって求められる。いくつかの実施形態において、1-抵抗スコアは、1-最終抵抗スコアである。いくつかの実施形態において、抵抗スコアは最終抵抗スコアである。いくつかの実施形態において、応答確率は応答スコアである。いくつかの実施形態において、機械学習アルゴリズムは応答スコアを出力する。いくつかの実施形態において、出力された応答スコアは0から1にスケーリングされる。いくつかの実施形態において、1はレスポンダーに完全に類似したものであり、0はノンレスポンダーに完全に類似したものである。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、ノンレスポンダーに対する類似性を計算する。いくつかの実施形態において、機械学習アルゴリズムは、レスポンダーおよびノンレスポンダーに対する類似性の数値を出力する。いくつかの実施形態において、タンパク質は、その応答スコアが特定の閾値を超える場合、RAPであるとみなされる。いくつかの実施形態において、「beyond」は「above(超、越、上方)」である。いくつかの実施形態において、「beyond」は「below(未満、下方)」である。いくつかの実施形態において、応答スコアの閾値は、0~1の尺度で計算される。いくつかの実施形態において、特定のタンパク質の応答スコアに対する閾値は、0.2~と0.95である。いくつかの実施形態において、特定のタンパク質の応答スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、応答スコアに対する閾値は、0.25である。いくつかの実施形態において、応答スコアに対する閾値は、0.42である。いくつかの実施形態において、応答スコアに対する閾値は、0.6である。いくつかの実施形態において、機械学習アルゴリズムによって計算された場合の応答スコアの閾値は、約0.2、0.25、0.3、0.35、0.4、0.42、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、または0.95である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の応答スコアの閾値は0.25である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の応答スコアの閾値は0.42である。いくつかの実施形態において、機械学習アルゴリズムを用いて計算した場合の応答スコアの閾値は0.6である。
【0111】
いくつかの実施形態において、機械学習モデルは機械学習アルゴリズムである。いくつかの実施形態において、アルゴリズムは教師あり学習アルゴリズムである。いくつかの実施形態において、アルゴリズムは教師なし学習アルゴリズムである。いくつかの実施形態において、アルゴリズムは強化学習アルゴリズムである。いくつかの実施形態において、機械学習モデルは畳み込みニューラルネットワーク(CNN)である。いくつかの実施形態において、少なくとも1つのハードウェアプロセッサは機械学習モデルを訓練する。いくつかの実施形態において、モデルは、少なくとも部分的に、訓練セットに基づく。いくつかの実施形態において、モデルは訓練セットに基づく。いくつかの実施形態において、モデルは訓練セットで訓練される。いくつかの実施形態において、少なくとも1つのハードウェアプロセッサは、機械学習モデルを対象からの因子発現レベルに適用する。
【0112】
いくつかの実施形態において、計算することは、レスポンダーにおける各タンパク質についての平均の発現を計算することを含む。いくつかの実施形態において、計算することは、ノンレスポンダーにおける各タンパク質についての平均の発現を計算することを含む。いくつかの実施形態において、計算することは、レスポンダーにおける各タンパク質についての平均の発現およびノンレスポンダーにおける各タンパク質についての平均の発現を計算することを含む。いくつかの実施形態において、計算することは、レスポンダーおよびノンレスポンダーにおける各タンパク質についての発現の分布を計算することを含む。いくつかの実施形態において、計算することは、レスポンダーおよびノンレスポンダーにおける各タンパク質についての発現の標準偏差を計算することを含む。いくつかの実施形態において、レスポンダーはレスポンダー集団にある。いくつかの実施形態において、ノンレスポンダーにおいてというのは、ノンレスポンダー集団にあることである。いくつかの実施形態において、抵抗スコアは、レスポンダーにおける算出された平均からの対象における因子発現の偏差と、ノンレスポンダーにおける算出された平均からの対象における因子発現の偏差との比に基づく。偏差の計算は当業者に周知である。対象における発現が平均から類似していないほど、偏差はより大きくなることが理解されるであろう。したがって、レスポンダーの平均とかなり類似の乏しい因子は、この比の計算において、分子が大きく、ノンレスポンダーの平均とあまり類似していない因子は分母が小さい。したがって、レスポンダー発現に類似していなければそのぶん、またノンレスポンダーの発現に類似しているほど、抵抗スコアが高い対象における因子の発現である。いくつかの実施形態において、所定の閾値を超える抵抗スコアは、因子が抵抗性関連因子であることを示す。いくつかの実施形態において、抵抗性関連因子は、抵抗性関連タンパク質(RAP)である。
【0113】
いくつかの実施形態において、計算することは、レスポンダーにおける各因子についての分布を計算することをさらに含む。いくつかの実施形態において、計算することは、ノンレスポンダーにおける各因子についての分布を計算することをさらに含む。いくつかの実施形態において、計算することは、レスポンダーにおける各因子についての分布およびノンレスポンダーにおける各因子についての分布を計算することをさらに含む。いくつかの実施形態において、計算することは、レスポンダーの各因子の標準偏差を計算することをさらに含む。いくつかの実施形態において、計算することは、ノンレスポンダーにおける各因子についての標準偏差を計算することをさらに含む。いくつかの実施形態において、計算することは、レスポンダーにおける各因子についての標準偏差およびノンレスポンダーにおける各タンパク質についての標準偏差を計算することをさらに含む。いくつかの実施形態において、計算することは、レスポンダーとノンレスポンダーが混合する中で各因子の標準偏差を計算することをさらに含む。いくつかの実施形態において、偏差は、計算された標準偏差の倍数として測定される。発現値の群の標準偏差に対する偏差をスケーリングすることによって、偏差をより絶対的な用語で与えることができ、非常に小さいおよび非常に大きいスタンド偏差(非常に低い発現レベルおよび非常に高い発現レベルも有し得る)の因子および集団の比較を可能にすることが当業者によって理解されよう。
【0114】
いくつかの実施形態において、抵抗スコアは、対象における各因子の発現レベルに対するZスコアに基づく。いくつかの実施形態において、抵抗スコアは、レスポンダーに対するZスコアに基づく。いくつかの実施形態において、抵抗スコアは、ノンレスポンダーに対するZスコアに基づく。いくつかの実施形態において、抵抗スコアは、レスポンダーに対するZスコアとノンレスポンダーに対するZスコアの両方に基づく。いくつかの実施形態において、抵抗スコアは、ノンレスポンダーに対するZスコアに対するレスポンダーに対するZスコアの比に基づく。Zスコアが集団の平均からの個々のレベルの隔たりを集団標準偏差の単位で計数することは、当業者に周知である。いくつかの実施形態において、Zスコアは式1によって計算される。
【0115】
いくつかの実施形態において、抵抗スコアは式
【数2】
によって計算される。いくつかの実施形態において、Zは、レスポンダーにおける計算された平均からの対象における因子発現の偏差である。いくつかの実施形態において、ZNRは、ノンレスポンダーにおける計算された平均からの対象における因子発現の偏差である。いくつかの実施形態において、||は偏差のZスコアである。いくつかの実施形態において、||は、標準偏差の倍数への偏差の標準化である。いくつかの実施形態において、cは定数である。いくつかの実施形態において、定数は、ZNR=0のスコアの発散を防ぐ調整定数である。いくつかの実施形態において、抵抗スコアは式2によって計算される。いくつかの実施形態において、単調関数は、ノンレスポンダー分布内の極値に対して抵抗スコアが減少するのを防ぐアドホック関数である。いくつかの実施形態において、関数は、アルゴリズム1で得られる関数である。
【0116】
いくつかの実施形態において、所定の閾値を超える抵抗スコアは、因子がRAPであることを示す。いくつかの実施形態において、「beyond」は「above(超、越、上方)」である。いくつかの実施形態において、閾値は所定の閾値である。いくつかの実施形態において、閾値は、しきい値である。いくつかの実施形態において、抵抗スコアの閾値は、約1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、6.0.6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、または7.0である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、閾値は、約0.05、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.67、0.7、0.75、0.8、0.85、または0.9である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、抵抗スコアの閾値は約2.9である。いくつかの実施形態において、抵抗スコアの閾値は2.9である。いくつかの実施形態において、抵抗スコアの閾値は約3.0である。いくつかの実施形態において、抵抗スコアの閾値は3.0である。いくつかの実施形態において、抵抗スコアの閾値は、任意の単位の尺度で計算される。いくつかの実施形態において、数学的計算によって計算された場合の抵抗スコアの閾値は、約1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、または5.0である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、数学的計算を用いて計算した場合の抵抗スコアの閾値は約2.9である。いくつかの実施形態において、数学的計算を用いて計算した場合の抵抗スコアの閾値は2.9である。いくつかの実施形態において、数学的計算を用いて計算した場合の抵抗スコアの閾値は約3.0である。いくつかの実施形態において、数学的計算を用いて計算した場合の抵抗スコアの閾値は3.0である。いくつかの実施形態において、数学的計算は、各タンパク質の平均の発現を計算することを含む方法である。
【0117】
いくつかの実施形態において、所定の数を超えるいくつかの抵抗性関連因子(例えば、RAP)を有する対象は、療法に抵抗性であると予測される。いくつかの実施形態において、所定の数を超えるいくつかの抵抗性関連因子を有する対象は、療法に応答しないと予測される。いくつかの実施形態において、所定の数を超えるいくつかの抵抗性関連因子を有する対象は、療法に対するノンレスポンダーであると予測される。いくつかの実施形態において、所定の数を下回るいくつかの抵抗性関連因子を有する対象は、療法に適していると予測される。いくつかの実施形態において、所定の数を下回るいくつかの抵抗性関連因子を有する対象は、療法に応答すると予測される。いくつかの実施形態において、所定の数を下回るいくつかの抵抗性関連因子を有する対象は、療法に対するレスポンダーであると予測される。いくつかの実施形態において、所定の数またはそれを下回るいくつかの抵抗性関連因子を有する対象は、療法に適していると予測される。いくつかの実施形態において、所定の数またはそれを下回るいくつかの抵抗性関連因子を有する対象は、療法に応答すると予測される。いくつかの実施形態において、所定の数またはそれを下回るいくつかの抵抗性関連因子を有する対象は、療法のレスポンダーであると予測される。
【0118】
いくつかの実施形態において、所定の数とは閾値の数である。いくつかの実施形態において、所定の数は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20である。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、所定の数は3である。いくつかの実施形態において、所定の数は4である。いくつかの実施形態において、所定の数は7である。いくつかの実施形態において、所定の数は13である。
【0119】
いくつかの実施形態において、方法は、少なくとも1つの経路、プロセス、またはネットワークへの抵抗性関連因子の分類をさらに含む。いくつかの実施形態において、本方法は、抵抗性関連因子に関する分析を実施して、抵抗性関連因子が関与する少なくとも1つの経路、プロセス、またはネットワークを決定する工程をさらに含む。いくつかの実施形態において、経路、プロセス、またはネットワークは、療法に対する非応答性を引き起こす。いくつかの実施形態において、分析は、経路分析、プロセス分析およびネットワーク分析から選択される。いくつかの実施形態において、方法は、RAPに対して経路分析を実施することをさらに含む。いくつかの実施形態において、方法は、RAPに対してプロセス分析を実行することをさらに含む。いくつかの実施形態において、方法は、RAPに対してネットワーク分析を実行することをさらに含む。いくつかの実施形態において、少なくとも1つの経路、プロセス、またはネットワークは、少なくとも2、3、4、5、6、7、8、9または10の経路、プロセス、またはネットワークを含む。各可能性は、本発明の別個の実施形態を表す。いくつかの実施形態において、少なくとも1つの経路、プロセス、またはネットワークは、抵抗性関連因子を含むことが知られているすべての経路、プロセス、またはネットワークである。いくつかの実施形態において、少なくとも1つの経路、プロセス、またはネットワークは、抵抗性関連因子が富化されたすべての経路、プロセスまたは、ネットワークである。いくつかの実施形態において、富化されたものは最も富化されている。いくつかの実施形態において、富化されたものは、任意のまたは当該の経路、プロセス、またはネットワークの最も多くのRAPを含み含有する。
【0120】
いくつかの実施形態において、方法は、経路、プロセス、またはネットワークを選択することを含む。いくつかの実施形態において、選択された経路、プロセス、またはネットワークは、療法に対する非応答に影響を及ぼすと仮定される。いくつかの実施形態において、選択された経路、プロセス、またはネットワークは、療法に対する非応答を引き起こすと仮定される。いくつかの実施形態において、選択された経路、プロセス、またはネットワークは、薬になり得ることが知られている。いくつかの実施形態において、薬になり得ることが知られているのは、経路、プロセス、またはネットワークを調節する公知の治療剤を含む。いくつかの実施形態において、公知の治療剤は、臨床試験の最中であるか、または臨床試験を終了している。いくつかの実施形態において、公知の治療剤はヒトでの使用が承認されている。いくつかの実施形態において、ヒトでの使用について承認されたものは、ヒトにおける疾患の治療における使用について承認されている。いくつかの実施形態において、疾患はがんである。いくつかの実施形態において、方法は、ノンレスポンダーであるか、またはノンレスポンダーであると予測される対象に、抵抗性関連因子を含有する少なくとも1つの経路、プロセス、またはネットワークを調節する薬剤を投与することをさらに含む。いくつかの実施形態において、薬剤は、経路、プロセス、またはネットワークにおける標的を阻害する。いくつかの実施形態において、標的は遺伝子である。いくつかの実施形態において、標的はタンパク質である。いくつかの実施形態において、タンパク質は調節RNAである。いくつかの実施形態において、標的は応答関連因子である。いくつかの実施形態において、標的は応答関連因子ではない。いくつかの実施形態において、薬剤は、経路、プロセス、またはネットワークにおいて標的を活性化する。いくつかの実施形態において、薬剤は経路、プロセス、またはネットワークを調節する。いくつかの実施形態において、経路の活性は非応答を誘導し、薬剤は経路を阻害する。いくつかの実施形態において、経路の活性は不応答を減少させ、薬剤は経路を活性化する。レスポンダーよりもノンレスポンダーでの発現に類似している対象におけるその発現によって、応答関連因子が特定されるということが、当業者によって理解されるであろう。したがって、例えば、その因子がノンレスポンダーにおいてより高度に発現され、経路/プロセス/ネットワークの活性を増加させるならば、その薬剤は経路を阻害する。例えば、因子がノンレスポンダーにおいてより高度に発現されるが、経路/プロセス/ネットワークの活性を低下させる場合、薬剤は経路/プロセス/ネットワークを活性化する。同様に、因子が、例えば、ノンレスポンダーにおいてより低く発現され、経路/プロセス/ネットワークの活性を低下させるならば、薬剤は経路/プロセス/ネットワークを阻害する。また、最後に、例えば、因子がノンレスポンダーにおいてより低く発現されるが、経路/プロセス/ネットワークの活性を増加させる場合、薬剤は経路/プロセス/ネットワークを活性化する。本質的に、薬剤は、それがレスポンダーにおいてより多く機能するように経路/プロセス/ネットワークを誘導すべきである。いくつかの実施形態において、薬剤は経路におけるハブ標的を標的とする。いくつかの実施形態において、薬剤は経路における調節因子標的を標的とする。いくつかの実施形態において、プロセス活性は非応答を誘導し、薬剤はプロセスを阻害する。いくつかの実施形態において、プロセスの活性は無応答を減少させ、薬剤はプロセスを活性化する。いくつかの実施形態において、薬剤は、プロセスにおいてハブ標的を標的とする。いくつかの実施形態において、薬剤は、プロセスの調節因子の標的を標的とする。いくつかの実施形態において、ネットワーク活性は無応答を誘導し、薬剤はネットワークを阻害する。いくつかの実施形態において、ネットワークの活性は無応答を低減し、薬剤はネットワークを活性化する。いくつかの実施形態において、薬剤は、ネットワークのハブ因子を標的とする。いくつかの実施形態において、薬剤は、ネットワークの調節因子を標的とする。いくつかの実施形態において、調節因子はマスタ調節因子である。因子は、当技術分野で公知の任意の分析ツールを使用して、経路、タンパク質相互作用、またはシグナルに、分類することができる。例としては、GO分析、Ingenuity分析、Metacore分析(Clarivate Analytics)、リアクトーム経路分析、および機能分析が挙げられるが、これらに限定されない。
【0121】
別の態様により、本発明の方法を実行するために少なくとも1つのハードウェアプロセッサによって実行可能なプログラムコードが具現化された非一時的コンピュータ可読記憶媒体を含むコンピュータプログラム製品が提供される。
【0122】
本発明は、システム、方法、および/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(複数可)を含むことができる。
【0123】
コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持および格納することができる有形のデバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、またはこれらの任意の適切な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の網羅してはいないリストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、命令が記録された機械的に符号化されたデバイス、および上記の任意の適切な組み合わせを含む。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体(例えば、光ファイバケーブルを通過する光パルス)を伝搬する電磁波、またはワイヤを介して伝送される電気信号などの一時的な信号自体であると解釈されるべきではない。むしろ、コンピュータ可読記憶媒体は非一時的(すなわち、不揮発性)媒体である。
【0124】
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワークおよび/または無線ネットワークを介して外部コンピュータもしくは外部記憶デバイスを介してそれぞれのコンピューティング/処理デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータおよび/またはエッジサーバを含むことができる。各コンピューティング/処理デバイスのネットワークアダプタカードまたはネットワークインターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、それぞれのコンピューティング/処理デバイスのコンピュータ可読記憶媒体に記憶するためにコンピュータ可読プログラム命令を転送する。
【0125】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはJava、Smalltalk、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかであってもよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンドアロンソフトウェアパッケージとして、部分的にユーザのコンピュータ上で、部分的にリモートコンピュータ上で、または完全にリモートコンピュータもしくはサーバ上で実行することができる。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、または外部コンピュータ(例えば、インターネットサービスプロバイダを使用してインターネットを介して)に接続されてもよい。いくつかの実施形態において、例えば、プログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)、またはプログラマブルロジックアレイ(PLA)を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることによってコンピュータ可読プログラム命令を実行することができる。
【0126】
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに与えられて機械を製造することができ、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行する命令は、フローチャートおよび/またはブロック図の1つまたは複数のブロックで指定された機能/動作を実施するための手段を作成する。これらのコンピュータ可読プログラム命令はまた、コンピュータ、プログラマブルデータ処理装置、および/または他のデバイスに特定の方法で機能するように指示することができるコンピュータ可読記憶媒体に格納されてもよく、その結果、格納された命令を有するコンピュータ可読記憶媒体は、フローチャートおよび/またはブロック図の1つまたは複数のブロックで指定された機能/動作の態様を実施する命令を含む製品を含む。
【0127】
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能な装置、または他のデバイスで実行される命令がフローチャートおよび/またはブロック図の1つまたは複数のブロックで指定された機能/動作を実施するように、コンピュータ、他のプログラム可能な装置、または他のデバイスで一連の動作ステップを実行させてコンピュータ実装プロセスを生成するために、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイスにロードされ得る。本明細書で使用される場合、「約」という用語は、値と組み合わせた場合、基準値の±10%を指す。例えば、約1000ナノメートル(nm)の長さは、1000nm+-100nmの長さを指す。
【0128】
本明細書および添付の特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、文脈上他に明確に指示されない限り、複数の指示対象を含むことに留意されたい。したがって、例えば、「a polynucleotide(ポリヌクレオチド)」への言及は、複数のそのようなポリヌクレオチドを含み、「the polynucleotide(ポリヌクレオチド)」への言及は、当業者に公知の1つまたは複数のポリペプチドおよびその等価物への言及などを含む。特許請求の範囲は、いずれかの任意選択の要素を除外するように起草され得ることにさらに留意されたい。したがって、この記述は、特許請求の範囲の要素の列挙、または「負」の限定の使用に関連して、「単独で」、「のみ」などのような排他的な用語を使用するための先行詞としての役割を果たすことを意図している。
【0129】
「A、B、およびCなどのうちの少なくとも1つ」に類似した慣例が使用される場合、一般に、そのような構成は、当業者が慣例を理解するであろうという意味で意図される(例えば、「A、B、およびCのうちの少なくとも1つを有するシステム」は、Aのみ、Bのみ、Cのみ、AとBとを一緒に、AとCとを一緒に、BとCとを一緒に、および/またはAとBとCとを一緒に有するシステムなどを含むが、これらに限定されない)。2つ以上の代替的な用語を提示する実質的に任意の選言的な単語および/または句は、明細書、特許請求の範囲、または図面のいずれかにかかわらず、用語の1つ、用語のいずれか、または両方の用語を含む可能性を考慮すると理解されるべきであることが当業者によってさらに理解されるであろう。例えば、「AまたはB」という語句は、「A」または「B」または「AおよびB」の可能性を含むと理解される。
【0130】
明確にするために別個の実施形態の文脈で説明されている本発明の特定の特徴は、単一の実施形態において組み合わせて提供されてもよいことが理解される。逆に、簡潔にするために単一の実施形態の文脈で説明されている本発明の様々な特徴は、別個にまたは任意の適切な部分的組み合わせで提供されてもよい。本発明に関連する実施形態のすべての組み合わせは、本発明によって具体的に包含され、あたかもそれぞれおよびすべての組み合わせが個別に明示的に開示されているかのように本明細書に開示される。さらに、様々な実施形態およびその要素のすべての部分的組み合わせもまた、本発明によって具体的に包含され、あたかもそのような部分的組み合わせのそれぞれおよびすべてが個別に明示的に本明細書に開示されているかのように本明細書に開示される。
【0131】
本発明のさらなる目的、利点、および新規な特徴は、限定することを意図するものではない以下の実施例を検討することによって当業者に明らかになるであろう。さらに、本明細書で上に描写され、以下の特許請求の範囲の項で請求される本発明の様々な実施形態および態様のそれぞれは、以下の実施例において実験的裏付けを見出す。
【0132】
上記で描写され、以下の特許請求の範囲の項で特許請求される本発明の様々な実施形態および態様は、以下の実施例において実験的裏付けを見出す。
【実施例
【0133】
一般に、本明細書で使用される命名法および本発明で利用される実験室手順には、分子、生化学、微生物学および組換えDNA技術が含まれる。そのような技術は文献で十分に説明されている。例えば、“Molecular Cloning:A laboratory Manual”Sambrook et al.,(1989);“Current Protocols in Molecular Biology”Volumes I-III Ausubel,R.M.,ed.(1994);Ausubel et al.,“Current Protocols in Molecular Biology”,John Wiley and Sons,Baltimore,Maryland(1989);Perbal,“A Practical Guide to Molecular Cloning”,John Wiley&Sons,New York(1988);Watson et al.,“Recombinant DNA”,Scientific American Books,New York;Birren et al.(eds)“Genome Analysis:A Laboratory Manual Series”,Vols.1-4,Cold Spring Harbor Laboratory Press,New York(1998);米国特許第4,666,828号明細書;第4,683,202号明細書;第4,801,531号明細書;第5,192,659号明細書;および第5,272,057号明細書に記載されている方法;“Cell Biology:A Laboratory Handbook”,Volumes I-III Cellis,J.E.,ed.(1994);“Culture of Animal Cells-A Manual of Basic Technique”by Freshney,Wiley-Liss,N.Y.(1994),Third Edition;“Current Protocols in Immunology”Volumes I-III Coligan J.E.,ed.(1994);Stites et al.(eds),“Basic and Clinical Immunology”(8th Edition),Appleton&Lange,Norwalk,CT(1994);Mishell and Shiigi(eds),“Strategies for Protein Purification and Characterization-A Laboratory Course Manual”CSHL Press(1996)を参照されたい;これらのすべては参照により組み込まれる。他の一般的な参考文献がこの文書全体にわたって提供される。
【0134】
実施例1:抵抗性関連タンパク質(RAP)に基づく応答予測-概念実証
データ収集
応答予測概念実証は、免疫チェック阻害剤(ICI)治療下の108人の非小細胞肺癌(NSCLC)患者からの血液試料の分析に基づく。施された様々な治療を表1にまとめる。
【0135】
【表1】
【0136】
108人の患者の血漿タンパク質レベルを測定し、約1100個の非冗長タンパク質標的を測定した。バッチの合計156個の試料について、ICI治療の開始前(T0)および第1の治療が施された後(T1)に試料を採取した。
【0137】
分類器の構成
治療に対する応答を予測するために、プロテオミクスレベルおよび応答標識を教師あり学習アルゴリズムによって組み込んだ。応答標識はレスポンダー(R)およびノンレスポンダー(NR)であり、3ヶ月での全奏効率(ORR)評価に基づいて決定した。具体的には、進行性疾患(PD)または疾患の進行に関連する早期死亡をNRに分類し、安定(SD)、最小奏効(MR)、部分奏効(PR)および完全奏効(CR)をRに分類した。ORR評価は、RECIST1.1またはORR評価のための他の検証された方法による「主要転帰測定」の項の臨床試験NCT04056247(clinicaltrials.gov/ct2/show/NCT04056247、その全体が参照により本明細書に組み込まれる)に記載されているように実施した。宿主応答を表す様々なタンパク質[時間枠:ベースライン(療法前)および1回目の薬物投与後(療法後)]の血中レベルの変化を記載のように決定した。
【0138】
試料を訓練セットと試験セットに分けた。アルゴリズムのすべての開発段階は訓練セットを使用して実行され、試験セットは最終段階でのみ使用されて最終アルゴリズムのパフォーマンスを試験した。訓練セットは、n=78名の患者(59名のレスポンダーおよび19名のノンレスポンダー)からの試料を含み、試験セットは、n=30名の患者において分析された試料を含んだ。
【0139】
応答分類器は、特徴を入力として扱い、特徴値に基づいて応答を予測する。特徴は、ベースライン(T0)および第1の治療(T1)後の2つの時点で血漿において測定されたタンパク質レベルである。異なる時点での同じタンパク質の測定値は、独立した特徴とみなされる。さらに、いくつかのタンパク質は、単一のプロテオミクスプロファイルにおいて2つ以上の測定値を有する(例えば、タンパク質IL-6を4回測定する)。各反復を独立した特徴として扱った。
【0140】
抵抗性関連タンパク質
抵抗性関連タンパク質(RAP)は特異的なタンパク質を指す、所与の患者における発現が療法に対する抵抗性を付与する、すなわちRAPは患者特異的である。それぞれの患者におけるその発現レベルが、レスポンダー集団よりもノンレスポンダー集団におけるその発現分布により類似している場合、タンパク質はRAPであると考えられる(図解のための図1A図1Cを参照のこと)。RAPは様々な方法で決定することができる。本明細書では、RAPの数学的計算、ならびにRAPを分類するための機械学習アルゴリズム、およびそれら2つを組み合わせる方法が提供される。これらの方法は単なる例示であり、RAPを計算する任意の方法を使用することができる。
【0141】
上記の概念を定量的に表現するために、RAPスコア(すなわち、抵抗スコア)を各タンパク質について求めた。低いRAPスコア値は、レスポンダー集団に典型的な発現レベルを表し、高いRAPスコアは、ノンレスポンダー集団に典型的な発現レベルを示す。タンパク質は、そのRAPスコアが特定の閾値を超える(例えば、スコアの構成に応じて上または下)場合、RAPとみなされる。以下、RAPスコア閾値最適化プロセスについて説明する。
【0142】
RAPスコアの計算は、レスポンダー集団とノンレスポンダー集団の両方における各タンパク質の発現レベル分布、および試験した患者のタンパク質レベル発現に関するデータを知ることを必要とする。異なる発現レベル範囲でのいくつかの異なるタンパク質間の比較を可能にするために、RAPスコアがタンパク質レベル発現のスケールの影響を受けず、それに対して感度が高くないことが重要である。これは、タンパク質発現レベルに11桁の大きなダイナミックレンジがある血漿試料では特に重要である。これを達成するために、RAPスコアは、集団標準偏差の単位で集団平均からの個々のレベルの隔たりを計数するZスコアに基づいている。技術的に言えば、Zスコアは式1によって定められる。
式1:
【数3】
式中、xは試験された患者のタンパク質レベルであり、μは集団の平均タンパク質レベルであり、σは集団標準偏差である。所与の患者のZスコアは、レスポンダーおよびノンレスポンダーの集団に関して別々に計算される。Zによって示されるレスポンダー集団に対するZスコアの計算のために、レスポンダー集団を使用して分布尺度μおよびσが計算される。ZNRによって示される、ノンレスポンダー集団に対するZスコアの計算のために、分布尺度μおよびσは、ノンレスポンダー集団を使用して計算される。最後に、RAPスコアを2で定める。
式2:
【数4】
単調関数
式中、cは、ZNR=0のスコアが発散するのを防ぐ正則化定数であり、単調関数は、ノンレスポンダー分布内の極値に対してRAPスコアが減少するのを防ぐように設計されたアドホック関数である。関数の実装は、アルゴリズム1の擬似コードによって与えられる。代表的なレスポンダーおよびノンレスポンダーの分布のRAPスコア値を図2に示す。
【0143】
アルゴリズム1:式2で使用される単調関数。
if|mean(R)-mean(NR)|>c・std(NR)then
if mean(NR)>mean(R)then
【数5】
else
【数6】
【0144】
所与の患者のRAPの正確な数を求めるために、すべてのタンパク質について閾値を決定し、決定された閾値を上回るRAPスコアを有するタンパク質をRAPとみなした。閾値は、訓練セットに適用される交差検証を使用して決定された。具体的には、訓練セットの1/3からなる交差検証データセットおよび訓練セットのさらに1/3からなる非交差検証データセットを、交差検証データセットと非交差検証データセットとの間でレスポンダーおよびノンレスポンダーの数を同様に保ちながらサンプリングした。非交差検証セットに対して計算を実施し、次いで、交差検証データセット内の各患者について、レスポンダーおよびノンレスポンダーの発現レベル分布を使用して、特徴(すなわち、T0およびT1で測定されたすべてのタンパク質)ごとにRAPスコアを計算した。次いで、RAPの数を使用して応答を予測し、予測パフォーマンスを定量化する受信者操作特性(ROC)曲線下面積(AUC)を各しきい値(図3A図3B)について計算した。小さなデータセットに関連するノイズを最小限に抑えるために、各しきい値(すなわち、訓練セットからの交差検証セットの異なるサンプリング)に対して100回の実現を行い、100回の実現にわたるAUCの平均を検討した。特に、図3Aの平均のROC AUC曲線は、単一の広いピークを示し、RAP数の予測力が選択された閾値に対してそれほど感度が高くないことを示唆している。T0およびT1での測定値を含む特徴については、閾値をそれぞれ1.61(図3B)および2.9(図3A)に設定した。
【0145】
機械学習評価:純粋に数学的な手法は(概念的にも実際的にも)有効であるが、対処すべきいくつかの欠点がある。
1.RAPスコア関数は、タンパク質発現レベルの基礎となる分布に依存するため、その有効性はプラットフォーム依存性であり得る(特に、異なるプロテオミクスシステムは、自然にスケーリングしない異なる測定単位を使用するため)。
2.現在の実装は、予測器に臨床パラメータ(例えば、患者の状態、適応症の詳細、治療の詳細など)を含める自然な方法を提供しない。
【0146】
機械学習アルゴリズムに基づく決定木学習を利用してタンパク質を所与の対象に対するRAPとして分類する代替アプローチが発明された。測定される各タンパク質について、機械学習アルゴリズム(例えば、XGBoostアルゴリズム)を使用し、訓練セットのデータに基づいて予測モデルを生成した。訓練セットからのそのようなデータは、タンパク質発現レベルおよびレスポンダー/ノンレスポンダータグだけでなく、患者の年齢、性別、状態、治療の種類、治療ライン、PD-L1の発現などのバイオマーカー発現などの他の特徴も含み得る。このアプローチは、タンパク質分布を仮定せず、臨床パラメータを利用するための自然なフレームワークを提供する。
【0147】
このアプローチを試験するために、76人の患者のコホートからの試料を、2つの異なるタンパク質分析プラットフォーム:約1200個のタンパク質(O)、および他の測定用の約7500個のタンパク質(S)使用してスクリーニングし、約1000個のタンパク質は両方のプラットフォームに共通であった。これらの対象に施された治療を表2にまとめる。
【0148】
【表2】
【0149】
76人の患者のコホートを、51人の対象(38人のレスポンダーおよび13人のノンレスポンダー)を含む訓練セットと、25人の対象(19人のレスポンダーおよび6人のノンレスポンダー)を含む試験セットとに分割した。この分析のためにXGBoostアルゴリズムが選択された、なぜなら問題が非線形性であること、およびアルゴリズムが小さなデータセットでの学習での効率性に優れているという評判があるためである。誤った発見のリスクを増加させる試験セットでの多重比較を回避するために、また研究の目標は(最適なモデル構成を特定するのではなく)予測可能性を検証することであるため、訓練モデルには以下の所定の構成が使用された。
モデルハイパーパラメータを以下のように設定した:
a.Max tree depth=4
b.Ridging factors:eta=0.8,lambda=5,alpha=2
c.num_parallel_tree=100
d.objective=binary:logistic
e.eval_metric=logloss
小さなノイズの多いデータセットを扱うために、パラメータを選択した。
【0150】
この評価の目的のために、機械学習アルゴリズムはタンパク質発現レベルのみで訓練され、他の考慮事項は除外された。患者の発現結果を各タンパク質について別々に評価し、タンパク質分類器を各単一タンパク質について計算した。機械学習アルゴリズムは、0~1のスコアを出力し、1はノンレスポンダーに最も類似し、0はレスポンダーに最も類似する。
【0151】
このアプローチを評価するために、入力されるタンパク質の2つの構成を使用した。第1の構成では、すべてのタンパク質を潜在的な予測因子として使用した。これは数学的手法で使用されたものと同様であるが、大きなコホートではこの方法が有効であると予想され、小さなコホートサイズ(特徴の数と比較して)では、誤検出が予測能力を妨げる可能性がある。第2の構成では、患者をレスポンダーおよびノンレスポンダーに分割する傾向に従って、単一タンパク質モデルをランク付けすること(すなわち、よりバランスのとれた予測クラスを有するタンパク質モデルにより高いランクを与える)を使用した。極端な例として、すべての患者が単一のクラス(レスポンダーまたはノンレスポンダー)に属するとモデルが予測した場合、モデルは可能な限り低いバランスランクを受け取った。スケールの反対の側面では、レスポンダーとノンレスポンダーとの間で集団を均等に分割したモデルが、最高のバランスランクを受け取った。異なるタンパク質モデルをランク付けした後、最も高いバランスランクを有する200個のタンパク質を使用して、機械学習アプローチを評価した。
【0152】
両方のアプローチを使用して、T0およびT1での「O」および「S」の発現の値に基づいて、対象を評価した。「O」のモデルパフォーマンス(AUCによって測定)は、0.4~0.8の閾値の範囲で0.8を超え、安定した滑らかな挙動(図3C)であり、AUC=0.89および95%信頼区間[0.594,0.995]でピークに達した。したがって、これらの試料について、閾値を約0.6に設定した。この結果は、数学的RAPアプローチを使用して同じデータセットについて得られたAUC=0.846に対するわずかな改善である。しかしながら、信頼区間が大きい(小さいデータセットのサイズの結果)ため、この差の統計的有意性は中程度である。
【0153】
予測因子を200個のタンパク質に限定した場合の「O」のピークモデルのパフォーマンスは、AUC=0.91および[0.602,0.996]という95%信頼区間であった(図3C)。この場合、閾値は本質的に同じであり、AUCは完全なタンパク質セットの構成に対するわずかな改善を表す。
【0154】
「S」のモデルパフォーマンス(AUCによって測定)は、0.4~0.9の閾値範囲で0.75を超え、安定した滑らかな挙動(図3C)を示し、AUCが0.81、95%信頼区間[0.587,0.924]でピークに達した。したがって、これらの試料では、この差は無視できるかもしれないが、閾値を約0.59でわずかに低く設定することができる。この結果は、「O」データを使用した同じモデル構成から観察された挙動よりも劣っており(約1標準偏差低い)、これはタンパク質の数がかなり多く、データセットのサイズが小さいため、予想外ではない。
【0155】
予測因子を200個のタンパク質に限定する場合の「S」のピークモデルパフォーマンスは、AUC=0.87および[0.597,0.992]の95%信頼区間であった(図3C)。したがって、閾値は、「S」分析で見出されたものと本質的に同じであり、この構成によって課される誤検出率の低下と一致して、完全なタンパク質セットの構成と比較してかなりの改善を表す。それでも、「S」の200個のタンパク質の構成のパフォーマンスは、「O」を使用した同じ構成よりもわずかに低い。しかしながら、差(<0.3標準偏差)の統計学的有意性は低い。
【0156】
RAP数による応答予測
上記のRAPスコアは、レスポンダーおよびノンレスポンダーの発現によって反映されるように、非応答性に対応する発現レベルである患者特異的タンパク質を同定することを可能にする。したがって、特定の患者が有するRAPの数が患者の応答を予測すると仮定された。測定されたタンパク質のほとんどすべてがレスポンダー集団に適合する発現レベルを示すので、少数のRAPを有するかまたはRAPをまったく有さない患者が治療に応答すると予想される。RAP数が多い患者は、いくつかのタンパク質の発現レベルがノンレスポンダー集団と類似しているため、抵抗性を発現すると予想される。この方法はRAPの性質を考慮しておらず、各対象は完全に異なるRAPを有し得る。むしろ、重要なのはRAPの総数であり、RAPの識別情報ではない。
【0157】
RAPスコアの予測パフォーマンスを、試験セットを使用して試験した。具体的には、試験セットの各患者(n=30)について、訓練セットのすべての患者のRおよびNRタンパク質レベル分布を使用して、すべての特徴についてRAPスコアを計算した(n=78)。上で説明したように訓練セットを使用して計算された閾値と共に、試験セットの各患者のRAPの数および識別情報を推測することが可能である。図4Aは、試験セットからの30人の対象と、T0+T1データを使用して各対象について(数学的方法を使用して)計算されたRAP数とを示す。閾値を3つのRAPに設定し、3つを超えるRAPを有する対象はノンレスポンダーであると予測された。ROC曲線は、0.88のAUCを示し、分析が高度に予測的であることを示している(図4B)。
【0158】
標的化RAP
ICI療法に対する抵抗性の分子的および免疫学的機構の理解の改善は、新規の予測バイオマーカーを同定し得るだけでなく、併用ICI療法の標的も示唆し得る。併用療法は、ICI抵抗性タンパク質を選択的に遮断して、非応答患者のICIの転帰を改善することを目的とする。
【0159】
併用療法の標的を見出すために、試験セット患者で見られたスコア>2.9(定義された閾値)を有するすべてのRAPを評価した。次に、非小細胞肺癌(NSCLC)患者または固形腫瘍を有する患者においてICIと組み合わせてこのリストからのRAPを標的とする臨床試験の検索を調べた。併用療法による臨床試験のマッピングにより、NSCLCもしくは固形腫瘍において、または500の異なる薬物によって、ICIと組み合わせて430のタンパク質を標的とする1300の臨床試験が得られた。試験セット(30人の患者のうちの少なくとも一人の患者に現れ、2.9より高いスコアを有するRAP)でスコアの閾値を満たした30のRAPと、ICIと組み合わせた臨床試験で標的とされることが見出されたタンパク質のリストとを比較して、NSCLC試験でICIと組み合わせてまた標的とされた4つのRAP:KDR(VEGFR2)、IL6、EPHA2、およびTACSD2が明らかになった。
【0160】
IL-6は、患者の試験セットコホートにおいて同定された標的化可能なRAPの1つである。最近、本発明者らは、抗CTLA-4の治療有効性が、担がんマウスにおける抗IL-6の同時投与によって有意に改善されることを示した(Khononov,et al.,2021,“Host response to immune checkpoint inhibitors contributes to tumor aggressiveness”,J.Immunother.Cancer,Mar;9)3_:e001996;参照によりその全体が本明細書に組み込まれる)。これらの結果は、抗IL-6を抗PD1または抗PD-L1治療と組み合わせた場合の改善された治療転帰を実証している、以前の刊行物と一致している。さらに、Khononovらにおけるインビトロの実験は、IL-6の阻害が抗PD-1誘導性腫瘍細胞浸潤特性を低下させることを実証しており、特異的療法誘導性宿主因子の遮断が療法抵抗性を克服するための戦略を表すという考えをさらに裏付けている。
【0161】
RAPに基づく療法標的化のための代替的なアプローチは、がんに関連する主要な生物学的過程にタンパク質を関連させることによるものである。この目的のために、各タンパク質を、主要な腫瘍形成プロセスを捕捉するがんの特徴に割り当てた。次いで、RAPを入力として各患者について富化分析を行った(フィッシャーの正確確率検定;図5)。6人の患者の予備分析により、合計4つの富化プロセスが明らかになった。1名の患者は、4つのプロセスすべてにおいて有意な富化を有していた;4人の患者が1~3のプロセスの富化を示した;1名の患者はいずれの有意な過程をも有さなかった。
【0162】
患者に対して富化分析が行われると、治療医は、富化された生物学的プロセスに基づいて療法を選択することができる。例えば、血管新生が有意に富化されている場合、医師は、血管新生を標的とする承認された薬物(例えば、アバスチン)をICIと併用することを選択し得る。別の例は、高い増殖シグナルを有する患者である。この場合、医師は、ICIを腫瘍細胞増殖に対する化学療法と併用することを選択し得る。
【0163】
RAPの生物学的側面をさらに調べるために、試験セットコホートの少なくとも3人の患者で得られた19個のRAPを調べた。ほとんどの患者は4~5のRAPを有していた。試験した患者の中で最も一般的なRAPはVEGFR2(KDR;12人の患者においてRAPとして同定された)であった。注目すべきことに、RAPのほとんどがT1において同定され、療法に対する抵抗性が主に獲得され、宿主応答から生じることを示唆した。VEGFR2は、T0およびT1の両方でRAPとして同定されたが、T1では、より多くの患者(T0の8名と比較して12名の患者)において、RAPとして定義された。VEGFR2は、レスポンダーにおいて発現がより高い内皮細胞の主要な成長因子である血管内皮成長因子(VEGF)の2つの受容体のうちの1つである。
【0164】
ネットワーク解析により、RAPの大部分は互いに機能的に関連しており、そのうち5つは高度に相互接続されていることが明らかになった(図6)。ほとんどのタンパク質は、がんの少なくとも1つの特徴と関連しており、これは、これらのRAPが実際に療法に対する抵抗性と関連していることをさらに意味する。がんのいくつかの特徴は、19個のRAPで有意に富化されていた(図7)。複数の細胞内および膜タンパク質がRAPとして同定された(図6)。そのため、推定される起源細胞の解析を行い、結果をさらに理解した(図8)。起源の細胞型としての肺および気管支の富化が観察された。さらに、19個のRAPの発現について様々ながん型を調べ、肺がんについての富化も観察された(図9)。
【0165】
実施例2:RAPと臨床データの融合
ICIによる第1の投与前(T0)および第1の投与後(T1)に、血液試料を得た184人のNSCLC患者のコホートを取得した。タンパク質レベルを測定した。応答の評価は、治療開始後3ヶ月および6ヶ月でのORRおよび1年での持続的臨床効果(DCB)に基づいた。無増悪生存(PFS)および全生存(OS)もモニターした。3ヶ月および6ヶ月の評価のために、進行性疾患または死亡の対象をノンレスポンダーとみなし、安定、最小寛解、部分寛解、および完全寛解の対象をレスポンダーとみなした。DCBは、ICI治療を継続した1年間のPFSと定義した。有害事象によりICI治療を停止した(しかし、進行の徴候はない)症例は、レスポンダーとして治療された。試験を通して収集された追加の臨床情報には、治療ライン(初回または進行)、PD-L1免疫染色(1%未満、1~49%、50%超)、年齢および性別が含まれた(図10A~10Fを参照)。提示されている分析は、T0のみに基づく。使用したICI/療法の内訳を表3に示す。
【0166】
【表3】
【0167】
コホートを開発セット(対象の60%)と検証セット(対象の40%)に分割した。開発セットをさらに訓練セットと試験セットに分けた。モデルを訓練セットで訓練し、訓練中にモデルにより確かめられなかった患者のサブセット(すなわち、試験セット)について、予測を生成した。開発セットのすべての患者の安定した予測を生成するために、開発セットの訓練セットおよび試験セットへの分割を複数回行った(発達セットの異なるサブセットについてモデルを訓練し、残りの患者について予測を実行するごとに、すなわち、訓練セットおよび試験セットを混合して再混合し、モデル/分類器が開発セット全体にわたって効果的であることを試験するために数十回の反復を実行)。次いで、開発セットに含まれる患者のROC AUCを計算することによって、予測の質を定量化した。最終的な分類器の機能性を検証するために、分析の最後にのみ検証セットを使用した。この分割を複数回行った。
【0168】
治療開始の3ヶ月後、6ヶ月後、および1年後という3つの時点での応答評価に基づいて、モデルを生成した。184人の患者全員が3ヶ月の時点で評価され、177人が6ヶ月で評価され、146人が1年で評価された。抵抗は経時的に増加した。対象の26%が3ヶ月でノンレスポンダーであり、45%が6ヶ月でノンレスポンダーであり、74%が1年でノンレスポンダーであった。これらの比率は、開発セットと検証セットとの間で同様であった。
【0169】
開発セットに基づくモデル生成時に、開発セットを無作為に訓練セットと試験セットに60回分けた。各反復で、各タンパク質についてどの程度レスポンダーまたはノンレスポンダーを区別するかを定義するコルモゴロフ-スミルノフ検定を使用して、上位の候補タンパク質を選択した。選択した各タンパク質について、訓練セットに基づいて、単一タンパク質XGBoostモデル(SPモデル)が生成されて、試験セットについての予測がなされた。タンパク質は、予測された抵抗性の確率(すなわち、抵抗スコア)が所定の閾値を超えた場合、特定の患者のRAPとして定義され、すべての反復の平均が、各患者に対して使用された。クラスの不均衡を処理するために、すべてのモデルに均一な閾値を割り当てた。各時点について異なる閾値を定めた(例えば、3ヶ月の閾値=0.25、6ヶ月の閾値=0.42、1年の閾値=0.45)。各患者について、モデルスコアが定められた閾値(すなわち、RAPの数)を超えたタンパク質の数を計算した。
【0170】
このコホートでは、RAPの数を確かめることのみが予測的であった。しかしながら、臨床データを統合することもできる予測モデルが作成された。提示された臨床分類器は、RAPの数、治療ライン(ICIが第1の治療ラインまたは進行ラインであった)、対象の年齢および腫瘍におけるPD-L1染色のパーセント(陽性細胞の1%未満、1~49%、または50%超)を入力として使用した。次いで、分類器は、0と1との間の最終抵抗スコアを生成し、それにおいて0はレスポンダーに最も類似し、1はノンレスポンダーに最も類似していた。所定の閾値を超えるスコアの対象は、ノンレスポンダーであると予測された。同様に、1-抵抗スコアである応答スコアも算出した。応答スコアについては、所定の閾値を上回るスコアの対象が、レスポンダーであると予測された。
【0171】
分類モデルのパフォーマンスを試験するために、実際の応答と共に最終抵抗スコアを使用して、ROC AUCを計算した。ROC AUCは、T0およびT1の両方について、3ヶ月のORR、6ヶ月のORR、および1年間のDCBについて別々に計算した。結果を図11Aにまとめる。分類器は、すべての時点において、開発セットおよび検証セットの両方について予測的であることが分かった。同様の分析は、分類器がT1データについてもすべての時点で予測的であることが分かったことを示した(図11B)。
【0172】
分類モデルのパフォーマンスを確認することに加えて、分類モデルによって各患者に割り当てられた予測応答確率(応答スコア)と観察された応答確率との間の相関も調べた。この目的のために、応答スコアSの各々の値について、観察された応答確率が、S±0.1の範囲内の応答スコアが割り当てられた患者の間でのレスポンダーの割合によって、与えられる。±0.1の間隔の選択は、任意であり、検証セットのサイズを反映する。より大きな検証セット内で、間隔をさらに短縮することができる。予測応答スコアと実際の応答確率との間の一致は、適合度R^2の構成によって定量化された。3つすべての時点(3ヶ月のORR、6ヶ月のORR、および1年のDCB)についての適合度は、時点T0(図12A~12B)についてR^2=0.98であった。
【0173】
検証セット内の患者は、長期利益集団および限定された利益集団に層別化され、層別化は、予測された3ヶ月の応答スコアに基づいた。生存分析では、層別化の質を、2つの集団内の単位時間当たりの事象の確率の比が得られるハザード比(HR)によって測定した。例えば、全生存(OS)での4というHRは、限定された利益集団の中の単位時間当たりの死亡事象についての確率が、長期利益集団の中の単位時間当たりの確率の4倍であることを意味する。検証セットでのHRは、PFSについては2.27、p<0.004(図13A)、OSについては4.50、p<0.0001(図13B)であった。
【0174】
この検証実験は、臨床データおよびRAP数を組み込んだ分類器が患者の応答を高度に予測することを実証する。
【0175】
RAPの機能的ネットワーク分析
RAPベースの分析は、抵抗マップの生成の基礎としてさらに使用される(図14A)。抵抗マップは、RAP間の相互作用とRAP機能の両方を表示する。この目的のために、RAPは、一人以上の患者(RAP計算中に、モデルは60回の反復を実行し、所与のタンパク質がモデルのために選択された数が記録される)において少なくとも10回のモデル反復でタンパク質が選択された場合に定められ、現在の患者コホートにおいて合計73のRAPが得られた。各ノードはRAPを表し、ノード間のエッジは機能の関係を示す。より大きなサイズのノードは、免疫療法と組み合わせた治験薬(IND)を示す。ノードは、タンパク質の機能に基づいて色付けされている。マップは、異なるRAP間の複数の相互作用を示すが、RAPは、スプライシング、免疫調節、血管新生、および細胞の増殖などの療法に対する抵抗性に関連し得る異なる機能的プロセスに関与している。患者特異的マップは、患者のRAPに基づいて生成することができ、これは1)個々の患者における抵抗性機構のマッピング、および2)抵抗性に対抗する標的治療の特定に役立つ。コホート内の患者の2つの例を図14Bに示す。これらの例において、ノンレスポンダーは、44のRAPおよび0.44の応答確率スコア(これは、非応答についての0.2の所定の閾値を上回る0.56の抵抗スコアに対応する)を有した。この患者は複数の機能群からのRAPを有していたが、DNA関連RAPはこの患者には存在しなかった。2番目の対象は、所定の閾値を下回る10RAPのレスポンダーであった。これらのRAPは、主に細胞骨格に関連していた。この患者は、0.91という高い応答確率を有していた(これは、0.2という所定の閾値を下回る0.09という抵抗スコアに対応する)。
【0176】
患者RAPのさらなる検査は、RAP間の機能的差異を示し、各応答群においてより高次に表れている(図15)。ノンレスポンダーRAPはスプライシング、シグナル伝達、および細胞骨格関連プロセスに関与するが、レスポンダーRAPは、主にタンパク質分解および細胞接着に関与する。興味深いことに、レスポンダー群のより高いRAPは、抗原提示に関与し得る2つのペプチダーゼを含み、それによって療法に対する応答を促進する。ノンレスポンダーをレスポンダーに変換するために、公知の治療剤が存在するRAPが選択されている。薬剤は、RAPを調節して経路の機能を変化させ、レスポンダーにおける経路の機能をより厳密に近似するように選択される。RAPを標的とする治療薬が利用できないかまたは望ましくない場合、RAPを含む経路を調節する治療剤が選択される。選択された薬剤は、RAPを含む経路を調節して経路の機能を変化させなければならず、その結果、それはレスポンダーにおける経路の機能により密接に近似する。治療剤は、ノンレスポンダーをレスポンダーに変換するために、またはICIとの併用治療として使用される。
【0177】
本発明をその特定の実施形態と併せて説明してきたが、多くの代替形態、修正形態および変形形態が当業者には明らかであることは明白である。したがって、添付の特許請求の範囲の精神および広い範囲に含まれるすべてのそのような代替形態、修正形態および変形形態を包含することが意図されている。
【0178】
実施例3:RAPベースのモデルの検証
前述のRAPベースのモデルを検証するために、NSCLC患者のより大きなコホートを使用した。339人のICI治療NSCLC患者から得た血漿試料および臨床データを収集した。治療前の血漿試料を、単一の血漿試料のおよそ7000のタンパク質を定量するタンパク質アッセイによってプロファイリングした。
【0179】
患者の臨床パラメータを図16Aに示す。年齢の中央値は65であった。患者の約3分の1は女性であった。患者の大部分(78.47%)は非扁平上皮癌(ほとんどが腺癌)を有し、患者の21.24%は扁平上皮癌を有していた。患者は、免疫チェックポイント遮断(ICB)-化学療法の併用(59.88%)またはICB単剤療法(40.12%)のいずれかで治療された。PD-L1の陰性(<1%)、低発現(1~49%)およびPD-L1高発現(≧50%)の患者の分布は概ね同等であった。高PD-L1群が最大であった(36%)。
【0180】
治療に対する臨床応答を治療開始後3ヶ月、6ヶ月および12ヶ月で評価し、各時点で、患者をレスポンダーまたはノンレスポンダーとして分類した。3ヶ月および6ヶ月の時点で、完全寛解、部分寛解または安定の患者をレスポンダーとして分類し、進行性疾患を有する患者をノンレスポンダーとして分類した。12ヶ月で、持続的臨床効果を示す患者(治療開始後少なくとも1年間進行性疾患がないと定義される)をレスポンダーとして分類し、他のすべての患者をノンレスポンダーとして分類した。これらの基準に基づいて、患者の69.32%、46.02%、および24.78%が、それぞれ3ヶ月、6ヶ月および12ヶ月で、レスポンダーとして分類された(図16)。コホートのサイズは、患者の死亡に起因して時点間で変動した(図17)。データセットは、3ヶ月、6ヶ月および12ヶ月の時点についてそれぞれ339、331、および299人の患者を含んだ。
【0181】
PD-L1の発現が6ヶ月および12ヶ月の時点での応答と相関したとしても、3つの時点のそれぞれにおいてこのパラメータのみを使用した応答予測は不良であり、受信者操作特性(ROC)プロットの曲線下面積(AUC)は、3ヶ月、6ヶ月および12ヶ月でそれぞれ0.5、0.6および0.55であった(図18A)。
【0182】
次に、追加の臨床パラメータを統合するとPD-L1バイオマーカーの予測能力が改善されるかどうかを尋ねた。3つの臨床パラメータ、すなわち、患者の年齢、患者の性別、および治療ラインが、応答と相関することが知られている。したがって、PD-L1、年齢、性別および治療ラインに基づく予測モデル(「臨床モデル」)を開発した。臨床モデルは、PD-L1単独と比較して応答予測能力のわずかな改善しか示さず、AUCはそれぞれ3ヶ月、6ヶ月、および12ヶ月間で0.52、0.6、および0.62であった(図18B)。予測パフォーマンスのさらなる改善が必要とされている。
【0183】
よりロバストな予測モデルを開発することを目的として、出力が療法の応答に関連する個々の特徴の合計である追加のモデルを設計した。各特徴はそれ自体で最終的な出力にわずかな影響を及ぼすため、誤った発見の影響が最小限に抑えられ、モデルの安定性が維持され、それによって患者間の有意な不均一性および比較的小さなコホートの多数の特徴の影響が潜在的に緩和される。モデルは、統計学的検定(RAP)によって決定されるように、レスポンダー集団およびノンレスポンダー集団において差次的な血漿レベルを示すタンパク質のセットに基づく。そのようなタンパク質は、個々の患者におけるそれらの血漿レベルに応じて、治療応答の潜在的な指標として役立つ。具体的には、所与の患者について、レスポンダー集団およびノンレスポンダー集団について訓練されたMLベースのモデルは、全RAPセット内の患者の潜在的RAPの各々の血漿レベルから「活性RAP」または「非活性RAP」の予測を推論する。このようにして、個別化されたRAPプロファイルが患者に割り当てられる。個人RAPの数の合計は、患者が治療に応答する可能性を反映している。RAPセットにおいて多数の「アクティブな予測」を示す患者(したがって、多くの個人RAP)は、治療に応答しない可能性が高いが、RAPセットにおいて多数の「非アクティブな」予測がある患者(したがって、少数の個人RAP)は、治療に応答する可能性が高い。同様に、MLベースのモデルは、実際には各RAPの活性スコアを与える。これらのスコアを合わせて(合計して)総RAPスコアを生成することができ、これを順次使用して患者の応答を予測することができる(RAPからの活性が多いほど、不応答性の可能性が高くなる)。3つの応答評価時点のそれぞれに1つずつ、3つのRAPベースのモデルを開発した。モデルは、同じワークフローに従って開発され、3ヶ月、6ヶ月または12ヶ月の時点についての応答標識を、タンパク質発現データおよび患者の性別と一緒に、個人のRAPおよび応答確率(総RAPスコアによって決定される)を決定するためのインプットとして使用した(図19A)。患者のコホートを、開発セット(患者コホートの75%;n=254)および検証セット(患者コホートの25%;n=85)に分割した。開発セットを、それぞれ開発セットの患者の75%および25%からなる訓練セットおよび試験セットにさらに分けた(図19B)。レスポンダー集団とノンレスポンダー集団との間の血漿レベル分布において統計学的に有意な差を示すタンパク質を訓練セットにおいて同定し、50の最も有意なタンパク質を一般的なRAPセットとして同定した。各RAPについて、MLアルゴリズムを2つの特徴、すなわちRAP血漿発現レベルおよび患者の性別で訓練して、訓練セットに基づくRAP活性/発現の予測モデルを開発した。次いで、活性予測(所与の対象における活性/発現されたRAPのタンパク質)を試験セットの各患者についてRAPごとに生成し、各単一RAPについて「活性」または「非活性」の予測をもたらした。3段階のプロセス(すなわち、RAP選択、モデルの訓練および活性の予測)を80回繰り返し、毎回患者を訓練セットと試験セットにランダムに分割した。各反復において、50の選択されたRAPにわたる活性スコアを患者ごとに合計して、総RAPスコアを得た。80回の反復の後、総RAPスコアを患者ごとに平均し、0~1の間の値に線形にスケーリングした。モデルの最終的な出力を、患者が治療に反応する可能性を反映する臨床的に配向されたメトリックである応答確率に、変換した。(同様に、アクティブRAPの総数を使用して、応答予測を行うことができる(前述)。
【0184】
この方法を使用して、患者を訓練セットと試験セットとの間で80回ランダムに混合し、各時点で訓練セットから50のRAPを選択し、同じRAPを全体で数回選択することができた(図20A)。それぞれ3ヶ月、6ヶ月および12ヶ月の時点について選択された合計287、330、および371のRAPのうち、約30のRAPが、各時点の反復の少なくとも50%(≧40回)で選択された(図20B)。3つの時点にわたって、合計598のRAPが選択され、そのうち113のRAPが3つの時点すべてに共通であったが、97、85および139のRAPは、それぞれ3ヶ月、6ヶ月および12ヶ月の時点に固有であった(図20C)。特に、多数のRAPを3つの時点にわたって複数回選択した(図20D)。すべての時点にわたるRAPに関連する生物学的プロセスには、スプライシング、補体および凝固カスケード、ならびにペプチダーゼ活性、ならびに複数のシグナル伝達カスケードが含まれる(図20E)。
【0185】
モデル開発後、各時点のRAPベースのモデルを、モデル訓練中に使用されなかった独立した検証セット(患者コホートの25%;n=85)で試験した。各時点に、応答確率を検証セットの各患者について決定した。応答確率分布の範囲は各時点で異なり、応答確率の中央値は経時的に減少した(図16A図6)。さらに、すべての患者の応答確率が、ある時点からいずれかのその後の時点まで減少し(図22A~22C)、経時的に観察された応答率の減少と一致した(図22D)。注目すべきことに、観察されたノンレスポンダーは、3つすべての時点について予測応答確率のより低い範囲でクラスター化し、モデルが高い予測力を有することを示している(図21)。さらに、応答確率(2D富化試験;誤発見率<0.05)に基づく富化分析は、3つの時点すべてで、レスポンダー、女性、非扁平上皮癌患者、および進行性疾患または死亡事象のない患者で、高い応答確率が有意に富化されたことを示した。一方、低い応答確率は、ノンレスポンダー、男性、扁平上皮癌患者および進行性疾患または死亡事象を有する患者で有意に富化された(図23)。
【0186】
応答確率の中央値を閾値として使用して、患者を高応答確率群または低応答確率群に分類し、中央値より上または下の予測応答確率の患者を、それぞれ高応答確率群または低応答確率群に割り当てた。Cox回帰分析は、3つの時点にわたって、高応答確率群の患者が低応答確率群の患者よりも有意に長い全生存を達成したことを実証した(図24A、ハザード比、HR=0.24~0.38)。無増悪生存(PFS;図24B、HR=0.32~0.41)についても同様の結果が得られた。これらの所見は、RAPベースのモデルがICB治療NSCLC患者の生存転帰を首尾よく分類することを実証している。
【0187】
モデルの精度をさらに試験するために、予測応答確率を観察された応答率と比較した。後者は、同様の応答確率を割り当てられた患者群の中での観察されたレスポンダーの割合を指す(すなわち、応答確率±0.15)。線形回帰分析は、予測応答確率と観察された応答率との間の高い適合度(R=0.97)を実証した(図25A)。さらに、ROC曲線のAUCは、3ヶ月、6ヶ月および12ヶ月の時点でそれぞれ0.71、0.77、および0.78であり(図25B)、ICBベースの治療の最初の年にわたるRAPベースのモデルの強力な予測能力を実証した。特に、RAPベースのモデルは、PD-L1ベースのモデル(最初の年のAUC=0.5~0.6)および臨床モデル(最初の年のAUC=0.52~0.62)と比較して、優れた予測パフォーマンスを示した(図18)。
【0188】
次に、臨床パラメータをRAPモデルに統合するとその予測パフォーマンスが改善されるかどうかを試験した。この目的のために、PD-L1ベースのモデルまたは臨床モデルをRAPベースのモデルと統合し、予測パフォーマンスを比較した。興味深いことに、PD-L1パラメータをRAPベースのモデルに追加すると、6ヶ月の時点の予測パフォーマンスがわずかに増加したが、RAPベースおよび臨床モデルを統合すると、全体的に予測パフォーマンスが低下した(図26A)。生存分析では、RAPモデルは他の4つのモデルと比較して最良のHRを示したが、HRはPD-L1ベースおよび臨床モデルでは有意ではなかった(図26B)。
【0189】
RAPモデル、PD-L1の発現および年齢に従って得られた活性RAPの数を統合した別のモデルでは、ROC曲線のAUCは、3ヶ月、6ヶ月および12ヶ月の時点でそれぞれ0.66、0.71、および0.68であった(図27A~27C)。線形回帰分析は、すべての時点での予測応答確率と観察された応答率との間の高い適合度(R=0.94)を実証した(図27D)。したがって、RAP数と臨床パラメータとの組み合わせは、総RAPスコア(各RAP活性レベル)と臨床パラメータとの組み合わせよりも、患者の応答を正確に予測する能力において、良好または優れていることが分かった。
【0190】
最後に、異なる患者サブセットにおけるRAPベースのモデルのパフォーマンスを試験した(図28)。このモデルは、ICI単剤療法サブセットおよびICI化学療法サブセットの両方において、集団全体におけるパフォーマンスと同様の強力な予測パフォーマンスを示した。一方、組織学サブセット分析は、全集団と比較して、3ヶ月で扁平上皮癌サブセットの予測の改善を示した。6ヶ月および12ヶ月では、PD-L1陰性サブセットにおいて最も強い予測が観察されたが、予測は、集団全体と比較してPD-L1高サブセットにおいてわずかに弱かった。
【0191】
実施例4:RAPベースのモデルは、PD-L1高患者における異なる転帰を予測する
ドライバー突然変異陰性NSCLCの初期の治療のための現在のガイドラインによれば、PD-L1高腫瘍の患者は、ICIの単剤療法またはICIと化学療法との併用で治療され、後者の療法の選択肢は、急速進行性疾患の場合に推奨される。PD-L1低値またはPD-L1陰性腫瘍の患者の場合、ICIと化学療法の併用が唯一の推奨される選択肢である。使用したコホートでは、PD-L1高患者は、PD-L1低およびPD-L1陰性患者と比較して、より良好な予後、およびOSとPFSの中央値の最大2倍の差を示した(図29A)。ほとんどのPD-L1高患者(65.3%)が単剤療法ICIで治療された。
【0192】
単剤療法ICIを受けているPD-L1高患者の中で、ICI-化学療法併用でよりうまく成し得た患者を特定することが可能である。このことを調査するために、RAPベースのモデルが患者のサブセット(すなわち、単剤療法ICIを受けているPD-L1高患者対ICI-化学療法併用を受けているPD-L1高患者)の生存転帰を予測する能力を試験した。単剤療法サブセットにおいて、高応答確率群の患者は、3つの時点すべてにおいて、低応答確率群の患者よりも有意に長いOSを有していた(3ヶ月HR=0.24、p<0.001;6ヶ月HR=0.36、p=0.004;12ヶ月HR=0.42、p=0.01;図29B)。特に、高い応答確率の患者では、OSの中央値が、3ヶ月および6ヶ月の時点で到達されず、低い応答確率の患者における平均10.98ヶ月と比較して、12ヶ月の時点で32.6ヶ月であった。注目すべきことに、それは全体的にPD-L1高患者のOSの中央値を超えていた(29.4ヶ月)。対照的に、併用療法サブセットでは、高応答確率群と低応答確率群とを比較した場合、いずれの時点においてもOSに有意差はなかった(図29B)。注目すべきことに、単剤療法または併用療法のサブセットにおいて高応答確率群と低応答確率群との間でPFSの有意差は観察されなかった(それぞれ図30A、30B)。まとめると、OS分析は、ICI単剤療法のベネフィットをあまり受けず、またICIと化学療法の併用でより良好な転帰を達成し得るPD-L1高患者を、RAPベースのモデルが特定できることを実証している。
【0193】
PD-L1-低/陰性患者に関して、高応答確率群および低応答確率群の両方が、単剤療法サブセットにおいて予後不良を示した(図29B)。これは、モデルが、ICI単剤療法からベネフィットを得るPD-L1-低/陰性患者のサブグループを同定しなかったことを示している。併用療法サブセットにおいて、高応答確率群は、低応答確率群よりも有意に長く生存し(3ヶ月HR=0.34、p<0.0001;6ヶ月HR=0.32、p<0.0001;12ヶ月HR=0.38、p<0.0001)、このサブセットにおいてPD-L1高患者と同様の転帰を示した(図29B)。したがって、RAPベースのモデルは、ベネフィットが推奨される併用療法からのより長いOSを示すPD-L1-低/陰性患者とそうでないPD-L1-低/陰性患者とを区別した。しかしながら、現在、後者の場合に対処するための治療選択肢はない。

図1A
図1B
図1C
図2
図3A
図3B
図3C
図4A
図4B
図5
図6-1】
図6-2】
図7
図8
図9
図10A
図10B
図10C
図10D
図10E
図10F
図11A
図11B
図12A
図12B
図13A
図13B
図14A
図14B
図15-1】
図15-2】
図16
図17
図18A
図18B
図19A
図19B
図20A
図20B
図20C
図20D
図20E-1】
図20E-2】
図20E-3】
図20E-4】
図21-1】
図21-2】
図22A
図22B
図22C
図22D
図23-1】
図23-2】
図24A-1】
図24A-2】
図24B-1】
図24B-2】
図25A
図25B
図26A-1】
図26A-2】
図26B-1】
図26B-2】
図27A
図27B
図27C
図27D
図28
図29A-1】
図29A-2】
図29B-1】
図29B-2】
図29B-3】
図29B-4】
図29B-5】
図29B-6】
図30A-1】
図30A-2】
図30A-3】
図30B-1】
図30B-2】
図30B-3】
【国際調査報告】