(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-09-22
(54)【発明の名称】患者を層別化するための分類子の開発
(51)【国際特許分類】
C12Q 1/6827 20180101AFI20220914BHJP
C12Q 1/6883 20180101ALI20220914BHJP
A61P 37/02 20060101ALI20220914BHJP
A61P 19/02 20060101ALI20220914BHJP
A61P 29/00 20060101ALI20220914BHJP
A61P 19/00 20060101ALI20220914BHJP
A61P 1/04 20060101ALI20220914BHJP
A61P 17/06 20060101ALI20220914BHJP
A61P 17/00 20060101ALI20220914BHJP
A61K 39/395 20060101ALI20220914BHJP
A61K 38/17 20060101ALI20220914BHJP
A61K 31/519 20060101ALI20220914BHJP
A61K 31/42 20060101ALI20220914BHJP
【FI】
C12Q1/6827 Z
C12Q1/6883 Z
A61P37/02
A61P19/02
A61P29/00 101
A61P19/00
A61P1/04
A61P17/06
A61P17/00
A61K39/395 U
A61K39/395 N
A61K38/17
A61K31/519
A61K31/42
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021577528
(86)(22)【出願日】2020-06-26
(85)【翻訳文提出日】2022-02-24
(86)【国際出願番号】 US2020039991
(87)【国際公開番号】W WO2020264426
(87)【国際公開日】2020-12-30
(32)【優先日】2019-06-27
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-08-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-01-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521566036
【氏名又は名称】サイファー メディシン コーポレーション
(74)【代理人】
【識別番号】100082072
【氏名又は名称】清原 義博
(72)【発明者】
【氏名】ジアシアン,スーザン
(72)【発明者】
【氏名】メラーズ,セオドア アール.
(72)【発明者】
【氏名】サントリーニ,マルク
(72)【発明者】
【氏名】アメリ,アッシャー
(72)【発明者】
【氏名】シェーンブルナー,ナンシー
(72)【発明者】
【氏名】アクマエフ,ヴャチェスラフ アール.
(72)【発明者】
【氏名】ジョンソン,キース ジェイ.
【テーマコード(参考)】
4B063
4C084
4C085
4C086
【Fターム(参考)】
4B063QA01
4B063QA19
4B063QQ02
4B063QQ42
4B063QR55
4B063QR62
4B063QS34
4B063QX02
4C084AA02
4C084BA34
4C084BA41
4C084BA44
4C084CA18
4C084DC50
4C084NA05
4C084ZA68
4C084ZA89
4C084ZA96
4C084ZB07
4C084ZB15
4C085AA13
4C085AA14
4C085BB31
4C085CC23
4C085EE01
4C086AA01
4C086AA02
4C086BC67
4C086CB05
4C086MA01
4C086MA04
4C086NA05
4C086ZA68
4C086ZA89
4C086ZA96
4C086ZB07
4C086ZB15
(57)【要約】
【解決手段】本明細書では、特定の処置に対する反応を予測するのに有用な分類子を開発するためのシステムおよび方法が提示される。例えば、いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象を処置する方法を提供し、上記方法は、抗TNF治療を受けたコホート内の反応性および非反応性の先行対象を区別するために確立された分類子を介して、反応性であると決定された対象に、抗TNF治療を投与する工程を含む。
【選択図】なし
【特許請求の範囲】
【請求項1】
自己免疫疾患に苦しむ対象を処置する方法であって、前記方法は、
抗TNF治療を受けたコホート内の反応性および非反応性の先行対象を区別するために確立された分類子を介して、反応性であると決定された対象に、抗TNF治療を投与する工程を含み、
前記分類子は、
その発現レベルが臨床的な反応性または非反応性に優位に相関する1つ以上の遺伝子、
1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つ、
を評価することによって開発され、
前記分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される、
方法。
【請求項2】
前記分類子は、少なくとも170人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する、請求項1に記載の方法。
【請求項3】
前記1つ以上の遺伝子は、ヒトインタラクトームマップ上にマッピングされたときのトポロジー特性によって特徴付けられる、請求項1または2に記載の方法。
【請求項4】
SNPは、ヒトゲノムに関連して同定される、請求項1-3のいずれか1つに記載の方法。
【請求項5】
前記分類子は、
その発現レベルが臨床的な反応性または非反応性に優位に相関する1つ以上の遺伝子、
1つ以上のSNPの存在、および、
少なくとも1つの臨床的特徴
のそれぞれを評価することによって開発される、請求項1-4のいずれか1つに記載の方法。
【請求項6】
1つ以上の遺伝子は以下から選択される、請求項1-5のいずれか1つに記載の方法。
【表1】
【請求項7】
少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される、請求項1-6のいずれか1つに記載の方法。
【請求項8】
前記分類子は、少なくとも90%の精度で、非反応性である集団内の少なくとも40%の対象を識別し、ここで、前記集団は少なくとも170人の対象を含む、請求項1-6のいずれか1つに記載の方法。
【請求項9】
抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーを投与することを含む、請求項1-8のいずれか1つに記載の方法。
【請求項10】
疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される、請求項1-9のいずれか1つに記載の方法。
【請求項11】
前記分類子は、反応性および非反応性の先行対象に由来するマイクロアレイ分析を用いて確立される、請求項1-10のいずれか1つに記載の方法。
【請求項12】
前記分類子は、独立したコホートに由来するRNAseqデータを使用して検証される、請求項1-11のいずれか1つに記載の方法。
【請求項13】
SNPは表5から選択される、請求項1-12のいずれか1つに記載の方法。
【請求項14】
自己免疫疾患に苦しむ対象へ治療を投与する方法であって、前記方法は、
抗TNF治療を受けたコホート内の反応性と非反応性の先行対象を区別するために確立された分類子を介して、反応性または非反応性に分類された対象に前記治療を投与する工程と、
対象が分類子によって反応性であると分類された場合に、抗TNF治療を投与する工程と、
対象が分類子によって非反応性であると分類された場合に、抗TNF治療の代替物を投与する工程とを含み、
前記分類子は、
その発現レベルが臨床的な反応性または非反応性に優位に相関する1つ以上の遺伝子、
1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つ、
を評価することによって開発され、
前記分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される、方法。
【請求項15】
前記分類子は、少なくとも170人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する、請求項14に記載の方法。
【請求項16】
前記分類子は、
その発現レベルが臨床的な反応性または非反応性に優位に相関する1つ以上の遺伝子、
1つ以上のSNPの存在、および、
少なくとも1つの臨床的特徴、
のそれぞれを評価することによって開発される、請求項15に記載の方法。
【請求項17】
少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される、請求項14-16のいずれか1つに記載の方法。
【請求項18】
抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーを投与することを含む、請求項14-17のいずれか1つに記載の方法。
【請求項19】
抗TNF治療の代替物は、リツキシマブ、サリルマブ、クエン酸トファシチニブ、レフノミド、ベドリズマブ、トシリズマブ、アナキン、およびアバタセプトから選択される、請求項14-18のいずれか1つに記載の方法。
【請求項20】
疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される、請求項19に記載の方法。
【請求項21】
1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法であって、前記方法は、
治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析する工程と、
配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、
1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、
1つ以上のSNPを分類子に含める工程と、を含む、方法。
【請求項22】
1つ以上の治療属性は、特定の疾患、障害、または疾病を発症するリスク、特定の疾患、障害、または疾病に対する特定のアウトカムの可能性、特定の治療に対する反応の可能性からなる群から選択される、請求項21に記載の方法。
【請求項23】
1つ以上の治療属性は、特定の治療に対する反応の可能性である、請求項21または22に記載の方法。
【請求項24】
特定の治療は抗TNF治療である、請求項21-23のいずれか1つに記載の方法。
【請求項25】
治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析することによって、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法であって、
改善は、
配列データから1つ以上の一塩基多型(SNP)の存在を評価することと、
1つのSNPの存在が少なくとも1つの治療属性と相関していることを決定することと、
1つ以上のSNPを分類子に含めることを含む、方法。
【請求項26】
1つ以上の治療属性は、特定の疾患、障害、または疾病を発症するリスク、特定の疾患、障害、または疾病に対する特定のアウトカムの可能性、特定の治療に対する反応の可能性からなる群から選択される、請求項25に記載の方法。
【請求項27】
1つ以上の治療属性は、特定の治療に対する反応の可能性である、請求項25または26に記載の方法。
【請求項28】
特定の治療は抗TNF治療である、請求項25-27のいずれか1つに記載の方法。
【請求項29】
1つ以上のSNPの存在を評価することは、RNAの配列データを参照ヒトゲノムと比較することを含む、請求項25-28のいずれか1つに記載の方法。
【請求項30】
自己免疫疾患に苦しむ対象を処置する方法であって、前記方法は、
(a)コンピューティングデバイスのプロセッサによって、対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、ここで、遺伝子は表1から選択される、工程と、
(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対して反応性または非反応性であるとして対象の分類を自動的に決定する工程と、
任意選択で、(c)対象が抗TNF治療に非反応性であると分類される場合、自己免疫疾患の処置のために抗TNF治療の代替物を対象に投与する工程、または、対象が抗TNF治療に反応性であると分類される場合、抗TNF治療を投与する工程と、
を含む、方法。
【請求項31】
工程(a)のプロセッサは、1つ以上の臨床的特徴、または1つ以上の一塩基多型(SNP)の少なくとも1つに対応するデータをさらに受信する、請求項30に記載の方法。
【請求項32】
1つ以上の臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される、請求項30または31に記載の方法。
【請求項33】
自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎から選択される、請求項30-32のいずれか1つに記載の方法。
【請求項34】
自己免疫疾患は、関節リウマチまたは潰瘍性大腸炎である、請求項30-33のいずれか1つに記載の方法。
【請求項35】
抗TNF治療の代替物は、リツキシマブ、サリルマブ、クエン酸トファシチニブ、レフノミド、ベドリズマブ、トシリズマブ、アナキン、およびアバタセプトから選択される、請求項30-34のいずれか1つに記載の方法。
【請求項36】
抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーから選択される、請求項30-34のいずれか1つに記載の方法。
【請求項37】
工程(b)は、機械学習モデルを用いて前記分類を自動的に決定することを含む、請求項30-36のいずれか1つに記載の方法。
【請求項38】
機械学習モデルは、ランダムフォレストモデルである、請求項37に記載の方法。
【請求項39】
工程(b)は、臨床共変動分類子(CC)を使用することなく前記分類を自動的に決定することを含む、請求項30-38のいずれか1つに記載の方法。
【請求項40】
工程(b)は、組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む、請求項30-38のいずれか1つに記載の方法。
【請求項41】
工程(b)は、臨床共変動分類子(CC)を使用することなく、かつ、組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む、請求項30-38のいずれか1つに記載の方法。
【請求項42】
(a)コンピューティングデバイスのプロセッサによって、疾患(例えば、自己免疫疾患、例えば、関節リウマチ)に苦しんでいる対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11の全てのメンバー)を含む、工程と、
(b)プロセッサによって、工程(a)で受信したデータを使用して、第1の治療(例えば、抗TNF治療)に対して非反応性であるとして対象の分類を自動的に決定する工程と、
任意選択で、(c)疾患の処置のために、対象に第2の治療(例えば、第1の治療の代替物、例えば、抗TNF治療の代替物)を処方および/または投与する工程であって、それによって、対象への第1の治療の処方および/または投与を回避する、工程とを含む、
方法。
【請求項43】
抗TNF治療で対象を処置する方法であって、前記方法は、
抗TNF治療を受けた反応性および非反応性の先行対象を区別するために確立された分類子を介して、反応性であると決定された対象に、抗TNF治療を投与する工程を含み、
前記分類子は、
その発現レベルが臨床的な反応性または非反応性に優位に相関する1つ以上の遺伝子、ならびに、
1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つ、
を評価することによって開発される、方法。
【請求項44】
自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、前記抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法であって、前記方法は、
(a)コンピューティングデバイスのプロセッサによって、以下からなる群から選択される1つ以上の遺伝子のそれぞれの前記対象に対する発現レベルに対応するデータを受信する工程と、
【表2】
(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対して反応性または非反応性であるとして対象の分類を自動的に決定する工程と、を含む、方法。
【請求項45】
(c)対象が抗TNF治療に非反応性であると工程(b)で分類される場合に、自己免疫疾患の処置のために抗TNF治療の代替物を対象に処方および/または投与する工程、あるいは、対象が抗TNF治療に反応性であると工程(b)で分類される場合に、抗TNF治療を対象に投与する工程を含む、請求項44に記載の方法。
【請求項46】
工程(a)のプロセッサは、
(i)対象の1つ以上の臨床的特徴、
(ii)対象の1つ以上の一塩基多型(SNP)、
の少なくとも1つに対応するデータをさらに受信する、請求項44または45に記載の方法。
【請求項47】
工程(a)のプロセッサは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを受信する、請求項44-46のいずれか1つに記載の方法。
【請求項48】
工程(a)のプロセッサは、表5に記載される1つ以上のSNPに対応するデータを受信する、請求項44-47のいずれか1つに記載の方法。
【請求項49】
自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎からなる群から選択されるメンバーである、請求項44-48のいずれか1つに記載の方法。
【請求項50】
自己免疫疾患は、関節リウマチまたは潰瘍性大腸炎である、請求項44-49のいずれか1つに記載の方法。
【請求項51】
抗TNF治療の代替物は、リツキシマブ、サリルマブ、クエン酸トファシチニブ、レフノミド、ベドリズマブ、トシリズマブ、アナキン、およびアバタセプトからなる群から選択される少なくとも1つのメンバーを含む、請求項44-50のいずれか1つに記載の方法。
【請求項52】
抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、または前述のもののいずれかのバイオシミラーからなる群から選択される少なくとも1つのメンバーを含む、請求項44-50のいずれか1つに記載の方法。
【請求項53】
抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、および前述のもののいずれかのバイオシミラーからなる群の任意のメンバーを含まない、請求項44-52のいずれか1つに記載の方法。
【請求項54】
工程(b)は、機械学習モデルを用いて前記分類を自動的に決定することを含む、請求項44-53のいずれか1つに記載の方法。
【請求項55】
機械学習モデルは、ランダムフォレストモデルである、請求項54に記載の方法。
【請求項56】
工程(b)は、臨床共変動分類子(CC)を使用することなく前記分類を自動的に決定することを含む、請求項44-55のいずれか1つに記載の方法。
【請求項57】
工程(b)は、組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む、請求項44-55のいずれか1つに記載の方法。
【請求項58】
工程(b)は、臨床共変動分類子(CC)を使用することなく、かつ組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む、請求項44-55のいずれか1つに記載の方法。
【請求項59】
自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、前記抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法であって、前記方法は、
(a)コンピューティングデバイスのプロセッサによって、自己免疫疾患に苦しんでいる対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子が、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバーを含む、工程と、
(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いとして対象の分類を自動的に決定する工程と、を含む、方法。
【請求項60】
(c)対象が抗TNF治療に非反応性であると工程(b)で分類される場合に、自己免疫疾患の処置のために抗TNF治療の代替物を対象に処方および/または投与する工程、あるいは、対象が抗TNF治療に反応性であると工程(b)で分類される場合に、抗TNF治療を対象に投与する工程を含む、請求項59に記載の方法。
【請求項61】
自己免疫疾患は慢性関節リウマチである、請求項59または60に記載の方法。
【請求項62】
工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも2つの遺伝子のそれぞれの発現レベルに対応するデータを受信することを含む、請求項59-61のいずれか1つに記載の方法。
【請求項63】
工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも3つの遺伝子のそれぞれの発現レベルに対応するデータを受信することを含む、請求項59-61のいずれか1つに記載の方法。
【請求項64】
工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも5つの遺伝子のそれぞれの発現レベルに対応するデータを受信することを含む、請求項59-61のいずれか1つに記載の方法。
【請求項65】
工程(a)のプロセッサは、
(i)対象の1つ以上の臨床的特徴、
(ii)対象の1つ以上の一塩基多型(SNP)、
の少なくとも1つに対応するデータをさらに受信する、請求項59-64のいずれか1つに記載の方法。
【請求項66】
工程(a)のプロセッサは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを受信する、請求項59-65のいずれか1つに記載の方法。
【請求項67】
工程(a)のプロセッサは、表5に記載される1つ以上のSNPに対応するデータを受信する、請求項59-66のいずれか1つに記載の方法。
【請求項68】
自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、前記抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類するためのシステムであって、前記システムは、
プロセッサと、
内部に命令を有するメモリとを含み、前記命令は、プロセッサによって実行されるときに、プロセッサに、
(a)以下からなる群から選択される1つ以上の遺伝子のそれぞれの前記対象に対する発現レベルを含むデータのセットを受信させ、
【表3】
および、
(b)データのセットを用いて、抗TNF治療に反応性または非反応性であるとして対象の分類を自動的に決定させる、システム。
【請求項69】
データのセットは、
(i)対象の1つ以上の臨床的特徴、
(ii)対象の1つ以上の一塩基多型(SNP)、
の少なくとも1つに対応するデータをさらに含む、請求項68に記載のシステム。
【請求項70】
データのセットは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを含む、請求項69に記載のシステム。
【請求項71】
データのセットは表5に記載される1つ以上のSNPを含む、請求項69または70に記載のシステム。
【請求項72】
自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎からなる群から選択されるメンバーである、請求項69-71のいずれか1つに記載のシステム。
【請求項73】
自己免疫疾患は、関節リウマチまたは潰瘍性大腸炎である、請求項69-71のいずれか1つに記載のシステム。
【請求項74】
自己免疫疾患は慢性関節リウマチである、請求項69-71のいずれか1つに記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
係属中の出願への相互参照
本出願は、2020年1月24日に出願された米国仮出願第62/965,486号、2019年6月27日に出願された米国仮出願第62/867,853号、および2019年8月2日に出願された米国仮出願第62/882,402号の優先権を主張するものであり、これらの各々は、全体として参照により本明細書に組み込まれる。
【0002】
本特許出願の主題は、2019年3月15日に出願された「Methods and Systems for Predicting Response to Anti-TNF Therapies」と題する係属中の国際特許出願第PCT/US19/22588号に関連しており、これは、2018年3月16日に出願された米国仮出願第62/644,070号の優先権と利益を主張し、これらのそれぞれの内容は全体として参照により本明細書に組み込まれるものとする。
【背景技術】
【0003】
関節リウマチ(RA)などの自己免疫疾患は、何百万人もの患者に影響を与え、その治療は、全体的な医療支出のうちのかなりの構成要素を表している。自己免疫疾患は、2つのグループ、臓器特異的自己免疫と全身性自己免疫に分けることができる。RAを含むリウマチ性疾患は、主に滑膜関節に発現し、最終的には腱、軟骨、および骨で不可逆的な破壊をもたらす全身性自己免疫疾患に属する。現在、RAを完治させる治療法は存在しないが、主に、このサイトカインの炎症促進性シグナル伝達を中和するように作用する抗TNF(腫瘍壊死因子)薬の開発により、これらの患者の治療法を管理するための大きな改善が行われた。このような生物学的治療(例えば、Humira、Enbrel、Remicade、Simponi、およびCymzia)は、一部のRA患者の治療アウトカムを著しく向上させた。
【0004】
RA患者の約34%(低い割合)が抗TNF治療に臨床的反応を示し、低疾患活動性(LDA)を達成し、時には寛解を達成する。これらのいわゆる「レスポンダー」の患者における疾患の進行は、TNFによって引き起こされる不適切な炎症促進反応の結果であると考えられる。抗TNFに応答しない患者には、抗CD20、同時刺激遮断、JAK、および抗IL6治療などの代替的な承認された治療がある。しかしながら、一般に、患者は、このような代替治療に切り替える前に、最初に様々な抗TNFを繰り返し、これが1年以上かかることもあり、その間、症状は持続し、病状はさらに進行し、治療目標を達成することはより困難になっている。
【0005】
治療の遅れの問題に加えて、抗TNF治療に伴う既知の重篤な感染症および悪性腫瘍のリスクは非常に深刻であるため、製品の承認には通常、いわゆる「ブラックボックス警告」をラベルに記載することが要求されている。このような治療の他の潜在的な副作用としては、例えば、うっ血性心不全、脱髄疾患、および他の全身性副作用が挙げられる。
【0006】
さらに、精密医療は、オミックスデータおよび臨床アウトカムを用いて、機械学習、人工知能、およびネットワーク科学アプローチで開発された独自のアルゴリズムを使用して、ゲノムデータおよび/またはマルチオミクスデータを解釈する能力に依存している。しかしながら、大きな課題は、オミックデータを解析するソフトウェアが常に改良および更新されていることである。このようなアップデートは、臨床研究所環境においてソフトウェアコンポーネントを含むシステムをロックして検証する必要があることから、適時に実施することが極めて困難である。
【発明の概要】
【0007】
抗TNF治療の重大な問題は、反応率が一定でないということである。実際、これらの分野の解決されていないニーズを特定するために免疫学やリウマチ学の分野の主要な科学者や臨床医を集めるように企画された最近の国際会議では、ほぼ例外なく、反応率の不確実性が喫緊の課題であることが確認されている。例えば、第19回国際標的治療学会(the 19th annual International Targeted Therapies meeting)では、関節リウマチ、乾癬性関節炎、軸性脊椎関節炎、全身性エリテマトーデス、および結合組織病(例えば、シェーグレン症候群、全身性硬化症、ベーチェット病およびIgG4関連疾患を含む血管炎)などの様々な疾患の治療における課題に関する分科会が開催され、これらの疾患すべてに共通する特定の問題、特に「治療反応の予測ツールを開発することができるように…それぞれの疾患内の異種性をより良く理解する必要性」を明らかにした。Winthrop, et al.,“The unmet need in rheumatology: Reports from the targeted therapies meeting 2017,” Clin. Immunol. pii: S1521-6616(17)30543-0, Aug. 12, 2017を参照。同様に、抗TNF治療によるクローン病の治療に関する多くの文献では、反応率が不安定で、どの患者に効果があるのか予測できないことが一貫して嘆かれている。例えば、M.T. Abreu,“Anti-TNF Failures in Crohn’s Disease,” Gastroenterol Hepatol (N.Y.), 7(1):37-39 (Jan. 2011)を参照。さらに、Ding et al.,“Systematic review: predicting and optimising response to anti-TNF therapy in Crohn’s disease-algorithm for practical management,” Aliment Pharmacol. Ther., 43(1):30-51 (Jan. 2016) (reporting that “[p]rimary nonresponse to anti-TNF treatment affects 13-0% of patients.”).を参照。
【0008】
提供された技術は、とりわけ、医療提供者が対象、例えば、特定の治療(例えば、抗TNF治療)から利益を得る可能性が高い対象のカテゴリー間または上記カテゴリー中で、利益を得ない対象、特定のアウトカムまたは副作用を達成するか、またはそれに苦しむ可能性が高い対象と区別することを可能にする。いくつかの実施形態では、したがって、上記のように提供される技術は患者のリスクを低減し、非応答患者集団に対するケアのタイミングおよび質を高め、薬剤開発の効率を高め、および/または非応答患者に効果のない治療を投与すること、または関連治療(例えば、抗TNF治療)の投与時にその患者が経験する副作用の治療に伴う費用を回避する。
【0009】
いくつかの実施形態では、本開示は、特定の治療(例えば、抗TNF治療)で対象を処置する方法を提供し、上記方法は、治療に反応性であると予想される対象と非反応性であると予想される対象とを区別するために、確立された分類子を介して、反応性であると決定された対象に治療を投与する工程を含む。
【0010】
とりわけ、対象が特定の治療に反応性であるか非反応性であるか、および/または特定のアウトカムまたは副作用を達成するかまたはそれに苦しむかを決定するために有用な分類子の実施形態も、このような分類子を準備する方法と同様に、本明細書に記載されている。
【0011】
提供される技術は、とりわけ、例えば、レスポンダー対ノンレスポンダー集団を定義するための特定の従来のアプローチに関する問題の原因の特定を含む、および/または、そのような集団を区別する分類子を定義するための特に有用な戦略を表す特定の洞察を具現化するおよび/または上記洞察から発生するものである。
【0012】
例えば、本明細書に記載されるように、本開示は、集団における遺伝子発現差を考慮してレスポンダー対ノンレスポンダーの集団を定義するための多くの従来の戦略の問題の1つの原因は、それらが通常、最高倍(すなわち、有意な)変化を優先させるか、さもなければ重要視することであるというWO2019/178546によって提供された洞察を利用する。WO2019/178546に記載されるように、このようなアプローチは疾患の生態に関連する微妙であるが意味のある差異を見逃している。さらに、本開示は、ヒトインタラクトーム(human interactome)マップ(特に、実施形態によっては、提案されているが実験的に検証されていない任意の理論的、計算的、または他の相互作用を明示的に除外する、細胞成分間の実験的に裏付けられた物理的相互作用を表すヒトインタラクトームマップに)上に、発現レベルが変化した遺伝子をマッピングすることで、特定の治療、特に抗TNF治療に対してレスポンダー対ノンレスポンダーを定義するための有用かつ有効な分類子を提供できるという、WO2019/178546にも記載されている洞察を利用するものである。いくつかの実施形態では、そのような分類子に含まれる遺伝子は、ヒトインタラクトーム上の連結モジュールを表す。
【0013】
本開示はさらに、特に有用な治療分類子がクロスプラットフォームデータの使用を通じて開発されるという洞察を提供する。例えば、本開示は、発現した配列の配列解析、例えば、一塩基多型(SNP)解析と差次的遺伝子発現との組み合わせが、治療分類子(すなわち、関連する治療を投与したとき/場合に、対象が1つ以上の特定のアウトカムまたは副作用等に応答するおよび/またはそれを達成するあるいはそれに苦しむ可能性を予測する分類子)の開発において特に有用であることを教示するものである。
【0014】
様々な治療(例えば、抗TNF)治療に関する重要な既知の問題は、反応率が一貫していないことである。実際、これらの分野の解決されていないニーズを特定するために免疫学やリウマチ学の分野の主要な科学者や臨床医を集めるように企画された最近の国際会議では、ほぼ例外なく、反応率の不確実性が喫緊の課題であることが確認されている。例えば、第19回国際標的治療学会(the 19th annual International Targeted Therapies meeting)では、関節リウマチ、乾癬性関節炎、軸性脊椎関節炎、全身性エリテマトーデス、および結合組織病(例えば、シェーグレン症候群、全身性硬化症、ベーチェット病およびIgG4関連疾患を含む血管炎)などの様々な疾患の治療における課題に関する分科会が開催され、これらの疾患すべてに共通する特定の問題、特に「治療反応の予測ツールを開発することができるように…それぞれの疾患内の異種性をより良く理解する必要性」を明らかにした。Winthrop, et al.,“The unmet need in rheumatology: Reports from the targeted therapies meeting 2017,” Clin. Immunol. pii: S1521-6616(17)30543-0, Aug. 12, 2017を参照。同様に、抗TNF治療によるクローン病の治療に関する多くの文献では、反応率が不安定で、どの患者に効果があるのか予測できないことが一貫して嘆かれている。例えば、M.T. Abreu,“Anti-TNF Failures in Crohn’s Disease,” Gastroenterol Hepatol (N.Y.), 7(1):37-39 (Jan. 2011)を参照。さらに、Ding et al.,“Systematic review: predicting and optimising response to anti-TNF therapy in Crohn’s disease-algorithm for practical management,” Aliment Pharmacol. Ther., 43(1):30-51 (Jan. 2016) (reporting that “[p]rimary nonresponse to anti-TNF treatment affects 13-40% of patients.”).を参照。
【0015】
したがって、現在、抗TNF治療が実施されている患者の相当数は、この治療から利益を得られないばかりか、害を受ける可能性さえある。抗TNF治療に伴う既知の重篤な感染症および悪性腫瘍のリスクは非常に深刻であるため、製品の承認には通常、いわゆる「ブラックボックス警告」をラベルに記載することが要求されている。このような治療のその他の潜在的な副作用としては、例えば、うっ血性心不全、脱髄疾患、およびその他の全身性の副作用が挙げられる。さらに、患者が抗TNF治療に反応しない(すなわち、抗TNF治療に対するノンレスポンダーである)と同定される前に数週間から数ヶ月の治療を必要とすることを考えると、レスポンダー対ノンレスポンダーの対象を識別できない現状の結果、そうした患者の適切な治療が著しく遅れる可能性がある。例えば、Roda et al.,“Loss of Response to Anti-TNFs: Definition, Epidemiology, and Management,” Clin. Tranl. Gastroenterol., 7(1):e135 (Jan. 2016) (citing Hanauer et al., “ACCENT I Study group. Maintenance Infliximab for Crohn’s disease: the ACCENT I randomized trial,” Lancet 59:1541-1549 (2002); Sands et al., “Infliximab maintenance therapy for fistulizing Crohn’s disease,”N. Engl. J. Med. 350:876-885 (2004))を参照。
【0016】
したがって、いくつかの実施形態では、本開示は、抗TNF治療で対象を処置する方法を提供し、上記方法は、抗TNF治療を受けた反応性および非反応性の先行対象を区別するために確立された分類子を介して、反応性であると決定された対象に、抗TNF治療を投与する工程を含み、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、ならびに、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNPs)の存在、あるいは、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つを評価することによって開発される。
【0017】
いくつかの実施形態では、本開示は、炎症性の疾患、障害、または疾病を処置する方法を提供し、上記方法は、少なくとも170人の対象の集団にわたって少なくとも90%の精度で対象の反応性を予測するように決定された分類子を適用することによって、反応性であると分類された対象に抗TNF治療を投与する工程を含む。
【0018】
いくつかの実施形態では、本開示は、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法を提供し、上記方法は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析する工程と、配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、1つ以上のSNPを分類子に含める工程と、を含む。
【0019】
いくつかの実施形態では、本開示は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析することによって、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法において、配列データから1つ以上の一塩基多型(SNP)の存在を評価すること、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定すること、1つ以上のSNPを分類子に含めることを含む改善を提供する。
【0020】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象を処置する方法を提供し、上記方法は、抗TNF治療を受けたコホート内の反応性および非反応性の先行対象を区別するために確立された分類子を介して、反応性であると決定された対象に、抗TNF治療を投与する工程を含み、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子と、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、あるいは、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つを評価することによって開発され、分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される。
【0021】
いくつかの実施形態では、分類子は、少なくとも170人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する。いくつかの実施形態では、1つ以上の遺伝子は、ヒトインタラクトームマップ上にマッピングされたときのトポロジー特性によって特徴付けられる。いくつかの実施形態では、SNPは、ヒトゲノムに関連して同定される。いくつかの実施形態では、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、1つ以上のSNPの存在、および、少なくとも1つの臨床的特徴のそれぞれを評価することによって開発される。
【0022】
いくつかの実施形態では、1つ以上の遺伝子は以下から選択される。
【0023】
【0024】
いくつかの実施形態では、少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される。いくつかの実施形態では、分類子は、少なくとも90%の精度で、非反応性である集団内の少なくとも40%の対象を識別し、ここで、集団は少なくとも170人の対象を含む。
【0025】
いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル(cirtolizumab pegol)、ゴリルマ(ゴリルマ)、またはそれらのバイオシミラーを投与することを含む。いくつかの実施形態では、疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される。いくつかの実施形態では、分類子は、反応性および非反応性の先行対象に由来するマイクロアレイ分析を用いて確立される。いくつかの実施形態では、分類子は、独立したコホートに由来するRNAseqデータを使用して検証される。いくつかの実施形態では、SNPは表5から選択される。
【0026】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象に治療を投与する方法を提供し、上記方法は、抗TNF治療を受けたコホート内の反応性と非反応性の先行対象を区別するために確立された分類子を介して、反応性または非反応性に分類された対象に上記治療を投与する工程と、対象が分類子によって反応性であると分類された場合に、抗TNF治療を投与する工程と、対象が分類子によって非反応性であると分類された場合に、抗TNF治療の代替物を投与する工程とを含み、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つを評価することによって開発され、分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される。
【0027】
いくつかの実施形態では、分類子は、少なくとも170人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、1つ以上のSNPの存在、および、少なくとも1つの臨床的特徴のそれぞれを評価することによって開発される。
【0028】
いくつかの実施形態では、少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される。いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーを投与することを含む。
【0029】
いくつかの実施形態では、抗TNF治療の代替物は、リツキシマブ、サリルマブ、クエン酸トファシチニブ、レフノミド、ベドリズマブ、トシリズマブ、アナキン、およびアバタセプトから選択される。
【0030】
いくつかの実施形態では、疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される。
【0031】
いくつかの実施形態では、本開示は、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法を提供し、上記方法は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析する工程と、配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、1つ以上のSNPを分類子に含める工程と、を含む。
【0032】
いくつかの実施形態では、本開示は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析することによって、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法において、配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、1つ以上のSNPを分類子に含める工程と、を含む改善を提供する。
【0033】
いくつかの実施形態では、1つ以上の治療属性は、特定の疾患、障害、または疾病を発症するリスク、特定の疾患、障害、または疾病に対する特定のアウトカムの可能性、特定の治療に対する反応の可能性からなる群から選択される。いくつかの実施形態では、1つ以上の治療属性は、特定の治療に対する反応の可能性である。いくつかの実施形態では、特定の治療は抗TNF治療である。いくつかの実施形態では、1つ以上のSNPの存在を評価する工程は、RNAの配列データを参照ヒトゲノムと比較することを含んでいる。
【0034】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象を処置する方法を提供し、上記方法は、(a)コンピューティングデバイスのプロセッサによって、対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、ここで、遺伝子は表1から選択される、工程と、(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対して反応性または非反応性であるとして対象の分類を自動的に決定する工程と、任意選択で、(c)対象が抗TNF治療に非反応性であると分類される場合、自己免疫疾患の処置のために抗TNF治療の代替物を対象に投与する工程、または、対象が抗TNF治療に反応性であると分類される場合、抗TNF治療を投与する工程と、を含む。
【0035】
いくつかの実施形態では、工程(a)のプロセッサは、1つ以上の臨床的特徴、または1つ以上の一塩基多型(SNP)の少なくとも1つに対応するデータをさらに受信する。
【0036】
いくつかの実施形態では、1つ以上の臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される。いくつかの実施形態では、自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎から選択される。いくつかの実施形態では、自己免疫疾患は、関節リウマチまたは潰瘍性大腸炎である。
【0037】
いくつかの実施形態では、抗TNF治療の代替物は、リツキシマブ、サリルマブ、クエン酸トファシチニブ、レフノミド、ベドリズマブ、トシリズマブ、アナキン、およびアバタセプトから選択される。いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーから選択される。
【0038】
いくつかの実施形態では、工程(b)は、機械学習モデルを用いて前記分類を自動的に決定することを含む。いくつかの実施形態では、機械学習モデルは、ランダムフォレストモデルである。
【0039】
いくつかの実施形態では、工程(b)は、臨床共変動分類子(CC)を使用することなく前記分類を自動的に決定することを含む。いくつかの実施形態では、工程(b)は、組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む。いくつかの実施形態では、工程(b)は、臨床共変動分類子(CC)を使用することなく、かつ組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む。
【0040】
いくつかの実施形態では、本開示は、(a)コンピューティングデバイスのプロセッサによって、自己免疫疾患(例えば、関節リウマチ)に苦しんでいる対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11の全てのメンバー)を含む、工程と、(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対して非反応性であるとして対象の分類を自動的に決定する工程と、および、任意選択で、(c)疾患の処置のために、対象に第2の治療(例えば、第1の治療の代替物、例えば、抗TNF治療の代替物)を処方および/または投与する工程であって、それによって、対象への第1の治療の処方および/または投与を回避する、工程とを含む。
【0041】
いくつかの実施形態では、本開示は、(a)コンピューティングデバイスのプロセッサによって、疾患(例えば、自己免疫疾患、例えば、関節リウマチ)に苦しんでいる対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11の全てのメンバー)を含む、工程と、(b)プロセッサによって、工程(a)で受信したデータを使用して、第1の治療(例えば、抗TNF治療)に対して反応性であるとして対象の分類を自動的に決定する工程と、および、任意選択で、(c)疾患の治療のために、対象に第1の治療を処方および/または投与する工程と、を含む方法を提供する。
【0042】
いくつかの実施形態では、工程(b)は、機械学習モデル(例えば、ランダムフォレストモデル)を用いて、前記分類を自動的に決定することを含む。いくつかの実施形態では、工程(b)は、臨床共変動分類子(CC)を使用することなく、かつ組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む。
【0043】
いくつかの実施形態では、本開示は、対象のゲノムデータ(例えば、次世代RNA-seqデータ)の解析のための(例えば、および、前記ゲノムデータに基づいて前記対象の分類を決定するための)パイプライン(例えば、コンピュータアーキテクチャパイプライン)を提供し、前記パイプラインは複数のモジュールを含み、各モジュールは、前記モジュールの更新後に独立して検証されることができる。
【0044】
いくつかの実施形態では、前記複数のモジュールは、1つ以上の機械学習モデルを含む。
【0045】
いくつかの実施形態では、前記複数のモジュールは、1つ以上の既知のバイオインフォマティクスモジュール(例えば、RSEMおよび/またはSTAR)ならびに1つ以上の独自の分類モジュールを含む。
【0046】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法を提供し、上記方法は、(a)コンピューティングデバイスのプロセッサによって、以下からなる群から選択される1つ以上の遺伝子のそれぞれの前記対象に対する発現レベルに対応するデータを受信する工程と、
【0047】
【表2】
(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対して反応性または非反応性であるとして対象の分類を自動的に決定する工程と、を含む。
【0048】
いくつかの実施形態では、自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法はさらに、(c)対象が抗TNF治療に非反応性であると工程(b)で分類される場合に、自己免疫疾患の処置のために抗TNF治療の代替物を対象に処方および/または投与する工程、または、対象が抗TNF治療に反応性であると工程(b)で分類される場合に、抗TNF治療を対象に投与する工程と、を含む。
【0049】
いくつかの実施形態では、工程(a)のプロセッサは、(i)対象の1つ以上の臨床的特徴、および、(ii)対象の1つ以上の一塩基多型(SNP)の少なくとも1つに対応するデータをさらに受信する。
【0050】
いくつかの実施形態では、工程(a)のプロセッサは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを受信する。
【0051】
いくつかの実施形態では、工程(a)のプロセッサは、表5に記載される1つ以上のSNPに対応するデータを受信する。
【0052】
いくつかの実施形態では、自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎からなる群から選択されるメンバーである。いくつかの実施形態では、自己免疫疾患は、関節リウマチまたは潰瘍性大腸炎である。
【0053】
いくつかの実施形態では、抗TNF治療の代替物は、リツキシマブ、サリルマブ、クエン酸トファシチニブ、レフノミド、ベドリズマブ、トシリズマブ、アナキン、およびアバタセプトからなる群から選択される少なくとも1つのメンバーを含む。
【0054】
いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、または前述のもののいずれかのバイオシミラーからなる群から選択される少なくとも1つのメンバーを含む。
【0055】
いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、および前述のもののいずれかのバイオシミラーからなる群の任意のメンバーを含まない。
【0056】
いくつかの実施形態では、工程(b)は、機械学習モデルを用いて前記分類を自動的に決定することを含む。いくつかの実施形態では、機械学習モデルは、ランダムフォレストモデルである。
【0057】
いくつかの実施形態では、工程(b)は、臨床共変動分類子(CC)を使用することなく前記分類を自動的に決定することを含む。いくつかの実施形態では、工程(b)は、組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む。いくつかの実施形態では、工程(b)は、臨床共変動分類子(CC)を使用することなく、かつ組み合わされたゲノム-臨床分類子(GCC)を使用することなく、前記分類を自動的に決定することを含む。
【0058】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法を提供し、上記方法は、(a)コンピューティングデバイスのプロセッサによって、自己免疫疾患に苦しんでいる対象の1つ以上の遺伝子のそれぞれの発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子が、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバーを含む、工程と、(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いとして対象の分類を自動的に決定する工程と、を含む。
【0059】
いくつかの実施形態では、自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法はさらに、(c)対象が抗TNF治療に非反応性であると工程(b)で分類される場合に、自己免疫疾患の処置のために抗TNF治療の代替物を対象に処方および/または投与する工程、または、対象が抗TNF治療に反応性であると工程(b)で分類される場合に、抗TNF治療を対象に投与する工程と、を含む。
【0060】
いくつかの実施形態では、自己免疫疾患は関節リウマチである。
【0061】
いくつかの実施形態では、工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも2つの遺伝子のそれぞれの発現レベルに対応するデータを受信することを含む。
【0062】
いくつかの実施形態では、工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも3つの遺伝子のそれぞれの発現レベルに対応するデータを受信することを含む。
【0063】
いくつかの実施形態では、工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも5つの遺伝子のそれぞれの発現レベルに対応するデータを受信することを含む。
【0064】
いくつかの実施形態では、工程(a)のプロセッサは、(i)対象の1つ以上の臨床的特徴、および、(ii)対象の1つ以上の一塩基多型(SNP)の少なくとも1つに対応するデータをさらに受信する。
【0065】
いくつかの実施形態では、工程(a)のプロセッサは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを受信する。
【0066】
いくつかの実施形態では、工程(a)のプロセッサは、表5に記載される1つ以上のSNPに対応するデータを受信する。
【0067】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類するためのシステムを提供し、上記システムは、プロセッサと、内部に命令を有するメモリとを含み、上記命令は、プロセッサによって実行されるときに、プロセッサに、(a)以下からなる群から選択される1つ以上の遺伝子のそれぞれの前記対象に対する発現レベルを含むデータのセットを受信させ、
【0068】
【表3】
および、(b)データのセットを用いて、抗TNF治療に反応性または非反応性であるとして対象の分類を自動的に決定させる。
【0069】
いくつかの実施形態では、データのセットは、(i)対象の1つ以上の臨床的特徴、および、(ii)対象の1つ以上の一塩基多型(SNP)の少なくとも1つに対応するデータをさらに含む。
【0070】
いくつかの実施形態では、データのセットは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを含む。
【0071】
いくつかの実施形態では、データのセットは表5に記載される1つ以上のSNPを含む。
【0072】
いくつかの実施形態では、自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎からなる群から選択されるメンバーである。いくつかの実施形態では、自己免疫疾患は、関節リウマチまたは潰瘍性大腸炎である。いくつかの実施形態では、自己免疫疾患は、関節リウマチである。
【0073】
定義
投与:本明細書で使用されるように、「投与」という用語は、典型的には、例えば、組成物である、または組成物に含まれる、または組成物によって他の方法で送達される、薬剤の送達を達成するための、対象または系への組成物の投与を意味する。
【0074】
薬剤:本明細書で使用されるように、「薬剤」という用語は、実体(例えば、脂質、金属、核酸、ポリペプチド、多糖類、低分子など、またはそれらの複合体、組み合わせ、混合物、あるいは系[例えば、細胞、組織、生物])、または現象(例えば、熱、電流または電場、磁力または磁場など)を指す。
【0075】
アミノ酸:本明細書で使用されるように、「アミノ酸」という用語は、例えば、1つ以上のペプチド結合の形成を通じて、ポリペプチド鎖に組み込むことができる任意の化合物および/または物質を指す。いくつかの実施形態では、アミノ酸は、一般構造H2N-C(H)(R)-COOHを有する。いくつかの実施形態では、アミノ酸は、自然発生のアミノ酸である。いくつかの実施形態では、アミノ酸は、非天然アミノ酸である。いくつかの実施形態では、アミノ酸は、D-アミノ酸である。いくつかの実施形態では、アミノ酸は、L-アミノ酸である。本明細書で使用されるように、「標準アミノ酸」という用語は、自然発生ペプチドに一般的に見られる20種のL-アミノ酸のいずれかを指す。「非標準アミノ酸」とは、それが天然供給源に存在するか、または見ることができるかどうかに関係なく、標準アミノ酸以外の任意のアミノ酸を指す。いくつかの実施形態では、ポリペプチド中のカルボキシ末端アミノ酸および/またはアミノ末端アミノ酸を含むアミノ酸は、上記の一般構造と比較して、構造修飾を含むことができる。例えば、いくつかの実施形態では、アミノ酸は、一般構造と比較して、メチル化、アミド化、アセチル化、ペグ化、グリコシル化、リン酸化、および/または置換(例えば、アミノ基、カルボン酸基、1つ以上のプロトン、および/または水酸基の)により修飾されていてもよい。いくつかの実施形態では、そのような修飾は、例えば、他の同一の非修飾アミノ酸を含むものと比較して、修飾アミノ酸を含むポリペプチドの安定性または循環半減期を変化させることができる。いくつかの実施形態では、そのような修飾は、他の同一の非修飾アミノ酸を含むものと比較して、修飾アミノ酸を含むポリペプチドの関連する活性を有意に変化させない。文脈から明らかなように、いくつかの実施形態では、「アミノ酸」という用語は、遊離アミノ酸を指すために使用されてもよく、いくつかの実施形態では、それは、ポリペプチドのアミノ酸残基、例えば、ポリペプチド内のアミノ酸残基を指すために使用されてもよい。
【0076】
アナログ:本明細書で使用されるように、「アナログ」という用語は、参照物質と1つ以上の特定の構造的特徴、要素、成分、または部分を共有する物質を意味する。典型的には、「アナログ」は、例えば、コアまたはコンセンサス構造を共有する参照物質と著しい構造的類似性を示すが、特定の離散的な方法においても異なる。いくつかの実施形態では、アナログは、例えば、参照物質の化学的操作によって、参照物質から生成することができる物質である。いくつかの実施形態では、アナログは、参照物質を生成する合成プロセスと実質的に類似する(例えば、複数の工程を共有する)合成プロセスの実行を介して、生成することができる物質である。いくつかの実施形態では、アナログは、参照物質を生成するために使用される合成プロセスとは異なる合成プロセスの実行を介して、生成されるか、または生成することができる。
【0077】
アンタゴニスト:本明細書で使用されるように、「アンタゴニスト」という用語は、その存在、レベル、程度、タイプ、または形態が、標的のレベルまたは活性の低下に関連付けられる薬剤または状態を指すことができる。アンタゴニストは、例えば、低分子、ポリペプチド、核酸、炭水化物、脂質、金属、および/または関連する阻害活性を示す任意の他の実体を含む任意の化学クラスの薬剤を含むことができる。いくつかの実施形態では、アンタゴニストは、その標的に直接結合するという意味で、「直接アンタゴニスト」であってよく、いくつかの実施形態では、アンタゴニストは、その標的に直接結合する以外の手段によって、例えば、標的のレベルまたは活性が変化するように、標的の制御因子と相互作用することによって、その影響を及ぼすという点で、「間接的アンタゴニスト」であってもよい。いくつかの実施形態では、「アンタゴニスト」は「阻害剤」と呼ばれることがある。
【0078】
抗体:本明細書で使用されるように、「抗体」という用語は、特定の標的抗原に対する特異的な結合をもたらすのに十分な正規の免疫グロブリン配列要素を含むポリペプチドを指す。当該技術分野で知られているように、自然界で産生されるインタクトな抗体は、「Y字」構造と一般に呼ばれるものに互いに会合している、2つの同一の重鎖ポリペプチド(それぞれ約50kD)と2つの同一の軽鎖ポリペプチド(それぞれ約25kD)で構成される約150kDの4量体である。それぞれの重鎖は、少なくとも4つのドメイン(それぞれ約110アミノ酸長)-アミノ末端可変(VH)ドメイン(Y字構造の先端に位置する)と、付随する3つの定常ドメイン、CH1、CH2、およびカルボキシ末端のCH3(Y字の基部の底部に位置する)とで構成される。「スイッチ」と呼ばれる短い領域は、重鎖可変領域と定常領域を接続している。「ヒンジ」はCH2およびCH3ドメインと抗体の残りの部分を接続する。このヒンジ領域の2つのジスルフィド結合は、インタクトな抗体において2つの重鎖ポリペプチドを互いに接続させる。それぞれの軽鎖は、2つのドメイン-アミノ末端可変(VL)ドメインと、それに付随する、別の「スイッチ」によって互いに隔てられたカルボキシ末端定常(CL)ドメインとで構成される。インタクトな抗体の四量体は、重鎖と軽鎖が1つのジスルフィド結合によって互いに結合している2つの重鎖-軽鎖二量体で構成され、2つの別のジスルフィド結合が重鎖ヒンジ領域を接続させ、その結果、二量体は互いに連結され、四量体が形成される。自然産生抗体も、典型的にはCH2ドメイン上でグリコシル化されている。天然抗体の各ドメインは、圧縮された逆平行βバレルで互いに対して詰め込まれた2つのβシート(例えば、3本鎖、4本鎖、または5本鎖のシート)から形成された「免疫グロブリンフォールド」によって特徴づけられる構造を有する。各可変ドメインは、「補体決定領域」(CDR1、CDR2、およびCDR3)として知られる3つの超可変ループと、4つのある程度不変の「フレームワーク」領域(FR1、FR2、FR3、およびFR4)を含んでいる。天然抗体が折り畳まれるとき、FR領域はドメインの構造的フレームワークを提供するβシートを形成し、重鎖と軽鎖の両方のCDRループ領域は3次元空間で一緒になり、Y構造の先端に位置する単一の超可変抗原結合部位を形成する。自然発生抗体のFc領域は補体系の要素に結合し、例えば、細胞傷害を媒介するエフェクター細胞を含むエフェクター細胞上の受容体にも結合する。当該技術分野で知られているように、Fc領域のFc受容体に対する親和性および/または他の結合属性は、グリコシル化または他の修飾によって調節され得る。いくつかの実施形態では、本発明に従って産生および/または利用される抗体としては、修飾または操作されたそのようなグリコシル化を有するFcドメインを含む、グリコシル化Fcドメインが挙げられる。本発明の目的のために、特定の実施形態では、天然抗体に見られるような十分な免疫グロブリンドメイン配列を含む任意のポリペプチドまたはポリペプチド複合体は、そのようなポリペプチドが天然産生であるか(例えば、抗原に反応する生物によって生成される)、または組換え工学、化学合成、あるいは他の人工システムもしくは方法によって生成されるかどうかにかかわらず、「抗体」と呼ばれ、および/または「抗体」として使用され得る。いくつかの実施形態では、抗体はポリクローナルである。いくつかの実施形態では、抗体はモノクローナルである。いくつかの実施形態では、抗体は、マウス、ウサギ、霊長類、またはヒトの抗体に特徴的な定常領域配列を有する。いくつかの実施形態では、抗体配列要素は、当該技術分野で知られているように、ヒト化、霊長類化、キメラなどである。さらに、本明細書で使用されるような「抗体」という用語は、適切な実施形態では、(他に記載がないか、文脈から明らかでない限り)代替提示における抗体構造的および機能的な特徴を利用するための当該技術分野で公知の、または開発された構築物またはフォーマットのいずれかを指すことができる。例えば、実施形態では、本発明に従って利用される抗体は、限定されないが、インタクトなIgA、IgG、IgE、またはIgM抗体;二重特異性または多重特異性抗体(例えば、Zybodies(登録商標)など);抗体フラグメント、例えば、Fabフラグメント、Fab’フラグメント、F(ab’)2フラグメント、Fd’フラグメント、Fdフラグメント、および単離CDRまたはそれらのセット;単鎖Fvs;ポリペプチド-Fc融合体;単一ドメイン抗体(例えば、IgNARまたはそのフラグメントなどのサメ単一ドメイン抗体);カメレオン抗体;マスク抗体(例えば、Probodies(登録商標);小モジュール免疫医薬品(「SMIPs(商標)」);単鎖またはタンデムジアボディ(TandAb(登録商標);VHH;アンチカリン(Anticalins(登録商標));ナノボディ(Nanobodies(登録商標))ミニボディ;BiTE(登録商標);アンキリンリピートタンパク質またはDARPINs(登録商標);Avimers(登録商標);DART;TCR様抗体;、Adnectins(登録商標);アフィリン(Affilins(登録商標));トランス-ボディ(Trans-bodies(登録商標));アフィボディ(Affibodies(登録商標));トリマー(Trimer)X(登録商標);マイクロプロテイン;Fynomers(登録商標)、Centyrins(登録商標);および、KALBITOR(登録商標)sから選択されるフォーマットである。いくつかの実施形態では、抗体は、天然に産生される場合に有するであろう共有結合修飾(例えば、糖鎖の結合)を欠くこともある。いくつかの実施形態では、抗体は、共有結合修飾(例えば、糖鎖、ペイロード[例えば、検出可能な部分、治療的部分、触媒的部分など]、または他のペンダント基[例えば、ポリ-エチレングリコールなど]の結合)を含んでもよい。
【0079】
関連付けられる:2つの事象または実体は、一方の存在、レベル、程度、タイプ、および/または形態が他方のそれと相関する場合、この用語が本明細書で用いられるように、互いに「関連付けられる」。例えば、特定の実体(例えば、ポリペプチド、遺伝的シグネチャー、代謝物、微生物など)は、その存在、レベル、および/または形態が、(例えば、関連集団にわたって)特定の疾患、障害、または疾病の発生率および/または感受性と相関する場合、その疾患、障害、または疾病に関連付けられると考えられる。いくつかの実施形態では、2つ以上の実体は、それらが互いに物理的に近接し、および/または、近接したままとなるように、直接的または間接的に相互作用する場合、互いに物理的に「関連付け」られる。いくつかの実施形態では、互いに物理的に関連付けられた2つ以上の実体は、互いに共有結合しており、いくつかの実施形態では、互いに物理的に関連付けられる2つ以上の実体は、互いに共有結合していないが、例えば、水素結合、ファンデルワールス相互作用、疎水性相互作用、磁性、およびそれらの組み合わせによって非共有結合的に関連付けられる。
【0080】
生体サンプル:本明細書で使用されるように、「生体サンプル」という用語は、典型的には、本明細書に記載されるように、関心の生体源(例えば、組織または生物または細胞培養物)から得られた/に由来するサンプルを指す。いくつかの実施形態では、関心の源は、動物またはヒトなどの生物を含んでいる。いくつかの実施形態では、生体サンプルは、生物学的組織または流体であるか、または生物学的組織または流体を含む。いくつかの実施形態では、生体サンプルは、骨髄、血液、血液細胞、腹水、組織または細針生検サンプル、細胞含有体液、遊離浮遊核酸、痰、唾液、尿、脳脊髄液、腹腔液、胸水、糞便、リンパ液、婦人科液、皮膚スワブ、膣スワブ、経口スワブ、鼻腔スワブ、洗液または洗浄液、例えば、管洗浄液または気管支肺胞洗浄液、吸引液、擦過物、骨髄検体、組織生検材料、手術検体、糞便、他の体液、分泌物、および/または排泄物、および/またはその細胞であってもよく、あるいは、これらを含んでもよい。いくつかの実施形態では、生体サンプルは、個体から得られた細胞であるか、または上記細胞を含む。いくつかの実施形態では、得られた細胞は、上記サンプルが得られた個体からの細胞であるか、または上記細胞を含む。いくつかの実施形態では、サンプルは、任意の適切な手段によって関心の源から直接得られた「一次サンプル」である。例えば、いくつかの実施形態では、一次生体サンプルは、生検(例えば、細針吸引または組織生検)、手術、体液(例えば、血液、リンパ液、糞便等)の採取などからなる群から選択される方法によって得られる。いくつかの実施形態では、文脈から明らかなように、「サンプル」という用語は、一次サンプルを処理することによって(例えば、1つ以上の成分の除去および/または1つ以上の薬剤の添加によって)得られる調製物を指す。例えば、半透膜を用いた濾過である。このような「処理されたサンプル」は、例えば、サンプルから抽出された、あるいは一次サンプルをmRNAの増幅または逆転写、特定の成分の単離、および/または精製などの技術に供することによって得られた、核酸またはタンパク質を含んでもよい。
【0081】
併用療法:本明細書で使用する場合、「併用療法」という用語は、対象が2つ以上の治療レジメン(例えば、2つ以上の治療薬)に同時に曝露される臨床介入を指す。いくつかの実施形態では、2つ以上の治療レジメンは同時に施されてもよい。いくつかの実施形態では、2つ以上の治療レジメンは、順次施されてもよい(例えば、第2のレジメンの任意の用量の投与前に第1のレジメンが投与される)。いくつかの実施形態では、2つ以上の治療レジメンは、重複する投薬レジメンで施される。いくつかの実施形態では、併用療法の投与は、他の薬剤またはモダリティを受ける対象への1つ以上の治療薬またはモダリティの投与を含むことができる。いくつかの実施形態では、併用療法は、必ずしも個々の薬剤が単一の組成物において一緒に投与されること(または、必ずしも同時に投与されること)を必要としない。いくつかの実施形態では、併用療法の2つ以上の治療薬またはモダリティは、例えば、別々の組成物において、別々の投与経路(例えば、1つの薬剤は経口的に、別の薬剤は静脈内に)、および/または異なる時点で、対象に別々に投与される。いくつかの実施形態では、2つ以上の治療薬は、組み合わせ組成物中で、または組み合わせ化合物中でさえ(例えば、単一の化学複合体または共有結合実体の一部として)、同じ投与経路を介して、および/または同時に投与され得る。
【0082】
比較可能:本明細書で使用されるように、「比較可能」という用語は、互いに同一ではないかもしれないが、当業者が、観察された差異または類似性に基づいて合理的に結論を導き出すことができると理解するように、比較を可能にするほどに十分類似している2つ以上の薬剤、実体、状況、条件のセットなどを指す。いくつかの実施形態では、条件、状況、個体、または集団の比較可能なセットは、複数の実質的に同一の特徴および1つまたは少数の変化した特徴によって特徴付けられる。当業者であれば、2つ以上のそのような薬剤、実体、状況、条件のセットなどが比較可能であるとみなされるために、任意の状況においてどの程度の同一性が必要であるかを、文脈上理解することができる。例えば、当業者であれば、状況、個体、または集団の異なるセットの下で、またはそれらと共に得られた結果または観察された現象の違いは、変化したそれらの特徴の変動に起因するかまたはそれを示しているという妥当な結論を保証するのに十分な数および種類の実質的に同一の特徴によって特徴づけられるとき、状況、個体、または集団のセットは互いに比較可能であると理解する。
【0083】
~に対応する:本明細書で使用されるように、「~に対応する」という表現は、「対応する」属性が明らかになるように、合理的に比較できるほどの十分な特徴を共有する2つの実体、事象、または現象間の関係を指す。例えば、いくつかの実施形態では、この用語は、適切な参照化合物または組成物との比較を通じて、化合物または組成物中の構造要素の位置および/または同一性を指定するために、化合物または組成物を参照して使用され得る。例えば、いくつかの実施形態では、ポリマー中の単量体残基(例えば、ポリペプチド中のアミノ酸残基またはポリヌクレオチド中の核酸残基)は、適切な参照ポリマー中の残基に「対応する」ものとして同定されてもよい。例えば、当業者は、単純化のために、ポリペプチド中の残基は、しばしば、参照関連ポリペプチドに基づく正準番号付けシステムを用いて指定され、そのため、例えば、190位置の残基に「対応する」アミノ酸は、実際には特定のアミノ酸鎖の190番目のアミノ酸でなくてもよく、むしろ参照ポリペプチド中の190位置で見られる残基に対応することを理解し、当業者であれば、「対応する」アミノ酸を同定する方法を容易に理解することができる。例えば、当業者は、例えば、本開示に従って、ポリペプチドおよび/または核酸中の「対応」残基を同定するために利用することができる、ソフトウエアプログラム、例えば、BLAST、CS-BLAST、CUSASW++、DIAMOND、FASTA、GGSEARCH/GLSEARCH、Genoogle、HMMER、HHpred/HHsearch、IDF、Infernal、KLAST、USEARCH、parasail、PSI-BLAST、PSI-Search、ScalaBLAST、Sequilab、SAM、SSEARCH、SWAPHI、SWAPHI-LS、SWIMM、またはSWIPEなどを含む様々な配列アライメント戦略を知っていることであろう。
【0084】
投薬レジメン:本明細書で使用する場合、「投薬レジメン」という用語は、通常、一定期間ごとに分けられて、対象に個別に投与される単位用量の(通常、1を超える)セットを指す。いくつかの実施形態では、所定の治療薬は、1つ以上の用量を含むことができる推奨される投薬レジメンを有する。いくつかの実施形態では、投薬レジメンは、それぞれが他の用量から時間的に分けられた、複数の用量を含む。いくつかの実施形態では、個々の用量は、同じ長さの時間によって互いに分けられており、いくつかの実施形態では、投薬レジメンは、複数の用量と、個々の用量をわける少なくとも2つの異なる期間とを含む。いくつかの実施形態では、投薬レジメン内の全ての用量は、同じ単位投与量である。いくつかの実施形態では、投薬レジメン内の異なる用量は、異なる量である。いくつかの実施形態では、投薬レジメンは、第1投与量の第1用量と、その後の、第1投与量とは異なる第2の投与量の1つ以上の追加の用量とを含む。いくつかの実施形態では、投薬レジメンは、第1の投与量の第1の用量と、その後の第1の投与量と同じ第2の投与量の1つ以上の追加の用量とを含む。いくつかの実施形態では、投薬レジメンは、関連する集団にわたって投与された場合に、所望のまたは有益なアウトカムと相関する(すなわち、治療用投薬レジメンである)。
【0085】
改善した、増加した、または減少した:本明細書で使用されるように、「改善した」、「増加した」、または「減少した」という用語、あるいは文法的に比較可能なその比較用語は、比較可能な参照測定値に対する相対的な値を示す。例えば、いくつかの実施形態では、関心の薬剤で達成された評価値は、比較可能な参照薬剤で得られた評価値と比較して「改善」される場合がある。代替的にまたは追加的に、いくつかの実施形態では、関心の対象またはシステムにおいて達成された評価値は、異なる条件下(例えば、関心の薬剤の投与などのイベントの前または後)で同じ対象またはシステムにおいて、あるいは異なる比較可能な対象において(例えば、関心の特定の疾患、障害、または疾病の1つ以上の指標の存在下において、あるいはある条件または薬剤への事前の曝露において、関心の対象またはシステムとは異なる比較可能な対象またはシステムにおいて)得られたものに対して「改善」されてもよい。
【0086】
医薬組成物:本明細書で使用されるように、「医薬組成物」という用語は、1つ以上の薬学的に許容可能な担体とともに製剤化された活性薬剤を指す。いくつかの実施形態では、活性薬剤は、関連する対象への治療レジメンにおける投与に適切な単位投与量(例えば、投与した場合に所定の治療効果を達成する統計的に有意な確率を示すことが実証されている量)において、または異なる比較可能な対象(例えば、関心の特定の疾患、障害、または疾病の1つ以上の指標の存在下において、あるいはある条件または薬剤への事前の曝露において、関心の対象またはシステムとは異なる比較可能な対象またはシステムにおいて)において存在する。いくつかの実施形態では、比較用語は、統計的に関連する差異(例えば、統計的関連性を達成するのに十分な有病率および/または大きさであること)を指す。当業者であれば、所定の文脈において、そのような統計的有意性を達成するために必要または十分な差の程度および/または有病率を認識するか、または容易に決定することができるであろう。
【0087】
薬学的に許容可能な:本明細書で使用されるように、「薬学的に許容可能な」という句は、健全な医学的判断の範囲内で、過度の毒性、刺激、アレルギー反応、または他の問題あるいは合併症なく、人間と動物の組織との接触使用に適していて、合理的なベネフィット・リスク比と釣り合っている、こうした化合物、材料、組成物、および/または剤形を指す。
【0088】
参照:本明細書で使用されるように、「参照」という用語は、比較が行われる参照または対照を示す。例えば、いくつかの実施形態では、関心の薬剤、動物、個体、集団、サンプル、配列、または値は、参照または対照の薬剤、動物、個体、集団、サンプル、配列、または値と比較される。いくつかの実施形態では、参照または対照は、関心の試験または決定と実質的に同時に試験および/または決定される。いくつかの実施形態では、参照または対照は、歴史的な参照または対照であり、任意選択で有形の媒体で具現化される。典型的には、当業者に理解されるように、参照または対照は、評価中のものと同等の条件または状況下で決定されるか、または特徴付けられる。当業者は、特定の可能性のある参照または対照への依拠および/または比較を正当化するのに十分な類似性が存在するとき、それを理解するであろう。
【0089】
治療上有効な量:本明細書で使用されるように、「治療上有効な量」という用語は、治療レジメンの一部として投与されたときに、所望の生物学的反応を誘発する物質(例えば、治療薬、組成物、および/または製剤)の量を指す。いくつかの実施形態では、治療上有効な量の物質は、疾患、障害、および/または疾病に苦しんでいるまたは罹患しやすい対象に投与された場合に、疾患、障害、および/または疾病を処置し、診断し、予防し、および/または発症を遅らせるのに十分な量である。当業者に理解されるように、物質の有効な量は、所望の生物学的エンドポイント、送達される物質、標的細胞または組織などの因子によって変化し得る。例えば、疾患、障害、および/または疾病を処置するための製剤中の化合物の有効な量は、疾患、障害、および/または疾病の1つ以上の症状または特徴を緩和し、改善し、軽減し、阻害し、予防し、その発症を遅らせ、その重症度を低減し、および/またはその発生率を低下させる量である。いくつかの実施形態では、治療上有効な量は、単回用量で投与され、いくつかの実施形態では、治療上有効な量を送達するために、複数回単位用量が必要とされる。
【0090】
変異体:本明細書で使用されるように、「変異体」という用語は、参照実体と有意な構造的同一性を示すが、参照実体と比較して1つ以上の化学部分の存在またはレベルにおいて参照実体と構造的に異なる実体を指す。多くの実施形態では、変異体はその参照実体と機能的にも異なる。一般に、特定の実体が参照実体の「変異体」であると適切に考えられるかどうかは、参照実体との構造的同一性の程度に基づく。当業者に理解されるように、いかなる生物学的または化学的な参照実体も、ある特徴的な構造要素を有する。変異体とは、定義によれば、1つ以上のそのような特徴的な構造要素を共有する別個の化学的実体である。少し例を挙げると、低分子は特徴的なコア構造要素(例えば、大環状コア)および/または1つ以上の特徴的な張り出している(pendent)部分を有してもよく、その結果、低分子の変異体は、コア構造要素および特徴的な張り出している部分を共有するが、他の張り出している部分および/または存在する結合の種類(単対二重、E対Zなど)で異なるものであり、線状空間または三次元空間において互いに相対的に指定された位置を有し、および/または特定の生物学的機能に寄与する複数のアミノ酸で構成され、核酸は、線状空間または三次元空間において互いに相対的に指定された位置を有する複数のヌクレオチド残基で構成される特徴的な配列要素を有していてもよい。例えば、変異体ポリペプチドは、アミノ酸配列における1つ以上の差、および/またはポリペプチド骨格に共有結合した化学部分(例えば、炭水化物、脂質など)における1つ以上の差の結果として、参照ポリペプチドと異なってもよい。いくつかの実施形態では、変異体ポリペプチドは、少なくとも85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、または99%である参照ポリペプチドとの全体配列同一性を示す。代替的にまたは追加的に、いくつかの実施形態では、変異体ポリペプチドは、参照ポリペプチドと少なくとも1つの特徴的な配列要素を共有しない。いくつかの実施形態では、参照ポリペプチドは、1つ以上の生物学的活性を有する。いくつかの実施形態では、変異体ポリペプチドは、参照ポリペプチドの生物学的活性の1つ以上を共有する。いくつかの実施形態では、変異体ポリペプチドは、参照ポリペプチドの生物学的活性の1つ以上を欠く。いくつかの実施形態では、変異体ポリペプチドは、参照ポリペプチドと比較して、1つ以上の生物学的活性の減少したレベルを示す。多くの実施形態では、関心のポリペプチドは、関心のポリペプチドが、特定の位置における少数の配列変化を除いて親のものと同一であるアミノ酸配列を有する場合、親または参照ポリペプチドの「変異体」であると考えられる。典型的には、親と比較して、変異体中の残基の20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%未満が置換されている。いくつかの実施形態では、変異体は、親と比較して、10、9、8、7、6、5、4、3、2、または1個の置換された残基を有する。しばしば、変異体は、非常に少数(例えば、5、4、3、2、または1未満)の置換された機能的残基(すなわち、特定の生物学的活性に関与する残基)の数を有する。さらに、変異体は典型的には、親と比較して、5、4、3、2、または1以下の付加または欠失を有し、しばしば、付加または欠失を有しない。さらに、任意の付加または欠失は典型的には、約25、約20、約19、約18、約17、約16、約15、約14、約13、約10、約9、約8、約7、約6未満であり、一般的には、約5、約4、約3、または約2未満の残基である。いくつかの実施形態では、親ポリペプチドまたは参照ポリペプチドは、自然界に見られるものである。
【図面の簡単な説明】
【0091】
【
図1】対象を抗TNF治療に対するレスポンダーとして分類するための、特定の遺伝子の発現レベルの潜在的な相対的予測値を示すグラフである。
【
図2】(赤枠の)RNAseqバイオインフォマティクスパイプライン、および(青枠の)例示的な独自のアルゴリズム(例えば、この例では、PrismRAアルゴリズム)を組み込んだ例示的な実施形態の図である。
【
図3】分類(例えば、診断、特定の治療に対する反応性の特定、および他の用途)において使用するためのRNA-seqデータのモジュール処理のための例示的なパイプラインである。
【
図4】様々な実施形態で使用するための例示的なネットワーク環境およびコンピューティングデバイスである。は様々な実施形態において例ネットワーク環境および使用用コンピューティングデバイスである。
【
図5】
図5は、本開示で説明される技術を実装するために使用することができるコンピューティングデバイス(500)およびモバイルコンピューティングデバイス(550)の一例を示す。
【
図6A】特徴選択(n=75)、モデル訓練(n=185)、およびモデル検証(n=46)のために使用されるコホートのフローチャートである。
【
図6B】
図6Aのコホート1における特徴選択プロセスを説明するプロセスである。POCデータセットとは、
図6Aのコホート1データセットを指す。データの80%は、最も識別可能な遺伝子を特定するためにU-検定を用いて分類子を訓練するために用いられ、80%のデータは、10分割交差検証を用いて10のグループに分割され、最終決定された特徴セットを提供する。最終決定された特徴セットは、残りの20%のデータのモデル訓練と評価に使用される。このプロセスは少なくとも100回繰り返される。
【
図6C】コホート1に適用される特徴選択方法論のフローチャートである。
【
図7A】抗TNF治療に対するレスポンダーとノンレスポンダーを識別するAbcon Cohort(Affymetrix)における遺伝子の選択に関連する。
図7Aは、上位100で選択された特徴対交差検証のラウンド数のプロットである。
【
図7B】抗TNF治療に対するレスポンダーとノンレスポンダーを識別するAbcon Cohort(Affymetrix)における遺伝子の選択に関連する。
図7Bは、100ラウンドの交差検証を通して、集約して20%の保留された試験セットに対する平均曲線下面積(AUC)を示す受信者動作特性曲線である。
【
図7C】抗TNF治療に対するレスポンダーとノンレスポンダーを識別するAbcon Cohort(Affymetrix)における遺伝子の選択に関連する。
図7Cは、各ランダムフォレストモデルによって指示される、交差検証の100ラウンドを通した集約して20%の保留された試験セットサンプルの予測されたクラス確率を示す。
【
図7D】抗TNF治療に対するレスポンダーとノンレスポンダーを識別するAbcon Cohort(Affymetrix)における遺伝子の選択に関連する。
図7Dは、100ラウンドの交差検証のうち30ラウンドについて上位100にランク付けされた38遺伝子を考慮したときの、抗TNF治療に対するレスポンダー(赤)およびノンレスポンダー(黒)の主成分分析を示す。
【
図8A】エンドポイントおよび包含基準の最適化に関する。
図8Aは、血清陽性の患者と血清陽性でない患者の両方から構築されたモデルの曲線下面積の分布である。
【
図8B】エンドポイントおよび包含基準の最適化に関する。
図8Bは、RFおよびCCPについて血清陽性の患者のみから構築されたモデルの曲線下面積分布である。血清陽性のサンプルにおけるベースラインRNAseqデータは、男性および女性の患者の両方について、6ヶ月後のACR50アウトカムtを最もよく予測する。
【
図9A】代表的なモデルの性能に関する。男性と女性の血清陽性患者を考慮し、治療後6か月のACR50を臨床エンドポイントとして使用した場合に作成された中央値のAUCモデル。
図9Aは、10回繰り返された集約して10%の保留された交差検証の平均曲線下面積(AUC)を示す受信者動作特性曲線を示している。
【
図9B】代表的なモデルの性能に関する。男性と女性の血清陽性患者を考慮し、治療後6か月のACR50を臨床エンドポイントとして使用した場合に作成された中央値のAUCモデル。
図9Bは、10回繰り返された集約して10%の保留された交差検証についての陰性的中率対真の陰性率のプロットである。
【
図9C】代表的なモデルの性能に関する。男性と女性の血清陽性患者を考慮し、治療後6か月のACR50を臨床エンドポイントとして使用した場合に作成された中央値のAUCモデル。
図9Cは、ランダムフォレストモデルによって決定されるようなレスポンダーとノンレスポンダーとの間の集約された検証セットサンプルの予測確率のプロットである。
【
図9D】代表的なモデルの性能に関する。男性と女性の血清陽性患者を考慮し、治療後6か月のACR50を臨床エンドポイントとして使用した場合に作成された中央値のAUCモデル。
図9Dは、集約された検証セットサンプルの混同行列である。
【
図10A】共変量のみ、RNAのみ、共変量とRNAを使用した場合のモデル性能を例証する。
【
図11】10%交差検証の50回の繰り返しを通して上位15における遺伝子選択頻度のグラフである。
【
図12A】抗TNF治療に対する応答の予測のためのモデルの検証に関する。
図12Aは、検証セットサンプルについての曲線下面積(AUC)を示す受信者動作特性曲線を例証する。
【
図12B】抗TNF治療に対する応答の予測のためのモデルの検証に関する。
図12Bは、検証セットサンプルに対する陰性的中率対真の陰性率のプロットである。
【
図12C】抗TNF治療に対する応答の予測のためのモデルの検証に関する。
図12Cは、ランダムフォレストモデルによって決定される各検証セットサンプルに対する予測されたクラス確率のプロットである。
【
図12D】抗TNF治療に対する応答の予測のためのモデルの検証に関する。
図12Dは、抗TNF治療に対する反応の予測のためのモデルの検証に関連する混同行列である。
【
図13A】抗TNF治療に対する反応の予測のための、血清陽性患者のみ(n=23)の間でのモデルの検証に関する。
図13Aは、検証セットサンプルについての曲線下面積(AUC)を示す受信者動作特性曲線を例証する。
【
図13B】抗TNF治療に対する反応の予測のための、血清陽性患者のみ(n=23)の間でのモデルの検証に関する。
図13Bは、検証セットサンプルに対する陰性的中率対真の陰性率のプロットである。
【
図13C】抗TNF治療に対する反応の予測のための、血清陽性患者のみ(n=23)の間でのモデルの検証に関する。
図13Cは、ランダムフォレストモデルによって決定される各検証セットサンプルに対する予測されたクラス確率のプロットである。
【
図13D】抗TNF治療に対する反応の予測のための、血清陽性患者のみ(n=23)の間でのモデルの検証に関する。
図13Dは、抗TNF治療に対する反応の予測のための血清陽性患者のみ(n=23)の間でのモデルの検証に関連する混同行列である。
【
図14】分類子を開発するための例示的なワークフローである。
【
図15】2つの主要なグループ化、一方が優勢的なノンレスポンダーと他方がレスポンダーを示す38遺伝子のRNA発現データの階層的クラスター分析であり、それによって抗TNF反応予測に対するこれらの遺伝子の識別的性質を実証する。ヒートマップは、相対的なRNA発現レベルを任意の単位で表したものである。
【
図16A】ヒトインタラクトームタンパク質-タンパク質ネットワークのサブセットの可視化である。ネットワーク上に含まれるタンパク質は、灰色の円として示される。赤で輪郭を描かれたものはSNP含有RNAによってコードされるタンパク質を表し、青で輪郭を描かれたものは応答識別力のある遺伝子によってコードされるタンパク質を表す。
【
図16B】分子薬物標的、RAに関連付けられるタンパク質(疾患モジュールタンパク質)、PrismRA予測分類アルゴリズムの開発に含まれる全ての分子特徴、SNP含有RNA(SNPs)によってコードされるタンパク質、および識別力のある遺伝子(DG)によってコードされるタンパク質の近接性の定量分析である。最終的な予測分類アルゴリズムに含まれる分子的特徴は黄色である。
【
図17】選択されたSNPが少なくとも10人の患者において検出された訓練コホートにおけるレスポンダーとノンレスポンダーRA患者のパーセンテージを描写する一連の棒グラフである。
【
図18】RA疾患モジュール、RA薬物標的、および分類子特徴(SNPおよびDG)を含むヒトインタラクトームサブネットワークである。
【
図19】RAにおける抗TNF薬反応アルゴリズムの開発を説明するフローチャートである。抗TNF治療に対するレスポンダーとノンレスポンダーとを識別する遺伝子発現が、一般に利用可能なマイクロアレイデータセットから選択された。クロスプラットフォーム解析において、これらの特徴をネットワーク疾患モジュール関連SNPsおよび臨床因子と組み合わせて、その後、RNAseqデータを用いた機械学習アルゴリズムの訓練に使用した。この薬物反応予測アルゴリズムの性能は、独立した検証試験で検証された。
【発明を実施するための形態】
【0092】
抗TNF治療に対する対象の反応を自動予測するためのシステムおよび方法が本明細書に提示される。また、本明細書では、ゲノムおよび/またはマルチオームデータの自動解釈のためのモジュールシステムも提示される。
【0093】
A.提供された分類子
本開示は、どの患者が特定の治療に反応するかまたは反応しないかを識別(すなわち、予測)することができる分類子およびそのような分類子の開発を提供する。いくつかの実施形態では、分類子は、抗TNF治療(例えば、特定の抗TNF薬剤および/またはレジメン)を受けた反応性および非反応性の先行対象を区別するために確立される。
【0094】
とりわけ、本開示は、特定の遺伝子のセットに対する発現レベルが、単独でおよび互いに組み合わせて、任意選択で特定の臨床的特徴および/または特定の一塩基多型の存在または不在と組み合わされて、抗TNF治療に対する反応(例えば、反応の1以上の特徴)を予測するために有用であるという洞察を包含している。
【0095】
いくつかの実施形態では、本開示は、そのような遺伝子発現レベル、臨床的特徴および/またはSNPであるか、あるいはそれを含む分類子を提供し、それが、抗TNF治療に反応する対象としない対象とを区別するために確立されていることを証明する。いくつかの実施形態では、提供される分類子は、抗TNF治療を受け、その反応性が知られている(例えば、以前に決定された)過去の(すなわち、以前の)対象集団のレトロスペクティブ分析を通じて、抗TNF治療に反応性または非反応性である対象(例えば、抗TNF治療で未処置の対象)を区別するように確立されている。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも70%の精度でコホート内のノンレスポンダーの少なくとも50%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも70%の精度でコホート内のノンレスポンダーの少なくとも60%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも70%の精度でコホート内のノンレスポンダーの少なくとも70%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも70%の精度でコホート内のノンレスポンダーの少なくとも80%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも70%の精度でコホート内のノンレスポンダーの少なくとも90%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも70%の精度でコホート内のノンレスポンダーの少なくとも99%を識別する分類子は、「検証済み」とみなされる。
【0096】
いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも80%の精度でコホート内のノンレスポンダーの少なくとも50%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも90%の精度でコホート内のノンレスポンダーの少なくとも50%を識別する分類子は、「検証済み」とみなされる。いくつかの実施形態では、そのような過去の(すなわち、以前の)集団に適用された場合、少なくとも99%の精度でコホート内のノンレスポンダーの少なくとも50%を識別する分類子は、「検証済み」とみなされる。
【0097】
いくつかの実施形態では、本開示は、疾患、障害、または疾病に苦しむ対象を処置する方法を提供し、上記方法は、そのような抗TNF治療に反応する可能性が高いと提供された分類子の適用を通じて決定された対象に抗TNF治療を投与する工程を含み、代替的または追加的に、いくつかの実施形態では、本開示は、疾患、障害、または疾病に苦しむ対象を処置する方法を提供し、上記方法は、抗TNF治療を保留する工程、および/または、そのような抗TNF治療に反応する可能性が低いと提供された分類子の適用を通じて決定された対象に抗TNF治療の代替物を投与する工程を含む。
【0098】
いくつかの実施形態では、提供される分類子は、1つ以上の遺伝子についての遺伝子発現情報であってもよく、またはそれを含んでいてもよい。代替的にまたは追加的に、いくつかの実施形態では、提供される分類子は、1つ以上の一塩基多型(SNP)、ならびに関連する対象の1つ以上の臨床的特性または特徴の存在または不在であってもよいし、またはそれらを含んでもよい。
【0099】
いくつかの実施形態では、分類子は、発現レベルが臨床的な反応性または非反応性に有意に相関する(例えば、線形および/または非線形様式で)1つ以上の遺伝子、1つ以上のSNPの存在、および、少なくとも1つの臨床的特徴のそれぞれを評価することによって開発される。
【0100】
いくつかの実施形態では、本明細書に記載されるように、分類子は、抗TNF治療を受け、反応する(すなわち、レスポンダーである)または反応しない(すなわち、ノンレスポンダーである)と決定された患者(例えば、先行対象)からの生体サンプルの1つ以上の特徴(例えば、遺伝子発現レベル、1つ以上のSNPの有無など)のレトロスペクティブ分析によって開発され、代替的にまたは追加的に、いくつかの実施形態では、分類子は、そのような患者の1つ以上の臨床的特徴のレトロスペクティブ分析によって開発され、これは、任意の生体サンプルの評価を含むこともあれば含まないこともある(および、例えば、医療記録を参照することによって達成されてもよい)。いくつかの実施形態では、そのような患者はすべて、同じ抗TNF治療を受けており(任意選択で、同じ期間または異なる期間)、代替的にまたは追加的に、いくつかの実施形態では、すべてのそのような患者は、同じ疾患、障害、または疾病であると診断されている。いくつかの実施形態では、レトロスペクティブ分析において生体サンプルが分析される患者は、(例えば、異なる抗TNF薬剤で、および/または異なるレジメンで)異なる抗TNF治療を受けており、代替的にまたは追加的に、いくつかの実施形態では、レトロスペクティブ分析において生体サンプルが分析される患者は、異なる疾患、障害、または疾病であると診断されていた。
【0101】
1.遺伝子発現
典型的には、本明細書に記載される分類子の遺伝子発現態様は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、ならびに、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNPs)の存在、あるいは、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つを評価することによって決定される。発現レベルがレスポンダー集団とノンレスポンダー集団との間で統計的に有意な差を示す遺伝子は、遺伝子応答シグネチャーに含まれることがある。
【0102】
いくつかの実施形態では、本開示は、反応性の対象と非反応性の対象との間の分類子を特定または提供する特定の以前の努力に伴う原因が、レスポンダー対ノンレスポンダーの集団における遺伝子発現レベルの比較を通じて、集団間の発現レベルの最大差(例えば、2倍以上の変化)を示す遺伝子を強調し、および/または上記遺伝子に(しばしば単独で)焦点を当てているという洞察を具現化している。本開示は、その発現レベルの差が比較的小さい(例えば、発現の2倍未満の変化)遺伝子でさえ、有用な情報を提供し、本明細書に記載の実施形態における分類子に有益に含まれることを評価する。
【0103】
さらに、いくつかの実施形態では、本開示は、本明細書に記載されるように、発現レベルがレスポンダー集団とノンレスポンダー集団との間で統計的に有意な差(任意選択で小さな差を含む)を示す遺伝子の相互作用パターンの解析が、分類子の品質および予測力を実質的に向上させる新たな価値ある情報を提供するという洞察を具現化するものである。
【0104】
いくつかの実施形態では、提供される分類子は、対象が特定の治療(例えば、抗TNF治療)に反応するかしないかを決定する(例えば、どの発現レベルが相関するか)ために使用することができる遺伝子または遺伝子のセットであるか、またはそれらを含む。いくつかの実施形態では、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、ならびに、1つ以上の一塩基多型(SNPs)の存在、ならびに、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つを評価することによって開発される。
【0105】
いくつかの実施形態では、分類子で使用するための、および/または、遺伝子発現を測定するための1つ以上の遺伝子は、表1の遺伝子から選択される。
【0106】
【0107】
特定の実施形態では、上記で特定された11個の特定された遺伝子(および/または
図1に示す17個の追加遺伝子)の様々なサブセットの遺伝子発現レベルが(例えば、重み付け因子を用いてまたは用いずに)使用される。例えば、特定の実施形態では、分類モデルは、使用され得る11個の遺伝子-CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3のセットの3、4、5、6、7、8、9、または10個のメンバーのサブセットの発現レベルに基づいてもよく、または特定の実施形態では、分類モデルは
図1に示す28個の遺伝子のセットのサブセットの発現レベルに基づくことができる。特定の実施形態では、分類子の遺伝子のそれぞれのRNA配列決定(RNA-seq)データリードカウントが、モデルにおいて使用される。特定の実施形態では、RNA-seqリードカウントは、100万リード当たりのエクソン1キロベース当たりのフラグメント(FPKM)として提供される。
【0108】
さらに、驚くべきことに、11個の遺伝子-CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3のセットの遺伝子発現レベルに基づくモデルは、臨床共変動分類子(CC)またはゲノム-臨床分類子(GCC)よりも、抗TNF治療に対する反応/非反応の予測因子として優れていたことが分かった。
【0109】
いくつかの実施形態では、11個の遺伝子(CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3)のセットの1、2、3、4、5、6、7、8、9、10、またはすべての11個の遺伝子が、抗TNF反応を予測するために測定される。いくつかの実施形態では、1個の遺伝子が測定される。いくつかの実施形態では、2個の遺伝子が選択される。いくつかの実施形態では、3個の遺伝子が選択される。いくつかの実施形態では、4個の遺伝子が選択される。いくつかの実施形態では、5個の遺伝子が選択される。いくつかの実施形態では、6個の遺伝子が選択される。いくつかの実施形態では、7個の遺伝子が選択される。いくつかの実施形態では、8個の遺伝子が選択される。いくつかの実施形態では、9個の遺伝子が選択される。いくつかの実施形態では、10個の遺伝子が選択される。いくつかの実施形態では、11個の遺伝子が選択される。いくつかの実施形態では、8個を超える遺伝子が選択される。いくつかの実施形態では、8、9、10、または11個の遺伝子が選択される。
【0110】
いくつかの実施形態では、反応性または非反応性であるとの対象の分類(すなわち、決定または予測)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3から選択される1つ以上の遺伝子の発現レベルを用いて決定される。いくつかの実施形態では、分類は、機械学習モデルを用いて決定される。いくつかの実施形態では、機械学習モデルは、ランダムフォレストモデルである。
【0111】
いくつかの実施形態では、提供される方法は、臨床共変動分類子(CC)を使用することなく、対象をレスポンダーまたはノンレスポンダーであると分類することを決定する。いくつかの実施形態では、提供される方法は、ゲノム-臨床分類子(GCC)を使用することなく、対象をレスポンダーまたはノンレスポンダーであると分類することを決定する。いくつかの実施形態では、提供される方法は、臨床共変動分類子(CC)を使用することなく、かつ、ゲノム-臨床分類子(GCC)を使用することなく、対象をレスポンダーまたはノンレスポンダーであると分類することを決定する。
【0112】
いくつかの実施形態では、分類子で使用するための1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される。
【0113】
いくつかの実施形態では、分類子における遺伝子発現は、例えば、検証された生物学的データ(例えば、Gene Expression Omnibus(「GEO」)などの公に利用可能なデータベースから得られる生物学的データ)から作成され得る、または作成されたようなmRNAおよび/またはタンパク質発現データセットを用いて同定され得る。いくつかの実施形態では、分類子は、特定の治療(例えば、抗TNF治療)に対する既知の反応性および既知の非反応性の先行対象の遺伝子発現レベルを比較することによって導き出され得る。いくつかの実施形態では、特定の遺伝子(すなわち、シグネチャー遺伝子)は、この遺伝子発現データのコホートから選択され、分類子を開発する際に使用される。
【0114】
いくつかの実施形態では、シグネチャー遺伝子は、Santolini, “A personalized, multiomics approach identifies genes involved in cardiac hypertrophy and heart failure,” Systems Biology and Applications, (2018)4:12; doi:1038/s41540-018-0046-3によって報告されたものに類似する方法によって特定されており、上記文献は参照により本書に組み込まれる。いくつかの実施形態では、シグネチャー遺伝子は、既知の反応性および非反応性の先行対象の遺伝子発現レベルを比較し、2つの群間の有意な変化を同定することによって同定され、有意な変化は、発現における大きな差(例えば、2倍以上の変化)、発現における小さな差(例えば、2倍未満の変化)、またはその両方であり得る。いくつかの実施形態では、遺伝子は、発現の差の有意性によってランク付けされる。いくつかの実施形態では、有意性は、遺伝子発現と反応アウトカムとの間のピアソン相関によって測定される。いくつかの実施形態では、シグネチャー遺伝子は、発現の差の有意性によるランク付けから選択される。いくつかの実施形態では、選択されるシグネチャー遺伝子の数は、解析された遺伝子の総数よりも少ない。いくつかの実施形態では、200個以下のシグネチャー遺伝子が選択される。いくつかの実施形態では、100個以下の遺伝子が選択される。
【0115】
いくつかの実施形態では、シグネチャー遺伝子は、タンパク質-タンパク質相互作用のマップである、ヒトインタラクトーム(HI)上のそれらの位置と連動して選択される。この手法でのHIの使用は、mRNA活性が動的であり、特定の疾患を理解するために重要なタンパク質の実際の過剰発現および過小発現を決定するという認識を包含する。いくつかの実施形態では、特定の治療(すなわち、抗TNF治療)に対する反応に関連付けられる遺伝子は、HIマップ上の個別のモジュールにおいてクラスター化(すなわち、遺伝子のクラスターを形成)することもある。このようなクラスターの存在は、基礎的な基礎疾患生物学の存在と関連付けられる。いくつかの実施形態では、分類子は、HIマップ上の遺伝子のクラスターから選択されたシグネチャー遺伝子から導き出される。したがって、いくつかの実施形態では、分類子は、ヒトインタラクトームマップ上の抗TNF治療に対する反応に関連付けられる遺伝子のクラスターから導き出される。
【0116】
いくつかの実施形態では、特定の治療に対する反応に関連付けられる遺伝子は、ヒトインタラクトームマップ上にマッピングされると、特定のトポロジー特性を示す。例えば、いくつかの実施形態では、複数の遺伝子は、抗TNF治療への反応に関連付けられ、かつ、ヒトインタラクトームマップ上のそれらの位置(すなわち、トポロジー特性、例えば、それらの互いに対する近接性)によって特徴付けられる。
【0117】
いくつかの実施形態では、特定の治療(すなわち、抗TNF治療)に対する反応に関連付けられる遺伝子は、HIマップ上で互いに近接した範囲内に存在することができる。上記近接する遺伝子は、必ずしも基本的な基礎疾患生物学を共有する必要はない。すなわち、いくつかの実施形態では、近接遺伝子は、有意なタンパク質相互作用を共有しない。したがって、いくつかの実施形態では、分類子は、ヒトインタラクトームマップ上で近接する遺伝子から導き出される。いくつかの実施形態では、分類子は、ヒトインタラクトームマップ上の特定の他のトポロジー特徴から導き出される。
【0118】
いくつかの実施形態では、特定の治療(すなわち、抗TNF治療)に対する反応に関連付けられる遺伝子は、HIマップと組み合わせて使用される場合、拡散状態距離(Diffusion State Distance)(DSD)によって決定されてもよい(Cao, et al.,PLOS One, 8(10):e76339 (Oct 23, 2013)を参照)。
【0119】
いくつかの実施形態では、シグネチャー遺伝子は、(1)既知のレスポンダーおよび既知のノンレスポンダーと比較した場合の遺伝子の発現の差の有意性に基づいて、遺伝子をランク付けすること、(2)ランク付けされた遺伝子から遺伝子を選択し、選択された遺伝子をヒトインターゲノムマップ上にマッピングすること、(3)ヒトインタラクトームマップ上にマッピングされた遺伝子からシグネチャー遺伝子を選択すること、によって選択される。
【0120】
いくつかの実施形態では、シグネチャー遺伝子(例えば、Santolini法から、または、限定されないが、クラスタリング、近接および拡散ベースの方法を含む様々なネットワークトポロジー特性を使用して、選択される)は、確率的ニューラルネットワークに提供され、それによって分類子を提供(すなわち、「訓練」)する。いくつかの実施形態では、確率的ニューラルネットワークは、参照により本明細書に組み込まれる“Probabilistic Neural Networks」、”Neural Networks、3(1):109-118(1990)においてD.F.Spechtにより提案されたアルゴリズムを実装する。いくつかの実施形態では、確率的ニューラルネットワークは、R-統計言語で記述され、定量的変数のベクトルによって記述される観測のセットを知り、観測を所定の数のグループ(例えば、レスポンダーおよびノンレスポンダー)に分類する。アルゴリズムは、既知のレスポンダーとノンレスポンダーから得られたシグネチャー遺伝子のデータセットで訓練され、提供される新しい観測値を推測する。いくつかの実施形態では、確率的ニューラルネットワークは、https://CRAN.R-project.org/package=pnn.から導き出されるものである。いくつかの実施形態では、シグネチャー遺伝子は、ランダムフォレストモデルに従って解析され、分類子を提供する。
【0121】
2.一塩基多型
本開示はさらに、一塩基多型(SNP)がRNA配列データを介して同定され得るという洞察を包含する。すなわち、RNA配列データを参照ヒトゲノムと比較することによって、例えば、RNA配列データをGRCh38ヒトゲノムにマッピングすることによって、である。理論に縛られることなく、分類子で使用されるRNA配列に相関するSNPの存在は、特定の治療(例えば、抗TNF治療)に反応するか、または反応しない対象の亜集団の同定を容易にすることができると信じられている。すなわち、識別力のある遺伝子およびSNP含有RNAのタンパク質産物は、ネットワーク医学およびパスウェイ濃縮分析を用いて分析することができる。分類子に含まれる識別力のある遺伝子およびSNP含有RNAによってコードされるタンパク質は、例えば、ヒトインタラクトームのマップに重ね合わされることで、識別力のある遺伝子の特定のセットを同定することによって対象の特定の亜集団を同定するのに役立つことが可能である。
【0122】
いくつかの実施形態では、提供される分類子およびそのような分類子を使用する方法は、一塩基多型(SNPs)に関連する評価を組み込む。いくつかの実施形態では、本開示は、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法を提供し、上記方法は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析する工程と、配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、1つ以上のSNPを分類子に含める工程と、を含む。
【0123】
いくつかの実施形態では、本開示は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析することによって、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法において、配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、1つ以上のSNPの存在を分類子に含める工程とを含む改善を提供する。
【0124】
いくつかの実施形態では、1つ以上のSNPは以下から選択される。
【0125】
【0126】
【0127】
3.臨床的特徴
分類子は、レスポンダーとノンレスポンダーを識別するための分類子の予測能力をさらに向上させるために、追加情報を組み込むこともできる。例えば、いくつかの実施形態では、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、および、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つを評価することによって開発される。すなわち、いくつかの実施形態では、分類子は、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子、および、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在を評価することによって開発される。いくつかの実施形態では、発現レベルが(例えば、線形および/または非線形様式で)臨床的な反応性または非反応性に有意に相関する1つ以上の遺伝子(例えば、線形および/または非線形様式で)、ならびに、反応性および非反応性の先行対象の少なくとも1つの臨床的特徴を評価することによって開発される。
【0128】
本開示はさらに、特定の臨床的な特徴(例えば、BMI、性別、年齢など)が本明細書で提供される分類子に組み込まれ得るという洞察を包含する。いくつかの実施形態では、提供される分類子およびそのような分類子を使用する方法は、臨床的特徴に関連する評価を組み込んでいる。いくつかの実施形態では、本開示は、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法を提供し、上記方法は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析する工程と、1つ以上の臨床的特徴の存在を評価する工程と、上記臨床的特徴に関連するその発現が少なくとも1つの治療属性と相関することを決定する工程と、1つ以上の臨床的特徴を分類子に含める工程と、を含む。
【0129】
いくつかの実施形態では、少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される。
【0130】
いくつかの実施形態において、臨床的特徴は以下から選択される。
【0131】
【0132】
【0133】
4.分類子の検証
代替的にまたは追加的に、いくつかの実施形態では、分類子は、リーブワンアウト(leave-one-out)交差検証および/またはk-分割交差検証を用いて、既知のレスポンダーおよびノンレスポンダーのコホートを用いて確率的ニューラルネットワークで訓練され得る。いくつかの実施形態では、このようなプロセスは、1つのサンプルを分析から除外し(すなわち、リーブワンアウト)、残りのサンプルに基づいてのみ分類子を訓練する。いくつかの実施形態では、更新された分類子は、その後、除外されたサンプルの反応の確率を予測するために使用される。いくつかの実施形態では、このようなプロセスは、例えば、すべてのサンプルが1回除外されるまで、反復的に繰り返され得る。いくつかの実施形態では、このようなプロセスは、既知のレスポンダーとノンレスポンダーのコホートをk個の等しいサイズのグループに無作為に分割する。k個のグループのうち、1つのグループは、モデルを試験するための検証データとして保持され、残りのグループは、訓練データとして使用される。このようなプロセスはk回繰り返すことができ、k個のグループのそれぞれは検証データとして正確に1回使用される。いくつかの実施形態では、アウトカムは、訓練セット内の各サンプルに対する確率スコアである。そのような確率スコアは、実際の反応アウトカムと相関することができる。再帰動作曲線(Recursive Operating Curve)(ROC)は、分類子の性能を推定するために使用することができる。いくつかの実施形態では、約0.6以上の曲線下面積(AUC)は、適切に検証された分類子を反映している。いくつかの実施形態では、0.9の陰性的中率(NPV)は、適切な検証済み分類子を反映している。いくつかの実施形態では、分類子は、例えば、適合性を確認するために(すなわち、リーブワンアウト交差検証および/またはk-分割交差検証を用いて)、完全に独立した(すなわち、盲検化した)コホートにおいて試験され得る。したがって、いくつかの実施形態では、提供される方法は、例えば、既知のレスポンダーおよびノンレスポンダーのグループに反応の確率を割り当てることによって、分類子を検証する1つ以上の工程と、レスポンダーとノンレスポンダーの盲検化されたグループに対して分類子をチェックする工程と、をさらに含む。これらのプロセスの出力は、対象が特定の治療(例えば、抗TNF治療)に反応するか否かを確定するのに有用な訓練された分類子である。
【0134】
したがって、いくつかの実施形態では、分類子は、ある種の治療、例えば、抗TNF治療を受けた反応性および非反応性の先行対象を区別するように確立される。この分類子は、対象が所定の治療に反応するか否かを予測することができる。いくつかの実施形態では、反応性の先行対象および非反応性の先行対象は、同じ疾患、障害、または疾病に苦しんでいる。
【0135】
いくつかの実施形態では、対象の遺伝子は、マイクロアレイ、RNA配列決定、リアルタイム定量逆転写PCR(qRT-PCR)、ビーズアレイ、ELISA、およびタンパク質発現のうちの少なくとも1つによって測定される。
【0136】
いくつかの実施形態では、分類子は、抗TNF治療で以前に処置された対象のコホートを使用して検証されるが、分類子を準備するために使用される対象のコホートから独立している。いくつかの実施形態では、分類子は遺伝子発現データ、SNPデータ、または臨床的特徴を使用して更新される。いくつかの実施形態では、非反応性対象の90%以上が、検証コホート内で60%以上の精度で予測されるとき、分類子は「検証済み」とみなされる。
【0137】
いくつかの実施形態では、分類子は、少なくとも100人の対象の集団全体にわたって反応性を予測する少なくとも60%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも150人の対象の集団にわたって、少なくとも60%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも170人の対象の集団にわたって、少なくとも60%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも200人以上の対象の集団にわたって、少なくとも60%の精度で対象の反応性を予測する。
【0138】
いくつかの実施形態では、分類子は、少なくとも100人の対象の集団にわたって、少なくとも80%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも150人の対象の集団にわたって、少なくとも80%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも170人の対象の集団にわたって、少なくとも80%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも200人以上の対象の集団にわたって、少なくとも80%の精度で対象の反応性を予測する。
【0139】
いくつかの実施形態では、分類子は、少なくとも100人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも150人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも170人の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する。いくつかの実施形態では、分類子は、少なくとも200人以上の対象の集団にわたって、少なくとも90%の精度で対象の反応性を予測する。
【0140】
B.遺伝子シグネチャーおよび/またはSNPの検出
訓練された分類子を用いて対象の遺伝子シグネチャーを検出することは、当業者にとって日常的な事項である。すなわち、最初に(分類子から)遺伝子シグネチャーを定義することにより、様々な方法を用いて、対象または対象のグループが確立された遺伝子シグネチャーを発現しているか否かを決定することができる。例えば、いくつかの実施形態では、実務者は、治療の投与前に対象から血液または組織サンプルを取得し、上記血液または組織サンプルからmRNAプロファイルを抽出および分析することができる。mRNAプロファイルの分析は、限定されないが、遺伝子アレイ、RNA-配列決定、ナノストリングシーケンシング、リアルタイム定量逆転写PCR(qRT-PCR)、ビーズアレイ、または酵素結合免疫吸着測定法(ELISA)を含む、当業者に知られている任意の方法によって実施することができる。したがって、いくつかの実施形態では、本開示は、対象がレスポンダーまたはノンレスポンダーとして分類されるかどうかを決定する方法を提供し、上記方法は、マイクロアレイ、RNA配列決定、リアルタイム定量逆転写PCR(qRT-PCR)、ビーズアレイ、およびELISAの少なくとも1つによって遺伝子発現を測定する工程を含む。いくつかの実施形態では、本開示は、RNA配列決定(すなわち、RNAseq)によって対象の遺伝子発現を測定する工程を含む、対象がレスポンダーまたはノンレスポンダーとして分類されるかどうかを決定する方法を提供する。
【0141】
本開示はさらに、一塩基多型(SNP)がRNA配列データを介して同定され得るという洞察を包含する。すなわち、RNA配列データを参照ヒトゲノムと比較することによって、例えば、RNA配列データをGRCh38ヒトゲノムにマッピングすることによって、である。理論に縛られることなく、分類子で使用されるRNA配列に相関するSNPの存在は、特定の治療(例えば、抗TNF治療)に反応するか、または反応しない対象の亜集団の同定を容易にすることができると信じられている。すなわち、識別力のある遺伝子およびSNP含有RNAのタンパク質産物は、ネットワーク医学およびパスウェイ濃縮分析を用いて分析することができる。分類子に含まれる識別力のある遺伝子およびSNP含有RNAによってコードされるタンパク質は、例えば、ヒトインタラクトームのマップに重ね合わされることで、識別力のある遺伝子の特定のセットを同定することによって対象の特定の亜集団を同定するのに役立つことが可能である。
【0142】
いくつかの実施形態では、遺伝子発現は、バックグラウンドデータを減算し、バッチ効果を補正し、およびハウスキーピング遺伝子の平均発現で除算することによって測定される。Eisenberg&Levanon、「Human housekeeping genes, revisited」、Trends in Genetics、29(10):569-574(2013年10月)を参照。マイクロアレイデータ解析の文脈では、バックグラウンド除去は、各プローブ特性の蛍光信号強度から、任意のmRNA配列に相補的でないチップ上のプローブ特性から生じる平均蛍光信号、すなわち、非特異的結合から生じる信号を減算することを意味する。バックグラウンド除去は、Affymetrix Gene Expression Consoleなどの異なるソフトウェアパッケージで行うことができる。ハウスキーピング遺伝子は、基本的な細胞維持に関与しているため、あらゆる細胞および条件下で一定の発現レベルを維持することが予想される。関心の遺伝子、すなわち、反応シグネチャーの遺伝子の発現レベルは、選択されたハウスキーピング遺伝子のグループにわたる平均発現レベルで発現レベルを割ることによって正規化することができる。このハウスキーピング遺伝子の正規化手順は、実験変動に対して遺伝子発現レベルを較正する。さらに、マイクロアレイの異なるバッチ間の変動性を補正するロバストマルチアレイ平均(「RMA」)などの正規化方法は、Illuminaおよび/またはAffymetrixプラットフォームのいずれかが推奨するRパッケージで利用可能である。正規化されたデータは対数変換され、サンプル間で検出率が低いプローブは除去される。さらに、利用可能な遺伝子記号またはEntrez IDを持たないプローブは、解析から除外される。
【0143】
いくつかの実施形態では、本開示は、抗TNF治療を受けた先行対象を反応性および非反応性に区別するために確立された分類子を含むキットを提供する。
【0144】
C.分類子の使用
1.患者の層別化
とりわけ、本開示は、抗TNF治療に対する反応性を予測するための技術を提供する。いくつかの実施形態では、提供される技術は、以前の方法論よりも優れたコホートにわたる一貫性および/または精度を示す。
【0145】
したがって、本開示は、患者の層別化、レスポンダー集団とノンレスポンダー集団を定義および/または区別するための技術を提供する。例えば、いくつかの実施形態では、本開示は、抗TNF治療で対象を処置するための方法を提供し、上記方法は、いくつかの実施形態では、抗TNF治療を受けた反応性および非反応性の先行対象を区別するために確立された分類子を介して、反応性であると決定された対象に、抗TNF治療を投与する工程を含む。
【0146】
いくつかの実施形態では、本開示は、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法を提供し、上記方法は、治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象において発現されたRNAの配列データを分析する工程と、配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、1つ以上のSNPの存在が少なくとも1つの治療属性と相関していることを決定する工程と、1つ以上のSNPを分類子に含める工程と、を含む。
【0147】
2.治療モニタリング
さらに、本開示は、所定の対象または対象のコホートに対する治療をモニタリングするための技術を提供する。対象の遺伝子発現レベルは時間とともに変化し得るので、場合によっては、1つ以上の時点、例えば、指定された間隔および/または周期的な間隔で対象を評価することが必要であるか、または望ましいことがある。
【0148】
いくつかの実施形態では、複数の時点でのモニタリングの繰り返しは、進行中の治療レジメンに影響を与え得る、対象の遺伝子発現プロファイルまたは特徴における1つ以上の変化の検出を許容または実現する。いくつかの実施形態では、対象に投与される特定の治療が継続される、変更される、または中断されることに応じて、変化が検出される。いくつかの実施形態では、治療は、例えば、対象がすでに処置されている1つ以上の薬剤または治療の投与の頻度および/または量を増加または減少させることによって、変更されてもよい。代替的にまたは追加的に、いくつかの実施形態では、治療は、1つ以上の新規の薬剤または治療による、治療の追加によって変更されてもよい。いくつかの実施形態では、治療は1つ以上の特定の薬剤または治療の中断または停止によって変更されてもよい。
【0149】
一例を挙げると、対象が最初に反応性であると分類された場合(対象の遺伝子発現が、分類子を通じて、疾患、障害、または疾病に関連付けられると決定されたため)、次に所定の抗TNF治療が投与され得る。所定の間隔(例えば、6ヶ月ごと、1年ごとなど)で、対象を再度検査し、対象が所定の抗TNF治療に依然として「反応性」であることを確認することができる。所定の対象の遺伝子発現レベルが時間とともに変化し、疾患、障害、または疾病に関連付けられる遺伝子がもはや発現しない場合、あるいは非反応性に関連付けられる遺伝子を発現する場合、対象の治療を遺伝子発現の変化に合わせて変更することができる。
【0150】
したがって、いくつかの実施形態では、本開示は、抗TNF治療で反応性であると分類子を介して以前に確立された対象に、治療を投与する方法を提供する。
【0151】
いくつかの実施形態では、本開示は、投与の前に対象が分類子を介してレスポンダーではないことを決定する工程と、抗TNF治療の代替的な治療を投与する工程とをさらに含む方法を提供する。
【0152】
いくつかの実施形態では、対象の遺伝子は、マイクロアレイ、RNA配列決定、リアルタイム定量逆転写PCR(qRT-PCR)、ビーズアレイ、ELISA、およびタンパク質発現のうちの少なくとも1つによって測定される。
【0153】
いくつかの実施形態では、対象は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される疾患、障害、または疾病に苦しんでいる。
【0154】
いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、あるいはそれらのバイオシミラーであるか、またはその投与を含む。いくつかの実施形態では、抗TNF治療は、インフリキシマブまたはアダリムマブであるか、またはその投与を含む。
【0155】
いくつかの実施形態では、反応性および非反応性の先行対象は、同じ疾患、障害、または疾病に苦しんだ。
【0156】
いくつかの実施形態では、抗TNF治療が投与される対象は、以前の反応性および非反応性の先行対象と同じ疾患、障害、または疾病に苦しんでいる。
【0157】
いくつかの実施形態では、疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される。
【0158】
いくつかの実施形態では、疾患、障害、または疾病は、関節リウマチである。
【0159】
いくつかの実施形態では、疾患、障害、または疾病は、潰瘍性大腸炎である。
【0160】
D.処置法
いくつかの実施形態では、抗TNF治療が投与される対象または集団、あるいは、抗TNF治療が控えられる(および/または代替治療が投与される)対象または集団は、特定の発現レベルの1つ以上の遺伝子、典型的には、複数の遺伝子を示すと決定されたものである。いくつかの実施形態では、1つ以上の遺伝子は、特定の閾値より下の発現レベルを有すると決定され、代替的または追加的に、いくつかの実施形態では、1つ以上の遺伝子は、特定の閾値より下の発現レベルを有すると決定される。いくつかの実施形態では、遺伝子の特定のセットは、それぞれが特定の閾値と比べて評価される(および、例えば、そのような閾値より上、下、またはそれと同等であると決定される)発現のパターンを有すると決定される。
【0161】
いくつかの実施形態では、本開示は、疾患、障害、または疾病に苦しむ、対象を処置する方法を提供し、上記方法は、1つ以上の遺伝子の特定の発現レベル未満を示すと決定された対象に、抗TNF治療の代替物を投与する工程を含む。
【0162】
したがって、いくつかの実施形態では、本開示は、
(a)コンピューティングデバイスのプロセッサによって、炎症性疾患(例えば、自己免疫疾患、関節リウマチ)に苦しむ対象の1つ以上の遺伝子の各々の発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11すべてのメンバー)を含む、工程と、
(b)プロセッサによって、工程(a)で受信されたデータを使用して、抗TNF治療に非反応性であるとして対象の分類を自動的に決定する工程と、任意選択的に、
(c)疾患の処置のために、第2の治療(例えば、抗TNF治療の代替物)を対象に処方および/または投与する工程であって、それによって、対象への第1の治療の処方および/または投与を回避する、工程と、を含む、方法を提供する。
【0163】
いくつかの実施形態では、本開示は、
(a)コンピューティングデバイスのプロセッサによって、疾患(例えば、自己免疫疾患、例えば、関節リウマチ)に苦しむ対象の各々の1つ以上の遺伝子の発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11すべてのメンバー)を含む、工程と、
(b)プロセッサによって、工程(a)で受信されたデータを使用して、第1の治療(例えば、抗TNF治療)に反応性であるとして対象の分類を自動的に決定する工程と、任意選択的に、
(c)疾患の処置のために、対象への第1の治療を処方および/または投与する工程と、を含む、方法を提供する。
【0164】
いくつかの実施形態では、本開示は、抗TNF治療が投与された反応性および非反応性の先行対象を区別するために確立された分類子(つまり、ここで、分類子は、受けた抗TNF治療に反応した人と反応しなかった人とを区別するために、後ろ向き解析によって確立された)によって反応性であると決定された対象に、抗TNF治療を投与する方法を提供し、ここで、分類子は、発現レベルが臨床的な反応性または非反応性と(例えば、線形および/または非線形の様式で)有意に相関する1つ以上の遺伝子と、発現された配列中の1つ以上の一塩基多型(SNP)の存在、および、反応性ならびに非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つと、を評価することによって開発される。
【0165】
TNF媒介性障害は、現在、TNFの阻害によって、および抗TNF剤(つまり、抗TNF治療)の投与によって処置されている。米国での使用が承認されている抗TNF剤の例としては、モノクローナル抗体、例えば、アダリムマブ(Humira(登録商標))、セルトリズマブペゴル(Cimiza(登録商標))、インフリキシマブ(Remicade(登録商標))、および、デコイ循環受容体融合タンパク質、例えば、エタネルセプト(Enbrel(登録商標))が挙げられる。これらの薬剤は、表2で以下に記載される投与レジメンに従って、現在、適応症の処置での使用が承認されている。
【0166】
【0167】
【0168】
【0169】
本開示は、表2に記載されるそれらの治療レジメンを含む、抗TNF治療に関連する技術を提供する。いくつかの実施形態では、抗TNF治療は、インフリキシマブ(Remicade(登録商標))、アダリムマブ(Humira(登録商標))、セルトリズマブペゴル(Cimiza(登録商標))、エタネルセプト(Enbrel(登録商標))、またはそのバイオシミラーの投与を含む。いくつかの実施形態では、抗TNF治療は、インフリキシマブ(Remicade(登録商標))またはアダリムマブ(Humira(登録商標))の投与を含む。いくつかの実施形態では、抗TNF治療は、インフリキシマブ(Remicade(登録商標))であるか、またはその投与を含む。いくつかの実施形態では、抗TNF治療は、アダリムマブ(Humira(登録商標))であるか、またはその投与を含む。
【0170】
いくつかの実施形態では、抗TNF治療は、バイオシミラー抗TNF剤であるか、またはその投与を含む。いくつかの実施形態では、抗TNF剤は、インフリキシマブのバイオシミラー、例えば、CT-P13、BOW015、SB2、Inflectra、Renflexis、およびIxifi、アダリムマブのバイオシミラー、例えば、ABP 501(AMGEVITA(商標))、Adfrar、およびHulio(商標)、ならびにエタネルセプトのバイオシミラー、例えば、HD203、SB4(Benepali(登録商標))、GP2015、Erelzi、およびIntaceptから選択される。
【0171】
いくつかの実施形態では、本開示は、自己免疫疾患に苦しむ対象を処置する方法を提供し、上記方法は、抗TNF治療を受けたコホートにおける反応性と非反応性の先行対象を区別するために確立された分類子によって反応性であると決定された対象に、抗TNF治療を投与する工程を含み、ここで、分類子は、発現レベルが臨床的な反応性または非反応性と(例えば、線形および/または非線形の様式で)有意に相関する1つ以上の遺伝子と、1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または反応性および非反応性の先行対象の少なくとも1つの臨床的特徴の少なくとも1つと、を評価することによって開発され、ここで、分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される。
【0172】
いくつかの実施形態では、抗TNF治療を受けたコホートの対象に由来するデータは、1つのタイプ(例えば、マイクロアレイ、RNAseqなど)のものであり、独立したコホートにおける分類子を検証するために使用されたデータは、異なるタイプ(例えば、マイクロアレイ、RNAseq)に由来する。したがって、いくつかの実施形態では、分類子は、反応性および非反応性の先行対象に由来するマイクロアレイ分析を使用して確立される。いくつかの実施形態では、分類子は、独立したコホートに由来するRNAseqデータを使用して検証される。
【0173】
本明細書で提供されるように、ある臨床的特徴と任意選択的に組み合わされたある遺伝子組合せの遺伝子発現レベルは、患者/対象が特定の治療(例えば、抗TNF治療)に反応するか否かを決定するために使用され得る。例えば、いくつかの実施形態では、1セットの11の遺伝子(CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3)の遺伝子発現レベルに基づく検証されたランダムフォレストモデルは、抗TNF治療に対するレスポンダーとしての対象の分類において、0.72の曲線下面積(AUC)、0.85の陰性的中率(NPV)、および0.61の真陰性率(TNR)を達成した。理論によって縛られることなく、これらの遺伝子は、炎症過程、RA、自己免疫、および抗TNF剤の作用メカニズムと高度に関連するように思われる。達成された高いNPVは、薬物副作用が重度であり得、およびLDAあるいは寛解が達成されるまでに長い時間がかかり得るRAの処置において重要な、ノンレスポンダーの識別に特に有用である。例えば、リウマチ学者は、RAに苦しむ所与の対象が抗TNF治療に反応しないと正確に予測することができ、したがって、代替療法を代わりに処方することができる可能性があり、それによって、対象が、抗TNF薬物の副作用リスクを回避し、効果がない疾患処置によって引き起こされる遅延を回避することを可能にする。
【0174】
いくつかの実施形態では、対象は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎から選択される疾患、障害、または 疾病に苦しむ。
【0175】
いくつかの実施形態では、抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、あるいはそれらのバイオシミラーであるか、またはその投与を含む。いくつかの実施形態では、抗TNF治療は、インフリキシマブまたはアダリムマブであるか、またはその投与を含む。
【0176】
いくつかの実施形態では、抗TNF治療の治療代替物は、リツキシマブ(Rituxan(登録商標))、サリルマブ(Kevzara(登録商標))、トファシチニブクエン酸塩(Xeljanz(登録商標))、レフノミド(lefunomide)(Arava(登録商標))、ベドリズマブ(Entyvio(登録商標))、トシリズマブ(Actemra(登録商標))、アナキンラ(Kineret(登録商標))、およびアバタセプト(Orencia(登録商標))から選択される。
【0177】
一般的に、提供される開示は、抗TNF治療の投与が企図または実行されるあらゆる状況で有用である。いくつかの実施形態では、提供される技術は、異常な(例えば、上昇した)TNF発現および/または活性に関連する疾患、障害、または疾病に苦しむ対象の診断および/または処置に有用である。いくつかの実施形態では、提供される技術は、抗TNF治療を受けているか、または受けた対象をモニタリングするのに有用である。いくつかの実施形態では、提供される技術は、対象が、与えられた抗TNF治療に反応するか、または反応しないかを識別する。いくつかの実施形態では、提供される技術は、対象が、与えられた抗TNF治療に対する耐性を獲得するかどうかを識別する。
【0178】
E.疾患、障害、または疾病
一般的に、提供される開示は、抗TNF治療の投与が企図または実行されるあらゆる状況で有用である。いくつかの実施形態では、提供される技術は、異常な(例えば、上昇した)TNF発現および/または活性に関連する疾患、障害、または疾病に苦しむ対象の診断および/または処置に有用である。いくつかの実施形態では、提供される技術は、抗TNF治療を受けているか、または受けた対象をモニタリングするのに有用である。いくつかの実施形態では、提供される技術は、対象が、与えられた抗TNF治療に反応するか、または反応しないかを識別する。いくつかの実施形態では、提供される技術は、対象が、与えられた抗TNF治療に対する耐性を獲得するかどうかを識別する。
【0179】
したがって、本開示は表2に示されるものを含む、TNFと関係する様々な障害の処置に関連する技術を提供する。いくつかの実施形態では、対象は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病(成人あるいは小児)、潰瘍性大腸炎、炎症性腸疾患、慢性乾癬、尋常性乾癬、化膿性汗腺炎、喘息、ブドウ膜炎、および若年性特発性関節炎から選択される疾患、障害、または疾病に苦しんでいる。いくつかの実施形態では、疾患、障害、または疾病は、関節リウマチである。いくつかの実施形態では、疾患、障害、または疾病は、乾癬性関節炎である。いくつかの実施形態では、疾患、障害、または疾病は、強直性脊椎炎である。いくつかの実施形態では、疾患、障害、または疾病は、クローン病である。いくつかの実施形態では、疾患、障害、または疾病は、成人クローン病である。いくつかの実施形態では、疾患、障害、または疾病は、小児クローン病である。いくつかの実施形態では、疾患、障害、または疾病は、炎症性腸疾患である。いくつかの実施形態では、疾患、障害、または疾病は、潰瘍性大腸炎である。いくつかの実施形態では、疾患、障害、または疾病は、慢性乾癬である。いくつかの実施形態では、疾患、障害、または疾病は、尋常性乾癬である。いくつかの実施形態では、疾患、障害、または疾病は、化膿性汗腺炎である。いくつかの実施形態では、疾患、障害、または疾病は、喘息である。いくつかの実施形態では、疾患、障害、または疾病は、ブドウ膜炎である。いくつかの実施形態では、疾患、障害、または疾病は、若年性特発性関節炎である。
【0180】
いくつかの実施形態では、疾患、障害、または疾病は、環状肉芽腫、リポイド類壊死症、化膿性汗腺炎(hiradenitis suppurativa)、壊疽性膿皮症(pyoderma gangrenossum)、スイート症候群、角層下膿疱症、全身性エリテマトーデス、強皮症、皮膚筋炎、ベーチェット病、急性/慢性の移植片対宿主疾患、毛孔性紅色粃糠疹、シェーグレン症候群(Sjorgren’s syndrome)、ヴェーゲナー肉芽腫症、多発性筋痛、リューマチ、皮膚筋炎、および壊疽性膿皮症である。
【0181】
さらに、記載されるように、本開示は、実務家が対象のコホートにおいて、反応を確実に一貫して予測することを可能にする技術を提供する。特に、例えば、いくつかの抗TNF治療の反応率は、所与の対象のコホート内で35%未満である。提供される技術は、対象のコホート内で65%を超える精度の反応率(つまり、ある対象は与えられた治療に反応するか、または反応しないか)の予測を可能にする。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でレスポンダーである(つまり、抗TNF治療に反応する)対象の65%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でレスポンダーである対象の70%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でレスポンダーである対象の80%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でレスポンダーである対象の90%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でレスポンダーである対象の100%を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でノンレスポンダーである(つまり、抗TNF治療に反応しない)対象の65%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でノンレスポンダーである対象の70%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でノンレスポンダーである対象の80%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でノンレスポンダーである対象の90%以上を予測する。いくつかの実施形態では、本明細書に記載される方法およびシステムは、所与のコホート内でノンレスポンダーである対象の100%を予測する。
【0182】
F.パイプライン分析
さらに、臨床ソフトウェアに求められるトレーサビリティおよびV&V試験/考証を可能にするが、経時的な構成要素の更新を可能にするのに柔軟であるモジュラーアーキテクチャを有する、ゲノムデータの分析のためのパイプラインが本明細書に記載されている。DNAおよびRNA(RNAseq)の次世代シーケンシング(NGS)は急速に発展している分野であり、バイオインフォマティクスアルゴリズムおよび構成要素が定期的に改善されている。これは、伝統的に固定化および確認される標準IVDソフトウェアと矛盾している。ソフトウェアへのいかなる変更も、広範な再検証および再確認を必要とする。ある実施形態では、本明細書に記載されるパイプラインは、既存の最先端技術のバイオインフォマティクスモジュール、例えば、RSEM(STAR)(これは、1つ以上の独自のアルゴリズムと一緒にパイプライン中で組み立てられるために、Rで書かれたアルゴリズムである)の使用を可能にする。モジュールはそれぞれ、ラッパー(wrapper)で「包まれる」。パイプラインの構成要素はそれぞれ独立して検証され得る。十分なパイプラインが検証され、システムは、ウエットラボ生成されたデータを使用して検証される。パイプラインの任意の構成要素、例えば、RSEM、STAR、または独自のアルゴリズムの1つ以上が今後、更新されることになっていた場合、その後、アップグレードされた構成要素を検証し、アップグレードされた構成要素を用いてシステムを検証し、およびあらかじめ生成されたウエットラボデータを再分析することによって、手軽なV&Vを完成することができる。
【0183】
図2は、独自の分類アルゴリズム、この例では、R(特定の治療に対するレスポンダー)またはNR(治療に対するノンレスポンダー)の分類結果を生成する独自のアルゴリズムのための入力を生成するために使用され得る、RNA-seqバイオインフォマティクスパイプラインの例示的な実施形態を示す。他の種類の分類が実施されてもよい。
【0184】
図2の例示的な実施形態によって例示されるように、
1.RNAseqバイオインフォマティクスパイプライン
a.本アプリケーションは、fastqファイルおよび患者識別子を読み取り、同じ患者識別子ならびに一連の属性値(フォーマットは、例えば、XML、JSON、あるいは他のオプションであってもよい)を特徴とする構造化されたテキスト報告書を返す。
b.入力ファイルは、fastqテキストデータファイル(平均で~30Mのリード、1ファイル当たり~1.4Gファイルサイズ)である。
c.fastq入力ファイルから最終報告書までの手順は、
i.Spliced Transcripts Alignment to a Reference(STAR)アライナー[Dobinら 2013]を用いた、参照ゲノムアセンブリ(Human Genome Assembly GRCh37またはGRCh38)に対するfastqの短いリード記録のアライメント、
ii.Expectation-Maximization(RSEM)ソフトウェアパッケージ(LiおよびWewey 2011)によるRNA-Seqを用いた転写産物の存在量の定量化、
iii.カスタム方法による任意選択の正規化、を含む。
2.PrismRAアルゴリズム(例示的な独自のアルゴリズム)
a.前の工程で生成された入力データマトリックスに関するセットのバイナリアウトカム(binary outcome)を、Rパッケージでモデル化する。このRパッケージは、glmnet、beanplots、pROC、およびsamrを含む、他のパッケージへの依存関係を特徴とする。
3.QCトラッキングおよびトリガー
a.最終テキスト報告書に加えて、本アプリケーションは、その値がソフトウェアの様々な動作を引き起こす中間のQC報告書を書き、読み取ることができる。
b.QC報告書は、FastQCパッケージ(これはthee Picard BAM/SAMライブラリを必要とする)でfastqファイルから、およびRNA-SeQCパッケージでBAMファイルから生成される。
4.データのトレーサビリティ、セキュリティ、プライバシー、コンプライアンス
a.結果は、すべての入力およびプロセスに完全に起因する。
b.データのプライバシーおよびセキュリティ:例えば、21 CFR Part 11, HIPAAおよびISO27001。
セキュリティコンプライアンス;GDPRコンプライアンス。
c.安定性:
i.ソフトウェアは自動的なパッケージの更新から隔離される。
ii.ソフトウェアは、例えば、オンプレミスでまたはプライベートクラウド上で展開することができるコンテナ内で移動可能である。
【0185】
図4に示されるように、本明細書に記載されているシステム、方法、およびアーキテクチャを提供する際に使用される、ネットワーク環境(400)の実施が示され、記載されている。概要では、
図4を参照すると、例示的なクラウドコンピューティング環境(400)のブロック図が示され、記載されている。クラウドコンピューティング環境(400)は、1つ以上のリソースプロバイダ(402a)、(402b)、(402c)(まとめて(402))を含み得る。リソースプロバイダ(402)はそれぞれ、コンピューティングリソースを含み得る。いくつかの実施では、コンピューティングリソースは、データを処理するために使用される任意のハードウェアおよび/またはソフトウェアも含み得る。例えば、コンピューティングリソースは、アルゴリズム、コンピュータプログラム、および/またはコンピューターアプリケーションを実行することができるハードウェアおよび/またはソフトウェアを含み得る。いくつかの実施では、例示的なコンピューティングリソースは、ストレージと検索の能力を有するアプリケーションサーバおよび/またはデータベースを含み得る。リソースプロバイダ(402)はそれぞれ、クラウドコンピューティング環境(400)における他の任意のリソースプロバイダ(402)に接続され得る。いくつかの実施では、リソースプロバイダ(402)は、コンピューターネットワーク(408)上で接続され得る。リソースプロバイダ(402)はそれぞれ、コンピューターネットワーク(408)上で、1つ以上のコンピューティングデバイス(404a)、(404b)、(404c)(まとめて(404))に接続され得る。
【0186】
クラウドコンピューティング環境(400)は、リソースマネージャ(406)を含み得る。リソースマネージャ(406)は、コンピューターネットワーク(408)上のリソースプロバイダ(402)およびコンピューティングデバイス(404)に接続され得る。いくつかの実施では、リソースマネージャ(406)は、1つ以上のコンピューティングデバイス(404)への1つ以上のリソースプロバイダー(402)によって、コンピューティングリソースの供給を促進し得る。リソースマネージャ(406)は、特定のコンピューティングデバイス(404)からコンピューティングリソースのリクエストを受け取ることがある。リソースマネージャ(406)は、コンピューティングデバイス(404)によって要求された、コンピューティングリソースを提供することができる1つ以上のリソースプロバイダー(402)を特定することができる。リソースマネージャ(406)は、コンピューティングリソースを提供するためにリソースプロバイダー(402)を選択することができる。リソースマネージャ(406)は、リソースプロバイダー(402)と特定のコンピューティングデバイス(404)の関係を促進し得る。いくつかの実装では、リソースマネージャ(406)は、特定のリソースプロバイダー(402)と特定のコンピューティングデバイス(404)の関係を確立し得る。いくつかの実施では、リソースマネージャ(406)は、要求されたコンピューティングリソースを備えた特定のリソースプロバイダー(402)へと特定のコンピューティングデバイス(404)をリダイレクトし得る。
【0187】
図5は、この開示で記載される技術を実施するために使用することができるコンピューティングデバイス(500)およびモバイルコンピューティングデバイス(550)の例を示す。コンピューティングデバイス(500)は、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータなどのデジタルコンピューターの様々な形態を表すように意図される。モバイルコンピューティングデバイス(550)は、携帯情報端末、携帯電話、スマートフォン、および他の同様のコンピューティングデバイスなどのモバイルデバイスの様々な形態を表すように意図される。ここに示される構成要素、それらの接続部、および関係、ならびにそれらの機能は、例としてのみ意図されており、限定するようには意図されない。
【0188】
コンピューティングデバイス(500)は、プロセッサ(502)、メモリ(504)、記憶装置(506)、メモリ(504)と複数の高速拡張ポート(510)に接続する高速インターフェース(508)、および低速拡張ポート(514)と記憶装置(506)に接続する低速インターフェース(512)を含む。プロセッサ(502)、メモリ(504)、記憶装置(506)、高速インターフェース(508)、高速拡張ポート(510)、および低速インターフェース(512)の各々は、様々なバスを使用して相互に連結し、および、共通のマザーボード上にマウントされるか、または必要に応じて他の様式でマウントされる。プロセッサ(502)は、高速インターフェース(508)につながれたディスプレイ(516)などの外部入力/出力デバイス上にGUIのためのグラフィカルな情報を表示するために、メモリ(504)内に、あるいは記憶装置(506)上で保存された命令を含む、コンピューティングデバイス(500)内で実行される命令を処理することができる。他の実施では、複数のプロセッサおよび/または複数のバスが、複数のメモリおよびメモリのタイプとともに、必要に応じて使用されてもよい。さらに、複数のコンピューティングデバイスは接続され得、各デバイスは、必要な操作の一部を提供する(例えば、サーババンク、ブレードサーバの群、またはマルチプロセッサーシステムとして)。したがって、用語が本明細書で使用される場合、複数の機能が「プロセッサ」によって実施されると記載される場合、これは、任意の数のコンピューティングデバイス(1つ以上)の任意の数のプロセッサ(1つ以上)によって複数の機能が実施される実施形態を包含する。さらに、機能が「プロセッサ」によって実施されると記載される場合、これは任意の数のコンピューティングデバイス(1つ以上)(例えば、分散コンピューティングシステム)の任意の数のプロセッサ(1つ以上)によって、機能が実施される実施形態を包含する。
【0189】
メモリ(504)は、コンピューティングデバイス(500)内の情報を保存する。いくつかの実施では、メモリ(504)は揮発性記憶ユニットである。いくつかの実施では、メモリ(504)は不揮発性記憶ユニットである。メモリ(504)はまた、コンピュータ可読媒体の別の形態、例えば、磁気または光ディスクであってもよい。
【0190】
記憶装置(506)は、コンピューティングデバイス(500)のための大容量記憶を提供することができる。いくつかの実施では、記憶装置(506)は、フロッピーディスクデバイス、ハードディスクデバイス、光ディスクデバイス、またはテープデバイス、フラッシュメモリあるいは他の同様のソリッドステートメモリ、またはストレージエリアネットワークあるいは他の構成のデバイスを含む、デバイスのアレイなどの、コンピュータ可読媒体であるか、またはコンピュータ可読媒体を含んでいてもよい。命令は情報担体に保存され得る。命令は、1つ以上の処理デバイス(例えば、プロセッサ(502))によって実行されるとき、上述されるものなどの1つ以上の方法を実施する。命令は、コンピュータ可読媒体または機械可読媒体(例えば、メモリ(504)、記憶装置(506)、あるいはプロセッサ(502)上のメモリ)などの1つ以上の記憶装置によって保存され得る。
【0191】
高速インターフェース(508)は、コンピューティングデバイス(500)のための帯域幅を集中的に使うオペレーション(bandwidth-intensive operations)を管理し、低速インターフェース(512)はより低い帯域幅を集中的に使うオペレーションを管理する。機能のそのような割り当ては一例にすぎない。いくつかの実施では、高速インターフェース(508)は、メモリ(504)、ディスプレイ(516)(例えば、グラフィックスプロセッサまたはアクセラレータを介して)、および高速拡張ポート(510)につながれ、これは、様々な拡張カード(図示せず)を受け入れることができる。実施では、低速インターフェース(512)は、記憶装置(506)および低速拡張ポート(514)につながれる。様々な通信ポート(例えば、USB、Bluetooth(登録商標)、イーサネット、無線イーサネット)を含み得る低速拡張ポート(514)は、1つ以上の入力/出力デバイス、例えば、キーボード、ポインティングデバイス、スキャナー、あるいはネットワークデバイス、例えば、スイッチまたはルーター、例えば、ネットワークアダプタにつながれていてもよい。
【0192】
図に示されるように、コンピューティングデバイス(500)は、多くの様々な形態で実装されてもよい。例えば、それは、標準サーバ(520)として、またはそのようなサーバの群で複数回実装されてもよい。加えて、それは、ラップトップコンピュータ(522)などのパーソナルコンピューターで実装されてもよい。さらに、それは、ラックサーバーシステム(524)の一部として実装されてもよい。あるいは、コンピューティングデバイス(500)の構成要素は、モバイルコンピューティングデバイス(550)などのモバイルデバイス(図示せず)中の他の構成要素と組み合わされてもよい。そのようなデバイスの各々は、コンピューティングデバイス(500)およびモバイルコンピューティングデバイス(550)の1つ以上を含んでいてもよく、全システムは、互いと通信する複数のコンピューティングデバイスから構成されていてもよい。
【0193】
モバイルコンピューティングデバイス(550)は、プロセッサ(552)、メモリ(564)、入力/出力デバイス、例えば、他の構成要素の中でも、ディスプレイ(554)、通信インターフェース(566)、およびトランシーバー(568)を含む。モバイルコンピューティングデバイス(550)はまた、さらなる保存を提供するために、マイクロドライブあるいは他のデバイスなどの記憶装置が設けられていてもよい。プロセッサ(552)、メモリ(564)、ディスプレイ(554)、通信インターフェース(566)、およびトランシーバー(568)の各々は、様々なバスを使用して相互に連結し、構成要素のいくつかは、共通のマザーボードにマウントされるか、または必要に応じて他の様式でマウントされ得る。
【0194】
プロセッサ(552)は、メモリ(564)に保存された命令を含む、モバイルコンピューティングデバイス(550)内の命令を実行することができる。プロセッサ(552)は、別個の複数のアナログおよびデジタル処理装置を含むチップのチップセットとして実行されてもよい。プロセッサ(552)は、例えば、ユーザーインタフェースの制御、モバイルコンピューティングデバイス(550)によって実行されるアプリケーション、およびモバイルコンピューティングデバイス(550)による無線通信など、モバイルコンピューティングデバイス(550)の他の構成要素の連携のために設けられる。
【0195】
プロセッサ(552)は、ディスプレイ(554)につながれた制御インターフェース(558)およびディスプレイインターフェース(556)を介してユーザーと通信することができる。ディスプレイ(554)は、例えば、TFT(薄膜トランジスタ液晶ディスプレイ)ディスプレイあるいはOLED(有機発光ダイオード)ディスプレイ、または他の適切なディスプレイ技術であってもよい。ディスプレイインターフェース(556)は、ユーザーにグラフィカルおよび他の情報を提示するディスプレイ(554)を駆動するための適切な電気回路を含む。制御インターフェース(558)は、ユーザーからコマンドを受け取り、それらをプロセッサ(552)に渡すために変換することができる。加えて、外部インターフェース(562)は、モバイルコンピューティングデバイス(550)が他のデバイスと近領域通信ができるように、プロセッサ(552)との通信を提供することができる。外部インターフェース(562)は、例えば、いくつかの実施では、有線通信のために、または他の実施では、無線通信のために設けられていてもよく、および複数のインターフェースも使用されてもよい。
【0196】
メモリ(564)は、モバイルコンピューティングデバイス(550)内に情報を保存する。メモリ(564)は、コンピュータ可読媒体、揮発性メモリユニット、または不揮発性メモリユニット1つ以上として実装され得る。拡張メモリ(574)がさらに設けられるか、または拡張インターフェース(572)を介してモバイルコンピューティングデバイス(550)に接続され得、これは、例えば、SIMM(Single In Line Memory Module)カードインターフェースを含み得る。拡張メモリ(574)は、モバイルコンピューティングデバイス(550)のために過剰な保存空間を提供することができるか、または、モバイルコンピューティングデバイス(550)のアプリケーションあるいは他の情報も保存することができる。具体的には、拡張メモリ(574)は、上述のプロセスを実行するための、または上述のプロセスを補うための命令を含むことができ、安全な情報も含むことができる。したがって、例えば、拡張メモリ(574)は、モバイルコンピューティングデバイス(550)のためのセキュリティモジュールとして設けられてもよく、モバイルコンピューティングデバイス(550)の安全な使用を可能にする命令でプログラムされてもよい。加えて、安全なアプリケーションは、ハッキングできない様式でSIMMカード上に識別する情報を置くことなど、追加情報とともにSIMMカードを介して提供され得る。
【0197】
後述されるように、メモリは、例えば、フラッシュメモリおよび/またはNVRAMメモリ(不揮発性ランダムアクセスメモリー)を含むことがある。いくつかの実装では、指示は情報担体に格納される。命令は、1つ以上の処理デバイス(例えば、プロセッサ(552))によって実行されるとき、上述されるものなどの1つ以上の方法を実施する。命令は、1つ以上のコンピュータ可読媒体または機械可読媒体(例えば、メモリ(564)、拡張メモリ(574)、あるいはプロセッサ(552)上のメモリ)などの1つ以上の記憶装置によって保存することができる。いくつかの実施では、命令は、例えば、トランシーバー(568)または外部インターフェース(562)上で、伝搬信号で受信される。
【0198】
モバイルコンピューティングデバイス(550)は、通信インターフェース(566)を介して無線で通信することができ、必要に応じて、それはデジタル信号処理回路を含んでいてもよい。通信インターフェース(566)は、とりわけ、GSM音声通話(モバイルコミュニケーションのためのグローバルシステム)、SMS(ショートメッセージサービス)、EMS(拡張メッセージサービス)、あるいはMMSメッセージング(マルチメディアメッセージサービス)などの様々なモードあるいはプロトコル下での通信、CDMA(符号分割多元接続)、TDMA(時分割多元接続)、PDC(パーソナルデジタルセルラー)、WCDMA(登録商標)(広帯域符号分割多重接続)、CDMA2000、またはGPRS(汎用パケット無線サービス)を提供することができる。そのような通信は、例えば、無線周波数を使用して、トランシーバー(568)を介して行われ得る。加えて、近距離通信は、Bluetooth(登録商標)、Wi-Fi(商標)、または他のそのようなトランシーバー(図示せず)を使用して行われてもよい。加えて、GPS(全地球測位システム)レシーバーモジュール(570)は、モバイルコンピューティングデバイス(550)への追加のナビゲーションと位置に関連する無線通信データを提供することができ、モバイルコンピューティングデバイス(550)上で実行されているアプリケーションによって、必要に応じて使用されてもよい。
【0199】
モバイルコンピューティングデバイス(550)はまた、オーディオコーデック(560)を使用して聴覚的に通信することができ、ユーザーから話された情報を得て、それを使用可能なデジタル情報に変換することができる。オーディオコーデック(560)は同様に、(例えば、モバイルコンピューティングデバイス(550)の送受話器中の)スピーカーなどによって、ユーザーのために可聴音を生成することができる。そのような音は、音声電話呼び出しの音を含んでいてもよく、記録された音(例えば、ボイスメール、音楽ファイルなど)を含んでいてもよく、モバイルコンピューティングデバイス(550)上で作動するアプリケーションによって生成される音をさらに含んでいてもよい。
【0200】
図に示されるように、モバイルコンピューティングデバイス(550)は多くの様々な形態で実装され得る。例えば、それは携帯電話(580)として実装され得る。さらに、それは、スマートフォン(582)、携帯情報端末、あるいは他の同様のモバイルデバイスの一部として実装されてもよい。
【0201】
本明細で記載されるシステムおよび技術の様々な実装は、デジタル電子回路、集積回路設計、特別に設計されたASIC(特定用途向け集積回路)、コンピューターハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実現することができる。これらの様々な実装は、ストレージシステム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスからデータおよび命令を受信するように、かつそれらにデータおよび命令を送信するように連結された、少なくとも1つのプログラマブルプロセッサ(特定の目的または多目的であってもよい)を含むプログラマブルシステム上で実行可能なおよび/または解釈可能である1つ以上のコンピュータプログラムでの実装を含み得る。
【0202】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとしても知られている)は、プログラマブルプロセッサのための機械命令を含み、高水準の手続き的(high-level procedural)および/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/機械語で実行することができる。本明細書で使用される場合、機械可読媒体およびコンピュータ可読媒体との用語は、機械命令および/またはデータを、機械可読信号としての機械命令を受信する機械可読媒体を含むプログラマブルプロセッサへと提供するために使用される、任意のコンピュータプログラムプロダクト、装置、および/またはデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指す。機械可読信号との用語は、プログラマブルプロセッサへの機械命令および/またはデータを提供するために使用される任意の信号を指す。
【0203】
ユーザーとの対話を提供するために、本明細書に記載されるシステムおよび技術は、ユーザーに情報を表示するための、表示デバイス(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニター)、およびキーボードならびにポインティングデバイス(例えば、マウスあるいはトラックボール)を備えるコンピュータ上で実装され、それによって、ユーザーは、コンピュータに入力を提供することができる。他の種類のデバイスも同様にユーザーとの対話を提供するために使用されてもよく、例えば、ユーザーに提供されるフィードバックは、感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)の任意の形態であり得、および、ユーザーからの入力は、音響、音声、または触覚の入力を含む任意の形態で受信され得る。
【0204】
本明細書に記載されるシステムおよび技術は、バックエンドコンポーネント(例えば、データサーバのような)を含むか、またはミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むか、またはフロントエンドコンポーネント(例えば、ユーザーが本明細書に記載されるシステムおよび技術の実装と相互作用することができる、グラフィカルユーザインターフェースあるいはウェブブラウザを備えるクライアントコンピュータ)を含む、コンピューティングシステム、あるいはそのようなバックエンド、ミドルウェア、およびフロントエンドのコンポーネントの任意の組み合わせで実装することができる。上記システムのコンポーネントは、任意の形態あるいはデジタルデータ通信(例えば、通信ネットワーク)の媒体によって相互接続することができる。通信ネットワークの実施例としては、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、およびインターネットが挙げられる。
【0205】
コンピューティングシステムは、クライアントとサーバとを含み得る。クライアントとサーバは一般的に遠隔地にあり、典型的には通信ネットワークを介して相互作用する。クライアントとサーバの関係は、それぞれのコンピュータ上で実行され、かつクライアントとサーバの関係を相互に持つコンピュータプログラムによって生じる。
【0206】
いくつかの実施では、本明細書に記載されるモジュールは、分離され得るか、組み合わせられ得るか、または単一のモジュールあるいは組み合わせられたモジュールへと取り込まれ得る。図に示されるモジュールは、本明細書に記載されるシステムを、本明細書に示されるソフトウェアアーキテクチャに限定するようには意図されていない。
【0207】
本明細書に記載される様々な実施の要素は、上に具体的に記載されない他の実装を形成するために組み合わせられ得る。要素は、それらの動作に悪影響を及ぼすことなく、本明細書に記載されるプロセス、コンピュータプログラム、データベースなどから除外される場合がある。加えて、図に示される論理流れは、望ましい結果を達成するために、示される特定の順序、または連続する順序を必要としない。様々な別個の要素は、本明細書に記載される機能を実施するために、1つ以上の個々の要素へと組み合わせられ得る。構造の観点から、いくつかの実施では、本明細書に記載されるシステムおよび方法の機能および装置。
【0208】
請求される発明のシステム、アーキテクチャ、デバイス、方法、およびプロセスは、本明細書に記載される実施形態からの情報を使用して開発された変形および適応を包含することが企図される。本明細書に記載されるシステム、アーキテクチャ、デバイス、方法、およびプロセスの適応および/または変更は、本明細書によって企図されるように実行され得る。
【0209】
本明細書全体を通じて、物品、デバイス、システム、およびアーキテクチャが、特定のコンポーネントを有するか、含む(including)か、または含む(comprising)と説明される場合、またはプロセスおよび方法が、特定の工程を有するか、含む(including)か、または含む(comprising)と説明される場合、言及されるコンポーネントから本質的になる、またはそれからなる本発明の物品、デバイス、システム、およびアーキテクチャがあること、および言及された処理工程から本質的になる、またはそれからなる本発明に従うプロセスおよび方法があることが企図される。
【0210】
本発明が動作可能である限り、工程の順序またはある動作を行うための順序は重要でないことを理解されたい。加えて、2つ以上の工程または動作は、同時に行われてもよい。
【0211】
例えば「背景」のセクションにおいて、任意の刊行物への言及は、その刊行物が本明細書で提示される請求項のいずれかに関して先行技術として機能することを認めるものではない。背景のセクションは、明確にする目的で提示されており、いかなる請求項に関する従来技術の説明として意図されているものではない。
【0212】
ヘッダーは読者の便宜のために提供されるものであり、ヘッダーの存在および/または配置は、本明細書に記載される主題の範囲を限定することを意図するものではない。
【0213】
G.例示的な実施形態
以下の番号付けされた実施形態は、非限定的であるが、本開示の特定の態様を例示するものである。
実施形態1.自己免疫疾患に苦しむ対象を処置する方法であって、上記方法は、
抗TNF治療を受けたコホートにおける反応性と非反応性の先行対象を区別するために確立された分類子によって反応性であると決定された対象に、抗TNF治療を投与する工程を含み、
ここで、分類子は、
発現レベルが臨床的な反応性または非反応性と(例えば、線形および/または非線形の様式で)有意に相関する、1つ以上の遺伝子と、
1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つと、
を評価することによって開発され、
ここで、分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される、方法。
実施形態2.分類子は、少なくとも170人の対象の集団にわたって少なくとも90%の精度で対象の反応性を予測する、実施形態1に記載の方法。
実施形態3.1つ以上の遺伝子は、ヒトインタラクトームマップにマップングされたときのそれらのトポロジー性質を特徴とする、実施形態1または実施形態2に記載の方法。
実施形態4.SNPは、ヒトゲノムに関して同定される、実施形態1-3のいずれか1つに記載の方法。
実施形態5.分類子は、
発現レベルが臨床的な反応性または臨床的な非反応性と(例えば、線形および/または非線形の様式で)有意に相関する1つ以上の遺伝子、
1つ以上SNPの存在、および
少なくとも1つの臨床的特徴
のそれぞれを評価することによって開発される、実施形態1-4のいずれか1つに記載の方法。
実施形態6.1つ以上の遺伝子は、
【0214】
【表8】
から選択される、実施形態1-5のいずれか1つに記載の方法。
実施形態7.少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される、実施形態1-6のいずれか1つに記載の方法。
実施形態8.分類子は、少なくとも90%の精度で、集団内の非反応性の対象の少なくとも40%を識別し、ここで、上記集団は少なくとも170人の対象を含む、実施形態1-6のいずれか1つに記載の方法。
実施形態9.抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーの投与を含む、実施形態1-8のいずれか1つに記載の方法。
実施形態10.疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される、実施形態1-9のいずれか1つに記載の方法。
実施形態11.分類子は、反応性および非反応性の先行対象に由来するマイクロアレイ分析を使用して確立される、実施形態1-10のいずれか1つに記載の方法。
実施形態12.分類子は、独立したコホートに由来するRNAseqデータを使用して検証される、実施形態1-11のいずれか1つに記載の方法。
実施形態13.SNPは表5から選択される、実施形態1-12のいずれか1つに記載の方法。
実施形態14.自己免疫疾患に苦しむ対象に治療を投与する方法であって、上記方法は、
抗TNF治療を受けたコホートにおいて反応性および非反応性の先行対象を区別するために確立された分類子によって反応性または非反応性であるとして分類された対象に治療を投与する工程を含み、
ここで、分類子によって対象が反応性であるとして分類される場合、抗TNF治療を投与し、分類子によって対象が非反応性であるとして分類される場合、抗TNF治療の代替物を投与し、ならびに、
分類子は、
発現レベルが臨床的な反応性または非反応性と(例えば、線形および/または非線形の様式で)有意に相関する、1つ以上の遺伝子と、
1つ以上の遺伝子の発現配列における1つ以上の一塩基多型(SNP)の存在、または反応性および非反応性の先行対象の少なくとも1つの臨床的特徴、の少なくとも1つと、
を評価することによって開発され、
ここで、分類子は、抗TNF治療を受けたコホートとは独立したコホートによって検証される、方法。
実施形態15.分類子は、少なくとも170人の対象の集団にわたって少なくとも90%の精度で対象の反応性を予測する、実施形態14に記載の方法。
実施形態16.分類子は、
発現レベルが臨床的な反応性または臨床的な非反応性と(例えば、線形および/または非線形の様式で)有意に相関する1つ以上の遺伝子、
1つ以上SNPの存在、および
少なくとも1つの臨床的特徴
の各々を評価することによって開発される、実施形態15に記載の方法。
実施形態17.少なくとも1つの臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される、実施形態14-16のいずれか1つに記載の方法。
実施形態18.抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーの投与を含む、実施形態14-17のいずれか1つに記載の方法。
実施形態19.抗TNF治療の代替物は、リツキシマブ、サリルマブ、トファシチニブクエン酸塩、レフノミド、ベドリズマブ、トシリズマブ、アナキンラ、およびアバタセプトから選択される、実施形態14-18のいずれか1つに記載の方法。
実施形態20.疾患、障害、または疾病は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、多発性硬化症、および若年性特発性関節炎から選択される、実施形態19に記載の方法。
実施形態21.1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法であって、上記方法は、
治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象中で発現されたRNAの配列データを分析する工程と、
配列データから1つ以上の一塩基多型(SNP)の存在を評価する工程と、
1つ以上のSNPの存在が少なくとも1つの治療属性と相関することを決定する工程と、
分類子に1つ以上のSNPを含める工程と、
を含む、方法。
実施形態22.1つ以上の治療属性は、特定の疾患、障害、または疾病を発症するリスク、特定の疾患、障害、または疾病のための特定のアウトカムの可能性、特定の治療に対する反応性の可能性からなる群から選択される、実施形態21に記載の方法。
実施形態23.1つ以上の治療属性は特定の治療に対する反応の可能性である、実施形態21または22に記載の方法。
実施形態24.特定の治療は抗TNF治療である、実施形態21-23のいずれか1つに記載の方法。
実施形態25.治療属性の少なくとも1つに関して少なくとも2つの異なるカテゴリーを表す対象中で発現されたRNAの配列データを分析することによって、1つ以上の治療属性に関して対象を層別化するための分類子を開発する方法において、改善は、
配列データから1つ以上の一塩基多型(SNP)の存在を評価すること、および、
1つ以上のSNPの存在が少なくとも1つの治療属性と相関すると決定すること、および、
分類子に1つ以上のSNPを含めること、
を含む、方法。
実施形態26.1つ以上の治療属性は、特定の疾患、障害、または疾病を発症するリスク、特定の疾患、障害、または疾病のための特定のアウトカムの可能性、特定の治療に対する反応性の可能性からなる群から選択される、実施形態25に記載の方法。
実施形態27.1つ以上の治療属性は特定の治療に対する反応の可能性である、実施形態25または26に記載の方法。
実施形態28.特定の治療は抗TNF治療である、実施形態25-27のいずれか1つに記載の方法。
実施形態29.1つ以上のSNPの存在を評価することは、RNAの配列データを参照ヒトゲノムと比較することを含む、実施形態25-28のいずれか1つに記載の方法。
実施形態30.自己免疫疾患に苦しむ対象を処置する方法であって、上記方法は、
(a)コンピューティングデバイスのプロセッサによって、対象の1つ以上の遺伝子の各々の発現レベルに対応するデータを受信する工程であって、ここで、遺伝子は表1から選択される、工程と、
(b)プロセッサによって、工程(a)で受信されたデータを使用して、抗TNF治療に反応性または非反応性であるとして対象の分類を自動的に決定する工程と、任意選択的に、
(c)抗TNF治療に非反応性であるとして対象が分類される場合、自己免疫疾患の処置のために、対象に抗TNF治療の代替物を投与する工程、または、抗TNF治療に反応性であるとして対象が分類される場合、抗TNF治療を投与する工程と、
を含む、方法。
実施形態31.工程(a)におけるプロセッサは、
1つ以上の臨床的特徴、または、
1つ以上の一塩基多型(SNP)
の少なくとも1つに対応するデータをさらに受信する、実施形態30に記載の方法。
実施形態32.1つ以上の臨床的特徴は、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、処置反応率(例えば、ACR20、ACR50、ACR70)、およびそれらの組み合わせから選択される、実施形態30または31に記載の方法。
実施形態33.自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎から選択される、実施形態30-32のいずれか1つに記載の方法。
実施形態34.自己免疫疾患は関節リウマチまたは潰瘍性大腸炎である、実施形態30-33のいずれか1つに記載の方法。
実施形態35.抗TNF治療の代替物は、リツキシマブ、サリルマブ、トファシチニブクエン酸塩、レフノミド、ベドリズマブ、トシリズマブ、アナキンラ、およびアバタセプトから選択される、実施形態30-34のいずれか1つに記載の方法。
実施形態36.抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、またはそれらのバイオシミラーから選択される、実施形態30-34のいずれか1つに記載の方法。
実施形態37.工程(b)は、機械学習モデルを使用して前記分類を自動的に決定することを含む、実施形態30-36のいずれか1つに記載の方法。
実施形態38.機械学習モデルはランダムフォレストモデルである、実施形態37に記載の方法。
実施形態39.工程(b)は、臨床共変動分類子(CC)を使用せずに、前記分類を自動的に決定することを含む、実施形態30-38のいずれか1つに記載の方法。
実施形態40.工程(b)は、組み合わされたゲノム-臨床分類子(GCC)を使用せずに、前記分類を自動的に決定することを含む、実施形態30-38のいずれか1つに記載の方法。
実施形態41.工程(b)は、臨床共変動分類子(CC)を使用せずに、および組み合わされたゲノム-臨床分類子(GCC)を使用せずに、前記分類を自動的に決定することを含む、実施形態30-38のいずれか1つに記載の方法。
実施形態42.方法であって、上記方法は、
(a)コンピューティングデバイスのプロセッサによって、自己免疫疾患(例えば、関節リウマチ)に苦しむ対象の1つ以上の遺伝子の各々の発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11すべてのメンバー)を含む、工程と、
(b)プロセッサによって、工程(a)で受信されたデータを使用して、抗TNF治療に非反応性であるとして対象の分類を自動的に決定する工程と、任意選択的に、
(c)疾患の処置のために第2の治療(例えば、第1の治療の代替物、例えば、抗TNF治療の代替物)を対象に処方および/または投与する工程であって、それによって、対象への第1の治療の処方および/または投与を回避する、工程と、
を含む、方法。
実施形態43.方法であって、上記方法は、
(a)コンピューティングデバイスのプロセッサによって、疾患(例えば、自己免疫疾患、例えば、関節リウマチ)に苦しむ対象の各々の1つ以上の遺伝子の発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバー(例えば、1、2、3、4、5、6、7、8、9、10、または11すべてのメンバー)を含む、工程と、
(b)プロセッサによって、工程(a)で受け入れられたデータを使用して、第1の治療(例えば、抗TNF治療)に反応性であるとして対象の分類を自動的に決定する工程と、任意選択的に、
(c)疾患の処置のために、対象への第1の治療を処方および/または投与する工程と、
を含む、方法。
実施形態44.工程(b)は、機械学習モデル(例えば、ランダムフォレストモデル)を使用して、前記分類を自動的に決定することを含む、実施形態42または43に記載の方法。
実施形態45.工程(b)は、臨床共変動分類子(CC)を使用せずに、および組み合わされたゲノム-臨床分類子(GCC)を使用せずに、前記分類を自動的に決定することを含む、実施形態43-44のいずれか1つに記載の方法。
実施形態46.対象のゲノムデータ(例えば、次世代RNA-seqデータ)の解析のための(例えば、および、前記ゲノムデータに基づいて前記対象の分類を決定するための)パイプライン(例えば、コンピュータアーキテクチャパイプライン)であって、前記パイプラインは複数のモジュールを含み、各モジュールは、前記モジュールの更新後に独立して検証されることができる、パイプライン。
実施形態47.前記複数のモジュールは1つ以上の機械学習モデルを含む、実施形態46に記載のパイプライン。
実施形態48.前記複数のモジュールは、1つ以上の既知のバイオインフォマティクスモジュール(例えば、RSEMおよび/またはSTAR)と、1つ以上の独自の分類モジュールとを含む、実施形態46または47に記載のパイプライン。
実施形態49.自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、前記抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法であって、上記方法は、
(a)コンピューティングデバイスのプロセッサによって、以下からなる群から選択される1つ以上の遺伝子のそれぞれの上記対象に対する発現レベルに対応するデータを受信する工程と、
【0215】
【表9】
(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対して反応性または非反応性であるとして対象の分類を自動的に決定する工程と、
を含む、方法。
実施形態50.(c)工程(b)において、抗TNF治療に非反応性であるとして対象が分類される場合、自己免疫疾患の処置のために、対象に抗TNF治療の代替物を処方および/または投与する工程、または、工程(b)において、抗TNF治療に反応性であるものとして対象が分類される場合、抗TNF治療を対象に投与する工程をさらに含む、実施形態49に記載の方法。
実施形態51.工程(a)におけるプロセッサは、
(i)対象の1つ以上の臨床的特徴、
(ii)対象のための1つ以上の一塩基多型(SNP)、
の少なくとも1つに対応するデータをさらに受信する、実施形態49または50に記載の方法。
実施形態52.工程(a)におけるプロセッサは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを受信する、実施形態49-51のいずれか1つに記載の方法。
実施形態53.工程(a)におけるプロセッサは、表5に示される1つ以上のSNPに対応するデータを受信する、実施形態49-52のいずれか1つに記載の方法。
実施形態54.自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎からなる群から選択されるメンバーである、実施形態49-53のいずれか1つに記載の方法。
実施形態55.自己免疫疾患は関節リウマチまたは潰瘍性大腸炎である、実施形態49-54のいずれか1つに記載の方法。
実施形態56.抗TNF治療の代替物は、リツキシマブ、サリルマブ、トファシチニブクエン酸塩、レフノミド、ベドリズマブ、トシリズマブ、アナキンラ、およびアバタセプトからなる群から選択される少なくとも1つのメンバーを含む、実施形態49-55のいずれか1つに記載の方法。
実施形態57.抗TNF治療は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、および前述のもののいずれかのバイオシミラーからなる群から選択される少なくとも1つのメンバーを含む、実施形態49-55のいずれか1つに記載の方法。
実施形態58.抗TNF治療の代替物は、インフリキシマブ、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリルマ、および前述のもののいずれかの任意のバイオシミラーからなる群の任意のメンバーを含まない、実施形態44-52のいずれか1つに記載の方法。
実施形態59.工程(b)は、機械学習モデルを使用して前記分類を自動的に決定することを含む、実施形態49-58のいずれか1つに記載の方法。
実施形態60.機械学習モデルはランダムフォレストモデルである、実施形態59に記載の方法。
実施形態61.工程(b)は、臨床共変動分類子(CC)を使用せずに前記分類を自動的に決定することを含む、実施形態49-60のいずれか1つに記載の方法。
実施形態62.工程(b)は、組み合わされたゲノム-臨床分類子(GCC)を使用せずに、前記分類を自動的に決定することを含む、実施形態49-60のいずれか1つに記載の方法。
実施形態63.工程(b)は、臨床共変動分類子(CC)を使用せずに、および組み合わされたゲノム-臨床分類子(GCC)を使用せずに、前記分類を自動的に決定することを含む、実施形態49-60のいずれか1つに記載の方法。
実施形態64.自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、前記抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類する方法であって、上記方法は、
(a)コンピューティングデバイスのプロセッサによって、自己免疫疾患に苦しむ対象の1つ以上の遺伝子の各々の発現レベルに対応するデータを受信する工程であって、前記1つ以上の遺伝子は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも1つのメンバーを含む、工程と、
(b)プロセッサによって、工程(a)で受信したデータを使用して、抗TNF治療に対する反応性または非反応性である可能性が高いとして対象の分類を自動的に決定する工程と、
を含む、方法。
実施形態65.対象が抗TNF治療に非反応性であると工程(b)で分類される場合に、自己免疫疾患の治療のために抗TNF治療の代替物を対象に処方および/または投与する工程、または、対象が抗TNF治療に反応性であると工程(b)で分類される場合に、抗TNF治療を対象に投与する工程と、をさらに含む、実施形態64に記載の方法。
実施形態66.自己免疫疾患は関節リウマチである、実施形態64または65に記載の方法。
実施形態67.工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも2つの遺伝子の各々の発現レベルに対応するデータを受信することを含む、実施形態64-66のいずれか1つに記載の方法。
実施形態68.工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも3つの遺伝子の各々の発現レベルに対応するデータを受信することを含む、実施形態64-66のいずれか1つに記載の方法。
実施形態69.工程(a)は、CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3からなる群から選択される少なくとも5つの遺伝子の各々の発現レベルに対応するデータを受信することを含む、実施形態64-66のいずれか1つに記載の方法。
実施形態70.工程(a)におけるプロセッサは、
(i)対象の1つ以上の臨床的特徴、
(ii)対象のための1つ以上の一塩基多型(SNP)、
の少なくとも1つに対応するデータをさらに受信する、実施形態64-69のいずれか1つに記載の方法。
実施形態71.工程(a)におけるプロセッサは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを受信する、実施形態64-70のいずれか1つに記載の方法。
実施形態72.工程(a)におけるプロセッサは、表5に示される1つ以上のSNPに対応するデータを受信する、実施形態64-71のいずれか1つに記載の方法。
実施形態73.自己免疫疾患に苦しんでいる対象を、前記対象への抗TNF治療の任意の投与の前に、前記抗TNF治療に反応性である可能性が高い、または非反応性である可能性が高いと分類するためのシステムであって、上記システムは、
プロセッサと、
内部に命令を有するメモリと、を含み、上記命令は、プロセッサによって実行されるときに、プロセッサに:
(a)以下からなる群から選択される1つ以上の遺伝子のそれぞれの前記対象に対する発現レベルを含むデータのセットを受信させ、
【0216】
【表10】
および、(b)データのセットを用いて、抗TNF治療に対して反応性または非反応性であるとして対象の分類を自動的に決定させる、システム。
実施形態74.データのセットは、
(i)対象の1つ以上の臨床的特徴、
(ii)対象のための1つ以上の一塩基多型(SNP)、
の少なくとも1つに対応するデータをさらに含む、実施形態73に記載のシステム。
実施形態75.データのセットは、肥満度指数(BMI)、性別、年齢、人種、以前の治療処置、疾患期間、C反応性タンパク質(CRP)レベル、抗環状シトルリン化ペプチドの存在、リウマチ因子の存在、患者の包括的評価、および処置反応率(例えば、ACR20、ACR50、ACR70)からなる群から選択される対象の1つ以上の臨床的特徴に対応するデータを含む、実施形態74に記載のシステム。
実施形態76.データのセットは表5に示される1つ以上のSNPを含む、実施形態74または75に記載のシステム。
実施形態77.自己免疫疾患は、関節リウマチ、乾癬性関節炎、強直性脊椎炎、クローン病、潰瘍性大腸炎、慢性乾癬、化膿性汗腺炎、および若年性特発性関節炎からなる群から選択されるメンバーである、実施形態74-76のいずれか1つに記載のシステム。
実施形態78.自己免疫疾患は関節リウマチまたは潰瘍性大腸炎である、実施形態74-76のいずれか1つに記載のシステム。
実施形態79.自己免疫疾患は関節リウマチである、実施形態74-76のいずれか1つに記載のシステム。
【実施例】
【0217】
実施例1
導入
RAなどの自己免疫疾患は、集団で数百万人の患者に影響を与え、その処置は医療費全体の大きな部分を占めるため、患者のアウトカムを改善するために注意が必要である。
【0218】
自己免疫疾患は、臓器特異的な自己免疫と全身的な自己免疫の2つの群に分けることができる。関節リウマチ(RA)を含むリウマチ様疾患は、主に滑膜性の連結に現れ、最終的に腱、軟骨、および硬骨の不可逆の破壊を引き起こす全身性自己免疫疾患に属する。RAに対する現在の治療法はないが、主に、このサイトカインの炎症誘発性シグナル伝達を中和するように作用する抗TNF剤の開発を通じて、これらの患者の処置を管理するために大幅な改良がなされてきた。そのような治療(Humira、Enbrel、Remicade、Simponi、Cymzia)は、一部のRA患者の処置アウトカムを大幅に改善した。
【0219】
RA患者の約3分の1は、抗TNF治療に対する臨床反応を示し、時々、寛解を達成する。これらのいわゆる「レスポンダー」患者を疾患進行は、不適切なTNF駆動型炎症誘発性反応の結果である可能性がある。
【0220】
RAを処置するために最も広く使用される生物学的治療は抗TNFである。このクラスの薬物を導入することで、一部の患者のLDAあるいは寛解の達成によりRAの処置が変わった。しかし、これらの処置標的に到達する患者の割合は低く、複数の臨床研究にわたって約34%である。抗TNFに反応しない患者のために、抗CD20、共刺激遮断、JAK、および抗IL6治療などの利用可能な、代替的な承認された治療が存在する。しかし、患者は、様々な抗TNFによる第1のサイクリングの後にのみ、そのような代替的な治療に切り替えられ、これには1年以上かかる可能性があり、その間も症状は存続し、疾患はさらに進行し、処置標的に到達するのがより困難になる。
【0221】
患者をできるだけ早くLDAまたは寛解に導き、障害の進行を止めるか、あるいは最小限に抑えるという標的治療の概念は広く受け入れられているが、多くの患者において実現することが難しい場合がある。RAは、リウマチ学者および患者による臨床評価に基づいて、疾患重症度の尺度を使用して評価される。軽度、中等度、または重度の疾患活性は、RAの場合には、腫脹関節および圧痛関節の数の評価;疼痛、機能、および全体的な健康に関する患者および医師により報告された評価;ならびに、血清バイオマーカーレベル(これは組み合わせられた時に疾患活性スコア(DAS)を生成する)を使用して決定される。中等度から重度の疾患活性は、患者の症状がもはや有効に管理されていないことを示す。治療に対する反応は、DASの変化を使用してモニタリングされ、LDAまたは寛解のレベルに対応する国際的に合意されたDAS28スコアを処理する。
【0222】
RAは、多くの複雑な疾患と同様に、サンプルの取り扱い、ライブラリの調製、および、血液vs滑膜のRAにおける生物学的シグナルの低下によるコホート間の再現性の欠如は、共通の症状のエンドポイントを共有する様々な疾患の集まりであり、したがって、個々の疾患の生物学に最適な標的療法が患者に処方されるためには、個別化医療へのアプローチが必要とされる。所定の治療に対する反応率が低く、深刻な副作用がそれぞれに関連し、患者に提供するために代替的で効果的な治療が利用できる場合、複雑な疾患における個別化されたヘルスケアは特に意味がある。これらの因子はすべてRAに適応される。補完療法医により個人の生物学を標的とすることによって、医師、患者、および支払者は最も効率的に治療目標を達成する。加えて、独自の疾患生物学に基づいて、既存の治療法に対するノンレスポンダーを特異的に標的とする新しい治療法を開発する必要がある。これは、現在の標準治療療法に反応しない患者に関連する高い薬物費、一般医療費、および社会的費用を考慮すると、さらに重要となる。
【0223】
治療開始前に抗TNFに対する非反応を予測する検査により、患者は現在の標準治療と比較してより早く代替治療に切り替えることができ、より多くの患者がLDAまたは寛解の治療標的に到達する。そのような予測的な反応試験およびその患者ケアに対する影響は、患者への実質的な臨床的利益およびヘルスケアシステムへの節約をもたらす。
【0224】
治療の作用機序と、分子レベルでの所定の患者の活性な疾患メカニズムを一致させることで、反応率が大幅に改善し、より多くの患者が低い疾患活性(LDA)または寛解の処置ゴールに到達することができる。処置標的の達成は、代替療法を検討する前に疾患の症状が著しく悪化するのを待つという日常的な慣行と比較して、初期段階でRA患者にとって有意に意味のある臨床的利益をもたらす。
【0225】
図6Aは、選択された特徴(n=75)、モデル訓練(n=185)、モデル検証(n=46)に使用されるコホートのフローチャートである。
図6Bは、
図6Aのコホート1における特徴選択プロセスを説明するプロセスである。POCデータセットは、
図6Aのコホート1のデータセットを指す。データの80%を、U試験を使用して分類子を訓練するために使用して、最も弁別的な遺伝子(discriminative genes)を同定し、80%のデータを、10分割交差検証を使用して10の群に分割して、最終決定された特徴セットを得る。最終決定された特徴セットを、データの残りの20%のモデル訓練および評価に使用する。このプロセスを、少なくとも100回繰り返す。
図6Cは、コホート1に適用された特徴選択方法のフローチャートである。
【0226】
結果
抗TNF治療に対する反応を予測するバイオマーカーの識別。本試験では、抗TNF治療に対するレスポンダーとノンレスポンダーとを識別する予測的なバイオマーカーを、Bienkowskaらによって公開された公に利用可能なデータセットから選択し(コホート1)、CORRONAから購入した231の関節リウマチ患者のコホート間でさらに評価し(コホート2)、その内、185(80%)のサンプルをモデル訓練に使用し、46(20%)を検証に使用した。コホートの説明については材料および方法を参照し、特徴選択、モデル訓練、およびモデル検証に使用されたサンプルのフローチャートについては
図6Aを参照されたい。
【0227】
コホート1のサンプル中の特徴選択に使用される方法を、
図6Cに示す。データセット中の合計21,818の遺伝子転写産物のうち、ランダムフォレストを使用した20%の保留された交差検証の100ラウンドのうち30ラウンドにおいて、38の遺伝子転写産物が識別力のあるものとして選択された(
図7A)。予測的な遺伝子が選択されたモデルを、交差検証の100ラウンドにわたってすべての保留された検証セットサンプルからのスコアを集約することによって評価した。ここで、レスポンダーは、集約されたランダムフォレストモデルによって出力されたノンレスポンダースコアと比較して、大幅に高いスコアを有することが分かった(p<0.0001)(
図7B)。集約されたスコアにより、60%の曲線下面積(AUC)が結果としてもたらされ(
図7C)、これにより、予測的な遺伝子が選択されるモデルは、レスポンダーとノンレスポンダーを有意に識別することができることが示唆された。
【0228】
38の選択された遺伝子を考慮したときのサンプル間の変動が、主成分分析(PCA)によって
図7Dで示される。ここで、データ中で説明された大半の変動(22%)は、第1の主成分(PC1)に沿っており、反応状態(レスポンダーvsノンレスポンダー)に大きく関連し、これらの38の選択された遺伝子の遺伝子発現プロファイルがレスポンダーとノンレスポンダーの間で異なっていることが示される。
【0229】
クロスプラットフォームモデルの最適化および訓練。コホート1から選択した38の予測的な遺伝子を、CORRONA(コホート2)から集めた231の関節リウマチ患者の間でさらに評価した。重要なことに、これらの2つのコホートからのデータを、2つの異なるプラットフォーム、すなわち、マイクロアレイ(コホート1)とRNASeq(コホート2)を介して生成し、新規なRNASeqプラットフォーム上で選択された特徴を使用して、モデルを再訓練する必要がある。コホート1で識別された38の予測的な遺伝子のうち28の予測的な遺伝子はコホート2の訓練内で検出可能であり、最終決定されたモデル開発のために評価した。コホート2中の231人の患者のうち80%(n=185)を、エンドポイント、包含基準、最終決定された特徴セット、およびモデル訓練の最適化のために使用し、残りの20%(n=46)を保留された検証のために取っておいた。
【0230】
包含基準の最適化のために、すべての訓練セット患者(
図8A)の間で、ならびに、RFとCCPの両方で試験結果が血清陽性であった訓練セット患者のみ(
図8B)で、モデルを構築した。血清陰性が線維筋痛症と強く関連し、かつ、あまり正確ではない反応評価に結びつく可能性があり、場合によっては、誤標識されたサンプルでの訓練に結びつく可能性があるという観察により、血液陽性度をモデル訓練のための包含基準として調べた。これらの2つの集団内では、様々な臨床エンドポイント(ACR50 3m、ACR50 6m、CDAI 3m、CDAI 6m、EULAR 3m、およびEULAR 6m)を使用する場合のモデルを評価した。レスポンダーとノンレスポンダーが各エンドポイントによってどのように定義されたかに関する情報については、材料および方法を参照されたい。
【0231】
最も高いモデル性能は、臨床エンドポイントとしてACR50 6mを使用する男女の血清陽性患者(n=90、
図6Aを参照)で構築されたモデルで達成された。ここで、72%の中央値AUCは、10回反復された10%の保留された交差検証の50の反復において達成された。このモデルの性能は、他のエンドポイントまたは包含基準で構築されたモデルよりも有意に高かった(p<0.0001)。その高性能のために、このモデルを、さらなる評価および保留された検証のために選択した。
【0232】
臨床エンドポイントとしてACR50 6mを使用して、男女の血清陽性患者で構築した中央値モデルを、
図9A~9Dで詳述される。10%の保留された交差検証の10のラウンド後、検証セットサンプルのスコアを集約すると、ノンレスポンダーと比較して、レスポンダーで有意に高いスコアを結果としてもたらし(p<0.00001)(
図9C)、72%のAUCと関連している(
図9A)。
【0233】
図9Bは、集約された検証セットサンプルに基づいて計算した陰性的中率(NPV)vs真陰性率(TNR)を示す。ここで、0.89のNPVは、0.55のTNRで達成され得る。この選択された最適なスコアカットオフ(0.29)で予測された分類と真の分類との合致を示す混同行列を、
図9Dに示す。
【0234】
選択されたモデル性能は、年齢、BMI、患者の疼痛、および圧痛関節と腫脹関節の数などの臨床ベースライン共変量を使用して構築されたモデルに対する分類精度の比較によって、さらに評価した。血清陽性患者の間でRNAのみ、RNAと共変量、ならびに共変量のみを使用し、臨床のエンドポイントとしてACR50 6mを使用して構築したモデルの箱ひげ図を、
図10A~10Bに示す。最も高いモデルAUCがRNAのみ(0.72の中央値AUC)で構築したモデルで達成され、これは共変量のみ(0.59の中央値AUC)で構築したモデル(p<0.00001)、ならびに、共変量と組み合わせたRNAで構築したモデル(0.70の中央値AUC、p<0.005)よりも有意に高いことが分かった。
【0235】
特徴の堅牢さは、10%の交差検証の50ラウンドを通じて、(28のうち)上位15の特徴でそれらの選択頻度を測定することによって評価した(
図11)。無作為に、選択の予想された数は、シミュレーションによって2,679(54%)であると決定された。11の遺伝子(CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3)が、可能性のある5,000の選択(80%)のうち4,000より多くで選択され、それらは無作為の予想よりも高頻度で選択されたことから、評価された28の遺伝子候補のうち最も堅牢なサブセットと考えられる。選択頻度の実質的な低下は上位11の後に観察され、次に最も頻繁に選択された遺伝子は5,000の可能性のある選択の54%のみで選択された。それらが無作為の予想よりも大きな頻度で選択されなかったため、これらの残りの17の遺伝子は、最終決定されたモデル開発および検証に考慮しなかった。
【0236】
抗TNF治療に対する反応の予測のために最適化されたモデルの検証。同じCORRONA研究コホートの一部であったが、そのRNAが最終モデル検証の目的で後に配列決定された追加の46人の患者によって、分類子パフォーマンスをさらに評価した。モデル検証のための保留された46のサンプルのうち35のサンプルを、治療開始の6ヶ月後にフォローアップし、モデル検証に使用した。90の訓練サンプルのフルセットを使用して、入力(CORO2B、STOML2、CHMP7、SPINT2、CYSLTR2、SSNA1、IMPDH2、GOLGA1、SUOX、ARPC1A、およびKLHDC3)として11の選択された遺伝子で最終決定されたランダムフォレストモデルを訓練した。モデル検証の結果は
図11に示され、0.72のAUC、0.85のNPV、および0.61のTNRを達成した。訓練データ(
図9Cを参照)から決定された最適なモデルカットオフ(0.29)を、混同行列生成に使用した(
図9D)。血清陽性患者のみ(n=23)でのモデル検証の結果を
図13A~13Dに示す。
【0237】
考察
私たちの知る限り、関節リウマチにおける抗TNF治療への反応を予測するバイオマーカーを選択し、最適化し、およびクロスコホートのクロスプラットフォーム解析で検証したのはこれが初めてである。ここで、遺伝子発現がマイクロアレイ(Affymatrix)を介して定量化された公に利用可能なデータセットから、28の予測的な遺伝子を選択した。RNASeqプラットフォーム上でのモデルの最適化後に、28の遺伝子のサブセット(11)を使用して、72%の検証されたAUC、0.85のNPV、0.61のTNRを有することが示されたモデルを構築した。これらの結果は、遺伝子発現プロファイルを使用して、抗TNF治療に対する非反応を再現性よく予測できることを示唆しており、このプロファイルは、ノンレスポンダーをスクリーニングして代替療法を調査し、その後、RAの処置のために処方された抗TNF治療の反応率を増加させる可能性がある。
【0238】
現在、抗TNF反応を予測する臨床的に有用な分類子がないのは、研究コミュニティー側の努力不足によるものではない。リウマチ因子(RF)および抗環状シトルリン化ペプチド(CCP)は、RAを診断するために使用されるバイオマーカーであり、患者の約80%で見られる。これらの循環するバイオマーカーのレベルは、リツキシマブに対する反応と相関していたが、その傾向は緩やかであり、臨床的に有用なほど十分な有用性はなかった。抗TNFおよび代替療法による処置に対する反応の遺伝的リスク遺伝子座の予測値を評価するために、多くの遺伝子関連性試験が行われている。関連性は認められたが、効果の大きさは中程度であった。ある試験では、トシリズマブで処置された患者において、リスクアレルごとにDAS28スコアの変化の2%しか説明され得ないことが推定された。抗TNFに対する反応を予測する8つの異なる遺伝子発現シグネチャーを試験した独立した試験では、ほとんどのシグネチャーは、臨床的に有用となるのに十分な予測値を示さなかった。また、いくつかの試験では、独立した患者コホートにおいて、様々な分類子が要求される性能基準を満たすことができないことが説明されている。RAの治療として認められている代替物である、トシリズマブおよびリツキシマブに対する反応を予測するための分類子も公開されているが、これらは、患者の独立したコホートでは確認することができなかった。これらの試験の多くに共通していることは、使用されている解析の枠組みが、遺伝学的データと臨床結果のデータセットの間の数学的相関を探すだけということである。その結果、これらの分類子の多くがうまく機能しない理由や、独立した患者コホートで結果を再現できない理由を説明する生物学的な状況を把握することができない。
【0239】
血液または組織からのRNAカウントは、個々の患者の疾患生物学を説明するために必要な情報を含んでいる。しかし、全体のトランスクリプトーム解析(方法を参照)によって生成された特徴(RNA)が多く、かつサンプルが比較的すくないことから、患者の疾患生物学に関わる原因遺伝子のより少ないセットを特定することが常に課題となっている。サンプルサイズを増やすための一つのアプローチは、一般に公開されているデータセットから収集した情報を活用することであるが、研究デザインの違い、特にRNA定量化のためのプラットフォームの違いは、コホート間の直接的な翻訳に問題がある。遺伝子発現データセットのクロスプラットフォーム分析は、結核を含む領域の診断法の開発のために、広く研究されている研究対象である。本試験では、バイオマーカーを、マイクロアレイによって生成されたデータセットから同定し、RNASeqデータセット内でさらに評価した。これらの2つのプラットフォーム上で生成されたデータは高度に相互に関連することが示されたが、ダイナミックレンジの差により、一方のプラットフォーム上での診断モデル開発と、もう一方のプラットフォームでの検証に課題が生じる。本試験では、マイクロアレイデータセットを使用して、遺伝子発現データの高い次元を、反応に関連する少数の遺伝子まで減少させ、その結果、我々のRNASeqデータセット内でより標的化されたアプローチを得ることができた。いずれかのプラットフォーム上で構築された交差検証モデルは、一貫したパフォーマンスを有することが示された。
【0240】
抗TNF治療に対する反応に関する容認された臨床定義が多くあり、かつゴールドスタンダードがないため、データが入手可能であるすべてのエンドポイントを評価し、訓練セットサンプル間の患者のベースライン遺伝子発現プロファイルによって最もよく反映されたエンドポイントを決定することを選択した。モデル性能に対する最大の影響は、クラスラベルに使用された臨床エンドポイントであることが分かった。CDAI 3m、CDAI 6m、およびEULAR 6mなどのある臨床のエンドポイントは、無作為(AUC 50%)を有意に上回って実施することができなかったが、ACR50 6mおよびEULAR 6mなどの他の臨床のエンドポイントは72%もの高い中央値AUCを達成した。これらのエンドポイントが互いと高度に相関するため、この知見は、わずかな割合の誤標識サンプルがモデル全体の性能に大きな影響を有し、次に、いくつかのエンドポイントは患者の転写プロファイルによってより良好に反映されることを示唆している。将来の試験は、臨床的なエンドポイントと患者のトランスクリプトームとの関係をさらに調査し、どのようなエンドポイントが生物学的に最も関連し得るのかについての洞察を得る必要がある。
【0241】
血清陽性の患者は、共有の類似する疾患の進行を有し、より重症のRAを有する可能性がより高いことが示されている一方、血清陰性のRA患者は、乾癬関連関節炎または脊椎関節症など、異なる形態の炎症性関節炎を有すると仮定されているため、包含基準としての血清陽性を調査した。したがって、診断モデル開発のための血清陽性の患者の選択は、血清陽性と血清陰性の患者の両方を組み合わせるよりも、異種性の低いRA集団であると考えられ得る。我々のモデル訓練から血清陰性の患者の取り除くことで、結果として、モデルAUCのより高い中央値と標準偏差の両方がもたらされた。
【0242】
共変量分析。我々のRNAベースの遺伝子発現試験の堅牢さをさらに実証するために、ベースラインで臨床共変量を使用して構築されたモデルに対する比較を行った。RNAのみを用いて構築されたモデルが、臨床共変量を使用したモデルよりも非常に良好な性能を示したという事実により、病院の訪問中にベースラインで得ることができる他の簡易な測定よりも、トランスクリプトームから得た情報価値が示される。
【0243】
TNF-αは、炎症と微生物免疫および多くのホメオスタシスの生理機能の強力かつ中央のメディエーターである。それは、RAを含む自己免疫疾患の処置のための抗TNF-α薬物の重要な標的である。TNF-αは膜貫通タンパク質として発現され、その遺伝子発現は3つの転写因子、すなわち、核因子kB(NF-κB)、c-6-Junアクチベータータンパク質-1(AP1)、および活性化T細胞(NFAT)に関連する核因子によって調節される。そのコグネイト受容体にTNF-αを結合すると、結果的に細胞死または細胞活性化に至り得るシグナル伝達経路活性の複合体および多様なアレイが引き起こされる。TNF-α受容体活性化は、炎症誘発性のサイトカイン、ケモカイン、およびプロスタグランジンの合成を引き起こす。さらに、TNF-αは白血球遊走にとって不可欠な細胞骨格の再構成を調節する。TNF-α活性化のこの多面発現性の役割は、分類子に含まれる遺伝子によってコードされる11のタンパク質のうち9つの機能に反映される。2つは炎症促進機構に関与し、5つは細胞骨格のリモデリングおよび機能に関与し、1つはNF-κBレギュレーションに関与し、2つはT細胞活性化に関与する。例えば、システイニルロイコトリエン受容体2(CYSLTR2)は、Gタンパク質共役受容体(GPCR)であり、GPCRは、顆粒球、マクロファージ、およびマスト細胞(PMID:25572555)などの活性化された先天性免疫細胞によって迅速に生成されたロイコトリエン-炎症誘発性の脂質メディエーターによって活性化される。このクラスのGPCRは、走化性、脱顆粒、およびスーパーオキシドアニオンの産生を含む様々な白血球機能を引き起こす。
【0244】
細胞骨格のリモデリングの役割は、この分類子において顕著に目に見える。細胞骨格は、細胞の形状、運動性、内部組織、および小器官と小胞の移動に関与する3次元の細胞内タンパク質性のネットワークである。細胞骨格の構成要素とRA疾患生物学の相互作用はおそらく多面的である。動的なアクチンリモデリングは、炎症部位への免疫細胞の効率的なホーミングおよび血管外遊出にとって重要である。サイトカインの一時的で極性化された放出は、細胞骨格のリモデリングに依存する。細胞骨格の構成要素が我々の分類に多く含まれていることは、細胞骨格がRA疾患の生物学において、これまで理解されてきたよりも中心的な役割を担っており、抗TNF-α治療に対する非反応を予測する上で極めて重要であり得ることを示唆している。
【0245】
自己抗原は、RAなどの自己免疫疾患の中心となる不適切な免疫応答を確立する際に重大な構成要素であり、したがって、自己抗原が我々の分類子において強調されるのは当然のことである。RAの免疫学的特徴は、免疫グロブリン(Ig)GのFc部分に対して向けられた自己抗体のファミリーである、リウマチ因子(RF)を含む血液中の自己抗体の存在である。我々の分析は、RAに関連する2つのさらなる自己抗原遺伝子、すなわち、GOLGA1とNA14を同定した。GOLGA1はゴルジン-97をコードし、ゴルジン-97は、ゴルジ(5)への輸送小胞を局在化する分子テザーである。さらに、ゴルジン-97を排除すると、NF-κBが活性化される。NA14は、シェーグレン症候群として知られる別の自己免疫疾患の特徴的な自己抗原であり、これは、涙と唾液を作る腺を攻撃する。さらに、細胞骨格の構成要素であるアクチンおよびミオシンに対する自己抗体は、一部のRA患者血清(PMID:12447636)において濃縮される。
【0246】
RAなどの免疫媒介性疾患に関与する遺伝子と環境要素。RAを有するリスクは、患者の一等親血縁者で増加し、一卵性双生児では自己免疫の一致率が比較的高く(40%)、このことは、免疫媒介性疾患の病因における遺伝的要素を示している。過去10年間で、一塩基多型(SNP)とヒトおよびマウスのゲノムのハプロタイプマップが利用可能になり、非常に大規模で十分に特徴付けられた患者コホートからのDNAの分析と相まって、ヒト自己免疫疾患に関連して発見された遺伝子の数の爆発的な増加が見られた。しかし、免疫媒介性疾患の一致は、有意ではあるものの、一卵性双生児では40%未満であり、環境要因とエピジェネティック要素もそのような疾患の発症において役割を果たすことが示唆されている。さらに、本試験では、アレル変異は、自己免疫の素因を高めるために進化したのではなく、食事、微生物叢、ビタミン、喫煙などの環境要素の結果として選択されたことが明らかにされている。結論として、自己免疫疾患の複雑さは、特定のRAで、多様なツールおよびメカニズムを使用して、様々な群によって確認される。これらの試験は、分子レベルでRAの異種性を実証し、なぜ単一の標的化処置がすべての患者に有効ではないのかを説明し、さらに我々の分類子の有意性を増大させる。本試験では、遺伝子ベースの分類子を使用して、RA患者における抗TNF治療に対する非反応を予測することができた。分類子中の遺伝子は、環境要因およびエピジェネティック要素によって影響を受ける可能性があるものを含む、新規で十分に研究されていない他の遺伝子に加えて、これらの既に既知の遺伝的リスク因子のいくつかと関連する。
【0247】
方法論
試験集団:コホート1-予測的な遺伝子を、Bienkowska et al.,Genomics,94:423-432(2009)(この全体が参照によって本明細書に組み込まれる)で公開されている公に利用可能なデータセットGSE15258から同定した。
【0248】
コホート2
・生物学的にナイーブな患者。
・Consortium of Rheumatology Researchers of North America(CORRONA)は、200165以来、米国で38,000人を超えるRA患者および彼らの医師から「実現世界」縦断データを収集してきた。データは、各レジストリ訪問で施設内倫理委員会/倫理委員会の承認を得て収集され、疾患重症度および活性、薬物、有害事象、生活の質、検査結果と画像化結果、および社会人口統計学的な情報65(socio-demographic information 65)を含む。
・CERTAIN試験は、CORRONAレジストリによって開始され、生物学的薬剤を開始しているか(生物学的にナイーブ)または切り換えている、中等度から重度の疾患活性を有するRA患者のデータを集めて比較し、抗TNF治療(Humira、Etanercept、Infliximab、Cimzia、およびSimponi)、ならびに作用薬物である代替メカニズム、アバタセプト、リツキシマブ、およびトシリズマブなどの生物学的な薬物の有効性および安全性を比較した。主要な比較有効性のエンドポイントは、登録前に少なくとも1つの抗TNF製剤に曝露された患者で、1年後に疾患活性が低い状態に到達することであった。患者訪問および血液検査は3ヶ月毎に義務付けられた。
・CERTAIN試験は、生物学的薬剤を開始または切り替えている>10人の臨床疾患活性スコア(CDAI)として定義された、中程度のレベルの疾患活性を有するすべての患者に開かれていた。さらに、PAXgene(商標) Blood RNAチューブを、ベースラインでCERTAIN患者から収集し、この試験前に-80℃で保存した。
・この回顧的バリデーション試験では、PAXgene全血RNAサンプルを、生物学的(b)DMARDの開始前に併用MTXにより処置し、3か月目のフォローアップ訪問時に>5mgの用量を変更せずに依然としてMTXを受けていたすべての患者から選択した。3か月の訪問後、患者は生物学的薬剤を中止することができる。患者は、ベースライン時または3か月のフォローアップ訪問時にヒドロキシクロロキン(プラケニル)の併用を許可されていたが、他のcsDMARDは許可されていなかった。患者は、3か月の訪問時にプレドニゾン(≦10mg/日)を許可された。より高用量(>10mg/日)のプレドニゾンが6か月の訪問時で許可された。臨床評価には、圧痛関節および腫脹関節の数、医師と患者の包括的な疾患活性スコア、患者の疼痛と疲労、および生活の質の調査が含まれていた。臨床試験は、全血球数、C反応性タンパク質、RF、および抗CCP力価を含んでいた。患者は、MTXまたはヒドロキシクロロキンの用量変更が必要な場合、あるいは、ベースライン時または3か月後の訪問時に他のcsDMARD治療により処置されている場合、本試験から除外された。プレドニゾン>10mg/日を投与されている患者も試験から除外された。
【0249】
抗TNF治療に対する反応の評価。出願人は、CDAI<10、DAS28CRP<2.9、あるいはACR50と同等の反応あるいはEULARの良好な反応によって定義された低い疾患活性を達成することとして反応を定義した。抗TNF治療に対する患者反応を、抗TNF治療開始から3か月および6か月後に評価した。
【0250】
RNA単離およびQC。miRNAを含む全RNAを、メーカーの説明書に従ってPAXgene Blood miRNA Kit(PreAnalytix)を使用して、PAXgene Blood RNAチューブから採取した血液から単離した。精製したRNAを、-80℃で保存した。Agilent Bioanalyzerを使用してRNA品質を評価し、NanoDrop ND-8000分光光度計を使用して、吸光度測定法によってサンプルの量を定量化した。RINが5未満でRNAが少なくとも1μgのサンプルを、GlobinClear処理へと進めた。
【0251】
グロビン枯渇およびcDNAライブラリ調製。グロビンmRNAを、メーカーの説明書に従ってGlobinClear-Human kit(Thermo Fisher)を使用して、血液由来の全RNAサンプルで枯渇させた。最終のグロビンmRNA枯渇RNAサンプルを、NanoDrop ND-8000分光光度計を使用して、吸光度測定法によって定量化した。
【0252】
Illumina TruSeq Stranded Total RNA方法を使用して、配列決定ライブラリを作成した。メーカーの説明書に従ってRiboZero Magnetic Goldキットを使用して、リボソームRNAを、ライブラリ生成の前に優先的に除去した。最終ライブラリをPCRによって増幅し、定量化し、正規化し、プールし、配列決定した。Nextseq 500シーケンサー上でライブラリを75サイクル実施し、1つのサンプル当たりの最低30Mのリードを標的とした。
【0253】
RNA-seq分析および遺伝子発現前処理。1人の患者当たり平均~40.2Mのリードを捕捉し、範囲は33.7~47.5Mであった。遺伝子ごと、および転写産物ごとの値は、(i)Spliced Transcripts Alignment to a Reference(STAR)アライナーを有するGRCh37バージョンのHuman Genome Assemblyに、短い50-mereリードをマッピングし[Dobinら、2013年]、その後、Expectation-Maximization(RSEM)ソフトウェアパッケージによるRNA-Seqにより、転写産物存在量を定量化することによって、導き出された。生カウントを分析で使用した。
【0254】
統計分析。統計分析はすべて、Python 2.7.15を使用して実施した。
図6Aは、最終モデル開発に使用した包含基準と同様に、特徴選択、モデル訓練、およびモデル検証に使用したコホートのフローチャートを詳述する。
図6Bは、コホート1中の予測的な遺伝子の同定に使用した方法のフローチャートを詳述する。交差検証の100のラウンド全体にわたって、サンプルの80%を、特徴選択およびモデル訓練のために無作為に選択した。80%の訓練サンプルのうち、マン・ホイットニーのU検定を使用して、レスポンダーとノンレスポンダーの間の発現において有意差がない特徴を除去した(p>0.05)。残りの特徴を、その後、10分割の交差検証全体にわたって評価し、その交差検証では、その平均減少不純物に基づいて各特徴をランク付けするためにランダムフォレストを使用した。5/10交差検証分割の上位100にランク付けされた特徴は、20%の保留された検査サンプルで試験されるランダムフォレストモデルを構築するために使用した。このプロセスを100回反復し、100回の反復のうち30回の反復において選択された特徴は、さらなる評価のための予測的なバイオマーカーと考えられた。
【0255】
抗TNF治療に対する反応用の予測的なバイオマーカーを、Consortium of Rheumatology Researchers of North America(CORRONA)から収集した231人の患者の独立したコホートでさらに評価した(セクション3.1、試験集団を参照)。185のサンプル(コホートの80%)を、最終決定された特徴選択、臨床エンドポイント評価、およびモデル訓練に使用した。最適なモデルパラメータおよび臨床エンドポイントを、50回反復された10%の保留された交差検証の10回の反復を通して評価した。交差検証の各ラウンド内では、不純物のランダムフォレストの平均減少によってランク付けされた上位15の特徴を使用して、サンプルの保留された10%に対して試験されるモデルを構築した。最終決定された特徴選択では、可能性のある5,000の選択のうち4,000を超える選択での上位15にランク付けされた場合の特徴を選択した。その後、最終決定されたランダムフォレストモデルを、これらの選択された特徴を使用して訓練し、コホートの残りの46のサンプル(20%)で検証した。
【0256】
実施例2
本実施例は、関節リウマチ(RA)患者における抗TNF治療への非反応を、ベースラインで、治療開始前に予測する分類アルゴリズムのクロスホート、クロスプラットフォームの開発および検証を説明する。さらに、本実施例では、例えば、他の特徴(例えば、特定のアウトカムまたは副作用などを達成する可能性など)を予測する、および/または他の治療に関連する、他の分類子の開発に適用できる特定の技術について説明する。
【0257】
1.方法
(i)試験集団
(a)発見コホート
【0258】
患者マイクロアレイデータ(アクセッション GSE15258)を、Gene Expression Omnibus(GEO)から得た。サンプル採取およびコホート情報の詳細をあらかじめ報告した。簡潔に言えば、抗TNF治療が未処置のRA患者を登録し、血液サンプルをPAXgeneチューブで採取した。治療反応は、DAS28-CRP EULAR反応定義に従って、処置開始14週間後に評価した。58の女性の患者サンプルを使用した。
【0259】
(b)訓練コホートおよび検証コホート
RA患者全血サンプルおよび臨床の測定値を、Consortium of Rheumatology Researchers of North America(CORRONA)によって、CERTAIN試験において前向きに収集した。CERTAIN試験は、43の施設と117名のリウマチ専門医が参加する前向き有効性比較試験として設計した。施設内倫理委員会と倫理委員会の承認は、サンプル採取と試験参加に先立って得た。本試験のために選択したサンプルは、サンプル採取の時点で生物学的にナイーブであった(つまり、患者は、以下の治療:アダリムマブ、エタネルセプト、インフリキシマブ、セルトリズマブペゴル、ゴリムマブ、トシリズマブ、リツキシマブ、およびアバタセプトを使用した経験がなかった)。患者は、処置する医師の裁量で、アダリムマブ、エタネルセプト、セルトリズマブペゴル、ゴリムマブ、またはインフリキシマブにより処置され、少なくとも6ヶ月の間、縦断的に追跡された。病歴に加えて、治療開始後0か月と6か月の時点で、圧痛関節および腫脹関節の数、医師と患者の包括的な疾患活性スコア、csDMARD用量、患者の疼痛評価、および生活の質の調査などの臨床評価を実施した。臨床試験は、全血球数、C反応性タンパク質(CRP)レベル、リウマチ因子力価、および抗環状シトルリン化されたタンパク質(抗CCP)力価を含んでいた。患者の人口統計および臨床の変数の特徴を表3に詳述する。訓練(n=143)および検証試験(n=175)の患者コホートは、反応率、年齢、および性別でバランスが取れていた。患者の視覚的アナログ尺度の疼痛スコアが最大スコア100の少なくとも15である場合、患者を独立した検証試験に含めた。CERTAIN試験の包含基準と一致しているため、検証試行での患者はみな、10より大きいCDAIを有していた。
【0260】
【0261】
(ii)抗TNF治療に対する臨床的反応の評価
CORRONA試験サンプルのうち、抗TNF治療の開始後6ヶ月目での反応は、ACR50(ACR50は、American College of Rheumatologyによって、寛解または疾患活動性が低い患者として定義される患者処置標的を指し、ここで、数字(例えば、50)は、腫脹関節および圧痛関節の数、患者および医師の報告評価、疼痛および全体的な健康、ならびに血清バイオマーカーを含む、標準的な測定値のセットにおける改善率を指す。レスポンダーは、28の圧痛関節数で>50%の改善、28の腫脹関節数で>50%の改善、および5つの臨床変数(疾患指数、患者の痛み、患者の全体的な評価、医師の包括的評価、およびCRPレベル)を示す個人である。
【0262】
(iii)RNA単離およびQC
メーカーの説明書に従ってPAXgene Blood miRNA Kit(PreAnalytix)を使用して、全RNAを、PAXgene Blood RNAチューブで採取された血液から単離した。Agilent Bioanalyzerを使用してRNA品質を評価し、NanoDrop ND-8000分光光度計を使用してサンプルを定量化した。
【0263】
(iv)RNAシーケンシング(RNAseq)分析および遺伝子発現前処理
メーカーの説明書に従って、GLOBINclear(Thermo Fisher)、Ribo-Zero Magnetic Gold(Epidemiology)、および、 TruSeq Stranded Total RNA (Illumina) キットを使用して、RNAを処理した。ライブラリを、NextSeq 550 DXまたはNovaSeq 6000シーケンサー上で75サイクル処理した。1人の患者当たり平均~42.2Mのリードを捕捉し、範囲は33.7~58.6 Mであった。50-ntのリードを、STARでGRCh37ヒトゲノムにマッピングした。100万のマップされたリード当たりの転写産物のキロベースあたりのフラグメント(FPKM)中の遺伝子の存在量を、RSEMソフトウェアパッケージで計算した。>400万または>700万のタンパク質をコードするリードのRNAインテグリティスコア(RNA integrity score)(RIN)を有するサンプルを分析した。検出可能なバッチ効果は、主成分分析に基づいて、NextSeq処理ライブラリとNovaSeq処理ライブラリの間で観察されなかった。
【0264】
(v)一塩基多型(SNP)解析
とりわけ、本開示は、SNP解析が、本明細書に記載される分類子(例えば、RNAseqデータを用いて、および/または遺伝子発現レベルにおける小さいが有意な差を考慮して開発された分類子)に含めるための特に有用な情報を提供するという洞察を提供する。SNPデータを得るために、サンプルをSTARでGRCh38ヒトゲノムにアライメントした。SNPは、RNAseqデータをコールするSNPとインデルのための修正版のGenome Analysis ToolKit Best Practicesワークフローを使用してコールした39のRA関連SNPを評価した。
【0265】
(vi)機械学習および薬物反応アルゴリズム開発
58人の患者の発見コホート中の21,818の転写物特徴を評価した。サンプルの無作為に選択された80%のうち、マン・ホイットニーU検定を使用して、レスポンダーとノンレスポンダーの間で有意に識別力のない遺伝子発現を除去した(p>0.05)。ランダムフォレスト機械学習アルゴリズムを使用して、その平均減少不純物に基づいて、それぞれの残りの特徴をランク付けした。上位100の特徴を使用してランダムフォレストモデルを構築し、これを、保留されたデータの20%のサブセットで試験した。このプロセスを100回反復し、反復の>30%で選択された特徴をさらに考慮に入れた。37の選択された遺伝子のうちの26の遺伝子発現は、訓練コホート中でRNAseqによって検出可能であった。さらなる2つの特徴を低い発現ゆえに除去した。最終モデル開発中に、70の識別力のある分子および臨床的特徴(表4~6)を、訓練コホートのデータを使用して、上述のランダムフォレストによって評価した。特徴リストから各特徴を取り除き、保留されたデータの20%のサブセット上のモデル性能を評価することによって、各特徴の重要性を評価した。上位50%の最も重要な特徴を使用して、訓練セット全体を使用するランダムフォレストの予測的な分類モデルを構築した。モデルの性能は、受信者動作曲線下面積、陰性的中率、および真陰性率を使用して評価した。統計分析はすべて、Python 2.7.15(www.python.org)を使用して実施した。
【0266】
表4は、関節リウマチ患者における抗TNFに対する非反応を予測する分類アルゴリズムの開発中に評価された、識別力のある遺伝子セットを提供する。
【0267】
【0268】
表5は、関節リウマチ患者における抗TNFに対する非反応を予側する分類アルゴリズムの開発中に評価されたSNPを提供する。
【0269】
【0270】
【0271】
表6は、CERTAINコホートからのこの試験で利用可能な臨床因子を提供する。
【0272】
【0273】
【0274】
(vii)ヒトインタラクトームおよびRA疾患モジュールの構築、ならびに分子機能のネットワーク医学的分析の実行
ヒトインタラクトームを、様々なタイプの実験的に得られたタンパク質間相互作用(PPI)データを含む21の公開データベース(表5)から、以前に記載されようにアセンブルした:1)ハイスループット酵母-2ハイブリッド(Y2H)実験(HI-Union)、3次元(3D)タンパク質構造(Interactome3D、Instruct、Insider)、または文献キュレーション(PINA、MINT、LitBM17、インタラクトーム3D、Instruct、Insider、BioGrid、HINT、HIPPIE、APID、InWeb)に由来する、バイナリPPI;2)BioPlex2、QUBIC、CoFrac、HINT、HIPPIE、APID、LitBM17、およびInWebに存在する、アフィニティー精製とその後の質量分析法によって同定されたPPI;3)KinomeNetworkXおよびPhosphoSitePlusからのキナーゼ-基質相互作用;4)SignaLinkおよびInnateDBからのシグナル伝達相互作用;および5)ENCODEコンソーシアムによって導き出された制御性の相互作用。Alonso-Lopezらによって提供されたPSI-MI IDの厳選されたリストは、文献キュレーションデータベースに存在するいくつかの実験方法間でバイナリ相互作用を区別するために使用した。特にInWebの場合、キュレーションスコアが<0.175(75番目パーセンタイル)の相互作用は考慮に入れなかった。すべてのタンパク質を対応するEntrezID(NCBI)にマッピングし、マッピングできなかったタンパク質を除去した。結果として生じるヒトインタラクトームは、18,505のタンパク質および327,924の相互作用を含んでいる。
【0275】
DIAMOnDアプローチを使用して、RA疾患モジュールを生成した。疾患モジュールを播種するために使用したタンパク質を、5つのデータベース(GWAS Catalog、HuGE Navigator Phenopedia、ClinVar、OMIM、およびMalaCards)の少なくとも2つによってRAに連結した。DIAMOnDは、疾患関連タンパク質と同じGene Ontology生物学的プロセス期間で有意に濃縮されたタンパク質を同定した。
【0276】
ヒトインタラクトームマップ上の分子特徴の相互の近接性は、前述のように計算した。簡潔に言えば、最近接距離を、各タンパク質とセット内の次に近いタンパク質との間の平均最短経路の長さとして定義した。観測された最近接距離の有意性を、同じサイズの10,000の無作為なタンパク質セットから求めた予想された最接近距離との比較において評価した。以前に記載されるように、無作為化を実施した。
【0277】
(viii)経路濃縮分析
KEGG、Biocarta、Reactome、およびシグナル伝達(ST)経路の注釈を、Molecular Signatures Database(MSigDB)、バージョン6.2から得た。フィッシャーの正確確率検定を使用して、生物学的経路を同定した。ボンフェローニ補正p値が<0.05の経路は、濃縮されたと考えられる。IL10、POMC、JAK1、ICOSLG、TNF、TNFSF11、NR3C1、P2RY12(NCT02874092)、PTGER4、GGPS1、FDPS、TNFRSF13B(NCT03016013)、IL6、ESR1、ESR2、ITK(NCT02919475)、BTK、TLR4(NCT03241108)、IRAK4、JAK2、JAK3、HDAC1(NCT02965599)、PSMB5、ADORA3、ITGA9(NCT02698657、NCT03257852)、IFNB1(NCT02727764;NCT03445715)、CX3CL1は、RAにおいて承認された薬物標的であった。
【0278】
2.結果
ヒトインタラクトームおよびRA疾患生物学のマップの構築
ヒト疾患生物学を評価するために必要なネットワーク医学的ツールの開発を開始するために、細胞成分とそれらの物理的相互作用のマップを作成した。合計18,505のタンパク質間の327,924のタンパク質間相互作用の公開されているデータ(表7)を統合することによって、ヒトインタラクトームと呼ばれる生物学の包括的なマップを作成した(方法を参照)。
【0279】
【0280】
【0281】
疾患関連タンパク質は、疾患モジュールと呼ばれるヒトインタラクトーム上のサブネットワーク中で互いと相互作用する傾向がある。既知の疾患関連タンパク質への近接性に基づいて可能性のある疾患関連タンパク質を集約するDIAMOnDアプローチを使用して、約200のタンパク質を含むRA疾患モジュールを生成した。これらのうち66%は、ゲノムワイド関連解析データベースのRAに連結されており、DIAMOnDは、疾患関連タンパク質と同じGene Ontology生物学的プロセス期間で有意に濃縮される残りのタンパク質を同定した。
【0282】
ヒトインタラクトームおよびRA疾患モジュールを使用して、本出願は、どのRA患者が抗TNF治療に反応しないかを予測するために臨床変数および分子特徴を統合する血液ベースの分類アルゴリズムを作成しようとした(
図11)。簡潔に言えば、抗TNF治療に対するレスポンダーとノンレスポンダーを識別する分子特徴を、公に利用可能なマイクロアレイデータセットから選択した。クロスプラットフォーム分析では、これらの特徴を、RA疾患モジュールに関連するSNPおよび臨床因子と組み合わせた。機械学習アルゴリズムを、RNAseqデータを使用して訓練した。最後に、予測的な薬物反応アルゴリズムの性能を、独立した検証試験で確認した。
【0283】
(i)RA患者における抗TNF治療に対する不適切な反応を予測する全血中の識別力のある遺伝子発現のクロスプラットフォームの同定
治療に対する非反応を予測する試験の臨床的有用性を最大化するために、特殊な検体採取手順を必要としないルーチンの非侵襲的または低侵襲的サンプルソースが理想的である。この理由のために、全血に由来する遺伝子発現データを分析した。抗TNF治療に対するレスポンダーとノンレスポンダーと見なされる患者の間で識別力のある遺伝子発現を、ランダムフォレスト機械学習アルゴリズムを使用して、58人の生物学的ナイーブRA患者の公開されているマイクロアレイ発見コホートデータセットから選択した。遺伝子発現が評価された発見データセット中の21,818の遺伝子のうち37の遺伝子は、抗TNF治療に対するレスポンダー(n=24)とノンレスポンダー(n=51)の間で識別力があった(
図9、表3)。マイクロアレイとRNAseqによる転写プロファイリングは、ダイナミックレンジにおいて様々であり、観察される遺伝子発現差の数や範囲に多少の不一致を示す。それにもかかわらず、マイクロアレイデータ中の抗TNF薬物反応の識別力があるものとして同定された転写産物の大部分は、さらにRNAseqデータ中のレスポンダーとノンレスポンダーを区別した。
【0284】
(ii)RNAseqデータからの疾患関連SNPの評価
RNAseqは、マイクロアレイ分析からの欠けているヌクレオチド配列についての情報を提供する。遺伝子発現に加えて、RNA配列のバリエーションは、RA患者における抗TNF治療に対する非反応を予測することができる。そのために、訓練データセットを、CORRONA CERTAIN試験で143人のRA患者から得られた臨床データおよび全血RNAseqデータから生成した。患者集団の特徴および人口統計を表3に要約する。SNP分析は従来、全ゲノムシーケンシングデータに対して実施されるが、大多数のゲノムが転写される。したがって、ほとんどのSNP変異体は、リボソームRNAが枯渇したRNAseqデータ中で検出することができる。関節リウマチに関連するいくつかのSNPは、発現定量的形質遺伝子座(eQTL)分析を通じて、末梢血単核細胞における遺伝子発現変化に機能的に関連する(表4)。選択されたNPに関連する遺伝子座は、RA疾患モジュールとの有意な重複を有する(
図8B)。そのような22のSNPは、患者のRNAseqデータ中で検出限界を超えており、さらなる質量スペクトル分析に含まれた(
図9)。
【0285】
(iii)多因子予測薬物反応アルゴリズムを開発するためのSNP、遺伝子発現データ、および臨床変数の統合
薬物反応(表4)、RA関連SNP(表5)、および臨床因子(表6)を示す遺伝子発現を使用して、抗TNF治療に対する非反応を予測する薬物反応アルゴリズムを訓練して開発した。ベンチマークとして6ヶ月でのACR50を使用すると、訓練コホート集団は30.8%の抗TNF治療に対する反応率を有していた。これは一般的な集団の代表であり、CORRONA CERTAIN試験の現実世界の前向き収集アプローチを反映する。ランダムフォレストを使用して、識別力のある遺伝子発現セット、SNP、ならびに臨床因子、またはそれらの組み合わせからの機能を用いて、RNAseq訓練データセットの80%で予測モデルを生成した。訓練データセットの残りの20%の交差検証では、受信者動作特性曲線下領域を使用してモデルの性能を評価した。この分析では、測定するべき偽陽性と真陽性の関係を評価して、モデルがレスポンダーとノンレスポンダーをどれだけうまく区別できるかを測定する。抗TNF治療に対する非反応を最も予測するモデルを、3つのすべての特徴タイプの組み合わせを使用して生成した。モデル交差検定の性能の受信者動作曲線下面積(AUC)は、0.66であった。臨床因子のみの場合、AUCは0.56であり、分子特徴のみの場合、AUCは0.64であった(表8)。交差検証の性能データは、分類子のトランスクリプトとSNP機能の決定的な重要性を確認する。表8は、完全な特徴セットおよびそのサブセットを使用したモデルからの交差検証の結果を提供する。
【0286】
【0287】
(iv)RA患者における抗TNF治療に対する非反応を予測するバイオマーカーパネルであるPrismRA(商標)の盲検化された独立した検証試験
多くの試験では、抗TNF治療に対する非反応の生物学が全血のトランスクリプトームに反映されていると仮定された。しかし、臨床に転用されたものはなく、このことは、RA疾患の生物学の複雑さと、アルゴリズム開発に使用される方法論が多様であることの両方を反映している可能性がある。さらに、限られたサンプルサイズと遺伝子発現データ分析の複雑さにより、これまでのところ、患者コホート全体およびより広い患者集団に一般化できるアルゴリズムの開発が妨げられてきた。12のSNP、8つの転写産物、2つの臨床検査、および3つの基本人口統計因子(性別、BMI、患者疾患評価)からなるPrismRA(商標)バイオマーカーパネルが一般化可能であることを確認するために、前向きに収集したサンプルの独立したグループ(n=175)を使用して、盲検化された検証試験を実施する。検証コホートに含まれるサンプルは、アルゴリズム開発のどの段階にも使用されておらず、アルゴリズムは、これらの患者の遺伝子発現データまたは臨床アウトカムから得られた情報を有していない。
【0288】
PrismRA(商標)バイオマーカーパネルの盲検化された独立した検証は、検証コホートを、予測されたノンレスポンダーとレスポンダーに層別化し、それぞれのサブグループでレスポンダーとなるオッズ比は0.152(CI 0.064、0.364)と極めて統計的に有意であった。PrismRA(商標)は、89.7%(NPV:陰性的中率)の精度で、ノンレスポンダー患者の50.0%(特異度)を同定した(表9)。ノンレスポンダーと予測された患者は、抗TNF製剤で10.3%の観察されたACR50の反応率を有し、全体の反応率30.3%よりも有意に低い。これらの個人を代替治療にリダイレクトすると、意味のある臨床的変化を達成する可能性が非常に高まる。反対に、予測されたレスポンダーは、43.0%の観察されたACR50反応率を有し、これは、層別化されていない患者集団の反応率よりも41.8%改善している。表9はPrismRA(商標)の予測的なバイオマーカーパネル検証の性能を提供する。
【0289】
【0290】
(v)抗TNF治療に対するレスポンダーとノンレスポンダーを識別する遺伝子産物の生物学的解釈
すべての既知のタンパク質間相互作用のヒトインタラクトームマップは、抗TNF治療に対する非反応の根底にある生物学を評価するためのユニークな視点を提供する。PrismRA
(商標)予測バイオマーカーパネルのRA疾患生物学への適用性を特徴付けるために、ヒトインタラクトームおよび経路濃縮分析を使用して、識別力のある遺伝子およびSNPeQTLのタンパク質産物を分析した。PrismRA
(商標)パネルに含まれる識別力のある遺伝子およびSNPのeQTLによってコードされるタンパク質を、ヒトインタラクトームマップ上に重ね合わせた(
図8A)。合計で42のタンパク質がヒトインタラクトーム上にマッピングされ、24は識別力のある遺伝子よって、18はSNP eQTLによって寄与される。これらの分子的特徴は、抗TNF治療に反応しないRA患者の亜集団を統合する、小さいながらも凝集性のある生物学的ネットワークを強調するマップ上に織り込まれる。この近接性の定量化(方法を参照)は、これらの異なる分子特徴が互いに著しく近いことを示している(zスコア=-2.18)。さらに、RA疾患モジュール(zスコア=-4.09)およびJAKおよびTNFなどのRA薬物標的(zスコア=-3.98)は、SNPとDGに集合的に近位である(
図8B)。
【0291】
経路濃縮分析を、抗TNF治療反応に含まれる分子経路に対する洞察を得るために実施した。照会された経路分析データベースで最も濃縮された経路として、T細胞シグナル伝達を特定した。抗TNF治療の反応とRAの疾患生物学の両方に対するT細胞シグナル伝達の関連性と重要性は十分に確立されている。
【0292】
3.考察
マイクロアレイ遺伝子発現データ、RNA次世代シーケンシング、生物学的ネットワーク分析、および機械学習を大規模な患者コホートに組み込むことにより、この試験では、抗TNF治療に対する非反応を予測するために全血遺伝子発現データを使用する薬物反応アルゴリズムが、様々なRA患者コホート間で実施され得ることが示される。PrismRA(商標)の盲検化された独立した検証試験に使用される前向きに収集されたRNAseqデータセットは、薬物反応アルゴリズムが、RA患者の独立した集団における抗TNF治療に対する非反応を90%の精度で予測できることを示した。抗TNF治療は、層別化されていない患者集団のほぼ70%を処置標的に達するように助けることができない。PrismRAを臨床ケアに組み込むと、この数は半分以上減少する。
【0293】
予測薬物反応アルゴリズムを、マイクロアレイデータセットで同定した識別力のある分子的特徴から導き出し、RNAseqデータから導き出された第2のデータセットからの臨床要因と併せてさらに評価した。これら2つの遺伝子発現解析プラットフォームは、正規化された遺伝子発現値を決定するためのRNA検出方法と統計ツールが異なる。技術のこれらの違いにもかかわらず、この試験で特定された分子機能のクロスプラットフォームおよびクロスコホートの普遍性は、抗TNF薬物反応の生物学の根底にある堅牢で一般化可能な分子プロセスの存在を強調する。
【0294】
単一の大規模なハイスループット分析アプローチは、RA疾患生物学の完全な分子構造をまだ捉えていない。SNPは、調節エレメントが同族のタンパク質パートナーと相互作用する傾向、遺伝子座から生成される代替スプライスバリアントの比率または同一性、転写レベル、およびタンパク質配列を含む、細胞生物学の多くの側面に影響を与える可能性がある。したがって、疾患に関連するSNPの機能的な読み取りは、個人が疾患を発症する傾向と、環境要因が病理生物学に影響を与える傾向に寄与する。エンハンサーRNAおよびプロモーター関連転写物など、タンパク質をコードしない多くの調節エレメントおよびゲノム領域が転写される。したがって、転写における空間的変化および時間的特異的変化に影響を与える多くのSNPを、RNAseqデータから評価することができる。SNPと遺伝子発現の分析はともに、それ以外の方法では不明瞭になる可能性のある表現型のバリエーションおよび経路の関連性を捉えることができる。塩基変異と識別力のある遺伝子発現を単一の予測アルゴリズムに統合することで、疾患の病因と薬剤反応に関する実用的な洞察が得られた。
【0295】
各患者の個別化された疾患生物学に一致するように治療レジメンをカスタマイズすることは、現代医学の目標である。医学へのこの個別化されたアプローチは、特定のゲノムマーカーを持つ患者に特定の治療法が処方される腫瘍学で使用される。RAなどの自己免疫疾患の複雑さと異種性は、臨床的に有用なツールを開発するための新規で多面的なアプローチを必要とする。抗TNF治療に反応しない患者を同定する分子経路の検査により、T細胞シグナル伝達とRA疾患生物学との関連が示された。滑膜の炎症は、滑膜区画への白血球浸潤および滑膜区画内での保持、ならびに慢性炎症細胞の不十分なアポトーシスに起因する。この滑膜浸潤物はナチュラルキラー(NK)細胞、CD4+、およびCD8+T細胞を含む。さらに、多くの活性化された制御性T細胞は、RA患者の関節中で検出することができる。T細胞シグナル伝達に関連しない残りの識別力のある遺伝子は、抗TNF治療に反応する患者と反応しない患者の間で異なるRA疾患の様々な側面を表す可能性がある。RA疾患生物学と関節リウマチとの関連は、PrismRA(商標)が抗TNFノンレスポンダーを識別するための強力な臨床ツールであるという信頼性および適用性を物語っている。
【0296】
抗TNF治療への反応が不十分であると予測される患者の場合、代替生物学的治療と標的合成治療は、代替治療開始後6か月で30~40%のACR50反応率で、疾患活性を迅速かつ持続的に改善することにより安全性および有効性を向上させる。いくつかのそのような代替治療は、FDAによって、およびRA患者処置ガイドラインによって一次療法として承認されている。血液検査としてのこの層別予測分類アルゴリズムをRAの臨床ケアに組み込むと、結果として、より多くの患者の低疾患活性をより早く達成できるようになる。このことは、患者の数ヶ月から数年の時間を節約し、潜在的な病気の進行を防ぎ、抗TNF治療を繰り返すことに伴う重篤な副作用にさらされることを避け、効果のない処置および有害事象の管理にかかる医療費を削減する。
【0297】
この機械学習およびネットワーク医学アプローチを使用して標的療法への非反応を予測する薬物反応アルゴリズムの開発および検証は、RAだけでなく他の複雑な自己免疫疾患の精密医療を進歩させるための大きな可能性を示す。
【0298】
以上、その中に記載された主題のある非限定的な実施形態を説明してきた。したがって、本明細書に記載されている実施形態は、その中で報告されている主題の単なる例示であることが理解されるべきである。図示された実施形態の詳細への言及は、特許請求の範囲を限定することを意図するものではなく、それ自体が、本質的であるとみなされるそれらの特徴を列挙している。
【0299】
請求される主題のシステムおよび方法は、その内に記載された実施形態からの情報を使用して開発された変形および適応を包含することが企図される。そこに記載されているシステムおよび方法の適応、変更、またはその両方は、関連技術の通常の技術者によって実行され得る。
【0300】
説明全体を通して、システムが特定の構成要素を有するか、含むか(including)、あるいは含む(comprising)と記載されている場合、または、方法が特定の工程を有するか、含むか(including)、あるいは含む(comprising)と記載されている場合、記載された構成要素から本質的になるか、またはそれからなる、本主題によって包含されるシステムが存在すること、および記載された処理工程から本質的になるか、またはそれからなる、本主題に含まれる方法が存在することがさらに企図される。
【0301】
工程の順序または特定の作用を実行するための順序は、その中に記載されている主題の任意の実施形態が動作可能である限り、重要ではないことを理解されたい。さらに、2つ以上の工程または作用が同時に実行されてもよい。
【国際調査報告】