IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インフラマティックス インコーポレイテッドの特許一覧

特表2023-525489ウイルス感染症を有する対象の死亡率リスクの決定
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-06-16
(54)【発明の名称】ウイルス感染症を有する対象の死亡率リスクの決定
(51)【国際特許分類】
   C12Q 1/686 20180101AFI20230609BHJP
   C12Q 1/6844 20180101ALI20230609BHJP
   C12Q 1/02 20060101ALI20230609BHJP
   C12Q 1/6888 20180101ALI20230609BHJP
   G01N 33/53 20060101ALI20230609BHJP
   G01N 33/569 20060101ALI20230609BHJP
   C12N 15/09 20060101ALN20230609BHJP
【FI】
C12Q1/686 Z ZNA
C12Q1/6844 Z
C12Q1/02
C12Q1/6888 Z
G01N33/53 M
G01N33/569 Z
C12N15/09 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022565618
(86)(22)【出願日】2021-04-29
(85)【翻訳文提出日】2022-12-19
(86)【国際出願番号】 US2021029847
(87)【国際公開番号】W WO2021222537
(87)【国際公開日】2021-11-04
(31)【優先権主張番号】63/017,570
(32)【優先日】2020-04-29
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521107080
【氏名又は名称】インフラマティックス インコーポレイテッド
【氏名又は名称原語表記】Inflammatix, Inc.
(74)【代理人】
【識別番号】110001302
【氏名又は名称】弁理士法人北青山インターナショナル
(72)【発明者】
【氏名】スウィーニー,ティモシー
(72)【発明者】
【氏名】ブトゥロヴィク,リュボミル
(72)【発明者】
【氏名】ミディック,ウロス
(72)【発明者】
【氏名】ヘ,ユドン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QA19
4B063QQ10
4B063QQ52
4B063QR32
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QS36
(57)【要約】
ウイルス感染症を有する対象の30日死亡率リスクを決定し、そのような対象の効果的なトリアージ戦略を決定するためのシステム、方法、組成物、装置、及びキットが提供される。本開示の方法及び組成物は、ウイルス死亡率トレーニングデータへの機械学習ワークフローの適用から同定されたバイオマーカーを含む。前記バイオマーカーは、前記対象の30日生存の可能性を決定するために使用できるスコアの計算を可能にする。
【選択図】図13C
【特許請求の範囲】
【請求項1】
救急治療室又は他の臨床施設においてウイルス感染症の診断を有する対象に緊急医療を施す方法であって、
(i)前記対象から得られた生体試料を受け取ること、
(ii)前記生体試料中のバイオマーカーであるTGFBI、DEFA4、LY86、BATF、及びHK3の発現レベルを検出すること、並びに
(iii)工程(ii)で検出された前記バイオマーカーの発現レベルに基づいてリスクスコアを決定し、前記スコアは、指定された期間にわたる前記対象の死亡率又はICUケアの必要性のリスクに相当すること、を含む方法。
【請求項2】
(iv)前記リスクスコアに基づいて、前記対象に緊急医療を施すこと又は前記救急治療室若しくは他の臨床施設から前記対象を退院させることをさらに含む、請求項1に記載の方法。
【請求項3】
前記指定された期間が30日である、請求項1又は2に記載の方法。
【請求項4】
工程(ii)において前記生体試料中のHLA-DPB1バイオマーカーの発現レベルを検出することをさらに含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記スコアを、30日にわたるICUケアの必要性又は死亡率のリスクの1又は複数の個別のレベルに対応する1又は複数の閾値と比較することを含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記スコアを、30日にわたるICUケアの必要性又は死亡率の(i)低、(ii)中間、及び(iii)高リスクを定義する2つの閾値と比較することにより、リスクの各レベル(i~iii)に対応する3つのリスクカテゴリーの1つに前記対象を分類できる、請求項5に記載の方法。
【請求項7】
前記リスクスコアが、前記対象について決定された1又は複数の臨床パラメータにも基づいている、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記1又は複数の臨床パラメータが、年齢又は臨床リスクスコアを含む、請求項7に記載の方法。
【請求項9】
前記臨床リスクスコアが、順次臓器不全評価(SOFA)スコアである、請求項8に記載の方法。
【請求項10】
前記バイオマーカーの発現が、qRT-PCR又は等温増幅を使用して検出される、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記等温増幅が、qRT-LAMPである、請求項10に記載の方法。
【請求項12】
前記バイオマーカーの発現が、NanoString nCounterを使用して検出される、請求項1~9のいずれか一項に記載の方法。
【請求項13】
前記生体試料が、血液試料である、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記診断が、前記対象から採取された生体試料中のウイルス抗原又はウイルス核酸の検出に基づく、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記診断が、前記対象から採取された生体試料におけるウイルス感染症に関連する宿主バイオマーカーの発現レベルの検出に基づく、請求項1~13のいずれか一項に記載の方法。
【請求項16】
前記バイオマーカーの発現レベルが、前記ウイルス感染症の診断から24時間以内に検出される、請求項1~15のいずれか一項に記載の方法。
【請求項17】
30日にわたる死亡率又はICUケアの必要性の低リスクを決定するための前記閾値が、0.15未満の尤度比に相当する、請求項6~16のいずれか一項に記載の方法。
【請求項18】
30日にわたるICUケアの必要性又は死亡率の中間リスクを決定するための前記閾値が、0.15~5の尤度比に相当する、請求項6~16のいずれか一項に記載の方法。
【請求項19】
前記リスクスコアに基づいて、前記救急治療室又は他の臨床施設から前記対象を退院させることをさらに含む、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記対象が、30日にわたるICUケアの必要性又は死亡率の(i)低リスクを有すると分類されている、請求項19に記載の方法。
【請求項21】
前記緊急医療が、臓器支持療法を実施すること、治療剤を投与すること、前記対象をICUへ入院させること、又は血液製剤を投与することを含む、請求項1~18のいずれか一項に記載の方法。
【請求項22】
前記対象が、30日にわたるICUケアの必要性又は死亡率の(ii)中間リスク又は(iii)高リスクを有すると分類されている、請求項21に記載の方法。
【請求項23】
前記対象が、30日死亡率の(iii)高リスクを有すると分類されている、請求項22に記載の方法。
【請求項24】
前記臓器支持療法が、人工呼吸器、ペースメーカー、除細動器、透析若しくは腎代替療法機器、又は肺動脈カテーテル、動脈血圧カテーテル、及び中心静脈圧カテーテルからなる群から選択される侵襲的モニターのいずれか1又は複数を前記対象に接続することを含む、請求項21~23のいずれか一項に記載の方法。
【請求項25】
前記治療剤が、免疫調節剤、抗ウイルス剤、凝固調節剤、昇圧剤、又は鎮静剤を含む、請求項21~24のいずれか一項に記載の方法。
【請求項26】
前記ウイルス感染症が、インフルエンザ又はSARS-CoV-2感染症である、請求項1~25のいずれか一項に記載の方法。
【請求項27】
前記ウイルス感染症が、SARS-CoV-2感染症である、請求項26に記載の方法。
【請求項28】
ウイルス感染症を有する対象の5つ以上のバイオマーカーの発現レベルを検出するための検査キットであって、前記キットが、前記5つ以上のバイオマーカーの発現レベルを特異的に検出するための試薬を含み、並びに前記バイオマーカーが、TGFBI、DEFA4、LY86、BATF、及びHK3を含む、検査キット。
【請求項29】
前記バイオマーカーが、HLA-DPB1をさらに含む、請求項28に記載の検査キット。
【請求項30】
マイクロアレイを含む、請求項28又は29に記載の検査キット。
【請求項31】
前記キットが、TGFBIにハイブリダイズするオリゴヌクレオチド、DEFA4にハイブリダイズするオリゴヌクレオチド、LY86にハイブリダイズするオリゴヌクレオチド、BATFにハイブリダイズするオリゴヌクレオチド、及びHK3にハイブリダイズするオリゴヌクレオチドを含む、請求項28~30のいずれか一項に記載の検査キット。
【請求項32】
HLA-DPB1にハイブリダイズするオリゴヌクレオチドをさらに含む、請求項31に記載の検査キット。
【請求項33】
q-RT-PCR、qRT-LAMP、又はNanoString nCounter分析を実行するための1又は複数の試薬をさらに含む、請求項28~32のいずれか一項に記載の検査キット。
【請求項34】
前記ウイルス感染症が、インフルエンザ又はSARS-CoV-2感染症である、請求項28~33のいずれか一項に記載の検査キット。
【請求項35】
前記対象の前記バイオマーカーの発現レベルに基づいて死亡率スコアを計算するための指示をさらに含み、前記スコアが、指定された期間における前記対象の死亡率リスクに相当する、請求項28~33のいずれか一項に記載の検査キット。
【請求項36】
前記死亡率スコアが、前記対象について確立された1又は複数の臨床パラメータにも基づいている、請求項35に記載の検査キット。
【請求項37】
前記1又は複数の臨床パラメータが、年齢又は臨床リスクスコアを含む、請求項36に記載の検査キット。
【請求項38】
前記臨床リスクスコアが、SOFAスコアである、請求項37に記載の検査キット。
【請求項39】
前記指定された期間が30日である、請求項35~38のいずれか一項に記載の検査キット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その全体が参照により本明細書に援用される、2020年4月29日に出願された米国特許仮出願番号第63/017,570号に対する優先権を主張する。
【背景技術】
【0002】
COVID-19の原因物質であるSARS-coronavirus 2(SARS-CoV-2)の出現及びその急速なパンデミックの広がりにより、これまでに5,400万人を超える症例及び100万人を超える死亡という世界的な健康危機が引き起こされている(1)。COVID-19はあらゆる臨床表現型を示し、ほとんどの患者は軽度~中等度の症状を示し、20%は典型的には1週間以内に重度又は重篤な疾患に進行する(2~6)。重症例は、人工呼吸器を必要とする急性呼吸不全を特徴とすることが多く、急性呼吸窮迫症候群(ARDS)に進行して死亡する場合がある(7)。ARDSの重症度及び発症は、加齢及び基礎となる医学的状態に関連している(3)。
【0003】
今までのところ、SARS-CoV-2感染症の診断法の開発が急速に進歩しているにもかかわらず、臨床データからバイオマーカー及び免疫病理学的所見に至るまでの既存の予後マーカーでは、どの患者が重症化する可能性があるかを特定できないことが証明されている(8)。リスク層別化(重症度分類)が不充分であることは、最前線の医療従事者が、隔離して自宅で回復させても安全な患者と、注意深いモニタリングが必要な患者とを判断できない可能性があることを意味している。免疫状態をモニタリングしながら重症度を早期に特定することも、コルチコステロイド、静注免疫グロブリン、又は選択的サイトカイン遮断などの治療の選択に重要であることも証明される可能性がある(9~11)。
【0004】
ウイルス因子ではなく、好中球増加、リンパ球数、CD3及びCD4T細胞数、インターロイキン-6及び-8、乳酸脱水素酵素、Dダイマー、AST、プレアルブミン、クレアチニン、グルコース、低密度リポタンパク質、血清フェリチン、並びにプロトロンビン時間を含む多くの検査値が重症疾患及びARDSのリスクを高めることに関連している(3、12、13)。機械学習(ML)を介して複数の弱いマーカーを組み合わせると、試験の識別及び臨床的有用性が高まる可能性がある一方、これまでのMLの適用は、深刻なオーバーフィッティング(過学習)及び臨床導入の欠如に至っている(14)。このようなモデルの失敗は、トレーニングにおける臨床的不均一性の欠如と、タスクにとって理想的ではない可能性がある既存の臨床検査を使用する変数選択の実用的な性質との両方から生じる。さらに、検査マーカーの多くは、それらが異常になるまでに患者がすでに重病であるため、重症度の指標としては遅い。
【0005】
全血トランスクリプトームに代表される宿主免疫応答は、感染症の存在、種類、及び重症度を診断することが繰り返し示されている(15~19)。複数の独立したデータセットにわたる臨床的、生物学的、及び技術的な不均一性を活用することにより、本発明者らは以前に、細菌感染症(15~17)とは異なり、無症候性感染症を識別することができる、呼吸器ウイルス感染症(16)に対する保存された宿主応答を特定した。ウイルス感染症に対するこの保存された宿主応答は、転帰の重症度と強く関連している(20)。本発明者らはまた、感染性疾患に対する保存された宿主免疫応答が、感染症患者の30日死亡率リスクの正確な予後マーカーになり得ることも実証した(18)。最も重要なことは、生物学的、臨床的、及び技術的な不均一性を説明することで、より一般化可能なロバストな宿主応答に基づいたターゲット・プラットフォームで迅速に翻訳可能なシグネチャを特定できることを実証したことである(19)。
【0006】
現在のCOVID-19パンデミックや将来のウイルスパンデミックにおいて、又は季節性インフルエンザの発生時に、最も必要とする人だけのために病院のリソースを保つために、トリアージ(例えば、救急部門)で患者のリスク層別化に対する重要なニーズがある。しかしながら、C反応性タンパク質及びプロカルシトニンなどの現在のバイオマーカーは、効果的なトリアージのための適切なリスク層別化を行わない。したがって、ウイルス感染症患者のリスク、例えば30日死亡率リスクを迅速かつ正確に決定できる新しいバイオマーカーのニーズがある。本開示は、このニーズを満たし、他の利点も提供する。
【発明の概要】
【0007】
一態様では、本開示は、救急治療室又は他の臨床施設においてウイルス感染症の診断を有する対象に緊急医療を施す方法であって、(i)前記対象から得られた生体試料を受け取ること、(ii)前記生体試料中のバイオマーカーであるTGFBI、DEFA4、LY86、BATF、及びHK3の発現レベルを検出すること、並びに(iii)工程(ii)で検出された前記バイオマーカーの発現レベルに基づいてリスクスコアを決定し、前記スコアは、指定された期間にわたる前記対象の死亡率又はICUケアの必要性のリスクに相当すること、を含む方法を提供する。
【0008】
いくつかの実施形態では、前記方法は、(iv)前記リスクスコアに基づいて、前記対象に緊急医療を施すこと又は前記救急治療室若しくは他の臨床施設から前記対象を退院させることをさらに含む。前記方法のいくつかの実施形態では、前記指定された期間が30日である。いくつかの実施形態では、前記方法は、工程(ii)において前記生体試料中のHLA-DPB1バイオマーカーの発現レベルを検出することをさらに含む。いくつかの実施形態では、前記スコアを、30日にわたるICUケアの必要性又は死亡率のリスクの1又は複数の個別のレベルに対応する1又は複数の閾値と比較する。いくつかの実施形態では、前記スコアを、30日にわたるICUケアの必要性又は死亡率の(i)低、(ii)中間、及び(iii)高リスクに対応する2つの閾値と比較することにより、リスクの各レベル(i~iii)に対応する3つのリスクカテゴリーの1つに前記対象を分類できる。
【0009】
いくつかの実施形態では、前記リスクスコアが、前記対象について決定された1又は複数の臨床パラメータにも基づいている。いくつかの実施形態では、前記1又は複数の臨床パラメータが、年齢又は臨床リスクスコアを含む。いくつかの実施形態では、前記臨床リスクスコアが、順次臓器不全評価(SOFA)スコアである。いくつかの実施形態では、前記遺伝子の発現が、qRT-PCR又は等温増幅を使用して検出される。いくつかの実施形態では、前記等温増幅法が、qRT-LAMPである。いくつかの実施形態では、前記遺伝子の発現が、NanoString nCounterを使用して検出される。いくつかの実施形態では、前記生体試料が、血液試料である。いくつかの実施形態では、前記診断が、前記対象から採取された生体試料中のウイルス抗原又はウイルス核酸の検出に基づく。いくつかの実施形態では、前記診断が、前記対象から採取された生体試料におけるウイルス感染症に関連するバイオマーカーの発現レベルの検出に基づく。いくつかの実施形態では、前記バイオマーカーの発現レベルが、ウイルス感染症の診断から24時間以内に検出される。
【0010】
いくつかの実施形態では、30日にわたる死亡率又はICUケアの必要性の低リスクを決定するための閾値が、0.15未満の尤度比に相当する。いくつかの実施形態では、30日にわたるICUケアの必要性又は死亡率の中間リスクを決定するための閾値が、0.15~5の尤度比に相当する。
【0011】
いくつかの実施形態では、前記方法は、前記リスクスコアに基づいて、前記救急治療室又は他の臨床施設から前記対象を退院させることをさらに含む。いくつかのそのような実施形態では、前記対象が、30日にわたるICUケアの必要性又は死亡率の(i)低リスクを有すると分類されている。いくつかの実施形態では、前記緊急医療が、臓器支持療法を実施すること、治療剤を投与すること、前記対象をICUへ入院させること、又は血液製剤を投与することを含む。いくつかのそのような実施形態では、前記対象が、30日にわたるICUケアの必要性又は死亡率の(ii)中間リスク又は(iii)高リスクを有すると分類されている。いくつかの実施形態では、前記臓器支持療法が、人工呼吸器、ペースメーカー、除細動器、透析若しくは腎代替療法機器、又は肺動脈カテーテル、動脈血圧カテーテル、及び中心静脈圧カテーテルからなる群から選択される侵襲的モニターのいずれか1又は複数を前記対象に接続することを含む。いくつかの実施形態では、前記治療剤が、免疫調節剤、抗ウイルス剤、凝固調節剤、昇圧剤、又は鎮静剤を含む。いくつかの実施形態では、前記ウイルス感染症が、インフルエンザ又はSARS-COV-2感染症である。
【0012】
別の態様では、本開示は、ウイルス感染症を有する対象の5つ以上のバイオマーカーの発現レベルを検出するための検査キットであって、前記キットが、前記5つ以上のバイオマーカーの発現レベルを特異的に検出するための試薬を含み、並びに前記バイオマーカーが、TGFBI、DEFA4、LY86、BATF、及びHK3を含む、検査キットを提供する。いくつかの実施形態では、前記バイオマーカーが、HLA-DPB1をさらに含む。いくつかの実施形態では、前記バイオマーカーが、TGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1を含む。
【0013】
いくつかの実施形態では、前記キットが、マイクロアレイを含む。いくつかの実施形態では、前記キットが、TGFBIにハイブリダイズするオリゴヌクレオチド、DEFA4にハイブリダイズするオリゴヌクレオチド、LY86にハイブリダイズするオリゴヌクレオチド、BATFにハイブリダイズするオリゴヌクレオチド、及びHK3にハイブリダイズするオリゴヌクレオチドを含む。いくつかの実施形態では、前記キットが、HLA-DPB1にハイブリダイズするオリゴヌクレオチドをさらに含む。いくつかの実施形態では、前記検査キットが、q-RT-PCR、qRT-LAMP、又はNanoString nCounter分析を実行するための1又は複数の試薬、デバイス、容器、又は器具をさらに含む。いくつかの実施形態では、前記ウイルス感染症が、インフルエンザ又はSARS-CoV-2感染症である。いくつかの実施形態では、前記検査キットが、前記対象の前記バイオマーカーの発現レベルに基づいて死亡率スコアを計算するための指示をさらに含み、前記スコアが、指定された期間における前記対象の死亡率リスクに相当する。いくつかの実施形態では、前記指定された期間が30日である。いくつかの実施形態では、前記死亡率スコアが、さらに前記対象について確立された1又は複数の臨床パラメータに基づいている。いくつかの実施形態では、前記1又は複数の臨床パラメータが、年齢又は臨床リスクスコアを含む。いくつかの実施形態では、前記臨床リスクスコアが、SOFAスコアである。
【0014】
以下の詳細な説明及び添付の図面を参照して、本開示の実施形態の性質及び利点をよりよく理解することができる。
【図面の簡単な説明】
【0015】
図1図1A及び図1Bは、選択された15個の遺伝子のうちの2遺伝子の組み合わせの2つの例であり、(大きい)三角形は非生存症例及び(小さい)四角形は生存症例である。
図2図2A図2Dは、選択された15個の遺伝子のそれぞれ(図2A)、選択された15個の遺伝子の2遺伝子対(図2B)、1、2、及び最大15のランク付けされた上位15個の遺伝子からなる予測因子(図2C)、並びに13,902個の遺伝子のそれぞれ(図2D)を使用して得られたROC曲線下面積(AUROC)のヒストグラム。
図3図3Aは、ロジスティック回帰モデルの選択。各点は、ロジスティック回帰ハイパーパラメータと決定閾値(すなわち、スコアが閾値を超えると30日死亡率が予測され、スコアが閾値を下回ると30日生存率が予測される閾値)とによって定義されるモデルに対応する。検索空間全体(100個のハイパーパラメータ構成)が示されている。図3Bは、最適なモデルのROCプロット。プロットは、リーブワンスタディアウト交差検証(leave-one-study-out cross-validation(LOSOCV))分割からプールされた確率を使用して構築されている。
図4図4は、HostDx(商標)ウイルス重症度が、低リスク患者の入院を除外し、入院が必要な高リスク患者を特定するために使用され得ることを示す。本研究では、患者のわずか10%が「中等度」/不確定バンドに分類され、この事は本試験が約90%の症例で、COVID-19でC反応性タンパク質又はプロカルシトニンが示したよりもはるかに有用であることを意味することに注意。
図5図5は、年齢調整した多変量モデル。この図は、年齢調整しても、遺伝子スコアが依然として死亡率と有意に関連していることを実証する。すなわち、前記スコアは、患者の年齢に関係なく(補正された場合でも)、死亡率の予測因子となる。
図6図6は、アテネのCOVID-19コホートから入手可能な試料及び臨床データを使用して、41人の患者の30日転帰に対してプロットした5-mRNAリスクスコア(「viral_severity」)。非重症患者は、ICUや人工呼吸器を必要としなかった。スコアは、96%の感度及び75%の特異度を示し、非重症患者を重症患者及び死亡患者から分離した。
図7図7は、単一遺伝子AUCの分布。AUCは、62人の患者の重症群対非重症群を予測するために計算した。以下を示す:検出された15,788個の遺伝子のそれぞれを使用したAUC分布(上段、灰色)、絶対効果サイズ>1.3及びP値<0.005によって定義される150個の下方制御(青色)された遺伝子又は329個の上方制御(サンゴ色)された遺伝子のそれぞれを使用したAUC、高発現かつロバストなパフォーマンスに対してさらに選択された35個の遺伝子の個々のAUC(緑色)、及び35個のバイオマーカー遺伝子からの全ての2遺伝子の組み合わせのAUC(紫色)。
図8図8は、頻度に基づくバイオマーカーの選択。上位46位の遺伝子のそれぞれが、62個のリーブワンアウト(leave-one-out(LOO))遺伝子選択から存在する回数。選択された35個のマーカー遺伝子は、62のLOOのうち少なくとも60で示され、33個は62のLOO全てで示された。
図9図9A及び図9Bは、重症COVID-19患者対非重症COVID-19患者を区別するための集計されたGMスコアのパフォーマンス。幾何平均スコアは、差次的に上方(n=22)発現及び下方(n=13)発現された遺伝子の正規化された発現の幾何平均に基づいている。図9Aは、非重症患者(橙色)及び重症患者(青色)の幾何平均スコアのボックスプロット。図9Bは、幾何平均スコアのROC。
図10図10A及び図10Bは、研究フロー。図10Aは、トレーニング及び試験のための臨床データフロー。図10Bは、6-mRNAウイルス重症度分類子の開発及び検証に使用した機械学習ワークフロー。LOSO=リーブワンスタディアウト(Leave-One-Study-Out)。CV=交差検証。AUROC=ROC曲線下面積。
図11図11A図11Dは、6-mRNA分類子のトレーニングデータ。図11Aは、t-SNEを使用した低次元での21の研究にわたる705個の試料の可視化。図11Bは、ロジスティック回帰モデルの選択。各ドットは、ロジスティック回帰ハイパーパラメータと決定閾値の組み合わせによって定義されたモデルに対応している。検索空間全体(100個のハイパーパラメータ構成)が示されている。図11Cは、最適なモデルのROCプロット。プロットは、交差検証分割からプールされた確率を使用して構築されている。図11Dは、死亡率の転帰に応じたロジスティック回帰モデルで使用した6個の遺伝子の発現。
図12図12A図12Dは、独立した後ろ向き非COVID-19コホートにおける6-mRNA分類子の検証。図12Aは、t-SNEを使用した試料の可視化。図12Bは、臨床的に関連する部分群を有する患者のロジスティック回帰モデルで使用した6個の遺伝子の発現。図12Cは、6-mRNA分類子が、COVID-19の非重症患者及び重症患者、並びに死亡した患者を正確に区別することを示す。図12Dは、部分群のROCプロット。
図13図13A図13Dは、COVID-19コホートにおける6-mRNA分類子の検証。図13Aは、t-SNEを使用した予測的検証コホートの97個の試料の可視化。図13Bは、重症及び非重症のSARS-CoV-2ウイルス感染症患者のロジスティック回帰モデルで使用した6個の遺伝子の発現。図13Cは、6-mRNA分類子が、COVID-19の非重症患者及び重症患者、並びに死亡した患者を正確に区別することを示す。図13Dは、非重症COVID-19対重症又は死亡のROCプロット(健康な対照からの試料は含まれず)。
図14図14は、最適なロジスティック回帰モデルのプールされたトレーニングセットの交差検証6-mRNAスコアの分布。青色=生存者、赤色=非生存者
図15図15は、迅速なqRT-LAMPのパネル及びNanoString(登録商標)nCounter(登録商標)の絶対的基準を使用した6-mRNA分類子スコアの相関関係は、臨床試料全体(n=61)で優れた一致(ピアソンR=0.95)を示すことを示す。
図16図16は、本開示の一実施形態に係る測定システム160を示す。
図17図17は、本開示の実施形態に係るシステム及び方法で使用可能な例示的なコンピューターシステムのブロック図を示す。
【0016】
用語
本明細書で使用される場合、以下の用語は、別段の指定のない限り、それらに帰する意味を有する。
【0017】
本明細書で使用される「1(つ)(a)」、「1(つ)(an)」、又は「前記(the)」という用語は、1つの要素を伴う態様を含むだけでなく、2つ以上の要素を伴う態様も含む。例えば、単数形「1(つ)(a)」、「1(つ)(an)」、及び「前記(the)」は、文脈が明確に指示しない限り、複数の指示対象を含む。したがって、例えば、「1つの細胞」への言及は、複数のそのような細胞を含み、「前記薬剤」への言及は、当業者に公知の1又は複数の薬剤への言及を含むなどである。
【0018】
本明細書で使用される「約」及び「およそ」という用語は、概して、測定の性質又は精度を考慮して、測定された量の誤差の許容程度を意味するものとする。典型的には、誤差の程度の例は、所与の値又は値の範囲内の20パーセント(%)以内、好ましくは10%以内、より好ましくは5%以内である。「約X」への言及は、少なくともX、0.8X、0.81X、0.82X、0.83X、0.84X、0.85X、0.86X、0.87X、0.88X、0.89X、0.9X、0.91X、0.92X、0.93X、0.94X、0.95X、0.96X、0.97X、0.98X、0.99X、1.01X、1.02X、1.03X、1.04X、1.05X、1.06X、1.07X、1.08X、1.09X、1.1X、1.11X、1.12X、1.13X、1.14X、1.15X、1.16X、1.17X、1.18X、1.19X、及び1.2Xの値を具体的に示している。したがって、「約X」は、例えば「0.98X」のクレーム限定(claim limitation)を教示し、書面による説明の裏付けを提供することを意図している。
【0019】
「核酸」又は「ポリヌクレオチド」という用語は、プライマー、プローブ、オリゴヌクレオチド、鋳型RNA若しくはcDNA、ゲノムDNA、バイオマーカー遺伝子の増幅された部分配列、又はデオキシリボ核酸(DNA)若しくはリボ核酸(RNA)で構成される任意のポリヌクレオチド、又はプリン若しくはピリミジン塩基か一本鎖若しくは二本鎖形態の修飾されたプリン若しくはピリミジン塩基のN-グリコシドである任意の他のタイプのポリヌクレオチドを指す。特に限定されない限り、この用語は、参照核酸と同様の結合特性を有し、天然に存在するヌクレオチドと同様に代謝される天然ヌクレオチドの公知の類似体を含む核酸を包含する。別段の指定のない限り、特定の核酸配列は、明示的に示された配列だけでなく、その保存的に修飾されたバリアント(例えば、縮重コドン置換)、対立遺伝子、オルソログ、SNP、及び相補的配列も暗示的に包含する。具体的には、縮重コドン置換は、1又は複数の選択された(又は全ての)コドンの3番目の位置が混合塩基及び/又はデオキシイノシン残基で置換されている配列を生成することによって達成され得る(Batzer et al.,Nucleic Acid Res.19:5081(1991);Ohtsuka et al.,J.Biol.Chem.260:2605-2608(1985)及びRossolini et al.,Mol.Cell.Probes 8:91-98(1994))。「核酸」、「DNA」、「ポリヌクレオチド」、及び同様の用語には、核酸類似体も含まれる。ポリヌクレオチドは、必ずしも既存の又は天然の配列に物理的に由来する必要はなく、化学合成、DNA複製、逆転写、又はそれらの組み合わせを含む任意の方法で生成することができる。
【0020】
本明細書で使用される「プライマー」は、天然に存在するか合成的に生成されたかに関わらず、核酸鎖に相補的なプライマー伸長産物の合成が、すなわち、ヌクレオチド及びDNAポリメラーゼなどの重合剤の存在下で、適切な温度及び緩衝液で誘導される条件下に置かれた際に合成の開始点として機能することができるオリゴヌクレオチドを指す。このような条件には、適温での適切な緩衝液(「緩衝液」は、補因子であるか、pH、イオン強度などに影響を与える置換基を含む)中の、4つの異なるデオキシリボヌクレオシド三リン酸並びにDNAポリメラーゼ又は逆転写酵素などの重合誘導剤の存在が含まれる。プライマーは、好ましくは、本明細書に記載のTaqManリアルタイム定量的RT-PCRなどの増幅における最大効率のために一本鎖である。本明細書のプライマーは、増幅される各特定配列の異なる鎖に実質的に相補的であるように選択され、所与のプライマーセットは、対応するバイオマーカー遺伝子の部分配列を増幅するために一緒に作用する。
【0021】
「遺伝子」という用語は、ポリペプチド鎖の生成に関与するDNAのセグメントを指す。これには、コード領域の前後の領域(リーダー及びトレーラー)、並びに個々のコードセグメント(エクソン)間の介在配列(イントロン)が含まれる。
【0022】
SARS-CoV-2は、COVID-19と呼ばれる感染性疾患を引き起こすコロナウイルスを指す。本発明の方法は、GenBank参照番号MN908947、LC757995、及びLC528232又は別のSARS-CoV-2ゲノムの全部若しくは一部のヌクレオチド配列を含む、又はそれらと実質的に同一の(例えば、70%、75%、80%、85%、90%、95%、又はそれ以上同一の)ヌクレオチド配列を含むウイルスによる感染によるものを含む、任意のSARS-CoV-2感染症を含む任意のウイルス感染症を有する任意の対象の30日死亡率リスク(集中治療室(ICU)への入院、二次感染、又は7、14、60日などの他の時点での死亡など、他の転帰のリスク)を決定するために使用できる。これらの方法は、症状の有無に関わらず、任意の方法によって検出された感染症を有する対象で実施され得る。
【0023】
本明細書で使用される場合、「バイオマーカー遺伝子」又は「バイオマーカー」とは、その発現が、例えばインフルエンザ又はSARS-CoV-2を有する対象において、3、7、14、28、30、60、又は90日でのウイルス感染症を有する対象における死亡率又は他の転帰、例えば、生存又は非生存、ICU入院、二次感染などと相関する遺伝子を指す。各遺伝子の発現レベルは、全ての患者の死亡率と相関する必要はなく、むしろ人口レベルで相関関係が存在することで、発現レベルは、ウイルス感染症及び公知の30日死亡率を有する個人の全体集団内で充分に相関しており、本明細書の別の場所に記載されているように、多くの方法のいずれかで他のバイオマーカー遺伝子の発現レベルと組み合わせることができ、バイオマーカー又は死亡率スコアを計算するために使用できる。関連する機器又はアッセイシステムからの直接読み出し値又は線形若しくは非線形変換、再スケーリング、正規化、Zスコア、共通参照値に対する比率、若しくは当業者に公知の他の手段の形態を含むがこれらに限定されない方法を使用して決定された値を含む個々のバイオマーカー遺伝子の測定された発現レベルに使用される値は、多くの方法のいずれかで決定できる。いくつかの実施形態では、バイオマーカーの読み出し値は、参照又は対照、例えばバイオマーカーと同時に発現が測定されるハウスキーピング遺伝子の読み出し値と比較される。例えば、参照遺伝子に対するバイオマーカーの比又は対数比を決定することができる。本発明の方法の目的のための好ましいバイオマーカー遺伝子には、TGFBI、DEFA4、LY86、BATF、及びHK3、又はTGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1が挙げられるが、例えば、本明細書に記載の機械学習法を使用して識別される他のバイオマーカーなど、他のバイオマーカーも同様に使用することができる。
【0024】
互いに交換可能に使用可能な「バイオマーカースコア」、「死亡率スコア」、又は「リスクスコア」という用語は、ウイルス感染症を有する対象の死亡率(又はその他の転帰)の確率の決定を可能にする値であって、前記対象における複数のバイオマーカー遺伝子、例えば2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、又はそれ以上の個々のバイオマーカー遺伝子の測定された発現レベルから計算される値を指す。いくつかの実施形態では、リスクスコアは、数式、指定された相互接続を使用した一連の数式、最適化されたハイパーパラメータを使用した機械学習アルゴリズム、又は別のパラメータに基づく方法を適用することによって決定され、それによって、バイオマーカー遺伝子の測定された発現値を使用して、例えば重み付き若しくは重み無しの算術平均若しくは幾何平均、線形回帰、ロジスティック回帰、ニューラルネット、又は当技術分野で公知の任意の他の方法を含む、単一の「リスク」スコアを生成することができる特定の実施形態では、「リスクスコア」は、本明細書の別の場所でより詳細に説明されるように、スコアが問題の転帰に対する所与の閾値を超えるか、又は閾値を超えないかによって、対象の30日死亡率リスク(又はICUケアの必要性)を決定するために使用される。前記リスクスコア(又は本明細書に記載されるように、異なる数式、アルゴリズムなどを使用して得られる異なるリスクスコア)を使用して、対象における感染関連リスクの他の側面、例えば入院期間、ICUケアの必要性、前記対象の再入院率などを決定できる。前記リスクスコアはまた、年齢、併存疾患状態、又はqSOFA、SOFA、APACHEなどのリスクスコア、又は当技術分野で公知の他のものなど1又は複数の臨床パラメータの単独又は組み合わせと組み合わせて死亡率又はその他の転帰のリスクを決定する際のスコアのパフォーマンスを改善することができる。
【0025】
「相互に関連付ける(correlating)」という用語は、概して、ある確率変数と別の確率変数との関係を決定することを指す。様々な実施形態では、所与のバイオマーカーレベル又はスコアを状態又は転帰(例えば、30日での生存又は非生存)の存在又は非存在と関連付けることは、同じ転帰の対象における少なくとも1つのバイオマーカーの存在、非存在、又は量を決定することを含む。特定の実施形態では、バイオマーカーレベル、非存在、又は存在のセットは、受信者動作特性(ROC)曲線を使用して、特定の転帰に関連付けられる。
【0026】
「保存的に修飾されたバリアント」は、同一又は本質的に同一のアミノ酸配列をコードする核酸、又は核酸がアミノ酸配列をコードしない場合、本質的に同一の配列を指す。遺伝コード(暗号)の縮重のために、多数の機能的に同一の核酸が任意のタンパク質をコードしている。例えば、GCA、GCC、GCG、及びGCUであるコドンは全てアミノ酸のアラニンをコードする。したがって、アラニンがコドンによって特定される全ての位置で、前記コドンは、コードされたポリペプチドを変更することなく、記載された対応するコドンのいずれかに変更され得る。このような核酸変異は、保存的に修飾された変異の一種である「サイレント変異」である。ポリペプチドをコードする本明細書の全ての核酸配列はまた、核酸の全ての可能なサイレント変異を説明する。当業者は、核酸中の各コドン(通常はメチオニンの唯一のコドンであるAUG、及び通常はトリプトファンの唯一のコドンであるTGGを除く)を修飾して、機能的に同一の分子を得ることができることを認識するであろう。したがって、ポリペプチドをコードする核酸の各サイレント変異は、記載された各配列に内在する。
【0027】
当業者は、コード配列内の単一のアミノ酸又はわずかな割合のアミノ酸を変更、付加、又は欠失する核酸、ペプチド、ポリペプチド、又はタンパク質配列への個々の置換、欠失、又は付加は、「保存的に修飾されたバリアント」であり、この変更により、アミノ酸が化学的に類似したアミノ酸に置換されることを認識するであろう。機能的に類似したアミノ酸を提供する保存的置換表は、当技術分野で周知である。このような保存的に修飾されたバリアントは、多型バリアント、種間ホモログ、及び対立遺伝子に加えて、これらを除外するものではない。場合によっては、保守的に修飾されたバリアントは、安定性、集合、又は活性が増加し得る。
【0028】
本明細書で使用される用語「同一」又はパーセント「同一性」は、2つ以上のポリヌクレオチド配列を説明する文脈において、同じである2つ以上の配列又は指定された部分配列を指す。「実質的に同一」な2つの配列は、配列比較アルゴリズムを使用するか、特定の領域が指定されていない手動のアライメントと目視検査とによって、比較ウィンドウ又は測定された指定領域で最大の一致が得られるように比較及び整列された場合、少なくとも60%同一性、好ましくは65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又は100%同一性を有する。ポリヌクレオチド配列に関して、この定義は、試験配列の相補体も指す。同一性は、長さが少なくとも約10、15、20、25、30、35、40、45、50、又はそれ以上のヌクレオチドである領域にわたって存在し得る。いくつかの実施形態では、パーセント同一性は、核酸配列の全長にわたって決定される。
【0029】
配列比較では、典型的には、1つの配列が参照配列として機能し、それに対して試験配列が比較される。配列比較アルゴリズムを使用する場合、試験配列及び参照配列をコンピューターに入力し、必要に応じて部分配列座標を指定し、配列アルゴリズムプログラムパラメータを指定する。デフォルトのプログラムパラメータを使用してもよく、別のパラメータを指定してもよい。次いで、配列比較アルゴリズムは、プログラムパラメータに基づいて、参照配列に対する試験配列のパーセント配列同一性を計算する。核酸とタンパク質との配列比較には、BLAST 2.0アルゴリズムを、例えば、デフォルトパラメータと共に使用できる。例えば、Altschul et al.,(1990)J.Mol.Biol.215:403-410及びアメリカ国立生物工学情報センター(National Center for Biotechnology Information(NCBI))のウェブサイト(ncbi.nlm.nih.gov)を参照。
【発明を実施するための形態】
【0030】
本開示は、ウイルス感染症を有する対象における30日(又は他の期間)死亡率リスク又は重篤な疾患のリスクを推定するための、並びに例えば、救急治療室環境に存在するそのような対象の効果的なトリアージ戦略を決定するための方法及び組成物を提供する。本発明の方法及び組成物は、ウイルス死亡率トレーニングデータ、すなわち、公知のウイルス感染症及び公知の30日転帰(生存又は非生存)を有する患者からの発現データへの機械学習ワークフローの適用から同定されたバイオマーカーを含む。これらのデータを使用して、例えば、SARS-CoV-2又はインフルエンザ感染であるウイルス感染症と診断された対象の30日生存(又は集中治療の必要性)の尤度を決定するために使用できるスコアの計算を可能にするバイオマーカーが特定された。
【0031】
I.対象
本発明の方法及び組成物を使用して、ウイルス感染症を有する対象のリスクスコア(例えば、30日死亡率又は集中治療室(ICU)ケアの必要性スコア)を決定することができる。様々な実施形態では、前記対象は、成人、小児、又は青年であり得る。前記対象は、男性であっても女性であってもよい。
【0032】
前記対象は、ウイルス感染、例えば、インフルエンザ又はSAR-CoV-2の診断を受けている。前記診断は、例えば、RT-PCRによるウイルスゲノム配列の検出によって、又は、例えば、ELISAによるウイルスに対する抗体の検出によって直接行うことができる。いくつかの実施形態では、前記診断は、例えば、対象の症状及び/又はウイルスへの公知の暴露の臨床的評価によって、間接的に行われる。いくつかの実施形態では、診断は、例えば、その全体の開示が参照により本明細書に援用されるSweeney et al.,(2016)Sci.Transl.Med.,8(346):346ra91及び国際公開(WO)第2017/214061号に記載されるようにウイルス感染症に関連するバイオマーカーを評価することによって行われる。
【0033】
特定の実施形態では、前記対象は、救急治療の状況、例えば、救急治療室、緊急医療施設、病院、又は診断が行われ得る任意の他の臨床環境に存在する。しかしながら、臨床環境は、患者が物理的に病院又は臨床施設にいることを必ずしも示しているわけではない。例えば、患者は家にいるかもしれないが、例えば、医療専門家との遠隔相談、在宅検査キットの使用、又は地域若しくはドライブアップ(drive-up)検査施設を通じて診断を受けている可能性がある。本明細書に記載の方法の結果は、対象のケアのための最適な次の工程又は行動計画の決定を可能にし得る。例えば、対象が30日死亡率のリスクが低いという決定は、救急治療室に在室している対象については、例えば、モニタリングのために帰宅するか、別の非救急病棟へ移るために、病室又は救急治療室から退院することができることを示し得る。本明細書の別の場所でより詳細に説明するように、30日死亡率のリスクが高い対象は、例えば、ICUに送られる、及び/又はその後の治療オプションのいずれかを適用され得る。ICUへの入院又は本明細書に記載のいずれかの治療の実施を含む、中間又は高リスクスコアを考慮して取られた一連の行動は、本開示の目的では「緊急医療」と見なされる。
【0034】
本発明の方法は、死亡率リスクに関する以前の研究よりもウイルス感染症に関してより具体的なアプローチを提供する(例えば、米国特許第10,344,332号及びSweeney et al.,(2018)Nature Commun.15(9):694を参照)。この初期の研究は、宿主応答が、段落[030]で説明されているような結果をオールカマー(all-comer)で正確に予測できることを示した。しかしながら、基礎となる宿主免疫応答は、生理学的傷害によって、例えば、細菌感染、ウイルス感染、及び非感染性炎症の間で異なる。本発明者らの以前のリスクスコアは、all-comerリスクスコアとして設計されていたが、本開示は、ウイルス感染症の患者のみに使用するために特別に設計されたリスクスコアを提供し、そのため、これらの患者のリスク層別化を改善し、場合によっては、より少ないバイオマーカーの使用を可能にする。
【0035】
本発明の方法は、例えば以下の任意のウイルスによる30日死亡率リスクを決定するために使用できる。インフルエンザ、コロナウイルス、エボラウイルス、マールブルグウイルス、ハンタウイルス、ロタウイルス、SARSコロナウイルス、MERSコロナウイルス、アデノウイルス、アデノ随伴ウイルス、愛知ウイルス、αパピローマウイルス、αウイルス、αコロナウイルス、αトルクウイルス、アレナウイルス、オーストラリアコウモリリッサウイルス、BKポリオーマウイルス、バンナウイルス、バーマ森林ウイルス、βコロナウイルス、ブニヤムウェラ(Bunyamwera)ウイルス、ブニヤウイルス・ラクロス(Bunyavirus La Crosse)、ブニヤウイルス・スノーシューヘア(Bunyavirus snowshoe hare)、カーディオウイルス、セルコピテシン(Cercopithecine)ヘルペスウイルス、チャンディプラウイルス、チクングニアウイルス、コサウイルス、コサウイルス、牛痘ウイルス、コクサッキーウイルス、クリミア・コンゴサイトメガロウイルス、出血熱ウイルス、δウイルス、δレトロウイルス、デングウイルス、ディペンドウイルス、ドーリ(Dhori)ウイルス、ダグベ(Dugbe)ウイルス、ドウベンハーゲ(Duvenhage)ウイルス、東部ウマ脳炎ウイルス、エコーウイルス、脳心筋炎ウイルス、エンテロウイルス、エプスタイン・バー(EB)ウイルス、エリスロウイルス、欧州コウモリリッサウイルス、フラビウイルス、GBウイルス/C型肝炎ウイルス、ハンタンウイルス、ハンタウイルス、ヘニパウイルス、ヘンドラウイルス、ヘニパウイルス、A型、B型、C型、及びE型肝炎、又はδウイルス、ヘパトウイルス、ヘパシウイルス、ヘペウイルス、馬痘ウイルス、アストロウイルス、サイトメガロウイルス、エンテロウイルス、ヘルペスウイルス、HIV、コブウイルス、リッサウイルス、パピローマウイルス、パラインフルエンザ、パルボウイルス、呼吸器合胞体ウイルス、ライノウイルス、スプマレトロウイルス、Tリンパ球向性ウイルス、トロウイルス、イスファハンウイルス、JCポリオーマウイルス、日本脳炎ウイルス、フニンアレナウイルス、KIポリマウイルス、クンジンウイルス、ラゴスコウモリウイルス、ビクトリア湖マールブルグウイルス、ランガットウイルス、ラッサウイルス、レンチウイルス、ローズデールウイルス、ルーピング病ウイルス、リンパクリプトウイルス、リンパ性脈絡膜髄膜炎ウイルス、リッサウイルス、マチュポウイルス、マールブルグウイルス、マスタデノウイルス、ママストロウイルス、マヤロウイルス、麻疹ウイルス、メンゴ脳心筋炎ウイルス、メルケル細胞ポリオーマウイルス、モコラウイルス、モルシポックスウイルス、伝染性軟属腫ウイルス、サル痘ウイルス、ムンプスウイルス、ムパピローマウイルス、マレーバレー脳炎ウイルス、ナイロウイルス、ニューヨークウイルス、ニパウイルス、ノロウイルス、ノーウォークウイルス、オニョンニョンウイルス、オルフウイルス、オロプーシェウイルス、オルソブニヤウイルス、オルソヘパドナウイルス、オルソニューモウイルス、オルソポックスウイルス、ヘパシウイルス、オルソポックスウイルス、ペギウイルス、ピチンデウイルス、ポリオウイルス、ポリオーマウイルス、プンタトロフレボウイルス、プーマラウイルス、狂犬病ウイルス、レスピロウイルス、ラディノウイルス、リフトバレー熱ウイルス、ロサウイルス、ロゼオロウイルス、ロスリバーウイルス、ロタウイルス、風疹ウイルス、ルブラウイルス、サギヤマウイルス、サリウイルスA、サシチョウバエ熱シシリアンウイルス、サポウイルス、サッポロウイルス、セドルナウイルス(seadornavirus)、セムリキフォレストウイルス、ソウルウイルス、シミアンフォーミーウイルス、シミアンウイルス、シンプレックスウイルス、シンドビスウイルス、サウサンプトンウイルス、スプマウイルス、セントルイス脳炎ウイルス、トゴトウイルス、ダニ媒介性ポワッサンウイルス、トルクテノウイルス、トロウイルス、トスカーナウイルス、ウークニエミウイルス、ワクシニアウイルス、水痘・帯状疱疹ウイルス、バリセロウイルス、天然痘ウイルス、ベネズエラウマ脳炎ウイルス、水疱性口内炎ウイルス、ベシキュロウイルス、西部ウマ脳炎ウイルス、WUポリオーマウイルス、西ナイルウイルス、ヤバサル腫瘍ウイルス、ヤバ様病ウイルス、黄熱病ウイルス、ジカウイルスなど。特定の実施形態では、前記対象は、コロナウイルス、例えばSARS-CoV-2又はインフルエンザを有する。前記対象は、パンデミック(広域流行性)、エピデミック(流行性)、季節性、又は単独の感染インシデントの際に感染し得る。特定の実施形態では、エピデミック又はパンデミックの文脈で、すなわち、医療資源が限られており、救急医療の文脈で存在する対象の迅速なトリアージが重要である場合に、感染が検出される。
【0036】
II.生体試料
患者のバイオマーカーの状態を評価するために、対象から生体試料を得る。例えば、血液試料はフレボトミスト(phlebotomist)(採血有資格者)によって採取され、mRNAを収集して保存することができる。いくつかの実施形態では、血液試料は、試料内の血液細胞からのRNAを即座に安定化できる溶液で事前に満たされたチューブに直接収集される。適切なチューブの1つは、PAXgene(登録商標)Blood RNA Tube(QIAGEN社、BDカタログ762165)であるが、RNAを保存可能な任意のチューブを使用できる。K2-EDTAチューブなどの非RNA保存チューブを使用することもできるが、静脈穿刺後一定時間内(例えば、15、30、60、又は120分以内)に検査、冷蔵保存、又はその両方とする必要がある。特定の細胞で発現が乏しいバイオマーカーポリヌクレオチドは、正規化技術を使用して濃縮することができる(Bonaldo et al.,1996,Genome Res.6:791-806)。特定の実施形態では、試料は、ウイルス感染の最初の診断から24時間以内に採取される。
【0037】
典型的には、生体試料は、全血、軟膜、血漿、血清、又は末梢血単核細胞(PBMCS)、T細胞、並びにリンパ球、多形核白血球、好中球、単球、網状赤血球、好塩基球、バンド細胞、後骨髄球、体腔細胞、血球、好酸球、巨核球、マクロファージ、樹状細胞、ナチュラルキラー細胞、又はそのような細胞の画分(例えば、核酸又はタンパク質画分)として挙げられる、成熟、未成熟、又は発生中の白血球などの血液細胞を含む。本発明の方法の目的のために使用され得る他の生体試料は、とりわけ、唾液、尿、汗、鼻スワブ、鼻咽頭スワブ、直腸スワブ、腹水、腹膜液、滑液、羊水、脳脊髄液、及び組織生検を含む。生体試料は、従来の技術、例えば、血液試料用の静脈穿刺又は固形組織試料用外科的技術によって対象から得ることができる。
【0038】
III.バイオマーカーの選択
ウイルス感染症と診断された対象の30日死亡率リスクは、バイオマーカーの発現レベルに基づいてスコア(例えば、「バイオマーカースコア」又は「死亡率スコア」)を計算することによって決定される。いくつかの実施形態では、前記スコアの計算には、5つのバイオマーカーのパネルが使用される。特定の実施形態では、バイオマーカー遺伝子は、TGFBI、DEFA4、LY86、BATF、及びHK3である。いくつかの実施形態では、前記スコアの計算には、6つのバイオマーカーのパネルが使用される。特定の実施形態では、バイオマーカー遺伝子は、TGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1である。TGFBIは、形質転換増殖因子β誘導を指す(例えば、NCBI遺伝子ID7045を参照、その全開示は参照により本明細書に援用される)。DEFA4は、デフェンシンα4を指す(例えば、NCBI遺伝子ID1669を参照、その全開示は参照により本明細書に援用される)。LY86は、リンパ球抗原86を指す(例えば、NCBI遺伝子ID9450を参照、その全開示は参照により本明細書に援用される)。BATFは、塩基性ロイシンジッパーATF様転写因子(例えば、NCBI遺伝子ID10538を参照、その全開示は参照により本明細書に援用される)を指し、HK3は、ヘキソキナーゼ3(例えば、NCBI遺伝子ID3101を参照、その全開示は参照により本明細書に援用される)を指し、及びHLA-DPB1は、主要組織適合複合体クラスII DPβ1(例えば、NCBI遺伝子ID3115を参照、その全開示は参照により本明細書に援用される)を指す。
【0039】
しかしながら、例えば、TGFBI、DEFA4、LY86、BATF、及びHK3、又はTGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1の代わりに、又はそれらに加えて、他のバイオマーカーを使用することができる。例えば、いくつかの実施形態では、本発明の方法で使用される他のバイオマーカーには、TDRD1、POLE、MYOM1、PDZD4、HHLA3、PDE4B、HSPA14、PRDM2、TSPAN13、GAB4、RPL4、EGLN1、TRIM67、AACS、及びST8SIA3が含まれるが、これに限定されない。本発明の方法で、任意の数のバイオマーカーを評価でき、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、又はそれ以上のバイオマーカーである。使用できる他のバイオマーカーには、例えば、それぞれの全開示が参照により本明細書に援用される、Mayhew et al.(2020)Nature Commun.11,Art.1177、Sweeney et al.,(2018)Nature Commun.9(1):694、Sweeney et al.(2015)Sci.Transl.Med.7(287):287ra71、Sweeney et al.,(2016)Sci.Transl.Med.8(346):346ra91、Sweeney et al.,(2018)Crit.Care Med.46(6):915-925、並びに特許公報の国際公開(WO)第2016/145426号、国際公開(WO)第2017/214061号、国際公開(WO)第2019/16822号、及び国際公開(WO)第2018/004806号に開示されるものが挙げられる。いくつかの実施形態では、バイオマーカーは、表1に記載されている遺伝子の任意の1又は複数を含む。いくつかの実施形態では、バイオマーカーは、表5に記載されている遺伝子の任意の1又は複数を含む。いくつかの実施形態では、バイオマーカーは、表3に記載されている遺伝子対の任意の1又は複数を含む。いくつかの実施形態では、バイオマーカーは、表6に記載されている遺伝子対の任意の1又は複数を含む。
【0040】
本発明の方法で使用されるバイオマーカーは、その発現レベルがウイルス感染症、例えばSARS-CoV-2又はインフルエンザを有する対象における30日死亡率(又は他の)転帰と相関する遺伝子に対応する。個々のバイオマーカーの発現レベルは、同じウイルス感染症の生存者又は非生存者におけるレベルと比較して上昇又は低下し得ることが理解される。重要なことは、バイオマーカーの発現レベルは、生存又は非生存に対して正相関又は逆相関であり、全体のスコア、例えば、リスクスコア、バイオマーカースコア、又は死亡率スコアの決定を可能にするため、対象の30日死亡率リスク、例えば、低い、中間の、又は高い30日死亡率リスクを決定するために使用できることである。
【0041】
追加のバイオマーカーは、本明細書の別の場所で、例えば、実施例でより詳細に説明されるように、標準的な分析方法又は測定基準を使用して、例えば、ウイルス感染症と診断され、30日転帰(すなわち、30日生存又は非生存)が判明している対象から採取した試料のデータを分析することにより、評価及び特定できる。特定の方法では、トレーニングデータのウイルス感染症の種類には対象のウイルス感染症の種類が含まれるが、これは必須ではない。適切な方法又は測定基準には、ピアソン相関、ケンドール順位相関、スピアマン順位相関、t検定、その他のノンパラメトリック尺度、非生存群のオーバーサンプリング、生存群のアンダーサンプリング、並びに線形回帰、非線形回帰、ランダムフォレスト及びその他のツリー・ベースの手法、人工ニューラルネットワークなどを含むその他の手法が挙げられる。特定の実施形態では、特徴選択は、ランキング測定基準として遺伝子発現と転帰との間のピアソン相関の絶対値を用いた単変量ランキングを使用する。いくつかの実施形態では、特徴(遺伝子)は、トレーニングの精度に合わせて最適化された貪欲法による順方向検索によって選択される。いくつかの実施形態では、特徴(遺伝子)は、受信者動作特性曲線下面積に合わせて最適化された貪欲法による順方向検索によって選択される。
【0042】
特定の実施形態では、例えば別個の検証セットを使用して、又は交差検証を使用して、機械学習ワークフローがトレーニングデータに適用される。例えば、ハイパーパラメータチューニングは、感染性疾患診断のモデル最適化に有効であることが公知のパラメータなど、パラメータの検索空間で使用され得る。使用できる分類子の例としては、線形カーネルを使用するサポートベクターマシン、ロジスティック回帰、及び線形活性化関数を使用する多層パーセプトロンなどの線形分類子が挙げられる。特徴選択は、候補バイオマーカーの遺伝子発現データを独立変数として使用し、公知の転帰を従属変数として使用して実行され得る。各モデルの感度及び偽陽性率並びにハイパーパラメータ検索中に評価される決定閾値に基づくプロットと、最適なモデルのプールされた交差検証確率に基づくROC様プロットとを使用して、様々なモデルを評価できる。(例えば、Ramkumar et al.,Development of a Novel Proteomic Risk-Classifier for Prognostication of Patients with Early-Stage Hormone Receptor-Positive Breast Cancer.Biomarker Insights,Vol.13,1-9,2018,Fig.2Aを参照)。任意の数の様々な交差検証(CV)のバリアントを使用できる。各分割(fold)が複数のスタディ(study)を含み、各スタディが正確に1つのCV分割に割り当てられる、5分割(5-fold)ランダムCVや5分割グループ化CV、並びに各スタディが1つのCV分割を形成するリーブワンスタディアウト(LOSO)法などである。いくつかの実施形態では、最終モデルに含まれる遺伝子の数は、例えば、5又は6に制限して、迅速な分子アッセイへの翻訳を容易にすることができる。例えば、発現レベルが最も高い遺伝子を選択することにより、遺伝子の数を減らすことができる。
【0043】
IV.バイオマーカー発現の検出
以下で詳細に説明するように、本明細書に記載のバイオマーカー遺伝子発現レベルに対応するデータセットを使用して、統計的機械学習アルゴリズムの適用に基づいて診断ルール若しくはモデル又は予測ルール若しくはモデルを作成し、死亡率リスクスコアを生成する。このようなアルゴリズムは、バイオマーカープロファイルと転帰との間の関係、例えば30日の生存率及び非生存率(トレーニングデータと称される場合もある)を使用する。前記データを、対象の状態、例えば30日での死亡率リスクを予測するために使用される関係を推測するために使用する。
【0044】
バイオマーカーの発現レベルは、多くの方法のいずれかで評価することができる。特定の実施形態では、バイオマーカーの発現レベルは、バイオマーカーのポリヌクレオチドレベルを測定することによって決定される。例えば、血液又はその他の生体試料が収集され保存されると、RNAは、使用するバイオマーカー遺伝子及び任意の対照遺伝子、例えば、バイオマーカーの参照値として使用されるハウスキーピング遺伝子の発現レベルのその後の定量化のためにRNAを保存できる限り、任意の方法を使用して抽出できる。RNAは、例えば、保存された血球から手動で、又は市販のRNA抽出キットを備えたQIAcube(登録商標)(QIAGEN社)などのロボット装置を使用して抽出することができる。いくつかの実施形態では、例えば、等温増幅法では、RNA抽出は行われない。そのような方法では、発現レベルは、例えば、血液細胞の溶解、次いで、例えば、逆転写及びmRNAの増幅によって直接決定することができる。
【0045】
いくつかの実施形態では、参照核酸はハウスキーピング遺伝子又は対応するmRNA転写物などのその産物である。いくつかの実施形態では、参照核酸には、プレmRNA分子、5’キャップmRNA分子、3’アデニル化mRNA分子、又は成熟mRNA分子であるmRNA転写物が含まれる。特定の実施形態では、参照核酸は、試験試料の供給源でもある哺乳動物宿主から得られた成熟mRNA分子である。いくつかの実施形態では、ハウスキーピング遺伝子又はその産物は、宿主の細胞によって比較的一定の速度で発現され、ハウスキーピング遺伝子の発現率は、他の宿主遺伝子又はその遺伝子産物の発現に対する基準点として使用できる。適切なハウスキーピング遺伝子は、当技術分野で周知であり、例えば、GAPDH、ユビキチン、18S(18S rRNA、例えば、HGNC(Human Genome Nomenclature Committee)番号44278~44281及び37657)、ACTB(Actin Beta、例えば、HGNC番号132))、KPNA6(カリオフェリンサブユニットα6、例えば、HGNC番号6399)、又はRREB1(ras応答性エレメント結合タンパク質1、例えば、HGNC番号10449)を含み得る。
【0046】
いくつかの実施形態では、参照核酸は、ヒトハウスキーピング遺伝子である。本発明の方法での使用に適した例示的なヒトハウスキーピング遺伝子には、KPNA6、RREB1、YWHAB、染色体1オープンリーディングフレーム43(C1orf43)、荷電多胞体タンパク質2A(CHMP2A)、ER膜タンパク質複合体サブユニット7(EMC7)、グルコース-6-リン酸イソメラーゼ(GPI)、プロテアソームサブユニットβ型2(PSMB2)、プロテアソームサブユニットβ型4(PSMB4)、メンバーRAS癌遺伝子ファミリー(RAB7A)、受容体アクセサリータンパク質5(REEP5)、小核リボ核タンパク質D3(SNRPD3)、バロシン含有タンパク質(VCP)、及び液胞タンパク質ソーティング29ホモログ(VPS29)が挙げられるが、これらに限定されない。いくつかの実施形態では、www/tau/ac/il~elieis/HKG/で提供されている任意のハウスキーピング遺伝子を使用できる(Eisenberg and Levanon.,Trends Genet.(2013),10:569-74を参照)。
【0047】
バイオマーカー遺伝子の転写物のレベル、又はそれらの互いに対するレベル、及び/又はハウスキーピング遺伝子などの参照遺伝子に対するそれらのレベルは、生体試料に存在するmRNA又はそれに由来するポリヌクレオチドの量から決定することができる。ポリヌクレオチドは、様々な方法で検出及び定量化でき、NanoString(例えば、nCounter解析)、マイクロアレイ解析、ポリメラーゼ連鎖反応(PCR)、逆転写酵素ポリメラーゼ連鎖反応(RT-PCR)、定量的RT-PCR(qRT-PCR)、遺伝子発現連鎖解析(SAGE)、等温増幅法、例えば、qRT-LAMP、内部DNA検出スイッチ、ノーザンブロッティング、RNAフィンガープリンティング、リガーゼ連鎖反応、Qbetaレプリカーゼ、鎖置換増幅、転写に基づく増幅システム、ヌクレアーゼ保護(SIヌクレアーゼ又はRNAse保護アッセイ)、配列決定法、並びにその全体が参照により本明細書に援用される国際公開(WO)第88/10315号及び第89/06700号並びに国際出願番号第PCT/US87/00880号及び第PCT/US89/01025号に開示される方法、及びMacManプローブ、フリップ(flip)プローブ、及びTaqManプローブを使用する方法(例えば、Murray et al.(2014)J.Mol Diag.16:6,pp 627-638を参照)が挙げられるが、これらに限定されない。例えば、それぞれが参照によりその全体が本明細書に援用される、Draghici,Data Analysis Tools for DNA Microarrays,Chapman and Hall/CRC,2003、Simon et al.,Design and Analysis of DNA Microarray Investigations,Springer,2004、Real-Time PCR:Current Technology and Applications,Logan,Edwards,and Saunders eds.,Caister Academic Press,2009、Bustin,A-Z of Quantitative PCR(IUL Biotechnology,No.5),International University Line,2004、Velculescu et al.(1995)Science 270:484-487、Matsumura et al.(2005)Cell.Microbiol.7:11-18、及びSerial Analysis of Gene Expression(SAGE):Methods and Protocols(Methods in Molecular Biology),Humana Press,2008を参照。
【0048】
いくつかの実施形態では、バイオマーカー遺伝子発現は、NanoString nCounterなどの遺伝子発現パネルを使用して検出され、これにより、増幅又はcDNA変換を必要とせずにバイオマーカー遺伝子発現の定量化が可能になる。そのような方法では、対象からの血液試料又は他の生体試料から得られたRNAは、プローブ、例えば、各バイオマーカー及び制御配列の標識レポータープローブ及び捕捉プローブに溶液中でハイブリダイズする。次いで、標的RNAプローブ複合体を精製し、固体支持体に固定した後、各々特定のマーカーの定量化を可能にする特定の蛍光シグネチャを有するマーカー特異的プローブを用いて定量化する。そのような用途のためのそのような方法並びにプローブ、例えば捕捉プローブ及びレポータープローブの生成は、当技術分野で公知であり、例えば、ウェブサイト(nanostring.com)に記載されている。
【0049】
qRT-PCR又はqRT-LAMPなどの増幅に基づく方法では、プライマーは様々な方法で得ることができる。例えば、プライマーは、例えば、Applied Biosystems社、Biolytic Lab Performance社、Sierra Biosystems社などによって販売されているオリゴ合成機を使用して実験室で合成することができる。あるいは、任意の配列及び/又は修飾を備えたプライマー及びプローブは、多数のサプライヤー、例えば、Thermo Fisher Scientific社、Biolytic Lab Performance社、IDT社、Sigma-Aldritch社、GeneScript社などから容易に注文できる。
【0050】
Oligoバージョン5.0(National Biosciences社)など、当技術分野で周知のコンピュータープログラムが、必要な特異度及び最適な増幅特性を有するプライマーの設計に有用である。PCR法は当技術分野で周知であり、例えば、その全体が参照により本明細書に援用される、Innis et al.,eds.,PCR Protocols:A Guide To Methods And Applications,Academic Press Inc.,San Diego,Calif.(1990)に記載されている。
【0051】
いくつかの実施形態では、マイクロアレイは、バイオマーカーのレベルを測定するために使用される。マイクロアレイ解析の利点は、各バイオマーカーの発現を同時に測定できることと、特定の疾患又は状態(例えば、インフルエンザ、SARS-CoV-2など)の診断的発現プロファイルを提供するようにマイクロアレイを特別に設計できることである。マイクロアレイは、ポリヌクレオチド配列を含むプローブを選択し、次いでそのようなプローブを固体支持体又は表面に固定することによって調製される。例えば、マイクロアレイは、それぞれ本明細書に記載のバイオマーカーの1つを表す結合(例えば、ハイブリダイゼーション)部位又は「プローブ」の規則配列を有する支持体又は表面を含み得る。マイクロアレイは、アドレス可能なアレイであることが好ましく、位置的にアドレス可能なアレイであることがより好ましい。より具体的には、アレイの各プローブは、好ましくは、固体支持体上の既知の所定の位置に配置され、各プローブの同一性(すなわち、配列)がアレイ中(すなわち、支持体又は表面上)の位置から決定され得る。各プローブは、好ましくは単一部位で固体支持体に共有結合される。マイクロアレイを調製するための条件、ハイブリダイゼーション条件、及び結合したプローブの検出のための条件は、当技術分野で周知である(例えば、Sambrook,et al.,Molecular Cloning:A Laboratory Manual(3rd Edition,2001)、Ausubel et al.,Current Protocols In Molecular Biology,vol.2,Current Protocols Publishing,New York(1994)、Shalon et al.,1996,Genome Research 6:639-645、Schena et al.,Genome Res.6:639-645(1996)、及びFerguson et al.,Nature Biotech.14:1681-1684(1996)を参照)。
【0052】
上記のように、特定のポリヌクレオチド分子が特異的にハイブリダイズする「プローブ」は、相補的なポリヌクレオチド配列を含む。前記マイクロアレイのプローブは、典型的には、例えば、長さが1,000ヌクレオチド以下、又は10~1,000ヌクレオチド、又は10~200、10~30、10~40、20~50、40~80、50~150、若しくは80~120ヌクレオチドのヌクレオチド配列からなる。前記プローブは、DNA配列、RNA配列、又はDNAとRNAとのコポリマー配列を含み得る。前記プローブのポリヌクレオチド配列はまた、DNA及び/又はRNA類似体、誘導体、又はそれらの組み合わせを含み得る。例えば、前記プローブは、塩基部分、糖部分、又はリン酸骨格(例えば、ホスホロチオエート)で修飾され得る。前記プローブのポリヌクレオチド配列は、合成オリゴヌクレオチド配列などの合成ヌクレオチド配列であり得る。プローブ配列は、インビボで酵素的に、インビトロで酵素的に(例えばPCRによって)、又はインビトロで非酵素的に合成され得る。
【0053】
プローブは、好ましくは、結合エネルギー、塩基組成、配列複雑性、クロスハイブリダイゼーション結合エネルギー、及び二次構造を考慮に入れるアルゴリズムを使用して選択される。Friend et al.(国際公開(WO)第01/05935号、2001年1月25日公開)及びHughes et al.,Nat.Biotech.19:342-7(2001)を参照。アレイは、陽性対照プローブ、例えば標的ポリヌクレオチド分子中の配列に相補的でハイブリダイズ可能であることが公知のプローブ、及び陰性対照プローブ、例えば標的ポリヌクレオチド分子中の配列に相補的ではなくハイブリダイズ可能でないことが公知のプローブの両方を含む。さらに、本発明の方法は、本明細書の他の場所でより詳細に説明するように、バイオマーカー自体、並びにハウスキーピング遺伝子などの内部制御配列の両方に対するプローブを含む。
【0054】
一実施形態では、TGFBIポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、DEFA4ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、LY86ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、BATFポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、及びHK3ポリヌクレオチドにハイブリダイズするオリゴヌクレオチドを含むマイクロアレイが提供される。一実施形態では、本開示は、TGFBIポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、DEFA4ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、LY86ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、BATFポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、HK3ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、及びHLA-DPB1ポリヌクレオチドにハイブリダイズするオリゴヌクレオチドを含むマイクロアレイを提供する。いくつかの実施形態では、本開示は、表1又は表5に列挙されたバイオマーカーのいずれかにハイブリダイズするオリゴヌクレオチドを含むマイクロアレイを提供する。いくつかの実施形態では、本開示は、表3又は表6に列挙されたバイオマーカー対のいずれかにハイブリダイズする2つのオリゴヌクレオチドを含むマイクロアレイを提供する。
【0055】
いくつかの実施形態では、定量的逆転写酵素PCR(qRT-PCR)は、バイオマーカーの発現プロファイルを決定するために使用される(例えば、その全体が参照により本明細書に援用される米国特許出願公開番号第2005/0048542A1号を参照)。RT-PCRによる遺伝子発現プロファイリングの第1の工程は、RNA鋳型のcDNAへの逆転写と、その後のPCR反応における指数関数的増幅である。最も一般的に使用される2つの逆転写酵素は、アビロ(avilo)骨髄芽球症ウイルス逆転写酵素(AMV-RT)及びモロニー(Moloney)マウス白血病ウイルス逆転写酵素(MLV-RT)である。逆転写工程は、典型的には、状況や発現プロファイリングの目的に応じて、特定のプライマー、ランダムヘキサマー、又はオリゴdTプライマーを使用してプライミングされる。例えば、抽出されたRNAは、GeneAmp RNA PCRキット(Perkin Elmer社、米国カリフォルニア州)を製造元の指示に従って使用して逆転写することができる。得られたcDNAは、その後のPCR反応の鋳型として使用できる。
【0056】
いくつかの実施形態では、PCRでは、5’-3’ヌクレアーゼ活性を有するが、3’-5’校正(プルーフリーディング)エンドヌクレアーゼ活性を欠くTaq DNAポリメラーゼを使用する。TaqMan PCRは典型的には、Taq又はTthポリメラーゼの5’-ヌクレアーゼ活性を利用して、その標的アンプリコンに結合したハイブリダイゼーションプローブを加水分解するが、同等の5’ヌクレアーゼ活性を有する任意の酵素を使用できる。このような方法では、2つのオリゴヌクレオチドプライマーを使用して、PCR反応に典型的なアンプリコンを生成し、3番目のオリゴヌクレオチド又はプローブを設計して、2つのPCRプライマー間に位置するヌクレオチド配列を検出する。プローブは、Taq DNAポリメラーゼ酵素によって伸長不可であり、レポーター蛍光色素及び消光剤蛍光色素で標識されている。レポーター色素からのレーザー誘起発光は、プローブ上に2つの色素が近接して配置されている場合、消光色素によって消光される。増幅反応中、Taq DNAポリメラーゼ酵素は鋳型依存的にプローブを切断する。得られたプローブ断片は溶液中で解離し、放出されたレポーター色素からのシグナルは、第2のフルオロフォアの消光効果を有さない。新たに合成された分子ごとに1分子のレポーター色素が遊離し、消光されていないレポーター色素の検出は、データの定量的解釈の基礎となる。
【0057】
TaqMan RT-PCRは、例えば、ABI PRISM 7700配列検出システム(Perkin-Elmer-Applied Biosystems社、米国カリフォルニア州フォスターシティ)又はLightCycler(Roche Molecular Biochemicals社、マンハイム、ドイツ)などの市販の機器を使用して行うことができる。好ましい実施形態では、5’ヌクレアーゼ手順は、ABI PRISM 7700配列検出システムなどのリアルタイム定量的PCR装置で実行される。前記システムは、サーモサイクラー、レーザー、電荷結合素子(CCD)、カメラ、及びコンピューターで構成されている。前記システムには、前記機器を実行し、データを分析するためのソフトウェアが含まれている。5’-ヌクレアーゼアッセイデータは、最初はCt、すなわち閾値サイクルとして表される。蛍光値はサイクルごとに記録され、増幅反応のその時点までに増幅された産物の量を表す。蛍光シグナルが統計的に有意であると最初に記録された時点が、閾値サイクル(Ct)である。
【0058】
エラーと試料間変動の影響とを最小限に抑えるために、RT-PCRは通常、内部標準を使用して実行される。理想的な内部標準は、異なる組織間で一定のレベルで発現され、実験的処理の影響を受けない。遺伝子発現のパターンを正規化するために使用され得るRNAには、ハウスキーピング遺伝子グリセルアルデヒド-3-リン酸-デヒドロゲナーゼ(GAPDH)及びベータ-アクチンのmRNAが挙げられる。
【0059】
特定の実施形態では、バイオマーカー遺伝子発現は、等温増幅を使用して決定される。等温増幅は、一定の単一増幅温度(例えば、約30℃~約95℃)を用いて標的核酸を増幅するプロセスである。標準的なPCRとは異なり、等温増幅反応には、アニールされたオリゴヌクレオチドの変性、ハイブリダイゼーション、及び伸長の複数サイクルが含まれず、増幅された標的核酸分子(すなわち、アンプリコン)の集団が形成される。当技術分野で公知の様々なタイプの等温適用があり、ループ媒介等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、リコンビナーゼポリメラーゼ増幅(RPA)、ローリングサークル増幅(RCA)、ニッキング酵素増幅反応(NEAR)、及びヘリカーゼ依存増幅(HDA)が挙げられるが、これらに限定されない。
【0060】
特定の実施形態では、等温増幅は、標的核酸が一定温度で増幅され、標的核酸の増幅速度が蛍光、濁度、又は同様の手段(例えば、NEAR又はLAMP)によってモニタリングされるリアルタイム定量的等温増幅である。場合によっては、RNA(例えば、mRNA)が生体試料から分離され、逆転写によってcDNAを合成するためのテンプレートとして使用される。cDNA分子は、増幅された標的核酸の産生を検出及び定量できるように、等温増幅条件下で増幅される。
【0061】
特定の実施形態では、等温増幅はループ媒介等温増幅(LAMP)である。LAMPは選択性を提供し、ポリメラーゼと標的核酸の固有の配列を認識する特別に設計されたプライマーのセットとを使用する(例えば、Nixon et al.,(2014)Bimolecular Detection and Quantitation,2:4-10、Schuler et al.,(2016)Anal Methods.,8:2750-2755、及びSchoepp et al.,(2017)Sci.Transl.Med.,9:eaal3693を参照)。PCRとは異なり、標的核酸は、複数の内部プライマー及び外部プライマーと、鎖置換活性を有するポリメラーゼを使用して、一定温度(例えば、60℃~65℃)で増幅される。場合によっては、標的核酸のセンス鎖及びアンチセンス鎖の一部に相補的な核酸配列を含む内部プライマー対がLAMPを開始する。内部プライマーによる鎖置換合成に続いて、外部プライマー対によってプライミングされた鎖置換合成により、一本鎖アンプリコンが放出され得る。一本鎖アンプリコンは、標的核酸の他端にハイブリダイズしてステムループ核酸構造を生成する第2の内部プライマー及び第2の外部プライマーによってプライミングされるさらなる合成のためのテンプレートとして機能し得る。その後のLAMPサイクリングでは、1つの内部プライマーが産物のループにハイブリダイズし、置換及び標的核酸合成を開始し、元のステムループ産物と、2倍の長さのステムを有する新しいステムループ産物を生成する。さらに、アンプリコンループ構造の3’末端は、自己鋳型鎖合成の開始部位として機能し、追加のループ構造を形成して後続の自己鋳型増幅ラウンドをプライミングするヘアピン様アンプリコンを生成する。増幅は、標的核酸の多数のコピーの蓄積を伴って継続する。LAMPプロセスの最終産物は、同一鎖内の標的核酸配列の交互に反転した反復間のアニーリングによって形成された複数のループを有する、カリフラワー様構造の標的核酸の連結された反復を有するステムループ核酸である。
【0062】
いくつかの実施形態では、等温増幅アッセイは、標的核酸を定量化するためのデジタル逆転写ループ媒介等温増幅(dRT-LAMP)反応を含む(例えば、Khorosheva et al.,(2016)Nucleic Acid Research,44:2 e10を参照)。通常、LAMPアッセイは、増幅反応中に検出可能なシグナル(例えば、蛍光)を生成する。いくつかの実施形態では、蛍光を検出して定量化できる。蛍光を検出及び定量化するための任意の適切な方法を使用することができる。場合によっては、Applied Biosystem社のQuantStudioなどの装置を使用して、等温増幅アッセイからの蛍光を検出及び定量化できる。
【0063】
定量的リアルタイム等温増幅によって試験試料中の標的核酸の増幅を検出するための任意の適切な方法を使用して、本発明の方法を実施することができる。いくつかの実施形態では、試験試料中の標的核酸の定量的リアルタイム等温増幅は、標的核酸の等温増幅中に組み込まれたヌクレオチド又はヌクレオチド類似体に結合した1又は複数の異なる(固有の)蛍光標識(例えば、5-FAM(522nm)、ROX(608nm)、FITC(518nm)、及びナイルレッド(Nile Red)(628nm))を検出することによって決定される。別の実施形態では、試験試料中の標的核酸の定量的リアルタイム等温増幅は、標的核酸の等温増幅中に組み込まれたヌクレオチド又はヌクレオチド類似体に結合した単一のフルオロフォア種(例えば、ROX(608nm))の検出によって決定することができる。いくつかの実施形態では、使用される各フルオロフォア種は、任意の他のフルオロフォア種とは異なる蛍光シグナルを放出するため、アッセイに存在する他のフルオロフォア種の中から各フルオロフォアを容易に検出できる。
【0064】
いくつかの実施形態では、定量的リアルタイム等温増幅によって試験試料中の標的核酸の増幅を検出する方法は、SYTO色素(SYTO9又はSYTO82)などのインターカレーター蛍光色素を使用することを含み得る。いくつかの実施形態では、定量的リアルタイム等温増幅により試験試料中の標的核酸の増幅を検出する方法は、非標識プライマーを使用して前記試験試料中の標的核酸を等温増幅し、標識プローブ(例えば、フルオロフォアを有する)を使用して前記試験試料中の標的核酸の等温増幅を検出することを含み得る。いくつかの実施形態では、非標識プライマーは、試験試料に存在する標的核酸を等温的に増幅するために使用され、5’末端に5-FAM色素標識を有し、3’末端にマイナーグルーブバインダー(MGB)と非蛍光クエンチャーとを有するプローブを使用して、標的核酸の等温増幅を検出する(例えば、ThermoFisher Scientific社のTaqMan Gene Expression Assay)。
【0065】
いくつかの実施形態では、試験試料中の標的核酸の増幅を検出することは、ワンステップ又はツーステップ定量的リアルタイム等温増幅アッセイを用いて行われる。ワンステップ定量的リアルタイム等温増幅アッセイでは、逆転写を定量的等温増幅と組み合わせて、単一の定量的リアルタイム等温増幅アッセイを形成する。ワンステップアッセイにより、実際の操作回数が減り、試験試料を処理するための合計時間が短縮される。ツーステップアッセイは、逆転写が行われる第1工程と、それに続く定量的等温増幅が行われる第2工程とを含む。ワンステップ又はツーステップアッセイのどちらを行うべきかを決定することは、当業者の技術常識の範囲内である。
【0066】
いくつかの実施形態では、増幅及び/又は検出は、図16に示されるように、統合された測定システムを使用して全体的又は部分的に実行され、これは、本明細書の別の場所で説明されているコンピューターシステムも含み得る(例えば、図17を参照)。
【0067】
いくつかの実施形態では、リスク又はバイオマーカーのスコアは、試験した各バイオマーカーのTt(閾値までの時間)値に基づいて計算される。これは、例えば、標的核酸(例えば、バイオマーカー)及び参照核酸(例えば、ハウスキーピング遺伝子)の等温増幅又は他の増幅についての標準曲線を確立することによって達成され得る。標準曲線は、複数の既知の入力濃度で定量化されたキャリブレーター試料を使用して、リアルタイムの等温増幅アッセイを実行することによって取得できる。適切な方法は、例えば、PCT公開番号(WO)第2020/061217号に提供されており、その全開示は参照により本明細書に援用される。
【0068】
例えば、いくつかの実施形態では、標準曲線を生成するために、定量化された物質の連続希釈を行うことによって定量化されたキャリブレーター試料が得られる。例えば、鋳型は、例えば、約10コピー/μL~約10コピー/μLの範囲内の濃度をカバーする鋳型を生成する10倍濃度間隔で緩衝液中で段階希釈される。各キャリブレーター試料の正確な濃度は、当技術分野で公知の方法を使用して決定することができる。
【0069】
標準曲線を得るために、標的核酸のそれぞれの濃度を有するそれぞれのキャリブレーター試料の既知量(例えば、1/μL)を用いて、各アリコートについてリアルタイム増幅アッセイを実施する。それぞれのキャリブレーター試料のリアルタイム増幅アッセイでは、標的核酸のインターカレーター蛍光色素(例えば、dsDNA色素)又は蛍光標識によって放出される蛍光の強度が、時間関数として測定される。例えば、リアルタイム定量的増幅アッセイにおいて時間関数として蛍光強度のプロットを作成することができる。破線は、所定の閾値強度を表すために使用することができ、増幅が開始された時点からの経過時間が閾値までの時間Ttである。それぞれの閾値までの時間値は、それぞれの蛍光曲線から時間関数として決定することができる。したがって、閾値までの時間値Tt、Ttn+1、Ttn+2などは、異なるキャリブレーター―試料について得られる。
【0070】
指数関数的増幅の場合、閾値までの時間は、開始コピー数(鋳型存在量とも称される)の対数(例えば、10を底とする対数)に直線的に比例する。データ点の散布図は、蛍光曲線から生成できる。各データ点は、データ対[Log10(CopyNumber), Tt]を表す(「CopyNumber」は、増幅アッセイにおける核酸の開始コピー数を指すことに注意)。いくつかの実施形態では、データ点はほぼ直線上にある。次いで、プロット内のデータ点に対して線形回帰が実行され、全偏差が最小でデータ点に最もよく適合する直線が得られる。線形回帰の結果は、下記式で表される直線になる。
mは直線の傾きであり、bはy切片である。傾きmは、標的核酸の等温増幅の効率を表す。bは、鋳型のコピー数がゼロに近似する時の閾値までの時間を表す。式(1)で表される直線を標準曲線と称する。
【0071】
いくつかの実施形態では、等温増幅アッセイの複製(例えば、三つ組)は、データの信頼性を高めるために、各試料に対して実行してもよい。複製された閾値までの時間の値を平均化し、標準偏差を計算できる。
【0072】
所定の等温増幅アッセイの標準曲線が確立されると、その標準曲線を使用して、下記式を用いて、標的核酸の未知の開始コピー数の増幅アッセイの将来の実行のために、閾値までの時間値を開始コピー数に変換できる。
【0073】
通常、低いコピー数又は非常に高いコピー数のデータ点は、直線から外れる場合がある。データ点が直線で表され得るコピー数の範囲は、標準曲線のダイナミックレンジと称される。閾値までの時間と標準曲線によって表されるコピー数の対数との間の線形関係は、ダイナミックレンジ内でのみ有効である。
【0074】
標的核酸及び参照核酸の増幅効率が所定の等温増幅アッセイで異なる場合、標的核酸及び参照核酸の標準曲線を別々に得る必要がある場合がある。したがって、2セットのリアルタイム等温増幅アッセイを行ってもよく、一方のセットは標的核酸の標準曲線を確立するためのものであり、他方のセットは参照核酸の標準曲線を確立するためのものである。複数の標的核酸が考慮される場合(例えば、本明細書に記載の5つのバイオマーカーのパネルの場合)、各標的核酸の標準曲線を得てもよい。
【0075】
いくつかの実施形態では、標準曲線は、試験試料を得る前に生成される。すなわち、標準曲線は、試験試料の定量的等温増幅を使用してオンボードで生成されるわけではない。このような標準曲線は、オフボード標準曲線と称される場合がある。オフボード標準曲線は、相対存在量の値を推定するために使用され得る。例えば、未知の入力濃度の標的核酸の試験試料について、試験試料の第1のアリコートに対して第1のリアルタイム増幅アッセイを実施して、標的核酸に関する第1の閾値までの時間値を得る。次いで、第2のリアルタイム等温増幅アッセイを、試験試料の第2のアリコートに対して実施して、参照核酸に関する第2の閾値までの時間値を得る。第1のアリコート及び第2のアリコートは、実質的に同量の試験試料を含む。次いで、第1の閾値までの時間は、標的核酸の標準曲線を使用して、標的核酸の開始コピー数に変換され得る。同様に、第2の閾値までの時間は、参照核酸の標準曲線を使用して、参照核酸の開始コピー数に変換され得る。次いで、標的核酸の開始コピー数を参照核酸の開始コピー数に対して正規化し、相対量の値を得る。
【0076】
標的核酸及び参照核酸の増幅効率は、既知の値とほぼ同じである場合、相対存在量は、標準曲線を使用せずに、閾値までの時間から直接得られ得る。
【0077】
V.バイオマーカースコアの計算
死亡率リスク、例えば、30日死亡率リスクを決定するために、モデル(例えば、最大のAUCを提供するハイパーパラメータ構成を備えたモデル)を対象からのバイオマーカー発現データに適用して、死亡の可能性を示すスコア、例えば、30日時点又は別の時点での死亡率、ICU入院リスクなどのスコア、例えば、「リスクスコア」、「バイオマーカースコア」、「死亡率スコア」、「30日死亡率スコア」、又は「HostDx(商標)ウイルス重症度スコア」を決定する。このスコアを使用して、例えば、対象をいくつかのビン、例えば、死亡率リスクが「低」、「中間」又は「不確定」、及び「高」の3つのビンのいずれかに分類することができる(例えば、図4を参照)。特定の実施形態では、このモデルは、ロジスティック回帰及び選択されたバイオマーカー遺伝子、例えば、TGFBI、DEFA4、LY86、BATF及びHK3、又はTGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1を使用して、スコアを計算する。前記モデルを使用して決定された30日死亡率は、本明細書の他の場所でより詳細に説明されているように、対象の最適な治療を決定するために使用される。
【0078】
例えば、ハウスキーピング遺伝子などの対照遺伝子と比較して、遺伝子レベルの合計、積、又は商を、それらの絶対レベル又はそれらの相対レベルに関して取得すること、又はそれらの値を、少なくとも測定された遺伝子レベル、例えば、2、3、4、5、6、7、8、9、10、若しくはそれ以上のバイオマーカー遺伝子の測定レベルを解釈可能なスコアに組み込む線形若しくは非線形アルゴリズムに入力することによって、リスク又はバイオマーカースコアを計算できる。特定の実施形態において、前記スコアは、5つのバイオマーカーのパネルについて得られた発現データに基づいて計算される。特定の実施形態において、前記スコアは、6つのバイオマーカーのパネルについて得られた発現データに基づいて計算される。
【0079】
半定量的方法では、閾値又はカットオフ値が適切に決定され、場合により所定の値である。特定の実施形態では、閾値は固定されているという意味では、例えば、以前のアッセイの経験及び/又は所与の転帰(単数又は複数)を有する対象の集団、例えば、30日生存又は非生存の転帰を有する50、100、150、200、250、300、350、400、450、500、又はそれ以上の人数の被験者の集団に基づいて事前に決定されている。あるいは、所定の値は、特定の値がアッセイ間で変化する場合でも、又はアッセイの実行ごとに決定され得る場合でも、閾値に到達する方法が事前に決定又は固定されていることを示してもよい。
【0080】
本明細書に記載の統計分析について、例えば、スコアの計算又は患者の特定の死亡率リスクの確率若しくは尤度の計算に含まれるバイオマーカーの選択のために、並びに特定のリスク若しくはバイオマーカースコアを考慮して行われる診断又は治療評価のために、各個人が患っている1又は複数の状態に関する臨床データなど、他の関連情報も考慮され得る。これには、年齢、人種、性別などの人口統計情報、状態の存在、非存在、程度、段階、重症度、又は進行に関する情報、SOFA、qSOFA、又はAPACHEなどの臨床リスクスコア、表現型特性の詳細、遺伝的な又は遺伝的に調節された情報、アミノ酸又はヌクレオチド関連のゲノミクス情報などの表現型情報、イメージング、生化学的、及び血液学的アッセイを含むその他の試験の結果、その他の生理学的スコアなどが含まれ得る。
【0081】
上記のように、個々のバイオマーカー遺伝子の存在量の値は、数式又は機械学習又は他のアルゴリズムを使用して組み合わせることができ、対象の30日死亡率リスクを予測できる死亡率スコアなどの単一の診断スコアを生成できる。これらの実施形態では、生成されたスコアは、任意の個々の遺伝子レベル単独よりも高い予測力を有する(例えば、30日での生存又は非生存の識別のためのより大きな受信者動作特性曲線下面積を有する)。
【0082】
いくつかの実施形態では、複数のバイオマーカーを単一の診断スコアに統合するためのアルゴリズムのタイプには、幾何平均の差、算術平均の差、和の差、単純和などが含まれるが、これらに限定されない。いくつかの実施形態では、診断スコアは、複数のバイオマーカーの相対的存在量の値に基づいて、回帰モデル、ツリー・ベースの機械学習モデル、サポートベクターマシン(SVM)モデル、人工ニューラルネットワーク(ANN)モデルなどの機械学習モデルを用いて推定されてもよい。
【0083】
バイオマーカーデータは、30日以内の対象の死亡率リスクを評価するために、テスト発現プロファイルと参照発現プロファイルとの間で観察されたバイオマーカーレベルの差異の統計的有意性を決定するために、様々な方法によって分析することもできる。特定の実施形態では、患者データは、1又は複数の方法で分析され、多変量線形判別分析(LDA)、受信者動作特性(ROC)解析、主成分分析(PCA)、アンサンブルデータマイニング法、マイクロアレイ有意性分析(SAM)、細胞特異的マイクロアレイ有意性分析(csSAM)、密度正規化イベントのスパニングツリー進行分析(SPADE)、及び多次元タンパク質同定技術(MUDPIT)による分析が挙げられるが、これらに限定されない。(例えば、その全体が参照により本明細書に援用される、Hilbe(2009)Logistic Regression Models,Chapman & Hall/CRC Press;McLachlan(2004)Discriminant Analysis and Statistical Pattern Recognition.Wiley Interscience、Zweig et al.(1993)Clin.Chem.39:561-577;Pepe(2003)The statistical evaluation of medical tests for classification and prediction,New York,N.Y.:Oxford、Sing et al.(2005)Bioinformatics 21:3940-3941、Tusher et al.(2001)Proc.Natl.Acad.Sci.U.S.A.98:5116-5121、Oza(2006)Ensemble data mining,NASA Ames Research Center,Moffett Field,Calif.,USA、English et al.(2009)J.Biomed.Inform.42(2):287-295、Zhang(2007)Bioinformatics 8:230、Shen-Orr et al.(2010)Journal of Immunology 184:144-130、Qiu et al.(2011)Nat.Biotechnol.29(10):886-891、Ru et al.(2006)J.Chromatogr.A.1111(2):166-174,Jolliffe Principal Component Analysis(Springer Series in Statistics,2.sup.nd edition,Springer,NY,2002)、及びKoren et al.(2004)IEEE Trans Vis Comput Graph 10:459-470を参照。)
【0084】
30日死亡率又は可能性を決定するために、全てのバイオマーカーが特定の対象の対照レベルに比べて上昇又は低下している必要はない。例えば、特定のバイオマーカーレベルの場合、異なる確率カテゴリーに分類される個人間に重複がある可能性がある。しかしながら、アッセイに含まれる全てのバイオマーカー遺伝子の合計レベルがスコアを生じさせるものであり、スコアが閾値、例えば、ウイルス感染症及び生存者転帰を有する少なくとも50、100、150、200、250、300、350、400、500、又はそれ以上の患者由来の閾値及び/又はウイルス感染症及び非生存者転帰を有する10、20、30、40、50、100、150、200、250、300、350、400、500、又はそれ以上の対照者の閾値を超えた場合、それにより対象の30日死亡率リスクに関する決定が可能になる。例えば、30日での死亡率リスクが低いと判断する場合には、閾値は、ウイルス感染症及び30日生存転帰を有する少なくとも100人の個人並びにウイルス感染症及び非生存転帰を有する100人の患者の集団全体での閾値となり得、30日で生存している対象の少なくとも90%が閾値を超えている。任意のアッセイでは、複数の閾値が存在する場合があり、例えば、死亡率リスクが高いことを示す一方向のしきい値と、死亡率リスクが低いことを示す他方向の閾値であることを理解されたい。
【0085】
本明細書で使用される場合、所与の転帰に関する「確率(可能性)」及び「リスク」という用語は、所与の数学的モデルに基づいて、特定のスコアを有する対象が実際にその状態(例えば、30日非生存)を有するという条件付き確率を指す。例えば、確率又はリスクの増加は、相対的又は絶対的なものであり得、質的又は量的に表すことができる。例えば、リスクの増加は、以前の集団研究に基づいて、単に対象のスコアを決定し、対象を「リスクの増加」カテゴリーに分類することで表現できる。あるいは、試験対象の増加したリスクの数値表現は、バイオマーカー又はリスクスコアの分析に基づいて決定することができる。
【0086】
いくつかの実施形態では、尤度は、バイオマーカー又は死亡率スコアのレベルを、1又は複数の事前に選択されたレベル又は閾値レベルと比較することによって評価される。30日死亡率のリスク、又は入院期間、ICUケアの必要性、人工呼吸器の必要性、再入院率などのケアの1又は複数の側面のリスクを予測する許容可能な能力を提供する閾値を選択できる。説明に役立つ例では、受信者動作特性(ROC)曲線は、第1の集団が第1の状態(例えば、30日での非生存)を有し、第2の集団が、第2の状態(例えば、30日での非生存)を有する、2つの集団におけるバイオマーカー又はリスクスコアの値をプロットすることによって計算される。
【0087】
任意の特定のバイオマーカーについて、疾患を有する対象と有さない対象とにおけるバイオマーカーレベルの分布は重複する可能性が高く、バイオマーカー又はリスクスコアにも一部の重複が存在し得る。このような条件下では、試験で第1の状態と第2の状態とを100%の精度で完全に区別することはできず、オーバーラップ領域は、試験で第1の状態と第2の状態とを区別できない場所を示している。閾値が選択され、その値を超えると(又は指定された状態若しくは予後によってバイオマーカー若しくはリスクスコアがどのように変化するかに応じて、その値を下回ると)、試験では「陽性」と見なされ、それを下回ると試験では「陰性」と見なされる。ROC曲線下面積(AUC)はC統計量を提供する。これは、認識された測定値が状態の正確な同定を可能にする確率の尺度である(例えば、Hanley et al.,Radiology 143:29-36(1982)を参照)。
【0088】
いくつかの実施形態では、陽性尤度比、陰性尤度比、オッズ比、及び/又はAUC若しくは受信者動作特性(ROC)値は、死亡率リスクを予測する方法の能力の尺度として使用される。本明細書で使用する場合、「尤度比」という用語は、所与の試験結果が目的の状態又は転帰を有する対象で観察される確率を、目的の状態又は転帰を有さない患者で同じ結果が観察される確率で割ったものである。したがって、陽性尤度比は、特定の状態又は転帰を有する対象で観察される陽性結果の確率を、特定の状態又は転帰を有さない対象で陽性結果が得られる確率で割ったものである。陰性尤度比は、特定の状態又は転帰を有さない対象の陰性結果の確率を、特定の状態又は転帰を有する対象の陰性結果の確率で割ったものである。
【0089】
「オッズ比」という用語は、本明細書で使用される場合、1つの群(例えば、30日生存者群)で発生するイベントのオッズと、別の群(例えば、30日非生存者群)で発生するイベントのオッズとの比率、又はその比率のデータに基づく推定値を指す。「曲線下面積」又は「AUC」という用語は、受信者動作特性(ROC)曲線の曲線下面積を指し、どちらも当技術分野で周知である。AUC測定値は、完全な決定閾値範囲全体における分類子の精度を評価するのに有用である。AUCが大きい分類子は、2つ以上の目的の群間で未知のものを正しく分類する(例えば、30日での死亡率リスクが低い、中間、又は高い)能力が高くなる。ROC曲線は、2つの集団(例えば、生存者又は非生存者)を区別する又は見分ける際に、特定の特徴(例えば、本明細書に記載のバイオマーカー発現レベル又はバイオマーカースコアのいずれか、及び/又は追加の生物医学情報の任意の項目)のパフォーマンスをプロットするのに有用である。典型的には、集団全体(例えば、症例及び対照)の特徴データは、単一の特徴の値に基づいて昇順に並べ替えられる。次いで、その特徴の各値について、データの真陽性率と偽陽性率とが計算される。感度は、その特徴の値を超える症例の数をカウントし、症例の総数で割ることによって決定される。特異度は、その特徴の値を下回る対照の数をカウントし、対照の総数で割ることによって決定される。
【0090】
これは、対照と比較して症例で特徴が上昇するシナリオを指すが、対照と比較して症例で特徴が低いシナリオにも適用される(このようなシナリオでは、その特徴の値を下回る試料がカウントされることになる)。ROC曲線は、単一の特徴に対しても他の単一の出力に対しても生成され得る。例えば、2つ以上の特徴の組み合わせを数学的に組み合わせて(例えば、加算、減算、乗算など)、単一の値を生成し、この単一の値をROC曲線にプロットできる。さらに、組み合わせが単一の出力値を導出する複数の特徴の任意の組み合わせを、ROC曲線にプロットできる。これらの特徴の組み合わせは、試験を構成し得る。ROC曲線は、試験の1-異度に対する試験の感度のプロットであり、感度は従来縦軸に表示され、1-異度は従来横軸に表示される。したがって、「AUCのROC値」は、分類子がランダムに選択された正のインスタンスを、ランダムに選択された負のインスタンスよりも高くランク付けする確率に等しくなる。
【0091】
いくつかの実施形態では、少なくとも2個(例えば、2個、3個、4個、5個、6個、7個、8個、9個、10個、又はそれ以上)のバイオマーカー遺伝子を選択して、第1の状態又は転帰を有する対象と、第2の状態又は転帰を有する対象とを、少なくとも約70%、75%、80%、85%、90%、95%の精度で、又は少なくとも約0.70、0.75、0.80、0.85、0.90、0.95のC統計量で見分ける。
【0092】
陽性尤度比の場合、1の値は、「状態」群及び「対照」群の両方の対象で陽性結果が出る可能性が等しいことを示し(例えば、30日での非生存者及び生存者)、1より大きい値は、前記状態群(例えば、非生存者)で陽性結果が得られる可能性がより高いことを示し、1より小さい値は、前記対照群(例えば、生存者)で陽性結果が得られる可能性がより高いことを示す。この文脈において、「状態」は、1つの特性を有する群(例えば、30日での非生存)、「対照」は、同じ特性を欠く群(例えば、30日での生存)を指すことを意味する。陰性尤度比の場合、1の値は、「状態」群及び「対照」群の両方の対象で陰性結果が出る可能性が等しいことを示し、1より大きい値は、前記状態群で陰性結果が得られる可能性がより高いことを示し、1より小さい値は、前記対照群で陰性結果が得られる可能性がより高いことを示す。
【0093】
特定の実施形態では、バイオマーカー又はリスクスコアは、ウイルス感染症及び30生存転帰を有する対象又はウイルス感染症及び30日非生存転帰を有する対象におけるバイオマーカーの測定レベルに基づいて計算され、30日死亡率又はICUケアの必要性について、高リスクビンに対応する尤度比は、1.5、2、2.5、3、3.5、4、又はそれ以上となるか、低リスクビンに対応する尤度比は、0.15、0.10、0.05、又はそれ以下となる。
【0094】
オッズ比の場合、1の値は、「状態」群及び「対照」群の両方の対象で陽性結果が出る可能性が等しいことを示し、1より大きい値は、前記状態群で陽性結果が得られる可能性がより高いことを示し、1より小さい値は、前記対照群で陽性結果が得られる可能性がより高いことを示す。AUCのROC値の場合、これはROC曲線の数値積分によって計算される。この値の範囲は、0.5~1.0である。0.5の値は、分類子(例えば、バイオマーカーレベル)が、症例及び対照(例えば、非生存者及び生存者)を区別できないことを示すが、1.0は完全な診断精度を示す。特定の実施形態では、バイオマーカー遺伝子レベル及び/又はバイオマーカースコアは、少なくとも約1.5以上若しくは約0.67以下、少なくとも約2以上若しくは約0.5以下、少なくとも約5以上若しくは約0.2以下、少なくとも約10以上若しくは約0.1以下、又は少なくとも約20以上若しくは約0.05以下の陽性尤度比又は陰性尤度比を示すように選択される。
【0095】
特定の実施形態では、バイオマーカー遺伝子レベル及び/又はバイオマーカースコアは、少なくとも約2以上若しくは約0.5以下、少なくとも約3以上若しくは約0.33以下、少なくとも約4以上若しくは約0.25以下、少なくとも約5以上若しくは約0.2以下、又は少なくとも約10以上若しくは約0.1以下のオッズ比を示すように選択される。特定の実施形態では、バイオマーカー遺伝子レベル及び/又はバイオマーカースコアは、0.5より大きい、好ましくは少なくとも0.6、より好ましくは0.7、さらにより好ましくは少なくとも0.8、さらにより好ましくは少なくとも0.9、最も好ましくは少なくとも0.95のAUCのROC値を示すように選択される。
【0096】
場合によっては、いわゆる「三分位値」、「四分位値」、又は「五分位値」分析で複数の閾値を決定できる。これらの方法では、「罹患」群及び「対照」群(又は「高リスク」及び「低リスク」)群は、まとめて単一の集団と見なされ、3、4、又は5(又はそれ以上)の個体数が等しい「ビン」に分割される。これらの「ビン」の2つの間の境界は、「閾値」と見なすことができる。リスク(例えば、特定の診断又は予後)は、被験者がどの「ビン」に分類されるかに基づいて割り当てることができる。特定の実施形態では、被験者は、本発明の方法を使用して得られたリスクスコアに基づいて、30日死亡率のリスク又はICUケアを必要とするリスクを参照して、3つのビン、すなわち「低」、「中間」、又は「高」のうちの1つに割り当てられる。例えば、対象は、30日での推定死亡確率に従って、低尤度(ビン1)、中間尤度(ビン2)、及び高尤度(ビン3)の3つのビンに分類できる。これらのビンは、例えば、尤度比がビン1で<0.15、ビン2で0.15~5、ビン3で>5となるように定義される。
【0097】
「尤度を評価する(こと)」及び「尤度を決定する(こと)」という語句は、本明細書で使用される場合、当業者が患者における状態(例えば、30日での生存又は非生存)の存在又は非存在を予測できる方法を指す。当業者は、この語句がその範囲内に、患者に状態が存在するか非存在である確率の増加を含むことを理解するであろう。すなわち、状態が対象において存在するか非存在である可能性が高いということである。例えば、特定の状態にあると識別された個人が実際にその状態にある確率は、「陽性適中率(陽性予測値)」又は「PPV」として表すことができる。陽性適中率は、真陽性の数を真陽性及び偽陽性の合計で割った値として計算できる。PPVは、本明細書に記載の予測方法の特性、並びに分析された集団における状態の有病率によって決定される。統計的アルゴリズムは、状態の有病率を有する母集団における陽性適中率が70%~99%の範囲内にあり、例えば少なくとも70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%であり得るように選択することができる。
【0098】
他の例では、特定の状態又は転帰を有さないと識別された個人が実際にはその状態を有さない確率は、「陰性適中率(陰性予測値)」又は「NPV」として表すことができる。陰性適中率は、真陰性の数を真陰性及び偽陰性の合計で割った値として計算できる。陰性適中率は、診断若しくは予後の方法、システム、又はコードの特性、並びに分析対象集団における疾患の有病率によって決定される。統計的方法及びモデルは、状態の有病率を有する母集団における陰性適中率が約70%~約99%の範囲内にあり、例えば少なくとも約70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%であり得るように選択することができる。
【0099】
いくつかの実施形態では、対象は、特定の状態又は転帰を有するか有さない有意確率を有すると判断される。「有意確率」とは、対象が、特定の状態又は転帰を有するか有さない妥当な確率(0.6、0.7、0.8、0.9、又はそれ以上)を有することを意味する。
【0100】
いくつかの実施形態では、バイオマーカースコアは、SOFA、qSOFA、又はAPACHEなどの1又は複数の臨床リスクスコアと組み合わされる。例えば、数式を使用して、(i)個々の遺伝子発現値又は遺伝子発現値を使用する分類子からの出力のいずれかを、(ii)臨床リスクスコアと組み合わせて、(iii)臨床医にとって有用な新しいスコアを生成する。
【0101】
VI.治療の決定
本明細書に記載の方法を使用して、30日死亡率又はICUケアの必要性の相対リスクに従って、ウイルス感染症を有する対象を分類することができる。特定の実施形態では、対象は、高リスク、低リスク、又は中間リスクを有するものとして分類される。高リスクの30日死亡率における対象は、直ちに集中治療を受ける必要がある。例えば、本明細書に記載の方法により、高リスクの30日死亡率を有すると特定された患者は、治療のために直ちにICUに送られ得るが、低リスクの30日死亡率を有すると特定された患者は、救急治療室環境から退院としてもよく、例えば、自己隔離及びさらなるモニタリングのために退院したり、通常の病棟で治療したりすることができる。患者及び臨床医の双方が、死亡率リスクのより良い推定から利益を得ることができる。これにより、患者の優先傾向及び救命措置に関する選択についてタイムリーな議論が可能になる。患者のより良い分子表現型解析は、1)薬物及び介入のための患者選択、及び2)対象死亡率の観察対期待比の評価の両方において、臨床試験の改善も可能にする。3つのリスククラス(「低」、「中間」又は「不確定」、及び「高」)の要約、並びに各クラスの例示的な治療又はトリアージの決定を図4に示す。本明細書で使用される場合、「緊急医療」は、ウイルス感染症の何らかの側面又は症状を緩和、排除、進行を遅らせる、又は何らかの方法で改善するために、救急治療室又は緊急医療における対象の治療に関して実施される任意の行動を含み、治療剤の投与、臓器支持療法の実施、及びICUへの入院が挙げられるが、これらに限定されない。
【0102】
高リスクの30日以内の死亡率を有すると特定された患者のICU治療には、身体機能の継続的なモニタリングと、正常な身体機能を回復するための生命維持装置及び/又は投薬の提供が含まれる場合がある。ICU治療は、例えば、呼吸を補助する人工呼吸器、身体機能をモニタリングするための機器(例えば、心拍数と脈拍数、肺への気流、血圧及び血流、中心静脈圧、血液中の酸素量、並びに体温)、ペースメーカー、除細動器、透析機器、静脈ライン、栄養チューブ、吸引ポンプ、ドレーン、及び/又はカテーテルを使用すること、及び/又は生命を脅かす状態(例えば、敗血症、重度の外傷、又は火傷)を治療するための様々な薬剤の投与を含み得る。ICU治療は、疼痛を軽減するための1又は複数の鎮痛薬、及び/又は睡眠を誘発するか不安を軽減するための鎮静薬、及び/又は医学的に昏睡を誘発するためのバルビツール酸塩(例えば、ペントバルビタール又はチオペンタール)の投与をさらに含み得る。
【0103】
特定の実施形態では、ウイルス感染症と診断された重症患者に、広域スペクトル抗ウイルス剤などの抗ウイルス剤、抗ウイルスワクチン、ノイラミニダーゼ阻害剤(例えば、ザナミビル(Zanamivir)(Relenza(商標)(リレンザ))及びオセルタミビル(Oseltamivir)(Tamiflu(登録商標)(タミフル)))、ヌクレオシド類似体(例えば、アシクロビル(Acyclovir)、ジドブジン(Zidovudine)(AZT)、及びラミブジン(Lamivudine))、アンチセンス抗ウイルス剤(例えば、ホスホロチオエートアンチセンス抗ウイルス剤(例えば、サイトメガロウイルス網膜炎に対するホミビルセン(Fomivirsen))、モルホリノアンチセンス抗ウイルス剤)、ウイルスアンコーティングの阻害剤(例えば、インフルエンザに対するアマンタジン(Amantadine)及び、リマンタジン(Rimantadine)、ライノウイルスに対するプレコナリル(Pleconaril))、ウイルス侵入の阻害剤(例えば、HIVに対するフゼオン(Fuzeon))、ウイルス集合阻害剤(例えば、リファンピシン)、又は免疫系を刺激する抗ウイルス剤(例えば、インターフェロン類)の治療有効量をさらに投与する。抗ウイルス剤の例としては、アバカビル(Abacavir)、アシクロビル(Aciclovir)、アシクロビル(Acyclovir)、アデホビル(Adefovir)、アマンタジン(Amantadine)、アンプレナビル(Amprenavir)、アンプリジェン(Ampligen)、アルビドール(Arbidol)、アタザナビル(Atazanavir)、アトリプラ(Atripla)(固定用量薬)、バラビル(Balavir)、シドフォビル(Cidofovir)、コンビビル(Combivir)(固定用量薬)、ドルテグラビル(Dolutegravir)、ダルナビル(Darunavir)、デラビルジン(Delavirdine)、ジダノシン(Didanosine)、ドコサノール(Docosanol)、エドクスジン(Edoxudine)、エファビレンツ(Efavirenz)、エムトリシタビン(Emtricitabine)、エンフビルチド(Enfuvirtide)、エンテカビル(Entecavir)、エコリエベル(Ecoliever)、ファムシクロビル(Famciclovir)、固定用量薬の組み合わせ(抗レトロウイルス薬)、ホミビルセン(Fomivirsen)、ホスアンプレナビル(Fosamprenavir)、ホスカルネット(Foscarnet)、ホスホネット(Fosfonet)、融合阻害剤、ガンシクロビル(Ganciclovir)、イバシタビン(Ibacitabine)、イムノビル(Imunovir)、イドクスウリジン(Idoxuridine)、イミキモド(Imiquimod)、インジナビル(Indinavir)、イノシン(Inosine)、インテグラーゼ阻害剤、インターフェロンIII型、インターフェロンII型、インターフェロンI型、インターフェロン、ラミブジン(Lamivudine)、ロピナビル(Lopinavir)、ロビリド(Loviride)、マラビロク(Maraviroc)、モロキシジン(Moroxydine)、メチサゾン(Methisazone)、ネルフィナビル(Nelfinavir)、ネビラピン(Nevirapine)、ネクサビル(Nexavir)、ニタゾキサニド(Nitazoxanide)、ヌクレオシド類似体、ノビル(Novir)、オセルタミビル(Oseltamivir)(Tamiflu(登録商標)(タミフル))、ペグインターフェロンα-2a、ペンシクロビル(Penciclovir)、ペラミビル(Peramivir)、プレコナリル(Pleconaril)、ポドフィロトキシン(Podophyllotoxin)、プロテアーゼ阻害剤、ラルテグラビル(Raltegravir)、逆転写酵素阻害剤、リバビリン(Ribavirin)、リマンタジン(Rimantadine)、リトナビル(Ritonavir)、ピラミジン(Pyramidine)、サキナビル(Saquinavir)、ソホスブビル(Sofosbuvir)、スタブジン(Stavudine)、相乗的増強剤(synergistic enhancer)(抗レトロウイルス薬)、テラプレビル(Telaprevir)、テノホビル(Tenofovir)、テノホビルジソプロキシル(Tenofovir disoproxil)、チプラナビル(Tipranavir)、トリフルリジン(Trifluridine)、トリジビル(Trizivir)、トロマンタジン(Tromantadine)、ツルバダ(Truvada)、バラシクロビル(Valaciclovir)(Valtrex(バルトレックス))、バルガンシクロビル(Valganciclovir)、ビクリビロク(Vicriviroc)、ビダラビン(Vidarabine)、ビラミジン(Viramidine)、ザルシタビン(Zalcitabine)、ザナミビル(Zanamivir)(Relenza(商標)(リレンザ))、及びジドブジン(Zidovudine)が挙げられる。投与され得る他の薬剤には、クロロキン、ヒドロキシクロロキン、サリルマブ(Sarilumab)、レムデシビル(Remdesivir)、アジスロマイシン(Azithromycin)、及びスタチンが挙げられる。
【0104】
いくつかの実施形態では、ウイルス感染症と診断された重症患者に、アバタセプト(Abatacept)、アベチムス(Abetimus)、アブリルマブ(Abrilumab)、アダリムマブ(Adalimumab)、アフェリモマブ(Afelimomab)、アフリベルセプト(Aflibercept)、アレファセプト(Alefacept)、アナキンラ(Anakinra)、アンデカリキシマブ(Andecaliximab)、アニフロルマブ(Anifrolumab)、アンルキンズマブ(Anrukinzumab)、抗リンパ球グロブリン、抗胸腺細胞グロブリン、葉酸拮抗薬、アポリズマブ(Apolizumab)、アプレミラスト(Apremilast)、アセリズマブ(Aselizumab)、アテゾリズマブ(Atezolizumab)、アトロリムマブ(Atorolimumab)、アベルマブ(Avelumab)、アザチオプリン(Azathioprine)、バシリキシマブ(Basiliximab)、ベラタセプト(Belatacept)、ベリムマブ(Belimumab)、ベンラリズマブ(Benralizumab)、ベルティリムマブ(Bertilimumab)、ベシレソマブ(Besilesomab)、ブレセルマブ(Bleselumab)、ブリシビモド(Blisibimod)、ブラジクマブ(Brazikumab)、ブリアキヌマブ(Briakinumab)、ブロダルマブ(Brodalumab)、カナキヌマブ(Canakinumab)、カルルマブ(Carlumab)、セデリズマブ(Cedelizumab)、セルトリズマブペゴル(Certolizumab pegol)、クロロキン、クラザキズマブ(Clazakizumab)、クレノリキシマブ(Clenoliximab)、コルチコステロイド、シクロスポリン(Cyclosporine)、ダクリズマブ(Daclizumab)、デュピルマブ(Dupilumab)、デュルバルマブ(Durvalumab)、エクリズマブ(Eculizumab)、エファリズマブ(Efalizumab)、エルデルマブ(Eldelumab)、エルシリモマブ(Elsilimomab)、エマパルマブ(Emapalumab)、エノキズマブ(Enokizumab)、エプラツズマブ(Epratuzumab)、エルリズマブ(Erlizumab)、エタネルセプト(Etanercept)、エトロリズマブ(Etrolizumab)、エベロリムス(Everolimus)、ファノレソマブ(Fanolesomab)、ファラリモマブ(Faralimomab)、フェザキヌマブ(Fezakinumab)、フレチクマブ(Fletikumab)、フォントリズマブ(Fontolizumab)、フレソリムマブ(Fresolimumab)、ガリキシマブ(Galiximab)、ガビリモマブ(Gavilimomab)、ゲボキズマブ(Gevokizumab)、ギルべツマブ(Gilvetmab)、ゴリムマブ(Golimumab)、ゴミリキシマブ(Gomiliximab)、グセルクマブ(Guselkumab)、グスペリムス(Gusperimus)、ヒドロキシクロロキン、イバリズマブ(Ibalizumab)、免疫グロブリンE、イネビリズマブ(Inebilizumab)、インフリキシマブ(Infliximab)、イノリモマブ(Inolimomab)、インテグリン(Integrin)、インターフェロン(Interferon)、イピリムマブ(Ipilimumab)、イトリズマブ(Itolizumab)、イキセキズマブ(Ixekizumab)、ケリキシマブ(Keliximab)、ラムパリズマブ(Lampalizumab)、ラナデルマブ(Lanadelumab)、レブリキズマブ(Lebrikizumab)、レフルノミド(Leflunomide)、レマルソマブ(Lemalesomab)、レナリドミド(Lenalidomide)、レンジルマブ(Lenzilumab)、ラルデリムマブ(Lerdelimumab)、レトリズマブ(Letolizumab)、リゲリズマブ(Ligelizumab)、リリルマブ(Lirilumab)、ルリズマブペゴル(Lulizumab pegol)、ルミリキシマブ(Lumiliximab)、マスリモマブ(Maslimomab)、マブリリムマブ(Mavrilimumab)、メポリズマブ(Mepolizumab)、メテリムマブ(Metelimumab)、メトトレキサート(Methotrexate)、ミノサイクリン(Minocycline)、モガムリズマブ(Mogamulizumab)、モロリムマブ(Morolimumab)、ムロモナブ-CD3(Muromonab-CD3)、ミコフェノール酸、ナミルマブ(Namilumab)、ナタリズマブ(Natalizumab)、ネレリモマブ(Nerelimomab)、ニボルマブ(Nivolumab)、オビヌツズマブ(Obinutuzumab)、オクレリズマブ(Ocrelizumab)、オヅリモマブ(Odulimomab)、オレクルマブ(Oleclumab)、オロキズマブ(Olokizumab)、オマリズマブ(Omalizumab)、オテリキシズマブ(Otelixizumab)、オキセルマブ(Oxelumab)、オゾラリズマブ(Ozoralizumab)、パムレブルマブ(Pamrevlumab)、パスコリズマブ(Pascolizumab)、パテクリズマブ(Pateclizumab)、PDE4阻害剤、ペグスネルセプト(Pegsunercept)、ペムブロリズマブ(Pembrolizumab)、ペラキズマブ(Perakizumab)、ペキセリズマブ(Pexelizumab)、ピジリズマブ(Pidilizumab)、ピメクロリムス(Pimecrolimus)、プラクルマブ(Placulumab)、プロザリズマブ(Plozalizumab)、ポマリドミド(Pomalidomide)、プリリキシマブ(Priliximab)、プリン合成阻害剤、ピリミジン合成阻害剤、キリズマブ(Quilizumab)、レスリズマブ(Reslizumab)、リダホロリムス(Ridaforolimus)、リロナセプト(Rilonacept)、リツキシマブ(Rituximab)、ロンタリズマブ(Rontalizumab)、ロベリズマブ(Rovelizumab)、ルプリズマブ(Ruplizumab)、サマリズマブ(Samalizumab)、サリルマブ(Sarilumab)、セクキヌマブ(Secukinumab)、シファリムマブ(Sifalimumab)、シプリズマブ(Siplizumab)、シロリムス(Sirolimus)、シルクマブ(Sirukumab)、スレソマブ(Sulesomab)、スルファサラジン(Sulfasalazine)、タバルマブ(Tabalumab)、タクロリムス(Tacrolimus)、タリズマブ(Talizumab)、テリモマブアリトックス(Telimomab aritox)、テムシロリムス(Temsirolimus)、テネリキシマブ(Teneliximab)、テプリズマブ(Teplizumab)、テリフルノミド(Teriflunomide)、テゼペルマブ(Tezepelumab)、チルドラキズマブ(Tildrakizumab)、トシリズマブ(Tocilizumab)、トファシチニブ(Tofacitinib)、トラリズマブ(Toralizumab)、トラロキヌマブ(Tralokinumab)、トレガリズマブ(Tregalizumab)、トレメリムマブ(Tremelimumab)、ウロクプルマブ(Ulocuplumab)、ウミロリムス(Umirolimus)、ウレルマブ(Urelumab)、ウステキヌマブ(Ustekinumab)、バパリキシマブ(Vapaliximab)、バルリルマブ(Varlilumab)、バテリズマブ(Vatelizumab)、ベドリズマブ(Vedolizumab)、ベパリモマブ(Vepalimomab)、ビシリズマブ(Visilizumab)、ボバリリズマブ(Vobarilizumab)、ザノリムマブ(Zanolimumab)、ゾリモマブアリトックス(Zolimomab aritox)、ゾタロリムス(Zotarolimus)などの自然免疫又は適応免疫モジュレーター又はrh-インターフェロン-ガンマなどの組換えヒトサイトカインの治療有効量をさらに投与する。
【0105】
いくつかの実施形態では、ウイルス感染症と診断された重症患者に、PD1、PDL1、CTLA4、TIM-3、BTLA、TREM-1、LAG3、VISTA,又はCD1、CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3、CD3d、CD3e、CD3g、CD4、CD5、CD6、CD7、CD8、CD8a、CD8b、CD9、CD10、CD11a、CD11b、CD11c、CD11d、CD13、CD14、CD15、CD16、CD16a、CD16b、CD17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32A、CD32B、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD45、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CD60a、CD60b、CD60c、CD61、CD62E、CD62L、CD62P、CD63、CD64a、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CD75、CD75s、CD77、CD79A、CD79B、CD80、CD81、CD82、CD83、CD84、CD85A、CD85B、CD85C、CD85D、CD85F、CD85G、CD85H、CD85I、CD85J、CD85K、CD85M、CD86、CD87、CD88、CD89、CD90、CD91、CD92、CD93、CD94、CD95、CD96、CD97、CD98、CD99、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107、CD107a、CD107b、CD108、CD109、CD110、CD111、CD112、CD113、CD114、CD115、CD116、CD117、CD118、CD119、CD120、CD120a、CD120b、CD121a、CD121b、CD122、CD123、CD124、CD125、CD126、CD127、CD129、CD130、CD131、CD132、CD133、CD134、CD135、CD136、CD137、CD138、CD139、CD140A、CD140B、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CD150、CD151、CD152、CD153、CD154、CD155、CD156、CD156a、CD156b、CD156c、CD157、CD158、CD158A、CD158B1、CD158B2、CD158C、CD158D、CD158E1、CD158E2、CD158F1、CD158F2、CD158G、CD158H、CD158I、CD158J、CD158K、CD159a、CD159c、CD160、CD161、CD162、CD163、CD164、CD165、CD166、CD167a、CD167b、CD168、CD169、CD170、CD171、CD172a、CD172b、CD172g、CD173、CD174、CD175、CD175s、CD176、CD177、CD178、CD179a、CD179b、CD180、CD181、CD182、CD183、CD184、CD185、CD186、CD187、CD188、CD189、CD190、CD191、CD192、CD193、CD194、CD195、CD196、CD197、CDw198、CDw199、CD200、CD201、CD202b、CD203c、CD204、CD205、CD206、CD207、CD208、CD209、CD210、CDw210a、CDw210b、CD211、CD212、CD213a1、CD213a2、CD214、CD215、CD216、CD217、CD218a、CD218b、CD219、CD220、CD221、CD222、CD223、CD224、CD225、CD226、CD227、CD228、CD229、CD230、CD231、CD232、CD233、CD234、CD235a、CD235b、CD236、CD237、CD238、CD239、CD240CE、CD240D、CD241、CD242、CD243、CD244、CD245、CD246、CD247、CD248、CD249、CD250、CD251、CD252、CD253、CD254、CD255、CD256、CD257、CD258、CD259、CD260、CD261、CD262、CD263、CD264、CD265、CD266、CD267、CD268、CD269、CD270、CD271、CD272、CD273、CD274、CD275、CD276、CD277、CD278、CD279、CD280、CD281、CD282、CD283、CD284、CD285、CD286、CD287、CD288、CD289、CD290、CD291、CD292、CDw293、CD294、CD295、CD296、CD297、CD298、CD299、CD300A、CD300C、CD301、CD302、CD303、CD304、CD305、CD306、CD307、CD307a、CD307b、CD307c、CD307d、CD307e、CD308、CD309、CD310、CD311、CD312、CD313、CD314、CD315、CD316、CD317、CD318、CD319、CD320、CD321、CD322、CD323、CD324、CD325、CD326、CD327、CD328、CD329、CD330、CD331、CD332、CD333、CD334、CD335、CD336、CD337、CD338、CD339、CD340、CD344、CD349、CD351、CD352、CD353、CD354、CD355、CD357、CD358、CD360、CD361、CD362、CD363、CD364、CD365、CD366、CD367、CD368、CD369、CD370、若しくはCD371を含む分化のヒトクラスターのいずれかの遮断修飾剤又はシグナル伝達修飾剤の治療有効量をさらに投与する。
【0106】
いくつかの実施形態では、ウイルス感染症と診断された重症患者に、アルブミン、抗血友病グロブリン、AHF A、C1阻害剤、Ca++、CD63、クリスマス因子、AHF B、内皮細胞増殖因子、上皮増殖因子、第V因子、第XI因子、第XIII因子、フィブリン安定化因子、ラキ‐ローランド(Laki-Lorand)因子、フィブリナーゼ、フィブリノーゲン、フィブロネクチン、GMP33、ハーゲマン(Hageman)因子、高分子量キニノーゲン、IgA、IgG、IgM、インターロイキン-1B、マルチメリン、P-セレクチン、血漿トロンボプラスチン前駆物質、AHF C、プラスミノーゲン活性化因子阻害剤1、血小板因子、血小板由来増殖因子、プレカリクレイン、プロアクセルリン、プロコンバーチン、タンパク質C、タンパク質M、タンパク質S、プロトロンビン、スチュアート・プロワー(Stuart-Prower)因子、TF、トロンボプラスチン、トロンボスポンジン、組織因子経路阻害剤、トランスフォーミング増殖因子β、血管内皮増殖因子、ビトロネクチン、フォン・ヴィレブランド因子、α2-アンチプラスミン、2-マクログロブリン、β-トロンボグロブリン、又は凝固若しくは血小板活性化カスケードの他のメンバーを標的とするものなど、凝固カスケード又は血小板活性化を変更する1又は複数の薬剤の治療有効量をさらに投与する。
【0107】
VII.キット及びシステム
A.キット
一態様では、本明細書に記載のバイオマーカーを検出するために使用することができる、対象における死亡率の予後診断のためのキットが提供される。例えば、前記キットを使用して、本明細書に記載のバイオマーカーのうちの任意の1又は複数を検出することができ、これらは、ウイルス感染症を有する対象の30日生存者及び30日非生存者からの試料において差次的に発現される。前記キットは、バイオマーカーの検出のための1又は複数の薬剤、ウイルス感染症が疑われるヒト対象から分離された生体試料を保持するための容器、及び前記生体試料中の少なくとも1つのバイオマーカーの存在又は量を検出するために、前記生体試料又は前記生体試料の一部と前記薬剤を反応させるための印刷された説明書を含み得る。前記薬剤は別々の容器に包装されていてもよい。前記キットは、PCR、等温増幅、イムノアッセイ、NanoString、又はマイクロアレイ分析を実行するための1又は複数の対照の参照試料及び試薬、例えば、30日生存又は非生存の転帰を有する対象からの参照試料をさらに含み得る。前記キットはまた、本明細書の装置のいずれかを実行するための1又は複数のデバイス又は器具、例えば、96ウェルプレート、マイクロ流体カートリッジ、単一ウェルマルチプレックスアッセイなどを含んでいてもよい。
【0108】
特定の実施形態では、前記キットは、目的の少なくとも5個又は6個のバイオマーカーのレベルを測定するための薬剤を含む。例えば、前記キットは、TGFBIポリヌクレオチド、DEFA4ポリヌクレオチド、LY86ポリヌクレオチド、BATFポリヌクレオチド、及びHK3ポリヌクレオチドを含むパネルのバイオマーカーを検出するための薬剤、例えば、プライマー及び/又はプローブを含み得る。いくつかの実施形態では、前記パネルは、HLA-DPB1をさらに含む。いくつかの実施形態では、前記パネルは、表1又は表5に記載されているバイオマーカーのいずれか1又は複数を含む。いくつかの実施形態では、前記パネルは、表3又は表6に記載されているバイオマーカーの任意の1又は複数のペアを含む。
【0109】
特定の実施形態では、前記キットは、複数のバイオマーカーポリヌクレオチドの分析のためのマイクロアレイ又は他の固体支持体を含む。前記キットに含まれる例示的なマイクロアレイ又は他の支持体は、TGFBIポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、DEFA4ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、LY86ポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、BATFポリヌクレオチドにハイブリダイズするオリゴヌクレオチド、及びHK3ポリヌクレオチドにハイブリダイズするオリゴヌクレオチドを含む。いくつかの実施形態では、前記キットは、HLA-DPB1ポリヌクレオチドにハイブリダイズするオリゴヌクレオチドをさらに含む。いくつかの実施形態では、前記マイクロアレイ又は他の支持体は、表1及び表5に列挙されるバイオマーカー、又は表3及び表6に列挙されるバイオマーカー対を含む、本明細書に記載の方法を使用して検出されるバイオマーカーのそれぞれに対するオリゴヌクレオチドを含む。
【0110】
前記キットは、前記キットに含まれる組成物用の1又は複数の容器を含み得る。組成物は、液体形態であってもよく、又は凍結乾燥されてもよい。前記組成物に適した容器には、例えば、ボトル、バイアル、注射器、及び試験管が含まれる。容器は、ガラスやプラスチックなど、様々な素材から形成され得る。前記キットはまた、ウイルス感染症を診断又は評価する方法についての説明書を含む添付文書を含み得る。
【0111】
B.バイオマーカーの発現を検出及び記録するための測定システム
一態様では、測定システムが提供される。そのようなシステムは、例えば、試料中のバイオマーカー遺伝子発現の検出、及び検出から得られたデータの記録を可能にする。次いで、格納されたデータを本明細書の他の場所で説明したように分析して、対象のウイルス感染状態を決定することができる。そのようなシステムは、論理システム(検出器からのデータを取得、変換、分析、又は別の方法で処理するためのコンピューター又は他のシステム又はデバイスなど)にデータを送信できるアッセイシステム(例えば、アッセイデバイス及び検出器を含む)を含み得る。前記論理システムは、前記アッセイシステムなどのシステム全体の要素を制御すること、記憶装置又は外部メモリにデータ又は他の情報を送信すること、及び/又は治療装置にコマンドを発行することを含む、複数の機能のうちの任意の1又は複数を有し得る。
【0112】
例示的な測定システムを図16に示す。図示のシステムは、アッセイ装置1610内に無細胞DNA分子などの試料1605を含み、試料705に対してアッセイ1608を実行することができる。例えば、試料1605をアッセイ1608の試薬と接触させて、物理的特性1615のシグナルを提供することができる。アッセイ装置の例は、アッセイのプローブ及び/又はプライマーを含むフローセル、又は(アッセイを含む液滴とともに)液滴が移動するチューブであり得る。前記試料からの物理的特性1615(例えば、蛍光強度、電圧、又は電流)は、検出器1620によって検出される。検出器1620は、データシグナルを構成するデータ点を取得するために、一定間隔で(例えば、定期的な間隔で)測定を行うことができる。一実施形態では、アナログ・デジタル変換器は、前記検出器からのアナログシグナルをデジタル形式に複数回変換する。アッセイ装置1610及び検出器1620は、アッセイシステム、例えば、本明細書に記載の実施形態に従ってバイオマーカー遺伝子発現を測定する増幅及び検出システムを形成することができる。データシグナル1625は、検出器1620から論理システム1630に送られる。一例として、データシグナル1625を使用して、選択されたバイオマーカーの発現レベルを決定することができる。データシグナル1625は、同時に実行される様々な測定、例えば、試料1605の異なる分子に対する異なる色の蛍光色素又は異なる電気シグナルを含み得るため、データシグナル1625は、複数のシグナルに対応し得る。データシグナル1625は、ローカルメモリ1635、外部メモリ1640、又は記憶装置1645に格納され得る。システム1600はまた、対象に治療を提供することができる治療装置1660を含んでいてもよい。治療装置1660は、治療を決定する及び/又は治療を行うために使用することができる。このような治療の例には、外科手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、及び幹細胞移植が含まれ得る。論理システム1630は、例えば、本明細書に記載の方法の結果を提供するために、治療装置1660に接続されていてもよい。治療装置は、撮像デバイスなどの他のデバイスからの入力及びユーザー入力(例えば、ロボットシステムに対する制御など、治療を制御するため)を受信してもよい。
【0113】
本明細書に記載の方法のある態様は、工程を実行するように構成され得る1又は複数のプロセッサを含むコンピューターシステムで全体的又は部分的に実行されてもよい。したがって、実施形態は、本明細書に記載の方法の工程を実行するように構成されたコンピューターシステムを対象とし、場合によっては、それぞれの工程又は工程群を実行する異なるコンポーネントを伴う。本開示のコンピューターシステムは、上述の測定システムの一部であってもよいし、任意の測定システムから独立していてもよい。いくつかの実施形態では、本開示は、入力されたバイオマーカー発現(及び所望により他の)データに基づいてウイルススコアを計算し、対象の30日死亡率リスクを決定するコンピューターシステムを提供する。
【0114】
例示的なコンピューターシステムを図17に示す。いずれのコンピューターシステムも、任意の適切な数のサブシステムを利用することができる。いくつかの実施形態では、コンピューターシステムは単一のコンピューター装置を含み、サブシステムはコンピューター装置のコンポーネントであり得る。他の実施形態では、コンピューターシステムは、それぞれがサブシステムであり、内部コンポーネントを有する複数のコンピューター装置を含み得る。コンピューターシステムには、デスクトップコンピューター及びラップトップコンピューター、タブレット、携帯電話、並びにその他のモバイルデバイスが含まれ得る。図17に示されるサブシステムは、システムバス175を介して相互接続される。プリンタ174、キーボード178、記憶装置179、ディスプレイアダプタ182に結合されたモニター176(例えば、LEDなどのディスプレイスクリーン)などの追加のサブシステム、及びその他が示されている。入力/出力(I/O)コントローラ171に結合する周辺機器及び入力/出力(I/O)デバイスは、入力/出力(I/O)ポート177(例えば、USB、FireWire(登録商標))などの当技術分野で公知の任意の数の手段によってコンピューターシステムに接続され得る。例えば、I/Oポート177又は外部インターフェース181(例えばイーサネット、Wi-Fiなど)を使用して、コンピューターシステム180をインターネット、マウス入力デバイス、又はスキャナなどの広域ネットワークに接続することができる。システムバス175を介した相互接続により、中央処理装置173は、各サブシステムと通信し、システムメモリ172又は記憶装置179(例えば、ハードドライブなどの固定ディスク又は光ディスク)からの複数の指示の実行並びにブシステム間の情報交換を制御することができる。前記システムメモリ172及び/又は前記記憶装置179は、コンピューター可読媒体を具現化し得る。別のサブシステムは、カメラ、マイクロフォン、加速度計などのデータ収集装置185である。本明細書で言及されるデータのいずれも、あるコンポーネントから別のコンポーネントに出力することができ、またユーザーに出力することができる。コンピューターシステムは、複数の同じコンポーネント又はサブシステムを含むことができ、例えば、外部インターフェース181によって、内部インターフェースによって、又は1つのコンポーネントから別のコンポーネントに接続及び取り外し可能な記憶装置を介して一緒に接続される。いくつかの実施形態では、コンピューターシステム、サブシステム、又は装置は、ネットワークを介して通信できる。このような場合、1台のコンピューターをクライアントと見なし、別のコンピューターをサーバーと見なすことができ、それぞれが同じコンピューターシステムの一部となり得る。クライアント及びサーバーにはそれぞれ、複数のシステム、サブシステム、又はコンポーネントを含めることができる。
【0115】
一態様では、本開示は、ウイルス感染症を有する患者の30日死亡率リスクを決定するためのコンピューター実施方法を提供する。前記コンピューターは、例えば、患者からの生体試料中の1又は複数のバイオマーカーのレベルの値を含む入力された患者データを受け取ること、1又は複数のバイオマーカーのレベルを分析し、所望によりそれらをそれぞれの参照値、例えば、正規化のためのハウスキーピング参照遺伝子と比較すること、前記バイオマーカーのレベルに基づいて前記患者の30日死亡率スコアを計算し、前記スコアを1又は複数の閾値と比較して、前記患者をリスクカテゴリーに割り当てること、並びに前記患者の死亡率リスクに関する情報を表示すること、を含む工程を実施する。特定の実施形態では、前記入力された患者データは、患者からの生体試料中の複数のバイオマーカーのレベルの値を含む。一実施形態では、前記入力された患者データは、ポリヌクレオチドであるTGFBI、DEFA4、LY86、BATF、及びHK3のレベルの値を含む。一実施形態では、前記入力された患者データは、TGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1のレベルの値を含む。
【0116】
さらなる態様では、説明したように、コンピューターで実施される方法を実行するための診断システムが提供される。診断システムは、プロセッサ、記憶コンポーネント(すなわち、メモリ)、表示コンポーネント、及び汎用コンピューターに典型的に存在する他のコンポーネントを含むコンピューターを含み得る。前記記憶コンポーネントは、前記プロセッサによって実行され得る指示及び前記プロセッサによって検索、操作、又は記憶され得るデータを含む、前記プロセッサによってアクセス可能な情報を格納する。
【0117】
前記記憶コンポーネントには、前記対象の死亡率リスクを決定するための指示が含まれている。例えば、前記記憶コンポーネントは、本明細書に記載されるように、バイオマーカー発現レベルに基づいて対象の死亡率の遺伝子スコアを計算するための指示を含む。また、前記記憶コンポーネントは、多変量線形判別分析(LDA)、受信者動作特性(ROC)解析、主成分分析(PCA)、アンサンブルデータマイニング法、細胞特異的マイクロアレイ有意性分析(csSAM)、又は多次元タンパク質同定技術(MUDPIT)による分析を実施するための指示をさらに含み得る。前記コンピュータープロセッサは、前記記憶コンポーネントに結合され、患者データを受け取り、1又は複数のアルゴリズムに従って患者データを分析するために、前記記憶コンポーネントに格納された前記指示を実行するように構成される。表示コンポーネントは、前記患者の診断及び/又は予後(例えば、死亡率リスク)に関する情報を表示する。前記記憶コンポーネントは、ハードドライブ、メモリカード、ROM、RAM、DVD、CD-ROM、USBフラッシュドライブ、書き込み可能メモリ、及び読み取り専用メモリなど、プロセッサによってアクセス可能な情報を格納できる任意のタイプのものであり得る。
【0118】
前記指示は、前記プロセッサによって直接(マシンコードなど)又は間接的に(スクリプトなど)実行される指示の任意のセットであり得る。その点で、「指示」、「工程」、及び「プログラム」という用語は、本明細書では交換可能に使用することができる。前記指示は、前記プロセッサによる直接処理用のオブジェクトコード形式で格納することも、オンデマンドで解釈されるか事前にコンパイルされるスクリプト又は独立したソースコードモジュールのコレクションを含む任意の他のコンピューター言語で格納することもできる。
【0119】
データは、指示に従って前記プロセッサによって検索、保存、又は変更される場合がある。例えば、前記診断システムは特定のデータ構造に限定されないが、前記データは、複数の異なるフィールド及びレコードを有するテーブル、XML文書、又はフラットファイルとしてリレーショナルデータベース内のコンピューターレジスタに格納され得る。前記データは、バイナリ値、ASCII、又はユニコード(Unicode)などのコンピューター可読形式でフォーマットすることもできるが、これらに限定されない。さらに、前記データは、数値、説明テキスト、専用のコード、ポインタ、他のメモリ(他のネットワークの場所を含む)に格納されたデータへの参照、又は関連する情報を計算する関数によって使用される情報など、関連する情報を識別するのに充分な情報を含み得る。特定の実施形態では、前記プロセッサ及び前記記憶コンポーネントは、同じ物理的ハウジング内に格納されていても格納されていなくてもよい複数のプロセッサ及び記憶コンポーネントを含み得る。例えば、指示及びデータの一部は取り外し可能なCD-ROMに格納され、その他は読み取り専用のコンピューターチップに格納される。前記指示及びデータの一部又は全ては、プロセッサから物理的に離れた場所に格納されていても、プロセッサからアクセス可能であり得る。同様に、前記プロセッサは、並列に動作してもよく、しなくてもよいプロセッサの集合を実際に含む場合がある。一態様では、コンピューターは、1又は複数のクライアントコンピューターと通信するサーバーである。各クライアントコンピューターは、プロセッサ、記憶コンポーネント、及び指示を使用して、サーバーと同様に構成され得る。クライアントコンピューターは、フルサイズのパーソナルコンピューターを含む場合があるが、前記システム及び方法の多くの側面は、インターネットなどのネットワークを介してサーバーと無線でデータを交換可能なモバイルデバイスに関連して使用される場合に特に有利である。
【0120】
VIII.実施例
以下の実施例は、請求された開示を説明するために提示されるが、限定するものではない。
【0121】
A.実施例1.27個のコホートデータのゲノム規模での解析。
宿主応答におけるウイルスの重症度に対するシグネチャ遺伝子同定の実現可能性を評価するために、856人のウイルス感染患者のゲノム規模での遺伝子発現データを調べた。上位15個の遺伝子を選択し、それらの2遺伝子対を、非生存症例と生存症例とを区別するために評価した。
【0122】
1.データセット
細菌感染症及びウイルス感染症と健康な対照(IMX11)とを含む42の研究からの5,217人の患者の血液遺伝子発現データのコレクションを使用した。このゲノム規模でのmRNAプロファイルには13,902個の遺伝子が含まれており、複数のプラットフォームで充分にテストされたCOCONUT法を使用して相互正規化した。27のコホートから856人の患者の全てのウイルス症例を選択した。これらの856人の患者のうち、691人は28日又は30日以内の生存、4人は28日又は30日以内の非生存、161人は不明として注釈を付している。このウイルス重症度分析は、4つの非生存例(陽性)と691の生存例(陰性)との間の2群比較のために実行した。
【0123】
2.方法
目的の遺伝子を選択するために、2群を対比するためのいくつかの測定基準を非生存症例対生存症例に適用した。測定基準には、ピアソン相関、ケンドール順位相関、スピアマン順位相関、t検定、及びその他のノンパラメトリック尺度が含まれる。2群間の極端に不均衡な症例数(4対691)を考慮すると、非生存群のオーバーサンプリングも生存群のアンダーサンプリングも確実に適用することはできない。各試験で推定した有意性は、分析的に多重度補正又は順列のいずれかを使用して、主に遺伝子をランク付けし、少数の非生存症例によって大幅に制限された統計的検出力を考慮してカットオフ値を提案する目的で使用した。
【0124】
3.結果
大まかな有意性推定に基づいて、各測定基準から上位の遺伝子の結果を調べた。様々な測定基準の上位遺伝子が非常に重複しており、使用されている様々な測定基準間である程度一致した結果を示していることが判明した。したがって、発見的(ヒューリスティクス)に2つの方法のみから上位10個の遺伝子を選択することにした。数値に基づく試験カテゴリーを表すピアソン相関及びランクに基づく試験カテゴリーを表すケンドール相関により、合計15個の遺伝子が得られる。
【0125】
ウイルスの重症度の予測に関してこれら15個の遺伝子のパフォーマンスを確認するために、全ての患者のこれら15個の遺伝子のそれぞれからの遺伝子発現測定値を予測因子として使用し、表1に示すAUROC値を計算した(0.898~0.994)。
【0126】
次に、各対の幾何平均を予測スコアとして使用して、これらの15遺伝子から2遺伝子組み合わせをそれぞれ評価し、それらのAUROC(0.940~0.998)を計算した。そのような105個の遺伝子対の2つの例を図1に示す。全105対からの全AUROCの分布を図2Bに示す。2遺伝子対のそれぞれのAUROCを表3に示す。
【0127】
また、表1のランク付け順序に基づいて、1つの遺伝子から始まり、最大15個の遺伝子を再帰的に追加する一連のモデルの予測スコアとして幾何平均を使用してAUROCを計算した。結果を表2に示す(0.920~0.997)。
【0128】
要約すると、図2A図2Dは、データ中の13,902個の遺伝子のそれぞれがAUROCを計算するために使用される分布(図2D)と比較して、上記の3つのシナリオ(図2A図2C)についてのAUROCのヒストグラムを示す。15個の選択された遺伝子と13,902個の調べた遺伝子の完全な補完とを含む3つのシナリオ間のAUROC分布の違いは、15個の遺伝子を組み合わせて使用する場合を含め、ウイルスの重症度を予測する方法の有効性を強調している。
【0129】
4.検討
利用可能な遺伝子発現データにより、ウイルスの重症度に関連する上位の遺伝子を特定することができた。少ない死亡症例数による制限のため、交差検証の使用やデータセットのトレーニング及び検証セットへの分割などの厳密な戦略を使用することはできなかった。
【0130】
B.実施例2.急性感染症に関連する29個の遺伝子の中からのウイルス死亡率マーカーの同定。
1.データ
以前に、公的情報源及び内部研究から、判定された感染状態及び死亡率情報を含む正規化された遺伝子発現データのマルチプラットフォームデータベースをコンパイルした。データには、以前の研究で急性感染症に関連することが判明した29個の遺伝子の遺伝子発現が含まれていた(Mayhew et al.,2020 Nature Commun.11,Art.1177)。
【0131】
ウイルス死亡率予測因子を開発するために、ウイルス感染症と診断され、既知の日数(28日又は30日)での死亡状態を有する成人患者に焦点を当てた。ここで、28又は30は交換可能で、30日死亡率と称される場合もある。しかしながら、入手可能なデータでは、ロバストなモデル開発には症例数の割合が低すぎた。この状況を緩和するために、以前に検証された高性能の細菌/ウイルス/非感染分類子の高度なバリアント(Mayhew et al.,2020)を適用し、3クラス分類子でウイルス感染症の確率が0.5を超える全ての試料を保持した。これにより、ウイルスデータセットのサイズが増加し、705個の29次元試料のトレーニングセットが得られ、死亡率は3.3%(23試料)であった。このデータを、機械学習ワークフローへの入力として使用した。
【0132】
2.分析
社内機械学習ワークフローをウイルス死亡率トレーニングデータに適用した。データサイズにより、別の検証セットを確保することができなかったが、代わりに、前記ワークフローでは交差検証を使用した。交差検証分割は単一の研究からの試料を含むのに対し、リーブワンスタディアウト(LOSO)アプローチが最もロバストな結果を生み出すことが判明した。感染性疾患診断ドメインのモデル最適化に有効であることが以前に判明したパラメータの検索空間に、ハイパーパラメータチューニングを適用した。検索空間のサイズは、迅速なターンアラウンドのために、そして過剰適合を制限するために100に固定した。オーバーフィッティングを制限するために、線形分類子のみを調べた:線形カーネルを使用するサポートベクターマシン、ロジスティック回帰、及び線形活性化関数を使用する多層パーセプトロン。
【0133】
PCRプラットフォームへの転送を容易にするために、5個の遺伝子を標的にして、特徴(遺伝子)選択を適用した。特徴選択は、ランキング測定基準として遺伝子発現と転帰との間のピアソン相関の絶対値を用いた単変量ランキングを使用した。ランキングは、バイアスを最小限に抑えるために交差検証ループ内で実施した。5個の遺伝子の最終的なリストは、交差検証分割間の平均遺伝子ランキングに基づいていた。
【0134】
検証セットがない場合、独立したデータで勝者分類子の受信者動作特性プロットを生成する実際に実行可能な方法はない。代わりに、交差検証に基づいて2つの関連するプロットを生成した。1)各モデルの感度及び偽陽性率とハイパーパラメータ検索中に評価された決定閾値、並びに2)最適なモデルのプールされた交差検証確率に基づくROC様プロット。
【0135】
年齢は30日死亡率の重要な予測因子であり、死亡率の予測因子が年齢に依存しないかどうかを評価することから、予測因子及び年齢を独立変数として、結果を従属変数として、多変量一般化線形二項モデルを当てはめる。
【0136】
3.結果
最適なモデル(AUROC0.89)では、ロジスティック回帰及び以下の遺伝子を使用した:TGFBI、DEFA4、LY86、BATF、及びHK3。モデル選択ドットプロットを図3Aに示す。AUCが最大のハイパーパラメータ構成を選択した。対応するROCを図3Bに示す。年齢は30日死亡率の重要な予測因子であり、死亡率の予測因子が年齢に依存しないかどうかを評価することから、予測因子及び年齢を独立変数として、多変量一般化線形二項モデルを当てはめる。5遺伝子スコアは有意(P<1×10-6)であったが、年齢は有意ではなかった(P=0.4)。
【0137】
選択したモデルのパフォーマンスをさらに特徴付けるために、30日での推定死亡確率を3つのビンに分割した:低尤度(ビン1)、中間(又は不確定)尤度(ビン2)、及び高尤度(ビン3)。これらのビンは尤度比がビン1で<0.15及びビン3で>5となるように定義される。最も低いビンは、LR-0.1、感度91%(推定NPV99.7%)である。最も高いビンはLR+5、特異度89%である。したがって、COVID-19の場合のプロカルシトニンのオッズ比(OR)5と比較して、上下のビンの診断オッズ比(DOR)は約50である。よって、HostDx(商標)ウイルス重症度は、最もリスクの低い群の約77%の患者の入院を除外すると同時に、入院が最も必要な13%の患者を特定するために使用され得る(図4)。分割に基づく勝者モデルの交差検証パフォーマンスを表4に示す。
【0138】
表4は、最適モデルの交差検証パフォーマンスの推定値を示す。LR=尤度比。率(フラクション):対応するビンに割り当てられた試料の割合(%)低リスクビンの特異度:低リスクビンに割り当てられた陽性試料の割合(%)。高リスクビンの感度: 高リスクビンに割り当てられた陰性試料の割合(%)。Sens@Spec90:特異度>90%である最適モデルの感度。Spec@Sens90:感度>90%である最適モデルの特異度。
【0139】
図5は、ウイルス死亡率予測因子を年齢で調整した結果を含む。結果は、予測因子が年齢に関係なく強力な予後情報を含むことを示している。
【0140】
C.実施例3.5-mRNAスコアの検証
5-mRNAスコアの前向き検証は、ギリシャのアテネにある1つの病院で行われた。患者は、救急部門でPCRによりSARS-COV-2陽性であった場合、又はSARS-COV-2の診断で病院に移送され、挿管された場合に登録された。臨床データは、ICUケア及び/又は人工呼吸器の必要性、死亡、及びその他の標準的な転帰を含め、30日で記録された。登録時にPAXgene RNAチューブに血液を採取し、冷凍してInflammatix社に発送した。RNAを抽出し、カスタムコードセットを使用してNanoString nCounter装置で実行した。正規化後に5遺伝子スコアを計算し、30日転帰と比較した(図6)。
【0141】
D.実施例4.リスク層別化のためのCOVD-19患者の全血中のSARS-CoV-2感染に対する重篤な反応に関連するバイオマーカーの同定
1.要約
SARS-CoV-2によって引き起こされたパンデミックに対応して、ゲノム規模での遺伝子発現を使用して、39非重症例及び24重症例で構成される62人のCOVID-19患者の血液中の宿主応答を研究した。重症度に関連する35個の遺伝子を特定し、重症度の予測におけるそれらのパフォーマンスを特徴付けた。一連の遺伝子は、臨床現場でのCOVID-19患者のリスク層別化のための予後検査でバイオマーカーとして利用できる。
【0142】
2.データセット
入院後24時間以内にSARS-Cov-2による市中下気道感染症で前向きに登録された62人のCOVID-19患者のRNA-Seq(RNAシーケンス)から収集された全血遺伝子発現データを使用した。コホートには、非重症群(n=39)及び重症疾患群(n=23、うち6人が死亡)が含まれていた。
【0143】
3.方法
データは、充分に確立されたオープンソースツール(FASTQC、STAR)を使用して、Inflammatix社の内部パイプラインで処理した。次いで、統計パッケージDESeq2を使用して、データを正規化し、差次的に発現する遺伝子をランク付けした。DESeq2 は、RNA配列決定データから差次的に発現された遺伝子を特定するために特別に設計された、最も一般的に使用されるソフトウェアパッケージの1つである。簡潔には、データの正規化を実行して配列決定及びRNA組成のバイアスを考慮し、次に各比較群の各遺伝子の分散を推定し、これを使用して負の二項分布に適合させる。遺伝子発現差の有意性は、ワルド(Wald)検定統計量を使用して評価する。また、遺伝子の数をさらに限定するための基準として、標準化された効果サイズ(ヘッジ(Hedge)のg)を使用した。ヘッジのgは、分散を考慮しているため、効果の大きさのロバストな推定値であり、中程度のサイズのコホートでも効果のロバストな推定値が得られる。
【0144】
4.結果
差次的発現は、倍数変化(FC)、効果サイズ(ES)、及びベンジャミーニ=ホッホベルク(Benjamini-Hochberg)補正P値(P値調整)の複数の閾値の選択肢で評価した。FC>1.5及びP値調整<0.05で、高い不均一性でも80%の検出力に相当する閾値で、1,865個の差次的に発現する遺伝子を特定した。この数は、アプリケーション開発には実用的ではないため、最も適切なシグナルに焦点を当てるために、P値調整<0.005及び|ES|>1.3(2のFCに相当)でよりストリンジェントなカットオフを使用することを選択した。これらの閾値で、479個の遺伝子を特定した。重症患者対非重症患者では、329個が上方制御され、150個が下方制御された。バックグラウンドパフォーマンスレベルを確立するために、最初に、測定された全ての遺伝子について、受信者動作特性曲線(ROC)の遺伝子ごとの曲線下面積(AUC)を推定した(図7A、AUCは0.36~0.87の範囲内で、中央値は0.64)。選択した479個の遺伝子のAUCは0.78~0.93の範囲内で、中央値は0.84であった(図7B図7C)。
【0145】
次いで、329個の上方制御された遺伝子と150個の下方制御された遺伝子の上位10%の最も高度に発現された遺伝子を別々に選択し、32個の上方制御された遺伝子及び15個の下方制御された遺伝子、合計47個の遺伝子が得られた。より高い発現の遺伝子は、多くの場合、本発明者らのアッセイでよりロバストなパフォーマンスであるためである。さらに、62個のリーブワンアウト(LOO)遺伝子選択から60回以上存在する遺伝子のみを保持することにより、前記リストを35個に絞り込んだ(図8)。特に、これらの遺伝子は、データの中で最もロバストな選択を表しており、35個の遺伝子のうち33個が、可能な62個のリーブワンアウト選択の全てにおいて存在している。
【0146】
図7Dに示すこれらの35個の遺伝子についての個々のAUCは、0.82~0.89の範囲内であり、中央値は0.84である(表5も参照)。また、35個の遺伝子のうちの2個の遺伝子の595個の組み合わせ全てのパフォーマンスを評価し、それらのAUCを図7E及び表6に示す。35個の同定されたバイオマーカー遺伝子の幾何平均差スコア(過剰発現-過少発現)は、最も高いAUCであった(0.91、図8)。
【0147】
5.検討
COVID-19は急速に進化するパンデミックである。本発明者らは、知る限りでは、COVID-19の重症度が多様なかなりの数の患者からの全血のRNA-seq遺伝子発現を報告した最初のグループである。これらの62個の試料により、COVID-19の重症度を予測するために使用できる可能性のある遺伝子のコアセットを特定することができ、タイムリーに患者をより迅速かつ正確にトリアージできるようになった。
【0148】
E.実施例5.非COVID-19ウイルス感染症を有する患者を用いてトレーニングされた6-mRNA宿主応答全血分類子は、COVID-19の重症度を正確に予測する
1.序論
急性ウイルス感染症の患者には、血液の宿主免疫応答に基づくmRNA予後シグネチャが共有されているという以前の結果に基づいて、ウイルス感染症患者の転帰を予測するための、倹約的かつ臨床的に翻訳可能な遺伝子シグネチャを特定できるという仮説を立てた。21の独立したデータセットを急性ウイルス感染症患者からの705の末梢血トランスクリプトームプロファイルと統合することにより、この仮説をテストし、これらの複数のウイルスデータセットにわたる死亡率予測のための6-mRNA宿主応答に基づくシグネチャを特定した。次に、様々なウイルス感染症(非COVID)の患者の1,417の血液トランスクリプトームプロファイルの21の独立した後ろ向きコホートで、ロックされたモデルを検証した。次に、COVID-19患者の独立した前向きに収集されたコホートで6-mRNAモデルを検証したところ、非COVIDデータを使用して完全にトレーニングされているにもかかわらず、転帰を予測する能力を示した。本発明者らの結果は、急性ウイルス感染症の転帰に関連する保存された宿主応答があることを示唆している。そして、COVID-19及びその他の急性ウイルス感染症の患者の管理の改善を支援するために、迅速な分子検査(CoVerity(商標))にさらに開発されている6-mRNA宿主応答シグネチャの迅速な等温バージョンの有効性を示した。
【0149】
2.材料及び方法
データ収集、キュレーション、及び試料のラベル付け
死亡率データが存在する典型的な急性感染症の研究について、公開リポジトリ(NCBI GEO及びEBI ArrayExpress)を検索した。小児の完全に非ウイルスのデータセットを削除した後、28日又は30日死亡率情報のいずれかを有する1,861人の成人患者からの試料で構成される17のマイクロアレイ又はRNAseq末梢血急性感染症研究を特定した(図10及び表7)。前述のように、これらのデータセットを処理して共正規化した(19)。
【0150】
公開されている試料における臨床的に判定されたウイルス感染症及び既知の死亡転帰を有する症例数は、ロバストなモデリングには過少であった。したがって、トレーニング試料の数を増やすために、以前に開発された遺伝子発現に基づく細菌/ウイルス分類子を使用してウイルス感染状態を割り当てた。分類子の精度は臨床判定の精度に近くなる。具体的には、「Inflammatix Bacterial-Viral Noninfected version 2」(IMX-BVN-2)と呼ばれる細菌感染対ウイルス感染の診断に、以前に説明したニューラルネットワークに基づく分類子の更新バージョンを利用した(18)。この方法は、多くの偽陽性を導入することなく、ウイルス感染症による死亡率試料の数を増やすというアイデアである。全ての試料について、IMX-BVN-2を適用して細菌又はウイルス感染症の確率を割り当て、IMX-BVN-2によるウイルス確率が0.5以上の試料を保持した。このウイルス感染症の評価をコンピューター支援判定と称する。1,861個の試料のうち、ウイルス感染症のIMX-BVN-2確率>0.5である311個の試料が見つかり、試料中9人の患者が30日以内の死亡であった。
【0151】
この公開されているマイクロアレイ/RNAseqデータに加えて、NanoString nCounterを使用してプロファイリングされた4つの独立したコホート(19)から394個の試料を含めた。その中14人の患者が死亡していた(表7)。したがって、全体として、ウイルス感染症及び短期死亡転帰のコンピューター支援判定を受けた患者からの21の独立した研究にわたる705個の血液試料を含めた。重要なことに、これらの患者は全員、2019年11月より前に登録されていたため、SARS-CoV-2に感染していなかった。
【0152】
分類子開発のための変数の選択
いくつかの生物学的及び実用的な理由から、分類子を開発するために29個のmRNAを事前に選択した。生物学的には、29個のmRNAは、重症患者の30日死亡率を予測するための11遺伝子セットと、ウイルス対細菌又は非感染性炎症を識別できる繰り返し検証された18遺伝子セットで構成されている(17~19)。したがって、一般化可能なウイルスの重症度シグネチャが可能である場合、適切な(及び事前に精査された)変数がこの場合ある可能性が高いと仮定した。入力変数を制限することで、トレーニングデータへのオーバーフィッティングのリスクも低下させた。実用的な観点からは、まず、これら29個の遺伝子を30分未満で測定するための診療現場での(Point Of Care)診断プラットフォームを開発している。これら29個の遺伝子のサブセットを使用して開発された分類子により、既存のプラットフォームで迅速な診療現場での検査(簡易迅速検査)を開発できるようになる。次に、トレーニングに含まれる21のコホートのうち4つは、NanoString nCounterを使用してこれら29個の遺伝子をプロファイリングしたInflammatix社の研究であり、したがって、これらの研究では、これが利用可能な唯一のmRNA発現データであった。
【0153】
機械学習を用いた分類子の開発
交差検証(CV)を使用して705個のウイルス試料を分析し、機械学習分類子のランク付けと選択を行った。交差検証の3つのバリアントを調査した:(1)5分割ランダムCV、(2)各分割が複数のスタディを含み、各スタディが正確に1つのCV分割に割り当てられる、5分割グループ付きCV、及び(3)各スタディがCV分割を形成する、リーブワンスタディアウト(LOSO)法。非ランダムCVバリアントを含めたのは、特定のデータセットについて、リーブワンスタディアウト交差検証がトレーニング中のオーバーフィッティングを減らし、よりロバストな分類子を生成する可能性があることを最近実証したからである(19)。ハイパーパラメータ検索空間は、機械学習のベストプラクティス及び感染症診断におけるモデルの最適化における以前の結果に基づいている(21)。迅速なターンアラウンド及びオーバーフィッティングの低減のために、線形分類子(線形カーネル、ロジスティック回帰、及び線形活性化関数を使用する多層パーセプトロンをサポートするベクターマシン)のみを調査し、検索するハイパーパラメータ構成の数を分類子あたり1000に制限した。そして、迅速な分子アッセイへの翻訳のための倹約的シグネチャを確保するために、最終モデルの遺伝子数を6に制限した。6個の遺伝子を選択するために、順方向選択及び単変量特徴ランキングを適用した。遺伝子選択プロセスでオーバーフィッティングを回避するためのベストプラクティスに従った(22、23)。
【0154】
各ハイパーパラメータ構成に対して交差検証を実施した。各分割内で、遺伝子のピアソン相関の絶対値及びクラスラベル(生存/死亡)を並べ替えた。次に、上位6個の遺伝子を使用して分類子をトレーニングし、それを除外された分割に適用した。前記分割からの予測確率がプールされ、プールされた交差検証確率に対する受信者動作特性曲線下面積(AUROC)が、分類モデルをランク付けするための測定基準として使用された。遺伝子の最終ランキングは、CV分割全体の平均ランキングを使用して決定した。最高ランクのモデルハイパーパラメータが選択され、6個の遺伝子の最終リストが確立されると、トレーニングセット全体及び「ロックされた」ハイパーパラメータを使用して最終モデルがトレーニングされた。対応するモデルの重みはロックされ、最終的な分類子は、COVID-19患者の独立した前向きコホートと、COVID-19を伴わないウイルス感染症患者の独立した後ろ向きコホートとで試験された。
【0155】
後ろ向き非COVID-19患者コホート
全血又は末梢血単核細胞(PBMC)に由来する34の独立したコホートの以前に説明したデータベースから試料のサブセットを選択した(20)。このデータベースから、6遺伝子シグネチャを特定するための分析で使用した全ての試料を削除し、21の独立したコホート全体で1,417個の試料を残した(表11)。これらのデータセットの試料は、実際の患者集団で観察された生物学的及び臨床的不均一性を表しており、無症候性から致命的なウイルス感染まで幅広い年齢範囲(12ヶ月未満~73歳)にわたる重症度の16の異なるウイルスに感染した健康対照及び患者が含まれた(図9A及び表11)特に、試料は、患者及びウイルスの多様な遺伝的背景を表す10か国に登録された患者からのものであった。そして、これらのデータセットは様々な製造元のマイクロアレイを使用してプロファイリングされたため、分析に技術的な不均一性を含めた。
【0156】
生データがGEOデータベースから入手可能である場合、標準的な方法を使用して全てのマイクロアレイデータセットを再正規化した。Affymetrixアレイのミスマッチプローブを使用して、GCロバストマルチアレイ平均(gcRMA)をアレイに適用した。Illumina、Agilent、GE、及びその他の商用アレイの分位正規化に続いて、正規指数バックグラウンド補正を使用した。カスタムアレイを再正規化せず、研究著者によって公開されているように前処理されたデータを使用した。統合分析を容易にするために、各データセットのマイクロアレイプローブをEntrez Gene ID(識別子)にマッピングした。プローブが複数の遺伝子と一致した場合、そのプローブの発現データを拡張して、遺伝子ごとに1つのレコードを追加した。複数のプローブがデータセット内の同じ遺伝子にマッピングされた場合、固定効果モデルを適用した。データセット内で、様々な種類のマイクロアレイでアッセイされたコホートは、独立したものとして扱った。
【0157】
後ろ向き非COVID-19患者試料の標準化された重症度割り当て
前述のように、1,417個の試料のそれぞれに標準化された重症度を使用した(20)。簡潔には、各データセットについて、原著で定義されている試料表現型を使用した。以下のように、原著の各データセットのコホートの説明に基づいて、各試料に重症度カテゴリーを手動で割り当てた:(1)健康対照:症候性で感染していない健康な個人(2)無症候性又は回復期:イルスに対して検査で陽性を示した無熱性かつ無症候性の個人、又はウイルス感染症から完全に回復し、症状が完全に解消された個人、(3)軽症:来患者として管理された又は救急部門(ED)から退院したウイルス感染症の症状のある個人、(4)中等症:般病棟に入院し、酸素吸入を必要としなかったウイルス感染症の症状のある個人、(5)重症:原著者によって「重症」と記載された、ウイルス感染症の症状のある個人、酸素吸入のある一般病棟に入院した、又は人工呼吸器や強心薬のサポートを必要とせずに集中治療室(ICU)に入院した患者、(6)重篤:CUで人工呼吸器を使用していた、又は急性呼吸窮迫症候群(ARDS)、敗血症性ショック、又は多臓器不全症候群(MODS)と診断されたウイルス感染症の症状のある個人、並びに(7)致死:ICUで死亡したウイルス感染症患者。
【0158】
試料レベルの重症度データを提供しなかったデータセット(GSE101702、GSE38900、GSE103842、GSE66099、GSE77087)については、次のように重症度カテゴリーを割り当てた。以下のいずれかの場合に、データセット内の全ての試料を「中等症」に分類した:(1)患者の70%超が、救急部門(ED)から退院するのではなく、一般病棟に入院した、(2)一般病棟に入院した患者の20%未満が酸素吸入を必要とした、又は(3)患者は一般病棟に入院し、原著者によって「軽症」又は「中等症」に分類された。データセット内の全ての試料を「重症」と分類したのは、20%を超える患者が、(1)一般病棟に入院し、原著者によって「重症」と分類された場合、(2)酸素吸入が必要な場合、又は(3)人工呼吸器なしでICUへの入院を必要とした場合であった。
【0159】
前向きCOVID-19患者コホート
この研究は、2020年3月~4月に、ギリシャのアテネにあるATTIKON 大学総合病院(ATTIKON University General Hospital)で実施された(2019年2月26日に倫理委員会が承認)。参加者は、呼吸器分泌物中のSARS-CoV-2の分子検出及び下気道への関与の放射線学的エビデンスを伴う、本人又は同意できない患者の場合は1親等近親者によって提供された書面によるインフォームドコンセントを有する成人であった。PAXgene(登録商標)Blood RNAチューブは、入院から最初の24時間以内に、その他の標準的な検査パラメータと共に採取された。データ収集には、人口統計情報、臨床スコア(SOFA、APACHE II)、検査結果、入院期間、及び臨床転帰が含まれる。患者は30日間毎日経過観察された。重症疾患は、呼吸不全(PaO/FiO比が150未満で人工呼吸器が必要)又は死亡と定義された。PAXgene(登録商標)Blood RNA試料は、Inflammatix社に送られ、前述のように、RNAが抽出されNanoString nCounterを用いて処理された(19)。6-mRNAスコアは、分類子の重みをロックした後に計算した。
【0160】
健康対照
商用ベンダー(BioIVT社)を通じて健康対照から5つの全血試料を取得した。各個人は無熱性であり、口頭でスクリーニングして、試料収集前の3日以内に感染の徴候や症状がないことを確認した。また、口頭でスクリーニングして、現在抗生物質治療を受けていないこと、及び試料収集前の3日以内に抗生物質を服用していないことを確認した。さらに、全ての試料は、分子又は抗体に基づく検査により、HIV、西ナイル熱、B型肝炎、及びC型肝炎に対して陰性であることが示された。試料をPAXgene(登録商標)Blood RNAチューブに採取し、製造元のプロトコルに従って処理した。試料を、-80℃で保存及び輸送した。
【0161】
迅速等温アッセイ
本発明者らの目標は、迅速なアッセイを作製し、等温反応が従来のqPCRよりもはるかに高速に実行されることである。したがって、LAMPアッセイを、エキソンジャンクションに渡るように設計し、これらの設計基準を満たす少なくとも3つのコア(FIP/BIP/F3/B3)ソリューションを各マーカーについて特定し、cDNAの増幅及びgDNAの排除の成功について評価した。利用可能な場合は、完全なプライマーセットを生成するための最適なコアソリューションのループプライマー(LF/LB)を続いて特定した。ソリューションは、cDNA及びRNAの効率的な増幅、gDNAに対する選択性、並びに単一の均一な融解ピークの存在に基づいてダウンセレクションした。最終的なプライマーセットを、表12として添付している。
【0162】
健康、細菌、又はウイルスを含む複数の感染クラスの患者からの61の血液試料の分析検証パネルを設計した。細菌又はウイルス感染症の患者からの試料のサブセットは、敗血症に進行した感染症の患者からのものであった。全血試料は、採取時に宿主mRNA発現プロファイルの完全性が維持されるPAXgene Blood RNA安定化バキュテナーで採取された。全RNAは、Agencourt RNAdvance Bloodキット及びプロトコルの修正版を使用して、安定化された各血液試料の1.5mLアリコートから抽出された。RNAを55℃で5分間熱処理し、定量前に急速冷却した。全RNA材料は、三つ組で5個のマーカーを測定するLAMP反応全体に均等に分配した。LAMPアッセイは、Optigene Ltd社が推奨するプロトコルの修正バージョンを使用して行い、QuantStudio 6 Real-Time PCR Systemで実行した。
【0163】
統計分析
分析は、Rバージョン3及びPythonバージョン3.6で実行した。受信者動作特性曲線下面積(AUROC)は、有病率に依存したり、特定のカットオフポイントを選択したりすることなく、診断試験の品質の一般的な尺度を提供するため、モデル評価の主要な測定基準として選択された。
【0164】
全ての検証データセット分析では、ロックされた6-mRNAロジスティック回帰出力、すなわち、予測確率を使用する。追加マーカーのAUROC(表9)は、各マーカーの利用可能なデータから計算される。他のマーカーを予測変数として伴う6-mRNA予測確率を含むロジスティック回帰モデルでは、モデルの収束を確実にするために値に条件付き多重代入を使用した。AUROCは、検証データの乏しいキャリブレーションを検出できない場合があるため(対象のランキングが保持される可能性があるため)、トレーニングデータから選択されたカットオフが、再キャリブレーションの前であっても、検証データで良好な感度及び特異度を維持することも実証した。試料サイズが比較的小さいため、可能な場合は正規性の仮定なしで群間比較を行った(クラスカル・ウォリス(Kruskal-Wallis)の順位和又はマン・ホイットニーのU検定)。連続変数については、中央値及び四分位範囲が与えられる。
【0165】
3.結果
最初に、コンピューター支援判定及び利用可能な結果データに基づいて、ウイルス感染症(SARS-CoV-2以外)の705人の患者を対象とした21の研究(24~39)を特定した(方法、図10、及び表7を参照)。これらの研究には、4社の製造元(Affymetrix社、Agilent社、Illumina社、Nanostring社)のmRNAプロファイリングプラットフォームを使用して14か国からのウイルス感染症由来の血液試料をプロファイリングしたため、臨床的、生物学的、及び技術的不均一性の広いスペクトルが含まれていた。各データセット内で、死亡した患者数は非常に少なく(1つの研究を除く全ての研究で2人以下)、充分な試料サイズを有する単一のコホートに依存するバイオマーカー発見の従来のアプローチは効果的ではなかったことを意味する。しかしながら、これらの705人の患者全体では充分な症例(試料採取から30日以内に23人の死亡)であった。独立したデータセットを統合し、不均一性を活用するための以前に説明したアプローチにより、プールされたデータセット全体で学習することができた(19、40、41)。t-確率的近隣埋め込み(t-SNE)を使用した研究全体に存在する全ての遺伝子を使用した705の共正規化試料の可視化は、死亡した患者からの試料と生存した患者からの試料との間に明確な分離がないことを示した(図11A)。
【0166】
6-mRNAロジスティック回帰に基づくモデルは、複数の後ろ向き研究でウイルス患者の死亡率を正確に予測する
分析で採用された線形機械学習アルゴリズム全体で、ロジスティック回帰を使用したモデルは、死亡したウイルス感染症患者を特定するための平均AUROCが最も高かった。さらに、ロジスティック回帰モデル内では、ランダム交差検証を使用してトレーニングされたモデルは、交差検証の他のバリアントを使用してトレーニングされたモデルよりも正確であった。そして、CVを使用してトレーニングされた様々な6-mRNAロジスティック回帰に基づくモデル内で、AUROCが最も高いモデルは以下の6個の遺伝子を使用した:TGFBI、DEFA4、LY86、BATF、HK3、及びHLA-DPB1。AUROCは0.896であった(95%CI:0.844~0.949)(図11B図11C、及び図14)。6個の遺伝子のそれぞれは、生存したウイルス感染症患者と生存しなかった患者との間で有意に差次的に発現され、死亡した患者では、そのうち3個の遺伝子(DEFA4、BATF、HK3)がより高く、3個の遺伝子(TGFBI、LY86、HLA-DPB1)がより低かった(図11D)。交差検証に基づいて、6-mRNAロジスティック回帰モデルは、生存した患者から死亡したウイルス感染症患者を区別するために、91%の感度及び68%の特異度を示した。6-mRNA分類子と称されるこのモデルを、複数の独立した後ろ向きコホート及び前向きコホートでの検証にそのまま使用した。
【0167】
6-mRNA分類子は、ウイルス感染症患者の年齢に依存しない死亡率の予測因子である
年齢は、呼吸器ウイルス感染症患者の30日死亡率の重要な予測因子として公知である。トレーニングデータの年齢に関する6-mRNA分類子の新しい予後情報の付加価値を評価するために、年齢及びプールされた交差検証6-mRNA分類子確率を独立変数としてバイナリロジスティック回帰モデルに適合させる。6-mRNAスコアは30日死亡率の増加と有意に関連していたが(P<0.001)、年齢はそうではなかった(P=0.06)。
【0168】
複数の独立した後ろ向きコホートにおける6-mRNA分類子の検証
ロックされた6-mRNA分類子を、10か国のウイルス感染症患者(健康対照:663人、非重症:674人、重症:71人、致死:7人)からの21の独立したコホートにわたる血液試料の1,417のトランスクリプトームプロファイルに適用した(表11)。6個の遺伝子の発現を使用した1,417個の試料の視覚化により、重症転帰を有する患者がより近くに集まっていることが示された(図12A)。6個の遺伝子のうち、過剰発現遺伝子(HK3、DEFA4、BATF)はウイルス感染症の重症度と正の相関があり、過小発現遺伝子(HLA-DPB1、LY86、TGFBI)は重症度と負の相関があった(図12B)。重要なことに、6-mRNA分類子スコアは重症度と正の相関があり、重症又は致死的ウイルス感染症患者では、非重症ウイルス感染症患者又は健康対照よりも有意に高かった(図12C)。そして、6-mRNA分類子スコアは、重症ウイルス感染症患者を、非重症ウイルス感染症患者(AUROC=0.91、95%CI:0.881~0.938)及び健康対照者(AUROC=0.998、95%CI:0.994~1)から区別した(図12D)。
【0169】
本発明者らは、ROC曲線をプロットして、臨床的に目的とする以下のサブグループにおける6-mRNA分類子の識別能力を評価した:健康対照、非重症例、重症及び致死転帰(図12D)。COVID-19などの一部のウイルス感染症は無症候性である可能性があるため、健康対照が提示される(但し、非重症ウイルス感染症は含めない)。全てのペアワイズ比較は、独立したデータに対する分類子のロバストなパフォーマンスを示し、0.86(非重症対健康)~1(重症対健康)のAUROC点推定値を達成した。
【0170】
独立したコホートにおける6-mRNA ロジスティック回帰モデルの前向き検証
ギリシャのアテネで、SARS-CoV-2による肺炎の成人患者97人を前向きに登録した。非重症COVID-19疾患の患者は47人であったが、50人は重症COVID-19であり、そのうち16人が死亡した(表8)。興味深いことに、6つのmRNAの発現を使用した低次元でのこれらの試料の視覚化(分類子なし)では、重症COVID-19疾患の患者を非重症疾患患者から区別できなかった(図13A)。非重症COVID-19疾患患者における6つのmRNAの発現を重症疾患患者と比較すると、それぞれの発現はトレーニングデータと同じ方向に統計的に有意に変化した(P<0.05)(図13B)。
【0171】
ロックされた6-mRNA分類子を97人のCOVID-19患者及び5人の健康対照に適用した。驚くべきことに、この分類子は、健康対照、非重症COVID-19の患者、並びに重症COVID-19及び死亡の患者を区別した(図13C)。特に、このモデルは重症呼吸不全患者と非重症患者とを、AUROCが0.89で区別した(95%CI:0.82~0.95、図13D)。
【0172】
また、ロジスティック回帰モデルに重症度の他の予測因子(年齢、SOFAスコア、CRP、PCT、乳酸、及び性別)を含めることにより、6-mRNAスコアがCOVID-19患者の重症度の独立した予測因子であるかどうかを評価した。予想したように、試料サイズが小さく、マーカー間の相関関係があるため、SOFA以外のマーカーは重症呼吸不全の統計的に有意な予測因子ではなかった(表13)。
【0173】
臨床応用の場合、AUROCはマーカーパフォーマンスのより適切な指標である。そのために、AUROCを使用して6-mRNAスコアを重症度の他の臨床パラメータと比較した(表9)。6-mRNAスコアは、SOFAを除いて、重症呼吸不全及び死亡の最も正確な予測因子であった。AUROCの信頼区間が重複しているのは、本研究が統計的に有意な差を検出するようになっていないためである。6-mRNAスコアが臨床医のベッドサイドでの重症度評価にどのように追加されるかを評価する代わりに、重症呼吸不全の予測について、分類子とSOFAスコアとの組み合わせがSOFA単独よりも改善するかどうかを評価した。2つのスコアを合わせたAUROCは0.95であった。継続的な純再分類改善度(continuous net reclassification improvement、cNRI)は、0.43[95%CI:0.04~0.81、P=0.03]であった。まとめると、これらの結果は、標準的なリスク予測因子に6-mRNAスコアを追加すると、臨床リスク予測が改善される可能性があることを示唆しているが、決定的な結論には、追加の独立したデータでの検証が必要である。
【0174】
臨床報告への翻訳
有用性及び採用を改善するには、直感的で実用的な試験レポートでリスク予測スコアを臨床医に提示する必要がある。そのために、6-mRNAスコアを3つのバンドで離散化した:重症転帰の低リスク、中間リスク、及び高リスク。各バンドのパフォーマンス特性を表10に示す。この表は、2つのバージョンの決定閾値を使用した後ろ向きデータ(健康対照を除く)に対する試験のパフォーマンスを示している:トレーニングデータで最適化された閾値(表10A)及び後ろ向き試験セットを使用して最適化された閾値(表10B)。転帰は重症感染症であった。表10C及び表10Dは、重症呼吸不全を転帰として使用した、COVID-19データの対応する結果を示している。
【0175】
迅速なアッセイへの変換
リスク予測スコアは、臨床ワークフローに適合するのに充分な速さである必要がある。そこで、迅速な6-mRNA試験の概念実証としてLAMPアッセイを開発した。さらに、健康対照及び様々な重症度の急性感染症からの61の臨床試料全体で、LAMP 6-mRNAスコアと参照NanoString(登録商標)6-mRNAスコアが非常に高い相関関係にあることを示した(r=0.95、図15)。これらの結果は、さらに最適化することで、6-mRNAモデルを臨床アッセイに翻訳して30分未満で実行できることを実証する。
【0176】
4.検討
2009年以来4回目のウイルスパンデミックである進行中のCOVID-19パンデミックによる深刻な経済的及び社会的コストは、誰が自宅で隔離して安全に回復できるか、誰が綿密にモニタリングする必要があるかについて、患者を層別化するのに役立つ予後試験の緊急の必要性を強調している。ここでは、SARS-CoV-2に感染していないウイルス感染患者からの21の不均一性研究にわたる705の末梢血トランスクリプトームプロファイルを統合した。これらの研究全体でかなりの生物学的、臨床的、及び技術的な不均一性があるにもかかわらず、重症ウイルス感染症患者をそうでない患者から区別する6-mRNA宿主応答シグネチャを特定した。この6-mRNAモデルの一般化可能性は、まず後ろ向きにプロファイリングされた1,417試料の21の独立した不均一コホートのセットで、次にギリシャのSARS-CoV-2感染症患者の独立した前向きに収集されたコホートで実証された。各検証分析で、6-mRNA分類子は、SAR-CoV-2を含む感染ウイルスに関係なく、重症転帰を有する患者を、非重症転帰を有する患者から正確に区別した。重要なことに、各分析全体で、6-mRNA分類子はAUROCよって測定された同様の精度を有し、生物学的、臨床的、及び技術的不均一性に対する一般化可能性及びロバストネスを実証している。この研究は、トランスクリプトーム全体の変化の説明ではなく、臨床ツールの開発に焦点を当てていたが、ウイルス感染症全体でのシグネチャの適用可能性は、重症転帰に関連する宿主因子がウイルス感染全体で保存されていることをさらに実証しており、これは最近の大規模分析と一致している(20)。
【0177】
多くのリスク層別化スコア及びバイオマーカーが存在するが、ウイルス感染症に特化したものはほとんどない。COVID-19用に特別に設計された最近のモデルのほとんどは、同じ均一なコホートでトレーニング及び検証されており、他のウイルス感染症で試験されていないため、他のウイルスへの一般化可能性は不明である(14)。その結果、SARS-CoV-2などの新しいウイルスが出現すると、その有用性は大幅に制限される。但し、ウイルス感染症に対する宿主応答は保存されており、他の急性症状に対する宿主応答とは異なることを本発明者らは繰り返し実証してきた(15~20)。
【0178】
ここでは、以前の結果に基づいて、ウイルス感染症患者で特別にトレーニングされた6-mRNA分類子を開発し、他の既存のバイオマーカーよりも優れたリスク層別化を行った。さらに、COVID-19のリスク層別化における臨床使用が承認された唯一のアッセイ(血中のIL-6を測定)は、ここで提案した6-mRNAモデルを大幅に下回っている。とは言え、重症呼吸不全の予測に関する既存のバイオマーカー(表9)に対するわずかな改善には、統計的有意性を確認するためにより大きなコホートが必要である。6-mRNAスコアは名目上SOFAよりも悪いが、SOFAは計算に24時間要する一方、6-mRNAスコアは30分で実施でき、トリアージテストとしての有用性を実証している。SOFAと組み合わせた相乗効果(正の再分類改善度(net reclassification improvement、NRI))は、6-mRNAスコアが臨床ゲシュタルト(gestalt)と組み合わせて実践を改善できることも示唆している。6-mRNAスコアは、急速な等温定量的RT-LAMPアッセイとして実践するために削減されており、さらなる開発によりクリニックで実施することが実用的である可能性があることを示唆している。
【0179】
本研究における本発明者らの目標は、根底にある生物学的メカニズムを調べることではなく、SARS-CoV-2パンデミックにおける予後検査の差し迫ったニーズに対処し、将来のパンデミックへの備えを改善することであった。しかしながら、immunoStatesデータベース(metasignature.khatrilab.stanford.edu)(42)を使用して、6個の遺伝子のうち5個(HK3、DEFA4、TGFBI、LY86、HLA-DPB1)が、単球、骨髄樹状細胞、及び顆粒球を含む骨髄性細胞で高度に発現されていることを見出した。これは、骨髄細胞がウイルス感染に対する保存された宿主応答の主要な供給源であることを実証する最近の結果と一致している(20)。さらに、本発明者らは以前に、DEFA4が、重症感染症に進行したデングウイルス感染症患者(43)、及び敗血症患者で死亡率リスクが高い患者(18)で過剰発現していることを見出した。HLA-DPB1は、HLAクラスIIβ鎖パラログに属し、細胞外タンパク質由来のペプチドを提示することにより、免疫系で中心的な役割を果たす。クラスII分子は、抗原提示細胞(B リンパ球、樹状細胞、マクロファージ)で発現される。重症転帰を伴う患者におけるHLA-DPB1の発現低下は、抗原提示の機能不全を示唆しており、さらに検討する必要がある。同様に、全身性炎症反応症候群(SIRS)患者と比較して、敗血症患者ではBATFが有意に過剰発現し、TGFBIが有意に過少発現している(15)。そして、末梢血でのTGFBI及びLY86の低発現は、敗血症患者の死亡率リスクの増加と関連している(18)。これらの結果は、細菌感染又はウイルス感染に関係なく、感染症の重症転帰に関連する共通の根本的な宿主免疫応答がある可能性があることをさらに示唆している。不均一なデータセット全体にわたる重症感染症患者におけるこれらの遺伝子の一貫した差次的発現は、宿主応答の調節不全を利用して高リスク群と低リスク群とにおける患者を層別化できるという本発明者らの仮説をさらに支持する.
【0180】
本発明者らの研究にはいくつかの制限がある。第一に、本発明者らの研究では、6-mRNAシグネチャの発見のために大量の不均一性を含む後ろ向きデータを使用しており、このような不均一性は、分類子の開発において未知の交絡因子を隠す可能性がある。但し、生物学的、臨床的、及び技術的不均一性の提示に成功したことで、診療現場での臨床解釈に適した、一般化可能な予後バイオマーカーの倹約的なセットを特定する推測的な可能性も高まった。第二に、差し迫ったニーズに対する実際的な考慮事項により、事前に選択されたmRNAのパネルに焦点を当てた。トランスクリプトームデータ全体を使用した同様の分析により、臨床データは少なくなるが、追加のシグネチャが見つかる可能性がある。第三に、線形モデルのみを考慮した。非線形関係を説明するより複雑なモデルは、より正確である可能性があるが、オーバーフィッティングする可能性もある。第四に、これら全てのタイプのパンデミック観察研究に共通する制限は、症状の発症からの時間の影響に関する理解の欠如である。そして、重症転帰に進行するリスクが高い患者をそうでない患者から区別する際の6-mRNAモデルの精度をさらに確認するには、さらに大規模な前向きコホートが必要である。
【0181】
全体として、本発明者らの結果は、一旦迅速なアッセイに翻訳され、より大きな前向きコホートで検証されると、この6-mRNA予後スコアが、SARS-CoV-2又はインフルエンザなどの他のウイルス感染症の診断後に患者をトリアージするのに役立つ臨床ツールとして使用できることを示している。トリアージの改善により、リソースをより効果的に割り当てながら、罹患率及び死亡率を減らすことができる。重症ウイルス感染症を発症するリスクが高い患者、すなわち、綿密な観察及び抗ウイルス療法から最も恩恵を受けるウイルス感染症患者群を特定することにより、本発明の6-mRNAシグネチャは、新たな抗ウイルス療法の評価を目的とした臨床試験における患者の選択及び場合によってはエンドポイント測定の指針にもなり得る。これは、現在のCOVID-19パンデミックの状況では特に重要であるが、将来のパンデミックや季節性インフルエンザでも役立つ。

1. coronavirus.jhu.edu/map.html.(Johns Hopkins University,2020).
2. F.Zhou et al.,Clinical course and risk factors for mortality of adult inpatients with COVID-19 in Wuhan,China:a retrospective cohort study.Lancet 395,1054-1062(2020).
3. D. Wang et al.,Clinical Characteristics of 138 Hospitalized Patients With 2019 Novel Coronavirus-Infected Pneumonia in Wuhan,China.Jama,(2020).
4. M.Cevik,C.Bamford,A.Ho,COVID-19 pandemic-A focused review for clinicians.Clin Microbiol Infect,(2020).
5. C.i.C.f.D.C.a.P.Epidemiology Working Group for NCIP Epidemic Response,[The epidemiological characteristics of an outbreak of 2019 novel coronavirus diseases(COVID-19)in China].Zhonghua Liu Xing Bing Xue Za Zhi 41,145-151(2020).
6. W.J.Guan et al.,Clinical Characteristics of Coronavirus Disease 2019 in China.N Engl J Med 382,1708-1720(2020).
7. D.A.Berlin,R.M.Gulick,F.J.Martinez,Severe Covid-19.N Engl J Med,(2020).
8. W.Liang et al.,Development and Validation of a Clinical Risk Score to Predict the Occurrence of Critical Illness in Hospitalized Patients With COVID-19.JAMA Intern Med,(2020).
9. P.Mehta et al.,COVID-19:consider cytokine storm syndromes and immunosuppression.Lancet 395,1033-1034(2020).
10. G.Monteleone,P.C.Sarzi-Puttini,S.Ardizzone,Preventing COVID-19-induced pneumonia with anticytokine therapy.Lancet Rheumatol 2,e255-e256(2020).
11. X.Xu et al.,Effective treatment of severe COVID-19 patients with tocilizumab.Proc Natl Acad Sci USA,(2020).
12. F.Wang et al.,The laboratory tests and host immunity of COVID-19 patients with different severity of illness.JCI Insight,(2020).
13. X.Zhang et al.,Viral and host factors related to the clinical outcome of COVID-19.Nature,(2020).
14. L.Wynants et al.,Prediction models for diagnosis and prognosis of covid-19 infection:systematic review and critical appraisal.BMJ 369,m1328(2020).
15. T.E.Sweeney,A.Shidham,H.R.Wong,P.Khatri,A comprehensive time-course-based multicohort analysis of sepsis and sterile inflammation reveals a robust diagnostic gene set.Sci Transl Med 7,287ra271(2015).
16. M.Andres-Terre et al.,Integrated,Multi-cohort Analysis Identifies Conserved Transcriptional Signatures across Multiple Respiratory Viruses.Immunity 43,1199-1211(2015).
17. T.E.Sweeney,H.R.Wong,P.Khatri,Robust classification of bacterial and viral infections via integrated host gene expression diagnostics.Sci Transl Med 8,346ra391(2016).
18. T.E.Sweeney et al.,A community approach to mortality prediction in sepsis via gene expression analysis.Nat Commun 9,694(2018).
19. M.B.Mayhew et al.,A generalizable 29-mRNA neural-network classifier for acute bacterial and viral infections.Nat Commun 11,1177(2020).
20. H.Zheng et al.,Multi-cohort analysis of host immune response identifies conserved protective and detrimental modules associated with severity irrespective of virus.medRxiv,2020.
21. M.B.Mayhew et al.,Optimization of genomic classifiers for clinical deployment:evaluation of Bayesian optimization for identification of predictive models of acute infection and in-hospital mortality.ArXiv,2003.12310(2020).
22. D.Krstajic,L.J Buturovic,D.E.Leahy,S.Thomas,Cross-validation pitfalls when selecting and assessing regression and classification models.J Cheminform 6,10(2014).
23. C.Ambroise,G.J.McLachlan,Selection bias in gene extraction on the basis of microarray gene-expression data.Proc Natl Acad Sci USA 99,6562-6566(2002).
24. R.Almansa et al.,Critical COPD respiratory illness is linked to increased transcriptomic activity of neutrophil proteases genes.BMC Res Notes 5,401(2012).
25. R.Almansa et al.,Transcriptomic correlates of organ failure extent in sepsis.J Infect 70,445-456(2015).
26. C.A.van de Weg et al.,Time since onset of disease and individual clinical markers associate with transcriptional changes in uncomplicated dengue.PLoS Negl Trop Dis 9,e0003522(2015).
27. R.Pankla et al.,Genomic transcriptional profiling identifies a candidate blood biomarker signature for the diagnosis of septicemic melioidosis.Genome Biol 10,R127(2009).
28. J.F.Bermejo-Martin et al.,Host adaptive immunity deficiency in severe pandemic influenza.Crit Care 14,R167(2010).
29. M.P.Berry et al.,An interferon-inducible neutrophil-driven blood transcriptional signature in human tuberculosis.Nature 466,973-977(2010).
30. J.E.Berdal et al.,Excessive innate immune response and mutant D222G/N in severe A(H1N1)pandemic influenza.J Infect 63,308-316(2011).
31. T.Dolinay et al.,Inflammasome-regulated cytokines are critical mediators of acute lung injury.Am J Respir Crit Care Med 185,1225-1234(2012).
32. G.P.Parnell et al.,A distinct influenza infection signature in the blood transcriptome of patients with severe community-acquired pneumonia.Crit Care 16,R157(2012).
33. G.P.Parnell et al.,Identifying key regulatory genes in the whole blood of septic patients to monitor underlying immune dysfunctions. Shock 40,166-174(2013).
34. M.Kwissa et al.,Dengue virus infection induces expansion of a CD14(+)CD16(+)monocyte population that stimulates plasmablast differentiation.Cell Host Microbe 16,115-127(2014).
35. N.M.Suarez et al.,Superiority of transcriptional profiling over procalcitonin for distinguishing bacterial from viral lower respiratory tract infections in hospitalized adults.J Infect Dis 212,213-222(2015).
36. B.P.Scicluna et al.,A molecular biomarker to diagnose community-acquired pneumonia on intensive care unit admission.Am J Respir Crit Care Med 192,826-835(2015).
37. Y.Zhai et al.,Host Transcriptional Response to Influenza and Other Acute Respiratory Viral Infections--A Prospective Cohort Study.PLoS Pathog 11,e1004869(2015).
38. B.M.Tang et al.,A novel immune biomarker.Eur Respir J 49,(2017).
39. F.Venet et al.,Modulation of LILRB2 protein and mRNA expressions in septic shock patients and after ex vivo lipopolysaccharide stimulation.Hum Immunol 78,441-450(2017).
40. T.E.Sweeney,W.A.Haynes,F.Vallania,J.P.Ioannidis,P.Khatri,Methods to increase reproducibility in differential gene expression via meta-analysis.Nucleic Acids Res(2016).
41. W.A.Haynes et al.,Empowering Multi-Cohort Gene Expression Analysis to Increase Reproducibility.Pac Symp Biocomput 22,144-153(2017).
42. F.Vallania et al.,Leveraging heterogeneity across multiple datasets increases cell-mixture deconvolution accuracy and reduces biological and technical biases.Nat Commun 9,1-8(2018).
43. M.Robinson et al.,A 20-Gene Set Predictive of Progression to Severe Dengue.Cell Rep 26,1104-1111.e1104(2019).
44. L.Fagerberg et al.,Analysis of the human tissue-specific expression by genome-wide integration of transcriptomics and antibody-based proteomics. Mol Cell Proteomics 13,397-406(2014).
【0182】
特定の実施形態の特定の詳細は、本開示の実施形態の精神及び範囲から逸脱することなく、任意の適切な方法で組み合わせることができる。しかしながら、本開示の他の実施形態は、個々の態様のそれぞれ、又はこれらの個々の態様の特定の組み合わせに関する特定の実施形態を対象とすることができる。
【0183】
本開示の例示的な実施形態の上記の説明は、例示及び説明の目的で提示されたものである。網羅的であること、又は開示を記述された詳細な形式に限定することは意図されておらず、上記の教示に照らして多くの修正及び変形が可能である。
【0184】
「1(つ)(a)」、「1(つ)(an)」、又は「前記(the)」の引用は、特に反対の指示がない限り、「1又は複数」を意味することを意図している。「又は」の使用は、特に反対の指示がない限り、「排他的又は」ではなく、「包括的又は」を意味することを意図している。「第1」の構成要素への言及は、必ずしも第2の構成要素が提供されることを必要としない。さらに、「第1(の)」又は「第2(の)」構成要素への言及は、明示的に述べられていない限り、言及された構成要素を特定の位置に限定しない。「基づく(based on)」という用語は、「少なくとも部分的に基づく」を意味することを意図している。
【0185】
本明細書で言及される全ての特許、特許出願、刊行物、及び説明は、全ての目的のために参照によりその全体が援用される。いずれも先行技術であると認められない。本出願と本明細書で提供される参考文献との間に矛盾が存在する場合、本出願が優先するものとする。
【0186】
置換基の群が本明細書で開示される場合、それらの群の全ての個々の要素、並びに置換基を使用して形成され得る全ての部分群及びクラスが別々に開示されることが理解される。マーカッシュ群又は他の群が本明細書で使用される場合、群の全ての個々の要素、並びに群の可能な全ての組み合わせ及び部分的組み合わせが、開示に個別に含まれることが意図される。本明細書で使用される「及び/又は」は、「及び/又は」で区切られたリスト内の項目の1つ、全て、又は任意の組み合わせがリストに含まれることを意味する。例えば、「1、2、及び/又は3」は、「『1』、又は『2』、又は『3』『1及び2』、又は『1及び3』、又は『2及び3』、又は『1、2、及び3』」と等しい。本明細書で範囲、例えば、温度範囲、時間範囲、又は組成範囲が示されている場合は常に、全ての中間範囲及び部分的範囲、並びに与えられた範囲に含まれる全ての個々の値は、開示に含まれることが意図されている。
図1
図2-1】
図2-2】
図3-1】
図3-2】
図4
図5
図6
図7
図8
図9-1】
図9-2】
図10
図11-1】
図11-2】
図12-1】
図12-2】
図13-1】
図13-2】
図14
図15
図16
図17
【国際調査報告】