(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-06-10
(54)【発明の名称】細菌感染対ウイルス感染の診断のためのシグネチャ
(51)【国際特許分類】
C12Q 1/686 20180101AFI20220603BHJP
C12Q 1/6883 20180101ALI20220603BHJP
A61K 45/00 20060101ALI20220603BHJP
A61P 31/04 20060101ALI20220603BHJP
A61P 31/12 20060101ALI20220603BHJP
C12Q 1/6851 20180101ALN20220603BHJP
C12N 15/113 20100101ALN20220603BHJP
【FI】
C12Q1/686 Z
C12Q1/6883 Z
A61K45/00
A61P31/04
A61P31/12
C12Q1/6851 Z
C12N15/113 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021557068
(86)(22)【出願日】2020-02-14
(85)【翻訳文提出日】2021-11-18
(86)【国際出願番号】 US2020018414
(87)【国際公開番号】W WO2020197659
(87)【国際公開日】2020-10-01
(32)【優先日】2019-03-25
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】503115205
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(71)【出願人】
【識別番号】502310254
【氏名又は名称】アメリカ合衆国
【氏名又は名称原語表記】The United States of America
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100126354
【氏名又は名称】藤田 尚
(72)【発明者】
【氏名】カトリ,パーヴェッシュ
(72)【発明者】
【氏名】ラオ,アディティヤ マノハール
(72)【発明者】
【氏名】レルマン,デイビッド エー.
(72)【発明者】
【氏名】ポッパー,スティーブン
(72)【発明者】
【氏名】スウィーニー,ティモシー イー.
【テーマコード(参考)】
4B063
4C084
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ03
4B063QQ08
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR62
4B063QS24
4B063QS25
4B063QS34
4B063QX02
4C084AA17
4C084NA05
4C084ZB331
4C084ZB332
4C084ZB351
4C084ZB352
(57)【要約】
本開示は、対象がウイルス感染又は細菌感染を有するかどうかを判定するための遺伝子発現に基づく方法を提供する。本方法を実施するためのキットも提供される。
【特許請求の範囲】
【請求項1】
試料を分析する方法であって、
(a)対象からRNAの試料を得る工程と、
(b)前記試料中のJUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1、及びEBI3によってコードされるRNA転写物の量を測定して、遺伝子発現データを生成する工程と、を含む、方法。
【請求項2】
前記測定工程が、RT-PCRによって行われる、請求項1に記載の方法。
【請求項3】
前記測定工程が、定量的等温増幅法を使用して行われる、請求項1に記載の方法。
【請求項4】
前記測定工程が、配列決定によって行われる、請求項1に記載の方法。
【請求項5】
前記測定工程が、前記RNA又は前記RNAから調製されたcDNAを標識し、前記標識されたRNA又はcDNAを支持体にハイブリダイズさせることによって行われる、請求項1に記載の方法。
【請求項6】
前記試料が、全血、白血球、好中球、末梢血単核球(PBMC)、又はバフィーコートから単離されたRNAを含む、請求項1から5のいずれか一項に記載の方法。
【請求項7】
(c)前記遺伝子発現データに基づいて、前記対象がウイルス感染を有するか細菌感染を有するかを示す報告を提供する工程であって、
(i)JUP、SUCLG2、IFI27、FCER1A、HESX1発現の増加は、前記対象がウイルス感染を有することを示し、
(ii)SMARCD3、ICAM1、EBI3の増加は、前記対象が細菌感染を有することを示す工程を更に含む、請求項1から6のいずれか一項に記載の方法。
【請求項8】
対象を治療する方法であって、
(a)前記対象がウイルス感染を有するか細菌感染を有するかを示す報告を受け取る工程であって、前記報告が、JUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1、及びEBI3によってコードされるRNA転写物の量を測定することによって得られた遺伝子発現データに基づく、工程と、
(b)JUP、SUCLG2、IFI27、及びFCER1A、並びにHESX1発現が増加したとして前記患者を同定する工程と、
前記対象を抗ウイルス療法で治療する工程、又は
(c)SMARCD3、ICAM1、EBI3の発現が増加したとして前記患者を同定する工程と、
前記対象を抗菌療法で治療する工程と、を含む、方法。
【請求項9】
工程(b)が、抗ウイルス剤を前記対象に投与するステップを含む、請求項8に記載の方法。
【請求項10】
工程(c)が、抗生物質を前記対象に投与するステップを含む、請求項8に記載の方法。
【請求項11】
JUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1及びEBI3によってコードされる前記RNA転写物の量を測定する試薬を含むキット。
【請求項12】
前記試薬が、各RNA転写物について、前記転写物にハイブリダイズする配列特異的オリゴヌクレオチドを含む、請求項11に記載のキット。
【請求項13】
配列特異的オリゴヌクレオチドがビオチン化され、及び/又は光学的に検出可能な部分で標識されている、請求項12に記載のキット。
【請求項14】
前記試薬が、各RNA転写物について、前記RNA転写物からの配列又は前記RNA転写物から調製されたcDNAを増幅する一対のPCRプライマーを含む、請求項11に記載のキット。
【請求項15】
前記試薬が、複数の反応容器を含み、それぞれが、前記転写物又は前記転写物から調製されたcDNAにハイブリダイズする少なくとも1つの配列特異的等温増幅プライマーを含む、請求項11に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2019年3月25日に出願された米国特許仮出願第62/823,460号の利益を主張し、全ての目的のためにその全体が参照により本明細書に組み込まれる。
【0002】
連邦政府による資金提供を受けた研究開発の記載
本発明は、国立衛生研究所によって授与された契約AI057229及びAI109662の下で政府の支援を受けてなされた。政府は、本発明に一定の権利を有する。
【背景技術】
【0003】
感染症の早期かつ正確な診断は、患者の転帰を改善し、抗生物質耐性を低減するための鍵である。細菌性敗血症の死亡率は、抗生物質が遅れる1時間毎に8%増加するが、細菌感染のない患者に抗生物質を投与すると、罹患率及び抗菌剤耐性が増加する。病院環境における不適切な抗生物質処方の割合は30~50%と推定され、改善された診断法によって支援される。驚くべきことに、疑わしい腸熱のために抗生物質を投与された患者の95%近くが培養陰性である。現在、感染症の存在及びタイプを広く決定することができるゴールドスタンダードポイントオブケア診断は存在しない。したがって、ホワイトハウスは、「細菌感染とウイルス感染とを迅速に区別する必要時点診断試験」を必要とする、薬剤耐性菌攻略国家活動計画を策定した。
【0004】
PCRに基づく分子診断は、血液培養物から直接病原体をプロファイリングすることができるが、そのような方法は、血液中の適切な数の病原体の存在に依存する。更に、それらは、別個の範囲の病原体を検出することに限定される。結果として、宿主遺伝子応答をプロファイリングする分子診断への関心が高まっている。これらには、炎症を起こしているが感染していない患者と比較して感染の存在を区別することができる診断が含まれる。全体として、この分野では大きな有望性が示されているが、宿主遺伝子発現感染診断はまだ臨床診療には至っていない。
【0005】
細菌感染とウイルス感染とを区別することができる高感度かつ特異的な診断検査が依然として必要とされている。
【発明の概要】
【0006】
JUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1、及びEBI3の8つの遺伝子の発現に基づいて、患者をウイルス感染又は細菌感染を有すると分類することができる。JUP、SUCLG2、IFI27、FCER1A、HESX1発現の増加は、対象がウイルス感染を有することを示し、SMARCD3、ICAM1、EBI3の増加は、対象が細菌感染を有することを示す。
【0007】
いくつかの実施形態では、試料を分析する方法が提供される。この方法は、(a)対象からRNAの試料を得る工程、(b)試料中のJUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1及びEBI3によってコードされるRNA転写物の量を測定して、遺伝子発現データを生成する工程を含むことができる。この方法は、遺伝子発現データに基づいて、対象がウイルス感染を有するか細菌感染を有するかを示す報告を提供することを更に含むことができ、(i)JUP、SUCLG2、IFI27、FCER1A、HESX1発現の増加は、対象がウイルス感染を有することを示し、(ii)SMARCD3、ICAM1、EBI3の増加は、対象が細菌感染を有することを示す。
【0008】
いくつかの実施形態では、治療方法が提供される。これらの実施形態では、方法は、(a)対象がウイルス感染又は細菌感染を有するかどうかを示す報告を受け取ることであり、この報告が、JUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1、及びEBI3によってコードされるRNA転写物の量を測定することによって得られた遺伝子発現データに基づく工程、並びに(b)JUP、SUCLG2、IFI27、及びFCER1A、並びにHESX1発現が増加したとして患者を同定し、対象を抗ウイルス療法で治療する工程、又は(c)SMARCD3、ICAM1、EBI3の発現が増加したとして患者を同定し、対象を抗菌療法で治療する工程を含み得る。
本方法を実施するためのキットも提供される。
【0009】
本発明は、添付の図面と併せて読めば、以下の詳細な説明から最もよく理解される。一般的な慣行によれば、図面の様々な特徴は縮尺通りではないことが強調される。反対に、様々な特徴の寸法は、明確にするために任意に拡大又は縮小される。図面には以下の図が含まれる。
【図面の簡単な説明】
【0010】
【0011】
【
図2】発見及び保持検証データにおいてウイルス感染を細胞内及び細胞外細菌感染から高精度に区別する8遺伝子シグネチャを示す。
【0012】
【
図3】独立した全血データセットにおいてウイルス感染を細胞内及び細胞外細菌感染から高精度で区別する8遺伝子シグネチャを示す。
【0013】
【
図4】独立したPBMCデータセットにおいてウイルス感染を細胞内及び細胞外細菌感染から高精度で区別する8遺伝子シグネチャを示す。
【0014】
【
図5】ネパールにおける細菌又はウイルス感染を有する患者の前向きに(prospectively)登録されたコホート(cohort)において、ウイルス感染を細胞内及び細胞外細菌感染と高精度で区別する8遺伝子シグネチャを示す。
【発明を実施するための形態】
【0015】
本発明の実施は、特に明記しない限り、当分野の技術の範囲内で、薬理学、化学、生化学、組換えDNA技術及び免疫学の従来の方法を使用する。そのような技術は文献で十分に説明されている。例えば、Handbook of Experimental Immunology、I~IV巻(D.M.Weir及びC.C.Blackwell編、Blackwell Scientific Publications社)、A.L.Lehninger、Biochemistry(Worth Publishers社、現行版)、Sambrookら、Molecular Cloning:A Laboratory Manual(第2版、1989)、Methods In Enzymology(S.Colowick及びN.Kaplan編、Academic Press社)を参照されたい。
【0016】
本明細書で引用される全ての刊行物、特許及び特許出願は、上記又は下記にかかわらず、その全体が参照により本明細書に組み込まれる。
【0017】
値の範囲が提供される場合、その範囲の上限と下限との間に、文脈上明確に指示されない限り、下限の単位の10分の1までの各介在値も具体的に開示されることが理解される。記載された範囲内の任意の記載された値又は介在する値と、その記載された範囲内の任意の他の記載された値又は介在する値との間のより小さい各範囲は、本発明に包含される。これらのより小さい範囲の上限及び下限は、独立して範囲に含まれてもよく、又は除外されてもよく、いずれかの、どちらでもない、又は両方の限界がより小さい範囲に含まれる各範囲もまた、記載された範囲内の任意の具体的に除外された限界を条件として、本発明に包含される。記載された範囲が限界の一方又は両方を含む場合、それらの含まれる限界の一方又は両方を除外した範囲も本発明に含まれる。
【0018】
他に定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載の方法及び材料と類似又は同等の任意の方法及び材料を本発明の実施又は試験に使用することができるが、いくつかの可能性のある好ましい方法及び材料をここで説明する。本明細書で言及される全ての刊行物は、刊行物が引用される関連する方法及び/又は材料を開示及び説明するために参照により本明細書に組み込まれる。本開示は、矛盾が存在する限り、組み込まれた刊行物の任意の開示を上回ることが理解される。
【0019】
本開示を読めば当業者には明らかなように、本明細書に記載及び図示された個々の実施形態の各々は、本発明の範囲又は精神から逸脱することなく、他のいくつかの実施形態のいずれかの特徴から容易に分離又は組み合わせられ得る個別の構成要素及び特徴を有する。列挙された任意の方法は、列挙された事象の順序で、又は論理的に可能な任意の他の順序で実行することができる。
【0020】
本明細書及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」及び「the」は、内容が明らかにそうでないことを指示しない限り、複数の指示対象を含むことに留意されたい。したがって、例えば、「アゴニスト」への言及は、2つ以上のそのようなアゴニストの混合物などを含む。
【0021】
本明細書で論じられる刊行物は、本出願の出願日前のそれらの開示のためにのみ提供される。本明細書中のいかなるものも、本発明が先行発明によってそのような刊行物に先行する権利がないことの承認として解釈されるべきではない。更に、提供された公開日は、独立して確認する必要があり得る実際の公開日とは異なる場合がある。
【0022】
上述のように、試料を分析する方法が提供される。いくつかの実施形態では、方法は、(a)対象からRNAの試料を得る工程、(b)試料中のJUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1及びEBI3によってコードされるRNA転写物の量を測定して、遺伝子発現データを生成する工程を含む。方法は、以下に記載されるように、様々な診断方法及び治療方法において使用することができる。
【0023】
診断方法
上記のように、方法は、対象がウイルス感染又は細菌感染を有するかどうかを判定するために使用することができる。いくつかの実施形態では、本方法は、(a)対象からRNAの試料を得る工程、(b)試料中のJUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1及びEBI3によってコードされるRNA転写物の量を測定して遺伝子発現データを生成する工程、並びに(c)対象がウイルス感染又は細菌感染を有するかどうかを示す報告を提供する工程を含むことができ、(i)JUP、SUCLG2、IFI27、FCER1A、HESX1発現の増加は、対象がウイルス感染を有することを示し、(ii)SMARCD3、ICAM1、EBI3の増加は、対象が細菌感染を有することを示す。
【0024】
測定工程は、任意の適切な方法を使用して行うことができる。例えば、試料中のRNA転写物の量は、RNA-seq(例えば、Morin et al BioTechniques 2008 45:81-94;Wang et al 2009 Nature Reviews Genetics 10:57-63を参照されたい)、RT-PCR(Freeman et al BioTechniques 1999 26:112-22,124-5)、あるいはRNA又はそれから調製されたcDNAを標識し、標識されたRNA又はcDNAをアレイにハイブリダイズさせることによって測定することができる。アレイは、測定される転写物又はそれから調製されるcDNAに特異的にハイブリダイズする、空間的にアドレス可能又は光学的にアドレス可能な配列特異的オリゴヌクレオチドプローブを含むことができる。空間的にアドレス可能なアレイ(当分野では一般に「マイクロアレイ」と呼ばれる)は、例えばSealfonら(例えば、Methods Mol Biol.2011;671:3-34を参照されたい)に記載されている。光学的にアドレス可能なアレイ(当分野では一般に「ビーズアレイ」と呼ばれる)は、ビーズが互いに区別できるように異なる色、強度及び/又は比のフルオロフォアで内部染色されたビーズを使用し、ビーズはオリゴヌクレオチドプローブにも結合している。例示的なビーズベースのアッセイは、Dupontら(J.Reprod Immunol.2005 66:175-91)及びKhalifianら(J Invest Dermatol.2015 135:1-5)に記載されている。試料中の転写物の存在量は、例えば、Gaoら(J.Virol Methods.2018 255:71-75)、Peaseら(Biomed Microdevices(2018)20:56)又はNixonら(Biomol.Det.and Quant 2014 2:4-10)に記載されているような定量的RT-PCR又は等温増幅法によって分析することもできる。試料中のRNA転写物の量を測定するための多くの他の方法が当分野で公知である。
【0025】
対象から得られたRNAの試料は、例えば、全血、白血球、末梢血単核球(PBMC)、好中球又はバフィーコートから単離されたRNAを含むことができる。全RNA、ポリA+RNA、豊富な転写物が枯渇したRNA、及び測定される転写物が豊富なRNAを調製する方法は周知である(例えば、Hitchen et al J Biomol Tech.2013 24:S43-S44を参照されたい)。方法がRNAからcDNAを調製することを含む場合、cDNAは、オリゴ(d)Tプライマー、ランダムプライマー又は分析される転写物にハイブリダイズする遺伝子特異的プライマーの集団を使用して調製することができる。
【0026】
転写物を測定する際、各転写物の絶対量を決定することができ、又は1つ又はそれ以上の対照転写物に対する各転写物の量を決定することができる。転写物の量が増加するか減少するかは、対照試料(例えば、ウイルス感染及び/又は細菌感染を有することが知られている又は知られていない少なくとも100、少なくとも200、又は少なくとも500人の対象の集団から採取された血液試料)中の転写物の量(例えば、転写物の平均量)に関連し得る。
【0027】
いくつかの実施形態では、方法は、転写物の量の測定値に基づいて、対象がウイルス感染を有するか細菌感染を有するかを示す報告を提供することを含むことができる。いくつかの実施形態では、この工程は、転写物のそれぞれの加重量に基づいてスコアを計算することを含むことができ、スコアは表現型と相関し、例えば、確率、尤度又は10点満点でのスコアなどの数であってもよい。これらの実施形態では、方法は、転写物のそれぞれの量を1つ又はそれ以上のアルゴリズムに入力する工程、アルゴリズムを実行する工程、及び計算に基づいて各表現型のスコアを受け取る工程を含むことができる。これらの実施形態では、対象からの他の測定値、例えば、対象が男性であるかどうか、対象の年齢、白血球数、好中球数、バンド数、リンパ球数、単球数、対象が免疫抑制されているかどうか、及び/又はグラム陰性菌が存在するかどうかなどを、アルゴリズムに入力することができる。
【0028】
いくつかの実施形態では、方法は、例えば、電子形式で報告を作成する工程、及び医師又は他の医療専門家にレポートを転送して、適切な一連の行動を特定する工程、例えば、対象の適切な治療法を特定する工程に役立つことを含み得る。報告は、対象がウイルスまたは細菌の感染を有するかどうかを判定するための診断として他の測定基準と共に使用することができる。
【0029】
任意の実施形態では、報告は「遠隔地」に転送することができ、「遠隔地」とは、画像が検査される場所以外の場所を意味する。例えば、遠隔地は、同じ都市内の別の場所(例えば、オフィス、研究室など)、異なる都市内の別の場所、異なる州内の別の場所、異なる国内の別の場所などであってもよい。したがって、あるアイテムが別のアイテムから「遠隔」であると示されるとき、意味されるのは、2つのアイテムが同じ部屋にあるが分離されているか、又は少なくとも異なる部屋若しくは異なる建物にあることが可能であり、少なくとも1マイル、10マイル、又は少なくとも100マイル離れていることが可能であることである。「通信」情報は、その情報を表すデータを適切な通信チャネル(例えば、プライベートネットワーク又はパブリックネットワーク)を介して電気信号として送信することを指す。アイテムの「転送」とは、アイテムをある場所から次の場所へ物理的に輸送するかどうかにかかわらず(それが可能な場合)、そのアイテムを入手するためのあらゆる手段を指し、少なくともデータの場合、データを搬送する媒体を物理的に搬送すること、又はデータを通信することを含む。通信媒体の例としては、無線又は赤外線送信チャネル、並びに別のコンピュータ又はネットワークデバイスへのネットワーク接続、及びインターネット、又は電子メール送信及びウェブサイトに記録された情報などが挙げられる。特定の実施形態では、報告は、MD又は他の資格のある医療専門家によって分析することができ、画像の分析結果に基づく報告は、試料が得られた対象に転送することができる。
【0030】
コンピュータ関連の実施形態では、システムは、プロセッサ、ストレージコンポーネント(すなわち、メモリ)、ディスプレイコンポーネント、及び一般的に汎用コンピュータに存在する他のコンポーネントを含むコンピュータを含むことができる。ストレージコンポーネントは、プロセッサによって実行することができる命令、及びプロセッサによって取得、操作又は保存することができるデータを含む、プロセッサによってアクセス可能な情報を記憶する。
【0031】
ストレージコンポーネントは、上記の測定値を入力として使用して、対象がウイルス感染又は細菌感染を有するかどうかを判定するための命令を含む。コンピュータプロセッサは、ストレージコンポーネントに結合され、患者データを受信し、1つ又はそれ以上のアルゴリズムに従って患者データを分析するために、ストレージコンポーネントに記憶された命令を実行するように構成される。ディスプレイコンポーネントは、患者の診断に関する情報を表示することができる。
【0032】
ストレージコンポーネントは、ハードドライブ、メモリカード、ROM、RAM、DVD、CD-ROM、USBフラッシュドライブ、書き込み可能メモリ、及び読み出し専用メモリなど、プロセッサによってアクセス可能な情報を記憶することができる任意のタイプのものであってもよい。プロセッサは、Intel Corporationのプロセッサなどの任意の周知のプロセッサであってもよい。あるいは、プロセッサは、ASICなどの専用コントローラであってもよい。
【0033】
命令は、プロセッサによって直接的に(マシンコードなど)又は間接的に(スクリプトなど)実行される任意の命令セットであってもよい。その点に関して、「命令」、「ステップ」、及び「プログラム」という用語は、本明細書では互換的に使用され得る。命令は、プロセッサによる直接処理のためのオブジェクトコード形式で、又はオンデマンドで解釈されるか又は事前にコンパイルされる独立したソースコードモジュールのスクリプト又は集合を含む任意の他のコンピュータ言語で記憶されてもよい。
【0034】
データは、命令に従ってプロセッサによって取得、保存、又は修正することができる。例えば、診断システムは、いかなる特定のデータ構造によっても限定されないが、データは、コンピュータレジスタ、複数の異なるフィールド及びレコードを有するテーブルとしてのリレーショナルデータベース、XML文書、又はフラットファイルに記憶することができる。データはまた、バイナリ値、ASCII又はユニコードなどであるが、これらに限定されない任意のコンピュータ可読フォーマットでフォーマットすることができる。更に、データは、数字、説明テキスト、専有コード、ポインタ、他のメモリ(他のネットワーク位置を含む)に保存されたデータへの参照、又は関連データを計算するために関数によって使用される情報など、関連情報を識別するのに十分な任意の情報を含むことができる。
【0035】
治療方法
治療方法も提供される。いくつかの実施形態では、これらの方法は、上記の方法を使用してウイルス感染又は細菌感染を有する対象を同定する工程、及び対象がウイルス感染又は細菌感染を有すると示されるかどうかに基づいて対象を治療する工程を含むことができる。いくつかの実施形態では、この方法は、対象がウイルス感染又は細菌感染を有するかどうかを示す報告を受け取る工程であって、報告が、JUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1、及びEBI3によってコードされるRNA転写物の量を測定することによって得られた遺伝子発現データに基づく工程、及び対象がウイルス感染又は細菌感染を有すると示されるかどうかに基づいて対象を治療する工程を含むことができる。いくつかの実施形態では、本方法は、(a)JUP、SUCLG2、IFI27、及びFCER1A、並びにHESX1の発現が増加したとして患者を同定する工程、並びに抗ウイルス療法で対象を治療する工程、又は(b)SMARCD3、ICAM1、EBI3の発現が増加しているとして患者を同定する工程、及び対象を抗菌療法で治療する工程を含むことができる。
【0036】
ウイルス感染を有すると示される対象は、治療有効用量の抗ウイルス剤、例えば広域抗ウイルス剤、抗ウイルスワクチン、ノイラミニダーゼ阻害剤(例えば、ザナミビル(リレンザ)及びオセルタミビル(タミフル))、ヌクレオシド類似体(例えば、アシクロビル、ジドブジン(AZT)及びラミブジン)、アンチセンス抗ウイルス剤(例えば、ホスホロチオエートアンチセンス抗ウイルス剤(例えば、サイトメガロウイルス網膜炎のためのフォミビルセン(Vitravene))、モルホリノアンチセンス抗ウイルス剤)、ウイルス脱コーティング阻害剤(例えば、インフルエンザのためのアマンタジン及びリマンタジン、ライノウイルスのためのプレコナリル)、ウイルス侵入阻害剤(例えば、HIVのフゼオン)、ウイルス集合阻害剤(例えば、リファンピシン)、又は免疫系を刺激する抗ウイルス剤(例えば、インターフェロン)を投与することによって治療することができる。例示的な抗ウイルス剤としては、アバカビル、アシクロビル(Aciclovir)、アシクロビル(Acyclovir)、アデフォビル、アマンタジン、アンプレナビル、アンプリゲン、アルビドール、アタザナビル、アトリプラ(固定用量薬物)、バラビル、シドフォビル、コンビビル(固定用量薬物)、ドルテグラビル、ダルナビル、デラビルジン、ジダノシン、ドコサノール、エドクスジン、エファビレンツ、エムトリシタビン、エンフビルチド、エンテカビル、エコリエベル、ファムシクロビル固定用量の組み合わせ(抗レトロウイルス)、フォミビルセン、ホサンプレナビル、ホスカルネット、ホスホネット、融合阻害剤、ガンシクロビル、イバシタビン、イムノビル、イドクスウリジン、イミキモド、インジナビル、イノシン、インテグラーゼ阻害剤、III型インターフェロン、II型インターフェロン、I型インターフェロン、インターフェロン、ラミブジン、ロピナビル、ロビリド、マラビロック、モロキシジン、メチサゾン、ネルフィナビル、ネビラピン、ネキサビル、ニタゾキサニド、ヌクレオシド類似体、ノビル、オセルタミビル(タミフル)、ペグインターフェロンアルファ-2a、ペンシクロビル、ペラミビル、プレコナリル、ポドフィロトキシン、プロテアーゼ阻害剤、ラルテグラビル、逆転写酵素阻害剤、リバビリン、リマンタジン、リトナビル、ピラミジン、サキナビル、ソフォスブビル、スタブジン、相乗的エンハンサー(抗レトロウイルス)、テラプレビル、テノホビル、テノホビルジソプロキシル、ティプラナビル、トリフルリジン、トリジビル、トロマンタジン、トルバダ、バラシクロビル(バルトレックス)、バルガンシクロビル、ビクリビロク、ビダラビン、ビラミジン、ザルシタビン、ザナミビル(リレンザ)、及びジドブジンが挙げられる。
【0037】
細菌感染を有すると示された対象は、治療有効用量の抗生物質を投与することによって治療することができる。抗生物質は、広域抗生物質、殺菌性抗生物質又は静菌性抗生物質を含むことができる。例示的な抗生物質としては、アミノグリコシド、例えば、アミカシン、アミキン、ゲンタマイシン、ガラマイシン、カナマイシン、カントレックス、ネオマイシン、ネオフラジン、ネチルマイシン、ネトロマイシン、トブラマイシン、ネブシン、パロモマイシン、フマチン、ストレプトマイシン、スペクチノマイシン(Bs)、及びトロビシン;アンサマイシン、例えば、ゲルダナマイシン、ハービマイシン、リファキシミン、及びキシファキサン;カルバセフェム、例えば、ロラカルベフ及びロラビッド;カルバペネム、例えば、エルタペネム、インバンツ、ドリペネム、ドリバックス、イミペネム/シラスタチン、プリマキシン、メロペネム、及びメレム;セファロスポリン、例えば、セファドロキシル、デュリセフ、セファゾリン、アンセフ、セファロチン(Cefalotin)又はセファロチン(Cefalothin)、ケフリン、セファレキシン、ケフレックス、セファクロル、ディスタクロル、セファマンドール、マンドル、セフォキシチン、メフォキシン、セフプロジル、セフジル、セフロキシム、セフチン、ジンナット、セフィキシム、セフジニル、セフジトレン、セフォペラゾン、セフォタキシム、セフポドキシム、セフタジジム、セフチブテン、セフチゾキシム、セフトリアキソン、セフェピム、マキシピム、セフタロリンフォサミル、テフラロ、セフトビプロール、及びゼフテラ;糖ペプチド、例えば、テイコプラニン、タルゴシド、バンコマイシン、バンコシン、テラバンシン、ビバチブ、ダルババンシン、ダルバンス、オリタバンシン、及びオルバクチブ;リンコサミド、例えば、クリンダマイシン、クレオシン、リンコマイシン、及びリンコシン;リポペプチド、例えば、ダプトマイシン及びキュービシン;マクロライド、例えば、アジスロマイシン、ジスロマックス、スマメド、キシトロン、クラリスロマイシン、ビアキシン、ジリスロマイシン、ダイナバック、エリスロマイシン、エリトシン、エリスロップド、ロキシスロマイシン、トロレアンドマイシン、タオ、テリスロマイシン、ケテック、スピラマイシン、及びロバマイシン;モノバクタム、例えば、アズトレオナム及びアザクタム;ニトロフラン、例えば、フラゾリドン、フロキソン、ニトロフラントイン、マクロダンチン、及びマクロビッド;オキサゾリジノン、例えば、リネゾリド、ザイボックス、VRSA、ポジゾリド、ラデゾリド、及びトレゾリド;ペニシリン、例えば、ペニシリンV、Veetids(Pen-Vee-K)、ピペラシリン、ピプラシル、ペニシリンG、ファイザーペン、テモシリン、ネガバン、チカルシリン、及びチカール;ペニシリンの組み合わせ、例えば、アモキシシリン/クラブラン酸、オーグメンチン、アンピシリン/スルバクタム、ウナシン、ピペラシリン/タゾバクタム、ゾシン、チカルシリン/クラブラン酸、及びチメンチ;ポリペプチド、例えば、バシトラシン、コリスチン、コリマイシン-S、及びポリミキシンB;キノロン/フルオロキノロン、例えば、シプロフロキサシン、シプロ、シプロキシン、シプロベイ、エノキサシン、ペネトレックス、ガチフロキサシン、テキン、ジェミフロキサシン、ファクティブ、レボフロキサシン、レバキン、ロメフロキサシン、マキサキン、モキシフロキサシン、アベロックス、ナリジキシン酸、ネグラム、ノルフロキサシン、ノロキシン、オフロキサシン、フロキシン、オクフロクス、トロバフロキサシン、トロバン、グレパフロキサシン、ラクサル、スパルフロキサシン、ザガム、テマフロキサシン、及びオムニフロクス;スルホンアミド、例えば、アモキシシリン、ノバモックス、アモキシル、アンピシリン、プリンシペン、アズロシリン、カルベニシリン、ジオシリン、クロキサシリン、テゴペン、ジクロキサシリン、ダイナペン、フルクロキサシリン、フロキサペン、メズロシリン、メズリン、メチシリン、スタフシリン、ナフシリン、ユニペン、オキサシリン、プロスタフリン、ペニシリンG、ペンチド、マフェニド、スルファミロン、スルファセタミド、スラミド、ブレフ-10、スルファジアジン、マイクロスルホン、スルファジアジン銀、シルバデン、スルファジメトキシンジメトックス、アルボン、スルファメチゾール、チオスルフィルフォルテ、スルファメトキサゾール、ガンタノール、スルファニルイミド、スルファサラジン、アザルフィジン、スルフイソキサゾール、ガントリシン、トリメトプリム-スルファメトキサゾール(コ-トリモキサゾール)(TMP-SMX)、バクトリム、セプトラ、スルホンアミドクリソイジン、及びプロントシル;テトラサイクリン、例えば、デメクロサイクリン、デクロマイシン、ドキシサイクリン、ビブラマイシン、ミノサイクリン、ミノシン、オキシテトラサイクリン、テラマイシン、テトラサイクリン及びスマイシン、アクロマイシンV、及びステクリン;マイコバクテリアに対する薬、例えば、クロファジミン、ランプレン、ダプソン、アブロスルホン、カプレオマイシン、カパスタット、シクロセリン、セロマイシン、エタンブトール、ミャンブトール、エチオナミド、トレケーター、イソニアジド、I.N.H、ピラジンアミド、アルジンアミド、リファンピシン、リファジン、リマクタン、リファブチン、マイコブチン、リファペンチン、プリフチン、及びストレプトマイシン;他の抗生物質、例えば、アルスフェナミン、サルバルサン、クロラムフェニコール、クロロミセチン、フォスフォマイシン、モヌロール、モヌリル、フシジン酸、フシジン、メトロニダゾール、フラジル、ムピロシン、バクトロバン、プラテンシマイシン、キヌプリスチン/ダルフォプリスチン、シナシッド、チアンフェニコール、チゲサイクリン、チガシル、チニダゾール、チンダマックスファシジン、トリメトプリム、プロロプリム、及びトリムペックスが挙げられる。
【0038】
上に列挙した治療薬を投与する方法及び投与量は、当分野で公知であるか、当分野から誘導することができる。
【0039】
キット
上記のように、本開示によって、主題の方法を実施するためのキットも提供される。いくつかの実施形態では、キットは、JUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1及びEBI3によってコードされるRNA転写物の量を測定するための試薬を含むことができる。いくつかの実施形態では、キットは、各RNA転写物について、転写物にハイブリダイズする配列特異的オリゴヌクレオチドを含むことができる。いくつかの実施形態では、配列特異的オリゴヌクレオチドは、ビオチン化され、及び/又は光学的に検出可能な部分で標識されていてもよい。いくつかの実施形態では、キットは、各RNA転写物について、RNA転写物からの配列又はRNA転写物から調製されたcDNAを増幅する一対のPCRプライマーを含むことができる。いくつかの実施形態では、キットは、オリゴヌクレオチドプローブアレイを含むことができ、アレイは、各RNA転写物について、転写物にハイブリダイズする少なくとも1つの配列特異的オリゴヌクレオチドを含む。オリゴヌクレオチドプローブは、例えば、平面支持体の表面上で空間的にアドレス可能であってもよく、又は光学的にアドレス可能なビーズに繋がれていてもよい。
【0040】
定量的等温増幅法が使用される実施形態では、キットは、複数の反応容器を含む試薬を含むことができ、各容器は、単一の転写物、例えばJUP、SUCLG2、IFI27、FCER1A、HESX1、SMARCD3、ICAM1及びEBI3から選択される単一遺伝子からの転写物、又はそれから調製されたcDNAにハイブリダイズする少なくとも1つ(例えば、2、3、4、5、又は6個)の配列特異的等温増幅プライマーを含む。したがって、いくつかの実施形態では、キットは、少なくとも8個の反応容器を含むことができ、各反応容器は、単一遺伝子によってコードされるRNA転写物を検出するための1つ又はそれ以上のプライマーを含む。いくつかの実施形態では、キットは、最大で合計30個又は50個のRNA転写物の量を測定するための試薬を含むことができる。
【0041】
いくつかの実施形態では、キットは、任意の数の遺伝子(例えば、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、又は少なくとも7個の遺伝子、最大30又は50個の遺伝子)のセットのRNA転写物の量を測定するための試薬を含むことができ、遺伝子のセットは、表2に列挙された遺伝子の任意のペア、並びに独立して表1に列挙されているか又は列挙されていない任意の他の遺伝子(例えば、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、又は少なくとも7個の他の遺伝子)を含む。例えば、キットは、各RNA転写物について、RNA転写物からの配列又はRNA転写物から調製されたcDNAを増幅する一対のPCRプライマーを含むことができる。
【0042】
キットの様々な構成要素は、別個の容器に存在してもよく、又は特定の適合する構成要素は、所望に応じて単一の容器に予め組み合わされてもよい。
【0043】
上記の構成要素に加えて、主題のキットは、主題の方法を実施するためにキットの構成要素を使用するための説明書を更に含むことができる。
【0044】
更なる実施形態
任意の実施形態では、方法は、8つの列挙された遺伝子によってコードされるRNA転写物の量を測定することによって、例えば、2、3、4、5、6又は7つの列挙された遺伝子によってコードされるRNA転写物の量を測定することによって実施することができる。いくつかの実施形態において測定される転写物の総数は、いくつかの実施形態において30又は50 RNAであってもよい。
【0045】
更に、8つの列挙された遺伝子又はそのサブセットに加えて、他の遺伝子を分析することができる。例えば、任意の実施形態では、方法は、以下の表1に列挙される他の遺伝子のRNA転写物の量を測定することを更に含むことができる。
【0046】
いくつかの実施形態では、方法は、任意の数の遺伝子(例えば、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、又は少なくとも7個の遺伝子、最大30又は50個の遺伝子)のセットのRNA転写物の量を測定することによって実施することができ、遺伝子のセットは、表2に列挙された遺伝子の任意のペア、並びに表1に独立して列挙されているか又は列挙されていない任意の他の遺伝子(例えば、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、又は少なくとも7個の他の遺伝子)を含む。
【0047】
いくつかの実施形態では、方法は、列挙された遺伝子に加えて、CEACAM1、ZDHHC19、C9orf95、GNA15、BATF、C3AR1、KIAA1370、TGFBI、MTCH1、RPGRIP1、及びHLA-DPB1によってコードされるRNA転写物の量を測定する工程を更に含むことができる。これらの実施形態では、CEACAM1、ZDHHC19、C9orf95、GNA15、BATF及びC3AR1バイオマーカーの発現増加並びにKIAA1370、TGFBI、MTCH1、RPGRIP1及びHLA-DPB1の発現減少は、国際公開第2016145426号に記載されているように対象が敗血症を有することを示す。したがって、本方法は、細菌感染及びウイルス感染の両方の治療のための統合された決定モデルとして使用することができる。
【実施例】
【0048】
以下の実施例は、当業者に本発明を作成及び使用する方法の完全な開示及び説明を提供するために記載されており、本発明者らが本発明と見なすものの範囲を限定することを意図するものではなく、以下の実験が実施された全て又は唯一の実験であることを表すことを意図するものでもない。使用される数(例えば、量、温度など)に関して正確性を確保するための努力がなされてきたが、いくつかの実験誤差及び偏差が考慮されるべきである。特に明記しない限り、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏であり、圧力は大気圧又は大気圧付近である。標準的な略語、例えば室温(RT);塩基対(bp);キロベース(kb);ピコリットル(pl);秒(s又はsec);分(m又は分);時間(h又はhr);日数(d);週(wk又はwks)ナノリットル(nl);マイクロリットル(ul);ミリリットル(ml);リットル(L);ナノグラム(ng);マイクログラム(ug);ミリグラム(mg);グラム((g)質量に関して);キログラム(kg);重力の当量((g)遠心分離との関連で);ナノモル(nM);マイクロモル(uM)、ミリモル(mM);モル(M);アミノ酸(aa);キロベース(kb);塩基対(bp);ヌクレオチド(nt);筋肉内(i.m.);腹腔内(i.p.);皮下(s.c.)などを使用することができる。
【0049】
材料及び方法
系統的なデータセットの検索
肺炎又は他の呼吸器感染症のパブリックヒトマイクロアレイゲノムワイド発現研究のために、NIH Gene Expression Omnibus(GEO)及びEuropean Bioinformatics Institute(EBI)ArrayExpressで系統的検索を行った。データセットが、(i)非臨床であった場合、(ii)全血又はPBMC以外の組織を使用して行われた場合、(iii)少なくとも4つの健常な試料を有していなかった場合、又は(iv)病原体が細菌性であるかウイルス性であるかを識別するのに十分な病原体標識を有していなかった場合、データセットを除外した。
【0050】
全てのマイクロアレイデータは、標準的な方法を使用して生データ(利用可能な場合)から再正規化された。Affymetrixアレイを、GCロバストマルチアレイ平均(gcRMA)(ミスマッチプローブを有するアレイ上)又はRMAを使用して正規化した。Illumina、Agilent、GE及び他の市販のアレイを、正規指数バックグラウンド補正とそれに続く分位正規化によって正規化した。カスタムアレイは再正規化せず、そのまま使用した。データをlog2変換し、固定効果モデルを使用して、各研究内の遺伝子に対するプローブを要約した。各研究内で、異なるマイクロアレイ型でアッセイしたコホートを独立して処理した。
【0051】
COCONUT共正規化
包含基準に適合し、呼吸器感染症をプロファイリングした43個のデータセットのうち、これらのデータセットのうち12個のみが細菌感染とウイルス感染の両方を含み、単一のデータセットのみが細胞内細菌感染、細胞外細菌感染、及びウイルス感染を含んでいた。(異なるプラットフォームの使用のために)これらの異なるアレイのバックグラウンド測定値の違いのために、バッチ効果に起因して著しく歪んだ結果を得ることなく43個全てのデータセット間で分析を行うことは困難である。これらのデータを利用するために、研究間で遺伝子の分布を変化させることなく、試料診断に対するいかなるバイアスもなしに発現データの共正規化を可能にする、コンバット共正規化の使用コントロール(COCONUT)2を使用した。それは、対照試料間で等しい分布のみを仮定するコンバット経験的ベイズ正規化方法の修正版26を適用する。簡潔には、各コホートからの健常対照は、共変量なしのコンバット共正規化を受け、各データセットの健常試料についてコンバット推定パラメータが取得される。次いで、これらのパラメータを各データセット内の疾患試料に適用し、これにより、各データセット内の健常試料と疾患試料との間の相対距離を依然として保持しながら、全ての試料が同じバックグラウンド分布をとる。
【0052】
シグネチャスコアの算出
以前に記載されたシグネチャスコア
1、2、5、24、25を使用して疾患分類を行った。シグネチャスコア(S
i)は、応答変数(この場合、細菌感染)と正に相関する遺伝子の幾何平均から、負に相関する遺伝子の幾何平均を引いたものとして計算される(Eq.1)。
【数1】
【0053】
簡易ベストサブセット選択
この方法は、貪欲逆方向検索を網羅的検索と組み合わせる。貪欲検索のみを実行することは計算的に実行可能であるが、貪欲アルゴリズムの性質のために、診断目的のための遺伝子の可能な最良の組み合わせが見出されることを保証しない。一方、ベストサブセット選択は網羅的検索であるため、常に遺伝子の最適な組み合わせを選択するが、ベストサブセット選択の計算コストは指数関数的に増加するため、約20を超える遺伝子で実行することは実行不可能であった。簡易ベストサブセット選択(簡易BSS)は、これらの方法の両方の強度を組み合わせる方法である。
【0054】
最初に、初期遺伝子リストに対する貪欲逆方向検索を実行した。簡潔には、検索は、出発遺伝子セットを取得し、各遺伝子を個々に除去した後にAUROCを計算することを含む。検索は更に、どの遺伝子の除去がAUROCの最大の増加をもたらすかを同定し、次いでその遺伝子をセットから永久的に除去することを含む。次いで、この同じ戦略を新しい遺伝子セットに適用し、その排除がAUROCの最大の増加をもたらす遺伝子を再び除去する。典型的な貪欲逆方向検索では、任意の遺伝子を除去すると、何らかの所定の閾値を超えるAUROCの減少がもたらされる点に達するまで、この工程が繰り返される。しかし、この場合、貪欲逆方向検索は、(この場合、このカットオフは20遺伝子であった)ベストサブセット選択を行うことができるように十分な遺伝子が排除されるまで単純に実行される。
【0055】
ベストサブセット選択は、簡易遺伝子リストで実行することができる。簡潔には、遺伝子の全ての可能な組み合わせの診断力は、各組み合わせのシグネチャスコアを計算し、対応するAUROCを報告することによって評価される。次に、全遺伝子の一意の数ごとに、最良のAUCを生成する遺伝子のサブセットが報告される。これにより、全遺伝子の数ごとの最良のシグネチャのリストが得られ、そこから最終的な遺伝子シグネチャを選択することができる。
【0056】
MANATEEを使用した8遺伝子シグネチャの導出
発見呼吸器感染コホートを、AggregaTed gEne発現又はMANATEEのMulticohort ANalysisを用いて分析した(
図1)。MANATEEは、従来のワークフローで可能であったよりも、単一の遺伝子発現分析において多数の独立した異種データセットの統合を可能にするためのマルチコホート分析フレームワークとして開発された。MANATEEは、データを発見及び保持検証にランダムに分割することによって開始する。ここでは、データの70%が発見に割り当てられ、残りの30%が保持検証に割り当てられた。次に、COCONUTを使用して発見及び保持検証データを独立して正規化する。発見データ内で、各遺伝子について、症例と対照との間の差次的発現の5つの尺度である(1)SAMスコア(マイクロアレイの有意性分析から)
27、(2)対応するSAMローカルFDR、(3)Benjamini-Hochberg FDR補正P値(t検定の実行から)
28、(4)効果サイズ、及び(5)倍数変化を計算した。効果サイズは、小さな試料バイアスを説明するHedgesの調整gとして推定された。リーブワンデータセットアウト(LODO)分析も実行し、試料の少なくとも5%を占める各データセットを発見データから個別に除去し、1つのデータセットを除外して、発見データの反復ごとに差次的発現統計量を再計算した。遺伝子がMANATEEによって選択されるためには、完全な発見データで計算された統計において設定された閾値を通過するだけでなく、1つのデータセットが除去された発見データの反復ごとの閾値も通過する必要がある。これにより、単一のデータセットが遺伝子の選択にあまりにも強い存在を及ぼすことが防止される。
【0057】
次に、SAMスコアが最も高い上位100遺伝子を選択した。診断性の高い遺伝子のみを選択するために、これらの遺伝子に対して簡易BSS(上記)を行った。簡易BSSの結果から、15遺伝子シグネチャ(最大AUROCを有するシグネチャ)及び8遺伝子シグネチャ(最大AUROCシグネチャの95% CI内にあった最小シグネチャ)を選択して、ホールドアウト検証で試験した。両方のシグネチャは同等のAUROCを有していたので、次の工程のために8遺伝子シグネチャを選択した。
【0058】
結果
発熱症状をもたらす細胞内細菌感染、細胞外細菌感染、又はウイルス感染で患者をプロファイリングした遺伝子発現マイクロアレイ又はRNA-seqコホートの系統的検索3、4により、包含基準を満たす43個の全血(WB)コホート及び9の末梢血単核細胞(PBMC)が同定された5~22。43個の独立したWBコホートは、1963個の非健常患者試料(562個の細胞外細菌感染、320個の細胞内細菌感染、及び1081個のウイルス感染)から構成され、9個の独立したPBMCコホートは、417個の非健常患者試料(172個の細胞外細菌感染、11個の細胞内細菌感染、及び234個のウイルス感染)から構成された。これらのデータには、広範囲の地理的地域からの子供と成人の両方が含まれていた。1419個の感染試料(348個の細胞外細菌感染、280個の細胞内細菌感染、及び791個のウイルス感染)からなる28個のWBデータセットを発見コホートとして使用し、544個の非健常サンプル(214個の細胞外細菌感染、40個の細胞内細菌感染、及び290個のウイルス感染)からなる残りの15個のWBデータセットを独立した検証コホートとして使用した。健常試料ではないが、細菌感染又はウイルス感染の患者がいた4つのデータセット(3個のWB及び1個のPBMC)を同定し、独立した検証コホートとして使用した。
【0059】
MANATEEによる上位差次的発現遺伝子の選択
収集されたデータの全てを利用するために、集約された遺伝子発現のマルチコホート分析(MANATEE)と呼ばれるマルチコホート分析フレームワークを開発した(
図1)。このフレームワークでは、データの70%を「発見」コホートにランダムに割り当て、残りの30%を「ホールドアウト検証」として割り当てた。次に、COCONUT正規化を全ての発見コホートにわたって適用した
2。COCONUTを発見及び保持検証データに別々に適用した。共正規化後、全てのデータセットにわたって6086個の共通遺伝子が存在した。各遺伝子の差次的発現統計を計算した後、フレームワークは、SAM(マイクロアレイの有意性分析)スコアが最も高い上位100個の遺伝子(細菌感染では58個、ウイルス感染では42個)を選択することによるフィルタリングを伴った。前述のシグネチャスコアモデル
1、2、5、24、25を使用して、これらの100個の遺伝子を使用して、細菌又はウイルス感染を有するとして試料を分類し、発見データにおいて0.874(95%CI 0.854~0.894)のAUROCを得た。
【表1】
【0060】
MANATEEによる8遺伝子シグネチャの導出
次の工程は、100個の遺伝子のリスト上で簡易ベストサブセット選択(簡易BSS)を実行することを伴い、これは最初に貪欲逆方向検索を実行して上位20個の最良の遺伝子を選択し、次いでそれらの20個の遺伝子上で網羅的検索を実行することからなる。現在の遺伝子リスト上で簡易BSSを実行することにより、細菌感染及びウイルス感染を区別するためのシグネチャ内の最も重要な遺伝子の同定が可能になった。簡易BSSの結果から、2つのシグネチャである発見における最大AUROCを有するシグネチャ[15遺伝子、AUROC=0.951(95%CI 0.939~0.964)]及び最大AUROCシグネチャの95%信頼区間内にあった最小シグネチャ[8遺伝子、AUROC=0.942(95%CI 0.928~0.955)、
図2A]を試験のために選択した。保持検証では、15遺伝子シグネチャのAUROCは0.948(95%CI 0.926~0.969)であり、8遺伝子シグネチャのAUROCは0.947(95%CI 0.925~0.969)であった(
図2B)。両方のシグネチャは、保持検証において実質的に同等のAUROCを有していたので、より小さい8遺伝子シグネチャをさらなる調査のために選択した。このシグネチャには、細菌感染においてより高い3つの遺伝子(SMARCD3、ICAM1、EBI3)及びウイルス感染においてより高い5つの遺伝子(JUP、SUCLG2、IFI27、FCER1A、HESX1)があった。
【0061】
独立したインシリココホートにおける検証
結果が広く適用可能であり、単純に訓練データに過剰適合しないことを検証するために、一連の完全に独立したコホートで8遺伝子シグネチャの性能を試験した。15個のWBデータセットを、COCONUTを使用した発見及び保持検証を省略した健常試料で正規化した。これらのデータには、544個の非健常試料(214個の細胞外細菌感染、40個の細胞内細菌感染、及び290個のウイルス感染)が含まれた。8シグネチャは、全ての細菌対ウイルス感染、細胞外細菌症対ウイルス感染、及び細胞内細菌症対ウイルス感染をそれぞれ区別するために、0.948(95%CI 0.929~0.967)、0.943(95%CI 0.921~0.966)、及び0.978(95%CI 0.945~1)のAUROCを有していた(
図3A)。8遺伝子シグネチャは、細菌感染及びウイルス感染の両方を有するが健常試料を含まない3個のWBデータセットにおいて更に検証した。GSE72809では、AUROCは0.955(95%CI 0.915~0.996)であり、GSE72810では、AUROCは0.949(95%CI 0.882~1)であり、GSE63990では、AUROCは0.878(95%CI 0.823~0.933)であり、要約AUCは0.914(95%CI 0.824~1)であった(
図3B)。
【0062】
同様の検証を9つのPBMCコホートで実施し、これには417個の非健常患者試料(172個の細胞外細菌感染、11個の細胞内細菌感染、及び234個のウイルス感染)が含まれた。これらのデータセットのCOCONUT正規化後、シグネチャは、全ての細菌対ウイルス感染、細胞外細菌対ウイルス感染、及び細胞内細菌対ウイルス感染をそれぞれ区別するために、0.92(95%CI 0.891~0.949)、0.921(95%CI 0.891~0.95)、及び0.906(95%CI 0.786~1)のAUROCを有することが見出された(
図4A)。8遺伝子シグネチャは、細菌感染及びウイルス感染を有するが健常試料を有しないPBMCコホートで更に検証され、このコホートは、2つの重複しないプラットフォーム(GPL570及びGPL2507)で測定された。したがって、検証を各プラットフォームについて別々に行った。GSE6269GPL570では、AUROCは0.992(95%CI 0.953~1)であり、GSE6269GPL2507では、AUROCは0.938(95%CI 0.841~1)であった(
図4B)。
【0063】
前向きコホート(prospective cohorts)における検証(validation)
最後に、フリューダイム社のRT-PCRを使用して、ネパールからの111個の全血試料の前向きコホートにおいて、7遺伝子及び8遺伝子の両方のシグネチャをプロファイリングした。これは、25個のウイルス感染、15個の細胞外細菌感染、及び71個の細胞内細菌感染を含む。7遺伝子シグネチャは、細胞外細菌感染をウイルス感染から高い精度で区別したが(AUROC=0.886、95%CI:0.78~0.99)、細胞内細菌感染をウイルス感染から区別する際の精度は実質的に低かった(AUROC=0.78、95%CI:0.68~0.88)。7遺伝子シグネチャは、細菌感染及びウイルス感染を区別する際の精度は全体的に低かった(AUROC=0.8、95%CI:0.72~0.89)(
図5)。対照的に、8遺伝子シグネチャは、ウイルス感染を細胞外及び細胞内細菌感染からそれぞれ区別するために、0.91(95%CI 0.816~0.1)及び0.915(95%CI 0.859~0.971)のAUROCを有していた。全体として、8遺伝子シグネチャは、細菌感染及びウイルス感染を区別する際の精度は高かった(AUROC=0.914、95%CI 0.862~0.966)。合わせて、これらの結果は、このシグネチャの診断力に高い信頼性をもたらす。
【0064】
2つの遺伝子の組み合わせ
表1に列挙した遺伝子の各対の組み合わせについて、受信者動作曲線下面積(AUROC)を計算した。以下の表2は、AUROC≧0.80を有する遺伝子の全てのペアワイズ組み合わせに対するAUROCを示す。
【表2】
【0065】
参考文献
1 Andres-Terre,M.et al.Integrated,Multi-cohort Analysis Identifies Conserved Transcriptional Signatures across Multiple Respiratory Viruses.Immunity 43,1199-1211,doi:10.1016/j.immuni.2015.11.003(2015).
2 Sweeney,T.E.,Wong,H.R.&Khatri,P.Robust classification of bacterial and viral infections via integrated host gene expression diagnostics.Sci Transl Med 8,346ra391,doi:10.1126/scitranslmed.aaf7165(2016).
3 Edgar,R.,Domrachev,M.&Lash,A.E.Gene Expression Omnibus:NCBI gene expression and hybridization array data repository.Nucleic Acids Res 30,207-210(2002).
4 Kolesnikov,N.et al.ArrayExpress update--simplifying data submissions.Nucleic Acids Res 43,D1113-1116,doi:10.1093/nar/gku1057(2015).
5 Sweeney,T.E.,Shidham,A.,Wong,H.R.&Khatri,P.A comprehensive time-course-based multicohort analysis of sepsis and sterile inflammation reveals a robust diagnostic gene set.Sci Transl Med 7,287ra271,doi:10.1126/scitranslmed.aaa5993(2015).
6 Ardura,M.I.et al.Enhanced monocyte response and decreased central memory T cells in children with invasive Staphylococcus aureus infections.PLoS One 4,e5446,doi:10.1371/journal.pone.0005446(2009).
7 Parnell,G.et al.Aberrant cell cycle and apoptotic changes characterise severe influenza A infection--a meta-analysis of genomic signatures in circulating leukocytes.PLoS One 6,e17186,doi:10.1371/journal.pone.0017186(2011).
8 Parnell,G.P.et al.A distinct influenza infection signature in the blood transcriptome of patients with severe community-acquired pneumonia.Crit Care 16,R157,doi:10.1186/cc11477(2012).
9 Banchereau,R.et al.Host immune transcriptional profiles reflect the variability in clinical disease manifestations in patients with Staphylococcus aureus infections.PLoS One 7,e34390,doi:10.1371/journal.pone.0034390(2012).
10 Berdal,J.E.et al.Excessive innate immune response and mutant D222G/N in severe A(H1N1)pandemic influenza.J Infect 63,308-316,doi:10.1016/j.jinf.2011.07.004(2011).
11 de Steenhuijsen Piters,W.A.et al.Nasopharyngeal Microbiota,Host Transcriptome,and Disease Severity in Children with Respiratory Syncytial Virus Infection.Am J Respir Crit Care Med 194,1104-1115,doi:10.1164/rccm.201602-0220OC(2016).
12 Heinonen,S.et al.Rhinovirus Detection in Symptomatic and Asymptomatic Children:Value of Host Transcriptome Analysis.Am J Respir Crit Care Med 193,772-782,doi:10.1164/rccm.201504-0749OC(2016).
13 Herberg,J.A.et al.Transcriptomic profiling in childhood H1N1/09 influenza reveals reduced expression of protein synthesis genes.J Infect Dis 208,1664-1668,doi:10.1093/infdis/jit348(2013).
14 Ioannidis,I.et al.Plasticity and virus specificity of the airway epithelial cell immune response during respiratory virus infection.J Virol 86,5422-5436,doi:10.1128/JVI.06757-11(2012).
15 Jong,V.L.et al.Transcriptome assists prognosis of disease severity in respiratory syncytial virus infected infants.Sci Rep 6,36603,doi:10.1038/srep36603(2016).
16 Lindow,J.C.et al.Cathelicidin Insufficiency in Patients with Fatal Leptospirosis.PLoS Pathog 12,e1005943,doi:10.1371/journal.ppat.1005943(2016).
17 Liu,T.Y.et al.An individualized predictor of health and disease using paired reference and target samples.BMC Bioinformatics 17,47,doi:10.1186/s12859-016-0889-9(2016).
18 Mejias,A.et al.Whole blood gene expression profiles to assess pathogenesis and disease severity in infants with respiratory syncytial virus infection.PLoS Med 10,e1001549,doi:10.1371/journal.pmed.1001549(2013).
19 Rodriguez-Fernandez,R.et al.Respiratory Syncytial Virus Genotypes,Host Immune Profiles,and Disease Severity in Young Children Hospitalized With Bronchiolitis.J Infect Dis 217,24-34,doi:10.1093/infdis/jix543(2017).
20 Suarez,N.M.et al.Superiority of transcriptional profiling over procalcitonin for distinguishing bacterial from viral lower respiratory tract infections in hospitalized adults.J Infect Dis 212,213-222,doi:10.1093/infdis/jiv047(2015).
21 Tang,B.M.et al.A novel immune biomarker IFI27 discriminates between influenza and bacteria in patients with suspected respiratory infection.Eur Respir J 49,doi:10.1183/13993003.02098-2016(2017).
22 Zaas,A.K.et al.Gene expression signatures diagnose influenza and other symptomatic respiratory viral infections in humans.Cell Host Microbe 6,207-217,doi:10.1016/j.chom.2009.07.006(2009).
23 Tsalik,E.L.et al.Host gene expression classifiers diagnose acute respiratory illness etiology.Sci Transl Med 8,322ra311,doi:10.1126/scitranslmed.aad6873(2016).
24 Sweeney,T.E.,Braviak,L.,Tato,C.M.&Khatri,P.Genome-wide expression for diagnosis of pulmonary tuberculosis:a multicohort analysis.Lancet Respir Med 4,213-224,doi:10.1016/S2213-2600(16)00048-5(2016).
25 Khatri,P.et al.A common rejection module(CRM)for acute rejection across multiple organs identifies novel therapeutics for organ transplantation.J Exp Med 210,2205-2221,doi:10.1084/jem.20122709(2013).
26 Johnson,W.E.,Fau,L.C.&Rabinovic,A.Adjusting batch effects in microarray expression data using empirical Bayes methods.Biostatistics(2006).
27 Tusher,V.G.,Tibshirani,R.&Chu,G.Significance analysis of microarrays applied to the ionizing radiation response.Proc Natl Acad Sci U S A 98,5116-5121,doi:10.1073/pnas.091062498(2001).
28 Benjamini,Y.&Hochberg,Y.Controlling the False Discovery Rate:A Practical and Powerful Approach to Multiple Testing.J R Stat Soc Series B Stat Methodol 57,289-300(1995).
【国際調査報告】