特許第6681337号(P6681337)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イギリス国の特許一覧

特許6681337敗血症の発症を予測するための装置、キット及び方法
<>
  • 特許6681337-敗血症の発症を予測するための装置、キット及び方法 図000032
  • 特許6681337-敗血症の発症を予測するための装置、キット及び方法 図000033
  • 特許6681337-敗血症の発症を予測するための装置、キット及び方法 図000034
  • 特許6681337-敗血症の発症を予測するための装置、キット及び方法 図000035
  • 特許6681337-敗血症の発症を予測するための装置、キット及び方法 図000036
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6681337
(24)【登録日】2020年3月25日
(45)【発行日】2020年4月15日
(54)【発明の名称】敗血症の発症を予測するための装置、キット及び方法
(51)【国際特許分類】
   C12M 1/34 20060101AFI20200406BHJP
   G01N 33/53 20060101ALI20200406BHJP
   G01N 37/00 20060101ALI20200406BHJP
   C12N 15/09 20060101ALI20200406BHJP
   C12Q 1/6851 20180101ALI20200406BHJP
【FI】
   C12M1/34 Z
   G01N33/53 M
   G01N37/00 102
   C12N15/09 200
   C12Q1/6851 Z
【請求項の数】14
【全頁数】40
(21)【出願番号】特願2016-551693(P2016-551693)
(86)(22)【出願日】2015年1月9日
(65)【公表番号】特表2017-506510(P2017-506510A)
(43)【公表日】2017年3月9日
(86)【国際出願番号】GB2015000004
(87)【国際公開番号】WO2015121605
(87)【国際公開日】20150820
【審査請求日】2018年1月5日
(31)【優先権主張番号】1402293.3
(32)【優先日】2014年2月11日
(33)【優先権主張国】GB
【前置審査】
(73)【特許権者】
【識別番号】390040604
【氏名又は名称】イギリス国
【氏名又は名称原語表記】THE SECRETARY OF STATE FOR DEFENCE IN HER BRITANNIC MAJESTY’S GOVERNMENT OF THE UNETED KINGDOM OF GREAT BRITAIN AND NORTHERN IRELAND
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100119013
【弁理士】
【氏名又は名称】山崎 一夫
(74)【代理人】
【識別番号】100123777
【弁理士】
【氏名又は名称】市川 さつき
(74)【代理人】
【識別番号】100111796
【弁理士】
【氏名又は名称】服部 博信
(74)【代理人】
【識別番号】100123766
【弁理士】
【氏名又は名称】松田 七重
(72)【発明者】
【氏名】スペンサー フィリッパ マリア
(72)【発明者】
【氏名】ルカジュースキー ローマン アントーニ
(72)【発明者】
【氏名】クラドック ローラ
(72)【発明者】
【氏名】ジョーンズ ヘレン エレリ
【審査官】 林 康子
(56)【参考文献】
【文献】 米国特許出願公開第2006/0246495(US,A1)
【文献】 米国特許出願公開第2004/0096917(US,A1)
【文献】 Illumina, HumanHT-12 v4 BeadChip Product Information, [online], 2010-5-12, [検索日2018-11-21], <https://www.illumina.com/documents/products/product_information_sheets/product_info_humanht-12.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
C12M 1/34
C12Q 1/00〜3/00
CAplus/MEDLINE/EMBASE/BIOSIS/WPIDS(STN)
PubMed
(57)【特許請求の範囲】
【請求項1】
症状が現れる前(発症前)に敗血症の進展を予測する診断キットであって、前記診断キットは、サンプル中のバイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトのレベルを検出する特有の手段からなり、前記バイオマーカーシグネチャーが、以下のいずれか1つからなる、診断キット:
表1に記載の全266個の遺伝子、
表3に記載の44個の遺伝子バイオマーカーシグネチャー、
表4に記載の45個の遺伝子バイオマーカーシグネチャー、
表3に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、
表4に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、又は
表5から選択される44個の遺伝子からなるバイオマーカーシグネチャーの1つ。
【請求項2】
前記遺伝子又は遺伝子プロダクトのレベルを検出する特有の手段が、バイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトに特有の固定化されたプローブ又は認識エレメントを含む、請求項1に記載の診断キット。
【請求項3】
前記遺伝子又は遺伝子プロダクトのレベルを検出する特有の手段が、核酸の検出手段を含む、請求項1又は2記載の診断キット。
【請求項4】
前記遺伝子又は遺伝子プロダクトのレベルを検出する特有の手段が、前記バイオマーカーシグネチャーの各遺伝子又は遺伝子プロダクトに特有のプローブが固定化されたマイクロアレイを含む、請求項1〜3のいずれか1項記載の診断キット。
【請求項5】
前記遺伝子又は遺伝子プロダクトのレベルを検出する特有の手段が、前記バイオマーカーシグネチャーの各遺伝子により発現されるRNAへの結合に特有のプローブが固定化されたマイクロアレイを含む、請求項1〜4のいずれか1項記載の診断キット。
【請求項6】
前記遺伝子又は遺伝子プロダクトのレベルを検出する特有の手段が、前記バイオマーカーシグネチャー中の遺伝子又は遺伝子領域の増幅を行うのに適した試薬を少なくとも幾つか含む、請求項1〜3のいずれか1項記載の診断キット。
【請求項7】
前記増幅がリアルタイム(RT)ポリメラーゼ連鎖反応であり、前記手段が、前記バイオマーカーシグネチャーの各遺伝子又は遺伝子領域あるいは遺伝子プロダクトを増幅するための特有のプライマーを含む、請求項6記載の診断キット。
【請求項8】
症状が現れる前(発症前)に、動物の生物学的サンプルを分析して、前記動物における敗血症の進展を予測又は監視する方法であって、
表1に記載の全266個の遺伝子、
表3に記載の44個の遺伝子バイオマーカーシグネチャー、
表4に記載の45個の遺伝子バイオマーカーシグネチャー、
表3に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、
表4に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、又は
表5から選択される44個の遺伝子からなるバイオマーカーシグネチャーの1つ
のいずれか1つからなるバイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトの発現を監視、測定及び/又は検出する工程と、
監視、測定及び/又は検出によって生成されたデータを評価して敗血症の進展を予測及び監視する工程を含む方法であって、
前記方法がコンピュータで実施され、前記監視、測定及び/又は検出工程が、前記バイオマーカーシグネチャーのすべてのバイオマーカーの定量的データを生成することを含み、ここで、前記データは定量的かつ定性的でもよく、前記データの評価が、前記データをコンピュータの分析プロセスに入力することと、前記データを前記参照用データと比較することと、敗血症の進展の尤度を予測又は監視する出力を前記分析プロセスから生成することとを含む、前記方法。
【請求項9】
前記生成されたデータを、(i)敗血症でない被験者群、(ii)すでに敗血症を発症した被験者群、及び(iii)感染はないがSIRSを有する被験者群から選択される1つ以上の群から得たサンプルから抽出された参照データと比較し、敗血症の見込みの予測を、サンプルの結果がどの群により類似しているかを基に判定する、請求項8記載の方法。
【請求項10】
前記遺伝子又は遺伝子プロダクトの発現を監視、測定及び/又は検出する工程が、バイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトに特有の固定化されたプローブ又は認識エレメントの使用を含む、請求項8又は9記載の方法。
【請求項11】
前記遺伝子又は遺伝子プロダクトの発現を監視、測定及び/又は検出する工程が、リアルタイム(RT)ポリメラーゼ連鎖反応(PCR)を使う、請求項8又は9記載の方法。
【請求項12】
症状が現れる前(発症前)に動物の生物学的サンプルを分析して敗血症の進展を予測及び監視する装置であって、前記装置が、バイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトの発現レベルを監視、測定又は検出する特有の手段と、前記監視、測定又は検出手段から生成されたデータを分析する手段と、ある動物の敗血症の進展を予測する出力又は敗血症の監視を可能にする出力を、前記分析から提供する手段とを有し、前記バイオマーカーシグネチャーが、以下のいずれか1つからなる前記装置:
表1に記載の全266個の遺伝子、
表3に記載の44個の遺伝子バイオマーカーシグネチャー、
表4に記載の45個の遺伝子バイオマーカーシグネチャー、
表3に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、
表4に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、又は
表5から選択される44個の遺伝子からなるバイオマーカーシグネチャーの1つ。
【請求項13】
前記遺伝子又は遺伝子プロダクトの発現を監視、測定及び/又は検出する手段が、バイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトに特有の固定化されたプローブ又は認識エレメントを含む、請求項12記載の装置。
【請求項14】
症状が現れる前(発症前)に敗血症の進展を予測し、敗血症の進展と非敗血症とを識別するための、以下の群の一つからなるバイオマーカーシグネチャーの使用:
表1に記載の全266個の遺伝子、
表3に記載の44個の遺伝子バイオマーカーシグネチャー、
表4に記載の45個の遺伝子バイオマーカーシグネチャー、
表3に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、
表4に記載の絞りこまれた25個の遺伝子バイオマーカーシグネチャー、又は
表5から選択される44個の遺伝子からなるバイオマーカーシグネチャーの1つ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動物の生物学的サンプルを分析して、該動物が敗血症の症状を発現するかどうかを予測するバイオマーカーシグネチャー/バイオマーカーリストを利用して、敗血症の進展(development)を予測及び監視するキット、方法及び装置に関するもので、とりわけ、少なくとも平均予測精度92%で敗血症進展と非敗血症との発現の識別が可能であり、少なくとも平均予測精度95%で敗血症進展とSIRSとの発現を識別することができるバイオマーカーシグネチャーに関する。
【背景技術】
【0002】
生物由来物質に暴露した後、敗血症の症状が現れる前には多くの場合誘導期がある。臨床症状が現れた後は、疾病の進行とともに治療効果が低下することが多く、診断に至るまでの時間が重要になる。検出アッセイ又は診断アッセイが、敗血症を最初に確認するインジケーターになると考えられる。そのため、このようなアッセイの有用性、迅速性、予測精度が結果を決める重大なものになる。短縮できた時間で医療的な対策の実施を早めることができ、回復に大きな影響を及ぼすことになる。
【0003】
生物由来物質による感染の迅速な検出が容易にできる技術の開発は、危険にさらされているすべてのものにとって重大な課題である。感染の初期段階では、多くの生物由来物質は、一般的な臨床サンプル(例えば血液)中には存在していないか、存在しても極めて低い濃度である。そのため、生物由来物質に特有なアッセイであっても、臨床症状が現れる前に感染を検出するには、有用性に限界があると考えられる。生物由来物質に感染すると、その種類を表す様々なバイオマーカーの発現の変動を伴う免疫反応パターンが引き出されることが、先行研究により明らかになってきた。このようなバイオマーカーの発現パターンが、様々な感染物質の診断になることがわかってきた。今日では、全トランスクリプトーム解析により、4つの一般的なヒト病原体(インフルエンザA、黄色ブドウ球菌、肺炎レンサ球菌及び大腸菌)が引き起こす急性感染症の患者の場合、その徴候を示す白血球中の遺伝子発現パターンを判別することができる。更に、適切なバイオインフォマチック分析技術を使用して感染症診断用の重要なバイオマーカーを選択することで、診断に必要とされるホストバイオマーカーの数を減らすことが最近の研究により可能となった。
【0004】
ホストバイオマーカーシグネチャーは、生物由来物質による感染を発症前に検出するための注目の解決策ではあるが、ホストバイオマーカーシグネチャーの探索は感染実験モデルを利用することに依存している。実験モデルでは、ヒトの疾病の病因に対する忠実度にばらつきがある。ヒトにおける発症前バイオマーカーを発見するための別の方法は、生物由来物質の感染の一般的な続発症、即ち、生命にかかわる敗血症を利用することである。敗血症は、従来は、感染に反応した全身性炎症反応症候群(SIRS)と定義されており、急性の臓器機能不全を併発すると、最終的には命にかかわる重篤な合併症を起こす可能性がある。この広い定義のよりどころは、明らかな全身的疾病症状(体温、血圧、心拍数等)の観察と、臨床サンプルからの微生物の培養により感染微生物の存在を提示することである。これは、炭疽病(炭疽菌)、野兎病(野兎病菌)、ペスト(ペスト菌)、鼻疽病(鼻疽菌)、類鼻疽(偽鼻疽菌)、出血性のフィロウイルス及びアルファウイルス感染症の動物モデル(一次マウス及びNHP)において説明されてきた。より重要なのは、敗血症はヒトにおいても同じ生物由来物質により直接引き起こされるということである。
【0005】
天然生物由来物質の感染発生率は一般的には極めて低いため、ヒト個体群での疾病の発症についての前向き研究は実行不可能である。しかしながら、臓器機能不全、低灌流又は低血圧を伴う重篤な敗血症の進展は、集中治療室(ICU)での罹病率及び死亡率の大きな原因の一つである。英国では、ICU入院患者総数の27%の原因が重篤な敗血症である。全ヨーロッパで、ICUでの重篤な敗血症の発生は平均で30%であり、死亡率は27%である。米国においては、敗血症による病院関連死亡率は18〜30%の範囲であり、すべての死因の推定9.3%が敗血症患者にみられる。明らかなのは、極めて利用しやすい患者集団が存在し、それを利用することで、敗血症発症の予測マーカーの研究が可能だということである。
【0006】
重篤な感染症及び敗血症は、診断、治療、サポートについては大いに改善されたが、依然として重大な死因であり、急性エピソードは乗り越えたものの、慢性体調不良や身体障害となることが多い。他の点で健康な成人では、突然の壊滅的な感染はめったにおこらないが、免疫不全の人や集中治療中の重篤な患者への危険性は増大し、病人や小さな子供は打ちのめされる。一部の症例では、一見したところ治療可能に思われる感染でも敗血症の進展に至る。即ち、進行性循環虚脱という特徴により、感染に対する反応が不良不適となり、腎臓及び呼吸器官不全、血液凝固異常、反応性がない(unresponsive)難治性低血圧を引き起こし、約30%は死に至る。北米では、敗血症の発生率は年間で人口の約0.3%(約750,000症例)で、高齢者の場合は死亡率が40%に上がり、最も重篤な状態である敗血症性ショックの場合、死亡率は50%に上昇する。
また、臨床的敗血症は、何らかのウィルス(例えば、ベネズエラ馬脳炎ウィルス、VEEV)や菌類の感染を原因とすることもあり、また、他のメカニズムを伴う可能性があることに注意しなければならない。
【0007】
重篤になる可能性のある感染症をできるだけ早く検出できること、特には、感染しやすい個体の敗血症の発症を予測できれば、明らかに有利である。ショック、敗血症、敗血症性ショック、毒素性ショック及び全身性炎症反応症候群(SIRS)等の臨床単位を定義する明白な基準を設定しようと、長年にわたり多大な努力が費やされてきた。
同様に、臨床パラメータ、化学的パラメータ、生化学的パラメータ、免疫学的パラメータ、血球計算によるパラメータの範囲を測定してロバストな予測モデルを設定しようと様々な試みがなされ、予測の的中と精巧さは様々であるが数多くのスコアシステムが提案されてきた。
1991年の米国胸部疾患学会(ACCP)及び米国集中治療医学会(SCCM)とのコンセンサス会議によると、以下の1つより多くを患者が有する場合は、「SIRS」とみなされる。体温が38℃より高いか36℃より低い。心拍数が90/分より多い。呼吸数が20/分より多いか、又は、PaCO2が32mmHgより低い呼吸亢進。白血球数が12,000個/μlより多いか、4,000個/μlより少ない。
「敗血症」は感染を原因とするSIRSと定義されてきた。SIRSは、例えば、火傷、膵臓炎及び他の病状など、感染がなくても起こりうることは認められている。「感染」とは、常態では無菌の組織、体液又は体腔に病原性又は病原となる可能性のある微生物が侵入することで引き起こされる発病プロセスと定義される。
【0008】
「重篤な敗血症」とは、臓器不全の併発で悪化した敗血症を意味する。
「敗血症性ショック」とは(成人の場合)、他の原因では説明がつかない連続性の動脈低血圧を特徴とする急性循環不全の状態が加わった敗血症を指す。
具体的な診断検査及び予後検査を開発する目的で、敗血症と数多くの特定の血清マーカーとの相関作用が広範囲にわたり研究されてきた。
しかしながら、敗血症と相関関係を有し、症状の重篤度を示すマーカーも多数あるが、いずれのマーカーも単独でも組み合せても、いまだに信頼性のある診断検査であることは証明されず、まして敗血症の進展を予想するどころではない。
信頼できる診断パターンやロバストな予後の徴候は、従来からの臨床診察をはじめとする複雑な変数セットが時間の経過で変動する中から抽出されるので、臨床化学、生化学的データ、免疫学的データ及び血球計算によるデータは、非常に精巧な分析方法が必要とされる。これまで、医療診断用のニューラルネットワークをはじめとする専門的なシステムや人工知能の使用が進んできた。
【0009】
ニューラルネットワークは、複雑なデータシステムにおいてパターン認識が可能な非線形関数である。これは、多数の数学的関数を用いることで実行され、数学的関数がノイズを伴うデータセット内でのネットワークによる構造認識を可能にする。即ち、システムからのデータが、データ内の変数同士の関係に基づいたパターンを生成できるからである。あるニューラルネットワークが、「学習」とされている期間中にデータポイントの例題を十分に認知すれば、この構造を「学び」、将来のデータポイント又はテストデータにおけるパターンを特定することができる。このようにして、ニューラルネットワークは、既に認知したデータ内に存在するパターンをモデリングすることによって、未来の例題を予測又は分類することができる。ネットワークの性能は、テストデータを正確に予測又は分類することができる能力によって、高精度スコアで評価され、データ内の正しいパターンをうまく認識したことが示される。ニューラルネットワークの並列処理能力は、処理エレメントのアーキテクチャーによって異なるが、この処理エレメントは生物学的ニューロンのモデルにしたがって相互作用するように配置されている。1つ以上の入力があると、結合重み(connection weights)によって調整され、処理エレメント内での刺激レベルが変化する。処理エレメントの出力はその活性レベルと関係し、この出力は非線形又は不連続の場合もある。そのため、ニューラルネットワークの学習は、エレメントの伝達関数に応じたエレメント間の内的に関連した重み、相互関連した構造の詳細、その後のシステムの認知ルールが含まれる。このようなシステムは、外傷性障害患者のヘルスアウトカムモデルをはじめとする、数多くの臨床の場に応用されている。
【0010】
米国特許出願第2002/0052557号には、多くの壊滅的な疾病の発症を患者の心拍数の変わりやすさをもとに予測する方法が記載されている。データのモデル化と分析の実行可能な方法には、ニューラルネットワークが挙げられている。
国際特許出願WO00/52472は、血漿又は好中性白血球表面のCD11b又は『CD11b複合体』(Mac-1、CR3)の数値を基にした、小児用の迅速なアッセイ法を記載している。この方法はマーカーを1種のみ使用しているが、このマーカーは、炎症に反応する周知の好中球活性化マーカーと思われる。
このような複雑なデータセットは、連続的な定量データというよりは不連続な定性データであることが多いが、こうしたデータセットを分析するためのもう一つの手法は、ロジスティック回帰等の高度な統計分析手法の使用である。二値の質的従属変数を用いたロジスティック回帰が、有意な変数の選択に関して十分な分析ができない場合は、多変量解析法を使用することができる。多重ロジスティック回帰モデルとニューラルネットワークの双方からの出力は、常に不定量であるが、ニューラルネットワークモデルが算出する尤度は、両極端のどちらかになることが一般的であり、中間の値にはほとんどならない。臨床状況によっては、これが役に立つ場合が多く、より明確な判断を出すことができる。
【0011】
感染及び/又は敗血症の最も早い段階での徴候を検出することができれば、出来るだけ早い治療が可能になるという点で明らかに有利である。症状の重篤度と、治療しなかった場合の予想結果とを示すことにより、治療の選択肢についての判定を知らせる。これは、集中治療室の患者又は火傷もしくは免疫システム損傷状態の危険度の高い入院患者群、及び、深刻な感染とその後の敗血症の危険性が高い状態にある群の両方に関係する。一例であるが、戦場及び一般市民の生活の場の両方で生物兵器が使用されたか、使用された疑いがある場合、生物兵器に曝された人々に対して、感染後の最も早い徴候をテストする迅速かつ信頼性のある手段があれば有利となろう。
しかしながら、敗血症を発症前に高い予測精度(例えば、>75%、好ましくは>90%)で検出又は予測できるテストもバイオマーカーのリストも、今日に至るまで特定/作製されていない。
【発明の概要】
【発明が解決しようとする課題】
【0012】
そこで、本発明は、発症前に高い予測精度で敗血症の進展を予測/検出するためのバイオマーカーシグネチャー(バイオマーカーのリスト)、及び該バイオマーカーシグネチャーを用いて生物学的サンプルを分類するための方法を提供すること、とりわけ、敗血症とSIRSとを少なくとも95%の精度で識別、及び/又は、敗血症と非敗血症とを少なくとも92%の精度で識別できるようなバイオマーカーシグネチャーを提供することを目的とする。
【課題を解決するための手段】
【0013】
上記を念頭に、本出願人は、症状が現れる前(発症前)に敗血症の進展を予測し、少なくとも75%の平均予測精度で敗血症と非敗血症の進展、及び、敗血症とSIRSの進展を識別することができるバイオマーカーシグネチャー(バイオマーカーリスト)を見出した。該バイオマーカーシグネチャーは、表1に挙げた266の遺伝子からなる遺伝子リストから選択された少なくとも25の遺伝子、或は、25の遺伝子の発現プロダクトが含まれている。本出願人は、臨床的に敗血症を発症する前のヒト患者から回収した血液サンプルを基にしたホストトランスクリプトームの広範な分析を通して、266遺伝子のパネル(表1)が敗血症の症状の発現に非常に有意であることを確認した。全パネル及びパネルのサブセットを数多くの統計モデルに使用し、敗血症患者と非敗血症患者、及び、敗血症患者とSIRS患者との識別を判定した。本出願人は、75%を超える平均予測精度を達成するのに、少なくとも25個の遺伝子バイオマーカーよりなるシグネチャーを、表1の266個の遺伝子から無作為に選択できることを示した。
【図面の簡単な説明】
【0014】
図1】無作為に選択したRNAサンプルのバイオアナライザーによる結果を表示したものである。
図2】サンプルの選択、特にはコントロールサンプルの選択の理論的根拠と、敗血症患者のサンプルとのマッチングを描いた説明図である。
図3】表24に詳細を記した15の組合せの、非敗血症に対する敗血症の予測精度を詳述するグラフである。
図4】表1の266個のバイオマーカーから選択された異なるバイオマーカーのサブセットの予測精度を示すグラフと表である。
【発明を実施するための形態】
【0015】
とりわけ本出願人は、266個のリストから無作為に選択された44個のバイオマーカーからなる44,014の組合せ/バイオマーカーシグネチャーの分析を行い、すべての組合せの平均予測精度が75%を超えることを示した。表24に挙げた15の特定の組合せが結果を表しているが、その精度は図3に示す。そこで、実施形態の1つでは、バイオマーカーシグネチャーは、表1に挙げた266個の遺伝子からなる遺伝子リストから選択された少なくとも44個の遺伝子を含む。
また、本出願人は、少なくとも25個、少なくとも44個の遺伝子バイオマーカー、及び266個すべての遺伝子バイオマーカーを含むバイオマーカーシグネチャーを確認しており、少なくとも92%の平均予測精度で敗血症の進展を非敗血症と識別し、少なくとも95%の平均予測精度で敗血症の進展をSIRSと識別することができている。
本出願人は、人工ニューラルネットワーク(ANN)を作製し学習させ、266個から選択されるバイオマーカーいずれも、敗血症と非敗血症及び/又は敗血症とSIRSとを識別する予測精度の提供が可能である。患者のデータセットを該ANNに入力することによって、患者が敗血症を発症するか否かの尤度を提供することができる。
【0016】
患者のデータセットは、例えば、患者の血液サンプルの266個のバイオマーカーに関する遺伝子発現レベルを含むが、これをANNに入力する。ANNは既にあるバイオマーカーシグネチャー(バイオマーカーのリスト)を選択しており、その選択したバイオマーカーシグネチャーの予測精度が出力され、その特定の患者データセットが、非敗血症及び/又はSIRSではなく敗血症の進展を示しているかどうかを表示する。学習を施したANNのRスクリプトについては、表2に詳細を示す。
本出願人は、表1に挙げた266個の遺伝子からなる遺伝子リストから選択された、少なくとも25個の遺伝子、好ましくは約44個の遺伝子を含むバイオマーカーシグネチャー(バイオマーカーのリスト)、又は、これらの遺伝子が発現したプロダクトを、表2に詳細を記したANN等の数学モデルに入力すると、敗血症の症状が出る前(発症前)に敗血症の進展を予測することができ、かつ、少なくとも92%の平均予測精度で敗血症の進展を非敗血症と識別することができることを明らかにした。
【0017】
また、本出願人は、表1に挙げた266個の遺伝子からなる遺伝子リストから選択された、少なくとも25個の遺伝子、好ましくは約44個の遺伝子を含むバイオマーカーシグネチャー(バイオマーカーのリスト)、又は、これらの遺伝子が発現したプロダクトを、表2に詳細を記載したANN等の数学モデルに入力すると、敗血症の症状が出る前(発症前)に敗血症の進展を予測することができ、かつ、少なくとも95%の平均予測精度で敗血症の進展をSIRSと識別することができることも明らかにした。このような予測精度の高いバイオマーカーシグネチャーは今日まで確認されておらず、こうしたシグネチャーを使えば、敗血症進展の可能性がある患者の特定(即ち、発症前に)、敗血症患者の監視、患者への潜在的な治療の通知を可能にするキット、装置及び方法の性能が格段に向上することは明らかである。
【0018】
表1:多数の数学的方法を用いて全トランスクリプトームから絞り込まれた、発症前に敗血症の進展を予測する266個の遺伝子バイオマーカー
【0019】
【表1】

【0020】
表2:予測精度を算出するために学習を施した人工ニューラルネットワーク(ANN)のRスクリプトで、266個のバイオマーカーから選択されたバイオマーカーシグネチャーが、非敗血症及び/又はSIRSに対して敗血症の進展を識別し、ANNに入力した患者データセットが敗血症の進展を示しているか否かの尤度を表す。
【0021】
【表2】

【0022】
本発明で使用する好適なバイオマーカーシグネチャーは、少なくとも92%の平均予測精度で敗血症の進展を非敗血症と識別するか、又は、少なくとも95%の平均予測精度で敗血症の進展をSIRSと識別することができるバイオマーカーシグネチャーであり、学習を施したANN(表2に詳細を示す)等の数学的モデルにバイオマーカーシグネチャーを入力するという簡単な反復アプローチによって確認することができる。とりわけ、本出願人はこの手法を用いて、予測精度100%で敗血症をSIRSと識別することができ、予測精度97%で敗血症をSIRSと識別することができる44個のバイオマーカーによる主要なバイオマーカーシグネチャーを特定した。
従って、本発明の第1の態様は、症状が現れる前(発症前)に敗血症の進展を予測する診断キットを提供するもので、前記診断キットは、サンプル中のバイオマーカーシグネチャーの各メンバーの遺伝子又は遺伝子プロダクトのレベルを検出する手段を有し、前記バイオマーカーシグネチャーが、表1に記載の266個の遺伝子からなるリストから選択された少なくとも25個の遺伝子又はそれらの遺伝子により発現されるプロダクトを有する。
【0023】
前記バイオマーカーシグネチャーは、少なくとも75%の平均予測精度で敗血症の進展を非敗血症と識別し、敗血症の進展をSIRSと識別することができればよいが、前記バイオマーカーシグネチャーが、少なくとも92%の平均予測精度で敗血症の進展を非敗血症と識別、及び/又は、少なくとも95%の平均予測精度で敗血症の進展を非敗血症と識別できることが、とりわけ有利である。
マイクロアレイ技術を使って、敗血症発症前の患者から集めたサンプルとコントロール群の非敗血症患者のサンプルの遺伝子発現データを得た。教師なしのバイオインフォマチック手法を用いて、臨床的な症状が現れる前の敗血症を特徴づける予後のトランスクリプトーム発現パターンをつきとめた。更に、定量的RT-PCRを用いて、これらの特有のバイオマーカーパターンの解析と検証を行った。
本出願人は、266個のバイオマーカーすべてを使用すると、95%を超える予測精度で非敗血症及びSIRSのいずれとも敗血症の進展を識別することを示した。266個のバイオマーカーから44個を選択すると、100%に至る予測精度で敗血症の進展をSIRSと識別すことができ、少なくとも97%の予測精度で敗血症の進展を非敗血症と識別することができる。
【0024】
とりわけ、本出願人は44個のバイオマーカーを含むバイオマーカーシグネチャーを特定した。このバイオマーカーのリストは表3に示すが、44個のバイオマーカーすべてを予測に使用した場合、SIRSに対しては100%に至る予測能力で敗血症の発症を予測することができる。表3に示すように、この45個のバイオマーカーから絞り込んだ25個のバイオマーカーの特定のリストを使用すると、少なくとも92%の予測精度で敗血症の進展を非敗血症と識別し、少なくとも95%の予測精度で敗血症の進展をSIRSと識別することができる。上記の予測精度は、とりわけ、表2に詳細を記した人工ニューラルネットワークを用いて得られるが、他の数学モデルや他の人工ニューラルネットワークを使って得ることもできる。
【0025】
表3:266個の遺伝子バイオマーカーから選択された44個のバイオマーカーからなる特定の(第1の)バイオマーカーシグネチャーと、更にそこから絞り込まれた25個のバイオマーカーリスト
【0026】
【表3】
【0027】
266個のリストから選択された45個の遺伝子バイオマーカーからなる更なるリストの詳細を表4に示すが、とりわけ、更に絞り込んだ25個のバイオマーカーからなる特定のリストを用いると、92%より高い予測精度で敗血症と非敗血症とを識別することもわかった。
【0028】
表4:266個の遺伝子バイオマーカーから選択された45個のバイオマーカーからなるもう一つの(第2の)特定バイオマーカーシグネチャーと、更にそこから絞り込まれた25個のバイオマーカーリスト
【0029】
【表4】
【0030】
この45個と25個の遺伝子バイオマーカーからなる更なる(第2の)バイオマーカーシグネチャー2種は、前記第1の44個の遺伝子バイオマーカーシグネチャーと、それぞれ11個及び6個のバイオマーカーが共通している。また、本出願人は、44個のバイオマーカーの更なる14種の組合せを詳細に評価したところ、これらすべての組合せが少なくとも75%の平均予測精度を有するが、このうちの6種の組合せの平均予測精度は少なくとも92%である。この6種のシグネチャーを表5に示す。この6種のシグネチャーでは、表3に示した第1の44個の遺伝子バイオマーカーシグネチャーと少なくとも5個の遺伝子が共通である。そこで、実施形態の1つでは、266個から選択された44個のバイオマーカー又は25個のバイオマーカーの組み合わせはいずれも、少なくとも92%の平均予測精度を得るために前記第1の44個のバイオマーカーの少なくとも5個のバイオマーカーを含んでいるとよい。
【0031】
別の実施形態では、前記少なくとも25個の遺伝子が、前記第1の44個の遺伝子バイオマーカーシグネチャーから選択された少なくとも11個の遺伝子を含む。第3の実施形態では、前記少なくとも25個の遺伝子が、少なくとも第1の25個の遺伝子バイオマーカーシグネチャー(表3)すべてを含む。第4の実施形態では、本発明のバイオマーカーシグネチャーが、前記第1の44個の遺伝子バイオマーカーシグネチャー(表3)すべてを含む。
【0032】
表5:266個のバイオマーカーリストから選択された44個のバイオマーカーによる6種の組合せで、表2に詳細を示した人工ニューラルネットワークを使うことにより、敗血症と非敗血症を識別する平均予測精度が少なくとも92%である6種の組合せ。
【0033】
【表5】
【0034】
本発明の第2の態様では、動物の生物学的サンプルを分析して、敗血症の進展をとりわけ症状が現れる前に予測及び監視する方法であって、選択したバイオマーカーシグネチャー(バイオマーカーのリスト)の全バイオマーカーの発現を監視、測定及び/又は検出することと、監視、測定及び/又は検出によって生成されたデータを評価/査定して敗血症の進展を予測及び監視することを含む方法が提供される。
好ましくは、前記方法が、75%より高い精度で、好ましくは90%より高い精度で、又は、92%を超える高さの精度で敗血症を非敗血症と識別することができ、また、それと同じ予測精度でSIRSからも敗血症を識別できる。
前記動物とはヒトでもよく、生物学的サンプルとは血液又は血漿サンプルが最も好適である。
【0035】
本発明の診断キットは、前記バイオマーカーシグネチャーの遺伝子群の中のある遺伝子又は遺伝子プロダクトのレベルを検出する手段を備える。遺伝子発現は、タンパク質やペプチドをはじめとする遺伝子プロダクトの存在を検出することによって求められるが、こうした方法は複雑になりやすい。ある特定の実施形態は、前記手段が、核酸、なかでもDNA、又は、mRNA等のRNAといった遺伝子プロダクトの検出手段を有する。
前記監視、測定又は検出にはいずれの好適な技術を使用してもよく、認識エレメント(recognition elements)の使用又はマイクロアレイによる手法が挙げられる。そこで、実施形態の1つは、本発明のキットが、バイオマーカーシグネチャーの各遺伝子により発現したRNAへの結合に適したプローブが固定化されたマイクロアレイを有する。
別の実施形態では、前記キットが、バイオマーカーシグネチャー中の遺伝子又は遺伝子領域を増幅するのに適した試薬を少なくとも幾つか有する。
実施形態の1つでは、バイオマーカーの発現を監視、測定又は検出するのに、リアルタイム(RT)ポリメラーゼ連鎖反応(PCR)を使用する。その場合、前記手段は、遺伝子又は遺伝子領域を増幅するためのプライマーを有してもよい。前記キットは、とりわけ蛍光ラベル等のラベル、及び/又は、TaqMan、LUX等のいずれの公知のアッセイを使用してもリアルタイムでPCRの監視ができるオリゴヌクレオチドのプローブを更に有してもよい。また、前記キットは、核酸増幅反応を行うのに必要な緩衝剤、酵素、MgCl等の塩等の試薬を含んでもよい。
【0036】
第2の態様の方法は、有利なことに、数多くのバイオマーカーとバイオマーカー同士の関連を監視分析する際の複雑さを解決するためにコンピュータで実施される。こうしたコンピュータ利用発明であれば、敗血症が進展するかどうかについて、「はい」/「いいえ」の回答が可能であるか、或は、敗血症の進展の可能性がどれくらいかを表示することが少なくともできるはずである。
前記方法は、好ましくは数学的モデリングツール及び/又はアルゴリズムを使用して、バイオマーカー発現のモニタリングと評価を質的にも量的にも行う。このツールとして、特に、サポートベクターマシーン(SVM)アルゴリズム、デジションツリー、ランダムフォレスト、人工ニューラルネットワーク、二次判別分析及びベイズ分類器が挙げられる。好適な実施形態では、バイオマーカーシグネチャー中のすべてのバイオマーカーのモニタリングによって得たデータを、人工ニューラルネットワーク、例えば、表2に詳細を示した学習を施した人工ニューラルネットワークで評価する。
第2の態様の実施形態の1つでは、前記方法がコンピュータを利用した方法であり、前記監視、測定及び/又は検出において、すべてのバイオマーカー用の定量的データ、更に任意であるが定性データを生成すること、前記データをコンピュータの分析プロセスに入力すること、少なくとも1種の数学的手法を用いて前記データを参照用データと比較すること、敗血症進展の尤度を予測する出力、又は、敗血症の症状の監視を可能にする出力を前記分析プロセスから生成することを含む。前記参照用データは、健康な被験者のデータ、敗血症と診断された被験者のデータ、SIRSと診断されたが感染症ではない被験者のデータを含んでいるとよい。
【0037】
前記分析プロセスからの出力によって、症状が出る1日前、2日前又は3日前というように、症状が現れるまでの時間を予測することができるので、医者にとって治療方針を提案するのにとりわけ貴重で有用となり、特に治療方針の選択が疾病の進行次第である場合はなおさらである。また、該方法は、症状の発現尤度が治療の期間中に低下しているかどうかを評価しながら、治療がうまくいっていることを監視できる。
本発明の第3の態様は、動物の生物学的サンプルを分析して敗血症の進展を予測及び監視する装置を提供するもので、前記装置は、前述のように、バイオマーカーシグネチャー中のバイオマーカーに特有の試薬を用いたRT-PCR等の、バイオマーカーシグネチャーのすべてのバイオマーカーの発現を監視、測定又は検出する手段と、人工ニューラルネットワークのようなデータ分析用の好適な数学的モデルを有するコンピュータ等の、監視、測定又は検出手段から生成されたデータを分析する手段と、ある動物が敗血症になる尤度を予測する出力又は敗血症を監視することができる出力を前記分析から提供する手段とを有する装置で、前記出力は最適にプログラムされたコンピュータが提供することもできる。
次に、添付の非制限的実施例及び図面を参照して本発明を説明する。
【実施例】
【0038】
実施例: 敗血症発症前バイオマーカーの予測パネルの開発
この研究プログラムの目的は、臨床上の敗血症発現前に回収した患者(ヒト)の血液サンプルをもとにした、ホストトランスクリプトームの広範にわたる解析により、敗血症発症前バイオマーカーの予測パネルを開発し、感染後に臨床的症状が現れるかどうか、いつ現れるかを示すことが可能なバイオマーカーシグネチャーを開発することであった。これを行うなかで、トランスクリプトームのバイオマーカーシグネチャーを基に、敗血症患者をコントロール群患者と識別するためのバイオインフォマチックモデルが適切に力をつけていく(suitably powered)。それにより、今度は、このモデルが敗血症を予測するためのRT-PCR方法の開発を助けることになり、その性能のおかげで、医療的対策が非常に有効な段階でタイムリーな診断と治療を提供できるのである。
我々はマイクロアレイ技術を使って、発症前の敗血症患者からのサンプル及びコントロール群の非敗血症患者のサンプルの遺伝子発現データを得た。教師なしバイオインフォマチック手法を用いて、臨床的な症状が出る前の敗血症を特徴づける予後のトランスクリプトーム発現パターンを特定した。フリューダイム社製BioMark(商標)リアルタイムPCRアレイのプラットフォームで定量RT-PCRを用いて、この特徴的なバイオマーカーパターンを更に分析検証した。
【0039】
有意性の検定により、266個のバイオマーカーからなる最終的なパネルが抽出された。その後、敗血症患者と非敗血症患者との差を判定するために、多くの統計モデルで上記の全パネルやサブセットを使った。人工ニューラルネットワークにより最高の予測精度が出て、44個のバイオマーカーが最適なサブセットとなった。
技術的概要
患者サンプルの取得と保管:
患者は、インフォームドコンセントを提示すれば本研究への参加が認められた。年齢は18歳〜80歳で、臨床家の見解として感染の恐れがあり、最終的には敗血症のリスクのある手術を受けている患者であった。代表的なものとしては、腹部及び胸部手術であったが、他の外科的処置も認められ、敗血症を引き起こす広範囲な顎顔面外科手術も一例として含まれた。除外されたのは、患者が妊娠している場合、公知の病原菌に感染(HIV、A型、B型もしくはC型肝炎)している場合、通常の免疫反応が抑制されている場合、又は、入院中のいつであっても本研究への参加同意を撤回した場合であった。登録後も、すべての患者は通常の基本的な看護を受けた。
【0040】
血液サンプルはプロトコルに従って回収された。手短に言うならば、患者の血液から4mlのアリコートを2つずつ無菌のEDTAヴァキュテーナーに回収し、すぐに10.5mlのRNAlater(登録商標)(RNA固定化培地、米国ライフテクノロジーズ社製)を入れたRNAse-フリーのガラス小瓶に移した。これを−20℃で保管し、最終的にドライアイス上に移した。更に、患者の血液4mlを血清分離管に採取し、回転分離後、−20℃で保管した。血液採取は手術前は1日前と7日前の間に一度行い、手術後は毎日一回行った。手術後の血液採取は、患者の退院又は手術から7日後、或は、その前に医者が敗血症を確認した場合に終了した。患者の付加情報(例えば、患者の日々の数値指標(metrics)、手術の種類、微生物学結果等)は、英国ItemTracker社に注文したデータベースを使って取り込んだ。
我々は、緊急を要しない手術患者2273名を本研究に勧誘し、1842名分のタイムコースサンプルを保管した。これらの患者のうち、72名の敗血症が進展した。ゆえに、我々の患者コホートにおける敗血症罹病率は3.91%である。残りの患者のうち、600名を超える患者がSIRSの基準(以下の4つの症状のうち2つ:体温の上昇/下降、心拍数の上昇、呼吸数の上昇、白血球数の上昇/下降)に該当した。しかしながら、この「SIRS」患者の多くは、その総体的症状における変化が極めて一時的であった。施設(centers)で医療スタッフが特定した患者数438名が、長期的SIRS患者の数をより反映していると考えた。
【0041】
患者への勧誘が十分であったため、2011年に行うバイオマーカーの探索に使用する30名分の敗血症患者のタイムコース分(ならびに、匹敵するコントロール群非敗血症患者の分)と、2012年に行うバイオマーカー検証用の更なる40名分の敗血症患者のタイムコース分(ならびに、コントロール群非敗血症患者の分)が確保された。
61名のSIRS患者の血液サンプルの最初のバッチを分析した。これらのサンプルのうち、2つのサンプルで血液中に微生物のDNAの存在が確認された(一人はE. coli であり、もう一人はS. aureus)。この2名の患者は、敗血症の発症に進展する患者コホートに属するとして再分類された。残りの59名の患者では、血液中の微生物のDNAは検出できないレベルだった。これにより、この59名の患者が正真正銘のSIRS患者グループに属することとなった。両グループの患者のバイオマーカーシグネチャーをバイオマーカー探索の分析に供し、緊急を要していない手術患者の中で敗血症を発症前に診断するためのバイオマーカーシグネチャーが見いだされた。SIRS又は敗血症のいずれかを発症した患者のサンプル、ならびに、術後の症状が何も発現しなかった患者(術後コントロール群)のサンプルを含む患者190名のサンプルの第2バッチは、Sepsitestを使った分析に再度供した。術後コントロール群患者のすべてのサンプルは、Sepsitestにより陰性であることが確認された。更に、血液感染の敗血症患者から隔離しておいたすべての患者のサンプルも正しく特定された。全SIRS患者は敗血性ではないことが確認された。
【0042】
固定化培地からのRNA抽出:
更なるマイクロアレイ分析及びフリューダイムアレイ分析のために選択された全患者サンプルから、RiboPure(商標)Bloodキット(米国ライフテクノロジーズ社)を使ってRNAを抽出し、TURBO DNA-free(商標)(米国ライフテクノロジーズ社)で処理した。サンプルの品質に信頼性を与える目的で、アジレントバイオアナライザーRNA6000 ナノキット(米国アジレント社)を使ってRNAプロダクトすべての品質をアジレント2100バイオアナライザー(米国アジレント社)で評価した。図1は、無作為に選択した12個のサンプルを使って、何百もの(the 100th)RNAサンプルをアジレント2100 バイオアナライザー(米国アジレント社)で定性評価した結果を示す。各レーンの二重の横縞模様が、少しの劣化もない高品質のRNAであることを示している。それぞれの製剤のRIN度(RNA integrity number)やRNA濃度等のRNA製剤の質及び量についての更なる定量的測定値から、RNA単離プロトコルが目的に合っていることが示された(表6)。
【0043】
表6:代表的なRNAサンプルの定量化及び完全性(integrity)
【0044】
【表6】
【0045】
RNAサンプルの99%以上が、RINの値は7以上の結果であり、収量が2μg以上であった。これらのサンプルは、マイクロアレイ分析及び定量RT-PCR分析を行うのに十分な量と品質であった。サンプル製剤の収量が不十分であることは稀であったが、この場合は、工程を4回繰り返し、プロダクトは定量RT-PCRだけに供した(即ち、cDNAを産生してPCRをうけるのに十分なRNAであった)。
敗血症の進展に進行した患者と進行しなかった患者の選別は、各施設の治験責任医師(PI)の責務ではなかった。PIは、皆、長年の診療経験を有する集中治療室顧問臨床医(consultant intensive care clinicians)であり、265を超えるピア・レビュー出版物がある。4施設の4人のPIのうち2人は、欧州と米国で機関誌や研究助成金提供団体の顧問的な重要な役割を果たしていた。臨床医が選別を行い、プロジェクトチームが再確認を行い、すべての患者が既に承認されている敗血症の定義に対する基準に合っていることを確認した。周術期の抗生物質の使用は最小限とし、敗血症患者症例の85.7%では、敗血症の診断前は広域抗菌スペクトル性の抗生物質が一投与のみであった。残りの患者は、毎日抗生物質の投与を受けていたが、敗血症の臨床的徴候を発現させた。こうした治療は微生物培養結果に影響する可能性はあるが、治療にもかかわらず敗血症が進展したことから、臨床指導のもと、これらの患者を本研究に加えた。本研究において敗血症を引き起こす感染物質の範囲はかなり広く、表7に示す。
【0046】
表7:本研究の第I相及び第II相において敗血症患者から単離した感染物質
【0047】
【表7】
【0048】
患者が敗血症と特定されると、各敗血症患者の年齢、性別及び手術に匹敵する対照群が選択された。これらの患者は、手術後にSIRSが進展しなかった患者である。図2は、どの患者サンプルが分析に供されたか、また、手術後の日数が異なる日に採取される患者のサンプルのタイムフレームをどのように標準化するかを示し、比較群選択の理論的根拠を説明している。発症前の有用なバイオマーカーシグネチャーが得られる可能性が最も高いということから、敗血症と診断される前の3日間に焦点を置いて主要な分析を行ったことを記しておく。ある敗血症患者の進展の過程を、敗血症患者#1のバーで示す。手術後に敗血症には至っていない多数の患者から、年齢/性別/手術が適合した対照を特定し、コンパレータ―として使用する。この例では、敗血症と診断された日は感染から7日後である。ゆえに、敗血症診断前3日間は、手術から4日後、5日後及び6日後ということになる。発症前の診断という観点からは、診断3日前、2日前及び1日前と表すこともできる。敗血症診断前の3日間のそれぞれの日について、手術後の比較を適切でロバストなものにするために、相応する手術後の血液サンプルを使用した。この場合、手術後4日、5日及び6日に採取した血液サンプルを比較に使用したが、これらは、(診断から)3日前、2日前及び1日前の対照群となる。敗血症が進展した患者の発症前の血液サンプルを、最も適切な手術後コンパレータとマッチさせる作業は、本研究の第I相及び第II相で繰り返し、結果的に、敗血症が進展した30〜40名の患者のタイムコースデータを手術後コンパレータ患者30〜40名とそれぞれ比較した。
【0049】
非敗血症のコンパレータ群だけでなく、敗血症ではなくSIRSが進展した患者からのサンプルに加えて、各患者の手術前サンプルを利用して更なる対照群を設定した。これにより、敗血症患者のトランスクリプトームに発見されたいずれの変化も、手術中に感染した直接的な結果であることが確認された。本研究の第I相及び第II相の両方で使用した患者について、概要を表8に示す。抗生物質の使用はケースバイケースで、臨床医の判断のもとに使用されたことを記しておく。本研究のプロトコルが患者の管理に影響したことはなく、本研究中に我々が医療的対策を指示することは倫理的にできなかった。
【0050】
表8:第I相及び第II相における患者の年齢、性別、敗血症までの猶予期間、手術の種類の概要
【0051】
【表8】
【0052】
マイクロアレイ分析(第I相−バイオマーカーの探索):
第I相の60名の患者(30名の敗血症患者と30名のコンパレータ)及び第II相の80名の患者(40名の敗血症患者と40名のコンパレータ)及び第II相の40名のSIRS患者からのサンプルを、Illumina(登録商標)Human HT12v4 Beadarrayで処理した。これは、第I相では192のトランスクリプトーム分析、第II相では433のトランスクリプトーム分析に相当した。30名の敗血症患者と、年齢、性別及び手術をマッチさせた30名の対照群(参照用)のデータを集めた。マイクロアレイデータは血液サンプル192個から集めた。これらは、手術前、敗血症発症の1日前、2日前、3日前に相当する異なる4つの時点を表した。敗血症サンプルの発症した日を基に、それぞれ参照用とペアにしてサンプル群を調達した。表9に概要を示す。
【0053】
表9:本研究の第I相で使用したサンプル数
【0054】
【表9】
【0055】
Illumina(登録商標)Human v4チップは、27,000を超える参照配列番号までマッピングする48,804個のプローブを有する。各プローブは50の塩基ペアの長さで、各遺伝子の特異性を高度に示す。各サンプル用に、グロビン低減RNA(GlobinClear(商標)、米国ライフテクノロジー社)を全RNAから調製した。RNAの完全性(RIN度)はバイオアナライザー2100(米国アジレント社)で測定し、濃度はNanoQuant(商標)(米国Tecan社)を用いて評価した。Illumina(登録商標)TotalPrep(登録商標)RNA増幅キット(ライフテクノロジー社)を使って増幅及び標識化してcRNAを調製し、ハイブリダイゼーションを行い、Human HT-12 v4 Beadarrays(米国Illumina(商標)社)に供した。その後、Illumina(登録商標)HighScanHQ(登録商標)で各チップを画像化した結果、強度によって各プローブが対応するが遺伝子の発現レベルが表された。GenomeStudio(登録商標)ソフトウェア(米国Illumina(登録商標)社)を使って、バックグラウンド減算データを生成した。
【0056】
第I相のマイクロアレイデータについて、様々な予備的分析又は探索的分析を行い、以下を判断した。
1.データにバッチ処理の影響があったか。
2.手術前トランスクリプトームと手術後トランスクリプトームとの間に違いがあったか。
3.敗血症が進展した患者のトランスクリプトームとその参照用コンパレータのトランスクリプトームとの間に著しい違いがあったか。
【0057】
バッチの影響:
3D主成分分析(PCA)を用いて、サンプルのハイブリダイゼーションを行った日が本研究における患者のトランスクリプトームに影響を与えたかどうかをしらべた。
ハイブリダイゼーションの日をかえて行ったが、サンプルが分離して異なるグループにならないことがわかった。このことにより、ハイブリダイゼーションの日によるバッチの影響はサンプル間にはないことが示された。
【0058】
手術前トランスクリプトームと手術後トランスクリプトーム:
手術前と手術後の患者のトランスクリプトームに何か違いがあるかどうかもPCAを使った。この分析によると、手術前の患者のトランスクリプトームはまとまっていた(cluster together)。これは、手術前の患者のトランスクリプトームが手術後の患者のトランスクリプトームとよりも互い同士が類似していることを示唆している。更には、手術後の患者の全サンプルのトランスクリプトームは、手術前のトランスクリプトームとは異なるがまとまっており、手術後患者のトランスクリプトームも、手術前患者のトランスクリプトームとよりも手術後患者のトランスクリプトーム同士との方が共通していることがわかった。
【0059】
敗血症が進展した患者とそのコンパレータとの違い:
階層的クラスタリングは、PCA同様、データセットの教師なし解析に使用するツールである。階層的クラスタリングを使い、両方の患者群のトランスクリプトームをヒートマップで示した。階層的クラスタリングは、同じようなトランスクリプトームパターン(発現プロファイル)が隣同士にくるようにデータセットの遺伝子の並び替えを行う。実際、互いに関連性のあるサンプルを特定するのに有用なツールである。
ヒートマップの予備的調査によると、比較用の(発症)1日前、2日前及び3日前の参照用患者のトランスクリプトームと同様に、手術前サンプルは、一般にヒートマップの上半分にまとまっている。それに対し、(発症)1日前、2日前及び3日前の、敗血症が進展する患者のトランスクリプトームは、ヒートマップの下の方にまとまっているようである。敗血症が進展する患者とその参照コンパレータのトランスクリプトームには違いがあることがわかる。
192個のサンプルからトランスクリプトームのデータを集めたのち、2つの患者群間で発現が有意に異なる主要なバイオマーカーを解明するためには、更なる分析が必要とされた。これらのホスト応答遺伝子(host response genes)がバイオマーカーシグネチャーの基礎を形成し、これを使えば、生命を脅かす疾病に伴う症状が進展する可能性のある個体を指摘できるようなる。
【0060】
バイオマーカーの探索 -マイクロアレイ(第I相)-
データの前処理:
データの前処理には3つの主要工程があった。
1.対数変換:更なる分析に必要な正規性の前提を満たすために、トランスクリプトームのデータでeを底数とする対数変換を行う。
2.手術前減算(Pre-surgery subtraction):手術への反応による各サンプルの対数発現を得るために、手術前の発現レベルと比較した差にすべてのサンプルを正規化した。
3.中央値の減算(Median subtraction):これは、系統的なばらつきを明らかにするために、各遺伝子プローブにおいて重要であった。
【0061】
重要な遺伝子を確定するための多重仮説検定:
敗血症と診断される前の3日間、遺伝子発現の有意差(定めた閾値p値以下)のエビデンスを見つけるため多重t検定を用いた。分析により、敗血症の診断前3日間すべてで、2つの患者群間で452の遺伝子が有意に異なることが示された。また、敗血症の診断前のそれぞれの日において、2つの患者群間での有意差にはエビデンスがあることも確認した。敗血症と診断される3日前、2日前及び1日前には、それぞれ91、1022及び938の遺伝子発現において有意差のエビデンスがあった。
そこで、我々は、マイクロアレイの有意差解析(SAM)(Tusher VG、Tibshirani R、Chu, X. 2001. Significance analysis of microarrays applied to the ionizing radiation response(電離放射線反応へのマイクロアレイの有意差解析の応用)Proc Nat Am Sci 98:5116-5121、R. Tibshirianiによりスタンフォード大学で発表)を実行する同様の手法を採用した。この方法はマイクロアレイ解析に通常使用されている。我々はこの代案は利用する価値があると感じた。なぜならば、最初の発見に対して独自の検証ができるので、発症前診断用のバイオマーカーの終局的な選択に信頼性を与えることができると感じたからである。
【0062】
発現解析とそれに続くSAM:
敗血症の発症といった既知の応答変数に基づいた被験者群間の遺伝子発現の違いを求める検定として、遺伝子発現解析を用いた。表10で定義した患者群を使って、応答変数を4つの異なる検定ごとに生成した。
【0063】
表10:遺伝子発現解析に使用した患者のカテゴリー
【0064】
【表10】
【0065】
4つの検定とは、以下の通りである。
1.S1+S2+S3 対 B1+B2+B3
2.S1 対 B1+B2+B3
3.S2 対 B1+B2+B3
4.S3 対 B1+B2+B3
統計用R言語ソフトウェアのSAMパッケージを使って、上記4つの検定それぞれについて発現解析を行った。各遺伝子iについて、2つの反応群間での発現の平均差から発現統計値dを算出する。この平均差rは標準偏差により下記式にしがたって決められる。
【0066】
【数1】
【0067】
この統計値は、遺伝子発現と応答変数との関係性の強さを測定することから、その大きさを基準とした自然順がある。
どの遺伝子が有意に発現されているかを判定するために、SAMは並び替えによる分析手法を採用して、様々な異なる検定統計閾値(デルタ)におけるローカルのフォルス・ディスカバリー・レート(偽発見率:FDR)を概算する。
有意な遺伝子を誤って特定してしまうという一貫した危険を保証しておく(ensure a consistent risk of falsely identifying)ために、それぞれの検定でFDRを1%にした。しかしながら、閾値の変化とともにFDRが変わるのは、発現統計値のばらつきによるもので、所定のデルタの範囲で最小のFDRであることが多い。
例えば、症状が出る2日前の敗血症の診断について、FDRの推定値を表11に示す。
【0068】
表11:敗血症の診断2日前の、デルタ値の範囲に対するFDR予測値の90パーセンタイル
【0069】
【表11】
【0070】
偽発見率(FDR)の見込みの上限として90パーセンタイルが用いられる。FDR1%(0.01)は許容できる危険度とみなされるが、デルタを1.47より高くするとFDRが再び上昇することが上記の表から明らかである。そこで、FDR<1%も満たされることから、デルタ値1.47を選択し、該診断用に全部で109の有意な遺伝子を特定した。
この手法を行った結果、敗血症発症前の3日間すべてにおいて2つの患者群間で発現に違いがある458の遺伝子を特定した。更に、発症の3日前、2日前、1日前それぞれにおいて、167個、179個及び226個の遺伝子の発現が患者群間でとりわけ差異があることがわかった。全部で163個の遺伝子、1日前では18個の遺伝子、2日前では12個の遺伝子、3日前では51個の遺伝子が、この検定に特有のものだった。
【0071】
モデル:
更なる検証のために選択したすべてのバイオマーカーは、その性能を定性的及び定量的に評価できるように数学的にモデル化しなければならない。以下によって有用なモデルを決定することが重要である。
‐いずれの前提も分析の目的に合っていることを確認する。
‐その分析が新しい手法でない場合は、モデル選択用の前例(precedent)を定める。
‐適切な感度分析を行い、モデルの限界を判定する。
‐モデルを科学理論的根拠に相関させる。
【0072】
生物構造機能学及び生物情報科学の分野においては、数多くの分析経路やアルゴリズム(又はモデル)を利用することができる。このような手法すべてを、敗血症を発症前に診断するための最適なバイオマーカーの選択と検証に利用することは不可能である。本プロジェクトの状況における分析基準を表12に示すが、モデルには適切な条件があるため、多くの手法は次々にはずされることになる。
【0073】
表12:バイオマーカーの選択と分析に使用するモデルの絞り込み
【0074】
【表12】
【0075】
最良適合法を決定するため、いくつかのモデルを作成した。
分析1:
サポートベクターマシーン(SVM)、ランダムフォレスト及び差異解析(Differential analysis)を用いて、目的のqRT-PCRに絞り込むための遺伝子をフリューダイムアレイで同定した。生存分析も使用したが、これは時系列的情報を利用する。すべての分析は、R2.14.0及び関連のRパッケージを介して行われた。
SVM及びランダムフォレストは教師あり機械学習アルゴリズムで、バイオインフォマチックツールとして一般に使用されている。変数(遺伝子)選択の容易さは、これらの方法を選ぶ際の主要な要因であった。SVMは観測を行い、2つのラベルが付いたグループを分割するのに最良の超平面を見つけ出す。ランダムフォレストアルゴリズムは、アンサンブル分類器で、バギングを使ってたくさんの独立した分類木を生成する。それぞれの木は学習データセットを有し、最初の観測値のサブセットはサンプルの約66%で、残りのサンプルは分類木の精度を決定するのに使用される。変数のランダムサブセットを使って各分類木が生成され、平均ジニ係数と呼ばれる分類木精度への影響の強さ基準に基づいて遺伝子を並べることができる。ランダムフォレストは0と1の間の値を出力する確率的分類器で、所定のサンプルが特定のクラスに属する確率を示す。
【0076】
敗血症の進展で役割を果たしているプローブを見つけ出すために、生存分析も使用した。この方法の主たる魅力は、異なる日のマイクロアレイデータをモデルに一体化させることができるところである。一方の機械学習手法は、重要な遺伝子を見つけ出すのに一時点しか使われない。しかしながら、この手法は予測用には開発されておらず、遺伝子ごとに別個のモデルを生成する。標準的な発現差異(standard differential expression)からのt統計量と同様に、検定統計量は遺伝子ごとに計算された後、それを使って遺伝子を並べる。
SVM、ランダムフォレスト、発現差異及び生存分析の手法は、表13に細かく示すように、第I相のマイクロアレイデータを分析する際、遺伝子選択において有意な重なりを見せた。すべて手術後のサンプルを使って、ランダムフォレスト、SVM、生存分析の手法が見出した敗血症前の上位531個の遺伝子は、発現の差異で見つけ出された遺伝子と多くが重なっていた。重複していたすべての遺伝子は非常に有意であり(p値<0.001)、重複した遺伝子の数を表13にまとめる。
【0077】
表13:発現遺伝子の発現差異解析 − 異なるモデル間で重複した遺伝子
【0078】
【表13】
【0079】
このデータを使った予測率をランダムフォレスト及びサポートベクターマシーン(SVM)で算出した。それぞれの日(手術前、診断1日前等)を敗血症群とコントロール群に分割した。診断1日前、2日前及び3日前それぞれで、割り算、引き算による手術前正規化を行った場合と、正規化を行わない場合で予測を行った。日にちをまたいだ平均値も考察した。例えば、患者ごとの診断1日前と2日前を合わせた平均を出した。サンプルは独立しているという仮説を支持するため、日を一緒にまとめてメタグループとすることはしなかった(敗血症群又はコントロール群)。各時点の間隔が同等であるという誤った前提のもとで(手術前の日から診断3日前までの時間は不定であった)、すべてのデータを生存分析に使用した。
【0080】
ランダムフォレストによる敗血症の予測:
ランダムフォレストは、たくさんの単純なツリー分類器から構成され、各分類器は、各ツリーの学習と検定用(70%:30%)のために、サンプルの無作為で異なるサブセットを基本とするため、誤判別率(error rate)を正確に評価できる。以下は、時点グループごとの敗血症の予測感度と特異度である。診断2日前及び3日前(D-2及びD-3)のサンプルサイズが小さいことを記しておく。手術前による正規化(対数変換前データの割り算)と日にちをまとめたところ、診断1日前と診断2日前を合わせた平均が最も正確な結果を出したことがわかった。引き算による正規化(示さず)は、割り算による正規化よりも結果が良くなかった。
【0081】
表14:ランダムフォレストを用いて特定した遺伝子のパフォーマンス
【0082】
【表14】
【0083】
ランダムフォレストと比較するために、非正規分布(non-normally distributed)のプローブを考察するウィルコクソン検定を合わせたサポートベクターマシーン(SVM)を採用した(表15)。診断1日前と2日前の平均が最良のパフォーマンスであったことを考えあわせ、これに注目し、テストデータの20%(20% for testing)を使って5分割交差検定を使用した。標準誤差は括弧で示す。
【0084】
表15:サポートベクターマシーンを用いて特定した遺伝子のパフォーマンス
【0085】
【表15】
【0086】
どちらの手法も許容できる手法であったが、2つの患者群間での顕著な差異化はみられなかった。即ち、これらのデータセットのモデル化には他の手法が有用である可能性を示唆した。
【0087】
分析2:
人工ニューラルネットワーク(ANN)は、例題データセットの不明のパターンが与えられると、データのクラスを予測する能力があり、ANNはこれまで試験的研究にうまく使用されてきた。ニューラルネットワーク分析は下記の工程で説明される。この分析をそれぞれ5回行ったところ、予測能力に許容しうる変動(possible changes in predictive ability)が見られた。
1.敗血症発症後、敗血症診断日の1日前、2日前、3日前すべての遺伝子発現データを、各検定用のSAM分析を基に確認した。このデータの正規化は、遺伝子ごとにメジアンの減算と標準偏差によるスケーリングで行った。
2.正規化したデータは、70%はニューラルネットワークの学習用サブセット、30%はニューラルネットワークの検証用に分割した。
3.ニューラルネットワークを学習させ、隠れユニットごとの重み(weights)を使って新しいデータの予測子(predictor)を形成する。
4.30%のサブセットは予測子に通し、2つの群(敗血症、非敗血症)のそれぞれに割り当てるための確率が出る。
5.ニューラルネットワークの予測能力は、30%の未知のデータセットから評価した特異度と感度を基準とした。
特異性と感度の平均は5個の別個のニューラルネットワークから得られた。結果を表16にまとめる。
【0088】
表16:5回繰り返した予測子の標準誤差を基にした、時間をおいた異なる日における敗血症の予測結果概要(SAM分析で特定された遺伝子を使用)
【0089】
【表16】
【0090】
ニューラルネットワーク分析は、感度/特異度の評価に使うべきサンプルの数による制限がある。新しいデータを予測子に通さなければならないからである。我々は、このデータセットを用いれば、他の分類手法の方が、より多くの患者数を基にした、より正確な結果を提供できるであろうことは十分に認めているが、分析1で用いた手法よりもよい結果であった。
SAM分析において特定された458の遺伝子を鑑み、また、検定統計量の大きさによる自然順によることを鑑みると、同等な予測能力を有しサイズが小さいサブセット(データは示されていない)を見つけ出すために、遺伝子をリストの一番上から選択することができた。
分析1及び分析2で行った異なる分析の結果、バイオマーカーの絞り込みを行った。上記で概説した手法のいずれかにより、もっとも予測性があると確認されたバイオマーカーを選び出し、フリューダイムqRT-PCRアレイシステムを使った更なる分析に供した。合計270個の遺伝子と、すべてのサンプルで常に発現したために6つのハウスキーピング遺伝子(BRD7、PWWP2A、RANBP3、TERF2、SCMH1、FAM105B)も一緒に選択された。
【0091】
フリューダイムによるマイクロアレイバイオマーカーの確認と定量化:
フリューダイム社BioMarkHDを使用して、全時点で採取した60個の第1相サンプルと80個の第II相サンプルにおける270の遺伝子のプロファイルを行った。BioMarkHD(商標)は、サンプル96個のプライマーとプローブとの96のペアを処理するqPCRアッセイである。具体的には、グロビン低減RNA(GlobinClear(商標)、米国ライフテクノロジー社)をcDNAに変換(ハイキャパシティーRTキット、米国ライフテクノロジー社)後、該当するすべてのアッセイのためのプライマープール(この場合は、276アッセイとプライマーペアのプール)(DeltaGene、米国フリューダイム社)を用いて、制限PCR(limited PCR)で前増幅を行った(PreAmp(商標)Master Mix、米国ライフテクノロジー社)。前増幅cDNAをエクソヌクレアーゼI(米国ニュー・イングランド・バイオラボ社)で処理し、希釈して未使用のプライマーとdNTPとを取り除き、qPCR用サンプルを調製した。前増幅サンプルは、2 x SsoFast EvaGreen Supermix with Low ROX(米国バイオ・ラッド社)及び20 x DNA Binding Dye Sample Loading Reagent(米国フリューダイム社)と混合し、アッセイ(プライマーペア)は2 x Assay Loading Reagent(米国フリューダイム社)と混合した。サンプルとアッセイの混合物を、BioMarkHD(商標)(米国フリューダイム社)の96x96のリアルタイムPCR解析用ダイナミックアレイIFCに装填した。フリューダイム社のリアルタイムPCR解析ソフトウェアを使用してCt値(閾値に達した時のサイクル数)を求め、線状(derivative)基線補修及びアッセイ固有の閾値の自動判別による判定を前処理として行った。基準遺伝子又はハウスキーピング遺伝子を使用して、各アッセイを正規化し、デルタCt値を生成する。更に基準サンプルを使用してプレート上のすべてのサンプルを正規化し、得られる値をデルタ-デルタCt値とする。96x96の3枚のプレートを使い、各プレートで270個の遺伝子と6個のハウスキーピング遺伝子のプロファイルを行った。
【0092】
第I相の60名の患者からの合計269個のサンプル(最初の第I相の192個 + コンパレータ群のサンプル)、第II相の80名の患者からの439個のサンプル(更にSIRS患者の40個のサンプル)について、フリューダイム社のBioMark(商標)を使ってプロファイルを行った。本研究の第I相のデータを最初に分析したことを記しておく。最初の分析はSVMを使い、絞り込んだバイオマーカーリストのパフォーマンスを評価した。表17に詳細を示したが、アレイは非敗血症であるコンパレータの患者を認識するのに非常に優れていた。しかしながら、敗血症患者の陽性を識別するパフォーマンスは、敗血症の診断前の時間が遡るにつれ低下した。更に、敗血症発症前の3日間のデータをプールした場合、アレイの全予測精度は78.8%であった。
【0093】
表17:第I相データでの発症前の敗血症患者とそのコンパレータの予測における、絞り込んだバイオマーカーのパフォーマンス(%)(フリューダイムアレイ使用)
【0094】
【表17】
【0095】
バイオマーカーシグネチャーの最適化:
第I相における分類器のパフォーマンスにより、新たな情報を鑑みてバイオマーカーリストは更新の必要があると判断した。第I相の結果から、発現差異解析を基にした遺伝子リストの絞り込みが可能になった。
【0096】
第II相のサンプルを用いたバイオマーカーの検証−独立したデータセットによるブラインドテスト:
本研究を通して、患者から新鮮な(fresh)サンプルセットを得た。これを、第I相から絞り込んだ遺伝子の検証に使用した。すべてのRNAサンプルを調製し、盲検として(blinded)、マイクロアレイ及びフリューダイムアレイ分析に供した。前記のように、SAM分析等いくつかの手法で266個の遺伝子を決定した。ランダムフォレスト分類器のジニ係数等の分類アルゴリズムから取り出した手段を用いて、この遺伝子セットを更に減らした。
2つのグループの分類器が選択された。1つは45個の遺伝子、他方は25個の遺伝子を有する。これらを表18に示す。
【0097】
表18:盲検とした433個のRNAサンプルのマイクロアレイ及びフリューダイムアレイ分析を用いて、本研究の第II相で予測精度を検定した45の遺伝子分類器と25の遺伝子分類器
【0098】
【表18】
【0099】
各サンプルがどのタイプの患者のものであったかを予測し、その予測を送って混合されない状態にした(sent them to be unblended)。これらの分類器のパフォーマンスを表19にまとめる。
【0100】
表19:バイオマーカー分類器のパフォーマンス(%)
-(A)コンパレータ群の患者のサンプルの予測精度、(B)発症前の敗血症患者のサンプルの予測精度
【0101】
【表19】

【0102】
表19は、採用した分析によって、敗血症患者と非敗血症患者とそのコンパレータとの間が所定の水準まで分類できることを示している。また、これらの表から、敗血症と診断された日から離れるほど、また、患者数Nが減少するほど、分類器のパフォーマンスが上昇することがわかる。
【0103】
バイオマーカーの評価:
当初のフリューダイムアレイから幾つかのバイオマーカーを除くことを決定した後、バイオマーカーの31.5%を、第II相のより良い候補とみなされたバイオマーカーで再構成した。この最終的なバイオマーカーリストには、第I相で特定され、フリューダイムの検証に使用された非常に有意な180の遺伝子が依然として含まれていた。SAM分析で追加候補のバイオマーカーとみなされたバイオマーカーが加わり、主要な発症前バイオマーカーを見つけ出す尤度が上昇した。これにより、遺伝子リストは、最適な遺伝子と判断されたものはそのまま保持し、かつ、発現差異解析で有意とわかった他の遺伝子をリストに盛り込むことができた。この最終リストを表20に示す。
【0104】
表20:第II相のフリューダイムアレイに使用するために最終的に絞り込まれた遺伝子
【0105】
【表20】

【0106】
なぜ、これらのバイオマーカーの候補が2つの患者群において敗血症の存在を示すのか、その理由を理解するために、これらの絞り込まれた遺伝子の発現の変動に影響を受けた経路及びネットワークをGeneGoソフトウェアで解析した。敗血症の診断より1日前の時点で、ホストの全経路の中で、補体、上皮−間葉系、細胞骨格系リモデリング経路は、過剰発現した遺伝子の割合が最も高かった。それに対し、敗血症の診断より1日前の時点で、ホストの応答経路のなかで免疫細胞に関連した経路やGタンパク質シグナル伝達経路は、発現が低下した遺伝子の割合が最も高かった。炎症性のアポプトーシスや細胞接着ネットワークは、健康なコンパレータ群の患者においては非常に発現増加したが、敗血症患者群では結果的には非常に発現低下した。同様のパターンが、タンパク質翻訳制御ネットワーク、抗原提示及びT細胞受容体シグナル伝達ネットワークでも見られた。
【0107】
重要な(highlighted)バイオマーカーのqRT-PCR検証:
− 独立したデータセット(第II相サンプル)でのブラインドテスト
第1の絞り込みバイオマーカーシグネチャーのパフォーマンスを考慮にいれ、遺伝子の数は更に少なくても、十分な予測精度を提供できるであろう第2のバイオマーカーのセットを絞り込むことにした。第1のセットと比較するために、266の遺伝子リストの無作為サンプルを抽出し、人工ニューラルネットワーク(ANN)の予測精度を求めることによって、44の遺伝子と25の遺伝子からなる2つの発症前バイオマーカー分類器を絞り込んだ。表21に挙げた44の遺伝子と25の遺伝子は、予測精度が最高値となった遺伝子リストである。
【0108】
表21:本研究の第II相で、盲検として433のRNAサンプルをフリューダイムアレイ分析して予測精度を検定した44個と25個の遺伝子分類器
【0109】
【表21】
【0110】
探索的分析:
検証用コホートに266の遺伝子を使って、敗血症、SIRS及びコンパレータ群の患者データの主成分分析(PCA)を行った。分類アルゴリズムによって群間に分界線が見い出されたことから、3つの患者群の分類は、更に解析を行うことができた。Dstlの44遺伝子分類器を使った検証用コホートのPCA分析で、上記の分類は更に明確になった。
【0111】
ANNの結果:
ANN手法のことはすでに第I相のパートとして説明した。70名の敗血症患者と70名のコンパレータ群の患者(第I相及び第II相の患者を合わせたもの)からのデータ/サンプルを使って、手術前、敗血症発症の1日前、2日前及び3日前に対応した異なる時点で、結果、600を超えるサンプルを使って、学習と検定(70:30)が行われた。5回繰り返した予測子の標準誤差を基にした、時間をおいた異なる日における敗血症の予測結果の概要を表22に示す。表2に詳細を示した人工ニューラルネットワークを使った。
【0112】
表22:ANN使用による敗血症の予測結果概要
【0113】
【表22】
【0114】
この結果から、ANNは、高い信頼度で敗血症患者と非敗血症患者とを分類することができることがわかる。この信頼度は、分類器の遺伝子の数を例えば25に減らした場合、ほとんど変動していない。この結果から、分類する際には最適な遺伝子数があることがわかる。
【0115】
ニューラルネットワーク分析 - SIRS:
これらの結果には、敗血症ではなくSIRSが進展する患者のバイオマーカーシグネチャーが、敗血症患者のバイオマーカーシグネチャーと同様であるか、重なる可能性があるのではないか、という混乱の原因が潜在的にある。そのため、偽陽性をうみだしたり、敗血症の発症前バイオマーカーシグネチャーの予測の有用性を台無しにしかねない。検査結果の信頼性が欠如することになろう。そこで、敗血症バイオマーカーシグネチャーに対し、SIRS患者40名分のデータをANNで分析した。その結果を表23に示す。
【0116】
表23:5回繰り返した予測子の標準誤差を基にした、時間をおいた異なる日における、敗血症vs.SIRSの予測結果概要
【0117】
【表23】
【0118】
表23の結果は、ANNが敗血症患者とSIRS患者のバイオマーカーシグネチャーを効果的に分類していることを示している。更に、分類には最適な遺伝子数があることが表23からもわかる。更に、263個の遺伝子と45個の遺伝子での結果の違いが示唆することは、263個の遺伝子バイオマーカーリストの中には、SIRSシグネチャーと共通点があるということである。
266のリストから無作為に選んだ44個のバイオマーカーで44,014通りの組合せ/バイオマーカーシグネチャーを作成したところ、すべての組合せで平均予測精度が75%より高い(実際は76.1%以上)ことがわかった。上位1,000のサブセット及び下位1,000のサブセットでの個々の遺伝子の存在度(abundance)は一様ではない。即ち、44個のバイオマーカーによる上位のサブセットに頻繁に現れる遺伝子は下位のサブセットにはそれほど頻繁に現れず、逆も同じである。
これらの結果を、表24に挙げた具体的な15通りの組合せで示す。それぞれの精度は図3に示す。即ち、実施形態の1つでは、バイオマーカーシグネチャーが、表1に挙げた266の遺伝子からなる遺伝子リストから選択された、少なくとも44の遺伝子を含む。
【0119】
表24:予測精度をテストした、44のバイオマーカーによる15の組合せ。予測精度は図3に示す。
【0120】
【表24】
【0121】
【0122】
図4に鑑みるが、266の遺伝子からなるパネルから、バイオマーカーの数が異なる98のサブセットを形成した。各サブセットの特徴は、44,014通りから選択された上位1,000のサブセットにおいてある特定の存在度を示す遺伝子を含むということだけである。サブセットは、1個の遺伝子(LDLRで、この存在度は明らかに最多である)のものから、266のバイオマーカーからなるパネル全体のものにまでに及ぶ。同じ存在度の遺伝子が多数ある場合は、それらの遺伝子すべてを、その閾値と結びつけて、1つのサブセットにまとめている。それゆえ、全遺伝子よりもサブセットの数が少ないのである。表2に詳細を記したものよりもベーシックなANNからトレンドが推論されるが、それは、サブセットのサイズが大きくなるにつれ予測精度が上昇し、サブセットのサイズが遺伝子97個になると予測精度の上昇が止まりはじめるというトレンドである。ここで予測精度が最高の97.0%に到達する。サブセットサイズが遺伝子149を超えると、予測精度は低下し始め、89.6%まで落ちる。このトレンドは、ランダムフォレストで得られたトレンドとは一致しないが、たくさんの無作為のサブセットというよりも、規定をつけたサブセットをここでは検討している。最高予測精度に達した3つのサブセットのうち、サイズが最小であるサブセット(サブセット50)は、検定の上位1000のサブセットに165回以上出現する遺伝子を含んでいる。
【0123】
システム‐スケールプロファイル手法を用いて、本研究では、術後の敗血症進展を高い精度で予測するバイオマーカーシグネチャーを、かなり大きなサイズの盲検検証セット(sizable blinded validation set)で特定した。複雑なデータセットを分析する際にポイントになるのは、分析方法である。我々の手法は、いずれのバイオマーカーもヒトの敗血症を予測しえないという推論に基づいていた。発症前のバイオマーカー発現についての先行研究は、バイオマーカー発現の従来からの線形解析では、2つの患者群、即ち、敗血症患者と非敗血症患者間の差を明らかにできないことを示していた。様々な非線形手法が用いられたが、敗血症が進展する患者のトランスクリプトームとそのコンパレータのトランスクリプトームとの識別がうまくいったかどうかもばらつきがあった。ランダムフォレスト及びSVMは、異なる患者群のトランスクリプトームの識別に使用できることを実証した。しかしながら、ANN分析は、25及び44の遺伝子バイオマーカーシグネチャーを使い、素晴らしい結果をだした。このバイオマーカーシグネチャーは、敗血症が進展する患者とそのコンパレータとを識別する際に、感度と特異度が高いだけでなく、予測精度も高かった。更には、SIRSであって敗血症が進展しなかった患者のトランスクリプトームは潜在的に混乱を引き起こすものであるが、これに対しての検定でも、我々が導き出したバイオマーカーシグネチャーは、非常にロバストであった。
【0124】
非線形手法のしっかりしたパフォーマンスは予想外ではないのかもしれない。というのも、免疫マーカーは敗血症の全タイムコースにわたって大きく変動しているからである。単純な線形手法を用いた分析では、容易に主要バイオマーカーシグネチャーを取り出せるとは考えられない。
また、複合的なqRT-PCRを使用することによって患者のトランスクリプトームの検定がうまくいったということは、この手法が診断アッセイとして更なる開発をするのにふさわしいことを示している。このことも注目に値する。
本シグネチャーを構成するトランスクリプトのサブセットは、その機能的関連性が、炎症や敗血症の際に伴う事象での調整された分子鎖及び細胞鎖と広くかかわっており、我々の結果は自信をえる。実際のところ、補体経路の活性化が敗血症や炎症において重要な役割をはたしていることがわかってきた。逆に言えば、樹状細胞及び他の抗原提示細胞は、敗血症エピソードの最中には血液循環系から消えていることがわかったが、これは、MHC遺伝子発現に関連したトランスクリプトの存在量の減少が観測されたことを説明できる。その上に、本研究の偏りのないグローバルなプロファイル手法によって同定したマーカー候補の大半が、機能豊富な「ランドマーク」的トランスクリプとはみなされていなかった点も留意すべきである。
図1
図2
図3
図4-1】
図4-2】