【実施例】
【0038】
実施例: 敗血症発症前バイオマーカーの予測パネルの開発
この研究プログラムの目的は、臨床上の敗血症発現前に回収した患者(ヒト)の血液サンプルをもとにした、ホストトランスクリプトームの広範にわたる解析により、敗血症発症前バイオマーカーの予測パネルを開発し、感染後に臨床的症状が現れるかどうか、いつ現れるかを示すことが可能なバイオマーカーシグネチャーを開発することであった。これを行うなかで、トランスクリプトームのバイオマーカーシグネチャーを基に、敗血症患者をコントロール群患者と識別するためのバイオインフォマチックモデルが適切に力をつけていく(suitably powered)。それにより、今度は、このモデルが敗血症を予測するためのRT-PCR方法の開発を助けることになり、その性能のおかげで、医療的対策が非常に有効な段階でタイムリーな診断と治療を提供できるのである。
我々はマイクロアレイ技術を使って、発症前の敗血症患者からのサンプル及びコントロール群の非敗血症患者のサンプルの遺伝子発現データを得た。教師なしバイオインフォマチック手法を用いて、臨床的な症状が出る前の敗血症を特徴づける予後のトランスクリプトーム発現パターンを特定した。フリューダイム社製BioMark(商標)リアルタイムPCRアレイのプラットフォームで定量RT-PCRを用いて、この特徴的なバイオマーカーパターンを更に分析検証した。
【0039】
有意性の検定により、266個のバイオマーカーからなる最終的なパネルが抽出された。その後、敗血症患者と非敗血症患者との差を判定するために、多くの統計モデルで上記の全パネルやサブセットを使った。人工ニューラルネットワークにより最高の予測精度が出て、44個のバイオマーカーが最適なサブセットとなった。
技術的概要
患者サンプルの取得と保管:
患者は、インフォームドコンセントを提示すれば本研究への参加が認められた。年齢は18歳〜80歳で、臨床家の見解として感染の恐れがあり、最終的には敗血症のリスクのある手術を受けている患者であった。代表的なものとしては、腹部及び胸部手術であったが、他の外科的処置も認められ、敗血症を引き起こす広範囲な顎顔面外科手術も一例として含まれた。除外されたのは、患者が妊娠している場合、公知の病原菌に感染(HIV、A型、B型もしくはC型肝炎)している場合、通常の免疫反応が抑制されている場合、又は、入院中のいつであっても本研究への参加同意を撤回した場合であった。登録後も、すべての患者は通常の基本的な看護を受けた。
【0040】
血液サンプルはプロトコルに従って回収された。手短に言うならば、患者の血液から4mlのアリコートを2つずつ無菌のEDTAヴァキュテーナーに回収し、すぐに10.5mlのRNAlater(登録商標)(RNA固定化培地、米国ライフテクノロジーズ社製)を入れたRNAse-フリーのガラス小瓶に移した。これを−20℃で保管し、最終的にドライアイス上に移した。更に、患者の血液4mlを血清分離管に採取し、回転分離後、−20℃で保管した。血液採取は手術前は1日前と7日前の間に一度行い、手術後は毎日一回行った。手術後の血液採取は、患者の退院又は手術から7日後、或は、その前に医者が敗血症を確認した場合に終了した。患者の付加情報(例えば、患者の日々の数値指標(metrics)、手術の種類、微生物学結果等)は、英国ItemTracker社に注文したデータベースを使って取り込んだ。
我々は、緊急を要しない手術患者2273名を本研究に勧誘し、1842名分のタイムコースサンプルを保管した。これらの患者のうち、72名の敗血症が進展した。ゆえに、我々の患者コホートにおける敗血症罹病率は3.91%である。残りの患者のうち、600名を超える患者がSIRSの基準(以下の4つの症状のうち2つ:体温の上昇/下降、心拍数の上昇、呼吸数の上昇、白血球数の上昇/下降)に該当した。しかしながら、この「SIRS」患者の多くは、その総体的症状における変化が極めて一時的であった。施設(centers)で医療スタッフが特定した患者数438名が、長期的SIRS患者の数をより反映していると考えた。
【0041】
患者への勧誘が十分であったため、2011年に行うバイオマーカーの探索に使用する30名分の敗血症患者のタイムコース分(ならびに、匹敵するコントロール群非敗血症患者の分)と、2012年に行うバイオマーカー検証用の更なる40名分の敗血症患者のタイムコース分(ならびに、コントロール群非敗血症患者の分)が確保された。
61名のSIRS患者の血液サンプルの最初のバッチを分析した。これらのサンプルのうち、2つのサンプルで血液中に微生物のDNAの存在が確認された(一人はE. coli であり、もう一人はS. aureus)。この2名の患者は、敗血症の発症に進展する患者コホートに属するとして再分類された。残りの59名の患者では、血液中の微生物のDNAは検出できないレベルだった。これにより、この59名の患者が正真正銘のSIRS患者グループに属することとなった。両グループの患者のバイオマーカーシグネチャーをバイオマーカー探索の分析に供し、緊急を要していない手術患者の中で敗血症を発症前に診断するためのバイオマーカーシグネチャーが見いだされた。SIRS又は敗血症のいずれかを発症した患者のサンプル、ならびに、術後の症状が何も発現しなかった患者(術後コントロール群)のサンプルを含む患者190名のサンプルの第2バッチは、Sepsitestを使った分析に再度供した。術後コントロール群患者のすべてのサンプルは、Sepsitestにより陰性であることが確認された。更に、血液感染の敗血症患者から隔離しておいたすべての患者のサンプルも正しく特定された。全SIRS患者は敗血性ではないことが確認された。
【0042】
固定化培地からのRNA抽出:
更なるマイクロアレイ分析及びフリューダイムアレイ分析のために選択された全患者サンプルから、RiboPure(商標)Bloodキット(米国ライフテクノロジーズ社)を使ってRNAを抽出し、TURBO DNA-free(商標)(米国ライフテクノロジーズ社)で処理した。サンプルの品質に信頼性を与える目的で、アジレントバイオアナライザーRNA6000 ナノキット(米国アジレント社)を使ってRNAプロダクトすべての品質をアジレント2100バイオアナライザー(米国アジレント社)で評価した。
図1は、無作為に選択した12個のサンプルを使って、何百もの(the 100th)RNAサンプルをアジレント2100 バイオアナライザー(米国アジレント社)で定性評価した結果を示す。各レーンの二重の横縞模様が、少しの劣化もない高品質のRNAであることを示している。それぞれの製剤のRIN度(RNA integrity number)やRNA濃度等のRNA製剤の質及び量についての更なる定量的測定値から、RNA単離プロトコルが目的に合っていることが示された(表6)。
【0043】
表6:代表的なRNAサンプルの定量化及び完全性(integrity)
【0044】
【表6】
【0045】
RNAサンプルの99%以上が、RINの値は7以上の結果であり、収量が2μg以上であった。これらのサンプルは、マイクロアレイ分析及び定量RT-PCR分析を行うのに十分な量と品質であった。サンプル製剤の収量が不十分であることは稀であったが、この場合は、工程を4回繰り返し、プロダクトは定量RT-PCRだけに供した(即ち、cDNAを産生してPCRをうけるのに十分なRNAであった)。
敗血症の進展に進行した患者と進行しなかった患者の選別は、各施設の治験責任医師(PI)の責務ではなかった。PIは、皆、長年の診療経験を有する集中治療室顧問臨床医(consultant intensive care clinicians)であり、265を超えるピア・レビュー出版物がある。4施設の4人のPIのうち2人は、欧州と米国で機関誌や研究助成金提供団体の顧問的な重要な役割を果たしていた。臨床医が選別を行い、プロジェクトチームが再確認を行い、すべての患者が既に承認されている敗血症の定義に対する基準に合っていることを確認した。周術期の抗生物質の使用は最小限とし、敗血症患者症例の85.7%では、敗血症の診断前は広域抗菌スペクトル性の抗生物質が一投与のみであった。残りの患者は、毎日抗生物質の投与を受けていたが、敗血症の臨床的徴候を発現させた。こうした治療は微生物培養結果に影響する可能性はあるが、治療にもかかわらず敗血症が進展したことから、臨床指導のもと、これらの患者を本研究に加えた。本研究において敗血症を引き起こす感染物質の範囲はかなり広く、表7に示す。
【0046】
表7:本研究の第I相及び第II相において敗血症患者から単離した感染物質
【0047】
【表7】
【0048】
患者が敗血症と特定されると、各敗血症患者の年齢、性別及び手術に匹敵する対照群が選択された。これらの患者は、手術後にSIRSが進展しなかった患者である。
図2は、どの患者サンプルが分析に供されたか、また、手術後の日数が異なる日に採取される患者のサンプルのタイムフレームをどのように標準化するかを示し、比較群選択の理論的根拠を説明している。発症前の有用なバイオマーカーシグネチャーが得られる可能性が最も高いということから、敗血症と診断される前の3日間に焦点を置いて主要な分析を行ったことを記しておく。ある敗血症患者の進展の過程を、敗血症患者#1のバーで示す。手術後に敗血症には至っていない多数の患者から、年齢/性別/手術が適合した対照を特定し、コンパレータ―として使用する。この例では、敗血症と診断された日は感染から7日後である。ゆえに、敗血症診断前3日間は、手術から4日後、5日後及び6日後ということになる。発症前の診断という観点からは、診断3日前、2日前及び1日前と表すこともできる。敗血症診断前の3日間のそれぞれの日について、手術後の比較を適切でロバストなものにするために、相応する手術後の血液サンプルを使用した。この場合、手術後4日、5日及び6日に採取した血液サンプルを比較に使用したが、これらは、(診断から)3日前、2日前及び1日前の対照群となる。敗血症が進展した患者の発症前の血液サンプルを、最も適切な手術後コンパレータとマッチさせる作業は、本研究の第I相及び第II相で繰り返し、結果的に、敗血症が進展した30〜40名の患者のタイムコースデータを手術後コンパレータ患者30〜40名とそれぞれ比較した。
【0049】
非敗血症のコンパレータ群だけでなく、敗血症ではなくSIRSが進展した患者からのサンプルに加えて、各患者の手術前サンプルを利用して更なる対照群を設定した。これにより、敗血症患者のトランスクリプトームに発見されたいずれの変化も、手術中に感染した直接的な結果であることが確認された。本研究の第I相及び第II相の両方で使用した患者について、概要を表8に示す。抗生物質の使用はケースバイケースで、臨床医の判断のもとに使用されたことを記しておく。本研究のプロトコルが患者の管理に影響したことはなく、本研究中に我々が医療的対策を指示することは倫理的にできなかった。
【0050】
表8:第I相及び第II相における患者の年齢、性別、敗血症までの猶予期間、手術の種類の概要
【0051】
【表8】
【0052】
マイクロアレイ分析(第I相−バイオマーカーの探索):
第I相の60名の患者(30名の敗血症患者と30名のコンパレータ)及び第II相の80名の患者(40名の敗血症患者と40名のコンパレータ)及び第II相の40名のSIRS患者からのサンプルを、Illumina(登録商標)Human HT12v4 Beadarrayで処理した。これは、第I相では192のトランスクリプトーム分析、第II相では433のトランスクリプトーム分析に相当した。30名の敗血症患者と、年齢、性別及び手術をマッチさせた30名の対照群(参照用)のデータを集めた。マイクロアレイデータは血液サンプル192個から集めた。これらは、手術前、敗血症発症の1日前、2日前、3日前に相当する異なる4つの時点を表した。敗血症サンプルの発症した日を基に、それぞれ参照用とペアにしてサンプル群を調達した。表9に概要を示す。
【0053】
表9:本研究の第I相で使用したサンプル数
【0054】
【表9】
【0055】
Illumina(登録商標)Human v4チップは、27,000を超える参照配列番号までマッピングする48,804個のプローブを有する。各プローブは50の塩基ペアの長さで、各遺伝子の特異性を高度に示す。各サンプル用に、グロビン低減RNA(GlobinClear(商標)、米国ライフテクノロジー社)を全RNAから調製した。RNAの完全性(RIN度)はバイオアナライザー2100(米国アジレント社)で測定し、濃度はNanoQuant(商標)(米国Tecan社)を用いて評価した。Illumina(登録商標)TotalPrep(登録商標)RNA増幅キット(ライフテクノロジー社)を使って増幅及び標識化してcRNAを調製し、ハイブリダイゼーションを行い、Human HT-12 v4 Beadarrays(米国Illumina(商標)社)に供した。その後、Illumina(登録商標)HighScanHQ(登録商標)で各チップを画像化した結果、強度によって各プローブが対応するが遺伝子の発現レベルが表された。GenomeStudio(登録商標)ソフトウェア(米国Illumina(登録商標)社)を使って、バックグラウンド減算データを生成した。
【0056】
第I相のマイクロアレイデータについて、様々な予備的分析又は探索的分析を行い、以下を判断した。
1.データにバッチ処理の影響があったか。
2.手術前トランスクリプトームと手術後トランスクリプトームとの間に違いがあったか。
3.敗血症が進展した患者のトランスクリプトームとその参照用コンパレータのトランスクリプトームとの間に著しい違いがあったか。
【0057】
バッチの影響:
3D主成分分析(PCA)を用いて、サンプルのハイブリダイゼーションを行った日が本研究における患者のトランスクリプトームに影響を与えたかどうかをしらべた。
ハイブリダイゼーションの日をかえて行ったが、サンプルが分離して異なるグループにならないことがわかった。このことにより、ハイブリダイゼーションの日によるバッチの影響はサンプル間にはないことが示された。
【0058】
手術前トランスクリプトームと手術後トランスクリプトーム:
手術前と手術後の患者のトランスクリプトームに何か違いがあるかどうかもPCAを使った。この分析によると、手術前の患者のトランスクリプトームはまとまっていた(cluster together)。これは、手術前の患者のトランスクリプトームが手術後の患者のトランスクリプトームとよりも互い同士が類似していることを示唆している。更には、手術後の患者の全サンプルのトランスクリプトームは、手術前のトランスクリプトームとは異なるがまとまっており、手術後患者のトランスクリプトームも、手術前患者のトランスクリプトームとよりも手術後患者のトランスクリプトーム同士との方が共通していることがわかった。
【0059】
敗血症が進展した患者とそのコンパレータとの違い:
階層的クラスタリングは、PCA同様、データセットの教師なし解析に使用するツールである。階層的クラスタリングを使い、両方の患者群のトランスクリプトームをヒートマップで示した。階層的クラスタリングは、同じようなトランスクリプトームパターン(発現プロファイル)が隣同士にくるようにデータセットの遺伝子の並び替えを行う。実際、互いに関連性のあるサンプルを特定するのに有用なツールである。
ヒートマップの予備的調査によると、比較用の(発症)1日前、2日前及び3日前の参照用患者のトランスクリプトームと同様に、手術前サンプルは、一般にヒートマップの上半分にまとまっている。それに対し、(発症)1日前、2日前及び3日前の、敗血症が進展する患者のトランスクリプトームは、ヒートマップの下の方にまとまっているようである。敗血症が進展する患者とその参照コンパレータのトランスクリプトームには違いがあることがわかる。
192個のサンプルからトランスクリプトームのデータを集めたのち、2つの患者群間で発現が有意に異なる主要なバイオマーカーを解明するためには、更なる分析が必要とされた。これらのホスト応答遺伝子(host response genes)がバイオマーカーシグネチャーの基礎を形成し、これを使えば、生命を脅かす疾病に伴う症状が進展する可能性のある個体を指摘できるようなる。
【0060】
バイオマーカーの探索 -マイクロアレイ(第I相)-
データの前処理:
データの前処理には3つの主要工程があった。
1.対数変換:更なる分析に必要な正規性の前提を満たすために、トランスクリプトームのデータでeを底数とする対数変換を行う。
2.手術前減算(Pre-surgery subtraction):手術への反応による各サンプルの対数発現を得るために、手術前の発現レベルと比較した差にすべてのサンプルを正規化した。
3.中央値の減算(Median subtraction):これは、系統的なばらつきを明らかにするために、各遺伝子プローブにおいて重要であった。
【0061】
重要な遺伝子を確定するための多重仮説検定:
敗血症と診断される前の3日間、遺伝子発現の有意差(定めた閾値p値以下)のエビデンスを見つけるため多重t検定を用いた。分析により、敗血症の診断前3日間すべてで、2つの患者群間で452の遺伝子が有意に異なることが示された。また、敗血症の診断前のそれぞれの日において、2つの患者群間での有意差にはエビデンスがあることも確認した。敗血症と診断される3日前、2日前及び1日前には、それぞれ91、1022及び938の遺伝子発現において有意差のエビデンスがあった。
そこで、我々は、マイクロアレイの有意差解析(SAM)(Tusher VG、Tibshirani R、Chu, X. 2001. Significance analysis of microarrays applied to the ionizing radiation response(電離放射線反応へのマイクロアレイの有意差解析の応用)Proc Nat Am Sci 98:5116-5121、R. Tibshirianiによりスタンフォード大学で発表)を実行する同様の手法を採用した。この方法はマイクロアレイ解析に通常使用されている。我々はこの代案は利用する価値があると感じた。なぜならば、最初の発見に対して独自の検証ができるので、発症前診断用のバイオマーカーの終局的な選択に信頼性を与えることができると感じたからである。
【0062】
発現解析とそれに続くSAM:
敗血症の発症といった既知の応答変数に基づいた被験者群間の遺伝子発現の違いを求める検定として、遺伝子発現解析を用いた。表10で定義した患者群を使って、応答変数を4つの異なる検定ごとに生成した。
【0063】
表10:遺伝子発現解析に使用した患者のカテゴリー
【0064】
【表10】
【0065】
4つの検定とは、以下の通りである。
1.S1+S2+S3 対 B1+B2+B3
2.S1 対 B1+B2+B3
3.S2 対 B1+B2+B3
4.S3 対 B1+B2+B3
統計用R言語ソフトウェアのSAMパッケージを使って、上記4つの検定それぞれについて発現解析を行った。各遺伝子iについて、2つの反応群間での発現の平均差から発現統計値dを算出する。この平均差rは標準偏差により下記式にしがたって決められる。
【0066】
【数1】
【0067】
この統計値は、遺伝子発現と応答変数との関係性の強さを測定することから、その大きさを基準とした自然順がある。
どの遺伝子が有意に発現されているかを判定するために、SAMは並び替えによる分析手法を採用して、様々な異なる検定統計閾値(デルタ)におけるローカルのフォルス・ディスカバリー・レート(偽発見率:FDR)を概算する。
有意な遺伝子を誤って特定してしまうという一貫した危険を保証しておく(ensure a consistent risk of falsely identifying)ために、それぞれの検定でFDRを1%にした。しかしながら、閾値の変化とともにFDRが変わるのは、発現統計値のばらつきによるもので、所定のデルタの範囲で最小のFDRであることが多い。
例えば、症状が出る2日前の敗血症の診断について、FDRの推定値を表11に示す。
【0068】
表11:敗血症の診断2日前の、デルタ値の範囲に対するFDR予測値の90パーセンタイル
【0069】
【表11】
【0070】
偽発見率(FDR)の見込みの上限として90パーセンタイルが用いられる。FDR1%(0.01)は許容できる危険度とみなされるが、デルタを1.47より高くするとFDRが再び上昇することが上記の表から明らかである。そこで、FDR<1%も満たされることから、デルタ値1.47を選択し、該診断用に全部で109の有意な遺伝子を特定した。
この手法を行った結果、敗血症発症前の3日間すべてにおいて2つの患者群間で発現に違いがある458の遺伝子を特定した。更に、発症の3日前、2日前、1日前それぞれにおいて、167個、179個及び226個の遺伝子の発現が患者群間でとりわけ差異があることがわかった。全部で163個の遺伝子、1日前では18個の遺伝子、2日前では12個の遺伝子、3日前では51個の遺伝子が、この検定に特有のものだった。
【0071】
モデル:
更なる検証のために選択したすべてのバイオマーカーは、その性能を定性的及び定量的に評価できるように数学的にモデル化しなければならない。以下によって有用なモデルを決定することが重要である。
‐いずれの前提も分析の目的に合っていることを確認する。
‐その分析が新しい手法でない場合は、モデル選択用の前例(precedent)を定める。
‐適切な感度分析を行い、モデルの限界を判定する。
‐モデルを科学理論的根拠に相関させる。
【0072】
生物構造機能学及び生物情報科学の分野においては、数多くの分析経路やアルゴリズム(又はモデル)を利用することができる。このような手法すべてを、敗血症を発症前に診断するための最適なバイオマーカーの選択と検証に利用することは不可能である。本プロジェクトの状況における分析基準を表12に示すが、モデルには適切な条件があるため、多くの手法は次々にはずされることになる。
【0073】
表12:バイオマーカーの選択と分析に使用するモデルの絞り込み
【0074】
【表12】
【0075】
最良適合法を決定するため、いくつかのモデルを作成した。
分析1:
サポートベクターマシーン(SVM)、ランダムフォレスト及び差異解析(Differential analysis)を用いて、目的のqRT-PCRに絞り込むための遺伝子をフリューダイムアレイで同定した。生存分析も使用したが、これは時系列的情報を利用する。すべての分析は、R2.14.0及び関連のRパッケージを介して行われた。
SVM及びランダムフォレストは教師あり機械学習アルゴリズムで、バイオインフォマチックツールとして一般に使用されている。変数(遺伝子)選択の容易さは、これらの方法を選ぶ際の主要な要因であった。SVMは観測を行い、2つのラベルが付いたグループを分割するのに最良の超平面を見つけ出す。ランダムフォレストアルゴリズムは、アンサンブル分類器で、バギングを使ってたくさんの独立した分類木を生成する。それぞれの木は学習データセットを有し、最初の観測値のサブセットはサンプルの約66%で、残りのサンプルは分類木の精度を決定するのに使用される。変数のランダムサブセットを使って各分類木が生成され、平均ジニ係数と呼ばれる分類木精度への影響の強さ基準に基づいて遺伝子を並べることができる。ランダムフォレストは0と1の間の値を出力する確率的分類器で、所定のサンプルが特定のクラスに属する確率を示す。
【0076】
敗血症の進展で役割を果たしているプローブを見つけ出すために、生存分析も使用した。この方法の主たる魅力は、異なる日のマイクロアレイデータをモデルに一体化させることができるところである。一方の機械学習手法は、重要な遺伝子を見つけ出すのに一時点しか使われない。しかしながら、この手法は予測用には開発されておらず、遺伝子ごとに別個のモデルを生成する。標準的な発現差異(standard differential expression)からのt統計量と同様に、検定統計量は遺伝子ごとに計算された後、それを使って遺伝子を並べる。
SVM、ランダムフォレスト、発現差異及び生存分析の手法は、表13に細かく示すように、第I相のマイクロアレイデータを分析する際、遺伝子選択において有意な重なりを見せた。すべて手術後のサンプルを使って、ランダムフォレスト、SVM、生存分析の手法が見出した敗血症前の上位531個の遺伝子は、発現の差異で見つけ出された遺伝子と多くが重なっていた。重複していたすべての遺伝子は非常に有意であり(p値<0.001)、重複した遺伝子の数を表13にまとめる。
【0077】
表13:発現遺伝子の発現差異解析 − 異なるモデル間で重複した遺伝子
【0078】
【表13】
【0079】
このデータを使った予測率をランダムフォレスト及びサポートベクターマシーン(SVM)で算出した。それぞれの日(手術前、診断1日前等)を敗血症群とコントロール群に分割した。診断1日前、2日前及び3日前それぞれで、割り算、引き算による手術前正規化を行った場合と、正規化を行わない場合で予測を行った。日にちをまたいだ平均値も考察した。例えば、患者ごとの診断1日前と2日前を合わせた平均を出した。サンプルは独立しているという仮説を支持するため、日を一緒にまとめてメタグループとすることはしなかった(敗血症群又はコントロール群)。各時点の間隔が同等であるという誤った前提のもとで(手術前の日から診断3日前までの時間は不定であった)、すべてのデータを生存分析に使用した。
【0080】
ランダムフォレストによる敗血症の予測:
ランダムフォレストは、たくさんの単純なツリー分類器から構成され、各分類器は、各ツリーの学習と検定用(70%:30%)のために、サンプルの無作為で異なるサブセットを基本とするため、誤判別率(error rate)を正確に評価できる。以下は、時点グループごとの敗血症の予測感度と特異度である。診断2日前及び3日前(D-2及びD-3)のサンプルサイズが小さいことを記しておく。手術前による正規化(対数変換前データの割り算)と日にちをまとめたところ、診断1日前と診断2日前を合わせた平均が最も正確な結果を出したことがわかった。引き算による正規化(示さず)は、割り算による正規化よりも結果が良くなかった。
【0081】
表14:ランダムフォレストを用いて特定した遺伝子のパフォーマンス
【0082】
【表14】
【0083】
ランダムフォレストと比較するために、非正規分布(non-normally distributed)のプローブを考察するウィルコクソン検定を合わせたサポートベクターマシーン(SVM)を採用した(表15)。診断1日前と2日前の平均が最良のパフォーマンスであったことを考えあわせ、これに注目し、テストデータの20%(20% for testing)を使って5分割交差検定を使用した。標準誤差は括弧で示す。
【0084】
表15:サポートベクターマシーンを用いて特定した遺伝子のパフォーマンス
【0085】
【表15】
【0086】
どちらの手法も許容できる手法であったが、2つの患者群間での顕著な差異化はみられなかった。即ち、これらのデータセットのモデル化には他の手法が有用である可能性を示唆した。
【0087】
分析2:
人工ニューラルネットワーク(ANN)は、例題データセットの不明のパターンが与えられると、データのクラスを予測する能力があり、ANNはこれまで試験的研究にうまく使用されてきた。ニューラルネットワーク分析は下記の工程で説明される。この分析をそれぞれ5回行ったところ、予測能力に許容しうる変動(possible changes in predictive ability)が見られた。
1.敗血症発症後、敗血症診断日の1日前、2日前、3日前すべての遺伝子発現データを、各検定用のSAM分析を基に確認した。このデータの正規化は、遺伝子ごとにメジアンの減算と標準偏差によるスケーリングで行った。
2.正規化したデータは、70%はニューラルネットワークの学習用サブセット、30%はニューラルネットワークの検証用に分割した。
3.ニューラルネットワークを学習させ、隠れユニットごとの重み(weights)を使って新しいデータの予測子(predictor)を形成する。
4.30%のサブセットは予測子に通し、2つの群(敗血症、非敗血症)のそれぞれに割り当てるための確率が出る。
5.ニューラルネットワークの予測能力は、30%の未知のデータセットから評価した特異度と感度を基準とした。
特異性と感度の平均は5個の別個のニューラルネットワークから得られた。結果を表16にまとめる。
【0088】
表16:5回繰り返した予測子の標準誤差を基にした、時間をおいた異なる日における敗血症の予測結果概要(SAM分析で特定された遺伝子を使用)
【0089】
【表16】
【0090】
ニューラルネットワーク分析は、感度/特異度の評価に使うべきサンプルの数による制限がある。新しいデータを予測子に通さなければならないからである。我々は、このデータセットを用いれば、他の分類手法の方が、より多くの患者数を基にした、より正確な結果を提供できるであろうことは十分に認めているが、分析1で用いた手法よりもよい結果であった。
SAM分析において特定された458の遺伝子を鑑み、また、検定統計量の大きさによる自然順によることを鑑みると、同等な予測能力を有しサイズが小さいサブセット(データは示されていない)を見つけ出すために、遺伝子をリストの一番上から選択することができた。
分析1及び分析2で行った異なる分析の結果、バイオマーカーの絞り込みを行った。上記で概説した手法のいずれかにより、もっとも予測性があると確認されたバイオマーカーを選び出し、フリューダイムqRT-PCRアレイシステムを使った更なる分析に供した。合計270個の遺伝子と、すべてのサンプルで常に発現したために6つのハウスキーピング遺伝子(BRD7、PWWP2A、RANBP3、TERF2、SCMH1、FAM105B)も一緒に選択された。
【0091】
フリューダイムによるマイクロアレイバイオマーカーの確認と定量化:
フリューダイム社BioMarkHDを使用して、全時点で採取した60個の第1相サンプルと80個の第II相サンプルにおける270の遺伝子のプロファイルを行った。BioMarkHD(商標)は、サンプル96個のプライマーとプローブとの96のペアを処理するqPCRアッセイである。具体的には、グロビン低減RNA(GlobinClear(商標)、米国ライフテクノロジー社)をcDNAに変換(ハイキャパシティーRTキット、米国ライフテクノロジー社)後、該当するすべてのアッセイのためのプライマープール(この場合は、276アッセイとプライマーペアのプール)(DeltaGene、米国フリューダイム社)を用いて、制限PCR(limited PCR)で前増幅を行った(PreAmp(商標)Master Mix、米国ライフテクノロジー社)。前増幅cDNAをエクソヌクレアーゼI(米国ニュー・イングランド・バイオラボ社)で処理し、希釈して未使用のプライマーとdNTPとを取り除き、qPCR用サンプルを調製した。前増幅サンプルは、2 x SsoFast EvaGreen Supermix with Low ROX(米国バイオ・ラッド社)及び20 x DNA Binding Dye Sample Loading Reagent(米国フリューダイム社)と混合し、アッセイ(プライマーペア)は2 x Assay Loading Reagent(米国フリューダイム社)と混合した。サンプルとアッセイの混合物を、BioMarkHD(商標)(米国フリューダイム社)の96x96のリアルタイムPCR解析用ダイナミックアレイIFCに装填した。フリューダイム社のリアルタイムPCR解析ソフトウェアを使用してCt値(閾値に達した時のサイクル数)を求め、線状(derivative)基線補修及びアッセイ固有の閾値の自動判別による判定を前処理として行った。基準遺伝子又はハウスキーピング遺伝子を使用して、各アッセイを正規化し、デルタCt値を生成する。更に基準サンプルを使用してプレート上のすべてのサンプルを正規化し、得られる値をデルタ-デルタCt値とする。96x96の3枚のプレートを使い、各プレートで270個の遺伝子と6個のハウスキーピング遺伝子のプロファイルを行った。
【0092】
第I相の60名の患者からの合計269個のサンプル(最初の第I相の192個 + コンパレータ群のサンプル)、第II相の80名の患者からの439個のサンプル(更にSIRS患者の40個のサンプル)について、フリューダイム社のBioMark(商標)を使ってプロファイルを行った。本研究の第I相のデータを最初に分析したことを記しておく。最初の分析はSVMを使い、絞り込んだバイオマーカーリストのパフォーマンスを評価した。表17に詳細を示したが、アレイは非敗血症であるコンパレータの患者を認識するのに非常に優れていた。しかしながら、敗血症患者の陽性を識別するパフォーマンスは、敗血症の診断前の時間が遡るにつれ低下した。更に、敗血症発症前の3日間のデータをプールした場合、アレイの全予測精度は78.8%であった。
【0093】
表17:第I相データでの発症前の敗血症患者とそのコンパレータの予測における、絞り込んだバイオマーカーのパフォーマンス(%)(フリューダイムアレイ使用)
【0094】
【表17】
【0095】
バイオマーカーシグネチャーの最適化:
第I相における分類器のパフォーマンスにより、新たな情報を鑑みてバイオマーカーリストは更新の必要があると判断した。第I相の結果から、発現差異解析を基にした遺伝子リストの絞り込みが可能になった。
【0096】
第II相のサンプルを用いたバイオマーカーの検証−独立したデータセットによるブラインドテスト:
本研究を通して、患者から新鮮な(fresh)サンプルセットを得た。これを、第I相から絞り込んだ遺伝子の検証に使用した。すべてのRNAサンプルを調製し、盲検として(blinded)、マイクロアレイ及びフリューダイムアレイ分析に供した。前記のように、SAM分析等いくつかの手法で266個の遺伝子を決定した。ランダムフォレスト分類器のジニ係数等の分類アルゴリズムから取り出した手段を用いて、この遺伝子セットを更に減らした。
2つのグループの分類器が選択された。1つは45個の遺伝子、他方は25個の遺伝子を有する。これらを表18に示す。
【0097】
表18:盲検とした433個のRNAサンプルのマイクロアレイ及びフリューダイムアレイ分析を用いて、本研究の第II相で予測精度を検定した45の遺伝子分類器と25の遺伝子分類器
【0098】
【表18】
【0099】
各サンプルがどのタイプの患者のものであったかを予測し、その予測を送って混合されない状態にした(sent them to be unblended)。これらの分類器のパフォーマンスを表19にまとめる。
【0100】
表19:バイオマーカー分類器のパフォーマンス(%)
-(A)コンパレータ群の患者のサンプルの予測精度、(B)発症前の敗血症患者のサンプルの予測精度
【0101】
【表19】
【0102】
表19は、採用した分析によって、敗血症患者と非敗血症患者とそのコンパレータとの間が所定の水準まで分類できることを示している。また、これらの表から、敗血症と診断された日から離れるほど、また、患者数Nが減少するほど、分類器のパフォーマンスが上昇することがわかる。
【0103】
バイオマーカーの評価:
当初のフリューダイムアレイから幾つかのバイオマーカーを除くことを決定した後、バイオマーカーの31.5%を、第II相のより良い候補とみなされたバイオマーカーで再構成した。この最終的なバイオマーカーリストには、第I相で特定され、フリューダイムの検証に使用された非常に有意な180の遺伝子が依然として含まれていた。SAM分析で追加候補のバイオマーカーとみなされたバイオマーカーが加わり、主要な発症前バイオマーカーを見つけ出す尤度が上昇した。これにより、遺伝子リストは、最適な遺伝子と判断されたものはそのまま保持し、かつ、発現差異解析で有意とわかった他の遺伝子をリストに盛り込むことができた。この最終リストを表20に示す。
【0104】
表20:第II相のフリューダイムアレイに使用するために最終的に絞り込まれた遺伝子
【0105】
【表20】
【0106】
なぜ、これらのバイオマーカーの候補が2つの患者群において敗血症の存在を示すのか、その理由を理解するために、これらの絞り込まれた遺伝子の発現の変動に影響を受けた経路及びネットワークをGeneGoソフトウェアで解析した。敗血症の診断より1日前の時点で、ホストの全経路の中で、補体、上皮−間葉系、細胞骨格系リモデリング経路は、過剰発現した遺伝子の割合が最も高かった。それに対し、敗血症の診断より1日前の時点で、ホストの応答経路のなかで免疫細胞に関連した経路やGタンパク質シグナル伝達経路は、発現が低下した遺伝子の割合が最も高かった。炎症性のアポプトーシスや細胞接着ネットワークは、健康なコンパレータ群の患者においては非常に発現増加したが、敗血症患者群では結果的には非常に発現低下した。同様のパターンが、タンパク質翻訳制御ネットワーク、抗原提示及びT細胞受容体シグナル伝達ネットワークでも見られた。
【0107】
重要な(highlighted)バイオマーカーのqRT-PCR検証:
− 独立したデータセット(第II相サンプル)でのブラインドテスト
第1の絞り込みバイオマーカーシグネチャーのパフォーマンスを考慮にいれ、遺伝子の数は更に少なくても、十分な予測精度を提供できるであろう第2のバイオマーカーのセットを絞り込むことにした。第1のセットと比較するために、266の遺伝子リストの無作為サンプルを抽出し、人工ニューラルネットワーク(ANN)の予測精度を求めることによって、44の遺伝子と25の遺伝子からなる2つの発症前バイオマーカー分類器を絞り込んだ。表21に挙げた44の遺伝子と25の遺伝子は、予測精度が最高値となった遺伝子リストである。
【0108】
表21:本研究の第II相で、盲検として433のRNAサンプルをフリューダイムアレイ分析して予測精度を検定した44個と25個の遺伝子分類器
【0109】
【表21】
【0110】
探索的分析:
検証用コホートに266の遺伝子を使って、敗血症、SIRS及びコンパレータ群の患者データの主成分分析(PCA)を行った。分類アルゴリズムによって群間に分界線が見い出されたことから、3つの患者群の分類は、更に解析を行うことができた。Dstlの44遺伝子分類器を使った検証用コホートのPCA分析で、上記の分類は更に明確になった。
【0111】
ANNの結果:
ANN手法のことはすでに第I相のパートとして説明した。70名の敗血症患者と70名のコンパレータ群の患者(第I相及び第II相の患者を合わせたもの)からのデータ/サンプルを使って、手術前、敗血症発症の1日前、2日前及び3日前に対応した異なる時点で、結果、600を超えるサンプルを使って、学習と検定(70:30)が行われた。5回繰り返した予測子の標準誤差を基にした、時間をおいた異なる日における敗血症の予測結果の概要を表22に示す。表2に詳細を示した人工ニューラルネットワークを使った。
【0112】
表22:ANN使用による敗血症の予測結果概要
【0113】
【表22】
【0114】
この結果から、ANNは、高い信頼度で敗血症患者と非敗血症患者とを分類することができることがわかる。この信頼度は、分類器の遺伝子の数を例えば25に減らした場合、ほとんど変動していない。この結果から、分類する際には最適な遺伝子数があることがわかる。
【0115】
ニューラルネットワーク分析 - SIRS:
これらの結果には、敗血症ではなくSIRSが進展する患者のバイオマーカーシグネチャーが、敗血症患者のバイオマーカーシグネチャーと同様であるか、重なる可能性があるのではないか、という混乱の原因が潜在的にある。そのため、偽陽性をうみだしたり、敗血症の発症前バイオマーカーシグネチャーの予測の有用性を台無しにしかねない。検査結果の信頼性が欠如することになろう。そこで、敗血症バイオマーカーシグネチャーに対し、SIRS患者40名分のデータをANNで分析した。その結果を表23に示す。
【0116】
表23:5回繰り返した予測子の標準誤差を基にした、時間をおいた異なる日における、敗血症vs.SIRSの予測結果概要
【0117】
【表23】
【0118】
表23の結果は、ANNが敗血症患者とSIRS患者のバイオマーカーシグネチャーを効果的に分類していることを示している。更に、分類には最適な遺伝子数があることが表23からもわかる。更に、263個の遺伝子と45個の遺伝子での結果の違いが示唆することは、263個の遺伝子バイオマーカーリストの中には、SIRSシグネチャーと共通点があるということである。
266のリストから無作為に選んだ44個のバイオマーカーで44,014通りの組合せ/バイオマーカーシグネチャーを作成したところ、すべての組合せで平均予測精度が75%より高い(実際は76.1%以上)ことがわかった。上位1,000のサブセット及び下位1,000のサブセットでの個々の遺伝子の存在度(abundance)は一様ではない。即ち、44個のバイオマーカーによる上位のサブセットに頻繁に現れる遺伝子は下位のサブセットにはそれほど頻繁に現れず、逆も同じである。
これらの結果を、表24に挙げた具体的な15通りの組合せで示す。それぞれの精度は
図3に示す。即ち、実施形態の1つでは、バイオマーカーシグネチャーが、表1に挙げた266の遺伝子からなる遺伝子リストから選択された、少なくとも44の遺伝子を含む。
【0119】
表24:予測精度をテストした、44のバイオマーカーによる15の組合せ。予測精度は
図3に示す。
【0120】
【表24】
【0121】
【0122】
図4に鑑みるが、266の遺伝子からなるパネルから、バイオマーカーの数が異なる98のサブセットを形成した。各サブセットの特徴は、44,014通りから選択された上位1,000のサブセットにおいてある特定の存在度を示す遺伝子を含むということだけである。サブセットは、1個の遺伝子(LDLRで、この存在度は明らかに最多である)のものから、266のバイオマーカーからなるパネル全体のものにまでに及ぶ。同じ存在度の遺伝子が多数ある場合は、それらの遺伝子すべてを、その閾値と結びつけて、1つのサブセットにまとめている。それゆえ、全遺伝子よりもサブセットの数が少ないのである。表2に詳細を記したものよりもベーシックなANNからトレンドが推論されるが、それは、サブセットのサイズが大きくなるにつれ予測精度が上昇し、サブセットのサイズが遺伝子97個になると予測精度の上昇が止まりはじめるというトレンドである。ここで予測精度が最高の97.0%に到達する。サブセットサイズが遺伝子149を超えると、予測精度は低下し始め、89.6%まで落ちる。このトレンドは、ランダムフォレストで得られたトレンドとは一致しないが、たくさんの無作為のサブセットというよりも、規定をつけたサブセットをここでは検討している。最高予測精度に達した3つのサブセットのうち、サイズが最小であるサブセット(サブセット50)は、検定の上位1000のサブセットに165回以上出現する遺伝子を含んでいる。
【0123】
システム‐スケールプロファイル手法を用いて、本研究では、術後の敗血症進展を高い精度で予測するバイオマーカーシグネチャーを、かなり大きなサイズの盲検検証セット(sizable blinded validation set)で特定した。複雑なデータセットを分析する際にポイントになるのは、分析方法である。我々の手法は、いずれのバイオマーカーもヒトの敗血症を予測しえないという推論に基づいていた。発症前のバイオマーカー発現についての先行研究は、バイオマーカー発現の従来からの線形解析では、2つの患者群、即ち、敗血症患者と非敗血症患者間の差を明らかにできないことを示していた。様々な非線形手法が用いられたが、敗血症が進展する患者のトランスクリプトームとそのコンパレータのトランスクリプトームとの識別がうまくいったかどうかもばらつきがあった。ランダムフォレスト及びSVMは、異なる患者群のトランスクリプトームの識別に使用できることを実証した。しかしながら、ANN分析は、25及び44の遺伝子バイオマーカーシグネチャーを使い、素晴らしい結果をだした。このバイオマーカーシグネチャーは、敗血症が進展する患者とそのコンパレータとを識別する際に、感度と特異度が高いだけでなく、予測精度も高かった。更には、SIRSであって敗血症が進展しなかった患者のトランスクリプトームは潜在的に混乱を引き起こすものであるが、これに対しての検定でも、我々が導き出したバイオマーカーシグネチャーは、非常にロバストであった。
【0124】
非線形手法のしっかりしたパフォーマンスは予想外ではないのかもしれない。というのも、免疫マーカーは敗血症の全タイムコースにわたって大きく変動しているからである。単純な線形手法を用いた分析では、容易に主要バイオマーカーシグネチャーを取り出せるとは考えられない。
また、複合的なqRT-PCRを使用することによって患者のトランスクリプトームの検定がうまくいったということは、この手法が診断アッセイとして更なる開発をするのにふさわしいことを示している。このことも注目に値する。
本シグネチャーを構成するトランスクリプトのサブセットは、その機能的関連性が、炎症や敗血症の際に伴う事象での調整された分子鎖及び細胞鎖と広くかかわっており、我々の結果は自信をえる。実際のところ、補体経路の活性化が敗血症や炎症において重要な役割をはたしていることがわかってきた。逆に言えば、樹状細胞及び他の抗原提示細胞は、敗血症エピソードの最中には血液循環系から消えていることがわかったが、これは、MHC遺伝子発現に関連したトランスクリプトの存在量の減少が観測されたことを説明できる。その上に、本研究の偏りのないグローバルなプロファイル手法によって同定したマーカー候補の大半が、機能豊富な「ランドマーク」的トランスクリプとはみなされていなかった点も留意すべきである。