【実施例】
【0109】
実施例1
CRCおよびCRAの一般化可能な微生物マーカーを特定できるかどうかを見極めるために、本発明者らは、2006年〜2016年の間に発表された多数の糞便微生物研究からの生の16S rRNA遺伝子配列データにアクセスした。本発明者らは、2つのバイオインフォマティクスのパイプラインを使用して該データを解析した:(1)以前に発表されたメタ解析で使用されたクローズドリファレンスOTU割り当て(closed-reference OTU assignment)アプローチである、QIIMEクローズドリファレンス(QIIME-CR)[20-22];および(2)より多くの生の配列データを利用し、場合によっては株レベルの分解能を提供する株特異的方法である、Strain Select-UPARSE(SS-UP)。さらに、データが利用可能な場合、本発明者らは、本発明者らの複合微生物マーカーを、持ち帰り用の非侵襲的だが不正確な検査であるグアヤック(guaiac)ベースの便潜血検査(FOBT)と比較した[23, 24]。
【0110】
研究の検索、選択、および組み入れ
本発明者らは、ヒト対象を含みかつ2006年から2016年の間に発表された、タイトルに大腸癌、結腸癌、大腸腺癌という用語を含む研究を特定するために、体系的なPubMed検索を行った。PubMedアドバンスドサーチ(advanced search)を使用した最終的な詳細検索用語は、((((((((((bacterial microbiome OR gut microbiome OR microbiota OR microbial)) AND (fecal or feces)) AND (colorectal cancer[Title] OR colon cancer[Title] OR colorectal adenoma[Title] OR adenomatous polyp[Title] or colorectal carcinoma[Title])) AND (“2006/01/01 “[PDAT]:“2016/04/01”[PDAT])) AND humans[MeSH Terms]) NOT review[Publication Type]) AND Humans[Mesh]))であった。原稿は、その本文中に細菌微生物叢(bacterial microbiome)、腸内微生物叢(gut microbiome)または微生物叢(microbiota)という用語、タイトルには大腸癌(colorectal cancer)または大腸腺腫(colorectal adenoma)または腺腫性ポリープ(adenomatous polyp)または大腸癌腫(colorectal carcinoma)という用語を必要とし、ヒト対象のみを含み、2006年〜2016年の間に発表されたものであった。
【0111】
糞便微生物叢とCRCとの関連性を評価する疫学研究の不偏合成(unbiased synthesis)を提示するために、本発明者らは、本発明者らの解析用の研究を特定して組み入れるために推奨のMOOSE(Meta-analysis of Observational Studies in Epidemiology:疫学における観察研究のメタ解析)チェックリストに従った[25]。研究が(i)16S rRNA遺伝子アンプリコンに454またはIlluminaシーケンシングを使用した;(ii)組織学的に確認されたCRCまたはCRAのサンプルおよび対照を含んでいた;および(iii)2016年4月1日までに公開されているまたは著者らによって共有された配列および関連するメタデータを有していた場合に、それらの研究は本発明者らの組み入れ基準(inclusion criteria)に適合する。
【0112】
糞便微生物とCRCとの関連性を評価する13件の研究が、上記の体系的な検索によって特定された。これらの研究は、DNA抽出方法、標的とされた16S rRNA遺伝子可変領域、シーケンシングプラットフォーム、および研究特性に関して異なっており、表2Aおよび2Bに要約される。
【0113】
(表2A)メタ解析に組み入れられた糞便研究の特性
略語:Seq Plat:シーケンシングプラットフォーム,Seq dir:シーケンシング方向,F:フォワード(5'-3')方向,R:リバース(3'-5')方向,CRC:大腸癌,CRA:大腸腺腫,Ctrl:対照,V1、V3、V4:16S rRNA遺伝子の可変領域;
は解析に組み入れられた研究を示し、Xはデータが利用できなかった研究を示す。
【0114】
(表2B)メタ解析に組み入れられた研究の配列統計値
略語:seq:配列,Avg:平均,SD:標準偏差,QIIME-CR:QIIMEクローズドリファレンスOTUピッキング,SS-UP:Strain Select, UPARSEバイオインフォマティクスパイプライン;各パイプラインについて、サンプルあたりのAvgリード±SDが報告される。
【0115】
これらのうち9件は、パブリックリポジトリ(例えば、Sequence Read Archive(SRA)、European Nucleotide Archive(ENA)、MG-RAST)に配列データを有するか、要請に応じて生データを提供した。これらのうち8件は、研究デザインにCRCまたはCRAおよび対照を有していた[10-14, 26-28]。1件の研究は、もっぱらCRA症例および対照由来の糞便サンプルを評価した[29]。残りの4件の研究の生の配列データは、公開されていなかったか、要請に応じて提供されなかったか、制御されたアクセスを介してのみ入手できた[15, 30-32]。したがって、これらの研究は解析に含めなかった。
【0116】
本発明者らは、9件の研究からの16S rRNA遺伝子シーケンシングデータをコンパイルした。研究の規模は対象12人から129人までさまざまであり、本発明者らは2つのバイオインフォマティクスパイプラインQIIME-CRおよびSS-UPを使用して、合計59,163,765の生の16S rRNA遺伝子配列を解析した。この組み合わせデータセットは、195のCRC、79のCRA、および235の対照から成っていた。配列の長さとカウント数は研究にわたって不均一であったが、SS-UPはQIIME-CRよりも多くのリードを保持していた。
【0117】
患者のメタデータ
疾患状態(すなわち、CRC、CRA、または対照)が入手できた参加者を解析に組み入れた。Zeller et al [10]は、大きな腺腫を彼らの解析から除外し、小さな腺腫を対照として組み入れた。本発明者らはこれらのサンプルの全部をCRA試料として評価した。年齢、性別、BMI(または身長と体重)、および便潜血検査(FOBT)の結果の臨床的変数も3件の研究では入手できた[10-12]。
【0118】
バイオインフォマティクス解析
上述したように、各研究は2つのバイオインフォマティクスパイプラインを使用して解析された;すなわち、QIIMEで実行されるオープンソースのクローズドリファレンス操作的分類単位(OTU)割り当てパイプライン(QIIME-CR)[33]、およびStrainSelectデータベース(secondgenome.com/StrainSelect)中の参照に対して糞便16S配列をアライメントし、UPARSEの方法論を使用してデノボクラスタリングを実行するパイプライン(SS-UP)[34]である。
【0119】
2つのパイプラインの使用の背後にある論理的根拠は、微生物叢メタ解析で一般的に使用されるクローズドリファレンスOTUピッキングへの代替アプローチを評価すること、および異なるOTUクラスタリングの手法がCRCの複合バイオマーカーの下流性能にどのように影響しうるかを判断することであった。SS-UPは、一部のOTUについての株レベルの注釈という追加の利点を有し、一方QIIME-CRは、一部のOTUについての種レベルの分解能を提供した。本発明者らは、罹患対象と対照対象との間の微生物叢ベースの違いが、いずれか一方のバイオインフォマティクスパイプラインを使用して対象を識別するのに十分であるかどうか、またはその違いがわずかであって、結果として特殊なアルゴリズムを必要とする可能性があるかどうか、を判断しようとした。各パイプラインについて、クオリティフィルタリング基準および配列の利用を表3A〜3Bに提供し、各パイプラインの実行に関する詳細を「補足方法」に提供する。
【0120】
(表3A)OTUクラスタリング用のリードを生成するために使用された長さフィルタリング基準
【0121】
(表3B)各パイプラインで利用されたリードの配列長さの中央値
リードは、SS-UPで株レベルのOTUにマップされて、デノボOTUにクラスター化され、かつQIIME-CRを使用して参照OTUにマップされた。
略語:QIIME-CR:QIIMEクローズドリファレンス法;SS-UP:Strain Select, UPARSE法。
【0122】
QIIME-CR処理:
QIIME-CRパイプラインでは、454データセットのクオリティフィルタリングと逆多重化(demultiplexing)を、QIIME 1.8でsplit_libraries.pyコマンドを使用して行った[10]。QIIME-CRとSS-UPの両方ではトランケートされたリードまたは誤って長いリードを除外するために、標的アンプリコンの長さに基づいて最小および最大リード長を選択した。それぞれに使用されたフィルタリングの長さを表3A〜3Bにまとめてある。さらに、本発明者らはクオリティフィルタリング(すなわち、6を超えるあいまいな塩基を含む配列、6ヌクレオチドを超えるホモポリマー鎖、プライマーまたはバーコード配列へのミスマッチの除外)にデフォルトパラメータを使用した。Illuminaデータでは、本発明者らは、複数のファイルを同時に処理できるため、QIIME 1.9からのmultiple_join_paired_ends.pyおよびmultiple_split_libraries_fastq.pyスクリプトを使用した。クオリティフィルタリングのパラメータをデフォルトに設定した(すなわち、低クオリティのベースコール(q<20)の最初のインスタンスでリードをトランケートし、元のリードの長さの<75%の場合にリードを除外した)。QIIME 1.9.0は、大規模MiSeqベースの研究の初期fastq処理にのみ使用した。全ての研究でのOTUクラスタリングおよび分類学的割り当て(taxonomy assignment)はQIIME 1.8.0を使用して行った。
【0123】
454およびIlluminaの両研究からのクオリティフィルタリングされかつ逆多重化されたデータセットは、pick_closed_reference_otus.py(リバースストランドマッチング対応のuclust 1.2.22q[11]を使用した)を用いて参照ベースのOTUに割り当てた。この戦略では、インプット配列を参照データベース(Greengenes_13_8)中の所定のクラスターセントロイド(centroid)にアライメントした[12]。配列が97%同一性の閾値で参照データセットとマッチした場合にのみ、その配列を保持した。このアプローチの欠点は、参照に似ていないリードを度外視することである。1件の研究[14]では、fasta形式のシーケンスファイルがMG-RASTリポジトリで共有されたが、qualファイルは除かれた。それゆえ、この研究ではクオリティフィルタリングが不可能であり、QIIME-CRおよびSS-UPの両パイプラインではクラスタリングの前に長さのトリミングのみを行った。2件の研究[27, 13]では、FリードとRリードの両方を収集するために454が使用されたが、それらは対合しなかったため、シングルエンドリード(single ended read)の2つのライブラリーの合計としてリードを評価した。
【0124】
SS-UP処理:
Strain Select-UPARSE(SS-UP)(Second Genome, Inc)パイプラインは、現存するカルチャーコレクションから取得できる細菌および古細菌株に由来する高クオリティ配列および注釈データのコレクションである、StrainSelectデータベース(secondgenome.com/StrainSelect)(公開準備中)を利用し、UPARSE方法論(SS-UP)を使用して株ヒットなしに全ての配列のデノボクラスタリングを実施する。SS-UPでは、Illuminaのペアエンドシーケンスリードは、fastq_minmergelenおよびfastq_maxmergelenのデータセット固有のカットオフを除き、デフォルト設定でUSEARCH fastq_mergepairsを使用してマージされた(表3A〜3B)。その結果得られた全てのマージされた配列は、USEARCHのusearch_globalを使用してStrainSelect v2014-02-20に対して比較された。454シングルエンドリードは、最初に、PrinSeq-lite[26]およびパラメータ「-trim_ns_left 1 -trim_ns_right 1 - min_len $MIN_LEN -trim_qual_right 20」を用いてN末端からクオリティトリミングされ(データセットごとの最小長さ値を表3A〜3Bに示す)、その後でUSEARCHのusearch_globalを用いてStrainSelectと比較された。明確な株のマッチは、最も近いマッチング株からの16S配列に対して99%以上の同一性を有し、2番目に近いマッチング株に対して(たとえ1塩基でも)より低い同一性を有するものとして定義された。これらの明確なヒットは株ごとに集計され、株レベルのOTU存在量テーブルが作成された。残りの配列は、USEARCHのfastq_maxeeとMAX_EE値1を使用して全体的なリードクオリティによりフィルタリングされ、リード長分布の95%区間の下方境界に長さトリミングされ(不均等なリード長分布を有するデータセットの場合、最短リード長への長さトリミングは非常に短いリードによって強く影響される;この外れ値の影響を補正するために95%区間を使用する)、脱複製され、サイズにより降順ソートされ、そしてUSEARCH(fastq_filter, derep_fulllength, sortbysize, cluster_otus)により97%同一性でクラスター化される。USEARCH cluster_otusは、可能性のあるキメラを廃棄する。デノボOTUあたりの代表的なコンセンサス配列が存在した。各研究について、存在量が3未満のデノボOTUは、あやしい(spurious)として廃棄した。その後、StrainSelectと比較されたが、株OTUに至らなかった全ての配列は、デノボOTU存在量テーブルを作成するために、代表的なコンセンサス配列(≧97%同一性)のセットにマッピングされた。代表的な株レベルのOTU配列および代表的なデノボOTU配列は、80%信頼でmothurのベイズ分類器[28]を介してGreengenes[12]分類学的分類を割り当てられた;該分類器は、16S rRNA遺伝子配列のGreengenes参照データベース(バージョン13_5)に対してトレーニングされた。SS-UPに使用されたGreengenesバージョン13_5とQIIME-CRに使用されたバージョン13_8は両方とも、同じ参照配列のセットを含む。13_8バージョンでは、追加の分類学的用語が手動でキュレートされたが、参照OTUと系統樹は変わらなかった。標準的な分類学的名称が確立されていない場合は、階層的な分類群の識別子を使用した(例えば、「97otu15279」)。全ての研究からの株レベルのOTUの存在量および分類体系でマッピングされたデノボOTU存在量をマージして、さらなる解析に使用した。SS-UPアプローチは、全ての高クオリティ配列をカウントできるようにし、また、デノボOTUの分類学的分類は、分類体系に保存されたデノボOTUを研究間で比較できるようにした。
【0125】
いずれか一方のバイオインフォマティクスパイプラインのクオリティフィルタリングおよびOTU割り当て後に100未満の配列を含むサンプルは、両方の全てのさらなる解析から除外した。あらゆる場合に、一方のパイプラインで100未満の配列を含んでいたサンプルはどれも、他方のパイプラインで100未満の配列を含んでいた。
【0126】
統計分析
Rパッケージphyloseqは、α多様性、β多様性メトリック(Bray-CurtisおよびJaccard指数など)、Bray-Curtis非類似度の主座標スケーリング、フィルミクテス門/バクテロイデス門(F/B)の比率、および示差的存在量分析などの全体的群集特性を決定するために使用された。Monte-Carloリサンプリングを使用した2サンプル並べ替えt検定を使用して、CRCと対照およびCRAと対照間のα多様性推定値およびF/B比率を比較した。順列分散分析(PERMANOVA)を使用して、veganパッケージでadonis関数を用いて、グループ内距離がグループ間距離と有意に異なるかどうかを検定した。多変量グループ分散等質性は、betadisper関数を使用してveganにより検定することができる。CRC症例および対照間のQIIME OTUとSS-UP OTUの示差的存在量は、DESeq2デザイン(〜研究(Study)+疾患状態)において交絡因子としての研究(Study)を調整して評価した。OTUは、それらの偽発見率(FDR)調整Benjamin Hochberg(BH)p値が<0.1であり、かつ推定log
2変化倍率が>1.5または<-1.5であった場合、有意に異なると見なされた。
【0127】
ランダム効果モデル(Random Effects model:REM)は、CRC対照サンプルを含む8件の研究を多数の研究のサンプルと見なし、新しい研究が実施された場合に起こりそうな結果を推測した。CRC-糞便微生物叢の研究は、それらの方法だけでなく患者の人口統計の点でも似ていなかった。これらの相違は、真の効果に異質性を持ち込む可能性がある。REモデルはこの異質性をランダムとして扱う。具体的には、前述のプール解析に加えて、本発明者らは、効果量の推定値としての研究ごとのDESeq2 log2変化倍率、および対応する標本分散(sampling variance)としてのそれらに関連する標準誤差を、REMへの入力として推定した。CRC 対 対照比較では少なくとも5件の研究(すなわち5、6、7または8件の研究)で、CRA 対 対照比較では3または4件の研究で、DESeq2により示差的に豊富として生じたOTUは、解析のために保持された。結果として生じるREモデルのp値は分類群OTUにわたる多数の比較のためにFDR補正され、有意なOTUについてはフォレストプロットがプロットされた。本発明者らはまた、いくつかの研究にわたってこれらのOTUの相対存在量をプロットし、対照と比較して症例のlog変化倍率が実際のOTUの保有率(prevalence)にどのように反映するかを推定した。
【0128】
ランダムフォレスト分類器(random forest classifier)の微生物分類群の予測力を決定するために、一般にmtryとして知られる決定木の各ノードで分割するためにランダムにサンプリングされた予測子特徴(predictor feature)の数を、(0.5, 1, 1.5, 1.75, 2, 2.5, 3.0)*(微生物予測子の総数の平方根)としてチューニングした。オーバーフィッティングを避けるために、モデルを内部的に10分割で交差検証し、5回繰り返した。最大値を持つ受信者操作特性曲線下面積(AUROC)のチューニングを使用して、最適なモデルを選択した。疾患の転帰を予測するためのRFモデルを、臨床マーカーのみ(臨床メタデータが利用可能な研究(n=3研究、156サンプル)の場合)、微生物マーカーのみ(全てのサンプルおよび研究(n=8研究、344サンプル)ならびに完全な臨床メタデータが利用可能なサンプルのサブセット(n=3研究、156サンプル)の場合)、および臨床マーカーと微生物マーカーの両方の組み合わせ(n=3研究、156サンプル)のために構築した。RFモデルを構築する前に、年齢およびBMIなどの臨床メタデータ間の連続変数を中心化してスケーリングした。特定の研究が分類器の最適なAUROC値に偏って影響したかどうかを推定するために、本発明者らは1件の研究抜き(leave one study out)解析を実施して、各研究が除かれた後の分類器の精度を推定した。本発明者らはまた、複合分類器が個々の研究からの均質に処理された特徴にどのように対応したかを比較するために、個々の研究の分類器を調べた。5回繰り返す10分割交差検証を使用した再帰的特徴消去(recursive feature elimination)を使用して、rfe関数を用いる分類のための最もインフォーマティブな微生物分類群を特定した。複合微生物バイオマーカーの一般化可能性を判断するために、1件研究抜きコホート(テストセット)分類器を使用して、predict.train関数を用いて抜き出された研究(検証セット)における疾患の転帰を予測した。上記モデルのROCを、pROCパッケージを使用してプロットした[29]。AUROCの違いを、該パッケージ内のDeLongの検定を用いて統計的に検定した。
【0129】
各パイプラインから得られたOTUテーブルを単変量および多変量技術を用いて解析し、全ての統計分析をR(バージョン3.2.1)で実施した。化学療法または放射線療法を受けており、サンプルあたり100未満のリードを有し、OTUが全サンプルの5%未満に存在すると記録された患者からのサンプルは、両パイプラインの解析から除外した。α多様性の比較のためにデータを、置換なしで深度1000まで希薄化したが、他の解析では希薄化しなかった[35]。phyloseq[35, 36]を用いて全体的群集特性を評価し、veganでadonis関数を用いて順列分散分析(PERMANOVA)を行った[37]。示差的存在量分析(症例と対照間)は、種レベル(QIIME-CR)および株レベル(SS-UP)でDESeq2を用いて実施した。CRCおよびCRA症例で普遍的に発生しかつ技術的変化に対してロバストであった微生物の特徴を特定するために、本発明者らはランダム効果モデル(REM)を適用して、調整log2変化倍率の要約推定値を取得した(FDR p<0.1で有意と見なした)。これは、Rでmetaforパッケージを使用しかつ研究をランダム効果として扱って、実施された[38]。ランダムフォレスト(RF)モデルは、複合糞便微生物バイオマーカーがCRCおよびCRAの症例を対照と識別できるかどうかを判定するために使用した。全研究にわたる、相対存在量に変換されたOTUカウントの組み合わせを、Rでcaretパッケージを使用して解析した[39, 40]。この解析に関するさらなる詳細は、「補足方法」に記載される。
【0130】
結果
Bray-Curtis非類似度およびJaccard指数を使用して、それぞれ、存在量およびキャリッジ(carriage)の効果を評価した。座標付け解析(ordination analysis)は、微生物群集の組成に関してサンプル間のかなりのばらつきを明らかにし、また、SS-UPからの座標付けが、QIIME-CRからのそれよりも、最初の2つの軸に沿ってより大きな総変動量を捉えたことを示した。軸1に沿った分離は、第一に研究によって生じ、その後は可変領域とシーケンシングプラットフォームによって生じた。これらのパラメータに大きな違いがあると、症例と対照の分離が容易に観察されなかった。
【0131】
PERMANOVAは、微生物叢の組成が疾患状態に応じて大幅に異なっていたことを示したが、症例と対照間の等分散性(homogeneity of variance)の欠如がこの結果に影響を与えた可能性が高い。等分散性を確認した後では、微生物叢の組成は、いずれか一方のインフォマティクスパイプラインまたは時には両方の場合に、BMIカテゴリー、シーケンシングプラットフォーム、FOBT検査の結果、および転移性疾患の分類(TNM病期分類でMにより表示)(情報が入手可能な場合)間でPERMANOVAによって有意に異なっていた(表4)。
【0132】
(表4)PERMANOVAを使用した臨床的、人口統計的および技術的変数にわたる微生物叢組成群の比較
略語:PERMANOVA:順列ANOVA,SS-UP:Strain Select UPARSE,QIIME-CR:QIIMEクローズドリファレンスOTUピッキング,BMI:体格指数,V1-V4:16S rRNA遺伝子の可変領域1から4,FOBT:便潜血検査
#:サンプル数は「クラス」の列に表示される順である;
*TNM:TNMは癌の病期分類システムであり、ここでTは元の腫瘍のサイズを表す(T1〜T4はそれぞれ最小から最大までの範囲である;Tis:上皮内癌);Nはリンパ節転移を表す(N0〜N2は少ないから多いまでのリンパ節浸潤を示す;Nx:リンパ節転移を評価できない);およびMは癌が体のさまざまな部分に転移しているかどうかを示す(M0:転移していない、M1:転移している)
【0133】
α多様性指数によって測定された全体的群集特性は、SS-UPでのCRC症例と対照間、SS-UPおよびQIIME-CRの両パイプラインでのCRA症例と対照間で類似していた。Shannon指数およびinverse Simpson指数は、Monte-Carlo並べ替えベースのt検定により、QIIME-CRパイプラインで対照と比較してCRA症例で有意に低かった(表5)。フィルミクテス門(Firmicutes)/バクテロイデス門(Bacteroidetes)の比率は、対照と比較してCRC症例とCRA症例のいずれにおいても違いがなかった。
【0134】
(表5)両パイプライン間の疾患状態の異なるサンプルのα多様性分布
略語:QIIME-CR, QIIMEクローズドリファレンスOTUピッキング,SD:標準偏差,CRC - 大腸癌,CRA - 大腸腺腫,SS-UP:Strain Select-UPARSE,p値:Monte Carlo並べ替えによるt検定で決定された疾患カテゴリーにわたる平均の差のp値。
【0135】
フィルタリング後、CRC症例と対照間の示差的存在量を分析するために、SS-UPパイプラインとQIIME-CRパイプラインに、それぞれ合計895および3511のOTUが保持された。ペプトストレプトコッカス・アナエロビウス(Peptostreptococcus anerobius)、パルビモナス属(Parvimonas)、ポルフィロモナス属(Porphyromonas)、アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)、およびフソバクテリウム属菌種(Fusobacterium sp.)は、両パイプラインにまたがって、対照と比較してCRC症例でかなり豊富に存在していた(表6)。
【0136】
(表6)SS-UPを使用して対照と比較したときのCRC症例での示差的存在量
略語:CRC:大腸癌,SS-UP:Strain Select-UPARSE,OTU:操作的分類単位,LogFC:Log2変化倍率,lfcse:Log2変化倍率標準誤差,stat:Wald検定の統計値,p:Wald検定に関連したp値,padj:FDR調整p値
ベース平均:サイズ係数(size factor)で割った正規化カウント値の平均
正のLog2変化倍率は、対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
「97otu12932」は、標準の分類学的名称が割り当てられていない、97%(種レベル)OTUクラスターを表す。
分類の表記法:門;属;種;株。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
正のLog2変化倍率は、対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
【0137】
SS-UPパイプラインは、CRC症例において、ポルフィロモナス・アサッカロリティカ(Porphyromonas asaccharolytica)ATCC 25260およびパルビモナス・ミクラ(Parvimonas micra)ATCC 33270を含めて、特定の菌株の顕著な富化を確認した。CRC症例におけるパントエア・アグロメランス(Pantoea agglomerans)の顕著な増菌もQIIME-CRから確認された(表7)。
【0138】
(表7)対照と比較したときのCRC症例での示差的存在量(QIIME-CR)
略語:OTU:操作的分類単位,LogFC:Log
2変化倍率,lfcse:Log
2変化倍率標準誤差,stat:Wald検定の統計値,p値:Wald検定に関連したp値,padj:FDR調整p値,unc:未分類,ベース平均:サイズ係数で割った正規化カウント値の平均;
正のLog2変化倍率は、対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
【0139】
CRAと対照の比較では、SS-UPおよびQIIME-CRパイプラインからそれぞれ710および2586のOTUが解析された。プレボテラ属(Prevotella)、メタノスパエラ属(Methanosphaera)、サクシノビブリオ属(Succinovibrio)およびヘモフィルス・パラインフルエンザ(Haemophilus parainfluenzae)種内のOTUは、両パイプラインで顕著に豊富であった。SS-UPは、DESeqによって顕著に異なって豊富であるとしてシネルギステス(Synergistes)科DSM 25858、メタノスパエラ・スタッドマナエ(Methanosphaera stadtmanae)DSM 3091などのユニークな株を特定した。アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)は、QIIME-CRによって対照と比較して、CRA症例ではあまり豊富でなかった(表8および9)。
【0140】
(表8)対照と比較したときのCRA症例での示差的存在量(SS-UP);正のLog2変化倍率は対照と比較してCRA糞便サンプルに豊富であることを示し、負の値はCRAと比較して対照サンプルに豊富であることを示す
略語:CRC:大腸癌,SS-UP:Strain Select-UPARSE,OTU:操作的分類単位,LogFC:Log
2変化倍率,lfcse:Log
2変化倍率標準誤差,stat:Wald検定の統計値,p値:Wald検定に関連したp値,padj:FDR調整p値;
ベース平均:サイズ係数で割った正規化カウント値の平均;
正のLog
2変化倍率は対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
「97otu12791」は、標準の分類学的名称が割り当てられていない、97%(種レベル)OTUクラスターを表す。
分類は、門;属;種;株の順に従う。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
【0141】
(表9)対照と比較したときのCRA症例での示差的存在量(QIIME-CR)
略語:OTU:操作的分類単位,LogFC:Log
2変化倍率,lfcse:Log
2変化倍率標準誤差,stat:Wald検定の統計値,p値:Wald検定に関連したp値,padj:FDR調整p値,unclassified(未分類) ベース平均:サイズ係数で割った正規化カウント値の平均
正のLog
2変化倍率は対照と比較してCRA糞便サンプルに豊富であることを示し、負の値はCRAと比較して対照サンプルに豊富であることを示す。
【0142】
ルミノコッカス属(Ruminococcus)とラクトバシラス属(Lactobacillus)、およびエンテロバクター科(Enterobacteriaceae)内のOTUは、対照と比較してCRCとCRAの両症例で一貫して豊富であった。特に、フソバクテリウム属菌種(Fusobacterium sp.)は、CRC症例では豊富であったが、CRA症例ではそうでなかった。
【0143】
本発明者らは、疾患の微生物マーカーが研究間で一貫していた度合いを評価するためにREMを構築した。5件以上の研究において、SS-UPパイプラインから合計142のOTUが、QIIME-CRパイプラインから388のOTUが生じた。パルビモナス・ミクラ(Parvimonas micra)ATCC 33270株は、SS-UPによって8件の研究のうち5件で、対照と比較してCRC症例で顕著に高かった(調整REM log
2倍の推定値:3.3、95%CI:2.2〜4.5、REM p<0.001、FDR調整p値<0.001)。SS-UPパイプラインからの他の例には、以下が含まれる:プロテオバクテリア門(Proteobacteria)内のOTU(8件の研究にわたる調整REM log
2倍の推定値:1.96、95%CI:0.8, 3.1、REM p=0.001、FDR p=0.07)およびストレプトコッカス・アンギノサス(Streptococcus anginosus)内のOTU(5件の研究にわたる調整REM log
2倍の推定値:1.4、95%CI:0.4, 2.4、REM p値:0.008、FDR p:0.19)。これらの研究に伴う生物学的および技術的な異質性にもかかわらず、上記のマーカーはCRCの重要なシグナルとして出現した(
図2A;表10)。
【0144】
(表10)SS-UPでのランダム効果モデル(REM)によって特定された、対照と比較してCRC症例で示差的に豊富なOTU
分類は門、属、種、株の順の慣例に従う。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
略語:LogFC:Log
2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
【0145】
フソバクテリウム属菌種(Fusobacterium sp.)は、8件のCRC-微生物叢関連研究のうち7件で検出されたが、症例と対照間で一貫して異なることはなかった。一部の研究では、ほとんど差異が観察されず、他の研究では逆の関係が検出された(つまり、症例と比較して対照で豊富)。対照と比較して症例でのフソバクテリウム属菌種の富化は、特にMiSeq研究で観察され、1.6の調整REM推定値(95%CI:0.04, 3.2、p:0.04、FDR p:0.4)をもたらした(表10)。
【0146】
REMによって有意と判定された分類群は、研究にわたってこれらの分類群の相対存在量分布のボックスプロットと合致していたが、比較グループではまばらに分布していた。また、QIIME-CRパイプラインは、対照と比較して、症例では一貫して富化または枯渇していた多数のOTUを特定したが、信頼性の高い種レベルの分類学的割り当てはほんの少数しかなかった。そのような例の1つは、ポルフィロモナス属(Porphyrmonas)内のOTUであった(5件の研究にわたる調整REM log2倍推定値:2.9;95%CI:2.0, 3.9;REM p値:2.2*10-9;FDR p:5.8*10-7)(
図2B;表11)。
【0147】
(表11)REM(QIIME-CR)によって特定された、対照と比較してCRC症例で示差的に豊富なOTU
分類は門、属、種の慣例に従う。所与の分類学的階級で不確実な分類の場合にはブランクが表示される。
LogFC:Log
2変化倍率 略語:LogFC:Log
2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I
2:ランダム効果モデルの場合、I
2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H
2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
【0148】
同様のREMを、CRAと対照を含む4件の研究のために構築した。SS-UPパイプラインは、CRAを含む研究のうち3件または全4件において検出された192のOTUを特定した。ラクノスピラ科(Lachnospiraceae)内のOTU(OTU1642;調整REM推定値:-1.96;95%CI:-2.97, -0.94;p:1.5*10-4;FDR:0.03)、およびバクテロイデス・プレビウス(Bacteroides plebius)種内のOTU(調整REM推定値:1.86;95%CI:0.5〜3.2;p:0.005;FDR:0.48)は、4件のCRA研究のうち3件で検出され、高い調整REM log2変化倍率を有していたが、FDR補正後は統計的に有意でなかった。同様に、QIIME-CRパイプラインは、バクテロイデス属(Bacteroides)(調整REM推定値:-2.9;95%CI:-4.1, -1.7;p:2.9*10-6;FDR:0.001)およびルミノコッカス属(Ruminococcus)(調整REM推定値:1.8;95%CI:0.6, 2.9;p:0.003;FDR:0.5)内のOTUをもたらした(表12および13)。
【0149】
(表12)ランダム効果モデル(SS-UP)によって特定された、対照と比較してCRA症例で示差的に豊富なOTU
分類は門、属、種、株の順の慣例に従う。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
略語:LogFC:Log
2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
【0150】
(表13)ランダム効果モデル(QIIME-CR)によって特定された、対照と比較してCRA症例で示差的に豊富なOTU
分類は門、属、種の慣例に従う。所与の分類学的階級で不確実な分類の場合にはブランクが表示される。
略語:LogFC:Log
2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
【0151】
上述したように、本発明者らは、疾患の複合微生物バイオマーカーを特定するために、各バイオインフォマティクスパイプライン用のランダムフォレスト分類器を開発した。最適モデルは、受信者操作特性曲線下面積(AUROC)についてチューニングされた。SS-UPパイプラインの場合、8件の研究で特定された微生物マーカーは80.4%のAUROC(感度:60.1%、特異度84.8%)を有し、これは臨床特徴に基づく分類器(AUROC:79.6%、DeLongs検定p=0.76)に類似していた。SS-UP微生物分類器は向上した感度を有し、一方臨床分類器はより良好な特異度を有していた。QIIME-CR微生物分類器のAUROCは76.6%であった(感度:55.3%、特異度:82.9%)(表14)。
【0152】
(表14)両パイプラインのランダムフォレスト分類器の特性
略語:QIIME-CR:QIIMEクローズドリファレンス,SS-UP:Strain Select UPARSE,ROC:受信者操作特性曲線,CRA:大腸腺腫;
平均は交差検証の分割(folds)にわたる平均を示し、臨床的変数は「臨床」および「臨床+」に含まれる。
微生物分類器はFOBT、年齢、性別、BMI、国籍であった。
【0153】
SS-UPとQIIME-CRの両方で、ペプトストレプトコッカス・アナエロビウス(Peptostreptococcus anerobius)、ポルフィロモナス属(Porphyromonas)およびディアリスター属(Dialister)内のOTUは、変数重要度(variable importance)が高くランク付けされた。SS-UP微生物分類器に含まれる上位の特徴は、前述のパルビモナス・ミクラ(Parvimonas micra)、ディアリスター・ニューモシンテス(Dialister pneumosintes)ATCC 33048、ペプトストレプトコッカス・ストマティス(Peptostreptococcus stomatis)DSM 17678、およびバクテロイデス・ブルガタス(Bacteroides vulgatus)ATCC 84842であったが、QIIME-CRアプローチでは、ブレイディア・モーレイ(Bulleida moorei)およびユウバクテリウム・ドリクム(Eubacterium dolichum)が重要であると特定された。フソバクテリウム属内のOTUもまた、CRC症例と対照を識別する上で重要であった。
【0154】
臨床データと人口統計データの両方が利用可能であった研究のサブセット(n=3研究、156サンプル)を使用して[10〜12]、これらの研究の微生物のみの分類器は、QIIME-CRの場合が80.9%、SS-UPの場合が89.6%のAUROC値を有していた。上述したように、臨床特徴単独は79.6%のAUROCをもたらし、臨床特徴と微生物特徴の両方を含む分類器は、QIIME-CRとSS-UPの場合に、それぞれ82.4%と91.3%のAUROC値を有していた(表14)。
【0155】
特定の研究が分類器の精度に重み付けをしたかどうかを判断するために、本発明者らは、n−1分析を行って、各研究が一度に1つずつ除外されたため、フルセットの研究(n=8研究)に基づいた性能と比較して、分類器の性能の変化を評価した。Wang_V3_454 [14]を除外すると、分類器の精度が最も低くなった(80.1%から75.8%);このことは、それが貢献する重要な特徴を有していたことを示唆する。WuZhu_V3_454を除外すると、SS-UPパイプラインの全体的な精度が向上した(AUROCは80.1%から83.9%に増加);このことは、それが疾患の転帰の分類を損なう「ノイズの多い」特徴に寄与していたことを示す。QIIME-CR解析でも同様の傾向が見られた(表15)。
【0156】
(表15)1件の研究抜き(leave one study out)および1件ごと(per study)のランダムフォレスト分類器の特性
略語:QIIME-CR:QIIMEクローズドリファレンス,SS-UP:Strain Select UPARSE,ROC:受信者操作特性曲線,PPV - 陽性的中率(Positive Predictive Value),NPV - 陰性的中率(Negative Predictive Value),mtry - ランダムフォレスト解析での各ノードでサブサンプリングされた特徴の数を決定するチューニングパラメータ、特徴:ランダムフォレスト解析で使用された微生物特徴の総数;
平均は交差検証の分割にわたる平均を示す。
【0157】
本発明者らは、各研究のRFモデルを個別に構築して、均質に処理されたサンプルを含む単一の研究内で特定された特徴がより良好なROCをしばしば有していたが、個々の研究モデルの感度は、多くの場合、組み合わせ分類器で得られた感度よりも低いことを観察した(表15)。
【0158】
分類器の一般化可能性をテストするために、本発明者らは、抜き出された研究における疾患の転帰をn−1微生物分類器がどの程度予測できるかを観察した。例えば、本発明者らは、(n−Chen_V13_454コホート)をトレーニングセットと考え、Chen_V13_454コホートを検証セットと考えて、Chenらのコホートにおける疾患の転帰が、残りの研究からの微生物特徴によってどの程度予測されるかを調べた。残りのコホートからの微生物特徴は、Chen_V13_454における36/42サンプル(AUROC:80.5%、精度:84.6%)を正しく予測することが観察された。予測値は研究間で異なっていた(表16)。
【0159】
(表16)除外された研究に対するn−1研究コホートの予測精度(SS-UP)
略語:SS-UP:Strain Select UPARSE,AUROC:受信者操作特性曲線下面積
【0160】
(表17)解析全体での上位25のOTU(SS-UP)
上向きの矢印は、対照と比較してCRC症例で分類群が上昇したことを示す。下向きの矢印は、症例と比較して対照で分類群が上昇したことを示す;
略語:SS-UP - Strain Select-UPARSE
示差的に豊富:DESeq2 Log2変化倍率>1.5、<-1.5、FDR p<0.05により選択された;
研究間で一貫して変化:調整ランダム効果Log2変化倍率>1もしくは<-1またはFDR調整REモデルp<0.5を有する;
分類での重要度:微生物特徴のRF分類器における重要度>10%;
上記の3つの基準のうち少なくとも2つを満たしたOTUが選ばれた。
【0161】
4件の研究からの微生物分類群を組み合わせたCRA 対 対照SS-UP分類器は、CRC分類器よりも低い精度(AUROC:63.6%)であったが、良好な感度(80.5%)および低い特異度(34.4%)を有していた。QIIME-CR CRA微生物分類器も同様のメトリックスを有していた(AUROC:67.4%、感度:78.3%、特異度:38.8%)。本発明者らはまた、CRAサンプルとCRCサンプルの分類を試みて、中程度に良好な分類精度を得た(SS-UP AUROC:73.7%、QIIME AUROC:80.7%)。
【0162】
最後に、本発明者らは、CRC 対 対照の比較用に上記解析からの微生物マーカーを組み合わせて、示差的に豊富であり、研究間で一貫しており、かつ分類する上で重要である共通のセットを特定した。SS-UPパイプラインからのこの25の微生物OTUリストを表17に示す。
【0163】
考察
以前に報告された大部分の微生物叢メタ解析では、16Sデータを処理するためのクローズドリファレンス方式が採用されてきた[20, 22, 41]。本研究において、本発明者らは、微生物叢研究の様々なコレクションをアセンブルして、クローズドリファレンスの手法と、オープンリファレンスOTUピッキングを組み合わせて参照データベースに対してデノボOTUを再分類する代替法と、の両方を評価した。多数の糞便微生物叢研究からの生の配列データをリポジショニングし、それを均一の方法で解析することによって、本発明者らは、CRCで一貫して豊富であるかまたは枯渇している微生物マーカーを特定した。重要なことに、本発明者らは、ショットガンメタゲノムシーケンシングを使用せずに、CRCおよびCRAに関連する新規かつこれまで未報告の菌株を特定した。
【0164】
元の微生物叢研究のそれぞれに関連する異質性にもかかわらず、本発明者らが構築したRF分類器は、Zeller et al [10](22分類群のショットガンメタゲノム分類器;AUROC 84%)、Zackular et al(6分類群;AUROC 79%)、およびBaxter et al [42](結腸病変を分類する微生物マーカー;AUROC 84.7%)によって報告された結果に匹敵した。[42] SS-UPベースの分類器は、一貫して、QIIME-CRの手法よりも高い感度と特異度をもたらし、予測子(すなわちOTU)およびチューニング変数(mtry)も少なかった。SS-UP微生物分類器は80.1%の精度を有し、Wu_V3_454研究(n=39)を除外すると、Baxter et al [42]と同様のAUROCが得られた。SS-UPパイプラインから得られた、研究[10-12]のサブセットからの微生物特徴を評価するモデル(AUROC 89.6%)または微生物特徴に加えてFOBT結果、年齢、性別およびBMIを評価するモデル(AUROC 91.8%)の結果は、Zeller et al(AUROC 87%)およびZackular et al(AUROC 93.6%)によって報告されたメタゲノムとFOBTを組み合わせた分類器に匹敵した。同様に、Baxterらは、微生物マーカーと、FOBTに代わるスクリーニング法である免疫学的便潜血検査(fecal immunochemical test:FIT)に基づいた組み合わせ分類器を報告しており、AUROCは95.2%であった[42]。したがって、これは、AUROC>84%を達成するCRC便分類器の最初の報告であるが、同時に8つのコホートおよび複数の実験室プロトコル間でばらつきが見られる。
【0165】
特に、本発明者らの1件抜き(leave-one-out)解析の結果は、SS-UP分類器が特定の研究に固有の特徴によって極端な影響を受けなかったことを示唆する。これにより、CRCのための信頼できる分類ツールとしての微生物マーカーの安定性が実証される。SS-UP微生物分類器の一般化可能性をさらに確立するために、1件抜き解析で除外された研究を外部検証コホートとして扱った場合に、その平均予測AUROCは71.3%であった(表16)。
【0166】
本発明者らは、パルビモナス・ミクラ(Parvimonas micra)ATCC 33270との高い類似度を有するOTUが、CRC症例で一貫して上昇するだけでなく、微生物分類器モデルおよび組み合わせ臨床-微生物分類器モデルで高くランク付けされることを報告する。以前に提案されたように[43]、歯周病のマーカー、例えばペプトストレプトコッカス属、ポルフィロモナス属およびディアリスター属菌種内のOTUは、両方のパイプラインに対して高い分類力を示した(表6〜7)。口腔病原体はCRCに関連して記述されており、この関係を説明するために複数のメカニズムが仮定されている[41, 44]。SS-UPパイプラインはまた、CRC症例に以前関与していた[26, 45]ブラウティア属(Blautia)内の菌株(例えば、Blautia luti DSM14534およびBlautia obeum ATCC 29174)の富化、ならびに食事由来の発癌物質を変換するユウバクテリウム・ハリイ(Eubacterium hallii)[46](DSM 3353株)および酪酸を産生するフィーカリバクテリウムcf.プラウスニッツイ(Faecalibacterium cf. prausnitzii)[12 27](KLE1255株)などの潜在的に有益な微生物の枯渇を確認した(表6)。
【0167】
SS-UPパイプラインとQIIME-CRパイプラインの両方において、CRC研究で最も一般的に報告されている細菌分類群の1つであるフソバクテリウム属菌種(Fusobacterium sp.)は対照と比較してCRC症例に豊富であることが判明した。それは本発明者らの示差的存在量分析でCRC症例に著しく豊富であり、組み合わせ(臨床+微生物)RFモデルで重要度が高いとランク付けされた;これらは両方ともプール解析であって、2つの大規模なMiSeq研究により重み付けされる可能性があった。1件ごと(per-study)の解析では、本発明者らは、V3および/またはV4領域を標的とするこれらのMiSeq研究で、log
2変化倍率が著しく高いフソバクテリウムOTUを特定したが、全研究にまたがって比較すると、その相対存在量および分布はかなり可変的であった。このことは、CRCに関連したフソバクテリウム属菌種の検出と報告が、16S標的領域(例えば、V3/V4アンプリコン)および/または利用したシーケンシングプラットフォームに左右され得ることを示唆する。フソバクテリウム属菌種はCRCサンプルに豊富であったものの、単変量解析、REMまたはRF分類モデルによるいずれのパイプラインでも、CRAサンプルに示差的に豊富であるとは認められなかった;このことは、それが後期疾患のマーカーであり得ることを示している。
【0168】
CRAまたは前癌病変は、どちらのバイオインフォマティクスパイプラインによっても、微生物マーカーにより対照から十分には識別されなかった。以前に発表された研究は、腺腫と対照を区別するための5つのOTUの組み合わせ(AUROC 83.9%)を報告したが、異なるコホートと20の微生物分類群を利用した別の研究は、CRAの識別において67.3%のROCをもたらした。微生物マーカーと臨床マーカーの組み合わせは、微生物マーカー単独よりもCRAに対する診断的有用性が高いようである。特に、FIT検査と門(phylum)レベルの微生物存在量の組み合わせは、CRAを分類するのに76.7%のAUROCを有することが報告されている[30]。以前に発表された研究と比較して、本発明者らの微生物マーカーのみのSS-UP分類器の感度は比較的高く(75.5%)、より特異度の高いFOBTまたはFIT検査[24, 30]を補完するために使用できる可能性がある。
【0169】
本発明者らのCRA 対 CRC分類は、本発明者らの解析での健常 対 CRA比較よりも、または他の研究からのものよりも、優れたAUROCをもたらした[11, 42]。したがって、微生物組成の変化は腺腫から癌への移行において最も明らかであるようだが、ポリープの発生時には必ずしもそうではない。示差的存在量分析は、CRAおよびCRCの両症例と対照との比較において、サクシノビブリオ属(Succinovibrio)およびクロストリジウム属(Clostridia)内の同じOTUのいくつかを特定した;これらは癌の進行において「ドライバー」種として機能しうる可能性がある。ドライバーであろうとパッセンジャーであろうと、これらの観察研究から、微生物の共生バランス失調(dysbiosis)はCRCに特有の特徴であり、検出および治療介入のための有望な標的を提示することが確認される。
【0170】
最善の努力にもかかわらず、特定の制限がいくつかあった。癌の病期、腫瘍の位置、FOBTの結果、および患者の人口統計(年齢、性別、BMIを含む)に関する情報は、解析された9件の研究のうち3件のみで利用可能であった。同様に、腺腫の成長パターン(例えば、管状または絨毛)および癌の能力(すなわち、腫瘍性または過形成性)に関する情報が限られていた。統計的に、示差的存在量分析は、疎な(sparse)微生物OTUデータ(微生物分類群分布の特性である)およびカバレッジの深度(depth of coverage)に関する変動に影響されやすい。本発明者らは、交絡因子を調整しかつ複数の比較を補正することによって、潜在的に人為的な結果を調整しようとした。
【0171】
これらの制限にもかかわらず、本研究は、様々な糞便微生物叢CRCデータセットをアセンブルして均一に解析し、CRC症例で一貫して上昇していた主要な分類群を特定し、そしてCRC検出用の16S rRNA遺伝子ベースの糞便微生物バイオマーカーの複合セットを決定した。これは、高感度で、特異的かつ非侵襲的なCRC診断法を探索する上で、重要な一歩前進に相当する。
【0172】
参照による組み入れ
本明細書に引用された全ての参考文献、記事、出版物、特許、特許公報、および特許出願は、あらゆる目的のためにそれらの全体が参照により本明細書に組み入れられる。
【0173】
しかしながら、本明細書に引用された参考文献、記事、出版物、特許、特許公報、および特許出願についての言及は、それらが有効な先行技術を構成するまたは世界のどの国でも一般常識の一部を形成する、ということの承認または何らかの示唆ではなく、また、そのようなものとして解釈されるべきではない。
【0174】
参考文献