(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-06
(45)【発行日】2023-10-17
(54)【発明の名称】大腸がんの検査方法
(51)【国際特許分類】
C12Q 1/6886 20180101AFI20231010BHJP
C12Q 1/6869 20180101ALI20231010BHJP
C12N 15/10 20060101ALN20231010BHJP
【FI】
C12Q1/6886 Z ZNA
C12Q1/6869 Z
C12N15/10 Z
(21)【出願番号】P 2018207802
(22)【出願日】2018-11-02
【審査請求日】2021-09-10
【国等の委託研究の成果に係る記載事項】(出願人による申告)国立研究開発法人日本医療研究開発機構(AMED)平成29年度次世代がん医療創生研究事業:腸内細菌を指標とした大腸がんの早期診断方法の開発「腸内細菌を指標とした大腸がんのスクリーニング方法の確立とそのがん予防への応用」「腸内細菌を利用した大腸がんの早期診断法及び発症リスク評価方法の開発」 産業技術力強化法第19条の適用を受ける特許出願
(73)【特許権者】
【識別番号】000173588
【氏名又は名称】公益財団法人がん研究会
(73)【特許権者】
【識別番号】591122956
【氏名又は名称】株式会社LSIメディエンス
(74)【代理人】
【識別番号】100179431
【氏名又は名称】白形 由美子
(72)【発明者】
【氏名】原 英二
(72)【発明者】
【氏名】長山 聡
(72)【発明者】
【氏名】吉本 真
【審査官】北村 悠美子
(56)【参考文献】
【文献】欧州特許出願公開第02955232(EP,A1)
【文献】国際公開第2018/079840(WO,A1)
【文献】国際公開第2019/151515(WO,A1)
【文献】MORI G. et al.,Shifts of Faecal Microbiota During Sporadic Colorectal Carcinogenesis,SCIENTIFIC REPORTS,2018年07月09日,Vol.8, 10329,p.1-11
【文献】ZACKULAR J. P. et al.,The Human Gut Microbiome as a Screening Tool for Colorectal Cancer,Cancer Prevention Research,2014年,Vol.7, No.11,p.1112-1121
【文献】Deep Learning with H2O,Sixth Edition,2017年,<https://h2o.ai/content/dam/h2o/en/marketing/documents/2018/01/DeepWater-BOOKLET.pdf>
【文献】メタゲノム・メタボローム解析により大腸がん発症関連細菌を特定 -便から大腸がんを早期に診断する新技術-,国立大学法人大阪大学 Press Release,p.1-9,2019年06月07日
【文献】YACHIDA S. et al.,nature medicine,2019年06月,Vol. 25, p.968-976
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
大腸がんの検査支援方法であって、
被験者から採取された糞便中の細菌叢の16SリボソームRNA遺伝子の塩基配列を網羅的に解析し、
得られた塩基配列のデータ群を
健常者及び大腸がん患者より得られたActinomycetales、Aeromonadales、Bacillales、Bacteroidales、Betaproteobacteriales、Bifidobacteriales、Clostridiales、Coriobacteriales、Desulfovibrionales、Enterobacteriales、Erysipelotrichales、Fusobacteriales、Lactobacillales、Mollicutes RF39、Selenomonadales、
及びVerrucomicrobialesに属する細菌のFeatureとその出現頻度をディープ・ラーニングを含む複数の機械学習アルゴリズムによって予め作成されている診断アルゴリズムによって解析し、
大腸がんを検出する検査支援方法。
【請求項2】
前記診断アルゴリズムが、
進行大腸がん患者、又は早期大腸がん患者から得られた16SリボソームRNA遺伝子の塩基配列データ群を区別して求めた診断アルゴリズムであって、
進行大腸がんは、Actinomycetales、Aeromonadales、Bacillales、Bacteroidales、Betaproteobacteriales、Bifidobacteriales、Clostridiales、Coriobacteriales、Desulfovibrionales、Enterobacteriales、Erysipelotrichales、Fusobacteriales、Lactobacillales、Mollicutes RF39、Selenomonadales、
及びVerrucomicrobialesに属する細菌のFeatureを用い、
早期大腸がんは、Bacteroidales、Betaproteobacteriales、Bifidobacteriales、Clostridiales、Coriobacteriales、Desulfovibrionales、Lactobacillales、
及びSelenomonadalesに属する細菌のFeatureを用い、
進行大腸がん、又は早期大腸がんを区別して解析することを特徴とする請求項1記載の検査支援方法。
【請求項3】
前記塩基配列のデータ群を大腸がん以外の疾患の診断アルゴリズムによって解析し、
大腸がんと併せて検出することを特徴とする請求項1又は2記載の検査支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、大腸がんの検査方法に関する。特に、被験者の糞便中の細菌の16S rRNA遺伝子の配列をメタシーケンス解析し、被験者が大腸がんに罹患しているかを検出する方法に関する。
【背景技術】
【0002】
厚生労働省の統計によれば、日本人の死因は男女ともにがんが第1位となっている。日本におけるがんの罹患数、死亡数は、人口の高齢化に伴い増加していることから、今後増々がんの罹患数は増加するものと考えられる。臓器別では、胃がんや前立腺がん、乳がんのように罹患数は増加しているにもかかわらず、死亡数は横ばい、あるいは微増のがんがある。その一方で、大腸がんのように罹患数、死亡数ともに増加しているがんもある。大腸がんは、日本対がん協会のがんの部位別統計によれば、がんによる死因のうち、女性ではトップ、男性でも3位であり、男女合わせて年間約5万人が大腸がんにより死亡している(2015年統計)。
【0003】
一般にがんは早期に発見し手術を行えば、完治、寛解する率が高くなる。大腸がんのように、罹患数、死亡数ともに増加しているがんは、早期発見が難しく、早期に治療を開始することができない患者が多いことを意味している。早期大腸がんの生存率は高いと言われていることから、早期発見をすることができれば、死亡数は減少するものと考えられる。したがって、大腸がんを早期発見することのできる検査方法が重要となる。
【0004】
現在、大腸がん検診は、一般に便潜血検査によって行われている。便潜血検査は、がんやポリープがあると大腸内に出血することがあるため、その血液を検出する検査である。症状がない場合であっても、大腸がん、あるいはポリープから出血があれば検出が可能であり、便を調べるという非侵襲的な方法であることから、無症状者を対象とした健康診断などで広く行われている検査である。
【0005】
便潜血検査には、大別してオルトトリジン法やガヤック法のような化学法と、抗体を用いた免疫法の2種類の検査方法がある。化学法は肉や魚などのヘモグロビンなどにも反応するため、2~3日前から食事制限が必要となる。一方、免疫法は便中のヒトヘモグロビンに特異的な抗体を用いて行う検査であり、食事や服薬の制限がなく受診者に対する負担が少ないことから、通常検診では、免疫法によって検査が行われている。しかし、いずれの便潜血検査であっても、出血していない場合には陰性となり、検出することができない。また、検診で広く行われている免疫法による検査では、胃に近い部位にがんがある場合には、ヘモグロビンが変性してしまうため、出血があっても検出できないことがある。そのため、便潜血検査では、検査によって大腸がんを発見できないいわゆる偽陰性が多いことが問題となっている。
【0006】
実際に、免疫法による便潜血検査の感度は、検査の回数(1日法・2日法・3日法)により異なるが、我が国では感度55.6~99.2%、海外では30~87%と報告されている(非特許文献1)。
【0007】
また、内視鏡を用いて検査を行うS字結腸鏡検査や全大腸内視鏡検査は、感度の良い検査であると言われている。特に、全大腸内視鏡検査は内視鏡による大腸全体の検査であることから、非常に感度が高い。しかしながら、前処置、前投薬、検査と患者の負担も大きく、また、まれにカメラを大腸に入れることによる出血や、穿孔を起こすことがあるため、感度は高いものの集団検診の一次検診には推奨されていない。したがって、内視鏡検査は、個人検診、あるいは症状のある者に対して行っているのが現状である。
【0008】
近年、次世代シーケンサーを用いて核酸配列を解析することができるようになり、糞便中の細菌の16S リボソームRNA(16S rRNA)配列解析から、腸内細菌叢と種々の疾患が相関することが報告されてきている。腸内細菌叢と相関する疾患としては、炎症性大腸炎、過敏性腸症候群などの大腸疾患だけではなく、肥満、非アルコール性脂肪性肝炎などの慢性疾患や、神経性疾患などの疾患との相関も報告されている(非特許文献2)。大腸がんと腸内細菌叢の相関に関しても多数報告されており、大腸がん発生と相関の高い菌種が報告されている(非特許文献3)。非特許文献3は総説であり、今までに報告されている大腸がんと相関して増減する菌種がまとめられている。しかしこれらの細菌は、大腸がんの原因となり得る菌、あるいは大腸がん発症を抑制し得る菌であり、これらの菌を検出することによって、大腸がんを感度良く検出できるわけではない。
【0009】
非特許文献4には、大腸がんを診断する方法として、患者の腸内細菌叢を解析する最適のアルゴリズムについて開示されている。非特許文献4は特定のアルゴリズムを用いることによってAUC=0.994と非常に感度良く大腸がんを診断できることが報告されている。食習慣の全く異なる中国とフランスの集団において、Bayes NetとRandam Forestという2つのアルゴリズムがどちらの集団においても精度良く大腸がんを診断できることが記載されている。
【0010】
また、特許文献1には定量的PCRによって1種又は複数種の細菌の16S rRNAを測定することにより大腸がんや腺腫性ポリープを検査する方法が開示されている。
【先行技術文献】
【特許文献】
【0011】
【非特許文献】
【0012】
【文献】有効性評価に基づく大腸がん検診ガイドライン 平成16年度 厚生労働省がん研究助成金「がん検診の適切な方法とその評価法の確立に関する研究」班 2005年3月24日
【文献】Martinez,K.B. et al., 2017, doi:10.1074/jbc.R116.752899
【文献】Gagniere,J. et al., World J. Gastroenterol., 2016, Vol.22(2), pp.501-518.
【文献】Ai,L. et al., Oncotarget, 2017, Vol.8, No.6, p.9545-9556.
【文献】Segata, N. et al., Genome Biology, 2011, 12:R60.
【発明の概要】
【発明が解決しようとする課題】
【0013】
上述のように、現在行われている大腸がんの検査は、非侵襲的な検査である便潜血検査は感度が低く、内視鏡検査は、感度は高いものの受診者に対する不利益が大きいという問題がある。近年提案されている腸内細菌を検査する方法は、次世代シーケンサーの普及とともに広く行われるようになってきたが、現在のところ特定の菌種が大腸がんをはじめとする種々の疾患へ相関することを指摘する研究が主流であり、疾患を診断するには至っていない(非特許文献2、3)。また、いずれの場合も早期がんを対象とするものではなく、早期の大腸がんを感度良く検査できる方法ではない。
【0014】
特許文献1に記載の方法は、AUCが0.7程度と、さほど感度の良い検査ということはできない。また、開示されている4つの細菌配列すべてについて定量を行ったとしても、個々に独立した検査であることから、感度が増強されることにはならない。
【0015】
非特許文献4に記載の方法は特定のアルゴリズムを用いることによって、感度良く大腸がんを検査できることが開示されている。しかし、解析に用いたサンプル数が少なく、過適合の可能性が高い。その結果、高いAUCが得られている可能性を否定できず、データとして信頼性に乏しい。
【0016】
さらに、非特許文献4に記載の方法は早期がんと進行がんを分けて解析してはいない。本発明者らのグループが早期がんと進行がんを分けて解析したところ、早期がんと進行がんとでは腸内細菌叢が大きく異なることが明らかとなった。大腸がんは多くの場合、進行がんになってから発見されることが多い。そのため、解析に用いられているのは進行がんを多く含む群となる。進行がん患者が多く含まれる群を用いて得られた解析結果をもとに、早期がん患者を検出することはできない。早期の大腸がんを検出するためには、早期がん患者から得られた試料をもとに解析する必要がある。
【0017】
本発明は、非侵襲的な検査でありながら、感度が高い大腸がんの検査方法を提供することを課題とする。便潜血検査に代わる一次スクリーニング検査として腸内細菌叢の検査を行い、陽性であった者を対象として大腸内視鏡検査を行えば、今まで検出することのできなかった早期の大腸がんを検出できるだけではなく、患者の負担も非常に少なくて済む。
【課題を解決するための手段】
【0018】
本発明は、便試料を用いて大腸がんを感度、及び特異度良く検査する方法に関する。特に、早期の大腸がんを検出する方法に関する。
(1)大腸がんの検査方法であって、被験者から採取された糞便中の細菌叢の16SリボソームRNA遺伝子の塩基配列を網羅的に解析し、得られた塩基配列のデータ群を予め得られている診断アルゴリズムによって解析し大腸がんを検出する検査方法。
(2)前記診断アルゴリズムが、進行大腸がん患者、又は早期大腸がん患者から得られた16SリボソームRNA遺伝子の塩基配列データ群を区別して求めた診断アルゴリズムであって、進行大腸がん、又は早期大腸がんを区別して解析することを特徴とする(1)記載の検査方法。
(3)前記診断アルゴリズムが、前記塩基配列のFeatureとその出現頻度を複数の機械学習アルゴリズムによって得られた結果を統合して作成した診断アルゴリズムであることを特徴とする(1)、又は(2)記載の検査方法。
(4)前記塩基配列のデータ群を大腸がん以外の疾患の診断アルゴリズムによって解析し、大腸がんと併せて診断を行うことを特徴とする(1)~(3)いずれか1項記載の検査方法。
【図面の簡単な説明】
【0019】
【
図1】全大腸がんの診断アルゴリズムによるROC曲線を示す。
図1AはTraning set、
図1BはTest setの解析結果を示す。
【
図2】進行大腸がんの診断アルゴリズムによるROC曲線を示す。
図2AはTraning set、
図2BはTest setの解析結果を示す。
【
図3】早期大腸がんの診断アルゴリズムによるROC曲線を示す。
図3AはTraning set、
図3BはTest setの解析結果を示す。
【
図4】
図4Aは、早期大腸がん診断アルゴリズムのTest群での早期がん予測値の分布の箱ひげ図を示す。
図4Bは、Test群を深達度別に分けた場合の予測値の分布の箱ひげ図を示す。
【発明を実施するための形態】
【0020】
本発明の方法は、対象の腸内細菌の塩基配列を網羅的に決定し、その情報をもとに疾患リスクを解析する方法である。したがって、疾患と腸内細菌叢の変化が明らかにされた疾患であれば、同様に検査を行うことができるだけではなく、同じデータをもとに解析し、異なる疾患も併せて検査結果を得ることができる。すなわち、非侵襲的な方法であり、かつ単一の検査でありながら、複数の疾患を同時に検査することができる。
【0021】
[実施例1]全大腸がんの診断アルゴリズム
大腸がんの場合は、進行がんであっても自覚症状のない患者も多い。また、健康診断時の検査においては、早期がん、進行がんを区別して検査することはないので、早期がん、進行がんを含めたがん患者の解析を行った。
【0022】
2013年12月から2015年3月にかけて、がん研有明病院、併設の健診センターにおいて、得られた糞便サンプルを用いて解析を行った(以下、この群をコホート1という。)。インフォームド・コンセントが得られた大腸がん患者509例、健常者928例の便試料のうち、採便日不適正、消化管再建手術既往などの除外基準に該当したサンプルを除外し、大腸がん379例(早期がん63例、進行がん316例)、健常者815例のサンプルについて解析を行った。また、すべての健常者は、5年以内に大腸内視鏡(Colono Fiberscopy:CF)検査の受診歴があり、大腸がんがないことが確認されている者(n=617)、あるいは、採便後2年間のフォロ-アップで大腸がん発症がないことが確認されている者(n=198)を対象としている。それぞれの群の臨床病理学的特徴を表1に示す。
【0023】
【0024】
早期がん、進行がんの判断は、検体の病理組織学的診断(pathological staging)を行い、深達度で判断し、基底膜に達していないTis、T1(がんが粘膜層にとどまり、粘膜下層に及んでいない、あるいはがんが粘膜下層に浸潤しているが、固有筋層に及んでいない状態)を早期、基底膜に達しているT2からT4b(がんが固有筋層まで浸潤している状態から直接他臓器に浸潤している状態までを含む。)を進行がんとして解析している。治療においても早期がんは内視鏡的切除が可能であるのに対し、進行がんでは腹腔鏡手術、あるいは開腹手術が必要となる。なお、進行がんのうち術前に化学療法、又は放射線化学療法を施行した症例については、術前治療前の検査データ(内視鏡検査、CT検査、直腸がんの場合は加えてMRI検査)の結果をもとに医師2名でclinincal stagingを行っている。
【0025】
便試料は採便容器(株式会社テクノスルガ・ラボ)に採取したものを回収した。大腸がん患者、健常者から得られた便試料から、以下の方法によりDNAを抽出した。検便サンプルは、ジルコニアビーズ(0.1mm、安井器械株式会社)を添加し、85℃、15分間、加熱した後、細胞破砕機(安井器械株式会社、マルチショッカー)によって破砕した。糞便破砕液は、QIAamp Fast DNA Stool Mini Kit(株式会社キアゲン)を用いて精製した。
【0026】
精製したDNAは、260nm、280nmの吸光度を測定後、-20℃で保存した。また、得られたDNAの品質は16S rRNAをPCR増幅して品質確認を行った。
【0027】
大腸がん患者、健常者から得られたDNA試料は、腸内細菌16s rRNA遺伝子配列をメタシーケエンス解析によって解析した。16S rRNA遺伝子において、種、あるいはグループに特異的な領域であるV1V2領域を含む配列を解析可能なように、16S rRNAに共通する配列をPCRプライマーとして設定し、一括してPCR増幅し、増幅された配列中に存在する種間で異なる可変領域の遺伝子配列の解析を行った。
【0028】
ヒト腸管には数百種の腸内常在菌が生息していると言われているが、多くの菌は嫌気性の細菌であり、培養することの難しい難培養性細菌であると言われている。次世代シークエンサを用いた16S rRNA遺伝子のメタシーケンス解析によれば、菌を分離培養することなく、菌種の解析を進めることができ
る。その結果、培養の容易性、困難性といったバイアスをかけることなく、腸内に生息する細菌集団の配列データを高速にかつ網羅的に取得することができる。
【0029】
ここでは、16S rRNAの可変領域であるV1~V2領域を増幅するPCRプライマーを設定しPCRによりライブラリーを作製しているが、これに限らず腸内細菌叢を網羅的に解析できる領域であれば、どのような領域にプライマーを設定して解析を行ってもよい。また、シーケンス方法についても、どのような方法を用いてもよい。例えば、ナノポアシーケンサーによる方法や今後開発される、新しいシーケンス方法を用いて解析を行うことができることは言うまでもない。
【0030】
ライブラリーの作製方法、シーケエンス方法についての概要を記載する。以下のPCRはすべて、KOD FX Neo(東洋紡株式会社)を用いて行っている。V1~V2領域のライブラリーは、便試料より抽出したDNAを1st PCRとして配列番号1、及び2に記載のプライマーを用いて増幅した。なお、PCR反応は、電気泳動によりチェックした。2nd PCRは以下の配列番号3~10のForwardプライマー、配列番号11~22のRevereseプライマーを夫々組合せ、計96通りの組合せにより増幅した。なお、2nd PCRの反応は、V1~V2領域のライブラリーを配列番号23及び24のプライマーを用いてPCR増幅し、電気泳動により確認した。
【0031】
【表2】
なお、mはa又はc、yはc又はg、nはa、c、g、tいずれかの塩基であることを示す。
【0032】
DNA配列はMiSeq Reagent Kit V2 500cycles を用い、MiSeqにより決定した。クオリティコントロールはPhiX コントロールv3(以上、全てイルミナ株式会社)を用いた。
【0033】
各試料から得られた配列は、QIIME 2を用いて解析を行った。QIIME 2によりシーケンスエラーを自動的に判断し、100%シーケンスリードが一致しているものを同一のFeatureとして解析するため、結果が非常に安定であり、各サンプルにおける存在比率が正確である。また、100%一致するシーケンスリードを同一のFeatureとするため、複数のFeatureに同じ菌種が割り当てられる。Featureによる解析は、配列類似性でクラスタリングするOTUを用いた解析に比べより診断モデル作成に適している。
【0034】
サンプルは、予めランダムにTraining群(8割、大腸がん患者293~312例、健常者638~659例)とTest群(2割、大腸がん患者67~86例、健常者156~177例)に分けた。また、LEfSe(Liner discriminant analysis Effect Size、非特許文献5)を用いて、健常者群、がん患者群に特徴的に出現する菌を解析した。
【0035】
次に機械学習アルゴリズムを用いて診断モデルを作成した。オープンソースの機械学習分析プラットフォームであるH2O.aiを用いて解析を行った。H2O.aiは機械学習とディープ・ラーニングの両方を行うことによって、より良いモデルを構築することを可能とするプラットフォームである。具体的には、一般化線形モデル、Distributed Random Forest、Extremely Randmized Trees、Gradient Boosting Machine、Deep Learingで得られた結果を一般化線形モデルを用いて統合するStacked Ensembles法により診断精度の良いアルゴリズムを作成した。その結果、294のFeatureを選択した。予め分けたTraining群で診断アルゴリズムを作成し、Test群でバリデーションを行った。
【0036】
まず、Training群における診断モデルの内的妥当性を検証するために、Training群のデータをランダムに10に分け9/10をTraning setとし、1/10をTest setとして交差検証を行った。なお、パラメータの調整等、すべての工程はH2Oによって自動的に行われるように設定されている。結果を
図1に示す。
【0037】
Training群におけるROC曲線は、平均AUC0.8799(±95%CI:0.0035)、Test群にあてた結果は、平均AUC0.8812(±95%CI:0.0083)であった。Training setの結果は交差検証の結果が改善するようにパラメータ値を調整するので、Test setのデータでモデルを評価することは必須である。Test群における平均AUCは0.8812であることから、非常に高い感度で大腸がん患者を診断できることを示している。
【0038】
複数の計算方法を統合して、診断方法を得る方法は、今回初めて行われた方法である。複数の解析方法を組み合わせるということにより、非常に精度が高く信頼性の高い診断方法を得ることができた。ここでは、上記の解析方法を用いてアルゴリズムを構築しているが、今後新しい統計解析方法や、新しい組み合わせによる解析方法で精度高く診断を行うことが可能となれば、それらの方法を用いてアルゴリズムを構築してもよい。
【0039】
なお、コホート1の全大腸胃がん診断アルゴリズムは、294のFeature(配列番号25~318)を用いて作成した。これらFeatureは、種まで同定可能なものもあったが、目までしか同定できないものも含まれていた。検出されたFeatureは、Actinomycetales、Aeromonadales、Bacillales、Bacteroidales、Betaproteobacteriales、Bifidobacteriales、Clostridiales、Coriobacteriales、Desulfovibrionales、Enterobacteriales、Erysipelotrichales、Fusobacteriales、Lactobacillales、Mollicutes RF39、Selenomonadales、Verrucomicrobialesの16の目に分類される菌であった。
【0040】
[実施例2]進行がんの診断アルゴリズム
次に、コホート1において、進行がん患者のみを抽出し、進行がん患者の診断アルゴリズムを作成した。前述のように、大腸がんにおいて、進行がんと早期がん患者の腸内細菌叢の解析を行った結果、進行がんと早期がんでは腸内細菌叢プロファイルが大きく異なっていた。コホート1の大腸がん患者は、早期がんが少ないとはいえ、63例含まれていることから、大腸がん患者のサンプルの中から、早期がん患者のサンプルを除外し進行がんのみを抽出して解析を行った。コホート1の進行がん316例、健常者815例を対象として、実施例1と同様にして診断アルゴリズムを作成し、ROC曲線を求めた(
図2)。
【0041】
Training群におけるROC曲線は、平均AUC0.8975(±95%CI:0.0031)、Test群にあてた結果は、平均AUC0.8877(±95%CI:0.0104)であった。進行がんに限定して診断アルゴリズムを作成したことで、診断の精度が改善している。
【0042】
なお、コホート1の進行がん診断アルゴリズムは、319のFeature(配列番号26~61、63、64、66~70、72~74、76~80、82、83、85~88、90~98、100、102~111、113、114-118、120、121、123~125、127~130、132~142、144~153、155~157、159~161、163~169、171~173、176~181、183~191、193~210、212、213、215~217、220、222、224~230、232~235、238~240、242~247、249~261、263~270、272~278、281~296、298~309、311~317、319~385)を用いて作成した。全大腸がんのアルゴリズム作成に使用したFeatureと重複しているものもあるが、進行がんのアルゴリズム作成にのみ使用しているFeatureも多数含まれている。病期を分けて解析を行うことの重要性を示している。
【0043】
これらFeatureは、Actinomycetales、Aeromonadales、Bacillales、Bacteroidales、Betaproteobacteriales、Bifidobacteriales、Clostridiales、Coriobacteriales、Desulfovibrionales、Enterobacteriales、Erysipelotrichales、Fusobacteriales、Lactobacillales、Mollicutes RF39、Selenomonadales、Verrucomicrobialesの16の目に分類される菌であった。
【0044】
[実施例3]早期がんの診断アルゴリズム
次に早期がんを診断可能なモデルの作成を行った。2017年1月~9月に新たに早期の大腸がんサンプルと、健常者サンプルを収集した。また、併せて大腸がんの前病変であるアデノーマ(腺腫)を有する患者サンプルを集めた(以下、コホート2という。)。アデノーマのサンプルは、直径10mm以上の進行したアデノーマを有する患者の糞便サンプルを収集している。
【0045】
消化器がん併存例、既往例など、早期がん患者8例、健常者9例を除外サンプルとした。その結果、早期がん患者135例、健常者154例、アデノーマ患者81例のサンプルが解析対象となった。
【0046】
実施例1と同様にして、コホート2のサンプルを用いて早期がん患者診断アルゴリズムを作成した。Training群、Test群のROC曲線を
図3に示す。Training群におけるROC曲線は、平均AUC0.9243(±95%CI:0.0045)、Test群にあてた結果は、平均AUC0.9274(±95%CI:0.0084)であった。AUCが0.92以上と非常に感度良く早期の大腸がんを診断する診断アルゴリズムが作成できた。便潜血検査では発見の難しい早期の大腸がん患者もこの診断アルゴリズムによって、感度・精度ともに高く検出することができる。
【0047】
なお、コホート2の早期がん診断アルゴリズムは、152のFeature(配列番号27、93、126、150、166、191、244、246、256、330、332、334、352、383、386~522)によって作成した。これらFeatureは、Bacteroidales、Betaproteobacteriales、Bifidobacteriales、Clostridiales、Coriobacteriales、Desulfovibrionales、Lactobacillales、Selenomonadalesの8つの目に属する菌であった。また、進行がん診断アルゴリズムと早期がん診断アルゴリズムの双方で共通するFeatureは13に留まり、進行がんと早期がんでは患者の腸内細菌叢が大きく異なることが示唆される。このことからも病期を分けて診断アルゴリズムを作成することが重要であることが示させる。
【0048】
早期がん患者、進行がん患者の腸内細菌叢は異なることから、別々の診断アルゴリズムを適用して検出を行うことにより、より精度良く大腸がん患者を検出することができる。具体的には同じ検査データを早期がん診断アルゴリズム、進行がん診断アルゴリズムを適用して解析を行えばよい。すなわち、1度のシーケンス解析によって得られたデータを異なる診断アルゴリズムに適用するだけでよい。さらに、アルツハイマー病をはじめとする神経変性疾患や、心筋梗塞など、腸内細菌叢と疾患との相関が明らかになってきている疾患についても精度の良い診断アルゴリズムが作成されれば、これら疾患も同じデータを用いて併せて検査を行うことが可能となる。
【0049】
次に、早期大腸がん診断モデルのTest群での早期がん予測値分布の箱ひげ図(
図4A)、及び深達度別の予測値分布の箱ひげ図(
図4B)を示す。なお、かっこ内に示す数字は各群のサンプル数を示す。
図4に示すように、早期がん、深達度Tis、T1に分けた早期がん、いずれにおいても明らかに健常者と大腸がん患者を精度良く診断できることが示された。
【0050】
早期がん診断アルゴリズムで、大腸がんの前病変であるアデノーマを検出し、切除を行うことができれば、大腸がんの罹患率を減らすことにつながり、大きなメリットがある。81例の進行したアデノーマ患者の腸内細菌を同様に解析し、得られたデータを早期がん診断アルゴリズムで解析を行った。
【0051】
特異度が93%になるように閾値を設定し、アデノーマ患者から得られたデータに適用した。その結果、陽性率は平均43.36%(95%CI1.9%)であった。従来の大腸がんの検査方法をアデノーマ患者に適用した場合、陽性率は20%程度であると言われている。したがって、従来法に比べて明らかに高い陽性率を示しており、アデノーマも検出可能であることが示された。
【配列表】