IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ スマートディーエヌエー ピーティーワイ エルティーディーの特許一覧

<>
  • 特許-ディスバイオシスを診断する方法 図1
  • 特許-ディスバイオシスを診断する方法 図2
  • 特許-ディスバイオシスを診断する方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-21
(45)【発行日】2023-07-31
(54)【発明の名称】ディスバイオシスを診断する方法
(51)【国際特許分類】
   C12Q 1/04 20060101AFI20230724BHJP
   C12Q 1/689 20180101ALI20230724BHJP
   A61K 45/00 20060101ALI20230724BHJP
   A61P 43/00 20060101ALI20230724BHJP
   A61P 1/00 20060101ALI20230724BHJP
【FI】
C12Q1/04
C12Q1/689 Z
A61K45/00
A61P43/00
A61P1/00
【請求項の数】 17
(21)【出願番号】P 2020524656
(86)(22)【出願日】2018-07-17
(65)【公表番号】
(43)【公表日】2020-09-03
(86)【国際出願番号】 AU2018050748
(87)【国際公開番号】W WO2019014714
(87)【国際公開日】2019-01-24
【審査請求日】2021-07-15
(31)【優先権主張番号】2017902786
(32)【優先日】2017-07-17
(33)【優先権主張国・地域又は機関】AU
【前置審査】
(73)【特許権者】
【識別番号】520019838
【氏名又は名称】スマートディーエヌエー ピーティーワイ エルティーディー
【氏名又は名称原語表記】SMARTDNA PTY LTD
(74)【代理人】
【識別番号】110000774
【氏名又は名称】弁理士法人 もえぎ特許事務所
(72)【発明者】
【氏名】スミス,マーガレット
【審査官】福澤 洋光
(56)【参考文献】
【文献】国際公開第2011/043654(WO,A1)
【文献】特表2016-501852(JP,A)
【文献】特開2016-214108(JP,A)
【文献】Gastroenterology,2011年,Vol.141,pp.1792-1801
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00- 3/00
C12N 1/00-15/90
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
PubMed
(57)【特許請求の範囲】
【請求項1】
被検者の過敏性腸症候群(IBS)のサブタイプを決定する方法であって、前記被検者由来の試料中又は前記被検者の環境由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、前記少なくとも5種の細菌は、Christensenella minuta、Papillibacter cinnamivorans、Bilophila wadsworthia、Ruminococcus bromii、及びSoleaferrea massiliensisを含む、方法。
【請求項2】
Akkermansia muciniphila、Oscillibacter valericigenes、Desulfitobacterium frappieri、Anaerofilum pentosovorans、Lactobacillus japonicas、Catabacter hongkongensis、Clostridium sporosphaeroides、及びFaecalibacterium prausnitziiから選択される少なくとも1種の細菌の存在量を決定することを更に含む、請求項1記載の方法。
【請求項3】
少なくとも10種の細菌の前記存在量を決定する、請求項1記載の方法。
【請求項4】
被検者のディスバイオシスを検出する方法であって、前記被検者由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、前記少なくとも5種の細菌は、Corynebacterium minutissimum、Prevotella oulora、Fusobacterium naviforme、Prevotella ruminicola、及びBifidobacterium thermacidophilumを含む、方法。
【請求項5】
Dysgonomonas wimpennyi、Propionibacterium acnes、Corynebacterium tuberculostearicum、Brevibacterium casei、Lachnobacterium bovis、Prevotella dentasini、Prevotella albensis、Veillonella atypica 、Kytococcus schroeteri、Prevotella copri、Bacteroides barnesiae、Prevotella conceptionensis、Anaerofustis stercorihominis、Bifidobacterium thermophilum、Prevotella brevis、Roseburia intestinalis、Clostridium symbiosum、Barnesiella intestinihominis、Bacteroides fragilis、Anaerostipes rhamnosus、Collinsella aerofaciens、Clostridium bolteae、Arthrobacter creatinolyticus、Atopobium fossor、Prevotella paludivivens、及びPelotomaculum isophthalicicumから選択される少なくとも1種の細菌の存在量を決定することを更に含む、請求項4記載の方法。
【請求項6】
少なくとも10種の細菌の前記存在量を決定する、請求項4記載の方法。
【請求項7】
少なくとも20種の細菌の前記存在量を決定する、請求項4記載の方法。
【請求項8】
前記ディスバイオシスは、IBSである、請求項4乃至7の何れかに記載の方法。
【請求項9】
過敏性腸症候群(IBS)である被検者のIBSのサブタイプを決定する方法であって、前記被検者由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、前記少なくとも5種の細菌は、Christensenella minuta、Soleaferrea massiliensis、Papillibacter cinnamivorans、Oscillibacter valericigenes、及びRuminococcus bromiiを含む、方法。
【請求項10】
Gemmiger formicilis、Desulfitobacterium frappieri、Alistipes obesi、Anaerofilum pentosovorans、Akkermansia muciniphila、Alkaliphilus crotonatoxidans、Eubacterium sulci、Bdellovibrio exovorus、Curtobacterium pusillum、Flavonifractor plautii、Ruminococcus lactaris、Mogibacterium neglectum、Roseburia inulinivorans、Butyricimonas virosa、Intestinimonas butyriciproducens、Butyrivibrio crossotus、Barnesiella intestinihominis、Flavobacterium resistens、Flavobacterium cauense、Clostridium glycyrrhizinilyticum、Anaerostipes hadrus、Prevotella ruminicola、Blautia wexlerae、及びAnaerostipes coliから選択される少なくとも1種の細菌の存在量を決定することを更に含む、請求項9記載の方法。
【請求項11】
少なくとも10種の細菌の前記存在量を決定する、請求項9記載の方法。
【請求項12】
少なくとも20種の細菌の前記存在量を決定する、請求項9記載の方法。
【請求項13】
請求項8記載の方法により被検者の過敏性腸症候群(IBS)を検出することと、前記被検者のIBSが検出された場合、その後、請求項9乃至12記載の方法によりIBSのサブタイプを決定することと、を含む方法。
【請求項14】
ディスバイオシスを有する被検者に適切な治療の決定を補助する方法であって、請求項1乃至3又は9乃至13の何れかに記載の方法により過敏性腸症候群(IBS)のサブタイプを決定することと、IBSのサブタイプの決定の結果に基づいて、適切な治療の決定を補助することと、を含む方法。
【請求項15】
被検者は、ヒトである、請求項1乃至14の何れかに記載の方法。
【請求項16】
被検者は、以前に化学療法又は抗生物質投与を受けている、請求項1乃至14の何れかに記載の方法。
【請求項17】
前記試料は、糞便試料である、請求項1乃至16の何れかに記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、被検者のディスバイオシスを診断する方法、適切な治療を決定する方法、及びディスバイオシスを治療する方法に関する。
【背景技術】
【0002】
ヒトの微生物叢は、殆どが細菌起源且つ非病原性の数兆の微生物で構成される。微生物叢は、ヒトの健康に極めて重要な役割を果たし、宿主の免疫系と共に機能して、病原体の侵入及び定着を防ぐ。また、必須のビタミン及び栄養素の供給源を提供すると共に、アミノ酸及び短鎖脂肪酸等の食物からのエネルギ及び栄養素の抽出を支援することにより、必須の代謝機能を有する。この点において、宿主は、健康に大きく貢献する多数の重要な生物学的機能について、微生物叢に大きく依存している。
【0003】
ヒトの微生物叢のディスバイオシスが多数の病気に関連することを示唆する証拠が増えている。しかしながら、微生物叢内の細菌種間の非常に複雑な相互作用のため、微生物叢がヒトの健康及びヒトの病気への関与に及ぼす正確な影響を判定又は予測することは困難である。したがって、関連疾患を発症するリスクのある被検者を特定するために、ディスバイオシスを効果的に診断可能な方法が必要となる。
【発明の概要】
【0004】
本発明者らは、被検者の微生物叢を分析することと、それを標準試料と比較することとを含む、被検者のディスバイオシスを診断する方法を開発した。更に、発明者らは、幾つかの細菌種及び属は、微生物叢における存在量が、IBS、自閉症、及び腸の老化を含む特定の疾患に関連するディスバイオシス及びそのサブタイプについて情報価値を有することを確認した。
【0005】
したがって、本開示は、被検者におけるIBSのサブタイプを決定する方法であって、被検者又は被検者の環境由来の試料中の少なくとも10属の細菌の存在量を決定することを含み、少なくとも10属は、Alkaliphilus、Sphingomonas、Pelotomaculum、Eggerthella、Eubacterium、Paracoccus、Lachnoclostridium、Bacillus、Anaerorhabdus、Actinomyces、Methylobacterium、Pseudomonas、Streptococcus、Staphylococcus、Peptoclostridium、Erysipelatoclostridium、Anaerostipes、Sutterella、Brevundimonas、Clostridium、Peptostreptococcaceae、Slackia、Blastomonas、Lactobacillus、Klebsiella、Agrobacterium、及びPhyllobacteriumから選択される、方法を提供する。
【0006】
一実施形態において、少なくとも10属の細菌には、Alkaliphilus、Sphingomonas、Pelotomaculum、Eggerthella、Eubacterium、Paracoccus、Lachnoclostridium、Bacillus、Anaerorhabdus、及びActinomycesから選択された少なくとも5属が含まれる。
【0007】
一実施形態において、少なくとも10属の細菌には、Alkaliphilus、Sphingomonas、Pelotomaculum、Eggerthella、Eubacterium、Paracoccus、Lachnoclostridium、Bacillus、Anaerorhabdus、及びActinomycesが含まれる。
【0008】
一実施形態において、少なくとも20属の細菌の存在量を決定する。
【0009】
また、本開示は、被検者におけるIBSのサブタイプを決定する方法であって、被検者又は被検者の環境由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、少なくとも5種の細菌は、Christensenella minuta、Papillibacter cinnamivorans、Bilophila wadsworthia、Ruminococcus bromii、Soleaferrea massiliensis、Akkermansia muciniphila、Oscillibacter valericigenes、Desulfitobacterium frappieri、Anaerofilum pentosovorans、Lactobacillus japonicas、Catabacter hongkongensis、Clostridium sporosphaeroides、及びFaecalibacterium prausnitziiから選択される、方法を提供する。
【0010】
一実施形態において、少なくとも5種の細菌には、Christensenella minuta、Papillibacter cinnamivorans、Bilophila wadsworthia、Ruminococcus bromii、及びSoleaferrea massiliensisから選択される少なくとも2種が含まれ。
【0011】
一実施形態において、少なくとも5種の細菌には、Christensenella minuta、Papillibacter cinnamivorans、Bilophila wadsworthia、Ruminococcus bromii、及びSoleaferrea massiliensisが含まれる。
【0012】
一実施形態において、少なくとも10種の細菌の存在量を決定する。
【0013】
また、本開示は、自閉症を診断する方法であって、被検者又は被検者の環境由来の試料中の少なくとも10属の細菌の存在量を決定することを含み、少なくとも10属は、Ruminiclostridium、Sarcina、Lachnoclostridium、Asaccharospora、Lachnobacterium、Anaerostipes、Faecalibacterium、Bacteroides、Mogibacterium、Haemophilus、Intestinibacter、Mobiluncus、Lactobacillus、Alistipes、Dorea、Ferrimonas、Romboutsia、Actinobacillus、Anaerofilum、Erwinia、Phascolarctobacterium、Selenomonas、Microbacterium、Ureibacillus、Proteus、Megamonas、Christensenella、Butyricimonas、Arcobacter、Yersinia、Lachnoanaerobaculum、Variovorax、Citrobacter、Paenibacillus、Anaeroplasma、Fictibacillus、Eisenbergiella、Lautropia、及びHowardellaから選択される、方法を提供する。
【0014】
一実施形態において、少なくとも10属の細菌には、Ruminiclostridium、Sarcina、Lachnoclostridium、Asaccharospora、Lachnobacterium、Anaerostipes、Faecalibacterium、Bacteroides、Mogibacterium、及びHaemophilusから選択された少なくとも5属が含まれる。
【0015】
一実施形態において、少なくとも10属の細菌には、Ruminiclostridium、Sarcina、Lachnoclostridium、Asaccharospora、Lachnobacterium、Anaerostipes、Faecalibacterium、Bacteroides、Mogibacterium,及びHaemophilusが含まれる。
【0016】
一実施形態において、少なくとも20属の細菌の存在量を決定する。一実施形態において、少なくとも30属の細菌の存在量を決定する。
【0017】
また、本開示は、被検者におけるディスバイオシスを診断する方法であって、被検者由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、少なくとも5種の細菌は、Corynebacterium minutissimum、Prevotella oulora、Fusobacterium naviforme、Prevotella ruminicola、Bifidobacterium thermacidophilum、Dysgonomonas wimpennyi、Propionibacterium acnes、Corynebacterium tuberculostearicum、Brevibacterium casei、Lachnobacterium bovis、Prevotella dentasini、Prevotella albensis、Veillonella atypica 、Kytococcus schroeteri、Prevotella copri、Bacteroides barnesiae、Prevotella conceptionensis、Anaerofustis stercorihominis、Bifidobacterium thermophilum、Prevotella brevis、Roseburia intestinalis、Clostridium symbiosum、Barnesiella intestinihominis、Bacteroides fragilis、Anaerostipes rhamnosus、Collinsella aerofaciens、Clostridium bolteae、Arthrobacter creatinolyticus、Atopobium fossor、Prevotella paludivivens、及びPelotomaculum isophthalicicumから選択される、方法を提供する。
【0018】
一実施形態において、少なくとも5種は、Corynebacterium minutissimum、Prevotella oulora、Fusobacterium naviforme、Prevotella ruminicola、及びBifidobacterium thermacidophilumから選択される少なくとも2種を含む。
【0019】
一実施形態において、少なくとも5種には、Corynebacterium minutissimum、Prevotella oulora、Fusobacterium naviforme、Prevotella ruminicola、及びBifidobacterium thermacidophilumが含まれる。
【0020】
一実施形態において、少なくとも10種の細菌の存在量を決定する。一実施形態において、少なくとも20種の細菌の存在量を決定する。
【0021】
また、本開示は、被検者におけるディスバイオシスを診断する方法であって、被検者由来の試料中の少なくとも5属の細菌の存在量を決定することを含み、少なくとも5属の細菌は、Corynebacterium、Lachnobacterium、Propionibacterium、Kytococcus、Fusobacterium、Veillonella、Prevotella、Anaerofustis、Arthrobacter、Dysgonomonas、Calothrix、Atopobium、Brevibacterium、Micrococcus、Burkholderia、Veillonella、Pelotomaculum、Acidaminococcus、Mitsuokella、Allisonella、Odoribacter、Bacteroides、Coprobacter、Alistipes、Ruminococcus、Ferrimonas、Alkaliphilus、及びLautropiaから選択される、方法を提供する。
【0022】
一実施形態において、少なくとも5属には、Corynebacterium、Lachnobacterium、Propionibacterium、Kytococcus、及びFusobacteriumから選択される少なくとも2属が含まれる。
【0023】
一実施形態において、少なくとも5属には、Corynebacterium、Lachnobacterium、Propionibacterium、Kytococcus、及びFusobacteriumが含まれる。
【0024】
一実施形態において、少なくとも10属の細菌の存在量を決定する。一実施形態において、少なくとも20属の細菌の存在量を決定する。
【0025】
一実施形態において、ディスバイオシスは、IBSである。
【0026】
また、本開示は、IBSである被検者におけるIBSのサブタイプを決定する方法であって、被検者由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、少なくとも5種の細菌は、Christensenella minuta、Soleaferrea massiliensis、Papillibacter cinnamivorans、Oscillibacter valericigenes、Ruminococcus bromii、Gemmiger formicilis、Desulfitobacterium frappieri、Alistipes obesi、Anaerofilum pentosovorans、Akkermansia muciniphila、Alkaliphilus crotonatoxidans、Eubacterium sulci、Bdellovibrio exovorus、Curtobacterium pusillum、Flavonifractor plautii、Ruminococcus lactaris、Mogibacterium neglectum、Roseburia inulinivorans、Butyricimonas virosa、Intestinimonas butyriciproducens、Butyrivibrio crossotus、Barnesiella intestinihominis、Flavobacterium resistens、Flavobacterium cauense、Clostridium glycyrrhizinilyticum、Anaerostipes hadrus、Prevotella ruminicola、Blautia wexlerae、及びAnaerostipes coliから選択される、方法を提供する。
【0027】
一実施形態において、少なくとも5種の細菌は、Christensenella minuta、Soleaferrea massiliensis、Papillibacter cinnamivorans、Oscillibacter valericigenes、及びRuminococcus bromiiから選択される少なくとも2種を含む。
【0028】
一実施形態において、少なくとも5種の細菌には、Christensenella minuta、Soleaferrea massiliensis、Papillibacter cinnamivorans、Oscillibacter valericigenes、及びRuminococcus bromiiが含まれる。
【0029】
一実施形態において、少なくとも10種の細菌の存在量を決定する。一実施形態において、少なくとも20種の細菌の存在量を決定する。
【0030】
また、本開示は、本明細書に記載の方法により被検者におけるIBSを診断することと、被検者がIBSと診断された場合、その後、本明細書に記載の方法によりIBSのサブタイプを決定することとを含む方法を提供する。
【0031】
また、本開示は、IBS-Mと診断された被検者におけるIBSのサブタイプを決定する方法であって、被検者由来の試料中の少なくとも5種の細菌の存在量を決定することと、少なくとも5種の細菌の存在量に基づいて、被検者を便秘型IBS-M(IBS-MC)又は下痢型IBS-M(IBS-MD)に割り当てることとを含む方法を提供する。
【0032】
一実施形態において、少なくとも5種の細菌は、Peptoniphilus coxii、Clostridium clariflavum、Bacteroides thetaiotaomicron、Bacteroides coprocola、Oscillibacter valericigenes、Clostridium hveragerdense、Ruminiclostridium clariflavum、Bacteroides xylanisolvens、Clostridium chauvoei、Clostridium tepidiprofundi、Papillibacter cinnamivorans、Lactococcus fujiensis、Bacteroides uniformis、Bacillus thuringiensis、Johnsonella ignava、Pseudoflavonifractor capillosus、Christensenella minuta、Enterococcus azikeevi、Intestinimonas butyriciproducens、Eubacterium sulci、Flavobacterium resistens、Anaerotruncus colihominis、Pseudoflavonifractor capillosus、Bacteroides fluxus、Ruminococcus lactaris、Butyrivibrio crossotus、Eubacterium rectale、Prevotella ruminicola、Gemmiger formicilis、Ruminococcus flavefaciens、及びFaecalibacterium prausnitziiから選択される。
【0033】
一実施形態において、少なくとも5種の細菌は、Peptoniphilus coxii、Clostridium clariflavum、Bacteroides thetaiotaomicron、Bacteroides coprocola、及びOscillibacter valericigenesから選択される少なくとも2種を含む。
【0034】
一実施形態において、少なくとも5種の細菌は、Peptoniphilus coxii、Clostridium clariflavum、Bacteroides thetaiotaomicron、Bacteroides coprocola、及びOscillibacter valericigenesを含む。
【0035】
一実施形態において、少なくとも10種の細菌の存在量を決定する。一実施形態において、少なくとも20種の細菌の存在量を決定する。
【0036】
また、本開示は、IBSである被検者における自閉症を診断する方法であって、被検者由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、少なくとも5種の細菌は、Eubacterium hallii、Eubacterium rectale、Lachnobacterium bovis、Lachnoclostridium glycyrrhizinilyticum、Blautia glucerasea、Eubacterium desmolans、Anoxystipes fissicatena、Blautia coccoides、Faecalibacterium prausnitzii、Clostridium symbiosum、Roseburia inulinivorans、Anaerostipes coli、Coprococcus comes、Lachnospira pectinoschiza、Arthrobacter creatinolyticus、Clostridium nexile、Bifidobacterium thermacidophilum、Anaerostipes rhamnosus、Clostridium clariflavum、Blautia wexlerae、Fusicatenibacter saccharivorans、Tolumonas auensis、Ruminococcus gnavus、Peptococcus niger、Dorea formicigenerans、Roseburia intestinalis、Blautia wexlerae、Clostridium populeti、Dorea massiliensis、及びEubacterium eligensから選択される、方法を提供する。
【0037】
一実施形態において、少なくとも5種の細菌は、Eubacterium hallii、Eubacterium rectale、Lachnobacterium bovis、Lachnoclostridium glycyrrhizinilyticum、及びBlautia gluceraseaから選択される少なくとも2種を含む。
【0038】
一実施形態において、少なくとも5種の細菌には、Eubacterium hallii、Eubacterium rectale、Lachnobacterium bovis、Lachnoclostridium glycyrrhizinilyticum、及びBlautia gluceraseaが含まれる。
【0039】
一実施形態において、少なくとも10種の細菌の存在量を決定する。一実施形態において、少なくとも20種の細菌の存在量を決定する。
【0040】
また、本開示は、腸の老化に関連するディスバイオシスを診断する方法であって、被検者由来の試料中の少なくとも5種の細菌の存在量を決定することを含み、少なくとも5種の細菌は、Pseudobutyrivibrio xylanivorans、Dorea massiliensis、Blautia glucerasea、Lachnoclostridium herbivorans、Faecalibacterium prausnitzii、Romboutsia lituseburense、Peptoniphilus methioninivorax、Blautia coccoides、Megamonas funiformis、Eubacterium rectale、Clostridium bifermentans、Roseburia intestinalis、Clostridium populeti、Clostridium hiranonis、Peptoclostridium difficile、Lactonifactor longoviformis、Clostridium caliptrosporum、Asaccharospora irregulare、Clostridium malenominatum、Clostridium symbiosum、Clostridium thermoalcaliphilum、Lachnoclostridium glycyrrhizinilyticum、Ruminococcus faecis、Blautia schinkii、Pseudoflavonifractor capillosus、Clostridium chromoreductans、Clostridium ghonii、Clostridium innocuum、Christensenella minuta、Dorea formicigenerans、及びClostridium tertiumから選択される、方法を提供する。
【0041】
一実施形態において、少なくとも5種の細菌は、Pseudobutyrivibrio xylanivorans、Dorea massiliensis、Blautia glucerasea、Lachnoclostridium herbivorans、及びFaecalibacterium prausnitziiから選択される少なくとも2種を含む。
【0042】
一実施形態において、少なくとも5種の細菌には、Pseudobutyrivibrio xylanivorans、Dorea massiliensis、Blautia glucerasea、Lachnoclostridium herbivorans、及びFaecalibacterium prausnitziiが含まれる。
【0043】
一実施形態において、少なくとも10種の細菌の存在量を決定する。一実施形態において、少なくとも20種の細菌の存在量を決定する。
【0044】
また、本開示は、ディスバイオシスを有する被検者を治療する方法であって、本明細書に記載の方法によりIBSのサブタイプを決定すること、又は本明細書に記載の方法により被検者を診断することと、被検者における1種以上の細菌の存在量を増加及び/又は減少させる組成物を被検者に投与することにより、被検者を治療することと、を含む方法を提供する。
【0045】
一実施形態において、組成物は、栄養補助食品である。一実施形態において、組成物は、腸内有益菌(プロバイオティクス)である。一実施形態において、組成物は、便微生物移植である。
【0046】
また、本開示は、本明細書に記載の治療の有効性をモニタする方法であって、被検者由来の試料中の1種以上の細菌の存在量を測定することを含み、1種以上の細菌の存在量の増加及び/又は減少は、治療の有効性を示す方法を提供する。
【0047】
また、本開示は、ディスバイオシスを有する被検者に適切な治療を決定する方法であって、本明細書に記載の方法によりIBSのサブタイプを決定すること、又は本明細書に記載の方法により被検者を診断することと、IBSのサブタイプの決定又は診断の結果に基づいて、適切な治療を決定することと、を含む方法を提供する。
【0048】
一実施形態において、被検者は、ヒトである。
【0049】
一実施形態において、被検者は、以前に化学療法又は抗生物質投与を受けている。
【0050】
一実施形態において、試料は、糞便試料である。
【0051】
また、本開示は、被検者におけるディスバイオシスを診断する方法を提供し、方法は、
i)被検者由来の試料中の核酸の配列を、細菌16S rRNA配列のデータベースに対してアラインメントすることと、
ii)ステップi)でのアラインメントを用いて、試料に存在する1種以上の細菌の同一性及び相対存在量を決定することと、
iii)試料中の1種以上の細菌の存在量を、健康な個体の参照集団における1種以上の細菌の存在量と比較することと、を含み、
参照集団に対する、試料中の細菌種の存在量の増加又は減少は、ディスバイオシスを示す。
【0052】
一実施形態において、データベースは、本質的に、ヒト胃腸微生物叢由来の16S rRNA配列からなる。
【0053】
一実施形態において、データベースは、DNA配列からなる。一実施形態において、データベースはRNA配列からなる。
【0054】
一実施形態において、参照集団は、被検者と年齢が一致する。
【0055】
一実施形態において、試料中の核酸の配列は、ハイスループット核酸シークエンシングにより得られる。
【0056】
一実施形態において、試料中の少なくとも50種の細菌の同一性及び相対存在量を決定する。一実施形態において、試料中の少なくとも100種の細菌の同一性及び相対存在量を決定する。一実施形態において、試料中の少なくとも200種の細菌の同一性及び相対存在量を決定する。
【0057】
一実施形態において、被検者は、ヒトである。一実施形態において、被検者は、ウマである。
【0058】
一実施形態において、試料は糞便試料である。一実施形態において、試料は被検者の口から得られる。一実施形態において、試料は、被検者の膣から得られる。一実施形態において、試料は、被検者の周囲環境から得られる。
【0059】
一実施形態において、ディスバイオシスは、胃腸管のディスバイオシスである。
【0060】
一実施形態において、ディスバイオシスは、過敏性腸症候群(IBS)に関連する。一実施形態において、ディスバイオシスは、炎症性疾患に関連する。一実施形態において、ディスバイオシスは免疫疾患に関連する。一実施形態において、ディスバイオシスは、代謝障害に関連する。一実施形態において、ディスバイオシスは、自閉症に関連する。一実施形態において、ディスバイオシスは、腸の老化に関連する。一実施形態において、ディスバイオシスは、慢性疲労に関連する。
【0061】
一実施形態において、被検者は、以前に化学療法を受けている。
【0062】
また、本開示は、被検者におけるディスバイオシスを診断する方法を提供し、方法は、
i)被検者由来の試料中の核酸の配列を細菌16S rRNA配列のデータベースに対してアラインメントすることと、
ii)ステップi)のアライメントを用いて、試料に存在する1種以上の細菌の同一性及び相対存在量を決定することにより、試料データセットを得ることと、
iii)試料データセットに機械学習アルゴリズムを適用して、被検者におけるディスバイオシスを診断することと、を含み、
機械学習アルゴリズムは、ディスバイオシスを有する個体を含む参照集団由来の細菌種の同一性及び存在量を含むトレーニングデータセットによりトレーニングを行っている。
【0063】
一実施形態において、機械学習アルゴリズムはベイジアンアルゴリズムである。一実施形態において、機械学習アルゴリズムは、ランダムフォレストアルゴリズムである。
【0064】
一実施形態において、参照集団は、更に健康な個体を含む。
【図面の簡単な説明】
【0065】
図1】バイオインフォマティクスパイプライン。実施例1記載の核酸シークエンシングデータを分析するためのワークフロー。
図2】被検者のディスバイオシスコンパス。全ての一致タイプ:N、S、B、Yの割合を4軸にまとめた(実施例2を参照)。プロットは、被検者の微生物叢が、平均化した対照に割り当てた健康な範囲から離れる方向へ移動したことを表す。データの大部分が「N」分類に含まれることになることから、「N」スケールが最大になると予想されるため、チャート上のスケールが等しくなる必要はない。したがって、Nスケールは0乃至1、他のスケールは0乃至0.3となる。
図3】腸内有益菌により治療した被検者の非IBS分類スコア。各個体に対して、その個体が「非IBS」群に割り当てられる確率に基づいて、全体的な分類スコアを割り当てた。スコアの範囲は、0乃至1である。より高いスコアは、より「非IBS様」の微生物叢に対応する。この図は、連続する腸内有益菌治療の度ごとに、全ての個体で平均「非IBS」スコアが有意且つ漸進的に増加したことを示す。
【発明を実施するための形態】
【0066】
一般的手法及び定義
【0067】
本明細書全体を通して、特に明記しない限り、又は文脈上異なる場合を除き、単一のステップ、組成物、ステップ群、又は組成物群への言及は、1つ及び複数(即ち、1つ以上)のステップ、組成物、ステップ群、又は組成物群を包含するものとする。
【0068】
本明細書に記載の開示が、具体的に記載されていない変形及び修正を容易に受けることを、当業者は理解するであろう。本開示は、そのような全ての変形及び修正を含むことを理解されたい。また、本開示は、本明細書において個別に又は集合的に言及又は示唆した全てのステップ、特徴、組成物、及び化合物と、前記ステップ又は特徴の任意の2つ以上のあらゆる組み合わせを含む。
【0069】
本開示は、例示のみを意図した本明細書に記載の特定の実施形態により範囲が限定されるものではない。機能的に同等の製品、組成物、及び方法は、当然ながら本開示の範囲に含まれる。
【0070】
本明細書に開示した例は、特に明記しない限り、他の例に準用されるものとする。
【0071】
特に定義されていない限り、本明細書で用いる全ての技術用語及び科学用語は、当業者が一般に理解しているのと同じ意味を持つものとする(例えば、分子遺伝学、微生物学、核酸シークエンシング、及び生化学)。
【0072】
「及び/又は」、例えば「X及び/又はY」という用語は、「X及びY」又は「X又はY」の何れかを意味すると理解され、両方の意味又は何れかの意味を明示的に支持するものとする。
【0073】
本明細書での使用において、約という用語は、特に明記しない限り、指定した値の+/-10%、より好ましくは+/-5%を示す。
【0074】
本明細書での使用において、「核酸配列」という語句は、核酸中のヌクレオチドの線形配列を示す。核酸配列は、DNA又はRNA配列の何れかである場合がある。
【0075】
本明細書での使用において、「試料」という用語は、被検者、又は被検者が居住する地域の土壌又は水等の被検者の周囲環境から得られた生物学的材料を採取したものを示す。一部の実施形態において、試料は、被検者から得られる。例えば、試料は、糞便試料である場合がある。一部の実施形態において、試料は、被検者の膣、口、又は他の開口部から得られる。試料は、被検者又は周囲環境から直接採取した形態であってよく、少なくとも部分的に精製し、少なくとも一部の非核酸物質を除去してもよい。精製は、僅かであってよく、例えば、試料の固体又は細胞の濃度をより小さな量にする程度、又は細胞を試料の残りの一部又は全部から分離する程度のものにし得る。一部の実施形態において、核酸は、試料から単離される。このような単離調製物は、試料中の核酸の逆転写産物及び/又はPCR増幅産物を含む。一部の実施形態において、主要な核酸は、DNAである。核酸調製物は、純粋な、又は部分的に精製された、核酸調製物にすることができる。複合試料を含む試料から核酸を単離する手法は、数多くあり、当該技術分野において周知である。適切な手法は、WO98/51693及びWO01/53525に記載されている。
【0076】
本明細書での使用において、「被検者」という用語は、ヒト及び非ヒト動物を含む任意の動物を示す。一部の実施形態において、動物は、哺乳動物である。一部の実施形態において、哺乳動物は、ヒトである。一部の実施形態において、哺乳動物は、ウマ、ウシ、ヒツジ、イヌ、又はネコである。一部の実施形態において、動物は、鳥である。一部の実施形態において、鳥は、ニワトリ、アヒル、又はシチメンチョウである。「被検者」、「患者」又は「個体」等の用語は、本開示において文脈内で相互に交換可能に使用できる用語である。一部の実施形態において、被検者は、大人又は小児又は乳児又は年配である。被検者は、病気又は病的状態を有し得る。例えば、一部の実施形態において、被検者は、癌を有する。
【0077】
本明細書での使用において、「参照集団」という用語は、被検者と比較されるべき個体の集合を示す。一部の実施形態において、参照集団は、健康な個体を含む。一部の実施形態において、参照集団は、診断対象となるディスバイオシスを有する個体を含む。一部の実施形態において、参照集団は、健康な個体と診断対象となるディスバイオシスを有する個体との両方を含む。一部の実施形態において、参照集団は、被検者と年齢が一致している。したがって、これらの実施形態において、被検者は、同様の年齢区分、例えば、乳児、小児、大人、又は年配である個体の集合と比較される。
【0078】
本明細書での使用において、「健康な個体」という用語は、病的状態、疾患、又は症候群を全く有していないヒト又は非ヒトの個体を示す。このような個体は、被検者と比較する参照集団を準備するのに有用となる。
【0079】
本明細書全体を通して、「含む(comprise)」という単語、又は「含む(comprises)」又は「含む(comprising)」等の変形は、記載の要素、整数、若しくはステップ、又は要素群、整数群、若しくはステップ群を含むことを意味するが、他の要素、整数、若しくはステップ、又は要素群、整数群、若しくはステップ群の除外を意味しないことは理解されよう。
【0080】
本開示は、特に明記しない限り、分子生物学、組換えDNA技術、及びバイオインフォマティクスの従来の手法を用いて、過度の実験を行うことなく実施される。このような手順は、例えば、(Sambrook & Green, 2012)、(Glover, 1985)、(Hames & Higgins, 1985)、(Roig, 1985)、(Perbal, 1984)、及び (Colowick & Kaplan, 1963)に記載されている。
【0081】
核酸配列分析、主成分分析、機械学習等のためのバイオインフォマティクスの応用を理解するのに有用な他の参考文献には、(Hinchliffe, 1996)、(Gibas & Jambeck, 2001)、(Pevzner, 2000)、(Durbin et al., 1998)、及び(Rashidi & Buehler, 2000)が含まれる。
【0082】
ディスバイオシス
【0083】
本明細書で使用される場合、「ディスバイオシス」という用語は、被検者の微生物叢における不均衡状態を示す。このような場合、被検者の微生物叢は、正常な健康である個体に特有の微生物叢とは異なるか、又はこうした微生物叢から逸脱している。ディスバイオシスの程度は、ある微生物叢が正常な微生物叢とどれほど異なるかの尺度となる。したがって、ディスバイオシスには、健康な個体の微生物叢に対する、1つ以上の細菌種の存在量の増加及び/又は減少の両方が含まれる。微生物叢の撹乱に関連する疾患及び状態の診断に関連して、ディスバイオシスは、より具体的には、疾患又は状態を有しない、又は疾患又は状態を発生させるリスクがない被検者の微生物叢とは異なる微生物叢として定義することができる。
【0084】
「微生物叢プロファイル」は、試料中の複数の細菌種の相対存在量のプロファイルである。本発明の方法によれば、微生物叢プロファイルは、被検者由来の試料中の核酸の分析から得られた、こうした存在量を、数値的に表現したものである。こうした存在量の個々の値は、定性的、定量的、又は半定量的なものにすることができる。「存在量」、「レベル」、又は「量」等の用語は、本開示において文脈内で相互に交換可能に使用できる用語である。
【0085】
微生物叢プロファイルは、試料において同定された各細菌種の存在量を含むことが可能であり、又は、試料において同定された各細菌属の合計存在量、即ち、各属の全種の存在量の合計を含むことができる。
【0086】
一部の実施形態において、ディスバイオシスは、胃腸管のディスバイオシスである。本明細書での使用において、「胃腸管」という用語は、口から始まり肛門で終わる連続した一連の器官である消化管(digestive tract又はalimentary canal)を示す。胃腸管には、多様な細菌種及び他の微生物種が定着している。胃腸管の全微生物内容物は、胃腸微生物叢と呼ばれる。
【0087】
一部の実施形態において、ディスバイオシスは、特定の状態又は疾患に関連する。ディスバイオシスが多くの様々な疾患及び状態に関連する可能性があることは、当技術分野において公知である。こうした疾患及び状態には、過敏性腸症候群(IBS)、炎症性腸疾患(IBD)、自閉症、セリアック病を含む免疫障害、アレルギ、喘息、代謝障害、炎症性疾患、心血管疾患、及び肥満等、腸及び腸外の障害の両方が含まれる。一部の実施形態において、ディスバイオシスは、IBS又はIBSの特定のサブタイプに関連する。一部の実施形態において、ディスバイオシスは、炎症性疾患に関連する。一部の実施形態において、ディスバイオシスは、免疫疾患に関連する。一部の実施形態において、ディスバイオシスは、代謝障害に関連する。一部の実施形態において、ディスバイオシスは、自閉症に関連する。一部の実施形態において、被検者は、癌を有する。一部の実施形態において、ディスバイオシスは、腸の老化に関連する。
【0088】
本明細書に記載の方法は、迅速、客観的、及び/又は正確に被検者を診断することを可能とし、これにより、被検者のディスバイオシスの程度を継続的にモニタし、ディスバイオシスと診断された被検者に対してパーソナライズした医学的処置を作成する機会を提供することができる。したがって、本発明の方法は、診断、疾患モニタリング、適切な治療計画の決定、被検者の治療、及び治療に対する被検者の反応の測定を包含する患者管理スキームの一部として組み込むことができる。したがって、一部の実施形態において、本発明の方法は、被検者の微生物叢内の1種以上の細菌の相対存在量を増加及び/又は減少させる組成物を投与することにより被検者を治療することを含む。適切な組成物には、限定では無く、栄養補助食品、医薬品、便微生物移植、植物性化学物質、発酵食品又は発酵飲料、植物又は植物抽出物、無脊椎生物、プレバイオティクス、及び腸内有益菌が含まれる。投与すべき組成物は、本発明の方法を利用することで確認される、ディスバイオシスを引き起こしている存在量を有する細菌の種に基づいて選択することができる。
【0089】
一部の実施形態において、被検者は、以前に疾患の治療を受けている。例えば、治療は、化学療法である場合がある。したがって、一部の実施形態において、本発明の方法は、治療の結果として生じ得る被検者の微生物叢の変化をモニタするのに有用である。
【0090】
一部の実施形態において、本明細書に記載の方法は、ディスバイオシス又は関連する状態を治療するために栄養補助食品を投与することを含む。本明細書での使用において、「栄養補助食品」という用語は、精製された形態、即ち、液体又はカプセルの形で投与すること又は食品に組み込むことが可能な、医薬品グレードのダイエタリーサプリメント又は食品添加物を示す。一部の実施形態において、栄養補助食品は、植物性化学物質を含む。
【0091】
一部の実施形態において、本明細書に記載の方法は、便微生物移植を施すことを含む。当該技術分野において公知であるように、便微生物移植は、健康な個体由来の糞便細菌を被検者に移植するプロセスである。健康な個体から得られた糞便細菌は、便の注入を介して、例えば浣腸、経口胃管により、又は凍結乾燥物を含むカプセルの形で口から、被検者に導入することができる
【0092】
過敏性腸症候群(IBS)
【0093】
一部の実施形態において、ディスバイオシスは、過敏性腸症候群(IBS)である。IBSは、被検者の腸の機能に影響を与える状態である。IBSは、腹痛及び便通パターンの変化を含む症状群として現れ、多くの場合、根底となる腸の損傷を示す証拠は存在しない。これまでIBSは、下痢が一般的であるか、便秘が一般的であるか、両方が一般的であるか、又は何れも頻繁に発生しないかにより、「ローマIV」基準に従って4つの主要なサブタイプに分類されており、これらのサブタイプは、それぞれIBS-D、IBS-C、IBS-M、又はIBS-Uである。この点において、Rome IV IBSサブタイプは、被検者が非常に軟らかい又は非常に硬い便を経験する頻度に基づく。従来、被検者は、糞便試料の外観に基づいて、及び/又はアンケートの記入により、これらのサブタイプの1つに割り当てられる。
【0094】
症状の種類、量、強度、及び重症度は、被検者ごとに異なる。更に、IBSサブタイプは、被検者の排便習慣の経時的な変化に応じて、再分類される場合がある。したがって、従来の方法を使用して、被検者のIBSのサブタイプを正確に決定することは困難である。本開示は、部分的には、被検者のミクロバイオーム内の特定の細菌の存在量の評価に基づく被検者におけるIBSのサブタイプを、診断及び/又は決定する方法に関する。更に、本発明者らは、驚くべきことに、被検者の微生物叢内の少なくとも5種の細菌の存在量を測定することにより、IBS-Mと診断された被検者を、本明細書で「IBS-MC」と呼ぶ便秘型IBS-M、又は本明細書で「IBS-MD」と呼ぶ下痢型IBS-Mに、更に割り当てることができることを見出した。このような方法により、IBSである被検者のために、より的を絞った及び/又はパーソナライズされた医療プロトコルの確立、例えば適切な腸内有益菌の特定が可能となる。
【0095】
試料中の細菌の同一性及び存在量を決定する方法
【0096】
微生物叢プロファイルは、試料中の細菌種の同一性及び存在量を測定及び/又は定量化し得る簡便な手段により得ることができる。細菌種の存在量は、任意の適切な方法により測定することができる。適切な方法には、限定では無く、核酸分析(核酸シークエンシング、オリゴヌクレオチドプローブハイブリダイゼーション、及びプライマに基づく核酸増幅手法を含む)、抗体結合又は他の特異的親和性リガンドに基づく手法、プロテオミクス及びメタボロミクス手法が含まれる。一部の実施形態において、細菌種の存在量は、核酸シークエンシングデータを分析することにより測定される。
【0097】
サンガージデオキシヌクレオチド配列決定法は、核酸の配列を決定するための手法であり、当該技術分野において周知である。最近では、「次世代」又は「第2世代」配列決定とも呼ばれる「ハイスループットシークエンシング」アプローチが開発されている。これらの最近の手法は、並列(例えば「超並列」)シークエンシング反応、又は試料内の複数の核酸の配列を得る時間のかからないステップを利用することから、高いスループットを特徴とする。様々なハイスループットシークエンシング方法において、単一分子の配列決定が提供され、パイロシークエンシング、リバーシブルダイターミネータシークエンシング、ライゲーションによる切断可能プローブシークエンシング、ライゲーションによる切断不可プローブシークエンシング、DNAナノボール、リアルタイム単分子シークエンシング等の手法が採用されている。
【0098】
一部の実施形態において、試料中の核酸の配列は、ハイスループットシークエンシングにより得られる。例えば、核酸の配列は、リバーシブルダイターミネータを利用するイルミナTMシークエンシングにより得ることができる。ハイスループットシークエンシングを実施するのに適した機器は、当該技術分野において公知であり、限定では無く、MiSeqTM機器(IlluminaTM)を含む。
【0099】
試料中の細菌の種の同一性及び存在量を決定するために、シークエンシングリードと既知の細菌の配列との間で配列アラインメントを行うことができる。アラインメントは、RNA又はDNA配列間で実行することができる。核酸配列をアライメントする方法は、当業者に周知であろう。このような比較用の配列アラインメントアルゴリズムを実施する様々なプログラムは、当該技術分野で公知であり、自由に利用可能である。これらのプログラムの幾つかは、Needleman-Wunsch又はSmith-Watermanアルゴリズムを利用している。これらのアルゴリズムは、以下のプログラムにより実施される:PileUp(Feng & Doolittle, 1987、Higgins & Sharp, 1989)、GCGソフトウェアスイート(Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA53711, 1991)の一部としてのGap及びBestFit(Needleman & Wunsch, 1970)、及びEmboss WINの「water」(バージョン2.10.0)。核酸配列の入力及びアラインメント又は他の操作に適した他のソフトウェアは、例えばBLASTN(NCIMB、https://blast.ncbi.nlm.nih.gov)等、自由に利用可能であり、又はVisualbasic、Fortran、Basic、Java、R、Python、C++等の標準プログラミング言語を用いて、当業者がオープンソースコードから容易に構築することができる。
【0100】
試料由来のクエリ配列と既知の細菌配列との間のアラインメントの成功(所定の閾値を超える配列同一性をもたらすアラインメント)は、その細菌が試料中に存在することを示す。したがって、配列アライメントを用いて、試料中の細菌種の同一性を決定することができる。一部の実施形態において、試料中の核酸の配列は、既知の細菌16S rRNA配列に対してアラインメントする。試料由来の核酸の配列は、16S rRNA配列に対して、又は16S rRNAをコードするDNA配列に対して、直接アラインメントすることができる。16S rRNAは、リボソーム動員中にmRNA標的のシャイン・ダルガルノ配列に結合する原核生物リボソーム小サブユニットのRNA成分である。16S rRNAをコードする遺伝子は、この遺伝子領域の進化速度が遅いことから、系統発生の再構築に使用される。
【0101】
したがって、16S rRNA配列は、どの細菌種が試料に存在するかを特定するのに有用となる。数千を超える微生物ゲノムが配列決定されており、16S rRNAの配列は、一般に公開されている(http://genomesonline.org又はhttp://www.ncbi.nlm.nih.govを参照)。Human Microbiome Project(http://nihroadmap.nih.gov/hmp/を参照)等、生態系に存在する全ての微生物DNAの配列決定を目的とした幾つかの公的事業が行われている。
【0102】
一部の実施形態において、試料において同定された細菌種のそれぞれの存在量は、核酸シークエンシング中に観察された特定の配列のシークエンシングリード数から計算される。特定の核酸配列について、観察されたシークエンシングリード数は、配列決定機器がその配列を検出した回数に対応する。したがって、シークエンシングリード数は、試料中に核酸配列が出現する回数と相関することから、核酸が由来する細菌種の存在量と相関する。
【0103】
一部の実施形態において、試料中の細菌種の存在量は、マイクロアレイ等、オリゴヌクレオチドハイブリダイゼーションプローブに基づくアプローチを用いて得ることができる。このようなアプローチにおいて、標的ヌクレオチド配列の存在及び量は、核酸プローブとその標的配列との間の特定のハイブリダイゼーション事象を検出することにより測定する。
【0104】
適切なハイブリダイゼーション条件は、(Sambrook & Green, 2012)、(Berger & Kimmel, 1987)、(Young & Davis, 1983)、及び(Thijssen, 1993)に記載されている。核酸プローブは、より広いアレイ、例えば、固定化核酸マイクロアレイの一部として提供することができる。適切な方法は、WO2012080754及びWO2011043654に記載されている。
【0105】
一部の実施形態において、その相対存在量を決定するべき細菌種は、事前に選択される。例えば、特定の細菌の相対存在量は、ディスバイオシスに関連する疾患を示唆する及び/又は引き起こす可能性がある。したがって、一部の実施形態では、試料において同定された各細菌種の存在量は、定量的な核酸に基づく増幅反応を用いて計算することができる。これらには、ポリメラーゼ連鎖反応(PCR)及びリガーゼ連鎖反応(LCR)と、逆転写PCR等、それらを修正したものとが含まれる。(McPherson & Moller, 2006)及び(Wiedman et al., 1994)を参照されたい。
【0106】
細菌16S rRNA配列のデータベース
【0107】
一部の実施形態では、試料中の核酸配列を細菌の16SrRNA配列のデータベースに対してアラインメントする。データベースは、RNA配列又はRNAをコードするDNA配列を含むことができる。更に、データベースは、複数の異なる細菌種からの既知の16rRNA配列を含むことができる。このような実施形態において、試料中のユニーク核酸配列をデータベース内の核酸配列にアラインメントし、最良の一致配列を決定することにより、試料中の核酸が由来する細菌種の同一性を決定する。
【0108】
100万を超える既知の細菌16S rRNA配列を含む適切な一般公開データベースには、限定では無く、SILVA(http://www.arb-silva.de、Pruesse et al., 2007)、RDP(http://rdp.cmu.mse.edu、Cole et al., 2008)、及びGreenGene (http://greengenes.lbl.gov)が含まれる。
【0109】
データベース内の参照配列の集合は、試料内の細菌核酸配列を確実に識別する上で重要となる。上述したデータベースは、広範な生態学的ソースからの微生物生態系の包括的なタクソノミックプロファイリングに向けたものである。このような広範な細菌配列は、ヒト胃腸微生物叢での細菌種の同定を必要とする実施形態において、適切ではない場合がある。これは、ヒト胃腸管に生息しない種に由来する類似の配列が過剰に表現され、最も近い配列の一致を選択するための計算アルゴリズムにとって問題となり得るためである。こうした誤分類の問題に対応する解決策の1つは、ヒト胃腸管で見られる細菌種由来の核酸配列のみを含む専用データベースを用いることである。したがって、一部の実施形態において、細菌16S rRNA配列のデータベースは、本質的に、ヒト胃腸微生物叢由来の核酸配列により構成される。適切なデータベースには、限定では無く、一般に公開されているHITdbデータベース(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4676846)が含まれる。このデータベースは、約2,473の一意の原核生物様のグループと、ヒト腸内微生物叢由来のタクソノミック系統とを専門に集めたものである。
【0110】
ワードプロセッシングソフトウェア(例えば、Microsoft WordTM又はCorel WordPerfectTM)及びデータベースソフトウェア(例えば、Microsoft ExcelTM、Corel QuattroProTM等のスプレッドシートソフトウェア、Microsoft AccessTM又はSequelTM、OracleTM、ParadoxTM等のデータベースプログラム)といった標準デスクトップアプリケーションは、適切なデータベースを編集、整理、又は構築するために、本開示に適合させることができる。例えば、システムには、文字列を操作するために、例えばユーザインターフェイス(例えば、Windows、Macintosh、又はLINUXシステム等の標準オペレーティングシステムのGUI)と連動して使用される、適切な文字列情報を有するソフトウェアを含めることができる。
【0111】
上述したように、システムには、適切なデータベースを備えたコンピュータを含めることができる。核酸配列を操作及びアラインメントするためのソフトウェア、及び本明細書に記載の任意の核酸配列を含むソフトウェアシステムに入力されるデータセットは、本開示の特徴となる場合がある。
【0112】
コンピュータは、例えば、PC(Intelx86又はPentiumチップ互換DOSTM、OS2TM、WINDOWSTM、WINDOWS NTTM、WINDOWS95TM、WINDOWS98TM、WINDOWS2000、WINDOWS ME、又はLINUXに基づくマシン)、MACINTOSHTM、PowerPC、又はUNIXに基づくマシン(例えば、SUNTM ワークステーション又はLINUXに基づくマシン)、又は当業者に公知の他の市販のコンピュータにすることができる。
【0113】
機械学習アルゴリズム
【0114】
一部の実施形態では、ディスバイオシスを診断するために、コンピュータで実施される機械学習アルゴリズムを利用する。このようなアルゴリズムは、ディスバイオシス又は関連疾患を有する被検者(疾患状態が不明)の全体的尤度を決定するために、参照集団(疾患状態が既知)からのトレーニングデータセットで観察される微生物叢とディスバイオシス(又は関連疾患)との関係を用いる。機械学習アルゴリズムは、当該技術分野において周知であり、(Rasmussen and & Williams, 2005)及び(Barber, 2012)に詳細に記載されている。機械学習アルゴリズムには、教師あり機械学習(例えば、ナイーブベイズ分類器、ランダムフォレスト等の決定木、最近傍、サポートベクタマシン、ニューラルネットワーク等)及び教師なし機械学習(例えばクラスタリング、主成分分析等)が含まれる。
【0115】
一部の実施形態において、機械学習アルゴリズムは、ナイーブベイズ分類器等のベイジアンアルゴリズムであり、これは(Barber, 2012)に記載されている。自由に利用できる適切なベイジアンアルゴリズムは、当業者に公知であり、R package ‘e1071’ version 1.6-7 “Misc Functions of the Department of Statistics, Probability Theory Group (Formerly: E1071) TU Wien、python package “NaiveBayes”(https://pypi.python.org/pypi/NaiveBayes)、又はC++プログラム“Naive Bayes Classifier”(http://www.openpr.org.cn/index.php/NLP-Toolkit-for-Natural-Language-Processing/43-Naive-Bayes-Classfier/View-details.html)を含む。
【0116】
一部の実施形態において、機械学習アルゴリズムは、ランダムフォレストアルゴリズムであり、(Ho, 1995)及び(Caruana & Niculescu-Mizil, 2006)に記載されている。自由に利用できる適切なランダムフォレストアルゴリズムは、当業者に公知であり、“The Original RF”(http://www.stat.berkeley.edu/~breiman/RandomForests/cc_software.htm)、ALGLIB(http://www.alglib.net/dataanalysis/decisionforest.php)、及びR package “randomForest”(https://cran.r-project.org/web/packages/randomForest/index.html)を含む。
【0117】
一部の実施形態では、被検者がディスバイオシスを有する尤度を決定するために、limmaを使用して、核酸シークエンシングデータを分析する。また、limmaを使用して、存在量が被検者のディスバイオシスの有無を最も示唆する細菌種を決定することもできる。limmaは、核酸シークエンシングデータを分析するための複数の統計アルゴリズムを含むR/Bioconductorソフトウェアパッケージである。limmaソフトウェアは、(Rithie et al., 2015)に記載されており、Bioconductorプロジェクト(http://www.bioconductor.org)の一部として自由に利用することができる。
【実施例
【0118】
実施例1 バイオインフォマティクスパイプライン
【0119】
「バイオインフォマティクスパイプライン」は、MiSeq(Illumina)ハイスループットシークエンシング機器により生成されたFASTQファイル形式の生核酸シークエンシングデータに連続的に適用された計算タスクのセットである。
【0120】
一貫性を保つために、一組の情報科学的手順をパイプラインに実装しており、結果の再現性と妥当性が改善されている。オープンソースプログラムとデータベースをパイプラインにおいて使用した。バイオインフォマティクスパイプラインの概要を図1に示す。
【0121】
生FASTQファイルの一次品質管理分析
【0122】
MiSeq機器において分析した個々の試料の生配列は、FASTQ形式(fastq.gz)とした。各試料の配列は、2つの圧縮FASTQファイルで供給され、1つはフォワードストランドリード用、他方はリバースストランドリード用とした。
【0123】
ダウンロードしたFASTQファイルは、MD5 sumsアルゴリズムに基づくExactFileプログラムを用いて整合性を確認した(図1、ボックスA)。各個体試料の2つのFASTQファイルは、それぞれFASTQCプログラムにより処理した。Perlスクリプトを用いて、このプログラムを処理バルクモードで実行し、各ファイルの簡単なレポートを生成した(図1、ボックスB)。次の重要なチェックポイントが報告された。
・生リード数。この数は、試料毎に30,000を超えることが予想された。
・第1のリードの品質。これは、分析した配列の280塩基以降に開始するQuality Value(QV)ビンフラグを渡すか、又は有する必要がある。これは、phredクオリティの中央値又は配列決定品質が、最初の280塩基の前に20未満に低下しなかったことを意味する。
・第1のリードの品質。これは、分析した配列の250塩基以降に開始するQVビンフラグを渡すか、又は有する必要がある。これは、phredクオリティの中央値又配列決定品質が、最初の250塩基の前に20未満に低下しなかったことを意味する。
・ライブラリGC含有量は、50乃至60%の範囲となるべきである。
【0124】
上記品質管理基準からの何らかの逸脱は、パイプラインのパフォーマンスに悪影響を及ぼした。上記基準を満たさなかった試料は、細菌分類プロファイルに対する外れ値として識別した。
【0125】
QIIMEワークフローを使用したコア16S分析
【0126】
QIIMETMは、Quantitative Insights Into Microbial Ecology(微生物生態に対する定量的洞察)の略である。QIIMEは、生DNA配列データの微生物叢分析に用いたオープンソースのバイオインフォマティクススイートである(http://qiime.org/)。様々なQIIMEステップによる複数の試料の自動処理に対応するため、主に以下のステップでPerlスクリプトを開発した。
【0127】
ペアリードの結合
【0128】
ペアリードのステッチングは、FLASHプログラム(Fast Length Adjustment of SHort reads)を用いて行った。このステップは、図1のボックスCに示している。FLASHは、次世代シークエンシング実験からのペアエンドリードをマージするための専用ソフトウェアツールである(https://ccb.jhu.edu/software/FLASH/)。FLASHプログラムにより、2つのFASTQファイルを分析し、配列の重複部分においてマージした塩基の品質を割り当てた単一のマージFASTQファイルを生成した。マージしていないリードは、別のファイルに保存した。未結合配列からのステッチ済みリード及びフォワードリードは、共にプールし、新しい単一のFASTQファイルとした。未結合配列の第2のリードは、この時点でパイプラインにおいて破棄した。次のFLASH設定を、デフォルト設定から変更した。
・max-overlap:150
・max-mismatch-density:0.33
【0129】
選択した設定の効率は、経験的に確立されたものであり、市販のバイオインフォマティクス分析ソフトウェアBaseSpace(Illumina)に最も近いことが明らかとなった。
【0130】
クオリティトリミング
【0131】
split_libraries.pyコマンドを使用して、追加の品質管理フィルタを適用した。このステップは、図1のボックスDに示している。
【0132】
次の品質管理パラメータを用いた。
・リードは、長さが150bp未満の場合に除去し、
・残りの設定は、デフォルトの閾値のままとした。
【0133】
このプログラムは、FASTQファイルを、拡張子.fnaを有するプレーンクオリティトリミングFASTAファイルに変換した。
【0134】
オープンタクソノミックユニット(OTU)クラスタリング
【0135】
クオリティトリミングを施し、連結した配列に対して、ペアワイズアラインメント及びクラスタリングを行った。これは、2配列間で共通するk-merを記録する配列の標的セットに対して特定の配列をクエリするプロセスである。クエリと、配列類似性を決定する標的配列との間の一致するk-merの数として配列の類似性を推測するのではなく、USEARCHは、2配列間で共有される一意のk-merの数に対して、標的配列を降順で並べる。クエリした配列は、クラスタ化した。各クラスタ又はセントロイドは、設定された同一性閾値レベル未満の類似性レベルを他のセントロイドと共有する。残りのクエリ配列は、その後、上述したUSEARCHアルゴリズムを用いて、同一性閾値に基づいてセントロイド(標的配列)に割り当てた。クエリ配列が閾値を超えるセントロイドとの類似性を共有しなかった場合は、新しいクラスタを作成した。デフォルトのUCLUSTアルゴリズムによりpick_otus.pyコマンドを用いて、ピッキングを行った(図1、ボックスE)。配列類似性の閾値は、85%とした。
【0136】
代表配列のピッキング
【0137】
各クラスタを表す最良配列を選択し、更にタクソノミマッチングを行った(図1、ボックスF)。クラスタ内の最良配列を代表配列又はシード配列とした。これは、85%の定義済み閾値を有するクラスタ内の残りの配列との類似性を有する非冗長配列である。これは、最も長い配列を表す。
【0138】
16S rRNA配列のデータベースへのタクソノミの割り当て
【0139】
各代表配列を検索し、細菌16S rRNA配列のデータベースに対してアラインメントし、最良の一致となるタクソノミをクラスタに割り当てた(図1、ボックスG)。一般に、各試料において約500種が同定された。上述したUCLUSTアルゴリズムでは、USEARCHの方法を使用した。
【0140】
このQIIMEにおけるプロセスでは、FASTA配列ファイルを入力として受領して各試料の微生物叢プロファイルを作成した。微生物叢プロファイルは、試料に存在する細菌の同一性及び存在量を含み、Biome形式のファイル(http://biom-format.org/)の形となる。各細菌種の相対存在量は、シークエンシングリード数に基づいて推定される。Biomeファイルは、観測分割表により生体試料を表すための汎用形式となるように設計されている。BIOMは、Earth Microbiome Projectの標準として認められており、Genomics Standards Consortiumがサポートするプロジェクトである。
【0141】
タクソノミテーブルの変換
【0142】
Biomeファイルは、その後、QIIMEコマンド「biom convert」を使用してプレーンテキストファイルに変換した。このテキストファイルは、エンドユーザ向けにグラフによる要約及びレポートを作成するために使用した。自動レポートを実行するために、オープンソースPDFライブラリ及びCRAN Rプロジェクトプログラムに基づいて、Perlスクリプトを開発した。Biome変換ステップにおいて、追加のノイズ除去ステップをテキストファイルに追加することができた。これはオプションの手順とした。デフォルトの設定として、割り当てられたリード数が10未満である全ての低存在量OTUは、未分類の門のビンに移動した。このステップは、図1のボックスHに示している。
【0143】
対照集団に関するベータ多様性
【0144】
2つの試料の細菌組成をベータ多様性統計(指標)と比較した。最も一般的な指標の1つは、Bray-Curtis非類似度である。この統計を使用して、2つの異なる部位間の組成の相違を各部位の計数に基づいて定量化した。0と1との間に限定されるため、2個体間での微生物叢の非類似性の簡便な尺度となる。0は、2個体の組成が同じであること(即ち、全種を共有すること)を意味し、1は、2個体が種を全く共有しないことを意味する。Bray-Curtis指数が中間(例えば、BC=0.5)である部位では、相対的な種の存在量も考慮に入れることから、この指標は、他の一般的に使用される指標とは異なる。試料を参照集団とペア毎に比較するために、Bray-Curtis指数をRにおいて距離に変換し、Veganライブラリに実装された「wcmdscale」、即ちWeighted Classical(Metric) Multidimensional Scaling法によりプロットした。このプロットの考え方は、参照集団に関して、特定の1試料がどれだけ近いかをモニタすることである(図1、ボックスI)。
【0145】
図付きのPDFレポート
【0146】
細菌の様々な重要な種及び属の存在量は、Perlスクリプトにより要約した。種プロファイルを含む出力テキストファイルを、Perlレポータスクリプトのソースとした。選択された分類群の割合を、参照集団に関して分析した。棒グラフ及び他のグラフィックは、自動スクリプトによりRにおいて作成した。作成した図及び表は、その後、PDF::API2ライブラリに基づくPerlスクリプトにより、PDFレポートに変換した(図1、ボックスJ)。
【0147】
Kronaチャート
【0148】
オープンソースのKronaツールを使用して、Kronaチャートを生成した(Ondov et al., 2011)。Krona視覚化ツールにより、メタゲノム分類の複雑な階層において、相対存在量及び信頼性を直感的に調査することが可能となった。Kronaチャートは、放射状の空間充填表示を変化させたものを、パラメトリックカラーリング及びインタラクティブな極座標ズーミングに組み合わせ、被検者の微生物叢のディスバイオシスを視覚化している(図1、ボックスK)。
【0149】
年齢による集団の構造化
【0150】
一部の集団サブグループ内の個体間で、腸内微生物叢プロファイルの有意差が確認された。年齢、性別、収集とDNA抽出との間の時間、生成された配列のバッチ数等、多数の統計を、微生物叢プロファイルと試料メタデータとの相関関係について試験した。プロファイルの最も大きな差は、年齢層によるものとなった。
【0151】
試験集団に対して適切なプロファイル比較を行うために、参照集団を次のサブグループに分割した。
・乳児:3歳まで、
・小児:3歳乃至12歳、
・大人:12乃至60歳、
・年配:60歳以上。
【0152】
これらの群の細菌プロファイルを、分類群の分布について個別に評価した。新たな試料は、適切な年齢群から人口範囲に従って試験した。
【0153】
実施例2 健康な個体に対する、被検者のディスバイオシスの診断
【0154】
試料
【0155】
DNA genotek OMNIgene・GUT(OMR-200)採取デバイスを用いて糞便試料を採取し、定量的腸内微生物叢プロファイル分析のためにDNAを安定化させた。実験室での受領後、各糞便試料は、-20℃で3ヶ月を超えずに凍結した。各試料につき、豆粒大の試料を取り出し、糞便物質をPathogen Lysisチューブ(CatNo.ID:19091 Qiagen)にアリコートすることで、抽出プロセスの準備を行った。各試料を13,000rpmで5分間遠心分離し、上清を廃棄した。一貫性を保つために、必要に応じて更に多くの固形糞便材料を使用して、Pathogen Lysisチューブの略半分を満たした。糞便試料を含むPathogen Lysisチューブは、更に処理するまで-20℃の冷凍庫で保管した。試料は、48個の試料のバッチロットにおいて処理した。QIAamp PowerFecal DNA キット(CatNo.ID:12830-50 Qiagen)を使用して、糞便試料からDNAを抽出した。各試料の生物多様性を確実に分析するため、この方法では、グラム陽性菌の細胞壁を確実溶解させる3つのステップとして、ビードビーティング(Tissue Lyser Qiagen)、95°Cでの加熱、及びプロテイナーゼK(Cat.No.19133 Qiagen)を使用した。次に、得られた溶解物を標準手順によりQIAcube(Qiagen)上で処理した。抽出したDNAを-20℃で凍結した後、MiSeqシステム(Illumina)によるハイスループットシークエンシングと、実施例1に記載のパイプラインによる分析とを行った。
【0156】
健康な個体の参照集団
【0157】
ディスバイオシスの尺度を得るために、参照集団が必要となった。そのため、健康な個体の対照群からの試料を、実施例1に記載のパイプラインによりプロファイルした。各細菌の存在量を試験し対照全体でまとめた。これにより、表1に示す存在量の概要が作成された。
【0158】
【表1】
【0159】
被検者の試料との比較
【0160】
次に、被検者の試料を参照集団プロファイルと比較した。試料が四分位間である場合、即ちQ3及びQ1の量の間である場合、参照集団データの大部分(50%)に含まれるため、「N」(標準)と分類した。試料が「Q3」と「Max」との間の範囲にあった場合は、「Y」、収量豊富と分類した。存在量が「Min」と「Q1」との間の種を有する試料は、「B」、基本的枯渇として分類した。存在量が対照の範囲外である種は、「S」、特別として分類した。これにより、試料プロファイル表が作成された(表2)。
【0161】
【表2】
【0162】
このプロファイルを、「ディスバイオシスコンパス」として、全ての一致タイプ:N、S、B、Yの割合を4軸にまとめたレーダーチャート上にプロットした(図2)。図2のプロットは、被検者試料の細菌バランスが、平均化した対照に割り当てた健康な緑の範囲から離れていることを表しており、したがってディスバイオシスを示している。対照は、上述した健康な個体の参照集団に由来する。この「S」へのシフトは、標準範囲外(Min及びMaxの外側)の存在量を有する細菌の量が3倍増加したことを示した。MaxとQ3との間に含まれる種に関連する「Y」方向への顕著な増加も存在した。低存在量の種では、「Min」と「Q1」との間の青の範囲の細菌に関連する「B」方向の数に変化はなかった。
【0163】
腸内微生物叢の関連性
【0164】
多数の病的状態が、被検者の微生物叢内の特定の細菌の枯渇又は相対存在量の増加との関連性を有することが確認された。こうした関連性を以下の表3にまとめている。
【0165】
【表3】
【0166】
腸内微生物叢の関連表により、特定の病的状態の診断を、その状態に関連することが知られている細菌のディスバイオシスに基づいて行うことが可能となった。
【0167】
実施例3 IBSサブタイプの予測
【0168】
ランダムフォレスト及びナイーブベイズアルゴリズム等の機械学習アルゴリズム及び教師あり分類を用いた予測モデリングを使用して、IBSサブタイプ:IBS-D(下痢)、IBS-C(便秘)、及びIBS-M(混合)を予測した。Rome IV基準を用いて臨床医により3つのサブタイプに分類された個体由来の微生物叢プロファイルを使用して、トレーニングデータセットを作成した。
・IBS-D(下痢)、n=78
・IBS-M(混合)、n=22
・IBS-C(便秘)、n=78
【0169】
予測アルゴリズムの目的は、IBSのサブタイプが不明である個体のサブタイプを予測するために使用可能な、IBSサブタイプが既知である個体群全体の微生物叢プロファイルにおける再現可能な違いを検出することとした。このケースでは、他のアルゴリズムと比較した際のパフォーマンスの向上が実証されることから、単純ベイズ分類器を使用した。ベイズ分類器は、スパムフィルタリング手順、自動医療診断、テキスト分類問題等、様々な分野での使用が知られている。R package ‘e1071’ version 1.6-7 “Misc Functions of the Department of Statistics, Probability Theory Group (Formerly: E1071),TU Wienにおいて実装されたプログラムを使用した。
【0170】
トレーニングデータセットは、実施例1に記載の方法を用いて、IBSサブタイプが既知である個体の糞便試料から得た微生物叢プロファイルを使用して作成した。トレーニングデータには、各個体の配列決定品質管理に合格したDNA配列の完全なセット(フィルタリングされていないセット)を含めた。各個体の微生物叢プロファイルは、タクソノミ分類の種のレベルで組み合わせた。これにより、既知のIBSサブタイプを有する個体から得られた178の糞便試料における1,756の同定種のマトリクスが生成された(IBS-D n=78、IBS-M n=22、IBS-D n=78)。このマトリクスは、機能別にナイーブベイズモデルをトレーニングするために使用されました。次に、トレーニングしたモデルをトレーニングデータ自体に適用し直し、その結果、89%(158/178)の試料が正しいサブタイプに割り当てられた。
【表A】
【0171】
上のプロットの縦列は、元の群である。横列は予測されるサブタイプである。黄色で強調表示された試料は、正しいサブタイプに割り当てられたものである。
【0172】
希薄化したデータを使用して、モデルのパフォーマンスを模擬試料セットで試験した。このため、元の未フィルタリング配列データセットを、32,000のランダムリードに低減した。リード数は、特定の試料毎に生じた配列の元の量に関係なく取得した。一部の試料では、シークエンシングデータの約15%未満となった。希薄化データセットが有する同定種の数(1,649)は、フルデータセット(1,756)と比較して少なかった。一部の希少種は、極僅かな配列リードにより表される場合があるため、選択されない可能性があることから、これは予期していた。この新しい希薄化データセットをトレーニング済みのモデルに適用し直すことで、試料の85%(151/178)でIBSサブタイプが正しく予測された。
【表B】
【0173】
また、626の対照試料(非IBS個体)の追加群を有するデータセットによりモデルをトレーニングした。この場合、希薄化データの98%がモデルにより正しい群に正確に割り当てられた。
【表C】
【0174】
これらの結果により、最大98%の精度でIBSタイプを予測する16S微生物叢プロファイルの適用性が実証された。また、IBSサブタイプ及び他の細菌のディスバイオシスのバイオマーカとして一般に使用可能な細菌のシグネチャがヒトの微生物叢に存在することを示している。
【0175】
実施例4 IBS診断及びサブタイム判定のための細菌バイオマーカ
【0176】
IBSサブタイプと健康な個体とにおいて存在量が最も異なる細菌種のリストを、IBSの診断及びサブタイプ判定に使用可能なものとして作成した。このリストは、実施例2に記載の個体群由来の微生物叢プロファイル:IBS-C、IBS-D、IBS-M、及び健康な対照を使用して作成した。経験的ベイズ法による一般化線形モデリングを用いて、試料数が少ない場合に安定した結果が得られるようにした。結果は、スチューデントのt検定及び2標本コルモゴロフ-スミルノフ検定を含む他の統計的方法により更に試験及び確認した。
【0177】
以下の表4及び5は、IBS群と健康な対照との間で存在量の差が最も大きい細菌上位100を示している。
【0178】
【表4-1】
【表4-2】
【0179】
【表5-1】
【表5-2】
【0180】
表4及び5に示した100種のリストのうち、13の細菌は、IBSサブタイプ予測にとって存在量の情報価値が最も高かった。
【表D】
【0181】
場合により、IBS分類モデルは、個別の種ではなく属レベルの全存在量、又は門、属、及び種レベルからの統合データを測定することにより改良した。ランダムフォレストアルゴリズムを使用した予測モデルは、実施例1に記載の方法を用いて取得した、IBS-C、IBS-D、IBS-M、及び健康な個体からの365属の存在量によりトレーニングした。このモデルを、実施例3に記載の試料当たり31,000リードの希薄化データセットに対して試験した。
【表E】
【0182】
属レベルの分類の結果、略97%の予測精度が得られ、IBSサブタイプを診断及び予測するバイオマーカとして試料中の特定の属の存在量を使用できることが示唆された。上述した実験において試験された365属のうち、以下の表6に示す30属は、IBSサブタイプを予測する上で情報価値が最も高かった。
【0183】
【表6】
【0184】
実施例5 自閉症の診断
【0185】
自閉症でない118人と自閉症である48人から糞便試料を取得した。試料は、実施例2に記載されているように処理し、MiSeq(Illumina)機器を使用してDNAの配列を決定し、結果データを実施例1に記載のパイプラインを用いて分析した。次に、ランダムフォレストモデルは、非自閉症及び自閉症の個人から得られた微生物叢プロファイル(種及び属レベル両方の存在量)でトレーニングした。モデルにより、デフォルト設定及び種レベルの存在量を使用して、非自閉症群に誤分類された自閉症の2人を除くほぼ全ての個人で自閉症が正しく予測され、誤り率は0.6乃至1%の範囲となった。属レベルの存在量による試験でも同様の結果が得られた。
【表F】
【0186】
これらの結果は、自閉症の診断における腸内マミクロバイオームの有意性を示している。そこで、データを更に分析し、個人が自閉症であるかについて存在量の情報価値が最も高い細菌の属を決定した。これらの属を以下の表7に列挙する。
【0187】
【表7-1】
【表7-2】
【0188】
実施例6 腸の老化の診断
【0189】
IBSサブタイプの予測に用いたものと同じアプローチを、未知の試料での年齢及び腸の老化の予測に使用した。年齢は、ヒトの腸内の微生物叢組成に影響を及ぼす主要因の1つであることが知られている。生後最初の数年(0乃至3年、「乳児」)で急速に変化し、4乃至12歳で成熟し(「小児」)、その後「大人」期(13乃至59歳)では比較的安した後、組成は、残りの集団とは異なるものとなる(60歳以上、「年配」)。様々な年齢の個人の集団の糞便試料由来の微生物叢プロファイルでランダムフォレストアルゴリズムをトレーニングしたにもかかわらず、使用した年齢の境界は、安定して確認されなかった。このデータセットには、「大人」456人、「乳児」35人、「小児」59人、「年配」76人が含まれた。このモデルにより、属及び種レベルの存在量を使用して、非希薄試料において大人群が100%正確に予測された。より小さな「乳児」、「小児」、及び「年配」の年齢群は、同じレベルの精度で予測されなかった。
【表G】
【0190】
種レベル及び属レベルのモデルの両方で、これらの群での誤分類は、約50%となった。属レベルのタクソノミを使用したモデリングでは、年齢予測に関して、種と比較して僅かに良好なパフォーマンスを示した。予測モデルは、各年齢群の個体数のバランスを取ることで改善することができた。
【0191】
実施例7 IBSの診断-属レベル
【0192】
実施例1に記載の方法を用いて、存在量が被検者のIBSの有無を最も示唆する細菌の属を特定した。
【0193】
ランダムフォレスト及びlimmaアルゴリズムの両方を用いて、最も示唆的な細菌の属を特定しており、結果を表8乃至11に示す。
【0194】
【表8-1】
【表8-2】
【0195】
【表9】
【0196】
【表10-1】
【表10-2】
【0197】
【表11】
【0198】
ランダムフォレスト及びlimmaアルゴリズムを用いて特定された属の間には有意な重複が存在する。両アルゴリズムの結果を評価することで、存在量が被検者のIBSの有無を最も示唆するものとして、以下の細菌のリストが特定された。
Corynebacterium、Lachnobacterium、Propionibacterium、Kytococcus、Fusobacterium、Veillonella、Prevotella、Anaerofustis、Arthrobacter、Dysgonomonas、Calothrix、Atopobium、Brevibacterium、Micrococcus、Burkholderia、Veillonella、Pelotomaculum、Acidaminococcus、Mitsuokella、Allisonella、Odoribacter、Bacteroides、Coprobacter、Alistipes、Ruminococcus、Ferrimonas、Alkaliphilus、及びLautropia。
【0199】
表9及び11は、上位5属のみを用いた場合、使用されるアルゴリズムに応じて、全体の分類誤識別率が7%乃至8%の範囲となったことを示している。これらの結果は、僅か5属の細菌の存在量を使用して、略92%乃至93%の精度でIBSである被検者を正しく診断可能であることを実証している。
【0200】
実施例8 IBSの診断-種レベル
【0201】
実施例1に記載の方法を用いて、存在量が被検者のIBSの有無を最も示唆する細菌の種を特定した。
【0202】
ランダムフォレスト及びlimmaアルゴリズムの両方を用いて、最も示唆的な細菌の種を特定しており、結果を表12乃至15に示す。
【0203】
【表12-1】
【表12-2】
【0204】
【表13】
【0205】
【表14-1】
【表14-2】
【0206】
【表15】
【0207】
ランダムフォレスト及びlimmaアルゴリズムを用いて特定された種の間には有意な重複が存在する。両アルゴリズムの結果を評価することで、存在量が被検者のIBSの有無を最も示唆するものとして、以下の細菌種が特定された。
Corynebacterium minutissimum、Prevotella oulora、Fusobacterium naviforme、Prevotella ruminicola、Bifidobacterium thermacidophilum、Dysgonomonas wimpennyi、Propionibacterium acnes、Corynebacterium tuberculostearicum、Brevibacterium casei、Lachnobacterium bovis、Prevotella dentasini、Prevotella albensis、Veillonella atypica 、Kytococcus schroeteri、Prevotella copri、Bacteroides barnesiae、Prevotella conceptionensis、Anaerofustis stercorihominis、Bifidobacterium thermophilum、Prevotella brevis、Roseburia intestinalis、Clostridium symbiosum、Barnesiella intestinihominis、Bacteroides fragilis、Anaerostipes rhamnosus、Collinsella aerofaciens、Clostridium bolteae、Arthrobacter creatinolyticus、Atopobium fossor、Prevotella paludivivens、及びPelotomaculum isophthalicicum。
【0208】
表13及び15は、上位5種のみを用いた場合、使用されるアルゴリズムに応じて、全体の分類誤識別率が4%乃至6%の範囲となったことを示している。これらの結果は、僅か5種の細菌の存在量を使用して、略94%乃至96%の精度でIBSである被検者を正しく診断可能であることを実証している。
【0209】
実施例9 IBSである被検者のIBSサブタイプの決定
【0210】
実施例1に記載の方法を用いて、IBSである被検者がIBS-C(便秘)かIBS-D(下痢)かを存在量が最も示唆する細菌の種を特定した。
【0211】
ランダムフォレスト及びlimmaアルゴリズムの両方を用いて、最も示唆的な細菌の種を特定しており、結果を表16乃至19に示す。
【0212】
【表16-1】
【表16-2】
【0213】
【表17】
【0214】
【表18-1】
【表18-2】
【0215】
【表19】
【0216】
ランダムフォレスト及びlimmaアルゴリズムを用いて特定された種の間には有意な重複が存在する。両アルゴリズムの結果を評価することで、IBSである被検者がIBS-CかIBS-Dかを存在量が最も示唆するものとして、以下の細菌種が特定された。
Christensenella minuta、Soleaferrea massiliensis、Papillibacter cinnamivorans、Oscillibacter valericigenes、Ruminococcus bromii、Gemmiger formicilis、Desulfitobacterium frappieri、Alistipes obesi、Anaerofilum pentosovorans、Akkermansia muciniphila、Alkaliphilus crotonatoxidans、Eubacterium sulci、Bdellovibrio exovorus、Curtobacterium pusillum、Flavonifractor plautii、Ruminococcus lactaris、Mogibacterium neglectum、Roseburia inulinivorans、Butyricimonas virosa、Intestinimonas butyriciproducens、Butyrivibrio crossotus、Barnesiella intestinihominis、Flavobacterium resistens、Flavobacterium cauense、Clostridium glycyrrhizinilyticum、Anaerostipes hadrus、Prevotella ruminicola、Blautia wexlerae、及びAnaerostipes coli。
【0217】
表17及び19は、上位5種のみを用いた場合、使用されるアルゴリズムに応じて、全体の分類誤識別率が6%乃至10%の範囲となったことを示している。これらの結果は、僅か5種の細菌の存在量を使用して、略90%乃至94%の精度でIBSである被検者がIBS-CかIBS-Dかを正しく決定可能であることを実証している。この精度は、上位100種の存在量を使用した場合、略97%に向上した。
【0218】
実施例10 IBS-Mと診断された被検者におけるIBSのサブタイプの決定
【0219】
実施例1に記載のものと同様の方法を用いて、IBS-M(混合)内の異なるサブタイプを特定するのに使用可能な存在量を有する潜在的な細菌種を特定した。IBS-M分類は、分子レベルで、環境、食物、及びストレス等の他の要因により分子署名が急速に変化する可能性のある不安定な異種細菌集団を意味する。
【0220】
驚くべきことに、IBS-Mと診断された被検者を、被検者由来の試料中の最小5種の細菌の存在量に基づいて、便秘型IBS-M(IBS-MC)又は下痢型IBS-M(IBS-MD)に割り当て可能であることを見出した
【0221】
ランダムフォレストアルゴリズムを用いて、新たに決定されたIBS-MD及びIBS-MCサブタイプを区別するために使用可能な最も示唆的な細菌の種を特定した。結果を表20及び21に示す。
【0222】
【表20-1】
【表20-2】
【0223】
【表21】
【0224】
IBS-Mと診断された被検者がIBS-MCかIBS-MDかを、存在量が最も示唆するものとして、以下の細菌種が特定された。
Peptoniphilus coxii、Clostridium clariflavum、Bacteroides thetaiotaomicron、Bacteroides coprocola、Oscillibacter valericigenes、Clostridium hveragerdense、Ruminiclostridium clariflavum、Bacteroides xylanisolvens、Clostridium chauvoei、Clostridium tepidiprofundi、Papillibacter cinnamivorans、Lactococcus fujiensis、Bacteroides uniformis、Bacillus thuringiensis、Johnsonella ignava、Pseudoflavonifractor capillosus、Christensenella minuta、Enterococcus azikeevi、Intestinimonas butyriciproducens、Eubacterium sulci、Flavobacterium resistens、Anaerotruncus colihominis、Pseudoflavonifractor capillosus、Bacteroides fluxus、Ruminococcus lactaris、Butyrivibrio crossotus、Eubacterium rectale、Prevotella ruminicola、Gemmiger formicilis、Ruminococcus flavefaciens、及びFaecalibacterium prausnitzii。
【0225】
表21は、使用したデータセットについて、上位5種のみを使用した場合、全体の分類誤識別率が0%となったことを示している。これは、僅か5種の細菌の存在量を使用して、IBS-Mと診断された被検者がIBS-MCがIBS-MDかを正しく診断可能であることを実証している。
【0226】
実施例11 IBSである被検者における自閉症の診断
【0227】
実施例1に記載の方法を用いて、存在量がIBSである被検者の自閉症の有無を最も示唆する細菌種を同定した。
【0228】
ランダムフォレストアルゴリズムを使用して、最も示唆的な細菌の種を特定しており、結果を表22乃至23に示す。
【0229】
【表22-1】
【表22-2】
【0230】
【表23】
【0231】
結果を評価することで、存在量がIBSである被検者の自閉症の有無を最も示唆するものとして、以下の細菌種が特定された。
Eubacterium hallii、Eubacterium rectale、Lachnobacterium bovis、Lachnoclostridium glycyrrhizinilyticum、Blautia glucerasea、Eubacterium desmolans、Anoxystipes fissicatena、Blautia coccoides、Faecalibacterium prausnitzii、Clostridium symbiosum、Roseburia inulinivorans、Anaerostipes coli、Coprococcus comes、Lachnospira pectinoschiza、Arthrobacter creatinolyticus、Clostridium nexile、Bifidobacterium thermacidophilum、Anaerostipes rhamnosus、Clostridium clariflavum、Blautia wexlerae、Fusicatenibacter saccharivorans、Tolumonas auensis、Ruminococcus gnavus、Peptococcus niger、Dorea formicigenerans、Roseburia intestinalis、Blautia wexlerae、Clostridium populeti、Dorea massiliensis、及びEubacterium eligens。
【0232】
表23は、上位5種のみを用いた場合、使用されるアルゴリズムに応じて、全体の分類誤識別率が12%となったことを示している。これらの結果は、僅か5種の細菌の存在量を使用して、略87%の精度でIBSである被検者を診断可能であることを実証している。この精度は、上位100種の存在量を使用した場合、略93%に向上した。
【0233】
実施例12 ディスバイオシス治療の有効性のモニタリング
【0234】
実施例1に記載の方法を用いて、腸内有益菌によるIBS治療の有効性をモニタした。治療中の様々な段階で、個体を非IBS(即ち、正常)、IBS-C、IBS-D、又はIBS-Mの4群の何れかに割り当てた。個体には、腸内有益菌による治療を2回連続して施し、微生物叢プロファイル内の細菌存在量を分析して、各個体を4群の何れかに割り当てた。結果を以下の表24に示す。
【0235】
【表24】
【0236】
表24は、2回の連続した腸内有益菌治療のそれぞれにより、「非IBS」に分類された個体数が極めて有意且つ漸進的に増加したことを示している(フィッシャの正確確率検定のp値=7.236e-16)。モデルに対して推定された分類精度は、85%を超えた。この精度は、未知の試料として扱われた参照(トレーニング)データにモデルを適用し直すことにより推定された。
【0237】
方法は、各個体の全体的な分類スコアも提供することができる。このスコアは、個体を特定の群に割り当てる確率として扱うことができる。スコアの範囲は、0乃至1となる。スコアが高いほど、その特定のトレーニング群に対するプロファイルの一致が良好となる。各試料の群全体での分類スコアの合計は、1となる。図3は、連続する腸内有益菌治療の度ごとに、全ての個体で平均「非IBS」スコアが有意且つ漸進的に増加したことを示している。これは、腸内有益菌による治療が進むにつれ、平均して、研究した個体が、漸進的に、より「非IBS様」(即ち、「正常」)になっていたことを意味する。
【0238】
実施例13 腸の老化に関連するディスバイオシスの診断
【0239】
実施例6に記載されたものと同様の方法を用いて、異なる年齢の被検者間で変化した細菌の種を決定した。被検者は、6つの異なる年齢カテゴリ、即ち、A01:2乃至5歳、A02:5乃至10歳、A03:10乃至20歳、A04:20乃至40歳、A05:40乃至60歳、A06:60乃至75歳に分けた。次に、被検者の微生物叢プロファイルを使用して、ランダムフォレストアルゴリズムをトレーニングし、その後、これを用いて未知の試料を6つの年齢カテゴリの何れかに分類した。
【0240】
異なる年齢群間で存在量が大きく変化した細菌の種を下の表25に示す。
【0241】
【表25-1】
【表25-2】
【0242】
上記の特定した種を用いて、ランダムフォレストアルゴリズムでは、全体として75%の精度で、上述した6つの年齢カテゴリの何れかに未知の被検者を正確に分類することができた。この精度は、サポートベクタマシン(SVM)を使用することで更に95%に向上した。
【0243】
同定された細菌の種は、年齢、例えば腸の老化に関連するディスバイオシスを診断するためのマーカーとして有用となる。結果を評価することで、存在量が被検者の年齢を最も示唆するものとして、以下の細菌種が特定された。
Pseudobutyrivibrio xylanivorans、Dorea massiliensis、Blautia glucerasea、Lachnoclostridium herbivorans、Faecalibacterium prausnitzii、Romboutsia lituseburense、Peptoniphilus methioninivorax、Blautia coccoides、Megamonas funiformis、Eubacterium rectale、Clostridium bifermentans、Roseburia intestinalis、Clostridium populeti、Clostridium hiranonis、Peptoclostridium difficile、Lactonifactor longoviformis、Clostridium caliptrosporum、Asaccharospora irregulare、Clostridium malenominatum、Clostridium symbiosum、Clostridium thermoalcaliphilum、Lachnoclostridium glycyrrhizinilyticum、Ruminococcus faecis、Blautia schinkii、Pseudoflavonifractor capillosus、Clostridium chromoreductans、Clostridium ghonii、Clostridium innocuum、Christensenella minuta、Dorea formicigenerans、及びClostridium tertium。
【先行技術文献】
【非特許文献】
【0244】
【文献】Barber, D. (2012) Bayesian Reasoning and Machine Learning. Cambridge University Press, New York, NY, USA.
【文献】Berger & Kimmel, (1987) Guide to Molecular Cloning Techniques. Methods in Enzymology, Volume 152, Academic Press Inc., San Diego, CA.
【文献】Caruana & Niculescu-Mizil, (2006) An Empirical Comparison of Supervised Learning Algorithms. Proceedings of the 23 rd International Conference on Machine Learning, Pittsburgh, PA.
【文献】Cole et al., (2008) Nucleic Acids Research. Vol 35-Database issue: D169-Dl 72
【文献】Colowick, S. and Kaplan, N. (1963) Methods In Enzymology eds., Academic Press, Inc., whole of series.
【文献】Durbin et al., (1998) Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. Cambridge University Press.
【文献】Feng & Doolittle, (1987) Progressive sequence alignment as a prerequisitetto correct phylogenetic trees. J. Mol. Evolution., 25, 351-360.
【文献】Gait, M. J. (1984) Oligonucleotide Synthesis: A Practical Approach. IRL Press, Oxford. Particularly the papers therein by Gait, ppl-22; Atkinson et al, pp35-81; Sproat et al, pp 83-115; and Wu et al, pp 135-151; 4.
【文献】Gibas & Jambeck (2001) Bioinformatics Computer Skills. O'Reilly.
【文献】Glover, D.N. (1985) DNA Cloning: A Practical Approach, Vols. I and II and III. IRL Press, Oxford.
【文献】Hames, B. D. & Higgins, S. J. (1985) Nucleic Acid Hybridization: A Practical Approach. IRL Press, Oxford.
【文献】Higgins, H.G. & Sharp, P.M. (1989) Fast and sensitive multiple sequence alignments on a microcomputer. CABIOS, 5:151-153.
【文献】Hinchliffe (1996) Modelling Molecular Structures. John Wiley and Sons.
【文献】Ho, T. K. (1995) Random Decision Forests. Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC, 14-16 August 1995 pp 278-282.
【文献】McPherson & Moller, (2006) PCR, second edition. Taylor & Francis Group.
【文献】Needleman, S.B. & Wunsch C.D., (1970) A general method applicable to the search for similarities in the amino acid sequence of two proteins.J. Mol. Biol. 48; 443-453.
【文献】Ondov, B. D. et al., (2011) Interactive metagenomic visualization in a Web browser. BMC Bioinformatics. 12:385. doi: 10.1186/1471-2105-12-385.
【文献】Perbal, B., (1984) A Practical Guide to Molecular Cloning.
【文献】Pevzner, (2000) Computational Molecular Biology and Algorithmic Approach. The MIT Press.
【文献】Pruesse et al., (2007) Nucleic Acid Research. Vol 35, p 7188.
【文献】Rashidi & Buehler, (2000) Bioinformatic Basics: Applications in Biological Science and Medicine. CRC Press LLC.
【文献】Rasmussen, C. E. & Williams, C. K. I. (2005) Gaussian Processes for Machine Learning. The MIT Press.
【文献】Ritchie et al., (2015) limma powers differential expression analyses for
【文献】RNA-sequencing and microarray studies. Nucleic Acids Research.
【文献】Roig, M. G. (1985) Immobilized Cells and Enzymes: A Practical Approach. IRL Press, Oxford.
【文献】Sambrook, J., & Green, M. R. (2012). Molecular Cloning: A Laboratory Manual (Fourth Edition). New York: Cold Spring Harbour Laboratory Press.
【文献】Thijssen, P., (1993) Hybridization with Nucleic Acid Probes. Laboratory Techniques in Biochemistry and Molecular Biology, Vol.24, Elsevier, N.Y.
【文献】Wiedman et al., (1994) PCR Meth Appl; 3:S51-S64.
【文献】Young & Davis, (1983) Proc. Natl. Acad. Sci.(USA) 80: 1194.
【符号の説明】
【0245】
[図1]
Core analysis with QIIME: QIIMEによるコア解析
Report: レポート
A. Checksums: A. チェックサム
B. FASTQC (QV): B. FASTQC (QV):
C. Combining the paired reads: C. ペアリードの結合
D. Quality trimming: D. クオリティトリミング
E. OTU clustering: E. OTUクラスタリング
F. Picking representative sequence: F. 代表配列のピッキング
G. Assigning taxonomy -alignment to database: G. データベースへのタクソノミアラインメントの割り当て
H. Convert taxonomy table (.biome -> .txt ): H. タクソノミテーブルの変換(.biome -> .txt )
I. Beta diversity within control populations (Bray Curtis): I. 対照集団内でのベータ多様性(Bray-Curtis)
J. PDF file with figures: J. 図付きのPDFファイル
K. Krona chart: K. Kronaチャート
[図2]
Controls: 対照
[図3]
Before treatment: 治療前
After first treatment: 第1の治療後
After second treatment: 第2の治療後
図1
図2
図3