特許6863633 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 一般社団法人日本農業フロンティア開発機構の特許一覧

特許6863633菌群抽出方法、装置、及び、プログラム、並びに、腸内細菌叢ＤＢ作成システム、及び、方法。

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】6863633

(24)【登録日】2021年4月5日

(45)【発行日】2021年4月21日

(54)【発明の名称】菌群抽出方法、装置、及び、プログラム、並びに、腸内細菌叢ＤＢ作成システム、及び、方法。

(51)【国際特許分類】

G16H 50/70 20180101AFI20210412BHJP

C12Q 1/6869 20180101ALI20210412BHJP

G01N 33/50 20060101ALI20210412BHJP

C12N 15/09 20060101ALN20210412BHJP

【ＦＩ】

G16H50/70

C12Q1/6869

G01N33/50 P

!C12N15/09 Z

【請求項の数】9

【全頁数】18

(21)【出願番号】特願2020-52927(P2020-52927)

(22)【出願日】2020年3月24日

【審査請求日】2020年4月10日

【早期審査対象出願】

(73)【特許権者】

【識別番号】518301936

【氏名又は名称】一般社団法人日本農業フロンティア開発機構

(74)【代理人】

【識別番号】100200229

【弁理士】

【氏名又は名称】矢作徹夫

(72)【発明者】

【氏名】増山博昭

(72)【発明者】

【氏名】蓮子和巳

(72)【発明者】

【氏名】本川正三

【審査官】松野広一

(56)【参考文献】

【文献】国際公開第２０１７／０３４０３１（ＷＯ，Ａ１）

【文献】特開２０２０−０３０６６２（ＪＰ，Ａ）

【文献】横山茂樹，誰でも分かる医療データマイニング，日本，ゼネラルヘルスケア株式会社（ＳＰＰ出版）竹澤慎，２０１４年２月１４日，第1版，pp.176-185，ISBN 978-4-9907308-0-2

【文献】足立浩平，多変量解析実例ハンドブック，日本，株式会社朝倉書店朝倉邦造，２００２年６月２５日，第1版，pp.287-293,348-368，ISBN 4-254-12147-4

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１６Ｈ１０／００−８０／００

Ｃ１２Ｑ１／６８６９

Ｇ０１Ｎ３３／５０

Ｃ１２Ｎ１５／０９

(57)【特許請求の範囲】

【請求項1】

複数の被験者の大便由来の塩基配列である塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、前記塩基配列群データを系統分類学に則って分類した既知菌群を含む第１の菌群データと、前記塩基配列群データをＯＴＵ化手法による分類毎に集計したＯＴＵ群を含む第２の菌群データを作成し、健康状態と関係のある菌群を抽出する方法であって、
前記第１の菌群データと、前記第２の菌群データを、前記塩基配列の共通性に基づいて比較し、
前記被験者の健康状態データと、前記比較された第１の菌群データ及び第２の菌群データを統計解析し、
所定の健康状態データと統計的に有意な関係のある菌群データを抽出するコンピュータによる菌群抽出方法。

【請求項2】

前記塩基配列群データに前記細菌叢解析及び前記ＤＮＡフィンガープリント法を適用し、前記第１の菌群データ及び前記第２の菌群データを作成するステップはコンピュータにより実行可能である、請求項１に記載のコンピュータによる菌群抽出方法。

【請求項3】

前記所定の健康状態データと統計的に有意な関係のある菌群データを抽出できない場合、前記細菌叢解析及び／又は前記ＤＮＡフィンガープリント法へフィードバック処理を行う請求項２に記載のコンピュータによる菌群抽出方法。

【請求項4】

前記フィードバック処理は、前記細菌叢解析に対しては他の細菌叢解析を読み込み、前記ＤＮＡフィンガープリント法に対しては、他のＤＮＡフィンガープリント法の適用、又は、ＯＴＵ範囲設定を変更する請求項３に記載のコンピュータによる菌群抽出方法。

【請求項5】

前記大便由来の塩基配列は次世代シーケンサによって求める請求項１から４の何れかに記載のコンピュータによる菌群抽出方法。

【請求項6】

健康状態と関係のある菌群を抽出する装置であって、
複数の被験者の大便由来の塩基配列である塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、前記塩基配列群データを系統分類学に則って分類した既知菌群を含む第１の菌群データと、前記塩基配列群データをＯＴＵ化手法による分類毎に集計したＯＴＵ群を含む第２の菌群データを作成し、前記第１の菌群データと、前記第２の菌群データを、前記塩基配列の共通性に基づいて比較する菌群作成部と、
前記被験者の健康状態データと、前記比較された第１の菌群データ及び第２の菌群データを統計解析する統計解析部と、
所定の健康状態データと統計的に有意な関係のある菌群データを抽出する菌群抽出部を備える菌群抽出装置。

【請求項7】

健康状態と関係のある菌群を抽出するプログラムであって、
複数の被験者の大便由来の塩基配列である塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、前記塩基配列群データを系統分類学に則って分類した既知菌群を含む第１の菌群データと、前記塩基配列群データをＯＴＵ化手法による分類毎に集計したＯＴＵ群を含む第２の菌群データを作成し、前記第１の菌群データと、前記第２の菌群データを、前記塩基配列の共通性に基づいて比較するステップと、
前記被験者の健康状態データと、前記比較された第１の菌群データ及び第２の菌群データを統計解析するステップと、
所定の健康状態データと統計的に有意な関係のある菌群データを抽出するステップをコンピュータに実行させる菌群抽出プログラム。

【請求項8】

健康状態と関係のある腸内細菌叢に関するデータベースを作成するシステムであって、
複数の被験者の大便から腸内細菌叢に関するＤＮＡ溶液を抽出する腸内細菌ＤＮＡ抽出装置と、
前記ＤＮＡ溶液から大便由来の塩基配列である塩基配列群データを解析する腸内細菌叢解析装置と、
前記塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、前記塩基配列群データを系統分類学に則って分類した既知菌群を含む第１の菌群データと、前記塩基配列群データをＯＴＵ化手法による分類毎に集計したＯＴＵ群を含む第２の菌群データを作成し、前記第１の菌群データと、前記第２の菌群データを、前記塩基配列の共通性に基づいて比較する菌群作成部と、
前記被験者の健康状態データと、前記比較された第１の菌群データ及び第２の菌群データを統計解析する統計解析部と、
所定の健康状態データと統計的に有意な関係のある菌群データを抽出する菌群抽出部を備える腸内細菌叢データベース作成システム。

【請求項9】

複数の被験者の大便から腸内細菌叢に関するＤＮＡ溶液を抽出し、前記ＤＮＡ溶液から大便由来の塩基配列である塩基配列群データを解析し、前記塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、前記塩基配列群データを系統分類学に則って分類した既知菌群を含む第１の菌群データと、前記塩基配列群データをＯＴＵ化手法による分類毎に集計したＯＴＵ群を含む第２の菌群データを作成し、健康状態と関係のある腸内細菌叢に関するデータベースを作成する方法であって、
前記第１の菌群データと、前記第２の菌群データを、前記塩基配列の共通性に基づいて比較し、
前記被験者の健康状態データと、前記比較された第１の菌群データ及び第２の菌群データを統計解析し、
所定の健康状態データと統計的に有意な関係のある菌群データを抽出するコンピュータによる腸内細菌叢データベース作成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明の実施形態は、生物の腸内細菌叢から、疾病と関係があると推定される菌群を抽出する技術に関する。

【背景技術】

【0002】

生物（人など）の腸内細菌叢を用いた疾病評価指標を算出する技術が開発されている。特許文献１は、採便を提出、かつ、属性などのアンケートを回答した被験者に対し、特定の疾病に対するリスクを示す評価レポートを提供する技術を開示している。このためには、この腸内細菌叢に関するデータベースとして、特定の疾病と関係があると推定される菌群を格納する必要がある。

【0003】

人の腸内細菌叢は数百〜千種を超えるともいわれる膨大な数の細菌から構成される極めて複雑な生態系であり、腸内細菌叢を培養、観察、同定、解析する作業には莫大な労力と時間が必要である。近年、分子生物学的な手法により、これらの問題を解決することが可能になった。この手法には、細菌の遺伝子、特に１６ＳｒＲＮＡの遺伝子（１６ＳｒＤＮＡ）の配列の違いを検出する技術が用いられている。

【0004】

このような技術を用いることによって、腸内細菌叢と疾病との関係についての研究が進んでいる。非特許文献１では、アレルギー性疾患と腸内細菌叢の関係性を調査する研究が行われている。この研究では、人の腸内細菌叢は、大便に含まれる細菌群の１６ＳｒＲＮＡ遺伝子の塩基配列を次世代シーケンサで解読され、系統分類学（進化の道筋を考慮した分類学）に則って分類した。この腸内細菌叢と被験者の自己申告のアレルギー疾患の有無との関連性を調べた結果、系統分類学的に目レベルでのＢａｃｔｅｒｏｉｄａｌｅｓの増加とＣｌｏｓｔｒｉｄｉａｌｅｓの減少がアレルギー疾患に関係しているかもしれない、と報告されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特許第６５３３９３０号公報

【非特許文献】

【0006】

【非特許文献1】Ｈｕａｅｔａｌ．、Ａｌｌｅｒｇｙａｓｓｏｃｉａｔｉｏｎｓｗｉｔｈｔｈｅａｄｕｌｔｆｅｃａｌｍｉｃｒｏｂｉｏｔａ：ＡｎａｌｙｓｉｓｏｆｔｈｅＡｍｅｒｉｃａｎＧｕｔＰｒｏｊｅｃｔ：ＥＢｉｏＭｅｄｉｃｉｎｅ３（２０１６）１７２−１７９、Ａｖａｉｌａｂｌｅｏｎｌｉｎｅ２７Ｎｏｖｅｍｂｅｒ２０１５、ｈｔｔｐ：／／ｄｘ．ｄｏｉ．ｏｒｇ／１０．１０１６／ｊ．ｅｂｉｏｍ．２０１５．１１．０３８

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかしながら、これら以外の菌が関係していないことは証明されていない。仮に、系統分類学的な手法で分類した既知の腸内細菌の細菌群とヒトの健康状態の項目に関連性（例えば、大便中のＢａｃｔｅｒｏｉｄａｌｅｓの量とアトピー性皮膚炎の重症度）が見いだせなくても、この腸内細菌叢と健康状態が関係ないとは言い切ることができない。すなわち、系統分類学的な菌の分類では公知のデータベースに登録されていない未知の塩基配列が示す菌については菌の種類を分類できないことと、系統分類学的な菌の分類手法のみによる菌群であるために健康状態との関連性が検出できない可能性が排除できないためである。

【0008】

出願人は、系統分類学的な分類では見いだされなかった腸内細菌叢と健康状態との関連性を、次世代シーケンサが登場する以前に利用されていたＤＮＡフィンガープリント法で表現される細菌群（ＯＴＵ）を用いて見いだす研究を行っている。

【0009】

そこで、次世代シーケンサで腸内細菌の塩基配列を解読した上で、系統分類学的な菌群では宿主の健康状態との関連性が見いだせない場合、１）塩基配列の様々な組み合わせによって作成される菌群を作成し、又は、２）ＤＮＡフィンガープリント法などその他の遺伝子解析を行って菌群を作成し、その菌群と健康状態との関連性を探索するといった解決策が考えられる。

【0010】

しかしながら、１）の菌群作成の場合、時間がかかり、２）の菌群作成の場合、時間とコストがかかる。このように、腸内細菌の系統分類的な菌群情報（すなわち既知菌情報）だけでは、腸内細菌叢とその宿主であるヒトの健康状態との関係性を充分に調査することは困難である。

【0011】

本発明は、このような課題に着目して鋭意研究され完成されたものであり、その目的は、疾病等の健康状態と関係があると推定される菌群を抽出する技術を提供することにある。

【課題を解決するための手段】

【0012】

上記課題を解決するために、本発明は、複数の被験者の大便由来塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、複数の菌群データを作成し、健康状態と関係のある菌群を抽出する方法であって、前記菌群データ間の比較をし、前記被験者の健康状態データと、前記比較された菌群データを統計解析し、所定の健康状態データと統計的に有意な関係のある菌群データを抽出するコンピュータによる菌群抽出方法である。

【0013】

他の本発明は、健康状態と関係のある菌群を抽出する装置であって、複数の被験者の大便由来塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、複数の菌群データを作成し、前記菌群データ間の比較をする菌群作成部と、前記被験者の健康状態データと、前記比較された菌群データを統計解析する統計解析部と、所定の健康状態データと統計的に有意な関係のある菌群データを抽出する菌群抽出部を備える菌群抽出装置である。

【0014】

他の本発明は、健康状態と関係のある菌群を抽出するプログラムであって、複数の被験者の大便由来塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、複数の菌群データを作成し、前記菌群データ間の比較をするステップと、前記被験者の健康状態データと、前記比較された菌群データを統計解析するステップと、所定の健康状態データと統計的に有意な関係のある菌群データを抽出するステップをコンピュータに実行させる菌群抽出プログラムである。

【0015】

他の本発明は、健康状態と関係のある腸内細菌叢に関するデータベースを作成するシステムであって、複数の被験者の大便から腸内細菌叢に関するＤＮＡ溶液を抽出する腸内細菌ＤＮＡ抽出装置と、前記ＤＮＡ溶液から大便由来塩基配列群データを解析する腸内細菌叢解析装置と、前記大便由来塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、複数の菌群データを作成し、前記菌群データ間の比較をする菌群作成部と、前記被験者の健康状態データと、前記比較された菌群データを統計解析する統計解析部と、所定の健康状態データと統計的に有意な関係のある菌群データを抽出する菌群抽出部を備える腸内細菌叢データベース作成システムである。

【0016】

他の本発明は、複数の被験者の大便から腸内細菌叢に関するＤＮＡ溶液を抽出し、前記ＤＮＡ溶液から大便由来塩基配列群データを解析し、前記大便由来塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、複数の菌群データを作成し、健康状態と関係のある腸内細菌叢に関するデータベースを作成する方法であって、前記菌群データ間の比較をし、前記被験者の健康状態データと、前記比較された菌群データを統計解析し、所定の健康状態データと統計的に有意な関係のある菌群データを抽出するコンピュータによる腸内細菌叢データベース作成方法である。

【発明の効果】

【0017】

本発明によれば、疾病等の健康状態と関係があると推定される菌群を抽出する技術を提供することができる。

【図面の簡単な説明】

【0018】

【図1】本発明の実施形態に係る腸内細菌叢ＤＢ作成システムの全体概略図である。

【図2】本実施形態に係る腸内細菌叢ＤＢ作成方法の全体フローチャートである。

【図3】本実施形態に係るＤＮＡ抽出方法のフローチャートである。

【図4】本実施形態に係る塩基配列群解析方法（その１：ウエット作業）のフローチャートである。

【図5】本実施形態に係る塩基配列群解析方法（その２：ドライ作業）のフローチャートである。

【図6】本実施形態に係る配列名と塩基配列の一例を示す表である。

【図7】本実施形態に係る菌群作成、統計解析及び菌群抽出のフローチャートである。

【図8】本実施形態に係る被験者ＩＤ及び菌属名の一例を示す表である。

【図9】本実施形態に係る被験者ＩＤ及びＤＮＡ断片長の一例を示す表である。

【図10】本実施形態に係るＯＴＵ群（占有率足切り値０．０％）を示すグラフである。

【図11】本実施形態に係るＯＴＵ群（占有率足切り値０．５％）を示すグラフである。

【図12】本実施形態に係るＯＴＵ群（占有率足切り値１．０％）を示すグラフである。

【図13】本実施形態に係る塩基配列と菌群の対応表の一例を示す表である。

【図14】本実施形態に係る菌群間で菌群内相対量の比較の一例（ＯＴＵと細菌叢の比較結果）を示す表である。

【図15】本実施形態に係る菌群抽出のフィードバックのフローチャートである。

【図16】本実施形態に係る菌群抽出の統計的有意の説明図（腎臓病）である。

【図17】本実施形態に係る菌群抽出の統計的有意の説明図（高血圧）である。

【図18】本実施形態に係る菌群抽出のフィードバック後の菌群間で菌群内相対量の比較の一例（ＯＴＵと細菌叢の比較結果）を示す表である。

【発明を実施するための形態】

【0019】

図面を参照しながら本発明の実施の形態を説明する。なお、各図において共通する部分には同一の符号を付し、重複した説明は省略する。

【0020】

（腸内細菌叢ＤＢ作成システム）
図１は、本発明の実施形態に係る腸内細菌叢ＤＢ作成システムの全体概略図である。腸内細菌叢ＤＢ作成システム１０は、複数の被験者が提出する採便キット、並びに、健康状態（疾病又は未病）に関するアンケートから腸内細菌叢データベース（ＤＢ）を作成する。ここで、被験者は健康体と疾病者の両方が含まれており、被験者ＩＤを有する約３，０００人である。

【0021】

腸内細菌叢ＤＢ作成システム１０は、被験者の採便キットから腸内細菌叢に関するＤＮＡ溶液を抽出する腸内細菌ＤＮＡ抽出装置１００と、ＤＮＡ（デオキシリボ核酸）溶液から腸内細菌叢に関するデータを解析する腸内細菌叢解析装置２００と、腸内細菌叢に関するデータ、及び、採便キットを提出した同じ被験者ＩＤの健康状態に関するアンケートから、被験者の疾病情報と統計的に有意な関係のある菌群を抽出する菌群抽出装置３００と、抽出した菌群に関する情報（疾病と関連性のある菌群）を格納する腸内細菌叢ＤＢ５００を備える。

【0022】

また、被験者ＩＤ毎の健康状態に関するアンケートはアンケートＤＢ４００に格納されている。被験者からのアンケート情報には、被験者の属性情報（年齢、性別など）、食生活等の生活習慣と身体情報から得られる健康状態データ（血液検査の結果、疾病など）が含まれている。

【0023】

菌群抽出装置３００は、解析された腸内細菌叢から菌群データを作成し菌群データ間を比較する菌群作成部３１０と、比較された菌群データ、及び、アンケートに記載されている被験者の健康状態データを用いて統計解析する統計解析部３２０と、所定の疾病データと統計的に有意な関係のある菌群データを抽出する菌群抽出部３３０を備える。菌群抽出装置３００はハードウェアでの実装に限られず、プログラム等のソフトウェアとしてコンピュータに実装されていてもよく、その実装形態は限定されない。例えば、パーソナルコンピュータ等のクライアント端末と有線又は無線の通信回線（インターネット回線など）に接続された専用サーバにインストールされて実装されていてもよいし、いわゆるクラウドサービスを利用して実装されていてもよい。

【0024】

図２は、本実施形態に係る腸内細菌叢ＤＢ作成方法の全体フローチャートである。腸内細菌ＤＮＡ抽出装置１００は、採便キットに保存された大便保存液からＤＮＡ溶液を抽出する（Ｓ１００）。腸内細菌叢解析装置２００は、ＤＮＡ溶液から塩基配列群を解析する（Ｓ１１０）。塩基配列群は、被験者の大便から検出された全ての塩基配列に相当し、３,０００人の被験者で１人当たり１万の塩基配列が検出されたとすると、大便由来の細菌の３,０００万塩基配列のパラメータになる。

【0025】

菌群抽出装置３００の菌群作成部３１０は、後述する細菌叢またはＯＴＵ群を作成する（Ｓ１２０）。本実施形態では、細菌叢及びＯＴＵ群を菌群という。

【0026】

菌群作成部３１０はＤＮＡフィンガープリント法を適用する場合、Ｔ−ＲＦＬＰ解析を用いる。Ｔ−ＲＦＬＰ（Ｔｅｒｍｉｎａｌ − ＲｅｓｔｒｉｃｔｉｏｎＦｒａｇｍｅｎｔＬｅｎｇｔｈＰｏｌｙｍｏｒｐｈｉｓｍ）では、ＤＮＡ断片長による細菌の分類を行い、分類毎に集計してＯＴＵを作成することができる。ＯＴＵは操作的分類単位（ＯｐｅｒａｔｉｏｎａｌＴａｘｏｎｏｍｉｃＵｎｉｔ）といい、「ＡｌｕＩ＿１．０＿３」などの分類の条件に沿った名前が菌の判別パターンとして付けられる。このような名前によって、制限酵素「ＡｌｕＩ」を使用し、足切り「１．０（％）」のＯＴＵのうち、ＤＮＡ断片長が３番目であると識別することが可能になる。

【0027】

また、ＯＴＵは、分類の条件によって系統分類学的な既知菌、未知菌を含む。ＯＴＵに含まれる既知菌の種類とその相対量は、ＤＮＡフィンガープリント法に対応する塩基配列の細菌叢と比較することで算出できる。なお、「ＡｌｕＩ（又はＡｌｕ−Ｉ）」は制限酵素の一例である。この制限酵素によってＤＮＡを操作的に切断し、最終的にはＯＴＵに分類することが可能になる。

【0028】

菌群抽出装置３００の統計解析部３２０は、菌群、及び、アンケートに記載されている被験者の健康状態を用いて統計解析する（Ｓ１３０）。統計解析では、菌群と健康状態との関係性を探索するモデルを使用する。例えば、ロジスティック回帰分析、共分散構造解析を用いる。

【0029】

被験者の健康状態は、被験者ＩＤ毎に、未病または疾病が記録されている。疾病としては、例えば、「アトピー」、「喘息」、「心臓病」、「大腸がん」、「胃腸病」、「肝臓病」、「腎臓病」、「糖尿病」、「高血圧」、「脂質異常」、「低体重（ＢＭＩ）」、「肥満（ＢＭＩ）」、「骨病」、「関節痛」、「うつ」などが挙げられる。これらの疾病は、被験者の自己申告による疾病でもよいし、医師の診断による疾病であってもよい。

【0030】

菌群抽出装置３００の菌群抽出部３３０は、複数の被験者の疾病情報と統計的な有意な関係のある菌群を抽出する（Ｓ１４０）。そして、抽出された菌群は、腸内細菌叢ＤＢ５００に菌群に関する情報として格納される（Ｓ１５０）。この菌群に関する情報が、複数の被験者から得られる疾病と関連性のある特定の特徴を持つ菌群であり、例えば、アトピーと関連性のある菌群、それらの菌群の構成、及び、構成する菌を示す塩基配列などが挙げられる。

【0031】

図３は、本実施形態に係るＤＮＡ抽出方法のフローチャートである。腸内細菌ＤＮＡ抽出装置１００が、被験者の大便検体に含まれる腸内細菌ＤＮＡを抽出する処理の流れを説明する。この抽出処理は一般的な方法であり、本実施形態がこの処理に限定されるものではない。

【0032】

抽出業者は約３，０００人の被験者に採便キットを渡し、被験者は各自の大便をトイレで排泄し、それを採便キットで大便検体を採取する。採便キットは、既存の製品を用いればよい。また、被験者は、健康状態に関するアンケートを記入し、アンケート回収業者に提出する。アンケート回収業者はアンケート結果をアンケートＤＢ４００に格納する。

【0033】

抽出業者は、採便キットで採取された大便保存液を被験者から受け取る（Ｓ２００）。抽出業者は、腸内細菌ＤＮＡ抽出装置１００に大便保存液を入力すると、腸内細菌ＤＮＡ抽出装置１００はまず、大便試料に含まれる細菌に対して溶菌処理を行う（Ｓ２１０）。溶菌処理とは、溶菌酵素処理や、物理的な破砕処理等によって細菌（細胞）を破砕する処理である。

【0034】

溶菌処理された試料は、フェノール・クロロホルム法により、細胞内外に含まれるタンパク質が除去される（Ｓ２２０）。

【0035】

酵素処理とエタノール沈殿法を用いて、試料に含まれるＤＮＡ以外の物質を除去し、ＤＮＡを精製する（Ｓ２３０）。そして、大便由来ＤＮＡ溶液を保存する（Ｓ２４０）。

【0036】

図４及び図５は、本実施形態に係る塩基配列群解析方法のフローチャートである。ＤＮＡ溶液を受け取った解析業者は、腸内細菌叢解析装置２００にＤＮＡ溶液を入力し、大便由来の塩基配列群を解析する。なお、抽出業者と解析業者を分けて説明したが、同一の事業者が抽出作業と解析作業を行ってもよい。

【0037】

ＤＮＡの塩基配列を解読する作業は単にＤＮＡシークエンスとも呼ばれる。ＤＮＡシークエンスは大きく分けて２つの工程からなる。第１の工程は実験での手作業であり、ウェット作業と呼ばれる。第２の工程はＰＣ（パーソナルコンピュータ）での作業であり、ドライ作業と呼ばれる。このＤＮＡシークエンスは一般的な方法であり、本実施形態がこの処理に限定されるものではない。

【0038】

まず図４を用いて、第１の工程（ウエット作業）を説明する。解析業者はＤＮＡ溶液をサンプル（鋳型）として、オーバーハング配列の付いたプライマーを用いた第１のＰＣＲ増幅を行う。ＰＣＲとは、ポリメラーゼ連鎖反応（ＰｏｌｙｍｅｒａｇｅＣｈａｉｎＲｅａｃｔｉｏｎ）をいう。ＤＮＡをＰＣＲ増幅した後に、第１のＰＣＲ産物を精製する（Ｓ３００）。アガロースゲル電気泳動を用いて、第１のＰＣＲ産物のＤＮＡの長さ（バンド）を確認する（Ｓ３１０）。

【0039】

解析業者は第１のＰＣＲ産物に対して、インデックス配列の付いたプライマーを用いた第２のＰＣＲ増幅を行う（Ｓ３２０）。全自動電気泳動システムを用いて、第２のＰＣＲ産物のＤＮＡの長さ（バンド）を確認する（Ｓ３３０）。

【0040】

解析業者は第２のＰＣＲ産物の濃度調整を行い、ＤＮＡの二重らせん構造を一本鎖に変性させる（Ｓ３４０）。そして、一本鎖をライブラリとして次世代シーケンサ（ＮｅｘｔＧｅｎｅｒａｔｉｏｎＳｅｑｕｅｎｃｅｒ；ＮＧＳ）にアプライし、ＤＮＡシークエンスを行う（Ｓ３５０）。

【0041】

次に図５を用いて、第２の工程（ドライ作業）を説明する。Ｓ３５０のシークエンス解析から得られたペアリードの塩基配列を１つにつなげる（Ｓ４００）。ペアリードとは、１つの長い配列から領域の異なる短い２つの配列が検出されることをいう。なお、Ｓ４００のペアリードの解析は本実施形態に必須の処理ではなく、省略してもよい。

【0042】

塩基配列のうち、解読の精度が悪い配列を取り除く。取り除く際に、Ｓ３５０のシークエンス解析のクオリティ情報が低いものを取り除くため、クオリティ・フィルタリングと呼ばれる（Ｓ４１０）。

【0043】

ＤＮＡを増幅するために用いたプライマー配列を除去する（Ｓ４２０）。さらに、キメラ配列も除去する（Ｓ４３０）。キメラ配列は、元々のＤＮＡ溶液には含まれていないと推定される配列である。

【0044】

このようにして１検体当たり約１万の塩基配列を解読する作業を、約３，０００人の被験者に行い、合計３，０００万ほどの塩基配列を大便由来の細菌の塩基配列群として抽出する（Ｓ４４０）。図６は、その塩基配列の一例を示す。

【0045】

図７は、本実施形態に係る菌群作成、統計解析及び菌群抽出に関する一連の処理のフローチャートである。これは、図２の菌群作成処理（Ｓ１２０）、統計解析処理（Ｓ１３０）、及び、菌群抽出処理（Ｓ１４０）を詳細に説明した図である。ここで、菌群とは、細菌叢とＯＴＵ群を包括する概念である。細菌叢とは、それぞれの菌名毎の相対量で表すことができる。ここで菌名がつくことは、公知のデータベースに菌の配列が登録されている菌（既知菌）であり、公知のデータベースに登録されていない菌は未知菌（Ｕｎｃｌａｓｓｉｆｉｅｄ）としてまとめる。また、ＯＴＵ群とは、あるＤＮＡフィンガープリント法の条件で作成されたＯＴＵの集団を示す。

【0046】

この図の入力データは、図５のＳ４４０で抽出した被験者人数分の大便由来の細菌の塩基配列群である。本実施形態では、入力データの母集団は全被験者（約３，０００人）の集団である。なお、菌群抽出解析の目的によっては、被験者のアンケート情報を用いて、母集団を性別や年齢で制限してもよい。

【0047】

本実施形態では、細菌叢解析について説明してから、ＤＮＡフィンガープリント法について説明するが、これらの手法を用いる順番に特に決まりは無い。

【0048】

Ｓ５００では、被験者全員分の塩基配列群に対して、系統分類学的な細菌叢解析を行う。ここでは、コンピュータを用い、塩基配列に対応する菌属名をつける。被験者全員分の塩基配列群に適用する細菌叢解析パイプラインでは、菌の判別にＲＤＰ（ＲｉｂｏｓｏｍａｌＤａｔａｂａｓｅＰｒｏｊｅｃｔ）Ｃｌａｓｓｉｆｉｅｒを、参照データベースにＲＤＰデータベースを用いる。

【0049】

Ｓ５１０では、細菌叢の作成を行う。具体的には、細菌叢解析を適用し、被験者毎に菌名がついた細菌叢（菌名毎の相対量、例えば、Ｂｉｆｉｄｏｂａｃｔｅｒｉｕｍ１０．０％）を作成する。すなわち、菌属ごとに集計し、各菌属の割合（％）を出す。図８が被験者ＩＤ毎（一例としてＩＤ＝００１〜０１０のみ値を記載）についての細菌叢（菌属）％の表である。

【0050】

Ｓ５２０では、被験者全員分の塩基配列群に対して、ＤＮＡフィンガープリント法による解析を行い、塩基配列に対応するＯＴＵ名をつける。ここでは、ＤＮＡフィンガープリント法の初期設定の読み込みを行う。または、後述するフィードバック設定の読み込みを行っても良い。

【0051】

ＤＮＡフィンガープリントを適用する手法（ＯＴＵ化手法ともいう）には、末端標識制限酵素断片多型解析（Ｔ−ＲＦＬＰ）解析（制限酵素によるＤＮＡの断片化［整数］）を用い、制限酵素はＡｌｕＩ、ＭｓｐＩを用いる。

【0052】

（初期設定）
ＯＴＵ範囲設定手法（初期設定）については、図９〜図１２を用いて説明する。まず、母集団（被験者全員）のＤＮＡ断片長（整数）の相対量のヒストグラムを作成する。図９は、被験者ＩＤ及びＤＮＡ断片長の一例を示す表である。同図（ａ）が被験者ＩＤ毎（一例としてＩＤ＝００１〜０１０のみ値を記載）についてのＤＮＡ断片長（１ｂｐ単位）の表である。

【0053】

次に、ある検体の菌群に含まれるＯＴＵの相対量（占有率）での足切り（０．５％、１．０％）を設定する。図９では、０％（足切り無し）、０．５％、１．０％で実施した。同図（ｂ）は占有率での足切り値毎のＤＮＡ断片長の頻度を、同図（ｃ）は足切り値毎のＤＮＡ断片長の頻度の１回差分値を、同図（ｄ）は足切り値毎のＤＮＡ断片長の頻度の２回差分値の表である。

【0054】

さらに、図９（ｂ）のＤＮＡ断片長の頻度のヒストグラム（ＤＮＡ断片長を短い順に並べた頻度分布）に対し、ピーク解析を実施する。ここでは、２回差分値で、＋（プラス）→−（マイナス）→０（ゼロ）となる値をピークとして検出する。

【0055】

最後に、ピーク毎にＯＴＵ化を行う。図１０は足切り値０．０％（足切り無し）の場合のＯＴＵ群を、図１１は足切り値０．５％の場合のＯＴＵ群を、図１２は足切り値１．０％の場合のＯＴＵ群を示す。このようにして被験者毎のＯＴＵ群を作成する（Ｓ５３０）。ここで、ＯＴＵ群は、ＤＮＡフィンガープリント法による菌の分類単位であり、ＯＴＵごとに集計したものである。

【0056】

被験者毎にＯＴＵ名での菌群（相対量で示す、例えばＯＴＵ＿１２３３０％）が作成される。本実施形態では、Ｔ−ＲＦＬＰ解析手法を適用しており、制限酵素ごとにＯＴＵ菌群が作成される。さらに足切り条件の数だけ菌群が作成される。後述する疾病毎の実施例においては、制限酵素２つ（ＡｌｕＩ、ＭｓｐＩ）、足切り条件２つ（０．５％、１．０％）で合計４つの菌群が作成される。

【0057】

ＤＮＡフィンガープリント法としては、Ｔ−ＲＦＬＰと同じくＤＮＡ断片長を指標とする制限酵素断片多型解析（ＲＦＬＰ）法や塩基配列中のＧＣ含量を指標とした勾配ゲル電気泳動（ＧｒａｄｉｅｎｔＧｅｌＥｌｅｃｔｒｏｐｈｏｒｅｓｉｓ、ＧＧＥ）法などを用いてもよい。それぞれの手法ごとに、目的に応じたＯＴＵ範囲設定を設定する必要がある。

【0058】

ＯＴＵ範囲設定によって、ＯＴＵの解像度が変更される。例として、ある検体の菌群に含まれるＯＴＵの相対量（占有率）を足切りすることによってヒストグラム上のピーク検出が変わり、ＯＴＵ範囲設定が変わる、つまり解像度が変わる。

【0059】

占有率での足切り基準を設定する場合は、基本的に足切り基準を高く設定したほうが、解像度が低くなり、逆に足切り基準を低く設定すると解像度は高くなる。しかし解像度は、指標であるＤＮＡ断片長が整数で示されているので、整数の単位以上に高くはできない。足切り基準は、占有率のほか、母集団内でそのＯＴＵを持つ被験者の数の相対量（保有率）でも設定可能である。

【0060】

Ｓ５４０では、塩基配列、細菌叢（菌属）、及びＯＴＵを並べた対応表を作成し、配列で対応させた細菌叢とＯＴＵ群を比較する。図１３では、それぞれの塩基配列に対応する菌群として、細菌叢解析では菌属名を、ＤＮＡフィンガープリント法として、制限酵素ＡｌｕＩ（切断部位は、塩基配列中のＡＧとＣＴの間、図１３の太字で示す「ＡＧ／ＣＴ」を参照）で足切り条件２つ（０．５％、１．０％）のＯＴＵ名を並列して示している。細菌叢（菌属）とＯＴＵの対応関係から、それぞれ菌属毎、ＯＴＵ毎に集計することで、細菌叢とＯＴＵ群の比較を行うことができる。

【0061】

図１３の太字で示す「ＡＧ／ＣＴ」が、制限酵素ＡｌｕＩによる切断部位を示している。配列名「ｓｅｑ２」は細菌叢解析では「Ｕｎｃｌａｓｓｉｆｉｅｄ（未知菌）」すなわち菌属名を特定できなかった。しかし、ＤＮＡフィンガープリント法も適用することによって、ＯＴＵ名をつけることが可能になる。配列名「ｓｅｑ２」について、足切り基準が０．５％ではＯＴＵ名「ＡｌｕＩ＿０．５＿３」を、足切り基準が１．０％ではＯＴＵ名「ＡｌｕＩ＿１．０＿４」をつけることが可能になる。

【0062】

例えば、後述する疾病毎の実施例において、制限酵素２つ（ＡｌｕＩ、ＭｓｐＩ）、足切り条件２つ（０．５％、１．０％）で合計４つの菌群が作成され、それぞれのＯＴＵ群と細菌叢の比較結果は、図１４のように示される。図１４によれば、ＤＮＡフィンガープリント法（Ｔ−ＲＦＬＰ適用；制限酵素ＡｌｕＩ）、足切り基準０．５％の場合、例えば、ＯＴＵ群「ＡｌｕＩ＿０．５＿１」は、菌属名「Ｄｏｒｅａ」が４０％含まれ、菌属名「Ｕｎｃｌａｓｉｆｉｅｄ（特定できず）」が３０％含まれていると、解釈できる。

【0063】

Ｓ５５０では、アンケートＤＢ４００から菌群抽出装置３００の統計解析部３２０へ被験者人数分（約３，０００人）のアンケート情報を入力する。アンケート情報は疾病の情報を含んでいる。また、特定の疾病に関係するアンケート情報だけを入力してもよい。後述する腎臓病の実施例では約２００人のアンケート情報を、高血圧の実施例では約５００人のアンケート情報を用いている。

【0064】

疾病には、心臓病、肝臓病、胃の疾病、腸の疾病、大腸がん、大腸ポリープ、がん（大腸がん以外のがん）、１型糖尿病、２型糖尿病、脂質異常症（高コレステロール、高中性脂肪など）、肥満、痩せ、骨や関節の疾病（骨粗しょう症など）、腰痛、関節痛、喘息、アレルギー性鼻炎（花粉症、ハウスダストなど）、食物、薬物、金属アレルギー、アトピー性皮膚炎、自己免疫疾患、免疫異常（関節リウマチ、膠原病など）、うつ病、うつ病以外のストレス系の疾病（パニック障害など）、眼の疾病、口腔内の疾病、耳の疾病（メニエール病、中耳炎、難聴など）、風邪、けがなどを含めてもよい。

【0065】

統計解析部３２０は、比較された細菌叢及びＯＴＵ群それぞれに対して、アンケート情報を用いて統計解析を行う（Ｓ５６０とＳ５７０）。具体的には、アンケート情報の項目（例えば、ある疾病に罹患しているか、していないかの自己申告）を統計解析の目的変数に、細菌叢またはＯＴＵ群をそれぞれ別の統計解析の説明変数に設定し、統計解析を行う。

【0066】

本実施形態では、統計解析の手法としてロジスティック回帰分析を行う。なお、統計解析手法としては、分散分析、クラスター解析、判別分析、主成分分析、因子分析、相関分析、多次元尺度構成法、対応分析、冗長分析、非負値行列因子分解、重回帰分析、パス解析、決定木分析、共分散構造分析、機械学習などを用いてもよい。

【0067】

細菌叢及びＯＴＵ群それぞれに対する統計解析（Ｓ５６０とＳ５７０）の結果は、説明変数として用いた菌属名とＯＴＵの対応表（その一例が図１３に相当）を参照し、菌属名のみで得られた解析結果（図１４の菌群作成パイプラインが「細菌叢解析」の場合のみ）とＯＴＵを追加した場合（図１４全体）に得られる結果の比較を行う（Ｓ５８０）。

【0068】

（フィードバック設定）
図１５は、本実施形態に係る菌群抽出のフィードバックに関する一連の処理のフローチャートである。図７で説明した初期設定の読み込みを行う代わりに、フィードバック設定の読み込みを行う。このため、図７と同じ符号については、既に説明しているため、重複した記載を省略する。

【0069】

Ｓ５８１では、図７のＳ５８０で説明した統計解析結果の比較によって、しきい値以上で疾病と関係のある菌群を抽出できたかを判定する。具体的には、統計解析の説明変数として細菌叢を用いた場合と、説明変数としてＯＴＵ群を用いた場合において、それぞれ設定した基準以上で目的変数であるアンケート情報と関係のある説明変数を抽出する。細菌叢の場合は菌属名を、ＯＴＵ群の場合はＯＴＵ名を抽出する。本実施形態では、統計解析としてロジスティック回帰分析を行い、設定した基準は、偏回帰係数のｐ値が０．０５以下、オッズ比が２．００以上である。

【0070】

統計手法やデータの母集団によって基準を設定してよい。本実施形態では、目的変数に対して正の影響を与える説明変数を抽出することを目的とし、ロジスティック回帰分析での結果のオッズ比を２．００以上とした。

【0071】

逆に、目的変数に対して負の影響を与える説明変数を抽出するのであれば、１以下のオッズ比（０．５０等）を設定する。本実施形態でのフィードバックは、一つの制限酵素での解像度を一方向（高血圧、ＡｌｕＩのみで足切り条件を低くする）だが、フィードバックを繰り返しても基準を満たすＯＴＵが見つからない場合等を考慮して、別のＴ−ＲＦＬＰ解析手法内で制限酵素の選択、もしくは別のＤＮＡフィンガープリント法の適用をフィードバック設定に含めることが可能である。

【0072】

Ｓ５８１の判定ステップで設定した基準に満たない場合（Ｓ５８１のＮｏ）は、Ｓ５２０のＤＮＡフィンガープリント法の読み込みにおいて、ＤＮＡフィンガープリント法又はＯＴＵ範囲設定に対しフィードバック処理を行う（Ｓ５９０）。フィードバック処理は、ＤＮＡフィンガープリント法に行う場合、制限酵素を変える等の他のＤＮＡフィンガープリント法を適用し、又は、ＯＴＵ範囲設定に対して行う場合、ＯＴＵ化の解像度を変更する。Ｓ５２０で作成した菌群が複数ある場合は、統計解析結果が基準に近い菌群の解像度をフィードバックする。解像度は、占有率での足切り基準を変更することで実施する。

【0073】

フィードバック処理について説明する。占有率での足切り０．５％の場合の菌群と１．０％の場合の菌群において、どちらの菌群を用いた場合の統計解析の結果がより基準に近いかを判断し、基準に近い方向へフィードバックをかける。例えば、１．０％よりも０．５％の方が基準に近い場合は、足切り基準を０．５％より小さくしてＯＴＵ範囲設定を実施した後にＯＴＵ化、そして再度統計解析を実施する。フィードバックをかける単位は、それぞれの手法によって設定するが、本実施形態では、０．５％刻みで設定した。つまり、１．０％よりも０．５％の方が基準に近い場合は、足切り０．０％（足切り無し）で菌群を作成する。

【0074】

しきい値（設定した基準）以上で疾病と関係のある菌群（例えば、ＯＴＵ）が抽出されたら（Ｓ５８１のＹｅｓ）、菌群抽出処理は終了する。なお、図１５に記載していないが、Ｓ５８１のＮｏの場合、Ｓ５００で本実施例とは異なる他の細菌叢解析法を用いてフィードバック処理を行い、Ｓ５１０以降の同様の処理フローを行っても良い。

【0075】

（実施形態；疾病「腎臓病」と関係のある菌群を抽出）
実施形態として、疾病「腎臓病」と関係のある菌群を抽出する場合を説明する。

【0076】

目的変数は、腎臓病に罹患しているか、していないかの２値データで、説明変数は１つもしくは複数の菌群に設定する。ロジスティック回帰分析では、説明変数毎に偏回帰係数、標準誤差、ｚ値、ｐ値、オッズ比、オッズ比９５％信頼区間下限、オッズ比９５％信頼区間上限が算出される。

【0077】

図１６は、本実施形態に係る菌群抽出の統計的有意性を説明するための図（腎臓病の場合）である。細菌叢を説明変数とした場合のオッズ比の最大値は、２．０６（図１６の網掛け数字を参照、以下同様）であった。一方で初期設定のＤＮＡフィンガープリント法では、制限酵素ＡｌｕＩを適用した際の占有率の足切り基準０．５％、１．０％のＯＴＵ群を説明変数とした場合のオッズ比は、共に１．３５、制限酵素ＭｓｐＩを適用した際の占有率の足切り基準０．５％、１．０％のＯＴＵ群を説明変数とした場合のオッズ比は共に２．１３であった。細菌叢のＢｉｆｉｄｏｂａｃｔｅｒｉｕｍとＯＴＵ群の「ＭｓｐＩ＿０．５＿１」と「ＭｓｐＩ＿１．０＿１」で基準をクリアしたので、フィードバックを行わずに図１５の処理フローを終了した。

【0078】

図１６によれば、説明変数「ＭｓｐＩ＿０．５＿１」と「ＭｓｐＩ＿１．０＿１」は目的変数「腎臓病」と正の影響があることが統計的に有意であると示される。従って、疾病「腎臓病」と関係があると推定される菌群として「ＭｓｐＩ＿０．５＿１」と「ＭｓｐＩ＿１．０＿１」を統計的に抽出することができた。

【0079】

「腎臓病」を目的変数とした場合、説明変数「ＭｓｐＩ＿０．５＿１」と「ＭｓｐＩ＿１．０＿１」は、細菌叢の「Ｂｉｆｉｄｏｂａｃｔｅｒｉｕｍ」を説明変数とした場合のオッズ比よりも、高いオッズ比が算出された。ＯＴＵと細菌叢の対応を示した図１４を参照すると、説明変数「ＭｓｐＩ＿０．５＿１」と「ＭｓｐＩ＿１．０＿１」には、主にＢｉｆｉｄｏｂａｃｔｅｒｉｕｍとＭｅｇａｍｏｎａｓが含まれている。このことは、Ｂｉｆｉｄｏｂａｃｔｅｒｉｕｍのみよりも、ＢｉｆｉｄｏｂａｃｔｅｒｉｕｍとＭｅｇａｍｏｎａｓを組み合わせた菌群の方がより「腎臓病」との関連性が高い可能性を示している。

【0080】

（実施形態；疾病「高血圧」と関係のある菌群を抽出）
実施形態として、疾病「高血圧」と関係のある菌群を抽出する場合を説明する。

【0081】

目的変数は、高血圧に罹患しているか、していないかの２値データで、説明変数は１つもしくは複数の菌群に設定する。ロジスティック回帰分析では、説明変数ごとに偏回帰係数、標準誤差、ｚ値、ｐ値、オッズ比、オッズ比９５%信頼区間下限、オッズ比９５%信頼区間上限が算出される。

【0082】

図１７は、本実施形態に係る菌群抽出の統計的有意性を説明するための図（高血圧の場合）である。細菌叢を説明変数とした場合のオッズ比の最大値は、１．０８（図１７の網掛け数字を参照、以下同様）であった。一方で初期設定のＤＮＡフィンガープリント法では、制限酵素ＡｌｕＩを適用した際の占有率の足切り基準０．５％、１．０％のＯＴＵ群を説明変数とした場合のオッズ比はそれぞれ１．９６と１．９２、制限酵素ＭｓｐＩを適用した際の占有率の足切り基準０．５％、１．０％のＯＴＵ群を説明変数とした場合のオッズ比はそれぞれ１．２７と１．２８であった。細菌叢とＤＮＡフィンガープリント法で設定した基準を満たさなかったので、フィードバックを実施した。

【0083】

フィードバックは、ＤＮＡフィンガープリントでの２つの方法のうち、オッズ比の最大値は、制限酵素ＡｌｕＩを適用した場合の方が制限酵素ＭｓｐＩを適用した場合より高かったので、制限酵素ＡｌｕＩのパイプラインで実施した。ＤＮＡフィンガープリントの制限酵素ＡｌｕＩ適用の場合は、足切り基準で占有率０．５％の場合のオッズ比が、１．０％より設定した基準より高かったので、足切り基準を低くするフィードバック（０．０％で足切りを実施して再度統計解析）を実施した。足切り基準０．０％では、説明変数「ＡｌｕＩ＿０．０＿４」を用いた際のオッズ比が２．０５となり基準をクリアしたので、図１５の処理フローを終了した。

【0084】

図１７によれば、説明変数「ＡｌｕＩ＿０．０＿４」は目的変数「高血圧」と正の影響があることが統計的に有意であると示される。従って、疾病「高血圧」と関係があると推定される菌群として「ＡｌｕＩ＿０．０＿４」を統計的に抽出することができた。

【0085】

「高血圧」を目的変数とした場合、説明変数「ＡｌｕＩ＿０．０＿４」を用いた場合のオッズ比は、菌属を説明変数とした場合や同じ制限酵素を用いたＯＴＵである「ＡｌｕＩ＿０．５＿４」よりも、高かった。細菌叢とＯＴＵの対応を示した図１４と図１８を参照すると、説明変数「ＡｌｕＩ＿０．０＿４」と「ＡｌｕＩ＿０．５＿４」には、主にＤｏｒｅａとＵｎｃｌａｓｓｉｆｉｅｄ（未知菌）が含まれている。さらに、より高いオッズ比を示した「ＡｌｕＩ＿０．０＿４」は、「ＡｌｕＩ＿０．５＿４」よりも、ＯＴＵ内に含まれるＵｎｃｌａｓｓｉｆｉｅｄの割合が高い。このことは、未知の菌群であるＵｎｃｌａｓｓｉｆｉｅｄが「高血圧」との関連性を高めている可能性を示している。

【0086】

（効果）
本実施形態によれば、疾病（例えば、腎臓病、高血圧）等の健康状態と関係があると推定される菌群を特異的に抽出することが可能である。また、コストが高く解析時間が長くなりすぎるために繰り返し実験を行うことはできずに、従来は知られていなかった未知菌による直接的な健康状態への影響（Ｕｎｃｌａｓｓｉｆｉｅｄを多く含むＯＴＵと疾病との関係性）や、間接的な健康状態への影響（既知菌とＵｎｃｌａｓｓｉｆｉｅｄの組み合わせを含むＯＴＵと疾病との関係性）を推定することが可能になる。

【0087】

このため、健康状態（疾病又は未病）と関係のある菌群について腸内細菌叢ＤＢを充実することが可能になる。そして、腸内細菌叢を用いた疾病評価指標を算出する技術を改善することができる。また、評価希望者（ユーザ）に提供される疾病評価レポートに、従来見つからなかった「腸内細菌叢と疾病との関連性」を記載することが可能になる。

【0088】

（変形例）
腸内細菌叢とその宿主であるヒトの健康状態との関係性を充分に調査するために、本実施形態は系統分類学的な分類手法と並行して、多様なＤＮＡフィンガープリント法を同時に実施するものである。ＤＮＡフィンガープリント法は、一つの方法のみであれば短時間、低コストで実施可能である。しかしながら、多様な方法を同時に実施するには時間とコストがかかる方法である。

【0089】

ところで、系統分類学的な細菌叢解析と同時にＤＮＡフィンガープリント法を実施する場合には、細菌叢解析のデータを用いることによって、ＤＮＡフィンガープリント法で得られる菌の判別パターンを実験での手作業で作成することも可能である。

【0090】

すなわち、図２で説明した腸内細菌叢ＤＢ作成方法のうち、菌群作成ステップ（Ｓ１２０）では、作業者が実験での手作業で被験者から得られる塩基配列群にＤＮＡフィンガープリント法を適用してもよい。また、図７の場合、ＤＮＡフィンガープリント法解析ステップ（Ｓ５２０）は実験での手作業で行い、ＯＴＵ群の作成ステップ（Ｓ５３０）はコンピュータ処理によりＯＴＵごとに集計してもよい。

【0091】

以上、本発明の実施例（変形例を含む）について説明してきたが、これらのうち、２つ以上の実施例を組み合わせて実施しても構わない。あるいは、これらのうち、１つの実施例を部分的に実施しても構わない。さらには、これらのうち、２つ以上の実施例を部分的に組み合わせて実施しても構わない。例えば、本実施形態では、統計解析の目的変数に対して正の影響を与える説明変数を抽出し、疾病と関係のある菌群を抽出した。しかしながら、統計解析の目的変数に対して負の影響を与える説明変数を抽出し、疾病を改善する可能性のある菌群を抽出してもよい。

【0092】

また、本発明は、上記発明の実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。例えば、疾病だけでなく、食生活などの他の健康状態と関係のある菌群を抽出してもよい。

【符号の説明】

【0093】

１０腸内細菌叢ＤＢ作成システム
１００腸内細菌ＤＮＡ抽出装置
２００腸内細菌叢解析装置
３００菌群抽出装置
４００アンケートＤＢ
５００腸内細菌叢ＤＢ

【要約】

【課題】疾病等の健康状態と関係があると推定される菌群を抽出する技術を提供することにある。
【解決手段】複数の被験者の大便由来塩基配列群データに細菌叢解析及びＤＮＡフィンガープリント法を適用し、複数の菌群データを作成し、健康状態と関係のある菌群を抽出する方法であって、前記菌群データ間の比較をし、前記被験者の健康状態データと、前記比較された菌群データを統計解析し、所定の健康状態データと統計的に有意な関係のある菌群データを抽出するコンピュータによる菌群抽出方法。
【選択図】図１

【図1】