(58)【調査した分野】(Int.Cl.,DB名)
複数の被験者の各々を識別する識別子と、前記複数の被験者から抽出された全ての種類を含む細菌分類レベルにおける複数の腸内細菌の各々について、前記複数の被験者の各々毎に抽出された細菌分類レベルにおける全ての腸内細菌に対する比率を表す値と、前記複数の被験者の各々の属性を表す情報と、が対応付けられている腸内細菌叢データベースを用いて、クラスタ数を算出するクラスタ数算出工程と、
前記腸内細菌叢データベースが多次元尺度法によって分析された結果を、前記クラスタ数算出工程によって算出された前記クラスタ数のクラスタに分類し、前記クラスタ毎に含まれる腸内細菌叢の情報を有する被験者の年齢に基づいて、各クラスタに対してラベルを付与するラベル付与工程と、
前記複数の被験者から抽出された全ての種類を含む細菌分類レベルにおける複数の腸内細菌の各々について、対象者から抽出された細菌分類レベルにおける全ての腸内細菌に対する比率を表す値と、前記腸内細菌叢データベースと、を多次元尺度法によって分析することで、前記対象者の腸内状態を年齢に基づく2つ以上のタイプのいずれに属しているか判定する判定工程と、
を含み、
前記判定工程における前記2つ以上のタイプは、前記ラベル付与工程によって付与された前記ラベルである腸内状態の判定方法。
前記対象者の糞便から抽出した腸内細菌叢の情報に、前記複数の被験者から抽出されかつ前記複数の被験者からのみ抽出された前記腸内細菌叢の情報を付加し、前記付加した前記腸内細菌叢の情報に0%の構成割合を挿入する対象者情報更新工程と、をさらに含み、
前記判定工程では、
前記腸内細菌叢データベースに格納されている複数の前記被験者の前記腸内細菌叢の情報と、更新された前記対象者の前記腸内細菌叢の情報が統合され、前記統合された腸内細菌叢の情報が、多次元尺度法によって分析されることで、前記対象者の腸内状態が前記年齢に基づく2つ以上のタイプのいずれかに属しているか判定される、請求項1に記載の腸内状態の判定方法。
複数の被験者の各々を識別する識別子と、前記複数の被験者から抽出された全ての種類を含む細菌分類レベルにおける複数の腸内細菌の各々について、前記複数の被験者の各々毎に抽出された細菌分類レベルにおける全ての腸内細菌に対する比率を表す値と、前記複数の被験者の各々の属性を表す情報と、が対応付けられている腸内細菌叢データベースと、
前記腸内細菌叢データベースを用いて、クラスタ数を算出し、前記腸内細菌叢データベースが多次元尺度法によって分析された結果を、算出した前記クラスタ数のクラスタに分類し、前記クラスタ毎に含まれる腸内細菌叢の情報を有する被験者の年齢に基づいて、各クラスタに対してラベルを付与し、前記複数の被験者から抽出された全ての種類を含む細菌分類レベルにおける複数の腸内細菌の各々について、対象者から抽出された細菌分類レベルにおける全ての腸内細菌に対する比率を表す値と、前記腸内細菌叢データベースと、を多次元尺度法によって分析する解析部と、
前記解析部によって解析された結果に基づいて、前記対象者の腸内状態を年齢に基づく2つ以上のタイプのいずれかに分類する判定部と、
を備える腸内状態の判定装置。
【発明を実施するための形態】
【0020】
以下、図面を参照しながら本発明の実施形態について説明する。なお、本明細書、特許請求の範囲に記載される「判定」および「推定」の語句は、本開示においてほぼ同義のものであるとして用いられるものである。
【0021】
<腸内状態の判定装置1の構成>
まず、腸内状態の判定装置1の構成について説明する。
図1は、本実施形態に係る腸内状態の判定装置1のブロック図である。
図1に示すように、腸内状態の判定装置1は、腸内細菌抽出装置11、データベース生成部12、データベース13、解析部14、および判定部15を備える。
【0022】
腸内細菌抽出装置11は、被験者および対象者(subject)の試料から腸内細菌を抽出する。ここで、被験者とは、腸内細菌叢のデータベースを構築するために試料を提供した人である。また、対象者とは、腸内状態の推定が行われる人である。なお、データベース構築後、被験者が対象者であってもよい。抽出された抽出結果には、被験者または対象者を識別するための識別子と、抽出された細菌名と、各細菌の構成割合を示す情報とが含まれている。腸内細菌抽出装置11は、抽出した被験者または対象者の抽出結果を、データベース生成部12と解析部14に出力する。なお、腸内細菌の抽出方法については後述する。また、腸内細菌抽出装置11は、後述するように、複数の装置、および複数のアプリケーション等によって構成されていてもよい。
【0023】
データベース生成部12は、腸内細菌抽出装置11が出力した抽出結果に、入力された被験者の属性を対応付けて腸内細菌叢データベースを構築し、構築した腸内細菌叢データベースをデータベース13に格納する。ここで被験者の属性とは、被験者の年齢、性別、体重、身長、居住地、出身地、国籍等である。なお、以下の例では、被験者の属性として年齢の場合を説明する。また、属性は、被験者の年齢層であってもよい。ここで、年齢層とは、例えば0〜10歳、10〜19歳、・・・、90〜99歳、100歳以上等、所定の年齢の集合のうちの1つであってもよい。例えば、被験者の年齢が42歳の場合、属性は40〜49歳であってもよい。
【0024】
データベース13には、表1に示すように、被験者の識別子に、年齢(属性)と、腸内細菌叢の構成割合とが関連付けられて格納されている。なお、腸内細菌叢の構成割合とは、m(mは2以上の整数)人の被験者から抽出された全ての細菌の種類n(nは2以上の整数)において、被験者それぞれから抽出された腸内細菌それぞれの保有数の占有割合である。このため、他の被験者からのみ抽出された腸内細菌に対する割合は、0%となる。
【0026】
なお、表1における細菌の分類レベルは、門、綱、目、科、属、種等のうちの少なくとも1つのレベルである。例えば、識別子が“1”には、年齢(属性)が“離乳中”、第1細菌の構成比率が“0.057(%)”、第2細菌の構成比率が“1.23(%)”、・・・、第n細菌の構成比率が“0(%)”が関連付けられている。なお、データベース13に格納される被験者の年齢は、例えば離乳中(0歳)〜104歳において、年齢層毎に複数名の腸内細菌叢の情報(以下、腸内細菌叢情報という)が格納されている。なお、データベース13には、細菌の分類レベル毎の腸内細菌叢情報に基づく腸内細菌叢データベースが格納されていてもよい。
また、データベース13には、表2に示すように、クラスタ数としてPが格納され、表3に示すように、クラスタ毎のラベル名として第1ラベル名、・・・、第Pラベル名が格納されている。
【0029】
また、各年齢層の被験者の腸内細菌叢情報が、例えば30人分ずつデータベース13に格納されている。なお、クラスタ数、ラベル名については、後述する。
【0030】
解析部14は、データベース13に格納されているm人分の腸内細菌叢情報を読み出し、読み出した腸内細菌叢情報に対して、最適なクラスタ数を算出する。解析部14は、例えばCalinski−Harabasz基準を使用してCalinski−Harabasz (CH) Indexを算出する。解析部14は、算出した値のうち最も高い値をクラスタ数Pとして、データベース13に格納する。なお、解析部14は、Cubic Clustering Criterion、Dunn’s Index、DB’s Index、Pseudo T−square等の他の手法を用いて、最適なクラスタ数を算出するようにしてもよい。
【0031】
解析部14は、読み出した腸内細菌叢情報に対して、例えばR(version3.0.3)softwareのクラスターパッケージを用いて、主座標分析による分析処理を行う。なお、解析部14は、腸内細菌叢情報に対して、主成分分析、計量多次元尺度法、非計量多次元尺度法等の他の多次元尺度法によって分析を行うようにしてもよい。解析部14は、主座標分析を行った結果に基づいて、算出したクラスタ数Pのいずれかにm人を、最短距離法、最長距離法群平均法、ウォード法、K−means法等を用いて分類する。解析部14は、分類したクラスタ毎に含まれる年齢の構成に基づいて、クラスタ毎にクラスタ名を付与する。
解析部14は、腸内細菌抽出装置11が出力した対象者の腸内細菌叢情報と、データベース13に格納されているm人の腸内細菌叢情報とを統合し、統合した(m+1)人の腸内細菌叢情報に対して主座標分析を行う。解析部14は、解析した解析結果を判定部15に出力する。
【0032】
判定部15は、解析部14が出力した解析結果において、対象者の腸内細菌叢情報が、分類されたクラスタのいずれに属しているか判定する。判定部15は、判定した判定結果を、プリンタ、表示部(不図示)等に出力する。なお、腸内状態の判定装置1または外部装置は、判定結果に基づいて、対象者への健康に関するアドバイスや食事に関するアドバイス等を生成するようにしてもよい。この場合、腸内状態の判定装置1または外部装置には、実年齢と推定された年齢毎に、健康に関するアドバイスや食事に関するアドバイス等が対応付けられたデータベースが接続されていてもよい。
【0033】
<腸内状態の判定装置1が行う処理手順の概略>
次に、腸内状態の判定装置1が行う処理手順の概略について説明する。
図2は、本実施形態に係る腸内状態の判定装置1が行う処理のフローチャートである。
(ステップS1)腸内細菌抽出装置11は、複数の年齢層の被験者の試料それぞれから、腸内細菌の抽出処理を行う。
(ステップS2)データベース生成部12は、腸内細菌抽出装置11が抽出した抽出結果に、入力された被験者の属性を対応付けてデータベースの構築処理を行う。
【0034】
(ステップS3)解析部14は、データベース13から読み出したm人分の腸内細菌叢情報に対して最適なクラスタ数Pを算出し、算出したクラスタ数Pをデータベース13に格納する。
【0035】
(ステップS4)解析部14は、ステップS3で読み出したm人分の腸内細菌叢情報に対して等の多次元尺度法分析による分析処理を行って、クラスタ数Pのいずれかにm人を分類する。続けて、解析部14は、分類したクラスタ毎に含まれる年齢の構成または後述する年齢グループの割合に基づいて、クラスタ毎にクラスタ名を付与するラベリング処理を行う。続けて、解析部14は、付与したラベル名を、データベース13に格納する。
【0036】
(ステップS5)腸内細菌抽出装置11は、対象者の腸内細菌の抽出処理を行う。
(ステップS6)解析部14は、データベース13から読み出したm人分の腸内細菌叢情報に、腸内細菌抽出装置11が出力した対象者の細菌叢情報を統合する。続けて、解析部14は、(m+1)人分の腸内細菌叢情報に対して、主座標分析等の多次元尺度法分析による分析処理を行う。
【0037】
(ステップS7)判定部15は、解析部14によって解析された結果に基づいて、対象者の腸内細菌叢情報が、分類されたクラスタのいずれに属しているか判定することで、腸内状態の判定処理を行う。
なお、腸内状態の判定装置1は、対象者毎に、ステップS5〜S7の処理を繰り返す。
【0038】
以上のように、本実施形態では、特定の腸内細菌のみによって対象者の腸内状態を推定するのではなく、抽出された腸内細菌叢の構成割合に基づいて、対象者の腸内状態がいずれのクラスタに分類されるかを判定する。なお、本実施形態では、データベース13の構築後、対象者の腸内状態の判定毎に、最適なクラスタ数の再計算を行わないことが好ましい。さらに、本実施形態では、データベース13の構築後、対象者の腸内状態の判定毎に、各クラスタのラベル名を再付与しないことが好ましい。
【0039】
<腸内細菌叢データベースの構築>
次に、データベース生成部12が
図2のステップS2で行う腸内細菌叢データベースの構築方法の例について説明する。なお、データベース生成部12は、門、綱、目、科、属等のうちの少なくとも1つのレベルについて腸内細菌叢データベースを構築する。
図3は、本実施形態に係る腸内細菌叢データベースの構築手順の一例を表す図である。
(ステップS11)データベース生成部12は、全ての被験者の腸内細菌叢の構成割合を取得する。
図3の表h101は、第1の被験者の腸内細菌叢の構成割合であり、
図3の表h102は、第2の被験者の腸内細菌叢の構成割合であり、
図3の表h103は、第mの被験者の腸内細菌叢の構成割合である。ここで、腸内細菌叢の構成割合とは、1人の被験者において、腸内細菌の全てに対する腸内細菌それぞれの割合である。なお、抽出される腸内細菌、および腸内細菌の種類数は、被験者間で異なる場合がある。例えば、第1の被験者から第1〜第100の腸内細菌が検出され、第2の被験者から第1、3、・・、100、101、102の腸内細菌が抽出される場合がある。
【0040】
(ステップS12)データベース生成部12は、ステップS11で取得した全ての被験者の腸内細菌叢の構成割合の情報を用いて、被験者の総数mと、腸内細菌の種類の総数nとを抽出する。なお、抽出する細菌の種類の総数nは、細菌の各分類レベル(門、綱、目、科、属、種等)のうち少なくとも1つである。例えば、第1の被験者から抽出された腸内細菌の種類が、100種類であり、他の被験者から当該100種類とは異なる腸内細菌が80種類抽出された場合、腸内細菌の種類の総数nは、180種類となる。データベース生成部12は、抽出した被験者の総数mと、腸内細菌の種類の総数nとをデータベース13に格納する。
【0041】
(ステップS13)データベース生成部12は、ステップS12で抽出した被験者の総数、腸内細菌の種類の総数、およびステップS11で取得した全ての被験者の腸内細菌叢の構成割合の情報を用いて、
図3の表h111に示すようにm×nの構成データを構築する。m×nの構成データでは、
図3の表h111に示すように、他の被験者から抽出された腸内細菌の構成割合に0%をデータベース生成部12が挿入する。
【0042】
(ステップS14)データベース生成部12は、各被験者の年齢(属性)情報を取得する。
(ステップS15)データベース生成部12は、ステップS14で取得した年齢情報を、ステップS13で構築したm×nの構成データに対応付けて、
図3の表h121に示すようにm行×(n+1)列の腸内細菌叢データベースを構築する。
【0043】
<クラスタリング処理、ラベル処理>
次に、解析部14が、
図2のステップS3、S4で行うクラスタリング処理およびラベル処理の例について説明する。
図4は、本実施形態に係る解析部14が行うクラスタリング処理およびラベル処理手順の一例を表す図である。なお、データベース13には、m人分の腸内細菌叢情報(腸内細菌叢の細菌分類レベル(門、綱、目、科、属等のうちの少なくとも1つのレベル)での構成データ)が格納されているとする。
【0044】
(ステップS21)解析部14は、データベース13からm人分の腸内細菌叢情報を読み出す。
(ステップS22)解析部14は、読み出したm人分の腸内細菌叢情報に対して、最適なクラスタ数を算出するために、例えばCalinski−Harabasz基準を使用してCH Indexを算出する。続けて、解析部14は、算出した値のうち、最も高い値をクラスタ数Pとして、データベース13に格納する。なお、
図4は、最適なクラスタ数Pが3として算出された例である。
【0045】
(ステップS23)解析部14は、読み出した腸内細菌叢情報に対して、例えばR(version3.0.3)softwareのクラスターパッケージを用いて、主座標分析等の多次元尺度法で分析を行う。符号g1が示す図は、主座標分析を行った結果の図である。主座標分析を行う場合は、まず第1主座標と第2主座標を求め、求めた第1主座標と第2主座標を用いて分析を行う。また、主成分分析を行う場合は、まず第1主成分と第2主成分を求め、求めた第1主成分と第2主成分を用いて分析を行う。
【0046】
(ステップS24)解析部14は、多次元尺度法分析を行った結果を、ステップS22で算出したクラスタ数Pに、例えばウォード法によって分類する。符号g2が示す図は、主座標分析を行った結果に対して、3つのクラスタに分類した図である。
(ステップS25)解析部14は、腸内細菌叢情報データベースに含まれる被験者それぞれの年齢を示す情報を読み出す。解析部14は、読み出した年齢情報を、例えば表4に示したように、複数の年齢グループに分類する。続けて、解析部14は、ステップS24で分類されたクラスタ毎に含まれる被験者の年齢グループの割合を確認する。
【0048】
(ステップS26)解析部14は、クラスタ毎に含まれる年齢グループの割合に基づいて、クラスタ毎に、例えば表5(
図4の符号g6)に示すように、クラスタ名を付与する。なお、円グラフg3は、第1クラスタに分類された年齢グループぞれぞれの割合を表し、円グラフg4は、第2クラスタに分類された年齢グループぞれぞれの割合を表し、円グラフg5は、第3クラスタに分類された年齢グループぞれぞれの割合を表す。続けて、解析部14は、付与したクラスタ名をデータベース13に格納する。
【0050】
以上で、解析部14が行うクラスタリング処理およびラベル処理を終了する。
すなわち、本実施形態では、多次元尺度法で分析された結果を、最適なクラスタ数Pに分類し、分類したクラスタ毎に含まれている被験者の年齢(属性)の割合に基づいて、クラスタにラベルを付与している。このラベルは、対象者の腸内状態の判定結果にも用いられる。
【0051】
<主座標分析を行いクラスタに分類した結果の例>
次に、主座標分析を行いクラスタに分類した結果の一例を説明する。
図5は、本実施形態に係る主座標分析を行い3つのクラスタに分類した結果を示す図である。
図5において、横軸は、第1主座標、縦軸は、第2主座標である。また、
図5に示す例は、m=379人、年齢0歳〜104歳、細菌数が187種類の腸内細菌叢情報を主座標分析した結果である。また、
図5に示す例は、表4に示したように、離乳前、離乳中、離乳後〜9歳、10−19歳、20−29歳、30−39歳、40−49歳、50−59歳、60−69歳、70−79歳、80−89歳、90−99歳、および100歳以上の13の年齢グループに分けた例である。さらに、算出されたCH Indexの値のうち、最も高い値が3の例である。
【0052】
図5において円g101で囲んだ範囲は、第1クラスタに分類される被験者による腸内細菌叢情報を示し、円g102で囲んだ範囲は、第2クラスタに分類される被験者による腸内細菌叢情報を示し、円g103で囲んだ範囲は、第3クラスタに分類される被験者による腸内細菌叢情報を示している。また、白抜きの四角1〜四角3それぞれは、各クラスタの重心を表している。また、重心から各被験者の腸内細菌叢情報に接続されている線分は、各腸内細菌叢情報が、第1クラスタ〜第3クラスタのいずれのクラスタに属しているかを示している。
【0053】
<主成分分析結果の例>
次に、主成分分析を行いクラスタに分類した結果の一例を説明する。
図6は、本実施形態に係る主成分分析を行い3つのクラスタに分類した結果を示す図である。
図6において、横軸は、第1主成分、縦軸は、第2主成分である。分析に用いた腸内細菌叢情報は、
図5に示した主座標分析と同じである。
【0054】
図6において円g201で囲んだ範囲は、第1クラスタに分類される被験者による腸内細菌叢情報を示し、円g202で囲んだ範囲は、第2クラスタに分類される被験者による腸内細菌叢情報を示し、円g203で囲んだ範囲は、第3クラスタに分類される被験者による腸内細菌叢情報を示している。また、重心1〜重心3から各被験者の腸内細菌叢情報に接続されている線分は、
図5と同様である。
【0055】
<各クラスタに含まれる年齢層の例>
次に、
図5および
図6における各クラスタの年齢層の例について説明する。
図7は、
図5および
図6における各クラスタの年齢層の例を示す図である。
図7の円グラフg301は、第1クラスタの年齢層の割合を示し、円グラフg302は、第2クラスタの年齢層の割合を示し、円グラフg303は、第3クラスタの年齢層の割合を示す。
【0056】
円グラフg301が示すように、第1クラスタは、離乳前と離乳中と離乳後〜9歳の年齢の被験者の割合の合計が50%程度である。このため、解析部14は、第1クラスタに対して、エンテロタイプ(enterotype)として、“乳児”のラベル名を付与する。なお、エンテロタイプとは、ヒト腸内共生細菌叢のパターンであり、本実施形態では、ヒト腸内共生細菌叢のパターンに基づいて分類された年齢のタイプである。
【0057】
また、円グラフg302が示すように、第2クラスタは、10−19歳と20−29歳と30−39歳の年齢の被験者の割合の合計が50%程度である。このため、解析部14は、第2クラスタに対して“成人”のラベル名を付与する。
また、円グラフg303が示すように、第3クラスタは、80−89歳と90−99歳と100歳以上の年齢の被験者の割合の合計が2/3以上である。このため、解析部14は、第2クラスタに対して“高齢者”のラベル名を付与する。
なお、上述したラベル名は一例であり、これに限られない。各クラスタに含まれる年齢層に応じた名前であればよい。
【0058】
<年齢層における各クラスタの割合>
次に、
図5および
図6に示した分析結果における、年齢層における各クラスタの割合を説明する。
図8は、
図5および
図6に示した分析結果における、年齢層における各クラスタの割合を示す図である。
図8において、横軸は年齢層、縦軸は割合を表している。また、
図8において、長方形g401は“乳児”(第1クラスタ)を表し、長方形g402は“成人”(第2クラスタ)を表し、長方形g403は“高齢者”(第3クラスタ)を表す。
【0059】
図8において、例えば離乳中の年齢層の被験者では、約70%が“乳児”に分類され、約30%が高齢者”に分類される。
また、例えば80−89歳の年齢層の被験者では、約80%が“高齢者”に分類され、約16%が“成人”に分類され、約4%が“乳児”に分類される。
このように、多くの被験者は年齢相応のエンテロタイプに属しているが、離乳前にも関わらず成人エンテロタイプに属していたり、80歳代にも関わらず乳児エンテロタイプに属していたりする被験者がおり、必ずしも実年齢と腸内細菌叢の構成年齢が一致するわけではない。
【0060】
<対象者の腸内状態の判定>
次に、対象者の腸内状態の判定処理手順の例を説明する。
図9は、本実施形態に係る対象者の腸内状態の判定処理のフローチャートである。
(ステップS51)解析部14は、データベース13からm人分の腸内細菌叢情報を読み出す。
(ステップS52)解析部14は、データベース13からクラスタ数、クラスタ毎のラベル名を読み出す。
【0061】
(ステップS53)腸内細菌抽出装置11は、後述する処理(
図10のステップS101〜S116)によって対象者の糞便を解析して、対象者の腸内細菌叢情報を抽出する。続けて、解析部14は、腸内細菌抽出装置11が出力した対象者の腸内細菌叢情報を取得する。
【0062】
(ステップS54)解析部14は、取得した対象者の腸内細菌叢情報に対して、対象者から抽出されずに被験者からのみ抽出された腸内細菌の情報を追加し、対象者の腸内細菌叢情報を更新する。例えば、対象者から抽出された腸内細菌の種類数が、100種類の場合、腸内細菌抽出装置11が出力する対象者の腸内細菌叢情報は、
図9の符号g451のように、1行×100列の情報である。解析部14は、
図9の符号g452および符号g453に示すように、列情報へ87(=187−100)種類の腸内細菌の情報を追加する。さらに、解析部14は、符号g453に示すように、追加した腸内細菌の情報の構成割合(構成比率)それぞれに0%を挿入する。なお、解析部14は、腸内細菌叢データベースに格納されている細菌の分類レベルと同じ分類レベルで、対象者の腸内細菌叢情報を更新する。
【0063】
(ステップS55)解析部14は、読み出したm人分の腸内細菌叢情報と、ステップS54で更新した対象者の腸内細菌叢情報とを統合する。続けて、解析部14は、統合した(m+1)人分の腸内細菌叢情報に対して、例えばR softwareのクラスターパッケージを用いて、主座標分析等の多次元尺度法分析を行う。続けて、解析部14は、読み出したクラスタ数に腸内細菌叢情報を、例えばウォード法によって分類する。
【0064】
(ステップS56)判定部15は、対象者の腸内細菌叢の構成割合が、分類されたクラスのうち、いずれのクラスタに属するかを判定する。
(ステップS57)判定部15は、対象者の腸内細菌叢の構成割合が、どのクラスタに属しているかを判別する。判定部15は、対象者の腸内細菌叢の構成割合が、第1クラスタに属していると判別した場合(ステップS57;第1クラスタ)ステップS58に処理を進め、第2クラスタに属していると判別した場合(ステップS57;第2クラスタ)ステップS59に処理を進め、第3クラスタに属していると判別した場合(ステップS57;第3クラスタ)ステップS60に処理を進める。
【0065】
(ステップS58)判定部15は、対象者の腸内状態を、第1のラベル名、例えば“乳児”であると判定し、判定した判定結果を外部装置に出力する。判定部15は、判定結果を出力後、処理を終了する。
(ステップS59)判定部15は、対象者の腸内状態を、第2のラベル名、例えば“成人”であると判定し、判定した判定結果を外部装置に出力する。判定部15は、判定結果を出力後、処理を終了する。
(ステップS60)判定部15は、対象者の腸内状態を、第3のラベル名、例えば“高齢者”であると判定し、判定した判定結果を外部装置に出力する。判定部15は、判定結果を出力後、処理を終了する。なお、ステップS58〜S60に基づいて、外部装置は、例えば『あなたの腸内状態は“成人の腸内細菌の構成割合”に分類されました』等を、対象者に報知する。
以上で、対象者の被験者における腸内状態の判定処理を終了する。
【0066】
なお、上述した例では、対象者について、腸内状態を判定する例を説明したが、これに限られない。データベース構築後に、m人のうちの1人の被験者の腸内細菌叢情報を抽出し、抽出した被験者について腸内状態の判定を行ってもよい。
【0067】
また、データベース生成部12は、データベース13の構築後も対象者の腸内細菌叢情報と年齢とを対応付けてデータベース13に逐次格納していく。そして、解析部14は、データベース13の格納されている被験者および対象者の腸内細菌叢情報が、所定の人数を超えたときに、最適なクラスタ数の再計算し、各クラスタのラベル名を再付与するようにしてもよい。
【0068】
<腸内細菌の抽出方法>
次に、腸内細菌抽出装置11が行う腸内細菌の抽出方法の一例について説明する。
図10は、本実施形態に係る腸内細菌抽出装置11が行う腸内細菌の抽出処理のフローチャートである。
【0069】
(ステップS101)腸内細菌抽出装置11は、被験者毎または対象者毎に、糞便20mg程度を測りとり、450ulの抽出液(100mM Tris/HCl、4mM EDTA、pH9.0)に懸濁する。
(ステップS102)腸内細菌抽出装置11は、ステップS101で懸濁した抽出液に、10%SDS溶液50ul、0.1mm径のガラスビーズ300mg、500ulのTE飽和フェノール(例えば和光純薬)を混合し、例えばFastPrep FP 100A(フナコシ社製)にてパワーレベル5、30秒の破砕処理を行う。
【0070】
(ステップS103)腸内細菌抽出装置11は、ステップS102で破砕処理を行った溶液に対して、14,000gで5分間遠心後400ulの上清を取得する。続けて、腸内細菌抽出装置11は、取得した上清に、250ulのフェノール・クロロホルム溶液(例えば和光純薬)を加えて混合し、14,000gで5分間遠心後250ulの上清を取得した。
【0071】
(ステップS104)腸内細菌抽出装置11は、ステップS103で取得した上清に、2−プロパノールを250ul加え、イソプロパノール沈殿させたものを200ulのTris−EDTAバッファー(pH8.0)で溶解し、DNA溶液を生成する。
【0072】
(ステップS105)腸内細菌抽出装置11は、細菌の16S rRNA遺伝子の第3〜4可変領域を増幅させるための1stプライマーセットであるTru357F[(5’−CGCTCTTCCGATCTCTGTACGGRAGGCAGCAG−3’(配列番号1))とTru806R[5’−CGCTCTTCCGATCTGACGGACTACHVGGGTWTCTAAT−3’(配列番号2)]と、例えば次世代シーケンサーMiseq(イルミナ社製)にて解析するために必要な2ndプライマーセットであるFwd [5’−X1NNNNNNNN−X2−3’]およびRev [5’−X3−NNNNNNNN−X4−3’]を設計し、例えばLife Technologies社のオリゴプライマー作成サービスによりプライマーを合成する。
なお、X1、X2、X3、X4、Nは以下の配列を表す。
X1: AATGATACGGCGACCACCGAGATCTACAC(配列番号3)
X2:ACACTCTTTCCCTACACGACGCTCTTCCGATCTCTG(配列番号4)
X3:CAAGCAGAAGACGGCATACGAGAT(配列番号5)
X4:GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAC(配列番号6)
Nは、任意の塩基からなるn人の被験者を識別するための塩基配列
【0073】
(ステップS106)腸内細菌抽出装置11は、鋳型DNA溶液および1stプライマーセットを含む総液量を25μlとした反応液を、例えばTaKaRa Ex Taq HS kit (タカラバイオ社製)を用いて調製する。続けて、腸内細菌抽出装置11は、例えばVeriti 200(Life Technologies社製)により、例えば94℃3分の後、94℃30秒、50℃30秒、72℃30秒を20回、72℃10分のPCR(Polymerase Chain Reaction)反応処理を行う。
【0074】
(ステップS107)腸内細菌抽出装置11は、ステップS106によって得られたPCR産物を1%アガロースゲルにて電気泳動し、バンドパターンを確認する。
(ステップS108)腸内細菌抽出装置11は、ステップS106によって得られたPCR産物1ulを鋳型とし、2ndプライマーセットを用いて上述した条件と同様にPCR反応処理を行う。ただし、PCRのサイクル数は、20回ではなく8回である。
【0075】
(ステップS109)腸内細菌抽出装置11は、ステップS108によって得られたPCR産物を1%アガロースゲルにて電気泳動し、バンドパターンを確認する。
(ステップS110)腸内細菌抽出装置11は、ステップS109の処理後、例えばQIAquick 96 PCR Purification Kit(キアゲン社製)にて精製を行い、例えばQuant−iT PicoGreen dsDNA Assay kit(Life Technologies社製)にて濃度を測定する。続けて、腸内細菌抽出装置11は、同濃度のDNA溶液を混合したものを、例えばMiseq v3 Reagent kit(イルミナ社製)に供し、Miseqにてシークエンス解析を実施する。
【0076】
(ステップS111)腸内細菌抽出装置11は、ステップS110によって得られたfastqファイルからPhix(シークエンス時のコントロール配列)およびヒトゲノム配列を除去する。
(ステップS112)腸内細菌抽出装置11は、ステップS111の処理後、塩基配列3’側からQ17以下の塩基を除去する。
【0077】
(ステップS113)腸内細菌抽出装置11は、ステップS112の処理後、150bp以下になったリードを除去する。続けて、腸内細菌抽出装置11は、全体でQ25以下のリード、ペアになっていないリードを除去する。
(ステップS114)腸内細菌抽出装置11は、ステップS113の処理後、得られたペアエンド配列を、例えばfastq−join(version.1.1.2−301)(http://code.google.com/p/ea−utils/wiki/FastqJoin)によって接続する。
【0078】
(ステップS115)腸内細菌抽出装置11は、ステップS114の処理後、例えばUCHIMEにてキメラ配列を除去する。
(ステップS116)最終的に、例えばサンプル当たり4,979±1,800の配列が得られ、腸内細菌抽出装置11は、これらを例えばQIIME software(version 1.8.0)(http://qiime.org/)にて97%の相同性を有する配列ごとをOTU(Operational Taxonomy Unit)とする。続けて、腸内細菌抽出装置11は、各OTUの代表配列を例えばGreengenes database 12_10(http://greengenes.secondgenome.com/downloads/database/12_10)に対して、例えばブラスト(BLAST;Basic Local Alignment Search Tool)を用いて検索することで腸内細菌叢の細菌分類レベル(門、綱、目、科、属、種等)での構成データを生成する。なお、構成データは、m人から検出された腸内細菌の種類がoの場合、m行×o列のテーブルとなる。また、BLASTとは、例えば所定の閾値以上のスコアで類似するシークエンス群を見つけるためのアルゴリズム、またそのアルゴリズムを実装したプログラムである。続けて、データベース生成部12は、腸内細菌抽出装置11によって生成された腸内細菌叢の細菌分類レベルでの構成データに、被験者の年齢を対応付けてデータベース13に格納する。
【0079】
以上で、腸内細菌の抽出処理手順を終了する。なお、上述した腸内細菌の抽出処理の手順、用いる溶液、用いる溶液の容量、用いるアプリケーション等は一例であり、これに限られない。
【0080】
[第1の試験例]
次に、第1の試験例について説明する。
(手順1)腸内細菌抽出装置11は、データベース用の379人の被験者の糞便を用いて、
図10に示したステップS101〜S116の処理によって腸内細菌叢の細菌分類レベルでの構成データを生成する。続けて、データベース生成部12は、腸内細菌抽出装置11によって生成された腸内細菌叢の細菌分類レベルでの構成データに、379人の被験者それぞれの年齢を対応付けてデータベース13に格納する。すなわち、データベース13には、379(被験者数)行×187(細菌の種類数)列の構成データに、識別子と年齢とが対応つけられて格納されている。なお、379人の被験者から抽出された腸内細菌は、表6〜表15の第1列に示す細菌であった。表6〜表15に示すように、抽出された腸内細菌のレベルは、属レベルである。なお、表6〜表15において、“[…]”は、現在は分類が不明瞭のため、かつて使われていた名称を表している。また、“gen.”は、属レベルの分類が不明または未同定であることを表し、“fan.”は、科レベルの分類が不明または未同定であることを表し、“ord.”は、目レベルの分類が不明または未同定であることを表している。
【0091】
(手順2)解析部14は、手順1によって構築された腸内細菌叢データベースに対して、CH Indexを算出することで最適なクラスタ数が3であると算出する。続けて、解析部14は、手順1によって構築された腸内細菌叢データベースに対して、R softwareのクラスターパッケージを用いて主座標分析を行い、3つのクラスタに分類する。続けて、解析部14は、3つのクラスタに含まれる被験者の年齢に基づいて、3つのクラスタそれぞれに、“乳児”、“成人”、および“高齢者”のラベル名を付与する。
【0092】
(手順3)腸内細菌抽出装置11は、40歳男性の対象者の糞便を用いて、
図10に示したステップS101〜S116の処理によって腸内細菌叢を抽出する。次に、解析部14は、取得した対象者の腸内細菌叢情報に対して、対象者から抽出されずに被験者からのみ抽出された腸内細菌の情報を追加し、対象者の腸内細菌叢情報を更新する。さらに、解析部14は、
図9の符号g453に示すように、追加した腸内細菌の情報の構成割合(構成比率)それぞれに0%を挿入する。表6〜表15の第2列に、抽出された腸内細菌および被験者のみから抽出された腸内細菌の構成割合を示す。更新後に得られるデータは、1行×187列の構築データである。
【0093】
(手順4)解析部14は、手順3によって得られた1行×187列の構築データと、手順1によって構築された379行×187列の構成データとを統合して、380行×187列の構成データを生成する。続けて、解析部14は、生成した380行×187列の構成データに対して、R softwareのクラスターパッケージを用いて主座標分析を行う。このとき、解析部14は、最適なクラスタ数の再計算を行わないことが好ましい。すなわち、クラスタ数は3のままで良いものである。
【0094】
(手順5)判定部15は、手順4によって解析された結果、40歳男性の対象者が、
図11に示すように、“成人”のエンテロタイプに属していると判定する。なお、どのクラスタに属しているかの判定は、解析部14による主座標分析後、クラスタ分類への処理によって行われる。
図11は、第1の試験例における40歳男性の対象者を含む380人分の腸内細菌叢を主座標分析した結果を示す図である。
図11において、横軸と縦軸は、
図5と同じである。また、円g501は“乳児”のクラスタ(エンテロタイプ)であり、円g502は“成人”のクラスタ(エンテロタイプ)であり、円g503は“高齢者”のクラスタ(エンテロタイプ)である。また、×印g511は、40歳男性の対象者の腸内細菌叢を表している。
【0095】
[第2の試験例]
次に、第2の試験例について説明する。
なお、第1の試験例の手順1によって、データベースの構築が終了、すなわち、379行×187列の構成データに、識別子と年齢とが対応つけられてデータベース13に格納されている。また、第1の試験例の手順2によって、最適なクラスタ数が3として算出されている。
【0096】
(手順2’)解析部14は、手順1によって構築されたデータベースに対して、R softwareのクラスターパッケージを用いて主成分分析を行い、3つのクラスタに分類する。続けて、解析部14は、3つのクラスタに含まれる被験者の年齢に基づいて、3つのクラスタそれぞれに、“乳児”、“成人”、および“高齢者”のラベル名を付与する。
【0097】
(手順3’)腸内細菌抽出装置11は、第1の試験例の手順3と同様の処理を行い、対象者の1行×187列の構成データを生成する。
【0098】
(手順4’)解析部14は、手順3’によって得られた対象者の1行×187列の構築データと、第1の試験例の手順1によって構築された被験者の379行×187列の構成データとを統合して、380行×187列の構成データを生成する。続けて、解析部14は、生成した380行×187列の構成データに対して、R softwareのクラスターパッケージを用いて主成分分析を行う。このとき、解析部14は、最適なクラスタ数の再計算を行わないことが好ましい。すなわち、クラスタ数は3のままで良いものである。
【0099】
(手順5’)判定部15は、手順4’によって解析された結果、40歳男性の対象者が、
図12に示すように、“成人”のエンテロタイプに属していると判定する。
図12は、第2の試験例における40歳男性の対象者を含む380人分の腸内細菌叢を主成分分析した結果を示す図である。
図12において、横軸と縦軸は、
図6と同じである。また、円g601は“乳児”のクラスタ(エンテロタイプ)であり、円g602は“成人”のクラスタ(エンテロタイプ)であり、円g603は“高齢者”のクラスタ(エンテロタイプ)である。また、星印g611は、40歳男性の対象者の腸内細菌叢を表している。
【0100】
図11および
図12に示したように、40歳男性の被験者の腸内状態は、主座標分析であっても主成分分析であっても、“成人”のエンテロタイプに属していると判定された。
【0101】
なお、上述した例において、属性として年齢の例を用いた例を説明したが、これに限られない。属性は、性別、体重、身長、居住地、出身地、国籍等であってもよい。また、腸内細菌叢に対応付けられている属性は、複数(例えば、年齢と国籍)であってもよい。例えば、属性が体重の場合、体重をいくつかのグループ(例えば10kg未満、10−19kg、20−29kg、・・・、90−99kg、100kg以上)に分類し、クラスタリングした結果に含まれる体重のグループに基づいてラベリングを行うようにしてもよい。
また、データベース13に格納される情報は、例えば国籍毎、地域毎等の複数のデータであってもよい。
【0102】
以上のように、本実施形態の腸内状態の判定方法は、腸内状態の判定装置1が、複数の被験者の各々を識別する識別子と、複数の被験者から抽出された全ての種類を含む細菌分類レベル(例えば、門、綱、目、科、属、種等)における複数の腸内細菌の各々について、複数の被験者の各々毎に抽出された細菌分類レベルにおける全ての腸内細菌(分類レベルが属レベルの場合、例えば、メタノブレウィバクテル属、アクチノマイセス属、・・・)に対する比率を表す値と、複数の被験者の各々の属性(例えば、年齢、性別、体重、身長、居住地、出身地、国籍等)を表す情報と、が対応付けられている腸内細菌叢データベース(データベース13)と、複数の被験者から抽出された全ての種類を含む細菌分類レベルにおける複数の腸内細菌の各々について、対象者から抽出された細菌分類レベルにおける全ての腸内細菌に対する比率を表す値(例えば、1行×187列の構成データ)と、を多次元尺度法(例えば、主座標分析、主成分分析)によって分析する(
図2のステップS6)ことで、対象者の腸内状態を属性に基づく2つ以上のタイプ(例えば、乳児、成人、高齢者)のいずれに属しているか判定する判定工程(
図2のステップS7)、を含む。
【0103】
これにより、本実施形態では、データベース13に格納されている複数の腸内細菌によって構成される腸内細菌叢情報を多次元尺度法によって分析した結果を用いて、対象者の腸内細菌叢の情報を、属性に基づくタイプに分類する。この結果、本実施形態によれば、対象者の腸内状態を2つ以上のタイプに分類することができる。
【0104】
また、本実施形態の腸内状態の判定方法において、腸内状態の判定装置1が、腸内細菌叢データベース(データベース13)を用いて、クラスタ数を算出するクラスタ数算出工程(
図2のステップS3)と、腸内細菌叢データベースが多次元尺度法(例えば、主座標分析、主成分分析)によって分析された結果を、クラスタ数算出工程によって算出されたクラスタ数のクラスタに分類し、クラスタ毎に含まれる腸内細菌叢の情報を有する被験者の属性(例えば、年齢、性別、体重、身長、居住地、出身地、国籍等)に基づいて、各クラスタに対してラベル(例えば、乳児、成人、高齢者)を付与するラベル付与工程(
図2のステップS4)と、をさらに含み、判定工程における2つ以上のタイプは、ラベル付与工程によって付与されたラベルである。
なお、腸内細菌叢とは、細菌分類レベルにおける腸内細菌(例えば、メタノブレウィバクテル属、アクチノマイセス属、・・・)の集合である。
【0105】
これにより、本実施形態では、予め算出したクラスタのいずれかのタイプに対象者の腸内状態を分類することができる。
【0106】
また、本実施形態の腸内状態の判定方法において、対象者の糞便から抽出した腸内細菌叢の情報に、前記複数の被験者から抽出されかつ前記複数の被験者からのみ抽出された前記腸内細菌叢の情報を付加し、前記付加した前記腸内細菌叢の情報に0%の構成割合を挿入する対象者情報更新工程(
図9のステップS54)と、をさらに含み、判定工程では、腸内細菌叢データベース(データベース13)に格納されている複数の被験者の腸内細菌叢の情報と、更新された対象者の腸内細菌叢の情報が統合され、統合された腸内細菌叢の情報が、多次元尺度法(例えば、主座標分析、主成分分析)によって分析されることで、対象者の腸内状態が属性に基づく2つ以上のタイプ(例えば、乳児、成人、高齢者)のいずれかに属しているか判定される。
【0107】
これにより、本実施形態では、複数の被験者の腸内細菌叢の構成割合によって構成される構成データと、対象者の腸内細菌叢の構成割合によって構成される構成データと、の列を揃えることができるので、2つの構成データを統合して多次元尺度法を行うことができる。この結果、本実施形態によれば、対象者の腸内細菌叢の構成割合である腸内状態を、複数の被験者の腸内細菌叢の構成割合に基づいて判定することができる。
【0108】
また、本実施形態の腸内状態の判定方法において、属性は年齢であり、腸内細菌叢データベース(データベース13)に含まれる複数(m人)の被験者の年齢を、複数の年齢グループに分類する年齢分類工程(
図4のステップS25)、をさらに含み、ラベル付与工程は、クラスタ毎に含まれる腸内細菌叢の情報を有する被験者の年齢グループに基づいて、各クラスタに対してラベルを予め付与する。
【0109】
これにより、本実施形態では、年齢グループに基づいて付与されたラベルを有するクラスタに、対象者の腸内状態を分類することができる。これにより、判定結果が年齢グループに基づいた名称であるため、判定結果を受け取る対象者が判定結果を理解しやすくなる。
【0110】
また、本実施形態の腸内状態の判定方法において、多次元尺度法は、主座標分析または主成分分析である。
また、本実施形態の腸内状態の判定方法において、複数の被験者は、離乳前から104歳までの年齢グループの各々について複数の被験者を含む。
【0111】
これにより、本実施形態では、対象者の腸内状態を、データベース13に格納されている腸内細菌叢情報を主座標分析、主成分分析によって分析し、クラスタリングされたクラスタに含まれる年齢に基づいて、2つ以上のタイプのいずれかに分類することができる。この結果、本実施形態では、年齢に応じてラベルが付与されたいずれかのタイプに対象者の腸内状態を分類することができる。
【0112】
また、本実施形態の腸内状態の判定方法において、腸内細菌叢データベースは、被験者から抽出された全ての腸内細菌に対する被験者から抽出された腸内細菌の各々の比率を被験者毎に取得する取得工程と、取得工程によって取得された被験者毎の腸内細菌の各々の比率を用いて、被験者の総数m(mは2以上の整数)と、複数の被験者から抽出された全ての種類を含む細菌分類レベルにおける複数の腸内細菌の種類の総数n(nは2以上の整数)とを抽出する抽出工程と、抽出工程によって抽出された被験者の総数mと、複数の腸内細菌の種類の総数nと、複数の被験者の各々毎に抽出された細菌分類レベルにおける全ての腸内細菌に対する比率を表す値と、を用いて、m行×n行の構成データを構築する構成データ構築工程と、複数の被験者の各々の年齢を示す情報を取得し、取得した被験者毎の年齢を示す情報を、構成データ構築工程で構築された構成データに対応付けて腸内細菌叢データベースを構築するデータベース構築工程、によって構築されたものである。
【0113】
これにより、本実施形態では、被験者または対象者以外から抽出された腸内細菌を用いて、腸内細菌叢データベースを構築することができる。この結果、本実施形態では、このように構築された腸内細菌叢データベースと、対象者の腸内細菌叢情報とを、多次元尺度法で分析することで、対象者の腸内状態を精度良く推定することができる。
【0114】
なお、上述した例では、腸内状態の判定装置1が、ヒトの腸内状態を腸内年齢として推定する例を説明するがこれに限られない。腸内状態の判定装置1は、動物の腸内状態を腸内年齢として推定するようにしてもよい。
【0115】
また、本実施形態の腸内状態の判定装置1の一部または全てを、CPU(中央演算装置)、DSP(デジタルシグナルプロセッサ)、コンピュータが、インストールされたアプリケーションによって行うようにしてもよい。