IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社サイキンソーの特許一覧

特開2023-18541情報処理システム、情報処理方法、及びプログラム
<>
  • 特開-情報処理システム、情報処理方法、及びプログラム 図1
  • 特開-情報処理システム、情報処理方法、及びプログラム 図2
  • 特開-情報処理システム、情報処理方法、及びプログラム 図3
  • 特開-情報処理システム、情報処理方法、及びプログラム 図4
  • 特開-情報処理システム、情報処理方法、及びプログラム 図5
  • 特開-情報処理システム、情報処理方法、及びプログラム 図6
  • 特開-情報処理システム、情報処理方法、及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023018541
(43)【公開日】2023-02-08
(54)【発明の名称】情報処理システム、情報処理方法、及びプログラム
(51)【国際特許分類】
   G16H 10/00 20180101AFI20230201BHJP
【FI】
G16H10/00
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021122746
(22)【出願日】2021-07-27
(71)【出願人】
【識別番号】515099908
【氏名又は名称】株式会社サイキンソー
(74)【代理人】
【識別番号】100126000
【弁理士】
【氏名又は名称】岩池 満
(74)【代理人】
【識別番号】100154748
【弁理士】
【氏名又は名称】菅沼 和弘
(72)【発明者】
【氏名】栗山 実
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA15
(57)【要約】      (修正有)
【課題】ヒト常在細菌の状態に基づいて、ユーザの健康状態を改善する改善アドバイスの導出の精度を向上させる情報処理システム、情報処理方法及びプログラムを提供する。
【解決手段】情報処理システムにおいて、情報処理装置は、複数の対象者の夫々について、2以上のヒト微生物種に関する情報を少なくとも含む単位データが時間方向に2以上配列されて構成される時系列情報が予め取得されている状態で、複数の対象者の夫々の時系列情報により得られる、複数の対象者の単位データの夫々の遷移の頻度に基づいて、複数の対象者の単位データを、複数のクラスタにクラスタリングするクラスタリング部を備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数の対象者の夫々について、2以上のヒト微生物種に関する情報を少なくとも含む単位データが時間方向に2以上配列されて構成される時系列情報が予め取得されている状態で、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度に基づいて、前記複数の対象者の前記単位データを、複数のクラスタにクラスタリングするクラスタリング手段
を備える情報処理システム。
【請求項2】
前記クラスタリング手段は、
前記複数の対象者の前記単位データをM個(Mは3以上の整数値)の第1クラスタにクラスタリングする第1クラスタリング手段と、
所定の関係にある前記M個の第1クラスタの群に基づいて、L個(LはM未満の正の整数値)の第2クラスタにクラスタリングする第2クラスタリング手段と、
を含む請求項1に記載の情報処理システム。
【請求項3】
前記第1クラスタリング手段は、
前記ヒト微生物種の類似度に基づいてクラスタリングし、
前記第2クラスタリング手段は、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度の関係を前記所定の関係として、第2クラスタを生成する、
請求項2に記載の情報処理システム。
【請求項4】
前記複数の対象者の単位データの夫々について、さらに、健康状態及び生活習慣に関するデータを少なくとも含むデータが、アンケートデータとして予め取得されている状態で、
前記アンケートデータの集計を行い、当該集計の結果に基づいて、前記L個の第2クラスタの夫々の範囲内における改善アドバイスを算出する改善アドバイス算出手段、
をさらに備える請求項1乃至3のいずれか1項に記載の情報処理システム。
【請求項5】
評価対象のユーザの前記単位データをユーザデータとして取得する取得手段と、
前記L個の第2クラスタのうち前記ユーザデータが所属する第2クラスタを所属クラスタとして判定する第2クラスタ判定手段と、
前記改善アドバイス算出手段により算出された前記改善アドバイスのうち、前記第2クラスタ判定手段により判定された前記所属クラスタの範囲内における前記改善アドバイスを少なくとも含む改善アドバイスを生成する改善アドバイス生成手段と、
をさらに備える請求項4に記載の情報処理システム。
【請求項6】
複数の対象者の夫々について、2以上のヒト微生物種に関する情報を少なくとも含む単位データが時間方向に2以上配列されて構成される時系列情報が予め取得されている状態で、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度に基づいて、前記複数の対象者の前記単位データを、複数のクラスタにクラスタリングするクラスタリングステップ
を含む情報処理方法。
【請求項7】
コンピュータに、
複数の対象者の夫々について、2以上のヒト微生物種に関する情報を少なくとも含む単位データが時間方向に2以上配列されて構成される時系列情報が予め取得されている状態で、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度に基づいて、前記複数の対象者の前記単位データを、複数のクラスタにクラスタリングするクラスタリングステップ
を含む制御処理を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
従来より、対象者の健康状態を把握するため、当該対象者のヒト常在細菌を調べることが行われている。
例えば、特許文献1には、対象者の腸内常在細菌を調べ、予め設定された腸内在細菌と食生活の相関関係等に基づいて食生活の改善案を提案する技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2012-165716号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述の特許文献1に記載の技術を含め従来技術のみでは、対象者の健康状態を正確に把握できるとは限らない。
即ち例えば、人の体内においては、多数且つ多種のヒト常在細菌種が全体として機能を発揮しているため、健康的なヒト常在細菌種、不調のヒト常在細菌種、というように単一のヒト常在細菌種の多寡のみをもって、対象者の健康状態を正確に把握することは困難である。換言すれば、対象者の体内に存在する複数のヒト常在細菌種及びそのヒト常在細菌種毎の数のパターン(組み合わせ)を考慮することが必要である。
また、従来多くの事例では、より良い健康状態になるためには、誰もに共通して増やすべき菌種や減らすべき菌種があるとの前提のもとに生活習慣の改善アドバイスが提供されてきた。しかしながら、複数の対象者の夫々において細菌叢のパターンは異なっており、夫々の対象者の細菌叢のパターンは日常的に変動しているが、その変動し得る範囲もまた対象者の夫々で異なっているため、万人共通の理想の細菌叢パターンへの遷移を目指す改善アドバイスは、夫々の対象者について有効性もまちまちとなる可能性があった。
本願発明は、このような状況に鑑みてなされたものであり、対象者のヒト常在細菌種に基づく健康状態の把握や生活習慣の改善のアドバイスの精度を向上させることを目的とする。
【0005】
本発明は、ヒト常在細菌の状態に基づいて、ユーザの健康状態を改善し得る改善アドバイスの導出の精度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様の情報処理システムは、
複数の対象者の夫々について、2以上のヒト微生物種に関する情報を少なくとも含む単位データが時間方向に2以上配列されて構成される時系列情報が予め取得されている状態で、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度に基づいて、前記複数の対象者の前記単位データを、複数のクラスタにクラスタリングするクラスタリング手段
を備える情報処理システム。
【0007】
本発明の一態様の上記情報処理システムに対応する情報処理方法及びプログラムも、本発明の一態様の情報処理方法及びプログラムとして提供される。
【発明の効果】
【0008】
本発明によれば、ヒト常在細菌の状態に基づいて、対象者の健康状態を改善し得る改善アドバイスの導出の精度を向上させる技術を提供することができる。
【図面の簡単な説明】
【0009】
図1】本発明の情報処理システムの一実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
図2図1の情報処理装置の機能的構成例の一例を示す機能ブロック図である。
図3図2の情報処理装置が実行する学習処理の流れの一例を説明する模式図である。
図4図2の機能的構成を有する情報処理装置による菌叢類似度クラスタリングの結果の一例を示す図である。
図5図2の機能的構成を有する情報処理装置による時系列クラスタリングの結果の一例を示す図である。
図6図2の情報処理装置が実行する評価処理の流れの一例を説明するフローチャートである。
図7図6の改善アドバイス生成処理により生成された改善アドバイスを含む評価結果の例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の実施形態について、図面を用いて説明する。
図1は、本発明の情報処理システムの一実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
【0011】
情報処理装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、入力部16と、出力部17と、記憶部18と、通信部19と、ドライブ20とを備えている。
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0012】
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、入力部16、出力部17、記憶部18、通信部19、及びドライブ20が接続されている。
入力部16は、キーボードやマウス等で構成され、ユーザの指示操作に応じて各種情報を入力する。
出力部17は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部18は、ハードディスク等で構成され、各種情報のデータを記憶する。
【0013】
通信部19は、ネットワークを介して他の端末(図示せず)との間で行う通信を制御すると共にドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31が適宜装着される。ドライブ20によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア31は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
【0014】
図2は、図1の情報処理装置の機能的構成例の一例を示す機能ブロック図である。
ここで、本実施形態において、情報処理装置1は、学習処理と評価処理の2つの処理を実行することができる。
詳しくは後述するが、学習処理とは、ヒト常在細菌データ等を学習データとして、ヒト常在細菌データの類似度及びヒト常在細菌データの遷移頻度を考慮したクラスタリングの学習を行う一連の処理をいう。また、学習処理においては、このようなクラスタ内における改善アドバイスが算出される。
また、評価処理とは、学習処理の結果得られたモデルを用いて、評価対象のユーザのヒト常在細菌データ等を評価データとして、その評価対象のユーザのヒト常在細菌データの属するクラスタやその評価対象のユーザに対する改善アドバイスを出力する一連の処理をいう。
なお、ヒト常在細菌データの遷移頻度の概念の詳細については後述する。
【0015】
情報処理装置1のCPU11においては、学習処理時には学習部111が機能し、評価処理時には評価部112が機能する。
また、記憶部18の一領域には、学習用DB200と、菌叢類似度モデルDB300と、遷移頻度モデルDB400と、改善アドバイスDB500が設けられる。
【0016】
学習部111においては、学習データ管理部121と、クラスタリング部122と、改善アドバイス算出部123と、が機能する。
【0017】
学習データ管理部121は、学習処理に用いられる学習データを取得し、適宜加工の上、学習用DB200に格納して管理する。
学習データ管理部121においては、学習用ユーザ情報取得部131と、時系列情報収集部132と、前処理部133と、学習用データ統合管理部134と、が機能する。
【0018】
学習用ユーザ情報取得部131は、N人(Nは2以上の整数値)の対象者の夫々について、ヒト常在細菌データ及びアンケートデータを、学習用ユーザ情報として取得する。
【0019】
時系列情報収集部132は、N人の対象者の夫々について、対象者毎のヒト常在細菌データ及びアンケートデータの時系列情報を収集する。
【0020】
ここで、ヒト常在細菌データとは、2種類以上のヒト常在細菌種に関する情報を少なくとも含むデータである。例えば、叢便から採取された複数種類のヒト常在細菌種について、夫々の存在する量を示すデータが、ヒト常在細菌データの一例である。
【0021】
ここで、「ヒト常在細菌」とは、主に、ヒトの身体に一過性でなく常に存在する細菌である。例えば、いわゆる腸内細菌は、ヒト常在細菌の一例である。また、所定の分類の結果えられる、所定の種のヒト常在細菌を「ヒト常在細菌種」と呼ぶ。
なお、夫々のヒト常在細菌種が存在する量には、「0」、即ち、その種のヒト常在細菌が全く存在しない場合やあらゆる種類のヒト常在細菌種が全く存在しない場合も含まれてよい。
【0022】
ここで、ヒト常在細菌データは、本実施形態では、学習処理の対象となるN人の対象者や評価処理の対象となるユーザから得られた各回の菌叢サンプルデータをいう。
即ち、ヒト常在細菌データ(菌叢サンプルデータ)とは、1回の生体試料採取(サンプリング)とその解析により得られた、1回分のヒト常在細菌に関する情報を含むデータある。
具体的には例えば、ヒト常在細菌データには、複数のヒト常在細菌種の夫々の菌種や系統、その比率等が含まれる。
学習用ユーザ情報取得部131は、N人の対象者の夫々について、1回の生体試料採取(サンプリング)が行われる毎に、その回のヒト常在細菌データを単位データとして取得する。
【0023】
また、アンケートデータとは、N人の対象者の夫々について、健康状態及び生活習慣に関する情報を少なくとも含むデータである。例えば、ヒト常在細菌データを提供したN人の対象者の夫々に対して、年齢、性別、アカウント情報、BMI(Body Mass Index)の他、健康状態、排便、飲食、生活習慣、精神面、体型等についての質問が行われた結果(回答)の情報が、アンケートデータとして収集される。
本実施形態では、所定の対象者について1回の生体試料採取(サンプリング)が行われる毎に、学習用ユーザ情報取得部131は、その所定の対象者についてのアンケートデータを取得する。
【0024】
ここで、N人の対象者の夫々には、個別のIDが付されている。ヒト常在細菌データ及びアンケートデータにおいても、N人の対象者の夫々のIDが対応付けられている。つまり、IDが同一のヒト常在細菌データとアンケートデータは、同一の対象者のデータである。
【0025】
N人の対象者の夫々について、このような生体試料採取(サンプリング)は、時間間隔をあけて、2回以上繰り返して実行される。
【0026】
そこで、時系列情報収集部132は、N人の対象者の夫々について、生体試料採取(サンプリング)が行われる毎に学習用ユーザ情報取得部131により取得されたヒト常在細菌データ(単位データ)が時間方向に2個以上配列されて構成される情報を、ヒト常在細菌データの時系列情報として取得する。
具体的には例えば、所定の対象者について、1か月あたり1回の生体試料採取とその解析が継続して行われるものとすると、各回のヒト常在細菌データ(単位データ)が時間方向に継続された回数分の個数だけ配列されて構成された情報が、当該所定の対象者についてのヒト常在細菌データの時系列情報として得られる。
【0027】
また、時系列情報収集部132は、N人の対象者の夫々について、生体試料採取(サンプリング)が行われる毎に学習用ユーザ情報取得部131により取得されたアンケートデータが時間方向に2個以上配列されて構成される情報を、アンケートデータの時系列情報として取得する。
【0028】
前処理部133は、時系列情報収集部132によりN人の対象者毎に収集されたヒト常在細菌データ及びアンケートデータの時系列情報に対して、後述のクラスタリングや演算に用いることができるよう、所定のフォーマットや数値に変換する前処理を施す。
【0029】
学習用データ統合管理部134は、所定の対象者について前処理部133により前処理が施されたヒト常在細菌データ及びアンケートデータの時系列情報を、当該所定の対象者についての学習データとして、N人の対象者の学習用ユーザデータを学習用DB200に格納して管理する。
即ち、学習用データ統合管理部134は、ヒト常在細菌データと、アンケートデータと、それらの時系列情報を関連付けることで統合された学習データとして、管理する。
【0030】
クラスタリング部122は、学習用DB200に格納されているN人の対象者の学習データに含まれるヒト常在細菌データをクラスタリングする。
具体的には、N人の対象者の夫々の時系列情報により得られる、N人の対象者のヒト常在細菌データ(単位データ)の夫々の遷移の頻度に基づいて、N人の対象者のヒト常在細菌データ(単位データ)を、複数のクラスタにクラスタリングする。
具体的には、クラスタリング部122においては、菌叢類似度クラスタリング部141と、遷移頻度クラスタリング部142と、が機能する。
【0031】
ここで、クラスタリング処理の前提となる用語の意義について、簡単に説明する。
「クラスタリング」とは、分析対象の集合から所定の条件を満たす部分集合を生成することをいう。また、「クラスタ」とは、クラスタリングにより生成された部分集合をいう。
【0032】
なお、クラスタリングの結果である複数のクラスタは、相互に重複していてもよく、複数のクラスタの何れにも属さない分析対象が存在してもよい。
ただし、以下、本実施形態のクラスタリングの結果の複数のクラスタは、相互に重複しないものとして説明する。
【0033】
菌叢類似度クラスタリング部141は、菌叢そのものの類似度の観点での所定のアルゴリズムにより、N人の対象者のヒト常在細菌データ(単位データ)をM個(MはNとは独立した2以上の整数値)のクラスタにクラスタリングする。
そして、菌叢類似度クラスタリング部141は、菌叢そのものの類似度の観点でクラスタリングされたクラスタに関する情報を菌叢類似度クラスタリングモデルMOD1として菌叢類似度モデルDB300に格納して管理する。
【0034】
詳しくは図3を用いて後述するが、菌叢類似度クラスタリング部141は、菌叢そのものの類似度の観点での所定のアルゴリズムとして、以下のようなアルゴリズムを採用したクラスタリングする。
【0035】
即ち、菌叢類似度クラスタリング部141は、N人の対象者の夫々の複数のヒト常在細菌データ(単位データ)の夫々同士の類似度に基づいて、クラスタリングする。例えば、菌叢類似度クラスタリング部141は、ヒト常在細菌(各回のヒト常在細菌データ)の夫々の細菌叢を構成する菌種や系統、その比率等の類似度が高いと判定されたものが同一のクラスタに属するように、クラスタリングする。
このように、菌叢類似度クラスタリング部141は、所定のアルゴリズムとして、菌叢そのものの類似度(以下、「菌叢類似度」と呼ぶ)の観点でクラスタリングする。
【0036】
なお、複数のヒト常在細菌データ(単位データ)同士の菌叢類似度は、以下のように規定することができる。即ち例えば、単位データが存在し得る空間における単位データ同士の距離的指標(例えばユークリッド距離)が小さいほど菌叢類似度が高いと規定することができる。ここで、ユークリッド距離には、構成される最近の種とその存在量の割合が考慮される。
このように、菌叢類似度クラスタリング部141は、菌叢類似度が所定値以上(距離的指標が所定値以下)の単位データを小クラスタとしてクラスタリングすることができる。
【0037】
ここで、上述の菌叢類似度クラスタリング部141によるクラスタリングの結果のクラスタを、「小クラスタ」と呼ぶ。即ち、「小クラスタ」とは、菌叢類似度の観点でのクラスタリングがなされた結果のクラスタである。
【0038】
遷移頻度クラスタリング部142は、菌叢の遷移頻度の観点での所定のアルゴリズムにより、菌叢類似度クラスタリング部141によりクラスタリングされた小クラスタ(菌叢類似度によりクラスタリングされた結果)を、L個(Lは1以上N以下の整数値)のクラスタにクラスタリングする。
そして、遷移頻度クラスタリング部142は、菌叢の遷移頻度の観点でクラスタリングされたクラスタに関する情報を遷移頻度クラスタリングモデルMOD2として遷移頻度モデルDB400に格納して管理する。
【0039】
詳しくは図3を用いて後述するが、遷移頻度クラスタリング部142は、所定のアルゴリズムとして、以下のようなアルゴリズムを採用してクラスタリングする。
【0040】
即ち、遷移頻度クラスタリング部142は、N人の対象者毎に収集された時系列情報のうちヒト常在細菌データの間における遷移の頻度(多寡)に基づいて、クラスタリングする。
例えば、遷移頻度クラスタリング部142は、N人の対象者の夫々のヒト常在細菌(各回のヒト常在細菌データ)が何れの小クラスタと何れの小クラスタとの間で相互に遷移し得るのか、また、その頻度が高いのかに基づいて、この頻度が高いと判定されたものが同一のクラスタに属するように、クラスタリングする。
このように、遷移頻度クラスタリング部142は、菌叢の遷移頻度の観点での所定のアルゴリズムとして、小クラスタの間における相互の遷移の頻度(以下、「遷移頻度」と呼ぶ)の観点でクラスタリングする。
【0041】
ここで、上述の遷移頻度クラスタリング部142によるクラスタリングの結果のクラスタを、「大クラスタ」と呼ぶ。即ち、「大クラスタ」とは、菌叢類似度の観点でのクラスタリングがなされた結果のクラスタである。
【0042】
上述したように、遷移頻度クラスタリング部142は、M個の小クラスタをL個の大クラスタにクラスタリングすることができる。
【0043】
ここで、遷移頻度クラスタリング部142において行われる、遷移頻度の観点でのクラスタリングの具体的に手法の概要を説明する。
即ち、遷移頻度クラスタリング部142は、まず、N人の対象者の夫々の時系列情報に基づき、小クラスタ間における遷移頻度の多寡を当該小クラスタ間の重みとして重み付き無向グラフを生成する。次に、遷移頻度クラスタリング部142は、重み付き無向グラフに基づき、小クラスタを大クラスタにクラスタリングする。
【0044】
そして、遷移頻度クラスタリング部142は、各々の小クラスタに所属していた単位データを、束ねた先の大クラスタに所属するものとして対応付ける。
このように、遷移頻度クラスタリング部142は、N人の対象者の夫々の複数のヒト常在細菌種データ(単位データ)を大クラスタにクラスタリングする。
【0045】
上述をまとめると、本実施形態の遷移頻度クラスタリングモデルMOD2は、N人の対象者の夫々の複数のヒト常在細菌データ(単位データ)に基づいてその単位データが属する大クラスタを特定することができるモデルであると言える。
【0046】
これにより、遷移頻度クラスタリング部142は、以下のように小クラスタを大クラスタにクラスタリングすることができる。即ち例えば、図示はしないが、第1対象者について、ヒト常在細菌種データ(単位データ)の時系列情報によれば、第1小クラスタ、第2小クラスタ、第3小クラスタと遷移(相互遷移)したとする。また、第2の対象者について、同様に、第1小クラスタ、第2小クラスタ、第4小クラスタと遷移(相互遷移)したとする。また、第3の対象者が第5小クラスタ、第6小クラスタ、第7小クラスタと遷移したとする。
【0047】
この場合、例えば、遷移頻度クラスタリング部142は、第1小クラスタ乃至第4小クラスタからなる第1大クラスタと、第5小クラスタ乃至第7小クラスタからなる第2大クラスタの2つの大クラスタにクラスタリングすることができる。
即ち、この例においては、遷移頻度クラスタリング部142は、第1小クラスタ乃至第4小クラスタからなる小クラスタ群と、第5小クラスタ乃至第7小クラスタからなる小クラスタ群の間での遷移の頻度が(この例では0回であって)低いことを条件にクラスタリングすることができる。
【0048】
また遷移の頻度の条件が上述と異なる例として、遷移頻度クラスタリング部142は、第1小クラスタ及び第2小クラスタの間の遷移(相互遷移)の頻度が(この例では2回であって)高いことを条件にクラスタリングすることができる。
【0049】
このように、遷移頻度クラスタリング部142は、所定のアルゴリズムとして、ヒト常在細菌データ(単位データ)が属する小クラスタが、どの小クラスタからどの小クラスタへ遷移し得て、その頻度が高いのかという遷移頻度の観点でクラスタリングする。
また、遷移頻度クラスタリング部142は、N人の対象者の夫々のヒト常在細菌データ(単位データ)の時系列情報に基づき、M個の小クラスタをL個の大クラスタにクラスタリングする。
【0050】
上述をまとめると、クラスタリング部122は、菌叢類似度クラスタリング部141と、遷移頻度クラスタリング部142により構成されており、N人の対象の夫々の複数の菌叢サンプルデータ(単位データ)を、菌叢類似度及び遷移頻度の2つの観点の両方に基づいてクラスタリングをすることができる。
そして、評価処理時には、遷移頻度クラスタリングモデルMOD2を用いることにより、評価対象のユーザのヒト常在細菌データ(単位データ)に基づいて、そのユーザの単位データの属する大クラスタを特定することができる。これにより、そのユーザの単位データから遷移し得る他の単位データや小クラスタを特定することができる。
【0051】
次に、ヒト常在細菌データ(単位データ)のクラスタリングにおいて遷移頻度が考慮されることによるメリットを説明する。
そこで、まず、アンケートの集計の例について第1乃至第4単位データ(1回のサンプル生体試料採取(サンプリング)におけるヒト常在細菌データ)を用いて、従来のクラスタリングとアンケートの集計について説明する。
ここで、第1単位データと、第3単位データは第1対象者から得られたデータであって、第2単位データと第4単位データは、第2対象者から得られたデータであったものとする。
なお、単位データには、複数のヒト常在細菌種毎の細菌叢を構成する菌種や系統、その量や比率等の情報が含まれている。
【0052】
即ち例えば、ヒト常在細菌種叢の従来のクラスタリングでは、単に、ある対象者のある1回のサンプル生体試料採取(サンプリング)におけるヒト常在細菌データ(単位データ)が何れの他のサンプル生体試料採取(サンプル)と類似するかに基づいてある対象者の細菌叢の状態が把握されてきた。更に言えば、従来のアンケート集計では、対象者を区別せず、単にヒト常在細菌データと対応付けてアンケートが集計されてきた。
【0053】
具体的には例えば、単位データの存在し得る空間において、第1単位データ及び第2単位データが他の単位データと比較して近傍(距離的に近く)の配置であったとする。同様に、第3単位データ及び第4単位データが他の単位データと比較して近傍(距離的に近く)の配置であったとする。また、第1単位データ及び第2単位データの組と、第3単位データ及び第4単位データの組は、近傍(距離的に近く)ではないものであったとする。
従来、このような単位データがクラスタリングされる場合、菌叢類似度が単位データの存在し得る空間における距離的指標(例えばユークリッド距離)に基づいてクラスタリングされる。その結果、第1単位データと第2単位データとを含む第1クラスタと、第3単位データと第4単位データを含む第2クラスタがクラスタリングの結果として生成されていた。
【0054】
その結果、例えば第1クラスタの中において、アンケートで「健康状態が良い」と回答した対象者の生活習慣と、「健康状態が悪い」と答えた対象者の生活習慣を比較することで、当該クラスタに属する対象者の健康状態を改善し得る生活習慣のアドバイスを導出していた。具体的には例えば、第1単位データの近傍に「健康状態が良い」対象者が多く、第2単位データの近傍に「健康状態が悪い」対象者が多い場合、この生活習慣のアドバイスは、第2単位データの近傍の状態から第1単位データの近傍の状態へ細菌叢を変化させるよう生活習慣アドバイスを導出していた。
これは、第2クラスタの中においても、同様であった。
【0055】
これに対し、本サービスでは、遷移頻度に基づいてクラスタリングする。
即ち、第1単位データと、第3単位データは第1対象者から得られたデータであって、第2単位データと第4単位データは、第2対象者から得られたデータであったことを考慮することができる。
即ち、第1単位データと第3単位データの間、第2単位データと第4単位データの間は相互に容易に遷移し得ることが考慮される。また、第1単位データと第2単位データの間、第3単位データと第4単位データの間は相互に容易には遷移しないことが考慮される。
これは、細菌叢の状態間の距離が各々の菌種の存在量を等しく数値として扱って計算されるものになっており、菌種ごとに存在量の変化が容易であるか否かや、細菌叢の状態間で遷移しやすいか否かの情報を考慮せずに定義されていたことから理解される。
【0056】
つまり、「第1単位データと第3単位データの間、第2単位データと第4単位データの間は相互に容易に遷移し得るが、第1単位データと第2単位データの間、第3単位データと第4単位データの間は相互に容易には遷移しない」場合には、「第2単位データ近傍の状態から第1単位データの近傍の状態へ細菌叢を変化させる」ことはデータの上では想定されても実際には困難であり、そのような生活習慣アドバイスも有効性が低いと考えられる。この場合にはむしろ、相互に容易に遷移し得る範囲をクラスタとして連結し、「第1単位データと第3単位データを含むクラスタ」、「第2単位データと第4単位データを含むクラスタ」をそれぞれ特定することで、実際に有効性を伴う生活習慣アドバイスの導出を実現し得ると考えられる。
【0057】
即ち、単に単位データ同士の菌叢類似度が高いという条件を考慮するのではなく、遷移し得る(実際に遷移した)か否かを考慮して、つまり、遷移頻度を考慮したクラスタを用いることで生活習慣アドバイスの導出の精度を高めることができるのである。
逆に言えば、従来のクラスタリングを行った結果、第1対象者の単位データからは遷移し得ない単位データへ遷移するための改善アドバイスがなされ、結果的に適切な改善アドバイスがなされないことがあったとも言える。
【0058】
なお、上述の例では、菌叢類似度を考慮してクラスタリングする手法と、遷移頻度を考慮してクラスタリングする手法について、単位データをクラスタリングする例を用いて説明したが、小クラスタからクラスタリングする場合においても同様である。
【0059】
即ち、従来、例えば100000の単位データを、単に菌叢類似度を考慮して10のクラスタにクラスタリングしていた。
しかしながら、本実施形態では、まず、100000個の単位データが、菌叢類似度を考慮して1000個(M個)の小クラスタにクラスタリングされる。そして、1000個(M個)の小クラスタが、10個(L個)の大クラスタにクラスタリングされる。その結果として、100000個の単位データが10個(L個)の大クラスタの内何れの大クラスタに属するかを判定するための遷移頻度クラスタリングモデルMOD2が生成されるのである。
【0060】
このように、本実施形態では、単位データは、一旦小クラスタを介して、大クラスタにクラスタリングされる。
これにより、例えば、実際にはほぼ変化のない(極端な例では、同一対象者から同時にサンプルされた複数の)単位データが1つの小クラスタとして管理される。この結果、単位データ間での遷移頻度よりも、遷移頻度(回数)のデータとしてより有用なデータが得られる。例えば、単に単位データに対して遷移頻度を考慮しようとしても、「遷移の回数が1か0か」といったデータとなってしまうことがある。しかしながら、本サービスでは、単位データは、一旦小クラスタとしてクラスタリングされる。これにより、遷移の回数として幅(例えば、遷移の回数が0~10回といった幅)を持ったデータとなるため、大クラスタへのクラスタリングにおいて処理が容易となる。
【0061】
上述が如く、本実施形態では、複数のヒト常在細菌種毎の細菌叢を構成する菌種や系統、その量や比率等の情報に基づいて、菌叢類似度及び遷移頻度の2つの観点の両方に基づくクラスタリングをする。ヒト常在細菌データ(単位データ)のクラスタリングにおいて遷移頻度が考慮されるからこそ、本サービスは、より的確な改善アドバイスの生成に資することができるのである。
【0062】
このように、本実施形態では、ヒト常在細菌種の細菌叢を構成する菌種や系統、その比率等の、菌叢類似度及び遷移頻度によりM個の大クラスタに分類する。これにより、後述の改善アドバイス算出部123や改善アドバイス生成部153により、大クラスタに応じた改善アドバイスが提供される。
【0063】
改善アドバイス算出部123は、遷移頻度クラスタリング部142によりクラスタリングされた大クラスタと、当該対象者のヒト常在細菌データとアンケートデータの時系列情報に基づいて、改善アドバイスを算出する。
改善アドバイスとは、対象者の健康状態を改善するためのものであって、対象者の生活習慣(献立や生活リズム、運動の習慣、サプリメントの摂取等)を改める方向性を示す助言である。
改善アドバイス算出部123は、算出した改善アドバイスを改善アドバイスDB500に格納して管理する。
【0064】
改善アドバイス算出部123は、改善アドバイスの一部として「菌叢状態スコア」を生成することもできる。ここで、「菌叢状態スコア」とは、単位データ(あるいはその周囲、即ち例えば小クラスタに含まれる単位データ)の夫々において期待される健康状態の良しあしをスコア化したものである。
即ち、本実施形態の菌叢状態スコアは、ある大クラスタに含まれる複数の単位データ間において異なる値となるものである。そして、その大クラスタ内における菌叢状態スコアが高くなるための、即ち、菌叢状態スコアが高い単位データの菌叢状態となるための生活習慣等が、本実施形態の改善アドバイスとして生成される。
【0065】
具体的には例えば、改善アドバイス算出部123は、遷移頻度クラスタリング部142によりクラスタリングされた大クラスタ毎に、アンケートデータに基づいて、健康状態と生活習慣のクロス集計を行うことにより、改善アドバイスを算出する。
即ち、大クラスタ毎に、アンケートデータに含まれる健康状態及び生活習慣をクロス集計することにより、ある大クラスタに属する対象者について、どのような生活習慣を送る対象者ほど健康状態が良い傾向にあるかや悪い傾向にあるかを算出する。
【0066】
従来、ある対象者のある一時のヒト常在細菌データ(単位データ)の菌叢類似度に基づいてある対象者の状態が把握され、改善アドバイスが算出されていた。
つまり、従来は、このようなほぼ同一の小クラスタは、菌叢類似度のみに基づいてよりクラスタリングがなされ、同一のクラスタとして扱われていた。
その結果、ある対象者にとって容易に遷移し得る範囲での好ましい細菌叢の構成と、他の対象者にとって容易に遷移し得る範囲での好ましい細菌叢の構成とが異なり、従ってある対象者の健康状態を改善し得る生活習慣アドバイスと他の対象者の健康状態を改善し得る生活習慣アドバイスも異なる、ということもあり得た。
更に言えば、ある対象者の健康状態の改善に有効な生活習慣アドバイスは、他の対象者の健康状態を改善するとは限らないこともあり得た。
【0067】
これに対して、本実施形態では、ある対象者のある一時のヒト常在細菌データ(単位データ)の菌叢類似度及び遷移頻度に基づいてある対象者の状態が把握され、改善アドバイスが算出される。
その結果、仮に第1乃至第3対象者の夫々のある一時のヒト常在細菌データについて、例えば、第1対象者と第2対象者の単位データは菌叢類似度が高く、ヒト常在細菌種近接しているが異なる小クラスタに所属し、第3対象者の単位データは第1対象者及び第2対象者とは菌叢類似度が低いとして、遷移頻度に基づいて夫々の小クラスタが大クラスタにまとめられた結果、第1対象者と第3対象者の単位データは同じ大クラスタに、第2対象者の単位データは異なる大クラスタに所属する場合、第1対象者と第2対象者には異なる改善アドバイスが算出され得る。
この例の場合、第1対象者には、大クラスタが同じ、より健康状態がすぐれている第3対象者に近づけるための、的確なアドバイスをすることができる。
つまり、本実施形態では、菌叢類似度と遷移頻度に基づいて、大クラスタが抽出され、改善アドバイスが算出されることにより、対象者の夫々に対してより的確な改善アドバイスが提供される。
なお、上述の例は第1対象者乃至第3対象者を用いて説明したが、それ以外の評価対象のユーザにおいても同様である。
【0068】
また、補足すると、大クラスタは、普段から菌叢には一定の変動が生じているとしても、その人がある程度固定的に持っている特性として変化せずに維持される確率の高い属性の範囲であり、ある種、「体質」とも呼べるものと言える。この「体質」(大クラスタ)は、特に大きな変動が生じた時は別の「体質」(大クラスタ)に変化することもあり得る。しかしながら、本実施形態では、日常的な変化程度では同じ「体質」(大クラスタ)にとどまると考えられる範囲の水準を特定し、改善アドバイスが提供されるものであると言える。
【0069】
次に、評価処理の流れの一例について説明する。
上述のように、評価処理時には評価部112が機能する。
【0070】
評価部112においては、評価用ユーザ情報取得部151と、遷移頻度評価部152と、改善アドバイス生成部153と、が機能する。
【0071】
評価用ユーザ情報取得部151は、評価対象のユーザのヒト常在細菌データ(単位データ)を、評価対象のユーザデータとして取得する。
なお、評価対象のユーザは上述のN人の対象者とは異なる者であってもよく、N人の対象者のうち何れかの者であってもよい。
【0072】
遷移頻度評価部152は、遷移頻度モデルDB400に格納された学習済みの遷移頻度クラスタリングモデルMOD2を用い、評価対象のユーザのヒト常在細菌データ(単位データ)が何れの大クラスタに属するかを評価する。
【0073】
改善アドバイス生成部153は、改善アドバイス算出部123により算出されたM個の大クラスタの夫々の改善アドバイスのうち、遷移頻度評価部152により評価された結果所属するとされた大クラスタを前提として、評価対象のユーザに対する改善アドバイスを生成する。
【0074】
即ち例えば、改善アドバイス生成部153は、評価対象のユーザに対して、そのユーザが所属していると考えられる大クラスタ内において、より健康状態が良い傾向にあるとされる単位データ(あるいは小クラスタ)へ遷移させるための生活習慣等の改善アドバイスを生成する。この時、改善アドバイス生成部153は、改善アドバイスDB500から改善アドバイス算出部123により算出された改善アドバイスを参照することができる。
【0075】
具体的には例えば、ある大クラスタにおいて、あるヒト常在細菌種が多い単位データほどアンケートで健康状態がよい回答が多い相関傾向にある場合の例を用いて説明する。この場合、改善アドバイス算出部123は、「その大クラスタ内でそのヒト常在細菌種が多いユーザ」のための改善アドバイスとして、「そのヒト常在細菌種を減らすための生活習慣等」の改善アドバイスを算出する。その結果、改善アドバイス生成部153は、その大クラスタに所属し、且つ、そのヒト常在細菌種が多い単位データのユーザに対して、「そのヒト常在細菌種を減らすための生活習慣等」の改善アドバイスを生成するのである。
【0076】
なお、改善アドバイス生成部153は、評価対象の単位データが所属する1つの大クラスタに対応したもの以外の情報を含む改善アドバイスを生成してもよい。即ち例えば、その大クラスタから遷移し得るものの、それが低い頻度であるような大クラスタであって、より健康状態がよい回答が多い相関傾向にある他の大クラスタに遷移させるための改善アドバイスを含んでもよい。このように、改善アドバイス生成部153は、連続的、又は、複数の方針を含んだ改善アドバイスを生成することもできる。
【0077】
このように、本実施形態では、評価対象のユーザの単位データが、学習処理におけるN人の対象者の時系列データを用いてクラスタリングされたL個の大クラスタのうち何れの大クラスタに所属するのかが判定される。そして、評価対象の単位データの所属する大クラスタに基づいて、評価対象のユーザに対する改善アドバイスが生成される。これにより、評価対象のユーザに対して、自身の単位データが実際に遷移可能であるか否かが考慮された改善アドバイスが提示される。即ち、評価対象のユーザにとっては、その改善アドバイスは、実際に有用な改善アドバイスとなっているのである。
【0078】
図3は、図2の情報処理装置が実行する学習処理の流れの一例を説明する模式図である。
まず、図3を用いて、学習データ管理部121により取得され適宜加工の上管理される、N人(Nは2以上の整数値)の対象者の夫々についてのヒト常在細菌データ及びアンケートデータについて説明する。
図3には、N人の対象者U1乃至Unの夫々が図示されている。
以下、特定の対象者Uk(kは1乃至Nのうち任意の整数値)に対する処理について説明する。なお、以下、kの添え字が付された符号は、対象者Ukに関する数値等であることを示す。
【0079】
対象者Ukは、時間方向に所定間隔をあけてLk回(Lkは、1以上の整数値)繰り返して各回の生体試料採取(サンプリング)を行っている。即ち、図3には、対象者Ukの1回の生体試料採取(サンプリング)が行われる毎に、学習用ユーザ情報取得部131により取得された単位データとして、その対象者Ukについてのヒト常在細菌データBk-1乃至Bk-Lkが図示されている。また、図3には、ヒト常在細菌データBk-1乃至Bk-Lkの夫々に対応して取得されたアンケートデータAk-1乃至Ak-Lkの夫々が図示されている。
【0080】
なお、以下、対象者UkのアンケートデータAk-1乃至Ak-Lkの夫々を、個々に区別する必要が無い場合、これらをまとめて「アンケートデータAk」と呼ぶ。「アンケートデータAk」と呼んでいる場合には、ヒト常在細菌データBk乃至Bk-Lkを、「ヒト常在細菌データBk」と呼ぶ。
更に、対象者U1乃至Unの夫々を、個々に区別する必要が無い場合、これらをまとめて「対象者U」と呼ぶ。「対象者U」と呼んでいる場合には、「アンケートデータA1乃至An」をまとめて「アンケートデータA」と呼ぶ。また、「ヒト常在細菌データB1乃至Bn」をまとめて「ヒト常在細菌データB」と呼ぶ。
【0081】
ステップST11において、菌叢類似度クラスタリング部141は、N人の対象者の夫々の複数の単位データ(各回のヒト常在細菌データB)をM個の小クラスタにクラスタリングする。菌叢類似度クラスタリング部141は、このようなクラスタリングのためのモデルを菌叢類似度モデルDB300に菌叢類似度クラスタリングモデルMOD1として格納して管理する。これにより、N人の対象者Uのヒト常在細菌データBの夫々について、所属先となる小クラスタが対応付けられる。
【0082】
なお、ステップST11の処理のクラスタリングに用いるアルゴリズムとしては、クラスタ中心点座標を扱い、かつ、全サンプルがいずれかのクラスタに属する手法を採用することが可能である。具体的には例えば、本実施形態では、「kmeans++」の手法が採用されている。ほかには例えば、「kmeans」等が上述の条件を満たす。なお、クラスタ数Pは全体のサンプル数に応じて適当な十分大きな数を取ることが好適である。本実施形態では、100乃至300程度(即ち、上述のM=100~300程度)の数値が採用されている。また、クラスタリングの距離定義には一般的なユークリッド距離が採用されている。
【0083】
次に、ステップST12において、遷移頻度クラスタリング部142は、N人の対象者Ukのヒト常在細菌データBk(単位データ)からなるの時系列情報を用いた所定のアルゴリズムにより、ステップST11の処理の結果であるM個の小クラスタを、L個(Lは1以上N以下の整数値)の大クラスタにクラスタリングする。即ち、小クラスタはLk回のヒト常在細菌データBk-1乃至Bk-Lkの時系列情報が用いられ、遷移頻度の概念でクラスタリングされる。なお、上述したように、遷移頻度クラスタリング部142は、このようなクラスタリングのためのモデルを遷移頻度モデルDB400に遷移頻度クラスタリングモデルMOD2として格納して管理する。このとき、遷移頻度クラスタリング部142の説明で上述したように、N人の対象者Ukのヒト常在細菌データBk(単位データ)と大クラスタが対応付けされる。
【0084】
まず、遷移頻度クラスタリング部142は、対象者U1乃至Unの夫々を順次処理対象(所定)の対象者Ukとして、対象者Ukの連続した受験回のヒト常在細菌データBのペア(例えば3回受検歴がある(Lkが3である)対象者Ukであれば「1回目のヒト常在細菌データBk-1及び2回目のヒト常在細菌データBk-2」、「2回目のヒト常在細菌データBk-2及び3回目のヒト常在細菌データBk-3」の2つのペア)の全てについて、ペアを構成する各回の単位データが所属する小クラスタのペアを特定し、2つの小クラスタ間にリンクを記録する。
【0085】
次に、遷移頻度クラスタリング部142は、小クラスタのペアを結ぶリンクを夫々カウントし、その本数を小クラスタのペアを結ぶリンクのウェイトとする。また、本実施形態では、入りと出が同一の小クラスタであるリンク、即ち、連続した受験回のペアにおいて所属する小クラスタが変化しなかったことを示すリンクは、削除される。このようにして得られた小クラスタのペアを結ぶリンクのウェイトに基づいて、小クラスタをノードと見なした、無向(undirected)で重み付き(weighted)のグラフ(以下、「重み付き無向グラフ」と呼ぶ)が生成される。
【0086】
ここで、本実施形態の遷移頻度クラスタリング部142は、以下のようにノードを除外する。即ち、生成された重み付き無向グラフを構成するノードのうち、他のノードと連結、即ちリンクでつながっていないノードは、除外される。
また、本実施形態では、グラフの最大連結部分(最もリンクのウェイトが大きな小クラスタのペア)から連結していないノードも、除外される。即ち例えば、第1乃至第4小クラスタ(ノード)が1つなぎに連結している場合において、第1小クラスタ及び第2小クラスタの間のリンクのウェイトが最も大きいとき、第1小クラスタ及び第2小クラスタの何れとも連結していない第4小クラスタは除外される。
このように、本実施形態では、グラフの最大連結部分(最もリンクのウェイトが大きな小クラスタのペア)から連結していないノードは、除外される。除外されたノードは、後で使用するために記録される。
なお、最大連結部分が、分析対象のグラフの全体の大半を占めないときには、最大連結部分に連結していないノードも除外しなくてもよい。
【0087】
本実施形態の遷移頻度クラスタリング部142は、上述のように得られた重み付き無向グラフに基づいて、N人の対象者の夫々のヒト常在細菌データB(単位データ)の時系列情報(2回以上の単位データが時間方向に配列されて構成される情報)に基づいて、小クラスタを大クラスタにクラスタリングする。
具体的には例えば、本実施形態の遷移頻度クラスタリング部142は、生成された重み付き無向グラフを構成するノード(小クラスタ)の間において、リンクの重み(小クラスタ間の遷移頻度の数に相当)に基づいて、「Fast Greedy」アルゴリズムに従ってクラスタリングする。なお、アルゴリズムはこれに限定されず、重みの要素を入れて無向グラフをクラスタリングできる他のアルゴリズムでも良い。
遷移頻度クラスタリング部142におけるクラスタリングにおけるクラスタ数は、クラスタ使用目的に応じて適当な数を取る。本実施形態では、5乃至10のクラスタ数が採用されている。このように作成されたクラスタは、ノードを接続するネットワーク(NW)状であることから、ネットワーク(NW)クラスタと呼ばれる。
【0088】
これにより、N人の対象者の夫々のヒト常在細菌データB(単位データ)の夫々は、小クラスタに対応され、更に上述のNWクラスタに対応される。更に言えば、所定のヒト常在細菌データB(単位データ)が所属する小クラスタが、ステップST12の処理において生成されたNWクラスタのいずれかに属している場合、当該NWクラスタを当該ヒト常在細菌データBの所属先とする。ヒト常在細菌データBが所属するノード(小クラスタ)がステップST13の処理において除外対象になっている場合は、除外されなかったノード(小クラスタ)の中心点座標のうち当該ヒト常在細菌データBの座標からの距離が最も小さいノード(小クラスタ)を特定し(距離定義はユークリッド距離でよい)、そのノード(小クラスタ)を当該ヒト常在細菌データBの所属先とする。
【0089】
なおNWクラスタから除外されたノード(小クラスタ)に所属するヒト常在細菌データBについては、上記のように近接小クラスタを使う方法のほか、「どのNWクラスタにも当てはまらなかった例外サンプル」として扱うものとしてもよい。
【0090】
次に、ステップST13において、改善アドバイス算出部123は、菌叢類似度クラスタリング部141及び遷移頻度クラスタリング部142によりクラスタリングされた大クラスタ毎に、アンケートデータに基づいて、健康状態と生活習慣のクロス集計を行うことにより、改善アドバイスを算出する。
即ち、改善アドバイス算出部123は、大クラスタ毎に、当該大クラスタに属する単位データに対応づくアンケートデータに含まれる健康状態や生活習慣をクロス集計する。具体的には例えば、改善アドバイス算出部123は、「当該大クラスタに属する対象者は、どのような生活習慣を送ることで、どのような健康状態になるのか」について、統計的に処理することで算出する。
【0091】
以上、図3を用いて、図2の情報処理装置が実行する学習処理の流れの一例を説明した。
以下、図4を用いて、菌叢類似度クラスタリングの結果の一例について説明する。
【0092】
図4は、図2の機能的構成を有する情報処理装置による菌叢類似度クラスタリングの結果の一例を示す図である。
図4には、分析対象の集合であるN人の対象者U1乃至Unの夫々の複数のヒト常在細菌データB(単位データ)の夫々の全てを菌叢類似度クラスタリング部141によりクラスタリングされた結果の小クラスタの夫々が、2次元グラフに配置されて図示されている。
図4の横軸Ax11及び縦軸Ax12の夫々は、主座標分析における第1主成分及び第2主成分の夫々である。
図4において、小クラスタの夫々(例えば、小クラスタSCL1)は、小クラスタの夫々に属するヒト常在細菌データBの中心点(例えば、(Ax11,Ax12)=(0.17,0.33))に配置されて図示されている。
【0093】
そして、図4のグラフの各点、即ち小クラスタ(例えば小クラスタSCL1)は、凡例に示すように7つのクラスタ(例えば、図4に示すクラスタCL2及びCL7等)に塗り分けられている。具体的には例えば、図4の小クラスタSCLは、クラスタCL7に属している。
【0094】
ここで、図4に示す7つのクラスタは、菌叢類似度の情報のみに基づいたクラスタを示すものである。つまり、図4の例においては、対象者Uの単にある1回のサンプル生体試料採取(サンプリング)におけるヒト常在細菌データB(単位データ)がどのようなものと類似するか(菌叢類似度)のみに基づいて、対象者Uの状態がクラスタリングされている。
【0095】
なお、図4において7つに色分けされたクラスタの夫々について明確な境界が存在しないのは、図4のグラフが主座標分析の結果であって、実際のヒト常在細菌データBは3次元以上の変数を持つ(多次元の)データであり、このような多次元のヒト常在細菌データBに基づいてクラスタリングされているためである。
【0096】
従来、ある対象者Ukの1回のサンプル生体資料採取(サンプリング)の結果得られたヒト常在細菌データBkは、図4で示された7つのクラスタのように、菌叢類似度のみに基づいてクラスタに分類されてきた。そして、所属するクラスタに応じた改善アドバイスがなされてきた。
つまり、まず、クラスタ(例えば、クラスタCL2及びCL7)の夫々について、アンケートデータが集計される。そして、アンケートデータの集計結果に基づいて、クラスタ(例えば、クラスタCL2及びCL7)において、どちらのクラスタがよりよい健康状態であるかが規定される。そして、ある対象者Ukの1回のサンプル生体資料採取(サンプリング)の結果、ヒト常在細菌データBkが得られた場合、当該ヒト常在細菌データBkが属するクラスタ(例えば、クラスタCL7)が特定される。その結果、クラスタCL7からクラスタCL2に属するためにはどのような生活習慣の改善を行うべきかといった、改善アドバイスがなされてきた。
【0097】
以上、図4を用いて、ヒト常在細菌データを小クラスタにクラスタリングした例と、従来の菌叢類似度のみに基づいたクラスタリングの例について説明した。
次に、本実施形態における時系列クラスタリングの例を、図5を用いて説明する。
【0098】
図5は、図2の機能的構成を有する情報処理装置による時系列クラスタリングの結果の一例を示す図である。
図5には、分析対象のN人の対象者の夫々のヒト常在細菌データ(単位データ)の時系列情報(2回以上のヒト常在細菌データ(単位データ)が時間方向に配列されて構成される情報)をクラスタリングした結果のノード(小クラスタ)及びそのリンク(遷移頻度)が、2次元グラフに配置されて図示されている。
図5の横軸Ax21及び縦軸Ax22の夫々は、主座標分析における第1主成分及び第2主成分の夫々である。
【0099】
図5において、遷移頻度があった小クラスタのペア(例えば、小クラスタSCL2及びSCL3のペア)には、連続した受験回のペアにおいて所属する小クラスタが変化したことを示すリンク(例えば、リンクL1)が図示されている。また、小クラスタSCL3及びSCL4のペアにおけるリンクL2は、上述の例のリンクL1と比較して太い線で図示されている。これは、リンクL1及びL2の夫々のリンクのウェイトを表している。つまり、線が太く図示されているリンク程、そのウェイトが大きく、そのリンクに対応する相互遷移が多く起こっていること(遷移頻度が高いこと)を示している。
【0100】
即ち、N人の対象者U1乃至Unの夫々の複数のヒト常在細菌データB(単位データ)の夫々の全てを菌叢類似度クラスタリング部141によりクラスタリングされた結果の小クラスタの夫々が、図5の各点として示されている。
【0101】
そして、図3等において説明した、遷移頻度クラスタリング部142により用いられる小クラスタ間における遷移頻度の多寡であって、その小クラスタ(ノード)間のリンクの重みが、図5の直線として示されている。
【0102】
図5のグラフの各点、即ち小クラスタ(例えば小クラスタSCL等)は、凡例に示すように7つのクラスタに塗り分けられている。即ち、図5のグラフにおける小クラスタの塗り分けの色は、遷移頻度に基づいて小クラスタを大クラスタにクラスタリングした結果のクラスタを示すものである。
即ち、図5のクラスタの夫々の色は、時系列情報を用いた遷移頻度の概念によるくクラスタリングの結果を示している。
【0103】
同一の小クラスタをクラスタリングしたとしても、図4に示す菌叢類似度に基づくクラスタと、図5に示す時系列情報に基づくクラスタとでは、異なるクラスタリング結果となるのが通常である。
【0104】
次に、図6を参照して、図2の機能的構成を有する情報処理装置1が実行する、評価処理の流れについて説明する。
図6は、図2の情報処理装置が実行する評価処理の流れの一例を説明するフローチャートである。
【0105】
評価処理は、評価対象のユーザの必要な任意のタイミングで、評価対象のユーザの評価情報が取得される際に開始されて、次のようなステップS21乃至S23の処理が実行される。
【0106】
ステップS21において、評価用ユーザ情報取得部151は、前記N人の対象者とは異なるユーザのヒト常在細菌データ(単位データ)を、評価対象のユーザデータとして取得する。
【0107】
ステップS22において、遷移頻度評価部152は、遷移頻度モデルDB400に格納された学習済みの遷移頻度クラスタリングモデルMOD2を用い、評価対象のユーザの単位データがL個の大クラスタのうち何れの大クラスタに所属するのかを評価する。
【0108】
ステップS23において、改善アドバイス生成部153は、改善アドバイス算出部123により算出されたM個の大クラスタの夫々の改善アドバイスのうち、遷移頻度評価部152により評価された結果所属するとされた大クラスタを前提として、評価対象のユーザに対する改善アドバイスを生成する。
【0109】
このように、評価対象のユーザに対する改善アドバイスが生成されると、アドバイス生成処理は終了になる。
【0110】
次に、図7を用いて、ある評価対象のユーザに対する評価結果の変化の例を説明する。
【0111】
図7は、図6の改善アドバイス生成処理により生成された改善アドバイスを含む評価結果の例を示す図である。
【0112】
図7(A)は、本実施形態における時系列情報や大クラスタを利用せず、菌叢類似度にのみ基づいた改善アドバイスを含む評価結果の例である。
図7(B)は、本実施形態における時系列情報や大クラスタを利用した、即ち、菌叢類似度及び時系列情報に基づいて大クラスタへの所属度合いに基づいた改善アドバイスを含む評価結果の例である。
【0113】
以下、図7(A)及び(B)を比較して、本実施形態における改善アドバイスの例について説明する。
【0114】
図7(A)に示す表の最も左の列には、上から、「菌叢クラスタ型」、「菌叢状態スコア」、「改善アドバイス」及び「肌のお悩み」の項目名が図示されている。
即ち、それより右の各列の夫々には、評価結果についての検査の回数毎の、「菌叢クラスタ型」、「菌叢状態スコア」、「改善アドバイス」及び「肌のお悩み」の夫々の項目に対する内容が図示されている。
【0115】
例えば、図7(A)の例の検査1回目乃至3回目において、「菌叢クラスタ型」は、「I」、「VI」、「I」と変化している。また、このとき、「菌叢状態スコア」は、「D」、「B」、「D」と変化している。
上述した通り、図7(A)の例は、本実施形態における時系列情報や大クラスタを利用せず、菌叢類似度にのみ基づいた改善アドバイスを含む評価結果の例である。つまり、図7(A)における「菌叢クラスタ型」は、図4の説明において色分けして示した菌叢類似度の情報のみに基づいたクラスタに対応する。
【0116】
そして、検査1回目及び3回目において、「菌叢クラスタ型」、「菌叢状態スコア」、「改善アドバイス」及び「肌のお悩み」の項目の夫々の内容は同一である。更に言えば、「菌叢クラスタ型」及び「菌叢状態スコア」が1対1対応している。これは、図4において説明したように、菌叢類似度にのみ基づいたクラスタの夫々について、アンケートデータが集計されるためである。そして、アンケートデータの集計結果に基づいて、複数のクラスタのうち、どのクラスタがよりよい健康状態であるかが規定される。
即ち図7(A)の例においては、菌叢クラスタ型「I」は菌叢状態スコアが比較的悪いと規定された結果、菌叢状態スコア「D」となっている。また、菌叢クラスタ型「VI」は比較的良い規定された結果、菌叢状態スコア「B」となっている。
【0117】
そして、ある対象者Ukの1回のサンプル生体資料採取(サンプリング)の結果、ヒト常在細菌データBkが得られた場合、当該ヒト常在細菌データBkが属するクラスタ(例えば、菌叢クラスタ型「I」)が特定される。その結果、菌叢クラスタ型「I」から菌叢クラスタ型「VI」に属するためにはどのような生活習慣の改善を行うべきかといった、改善アドバイスがなされてきたことに対応する。
これは、「菌叢状態スコア」及び「改善アドバイス」の項目の内容は、菌叢クラスタ型に基づいていたからに他ならない。
【0118】
つまり、従来の評価結果における菌叢クラスタ型とは、ヒト常在細菌データを類似度にのみ基づいてクラスタリングすることにより、得られていた。つまり、図7(A)の例においては、「菌叢状態が状態Iであれば(状態Iに類似していれば)菌叢状態は悪い(菌叢状態スコアが低い)」、「菌叢状態が状態VIであれば(状態VIに類似していれば)菌叢状態は良い(菌叢状態スコアが高い)」等と評価されていた。
更に言えば、改善アドバイスも、菌叢類似度にのみ基づいてクラスタリングされたクラスタ(菌叢状態)に依存していた。具体的には例えば、「菌叢状態が状態Iであれば緑黄色野菜及び魚介類を摂取すべき」、「菌叢状態がVIであれば大豆類を摂取すべき」と評価されていた。
【0119】
その結果、検査2回目において、改善アドバイスを提供したものの、検査3回目には検査1回目の状態に戻ってしまっている。また、「肌のお悩み」も再び発生して(とても気になって)いる。つまり、一部の対象者にとっては改善アドバイスが適切ではなく、改善どころか改悪してしまったり、前回の改善がないがしろになったり、前回改善したのは見せかけだったりということが考えられる。
【0120】
このように、本サービスで利用される遷移頻度の概念を利用しない評価結果の例では、菌叢類似度のみに依存して菌叢クラスタ型が決定され、菌叢状態のスコアも菌叢クラスタ型のみに依存する結果となり、対象者の体質や状況を必ずしも反映できないことがあった。
【0121】
これに対し、例えば、図7(B)の例の検査1回目乃至3回目において、「菌叢クラスタ型」は、「2」から変化していない。また、このとき、「菌叢状態スコア」は、「D」、「B」、「B」と変化している。
上述した通り、図7(B)の例は、本実施形態における遷移頻度の概念を利用した大クラスタに基づいた評価結果の例である。つまり、図7(B)における「菌叢クラスタ型」は、本実施形態における菌叢類似度及び遷移頻度に基づくクラスタを示している。
【0122】
そして、検査1回目乃至3回目において、「菌叢クラスタ型」の内容は同一である。一方で、「菌叢状態スコア」の項目の夫々の内容は、「D」から「B」へと変化している。これは、検査1回目乃至3回目において、同一の大クラスタに属するものの、その回のヒト常在細菌データB(単位データ)が、同一の大クラスタ内において個々に菌叢状態スコアが割り当てられていることに対応する。
【0123】
更に言えば、検査2回目及び3回目において、「菌叢クラスタ型」及び「菌叢状態スコア」の内容は同一である。このとき、「改善アドバイス」の内容は、「緑黄色野菜の摂取 雑穀米の摂取」から、「緑黄色野菜の摂取」に変化している。つまり、その回のヒト常在細菌データB(単位データ)が、前回の大クラスタと同一のクラスタに属していて、かつ、菌叢状態スコア(健康状態)も変わらなかったとしても、異なる改善アドバイスが生成し得ることに対応する。
つまり、「改善アドバイス」の項目の内容は、遷移頻度の概念を利用した大クラスタに基づいた「菌叢クラスタ型」及び「菌叢状態スコア」に基づいているからに他ならない。
【0124】
即ち、本実施形態では「菌叢クラスタ型」として、大クラスタ又はそれに類する何らかのクラスタが採用され得る。そのため、同一の「菌叢クラスタ型」の中で菌叢が遷移しがちである。従って、改善アドバイスに従ったユーザは、その改善の結果として「別の菌叢クラスタ型に遷移する」のではなく「同じ菌叢クラスタ型の中で、より良い状態に遷移する」ものとして取り扱われるほうが、好適である。
つまり、同じ「菌叢クラスタ型」であっても、既に菌叢状態が良い人とそうでない人とで、改善アドバイスの強弱(数量)等を変化させると好適である。
【0125】
これに対して従来の手法では、菌叢クラスタ型「VI」は良い菌叢、菌叢クラスタ型「I」は悪い菌叢、のように菌叢クラスタ型(菌叢類似度にのみ基づくクラスタの何れに所属するか)単位での評価を前提とする。そのため、菌叢クラスタ型「I」から「VI」へ遷移させるための改善アドバイスは、改善アドバイスを提供する対象であるユーザが菌叢クラスタ型「I」に所属している間は同一であることになる。
このように、本実施形態では、より菌叢類似度のみに寄らず、また、菌叢クラスタ型にとらわれず、より適切な改善アドバイスが提供されるのである。
【0126】
このように、本サービスでは、菌叢類似度のみならず、時系列情報を用いて遷移頻度の概念でクラスタリングすることにより、上述の単位データを大クラスタに対応付けることを可能とし、その大クラスタ内に所属する各単位データにたいしてより良い菌叢状態を目指すための改善アドバイスをより緻密に提供できる。
【0127】
ここで、従来の菌叢類似度のみに基づいたクラスタリングにおいては、例えば、従来では複数回の検査間において変動しやすいヒト常在細菌種に影響され、クラスタリングが複数回の検査の夫々においてクラスタリング結果(図7(A)でいう菌叢クラスタ型)が異なることがあった。
本実施形態では、そもそも、遷移頻度の概念を用いてクラスタリングするため、変動しやすいヒト常在細菌種の影響を考慮した大クラスタが生成される。換言すると、本実施形態は、複数回の検査間において変動しやすいヒト常在細菌種の菌種の影響を抑制した改善アドバイスを提供することができる。
このように、本実施形態は従来の菌叢類似度としてのクラスタ間距離の情報では、不足していた観点(要素)を更に加味して、クラスタリングすることができるようになっているのである。
【0128】
また、学術的には、「菌叢は変化したほうが良いという学説」と、「菌叢は安定していた方が良いという学説」が存在する。本実施形態において評価される遷移頻度の概念を用いた大クラスタは、このような学説に影響を及ぼし得る概念である。
【0129】
以上、本発明が適用される情報処理システムの実施形態を説明してきた。しかしながら、本発明が適用される実施形態は、例えば次のようなものであってもよい。
【0130】
例えば、上述の本実施形態では、学習データ管理部121によりN人の対象者U1乃至Unの夫々について、2以上のヒト常在細菌データBが時間方向に2以上配列されて構成されるヒト常在細菌データB(対象者Ukについてはヒト常在細菌データBk-1乃至Bk-Lk)が取得され管理されるものとしたが、特にこれに限定されない。
即ち、N人(Nは2以上の整数値)の対象者の夫々について、2以上のヒト常在細菌種に関する情報を少なくとも含む単位データ(例えば、図3のヒト常在細菌データBやアンケートデータA)は予め取得されていれば足りる。
【0131】
また例えば、菌叢類似度クラスタリング部141は、図2及び図3において説明したアルゴリズムにより、N人の対象者の夫々のヒト常在細菌データ(単位データ)を小クラスタにクラスタリングするものとしたが、特にこれに限定されない。
例えば、図2及び図3において説明したアルゴリズム以外のアルゴリズムが採用されてもよい。
即ち例えば、菌叢類似度クラスタリング部141は、N人の対象者の夫々の単位データを、菌叢類似度を用いて、最終的なクラスタリング(上述の例では大クラスタ)よりも小さなクラスタ(上述の例では小クラスタ)にクラスタリングすれば足りる。
【0132】
また例えば、遷移頻度クラスタリング部142は、図3及び図3において説明したアルゴリズムにより、N人の対象者の夫々のヒト常在細菌データB(単位データ)の時系列情報(2回以上の単位データが時間方向に配列されて構成される情報)をクラスタリングするものとしたが、特にこれに限定されない。
例えば、図3において説明したアルゴリズム以外のアルゴリズムが採用されてもよい。
即ち、遷移頻度クラスタリング部142は、N人の対象の夫々の時系列情報に基づいて、遷移頻度の概念を用いてクラスタリングすれば足りる。
【0133】
また例えば、評価処理は、学習処理におけるN人の対象者のデータとは異なるユーザのユーザデータに対して行われたが、特にこれに限定されない。
即ち、評価対象のユーザのデータが得られるたび、学習処理を行い、学習処理において算出された菌叢クラスタ型や、改善アドバイスが、評価対象のユーザに提供されてもよい。
【0134】
また例えば、上述の実施形態では、本サービスはヒト常在細菌を対象とするものとしたが、特にこれに限定されない。即ち、本サービスは各種各様な微生物叢を対象とすることができる。具体的には例えば、本サービスの対象として、ヒト微生物叢を採用することができる。即ち、ヒト常在細菌といったヒトの身体に一過性でなく常に存在する細菌のみならず、外来のものを含む微生物(細菌、真菌、藻類、原生生物等)の微生物叢を対象とすることができる。なお、対象となる微生物叢にはウィルス等の非生物が含まれていてもよい。
また、ヒトの特定の部位(例えば、腸内等の消化器)における微生物叢に限定されず、ヒトの様々な部位(消化器、皮膚、口腔及び鼻腔、若しくは、これらの組合せ等)における微生物叢が対象とされてもよい。
更に言えば、ヒトにおける細菌叢や微生物叢に限定されず、所定の対象における細菌叢や微生物叢を対象とすることができる。具体的には例えば、植物や、土壌、海洋、大気といった環境微生物を対象とすることもできる。
この場合、植物や土壌、海洋、大気等といった所定の対象についても、類似度のみならず遷移頻度に基づいた分類が可能となる。
【0135】
また例えば、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図2の機能的構成は例示に過ぎず、特に限定されない。
即ち、上述した一連の処理を全体として実行できる機能が情報処理システムに備えられていれば足り、この機能を実現するためにどのような機能ブロック及びデータベースを用いるのかは特に図2の例に限定されない。また、機能ブロック及びデータベースの存在場所も、図2に特に限定されず、任意でよい。例えば、情報処理装置1の機能ブロック及びデータベースを図示せぬ他の情報処理装置等に移譲させてもよい。即ち例えば、学習処理を行う情報処理装置と、評価処理を行う情報処理装置とに分割する等してもよい。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
【0136】
また例えば、一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。
また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えばサーバの他汎用のスマートフォンやパーソナルコンピュータであってもよい。
【0137】
また例えば、このようなプログラムを含む記録媒体は、利用者(本サービスの提供者や評価対象のユーザ)にプログラムを提供するために装置本体とは別に配布される図示せぬリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態で利用者に提供される記録媒体等で構成される。
【0138】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
即ち、上述の実施形態では、図2の複数の機能ブロック(複数の手段の具現化の形態)を有する図1の情報処理装置1から情報処理システムは構成されていたが、特にこれに限定されず、例えば、図2の複数の機能ブロック(複数の手段の具現化の形態)は、ネットワーク等を介して接続される複数の装置の何れかに分散して配置されることで、情報処理システムが構成されるようにしてもよい。
【0139】
以上を換言すると、本発明が適用される情報処理システムは、次のような構成を有する各種各様の実施形態を取ることができる。
【0140】
即ち、本発明が適用される情報処理システム(例えば、図2等の情報処理装置1)は、
複数の対象者の夫々について、2以上のヒト微生物種に関する情報を少なくとも含む単位データ(例えば、図3のヒト常在細菌データBk-1)が時間方向に2以上配列されて構成される時系列情報(例えば、図3のヒト常在細菌データBk-1乃至Bk-Lk)が予め取得されている状態で、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度(例えば、明細書中の遷移頻度)に基づいて、前記複数の対象者の前記単位データを、複数のクラスタにクラスタリングするクラスタリング手段(例えば、図2のクラスタリング部122)
を備える。
【0141】
これにより、ある対象者のある一時のヒト常在細菌データ(単位データ)のクラスタリングにおいて、遷移の頻度が考慮される。そのクラスタリング結果を用いることで、対象者又はユーザの遷移頻度が考慮される。
従来、ある対象者のある一時のヒト常在細菌データ(単位データ)の菌叢類似度に基づいてある対象者の状態が把握され、改善アドバイスが算出されていたが、これと比較してより適切なクラスタリングとなり、より有用な改善アドバイスを行うといったことが可能となる。
【0142】
さらに、前記クラスタリング手段は、
前記複数の対象者の前記単位データをM個(Mは3以上の整数値)の第1クラスタ(例えば、明細書中の小クラスタ)にクラスタリングする第1クラスタリング手段(例えば、図2の菌叢類似度クラスタリング部141)と、
所定の関係にある前記M個の第1クラスタの群に基づいて、L個(LはM未満の正の整数値)の第2クラスタ(例えば、明細書中の大クラスタ)にクラスタリングする第2クラスタリング手段(例えば、遷移頻度クラスタリング部142)と、
を含むことができる。
【0143】
これにより、ヒト常在細菌データ(単位データ)は、まず、第1クラスタにクラスタリングされた後、第2クラスタにクラスタリングされる。
遷移の頻度を考慮してクラスタリングするにあたり、2段階のクラスタリングを行うことで、遷移の頻度のデータの統計量を適宜調整して、より適切に遷移の頻度を考慮したクラスタリングが可能となる。
【0144】
さらに、前記第1クラスタリング手段は、
前記ヒト微生物種の類似度に基づいてクラスタリングし、
前記第2クラスタリング手段は、
前記複数の対象者の夫々の前記時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度の関係を前記所定の関係として、第2クラスタを生成する、ことができる。
【0145】
まず、ヒト常在細菌に関する情報を少なくとも含む単位データは、第1クラスタにクラスタリングされる。そして、複数の対象者の夫々の時系列情報により得られる、前記複数の対象者の前記単位データの夫々の遷移の頻度の関係に基づき、第1クラスタが更にL個の第2クラスタにクラスタリングされる。これにより、複数の対象者の夫々が所定の関係にある、という条件の群に属する単位データがL個の第2クラスタにクラスタリングされるための学習が行われる。
つまり、従来のクラスタリングのように、単にデータを、夫々のデータ同士が類似するという観点のみによりクラスタリングするのでなく、時系列情報に基づいてそれとは異なる所定の関係にあるものについてクラスタリングされる。これにより、複数の対象者の夫々の単位データをM個のクラスタとする際に、対象者の夫々のその時点の単位データのみならず、所定の関係も考慮される。
例えば、所定の関係として、単位データの間で相互に遷移し得るか否か、が採用されたクラスタリングも可能となる。つまり、第2クラスタは、所定の関係を反映したという観点でより精度の高いクラスタとなる。
【0146】
これにより、類似度とは別の所定の関係として、クラスタを構成する単位データ間での遷移が起こり得るか、また、起こりやすいか、の観点で第2クラスタが生成される。
その結果、第2クラスタは、遷移しやすいか否かしたという観点でより精度の高いクラスタとなる。
【0147】
前記複数の対象者の単位データの夫々について、さらに、健康状態及び生活習慣に関するデータを少なくとも含むデータが、アンケートデータとして予め取得されている状態で、
前記アンケートデータの集計を行い、当該集計の結果に基づいて、前記L個の第2クラスタの夫々の範囲内における改善アドバイスを算出する改善アドバイス算出手段(例えば、図2の改善アドバイス算出部123)、
をさらに備えることができる。
【0148】
これにより、よりその対象者の体質が的確に反映されたM個のクラスタに基づいて、改善アドバイスが算出される。つまり、よりその対象者の体質に合わせた的確な改善アドバイスが算出される。
その結果、その対象者のヒト常在細菌種に基づく改善のアドバイスの精度が向上する。
【0149】
また、
評価対象のユーザの前記単位データをユーザデータとして取得する取得手段(例えば、図2の評価用ユーザ情報取得部151)と、
前記L個の第2クラスタのうち前記ユーザデータが所属する第2クラスタを所属クラスタとして判定する第2クラスタ判定手段(例えば、図2の遷移頻度評価部152)と、
前記改善アドバイス算出手段により算出された前記改善アドバイスのうち、前記第2クラスタ判定手段により判定された前記所属クラスタの範囲内における前記改善アドバイスを少なくとも含む改善アドバイスを生成する改善アドバイス生成手段(例えば、図2の改善アドバイス生成部153)と、をさらに備えることができる。
【0150】
これにより、上述の前記N人の対象者とは異なるユーザについても、M個のクラスタのうち所属度の高い、即ち、体質が的確に反映されたクラスタはいずれなのかが算出される。そして、所属度の高い、即ち、体質が的確に反映されたクラスタに合わせた改善アドバイスが生成される。これにより、評価対象のユーザに対して、より的確な改善アドバイスが提供される。
【符号の説明】
【0151】
1・・・情報処理装置、11・・・CPU、18・・・記憶部、20・・・ドライブ、31・・・リムーバブルメディア、111・・・学習部、112・・・評価部、121・・・学習データ管、部、122・・・クラスタリング部、123・・・改善アドバイス算出部、131・・・学習用ユーザ情報取得部、132・・・時系列情報収集部、133・・・前処理部、134・・・学習用データ統合管理部、141・・・菌叢類似度クラスタリング部、142・・・遷移頻度クラスタリング部、151・・・評価用ユーザ情報取得部、152・・・遷移頻度評価部、153・・・改善アドバイス生成部、200・・・学習用DB、300・・・菌叢類似度モデルDB、400・・・遷移頻度モデルDB、500・・・改善アドバイスDB
図1
図2
図3
図4
図5
図6
図7