(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-27
(45)【発行日】2024-03-06
(54)【発明の名称】空間評価システム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240228BHJP
【FI】
G06Q50/10
(21)【出願番号】P 2022575647
(86)(22)【出願日】2022-01-14
(86)【国際出願番号】 JP2022001136
(87)【国際公開番号】W WO2022154086
(87)【国際公開日】2022-07-21
【審査請求日】2022-10-21
(31)【優先権主張番号】P 2021005128
(32)【優先日】2021-01-15
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(73)【特許権者】
【識別番号】504202472
【氏名又は名称】大学共同利用機関法人情報・システム研究機構
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】豊田 章倫
(72)【発明者】
【氏名】伊藤 正和
(72)【発明者】
【氏名】片平 悟史
(72)【発明者】
【氏名】松尾 祐児
(72)【発明者】
【氏名】池内 暁紀
(72)【発明者】
【氏名】黒川 顕
(72)【発明者】
【氏名】東 光一
(72)【発明者】
【氏名】森 宙史
【審査官】▲高▼瀬 健太郎
(56)【参考文献】
【文献】特開2013-167440(JP,A)
【文献】特開2019-028063(JP,A)
【文献】米国特許出願公開第2019/0325334(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
評価対象である対象空間が自然環境にどの程度近い空間であるかを評価する演算処理装置を備える空間評価システムであって、
前記演算処理装置は、
自然環境にどの程度近い空間であるかを指標にした自然度
と、空気中から採取されたサンプルに含まれる微生物を含む物質の種類、及び、前記物質毎の存在量を示す空気質データと、が紐づけられて設定された設定部と、
前記空気質データか
ら前記自然度を推定する推定部と、を有
しており、
前記設定部に設定された前記自然度は、自然物又は人工物の多さが異なる複数の参照空間のそれぞれにおいて、センサ及び官能評価により取得された環境データから算出された指標であって、前記自然度の値が大きいほど前記参照空間が前記自然環境に近い空間であり、前記自然度の値が小さいほど前記参照空間が人工環境に近い空間であることを示す指標であり、
前記設定部に設定された前記空気質データは、前記複数の参照空間のそれぞれの空気中から採取された学習用のサンプルを分析することによって取得されたデータであり、
前記推定部は、
前記設定部に設定された前記自然度及び前記空気質データのデータセットを教師データとして前記空気質データに対応する前記自然度の算出を機械学習することによって構築された推定モデルを有し、
前記対象空間の空気中から採取されたサンプルを分析することによって取得された前記空気質データが入力された前記推定モデルが、入力された前記空気質データに対応する前記自然度を算出することによって、前記対象空間の前記自然度を推定する
ことを特徴とする空間評価システム。
【請求項2】
前記環境データは、前記
参照空間において
前記センサにより取得された量的データと、前記
参照空間において
前記官能評価により取得された質的データと、を含む
ことを特徴とする請求項
1に記載の空間評価システム。
【請求項3】
前記空気質データは、採取装置により採取されたサンプルを分析装置により分析することによって取得され、
前記設定部には、前記サンプルを採取する前に前記採取装置に存在する前記物質の前記空気質データ、若しくは、前記サンプルを分析する前に前記分析装置に存在する前記物質の前記空気質データの何れか一方又は両方が、ネガティブコントロールサンプルの前記空気質データとして設定されており、
前記推定部は、前記対象空間において採取された前記サンプルの前記空気質データに混入する前記ネガティブコントロールサンプルの前記空気質データの混入割合を推定し、前記ネガティブコントロールサンプルの前記空気質データが除外された前記対象空間の前記空気質データから、前記対象空間の前記自然度を推定する
ことを特徴とする請求項
1又は2に記載の空間評価システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、空間評価システムに関する。
【背景技術】
【0002】
人の健康や心身機能の維持向上への関心が高まる中、労働生産性やストレス低減効果の高い空間の実現に注目が集まっている。例えば、人が植物と共生することにより癒し効果が発揮されることは良く知られており、バイオフィリックデザイン(Biophilic design)を取り入れた「あたかも自然の森林の中にいる事を感じられる」空間の具現化が期待されている。バイオフィリックデザインは、「人は自然とのつながりを本能的に求めている」というバイオフィリア(Biophilia)の概念に基づいた空間設計手法である。バイオフィリックデザインのような空間設計では、空間が自然環境にどの程度近い空間であるかを把握することが重要である。
【0003】
自然環境を客観的に評価する手法はこれまでにも提案されている。特許文献1には、森林地域を上空から撮影した樹幹形状画像及びスペクトル分析結果を解析し、森林地域を評価する方法が開示されている。特許文献2には、自然環境における植物量データと微生物活性データとから、物質循環の状態を把握することにより、自然らしさを評価する手法が開示されている。
【0004】
また、人が感じる自然度合いを主眼にした評価手法も提案されている。例えば、特許文献3には、森林内の空間にいる際の生理反応情報と、都市部の空間にいる際の生理反応情報とを取得し、それぞれの生理反応情報の差に基づき、当該森林内の空間が森林浴に適した空間であるか否かを判断する(空間を評価する)手法が開示されている。非特許文献1には、屋内空間における光や色、景観のフラクタル構造、空間内の生物の有無等の評価項目から、空間の自然度合いを評価する方法が開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2001-357380号公報
【文献】特開2014-039493号公報
【文献】特開2005-103309号公報
【非特許文献】
【0006】
【文献】Nikos A.Salingaros,“The Biophilic Healing Index Predicts Effects of the Built Environment On Our Wellbeing”,Journal of Biourbanism,8(1/2019),p.13-34
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に開示の手法では、上空から撮影した画像データの解析が主であるので、画像による評価に限定される。特許文献2に開示の手法では、対象空間に土壌が存在しない場合には適用できない。特許文献3に開示の手法では、未知の空間を評価するためには、異なる複数の空間での生理反応情報の相対的変化を取得した上で解析する必要があるので、評価に多大な労力と時間を必要とする。しかも、評価結果が生理反応情報を提供する被験者の個人差に大きく依存するので、当該空間を定量的に評価することは難しい。非特許文献1に開示の手法では、各評価項目が主に視覚的な情報に基づく項目であり3段階評価であるので、抽出される情報量が少ない。しかも、屋内空間に限定した評価手法であるので、自然環境と比較して自然度を評価することは難しい。
【0008】
本発明は、上記に鑑みてなされたものであり、評価対象である未知の空間が自然環境にどの程度近い空間であるかを簡易且つ定量的に評価することが可能な新しい空間評価システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
バイオフィリックデザインのような空間設計では、空間が自然環境にどの程度近い空間であるかを指標にした「自然度」を把握することが重要である。発明者は、空間の自然度が、空間に存在する空気の質(以下「空気質」とも称する)に影響を受けることを見出した。特に、発明者は、空間の自然度が、空間の空気中に存在する微生物に大きく影響を受けることを見出した。
【0010】
上記課題を解決するために、本発明に係る空間評価システムは、自然環境にどの程度近い空間であるかを指標にした自然度が設定された設定部と、評価対象である対象空間の空気中から採取されたサンプルに含まれる微生物を含む物質の種類、及び、前記物質毎の存在量を示す空気質データから、前記サンプルが採取された前記対象空間の前記自然度を推定する推定部と、を有することを特徴とする。
【0011】
これにより、空間評価システムは、任意に決定され得る対象空間の空気中からサンプルを採取し、採取されたサンプルの空気質データを取得しさえすれば、空気質データのみから自然度を推定することができる。すなわち、空間評価システムは、その都度、対象空間を上空から撮像したり、対象空間において生理反応情報を取得したり、官能評価を行ったりしなくても、空気質データのみから自然度を推定することができる。加えて、空間評価システムは、対象空間が屋内空間のような土壌が存在しない空間であっても、自然環境に近い屋外空間であっても適用可能であり、対象空間の属性に左右されずに自然度を推定することができる。よって、空間評価システムは、未知の空間が自然環境にどの程度近い空間であるかを簡易且つ定量的に評価することができる。
【0012】
更に好ましい態様として、前記設定部には、複数の特定の空間の状態を示す環境データに基づいて前記自然度が設定されており、前記環境データは、環境が異なる前記複数の特定の空間のそれぞれにおいて取得されたデータである。
【0013】
これにより、空間評価システムは、自然度を、環境が異なる様々な空間を客観的に評価できる指標として確立することができる。よって、空間評価システムは、推定部により自然度を精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを精確に評価することができる。
【0014】
更に好ましい態様として、前記環境データは、前記特定の空間においてセンサにより取得された量的データと、前記特定の空間において官能評価により取得された質的データと、を含む。
【0015】
これにより、空間評価システムは、量的データ及び質的データという観点の異なる種々のデータを組み合わせて自然度を算出及び設定することができるので、自然度を、様々な観点から総合的に評価できる蓋然性の高い指標として確立することができる。特に、環境データが、官能評価により取得された質的データを含むことによって、空間評価システムは、自然度を、人の感覚的な評価結果に近い指標として確立することができる。よって、空間評価システムは、推定部により自然度を更に精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを更に精確に評価することができる。
【0016】
更に好ましい態様として、前記複数の特定の空間のそれぞれの空気中から採取された学習用のサンプルの前記空気質データと、前記複数の特定の空間のそれぞれに対応する前記自然度とが、紐付けられたデータセットを教師データとして、前記対象空間の前記空気質データに対する前記自然度の算出を機械学習したものである。
【0017】
これにより、空間評価システムは、任意に決定され得る対象空間の空気質データのみから自然度を更に簡易且つ精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを更に簡易且つ精確に評価することができる。
【0018】
更に好ましい態様として、前記空気質データは、採取装置により採取されたサンプルを分析装置により分析することによって取得され、前記設定部には、前記サンプルを採取する前に前記採取装置に存在する前記物質の前記空気質データ、若しくは、前記サンプルを分析する前に前記分析装置に存在する前記物質の前記空気質データの何れか一方又は両方が、ネガティブコントロールサンプルの前記空気質データとして設定されており、前記推定部は、前記対象空間において採取された前記サンプルの前記空気質データに混入する前記ネガティブコントロールサンプルの前記空気質データの混入割合を推定し、前記ネガティブコントロールサンプルの前記空気質データが除外された前記対象空間の前記空気質データから、前記対象空間の前記自然度を推定する。
【0019】
これにより、空間評価システムは、採取されたサンプル本来の空気質データから自然度を推定することができる。よって、空間評価システムは、推定部により自然度を更に精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを更に精確に評価することができる。
【発明の効果】
【0020】
本発明によれば、評価対象である未知の空間が自然環境にどの程度近い空間であるかを簡易且つ定量的に評価することが可能な新しい空間評価システムを提供することができる。
【図面の簡単な説明】
【0021】
【
図4】BPSの算出手法の妥当性を検証した結果を示す図。
【
図6】BPSの推定モデルを表現したグラフィカルモデルを示す図。
【
図7】BPSの推定モデルに係る機械学習によって抽出されたトピック及びηパラメータを示す図。
【
図8】各サンプルの微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を示す図。
【
図9】
図8に示す各サンプルにおける各トピックの混合割合を示す図。
【
図10】BPSの推定モデルの妥当性を検証した結果を示す図。
【
図11】BPSの推定モデルを用いて対象空間のBPSを推定した結果を示す図。
【
図12】LDAncによるNC推定モデルを表現したグラフィカルモデルを示す図。
【
図13】LDAncによるNC推定モデルの推定精度を検証した結果の一例を示す図。
【
図14】LDAncによるNC推定モデルの推定精度を検証した結果の他の例を示す図。
【発明を実施するための形態】
【0022】
以下、本発明の実施形態について図面を用いて説明する。各実施形態において同一の符号を付された構成は、特に言及しない限り、各実施形態において同様の機能を有し、その説明を省略する。
【0023】
[空間評価システムの構成]
図1を用いて、空間評価システム1の構成について説明する。
図1は、空間評価システム1の構成を示す図である。
【0024】
空間評価システム1は、森林若しくは市街地等の屋外空間、又は、オフィス若しくは住居等の屋内空間を含む様々な空間が、自然環境にどの程度近い空間であるかを評価するシステムである。空間評価システム1は、上記のバイオフィリックデザインを取り入れた空間の具現化に有効である。バイオフィリックデザインのような、自然を感じられる植物との共生空間を構築する空間設計では、空間が自然環境にどの程度近い空間であるかを指標にした「自然度」を把握することが重要である。また、人は、視覚又は聴覚等の感覚刺激に加え、空間の空気質にも影響を受ける。このような空間設計では、空気質にも着目して空間の自然度を評価することが重要である。
【0025】
本実施形態では、空気質にも着目した空間の自然度として、バイオフィリックスコア(Biophilic Score;以下「BPS」とも称する)を導入する。BPSは、温度又は湿度等の空間の状態を示す「環境データ」を統計的手法により分析することによって算出される。なお、環境データの詳細及びBPSの算出については、
図2~
図4を用いて後述する。
【0026】
空間評価システム1は、評価対象である未知の空間(以下「対象空間」とも称する)の空気質を示すデータ(以下「空気質データ」とも称する)から、対象空間のBPSを推定する。対象空間は、屋内空間及び屋外空間を問わない任意に決定され得る空間である。対象空間の空気質データは、対象空間の空気中から採取されたサンプルに含まれる微生物を含む物質の種類、及び、当該物質毎の存在量(相対存在量)を示すデータである。
【0027】
空間評価システム1に用いられるサンプルに含まれる物質としては、微生物の他、無機ガス、揮発性有機化合物又はアレルゲン等が挙げられる。微生物は、様々な環境に存在し、物質循環や宿主の健康状態等に影響を与えることが知られている。対象空間の空気中に存在する微生物は、対象空間の空気質に影響を与える。本実施形態では、空間評価システム1に用いられるサンプルに含まれる物質として微生物にフォーカスし、対象空間の空気質データとして、対象空間の微生物群集構造データを採用する。対象空間の微生物群集構造データは、対象空間の空気中から採取されたサンプルに含まれる微生物群集に属する微生物の種類(微生物系統)、及び、当該微生物毎の存在量(相対存在量)を示すデータである。
【0028】
図1に示すように、空間評価システム1は、演算処理装置10を備える。演算処理装置10は、プロセッサ及び記憶装置等のハードウェアと、プログラム等のソフトウェアとによって構成される。演算処理装置10は、記憶装置に記憶されたプログラムをプロセッサが実行することによって、空間評価システム1の各種機能を実現する。なお、空間評価システム1は、図示していないが、演算処理装置10にデータ等を入力する入力装置と、演算処理装置10の演算処理結果を出力する出力装置を備えてもよい。更に、空間評価システム1は、外部機器との通信を行う通信装置を備えてもよい。
【0029】
演算処理装置10は、対象空間の微生物群集構造データから対象空間のBPSを推定する推定部11と、参照空間の微生物群集構造データ及びBPSが設定された設定部12とを有する。推定部11は、対象空間の微生物群集構造データから対象空間のBPSを推定する数理モデル(以下「推定モデル」とも称する)によって構成される。
【0030】
本実施形態では、推定部11は、複数の参照空間のそれぞれの空気中から採取された学習用のサンプルの微生物群集構造データと、当該複数の参照空間のそれぞれに対応するBPSとが紐付けられたデータセットを教師データとして、対象空間の微生物群集構造データに対するBPSの算出を機械学習したものである。複数の参照空間のそれぞれは、学習用のサンプルを採取するために予め定められた空間である。本実施形態では、複数の参照空間として、森林、公園又は市街地等の種々の屋外空間、オフィス、実験室又は住居等の種々の屋内空間、及び、実験的に作製した屋内の緑化空間が採用されている。参照空間は、特許請求の範囲に記載された「特定の空間」の一例に相当する。
【0031】
推定部11が、上記のデータセットを教師データとして、対象空間の微生物群集構造データに対するBPSの算出を機械学習したものであることにより、空間評価システム1は、対象空間の空気質データのみからBPSを更に簡易且つ精確に推定することができる。よって、空間評価システム1は、未知の空間が自然環境にどの程度近い空間であるかを更に簡易且つ精確に評価することができる。
【0032】
推定部11を構成するBPSの推定モデルが構築されるまでの手順について説明する。推定モデルの学習段階では、まず、予め定められた複数の参照空間のそれぞれにおいて、各参照空間の空気中から学習用のサンプルを採取する。採取された各サンプルに含まれる微生物群集の構造を解析し、複数の参照空間のそれぞれの微生物群集構造データを取得する。また、複数の参照空間のそれぞれにおいて、環境データを取得する。取得された環境データに基づいてBPSを算出する。そして、複数の参照空間のそれぞれの微生物群集構造データと、複数の参照空間のそれぞれに対応するBPSとを紐付けてデータセットを作成する。作成されたデータセットは、設定部12に設定される。設定部12は、当該データセットを教師データとして推定モデルに設定し、対象空間の微生物群集構造データに対するBPSの算出を機械学習により学習させる。このようにして、学習済みの推定モデルが構築される。空間評価システム1では、推定モデルに対する教師データの設定及び機械学習の実行処理が、設定部12によって行われてもよい。
【0033】
推定モデルの学習段階では、上記のデータセットに加えて、ネガティブコントロールサンプル(以下「NCサンプル」とも称する)の微生物群集構造データが、推定モデルに設定される。NCサンプルは、本来的には、参照空間又は対象空間の空気中に存在しない物質である。NCサンプルは、参照空間又は対象空間の空気中からサンプルを採取して微生物群集構造データを取得する過程において混入し得る物質である。NCサンプルは、例えば、空気中からサンプルを採取するために使用されるエアサンプラー等の採取装置、採取されたサンプルの分析装置、又は、試薬等に存在する物質である。本実施形態では、サンプルを採取する前に採取装置に存在する微生物の微生物群集構造データ、若しくは、サンプルを分析する前に分析装置に存在する微生物の微生物群集構造データの何れか一方又は両方が、NCサンプルの微生物群集構造データとして、予め設定部12に設定されている。設定部12は、NCサンプルの微生物群集構造データを推定モデルに設定し、上記のデータセット及びNCサンプルの微生物群集構造データを用いて上記の機械学習を行うことによって、学習済みの推定モデルを構築する。なお、微生物群集構造データの取得については、
図5を用いて後述する。推定モデルに係る機械学習の詳細については、
図6~
図11を用いて後述する。
【0034】
推定部11を構成するBPSの推定モデルによって対象空間のBPSを推定するまでの手順について説明する。BPSの推定モデルの利活用段階では、まず、対象空間の空気中からサンプルを採取する。採取されたサンプルに含まれる微生物群集の構造を解析し、対象空間の微生物群集構造データを取得する。そして、対象空間の微生物群集構造データを、学習済みのBPSの推定モデルに入力し、対象空間のBPSを推定する。このとき、学習済みのBPSの推定モデルでは、対象空間において採取されたサンプルの微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を推定し、NCサンプルの微生物群集構造データが除外された対象空間の微生物群集構造データから、対象空間のBPSを推定する。
【0035】
これにより、空間評価システム1は、対象空間において採取されたサンプル本来の微生物群集構造データからBPSを推定することができる。従来、NCサンプルの微生物群集構造データの混入割合を適切に推定することが難しかったので、対象空間において採取されたサンプル本来の微生物群集構造データを取得することは難しかった。空間評価システム1は、対象空間の微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を推定することができ、採取されたサンプル本来の微生物群集構造データからBPSを推定することができる。よって、空間評価システム1は、推定部11によりBPSを更に精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを更に精確に評価することができる。
【0036】
なお、推定部11は、上記のような機械学習によって構築された推定モデルに限定されない。推定部11は、複数の参照空間のそれぞれにおいて取得された微生物群集構造データとBPSとの関係が記述された、関係式、テーブル又はグラフ等によって構成されてもよい。
【0037】
[BPSの算出]
図2~
図4を用いて、BPSの算出手法について説明する。
図2は、環境データの一例を示す図である。
図3は、BPSの算出手法を説明する図である。
【0038】
BPSは、複数の参照空間のそれぞれにおいて取得された環境データに基づいて算出される。環境データは、環境が異なる複数の参照空間のそれぞれにおいて取得されたデータである。環境が異なる複数の参照空間とは、例えば、コンクリート建造物等の人工物、又は、森林等の自然物の多さが異なる複数の参照空間である。設定部12には、複数の参照空間のそれぞれの状態を示す環境データに基づいて算出されたBPSが設定されている。
【0039】
これにより、空間評価システム1は、BPSを、環境が異なる複数の参照空間を客観的に評価できる指標として確立することができる。よって、空間評価システム1は、推定部11により自然度を精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを精確に評価することができる。
【0040】
一の参照空間において取得される一の環境データは、
図2に示すように、当該参照空間において各種センサにより取得された複数の量的データと、当該参照空間におけるアンケート調査等の官能評価により取得された複数の質的データとを含む。
【0041】
これにより、空間評価システム1は、量的データ及び質的データという観点の異なる種々のデータを組み合わせてBPSを算出及び設定することができるので、BPSを、様々な観点から総合的に評価できる蓋然性の高い指標として確立することができる。特に、環境データが、官能評価により取得された質的データを含むことによって、空間評価システム1は、自然度を、人の感覚的な評価結果に近い指標として確立することができる。よって、空間評価システム1は、推定部11により自然度を更に精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを更に精確に評価することができる。
【0042】
取得された環境データは、当該環境データが取得された参照空間において採取されたサンプルに対応付けられて、
図3の上段に示すようなテーブルに格納される。このテーブルは、
図3の上段に示すように、量的データと質的データとを分けて格納する。
【0043】
BPSは、環境データに対して多因子分析(MFA)を行うことによって算出される。具体的には、まず、環境データに含まれる量的データに対して主成分分析を行うと共に、環境データに含まれる質的データに対して多重対応分析を行い、それぞれに対して特異値分解を行う。データ間のスケールを統一するスケーリング処理として、量的データの全体を量的データの特異値分解で得られた第1特異値で除算すると共に、質的データの全体を質的データの特異値分解で得られた第1特異値で除算する。スケーリング処理が行われた量的データが格納されたテーブルと、スケーリング処理が行われた質的データが格納されたテーブルとを統合する。統合されたテーブルに格納された全データに対して主成分分析を行う。これにより、複数の量的データ及び複数の質的データを含む多次元の環境データは、
図3の下段に示す数直線のように、1次元の連続値データとして次元圧縮される。
【0044】
図3に示す数直線の上側には、各参照空間において採取された各サンプルがプロットされている。
図3に示す数直線の下側には、各参照空間において取得された各環境データに含まれる複数の量的データと複数の質的データとが混在してプロットされている。
図3に示す数直線は、負方向(左方)に向かうに従って「人工的」な環境データが現れ、正方向に向かうに従って「自然的」な環境データが現れる。
図3に示す数直線は、人工環境に近い空間であるか、又は、自然環境に近い空間であるかを相対的に表現する指標を示している。本実施形態では、
図3に示す数直線が示す1次元の連続値データをBPSに定義する。このようにして、BPSは、複数の参照空間のそれぞれにおいて取得された環境データに基づいて算出される。空間評価システム1は、BPSを算出する算出部を有していてもよい。
【0045】
図4は、BPSの算出手法の妥当性を検証した結果を示す図である。
【0046】
図4に示すグラフは、環境データに対して多因子分析を行って得られた第1因子~第20因子と、環境省自然環境局にて公開されている植生自然度の調査結果とのスピアマン相関を計算した結果を示している。
図4に示すように、第1因子におけるスピアマン相関の値は、約0.75と高い値を示している。第2因子~第20因子におけるスピアマン相関の値は、第1因子におけるスピアマン相関の値と有意差をもって低い値を示している。これにより、多次元の環境データを多因子分析によって第1因子に次元圧縮したデータをBPSとして定義することは妥当であると考えられる。
【0047】
なお、
図2に示す環境データでは、量的データの1つとして「周辺緑化率」が含まれているが、「周辺緑化率」の代わりに、NDVI(Normalized Difference Vegetation Index)を採用してもよい。NDVIは、可視域及び近赤外域の各電磁波に対する植物の各反射率を人工衛星等から取得して算出された植生指標である。これにより、参照空間周辺の正確な緑化率が算出され得る。
【0048】
[微生物群集構造データの取得]
図5を用いて、微生物群集構造データの取得について説明する。
図5は、微生物群集構造データの取得手順を示す図である。
【0049】
ステップS501において、まず、参照空間の空気中からサンプルを採取する。具体的には、Sartorius社製のMD8エアスキャン又はエアポート等の採取装置、及び、ゼラチンフィルタを使用し、3000Lの空気を吸引して空気中の微生物群集をゼラチンフィルタに吸着させる。
【0050】
ステップS502において、採取されたサンプルからDNAを抽出する。具体的には、ゼラチンフィルタを溶解及び濾過し、QIAGEN社製のDNeasy PowerWater Kitを使用して、DNAを抽出する。
【0051】
ステップS503において、ライブラリを調整する。具体的には、16S rRNAのV1-V2領域を標的としたプライマーを使用し、Illumina社の標準プロトコルに従ってPCR増幅を行い、ライブラリを調製する。
【0052】
ステップS504において、DNAシーケンスを行う。具体的には、シーケンサとしてIllumina社製のiSeq 100を使用し、150bp×2のペアエンドシーケンスを行う。
【0053】
ステップS505において、メタゲノム解析を行う。具体的には、シーケンサにより得られたリードからアダプター配列を除外した後、Forwardリードのみに対してQiime2を用いてメタゲノム解析を行う。これにより、参照空間の空気中から採取されたサンプルの微生物群集構造データが取得される。
【0054】
なお、対象空間の空気中から採取されたサンプルの微生物群集構造データを取得する手順についても、上記のステップS501~ステップS505と同様である。また、NCサンプルの微生物群集構造データを取得する手順についても、ステップS501において参照空間又は対象空間の空気中からサンプルを採取すること以外は、上記のステップS502~ステップS505と同様である。
【0055】
[BPSの推定モデルに係る機械学習]
図6~
図11を用いて、BPSの推定モデルに係る機械学習について説明する。
図6は、BPSの推定モデルを表現したグラフィカルモデルを示す図である。
【0056】
微生物群集構造データのような多変量データからBPSのような数値データへの変換を学習する手法としては、多くの機械学習の手法が適用可能である。なかでも、ランダムフォレスト又は深層学習等の非線形変換手法は、予測の精度が高いことが知られており、多くの活用事例がある。しかしながら、これらの非線形変換手法は、一般的に変換規則の解釈が難しい。また、本実施形態では、微生物群集構造データとBPSとの関係性が明示される推定モデルを構築できることが望ましい。例えば、微生物群集構造データに対して、どのような部分群集(微生物群集を構成する単位。「サブコミュニティ」とも称する)を付加又は除外すればBPSが変化するのかが明示される推定モデルを構築できることが望ましい。更に、微生物群集構造データの取得過程は、本質的に確率論的な現象である。サンプルに含まれる「真の微生物群集」を直接観測することは、一般的に不可能であり、微生物群集構造データは、常に、サンプルからの確率論的なサンプリングによって取得される。深層学習等の決定論的な手法では、このようなデータの確率論的な性質を捉えることは容易ではない。
【0057】
そこで、本実施形態では、BPSの推定モデルに係る機械学習の手法として、トピックモデルの1つである教師あり潜在ディリクレ分配法(supervised Latent Dirichlet Allocation;以下「sLDA」とも称する)を採用する。そして、本実施形態では、NCサンプルの微生物群集構造データが推定モデルに予め設定される。sLDAは、補助情報とカウントデータを同時に学習して「トピック」を抽出するモデリング手法である。sLDAでは、それぞれのトピックが「補助情報の回帰係数」(1次元の連続値)とリンクする。なお、本実施形態では、BPSの推定モデルに係る機械学習の手法として、sLDAを採用したが、他の手法を採用してもよい。
【0058】
【0059】
【0060】
【0061】
【0062】
【0063】
【0064】
【0065】
【0066】
【0067】
【0068】
【0069】
【0070】
【0071】
図7は、BPSの推定モデルに係る機械学習によって抽出されたトピック及びηパラメータを示す図である。
【0072】
BPSの推定モデルでは、自然界に本質的に何らかの微生物群集のパターン(部分群集)が存在すると仮定している。この微生物群集のパターンは、人に由来する微生物が多い部分群集と、自然に由来する微生物が多い部分群集とに分けることができ、上記のトピックに該当する。実際に空気中から採取されたサンプルでは、これらのトピックが混ざり合って存在する。トピックの混ざり方(どのトピックがどの程度優勢か)は、サンプルによって様々である。更に、サンプルにはトピックのメンバーである微生物の全てが観測されるわけではなく、トピックの群集構造(微生物の種類及びその存在量)に応じて確率的にサンプリングされた結果が観測される。
【0073】
また、各サンプルは、微生物群集構造データに独立して算出されたBPSを有している。BPSの推定モデルでは、BPSが、サンプル毎の「トピックの混ざり具合(混合割合)」によって規定されていると仮定している。例えば、或るトピックはBPSに負の影響(BPSを減少させる影響)を与え、他の或るトピックはBPSに正の影響(BPSを増加させる影響)を与える。BPSの増減に対する各トピックの影響を表すパラメータが、ηパラメータである。BPSの推定モデルでは、各サンプルのBPSが、各サンプルにおけるトピックの混合割合(トピック組成)とηパラメータとの内積によって算出されると仮定している。
【0074】
本実施形態では、参照空間の空気中から採取された585個のサンプルを用意し、各サンプルの微生物群集構造データ及びBPSを取得した。更に、NCサンプルとして27個のサンプルを用意し、その微生物群集構造データを取得した。これらのデータを推定モデルに設定して機械学習を行い、Topic#0~Topic#11の12個のトピックを抽出した。トピックの抽出数(12個)は、トピックの抽出数を増加させてもモデルの推定精度が大きく向上しない数であることを予め検証した上で設定されている。
【0075】
図7には、抽出されたTopic#0~Topic#11の各トピックのηパラメータをプロットした数直線と、それぞれのトピックに属する上位5種の微生物の種類及びその存在量が示されている。
図7を参照すると、Topic#5及びTopic#11のようなηパラメータが負であるトピックでは、下線で示すように、「Propionibacterium」等のヒト共生細菌のような、人に由来する微生物が多く属している傾向にあることが分かる。また、
図7を参照すると、Topic#2及びTopic#10のようなηパラメータが正であるトピックでは、囲み線で示すように、「Sorangium」等の土壌細菌のような、自然に由来する微生物が多く属している傾向にあることが分かる。すなわち、ηパラメータが負であるトピックはBPSに対して負の影響が大きく、ηパラメータが正であるトピックはBPSに対して正の影響が大きいと考えることができる。よって、ηパラメータが負であるトピックの混合割合が大きいほど人工環境に近い空間における微生物群集構造データであり、ηパラメータが正であるトピックの混合割合が大きいほど自然環境に近いと空間における微生物群集構造データであると考えることができる。
【0076】
図8は、各サンプルの微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を示す図である。
図9は、
図8に示す各サンプルにおける各トピックの混合割合を示す図である。
【0077】
図8に示すグラフは、学習用のサンプル(585個)からランダムに20個のサンプルをピックアップし、ピックアップされた各サンプルの微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を推定した結果を示している。
図8において、「Target data」は各サンプルの微生物群集構造データの割合(相対存在量)を示し、「Negative controls」は、NCサンプルの微生物群集構造データの割合(相対存在量)を示している。
図9に示すグラフは、
図8から「Negative controls」を除外し、「Target data」の部分を100%として各サンプルにおけるトピックの混合割合(相対存在量)を算出した結果を示している。すなわち、
図9は、NCサンプルの微生物群集構造データが除外された
図8に示す各サンプルにおけるトピックの混合割合を示している。また、
図8及び
図9に示すグラフでは、図の上からBPSが小さい順に各サンプルを並べている。
【0078】
図8に示す「サンプル#1」や「サンプル#5」のサンプルのように、NCサンプルの微生物群集構造データの混入割合が50%を超えるサンプルも存在する。したがって、各サンプルにおいて各トピックの混合割合を精確に抽出するためには、各サンプルの微生物群集構造データからNCサンプルの微生物群集構造データが除外されることが好ましい。
【0079】
図9に示すように、BPSが小さいサンプルでは、Topic#5及びTopic#11のようなηパラメータが負であるトピックが多く含まれる傾向にあることが分かる。BPSが大きいサンプルでは、Topic#2及びTopic#10のようなηパラメータが正であるトピックが多く含まれる傾向にあることが分かる。
図7~
図9によれば、本実施形態のBPSの推定モデルは、BPSに沿ったトピックを抽出することが可能であると言える。
【0080】
図10は、BPSの推定モデルの妥当性を検証した結果を示す図である。
【0081】
本実施形態では、5分割交差検証(5-fold cross validation)によって推定モデルの妥当性を検証した。具体的には、まず、585個の各サンプルのデータセット(微生物群集構造データ及びBPS)群を5つに分割する。分割された5つのデータセット群のうちの4つを学習用のサンプルのデータセット群とし、残りの1つを擬似的にテスト用のサンプルのデータセット群として隔離する。学習用のサンプルのデータセット群を用いて、上記の機械学習を行う。テスト用のデータセット群の各微生物群集構造データを、学習済みの推定モデルに入力されるテストデータとし、テスト用のデータセット群の各BPSを、正解データとする。学習済みの推定モデルにテストデータを入力してBPSを推定し、正解データと比較する。このような処理を5回繰り返すことによって、推定モデルの妥当性を検証した。
【0082】
学習済みの推定モデルにテストデータを入力してBPSを推定する際、まず、テストデータの微生物群集構造データから、当該推定モデルのパラメータを用いて、各テストデータにおける各トピックの混合割合(トピック組成)を推定する。その後、各テストデータにおける各トピックの混合割合とηパラメータとの内積を算出して、BPSに変換する。このような処理によって、テストデータからBPSを推定した。
【0083】
図10に示すグラフは、テストデータによるBPSの推定結果と正解データとのスピアマン相関を計算した結果を示している。
図10の縦軸は、テストデータによるBPSの推定結果を示し、
図10の横軸は、正解データを示している。
図10の各点は、テスト用のサンプルを示している。テストデータによるBPSの推定結果と正解データとのスピアマン相関の値は、約0.79と高い値を示している。これにより、本実施形態のBPSの推定モデルは、妥当であると考えられる。
【0084】
図11は、BPSの推定モデルを用いて対象空間のBPSを推定した結果を示す図である。
【0085】
図11には、BPSの数直線が示されている。
図11に示す数直線の上側には、
図3と同様に、各参照空間において採取された各サンプルがプロットされている。
図11に示す数直線の下側には、各対象空間において採取された各サンプルがプロットされている。対象空間において採取された各サンプルは、BPSの算出や推定モデルの構築に用いられていない未知のサンプルである。対象空間において採取された各サンプルの微生物群集構造データを、学習済みのBPSの推定モデルに入力し、対象空間のBPSを推定した。ホテル屋内において採取されたサンプルAでは、人工環境に近い空間を示す負側(左側)のBPSが推定された。都市部公園において採取されたサンプルBでは、人工環境及び自然環境の中間的な空間を示すBPSが推定された。三重県の山林において採取されたサンプルCでは、自然環境に近い空間を示す正側(右側)のBPSが推定された。岐阜県の山林において採取されたサンプルDでは、サンプルCよりも自然環境に近い空間を示す正側(右側)のBPSが推定された。
【0086】
[作用効果]
以上のように、本実施形態の空間評価システム1は、自然環境にどの程度近い空間であるかを指標にした自然度(BPS)が設定された設定部12を有する。更に、本実施形態の空間評価システム1は、評価対象である対象空間の空気中から採取されたサンプルに含まれる微生物を含む物質の種類、及び、当該物質毎の存在量を示す空気質データ(微生物群集構造データ)から、サンプルが採取された対象空間の自然度(BPS)を推定する推定部11を有する。
【0087】
これにより、本実施形態の空間評価システム1は、任意に決定され得る対象空間の空気中からサンプルを採取し、採取されたサンプルの空気質データを取得しさえすれば、空気質データのみから自然度を推定することができる。すなわち、本実施形態の空間評価システム1は、その都度、対象空間を上空から撮像したり、対象空間において生理反応情報を取得したり、官能評価を行ったりしなくても、空気質データのみから自然度を推定することができる。加えて、本実施形態の空間評価システム1は、対象空間が屋内空間のような土壌が存在しない空間であっても、自然環境に近い屋外空間であっても適用可能であり、対象空間の属性に左右されずに、空気質データのみから自然度を推定することができる。従来、無機ガス又は揮発性有機化合物等で空気の汚染度合を指標化し、評価している例はあるが、自然度の評価を目的として空気質データを用いることは前例がない。当然ながら、空気質データから自然度を推定するモデルについても前例がない。本実施形態の空間評価システム1は、任意に決定され得る対象空間の空気質データのみから自然度を推定することができる。よって、本実施形態の空間評価システム1は、未知の空間が自然環境にどの程度近い空間であるかを簡易且つ定量的に評価することができる。
【0088】
また、本実施形態の空間評価システム1は、推定部11を構成する自然度の推定モデルに係る機械学習が、トピックモデルの1つであるsLDAによって行われる。
【0089】
これにより、本実施形態の空間評価システム1は、例えば、微生物群集構造データに存在する自然度に影響を与える部分群集の構造(すなわちトピック)を抽出することができる。よって、本実施形態の空間評価システム1は、推定部11により自然度を更に精確に推定することができるので、未知の空間が自然環境にどの程度近い空間であるかを更に精確に評価することができる。
【0090】
上記のように、推定モデルに係る機械学習の手法としては、ランダムフォレスト又は深層学習等の機械学習の手法が適用可能である。しかし、これらの手法では、例えば、微生物群集構造データに存在する自然度に影響を与える部分群集の構造を抽出することは容易ではない。更に、例えば、微生物群集構造データの取得過程は、本質的に「真の微生物群集」からのサンプリングプロセスであるので、データの確率的なゆらぎがノイズとして含まれることは避けられない。深層学習等の決定論的な手法では、このようなデータの確率論的な性質を捉えることは容易ではなく、確率論的なサンプリングプロセスを明示的にモデリングすることは容易ではない。しかも、例えば、微生物群集構造データによっては、必ずしも十全にサンプリングができているとは限らず、スパースなデータが多く存在する。よって、深層学習等の決定論的な手法では、過学習を防ぐ正則化手段の選択も困難となり得る。このようなことから、推定モデルは、確率モデルであり、部分群集の構造を抽出することが可能であり、且つ、数値情報への回帰を学習するモデリング手法として、本実施形態のsLDAを用いた手法が有効である。
【0091】
しかも、本実施形態の空間評価システム1は、上記のような自然度に影響を与えるトピックを抽出することができるので、どのようなトピックを付加又は除外すれば自然度が変化するのかが明示され得る。したがって、本実施形態の空間評価システム1は、所望の自然度を得るために必要な空気質に係る物質の種類及び存在量を、簡易且つ定量的に把握することができる。よって、本実施形態の空間評価システム1は、所望の自然度となる空間の設計指針を、簡易且つ定量的に策定することができる。
【0092】
[ネガティブコントロールに関する他の実施形態]
図12~
図14を用いて、ネガティブコントロールに関する他の実施形態について説明する。
【0093】
上記の実施形態において、推定部11を構成するBPSの推定モデルは、上記のデータセット(微生物群集構造データ及びBPS)及びNCサンプルの微生物群集構造データを用いて、sLDAによって機械学習が行われていた。学習済みの推定モデルは、対象空間において採取されたサンプルの微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を推定し、NCサンプルの微生物群集構造データが除外された対象空間の微生物群集構造データから、対象空間のBPSを推定していた。
【0094】
ここで、NCサンプルの微生物群集構造データの混入割合を推定するモデル(以下「NC推定モデル)とも称する)自体は、
図6に示したsLDAとは異なる手法によって構築することができる。本実施形態では、NC推定モデルに係る機械学習の手法として、トピックモデルの1つである通常(教師なし)の潜在ディリクレ分配法(以下「LDA」とも称する)を拡張した手法を採用する。具体的には、NC推定モデルに係る機械学習の手法として、通常のLDAに対して、NCサンプルの微生物群集構造データの混入割合の推定するため計算式を追加した手法(以下「LDAnc」とも称する)を採用する。
【0095】
図12は、LDAncによるNC推定モデルを表現したグラフィカルモデルを示す図である。
【0096】
LDAncによるNC推定モデルを記述する数式に用いられる変数は、上記の
図6を用いた説明と同様である。NCサンプルの微生物群集構造データは、上記の
図5を用いた説明と同様に、採取装置、分析装置又は試薬等に存在する微生物に対してメタゲノム解析を行い、当該微生物の系統組成を明らかにすることによって、事前に取得しておく。LDAncでは、NCサンプルの群集構造を固定する一方、トピックの群集構造は未知であるとして、通常のLDAと同様に、ギブスサンプリングによってパラメータを更新する。LDAncは、未知の部分群集を推定するLDAの利点と、既知の部分群集の混合割合を推定するSource Trackerの利点とを折衷した手法である。
【0097】
【0098】
【0099】
【0100】
最後に、それぞれのDNA配列に割り当てられた番号を調べ、NCサンプルに対応する番号が割り当てられたDNA配列を特定する。そして、サンプル中のDNA配列全体のうち、NCサンプルに対応する番号が割り当てられたDNA配列が占める割合を計算する。これにより、NCサンプルの混入割合を推定することができる。
【0101】
図13は、LDAncによるNC推定モデルの推定精度を検証した結果の一例を示す図である。
図14は、LDAncによるNC推定モデルの推定精度を検証した結果の他の例を示す図である。
【0102】
この検証は、擬似的に画像を用いて行った。具体的にては、正解データとして10個の画像と、テストデータとして30個の画像を用意した。正解データの10個の画像は、部分群集に相当する所定の色及び形状を有するパターンが、画像毎に異なる画素領域に配置されたものである。テストデータの30個の画像は、部分群集に相当する当該パターンを各画像においてランダムに混合させたものである。そして、LDAncによるNC推定モデルと通常のLDAによるNC推定モデルとにおいて、テストデータから、正解データの当該パターンを推定させた。この際、通常のLDAによるNC推定モデルでは、10個の正解データが全て未知であるとして、正解データの当該パターンを推定させた。LDAncによるLDAによるNC推定モデルでは、10個の正解データのうちの2個が既知であり残りの8個が未知であるとして、正解データの当該パターンを推定させた。そして、推定された当該パターンと、正解データの当該パターンとの平均絶対誤差(Mean Absolute Error;以下「MAE」とも称する)を算出した。このような処理を100回繰り返し、各NC推定モデルにおけるMAEの分布を求めた。
【0103】
図13には、各NC推定モデルにおけるMAEの分布が示されている。LDAncによるNC推定モデルのMAEは、通常のLDAによるNC推定モデルよりも小さくなっていることが分かる。これにより、LDAncによるNC推定モデルは、通常のLDAによるNC推定モデルよりも、推定精度が高くなっていることが分かる。
【0104】
図14には、テストデータの数を変化させた場合の、各NC推定モデルにおけるMAEの推移が示されている。LDAncによるNC推定モデルのMAEは、通常のLDAによるNC推定モデルよりも全体的に小さくなっていることが分かる。これにより、LDAncによるNC推定モデルは、通常のLDAによるNC推定モデルよりも、推定精度が高くなっていることが分かる。特に、テストデータの数が少ない場合には、LDAncによるNC推定モデルのMAEは、通常のLDAによるNC推定モデルよりも顕著に小さくなっていることが分かる。これにより、LDAncによるNC推定モデルは、特にテストデータの数が少ない場合、通常のLDAによるNC推定モデルよりも有効であることが分かる。また、LDAncによるNC推定モデルのMAEは、テストデータの数を変化に応じて、通常のLDAによるNC推定モデルよりもばらつきが小さいことが分かる。これにより、LDAncによるNC推定モデルは、通常のLDAによるNC推定モデルよりも、推定精度が安定していることが分かる。
【0105】
このように、LDAncによるNC推定モデルは、通常のLDAによるNC推定モデルよりも高い推定精度で、対象空間において採取されたサンプルの微生物群集構造データに混入するNCサンプルの微生物群集構造データの混入割合を推定することができる。LDAncによるNC推定モデルは、推定されたNCサンプルの微生物群集構造データの混入割合を、対象空間において採取されたサンプルの微生物群集構造データから差し引くことによって、採取されたサンプル本来の微生物群集構造データを取得することができる。
【0106】
なお、LDAncによるNC推定モデルは、微生物群集構造データに限定されず、微生物群集構造データ以外の空気質データ又は文書データ等の他のカウントデータについても適用することができる。また、LDAncによるNC推定モデルは、空間評価システム1の演算処理装置10に備えられた推定部11の一部を構成することができる。
【0107】
以上、本発明の実施形態について詳述したが、本発明は、上記の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の精神を逸脱しない範囲で、種々の設計変更を行うことができる。本発明は、或る実施形態の構成を他の実施形態の構成に追加したり、或る実施形態の構成を他の実施形態と置換したり、或る実施形態の構成の一部を削除したりすることができる。
【符号の説明】
【0108】
1…空間評価システム、10…演算処理装置、11…推定部、12…設定部