IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人福岡大学の特許一覧 ▶ 独立行政法人国立成育医療研究センターの特許一覧

特開2023-109481妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム
<>
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図1
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図2
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図3
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図4
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図5A
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図5B
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図6A
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図6B
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図7
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図8
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図9
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図10
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図11
  • 特開-妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023109481
(43)【公開日】2023-08-08
(54)【発明の名称】妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム
(51)【国際特許分類】
   C12Q 1/04 20060101AFI20230801BHJP
   C12M 1/34 20060101ALI20230801BHJP
   G01N 33/48 20060101ALI20230801BHJP
   G01N 33/50 20060101ALI20230801BHJP
   G01N 33/68 20060101ALI20230801BHJP
   C12Q 1/68 20180101ALI20230801BHJP
   C12Q 1/6869 20180101ALI20230801BHJP
   C12N 1/20 20060101ALN20230801BHJP
【FI】
C12Q1/04
C12M1/34 D
G01N33/48 M
G01N33/50 J
G01N33/68
C12Q1/68 100Z
C12Q1/6869 Z
C12N1/20 A
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022011019
(22)【出願日】2022-01-27
(71)【出願人】
【識別番号】598015084
【氏名又は名称】学校法人福岡大学
(71)【出願人】
【識別番号】510136312
【氏名又は名称】国立研究開発法人国立成育医療研究センター
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100145104
【弁理士】
【氏名又は名称】膝舘 祥治
(74)【代理人】
【識別番号】100163902
【弁理士】
【氏名又は名称】市川 奈月
(72)【発明者】
【氏名】宮本 新吾
(72)【発明者】
【氏名】漆山 大知
(72)【発明者】
【氏名】柴田 磨己
(72)【発明者】
【氏名】秦 健一郎
【テーマコード(参考)】
2G045
4B029
4B063
4B065
【Fターム(参考)】
2G045AA25
2G045DA36
4B029AA07
4B029BB02
4B029FA01
4B063QA01
4B063QA18
4B063QA19
4B063QQ06
4B065AA01X
4B065AA30X
4B065AA49X
4B065BA22
4B065CA46
(57)【要約】
【課題】絨毛膜羊膜炎の発症の予測を容易かつ高精度に行う。
【解決手段】予測方法は、対象者の絨毛膜羊膜炎の発症を予測する方法であって、対象者の生体情報として、対象者の試料から得られた少なくとも1以上の細菌の組成情報と、対象者の少なくとも1以上の臨床情報とを取得し、過去に得られた複数の妊婦の生体情報と、当該妊婦の絨毛膜羊膜炎の発症歴との関係を利用して得られた値を用いて、対象者の生体情報で特定される所定のマトリクスを生成し、マトリクスを用いて、対象者の絨毛膜羊膜炎の発症を予測する。
【選択図】図1
【特許請求の範囲】
【請求項1】
対象者に生じる妊娠関連有害事象の発生を予測する予測方法であって、
前記対象者の生体情報として、前記対象者の試料から得られた少なくとも1以上の細菌の組成情報と、前記対象者の少なくとも1以上の臨床情報とを取得し、
過去に得られた複数の妊婦の前記生体情報と、当該妊婦に生じた妊娠関連有害事象の発生との関係を利用して得られた値を用いて、前記対象者の前記生体情報で特定される所定のマトリクスを生成し、
前記マトリクスを用いて、前記対象者の妊娠関連有害事象の発生を予測する、
予測方法。
【請求項2】
前記妊娠関連有害事象は、絨毛膜羊膜炎である
請求項1に記載の予測方法。
【請求項3】
過去に得られた複数の妊婦の前記生体情報は、前記複数の妊婦から得られた前記試料に前記細菌が含まれる程度を示す第1の数値と、前記複数の妊婦の前記臨床情報を示す第2の数値との組み合わせを含み、
前記マトリクスは、前記対象者から得られた前記試料に前記細菌が含まれる程度を示す第1の数値と、前記対象者の前記臨床情報を示す第2の数値とを含む
請求項2記載の予測方法。
【請求項4】
前記第1の数値及び前記第2の数値は、所定の閾値に応じて得られた0又は1のいずれかの値である請求項3記載の予測方法。
【請求項5】
前記マトリクスを構成する各値の合計値を所定の閾値と比較して、前記対象者の絨毛膜羊膜炎の発症を予測する請求項3又は4記載の予測方法。
【請求項6】
前記細菌は、下記で示される細菌群から選択された少なくともいずれかを含む請求項2乃至5のいずれか1記載の予測方法。
細菌群
・ラクトバチルス・イナース(Lactobacillus iners)
・ラクトバチルス・クリスパータス(Lactobacillus crispatus)
・ラクトバチルス・ガゼリ(Lactobacillus gasseri)
・ガードネレラ・バギナリス(Gardnerella vaginalis)
・アトポビウム・バギナエ(Atopobium vaginae)
・ラクトバチルス・ジェンセニイ(Lactobacillus jensenii)
・ウレアプラズマ・パルハム(Ureaplasma parvum)
・メガスファエラ・ゲノモスプ・タイプ1(Megasphaera genomosp. type_1)
・ストレプトコッカス・アガラクティアエ(Streptococcus agalactiae)
【請求項7】
前記臨床情報は、対象者の年齢、妊娠歴、出産歴、心拍数、白血球数、CRP値、体温、子宮頸管長からなる群から選択された少なくともいずれかを含む請求項2乃至6のいずれか1記載の予測方法。
【請求項8】
コンピュータに、請求項2乃至7のいずれか1記載の方法を実行させるコンピュータプログラム。
【請求項9】
対象者の絨毛膜羊膜炎の発症を予測する予測装置であって、
前記対象者の生体情報として、前記対象者の試料から得られた少なくとも1以上の細菌の組成情報と、前記対象者の少なくとも1以上の臨床情報とを受け付ける受付部と、
過去に得られた複数の妊婦の前記生体情報と、当該妊婦の前記絨毛膜羊膜炎の発症歴との関係を利用して得られた値を用いて、前記対象者の前記生体情報で特定される所定のマトリクスを生成し、前記マトリクスを用いて、前記対象者の絨毛膜羊膜炎の発症を予測する予測部と、
を備える予測装置。
【請求項10】
前記過去の複数の妊婦の生体情報は、前記複数の妊婦から得られた前記試料に前記細菌が含まれる程度を示す第1の数値と、前記複数の妊婦の前記臨床情報を示す第2の数値との組み合わせを含み、
前記予測部は、前記対象者から得られた前記試料に前記細菌が含まれる程度を示す第1の数値と、前記対象者の前記臨床情報を示す第2の数値とを含むマトリクスを生成する
請求項9記載の予測装置。
【請求項11】
前記予測部は、
前記対象者の試料から得られた値を、項目毎に予め定められる所定の閾値と比較して求めた0又は1の値を前記第1の数値として利用し、
前記対象者の臨床情報を、項目毎に予め定められる所定の閾値と比較して求めた0又は1の値を前記第2の数値として利用する
請求項10記載の予測装置。
【請求項12】
前記予測部は、
前記マトリクスを構成する各値の合計値を所定の閾値と比較して、前記対象者の絨毛膜羊膜炎の発症を予測する請求項10又は11記載の予測装置。
【請求項13】
機械学習を利用して、前記予測部で利用する前記閾値を算出する算出部をさらに備える
請求項12に記載の予測装置。
【請求項14】
機械学習を利用して、前記予測部でマトリクスの生成に利用する生体情報の種別及び項目数を再選択する選択部をさらに備える
請求項13に記載の予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、妊娠関連有害事象の発生、例えば、絨毛膜羊膜炎の発症を予測する予測方法、予測装置及びコンピュータプログラムに関する。
【背景技術】
【0002】
絨毛膜羊膜炎は、胎児付属物である卵膜に細菌が感染して生じる炎症性疾患である。絨毛膜羊膜炎は、早産を引き起こす病態であり、また出生後の児の予後、例えば、中枢神経系障害、慢性呼吸障害等の後遺症と密接に関わっているとされる。
【0003】
絨毛膜羊膜炎の診断方法として、羊水から特定の微生物の検出を利用するものが知られている。また、近年、対象者の膣に由来する試料に含まれる特定の遺伝子の塩基配列のデータ群に基づいて、細菌の存在を検出して絨毛膜羊膜炎の発症を予測する技術もある(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2021/112236号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の方法では、塩基配列のデータ群を利用して絨毛膜羊膜炎の発症を予測する際、特定細菌の菌種数に基づいて絨毛膜羊膜炎の発症を予測するが、より容易かつより高精度に予測する方法が求められている。また、菌種数のみによっては高精度な予測が困難な場合もあった。
【0006】
また、絨毛膜羊膜炎の発生の他、流産、早産、不妊症、妊娠高血圧症候群、胎児感染、新生児感染等の妊娠関連有害事象も、子宮内の特定細菌の菌種数と密接な関係がある。したがって、このような妊娠関連有害事象も、特定細菌の菌種数等を用いて予測可能であると考えられる。
【0007】
上記に鑑み、本発明は、絨毛膜羊膜炎の発症等の妊娠関連有害事象の発生を容易かつ高精度に予測する予測方法、予測装置及びコンピュータプログラムに関する。
【課題を解決するための手段】
【0008】
本開示に係る予測方法は、対象者の絨毛膜羊膜炎の発症等の妊娠関連有害事象を予測する予測方法であって、前記対象者の生体情報として、前記対象者の試料から得られた少なくとも1以上の細菌の組成情報と、前記対象者の少なくとも1以上の臨床情報とを取得し、過去に得られた複数の妊婦の前記生体情報と、当該妊婦の前記絨毛膜羊膜炎の発症歴との関係を利用して得られた値を用いて、前記対象者の前記生体情報で特定される所定のマトリクスを生成し、前記マトリクスを用いて、前記対象者の絨毛膜羊膜炎の発症を予測する。
【発明の効果】
【0009】
本開示の予測方法、予測装置及びコンピュータプログラムによれば、絨毛膜羊膜炎の発症等の妊娠関連有害事象の発生の予測を容易かつ高精度に行うことができる。
【図面の簡単な説明】
【0010】
図1】予測装置の構成を示すブロック図である。
図2】予測装置で生成されるマトリクス及びマトリクスを利用して得られるリスクスコアの一例である。
図3】予測装置で利用する細菌情報の生成処理の一例を説明するフローチャートである。
図4】予測装置で実行される予測処理の一例を説明するフローチャートである。
図5A】予測装置で実行される閾値の算出及び項目の選択の処理を説明するフローチャートである。
図5B図5Aに続いて予測装置で実行される閾値の算出及び項目の選択の処理を説明するフローチャートである。
図6A】閾値の算出に利用されるROC曲線の一例である。
図6B】閾値の算出に利用される別の項目のROC曲線の一例である。
図7】臨床情報の各項目について得られた値の一例である。
図8】複数の妊婦の細菌情報を用いて得られたマトリクスの一例である。
図9】複数の細菌情報の重要度を降順で示す一例である。
図10】複数の細菌種のグループにいて得られた値の一例である。
図11】複数の妊婦の生体情報を用いて得られたマトリクス及びリスクスコアの一例である。
図12】リスクスコアの閾値の算出に利用されるROC曲線の一例である。
【発明を実施するための形態】
【0011】
以下に、図面を参照して本開示に係る予測方法、予測装置及びコンピュータプログラムについて説明する。本開示に係る予測方法、予測装置及びコンピュータプログラムは、対象者の絨毛膜羊膜炎の発症等の妊娠関連有害事象の発生の可能性の程度を予測する。以下では、妊娠関連有害事象の発生の可能性の程度は、発生する可能性の高低、すなわち、発生する可能性が“高い(ハイリスクである)”又は“低い(ハイリスクでない、またはローリスクである)”のいずれかを予測するものとする。具体的には、発生する可能性がある割合(例えば、50%)以上であるとき発生する可能性が高いとし、ある割合未満であるとき発生する可能性は低い等と予め定めることができる。しかしながら、発生する可能性を“10%”、“50%”、“70%”等の割合で予測するものであってもよい。以下の説明では、同一の構成について、同一の符号を付して説明を省略する。
【0012】
以下の説明において「対象者」は、絨毛膜羊膜炎の発症等の妊娠関連有害事象の発生の可能性の高低に関する予測の対象となる者である。また、「妊娠関連有害事象」とは、例えば、絨毛膜羊膜炎、妊娠高血圧症候群、流産又は早産等の正産期前の出産、不妊症、胎児感染、新生児感染等の妊娠に事象である。なお、以下では、「妊娠関連有害事象の発生の可能性の予測」に関し、「絨毛膜羊膜炎の発生の可能性の高低に関する予測」を例として説明する。
【0013】
〈予測装置〉
図1を用いて、実施形態に係る予測装置1について説明する。予測装置1は、演算装置11、記憶装置12、入力装置13、出力装置14及び通信装置15を備える情報処理装置によって実現される。
【0014】
演算装置11は、予測装置1全体の制御を司るコントローラである。演算装置11は、記憶装置12に記憶される予測プログラムPを実行することにより、受付部111及び予測部112としての処理を実行し、対象者の絨毛膜羊膜炎の発症の予測に関する種々の処理を実行しうる。また、演算装置11は、算出部113としての処理を実行し、予測に用いる閾値の算出に関する種々の処理を実行しうる。さらに、演算装置11は、選択部114としての処理を実行し、予測に用いる項目の選択に関する種々の処理を実行しうる。演算装置11は、ハードウェアとソフトウェアの協働により所定の機能を実現する構成に限定されず、所定の機能を実現する専用に設計されたハードウェア回路でもよい。すなわち、演算装置11は、CPU、MPU、GPU、FPGA、DSP、ASIC等、種々のプロセッサで実現することができる。
【0015】
記憶装置12は、種々の情報を記録する記憶媒体である。記憶装置12は、例えば、RAM、ROM、フラッシュメモリ、SSD(Solid State Drive)、ハードディスクドライブ、その他の記憶デバイス又はそれらを適宜組み合わせて実現される。記憶装置12は、演算装置11が実行するコンピュータプログラムである予測プログラムPの他、予測の処理で用いられる閾値データD1及び予測の処理で得られた履歴データD2等が格納される。
【0016】
入力装置13は、予測のリクエストやデータの入力に利用される操作ボタン、キーボード、マウス、タッチパネル、マイクロフォン等の入力手段である。また、出力装置14は、予測結果やデータの出力に利用されるディスプレイ、スピーカ等の出力手段である。
【0017】
通信装置15は、外部の装置(例えば、データ群を記憶する記憶媒体)とのデータ通信を可能とするための通信手段である。データ通信は、無線および/または有線による公知の通信規格にしたがって行われ得る。例えば、有線によるデータ通信は、イーサネット(登録商標)規格、および/またはUSB(登録商標)規格等に準拠して動作する半導体集積回路の通信コントローラを通信装置15として用いることによって行われる。また無線によるデータ通信は、LAN(Local Area Network)に関するIEEE802.11規格、および/または移動体通信に関する、いわゆる4G/5Gと呼ばれる、第4世代/第5世代移動通信システム等に準拠して動作する半導体集積回路の通信コントローラを通信装置15として用いることによって行われる。
【0018】
受付部111は、対象者の生体情報を受け付ける。受付部111が取得する生体情報は、対象者の試料から得られた少なくとも1以上の細菌の組成情報と、対象者の少なくとも1以上の臨床情報とを含む。受付部111が取得する細菌の組成情報は、複数の細菌の組成情報、具体的には、細菌群の組成情報であることが好ましい。また、受付部111が取得する臨床情報も、複数種の臨床情報であることが好ましい。
【0019】
生体情報を得るための「試料」は、常在細菌叢を含む、対象者の分泌物等の試料である。具体的には、分泌物は、膣分泌物、便、皮膚、羊水、唾液等が考え得る。分泌物として、膣分泌物等を利用することで、非侵襲性の予測が可能となる。また、「細菌」は、例えば、下記で示される細菌群から選択されたいずれか1つである。具体的には、分泌物に含まれる細菌の割合を利用する。
細菌群
・ラクトバチルス・イナース(Lactobacillus iners)
・ラクトバチルス・クリスパータス(Lactobacillus crispatus)
・ラクトバチルス・ガゼリ(Lactobacillus gasseri)
・ガードネレラ・バギナリス(Gardnerella vaginalis)
・アトポビウム・バギナエ(Atopobium vaginae)
・ラクトバチルス・ジェンセニイ(Lactobacillus jensenii)
・ウレアプラズマ・パルハム(Ureaplasma parvum)
・メガスファエラ・ゲノモスプ・タイプ1(Megasphaera genomosp. type_1)
・ストレプトコッカス・アガラクティアエ(Streptococcus agalactiae)
【0020】
生体情報に含まれる臨床情報は、例えば、下記で示される臨床情報群から選択されたいずれか1つである。
臨床情報群
・対象者の年齢
・対象者の妊娠歴(例えば、今回を含む妊娠回数)
・対象者の出産歴(例えば、過去の出産回数)
・対象者の心拍数
・対象者の白血球数
・対象者のCRP値
・対象者の体温
・対象者の子宮頸管長
【0021】
このとき、対象者の妊娠歴及び出産回数等の臨床情報の一部については、一回の妊娠期間については、同一であるが、他の臨床情報及び細菌の組成情報は、一回の妊娠期間であっても変化するため、患者の臨床情報及び細菌の組成情報は、同一のタイミングで取得することが好ましい。例えば、臨床情報の各値の計測と、細菌の組成情報を計測するための分泌物の採取は一回の妊婦検診等の、同一のタイミングで行うことが好ましい。
【0022】
予測部112は、過去に得られた複数の妊婦の生体情報と、当該複数の妊婦の絨毛膜羊膜炎の発症歴との関係を利用して得られた閾値を利用して、受付部111が受け付けた対象者の生体情報で特定される所定のマトリクスを生成し、当該マトリクスから得られる値を用いて、対象者の絨毛膜羊膜炎の発症を予測する。
【0023】
まず、予測部112は、複数の妊婦から過去に得られた生体情報と、各妊婦の絨毛膜羊膜炎の発症歴とを関連付けるデータから得られた閾値を用いて、図2に示すようなマトリクスを生成する。例えば、図2に示すように、生体情報は、妊婦の試料に含まれる細菌の組成情報と、妊婦の臨床情報との組み合わせを含む。マトリクスの生成に利用する項目毎に設定される閾値は、閾値データD1として、記憶装置12に記憶される。また、閾値データD1は、予測に利用する生体情報の項目の選択肢を含むことができる。予測部112は、閾値データD1に含まれる選択肢の生体情報の項目のみを含むことで、精度の高い予測結果を得ることができる。
【0024】
予測部112は、細菌の組成情報から「第1の数値」を求める。「第1の数値」は、例えば、妊婦の膣分泌物に上述した各細菌が検出された否か、又は、各菌が含まれる割合が細菌毎に設定された所定の閾値に応じて得られた0又は1のいずれかの値である。例えば、細菌毎に、細菌が検出されない場合、当該細菌に関する第1の数値を「0」とし、検出された場合、当該細菌に関する第1の数値を「1」とすることができる。
【0025】
また、予測部112は、臨床情報から「第2の数値」を求める。「第2の数値」は、例えば、上述した各臨床情報を示す数値そのものではなく、これら数値が、臨床情報の項目毎に設定された所定の閾値に応じて得られた0又は1のいずれかの値である。
【0026】
なお、利用する閾値の数は限定されない。例えば、予測部112は、1つの閾値を用いて「0」又は「1」に分類してもよい。また例えば、予測部112は、A,Bの2つの閾値を用いて、A未満及びB以上の範囲を「0」と分類し、A~Bの範囲を「1」と分類してもよい。
【0027】
閾値データD1に含まれる臨床情報の項目毎の閾値は、例えば、過去に得られた複数の妊婦の臨床情報を示す数値と、その妊婦が絨毛膜羊膜炎を発症したか否かを用いて決定される。例えば各項目の臨床情報の閾値は、臨床情報毎に、ROC曲線を用いてAUCが最大となる値を閾値とすることができる。
【0028】
予測部112は、マトリクスを構成する各値を用いて、絨毛膜羊膜炎の発症の予測に用いるリスクスコアを求める。例えば、図2に示す例では、右に記載される値がリスクスコアである。この図2に示すリスクスコアは例えば、以下に示すような式(1)によって求められる。
リスクスコア=(CAM項目合計数)-(non-CAM項目合計数) ・・・(1)
「CAM項目」とは、絨毛膜羊膜炎の陽性(CAM)の予測の判断に利用される項目であって、陽性のリスクが高い場合「1」となる項目である。「non-CAM項目」とは、絨毛膜羊膜炎の陰性(non-CAM)の予測の判断に利用される項目であって、陰性の可能性が高い場合「1」となる項目である。例えば、図2において、「CAM」と記載される項目が、CAM項目であり、「non-CAM」と記載される項目がnon-CAM項目である。したがって、「CAM」が「1」となった項目の合計数を「CAM項目合計数」とし、「non-CAM」が「1」となった項目の合計数を「non-CAM項目合計数」としてリスクスコアを算出する。
【0029】
予測部112は、得られたリスクスコアに応じて、絨毛膜羊膜炎の発症の予測結果を求める。例えば、リスクスコアが所定のスコア閾値以上である場合、絨毛膜羊膜炎を発症する可能性が高い、すなわち、発症の「可能性あり」と予測し、リスクスコアが所定のスコア閾値未満である場合、絨毛膜羊膜炎を発症する可能性が低い、すなわち、発症の「可能性なし」と予測するようにしてもよい。他の例としては、複数のリスクスコアの範囲を定め、リスクスコア毎に発生する可能性を示すレベルを割り当て予測結果としてもよい。なお、ここで利用するスコア閾値も閾値データD1に含むことができる。
【0030】
予測部112は、得られた予測結果を出力装置14に出力する。また、予測部112は、予測に使用した生体情報及び得られた予測結果を追加して、履歴データD2を更新し、記憶装置12に記憶させる。また、この履歴データD2では、予測の結果に応じて後に実際に診断して得られた感染の有無を関連付けてもよい。
【0031】
算出部113は、予測部112で予測され、記憶装置12において履歴データD2に含まれる複数の妊婦の生体情報を用いて、閾値データD1に含まれる各項目の新たな閾値を算出し、閾値データD1を更新する。また、算出部113は、後段の選択部114によって予測に利用する項目が再選択されると、新たなスコア閾値を算出し、算出した新たなスコア閾値で閾値データD1を更新する。閾値データD1が更新されると、それ以降、予測部112は、閾値データD1に含まれる新たな閾値を利用して予測処理を実行する。
【0032】
選択部114は、スコアの算出に利用する細菌及び臨床情報の各項目について重要度を求め、予測に利用する項目を選択して、選択した生体情報の項目で新たな項目グループを生成し、新たな項目グループで閾値データD1を更新する。新たな項目グループが更新されると、それ以降、予測部112は、新たな項目グループに含まれる項目の生体情報を利用して予測処理を実行する。
【0033】
このように、予測装置1では、算出部113において予測結果を利用して各閾値を再計算するとともに、リスクスコアの算出に利用する細菌及び臨床情報の種別を見直すことで、対象者の絨毛膜羊膜炎の発症の予測精度を向上させることができる。
【0034】
《細菌情報の取得処理》
図3に示すフローチャートを用いて、予測装置1における予測処理の前提として行われる細菌情報の取得の処理を説明する。まず、対象者である妊婦から試料を採取する(S11)。
【0035】
その後、ステップS11で採取された試料から塩基配列のデータ群を取得する(S12)。
【0036】
次に、ステップS12で取得されたデータ群を利用して、予測処理に利用される特定細菌を検出する(S13)。
【0037】
続いて、ステップS13で検出された各特定細菌の情報を含む細菌情報が生成される(S14)。
【0038】
なお、ステップS11乃至S13における処理の具体例については、補足として後述しうる。
【0039】
《絨毛膜羊膜炎の発症の予測処理》
図4に示すフローチャートを用いて、予測装置1における絨毛膜羊膜炎の発症の予測処理を説明する。まず、受付部111は、対象者である妊婦の生体情報を受け付ける(S21)。生体情報は、図3に示すフローチャートを用いて上述したように生成された細菌情報と、対象者の臨床情報とを含む。
【0040】
予測部112は、ステップS21で受け付けた生体情報の複数の項目から、絨毛膜羊膜炎の発症予測に利用する1の項目を選択する(S22)。ここで、発症の予測処理に利用する生体情報の項目は、例えば、閾値データD1に含まれる。
【0041】
予測部112は、ステップS22で選択した生体情報の項目の値を、閾値データD1で定められる当該生体情報の項目の閾値と比較する(S23)。閾値以上であるとき(S23でYES)、予測部112は、当該項目の第1の数値又は第2の数値を「1」とする(S24)。一方、閾値未満であるとき(S23でNO)、予測部112は、当該項目の第1の数値又は第2の数値を「0」とする(S25)。
【0042】
予測部112は、発症予測に利用する全ての生体情報の項目について第1の数値及び第2の数値の決定が終了するまでステップS22~S25の処理を繰り返す(S26)。
【0043】
発症予測に利用する全ての生体情報の項目について第1の数値及び第2の数値の決定が終了すると(S26でYES)、予測部112は、得られた第1の数値及び第2の数値を用いたマトリクスを生成する(S27)。
【0044】
予測部112は、ステップS27で生成したマトリクスを用いて、リスクスコアを算出する(S28)。
【0045】
予測部112は、ステップS28で算出したリスクスコアをスコア閾値と比較し、絨毛膜羊膜炎の発症を予測する(S29)。
【0046】
予測部112は、ステップS29で得られた予測結果を出力装置14に出力させる(S30)。
【0047】
このように、予測装置1は、過去に得られた複数の妊婦の生体情報と、当該複数の妊婦の絨毛膜羊膜炎の発症歴との関係を利用して得られた閾値を用いて、対象者である妊婦の絨毛膜羊膜炎の発症を予測することができる。
【0048】
また、予測の結果、絨毛膜羊膜炎の発症の可能性がある、又は、発症のリスクが高いと予測される対象には、羊水検査等の追加検査を実施してもよく、必要に応じて経過観察、治療介入等の処置を実施してもよい。
【0049】
《閾値算出・項目選択の処理》
図5A及び図5Bに示すフローチャートを用いて、予測装置1における各閾値の算出及び予測に利用する生体情報の項目の選択の処理を説明する。図5Aに示すように、まず、算出部113は、過去に得られた複数の妊婦の生体情報と、各妊婦の絨毛膜羊膜炎の発症歴とを受け付ける(S41)。生体情報は、図2を用いて上述したように、細菌情報と臨床情報とを含む。また、発症歴は、絨毛膜羊膜炎が陽性又は陽性のいずれであったかを示す情報である。この生体情報及び発症歴は、記憶装置12に記憶される履歴データD2を利用してもよい。
【0050】
算出部113は、ステップS41で受け付けた複数の生体情報の項目のうち、1の臨床情報の項目を選択する(S42)。
【0051】
算出部113は、ステップS42で選択した臨床情報の項目に関し、複数の妊婦の値を用いて、ROC曲線を生成する(S43)。
【0052】
また、算出部113は、ステップS43で生成されたROC曲線を用いて、AUC、95%信頼区間(CI)、閾値、感度、特異度、PPV及びNPVとともに、絨毛膜羊膜炎患者(CAM)の生体情報の平均値及び非絨毛膜羊膜炎患者(non-CAM)の生体情報の平均値の各値を算出する(S44)。例えば、算出部113は、陽性と陰性との区別、具体的には、CAMとnon-CAMとを区別する際の最適な閾値の算出にYouden’s indexを用いる。なお、初回に利用する閾値の決定には、同一の方法である必要はなく、今回の例では、Blanc's classificationを利用した。
【0053】
また、算出部113は、全ての生体情報の項目について閾値等の各値及び平均値の算出が終了するまでステップS42~S44の処理を繰り返す(S45)。
【0054】
図6Aは、年齢、妊娠歴(妊娠回数)、出産歴(出産回数)及び子宮頸管長の各値に関するROC曲線を示す。図6Aに示すROC曲線を用いた例では、CAMとnon-CAMとを区別する年齢の閾値が「30.5(歳)」、妊娠歴(妊娠回数)の閾値が「2.5(回)」、出産歴(出産回数)の閾値が「0.5(回)」、子宮頸管長の閾値が「19.5(mm)」とされた。また、図6Bは、CRP値、体温、心拍数及び白血球数の各値に関するROC曲線を示す。図6Bに示すROC曲線を用いた例では、CRP値の閾値が「0.24(mg/dl)」、体温の閾値が「36.75(℃)」、心拍数の閾値が「93(bpm)」、白血球数の閾値が「11800(/μl)(mm)」とされた。対象者の臨床情報の値がこの閾値以上であると、対象の臨床情報に関する第2の数値は「1」となり、閾値未満であると、対象の臨床情報に関する第2の値は「0」となる。
【0055】
また、図7は、ROC曲線を用いて臨床情報の種別毎に得られたAUC、95%信頼区間(CI)、閾値、各臨床情報の種別毎に算出したCAMグループの各値の平均値、non-CAMグループの各値の平均値、感度、特異度、PPV及びNPVの一例である。
【0056】
選択部114は、全ての項目について各値が算出されると(S45でYES)、所定の条件を満たす臨床情報項目を選択する(S46)。例えば、選択部114は、AUCが所定値(例えば、0.65)以上の臨床情報を、選択するようにしてもよい。
【0057】
その後、選択部114は、CAM項目及びnon-CAM項目を決定する(S47)。例えば、選択部114は、AUCが所定値(例えば、0.65)以上の臨床情報を選択する。また、選択手段114は、選択された各臨床情報について、CAMグループの平均値とnon-CAMグループの平均値を比較し、non-CAMグループの平均値が大きい場合、「non-CAM項目」とし、CAMグループの平均値が大きい場合、「CAM項目」とする。なお、臨床情報の選択は、AUCの利用の他、Random Forestを利用してもよい。
【0058】
また、図5Bに示すように、算出部113は、複数の妊婦の細菌情報の各値について、妊婦の試料から検出されたか否かに応じて定められる値でマトリクスを生成する(S48)。図8は、各妊婦の細菌情報の値から得られたマトリクスの一例である。算出部113は、検出された細菌種の値を「1」、検出されない細菌種の値を「0」として図8に示すようなマトリクスを生成する。
【0059】
次に、算出部113は、各細菌種について、重要度を算出する(S49)。例えば、算出部113は、機械学習のアルゴリズムの1つであるRandom Forestで、図9に一例を示すように、non-CAMかCAMかを鑑別する際の各細菌種の重要度を計算する。
【0060】
その後、選択部114は、異なる種別の項目を異なる数含む複数の項目のグループを生成する(S50)。選択部114は、図10に一例を示すように、重要度が所定値以上の細菌種で全ての組み合わせのグループを生成する。図10では、3通りの組み合わせのみを示すが、実際は、選択部114は、取り得る全ての細菌種のグループを生成する。
【0061】
選択部114は、ステップS50で生成した各グループのAUCを算出する(S51)。図10に示す例は、3通りの細菌種のグループのAUCの値である。また、図10に示す例では、選択部114は、信頼区間、閾値、感度、特異度、PPV,NPV、精度も算出している。
【0062】
選択部114は、複数のグループの中からステップS49で得られた予測が最良となるグループ、及び、特定の細菌種を選択する(S52)。例えば、選択部114は、ステップS49で算出したAUCを用いて、次回の予測処理で使用する細菌種のグループを選択する。このとき、予測の精度はAUCだけでなく、図10に一例を示す信頼区間、閾値、感度、及び/又は、特異度など、Random Forestで算出される他の値でも判断することが出来る。図10に示す例では、グループ2が最もAUCが高いことがわかる。したがって、仮に、図10に示すグループ1~3の中からAUCを用いて選択する場合、選択部114は、グループ2を選択する。また、「特定の細菌種」は、CAMグループのみで検出された細菌種及びnon-CAMグループのみで検出された細菌種を含むことが出来る。
【0063】
その後、選択部114は、CAM項目及びnon-CAM項目を決定する(S53)。例えば、選択部114は、ステップS48で生成したマトリクスを用いて、各細菌種について、CAMグループの合計数とnon-CAMグループの合計数を比較し、CAMグループの合計数が多い項目は、「CAM項目」とし、non-CAMグループの合計数が多い項目は「non-CAM項目」とする。なお、仮にステップS52で選択されたグループグループに含まれていない場合であっても、選択部114は、ステップS52でCAMグループのみで検出された細菌種は、「CAM項目」としてもよいし、non-CAMグループのみで検出された細菌種は、「non-CAM項目」としてもよい。
【0064】
算出部113は、ステップS52で選択した項目の第1の数値及び、ステップ46で選択した項目の第2の数値を使用して求めるリスクスコアと比較するリスクスコア閾値を算出する(S53)。具体的には、選択部114は、図11に示すように、複数の妊婦の選択された細菌種の第1の数値及び選択された臨床情報の第2の数値を用いて、式(1)によりCAMグループのnon-CAMグループのリスクスコアを算出し、図12に示すようにROC曲線を生成し、リスクスコア閾値を求める。
リスクスコア=(CAM項目合計数)-(non-CAM項目合計数) ・・・(1)
【0065】
なお、図5A及び図5Bに示すフローチャートの順序は一例である。例えば、同時に実行可能な処理については、同時に実行することができる。具体的には、ステップS42乃至S47の臨床情報に関する一連の処理と、ステップS48乃至S53の細菌情報に関する一連の処理とを並列して実行してもよい。
【0066】
このように、予測装置1は、新たに得られた複数の妊婦の生体情報と、当該複数の妊婦の絨毛膜羊膜炎の発症歴とを利用して、予測に利用する閾値を再計算するとともに、予測に利用する生体情報の項目を再選択する。これにより、発症予測の精度を向上させることができる。例えば、このように、生体情報の項目を再選択可能とすることで、人種、生活習慣、疾患、合併症等が異なる対象群に、より適切な予測をすることができる。換言すると、予測装置1は、自己学習をすることにより、使用により、予測精度を向上させることが可能となる。
【0067】
《補足》
羊水を試料として、羊水に含まれる細菌叢を分析する方法では、絨毛膜羊膜炎から羊水感染まで病態が進行していないと細菌を検出することができない。したがって、絨毛膜羊膜炎を発症している対象については絨毛膜羊膜炎の存在を出生前に検出することができるものの、絨毛膜羊膜炎を発症していない対象についての絨毛膜羊膜炎発症の可能性を予測することは困難であると考えられる。また、羊水採取は対象に対する侵襲を伴い、容易に実施することが困難であるし、複数回の羊水採取は更にリスクが高く、その実施は更に困難である。一方、絨毛膜羊膜炎の発症予測方法では、対象の膣に由来する試料に含まれる細菌叢を分析して、特定の細菌の存在の有無に基づいて絨毛膜羊膜炎の発症の可能性を予測することができる。検出対象となる細菌種は後述するように、膣に由来する試料と分娩後の胎盤病理検査による確定診断とを関連付けて選択されるため、高い感度で絨毛膜羊膜炎発症の可能性を予測することができる。
【0068】
図3のフローチャートのステップS12では、対象者の膣に由来する試料に含まれる16SリボソームRNA遺伝子の塩基配列のデータ群を得る。絨毛膜羊膜炎の発症予測方法における対象者としては、ヒトの妊婦であればよく、例えば、周産期の妊婦であってよく、切迫早産が懸念される周産期の妊婦であってよい。ステップS12で採取する対象者の試料は、例えば、膣に由来する試料である。例えば、試料は、膣スワブであってよい。膣スワブは市販のキット、例えば、オプティスワブ トランスポート・システム(Puritan社)、Catch-All Sample Collection Swab(Epicentre社)等の通常用いられる方法を採用して採取することができる。採取した試料は例えば、-80℃で保存しておくことができる。
【0069】
試料に含まれる16SリボソームRNA遺伝子の塩基配列のデータ群は、例えば以下のような分析方法で得ることができる。試料からDNAを抽出することと、抽出されたDNAを16SリボソームRNA遺伝子に対するユニバーサルプライマーセットを用いてPCRで増幅して16SリボソームRNA遺伝子のアンプリコン(PCR増幅産物)を得ることと、アンプリコンに含まれる16SリボソームRNA遺伝子の塩基配列を無作為に決定することとを含む方法で、16SリボソームRNA遺伝子の塩基配列のデータ群を得ることができる。
【0070】
試料からのDNAの抽出は、当該技術分野で慣用されているDNA抽出方法によって実施することができる。例えば、ガラスビーズ等を用いるビーズ処理によって物理的に細胞を破砕して溶菌し、市販のDNA抽出キット等を用いて試料に含まれるDNAを抽出することができる。
【0071】
抽出したDNAを鋳型として、16SリボソームRNA遺伝子に対するユニバーサルプライマーセットを用いてPCRで増幅することで、16SリボソームRNA遺伝子のアンプリコンを得ることができる。16SリボソームRNA遺伝子に対するユニバーサルプライマーセットの増幅対象領域は、16SリボソームRNA遺伝子のV1からV9のすべての可変領域のいずれであってもよく、例えば、V1領域とV2領域を挟む保存領域を増幅対象領域とすることができる。これにより、16SリボソームRNA遺伝子から有効な系統分類情報が容易に得られる。ここで、ユニバーサルプライマーは、いわゆるバーコード配列等を含んでいてよく、バーコード配列は5’末端および3’末端のいずれに配置されていてもよい。
【0072】
得られたアンプリコンに含まれる16SリボソームRNA遺伝子の塩基配列を無作為に決定することで塩基配列のデータ群が得られる。塩基配列のデータ群は、ある細菌種に特異的な16SリボソームRNA遺伝子の塩基配列と、その塩基配列を有するオリゴヌクレオチドの存在量(例えば、リード数等)との組み合わせで構成される。ここで「無作為に決定する」とは、塩基配列を決定すべきDNA等の混合物中から、ある特定の配列のものだけ選択したり、ある配列のものを排除したりすることなく、できるだけランダムに、その混合物中に含まれる任意の塩基配列を決定するという意味である。そのようにして塩基配列を無作為に決定すると、抽出されたDNA等の混合物中での濃度が高い塩基配列を有するDNAについては、塩基配列決定の対象となる頻度が高くなり、逆に濃度が低い塩基配列を有するDNAについては、塩基配列決定の対象となる頻度が低くなる。一方、膣に由来する試料に含まれる膣内細菌叢は複数種類の細菌を含み、それぞれの菌種に特有の塩基配列を16SリボソームRNA遺伝子上に有している。したがって、膣に由来する試料から調製したDNA等の混合物の塩基配列を無作為に決定することによって得られる塩基配列のデータ群中では、任意に選択され得る塩基配列に合致する塩基配列(例えばある特定の菌種に特有の塩基配列に合致するもの)のリード数が、膣内細菌叢を構成する細菌の存在量の多寡を反映することになる。すなわち、その塩基配列のデータ群が、膣内細菌叢の菌叢構造を反映することになる。
【0073】
アンプリコンに含まれる16SリボソームRNA遺伝子の塩基配列は、いわゆる次世代シーケンサー(NGS)を用いて決定される。次世代シーケンサーとは、サンガー法を用いるキャピラリーシーケンサーと対比される用語である。次世代シーケンサーでは、合成シーケンシング法、パイロシーケンシング法、リガーゼ反応シーケンシング法等のシーケンシング原理が用いられる。次世代シーケンサーとして具体的には、MinION(登録商標)システム(株式会社オックスフォード・ナノポアテクノロジーズ)、MiSeq(登録商標)システム(illmina社)、HiSeq(登録商標)システム(illmina社)、IonPGM(登録商標)システム(Life Technology社)等が挙げられる。次世代シーケンサーによるアンプリコンシーケンシングは、メーカー推奨プロトコールに従って実施することができる。またシーケンシング解析では、クオリティコントロールにより、低クオリティリードなどを削除した上で、所定の数のリードを塩基配列のデータ群とすることができる。
【0074】
図3のフローチャートのステップS12では、次世代シーケンサーを用いる網羅的な解析に代えて、上記細菌群を構成するそれぞれの菌種に特異的なプライマーセットを用いて定量PCRを実施して、膣に由来する試料に含まれる16SリボソームRNA遺伝子の塩基配列のデータ群を得てもよい。それぞれの菌種に特異的なプライマーセットは、例えば、RDP(Ribosomal Database Project, http://rdp.cme.msu.edu)から得られるそれぞれの細菌種についての16SリボソームRNA遺伝子の標準配列に基づいて作成することができる。具体的には、MEGA(Molecular Evolutionary Genetics Analysis, http://www.megasoftware.net)を用いてマルチプルアライメントし、16SリボソームRNA遺伝子中における菌種内で共通かつ菌種間で異なる塩基配列を同定する。次いでその塩基配列に対するプライマーセットを設計することで、それぞれの菌種に特異的なプライマーセットを得ることができる。なお、設計したプライマーセットの特異性は、in-silico PCR等で確認してもよい。
【0075】
定量PCRは、PCR増幅産物を定量的に得られる手法であればよく、リアルタイムPCR、デジタルPCR等の公知の手法を用いることができる。この場合、塩基配列のデータ群は、特定のプライマーセットの増幅対象領域の塩基配列と、その塩基配列を有するオリゴヌクレオチドの存在量(例えば、コピー数等)との組み合わせであり、次世代シーケンサーで得られる塩基配列のデータ群と実質的に同一であると考えられる。
【0076】
図3のフローチャートのステップS13では、得られる塩基配列のデータ群に基づいて、前記細菌群から選択される特定細菌の存在を検出する。これにより試料に含まれる特定細菌の菌種数が特定される。試料における特定細菌の存在は、その菌種に特異的な16SリボソームRNA遺伝子の塩基配列を有するオリゴヌクレオチドの存在量に基づいて判断することができる。塩基配列のデータ群が次世代シーケンサーで得られる場合、特定の塩基配列を有するオリゴヌクレオチドのリード数、または特定の塩基配列を有するオリゴヌクレオチドのリード数を全菌種のリード数で補正した補正値が、所定のカットオフ値以上である場合に、特定の塩基配列に対応する菌種が存在すると判断してよい。また、塩基配列のデータ群が定量PCRで得られる場合、特定の塩基配列を有するオリゴヌクレオチドのコピー数を全菌種のコピー数で補正した補正値が、所定のカットオフ値以上であれば、特定の塩基配列に対応する菌種が存在すると判断することができる。
【0077】
なお、上述の例では、生体情報として、試料に細菌が含まれる程度を示す第1の数値と、臨床情報を示す第2の数値とを用いる一例で説明したが、上記に加え又は代えて、Caho1の値に基づいて求められた0又は1の値、及び/又はCST(community state types)のレベルに基づいて求められた0又は1のいずれかの値を利用してもよい。「Chao1」は、チャオA著、「Nonparametric Estimation of the Number of Classes in a Population」、Scandinavian Journal of Statistics、1984年、265-270頁に定義される。また、「CTS」は、ラヴェルV他14名著、「Vaginal microbiome of reproductive-age women」、Proceedings of the National Academy of Sciences of the United States of America、2010年6月3日、4680-4687頁に定義される。
【産業上の利用可能性】
【0078】
本開示は、特定の妊娠関連有害事象の発生の発症の予測に有用である。
【符号の説明】
【0079】
1 予測装置
11 演算装置
111 受付部
112 予測部
113 算出部
114 選択部
12 記憶装置
13 入力装置
14 出力装置
15 通信装置
図1
図2
図3
図4
図5A
図5B
図6A
図6B
図7
図8
図9
図10
図11
図12