(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-30
(45)【発行日】2022-07-08
(54)【発明の名称】データ収集解析装置及びデータ収集解析方法
(51)【国際特許分類】
A61B 10/00 20060101AFI20220701BHJP
G06N 5/02 20060101ALI20220701BHJP
【FI】
A61B10/00 N ZDM
G06N5/02 120
G06N5/02 150
A61B10/00 H
(21)【出願番号】P 2018158737
(22)【出願日】2018-08-27
【審査請求日】2021-02-08
(73)【特許権者】
【識別番号】392026693
【氏名又は名称】株式会社NTTドコモ
(73)【特許権者】
【識別番号】504157024
【氏名又は名称】国立大学法人東北大学
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100124844
【氏名又は名称】石原 隆治
(72)【発明者】
【氏名】熊谷 沙津希
(72)【発明者】
【氏名】越智 大介
(72)【発明者】
【氏名】山内 隆史
(72)【発明者】
【氏名】檜山 聡
(72)【発明者】
【氏名】菅原 準一
(72)【発明者】
【氏名】長▲崎▼ 正朗
【審査官】牧尾 尚能
(56)【参考文献】
【文献】特表2007-506979(JP,A)
【文献】特表2008-510508(JP,A)
【文献】特開2016-024655(JP,A)
【文献】米国特許出願公開第2008/0213794(US,A1)
【文献】米国特許出願公開第2006/0247536(US,A1)
【文献】特開2006-163489(JP,A)
【文献】米国特許出願公開第2017/0205420(US,A1)
【文献】特開2006-163932(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
A61B 9/00 - 10/06
G06Q 50/22
G16H 10/00 - 80/00
A61B 5/00 - 5/01
(57)【特許請求の範囲】
【請求項1】
複数のデータソース装置から妊婦に関するデータを取得するデータ取得
部と、
妊娠糖尿病(GDM)発症予測モデルに基づき、前記
妊婦に関するデータから前記妊婦のGDM発症予測を実行するGDM発症予測
部と、
前記GDM発症予測の結果を通知する結果通知
部と、
前記GDM発症予測モデルを生成するGDM発症予測モデル生成部と、
を有し、
前記データ取得
部は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記
妊婦に関するデータを少なくとも1回、または連続して取得し、
前記GDM発症予測モデル生成部は、前記妊婦に関するデータに基づき、GDM発症日予測モデルまたはGDM発症リスク算出モデルを生成し、
前記GDM発症予測
部は、
前記妊婦に関するデータ、および前記生成されたGDM発症日予測モデルまたはGDM発症リスク算出モデルにそれぞれ基づき、GDM発症日予測またはGDM発症リスク算出を実行するデータ収集解析装置。
【請求項2】
前記GDM発症予測モデル生成部は、前記少なくとも1回、または連続して取得された
前記妊婦に関するデータ、または連続して取得された
前記妊婦に関するデータから部分的に取得されたデータの各データ項目を独立の変数として設定し、妊婦の属性によって当該妊婦を1または複数の群に層別化し、特定の妊娠期間にGDMを発症した妊婦群と合併症がない妊婦群とのデータ分布の違いの大きさを利用して特徴量を抽出し、前記GDM発症予測モデルを生成す
る、請求項1記載のデータ収集解析装置。
【請求項3】
前記GDM発症予測モデル生成
部は、前記妊婦を1または複数に層別化する妊婦の属性として、非妊時BMI、年齢、既往歴、出産歴、児の性別の何れか1つ以上を含む、請求項2記載のデータ収集解析装置。
【請求項4】
前記GDM発症予測モデル生成
部は、BMI、平均動脈圧、下腹部の痛み、拡張期血圧、脈拍、基礎体温、基礎代謝、就寝中に起きた回数、起床時刻、1日に活動した距離、から嘔吐の回数、腰の痛み、骨格筋率、歯の痛み、室温、収縮期血圧、収縮期血圧と拡張期血圧の差、就寝時刻、上腹部の痛み、睡眠の質の悪さ、睡眠時間、総消費カロリー、体脂肪率、体重、非妊娠時からの体重増加率、非妊娠時からの体重増加量、痛みを伴う収縮、痛みを伴わない収縮、吐き気の総時間、頭の痛み、動悸の回数、便通の回数、便通の柔らかさ、1日の歩数、脈圧及び嘔吐、妊娠状況(単胎・多胎)、妊娠回数、出産回数の1つ以上のデータ項目から、特徴量を抽出する、請求項2又は3記載のデータ収集解析装置。
【請求項5】
前記GDM発症予測モデル生成
部は、特定の妊娠期間にある一定期間以上連続または集中して、GDMを発症した妊婦群と合併症がない妊婦群とのデータ分布の違いの大きさを利用して特徴量を抽出する、請求項2乃至4何れか一項記載のデータ収集解析装置。
【請求項6】
前記GDM発症予測
部は、前記妊婦に欠損するデータを、前記妊婦に最も近しいデータを妊婦データから抽出し補間する、請求項1乃至5何れか一項記載のデータ収集解析装置。
【請求項7】
データ収集解析装置が実行するデータ収集解析方法であって、
複数のデータソース装置から妊婦に関するデータを取得するステップと、
妊娠糖尿病(GDM)発症予測モデルに基づき、前記
妊婦に関するデータから前記妊婦のGDM発症予測を実行するステップと、
前記GDM発症予測の結果を通知するステップと、
前記GDM発症予測モデルを生成するステップと、
を有し、
前記
妊婦に関するデータを取得するステップは、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記
妊婦に関するデータを少なくとも1回、または連続して取得することを含み、
前記GDM発症予測モデルを生成するステップは、前記妊婦に関するデータに基づき、GDM発症日予測モデルまたはGDM発症リスク算出モデルを生成することを含み、
前記妊婦のGDM発症予測を実行するステップは、
前記妊婦に関するデータ、および前記生成されたGDM発症日予測モデルまたはGDM発症リスク算出モデルにそれぞれ基づき、GDM発症日予測またはGDM発症リスク算出を実行することを含むデータ収集解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に医療診断技術に関し、より詳細には、非侵襲的に妊娠糖尿病の発症予測又は異常検出を行うための妊娠糖尿病発症有無予測のためのデータ収集解析装置及び方法に関する。
【背景技術】
【0002】
妊娠糖尿病(GDM:Gestational Diabetes Mellitus)は妊娠高血圧症候群などの産科的合併症や網膜症などの糖尿病合併症の憎悪、胎児死亡などの周産期合併症、また、児の成長後に糖尿病など成長期合併症を引き起こす母児の命に関わる周産期医療上の代表的な疾患で、遺伝的要因と環境因子による複雑な相互作用により発症する多因子疾患である。さらに、GDM罹患妊婦はその後の生活習慣病の発症リスクが高いことが知られている。
【0003】
GDMは、遺伝的要因だけでなく、環境要因が複雑に関与しており、従来は予測が困難であった。GDMリスク要因として、尿糖陽性、糖尿病家族歴、肥満、過度の体重増加、巨大児出産の既往歴、加齢などがあるが、これらとGDMとの関連性は弱く、そのため、未だに予兆や原因が特定されずに効果のある予防方法が確立されていない。
【0004】
現時点の産科診療においては、受診時に取得される検査情報、病歴聴取及び/又は診察情報による発症予測が主体であり、在宅中などの連続した生活環境情報を取得することは困難であった。疾患発症に関する研究において、妊婦の生活環境情報を取得する方法として従来は調査票による調査を実施することが主な手法であった。しかしこの方法には、妊婦の記憶が不正確で回答に誤りがあること(想起バイアス)による精度の問題があり、また、実施間隔が早くて半年に1回程度と、取得頻度の問題等があった。そのため、妊婦の生活の実態を捉えて疾患との因果関係を明らかにするには不十分な方法であった。今後、疾患の発症予測を精緻に行うためには、受診時以外の連続環境情報を取得し、それらと受診時情報を統合的に解析することが必要であるが、これらの情報についてはこれまで入手困難だったため、妊娠に関連した疾患の発症予測には利用されてこなかった。
【0005】
妊婦の生活環境に基づいた、疫学的なGDM発症研究としては、例えば、年齢や糖尿病の家族歴などの記録データと血圧や体重などの測定のデータから、妊婦の第1トライメスタにおけるGDM発症因子を予測するという報告(非特許文献1)がある。しかし、この研究では、測定データの記録が妊婦の妊娠11週から13週における病院への定期訪問時に実施され、記録回数が1回程度に限られるため、体調による一時的な異常値などが測定結果に含まれる可能性があり、十分な精度とは言えない。
【先行技術文献】
【非特許文献】
【0006】
【文献】"First-Trimester Prediction of Gestational Diabetes Mellitus: Examining the Potential of Combining Maternal Characteristics and Laboratory Measures", Makrina Savvidou, et al., Diabetes 2010 Dec (https://doi.org/10.2337/db10-0688)
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述した問題点を鑑み、本発明の課題は、GDMの発症予測精度を向上させるためのデータ収集解析技術を提供することである。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明の一態様は、複数のデータソース装置から妊婦に関するデータを取得するデータ取得機能と、妊娠糖尿病(GDM)発症予測モデルに基づき、前記妊婦に関するデータから前記妊婦のGDM発症予測を実行するGDM発症予測部と、前記GDM発症予測の結果を通知する結果通知部と、前記GDM発症予測モデルを生成するGDM発症予測モデル生成部と、を有し、前記データ取得部は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記妊婦に関するデータを少なくとも1回、または連続して取得し、前記GDM発症予測モデル生成部は、前記妊婦に関するデータに基づき、GDM発症日予測モデルまたはGDM発症リスク算出モデルを生成し、前記GDM発症予測部は、前記妊婦に関するデータ、および前記生成されたGDM発症日予測モデルまたはGDM発症リスク算出モデルにそれぞれ基づき、GDM発症日予測またはGDM発症リスク算出を実行するデータ収集解析装置に関する。
【発明の効果】
【0009】
本発明によると、GDMの発症予測精度を向上させるためのデータ収集解析技術を提供することができる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本発明の一実施例によるシステム構成を示すブロック図である。
【
図2】
図2は、本発明の一実施例による測定値転送装置の機能構成を示すブロック図である。
【
図3】
図3は、本発明の一実施例による体調登録装置の機能構成を示すブロック図である。
【
図4】
図4は、本発明の一実施例による気象情報取得装置の機能構成を示すブロック図である。
【
図5】
図5は、本発明の一実施例による調査票登録装置の機能構成を示すブロック図である。
【
図6】
図6は、本発明の一実施例による診療記録登録装置の機能構成を示すブロック図である。
【
図7】
図7は、本発明の一実施例によるデータ収集解析装置の機能構成を示すブロック図である。
【
図8】
図8は、本発明の実施例1におけるデータ収集解析処理を示すフローチャートである。
【
図9】
図9は、本発明の実施例3におけるGDM発症予測モデル生成処理を示すフローチャートである。
【
図10】
図10は、GDM発症有無予測を実施した実施例3において選定された特徴量の組み合わせを示す表である。
【
図11】
図11は、本発明の実施例4におけるGDM発症予測モデル生成処理を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面に基づいて本発明の実施の形態を説明する。
【0012】
後述される実施例では、GDM発症予測のためのデータ収集解析装置が開示される。BMIなど単一の指標による従来のGDM発症予測ではその予測精度が低いため、以下の実施例によるデータ収集解析装置では、妊婦の生活環境のデータのうち、複数のデータを組み合わせて予測精度を向上させる。また、データ収集解析装置は、取得するデータを1つの時点の測定値だけではなく、例えば、連続的に、または定期的など複数の時点にて断続的に取得し、取得したデータから想起バイアスを極力排除することによって客観的なデータを利用する。
【0013】
具体的には、以下の実施例によるデータ収集システムによると、妊婦の生活環境をより客観的により高頻度で取得することで妊婦関連疾患発症の環境要因を明らかにするために、妊娠初期または妊娠前より、以下のような多様なデータが取得される。
1)血圧計、体重計、活動量計、体温計などの計測装置の日々のデータ
2)日々の気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動間隔、食事内容、服薬内容の体調データ
3)妊婦の居住地の気温、天候、湿度、気圧、潮汐などの日々の生活環境データ
4)食習慣、睡眠状況、喫煙等の生活習慣に関する定期的な調査票データ
5)妊婦健診等の定期的な診療記録データ
これらのようなデータを取得することで、多種類のデータを利用可能となり、単一の指標に基づく従来のGDM発症予測より予測精度を向上させることができる。また、上記1)~3)に関して妊娠期間中やその前後において、1日数回から1週間に数回など高頻度にデータを取得し、さらに、上記1)、3)などによる客観的なデータ取得と、2)による日々の登録において妊婦が記憶するべき間隔を短くすることによる想起バイアスの排除又は低減を実現することができる。なお、上記のデータのうち、1)~3)のデータ項目はライフログと定義される。また、データの収集は連続的に行ってもよく、連続的に収集したデータを用いた解析は得られたデータから適宜選択したものを解析に使用することでもよい。
【0014】
これにより、本発明では、GDM発症予測モデルを生成するために、これらのライフログや調査票、診療記録を取得し、妊婦の環境情報を充実させることができる。つまり、本発明は、非侵襲的にGDMの発症予測又は異常検出のために、妊婦の妊娠期間中や産後に日々のライフログとして、例えば、血圧計、体重体組成計、活動量計、体温計等で計測した客観データ、日々の気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動、食事、服薬などの妊婦の体調に関するデータを取得すると共に、妊婦の居住地の気温、天候、湿度、気圧、潮汐などの客観データなどのうち1つ以上のデータ項目に関するデータを取得し、これらを組み合わせて解析することによって、より高精度なGDM発症予測を実現することができる。
【0015】
まず、
図1を参照して、本発明の一実施例によるデータ収集システムを説明する。
図1は、本発明の一実施例によるシステム構成を示すブロック図である。
【0016】
図1に示されるように、データ収集システム10は、計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60、診療記録登録装置70及びデータ収集解析装置100を有する。なお、図示されたシステム構成は一例にすぎず、一部の装置は省かれてもよいし、あるいは、他の装置が追加されてもよい。例えば、データ収集システム10は、計測装置20又は体調登録装置40のいずれか一方又は両方、診療記録登録装置70及びデータ収集解析装置100を有し、任意的に、測定値転送装置30、気象情報取得装置50及び/又は調査票登録装置60を有してもよい。
【0017】
計測装置20は、血圧計、体重計、活動量計、体温計などを含み、妊婦の血圧等の生理データを計測する。
【0018】
測定値転送装置30は、計測装置20とデータ収集解析装置100との間でデータを転送する。なお、計測装置20自体が測定値転送装置30の機能を含み、データ収集解析装置100に計測値を直接送信するようにしてもよい。
【0019】
体調登録装置40は、妊婦が日々の体調情報を登録するための装置であり、例えば、アプリケーションを用いてスマートフォンに実装可能である。具体的には、妊婦は、自らの体調情報を体調登録装置40に入力する。ここで、体調情報は、例えば、気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動間隔、食事内容、服薬内容などのデータ項目を含むものであってもよいが、これらに限定されない。
【0020】
気象情報取得装置50は、一般に公開されている気象情報のデータベース(図示せず)から、妊婦の居住地における気象情報を取得する。ここで、気象情報は、例えば、所定の期間毎(1時間単位、1日単位など)の天候、降水確率、気温、湿度、風速、風向、気圧、潮汐などのデータ項目を含むものであってもよいが、これらに限定されない。
【0021】
調査票登録装置60は、妊婦からの定期的な調査票の情報を登録するための装置である。具体的には、入力担当者が、妊婦から取得した調査票の情報を調査票登録装置60に登録する。ここで、調査票の情報は、例えば、妊婦やその家族の家族構成、妊婦や家族の既往歴、妊娠出産歴、食生活、睡眠状況、服薬状況、喫煙飲酒状況、運動状況、勤務状況、精神的状況などのデータ項目を含むものであってもよいが、これらに限定されない。
【0022】
診療記録登録装置70は、妊婦の出産時の診療記録を登録するための装置である。また、任意で妊婦の定期的な妊婦健診等の診療情報が更に診療記録登録装置70に登録されてもよい。
【0023】
データ収集解析装置100は、以下で詳細に説明されるように、計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60及び診療記録登録装置70の1つ以上からネットワーク80を介し上述したデータ項目に関するデータを収集し、GDMの発症予測モデルを生成、予測を実施する。ネットワーク80については単一のネットワークではなく、複数から構成されていても良い。
【0024】
なお、上述した各装置は、典型的には、コンピュータ、スマートフォン、タブレット、サーバなどの通信機能を備えた情報処理装置により実現されてもよい。例えば、情報処理装置に搭載されたプロセッサが、メモリ装置に格納されたデータやプログラムを処理及び実行することによって、後述される各種機能及び処理を実行する。しかしながら、各装置は、何れか特定のハードウェア構成に限定されるものでなく、適切なハードウェア構成により実現されてもよい。
【0025】
次に、
図2を参照して、本発明の一実施例による測定値転送装置を説明する。
図2は、本発明の一実施例による測定値転送装置の機能構成を示すブロック図である。
【0026】
図2に示されるように、測定値転送装置30は、データ取得機能31、データ転送機能32、計測装置認証機能33及び利用者認証機能34を有する。
【0027】
データ取得機能31は、1つ以上の計測装置20と通信し、計測装置20からデータ及び測定値を取得する。なお、測定値転送装置30と計測装置20との間の通信は、以下に限定することなく、Bluetooth(登録商標)、Wi-Fi(登録商標)、NFC、ZigBee(登録商標)、USB接続、モバイル通信(3G、LTE、4G、5Gなど)などの通信方式により実現されてもよい。例えば、計測装置20から取得されるデータ項目は、以下に限定されることなく、血圧計、体重計、活動量計、体温計などの妊婦に関する生理データであってもよい。
【0028】
データ転送機能32は、取得したデータ及び測定値をネットワーク80を介しデータ収集解析装置100に転送する。当該データは、妊娠期間中やその前後において1回、または連続的に、あるいは1日数回から1週間に数回など高頻度に取得され、データ収集解析装置100に転送されてもよい。
【0029】
計測装置認証機能33は、通信先の計測装置20を認証する。
【0030】
利用者認証機能34は、妊婦などの測定値転送装置30の利用者を認証する。
【0031】
次に、
図3を参照して、本発明の一実施例による体調登録装置を説明する。
図3は、本発明の一実施例による体調登録装置の機能構成を示すブロック図である。
【0032】
図3に示されるように、体調登録装置40は、データ登録機能41、データ転送機能42及び利用者認証機能43を有する。
【0033】
データ登録機能41は、妊婦などの利用者からの入力内容をデータとして登録する。例えば、妊婦から入力されるデータ項目は、以下に限定されることなく、日々の気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動間隔、食事内容、服薬内容などの妊婦の体調データであってもよい。
【0034】
データ転送機能42は、登録されたデータをデータ収集解析装置100に転送する。当該データは、妊娠期間中やその前後において1回、または連続的に、あるいは1日数回から1週間に数回など高頻度に取得され、データ収集解析装置100に転送されてもよい。
【0035】
利用者認証機能43は、妊婦などの体調登録装置の利用者を認証する。
【0036】
次に、
図4を参照して、本発明の一実施例による気象情報取得装置を説明する。
図4は、本発明の一実施例による気象情報取得装置の機能構成を示すブロック図である。
【0037】
図4に示されるように、気象情報取得装置50は、データ取得機能51及びデータ転送機能52を有する。
【0038】
データ取得機能51は、気象情報データベースから気象情報を取得する。気象情報データベースには、例えば、一般公開されているデータベースがある。例えば、気象情報は、以下に限定されることなく、妊婦の居住地の気温、天候、湿度、気圧、潮汐などの生活環境データであってもよい。
【0039】
データ転送機能52は、取得したデータをデータ収集解析装置100に転送する。当該データは、妊娠期間中やその前後において1回、または連続的に、あるいは1日数回から1週間に数回など高頻度に取得され、データ収集解析装置100に転送されてもよい。
【0040】
次に、
図5を参照して、本発明の一実施例による調査票登録装置を説明する。
図5は、本発明の一実施例による調査票登録装置の機能構成を示すブロック図である。
【0041】
図5に示されるように、調査票登録装置60は、データ登録機能61及びデータ転送機能62を有する。
【0042】
データ登録機能61は、調査票情報の入力担当者が入力するデータを登録する。例えば、妊婦に関する調査票情報は、以下に限定されることなく、妊婦やその家族の家族構成、妊婦や家族の既往歴、妊娠出産歴、食生活、睡眠状況、服薬状況、喫煙飲酒状況、運動状況、勤務状況、精神的状況などの妊婦やその家族の生活習慣に関するデータ項目であってもよい。
【0043】
データ転送機能62は、登録したデータをデータ収集解析装置100に転送する。
【0044】
次に、
図6を参照して、本発明の一実施例による診療記録登録装置を説明する。
図6は、本発明の一実施例による診療記録登録装置の機能構成を示すブロック図である。
【0045】
図6に示されるように、診療記録登録装置70は、データ登録機能71及びデータ転送機能72を有する。
【0046】
データ登録機能71は、診療記録の入力担当者が入力するデータを登録する。例えば、診療記録は、以下に限定されることなく、医師などにより記録された妊婦健診などの診療記録であってもよい。
【0047】
データ転送機能72は、登録したデータをデータ収集解析装置100に転送する。
【0048】
次に、
図7を参照して、本発明の一実施例によるデータ収集解析装置を説明する。
図7は、本発明の一実施例によるデータ収集解析装置の機能構成を示すブロック図である。
【0049】
図7に示されるように、データ収集解析装置100は、データ取得機能110、データ保存機能120、GDM発症予測モデル生成機能130を有する。
【0050】
データ取得機能110は、複数のデータソース装置から妊婦に関するデータを取得する。また、データ取得機能110は、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、妊婦に関するデータを1回、または連続的に、あるいは複数の時点にて断続的に取得する。すなわち、データ取得機能110は、上述した計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60及び/又は診療記録登録装置70などのデータソース装置から、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、妊婦に関する1つ以上のデータ項目のデータを、例えば、1回、または連続的に、あるいは定期的など複数の時点にて断続的に取得する。
【0051】
ここで、妊婦に関するデータは、例えば、非妊娠時BMI、妊娠回数、出産回数、妊娠時年齢、血圧、脈拍、体重、BMI、歩数、消費カロリー、体温、気分、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便通の柔らかさ、子宮収縮、頭の痛み、歯の痛み、上腹部の痛み、下腹部の痛み、腰の痛み、吐き気、嘔吐、動悸、胎動間隔、食事内容、服薬内容、既往歴、妊娠状況(単胎・多胎)、気温、室温、湿度、気圧、天気概況、潮汐及び月齢の1つ以上のデータ項目を含むものであってもよい。
【0052】
データ保存機能120は、取得した妊婦に関するデータを保存する。
【0053】
GDM発症予測モデル生成機能130は、GDM発症予測モデルを生成及び保存する。例えば、GDM発症予測モデル生成機能130は、合併症を発症せずに出産した妊婦とGDMにより出産した妊婦とを含む複数の妊婦から取得した妊婦に関するデータに基づき、GDM発症予測モデルを生成及び更新してもよい。具体的には、GDM発症予測モデルは、以下で詳細に説明されるようなモデル導出方法に従って生成されてもよい。
【0054】
GDM発症予測機能140は、GDM発症予測モデルに基づき、取得した妊婦に関するデータから妊婦のGDM発症予測を実行する。具体的には、GDM発症予測機能140は、取得した妊婦に関するデータをGDM発症予測モデルに投入し、GDM発症予測モデルの出力結果に基づき当該妊婦のGDM発症有無予測、GDM発症日予測又はGDM発症リスク算出を実行してもよい。すなわち、GDM発症予測において、GDM発症予測機能140は、当該妊婦にGDM発症の可能性があるか予測し(GDM発症有無予測)、当該妊婦のGDM発症日を予測し(GDM発症日予測)、あるいは、当該妊婦のGDM発症リスクを算出してもよい(GDM発症リスク算出)。なお、GDM発症予測機能140は、妊婦の週数に応じて異なるデータ項目に基づき、当該妊婦のGDM発症有無予測、GDM発症日予測又はGDM発症リスク算出を実行してもよい。
【0055】
結果通知機能150は、GDM発症予測機能140によって実行されたGDM発症予測の結果を妊婦、医療関係者などに通知する。
【0056】
なお、上述した装置は、それぞれが単独の装置であることもあれば、ある装置が他の装置の機能の一部又は全部を備えることもある。
(実施例1)
次に、
図8を参照して、本発明の一実施例によるデータ収集解析処理を説明する。当該データ収集解析処理は、上述したデータ収集解析装置100によって実行される。
図8は、本発明の一実施例によるデータ収集解析処理を示すフローチャートである。
【0057】
図8に示されるように、ステップS100において、データ収集解析装置100は、上述した計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60及び/又は診療記録登録装置70などのデータソース装置の全て又は一部からデータを取得し、取得したデータを保存する。具体的には、データ収集解析装置100は、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間においてデータを1回、または連続的に、あるいは定期的など複数の時点で断続的に取得する。
【0058】
まず、妊婦は、妊娠前もしくは妊娠中の任意の時点から、出産もしくは産後の任意の時点までの間、計測装置20を使用する。計測装置20は、例えば、血圧計、体重計、活動量計、体温計などを含む。血圧計は、収縮期血圧、拡張期血圧、脈拍数、室温などを計測する。体重計は、体重、BMI、体脂肪率、骨格筋率などを計測する。活動量計は、歩数、消費カロリーなどを計測する。体温計は、体温などを計測する。計測装置20による測定は、血圧計については1日朝晩の2回、その他は1日朝1回を想定するが、その限りではなく、1回、または連続的に、あるいは任意の間隔で複数回断続的に計測することも可能である。測定値転送装置30は、各計測装置20から計測データを取得し、データ収集解析装置100に転送する。
【0059】
また、妊婦は、体調登録装置40に自身の体調を登録する。体調登録装置40として、スマートフォンに体調登録用アプリやWebページを用いる場合を想定するが、その限りではない。体調情報として、気分、就寝日時、起床日時、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便痛の軟らかさ、吐き気を感じた総時間、嘔吐の回数、空嘔吐の回数、頭の痛み、歯の痛み、腰の痛み、上腹部の痛み、下腹部の痛み、痛みを伴わない子宮収縮回数、痛みを伴う子宮収縮回数、動悸、胎動間隔、食事内容、服薬内容の1つ以上のデータ項目が登録されることが想定されるが、これらに限定されるものでない。体調情報の登録期間は、妊娠前もしくは妊娠中の任意の時点から、出産もしくは産後の任意の時点までの間を想定する。また、体調登録間隔は、主なデータ項目は1日1回を想定するが、食事内容や服薬内容など一部のデータ項目については、1日複数回の入力を想定する。また、これらのデータ項目は毎日ではなく、任意の間隔で計測することも可能である。
【0060】
また、気象情報取得装置50は、毎日の気象情報を収集する。例えば、気象庁のWebサイトから取得可能である。取得されるデータ項目は、日付、降水量、平均気温、最高気温、最低気温、全天日射量、平均雲量、降雪の深さ、最深積雪、最大瞬間風速、潮汐及び/又は月齢を想定し、さらには1時間ごとの、気温、降水量、風向き、風速、日照時間、湿度、気圧、天気概況を想定するが、これらに限定されるものでない。また、データの単位も1日や時間に限定されず、週単位、月単位、年単位も取り得る。
【0061】
また、調査票登録装置60は、妊婦が記入した定期的な調査票の情報を取得する。調査票の情報は、妊婦やその家族の家族構成、妊婦や家族の既往歴、妊娠出産歴、食生活、睡眠状況、服薬状況、喫煙飲酒状況、運動状況、勤務状況、精神的状況などのデータ項目を含むが、これらに限定されるものでない。取得の頻度については、調査票の頻度を想定する。
【0062】
また、診療記録登録装置70は、妊婦が妊婦健診などで受診した際の検査値や所見などの記録を取得する。取得の頻度については、受診の頻度を想定する。
【0063】
ステップS101において、データ収集解析装置100は、取得したデータに対して異常値を検出及び除去し、欠測値を補間する。例えば、日々の収縮期血圧が120mmHgである妊婦が、ある1日だけ60mmHgであった場合、データ収集解析装置100は、当該測定値を実際の値ではなく計測エラーとみなして、当該測定値を除去する。この除去基準の一例として、データ収集解析装置100は、その妊婦のこれまでの収縮期血圧の平均μと標準偏差σを計算し、ある計測値が平均μよりnσ以上解離していた場合に、当該計測値を除去する(nは任意の数値)、などの方法があるが、これに限定されるものでない。また、欠測値に関しては、前後の点を用いた線形補間やスプライン補間や、欠測値以外の計測点にフィッティングしたモデルを用いて補間する方法などがあるが、それらに限定されない。
【0064】
ステップS102において、データ収集解析装置100は、既に出産して出産状況が確定している妊婦のデータを用いて、GDMを発症した妊婦群とそれ以外の群でデータ分布の違いが大きいデータ項目を、GDM発症予測モデルの特徴量として抽出する。データ分布の違いの大きさの定義には、例えば、「データの平均値が同じとは言えない確率が大きい」ことや「データの分布が同じとは言えない確率が大きい」という指標が利用可能であるが、それらに限定されるものではない。これには、ウェルチのt検定、スチューデントのt検定、多変量解析、多変量ロジスティック回帰、カイ二乗検定、フィッシャーの正確確率検定などを用いた方法や、Lasso回帰やRidge回帰、Elastic Netなどにより有用なデータ項目を限定する方法や主成分分析の寄与率などからデータ項目を限定する方法があるが、それらに限定されるものでない。なお、特徴量とは、何らかの予測モデルを作成する際にモデルの変数として使用するデータ項目のことを指し、例えば血圧、体温などである。
【0065】
ステップS103、S105及びS107において、データ収集解析装置100は、抽出した特徴量を用いてGDM発症予測モデルを生成する。具体的には、データ収集解析装置100は、ステップS103において、GDMになるかどうかを予測する分類モデルとしてGDM発症予測モデルを生成する。また、データ収集解析装置100は、ステップS105において、各妊婦のGDM発症日を予測する回帰モデルとしてGDM発症日予測モデルを生成する。また、データ収集解析装置100は、S107において、GDM発症のリスクを算出するGDM発症リスク算出モデルを生成する。回帰モデルには、線形回帰モデル、ロジスティック回帰モデル、SVMによる回帰モデル、多層ニューラルネットワークによる回帰モデルなどがあるが、それらに限定されるものでない。また、分類モデルにおいても、線形分類、ロジスティック回帰、ベイジアンネットワーク、SVM、k近傍法、ランダムフォレスト、多層ニューラルネットワークによる分類モデルなどがあるが、それらに限定されるものでない。GDM発症リスク算出モデルについては、オッズ比、寄与危険度、相対危険度などがあるが、それらに限定されるものでない。また、ステップS103、S105、S107は、S102と切り離さずに一体で処理されてもよい。
【0066】
ステップS104、S106及びS108において、データ収集解析装置100は、生成されたGDM発症予測モデル、GDM発症日予測モデル及びGDM発症のリスク算出モデルに予測対象の妊婦のデータをそれぞれ投入し、GDM発症予測を実行する。具体的には、データ収集解析装置100は、ステップS104において、GDM発症予測モデルを利用して予測対象の妊婦のデータから将来のGDM発症の有無を予測する。また、データ収集解析装置100は、ステップS106において、GDM発症日予測モデルを利用して予測対象の妊婦のデータからGDM発症日を予測する。また、データ収集解析装置100は、ステップS108において、GDM発症リスク算出モデルを利用して予測対象の妊婦のデータからGDMリスクを算出する。なお、GDM有無予測は、最終的なGDM発症有無の予測、この先n1週間(n1は任意の数値)でGDMを発症しない予測、この先n2週間(n2は任意の数値)でGDMを発症する予測、などを含むが、それらに限定されるものでない。
【0067】
ステップS109において、データ収集解析装置100は、GDM発症予測結果、GDM発症日予測結果及び/又はGDM発症リスク計算結果を妊婦又は医療機関に通知し、当該データ収集解析処理を終了する。
(実施例2)
なお、上述した実施例1のうち、GDM発症予測モデル、GDM発症日予測モデル又はGDM発症リスク算出モデルを生成及び/又は投入するのに利用するデータ項目は、非妊娠時BMI、妊娠回数、出産回数、妊娠時年齢、血圧、脈拍、体重、BMI、歩数、消費カロリー、体温、気分、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便通の柔らかさ、子宮収縮、頭の痛み、歯の痛み、上腹部の痛み、下腹部の痛み、腰の痛み、吐き気、嘔吐、動悸、胎動間隔、食事内容、服薬内容、既往歴、妊娠状況(単胎・多胎)、気温、室温、湿度、気圧、天気概況、潮汐及び月齢の1つ以上に限定されてもよい(ただし、非妊娠時BMI単独の場合を除く)。これにより、より少ないデータ数で効率的にモデルの生成及び利用が可能となる。
(実施例3)
図9は、本発明の一実施例によるGDM発症予測モデル生成処理を示すフローチャートである。上述した実施例2に関して、後述されるGDM発症予測モデル生成処理では、GDMを発症した妊婦群と合併症がない妊婦群のデータ分布の違いの大きさを利用し、複数の妊娠週数において安定して高いGDM発症予測精度を示すGDM発症予測モデルが生成される。当該GDM発症予測モデル生成処理は、上述された
図8のステップS102,S103において実行可能であり、後述されるステップS102-1~9がステップS102の特徴量の抽出処理に対応し、ステップS103-1~3がステップS103のGDM有無予測モデルの生成処理に対応する。実施例3では、GDM発症予測モデル生成機能130は、取得したデータを、GDMを発症した妊婦群と合併症がない妊婦群に分け、各データ項目のうち二群でデータ分布の違いが大きい(すなわち、区別する、判別する、分離するなど)データ項目を抽出し、さらに各データ項目において相関の高いデータ項目同士のうち一つを選択しデータ項目数を削減することによって、GDM発症予測モデルの生成に利用する特徴量を抽出する。なお、上記はGDM発症予測モデルに利用する特徴量の抽出方法やGDM発症予測モデルの選定方法の一例であって、GDM発症予測生成モデル生成処理はこれに制限されない。他複数の回帰手法などによって特徴量を抽出し、GDM発症予測モデルを生成する方法もある。
【0068】
図9に示されるように、ステップS102-1において、データ収集解析装置100は、取得したデータ項目の一部のデータ項目を加工し、新たにデータ項目として追加する。具体的には、データ収集解析装置100は、一部のデータ項目について、以下に限定することなく、数日前のデータとの差、数日間の平均及び分散、計測値の近似モデルを生成したその微分、二階微分などを導出する。また、本発明の実施例において加工処理とは、収集された各データ項目について、その一部また全部から新たにデータを算出する処理を指す。
【0069】
まず、特徴量の抽出処理とGDM発症予測モデル生成処理について説明する。
【0070】
ステップS102-2において、データ収集解析装置100は、元のデータとS102-1で生成したデータとを結合し、モデル生成のために、既に出産済みの妊婦のデータを抽出する。
【0071】
ステップS102-3において、データ収集解析装置100は、GDM発症予測に有用なデータ項目が妊婦の属性(身体的特徴、既往歴、遺伝的体質など)ごとに異なる変化をすることを前提とし、GDMを発症した妊婦群と合併症がない妊婦群の間でデータの分布の違いが大きいデータ項目の抽出を属性ごとに層別化して算出するループを開始する。層別化のために、非妊時BMI、年齢、既往歴、出産歴、児の性別などの妊婦の属性が利用されてもよい。例えば、妊婦の非妊時BMIごとにデータ項目を抽出する場合、妊婦の非妊時BMIをL1~Ln群(例えば、L1=肥満、L2=標準、L3=痩せ)に分けるとすると、妊婦の非妊時BMIを示すパラメータi=L1でループ内処理を実行し、次にiL2として実行し、最終的にi=Lnとして実行する。
【0072】
ステップS102-4において、データ収集解析装置100は、GDM発症予測に有用なデータ項目が妊娠週数ごとに変化することを前提とし、各データ項目について、GDMを発症した妊婦群と合併症がない妊婦群に差があることを示すp値を妊娠週数ごとに算出するループを開始する。N~N+n週(例えば、N=16、N+n=38)まで各週でデータ項目ごとにp値を算出する場合、妊娠日数を示すパラメータt1をt1=N×7(日)でループ内処理を実行し、次にt1=(N+1)×7として実行し、最終的にt1=(N+n)×7として実行する。なおp値は、GDMを発症した妊婦群と合併症がない妊婦群を予測するロジスティック回帰モデルを構築した場合に、当該データ項目を特徴量とする係数が0となる帰無仮説を棄却する確率を示すp値であっても良いし、または群間の当該データ項目の平均値に差があることを示すウェルチのt検定によるp値であっても良く、またその限りではない。
【0073】
ステップS102-5において、データ収集解析装置100は、ループ内処理の最初に、S102-2で抽出したデータから、期間が(t1-a)日から(t1+b)日となるデータを選択し、それらのデータに紐付く妊婦がGDMになった群と、そうでなかった群にデータを分ける。aやbは任意の数値で、例えば1週間単位でモデルを生成する場合は、a=0、b=6である。また、a=28など大きくすることで、t1より28日前のデータからb日後の長期のデータを利用してその後のデータ項目の抽出が可能である。その後、データ収集解析装置100は、ステップS102-5において例えばロジスティック回帰などを用いてp値などを算出する。
【0074】
ステップS102-6において、データ収集解析装置100は、t1の分だけ各データ項目のp値を算出し、ループを終了する。
【0075】
ステップS102-7において、データ収集解析装置100は、各データ項目において、GDMを発症した妊婦群と合併症がない妊婦群の間でデータに有意に差がある期間を算出する。具体的には、N~N+n週の中から、各データ項目のp値がN~N+n週の一部また全部の週で1以上連続してc(例えば、c=0.05)未満となる連続数Sと期間Tを算出し抽出する。例えば、データ項目Xのp値が期間N~N+n週のうちN+k~N+m週で連続してc未満となる場合、連続数S=(N+m)-(N+k)+1となり、期間TはN+m~N+k週となる。S、Tはデータ項目ごとに算出されるため、データ項目がX(1~x)個あった場合、SはS1~Sx、TはT1~Tx分算出される。また、S、Tは1つのデータ項目で複数算出される場合がある。例えば、期間N~N+n週のうち、あるデータ項目uのp値が連続してc未満となる期間が複数(r期間分)ある場合、SuはSu1~Sur、TuはTu1~Tur分算出される。なお、1週間単位に限定することなく、例えば一定期間を1日単位でずらして算出することも可能である。また、上記は具体例の1つであり、p値がc未満である期間が連続している場合を想定した例であるが、連続していなくても傾向として一定期間においてp値がcを下回る頻度の高い期間を算出するような平滑化手法を組み合わせても良い。
【0076】
ステップS102-8において、データ収集解析装置100は、GDM発症予測に有用なデータ項目が妊娠週数ごとに変化することを前提とし、GDM発症予測モデルを妊娠週数ごとに生成するループを開始する。なお、GDM発症予測モデルの生成は、妊娠週数のみに制限されない。具体的には、妊娠期間(初期、中期、後期)などによる生成も可能である。
【0077】
ステップS102-9において、データ収集解析装置100は、S102-8のループ内処理の最初に、S102-7で算出した各データ項目のS,Tを取得する。各データ項目について、Tが期間(t2-a)日から(t2+b)と重複し、Tに対応するSの値がある一定値以上であるデータ項目を取得し、これらをGDM発症予測モデルの特徴量features(t2)とする。特徴量は、BMI、平均動脈圧、下腹部の痛み、拡張期血圧、脈拍、基礎体温、基礎代謝、就寝中に起きた回数、起床時刻、1日に活動した距離、から嘔吐の回数、腰の痛み、骨格筋率、歯の痛み、室温、収縮期血圧、収縮期血圧と拡張期血圧の差、就寝時刻、上腹部の痛み、睡眠の質の悪さ、睡眠時間、総消費カロリー、体脂肪率、体重、非妊娠時からの体重増加率、非妊娠時からの体重増加量、痛みを伴う収縮、痛みを伴わない収縮、吐き気の総時間、頭の痛み、動悸の回数、便通の回数、便通の柔らかさ、1日の歩数、脈圧及び嘔吐、妊娠状況(単胎・多胎)、妊娠回数、出産回数などのデータ項目から抽出される。なお、例として特徴量の組み合わせを
図10中に示す。
図10は、標準体型の妊婦における、妊娠16週から38週のうち10週以上連続して、GDMを発症した妊婦群と合併症がない妊婦群とのデータ分布の違いが大きかったデータ項目の例である。このように、特定の妊娠期間にある一定期間以上連続または集中して、GDMを発症した妊婦群と合併症がない妊婦群とのデータ分布の違いが大きいデータ項目から特徴量を抽出する。なお、
図10は妊娠16週から38週全体の標準体型の妊婦における特徴量の一例であるが、妊娠週数ごとの特徴量抽出も可能である。
【0078】
次に、GDM発症予測モデルの生成方法について説明する。上記で生成した特徴量を使用し、予測精度が高いモデルを選定することを考える。
【0079】
ステップS103-1において、データ収集解析装置100は、S102で抽出した特徴量から、期間が(t2-a)日から(t2+b)日のモデルを生成する。例えば、この時点での予測モデルとして、サポートベクタマシン(SVM)を使用し、期間が(t2-a)日から(t2+b)日のモデルM(i,t2)を生成する。
【0080】
ステップS103-2において、データ収集解析装置100は、t2の分だけ各データ項目のモデルを生成し、ループを終了する。
【0081】
ステップS103-3において、データ収集解析装置100は、iの分だけ各データ項目のモデルを生成し、ループを終了する。
【0082】
以上により、複数の妊娠週数において安定して高いGDM発症予測精度を示すGDM発症予測モデルを生成できる。
(実施例4)
図11は、本発明の実施例によるGDM発症予測処理を示すフローチャートである。上述した実施例3で生成されたGDM発症予測モデルに関して、予測対象となる未出産の妊婦データを適用させることで、任意の妊娠週数において安定して高いGDM発症予測値を算出する。
【0083】
当該GDM発症予測処理は、上述された
図8のステップS102,S103において実行可能であり、後述されるステップS104-1~7がステップS104のGDM発症予測処理に対応する。実施例4では、GDM発症予測機能140は、取得した予測対象妊婦を属性(身体的特徴、既往歴、遺伝的体質など)で分け、妊娠週数に応じたGDM発症予測モデルからGDM発症予測結果を算出する。なお、予測に利用するデータおよびデータ項目が予測対象妊婦のデータにない場合、GDM発症予測モデル生成時の妊婦の中で、予測対象妊婦と属性などが最も近しい妊婦のデータから予測対象妊婦のデータを補間し予測する。
【0084】
図11に示されるように、ステップS104-1において、データ収集解析装置100は、取得したデータ項目の一部のデータ項目を加工し、新たにデータ項目として追加する。具体的には、データ収集解析装置100は、一部のデータ項目について、以下に限定することなく、数日前のデータとの差、数日間の平均及び分散、計測値の近似モデルを生成したその微分、二階微分などを導出する。また、本発明において加工処理とは、収集された各データ項目について、その一部また全部から新たにデータを算出する処理を指す。
【0085】
ステップS104-2において、データ収集解析装置100は、予測対象妊婦を属性によって分類し、分類結果lと予測時の妊娠週数tからGDM発症予測モデルM(l,f,t)を決定する。fはGDM発症予測に必要なデータ項目である。なお、分類はS102-3での分類と同様の方法で実施する。
【0086】
ステップS104-3において、データ収集解析装置100は、予測対象妊婦のデータから、GDM発症予測モデルM(l,f,t)に必要なデータを抽出する。
【0087】
ステップS104-4において、データ収集解析装置100は、S104-3においてGDM発症予測モデルに必要なデータを予測対象妊婦が持っていない場合、予測対象妊婦に不足するデータをGDM発症予測モデル生成時に参加した妊婦から補間する。例えば、GDM発症予測モデルに必要なデータ項目fa、fb、fcのうち、予測対象妊婦のデータの中にデータ項目fcが無い場合、GDM発症予測モデル生成時に参加した妊婦のうち、予測対象妊婦と属性が近しい妊婦のデータから、データ項目fcを抽出し、予測対象妊婦のデータとして補間する。なお、不足データの補間は、GDM発症予測モデル生成時に参加した妊婦データからの補間に限定せず、その他未出産妊婦のデータから補間するなどしてもよいし、当該妊婦の別の時系列のデータから補間しても良い。
【0088】
ステップS104-5において、データ収集解析装置100は、予測対象妊婦のデータをGDM発症予測モデルM(l,f,t)に適用し、予測値を算出する。
【0089】
ステップS104-6において、データ収集解析装置100は、S104-5で算出された予測値を基にロジスティック回帰やSVMなどからGDM発症を予測する。なお、発症予測に用いる方法は上述した方法に限定されない。
【0090】
ステップS104-7において、データ収集解析装置100は、GDM発症予測結果を返す。
【0091】
以上により、複数の妊娠週数において安定して高いGDM発症を予測できる。
【0092】
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0093】
10 データ収集システム
20 計測装置
30 測定値転送装置
40 体調登録装置
50 気象情報取得装置
60 調査票登録装置
70 診療記録登録装置
80 ネットワーク
100 データ収集解析装置