(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024157060
(43)【公開日】2024-11-07
(54)【発明の名称】重症化予測装置、重症化予測方法、及びプログラム
(51)【国際特許分類】
G16H 50/70 20180101AFI20241030BHJP
G16H 50/80 20180101ALI20241030BHJP
G06Q 10/04 20230101ALI20241030BHJP
G01N 33/49 20060101ALI20241030BHJP
【FI】
G16H50/70
G16H50/80
G06Q10/04
G01N33/49 A
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021123710
(22)【出願日】2021-07-28
(71)【出願人】
【識別番号】899000079
【氏名又は名称】慶應義塾
(74)【代理人】
【識別番号】100127384
【弁理士】
【氏名又は名称】坊野 康博
(74)【代理人】
【識別番号】100152054
【弁理士】
【氏名又は名称】仲野 孝雅
(72)【発明者】
【氏名】福永 興壱
(72)【発明者】
【氏名】石井 誠
(72)【発明者】
【氏名】寺井 秀樹
(72)【発明者】
【氏名】満倉 靖恵
【テーマコード(参考)】
2G045
5L010
5L049
5L099
【Fターム(参考)】
2G045AA25
2G045CA17
2G045CA25
2G045DA20
2G045DA36
2G045DA51
2G045JA01
5L010AA04
5L049AA04
5L099AA03
5L099AA22
(57)【要約】
【課題】より簡便な方法で、ウイルスの感染者の重症化に関する予測を行う。
【解決手段】重症化予測装置20は、特徴量抽出部212と、予測モデル構築部213と、予測実行部214と、を備える。特徴量抽出部212は、ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する。予測モデル構築部213は、被験者となる感染者の血液から抽出された特徴量を因子とすると共に、被験者となる感染者がウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築する。予測実行部214は、予測対象者となる感染者の血液から抽出された特徴量と、予測モデルとに基づいて、予測対象者となる感染者の重症化に関する予測をする。
【選択図】
図2
【特許請求の範囲】
【請求項1】
ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する特徴量抽出手段と、
被験者となる前記感染者の血液から抽出された前記特徴量を因子とすると共に、前記被験者となる前記感染者が前記ウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築するモデル構築手段と、
予測対象者となる前記感染者の血液から抽出された前記特徴量と、前記予測モデルとに基づいて、前記予測対象者となる前記感染者の重症化に関する予測をする予測手段と、
を備えることを特徴とする重症化予測装置。
【請求項2】
前記モデル構築手段は、前記特徴量を因子とする場合に、前記血液に含まれる複数の成分における、リンパ球、フェリチン、ヘモグロビン、C反応性蛋白質、及び乳酸脱水素酵素の一部又は全部を、前記血液に含まれる他の成分よりも重要度の高い因子として予測モデルを構築する、
ことを特徴とする請求項1に記載の重症化予測装置。
【請求項3】
前記特徴量抽出手段は、或る感染者について前記特徴量として抽出した複数の成分それぞれの検査値の一部が欠損している場合に、他の感染者の検査値に基づいた代表値により、前記欠損を補間する、
ことを特徴とする請求項1又は2に記載の重症化予測装置。
【請求項4】
ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する特徴量抽出ステップと、
被験者となる前記感染者の血液から抽出された前記特徴量を因子とすると共に、前記被験者となる前記感染者が前記ウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築するモデル構築ステップと、
予測対象者となる前記感染者の血液から抽出された前記特徴量と、前記予測モデルとに基づいて、前記予測対象者となる前記感染者の重症化に関する予測をする予測ステップと、
を含むことを特徴とする重症化予測方法。
【請求項5】
ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する特徴量抽出機能と、
被験者となる前記感染者の血液から抽出された前記特徴量を因子とすると共に、前記被験者となる前記感染者が前記ウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築するモデル構築機能と、
予測対象者となる前記感染者の血液から抽出された前記特徴量と、前記予測モデルとに基づいて、前記予測対象者となる前記感染者の重症化に関する予測をする予測機能と、
をコンピュータに実現させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、重症化予測装置、重症化予測方法、及びプログラムに関する。
【背景技術】
【0002】
近年、新型コロナウイルスに代表される様々なウイルスの感染症への対策が、より重要となっている。また、これに伴い、ウイルスの感染に関する技術の開発が、広く行われている。
【0003】
このような技術の一例が特許文献1に開示されている。特許文献1に開示の技術では、ポリメラーゼ連鎖反応(PCR:Polymerase Chain Reaction)に基づいた、いわゆるPCR検査において、偽陰性が生まれる状況を回避することによって、陰性の判定精度をより向上させている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、ウイルスの感染者が重症化した場合、その治療のためには、専門の医療スタッフや特殊な医療機器や薬剤等が必要となり、治療はより困難となる。従って、このような重症化に対して備えるため、医療現場では、患者が重症化するか否かを予測する必要がある。
【0006】
この点、上述した特許文献1に開示の技術等の一般的な技術では、ウイルスに感染しているか否か(すなわち、陽性であるか陰性であるか)について判定を行うことができるに過ぎず、ウイルスの感染者が、その後重症化するか否かについては判定をすることができない。
【0007】
そのため、医療従事者は、ウイルスの感染者を適宜観察すると共に、多数の項目について検査を行い、様々な指標(例えば、意識レベル、発熱、咳、味覚障害、倦怠感、吐き気や嘔吐、心不全、及び肝機能障害等)に基づいて、重症化に関する予測をしている。しかしながら、このような適宜の観察や多数の項目に関する検査を伴う重症化に関する予測は、医療従事者に負担を生じさせるものであった。
【0008】
本発明は、このような状況に鑑みてなされたものである。そして、本発明の課題は、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うことである。
【課題を解決するための手段】
【0009】
上記課題を解決するため、本発明の一実施形態に係る重症化予測システムは、
ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する特徴量抽出手段と、
被験者となる前記感染者の血液から抽出された前記特徴量を因子とすると共に、前記被験者となる前記感染者が前記ウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築するモデル構築手段と、
予測対象者となる前記感染者の血液から抽出された前記特徴量と、前記予測モデルとに基づいて、前記予測対象者となる前記感染者の重症化に関する予測をする予測手段と、
を備えることを特徴とする。
【発明の効果】
【0010】
本発明によれば、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うことができる。
【図面の簡単な説明】
【0011】
【
図1】重症化予測システムSの全体構成を示すブロック図である。
【
図2】重症化予測装置20により行われる、ウイルスの感染者の重症化に関する予測を実現するための処理の概要について示す模式図である。
【
図3】検査データ管理装置10の構成の一例を示すブロック図である。
【
図4】検査データ記憶部151が記憶する検査データの構造を模式的に示すテーブルである。
【
図5】重症化予測装置20の構成の一例を示すブロック図である。
【
図6】検査データ管理装置10及び重症化予測装置20が実行する検査データ更新処理の流れを説明するフローチャートである。
【
図7】重症化予測装置20が実行する予測モデル構築処理の流れを説明するフローチャートである。
【
図8】重症化予測装置20が実行する予測実行処理の流れを説明するフローチャートである。
【
図9】トレーニンググループのサイズに応じた各因子の影響度の変化について示すグラフである。
【発明を実施するための形態】
【0012】
以下、添付の図面を参照して本発明の実施形態の一例について説明する。
【0013】
[システム構成]
図1は、本実施形態に係る重症化予測システムSの全体構成を示すブロック図である。
図1に示すように、重症化予測システムSは、n台(nは、1以上の任意の整数値)の検査データ管理装置10(ここでは、検査データ管理装置10-1、・・・、検査データ管理装置10-n)と、重症化予測装置20と、ネットワーク30と、を含む。なお、以下の説明において、n台の検査データ管理装置10を区別することなく説明する場合には、符号の末尾を省略して、単に「検査データ管理装置10」と呼ぶ。
【0014】
検査データ管理装置10のそれぞれと、重症化予測装置20とは、任意の通信方式に準拠して、通信可能に接続される。この通信は、装置間で直接行われてもよいし、中継装置を含んだネットワーク30を介して行われてもよい。ネットワーク30を介して通信が行われる場合、このネットワーク30は、例えば、インターネットや、LAN(Local Area Network)といったネットワークにより実現される。
【0015】
重症化予測システムSは、本発明の実施形態の一例であり、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うものである。ここで、本発明の発明者は、ウイルスの感染者の重症化に関する予測について試験研究を重ねた結果、ウイルスの感染者の血液に含まれる複数の成分の検査値と、ウイルスの感染者の重症化との間に相関性があることを見出した。そして、本発明の発明者は、ウイルスの感染者の血液に含まれる所定の成分の検査値に基づいて、ウイルスの感染者の重症化に関する予測をすることが可能であると着想し、本発明を成すに至った。
【0016】
以下、このような本発明の実施形態の一例である重症化予測システムSについて、以下詳細に説明する。この説明のための一例として、「ウイルス」は、新型コロナウイルスと称されるSARSコロナウイルス2(SARS-CoV-2)であり、ウイルスの「感染者」はこの新型コロナウイルスにより新型コロナウイルス感染症(COVID-19)に感染した者であることを想定する。
ただし、これは説明のための一例に過ぎず、本発明の適用範囲を限定する趣旨ではない。例えば、重症化予測システムSが、他のウイルスを対象として、この他のウイルスの感染者の重症化に関する予測を行うようにしてもよい。
【0017】
検査データ管理装置10は、検査データを管理する。検査データ管理装置10は、例えば、病院や検査機関等の医療施設に設置されたサーバやパーソナルコンピュータ、あるいはクラウドサーバ等により実現される。この検査データには、例えば、ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値や、ウイルスの感染者が重症化したか否かを示す情報が含まれる。
検査データ管理装置10は、医療施設で血液検査が行われたり、医療従事者によりウイルスの感染者が重症化したとの診断がなされたりした場合に、これらの検査や診断結果に応じて、検査データを適宜更新する。また、検査データ管理装置10は、更新後の最新の検査データを重症化予測装置20に対して提供する。
【0018】
重症化予測装置20は、検査データ管理装置10から提供された検査データに基づいて、ウイルスの感染者の重症化に関する予測をする。重症化予測装置20は、例えば、病院や検査機関等の医療施設に設置されたサーバやパーソナルコンピュータ、あるいはクラウドサーバ等により実現される。
【0019】
重症化予測装置20により行われる処理の概要について、
図2を参照して説明をする。
図2は、重症化予測装置20により行われる、ウイルスの感染者の重症化に関する予測を実現するための処理の概要について示す模式図である。
【0020】
前提として、本実施形態では、ウイルスの感染者を3つに分類する。
まず、ウイルスの感染者であって、自身の検査データが予測モデルの構築のために用いられる感染者を「被験者」に分類する。この被験者は、さらに、重症と診断された(すなわち、重症化した)被験者(図中の(A)に相当)と、非重症と診断された(すなわち、重症化しなかった)被験者(図中の(B)に相当)に分類される。一方で、ウイルスの感染者であって、重症化に関する予測の対象者となる感染者を「予測対象者」に分類する(図中の(C)に相当)。
【0021】
そして、重症化予測装置20は、被験者となるウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する(図中の(1)及び(2)に相当)。
次に、重症化予測装置20は、被験者となる感染者の血液から抽出された特徴量を因子(すなわち、説明変数)とすると共に、特徴量の取得元となった被験者となる感染者がウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築する(図中の(3)に相当)。この予測モデルは、予測対象者を「重症化する」又は「重症化しない」の何れかに分類する二項分類器である。
【0022】
次に、重症化予測装置20は、予測対象者となるウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する(図中の(4)に相当)。
さらに、重症化予測装置20は、予測対象者となる感染者の血液から抽出された特徴量と、予測モデルとに基づいて、予測対象者となる感染者の重症化に関する予測をする。具体的には、重症化予測装置20は、予測対象者となる感染者から抽出された特徴量を予測モデルに入力(図中の(5)に相当)する。そして、重症化予測装置20は、この入力に対応する予測モデルからの出力を、予測対象者の重症化に関する予測結果として、重症化予測装置20のユーザ(例えば、医療従事者)に対して提示する(図中の(6)に相当)。
【0023】
このように、重症化予測装置20は、被験者となる感染者の血液から抽出された特徴量により構築した予測モデルと、予測対象者となる感染者の血液から抽出された特徴量とに基づいて、予測対象者となる感染者の重症化に関する予測をする。ここで、このような処理を実現するための特徴量は、感染者の血液に含まれる複数の成分それぞれの検査値から抽出できる。
すなわち、医療従事者は、感染者の血液を採取するのみで、重症化予測装置20により予測を行うことができる。これは、従来行われている、適宜の観察や多数の項目に関する検査を伴う重症化に関する予測に比べて、非常に簡便な方法である。
従って、重症化予測装置20によれば、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うことができる。
【0024】
次に、このようなウイルスの感染者の重症化に関する予測を実現するための、検査データ管理装置10及び重症化予測装置20のハードウェア及び機能の構成について説明をする。
【0025】
[検査データ管理装置の構成]
検査データ管理装置10の構成について、
図3を参照して説明をする。
図3は、検査データ管理装置10の構成の一例を示すブロック図である。
図3に示すように、検査データ管理装置10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、通信部14と、記憶部15と、入力部16と、出力部17と、ドライブ18と、を備えている。これら各部は、信号線により接続されており、相互に信号を送受する。
【0026】
CPU11は、ROM12に記録されているプログラム、又は、記憶部15からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0027】
通信部14は、CPU11が、他の装置との間で通信を行うための通信制御を行う。
記憶部15は、DRAM(Dynamic Random Access Memory)等の半導体メモリで構成され、各種データを記憶する。
【0028】
入力部16は、各種ボタン及びタッチパネル、又はマウス及びキーボード等の外部入力装置で構成され、ユーザの指示操作に応じて各種情報を入力する。
出力部17は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
【0029】
ドライブ18には、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリ等よりなる、リムーバブルメディア51が適宜装着される。ドライブ18よってリムーバブルメディア51から読み出されたプログラムは、必要に応じて記憶部15にインストールされる。
【0030】
検査データ管理装置10では、これら各部が協働することにより、「検査データ管理処理」を行なう。
ここで、検査データ管理処理は、検査データ管理装置10が管理データを適宜更新すると共に、更新後の最新の検査データを重症化予測装置20に対して提供する一連の処理である。
【0031】
検査データ管理処理が実行される場合、
図3に示すように、CPU11において、検査データ管理部111と、検査データ提供部112と、が機能する。
また、記憶部15の一領域には、検査データ記憶部151が設けられる。
以下で特に言及しない場合も含め、これら機能ブロック間では、処理を実現するために必要なデータを、適切なタイミングで適宜送受信する。
【0032】
検査データ管理部111は、入力部16が受け付けた検査データ管理装置10のユーザによる入力操作や、通信部14を介して受信した他の装置(例えば、医療施設で利用される血液検査装置)からの検査結果に基づいて、最新の検査データ(例えば、最新の検査値や最新の診断結果)を取得する。
そして、検査データ管理部111は、取得した最新の検査データに基づいて、検査データ記憶部151が記憶している既存の検査データを最新の内容に更新する。すなわち、検査データ記憶部151は、検査データを記憶する記憶部として機能する。
【0033】
検査データ記憶部151が記憶する検査データについて、
図4を参照して説明する。
図4は、検査データ記憶部151が記憶する検査データの構造を模式的に示すテーブルである。
図4に示すように、この検査データテーブルは、列(カラム)として、感染者情報である「感染者ID」及び「感染者属性」と、検査値である「血小板」、「LDH」、・・・、「フェリチン」と、「重症化診断結果」と、を含んでいる。また、この検査データテーブルは、感染者それぞれについて、行(レコード)を設けている。そして各入力項目(フィールド)には、検査データ管理部111により対応するデータが格納される。
【0034】
ここで、感染者IDは、各感染者を識別するための識別子であり、各感染者に対してユニークな番号やテキスト等の情報が割り当てられ、格納される。
【0035】
感染者属性は、感染者の属性を示す情報であり、例えば、感染者の年齢や性別や基礎疾患の有無等の情報が格納される。
【0036】
血小板、LDH、・・・、フェリチンは、感染者の血液の成分それぞれに対応するものであり、これら血液の成分それぞれの検査値が格納される。ただし、図中に示したこれらの成分(すなわち、血小板、LDH、・・・、フェリチン)は例示に過ぎず、これら以外の成分の検査値が格納されるようにしてもよい。なお、検査値を取得する前提となる、血液の採取や血液検査の手法については、当業者によく知られているので、ここでの詳細な説明は省略する。また、図中では、検査値の値を「***」として示す。
【0037】
重症化診断結果は、医療従事者による重症化に関する診断結果が格納される。具体的には、重症化したと診断された場合に「重症化」、重症化しなかったと診断された場合に「非重症化」、未だ診断がなされていない場合に「未確定」といった情報が格納される。
【0038】
上述したように、検査データ管理部111は、医療施設で血液検査が行われたり、医療従事者によりウイルスの感染者が重症化したとの診断がなされたりした場合に、これらの検査や診断結果に応じて、検査データを適宜更新する。
なお、この検査データは、本実施形態のために収集された本実施形態専用の検査データであってもよいが、医療施設間での情報共有や研究のために収集された一般的な検査データであってもよい。すなわち、本実施形態は、すでに世の中に多数存在する、一般的な検査データを流用して、予測モデルの構築等を行うことが可能である。
【0039】
図3に戻り、検査データ提供部112は、検査データ記憶部151が記憶する更新後の最新の検査データを、通信部14を介して重症化予測装置20に対して送信することにより提供する。提供のタイミングは、検査データが更新される都度であってもよいし、重症化予測装置20からの要求に応じてであってもよいし、所定の周期であってもよい。また、提供の方法としては、検査データを、通信部14を介して重症化予測装置20に送信する方法でもよいが、リムーバブルメディア51等の記憶媒体を介する方法でもよい。
【0040】
[重症化予測装置の構成]
次に、重症化予測装置20の構成について、
図5を参照して説明をする。
図5は、重症化予測装置20の構成の一例を示すブロック図である。
図5に示すように、重症化予測装置20は、CPU21と、ROM22と、RAM23と、通信部24と、記憶部25と、入力部26と、出力部27と、ドライブ28と、を備えている。これら各部は、信号線により接続されており、相互に信号を送受する。これら各部は、
図3を参照して上述した、検査データ管理装置10が備える同名の各部と同等のハードウェアにより実現される。例えば、CPU21は、CPU11と同等のハードウェアにより実現される。従って、ここでは、これら各部についての、重複する説明を省略する。
【0041】
重症化予測装置20では、これら各部が協働することにより、「検査データ更新処理」、「予測モデル構築処理」及び「予測実行処理」を行なう。
ここで、上述したように、検査データ管理処理は、検査データ管理装置10が管理データを適宜更新すると共に、更新後の最新の検査データを重症化予測装置20に対して提供する一連の処理である。
【0042】
また、予測モデル構築処理は、被験者の検査データから抽出した特徴量に基づいて、重症化に関する予測を行うための予測モデルを構築する一連の処理である。
【0043】
さらに、予測実行処理は、予測対象者の検査データから抽出した特徴量と、予測モデルとに基づいて、重症化に関する予測を実行する一連の処理である。
【0044】
これらの処理が実行される場合、
図5に示すように、CPU21において、検査データ取得部211と、特徴量抽出部212と、予測モデル構築部213と、予測実行部214と、が機能する。
また、記憶部25の一領域には、検査データ記憶部251と、特徴量記憶部252と、予測モデル記憶部253と、が設けられる。
以下で特に言及しない場合も含め、これら機能ブロック間では、処理を実現するために必要なデータを、適切なタイミングで適宜送受信する。
【0045】
検査データ取得部211は、検査データ管理装置10から提供された最新の検査データを取得する。例えば、検査データの提供が、検査データ管理装置10からの送信により行われる場合、検査データ取得部211は、この検査データを、通信部24を介して受信することにより取得する。また、検査データの提供が、リムーバブルメディア51等の記憶媒体を介して行われる場合、検査データ取得部211は、この検査データを、ドライブ28を介して読み取ることにより取得する。
【0046】
そして、検査データ取得部211は、取得した検査データを検査データ記憶部251に記憶させる。すなわち、検査データ記憶部251は、検査データを記憶する記憶部として機能する。これにより、検査データ記憶部251の記憶する検査データは、検査データ記憶部151の記憶する検査データと同様に、最新の内容に更新される。なお、検査データは、複数存在する検査データ管理装置10の内の、何れの検査データ管理装置10から取得されてもよい。
【0047】
特徴量抽出部212は、検査データ記憶部251が記憶する検査データから特徴量を抽出する。具体的には、特徴量抽出部212は、ウイルスの感染者の血液の成分の検査値の値と、その感染者の重症化診断結果とを組にした情報を、各感染者それぞれについて特徴量として抽出する。
ここで、検査データには、血液中の様々な成分の検査値が含まれているが、その中には、ウイルスの感染者の重症化との間に相関性が高い成分と、相関性が低い(あるいは相関性が無い)成分が存在する。そこで、特徴量抽出部212は、特徴量として、全ての成分の検査値を抽出するのではなく、ウイルスの感染者の重症化との間に相関性が高い成分の検査値を抽出するようにする。これにより、より精度高く、重症化に関する予測を行うことが可能な予測モデルを構築したり、予測を実行したりすることができる。具体的に、何れの成分の検査値を特徴量として抽出することが望ましいかについては、後述の検証例において説明する。
【0048】
そして、特徴量抽出部212は、抽出した特徴量を特徴量記憶部252に記憶させる。すなわち、特徴量記憶部252は、特徴量を記憶する記憶部として機能する。
【0049】
予測モデル構築部213は、特徴量記憶部252が記憶する被験者の検査データの特徴量に基づいて、予測モデルを構築する。この予測モデルの構築には、上述したように、被験者となる感染者であって重症化した感染者(すなわち、重症化診断結果が「重症化」の感染者)の検査データの特徴量と、被験者となる感染者であって重症化しなかった感染者(すなわち、重症化診断結果が「非重症化」の感染者)の検査データの特徴量とが用いられる。
【0050】
予測モデル構築部213は、まず、予測モデルの構築を適切に行うべく、これらの特徴量に対して、所定の前処理を行う。予測モデル構築部213は、例えば、前処理として、特徴量として抽出された血液の成分の検査値のそれぞれについて、検査値の平均と標準偏差を用いて、平均0で標準偏差1となるようにデータの標準化を行う。これにより、各血液の成分を同じスケールで扱って、予測モデルを構築することができる。
【0051】
また、例えば、或る感染者について特徴量として抽出された複数の成分それぞれの検査値の一部が欠損している場合がある。例えば、そもそも検査データにおいて、或る成分についての検査値が存在しない場合である。この場合に、予測モデル構築部213は、前処理として、他の感染者の、この或る成分の検査値に基づいた代表値により、前記欠損を補間する。代表値は、例えば、平均値や、中央値や、最頻値である。これにより、血液の一部の成分について検査値が欠損していないが、血液の他の成分について検査値が存在するような被験者の特徴量も、予測モデルの構築に用いることが可能となる。
【0052】
そして、予測モデル構築部213は、このような前処理を行った特徴量に基づいて、予測モデルを構築する。ここで、予測モデル構築部213により構築される予測モデルは、予測対象者を「重症化する」又は「重症化しない」の何れかに分類する二項分類器であればよく、その構築手法は、特に限定されないが、例えば、予測モデル構築部213は、被験者となる感染者の血液から抽出された特徴量を因子(すなわち、説明変数)とすると共に、特徴量の取得元となった被験者となる感染者がウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築する。
【0053】
この場合、予測モデル構築部213は、下記の式(1)に示すロジスティック回帰式において、変数増減法による説明変数の最適化を行う。ここで、説明変数は、特徴量抽出部212が抽出した特徴量における血液の成分それぞれの検査値であり、説明変数として何れの血液の成分の検査値の偏回帰係数を増減するかを最適化する機械学習を行うことにより、予測モデルを構築する。
【0054】
【数1】
ただし、式(1)において、pは陽性確率であり、β
iは偏回帰係数であり、x
iは説明変数である。
【0055】
この場合に、予測モデル構築部213は、予測モデルの構築において、その他の既存の手法をさらに適用してもよい。例えば、予測モデル構築部213は、被験者となる感染者であって、重症化した感染者と、重症化しなかった感染者との比に基づいたクラス重みの調整を行う。
【0056】
あるいは、予測モデル構築部213は、汎化性能を実現するため、k-分割交差検証(k-fold cross-validation)による検証を行うようにする。この場合、Kの値は、例えば、5とする。
【0057】
他にも、予測モデル構築部213は、例えば、分類器の予測能の指標として、ROC(Receiver operating characteristic)曲線を作成し、AUC(Area Under the Curve)を求める。この際、カットオフ値pc>pの場合非重症化(すなわち、陰性)とし、カットオフ値pc≦pの場合重症化(すなわち、陽性)とし、これらの結果に基づいて、感度(すなわち、正常な人を正常と判定できる確率)と、特異度(すなわち、異常な人を以上と判定できる確率)を特定し、検証を行う。
【0058】
予測モデル構築部213は、適宜このような検証等を行いつつ、機械学習を繰り返し、予測モデルを構築する。そして、予測モデル構築部213は、構築した予測モデルを予測モデル記憶部253に記憶させる。すなわち、予測モデル記憶部253は、予測モデルを記憶する記憶部として機能する。
【0059】
予測実行部214は、特徴量記憶部252が記憶している予測対象者となる感染者の検査データの特徴量と、予測モデル記憶部253が記憶している予測モデルとに基づいて、重症化に関する予測をする。例えば、予測実行部214は、入力部26が受け付けたユーザからの予測対象となる感染者の選択操作(又は、通信部24を介して受信したユーザからの予測対象となる感染者の選択操作)に基づいて、予測対象となる感染者の特徴量を取得する。この場合、この予測対象となる感染者は、重症化診断結果が「未確定」の感染者から選択される。
【0060】
また、予測実行部214は、予測を適切に行うべく、この予測対象者の特徴量に対して、予測モデル構築部213による前処理と同様にデータの正規化等の前処理を行う。そして、予測実行部214は、この前処理後の予測対象者の特徴量を、予測モデル記憶部253が記憶する予測モデルに入力することにより、重症化に関する予測を実行する。また、予測実行部214は、この入力に対応する予測モデルからの出力を、予測対象者の重症化に関する予測結果とする。ここで、この予測モデルは、予測対象者を「重症化する」又は「重症化しない」の何れかに分類する二項分類器である。そのため、予測モデルの出力は、予測対象者が「重症化する」又は「重症化しない」の何れに該当するのかを示すものである。
【0061】
そして、予測実行部214は、この予測結果を、重症化予測装置20のユーザ(例えば、医療従事者)に対して提示する。この提示は、例えば、出力部27に含まれるディスプレイへの表示や、出力部27に含まれるスピーカからの音声出力や、通信部24を介した印刷装置(図示を省略する。)からの紙媒体への印刷や、通信部24を介したユーザが利用する他の装置(図示を省略する。)への送信であってよい。
【0062】
これにより、被験者となる感染者の血液から抽出された特徴量により構築した予測モデルと、予測対象者となる感染者の血液から抽出された特徴量とに基づいて、予測対象者となる感染者の重症化に関する予測を行い、その予測結果をユーザに対して提示することができる。そのため、ユーザは、重症化すると予測された感染者への対策(例えば、病床や特殊な医療機器の確保等)を予め講じることができ、いち早く適切な治療を開始するようなことが可能となる。
【0063】
[動作]
次に、重症化予測システムSの動作について説明する。
[検査データ更新処理]
図6は、検査データ管理装置10及び重症化予測装置20が実行する検査データ更新処理の流れを説明するフローチャートである。検査データ更新処理は、検査データ管理装置10及び重症化予測装置20の起動に伴い、周期的に繰り返し実行される。
【0064】
まず、検査データ管理装置10側の処理の流れから説明する。
ステップS11において、検査データ管理部111は、ユーザによる入力操作や、他の装置(例えば、医療施設で利用される血液検査装置)からの検査結果の受信により、最新の検査データを取得したか否かを判定する。最新の検査データを取得した場合は、ステップS11においてYesと判定され、処理はステップS12に進む。一方で、最新の検査データを取得していない場合は、ステップS11においてNoと判定され、処理はステップS13に進む。
【0065】
ステップS12において、検査データ管理部111は、取得した最新の検査データを検査データ記憶部151に記憶させることにより、検査データを更新する。
【0066】
ステップS13において、検査データ提供部112は、検査データ記憶部151が記憶する更新後の最新の検査データを、通信部14を介して重症化予測装置20に対して送信することにより提供するタイミングとなったか否かを判定する。上述したように、提供のタイミングは、検査データが更新される都度であってもよいし、重症化予測装置20からの要求に応じてであってもよいし、所定の周期であってもよい。検査データを提供するタイミングとなった場合は、ステップS13においてYesと判定され、処理はステップS14に進む。一方で、検査データを提供するタイミングとなっていない場合は、ステップS13においてNoと判定され、本処理は終了する。そして、所定の周期でまたステップS11から処理が繰り返される。
【0067】
ステップS14において、検査データ提供部112は、検査データ記憶部151が記憶する更新後の最新の検査データを、通信部14を介して重症化予測装置20に対して送信することにより提供する。これにより、本処理は終了する。そして、所定の周期でまたステップS11から処理が繰り返される。
【0068】
次に、重症化予測装置20側の処理の流れについて説明する。
ステップS21において、検査データ取得部211は、最新の検査データを受信したか否かを判定する。最新の検査データを受信した場合は、ステップS21においてYesと判定され、処理はステップS22に進む。一方で、最新の検査データを受信していない場合は、ステップS21においてNoと判定され、本処理は終了する。そして、所定の周期でまたステップS21から処理が繰り返される。
【0069】
ステップS22において、受信した最新の検査データを検査データ記憶部251に記憶させることにより、検査データを更新する。これにより、本処理は終了する。そして、所定の周期でまたステップS21から処理が繰り返される。
【0070】
以上説明した検査データ更新処理により、検査データ記憶部151及び検査データ記憶部251の記憶する検査データは、適宜最新の内容に更新される。
【0071】
[予測モデル構築処理]
図7は、重症化予測装置20が実行する予測モデル構築処理の流れを説明するフローチャートである。予測モデル構築処理は、入力部26が受け付けた重症化予測装置20のユーザによる、予測モデル構築処理の開始指示操作に基づいて実行される。
【0072】
ステップS31において、特徴量抽出部212は、検査データ記憶部251が記憶する検査データから被験者の特徴量を抽出する。
【0073】
ステップS32において、特徴量抽出部212は、抽出した被験者の特徴量を特徴量記憶部252に記憶させる。
【0074】
ステップS33において、予測モデル構築部213は、予測モデルの構築を適切に行うべく、被験者の特徴量に対して、所定の前処理を行う。
【0075】
ステップS34において、予測モデル構築部213は、前処理を行った被験者の特徴量に基づいて、予測モデルを構築する。
【0076】
ステップS35において、予測モデル構築部213は、予測モデルの構築を終了するか否かを判定する。予測モデル構築部213は、例えば、所定回数ないし所定時間予測モデルの構築のための機械学習を継続した場合や、予測モデルの予測精度が所定の精度となった場合に予測モデルの構築を終了する。予測モデルの構築を終了する場合は、ステップS35においてYesと判定され、処理はステップS36に進む。一方で、予測モデルの構築を終了しない場合は、ステップS35においてNoと判定され、処理はステップS34に戻り、予測モデルの構築が継続される。
【0077】
ステップS36において、予測モデル構築部213は、構築した予測モデルを予測モデル記憶部253に記憶させる。これにより、本処理は終了する。
【0078】
以上説明した、予測モデル構築処理により、重症化に関する予測をするための予測モデルが構築される。
【0079】
[予測実行処理]
図8は、重症化予測装置20が実行する予測実行処理の流れを説明するフローチャートである。予測実行処理は、入力部26が受け付けた重症化予測装置20のユーザによる、予測実行処理の開始指示操作に基づいて実行される。
【0080】
ステップS41において、検査データ記憶部251が記憶する検査データから予測対象者の特徴量を抽出する。
【0081】
ステップS42において、特徴量抽出部212は、抽出した予測対象者の特徴量を特徴量記憶部252に記憶させる。
【0082】
ステップS43において、予測実行部214は、予測を適切に行うべく、予測対象者の特徴量に対して、予測モデル構築部213による前処理と同様にデータの正規化等の前処理を行う。
【0083】
ステップS44において、予測実行部214は、前処理後の予測対象者の特徴量を、予測モデル記憶部253が記憶する予測モデルに入力することにより、重症化に関する予測を実行する。
【0084】
ステップS45において、予測実行部214は、この入力に対応する予測モデルからの出力を、予測対象者の重症化に関する予測結果として、重症化予測装置20のユーザ(例えば、医療従事者)に対して提示する。これにより、本処理は終了する。
【0085】
以上説明した予測実行処理により、重症化予測装置20は、被験者となる感染者の血液から抽出された特徴量により構築した予測モデルと、予測対象者となる感染者の血液から抽出された特徴量とに基づいて、予測対象者となる感染者の重症化に関する予測をする。ここで、このような処理を実現するための特徴量は、感染者の血液に含まれる複数の成分それぞれの検査値から抽出できる。
すなわち、医療従事者は、感染者の血液を採取するのみで、重症化予測装置20により予測を行うことができる。これは、従来行われている、適宜の観察や多数の項目に関する検査を伴う重症化に関する予測に比べて、非常に簡便な方法である。
従って、重症化予測装置20によれば、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うことができる。
【0086】
[検証例]
以上、本発明の実施形態について説明した。次に、本発明の実施形態における、検証例について説明をする。
本検証例では、複数の病院から収集した300人分のウイルスの感染者の検査データに対して、本発明の実施形態における上述の各処理を実行した。なお、これら300人の年齢層は多岐にわたっている。また、これら300人の性別についても男女がほぼ同数含まれている。さらに、これら300人の内、重症患者はおおむね100人である。
【0087】
そして、構築される予測モデルの精度を高めるために、予測モデルの構築に用いるトレーニンググループのサイズ(すなわち、300人分の特徴量の内、何人分の特徴量を予測モデルの構築の機械学習のために用いるのか)を変更することにより、トレーニンググループを複数作成した。具体的には、300人分の特徴量の内、10%である30人分の特徴量を予測モデルの構築に用いる第1のトレーニンググループを作成し、20%である60人分の特徴量を予測モデルの構築に用いる第2のトレーニンググループを作成し、これを10%間隔で増加させていくことにより、90%である270人分の特徴量を予測モデルの構築に用いる第9のトレーニンググループまで作成した。
【0088】
そして、各サイズグループの特徴量を用いて予測モデルを構築することを、20回行った。
さらに、各予測モデルの構築において得られた、各因子(すなわち、説明変数とされた各血液の成分の検査値)の係数(すなわち、Zスコア)を正規化した。そして、20回行った結果の平均値を算出した。その平均値を
図9に示す。
【0089】
図9は、トレーニンググループのサイズに応じた各因子の影響度の変化について示すグラフである。このグラフでは、縦軸が各因子の係数(すなわち、Zスコア)の平均値を示し、横軸がトレーニンググループのサイズを示す。
【0090】
なお、上述したように、特徴量として、全ての成分の検査値を抽出するのではなく、ウイルスの感染者の重症化との間に相関性が高い成分の検査値を抽出するようにしている。ここでは、30を超える血液の成分の中から、リンパ球(Lymphocytes)、ヘモグロビン(Hemoglobin)、クレアチン(Cre:Creatine)、乳酸脱水素酵素(LDH:Lactate Dehydrogenase)、フェリチン(Ferritin)、Dダイマー(D-dimer)、及びC反応性蛋白質(CRP:C-reactive protein)の7つの成分の検査値を抽出している。これらは、医師による医学的見地や、予測モデルの構築の試行から、ウイルスの感染者の重症化との間に相関性が高い成分として選択された検査値である。
【0091】
そして、
図9に示すように、本検証例では、特に、リンパ球、フェリチン、ヘモグロビン、C反応性蛋白質、及び乳酸脱水素酵素の順に、ウイルスの感染者の重症化との間に相関性が高い成分となった。従って、予測モデルを構築する場合は、これらの成分の一部又は全部の検査値を特徴量として因子(すなわち、目的変数)とすることにより、血液に含まれる他の成分よりも重要度の高い因子として予測モデルを構築することが望ましい。
【0092】
そして、本検証例では、何れのトレーニンググループの予測モデルも、重症化に関する予測の精度は、80%を超えていた。すなわち、80%を超える高い確率で、予測対象者が、重症化するか(あるいは、重症化しないか)を予測することが可能であった。このように、本発明の実施形態によれば、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うことができるのみならず、精度高い予測を行うこともできる。
【0093】
[変形例]
以上、本発明の実施形態について説明したが、この実施形態は例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明は、本発明の要旨を逸脱しない範囲で、その他の様々な実施形態を取ることが可能である共に、省略及び置換等種々の変形を行うことができる。この場合に、これら実施形態及びその変形は、本明細書等に記載された発明の範囲及び要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
一例として、以上説明した本発明の実施形態を、以下に例示するようにして変形してもよい。
【0094】
上述した実施形態における重症化予測システムSの装置構成は一例に過ぎず、適宜変更することが可能である。例えば、上述した実施形態では、検査データ管理装置10と、重症化予測装置20とが別体の装置として実現されていた。これに限らず、例えば、検査データ管理装置10と、重症化予測装置20とが一体の装置として実現されてもよい。
【0095】
また、上述した実施形態では、検査データ管理装置10や重症化予測装置20のそれぞれを単一のコンピュータで実現していた。これに限らず、検査データ管理装置10や重症化予測装置20のそれぞれを、クラウドコンピューティング等の技術を利用することにより複数のコンピュータで実現するようにしてもよい。
【0096】
他にも、上述した実施形態では、1つの予測モデルを構築することを想定していた。これに限らず、複数の予測モデルを構築するようにしてもよい。例えば、検査データに含まれる感染者の属性毎に基づいて、性別毎や年齢層毎に検査データを分類する。そして、性別毎や年齢層毎にそれぞれ予測モデルを構築するようにしてもよい。そして、予測対象者の性別や年齢層に適合する予測モデルを用いて、重症化に関する予測を行うようにしてもよい。これにより、性別や年齢層といった特性により適合した、予測を行うことが可能となる。
【0097】
他にも、上述した実施形態では、ロジスティック回帰式により分類器を作成した。これに限らず、例えば、単純パーセプトロンや、線形サポートベクトルマシンといった他の手法により分類器を作成するようにしてもよい。
【0098】
[構成例]
以上のように、本実施形態に係る重症化予測装置20は、特徴量抽出部212と、予測モデル構築部213と、予測実行部214と、を備える。
特徴量抽出部212は、ウイルスの感染者の血液に含まれる複数の成分それぞれの検査値を特徴量として抽出する。
予測モデル構築部213は、被験者となる感染者の血液から抽出された特徴量を因子とすると共に、被験者となる感染者がウイルスへの感染により重症化したか否かを目的変数として、ロジスティックス回帰分析を行うことにより、重症化に関する予測をする予測モデルを構築する。
予測実行部214は、予測対象者となる感染者の血液から抽出された特徴量と、予測モデルとに基づいて、予測対象者となる感染者の重症化に関する予測をする。
【0099】
このように、重症化予測装置20は、被験者となる感染者の血液から抽出された特徴量により構築した予測モデルと、予測対象者となる感染者の血液から抽出された特徴量とに基づいて、予測対象者となる感染者の重症化に関する予測をする。ここで、このような処理を実現するための特徴量は、感染者の血液に含まれる複数の成分それぞれの検査値から抽出できる。
すなわち、医療従事者は、感染者の血液を採取するのみで、重症化予測装置20により予測を行うことができる。これは、従来行われている、適宜の観察や多数の項目に関する検査を伴う重症化に関する予測に比べて、非常に簡便な方法である。
従って、重症化予測装置20によれば、より簡便な方法で、ウイルスの感染者の重症化に関する予測を行うことができる。
【0100】
予測モデル構築部213は、特徴量を因子とする場合に、血液に含まれる複数の成分における、リンパ球、フェリチン、ヘモグロビン、C反応性蛋白質、及び乳酸脱水素酵素の一部又は全部を、血液に含まれる他の成分よりも重要度の高い因子として予測モデルを構築する。
これにより、重症化と相関性の高い成分の検査値を重要度の高い因子として、精度高く、ウイルスの感染者の重症化に関する予測を行うことができる。
【0101】
特徴量取得手段は、或る感染者について特徴量として抽出した複数の成分それぞれの検査値の一部が欠損している場合に、他の感染者の検査値に基づいた代表値により、欠損を補間する。
これにより、例えば、予測対象者となる感染者について、血液の複数の成分のうちの何れかの成分についての検査値が欠損していたとしても、これを補間できる。そして、他の欠損していない成分の検査値と共に、ウイルスの感染者の重症化に関する予測を行うことができる。
【0102】
[ハードウェアやソフトウェアによる機能の実現]
上述した実施形態による一連の処理を実行させる機能は、ハードウェアにより実現することもできるし、ソフトウェアにより実現することもできるし、これらの組み合わせにより実現することもできる。換言すると、上述した一連の処理を実行する機能が、重症化予測システムSの何れかにおいて実現されていれば足り、この機能をどのような態様で実現するのかについては、特に限定されない。
【0103】
例えば、上述した一連の処理を実行する機能を、演算処理を実行するプロセッサによって実現する場合、この演算処理を実行するプロセッサは、シングルプロセッサ、マルチプロセッサ及びマルチコアプロセッサ等の各種処理装置単体によって構成されるものの他、これら各種処理装置と、ASIC(Application Specific Integrated Circuit)又はFPGA(Field-Programmable Gate Array)等の処理回路とが組み合わせられたものを含む。
【0104】
また、例えば、上述した一連の処理を実行する機能を、ソフトウェアにより実現する場合、そのソフトウェアを構成するプログラムは、ネットワーク又は記録媒体を介してコンピュータにインストールされる。この場合、コンピュータは、専用のハードウェアが組み込まれているコンピュータであってもよいし、プログラムをインストールすることで所定の機能を実行することが可能な汎用のコンピュータ(例えば、汎用のパーソナルコンピュータ等の電子機器一般)であってもよい。また、プログラムを記述するステップは、その順序に沿って時系列的に行われる処理のみを含んでいてもよいが、並列的あるいは個別に実行される処理を含んでいてもよい。また、プログラムを記述するステップは、本発明の要旨を逸脱しない範囲内において、任意の順番に実行されてよい。
【0105】
このようなプログラムを記録した記録媒体は、コンピュータ本体とは別に配布されることによりユーザに提供されてもよく、コンピュータ本体に予め組み込まれた状態でユーザに提供されてもよい。この場合、コンピュータ本体とは別に配布される記憶媒体は、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)、あるいはBlu-ray(登録商標) Disc(ブルーレイディスク)等により構成される。光磁気ディスクは、例えば、MD(Mini Disc)等により構成される。これら記憶媒体は、例えば、リムーバブルメディア51やリムーバブルメディア52として実現され、ドライブ18やドライブ28に装着されて、コンピュータ本体に組み込まれる。また、コンピュータ本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されているROM12やROM22、あるいは記憶部15や記憶部25に含まれるSSD(Solid State Drive)やハードディスク等により構成される。
【符号の説明】
【0106】
10 検査データ管理装置、20 重症化予測装置、11,21 CPU、12,22 ROM、13,23 RAM、14,24 通信部、15,25 記憶部、16,26 入力部、17,27 出力部、18,28 ドライブ、51,52 リムーバブルメディア、111 検査データ管理部、112 検査データ提供部、151,251 検査データ記憶部、211 検査データ取得部、212 特徴量抽出部、213 予測モデル構築部、214 予測実行部、252 特徴量記憶部、253 予測モデル記憶部、S 重症化予測システム