IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 東京大学の特許一覧

<>
  • 特許-予後予測装置、及びプログラム 図1
  • 特許-予後予測装置、及びプログラム 図2
  • 特許-予後予測装置、及びプログラム 図3
  • 特許-予後予測装置、及びプログラム 図4
  • 特許-予後予測装置、及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-13
(45)【発行日】2024-06-21
(54)【発明の名称】予後予測装置、及びプログラム
(51)【国際特許分類】
   G16H 50/50 20180101AFI20240614BHJP
【FI】
G16H50/50
【請求項の数】 7
(21)【出願番号】P 2022514361
(86)(22)【出願日】2021-03-16
(86)【国際出願番号】 JP2021010712
(87)【国際公開番号】W WO2021205828
(87)【国際公開日】2021-10-14
【審査請求日】2022-10-03
(31)【優先権主張番号】P 2020070768
(32)【優先日】2020-04-10
(33)【優先権主張国・地域又は機関】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)2019年度、国立研究開発法人日本医療研究開発機構、医療分野国際科学技術共同研究開発推進事業Interstellar Initiative、研究開発課題名「Development of personalized treatment algorithm for pneumonia of the very old people using artificial intelligence」、産業技術力強化法第17条の適用を受ける特許出願 令和2年度、国立研究開発法人日本医療研究開発機構、新興・再興感染症に対する革新的医薬品等開発推進研究事業、研究開発課題名「人工知能を用いたCOVID19肺炎の重症度トリアージシステムの開発」、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100122275
【弁理士】
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】田岡 和城
(72)【発明者】
【氏名】坪坂 歩
【審査官】三橋 竜太郎
(56)【参考文献】
【文献】特開2020-021371(JP,A)
【文献】特開2012-130408(JP,A)
【文献】特開2018-036900(JP,A)
【文献】米国特許出願公開第2019/0108912(US,A1)
【文献】特開2016-032480(JP,A)
【文献】岡村 浩史,外24名,“機械学習とR/shiny を用いた患者個別の予測生存曲線描出アプリケーション開発”,第39回医療情報学連合大会(第20回日本医療情報学会学術大会)論文集 [CD-ROM],2019年11月28日,pp.160-163
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
少なくとも一つの種類の臨床情報を含む因子情報と、予後の情報との既知の情報の組を受け入れる手段と、
前記受け入れた既知の因子情報を入力とし、対応する既知の予後の情報を出力するよう、少なくとも一つの機械学習アルゴリズムにより、少なくとも一つの機械学習モデルを機械学習する機械学習手段と、
を含み、
前記機械学習手段による機械学習処理と、当該機械学習処理の結果を用いて、予後の予測の対象となった患者に関する予後予測の処理とを行う予後予測装置。
【請求項2】
少なくとも一つの種類の臨床情報を含む因子情報と、予後の情報との既知の情報の組を受け入れる手段と、
前記受け入れた既知の因子情報を入力とし、対応する既知の予後の情報を出力するよう、少なくとも一つの機械学習アルゴリズムにより、少なくとも一つの機械学習モデルを機械学習する機械学習手段と、
を含み、
前記機械学習手段は、前記入力情報として、治療の開始から所定の時間が経過した後の治療効果に関わる初期反応性情報を、因子情報としてさらに受け入れて、予後の情報を出力するよう機械学習処理を行い、
当該機械学習処理の結果が、予後の予測の対象となった患者に関する予後予測の処理に供される予後予測装置。
【請求項3】
請求項に記載の予後予測装置であって、
さらに、
臨床情報と、検査結果の情報と、既往症の情報と、使用薬剤の情報と、疾病の起因となる菌ないしウイルスを特定する情報とを含む因子情報を用いて、予後の情報を出力するモデルに基づき、予後の情報に対する因子情報のうち、主要因子となる少なくとも一種類の因子情報を選択する予備処理手段を備え、
前記機械学習手段は、前記予備処理手段が選択した種類の因子情報と予後の情報との既知の情報の組を用い、前記予備処理手段が選択した種類の既知の因子情報と、前記初期反応性情報とを入力情報として、対応する既知の予後の情報を出力するよう、少なくとも一つの機械学習アルゴリズムにより、少なくとも一つの機械学習モデルを機械学習する機械学習処理を行う予後予測装置。
【請求項4】
請求項に記載の予後予測装置であって、
前記予備処理手段は、前記モデルとして、Cox比例ハザードモデルを用いる予後予測装置。
【請求項5】
請求項に記載の予後予測装置であって、
予後の予測の対象となった患者についての、治療の開始から所定の時間が経過した後の治療効果に関わる初期反応性情報を取得する手段をさらに含み、
当該初期反応性情報が取得されるごとに、当該取得した初期反応性情報を含む入力情報と、前記機械学習手段による機械学習処理の結果とを用いて、前記予後の予測の対象となった患者に関する予後予測を更新する予後予測装置。
【請求項6】
請求項1から5のいずれか一項に記載の予後予測装置であって、
前記予後の情報は、疾病の経過に関する予後の情報と、疾病の結末に関する予後の情報とを含み、
前記機械学習手段は、前記受け入れた既知の因子情報を入力とし、対応する既知の、前記疾病の経過に関する予後の情報と疾病の結末に関する予後の情報とを出力するよう、少なくとも一つの機械学習アルゴリズムにより、少なくとも一つの機械学習モデルを機械学習し、
前記機械学習手段による機械学習処理の結果が、予後の予測の対象となった患者に関する、疾病の経過に関する予後と疾病の結末に関する予後との予測の処理に供される予後予測装置。
【請求項7】
コンピュータを、
臨床情報と、検査結果の情報と、既往症の情報と、使用薬剤の情報と、疾病の起因となる菌ないしウイルスを特定する情報とを含む因子情報を用いて、予後の情報を出力するモデルに基づき、予後の情報に対する因子情報のうち、主要因子となる少なくとも一種類の因子情報を選択する予備処理手段と、
前記予備処理手段が選択した種類の因子情報と予後の情報との既知の情報の組を用い、前記予備処理手段が選択した種類の既知の因子情報を入力情報として、対応する既知の予後の情報を出力するよう、少なくとも一つの機械学習アルゴリズムにより、少なくとも一つの機械学習モデルを機械学習する機械学習処理を行う機械学習手段と、
前記機械学習手段による機械学習処理の結果に基づいて、予後の予測の対象となった患者に関する、前記予備処理手段が選択した種類の既知の因子情報を入力情報とした、予後予測の処理を実行する手段と、
として機能させ、
前記機械学習手段として機能させる際には、前記入力情報として、治療の開始から所定の時間が経過した後の治療効果に関わる初期反応性情報を、因子情報としてさらに受け入れて、予後の情報を出力するよう機械学習処理を行わせるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、疾病の予後を予測する予後予測装置、及びプログラムに関する。
【背景技術】
【0002】
近年では高齢者が増加しており、一方で、病床数の確保や、運営の効率化などのため、高齢者の疾病について、その予後を予測することが求められている。例えば、癌の進行を予測する装置の例が特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特表2009-537108号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、癌など遺伝的な疾病であれば、特許文献1に開示のように、遺伝情報等から予後を予測することが可能であることが知られているが、例えば高齢者の主たる死因のひとつである肺炎では、その因子が必ずしも明確でなく、予後予測が困難であった。
【0005】
本発明は上記実情に鑑みて為されたもので、因子が明確でない肺炎等の疾病について、その予後を予測できる予後予測装置、及びプログラムを提供することを、その目的の一つとする。
【課題を解決するための手段】
【0006】
上記従来例の問題点を解決する本発明の一態様は、予後予測装置であって、少なくとも一つの種類の臨床情報を含む因子情報と、予後の情報との既知の情報の組を受け入れる手段と、前記受け入れた既知の因子情報を入力とし、対応する既知の予後の情報を出力するよう、少なくとも一つの機械学習アルゴリズムにより、少なくとも一つの機械学習モデルを機械学習する機械学習手段と、を含み、前記機械学習手段による機械学習処理の結果が、予後の予測の対象となった患者に関する、予後予測の処理に供されることとしたものである。
【発明の効果】
【0007】
本発明によると、因子が明確でない肺炎等の疾病について、その予後を予測可能となる。
【図面の簡単な説明】
【0008】
図1】本発明の実施の形態に係る予後予測装置の構成例を表すブロック図である。
図2】本発明の実施の形態に係る予後予測装置の例を表す機能ブロック図である。
図3】本発明の実施の形態に係る予後予測装置の機械学習処理の例を表すフローチャート図である。
図4】本発明の実施の形態に係る予後予測装置による推定処理の例を表すフローチャート図である。
図5】本発明の実施の形態に係る予後予測装置による推定処理の一例を表す説明図である。
【発明を実施するための形態】
【0009】
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る予後予測装置1の一例は、図1に例示するように、制御部11、記憶部12、操作部13、表示部14及び通信部15を備える一般的なコンピュータ装置である。
【0010】
ここで制御部11は、CPU等のプログラム制御デバイスであり、記憶部12に格納されたプログラムに従って動作する。本実施の形態では、この制御部11は、既知の因子情報と、対応する予後の情報と(既知の情報の組)を受け入れて、当該因子情報に基づいて予後の情報を出力するモデルを用いて、予後の情報に対する因子情報のうち、主要因子となる少なくとも一種類の情報を選択する。ここで因子情報は、例えば少なくとも一種類の臨床情報を含み、一例では臨床情報のほか、検査結果の情報、既往症の情報、使用薬剤の情報、疾病の起因となる菌ないしウイルスを特定する情報(起因菌や耐性菌の有無など)、及び初期反応性の情報の少なくとも一つの種類の情報を含む。
【0011】
臨床情報には、対象者の年齢、性別、身長、体重、BMI、入院回数、居住地(介護施設か否かなどといった情報でよい)、人種などのほか、入院時(あるいは治療開始時)のバイタル情報としてPS(performance status)や、体温、血圧、酸素化(例えば酸素濃度(P/F))、呼吸回数、心拍数などの情報を含む。
【0012】
また検査結果の情報には、例えば血液検査の情報として白血球数(WBC)、ヘモグロビン(HB)、血小板数(PLt)、栄養状態に関わる量(例えばアルブミン(Alb)の値など)、腎機能に関わる量(例えば尿酸(BUN)やクレアチニン(Cre)の値、推算糸球体濾過量(eGFR))、肝機能に関わる量(GOT,GPT)、炎症や感染症の有無に関わる量(例えばC反応性蛋白(CRP)の値など)、総ビリルビン(T-bil)、ウイルスPCR検査(コロナウイルスなど)が含まれる。
【0013】
さらに既往症の情報とは、高血圧や糖尿病、循環器疾患、慢性心不全、脳梗塞、呼吸器疾患、敗血症、癌(悪性腫瘍)などの有無の情報であり、使用薬剤の情報は、使用している抗生剤の種類やグループ、投与量などを特定する情報でよい。
【0014】
また、初期反応性の情報は、治療の開始から所定の時間が経過した後の治療効果に関わる情報であり、例えば治療の開始から5日ないし7日の間の熱型(体温の変化)やC反応性蛋白(CRP)の値を表す情報等が相当する。
【0015】
制御部11は、上記選択した種類の因子情報と予後の情報との既知の情報の組を訓練データとして用い、当該選択した種類の因子情報を入力情報として、予後の情報を出力するよう機械学習処理を行う。ここで制御部11が行う機械学習は、例えば因子情報に基づく決定木(decision tree)解析や、ランダムフォレスト(L. Breiman: "Random Forests", Machine Learning, 45, 1, pp.5-32(2001))解析などであるとする。
【0016】
すなわち制御部11は、所定のモデルにより、主要な因子として選択された種類の因子情報を用いた決定木(回帰木または分類木)、あるいはランダムフォレストを生成する。決定木を生成するための機械学習処理の方法は、C4.5等広く知られた方法を採用してよい。
【0017】
そして制御部11は、この機械学習処理の結果として得られた決定木あるいはランダムフォレストを用い、予後の予測の対象となった患者に関する因子情報を入力情報とした、予後予測の処理を行う。ここで入力情報とする因子情報は、先のモデルで選択した種類の因子情報である。この制御部11の詳細な動作については、後に述べる。
【0018】
記憶部12は、メモリデバイスや、ディスクデバイス等であり、制御部11によって実行されるプログラムを保持する。またこの記憶部12は制御部11のワークメモリとしても動作する。
【0019】
操作部13は、マウスやキーボード等であり、ユーザの操作を受け入れて、当該操作の内容を表す情報を、制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従って情報を表示出力する。
【0020】
通信部15は、ネットワークインタフェース等であり、制御部11から入力される指示に従って、ネットワークを介して既存の病院や診療所の情報端末のパソコン、タブレット、スマートフォン、あるいはクラウドシステムなどとの間で種々のデータを送受する。
【0021】
次に本実施の形態の制御部11の動作について説明する。本実施の形態では、制御部11は、機械学習処理と、当該機械学習処理の結果を用いた予測処理とを実行する。この制御部11は、機能的には、図2に例示するように、情報収集部21と、予備処理部22と、機械学習部23と、予測出力部24とを含んで構成される。
【0022】
情報収集部21は、機械学習処理の段階では、既知の因子情報と、対応する予後の情報と(既知の情報の組)を受け入れる。具体的にこの情報は、予後が既知である過去の患者に関する複数の情報の組であり、因子情報は、既に述べたように臨床情報、検査結果の情報、既往症の情報、使用薬剤の情報、疾病の起因となる菌ないしウイルスを特定する情報、及び初期反応性の情報の少なくとも一つの種類の情報が含まれる。
【0023】
また情報収集部21が取得する予後の情報としては、入院期間(入院から退院までの日数)や、重症化の可能性の有無など、疾病の経過に関する予後の情報、あるいは、生存期間(入院から死亡までの日数)の情報や、結果的に生存または死亡のいずれとなる可能性が高いかを表す疾病の結末に関する予後の情報など、複数の種類の予後の情報が含まれ得る。
【0024】
またこの情報収集部21は、予測処理の段階では、予後の予測の対象となった患者についての因子情報を受け入れる。後に説明するように、予測処理において必要となる因子情報の種類については、機械学習処理の過程で選択され、予備処理部22により当該因子情報の種類を表す情報が出力されることとなるので、情報収集部21は、予後の予測の対象となった患者についての因子情報のうち、当該機械学習処理の際に選択された種類の因子情報を収集することとすればよい。
【0025】
予備処理部22は、機械学習処理の段階で動作し、情報収集部21が取得した因子情報に基づいて予後の情報を出力するモデルを用いて、予後の情報に対する因子情報のうち、主要因子となる少なくとも一種類の情報を選択する。
【0026】
具体的に本実施の形態の一例では、この予備処理部22は、当該モデルとしてCox比例ハザードモデルを用いる。すなわち、因子情報の値の線形結合の指数関数である相対危険度関数を生成し、部分尤度法等により各因子情報のp値(有意性)及びハザード比βを求める。この演算は、一般的なCox比例ハザードモデルに係る推定法として広く知られているので、ここでの詳しい説明は省略する。
【0027】
予備処理部22は、ここで求めたp値が所定のしきい値(例えば0.05)を下回る(有意である)因子情報を特定して選択する。そして予備処理部22は、当該特定した因子情報の種類を表す情報(例えばバイタル情報であるPSであることを特定する情報等、主要な因子として選択された因子情報の種類を特定する情報)を出力する。
【0028】
また予備処理部22は、上記特定した因子情報以外であっても、ユーザが臨床的に重要と考える因子情報の種類を表す情報を、上記特定した因子情報の種類を表す情報とともに出力してもよい。
【0029】
機械学習部23は、機械学習処理の段階で動作し、情報収集部21が取得した因子情報のうち、予備処理部22が出力する情報で特定される因子情報を入力情報とし、それに対応する予後の情報を目的変数として出力するよう、予め定められた決定木あるいはランダムフォレストを機械学習して得る。
【0030】
ここで決定木やランダムフォレストの生成の際に用いる機械学習処理の方法は、既に述べたようにC4.5等広く知られた方法を採用してよい。この際、機械学習の結果となる決定木やランダムフォレスト等のハイパーパラメータの設定は、経験的に行うこととしてもよい。また、ハイパーパラメータの設定のために、ハイパーパラメータのセットを複数セット用いて複数の機械学習処理を並列的に行い、このうち学習曲線(訓練データの数の増加に対する機械学習結果の汎化性能の変化)が最も好適であるハイパーパラメータのセットを選択するなど、人為的操作なく試行錯誤的にハイパーパラメータを最適化する方法(例えばoptuna(https://optuna.org))などを採用してもよい。
【0031】
例えば機械学習部23が決定木を機械学習結果として得ようとする場合、決定木のハイパーパラメータである深さの最大値(max depth)や、リーフノードの最大値(max leaf nodes)、判断基準(ジニやエントロピーなどの別)などを経験的に、あるいは試行錯誤的に決定しておく。
【0032】
この機械学習部23の処理により、予備処理部22により主要な因子として決定された種類の因子情報と予後との関係が機械学習され、因子情報に基づく予後の情報の推定が可能となる。
【0033】
予測出力部24は、予測処理の段階で動作し、情報収集部21が得た、予後の予測の対象となった患者を特定する情報(識別子であってもよいし、氏名等であってもよい)と、当該患者についての因子情報とを受け入れる。この予測出力部24は、機械学習部23が得た機械学習結果(決定木あるいはランダムフォレスト)と、受け入れた因子情報のうち、機械学習部23が利用した因子情報とを用いて、予後の情報を予測して出力する。例えば予後の情報が、入院期間(入院から退院までの日数)と生存期間(入院から死亡までの日数)との情報であれば、予測出力部24は、予後の予測の対象となった患者についての因子情報に基づいて、機械学習部23が生成した決定木等を用いて、これらの情報(入院期間が推定される場合は生存期間の情報は存在せず、生存期間が推定される場合は、入院期間は生存期間に等しい値となる)を推定して、当該予後予測の結果を、患者を特定する情報とともに出力する。
【0034】
ここで予測出力部24の出力は、既に述べた表示部14に対して行われてもよいし、通信部15を介して、別のシステムに送信され、当該別のシステムにおいて表示出力されてもよい。この別のシステムには、例えば他のパーソナルコンピュータやタブレット、スマートフォンなどのコンピュータデバイスを含む。また別のシステムとして、電子カルテシステムやナースコールのシステム、あるいは医療従事者が所持する種々の端末装置であってもよい。
【0035】
予測出力部24から、予後の予測の情報を受けたこれらのシステムはそれぞれの表示手段により、情報を表示することとなる。
【0036】
[経過情報の参照]
なお、本実施の形態の上記の例において、機械学習及び機械学習結果を用いた推定の処理に用いる、ユーザが臨床的に重要と考える因子情報には、治療の開始から所定の時間が経過した後の治療効果に関わる因子情報(初期反応性の情報)が含まれてもよい。
【0037】
この例では、機械学習部23は、入力情報として、治療の開始から所定の時間が経過した後の治療効果に関わる因子情報を受け入れ、当該因子情報を、他の(予備処理部22により選択された種類の因子情報とともに)用いて予後の情報を出力するよう機械学習処理を行うこととなる。
【0038】
そして予測出力部24は、当該機械学習処理の結果を、予後の予測の対象となった患者に関する予後予測の処理に供する。
【0039】
具体的に治療の開始から所定の時間が経過した後の治療効果に関わる因子情報は既に述べたように、治療の開始から5日ないし7日の間の熱型(体温の変化)やC反応性蛋白(CRP)の値を表す情報等である。本実施の形態の予後予測装置1は、予後の予測の対象となった患者に関して、このような治療に対する反応性の情報が取得される度に、予測出力部24が、当該取得した因子情報を含む入力情報と、機械学習部23により生成された機械学習処理の結果である決定木等とを用いて、予後の予測の対象となった患者に関する予後予測を更新し、当該更新した予後の予測の結果を表す情報を出力する。ここでの出力においても、既に述べたように、表示部14に対して行われてもよいし、通信部15を介して、別のシステムに送信され、当該別のシステムにおいて表示出力されてもよい。
【0040】
[地域差]
感染症には、地域差があることが知られている。例えば、細菌においても、地域によって緑膿菌が主な肺炎の起因菌である地域もあれば、肺炎球菌が多い地域もある。起因菌の感受性においても、抗生剤の使用頻度により、感受性が地域によって異なる。さらに、2020年現在、感染が拡大している、いわゆる新型コロナウィルス(SARS-CoV-2)では、複数の互いに異なる変異を起こしたウィルスが、それぞれ異なる地域で感染を広げていることが指摘されている。
【0041】
そこで本実施の形態の予後予測装置1は、感染症等、地域性のある疾病の予後を予測する場合には、地域差を考慮して、情報収集部21が患者の所在する地域ごとに、訓練データとなる因子情報及び予後情報の組(既知の情報の組)を取得する。そして予後予測装置1は、地域ごとに取得された既知の情報の組に基づき、主要な因子情報の選択と、機械学習処理とを行い、地域ごとの機械学習結果である決定木等を生成する。
【0042】
この例では、予後予測装置1は、予後の予測の対象となった患者の所在地域に対応して得られた決定木あるいはランダムフォレストと、当該予後の予測の対象となった患者についての因子情報とを用いて、予後の情報を予測して出力する。なお、地域の範囲は都道府県等の行政区単位でよく、経験的に定めればよい。
【0043】
[動作]
本実施の形態は以上の構成を備えており、次のように動作する。本実施の形態の予後予測装置1を利用するため、予め予測の対象となる患者の所在する地域(例えば県)を含む、少なくとも一つの地域にある病院に入院していた過去の患者にかかる因子情報と、対応する予後の情報との、既知の情報の組を予め用意しておく。
【0044】
なお、以下の例では、予後予測装置1は、高齢者の肺炎に関する予後を予測する例を示す。この例では、因子情報は、臨床情報、検査結果の情報、既往症の情報、使用薬剤の情報、疾病の起因菌・起因ウイルスや耐性菌の有無、及び初期反応性の情報を含む。また予後の情報としては、入院期間(入院から退院までの日数)あるいは生存期間(入院から死亡までの日数)の情報であるとする。
【0045】
予後予測装置1は、まず機械学習処理を実行する。この段階では、図3に例示するように、予後予測装置1は、上記予め用意されている既知の情報の組を、対応する地域ごと(以下処理対象地域と呼ぶ)に取得する(S1)。そして予後予測装置1は、当該取得した既知の情報の組に係る因子情報に基づいて、対応する予後の情報を出力するCox比例ハザードモデルを用い、部分尤度法等により各因子情報のp値(有意性)及びハザード比βを求める。予後予測装置1は、ここで求めたp値が所定のしきい値(例えば0.05)を下回る(有意である)因子情報を、主要な因子として特定して選択する(主要因子を選択:S2)。
【0046】
また予後予測装置1は、予めユーザが臨床的に重要と考えて指定した因子情報の種類を表す情報(例えばここでは初期反応性の情報とする)と、ステップS2で選択した因子情報の種類を表す情報と(のいずれかに含まれる因子情報の種類の情報)を得る(主要因子を決定:S3)。この因子情報の種類を表す情報は、処理対象地域を特定する情報に関連付けて記憶しておく。
【0047】
予後予測装置1は、ステップS1で取得した既知の情報の組を訓練データとして、その因子情報のうち、ステップS3で得た情報で特定される種類の因子情報を入力情報とし、それに対応する予後の情報を目的変数として出力するよう、ランダムフォレストを機械学習して得る(S4)。
【0048】
予後予測装置1は、この処理S1からS4を、用意した既知の情報の組に係る地域ごとに繰り返して、各地域に対応するランダムフォレストを、機械学習の結果として得て、処理対象地域を特定する情報に関連付けて記憶しておく。
【0049】
これにより予後予測装置1は、地域を特定する情報と、主要な因子とされた因子情報の種類を表す情報と、機械学習の結果を表す情報(ランダムフォレストを特定する情報)とを関連付けて保持した状態となる。
【0050】
次に予後予測装置1を用いた予測の処理について説明する。この予測の処理を行う段階では、予後予測装置1は、図4に例示するように、予後の予測の対象としてユーザにより指定された患者についての因子情報を受け入れる(S11)。ここで受け入れる因子情報は、当該予後の予測の対象となった患者の在住する地域を特定する情報に関連付けて記憶している、主要な因子とされた種類の因子情報のみでよい。また、初期反応性の情報については、当初は存在しなくてもよい。ある種類の因子情報が存在しない場合、予後予測装置1は当該因子情報については欠損値として以下の処理を実行する。
【0051】
予後予測装置1は、予後の予測の対象となった患者の在住する地域を特定する情報に関連付けて記憶している、機械学習済みのランダムフォレストと、ステップS11で受け入れた因子情報とを用いて、予後の情報の予測結果を得る(S12)。
【0052】
ここでは予後の情報は、入院期間(入院から退院までの日数)と生存期間(入院から死亡までの日数)との情報としているので、予後予測装置1は、入院期間または生存期間(入院期間が推定される場合は生存期間の情報は存在せず、生存期間が推定される場合は、入院期間は生存期間に等しい値となる)を推定して出力することとなる。
【0053】
なお、欠損値を含む情報からランダムフォレスト等を用いてその目的変数を推定する方法については、代表値で置き換える方法や、欠損値を推測して用いる方法など種々の広く知られた方法を採用できるため、ここでの説明は省略する。
【0054】
予後予測装置1は、予後の予測の対象となった患者が生存している限り、所定の日数(例えば5日または7日)ごとに、上記予測の処理を繰り返して実行し、予後の予測の対象となった患者に関する予後予測を更新する。
【0055】
[予備処理を行わない例]
また本実施の形態の予後予測装置1の別の例では、予備処理を行わずに、予め選択された因子情報に基づいて機械学習処理を行うこととしてもよい。この例では、制御部11によって実現される予備処理部22は、予め選択された少なくとも一つの種類の因子情報を特定する情報を、主要な因子情報の種類を特定する情報として出力し、機械学習部23は、情報収集部21が取得した因子情報のうち、当該予備処理部22が出力する情報で特定される種類の因子情報を入力情報とし、それに対応する予後の情報を目的変数として出力するよう、決定木あるいはランダムフォレストを機械学習して得る。
【0056】
また、機械学習部23が、因子情報をサブサンプリングする機械学習処理を行う場合や因子情報の重要性を判定可能な機械学習処理を行う場合もある。こうした場合、予備処理の段階で主要と考えられる因子情報を選択しておく必要は必ずしもない。
【0057】
これらの例では、予測処理の段階で動作する予測出力部24は次のように動作する。予測出力部24は、情報収集部21が得た、予後の予測の対象となった患者を特定する情報(識別子であってもよいし、氏名等であってもよい)と、当該患者についての因子情報とを受け入れる。そして予測出力部24は、機械学習部23が得た決定木あるいはランダムフォレストなどの機械学習結果と、受け入れた因子情報のうち、機械学習部23が機械学習で用いた(サブサンプリングが行われる場合、機械学習により、予測の処理で使用することとなった)因子情報とを用いて、予後の情報を予測して出力する。
【0058】
[機械学習の他の例]
なお、ここまでの説明において制御部11が、機械学習部23として動作して生成する機械学習の結果は、一般的な決定木やランダムフォレストであるとしたが、本実施の形態はこれに限られず、XGBoostやLight GBM(Gradient Boosting)などを用いてもよいし、その他のディープラーニングモデルを用いても構わない。これらの場合も、それぞれのハイパーパラメータは、経験的に、あるいはoptunaなどを用いて試行錯誤的に決定しておくこととすればよい。
【0059】
[機械学習のモデル、アルゴリズムを選択する例]
またここまでの説明において機械処理部23は、予め定められた決定木あるいはランダムフォレストを機械学習するものとしていたが、本実施の形態の別の例では、複数の機械学習モデルや機械学習処理から、効果的なモデルやアルゴリズムを選択して用いることとしてもよい。
【0060】
一例としてこの機械学習部23は、機械学習処理の段階で動作して、情報収集部21が取得した因子情報のうち、予備処理部22が出力する情報で特定される因子情報、あるいは予め定めた種類の因子情報を入力情報とし、それに対応する予後の情報を目的変数として出力するよう、予め選択された複数の機械学習モデルを、対応する機械学習処理により機械学習する。
【0061】
ここで予め選択された機械学習処理としては、例えば、キャットブースト(Liudmila Prokhorenkova, et al., CatBoost: unbiased boosting with categorical features, arXiv:1706.09516v5)やLight GBM(Gradient Boosting Machine:Guolin Ke, et al., Light GBM: A Highly Efficient Gradient Boosting Decision Tree)、GBM、Extreme Gradient Boosting(XGBoost)、ExtraTrees(Pierre Geurts, et al., Extremely randomized trees, Mach. Learn 63, 3-42(2006))、ランダムフォレスト、Ada Boost Classifier、ロジスティック回帰、線形判別分析(LDA)、ナイーブベイズ、K近傍法、リッジ分類器、サポートベクターマシンなど、種々の決定木や分類器等を含んでよい。なお、モデルのハイパーパラメータの設定などは、経験的に行うこととしてもよいし、既に述べたようにoptunaなどを採用してもよい。
【0062】
機械学習部23は、上述のように、これら選択された複数の機械学習モデルを、対応する機械学習処理により機械学習し、その機械学習の結果を、既知の因子情報と予後の情報との組を利用して評価する。このような評価の方法については広く知られた方法を採用できるので、ここでの詳しい説明を省略するが、この評価は例えば、予後の情報に関するAUC(Area under curve)値や、正答率(Accuracy)によって行えばよい。
【0063】
機械学習部23は、AUC値や正答率の高い順に、選択された複数の機械学習モデルを配列し、その先頭(最もAUC値や正答率の高かったもの)を、学習済みモデルとして選択する。
【0064】
一例として、AUC値や正答率の高い順に配列した結果、上記の、複数の機械学習処理を列挙した順となった場合、機械学習部23は、最もAUC値や正答率が高かったと評価されたキャットブーストによる機械学習結果を、学習済みモデルとして選択する。
【0065】
この例では、予測処理の段階において、予測出力部24は、機械学習部23により学習済みモデルとして選択された機械学習結果を用いて次の処理を行う。すなわちこの例の予測出力部24は、情報収集部21が得た、予後の予測の対象となった患者を特定する情報と、当該患者についての因子情報とを受け入れ、機械学習部23が学習済みモデルとして選択した機械学習結果、例えば上述の例であれば、キャットブーストによる機械学習の結果に、受け入れた因子情報を入力し、予測される予後の情報を得る。そして予測出力部24は、当該予後予測の結果を、入力した因子情報とともに受け入れた、患者を特定する情報とともに出力する。
【0066】
本実施の形態のこの例では、因子情報に基づいて比較的AUCや正答率の高い機械学習結果を用いて予測を行うことが可能となる。
【0067】
[複数の予後予測情報]
また既に述べたように、本実施の形態のある例では、予測の対象とする予後の情報には、疾病の経過に関する予後の情報や、疾病の結末に関する予後の情報など、複数の種類の予後の情報が含まれてもよい。ここで疾病の経過に関する予後の情報は、重症化の可能性の有無などであり、例えば人工呼吸器が必要な状態となるか否か、あるいは集中治療室への入院の可能性の有無などである。また、疾病の結末に関する予後の情報は、死亡する可能性が高いか否かを表す情報などである。
【0068】
この例では、機械学習部23は、予測の対象とする予後の情報の種類ごとに、機械学習結果を得てもよい。すなわち機械学習部23は、複数の種類の因子情報を入力とし、疾病の経過に関する予後の情報(例えば所定の日数が経過した後の軽症、中等症、重症の別)を教師情報として、第1の決定木をキャットブーストにより機械学習するとともに、複数の種類の因子情報を入力とし、疾病の結末に関する予後の情報(例えば所定の日数が経過した後の生存、死亡の別)を教師情報として、第2の決定木をキャットブーストにより機械学習することとしてもよい。
【0069】
なお、第2の決定木の機械学習に用いる因子情報の種類の組は、第1の決定木の機械学習に用いたものと異なる種類の組であってよい。つまり、予備処理部22は、予測する予後の情報の種類ごとに、主要な因子情報(の組)を選択して、当該選択した因子情報の種類を特定する情報を出力する。
【0070】
この機械学習結果である第1の決定木は、機械学習の際に用いたものと同じ種類の因子情報を入力したときに、対応する重症化の確率(スコア)を出力するものとなる。また第2の決定木は、機械学習の際に用いたものと同じ種類の因子情報を入力したときに、対応する死亡率(スコア)を出力するものとなる。
【0071】
つまりこの例では、予測出力部24は、情報収集部21が得た、予後の予測の対象となった患者を特定する情報と、当該患者についての因子情報とを受け入れると、機械学習部23により機械学習された機械学習結果である第1の決定木に、当該受け入れた因子情報のうち、機械学習部23が第1の決定木の機械学習に用いた因子情報を入力し、予後の予測の対象となった患者の重症化の確率を予測して出力する。
【0072】
また予測出力部24は、機械学習部23により機械学習された機械学習結果である第2の決定木に、受け入れた因子情報のうち、機械学習部23が第2の決定木の機械学習に用いた因子情報を入力し、予後の予測の対象となった患者が死亡する確率を予測して出力する。
【0073】
予測出力部24はさらに、重症化の確率と、死亡する確率とを互いに交差する軸方向にとって、既知の因子情報と予後の情報との組に基づく、予測出力部24の出力(重症化の確率と死亡する確率)を点群としてプロットし、そのうち実際に重症化した患者に係る点群を囲む閉曲線と、重症化しなかった患者に関する点群を囲む閉曲線を得てもよい。また、死亡した患者に関する点群を囲む閉曲線を生成してもよい。これらの閉曲線は、人為的に生成してもよいし、対応する点群を取り囲む凸包を生成することで得てもよい。
【0074】
予測出力部24は、予後の予測の対象となった患者についての推定結果に対応する点を同じ座標軸上にプロットし、当該推定結果が、上記閉曲線のいずれかに属する場合、当該閉曲線に係る情報を出力する。
【0075】
例えば予後の予測の対象となった患者についての推定結果に対応する点が、重症化しなかった患者に関する点群を囲む閉曲線内に属する座標にプロットされたときには、予測出力部24は、当該予後の予測の対象となった患者は「重症化しない」との予測を出力する。
【0076】
本実施の形態のこの例によると、重症化しないグループを判別でき、入院の要否などを簡易に判定可能となる。また同様に、重症化する、あるいは死亡する確率が高い患者を判別でき、予後の予測の対象となった患者が入院の必要な患者であるか否かを簡易に判別可能となる。
【0077】
また本実施の形態のある例では、予測出力部25は、図5に例示するように、予測する予後の情報の種類(例えば重症化の可能性と、死亡率とのいずれか)を選択すると、予備処理部22または機械学習部23の処理により、当該選択された種類の予後の情報を予測するために主要な因子として特定された因子情報の種類を表す情報を提示する(A)とともに、少なくとも当該特定された種類の因子情報(機械学習の際に利用した因子情報)の入力を行うための欄(B)を表示する。
【0078】
このとき、主要な因子として特定された種類の因子情報の入力欄のみを表示することとしてもよいし、主要な因子として特定された種類の因子情報だけでなく、他の因子情報の入力欄(例えば予測の対象となり得る予後の情報の種類のそれぞれに対応して特定された主要な因子情報の組の論理和に含まれる種類の因子情報の入力欄)も表示し、予測の対象となる予後の情報に対応して特定された主要な因子情報の入力欄と、そうでない入力欄とを識別可能に表示してもよい。
【0079】
なお、ここで主要な因子情報は、予備処理や機械学習の処理により主要と判断された因子情報であってもよいし、機械学習の過程でサブサンプリングが行われる場合、機械学習により、予測の処理で使用することとなった因子情報であってもよい。
【0080】
さらに予後予測装置1は、当該欄(B)において、予測の対象となった予後の情報に対応して、主要な因子として特定された種類の因子情報のいずれかに対応する入力欄に情報が入力されていないときには、その旨を表示して、予後の予測の処理を行わないようにしてもよい。
【0081】
予後予測装置1は、上記表示した欄(B)において、予測の対象となった予後の情報に対応して、主要な因子として特定された種類の因子情報が入力されると、予測出力部24としての処理を実行して、予測の対象となった予後の情報の予測結果を得て、当該予測した結果を出力する(C)。
【0082】
[薬剤の効能分析]
さらに本実施の形態の予後予測装置1では、上述のように、軽症、中等症、重症のそれぞれに属する確率が判定できるため、患者を、軽症、中等症、重症に分類し、それぞれの分類に属する複数の患者のグループに対し、互いに異なる薬剤を用いて治療を行い、経過を確認することで薬剤の効果を分析できる。
【0083】
例えば重症化するとの予測がなされた患者を2つのグループに分け、一方のグループには薬剤Aを投与し、他方のグループには薬剤Aを投与しないとき、一方のグループの実際の重症化率が、他方のグループの実際の重症化率より有意に低いと判断されれば、薬剤Aが当該患者が罹患している疾患に効果があることが確認できる。
【0084】
[電子カルテからの情報抽出]
本実施の形態の予後予測装置1は、またいわゆる電子カルテシステムと連携して、あるいは電子カルテシステムの機能の一部として実装されてもよい。この例では、予後予測装置1は、機械学習処理の訓練データ、あるいは、推定処理における、予後の予測の対象となった患者についての因子情報を、電子カルテシステムから抽出してそれぞれの処理に供することとする。
【0085】
またこの例では、既に述べたように、予後予測装置1の出力する予後の予測の結果の情報を、電子カルテシステム上で表示出力することとしてもよい。
【0086】
[サーバとして実装する例]
また本実施の形態の予後予測装置1は、サーバとして実装されてもよい。この場合、電子カルテシステム等、外部のコンピュータシステムからのアクセスを受けて、機械学習の訓練データや、予後の予測の対象となった患者についての情報(患者を特定する情報や、所在地域を特定する情報、及び因子情報等)を、当該外部のコンピュータシステムから受け入れて、機械学習処理や、推定の処理を実行する。
【0087】
そして推定の処理を行った場合は、この例の予後予測装置1は、外部のコンピュータシステムから指定された出力先に、当該予後の予測の結果の情報を出力する。この出力先は例えば、電子カルテシステムや、ナースコールシステム、医療従事者向けの端末等とすることができる。
【0088】
[実施形態の効果]
本実施の形態によると、臨床試験が行われていない高齢者の肺炎など、疾病の予後に影響する因子が不明な状況であっても、いわゆるリアルワールドデータを用いた治療指針を決定でき、またその予後を予測可能となる。
【符号の説明】
【0089】
1 予後予測装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 通信部、21 情報収集部、22 予備処理部、23 機械学習部、24 予測出力部。

図1
図2
図3
図4
図5