(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023057718
(43)【公開日】2023-04-24
(54)【発明の名称】病気の重症化予測システム
(51)【国際特許分類】
G16H 50/50 20180101AFI20230417BHJP
G16Y 10/60 20200101ALI20230417BHJP
【FI】
G16H50/50
G16Y10/60
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021167363
(22)【出願日】2021-10-12
(71)【出願人】
【識別番号】304020177
【氏名又は名称】国立大学法人山口大学
(74)【代理人】
【識別番号】100141173
【弁理士】
【氏名又は名称】西村 啓一
(72)【発明者】
【氏名】浅井 義之
(72)【発明者】
【氏名】濱田 和希
(72)【発明者】
【氏名】松永 和人
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
【課題】機械学習により病気の重症化の有無の予測を支援する。
【解決手段】本発明に係る重症化予測用学習モデル生成方法は、患者が罹患している病気の重症化の有無を予測するための重症化予測用学習モデルを生成する。同方法は、病気の罹患歴を有する複数の解析対象患者から得られる複数の項目ごとの解析対象患者情報を取得する情報取得ステップS102と、解析対象患者情報を説明変数とし重症化の有無を目的変数として1次学習モデルを構築する第1学習ステップS103と、1次学習モデルにおいて、寄与度を取得する寄与度取得ステップS104と、寄与度に基づいて複数の項目の中から、複数の特定項目を選択する選択ステップS106と、複数の特定項目に対応する解析対象患者情報を説明変数とし重症化の有無を目的変数として重症化予測用学習モデルとなる2次学習モデルを構築する第2学習ステップS107と、を有してなる。
【選択図】
図6
【特許請求の範囲】
【請求項1】
患者が罹患している病気の重症化の有無を予測するために用いられる重症化予測用学習モデルを生成する病気の重症化予測用学習モデル生成方法であって、
前記病気の罹患歴を有する複数の解析対象患者から得られる複数の項目ごとの解析対象患者情報を取得する情報取得ステップと、
複数の前記項目に対応する前記解析対象患者情報を説明変数とし、前記重症化の有無を目的変数として、前記重症化の有無を予測するための1次学習モデルを構築する第1学習ステップと、
前記1次学習モデルにおいて、複数の前記項目ごとに前記重症化の有無の予測精度の向上への寄与度を取得する寄与度取得ステップと、
前記寄与度に基づいて、複数の前記項目の中から、複数の特定項目を選択する選択ステップと、
複数の前記特定項目に対応する前記解析対象患者情報を説明変数とし、前記重症化の有無を目的変数として、前記重症化予測用学習モデルとなる2次学習モデルを構築する第2学習ステップと、
を有してなる、
ことを特徴とする病気の重症化予測用学習モデル生成方法。
【請求項2】
取得された前記寄与度の大きさに基づいて、複数の前記項目それぞれに順位を付ける順位付ステップ、
を有してなり、
前記選択ステップにおいて、複数の前記特定項目は、前記順位に基づいて選択される、
請求項1記載の病気の重症化予測用学習モデル生成方法。
【請求項3】
複数の前記特定項目は、
前記順位が上位「n」(nは2以上の整数)位以内の複数の前記項目、
を含む、
請求項2記載の病気の重症化予測用学習モデル生成方法。
【請求項4】
前記項目は、前記解析対象患者の属性、前記解析対象患者の行動履歴、および前記解析対象患者が受けた検査項目、を含む、
請求項1乃至3のいずれかに記載の病気の重症化予測用学習モデル生成方法。
【請求項5】
前記病気は、気管支喘息であり、
前記項目は、増悪回数、BMI、年齢、呼気一酸化窒素、血中好酸球、白血球数、%予測1秒量、%予測努力性肺活量、副鼻腔炎の有無、および喫煙歴、を含み、
前記特定項目は、前記増悪回数および前記年齢、を含み、
前記重症化の有無は、1秒量の経年低下量が所定の閾値以上か否かで定義される、
請求項4記載の病気の重症化予測用学習モデル生成方法。
【請求項6】
患者が罹患している病気の重症化の有無を予測するために用いられる重症化予測用学習モデルを生成する病気の重症化予測用学習モデル生成装置であって、
前記病気の罹患歴を有する複数の解析対象患者から得られる複数の項目ごとの解析対象患者情報を取得する生成情報取得部と、
複数の前記項目に対応する前記解析対象患者情報を説明変数とし、前記重症化の有無を目的変数として、前記重症化の有無を予測するための1次学習モデルを構築する第1学習部と、
前記1次学習モデルにおいて、複数の前記項目ごとに前記重症化の有無の予測精度の向上への寄与度を取得する寄与度取得部と、
前記寄与度に基づいて、複数の前記項目の中から、複数の特定項目を選択する選択部と、
複数の前記特定項目に対応する前記解析対象患者情報を説明変数とし、前記重症化の有無を目的変数として、前記重症化予測用学習モデルとなる2次学習モデルを構築する第2学習部と、
を有してなる、
ことを特徴とする病気の重症化予測用学習モデル生成装置。
【請求項7】
コンピュータを請求項6記載の病気の重症化予測用学習モデル生成装置として機能させる、
ことを特徴とする病気の重症化予測用学習モデル生成プログラム。
【請求項8】
患者が罹患している病気の重症化の有無を予測する病気の重症化予測装置であって、
前記患者から得られる複数の項目ごとの患者情報を取得する予測情報取得部と、
前記患者情報に基づいて、学習済みの学習モデルを用いて、前記重症化の有無を予測する予測部と、
を有してなり、
前記学習モデルは、請求項1記載の重症化予測用学習モデル生成方法により生成される、
ことを特徴とする病気の重症化予測装置。
【請求項9】
コンピュータを請求項8記載の病気の重症化予測装置として機能させる、
ことを特徴とする病気の重症化予測プログラム。
【請求項10】
患者が罹患している病気の重症化の有無を予測する重症化予測装置により実行される病気の重症化予測方法であって、
前記重症化予測装置は、
前記重症化の有無の予測に用いられる学習済みの学習モデルを記憶する記憶部、
を備え、
前記重症化予測装置が、
前記患者から得られる複数の項目ごとの患者情報を取得する予測情報取得ステップと、
前記患者情報に基づいて、学習済みの学習モデルを用いて、前記重症化の有無を予測する予測ステップと、
を有してなり、
前記学習モデルは、請求項1記載の重症化予測用学習モデル生成方法により生成される、
ことを特徴とする病気の重症化予測方法。
【請求項11】
患者が罹患している病気の重症化の有無を予測する病気の重症化予測システムであって、
請求項6記載の重症化予測用学習モデル生成装置と、
請求項8記載の重症化予測装置と、
を有してなる、
ことを特徴とする病気の重症化予測システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、病気の重症化予測用学習モデル生成方法、生成プログラム、および生成方法と、病気の重症化予測装置、重症化予測プログラム、および重症化予測方法と、病気の重症化予測システムと、に関する。
【背景技術】
【0002】
一般的に、病気の重症度の判断は、自覚症状の程度、各種検査の測定値、増悪(例えば、発作)の回数などの臨床情報に基づいて、医師により行われる。病気の重症化は、自覚症状の悪化、増悪による救急受診、および入院、に伴う生活の質(QOL:Quality Of Life)の低下および医療費の増大に繋がるため、患者には、社会的にも経済的にも負担となる。
【0003】
病気の悪化・重症化と関連する因子として、患者から得られる様々な情報(性別、年齢などの属性、喫煙などの患者の行動履歴、病気に関連する検査データ、など)が報告されている。しかしながら、これらの因子を包括的に解析し、個々の患者ごとの病気の重症化の予測は、医師の診療科従事年数や経験症例数に基づく個人差に依存する。そのため、重症化の予測は、困難である。
【0004】
これまでにも、気管支喘息患者から得られる複数の情報に基づいて、治療薬の選択を支援するシステムが、提案されている(例えば、特許文献1参照)。
【0005】
特許文献1に開示されたシステムは、気管支喘息患者から得られる複数の情報(遺伝子発現データ、気道・血中好酸球数、免疫グロブリン、ペリオスチンなど)を測定・解析することにより、気管支喘息フェノタイプを分類し、吸入ステロイドの使用を含めた治療薬選択を支援する。しかしながら、同システムは、気管支喘息の重症化を予測するシステムではない。そのため、同システムは、予測に基づく早期治療介入を実践することによる重症化の防止には適用できない。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、機械学習により、病気の重症化の有無の予測を支援することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る病気の重症化予測用学習モデル生成方法は、患者が罹患している病気の重症化の有無を予測するために用いられる重症化予測用学習モデルを生成する重症化予測用学習モデル生成方法であって、病気の罹患歴を有する複数の解析対象患者から得られる複数の項目ごとの解析対象患者情報を取得する情報取得ステップと、複数の項目に対応する解析対象患者情報を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するための1次学習モデルを構築する第1学習ステップと、1次学習モデルにおいて、複数の項目ごとに重症化の有無の予測精度の向上への寄与度を取得する寄与度取得ステップと、寄与度に基づいて、複数の項目の中から、複数の特定項目を選択する選択ステップと、複数の特定項目に対応する解析対象患者情報を説明変数とし、重症化の有無を目的変数として、重症化予測用学習モデルとなる2次学習モデルを構築する第2学習ステップと、を有してなる、ことを特徴とする。
【発明の効果】
【0009】
本発明によれば、機械学習により病気の重症化の有無の予測を支援することができる。
【図面の簡単な説明】
【0010】
【
図1】本発明に係る病気の重症化予測システムの実施の形態を示すネットワーク構成図である。
【
図2】
図1のシステムが備える病気の重症化予測用学習モデル生成装置の機能ブロック図である。
【
図3】
図2の重症化予測用学習モデル生成装置が備える記憶部に記憶されている情報の例を示す模式図である。
【
図4】
図1のシステムが備える病気の重症化予測装置の機能ブロック図である。
【
図5】
図4の重症化予測装置が備える記憶部に記憶されている情報の例を示す模式図である。
【
図6】本発明に係る重症化予測用学習モデル生成方法の実施の形態を示す、病気の重症化予測用学習モデル生成処理のフローチャートである。
【
図7】本発明に係る病気の重症化予測方法の実施の形態を示す、病気の重症化予測処理のフローチャートである。
【
図8】
図4の病気の重症化予測装置が備える表示部に表示されている情報の例を示す模式図である。
【
図9】本発明の実施例において、説明変数と寄与度との関係を示すグラフである。
【
図10】(a)はランダムフォレストモデルを用いて生成された2次学習モデルのROC曲線図であり、(b)~(g)はロジスティック回帰モデルを用いて生成された2次学習モデルのROC曲線である。
【
図11】上位5位以内の項目の組合せに基づいて生成された2次学習モデル(ランダムフォレストモデル)の10分割交差検証法による検証結果を示す表である。
【
図12】上位5位以内の項目の組合せに基づいて生成された2次学習モデル(ロジスティック回帰モデル)の10分割交差検証法による検証結果を示す表である。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら、本発明に係る病気の重症化予測システム(以下「本システム」という。)と、病気の重症化予測用学習モデル生成装置(以下「本生成装置」という。)と、病気の重症化予測用学習モデル生成プログラム(以下「本生成プログラム」という。)と、病気の重症化予測用学習モデル生成方法(以下「本生成方法」という。)と、病気の重症化予測装置(以下「本予測装置」という。)と、病気の重症化予測プログラム(以下「本予測プログラム」という。)と、病気の重症化予測方法(以下「本予測方法」という。)と、の実施の形態について説明する。
【0012】
本発明は、患者が罹患している病気の重症化の有無を予測するための学習モデル(以下「重症化予測用学習モデル」という。)を生成し、生成された重症化予測用学習モデルを用いて患者が罹患している病気の重症化の有無を予測する。
【0013】
「患者」は、本発明により、重症化の有無が予測される対象者である。
【0014】
「病気」は、患者の心または体に現れる異常である。本発明において、病気は、特に、医師の経験年数や経験症例数により重症化の有無の予測に差異が生じやすい異常である。以下の説明において、病気は、例えば、世界的に最も有病率・罹患率の高い慢性呼吸器疾患の1つである気管支喘息である。
【0015】
●重症化予測システム●
●重症化予測システムの構成
図1は、本システムの実施の形態を示すネットワーク構成図である。
【0016】
本システム1は、患者が罹患している病気の重症化の有無を予測するために用いられる病気の重症化予測用学習モデルを生成し、同モデルを用いて病気の重症化の有無を予測する。本システム1は、本生成装置10と本予測装置20とを備える。
【0017】
本生成装置10は、患者が罹患している病気の重症化の有無を予測するために用いられる重症化予測用学習モデルを生成する。本生成装置10の具体的な構成と動作とは、後述する。
【0018】
本予測装置20は、患者が罹患している病気の重症化の有無を予測する。本予測装置20の具体的な構成と動作とは、後述する。
【0019】
外部装置30は、例えば、本生成装置10と本予測装置20との動作に必要な情報(例えば、後述する解析対象患者情報、患者情報、など)を記憶するサーバなどの情報記憶装置である。
【0020】
ネットワークNは、例えば、インターネット、移動体通信網、LAN(Local Area Network)、WAN(Wide Area Network)、Wi-Fi(登録商標)、Bluetooth(登録商標)のような通信網である。
【0021】
●重症化予測用学習モデル生成装置の構成
図2は、本生成装置10の機能ブロック図である。
【0022】
本生成装置10は、例えば、パーソナルコンピュータで実現される。本生成装置10では、本生成プログラムが動作して、本生成プログラムが本生成装置10のハードウェア資源と協働して、本生成方法を実現する。
【0023】
ここで、コンピュータ(不図示)に本生成プログラムを実行させることで、本生成プログラムは、同コンピュータを本生成装置10と同様に機能させて、同コンピュータに本生成方法を実行させることができる。
【0024】
本生成装置10は、通信部11と、記憶部12と、制御部13と、操作部14と、表示部15と、を備える。
【0025】
通信部11は、ネットワークNを介して、本予測装置20と外部装置30とに接続されている。通信部11は、例えば、通信モジュールや通信インターフェイスにより構成されている。
【0026】
記憶部12は、本生成装置10が後述する本生成方法を実行するために必要な情報(例えば、後述する解析対象患者情報データベースDB1など)を記憶する。記憶部12は、例えば、本生成装置10が備えるHDD(Hard Disk Drive)またはSSD(Solid State Drive)のような記録装置、および/または、フラッシュメモリのような記憶媒体、により構成されている。
【0027】
「解析対象患者情報データベース(以下単に「DB1」と表記する場合もある。)」は、例えば、複数の解析対象患者から得られる複数の項目ごとの情報(以下「解析対象者情報」という。)が、病気ごとに記憶されているデータベースである。すなわち、DB1には、病気ごとに複数の解析対象者情報が記憶されている。本実施の形態において、DB1は、例えば、本生成装置10の使用者により、病院や健診センターなどの医療機関が保有する情報に基づいて生成されている。DB1は、例えば、病気ごとに予め生成され、記憶部12に記憶されている。
【0028】
「解析対象患者」は、機械学習アルゴリズムの説明変数および目的変数となる情報(すなわち、教師データ)が得られる患者である。すなわち、解析対象患者は、重症化の有無の予測の対象となる共通の病気の罹患歴を有し、経時的な重症化の程度(すなわち、有無)が既知の患者である。ここで、解析対象患者が罹患している(罹患していた)病気は、患者が罹患している病気と同じである。
【0029】
「項目」は、解析対象患者および患者から得られる情報の種別である。項目は、解析対象患者(患者)の属性(例えば、年齢、性別など)、解析対象患者(患者)の行動履歴(例えば、喫煙歴など)、および、解析対象患者(患者)が受けた検査項目(例えば、呼吸機能検査、問診の項目など)、を含む。
【0030】
図3は、記憶部12に記憶されている情報(DB1)の例を示す模式図である。
「病気ID」は、各病気に対応する病気固有の識別情報である。「解析対象患者ID」は、各解析対象患者に対応する解析対象患者固有の識別情報である。「項目ID」は、各項目に対応する項目固有の識別情報である。DB1には、病気IDと解析対象患者IDと項目IDとが関連付けられて記憶されている。
【0031】
同図は、例えば、病気ID「A001」の罹患歴のある解析対象患者ID「X001」の項目ID「Y001」に対応する情報が「y01」であり、項目ID「Y002」に対応する情報が「y02」である、ことを示している。本生成装置10は、例えば、病気ID「A001」を用いてDB1を参照することにより、病気ID「A001」に関連付けられて記憶部12に記憶されている解析対象者情報を項目ごとに読み出す(取得する)ことができる。
【0032】
図2に戻る。
制御部13は、本生成装置10全体の動作を制御すると共に、後述する本生成方法を実行する。制御部13は、例えば、本生成装置10が備えるCPU(Central Processing Unit)と、CPUの作業領域として機能するRAM(Random Access Memory)と、本生成プログラムなどの各種情報を記憶するROM(Read Only Memory)と、により構成されている。制御部13は、生成情報取得部131と、第1学習部132と、寄与度取得部133と、選択部134と、第2学習部135と、モデル検証部136と、モデル選択部137と、出力部138と、を備える。
【0033】
生成情報取得部131は、複数の解析対象患者から得られる複数の項目ごとの解析対象患者情報を取得する。生成情報取得部131の具体的な動作は、後述する。
【0034】
第1学習部132は、複数の項目に対応する解析対象患者情報を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するための1次学習モデルを構築する。第1学習部132の具体的な動作は、後述する。
【0035】
寄与度取得部133は、1次学習モデルにおいて、複数の項目ごとに重症化の有無の予測精度の向上への寄与度を取得する。寄与度取得部133の具体的な動作は、後述する。
【0036】
「寄与度」は、1次学習モデルにおいて、患者の重症化の有無の予測精度の向上に対して、説明変数(項目に対応する解析対象患者情報)それぞれが寄与する(影響する)度合である。本実施の形態において、寄与度は、パーミュテーションインポータンス(Permutation Importance)である。
【0037】
なお、本発明における寄与度は、パーミュテーションインポータンスに限定されない。すなわち、例えば、本発明における寄与度は、SHAP値でもよい。
【0038】
選択部134は、寄与度に基づいて、複数の項目の中から、複数の特定項目を選択する。選択部134の具体的な動作は、後述する。
【0039】
「特定項目」は、項目の内、後述する2次学習モデルの生成の際に説明変数として用いられる解析対象患者情報に対応する項目である。
【0040】
第2学習部135は、複数の特定項目に対応する解析対象患者情報(以下「特定対象患者情報」という。)を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するための2次学習モデルを構築する。第2学習部135の具体的な動作は、後述する。
【0041】
ここで、1次学習モデルと2次学習モデルとは、共通する機械学習モデルを用いて構築される。本実施の形態において、機械学習モデルは、例えば、ランダムフォレストモデルである。
【0042】
なお、本発明における機械学習モデルは、ランダムフォレストモデルに限定されない。すなわち、例えば、本発明における機械学習モデルは、ロジスティック回帰モデルでもよく、あるいは、サポートベクターマシンモデルやナイーブベイズモデルでもよい。
【0043】
モデル検証部136は、構築された2次学習モデルの検証を行う。モデル検証部136の具体的な動作は、後述する。
【0044】
モデル選択部137は、構築された1以上の2次学習モデルの検証結果に基づいて、2次学習モデルを対応する病気の重症化予測用学習モデルとして選択する。モデル選択部137の具体的な動作は、後述する。
【0045】
出力部138は、後述する本生成方法が実行されて得られる各種情報(例えば、本生成装置10の使用者の選択を要する情報など)を出力する。出力部138の具体的な動作は、後述する。
【0046】
操作部14は、本生成装置10の使用者(例えば、医師や看護師などの医療従事者。)により操作(例えば、情報の入力・選択操作など)される機器である。操作部14は、例えば、キーボード、マウス、タッチパネルである。
【0047】
表示部15は、制御部13が出力する情報を表示する機器である。表示部15は、例えば、モニタやディスプレイである。
【0048】
なお、本生成装置における操作部と表示部とは、例えば、タッチパネル式ディスプレイで構成されてもよい。
【0049】
●重症化予測定装置の構成
図4は、本予測装置20の機能ブロック図である。
【0050】
本予測装置20は、例えば、パーソナルコンピュータで実現される。本予測装置20では、本予測プログラムが動作して、本予測プログラムが本予測装置20のハードウェア資源と協働して、本予測方法を実現する。
【0051】
ここで、コンピュータ(不図示)に本予測プログラムを実行させることで、本予測プログラムは、同コンピュータを本予測装置20と同様に機能させて、同コンピュータに本予測方法を実行させることができる。
【0052】
本予測装置20は、通信部21と、記憶部22と、制御部23と、操作部24と、表示部25と、を備える。
【0053】
通信部21は、ネットワークNを介して、本生成装置10と外部装置30とに接続されている。通信部21は、例えば、通信モジュールや通信インターフェイスにより構成されている。
【0054】
記憶部22は、本予測装置20が後述する本予測方法を実行するために必要な情報(例えば、患者情報データベースDB2、学習済みの重症化予測用学習モデルなど)を記憶する。記憶部22は、例えば、本予測装置20が備えるHDDまたはSSDのような記録装置、および/または、フラッシュメモリのような記憶媒体、により構成されている。
【0055】
「患者情報データベースDB2(以下単に「DB2」と表記する場合もある。)」は、例えば、患者から得られる複数の項目ごとの情報が、患者ごとに記憶されているデータベースである。すなわち、DB2には、患者ごとに、1の病気に対応する複数の患者情報が記憶されている。本実施の形態において、DB2は、例えば、本予測装置20の使用者により、医療機関が保有する情報に基づいて生成されている。DB2は、例えば、患者ごとに予め生成され、記憶部22に記憶されている。
【0056】
図5は、記憶部22に記憶されている情報(DB2)の例を示す模式図である。
「患者ID」は、各患者に対応する患者固有の識別情報である。DB2には、患者IDと病気IDと項目IDとが関連付けられて記憶されている。本予測装置20は、例えば、患者ID「Z001」を用いてDB2を参照することにより、患者ID「Z001」に関連付けられて記憶されている患者情報を項目ごとに読み出す(取得する)ことができる。
【0057】
図4に戻る。
制御部23は、本予測装置20全体の動作を制御すると共に、後述する本予測方法を実行する。制御部23は、例えば、本予測装置20が備えるCPUと、CPUの作業領域として機能するRAMと、本予測プログラムなどの各種情報を記憶するROMと、により構成されている。制御部23は、予測情報取得部231と、予測部232、出力部233と、を備える。
【0058】
予測情報取得部231は、患者から得られる複数の項目ごとの患者情報を取得する。予測情報取得部231の具体的な動作は、後述する。
【0059】
予測部232は、患者情報に基づいて、学習済みの学習モデル(後述する重症化予測用学習モデル)を用いて、重症化の有無を予測する。予測部232の具体的な動作は、後述する。
【0060】
出力部233は、後述する本予測プログラムが実行されて得られる各種情報(例えば、予測結果など)を出力する。出力部233の具体的な動作は、後述する。
【0061】
操作部24は、本予測装置20の使用者(例えば、医師や看護師などの医療従事者。)により操作(例えば、情報の入力・選択操作)される機器である。操作部24は、例えば、キーボード、マウス、タッチパネルである。
【0062】
表示部25は、出力部233が出力する情報(例えば、予測結果など)を表示する機器である。表示部25は、例えば、モニタやディスプレイである。
【0063】
なお、本予測装置における操作部と表示部とは、例えば、タッチパネル式ディスプレイで構成されてもよい。
【0064】
●重症化予測システムの動作
次に、本システム1の動作、すなわち、本生成装置10および本予測装置20の動作について説明する。
【0065】
●重症化予測用学習モデル生成装置の動作
先ず、本生成装置10の動作、すなわち、本生成装置10が実行する本生成方法について説明する。以下の本生成方法の説明において、
図2も併せて参照される。
【0066】
本生成装置10は、本生成方法として重症化予測用学習モデル生成処理(S1)を実行する。「重症化予測用学習モデル生成処理(S1)」は、本生成装置10が解析対象患者情報に基づく機械学習により、病気の重症化の予測を支援するための1の重症化予測用学習モデルを生成する処理である。
【0067】
図6は、本生成方法の実施の形態を示す、重症化予測用学習モデル生成処理(S1)のフローチャートである。
【0068】
先ず、生成情報取得部131は、学習モデルの生成対象の病気の情報(病気ID)を取得する(S101)。具体的には、例えば、生成情報取得部131は、本生成装置10の使用者が操作部24を介して入力した病気名から病気IDを取得する。その結果、生成情報取得部131は、取得した病気IDに基づいて、重症化の予測の対象となる病気の情報(名称など)を取得する。
【0069】
次いで、生成情報取得部131は、解析対象患者情報を取得する(S102:情報取得ステップ)。具体的には、生成情報取得部131は、例えば、病気IDを用いてDB1を参照することにより、病気IDに関連付けられてDB1に記憶されている解析対象患者情報を取得する。
【0070】
次いで、第1学習部132は、各項目に対応する解析対象患者情報を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するための1次学習モデルを構築する(S103:第1学習ステップ)。ここで、重症化の有無は、例えば、病気の重症化の指標となる項目の有無、項目に対応する値の大小、項目に対応する値と閾値との関係(閾値以上、閾値未満、など)、などに基づいて、本生成装置10の使用者により予め設定されている。
【0071】
次いで、寄与度取得部133は、第1学習部132により生成された学習済みの1次学習モデルにおいて、項目ごとに重症化の有無の予測への寄与度を取得する(S104:寄与度取得ステップ)。具体的には、寄与度取得部133は、例えば、項目ごとにパーミュテーションインポータンスを算出し、算出された値を寄与度として取得し、項目に関連付けて記憶部12に記憶する。ここで、寄与度(パーミュテーションインポータンス)は、例えば、合計100回の反復施行により算出されている。
【0072】
次いで、寄与度取得部133は、全ての項目に対する寄与度を比較して、寄与度の大きさに基づいて、複数の項目それぞれに順位を付ける(S105:順位付ステップ)。順位は、寄与度の大きい項目から順に付けられる。
【0073】
次いで、選択部134は、寄与度に基づいて、複数の項目の中から、複数の特定項目を選択する(S106:選択ステップ)。具体的には、選択部134は、寄与度の順位が上位「n」(nは2以上の整数)位以内の複数の項目を特定項目として選択する。ここで、選択部134は、例えば、上位「n」位以内の項目のうち、複数の項目からなる1の組合せを選択する。すなわち、特定項目は、順位が上位「n」位以内の複数の項目を含む。
【0074】
なお、本発明における選択部は、「n」の値および1の組合せが予め設定されているとき、設定されている組合せを選択してもよい。また、例えば、本発明における選択部は、「1」位の項目を必ず組合せに含めて特定項目を選択してもよい。さらに、本発明における選択部は、本生成装置の使用者が操作部を介して選択した項目を特定項目として選択してもよい。
【0075】
次いで、第2学習部135は、処理S102で取得された解析対象患者情報のうち、複数の特定項目に対応する解析対象患者情報(特定対象患者情報)を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するための2次学習モデルを構築する(S107:第2学習ステップ)。2次学習モデルは、記憶部12に記憶される。
【0076】
次いで、モデル検証部136は、構築された2次学習モデルを検証する(S108)。具体的には、モデル検証部136は、例えば、10分割交差検証法を用いて、2次学習モデルのROC解析を行い、2次学習モデルの予測精度を算出することにより、2次学習モデルを検証する。検証結果(AUC、正答率)は、2次学習モデルに関連付けられて、記憶部12に記憶される。
【0077】
次いで、制御部13は、選択されていない組合せの有無を予測する(S109)。選択されていない組合せが有るとき(S109の「Y」)、本生成方法は、処理S106に戻る。
【0078】
一方、選択されていない組合せが無いとき(S109の「N」)、モデル選択部137は、構築された1以上の2次学習モデルのうち、検証結果(AUC、正答率)が最もよい2次学習モデルを対応する病気の重症化予測用学習モデルとして選択する(S110)。換言すれば、本生成装置10は、1の2次学習モデルを重症化予測用学習モデルとして構築する。重症化予測用学習モデルは、例えば、対応する病気IDに関連付けられて記憶部12に記憶される。
【0079】
次いで、制御部13は、通信部11を介して、重症化予測用学習モデルを本予測装置20に送信する(S111)。送信された重症化予測用学習モデルは、本予測装置20の記憶部22に記憶される。
【0080】
なお、本生成方法は、本実施の形態に限定されない。すなわち、例えば、特定項目の選択処理において、本発明における選択部は、本生成装置の使用者が操作部を介して選択した項目を、特定項目として選択してもよい。この場合、本予測装置の出力部は、例えば、項目ごとの寄与度を表示部に出力する。
【0081】
また、例えば、2次学習モデルの検証処理と2次学習モデルの選択処理とは、本予測装置ではなく、本予測装置の使用者に実行されてもよい。
【0082】
さらに、例えば、2次学習モデルの選択処理において、本発明におけるモデル選択部は、本生成装置の使用者が操作部を介して選択した2次学習モデルを、重症化予測用学習モデルとして選択してもよい。この場合、本予測装置の出力部は、例えば、2次学習モデルごとの検証結果を表示部に出力する。
【0083】
●重症化予測装置の動作
次いで、本予測装置20の動作、すなわち、本予測装置20が実行する本予測方法について説明する。以下の本予測方法の説明において、
図4も併せて参照される。
【0084】
本予測装置20は、本予測方法として重症化予測処理(S2)を実行する。「重症化予測処理(S2)」は、本予測装置20が重症化予測用学習モデルと患者情報とに基づいて病気の重症化を予測する処理である。
【0085】
図7は、本予測方法の実施の形態を示す、重症化予測処理(S2)のフローチャートである。
【0086】
先ず、予測情報取得部231は、重症化の予測対象の病気の情報(病気ID)を取得する(S201)。具体的には、例えば、予測情報取得部231は、本予測装置20の使用者が操作部24を介して入力した病気名から病気IDを取得する。その結果、予測情報取得部231は、取得した病気IDに基づいて、重症化の予測の対象となる病気の情報(名称など)を取得する。
【0087】
次いで、予測情報取得部231は、予測対象の患者の患者情報を取得する(S202:予測情報取得ステップ)。具体的には、予測情報取得部231は、例えば、患者ID(および病気ID)を用いてDB2を参照して、患者IDに関連付けられて記憶部22に記憶されている患者情報を取得する。
【0088】
次いで、予測部232は、記憶部22に記憶されている重症化予測用学習モデルを読み出す(S203)。具体的には、予測部232は、例えば、病気IDを用いて記憶部22を参照して、病気IDに関連付けられて記憶部22に記憶されている重症化予測用学習モデルを記憶部22から読み出す。前述のとおり、重症化予測用学習モデルは、本生成装置10が本生成方法を実行することにより生成されている。
【0089】
なお、本発明における予測部は、例えば、本予測装置の使用者が操作部を介して選択した重症化予測用学習モデルを記憶部から読み出してもよい。
【0090】
次いで、予測部232は、重症化予測用学習モデルと患者情報とに基づいて、患者の重症化の有無を予測する(S204:予測ステップ)。予測結果は、例えば、患者IDに関連付けられて記憶部22に記憶される。ここで、予測結果は、重症化の「有」「無」を示す情報である。
【0091】
次いで、出力部233は、予測結果を表示部25に出力する(S205)。
【0092】
次いで、表示部25は、予測結果を表示する(S206)。
【0093】
図8は、表示部25に表示されている情報(予測結果)の例を示す模式図である。
同図は、患者「A」の病気「B」の重症化の可能性が「有」となっていることを示す。
【0094】
このように、本予測装置20は、本予測方法を実行することにより、予測対象の患者の重症化の有無を予測する。本予測装置20の使用者は、表示部25に表示された予測結果を閲覧することにより、患者の病気の重症化の有無を判断(推定)することができる。その結果、例えば、本予測装置20の予測結果を得た医師は、重症化の有無の判断結果に基づいて、予め患者の治療方針を策定することができる。
【0095】
なお、本発明における予測情報取得部は、本予測装置の使用者が操作部を介して入力した患者情報を取得してもよい。
【0096】
●実施例●
次に、実際の診療データを用いて、重症化予測用学習モデルを生成した場合を例に、本発明の実施例について以下説明する。以下の実施例において、用いられた診療データは、症状の安定した25歳以上の気管支喘息患者128名に対して実行された3年間の前向き観察研究(FLOAT:Factors affecting the Long-term Asthma Therapy)により得られたデータである。1秒量(FEV1:Forced Exhaled Volume in 1 second)の年間平均減少量(経年低下量)が「-40mL/year」以下の場合が迅速な症例(Rapid decliner)と定義されたとき、目的変数は、3年後にRapid declinerか否かと定義されている。一方、説明変数(項目)は、「年齢」「性別」「BMI」「喫煙歴(Packyear)」「喘息症状スコアACT(Asthma Control Test)」「%予測1秒量(%FEV1)」「%予測努力性肺活量(%FVC)」「呼気一酸化窒素(FeNO)」「白血球数」「血中好酸球数」「IgE」「増悪回数」「鼻炎の有無」「副鼻腔炎の有無」「逆流性食道炎の有無」「アトピーの有無」である。
【0097】
先ず、前述の説明変数と目的変数とに基づいて、1次学習モデルが生成された。次いで、説明変数ごとの予測精度の向上に対する寄与度(パーミュテーションインポータンス)が取得され、その順位付けが行われた。
【0098】
図9は、本発明の実施例において説明変数と寄与度との関係を示すグラフである。
同図は、「増悪回数」が1位であり、「BMI」「年齢」「FeNO」「血中好酸球数」が2~5位であることを示す。
【0099】
次いで、寄与度の上位5位以内の5つの項目(「増悪回数」「BMI」「年齢」「FeNO」「血中好酸球数」)が特定項目として選択され、2次学習モデルが生成された。
【0100】
図10(a)はランダムフォレストモデルを用いて生成された2次学習モデルのROC曲線図であり、(b)~(g)はロジスティック回帰モデルを用いて生成された2次学習モデルのROC曲線である。
【0101】
同図において、(a)(b)は上位5位以内の5つの項目が特定項目として選択された例を示し、(c)は「増悪回数」のみが特定項目として選択された比較例を示し、(d)は「BMI」のみが特定項目として選択された比較例を示し、(e)は「年齢」のみが特定項目として選択された比較例を示し、(f)は「血中好酸球数」が特定項目として選択された比較例を示し、(g)は「FeNO」が特定項目として選択された比較例を示す。
図5に示されるとおり、寄与度上位5位以内の項目を単独で特定項目として選択されたときの予測精度よりも、上位5位以内の全ての項目の組合せを特定項目として選択されたときの予測精度の方が良好である。
【0102】
図11は、上位5位以内の項目の組合せに基づいて生成された2次学習モデル(ランダムフォレストモデル)の10分割交差検証法による検証結果を示す表である。
図12は、上位5位以内の項目の組合せに基づいて生成された2次学習モデル(ロジスティック回帰モデル)の10分割交差検証法による検証結果を示す表である。
【0103】
図11と
図12とに示されるとおり、上位5位以内の項目の組合せに基づいて生成された2次学習モデルでは、少なくとも「増悪回数」「年齢」が特定項目として選択されることにより、高いAUCと正答率とが得られている。
【0104】
このように、本発明により生成された気管支喘息患者の重症化の有無を予測するための重症化予測用学習モデルでは、ランダムフォレストモデルにおいて、AUC:0.80(95%CI:0.67~0.93)、正答率:78%(95%CI:70~86%)の検証結果が得られ、ロジスティック回帰モデルにおいて、AUC:0.84(95%CI:0.65~1.00)、正答率:81%(95%CI:72%~90%)の検証結果がえられた。すなわち、本発明により、気管支喘息の高精度な重症化の予測が可能な重症化予測用学習モデルが生成された。
【0105】
●まとめ
以上説明した実施の形態によれば、本生成装置10により実行される本生成方法は、情報取得ステップと、第1学習ステップと、寄与度取得ステップと、選択ステップと、第2学習ステップと、を有してなる。本生成装置10は、情報取得ステップにおいて、病気の罹患歴を有する複数の解析対象患者から得られる複数の項目ごとの解析対象患者情報を取得する。本生成装置10は、第1学習ステップにおいて、複数の項目に対応する解析対象患者情報を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するための1次学習モデルを構築する。本生成装置10は、寄与度取得ステップにおいて、1次学習モデルにおいて、複数の項目ごとに重症化の有無の予測精度の向上への寄与度を取得する。本生成装置10は、選択ステップにおいて、寄与度に基づいて、複数の項目の中から、複数の特定項目を選択する。本生成装置10は、2次学習ステップにおいて、複数の特定項目に対応する解析対象患者情報を説明変数とし、重症化の有無を目的変数として、重症化の有無を予測するために用いられる重症化予測用学習モデルとなる2次学習モデルを構築する。この構成によれば、本生成方法(本生成装置10)は、寄与度に基づいて特定項目を選択し、2次学習モデルを生成することにより、精度の高い重症化予測用学習モデルを生成することができる。すなわち、本発明は、機械学習により、病気の重症化の有無の予測を支援することができる。
【0106】
また、以上説明した実施の形態によれば、寄与度取得ステップは、順位付ステップを含む。本生成装置10は、順位付ステップにおいて、取得された寄与度の大きさに基づいて、複数の項目それぞれに順位を付ける。本生成装置10は、選択ステップにおいて、順位に基づいて複数の特定項目を選択する。この構成によれば、本生成方法(本生成装置10)は、1次学習モデルにおける寄与度の高い項目の組合せを特定項目の組合せとして選択し、2次学習モデルを生成することにより、より精度の高い重症化予測用学習モデルを生成することができる。すなわち、本発明は、機械学習により、病気の重症化の有無の予測を支援することができる。
【0107】
さらに、以上説明した実施の形態によれば、複数の特定項目は、順位が上位「n」(nは整数)位以内の複数の項目を含む。この構成によれば、本生成方法(本生成装置10)は、1次学習モデルにおける寄与度の高い項目の組合せを特定項目の組合せとして選択し、2次学習モデルを生成することにより、より精度の高い重症化予測用学習モデルを生成することができる。すなわち、本発明は、機械学習により、病気の重症化の有無の予測を支援することができる。
【0108】
さらにまた、以上説明した実施の形態によれば、項目は、解析対象患者の属性、解析対象者の行動履歴、および解析対象者が受けた検査項目、を含む。この構成によれば、検査項目だけでなく、解析対象患者の属性や行動履歴が学習モデルの説明変数として選択可能である。その結果、学習モデルの説明変数の選択幅が増す。したがって、本生成方法(本生成装置10)は、より精度の高い重症化予測用学習モデルを生成することができる。
【0109】
さらにまた、以上説明した実施の形態によれば、本予測方法は、予測情報取得ステップと予測ステップとを有してなる。本予測装置20は、予測情報取得ステップにおいて、患者から得られる複数の項目ごとの患者情報を取得する。本予測装置20は、予測ステップにおいて、患者情報に基づいて、学習済みの重症化予測用学習モデルを用いて、重症化の有無を予測する。この構成によれば、本予測方法(本予測装置20)は、機械学習により生成された重症化予測用学習モデルを用いた予測結果を本予測装置20の使用者に提供することにより、病気の重症化の有無の予測を支援することができる。
【0110】
なお、以上説明した実施の形態では、本生成装置10は、本予測装置20と別体(別のコンピュータ)で構成されていた。これに代えて、本生成装置は本予測装置としても機能してもよく、あるいは、本予測装置は本生成装置としても機能してもよい。すなわち、1のコンピュータが本生成装置と本予測装置(すなわち、本システム)として機能してもよい。
【0111】
また、本発明における出力部の出力先は、表示部に限定されない。すなわち、例えば、本発明における出力部は、プリンタに情報を出力してもよい。また、例えば、本発明における出力部は、通信部を介して、外部装置(例えば、携帯型情報処理端末など)に情報を出力してもよい。
【0112】
さらに、本発明におけるDB1、DB2は、本実施の形態に限定されない。
【0113】
さらにまた、本発明における生成情報取得部は、DB1に代えて、外部装置から解析対象者情報を取得してもよい。
【0114】
さらにまた、以上説明した実施の形態では、本生成装置10と本予測装置20それぞれは、1つのコンピュータにより構成されていた。これに代えて、本生成装置と本予測装置それぞれは、複数のコンピュータにより構成されてもよい。すなわち、例えば、本生成装置は、本生成装置として機能する複数のコンピュータ群で構成されてもよい。具体的には、例えば、本生成装置(コンピュータ群)は、記憶部を備えるコンピュータと、本生成方法を実行する制御部を備えるコンピュータと、により構成されてもよい。また、例えば、複数のコンピュータが、生成情報取得部、第1学習部、寄与度取得部、選択部、第2学習部、モデル検証部、モデル選択部、出力部それぞれの機能を分散して備えてもよい。この場合、コンピュータ群を構成する複数のコンピュータは、ネットワークを介して情報の送受信をしてもよく、あるいは、可搬記憶媒体を用いて情報の受け渡しをしてもよい。
【符号の説明】
【0115】
1 重症化予測システム
10 重症化予測用学習モデル生成装置
12 記憶部
131 生成情報取得部
132 第1学習部
133 寄与度取得部
134 選択部
135 第2学習部
20 重症化予測装置
22 記憶部
231 予測情報取得部
232 予測部