IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラティロン ヘルス,インコーポレイテッドの特許一覧

<>
  • 特表-健康情報に基づく予後スコア 図1
  • 特表-健康情報に基づく予後スコア 図2
  • 特表-健康情報に基づく予後スコア 図3
  • 特表-健康情報に基づく予後スコア 図4
  • 特表-健康情報に基づく予後スコア 図5
  • 特表-健康情報に基づく予後スコア 図6
  • 特表-健康情報に基づく予後スコア 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-04-14
(54)【発明の名称】健康情報に基づく予後スコア
(51)【国際特許分類】
   G16H 50/30 20180101AFI20220407BHJP
【FI】
G16H50/30
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021549757
(86)(22)【出願日】2020-02-25
(85)【翻訳文提出日】2021-10-18
(86)【国際出願番号】 US2020019663
(87)【国際公開番号】W WO2020176476
(87)【国際公開日】2020-09-03
(31)【優先権主張番号】62/810,700
(32)【優先日】2019-02-26
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/825,338
(32)【優先日】2019-03-28
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ブルートゥース
2.VISUAL BASIC
3.JAVA
(71)【出願人】
【識別番号】519349872
【氏名又は名称】フラティロン ヘルス,インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ヘイムソン,ジョシュア,ディー.
(72)【発明者】
【氏名】バクシー,シュルジャル
(72)【発明者】
【氏名】メロポール,ニール
(72)【発明者】
【氏名】アムブワニ,ギートゥ
(72)【発明者】
【氏名】バッケンロス,ダニエル
(72)【発明者】
【氏名】ムラリ,マヘシュ
(72)【発明者】
【氏名】ロシック,アンドレユ
(72)【発明者】
【氏名】ジャン,チェンシェン
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA15
(57)【要約】
患者の生存率を予測するためのモデル支援システムは少なくとも1つのプロセッサを含み得る。プロセッサは患者の医療記録を格納するデータベースにアクセスするようにプログラムされ得る。医療記録は、患者に関連する構造化情報及び非構造化情報の少なくとも1つを含み得、そして構造化患者ECOGスコアを欠き得る。プロセッサはさらに、患者に関係する構造化情報及び非構造化情報の少なくとも1つを分析し;分析に基づき、そして構造化ECOGスコア無しに、患者のパフォーマンスステータス予測を生成し;そして予測パフォーマンスステータスを示す出力を提供するようにプログラムされ得る。構造化情報及び非構造化情報の少なくとも1つの情報の分析並びに予測パフォーマンスステータスの生成はトレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも1つにより行われ得る。
【特許請求の範囲】
【請求項1】
患者のパフォーマンスステータスを予測するためのモデル支援システムであって、前記システムは、
前記患者に関連する構造化情報及び非構造化情報の少なくとも1つを含む前記患者の医療記録であって構造化患者ECOGスコアを欠く医療記録を格納するデータベースにアクセスし;
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも1つを分析し;
前記分析に基づき、そして構造化ECOGスコア無しに、前記患者のパフォーマンスステータス予測を生成し;そして
前記患者の前記予測パフォーマンスステータスを示す出力を提供するようにプログラムされた少なくとも1つのプロセッサを含み:
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも1つの前記分析並びに前記患者の前記予測パフォーマンスステータスの前記生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも1つにより行われる、システム。
【請求項2】
前記トレーニング済み機械学習モデルはロジスティック回帰モデル、ニューラルネットワーク又はランダムフォレストモデルを含む、請求項1に記載のシステム。
【請求項3】
前記トレーニング済み機械学習モデルはコックス比例ハザード回帰モデルを含む、請求項1に記載のシステム。
【請求項4】
前記トレーニング済み機械学習モデルはlasso回帰分析を適用する、請求項1に記載のシステム。
【請求項5】
前記患者の前記医療記録は医療提供者、研究所又は保険会社から受信される、請求項1に記載のシステム。
【請求項6】
前記構造化情報は、性別、生年月日、人種、体重、研究所結果、バイタルサイン、診断日、訪問日、投薬指示、診断コード、手順コード、薬コード、以前の療法、又は投薬管理を含む、請求項1に記載のシステム。
【請求項7】
前記非構造化情報は、ヘルスケア提供者により書かれたテキスト、放射線学的報告、又は病理学報告を含む、請求項1に記載のシステム。
【請求項8】
前記パフォーマンスステータス予測は前記患者の生存率予測を含む、請求項1に記載のシステム。
【請求項9】
前記予測パフォーマンスステータスを示す前記出力は前記患者が生き延びることが予想される期間の時間推定を含む、請求項8に記載のシステム。
【請求項10】
前記患者が生き延びることが予想される期間の前記時間推定は療法の開始日に対するものである、請求項9に記載のシステム。
【請求項11】
前記少なくとも1つのプロセッサはさらに、前記予測パフォーマンスステータスを示す少なくとも前記出力に基づき前記患者を臨床試験に含むことの適合性を判断するようにプログラムされる、請求項1に記載のシステム。
【請求項12】
前記少なくとも1つのプロセッサはさらに、前記患者を前記臨床試験に含むことの前記適合性を示す出力を提供するようにプログラムされる、請求項11に記載のシステム。
【請求項13】
前記臨床試験は療法を使用して前記患者を治療することに関与する、請求項12に記載のシステム。
【請求項14】
前記療法は癌療法である、請求項13に記載のシステム。
【請求項15】
前記少なくとも1つのプロセッサはさらに:前記患者に関係する前記構造化情報及び非構造化情報の少なくとも1つの前記分析に基づき、病気に起因する前記患者の予想改善又は悪化の時間推定を生成するようにプログラムされる、請求項1に記載のシステム。
【請求項16】
前記病気に起因する前記患者の予想改善又は悪化の前記時間推定は療法の開始日に対するものである、請求項15に記載のシステム。
【請求項17】
前記少なくとも1つのプロセッサはさらに:前記患者に関係する前記構造化情報及び非構造化情報の少なくとも1つの前記分析に基づき、療法の開始日後の所定期間にわたって、前記患者内の腫瘍がどれだけ縮小又は成長すると予測されるかを示すサイズ推定を生成するようにプログラムされる、請求項1に記載のシステム。
【請求項18】
前記トレーニング済み機械学習モデルは:
複数の患者の医療記録にアクセスし;
前記医療記録の第1の下位集合を選択し;
前記第1の下位集合内の前記患者の予測パフォーマンスステータスを生成するために前記医療記録の前記第1の下位集合を分析し;
前記第1の下位集合を含まない前記医療記録の第2の下位集合を選択し;
前記第2の下位集合内の前記患者の予測パフォーマンスステータスを生成するために前記医療記録の前記第2の下位集合を分析し;そして
前記トレーニング済み機械学習モデルの精度レベルを前記第1の下位集合内の前記患者の前記予測パフォーマンスステータス及び前記第2の下位集合内の前記患者の前記予測パフォーマンスステータスに基づき判断するように構成される、請求項1に記載のシステム。
【請求項19】
前記複数の患者の前記医療記録は前記構造化患者ECOGスコアを欠く、請求項18に記載のシステム。
【請求項20】
前記自然言語処理アルゴリズムはロジスティック回帰、ニューラルネットワーク又はランダムフォレストアルゴリズムを含む、請求項1に記載のシステム。
【請求項21】
前記自然言語処理アルゴリズムはコックス比例ハザード回帰アルゴリズムを含む、請求項1に記載のシステム。
【請求項22】
前記自然言語処理アルゴリズムはlasso回帰分析を適用する、請求項1に記載のシステム。
【請求項23】
患者のパフォーマンスステータスを予測するための方法であって、前記方法は、
前記患者に関連する構造化情報及び非構造化情報の少なくとも1つを含む前記患者の医療記録であって構造化患者ECOGスコアを欠く医療記録を格納するデータベースにアクセスすること;
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも1つを分析すること;
前記分析に基づき、そして構造化ECOGスコア無しに、前記患者のパフォーマンスステータス予測を生成すること;及び
前記患者の前記予測パフォーマンスステータスを示す出力を提供することを含み、
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも1つの前記分析並びに前記患者の前記パフォーマンスステータス予測の前記生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも1つにより行われる、方法。
【請求項24】
前記トレーニング済み機械学習モデルはロジスティック回帰モデル、ニューラルネットワーク又はランダムフォレストモデルを含む、請求項23に記載の方法。
【請求項25】
前記構造化情報は、性別、生年月日、人種、体重、研究所結果、バイタルサイン、診断日、訪問日、投薬指示、診断コード、手順コード、薬コード、以前の療法、又は投薬管理を含む、請求項23に記載の方法。
【請求項26】
前記非構造化情報は、ヘルスケア提供者により書かれるテキスト、放射線学的報告、又は病理学報告を含む、請求項23に記載の方法。
【請求項27】
前記予測パフォーマンスステータスを示す少なくとも前記出力に基づき前記患者を臨床試験に含むことの適合性を判断することをさらに含む請求項23に記載の方法。
【請求項28】
前記患者に関係する前記構造化情報及び非構造化情報の少なくとも1つの前記分析に基づき、病気に起因する前記患者の予想改善又は悪化の時間推定を生成することをさらに含む請求項23に記載の方法。
【請求項29】
前記患者に関係する前記構造化情報及び非構造化情報の少なくとも1つの前記分析に基づき、療法の開始日後の所定期間にわたって、前記患者内の腫瘍がどれだけ縮小又は成長すると予測されるかを示すサイズ推定を生成することをさらに含む請求項23に記載の方法。
【請求項30】
前記パフォーマンスステータス予測を生成することは前記患者の生存率予測を生成することを含む、請求項23に記載の方法。
【請求項31】
患者のパフォーマンスステータススコアを提供するシステムであって、前記システムは、
前記患者に関連する構造化及び非構造化情報を含む前記患者の医療記録を格納するデータベースにアクセスし;前記患者に関連する治療方針を前記医療記録に基づき識別し、
前記構造化情報は前記治療方針に関連する前記患者のパフォーマンスステータススコアを欠き;
前記治療方針に関連する前記患者のパフォーマンスステータススコアを判断するために前記非構造化情報を分析し、前記パフォーマンスステータススコアはトレーニング済み機械学習モデル又は自然言語処理アルゴリズムのうちの少なくとも1つにより判断され;そして
前記パフォーマンスステータススコアを示す出力を提供するようにプログラムされる少なくとも1つのプロセッサを含む、システム。
【請求項32】
前記パフォーマンスステータススコアはECOGスコアを含む、請求項31に記載のシステム。
【請求項33】
前記非構造化情報の前記分析は前記治療方針の開始日の所定時間枠内に記録される非構造化情報に限定される、請求項31に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001] 本出願は2019年2月26日出願の米国仮出願第62/810,700号及び2019年3月28日出願の米国仮出願第62/825,338号の優先権の利点を請求する。前述の出願の全体を参照により本明細書に援用する。
【背景技術】
【0002】
背景
技術分野
[0002] 本開示は患者の生存率を予測するためのモデル支援システム及び方法に関する。
【0003】
背景情報
[0003] 末期的な可能性の医療状態を有する患者を治療する際、医者はしばしば患者の福利及び改善の尤度について難しい評価を行う。これらの予後判断はしばしば患者の適切な治療計画を判断する。患者の改善の尤度又は生存率の評価は、その多くが主観的であり且つ容易に測定可能でない多数の要因の組み合わせの考察に関与し得る。したがって、適切な治療計画を判断するのを助けるために、患者の死亡の尤度、短期改善及び全体的福利のより定量化可能な評価の必要性がある。
【0004】
[0004] 患者の一般的福利を定量化しようとするいくつかの解決策が開発されてきた。例えば、Eastern Cooperative Oncology Group(ECOG)スコアは、医師が患者の機能のレベルを追跡することを可能にする予後スコアである(0~5;0は良好;5は死亡)。このスコアはいくつかの療法に耐える患者の能力を評価する際に役立ち得る。例えば、1のECOGスコアを有する患者は4のECOGスコアを有する患者より毒性が高い薬をより自由に処方され得る。しかし、ECOGスコアの展開は個々の医者からの評価に依存する。実際、多くの医者及び臨床医はEGOGスコアを追跡しておらず、このことは、ECOGスコア情報が患者群に関し無い又は不完全であるかもしれないので医療データの現実世界分析を困難にし得る。さらに、これらのECOGスコアは、主観的であり、患者を評価する各医者の個々の判断に依存する。したがって、所与の患者のECOGスコアは評価を提供する医者に依存して変わり得る。
【0005】
[0005] したがって、特にECOGスコアが無い場合には、患者の改善された予後評価の必要性がある。解決策は有利には、個々のケア提供者によりなされるスコア評価に関与すること無しに、患者に関連するデータに基づく予後スコアの展開を可能にするべきである。解決策は、例えば患者の医療記録からのデータなど患者に関連する広範囲のデータに基づき患者を採点することができるべきである。解決策はさらに、特定治療に対する患者の反応を予測すること又は患者の臨床試験の適合性を評価することなど、生存率スコアを越えた追加予後を可能にするべきである。
【発明の概要】
【課題を解決するための手段】
【0006】
概要
[0006] 本開示に整合する実施形態は患者の生存率を予測するためのシステム及び方法を含む。例示的実施形態では、少なくとも1つのプロセッサを含む患者のパフォーマンスステータスを予測するためのモデル支援システムが存在し得る。プロセッサは、患者に関連する構造化情報及び非構造化情報の少なくとも1つを含む患者の医療記録であって構造化患者ECOGスコアを欠く医療記録を格納するデータベースにアクセスし;患者に関連する構造化情報及び非構造化情報の少なくとも1つを分析し;上記分析に基づき、そして構造化ECOGスコア無しに、患者のパフォーマンスステータス予測を生成し;そして患者の予測パフォーマンスステータスを示す出力を提供するようにプログラムされ得、患者に関連する構造化情報及び非構造化情報の少なくとも1つの分析並びに患者の予測パフォーマンスステータスの生成はトレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも1つにより行われる。
【0007】
[0007] 別の開示された実施形態によると、患者のパフォーマンスステータスを予測する方法が実施され得る。本方法は、患者に関連する構造化情報及び非構造化情報の少なくとも1つを含む患者の医療記録であって構造化患者ECOGスコアを欠く医療記録を格納するデータベースにアクセスすること;患者に関連する構造化情報及び非構造化情報の少なくとも1つを分析すること;上記分析に基づき、そして構造化ECOGスコア無しに、患者のパフォーマンスステータス予測を生成すること;及び患者の予測パフォーマンスステータスを示す出力を提供することを含み得、患者に関連する構造化情報及び非構造化情報の少なくとも1つの分析並びに患者の予測パフォーマンスステータスの生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも1つにより行われる。
【0008】
[0008] 別の開示された実施形態によると、患者のパフォーマンスステータススコアを提供するシステムは少なくとも1つのプロセッサを含み得る。少なくとも1つのプロセッサは、患者に関連する構造化及び非構造化情報を含む患者の医療記録を格納するデータベースにアクセスし;患者に関連する治療方針を医療記録に基づき識別し、構造化情報は治療方針に関連する患者のパフォーマンスステータススコアを欠き;治療方針に関連する患者のパフォーマンスステータススコアを判断するために非構造化情報を分析し、パフォーマンスステータススコアはトレーニング済み機械学習モデル又は自然言語処理アルゴリズムのうちの少なくとも1つにより判断され;そしてパフォーマンスステータススコアを示す出力を提供するようにプログラムされ得る。
【0009】
[0009] 他の開示された実施形態に整合して、非一時的コンピュータ可読ストレージ媒体は、少なくとも1つの処理装置により実行されるプログラム命令であって本明細書における説明される方法のうちの任意のものを行うプログラム命令を格納し得る。
【0010】
図面の簡単な説明
[0010] 本明細書に援用され本明細書の一部を構成する添付図面は本明細書と共に、様々な実施形態の原理を示しており、その原理を説明する役目を果たす。
【図面の簡単な説明】
【0011】
図1】[0011]本開示に整合する実施形態を実施するための例示的システム環境を示すブロック図である。
図2】[0012]本開示に整合する患者の例示的医療記録を示すブロック図である。
図3】[0013]本開示に整合する患者の例示的予後予測を示すブロック図である。
図4】[0014]本開示に整合する実施形態を実施するための例示的機械学習過程を示すブロック図である。
図5】[0015]本開示に整合する患者のパフォーマンスステータスを予測する例示的方法を示す流れ図である。
図6】[0016]本開示に整合するトレーニング済み機械学習モデルの精度レベルを判断する例示的方法を示す流れ図である。
図7】[0017]本開示に整合する患者パフォーマンスステータススコアを判断する例示的方法を示す流れ図である。
【発明を実施するための形態】
【0012】
詳細な説明
[0018] 以下の詳細説明は添付図面を参照する。可能な限り、同じ参照符号が、同じ又は同様な部分を参照するために添付図面及び以下の明細書を通して使用される。いくつかの例示的実施形態が本明細書において説明されるが、修正形態、適応化形態及び他の実施形態が可能である。例えば、置換、追加又は修正が添付図面に示された部品に対しなされ得、本明細書において説明される例示的方法は、本開示方法に対して工程を置換、再順序付け、除去、又は追加することにより修正され得る。したがって、以下の詳細説明は開示された実施形態及び例に限定されない。その代りに、適切な範囲が添付の特許請求の範囲により定義される。
【0013】
[0019] 本明細書における実施形態はコンピュータ実施方法、有形な非一時的コンピュータ可読媒体、及びシステムを含む。コンピュータ実施方法は、非一時的コンピュータ可読ストレージ媒体から命令を受信する例えば少なくとも1つのプロセッサ(例えば処理装置)により実行され得る。同様に、本開示に整合するシステムは少なくとも1つのプロセッサ(例えば処理装置)及びメモリを含み得、メモリは非一時的コンピュータ可読ストレージ媒体であり得る。本明細書で使用されるように、非一時的コンピュータ可読ストレージ媒体は、少なくとも1つのプロセッサにより読み取り可能な情報又はデータが格納され得る任意のタイプの物理的メモリを指す。この例はランダムアクセスメモリ(RAM:random access memory)、読み出し専用メモリ(ROM:read-only memory)、揮発性メモリ、不揮発性メモリ、ハードドライブ、CD ROM、DVD、フラッシュドライブ、ディスク及び任意の他の公知の物理的ストレージ媒体を含む。「メモリ」及び「コンピュータ可読ストレージ媒体」などの単数用語は、複数のメモリ及び/又はコンピュータ可読ストレージ媒体などのような複数の構造を追加的に指し得る。本明細書で参照されるように、「メモリ」は別途規定しない限り任意のタイプのコンピュータ可読ストレージ媒体を含み得る。コンピュータ可読ストレージ媒体は少なくとも1つのプロセッサによる実行のための命令(プロセッサに本明細書内の実施形態に整合する工程又は段階を行わせるための命令を含む)を格納し得る。加えて、1つ又は複数のコンピュータ可読ストレージ媒体はコンピュータ実施方法を実施する際に利用され得る。用語「コンピュータ可読ストレージ媒体」は、有形物品を含むが搬送波及び一時的信号を除外するものと理解されるべきである。
【0014】
[0020] 本開示の実施形態は患者のパフォーマンスステータスを予測するためのシステム及び方法を提供する。開示されたシステム及び方法のユーザは、患者の臨床経験にアクセスしたい及び/又は患者データを分析したいかもしれない任意の個人を包含し得る。したがって、本開示を通じて、本開示システム及び方法の「ユーザ」への言及は医師、ヘルスケア機関における品質保証部及び/又は患者などの任意の個人を包含し得る。腫瘍又は癌療法が本開示を通じて参照されるが、これらは一例として提供されるに過ぎず、そして開示されるシステム及び方法は様々な他の病気及び/又は治療に適用し得るということが理解される。
【0015】
[0021] 図1は以下に詳細に説明される本開示に整合する実施形態を実施するための例示的システム環境100を示す。図1に示すように、システム環境100はいくつかの部品を含む。これらの部品の数及び配置は例示的でありそして例示のために提供されるということが本開示から理解されることになる。他の配置及び他の数の部品が本開示の教示及び実施形態から逸脱することなく使用され得る。
【0016】
[0022] 図1に示すように、例示的システム環境100はシステム130を含む。システム130は、ネットワーク上のエンティティから情報を受信し、この情報を処理し、格納し、そしてネットワーク上の他のエンティティへ表示/送信するように構成された1つ又は複数のサーバシステム、データベース及び/又は計算システムを含み得る。したがって、いくつかの実施形態では、ネットワークは、クラウド共有、格納及び/又は計算を容易にし得る。一実施形態では、システム130は、図1のシステム130を表す点線により囲まれた領域内に示される処理エンジン140及び1つ又は複数のデータベース150を含み得る。処理エンジン140は、1つ又は複数の一般的プロセッサ(例えば中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)など)及び/又は1つ又は複数の特殊プロセッサ(例えば特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)など)などの少なくとも1つの処理装置を含み得る。
【0017】
[0023] 一実施形態では、システム130は、1つ又は複数のデータソース110及びクライエント装置160などの様々な他の部品から及び/又はそれへ患者医療データを受信及び/又は送信し得る。医療データは、それぞれが患者に関連する1つ又は複数の医療記録内に格納され得る。具体的には、システム130は、データソース110を含む様々なデータソースからネットワーク120(例えばインターネット、イントラネット、WAN、LAN、セルラーネットワーク、ブルートゥースなど)上で送信されるデータを受信及び格納し、受信されたデータを処理し、そしてこの処理に基づくデータ及び結果をクライエント装置160へ送信するように構成され得る。
【0018】
[0024] システム環境100の様々な部品は、メモリ、中央処理ユニット(CPU)及び/又はユーザインターフェースを含むハードウェア、ソフトウェア及び/又はファームウェアのアセンブリを含み得る。メモリは、フロッピーディスク、ハードディスク又は磁気テープを含む磁気ストレージ;ソリッドステートディスク(SSD)又はフラッシュメモリなどの半導体ストレージ;光ディスクストレージ;又は磁気光学ディスクストレージなどの物理的ストレージ媒体で具現化される任意のタイプのRAM又はROMを含み得る。CPUは、メモリ内に格納された一組のプログラム可能命令又はソフトウェアに従ってデータを処理するための1つ又は複数のプロセッサを含み得る。各プロセッサの機能は、単一専用プロセッサにより又は複数のプロセッサにより提供され得る。さらに、プロセッサは、限定しないがデジタルシグナルプロセッサ(DSP)ハードウェア、又はソフトウェアを実行することができる任意の他のハードウェアを含み得る。任意選択的ユーザインターフェースはディスプレイモニタ、キーボード及び/又はマウスなどの任意のタイプ又は組み合わせの入力/出力装置を含み得る。
【0019】
[0025] システム環境100内で送信及び/又は交換されるデータはデータインターフェース上で発生し得る。本明細書で使用されるように、データインターフェースは、システム環境100の2つ以上の部品がデータを交換する任意の境界を含み得る。例えば、環境100は、ソフトウェア、ハードウェア、データベース、装置、人又は前述の任意の組み合わせの間でデータを交換し得る。さらに、ソフトウェア、プロセッサ、データストレージ装置及びネットワークの任意の好適な構成がシステム環境100の部品及び関連実施形態の特徴を実現するために選択され得るということが理解されることになる。
【0020】
[0026] 以下にさらに説明するように、システム130はネットワーク120内のデータソース110又は他のソースから患者医療記録を受信するように構成され得る。データソース110は患者の医療データの様々なソースを含み得る。例えば、データソース110は、患者の医療提供者(医師、看護婦、専門家、コンサルタント、病院、診療所など)を含み得る。データソース110はまた、放射線学又は他の撮像研究所、血液学研究所、病理学研究所などの研究所を含み得る。データソース110はまた、保険会社又は患者データの任意の他のソースを含み得る。システム130は、患者に関するデータを予測するために1つ又は複数のモデルを開発するように構成され得る。例えば、システム130は、トレーニングデータに基づきモデルを開発するために機械学習技術を使用し得る。システム130は、例えば生存率スコアと患者の治療又は福利に関係する他のパフォーマンスステータス指標とを含む予後結果を生成するために1つ又は複数のモデルを、受信された医療結果へ適用し得る。
【0021】
[0027] システム130はさらに、ネットワーク120上の1つ又は複数のクライエント装置160と通信し得る。例えば、システム130はデータソース110からのデータの分析に基づく予後結果をクライエント装置160へ提供し得る。クライエント装置160は、ネットワーク120上のデータを受信又は送信することができる任意のエンティティ又は装置を含み得る。例えば、クライエント装置160は、サーバ又はデスクトップ又はラップトップコンピュータなどの計算装置を含み得る。クライエント装置160はまた、モバイル装置、タブレット、ウェアラブル装置(すなわちスマートウオッチ、移植可能装置、フィットネス追跡器など)、仮想マシン、IoT装置などの他の装置又は他の様々な技術を含み得る。いくつかの実施形態では、クライエント装置160は、ネットワーク120上の患者に関する情報の照会(予後スコア、患者医療記録又は患者に関する様々な他の情報の照会など)をシステム130へ送信し得る。
【0022】
[0028] 図2は患者の例示的医療記録200を示す。医療記録200は、上述のようにデータソース110から受信され、そしてシステム130により処理され得る。データソース110(又は他のどこか)から受信される記録は図2に示すように構造化データ210及び非構造化データ220の両方を含み得る。構造化データ210は、患者に関する定量化可能又は分類可能データ、例えば性別、年齢、人種、体重、バイタルサイン、研究所結果、診断の日、診断タイプ、病期(例えば課金コード)、療法タイミング、行われる手順、訪問日、診療タイプ、保険業者及び保険開始日、投薬指示、投薬管理、又は患者に関する任意の他の測定可能データを含み得る。非構造化データは、医師のノート又は患者の研究所報告など定量化可能でない又は容易に分類されない患者に関する情報を含み得る。非構造化データ220は、治療計画に関する医師の記述、何が訪問時に発生したかを記述するノート、患者の具合に関する記述、放射線学的報告、病理報告などの情報を含み得る。いくつかの実施形態では、非構造化データは抽象化処理により捕捉され得るが、構造化データは、ヘルスケア専門家により入力され得る、又はいくつかのアルゴリズムを使用して計算され得る。
【0023】
[0029] データソース110から受信されるデータでは、各患者は、1又は複数の医療従事者により又は患者により生成される1つ又は複数の記録により表され得る。例えば、患者に関連する医者、患者に関連する看護婦、患者に関連する理学療法士などがそれぞれ患者の医療記録を生成し得る。いくつかの実施形態では、1つ又は複数の記録は、同じデータベース内で照合及び/又は同じデータベース内に格納され得る。他の実施形態では、1つ又は複数の記録は複数のデータベースにわたって分散され得る。いくつかの実施形態では、これらの記録は複数の電子データ表現で格納及び/又は提供され得る。例えば、患者記録は、テキストファイル、ポータブル文書フォーマット(PDF:portable document format)ファイル、拡張可能マークアップ言語(XML:extensible markup language)ファイルなどの1つ又は複数の電子ファイルとして表現され得る。文書がPDFファイル、画像、又はテキスト無しの他のファイルとして格納されれば、電子データ表現はまた、光学式文字認識処理から導出される文書に関連するテキストを含み得る。
【0024】
[0030] 図3は本開示に整合する患者の例示的予後結果300を示す。例えば、予後結果300は、データソース110から受信される患者医療データへモデルを適用することによりシステム130により生成され得る。予後結果300は医療記録200に基づく患者に関する多種多様な予測を含み得る。例えば、図3に示すように、予後結果300は計算された生存率スコアを含み得る。このスコアは機械学習技術に基づくので、計算されたスコアは、ECOGスコアより全体的生存率のより良い予測として役立ち得る。いくつかの実施形態では、生存率スコアは、患者が生き延びることが予想される期間の時間推定を含み得る。例えば、生存率スコアは、図3に示すように何か月にわたる患者の生存率を予測し得る。任意の他の適切な時間増分又は時間間隔もまた使用され得る。いくつかの実施形態では、時間推定は、患者の治療又は療法の開始日など特定日に対するものであり得る。生存率スコアはまた、スケール(例えば1~10又は1~5の範囲)上で又はパーセントとして表され得る。様々な形式又はフォーマットが上に説明されたが、開示される実施形態は生存率スコアの任意特定形式又はフォーマットに限定されないということが理解される。
【0025】
[0031] さらに、生存率スコアが一例として提供されたが、様々な他のパフォーマンスステータス指標が予後結果300に含まれ得る。本明細書で使用されるように、患者の「パフォーマンスステータス」は患者の現在の健康又は福利の任意の表示を含み得る。パフォーマンスステータスは、患者の生存率スコアに限定されなく、そして患者の状態の他の指標を含み得る。一例として、パフォーマンスステータスは患者の感情的又は精神的健康に関係し得る。例えば、医師により書かれたノートの分析に基づき、システム130は、患者が治療に応じた前向きな見通し又は後向きな見通しを有するか、患者が鬱の兆しを示すかどうか、患者が、いくつかの精神的副作用、又は患者の情緒面の健康に関する任意の他の情報を呈示するかを判断し得る。このような情報は、適切な処理を判断するために、患者が臨床試験に含まれるべきかどうかなどを判断するために有用であり得る。パフォーマンスステータスは、上述の生存率スコアに似たスコア(例えば数値、テキストベース等級など)として表され得る。
【0026】
[0032] 予後結果300はまた、患者の治療、患者の病気の進展、又は患者の福利全体に関連する様々な他のパフォーマンスステータス予測を含み得る。いくつかの実施形態では、システム130は、病気に起因する患者の予想改善又は悪化の時間推定を生成し得る。例えば、予後結果300は患者の回復の推定時間枠を反映し得る。他の実施形態では、予後結果300は、患者の悪化の時間(例えば癌治療患者が病気の進行ステージに到達するのにかかる時間などの)推定を含み得る。これらの時間推定は、患者の特定治療又は療法の開始日又は患者のケアに関係する他の日に対するものであり得る。パフォーマンスステータス予測は、回復の予測尤度、特定処理に対する予測反応性、特定病気に対する予測感受性、予測複雑性若しくは発生し得る他の事象、又は患者の福利に関する様々な他の予測などの患者に関する他の予測を含み得る。
【0027】
[0033] 予後結果300はまた、患者を臨床試験に含むことの適合性を含み得る。例えば、システム130は、生成された生存率スコア、又は機械学習過程において使用される他の要因などの生成されたパフォーマンスステータス表示に基づき1つ又は複数の臨床試験の患者の適合性を判断し得る。臨床試験は特定の療法又は技術を使用して患者を治療することに関与し得る。例えば、これは革新的癌療法又は実験的薬物治療を含み得る。患者の適合性出力は図3に示すように2値「推奨」又は「非推奨」フォーマットで予後結果内に表され得る。代替的に、患者の適合性は、スケールで(例えば1~10)、パーセントとして、一連の等級(例えば「高度に好適」、「適度に好適」など)として又は様々な他のフォーマットでなど累進的フォーマットで表され得る。いくつかの実施形態では、患者が臨床試験に含まれる適合性はシステム130により生成される生存率スコアに基づき得る。例えばより長い予測生存率を有する患者は臨床試験に含まれる可能性がより高いかもしれない。
【0028】
[0034] 予後結果300はまた、未治療患者の病気又は特定療法に応じた患者の病気のいずれかの予測反応を含み得る。例えば、癌患者を治療する際、システム130は、所定期間にわたってどれだけ患者内の腫瘍が縮小又は成長することが予測されるかを示すサイズ推定を生成し得る。いくつかの実施形態では、腫瘍のサイズの予測は療法の開始日後の所定時間に基づき判断され得る。腫瘍反応推定は、図3に示すようにサイズ(重量による、容積による、又は測定の他のある単位による、のいずれか)のパーセント増加又はパーセント低下として表され得る。予測腫瘍反応はまた、重量により、容積により、又は長さ(例えば直径、外周など)としてなど絶対項で表現され得る。
【0029】
[0035] 図4は本開示に整合する実施形態を実施するための例示的機械学習システム400を示す。機械学習システム400はシステム130(図1)の一部として実現され得る。例えば、機械学習システム400は処理エンジン140の一部品又は処理であり得る。開示された実施形態によると、機械学習システム400はトレーニング済みモデル(例えば監視(supervised)機械学習システム)を、患者に関連する一組のトレーニングデータに基づき生成し得、そして生存率スコア又は患者に関係する多くの他の予測を生成するためにこのモデルを使用し得る。例えば、図4に示すように、機械学習システム400は予後結果300を生成するためのモデル430を生成し得る。機械学習システム400は、例えばトレーニングアルゴリズム420を使用することにより、トレーニング処理を通じてモデル430を開発し得る。
【0030】
[0036] モデル430のトレーニングは、モデルを開発するためにトレーニングアルゴリズム420へ入力され得るトレーニングデータセット410の使用に関与し得る。トレーニングデータ410は、モデルにより推定される様々な結果(例えば患者生存率、患者パフォーマンスステータス、腫瘍反応、病気進展時間枠、臨床試験の適合性など)が既に知られている複数の患者医療記録(例えば図4に示すように「記録1」、「記録2」、「記録3」など)を含み得る。いくつかの実施形態では、トレーニングデータ410はまた、トレーニング処理を容易にするために、トレーニングアルゴリズム420への入力に先立ってクリーンにされ得る、条件付けられ得る及び/又は操作され得る。機械学習システム400は、特徴と特定患者結果との間の相関を判断するために1つ又は複数の特徴(又は特徴ベクトル)を記録から抽出し得る。これらの特徴は上述の医療記録内の構造化及び非構造化データから抽出され得る。例えば、トレーニング処理は、患者の体重、性別、記録されたバイタルサイン、診断コードなどのデータと患者の関連生存率又は他の結果とを相関付け得る。
【0031】
[0037] 非構造化データに関して、様々な技術(例えば自然言語処理技術)が、特徴ベクトルをモデルへ提供するために使用され得る。患者の医療記録の文書のいくつか又は一部は電子的に利用可能であり得るが、記録内のタイプされた、手書きされた、又は印刷されたテキストは機械符号化テキストへ変換され得る(例えば光学式文字認識(OCR)を介し)。電子テキストが、特定結果に関連するいくつかのキーワード又は語句に関し検索され得る。いくつかの実施形態では、識別されたワード又はテキストの近傍のテキストのスニペット(snippet)がワード又は語句の文脈に関する追加情報を収集するために試験され得る。例えば、用語「転移性」を検索する際、語句「転移性活動の証拠無し」は「ステージIV;転移性」とは著しく異なる意味を伝え得る。興味あるワード又は語句を囲むテキストのスニペットを分析することにより、1つ又は複数の特徴が、抽出され得、トレーニング済み選択モデルへの入力として提供され得る特徴ベクトルを形成する。非構造化文書からのこれらの特徴は、患者の医療記録又は他の利用可能データソース(例えばクレームデータ、患者報告データ)に関連する構造化データからの特徴と組み合わせられ得る。
【0032】
[0038] 所望結果に関する情報(例えば患者の生存率)と共に、抽出された特徴の一部はトレーニングデータ410として格納され得る。次に、トレーニングデータ410(又はその一部)は、モデルをトレーニングするためにトレーニングアルゴリズム420によって配置され得る。多くのこのようなインスタンスへ晒されることにより、モデル430は、予想結果と同一な又はそれに近い出力を「学習」し、提供し得る。
【0033】
[0039] 機械学習システム400はモデル430を開発するために任意の好適な機械学習アルゴリズムを採用し得る。例えば、トレーニングアルゴリズム420は、抽出された特徴を特定患者結果へ関連付ける1つ又は複数の機能(又は規則)を生成するロジスティック回帰を含み得る。追加的に又はその代わりに、トレーニングアルゴリズム420は、特徴の入力層が1つ又は複数の隠れ層に挿通され次に(関連確率を有する)患者結果の出力層に挿通されるように1つ又は複数のノードの重み付けを調整する1つ又は複数のニューラルネットワークを含み得る。他のタイプの機械学習技術がまた、線形回復モデル、lasso回帰分析、ランダムフォレストモデル、K-Nearest Neighbor(KNN)モデル、K-平均モデル、決定木、コックス比例ハザード(cox proportional hazards)回帰モデル、Na「i」ve Bayesモデル、サポートベクトルマシン(SVM:Support Vector Machines)モデル、又はgradient boostingアルゴリズムなどのロジスティック回帰技術と組み合わせて又はこれとは別にのいずれかで使用され得る。これらのモデルはまた、手動トレーニングが必要とされない非監視(unsupervised)機械学習過程又は強化機械学習過程を使用して開発され得る。
【0034】
[0040] トレーニングデータ410の残り部分は、トレーニング済みモデル430を試験するとともにそのパフォーマンスを評価するために使用され得る。例えば、トレーニングデータセット410の残りにおいて個人毎に、特徴ベクトルが、当該患者に関連する医療記録から抽出され得る。これらの特徴ベクトルはモデル430へ提供され得、当該個人の出力は当該個人の既知の結果(例えば当該個人の実際の生存時間)と比較され得る。モデル430の出力と、トレーニングデータセット410内の任意の個人の既知の結果との間の乖離は、図4に示すようにパフォーマンス測定結果460を生成するために使用され得る。パフォーマンス測定結果460は、予後結果450と既知の患者結果との間の乖離を低減するためにモデル430を更新する(例えば、モデルを再トレーニングする)ために使用され得る。例えば、モデルの1つ又は複数の関数が追加、除去、又は修正され得る(例えば、二次関数が三次関数へ修正され得る、指数関数が多項式関数へ修正され得る、等々)。したがって、乖離は、モデル430へ渡された特徴がどのように構築されたか又はどのタイプのモデルが採用されたかを修正するための決定を通知するために使用され得る。代替案として、いくつかの実施形態では、回帰の1つ又は複数の重み付け(又は、モデルがニューラルネットワークを含めばノードの1つ又は複数の重み付け)が乖離を低減するために調整され得る。乖離のレベルが所望限界内(例えば10%未満、5%未満)である場合、1つ又は複数のモデル430は、「患者結果が未知である」データセットに対する操作に好適であると見做され得る。
【0035】
[0041] 「乖離」の観点で上に説明されたが、1つ又は複数の損失関数もまた、モデルの精度を測定するために使用され得る。例えば、二次損失関数、ヒンジ損失関数、ロジスティック損失関数、クロスエントロピー損失関数又は任意の他の損失関数が使用され得る。このような実施形態では、モデルに対する更新は1つ又は複数の損失関数を低減する(又は、少なくとも局所的に最小化すらする)ように構成され得る。
【0036】
[0042] モデル430が構築されると、医療記録440などの新しいデータがモデル430へ入力され得る。医療記録440は上述の医療記録200に対応し得る。例えば、医療記録440は、各患者が1つ又は複数の医療記録に関連付けられるように複数の患者に関連する構造化及び非構造化データを含み得る。モデル430は、予後結果450などのスコア及び/又は予測を生成するために特徴を医療記録440から抽出し得る。予後結果450は予後結果300に関して上述したように、生存率スコアだけでなく他のスコア又は予測も含み得る。
【0037】
[0043] いくつかの実施形態では、非構造化データ210及び構造化データ220は1つ又は複数の自然言語処理アルゴリズムを使用して分析され得る。本明細書で使用されるように、「自然言語処理」は、書かれた自然言語情報を分析及び処理するための任意の技術又は処理を指し得る。自然言語情報は、書かれた又は話された言語を通じて人により生成されるテキスト又は音声データを含み得る。例えば、自然言語情報は、上述のように分析され得る非構造化データとして医療記録に含まれ得る。自然言語処理アルゴリズムは自然言語情報を分析するための任意のコンピュータベース技術を含み得る。例えば、自然言語処理アルゴリズムは、レマタイゼーション(lemmatization)、品詞タグ付け、文章解読(sentence breaking)、ワードステミング(word stemming)、語彙意味論、機械翻訳、名前エンティティ認識(NER:name entity recognition)、光学式文字認識(OCR:optical character recognition)、又は非構造化データ若しくは構造化データから情報を抽出することを容易にし得る様々な他の技術などの技術を含み得る。これらのアルゴリズムは、単独で、又は上述の機械学習技術と組み合わせて使用され得る。例えば、自然言語処理アルゴリズムは上述の非構造化データの条件付けの一部として使用され得る。
【0038】
[0044] 図5は患者のパフォーマンスステータスを生成する例示的方法500を示す。方法500は例えばシステム100(図1に示す)の処理エンジン140の少なくとも1つのプロセッサにより実施され得る。
【0039】
[0045] 工程510では、方法500は患者の医療記録を格納するデータベースにアクセスすることを含み得る。医療記録は患者に関連する構造化情報及び非構造化情報の少なくとも1つを含み得る。例えば、処理エンジン140は、データソース110又は他の様々なソースからネットワーク120を介しデータベースにアクセスし得る。上述のように、データソース110は患者医療データの様々なソースを含み得、例えば、患者の医療記録は医療提供者、研究所又は保険会社から受信され得る。代替的に又は加えて、処理エンジンはデータベース150などのローカルデータベースにアクセスし得る。
【0040】
[0046] 処理エンジン140は、上述のように、医療記録200に整合する1つ又は複数の医療記録にアクセスし得る。医療記録は1つ又は複数の電子ファイル(テキストファイル、画像ファイル、PDFファイル、XLMファイル、YAMLファイルなど)を含み得る。医療記録は、性別、生年月日、人種、体重、研究所結果、バイタルサイン、診断日、訪問日、投薬指示、診断コード、手順コード、薬コード、以前の療法、又は投薬管理を含み得る構造化情報、及びヘルスケア提供者により書かれるテキスト、放射線学的報告、又は病理学報告を含み得る非構造化情報を含み得る。各医療記録は特定患者に関連付けられ得、そして、いくつかの実施形態では、複数の医療記録が特定患者に関連付けられ得る。医療記録は、医療機関からのデータに限定され得なく、そして、クレームデータ(例えば保険会社からの)、患者報告データ、又は患者の治療若しくは福利に関連する他の情報などの他の関連形式のデータを含み得る。開示された実施形態に整合して、医療記録は患者ECOGスコアを欠き得る。いくつかの実施形態では、医療記録は構造化ECOGスコアを欠き得る。例えば、ECOGスコアは構造化情報内に含まれないかもしれないが、非構造化情報に含まれ得る。他の実施形態では、医療記録は構造化情報及び非構造化情報の両方内にECOGスコアを欠き得る。
【0041】
[0047] 工程520では、方法500は、患者に関連する構造化情報及び非構造化情報の少なくとも1つを分析することを含み得る。いくつかの実施形態では、患者に関連する構造化情報及び非構造化情報の少なくとも1つの分析並びに患者の予測パフォーマンスステータスの生成はトレーニング済み機械学習モデルにより行われ得る。例えば、処理エンジン140は上述のように、患者の医療記録を分析するために機械学習技術を採用し得る。工程520は図4に関連して述べたように、機械学習過程を通じて開発された1つ又は複数のトレーニング済み機械学習モデルを使用し得る。例えば、トレーニング済みモデルはロジスティック回帰モデル、ニューラルネットワーク、コックス比例ハザード回帰、lasso回帰分析ネットワーク又はランダムフォレストモデルを含み得る。同様に、自然言語処理アルゴリズムは、ロジスティック回帰、ニューラルネットワーク、コックス比例ハザード回帰、lasso回帰分析ネットワーク又はランダムフォレストアルゴリズムのうちの1つ又は複数を含み得る。いくつかの実施形態では、モデルはまた、手動トレーニングが必要とされない非監視学習過程又は強化機械学習過程を使用して開発され得る。他の実施形態では、患者に関連する構造化情報及び非構造化情報の少なくとも1つの分析並びに患者の予測パフォーマンスステータスの生成は自然言語処理アルゴリズムにより行われ得る。例えば、工程520は、腫瘍反応、処方治療に対する反応、患者の状態の改善又は悪化、又は患者のパフォーマンスステータスを示し得る任意の他のテキストベース情報を示す情報を抽出するために構造化データ又は非構造化データに対し自然言語処理アルゴリズムを使用することを含み得る。
【0042】
[0048] 工程520は、医療記録の分析を容易にするために追加副工程(記録内の情報を条件付ける又は変更することなど)を含み得る。処理エンジン140は構造化情報又は非構造化情報を解釈するために様々な技術を採用し得る。記録内のタイプされた、手書きされた、又は印刷されたテキストは機械符号化テキストへ変換され得る(例えば光学式文字認識(OCR)を介し)。上述のように、電子テキストが、特定結果に関連する及び識別されたワードの近傍のテキストのスニペットに関連するいくつかのキーワード若しくは語句に関し検索され得る、又はテキストが、ワード又は語句の文脈に関する追加情報を収集するために試験され得る。処理エンジン140はまた、上述のように医療記録から1つ又は複数の特徴ベクトルを抽出し得る。処理エンジン140は医療記録(又は抽出された特徴)をトレーニング済み機械学習モデルへ入力し得る。
【0043】
[0049] 工程530では、方法500は分析に基づき患者のパフォーマンスステータス予測を生成することを含み得る。論述したように、この分析は構造化ECOGスコア無しに行われ得る。いくつかの実施形態では、パフォーマンスステータス予測は患者の生存率予測を含み得る。例えば、処理エンジン140は、図3に関して上に述べたように生存率スコアを生成し得る。生存率予測は患者の生存の推定期間を示し得る。例えば、生存率予測は、患者が生き延びることが予想される期間の時間推定を含み得る。いくつかの実施形態では、患者が生き延びることが予想される期間の時間推定は薬の投与又は特定癌治療の開始などの療法の開始日に対するものであり得る。生存率スコアはまた様々な他のフォーマットで提示され得る。予測パフォーマンスステータスは、生存率スコアに限定されなく、患者の状態の他の指標(患者が受けている治療の現在のステージ、患者の現在の健康又は状態の評価、特定治療に対する患者の反応、ある病気に対する患者の感受性、患者の感情的又は精神的健康、又は様々な他の状態指標など)を含み得る。これらの予測パフォーマンスステータスは、上に詳細に説明された生存率スコアと同様なスコアを割り当てられ得る。
【0044】
[0050] いくつかの実施形態では、パフォーマンスステータス予測は、工程520と同様に、1つ又は複数の機械学習モデルを使用して工程530において生成され得る。例えば、処理エンジン140は、工程510においてアクセスされた医療記録に関連するデータをトレーニング済み機械学習モデル430へ入力し得る。モデルは、医療記録に関連する患者のパフォーマンスステータスを含む一組の予後結果を出力し得る。いくつかの例では、予後結果は上に論述したような生存率スコア又は他のパフォーマンスステータススコアを含み得る。
【0045】
[0051] 工程540では、方法500は患者の予測パフォーマンスステータスを示す出力を提供することを含み得る。例えば、システム130は予測パフォーマンスステータスをネットワーク120内の別の装置又はエンティティへ送信し得る。いくつかの実施形態では、システム130は予測パフォーマンスステータス(例えば生存率スコア)をコンピュータ、サーバ又はモバイル装置などのクライエント装置へ送信し得る。代替的に又は追加的に、システム130は予測をデータソース110(例えば医療記録を提供する医療提供者)へ送信し得る。処理エンジン140はまた、報告、又はパフォーマンスステータス予測を含む情報の他の編纂物を生成し得る。パフォーマンスステータス予測はまた、ローカルに(例えばシステム130に関連するディスプレイ上に)提示され得る。例えば、生存率スコア(又はパフォーマンスの他の指標)が、数値として、テキスト(例えば、「患者は2年間生き延びると予想される」など期間の記述)として、タイムライン又は他の図的表現などのグラフィックとして、テキストとグラフィックスとの組み合わせとして、又は情報を提示する任意の他のやり方で表示され得る。
【0046】
[0052] 方法500はさらに追加工程を含み得る。例えば、追加の結果又は予測が、予測パフォーマンスステータスに加えて又はその代わりに生成され得る。いくつかの実施形態では、方法500はさらに、患者の予測パフォーマンスステータスを示す少なくとも出力に基づき、患者を臨床試験に含むことの適合性を判断することを含み得る。上述のように、パフォーマンスステータスは、臨床試験に含むことの患者の適合性を評価する際に有用であり得る。例えば、より長く生き延びると予想される患者(生存率予測により判断される)は臨床試験に含まれる可能性がより高いかもしれない。患者の状態、患者の感情的若しくは精神的状態、又は他の状態指標などの他のパフォーマンスステータス指標又はスコアが同様に、臨床試験に含まれる適合性を判断するのに役立ち得る。いくつかの実施形態では、例えば、臨床試験は癌療法などの療法を使用して患者を治療することに関与し得る。方法500はまた、工程540の出力と同様な、患者を臨床試験に含むことの適合性を示す出力を提供することを含み得る。
【0047】
[0053] 他の予測もまた、方法500の一部として、医療記録に含まれる情報に基づき生成され得る。例えば、方法500はさらに、上述のように、患者に関連する構造化情報及び非構造化情報の少なくとも1つの分析に基づき、病気に起因する患者の予想改善又は悪化の時間推定を生成することを含み得る。この時間推定は患者の療法の開始日などの特定日に対するものであり得る。いくつかの実施形態では、方法500はさらに、患者に関連する構造化情報及び非構造化情報の少なくとも1つの分析に基づき、療法の開始日後の所定期間にわたって、患者内の腫瘍がどれだけ縮小又は成長すると予測されるかを示すサイズ推定を生成することを含み得る。
【0048】
[0054] 図6はトレーニング済み機械学習モデルの精度レベルを判断する例示的方法600を示す。方法600は例えば、機械学習モデルのトレーニングの一部として処理エンジン140の少なくとも1つのプロセッサにより実施され得る。判断された精度レベルは、モデルを修正(例えば再トレーニング)して精度を改善するために使用され得る。
【0049】
[0055] 工程610では、方法600は複数の患者の医療記録にアクセスすることを含み得る。医療記録は、例えばデータベース150などの医療記録を格納するデータベースからアクセスされ得る。いくつかの実施形態では、医療記録は例えばデータソース110からネットワークを介しアクセスされ得る。他の実施形態では、医療記録は、上述のように、機械学習モデルをトレーニング/試験するためのトレーニングデータセットの一部として提供され得る。医療記録は、一組の患者に関連付けられ得、そして上述のように構造化及び非構造化情報を含み得る。医療記録はまた患者ECOGスコア(例えば構造化及び/又は非構造化ECOGスコア)を欠き得る。
【0050】
[0056] 工程620では、方法600は、工程610においてアクセスされた医療記録の第1の下位集合を選択することを含み得る。例えば、医療記録に関連する患者の下位集合が識別され得、そして患者の下位集合に関連するそれらの記録が選択され得る。工程630では、方法600は、第1の下位集合内の患者の予測パフォーマンスステータスを生成するために医療記録の第1の下位集合を分析することを含み得る。いくつかの実施形態では、予測パフォーマンスステータスは、上述のように患者の予測生存率を含み得る。医療記録の分析は、方法500を参照して上に説明した工程520、530に整合し得る。例えば、医療記録の下位集合は、構造化及び非構造化情報から情報を識別及び/又は分離しそして特徴又は特徴ベクトルを抽出するために分析され得る。次に、医療記録(又は特徴又は特徴ベクトル)は、第1の下位集合内の患者の予測パフォーマンスステータススコアを出力し得るトレーニング済み機械学習モデルへ入力され得る。方法500と同様に、パフォーマンスステータス予測は、患者の生存率の推定時間を含む様々なフォーマットで表され得る。
【0051】
[0057] 工程640では、方法600は、第1の下位集合を含まない医療記録の第2の下位集合を選択することを含み得る。例えば、第2の下位集合は、第1の下位集合に含まれる医療記録のいずれも第2の下位集合内に含まれないように選択され得る。工程650では、方法600は、第2の下位集合内の患者の予測パフォーマンスステータスを生成するために医療記録の第2の下位集合を分析することを含み得る。医療記録の第2の下位集合は、工程630における第1の下位集合と同様に、パフォーマンスステータススコア又は他の指標を生成するために機械学習モデルを介し分析され得る。
【0052】
[0058] 工程660では、方法600は、トレーニング済み機械学習モデルの精度レベルを第1の下位集合内の患者の予測パフォーマンスステータス及び第2の下位集合内の患者の予測パフォーマンスステータスに基づき判断することを含み得る。工程660は、第1及び第2の下位集合の予測パフォーマンスステータスと医療記録の下位集合に関連する患者の既知のパフォーマンスステータスとを比較することを含み得る。例えば、工程610においてアクセスされた医療記録がトレーニング又は試験データセットの一部であれば、患者の実際のパフォーマンスステータスは既知であり得る。方法600を行うシステムは、トレーニング済み機械学習モデルの精度を、予測された患者パフォーマンスステータス値と既知の患者パフォーマンスステータス値との間の乖離に基づき判断し得る。1つ又は複数の損失関数がまた、例えば二次損失関数、ヒンジ損失関数、ロジスティック損失関数、クロスエントロピー損失関数、又は任意の他の損失関数を使用することによりモデルの精度を測定するために使用され得る。
【0053】
[0059] トレーニング済み機械学習モデルの判断された精度レベルはモデルを改善するために使用され得る。例えば、判断された精度レベルに基づき、モデルの1つ又は複数の関数又は変数が上述のように追加、除去、又は修正され得る。判断された精度レベルは、モデルへ渡された特徴がどのように構築されたか又はどのタイプのモデルが採用されたかを修正するための決定を通知するために使用され得る。いくつかの実施形態では、回帰の1つ又は複数の重み付け(又は、モデルがニューラルネットワークを含めばノードの1つ又は複数の重み付け)は乖離を低減するために調整され得る。乖離のレベルが所望限界内(例えば10%未満、5%未満)である場合、1つ又は複数のモデルは、例えば上述の方法500を使用することにより、「患者結果が未知である」データセットに対する操作に好適であると見做され得る。
【0054】
[0060] 上に説明された方法は、医療記録200などの医療記録が構造化スコア(ECOGスコアなど)を含まない場合に特に有用であり得る。例えば、構造化データ210は、ECOGスコア又は他の同様なタイプのスコアを指定するフィールドを含まないかもしれない。しかし、いくつかの実施形態では、医療記録200は、構造化ECOGスコアを含まないかもしれないが、非構造化データ210内にECOGスコアを含み得る。例えば、医師又は他の医療専門家は、患者が1のECOGスコアを有するということを示し得る「ECOG 1」又は「1の患者ステータス」などの手書きのノートを含み得る。開示されたシステムはさらに、非構造化患者医療データからECOGスコアなどの患者ステータススコアを抽出するように構成され得る。抽出されたECOGスコアデータは、患者のパフォーマンスステータスを単独で又は上述の技術と組み合わせて評価するために使用され得る。いくつかの実施形態では、抽出されたECOGスコアは、欠落ECOGスコアデータを構造化データ210内に埋めるために使用され得る。
【0055】
[0061] ECOGスコアは様々な技術を使用して非構造化データ220から抽出され得る。例えば、単純な検索照会が、ECOGスコアを識別するために非構造化データに対し行われ得る。いくつかの実施形態では、上述のスニペットと同様なスニペット手法が使用され得る。例えば、システム130は、ECOGスコアを示し得る数(例えば0~5の間の数)のうちのある数のワード内のキーワード項を含む文書又は文書の一部を検索し得る。例示として、照会は、0~5の間の数の3ワード内に「ECOG」(又は「パフォーマンスステータス」、「患者ステータス」などの他の同様な用語)を含む文書をフェッチするために行われ得る。様々な他の範囲のワード(例えば3ワードより多い又は少ないワード)が使用され得る。次に、上に説明したものを含む正規表現(又は様々な他の機械学習アルゴリズム)が、数値スコアを抽出するために検索結果へ適用され得る。次に、抽出された構造化スコアは、患者に関連するさらなる分析に使用するために表内に又は他のフォーマットで格納され得る。いくつかの実施形態では、抽出されたECOGスコアはデータベース150内に格納され得る。
【0056】
[0062] いくつかの実施形態では、ECOGスコアの抽出は患者の特定治療方針に関連し得る。本明細書で使用されるように、「治療方針」は患者を治療するための任意の周期又は処理を指し得る。例えば、治療方針は、単独薬又はいくつかの薬の組み合わせの全周期などの薬物治療法を含み得る。別の例として、治療方針は放射線療法など癌療法の全周期を含み得る。治療方針は任意の特定な形式又は療法又は治療に限定されない。システム130は、医療記録から1又は複数の患者の一連の治療方針を識別し得、そしてベースライン構造化ECOGスコアを欠く治療方針をさらに識別し得る。ECOGスコアの抽出は、ベースライン構造化ECOGスコアを欠く治療方針に関連する非構造化データに対し行われ得る。いくつかの実施形態では、非構造化情報に対し行われる検索照会は治療方針に関連する特定時間枠に限定され得る。時間枠は、特定治療方針の関連検索結果を提供する可能性が高い任意の所定量の時間であり得る。例えば、検索は、治療開始日前の一定期間(例えば2か月、30日、15日など)及び治療開始日後の一定期間(例えば2日、7日、2週間など)に限定され得る。
【0057】
[0063] 図7は本開示に整合する患者ステータススコアを判断する例示的方法700を示す流れ図である。方法700は例えばシステム100(図1に示す)の処理エンジン140の少なくとも1つのプロセッサにより実施され得る。
【0058】
[0064] 工程710では、方法700は患者の医療記録を格納するデータベースにアクセスすることを含み得る。例えば、処理エンジン140は、医療記録200を取得するためにデータソース110又は他の様々なソースからネットワーク120を介しデータベースにアクセスし得る。医療記録は患者に関連する構造化情報及び非構造化情報を含み得る。例えば、医療記録は上述のように構造化情報210及び非構造化情報220を含み得る。
【0059】
[0065] 工程720において、方法700は、患者に関連する治療方針を医療記録に基づき識別することを含み得る。上述のように、医療記録内の構造化情報は治療方針に関連する患者のステータススコアを欠き得る。ステータススコアは患者のパフォーマンスステータスの任意の指標であり得る。例えば、いくつかの実施形態では、ステータススコアは患者のECOGスコアを含み得る。
【0060】
[0066] 工程730では、方法700は、治療方針に関連する患者のステータススコアを判断するために非構造化情報を分析することを含み得る。上述のように、分析は、数のうちのある数のワード内のキーワードを含む文書又は文書の一部を識別するために検索を非構造化データに対し行うことを含み得る。いくつかの実施形態では、非構造化情報の分析並びに患者の予測パフォーマンスステータスの生成はトレーニング済み機械学習モデルにより行われ得る。例えば、キーワードは「ECOG」又は「パフォーマンスステータス」などの項を含み得る。キーワードが数0~5(又はステータススコアを表し得る任意の他の数の範囲)内のある数のワード(例えば3ワード、5ワードなど)内に出現する文書が識別され得る。線形回帰又は他のアルゴリズムが、患者ステータススコアを抽出するために検索結果に対し行われ得る。他の実施形態では、自然言語処理アルゴリズムが上述のように非構造化情報を分析するために使用され得る。いくつかの実施形態では、非構造化情報の分析は、治療方針の開始日の所定時間枠内に記録される非構造化情報に限定され得る。例えば、治療方針の開始日前の30日以内及び治療方針の開始日後の7日以内に記録される非構造化情報が分析され得る。
【0061】
[0067] 工程740では、方法700はステータススコアを示す出力を提供することを含み得る。この出力は、患者のパフォーマンスステータスの出力に関して上に説明された様々な方法のうちの任意のものを使用することにより提供され得る。例えば、システム130はステータススコアをネットワーク120内の別の装置又はエンティティへ送信し得る。いくつかの実施形態では、ステータススコアは例えばデータベース150内に格納され得る。いくつかの実施形態では、ステータススコアはベースラインECOGスコアを欠く他の治療方針のステータススコアを含む表内に格納され得る。いくつかの実施形態では、ステータススコアは、装置の画面上に表示されるユーザインターフェースの一部として表示するために出力され得る。
【0062】
[0068] これまでの説明は、例示を目的として提示された。これは、網羅的ではなく、したがって、開示された実施形態の精密な形式に限定されない。修正及び適応化は、本明細書の考察と開示された実施形態の実行とから当業者に明らかになる。加えて、開示された実施形態の態様はメモリ内に格納されるとして説明されたが、当業者は、これらの態様が例えばハードディスク又はCD ROM、又は他の形式のRAM又はROM、USB媒体、DVD、ブルーレイ、4KウルトラHDブルーレイ、又は他の光ドライブ媒体などの二次ストレージ装置などの他のタイプのコンピュータ可読媒体上にも格納され得るということを理解することになる。
【0063】
[0069] 本明細書及び開示方法に基づくコンピュータプログラムは経験を積んだ開発者のスキル範囲内である。様々なプログラム又はプログラムモジュールは、当業者に知られた技術のうちの任意のものを使用して生成され得る又は既存ソフトウェアと接続して設計され得る。例えば、プログラム部又はプログラムモジュールは、.Net Framework、.Net Compact Framework(そしてVisual Basic、Cなどの関連言語)、Java、Python、R、C++、Objective-C、HTML、HTML/AJAX組み合わせ、XML、又は包含型Javaアプレットを有するHTMLで又はこれを使用して設計され得る。
【0064】
[0070] さらに、例示的実施形態が本明細書において説明されたが、等価的要素、修正、省略、組み合わせ(例えば様々な実施形態全体にわたる態様の)、適応化、及び/又は代替形態を有するありとあらゆる実施形態の範囲は、本開示に基づき当業者により理解されるだろう。特許請求の範囲における制限は、特許請求の範囲において採用される言語に基づき広く解釈されるべきであり、そして本明細書内で又は本出願の審査中に説明された例に限定されない。これらの例は非排他的であると解釈されるべきである。さらに、本開示方法の工程は、工程を再順序付けすることにより及び/又は工程を挿入又は削除することを含む任意のやり方で修正され得る。したがって、本明細書及び例は単なる例示と考えられ得、真の範囲及び精神は以下の特許請求の範囲及びそれらの等価物の全範囲により示されるということが意図されている。
図1
図2
図3
図4
図5
図6
図7
【国際調査報告】