IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テンパス・ラボズ・インコーポレイテッドの特許一覧

特表2022-545017高次元時系列薬剤データからの教師なし学習および治療ラインの予測
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-10-24
(54)【発明の名称】高次元時系列薬剤データからの教師なし学習および治療ラインの予測
(51)【国際特許分類】
   G16H 10/00 20180101AFI20221017BHJP
   G16H 20/10 20180101ALI20221017BHJP
【FI】
G16H10/00
G16H20/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022511315
(86)(22)【出願日】2020-08-24
(85)【翻訳文提出日】2022-04-20
(86)【国際出願番号】 US2020047704
(87)【国際公開番号】W WO2021035224
(87)【国際公開日】2021-02-25
(31)【優先権主張番号】62/890,178
(32)【優先日】2019-08-22
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521288448
【氏名又は名称】テンパス・ラボズ・インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】マシュー・バーバー
(72)【発明者】
【氏名】ライアン・モーク
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA01
5L099AA21
5L099AA25
(57)【要約】
一態様において、本開示は、患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするための方法を提供する。この方法は、複数のデジタル記録から患者の医療記録を識別することと、医療記録のサブセットから、患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、薬剤の投与が時間間隔内に収まるときに1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、1つまたは複数の治療のうちの1つの治療がその時間間隔から外れているが、延長期間内にあるときにそれぞれの治療間隔の時間間隔を精緻化することと、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することと、最高の最尤推定を有する潜在的治療ラインを治療ラインとしてラベル付けすることとを含む。
【特許請求の範囲】
【請求項1】
患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするための方法であって、
複数のデジタル記録から前記患者の医療記録を識別するステップであって、前記医療記録のサブセットは、前記患者の病状診断後の1つまたは複数の治療に関する前記患者の医療履歴を反映する、ステップと、
医療記録の前記サブセットから、前記患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成するステップと、
前記薬剤の前記投与が前記時間間隔内に収まるときに前記1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けるステップと、
それぞれの治療間隔の前記時間間隔を、前記1つまたは複数の治療のうちの1つ治療が前記時間間隔から外れているが延長期間内にあるときに精緻化することであって、前記精緻化された時間間隔において、間隔優先事象が起こらない、精緻化するステップと、
教師なし人工知能エンジンを介して、前記複数の治療間隔から1つまたは複数の潜在的治療ラインを識別するステップであって、各潜在的治療ラインは、前記複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、ステップと、
前記教師なし人工知能エンジンを介して、最高の最尤推定を有する前記潜在的治療ラインを前記治療ラインとしてラベル付けするステップとを含む方法。
【請求項2】
前記教師なし人工知能エンジンを介して、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の前記潜在的治療ラインの前記それぞれの最高の最尤推定を有する前記潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けするステップをさらに含む請求項1に記載の方法。
【請求項3】
前記教師なし人工知能エンジンを介して、複数の患者に対するそれぞれの増分的に番号を振られた治療ラインをラベル付けするステップと、
患者の複数のコホートを識別するステップと、
患者の前記複数のコホートの各々に対する前記増分的に番号を振られた治療ラインを報告するステップとをさらに含む請求項2に記載の方法。
【請求項4】
標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告するステップをさらに含む請求項3に記載の方法。
【請求項5】
少なくとも一部は各治療ラインの前記それぞれの時間間隔に基づき、経時的な治療ラインの変更を報告するステップをさらに含む請求項3に記載の方法。
【請求項6】
患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告するステップをさらに含み、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する、請求項3に記載の方法。
【請求項7】
前記第1のコホートと前記第2のコホートとの間の無増悪生存率に関する分析を報告するステップをさらに含む請求項6に記載の方法。
【請求項8】
共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成するステップと、
共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成するステップと、
前記第1のコホートおよび前記第2のコホートに対する前記無増悪生存曲線を同じ生存グラフ上に表示するステップとをさらに含む請求項3に記載の方法。
【請求項9】
ラベル付けされた治療ラインは、薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つもしくは複数を含む請求項8に記載の方法。
【請求項10】
レポートを生成するステップであって、前記レポートは前記患者および前記それぞれの時間間隔についてラベル付けされた各治療ラインを含む、ステップをさらに含む請求項1に記載の方法。
【請求項11】
病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含む請求項1に記載の方法。
【請求項12】
前記病状診断は、癌である請求項1に記載の方法。
【請求項13】
前記複数のデジタル記録は、1つまたは複数のEHR医療記録、および1つまたは複数のキュレーションされた医療記録を含む請求項1に記載の方法。
【請求項14】
キュレーションされた医療記録は、前記1つまたは複数のEHR医療記録に含まれない記録の画像である請求項13に記載の方法。
【請求項15】
前記キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化することをさらに含む請求項13に記載の方法。
【請求項16】
治療識別子によって、前記患者に投与された治療と、前記治療が投与された投与日とを識別するステップをさらに含む請求項1に記載の方法。
【請求項17】
治療は、
薬剤、薬物、分子、または化学薬品の投与、
医療デバイスの植え込み、
医療デバイスの使用、
生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線療法、もしくは放射線療法の使用、
外科的手技、または
放射線外科手術
のうちの1つまたは複数を含む請求項1に記載の方法。
【請求項18】
患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするためのシステムであって、
少なくとも1つのプロセッサを有する少なくとも1つのコンピュータであって、前記プロセッサは
複数のデジタル記録から前記患者の医療記録を識別することであって、前記医療記録のサブセットは、前記患者の病状診断後の1つまたは複数の治療に関する前記患者の医療履歴を反映する、識別することと
医療記録の前記サブセットから、前記患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、
前記薬剤の前記投与が前記時間間隔内に収まるときに前記1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、
それぞれの治療間隔の前記時間間隔を、前記1つまたは複数の治療のうちの1つ治療が前記時間間隔から外れているが延長期間内にあるときに精緻化することであって、前記精緻化された時間間隔において、間隔優先事象が起こらない、精緻化することとを行うようにプログラムされた、少なくとも1つのコンピュータを備え、
前記少なくとも1つのコンピュータは教師なし人工知能エンジンを含み、前記教師なし人工知能エンジンは
前記複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することであって、各潜在的治療ラインは、前記複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、識別することと、
最高の最尤推定を有する前記潜在的治療ラインを前記治療ラインとしてラベル付けすることとを行うようにプログラムされている、システム。
【請求項19】
前記教師なし人工知能エンジンは、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の前記潜在的治療ラインの前記それぞれの最高の最尤推定を有する前記潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けするようにプログラムされる請求項18に記載のシステム。
【請求項20】
前記教師なし人工知能エンジンは、
複数の患者に対するそれぞれの増分的に番号を振られた治療ラインをラベル付けし、
患者の複数のコホートを識別し、
患者の前記複数のコホートの各々に対する前記増分的に番号を振られた治療ラインを報告するようにプログラムされる請求項19に記載のシステム。
【請求項21】
前記少なくとも1つのコンピュータは、
標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告するようにさらにプログラムされる請求項20に記載のシステム。
【請求項22】
前記少なくとも1つのコンピュータは、
少なくとも一部は各治療ラインの前記それぞれの時間間隔に基づき、経時的な治療ラインの変更を報告するようにプログラムされる請求項20に記載のシステム。
【請求項23】
前記少なくとも1つのコンピュータは、
患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告するようにさらにプログラムされ、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する、請求項20に記載のシステム。
【請求項24】
前記少なくとも1つのコンピュータは、
前記第1のコホートと前記第2のコホートとの間の無増悪生存率に関する分析を報告するようにさらにプログラムされる請求項23に記載のシステム。
【請求項25】
前記少なくとも1つのコンピュータは、
共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成し、
共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成し、
前記第1のコホートおよび前記第2のコホートに対する前記無増悪生存曲線を同じ生存グラフ上に表示するようにさらにプログラムされる請求項20に記載のシステム。
【請求項26】
ラベル付けされた治療ラインは、
薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つまたは複数を含む請求項25に記載のシステム。
【請求項27】
病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含む請求項18に記載のシステム。
【請求項28】
前記複数のデジタル記録は、1つまたは複数のEHR医療記録、および1つまたは複数のキュレーションされた医療記録を含む請求項18に記載のシステム。
【請求項29】
前記少なくとも1つのコンピュータは、
前記キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化するようにさらにプログラムされる請求項28に記載のシステム。
【請求項30】
治療は、
薬剤、薬物、分子、もしくは化学薬品の投与、
医療デバイスの植え込み、
医療デバイスの使用、
生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線療法、もしくは放射線療法の使用、
外科的手技、または
放射線外科
のうちの1つもしくは複数を含む請求項18に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、内容全体が参照により本明細書に組み込まれている、2019年8月22日に出願した米国仮特許出願第62/890,178号、名称「Unsupervised Learning And Prediction Of Lines Of Therapy From High-Dimensional Longitudinal Medications Data」の優先権の利益を主張するものである。
【0002】
本開示は、患者記録内に存在する治療ラインにラベル付けするための、コンピュータで実装される方法およびシステムに関係し、より詳細には、薬剤データから治療ラインをラベル付けするための教師なしアプローチに関係する。
【背景技術】
【0003】
治療ライン(LoT)は、抗悪性腫瘍薬による治療を議論するための標準的な命名法である。標準治療(SoC)の治療ガイドラインを発行する団体であるNational Comprehensive Cancer NetworkおよびAssociation for Clinical Oncology (ASCO)の両方が、LoTの枠組み内の研究結果を提示している。癌専門医は、患者に対する治療方針を立てる際にこれらのガイドラインを詳しく検討する。それに加えて、LoTの構成は、規制当局、支払者(民間および機関の両方)、および提供者グループが、新しい抗癌剤の計画、承認、および支払を行う際に考慮される。そのようなものとして、製薬会社もLoTおよび新薬によって実現される患者に対する潜在的影響/利益を考慮して計画および試験的設計にアプローチする。医師は、患者に処方されたLoT、任意の悪影響、増悪、または介入した事象、および患者の転帰を改善するために治療を補償しまたは適合させるためのLoTへのその後の任意の変更を強調することによって別の医師に患者の履歴を頻繁に要約する。残念ながら、このタイプの非公式な要約は、患者の電子医療/健康記録(EMR/EHR)に決して入力されない。医師が患者のEMRを提供することに同意したときに、提供された記録を解析して、LoTさらには重要な、介在する(取って代わる)事象(増悪、退行、転移、時間の長さを含む)を引き抜き、医師の便宜のために医師に提供し、各患者に対するLoT履歴に関する医師の理解を改善することが望ましい。
【0004】
これが達成困難な課題であるのは、EHRおよび/または経過記録だけから回復可能な情報は決して完全ではないからである。記録中に出現し得る(または出現し得ない)不正確さ、矛盾、記録の欠落、および他の不完全な項目が多数あり、これらは考慮される必要がある。たとえば、癌専門医が2つのLoTを考慮することがあり、1つは治療ラインまたは一連の単剤療法としてのシクロホスファミド、ドキソルビシン、パクリタキセルの薬剤/治療/療法の組み合わせである。患者の保険会社側で、費用の面からパクリタキセルの採用を拒絶することがあり、したがって患者はシクロホスファミドおよびドキソルビシンを受ける。一連の投与の後、患者はこの組み合わせでは健康全般に悪影響があると判断し、患者はパクリタキセル単独の維持療法に移行することもある。EMRでは、これらの薬剤はすべて数カ月間記録されるように見え得るが、これは患者がEMRの最初の数項目でパクリタキセルを受けたすらなく、シクロホスファミドを受けたのはその期間の一部においてだけだったとしてもである。その後、腫瘍の成長を観察するために、癌専門医がCTスキャンを指示することもある。患者が、6カ月後、症状が悪化したことから再診したときに、医者は症状の悪化を増悪事象として経過記録に記載し、薬剤カルボプラチンおよびゲムシタビンをリストし得るか、または医者は薬剤ゲムシタビンだけをリストし、以前の薬剤については記録を曖昧にしたままにしておく。抽象化の観点から、EMRは単に前治療薬が処方され、6カ月後にゲムシタビンが処方されたことを記録するだけである。EMRは、CTスキャンさらには6カ月の時間枠における症状悪化も記録し得る。これらの記録からLoTを作成することの難しさは、多岐にわたる。
1)患者が服薬しない、あるいはそれを中止した場合、それらを服薬したことを示すLoTはデータサイエンスの観点からは信頼できない。
2)業界の観点からは、薬剤に対する悪影響の回避のために薬剤を調整しただけのLoTの変更は、新しいLoTではなく、同じLoTである。したがって、薬剤変更は必ずしも新しいLoTを示すものではない。薬剤の変更が、増悪事象、症状悪化、または他の任意の重要な介入事象と一致しているかどうかを識別することは、扱いにくい場合があり、たとえば、保険の問題または副作用の問題で患者が服薬しなかった場合、これはLoTの変更として症状の悪化に対して修正することが困難であるか、または元のLoTに対して副作用を避けるだけであり得る。
3)データサイエンスの観点からは、新薬が処方された後であっても、薬剤が年間を通して一部または全部継続されたかどうかをインピュートすることは困難であり得る。
4)臨床医の観点からは、いくつかの薬物は、名称の変更がありながら、本質的に同じ薬物とみなされ得る。
5)患者は、治療の一環として、「対症療法」薬剤と呼ばれる多くの薬剤を受けているが、LoTの割り当てには無関係である。さらに、これらを区別することは、必ずしも直接的ではないが、それは、「対症療法」対「初期治療」と考えられる薬剤は、癌型によって異なるからである。
6)データソースの異質性。EHRおよび経過観察記録からのキュレーションはソース毎に異なり、LoT決定の前に共通の標準への調和を必要とする。
7)むらのあるデータの負担および複雑さの克服。癌治療記録がEHRおよびキュレーションされた経過記録の両方で完全にカバーされている患者はほとんどいない。多くの場合、一方または他方のみが利用可能であり、両方が存在する場合、これらは患者のタイムラインの調和しない部分を記述しています。これは、特に、記録が一般に薬剤のセットの始まりを記録しているが、それらがいつ停止されたかをほとんど記録しないときに、問題を複雑にする。
【0005】
現在のところ、EMRからLoTを予測し、ダイジェストし、またはインピュートするためのいかなるアルゴリズムも存在しない。これは一般に、熟練した施術者がファイルを手動でレビューして、すべての患者についてケースバイケースでこれらの決定を行うことを必要とし、これはコストと時間を要するものである。機械学習は、不完全なデータからLoTが予測され得ることを典型的に反映する介在事象による特定の診断のための薬剤変更の頻度、よくある出現に基づき、すべての患者について横断的にすべての薬剤を考察するために適用され得る。これに対処するために、ルールベースの構造などのヒューリスティックと臨床的洞察とを合成する機械学習アプローチと、機械学習アルゴリズム(MLA)を使用して効果的な予測を行う期待値最大化(EM)アルゴリズムが考察され得る。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】米国特許出願第16/732,168号
【発明の概要】
【課題を解決するための手段】
【0007】
一態様において、本開示は、患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするための方法を提供する。この方法は、複数のデジタル記録から患者の医療記録を識別することであって、医療記録のサブセットは患者の病状診断後の1つまたは複数の治療に関する患者の医療履歴を反映する、識別することと、医療記録のサブセットから、患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、薬剤の投与が時間間隔内に収まるときに1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、それぞれの治療間隔の時間間隔を、1つまたは複数の治療のうちの1つ治療が時間間隔から外れているが延長期間内にあるときに精緻化することであって、精緻化された時間間隔において、間隔優先事象が起こらない、精緻化することと、教師なし人工知能エンジンを介して、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することであって、各潜在的治療ラインは、複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、識別することと、教師なし人工知能エンジンを介して、最高の最尤推定を有する潜在的治療ラインを治療ラインとしてラベル付けすることとを含む。
【0008】
この方法は、教師なし人工知能エンジンを介して、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の潜在的治療ラインのそれぞれの最高の最尤推定を有する潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けすることをさらに含み得る。この方法は、教師なし人工知能エンジンを介して、複数の患者に対するそれぞれの増分的に番号を振られた治療ラインをラベル付けすることと、患者の複数のコホートを識別することと、患者の複数のコホートの各々に対する増分的に番号を振られた治療ラインを報告することとをさらに含み得る。この方法は、標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告することをさらに含み得る。この方法は、少なくとも一部は各治療ラインのそれぞれの時間間隔に基づき、経時的な治療ラインの変更を報告することをさらに含み得る。この方法は、患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告することをさらに含み得、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する。この方法は、第1のコホートと第2のコホートとの間の無増悪生存率に関する分析を報告することをさらに含んでもよい。この方法は、共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成することと、共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成することと、第1のコホートおよび第2のコホートに対する無増悪生存曲線を同じ生存グラフ上に表示することとをさらに含み得る。この方法において、ラベル付けされた治療ラインは、薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つもしくは複数を含み得る。
【0009】
この方法は、レポートを生成することであって、レポートは患者およびそれぞれの時間間隔についてラベル付けされた各治療ラインを含む、生成することをさらに含み得る。
【0010】
この方法では、病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含み得る。
【0011】
この方法では、病状診断は、癌であり得る。
【0012】
この方法において、複数のデジタル記録は、1つまたは複数のEHR医療記録、および1つまたは複数のキュレーションされた医療記録を含んでもよい。この方法では、キュレーションされた医療記録は、1つまたは複数のEHR医療記録に含まれない記録の画像であってもよい。この方法は、キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化することをさらに含み得る。
【0013】
この方法は、治療識別子によって、患者に投与された治療と、その治療が投与された投与日とを識別することをさらに含み得る。
【0014】
この方法では、治療は、薬剤、薬物、分子、または化学薬品の投与、医療デバイスの植え込み、医療デバイスの使用、生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線波療法の使用もしくは放射線療法、外科的手技、または放射線外科手術のうちの1つまたは複数を含み得る。
【0015】
別の態様において、本開示は、患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするためのシステムを提供する。システムは、少なくとも1つのプロセッサを有する少なくとも1つのコンピュータであって、プロセッサは、複数のデジタル記録から患者の医療記録を識別することであって、医療記録のサブセットは、患者の病状態診断後の1つまたは複数の治療に関する患者の医療履歴を反映する、識別することと、医療記録のサブセットから、患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、薬剤の投与が時間間隔内に収まるときに1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、それぞれの治療間隔の時間間隔を、1つまたは複数の治療のうちの1つの治療が時間間隔を外れているが延長期間内にあるときに精緻化することであって、精緻化された時間間隔において、間隔優先事象が起こらない、精緻化することとを行うようにプログラムされた、少なくとも1つのコンピュータを含み、少なくとも1つのコンピュータは、教師なし人工知能エンジンを含み、教師なし人工知能エンジンは、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することであって、各潜在的治療ラインは、複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、識別することと、最高の最尤推定を有する潜在的治療ラインをその治療ラインとしてラベル付けすることとを行うようにプログラムされる。
【0016】
システムにおいて、教師なし人工知能エンジンは、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の潜在的治療ラインのそれぞれの最高の最尤推定を有する潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けするようにプログラムされ得る。システムにおいて、教師なし人工知能エンジンは、複数の患者についてそれぞれの増分的に番号を振られた治療ラインをラベル付けし、患者の複数のコホートを識別し、患者の複数のコホートの各々について増分的に番号を振られた治療ラインを報告するようにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告するようにさらにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、少なくとも一部は各治療ラインのそれぞれの時間間隔に基づき、経時的な治療ラインの変更を報告するようにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告することであって、ようにさらにプログラムされ得、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する。システムにおいて、少なくとも1つのコンピュータは、第1のコホートと第2のコホートとの間の無増悪生存率に関する分析を報告するようにさらにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成し、共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成し、第1のコホートおよび第2のコホートに対する無増悪生存曲線を同じ生存グラフ上に表示するようにさらにプログラムされ得る。システムにおいて、ラベル付けされた治療ラインは、薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つもしくは複数を含み得る。
【0017】
システムにおいて、病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含み得る。
【0018】
システムにおいて、複数のデジタル記録は、1つまたは複数のEHR医療記録と1つまたは複数のキュレーションされた医療記録とを含んでもよい。システムにおいて、少なくとも1つのコンピュータは、キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化するようにさらにプログラムされ得る。
【0019】
システムにおいて、治療は、薬剤、薬物、分子、または化学薬品の投与、医療デバイスの植え込み、医療デバイスの使用、生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線波療法の使用もしくは放射線療法、外科的手技、または放射線外科手術のうちの1つまたは複数を含み得る。
【0020】
本特許のファイルは、カラーで作成された少なくとも1つの図面/写真を含む。カラー図面/写真を含む本特許の写しは、請求と必要な手数料の支払とによって当局から提供される。
【図面の簡単な説明】
【0021】
図1】治療ライン(LoT)予測の準備、訓練、および生成の一実施形態を示すフローチャートである。
図2】ルールベース前処理とともにMLAアプローチを使用する治療ライン(LoT)予測の準備、訓練、および生成の一実施形態を示すフローチャートである。
図3】転移性非小細胞肺癌と診断された第1の患者に対するLoT予測の説明図である。
図4】卵巣癌と診断された第2の患者に対するLoT予測の説明図である。
図5】乳癌と診断された第3の患者に対するLoT予測の説明図である。
図6】キュレーションされた患者履歴から複雑なキュレーションされたフィールドをインピュートし、それらを非キュレーション患者または少量のデータを有する患者に適用する方法を実装するルールベースの前処理を伴う人工知能エンジンアプローチを使用して治療ライン(LoT)を準備し、訓練し、割り当てる一実施形態であるシステム600を示すフローチャートである。
図7】3つの段階にわたる治療ライン(LoT)モデルを準備し、訓練し、生成する一実施形態を示すフローチャートである。
図8】転移性非小細胞肺癌と診断された第1の患者に対するLoT予測の説明図である。
図9】卵巣癌と診断された第2の患者に対するLoT予測の説明図である。
図10】乳癌と診断された第3の患者に対するLoT予測の説明図である。
図11A】フローの第1のステップを例示する図である。
図11B図11Aのフローの第2のステップに含まれる投薬間隔の数を例示する図である。
図11C図11Aのフローの第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示する図である。
図11D図11Aのフローの第4のステップにおいてライン割り当てを出力することを例示する図である。
図12A】フローの第1のステップを例示する図である。
図12B図12Aのフローの第2のステップに含まれる投薬間隔の数を例示する図である。
図12C図12Aのフローの第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示する図である。
図12D図12Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。
図12E図12Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。
図12F図12Aのフローの第5のステップにおいてライン割り当てを出力することを例示する図である。
図13A】フローの第1のステップを例示する図である。
図13B図13Aのフローの第2のステップに含まれる投薬間隔の数を例示する図である。
図13C図13Aのフローの第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示する図である。
図13D図13Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。
図13E図13Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。
図13F図13Aのフローの第5のステップにおいてライン割り当てを出力することを例示する図である。
図14】少なくとも癌免疫(IO)レジメン療法を有する患者に適用されるような治療ラインを例示するサンキーダイアグラムである。
図15】異なる第1の治療ラインを受けた患者の生存曲線を描いた無増悪生存率(PFS)グラフである。
図16】一実施形態による患者に対する治療ラインを使用者が編集するための治療ライン編集ツールの説明図である。
図17】一実施形態によるLoTラベル付けが実行された後の患者タイムラインの構造化データ表現の説明図である。
図18】肺癌コホートおよび乳癌コホートにおける患者のコホートから識別されるLoTの平均持続時間のボックスプロット図である。
図19】患者に投与された乳癌治療薬に対する第1のLoTに基づくLoT頻度の説明図である。
図20】患者に投与された乳癌治療薬に対する第2のLoTに基づくLoT頻度の説明図である。
図21】患者に投与された非小細胞肺癌(NSCLC)治療薬に対する第1のLoTに基づくLoT頻度の説明図である。
図22】患者に投与された非小細胞肺癌治療薬に対する第2のLoTに基づくLoT頻度の説明図である。
図23】列挙されたLoTの少なくとも1つを含むコホートに割り当てられた各原発癌に対する患者の割合の棒グラフ図である。
図24】本開示のいくつかの実装形態が動作し得るコンピュータシステムの一実装形態のブロック図の説明図である。
【発明を実施するための形態】
【0022】
「病状」という語句は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、自己免疫疾患、または他の疾病などの疾病の状態を意味する。病状は、被験者における疾病の有無を反映するものとしてよく、それが存在するときにその疾患の重篤度をさらに反映し得る。
【0023】
図1は、投与された薬剤および臨床記録に基づき患者に対する治療ラインをラベル付けするためのコンピュータ実装システム100の一実施形態を例示している。治療ラインは、システムアーキテクチャ100によって実装される臨床健康記録110によって表される患者情報から生成され得る。システム100は、ハードウェアまたはハードウェアとソフトウェアの両方の組み合わせである、コンテンツサーバ(LoTエンジンとも呼ばれる)であってよい。医療提供者または患者などの使用者は、GUI170a~170nを通じてリモートアクセスを与えられ、これにより使用者自身のローカルデバイス(たとえば、パーソナルコンピュータまたはワイヤレスハンドヘルドデバイス)を使用して患者の医療状態に関する情報を閲覧し、更新し、分析する。使用者は、システムをインタラクティブに操作して電子記録を生成し、電子記録を更新し、他のアクションを実行する指示を出すことができる。コンテンツサーバは、異なる形式の様々な情報を受信するように構成され、これは、コンテンツサーバ上の、またはコンテンツサーバと連動する治療ラインモジュール120の動作による処理に適している標準化された形式に情報を変換する。したがって、患者の電子医療記録(EMR)、非構造化テキスト、遺伝子シークエンシング、画像処理、および他の様々な情報から取得された情報は、1つもしくは複数の人工知能エンジンまたは機械学習モデルを訓練するために使用される特徴に変換され得る。
【0024】
コンテンツサーバ100によって取得され、処理され、生成される情報は、ネットワークベースのストレージデバイスのうちの1つまたは複数に記憶される。使用者は、コンテンツサーバをインタラクティブに操作してネットワークベースのストレージデバイスに記憶されている情報にアクセスすることができ、コンテンツサーバは、使用者提供情報を受け取り、ネットワークベースのストレージに記憶されている1つまたは複数のモデルを情報に適用し、電子形式で、モデル適用の結果を、ユーザデバイスのグラフィカルユーザインターフェース上で使用者に提供することができる。電子情報は、その情報にアクセスする使用者に対してコンピュータネットワーク上で標準化形式により伝送される。このようにして、使用者は、自動的に生成することができるシステムの予測に従って医療診断および治療戦略を容易に適合させることができる。さらに、システムは、患者診断および治療に関する使用者への推奨を生成する。
【0025】
いくつかの実施形態において、説明されているシステムおよび方法は、デジタルおよび実験室ヘルスケアプラットフォームの一部として実装される。プラットフォームは、ターゲット医療的ケア精密薬剤治療の一部として分子レポートを自動的に生成し得る。いくつかの実施形態において、本開示の実施形態に係るシステムは、1つまたは複数のマイクロサービス上で動作し、これは、発注管理システムのマイクロサービスであってもよい。いくつかの実施形態において、本システムは、細胞型プロファイリングサービスの1つまたは複数のマイクロサービスと併せて実装される。
【0026】
臨床健康記録110は、システム100に情報が存在する一部またはすべての患者について生成された特徴、または状態特性の集合体を記憶し得る。これらの特徴は、システム100を使用して薬剤および優先事象を識別するために使用され得る。すべての患者にわたる特徴範囲は情報的密度が高いが、患者の特徴セットは、すべての患者にわたるすべての特徴の集合的特徴範囲の全体にわたって要素がまばらに配置されているものとしてよい。たとえば、すべての患者にわたる特徴範囲は数万の特徴に拡大し得るが、患者の固有特徴セットは、その患者について利用可能な記録に基づき集合的特徴範囲の数百または数千個からなるサブセットを含み得る。
【0027】
臨床健康記録110内に存在する複数の特徴は、患者の健康記録内で利用可能なフィールドの多様なセットを含んでもよい。臨床情報は、たとえば、医師、看護師、または他の医療専門家もしくは代表者によって、自動的にもしくは手動により行われ得る、電子医療記録(EMR)または電子健康記録(EHR)に入力されたフィールドに基づくものとしてよい。他の臨床情報は、たとえば、遺伝子シークエンシング報告(たとえば、分子フィールドから)、経過報告、検査結果、保険請求コードおよび/または記録、ならびに患者に対する他の医療文書などの、他の情報源から得られるデジタル方式でキュレーションされた情報114であってもよい。シークエンシングは、次世代シークエンシング(NGS)を含むものとしてよく、ロングリード、ショートリード、または患者の体細胞および/または正常なゲノムをシークエンシングする他の形態であってよい。追加の臨床健康記録内の特徴の包括的集合体は、診断、治療レジメンへの反応、遺伝子プロファイル、臨床および表現型の特徴、および/または他の医学的、地理的、人口統計学的、臨床的、分子的、もしくは遺伝的な特徴を含み得る様々な医学分野にわたって様々な特徴を一緒に組み合わせたものであってよい。たとえば、特徴のサブセットは、RNAまたはDNAシークエンシングから導出される特徴、病理学者による細胞レビューから導出される病理学的特徴、または他の画像などの、分子データ特徴を含み得る。
【0028】
画像特徴は、たとえば、染色されたH&EまたはIHCスライドのレビューなど、病理学者による標本のレビューを通じて識別される特徴を含み得る。別の例として、特徴のサブセットは、そのような特徴セットの個別の結果および組み合わされた結果の解析から取得された派生的特徴を含み得る。DNAおよびRNAシークエンシングから導出される特徴は、シークエンシングされた試料中で識別できる遺伝的バリアントを含み得る。遺伝的バリアントのさらなる分析は、一塩基または複数塩基多型を識別するステップ、変異が挿入または欠失事象であるかどうかを識別するステップ、機能喪失または機能獲得を識別するステップ、融合を識別するステップ、コピー数変化を計算するステップ、マイクロサテライト不安定性を計算するステップ、腫瘍遺伝子変異量を計算するステップ、またはDNAおよびRNA内の他の構造的変化などのステップを含み得る。H&E染色またはIHC染色のためのスライドの解析は、腫瘍浸潤、プログラム細胞死リガンド1(PD-L1)の状態、ヒト白血球抗原(HLA)の状態、または他の免疫学関係特徴などの特徴を明らかにし得る。
【0029】
構造化された、キュレーションされた、および/または電子的な医療もしくは健康記録112および114から導出される特徴は、診断、症状、治療法、転帰などの臨床的特徴、患者名、生年月日、性別、民族、死亡日、住所、喫煙状態、癌、病気、疾患、糖尿病、鬱病、他の身体的または精神的な疾病の診断日などの患者人口統計、既往歴、家族病歴、初診日、転移診断日などの臨床診断、癌病期、腫瘍キャラクタリゼーション、原発組織、治療ライン、治療グループ、臨床試験、処方されるまたは服用される薬剤、外科手術、放射線療法、画像診断、副作用、関連する転帰などの治療および転帰、遂行度スコア、実験室検査、病理結果、予後指標などの遺伝子検査および実験室情報、遺伝子検査日、使用される検査提供者、遺伝子シーケンシング方法または遺伝子パネルなどの使用される検査方法、含まれる遺伝子、バリアント、発現レベル/状態などの遺伝子結果、または上記のいずれかに関連付けられている対応する日付を含み得る。
【0030】
機械学習モデルおよび/または人工知能エンジンは、任意の特徴から選択することによって、分類ラベル付け、および/または分析を実行し得る。患者の特徴セットを強化するための1つの方法は、何万もの特徴からの特徴セットを一握りの特徴に折り畳むなどの次元削減を含んでもよい。情報を失うことなく次元削減を実行することは、教師なし方式または教師あり方式でアプローチされ得る。教師なし方法は、RNA変分オートエンコーダ、SVD、PCA、KernelPCA、SparsePCA、DictionaryLearning、Isomap、NMF、UMAP、特徴凝集、患者相関クラスタリング、KMeans、Gaussian Mixture、または球状KMeansを含み得る。教師あり方式で次元削減を実行することは、線形判別分析、近傍成分分析、MLP転送学習、または樹木教師あり埋め込みを含んでもよい。
【0031】
機械学習モデルまたは人工知能エンジンは、勾配ブースティングモデル、ランダムフォレストモデル、ニューラルネットワーク(NN)、回帰モデル、ナイーブベイズモデル、または機械学習アルゴリズム(MLA)を介して実装され得る。MLAまたはNNは、各患者または画像および特徴に対する特徴ベクトルを有する複数の行列などの訓練データセットから訓練され得る。例示的な予測プロファイルでは、訓練データセットは、EHRからキュレーションされたもの、または遺伝子シークエンシングレポートなど、患者の画像、病理、臨床、および/または分子レポートならびに詳細を含み得る。MLAは、線形回帰、ロジスティック回帰、決定木、分類および回帰木、ナイーブベイズ、最近傍クラスタリングを使用する教師ありアルゴリズム(データセット内の特徴/分類がアノテーションされているアルゴリズムなど)、アプリオリ、meansクラスタリング、主成分解析、ランダムフォレスト、適応型ブースティングを使用する教師なしアルゴリズム(データセット内の特徴/分類がアノテーションされていないアルゴリズムなど)、生成アプローチ(ガウス分布の混合、多項分布の混合、隠れマルコフモデルなど)、低密度分離、グラフベースのアプローチ(mincut、調和関数、多様体正則化など)、発見的アプローチ、またはサポートベクターマシンを使用する半教師ありアルゴリズム(データセット内の不完全な数の特徴/分類がアノテーションされているアルゴリズムなど)を含む。NNは、条件付き確率場、畳み込みニューラルネットワーク、注意ベースニューラルネットワーク、ディープラーニング、長短期記憶ネットワーク、または他のニューラルモデルを含み、訓練データセットは、複数の腫瘍サンプル、各サンプルに対するRNA発現データ、および各サンプルに対するイメージングデータをカバーする病理レポートを含む。MLAおよびニューラルネットワークは、機械学習の異なるアプローチを識別するが、これらの用語は、本明細書では交換可能に使用され得る。したがって、特に断りのない限り、MLAの言及は対応するNNを含み得るか、またはNNの言及は対応するMLAを含み、人工知能エンジンは階層型アーキテクチャにおける各々のうちの1つまたは複数を具現化し得る。
【0032】
いくつかの実施形態において、人工知能エンジンは、訓練された機械学習モデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、1つまたは複数のLoTを有する医療記録上で機械学習モデルを訓練することによって生成され得る。いくつかの実施形態において、訓練された機械学習モデルは、回帰モデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、クラスタリングモデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、次元削減モデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、分類モデルであってよい。
【0033】
訓練は、最適化されたデータセットを各患者に対する特徴ベクトルの行列として提供することと、これらの特徴を患者記録内に出現するときに監視信号としてラベル付けすることと、出力分類、予測、またはラベルを予測するようにMLAを訓練することとを含み得る。人工NNは、強力な計算モデルであり、人工知能の難しい問題を解くことに強みのあることを示している。これらが普遍的近似器であることも示されている(適切なパラメータを与えたときに広範な関数を表現することができる)。MLAの中には、重要な特徴を識別し、それらに対する係数、すなわち重みを識別するものもある。係数は、特徴の出現頻度と掛け合わされてスコアを生成し、1つまたは複数の特徴のスコアが閾値を超えたときに、MLAによっていくつかの分類が予測され得る。係数スキーマは、ルールベーススキーマと組み合わされ、複数の特徴に基づく予測などの、より複雑な予測を生成するものとしてよい。たとえば、異なる分類において10個の重要な特徴が識別され得る。係数のリストは、重要な特徴に対して存在し、ルールセットは、分類に対して存在し得る。ルールセットは、特徴の出現数、特徴のスケーリングされた重み、または当業者に知られているロジックで符号化された特徴の他の定性的および定量的な評価に基づくものとしてよい。他のMLAでは、特徴は、二分木構造で編成されてもよい。たとえば、大部分の分類を区別する主要な特徴は、二分木のルートとして、また木における後続の各枝として、木の終端ノードに到達することに基づき分類が与えられ得るまで、存在し得る。たとえば、二分木は、第1の特徴を検定するルートノードを有し得る。この特徴の出現または非出現は、存在していなければならず(二分決定)、ロジックは、分類される項目に対して真である枝をトラバースするものとしてよい。追加のルールは、閾値、範囲、または他の定性的および定量的検定に基づくものとしてよい。訓練データセットが多数の知られている値またはアノテーションを有するときに教師ありの方法は有用であるが、EMR/EHRドキュメントの性質上、多数のアノテーションが与えられていない場合もある。大量のラベル付けされていないデータを探索するときに、教師なしの方法はデータセット内のインスタンスのビン分割/バケット化に対して有益である。上記のモデルの単一のインスタンス、または2つもしくはそれ以上のそのようなインスタンスは組み合わせることで、本明細書において説明されているモデルまたはエンジンの目的のためにモデルを構成し得る。
【0034】
治療ラインモジュール120は、複数のモジュール、すなわち、記録調和モジュール122、間隔生成モジュール124、および治療ライン割り当てモジュール126を含み得る。記録調和モジュール122は、図3に関して以下でより詳細に開示されているように、EMR112およびデジタル方式でキュレーションされた記録114に含まれる記録を調和させて、重複を除去し、類似の記録を組み合わせ、追加の調和ステップを取るものとしてよい。間隔生成モジュール124は、図4に関して以下でより詳細に開示されているように、調和された記録を受け取り、調和された記録に基づいて複数の治療間隔を生成し、精緻化するものとしてよい。治療ライン割り当てモジュール126は、複数の治療間隔を受け取り、潜在的治療ラインを識別し、患者に投与される1つまたは複数の治療ラインを識別しラベル付けするために、訓練済み人工知能エンジンを潜在的治療ラインに適用し得る。
【0035】
治療ライン(LoT)ストア150は、LoTモジュール120から生成されたLoTを受け取り、システム100で使用するためにそれらを記憶しておくものとしてよい。LoTは、たとえば、いくつかの実施形態において、ウェブフォーム160a~160nを含み得る、ウェブフォームベースの対話型ユーザインターフェースなどのユーザインターフェースによって取り出せるように構造化形式で記憶され得る。ウェブフォームは、モジュール120からの即時LoTを開始するか、もしくは閲覧すること、またはモジュール120がそこからの分析を実行し得る患者のコホートを開始するか、もしくは調整することを含む、複数の分析機能を実行するためのコンピュータシステムの使用者に、コンピュータによって表示できるGUIをサポートし得る。電子レポート170a~170nは、グラフィカルユーザインターフェース(GUI)165を介して生成され、使用者に提供され得る。GUI165は、ネットワークを介してコンテンツサーバ/予測エンジン100に接続されているユーザデバイス上に提示され得ることは理解されるべきである。
【0036】
レポート170a~170nは、様々な医師および医療提供者(検査室を含む)から患者情報を収集して標準化形式に変換し、統合し、それをネットワークベースのストレージデバイスに記憶し、本開示の実施形態に従ってレポートが生成された後電子レポートを含むメッセージを生成するネットワークベースの患者管理システムの一部として使用者に提供され得る。このようにして、使用者(たとえば、医師、癌専門医、もしくは任意の他の医療提供者、または患者は、生成されたLoTに関係するコンピュータ生成された予測、分析、および他のレポートを受け取る。
【0037】
いくつかの実施形態において、電子レポートは、類似の治療を受けたことのある類似の患者の反応に基づく予測反応と相関する次のLoTまたは治療を使用して患者を治療するための医師への推奨を含み得る。
【0038】
図2は、複数のデジタル記録から1つまたは複数の治療ラインを生成するための方法のフローチャートを例示している。ステップ210において、システム200は、複数のデジタル記録から患者に対する医療記録を識別し得る。これらの記録は、EMR/EHR内に記録されるか、非構造化データからデジタル方式でキュレーションされてもよい。医療記録は、特定の時間期間からのものに限定されてもよく、癌などの病状の診断から始まる時間期間を含む。追加の時間期間は、経時的なLoT開発の分析を実行するときに特定の年間隔を含み得る。
【0039】
ステップ220において、システム200は、時間間隔において少なくとも1つの薬剤を有する複数の治療間隔を作成し得る。これらの薬剤は患者記録から識別され、診断に関連するものとしてさらに識別されている。時間間隔は、開始日および/または終了日に関連付けられ、日付は、患者記録から直接割り当てられ得るか、または類似の薬剤、標準診療、もしくは類似の患者記録で訓練された人工知能エンジンからの学習済み間隔などの追加の支援情報からインピュートされ得る。
【0040】
ステップ230において、システム200は、薬剤の投与が時間間隔内に収まるときに薬剤をそれぞれの治療間隔に関連付け得る。たとえば、6月1日から6月23日までの治療間隔が存在する場合、6月15日に投与されたそれぞれの薬剤は、治療間隔と関連付けられ得るが、9月1日に投与された薬剤は、その投与が時間間隔内に入らないので治療間隔と関連付けられ得ない。
【0041】
ステップ240において、システム200は、各それぞれの治療間隔の時間間隔を精緻化し得る。時間間隔は、重複する間隔を組み合わせること、間隔を分割すること、または1つまたは複数のヒューリスティック、規則、もしくは訓練されたモデルに従って開始日および/もしくは終了日を調整することによって精緻化され得る。
【0042】
ステップ250において、システム200は、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別し得る。識別は、訓練されたモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。
【0043】
ステップ260において、システム200は、最高の最尤推定を有する潜在的治療ラインを治療ラインとしてラベル付けし得る。たとえば、潜在的治療ラインの順位付けされたリストが与えられた場合、最も高い順位付け(最も信頼度が高い)を有する治療ラインは、治療ラインとして選択され得る。
【0044】
図3は、図1の記録調和122のサブプロセスを実装する例示的な記録調和モジュール300を例示している。
【0045】
記録調和は、記録ホワイトリストおよび/または記録ブラックリストモジュール322、記録関連付けモジュール324、記録組み合わせモジュール326、およびヒューリスティック処理モジュール328などの1つまたは複数のモジュールを含み得る。
【0046】
記録ホワイトリストおよび/または記録ブラックリストモジュール322は、そのコンテンツ、品質、信頼性、または他の評価メトリックに基づき記録を含むかまたは除外するものとしてよい。たとえば、記録は、そのソースがそれぞれの施設からの撮像結果であると識別され得るときに含まれるか、画像解像度が可読性に関して許容閾値を下回る場合に除外されるか、または記録が性別、人種、または他の不変特性/人口統計学における不整合などの患者の不整合を含む場合に除外され得る。
【0047】
記録関連付けモジュール324は、冗長性がないか記録をチェックし、複数回出現する記録、または他の記録と同じ情報を含む記録を削除し得る。薬剤、投薬開始日、または投薬終了日との関連付けは、割り当てられるか、またはインピュートされ得る。
【0048】
記録組み合わせモジュール326は、十分に重複する関連付けを有する記録を組み合わせてもよい。十分に重複する関連付けは、同じ薬剤または類似の薬剤(後発医薬品対ブランド名、競合するブランド名、知られている同等物、または他の類似物など)を含んでもよい。類似の薬剤について同じ開始日を有する複数の記録は、単一の記録に「ロールアップ」されてもよい。
【0049】
ヒューリスティック処理モジュール328は、ルールベースまたは人工知能駆動型記録調和構造を組み込み得る。一例において、人工知能エンジンは、類似の薬剤を識別するように薬剤名に関して訓練されるか、または各薬剤タイプについて患者に最もよく処方されている薬剤の持続期間を予測するように投薬間隔に関して訓練されてもよい。モデルは、それに加えて、開始日、終了日の割り当てに設定された閾値を適用するか、または各記録に対する最小もしくは最大の時間期間を強制するためのルールセットを含み得る。
【0050】
追加の記録調和ステップは、データ取込および調和に関して以下に開示される。
【0051】
図4は、図1の間隔生成124のサブプロセスを実装する例示的な間隔生成モジュール400を例示している。
【0052】
間隔生成は、診断関連性フィルタ422、間隔日付割り当て424、間隔日付インピュテーション426、間隔日付延長428、または間隔日付セグメント化430などの1つまたは複数のモジュールを含んでもよい。
【0053】
診断関連性フィルタ422は、診断を扱うことが知られている薬剤を含む知識データベースを組み込み得る。これらの薬剤は、FDA承認、臨床試験、出版物、または患者記録に関する人工知能分析からキュレーションされ得る。診断の治療に関連しない薬剤は、診断を扱う目的で投与されそうもないので、LoTに対する処理から除外され得る。
【0054】
間隔日付割り当て424は、記録キュレーション、調和、または関連性フィルタリングにおいて先行するモジュールの1つから削除されていない各薬剤記録に間隔を割り当てることを含み得る。薬剤および少なくとも開始日を含む医療記録は、薬剤を有しない、または同じもしくは類似の薬剤を有する間隔に割り当てられ得る。
【0055】
間隔日付インピュテーション426は、その間隔の薬剤の投与の正確な推定を反映するために、間隔に対する開始日または終了日をインピュートすることを含み得る。たとえば、投薬が設定された日数間継続すると予想される場合(抗生物質、ステロイド、または知られている周期性を有する他の薬剤の過程)、終了日は、それぞれの薬剤が7日後、14日後、3カ月後などの予想される持続期間に基づき割り当てられる間隔についてインピュートされ得る。
【0056】
間隔日付延長428は、連続する間隔が重なるときを識別することと、薬剤が同じであるかまたは類似しているときに他の重なる間隔を包含するように最初の重なる間隔の持続時間を延長することとを含み得る。それに加えて、薬剤が間隔に対して割り当てられるか、またはインピュートされるときに、それぞれの間隔の開始日または終了日は、延長が閾値時間期間の範囲内に収まるときに追加の投薬の日付を含むように延長され得る。一例において、閾値時間期間は、上記の記録組み合わせ326と同様に、22日などの設定された持続期間、またはその間隔の投薬に基づく薬剤毎の時間期間を含み得る。
【0057】
間隔日付セグメント化430は、1つまたは複数の間隔において間隔優先事象が発生したときを識別し、優先事象の日付で各それぞれの間隔を分割することを含み得る。たとえば、癌診断において、転移の発生は、間隔優先事象として参照されてもよく、転移の日付を超えて延長する任意の間隔は、元の間隔開始日および終了日としての転移の日付を有する第1の間隔と、間隔開始日としての転移の日付および元の間隔終了日を有する第2の間隔とに分割され得る。優先事象は、治療ライン変更を引き起こす事象を含み、患者記録の人工知能分析を通じて、またはルールセットを介して、またはFDA承認、臨床試験、出版物からキュレーションされ得るようなそれらの事象を通じて、識別され得る。
【0058】
図5は、図1の治療ライン割り当て126のサブプロセスを実装するための例示的な治療ライン割り当てモジュール500を例示している。
【0059】
治療ライン割り当ては、LoT割り当て推定522、LoT割り当て確率524、LoT順位付け526、またはLoTラベル付け528などの1つまたは複数のモジュールを含んでもよい。
【0060】
LoT割り当て推定522は、潜在的治療ラインを識別するために間隔が互いに間隔に対して一部および全体として考慮され得るように利用可能な間隔の整数の結合の評価を実行することを含んでもよい。別の実施形態において、人工知能エンジンは、複数の治療間隔を受け取り、複数の潜在的治療ラインを出力し得る。
【0061】
LoT割り当て確率524は、各潜在的治療ラインが連続的に番号を振られた治療ライン(第1の治療ライン、第2の治療ライン、第3の治療ラインなど)として含まれるであろう可能性を識別するために各潜在的治療ラインの期待最大確率を計算することを含み得る。
【0062】
LoT順位付け526は、最も高い確率を有する潜在的治療ラインが順位付けの最上位にあり、最も低い確率を有する潜在的治療ラインが順位付けの最下位にあるようにそれらの尤度に基づき複数の潜在的治療ラインを順位付けすることを含み得る。
【0063】
LoTラベル付け528は、最も可能性の高い潜在的治療ラインをその治療ラインとして識別するか、または連続する潜在的治療ラインを評価して、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔における潜在的治療ラインのそれぞれの最高の最尤推定値を有する連続する増分的に番号を振られた治療ラインを識別するものとしてよい。たとえば、第1の潜在的治療ラインが1月に開始し、第2の潜在的治療ラインが5月に開始する場合、第1の潜在的治療ラインは、第1の治療ラインとしてラベル付けされ、第2の潜在的治療ラインは、両方の治療ラインが5月以前および5月以降の間隔でそれぞれ最高順位付け潜在的治療ラインであるときにその第2の治療ラインとしてラベル付けされ得る。それに加えて、人工知能エンジンは、治療ラインおよび/または反復的に連続する治療ラインを識別し、ラベル付けするように訓練されてもよい。
【0064】
図3図5のモジュールは、次のステップまたはプロセスのうちの1つまたは複数を実行するように構成され得る。
【0065】
一例において、ルールのセットが、患者の記録から1つまたは複数のLoTをラベル付けするプロセスをガイドし得る。ルールは、1つまたは複数の「ハード」ルールまたは「ソフト」ルールを含み得る。
【0066】
ハードルール
前立腺癌の初期診断後、患者にロイプロリドを処方し、生涯投与することが一般的であり得る。したがって、EMRにロイプロライドが出現した後、LoTが変更されたとしても、常にLoTの一部として残り得る。別の例示的なハードルールは、治療中止、転移、または進行性疾患転帰など、LoTの変更を必要とするいくつかの介在事象を含み得る。その反対もハードルールとして符号化され得る。たとえば、アベマシクリブへの投薬変更が記録された患者は、一般に乳癌の転移によってのみ出現する。EMRが不完全であり、患者の癌が転移によって広がったことを記載していない場合でも、これはインピュートされEMRに追加されるとともに、それぞれの治療間隔、潜在的LoT、または検出後LoTをセグメント化し得る。同様に、一方のクラスの薬物から別のクラスの薬物への進行もハードルールとして実装されてよく、それぞれの治療間隔、潜在的LoT、またはLoTのセグメント化を強制し得る。
【0067】
ソフトルール
ルールが形成されるが、条件付きで適用され得るときに、それらはソフトルールとして符号化され得る。一例において、癌専門医は、LoTを異なる仕方で各々定義する、すなわち、一部をカルボプラチンとシスプラチンとを一緒にLoTと見なすが、その後のメンテナンスペムブロリズマブをLoTのコア部分ではないと見なし得るものも、シスプラチンおよびカルボプラチンをメンテナンスペムブロリズマブと併せて1つのLoTと見なし得るものもいることに留意されたい。副作用回避のためとは言え、逸脱を新たなLoTと考える人もいれば、そうでない人もいる。これらのタイプの選好は、LoTに追加の重みを与えるが、EMRで見たときに新しいLoTが生成されることを必要としないソフトルールとして生成され得る。2つの薬剤が、同じ有効成分を有する、または異なる有効成分で同じ効果を達成するなど、類似している場合、一方から他方への変更は、LoT変更の有無を決定するために加重されてよい。さらに、一方のソフトルールを適用することが別のソフトルールを適用することよりも好まれることが記録され、医師毎または施設毎に適用され、それにより特定のソフトルールが、そのソフトルールの使用を選択した特定の医師または施設のケアの下にある患者に基づき条件付きで適用され得る。
【0068】
アルゴリズムの方法論および出力例
一アプローチにおいて、EMRおよびキュレーションされた進行レポートは、すべての診断、薬剤、有意な事象、ならびに薬剤の組み合わせ、有意な事象、および薬剤の他の組み合わせに基づき任意のLoTを識別することに関連し得る他の特徴について解析され得る。MLAは、大きく分けて2つのステップで機能する。最初のステップは、EHRおよびキュレーションされた経過記録をまたがる投薬、転帰、診断を含む、異種のデータソースを合成し調和させ、患者ケアの固有の間隔を作成することからなる。第2のステップでは、これらの間隔のすべての可能な組み合わせを考慮し、しかるべくLoTを割り当てる。薬歴がTHECATSATという文字列として表現される辞書的例では、各文字は第1のステップによるダイジェスト作成の後、固有の薬剤の組み合わせを表し得る。患者データにまたがって訓練した後、第2のステップのゴールは、ヒューリスティックを考慮して、共通の投薬パターンを認識し、これを「THE」+「CAT」+「SAT」に分離することである。患者EMRに基づく例は、図8図13Fに関して以下で説明される。
【0069】
モデルの訓練
モデルの訓練は、大きな訓練コホート内の各患者に対する固有の治療間隔(「T」または「H」のような、上記の例からの「文字」)を定義すること、集約のすべての組み合わせ(T+HEC+AT対THE+CAT)を反復的に考察すること、これらの集約を割り当てること、これらの結果として得られる集約(単語)の頻度を計算すること、終了条件に到達するまで集約を再割り当てることからなるものとしてよい。集約のこれらの組み合わせは、整数の結合のアプローチを使用して列挙される。そのような5つの薬剤のLoT表現を有する簡素化された例において、整数の結合のアプローチを使用して16の異なる可能なLoTグルーピングに分割する。
【0070】
5の16個の合成は次の通りである。
● 5
● 4 + 1
● 3 + 2
● 3 + 1 + 1
● 2 + 3
● 2 + 2 + 1
● 2 + 1 + 2
● 2 + 1 + 1 + 1
● 1 + 4
● 1 + 3 + 1
● 1 + 2 + 2
● 1 + 2 + 1 + 1
● 1 + 1 + 3
● 1 + 1 + 2 + 1
● 1 + 1 + 1 + 2
● 1 + 1 + 1 + 1 + 1.
【0071】
この頻度分析は、診断情報、臨床情報、および有意な事象と併せてハード/ソフトルールと組み合わされ、それにより、各結合に対する包括的確率推定を提供し得る。次いで、この最もありそうな結合(THE+CAT+SAT)が、割り当てられたLoTとして出力される。
【0072】
一ゴールは、テキストの大きなコーパスを研究した後、THE|CAT|SATと読めるように、この文字列の切り出し点を識別することである。アルファベットの各文字が子音(C)および母音(V)などの何らかの下位階層にマッピングされていれば、このような問題はより簡単で、上記はT→C、H→V、E→C、C→C、A→V、T→C、S→C、A→V、T→Cと読めるということもあり得る。この場合、セパレータCVC|CVC|CVCを学習する方がはるかに簡単である。このために、解剖治療化学(ATC)分類システムは、薬物の有効成分を、作用する器官またはシステムおよびその治療的、薬理学的、および化学的特性に従って分類する薬物分類システムである。これは世界保健機関の薬物統計方法論協力センター(WHOCC)によって管理されており、1976年に初めて発表された。この医薬品コーディングシステムでは、薬物を、作用する器官またはシステム、その治療の意図または性質、および薬物の化学的特性に従って異なるグループに分ける。異なるブランドは、同じ活性物質および指示を有している場合に同じコードを共有する。各下位レベルのATCコードは、単一の指示(または使用)において医薬品として使用される物質、または物質の組み合わせを表している。これは、1つの薬物が複数のコードを有することができる、たとえば、アセチルサリチル酸(アスピリン)はA01AD05(WHO)を経口局所治療のための薬物として、B01AC06(WHO)を血小板阻害薬として、N02BA01(WHO)を鎮痛および解熱薬として有し、さらには1つのコードが複数の有効成分を表すことができる、たとえば、C09BB04(WHO)はペリンドプリルとアムロジピンとの組み合わせであり、2つの有効成分は単独で処方されたときにはそれ自体のコード(それぞれC09AA04(WHO)およびC08CA01(WHO))を有する。ATC分類システムは厳密な階層構造になっている、すなわち、親を有しない最上位の14のコードを除き、各コードは必ず唯一の親コードを有する。これらのコードは、意味的識別子である、すなわち、それらは、それ自体親の完全な系統を表す。ATC階層は、所与の薬剤に対して第3レベル階層と第4レベル階層を提供する。各薬剤をこの階層に再マッピングできれば、特にデータセットがより小さいか、または極めて高い薬剤カーディナリティがある文脈では、これらのより単純な表現においてLoTを定義することの改善が実現され得る。注目すべき具体的な事例は、1つの癌で極めて一般的であるが、従来のMLA技術を使用して学習することが困難である、ホルモン維持療法および他の療法であり得る。
【0073】
たとえば、乳癌LoTでは、コホートは、乳癌に関連する約55の固有の抗悪性腫瘍薬を有し得る。これらの薬剤をそれらの基礎となるATC階層に、レベル3または4のいずれかを通じてグループ化すると、その結果、ATCレベル4の下で20、およびATCレベル3の下で9というこの薬剤空間の著しい減少が生じる。識別されたLoT状態(乳癌の患者セット全体からのLoTの分類)の数は、薬剤名のみを使用して1117であり、ATCレベル4の下で656、ATCレベル3の下で289である。大まかに言って、次第に非特異的な薬剤グルーピングを採用してゆくと、固有の「薬剤」の数は1/2に減少し、それに応じて、出力モデルにおける薬剤状態の数はおおよそ1/2減少する。
【0074】
ATC階層によって提供される同等性は、主として乳癌で観察される「維持」問題を解決するために実装された。第一選択である化学療法(ドキシサイクリンおよびシクロホスファミド)に続いてタモキシフェンまたはアナストロゾール(ホルモン療法)を行う患者がしばしば見られるが、これはすべて1つのLoTと見なされる。しかし、基本患者データからLoTを識別することに対する純粋な頻度ベースのアプローチでは、ほとんど常に、化学療法およびホルモン療法は別のLoTであると言うが、それは、ホルモン療法はどこにでもあるものだからであり、全患者投薬状態の半分は、ホルモン療法であり(すなわち、患者が少なくとも1つの薬剤を服用していれば、半分の時間は、ホルモン療法である)、第2に、第一選択として化学療法を受ける患者は、時間の半分である、180日以内にホルモン療法に移行する。言葉の例(THECATSAT)に戻ると、これは、人はEをほぼいつでも見ていて、THを規則正しいペースで見ていて、THEについては時間のほぼ半分であると言っているようなものである。純粋な頻度では、TH|Eが結果である。これは、部分的にはEの偏在性(prob(E)が高い)によりprob(TH)*(E)>prob(THE)であるからである。実際、これは、Eが後にある、または単にEである何百ものバリエーションを観察するからである。この場合、Eは単一の文字のみであると考えるであろう。
【0075】
したがって、維持の問題は、純粋頻度モデルのコア問題の結果であり、Eの出現が重要でないとき、および第2に、Eが一般的に単独で見られる場合、およびTH、実際には1つの「単語」になり得るいくつかの事例があるときに常に分離していなければならないことである。これらの両方は、確率表現に符号化されてよく、THEは、prob_1(TH)*prob_2(E)<prob_1(THE)である場合に単語であり、prob_1は所与の文字を第1(1)、第2(2)などを観察する確率を示す。後者は、THEの「word-ness」がprob(E|TH)>prob(X|TH)*prob(E|X)である、すなわち、所与のTHが前にあり、Eの存在が偶然(または任意の他の所与の薬剤、X)に比べて有意に高い場合であるとして符号化されるものとしてよく、場合によってはEの頻度によって変調される。
【0076】
どのモデルを実装すべきかを選択することは、基礎となるシステムの性能を評価する事例である。治療ラインは、しばしばNCCNガイドラインの結果であり、癌専門医は、ほんのわずかの変更で、所与の時点における「計画」を選択し、転帰が観察された後これを変更し、および/または治療への患者の反応はよくない。したがって、後者の方がより適切な確率空間の表現方法である。前者の表現は、prob_1(TH)*prob_2(E)!=prob_2(TH)*prob_3(E)を意味し、時間順序付けが厳密に確率を変化させることを意味する。これは同様にその場合である可能性が高いが、捕らえるべきより望ましい特徴は、EまたはTHだけを見ることがTHEが単語かどうかを予測することに重要ではなく、むしろTH(X)と(Z)Eとを比較し、X=E、Z=THのときに有意な濃縮があるかどうかを予測することに重要であるということである。
【0077】
上で説明されているように、確率モデルは、その生の形態において、進行事象を通常インピュートする方式への不明確なマッピングを有する。最悪の場合、進行事象を実際には見ることはほとんどないときに一貫して進行事象をインピュートするときがある。モデルと転帰との間の一致を一層高めるために、以下のような基礎となる確率モデルを用いて強化されたモデルおよび対応するモデルの訓練が実施される。
prob(A→B)=prob(A)*prob(B)*prog_w(A,B )対prob(AB)*[1-prog_w(A,B )]、
ここで、prog_w(A,B)は、投薬状態Aと投薬状態Bとの間の観察される進行発生率の推定を表す。上記の状態がLoTブレークを開始することは、A→Bへの遷移で通常観測される進行の発生率により修正され、この状態がより一般的になればなるほど、両者が1つのLoTである状況と比較してより可能性が高くなる。このモデルは、prog_w(A,B)を、この遷移を観測した総回数に対するこの遷移において観察された進行の回数として実装し得る。しかしながら、大多数の遷移は、ほとんど未観察なので、モデルに著しいバイアスをかけることになる。0.5に向かう傾向のある「ベイズ」推定(つまり、進行発生率ではなく、モデルの基本的な頻度空間に決定を任せる)がなされる。サンプルサイズが大きければ大きいほど、観察された推定値を使いたくなり、小さければ小さいほど、0.5を使いたくなる。これを実装する古典的な方法は、加法的平滑化であり、prog_wは次の通りであり得る。
prog_w(A→B)=(prog_f)±abs(prog_f-0.5)*(upper_95(prog_f)-lower_5(prog_f))。
ここで、prog_fはA→Bの遷移で観察された進行の回数を全体の発生率で割ったものであり、upper_95(prog_f)、lower_5(prog_f)はprog_fに対するClopper Pearson法に基づく95番目と5番目の二項比率CI推定値である。サンプルサイズが大きくなると、信頼区間が0に近づくので、prog_fに適用される「センタリング」は減少する。サンプルサイズが増加すると、信頼区間は発散し(最大1.0)、これは最大のシフトが適用されることを意味し、prog_wは0.5に向かう傾向を有する。
【0078】
ATCおよび強化されたモデルは、共通の遷移と最も高い一致を示している。最も重要なことは、モデルが次にデータ(トラスツズマブ→トロゾール)との最も少ない有意な矛盾を示し、データ中の1/319の発生率は出力中の319のうちの30に匹敵し、これは極めて小さな差であるか、またはタキサン→トロゾールなどの~29の追加事象の注入である。これは、化学療法などの強力で迅速な開始療法から維持療法への遷移として極めて一般的なものである。即時LoTラベル付け人工知能エンジンの利点は、要求実体に基づき可能な3つのLoTをカバーするソフトルールにおける微妙な差異を許すことである。は開始療法、維持療法、または開始療法と維持療法の組み合わせを含むことが可能であるLoT。
【0079】
したがって、強化されたモデルは、高次の相互作用の可能性を維持しながら、維持療法に関する誤ったLoTの変化を除去するか、またはモデルと観察されたデータとの間の矛盾の発生を減少させる。
【0080】
別の実施形態において、教師なしモデルなどの、人工知能モデルは、患者の健康情報または他の治療情報に関して訓練され得る。教師なしモデルは、患者が受けた投薬または他の療法および進行に関する情報、または治療間隔優先事象を含む情報に関して訓練され得る。いくつかの例において、モデル訓練と関連性のある進行事象は、第1の療法が中止された後、第2の療法が開始される前に発生した進行事象である。
【0081】
いくつかの実施形態において、患者の健康データを使用して訓練されたモデルによって識別される治療ラインは、National Comprehensive Cancer Network(NCCN)によって公開されているガイドライン、FDAガイドライン、臨床試験、または他の出版物などの、所定の標準的治療法ガイドラインに従う。
【0082】
いくつかの実施形態において、半教師ありアプローチは、多数の治療ラインがNCCNガイドライン、FDA勧告、臨床試験、医薬品ファクトシート、または他の出版物からキュレーションされる場合に実装され、次いで、半教師ありアプローチの教師なし部分においてキュレーションされたラベルに一致しないラベルが生成された患者におけるラベルを識別するための出発点として使用され得る。当業者であれば、半教師ありアプローチは、セットアップおよび実行のために操作中に追加の時間を要するが、正確なLoT指定を含む出発基準を与えられているのでより信頼性の高いLoTを提供することを認識するであろう。
【0083】
いくつかの実施形態において、2つまたはそれ以上の治療の投与日が互いの時間期間内にあるときに同じ治療識別子を有する治療から連結治療を生成することによって治療が生成され得る。いくつかの実施形態において、時間期間は、少なくとも一部は病状に基づくことができる。いくつかの実施形態において、時間期間は、少なくとも一部は治療識別子に基づくことができる。いくつかの実施形態において、時間期間は、少なくとも一部は病状および治療識別子に基づくことができる。
【0084】
任意の特定の患者記録について、記録から識別される治療ラインは、標準的治療法ガイドラインで公表されている治療ラインに揃えるものとしてよい。たとえば、卵巣癌では、標準的治療法ガイドラインは、2またはそれ以上の白金ベース治療ラインを受け、最近の再発治療ラインに対して完全もしくは部分的反応を有していた白金感受性疾患の患者に対する維持療法としてニラパリブを推奨し得る。ウェブページ160A~160NまたはGUI170を介して実行されるものなどの分析は、NCCN、FDA、または他のガイドライン設定実体からのガイドラインへのコンプライアンス統計を医師または施設に対して提供し得る。
【0085】
治療ラインのいくつかは、NCCNガイドラインで識別される治療法ガイドラインなどの、標準的治療法ガイドラインに一致する。治療ラインのうちの他のものは、標準的治療法ガイドラインと一致しない場合がある。これらの場合において、LoT決定は、間違っている可能性のある医療記録内のデータを識別する品質改善の目的に使用され得る。他の場合では、LoT決定は、FDA承認された療法の組み合わせを試験する試験などの臨床試験に参加した患者を識別し得る。他の例では、LoT決定は、現在の標準的治療法ガイドラインにまだ反映されていない臨床診療の新しい傾向を識別し得る。たとえば、LoT化学療法レジームとその後のLoT維持標的療法(PARP阻害剤またはEGFR阻害剤のような標的阻害剤など)を受ける患者の卵巣癌における治療ライン。
【0086】
別の半教師ありアプローチは、LoTのタイムラインに対するバケット化を強制し得る。たとえば、1980年には、2つの薬物を有する最初のLoTが標準であり得るが、1993年には、それらの2つの薬物は、LoTとして中止され、置き換えられる。半教師ありアプローチでは、公的記録からガイドラインの変更を取り込むか、または臨床試験に含まれることに基づき新しい治療がリリースされた年を識別し、LoTの発展が長年にわたって追跡されるように教師なしLoTキュレーションをLoT変更の年の間に来るよう境界を付け得る。一実施形態において、それらの境界は、スライディングウィンドウとして設定され、図7に関してより詳細に示されるようなEMと類似の最適化されたEMに基づき自動的に決定され得る。類似のバケット化は、医師、施設、州、地域、国、または患者のコホートに対する他の共通の特徴などによる地理的基準に基づき実行され得る。教師なし学習は、既存の患者記録から意味のあるLoTを引き出すために、時間または場所に基づき新しいウィンドウを識別しようと試みることの本質的に可変な性質に起因してこれらの分析に優れている。分析は、ウィンドウイングを使用して実行され、それにより、特定のLoTが最も効果的である地域、施設、または年を識別し得る。
【0087】
いくつかの実施形態において、教師なしアプローチは、異なる癌およびその投薬に従ってシステムを微調整することを可能にする。たとえば、前立腺癌の治療は、たとえば、伝統的に短い間隔を有する肺癌を治療するために投与される静脈内投薬よりも長い間隔で服用される経口薬剤を含む。制限的な構造化モデルは、癌亜型およびラベルの微妙な差異は、訓練中にプログラマーによって列挙されるか、またはキュレーションされたデータのシステムから利用可能であるような薬剤のカテゴリのみに制限され得るので、ラベルを学習するのに困難が伴い得る。
【0088】
図6は、キュレーションされた患者履歴から複雑なキュレーションされたフィールドをインピュートし、それらを非キュレーション患者または少量のデータを有する患者に適用する方法を実装するルールベースの前処理を伴う人工知能エンジンアプローチを使用して治療ライン(LoT)を準備し、訓練し、割り当てる一実施形態であるシステム600を示すフローチャートである。
【0089】
患者の薬歴は、経過記録および電子医療記録(EHR)MR112などのデジタル文書の機械学習、および医療専門家アノテーションの組み合わせから導出されるキュレーションされた医療記録(MR)114の組み合わせを通じて臨床医療記録110として捕捉される。患者の医療記録の特徴は、構造化され、システム600内の複数のモジュールに送信され得る。システム600は、この冗長で反復的で、時には一貫性のない生の入力を取り込み、患者の癌を治療するために使用される最も顕著な薬剤を捕らえる一連の凝縮された記録に変換することに焦点を当てている。次のステップは、この変換を実行するための例示的な方法である。
【0090】
別の実施形態では、記録調和122は、薬剤フィルタリングモジュール605、薬剤組み合わせモジュール610、薬剤調和モジュール615を含み得る。薬剤フィルタリング605は、キュレーションされた記録114およびEHR112から臨床健康記録110の薬剤を、抗悪性腫瘍薬などの、薬物癌療法にフィルタリングすることを含み得る。フィルタは、また、治療ラインに関連する薬剤を識別するなどのために、他の薬剤特性に対して適用され得る。典型的には治療ラインの一部ではない薬剤をフィルタリングすることで、利用可能な膨大な数の患者記録を処理するのに必要な計算負荷を低減する。たとえば、電子医療記録(EHR)は、鎮痛剤、抗生物質、プラシーボ、マルチビタミンなど様々な、発注され、患者に投与されるすべての薬剤からなる。フィルタリング段階605は、抗悪性腫瘍薬(抗癌剤)として識別され内部値セットに記憶されていることのない任意の薬剤を除去する。この値セットは、臨床チームによって定義されるか、または機械学習モデルさらには内外の出版物、臨床試験、FDA承認、NCCNガイドライン、または医薬品レポートからキュレーションされてもよい。
【0091】
薬剤組み合わせ610は、22日などの閾値日数(d)内の薬剤記録(MR)を組み合わせるものとしてよい。閾値は、薬剤、薬物クラス、活性成分によって設定されるか、または人工知能エンジンを介して患者記録から学習されてもよい。EHR MRは、薬剤の発注および投与毎に発生する反復性が非常に高い定期的記録である。多くの抗腫瘍療法は、22d(1サイクルと呼ばれる)毎に投与され、したがって22d内の記録を組み合わせることによって、患者が薬剤に投与されている持続時間全体を捕捉する著しい記録圧縮が達成され得る。手順的には、日付インピュテーションのための1つのプロセスが、各レコードに対して実行されるものとしてよく、これは以下を含む。
a) MRが年単位の開始日または終了日を有する場合、または開始日がない場合、調和615に進む。
b) MRが月のみの開始日または終了日を有する場合、その月の15日にインピュートする。
c) MRが欠落終了日を有する場合、終了日を開始日に設定する。
ネイティブの記録およびキュレーションされた記録について別々に(つまり、ネイティブの記録のすべての薬剤について次のステップをさらにはキュレーションされた記録のすべての薬剤についても実行する)、各薬剤について次を実行する。
i) 薬剤の各MRを開始日順に並べ替える。
ii) 薬剤の各MRについて:
(1) 記録の最後と後続の記録の最初とを比較する。MRが互いの22d以内である場合、記録を組み合わせる。これは、記録の終わりを後続の記録の終わりに設定し、その薬剤に対する介在するMRを削除することによって達成され得る。
(2) 次のレコードに進む。
【0092】
調和615は、冗長な、時には矛盾する、情報を識別し、是正するものとしてよい。「調和」は、機械学習アルゴリズム、内外の出版物および医療専門家から学習したヒューリスティックのセットを指し、これらの冗長性または矛盾を取り除き、EHR MR112の高い時間分解能とキュレーションされたMR114の専門家知識とを組み合わせたMRの一貫性のあるセットを確立する。手順的には、調和の一実施形態は、以下のことを伴い得る。
a) 何らかのキュレーションされたEMRの時間分解能の低さを是正し、調和に必要に応じて1日、1週間、または1カ月以内に正確になるようにMRの分解能を満たすように次のインピュテーションルールを課す。以下のアプローチは、これらの記録の最大の持続時間を想定し、場合によってはより高い分解能を有するEHR MRがこれらの日付を明確にすることを可能にする。
i) 月のみの開始の場合、日をその月の1日に設定する。年のみの場合、月を1月に設定し、日を1日に設定する。
ii) 月のみの終了の場合、その日を15日に設定する。年のみの場合は、月を12月に設定し、日を31日に設定する。
b) すべての記録がネイティブであるか、またはキュレーションされており、調和の必要がない場合、間隔生成124に進む。
c) 組み合わされた記録を開始日で並べ替える。
d) 患者記録内の各薬剤タイプについて:
i) 空の「出力リスト」を作成する。(リストの最後のエントリはoutput[-1]として参照される)
ii) この薬剤タイプの各記録について:
(1) これが最初のエントリである場合、出力に追加する。
(2) 現在の記録がoutput[-1]より後に発生した場合、記録を出力に付加する。続く。
(3) 記録がoutput[-1]よりも高い分解能の開始日または終了日を有する場合(月または年の分解能など、および記録は日の分解能を有する)、低い分解能の日付を高い分解能の日付に置き換える。
(4) 記録がoutput[-1]の時間枠内に出現する場合(数カ月間のキュレーションされた記録内に出現する1日の記録など)、この異質な記録を出力リストから除外する。
e) 出力リストを、分類され構造化された各MRの薬剤を有する調和された薬剤テーブル620として返す。
【0093】
別の実施形態において、間隔生成124は、原発性癌(PC)関連性フィルタ625、日付パディング630、PCキュレーションモデル635を使用するMRの組み合わせ、および間隔生成640に対するモジュールを含み得る。治療ラインは、1つまたは複数の薬剤の投与(これに限らないが「レジメン」など)を記述する連続的医療ケアの期間によって最もよく説明される。ここで、連続的ケアのこれらの期間は、「間隔」、または「治療間隔」と称される。「間隔生成」は、調和されたMRをこれらの治療/投薬間隔(MI)に変換するプロセスである。これらは、患者が薬剤の1つのセットを服用している持続時間を単に表し、患者の原発性癌型に関連する抗悪性腫瘍薬の変更、追加、または差し引きが生じたときに新しいMIが開始する。
【0094】
PC関連性フィルタ625は、さらに患者の原発性癌(PC)、診断、または治療ラインにバイアスをかけるための他の識別子に関連する薬剤によって調和された薬剤テーブルをフィルタリングし得る。このリストは、機械学習モデル、内外の出版物、および医療専門家によって定義される。これは、いくつかの癌(前立腺癌など)では支持療法であるが、他の癌(骨肉腫など)には顕著であると考えられるデノスマブなどの薬剤を取り除く。PCフィルタリングの一実施形態は、以下のことを伴い得る。
a) PC関連性フィルタを使用して患者MRをフィルタリングする。
b) 残りのMR内の有意な不確実性のある患者をフィルタリングする。これは以下を含む。
i) 年のみの投薬記録。
ii) 実際の薬剤名ではなく、キュレーションされた進行メモから存在する曖昧なまたは一般的な薬剤名(「白金化合物」または「抗悪性腫瘍薬」など)。
【0095】
日付パディング630は、日付を識別し、パディングし得る。多数のMRが、開始日、または開始日に相当する終了日のみからなる。投薬間隔を構築するために、最小限の持続時間が必要であり、したがってこれらの記録は、間隔区別閾値(DATE_PAD、典型的には21d、DATE_PADは、使用者の閾値選択に基づき使用者によって設定され得るチューニング可能なハイパーパラメータ)を使用して終了日を与えられる。一実施形態は、以下のことを伴い得る。
A) 記録が終了日を有しないか、または終了日==開始日の場合、終了日=開始日+DATE_PADを設定する。
【0096】
PCキュレーションモデル635を使用するMR組み合わせは、薬剤特異的ロールアップを実行するものとしてよい。多数の抗悪性腫瘍薬がおおよそ21d毎に投与される一方で、いくつかのホルモン治療薬は毎月またはそれ以下の頻度で投与される。これを考慮するために、薬剤特異的ロールアップ(典型的には22d~180d)が、各薬剤について機械学習および医療専門家の知識との組み合わせから学習され得る。このプロセスは、PCキュレーションモデルのセクションに関してより詳細に後述される。一実施形態は、以下のことを伴い得る。
a) 学習された薬剤特異的ロールアップは、各薬剤記録に適用される。各薬剤および各記録について:
i) 前の記録の終わりと後の記録の始まりがこのロールアップ内にある場合、その記録を組み合わせ、2つの記録を縫い合わせる。
【0097】
間隔生成640は、MRから投薬間隔への変換を含んでもよい。患者の薬歴は、典型的には、時間的に重なり合う複数の抗悪性腫瘍薬MRからなる。この変換処理で、1つまたは複数の薬剤の均質な治療の定義済み間隔が生成され、抗悪性腫瘍薬が患者の投薬記録から追加されるか、または差し引かれたときに必ず、新しい投薬間隔が開始される。一実施形態は、以下のことを伴い得る。
a) 結果的に得られた投薬記録を開始日で並べ替え、各記録について以下を実行する。
i) 次のうちの1つに該当する場合、新しい間隔を作成する。
(1) 最初の投薬記録、
(2) 投薬記録が最後の間隔の終了後に開始する、または
(3) 投薬記録が最後の間隔終了の終わりの間隔区別閾値(たとえば、22日)以内に開始し、記録の開始または前の間隔の終了のいずれかが月単位の分解能である。
ii) 投薬記録が最後の間隔と重なる場合、この投薬記録をその間隔に追加する。
iii) 複数の重なる記録があることにより、少なくとも間隔区別閾値の間隔が構築できない場合、その患者に対してLoTは決定され得ず、失敗状態を返す。
iv) そうでない場合、投薬記録は複数の他の間隔にまたがって出現し、したがってこの薬剤を重なり合う任意の記録に追加する。最後の間隔の終了後も記録が続いている場合、記録の残り部分に対して新しい間隔を作成する。
b) 投薬間隔645を出力し、治療間隔を含むすべての記録、開始および終了、および関連付けられている薬剤を記述する。
【0098】
当業者であれば、上記のステップは、本開示が働き得る実施形態を表していることを理解するであろう。本明細書の開示と一致する他のシステムおよび方法も利用可能である。
【0099】
治療ライン(LoT)割り当て126は、転帰650、モデル化されたLoT頻度655、推定確率660、LoTラベル付け665、または後処理LoT670で間隔を精緻化する1つまたは複数のモジュールを備え得る。患者の治療ラインは、その人の癌を管理するために癌専門医によって採用される治療戦略を捕らえるものである。各ラインは、1つまたは複数の計画された抗悪性腫瘍薬であり、患者に間隔優先事象(たとえば、患者の予後悪化または転移事象を示す画像結果)が発生したときに、薬剤の新しいセットまたは新しい「治療ライン」が提案される。反応データが不完全なせいで(多くの場合に、単独で経過報告内に存在する)、これらの予定外の事象は、患者MRではしばしば見あたらない。主なゴールは、一般的な治療パターンを学習し、反応データが乏しい場合にこれらを適用して、計算によって導出されたLoTの割り当てを生成することである。ここで、LoT割り当て126から生成された間隔は、存在するときに、患者の臨床健康記録110からの反応データでアノテーションされ、精緻化された間隔リストを生成する。整数の結合(COI)アプローチを使用して、これらの間隔セットの最も可能性の高い組み合わせが決定され、その患者の増分的に数値化されたLoTが考慮される。いくつかの実施形態において、1つまたは複数のLoTがアノテーションされ得る。いくつかの実施形態において、1つまたは複数のLoTはアノテーションされ得ない。いくつかの実施形態において、治療は、アノテーションされ得る。いくつかの実施形態において、治療は、アノテーションされ得ない。
【0100】
転帰で間隔を精緻化すること650は、LoTの変化の絶対的な指標である、転帰などの、いくつかの「治療間隔優先事象」または患者事象を識別し得る。これらは投薬間隔に追加され、間隔の1つまたは複数の分割されたセットからなる精緻化された間隔リストを生成する。完了のためのそのような1つのプロセスは、以下を含み得る。
a) すべての患者転帰を収集し、LoTに関連する転帰および介入にフィルタリングする。これらは、去勢抵抗性前立腺癌(CRPC)診断などの、癌型固有のものであるか、または一般的に転移診断もしくは進行性疾患転帰のようなものであり得る。一般的に除去される転帰は、完全および部分反応(LoTが成功し、継続されるべきであることを示す)を含む。
b) 各転帰および患者間隔を繰り返し、新しい間隔の開始の間隔区別閾値内に転帰が出現する場合、この患者間隔リストを間隔の2つの別々のセットに分離する。転帰が2つの間隔の閾値内にある場合、時間的に近い方の間隔で分離し、後者を選択する。
c) 患者精緻化間隔リストを繰り返し、治療ライン最大持続時間閾値(たとえば、180日)分離が出現した場合に、追加のセットに分ける。
【0101】
モデル化されたLoT頻度655は、各治療間隔に対して整数分割の結合を列挙するか、または潜在的な治療ラインに分割する薬剤のすべての順次的な順列を生成するものとしてよい。一例において、これは、患者記録に関して訓練された人工知能エンジンを含んでもよい。
【0102】
推定確率660は、潜在的LoT、および各LoTに対するそれぞれの尤度を生成するための治療間隔の集まりを受け取るものとしてよい。いくつかの実施形態において、655および660は、人工知能エンジンが、転帰データに基づき精緻化済み間隔を受け取り、間隔から潜在的LoTを分離し、さらには各潜在的LoTがLoTである尤度を測定する確率を生成するように単一の段階に組み合わされ得る。一例において、プロセスは以下を含んでもよい。
a) 精緻化された間隔リストを、転帰を与えられたセットに分離した後、各セットについて繰り返し、以下を実行する(LoTカウンター=1を設定する)。
i) 整数の結合アプローチ、または患者データからLoTを識別するように訓練された教師なし人工知能エンジンを使用して、間隔のすべての可能な結合(潜在的LoT)を計算する。
ii) モデルの訓練中に学習された頻度を使用してこれらの間隔結合の各々の確率を計算する。所与の間隔組み合わせの全確率は、個別の組み合わされた間隔の積である(2間隔の場合、これはProb(間隔1)*Prob(間隔2)およびProb(間隔1の後に間隔2)である)。
iii) 最も高い確率を有する間隔の組み合わせをLoT割り当てと考える。(Prob(間隔1)*Prob(間隔2)>Prob(間隔1の後に間隔2)の場合、間隔1は第1のLoTとなり、間隔2は第2のLoTとなる。)
【0103】
LoTラベル付け665は、投薬間隔のセットの最も可能性の高い結合(各連続する時間期間について最高の尤度を有する潜在的LoT)を識別し、これは患者のLoTと考えられ得る。一例において、プロセスは以下を含んでもよい。
i) これらの間隔組み合わせの各々に、LoTカウンターを用いて番号を振り、毎回増分する。(2間隔の場合に、LoT1が割り当てられた間隔が先行していた場合、間隔1はLoT2を割り当てられ、間隔2はLoT3を割り当てられる)。
【0104】
後処理LoT670は、是正されるかまたは修正され得るLoTを識別することを含んでもよい。たとえば、まれな場合では、連続する組み合わされた間隔は、薬剤の同じセットを有し得るが、薬剤または間隔に対する組み合わせ閾値を超える時間期間によって分離されていたが、いかなる治療間隔優先事象を有さず、したがって同じLoTであると考えられ得る。後処理で是正されるかまたは調整され得るパターンに入る任意のLoTは、同じLoTに割り当てられてよく、続くLoTは増分的に調整され得る。一例において、これは以下を含んでもよい。
a) すべての最も可能性の高い間隔結合を最終的LoTリストに組み合わせる。
b) 間隔結合の各々を繰り返し、以下を実行する。
i) 2つの連続するLoTが同じ薬剤を有する場合、それらに同じLoTを割り当てる(例:[ドキソルビシン、シクロホスファミドおよびドキソルビシン]|[シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシンおよびパクリタキセル、アナストロゾール]は最終出力リスト[ドキソルビシン、シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシンおよびパクリタキセル、アナストロゾール]を生成し、これは[ドキソルビシン、シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシンおよびパクリタキセル、アナストロゾール]に変換され、ここで、「|」バーは転帰を示し、「、」読点は新しいLoTを示し、「および」でグループ化された薬剤が組み合わせになっている)。
【0105】
いくつかの実施形態において、LoTストア150に記憶されているLoTテーブルなどの出力LoTテーブルは、jsonファイル、xmlファイル、または他の形式などの構造化形式であってよく、次の構造化されたデータフィールドのサブセットを有し得る。
● patient_id:テーブル間で一意のpatient_id。
● interval_start:投薬間隔の開始。
● interval_end:投薬間隔の終了。
● medication:関連する薬剤(1行に最大1つ)。
● lot:割り当てられたLoT。(1~n、整数)。
● complete_lot_start:1つまたは複数の間隔にまたがる、包括的なLoTの開始。
● complete_lot_end:1つまたは複数の間隔にまたがる、包括的なLoTの終了。
● complete_lot_medications:所与のLoTにおける関連付けられている薬剤を「+」記号で連結してリストする。
● emr_derived:LoT全体がEHRにのみ存在する投薬記録に由来する場合は1、そうでない場合は0。
● success:LoTが患者について正常に定義できたかどうか。これは、患者がLoTに対して必要な年のみの薬剤を有しているか、または結果として治療間隔をもたらす投薬記録を有する場合に不成功である。
【0106】
生成された後、LoTテーブルは、LoTストア150に記憶されるか、または分析モデルでその後使用するために患者のEHRの構造化データと組み合わされてもよい。
【0107】
原発性癌(PC)キュレーションモデルアルゴリズム
上で説明されているように、異なる薬剤は、原発性癌型により異なり得る異なるサイクルを有する。次のステップは、キュレーションされたMRに存在する医学的知識を活用することによって注目している特定の薬剤に対する原発性癌型のこのサイクル時間を推定するために使用され得る。キュレーションされたMRによって記述されているような薬剤投与の典型的な持続時間を捕捉し、これを使用して、EHR MRに適用されたときにこの典型的な持続時間を繰り返すその薬剤のサイクルタイムを提案することによるものである。これは、非常に反復的なEHR投与記録を、アブストラクターがキュレーションし得るキュレーションされたMR持続時間の「外観」に変換する効果がある。一般性を損なうことなく、このプロセスは、以下、単一の原発性癌型に対する単一の薬剤について説明されているが、本開示を損なうことなく、複数の癌型および複数の薬剤に拡張され得る。
1. 入力:所与の原発性癌型に対する所与の薬剤についてのキュレーションされたMRおよびEHR MR。
2. 次の特性を有するキュレーションされたMRをフィルタリングする:
a. 開始日とは異なる終了日
b. 少なくとも月単位の分解能による開始日および終了日。
3. MR終了日~MR開始日と定義される、これらのキュレーションされたMRにまたがる薬剤投与の持続時間を計算する。
4. キュレーションされたMRにまたがる薬剤投与の持続時間中央値を計算する。
5. 最小間隔閾値(典型的には22d)から始めて、次を実行する。
a. 各患者についてこの閾値内のEHR記録を組み合わせ、(場合によっては)1つまたは複数の記録によって記述されている薬剤投与の持続時間を生成する。
b. これらの記録の各々について薬剤投与の持続時間(終了~開始)を計算する。
c. これらの記録すべてにまたがって持続時間中央値を計算する。
d. この中央値が(4で計算した)キュレーションされたMR中央値と等しい場合、この間隔閾値を「サイクル時間」として返すが、そうでない場合は、間隔閾値を増分する。
e. 増分閾値が最大間隔閾値(典型的には180dに設定される)より大きい場合、ループから出る。
【0108】
上記のアプローチは、中央値ではなく、キュレーションされた持続時間分布のカーネル密度近似を計算し、2つの分布の距離メトリック(ユークリッド距離、幾何学的距離、またはカルバックライブラーダイバージェンス)を最小化する閾値を返すものとして一般化され得る。
【0109】
図7は、3つの段階710、720、および730にわたる治療ライン(LoT)モデルを準備し、訓練し、生成する一実施形態を示すフローチャートである。
【0110】
モデルデータ準備段階710では、診断、予後、治療、および転帰に関連する患者情報のソースが、キュレーションされた、EMR/EHR記録を含む臨床健康記録110においてソースをまたがって集約される。これらの記録からの分析により、癌特異的臨床的洞察705、患者投薬714、およびキュレーションされた進行および治療逸脱712が生成される。たとえば、患者が前立腺癌と診断された場合、前立腺癌臨床洞察(前立腺癌の治療に直接リンクする薬剤、治療、または療法の種類、特定の薬剤、治療、または療法の前立腺癌に対する効果、前立腺癌におけるLoTに関連するコードにリンクする薬剤、治療、または療法名のリスト、去勢抵抗性前立腺癌(CRPC)診断への進行などの各癌型に対するLoTブレークを確立し得る進行事象など)は、要素705および712において、1つもしくは複数のデータベースまたは出版物などの内外のソースから取り出され得る。次いで、経過記録、検査結果、または他の手書き文書などの文書からキュレーションされた薬剤は、治療に対して効果を有する薬剤などのさらなる処理のための診断済み癌に関連する薬剤のみを含むようにフィルタリングされ得る。たとえば、頭痛のためのアンフェタミン、アレルギーのための抗ヒスタミン、うつ病のためのセラトニン受容体阻害剤、または診断された癌の治療以外の目的で患者が服用している薬剤などの無関係な薬剤は、LoT予測からフィルタリングされ得る。モジュール716での癌型によるLoTに関連する薬剤へのフィルタリングは、モデル化された日付および間隔718が各患者に対する診断に関連する治療からのみ計算されるように癌診断からうつ病薬をフィルタリングするように実行され得る。モデル化された日付および間隔718は、対応する開始日および終了日を含むものとしてよく、これはフィルタリングされたLoT薬剤リストに残っている薬剤の各々に関して生成されてよく、初期タイムライン間隔が生成されてよい。モデル化された日付および間隔718の集まりは、たとえば、すべての癌、器官特異的癌(乳房、肺、骨、血液、肝臓、前立腺など)、またはさらには非小細胞肺癌、非浸潤性乳管癌(DCIS)、浸潤性腺管癌(IDC)、トリプルネガティブ乳癌、または他の診断などの特定の診断の関連診断を有するデータセット内のすべての患者についてキュレーションされ
る。
【0111】
訓練段階720では、追加の癌特異的臨床的洞察が要素705で取り出され、段階710から要素718で計算された投薬間隔は、薬剤測定間隔頻度(w)722で受信される。追加の癌特有臨床的洞察は、自動LoTブレークを構成する日数(たとえば、急速進行する癌についてはこれは90日とすることが可能であり、より遅いペースで進行する癌についてはこれは180日とすることが可能であり、さらには前立腺癌に対するCRPC診断などの各癌型に対するLoTブレークを確立し得る進行事象)を含み得る。要素722において、治療/投薬間隔は、発生頻度を識別するためにすべての患者データにわたって比較され得る。たとえば、前立腺癌を有する患者では、治療/投薬間隔は、また、日数(w)に対応する幅を有するローリングウィンドウに従って精緻化され得る。このプロセスは、患者集団におけるLoTの最も代表的なセットを識別するために1つまたは複数のウィンドウサイズ(w=30日、90日、120日など)にわたって実行され得る。患者集団において識別された各投薬間隔について、期待値最大化(EM)が、間隔の信頼性を識別するために計算され得る。これらの間隔は、頻度のEMをループした後、LoT分割割り当て724において割り当てられ得る。最適なウィンドウサイズが決定された後、投薬頻度は、投薬頻度精緻化726で精緻化され得る。精緻化は、指定されたウィンドウサイズ(w)での収束が達成されるまで、頻度のEMをもう一回ループすることを含み得る。最も高い期待値を有する治療間隔のセットは、LoT(潜在的LoT)の最良の代表的セットとして選択され得る。すべての患者がLoTの基本セットを識別するように処理された後、段階130は、モデル化されたLoT頻度655から推定されたLoT頻度を出力し得る。
【0112】
モデルLoT割り当て段階730で、すべての患者にわたる推定されたLoT頻度655の集まりは、各新規患者の投薬間隔と比較され得る。LoT生成段階732において、潜在的LoTとして指定された治療間隔は、次いで、潜在的LoTの各患者の順位付けに対応する第1、第2、第3などのLoT分割に割り当てられ得る。整数の結合方法に従って列挙された、各潜在的LoT割り当て732は、LoTおよびLoTラベル付け734で患者のLoTとしてラベル付けされた最もありそうなLoTの対応する人気度によって順位付けされ得る。
【0113】
LoTラベル付けの例示的な用途は、図8図13に関して以下で説明される。例示的な実施形態は、図1図7のシステムおよび方法を含む、本明細書において開示されている方法およびシステムのいずれかに従って生成され、ラベル付けされてもよい。次の例は、本明細書における異なる方法およびアプローチが、患者記録の異なる例にどのように適用され得るかを例示するために提供される。
【0114】
図8図10は、一実施形態による組み合わせられたEMRおよびキュレーション記録システムからの患者医療記録、計算された投薬間隔、および予測された治療ライン(LoT)を示す図である。投薬、転帰、治療間隔優先事象、および他のLoT特徴を抽出するときに患者記録のタイプおよびソースが考慮され得る。これらの説明図は、記録内の1つまたは複数の治療間隔および潜在的LoTを識別するためのEMRとキュレーションされた記録との間の相互作用を強調する。
【0115】
図8は、転移性非小細胞肺癌と診断された第1の患者に対するLoT予測の説明図である。第1の患者は、2016年8月に一次診断802でNSCLCと診断された。治療過程における次の1年全体を通して、第1の患者を治療する癌専門医は、患者、第1の患者の薬剤、および関連する転帰を記述するいくつかの経過記録(上で「経過記録」として表されている)を作成した。このデータは、薬剤投与804の電子医療健康記録(EHR)により補完される。
【0116】
医療専門家(キュレーター)が、これらの経過記録の各々を調べ、各ノートからの表示される投薬および関連する転帰806を記録した。次に、経過記録の内容が説明される。
経過記録1(PN1):キュレーターは、2016年の8月に患者の一次診断さらにはペメトレキセド、ベバシズマブ、およびカルボプラチンのトリプレット化学療法808の最初の投与の日付を記録した。
PN2:キュレーターは、2016年10月のPN1のトリプレット療法808の終了、関連療法への部分的反応(表示なし、2016年10月)、および2016年11月のペメトレキセド/ベバシズマブ維持療法810の開始を記録した。
PN3:2017年1月、キュレーターは2016年12月に進行性疾患転帰812をペメトレキセド/ベバシズマブ維持療法810およびその関連する終了に記録した。また、癌専門医は、2017年2月に患者にニボルマブ814に投与する意向を記した。
PN4:キュレーターは、2017年2月にニボルマブ814に対する進行性疾患転帰816(この療法が患者の癌の治療に不成功であったことを意味する)を記録した。また、ゲムシタビン療法818の開始が、2017年3月から始めて記録された。
PN5:2017年3月下旬における毒性によるゲムシタビン818の終了が記録され、さらには同時にパクリタキセル820の投与開始が記録された。
PN6:2017年6月にパクリタキセル820の終了が記録され、療法に対する関連する「完全反応」(患者に癌がないことが判明したことを示す)が記録された。
PN7:2017年8月のフォローアップ訪問時に、別の「完全反応」822が記録され、患者が引き続き癌でないことが判明したことを示した。これらのキュレーションされた薬剤は、下流の分析のために、薬剤テーブルに入力され、転帰SQLテーブルに転帰が入力された。
【0117】
包含およびEHRとの調和
次に、病院からのEHRに存在する薬剤投与記録は、投薬データテーブルに追加された(図1の記録調和122に従ったすべての薬剤投与804およびイベントバー)。デキサメタゾン投与824は、追加的に記録された。これらは、副作用を和らげるために患者が化学療法と併用して一般的に受ける支持療法薬であるので、これらの薬剤はキュレーションされていない。表示されている間、デキサメタゾンはフィルタリングされ、その後の計算において考慮されなかったが、それは、支持療法薬がLoT間隔生成モジュール124にとって顕著であるとは見なされないからである。2016年9月および10月のペメトレキセド、ベバシズマブ、およびカルボプラチン808のEHR投与記録は、これらの薬剤のキュレーションされた記録に追加され、記録調和122においてこれらの薬剤に対する「ネイティブのおよびキュレーションされた」記録を生成した。パクリタキセル820のEHR投与は、2017年の4月から6月においてキュレーションされた記録を増強するために使用されており、別の「ネイティブの、およびキュレーションされた」記録を生成した。8月のパクリタキセルの追加投与(804aにおける)は、記録調和122で患者記録に追加された。
【0118】
投薬間隔の提示
次に、記述された投薬記録は、固有の薬剤の間隔に変換された(点線バーは830a~830eで表される)。これらの間隔は、定義された開始日および終了日で同時に服用された薬剤の集合を表す。投薬間隔は、投薬の変更が生じたときに必ず作成される(間隔生成モジュール124を参照)。
間隔830a:最初の投薬間隔は、トリプレット療法であるペメトレキセド/ベバシズマブ/カルボプラチンから始まり、2016年10月のカルボプラチンの中止で終了する(間隔作成モジュール124)。
間隔830b:ペメトレキセド/ベバシズマブからなり、この間隔はカルボプラチンの中止で始まり、このダブレット療法の終了まで継続する(間隔生成モジュール124)。
間隔830c:これは、2017年2月のニボルマブの患者投与を捕捉する(間隔生成モジュール124)。
間隔830d:この間隔は、2017年3月のゲムシタビンの投与から始まり、その中止およびパクリタキセルの開始で終了する(間隔生成モジュール124)。
間隔830e:キュレーションされた、ネイティブのパクリタキセル記録から始まり、2017年7月のパクリタキセル投与のEHR記録まで続く。患者は2017年5月から始めてデキサメタゾンを受けたけれども、この薬剤はLoT割り当てに関連しないと考えられるので、2017年5月から2017年7月の第6の間隔が生成されることを引き起こさない(間隔生成モジュール124)。
【0119】
間隔に関するLoT割り当て
次に、確率的選択およびヒューリスティックの組み合わせが、生成された投薬間隔(1~5)に対するLoTを決定するために適用される(LoT割り当てモジュール126)。
【0120】
異なる間隔を分離するために転帰が考慮される。2017年1月の転帰は、間隔830bを間隔830cから分離するために使用される(LoT割り当てモジュール126)。
2017年2月後半の転帰は、間隔830cと間隔830dとを分離するために使用される(LoT割り当てモジュール126)。
次に、間隔830a~830bについて検討する。この場合、訓練母集団にわたってこれらの間隔の各々の相対的頻度を考慮して確率的選択がなされる。間隔830a(トリプレット療法を表す)を単独で見る確率は10%であり、間隔830b(ペメトレキセド/ベバシズマブ)を単独で見る確率は5%であり、したがって組み合わせ確率は0.5%(10%*5%)となる。しかしながら、間隔830aを見て続いて間隔830bを見るのは2%である。2%>0.5%なので、この間隔は組み合わされ、1LoT(LoT割り当てモジュール126)と定義される。
間隔830cは、間隔830bと間隔830dとによって転帰で分離されているので、この単独の間隔はLoT 2となる(LoT割り当てモジュール126)。
間隔830dおよび830eは、次に、確率的選択の観点から考察される。間隔830dおよび830eを単独で見る確率は7.5%(それぞれ30%および25%、30%*25%=7.5%)であるが、データセットにまたがる間隔830d~830eを見る確率は1%である。7.5%>1%なので、間隔は分離されたLoTと考えられ、間隔830dはLoT3に割り当てられ、間隔830eはLoT4に割り当てられる(LoT割り当てモジュール126)。
【0121】
図9は、卵巣癌と診断された第2の患者に対するLoT予測の説明図である。
患者背景および臨床データソース。
PN1、2015年3月:一次診断および手術、カルボプラチン、ベバシズマブ、およびパクリタキセルの開始。
PN2、2015年9月:ベバシズマブの開始、カルボプラチン、パクリタキセルの終了。
PN3、2016年3月:進行性疾患の転帰
PN4、2016年6月:進行性疾患転帰、ベバシズマブの終了(月のみ)、カルボプラチン、ベバシズマブ、ゲムシタビンの開始。
PN5、2016年10月:カルボプラチン、ベバシズマブ、ゲムシタビンの終了。
EHRソース:アナストロゾール、2017年4月。
【0122】
間隔構築
間隔930a:トリプレット療法カルボプラチン/ベバシズマブ/パクリタキセル。
間隔930b:ベバシズマブ(間隔生成モジュール124によって間隔930aから分離される)。
間隔930c:カルボプラチン/ベバシズマブ/ゲムシタビン。
間隔930d:アナストロゾール(間隔生成モジュール124によって間隔930aから分離された)。
【0123】
LoT割り当て:
2016年6月の転帰は、間隔930a~930bと930c~930dとの間の分離を知らせるために使用される(LoT割り当てモジュール126)。間隔930cおよび930dは、前の終了と次の開始との間の分離に起因して分離される(LoT割り当てモジュール126)。次に、精緻化された間隔リストは、[(間隔930a、間隔930b)、(間隔930c)、(間隔930d)]からなる。
【0124】
最初のセットについて、間隔930aおよび間隔930b単独の確率と組み合わせの確率とが比較される。組み合わせた間隔の方が確率が高いので、セットは(間隔930a+間隔930b)となり、LoT1を割り当てられる(LoT割り当てモジュール126)。
間隔930cはLoT2を割り当てられ、間隔930dはLoT3を割り当てられる(LoT割り当てモジュール126、ただ1つの可能な結合)。
【0125】
図10は、乳癌と診断された第3の患者に対するLoT予測の説明図である。
患者背景および臨床データソース。
PN1、2017年1月:一次診断、乳房、およびドセタキセル、トラスツズマブ、ペルツズマブ、およびカルボプラチンの開始。
PN2、2017年7月:ドセタキセル、トラスツズマブ、ペルツズマブ、およびカルボプラチンの投与終了。
EMR、2017年7月:トラスツズマブの投与
EMR、2017年12月~2018年6月:カペシタビンの投与、トラスツズマブの数回の投与、およびタモキシフェンの2回の投与。
【0126】
間隔構築
間隔1030a:ドセタキセル、トラスツズマブ、ペルツズマブ、およびカルボプラチンのクワドラプレット療法。
間隔1030b:トラスツズマブ(間隔生成モジュール124を介して間隔1030aによって分離される)。
間隔1030c:トラスツズマブおよびカペシタビン(新薬および間隔生成モジュール124によって間隔1030bから分離される)。
間隔1030d:トラスツズマブ(カペシタビンの滴下によって間隔1030cから分離される、間隔生成モジュール124はトラスツズマブの継続を参照する)。
間隔1030e:トラスツズマブおよびタモキシフェン(タモキシフェンの導入によって間隔1030dから分離される、間隔生成モジュール124、間隔生成モジュール124を介して継続する、タモキシフェンは207dの薬剤特異的ロールアップを採用する)。
【0127】
LoT割り当て:この記録は転帰を有していないので、5つの間隔のすべての可能な結合が確率的に検討され(この場合、2(5-1)または16の可能な組み合わせ、LoT割り当てモジュール126)、最も確率の高いものが一連のLoTとして選択される。この場合、2+1+2が最も可能性の高い間隔結合として選択された。
【0128】
図11図13は、4つのステップを含む別の実施形態による患者記録からの治療ラインラベル付けを例示している。
1) 投薬、癌診断、および間隔優先事象などの転帰を識別する医療記録を組み合わせる。
2) 患者記録における各新規療法または投薬の開始時に複数の投薬間隔を定義する。
3) 複数の患者記録から教師なし方式で訓練した人工知能エンジンを適用し、LoTの完全なリスティングに対して学習済みヒューリスティックを適用すること。
4) 人工知能エンジンから識別されたLoTに従ってLoT割り当てを出力すること。
【0129】
図11図13は、時刻0の日における一次診断(pDX)、ある時刻における一次診断の後に発生し、少なくとも1日の持続時間を有する複数の投薬/療法、および外科手術などの任意の間隔優先事象のリスティング、または患者記録からの転帰リスティングを含んでいる。各々は、療法、投薬、または他の事象の間隔を表示するためのpDX開始日および終了日を有する。
【0130】
次に、図11A図11Dを参照すると、治療ライン生成の例示的なフロー1100が示されている。図11Aは、フロー1100の第1のステップを例示している。フロー1100の第1のステップは、1つまたは複数の投薬および/または治療、1つまたは複数の診断(たとえば、癌診断)、および1つまたは複数の転帰(たとえば、進行性疾患転帰)を組み合わせることを含むことができる。例示的なフロー1100において、一次診断は、使用者(たとえば、癌専門医)に1つまたは複数の時間間隔を提供するために事象および/または治療がマッピングされ得るタイムラインの開始を定義することができる。図示されているように、1つまたは複数の投薬および/または治療は、カルボプラチン、ペメトレキセド、ニボルマブ、および外科手術を含むことができる。いくつかの実施形態において、図11Aに示されているようなフロー1100は、図2のステップ210および220を使用して生成され得る。
【0131】
図11Bは、フロー1100の第2のステップに含まれる投薬間隔の数を例示している。図11Bのフロー1100は、図11Aの1つまたは複数の投薬および/または治療に基づき生成され得る。いくつかの薬剤は、1つまたは複数の新しい治療に対する共通の間隔と関連付けることができる。図示されているように、カルボプラチンおよびペメトレキセドは、一次診断の約70日後である第1の投薬間隔と関連付けられ得る。第1の投薬間隔は、第1の新しい治療の開始を定義することができる。他の薬剤は、第2の投薬間隔と関連付けることができる。図示されているように、ニボルマブは、第2の投薬間隔と関連付けることができる。第2の投薬間隔は、第2の新しい治療の開始を定義することができる。いくつかの実施形態において、図11Bに示されているようなフロー1100は、図2のステップ230を使用して生成され得る。
【0132】
図11Cは、フロー1100の第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示している。ヒューリスティックは、重なり合う間隔を組み合わせること、間隔を分割すること、または1つもしくは複数のヒューリスティック、ルール、もしくは訓練済みモデルに従って開始日および/もしくは終了日を調整することによって1つまたは複数の投薬間隔を精緻化することができる。たとえば、カルボプラチンおよびペメトレキセドは、別々の投薬間隔と関連付けることも可能であり、フロー1100は、カルボプラチンおよびペメトレキセドの両方を第1の投薬間隔と関連付けることができる。ヒューリスティックは、進行性疾患転帰に関連付けられているルールに基づき1つまたは複数の投薬間隔を精緻化することができる。たとえば、ヒューリスティックは、診断後約130日の進行性疾患転帰に基づき診断後約130日に開始するように第2の投薬間隔を設定することができる。同じ薬剤(たとえば、ニボルマブ)の継続のために、治療ラインは、ニボルマブを使用する第2の治療に関連付けられている第3の間隔などの、すべての投薬間隔について同じであってよい。いくつかの実施形態において、図11Cに示されているようなフロー1100は、図2のステップ240を使用して生成され得る。
【0133】
図11Dは、フロー1100の第4のステップにおいてライン割り当てを出力することを例示している。ライン割り当ては、1つまたは複数の投薬間隔から1つまたは複数の潜在的治療ラインに関連付けられ得る。識別は、訓練済みモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。治療ラインは、第1の投薬間隔に関連付けられている第1のライン(たとえば、カルボプラチンおよびペメトレキセド治療)および第2の投薬間隔に関連付けられている第2のライン(たとえば、ニボルマブ治療)を含むことができる。いくつかの実施形態において、図11Dに示されているようなフロー1100は、図2のステップ250および260を使用して生成され得る。
【0134】
次に、図12A図12Fを参照すると、治療ライン生成の例示的なフロー1200が示されている。図12Aは、フロー1200の第1のステップを例示している。フロー1200の第1のステップは、1つまたは複数の投薬および/または治療ならびに1つまたは複数の診断(たとえば、癌診断)を組み合わせることを含むことができる。例示的なフロー1200において、一次診断は、使用者(たとえば、癌専門医)に1つまたは複数の時間間隔を提供するために事象および/または治療がマッピングされ得るタイムラインの開始を定義することができる。図示されているように、1つまたは複数の投薬および/または治療は、ドキソルビシン、シクロホスファミド、パクリタキセル、タモキシフェン、および外科手術を含むことができる。いくつかの実施形態において、図12Aに示されているようなフロー1200は、図2のステップ210および220を使用して生成され得る。
【0135】
図12Bは、フロー1200の第2のステップに含まれる投薬間隔の数を例示している。図12Bのフロー1200は、図12Aの1つまたは複数の投薬および/または治療に基づき生成され得る。いくつかの薬剤は、1つまたは複数の新しい治療に対する共通の間隔と関連付けることができる。図示されているように、ドキソルビシンおよびシクロホスファミドは、一次診断の約50日後である第1の投薬間隔と関連付けられ得る。第1の投薬間隔は、第1の新しい治療の開始を定義することができる。他の薬剤は、第2の投薬間隔または第3の投薬間隔と関連付けることができる。図示されているように、パクリタキセルは、一次診断の約120日後である第2の投薬間隔と関連付けられ得る。第2の投薬間隔は、第2の新しい治療の開始を定義することができる。図示されているように、タモキシフェンは、一次診断の約150日後である第3の投薬間隔と関連付けられ得る。第3の投薬間隔は、第3の新しい治療の開始を定義することができる。いくつかの実施形態において、図12Bに示されているようなフロー1200は、図2のステップ230を使用して生成され得る。
【0136】
図12Cは、フロー1200の第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示している。ヒューリスティックは、重なり合う間隔を組み合わせること、間隔を分割すること、または1つもしくは複数のヒューリスティック、ルール、もしくは訓練済みモデルに従って開始日および/もしくは終了日を調整することによって1つまたは複数の投薬間隔を精緻化することができる。たとえば、ドキソルビシンおよびシクロホスファミドは、別々の投薬間隔と関連付けることも可能であり、フロー1200は、ドキソルビシンおよびシクロホスファミドの両方を第1の投薬間隔と関連付けることができる。ヒューリスティックは、ホルモン療法に関連付けられているルールに基づき1つまたは複数の投薬間隔を精緻化することができる。たとえば、ヒューリスティックは、第3の治療がホルモン療法であるため、第3の治療(たとえば、タモキシフェン)を含むように第2の投薬間隔を設定することができる。いくつかの実施形態において、図12Cに示されているようなフロー1200は、図2のステップ240を使用して生成され得る。
【0137】
図12Dは、フロー1200の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。各投薬間隔について、期待値最大化モデルは、EMを計算して投薬間隔の信頼性を識別するために使用され得る。いくつかの実施形態において、図12Dに示されているようなフロー1200は、図2のステップ240を使用して生成され得る。
【0138】
図12Eは、フロー1200の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。具体的には、フロー1200は、第1の投薬間隔遷移「A」および第2の投薬間隔遷移「B」に期待値最大化モデルを適用して、第1の投薬間隔が第2の投薬間隔と組み合わされるべきか、または分離されたままにしておくべきかを決定し、推定性能を最大化することを含むことができる。1つまたは複数の所与の間隔を観察する確率は、P(X)と表記され得る。2つの間隔の間の進行事象を観察する確率は、P_prog(X→Y)と表記され得る。間隔を2つのラインに分割したときに進行事象を見る確率(P(A)P(B)P_prog(A→B))は、1つのラインを維持したときに進行事象を見る確率(P(AB)(1-P_prog(A→B)))と比較され、より確率の高い選択肢がライン割り当てとして選択され得る。図12Eに示されている例では、より確率の高い選択肢は、間隔を2つのラインに分割することであると決定されたので、間隔「A」および間隔「B」の各々は対応する投薬ラインを有する。
【0139】
図12Fは、フロー1200の第5のステップにおいてライン割り当てを出力することを例示している。ライン割り当ては、1つまたは複数の投薬間隔から1つまたは複数の潜在的治療ラインに関連付けられ得る。識別は、訓練済みモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。治療ラインは、第1、第2、および第3の投薬間隔に関連付けられている第1のラインを含むことができる。いくつかの実施形態において、図12Fに示されているようなフロー1200は、図2のステップ250および260を使用して生成され得る。
【0140】
次に、図13A図13Fを参照すると、治療ライン生成の例示的なフロー1300が示されている。図13Aは、フロー1300の第1のステップを例示している。フロー1300の第1のステップは、1つまたは複数の投薬および/または治療、1つまたは複数の進行性疾患転帰、および1つまたは複数の診断(たとえば、癌診断)を組み合わせることを含むことができる。例示的なフロー1300において、一次診断は、使用者(たとえば、癌専門医)に1つまたは複数の時間間隔を提供するために事象および/または治療がマッピングされ得るタイムラインの開始を定義することができる。図示されているように、1つまたは複数の投薬および/または治療は、デキサメタゾン、レナリドミド、ボルテゾミブ、カルフィルゾミブ、ポマリドミド、ダラツムマブ、および幹細胞移植を含み得る。いくつかの実施形態において、図13Aに示されているようなフロー1300は、図2のステップ210および220を使用して生成され得る。
【0141】
図13Bは、フロー1300の第2のステップに含まれる投薬間隔の数を例示している。図13Bのフロー1300は、図13Aの1つまたは複数の投薬および/または治療に基づき生成され得る。いくつかの薬剤は、1つまたは複数の新しい治療に対する共通の間隔と関連付けることができる。図示されているように、デキサメタゾン、レナリドミド、およびボルテゾミブは、一次診断の約5日後である第1の投薬間隔と関連付けられ得る。第1の投薬間隔は、第1の新しい治療の開始を定義することができる。他の薬剤は、追加の投薬間隔と関連付けることができる。図示されているように、カルフィルゾミブおよびポマリドミドは、一次診断の約180日後である第2の投薬間隔と関連付けられ得る。第2の投薬間隔は、第2の新しい治療の開始を定義することができる。図示されているように、幹細胞移植は、一次診断の約360日後である第3の投薬間隔と関連付けられ得る。第3の投薬間隔は、第3の新しい治療の開始を定義することができる。図示されているように、レナリドミドは、一次診断の約540日後である第4の投薬間隔と関連付けられ得る。第4の投薬間隔は、第4の新しい治療の開始を定義することができる。図示されているように、ダラツムマブおよびデキサメタゾンは、一次診断の約700日後である第5の投薬間隔と関連付けられ得る。第5の投薬間隔は、第5の新しい治療の開始を定義することができる。図示されているように、ポマリドミドは、一次診断の約750日後である第6の投薬間隔と関連付けられ得る。第6の投薬間隔は、第6の新しい治療の開始を定義することができる。図示されているように、ダラツムマブは、一次診断の約930日後である第7の投薬間隔と関連付けられ得る。第7の投薬間隔は、第7の新しい治療の開始を定義することができる。いくつかの実施形態において、図13Bに示されているようなフロー1300は、図2のステップ230を使用して生成され得る。
【0142】
図13Cは、フロー1300の第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示している。ヒューリスティックは、重なり合う間隔を組み合わせること、間隔を分割すること、または1つもしくは複数のヒューリスティック、ルール、もしくは訓練済みモデルに従って開始日および/もしくは終了日を調整することによって1つまたは複数の投薬間隔を精緻化することができる。ヒューリスティックは、進行性疾患転帰に関連付けられているルールに基づき1つまたは複数の投薬間隔を精緻化することができる。たとえば、ヒューリスティックは、診断後約700日の進行性疾患転帰に基づき診断後約700日に開始するように第5の投薬間隔を設定することができる。いくつかの実施形態において、図13Cに示されているようなフロー1300は、図2のステップ240を使用して生成され得る。
【0143】
図13Dは、フロー1300の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。各投薬間隔について、期待値最大化モデルは、EMを計算して投薬間隔の信頼性を識別するために使用され得る。いくつかの実施形態において、図13Dに示されているようなフロー1300は、図2のステップ240を使用して生成され得る。
【0144】
図13Eは、フロー1300の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。具体的には、フロー1300は、第1の投薬間隔遷移「C」および第2の投薬間隔遷移「D」、および第3の投薬間隔遷移「E」に期待値最大化モデルを適用して、デキサメタゾン、ポマリドミド、およびダラツムマブが単一の間隔に組み合わされるべきか、または分離されたままにしておくべきかを決定し、推定性能を最大化することを含むことができる。遷移C-DおよびD-Eにおける新しいラインの確率は、P(C)P(D)P(E)P_prog(C→D)P_prog(D→E)と記すことができる。遷移C-Dにおける新しいラインの確率は、P(CD)P(E)(1-P_prog(C→D))P_prog(D→E)と記すことができる。遷移D-Eにおける新しいラインの確率は、P(C)P(DE)P_prog(C→D)(1-P_prog(D→E))と記すことができる。遷移C、D、およびEが1つのライン上にある確率は、P(CDE)(1-P_prog (C→D))(1-P_prog (D→E))と記すことができる。図13Eに示されている例では、C、D、およびEが1つのライン上にある確率が最も高いと決定された。
【0145】
図13Fは、フロー1300の第5のステップにおいてライン割り当てを出力することを例示している。ライン割り当ては、1つまたは複数の投薬間隔から1つまたは複数の潜在的治療ラインに関連付けられ得る。識別は、訓練済みモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。治療ラインは、第1の投薬間隔に関連付けられている第1のライン、第2、第3、および第4の投薬間隔に関連付けられている第2のライン、ならびに第5、第6、および第7の投薬間隔に関連付けられている第3のラインを含むことができる。いくつかの実施形態において、図13Fに示されているようなフロー1300は、図2のステップ250および260を使用して生成され得る。
【0146】
図14は少なくとも癌免疫(IO)レジメン療法を有する患者に適用されるような治療ラインを例示するサンキーダイアグラム1400である。
【0147】
この例における患者記録について、第1の治療ラインは、アテゾリズマブ、ニボルマブ、またはペムブロリズマブなどのIO単剤療法、イピリムマブおよびニボルマブなどの組み合わせIOおよびIO、またはカルボプラチン、ペムブロリズマブ、ペメトレキセドなどの組み合わせIO単剤療法および化学療法、カルボプラチン、パクリタキセル、ペムブロリズマブ、カルボプラチン、タンパク質結合パクリタキセル、ペムブロリズマブ、カルボプラチン、ペムブロリズマブ、ペメトレキセド、または任意の他の列挙された組み合わせを含み得る。第2の治療ラインは、IO療法、ホルモン療法、または維持療法の追加の組み合わせを含む。第3の治療ラインは、ドセタキセル、ラムシルマブ、ビノレルビン、およびゲムシタビンを含む。そして第4の治療ラインは、ドセタキセルおよびゲムシタビンを含む。
【0148】
データセットが、各患者がどの治療ラインを投与されたかに従ってラベル付けされた後、追加の分析が実行され得る。
【0149】
図15は、異なる第1の治療ラインを受けた患者の生存曲線を描いた無増悪生存率(PFS)グラフ1500である。
【0150】
患者のコホートは、共通の診断および1つまたは複数の治療ラインに基づき生成され得る。コホートは、また、患者記録に含まれる特徴のどれかに基づきフィルタリングし得る。例示的な治療ライン1510、1520、および1530。医師は、本明細書に開示されている任意のシステムおよび方法に従ってラベル付けされたLoTを含む患者記録から見出された特徴の集まりを含む、図1のウェブポータル160A~160Nなどのウェブポータルを使用してコホートを選択し、PFSグラフに初期値を入れて識別された特性を有する患者のコホートに関して患者の生存を経時的に比較するものとしてよい。ここで、PFS曲線1510に関連付けられている治療ラインを受ける患者は、PFS曲線1520に関連付けられている治療ラインを受ける患者よりも治療によく反応し、両方のコホートは、患者がPFS曲線1530に関連付けられている治療ラインのレジメンを受ける治療よりもよく反応することが経験的に観察され得る。この情報およびコホートの集まりに基づき、医師は、曲線1530に関連付けられているLoTの処方を回避する傾向が強く、曲線1510に関連付けられているLoTの処方を推奨する可能性が高い。
【0151】
オンラインウェブポータルを介し、患者の記録に見られる特徴に基づくコホート選択の一例は、すべての目的に関して参照により本明細書に組み込まれている2019年12月31日に出願した米国特許出願第16/732,168号、名称「A Method And Process For Predicting And Analyzing Patient Cohort Response, Progression And Survival」において説明されている。
【0152】
米国特許出願第16/732,168号の例示的なオンラインウェブポータルを参照すると、図1図9のコホート選択、図10図28の分析、および図29図33のカスタマイズ可能なウェブポータル(ノートブック)実装は、たとえば、ウェブポータル160a~160nまたはGUI170a~170nにおける図1の臨床健康記録110、患者について識別された少なくとも1つのLoTに基づき表示する分析、および任意の追加のコホート特徴から特徴を選択し、受信するコホート選択としてその全体が参照される。カスタマイズ分析を使用者に表示するのに適しているカスタマイズ可能なノートブックは、PFS、外れ値、手術の有効性、LoT性能に関する患者の分子的特徴、有害事象分析、LoTの持続時間からの効果、または他のコホート分析などに対するカスタムターゲット生成を含むものとしてよく、これはラベル付けされたLoTに基づくものとしてよい。例示的なノートブックは、プログラミングアプローチで、分析のためにR、SQL、または他のデータベースソフトウェアバックエンドを有するカスタムインターフェースを設計することを可能にする。カスタムインターフェースは、特に効果的である可能性がある薬剤および治療の承認適応症外使用を識別することを含み得る。ノートブックは、治療の承認適応症外使用の有効性を検証するために、新しい臨床試験に対する調査を開始して、それを確立するためのインフォマティクスを識別し、提示するものとしてよい。一例において、ノートブックでは、それぞれのLoTが、一般薬名、ブランド薬名、および治療ロールアップクラス(治療の種類[標的、開始、維持、化学療法、放射線療法、チロシンキナーゼ阻害剤(TKI)など]、LoT内の薬剤の投与量、および/または経口、静脈内、放射線曝露などの、治療の投与方法に関連付けられていることを識別してよい。
【0153】
図16は、一実施形態による患者に対する治療ラインを使用者が編集するための治療ライン編集ツール1600の説明図である。
【0154】
治療ライン編集ツールは、本明細書における方法およびシステムに従って識別された治療ラインを有する患者のセットから任意の患者を受け取るものとしてよい。患者がロードされた後、図11図13のタイムラインに類似するタイムラインがロードされる。別の実施形態では、図8図10のタイムラインに類似するタイムラインが同様にロードされ得る。使用者は、カーソルを使って、教師なし人工知能エンジンによって実行されたLoTラベル付けにおける認知された欠陥を是正するいくつかの操作を実行し得る。
【0155】
たとえば、使用者は、任意の治療ライン指定をドラッグ&ドロップ1610して、列挙されたLoTの新しい位置に基づき新しいLoTを再キャリブレーションし得る。使用者は、スペルミスを是正するために、またはブランド名を一般名または薬剤のクラスと置き換えるように、薬剤名1620を編集してよい。使用者は、一次診断軸のところで右クリック1630し、マウスカーソル位置にLoTを挿入するか、または削除し得る。使用者は、投薬間隔をドラッグ&ドロップ1640して、その間隔の開始日または終了日を編集し得る。使用者は、薬剤を右クリック1650して、新しい薬剤を挿入するか、または薬剤を削除し得る。使用者は、転帰を右クリック1660して、手術、手技、または他の優先事象などの新しい転帰を記録に挿入し得る。
【0156】
コントロール1610~1660は、クリックおよびドラッグおよび右クリックなどのマウスイベントに関して例示されているが、当業者であれば、これらのコントロールは、キーボードコントロール、タッチスクリーンコントロール、またはPCの入出力デバイスもしくはモバイルデバイスのインターフェースの類似のインタラクティブな操作などの異なるイベントを使用して操作されてもよいことを認識するであろう。
【0157】
図17は、一実施形態によるLoTラベル付けが実行された後の患者タイムライン1700の構造化データ表現の説明図である。
【0158】
患者タイムライン1700は、LoTラベルが挿入されている患者記録に対するすべての重要な間隔アンカーを表す。この例では、患者は、2000/1/1に原発性癌の診断を受け、2000/2/29に第1の治療ラインを開始し、約16カ月後、2001/8/11に進行事象が観察され、進行事象は治療内部優先事象として認められ、2001/12/9から始めて第2の治療ラインが投与され、患者は2002/12/16に遺伝子シークエンシングを実施されたが、これはおそらく別の器官部位への腫瘍の転移などの進行事象による。シークエンシングの日付の時点で、タイムラインは、たとえば、徹底的なウェブポータル160A~160Nを通じて、治療医師から利用可能になっている。次に、医師は、ポータルを利用して、患者の類似のコホートに基づき将来のLoT転帰を確認して、肯定的な反応の可能性を改善するために患者の次のLoTを個人化し得る。他の分析は、他の治療、LoTとしてラベル付けされたもの以外の手技の評価、治療の転帰における遺伝的バリアントの評価、患者に治療中の任意の時点において転移または進行を生じるリスクのレベルの識別、および患者の治療を個人化し肯定的転帰を改善するための他の分析を含む。
【0159】
図18は、肺癌コホートおよび乳癌コホートにおける患者のコホートから識別されるLoTの平均持続時間のボックスプロット図1800である。
【0160】
上で言及されているように、癌特異的間隔は、複数の患者に対する人工知能エンジンの訓練から学習され得る。そのような学習が、正しい日付がインピュートされ得るように治療の平均持続時間に関係した後、その間隔は、モデルがそこからラベル付けするための意味のある潜在的LoT選択を提供するように適切なサイズに設定される。一例として、肺癌患者は、治療間隔の大半を約70日で経験し、120日を超えるものはほとんどない。LoT1~4の分析は、肺癌の診断において、各連続する治療ラインにわたって変動はごくわずかであることを示している。したがって、肺癌間隔閾値は、約70日~120日であり、評価されるLoT間隔に応じて変化することはない。しかし、乳癌の診断の場合、治療間隔の大半は100日前後であり、第1のLoTは300日、第2のLoTは290日、第3のLoTは260日、第4のLoTは210日程度である。乳癌に対する分析では、薬剤持続時間および治療間隔に対する閾値は肺癌の薬剤持続時間および治療間隔に比べて2~3倍長いことを識別している。
【0161】
図19は、患者に投与された乳癌治療薬に対する第1のLoTに基づくLoT頻度1900の説明図である。
【0162】
教師なし学習を介して生成されたモデルに基づき、乳癌患者の大多数は、アナストロゾール、タモキシフェン、またはAC-T(薬物である塩酸ドキソルビシン(アドリアマイシン)およびシクロホスファミド、次いでパクリタキセル(タキソール)による治療)の第1の治療ラインを開始することになる。乳癌患者の第1のLoT選択には大きなばらつきがあるように見えるが、図20は、乳癌患者に対する第2のLoT頻度分布を表している。
【0163】
図20は、患者に投与された乳癌治療薬に対する第2のLoTに基づくLoT頻度2000の説明図である。
【0164】
教師なし学習を介して生成されたモデルに基づき、乳癌患者の大多数は、図19の第1の治療ラインと、その後のアナストロゾール、タモキシフェン、レトロゾールの第2の治療ラインを受ける。同様に、AC-Tレジメンは、患者に対する第2のLoTとして処方されることは決してなく、したがって第2の治療ラインに対して学習済みラベル付け空間内に出現しないことは意味があることに留意されたい。乳癌患者に対する第2のLoT選択にはあまりばらつきがないが、これは、維持療法が一般的に第3の治療ラインで処方される治療であることから予想される。
【0165】
図21は、患者に投与された非小細胞肺癌(NSCLC)治療薬に対する第1のLoTに基づくLoT頻度2100の説明図である。
【0166】
教師なし学習を介して生成されたモデルに基づき、NSCLC患者の大多数は、カルボプラチンおよびパクリタキセルで開始し、一部の患者はカルボプラチンおよびペメトレキセドまたはエトポシドのいずれかで開始する。正確性のもう1つのポイントは、NSCLC患者のいずれも、図22にリストされているものなど、標的療法で開始しないことを含む。
【0167】
図22は、患者に投与された非小細胞肺癌治療薬に対する第2のLoTに基づくLoT頻度2200の説明図である。
【0168】
教師なし学習を介して生成されたモデルに基づき、NSCLC癌患者の大多数は、図21の第1の治療ラインと、その後に続く、ニボルマブまたはペメトレキセドの第2の治療ラインを受けるが、かなり均一な分布で第2のLoTとしてゲムシタビン、ドセタキセル、またはトポテカンの標的療法を試みる。
【0169】
図19図22は、それぞれの一次診断コホートにおける全患者にわたる特定のLoTの出現頻度を例示している。例示的な例は乳癌および肺癌に限定されたが、本明細書において開示されている方法およびシステムは、本明細書において説明されている実施形態から逸脱することなく任意の癌診断に適用され得る。さらに、間隔および潜在的治療ラインに対する順位付けは、頻度に基づく尤度から直接的に導出されてもよい。たとえば、第1のLoTが第1のLoTとして患者の50%に発生する場合、LoTラベル付けにおいてそれぞれの治療間隔がそれに対応するときに50%の尤度を直接与えてもよい。それに加えて、人工知能エンジンは、互いに連続するLoTの頻度に基づきさらなる尤度の推定を生成し得る。たとえば、カルボプラチンおよびパクリタキセルの第1のLoTの後にニボルマブの第2のLoTが時間の80%で続き、カルボプラチンとパクリタキセルの両方およびニボルマブが連続する治療間隔に入っている場合、第1のLoTがカルボプラチンおよびパクリタキセルであり、第2の治療ラインがニボルマブである確率は、記録がカルボプラチンおよびパクリタキセルの第1のラインのみまたはニボルマブの第2のラインのみを含んでいた場合に比べて高くスケーリングされることになる。
【0170】
図23は、列挙されたLoTの少なくとも1つを含むコホートに割り当てられた各原発癌に対する患者の割合の棒グラフ図2300である。
【0171】
この例では、乳癌患者は、70%が第1のLoTをラベル付けされ、15%が第2のLoTをラベル付けされ、5%のみが第3のLoTをラベル付けされるように分布される。逆に、結腸直腸癌(CRC)の一次診断については、60%だけが第1のLoTをラベル付けされ、15%が第2のLoTをラベル付けされ、5%が第3のLoTをラベル付けされる。それぞれのラベルがない患者は、もしあれば、どのようなラベルが適用されるかを識別するために手作業で評価され得る。
【0172】
図24は、本明細書で説明されている方法のうちの任意の1つまたは複数をマシンに実行させるために、命令セットが実行され得るコンピュータシステム2400の例示的なマシンの説明図である。代替的実装形態において、マシンは、LAN、イントラネット、エクストラネット、および/またはインターネットにおいて他のマシンに(たとえば、ネットワーク)接続され得る。
【0173】
マシンは、クライアントサーバネットワーク環境内のサーバまたはクライアントマシンの能力内で、またはピアツーピア(または分散)ネットワーク環境内のピアマシンとして、またはクラウドコンピューティングインフラストラクチャまたは環境内のサーバもしくはクライアントマシンとして動作し得る。マシンは、パーソナルコンピュータ(PC)、タブレットPC、セットトップボックス(STB)、携帯情報端末(PDA)、携帯電話、ウェブアプライアンス、サーバ、ネットワークルーター、スイッチもしくはブリッジ、またはそのマシンによって実行されるアクションを指定する命令セット(順次または他の方法で)実行することができる任意のマシンであってよい。さらに、単一のマシンが図示されているが、「マシン」という用語は、本明細書で説明されている方法のうちの任意の1つまたは複数を実行するために命令セット(または複数の命令セット)を個別に、または連携して実行するマシンの任意の集合体を含むと解釈されるものとする。
【0174】
例示的なコンピュータシステム2400は、処理デバイス2402、メインメモリ2404(リードオンリーメモリ(ROM)、フラッシュメモリ、シンクロナスダイナミックランダムアクセスメモリ(DRAM)(SDRAM)またはDRAMなどのダイナミックランダムアクセスメモリ(DRAM)、など)、スタティックメモリ2406(フラッシュメモリ、スタティックランダムアクセスメモリ(SRAM)、など)、およびデータストレージデバイス2418を備え、これらはバス2430を介して互いに通信する。
【0175】
処理デバイス2402は、マクロプロセッサ、中央演算処理装置、または同様のものなどの1つまたは複数の汎用処理デバイスを表す。より具体的には、処理デバイスは、複合命令セットコンピューティング(CISC)マイクロプロセッサ、縮小命令セットコンピューティング(RISC)マイクロプロセッサ、超長命令語(VLIW)マイクロプロセッサ、または他の命令セットを実装するプロセッサもしくは命令セットの組み合わせを実装するプロセッサであってよい。処理デバイス2402は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタルシグナルプロセッサ(DSP)、ネットワークプロセッサ、または同様のものなどの1つまたは複数の専用処理デバイスであってもよい。処理デバイス2402は、本明細書で説明されているオペレーションおよびステップを実行する命令2422を実行するように構成される。
【0176】
コンピュータシステム2400は、LAN、イントラネット、インターネット、および/またはエクストラネットに接続するためのネットワークインターフェースデバイス2408をさらに含んでもよい。コンピュータシステム2400は、ビデオディスプレイユニット2410(液晶ディスプレイ(LCD)または陰極線管(CRT)など)、英数字入力デバイス2412(キーボードなど)、カーソル制御デバイス2414(マウスなど)、信号発生デバイス2416(スピーカーなど)、およびグラフィックプロセッシングユニット2424(グラフィックスカードなど)も備え得る。
【0177】
データストレージデバイス2418は、本明細書で説明されている方法または機能のうちの任意の1つまたは複数を使用する1つまたは複数の命令セットまたはソフトウェア2422が記憶されるマシン可読記憶媒体2428(コンピュータ可読媒体とも呼ばれる)であってよい。命令2422は、コンピュータシステム2400による実行中に完全にまたは少なくとも部分的にメインメモリ2404および/または処理デバイス2402内にも常駐するもものとしてよく、メインメモリ2404および処理デバイス2402もマシン可読媒体を構成する。
【0178】
一実装形態において、命令2422は、治療ラインモジュール(図1の治療ラインモジュール120など)に対する命令および/または治療ラインモジュールとして機能する方法を含むソフトウェアライブラリを含む。命令2422は、記録調和モジュール122、間隔生成モジュール124、およびLoT割り当てモジュール126のための命令をさらに含み得る(図1の記録調和モジュール122、間隔生成モジュール124、およびLoT割り当てモジュール126など)。マシン可読記憶媒体2428は、単一の媒体であるものとして例示的な実装形態において示されているが、「マシン可読記憶媒体」という語は、1つまたは複数の命令セットを記憶する単一の媒体または複数の媒体(集中もしくは分散データベース、および/または関連するキャッシュおよびサーバなど)を含むものとして解釈されるべきである。「マシン可読記憶媒体」という語は、マシンによって実行される命令セットを記憶するか、または符号化することができ、本開示の方法のうちの任意の1つまたは複数をマシンに実行させる任意の媒体を含むものとしても解釈されるべきである。「マシン可読記憶媒体」という語は、限定はしないが、ソリッドステートメモリ、光媒体、および磁気媒体を含むものとしてしかるべく解釈されるものとする。「マシン可読記憶媒体」という用語は、マシン可読記憶媒体を一時的記憶媒体または一時的マシン可読記憶媒体として識別することによって別段の指定がなされていない限り信号などの一時的記憶媒体をしかるべく除外するものとする。
【0179】
別の実装形態において、仮想マシン2440は、記録調和モジュール122、間隔生成モジュール124、およびLoT割り当てモジュール126のための命令を実行するモジュールを備え得る。計算では、仮想マシン(VM)がコンピュータシステムのエミュレーションである。仮想マシンは、コンピュータアーキテクチャに基づいており、物理的コンピュータの機能を提供する。それらの実装形態は、専用ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとの組み合わせを伴い得る。
【0180】
先行する詳細な説明のいくつかの部分は、コンピュータメモリ内のデータビットに対する演算のアルゴリズムおよび記号表現に関して提示されている。これらのアルゴリズムに関する説明および表現は、作業の内容を当業者に最も効果的に伝えるためにデータ処理の技術者によって使用される手段である。アルゴリズムは、本明細書では、また一般的に、望む結果をもたらす演算の自己矛盾のないシーケンスであることが企図される。これらの演算は、物理的量の物理的操作を必要とする演算である。通常、必ずというわけではないが、これらの量は、記憶され、組み合わされ、比較され、および他の何らかの形で操作されることができる電気的または磁気的信号の形態をとる。主に共通使用の理由から、これらの信号をビット、値、要素、記号、文字、語、数、または同様のものとして参照することがときには都合がよいことが実証されている。
【0181】
しかしながら、これらおよび類似の語のすべては、適切な物理的量と関連付けられるべきであり、これらの量に付けられた都合のよいラベルにすぎないことを覚えておくべきである。上記の説明から明らかなように特に他で断りのない限り、説明全体を通して、「識別すること」または「提供すること」または「計算すること」または「決定すること」または同様の語句などの語を利用する記述は、コンピュータシステムのレジスタおよびメモリ内で物理的(電子的)量として表されているデータを操作し、コンピュータシステムのメモリまたはレジスタまたは他のそのような情報記憶デバイス内で物理的量として同様に表現される他のデータに変換するコンピュータシステム、または類似の電子コンピューティングデバイスのアクションおよびプロセスを指すことは理解される。
【0182】
本開示は、本明細書のオペレーションを実行するための装置にも関係する。この装置は、意図された目的のために特別に制作されうるか、またはコンピュータに記憶されているコンピュータプログラムによって選択的にアクティブ化されるかもしくは再構成される1つもしくは複数の汎用コンピュータを備え得る。このようなコンピュータプログラムは、限定はしないが、フロッピィーディスク、光ディスク、CD-ROM、および光磁気ディスクを含む任意の種類のディスク、リードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気もしくは光カード、または電子的命令を記憶するのに適した任意の種類の媒体などのコンピュータ可読記憶媒体に記憶されるものとしよく、これらは各々コンピュータシステムバスに結合されている。
【0183】
本明細書で提示されているアルゴリズムおよび表示は、任意の特定のコンピュータまたは他の装置に本質的に関係しているわけではない。様々な汎用システムが、本明細書の教示に従ってプログラムとともに使用され得るか、または方法を実行するためにより専門化された装置を製作することが都合よいことが実証され得る。様々なこれらのシステムに対する構造は、以下の説明で述べられている通りに見える。それに加えて、本開示は、任意の特定のプログラミング言語を参照して説明されてはいない。本明細書で説明されているように本開示の教示を実装するために様々なプログラミング言語が使用され得ることは理解されるであろう。
【0184】
本開示は、本開示に従ってプロセスを実行するようにコンピュータシステム(または他の電子デバイス)をプログラムするために使用され得る、命令が記憶されているマシン可読媒体を含むものとしてよい、コンピュータプログラム製品またはソフトウェアとして提供され得る。マシン可読記憶媒体は、マシン(コンピュータなど)によって読み込むことが可能な形式で情報を記憶するためのメカニズムを備える。たとえば、マシン可読(コンピュータ可読など)媒体は、リードオンリーメモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイスなどのマシン(コンピュータなど) 可読記憶媒体を含む。
【0185】
上記明細書において、本開示の実装形態は、特定の例示的な実装形態を参照しつつ説明されている。次に示す請求項に規定されているような本開示の実装形態のより広い精神および範囲から逸脱することなくそれに対して様々な修正が行われ得ることは明白であろう。したがって、本明細書および図面は、制限的な意味ではなく例示的な意味で考慮されるべきである。
【符号の説明】
【0186】
100 コンピュータ実装システム
110 臨床健康記録
112 EMR
114 記録、情報
120 治療ラインモジュール
122 記録調和モジュール
124 間隔生成モジュール
126 治療ライン割り当てモジュール
150 治療ライン(LoT)ストア
160a~160n ウェブフォーム
160A~160N ウェブページ
165 グラフィカルユーザインターフェース(GUI)
170a~170n GUI、電子レポート
200 システム
300 記録調和モジュール
322 記録ホワイトリストおよび/または記録ブラックリストモジュール
324 記録関連付けモジュール
326 記録組み合わせモジュール
328 ヒューリスティック処理モジュール
400 間隔生成モジュール
422 診断関連性フィルタ
424 間隔日付割り当て
426 間隔日付インピュテーション
428 間隔日付延長
430 間隔日付セグメント化
500 間隔生成モジュール、治療ライン割り当てモジュール
522 LoT割り当て推定
524 LoT割り当て確率
526 LoT順位付け
528 LoTラベル付け
600 システム
605 薬剤フィルタリングモジュール
610 薬剤組み合わせモジュール
615 薬剤調和モジュール
620 調和された薬剤テーブル
625 原発性癌(PC)関連性フィルタ
630 日付パディング
635 PCキュレーションモデル
640 間隔生成
645 投薬間隔
650 転帰
655 モデル化されたLoT頻度
660 推定確率
665 LoTラベル付け
670 後処理LoT
705 臨床的洞察
710 モデルデータ準備段階
712 キュレーションされた進行および治療逸脱
714 患者投薬
716 モジュール
718 モデル化された日付および間隔
720 訓練段階
722 薬剤測定間隔頻度(w)
724 LoT分割割り当て
726 投薬頻度精緻化
730 モデルLoT割り当て段階
732 LoT生成段階
734 LoTラベル付け
802 一次診断
804 薬剤投与
806 転帰
808 トリプレット化学療法
810 ペメトレキセド/ベバシズマブ維持療法
812 進行性疾患転帰
814 ニボルマブ
816 進行性疾患転帰
818 ゲムシタビン療法
820 パクリタキセル
822 完全反応
824 デキサメタゾン投与
830a 間隔
830b 間隔
830c 間隔
830d 間隔
830e 間隔
930a 間隔
930b 間隔
930c 間隔
930d 間隔
1030a 間隔
1030b 間隔
1030c 間隔
1030d 間隔
1030e 間隔
1100 フロー
1200 フロー
1300 フロー
1400 サンキーダイアグラム
1500 無増悪生存率(PFS)グラフ
1510、1520、1530 治療ライン
1600 治療ライン編集ツール
1610 コントロール
1620 薬剤名、コントロール
1630 コントロール
1640 コントロール
1650 コントロール
1660 コントロール
1700 患者タイムライン
1800 ボックスプロット図
1900 LoT頻度
2000 LoT頻度
2100 LoT頻度
2200 LoT頻度
2300 棒グラフ図
2400 コンピュータシステム
2402 処理デバイス
2404 メインメモリ
2406 スタティックメモリ
2408 ネットワークインターフェースデバイス
2410 ビデオディスプレイユニット
2412 英数字入力デバイス
2414 カーソル制御デバイス
2416 信号発生デバイス
2418 データストレージデバイス
2422 命令セットまたはソフトウェア、命令
2424 グラフィックプロセッシングユニット
2428 マシン可読記憶媒体
2430 バス
2440 仮想マシン
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11A
図11B
図11C
図11D
図12A
図12B
図12C
図12D
図12E
図12F
図13A
図13B
図13C
図13D
図13E
図13F
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
【国際調査報告】