(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024096475
(43)【公開日】2024-07-12
(54)【発明の名称】生成モデルを用いてデータを補完するためのシステムおよび方法
(51)【国際特許分類】
G16H 50/50 20180101AFI20240705BHJP
【FI】
G16H50/50
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024079324
(22)【出願日】2024-05-15
(62)【分割の表示】P 2022512791の分割
【原出願日】2020-08-19
(31)【優先権主張番号】62/891,240
(32)【優先日】2019-08-23
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520139815
【氏名又は名称】アンラーン.エーアイ, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】チャールズ ケネス フィッシャー
(72)【発明者】
【氏名】アーロン マイケル スミス
(72)【発明者】
【氏名】ジョナサン ライアン ウォルシュ
(57)【要約】
【課題】好適な生成モデルを用いてデータを補完するためのシステムおよび方法を提供すること。
【解決手段】本発明は、概して、分析のためのデータを補完することに関し、より具体的には、生成モデルを使用して、分析のためのデータを補完することに関する。本発明の実施形態による、無作為化対照試験(RCT)の治療効果を決定するためのシステムおよび方法が、例証される。一実施形態は、治療効果を決定するための方法を含む。本方法は、RCTからのデータを受信するステップと、1つまたはそれを上回る生成モデルのセットを使用して、結果データを発生させるステップと、発生された結果データを使用して、RCTに関する治療効果を決定するステップとを含む。
【選択図】
図6
【特許請求の範囲】
【請求項1】
本明細書に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2019年8月23日に出願され、「System and Method for Supplementing Data in Randomized Controlled Trials with Generative Models」と題された、米国仮特許出願第62/891,240号の35 U.S.C. Section 119(e)(米国特許法第119条(e))下の利益および優先権を主張する。米国仮特許出願第62/891,240号の開示は、あらゆる目的のために、参照することによって、その全体として本明細書に組み込まれる。
【0002】
本発明は、概して、分析のためのデータを補完することに関し、より具体的には、生成モデルを使用して、分析のためのデータを補完することに関する。
【背景技術】
【0003】
無作為化対照試験(RCT)は、一般的には、薬物および医療用デバイス等の新しい治療の安全性および有効性を査定するために使用される。RCTでは、特定の特性を伴う対象のグループが、新しい治療を受ける1つまたはそれを上回る実験グループ、または比較治療(例えば、偽薬)を受ける対照グループに無作為に割り当てられ、これらのグループからの転帰が、新しい治療の安全性および有効性を査定するために比較される。ヒト対象をRCTに参加するように募集することは、高価かつ時間がかかり、ある場合には、非倫理的である。
【発明の概要】
【課題を解決するための手段】
【0004】
本発明の実施形態による、無作為化対照試験(RCT)の治療効果を決定するためのシステムおよび方法が、例証される。一実施形態は、治療効果を決定するための方法を含む。本方法は、RCTからのデータを受信するためのステップと、1つまたはそれを上回る生成モデルのセットを使用して、結果データを発生させるためのステップと、発生された結果データを使用して、RCTに関する治療効果を決定するためのステップとを含む。
【0005】
さらなる実施形態では、受信されたデータは、RCTの対象からのパネルデータを含み、発生された結果データは、1つまたはそれを上回るデジタル対象のセットに関する予測されるパネルデータを含む。パネルデータは、複数の離散時点における複数の特性の観察された値を説明する。
【0006】
さらに別の実施形態では、デジタル対象のセットに関する予測されるパネルデータは、RCTの母集団統計に基づいて発生され、発生された結果データは、RCTデータの対照群データを補完するために使用される。
【0007】
なおもさらなる実施形態では、デジタル対象のセットに関する予測されるパネルデータは、RCTの対象の個々の特性に基づいて発生される。
【0008】
さらに別の実施形態では、治療効果を決定するステップは、特定の対象の特性に基づいて予測されるパネルデータをRCTデータからの特定の対象に関するパネルデータと比較するステップを含む。
【0009】
さらにさらなる実施形態では、特定の対象に関する予測されるパネルデータは、いくつかの予測される転帰を含む。治療効果を決定するステップは、いくつかの予測される転帰に基づいて、変換された裾面積確率を算出するステップと、変換された裾面積確率に基づいて、特定の対象のための応答を決定するステップとを含む。
【0010】
別の付加的実施形態では、本方法はさらに、履歴データを受信するためのステップを含む。履歴データは、履歴対照群、患者レジストリ、電子カルテ、および実世界データからの対照群データのうちの少なくとも1つを含む。
【0011】
さらなる付加的実施形態では、本方法はさらに、履歴データを使用して、生成モデルのセットを予め訓練するためのステップを含む。
【0012】
再び別の実施形態では、本方法はさらに、履歴データに基づいて事前分布を決定するためのステップを含む。治療効果を決定するステップはさらに、事前分布に基づく。
【0013】
再びさらなる実施形態では、本方法はさらに、RCTの対照群に関するRCTデータを使用して、生成モデルのセットの第1の生成モデルと、RCTの治療群に関するRCTデータを使用して、生成モデルのセットの第2の生成モデルとを調整するためのステップを含む。治療効果を決定するステップは、第1の生成モデルおよび第2の生成モデルを比較するステップを含む。
【0014】
なおもさらに別の実施形態では、第1の生成モデルおよび第2の生成モデルを比較するステップは、第1の生成モデルからサンプルの第1のセットを引き出すステップと、第2の生成モデルからサンプルの第2のセットを引き出すステップと、サンプルの第1および第2のセットの分布を比較するステップとを含む。
【0015】
なおもさらにさらなる実施形態では、本方法はさらに、RCTに関する特性のセットを決定するためのステップを含む。特性のセットは、対照群および治療群のそれぞれにおいて登録されるべきいくつかの対象を含む。
【0016】
さらに別の付加的実施形態では、RCTに関する特性のセットを決定するステップは、所望の第一種過誤率および所望の第二種過誤率のうちの少なくとも一方に基づく。
【0017】
なおもさらなる付加的実施形態では、生成モデルのセットは、条件付き制限ボルツマン機械、統計モデル、敵対的生成ネットワーク、再帰型ニューラルネットワーク、ガウス過程、オートエンコーダ、自己回帰モデル、および変分オートエンコーダのうちの少なくとも1つを含む。
【0018】
再びさらに別の実施形態では、治療効果を決定するステップは、生成モデルのセットに関する偏りを決定するステップと、決定された偏りに基づいて、決定された治療効果を補正するステップとを含む。
【0019】
再びなおもさらなる実施形態では、治療効果を決定するステップは、相互作用に基づいて、条件付き平均治療効果を算出するステップを含む。
【0020】
付加的な実施形態および特徴が、部分的に、続く説明において記載され、部分的に、本明細書の考察の結果、当業者に明白な状態となる、または本発明の実践によって習得され得る。本開示の一部を形成する、本明細書の残りの部分および図面の参照によって、本発明の性質および利点のさらなる理解が、実現され得る。
本明細書は、例えば、以下の項目も提供する。
(項目1)
治療効果を決定するための方法であって、前記方法は、
無作為化対照試験(RCT)からのデータを受信するステップと、
1つまたはそれを上回る生成モデルのセットを使用して、結果データを発生させるステップと、
前記発生された結果データを使用して、前記RCTに関する治療効果を決定するステップと
を含む、方法。
(項目2)
前記受信されたデータは、前記RCTの対象からのパネルデータを含み、前記発生された結果データは、1つまたはそれを上回るデジタル対象のセットに関する予測されるパネルデータを含み、前記パネルデータは、複数の離散時点における複数の特性の観察された値を説明する、項目1に記載の方法。
(項目3)
前記デジタル対象のセットに関する前記予測されるパネルデータは、前記RCTの母集団統計に基づいて発生され、
前記発生された結果データは、前記RCTデータの対照群データを補完するために使用される、
項目2に記載の方法。
(項目4)
前記デジタル対象のセットに関する前記予測されるパネルデータは、前記RCTの対象の個々の特性に基づいて発生される、項目2に記載の方法。
(項目5)
前記治療効果を決定するステップは、特定の対象の特性に基づく前記予測されるパネルデータを前記RCTデータからの前記特定の対象に関する前記パネルデータと比較するステップを含む、項目4に記載の方法。
(項目6)
特定の対象に関する前記予測されるパネルデータは、複数の予測される転帰を含み、
前記治療効果を決定するステップは、
前記複数の予測される転帰に基づいて、変換された裾面積確率を算出するステップと、
前記変換された裾面積確率に基づいて、前記特定の対象のための応答を決定するステップと
を含む、項目4に記載の方法。
(項目7)
履歴データを受信するステップをさらに含み、前記履歴データは、履歴対照群、患者レジストリ、電子カルテ、および実世界データからの対照群データのうちの少なくとも1つを含む、項目1に記載の方法。
(項目8)
前記履歴データを使用して、生成モデルのセットを予め訓練するステップをさらに含む、項目7に記載の方法。
(項目9)
前記履歴データに基づいて事前分布を決定するステップをさらに含み、前記治療効果を決定するステップはさらに、前記事前分布に基づく、項目7に記載の方法。
(項目10)
前記RCTの対照群に関する前記RCTデータを使用して、前記生成モデルのセットの第1の生成モデルを調整し、前記RCTの治療群に関する前記RCTデータを使用して、前記生成モデルのセットの第2の生成モデルを調整するステップをさらに含み、前記治療効果を決定するステップは、前記第1の生成モデルおよび第2の生成モデルを比較するステップを含む、項目1に記載の方法。
(項目11)
前記第1の生成モデルおよび第2の生成モデルを比較するステップは、
前記第1の生成モデルからサンプルの第1のセットを引き出すステップと、
前記第2の生成モデルからサンプルの第2のセットを引き出すステップと、
前記サンプルの第1および第2のセットの分布を比較するステップと
を含む、項目10に記載の方法。
(項目12)
前記RCTに関する特性のセットを決定するステップをさらに含み、前記特性のセットは、対照群および治療群のそれぞれにおいて登録されるべきいくつかの対象を含む、項目1に記載の方法。
(項目13)
前記RCTのための前記特性のセットを決定するステップは、所望の第一種過誤率および所望の第二種過誤率のうちの少なくとも一方に基づく、項目12に記載の方法。
(項目14)
前記生成モデルのセットは、条件付き制限ボルツマン機械、統計モデル、敵対的生成ネットワーク、再帰型ニューラルネットワーク、ガウス過程、オートエンコーダ、自己回帰モデル、および変分オートエンコーダのうちの少なくとも1つを含む、項目1に記載の方法。
(項目15)
前記治療効果を決定するステップは、
前記生成モデルのセットに関する偏りを決定するステップと、
前記決定された偏りに基づいて、前記決定された治療効果を補正するステップと
を含む、項目1に記載の方法。
(項目16)
前記治療効果を決定するステップは、相互作用に基づいて、条件付き平均治療効果を算出するステップを含む、項目1に記載の方法。
【図面の簡単な説明】
【0021】
本説明および請求項は、本発明の例示的実施形態として提示され、本発明の範囲の完全な列挙として解釈されるべきではない、以下の図およびデータグラフを参照して、より完全に理解されるであろう。
【0022】
【
図1】
図1は、本発明の種々の実施形態による、臨床治験の分析における生成モデルに関する使用の実施例を図示する。
【0023】
【
図2】
図2は、本発明のある実施形態による、RCTの治療効果を決定するためのプロセスのある実施例を概念的に図示する。
【0024】
【
図3】
図3は、本発明のある実施形態による、臨床治験パネルデータに関する生成モデルのある実施例を図示する。
【0025】
【
図4】
図4は、本発明のある実施形態による、治療効果を推定するために生成モデルを使用する、ある実施例を図示する。
【0026】
【
図5】
図5は、本発明のある実施形態による、治療効果を推定するためにデジタル対象から情報を借用する、ある実施例を図示する。
【0027】
【
図6】
図6は、本発明のある実施形態による、治療効果を推定するためにデジタルツインから情報を借用する、ある実施例を図示する。
【0028】
【
図7】
図7は、本発明のある実施形態による、治療効果を推定するために一般化線形モデルおよびデジタルツインを使用する、ある実施例を図示する。
【0029】
【
図8】
図8は、本発明のある実施形態による、個々の治療応答を測定するために生成モデルを使用する、ある実施例を図示する。
【0030】
【
図9】
図9は、本発明のある実施形態による、個々の治療応答を用いて治療効果を推定する、ある実施例を図示する。
【0031】
【
図10】
図10は、本発明のいくつかの実施形態による、治療効果を決定する治療分析システムのある実施例を図示する。
【0032】
【
図11】
図11は、本発明の種々の実施形態による、治療効果を決定するプロセスを実施するための命令を実行する、治療分析要素のある実施例を図示する。
【0033】
【
図12】
図12は、本発明のある実施形態による、治療効果を決定するための治療分析アプリケーションのある実施例を図示する。
【発明を実施するための形態】
【0034】
詳細な説明
本発明のいくつかの実施形態によるシステムおよび方法は、生成モデルからサンプリングされたデータを使用して、無作為化対照試験(RCT)に関する治療効果を決定する、RCTを設計する、および/または治療に関する決定規則を決定することができる。本発明のいくつかの実施形態による、生成モデルからサンプリングされたデータは、本説明の全体を通して「デジタル対象」と称され得る。多くの実施形態では、デジタル対象は、調査の開始時に治療グループの所与の統計値に合致するように発生されることができる。本発明の多数の実施形態によるデジタル対象は、調査における対象毎に発生されることができ、発生されたデジタル対象は、反事実分析のためにデジタルツインとして使用されることができる。種々の実施形態では、生成モデルは、各患者に対して個々のものである応答の測定値を算出するために使用されることができ、本応答は、治療の効果を査定するために使用されることができる。本発明のいくつかの実施形態によるシステムおよび方法は、発生されたデジタル対象データを組み込むことによって導入され得る偏りを補正することができる。
【0035】
ある実施形態では、本発明のいくつかの実施形態によるプロセスは、RCTの異なる群のために要求される対象の数を低減させることによって、RCT設計を改良することができる。本発明のいくつかの実施形態によるプロセスは、試験の統計的検出力を向上させることによって、RCTから治療効果を正確に決定するためのシステムの能力を改良することができる。多くの実施形態では、RCTを行うプロセスは、分析および治療決定を通して設計から改良されることができる。
【0036】
本発明の種々の実施形態による、臨床治験の分析における生成モデルに関する使用の実施例が、
図1に図示される。第1の実施例105は、生成モデル、デジタル対象、またはデジタルツインが、従来的な無作為化対照試験の統計的検出力を向上させるために使用され得ることを例証する。第2の実施例110では、発生されたデータが、無作為化対照試験の対照グループにおいて登録されるために要求される対象の数を減少させるために使用される。第3の実施例115は、発生されたデータが、単一群試験の外部コンパレータ群として使用され得ることを示す。
【0037】
RCTでは、特定の特性を伴う対象のグループが、新しい治療を受ける1つまたはそれを上回る実験グループ、または比較治療(例えば、偽薬)を受ける対照グループに無作為に割り当てられ、これらのグループからの転帰が、新しい治療の安全性および有効性を査定するために比較されることができる。一般性を失うことなく、RCTは、i=1,...
,N人のヒト対象を含むように仮定され得る。これらの対象は、多くの場合、治療グループに割り当てられる確率が、いかなる観察されていない特性にも関係なく、対象毎に同一であるように、対照グループまたは治療グループに無作為に割り当てられる。グループへの対象iの割当は、インジケータ変数wiによって表される。例えば、2つのグループを用いた調査では、対象iが、対照グループに割り当てられる場合、wi=0となり、対象iが、治療グループに割り当てられる場合、wi=1となる。治療グループに割り当てられる対象の数は、NT=Σiwiであり、対照グループに割り当てられる対象の数は、NC=N-NTである。
【0038】
種々の実施形態では、RCTにおける各対象iは、時間tにおける変数x
ij(t)のベクトルx
i(t)によって説明されることができる。本説明では、表記
【化1】
は、時間ゼロにおいて得られたデータのベクトルを示すための、対象iおよびx
0,iからのデータのパネルを示す。RCTは、多くの場合、治療が転帰y
i=f(X
i)に影響を及ぼす方法を推定するステップに関係する。関数f(・)は、治療の転帰を査定するために使用されている、変数の組み合わせを説明する。本発明のいくつかの実施形態による変数は、とりわけ、(限定ではないが)調査の終了時における、単一の変数の値に基づく単純なエンドポイント、調査の終了時における、患者の特性から構築される複合スコア、および/またはある範囲の率または生存率期間等の時間依存的転帰を含むことができる。本明細書に説明されるような、本発明の種々の実施形態によるアプローチは、((限定ではないが)治療の有効性および安全性に関連するもの等の)1つまたはそれを上回る転帰に及ぼす治療の効果を分析するために適用されることができる。
【0039】
各対象は、2つの潜在的転帰を有している。対象が、対照グループに割り当てられた場合、すなわち、w
i=0である場合、y
i
(0)が、観察される潜在的転帰となるであろう。対照的に、対象が、治療を受けるように割り当てられた場合、すなわち、w
i=1である場合、y
i
(1)が、観察される潜在的転帰となるであろう。実践では、対象は、観察された転帰が、Y
i=y
i
(0)(1-w
i)+w
iy
i
(1)となるように、治療群のうちの1つのみに割り当てられることができる。本発明の多くの実施形態による潜在的転帰は、限定ではないが、以下のような条件付き平均治療効果(1)および/または平均治療効果(2)等の種々の尺度を含むことができる。
【化2】
【化3】
本発明のいくつかの実施形態によるプロセスは、これらの数量を高い正確度および精度で推定することができる、および/または低い過誤率を有する治療を効果的であると宣言するための決定規則を決定することができる。
【0040】
ヒト対象をRCTに参加するように募集することは、高価かつ時間がかかり、ある場合には、非倫理的であり得る。結果として、RCTのために要求される対象の数を低減させるために外部対照群を使用するための、いくつかの方法が、開発されている。これらの方法は、典型的には、「履歴借用」または「外部対照」と称される、2つのバケットに分類される。
【0041】
履歴借用は、以前に完了した試験の対照群からのデータを新しい試験の分析に組み込むことを指す。典型的には、履歴借用は、履歴データセットから導出された事前分布を使用して、ベイズ法を適用する。そのような方法は、無作為化対照試験の検出力を向上させ、対照群のサイズを減少させる、またはさらに、対照群を履歴データ自体(すなわち、「外部対照群」)と差し替えるために使用されることができる。外部対照群のいくつかの実施例は、以前に完了した臨床治験(履歴対照群とも呼ばれる)からの対照群と、患者レジストリと、日常的処置を受ける患者から収集されたデータ(実世界データと呼ばれる)とを含む。これらの外部対照群の使用は、本RCTの母集団または設計が、外部データソースの母集団または設計と異なる場合、深刻な欠点を有し得る。
【0042】
近年では、機械学習方法を適用し、シミュレートされた対象記録を生成することが、可能な状態になってきた。RCTからのデータに加えて、本発明のいくつかの実施形態による生成モデルが、同時確率分布
【化4】
および条件付き確率分布
【化5】
(θ
Jおよびθ
Cは、それぞれ、同時分布および条件付き分布のパラメータである)を通して、ベースライン特性x
0および対照の潜在的転帰y
(0)をリンクすることができる。同時分布のモデルもまた、条件付き分布のモデルを提供するであろうが、逆は、当てはまらないことに留意されたい。
【0043】
いくつかの実施形態では、シミュレートされた対象記録は、(限定ではないが)履歴、レジストリ、および/または実世界データのうちの1つまたはそれを上回るもの等の種々のデータに基づいて訓練され得る、確率的生成モデルからサンプリングされることができる。そのようなモデルは、新しい患者母集団および新しい研究に外挿されることを可能にすることができる。
【0044】
いくつかの実施形態では、生成モデルは、申請臨床試験データモデル(SDTM)等の専門的フォーマットにおいて、直接または間接的にのいずれかでデータを生成し、標準的ワークフローへのシームレスな統合を促進し得る。種々の実施形態では、データのパネル全体を発生させるステップは、試験転帰(一次エンドポイント、二次エンドポイント、および探索的エンドポイント、および安全性情報等)のうちの多くのものが、単一の生成モデルを使用した非常に倹約的な方法において分析され得るため、魅力的であり得る。単純化のために、表記p(y,x0)が、本説明では、p(X)の代わりに使用され得るが、前者が、常時、データのパネルXを発生させ、次いで、パネルから具体的な転帰y=f(X)を算出することによって、後者から取得され得るとの理解を伴う。
【0045】
本発明の多数の実施形態によるシステムおよび方法は、確率的生成モデルからのデータをRCTの分析に組み込むための種々のアプローチを提供することができる。多数の実施形態では、そのような方法は、履歴データセットから直接借用することと対照的に、モデルから借用することとして見なされ得る。それからデータが借用され得る生成モデルが、(例えば、不正確なモデル化の仮定に起因して)偏り得るため、本発明のいくつかの実施形態によるシステムおよび方法は、RCTの分析におけるこれらの潜在的偏りを考慮することができる。本発明の種々の実施形態による生成モデルは、調査の開始時に各シミュレートされた対象の特性の制御を提供することができる。例えば、本発明の種々の実施形態によるプロセスは、調査におけるヒト対象毎に1つまたはそれを上回るデジタルツインを生成することができる。本発明のある実施形態によるプロセスは、デジタルツインを組み込み、統計的検出力を向上させることができ、母集団レベル情報を借用する、または履歴または実世界データベース内の患者への最も近傍の近隣合致を使用する、調査設計等の従来的調査設計より個別化された情報を提供することができる。
治療効果の決定
【0046】
RCTの治療効果を決定するためのプロセスのある実施例が、
図2に概念的に図示される。プロセス200は、RCTデータを受信する(205)。RCTデータは、RCTの対象から収集されたパネルデータを含むことができる。本発明の種々の実施形態によるRCTデータは、対象が治療を受けたかどうかに基づいて、対照群と治療群とに分割されることができる。多くの実施形態では、RCTデータは、発生された対象データで補完されることができる。本発明のいくつかの実施形態による発生された対象データは、(限定ではないが)デジタル対象データおよび/またはデジタルツインデータを含むことができる。
【0047】
いくつかの実施形態では、プロセスは、生成モデルを予め訓練する、および/またはベイズ分析のための事前分布を決定するために使用され得る、履歴データを受信することができる。本発明の多数の実施形態による履歴データは、(限定ではないが)履歴対照群、患者レジストリ、電子カルテ、および/または実世界データからの対照群を含むことができる。
【0048】
プロセス200は、生成モデルを使用して、デジタル対象データを発生させる(210)。本発明のある実施形態による生成モデルは、個人および/または母集団の特性に基づいて、潜在的転帰データを発生させるように訓練されることができる。本発明のいくつかの実施形態によるデジタル対象データは、(限定ではないが)パネルデータ、転帰データ等を含むことができる。多数の実施形態では、生成モデルは、直接、具体的な転帰p(y|x0)に関して訓練されることができる。例えば、生成モデルを使用することの目標が、無作為化対照試験の一次分析のための統計的検出力を向上させることである場合、p(y|x0)のモデルを使用することのみで十分であり得る(但し、必要ではない)。
【0049】
代替として、または併せて、生成モデルは、臨床治験の分析において使用され得る、パネルデータを発生させるように訓練される。臨床治験内の対象に関するデータは、典型的には、パネルであり、すなわち、これは、複数の離散時点(例えば、臨床治験の敷地への訪問)における複数の特性の観察された値を説明する。例えば、生成モデルルを使用することの目標が、試験の対照グループ内の対象の数を低減させること、または単一群試験のための外部コンパレータとしてのものである場合、本発明の多くの実施形態による発生されたパネルデータが、試験の分析の多くのものまたは全てを実施するために使用されることができる。
【0050】
いくつかの実施形態では、生成モデルは、(限定ではないが)従来的統計モデル、敵対的生成ネットワーク、再帰型ニューラルネットワーク、ガウス過程、オートエンコーダ、自己回帰モデル、変分オートエンコーダ、および/または他のタイプの確率的生成モデルを含むことができる。例えば、本発明のいくつかの実施形態によるプロセスは、(限定ではないが)それから任意の転帰が算出され得る、パネルデータp(X)の完全同時分布のための条件付き制限ボルツマン機械等の逐次モデルを使用することができる。
【0051】
本発明のある実施形態による、臨床治験パネルデータのための生成モデルのある実施例が、
図3に図示される。本発明の種々の実施形態に従ってパネルデータを発生させるステップは、1つのみの具体的な転帰ではなく、臨床治験内での種々の分析(例えば、一次エンドポイント、二次エンドポイント、および探索的エンドポイント、および安全性情報)のために生成モデルから情報を借用することを可能にすることができる。加えて、生成モデルから引き出されたデジタル対象は、試験内の実際の対象から取得されたデータと同一の形態であることができる。
【0052】
図2に戻って参照すると、プロセス200は、発生されたデジタル対象データを使用して、RCTに関する治療効果を決定する(215)。本発明の多くの実施形態による生成モデルは、種々の用途のために種々の異なる方法においてRCTの分析に組み込まれることができる。多くの実施形態では、生成モデルは、対照群および治療群からのデータに基づいて別個の生成モデルを訓練することによって、治療効果を推定するために使用されることができる。本発明の多くの実施形態によるプロセスは、生成モデルを使用し、デジタル対象を発生させ、RCT内の対照群を補完することができる。ある実施形態では、プロセスは、生成モデルを使用し、対照群および/または治療群内の個人のためにデジタルツインを発生させることができる。本発明の多数の実施形態による生成モデルは、治療に対する個別化された応答を定義するために使用される。本発明の種々の実施形態に従って治療効果を決定するための種々の方法が、本明細書により詳細に説明される。
【0053】
いくつかの実施形態では、治療効果は、一般化線形モデル(GLM)を発生されたデジタル対象データおよび/またはRCTデータに適合させることによって決定されることができる。いくつかの実施形態では、マルチレベルGLMが、パラメータ(例えば、治療効果)が、最大尤度またはベイズアプローチを通して推定され得るように設定されることができる。頻度論的アプローチでは、帰無仮説β0=0を試験し得る一方、ベイズアプローチは、事後確率Prob(β0≧0|data,prior)に焦点を当て得る。
【0054】
RCT内の治療効果を決定するための具体的なプロセスが、上記に説明されるが、種々のプロセスのうちのいずれも、具体的な用途の要件に対して適宜、治療効果を決定するために利用されることができる。ある実施形態では、ステップは、示され、説明される順序またはシーケンスに限定されない、任意の順序またはシーケンスにおいて実行または実施され得る。いくつかの実施形態では、上記のステップのうちのいくつかは、待ち時間および処理時間を短縮させるために、適切である場合、実質的に同時に、または並行して実行または実施されてもよい。いくつかの実施形態では、上記のステップのうちの1つまたはそれを上回るものが、省略されてもよい。
生成モデルを使用した治療効果の推定
【0055】
多くの実施形態では、プロセスは、2つの新しい生成モデル、すなわち、治療グループからのデータを使用する治療モデル
【化6】
、および対照グループからのデータを使用する対照モデル
【化7】
を訓練することによって、治療効果を推定することができる。種々の実施形態では、RCTからのデータの完全なパネルが、生成モデルを訓練し、発生されたデータのパネルを生成するために使用されることができる。そのようなプロセスは、訓練された対照モデルに対して訓練された治療モデルを比較することによって、((限定ではないが)一次エンドポイント、二次エンドポイント、および探索的エンドポイント、および安全性情報を含む)多くの転帰の分析を可能にすることができる。単純化のために、表記p(y,x
0)が、p(X)の代わりに使用され得るが、前者が、常時、データのパネルXを発生させ、次いで、パネルから具体的な転帰y=f(X)を算出することによって、後者から取得され得るとの理解を伴う。
【0056】
一実施形態では、対照条件のための生成モデル(例えば、条件付き制限ボルツマン機械)が、以前に完了した臨床治験からの履歴データに基づいて訓練されることができる。次いで、対照グループおよび治療グループのための2つの新しい生成モデルが、最小限化の問題を解決することによって取得されることができる。
【化8-1】
【化8-2】
式中、λ
0およびλ
1は、予め訓練された生成モデルが、RCTの2つの群における転帰を説明する良好程度を説明する、以前のパラメータであり、D(・,・)は、(限定ではないが)カルバック・ライブラー情報量等、2つの生成モデル間の差異の尺度である。例えば、新しい生成モデルもまた、条件付き制限ボルツマン機械であり得る。
【0057】
治療効果に関する推定は、次いで、以下のように算出されることができる。
【化9】
いくつかの実施形態では、治療効果は、対照モデルおよび治療モデルからサンプルを引き出し、サンプルの分布を比較することによって、算出されることができる。本発明のいくつかの実施形態によるプロセスはさらに、治療効果推定の不確実性を調節することによって、治療効果の算出を調整することができる。いくつかの実施形態では、治療効果推定の不確実性
【化10】
が、RCTからのデータを繰り返して(差替を伴って)再サンプリングし、更新された生成モデルを訓練し、治療効果に関する推定値を算出することによって、ブートストラップを使用して取得されることができ、不確実性は、これらの推定値の標準偏差である。いくつかの実施形態では、治療効果に関する点推定およびその不確実性に関する推定が、決定規則を生成するために仮説検定を実施するために使用されることができる。
【0058】
多数の実施形態では、プロセスは、(例えば、履歴データのベイズ分析から取得される)生成モデルのパラメータに関する分布π(θ
J)から開始することができる。次いで、θ
J0およびθ
J1に関する事後分布が、ベイズ規則を適用することによって推定されることができる。
【化11】
ある実施形態では、治療効果に関する点推定が、事後分布の平均値として計算されることができる。
【化12】
不確実性が、事後分布の分散である場合、以下のようになる。
【化13】
上記のように、治療効果に関する点推定およびそれらの不確実性に関する推定が、本発明のある実施形態に従って決定規則を生成するために、仮説検定を実施するために使用されることができる。本発明の種々の実施形態によるプロセスは、ベースライン共変量x
0に基づいて条件付けられる治療効果を推定するために、同時生成モデルと対照的に(またはそれと合わせて)、条件付き生成モデル
【化14】
を訓練することができる。
【0059】
これらの方法に基づいて決定規則の動作特性を決定することは、困難であり得る。具体的には、第一種過誤率(すなわち、効果がない治療が効果的であると宣言されるであろう、確率)および第二種過誤率(すなわち、効果的な治療が、効果がないと宣言されるであろう、確率)を推定するために、大規模なシミュレーションが、要求され得る。十分に特性評価された動作特性が、RCTの多くの用途のために要求され、結果として、本アプローチは、多くの場合、実現困難である。現代の機械学習技法に依拠する生成モデルは、典型的には、訓練するのに計算上高価である。結果として、ブートストラップまたはベイズ法を使用し、合理的な決定規則を公式化するために要求される、不確実性を取得することは、非常に厄介であり得る。
【0060】
本発明のある実施形態に従って治療効果を推定するために生成モデルを使用する、ある実施例が、
図4に図示される。第1の段階405において、対照条件の訓練されていない生成モデルが、(限定ではないが)以前に完了した臨床治験、電子カルテ、および/または他の調査からのデータ等の履歴データを使用して訓練される。第2の段階410において、患者母集団が、無作為化対照試験の一部として、無作為に、対照グループと治療グループとに分割される。母集団からの患者が、本発明の種々の実施形態に従って、不均一無作為化を用いて、対照グループと治療グループとに無作為化されることができる。本実施例では、2つの新しい生成モデル、すなわち、対照グループのためのものと治療グループのためのものとが、訓練される。ある実施形態では、対照生成モデルおよび治療生成モデルは、予め訓練された生成モデルに基づくことができるが、加えて、RCTからの新しい情報を反映するように訓練されることもできる。対照モデルおよび生成モデルからの出力が、次いで、比較され、治療効果を算出することができる。いくつかの実施形態では、ベイズ法および/またはブートストラップが、治療効果の不確実性を推定するために使用されてもよく、p値および/または事後確率に基づく決定規則が、適用されてもよい。
デジタル対象からの情報の借用
【0061】
生成モデルの特性を定義することは、モデルから新しいサンプルを引き出し得ることである。いくつかの実施形態では、生成モデルからの各サンプルは、デジタル対象である。本発明のいくつかの実施形態によるプロセスは、合成母集団のモーメントが、RCTにおける実際の母集団の種々のモーメントに合致するように、i=1,...、M’に関するデ
ジタル対象の初期サンプル(y
i,x
0,i)~p(y
i,x
0,i)を引き出すことができる。目標が、
【化15】
となるように、
【化16】
を、デジタル対象データからの算出されたモーメントと実際の母集団から算出されたモーメントとの間の一致の尺度とする。本発明の多くの実施形態に従って初期母集団を発生させるためのプロセスは、あるiを無作為に選定し、新しいサンプル(y’
i,x’
0,i
)~p(y,x
0)を発生させることができる。プロセスは、そうすることが、
【化17】
を減少させる場合、デジタル対象iをサンプルと差し替えることができる。サンプルを発生させるためにマルコフ連鎖(例えば、深層ボルツマン機械)を使用する生成モデルに関して、本発明のいくつかの実施形態によるプロセスは、サンプルiから開始する1つまたはそれを上回るステップを講じることによって、新しいサンプルを算出することができる。
【0062】
所与の対象が、RCTからの実際の対象である場合、変数s
i=0定義し、対象が、生成モデルから引き出されたデジタル対象である場合、s
i=1を定義する。RCTにおける対象からのデータは、(Y
i,x
0,i,w
i,s
i=0)として表されることができる。同様に、M個のサンプル
【化18】
も、生成モデルを使用して発生されることができ、サンプルのうちのN
S≦M個のものが、RCTの包含基準に基づいて、または(限定ではないが)時間ゼロにおけるいくつかの選定された変数の平均および標準偏差等の調査母集団の特性のうちのいくつかのものに合致するように選択されることができる。
【0063】
本発明のある実施形態によるシステムおよび方法は、以下によって与えられた一般化線形モデル(GLM)をその最も一般的な形態において適合させることによって、治療効果に関する推定にデジタル対象を組み込むことができる。
【化19】
式中、g(・)は、リンク関数である。例えば、g(μ)=μは、線形回帰に対応し、g(μ)=log(μ/(1-μ))は、ロジスティック回帰に対応する。種々の実施形態では、本フレームワークはまた、生存率分析のために特殊事例として使用される、コックス比例ハザードモデルも含むことができる。多くの実施形態では、これらの係数のうちのいくつかのものが、より単純なモデルを生成するためにゼロに設定されてもよい。
【0064】
方程式7の実施例では、b個の係数を伴う項が、治療効果を表し、これは、ベースライン共変量x0に依存し得る。c個の係数を伴う項が、生成モデルの潜在的偏りを表し、これは、ベースライン共変量x0に依存し得る。d個の係数を伴う項が、試験における治療グループと対照グループとの間の潜在的なベースライン差異を表す。モデルは、GLMを適合させるための種々の方法のうちのいずれかを使用して、適合されることができる。
【0065】
いくつかの実施形態では、係数の不確実性が、分析的に推定されることができる。代替として、または併せて、本発明の多数の実施形態による不確実性は、データを繰り返して再サンプリングし(差替を用いて)、モデルを再度適合させることによって、ブートストラップを使用して推定されることができる。本発明の多くの実施形態による不確実性は、そのような再サンプリング手順によって算出された、係数の標準偏差として算出されることができる。治療効果に関する点推定およびそれらの不確実性に関する推定が、本発明の多くの実施形態に従って決定規則を生成するために、仮説検定を実施するために使用されることができる。
【0066】
理論上、完璧な生成モデルは、インジケータ変数s
iが、影響を及ぼさないように、全てのjに関してc
j=0の状態で、偏りを有していないであろう。しかしながら、機械学習モデルは、訓練セットから外れたデータに完全に一般化しない場合がある。典型的には、モデルの一般化性能は、提出されたデータが、モデルの性能を試験するために使用され得るように、モデル訓練相からあるデータを提出することによって測定される。例えば、生成モデルに加えて、履歴臨床治験からの1つまたはそれを上回る対照群が、存在すると仮定する。次いで、c個の係数が、履歴対照群データに対して低減されたGLMを適合させることによって、本発明の多数の実施形態に従って推定されることができる。
【化20】
これは、特に、データに基づいた事前分布が、RCTにおけるベイズ分析(例えば、方程式7)内で使用され得る場合、分布π(a,c)が履歴データを使用してこれらの係数に関して推定され得る、ベイズフレームワークにおいて有用であり得る。本質的には、本発明のいくつかの実施形態によるプロセスは、履歴データを使用し、生成モデルが新しい母集団に一般化される可能性が高い程度を決定し、次いで、本情報をRCTの分析に適用することができる。π(c)→δ(c-0)という限界では、デジタル対象は、RCT内の実際の対照対象に代入可能な状態となる。結果として、生成モデルが、優れているほど、より少ない対照対象が、RCT内で要求される。ある実施形態では、治療グループと対照グループとの間の潜在的なベースライン差異に関するd個の係数を含む、w
i=0であるとき、類似のアプローチが、アクティブである、任意の係数に関する事前情報を含むように、使用され得る。
【0067】
ある実施形態では、より単純なモデルが、パラメータのうちのいくつかのものをゼロに設定することによって、生成され得る。c個の係数の影響を理解するために、線形リンク関数を伴い、相互作用を伴わず、全てのd個の係数をゼロに設定する、単純な事例が、説明される。本単純な事例では、上記のGLMは、単純線形回帰の状態になる。
【化21】
加えて、対数尤度関数に対して以下のペナルティを追加することによって、表現され得る、事前分布を仮定する。
【化22】
式中、λは、生成モデルの品質における確信の程度を制御する。前述に述べられるように、事前分布のパラメータは、履歴データから推定される、および/またはいくつかの他の手段を通して規定され得る。当業者は、これが、事前分布または事前情報を組み込むための手段の唯一の選択肢ではなく、これが、本発明の種々の実施形態によるプロセスの性質を例証するための分析のために十分に単純な実施例を提供することを認識するであろう。
【0068】
多くの実施形態では、点推定および治療効果の不確実性が、結果として生じる事後分布のLaplace近似を使用して推定されることができる。実践では、(限定ではないが)厳密な積分、マルコフ連鎖モンテカルロ計算、および/または変分近似計算を含む、種々の方法が、事後分布を取得するために使用され得る。Laplace近似(すなわち、事後分布の最大値についての級数展開)を使用すると、以下
【化23】
によって求められ得るパラメータa、b
0、およびc
0の事後分布と、
以下
【化24】
によって求められ得る、点推定との共分散行列に関する推定を導出することが、可能である。
【0069】
λ→0という限界では、点推定は、
【化25】
であり、不確実性は、
【化26】
である。これは、治療効果に関する通例の頻度論的推定である。λ=0が、デジタル対象を発生させるために使用されるモデルが、不十分な品質である可能性が高いという事前確信を表現するため、デジタル対象からの情報が、完全に無視されていることに留意されたい。対照的に、モデルから発生されたデジタル対象が、実際の対照対象から統計的に区別不可能であるとの事前確信を表現する、限界λ→∞を検討する。本場合には、点推定は、
【化27】
であり、不確実性は、
【化28】
である。すなわち、これは、デジタル対象データを、これが実際の対照対象データに厳密に代入可能である場合と同様に取り扱う。λの中間値は、デジタル対照対象からの情報の中間量を借用する。
【0070】
前述の実施例におけるように、ベイズ法を使用し、デジタル対象データを臨床治験に組み込むことによって、試験の統計的検出力を向上させる、および/または対照グループのために要求される実際の対象の数を低減させることが、可能となる。履歴データを使用して事前分布のパラメータを推定することによって、デジタル対象を生成するために使用されるモデルが、正確であるように示され得る場合、多数の実際の対象を要求しない、魅力的な動作特性(すなわち、低い第一種過誤率および第二種過誤率)を伴う試験を生成および設計することが、可能であり得る。本発明の種々の実施形態による動作特性が、分析計算および/またはコンピュータシミュレーションを通して特性評価されることができる。
【0071】
本発明のある実施形態に従って治療効果を推定するためにデジタル対象から情報を借用する、ある実施例が、
図5に図示される。第1の段階505において、対照条件の生成モデルが、(限定ではないが)以前に完了した臨床治験、電子カルテ、または他の調査からのデータ等の履歴データを使用して訓練される。第2の段階510では、実施されるべき分析が、ベイズ式である場合、生成モデルからの予測が、予測が新しい母集団に一般化する程度を捕捉する事前分布を取得するためにモデルを訓練するために使用されなかった、履歴データと比較される。頻度論的分析は、第2の段階510をスキップすることができる。第3の段階515において、無作為化対照試験が、(潜在的に、不均一無作為化を用いて)行われる。生成モデルが、デジタル対象を生成するために使用され、データの全てが、(分析が、ベイズ式である場合、ステップ510から以前のものを含む)統計分析に組み込まれ、治療効果を推定する。ベイズ法、分析計算、またはブートストラップが、治療効果の不確実性を推定するために使用されてもよく、p値または事後確率に基づく決定規則が、適用されてもよい。
デジタルツインからの情報の借用
【0072】
いくつかの方法は、共変量を調節しながら、GLMを使用して治療効果を推定する。例えば、治療のインジケータに対する試験における最終転帰の回帰、および試験の開始時の疾患の重症度の測定を実施し得る。共変量が、治療が無作為化対照試験において割り当てられる前に測定される限り、共変量を調節するステップは、頻度論的分析における治療効果に関する推定を偏らせることはないであろう。共変量調整を使用しているとき、統計的検出力は、転帰と調節されている共変量との間の相関の関数であり、相関が、高いほど、統計的検出力が、より高くなる。
【0073】
理論上、取得し得る転帰と最も相関する共変量は、転帰の正確な予測である。したがって、本発明の種々の実施形態に従って生成モデルをRCTに組み込むための別の方法は、治療効果を推定するために、生成モデルを使用し、転帰を予測し、GLMにおいて予測された転帰を調節することである。Ep[yi]およびVarp[yi]は、それぞれ、対象iに関する、生成モデルによって予測される転帰の予期される値および分散を示すとする。生成モデルのタイプに応じて、これらのモーメントは、本発明のいくつかの実施形態に従って、分析的に、またはより一般的には、生成モデルp(yi|x0,i)からサンプルを引き出し、モーメントのモンテカルロ推定を算出することによって、算出可能であり得る。モンテカルロ推定を算出するために使用されるサンプルの数は、研究者によって選択されるパラメータであることができる。上記のように、本発明のいくつかの実施形態によるプロセスは、単一の生成モデルが、所与の試験(例えば、一次エンドポイント、二次エンドポイント、および探索的エンドポイント、および安全性情報)における多くの転帰の分析のために使用され得るようにパネルデータを発生させる、生成モデルを使用することができる。いくつかの実施形態では、所与の転帰に関する予測ではなく、生成モデルから導出される複数の転帰の予測が全て、特定の転帰に関するGLMの中に含まれてもよい。本発明のいくつかの実施形態による生成モデルから引き出されたサンプルが、試験の開始時に、その対象のデジタルツインとも称される、対象の特性に基づいて条件付けられることができる。
【0074】
多くの実施形態では、デジタルツインは、以下の形態のGLMを適合させることによって、治療効果を推定するためにRCTに組み込まれることができる。
【化29-1】
【化29-2】
式中、g(・)は、リンク関数である。例えば、g(μ)=μは、線形回帰に対応し、g(μ)=log(μ/(1-μ))は、ロジスティック回帰に対応する。本発明の多数の実施形態による本フレームワークはまた、特殊事例として、生存率分析のために使用されるコックス比例ハザードモデルを含むことができる。多くの実施形態では、これらの係数のうちのいくつかが、より単純なモデルを生成するためにゼロに設定されてもよい。当業者は、所望に応じて、共変量として、生成モデルからの他の予測を含むことが、自明であることを認識するであろう。
【0075】
上記の方程式は、種々の用途および実装に一般化されることができる。b個の係数を伴う項が、治療効果を表し、これは、ベースライン共変量x0に依存し得る。c個の係数を伴う項が、生成モデルの潜在的偏りを表し、これは、ベースライン共変量x0に依存し得る。d個の係数を伴う項が、試験における治療グループと対照グループとの間の潜在的なベースライン差異を表す。z個の係数を伴う項が、予測された転帰と観察された転帰との間の関係が、治療によって影響を及ぼされ得ることを反映する。モデルは、GLMを適合させるための種々の方法のうちのいずれかを使用して適合されることができる。いくつかの実施形態では、係数の不確実性が、分析的に推定されることができる。代替として、または併せて、本発明の多くの実施形態によるプロセスは、データを繰り返して(差替を伴って)再サンプリングし、モデルを再度適合させることによって、ブートストラップを使用して不確実性を推定することができ、不確実性は、本再サンプリング手順によって算出される、係数の標準偏差であることができる。いくつかの実施形態では、治療効果に関する点推定およびそれらの不確実性に関する推定が、決定規則を生成するために仮説検定を実施するために使用されることができる。
【0076】
いくつかの実施形態では、転帰の分散は、生成モデルによって予測される転帰の分散を調節する、別のGLMを通してモデル化されることができる。例えば、本発明の多くの実施形態による分散は、以下のようにモデル化されることができる。
【化30】
式中、G(・)は、分散のために適切である、リンク関数である。例えば、G(σ
2)=log(σ
2)は、持続的転帰に関して使用されることができる。多くの実施形態では、これらの係数のうちのいくつかのものが、より単純なモデルを生成するためにゼロに設定されてもよい。当業者は、生成モデルからの他の予測が、所望に応じて共変量として含まれ得ることを認識するであろう。
【0077】
本発明のある実施形態に従ってよく訓練された生成モデルは、構築によって、
【化31】
と、
【化32】
とを有するであろう。したがって、GLMにおける係数についての事前知識が、治療効果の推定を改良するために使用されることができる。しかしながら、機械学習モデルは、訓練セットから外れたデータに完全に一般化されない場合がある。典型的には、モデルの一般化性能が、提出されたデータが、モデルの性能を試験するために使用され得るように、モデル訓練相からあるデータを提出することによって測定される。例えば、生成モデルに加えて、履歴臨床治験からの1つまたはそれを上回る対照群が、存在すると仮定する。次いで、本発明の種々の実施形態によるc個の係数が、平均(13)または分散(14)に関して、低減されたGLMを履歴対照群データに対して適合させることによって、推定されることができる。
【化33】
【化34】
これは、特に、データに基づいた事前分布が、RCTにおけるベイズ分析内で使用され得る場合、分布π(a,c)またはπ(α、γ)が、履歴データを使用してこれらの係数に関して推定され得る、ベイズフレームワークにおいて有用である。本質的には、これは、履歴データを使用し、生成モデルが新しい母集団に一般化される可能性が高い程度を決定し、次いで、本情報をRCTの分析に適用する。π(a,c)→δ(a-0)δ(c-1)という限界では、本発明の種々の実施形態によるデジタルツインは、RCTにおける実際の対照対象に代入可能な状態になることができる。結果として、生成モデルが、優れているほど、RCTにおいて要求される対照対象が、より少なくなる。いくつかの実施形態では、類似のアプローチが、d個の係数を含む、w
i=0であるとき、アクティブである任意の係数に基づく事前情報を含むように使用され得る。
【0078】
本発明の種々の実施形態に従って治療効果を推定するためにデジタルツインを組み込む、臨床治験の頻度論的分析およびベイズ分析に関するワークフローの実施例が、下記に説明される。持続的エンドポイントに関する頻度論的事例に関して、相互作用および等分散性誤差がないと仮定して、以下の単純な実施例を検討する。
【化35】
当業者は、これが、方程式11および方程式12によって捕捉される、より一般的な場合に適用され得る方法を認識するであろう。多数の実施形態では、単純な分析が、より容易に解釈される結果につながり得る。本モデルは、モデルが、(例えば、最大尤度によって)適合され得るように、通常の尤度を含意する。
【化36】
考慮するための2つの状況、すなわち、(1)試験の設計が、デジタルツインが、試験の統計的検出力を向上させるために使用され得るように、デジタルツインを組み込むことに先立って、ある方法によってすでに決定されていること、または(2)試験が、十分な検出力を伴う効率的設計を達成するためにデジタルツインを組み込むように設計される必要があることが、存在する。持続的エンドポイントの場合では、試験の統計的検出力は、y
iと、履歴データから推定され得、治療効果の規模の関数であり得る、E
p[y
i]との間の相関に依存するであろう。種々の実施形態では、分析の公式が、本特殊事例において導出されることができる。代替として、または併せて、コンピュータシミュレーションが、一般的場合において利用されることができる。
【0079】
いったん試験が、設計されると、患者が、登録され、その転帰が測定されるまで、追跡調査される。ある場合には、患者は、試験を終了することが不可能である場合があり、種々の方法(最終観察値前方繰越法等)が、大部分の臨床治験におけるように、試験を完了していない患者に関する転帰をインピュートするために適用される必要がある。いくつかの実施形態では、GLMは、試験からのデータに適合され、治療効果に関する点推定
【化37】
および不確実性
【化38】
を取得することができる。比率
【化39】
は、p値p
b0を算出するために使用され得る、スチューデントのt分布に追従し、
【化40】
(
【化41】
は、第一種過誤率の所望の対照である)である場合、治療効果が存在しないという帰無仮説が、拒否され得る。本アプローチは、第一種過誤率を制御することが保証される一方、実現される検出力は、y
iおよびE
p[y
i]のサンプル外相関および真の効果サイズに関連するであろう。
【0080】
等分散性誤差を伴う持続的エンドポイントに関するベイズ事例では、単純な分析を仮定する。
【化42】
ある実施形態では、単純な分析は、より容易に解釈される結果につながり得る。本モデルは、以下のように通常の尤度を含意するが、本発明の種々の実施形態によるプロセスは、最大尤度の方法の代わりに、これを適合させるためにベイズアプローチを使用することができる。
【化43】
特に、生成モデルを訓練するために使用されなかった、条件w
i=0を表す履歴データを用いると、本発明の多くの実施形態によるプロセスは、RCTの分析のための事前分布を導出するために、モデルを履歴データに適合させることができる。
【化44】
そうするために、(限定ではないが)正規逆ガンマ事前分布または別の適切な事前分布等の事前分布π
0(a,c
0,σ
2)等を採集する。履歴データを分析する前に事前のパラメータを通知するためのデータが、存在しないため、本発明のいくつかの実施形態によるプロセスは、事前拡散または事前デフォルトを使用することができる。多数の実施形態では、事前分布に対するベイズ更新が、履歴データから算出され、新しい分布π
H(a,c
0,σ
2)を導出することができる(下付き文字Hは、本分布が、履歴データから取得されたことを示すために使用され得る)。本発明の多数の実施形態によるプロセスは、次いで、治療効果に関する事前分布π
0(b
0)を規定することができる。これはまた、利用可能である場合、本発明の多くの実施形態に従ってデータから導出され得る、または事前拡散または事前デフォルトが、使用され得る。完全な事前分布は、ここで、π
H(a,c
0,σ
2)π
0(b
0)となる。種々の実施形態では、そのような分布は、典型的なベイズ試験設計におけるように、試験を設計するために予期されるサンプルサイズを算出するために使用されることができる。いったん試験が、設計されると、患者が、登録され、その転帰が測定されるまで、追跡調査されることができる。ある場合には、患者は、試験を終了することが不可能である場合があり、種々の方法(最終観察値前方繰越法等)が、大部分の臨床治験におけるように、試験を完了していない患者に関する転帰をインピュートするために適用されることができる。
【0081】
多数の実施形態では、GLMは、パラメータに関して事後分布π
RCT(a,b
0,c
0,σ
2)を取得するために適合されることができる。治療効果に関する点推定が、例えば、
【化45】
によって算出されることができるが、他のベイズ点推定も同様に、算出され得る。いくつかの実施形態では、治療効果がゼロを上回る事後確率もまた、
【化46】
として算出されることができる(式中、θ(・)は、引数が、真である場合、1を返し、そうでない場合は、ゼロを返す、論理関数である)。典型的ベイズ分析におけるように、治療は、本発明のいくつかの実施形態に従って、Prob(b
0≧0)が、予め規定された閾値を超過する場合、効果的であると宣言されることができる。
【0082】
情報価値があり得る、ベイズ分析に対する2つの限界が、存在する。最初に、平坦な事前分布の限界では、π
H(a,c
0,σ
2)π
0(b
0)∝1であり、次いで、治療効果の点推定および不確実性は、前述に説明される最尤法と同一の結果を与えるように収束するであろう。したがって、RCTにおける母集団へのデジタルツインモデルの一般化可能性が、疑わしい場合、ベイズ分析は、最終的に頻度論的分析に非常に類似した状態になるであろう。デジタル対象を含む、試験における治療効果を推定するために使用される方法と対照的に、分析内にデジタルツインを含むことは、依然として、y
iが、E
p[y
i]と相関する限り、検出力の利得につながる。他の有益な限界は、π
H(a,c
0,σ
2)π
0(b
0)∝δ(a-0)δ(c
0-1)である。本限界では、治療効果に関する点推定が、
【化47】
に収束する。すなわち、いくつかの実施形態では、治療効果に関する推定が、治療を受けた患者w
i=1に関する、観察された転帰と予測された転帰との間の差異の平均をとることによって、取得されることができる。本後者の事前分布が、対照治療を受けた患者w
i=0からのデータが無視され得る状況につながり得ることに留意されたい。本発明の種々の実施形態によるプロセスは、同時対照群を伴うことなく試験を実行することができる。
【0083】
これらの単純な実施例を通して捕捉される頻度論的方法およびベイズ法に対して、利点と、欠点とが、存在する。RCTの分析においてデジタルツインを含むことに対する頻度論的アプローチは、第一種過誤率を制御しながら、統計的検出力の向上につながる。所望に応じて、同時対照群のために要求される対象の数を減少させるために統計的検出力の理論的向上を使用することもまた、可能であるが、これは、ゼロの同時対照対象まで低減されることはできない。ベイズアプローチは、(例えば、履歴データの分析から)デジタルツインを生成するために使用されるモデルの一般化可能性についてのより多くの情報を借用し、結果として、検出力を頻度論的アプローチよりもはるかに多く向上させることができる。加えて、本発明の多数の実施形態によるベイズ法の使用は、同時対照群のサイズをさらにもっと減少させることを可能にすることができる。しかしながら、検出力の向上/要求されるサンプルサイズの減少は、制御されていない第一種過誤率を犠牲にして生じ得る。したがって、本発明の多くの実施形態によるプロセスは、試験の動作特性が説明され得るように、第一種過誤率を推定するためにベイズ分析のコンピュータシミュレーションを実施することができる。
【0084】
最終実施例として、GLMもまた分散のために使用される、単純な事例を検討することが、役立つ。例えば、以下のモデルを検討する。
【化48】
その尤度は、以下のようになる。
【化49】
【0085】
本発明のいくつかの実施形態によるモデルは、転帰の分散が、デジタルツインモデルによって予測される分散と相関し、分散が、治療によって影響を及ぼされ得る、異分散性を可能にすることができる。いくつかの実施形態では、GLMのシステムは、より単純なモデルに関する事例におけるように、(例えば、最大尤度、ベイズアプローチ等を使用して)適合されることができる。当業者は、また、必要である場合、より複雑な関係をモデル化するために、相互作用または他の項も含み得ることを明確に認識するであろう。加えて、当業者はまた、相互作用を含むことが、平均治療効果に加えて、条件付き平均治療効果の推定につながり得ることも認識するであろう。
【0086】
本発明のある実施形態に従って治療効果を推定するためにデジタルツインからの情報を借用する実施例が、
図6に図示される。第1の部分605において、対照条件の生成モデルが、以前に完了した臨床治験、電子カルテ、または他の調査からの履歴データを使用して訓練される。第2の部分610において、実施されることになる分析が、ベイズ式である場合、生成モデルからの予測が、予測が新しい母集団に一般化する程度を捕捉する事前分布を取得するためにモデルを訓練するために使用されなかった、履歴データと比較される。頻度論的分析は、事前分布を取得する必要はない。第3の部分615では、無作為化対照試験が、(潜在的に不均一無作為化を用いて)行われ、デジタルツインが、試験における対象毎に発生され、データの全てが、(分析が、ベイズ式である場合、ステップ610から以前のものを含む)統計分析に組み込まれ、治療効果を推定する。ベイズ法、分析計算、またはブートストラップが、治療効果の不確実性を推定するために使用されてもよく、p値または事後確率に基づく決定規則が、適用されてもよい。
【0087】
本発明のある実施形態による、治療効果を推定するために一般化線形モデルおよびデジタルツインを使用する、ある実施例が、
図7に図示される。本図面は、持続的転帰の単純な分析を使用した概念を図示する。x軸が、デジタルツインからの転帰に関する予測を表し、y軸が、RCTにおける対象の観察された転帰を表す。線形モデルが、RCTからのデータに適合され、デジタルツインから予測される転帰を調節する。相互作用が、含まれていない場合、2つの平行線が、データに、すなわち、一方が対照グループに、一方が治療グループに適合される。これらの線の間の距離は、治療効果に関する推定である。頻度論的方法およびベイズ法は両方とも、一般化線形モデルを分析するために使用され得る。
応答を定義し、治療効果を推定するための生成モデルの使用
【0088】
前述の節において、応答が、転帰の単位yで定義された。例えば、生存率転帰を伴う分析は、時間の単位を伴う治療効果を生産するであろう。例えば、治療が、平均で6ヶ月生存率を改良することが、見出され得る。これは、典型的には、治療効果の解釈を補助するために有用である。しかしながら、その自然単位の観点から治療効果を定義することは、不均質である、母集団の治療の重要な特性を覆い隠し得る。すなわち、具体的な個人が治療に対して応答する方法を理解するために、異なる方法において治療効果を測定することが、有益であり得る。
【0089】
多数の実施形態では、生成モデルが、治療に対する個別化された応答を定義するために、使用されることができる。特に、対照条件の生成モデル下において、y
iを上回る、またはそれに等しい転帰を観察する確率を定義する、持続的転帰の裾確率を検討する。
【化50】
すなわち、対象iが、それらが対照を受けている場合、y
iより良好な転帰を有するであろう、確率p
iが、存在する。本実施例が、より大きいy
iが、より良好であると仮定するが、積分の下限を-∞に、かつ上限をy
iに変更することによって、反対の場合を検討することが、自明であることに留意されたい。いくつかの実施形態では、p
iは、j=1,...,Nに関してy
i~p(y|x
i)を用いて、N個のデジタルツインを生成し、
【化51】
(式中、Θ(・)は、引数が、真である場合、1に等しく、そうでない場合は、ゼロに等しい、論理関数である)を近似することによって、モンテカルロ推定を使用して算出されることができる。
【0090】
本発明のある実施形態による、個々の治療応答を測定するために生成モデルを使用する、ある実施例が、
図8に図示される。生成モデルが、観察された応答に関する裾面積確率を算出するために使用されることができる。これは、患者が、対照条件下において、試験において観察されたものより良好な応答を実証するであろう可能性の高さを説明する。
【0091】
単一の対象の場合では、piは、データが生成モデルから引き出されたという帰無仮説に対する証拠の尺度として解釈されることができる。対照群内の対象がwi=0を伴う場合を検討する。本場合において、小piが観察され得る、2つの理由、すなわち、第1に、これは、単に無作為の偶然に起因し得るものであること、第2に、これは、対照条件の生成モデルが、偏っていることを示し得ることが、存在する。これは、不適切に訓練されたモデル、または訓練データとRCTの同時対照群との間の不整合を反映し得る。しかしながら、piが、概して、wi=0を伴うそれらの対象に関して大きいと仮定する。次いで、これは、対照条件の生成モデルが、RCTの同時対照群からのデータに一貫することを示す。本場合では、wi=1を伴う対象が、小piを有する場合、これは、無作為の偶然または治療に対する応答のいずれかから結果として生じ得る。
【0092】
上記に説明される直観は、RCTの分析における対照条件の生成モデルの2つの付加的な使用を示唆する。第1に、生成モデルが、RCTにおける同時対照群と履歴データからのその予期される挙動との間の相違を測定するために使用されることができる。例えば、平均サプライズ
【化52】
は、本相違の尺度である。大きいサプライズ
【化53】
は、生成モデルの問題または対照グループの問題のいずれかを示す。対照グループに関するp
iを相違を測定するためのスコアに組み合わせるための多くの他の方法が、存在する。本分析は、相違の原因を明確に決定することはできないが、臨床治験の賛助者または規制当局によるさらなる検査にさらなる利点となり得る、潜在的な問題にフラグを立てることができる。
【0093】
本発明の多数の実施形態によるプロセスは、治療効果を推定するための応答の尺度としてp
iを使用して、RCTからのデータに線形モデルを適合させることができる。本発明の種々の実施形態によるプロセスは、正規化変換を使用し、応答をΦ
-1(p
i)として定義し、線形モデルを適合させることができる。
【化54】
式中、Φ
-1(・)は、標準的な正規分布の逆累積分布関数であることができる。パラメータaは、生成モデルの偏りを考慮する。他の節において説明されるように、aに関する事前情報が、本発明のある実施形態に従って、履歴データに対する回帰から導出されることができる。本場合には、
【化55】
は、生成モデルが偏っていない場合、0に等しくなるであろう。いくつかの実施形態では、分析が、本再定義された応答を伴う頻度論的事例およびベイズ式事例に関して全体を通して説明されるように進行することができる。治療効果に関して結果として生じる推定は、構築によって個別化されるという利点を有し、これは、対照条件下において予測された転帰のそれらの分布と比較して、特定の患者が応答した程度を説明する。しかしながら、これはまた、生成モデルを参照せずに解釈することは不可能であるという欠点も有する。それにもかかわらず、そのようなアプローチは、特に、異質効果を伴う治療に関して有用であり得る。
【0094】
本発明のある実施形態に従って個々の治療応答を用いて治療効果を推定する、ある実施例が、
図9に図示される。部分905において、対照条件の生成モデルが、以前に完了した臨床治験、電子カルテ、または他の調査からの履歴データを使用して訓練される。部分910において、実施されるべき分析が、ベイズ式である場合、生成モデルからの予測が、予測が新しい母集団に一般化する程度を捕捉する事前分布を取得するためにモデルを訓練するために使用されなかった、履歴データと比較される。頻度論的分析は、部分910をスキップすることができる。部分915において、無作為化対照試験が、(潜在的に、不均一無作為化を用いて)行われ、生成モデルが、変換された裾面積確率に基づいて、対象毎に応答を定義するために使用され、データの全てが、(分析が、ベイズ式である場合、ステップ910から以前のものを含む)統計分析に組み込まれ、治療効果を推定する。ベイズ法、分析計算、またはブートストラップが、治療効果の不確実性を推定するために使用されてもよく、p値または事後確率に基づく決定規則が、適用されてもよい。
治療効果を決定するためのシステム
治療分析システム
【0095】
本発明のいくつかの実施形態に従って治療効果を決定する、治療分析システムのある実施例が、
図10に図示される。ネットワーク1000は、通信ネットワーク1060を含む。通信ネットワーク1060は、デバイスが、他の接続されるデバイスと通信するためにネットワーク1060に接続されることを可能にする、インターネット等のネットワークである。サーバシステム1010、1040、および1070が、ネットワーク1060に接続される。サーバシステム1010、1040、および1070はそれぞれ、ネットワーク1060を経由してユーザにクラウドサービスを提供するプロセスを実行する、内部ネットワークを介して相互に通信可能に接続される、1つまたはそれを上回るサーバのグループである。当業者は、治療分析システムが、本発明から逸脱することなく、あるコンポーネントを除外し得ること、および/または、簡潔にするために省略される、他のコンポーネントを含み得ることを認識するであろう。
【0096】
本議論の目的のために、クラウドサービスは、ネットワークを経由してデバイスにデータおよび/または実行可能なアプリケーションを提供するために、1つまたはそれを上回るサーバシステムによって実行される、1つまたはそれを上回るアプリケーションである。サーバシステム1010、1040、および1070は、それぞれ、内部ネットワーク内に3つのサーバを有するように示される。しかしながら、サーバシステム1010、1040、および1070は、任意の数のサーバを含んでもよく、任意の付加的な数のサーバシステムが、クラウドサービスを提供するためにネットワーク1060に接続されてもよい。本発明の種々の実施形態によると、本発明の種々の実施形態による治療分析システムが、ネットワーク1060を経由して通信する、単一のサーバシステムおよび/またはサーバシステムのグループ上で実行されているプロセスによって、提供されてもよい。
【0097】
ユーザは、本発明の種々の実施形態に従って治療効果を決定するプロセスを実施するためにネットワーク1060に接続する、個人用デバイス1080および1020を使用してもよい。示される実施形態では、個人用デバイス1080は、ネットワーク1060に従来の「有線」接続を介して接続される、デスクトップコンピュータとして示されている。しかしながら、個人用デバイス1080は、「有線」接続を介してネットワーク1060に接続する、デスクトップコンピュータ、ラップトップコンピュータ、スマートテレビ、エンターテインメントゲーム用コンソール、または任意の他のデバイスであってもよい。モバイルデバイス1020は、無線接続を使用してネットワーク1060に接続する。無線接続は、無線周波数(RF)信号、赤外線信号、また任意の他の形態の無線シグナリングを使用し、ネットワーク1060に接続する、接続である。
図10では、モバイルデバイス1020は、携帯電話である。しかしながら、モバイルデバイス1020は、本発明から逸脱することなく、無線接続を介してネットワーク1060に接続する、モバイルフォン、携帯情報端末(PDA)、タブレット、スマートフォン、または任意の他のタイプのデバイスであってもよい。
【0098】
容易に理解され得るように、治療効果を決定するために使用される具体的なコンピューティングシステムは、主として、所与の用途の要件に依存し、任意の具体的なコンピューティングシステム実装に限定されると見なされるべきではない。
治療分析要素
【0099】
本発明の種々の実施形態に従って治療効果を決定するプロセスを実施するための命令を実行する、治療分析要素のある実施例が、
図11に図示される。本発明の多くの実施形態による治療分析要素は、(限定ではないが)モバイルデバイス、クラウドサービス、および/またはコンピュータのうちの1つまたはそれを上回るものを含むことができる。治療分析要素1100は、プロセッサ1105と、周辺装置1110と、ネットワークインターフェース1115と、メモリ1120とを含む。当業者は、治療分析要素が、本発明から逸脱することなく、あるコンポーネントを除外し得ること、および/または簡潔にするために省略される他のコンポーネントを含み得ることを認識するであろう。
【0100】
プロセッサ1105は、(限定ではないが)メモリ1120内に記憶される命令を実施し、メモリ内に記憶されるデータを操作する、プロセッサ、マイクロプロセッサ、コントローラ、またはプロセッサ、マイクロプロセッサ、および/またはコントローラの組み合わせを含むことができる。プロセッサ命令は、本発明のある実施形態に従ってプロセスを実施するためのプロセッサ1105を構成することができる。
【0101】
周辺装置1110は、(限定ではないが)カメラ、ディスプレイ、および/またはセンサ等、データを捕捉するための種々のコンポーネントのうちのいずれかを含むことができる。種々の実施形態では、周辺装置は、入力を集める、および/または出力を提供するために使用されることができる。治療分析要素1100は、プロセッサ1105によって実施される命令に基づいて、ネットワークを経由してデータを伝送および受信するためにネットワ-クインターフェース1115を利用することができる。本発明の多くの実施形態による周辺装置および/またはネットワークインターフェースは、治療効果を決定するために使用され得る、データを集めるために使用されることができる。
【0102】
メモリ1120は、治療分析アプリケーション1125と、履歴データ1130と、履歴データ1135と、モデルデータ1140とを含む。本発明のいくつかの実施形態による治療分析アプリケーションは、RCTの治療効果を決定する、RCTを設計する、および/または治療に関する決定規則を決定するために使用されることができる。
【0103】
本発明の多くの実施形態による履歴データが、デジタル対象および/またはデジタルツインに関する潜在的転帰を発生させるように、生成モデルを予め訓練するために使用されることができる。多数の実施形態では、履歴データは、(限定ではないが)履歴対照群、患者レジストリ、電子カルテ、および/または実世界データからの対照群を含むことができる。多くの実施形態では、生成モデルからの予測が、予測が新しい母集団に一般化する程度を捕捉する事前分布を取得するためにモデルを訓練するために使用されなかった、履歴データと比較されることができる。
【0104】
いくつかの実施形態では、RCTデータは、RCTの対象から収集されたパネルデータを含むことができる。本発明の種々の実施形態によるRCTデータは、対象が治療を受けたかどうかに基づいて、対照群と治療群とに分割されることができる。多くの実施形態では、RCTデータは、発生された対象データで補完されることができる。本発明のいくつかの実施形態による発生された対象データは、(限定ではないが)デジタル対象データおよび/またはデジタルツインデータを含むことができる。
【0105】
いくつかの実施形態では、モデルデータは、生成モデルに関する種々のパラメータおよび/または加重を記憶することができる。本発明の多くの実施形態によるモデルデータは、履歴データに基づいて訓練される、および/またはRCTデータに基づいて訓練されるモデルに関するデータを含むことができる。いくつかの実施形態では、予め訓練されたモデルは、RCTデータに基づいて更新され、デジタル対象を発生させることができる。
【0106】
治療分析要素1100の具体的な実施例が、本図に図示されているが、種々の治療分析要素のうちのいずれも、本発明の実施形態に従って具体的な用途の要件に対して適宜、本明細書に説明されるものに類似する、治療効果を決定するためのプロセスを実施するために利用されることができる。
治療分析アプリケーション
【0107】
本発明のある実施形態に従って治療効果を決定するための治療分析アプリケーションのある実施例が、
図12に図示される。治療分析アプリケーション1200は、デジタル対象発生器1205と、治療効果エンジン1210と、出力エンジン1215とを含む。当業者は、治療分析アプリケーションが、本発明から逸脱することなく、あるコンポーネントを除外し得ること、および/または簡潔にするために省略される他のコンポーネントを含み得ることを認識するであろう。
【0108】
本発明の種々の実施形態によるデジタル対象発生器は、デジタル対象および/またはデジタルツインデータを発生させ得る、生成モデルを含むことができる。本発明のある実施形態による生成モデルが、個人および/または母集団の特性に基づいて潜在的転帰データを発生させるように訓練されることができる。本発明のいくつかの実施形態によるデジタル対象データは、(限定ではないが)パネルデータ、転帰データ等を含むことができる。いくつかの実施形態では、生成モデルは、(限定ではないが、)従来的統計モデル、敵対的生成ネットワーク、再帰型ニューラルネットワーク、ガウス過程、オートエンコーダ、自己回帰モデル、変分オートエンコーダ、および/または他のタイプの確率的生成モデルを含むことができる。
【0109】
種々の実施形態では、治療効果エンジンは、発生されたデジタル対象データおよび/またはRCTからのデータに基づいて、治療効果を決定するために使用されることができる。いくつかの実施形態では、治療効果エンジンは、デジタル対象発生器からのデジタル対象データを使用し、限定ではないが、RCTの対照群および治療群からのデータに基づいて別個の生成モデルを比較すること、RCTにおける対照群を補完すること、予測される潜在的対照転帰を実際の治療転帰と比較すること等の種々の異なる用途において治療効果を決定することができる。本発明のいくつかの実施形態による治療効果エンジンが、治療に対する個別化された応答を決定するために使用されることができる。ある実施形態では、治療効果エンジンは、デジタル対象発生器の生成モデルの偏りを決定し、治療効果分析における偏り(または偏りに関する補正)を組み込むことができる。
【0110】
本発明のいくつかの実施形態による出力エンジンは、ユーザに、(限定ではないが)決定規則、治療効果、生成モデルの偏り、推奨されるRCT設計等を含む、種々の出力を提供することができる。多数の実施形態では、出力エンジンは、デジタル対象発生器の生成モデルの結果が、RCT母集団から分散するときにフィードバックを提供することができる。例えば、発明のある実施形態による出力エンジンは、対照群からの対象のデジタルツインに関する発生された対照転帰とそれらの実際の対照転帰との間の差異が、閾値を超過するとき、通知を提供することができる。
【0111】
治療分析アプリケーションの具体的な実施例が、本図に図示されているが、種々の治療分析アプリケーションのうちのいずれも、本発明の実施形態に従って具体的な用途の要件に対して適宜、本明細書に説明されるものに類似する、治療効果を決定するためのプロセスを実施するために利用されることができる。
【0112】
治療効果を決定する具体的な方法が、上記に議論されるが、治療分析の多くの異なる方法が、本発明の多くの異なる実施形態に従って実装されることができる。したがって、本発明が、本発明の範囲および精神から逸脱することなく、具体的に説明されるもの以外の方法において実践され得ることを理解されたい。したがって、本発明の実施形態は、全ての点で、例証的であり、かつ制限的ではないと見なされるべきである。故に、本発明の範囲は、例証される実施形態によってではなく、添付の請求項およびそれらの均等物によって決定されるべきである。
【外国語明細書】