(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-05
(54)【発明の名称】ADAS-Cogスコアを予測する方法
(51)【国際特許分類】
G16H 20/00 20180101AFI20241128BHJP
【FI】
G16H20/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024537017
(86)(22)【出願日】2022-12-13
(85)【翻訳文提出日】2024-08-13
(86)【国際出願番号】 EP2022085684
(87)【国際公開番号】W WO2023126170
(87)【国際公開日】2023-07-06
(32)【優先日】2021-12-29
(33)【優先権主張国・地域又は機関】GB
(32)【優先日】2022-08-03
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
(71)【出願人】
【識別番号】507092676
【氏名又は名称】ウィスタ ラボラトリーズ リミテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】アガルワル,アニッシュ
(72)【発明者】
【氏名】ミシュラ,ヴィシャル
(72)【発明者】
【氏名】シェルター,ビョルン
(72)【発明者】
【氏名】シャー,デヴァブラット
(72)【発明者】
【氏名】シェン,デニス
(72)【発明者】
【氏名】シールズ,ヘレン
(72)【発明者】
【氏名】ウィスチク,クロード ミシェル
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するための方法。本方法は、複数の患者又は患者コホートに関するデータを取得することであって、データが、経時的な複数の患者又は患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、各患者又は患者コホートが、複数の治療計画から選択された治療計画を受けている、データを取得することと、データを、患者又は患者コホート、時間、及び治療計画にわたるテンソルにエンコードすることと、機械学習プロセス及びテンソルを使用して、ターゲット患者又はターゲット患者コホートの合成モデルを生成することと、合成モデルを使用して、複数の治療計画から選択されたターゲット治療計画の下でのターゲット患者又はターゲット患者コホートのADAS-Cogスコアを予測することとを含む。
【特許請求の範囲】
【請求項1】
アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するための方法であって、
複数の患者又は患者コホートに関するデータを取得することであって、前記データが、経時的な前記複数の患者又は患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、各患者又は患者コホートが、複数の治療計画から選択された治療計画を受けている、データを取得することと、
前記データを、患者又は患者コホート、時間、及び治療計画にわたるテンソルにエンコードすることと、
機械学習プロセス及び前記テンソルを使用して、ターゲット患者又はターゲット患者コホートの合成モデルを生成することと、
前記合成モデルを使用して、前記複数の治療計画から選択されたターゲット治療計画の下でのターゲット患者又はターゲット患者コホートのADAS-Cogスコアを予測することと
を含む方法。
【請求項2】
前記ターゲット患者/コホートの前記合成モデルが、前記ターゲット患者又はターゲット患者コホートに関係するデータを使用して生成される、請求項1に記載の方法。
【請求項3】
前記テンソルが3階テンソルである、請求項1又は2に記載の方法。
【請求項4】
前記ターゲット患者又はターゲット患者コホートが実際の治療計画を受けており、前記実際の治療計画が前記ターゲット治療計画とは異なる、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記合成モデルが、前記ターゲット患者/コホートが受けた実際の治療計画と同じ治療計画に対応する前記テンソル内の観察データのセットに少なくとも一部基づいて、機械学習プロセスを使用して生成される、請求項4に記載の方法。
【請求項6】
前記機械学習プロセスが、前記ターゲット患者/コホートに関係する前記データと、前記実際の治療計画に関連付けられる前記テンソル内の観察データの前記セットとの最小ノルム線形関係を決定することを含む、請求項5に記載の方法。
【請求項7】
前記機械学習プロセスが、主成分回帰(PCR)分析を実行することを含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記生成された合成モデルの訓練誤差を決定することによって、前記ターゲット患者又はターゲット患者コホートの前記合成モデルを検証することをさらに含み、その後、前記決定された訓練誤差が事前定義された基準を満たす場合にのみ、前記合成モデルを使用して前記ターゲット患者又はターゲット患者コホートの前記ADAS-Cogスコアを予測するステップに進む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記ターゲット治療計画の下での前記ターゲット患者/コホートの前記ADAS-Cogスコアを予測することが、前記合成モデルと、前記ターゲット治療計画に対応する前記テンソル内のデータのセットとに基づく、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記複数の患者又は患者コホートに関する前記データが、アルツハイマー病を治療するための臨床試験からのデータである、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記臨床試験の結果において、前記ターゲット治療計画の下での前記ターゲット患者又はターゲット患者コホートの前記予測されたADAS-Cogスコアを使用することをさらに含む、請求項10に記載の方法。
【請求項12】
脱落者による臨床試験での欠落データを予測するためのものである、請求項1~11のいずれか一項に記載の方法。
【請求項13】
請求項1~12のいずれか一項に記載の方法を使用して神経認知疾患を治療するための臨床試験用のデータを処理するための方法であって、
少なくとも2つの患者コホートに関するデータを取得することであって、第1の患者コホートが、第1の治療計画を受けている患者の第1のサブセットと、第2の治療計画を受けている患者の第2のサブセットとを含み、第2の患者コホートが、前記第1の治療計画を受けている患者の第1のサブセットと、第3の治療計画を受けている患者の第2のサブセットとを含み、前記データが、経時的な前記患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含む、データを取得することと、
前記データを、患者コホート、時間、及び治療計画にわたるテンソルにエンコードすることと、
機械学習プロセス及び前記テンソルを使用して、前記第1の患者コホートの第1の合成モデルと、前記第2の患者コホートの第2の合成モデルとを生成することと、
前記第1の合成モデルを使用して前記第3の治療計画の下での前記第1の患者コホートのADAS-Cogスコアを予測し、前記第2の合成モデルを使用して前記第2の治療計画の下での前記第2の患者コホートのADAS-Cogスコアを予測することと
を含む方法。
【請求項14】
前記第1及び第2の合成モデルが、前記第1の治療計画に対応する前記テンソルでの観察データのセットに少なくとも一部基づいて、前記機械学習プロセスを使用して生成される、
請求項13に記載の方法。
【請求項15】
前記第3の治療計画の下での前記第1の患者コホートの前記ADAS-Cogスコアを予測することが、前記第1の合成モデルと、前記第3の治療計画に対応する前記テンソル内のデータのセットとに基づき、
前記第2の治療計画の下での前記第2の患者コホートの前記ADAS-Cogスコアを予測することが、前記第2の合成モデルと、前記第2の治療計画に対応する前記テンソル内のデータのセットとに基づく、
請求項13又は14に記載の方法。
【請求項16】
コンピュータ実装された請求項1~15のいずれか一項に記載の方法。
【請求項17】
アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するためのシステムであって、
複数の患者又は患者コホートに関するデータを取得するように構成されたデータ獲得手段であって、前記データが、経時的な前記複数の患者又は患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、各患者又は患者コホートが、複数の治療計画から選択された治療計画を受けている、データ獲得手段と、
前記データを、患者又は患者コホート、時間、及び治療計画にわたるテンソルにエンコードするように構成されたテンソル生成手段と、
機械学習プロセス及び前記テンソルを使用して、患者又は患者コホートの合成モデルを生成するように構成された合成モデル生成手段と、
前記合成モデルを使用して、前記複数の治療計画のうちのターゲット治療計画の下での患者又は患者コホートのADAS-Cogスコアを予測するように構成された予測手段と
を備えるシステム。
【請求項18】
前記システムが、アルツハイマー病を治療するための臨床試験のためのデータを処理し、
前記データ獲得手段が、少なくとも2つの患者コホートからのデータを収集するように構成され、第1の患者コホートが、第1の治療計画を受けている患者の第1のサブセットと、第2の治療計画を受けている患者の第2のサブセットとを含み、第2の患者コホートが、前記第1の治療計画を受けている患者の第1のサブセットと、第3の治療計画を受けている患者の第2のサブセットとを含み、前記データが、経時的な前記患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、
前記テンソル生成手段が、前記データを、患者コホート、時間、及び治療計画にわたるテンソルにエンコードするように構成され、
前記合成モデル生成手段が、機械学習プロセス及び前記テンソルを使用して、前記第1の患者コホートの第1の合成モデルと、前記第2の患者コホートの第2の合成モデルとを生成するように構成され、
前記予測手段が、前記第1の合成モデルを使用して前記第3の治療計画の下での前記第1の患者コホートのADAS-Cogスコアを予測し、前記第2の合成モデルを使用して前記第2の治療計画の下での前記第2の患者コホートのADAS-Cogスコアを予測するように構成される、
請求項17に記載のシステム。
【請求項19】
プロセッサ上で実行されるときに、請求項1~16のいずれか一項に記載の方法を前記プロセッサに実施させる機械実行可能命令を含む非一時的なコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、認知機能のレベルを予測するための方法に関し、特に、排他的にではないが、アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するための方法に関する。
【背景技術】
【0002】
背景
アルツハイマー病は、脳内に過剰なタンパク質が蓄積し、ニューロン機能を損ない、最終的には細胞死を引き起こす神経疾患である。この病気は継続的な進行によって特徴付けられるが、進行の速度は個人により異なる。
【0003】
アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)は、個人ごとのアルツハイマー病の進行速度を追跡し、特に個人の認知機能及び非認知機能のレベルを決定及び追跡するために1980年代に開発された。それ以来、例えば前認知症段階の集団でのアルツハイマー病の診断の助けとしても使用されている。ADAS-Cogは現在、アルツハイマー病を含む認知症に関する治療の有効性を評価するためのゴールドスタンダードと考えられている。
【0004】
アルツハイマー病の診断、及び診断後の特定の治療の下での被験者の精神能力の監視は、活発且つ多面的な研究分野であり、しばしば臨床試験の対象となる。
【0005】
製薬会社は、臨床試験を行う助けとなる高度な分析をますます使用している。
【0006】
この傾向は、個別化医療への関心の高まりと、機械学習の登場による最新の統計技法及び計算リソースの急速な発展とによって支えられている(Shah et al, 2019;Bhatt, 2021)。臨床試験の設計及び分析を適応させることによる臨床試験の効率の改善は特に興味深い。さらに、脱落者(すなわち、臨床試験の全過程を経ない患者)は、試験における大きなバイアス源であり、試験が失敗する大きな理由となり得る(Little et. al., 2012)。
【0007】
本発明は、上記のような考慮事項に照らして想到された。
【発明の概要】
【課題を解決するための手段】
【0008】
発明の概要
第1の態様では、アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するための方法であって、
複数の患者又は患者コホートに関するデータを取得することであって、データが、経時的な複数の患者又は患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、各患者又は患者コホートが、複数の治療計画から選択された治療計画を受けている、データを取得することと、
データを、患者又は患者コホート、時間、及び治療計画にわたるテンソルにエンコードすることと、
機械学習プロセス及びテンソルを使用して、ターゲット患者又はターゲット患者コホートの合成モデルを生成することと、
合成モデルを使用して、複数の治療計画から選択されたターゲット治療計画の下でのターゲット患者又はターゲット患者コホートのADAS-Cogスコアを予測することと
を含む方法が提供される。
【0009】
本発明者らは、(例えばアルツハイマー病の治療に関する臨床試験からの)複数の異なる治療計画を受けたときの複数の患者のADAS-Cog軌跡に関するこのデータが、驚くべきことに、アルツハイマー病患者が不均質な健康状態軌跡を有するにもかかわらず、誘発されたテンソルの有意な潜在的な線形構造を示すことを発見した。これは、個人患者レベルでは特に驚くべきことである。これは、正規患者(又は患者コホート)プロファイルの数が限られているため、全ての患者を、その患者らのADAS-Cogスコアに関するこれらのプロファイルの線形結合として表現することができることを意味する。その結果、これにより、特定の治療計画を受けた他の患者からの情報を活用することによって、同じ治療計画の下での任意の患者に関連するADAS-Cog軌跡を予測することができる。
【0010】
このようにして、未知の治療計画(すなわち、ターゲット患者が受けていない治療計画)の下でのターゲット患者又はターゲット患者コホートのADAS-Cogスコア、又はADAS-Cogスコアの縦断的軌跡を推定することができる。
【0011】
ターゲット治療は、一般には未知の治療計画であり、すなわちターゲット患者が受けていないが、仮に患者がターゲット治療計画を受けた場合の転帰が予測されることが望まれる治療計画であることを理解すべきである。
【0012】
次に、任意選択の機能を述べる。これらは、単独で適用することも、本開示の任意の態様と組み合わせて適用することもできる。
【0013】
合成モデルは、利用可能なデータを使用して、利用可能なデータでは見られない(患者/患者コホートと治療との組合せに関する経時的なADAS-Cogスコアの)合成軌跡を作成するモデルであることを理解されたい。
【0014】
好ましくは、複数の患者又は患者コホートに関するデータは、アルツハイマー病を治療するための臨床試験からのデータである。
【0015】
本方法は、ADAS-Cogスコアを予測するための方法に限定されないことがあり、ミニメンタルステート検査(MMSE)、Global Deterioration Scale(GDS)、モントリオール認知評価(MoCA)など、神経認知状態又は低下を予測するための他のスコアの予測にも適用することができることを理解されたい。
【0016】
したがって、より一般には、本方法は、患者又は患者コホートの神経認知状態を予測するための方法であり得る。したがって、取得されるデータは、経時的な複数の患者又は患者コホートの神経認知状態の縦断的軌跡に関する情報を含むことがある。ターゲット患者又はターゲット患者コホートが実際の治療計画を受けていることがあり、実際の治療計画がターゲット治療計画とは異なる。特に、ターゲット患者/コホートは「実際の」治療計画を受けていることがあり、その第1の治療計画の転帰を観察することができる。ターゲット患者/患者コホートが受けていない第2の異なる「ターゲット」治療計画の下でのターゲット患者/患者コホートの転帰は、合成モデルを使用して予測することができる。ここで、「転帰」という用語は、時点tでのターゲット患者/コホートのADAS-Cogスコア、又は経時的なターゲット患者/コホートのADAS-Cog軌跡として理解される。
【0017】
テンソルは3階テンソルであり得る。
【0018】
テンソル内のデータは、複数の患者/コホートの各患者について、(i)経時的なそれぞれの患者/コホートのADAS-Cog軌跡(例えば、それぞれの患者のADAS-Cogスコアの(例えばt=0での)ベースライン測定値、及びその後の複数の時点/通院における患者/コホートのADAS-Cogスコア)と、(ii)それぞれの患者/コホートが受けた治療計画とに関するデータを含むことがある。
【0019】
複数の治療計画のうちの1つ又は複数は、例えばアルツハイマー病の治療のための医薬品又は療法など、1つ又は複数の異なる神経薬理学的介入を含むことがある。複数の治療計画のうちの1つの治療計画は、治療なしに対応することがある(例えば、この治療計画を受ける患者は対照群に含まれる)。異なる治療計画は、治療/医薬品の異なる投与レジームを含むことがある。例えば、第1の治療計画は、標準治療の使用と組み合わせた高用量の治療に対応することがあり、第2の治療計画は、標準治療の不使用と組み合わせた高用量の治療に対応することがあり、第3の治療計画は、標準治療の使用と組み合わせた低用量の治療に対応することがあり、第4の治療計画は、標準治療の不使用と組み合わせた低用量の治療に対応することがある。
【0020】
ターゲット患者又はターゲット患者コホートの合成モデルは、ターゲット患者又はターゲット患者コホートに関係するデータを使用して生成することができる。ターゲット患者又はターゲット患者コホートに関係するデータは、(i)経時的なターゲット患者/コホートのADAS-Cog軌跡(例えば、ターゲット患者/コホートのADAS-Cogスコアの(例えばt=0での)ベースライン測定値、及びその後の複数の時点/通院におけるターゲット患者/コホートのADAS-Cogスコア)と、(ii)それぞれの患者が受けた実際の治療計画とに関するデータを含むことがある。
【0021】
データが個人患者ではなく患者コホートに関係している場合、それぞれのADAS-Cogスコアは、コホートにわたる平均(例えば平均値)ADAS-Cogスコアでよい。
【0022】
好ましくは、合成モデルは、ターゲット患者又はターゲット患者コホートが受けた実際の治療計画と同じ治療計画に対応するテンソル内の観察データのセットに少なくとも一部基づいて、機械学習プロセスを使用して生成され得る。特に、合成モデルは、ターゲット患者/コホートが受けた実際の治療計画に関係するテンソルからの観察データのセットから、少なくとも一部学習され得る。このデータは、ターゲット患者/コホートとテンソル内の患者データとが共通して有するデータの観察されたペア(時間、治療計画)のセットを含むことがある。言い換えると、機械学習プロセスは、ターゲット患者/コホートに関する(試験通院、治療計画)データペアのセットと、同じ通院時点(例えば日)に対応する、同じ(実際の)治療計画の下でのテンソルでの患者とに基づくことがある。
【0023】
機械学習プロセスは、ターゲット患者/コホートに関係するデータと、実際の治療計画に関連するテンソル内の観察データのセットとの最小ノルム線形関係を決定することを含むことがある。
【0024】
機械学習プロセスは、主成分回帰(PCR)分析を実行することを含むことがある。特に、機械学習プロセスは、ターゲット患者/コホートに関係するデータと、ターゲット患者/コホートが受けた実際の治療計画に対応するテンソル内の観察データのセットとの間でPCRを実行することを含むことがある。PCRプロセスは、ターゲット患者/コホートに関係するデータと、実際の治療計画に関連するテンソル内の観察データのセットとの間の一意の最小ノルム線形関係を定義することができる。
【0025】
代替として、他の既知の機械学習アルゴリズム(パラメトリック又はノンパラメトリック)を機械学習プロセスで使用して、ターゲット患者/コホートに関係するデータと、実際の治療計画に関連付けられたテンソル内の観察データのセットとの関係を学習することもできる。例えば、ニューラルネットワークやランダムフォレストを使用することができる。
【0026】
任意選択で、本方法は、ターゲット患者/コホートの合成モデルを検証することを含むことがある。これは、学習された合成モデルの訓練誤差を決定し、その後、決定された訓練誤差が事前定義された基準/閾値を満たす場合にのみ、合成モデルを使用してターゲット患者/コホートのADAS-Cogスコアを予測するステップに進むことを含むことがある。このようにして、合成モデルが満足の行く基準まで訓練されていることを検証することができる。さらに、このステップは、正確な推定値を提供するために、基礎となるデータが望ましい特性を満たしている可能性が高いことも検証する。
【0027】
ターゲット治療計画の下でターゲット患者/コホートのADAS-Cogスコアを予測するステップが、学習された合成モデル、及びターゲット治療計画に対応するテンソル内のデータのセットに基づくことがある。
【0028】
予測は、経時的なターゲット治療計画の下でのターゲット患者/コホートのADAS-Cog軌跡の予測でよく、又は特定の時点tでのADAS-Cogスコアの予測でもよい。
【0029】
任意選択で、本方法は、合成モデルを使用して、複数の治療計画のうちの各治療計画の下でのターゲット患者/コホートのADAS-Cogスコアを予測することを含むことができる。
【0030】
上述したように、データは、アルツハイマー病を治療するため、例えばアルツハイマー病の治療における神経薬理学的介入(医薬品など)の有効性を評価するための臨床試験からのものであり得る。複数の患者は、アルツハイマー病と診断されている治療群でよい。複数の患者は、アルツハイマー病と診断されている患者を含むことがある。
【0031】
上記の方法はコンピュータ実装され得る。例えば、本方法は、1つ又は複数のコンピュータ処理デバイスで実装され得る。1つ又は複数のコンピュータ処理デバイスは、例えば、1つ又は複数のコンピュータ、サーバ、クラウドベースのデバイスでよい。
【0032】
本方法は、臨床試験の結果において、ターゲット治療計画の下でのターゲット患者又はターゲット患者コホートの予測されたADAS-Cogスコアを使用することをさらに含むことがある。
【0033】
第1の例として、本方法は、脱落者(臨床試験の全過程を経なかった患者)による臨床試験での欠落データを予測するためのものであり得る。したがって、ターゲット患者は臨床試験の脱落者でよく、本方法は、ターゲット患者の予測されたADAS-Cogスコアを、臨床試験結果におけるターゲット患者に関する結果として使用することをさらに含むこともある。
【0034】
このようにして、患者が試験から脱落し、経時的なADAS-Cog軌跡全体、したがって試験の転帰を観察することができない場合でも、その患者の経時的なADAS-Cogスコアを、試験での他の患者の観察値を活用することによって予測することができる。脱落者は一般に、試験における大きなバイアス源であり、試験が失敗する大きな理由となり得る。本方法により、このバイアスが低減される。
【0035】
この態様の方法は、上述した好ましい特徴及び任意選択の特徴のいくつかの組合せを含むことも、全てを含むこともあり、又はどれも含まないこともある。
【0036】
別の例として、本方法は、患者コホートレベルでの個別化治療のためのデータ効率が高い臨床試験を設計するために使用することができる。
【0037】
特に、本発明の第2の態様では、上述した方法を使用して神経認知疾患を治療するための臨床試験用のデータを処理するための方法であって、
少なくとも2つの患者コホートに関するデータを取得することであって、第1の患者コホートが、第1の治療計画を受けている患者の第1のサブセットと、第2の治療計画を受けている患者の第2のサブセットとを含み、第2の患者コホートが、第1の治療計画を受けている患者の第1のサブセットと、第3の治療計画を受けている患者の第2のサブセットとを含み、データが、経時的な患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含む、データを取得することと、
データを、患者コホート、時間、及び治療計画にわたるテンソルにエンコードすることと、
機械学習プロセス及びテンソルを使用して、第1の患者コホートの第1の合成モデルと、第2の患者コホートの第2の合成モデルとを生成することと、
第1の合成モデルを使用して第3の治療計画の下での第1の患者コホートのADAS-Cogスコアを予測し、第2の合成モデルを使用して第2の治療計画の下での第2の患者コホートのADAS-Cogスコアを予測することと
を含む方法が提供される。
【0038】
このようにして、第1/第2の合成モデルは、未知の治療の下でのあらゆる患者コホートに関するADAS-Cogスコア(又は経時的なADAS-Cog軌跡)を予測することができる。これにより、臨床試験を受けた被験者のより小さなサブセットからの対応する転帰を活用することによって被験者の転帰を予測することができるので、はるかに少ない患者/被験者を含む臨床試験の設計を行うことができる。これにより、より良いデータ効率の臨床試験が得られる。
【0039】
臨床試験は、例えば、アルツハイマー病や行動障害型前頭側頭型認知症(FTD)を治療するための試験でよい。
【0040】
テンソルは3階テンソルであり得る。
【0041】
テンソル内のデータは、患者コホートの各患者について、(i)経時的なそれぞれの患者のADAS-Cog軌跡(例えば、それぞれの患者のADAS-Cogスコアの(例えばt=0での)ベースライン測定値、及びその後の複数の時点/通院における患者のADAS-Cogスコア)と、(ii)それぞれの患者が受けた治療計画とに関するデータを含むことがある。
【0042】
治療計画は、例えばアルツハイマー病の治療のための医薬品又は療法など、1つ又は複数の異なる神経薬理学的介入を含むことがある。治療計画のうちの1つは、治療なしに対応することがある(例えば、この治療計画を受ける患者は対照群に含まれる)。異なる治療計画は、治療/医薬品の異なる投与レジームを含むことがある。例えば、第1の治療計画は、標準治療の使用と組み合わせた高用量の治療に対応することがあり、第2の治療計画は、標準治療の不使用と組み合わせた高用量の治療に対応することがあり、第3の治療計画は、標準治療の使用と組み合わせた低用量の治療に対応することがある。第4の治療計画は、標準治療の不使用と組み合わせた低用量の治療に対応することがある。
【0043】
第1/第2の合成モデルは、それぞれ第1/第2の患者コホートに関係するデータを使用して生成され得る。第1/第2の患者コホートに関係するデータは、(i)経時的な第1/第2の患者コホートのADAS-Cog軌跡(例えば、第1/第2の患者コホートのADAS-Cogスコアの(例えばt=0での)ベースライン測定値、及びその後の複数の時点/通院における第1/第2の患者コホートのADAS-Cogスコア)と、(ii)それぞれの患者コホート内の患者が受けた実際の治療計画とに関するデータを含むことがある。
【0044】
それぞれのADAS-Cogスコアは、コホートにわたる平均(例えば平均値)ADAS-Cogスコアでよい。
【0045】
好ましくは、第1/第2の合成モデルが、それぞれ第1/第2の患者コホート内の患者が受けた実際の治療計画と同じ治療計画に対応するテンソル内の観察データのセットに少なくとも一部基づいて、機械学習プロセスを使用して生成され得る。例えば、第1の合成モデルは、(第1と第2の患者コホートの両方での患者のサブセットが第1の治療計画を受けるので)第1の治療計画に対応するテンソル内の観察データのセットに少なくとも一部基づいて機械学習プロセスを使用して生成することができる。
【0046】
機械学習プロセスは、第1/第2の患者コホートに関係するデータと、第1の治療計画を受けた第1/第2のコホート内の患者のサブグループに関連するテンソル内の観察データのセットとの最小ノルム線形関係を決定することを含むことがある。
【0047】
機械学習プロセスが、主成分回帰(PCR)分析を実行することを含むことがある。特に、機械学習プロセスは、第1/第2の患者コホートに関係するデータと、それぞれ第1/第2の患者コホートでの患者のサブセットが受けた第1の治療計画に対応するテンソル内の観察データのセットとの間でPCRを行うことを含むことがある。PCRプロセスは、第1/第2の患者コホートに関係するデータと、それぞれ第1/第2の患者コホート内の患者のサブセットが受けた第1の治療計画に関連するテンソル内の観察データのセットとの間の一意の最小ノルム線形関係を定義することができる。
【0048】
代替として、他の既知の機械学習アルゴリズム(パラメトリック又はノンパラメトリック)を機械学習プロセスで使用して、線形関係を学習することもできる。例えば、ニューラルネットワークやランダムフォレストを使用することができる。
【0049】
任意選択で、本方法は、第1及び/又は第2の合成モデルを検証することを含むことがある。これは、学習された第1/第2の合成モデルの訓練誤差を決定し、その後、決定された訓練誤差が事前定義された基準/閾値を満たす場合にのみ、合成モデルを使用してターゲット患者/コホートのADAS-Cogスコアを予測するステップに進むことを含むことがある。このようにして、合成モデルが満足の行く基準まで訓練されていることを検証することができる。さらに、このステップは、正確な推定値を提供するために、基礎となるデータが望ましい特性を満たしている可能性が高いことも検証する。
【0050】
第3/第2の治療計画の下での第1/第2の患者コホートのADAS-Cogスコアを予測するステップは、学習された第1/第2の合成モデルと、第3/第2の治療計画に対応するテンソル内のデータのセットとにそれぞれ基づくこともある。
【0051】
予測は、経時的な第3/第2の治療計画の下での第1/第2の患者コホートのADAS-Cog軌跡の予測でよく、又は特定の時点tでのADAS-Cogスコアの予測でもよい。
【0052】
上記の方法はコンピュータ実装され得る。例えば、本方法は、1つ又は複数のコンピュータ処理デバイスで実装され得る。1つ又は複数のコンピュータ処理デバイスは、例えば、1つ又は複数のコンピュータ、サーバ、クラウドベースのデバイスでよい。
【0053】
この態様の方法は、上述した好ましい特徴及び任意選択の特徴のいくつかの組合せを含むことも、全てを含むこともあり、又はどれも含まないこともある。
【0054】
第3の態様では、1つ又は複数のプロセッサ及びメモリを含むシステムであって、メモリが、1つ又は複数のプロセッサ上で実行されるときに、1つ又は複数のプロセッサに第1の態様の方法を実施させる機械実行可能命令を含む、システムが提供される。
【0055】
メモリは、プロセッサ上で実行されるときに、第1の態様を参照して記載した任意選択の特徴のいずれか1つ又は共存可能であればそれらの組合せを含む第1の態様の方法をプロセッサに実施させる機械実行可能命令を含むことがある。
【0056】
したがって、アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するためのシステムであって、
複数の患者又は患者コホートに関するデータを取得するように構成されたデータ獲得手段であって、データが、経時的な複数の患者又は患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、各患者又は患者コホートが、複数の治療計画から選択された治療計画を受けている、データ獲得手段と、
データを、患者又は患者コホート、時間、及び治療計画にわたるテンソルにエンコードするように構成されたテンソル生成手段と、
機械学習プロセス及びテンソルを使用して、患者又は患者コホートの合成モデルを生成するように構成された合成モデル生成手段と、
合成モデルを使用して、複数の治療計画のうちのターゲット治療計画の下での患者又は患者コホートのADAS-Cogスコアを予測するように構成された予測手段と
を備えるシステムが提供される。
【0057】
いくつかの実施形態では、システムは、例えば、1つ又は複数のコンピュータ、サーバ、又はクラウドベースのデバイスを備えることがある。
【0058】
このシステムは、アルツハイマー病を治療するための臨床試験のためのデータを処理するためのシステムでよく、
データ獲得手段が、少なくとも2つの患者コホートからのデータを収集するように構成され、第1の患者コホートが、第1の治療計画を受けている患者の第1のサブセットと、第2の治療計画を受けている患者の第2のサブセットとを含み、第2の患者コホートが、第1の治療計画を受けている患者の第1のサブセットと、第3の治療計画を受けている患者の第2のサブセットとを含み、データが、経時的な患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、
テンソル生成手段が、データを、患者コホート、時間、及び治療計画にわたるテンソルにエンコードするように構成され、
合成モデル生成手段が、機械学習プロセス及びテンソルを使用して、第1の患者コホートの第1の合成モデルと、第2の患者コホートの第2の合成モデルとを生成するように構成され、
予測手段が、第1の合成モデルを使用して第3の治療計画の下での第1の患者コホートのADAS-Cogスコアを予測し、第2の合成モデルを使用して第2の治療計画の下での第2の患者コホートのADAS-Cogスコアを予測するように構成される。
【0059】
したがって、システムは、第2の態様を参照して記載した任意選択の特徴のいずれか1つ又は共存可能であればそれらの組合せを含む第2の態様の方法を実施するように構成することができる。
【0060】
第4の態様によれば、プロセッサ上で実行されるときに、第1の態様又は第2の態様を参照して記載した任意選択の特徴のいずれか1つ又は共存可能であればそれらの組合せを含む第1の態様又は第2の態様の方法をプロセッサに実施させる機械実行可能命令を含む非一時的なコンピュータ可読記憶媒体が提供される。
【0061】
第5の態様によれば、コンピュータ上で実行されるときに、コンピュータに第1の態様又は第2の態様の方法を実施させる実行可能コードを含むコンピュータプログラムが提供される。
【0062】
第6の態様によれば、コンピュータ上で実行されるときに、コンピュータに第1の態様又は第2の態様の方法を実施させるコードを含むコンピュータプログラムを記憶するコンピュータ可読記憶媒体が提供される。
【0063】
本発明は、そのような組合せが明らかに許されない又は明示的に回避されている場合を除き、記載された態様及び好ましい特徴の組合せを含む。
【0064】
図面の概要
以下、本発明の原理を例示する実施形態及び実験について、添付図面を参照して論じる。
【図面の簡単な説明】
【0065】
【
図1】臨床試験データの3階テンソルのスペクトルを、(i)モード2の展開の下での患者コホートレベルと、(ii)「高-使用」の下での個人患者レベルとでそれぞれ示す2つのグラフを含む図である。
【
図2】実際の試験データとデータ効率が高い試験データとをそれぞれ示す2つの表を含む図である。
【
図3】データ効率が高い試験に関連する誤差を示すグラフを示す図である。
【
図4】本開示の一態様による方法を使用して、様々な治療及び様々な数の観察された治療にわたる臨床試験の脱落者に関する欠落データを補完する平均絶対誤差及び標準誤差を、他のベースライン測定法と比較して示すプロットを含む図である。
【
図5】臨床試験の遵守者に関連する観察された密度と、本開示の一態様による方法を使用して予測された脱落者に関連する推定密度との比較を示すプロットを含む図である。
【
図6】アルツハイマー病評価スケール-認知サブスケール(ADAS-Cog)における患者又は患者コホートの認知スコアを予測するための方法の流れ図である。
【
図7】
図6の方法を実施するためのシステムの概略図である。
【発明を実施するための形態】
【0066】
発明の詳細な説明
以下、添付図面を参照して本発明の態様及び実施形態を論じる。さらなる態様及び実施形態は、当業者に明らかであろう。本文中で言及される全ての文書を参照により本明細書に援用する。
【0067】
本発明者らは、実際の臨床試験データに対して上記の方法の分析を実施し、ランダムではない(すなわち因果検証される)欠落データを含む低ランクテンソルを回復するように設計された合成介入(SI)推定量で臨床試験データを使用することができることを確かめた。
【0068】
臨床試験の概要
アルツハイマー病に関する第III相臨床試験(TRx-237-005及びTRx-237-015)からのデータを取得した。これらの臨床試験には1162人の患者が参加した。試験開始前に、各患者のベースライン測定値を収集した。これには、患者の性別、年齢、ベースラインADAS-Cog、及びミニメンタルステート検査(MMSE)スコアが含まれていた。
【0069】
以下、Xiは、患者iに関連するベースライン測定値のベクトルとして表される。
【0070】
2つの第III相試験にわたって、各患者を、(TauRx Therapeutics社によって開発された)LMTMの8、150、200、又は250mg/日の治療に無作為に割り付けたが、両方の試験で用量反応の欠如が観察された。さらなる母集団薬物動態解析から、8mg/日の範囲内の定常状態血漿レベルについて急激な濃度-反応関係が示された。その後、患者を、1日目のアッセイにおける量の下限値に基づく閾値を使用して、「低」血漿レベルと「高」血漿レベルの患者に分類した。この分析により、「高」血漿レベルのグループでは認知機能低下及び脳萎縮に大きな有意差が見られた(Schelter et. al., 2019)。さらに、各患者は、既に標準治療を使用しているかどうかに関係なく試験に参加した。したがって、D=4の可能な組合せが得られた。すなわち、「低-使用」、「低-不使用」、「高-使用」、「高-不使用」である。試験は5回の通院にわたり、各通院の間隔は13週間空けた。各通院tで、あらゆる患者iの進行性ADAS-Cogスコア
【数1】
を測定して記録した。完全を期すために、ベースラインからのADAS-Cogスコアの正の変化は病気が悪化していることを示すことに留意されたい。
【0071】
テンソルとしての臨床試験データのエンコード
臨床試験データは、患者コホートレベルと個人患者レベルとの両方で、3階テンソルとしてエンコードすることができる。
【0072】
これを実証するために、臨床試験データを、まず患者コホートレベルで3階テンソルにエンコードした。試験開始前に、患者をベースライン測定値X
iに基づいて6つのコホートにクラスタ化した。目標は、6つの患者コホートのそれぞれについて4つの治療組合せ全ての因果効果を推定することであった。クラスタの形成に、観察された試験通院転帰(すなわち、Y
ti)は使用しなかった。各患者コホートについて、あらゆる治療組合せ(「低-不使用」の治療を受けた患者がいなかった1つのクラスタを除く)の下で、ADAS-Cog軌跡を観察した。このデータを、3階テンソル
【数2】
にエンコードした。ここで、[Y
1]
ijdは、治療dの下での通院jでの患者コホートiに関する観察された平均ADAS-Cog軌跡を表す。
【0073】
次に、コホートレベルではなく、個人患者レベルでのデータを分析した。利用可能な個人患者ADAS-Cog軌跡データを、3階テンソル
【数3】
にエンコードした。ここで、[Y
2]
ijdは、治療dの下での通院jでの患者iを表す。各患者が単一の治療しか受けられないので、Y
1とは異なり、Y
2は一部しか観察されない。しかし、あらゆる治療dについて、治療群d内の患者(J
d)のみを考慮する場合、
【数4】
によって表される得られる行列が十分に観察される。ここで、N
d=|J
d|である。J
dは、5回の通院全てに参加した患者のみを含んでいた。
【0074】
図1のプロット10に示されるように、Y
1のスペクトルプロファイルを、そのモード1及びモード2の展開を調べることによって分析した。テンソル展開のさらなる詳細は、Agarwal, A et al., (2020)のセクション7で見ることができる。プロット10で示されるように、Y
1は、実質上、低い正準多進(CP)テンソルランク、すなわち1を有することが分かった。Y
2も分析した。
図1のプロット12は、「高-使用」治療の下でのY
2
dのスペクトルプロファイルを示す。Y
1と同様に、Y
2
dもほぼランク1であることが示された。
【0075】
Y1とY2
dとはどちらも低ランクテンソルであるので、誘導されたテンソル/行列には重要な潜在的な線形構造があることが分かった。特に、これは、正規患者又は患者コホートプロファイルの数が限られているため、全ての患者を、その患者らのADAS-Cogスコアに関するこれらのプロファイルの線形結合として表現することができることを意味する。アルツハイマー病患者の不均質な健康状態軌跡を考えると、これは驚くべきことである。したがって、これにより、既知の合成介入推定量を使用して特定の治療を受けた他の患者からの情報を活用することによって、その治療の下での任意の患者に関連するADAS-Cog軌跡を予測することができることが本発明により判明した。
【0076】
合成介入による軌道予測
一般性を失うことなく、上記の方法の狙いは、治療dの下での通院tでの患者(又はコホート)iに関するADAS-Cogスコアを予測することであり、これをYti
(d)と表す。
【0077】
2ステップ合成介入推定量を使用して、各治療の下での各患者の不均質なADAS-Cog軌跡を推定する。そのような2ステップSI推定量の一例は、Agarwal, A et al., (2020)に開示されている。
【0078】
第1のステップは、患者iとJ
d内の患者との共通の観察値に基づいて訓練される機械学習モデル
【数5】
によってパラメータ化されたターゲット患者iの「合成」モデルを構築する。第2のステップは、J
d内の患者の観察された転帰と学習された合成モデルとを活用して、時間tでの治療dの下での患者iのADAS-Cogスコアをシミュレートする。
【0079】
理解を助けるために使用される表記法を以下に記載する。
【0080】
Ωd⊂[T]×[D]は、患者iとJd内の患者とが共通に有する観察された(試験通院、治療)ペアのセット、すなわち、同じ通院日数及び同じ治療の患者iとJd内の患者とに関する(試験通院、治療)ペアの集合を表すものとし、Td=|Ωd|とする。
【0081】
【数6】
及び
【数7】
は、Y
iでのベースライン測定値
【数8】
の連結を表す。
【0082】
同様に、J
d内の患者に関して、
【数9】
【数10】
及び
【数11】
を定義する。
【0083】
特異値分解は、
【数12】
と表され、ここで
【数13】
は外積である。
【0084】
2ステップSI推定量は、保持すべき
【数14】
の特異成分の数を定量化する単一のハイパーパラメータkを有する。Agarwal, A et al., (2020)のセクション3が、kを選択することができる方法の例を提供している。
【0085】
上述したように、SI推定量の第1のステップは、機械学習モデル
【数15】
によってパラメータ化されたターゲット患者iの「合成」モデルを構築することであり、
【数16】
である。
【0086】
SI推定量の第2のステップは、J
d内の患者の観察された転帰と学習された合成モデルとを活用して、時間tでの治療dの下での患者iのADAS-Cogスコアをシミュレートすることである。
【数17】
【0087】
個別化治療のためのデータ効率が高い臨床試験
既述のように、上述した方法を使用して、患者コホートレベルでの個別化治療のためのデータ効率が高い臨床試験を設計することができる。
【0088】
これを実証するために、本発明者らは、このコホート内の患者が実質的に現在の標準治療を受けているので、「低-使用」薬物組合せを対照として定義した。データ効率が高い試験をシミュレートするために、上述したSI推定量により、6つの患者コホート全てについて制御下でADAS-Cogスコアを観察できるようにした。しかし、SI推定量により、他の3つの可能な治療(高-使用、低-不使用、高-不使用)の1つの下での各患者コホートを観察することしかできなかった。すなわち、本発明者らは、SI推定量がこれらの軌跡を再現することができるかどうかを確認するために、これら3つの治療の下でのデータを意図的にテストセットとして提示した。実際の試験データに関する観察パターンのグラフ表示を
図2の表14で見ることができ、シミュレートされたデータ効率が高い試験データに関する観察パターンのグラフ表示を
図2の表16で見ることができる。
図2では、セル内のチェックマークは観察された転帰を表し、空白セルは観察されていない(すなわち提示される)転帰を表す。
【0089】
図2の表16でのパターンのスパース性を考慮して、目的は、観察されていない2つの治療のそれぞれの下でのあらゆる患者コホートに関する平均ADAS-Cog軌跡を推定することであった。すなわち、観察されていない治療dに関して、狙いは、以下を推定することである。
【数18】
ここで、S
iは、コホートi内の個人を表す。
【0090】
任意のコホートi及び治療dに関するSI推定量の予測精度を定量化するために、ランダム化比較試験(RCT)推定量をベースラインとして使用した。RCT推定量は、治療dを受けた全ての患者にわたる平均ADAS-Cog転帰をその予測値として採用する。したがって、例えば高-使用の下での
図2におけるコホート3のADAS-Cog転帰を予測するために、RCT推定量は、コホート1及び2での全ての患者の平均ADAS-Cog転帰を採用する。試験内の患者が均質である場合、RCT推定量は強力な予測因子になる。より正式には、任意のコホートi及び治療dに関して、二乗誤差が以下のように定義される。
【数19】
ここで、
【数20】
は、SI推定量の出力である。上式での分子及び分母は、それぞれSI誤差及びRCT誤差を表す。
【数21】
は、修正されたR
2統計と解釈することができ、これは、コホートごとに予測を「個別化」することによって精度の向上を得ている。
【0091】
上記の設定では、SI推定量を適用して、未知の治療の下でのあらゆる患者コホートに関するADAS-Cog軌跡を予測した。ランダム性を軽減するために、この実験を、反復ごとに異なる治療割付けで10回繰り返した。結果を
図3のグラフ18で見ることができる。
【0092】
図3のグラフ18は、あらゆる治療の下での各コホートにわたる二乗誤差
【数22】
及び標準誤差(網掛け)を示す。
【0093】
ほぼ全てのコホートi及び治療dにわたって、中央値
【数23】
≒0.95であることが分かる。これは、SI推定量がRCT推定量よりもはるかに優れていることを示す。RCT推定量とSI推定量との相違がそれほど顕著ではない低-不使用の下でのコホート3でも、SI推定量は、依然としてRCT推定量よりも優れている。
【0094】
これは、実際にコホート間に大きな不均質性があることを裏付け、注目すべきことに、SI推定量は、この不均質性、及びデータの小さなサブセットのみへのアクセスにもかかわらず、転帰を正確に予測する。
【0095】
臨床試験での脱落者の欠落値の補完
脱落者(すなわち、臨床試験の全過程を経ない患者)は、試験における大きなバイアス源であり、試験が失敗する大きな理由となり得る(Little et. al., 2012)。本発明者らは、ADAS-Cogスコアを予測するための上記の方法を使用して、脱落者による欠落データ値を補完することができることを見出した。
【0096】
上述したSI推定量を検証するために、観察した患者データに関する脱落者をシミュレートした。シミュレーションを現実的なものにするために、患者が脱落者である確率を、患者のADAS-Cogスコアの変化に応じて決定した。これは、治療に応答しない傾向がある患者が脱落する可能性がより高いという現実に密接に合致している。
【0097】
シミュレーションは、以下のように設定した。
【0098】
T0<Tを、患者が誰も脱落していない時点での通院回数として選択した。通院T0後のベースラインからの患者のADAS-Cogスコアの平均変化に基づいて、患者を不良、中等度、及び良好応答者にクラスタ化した。不良応答者とは、ベースラインからの平均変化が全患者にわたる平均から上に1標準偏差よりも大きく離れた高い患者である。良好応答者とは、平均から下に1標準偏差の患者である。中等度応答者とは、残りの患者、すなわち1標準偏差以内の患者である。上述したように、ADAS-Cogスコアの増加は、病気が悪化していることを意味する。
【0099】
通院T0後の脱落の確率は、不良、中等度、良好応答者について、それぞれ60%、30%、10%を選択した。低-不使用の組合せの下では患者数が少なかったため、他の3つの組合せに焦点を当てた。
【0100】
狙いは、全ての患者(シミュレートされた遵守者及び脱落者)にわたって各治療に関するベースラインからの平均変化を推定することであった。
【数24】
ここで、B
iは、試験開始前の患者iに関する測定されたベースラインADAS-Cogスコアである。
【0101】
精度を、相対平均絶対誤差
【数25】
によって測定した。
【数26】
は、iが脱落者として選択された場合の上述したSI推定量の出力であり、iが遵守者である場合に観察される
【数27】
と等しい。
【0102】
推定量を、Little et. al., 2012で使用されたベースライン推定量と比較した。(i)完全ケース:遵守者からのデータのみを使用してμ(d)を推定する;(ii)RCT;(iii)LOCF(Last Observation Carried Forward):(縦断的研究で一般に使用する)入手可能な最後の転帰を使用して、脱落者に関する欠落データを補完する;(iv)多変量特異スペクトル解析(mSSA):スペクトルベースの時系列アルゴリズムを使用して、脱落者に関する欠落データを補完する(この推定量は、標準ベンチマークでの多くの最先端の時系列アルゴリズムよりも優れていることが実証されている)(Agarwal, et. al., 2021)。
【0103】
T
0を1から4まで変化させた。この手順を、各T
0について10回繰り返し、得られた平均絶対誤差及び標準誤差が
図4に示されるプロット20に示されている。標準誤差は、帯状の網掛けとしてプロット20に示されている。SI推定量は低い相対誤差を実現するだけでなく、既存のベースラインよりも一貫して優れていることが判明した。
【0104】
上述したSI推定法は、あらゆる脱落患者に関して、仮にその患者らが留まっていた場合の反事実的ADAS-Cog軌跡を構築することによって、上述したTauRxによって行われた実際の臨床試験において実際の脱落者により存在するバイアスを定量化するために使用することもできる。
【0105】
図5には、遵守者(実際に観察された)と脱落者(これは、SI推定量から作成された反事実的な分布である)に関するベースラインからの平均変化の分布が示されている。
【0106】
脱落者のデータは、現実の試験データでは実際には欠落しているので、推定密度を検証することはできないが、定性的結論は、脱落した患者から受け取られたフィードバックと一致していた。特に、プロット22aは、脱落者が低-使用の組合せに対する応答が悪かったために脱落者が試験から離脱した可能性が高いという自然な流れを示唆している。実際、これらの患者は、割り当てられた組合せによって体調が悪くなったと発言した患者であった。同様の状況がプロット22bに示されているが、遵守者と脱落者との差異はそれほど顕著ではない。比較すると、プロット22cは、脱落者と遵守者が、高-不使用の組合せに対して同様に応答したことを示唆する。実際、この特定の組合せに関する脱落者の多くは、新しい仕事のために不便な遠い場所に引っ越したなど、外的な事情により試験から離脱したと述べた。
【0107】
したがって、本発明者らは、上述した方法を使用して、脱落者による欠落データ値を正確に補完することができることを示した。
【0108】
ADAS-Cogスコアを予測するための方法
図6は、未知の治療計画の下でのターゲット患者のADAS-Cogスコアを予測するための方法の流れ図を示す。本方法は、1つ又は複数のコンピューティングデバイスで行うことができる。
【0109】
S101で、アルツハイマー病の治療に関する臨床試験からのデータが(例えば内部又は外部のストレージシステムから)取得される。データは、経時的な複数の患者のADAS-Cogスコアの縦断的軌跡と、各患者が受けた治療計画とに関する情報を含む(例えば、データは、ADAS-Cogスコア情報、時間情報、及び治療計画情報を含む)。
【0110】
S103で、このデータが、患者、時間、及び治療計画にわたる3階テンソルにエンコードされる。
【0111】
S105で、合成介入推定量の第1のステップで、合成モデルが生成される。合成モデルはターゲット患者のものであり、機械学習プロセスを使用して生成される。S106に示されるように、任意選択で、合成モデルは、ターゲット患者が受けた実際の治療計画に対応するテンソルでの観察データのセットと、ターゲット患者に関係するデータとに基づいて訓練される。例えば、機械学習プロセスは、ターゲット患者に関係するデータと、ターゲット患者が受けた実際の治療計画に関連するテンソルでの観察データのセットとの最小ノルム線形関係を決定することを含むことがある。特に、PCRプロセスは、ターゲット患者に関係するデータと、実際の治療計画に関連するテンソル内の観察データのセットとの間の一意の最小ノルム線形関係を定義することができる。
【0112】
S107は、任意選択のステップである。S107で、合成モデルが、その精度をチェックするために検証される。学習された合成モデルの訓練誤差が、ターゲット患者に関するデータと、合成モデルとに基づいて計算され、ターゲット患者に関係する観察データを合成モデルが正確に予測することができるかどうかをテストする。計算された誤差が事前定義された閾値未満である場合、方法はS109に進む。そうでない場合には、方法が終了する。
【0113】
S109で、合成モデルと、S110に示されるようにターゲット治療計画に対応するテンソルでのデータのセットとを使用して、未知の治療計画の下でのターゲット患者のADAS-Cog軌跡が予測される。
【0114】
このようにして、ターゲット患者がまだ終了していない特定の治療計画の下でのターゲット患者のADAS-Cog軌跡を予測することができる。この予測は、ターゲット患者が臨床試験から脱落した場合などに、臨床試験結果におけるターゲット患者による治療計画の転帰として使用することができる。また、この予測を使用して、よりデータ効率が高い臨床試験を提供することもできる(例えば、結果の一部を予測することによって、臨床試験に必要な被験者数が少なくて済む)。また、この予測を使用して、例えばどの治療計画がより効率的であり得るかを予測することによって、よりデータ効率が高い臨床試験を設計する、又は個別化された療法を指示することもできる。
【0115】
予測に基づいて、有望な転帰をもたらす部分母集団-治療のペアをさらに調査することができ、望ましくない転帰をもたらすペアを破棄することができる。このようにして、上記の方法は、優先すべき実験を戦略的に決定するためのレコメンドエンジンとして、また精密医療の発展に向けたツールとして使用することができる。
【0116】
1つ又は複数の予測を使用して臨床試験の転帰を予見することができるので、上述した方法は、予測された結果に基づいて、早期打切りの用途で、例えば臨床試験を継続するか中止するかを決定するために使用することもできる。
【0117】
上記の方法のさらなる用途を以下に述べる。
【0118】
第1の用途は、まれな疾患及び/又は希少疾患の分野で一般的であり得る、対照のない単群試験に関するものである。これらの疾患分野は、患者母集団が小さく、標準治療が確立されていないことがある。これらの臨床試験は、統計サンプル数が不十分であることがあり、また患者へのプラセボの投与に関する倫理的な懸念が生じることがある。これらの問題に対処するために、外部対照データが使用されることがある。この外部対照データは、上述した方法において、複数の患者又は患者コホートに関するデータとして使用することができる。このようにして、合成モデルを使用して、外部対照患者からのデータの加重組合せを使用して、制御下のあらゆる試験中の患者の合成ツインを構築することができる。その後、合成ツインのコホートが合成対照群を形成し得る。
【0119】
さらなる用途は、承認された治療の現実での安全性及び有効性を実証することに焦点を当てる。特に、安全性の証拠を提供するために、患者に有害であり得る潜在的な危険を特定するために、新たに承認された治療の包括的な監視が実施され得る。これは有害事象報告と呼ばれることがあり、新たに承認された治療によって有害事象が引き起こされるかどうかを判断するために使用され得る。一般に、評価は、治療計画の下での患者集団と自然対照群との間で有害事象の発生率が比較される観察試験を含む。上述した方法を使用して、人工的な対照群を構築することができる。特に、治療の下でのあらゆる患者について、外部(例えば現実世界)対照データから、制御下での合成ツインを構築することができる。観察された治療群での有害事象の発生率が合成対照群と比較して統計的に高い場合、その治療が有害事象に寄与すると判断され得る。有効性を実証するために、新たに発表された治療が、確立されている標準治療計画に対して競合性があるという証拠が提供され得る。上述した方法を使用して、標準治療計画の下での合成コホートを構築することができる。特に、新たな治療計画の下でのあらゆる患者について、上述した方法は、標準治療計画の下で合成ツインを生成することができる。標準治療と比較した新たな治療の比較有効性を評価するために、2つの治療群の療法転帰を比較することができる。
【0120】
上述した方法は、適応拡大にも使用することができる。例えば、適応外患者(例えば、ランダム化比較試験で低代表の、又は代表されていない個人)の文脈で、上述した方法を使用して、あらゆる適応外患者について、適応患者からのデータの加重組合せとして、(新たに発表された)治療計画の下での合成ツインを構築することができる。これは、(新たに発表された)治療計画の下での適応外患者の合成試験を効果的にシミュレートすることができる。これは、適応外の部分母集団への治療の拡大を支持する又はそれに反対する証拠を研究者に与え得る。
【0121】
以下、所与のターゲット「ユニット」iが仮に介入dを受けた場合のそのユニットiに関する合成データを構築するための
図6の方法について、例示的な一般化されたアルゴリズムの概要を提供し、ここで、ユニットiに関連するデータが欠落していると仮定する。ここで、「ユニット」は患者又は患者コホートを表すことがあり、「介入」は治療計画を表すことがある。
【0122】
1.データ準備
a)各ユニットごとに、そのユニットが受ける全ての介入に関連するデータが存在するデータベースを準備する。
b)ターゲットユニットiに関連する全ての観察についてデータベースを照会する。
c)介入dを受けた「ドナー」ユニットに関連する全ての観察についてデータベースを照会する。
d)データをフィルタリングして、(i)満足の行く観察値の数と(ii)フィルタリングされたドナーユニットの数との最小値を最大にする、ターゲットユニットiと関連のドナーユニットとの共通の介入に関連する観察値のコレクションを特定する。
e)ターゲットユニットとフィルタリングされたドナーユニットとに関連する共通の介入(ステップ(d)から)に関係するデータのみからなる新たなテーブルを作成する。これらの2つのデータ構造をそれぞれy1及びX1と表す。
f)介入dの下でのフィルタリングされたドナーユニットに関連する介入に関係するデータのみからなる新たなテーブルを作成する。このデータ構造をX2と表す。
【0123】
2.診断テストによるデータ検証
a)列ごとにX1、X2を連結する新たなテーブル、すなわちX=[X1,X2]を作成する。
b)Xの特異値分解を実施し、そのスペクトルプロファイルを調べる。Xが低次元構造を示しているかどうかを確認する。Xが低次元構造を示さない場合、Xを前処理する必要があり得る(例えば、Xにオートエンコーダを適用して、Xの新たな低次元表現を識別する)。
c)X1、X2に対してサブスペース包含仮説検定を実施する(例えば、Agarwal et. al., 2020のセクション5に詳述されている)。仮説検定に合格した場合、介入dの下でのユニットiに関する合成データを正確に作成することができるという強力な診断的証拠が得られる。
【0124】
図1に関連して上述したように、アルツハイマー病の治療に関する臨床試験からのデータは一般に低いテンソルランクを有し、したがって介入dの下でのユニットiに関する合成データを正確に作成することができるという強力な診断的証拠があることに留意されたい。
【0125】
3.合成データの生成
a)事前定義された訓練誤差許容値εを選択する。
b)上述した合成データ生成手順に従う(Agarwal et. al., 2020のセクション3でさらに詳述されている)。
(i)モデル学習:y
1とX
1との間で主成分回帰(PCR)を実行して
【数28】
を生成する。これは、ターゲットユニットiとフィルタリングされたドナーユニットとの一意の最小ノルム線形関係を定義する。代替として、異なる機械学習(ML)アルゴリズム(パラメトリック又はノンパラメトリック)を使用して、y
1とX
1の関係を学習することもできる(例えばニューラルネットワーク又はランダムフォレストを使用する)。y
1とX
1との間の学習モデルを
【数29】
と表す。
(ii)中間合成データモデルの検証:観察値y
1と推定値
【数30】
との訓練誤差を計算する。誤差がε未満の場合、ターゲットユニットとドナーユニットとの間での学習されたモデルが予測に関して満足の行くものであるので、次のステップに進む。
(iii)合成データ生成:介入dの下でのターゲットユニットiに関連する合成データを
【数31】
として作成する。ここから、推定値
【数32】
(又はより一般には
【数33】
)に加えて、平均(例えば介入dの下でのターゲットiの平均的な反事実的転帰を表す)を計算することによって、さらなる手順を適用することができる。
【0126】
4.合成データの精度の診断
a)追加される評価層として、「交差検証」試験を行って、上記のステップが観察データセットの作成に成功したかどうかを調査することができる。各ドナーユニットはターゲットユニットとなるように繰り返し割り当てられることがあり、残りのドナーユニットは、その特定の介入に関するドナーグループを形成する。すなわち、介入dの下での一時的なターゲットユニットの観察値を観察することができる(すなわち、再現すべき「合成」データにアクセスできる)。次いで、
【数34】
(又はより一般には
【数35】
)(ここで、X
2は一時的なドナーグループにわたって定義される)と、介入dの下で一時的なターゲットユニットに関連する観察値との間の予測誤差を測定する追加の検証により、上述したのと同じ手順を行うことができる。
【0127】
図7は、
図6の方法を実施するためのシステム200の概略図である。システム200は、例えば1つ又は複数のコンピューティングデバイスを備えることがある。
【0128】
システム200は、複数の患者又は患者コホートに関するデータを取得するように構成されたデータ獲得手段202を備え、このデータは、経時的な複数の患者又は患者コホートのADAS-Cogスコアの縦断的軌跡に関する情報を含み、各患者又は患者コホートは、複数の治療計画から選択された治療計画を受けている。データは、有線又は無線接続を介して外部記憶媒体210から取得されることがある。
【0129】
システム200は、データ獲得手段202によって獲得されたデータを、患者又は患者コホート、時間、及び治療計画にわたるテンソルにエンコードするように構成されたテンソル生成手段204も備える。
【0130】
合成モデル生成手段206は、機械学習プロセスと、テンソル生成手段204によって生成されたテンソルとを使用して、患者又は患者コホートの合成モデルを生成するように構成される。予測手段208は、合成モデル生成手段208によって生成された合成モデルを使用して、複数の治療計画のうちのターゲット治療計画の下での患者又は患者コホートのADAS-Cogスコアを予測するように構成される。この予測されたADAS-Cogスコアは、例えば有線又は無線接続によってシステムから出力され得る。
【0131】
上記の実施形態のシステム及び方法は、記載した構造コンポーネント及びユーザ対話に加えて、コンピュータシステム(特にコンピュータハードウェア又はコンピュータソフトウェア)に実装することができる。
【0132】
「コンピュータシステム」という用語は、上述した実施形態に従ってシステムを具現化する又は方法を実施するためのハードウェア、ソフトウェア、及びデータ記憶デバイスを含む。例えば、コンピュータシステムは、中央処理装置(CPU)、入力手段、出力手段、及びデータストレージを備えることがある。好ましくは、コンピュータシステムは、視覚的な出力表示を提供するためのモニタを有する。データストレージは、RAM、ディスクドライブ、又は他のコンピュータ可読媒体を備えることがある。コンピュータシステムは、ネットワークによって接続され、そのネットワークを介して相互に通信可能な複数のコンピューティングデバイスを含むことがある。
【0133】
上記の実施形態の方法は、コンピュータプログラムとして、又はコンピュータ上で実行されるときに上述した方法を実施するように構成されたコンピュータプログラムを担うコンピュータプログラム製品若しくはコンピュータ可読媒体として提供され得る。
【0134】
「コンピュータ可読媒体」という用語は、限定はしないが、コンピュータ又はコンピュータシステムによって直接読み取ってアクセスすることができる任意の非一時的な媒体を含む。媒体は、限定はしないが、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープなどの磁気記憶媒体、光ディスクやCD-ROMなどの光記憶媒体、RAM、ROM、及びフラッシュメモリを含むメモリなどの電気記憶媒体、並びに上記の磁気/光記憶媒体などのハイブリッド及び組合せを含む。
【0135】
特定の形態で表された、又は開示された機能を行うための手段若しくは適切であれば開示された結果を得るための方法若しくはプロセスに関して表された以上の説明、又は添付の特許請求の範囲、又は添付図面に開示される特徴は、個別に又はそのような特徴の任意の組合せで、本発明を様々な形態で実現するために利用することができる。
【0136】
上述した例示的実施形態に関連して本発明を述べてきたが、本開示を読めば、当業者には多くの等価な修正形態及び変形形態が明らかであろう。したがって、上に記載した本発明の例示的実施形態は例示的なものであり、限定的なものではないと考えられる。本発明の精神及び範囲から逸脱することなく、記載した実施形態に対して様々な変更を加えることができる。
【0137】
疑義を避けるために付言すると、本明細書で提供される理論的な説明は、読者の理解を深める目的で提供されている。本発明者らは、これらの理論的な説明のいずれにも拘束されることを望まない。
【0138】
本明細書で使用されているセクションの見出しは、構成上の目的のものにすぎず、記載されている主題を限定するものと解釈すべきではない。
【0139】
添付の特許請求の範囲を含め、本明細書全体を通じて、文脈上別段の要求がない限り、「備える」及び「含む」という語、及び「備えて」、「備え」、及び「含み」などの語形変化は、指定された整数、ステップ、又は整数若しくはステップの群の包含を示唆し、任意の他の整数、ステップ、又は整数若しくはステップの群の除外を示唆するものではないことを理解されたい。
【0140】
本明細書及び添付の特許請求の範囲で使用するとき、文脈上明らかに別段の指示がない限り、単数形「a」、「an」、及び「the」は複数の指示対象を含むことに留意されたい。本明細書において、範囲は、「約」ある特定の値から、及び/又は「約」別の特定の値までとして表現されることがある。そのような範囲が表現されるとき、別の実施形態は、上記ある特定の値から、及び/又は上記別の特定の値までを含む。同様に、先行詞「約」の使用によって値が近似値として表現されるとき、特定の値が別の実施形態を成すことを理解されたい。数値に関する用語「約」は任意選択であり、例えば±10%を意味する。
【0141】
参考文献
本発明及び本発明が関連する先行技術をより完全に説明して開示するために、上では多数の刊行物が引用されている。これらの参考文献に関する全引用を以下に記載する。
Agarwal, A., Shah, D., Shen, D.: Synthetic interventions (2020), arXiv:2006.07691 [econ.EM]
Bhatt, A.: Artificial intelligence in managing clinical trial design and conduct: Man and machine still on the learning curve? Perspectives in Clinical Research 12(1), 1 (2021)
Little, R.J., D’Agostino, R., Cohen, M.L., Dickersin, K., Emerson, S.S., Farrar, J.T., Frangakis, C., Hogan, J.W., Molenberghs, G., Murphy, S.A., Neaton, J.D., Rotnitzky, A., Scharfstein, D., Shih, W.J., Siegel, J.P., Stern, H.: The prevention and treatment of missing data in clinical trials. New England Journal of Medicine 367(14), 1355-1360 (2012). https://doi.org/10.1056/NEJMsr1203730, pMID: 23034025
Schelter BO, Shiells H, Baddeley TC, Rubino CM, Ganesan H, Hammel J, Vuksanovic V, Staff RT, Murray AD, Bracoud L, Riedel G, Gauthier S, Jia J, Bentham P, Kook K, Storey JMD, Harrington CR, Wischik CM. Concentration-Dependent Activity of Hydromethylthionine on Cognitive Decline and Brain Atrophy in Mild to Moderate Alzheimer’s Disease. J Alzheimers Dis. 2019;72(3):931-946. doi: 10.3233/JAD-190772. PMID: 31658058; PMCID: PMC6918900. (2019)
Shah, P., Kendall, F., Khozin, S., Goosen, R., Hu, J., Laramie, J., Ringel, M., Schork, N.: Artificial intelligence and machine learning in clinical development: a translational perspective. NPJ digital medicine 2(1), 1-5 (2019)
【国際調査報告】