(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-11-25
(54)【発明の名称】疾患状態の予測方法
(51)【国際特許分類】
G16H 50/20 20180101AFI20221117BHJP
【FI】
G16H50/20
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022518984
(86)(22)【出願日】2020-09-29
(85)【翻訳文提出日】2022-03-24
(86)【国際出願番号】 EP2020077207
(87)【国際公開番号】W WO2021063935
(87)【国際公開日】2021-04-08
(32)【優先日】2019-09-30
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】591003013
【氏名又は名称】エフ.ホフマン-ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN-LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100102978
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】ゴッセンス クリスティアン
(72)【発明者】
【氏名】リプスマイヤー フロリアン
(72)【発明者】
【氏名】シミリオン セドリック アンドレ マリー ビンセント ジェフリー
(72)【発明者】
【氏名】リンデマン マイケル
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システム(110)が提案される。機械学習システム(110)は、
- 入力データを受信するように構成された少なくとも1つの通信インターフェース(114)であって、入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、履歴的デジタルバイオマーカー特徴データのセットが、予測される疾患状態を示す複数の測定値を含む、少なくとも1つの通信インターフェース(114)と、
- 少なくとも1つのアルゴリズムを含む少なくとも1つの機械学習モデルを含む、少なくとも1つのモデルユニット(116)と、
- 少なくとも1つの処理ユニット(112)であって、処理ユニット(112)が、入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するように構成されており、処理ユニット(112)が、訓練データセットを用いて機械学習モデルを訓練することによって分析モデルを決定するように構成されており、処理ユニット(112)が、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されており、処理ユニット(112)が、予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルの性能を決定するように構成されている、少なくとも1つの処理ユニット(112)と、
を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システム(110)であって、
- 入力データを受信するように構成された少なくとも1つの通信インターフェース(114)であって、前記入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、前記履歴的デジタルバイオマーカー特徴データのセットが、予測される前記疾患状態を示す複数の測定値を含み、前記履歴的デジタルバイオマーカー特徴データが、前記疾患の症状に関する被験者ごとの複数の異なる測定値を含む、少なくとも1つのモバイル装置によって決定された実験データであり、前記入力データが、少なくとも1つの認知検査および/または少なくとも1つの手運動機能検査および/または少なくとも1つの運動性検査などの、前記モバイル装置を使用する能動的検査で決定される、少なくとも1つの通信インターフェース(114)と、
- 少なくとも1つのアルゴリズムを含む少なくとも1つの機械学習モデルを含む、少なくとも1つのモデルユニット(116)と、
- 少なくとも1つの処理ユニット(112)であって、前記処理ユニット(112)が、入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するように構成されており、前記処理ユニット(112)が、前記機械学習モデルを前記訓練データセットを用いて訓練することによって、前記分析モデルを決定するように構成されており、前記訓練が、前記訓練データセット上の機械学習モデルの前記アルゴリズムのパラメータを決定するプロセスであり、前記訓練が、異なる被験者の前記訓練データセットに対して反復的に実行され、前記分析モデルが回帰モデルであり、前記機械学習モデルの前記アルゴリズムが、k最近傍(kNN);線形回帰;部分的最終二乗(PLS);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであり、または、前記分析モデルが分類モデルであり、前記機械学習モデルの前記アルゴリズムが、k最近傍(kNN);サポートベクターマシン(SVM);線形判別分析(LDA);二次判別分析(QDA);ナイーブベイズ(NB);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであり、前記処理ユニット(112)が、前記決定された分析モデルを使用して前記試験データセット上の前記目標変数を予測するように構成されており、前記処理ユニット(112)が、前記予測された目標変数と前記試験データセットの前記目標変数の真値とに基づいて前記決定された分析モデルの性能を決定するように構成されている、少なくとも1つの処理ユニット(112)と、を備え、
前記機械学習システム(110)が、少なくとも1つの出力インターフェース(118)を備え、前記出力インターフェース(118)が、少なくとも1つの出力を提供するように構成されており、前記出力が、前記決定された分析モデルの前記性能に関する少なくとも1つの情報を含み、前記決定された分析モデルの前記性能に関する前記情報が、少なくとも1つのスコアチャート、少なくとも1つの予測プロット、少なくとも1つの相関プロット、および少なくとも1つの残差プロットのうちの1つ以上を含み、
前記モデルユニット(116)が、複数の機械学習モデルを含み、前記機械学習モデルが、それらのアルゴリズムによって区別され、前記処理ユニット(112)が、それぞれの前記機械学習モデルを前記訓練データセットを用いて訓練することによって、前記機械学習モデルのそれぞれの分析モデルを決定し、且つ前記決定された分析モデルを使用して前記試験データセット上の前記目標変数を予測するように構成されており、前記処理ユニット(112)が、前記予測された目標変数と前記試験データセットの前記目標変数の真値とに基づいて前記決定された分析モデルのそれぞれの性能を決定するように構成されており、前記処理ユニット(112)が、最良の性能を有する前記分析モデルを決定するように構成されている、機械学習システム(110)。
【請求項2】
その状態について予測される前記疾患が多発性硬化症であり、前記目標変数が総合障害度評価尺度(EDSS)値であるか、または、その状態について予測される前記疾患が脊髄性筋萎縮症であり、前記目標変数が強制肺活量(FVC)値であるか、または、その状態について予測される前記疾患がハンチントン病であり、前記目標変数が総運動スコア(TMS)値である、請求項1に記載の機械学習システム(110)。
【請求項3】
前記処理ユニット(112)が、被験者ごとに前記入力データの訓練データセットおよび試験データセットを生成および/または作成するように構成され、前記試験データセットが一被験者のデータを含み、前記訓練データセットが他の入力データを含む、請求項1または2に記載の機械学習システム(110)。
【請求項4】
前記処理ユニット(112)が、前記入力データから特徴を抽出するように構成されており、前記処理ユニット(112)が、最大関連性-最小冗長性技術を使用して前記特徴をランク付けするように構成されている、請求項1から3のいずれか一項に記載の機械学習システム(110)。
【請求項5】
前記処理ユニット(112)が、前記訓練データセットを用いて前記機械学習モデルを訓練することによって、前記分析モデルを決定するために、異なる数の特徴を考慮するように構成されている、請求項4に記載の機械学習システム(110)。
【請求項6】
前記処理ユニット(112)が、前記入力データを前処理するように構成されており、前記前処理が、少なくとも1つの品質基準を満たす入力データのための少なくとも1つのフィルタリングプロセスを含む、請求項1から5のいずれか一項に記載の機械学習システム(110)。
【請求項7】
前記処理ユニット(112)が、訓練データセットおよび試験データセットの、少なくとも1つの安定化変換;少なくとも1つの集約;少なくとも1つの正規化のうちの1つ以上を実行するように構成されている、請求項1から6のいずれか一項に記載の機械学習システム(110)。
【請求項8】
疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータ実装方法であって、前記方法において、請求項1から7のいずれか一項に記載の機械学習システム(110)が使用され、前記方法が、
a)少なくとも1つの通信インターフェース(114)を介して入力データを受信するステップであって、前記入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、前記履歴的デジタルバイオマーカー特徴データのセットが、予測される前記疾患状態を示す複数の測定値を含む、受信するステップと、
少なくとも1つの処理ユニット(112)において、
b)前記入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するステップと、
c)前記訓練データセットを用いて少なくとも1つのアルゴリズムを含む機械学習モデルを訓練することによって、前記分析モデルを決定するステップと、
d)前記決定された分析モデルを使用して前記試験データセット上の目標変数を予測するステップと、
e)前記予測された目標変数と前記試験データセットの前記目標変数の真値とに基づいて、前記決定された分析モデルの性能を決定するステップと、を含む、方法。
【請求項9】
ステップc)において、前記訓練データセットを用いて複数の機械学習モデルを訓練することによって、複数の分析モデルが決定され、前記機械学習モデルが、それらのアルゴリズムによって区別され、ステップd)において、複数の目標変数が、前記決定された分析モデルを使用して前記試験データセット上で予測され、ステップe)において、前記決定された分析モデルのそれぞれの前記性能が、前記予測された目標変数と前記試験データセットの前記目標変数の前記真値とに基づいて決定され、前記方法が、最良の性能を有する前記分析モデルを決定することをさらに含む、請求項8に記載の方法。
【請求項10】
疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータプログラムであって、コンピュータまたはコンピュータネットワーク上で実行されると、前記コンピュータまたは前記コンピュータネットワークに、請求項8または9に記載の疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための方法を完全にまたは部分的に実行させるように構成されており、
前記コンピュータプログラムが、請求項8または9に記載の疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための方法の少なくともステップb)からe)を実行するように構成されている、コンピュータプログラム。
【請求項11】
多発性硬化症を示す総合障害度評価尺度(EDSS)値、脊髄性筋萎縮症を示す強制肺活量(FVC)値、またはハンチントン病を示す総運動スコア(TMS)値のうちの1つ以上を予測するための分析モデルを決定するための機械学習システムに関する、請求項1から7のいずれか一項に記載の機械学習システム(110)の使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、疾患のデジタル評価の分野に関する。特に、本発明は、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システム、および疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータ実装方法に関する。さらに、本発明は、コンピュータプログラムおよびコンピュータ可読記憶媒体に関する。装置および方法は、多発性硬化症を示す総合障害度評価尺度(EDSS)、脊髄性筋萎縮症を示す強制肺活量、またはハンチントン病を示す総運動スコア(TMS)を予測するための分析モデルを決定するために使用されることができる。
【背景技術】
【0002】
疾患、特に神経疾患は、疾患管理のための集中的な診断手段を必要とする。疾患の発症後、これらの疾患は、典型的には進行性疾患であり、正確な状態を決定するために病期分類システムによって評価される必要がある。これらの進行性神経疾患の中でも顕著な例には、多発性硬化症(MS)、ハンチントン病(HD)および脊髄性筋萎縮症(SMA)がある。
【0003】
現在、そのような疾患の病期分類は多大な労力を必要とし、病院または医院の医療専門家に行く必要がある患者にとって厄介である。さらに、病期分類は、医療専門家の終わりに経験を必要とし、しばしば主観的であり、個人的な経験および判断に基づく。それにもかかわらず、疾患管理に特に有用な疾患病期分類からのいくつかのパラメータがある。さらに、特殊な機器、すなわち肺活量測定装置によって強制肺活量を決定する必要があるなど、臨床的に関連するパラメータであったSMAなどの他の場合が存在する。これらの場合の全てについて、代用物を決定することが有用であり得る。適切な代用物は、バイオマーカー、特に、病期分類システムに相関させることができる、または臨床パラメータの代用マーカーとすることができる生物学的機能の性能パラメータを決定する際の試験からの性能パラメータなどのデジタル取得バイオマーカーを含む。
【0004】
スコアまたは他の臨床パラメータなどの関心対象の実際の臨床パラメータ間の相関は、様々な分析方法によってデータから導出されることができる。これらの方法に基づいて、モデルに供給される代用物マーカーに基づいて実際の臨床パラメータ値を予測することを可能にするモデルが確立されることができる。しかしながら、最良の相関を示し、したがって臨床パラメータの最良の予測をもたらすモデルを特定して適用することが決定的である。
【0005】
国際公開第2018/132483号パンフレット(特許文献1)は、認知プラットフォームのコンピュータ化されたタスクを有する個人の応答から収集されたデータを使用して、認知能力の指標として性能メトリックを導出し、予測モデルを性能メトリックおよび個人の年齢および性別の一方または双方を示すデータに適用して、神経変性状態の指標を生成するための例示的なシステム、方法、および装置を記載している。
【0006】
中国特許出願公開第109 717 833号明細書(特許文献2)は、人体の運動姿勢に基づく神経疾患補助診断システムを記載しており、インテリジェント医療処置の分野に属する。神経疾患補助診断システムは、検査される被験者の運動姿勢を定量化し、人体の運動姿勢データから23次元歩行関連特徴を抽出し、関連特徴を分類予測モデルに入力して検査される被験者を診断し、検査される被験者の診断結果に対する視覚運動機能検査レポートを生成し、補助診断提案を提供する。
【0007】
米国特許出願公開第2017/308981号明細書(特許文献3)は、特定の患者の症状を発症するリスクを特定するコンピュータ実装方法を記載している。第1に、1つ以上の患者データベースを利用することによって初期変数セットが開発される。第2に、機械学習を使用して、選択された症状を予測するモデルが作成される。開発されたモデルでは、初期変数セットの患者健康情報データベースから患者特徴ベクトルが作成される。モデルがこれらの患者特徴ベクトルに適用されて、症状の発症を予測する。症状を有すると予測される患者は、適切な介入プログラムに登録されることができる。
【0008】
米国特許出願公開第2016/192889号明細書(特許文献4)は、以下のステップおよび特徴を少なくとも有する、精神病リスクモデリングのための適応パターン認識のための方法およびシステムを記載している:脳画像およびデータマイニングに基づいて第1のリスク定量化または分類システムを自動的に生成する;ゲノムおよび/またはメタボローム情報およびデータマイニングに基づいて第2のリスク定量化または分類システムを自動的に生成し、データマイニング計算によって第1および第2のリスク定量化または分類システムをさらに処理して、単一被験者レベルで精神病リスクを自動的に定量化するためのメタレベルリスク定量化データを作成する。
【0009】
大量のデータおよび複雑なデータを分析することができ、高速で信頼性が高く正確な結果をもたらすモデルを自動的に構築する必要がある。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】国際公開第2018/132483号パンフレット
【特許文献2】中国特許出願公開第109 717 833号明細書
【特許文献3】米国特許出願公開第2017/308981号明細書
【特許文献4】米国特許出願公開第2016/192889号明細書
【発明の概要】
【発明が解決しようとする課題】
【0011】
解決すべき課題
したがって、上述した技術的課題に対処する方法および装置を提供することが望ましい。具体的には、信頼できる疾患特異的分析モデルの迅速且つ自動的な構築を確実にする、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための装置および方法が提供されるべきである。
【課題を解決するための手段】
【0012】
概要
この問題は、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システム、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータ実装方法、コンピュータプログラム、および独立請求項の特徴による使用によって対処される。単独で、または任意の組み合わせで実現されることができる有利な実施形態は、従属請求項に記載されている。
【0013】
以下において使用される場合、用語「有する」、「備える」もしくは「含む」またはこれらの任意の文法的変化形は、包括的に用いられる。したがって、これらの用語は、これらの用語によって導入される特徴に加えて、この文脈で説明されているエンティティにさらなる特徴が存在しない状況と、1つ以上の追加の特徴が存在する状況との双方を指す場合がある。例として、「AはBを有する」、「AはBを備える」および「AはBを含む」という表現は、双方とも、B以外に、他の要素がAに存在しない状況(すなわち、Aが単独で且つ排他的にBからなる状況)、および、B以外に、要素C、要素CおよびD、さらにはさらなる要素など、1つ以上のさらなる要素がエンティティAに存在する状況を指す場合がある。
【0014】
さらに、特徴または要素が1回または複数回存在することができることを示す「少なくとも1つ」、「1つ以上」という用語または同様の表現は、通常、それぞれの特徴または要素を導入するときに一度だけ使用されることに留意されたい。以下では、ほとんどの場合、それぞれの特徴または要素を指すとき、それぞれの特徴または要素が1回または複数回存在することができるという事実にもかかわらず、「少なくとも1つ」または「1つ以上」という表現は繰り返されない。
【0015】
さらに、以下において使用される場合、用語「好ましくは」、「より好ましくは」、「特に」、「より特に」、「具体的に」、「より具体的に」または同様の用語は、代替の可能性を制限することなく、任意の特徴と併せて使用される。したがって、これらの用語によって導入される特徴は、任意の特徴であり、決して特許請求の範囲を制限することを意図したものではない。本発明は、当業者が認識するように、代替の特徴を使用することによって実施されてもよい。同様に、「本発明の実施形態において」または同様の表現によって導入される特徴は、本発明の代替の実施形態に関する制限がなく、本発明の範囲に関する制限がなく、およびそのような方法で導入された特徴を、本発明の他の任意または非任意の特徴と組み合わせる可能性に関する制限がない任意の特徴であることを意図する。
【0016】
本発明の第1の態様では、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システムが提案される。
【0017】
機械学習システムは、
- 入力データを受信するように構成された少なくとも1つの通信インターフェースであって、入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、履歴的デジタルバイオマーカー特徴データのセットが、予測される疾患状態を示す複数の測定値を含む、少なくとも1つの通信インターフェースと、
- 少なくとも1つのアルゴリズムを含む少なくとも1つの機械学習モデルを含む、少なくとも1つのモデルユニットと、
- 少なくとも1つの処理ユニットであって、処理ユニットが、入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するように構成されており、処理ユニットが、訓練データセットを用いて機械学習モデルを訓練することによって分析モデルを決定するように構成されており、処理ユニットが、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されており、処理ユニットが、予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルの性能を決定するように構成されている、少なくとも1つの処理ユニットと、を備える。
【0018】
本明細書で使用される「機械学習」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、分析モデルの自動的なモデル構築のために人工知能(AI)を使用する方法を指すことができる。本明細書で使用される「機械学習システム」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、特に所与のアルゴリズムにおいて論理を実行するための、機械学習のために構成されたプロセッサ、マイクロプロセッサ、またはコンピュータシステムなどの少なくとも1つの処理ユニットを備えるシステムを指すことができる。機械学習システムは、少なくとも1つの機械学習アルゴリズムを実施および/または実行するように構成されることができ、機械学習アルゴリズムは、訓練データに基づいて少なくとも1つの分析モデルを構築するように構成されている。
【0019】
本明細書で使用される「分析モデル」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、少なくとも1つの状態変数について少なくとも1つの目標変数を予測するように構成された数学的モデルを指すことができる。分析モデルは、回帰モデルであってもよいし、分類モデルであってもよい。本明細書で使用される「回帰モデル」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、ある範囲内の数値を出力として有する少なくとも1つの教師あり学習アルゴリズムを含む分析モデルを指すことができる。本明細書で使用される「分類モデル」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、「病気」または「健康」などの分類器を出力として有する少なくとも1つの教師あり学習アルゴリズムを含む分析モデルを指すことができる。
【0020】
本明細書で使用される「目標変数」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、予測される臨床値を指すことができる。予測される目標変数値は、その存在または状態について予測される疾患に依存することができる。目標変数は、数値であってもカテゴリであってもよい。例えば、目標変数は、カテゴリとすることができ、疾患が存在する場合は「陽性」とすることができ、疾患が存在しない場合は「陰性」とすることができる。
【0021】
目標変数は、少なくとも1つの値および/またはスケール値などの数値であってもよい。
【0022】
例えば、その状態について予測される疾患は、多発性硬化症である。本明細書で使用される「多発性硬化症(MS)」という用語は、典型的には、それに罹患している被験者に長期および重度の障害を引き起こす中枢神経系(CNS)の疾患に関する。本発明にしたがって使用される用語にも包含される以下のMSの4つの標準化されたサブタイプ定義が存在する:再発寛解、二次進行性、原発性進行性および進行性再発。MSの再発型という用語も使用され、再発寛解型および再発の重畳を伴う二次性進行性MSを包含する。再発寛解型は、予測不可能な再発とそれに続く数ヶ月から数年の寛解期間を特徴とし、臨床疾患活動性の新たな徴候はない。発作(活動状態)中に罹患した欠損は、治癒するか、または後遺症を残すことがある。これは、MSに罹患している被験者の85から90%の初期経過を記載する。二次性進行性MSは、初期再発寛解型MSを有し、その後、明確な寛解期間を何ら伴うことなく急性発作の間に進行性の神経学的低下を有し始めるものを記載する。時折、再発および軽度の寛解が現れることがある。疾患発症と再発寛解から二次性進行性MSへの転換との間の時間の中央値は約19年である。原発性進行性サブタイプは、最初のMS症状後に寛解を全く有しない被験者の約10から15%を記載する。それは、寛解および改善がないか、または偶発的および軽微なものにすぎない、発症からの障害の進行によって特徴付けられる。原発性進行性サブタイプの発症年齢は、他のサブタイプよりも遅い。進行性再発性MSは、発症から、安定した神経学的低下を有するが、明らかな重畳発作も患っている被験者を記載する。この後者の進行性再発表現型が原発性進行性MS(PPMS)の変形であり、McDonald 2010基準によるPPMSの診断が進行性再発変異体を含むことが現在受け入れられている。
【0023】
MSに関連する症状は、感覚の変化(知覚低下および知覚異常)、筋力低下、筋攣縮、運動困難、協調およびバランスの困難(運動失調)、発話の問題(構音障害)または嚥下の問題(嚥下障害)、視覚的問題(眼振、視神経炎および視力低下、または複視)、疲労、急性または慢性の疼痛、膀胱、性的および腸の問題を含む。様々な程度の認知障害、ならびにうつ病または不安定な気分の情動症状もまた、頻繁な症状である。障害の進行および症状の重症度の主な臨床的尺度は、総合障害度評価尺度(EDSS)である。MSのさらなる症状は、当該技術分野で周知であり、医学および神経学の標準的な教科書に記載されている。
【0024】
本明細書で使用される「進行性MS」という用語は、疾患および/またはその症状の1つ以上が経時的に悪化する状態を指す。典型的には、進行は、活動状態の出現を伴う。前記進行は、疾患の全てのサブタイプで起こることがある。しかしながら、典型的には、「進行性MS」は、再発寛解型MSに罹患している被験者において本発明にしたがって決定されるものとする。
【0025】
多発性硬化症の状態を決定することは、一般に、微細運動能力の障害、ニーズのピン留め、指のしびれ、疲労および日周リズムへの変化、歩行の問題および歩行困難、処理速度の問題を含む認知障害からなる群から選択される多発性硬化症に関連する少なくとも1つの症状を評価することを含む。多発性硬化症の障害は、Kurtzke JF、「Rating neurologic impairment in multiple sclerosis:an expanded disability status scale(EDSS)」、1983年11月、Neurology.33(11):1444-52.doi:10.1212/WNL.33.11.1444.PMID 6685237に記載されているように、総合障害度評価尺度(EDSS)にしたがって定量化されることができる。目標変数は、EDSS値であってもよい。
【0026】
したがって、本明細書で使用される「総合障害度評価尺度(EDSS)」という用語は、MSに罹患している被験者における障害の定量的評価に基づくスコアを指す(Krutzke 1983)。EDSSは、臨床医による神経学的検査に基づいている。EDSSは、これらの機能システムのそれぞれにおいて機能システムスコア(FSS)を割り当てることによって、8つの機能システムにおける障害を定量化する。機能系は、錐体系、小脳系、脳幹系、感覚系、腸および膀胱系、視覚系、脳系および他の(残りの)系である。EDSSステップ1.0から4.5は、完全に歩行可能なMSに罹患している被験者を指し、EDSSステップ5.0から9.5は、歩行障害を有する被験者を特徴付ける。
【0027】
見込まれる各結果の臨床的意味は、以下のとおりである。
・ 0.0:神経学的に正常。
・ 1.0:障害なし。1項目のFSで極軽度の徴候。
・ 1.5:障害なし。2項目以上のFSで極軽度の徴候。
・ 2.0:1項目のFSで極軽度の障害。
・ 2.5:1項目のFSで軽度の障害または2項目のFSで極軽度の障害。
・ 3.0:歩行障害なし。1項目のFSで中程度の障害、または3~4項目のFSで軽度の障害。
・ 3.5:歩行障害なし。1項目のFSで中程度の障害および1または2項目のFSで軽度の障害を有する;または2項目のFSで中程度の障害;または5項目のFSで軽度の障害。
・ 4.0:補助なしで完全に歩行可能。比較的重度の身体的障害にもかかわらず、1日に約12時間起き上がって動き回れる。補助なしで500メートル歩行可能。
・ 4.5:補助なしで完全に歩行可能。1日の大半は起き上がって動き回ることができ、終日働くことができる。あるいは完全な活動にいくつか制限があるか、または最小限の補助が必要であり得る。比較的重度の障害。補助なしで300メートル歩行可能。
・ 5.0:補助なしで約200メートル歩行可能。身体的障害により十分な日常活動ができない。
・ 5.5:100メートル歩行可能。身体的障害により十分な日常活動ができない。
・ 6.0:休憩ありまたはなしで100メートル歩行するのに、時々または常時片側に補助具(杖、松葉杖または装具)が必要。
・ 6.5:休憩なしで20メートル歩行するのに、常時両側に補助具(杖、松葉杖または装具)が必要。
・ 7.0:補助があっても5メートルを超えて歩くことはできない。基本的に車椅子の生活。車椅子への移動、操作は自力;車椅子で1日約12時間活動。
・ 7.5:車椅子に限られる。数歩以上は歩けない。車椅子の操作は自力だが車椅子への移動のための補助を必要とする可能性がある。終日活動するためには電動椅子を必要とする場合がある。
・ 8.0:基本的にベッド、椅子、または車椅子に限られるが、一日の大半はベッド外で生活;身の回りのことはできる。一般に、腕の使用は可能。
・ 8.5:基本的に一日の多くの時間ベッドで生活。腕の使用はある程度可能。身の回りのことはある程度できる。
・ 9.0:寝たきり。意思伝達と飲食は可能。
・ 9.5:十分な意思伝達ができない、または食べる/飲み込むことができない。
・ 10.0:MSに起因する死亡。
【0028】
例えば、その状態について予測される疾患は、脊髄性筋萎縮症である。
【0029】
「脊髄性筋萎縮症(SMA)」という用語は、本明細書で使用するとき、一般的に脊髄における、運動ニューロン機能の喪失によって特徴付けられる、神経筋疾患に関する。運動ニューロン機能の喪失の結果として、一般的に、筋委縮が起こって、罹患した対象の早期死亡に至る。疾患は、SMN1遺伝子の遺伝性遺伝子異常によって引き起こされる。上記遺伝子によってコード化されたSMNタンパク質は、運動ニューロン生存のために必要である。疾患は、常染色体劣性型で遺伝する。
【0030】
SMAに関連する症状は、特に四肢の反射消失、筋力低下および筋緊張不良、呼吸筋の衰弱の結果として、小児期に発達段階を完了することの困難性、呼吸の問題、ならびに肺における分泌物蓄積、ならびに吸引、嚥下および摂取/摂食の困難性を含む。4つの異なるタイプのSMAが知られている。
【0031】
乳児型SMAまたはSMA1(ウェルドニッヒ・ホフマン病)は、通常は迅速且つ予想外の発症(「フロッピー乳児症候群」)を伴って、生後数ヶ月で現れる重篤な形態である。急性の運動ニューロン死は、主な身体器官、特に呼吸器系の非効率性を引き起こし、肺炎誘発性呼吸不全が最も頻繁な死因である。人工呼吸を受けていない限り、SMA1と診断された乳児は、一般に2歳を過ぎても生存しておらず、最も重度の症例では、SMA0と呼ばれることもあるが、数週間以内に早期に死亡する。適切な呼吸支援により、SMA1症例の約10%を占めるより軽度のSMA1表現型を有するものは、青年期および成人期まで生存することが知られている。
【0032】
中間型SMAまたはSMA2(デュボヴィッツ病)は、決して立ったり歩いたりすることができないが、生涯の少なくともしばらくの間座位を維持することができる小児に発症する。衰弱の発症は、通常、6ヶ月から18ヶ月の間のしばらくの間に認められる。進行は、様々であることが知られている。一部の人々は経時的に徐々に弱く成長するが、他の人々は慎重な維持によっていかなる進行も回避する。これらの小児には脊柱側弯症が存在することがあり、装具による矯正は呼吸の改善に役立つことがある。筋肉が弱くなり、呼吸器系が大きな懸念事項となっている。平均余命は幾分短くなるが、SMA2を有するほとんどの人は、成人期まで良好に生存する。
【0033】
若年性SMAまたはSMA3(クーゲルベルグ・ウェランダー病)は、典型的には12月齢後に現れ、しばらくすると支持なしで歩行することができるSMA3を有する人々を表すが、多くは後にこの能力を失う。呼吸障害はあまり目立たず、平均余命は、正常またはほぼ正常である。
【0034】
成人のSMAまたはSMA4は、通常、30代以降に、四肢の近位筋に影響を及ぼす筋肉が徐々に弱くなり、運動のために人が車椅子を使用することをしばしば必要とする。他の合併症は稀であり、平均余命は影響を受けない。
【0035】
典型的には、本発明にかかるSMAは、SMA1(ウェルドニッヒ・ホフマン病)、SMA2(デュボヴィッツ病)、SMA 3(クーゲルベルグ・ウェランダー病)またはSMA4である。
【0036】
SMAは、典型的には、低血圧の存在および反射の欠如によって診断される。双方とも、筋電図検査を含む病院の臨床医による標準的な技術によって測定されることができる。時折、血清クレアチンキナーゼが生化学的パラメータとして増加することがある。さらに、特に出生前診断またはキャリアスクリーニングとして遺伝子検査も可能である。さらに、SMA管理における重要なパラメータは、呼吸器系の機能である。呼吸器系の機能は、典型的には、SMAの結果としての呼吸器系の障害の程度を示すことになる被験者の強制肺活量を測定することによって決定されることができる。
【0037】
本明細書で使用される「強制肺活量(FVC)」という用語は、被験者が完全な吸気後に強制的に吹き出すことができるリットル単位の空気の体積を指す。それは、典型的には、肺活量測定装置を使用して病院または医師の勤務先で肺活量測定によって決定される。
【0038】
脊髄性筋萎縮症の状態を決定することは、一般に、筋緊張低下および筋力低下、疲労ならびに日周リズムの変化からなる群から選択される脊髄性筋萎縮症に関連する少なくとも1つの症状を評価することを含む。脊髄性筋萎縮症の状態の尺度は、強制肺活量(FVC)とすることができる。FVCは、リットル単位で測定される、完全吸気後に強制的に吹き出すことができる空気の量の定量的尺度とすることができる(https://en.wikipedia.org/wiki/Spirometryを参照)。目標変数は、FVC値とすることができる。
【0039】
例えば、その状態について予測される疾患は、ハンチントン病である。
【0040】
本明細書で使用される「ハンチントン病(HD)」という用語は、中枢神経系における神経細胞死を伴う遺伝性神経障害に関する。最も顕著には、脳幹神経節は、細胞死の影響を受ける。黒質、大脳皮質、海馬およびプルキンエ細胞などの関与する脳のさらなる領域も存在する。全ての領域は、典型的には、運動および行動制御において役割を果たす。この疾患は、ハンチンチンをコードする遺伝子の遺伝子変異によって引き起こされる。ハンチンチンは、様々な細胞機能に関与するタンパク質であり、100を超える他のタンパク質と相互作用する。変異ハンチンチンは、特定の神経細胞型に対して細胞傷害性であるようである。変異ハンチンチンは、ハンチンチン遺伝子におけるトリヌクレオチド反復によって引き起こされるポリグルタミン領域を特徴とする。タンパク質のポリグルタミン領域内の36個を超えるグルタミン残基の反復は、ハンチンチンタンパク質を引き起こす疾患をもたらす。
【0041】
この疾患の症状は、最も一般的には中年期に顕著になるが、乳児期から高齢者までの任意の年齢で始まることができる。初期段階では、症状は、性格、認知、および身体能力の微妙な変化を伴う。認知的および行動的症状は、一般に、前記初期段階で単独で認識されるほど重度ではないため、身体的症状は、通常、最初に注目される。HDを有するほぼ全ての者が、最終的には類似の身体的症状を示すが、認知的および行動的症状の発症、進行および程度は、個体間で有意に異なる。最も特徴的な初期身体的症状は、舞踏病と呼ばれるぎくしゃくしたランダムな制御不能な運動である。舞踏病は、一般的な不穏状態、小さな意図せずに開始されたまたは未完了の運動、協調の欠如、または衝動性眼球運動の遅延として最初に示されることがある。これらの軽微な運動異常は、通常、少なくとも3年、運動機能障害のより明白な徴候に先行する。硬直、ライジング動作または異常な姿勢などの症状の明確な外観は、障害が進行するにつれて現れる。これらは、運動を担う脳内の系が影響を受けたという徴候である。精神運動機能がますます損なわれ、筋肉制御を必要とするあらゆる行動が影響を受ける。一般的な結果は、身体的不安定性、異常な顔面表情、および咀嚼、嚥下、および発話の困難性である。その結果、摂食困難および睡眠障害もこの疾患に付随している。認知能力も進行性に障害される。機能障害は、実行機能、認知の柔軟性、抽象的な思考、ルールの取得、および適切な行動/反応能力である。より顕著な段階では、短期記憶障害から長期記憶障害を含む記憶障害が現れる傾向がある。認知の問題は時間とともに悪化し、最終的に認知症になる。HDに伴う精神医学的合併症は、不安、うつ病、感情の表出の減少(鈍感)、自己中心性、攻撃性、および強迫行動であり、後者はアルコール依存症、賭け事、および多幸症を含む嗜癖を引き起こすかまたは悪化させる可能性がある。
【0042】
HDの治療法は存在しない。対処すべき症状に応じて、疾患管理には支持的な測定がある。さらに、疾患、その進行またはそれに伴う症状を改善するために、いくつかの薬物が使用される。テトラベナジンは、HDの処置に承認されており、神経遮断薬を含み、ベンゾジアゼピンは、舞踏病の軽減に役立つ薬物として使用されており、アマンタジンまたはレマセミドは、まだ調査中であるが、予備的な肯定的な結果を示している。特に若年症例における運動低下および硬直は、抗パーキンソン薬で処置されることができ、ミオクロニー性運動亢進は、バルプロ酸で処置されることができる。エチル-エイコサペント酸は、患者の運動症状を増強することが見出されたが、その長期効果を明らかにする必要がある。
【0043】
この疾患は、遺伝子検査によって診断されることができる。さらに、疾患の重症度は、統一ハンチントン病評価尺度(UHDRS)にしたがって病期分類されることができる。この尺度システムは、4つの構成要素、すなわち、運動機能、認知、行動および機能的能力に対処する。運動機能評価は、眼球追跡、サッカード開始、サッカード速度、構音障害、舌突出、最大ジストニア、最大舞踏病、後突引っ張り試験、指のタッピング、回内/回外手、ルリア、固縮アーム、運動緩徐体、歩行、およびタンデム歩行の評価を含み、総運動スコア(TMS)として要約されることができる。運動機能は、医師によって調査および判断されなければならない。
【0044】
ハンチントン病の状態を決定することは、一般に、以下からなる群から選択されたハンチントン病に関連する少なくとも1つの症状を評価することを含む:精神運動遅滞、舞踏病(加加速度、ライジング)、進行性構音障害、固縮およびジストニア、社会的引きこもり、処理速度の進行性認知障害、注意、計画、視覚空間処理、学習(インタクトな想起ではあるが)、疲労および日周リズムへの変化。状態の尺度は、総運動スコア(TMS)である。目標変数は、総運動スコア(TMS)値とすることができる。したがって、本明細書で使用される「総運動スコア(TMS)」という用語は、眼球追跡、サッカード開始、サッカード速度、構音障害、舌突出、最大ジストニア、最大舞踏病、後突引っ張り試験、指タッピング、回内/回外手、ルリア、固縮アーム、運動緩徐体、歩行、およびタンデム歩行の評価に基づくスコアを指す。
【0045】
本明細書で使用される「状態変数」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、被験者による健康診断および/または自己診断によって導出されたデータなどの予測モデルに入力されることができる入力変数を指すことができる。状態変数は、少なくとも1つの能動的試験および/または少なくとも1つの受動的監視において決定されてもよい。例えば、状態変数は、少なくとも1つの認知試験および/または少なくとも1つの手運動機能試験および/または少なくとも1つの運動性試験などの能動的試験で決定されてもよい。
【0046】
本明細書で使用される「被験者」という用語は、典型的には哺乳動物に関する。本発明にかかる被験者は、典型的には、疾患に罹患している可能性があり、または疾患に罹患している疑いがある、すなわち、前記疾患に関連する陰性症状の一部または全部を既に示している可能性がある。本発明の実施形態では、前記被験者はヒトである。
【0047】
状態変数は、被験者の少なくとも1つのモバイル装置を使用することによって決定されることができる。本明細書で使用される「モバイル装置」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、モバイル電子装置、より具体的には、少なくとも1つのプロセッサを備えるモバイル通信装置を指すことができる。モバイル装置は、具体的には携帯電話またはスマートフォンとすることができる。モバイル装置はまた、タブレットコンピュータまたは任意の他の種類のポータブルコンピュータを指すこともできる。モバイル装置は、データ取得のために構成されることができるデータ取得ユニットを備えてもよい。モバイル装置は、定量的または定性的に物理的パラメータを検出および/または測定し、それらをさらなる処理および/または分析などのための電子信号に変換するように構成されることができる。この目的のために、モバイル装置は、少なくとも1つのセンサを備えることができる。1つを超えるセンサ、すなわち、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、もしくは少なくとも10、またはさらに多くの異なるセンサが、モバイル装置に使用されることができることが理解されるであろう。センサは、少なくとも1つのジャイロスコープ、少なくとも1つの磁力計、少なくとも1つの加速度計、少なくとも1つの近接センサ、少なくとも1つの温度計、少なくとも1つの歩数計、少なくとも1つの指紋検出器、少なくとも1つのタッチセンサ、少なくとも1つのボイスレコーダ、少なくとも1つの光センサ、少なくとも1つの圧力センサ、少なくとも1つの位置データ検出器、少なくとも1つのカメラ、少なくとも1つのGPSなどからなる群から選択される少なくとも1つのセンサであってもよい。モバイル装置は、プロセッサと、少なくとも1つのデータベースと、前記装置に有形に埋め込まれ、前記装置上で実行されると、データ取得のための方法を実行するソフトウェアとを備えることができる。モバイル装置は、例えば、データ収集のための方法で要求された少なくとも1つのタスクを実行するための、ディスプレイおよび/または少なくとも1つのキーなどのユーザインターフェースを備えることができる。
【0048】
本明細書で使用される「予測する」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、少なくとも1つの状態変数についての疾患状態を示す少なくとも1つの数値またはカテゴリ値を決定することを指すことができる。特に、状態変数は、入力として分析に記入されてもよく、分析モデルは、疾患状態を示す少なくとも1つの数値またはカテゴリ値を決定するために状態変数に対して少なくとも1つの分析を実行するように構成されてもよい。分析は、少なくとも1つの訓練されたアルゴリズムを使用することを含むことができる。
【0049】
本明細書で使用される「少なくとも1つの分析モデルを決定する」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、分析モデルの構築および/または作成を指すことができる。
【0050】
本明細書で使用される「疾患状態」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、健康状態および/または医学的状態および/または疾患段階を指すことができる。例えば、疾患状態は、健康または病気および/または疾患の有無とすることができる。例えば、疾患状態は、疾患の病期を示す尺度に関する値とすることができる。本明細書で使用される「疾患状態を示す」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、疾患状態に直接関連する情報および/または疾患状態に間接的に関連する情報、例えば疾患状態を導出するためのさらなる分析および/または処理を必要とする情報を指すことができる。例えば、目標変数は、疾患状態を決定するためにテーブルおよび/またはルックアップテーブルと比較する必要がある値とすることができる。
【0051】
本明細書で使用される「通信インターフェース」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されるものではないが、情報を転送するように構成された境界を形成するアイテムまたは要素を指すことができる。特に、通信インターフェースは、例えば別の装置に情報を送信または出力するなどのために、例えばコンピュータなどの計算装置から情報を転送するように構成されることができる。追加的または代替的に、通信インターフェースは、情報を受信するなどのために、計算装置、例えばコンピュータに情報を転送するように構成されてもよい。通信インターフェースは、具体的には、情報を転送または交換するための手段を提供することができる。特に、通信インターフェースは、例えば、ブルートゥース、NFC、誘導結合などのデータ転送接続を提供することができる。例として、通信インターフェースは、ネットワークまたはインターネットポート、USBポート、およびディスクドライブのうちの1つ以上を含む少なくとも1つのポートとすることができるか、またはそれらを含むことができる。通信インターフェースは、少なくとも1つのウェブインターフェースとすることができる。
【0052】
本明細書で使用される「入力データ」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、モデル構築に使用される実験データを指すことができる。入力データは、履歴的デジタルバイオマーカー特徴データのセットを含む。本明細書で使用される「バイオマーカー」という用語は、広義な用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、生物学的状態および/または生物学的症状の測定可能な特徴を指すことができる。本明細書で使用される「特徴」という用語は、広義な用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、予測が基づく疾患の症状の測定可能な特性および/または特徴を指すことができる。特に、全ての試験からの全ての特徴を考慮することができ、各予測のための特徴の最適なセットが決定される。したがって、全ての特徴が各疾患について考慮されることができる。本明細書で使用される「デジタルバイオマーカー特徴データ」という用語は、広義な用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、疾患の症状に関する被験者ごとの複数の異なる測定値を含むモバイル装置などの少なくとも1つのデジタル装置によって決定された実験データを指すことができる。デジタルバイオマーカー特徴データは、少なくとも1つのモバイル装置を使用することによって決定されることができる。モバイル装置およびモバイル装置を用いたデジタルバイオマーカー特徴データの決定に関しては、上記のモバイル装置を用いた状態変数の決定の説明が参照される。履歴的デジタルバイオマーカー特徴データのセットは、予測される疾患状態を示す被験者ごとの複数の測定値を含む。本明細書で使用される「履歴的」という用語は、広義な用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、デジタルバイオマーカー特徴データが、少なくとも1つの試験研究中などのモデル構築前に決定および/または収集されたという事実を指すことができる。例えば、多発性硬化症を示す少なくとも1つの目標を予測するためのモデル構築の場合、デジタルバイオマーカー特徴データは、Floodlight POC研究からのデータとすることができる。例えば、脊髄性筋萎縮症を示す少なくとも1つの目標を予測するためのモデル構築の場合、デジタルバイオマーカー特徴データは、OLEOS研究からのデータとすることができる。例えば、ハンチントン病を示す少なくとも1つの目標を予測するためのモデル構築の場合、デジタルバイオマーカー特徴データは、HD OLE研究、ISIS 44319-CS2からのデータとすることができる。入力データは、少なくとも1つの能動的試験および/または少なくとも1つの受動的監視において決定されてもよい。例えば、入力データは、少なくとも1つの認知試験および/または少なくとも1つの手運動機能試験および/または少なくとも1つの運動性試験などの少なくとも1つのモバイル装置を使用するアクティブ試験で決定されてもよい。
【0053】
入力データは、目標データをさらに含むことができる。本明細書で使用される「目標データ」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、予測するための臨床値、特に被験者ごとに1つの臨床値を含むデータを指すことができる。目標データは、数値であってもカテゴリであってもよい。臨床値は、疾患の状態を直接的または間接的に指すことができる。
【0054】
処理ユニットは、入力データから特徴を抽出するように構成されてもよい。本明細書で使用される「特徴を抽出する」という用語は、広義な用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、入力データから特徴を決定および/または導出する少なくとも1つのプロセスを指すことができる。具体的には、特徴は事前定義されてもよく、特徴のサブセットは、可能な特徴のセット全体から選択されてもよい。特徴の抽出は、データ集約、データ削減、データ変換などのうちの1つ以上を含むことができる。処理ユニットは、特徴をランク付けするように構成されることができる。本明細書で使用される「特徴をランク付けする」という用語は、広義な用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、所定の基準に応じて、ランク、特に重みを特徴のそれぞれに割り当てることを指すことができる。例えば、特徴は、それらの関連性に関して、すなわち目標変数との相関に関してランク付けされてもよく、および/または特徴は、冗長性に関して、すなわち特徴間の相関に関してランク付けされてもよい。処理ユニットは、最大関連性-最小冗長性技術を使用して特徴をランク付けするように構成されることができる。この方法は、関連性と冗長性との間のトレードオフを使用して全ての特徴をランク付けする。具体的には、特徴選択およびランク付けは、Ding C.、Peng H、「Minimum redundancy fweature selection from microarray gene expression data」、J Bioinform Comput Biol.2005年4月;3(2):185-205,PubMed PMID:15852500に記載されているように実行されることができる。特徴選択およびランク付けは、Dingらに記載された方法と比較して修正された方法を使用して実行されることができる。平均相関係数ではなく最大相関係数が使用されてもよく、加算変換が適用されてもよい。分析モデルとしての回帰モデルの場合、変換は、平均相関係数の値を5乗に上げることができる。分析モデルとしての分類モデルの場合、平均相関係数の値に10を乗算してもよい。
【0055】
本明細書で使用される「モデルユニット」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、少なくとも1つの機械学習モデルを記憶するように構成された少なくとも1つのデータ記憶装置および/または記憶ユニットを指すことができる。本明細書で使用される「機械学習モデル」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、少なくとも1つの訓練可能なアルゴリズムを指すことができる。モデルユニットは、複数の機械学習モデル、例えば、回帰モデルを構築するための異なる機械学習モデルおよび分類モデルを構築するための機械学習モデルを含むことができる。例えば、分析モデルは、回帰モデルであってもよく、機械学習モデルのアルゴリズムは、k最近傍(kNN);線形回帰;部分的最終二乗(PLS);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであってもよい。例えば、分析モデルは、分類モデルであってもよく、機械学習モデルのアルゴリズムは、k最近傍(kNN);サポートベクターマシン(SVM);線形判別分析(LDA);二次判別分析(QDA);ナイーブベイズ(NB);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであってもよい。
【0056】
本明細書で使用される「処理ユニット」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、コンピュータまたはシステムの動作を実行するように構成された任意の論理回路、および/または一般に、計算または論理演算を実行するように構成された装置を指すことができる。処理ユニットは、少なくとも1つのプロセッサを備えることができる。特に、処理ユニットは、コンピュータまたはシステムを駆動する基本的な命令を処理するように構成されることができる。例として、処理ユニットは、少なくとも1つの算術論理演算ユニット(ALU)と、数値演算コプロセッサまたは数値コプロセッサなどの少なくとも1つの浮動小数点ユニット(FPU)と、複数のレジスタと、キャッシュメモリなどのメモリとを備えてもよい。特に、処理ユニットは、マルチコアプロセッサであってもよい。処理ユニットは、機械学習のために構成されてもよい。処理ユニットは、中央処理装置(CPU)および/または1つ以上のグラフィック処理ユニット(GPU)および/または1つ以上の特定用途向け集積回路(ASIC)および/または1つ以上のテンソル処理ユニット(TPU)および/または1つ以上のフィールドプログラマブルゲートアレイ(FPGA)などを備えることができる。
【0057】
処理ユニットは、入力データを前処理するように構成されてもよい。前処理は、入力データが少なくとも1つの品質基準を満たすための少なくとも1つのフィルタリングプロセスを含むことができる。例えば、入力データは、欠落変数を除去するためにフィルタリングされてもよい。例えば、前処理は、予め定義された最小観察数未満の被験者からのデータを除外することを含むことができる。
【0058】
本明細書で使用される「訓練データセット」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、機械学習モデルを訓練するために使用される入力データのサブセットを指すことができる。本明細書で使用される「試験データセット」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、訓練された機械学習モデルを試験するために使用される入力データの別のサブセットを指すことができる。訓練データセットは、複数の訓練データセットを含むことができる。特に、訓練データセットは、入力データの被験者ごとの訓練データセットを含む。試験データセットは、複数の試験データセットを含むことができる。特に、試験データセットは、入力データの被験者ごとの試験データセットを含む。処理ユニットは、被験者ごとに入力データの訓練データセットおよび試験データセットを生成および/または作成するように構成されることができ、被験者ごとの試験データセットは、その被験者のデータのみを含むことができ、その被験者の訓練データセットは、他の全ての入力データを含む。
【0059】
処理ユニットは、各被験者について訓練データセットおよび試験データセットの双方に対して少なくとも1つのデータ集約および/またはデータ変換を実行するように構成されることができる。変換および特徴ランク付けステップは、訓練データセットおよび試験データセットに分割することなく実行されることができる。これは、例えばデータからの重要な特徴の干渉を可能にすることができる。
【0060】
処理ユニットは、訓練データセットおよび試験データセットの、少なくとも1つの安定化変換;少なくとも1つの集約;少なくとも1つの正規化のうちの1つ以上のために構成されてもよい。
【0061】
例えば、処理ユニットは、訓練データセットおよび試験データセットの双方の被験者ごとのデータ集約のために構成されてもよく、特徴の平均値は、被験者ごとに決定される。
【0062】
例えば、処理ユニットは、分散安定化のために構成されてもよく、各特徴に対して、少なくとも1つの分散安定化関数が適用される。分散安定化関数は、全ての値が300よりも大きく且つ0と1との間の値がない場合に使用されることができるロジスティック;全ての値が0から1の間(両端を含む)である場合に使用されることができるロジット;シグモイド;全ての値>=0の場合に考慮される場合に使用されることができるlog 10からなる群から選択される少なくとも1つの関数とすることができる。処理ユニットは、各分散変換関数を使用して各特徴の値を変換するように構成されることができる。処理ユニットは、特定の基準を使用して、元の分布を含む結果として生じる分布のそれぞれを評価するように構成されることができる。分析モデルとしての分類モデルの場合、すなわち目標変数が離散的である場合、前記基準は、取得された値が異なるクラスをどの程度分離することができるかとすることができる。具体的には、この目的のために、全てのクラスごとの平均シルエット値の最大値が使用されることができる。分析モデルとしての回帰モデルの場合、基準は、分散安定化関数を適用して得られた値を目標変数に対して回帰した後に得られる平均絶対誤差とすることができる。この選択基準を使用して、処理ユニットは、もしあれば元の値よりも良い、訓練データセット上の最良の可能な変換を決定するように構成されることができる。続いて、可能な限り最良の変換が試験データセットに適用されることができる。
【0063】
例えば、処理ユニットは、zスコア変換のために構成されてもよく、変換された特徴ごとに、訓練データセット上で平均および標準偏差が決定され、これらの値は、訓練データセットと試験データセットの双方のzスコア変換に使用される。
【0064】
例えば、処理ユニットは、訓練データセットおよび試験データセットの双方に対して3つのデータ変換ステップを実行するように構成されてもよく、変換ステップは、以下を含む:1.被験者別データ集約;2.分散安定化;3.zスコア変換。
【0065】
処理ユニットは、ランク付けおよび変換ステップの少なくとも1つの出力を決定および/または提供するように構成されることができる。例えば、ランク付けおよび変換ステップの出力は、少なくとも1つの診断プロットを含むことができる。診断プロットは、ランク付け手順に関連する重要な統計を比較する少なくとも1つの主成分分析(PCA)プロットおよび/または少なくとも1つのペアプロットを含むことができる。
【0066】
処理ユニットは、機械学習モデルを訓練データセットを用いて訓練することによって分析モデルを決定するように構成されている。本明細書で使用される「機械学習モデルを訓練する」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、訓練データセット上の機械学習モデルのアルゴリズムのパラメータを決定するプロセスを指すことができる。訓練は、少なくとも1つの最適化または調整プロセスを含むことができ、最良のパラメータの組み合わせが決定される。訓練は、異なる被験者の訓練データセットに対して反復的に実行されてもよい。処理ユニットは、訓練データセットを用いて機械学習モデルを訓練することによって分析モデルを決定するために、異なる数の特徴を考慮するように構成されてもよい。機械学習モデルのアルゴリズムは、例えばそれらのランキングに応じて、異なる数の特徴を使用して訓練データセットに適用されることができる。訓練は、モデルパラメータのロバストな推定値を得るためのn倍交差検証を含むことができる。機械学習モデルの訓練は、少なくとも1つの制御された学習プロセスを含むことができ、少なくとも1つのハイパーパラメータが訓練プロセスを制御するために選択される。必要に応じて、ハイパーパラメータの異なる組み合わせを試験するために、訓練ステップが繰り返される。
【0067】
特に、機械学習モデルの訓練に続いて、処理ユニットは、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されている。本明細書で使用される「決定された分析モデル」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、訓練された機械学習モデルを指すことができる。処理ユニットは、決定された分析モデルを使用して、各被験者の試験データセットに基づいて、各被験者の目標変数を予測するように構成されることができる。処理ユニットは、分析モデルを使用して、それぞれの訓練データセットおよび試験データセット上の各被験者について目標変数を予測するように構成されることができる。処理ユニットは、例えば、少なくとも1つの出力ファイルに、被験者ごとの予測された目標変数と被験者ごとの目標変数の真値の双方を記録および/または記憶するように構成されることができる。本明細書で使用される「目標変数の真値」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、その被験者の目標データから決定されることができる、その被験者の目標変数の現実の値または実際の値を指すことができる。
【0068】
処理ユニットは、予測された目標変数と試験データセットの目標変数の真値に基づいて、決定された分析モデルの性能を決定するように構成されている。本明細書で使用される「性能」という用語は、広義の用語であり、当業者にとって通常の慣習的な意味が与えられるべきであり、特別なまたはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、限定されないが、目標変数を予測するための決定された分析モデルの適合性を指すことができる。性能は、予測された目標変数と目標変数の真値との間の偏差によって特徴付けられることができる。機械学習システムは、少なくとも1つの出力インターフェースを備えることができる。出力インターフェースは、通信インターフェースと同一に設計されてもよく、および/または通信インターフェースと一体に形成されてもよい。出力インターフェースは、少なくとも1つの出力を提供するように構成されることができる。出力は、決定された分析モデルの性能に関する少なくとも1つの情報を含むことができる。決定された分析モデルの性能に関する情報は、少なくとも1つのスコアチャート、少なくとも1つの予測プロット、少なくとも1つの相関プロット、および少なくとも1つの残差プロットのうちの1つ以上を含むことができる。
【0069】
モデルユニットは、複数の機械学習モデルを含むことができ、機械学習モデルは、それらのアルゴリズムによって区別される。例えば、回帰モデルを構築するために、モデルユニットは、以下のアルゴリズムk最近傍(kNN)、線形回帰、部分的最終二乗(PLS)、ランダムフォレスト(RF)、および極ランダム化ツリー(XT)を含むことができる。例えば、分類モデルを構築するために、モデルユニットは、以下のアルゴリズムk最近傍(kNN)、サポートベクターマシン(SVM)、線形判別分析(LDA)、二次判別分析(QDA)、ナイーブベイズ(NB)、ランダムフォレスト(RF)、および極ランダム化ツリー(XT)を含むことができる。処理ユニットは、訓練データセットを用いてそれぞれの機械学習モデルを訓練することによって、機械学習モデルのそれぞれの分析モデルを決定し、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されることができる。
【0070】
処理ユニットは、予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルのそれぞれの性能を決定するように構成されることができる。回帰モデルを構築する場合、処理ユニットによって提供される出力は、少なくとも1つのスコアチャート、少なくとも1つの予測プロット、少なくとも1つの相関プロット、および少なくとも1つの残差プロットのうちの1つ以上を含むことができる。スコアチャートは、各被験者について、試験データセットおよび訓練データセットの双方からの平均絶対誤差、ならびに各タイプの回帰器、すなわち使用されたアルゴリズム、および選択された特徴の数を示すボックスプロットとすることができる。予測プロットは、回帰器タイプおよび特徴の数の各組み合わせについて、試験および訓練データの双方について、目標変数の予測値が真値とどの程度良好に相関するかを示すことができる。相関プロットは、各回帰器タイプについて、モデルに含まれる特徴の数の関数として、予測された目標変数と真の目標変数との間のスピアマン相関係数を示すことができる。残差プロットは、回帰器タイプおよび特徴の数の各組み合わせについて、ならびに試験および訓練データの双方について、予測された目標変数と残差との間の相関を示すことができる。処理ユニットは、特に出力に基づいて、最良の性能を有する分析モデルを決定するように構成されてもよい。
【0071】
分類モデルを構築する場合、処理ユニットによって提供される出力は、スコアリングチャートを含むことができ、これは、各被験者について、試験データおよび訓練データの双方から、ならびに回帰器のタイプおよび選択された特徴の数ごとに、FスコアまたはF尺度とも呼ばれる平均F1性能スコアをボックスプロットで示す。処理ユニットは、特に出力に基づいて、最良の性能を有する分析モデルを決定するように構成されてもよい。
【0072】
本発明のさらなる態様では、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータ実装方法が提案される。本方法では、本発明にかかる機械学習システムが使用される。したがって、本方法の実施形態および定義に関して、上記の機械学習システムの説明、または以下にさらに詳細に説明されるような機械学習システムの説明が参照される。
【0073】
本方法は、具体的には、所定の順序で実行されることができる以下の方法ステップを含む。しかし、異なる順序も可能である。さらに、2つ以上の方法ステップを完全にまたは部分的に同時に実行することが可能である。さらに、方法ステップの1つ以上またはさらには全てが、1回実行されてもよく、または1回もしくは数回繰り返されるなど、繰り返し実行されてもよい。さらに、本方法は、列挙されていない追加の方法ステップを含んでもよい。
【0074】
本方法は、
a)少なくとも1つの通信インターフェースを介して入力データを受信するステップであって、入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、履歴的デジタルバイオマーカー特徴データのセットが、予測される疾患状態を示す複数の測定値を含む、受信するステップと、
少なくとも1つの処理ユニットにおいて、
b)入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するステップと、
c)訓練データセットを用いて少なくとも1つのアルゴリズムを含む機械学習モデルを訓練することによって、分析モデルを決定するステップと、
d)決定された分析モデルを使用して試験データセット上の目標変数を予測するステップと、
e)予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルの性能を決定するステップと、
を含む。
【0075】
ステップc)において、複数の分析モデルは、訓練データセットを用いて複数の機械学習モデルを訓練することによって、決定されることができる。機械学習モデルは、それらのアルゴリズムによって区別されることができる。ステップd)において、決定された分析モデルを使用して、試験データセット上で複数の目標変数が予測されることができる。ステップe)において、決定された分析モデルのそれぞれの性能は、予測された目標変数と試験データセットの目標変数の真値に基づいて決定されることができる。本方法は、最良の性能を有する分析モデルを決定することをさらに含むことができる。
【0076】
本明細書にさらに開示および提案されるのは、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータプログラムであって、プログラムがコンピュータまたはコンピュータネットワーク上で実行されると、本明細書に含まれる実施形態の1つ以上において本発明にかかる方法を実行するためのコンピュータ実行可能命令を含む、コンピュータプログラムである。具体的には、コンピュータプログラムは、コンピュータ可読データキャリアおよび/またはコンピュータ可読記憶媒体に記憶されることができる。コンピュータプログラムは、本明細書に含まれる実施形態のうちの1つ以上において、本発明にかかる方法の少なくともステップb)からe)を実行するように構成されている。
【0077】
本明細書で使用される場合、「コンピュータ可読データキャリア」および「コンピュータ可読記憶媒体」という用語は、具体的には、コンピュータ実行可能命令が記憶されたハードウェア記憶媒体などの非一時的データ記憶手段を指すことができる。コンピュータ可読データキャリアまたは記憶媒体は、具体的には、ランダムアクセスメモリ(RAM)および/または読み出し専用メモリ(ROM)などの記憶媒体とすることができるか、またはそれを含むことができる。
【0078】
したがって、具体的には、上述したような方法ステップb)からe)の1つ、2つ以上、または全ては、コンピュータまたはコンピュータネットワークを使用して、好ましくはコンピュータプログラムを使用して実行されることができる。
【0079】
本明細書にさらに開示および提案されるのは、プログラムがコンピュータまたはコンピュータネットワーク上で実行されると、本明細書に含まれる1つ以上の実施形態における本開示にかかる方法を実行するために、プログラムコード手段を有するコンピュータプログラム製品である。具体的には、プログラムコード手段は、コンピュータ可読データキャリアおよび/またはコンピュータ可読記憶媒体に記憶されることができる。
【0080】
データ構造が記憶されたデータキャリアが本明細書にさらに開示および提案されており、これは、コンピュータまたはコンピュータネットワークのワーキングメモリまたはメインメモリなどのコンピュータまたはコンピュータネットワークにロードした後、本明細書に開示される1つ以上の実施形態にかかる方法を実行することができる。
【0081】
プログラムがコンピュータまたはコンピュータネットワーク上で実行されるときに、本明細書に含まれる1つ以上の実施形態にかかる方法を実行するために、機械可読キャリアに記憶されたプログラムコードを手段有するコンピュータプログラム製品が本明細書にさらに開示および提案される。本明細書中で用いられる場合、コンピュータプログラム製品は、取引可能な製品としてのプログラムを指す。製品は、一般に、紙のフォーマットなどの任意のフォーマットで、またはコンピュータ可読データキャリアおよび/またはコンピュータ可読記憶媒体上に存在する。具体的には、コンピュータプログラム製品は、データネットワーク上で配信されてもよい。
【0082】
最後に、本明細書に開示される1つ以上の実施形態にかかる方法を実行するための、コンピュータシステムまたはコンピュータネットワークによって読み取り可能な命令を含む変調データ信号が本明細書にさらに開示および提案される。
【0083】
本開示のコンピュータ実施態様を参照すると、本明細書に開示される実施形態の1つ以上にかかる方法のうちの1つ以上の方法ステップまたは全ての方法ステップは、コンピュータまたはコンピュータネットワークを使用することによって実行されることができる。したがって、一般に、データの提供および/または操作を含む方法ステップのいずれかは、コンピュータまたはコンピュータネットワークを使用することによって実行されることができる。一般に、これらの方法ステップは、試料の提供および/または実際の測定を実行する特定の態様などの手作業を必要とする方法ステップを通常除いて、任意の方法ステップを含むことができる。
【0084】
具体的には、本明細書では、さらに以下が開示される。
- プロセッサが、この説明で記載される実施形態のうちの1つにかかる方法を実行するように適合された少なくとも1つのプロセッサを備えるコンピュータまたはコンピュータネットワーク。
- データ構造がコンピュータ上で実行されている間に、本明細書に記載された実施形態のうちの1つにかかる方法を実行するように適合されたコンピュータロード可能データ構造。
- プログラムがコンピュータ上で実行されている間に、この明細書に記載された実施形態のうちの1つにかかる方法を実行するように適合されたコンピュータプログラム。
- コンピュータプログラムがコンピュータ上またはコンピュータネットワーク上で実行されている間に、この明細書に記載された実施形態のうちの1つにかかる方法を実行するためのプログラム手段を備えるコンピュータプログラム。
- プログラム手段がコンピュータが読み取り可能な記憶媒体上に記憶された、先行する実施形態にかかるプログラム手段を備えるコンピュータプログラム。
- データ構造が記憶媒体に記憶され、データ構造がコンピュータまたはコンピュータネットワークのメイン記憶部および/またはワーキング記憶部にロードされた後、本明細書に記載された実施形態のうちの1つにかかる方法を実行するように適合された、記憶媒体。
- コンピュータまたはコンピュータネットワーク上でプログラムコード手段が実行された場合に、この説明に記載された実施形態のうちの1つにかかる方法を実行するために、プログラムコード手段が記憶されることができる、または記憶媒体上に記憶されることができる、プログラムコード手段を有するコンピュータプログラム製品。
【0085】
本発明のさらなる態様では、多発性硬化症を示す総合障害度評価尺度(EDSS)値、脊髄性筋萎縮症を示す強制肺活量(FVC)値、またはハンチントン病を示す総運動スコア(TMS)値のうちの1つ以上を予測するための、本明細書に開示される実施形態のうちの1つ以上にかかる機械学習システムの使用が提案される。
【0086】
本発明にかかる装置および方法は、疾患状態を予測するための既知の方法を超えるいくつかの利点を有する。機械学習システムの使用は、いくつかの大規模な試験研究で決定されたデータなどの大量の複雑な入力データを分析することを可能にし、高速で信頼性があり正確な結果を提供することを可能にする分析モデルを決定することを可能にすることができる。
【0087】
要約すると、さらに可能な実施形態を除外することなく、以下の実施形態が想定されることができる。
【0088】
実施形態1:疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システムであって、
- 入力データを受信するように構成された少なくとも1つの通信インターフェースであって、入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、履歴的デジタルバイオマーカー特徴データのセットが、予測される疾患状態を示す複数の測定値を含む、少なくとも1つの通信インターフェースと、
- 少なくとも1つのアルゴリズムを含む少なくとも1つの機械学習モデルを含む、少なくとも1つのモデルユニットと、
- 少なくとも1つの処理ユニットであって、処理ユニットが、入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するように構成されており、処理ユニットが、訓練データセットを用いて機械学習モデルを訓練することによって分析モデルを決定するように構成されており、処理ユニットが、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されており、処理ユニットが、予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルの性能を決定するように構成されている、少なくとも1つの処理ユニットと、を備える、機械学習システム。
【0089】
実施形態2:分析モデルが、回帰モデルまたは分類モデルである、実施形態1に記載の機械学習システム。
【0090】
実施形態3:分析モデルが回帰モデルであり、機械学習モデルのアルゴリズムが、k最近傍(kNN);線形回帰;部分的最終二乗(PLS);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであり、または、分析モデルが分類モデルであり、機械学習モデルのアルゴリズムが、k最近傍(kNN);サポートベクターマシン(SVM);線形判別分析(LDA);二次判別分析(QDA);ナイーブベイズ(NB);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムである、実施形態1または2に記載の機械学習システム。
【0091】
実施形態4:モデルユニットが複数の機械学習モデルを含み、機械学習モデルが、それらのアルゴリズムによって区別される、実施形態1から3のいずれか1つに記載の機械学習システム。
【0092】
実施形態5:処理ユニットが、各機械学習モデルを訓練データセットを用いて訓練することによって、機械学習モデルごとに分析モデルを決定し、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されており、処理ユニットが、予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルのそれぞれの性能を決定するように構成されており、処理ユニットが、最良の性能を有する分析モデルを決定するように構成されている、実施形態4に記載の機械学習システム。
【0093】
実施形態6:目標変数が、予測される臨床値であり、目標変数が数値またはカテゴリのいずれかである、実施形態1~5のいずれか1つに記載の機械学習システム。
【0094】
実施形態7:その状態について予測される疾患が多発性硬化症であり、目標変数が総合障害度評価尺度(EDSS)値であり、または、その状態について予測される疾患が脊髄性筋萎縮症であり、目標変数が強制肺活量(FVC)値であり、または、その状態について予測される疾患がハンチントン病であり、目標変数が総運動スコア(TMS)値である、実施形態1から6のいずれか1つに記載の機械学習システム。
【0095】
実施形態8:処理ユニットが、被験者ごとに入力データの訓練データセットおよび試験データセットを生成および/または作成するように構成され、試験データセットが一被験者のデータを含み、訓練データセットが他の入力データを含む、実施形態1から7のいずれか1つに記載の機械学習システム。
【0096】
実施形態9:処理ユニットが、入力データから特徴を抽出するように構成されており、処理ユニットが、最大関連性-最小冗長性技術を使用して特徴をランク付けするように構成されている、実施形態1から8のいずれか1つに記載の機械学習システム。
【0097】
実施形態10:処理ユニットが、訓練データセットを用いて機械学習モデルを訓練することによって分析モデルを決定するために、異なる数の特徴を考慮するように構成されている、実施形態9に記載の機械学習システム。
【0098】
実施形態11:処理ユニットが、入力データを前処理するように構成されており、前処理が、入力データが少なくとも1つの品質基準を満たすための少なくとも1つのフィルタリングプロセスを含む、実施形態1から10のいずれか1つに記載の機械学習システム。
【0099】
実施形態12:処理ユニットが、訓練データセットおよび試験データセットの、少なくとも1つの安定化変換;少なくとも1つの集約;少なくとも1つの正規化のうちの1つ以上を実行するように構成されている、実施形態1から11のいずれか1つに記載の機械学習システム。
【0100】
実施形態13:機械学習システムが、少なくとも1つの出力インターフェースを備え、出力インターフェースが、少なくとも1つの出力を提供するように構成されており、出力が、決定された分析モデルの性能に関する少なくとも1つの情報を含む、実施形態1から12のいずれか1つに記載の機械学習システム。
【0101】
実施形態14:決定された分析モデルの性能に関する情報が、少なくとも1つのスコアチャート、少なくとも1つの予測プロット、少なくとも1つの相関プロット、および少なくとも1つの残差プロットのうちの1つ以上を含む、実施形態13に記載の機械学習システム。
【0102】
実施形態15:疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータ実装方法であって、方法では、先行する実施形態のいずれか1つにかかる機械学習システムが使用され、方法が、
a)少なくとも1つの通信インターフェースを介して入力データを受信するステップであって、入力データが履歴的デジタルバイオマーカー特徴データのセットを含み、履歴的デジタルバイオマーカー特徴データのセットが、予測される疾患状態を示す複数の測定値を含む、受信するステップと、
少なくとも1つの処理ユニットにおいて、
b)入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するステップと、
c)訓練データセットを用いて少なくとも1つのアルゴリズムを含む機械学習モデルを訓練することによって、分析モデルを決定するステップと、
d)決定された分析モデルを使用して試験データセット上の目標変数を予測するステップと、
e)予測された目標変数と試験データセットの目標変数の真値とに基づいて、決定された分析モデルの性能を決定するステップと、を含む、方法。
【0103】
実施形態16:ステップc)において、複数の分析モデルが、訓練データセットを用いて複数の機械学習モデルを訓練することによって決定され、機械学習モデルが、それらのアルゴリズムによって区別され、ステップd)において、決定された分析モデルを使用して試験データセット上で複数の目標変数が予測され、ステップe)において、決定された分析モデルのそれぞれの性能が、予測された目標変数と試験データセットの目標変数の真値とに基づいて決定され、方法が、最良の性能を有する分析モデルを決定するステップをさらに含む、実施形態15に記載の方法。
【0104】
実施形態17:疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するためのコンピュータプログラムであって、コンピュータまたはコンピュータネットワーク上で実行されると、コンピュータまたはコンピュータネットワークに、実施形態15または16にかかる疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための方法を完全にまたは部分的に実行させるように構成されており、コンピュータプログラムが、実施形態15または16にかかる疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための方法の少なくともステップb)からe)を実行するように構成されている、コンピュータプログラム。
【0105】
実施形態18:コンピュータまたはコンピュータネットワークによって実行されると、先行する方法の実施形態15または16にかかる方法の少なくともステップb)からe)を実行させる命令を含むコンピュータ可読記憶媒体。
【0106】
実施形態19:多発性硬化症を示す総合障害度評価尺度(EDSS)値、脊髄性筋萎縮症を示す強制肺活量(FVC)値、またはハンチントン病を示す総運動スコア(TMS)値のうちの1つ以上を予測するための分析モデルを決定するための機械学習システムに関する、実施形態1~14のいずれか1つに記載の機械学習システムの使用。
【図面の簡単な説明】
【0107】
さらなる任意の特徴および実施形態は、好ましくは従属請求項と併せて、実施形態の後続の説明においてより詳細に開示される。その中で、それぞれの任意の特徴は、当業者が理解するように、独立した方法で、ならびに任意の実行可能な組み合わせで実現されてもよい。本発明の範囲は、好ましい実施形態によって限定されない。実施形態は、図に概略的に示されている。その中で、これらの図の同一の参照符号は、同一または機能的に匹敵する要素を指す。
【0108】
図は以下のとおりである。
【
図1】本発明にかかる機械学習システムの例示的な実施形態を示している。
【
図2】本発明にかかるコンピュータ実装方法の例示的な実施形態を示している。
【
図3A】分析モデルの性能を評価するための相関プロットの実施形態を示している。
【
図3B】分析モデルの性能を評価するための相関プロットの実施形態を示している。
【
図3C】分析モデルの性能を評価するための相関プロットの実施形態を示している。
【発明を実施するための形態】
【0109】
態様の詳細な説明
図1は、疾患状態を示す少なくとも1つの目標変数を予測するための少なくとも1つの分析モデルを決定するための機械学習システム110の実施形態を高度に概略的に示している。
【0110】
分析モデルは、少なくとも1つの状態変数について少なくとも1つの目標変数を予測するように構成された数学モデルとすることができる。分析モデルは、回帰モデルであってもよいし、分類モデルであってもよい。回帰モデルは、ある範囲内の数値を出力として有する少なくとも1つの教師あり学習アルゴリズムを含む分析モデルとすることができる。分類モデルは、「病気」または「健康」などの分類子を出力として有する少なくとも1つの教師あり学習アルゴリズムを含む分析モデルとすることができる。
【0111】
予測される目標変数値は、その存在または状態について予測される疾患に依存することができる。目標変数は、数値であってもカテゴリであってもよい。例えば、目標変数は、カテゴリとすることができ、疾患が存在する場合は「陽性」とすることができ、疾患が存在しない場合は「陰性」とすることができる。疾患状態は、健康症状および/または医学的症状および/または疾患段階とすることができる。例えば、疾患状態は、健康または病気および/または疾患の有無とすることができる。例えば、疾患状態は、疾患の病期を示す尺度に関する値とすることができる。目標変数は、少なくとも1つの値および/またはスケール値などの数値であってもよい。目標変数は、疾患状態に直接関連してもよく、および/または疾患状態に間接的に関連してもよい。例えば、目標変数は、疾患状態を導出するためのさらなる分析および/または処理を必要とすることができる。例えば、目標変数は、疾患状態を決定するためにテーブルおよび/またはルックアップテーブルと比較する必要がある値とすることができる。
【0112】
機械学習システム110は、特に所与のアルゴリズムにおける論理を実行するための機械学習のために構成されたプロセッサ、マイクロプロセッサ、またはコンピュータシステムなどの少なくとも1つの処理ユニット112を備える。機械学習システム110は、少なくとも1つの機械学習アルゴリズムを実施および/または実行するように構成されることができ、機械学習アルゴリズムは、訓練データに基づいて少なくとも1つの分析モデルを構築するように構成されている。処理ユニット112は、少なくとも1つのプロセッサを備えることができる。特に、処理ユニット112は、コンピュータまたはシステムを駆動する基本的な命令を処理するように構成されることができる。例として、処理ユニット112は、少なくとも1つの算術論理演算ユニット(ALU)と、数値演算コプロセッサまたは数値コプロセッサなどの少なくとも1つの浮動小数点ユニット(FPU)と、複数のレジスタと、キャッシュメモリなどのメモリとを備えてもよい。特に、処理ユニット112は、マルチコアプロセッサであってもよい。処理ユニット112は、機械学習のために構成されてもよい。処理ユニット112は、中央処理装置(CPU)および/または1つ以上のグラフィック処理ユニット(GPU)および/または1つ以上の特定用途向け集積回路(ASIC)および/または1つ以上のテンソル処理ユニット(TPU)および/または1つ以上のフィールドプログラマブルゲートアレイ(FPGA)などを備えることができる。
【0113】
機械学習システムは、入力データを受信するように構成された少なくとも1つの通信インターフェース114を備える。通信インターフェース114は、例えば別の装置に情報を送信または出力するなどのために、例えばコンピュータなどの計算装置から情報を転送するように構成されることができる。追加的または代替的に、通信インターフェース114は、情報を受信するなどのために、計算装置、例えばコンピュータに情報を転送するように構成されてもよい。通信インターフェース114は、具体的には、情報を転送または交換するための手段を提供することができる。特に、通信インターフェース114は、例えば、ブルートゥース、NFC、誘導結合などのデータ転送接続を提供することができる。例として、通信インターフェース114は、ネットワークまたはインターネットポート、USBポート、およびディスクドライブのうちの1つまたは複数を含む少なくとも1つのポートとすることができるか、またはそれらを含むことができる。通信インターフェース114は、少なくとも1つのウェブインターフェースとすることができる。
【0114】
入力データは、履歴的デジタルバイオマーカー特徴データのセットを含み、履歴的デジタルバイオマーカー特徴データのセットは、予測される疾患状態を示す複数の測定値を含む。履歴的デジタルバイオマーカー特徴データのセットは、予測される疾患状態を示す被験者ごとの複数の測定値を含む。例えば、多発性硬化症を示す少なくとも1つの目標を予測するためのモデル構築の場合、デジタルバイオマーカー特徴データは、Floodlight POC研究からのデータとすることができる。例えば、脊髄性筋萎縮症を示す少なくとも1つの目標を予測するためのモデル構築の場合、デジタルバイオマーカー特徴データは、OLEOS研究からのデータとすることができる。例えば、ハンチントン病を示す少なくとも1つの目標を予測するためのモデル構築の場合、デジタルバイオマーカー特徴データは、HD OLE研究、ISIS 44319-CS2からのデータとすることができる。入力データは、少なくとも1つの能動的試験および/または少なくとも1つの受動的監視において決定されてもよい。例えば、入力データは、少なくとも1つの認知試験および/または少なくとも1つの手運動機能試験および/または少なくとも1つの運動性試験などの少なくとも1つのモバイル装置を使用するアクティブ試験で決定されてもよい。
【0115】
入力データは、目標データをさらに含むことができる。目標データは、予測する臨床値、特に被験者ごとに1つの臨床値を含む。目標データは、数値であってもカテゴリであってもよい。臨床値は、疾患の状態を直接的または間接的に指すことができる。
【0116】
処理ユニット112は、入力データから特徴を抽出するように構成されてもよい。特徴の抽出は、データ集約、データ削減、データ変換などのうちの1つ以上を含むことができる。処理ユニット112は、特徴をランク付けするように構成されることができる。例えば、特徴は、それらの関連性に関して、すなわち目標変数との相関に関してランク付けされてもよく、および/または特徴は、冗長性に関して、すなわち特徴間の相関に関してランク付けされてもよい。処理ユニット112は、最大関連性-最小冗長性技術を使用して特徴をランク付けするように構成されることができる。この方法は、関連性と冗長性との間のトレードオフを使用して全ての特徴をランク付けする。具体的には、特徴選択およびランク付けは、Ding C.、Peng H、「Minimum redundancy fweature selection from microarray gene expression data」、J Bioinform Comput Biol.2005年4月;3(2):185-205,PubMed PMID:15852500に記載されているように実行されることができる。特徴選択およびランク付けは、Dingらに記載された方法と比較して修正された方法を使用して実行されることができる。平均相関係数ではなく最大相関係数が使用されてもよく、加算変換が適用されてもよい。分析モデルとしての回帰モデルの場合、変換は、平均相関係数の値を5乗に上げることができる。分析モデルとしての分類モデルの場合、平均相関係数の値に10を乗算してもよい。
【0117】
機械学習システム110は、少なくとも1つのアルゴリズムを含む少なくとも1つの機械学習モデルを含む、少なくとも1つのモデルユニット116を含む。モデルユニット116は、複数の機械学習モデル、例えば、回帰モデルを構築するための異なる機械学習モデルおよび分類モデルを構築するための機械学習モデルを含むことができる。例えば、分析モデルは、回帰モデルであってもよく、機械学習モデルのアルゴリズムは、k最近傍(kNN);線形回帰;部分的最終二乗(PLS);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであってもよい。例えば、分析モデルは、分類モデルであってもよく、機械学習モデルのアルゴリズムは、k最近傍(kNN);サポートベクターマシン(SVM);線形判別分析(LDA);二次判別分析(QDA);ナイーブベイズ(NB);ランダムフォレスト(RF);および極ランダム化ツリー(XT)からなる群から選択される少なくとも1つのアルゴリズムであってもよい。
【0118】
処理ユニット112は、入力データを前処理するように構成されてもよい。前処理112は、入力データが少なくとも1つの品質基準を満たすための少なくとも1つのフィルタリングプロセスを含むことができる。例えば、入力データは、欠落変数を除去するためにフィルタリングされてもよい。例えば、前処理は、予め定義された最小観察数未満の被験者からのデータを除外することを含むことができる。
【0119】
処理ユニット112は、入力データセットから少なくとも1つの訓練データセットおよび少なくとも1つの試験データセットを決定するように構成されている。訓練データセットは、複数の訓練データセットを含むことができる。特に、訓練データセットは、入力データの被験者ごとの訓練データセットを含む。試験データセットは、複数の試験データセットを含むことができる。特に、試験データセットは、入力データの被験者ごとの試験データセットを含む。処理ユニット112は、被験者ごとに入力データの訓練データセットおよび試験データセットを生成および/または作成するように構成されることができ、被験者ごとの試験データセットは、その被験者のデータのみを含むことができ、その被験者の訓練データセットは、他の全ての入力データを含む。
【0120】
処理ユニット112は、各被験者について訓練データセットおよび試験データセットの双方に対して少なくとも1つのデータ集約および/またはデータ変換を実行するように構成されることができる。変換および特徴ランク付けステップは、訓練データセットおよび試験データセットに分割することなく実行されることができる。これは、例えばデータからの重要な特徴の干渉を可能にすることができる。処理ユニット112は、訓練データセットおよび試験データセットの、少なくとも1つの安定化変換;少なくとも1つの集約;少なくとも1つの正規化のうちの1つ以上のために構成されてもよい。例えば、処理ユニット112は、訓練データセットおよび試験データセットの双方の被験者ごとのデータ集約のために構成されてもよく、特徴の平均値は、被験者ごとに決定される。例えば、処理ユニット112は、分散安定化のために構成されてもよく、各特徴に対して、少なくとも1つの分散安定化関数が適用される。分散安定化関数は、全ての値が300よりも大きく且つ0と1との間の値がない場合に使用されることができるロジスティック;全ての値が0から1の間(両端を含む)である場合に使用されることができるロジット;シグモイド;全ての値>=0の場合に考慮される場合に使用されることができるlog 10からなる群から選択される少なくとも1つの関数とすることができる。処理ユニット112は、各分散変換関数を使用して各特徴の値を変換するように構成されることができる。処理ユニット112は、特定の基準を使用して、元の分布を含む結果として生じる分布のそれぞれを評価するように構成されることができる。分析モデルとしての分類モデルの場合、すなわち目標変数が離散的である場合、前記基準は、取得された値が異なるクラスをどの程度分離することができるかとすることができる。具体的には、この目的のために、全てのクラスごとの平均シルエット値の最大値が使用されることができる。分析モデルとしての回帰モデルの場合、基準は、分散安定化関数を適用して得られた値を目標変数に対して回帰した後に得られる平均絶対誤差とすることができる。この選択基準を使用して、処理ユニット112は、もしあれば元の値よりも良い、訓練データセット上の最良の可能な変換を決定するように構成されることができる。続いて、可能な限り最良の変換が試験データセットに適用されることができる。例えば、処理ユニット112は、zスコア変換のために構成されてもよく、変換された特徴ごとに、訓練データセット上で平均および標準偏差が決定され、これらの値は、訓練データセットと試験データセットの双方のzスコア変換に使用される。例えば、処理ユニット112は、訓練データセットおよび試験データセットの双方に対して3つのデータ変換ステップを実行するように構成されてもよく、変換ステップは、以下を含む:1.被験者別データ集約;2.分散安定化;3.zスコア変換。処理ユニット112は、ランク付けおよび変換ステップの少なくとも1つの出力を決定および/または提供するように構成されることができる。例えば、ランク付けおよび変換ステップの出力は、少なくとも1つの診断プロットを含むことができる。診断プロットは、ランク付け手順に関連する重要な統計を比較する少なくとも1つの主成分分析(PCA)プロットおよび/または少なくとも1つのペアプロットを含むことができる。
【0121】
処理ユニット112は、機械学習モデルを訓練データセットを用いて訓練することによって、分析モデルを決定するように構成されている。訓練は、少なくとも1つの最適化または調整プロセスを含むことができ、最良のパラメータの組み合わせが決定される。訓練は、異なる被験者の訓練データセットに対して反復的に実行されてもよい。処理ユニット112は、訓練データセットを用いて機械学習モデルを訓練することによって分析モデルを決定するために、異なる数の特徴を考慮するように構成されてもよい。機械学習モデルのアルゴリズムは、例えばそれらのランキングに応じて、異なる数の特徴を使用して訓練データセットに適用されることができる。訓練は、モデルパラメータのロバストな推定値を得るためのn倍交差検証を含むことができる。機械学習モデルの訓練は、少なくとも1つの制御された学習プロセスを含むことができ、少なくとも1つのハイパーパラメータが訓練プロセスを制御するために選択される。必要に応じて、ハイパーパラメータの異なる組み合わせを試験するために、訓練ステップが繰り返される。
【0122】
特に、機械学習モデルの訓練に続いて、処理ユニット112は、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されている。処理ユニット112は、決定された分析モデルを使用して、各被験者の試験データセットに基づいて、各被験者の目標変数を予測するように構成されることができる。処理ユニット112は、分析モデルを使用して、それぞれの訓練データセットおよび試験データセット上の各被験者について目標変数を予測するように構成されることができる。処理ユニット112は、例えば、少なくとも1つの出力ファイルに、被験者ごとの予測された目標変数と被験者ごとの目標変数の真値の双方を記録および/または記憶するように構成されることができる。
【0123】
処理ユニット112は、予測された目標変数と試験データセットの目標変数の真値に基づいて、決定された分析モデルの性能を決定するように構成されている。性能は、予測された目標変数と目標変数の真値との間の偏差によって特徴付けられることができる。機械学習システム110は、少なくとも1つの出力インターフェース118を備えることができる。出力インターフェース118は、通信インターフェース114と同一に設計されてもよく、および/または通信インターフェース114と一体に形成されてもよい。出力インターフェース118は、少なくとも1つの出力を提供するように構成されることができる。出力は、決定された分析モデルの性能に関する少なくとも1つの情報を含むことができる。決定された分析モデルの性能に関する情報は、少なくとも1つのスコアチャート、少なくとも1つの予測プロット、少なくとも1つの相関プロット、および少なくとも1つの残差プロットのうちの1つ以上を含むことができる。
【0124】
モデルユニット116は、複数の機械学習モデルを含むことができ、機械学習モデルは、それらのアルゴリズムによって区別される。例えば、回帰モデルを構築するために、モデルユニット116は、以下のアルゴリズムk最近傍(kNN)、線形回帰、部分的最終二乗(PLS)、ランダムフォレスト(RF)、および極ランダム化ツリー(XT)を含むことができる。例えば、分類モデルを構築するために、モデルユニット116は、以下のアルゴリズムk最近傍(kNN)、サポートベクターマシン(SVM)、線形判別分析(LDA)、二次判別分析(QDA)、ナイーブベイズ(NB)、ランダムフォレスト(RF)、および極ランダム化ツリー(XT)を含むことができる。処理ユニット112は、訓練データセットを用いてそれぞれの機械学習モデルを訓練することによって、機械学習モデルのそれぞれの分析モデルを決定し、決定された分析モデルを使用して試験データセット上の目標変数を予測するように構成されることができる。
【0125】
図2は、本発明にかかる方法の例示的な一連のステップを示している。参照符号120で示すステップa)では、入力データが通信インターフェース114を介して受信される。本方法は、参照符号122で示す入力データを前処理することを含む。上記で概説したように、前処理は、入力データが少なくとも1つの品質基準を満たすための少なくとも1つのフィルタリングプロセスを含むことができる。例えば、入力データは、欠落変数を除去するためにフィルタリングされてもよい。例えば、前処理は、予め定義された最小観察数未満の被験者からのデータを除外することを含むことができる。参照符号124で示されるステップb)では、訓練データセットおよび試験データセットは、処理ユニット112によって決定される。本方法は、各被験者について訓練データセットおよび試験データセットの双方に対して少なくとも1つのデータ集約および/またはデータ変換をさらに含むことができる。本方法は、少なくとも1つの特徴抽出をさらに含むことができる。データ集約および/またはデータ変換および特徴抽出のステップは、
図2において参照符号126で示されている。特徴抽出は、特徴のランク付けを含むことができる。参照符号128で示されるステップc)では、分析モデルは、訓練データセットを用いて少なくとも1つのアルゴリズムを含む機械学習モデルを訓練することによって、決定される。参照符号130で示されるステップd)では、決定された分析モデルを使用して試験データセット上で目標変数が予測される。参照符号132で示されるステップe)では、決定された分析モデルの性能は、予測された目標変数と試験データセットの目標変数の真値とに基づいて決定される。
【0126】
図3Aから
図3Cは、分析モデルの性能を評価するための相関プロットの実施形態を示している。
【0127】
図3Aは、多発性硬化症を示す総合障害度評価尺度値を予測するための分析モデル、特に回帰モデルの相関プロットを示している。入力データは、52人の被験者からのFloodlight POC研究からのデータであった。
【0128】
予想されるパイロット研究(FLOODLIGHT)では、多発性硬化症患者においてデジタル技術を使用して遠隔患者監視を行うことの実現可能性を評価した。試験集団は、以下の組み入れ基準および除外基準を使用することによって選択した。
【0129】
主要選択基準:
署名されたインフォームドコンセントフォーム
治験実施計画書を遵守できると治験責任医師が判断すること
年齢18歳以上55歳以下(両端含む)
改訂McDonald 2010基準にしたがって確認された、MSの確定診断を有すること
EDSSスコア0.0以上5.5以下(両端含む)
体重:45~110kg
妊娠可能な女性の場合:試験期間中に許容可能な避妊法を使用する旨の合意すること
【0130】
主要除外基準:
治験責任医師の裁量による重症患者および不安定患者
登録前の最後の12週間における投薬レジメンの変更または疾患修飾療法(DMT)の切り替え
妊娠中もしくは授乳中、または試験中に妊娠することを意図している。
【0131】
この研究の主な目的は、コンプライアンスレベル(%)として定量化されたスマートフォンおよびスマートウォッチに基づく評価への遵守を示し、満足度アンケートを使用して、スマートフォンおよびスマートウォッチの評価スケジュールに対する患者および健常対照からのフィードバック、ならびに日常活動への影響を得ることである。さらにまた、さらなる目的が対処され、特に、Floodlight試験を使用して行われた評価と従来のMS臨床転帰との間の関連が決定され、Floodlight測定が疾患活動性/進行のマーカーとして使用されることができ、経時的なMRIおよび臨床転帰の変化に関連するかどうかが確立され、Floodlight試験バッテリがMSを有する患者と有しない患者との間、およびMSを有する患者の表現型間で区別できるかどうかが決定された。
【0132】
能動的試験および受動的監視に加えて、以下の評価を各予定された診療所訪問で実施した。
・ SDMTの口頭バージョン
・ 運動機能および認知機能の疲労スケール(FSMC)
・ 時限25フィート歩行試験(T25-FW)
・ ベルグバランススケール(BBS)
・ 9孔ペグ試験(9HPT)
・ 患者健康アンケート(PHQ-9)
・ MSのみを有する患者:
・ 脳MRI(MSmetrix)
・ 総合障害度評価尺度(EDSS)
・ 患者決定疾患ステップ(PDDS)
・ MSIS-29のペンおよび紙バージョン
【0133】
診療所での試験を実施している間、患者および健常対照は、スマートフォンおよびスマートウォッチを携帯/装着して、診療所での測定とともにセンサデータを収集するように求められた。要約すると、研究の結果は、患者がスマートフォンおよびスマートウォッチベースの評価に非常に関与していることを示した。さらに、試験とベースラインで記録された診療所の臨床転帰測定との間には相関関係があり、これは、スマートフォンベースのFloodlight試験バッテリが現実世界のシナリオでMSを継続的に監視するための強力なツールになることを示唆している。さらに、歩行中およびUターン中のターン速度のスマートフォンに基づく測定は、EDSSと相関するように見えた。
【0134】
図3Aでは、本発明の方法を使用してモデル構築中に7つの試験からの合計889個の特徴を評価した。この予測に使用された試験は、被験者が所与の時間スパンにおいて可能な限り多くの記号を数字に一致させなければならない記号数字モダリティ試験(SDMT);被験者が親指と人差し指を使用して、所与の期間内に画面上に表示される可能な限り多くのトマトをつぶさなければならない、ピンチ試験;被験者がスクリーン上の形状をトレースしなければならない描画A形状試験;被験者が30秒間直立しなければならない立位バランス試験;被験者が短いスパンを歩いた後に180度ターンしなければならない5Uターン試験;被験者が2分間歩行しなければならない2分間歩行試験;最後に歩行の受動的監視であった。以下の表は、予測に使用された選択された特徴、特徴が導出された試験、特徴およびランク付けの簡単な説明を与える。
【0135】
【0136】
図3Aは、各分析モデルに含まれる特徴の数fの関数として、特にkNN、線形回帰、PLS、RF、およびXTについて左から右に、各回帰器タイプについて、予測された目標変数と真の目標変数との間のスピアマン相関係数r
sを示している。上段は、試験データセットに対して試験されたそれぞれの分析モデルの性能を示している。下段は、訓練データで試験されたそれぞれの分析モデルの性能を示している。下段の曲線は、訓練データ上の目標変数の予測から得られた「全て」および「平均」の結果を示している。「平均」は、被験者あたりの全ての観察の平均値に対する予測を指す。「全て」は、全ての個々の観測値に対する予測を指す。任意の機械学習モデルの性能を評価するために、試験データ(上段)からの結果はより信頼性が高いと考えられた。最良に機能する回帰モデルは、円および矢印で示される0.77のr
s値を有する、モデルに含まれる32個の特徴を有するRFであることが分かった。
【0137】
以下、試験のより詳細な説明を行う。試験は、典型的には、本明細書の他の箇所で指定されるようなモバイル装置などのデータ取得装置上にコンピュータ実装される。
【0138】
(1)歩行および姿勢の受動的監視のための試験:受動的監視
モバイル装置は、典型的には、活動の全てまたはサブセットの受動的監視からデータを実行または取得するように適合される。特に、受動的監視は、歩行の測定値、一般に日常ルーチンにおける移動量、日常ルーチンにおける移動のタイプ、日常生活における一般的な移動性、および移動行動の変化からなる群から選択される、1日または複数日または1週間または複数週間などの所定の窓の間に実行される1つ以上の活動の監視を含むものとする。
【0139】
関心のある典型的な受動的監視性能パラメータ:
a.歩行の頻度および/または速度;
b.起立/着席、静止およびバランスをとる量、能力および/または速度
c.一般的なモビリティの指標としての訪問位置の数;
d.移動行動の指標として訪問した場所の種類。
【0140】
(2)認知能力の試験:SDMT(eSDMTとも呼ばれる)
モバイル装置はまた、典型的には、コンピュータ実装の符号数字モダリティ試験(eSDMT)からデータを実行または取得するように適合される。試験の従来の紙のSDMTバージョンは、最大90秒で表示される120個のシンボルのシーケンスと、所定の順序で9個のシンボルおよび1から9までのそれぞれの一致する数字を有する参照キーの凡例(3つのバージョンが利用可能である)とからなる。スマートフォンベースのeSDMTは、患者が自己管理することを意図しており、一連のシンボル、典型的には同じ110個のシンボルのシーケンスと、文書/口頭バージョンのSDMTの参照キーの凡例、典型的には3個の参照キーの凡例の間のランダムな交替(次の試験を行う)とを使用する。eSDMTは、文書/口頭バージョンと同様に、90秒の時間などの所定の時間窓において、抽象記号と特定の数字とを対にする速度(正しい対の応答の数)を測定する。試験は、典型的には毎週行われるが、代わりに、より高い(例えば、毎日)またはより低い(例えば、隔週)頻度で行われてもよい。あるいは、試験は、110を超えるシンボルおよび参照キーの凡例のより多くのおよび/または進化的バージョンを包含することもできる。記号シーケンスはまた、ランダムに、または任意の他の修飾された予め指定されたシーケンスにしたがって管理されることができる。
【0141】
関心のある典型的なeSDMT性能パラメータ:
1.正しい応答回数
a.90秒間の全体的な正しい応答(CR)の総数(口頭/紙SDMTと同様)
b.時間0から30秒までの正しい応答回数(CR0-30)
c.時間30から60秒までの正しい応答回数(CR30-60)
d.時間60から90秒までの正しい応答回数(CR60-90)
e.時間0から45秒までの正しい応答回数(CR0-45)
f.時間45から90秒までの正しい応答回数(CR45-90)
g.時間iからj秒までの正しい応答の回数(CRi-j)であり、i、jは、1から90秒の間であり、i<jである。
【0142】
2.エラー回数
a.90秒間のエラー総数(E)
b.時間0から30秒までのエラー回数(E0-30)
c.時間30から60秒までのエラー回数(E30-60)
d.時間60から90秒までのエラー回数(E60-90)
e.時間0から45秒までのエラー回数(E0-45)
f.時間45から90秒までのエラー回数(E45-90)
g.時間iからj秒までのエラー回数(Ei-j)であり、i、jは、1から90秒の間であり、i<jである。
【0143】
3.応答回数
a.90秒間の全応答(R)の総数
b.時間0から30秒までの応答回数(R0-30)
c.時間30から60秒までの応答回数(R30-60)
d.時間60から90秒までの応答回数(R60-90)
e.時間0から45秒までの応答回数(R0-45)
f.時間45から90秒までの応答回数(R45-90)
【0144】
4.正解率
a.90秒間にわたる平均正解率(AR):AR=CR/R
b.時間0から30秒までの平均正解率(AR):AR0-30=CR0-30/R0-30
c.時間30から60秒までの平均正解率(AR):AR30-60=CR30-60/R30-60
d.時間60から90秒までの平均正解率(AR):AR60-90=CR60-90/R60-90
e.時間0から45秒までの平均正解率(AR):AR0-45=CR0-45/R0-45
f.時間45から90秒までの平均正解率(AR):AR45-90=CR45-90/R45-90
【0145】
5.タスク疲労度指数の終わり
a.過去30秒間の速度疲労度指数(SFI):SFI60-90=CR60-90/max(CR0-30,CR30-60)
b.過去45秒間のSFI:SFI45-90=CR45-90/CR0-45
c.過去30秒間の精度疲労度指数(AFI):AFI60-90=AR60-90/max(AR0-30,AR30-60)
d.最後の45秒間のAFI:AFI45-90=AR45-90/AR0-45
【0146】
6.連続する正しい応答の最長シーケンス
a.90秒以内の全体的に連続する正解応答(CCR)の最長シーケンス内の正しい応答回数
b.時間0から30秒までの連続する正しい応答の最長シーケンス内の正しい応答回数(CCR0-30)
c.時間30から60秒までの連続した正しい応答の最長シーケンス内の正しい応答回数(CCR30-60)
d.時間60から90秒までの連続する正しい応答の最長シーケンス内の正しい応答の数(CCR60-90)
e.時間0から45秒までの連続する正しい応答の最長シーケンス内の正しい応答の数(CCR0-45)
f.時間45から90秒までの連続する正しい応答の最長シーケンス内の正しい応答の数(CCR45-90)
【0147】
7.応答間の時間差
a.2つの連続応答間のギャップ(G)時間の連続可変分析
b.90秒間にわたる連続する2つの応答間で経過した最大ギャップ(GM)時間
c.時間0から30秒までの2つの連続する応答間に経過した最大ギャップ時間(GM0-30)
d.時間30から60秒までの2つの連続する応答間に経過した最大ギャップ時間(GM30-60)
e.時間60から90秒までの2つの連続する応答間に経過した最大ギャップ時間(GM60-90)
f.時間0から45秒までの2つの連続する応答間に経過した最大ギャップ時間(GM0-45)
g.時間45から90秒までの2つの連続する応答間に経過した最大ギャップ時間(GM45-90)
【0148】
8.正しい応答間時間差
a.連続する2つの正しい応答間のギャップ(Gc)時間の連続可変分析
b.90秒間にわたる連続する2つの正しい応答間に経過した最大ギャップ(GcM)時間
c.時間0から30秒までの連続する2つの正しい応答間で経過した最大ギャップ時間(GcM0-30)
d.時間30から60秒までの連続する2つの正しい応答間で経過した最大ギャップ時間(GcM30-60)
e.時間60から90秒までの連続する2つの正しい応答間で経過した最大ギャップ時間(GcM60-90)
f.時間0から45秒までの連続する2つの正しい応答間で経過した最大ギャップ時間(GcM0-45)
g.時間45から90秒までの連続する2つの正しい応答間で経過した最大ギャップ時間(GcM45-90)
【0149】
9.eSDMT中に捕捉された微細指運動技能関数パラメータ
a.90秒を超える応答を入力しながら、タッチスクリーン接触時間(Tts)、タッチスクリーン接触時間(Dts)と最も近い目標桁キーの中心との偏差、および、誤って入力されたタッチスクリーン接触時間(Mts)(つまり、キーヒットをトリガしないか、またはキーヒットをトリガするが、画面上の二次スライドを伴う接触時間)の連続可変分析
b.時間0から30秒までのエポック別の各変数:Tts0-30,Dts0-30,Mts0-30
c.時間30から60秒までのエポック別の各変数:Tts30-60,Dts30-60,Mts30-60
d.時間60から90秒までのエポック別の各変数:Tts60-90,Dts60-90,Mts60-90
e.時間0から45秒までのエポック別の各変数:Tts0-45,Dts0-45,Mts0-45
f.時間45から90秒までのエポック別の各変数:Tts45-90,Dts45-90,Mts45-90
【0150】
10.単一シンボルまたはシンボルのクラスタによる性能のシンボル固有分析
a.9つのシンボルのそれぞれの個別のCRおよびそれらの全ての可能なクラスタ化された組み合わせ
b.9つのシンボルのそれぞれの個別のARおよびそれらの全ての可能なクラスタ化された組み合わせ
c.9つのシンボルのそれぞれの個別に記録された応答およびそれらの全ての可能なクラスタ化された組み合わせに対する以前の応答からのギャップ時間(G)
d.9つのシンボルの誤った置換のタイプを個別に探索し、9桁の応答を個別に探索することによって優先的な不正確な応答を認識するためのパターン分析。
【0151】
11.学習および認知予備力分析
a.eSDMTの連続実施間のCR(全体的および#9に記載のシンボル特異的)におけるベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
b.eSDMTの連続実施間のAR(全体的および#9に記載のシンボル特異的)におけるベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
c.eSDMTの連続実施間の平均GおよびGM(全体および#9に記載のシンボル特異的)のベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
d.eSDMTの連続実施間の平均GcおよびGcM(全体および#9に記載のシンボル特異的)のベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
e.eSDMTの連続実施間のSFI60-90およびSFI45-90におけるベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
f.eSDMTの連続実施間のAFI60-90およびAFI45-90のベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
g.eSDMTの連続実施間のTtsのベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
h.eSDMTの連続実施間のDtsのベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化
i.eSDMTの連続実施間のMtsのベースライン(試験の最初の2回の実施からの平均性能として定義されるベースライン)からの変化。
【0152】
(3)能動的歩行および姿勢能力の試験:Uターン試験(5Uターン試験、5UTTとも表記する)および2MWT
歩行能力ならびに歩行および歩幅動態の測定のためのセンサベースの(例えば、加速度計、ジャイロスコープ、磁力計、全地球測位システム[GPS])およびコンピュータ実装試験、特に2分間歩行試験(2MWT)および5Uターン試験(5UTT)。
【0153】
一実施形態では、モバイル装置は、2分間歩行試験(2MWT)からデータを実行または取得するように適合される。この試験の目的は、2分間歩行試験(2MWT)で歩行特徴を捕捉することによって、長距離歩行における困難性、疲労性または異常なパターンを評価することである。データは、モバイル装置から取り込まれる。身体的障害の進行または新たな再発の場合、ストライドおよび歩幅の減少、ストライド期間の増加、歩幅期間および非対称性の増加、ならびに周期性の低いストライドおよび歩幅が観察されることができる。歩行中の腕のスイングの動的性も、モバイル装置を介して評価される。被験者は、「できるだけ速く、できるだけ長く2分間歩くが、安全に歩く」ように指示される。2MWTは、屋内または屋外で、患者がUターンなしで200メートル以上まっすぐ歩くことができることを確認した場所の平らな地面で行われる必要がある単純な試験である。被験者は、必要に応じて、通常の履物ならびに補助装置および/または矯正器具を着用することができる。試験は、典型的には毎日行われる。
【0154】
特定の目的の典型的な2MWT性能パラメータ:
1.歩行速度および痙縮の代用物:
a.例えば2分で検出された総ステップ数(ΣS)
b.2分以内に停止が検出された場合の総停止回数(ΣRs)
c.2MWT全体の歩行ステップ時間(WsT)の持続時間の連続可変分析
d.2MWT全体の歩行ステップ速度(WsV)(ステップ/秒)の連続可変分析
e.2MWT全体のステップ非対称率(あるステップから次のステップまでのステップ持続時間の平均差を平均ステップ持続時間で割ったもの):SAR=平均Δ(WsTx-WsTx+1)/(120/ΣS)
f.20秒の各エポックについて検出されたステップの総数(ΣSt,t+20)
g.20秒の各エポックにおける平均歩行ステップ時間:WsTt,t+20=20/ΣSt,t+20
h.20秒の各エポックでの平均歩行ステップ速度:WsVt,t+20=ΣSt,t+20/20
i.20秒の各エポックにおけるステップ非対称率:SARt,t+20=meanΔt,t+20(WsTx-WsTx+1)/(20/ΣSt,t+20)
j.生体力学的モデリングによる歩幅および総歩行距離
【0155】
2.歩行疲労度指数:
a.減速指数:DI=WsV100-120/max(WsV0-20,WsV20-40,WsV40-60)
b.非対称指数:AI=SAR100-120/min(SAR0-20,SAR20-40,SAR40-60)
【0156】
別の実施形態では、モバイル装置は、5Uターン試験(5UTT)からデータを実行または取得するように適合される。この試験の目的は、快適なペースで短距離を歩行しながらUターンを行う際の困難性または異常なパターンを評価することである。5UTTは、屋内または屋外で、患者が「安全に歩行し、数メートル離れた2つの地点間で前後に5回連続してUターンを行う」ように指示される均一な地面で行われる必要がある。このタスク中の歩行特徴データ(Uターン中のステップカウント、ステップ持続時間および非対称性の変化、Uターン持続時間、ターン速度およびUターン中の腕振りの変化)は、モバイル装置によって捕捉される。被験者は、必要に応じて、通常の履物ならびに補助装置および/または矯正器具を着用することができる。試験は、典型的には毎日行われる。
【0157】
関心のある典型的な5UTT性能パラメータ:
1.完全なUターンの開始から終了までに必要な平均ステップ数(ΣSu)
2.完全なUターンの開始から終了までに必要な平均時間(Tu)
3.平均歩行ステップ持続時間:Tsu=Tu/ΣSu
4.ターン方向(左/右)
5.ターン速度(度/秒)
【0158】
図3Bは、脊髄性筋萎縮症を示す強制肺活量(FVC)値を予測するための分析モデル、特に回帰モデルの相関プロットを示している。入力データは、14人の被験者からのOLEOS研究からのデータであった。本発明にかかる方法を使用してモデル構築中に、9つの試験からの合計1326個の特徴を評価した。以下の表は、予測に使用された選択された特徴、特徴が導出された試験、特徴およびランク付けの簡単な説明を与える。
【0159】
【0160】
図3Bは、各分析モデルに含まれる特徴の数fの関数として、特にkNN、線形回帰、PLS、RF、およびXTについて左から右に、各回帰器タイプについて、予測された目標変数と真の目標変数との間のスピアマン相関係数r
sを示している。上段は、試験データセットに対して試験されたそれぞれの分析モデルの性能を示している。下段は、訓練データで試験されたそれぞれの分析モデルの性能を示している。下段の曲線は、訓練データ上の目標変数の予測から得られた「全て」および「平均」の結果を示している。「平均」は、被験者あたりの全ての観察の平均値に対する予測を指す。「全て」は、全ての個々の観測値に対する予測を指す。任意の機械学習モデルの性能を評価するために、試験データ(上段)からの結果はより信頼性が高いと考えられた。最良に機能する回帰モデルは、円および矢印で示される0.8のr
s値を有する、モデルに含まれる10個の特徴を有するPLSであることが分かった。
【0161】
以下、試験のより詳細な説明を行う。試験は、典型的には、本明細書の他の箇所で指定されるようなモバイル装置などのデータ取得装置上にコンピュータ実装される。
【0162】
(1)中心運動機能の試験:形状描画試験および形状つぶし試験
モバイル装置は、指の器用さおよび遠位脱力感を測定するように構成された遠位運動機能のさらなる試験(いわゆる「形状描画試験」)を実行またはそこからデータを取得するようにさらに適合されることができる。かかる試験から獲得されるデータセットによって、指の動きの精度、圧力プロファイル、および速度プロファイルを特定することが可能になる。
【0163】
「形状描画」試験の目的は、微細指制御およびストロークシーケンシングを評価することである。この試験は、手の運動機能障害の以下の態様を網羅すると考えられる:振戦および痙縮ならびに手と目の協調障害。患者は、試験されない手でモバイル装置を保持し、モバイル装置のタッチ画面に、次第に複雑になる事前に書かれた6つの交互の形状(直線、長方形、円形、正弦曲線、および螺旋(以下参照))を、試験される手の中指で、例えば30秒の最大時間内で「できるだけ早く正確に」描くように指示される。形状を上手く描くためには、患者の指はタッチ画面上で継続的にスライドし、全ての示されたチェックポイントを通過し、書き込み経路の境界内に収まる示された始点および終点を接続しなければならない。患者は、6つの形状それぞれを上手く完成させるために最大2回の試行を有する。試験は右手と左手で交互に実施される。ユーザは毎日交互に行うように指示される。2つの直線形状はそれぞれ、特定の数「a」のチェックポイントを有して、すなわち「a-1」個のセグメントを接続する。正方形形状は、特定の数「b」のチェックポイントを有して、すなわち「b-1」個のセグメントを接続する。円形形状は、特定の数「c」のチェックポイントを有して、すなわち「c-1」個のセグメントを接続する。8字形状は、特定の数「d」のチェックポイントを有して、すなわち「d-1」個のセグメントを接続する。螺旋形状は、特定の数「e」のチェックポイントを有して、すなわち「e-1」個のセグメントを接続する。6つの形状が完成したということは、合計「(2a+b+c+d+e-6)」個のセグメントを描くのに成功したことを示唆する。
【0164】
関心のある形状試験性能パラメータの典型的な描画:
形状の複雑さに基づいて、直線および正方形形状は重み付け因子(Wf)1、円形および正弦曲線形状は重み付け因子2、螺旋形状は重み付け因子3と関連付けられる。2回目の試行で上手く完成した形状は、重み付け因子0.5と関連付けることができる。これらの重み付け因子は、本発明の文脈で変更することができる数値例である。
【0165】
1.形状完成性能スコア:
a.試験あたりの形状完了成功数(0から6)(ΣSh)
b.1回目の試行で正常に完了した形状の数(0から6)(ΣSh1)
c.2回目の試行で正常に完了した形状の数(0から6)(ΣSh2)
d.全ての試行で失敗した/未完了の形状の数(0から12)(ΣF)
e.上手く完成した形状の数を、それぞれの形状の異なる複雑さレベルに対する重み付け因子で調節したものを反映した、形状完成スコア(0から10)(Σ[Sh×Wf])
f.上手く完成した形状の数を、それぞれの形状の異なる複雑さレベルに対する、また1回目対2回目の試行における成功から成る重み付け因子で調節したものを反映した、形状完成スコア(0から10)(Σ[Sh1×Wf]+Σ[Sh2×Wf×0.5])
g.#1eで定義されるような形状完成スコア、また#1fは、30/tを掛けた場合の試験完成時の速度からなることができる(tは、試験を完了するまでの時間を秒単位で表す)。
h.特定の期間内の複数の試験に基づく6つの個々の形状ごとの全体的および1回目の試行完了率:(ΣSh1)/(ΣSh1+ΣSh2+ΣF)および(ΣSh1+ΣSh2)/(ΣSh1+ΣSh2+ΣF)。
【0166】
2.セグメント完了および性能スコア/測定:
(適用可能な場合、各形状に対する2回の試行のうち最良のもの[完成したセグメントの最大数]に基づいた分析)
a.試験あたりの成功裏に完了したセグメントの数(0から[2a+b+c+d+e-6])(ΣSe)
b.成功裏に完了したセグメントの平均迅速性([C]、セグメント/秒):C=ΣSe/t、ここで、tは、試験を完了するまでの秒単位の時間(最大30秒)を表す。
c.上手く完成したセグメントの数を、それぞれの形状の異なる複雑さレベルに対する重み付け因子で調節したものを反映した、セグメント完成スコア(Σ[Se×Wf])
d.速度調節し重み付けしたセグメント完成スコア(Σ[Se×Wf]×30/t)(tは、試験を完了するまでの時間を秒単位で表す)。
e.直線および正方形形状に対する形状特有の上手く完成したセグメントの数(ΣSeLS)
f.円形および正弦曲線形状に対する形状特有の上手く完成したセグメントの数(ΣSeCS)
g.螺旋形状に対する形状特有の上手く完成したセグメントの数(ΣSeS)
h.線形および正方形の試験で実施された成功裏に完成したセグメントの形状特異的平均線形許容度:CL=ΣSeLS/t、ここで、tは、これらの特定の形状内の対応する成功裏に完成したセグメントの開始点から終了点までの経過秒単位の累積エポック時間を表す。
i.円形および正弦曲線形状試験で実施された成功裏に完成したセグメントの形状特異的平均円形度:CC=ΣSeCS/t、ここで、tは、これらの特定の形状内の対応する成功裏に完成したセグメントの開始点から終了点までの経過秒単位の累積エポック時間を表す。
j.螺旋形状試験で実施され、成功裏に完成したセグメントの形状特異的平均螺旋面積:CS=ΣSeS/t、ここで、tは、この特定の形状内の対応する成功裏に完成したセグメントの開始点から終了点までの経過秒単位の累積エポック時間を表す。
【0167】
3.描画精度性能スコア/測定:
(適用可能な場合、各形状に対する2回の試行のうち最良のもの[完成したセグメントの最大数]に基づいた分析)
a.特定の形状内の(開始チェックポイントから到達した終了チェックポイントまで)対応する標的経路の合計累積長さで割った、これらの形状それぞれに伸ばされた開始チェックポイントから終了チェックポイントまでの、描かれた軌道と標的の描画経路との間の統合された表面偏差における、曲線下面積(AUC)全体の指標の合計として計算した偏差(Dev)。
b.#3aでDevとして計算した、ただし具体的には直線および正方形形状試験結果からの、直線偏差(DevL)
c.#3aでDevとして計算した、ただし具体的には円形および正弦曲線形状試験結果からの、円形偏差(DevC)
d.#3aでDevとして計算した、ただし、具体的には螺旋形状試験結果からの、螺旋偏差(DevS)
e.#3aでDevとして計算した、ただし6個の個別の形状試験結果それぞれからの、最良の試行の中で少なくとも3つのセグメントが上手く完成した形状のみに適用可能な、形状特有の偏差(Dev1-6)
f.形状特有のまたは形状にとらわれない目標軌道からの全体偏差を計算する他の任意の方法の連続可変分析
【0168】
4.)圧力プロファイル測定
i)掛けられる平均押圧
ii)圧力の標準偏差として計算される偏差(Dev)
【0169】
遠位運動機能(いわゆる「形状つぶし試験」)は、指の器用さおよび遠位脱力を測定することができる。かかる試験から取得されるデータセットは、指の動きの精度と速度、および関連する圧力プロファイルを特定することを可能にする。この試験は、まず被験者の移動精度能力に対する較正を必要とする場合がある。
【0170】
形状つぶし試験の目的は、ピンチ閉鎖指運動の精度を評価することによって、微細な遠位運動操作(把持および掴持)ならびに制御を評価することである。試験は、把持/掴持機能の障害、筋力低下、および手と目の協調運動障害といった、障害がある手の運動機能の態様を網羅するものとみなされる。患者は、試験されない手でモバイル装置を保持し、同じ手の2つの指(親指+中指、または好ましくは親指+薬指)で画面に触れることによって、30秒の間にできるだけ多くの丸い形状(すなわち、トマト)をつぶす/摘まむように指示される。損なわれた微細な運動操作は、性能に影響を及ぼす。試験は、右手と左手で交互に実施される。ユーザは、毎日交互に行うように指示される。
【0171】
関心のある典型的な形状つぶし試験性能パラメータ:
1.つぶした形状の数
a.30秒間につぶしたトマト形状の総数(ΣSh)
b.最初の試行(ΣSh1)で30秒間につぶしたトマトの総数(最初の試行は、試験の真に最初の試行ではない場合、うまくつぶした後の画面上の最初の二重接触として検出される)
【0172】
2.ピンチ動作の精度指標:
a.試験の全期間内の(別個に検出された二重指接触の総数として測定される)ピンチ(ΣP)試行の総数で割ったΣShとして定義されるピンチ成功率(PSR)。
b.検出された全ての二重接触に関して第1および第2の指による画面タッチの間の遅れ時間として測定される、ダブルタッチの非同期性(DTA)。
c.検出された全ての二重接触に関して、二重接触における2つの指の開始タッチ地点の間における等距離の地点から、トマト形状の中心まで距離として測定される、ピンチする目標の精度(PTP)。
d.ピンチ動作に成功する全ての二重接触に関して、ピンチのギャップに達するまで二重接触の開始地点から2つの指がスライドするそれぞれの距離の間の比(最短/最長)として測定される、ピンチする指の動きの非対称性(PFMA)。
e.ピンチ動作に成功する全ての二重接触に関して、二重接触の時間からピンチのギャップに到達するまで画面上をスライドする一方および/または双方の指それぞれの速度(mm/秒)として測定される、ピンチする指の速度(PFV)。
f.ピンチ動作に成功する全ての二重接触に関して、二重接触の時間からピンチのギャップに達するまで画面上をスライドする個々の指それぞれの速度間の比(最低速/最高速)として測定される、ピンチする指の非同期性(PFA)。
g.時間に伴う2aから2fの連続可変分析、ならびに可変持続時間(5~15秒)のエポックによるそれらの分析。
h.全ての試験される形状に関する、目標の描かれた軌道からの偏差を統合測定する連続可変分析(特に螺旋および正方形)
【0173】
3.)圧力プロファイル測定
i)掛けられる平均押圧
ii)圧力の標準偏差として計算される偏差(Dev)
【0174】
より典型的には、形状つぶし試験および形状描画試験は、本発明の方法にしたがって実施される。さらにより具体的には、以下の表1に列挙される性能パラメータが決定される。
【0175】
データ取得装置は、発声能力を測定することによって近位の中央運動機能を測定するように構成された中央運動機能のためのさらなる試験(いわゆる「音声試験」)を実行またはそこからデータを取得するようにさらに適合されることができる。
【0176】
(2)モンスター応援試験、音声試験:
本明細書で使用される「モンスター応援試験」という用語は、持続性発声の試験に関し、これは、実施形態では、腹部および胸部の障害に対処するための呼吸機能評価の代理試験であり、実施形態では、筋疲労、中枢性緊張低下および/または換気問題の指標として音声ピッチ変動を含む。実施形態では、モンスター応援は、「あー」音の制御された発声を持続する参加者の能力を測定する。試験は、適切なセンサを使用して参加者の発声、実施形態ではマイクロフォンなどのボイスレコーダを捕捉する。
【0177】
実施形態では、被験者によって実行されるべきタスクは以下のとおりである:モンスター応援は、参加者が、モンスターが自分の目標に向かって走る速度を制御することを必要とする。モンスターは、30秒でできるだけ遠くまで走ろうとしている。被験者は、できるだけ長い間、できるだけ大きな「あー」音を出すように求められる。音声の音量が決定され、キャラクタの走行速度を調整するために使用される。ゲーム時間は30秒であるため、必要に応じて複数回の「あー」音を使用してゲームを完了することができる。
【0178】
(3)モンスタータップ試験:
本明細書で使用される「モンスタータップ試験」という用語は、MFM D3(Berard Cら(2005)、Neuromuscular Disorders 15:463)にしたがって遠位運動機能の評価のために設計された試験に関する。実施形態では、試験は、器用さ、遠位の弱点/強度、およびパワーを評価する、MFM試験17(10枚のコインを取る)、18(指でCDの縁を一周する)、19(鉛筆を取ってループを引く)、および22(図面に指を置く)に特に固定される。ゲームは、参加者の器用さおよび移動速度を測定する。実施形態では、被験者によって実行されるべきタスクは以下のとおりである:7つの異なるスクリーン位置でランダムに現れるモンスターに被験者がタップする。
【0179】
図3Cは、ハンチントン病を示す総運動スコア(TMS)値を予測するための分析モデル、特に回帰モデルの相関プロットを示している。入力データは、46人の被験者からのHD OLE研究、ISIS 44319-CS2からのデータであった。ISIS 443139-CS2試験は、試験ISIS 443139-CS1に参加した患者のオープンラベル拡張(OLE)である。試験ISIS 443139-CS1は、包括的に25~65歳の早期発症HDを有する46人の患者における複数漸増用量(MAD)研究であった。合計で43個の特徴を、本発明にかかる方法を使用してモデル構築中に評価した1つの試験である描画A形状試験(上記参照)から評価した。以下の表は、予測に使用された選択された特徴、特徴が導出された試験、特徴およびランク付けの簡単な説明を与える。
【0180】
【0181】
図3Cは、各分析モデルに含まれる特徴の数fの関数として、特にkNN、線形回帰、PLS、RF、およびXTについて左から右に、各回帰器タイプについて、予測された目標変数と真の目標変数との間のスピアマン相関係数r
sを示している。上段は、試験データセットに対して試験されたそれぞれの分析モデルの性能を示している。下段は、訓練データで試験されたそれぞれの分析モデルの性能を示している。下段の曲線は、下段の「全て」および「平均」の結果を示しており、訓練データ上で目標変数を予測した結果である。「平均」は、被験者あたりの全ての観察の平均値に対する予測を指す。「全て」は、全ての個々の観測値に対する予測を指す。任意の機械学習モデルの性能を評価するために、試験データ(上段)からの結果はより信頼性が高いと考えられた。最良に機能する回帰モデルは、円および矢印で示される0.65のr
s値を有する、モデルに含まれる4個の特徴を有するPLSであることが分かった。
【符号の説明】
【0182】
110 機械学習システム
112 処理ユニット
114 通信インターフェース
116 モデルユニット
118 出力インターフェース
120 ステップa)
122 前処理
124 ステップb)
126 変換および特徴抽出
128 ステップc)
130 ステップd)
132 ステップe)
【国際調査報告】