IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイ2ディーエックス インコーポレイテッドの特許一覧

特開2023-103221治療標的特定のためのインテリジェントシステム及び方法
<>
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図1
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図2
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図3
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図4
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図5
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図6
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図7
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図8
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図9
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図10
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図11
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図12
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図13
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図14
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図15
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図16
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図17
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図18
  • 特開-治療標的特定のためのインテリジェントシステム及び方法 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023103221
(43)【公開日】2023-07-26
(54)【発明の名称】治療標的特定のためのインテリジェントシステム及び方法
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20230719BHJP
   C12N 15/11 20060101ALI20230719BHJP
   C12Q 1/06 20060101ALI20230719BHJP
   C12Q 1/6827 20180101ALI20230719BHJP
【FI】
C12Q1/68
C12N15/11 Z
C12Q1/06
C12Q1/6827 Z
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2023064109
(22)【出願日】2023-04-11
(62)【分割の表示】P 2021523395の分割
【原出願日】2019-10-31
(31)【優先権主張番号】62/754,481
(32)【優先日】2018-11-01
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TENSORFLOW
2.MATLAB
(71)【出願人】
【識別番号】515259030
【氏名又は名称】アイ2ディーエックス インコーポレイテッド
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】リデイ ヤノス
(72)【発明者】
【氏名】ミクノ アーサー
(57)【要約】      (修正有)
【課題】新規な治療標的特定のための、神経変性及び他の中枢神経系(CNS)疾患における疾患の遺伝的ドライバを明らかにする、システム及びコンピュータに実装された方法を提供する。
【解決手段】方法は、第1の統合された定量的な「深層」イメージング表現型から開始でき、これは、所定の時点(断面的)での疾患を正確に反映し、候補の一塩基多型(SNP)及び/又は遺伝子を返す。候補SNP/遺伝子は、第2の機械学習及び/又は人工知能(AI)ベースの画像解析操作を用いて臨床応答を評価することによりさらに検証され、遺伝子発現プロファイリングと経路マッピングを含む標的妥当性解析とを含み得る。候補SNP/遺伝子のセットを構築して、追加の検証ステップとして機能する、前述のSNP/遺伝子から深層学習モデルを用いて第1のイメージング表現型を正確に予測し得る。
【選択図】図1
【特許請求の範囲】
【請求項1】
状態の遺伝的バイオマーカを特定するための、コンピュータに実装された方法であって、以下を含む方法:
対象の状態について、当該状態を有する複数の対象のために、表現型の画像の定量的画像解析を実行して、第1の正確な定量的表現型を得ること;
前記複数の対象又は複数の異なる対象の、各対象について、定量的ゲノム解析を実行すること;
前記定量的画像解析及び前記定量的ゲノム解析から、前記複数の対象における前記状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;
前記少なくとも1つの候補遺伝子バイオマーカを検証するために、当該少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測すること;
前記少なくとも1つの候補遺伝子バイオマーカに基づき、前記状態についての少なくとも1つの治療標的を特定すること、ここで、前記状態についての前記少なくとも1つの治療標的は、前記少なくとも1つの候補遺伝子バイオマーカと生物学的に関連している;及び、
前記状態について特定された少なくとも1つの治療標的を含むレポートを生成すること。
【請求項2】
請求項1に記載のコンピュータに実装された方法において、
定量的ゲノム解析を実行することは、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行することを含む、方法。
【請求項3】
請求項1に記載のコンピュータに実装された方法において、
前記少なくとも1つの候補遺伝子バイオマーカを検証するために、前記少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測することにより、検証メトリック(a
validation metric)を決定することをさらに含む、方法。
【請求項4】
請求項3に記載のコンピュータに実装された方法において、
前記臨床応答の予測は、前記少なくとも1つの遺伝的バイオマーカに関連する少なくとも1つの生物学的経路を調節するために実行する、方法。
【請求項5】
請求項4に記載のコンピュータに実装された方法において、
予測される前記臨床応答は、前記少なくとも1つの遺伝的バイオマーカに関連する生物学的経路の少なくとも1つの生物学的に活性なタンパク質を阻害するために実行する、方法。
【請求項6】
請求項1に記載のコンピュータに実装された方法において、以下のうちの少なくとも1つをさらに含む、方法:
前記対象の前記表現型の前記画像を得ること、ここで、当該画像は、所定の時点での状態を正確に示す;
定量的表現型について約85%又はそれより高い表現型精度を得ること;
前記対象の前記表現型の前記画像から前記状態として疾患を検出すること;
疾患スペクトルの各所で疾患活動を定義すること;又は、
前記対象の前記表現型の前記画像を用いて標準化取込値比(SUVR)解析を実行すること。
【請求項7】
請求項1に記載のコンピュータに実装された方法において、
前記表現型の前記画像の前記定量的画像解析を実行することは、以下のうちの少なくとも1つを含む、方法:
前記画像からボクセルベースのアミロイド標準化取込値比(SUVR)を計算すること;
前記画像からボクセルベースのドーパミントランスポータ単一光子放射型断層撮影(DAT-SPECT)定量を計算すること;
前記画像からボクセルベースのα-シヌクレインリガンド結合を計算すること;又は、
前記画像から局所的セロトニン受容体リガンド結合を計算すること。
【請求項8】
請求項1に記載のコンピュータに実装された方法において、
前記画像は、陽電子放射断層撮影法(PET)、磁気共鳴画像法(MRI)、単一光子放射型断層撮影法(SPECT)及びそれらの組み合わせから選択される、方法。
【請求項9】
請求項3に記載のコンピュータに実装された方法において、
前記臨床応答を予測することは、以下のうちの少なくとも1つを含む、方法:
遺伝子型の定量化により、海馬マスクされた(hippocampus-masked)ボクセルベースのタウSUVRを実行すること;
海馬を用いた遺伝子型の定量化によるボクセルベースのタウSUVRによる記憶追跡の決定を実行すること;
海馬内でボクセルベースのタウ定量化を実行すること;
臨床応答を追跡するタウ画像解析を実行すること;又は、
臨床応答追跡測定を実行すること。
【請求項10】
請求項3に記載のコンピュータに実装された方法において、
前記臨床応答を予測することは、以下のうちの少なくとも1つを含む、方法:
振戦の定量化を実行すること;又は、
自動化された振戦の定量化を実行すること、
ここで、振戦の定量化は、任意選択で遺伝子型による。
【請求項11】
請求項3に記載のコンピュータに実装された方法において、
前記臨床応答を予測することは、画像からボクセルベースのセロトニン受容体リガンド結合を計算することを含む、方法。
【請求項12】
請求項1に記載のコンピュータに実装された方法において、
前記状態についての前記少なくとも1つの候補遺伝子バイオマーカに基づき遺伝子型から表現型の予測を実行することをさらに含む、方法。
【請求項13】
請求項12に記載のコンピュータに実装された方法において、
前記表現型の予測は、以下のうちの少なくとも1つを含む、方法:
一塩基多型(SNP)モデルからの深層学習による表現型の予測;
陽電子放射断層撮影(PET)画像による定量的表現型の解析;
深層学習SNPモデルによりボクセルベースのアミロイドSUVRを予測すること;
深層学習SNPモデルによりボクセルベースのDAT-SPECT定量を予測すること;
深層学習SNPモデルによりボクセルベースのα-シヌクレインリガンド結合を予測すること;又は、
深層学習SNPモデルにより局所的セロトニン受容体リガンド結合を予測すること。
【請求項14】
請求項1に記載のコンピュータに実装された方法において、
以下のうちの少なくとも1つを含む、方法:
前記レポートに前記少なくとも1つの候補遺伝子バイオマーカを載せること;
前記少なくとも1つの候補遺伝子バイオマーカを有する生物学的経路を解析すること;
又は、
前記少なくとも1つの候補遺伝子バイオマーカを、前記状態に関連する生物学的経路と比較すること。
【請求項15】
請求項1に記載のコンピュータに実装された方法において、
前記状態は以下である、方法:
前記対象において互いに相関する1組の医学的兆候及び症状を有する症候群;
前記対象の外的又は内的要因に対して病態生理学的応答を示す疾患;又は、
前記対象の正常な身体構造及び/又は機能に混乱をもたらす障害。
【請求項16】
請求項15に記載のコンピュータに実装された方法において、
前記状態は、アルツハイマー病、パーキンソン病及び大うつ病性障害(MDD)から選択される、方法。
【請求項17】
状態の遺伝的バイオマーカを特定するためのシステムであって、
以下を含む、システム:
深層表現型決定ユニット;
前記深層表現型決定ユニットの下流にあるQTL GWAS解析ユニット;及び、
前記QTL GWAS解析ユニットの下流にある臨床応答検証ユニット。
【請求項18】
請求項17に記載のシステムにおいて、
前記システムのコンポーネントは、以下のうちの1つ又は複数によって構成された、システム:
前記深層表現型決定ユニットは、以下のうちの少なくとも1つを実行するように構成されている:
正確な定量的表現型の解析を実行すること;
PET及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算すること;
SPECT及びT1 MRI画像からボクセルベースのDAT-SPECT定量を計算すること;
PET及びT1 MRI画像からボクセルベースのα-シヌクレインリガンド結合を計算すること;又は、
PET及びT1 MRI画像から局所的セロトニン受容体リガンド結合を計算すること;
前記QTL GWAS解析ユニットは、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行するために構成されている;及び、
前記臨床応答検証ユニットは、以下のうちの少なくとも1つを実行するように構成されている:
前記少なくとも1つの候補遺伝子バイオマーカを検証するために、前記少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測すること;
海馬マスクされたボクセルベースのタウSUVRを、遺伝子型で比較すること;
振戦の定量化を遺伝子型で比較すること;又は、
ボクセルベースのセロトニン受容体リガンド結合を、PET及びT1 MRI画像を用いて計算すること。
【請求項19】
請求項18に記載のシステムにおいて、
以下のうちの少なくとも1つをさらに含む、システム:
自動化された又は自動化されていない、遺伝子発現プロファイリングを実行するために構成された遺伝子発現解析ユニット;
前記遺伝子発現解析ユニットにより特定された遺伝子の1つ又は複数の生物学的経路を
マッピングするために構成された経路マッピングユニット;
深層学習モデルを用いて、前記深層表現型決定ユニットにより特定される表現型を予測するように、又は新しい状態の新しい調査のために新しい表現型を予測するように、構成された表現型予測ユニット;
任意選択で前記深層表現型決定ユニットとともに用いられ、表現型のパターン又は傾向を決定するように構成された、パターン及び/又は傾向解析ユニット;
方法のあらゆるデータ又はメトリックの統計解析を実行するように構成された統計解析ユニット;
テキストマイニングにより治療標的の妥当性を決定するように、及び/又は、前記治療標的に関連する生物学的経路の生物学的実体の化学的モジュレータを決定するように、構成された、テキストマイニング妥当性解析ユニット;
前記治療標的を調節できる新規化学物質(NCE)を設計又は生成するように構成された、新規化学物質(NCE)予測ユニット;又は、
レポートユニットは、レポートを生成するように構成されている。
【請求項20】
アミロイド陽性又は初期アルツハイマー病を検出するための、人工ニューラルネットワークを訓練する、コンピュータに実装された方法であって、以下を含む、方法:
データベースから、対応する陽電子放射断層撮影(PET)画像、磁気共鳴画像法(MRI)の画像及び対応する遺伝子型データのセットを収集すること;
前記PET画像及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算して、初期アルツハイマー病の正確な定量的表現型を得ること;
前記定量的表現型及び対応する遺伝子型データを含む、訓練セットを作成すること;及び、
前記訓練セットを用いて、遺伝子型データから前記定量的表現型を予測するように、人工ニューラルネットワークの訓練を実行すること。
【請求項21】
請求項20に記載のコンピュータに実装された方法において、
前記人工ニューラルネットワークは、少なくとも、SNP id 1-32のサブセット、及び任意選択で前記定量的表現型を予測するためのSNP id 33を含む、遺伝子型データを用いて訓練された、方法:
ID Chr SNP A1 A2
1 1 rs4912453 T C
2 1 rs12120406 G A
3 1 rs11161719 C T
4 1 rs6576798 C T
5 3 rs2030515 G A
6 4 rs4689137 G C
7 4 rs10007765 C G
8 4 rs10029820 G A
9 6 rs9458512 A G
10 7 rs1001029 A G
11 7 rs1001026 A G
12 7 rs13222318 C T
13 7 rs62444137 A G
14 7 rs17680408 A G
15 7 rs10234008 T C
16 7 rs917321 T C
17 7 rs993900 A G
18 14 rs8009420 A C
19 14 rs213563 A G
20 15 rs7164265 C T
21 15 rs1551466 C G
22 15 rs12916234 A C
23 15 rs9920618 C T
24 16 rs8056050 C T
25 18 rs4891826 G T
26 19 rs71352238 C T
27 19 rs2075650 G A
28 19 rs157582 A G
29 19 rs769449 A G
30 19 rs56131196 A G
31 19 rs4420638 G A
32 19 rs17815373 A G
33 16 rs4402561 C T。
【請求項22】
以下を含む、コンピュータに実装された方法:
PET及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算すること;
量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること;
定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;
海馬マスクされたボクセルベースのタウSUVRを遺伝子型で比較すること;
深層学習SNPモデルによりボクセルベースのアミロイドSUVRを予測すること;及び、
予測された前記ボクセルベースのアミロイドSUVRを含むレポートを生成すること。
【発明の詳細な説明】
【背景技術】
【0001】
神経変性及び他の中枢神経系(CNS)疾患は、治療法開発のための新しい標的を必要としており、それは特にこの分野が症候性アプローチから疾患の修正及び予防に向けて移行しているからである。アルツハイマー病(AD)では、今日までのほぼすべての臨床試験が失敗したため、疾患の新しい遺伝的ドライバを発見して標的にすることは、大きな関心が持たれている。
【0002】
人工知能(AI)及び機械学習ベースのアプローチは、医薬の発見及び開発を支援し効率を向上させるために台頭してきている。産業は、例えば、医薬の発見及び開発に深層学習を適用することにより、電子健康記録(EHR)データなどの「ビッグデータ」ソースを活用しようとしている。しかし、このような「ビッグデータ」ソースの品質は様々である。さらに、AIによって行われた予測は、説明が難しい及び/又は誤っている場合がある。したがって、検出されたパターン及び行われた予測が透明性があり妥当である、いわゆるxAI(説明可能なAI)に向かう傾向がある。「優れた」(例えば、クリーンな)データソースを入手するのはさらに困難であり、実用性を実現するには「少数ショット学習」アプローチが必要である;これは、数千又は数百万の訓練の機会を必要とすることもある特定の深層学習アプローチとはまったく対照的である。少数ショット学習システムは、訓練の機会がはるかに少なく、幼児がどのように新しいタスクを学習するかということと関連付けられてきた。
【0003】
このように、限られたデータソースから情報を抽出して、バイオ医薬の研究及び開発を支援し、中枢神経系疾患及びそれ以外の疾患の新規な遺伝的ドライバを解読できる、透明性が高くインテリジェントなシステムに対する満たされていないニーズがある。
【発明の概要】
【0004】
本開示は、限られた量のヒトのデータから、新規な治療標的特定のための、神経変性及び他の中枢神経系(CNS)疾患における、疾患の遺伝的ドライバを明らかにする、システム及びコンピュータに実装された方法を開示する。一実施形態の一態様によれば、本開示は、第1の統合された定量的な「深層」イメージング表現型から開始する方法を開示し、これは、所定の時点(断面的)での疾患を正確に反映し、候補の一塩基多型(SNP)及び/又は遺伝子を返す。候補SNP/遺伝子は、少なくとも部分的に第2の機械学習及び/又は人工知能(AI)ベースの画像解析操作を用いて臨床応答を評価し、さらに続き得る遺伝子発現プロファイリングと経路マッピングを含む標的妥当性解析とによってさらに検証される。候補SNP/遺伝子のセットを構築して、追加の検証ステップとして機能する、前述のSNP/遺伝子からの深層学習モデルを用いて第1のイメージング表現型を正確に予測できる。
【0005】
本開示の例示的な実施形態は、わずか数百のサンプルで治療標的を発見し、さらに数千のサンプルを必要とする他の遺伝子発見/リスク予測アプローチと同等の性能を達成するための、アルツハイマー病の研究におけるコンピュータ技術又は使用を提供する。
【0006】
ここで、いくつかの実施形態は、画像遺伝学及びAIの分野で改善を提供し、一実施形態では、前記コンピュータに実装された方法は、前記第1の統合された定量的な「深層」イメージング表現型から開始し、これは、単一の測定で所定の時点(断面的)での疾患を正確に反映し、例えば、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行することにより、候補の一塩基多型(SNP)及び/又は遺伝子を返す。
【0007】
今日までの他のQTL GWASアプローチは、例えば、カルテ又はEHRに通常見られる定量的測定を利用してきた。従来のアプローチで用いられた定量的測定の例は、ノイズが多く離散的な認知テスト結果、又は全体的なアミロイドの測定、又はおそらくタウ陽性状態(例えば、脳脊髄液(CSF)によるもの)を含み得る。これらの従来のアプローチは、他の制限の中でも、とりわけ、例えば初期の疾患段階からのADへの転換の、予測の正確さの欠如のために、せいぜい限られた成功しか収めていない。QTL GWAS解析とは対照的に、症例対照解析は、ADの「症例」を構成するものに関する不確実性によって複雑となり得るが、これには、これらの症例対照解析が非公式の家族歴情報に依存する場合があることなど、多くの理由がある。標的発見のためのより新しいがまだ制限されたアプローチは、脳バンクサンプルの凝集、及び、例えばRNAシーケンシングトランスクリプトミクスによる、その解析である。脳バンクデータは標的検証(確認)の貴重な情報源であり得るが、その一方で、サンプル準備と死亡後のサンプル捕捉の時間とによるノイズあり得るので、ADにおける意味のある新規な治療標的を、それ自体で明らかにすることはまだできていない。
【0008】
これら及び他の従来のアプローチとは対照的に、陽電子放射断層撮影法(PET)及び磁気共鳴画像法(MRI)のボクセルベースの定量化などの、分子マルチモーダルイメージングは、局所的な空間情報を符号化し、インビボでの分子イベントを捕捉できるので、より適している。
【0009】
いくつかの実施形態では、状態の遺伝的バイオマーカを特定するための、コンピュータに実装された方法は、以下を含み得る:対象の状態について、当該状態を有する複数の対象のために、表現型の画像の定量的画像解析を実行して、第1の正確な定量的表現型を得ること;複数の対象又は複数の異なる対象の、各対象について、定量的ゲノム解析を実行すること;定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;少なくとも1つの候補遺伝子バイオマーカを検証するために、少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測すること;少なくとも1つの候補遺伝子バイオマーカに基づき、状態についての少なくとも1つの治療標的を特定すること、ここで、状態についての少なくとも1つの治療標的は、少なくとも1つの候補遺伝子バイオマーカと生物学的に関連している;及び、状態についての特定された少なくとも1つの治療標的を含むレポートを生成する。いくつかの態様では、定量的ゲノム解析を実行することは、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行することを含む。
【0010】
いくつかの実施形態では、本方法は、少なくとも1つの候補遺伝子バイオマーカを検証するために、少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測することにより、検証メトリックを決定すること含み得る。いくつかの態様では、臨床応答の予測は、少なくとも1つの遺伝的バイオマーカに関連する少なくとも1つの生物学的経路を調節するために実行する。いくつかの態様では、予測される臨床応答は、少なくとも1つの遺伝的バイオマーカに関連する生物学的経路の少なくとも1つの生物学的に活性なタンパク質を阻害するために実行する。
【0011】
いくつかの実施形態では、本方法は、以下のうちの少なくとも1つを含み得る:対象の表現型の画像を得ること、ここで、画像は、所定の時点での状態を正確に示す;定量的表現型について約85%又は85%超えの表現型の精度を得ること;対象の表現型の画像から状態として疾患を検出すること;疾患スペクトルの各所で疾患活動を定義する;又は、対象の表現型の画像を用いて標準化取込値比(SUVR)解析を実行すること。
【0012】
いくつかの実施形態では、表現型の画像の定量的画像解析を実行することは、以下のうちの少なくとも1つを含む:画像からボクセルベースのアミロイド標準化取込値比(SU
VR)を計算すること;画像からボクセルベースのドーパミントランスポータ単一光子放射型断層撮影(DAT-SPECT)定量を計算すること;画像からボクセルベースのα-シヌクレインリガンド結合を計算すること;又は、画像から局所的セロトニン受容体リガンド結合を計算すること。
【0013】
いくつかの実施形態では、画像は、陽電子放射断層撮影法(PET)及び磁気共鳴画像法(MRI)、単一光子放射型断層撮影法(SPECT)及びそれらの組み合わせから選択される。
【0014】
いくつかの実施形態では、臨床応答を予測することは、以下のうちの少なくとも1つを含む:遺伝子型の定量化により、海馬マスクされたボクセルベースのタウSUVRを実行すること;海馬を用いた遺伝子型の定量化によるボクセルベースのタウSUVRによる記憶追跡の決定を実行すること;海馬内でボクセルベースのタウ定量化を実行すること;臨床応答を追跡するタウ画像解析を実行すること;又は、臨床応答追跡測定を実行すること。いくつかの態様では、臨床応答を予測することは、以下のうちの少なくとも1つを含む:振戦の定量化を実行すること;又は、自動化された振戦の定量化を実行すること、ここで、振戦の定量化は、任意選択で遺伝子型による。いくつかの態様では、臨床応答を予測することは、画像からボクセルベースのセロトニン受容体リガンド結合を計算することを含む。
【0015】
いくつかの実施形態では、本方法は、状態についての少なくとも1つの候補遺伝子バイオマーカに基づき遺伝子型から表現型の予測を実行することをさらに含み得る。いくつかの態様では、表現型の予測は、以下のうちの少なくとも1つを含む:一塩基多型(SNP)モデルからの深層学習による表現型の予測;陽電子放射断層撮影(PET)画像による定量的表現型の解析;深層学習SNPモデルによりボクセルベースのアミロイドSUVRを予測すること;深層学習SNPモデルによりボクセルベースのDAT-SPECT定量を予測すること;深層学習SNPモデルによりボクセルベースのα-シヌクレインリガンド結合を予測すること;又は、深層学習SNPモデルにより局所的セロトニン受容体リガンド結合を予測すること。
【0016】
いくつかの実施形態では、本方法は、以下のうちの少なくとも1つを含み得る:レポートに少なくとも1つの候補遺伝子バイオマーカを載せること;少なくとも1つの候補遺伝子バイオマーカを有する生物学的経路を解析すること;又は、少なくとも1つの候補遺伝子バイオマーカを、状態に関連する生物学的経路と比較すること。
【0017】
いくつかの実施形態では、状態は以下である:対象において互いに相関する1組の医学的兆候及び症状を有する症候群;対象の外的又は内的要因に対して病態生理学的応答を示す疾患;又は、対象の正常な身体構造及び/又は機能に混乱をもたらす障害。いくつかの態様では、状態は、アルツハイマー病、パーキンソン病及び大うつ病性障害(MDD)から選択される。
【0018】
いくつかの実施形態では、コンピュータに実装された方法は、以下を含み得る:正確な定量的表現型の解析を実行すること;量的形質遺伝子座のゲノムワイド関連解析(QTL
GWAS)を実行すること;定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;少なくとも1つの候補遺伝子バイオマーカを検証するために、少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測すること;及び、深層学習SNPモデルにより表現型の予測を実行すること。
【0019】
いくつかの実施形態では、コンピュータに実装された方法は、以下を含み得る:SPE
CT及びT1 MRI画像からボクセルベースのDAT-SPECT定量を計算すること;量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること;定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;振戦の定量化を遺伝子型で比較すること;深層学習SNPモデルによりボクセルベースのDAT-SPECT定量を予測すること。
【0020】
いくつかの実施形態では、コンピュータに実装された方法は、以下を含み得る:PET及びT1 MRI画像からボクセルベースのα-シヌクレインリガンド結合を計算すること;量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること;定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;振戦の定量化を遺伝子型で比較すること;及び、深層学習SNPモデルによりボクセルベースのα-シヌクレインリガンド結合を予測すること。
【0021】
いくつかの実施形態では、コンピュータに実装された方法は、以下を含み得る:PET及びT1 MRI画像から局所的セロトニン受容体リガンド結合を計算すること;量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること;定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;PET及びT1 MRI画像を用いてボクセルベースのセロトニン受容体リガンド結合を計算すること;及び、深層学習SNPモデルにより局所的セロトニン受容体リガンド結合を予測すること。
【0022】
いくつかの実施形態では、コンピュータに実装された方法は、以下を含み得る:PET及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算すること;量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること;定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること;海馬マスクされたボクセルベースのタウSUVRを、遺伝子型で比較すること;深層学習SNPモデルによりボクセルベースのアミロイドSUVRを予測すること;及び、予測されたボクセルベースのアミロイドSUVRを含むレポートを生成すること。
【0023】
いくつかの実施形態では、アミロイド陽性又は初期アルツハイマー病を検出するための、人工ニューラルネットワークを訓練する、コンピュータに実装された方法は、以下を含み得る:データベースから、対応する陽電子放射断層撮影(PET)画像、磁気共鳴画像法(MRI)の画像及び対応する遺伝子型データのセットを収集すること;PET画像及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算して、初期アルツハイマー病の正確な定量的表現型を得ること;定量的表現型及び対応する遺伝子型データを含む、訓練セットを作成すること;及び、訓練セットを用いて、遺伝子型データから定量的表現型を予測するために、人工ニューラルネットワークの訓練を実行すること。いくつかの態様では、人工ニューラルネットワークは、少なくとも、SNP id 1-32、又はSNP id 1-32のサブセット、及び任意選択で定量的表現型を予測するための表1のSNP id 33を含む、遺伝子型データを用いて訓練されている。いくつかの態様では、訓練は、本明細書に記載する方法で動作するための訓練を提供するために、十分な数のSNPを有するサブセットを含み得る。サブセットは、NP id 1-32の、少なくとも10個のSNP、少なくとも15個のSNP、少なくとも20個のSNP、少なくとも25個のSNP又は少なくとも30個のSNPを含み得る。しかし、サブセット内のSNPの数が多いほど、性能が向上する可能性があることを認識しておくべきである。
【0024】
いくつかの実施形態では、状態の遺伝的バイオマーカを特定するためのシステムは、以
下を含み得る:深層表現型決定ユニット;深層表現型決定ユニットの下流にあるQTL GWAS解析ユニット;及び、QTL GWAS解析ユニットの下流にある臨床応答検証ユニット。いくつかの態様では、システムは、臨床応答検証ユニットの下流にある、遺伝子発現解析ユニットを含む。いくつかの態様では、システムは、臨床応答検証ユニットの下流にある、また、任意選択で遺伝子発現解析ユニットの下流にある、経路マッピングユニットを含む。いくつかの態様では、システムは、臨床応答検証ユニットの下流にある、また、任意選択で遺伝子発現解析ユニットの下流にある、また、任意選択で経路マッピングユニットの下流にある、表現型予測ユニットを含む。いくつかの態様では、システムは、以下から選択される1つ又は複数のユニットを含み得るツールセットシステムを含む:パターン及び/又は傾向解析ユニット;統計解析ユニット;テキストマイニング妥当性解析ユニット;新規化学物質(NCE)予測ユニット;又はレポートユニット。
【0025】
いくつかの実施形態では、システムは、以下のうちの1つ又は複数にしたがい構成し得る。いくつかの態様では、深層表現型決定ユニットは、以下のうちの少なくとも1つを実行するために構成されている:正確な定量的表現型の解析を実行すること;PET及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算すること;SPECT及びT1 MRI画像からボクセルベースのDAT-SPECT定量を計算すること;PET及びT1 MRI画像からボクセルベースのα-シヌクレインリガンド結合を計算すること;又は、PET及びT1 MRI画像から局所的セロトニン受容体リガンド結合を計算すること。いくつかの態様では、QTL GWAS解析ユニットは、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行するために構成されている。いくつかの態様では、臨床応答検証ユニットは、以下のうちの少なくとも1つを実行するために構成されている:少なくとも1つの候補遺伝子バイオマーカを検証するために、少なくとも1つの候補遺伝子バイオマーカに対して臨床応答を予測すること;海馬マスクされたボクセルベースのタウSUVRを遺伝子型で比較すること;振戦の定量化を遺伝子型で比較すること;又は、PET及びT1 MRI画像を用いたボクセルベースのセロトニン受容体リガンド結合を計算すること。
【0026】
いくつかの実施形態では、システムは、以下のうちの1つ又は複数を含み得る:自動化された又は自動化されていない、遺伝子発現プロファイリングを実行するために構成された遺伝子発現解析ユニット;遺伝子発現解析ユニットにより特定された遺伝子の1つ又は複数の生物学的経路をマッピングするために構成された経路マッピングユニット;深層学習モデルを用いて、深層表現型決定ユニットにより特定される表現型を予測するように、又は新しい状態の新しい調査のために新しい表現型を予測するように、構成された表現型予測ユニット;任意選択で深層表現型決定ユニットとともに用いられ、表現型のパターン又は傾向を決定するように構成された、パターン及び/又は傾向解析ユニット;本方法のあらゆるデータ又はメトリックの統計解析を実行するように構成された統計解析ユニット;テキストマイニングにより治療標的の妥当性を決定するように、及び/又は、治療標的に関連する生物学的経路の生物学的実体の化学的モジュレータを決定するように、構成された、テキストマイニング妥当性解析ユニット;治療標的を調節できる新規化学物質(NCE)を設計又は生成するように構成された、新規化学物質(NCE)予測ユニット;又は、レポートユニットは、レポートを生成するように構成されている。
【図面の簡単な説明】
【0027】
本開示の実施形態は、限定ではなく例として示されており、以下の図面を参照することにより、本開示をよりよく理解できる:
図1】新規の治療標的特定のために、はるかに少ないヒトのデータから、神経変性及び他のCNS疾患における疾患の遺伝的ドライバを明らかにするための、効率的な、コンピュータに実装された方法のフローチャートの例である。
図2】新規の治療標的特定のために、はるかに少ないヒトデータから、アルツハイマー病の疾患の遺伝的ドライバを明らかにするための、効率的な、コンピュータに実装された方法のフローチャートの例である。
図3】DAT-SPECT及びMRIから計算されたボクセルベースのドーパミントランスポータ単一光子放射型断層撮影(DAT-SPECT)深層イメージング表現型及び臨床応答評価のための自動化された振戦の定量化を用いて、パーキンソン病の疾患の遺伝的ドライバを特定するための、コンピュータに実装された方法のフローチャートの例である。
図4】α-シヌクレインPET及びMRIから計算されたボクセルベースの深層イメージング表現型及び臨床応答評価のための自動化された振戦の定量化を用いて、パーキンソン病の疾患の遺伝的ドライバを特定するための、コンピュータに実装された方法のフローチャートの例である。
図5】PET及びT1 MRIからの局所的セロトニン受容体リガンド結合から計算された深層イメージング表現型、並びに臨床応答評価のためのPET及びTI MRIからのボクセルベースのセロトニン受容体リガンド結合を用いて、大うつ病性障害(MDD)の疾患の遺伝的ドライバを特定するための、コンピュータに実装された方法のフローチャートの例である。
図6】主要なコンポーネント、及び創薬における治療標的特定のための例示的なインテリジェントシステムのデータフローを示す図である。
図7】標的特定のための定量的な「深層」表現型の、新しい米国国立老化研究所及びアルツハイマー病協会(NIA-AA)の「ATN」(ベータアミロイド沈着、病理学的タウ、及び神経変性)基準による、高い精度(>/=85%)を示す図であり、ここでは例として、単一のアミロイドPET及びT1 MRIスキャンから計算されたボクセルベースの標準化取込値比(SUVR)であり、異なるATNバイオマーカのプロファイルグループ間の識別を示す。
図8】臨床応答を評価するための海馬内のボクセルベースのタウPET定量化について30人の対象の予備結果を示す図であり、タウPET定量化又はアミロイドPET定量化のいずれかに関連しており、他の研究者によって報告されたものよりもミニメンタルステート検査(MMSE)との強い相関を示す。
図9】アルツハイマー病における疾患の遺伝的ドライバを明らかにするためのシステムによって生成されたレポートの例であり、ここでは例として、候補リゾホスファチジルコリンアシルトランスフェラーゼ2(LPCAT2)遺伝子/タンパク質を示す;保護SNP rs4402561の示唆的な関連性は、第1の正確な定量的表現型(PETQ)により検出され、ステップダウンパターンは第2の臨床応答追跡測定(PETQ TAU)により確認された(訓練p=0.054)。
図10】アルツハイマー病における疾患の遺伝的ドライバを明らかにするためのシステムによって生成されたレポートの例であり、ここでは例として、候補LPCAT2遺伝子/タンパク質を示す;血液発現プロファイリングから、おそらく規制転写物に関連する、LPCAT2プローブの非常に重要なステップアップパターンを確認できる。
図11】アルツハイマー病における疾患の遺伝的ドライバを明らかにするためのシステムによって生成されたレポートの例であり、ここでは例として、候補LPCAT2遺伝子/タンパク質を示す;脳バンク遺伝子発現プロファイリングから、上前頭皮質内の、若い対照(yCTR)、年齢を一致させた古い対照(oCTR)及びアルツハイマー病の対象(AD)の間でLPCAT2プローブのトレンドステップアップパターンが確認できる。
図12】アルツハイマー病の疾患の遺伝的ドライバを明らかにするためのシステムによって生成されたレポートの例であり、ここでは例として、候補LPCAT2遺伝子/タンパク質を示す;rs4402561マイナーアレルキャリアステータスによる炎症性サイトカインIL6の血液発現プロファイリングから、トレンドステップダウンパターンが確認でき、保護を説明している。
図13】主要なコンポーネント、及び創薬における治療標的特定のためのインテリジェントシステム内の表現型予測(DeepQnt)の例におけるデータフローを示す図である;候補SNP/遺伝子のセットは、発見されたSNP/遺伝子からの深層学習モデルを用いて元のイメージング表現型を予測するように構築でき、追加の検証ステップとして機能し得る(VCFファイルが示されるが、BCFファイルを用いてもよい)。
図14】創薬における治療標的特定のためのインテリジェントシステム内の深層学習ベースのシステム(DeepQnt)を用いた遺伝子型からの表現型(PETQ SUVR)予測を示す図である。アミロイド陽性のPETスキャン(FDA承認の方法であるSPAPで評価)を受けた対象は、SPAP+と表示されている。
図15】創薬における治療標的特定のためのインテリジェントシステム内の表現型予測(DeepQnt)の例の性能を示す図である;例として、アルツハイマー病(AD)の強力なコンピュータ技術により、わずか数百のサンプルで治療標的を発見でき、数千のサンプルを必要とする他の遺伝子発見/リスク予測アプローチと同等の性能を達成する;SPAPposは、アミロイド陽性のPETスキャン、長期(>=5年)の追跡調査をともなうデータセットにおける軽度認知障害(MCI)からADへのNC/C転換を示す。
図16】本明細書に記載する方法(又はその一部)を実行するための、いくつかの実施形態で提供され得る例示的なコンピューティングデバイス1600(例えば、コンピュータ)の例を示す。
図17】ベンチマーク法(ポリジェニックハザードスコア、PHS;Desikanら、PLoS Medicine 2017)に対する、創薬における治療標的特定のためのインテリジェントシステム内の表現型予測(DeepQnt)の例の直接の性能比較を示す図である;例として、アルツハイマー病(AD)で開示されたコンピュータ技術により、わずか数百のサンプルで治療標的を発見でき、何千もの対象から引き出されたPHSなどの他の遺伝子発見/リスク予測アプローチと同等の性能(ここではMCIからADへの転換検出)を達成する。NC/Cは、長期(>=5年)の追跡調査をともなうデータセットにおける軽度認知障害(MCI)からADへの転換を示す。
図18】ベンチマーク法(ポリジェニックハザードスコア、PHS;Desikanら、PLoS Medicine 2017)に対する、創薬における治療標的特定のためのインテリジェントシステム内の表現型予測(DeepQnt)の例の直接の性能比較を示す図である;例として、アルツハイマー病(AD)で開示されたコンピュータ技術は、わずか数百のサンプルで治療標的を発見でき、同等の性能を達成する(ここではMCI対象のアミロイド陽性の検出について)。SPAP陽性は、アミロイド陽性PETスキャンを示す;MCIは、軽度認知障害である。
図19】54のMCIテストケースについて、創薬における治療標的特定のためのインテリジェントシステム内の表現型予測(DeepQnt)の例の性能比較を示す図である;例として、アルツハイマー病(AD)で開示されたコンピュータ技術により、わずか数百のサンプルで治療標的を発見でき、APOE4キャリアステータスのみと比較して性能の向上(ここではMCIからADへの転換検出)を達成する。MCIは、長い(>=5年)追跡調査をともなうデータセットにおける軽度認知障害を示す。
【発明を実施するための形態】
【0028】
一般に、本技術は、データを処理して、障害、疾患又は症候群などの状態を示す遺伝情報を特定する方法及びその方法を実行するためのシステムに関する。本明細書に記載するプロトコルは、状態を示すSNP又は他の遺伝子型情報を同定するために用いることができる。本方法は、状態の表現型に関連する遺伝子型を特定できるように、対象の母集団のデータセットを解析し且つ処理するために用い得るメトリックを提供する。
【0029】
いくつかの実施形態では、プロトコルは、断面的解析とよばれる、疾患の時点のデータを用い得る。しかし、プロトコルは、縦断的解析とよばれる、疾患の経時的な複数のデータポイントを用い得る。
【0030】
プロトコルは、対象の表現型の定量的測定のために、対象の母集団の各所のデータポイントを解析し得る。その時点での疾患の断面的定量的測定は、対象の状態の表現型について解析され得る。断面的測定は、前臨床若しくは前症状の段階とよばれる発症前の初期段階、又は症状の段階など、疾患の非常に早い段階で実行し得る。
【0031】
データセットには、これを解析して、その状態のメトリックとして定量的な表現型を特定し得るような、状態の測定値を含めることができる。本明細書で提供する新しいATN定義は、状態を決定するために用い得る。例えば、アルツハイマー病(AD)の場合、アミロイド及びタウ陽性を用いて、完全な認知症の段階の前である、前臨床AD状態又は前駆状態を定義し得る。断面的測定は、精神障害がないか又はある程度あるが完全な病状ではない、対象のデータセット(例1など)に適用される。図2のステップ210に示すように、メトリックが適用され、状態は、例えば約85%又は約85%超えの精度(例えば、正確な定量的表現型として定義される)で、メトリックで正確に特定できると決定される。
【0032】
前臨床対照(すなわち、症状のない対象)では、対象をメトリックで解析して、状態を特定し得る。したがって、その状態を発症する可能性のある対象を、その状態を発症する可能性が低い対象と区別できる。メトリックが特定されると、それを用いて、対象がその状態を発症する可能性を最大100%の精度で予測できる。
【0033】
本明細書に記載するように、深層表現型は、疾患を特定する結果となるメトリック(例えば、正確な定量的表現型であってもよい)までデータを抽出することを可能にする。このメトリックでは、発症前の状態から発症を経て、完全な状態(アルツハイマー病など)までの、状態のスペクトルの各所の決定を可能にする。
【0034】
メトリックは、一旦特定されると、状態に特に関連していない対象で検証するために、ディスカバリデータセットとともに用い得る。メトリックは、状態の遺伝子型を特定するために、ディスカバリデータセット(例えば、患者ごとに1つの時点、断面的であるが、1つの対象の時点は他の対象の時点とは異なっていてもよい)で処理し得る。これにより、プロトコルは、状態のスペクトルの各所で、その状態に関連した遺伝子コードを特定するために、遺伝子型を表現型に適合させる。次いで、遺伝子解析により、状態を示す、SNPを含み得る1つ又は複数の遺伝子の特定を提供し得る。これは、感受性の診断目的の、又は状態を有する、様々な対象に用いることのできる深層表現型を含み得る。
【0035】
いくつかの実施形態では、ボクセルベースのSUVRを遺伝子型により解析して、ボクセルメトリックを取得し得る。例えば、図2のステップ240は、ボクセルメトリックを決定するために用い得る。新しいボクセルメトリックを用いて、記憶を扱う海馬などの対象を解析し得る。海馬は、タウなどのように、アルツハイマー病と関連しているために用い得る。ボクセルメトリックは、認知尺度としてのMMSEなどによって、記憶と相関し、これは、本明細書に記載するように図8に示すことができ、これは、ボクセルメトリックが記憶を追跡する、臨床応答尺度であることを示している。
【0036】
いくつかの実施形態では、プロトコルは以下を含み得る:画像データ(例えば、深層表現型)から正確な定量的表現型を得ること;正確な定量的表現型をメトリックとして用いることに部分的に基づき、遺伝子型を得ること;ボクセルメトリックを決定すること;及び、応答追跡メトリックであってもよいボクセルメトリックを、SNPなどの遺伝子型を検証するための正確な定量的表現型メトリックと組み合わせる。例えば、図9に関して説明する様々な態様は、より低い値が指標であるSNPなどのように、ヒット(例えば、p値)としてのSNPを見つけるように解析し得る。次いで、SNPのキャリアは、感受性
があるか若しくは状態を有する、又は、その状態になる可能性を抑制できるように保護されている、と特定できる。次いで、海馬の状態の指標として、SNPのキャリア及び非キャリアを、記憶について解析し得る。
【0037】
いくつかの実施形態では、深層学習をSNPモデルに適用でき、データを解析して、元の定量的表現型の予測を実行し得る。これは、追加の検証として用い得る。したがって、SNPを得る方法は、SNPモデルを訓練する前に用い得る。次いで、SNPモデルを用いて、さらなる検証として元の定量的表現型を予測し得る。例えば、図14は、SNPモデルに基づく、予測値対元の定量的表現型を示す。
【0038】
いくつかの実施形態では、SNPモデルは、アミロイド陽性又はアミロイド陰性の対象を有するデータセットにSNPモデルを適用することによってテストされ得る。このモデルは、また、SNPモデルに基づき、状態のある対象と状態のない対象とを区別し得る。
【0039】
SNPモデルを用いた現在の技術は、数千のデータポイントを持つ大きなデータセットを必要とする代わりに、数百のデータポイントのオーダーの小さなデータセットに用いることができる。これにより、SNPを診断目的で用い得る。
【0040】
以下の説明では、説明の目的で、本開示の具体的な詳細が記載されているので、本開示をより明確に理解できる。しかし、本開示は、これらの特定の詳細なしに当業者によって実施され得ることは明らかであろう。本開示の例示的な実施形態のいくつかの特定の特徴は、以下の例で詳述され、図1~19に示されている。
【0041】
いくつかの実施形態では、図1は、状態の遺伝的バイオマーカを特定する方法100を示す。方法100は、対象の状態について、当該状態を有する複数の対象のために、表現型の画像の定量的画像解析を実行して、第1の正確な定量的表現型を得ることを含み得る。これは、ステップ110に示されるように、正確な定量的表現型を得ることとよんでもよい。このステップは、本開示及び例に関して本明細書に記載するように実行し得る。いくつかの態様では、このステップは、対象の表現型の画像を取得することによって実行でき、ここで画像は、所定の時点での状態を正確に示す。このステップは、定量的表現型について85%超え又は約85%の表現型の精度を得ることも含み得る。表現型の精度は正確に85%であってもよく、85%超え又は約85%(例えば、1%、2%、3%、4%又は5%以内)であってもよい。
【0042】
いくつかの実施形態では、方法100は、対象の表現型の画像から状態として疾患、障害又は症候群を検出することを含んでいてもよく、これは、ステップ110又はそのサブステップに含まれ得る。したがって、画像は、各対象又は複数の対象のうちの1以上の対象における病状、障害又は症候群としての状態を検出するように処理し得る。複雑な画像解析及びデータベース情報は、状態を検出するための処理中に使用し得る。少なくとも1つの実施形態では、方法100は、疾患の経時的な複数のデータポイントを用いて、縦断的解析を実行し得る。
【0043】
いくつかの実施形態では、方法100は、ステップ110又はそのサブステップに含まれ得る、状態スペクトル(例えば、疾患スペクトル)各所での状態活性(例えば、疾患活動)を定義するためのプロセスを含んでいてもよい。これは、各対象又は複数の対象のうちの1以上の対象における状態の段階又は状態の進行を特定することを可能にし得る。そのため、各対象は解析において同じ病状でなくてもよい。これにより、データ時点を各対象の単一の時点とし得るが、データ時点は、対象の母集団の様々な状態進行にわたるものであってもよい。
【0044】
いくつかの実施形態では、方法100は、対象の表現型の画像を用いて標準化取込値比(SUVR)解析を実行することを含み得る。SUVRは、当技術分野で知られているように実装できる。SUVRは、陽電子放射断層撮影(PET)画像などの画像データを用いて計算し、状態及び状態の状況の定量解析を提供できる。
【0045】
図1はまた、方法が、ステップ120のように、複数の対象の各々又は複数の異なる対象に対して定量的ゲノム解析を実行することを含み得ることを示す。定量的ゲノム解析は、ステップ110のように同じ対象に対して実行され得るが、解析は、独立したデータセットの検証解析を提供できる、異なるグループの対象で実行してもよい。いくつかの態様では、定量的ゲノム解析は、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)の実行を含む(例えば、ステップ120)。QTL GWASは、当技術分野で知られ、本明細書に記載するように実行し得る。QTL GWASの結果は、状態との相関を解析するためのSNPのパネルなど、1つ以上のSNPを提供し得る。
【0046】
したがって、ゲノム解析の結果は、ステップ130で複数の対象の状態について少なくとも1つの候補遺伝子バイオマーカを得る結果となり得る。そのため、定量的画像解析及び定量的ゲノム解析からの情報は、マイナーアレル又はメジャーアレルなどのSNP又は遺伝子コードであってもよい1つ又は複数の候補バイオマーカを特定するために、ステップ130で用いることができる。
【0047】
方法100はまた、少なくとも1つの候補遺伝子バイオマーカを検証するために、少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測することを含んでいてもよく、これは、臨床応答検証を提供するためにステップ140で実行し得る。このステップは、本方法の品質を向上させるのに役立ち、特定された候補バイオマーカを検証できる。このステップは、様々なプロトコルで実行でき、これは、具体的には、本明細書でより詳細に説明するように図2のステップ240を含み得る。したがって、予測された臨床応答は、少なくとも1つの遺伝的バイオマーカに関連する少なくとも1つの生物学的経路を調節するために実行され得る。いくつかの態様では、予測された臨床応答は、少なくとも1つの遺伝的バイオマーカに関連する生物学的経路の少なくとも1つの生物学的に活性なタンパク質を阻害するために実行し得る。この臨床的検証は、1つ又は複数の候補バイオマーカを検証するために用いることができ、さらなる解析及び開発のために1つ又は複数の検証済み候補バイオマーカを選択するために用いることができる。
【0048】
いくつかの実施形態では、臨床応答を予測することは、臨床応答検証のための異なるプロトコルを含み得る。いくつかの態様では、臨床応答検証は、本明細書に記載するように、遺伝子型定量化による海馬マスクされたボクセルベースのタウSUVRを実行することを含み得る。いくつかの態様では、臨床応答検証は、本明細書に記載するように、海馬を用いた遺伝子型定量化によるボクセルベースのタウSUVRによる記憶追跡の決定を実行することを含み得る。いくつかの態様では、臨床応答検証は、本明細書に記載するように、海馬内でボクセルベースのタウ定量化を実行することを含み得る。いくつかの態様では、臨床応答検証は、本明細書に記載するように、臨床応答を追跡するタウ画像解析を実行することを含み得る。いくつかの態様では、臨床応答検証は、臨床応答追跡測定を実施することを含み得る。いくつかの態様では、臨床応答検証は、以下のうちの少なくとも1つを含む:振戦の定量化を実行すること:又は、自動化された振戦の定量化を実行すること、ここで、振戦の定量化は、任意選択で遺伝子型による。一例では、組み込まれた参考文献は、振戦の定量化などに関する詳細な情報を提供し得る。いくつかの態様では、臨床応答検証は、以下を含み得る:画像からのボクセルベースのセロトニン受容体リガンド結合を計算すること。
【0049】
方法100はまた、状態の少なくとも1つの候補遺伝子バイオマーカに基づき遺伝子型
から表現型の予測を実行することを含んでいてもよく、これは、SNPモデルからの深層学習をともなう表現型の予測のためのステップ150であってもよい。いくつかの態様では、表現型の予測は、特定された1つ又は複数のバイオマーカのプロトコルの検証として用い得る。いくつかの態様では、表現型の予測は、陽電子放射断層撮影(PET)画像を用いた定量的表現型の解析を含み得る。いくつかの態様では、表現型の予測は、深層学習SNPモデルでボクセルベースのアミロイドSUVRを予測し得る。いくつかの態様では、表現型の予測は、深層学習SNPモデルでボクセルベースのDAT-SPECT定量化を予測し得る。いくつかの態様では、表現型の予測は、深層学習SNPモデルでボクセルベースのα-シヌクレインリガンド結合を予測し得る。いくつかの態様では、表現型の予測は、深層学習SNPモデルで局所的リガンド結合を予測し得る。
【0050】
いくつかの実施形態では、方法はまた、それに関連する1つ又は複数の生物学的経路の観点から、1つ又は複数の候補バイオマーカの解析を含み得る。これは、少なくとも1つの候補遺伝子バイオマーカに基づき表現型の状態について少なくとも1つの治療標的を特定することを含み得る。治療標的は、治療標的についてエンコードする候補バイオマーカ、又はそれに関連する1つ又は複数の生物学的経路において治療標的が相互作用する基質若しくは他の物質のいずれかによって、候補バイオマーカと関連付け得る。いくつかの態様では、状態の少なくとも1つの治療標的は、少なくとも1つの候補遺伝子バイオマーカと生物学的に関連している。したがって、治療標的は、治療標的を調節する既知又は新規の治療物質(例えば、新規化学物質(NCE))の解析のために選択し得る。多くの場合、治療標的は、生物学的活性の阻害の標的となり得る。他の例では、治療標的は、活性化及び/又は生物学的活性の増加のための標的となり得る。一態様では、治療標的の特定は、ステップ120、130、140若しくは150又はそれらのサブステップの一部であってもよい。いずれにしても、候補バイオマーカを知ることは、関連する生物学的経路を特定することにつながることがあり、その解析は、1つ又は複数の治療標的を特定し得る。
【0051】
いくつかの実施形態では、方法はまた、紙又は電子的レポートであるかどうかにかかわらず、レポートの生成を含み得る。レポートの生成は、本明細書に記載する方法100などの方法で得られた情報を含み得る。レポートは、組み込まれた参考文献に記載されているプロトコル又はシステムを用いて生成でき及び/若しくは配信でき、又は医師のためのレポートとして配信するために編集できる。図7、8、9、10、11、12、14、15及び/若しくは17-19などの図のデータ、又は同様のデータ型又はデータ形式が、レポートに含まれ得る。レポートは、決定されたメトリックなどの結果データが含み得る。レポートは、1つ以上の候補バイオマーカを含んでいてもよく、状態に関連付けられた検証済みで具体的に特定されたバイオマーカを含んでいてもよい。次いで、レポートは、1以上の対象、及びその状態に取り組む医療専門家又は研究者に提供され得る。レポートは、状態の治療法として用いられる治療法に関する情報も含み得る。このため、本方法は、その状態について特定された少なくとも1つの治療標的を含むレポートを生成することを含み得る。図に関して、「終了」は解析の終了であってもよく、これにより、レポートが生成されてもよい(例えば、自動的に、又はプロトコルオペレータによる命令によって)。少なくとも1つの実施形態では、本方法は、決定されたメトリクス、候補バイオマーカなどの結果データを洗練するために、方法の1つ又は複数のステップを再帰的に実行し得る。
【0052】
いくつかの実施形態では、本方法は、特定のプロトコルを実行するために、様々なアクション又はステップを含み得る。いくつかの態様では、方法は、対象の表現型の画像を得ることを含んでいてもよく、その画像は、所定の時点での状態を正確に示す。いくつかの態様では、方法は、定量的表現型について85%超え又は約85%又は85%に等しい表現型の精度を得ることを含み得る。いくつかの態様では、方法は、対象の表現型の画像か
ら状態として疾患を検出することを含み得る。いくつかの態様では、方法は、状態の疾患スペクトルの各所での疾患活動を定義することを含み得る。いくつかの態様では、本方法は、対象の表現型の画像を用いて標準化取込値比(SUVR)解析を実行することを含み得る。
【0053】
いくつかの実施形態では、方法100は、表現型の画像の定量的画像解析を実行するための特定の方法ステップを含み得る。いくつかの態様では、方法100は、以下を含み得る:画像からボクセルベースのアミロイド標準化取込値比(SUVR)を計算すること(図2のステップ210);画像からボクセルベースのドーパミントランスポータ単一光子放射型断層撮影(DAT-SPECT)定量を計算すること(図3のステップ310);画像からボクセルベースのα-シヌクレインリガンド結合を計算すること(図4のステップ410);又は、画像から局所的セロトニン受容体リガンド結合を計算すること(図5のステップ510)。
【0054】
いくつかの実施形態では、本方法で用いられる画像は、標準的なカメラ(例えば、CDC、CMOSなど)からのデジタル画像など、あらゆる機器からのあらゆる画像であり得る。しかし、いくつかの態様では、画像は、医療分野で一般的に用いられる画像化技術からのものであってもよい。これらには、陽電子放射断層撮影法(PET)、磁気共鳴画像法(MRI)、単一光子放射型断層撮影法(SPECT)及びそれらの組み合わせやその他が含まれ得る。
【0055】
いくつかの実施形態では、方法100は、臨床応答検証を実行するための様々なプロトコルを含み得る(ステップ140)。そのようなプロトコルは、以下のうちの少なくとも1つを含み得る:遺伝子型の定量化によって海馬マスクされたボクセルベースのタウSUVRを実行すること;海馬を用いた遺伝子型の定量化により、ボクセルベースのタウSUVRを用いて記憶追跡特性の決定を実行すること;海馬内でボクセルベースのタウ定量を実行すること;臨床応答を追跡するタウ画像解析を実行すること;又は、臨床応答追跡測定を実行すること。臨床応答検証(ステップ140)はまた、以下を含み得る:海馬マスクされたボクセルベースのタウSUVRを遺伝子型で比較すること(図2のステップ240);振戦の定量化を遺伝子型で比較すること(図3のステップ340又は図4のステップ440);又は、ボクセルベースのセロトニン受容体リガンド結合を計算すること(図5のステップ540)。
【0056】
図1に示すように、方法100は、以下を含み得る:正確な定量的表現型の解析を実行すること(ステップ110);量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること(ステップ120);定量的画像解析及び定量的ゲノム解析から、複数の対象における状態の少なくとも1つの候補遺伝子バイオマーカを得ること(ステップ130);少なくとも1つの候補遺伝子バイオマーカを検証するために、少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測すること(ステップ140);及び、深層学習SNPモデルを用いて表現型の予測を実行すること(ステップ150)。
【0057】
図2もまた、状態の遺伝的バイオマーカを特定する方法200を提供し、これは、以下を含み得る:PET及びT1 MRI画像からボクセルベースのアミロイドSUVRを計算すること(ステップ210);量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること(ステップ220);定量的画像解析及び定量的ゲノム解析から、複数の対象における状態の少なくとも1つの候補遺伝子バイオマーカを得ること(ステップ230);海馬マスクされたボクセルベースのタウSUVRを遺伝子型で比較すること(ステップ240);深層学習SNPモデルを用いてボクセルベースのアミロイドSUVRを予測すること(ステップ250)。
【0058】
図3もまた、状態の遺伝的バイオマーカを特定する方法300を提供し、これは、以下を含み得る:SPECT及びT1 MRI画像からボクセルベースのDAT-SPECT定量を計算すること(ステップ310);量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること(ステップ320);定量的画像解析及び定量的ゲノム解析から、複数の対象における状態の少なくとも1つの候補遺伝子バイオマーカを得ること(ステップ330);振戦の定量化を遺伝子型で比較すること(ステップ340);及び、深層学習SNPモデルを用いたボクセルベースのDAT-SPECT定量を予測すること(ステップ350)。
【0059】
図4もまた、状態の遺伝的バイオマーカを特定する方法400を提供し、これは、以下を含み得る:PET及びT1 MRI画像からボクセルベースのα-シヌクレインリガンド結合を計算すること(ステップ410);量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること(ステップ420);定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること(ステップ430);振戦の定量化を遺伝子型で比較すること(ステップ440);深層学習SNPモデルを用いてボクセルベースのα-シヌクレインリガンド結合を予測すること(ステップ450)。
【0060】
図5もまた、状態の遺伝的バイオマーカを特定する方法500を提供し、これは、以下を含み得る:PET及びT1 MRI画像から局所的セロトニン受容体リガンド結合を計算すること(ステップ510);量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行すること(ステップ520);定量的画像解析及び定量的ゲノム解析から、複数の対象における状態についての少なくとも1つの候補遺伝子バイオマーカを得ること(ステップ530);PET及びT1 MRI画像を用いてボクセルベースのセロトニン受容体リガンド結合を計算すること(ステップ540);及び、深層学習SNPモデルを用いて局所的セロトニン受容体リガンド結合を予測すること(ステップ550)。
【0061】
図1~5との関係で、図示され及び説明された実施形態は、ここで提供される例によってサポートされる。その例は、状態の遺伝的バイオマーカを特定する目的を達成するために、プロトコル、データ及びデータ解析のための情報を提供する。状態は、本明細書で挙げるものなど、あらゆる状態であり得る。しかし、プロトコルは、他の遺伝的バイオマーカを決定するために、他の条件又はそのサブタイプに適用され得ることを認識されるべきである。
【0062】
いくつかの実施形態では、方法のいずれかは、特定された少なくとも1つの候補遺伝子バイオマーカを有する生物学的経路を解析することを含み得る。生物学的経路は、生物学的経路の既知の生物学的実体、並びに既知の生物学的実体の既知のモジュレータに関して解析され得る。したがって、既知のモジュレータによって調節できる生物学的実体を、治療標的について特定し得る。治療標的は、既知の化学的物質によって調節でき、それにより、潜在的な治療法として含まれ得る。そして、これらの潜在的な治療法は、状態について調査され得る。しかし、既知の生物学的実体はまた、その状態の治療において使用され得る、そのモジュレータであり得る新規化学物質(NCE)を決定するために研究され得る。その既知の生物学的実体は、インシリコで若しくは現実世界での評価、又はそれらの組み合わせで研究され得る。
【0063】
いくつかの実施形態では、状態は、症候群、疾患、障害等である。症候群は、表現型を示していてもよく、対象において互いに相関している、一組の医学的兆候及び症状を有し得る。疾患は、表現型に現れ得る、対象の外的又は内的要因に対して病態生理学的応答を示してもよい。障害は、対象の通常の身体構造及び/又は機能に混乱をもたらし得る。
【0064】
本明細書に記載する、状態のいくつかの例は、アルツハイマー病、パーキンソン病及び大うつ病性障害(MDD)を含み得る。しかし、他の病気は、本明細書に記載する技術による状態に用い得る。
【0065】
図6は、状態の遺伝的バイオマーカを特定するためのシステム600の実施形態を示す。システム600は、少なくとも以下を含むことが示されている;深層表現型決定ユニット610;深層表現型決定ユニット610の下流にあるQTL GWAS解析ユニット620;及び、QTL GWAS解析ユニット620の下流にある臨床応答検証ユニット630。これらのコンポーネントは、本明細書に記載する方法を実行するために用い得る。システム600は、臨床応答検証ユニット630の下流にあり得る遺伝子発現解析ユニット640をさらに(任意選択で)含み得る。システム600は、臨床応答検証ユニット630の下流に、また任意選択で遺伝子発現ユニット640の下流に、経路マッピングユニット650をさらに(任意選択で)含み得る。システム600は、臨床応答検証ユニット630の下流に、及び/又は任意選択で遺伝子発現解析ユニット640の下流に、及び/又は任意選択で経路マッピングユニット650の下流に、さらに(任意選択で)表現型予測ユニット660を含み得る。
【0066】
図6はまた、ツールセットシステム670を含むシステム600を示す。ツールセットシステム670は、以下から選択される1つ又は複数のユニットを含み得る:パターン及び/又は傾向解析ユニット672;統計解析ユニット674;テキストマイニング妥当性解析ユニット676;新規化学物質(NCE)予測ユニット678;又は、レポートユニット680。
【0067】
いくつかの実施形態では、システム600は、以下の1つ又は複数にしたがい、及び本明細書の開示にしたがい、構成されるコンポーネントを含み得る。深層表現型決定ユニット610は、ステップ110、210、310、410及び510を実行ために構成し得る。QTL GWAS解析ユニット620は、ステップ120、220、320、420及び520を実行するために構成し得る;臨床応答検証ユニット630は、ステップ140、240、340、440及び540を実行するために構成し得る。遺伝子発現解析ユニット640は、自動化されていてもよく自動化されていなくてもよい遺伝子発現プロファイリング640を実行するために構成され得る。経路マッピングユニット650は、遺伝子発現解析ユニット640によって特定される遺伝子の1つ又は複数の生物学的経路をマッピングするために構成し得る。表現型予測ユニット660は、深層学習モデルを用いて、深層表現型決定ユニット610によって特定される表現型を予測するように又は新しい状態の新しい調査のための新しい表現型を予測するように構成し得る。パターン及び/又は傾向解析ユニット672は、深層表現型決定ユニット610、臨床応答検証ユニット630、遺伝子発現解析ユニット640と共に用いることができ、表現型のパターン又は傾向を決定するように構成され得る。統計解析ユニット674は、本方法のあらゆるデータ又はメトリックの統計解析を実行するように構成し得る。テキストマイニング妥当性解析ユニット676は、テキストマイニングによって治療標的の妥当性を決定するように、及び/又は治療標的に関連する生物学的経路の生物学的実体の化学的モジュレータを決定するように構成し得る。新規化学物質(NCE)予測ユニット678を用いて、治療標的を調節することができるNCEを設計又は生成し得る。レポートユニット680は、組み込まれた参考文献のプロトコルなどによって、レポートを生成するように構成し得る。化学的モジュレータ又はNCEはまた、生物学的に活性な薬剤で置換でき、生物学的に活性な薬剤は、小分子、ペプチド、バイオ医薬品、抗体、核酸、siRNAなどの、生物学的なものか又は合成されるものかにかかわらない、任意の化学物質であってよい。
【0068】
いくつかの実施形態では、システム600のコンポーネントは、コンピューティングシステムで実行できるコンピュータ又はコンピュータモジュールであってもよい。そのコン
ポーネントは、コンピュータのプロセッサ(例えば、マイクロプロセッサ)によって実行されると、任意のプロトコルについて本明細書に記載する方法及び方法ステップの実行を引き起こすことができるコンピュータ実行可能コードを含み得る。
【0069】
図13は、本明細書に記載する方法で使用できるDeepQnt処理パイプライン1300を示す。図示するように、処理パイプライン1300は、図示の個別のステップを有していてもよく、これは、コンピューティングシステム(例えば、システム600、610、660)で、及び例4-方法でさらに詳細に説明される方法で実行し得る。個別のステップは、図13で説明できる。本明細書で提供する方法は、深層学習及び人工知能用に構成されたものなどのコンピューティングシステムで実行し得る。いくつかの例では、本方法は、データを取得し、データを処理して、治療プロトコルについて推奨を得ることを含み得る。そして、推奨される治療プロトコルを、その治療プロトコルのパラメータにしたがい患者に実行し得る。すなわち、治療プロトコルの計算による生成がなければ、治療プロトコルの態様は、そうするように指示されない限り実行し得ない。このため、薬の種類、特定の薬、又は薬の組み合わせなどの指示を得ることは、治療プロトコルを実行するために不可欠である場合がある。
【実施例0070】
例1
単一の測定で所定の時点(断面的)での疾患を正確に反映する、第1の統合された定量的「深層」アルツハイマー病(AD)イメージング表現型110(図1)、210(図2)、700(図7)を確立する:
自動化されたボクセルベースのアミロイドPET定量及びATN分類間の一致
ここで、図7を参照する。図7は、新しいNIA-AA「ATN」基準(例えば、Jackら、Alzheimer’s and Dementia 2018)による標的特定のための定量的「深層」(例えば、疾患を定義するメトリック)表現型の高い(>/=85%)精度(例えば、正確な表現型)を示す図である。標的特定のための定量的「深層」表現型の特定は、例えば、アミロイドPET及びT1 MRIスキャンからのボクセルベースのSUVRに基づいてもよい。新たに提案された「ATN」分類は、アミロイド、タウ及び神経変性の二分されたバイオマーカを利用して、8つの可能なバイオマーカの組み合わせをもたらす。「T」はAD神経病理学によって動機付けられているが、CSFサンプル又はタウPETのいずれかが必要である。さらに、MCI患者では、「N」はADへの臨床的転換に関してより有益であると考えられる(Novakら、Polcherら、Burnhamら、AAIC 2017)。図7に示されるような解析の目的は、以前に(より進行した疾患で)検証されたボクセルベースのアミロイドPET定量ソフトウェアが、ATNステータスによって確立された前臨床及び前駆ADグループを特定する能力を評価することであった。
【0071】
例1-方法
方法の例では、229人の非認知症の対象(訓練には用いない)を含んでいた:86人の健康な対照(CTR)、143人のMCI。すべての対象は、解析に利用できる完全なATNプロファイルを有していた。「A」:[18F]florbetapir PETアミロイド陽性は、臨床使用が承認された領域ベースの定量法であるsyngo.PETアミロイド斑(SPAP)を用いて確立された。「T」:CSFのp-タウステータスは、新しいElecsysアッセイで確立された。「N」:平均左/右海馬体積は、EADC/ADNI調和プロトコルに対して以前に検証された高速MRI定量で計算された。対応するPET/T1 MRIスキャンペアからのボクセルベースのSUVRは、ATNプロファイリングに基づき前臨床又は前臨床/前駆症状を組み合わせたグループを特定する能力について評価された(+、-、「x」は+又-を示す)。
【0072】
例1-結果:
前臨床AD(A+T+Nxとして定義、n=29)対A-TxNx/A+T-Nx(n=57)CTR対象を区別するための、グラフ710の受信者動作特性曲線下面積(AUC)は0.917であった。グラフ710(A+T+Nx対A-TxNx/A+T-Nx(前臨床AD対その他))では、引き出し線は感度/特異性/精度(sens/spec/acc)%を指し、これは1.23のカットオフで86/86/86であった。前臨床/前駆AD(A+T+Nxとして定義、n=86)対A-TxNx/A+T-Nx(n=143)CTR/MCI対象のグラフ720のAUCは0.918であった。グラフ720(A+T+Nx対A-TxNx/A+T-Nx(前臨床/前駆AD対その他))では、引き出し線は感度/特異性/精度%を指し、これは1.23のカットオフで81/91/87であった。グラフ730をA+T+/A+N+(n=88)及びA-TxNx/A+T-N-(n=141)CTR/MCI対象で区別するための、AUCは0.928であった。グラフ730(A+T+/A+N+対A-TxNx/A+TN-(前臨床/前駆AD/A+T-N+対その他))では、引き出し線は感度/特異性/精度%を示し、これは1.23のカットオフで82/92/88であった。グラフ715では、p=9.6×10-14であった。グラフ725では、p=1.1×10-35であった。グラフ735では、p=6.9x10-39であった。グラフ710、720及び730にでは、X軸は1-特異性であり、Y軸は感度である。
【0073】
したがって、図7に示すように、グラフ710のボクセルベースのアミロイドPET定量は、参照臨床領域ベースの定量法(SPAP)、p-tauのElecsysアッセイ及び高速海馬体積測定によって決定されるように、前臨床で確立されたATN分類及びグラフ720前臨床/前駆疾患バイオマーカプロファイル(A+T+Nx)とよい一致を示した。前臨床/MCIステージの疾患定義がNIA-AAフレームワークで以前に検討されたようにA+T+又はA+N+に基づいていた場合(ステージ2/3、MCI-AD-high)、グラフ730の精度は同等に高かった。
【0074】
図6を参照する。図6は、コアモジュール610~660としての主要なコンポーネント、及びコアモジュール610~660とともに用いられるツールセットライブラリ670に沿った、創薬における治療標的特定のための例示的なインテリジェントシステムのデータフローを示す図である;熟練した当業者は、新しいATN分類で定義される前臨床疾患を正確に検出するユニット610(図6)を備えた単一の統合された定量的PET測定110(図1)又は210(図2)の使用が、以下の点において、本開示に詳述される重要な考慮事項であることを理解するであろう:はるかに少ないヒトのデータから、新規の治療標的特定のために、神経変性及び他の中枢神経系疾患における疾患の遺伝的ドライバを明らかにするための効率的な、コンピュータに実装された方法100(図1)及びシステム(例えば、図6)において、より具体的には、新規治療標的同定のためのアルツハイマー病における疾患の遺伝的ドライバを明らかにするためのシステム600(図6)を備えた、効率的な、コンピュータに実装された方法200(図2)において。
【0075】
本開示は、、標的特定のために前記第1の正確な定量的表現型(例えば、ステップ110、ステップ210、ユニット610を参照)、例えば、アミロイドPET及びT1 MRIスキャンからの第1のボクセルベースのSUVR210、700を得た後、第2のステップ140(図1)、240(図2)をユニット630(図6)とともに、組み合わせて導入する技術を説明する。
【0076】
一実施形態では、本発明は、次いで、以下でさらに説明するように、標的遺伝子型に対する臨床応答の画像化又は非画像化定量測定値(例えば、ステップ140、ステップ240、ユニット630を参照)の計算をさらに組み込む;特定の一実施形態では、前記測定値は、ステップ240の海馬内のボクセルベースのタウPET定量であり、ステップ24
0の定量化は、少なくとも部分的に、機械学習/AIベースの画像解析操作を用いて、ステップ140における前記臨床応答を評価する。
【0077】
方法200の前述の例示的な実施形態では、ステップ210における前記第1の画像表現型のデータ700の実証された高精度は、原則として、機械学習/AIに基づくステップ210の前記ボクセルベースのSUVRと密接に相関するステップ110の代替メトリックによって達成され得る。
【0078】
同様に、そして本開示の文脈において、ステップ240における海馬内の前記ボクセルベースのタウPET定量化の記憶追跡特性は、原則として、すでにここで実施されるように(以下の例2の詳細を参照)、前記機械学習ベースの画像解析操作を用いて、及び/又は海馬のCA1領域などの特定のボクセルセットの選択と組み合わせて海馬の周りのタイトなマスクを用いて達成され得る。
【0079】
本開示の他の例示的な実施形態は、図3~5に概説されている:
図3は、パーキンソン病における疾患の遺伝的ドライバを特定するための、コンピュータに実装された方法300のフローチャートの例であり、ここで、DAT-SPECT及びMRイメージングから計算された、ステップ310におけるボクセルベースのDAT-SPECT深層イメージング表現型、及び臨床応答評価のためにステップ340で自動化された振戦の定量化を用いている;代替的又は追加的に、ステップ340からの自動化された振戦の定量化は、機械学習/AIに基づき得る。
【0080】
同様に、図4は、パーキンソン病における疾患の遺伝的ドライバを特定するための、コンピュータに実装された方法400のフローチャートの例であり、ここで、α-シヌクレインPET及びMRイメージングから計算された、ステップ410におけるボクセルベースのディープイメージング表現型、及び臨床応答評価のためにステップ440で自動化された振戦の定量化を用いている;代替的又は追加的に、ステップ440からの自動化された振戦の定量化は、機械学習/AIに基づき得る。
【0081】
さらに別の例で、図5は、PET及びT1 MRIからの局所的セロトニン受容体リガンド結合から計算されたステップ510における第1の深層イメージング表現型、並びに臨床応答評価のためのPET及びT1 MRIからのステップ540のメトリックにおける第2のボクセルベースのセロトニン受容体リガンド結合を用いて、大うつ病性障害(MDD)における疾患の遺伝的ドライバを特定するための、コンピュータに実装された方法500のフローチャートの例である。代替的又は追加的に、ステップ540からのメトリック(例えば、ボクセルメトリック)は、機械学習/AIに基づき得る。
【0082】
例2
海馬マスクされたボクセルベースのタウSUVRを計算することによる臨床応答の予測:
図8を参照する。図8は、臨床応答を評価するための海馬824内のボクセルベースのタウPET定量化(例えば、ステップ140、ステップ240、ユニット630を参照)についての30人の対象におけるグラフ810及びグラフ820の予備結果を示す図である。これは、タウPET定量化又はアミロイドPET定量化のいずれかに関連しているので、他の研究者によって報告されたものよりもグラフ820においてMMSEとのより強い相関(r=-0.60、p<0.001)を示した。グラフ810では、p=0.013、n=30であり、非コンバータは白丸で示され、初期のAD対象12人であるeADは黒丸で示される(軽度ADの対象4人も含む、8/12人の対象において、転換イベントの前又は1年以内に得られたタウスキャン)。グラフ820では、r=-0.60(p<0.001)及びy=-5.93x+34.2(n=30)である。
【0083】
熟練した当業者は、今日までの海馬内のタウPET定量化が、海馬の真の境界を行き過ぎる同時登録されたMRIセグメンテーションによって部分的に妨げられ、その結果、例えば、脈絡叢におけるオフターゲット結合によって汚染されていることを理解するであろう;したがって、海馬は、MMSE(臨床応答の絶対的基準)などの認知測定と適切に相関することが示されていないので、測定には不適切な部位と考えられてきた。本開示では、実施形態の一態様によれば、技術は、そのような行き過ぎを回避し、臨床応答をうまく追跡するタウイメージング測定を組み込むことによって、この問題を解決し得る。
【0084】
初期アルツハイマー病(AD)におけるタウ指向療法への応答を予測し且つ測定するという特定の目標を有し、神経変性の初期段階及び位置での疾患活動性を正確に反映し、臨床転帰によく対応する、新規なアプローチに大きな関心が持たれている。定着した解剖学的な又は複合的な関心領域及び/又はz-スコアベースのアプローチを用いて、そのような測定を引き出す最初の試みは、これまでのところ様々な成功を収めており、及び/又はアミロイド陽性状態の事前知識を組み込む追加的な必要性によって妨げられている。Pontecorvoら(Brain 2017)は、[18F]Flortaucipir
PETコホート解析で有望な結果を報告した。注目すべきことに、海馬のサブ領域(subregions)から計算されたSUVRは、複合新皮質SUVRよりもグループ識別に役立つようである。図8に示される解析の目的は、データ800が、ボクセルベースの(海馬マスクされた)タウ定量化(例えば、ステップ140、ステップ240、ユニット630を参照)と記憶822(例えば、ベースラインMMSE)との関連性、及び初期AD対象814からのMCI非転換対象812の、グラフ810におけるデータを区別するその能力を実証することであった。
【0085】
例2-方法:
MCI又はADの30人の対象816(例1では用いられないデータセット)が関与し、2つのグループに分けられた:18人のMCI非転換(4~5年のMCI追跡調査)及び12人の主に初期のAD対象(8/12人の対象は、MCIからADへの転換イベントの前後1年以内にPETスキャンを行った;さらに、要約提出時に利用可能なデータが限られていたため、軽度ADの4/12人の対象が含まれていた)。対応する[18F]Flortaucipir PET、T1 MRIスキャン及びMMSEスコア(PET時)もまた得た。海馬のマスクは、前述の、EADC/ADNI調和プロトコル(HarP)に対して検証されたように、マルチアトラスの、GPU高速化された、機械学習ベースの海馬セグメンテーションを用い、T1 MRIから引き出された。ボクセルごとのSUVRマップ(75~105分、小脳参照)は、部分的なボリューム補正を行い、MNI空間に変換した。非転換グループ及び初期ADグループを区別する海馬内の最適なボクセルは、ボクセルごとのtスコアクラスター解析に基づき決定した。ボクセルベースのSUVRは、リーブワンアウト解析(a leave-one-out analysis)で各対象の海馬ボクセルから得た。海馬ボクセルベースのSUVR及びMMSE間の相関は、ピアソンの相関で評価した。
【0086】
例2-結果:
グループ分類810について、受信者動作特性曲線下面積(AUC)は0.79であった(グループ差の両側tテスト(two-tailed t-test):p=0.013)。海馬ボクセルベースのSUVR824は、MMSEスコア822と有意に相関していた(r=-0.60、p<0.001)。
【0087】
ボクセルベースのアプローチは、局所的海馬SUVR(AUC=0.60、r=-0.49)及び海馬体積(AUC=0.73、r=0.27)よりも性能の向上を示した。
【0088】
18F]Flortaucipir(18F-AV-1451)SUVRとベースラインMMSEとの関連性は、他の研究者によって、全体及び局所の両方の測定で~r=-0.4のオーダーであることが以前に示されたが、ここで説明する例2におけるアプローチは、MMSEとよりよく相関する海馬内のボクセルのサブグループを特定し、本開示の実施形態の一態様によれば、臨床応答をうまく追跡するタウ画像測定を組み込むことによって、問題を解決する(例えば、ステップ140、ステップ240、ユニット630を参照)。脈絡叢の取り込みの潜在的な影響は、PVCと脈絡叢の一部の遠位にある海馬ボクセルの選択とによって改善されることがわかった。さらに、疾患生物学の観点から、海馬の活動過剰は、疾患のドライバとしてさらに研究され、前駆ADにおけるタウ沈着に関連しており、それゆえ、はるかに少ないヒトのデータから、新規の治療標的特定のために、神経変性及び他のCNS疾患における疾患の遺伝的ドライバを明らかにするために、効率的な、コンピュータに実装された方法100及びシステム600において、より具体的には、はるかに少ないヒトのデータから、新規の治療標的特定のために、アルツハイマー病における疾患の遺伝的ドライバを明らかにするために、効率的な、コンピュータに実装された方法200及びシステム600において、本開示の文脈で重要な考慮事項である。
【0089】
例3
第1の統合された定量的「深層」アルツハイマー病(AD)イメージング表現型に対するQTL GWAS解析:
当業者は、例えばPLINKを用い、QTL GWAS解析(例えば、ステップ120、ステップ220、ユニット620)と組み合わせて、例1に示されるような標的特定のために、高い(>/=85%)精度(新しいNIA-AA「ATN」基準による)の定量的「深層」表現型(例えば、ステップ110、ステップ210、ユニット610を参照)を用いることは、潜在的に新規なSNPを特定するための重要なステップであることを理解し得る。ユニット620では他のQTL GWAS技術、例えばランダムフォレストの機械学習に基づく技術を用い得る。例1で詳述した画像表現型(例えば、ステップ110、ステップ210、ユニット610を参照)によってより進行した疾患(AD認知症)を100%の高精度で検出することが前に実証されており、したがって、前記定量的表現型(ステップ110、ステップ210、ユニット610)は、疾患スペクトル全体にわたる疾患活動性を反映し、はるかに少ないヒトのデータから、新しい治療標的の特定のために、アルツハイマー病における疾患の遺伝的ドライバを明らかにするための、効率的な、本開示に係る、コンピュータに実装された方法200及びシステム600において、前記QTL GWASと組み合わせてのその使用をより適したものにする。
【0090】
一実施形態の一態様では、遺伝子型決定(genotyping)は、n=334の全発見サンプルにおいてIllumina Omni2.5マイクロアレイを用いて実行した。
【0091】
表1は、本開示の例に係る、前記定量的表現型(例えば、ステップ110、ステップ210、ユニット610を参照)に対する前記QTL GWAS120、220、620の結果として検出された33の疾患関連SNPのリストを示す。それぞれのSNP id(IDは、ここではランクを反映していない)、染色体(Chr)、SNP(アクセッション番号、バリアントを識別するrsidともよばれる)、及びバリアントアレル/塩基(A1はマイナーアレルを示し、A2はメジャーアレルを示す)を表1に示す。マイナーアレルは、疾患の可能性が低いか高いかを示すSNPを決定する目的でSNPとみなし得る。メジャーアレルは、マイナーアレルによって提供されるものとは反対の指標を提供する共通のアレルである。
【0092】
【表1】
【0093】
インテリジェントシステム600における前述の詳細なステップ110~150、210~250及びユニット610、620、630、並びに本明細書に開示されるコンピュ
ータに実装された方法100及び200は、ユニット640において遺伝子発現プロファイリングを実行するための自動化されたステップ、及び経路マッピングユニット650を含むユニット672、674、676、680における標的妥当性解析がさらに続いてもよい。一実施形態によれば、表1に列挙されるような候補SNP/遺伝子のセットは、追加の検証ステップとして機能する、前記SNP/遺伝子(例えば、ステップ130、ステップ230を参照)からの深層学習モデル(例えば、ステップ150、ステップ250、ユニット660を参照)を備えた、前記第1の画像表現型(例えば、ステップ110、ステップ210、ユニット610を参照)を正確に予測するためにさらに構築され得る。
【0094】
例4
創薬における治療標的特定のためのインテリジェントシステム内の深層学習ベースのシステム(DeepQnt)で、はるかに少ない遺伝子型データからの表現型の予測、及び、何千もの対象から引き出されたポリジェニックハザードスコア(PHS、Desikanら、PLoS Medicine 2017)との直接の性能比較:
図14を参照する。図14は、表現型(PETQ SUVR)(例えば、ステップ110、ステップ210、ユニット610を参照)を示す図であり、これは、創薬における治療標的特定のためのインテリジェントシステム600で実行される、開示された、コンピュータに実装された方法(例えば、方法100又は方法200を参照)内の、深層学習ベースのシステム(DeepQnt)(例えば、ステップ150、ステップ250、ユニット660を参照)を備えたPETQ SUVR1412予測を提供し得る;アミロイド陽性のPETスキャン(FDA承認の方法であるSPAPで評価)を受けた対象は、SPAP+(三角形の記号)で示される。予測1414(例えば、予測されたSUVR)は、例えばPETQ SUVR1412を得るためにユニット610でステップ110又はステップ210によって得られた、元の定量的表現型に対してピアソンのr=0.411との有意な相関を達成し得る。
【0095】
図15を参照する。図15は、例えば、開示された、コンピュータに実装された方法100又は方法200内のユニット660を用い、且つ、創薬における治療標的特定のためのインテリジェントシステム600を用いた、ステップ150又はステップ250により、例示的な表現型予測(DeepQnt)の性能を示す図である;SPAPposはアミロイド陽性PETスキャンを示し、三角形の記号はMCIからADへの転換、長期(>/=5年)の追跡調査をともなうデータセットにおける軽度認知障害(MCI)からADへのNC/C転換を示す。
【0096】
グラフ1510では、予測1514(例えば、予測されたSUVR)は、アミロイド陽性状態1512(例えば、SPAP陽性)によってグループを分類するだけでなく、コンバータC(三角形の記号)を非コンバータNC(正方形の記号)から分類することも可能にする。それぞれの受信者動作特性(ROC)曲線は、グラフ1520(C対NCについて、曲線の下の面積AUC=0.757)及びグラフ1530(アミロイド陽性検出のAUC 0.724)に示される。
【0097】
これらの性能の結果は、例として、アルツハイマー病(AD)の強力なコンピュータ技術により、わずか数百のサンプルで治療標的を発見し、数千人の対象から得たポリジェニックハザードスコア(PHS)(詳細データは図17~18に示す)などの他の遺伝子発見/リスク予測アプローチと同等の性能を達成できること、及び、APOE4キャリアステータス(感度76%、特異性67%、精度72%、データは示されない)のみと比較して初期ADを検出する改善された性能(MCIからADへの転換の検出;感度91%、特異性62%、精度80%;図19)を示している。
【0098】
例4-方法:
訓練には、合計334人の対象が含まれていた:128人の健康な対照(CTR)、159人のMCI、及び47人のAD。テストには、54人のMCI対象の個別のデータセットが含まれ、コンバータ(ADへ)と非コンバータとに分けられた:33人のコンバータ(転換の1~3年前のPET)と21人の非コンバータ(5~7年のMCI追跡調査)。対応する[18F]florbetapir PET、T1 MRI、Illumina Omni2.5M遺伝子型決定データ、参照臨床領域ベースの定量法(SPAP)、アミロイド陽性(SPAP+)ステータスの確立に用いるもの、及びポリジェニックハザードスコア(PHS)を得た;54人のMCI症例(52)のサブセットのみがPHSも有し、47人はSPAPも利用可能であった;45の例はPHS及びSPAPの両方を有していた。PETQ SUVR1412を得るための第1のボクセルベースのSUVRイメージング表現型(例えば、ステップ110、ステップ210、ユニット610)は、例1で詳述したように、各PET/MRIスキャンペアについて計算した。
【0099】
海馬内のボクセルベースのタウPET定量化(例えば、ステップ140、ステップ240、ユニット630を参照)からの第2の臨床応答測定値を含む追加のデータセット(訓練には用いない)を、例2で詳述したように、前記臨床応答を検証するためにさらに使用した。ここで、定量化には少なくとも部分的に機械学習/AIベースの画像解析操作を用いた。
【0100】
共変量のないモデル及び共変量としてAPOE4キャリアステータスを有するモデルを用いて、ボクセルベースのSUVR表現型(例えば、ステップ110、ステップ210、ユニット610、PETQ SUVR1412を参照)に関連した候補SNP(例えば、ステップ130、ステップ230)を検出するために、PLINKv1.9ベータ(線形優勢モデル、MAF>0.1)(例えば、ステップ120、ステップ220、ユニット620を参照)を用いた。人工ニューラルネットワーク(ANN)は、第1のボクセルベースのSUVR表現型(例えば、ステップ110、ステップ210、ユニット610、PETQ SUVR1412を参照)を予測するように、32のSNPのセット(表1、SNP id 1~32を参照)を用いて訓練した;GPU-高速化TensorFlow(v1.1.0)及び選択したパラメータ(batch size=4,keep probability=1.0,initializer=Xavier,optimizer=Adam,learning rate=0.001,layers=[32-22-1],iterations=350)を用いた。予測されたSUVR1414、1514は、ANNモデルを用いて各対象について計算された。当業者は、いくつかの態様において、ANNが、表1の前記SNP id 1~32のサブセット及び任意選択で表1のSNP id 33、のみを含む遺伝子型データを用いて、さらに訓練され、前記第1のボクセルベースのSUVR表現型を予測し得ることを理解するであろう。ANNは、例えば、Caffe、Pytorch又はMATLABなどのツールキットを用いて実装し、そして実行可能ファイル若しくはC/C++共有ライブラリとしてコンパイルしてもよい。
【0101】
図13を参照する。図13は、創薬における治療標的特定のためのインテリジェントシステム600内の例示的な表現型予測(DeepQnt)(例えば、ステップ150、ステップ250、ユニット660を参照)における主要なコンポーネント及びデータフロー/処理パイプライン(ステップ1~8)を示す図である;候補SNP/遺伝子のセット(例えば、ステップ130、ステップ230を参照)は、発見されたSNP/遺伝子から深層学習モデルを用いて、元のイメージング表現型(例えば、ステップ110、ステップ210、ユニット610、PETQ SUVR1412を参照)を予測するように構築でき、これは追加の検証ステップとして機能し得る。
【0102】
より詳細には、一実施形態での、図13の離散ステップの擬似コードは、以下のとおり
である:
1.入力ファイル(VCF/BCF)ヘッダを読み取り、サンプルを確認し、tabixファイルを確認し、設定を更新する;
2.生のヘッダ、サンプル数、シーケンス名、##reference及び##fileformatを抽出する;
3.遺伝子型、倍数性、#occurrencesを含む、各SNPについて、キー/値の辞書を作成する;
4.入力ファイルの各行を読み取り、以下を行う:
a.SNP辞書キーと比較して、一致するかどうかを確認する;
b.一致したタイプを決定する(rs+bp、rsのみ、bpのみ);
c.REF文字、ALT文字、遺伝子型及び文字コードを抽出する;
d.遺伝子型に基づき、適切なtensorflowモデルコード(1、2又は3)を割り当てる;
e.抽出した情報及びモデルコードをSNP辞書に追加する;
5.SNP情報をログファイルに出力し、必要なすべてのSNPが存在するかどうかを確認する;
6.tensorflowモデルに入力するために、SNP遺伝子型データから特徴ベクトルを生成する;
7.遺伝子型を非キャリア/キャリアに再コード化し、tensorflow DNNモデルを実行する;そして、
8.tensorflowモデルからの出力をフォーマット済みSUVR出力値に変換し、端末に出力する。
【0103】
例5
開示に関連する、アルツハイマー病LPCAT2候補遺伝子及びSNP rs4402561の発見。
【0104】
図9を参照する。図9は、アルツハイマー病における疾患の遺伝的ドライバを明らかにするための、ユニット680などを備えるシステム600によって生成されたレポートの例、ここでは、例として、候補LPCAT2遺伝子/タンパク質、を示す図である;熟練した当業者が理解するように、保護候補SNP(例えば、ステップ130、ステップ230を参照)rs4402561(表1、SNP id33を参照)のグラフ920の示唆的な関連が、第1の正確な定量的表現型(PETQ)で検出され(例えば、ステップ110、ステップ210、ユニット610、PETQ SUVR1412)、及びグラフ930におけるステップダウンパターン(例えば、ユニット672、ユニット674)は、第2の臨床応答追跡測定(訓練p=0.054)によって確認された(PETQ TAU)(例えば、ステップ140、ステップ240、ユニット630)。グラフ910は、n=97/162/75(左のデータは2/2、中央のデータは1/2、右のデータは1/1)のrs4402561のデータを示している。グラフ920は、n=97/237(左のデータは非キャリア、右のデータはキャリア)、p=2.72e-5の、rs4402561のデータを示している。ボンフェローニ有意水準=0.05/1589548=3.15e-8。グラフ930は、n=6/12(左のデータは非キャリア、右のデータはキャリア)、p=0.054のrs4402561のデータを示している。
【0105】
表1において、id33では、QTL GWAS(例えば、ステップ120、ステップ220、ユニット620)によって明らかにされたrs4402561 SNP(例えば、ステップ130、ステップ230)の保護特性に対応する塩基がマイナーアレルのA1列にある。当業者は、このQTL GWASの例ではA1がマイナーアレルであるにもかかわらず、マイナーアレル(MA)の指定は、関連研究に用いられる集団マイナーアレル頻度(MAF)に依存しており、実際の塩基文字置換は、解析中に用いられる遺伝子型決
定方法及びコーディング/レポートの基準に依存して翻訳される必要があり得ることを理解するであろう。例えば、rs4402561の場合、関連する保護として表示される塩基はCであるが、逆ストランド方向で報告された場合はGである。
【0106】
図10を参照する。図10は、アルツハイマー病における疾患の遺伝的ドライバを明らかにするためにシステム600、680によって生成されたレポート1000、ここでは、例として、候補LPCAT2遺伝子/タンパク質、を示す図である;当業者が理解するように、血液発現プロファイリンググラフ1010、1020は、おそらく調節転写物に関連するLPCAT2プローブの非常に有意なステップアップパターン1010、672、674を確認する。グラフ1010及び1020は、LPCAT2-11725418、N=49の場合である。グラフ1010では、左のデータは22、中央のデータは12、右のデータは11でる。グラフ1020では、左のデータは非キャリアであり、右のデータはキャリアである。
【0107】
図11を参照する。図11は、アルツハイマー病における疾患の遺伝的ドライバを明らかにするために、ユニット680などを備えるシステム600によって生成されたレポート1100、ここでは、例として、候補LPCAT2遺伝子/タンパク質を示す図である;熟練した当業者は、脳バンク遺伝子発現プロファイリング1120が、上前頭皮質内で、若い対照(yCTR)、年齢を一致させた古い対照(oCTR)及びアルツハイマー病の対象(AD)間の、LPCAT2プローブのプロファイル1120(例えば、ユニット672、ユニット674を参照)に示されるトレンドステップアップパターンを示すことを確認する。左のグラフのデータはLPCAT-227889-海馬、N=62(左のデータはyCTR、中央のデータはoCTR、右のデータはAD)のデータであり、右のグラフのデータはLPCAT2-227889-上前頭回(superior frontal)、N=69のデータである(左のデータはyCTR、中央のデータはoCTR、右のデータはAD)。ボンフェローニ有意水準=0.05/4=0.0125。
【0108】
図12を参照する。図12は、アルツハイマー病における疾患の遺伝的ドライバを明らかにするための、ユニット680などを備えるシステム600によって生成されたレポート1200であり、ここでは、候補LPCAT2遺伝子/タンパク質の例を示す、図である;当業者は、rs4402561マイナーアレルキャリア状態による炎症性サイトカインIL6の血液発現プロファイリング1210が、プロファイル1210(例えば、ユニット672、ユニット674を参照)に示されるトレンドステップダウンパターンを示し、保護を説明することを理解するであろう。データはIL6-11746463、N=49及びp=0.031についてである(左のデータは非キャリア;右のデータはキャリア)。ボンフェローニ有意水準=0.05/2=0.025である。。
【0109】
前述の例5では、アルツハイマー病LPCAT2候補遺伝子及び関連するSNP rs4402561の発見により、推定治療標的は、ユニット650を用いた上流/下流経路マッピング及びユニット676を用いたテキストマイニングによる標的妥当性解析によってさらに実証されている。LPCATの下流分子経路は、ミクログリア細胞でさらに発現する血小板活性化因子(PAF)をもたらす。小分子選択的LPCAT2阻害剤(TSI-01)がユニット676で発見され、そのそれぞれのSMILESコードは次のとおりである:
O=C(C(Cl)=C1Cl)N(C2=CC=C(C(OC(C)C)=O)C=C2)C1=O。
【0110】
既知の分子構造から始めて、SwissTargetPredictionなどのツールを用いると、ユニット678で構造ベースのドラッグデザインが可能となる。最後に、例えばAtomwise AtomNet又はユニット678の他のAIベースのインシ
リコ創薬ツールを用いて、可能性のある新規化学物質(NCE)をインシリコで発見するために、LPCAT2の推定標的自体を用い得る。
【0111】
本開示は、様々な態様の例示として意図されている、本出願に記載されている特定の実施形態に限定されるべきではない。その思想及び範囲から逸脱することなく、多くの変更やバリエーションが可能である。本明細書に列挙されたものに加えて、本開示の範囲内の機能的に同等の方法及び装置が、前述の説明から可能である。本明細書で用いる用語は、特定の実施形態を説明することのみを目的としており、限定することを意図するものではない。
【0112】
一実施形態では、本方法は、コンピューティングシステム上で実行される態様を含み得る。このため、コンピューティングシステムは、本方法を実行するためのコンピュータ実行可能な命令を有するメモリデバイスを含み得る。コンピュータ実行可能命令は、本明細書に記載する方法のいずれかを実行するための1つ又は複数のアルゴリズムを含むコンピュータプログラム製品の一部であってもよい。
【0113】
一実施形態では、本明細書に記載する操作、プロセス又は方法はいずれも、コンピュータ可読媒体に格納され、1つ又は複数のプロセッサによって実行可能な、コンピュータ可読命令の実行に応答して、実行され又は実行させることができる。コンピュータ可読命令は、デスクトップコンピューティングシステム、ポータブルコンピューティングシステム、タブレットコンピューティングシステム、ハンドヘルドコンピューティングシステム及びネットワーク要素、並びに/又は他のあらゆるコンピューティングデバイスなどの、広範囲のコンピューティングシステムのプロセッサによって実行できる。コンピュータ可読媒体は一時的なものではない。コンピュータ可読媒体は、コンピュータ/プロセッサによって物理的に読めるように、コンピュータ可読命令がその中に格納されている物理媒体である。
【0114】
本明細書に記載するプロセス及び/又はシステム及び/又は他の技術に影響を与えることができる様々な媒体があるが(例えば、ハードウェア、ソフトウェア及び/又はファームウェア)、好ましい媒体は、プロセス及び/又はシステム及び/又は他の技術が展開される状況によって変化し得る。例えば、実装者が速度及び精度が最優先事項であると判断した場合、実装者は主にハードウェア及び/又はファームウェア媒体を選択し得る;柔軟性が最優先の場合、実装者は主にソフトウェアの実装を選択し得る;又は、さらに別の方法として、実装者は、ハードウェア、ソフトウェア及び/又はファームウェアのいくつかの組み合わせを選択し得る。
【0115】
本明細書に記載する様々な動作は、広範囲のハードウェア、ソフトウェア、ファームウェア又はそれらの実質的に任意の組み合わせによって、個別に及び/又はまとめて実装できる。一実施形態では、本明細書に記載する主題のいくつかの部分は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)又は他の統合フォーマットを介して実装し得る。しかし、本明細書に開示される実施形態のいくつかの態様は、全体的に又は部分的に、1つ又は複数のコンピュータ上で実行される1つ又は複数のコンピュータプログラムとして(例えば、1つ又は複数のコンピュータシステム上で実行される1つ又は複数のプログラムとして)、1つ又は複数のプロセッサで実行される1つ又は複数のプログラムとして(例えば、1つ又は複数のマイクロプロセッサで実行される1つ又は複数のプログラムとして)、ファームウェアとして、又はそれらの実質的に任意の組み合わせとして、集積回路に同等に実装でき、そして、この開示に照らして、回路を設計すること並びに/又はソフトウェア及び/若しくはファームウェアのコードを書くことが、可能である。さらに、本明細書に記載する主題のメカニズムは、様々な形式のプログラム製品として配布でき、本明細書に記載する
主題の例示的な実施形態は、配布を行うために用いられる実際に使用される信号伝達媒体の特定のタイプに関係なく適用される。物理的な信号伝達媒体の例には、以下が含まれるが、これらに限定されない:フロッピーディスク、ハードディスクドライブ(HDD)、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)、デジタルテープ、コンピュータメモリなどの記録可能なタイプの媒体又は一時的若しくは伝送用ではないその他の物理媒体。コンピュータ可読命令を有する物理媒体の例は、デジタル及び/又はアナログ通信媒体(例えば、光ファイバーケーブル、導波管、有線通信リンク、無線通信リンクなど)などの一時的又は伝送タイプの媒体を含んでいない。
【0116】
本明細書に記載する方法でデバイス及び/又はプロセスを説明し、その後、エンジニアリング手法を用いて、そのようなデバイス及び/又はプロセスをデータ処理システムに統合することが一般的である。すなわち、本明細書に記載するデバイス及び/又はプロセスの少なくとも一部は、妥当な量の実験を介してデータ処理システムに統合できる。典型的なデータ処理システムは、一般に、システムユニットハウジング、ビデオディスプレイデバイス、揮発性及び不揮発性メモリなどのメモリ、マイクロプロセッサやデジタル信号プロセッサなどのプロセッサ、オペレーティングシステムなどの計算エンティティ、ドライバ、グラフィカルユーザーインターフェイス、アプリケーションプログラム、タッチパッド又はスクリーンなどの1つ以上の対話デバイス、及び/又はフィードバックループ及び制御モーターを含む制御システム(例えば、位置及び/又は速度を感知するためのフィードバック;移動のため並びに/又はコンポーネント及び/若しくは量の調整をするための制御モーター)を含む。典型的なデータ処理システムは、データコンピューティング/通信及び/又はネットワークコンピューティング/通信システムに一般に見られるような、あらゆる適切な市販のコンポーネントを利用して実装し得る。
【0117】
本明細書に記載する主題は、異なる他のコンポーネントに含まれる、又はそれらと接続された異なるコンポーネントを示す場合がある。このように示されるアーキテクチャは単なる例示であり、実際は、同じ機能を実現する他の多くのアーキテクチャを実装し得る。概念的な意味では、同じ機能を実現するためのコンポーネントの配置は、必要な機能が実現されるように効果的に「関連付けられ」る。したがって、特定の機能を達成するためにここで組み合わされるあらゆる2つのコンポーネントは、アーキテクチャや中間コンポーネントに関係なく、望ましい機能が達成されるように互いに「関連付けられている」とみなし得る。同様に、そのように関連付けられたあらゆる2つのコンポーネントは、互いに「動作可能に接続して」又は「動作可能に結合して」、望ましい機能を実現するとみなし得る。そして、そのように関連付けられたあらゆる2つのコンポーネントは、互いに「動作可能に結合して」、望ましい機能を実現するとみなし得る。動作可能に結合可能な特定の例には、物理的に結合可能な及び/若しくは物理的に相互作用するコンポーネント並びに/又はワイヤレスで相互作用可能な及び/若しくはワイヤレスで相互作用するコンポーネント並びに/又は論理的に相互作用する及び/若しくは論理的に相互作用可能なコンポーネントが含まれるが、これらに限定されない。
【0118】
図16は、本明細書に記載する方法(又はその一部)を実行するためにいくつかの実施形態において構成され得る例示的なコンピューティングデバイス1600(例えば、コンピュータ)を示す。非常に基本的な構成1602では、コンピューティングデバイス1600は、一般に、1つ又は複数のプロセッサ1604及びシステムメモリ1606を含む。メモリバス1608は、プロセッサ1604及びシステムメモリ1606間の通信に使用し得る。
【0119】
所望の構成に応じて、プロセッサ1604は、マイクロプロセッサ(μP)、マイクロコントローラ(μC)、デジタル信号プロセッサ(DSP)又はそれらのあらゆる組み合わせを含むが、これらに限定されない任意のタイプであり得る。プロセッサ1604は、
レベル1キャッシュ1610及びレベル2キャッシュ1612などの1つ又は複数のレベルのキャッシュ、プロセッサコア1614及びレジスタ1616を含み得る。例示的なプロセッサコア1614は、算術論理ユニット(ALU)、浮動小数点ユニット(FPU)、デジタル信号処理コア(DSPコア)又はそれらのあらゆる組み合わせを含み得る。例示的なメモリコントローラ1618は、プロセッサ1604とともに使用されてもよく、又はいくつかの実装において、メモリコントローラ1618は、プロセッサ1604の内部部分であってもよい。
【0120】
所望の構成に応じて、システムメモリ1606は、揮発性メモリ(RAMなど)、不揮発性メモリ(ROM、フラッシュメモリなど)又はそれらのあらゆる組み合わせを含むがこれらに限定されない任意のタイプであってもよい。システムメモリ1606は、オペレーティングシステム1620、1つ又は複数のアプリケーション1622及びプログラムデータ1624を含み得る。アプリケーション1622は、本明細書に記載する方法に関して記載する操作を含む、本明細書に記載する操作を実行するように構成される決定アプリケーション1626を含み得る。決定アプリケーション1626は、圧力、流量及び/又は温度などのデータを取得し、圧力、流量及び/又は温度を変更するようにシステムの変更を決定し得る。
【0121】
コンピューティングデバイス1600は、追加の特徴又は機能、並びに基本構成1602及びあらゆる必要なデバイス及びインターフェース間の通信を容易にする追加のインターフェースを有し得る。例えば、バス/インターフェースコントローラ1630を用いて、ストレージインターフェースバス1634を介した基本構成1602と1つ又は複数のデータ記憶装置1632との間の通信を容易にし得る。データ記憶装置1632は、取り外し可能な記憶装置1636、取り外し不可能な記憶装置1638又はそれらの組み合わせであってもよい。取り外し可能な記憶装置及び取り外し不可能な記憶装置の例を具体的に挙げると、フレキシブルディスクドライブやハードディスクドライブ(HDD)などの磁気ディスク装置、コンパクトディスク(CD)ドライブ又はデジタル多用途ディスク(DVD)ドライブなどの光学ディスクドライブ、ソリッドステートドライブ(SSD)、テープドライブなどがある。例示的なコンピュータ記憶媒体には、コンピュータ可読命令、データ構造、プログラムモジュール又は他のデータなどの情報を格納するためのあらゆる方法又は技術で実装される揮発性及び不揮発性の、取り外し可能な及び取り外し不可能なメディアが含まれる。
【0122】
システムメモリ1606、取り外し可能な記憶装置1636及び取り外し不可能な記憶装置1638は、コンピュータ記憶媒体の例である。コンピュータ記憶媒体には、限定されないが、RAM、ROM、EEPROM、フラッシュメモリ又はその他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)又はその他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置又はその他の磁気記憶装置又は所望の情報を格納するために使用でき、コンピューティングデバイス1600によってアクセスできるその他の媒体が含まれる。そのようなコンピュータ記憶媒体は、コンピューティングデバイス1600の一部であってもよい。
【0123】
コンピューティングデバイス1600は、バス/インターフェースコントローラ1630を介して、様々なインターフェースデバイス(例えば、出力装置1642、周辺インターフェース1644及び通信装置1646)から基本構成1602への通信を容易にするインターフェースバス1640も含み得る。例示的な出力装置1642は、1つ又は複数のA/Vポート1652を介してディスプレイ又はスピーカーなどの様々な外部装置と通信するように構成し得る、グラフィックス処理ユニット1648及びオーディオ処理ユニット1650を含み得る。例示的な周辺装置1642は、1つ又は複数のI/Oポート1658を介して、入力装置(例えば、キーボード、マウス、ペン、音声入力装置、タッチ
入力装置など)又は他の周辺装置(例えば、プリンター、スキャナーなど)などの外部装置と通信するように構成され得る、シリアルインターフェースコントローラ1654又はパラレルインターフェースコントローラ1656を含み得る。例示的な通信デバイス1646は、1つ又は複数の通信ポート1664を介して、ネットワーク通信リンクによって1つ又は複数の他のコンピューティングデバイス1662との通信を容易にするように構成され得るネットワークコントローラ1660を含む。
【0124】
ネットワーク通信リンクは、通信媒体の一例である。通信媒体は、一般に、コンピュータ可読命令、データ構造、プログラムモジュール又は搬送波又は他の転送メカニズムなどの変調データ信号内の他のデータによって具体化でき、あらゆる情報配信媒体を含み得る。「変調データ信号」は、信号内の情報をエンコードするように設定又は変更されたその特性の1つ又は複数を有する信号であり得る。限定ではなく例として、通信メディアには、有線ネットワーク又は直接有線接続などの有線メディア、並びに音響、ラジオ波(RF)、マイクロ波、赤外線(IR)及び他のワイヤレスメディアなどのワイヤレスメディアが含まれ得る。本明細書で用いるコンピュータ可読媒体という用語は、記憶媒体及び通信媒体の両方を含み得る。
【0125】
コンピューティングデバイス1600は、携帯電話、パーソナルデジタルアシスタント(PDA)、パーソナルメディアプレーヤーデバイス、ワイヤレスウェブウォッチデバイス、パーソナルヘッドセットデバイス、アプリケーション固有デバイス又は前述の機能のいずれかを含むハイブリッドデバイスなどの、小型形態の携帯用(又はモバイル)電子機器として実施し得る。コンピューティングデバイス1600は、また、ラップトップコンピュータ及び非ラップトップコンピュータ構成の両方を含むパーソナルコンピュータとしても実施し得る。コンピューティングデバイス1600は、あらゆるタイプのネットワークコンピューティングデバイスであってもよい。コンピューティングデバイス1600は、本明細書に記載する自動化システムであってもよい。
【0126】
本明細書に記載する実施形態は、様々なコンピュータハードウェア又はソフトウェアモジュールを含む専用コンピュータの使用を含み得る。
【0127】
本開示の範囲に含まれる実施形態は、コンピュータ実行可能命令又はそこに格納されているデータ構造を実行又は保持するためのコンピュータ可読媒体も含む。このようなコンピュータ可読媒体は、コンピュータがアクセスできる利用可能なあらゆる媒体であってよい。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD-ROM若しくは他の光ディスク記憶装置、磁気ディスク記憶装置若しくは他の磁気記憶装置、又は、所望のプログラムコード手段を、コンピュータ実行可能命令又はデータ構造の形で格納し若しくは持ち運べる、コンピュータによってアクセスできるその他の媒体を含み得る。情報がネットワーク又は別の通信接続(ハードワイヤード、ワイヤレス又はハードワイヤードとワイヤレスとの組み合わせ)を介してコンピュータに、転送又は提供される場合、コンピュータはその接続をコンピュータ可読媒体として適切に認識する。したがって、そのようなあらゆる接続は、コンピュータ可読媒体と適切によばれる。前述のものの組み合わせもコンピュータ可読媒体の範囲に含まれるべきである。
【0128】
コンピュータ実行可能命令は、例えば、コンピュータ又は専用処理装置に、特定の機能又は機能群を実行させる命令及びデータを含む。主題は、構造的特徴及び/又は方法論的行為に特有の言葉で説明されているが、本明細書に記載する主題は、前述の特定の特徴又は行為に限定されないことを理解されたい。
【0129】
本明細書における実質的に任意の複数形及び/又は単数形の用語の使用に関して、当業者は文脈及び/又は用途に応じて、複数形から単数形へ、及び/又は単数形から複数形へ
と変換し得る。様々な単数形/複数形の順列は、明確にするために本明細書に明示的に記載されている場合がある。
【0130】
一般に、本明細書で用いる用語は一般に「オープンな」用語として意図されていることを当業者は理解するだろう(例えば、「含み」という用語は「含むが、これに限定されず」と解釈されるべきであり、「有する」という用語は「少なくとも有する」と解釈されるべきであり、「含む」という用語は「含むがそれに限定されない」などと解釈されるべきである)。さらに、特定の数が意図されている場合、そのような意図は明示的に列挙され、そのような言及がない場合、そのような意図は存在しないことが当業者によって理解されるであろう。例えば、理解の助けとして、本明細書で提供する説明は、本明細書で説明する方法及び構造の要素を導入するための導入句「少なくとも1つ」及び「1つ又は複数」の使用を含む場合がある。しかし、そのような句の使用は、不定冠詞「a」又は「an」の導入が、そのような導入を1つだけ含む実施形態に説明を限定することを意味すると解釈されるべきではない。要素を導入する定冠詞の使用についても同じことがいえる。
【0131】
さらに、本開示の特徴又は態様がマーカッシュグループに関して説明される場合、当業者は、本開示が、それによって、マーカッシュグループに含まれる任意の個々の構成又は構成のサブグループに関しても説明されることを認識するであろう。
【0132】
当業者には理解されるように、書面による説明を提供するなど、あらゆる目的のために、本明細書に開示されるすべての範囲は、ありとあらゆる部分範囲及びその部分範囲の組み合わせも包含する。記載された範囲は、同じ範囲を、少なくとも等しい半分、3分の1、4分の1、5分の1、10分の1などに分割することを十分に説明し、可能にするものとして容易に認識できる。非限定的な例として、本明細書で記載する各範囲は、下3分の1、中3分の1及び上3分の1などのように、容易に分割し得る。当業者には理解されるように、「~まで」、「少なくとも」などのすべての言語は、列挙された数を含み、前述のように、部分範囲に続いて分割できる範囲を指す。最後に、当業者には理解されるように、範囲には個々の構成の各々が含まれる。したがって、例えば、1~3個のセルを有する群は、1個、2個又は3個のセルを有する群を指す。同様に、1~5個のセルを有する群は、1個、2個、3個、4個又は5個のセルを有する群を指す。
【0133】
以上より、本開示の様々な実施形態が説明のために本明細書に記載されており、本開示の範囲及び思想から逸脱することなく様々な変更を行うことができることが理解されるであろう。したがって、本明細書に開示される様々な実施形態は、限定を意図するものではない。
【0134】
この開示は特許請求の範囲をともなうが、これらは本明細書に記載する実施形態の例示的な例を提供するためだけに提示されている。この特許出願の特許請求の範囲は、本明細書に記載する実施形態を限定するものではなく、代わりに、選択する実施形態をさらに説明し、支持する。本明細書に記載するそのような態様の範囲は、代わりに、2018年11月1日に出願された米国仮出願第62/754,481号の優先権を主張する本特許出願の利益を主張する、その後に提出される非仮出願に提示される可能性のある他の請求項によって特定され、その仮出願は、その全体が特定の参照により本明細書に援用される。
【0135】
本明細書に記載するすべての参考文献は、その全体が特定の参照によって本明細書に援用される。
【0136】
この特許出願は、2016年10月11日出願のPCT出願番号PCT/US16/56476の米国国内段階である米国出願番号15/766,805、2015年10月9日出願の米国仮出願番号62/239,604、2018年3月13日出願の米国出願番
号15/919,666、2017年9月25日出願の米国出願番号15/714,984及び2013年3月15日出願の米国出願番号13/842,004を相互参照し、これらは参照によってその全体が本明細書に援用される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
【手続補正書】
【提出日】2023-04-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
状態の遺伝子バイオマーカを特定するための、コンピュータによって実行される方法であって、前記状態は神経変性疾患であり、
対象の前記状態について、数の対象のために、表現型の画像の定量的画像解析を実行して、状態を検出するため85%又は85%超えの精度を有し、前記状態の疾患スペクトルの各所で疾患活動を反映する第1定量的表現型を得ること
前記複数対象につい定量的ゲノム解析を実行すること
前記定量的画像解析及び前記定量的ゲノム解析から、前記複数の対象における前記状態についての少なくとも1つの候補遺伝子バイオマーカを得ること
前記少なくとも1つの候補遺伝子バイオマーカを検証するために、前記少なくとも1つの候補遺伝子バイオマーカに対する臨床応答を予測することにより、検証メトリック(a validation metric)を決定すること、
前記少なくとも1つの候補遺伝子バイオマーカに基づき、前記少なくとも1つの候補遺伝子バイオマーカと生物学的に関連している、前記状態についての少なくとも1つの治療標的を特定すること
前記状態について特定された少なくとも1つの治療標的を含むレポートを生成すること
を含む方法
【請求項2】
請求項1に記載のコンピュータによって実行される方法において、
前記定量的ゲノム解析を実行することは、量的形質遺伝子座のゲノムワイド関連解析(QTL GWAS)を実行することを含む、方法。
【請求項3】
請求項に記載のコンピュータによって実行される方法において、
前記臨床応答の予測は、前記少なくとも1つの候補遺伝バイオマーカに関連する少なくとも1つの生物学的経路を調節するために実行する、方法。
【請求項4】
請求項に記載のコンピュータによって実行される方法において、
予測される前記臨床応答は、前記少なくとも1つの候補遺伝バイオマーカに関連する生物学的経路の少なくとも1つの生物学的に活性なタンパク質を阻害するために実行する、方法。
【請求項5】
請求項1に記載のコンピュータによって実行される方法において
前記対象の前記表現型の所定の時点での状態を正確に示す前記画像を得ること
定量的表現型について5%又はそれより高い表現型精度を得ること
前記対象の前記表現型の前記画像から前記状態として疾患を検出すること
疾患スペクトルの各所で疾患活動を定義すること又は、
前記対象の前記表現型の前記画像を用いて標準化取込値比(SUVR)解析を実行すること、のうちの少なくとも1つをさらに含む、方法
【請求項6】
請求項1に記載のコンピュータによって実行される方法において、
前記表現型の前記画像の前記定量的画像解析を実行することは
前記画像からボクセルベースのアミロイド標準化取込値比(SUVR)を計算すること
前記画像からボクセルベースのドーパミントランスポータ単一光子放射型断層撮影(DAT-SPECT)定量を計算すること、又は、
前記画像からボクセルベースのα-シヌクレインリガンド結合を計算すること、
のうちの少なくとも1つを含む、方法
【請求項7】
請求項1に記載のコンピュータによって実行される方法において、
前記画像は、陽電子放射断層撮影法(PET)、磁気共鳴画像法(MRI)、単一光子放射型断層撮影法(SPECT)及びそれらの組み合わせから選択される、方法。
【請求項8】
請求項に記載のコンピュータによって実行される方法において、
前記臨床応答を予測することは
振戦の定量化を実行すること又は、
自動化された振戦の定量化を実行すること、
のうちの少なくとも1つを含み、前記振戦の定量化は遺伝子型で比較される、方法
【請求項9】
請求項1に記載のコンピュータによって実行される方法において、
前記状態についての前記少なくとも1つの候補遺伝子バイオマーカに基づき遺伝子型から表現型の予測を実行することをさらに含む、方法。
【請求項10】
請求項に記載のコンピュータによって実行される方法において、
前記表現型の予測は
一塩基多型(SNP)モデルからの深層学習による表現型の予測すること、
陽電子放射断層撮影(PET)画像による定量的表現型の解析をすること、
深層学習SNPモデルによりボクセルベースのアミロイドSUVRを予測すること
深層学習SNPモデルによりボクセルベースのDAT-SPECT定量を予測すること
深層学習SNPモデルによりボクセルベースのα-シヌクレインリガンド結合を予測すること又は、
深層学習SNPモデルにより局所的セロトニン受容体リガンド結合を予測すること
のうちの少なくとも1つを含む、方法
【請求項11】
請求項1に記載のコンピュータによって実行される方法において、
前記レポートに前記少なくとも1つの候補遺伝子バイオマーカを載せること
前記少なくとも1つの候補遺伝子バイオマーカを有する生物学的経路を解析すること又は、
前記少なくとも1つの候補遺伝子バイオマーカを、前記状態に関連する生物学的経路と比較すること
のうちの少なくとも1つを含む、方法
【請求項12】
請求項に記載のコンピュータによって実行される方法において、
前記状態は、アルツハイマー病である、方法。
【請求項13】
請求項1に記載のコンピュータによって実行される方法において、
前記状態は、パーキンソン病である、方法。