(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-26
(54)【発明の名称】コンデンセートの表現型を同定する方法及びその使用
(51)【国際特許分類】
C12Q 1/04 20060101AFI20240216BHJP
【FI】
C12Q1/04
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023553278
(86)(22)【出願日】2022-03-01
(85)【翻訳文提出日】2023-09-01
(86)【国際出願番号】 US2022018311
(87)【国際公開番号】W WO2022187225
(87)【国際公開日】2022-09-09
(32)【優先日】2021-03-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-01-10
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521336185
【氏名又は名称】デューポイント セラピューティクス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】チェン, ウィリアム ダブリュー.
(72)【発明者】
【氏名】マンテイガ, ジョン シー.
(72)【発明者】
【氏名】ユー, ビオレタ
(72)【発明者】
【氏名】クォン, アン ディー.
(72)【発明者】
【氏名】ダンドライカー, ピーター ジェフリー
(72)【発明者】
【氏名】ビューテル, ブルース アーロン
(72)【発明者】
【氏名】ジャン, チー
(72)【発明者】
【氏名】ゼン, リンヤオ
(72)【発明者】
【氏名】シュテフェン, アンドレアス
(72)【発明者】
【氏名】フライターク, ダニエル フランツ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QA19
4B063QQ08
4B063QR48
4B063QR56
4B063QS33
4B063QS34
4B063QX02
(57)【要約】
本出願は、いくつかの態様では、疾患と関連する目的コンデンセートを同定する方法を提供する。また、疾患と関連する目的コンデンセートを同定するためのマーカーを同定する方法も提供される。他の態様では、同定された目的コンデンセートを介して疾患を処置するのに有用な治療薬を同定する方法が本明細書で提供される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
疾患と関連する目的コンデンセートを同定する方法であって、
(a)第1の細胞モデル由来の第1のコンデンセートの表現型を、第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること、を含み、
前記第1の細胞モデル及び前記第2の細胞モデル間の差異が、1つ以上の疾患関連因子に起因し、
前記1つ以上の疾患関連因子のうちの少なくとも1つが、前記第1の細胞モデルまたは前記第2の細胞モデルのいずれかに導入される、前記比較することと、
(b)前記目的コンデンセートに対する前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の差異に基づいて、前記疾患と関連する前記目的コンデンセートを同定すること、
を含む、前記方法。
【請求項2】
前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型が、それぞれ、1つ以上の表現型識別子を特徴とする、請求項1に記載の方法。
【請求項3】
前記1つ以上の表現型識別子が、コンデンセートの存在、不存在、レベル、形態的特徴、位置、挙動、組成、及び材料特性からなる群より選択される識別子を含む、請求項2に記載の方法。
【請求項4】
前記疾患と関連する前記1つ以上の疾患関連因子が、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス、及び環境刺激からなる群より選択される因子を含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記第2の細胞モデルが、前記疾患と関連する前記1つ以上の疾患関連因子に基づいて処置及び/または操作される、請求項1~4のいずれか1つに記載の方法。
【請求項6】
前記第1の細胞モデルが、前記疾患と関連する前記1つ以上の疾患関連因子に基づいて処置及び/または操作される、請求項1~5のいずれか1項に記載の方法。
【請求項7】
さらに、前記第2の細胞モデルを取得することを含む、請求項1~6のいずれか1項に記載の方法。
【請求項8】
さらに、前記第2の細胞モデルを生成することを含む、請求項1~7のいずれか1項に記載の方法。
【請求項9】
さらに、前記第1の細胞モデルを取得することを含む、請求項1~8のいずれか1項に記載の方法。
【請求項10】
さらに、前記第1の細胞モデルを生成することを含む、請求項1~9のいずれか1項に記載の方法。
【請求項11】
さらに、前記第1のコンデンセートの表現型を取得することを含む、請求項1~10のいずれか1項に記載の方法。
【請求項12】
前記第1のコンデンセートの表現型を取得することが、第1のマーカーの前記目的コンデンセートとの関連を測定することを含む、請求項11に記載の方法。
【請求項13】
前記第1のマーカーが、生物学的マーカーである、請求項12に記載の方法。
【請求項14】
前記第1のマーカーと前記目的コンデンセートとの前記関連が、イメージング手法を使用して決定される、請求項12または13に記載の方法。
【請求項15】
前記イメージング手法が、前記第1のマーカーを標識することを含む、請求項14に記載の方法。
【請求項16】
さらに、前記第2のコンデンセートの表現型を取得することを含む、請求項1~15のいずれか1項に記載の方法。
【請求項17】
前記第2のコンデンセートの表現型を取得することが、第2のマーカーの前記目的コンデンセートとの関連を測定することを含む、請求項16に記載の方法。
【請求項18】
前記第2のマーカーが、生物学的マーカーである、請求項17に記載の方法。
【請求項19】
前記第2のマーカーの前記目的コンデンセートとの前記関連が、イメージング手法を使用して決定される、請求項17または18に記載の方法。
【請求項20】
前記イメージング手法が、前記第2のマーカーを標識することを含む、請求項19に記載の方法。
【請求項21】
さらに、前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することを含む、請求項1~20のいずれか1項に記載の方法。
【請求項22】
前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することが、定性的評価を含む、請求項21に記載の方法。
【請求項23】
前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することが、定量的評価を含む、請求項21または22に記載の方法。
【請求項24】
前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することが、in silico手法を含む、請求項21~23のいずれか1項に記載の方法。
【請求項25】
前記目的コンデンセートが、前記第1の細胞モデル内に存在するか、または、それに由来する、請求項1~24のいずれか1項に記載の方法。
【請求項26】
前記目的コンデンセートが、前記第1の細胞モデルに存在しないか、または、それに由来しない、請求項1~24のいずれか1項に記載の方法。
【請求項27】
前記目的コンデンセートが、前記第2の細胞モデルに存在しないか、または、それに由来しない、請求項1~25のいずれか1項に記載の方法。
【請求項28】
前記目的コンデンセートが、前記第2の細胞モデル内に存在するか、または、それに由来する、請求項1~26のいずれか1項に記載の方法。
【請求項29】
前記目的コンデンセートが、ストレス顆粒、切断体、p顆粒、ヒストンローカス体、多小胞体、神経RNA顆粒、核内gem、核膜孔、核スペックル、核ストレス体、核小体、Oct1/PTF/転写(OPT)ドメイン、パラスペックル、傍核小体コンパートメント、PML核小体、PML発がんドメイン、ポリコーム体、プロセシング体、Sam68核小体、及びスプライシングスペックルからなる群より選択されるコンデンセートタイプに属する、請求項1~28のいずれか1項に記載の方法。
【請求項30】
前記疾患が、単一遺伝子疾患である、請求項1~29のいずれか1項に記載の方法。
【請求項31】
前記疾患が、多遺伝子疾患である、請求項1~29のいずれか1項に記載の方法。
【請求項32】
前記疾患が、多因子疾患である、請求項1~31のいずれか1項に記載の方法。
【請求項33】
前記疾患が、少なくとも部分的に、刺激及び/または外因性因子により引き起こされる、請求項1~32のいずれか1項に記載の方法。
【請求項34】
前記疾患が、感染因子により引き起こされる、請求項33に記載の方法。
【請求項35】
前記第1のマーカー及び前記第2のマーカーが、同じである、請求項17~34のいずれか1項に記載の方法。
【請求項36】
前記第1のマーカー及び前記第2のマーカーが、異なる、請求項17~34のいずれか1項に記載の方法。
【請求項37】
疾患と関連する目的コンデンセートを同定するのに有用なマーカーを同定する方法であって、
(a)複数の候補マーカーまたはその前駆体を、前記疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること、
(b)前記複数の候補マーカーのうちの少なくとも1つを、コンデンセート親和性因子について評価すること、及び
(c)前記疾患の前記1つ以上の疾患関連因子と所望の関連のレベルを有し且つ所望のコンデンセート親和性因子を有する前記マーカーに基づいて、前記複数の候補マーカーから前記マーカーを同定すること、
を含む、前記方法。
【請求項38】
さらに、前記疾患の前記1つ以上の疾患関連因子を同定することを含む、請求項37に記載の方法。
【請求項39】
前記疾患の前記1つ以上の疾患関連因子のそれぞれが、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス、及び環境刺激からなる群より選択される、請求項37または38のいずれか1つに記載の方法。
【請求項40】
さらに、前記疾患の前記1つ以上の疾患関連因子と関連する遺伝子またはノンコーディングバリアントを同定することを含む、請求項37~39のいずれか1項に記載の方法。
【請求項41】
各候補マーカーの、前記疾患の前記1つ以上の疾患関連因子との前記関連のレベルが、疾患原因因子スコアに基づいている、請求項37~40のいずれか1項に記載の方法。
【請求項42】
前記疾患原因因子スコアが、各候補マーカーの、前記疾患の前記1つ以上の疾患関連因子との関連の前記強度を反映する、請求項41に記載の方法。
【請求項43】
さらに、各候補マーカーに前記疾患原因因子スコアを割り当てることを含む、請求項41または42に記載の方法。
【請求項44】
前記コンデンセート親和性因子が、コンデンセート関連スコアに基づいている、請求項37~43のいずれか1つに記載の方法。
【請求項45】
前記コンデンセート関連スコアが、前記候補マーカーまたはその一部と、任意のコンデンセート、特定のコンデンセート、及び/またはコンデンセートと関連する高分子との関連の前記強度を反映する、請求項44に記載の方法。
【請求項46】
さらに、前記候補マーカーに前記コンデンセート関連スコアを割り当てることを含む、請求項44または45に記載の方法。
【請求項47】
前記コンデンセート関連スコアが、コンデンセート機能スコア及びコンデンセート親和性スコアの複合スコアである、請求項44~46のいずれか1項に記載の方法。
【請求項48】
前記コンデンセート機能スコアが、前記疾患の前記1つ以上の疾患関連因子と関連する前記候補マーカーもしくはその部分または前記遺伝子もしくは前記ノンコーディングバリアントの遺伝的変化が、
i)天然変性領域(IDR)内にあるかどうか、
ii)翻訳後修飾を受けるかどうか、
iii)前記疾患の前記1つ以上の疾患関連因子と関連する前記候補マーカーまたは前記遺伝子のスプライシングに影響を及ぼすかどうか、
iv)前記疾患の前記1つ以上の疾患関連因子と関連する前記遺伝子または前記ノンコーディングバリアントに近いクロマチン状態に影響を及ぼすかどうか、及び
v)前記疾患の前記1つ以上の疾患関連因子と関連する前記遺伝子の発現に影響を及ぼすかどうか、
のうちの1つ以上の因子に基づいて決定される、請求項47に記載の方法。
【請求項49】
前記1つ以上の因子のそれぞれが、前記コンデンセート機能スコアに寄与する重みを有する、請求項48に記載の方法。
【請求項50】
前記コンデンセート親和性スコアが、前記候補マーカーもしくはその一部、または前記疾患の前記1つ以上の疾患関連因子と関連する前記遺伝子において、
i)IDRの存在、不存在、量、及び/または程度、
ii)コンデンセート有利モチーフの存在、不存在、量、及び/または程度、ならびに
iii)相互作用ドメインの存在、不存在、量、及び/または結合価、
のうちの1つ以上の因子に基づいて決定される、請求項47に記載の方法。
【請求項51】
前記1つ以上の因子がそれぞれ、前記コンデンセート親和性スコアに寄与する重みを有する、請求項50に記載の方法。
【請求項52】
さらに、前記同定された遺伝子に基づいて遺伝子発現産物を同定することを含み、前記遺伝子発現産物またはその一部分が、前記複数の候補マーカーまたはその前駆体を送り込むために使用される、請求項40~51のいずれか1項に記載の方法。
【請求項53】
前記マーカーを前記複数の候補マーカーから同定することが、前記疾患の前記1つ以上の疾患関連因子との関連の前記所望のレベル及び前記所望のコンデンセート親和性因子に基づく累積スコアを含む、請求項37~52のいずれか1つに記載の方法。
【請求項54】
前記マーカーが、生物学的マーカーである、請求項37~53のいずれか1項に記載の方法。
【請求項55】
前記マーカーが、in silicoで同定される、請求項37~54のいずれか1項に記載の方法。
【請求項56】
さらに、前記マーカーが、前記疾患と関連する目的コンデンセートを同定するのに有用であることを検証することを含む、請求項37~55のいずれか1項に記載の方法。
【請求項57】
疾患と関連する目的コンデンセートを同定する方法であって、
(a)第1の細胞モデル由来の第1のコンデンセートの表現型を、第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること、を含み、
前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型が、請求項37~56のいずれか1項に記載の方法を使用して同定されたマーカーを使用して得られ、
前記第1の細胞モデル及び前記第2の細胞モデル間の差異が、前記疾患の1つ以上の疾患関連因子に起因し、
前記1つ以上の疾患関連因子のうちの少なくとも1つが、前記第1の細胞モデルまたは前記第2の細胞モデルのいずれかに導入される、前記比較することと、さらに、
(b)前記目的コンデンセートに対する前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の差異に基づいて、前記疾患と関連する前記目的コンデンセートを同定すること、
を含む、前記方法。
【請求項58】
コンデンセートの表現型を調節する化合物を同定する方法であって、
(a)前記化合物及び細胞モデルを含む組成物を混合すること、ならびに
(b)前記組成物の得られるコンデンセートの表現型を取得すること、
を含み、
前記得られるコンデンセートの表現型及び参照コンデンセートの表現型間の差異により、前記化合物が前記コンデンセートの表現型を調節することが同定される、前記方法。
【請求項59】
疾患の処置に有用な化合物を同定する方法であって、
(a)前記化合物及び第1の細胞モデルを含む組成物を混合すること、
(b)前記組成物の得られるコンデンセートの表現型を取得すること、
を含み、
前記得られるコンデンセートの表現型が、前記疾患の1つ以上の疾患関連因子と関連する表現型識別子の所望の調節を有する場合、前記化合物は、前記疾患の処置に有用であると同定される、前記方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年3月2日に出願された米国仮特許出願第63/155,683号及び2022年1月10日に出願された米国仮特許出願第63/298,171号の優先権の利益を主張し、それぞれの内容は、全体が参照により本明細書に組み込まれる。
【0002】
本出願は、生物学的コンデンセートの分野に関する。
【背景技術】
【0003】
従来の疾患研究及び治療薬発見への応用は、例えば、既知の細胞経路を介して、疾患関連生物学を引き起こすまたは媒介する個々の生体分子(分子標的)を同定することに焦点を当てている。この治療薬発見のアプローチには以下の2つの原則が不可欠である。(1)分子標的は、固有の分子標的活性の調節及び/または他の分子との相互作用が疾患の生物学を軽減するように作用し得る証拠を得るために、(例えば、遺伝的性質または薬理学を使用して)検証される必要がある、ならびに、(2)分子標的は、in vivoでの分子標的調節に所望の影響を及ぼすことが可能な少なくとも1つの治療法(例えば、小分子または抗体)を備えた「創薬可能」である必要がある。in vivo系が、非常に複雑であり、細胞経路及び生体分子の作用及び相互作用の本発明者らの理解は、多くの場合、不完全であり、さらに、単独で見た場合、全ての個々の生体分子が好適な薬剤標的であるとは限らないので、疾患研究及び治療薬発見に対する、この「単一標的」アプローチは、重大な制限を有する。そのような課題は、満たされていない医療ニーズに対処する新しい治療薬が現在不足していることの一因となっている。
【発明の概要】
【課題を解決するための手段】
【0004】
いくつかの態様では、疾患と関連する目的コンデンセートを同定する方法が本明細書で提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異が1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つが第1の細胞モデルまたは第2の細胞モデルのいずれかに導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。
【0005】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型は、それぞれ、1つ以上の表現型識別子を特徴とする。いくつかの実施形態では、1つ以上の表現型識別子は、コンデンセートの存在、不存在、レベル、形態的特徴、位置、挙動、組成、及び材料特性からなる群より選択される識別子を含む。
【0006】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患と関連する1つ以上の疾患関連因子は、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス(例えば、ストレス)、及び環境刺激からなる群より選択される因子を含む。
【0007】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、第2の細胞モデルは、疾患と関連する1つ以上の疾患関連因子に基づいて処置及び/または操作されている。
【0008】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、第1の細胞モデルは、疾患と関連する1つ以上の疾患関連因子に基づいて処置及び/または操作されている。
【0009】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第2の細胞モデルを取得することを含む。
【0010】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第2の細胞モデルを生成することを含む。
【0011】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第1の細胞モデルを取得することを含む。
【0012】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第1の細胞モデルを生成することを含む。
【0013】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第1のコンデンセートの表現型を取得することを含む。いくつかの実施形態では、第1のコンデンセートの表現型を取得することが、第1のマーカーの目的コンデンセートとの関連を測定することを含む。いくつかの実施形態では、第1のマーカーは、生物学的マーカーである。いくつかの実施形態では、第1のマーカーの目的コンデンセートとの関連は、イメージング手法を使用して決定される。いくつかの実施形態では、イメージング手法は、第1のマーカーを標識することを含む。
【0014】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第2のコンデンセートの表現型を取得することを含む。いくつかの実施形態では、第2のコンデンセートの表現型を取得することは、第2のマーカーの目的コンデンセートとの関連を測定することを含む。いくつかの実施形態では、第2のマーカーは、生物学的マーカーである。いくつかの実施形態では、第2のマーカーの目的コンデンセートとの関連は、イメージング手法を使用して決定される。いくつかの実施形態では、イメージング手法は、第2のマーカーを標識することを含む。
【0015】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することを含む。いくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することは、定性的評価を含む。いくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することは、定量的評価を含む。いくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することは、in silico手法を含む。
【0016】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、目的コンデンセートは、第1の細胞モデル内に存在するか、または、それに由来する。
【0017】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、目的コンデンセートは、第1の細胞モデル中に存在しないか、または、それに由来しない。
【0018】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、目的コンデンセートは、第2の細胞モデル中に存在しないか、または、それに由来しない。
【0019】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、目的コンデンセートは、第2の細胞モデル内に存在するか、または、それに由来する。
【0020】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、目的コンデンセートは、ストレス顆粒、切断体(cleavage body)、p顆粒、ヒストンローカス体、多小胞体、神経RNA顆粒、核内gem、核膜孔、核スペックル、核ストレス体、核小体、Oct1/PTF/転写(OPT)ドメイン、パラスペックル、傍核小体コンパートメント、PML核小体、PML発がんドメイン、ポリコーム体、プロセシング体、Sam68核小体、及びスプライシングスペックルからなる群より選択されるコンデンセートタイプに属する。
【0021】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患は、単一遺伝子疾患である。
【0022】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患は、多遺伝子疾患である。
【0023】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患は、多因子疾患である。
【0024】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患は、少なくとも部分的に、刺激及び/または外因性因子により引き起こされる。
【0025】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患は、感染因子により引き起こされる。
【0026】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、第1のマーカー及び第2のマーカーは、同じである。いくつかの実施形態では、第1のマーカー及び第2のマーカーは、異なる。
【0027】
他の態様では、疾患と関連する目的コンデンセートを同定するのに有用なマーカーを同定する方法が本明細書で提供され、方法は、(a)複数の候補マーカーまたはその前駆体を疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること、(b)複数の候補マーカーのうちの少なくとも1つをコンデンセート親和性因子について評価すること、及び(c)疾患の1つ以上の疾患関連因子との所望の関連のレベルを有し且つ所望のコンデンセート親和性因子を有するマーカーに基づいて、マーカーを複数の候補マーカーから同定すること、を含む。
【0028】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、疾患の1つ以上の疾患関連因子を同定することを含む。いくつかの実施形態では、疾患の1つ以上の疾患関連因子のそれぞれが、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス、及び環境刺激からなる群より選択される。
【0029】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、疾患の1つ以上の疾患関連因子と関連する遺伝子またはノンコーディングバリアントを同定することを含む。
【0030】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、疾患の1つ以上の疾患関連因子との各候補マーカーの関連のレベルは、疾患原因因子スコアに基づいている。いくつかの実施形態では、疾患原因因子スコアは、各候補マーカーの疾患の1つ以上の疾患関連因子との関連の強度を反映する。いくつかの実施形態では、方法は、さらに、各候補マーカーに疾患原因因子スコアを割り当てることを含む。
【0031】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、コンデンセート親和性因子は、コンデンセート関連スコアに基づいている。いくつかの実施形態では、コンデンセート関連スコアは、候補マーカーまたはその一部と、任意のコンデンセート、特定のコンデンセート、及び/またはコンデンセートと関連する高分子との関連の強度を反映する。いくつかの実施形態では、方法は、さらに、候補マーカーにコンデンセート関連スコアを割り当てることを含む。いくつかの実施形態では、コンデンセート関連スコアは、コンデンセート機能スコア及びコンデンセート親和性スコアの複合スコアである。いくつかの実施形態では、コンデンセート機能スコアは、以下の1つ以上の因子に基づいて決定される。疾患の1つ以上の疾患関連因子と関連する候補マーカーもしくはその部分または遺伝子もしくはノンコーディングバリアントの遺伝的変化が、i)天然変性領域(IDR)内にあるかどうか、ii)翻訳後修飾を受けているかどうか、iii)疾患の1つ以上の疾患関連因子と関連する候補マーカーまたは遺伝子のスプライシングに影響を及ぼすかどうか、iv)疾患の1つ以上の疾患関連因子と関連する遺伝子またはノンコーディングバリアントに近いクロマチン状態に影響を及ぼすかどうか、及び、v)疾患の1つ以上の疾患関連因子と関連する遺伝子の発現に影響を及ぼすかどうか。いくつかの実施形態では、コンデンセート機能スコアを決定するための1つ以上の因子は、それぞれ、コンデンセート機能スコアに寄与する重みを有する。いくつかの実施形態では、コンデンセート親和性スコアは、疾患の1つ以上の疾患関連因子と関連する候補マーカーもしくはその一部または遺伝子において、以下の1つ以上の因子に基づいて決定される。i)IDRの存在、不存在、量、及び/または程度、ii)コンデンセートを好むモチーフの存在、不存在、量、及び/または程度、ならびに、iii)相互作用ドメインの存在、不存在、量、及び/または結合価。いくつかの実施形態では、コンデンセート親和性スコアを決定するための1つ以上の因子は、それぞれ、コンデンセート親和性スコアに寄与する重みを有する。
【0032】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、同定された遺伝子に基づいて遺伝子発現産物を同定することを含み、遺伝子発現産物またはその一部が、複数の候補マーカーまたはその前駆体を送り込むために使用される。
【0033】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、マーカーを複数の候補マーカーから同定することは、疾患の1つ以上の疾患関連因子との所望の関連のレベル及び所望のコンデンセート親和性因子に基づく累積スコアを含む。
【0034】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、マーカーは、生物学的マーカーである。
【0035】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、マーカーは、in silicoで同定される。
【0036】
本明細書に記載の方法のいずれか1つによるいくつかの実施形態では、方法は、さらに、疾患と関連する目的コンデンセートを同定するのにマーカーが有用であることを検証することを含む。
【0037】
他の態様では、疾患と関連する目的コンデンセートを同定する方法が本明細書に提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1のコンデンセートの表現型及び第2のコンデンセートの表現型は、本明細書に記載の方法(例えば、上記の方法のいずれか1つ)を使用して同定されたマーカーを使用して得られ、第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つは、第1の細胞モデルまたは第2の細胞モデルのいずれかに導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。
【0038】
他の態様では、コンデンセートの表現型を調節する化合物を同定する方法が本明細書に提供され、方法は、(a)細胞モデルを含む化合物及び組成物を混合すること、ならびに、(b)得られた組成物のコンデンセートの表現型を取得すること、を含み、得られたコンデンセートの表現型及び参照コンデンセートの表現型間の差異により、化合物がコンデンセートの表現型を調節するものとして同定される。
【0039】
他の態様では、疾患の処置に有用な化合物を同定する方法が本明細書に提供され、方法は、(a)化合物と、第1の細胞モデルを含む組成物を混合すること、(b)得られる組成物のコンデンセートの表現型を取得すること、を含み、得られるコンデンセートの表現型が疾患の1つ以上の疾患関連因子と関連する表現型識別子の所望の調節を有する場合、化合物は、疾患の処置に有用であると同定される。
【0040】
本明細書に記載の実装の形態及び詳細の変更が、本開示の範囲から逸脱することなく、なされ得ることが、当業者らにも理解されるであろう。加えて、様々な利点、態様、及び目的が、様々な実装に関して記載されているが、本開示の範囲は、そのような利点、態様、及び目的に関して限定されるべきではない。
【0041】
特許出願及び刊行物を含む、本明細書で引用される参考文献は全て、全体が参照により本明細書に組み込まれる。
【図面の簡単な説明】
【0042】
【
図1】野生型RBM20ポリペプチド(A)、R636S変異型RBM20ポリペプチド(B)、R636C変異型RBM20ポリペプチド(C)、及びR636H変異型RBM20ポリペプチド(D)で一過性トランスフェクトされたH9C2細胞の蛍光画像を示す。
【0043】
【
図2】リード一塩基多型(SNP)内の遺伝子を評価するための例示的なワークフローの概略図を示す。
【0044】
【
図3】KCNJ11及びABCC8のゲノム遺伝子座にわたるSNPの濃縮を示す。
【0045】
【
図4】野生型デスモプラキン(DSP)ポリペプチド(A)、S299R変異型DSPポリペプチド(B)、及びQ331ter終結変異型DSPポリペプチド(C)と融合したGFPで一過性トランスフェクトされたiCell(登録商標)心筋細胞の蛍光画像を示す。細胞DNAもDAPIで染色した。
【0046】
【
図5】野生型デスモグレイン2(DSG2)ポリペプチド(A)及びW306ter終結変異型DSG2ポリペプチド(B)と融合したGFPで一過性トランスフェクトされたiCell(登録商標)心筋細胞の蛍光画像を示す。細胞DNAもDAPIで染色した。
【0047】
【
図6】野生型アルファ-プロテインキナーゼ3(ALPK3)ポリペプチド(A)、L1299P変異型ALPK3ポリペプチド(B)、L1622P変異型ALPK3ポリペプチド(C)、R1261ter終結変異型ALPK3ポリペプチド(D)、W1264ter終結変異型ALPK3ポリペプチド(E)、及びW1765ter終結変異型ALPK3ポリペプチド(F)と融合したGFPで一過性にトランスフェクトされたiCell(登録商標)心筋細胞の蛍光画像を示す。細胞DNAもDAPIで染色した。
【発明を実施するための形態】
【0048】
本出願は、いくつかの態様では、疾患と関連するコンデンセートの表現型を同定する方法を提供する。コンデンセートは、液液相分離により形成される膜のない分子集合体である。コンデンセートは、内因性分子及び外因性分子を含む、多くの分子を結びつける非常に動的なハブである。いくつかの実施形態では、コンデンセートの表現型は、1つ以上の表現型識別子、例えば、コンデンセートの存在、不存在、量、形態学的特徴(例えば、形状、サイズ、球形度)、位置(例えば、細胞質対核)、分布(例えば、細胞器官と比較)、挙動(例えば、速度論)、組成、または物質特性(例えば、流動性、繊維状、またはゲル状)を特徴とする。いくつかの実施形態では、コンデンセートの表現型は、疾患の機序(もしくはその一部)及び/または疾患の処置に有用な治療的介入の程度を解明し得る。いくつかの実施形態では、コンデンセートの表現型は、疾患(例えば、コンデンセート及び/または生体分子)の因子(例えば、原因因子)が観察される疾患生物学に現れる機能的機序を解明し得、従って、一部の場合では、治療標的を提供する。本開示は、少なくとも部分的に、例えば、目的コンデンセートの表現型及び/またはコンデンセートを調節することによる、例えば、疾患生物学におけるコンデンセートの役割、コンデンセート及びコンデンセートの表現型を研究するための関連細胞モデルの開発、ならびに疾患関連コンデンセートの表現型の同定、疾患と関連する目的コンデンセートの同定、及び疾患を処置するための治療薬の同定のための方法の開発に関する発明者らの知見及び独自の観点に基づいている。
【0049】
いくつかの態様では、疾患と関連するコンデンセートの表現型を同定する方法が本明細書で提供される。いくつかの実施形態では、コンデンセートの表現型は、疾患と関連する目的コンデンセートを同定するために使用される。いくつかの実施形態では、同定されたコンデンセートの表現型及び/または疾患と関連する目的コンデンセートは、疾患と関連する因子(例えば、原因因子)を同定するために使用される。他の態様では、目的コンデンセートの表現型及び/またはコンデンセートをイメージングする方法論が本明細書で提供される。いくつかの実施形態では、イメージング手法は、例えば、コンデンセート、コンデンセート成分、及び/または細胞の特徴を観察するために、生物学的マーカーなどのマーカーを利用する。いくつかの実施形態では、本明細書に記載のイメージング手法に有用なマーカー(例えば、マーカーパネル)及びマーカーを同定するための方法が本明細書で提供される。他の態様では、本明細書に記載の方法に有用な細胞モデルが本明細書で提供される。例えば、いくつかの実施形態では、2つの細胞モデルの比較により、目的コンデンセートの表現型及び/またはコンデンセートの同定が可能になる。いくつかの実施形態では、そのような細胞モデルを設計及び操作するための方法論が本明細書で提供される。
【0050】
これらの知見及び観点は、新たな創薬可能な分子標的(限定されないが、単一分子標的及びポリペプチド及び/または生物学的コンデンセートなどの核酸のコミュニティを含む)の同定ならびに疾患の処置に有用な化合物を同定する方法により、医薬品開発の新たな機会を生み出す。例えば、本明細書に記載の方法は、多遺伝子及び/または環境因子により影響を受ける疾患を含む、多因子疾患についてのコンデンセートに基づく仮説を同定及び検証するのに有用である。
【0051】
従って、いくつかの態様では、疾患と関連する目的コンデンセートを同定する方法が本明細書で提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異が1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つが第1の細胞モデルまたは第2の細胞モデルのいずれかに導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。
【0052】
他の態様では、疾患と関連する目的コンデンセートを同定する方法が本明細書に提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1のコンデンセートの表現型及び第2のコンデンセートの表現型は、本明細書に記載の方法を使用して同定されたマーカーを使用して得られ、第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つは、第1の細胞モデルまたは第2の細胞モデルのいずれかに導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。
【0053】
他の態様では、コンデンセートの表現型を調節する化合物を同定する方法が本明細書に提供され、方法は、(a)細胞モデルを含む化合物及び組成物を混合すること、ならびに、(b)得られた組成物のコンデンセートの表現型を取得すること、を含み、得られたコンデンセートの表現型及び参照コンデンセートの表現型間の差異により、化合物がコンデンセートの表現型を調節するものとして同定される。
【0054】
他の態様では、疾患の処置に有用な化合物を同定する方法が本明細書に提供され、方法は、(a)化合物と、第1の細胞モデルを含む組成物を混合すること、(b)得られる組成物のコンデンセートの表現型を取得すること、を含み、得られるコンデンセートの表現型が疾患の1つ以上の疾患関連因子と関連する表現型識別子の所望の調節を有する場合、化合物は、疾患の処置に有用であると同定される。
【0055】
他の態様では、疾患と関連する目的コンデンセートを同定するのに有用なマーカーを同定する方法が本明細書で提供され、方法は、(a)複数の候補マーカーまたはその前駆体を疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること、(b)複数の候補マーカーのうちの少なくとも1つをコンデンセート親和性因子について評価すること、及び(c)疾患の1つ以上の疾患関連因子との所望の関連のレベルを有し且つ所望のコンデンセート親和性因子を有するマーカーに基づいて、マーカーを複数の候補マーカーから同定すること、を含む。
【0056】
本明細書で使用されるセクションの見出しは、整理のみを目的としており、記載の主題を限定するものとして解釈されるべきではない。例えば、本開示のいくつかの態様は、モジュール形式で提示され、そのような提示は、本明細書で教示されるアプローチの可能な組み合わせを限定するものとして解釈されるべきではない。
【0057】
I.定義
この仕様を解釈するために、次の定義が適用され、必要に応じて、単数形で使用される用語には、複数形も含まれ、逆も同様である。以下に記載の任意の定義が、参照により本明細書に組み込まれる任意の文書と矛盾する場合には、記載の定義が優先するものとする。
【0058】
本明細書で使用される場合、「コンデンセート」は、1つ以上のタンパク質及び/または核酸などの他のポリマーの相分離(相分離の全ての段階を含む)により形成される非膜カプセル化コンパートメントを意味する。
【0059】
本明細書で使用される「ポリペプチド」及び「タンパク質」という用語は、アミノ酸残基を含むポリマーを指すために互換的に使用され得、最小長に限定されない。そのようなポリマーは、天然もしくは非天然のアミノ酸残基、またはそれらの組み合わせを含有してもよく、アミノ酸残基のペプチド、ポリペプチド、オリゴペプチド、二量体、三量体、及び多量体が挙げられるが、これらに限定されない。全長ポリペプチドまたはタンパク質、及びそれらのフラグメントは、本定義に包含される。用語には、その修飾種、例えば、限定されないが、メチル化、リン酸化グリコシル化、シアリル化、またはアセチル化を含む、1つ以上の残基の翻訳後修飾も含まれる。
【0060】
「抗体」という用語及びその文法的同等物には、全長抗体及びその抗原結合フラグメントが含まれる。全長抗体は、2つの重鎖及び2つの軽鎖を含む。本明細書で使用される「抗原結合フラグメント」という用語は、例えば、ダイアボディ、Fab、Fab’、F(ab’)2、Fvフラグメント、ジスルフィド安定化Fvフラグメント(dsFv)、(dsFv)2、二重特異性dsFv(dsFv-dsFv’)、ジスルフィド安定化ダイアボディ(dsダイアボディ)、一本鎖抗体分子(scFv)、scFvダイマー(二価ダイアボディ)、1つ以上のCDRを含む抗体の一部から形成される多重特異性抗体、ラクダ化単一ドメイン抗体、ナノボディ、ドメイン抗体、二価ドメイン抗体、抗原に結合するが完全な全長抗体構造を含まない任意の他の抗体フラグメント、または抗体模倣物(例えば、設計されたアンキリンリピートタンパク質(DARPin)、アフィマー、またはモノボディ(ADNECTINS(登録商標))を含む抗体フラグメントを指す。抗原結合フラグメントは、親抗体または親抗体フラグメント(例えば、親scFv)が結合するのと同じ抗原に結合することが可能である。
【0061】
本明細書で使用される「を含むこと」、「を有すること」、「を含有すること」、及び「が含まれること」という用語、ならびに他の同様の形態、ならびにその文法的同等物は、意味が同等であり、これらの単語のいずれか1つに続く項目(複数可)が、そのような項目(複数可)の網羅的なリストを意味しないか、または、記載された項目(複数可)のみに限定されることを意味するという点で、制約がないことが意図される。例えば、構成要素A、B、及びCを「含む」物品は、構成要素A、B、及びCで構成され(すなわち、それのみを含有し)得るか、または、構成要素A、B、及びCだけでなく他の1つ以上の構成要素を含有し得る。そのようなものであるから、「からなる」及びその類似の形態、ならびにその文法的同等物には、「から本質的になる」または「からなる」の実施形態の開示が含まれることが意図され、理解される。
【0062】
値の範囲が提供される場合、その範囲内の上限及び下限間の下限の単位の10の1の各介在値、ならびに、他の任意の所定値またはその所定範囲の介在値は、別途文脈に明確な指示がない限り、所定の範囲の特に除外される任意の端が適用される本開示に包含されると理解される。記載された範囲が端の一方または両方を含む場合、それらの含まれる端の一方または両方を除く範囲も開示に含まれる。
【0063】
本明細書の「約」値またはパラメータへの言及は、その値またはパラメータ自体に関する変動を含む(及び説明する)。例えば、「Xについて」という記載は、「X」についての記述を指す。
【0064】
添付の特許請求の範囲を含む本明細書で使用される場合、単数形「a」、「または」、及び「the」には、文脈に別途明示のない限り、複数の指示対象が含まれる。
【0065】
II.コンデンセートの表現型を同定する方法及びその使用
疾患と関連するコンデンセートの表現型を同定する方法が本明細書で提供される。いくつかの実施形態では、コンデンセートの表現型の同定により、疾患と関連する目的コンデンセートの同定が可能になる。いくつかの実施形態では、目的コンデンセートは、2つ以上のコンデンセートの表現型間の1つ以上の差異により同定される。例えば、いくつかの実施形態では、方法は、第1の細胞モデル(例えば、非疾患状態の細胞モデルまたは健常細胞モデル)由来の第1のコンデンセートの表現型及び第2の細胞モデル(例えば、疾患細胞モデル)由来の第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定することを含み、第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因する。いくつかの実施形態では、疾患と関連するコンデンセートの表現型は、疾患の細胞モデルの1つ以上の表現型識別子を含む。
【0066】
いくつかの実施形態では、疾患と関連するコンデンセートの表現型を同定する方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因する)、ならびに、(b)第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、疾患と関連するコンデンセートの表現型を同定すること、を含む。
【0067】
いくつかの実施形態では、疾患と関連するコンデンセートの表現型を同定する方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデルは、疾患の1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つは、第1の細胞モデルもしくは第2の細胞モデルのいずれか(または両方の細胞モデル、例えば、様々な疾患関連因子が導入)に導入される)、ならびに、(b)第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、疾患と関連するコンデンセートの表現型を同定すること、を含む。いくつかの実施形態では、1つ以上の疾患関連因子は、第1の細胞モデル及び第2の細胞モデルに導入される。いくつかの実施形態では、第1の細胞モデル及び第2の細胞モデルに導入される1つ以上の疾患関連因子は異なる。例えば、疾患への寄与が少ない疾患関連因子が第1の細胞モデルに導入され、疾患への寄与がより高い疾患関連因子が第2の細胞モデルに導入され、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異は、超拡大したコンデンセート対拡大したコンデンセートのような重大な差異であるが、非疾患状態の細胞モデルまたは健常な細胞モデルでは、コンデンセートはサイズがより小さい。
【0068】
いくつかの実施形態では、疾患と関連するコンデンセートの表現型を同定する方法は、第1の細胞モデル及び/または第2の細胞モデルを取得すること、例えば、生成すること、を含む。いくつかの実施形態では、方法は、細胞モデルの状態、例えば、処置及び/または刺激された状態、を生成することを含む。例えば、いくつかの実施形態では、方法は、コンデンセートの表現型を取得するのに適した細胞モデルの状態を生成することを含む。
【0069】
いくつかの実施形態では、疾患と関連するコンデンセートの表現型を同定する方法は、第1のコンデンセートの表現型及び/または第2のコンデンセートの表現型を取得すること、例えば、決定すること、を含む。いくつかの実施形態では、第1のコンデンセートの表現型及び/または第2のコンデンセートの表現型は、イメージング手法を使用して取得される。
【0070】
いくつかの実施形態では、目的コンデンセートを同定する方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連要因に起因する)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。
【0071】
いくつかの実施形態では、目的コンデンセートを同定する方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を、第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つが、第1の細胞モデルもしくは第2の細胞モデルのいずれか(または両方の細胞モデル、例えば、様々な疾患関連因子が導入)に導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。いくつかの実施形態では、1つ以上の疾患関連因子は、第1の細胞モデル及び第2の細胞モデルに導入される。
【0072】
いくつかの実施形態では、目的コンデンセートを同定する方法は、第1の細胞モデル及び/または第2の細胞モデルを取得すること、例えば、生成すること、を含む。いくつかの実施形態では、方法は、細胞モデルの状態、例えば、処置及び/または刺激された状態、を生成することを含む。例えば、いくつかの実施形態では、方法は、目的コンデンセートの表現型及び/またはコンデンセートを取得するのに適した細胞モデルの状態を生成することを含む。
【0073】
いくつかの実施形態では、目的コンデンセートを同定する方法は、第1のコンデンセートの表現型及び/または第2のコンデンセートの表現型を取得すること、例えば、決定すること、を含む。いくつかの実施形態では、第1のコンデンセートの表現型及び/または第2のコンデンセートの表現型は、イメージング手法を使用して取得される。
【0074】
疾患及びその疾患関連因子、細胞モデル、ならびにコンデンセートの表現型の特徴、及びそれらと関連する特徴を含む、方法の特定の特徴は、以下のセクションで、さらに詳細に記載される。そのような特徴のモジュール式の考察は、本明細書で記載の方法の範囲を限定することが意図されず、本明細書で提供される教示を使用すると、本明細書で提供される方法の全範囲に到達するために、モジュール式で記載される様々な特徴を容易に組み合わせ得る。
【0075】
A.疾患及びその疾患関連因子
本明細書に記載される目的コンデンセートの表現型及び/またはコンデンセートを同定する方法は、任意の疾患、例えば、疾患または病状の態様を媒介する、及び/または、それに寄与するコンデンセートを含む(またはそれを欠く)ことが仮定される疾患、を評価するために適用され得る。いくつかの実施形態では、同定された目的コンデンセートの存在(またはレベルの増加)は、疾患を媒介するか、または、それに起因する。いくつかの実施形態では、同定された目的コンデンセートの不存在(またはレベルの減少)は、疾患を媒介するか、または、それに起因する。いくつかの実施形態では、同定された目的コンデンセートの表現型は、疾患を媒介するか、または、それに起因する。いくつかの実施形態では、同定された目的コンデンセートは、例えば、診断及び/または治療薬のスクリーニングのための疾患のバイオマーカーとして機能し得る。本明細書に記載されるように、いくつかの実施形態では、疾患は、病状、例えば、進行または重症度のレベルを包含する。
【0076】
本明細書に包含される疾患は、単一の要因または複数の寄与する要因により発生及び/または進行し得る。いくつかの実施形態では、疾患は、少なくとも部分的に、単一の要因により引き起こされる。いくつかの実施形態では、疾患は、少なくとも部分的に、複数の要因により引き起こされる。いくつかの実施形態では、1つ以上の疾患関連因子が疾患と関連している。例えば、いくつかの実施形態では、疾患と関連する1つ以上の疾患関連因子は、遺伝的変化(例えば、遺伝子変異または遺伝的バリアント)、翻訳後修飾バリアント、外因性遺伝的物質、内因性化合物のレベル、外因性化合物のレベル、物理的プロセス(例えば、老化)、及び刺激からなる群より選択される因子を含む。いくつかの実施形態では、因子(例えば、遺伝的バリアント)は、例えば、約2、1.5、1、もしくは0.5以下のいずれかの対数オッズ比、または、0.95より高い浸透率を有する遺伝的バリアントの場合、疾患との弱い関連を有する。
【0077】
いくつかの実施形態では、疾患は、少なくとも部分的に、遺伝因子、例えば、遺伝的変化及び/またはその発現産物により引き起こされる。いくつかの実施形態では、疾患は、メンデル遺伝病である。いくつかの実施形態では、疾患は、単一遺伝子疾患である。いくつかの実施形態では、遺伝因子は、遺伝的変化である。いくつかの実施形態では、遺伝子変化は、限定されないが、一塩基多型(SNP)からより大きな遺伝子挿入、欠失、置換、もしくはリピート伸長、またはそれらの組み合わせまでを含む、遺伝的バリアントまたは遺伝子変異である。いくつかの実施形態では、遺伝的変化は、点変異、終結変異、切断変異、スプライシングに影響を及ぼす変異、またはフレームシフト変異である。いくつかの実施形態では、遺伝的変化は、遺伝子における遺伝的バリアントまたは遺伝子変異であり、コーディングSNPなどの「コーディングバリアント」と呼ばれることがある。いくつかの実施形態では、遺伝的変化は、ノンコーディング領域(プロモーター、イントロン、エンハンサー、遺伝子間領域(IGR)、DNaseI高感受性部位(DHS)を含むがこれらに限定されない)における遺伝的バリアントまたは遺伝子変異であり、ノンコーディングSNPなどの「ノンコーディングバリアント」と呼ばれることがある。いくつかの実施形態では、遺伝的バリアントまたは遺伝子変異は、ノンコーディングRNA(ncRNA)であるか、またはそれの中にある。いくつかの実施形態では、ノンコーディング領域またはncRNAにおける遺伝的バリアントまたは遺伝子変異は、i)転写及び/または発現レベル、ii)翻訳後修飾、ならびに、iii)疾患を(直接的または間接的に)引き起こすことが知られている遺伝子などの、疾患と関連する遺伝子(または遺伝子産物)の機能、のうちの1つ以上に影響を及ぼす。いくつかの実施形態では、疾患は、多遺伝子疾患である。いくつかの実施形態では、遺伝因子は、バリアントである。いくつかの実施形態では、遺伝因子は、マイナー対立遺伝子頻度が1%を超える一般的なバリアントである。いくつかの実施形態では、遺伝因子は、マイナー対立遺伝子頻度が1%未満のレアバリアントである。いくつかの実施形態では、遺伝因子は、発現レベルバリアントである。いくつかの実施形態では、遺伝因子は、スプライシングバリアントである。
【0078】
いくつかの実施形態では、疾患は、少なくとも部分的には、翻訳後修飾バリアントにより引き起こされる。いくつかの実施形態では、翻訳後修飾バリアントは、翻訳後修飾を含むポリペプチドである。翻訳後修飾は、当該技術分野で公知の任意の翻訳後修飾(例えば、以下を参照、“Post translational modifications:an overview,”2017,PROTEINTECH(登録商標)ブログを参照)(限定されないが、リン酸化、メチル化、グリコシル化、シアリル化、アセチル化、ADP-リボシル化、ファルネシル化、プレニル化、脱アミド化、タンパク質分解、ゲラニルゲラニル化、ヒドロキシル化、ユビキチン化、ニトロシル化、脂質化、O-GlcNAc化、及びUBL-タンパク質コンジュゲーション(例えば、スモイル化)を含む)であり得る。
【0079】
いくつかの実施形態では、疾患は、少なくとも部分的には、外因性遺伝物質により引き起こされる。いくつかの実施形態では、外因性遺伝物質は、感染因子に由来する。いくつかの実施形態では、感染因子は、ウイルス、例えば、Orthomyxoviridae、Filoviridae、Flaviviridae、Coronaviridae、adenoviridae、Anelloviridae、Arenaviridae、Astrovididae、Bornaviridae、Bunyaviridae、Caliciviridae、Hepadnaviridae、Hereviridae、Herpesviridae、Papillomaviridae、Paramyxoviridae、Retroviridae、Parvoviridae、Picobirnaviridae、Picobirna、Picornaviridae、Pneumoviridiae、Polyomaviridae、Reoviridae、Rhabdoviridae、Togaviridae、Delta、及びPoxviridae科のうちのいずれか1つのウイルスである。いくつかの実施形態では、感染因子は、細菌である。いくつかの実施形態では、感染因子は、真菌である。いくつかの実施形態では、感染因子は、寄生生物である。
【0080】
いくつかの実施形態では、疾患は、ウイルス感染により引き起こされる。いくつかの実施形態では、ウイルス感染は、限定されないが、コロナウイルス(例えば、SARS、MERS、SARS-CoV2)、エンテロウイルス、A型肝炎ウイルス及びE型肝炎ウイルス、インフルエンザウイルス、呼吸器ウイルス、またはノロウイルスによる感染などの急性感染症である。いくつかの実施形態では、ウイルス感染症は、限定されないが、HIV、B型肝炎ウイルス、C型肝炎ウイルス、及びD型肝炎ウイルス、またはヘルペスウイルス(例えば、サイトメガロウイルス、単純ヘルペスウイルス、水痘帯状疱疹ウイルス)による感染などの慢性感染症である。いくつかの実施形態では、慢性ウイルス感染(例えば、B型肝炎ウイルス感染またはC型肝炎ウイルス感染)は、持続的であり、何年にもわたって生じることがある。いくつかの実施形態では、ウイルス感染は、潜伏ウイルスにより引き起こされる。いくつかの実施形態では、潜伏ウイルスは、非複製状態で存在し、潜伏ウイルスは、多くの場合、生物へのストレスを通じて活性化されて、潜伏状態から抜け出し、急性の活動性感染になり得る。いくつかの実施形態では、潜伏期間の喪失及び活動性感染の誘導に対するストレスの影響は、生物学的コンデンセートを通じて調節され得る。いくつかの実施形態では、急性ウイルス感染及び慢性ウイルス感染の両方について、生物学的コンデンセートは、ウイルスの生活環と関連する。いくつかの実施形態では、生物学的コンデンセートは、先天性免疫応答及び/または適応免疫応答などの宿主の免疫応答と関連する。
【0081】
いくつかの実施形態では、疾患は、少なくとも部分的には、感染因子、例えば、ウイルス、細菌、真菌、または寄生生物により引き起こされる。いくつかの実施形態では、目的コンデンセートは、感染因子、例えば、細菌、真菌、寄生生物、またはウイルスの生存に関与しており、本明細書に記載される方法は、本明細書に記載の方法による目的コンデンセートを評価するために感染因子の遺伝子を使用する。例えば、いくつかの実施形態では、方法は、感染因子の遺伝子性質が相分離し、及び/または既知のコンデンセートタンパク質と相互作用する傾向を予測することを含む。いくつかの実施形態では、細胞へのウイルスの導入は、感染細胞に特異的な目的コンデンセートの表現型及び/またはコンデンセートを同定するために、非感染細胞と比較することができる。いくつかの実施形態では、マイコプラズマジウムまたは細胞内寄生生物に感染した細胞は、感染細胞に特異的な目的コンデンセートの表現型及び/またはコンデンセートを同定するために、非感染細胞と比較することができる。いくつかの実施形態では、感染因子の遺伝子は、複製及び/または増殖と関連する感染因子の遺伝子である。
【0082】
いくつかの実施形態では、疾患は、少なくとも部分的に、内因性化合物のレベル(存在及び非存在を含む)により引き起こされる。いくつかの実施形態では、内因性化合物は、ホルモンである。いくつかの実施形態では、内因性化合物は、サイトカインである。いくつかの実施形態では、内因性化合物は、細胞プロセスの代謝産物、例えば、核酸生合成、代謝、アポトーシス、エンドサイトーシス、クエン酸回路中などの代謝産物である。
【0083】
いくつかの実施形態では、疾患は、少なくとも部分的に、外因性化合物のレベル(存在及び非存在を含む)により引き起こされる。いくつかの実施形態では、外因性化合物は、栄養素、毒性物質、及び毒素原からなる群より選択される。
【0084】
いくつかの実施形態では、疾患は、少なくとも部分的に、物理的プロセス、例えば、ストレス、老化、物理的外傷(例えば、反復性脳損傷)、感染、及び付随する応答(例えば、高熱)、細胞ストレス条件下などの恒常性を維持する能力に悪影響を及ぼす遺伝的変化のレベル(存在及び不存在を含む)により引き起こされる。いくつかの実施形態では、疾患は、少なくとも部分的に、慢性ストレスにより引き起こされる。
【0085】
いくつかの実施形態では、疾患は、少なくとも部分的に、刺激のレベル(存在及び非存在を含む)により引き起こされる。いくつかの実施形態では、刺激は、環境刺激である。いくつかの実施形態では、刺激は、温度、光、音、痛み、pH、及び圧力からなる群より選択される。いくつかの実施形態では、疾患は、少なくとも部分的に、食事により引き起こされる。いくつかの実施形態では、刺激は、ストレスを誘発する。
【0086】
いくつかの実施形態では、疾患は、神経変性疾患、例えば、筋萎縮性側索硬化症(ALS)、多発性硬化症、前頭側頭障害、パーキンソン病、及びアルツハイマー病である。いくつかの実施形態では、疾患は、がんなどの増殖性障害である。いくつかの実施形態では、疾患は、自己免疫疾患などの免疫疾患、またはサイトカイン放出症候群(CRS)などの過剰な免疫応答である。いくつかの実施形態では、疾患は、線維症形成と関連する。いくつかの実施形態では、疾患は、心臓病、例えば、家族性または非家族性拡張型心筋症(DCM)、例えば、RNA結合モチーフタンパク質20(RBM20)、デスモプラキン(DSP)、デスモグレイン-2(DSG2)、及びアルファプロテインキナーゼ3(ALPK3)のうちの1つ以上における変異により直接的または間接的に引き起こされるか、またはそれと関連するDCMである。いくつかの実施形態では、疾患は、代謝障害と関連する。
【0087】
B.細胞モデルシステム
いくつかの態様では、本明細書に記載される目的コンデンセートの表現型及び/またはコンデンセートを同定する方法に有用な細胞モデルが本明細書で提供される。
【0088】
いくつかの実施形態では、細胞モデルは、疾患または疾患状態の細胞モデル(例えば、疾患細胞モデル)であり、細胞モデルは、疾患に起因する1つ以上の疾患関連因子を含む。いくつかの実施形態では、細胞モデルの設計に有用な疾患関連因子を同定する方法が本明細書に提供される。いくつかの実施形態では、疾患は、複数の疾患関連因子を有する多因子疾患であり、疾患の細胞モデルは、疾患に起因する1つ以上の疾患関連因子を含む。いくつかの実施形態では、細胞モデルは、対照または健常な状態の細胞モデルであり、対照または健常な細胞モデルは、疾患に起因する1つ以上の疾患関連因子を含まない。
【0089】
いくつかの実施形態では、目的コンデンセートの表現型及び/またはコンデンセートを同定する方法は、2つの細胞モデルを比較することを含む。いくつかの実施形態では、方法は、2つの細胞モデルを比較することを含み、2つの細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因する。いくつかの実施形態では、2つの細胞モデルは、単一の細胞モデル供給源から取得され、例えば、第1の細胞モデルは、細胞モデル供給源であり、第2の細胞モデルは、細胞モデル供給源の修正バージョンである。いくつかの実施形態では、第1の細胞モデルは、細胞モデル供給源の第1の修正バージョンであり、第2の細胞モデルは、細胞モデル供給源の第2の修正バージョンである。いくつかの実施形態では、2つの細胞モデルは、非疾患または健常細胞モデル及び疾患細胞モデルである。いくつかの実施形態では、2つの細胞モデルは、双方ともに、疾患の1つ以上の疾患関連因子に起因する差異を有する疾患細胞モデル、例えば、異なる疾患の重症度を有する疾患細胞モデル(または、疾患表現型、例えば、遺伝子の異なる遺伝的バリアントもしくは異なる遺伝子に起因するものなど)である。いくつかの実施形態では、疾患と関連する1つ以上の疾患関連因子は、知られていないか、または完全には知られていない。
【0090】
本明細書に記載される細胞モデルは、例えば、細胞モデルを含む組成物中に、任意数の個々の細胞を含んでもよい。いくつかの実施形態では、組成物は、細胞モデルの複数の細胞を含み、複数の細胞は、均一である。
【0091】
いくつかの実施形態では、細胞モデルは、トランスフェクトされた細胞モデル(例えば、安定にまたは一過性トランスフェクトされたもの)である。いくつかの実施形態では、細胞モデルは、安定細胞モデルである。いくつかの実施形態では、細胞モデルは、哺乳動物細胞などの動物細胞であるか、または、それに由来する。いくつかの実施形態では、細胞モデルは、ヒト細胞であるか、または、それに由来する。いくつかの実施形態では、細胞モデルは、ニューロンであるか、または、それに由来する。いくつかの実施形態では、細胞モデルは、がん細胞であるか、または、それに由来する。いくつかの実施形態では、細胞モデルは、HEK293細胞などの細胞株、またはHeLa細胞などの疾患細胞株に由来する。いくつかの実施形態では、細胞モデルは、人工多能性幹細胞(iPSC)、例えば、iPSC由来運動ニューロン(iPSC-MN)またはiPSCに由来する心筋細胞(iPSC-CM)、例えば、iCell(登録商標)心筋細胞であるか、または、それに由来する。いくつかの実施形態では、細胞モデルは、生検または組織試料、例えば、患者試料、例えば、健常な生検または疾患の生検または組織試料に由来する。いくつかの実施形態では、細胞モデルは、健常な肺組織または疾患ドナー肺組織などのヒト初代肺線維芽細胞に由来する。いくつかの実施形態では、細胞モデルは、55歳未満などの若い個体に由来する。いくつかの実施形態では、細胞モデルは、55歳以上などの高齢の個体に由来する。いくつかの実施形態では、細胞モデルは、疾患と関連する1つ以上の疾患関連因子を含む。
【0092】
他の態様では、細胞モデルを同定及び/または作製することを含む方法が本明細書で提供される。いくつかの実施形態では、方法は、細胞モデルを取得することを含む。いくつかの実施形態では、細胞モデルは、健常な個体または病気の個体から得られる。いくつかの実施形態では、疾患と関連する1つ以上の疾患関連因子は、細胞モデルに導入される。いくつかの実施形態では、方法は、細胞モデルを生成することを含む。いくつかの実施形態では、細胞モデルは、疾患と関連する1つ以上の疾患関連因子に基づいて処置及び/または操作される。
【0093】
細胞モデルを作成する手法は、当該技術分野で周知である。いくつかの実施形態では、細胞モデルは、疾患と関連する1つ以上の疾患関連因子に基づいて、前駆体の態様を調節することにより、細胞モデルの前駆体から生成される。例えば、細胞モデルは、前駆細胞を酸化ストレスなどのストレスに曝すか、または前駆細胞を小分子化合物もしくはホルモンで処置することにより生成することができる。いくつかの実施形態では、細胞モデルは、前駆細胞をウイルス、細菌、真菌、または寄生生物による感染などの感染に曝すことにより得られる。いくつかの実施形態では、細胞モデルは、遺伝的特徴またはその発現産物のノックダウンまたはノックアウトを介して、例えば、当該技術分野で既知の任意の方法、例えば、RNAi、TALEN、ZFN、またはCRISPR/Cas、により作製される。いくつかの実施形態では、細胞モデルは、ノックインにより提供される。いくつかの実施形態では、細胞モデルは、トランスフェクションを介して生成される。いくつかの実施形態では、細胞モデルは、標識、例えば、GFP、に融合されたポリペプチドなどの融合ポリペプチドでトランスフェクトされる。いくつかの実施形態では、細胞モデルは、野生型ポリペプチドでトランスフェクトされる。いくつかの実施形態では、細胞モデルは、変異型ポリペプチドなどのバリアントポリペプチドでトランスフェクトされる。いくつかの実施形態では、細胞モデルは、あるレベルの遺伝子発現産物を発現するようにトランスフェクトされる。いくつかの実施形態では、発現レベルバリアント細胞モデルは、遺伝子発現産物が所定のレベルに達した時に作製され、本明細書に記載の方法で使用される。
【0094】
いくつかの実施形態では、細胞モデルは、トランスフェクトして、野生型ポリペプチドなどのポリペプチドを、ほぼ内因性レベルで発現させる。いくつかの実施形態では、細胞モデルは、野生型ポリペプチドなどのポリペプチドを発現せず、ほぼ内因性レベルは、別の細胞モデルにおけるポリペプチドの発現レベルに基づいている。いくつかの実施形態では、細胞モデルは、標識野生型ポリペプチドなどの標識を有するポリペプチドを、ほぼ内因性レベルで発現するようにトランスフェクトされ、ほぼ内因性レベルは、ポリペプチドのそれぞれの未標識バージョンの発現レベルに基づいている。いくつかの実施形態では、細胞モデルは、未標識ポリペプチドの発現が減少しており、例えば、細胞モデルは、未標識ポリペプチドのノックアウトを含む。いくつかの実施形態では、細胞モデルは、バリアントポリペプチドのそれぞれの野生型ポリペプチドの内因性発現レベルと実質的に同様のレベルで、バリアントポリペプチド、例えば、変異型ポリペプチド(例えば、点変異、切断変異、フレームシフト変異、または終結変異)を発現するようにトランスフェクトされる。本明細書に記載されるように、いくつかの実施形態では、「ほぼ内因性レベル」または「実質的に類似」という用語は、ポリペプチドの測定された内因性レベルの2倍の差以内にあるポリペプチド発現レベルを指す。
【0095】
C.コンデンセートの表現型
いくつかの態様では、例えば、疾患と関連する目的コンデンセートを同定するための、本明細書に記載の方法に有用なコンデンセートの表現型が本明細書に提供される。コンデンセートの表現型を取得する、例えば、決定する方法も提供される。
【0096】
本明細書に記載されるように、いくつかの実施形態では、コンデンセートの表現型は、細胞モデルのコンデンセートと関連する1つ以上の観察可能なもしくは測定可能な特徴または表現型識別子を含む。例えば、コンデンセートと関連する観察可能なまたは測定可能な特徴または表現型識別子は、細胞モデルの細胞を含む組成物をイメージングすることにより決定され得る。コンデンセートの表現型の観察可能または測定可能な特徴には、コンデンセートの存在(不存在及びレベル/量を含む)、位置、分布、動態(例えば、形成または溶解の動態)、形態学的(例えば、サイズ、形状、球形性)、物質(例えば、流動性または剛性)、及び組成特性が含まれるが、これらに限定されない。
【0097】
いくつかの実施形態では、コンデンセートの表現型は、1つ以上の表現型識別子、例えば、コンデンセートの存在、不存在、レベル、形態学的特徴、位置、挙動、組成、及び物質特性からなる群より選択される識別子を特徴とする。いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセートの存在を含む。いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセートの不存在(消失または溶解を含む)を含む。いくつかの実施形態では、コンデンセートの表現型は、個々のコンデンセートの数及び/またはサイズの特徴に基づく量を含む、目的コンデンセートの量を含む。いくつかの実施形態では、コンデンセートの表現型は、成分(例えば、生物学的マーカーなどのマーカー、または特定の条件下でコンデンセートの成分となる1つ以上の他の生体分子)を含む、及び/または含まない、目的コンデンセートの量を含む。いくつかの実施形態では、コンデンセートの表現型は、生体分子(例えば、ポリペプチド、DNA、RNA)などのマーカーの目的コンデンセートとの関連のレベル(例えば、量及び/または強度)を含む。いくつかの実施形態では、コンデンセートの表現型は、細胞モデルにおける第1の生体分子(例えば、ポリペプチド、DNA、RNA)の第2の生体分子との関連のレベル(例えば、量及び/または強度)を含み、生体分子の一方または両方は、目的コンデンセートと関連するか、または2つの生体分子は、異なるコンデンセートと関連する。いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセート内の目的コンデンセートの成分の存在量(または関連のレベル)を含む。いくつかの実施形態では、コンデンセートの表現型は、細胞内位置などの、目的コンデンセートまたはその成分の位置を含む。例えば、コンデンセートまたはその成分が健常な状態(例えば、疾患状態下で細胞質に移動する)中で通常存在しない場所に、コンデンセートまたはその成分が移動する。いくつかの実施形態では、コンデンセートの表現型は、(例えば、他の細胞小器官、他のコンデンセート、または他の生体分子に対する)目的コンデンセートまたはその成分の分布を含む。例えば、コンデンセートまたはその成分は、健常な状態での分布の仕方と比較して、細胞内位置でより密に分布する(例えば、ゴルジ装置の周囲に密に分布する)。いくつかの実施形態では、コンデンセートの表現型は、細胞モデルにおける目的コンデンセートの形態学的特徴、例えば、サイズ、形状、体積、表面積、及び/または球形度、を含む。いくつかの実施形態では、コンデンセートの表現型は、細胞当たりのコンデンセートの数を含む。いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセートの組成を含む。いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセートの挙動または物質特性、例えば、動的特性、流動性、固体性、または繊維形成、を含む。いくつかの実施形態では、コンデンセートの表現型は、コンデンセート形成の動態に関する情報を含む。いくつかの実施形態では、コンデンセートの表現型は、コンデンセートの溶解の動態に関する情報を含む。いくつかの実施形態では、コンデンセートの表現型は、外部刺激に応答した、形成または溶解特性などの表現型識別子の変化を含む。
【0098】
いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセートが細胞モデル中に存在するか、または、それに由来することを示す。いくつかの実施形態では、コンデンセートの表現型は、目的コンデンセートが細胞モデルに存在しないか、または、それに由来しないことを示す。
【0099】
例えば、いくつかの実施形態では、コンデンセートの表現型を取得することは、マーカーと目的コンデンセートとの関連を測定することを含む。いくつかの実施形態では、マーカーは、生物学的マーカー、例えば、ポリペプチド、DNA、RNA(コーディングもしくはノンコーディング)、またはそれの任意の修飾、例えば、ポリペプチドの翻訳後修飾(例えば、リン酸化、グリコシル化、O-GlcNAc化、UBLタンパク質コンジュゲーション(例えば、スモイル化)、メチル化、シアリル化、アセチル化、ADP-リボシル化、ファルメシル化、プレニル化、脱アミド化、タンパク質分解、ゲラニルゲラニル化、ヒドロキシル化、ユビキチン化、ニトロシル化、脂質化)、エピジェネティック修飾(例えば、ヒストンのアセチル化もしくはメチル化、DNAメチル化など)、または核酸の修飾(例えば、RNAキャッピング)である。いくつかの実施形態では、マーカーの目的コンデンセートとの関連は、本明細書に記載のイメージング手法のいずれかのようなイメージング手法を使用して決定される。いくつかの実施形態では、イメージング手法は、マーカーを標識すること、例えば、蛍光(例えば、GFP)融合タンパク質として、またはIF染色を介してマーカーを発現すること、を含む。
【0100】
いくつかの実施形態では、本明細書に記載の方法は、例えば、イメージング手法などを使用して、第1の細胞モデルにおける第1のマーカー(例えば、第1の生物学的マーカー)の目的コンデンセートとの関連を測定することにより第1のコンデンセートの表現型を取得すること、及び、第2の細胞モデルにおける第2のマーカー(例えば、第2の生物学的マーカー)の目的コンデンセートとの関連を測定することにより第2のコンデンセートの表現型を取得すること、を含む。いくつかの実施形態では、方法は、さらに、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することを含む。いくつかの実施形態では、第1のマーカー及び第2のマーカーは、同じである。いくつかの実施形態では、第1のマーカー及び第2のマーカーは、異なる。
【0101】
本明細書及び以下のセクションで考察されるように、いくつかの実施形態では、コンデンセートの表現型は、標識手法を使用して決定される。例えば、いくつかの実施形態では、標識された生物学的マーカーなどの標識マーカーの使用は、コンデンセートの視覚化、及びその関連する観察可能なまたは測定可能な特性の決定を容易にする。いくつかの実施形態では、標識マーカーは、コンデンセートと関連し、例えば、コンデンセートに分配される。いくつかの実施形態では、標識マーカーは、コンデンセートと関連しない。
【0102】
1.マーカー及び生物学的マーカー
いくつかの態様では、コンデンセート及び/またはコンデンセートの表現型を同定するのに有用な生物学的マーカーなどのマーカーが本明細書に提供される。いくつかの実施形態では、コンデンセート及び/またはコンデンセートの表現型を評価するために、生物学的マーカーなどのマーカーを使用する方法が本明細書に提供される。いくつかの実施形態では、コンデンセート及び/またはコンデンセートの表現型を評価または同定するために有用な、生物学的マーカーなどのマーカーを同定する方法が本明細書に提供される。
【0103】
本明細書に記載のマーカー及び生物学的マーカーは、特定の(必ずしも全てではない)状態のコンデンセートと関連すると知られているか、または仮定されている任意の組成物(例えば、ポリペプチドなどの生体分子、DNA(コーディングもしくはノンコーディング)、RNA(コーディングもしくはノンコーディング)、ホルモン、または小分子化合物)であり得る。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)は、コンデンセートと関連することがこれまで知られておらず、in silico法などの本明細書に記載の方法のいずれかで同定される。マーカーまたは生物学的マーカーという用語の使用は、マーカーまたは生物学的マーカーが、常に、細胞モデル内の、または、それに由来するコンデンセートと関連することを意味することが意図されない。いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルの、または、それに由来するコンデンセートと関連する。いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルの、または、それに由来するコンデンセートに分配される。いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルの、または、それに由来するコンデンセートと関連しない。
【0104】
いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルまたは細胞モデルを含む組成物中で見出されるか、または産生される高分子である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、コンデンセートと関連する高分子である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、コンデンセートから解離する高分子である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、コンデンセートに分配される高分子である。いくつかの実施形態では、生物学的マーカー(例えば、ノンコーディングバリアント)などのマーカーは、i)転写及び/または発現レベル(例えば、存在量)、ii)翻訳後修飾、ならびに、iii)コンデンセートと関連するか、コンデンセートから解離するか、またはコンデンセートに分配される高分子の機能(例えば、他の分子(例えば、タンパク質)または薬剤(例えば、化合物)との結合、コンデンセートへの取り込み、またはコンデンセートからの解離)への結合)、のうちの1つ以上に影響を及ぼす。いくつかの実施形態では、生物学的マーカーなどのマーカーは、融合ポリペプチド(例えば、GFP融合ポリペプチド)を含むポリペプチドである。いくつかの実施形態では、生物学的マーカーなどのマーカーは、コーディングまたはノンコーディング核酸のいずれかのDNAまたはRNAなどの核酸である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、遺伝子または遺伝子産物(例えば、RNAもしくはポリペプチド)である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、対立遺伝子(例えば、リードSNPなどの一塩基多型(SNP)対立遺伝子)、例えば、コーディングまたはノンコーディングSNPである。いくつかの実施形態では、生物学的マーカーなどのマーカーは、定量的形質遺伝子座(QTL)またはQTLと関連する遺伝子、例えば、発現QTL(eQTL)またはeQTLと関連する遺伝子である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、脂質である。いくつかの実施形態では、生物学的マーカーなどのマーカーは、ホルモンである。いくつかの実施形態では、マーカーは、色素などの小分子化合物(例えば、1000Da以下の分子量を有する)、または診断/治療薬である。
【0105】
一般的に言えば、QTLは、表現型、例えば、疾患表現型における量的形質の変化と相関するゲノム遺伝子座であり、eQTLは、mRNAの発現レベルの変化と相関するゲノム遺伝子座である。QTL及びeQTLは、観察された形質または発現変化と相関する分子マーカー(例えば、SNP)でマッピングすることができる。
【0106】
生体内の同じ遺伝子の2つの対立遺伝子間の配列の変化は、「対立遺伝子多型」と呼ばれる。多型は、コーディング領域内のヌクレオチドに存在し得るが、遺伝コードの縮重により、アミノ酸配列の変化はコードされない。あるいは、多型配列は、特定の位置で異なるアミノ酸をコードし得るが、アミノ酸の変化は、タンパク質の機能に影響を及ぼさない。多型領域は、遺伝子のノンコーディング領域、またはゲノム内の任意のノンコーディング領域にも見出され得る。いくつかの実施形態では、多型は、遺伝子のコーディング領域、または遺伝子の非翻訳領域(例えば、5’UTR、イントロン、または3’UTR)で見出される。「一塩基多型」または「SNP」は、各対立遺伝子が対立遺伝子のDNA配列中の単一ヌクレオチドの置換により異なる多型を指す。SNPは、ノンコーディング領域(ノンコーディングSNP)にも存在し得る。いくつかの場合では、単一ヌクレオチドの変化により、対応する遺伝子産物(すなわち、タンパク質)の構造及び/または機能が変化し得る。いくつかの実施形態では、ノンコーディングSNPは、i)転写及び/または発現レベル、ii)翻訳後修飾、及び、iii)遺伝子(または遺伝子産物、例えば、コンデンセートへの取り込み、または、それからの解離)の機能、のうちの1つ以上に影響を及ぼし得る。ほとんどのSNPでは、4つの可能なヌクレオチド(A、T、C、またはG)のうち2つだけが観察される。SNPは、二、三、または四対立遺伝子多型であり得る。しかし、ヒトでは、三対立遺伝子及び四対立遺伝子のSNPは、まれであり、SNPは、単に二対立遺伝子マーカーと呼ばれる。
【0107】
SNPのセットは、公的に入手可能な遺伝子の配列情報を分析すること、及び、ヌクレオチド変化を有する遺伝子の別の形態を同定することにより決定することができる。例えば、Genecardsなどのいくつかのデータベースは、SNPの配列を提供する。いくつかの実施形態では、制限酵素切断配列の存在について、SNP部位が分析される。いくつかの実施形態では、SNP(コーディングSNPまたはノンコーディングSNP)(例えば、疾患と関連する、または疾患の1つ以上の疾患関連因子と関連するSNP)は、ゲノムワイド関連解析(GWAS)を使用して同定される。いくつかの実施形態では、SNPは、GWAS知見に機能的に注釈を付け、最も可能性の高い原因SNP及び遺伝子に優先順位を付けるウェブベースのプラットフォームであるFUMAを使用して同定される(例えば、以下を参照、K.Watanabe et al.,“Functional mapping and annotation of genetic associations with FUMA,”Nat Commun.2017;8(1):1826、この内容は、全体が参照により本明細書に組み込まれる)。
【0108】
従って、いくつかの実施形態では、候補マーカーなどのマーカーは、GWASで同定される。いくつかの実施形態では、候補マーカーなどのマーカーは、FUMAで同定される。いくつかの実施形態では、マーカーは、本明細書に記載の任意のマーカーまたは疾患関連因子(例えば、遺伝的バリアント)の同定方法により同定される(例えば、セクション「D.マーカー及び/または疾患関連因子を同定する方法」ならびに以下の実施例3を参照)。いくつかの実施形態では、候補マーカーなどのマーカーは、eQTLマッピングなどのQTLマッピングで同定される。
【0109】
本明細書に記載されるマーカー及び生物学的マーカーは、細胞モデルに対して天然でも、非天然(例えば、導入されたもの)でもよい。例えば、いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルにおいて天然に発現されるポリペプチドである。いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルに(例えば、トランスフェクションを介して)導入されるポリペプチドである。いくつかの実施形態では、細胞モデルに導入されたポリペプチドは、細胞モデルで天然に発現されるか、またはそれの遺伝物質に天然にコードされる。いくつかの実施形態では、細胞モデルに導入されたポリペプチドは、標識と融合されたポリペプチドなど、細胞モデルで天然に発現されたポリペプチドに由来する修飾バージョンである。いくつかの実施形態では、生物学的マーカーなどのマーカーは、ストレス、老化、混雑、感染などの特定の条件下の細胞モデルで天然に発現されるポリペプチドである。いくつかの実施形態では、生物学的マーカーなどのマーカーは、細胞モデルと関連する、例えば、細胞モデルにより発現されることが知られている。いくつかの実施形態では、生物学的マーカーなどのマーカーは、疾患と関連することが知られている。いくつかの実施形態では、生物学的マーカーなどのマーカーは、疾患の疾患関連因子(例えば、原因因子)と関連することが知られている。いくつかの実施形態では、生物学的マーカーなどのマーカーは、疾患の原因因子である。
【0110】
2.マーカーパネル
いくつかの実施形態では、本明細書に記載の方法は、生物学的マーカーなどの複数のマーカーを含むマーカーパネルの使用を含む。いくつかの実施形態では、マーカーパネルの各マーカーは、所望の特性を含む。いくつかの実施形態では、所望の特性は、以下のいずれか1つ以上に基づく:コンデンセートとの仮定または既知の関連は、特徴、例えば、天然変性領域(IDR)、コイルドコイルドドメイン、もしくは(例えば、タンパク質結合、DNA/RNA結合を介して)コンデンセート成分と関連すると仮定もしくは既知である構造化された領域を含むか、細胞経路などの細胞プロセスと関連していると仮説もしくは既知であるか、または疾患、もしくは、例えば、病状下で発現が改変された病状と関連することが仮説もしくは既知である。
【0111】
いくつかの実施形態では、マーカーパネルは、単一のコンデンセートタイプ、例えば、共通高分子成分を含有するコンデンセートタイプ、を同定する。いくつかの実施形態では、マーカーパネルは、複数のコンデンセート(例えば、汎コンデンセートマーカーパネル)を同定し、例えば、複数のコンデンセートのうちの特定のものは、第1の高分子成分を含有し、複数のコンデンセートのうちの特定のものは、第1のポリマー成分を含有しない。いくつかの実施形態では、マーカーパネルは、複数のコンデンセートを同定するのに有用な、生物学的マーカーなどの複数のマーカーを含み、複数のコンデンセートは、2種類以上のコンデンセートを含む。
【0112】
3.イメージング手法及び画像解析
いくつかの態様では、本明細書に記載される方法は、例えば、コンデンセートの表現型を評価する場合及び/または目的コンデンセートを評価する場合、コンデンセート(またはその欠如)を視覚化するイメージング手法の使用を含む。いくつかの実施形態では、方法は、例えば、コンデンセートの表現型を決定する場合及び/または目的コンデンセートを評価する場合、コンデンセートの特徴を評価するのに有用な画像解析手法を含む。
【0113】
いくつかの実施形態では、生物学的マーカーなどの1つ以上のマーカーは、イメージング手法によりコンデンセートを視覚化するために使用される。従って、いくつかの実施形態では、生物学的マーカーなどのマーカーは、標識を含む。いくつかの実施形態では、生物学的マーカーなどのマーカーは、(例えば、親和性試薬、例えば、抗体、を介して)標識される。いくつかの実施形態では、標識は、放射性標識、比色標識、発光標識、化学反応性標識(例えば、クリックケミストリーで使用される成分部分)、及び蛍光標識からなる群より選択される。いくつかの実施形態では、標識は、1000Da以下の分子量を有する化合物などの小分子である。いくつかの実施形態では、標識は、発蛍光団を含む小分子である。いくつかの実施形態では、標識は、例えば、共有結合または非共有結合で、マーカーと関連する。いくつかの実施形態では、標識は、Halo、dendra2、GFP、RFP、またはmCherryであり得るが、これらに限定されない。
【0114】
いくつかの実施形態では、イメージング手法は、例えば、マーカー、例えば、生物学的マーカーに特異的に結合する、標識抗体などの親和性標識を使用した、免疫蛍光(IF)手法の使用を含む。いくつかの実施形態では、IF手法は、細胞モデルを標識抗体などの親和性標識に曝すこと、及び細胞モデルをイメージングすることを含む。いくつかの実施形態では、方法は、さらに、取り込まれた画像を、目的コンデンセートなどのコンデンセート、及び/またはコンデンセートの表現型について評価することを含む。
【0115】
いくつかの実施形態では、イメージング手法は、例えば、マーカー、例えば、生物学的マーカーに特異的に結合する核酸プローブを使用する、in situハイブリダイゼーション(ISH)手法、例えば、蛍光ISH(FISH)手法の使用を含む。いくつかの実施形態では、FISH手法は、細胞モデルを核酸プローブに曝すこと、及び細胞モデルをイメージングすることを含む。いくつかの実施形態では、方法は、さらに、取り込まれた画像を、目的コンデンセートなどのコンデンセート、及び/またはコンデンセートの表現型について評価することを含む。
【0116】
いくつかの実施形態では、IF及び/またはFISH手法は、高スループット方式で実施される。例えば、いくつかの実施形態では、IF手法は、標識抗体などの1つ以上の親和性標識を使用して細胞モデルの複数のアリコートを評価することを含む。いくつかの実施形態では、細胞モデルのアリコートの少なくとも2つ以上が、異なる特異性を有する親和性標識、例えば、第1のマーカーに特異的な第1の親和性標識及び第1のマーカーまたは第2のマーカーの別のエピトープに特異的な第2の親和性標識に曝される。いくつかの実施形態では、細胞モデルのアリコートは、(例えば、親和性標識を使用して細胞モデルの2つのアリコートのそれぞれに曝すことにより)2つ以上の親和性標識に並行して曝される。いくつかの実施形態では、細胞モデルのアリコートは、(例えば、アリコートを第1の親和性標識に曝し、イメージングし、アリコートから第1の親和性標識を除去し、次に、アリコートを第2の親和性標識に曝すことにより)連続して2つ以上の親和性標識に曝される。いくつかの実施形態では、細胞モデルのアリコートは、2つ以上の親和性標識に同時に曝される。いくつかの実施形態では、細胞モデルのアリコートは、384ウェルプレートなどのウェル付きプレート内で形成される。
【0117】
いくつかの実施形態では、FISH手法は、1つ以上の核酸プローブを使用して細胞モデルの複数のアリコートを評価することを含む。いくつかの実施形態では、細胞モデルのアリコートの少なくとも2つ以上が、異なる特異性を有する核酸プローブに曝される。いくつかの実施形態では、細胞モデルのアリコートは、(例えば、核酸プローブを使用して細胞モデルの2つのアリコートのそれぞれを曝すことにより)2つ以上の核酸プローブに並行して曝される。いくつかの実施形態では、細胞モデルのアリコートは、(例えば、アリコートを最初の核酸プローブに曝し、イメージングし、アリコートから核酸プローブを除去し、次に、アリコートを第2の核酸プローブに曝すことにより)連続して2つ以上の核酸プローブに曝される。いくつかの実施形態では、細胞モデルのアリコートは、2つ以上の核酸プローブに同時に曝される。いくつかの実施形態では、細胞モデルのアリコートは、384ウェルプレートなどのウェル付きプレート内で形成される。
【0118】
いくつかの実施形態では、IF及び/またはFISH手法は、コンデンセートまたはその成分と関連する、生物学的マーカーなどの別のマーカーを同定するために実施される。例えば、いくつかの実施形態では、本方法は、細胞モデルを少なくとも2つの親和性標識に曝すことを含み、第1の親和性標識は、コンデンセートと関連する第1のマーカーに特異的であり、第2の親和性標識は、別のマーカーに特異的である。いくつかの実施形態では、方法は、細胞モデルを少なくとも2つの核酸プローブに曝すことを含み、第1の核酸プローブは、コンデンセートと関連する第1のマーカーに特異的であり、第2の核酸プローブは、別のマーカーに特異的である。いくつかの実施形態では、方法は、細胞モデルを親和性標識及び核酸プローブに曝すことを含み、親和性標識は、コンデンセートと関連する第1のマーカーに特異的であり、核酸プローブは、別のマーカーに特異的である。いくつかの実施形態では、方法は、細胞モデルを親和性標識及び核酸プローブに曝すことを含み、核酸プローブは、コンデンセートと関連する第1のマーカーに特異的であり、親和性標識は、別のマーカーに特異的である。いくつかの実施形態では、コンデンセートと関連する第2のマーカーの同定は、共局在化に基づいている。いくつかの実施形態では、上記の方法論は、並行して、同時に、または順次実行される。いくつかの実施形態では、細胞モデルは、標識(例えば、GFP)を含む第1のマーカーを含み、第2のマーカーは、IF及び/またはFISH手法を使用して視覚化される。
【0119】
いくつかの実施形態では、IF及び/またはFISH手法は、生物学的マーカーなどのマーカーの、コンデンセートまたはその成分との関連を評価するために使用される。いくつかの実施形態では、IF及び/またはFISH手法は、経時的に、例えば、経時研究を介して、生物学的マーカーなどのマーカーの、コンデンセートまたはその成分との関連を評価するために使用される。いくつかの実施形態では、IF及び/またはFISH手法は、刺激、例えば、化合物、例えば、治療化合物、感染(例えば、ウイルス感染)、または環境刺激(例えば、ストレス)の存在下で、生物学的マーカーなどのマーカーのコンデンセートとの関連を評価するために使用される。
【0120】
いくつかの実施形態では、IF手法は、検証されたIF手法である。例えば、いくつかの実施形態では、親和性標識は、マーカーがコンデンセートに分配される場合を含む、関連マーカーと関連することが確認されている。いくつかの実施形態では、親和性標識は、マーカーの発現が低下した細胞モデル(例えば、ノックアウトまたはノックダウン細胞モデル)を評価することにより、関連マーカーと関連することが確認されている。
【0121】
いくつかの実施形態では、方法は、さらに、細胞二重層及び/または細胞小器官の境界などの細胞モデルの特徴を同定するための追加のマーカー及び/または色素の使用を含む。
【0122】
いくつかの実施形態では、方法は、コンデンセートの材料特性、力学、及び移動度を研究するためのFRAPまたはSPTなどの、本明細書に記載のコンデンセートの分析に有用な追加の方法論を含む。いくつかの実施形態では、光オリゴマー化可能なシードが、相分離画分をマッピングするために使用され得る。(例えば、以下を参照:Bracha et al.,Cell,175,2018)。
【0123】
いくつかの実施形態では、イメージング法は、顕微鏡検査法(及び関連顕微鏡機器)の使用を含む。いくつかの実施形態では、顕微鏡検査法は、共焦点顕微鏡検査法を含む。いくつかの実施形態では、顕微鏡検査法は、蛍光顕微鏡検査法を含む。いくつかの実施形態では、顕微鏡検査法は、高解像度顕微鏡検査法を含む。いくつかの実施形態では、顕微鏡検査法は、誘導放出抑制(STED)顕微鏡検査法を含む。いくつかの実施形態では、顕微鏡検査法は、SoRa超解像度スピニングディスク顕微鏡検査法を含む。いくつかの実施形態では、顕微鏡検査法は、電子顕微鏡検査法(例えば、cryo-EMまたはcryo-ET)を含む。いくつかの実施形態では、顕微鏡検査法は、内部全反射蛍光(TIRF)顕微鏡検査法を含む。
【0124】
いくつかの態様では、方法は、コンデンセートの表現型の態様を決定するための非イメージングベースの手法を含む。例えば、いくつかの実施形態では、方法は、例えば、質量分析手法(例えば、架橋質量分析及び/または質量分析と組み合わせたプルダウン)、RNA-seq、NMR分光法、またはブロット手法(例えば、ウェスタンブロット)を介して、コンデンセートの組成を決定することを含む。様々なコンデンセート分析方法については、例えば、以下を参照、Basturea,G.N.(“Biological Condensates,”MATER METHODS 2019;9:2794)。
【0125】
いくつかの実施形態では、方法は、例えば、コンデンセートの表現型を決定するための、コンデンセートの観察可能または測定可能な特徴を評価するため分析手法を含む。いくつかの実施形態では、分析手法は、コンデンセートの存在(不存在及びレベル、量、位置、及び/または分布を含む)、形態学的特性(例えば、形状、サイズ、体積、表面積、及び/または球形度)、物質特性(例えば、動態、流動性、または剛性)、ならびに組成特性のうちのいずれか1つ以上を決定するのに有用である。いくつかの実施形態では、分析手法は、例えば、コンデンセート及び/またはコンデンセートの表現型を検出するための手動法を含む。いくつかの実施形態では、分析手法は、例えば、コンデンセート及び/またはコンデンセートの表現型を検出するための自動または半自動分析手法を含む。いくつかの実施形態では、分析手法は、例えば、コンデンセート及び/またはコンデンセートの表現型を検出するためのin silico分析手法を含む。機械学習及び深層学習を組み込んだものなどの、in silico分析のための特定の方法は、米国特許第10,303,979号などの当該技術分野(全体が参照により本明細書に組み込まれる)で既知である。
【0126】
D.マーカー及び/または疾患関連因子を同定する方法
いくつかの態様では、本明細書に記載の方法に有用なマーカー(例えば、生物学的マーカー)及び/または疾患関連因子を同定する方法が本明細書に提供される。いくつかの実施形態では、マーカーは、疾患関連因子である。いくつかの実施形態では、マーカーは、本明細書に記載のイメージング手法に有用である。いくつかの実施形態では、疾患関連因子は、本明細書に記載の細胞モデルを取得(例えば、設計及び操作)するのに有用である。
【0127】
実施形態では、疾患と関連する目的コンデンセートを同定するのに有用なマーカーを同定する方法が本明細書で提供され、方法は、(a)複数の候補マーカーまたはその前駆体を、疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること、(b)複数の候補マーカーのうちの少なくとも1つをコンデンセート親和性因子について評価すること、及び(c)疾患の1つ以上の疾患関連因子との所望の関連のレベルを有し且つ所望のコンデンセート親和性因子を有するマーカーに基づいて、マーカーを複数の候補マーカーから同定すること、を含む。
【0128】
いくつかの実施形態では、方法は、さらに、疾患の1つ以上の疾患関連因子を同定することを含む。いくつかの実施形態では、疾患の1つ以上の疾患関連因子のそれぞれが、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス、及び環境刺激からなる群より選択される。いくつかの実施形態では、方法は、さらに、疾患の1つ以上の疾患関連因子と関連する遺伝子またはノンコーディングバリアント(例えば、ノンコーディングSNP)を同定することを含む。いくつかの実施形態では、方法は、さらに、同定された遺伝子に基づいて遺伝子発現産物を同定することを含み、遺伝子発現産物またはその一部は、複数の候補マーカーまたはその前駆体を送り込むために使用される。いくつかの実施形態では、各候補マーカーと疾患の1つ以上の疾患関連因子との関連のレベルは、疾患原因因子スコアに基づいている。いくつかの実施形態では、疾患原因因子スコアは、各候補マーカーの疾患の1つ以上の疾患関連因子との関連の強度を反映する。いくつかの実施形態では、方法は、さらに、各候補マーカーに疾患原因因子スコアを割り当てることを含む。いくつかの実施形態では、方法は、(例えば、1つ以上の細胞モデルを介して評価する疾患関連因子のリストに優先順位を付けるための)疾患との関連の強度について疾患関連因子をランク付けすることを含む。
【0129】
いくつかの実施形態では、コンデンセート親和性因子は、コンデンセート関連スコアに基づいている。いくつかの実施形態では、コンデンセート関連スコアは、候補マーカーまたはその一部と、任意のコンデンセート、特定のコンデンセート、及び/またはコンデンセートと関連する高分子との関連の強度を反映する。いくつかの実施形態では、方法は、さらに、候補マーカーにコンデンセート関連スコアを割り当てることを含む。
【0130】
いくつかの実施形態では、複数の候補マーカーからマーカーを同定することは、例えば、重み付けを介して、疾患関連因子(複数可)及び/またはコンデンセート親和性因子(複数可)の寄与を考慮する累積スコアの使用を含む。いくつかの実施形態では、累積スコアは、1つ以上の疾患関連因子及び1つ以上のコンデンセート親和性因子の両方が含まれる入力データを含む。いくつかの実施形態では、複数の候補マーカーからマーカーを同定することは、疾患の1つ以上の疾患関連因子及び所望のコンデンセート親和性因子との所望の関連のレベルに基づく累積スコアを含み、任意に、さらに、累積スコアに寄与する際の異なる所望の重みを含む。
【0131】
いくつかの実施形態では、マーカーは、生物学的マーカーである。いくつかの実施形態では、マーカーは、それと関連するバリアントポリペプチドを含む遺伝子産物である。いくつかの実施形態では、マーカーは、ノンコーディングバリアント、例えば、ノンコーディングRNA(ncRNA)バリアント、またはノンコーディング領域の遺伝的変化(プロモーター、イントロン、エンハンサー、遺伝子間領域(IGR)、DNaseI高感受性部位(DHS)を含むが、これらに限定されない)である。いくつかの実施形態では、マーカーは、コーディングSNPまたはノンコーディングSNPである。
【0132】
いくつかの実施形態では、マーカーは、in silicoで同定される。
【0133】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、疾患の1つ以上の疾患関連因子を同定することを含む。いくつかの実施形態では、方法は、さらに、1つ以上の疾患表現型(例えば、高血圧、神経細胞死、または単球浸潤)を同定することを含む。いくつかの実施形態では、疾患表現型は、文献情報から取得される(例えば、マイニングまたは検出される)。いくつかの実施形態では、疾患表現型は、表現型-表現型相関関係を介して、例えば、難解な表現型解析コホート研究及び/または大規模なバイオバンクデータセット(例えば、All of Us、UK Biobank、COPDGene)及び関連研究エンジン(例えば、Global Biobank Engine、GenoPheno)を介して取得される(例えば、マイニングまたは検出される)。いくつかの実施形態では、疾患表現型は、2つ以上の表現型の遺伝的重複を介して取得され(例えば、マイニングまたは検出され)、例えば、2つ以上の表現型間のゲノム遺伝子座の共有遺伝率または関連統計のベイジアン共局在化を計算する連鎖不平衡(LD)スコア回帰を介して取得される。いくつかの実施形態では、疾患の1つ以上の疾患関連因子のそれぞれが、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質(例えば、ウイルスまたは細菌感染に起因する)、内因性化合物の存在、外因性化合物の存在、物理的プロセス(例えば、老化)、及び環境刺激からなる群より選択される。例えば、いくつかの実施形態では、方法は、疾患または疾患表現型と関連することが知られているか、または仮定されている、家族性、稀少、または一般的な遺伝的バリアントを同定することを含む。任意の好適な方法は、例えば、遺伝学ベースのツール、ゲノムワイド関連解析(GWAS)、連鎖試験、レアバリアント関連解析(またはレアバリアント負荷試験)、予測機能喪失(pLOF)解析、条件付きファインマッピング、発現QTL(eQTL)またはスプライスQTLの共局在化、多遺伝子優先スコア(PoPS)、クロマチン相互作用マッピング、メンデル解析(例えば、OMIMデータベースによる)、及びゲノム注釈の強化により、疾患の1つ以上の疾患関連因子を同定及び/または評価するために使用することができる。いくつかの実施形態では、方法は、さらに、疾患(または疾患表現型)に対する疾患関連因子の関連または因果関係の強度またはレベルを反映する、各疾患関連因子の表現型因果スコアを割り当てることを含む。例えば、複数の乳癌疾患関連因子のうち、BRCA1及び/またはBRCA2などの遺伝的変化は、年齢、妊娠、及び/または飲酒もしくは喫煙などのライフスタイルと比較して、より高い表現型因果スコアを有し得る。別の例では、特定の遺伝的バリアントは、より重篤な疾患表現型(複数可)を引き起こし、他の遺伝的バリアント(複数可)と比較して、より高い表現型因果スコアを有する。目的の疾患表現型と統計的により関連しているバリアントは、より高い表現型因果スコアを有する。いくつかの実施形態では、方法は、さらに、割り当てられた表現型因果スコアに基づいて複数の疾患関連因子をランク付けすることを含む。いくつかの実施形態では、方法は、さらに、疾患の上位の、または最も望ましい、1つ以上の疾患関連因子を選択することを含む。いくつかの実施形態では、限定されないが、主成分分析、非負行列因数分解、または非線形次元削減法を含む次元削減法は、例えば、多くの場合、疾患と関連するか、または疾患の発症及び/または進行に、より寄与する、1つ以上の支配的な疾患関連因子を同定するために、複数の疾患関連因子に対して実行される。いくつかの実施形態では、次元削減法は、1つ以上の支配的な疾患表現型を同定するために、複数の疾患表現型で実施される。いくつかの実施形態では、疾患関連因子の表現型因果スコアは、メンデルランダム化を介して取得され、これは、疾患関連因子及び疾患の影響間の因果関係を調査するために、操作変数として遺伝的変化を使用する(例えば、以下を参照、G.Qi and N.Chatterjee,Nat Commun.2019;10:1941;N.M.Davies et al.BMJ 2018;362:k601)。いくつかの実施形態では、1つ以上の疾患関連因子のそれぞれについて、疾患関連因子ベクターが取得され、各疾患関連因子ベクターは、それぞれ、疾患(例えば、血圧、神経細胞死、単球浸潤レベル)の1つ以上の疾患表現型間の疾患表現型の重症度を測定する測定基準を含む1つ以上の疾患表現型要素を含み、各疾患関連因子の疾患関連因子ベクターは、そのような疾患関連因子の、疾患の全疾患表現型(または次元削減により得られる疾患表現型)への寄与の測定値を提供し、それにより、疾患関連因子の表現型因果スコアを取得する。いくつかの実施形態では、疾患関連因子ベクターは、さらに、対照因子ベクターと比較され、これは、非疾患状態または健常生物において、対応する対照表現型を測定する測定基準(例えば、血圧、神経細胞の生存/量、単球浸潤レベル)をそれぞれ含む1つ以上の対照表現型要素を含み、対照因子ベクターは、非疾患状態または健常生物における、全ての対応する対照表現型(または次元削減により得られる対応する対照表現型)の測定値を提供する。いくつかの実施形態では、疾患関連因子の表現型因果スコアは、疾患関連因子ベクター及び対照因子ベクター間の差である。
【0134】
いくつかの実施形態では、(例えば、本明細書に記載の細胞モデルを取得するための)疾患の疾患関連因子を同定する方法は、i)複数の候補疾患関連因子を取得すること、ii)疾患の1つ以上の疾患表現型を取得すること、iii)(例えば、本明細書に記載の表現型因果スコア取得方法のいずれかを使用する)複数の候補疾患関連因子のそれぞれに表現型因果スコアを割り当てること(各表現型因果スコアは、疾患の1つ以上の疾患表現型を有する各候補疾患関連因子の関連のレベルを反映する)、及び、iv)割り当てられた表現型因果スコアに基づいて、複数の候補疾患関連因子をランク付けすること(最上位の、または最も望ましい1つ以上の候補疾患関連因子が、疾患の疾患関連因子として同定される)を含む。いくつかの実施形態では、疾患の疾患関連因子は、in silicoで同定される。
【0135】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、疾患の1つ以上の疾患関連因子と関連する遺伝子またはノンコーディングバリアント(例えば、ノンコーディングSNP)を同定することを含む。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、疾患の1つ以上の疾患関連因子と関連する遺伝子またはノンコーディングバリアント(例えば、ノンコーディングSNP)を、コンデンセートまたはその成分(例えば、コンデンセート親和性因子)と関連することが既知のまたは同定されたそれらの遺伝子またはノンコーディングバリアントから同定することを含む。いくつかの実施形態では、遺伝子またはノンコーディングバリアントは、疾患の上位の1つ以上の疾患関連因子との関連に基づいて同定される。いくつかの実施形態では、遺伝子またはノンコーディングバリアントは、SNP(例えば、疾患または疾患表現型と関連するリードSNP、例えば、リードノンコーディングSNPまたはリードコーディングSNP)に対するその位置(例えば、±500kb、±100kb、±50kb、±10kb、±5kb、±1kb、または±500bp以内のいずれか)に基づいて同定される。いくつかの実施形態では、遺伝子は、SNP(例えば、疾患または疾患表現型と関連するリードSNP)と連鎖不平衡(LD)にある全てのSNPの一部を同定すること、及び、これらの同定されたSNPを対応するタンパク質コーディング遺伝子にマッピングすることにより同定される。いくつかの実施形態では、ノンコーディングバリアントは、SNP(例えば、疾患または疾患表現型と関連するリードSNP、例えば、リードノンコーディングSNPまたはリードコーディングSNP)と連鎖不均衡(LD)にある全てのSNPの一部を同定することにより同定される。いくつかの実施形態では、方法は、さらに、SNP(例えば、疾患または疾患表現型と関連するリードSNP)と連鎖不均衡にある全SNPから、エクソンSNP及び/またはスプライシングSNPを同定することを含む。いくつかの実施形態では、遺伝子を同定することは、オープンリーディングフレーム(ORF)、調節エレメント(例えば、プロモーター、エンハンサー、イントロン領域)、転写開始部位、翻訳開始部位、RNAスパイシング部位などのうちの1つ以上を同定することを含む。いくつかの実施形態では、遺伝子を同定することは、その遺伝子に近い(例えば、遺伝子の±500kb、±100kb、±50kb、±10kb、±5kb、±1kb、または±500bp以内のいずれかの)ノンコーディングバリアント、例えば、機能的ノンコーディング領域、例えば、エンハンサーエレメント、DNase高感受性領域、及びクロマチンマークに存在するノンコーディングバリアント、を同定することを含む。いくつかの実施形態では、方法は、さらに、同定された遺伝子に基づいて遺伝子発現産物を同定することを含む。いくつかの実施形態では、遺伝子発現産物またはその一部が、マーカー(例えば、生物学的マーカー)として使用される。いくつかの実施形態では、ノンコーディングバリアント、例えば、ノンコーディング領域における遺伝的変化の存在(例えば、PCRまたは配列決定技術による)が、マーカー(例えば、生物学的マーカー)として使用される。いくつかの実施形態では、発現産物は、mRNAである。いくつかの実施形態では、発現産物は、ノンコーディングRNA(ncRNA)である。いくつかの実施形態では、発現産物は、スプライシングバリアントである。いくつかの実施形態では、発現産物は、ポリペプチドである。いくつかの実施形態では、発現産物は、転写後または翻訳後修飾を含む。例えば、GWASツール(例えば、ファインマッピング、GitHub、PLINK、BOLT-LMM混合モデル関連試験、SAIGE(一般化混合モデルの拡張可能及び実装))、FUMA、発現及びタンパク質の量的形質遺伝子座(「xQTL」)の共局在化などの分子統合ツール、タンパク質相互作用データベースまたは予測アルゴリズム(例えば:IDR予測ツール、例えば、DISOPRED3、ANCHOR、ANCHOR2、IUPred2、アルファ-MoRFpred、MoRFpred、fMoRFpred、またはMoRFCHiBi、多価予測ツール、配列関数アノテーション予測ツール)、スプライス部位予測アルゴリズム(例えば、SpliceFinder、NNSplice、MaxEntScan、GeneSplicer、HumanSplicingFinder、またはSpliceSiteFinder-like)、分割遺伝率、及び多遺伝子優先スコア(PoPS;以下を参照、Weeks et al.,medRxiv 2020))のうちの1つ以上を使用して、疾患関連因子(例えば、遺伝的バリアント、変異型タンパク質、ウイルス感染)を遺伝子にマッピングするために、任意の好適な方法を使用することができる。いくつかの実施形態では、多遺伝子優先スコアは、例えば、コンデンセートメンバーシップ情報を含む遺伝子メンバーシップの入力行列により、コンデンセート親和性因子を含むように改変される。
【0136】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、疾患の1つ以上の疾患関連因子と関連することが確認された1つ以上の遺伝子またはノンコーディングバリアント(例えば、ノンコーディングSNP)を、1つ以上の疾患関連因子との関連のレベルについて評価することを含む。いくつかの実施形態では、マーカー(例えば、生物学的マーカーなどの候補マーカー)、遺伝子、またはノンコーディングバリアントの、疾患の1つ以上の疾患関連因子との関連は、疾患原因因子スコアに基づいている。いくつかの実施形態では、疾患原因因子スコアは、マーカー(例えば、生物学的マーカー)、遺伝子、またはノンコーディングバリアントの疾患の1つ以上の疾患関連因子との関連の強度を反映する。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)、遺伝子、またはノンコーディングバリアントを同定する方法は、マーカー、遺伝子、またはノンコーディングバリアントに疾患原因因子スコアを割り当てることを含む。いくつかの実施形態では、疾患原因因子スコアは、以下のうちの1つ以上に基づいて決定される。i)疾患関連因子(例えば、原因因子)とマーカー(ノンコーディングバリアントまたは遺伝子)との間のゲノム距離、例えば、(ウイルス感染による)ウイルス挿入部位と遺伝子(例えば、遺伝子の転写開始部位)もしくはノンコーディングバリアントとの間の距離、または、遺伝子もしくはノンコーディングバリアントと既知の遺伝的変化(すなわち、遺伝的連鎖)との間のゲノム距離、ii)疾患において、疾患関連因子(例えば、家族性変異、喫煙などの原因因子)と一緒に現れるマーカー(例えば、遺伝的バリアントまたは遺伝子産物)の頻度、例えば、疾患細胞型または組織におけるマーカーの富化(例えば、H.K.Finucane et al.Nat Genet.2018;50(4):621-629に記載の方法を使用)、iii)マーカー(例えば、異なる遺伝的バリアントまたは異なる遺伝子産物)が疾患関連因子(例えば、ウイルス感染などの原因因子)と関連する場合の疾患表現型の重症度、iv)マーカー(ノンコーディングバリアントまたは遺伝子)の疾患関連因子(例えば、原因因子)との相互作用の強度、例えば、マーカータンパク質の疾患関連因子タンパク質(例えば、原因因子タンパク質)への結合親和性、v)疾患のマーカー(ノンコーディングバリアントまたは遺伝子)及び疾患関連因子(例えば、原因因子)間の機能的関係、(例えば、それらが、同じシグナル伝達経路で、1つ以上の細胞状態で共発現された同じ細胞型内で、及び同じ分子複合体内で機能するかどうか(例えば、マーカー、ノンコーディングバリアント、または遺伝子のパスウェイエンリッチメント(例えば、DEPICTの使用、以下を参照、T.H.Pers et al.Nat Commun.2015;6:589)及び/またはタンパク質ネットワークエンリッチメント(例えば、GWASの要約統計量及び/もしくは疾患関連タンパク質間関連評価装置(DAPPLE;以下を参照、E.J.Roissin et al.PLoS Genet.2011;7(1):e1001273))を計算し、任意に、優先順位付けする)、あるいは、ノンコーディングバリアントが、a)転写及び/または発現レベル、b)転写後翻訳修飾、ならびに、c)疾患を(直接的または間接的に)引き起こすことが知られている遺伝子などの疾患関連因子(例えば、遺伝子または遺伝子産物)の機能のうちの1つ以上に影響を及ぼすかどうか)等。いくつかの実施形態では、方法は、さらに、割り当てられた疾患原因因子スコアに基づいて、複数のマーカー(例えば、候補マーカー、例えば、生物学的マーカー)、遺伝子、またはノンコーディングバリアントをランク付けすることを含む。いくつかの実施形態では、方法は、さらに、割り当てられた疾患原因因子スコアに基づいて、1つ以上の上位マーカー(例えば、生物学的マーカー)、遺伝子、またはノンコーディングバリアントを選択することを含む。
【0137】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、コンデンセートまたはその成分(例えば、コンデンセート親和性因子)と関連する遺伝子またはノンコーディングバリアント(例えば、ノンコーディングSNP)を同定することを含む。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、1つ以上の遺伝子またはノンコーディングバリアントを、コンデンセートまたはその成分との関連のレベル(例えば、コンデンセート親和性因子)について評価することを含む。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、疾患の1つ以上の疾患関連因子と関連することが知られているか、または確認されている1つ以上の遺伝子またはノンコーディングバリアント(例えば、ノンコーディングSNP)を、コンデンセートまたはその成分との関連のレベル(例えば、コンデンセート親和性因子)について評価することを含む。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)、遺伝子、またはノンコーディングバリアントの、コンデンセートまたはその成分(例えば、コンデンセート親和性因子)との関連は、コンデンセート関連スコアに基づいている。いくつかの実施形態では、コンデンセート関連スコアは、マーカー(例えば、ノンコーディングバリアントもしくはコーディングバリアント)またはその一部の、任意のコンデンセート、特定のコンデンセート、及び/またはコンデンセートと関連する高分子(例えば、ポリペプチド、RNA、DNA)への関連の強度に影響を及ぼす。いくつかの実施形態では、コンデンセート関連スコアは、コンデンセート親和性スコア及びコンデンセート機能スコアの複合スコアである。いくつかの実施形態では、複合コンデンセート関連スコアを得るために、コンデンセート親和性スコア及びコンデンセート機能スコアにそれぞれ、重み付け(例えば、40%対60%)が与えられる。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、マーカーにコンデンセート関連スコアを割り当てることを含む。いくつかの実施形態では、コンデンセート関連スコアは、(i)マーカーまたは遺伝子産物の分配特性(例えば、分配係数)、(ii)マーカー(または遺伝子もしくは遺伝子産物)の、コンデンセート成分またはコンデンセートと関連する高分子(例えば、ポリペプチド、RNA、DNA)への結合親和性(例えば、高分子は、疾患またはストレス状態下でコンデンセートの成分になる))、(iii)マーカーまたは遺伝子産物のタンパク質構造またはドメイン、例えば、IDRなどの変性領域の存在/不存在/量/程度(例えば、天然変性領域予測因子(PONDR(登録商標))を使用)、コイルドコイルドメイン及びタンパク質凝集媒介におけるその強度などのコンデンセートを好むモチーフの存在/不存在/量、ならびに相互作用の多価性を達成する相互作用ドメインの存在/不存在/量、iv)マーカー(例えば、遺伝子もしくは遺伝子産物、またはノンコーディングバリアント)のコンデンセート機能との関連のレベル、v)例えば、タンパク質がコンデンセート様構造を形成しているかどうかを判定するHuman Protein Atlas(HPA)のデータに基づいた、マーカー(または遺伝子もしくは遺伝子産物)のコンデンセートまたはタンパクイメージ分析、vi)予測されたコンデンセート形成能力(例えば、スコア)などのうちの1つ以上を含む因子(任意に、それぞれが、コンデンセート関連スコアに寄与する際に所望の重みを有する)に基づいて決定される。いくつかの実施形態では、マーカー(例えば、遺伝子もしくは遺伝子産物、またはノンコーディングバリアント)とコンデンセート機能との関連のレベルは、コンデンセート機能スコアに基づいて決定され、これは、マーカー(もしくはその一部)、遺伝子、または1つ以上の疾患関連因子と関連するノンコーディングバリアントに対応する遺伝的変化が、以下の1つ以上の因子(任意に、それぞれは、コンデンセート機能スコアに寄与する際に所望の重みを有する)に基づいて決定される。(i)無秩序な領域(例えば、IDR)内にあり、及び/または翻訳後修飾(例えば、リン酸化、ユビキチン化、スモイル化、メチル化、またはアセチル化)を受けている。(ii)マーカーまたは遺伝子のスプライシング(例えば、SpliceAI、SpliceFinderなどのツールを使用)に影響を及ぼす。(iii)(例えば、遺伝子またはノンコーディングバリアントから±500kb、±100kb、±50kb、±10kb、±5kb、±1kb、または±500bpのいずれか以内の)1つ以上の疾患関連因子と関連することが確認された遺伝子またはノンコーディングバリアントの近くのクロマチン状態(例えば、ヒストン修飾、ヌクレオソーム密度、及び/または分布など、例えば、エピジェネティック修飾を検出するDeepSEAを使用したもの)に影響を及ぼす。iv)1つ以上の疾患関連因子と関連することが確認された遺伝子の発現に影響を及ぼし、これは、例えば、遺伝子産物の豊富さにより間接的にコンデンセートに影響を及ぼし得る、等。いくつかの実施形態では、コンデンセート親和性スコアは、(i)IDRなどの変性領域の存在/不存在/量/程度(例えば、PONDR(登録商標)を使用)、(ii)コイルドコイルドメインなどのコンデンセートを好むモチーフの存在/不存在/量/程度、及び(iii)マーカーまたは遺伝子産物における相互作用多価性を達成する相互作用ドメインの存在/不存在/量/原子価、のうちの1つ以上の因子(任意に、それぞれは、コンデンセート親和性スコアに寄与する所望の重みを有する)に基づいて決定される。いくつかの実施形態では、方法は、さらに、割り当てられたコンデンセート関連スコアに基づいて複数のマーカー(例えば、候補マーカー、例えば、生物学的マーカー)をランク付けすることを含む。いくつかの実施形態では、方法は、さらに、割り当てられたコンデンセート関連スコアに基づいて、1つ以上の上位のマーカー(例えば、生物学的マーカー)を選択することを含む。
【0138】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、遺伝子(または、遺伝子産物)及び疾患間の投薬量関係の因果強度により、疾患の1つ以上の疾患関連因子と関連することが確認された1つ以上の遺伝子を評価することを含む。いくつかの実施形態では、投薬量の因果強度は、投薬量スコアの効果量に基づいており、これは、メンデルランダム化(MR;例えば、以下を参照、G.Qi and N.Chatterjee,Nat Commun.2019;10:1941;N.M.Davies et al.BMJ 2018;362:k601)を使用して、遺伝子(または遺伝子産物)存在量対疾患の影響の大きさの比として計算される。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、マーカーに薬物量スコアの効果量を割り当てることを含む。いくつかの実施形態では、方法は、さらに、割り当てられた投薬量スコアの効果量に基づいて複数のマーカー(例えば、候補マーカー、例えば、生物学的マーカー)をランク付けすることを含む。いくつかの実施形態では、方法は、さらに、割り当てられた投薬量スコアの効果量に基づいて、1つ以上の上位マーカー(例えば、生物学的マーカー)を選択することを含む。
【0139】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、疾患の1つ以上の疾患関連因子、所望のコンデンセート親和性因子、及び、任意に、投薬量の望ましい因果強度との所望の関連のレベルを有するマーカーに基づいてマーカーを同定することを含む。いくつかの実施形態では、所望のレベルのそのような組み合わせは、重み付けされた疾患原因因子スコア、コンデンセート関連スコア、及び、任意に、投薬量スコアの効果量を含む累積スコアに基づいている。そのような累積スコアは、以下の各疾患関連因子またはマーカーに関する情報を提供する。マーカーがコンデンセート遺伝子であり、及び/または疾患バリアントがコンデンセート機序を通じて作用する程度、ヒトの分子データが仮説を裏付ける程度、及び、任意に、効果の大きさ。
【0140】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)を同定する方法は、マーカーの以下との関連の強度に基づいて、マーカーを複数の候補マーカーから選択することを含む。(i)疾患の1つ以上の疾患関連因子、及び、(ii)コンデンセートもしくはその成分。いくつかの実施形態では、複数の候補マーカーからマーカー(例えば、生物学的マーカー)を選択することは、以下のいずれか1つを含む。a-i)複数の候補マーカーのそれぞれに疾患原因因子スコアを割り当てるステップ(複数の候補マーカーのそれぞれが、コンデンセートもしくはその成分との関連を有する)ならびに、a-ii)割り当てられた疾患原因因子スコアに基づいて複数の候補マーカーをランク付けするステップ(上位にランク付けされた(1つ以上の)候補マーカー(複数可)が最終マーカー(複数可)として選択される)、または、b-i)複数の候補マーカーのそれぞれにコンデンセート関連スコアを割り当てるステップ(複数の候補マーカーのそれぞれは、疾患の1つ以上の疾患関連因子との関連を有する)、ならびに、b-ii)割り当てられたコンデンセート関連スコアに基づいて複数の候補マーカーをランク付けするステップ(上位にランク付けされた(1つ以上の)候補マーカー(複数可)が、最終マーカー(複数可)として選択される)、または、c-i)複数の候補マーカーのそれぞれに疾患原因因子スコアを割り当てるステップ、c-ii)複数の候補マーカーのそれぞれにコンデンセート関連スコアを割り当てるステップ、c-iii)割り当てられた疾患原因因子スコア及び割り当てられたコンデンセート関連スコアに基づいて、複数の候補マーカーのそれぞれに累積スコアを割り当てるステップ、ならびに、c-iv)割り当てられた累積スコアに基づいて複数の候補マーカーをランク付けするステップ(上位にランク付けされた(1つ以上の)候補マーカー(複数可)が最終マーカー(複数可)として選択される)。いくつかの実施形態では、方法は、さらに、投薬量スコア(複数可)の効果量、または投薬量スコア(複数可)の効果量を考慮に入れた累積スコア(複数可)について候補マーカー(複数可)または最終マーカー(複数可)を、割り当てること、ランク付けすること、選択することを含む。
【0141】
いくつかの実施形態では、疾患と関連する目的コンデンセートの同定に有用な、マーカー、例えば、遺伝子または遺伝子産物、例えば、野生型もしくはバリアントポリペプチド、またはノンコーディングバリアント(例えば、ノンコーディングSNP)を同定する方法が本明細書で提供され、方法は、(a)複数の候補マーカーまたはその前駆体を、疾患との関連のレベルについて評価すること、(b)複数の候補マーカーのうちの少なくとも1つを、コンデンセート親和性因子について評価すること、及び、(c)疾患との関連のレベルを有し且つ1つ以上のコンデンセート親和性因子を有するマーカーに基づいて、複数の候補マーカーからマーカーを同定すること、を含み、同定することは、疾患及び/または1つ以上のコンデンセート親和性因子(複数可)との関連のレベル(例えば、疾患の1つ以上の疾患関連因子との関連のレベルを含む)の寄与を考慮に入れる蓄積スコアを使用して実施される。
【0142】
いくつかの実施形態では、疾患と関連する目的コンデンセートを同定するのに有用な、マーカー、例えば、遺伝子または遺伝子産物、例えば、野生型もしくはバリアントポリペプチドまたはノンコーディングバリアントを同定する方法が本明細書に提供され、方法は、(a)複数の候補マーカーまたはその前駆体を、疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること、(b)複数の候補マーカーのうちの少なくとも1つを、コンデンセート親和性因子について評価すること、及び、(c)疾患の1つ以上の疾患関連因子との関連のレベルを有し且つ1つ以上のコンデンセート親和性因子を有するマーカーに基づいて、複数の候補マーカーからマーカーを同定すること、を含み、同定することは、疾患関連因子(複数可)の1つ以上及び/またはコンデンセート親和性因子(複数可)の1つ以上の寄与を考慮する累積スコアを使用して実施される。
【0143】
いくつかの実施形態では、累積スコアは、そこで評価される因子に重み付けをする。いくつかの実施形態では、累積スコアは、さらに1つ以上のコンデンセート親和性因子を介して評価される候補マーカーのリストを提供する。いくつかの実施形態では、複数の候補マーカーは、疾患などの状態に関するGWAS分析に基づいて同定される。いくつかの実施形態では、1つ以上の疾患関連因子は、(a)コンデンセートに焦点を当てた多遺伝子性遺伝子の特徴(PoPSまたは改変PoPS)、(b)PoPS、(c)メンデル遺伝子因子、(d)レアバリアント負荷、(e)独立した有意なSNPと連鎖不平衡にあるSNPによるタンパク質コーディング遺伝子のマッピング、(f)組織全体(複数可)にわたるeQTLの共局在、及び、(g)クロマチン相互作用(例えば、Hi-Cまたは3Cマッピングによる)に基づいている。いくつかの実施形態では、1つ以上のコンデンセート親和性因子は、相分離形成の確率(例えば、DeepPhaseスコア)、予測されるコンデンセート形成(例えば、Pスコア)、天然変性領域(IDR領域)またはIDR領域の画分の存在、既知のコンデンセートとの関連、及びHuman Protein Atlas(HPA)のタンパク質画像に基づいている。
【0144】
いくつかの実施形態では、疾患と関連する目的コンデンセートを同定するのに有用な、マーカー、例えば、遺伝子または遺伝子産物、例えば、野生型もしくはバリアントポリペプチドまたはノンコーディングバリアント、を同定する方法が本明細書に提供され、方法は、(a)例えば、GWAS分析を介して、疾患と関連する複数の候補マーカーを取得すること、(b)複数の候補マーカーまたはその前駆体を、疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること(いくつかの実施形態では、疾患関連因子は、(例えば、1つ以上のコンデンセート親和性因子を含む修正PoPSスコアよる)1つ以上のコンデンセート親和性因子を組み込み得る))、(c)複数の候補マーカーのうちの少なくとも1つをコンデンセート親和性因子について評価すること、ならびに、(d)疾患の1つ以上の疾患関連因子との関連のレベルを有し且つ1つ以上のコンデンセート親和性因子を有するマーカーに基づいて、複数の候補マーカーからマーカーを同定すること(同定することは、疾患関連因子(複数可)の1つ以上及び/またはコンデンセート親和性因子(複数可)の1つ以上の寄与を考慮する累積スコアを使用して実施される)、を含む。
【0145】
いくつかの実施形態では、方法は、疾患の1つ以上の疾患関連因子に基づいて、複数の候補マーカーまたはその前駆体に優先順位を付けるスコアリング手法の使用を含み、いくつかの実施形態では、疾患関連因子は、1つ以上のコンデンセート親和性因子(例えば、1つ以上のコンデンセート親和性因子を含む修正PoPSスコアなどを介して)、例えば、遺伝子優先順位付けスコアを組み込み得る。いくつかの実施形態では、累積スコアは、そこで評価される因子に重み付けをする。いくつかの実施形態では、累積スコアは、さらに1つ以上のコンデンセート親和性因子を介して評価される候補マーカーのリストを提供する。いくつかの実施形態では、複数の候補マーカーは、疾患などの状態に関するGWAS分析に基づいて同定される。いくつかの実施形態では、1つ以上の疾患関連因子は、(a)コンデンセートに焦点を当てたPoPS、(b)PoPS、(c)メンデル遺伝子因子、(d)レアバリアント負荷、(e)独立した有意なSNPと連鎖不平衡にあるSNPによるタンパク質コーディング遺伝子のマッピング、(f)組織全体(複数可)にわたるeQTLの共局在、及び、(g)クロマチン相互作用(例えば、Hi-Cまたは3Cマッピングによる)に基づいている。いくつかの実施形態では、1つ以上のコンデンセート親和性因子は、相分離形成の確率(例えば、DeepPhaseスコア)、予測されるコンデンセート形成(例えば、Pスコア)、天然変性領域(IDR領域)またはIDR領域の画分の存在、既知のコンデンセートとの関連、及びHuman Protein Atlas(HPA)のタンパク質画像に基づいている。
【0146】
いくつかの実施形態では、マーカー(例えば、生物学的マーカー)は、例えば、バイオインフォマティクス、トランスクリプトミクス、プロテオミクス、遺伝学、ゲノミクス、エピゲノミクス、システム生物学、システム医学または薬理学、機械学習、深層学習等における1つ以上の知識、データベース、アルゴリズム、方法を使用して、in silicoで同定される。いくつかの実施形態では、方法は、さらに、同定/選択されたマーカー(例えば、生物学的マーカー)の以下との関連を検証することを含む。(i)疾患の1つ以上疾患関連因子、(ii)コンデンセートまたはその成分、及び、任意に、(iii)疾患の影響の大きさ。当該技術分野で既知の、及び/または本明細書に記載の任意の好適な方法を、そのような検証に使用することができる。例えば、細胞または生物内の同定された生物学的マーカー(例えば、遺伝子またはノンコーディングバリアント)を変異させ、細胞機能及び/または疾患表現型を試験する。例えば、疾患細胞モデルまたは疾患生物における同定された生物学的マーカー(例えば、キナーゼ)の機能を阻害すること、ならびに細胞機能の回復及び/または疾患の緩和/排除を試験すること。別の例としては、疾患細胞モデルのコンデンセートに対してIF染色を実施し、コンデンセート内のそのような生物学的マーカーの存在を試験する。別の例としては、同定されたマーカーの存在下でin vitroコンデンセートを形成すること、及び、そのようなマーカーのin vitroコンデンセートとの関連を試験すること。
【0147】
E.コンデンセートの表現型の比較
いくつかの態様では、方法は、コンデンセートの表現型間の差異を同定するためにコンデンセートの表現型を比較することを含む。
【0148】
いくつかの実施形態では、方法は、コンデンセートの表現型間の差異を決定する任意の定量的及び/または定性的画像解析法の使用を含む。いくつかの実施形態では、方法は、コンデンセートの表現型間の差異を決定する手動画像解析法の使用を含む。いくつかの実施形態では、方法は、コンデンセートの表現型間の差異を決定する半自動または自動画像解析法の使用を含む。いくつかの実施形態では、半自動または自動画像解析方法は、さらに、コンデンセートの表現型間の差異を決定する手動検証を含む。
【0149】
いくつかの実施形態では、コンデンセートの表現型間の差異を同定するためにコンデンセートの表現型を比較する方法は、トレーニング済みの深層畳み込みニューラルネットワークなどの深層畳み込みニューラルネットワークの使用を含む。いくつかの実施形態では、方法は、教師ありアルゴリズム、弱教師あり、または教師なしアルゴリズムの使用を含む。いくつかの実施形態では、アルゴリズムは、単一セル特徴埋め込みの弱教師学習を利用する。いくつかの実施形態では、方法は、例えば、畳み込みニューラルネットワーク及び複数のインスタンス学習を組み合わせるために、複数のインスタンス学習の使用を含む。いくつかの実施形態では、方法は、例えば、定性的及び定量的分析で使用される、1つ以上の生物学的エンティティ(例えば、核、完全細胞、及び/またはコンデンセート)のセグメンテーションからの従来の単一細胞特徴抽出(例えば、ピクセル強度、形状、テクスチャ、及び/または共局在特性)を含む。例えば、以下を参照、Caicedo et al.,bioRxiv,2018;Cuccarese et al.,bioRxiv,2020;Kraus et al.,Bioinformatics,32,2016;及びMcQuin et al.,PLoS Biol,16,2018(全体が参照により本明細書に組み込まれる)。
【0150】
いくつかの実施形態では、方法は、第1の細胞モデル及び第2の細胞モデルから得られたコンデンセートの表現型間の差異を決定することを含み、第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因する。いくつかの実施形態では、疾患の原因因子は、未知であるか、または完全には知られていない。
【0151】
いくつかの実施形態では、第1のコンデンセート表現型及び第2のコンデンセート表現型間の差異を決定することは、定性的評価、例えば、コンデンセートの流動性、コンデンセートの形状もしくは球形度、コンデンセートもしくはその成分の機能、またはコンデンセートもしくはその成分が関与する生物学的活性(例えば、細胞のシグナル伝達、細胞機能)を含む。いくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することは、定量的評価、例えば、蛍光強度、コンデンセートの流動性、コンデンセートの形状及び/またはサイズ、コンデンセートの数、領域内のコンデンセートの分布密度などを含む。いくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することは、本明細書に記載される表現型同定方法、例えば、イメージング手法(画像処理手法を含む)、IF、FRAP、MSなど、のうちの1つ以上を使用する。いくつかの実施形態では、第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異を決定することは、例えば、統計学、バイオインフォマティクス、機械学習及び/または深層学習手法、またはタンパク質/タンパク質複合体/凝集体/無膜顆粒の研究に適した任意の利用可能なアルゴリズムを含むin silico手法を含む。
【0152】
いくつかの実施形態では、2つの細胞モデル間のコンデンセートの表現型を比較することは、以下と比較して、疾患細胞モデル(例えば、疾患心筋細胞モデル)の、または、それに由来する目的コンデンセートとのマーカー(例えば、生物学的マーカー)の関連のレベルを比較することを含む。(i)参照細胞モデル(例えば、健常な細胞、もしくはキャンセル細胞モデルなどの無関係な疾患細胞モデル)の、もしくは、それに由来するコンデンセートとのマーカー(例えば、生物学的マーカー)の関連のレベル、または、(ii)マーカーの対応物(例えば、遺伝的バリアント)の、疾患細胞モデルの、もしくは、それに由来する目的コンデンセートとの関連のレベル。いくつかの実施形態では、関連のレベルの差異の検出により、疾患と関連する目的コンデンセートが同定される。
【0153】
いくつかの実施形態では、疾患と関連する目的コンデンセートを同定する方法は、(i)マーカー(例えば、生物学的マーカー)の、参照細胞モデル(例えば、健常な細胞、もしくは無関係な疾患細胞モデル)の、もしくは、それに由来するコンデンセートとの関連のレベル、または、(ii)マーカーの対応物(例えば、遺伝的バリアントなどの生物学的マーカー)の、疾患細胞モデルの、もしくは、それに由来する目的コンデンセートとの関連のレベル、と比較して、マーカー(例えば、生物学的マーカー)の、疾患細胞モデルの、もしくは、それに由来する目的コンデンセートとの関連のレベルの変調を検出することを含み、変調の検出により、疾患と関連する目的コンデンセートが同定される。いくつかの実施形態では、マーカー(例えば、生物学的マーカー)は、以下との関連を有することに基づいて選択される。(i)疾患の1つ以上の疾患関連因子、(ii)コンデンセートまたはその成分、及び、任意に(iii)疾患の影響の大きさ。いくつかの実施形態では、方法は、さらに、以下との関連を有することに基づいてマーカー(例えば、生物学的マーカー)を同定することを含む。(i)疾患の1つ以上の疾患関連因子、(ii)コンデンセートまたはその成分、及び、任意に、(iii)疾患の影響の大きさ。
【0154】
F.コンデンセート
本明細書で提供される方法は、多種多様なコンデンセート及びコンデンセートのタイプを評価するのに有用である。
【0155】
いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、細胞モデル内に存在するか、または、それに由来する。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、細胞コンデンセートである。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、細胞の特定の位置、例えば、細胞小器官、例えば、核に局在する。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、細胞の特定の位置に局在せず、例えば、細胞全体の周囲またはサイトゾル全体に拡散する。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、細胞外コンデンセートである。
【0156】
いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、疾患細胞モデルのみに見出される。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、健常な細胞モデルのみに見出される。いくつかの実施形態では、目的コンデンセートは、第1の細胞モデル内に存在するか、または、それに由来する。いくつかの実施形態では、目的コンデンセートは、第2の細胞モデル内に存在しないか、または、それに由来しない。いくつかの実施形態では、目的コンデンセートは、第1の細胞モデル内に存在しないか、または、それに由来しない。いくつかの実施形態では、目的コンデンセートは、第2の細胞モデル内に存在するか、または、それに由来する。
【0157】
目的コンデンセートなどのコンデンセートは、当該技術分野で既知の任意のコンデンセートであり得る。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、ストレス顆粒、切断体、p顆粒、ヒストンローカス体、多小胞体、神経RNA顆粒、核内gem、核膜孔、核スペックル、核ストレス体、核小体、Oct1/PTF/転写(OPT)ドメイン、パラスペックル、傍核小体コンパートメント、PML核小体、PML発がんドメイン、ポリコーム体、プロセシング体、Sam68核小体、及びスプライシングスペックルからなる群より選択されるコンデンセートタイプに属する。いくつかの実施形態では、目的コンデンセートなどのコンデンセートは、以前には知られておらず、本明細書に記載の任意の方法で同定される。
【0158】
いくつかの実施形態では、目的コンデンセートは、家族性DCMと関連し、例えば、家族性DCM患者に存在するか、または健常な個体と比較して家族性DCM患者で異なるコンデンセートの表現型を有する。いくつかの実施形態では、目的コンデンセートは、RBM20コンデンセート、DSPコンデンセート、DSG2コンデンセート、またはALPK3コンデンセートである。
【0159】
G.追加の方法
いくつかの実施形態では、目的コンデンセートを同定する方法は、本明細書に記載の方法のいずれかを使用して同定/選択されたマーカーなどのマーカー(例えば、生物学的マーカー)の、目的コンデンセートとの関連のレベルの変調を検出することを含む。いくつかの実施形態では、生物学的マーカーの目的コンデンセートとの関連のレベルの変調を検出することは、イメージング手法、例えば、本明細書に記載のイメージング手法のいずれか、を介して実施される。
【0160】
いくつかの実施形態では、目的コンデンセートを同定する方法は、さらに、以下を決定することを含む。本明細書に記載の方法のいずれかを使用して同定/選択されたマーカーなどのマーカー(例えば、生物学的マーカー)の、参照細胞モデルの、もしくは、それに由来する目的コンデンセートとの関連のレベル、または、本明細書に記載の方法のいずれかを使用して同定/選択されたマーカーなどのマーカーの対応物(例えば、生物学的マーカー)の、疾患細胞モデルの、もしくは、それに由来する目的コンデンセートとの関連のレベル。いくつかの実施形態では、生物学的マーカーの対応物は、生物学的マーカーの遺伝的バリアント、スプライシングバリアント、または翻訳後修飾バリアントである。
【0161】
いくつかの実施形態では、目的コンデンセートを同定する方法は、さらに、目的コンデンセートが疾患と関連していることを検証することを含む。当該技術分野で既知の、及び/または本明細書に記載の任意の好適な方法を、そのような検証に使用することができる。例えば、健常な細胞モデルまたは生物において疾患コンデンセートの形成を誘導すること(例えば、ノックアウト内因性マーカータンパク質の発現、及び対応する変異型マーカータンパク質の発現を誘導すること)、ならびに、細胞機能及び/または疾患表現型を試験すること。別の例としては、小分子化合物を使用して疾患細胞モデルまたは疾患生物において目的コンデンセートの解離を引き起こすこと、ならびに、細胞機能の回復及び/または疾患の緩和/除去を試験すること。
【0162】
他の態様では、疾患と関連する目的コンデンセートを同定する方法が本明細書に提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1のコンデンセートの表現型及び第2のコンデンセートの表現型は、本明細書に記載の方法のうちのいずれか1つを使用して同定されたマーカーを使用して得られ、第1の細胞モデル及び第2の細胞モデル間の差異は、疾患の1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つは、第1の細胞モデルまたは第2の細胞モデルのいずれかに導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。
【0163】
H.目的コンデンセートを同定する例示的な方法
いくつかの態様では、疾患と関連するコンデンセートの表現型を同定する方法が提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、1つ以上の疾患関連因子に起因する)、ならびに、(b)第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、第2のコンデンセートの表現型を疾患と関連するコンデンセートの表現型として同定すること、を含む。いくつかの実施形態では、疾患と関連する目的コンデンセートは、疾患と関連するコンデンセートの表現型から同定される。いくつかの実施形態では、疾患と関連する目的コンデンセートを同定する方法が提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、1つ以上の疾患関連因子に起因する)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。いくつかの実施形態では、第1のコンデンセートの表現型または第2のコンデンセートの表現型などのコンデンセートの表現型は、コンデンセートと関連することが知られている、または考えられているマーカーを含むマーカーパネルを使用して取得される。いくつかの実施形態では、コンデンセートの表現型は、マーカーパネルのマーカーを視覚化するために設計されたイメージング手法を使用して取得され、例えば、決定される。いくつかの実施形態では、イメージング手法は、IF、ISH(例えば、FISH)、遺伝子融合(例えば、GFP標識)、またはマーカー及び/またはコンデンセートに特異的な色素のうちのいずれか1つ以上を使用してマーカーを標識することを含む。いくつかの実施形態では、イメージング手法は、自動画像解析を含む。いくつかの実施形態では、細胞モデルの疾患関連因子は、本明細書に記載のin silico法を使用して同定及び/または選択される。
【0164】
いくつかの態様では、疾患と関連するコンデンセートの表現型を同定する方法が提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、1つ以上の疾患関連因子に起因する)、ならびに、(b)第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、第2のコンデンセートの表現型を疾患と関連するコンデンセートの表現型として同定すること、を含む。いくつかの実施形態では、疾患と関連する目的コンデンセートは、疾患と関連するコンデンセートの表現型から同定される。いくつかの実施形態では、疾患と関連する目的コンデンセートを同定する方法が提供され、方法は、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(第1の細胞モデル及び第2の細胞モデル間の差異は、1つ以上の疾患関連因子に起因する)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。いくつかの実施形態では、第1のコンデンセートの表現型または第2のコンデンセートの表現型などのコンデンセートの表現型は、本明細書に記載のin silico法を使用して同定されたマーカーを使用して取得される。いくつかの実施形態では、コンデンセートの表現型は、マーカーパネルのマーカーを視覚化するために設計されたイメージング手法を使用して取得され、例えば、決定される。いくつかの実施形態では、イメージング手法は、IF、ISH(例えば、FISH)、遺伝子融合(例えば、GFP標識)、またはマーカー及び/またはコンデンセートに特異的な色素のうちのいずれか1つ以上を使用してマーカーを標識することを含む。いくつかの実施形態では、イメージング手法は、自動画像解析を含む。いくつかの実施形態では、細胞モデルの疾患関連因子は、本明細書に記載のin silico法を使用して同定及び/または選択される。
【0165】
いくつかの態様では、疾患と関連するコンデンセートの表現型を同定する方法が提供され、方法は、(a)コンデンセートの表現型のセットを比較すること(コンデンセートの表現型のセットの各コンデンセートの表現型は、それぞれの細胞モデルに由来し、それぞれの細胞モデル間の違いは、1つ以上の疾患関連要因に起因する)、ならびに、(b)コンデンセートの表現型のセットの少なくとも2つのコンデンセートの表現型及び他のコンデンセートの表現型間の収束差に基づいて、疾患と関連するコンデンセートの表現型のセットの少なくとも2つのコンデンセートの表現型を同定すること、を含む。いくつかの実施形態では、それぞれの細胞モデルのそれぞれは、1つ以上の疾患関連因子の固有の組み合わせを含む。いくつかの実施形態では、疾患と関連する目的コンデンセートは、コンデンセートの表現型の少なくとも2つとコンデンセートの表現型のセットの他のコンデンセートの表現型との間の収束差に基づいて同定される。いくつかの実施形態では、コンデンセートの表現型は、コンデンセートと関連することが知られている、または考えられているマーカーを含むマーカーパネルを使用して取得される。いくつかの実施形態では、第1のコンデンセートの表現型または第2のコンデンセートの表現型などのコンデンセートの表現型は、本明細書に記載のin silico法を使用して同定されたマーカーを使用して取得される。いくつかの実施形態では、コンデンセートの表現型は、マーカーパネルのマーカーを視覚化するために設計されたイメージング手法を使用して取得され、例えば、決定される。いくつかの実施形態では、イメージング手法は、IF、ISH(例えば、FISH)、遺伝子融合(例えば、GFP標識)、またはマーカー及び/またはコンデンセートに特異的な色素のうちのいずれか1つ以上を使用してマーカーを標識することを含む。いくつかの実施形態では、イメージング手法は、自動画像解析を含む。いくつかの実施形態では、細胞モデルの疾患関連因子は、本明細書に記載のin silico法を使用して同定及び/または選択される。
【0166】
いくつかの実施形態では、疾患と関連する目的コンデンセートを同定する方法が提供され、方法は、(a)コンデンセートの表現型のセットを比較すること(コンデンセートの表現型のセットの各コンデンセートの表現型は、それぞれの細胞モデルに由来し、それぞれの細胞モデル間の差異は、1つ以上の疾患関連因子に起因する)、ならびに、(b)コンデンセートの表現型のセットのうちの少なくとも2つのコンデンセートの表現型において同定された収束差に基づいて、目的コンデンセートを疾患と関連するものと同定すること、を含む。いくつかの実施形態では、コンデンセートの表現型は、コンデンセートと関連することが知られている、または考えられているマーカーを含むマーカーパネルを使用して取得される。いくつかの実施形態では、第1のコンデンセートの表現型または第2のコンデンセートの表現型などのコンデンセートの表現型は、本明細書に記載のin silico法を使用して同定されたマーカーを使用して取得される。いくつかの実施形態では、コンデンセートの表現型は、マーカーパネルのマーカーを視覚化するために設計されたイメージング手法を使用して取得され、例えば、決定される。いくつかの実施形態では、イメージング手法は、IF、ISH(例えば、FISH)、遺伝子融合(例えば、GFP標識)、またはマーカー及び/またはコンデンセートに特異的な色素のうちのいずれか1つ以上を使用してマーカーを標識することを含む。いくつかの実施形態では、イメージング手法は、自動画像解析を含む。いくつかの実施形態では、細胞モデルの疾患関連因子は、本明細書に記載のin silico法を使用して同定及び/または選択される。
【0167】
III.本明細書に開示の方法により可能になるさらなる態様
他の態様では、コンデンセートの表現型、目的コンデンセート、細胞モデル、及びマーカーの同定により可能になるさらなる方法及び態様、ならびに本明細書に記載の関連方法が本明細書に提供される。
【0168】
いくつかの実施形態では、コンデンセートの表現型を調節する化合物を同定する方法が本明細書で提供され、方法は、(a)化合物と、細胞モデルを含む組成物を混合すること、及び、(b)得られる組成物のコンデンセートの表現型を取得すること、を含み、得られるコンデンセートの表現型及び参照のコンデンセートの表現型間の差異により、化合物がコンデンセートの表現型を調節するものとして同定される。いくつかの実施形態では、細胞モデルは、疾患関連因子を含む。いくつかの実施形態では、疾患関連因子は、本明細書に記載の方法を使用して同定される。いくつかの実施形態では、参照コンデンセートの表現型は、参照細胞モデルのコンデンセートの表現型であり、細胞モデル及び参照細胞モデル間の差異は、1つ以上の疾患関連因子に起因する。いくつかの実施形態では、得られるコンデンセートの表現型及び/または参照コンデンセートの表現型は、生物学的マーカーなどのマーカーを使用してイメージングされる。いくつかの実施形態では、得られるコンデンセートの表現型及び/または参照コンデンセートの表現型は、マーカーパネルを使用してイメージングされる。いくつかの実施形態では、マーカーは、本明細書に記載の方法を使用して同定される。
【0169】
いくつかの実施形態では、疾患の処置に有用な化合物を同定する方法が本明細書に提供され、方法は、(a)化合物と、細胞モデルを含む組成物を混合すること、(b)得られる組成物のコンデンセートの表現型を取得すること、を含み、得られるコンデンセートの表現型が疾患の1つ以上の疾患関連因子と関連する表現型識別子の所望の調節を有する場合、化合物は、疾患の処置に有用であると同定される。いくつかの実施形態では、細胞モデルは、疾患関連因子を含む。いくつかの実施形態では、疾患関連因子は、本明細書に記載の方法を使用して同定される。いくつかの実施形態では、参照コンデンセートの表現型は、参照細胞モデルのコンデンセートの表現型であり、細胞モデル及び参照細胞モデル間の差異は、1つ以上の疾患関連因子に起因する。いくつかの実施形態では、得られるコンデンセートの表現型及び/または参照コンデンセートの表現型は、生物学的マーカーなどのマーカーを使用してイメージングされる。いくつかの実施形態では、得られるコンデンセートの表現型及び/または参照コンデンセートの表現型は、マーカーパネルを使用してイメージングされる。いくつかの実施形態では、マーカーは、本明細書に記載の方法を使用して同定される。
【0170】
他の態様では、疾患と関連する生物学的成分を同定する方法が本明細書に提供され、方法は、本明細書に記載の方法のいずれか1つに従って目的コンデンセートを同定すること、及び、目的コンデンセートまたはその成分との関連に基づいて生物学的成分を同定することを含む。いくつかの実施形態では、生物学的成分は、目的コンデンセートへの分配に基づいて同定される。いくつかの実施形態では、生物学的成分は、別の成分の目的コンデンセートへの分配を調節することに基づいて同定される。
【0171】
他の態様では、試験化合物またはその一部と標的コンデンセートまたはその成分との1つ以上の相互作用を同定する方法が本明細書に提供される。いくつかの実施形態では、相互作用は、化合物またはその一部とコンデンセートまたはその成分が、濃厚相及び/または希薄相で評価されるように互いに影響を及ぼす仕方である。いくつかの実施形態では、相互作用には、コンデンセートに対する、化合物またはその部分に特異的な分配の態様が含まれ、これは、化合物またはその部分のコンデンセートの分配と関連する様々な疾患関連因子を包含する。いくつかの実施形態では、相互作用には、化合物またはその部分の存在下のコンデンセートに対するコンデンセートの成分の分配特性の態様が含まれ、これには、化合物またはその部分がコンデンセートの相挙動に有する影響と関連する様々な疾患関連因子が包含される。いくつかの実施形態では、化合物は、試験化合物である。いくつかの実施形態では、化合物は、参照化合物である。いくつかの実施形態では、コンデンセートは、標的コンデンセートである。いくつかの実施形態では、コンデンセートは、参照コンデンセートである。
【0172】
他の態様では、疾患の処置に有用な治療薬の分子標的を同定する方法が本明細書に提供され、方法は、本明細書に記載の方法のいずれか1つを使用して目的コンデンセートを同定すること、ならびに、目的コンデンセートとの関連及び/または相互作用に基づいて分子標的を同定すること、を含む。いくつかの実施形態では、分子標的は、目的コンデンセート中で分配される。いくつかの実施形態では、分子標的は、目的コンデンセートと関連する、及び/または、それに分配される成分と相互作用する。
【0173】
当業者らは、いくつかの実施形態が本出願の開示の範囲及び趣旨内で可能であることを認識するであろう。本開示は、さらに、以下の実施例で示されるが、これらは、本開示の範囲または精神をその中に記載される特定の手順に限定するものとして解釈されるべきではない。
【0174】
例示的な実施形態
実施形態1.疾患と関連する目的コンデンセートを同定する方法であって、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(前記第1の細胞モデル及び前記第2の細胞モデル間の差異が1つ以上の疾患関連因子に起因し、1つ以上の疾患関連因子のうちの少なくとも1つが前記第1の細胞モデルまたは前記第2の細胞モデルのいずれかに導入される)、ならびに、(b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、前記目的コンデンセートを前記疾患と関連するものと同定すること、を含む、前記方法。
【0175】
実施形態2.前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型が、それぞれ、1つ以上の表現型識別子を特徴とする、実施形態1に記載の方法。
【0176】
実施形態3.前記1つ以上の表現型識別子が、コンデンセートの存在、不存在、レベル、形態的特徴、位置、挙動、組成、及び材料特性からなる群より選択される識別子を含む、実施形態2に記載の方法。
【0177】
実施形態4.前記疾患と関連する前記1つ以上の疾患関連因子が、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス、及び環境刺激からなる群より選択される因子を含む、実施形態1~3のいずれか1つに記載の方法。
【0178】
実施形態5.前記第2の細胞モデルが、前記疾患と関連する前記1つ以上の疾患関連因子に基づいて処置及び/または操作される、実施形態1~4のいずれか1つに記載の方法。
【0179】
実施形態6.前記第1の細胞モデルが、前記疾患と関連する前記1つ以上の疾患関連因子に基づいて処置及び/または操作される、実施形態1~5のいずれか1つに記載の方法。
【0180】
実施形態7.さらに、前記第2の細胞モデルを取得することを含む、実施形態1~6のいずれか1つに記載の方法。
【0181】
実施形態8.さらに、前記第2の細胞モデルを生成することを含む、実施形態1~7のいずれか1つに記載の方法。
【0182】
実施形態9.さらに、前記第1の細胞モデルを取得することを含む、実施形態1~8のいずれか1つに記載の方法。
【0183】
実施形態10.さらに、前記第1の細胞モデルを作製することを含む、実施形態1~9のいずれか1つに記載の方法。
【0184】
実施形態11.さらに、前記第1のコンデンセートの表現型を取得することを含む、実施形態1~10のいずれか1つに記載の方法。
【0185】
実施形態12.前記第1のコンデンセートの表現型を取得することが、第1のマーカーの前記目的コンデンセートとの関連を測定することを含む、実施形態11に記載の方法。
【0186】
実施形態13.前記第1のマーカーが、生物学的マーカーである、実施形態12に記載の方法。
【0187】
実施形態14.前記第1のマーカーの前記目的コンデンセートとの関連が、イメージング手法を使用して決定される、実施形態12または13に記載の方法。
【0188】
実施形態15.イメージング手法が、第1のマーカーを標識することを含む、実施形態14に記載の方法。
【0189】
実施形態16.さらに、前記第2のコンデンセートの表現型を取得することを含む、実施形態1~15のいずれか1つに記載の方法。
【0190】
実施形態17.前記第2のコンデンセートの表現型を取得することが、第2のマーカーの前記目的コンデンセートとの関連を測定することを含む、実施形態16に記載の方法。
【0191】
実施形態18.前記第2のマーカーが、生物学的マーカーである、実施形態17に記載の方法。
【0192】
実施形態19.前記第2のマーカーの前記目的コンデンセートとの関連が、イメージング手法を使用して決定される、実施形態17または18に記載の方法。
【0193】
実施形態20.前記イメージング手法が、前記第2のマーカーを標識することを含む、実施形態19に記載の方法。
【0194】
実施形態21.さらに、前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することを含む、実施形態1~20のいずれか1つに記載の方法。
【0195】
実施形態22.前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することが、定性的評価を含む、実施形態21に記載の方法。
【0196】
実施形態23.前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することが、定量的評価を含む、実施形態21または22に記載の方法。
【0197】
実施形態24.前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型間の前記差異を決定することが、in silico手法を含む、実施形態21~23のいずれか1つに記載の方法。
【0198】
実施形態25.前記目的コンデンセートが、前記第1の細胞モデル内に存在するか、または、それに由来する、実施形態1~24のいずれか1つに記載の方法。
【0199】
実施形態26.前記目的コンデンセートが、前記第1の細胞モデル内に存在しないか、または、それに由来しない、実施形態1~24のいずれか1つに記載の方法。
【0200】
実施形態27.前記目的コンデンセートが、前記第2の細胞モデル内に存在しないか、または、それに由来しない、実施形態1~25のいずれか1つに記載の方法。
【0201】
実施形態28.前記目的コンデンセートが、前記第2の細胞モデル内に存在するか、または、それに由来する、実施形態1~26のいずれか1つに記載の方法。
【0202】
実施形態29.前記目的コンデンセートが、ストレス顆粒、切断体、p顆粒、ヒストンローカス体、多小胞体、神経RNA顆粒、核内gem、核膜孔、核スペックル、核ストレス体、核小体、Oct1/PTF/転写(OPT)ドメイン、パラスペックル、傍核小体コンパートメント、PML核小体、PML発がんドメイン、ポリコーム体、プロセシング体、Sam68核小体、及びスプライシングスペックルからなる群より選択されるコンデンセートタイプに属する、実施形態1~28のいずれか1項に記載の方法。
【0203】
実施形態30.前記疾患が、単一遺伝子疾患である、実施形態1~29のいずれか1つに記載の方法。
【0204】
実施形態31.前記疾患が、多遺伝子疾患である、実施形態1~29のいずれか1つに記載の方法。
【0205】
実施形態32.前記疾患が、多因子疾患である、実施形態1~31のいずれか1つに記載の方法。
【0206】
実施形態33.前記疾患が、少なくとも部分的に、刺激及び/または外因性因子により引き起こされる、実施形態1~32のいずれか1項に記載の方法。
【0207】
実施形態34.前記疾患が、感染因子により引き起こされる、実施形態33に記載の方法。
【0208】
実施形態35.前記第1のマーカー及び前記第2のマーカーが、同じである、実施形態17~34のいずれか1つに記載の方法。
【0209】
実施形態36.前記第1のマーカー及び前記第2のマーカーが、異なる、実施形態17~34のいずれか1つに記載の方法。
【0210】
実施形態37.前記疾患と関連する前記目的コンデンセートを同定するのに有用なマーカーを同定する方法であって、(a)複数の候補マーカーまたはその前駆体を前記疾患の1つ以上の疾患関連因子との関連のレベルについて評価すること、(b)前記複数の候補マーカーのうちの少なくとも1つをコンデンセート親和性因子について評価すること、及び(c)前記疾患の前記1つ以上の疾患関連因子との所望の関連のレベルを有し且つ所望のコンデンセート親和性因子を有する前記マーカーに基づいて、前記マーカーを複数の前記候補マーカーから同定すること、を含む、前記方法。
【0211】
実施形態38.さらに、前記疾患の1つ以上の疾患関連因子を同定することを含む、実施形態37に記載の方法。
【0212】
実施形態39.前記疾患の1つ以上の疾患関連因子のそれぞれが、遺伝的バリアント、翻訳後修飾バリアント、外因性遺伝物質、内因性化合物の存在、外因性化合物の存在、物理的プロセス、及び環境刺激からなる群より選択される、実施形態37または38のいずれか1つに記載の方法。
【0213】
実施形態40.さらに、前記疾患の1つ以上の疾患関連因子と関連する遺伝子を同定することを含む、実施形態37~39のいずれか1つに記載の方法。
【0214】
実施形態41.さらに、前記同定された遺伝子に基づいて遺伝子発現産物を同定することを含み、前記遺伝子発現産物またはその一部が、前記複数の候補マーカーまたはその前駆体を送り込むために使用される、実施形態40に記載の方法。
【0215】
実施形態42.各候補マーカーと前記疾患の前記1つ以上の疾患関連因子との前記関連のレベルが、疾患原因因子スコアに基づいている、実施形態37~41のいずれか1つに記載の方法。
【0216】
実施形態43.前記疾患原因因子スコアが、各候補マーカーの前記疾患の前記1つ以上の疾患関連因子との関連の強度を反映する、実施形態42に記載の方法。
【0217】
実施形態44.さらに、各候補マーカーに前記疾患原因因子スコアを割り当てることを含む、実施形態42または43に記載の方法。
【0218】
実施形態45.前記コンデンセート親和性因子が、コンデンセート関連スコアに基づいている、実施形態37~44のいずれか1つに記載の方法。
【0219】
実施形態46.前記コンデンセート関連スコアが、前記候補マーカーまたはその一部と、任意のコンデンセート、特定のコンデンセート、及び/またはコンデンセートと関連する高分子との関連の強度を反映する、実施形態45に記載の方法。
【0220】
実施形態47.さらに、前記候補マーカーに前記コンデンセート関連スコアを割り当てることを含む、実施形態45または46に記載の方法。
【0221】
実施形態48.前記マーカーを前記複数の候補マーカーから同定することが、前記疾患の前記1つ以上の疾患関連因子との関連の前記所望のレベル及び前記所望のコンデンセート親和性因子に基づく累積スコアを含む、実施形態37~47のいずれか1つに記載の方法。
【0222】
実施形態49.前記マーカーが、生物学的マーカーである、実施形態37~48のいずれか1つに記載の方法。
【0223】
実施形態50.前記マーカーが、in silicoで同定される、実施形態37~49のいずれか1つに記載の方法。
【0224】
実施形態51.さらに、前記マーカーが、前記疾患と関連する目的コンデンセートを同定するのに有用であることを検証することを含む、実施形態37~50のいずれか1つに記載の方法。
【0225】
実施形態52.前記疾患と関連する目的コンデンセートを同定する方法であって、(a)第1の細胞モデル由来の第1のコンデンセートの表現型を、第2の細胞モデル由来の第2のコンデンセートの表現型と比較すること(前記第1のコンデンセートの表現型及び前記第2のコンデンセートの表現型は、実施形態37~51のいずれか1つに記載の方法を使用して同定されたマーカーを使用して得られ、前記第1の細胞モデル及び前記第2の細胞モデル間の差異が、前記疾患の前記1つ以上の疾患関連因子に起因し、前記1つ以上の疾患関連因子のうちの少なくとも1つが、前記第1の細胞モデルまたは前記第2の細胞モデルのいずれかに導入され)、ならびに、b)目的コンデンセートに対する第1のコンデンセートの表現型及び第2のコンデンセートの表現型間の差異に基づいて、前記目的コンデンセートを前記疾患と関連するものと同定すること、を含む、前記方法。
【0226】
実施形態53.コンデンセートの表現型を調節する化合物を同定する方法であって、(a)前記化合物と、細胞モデルを含む組成物を混合すること、及び、(b)得られる組成物のコンデンセートの表現型を取得すること、を含み、前記得られるコンデンセートの表現型及び参照のコンデンセートの表現型間の差異により、前記化合物が前記コンデンセートの表現型を調節するものとして同定される、前記方法。
【0227】
実施形態54.疾患の処置に有用な化合物を同定する方法であって、(a)前記化合物と、第1の細胞モデルを含む組成物を混合すること、(b)得られる前記組成物のコンデンセートの表現型を取得すること、を含み、前記得られるコンデンセートの表現型が前記疾患の1つ以上の疾患関連因子と関連する表現型識別子の所望の調節を有する場合、前記化合物が、前記疾患の処置に有用であると同定される、前記方法。
【実施例】
【0228】
実施例1
この例は、疾患と関連する目的コンデンセートを同定する方法を示す。
【0229】
特定のRBM20変異体を、家族性拡張型心筋症(DCM)と関連する疾患関連因子として同定した。H9C2細胞を、心筋細胞親細胞モデルとして取得した。以下のRBM20マーカーのうちの1つを発現するようにH9C2細胞を操作することにより、4つの派生細胞モデルを生成した:(i)Dendra2標識に連結された野生型RBM20ポリペプチド、(ii)Dendra2標識に連結されたR636S変異型RBM20ポリペプチド、(iii)Dendra2標識に連結されたR636C変異型RBM20ポリペプチド、及び、(iv)Dendra2標識に連結されたR636H変異型RBM20ポリペプチド。トランスフェクション後、細胞をインキュベートして、RBM20ポリペプチドを発現させた。60倍の油対物レンズを備えたDeltaVision広視野デコンボリューションシステムを使用して、4つの細胞モデルの蛍光画像をキャプチャした。
【0230】
蛍光画像(
図1A~1D)から、4つのRBM20発現細胞モデルのそれぞれについてコンデンセートの表現型が得られた。コンデンセートの表現型には、コンデンセートの位置、数、サイズ、及び形状が含まれる。次に、細胞モデルから得られたコンデンセートの表現型間の比較を行った。例えば、
図1A~1Dに示されるように、野生型RBM20ポリペプチドをトランスフェクトされたH9C2細胞では、RBM20コンデンセートは、主に、核内で観察され(
図1A)、RBM20変異型ポリペプチドがトランスフェクトされたH9C2細胞では、RBM20コンデンセートは、専ら細胞質内で観察された(
図1B、R636S RBM20;
図1C、R636C RBM20;
図1D、R636H RBM20)。従って、RBM20コンデンセートは、家族性DCMと関連する目的コンデンセートとして同定された。
【0231】
実施例2
本実施例は、健常な状態及び病状と関連する細胞成分を同定するのに有用な相互作用マップを生成するためのゲノム情報の大規模分析を示す。そのような相互作用には、直接的関係(例えば、遺伝子間の物理的接触)または間接的関係(例えば、ある遺伝子が、他の遺伝子の生成を開始する)の両方が含まれ得る。その後、相互作用マップは、疾患関連因子を同定し、目的コンデンセートの表現型及び/またはコンデンセートの同定に有用なマーカー(例えば、生物学的マーカー)を同定し、関連組織、及び/または、例えば、疾患に関連する及び/または薬物スクリーニングアッセイが実施される細胞型を同定(及び/または操作)し、ならびに、目的の遺伝子(例えば、コンデンセートと関連する遺伝子)及び/またはコンデンセートが機能的に関与する経路を同定するために使用されてもよい。
【0232】
簡単に言うと、ヒトの遺伝的性質は、疾患と関連するゲノムの重要な領域を評価し、マークするための基礎として使用される。次に、そのような情報を遺伝子相互作用情報と組み合わせて、各疾患を調節する遺伝子相互作用のマップを作成する。次に、遺伝子のそれぞれのセットでは、関連表現型(例えば、疾患表現型)を使用して、マッピングされた相互作用をより小さな群に分割し、それにより、疾患と関連する特定のプロセス及び細胞成分の観点からマップに詳細を追加する。さらに、機能喪失遺伝学及び動物ノックアウトデータを使用し、マッピングされた相互作用を評価及びスクリーニングして、結果の信頼性が向上する。
【0233】
より具体的には、遺伝子型-表現型関連の統計資料は、データベースから取得されるか、または、必要に応じて、多くの形質のロジスティック回帰を介して症例対照遺伝子型から再導出される。回帰モデル内の交絡変数は、回帰プロセスで制御されるであろう。次に、DAPPLEアルゴリズムを使用して、各形質のタンパク質相互作用マップを生成する。簡単に言うと、DAPPLEアルゴリズムは、形質のピーク遺伝子座のゲノムウィンドウ内にほとんどの遺伝子を包含する最大のタンパク質間相互作用(PPI)サブネットワークを同定するために、貪欲な選択法を使用する。続いて、アルゴリズムは、各遺伝子ノードの次数を保存するスクランブルPPIネットワーク上の同じ遺伝子座を使用して、プロセスを繰り返し、それにより、最初に発見されたサブネットワークの統計的有意性値を計算するためのPPIサブネットワークのバックグラウンドヌル分布が生成される。各形質について、その形質と遺伝性を共有する一連の内部表現型が収集され、遺伝子をクラスター化するために遺伝子を内部表現型クラスに割り当てるために、形質及びその内部表現型間の共局在が計算される。クラスターは、さらに、相互作用マップをモジュールに分割するために使用される。上記の知見は、エクソーム機能喪失バリアントに関する情報及び知見を検証するための公的に入手可能なマウスノックアウトデータを使用して検証される。
【0234】
この知見は、疾患関連因子(例えば、細胞モデルを同定及び/または操作するのに有用なもの)、目的コンデンセートの表現型及び/またはコンデンセートを同定するために有用なマーカー、関連組織及び/または細胞型に関するガイダンス、例えば、疾患に関連するもの及び/または薬物スクリーニングアッセイが実施されるもの、ならびに目的の遺伝子(例えば、コンデンセートと関連する遺伝子)及び/またはコンデンセートが機能的に関与する経路に関する情報、のいずれかを提供するであろう。
【0235】
実施例3
本実施例は、コンデンセートと関連し、2型糖尿病(T2D)の病因に関与すると予測される遺伝子またはノンコーディングバリアントを同定し、優先順位を付けるために、本明細書で教示されるワークフローの使用を示す。具体的には、以下でより詳細に説明するように、方法は、複数の候補遺伝子を、T2Dの1つ以上の疾患関連因子との関連のレベルについて評価すること、及び、候補遺伝子のサブセットを、複数のコンデンセート親和性因子について評価すること、を含む。遺伝子の同定及び優先順位付けは、以下で考察される累積スコアの使用を含む。
【0236】
図2は、本明細書で記載の方法の例示的なワークフローを示す。ゲノムワイド関連研究(GWAS)のデータを使用して、T2Dと関連する遺伝子座及び遺伝子を同定した。ヒトゲノムは、少なくとも20,000の既知の遺伝子で構成される。GWAS分析の後に、T2Dと関連する2,540の遺伝子(リードSNPから±500kb以内)を含む226の遺伝子座をリストする遺伝子座対遺伝子表を生成した(p<5×10
-8の閾値がこの分析に使用された)。GWASで同定された遺伝子座数は、文献で同定されたものと同等であった(A.Mahajan et al.,Nat Genet.2018;50(11):1505-1513;M.Vujkovic et al.,Nat Genet.2020;52(7):680-691)。
【0237】
本明細書に記載の方法によるさらなる分析の前に、GWASデータのゲノミックアノテーションのマルチマーカー分析(MAGMA)分析を実施して、遺伝子座対遺伝子表のメンバーを評価した。ボンフェローニ補正された有意に濃縮されたMAGMA遺伝子セットは、GWAS分析により同定された上位の有意に濃縮された遺伝子が、関連T2D生物学的経路、分子機能、及び細胞成分と関連していたことを示した(分子シグネチャーデータベース(MsigDB)に基づく)。しかし、既知のコンデンセート中に複数の遺伝子(または遺伝子産物)を有することに基づいた、有意に濃縮された組織タイプまたはコンデンセートの関連は、MAGMA遺伝子セットから確認されなかった。この結果は、コンデンセートと関連し且つT2Dの病因に関与する遺伝子を同定し、優先順位付けするために、本明細書に記載されるような、さらなるコンデンセート特異的分析の必要性を示す。
【0238】
GWASデータを使用して、同定された遺伝子座と関連する候補遺伝子/マーカー(原因遺伝子/バリアント(遺伝子-疾患の関連を引き起こす)を含む、標的遺伝子(原因バリアントの影響を受ける)、及び他の候補(例えば、T2Dと関連する未知の候補マーカー))を評価して、重み付けされた遺伝子の優先順位付けスコアに基づいて、目的の遺伝子を同定し、優先順位を付けた。T2Dと関連する226のGWAS遺伝子座を使用して、リードSNPから500キロベース以内にマッピングされた2540の遺伝子が、独立して、以下のそれぞれに基づいて評価された。(a)コンデンセートに焦点を当てた多遺伝子遺伝子の特徴(例えば、改変PoPS)、(b)メンデル遺伝子解析、(c)レアバリアント負荷、(d)独立した重要なSNPと連鎖不平衡(LD)にあるSNPによるタンパク質コーディング遺伝子のマッピング、(e)組織全体にわたるeQTLの共局在、及び、(f)クロマチン相互作用。
【0239】
GWAS及び様々なソースの生物学的データベースの多遺伝子シグナルに影響する遺伝子優先順位付け方法である多遺伝子優先スコア(PoPS、Weeks et al..medRxiv,2020)は、コンデンセートに焦点を当てた多遺伝子遺伝子の特徴を含むように修正された。PoPSの場合、データ入力には、遺伝子経路、タンパク質間相互作用、及び単一細胞RNA-seqの関連データセットの生物学的情報を組み込む、GWAS概要統計及び遺伝子メンバーシップの入力行列が含まれていた。遺伝子経路、タンパク質間相互作用、及び単一細胞RNA-seqデータセットに加えて、独自のデータベースのコンデンセートメンバーシップ情報及び追加の疾患関連遺伝子発現データが、修正PoPS解析の遺伝子メンバーシップ入力行列に含まれた。GWAS解析のマッピングされた2,540の遺伝子のうち、改変PoPSスコアが高い1,232の遺伝子を同定した。
【0240】
メンデル遺伝子解析は、ヒトの遺伝子/遺伝子型及び遺伝的表現型、例えば、疾患表現型を関連付けるオンラインでのヒトのメンデル遺伝(OMIM)大要録を使用して実施された。これらの表現型には、(1)単一遺伝子メンデル障害及び形質、(2)がん及び複雑な疾患に対する感受性、(3)異常ではあるが良性の臨床検査値及び血液型につながる変化、ならびに、(4)選択された体細胞遺伝性疾患、が含まれる。GWAS解析でマッピングされた2,540の遺伝子のうち、580の遺伝子が、OMIM表現型を有し、手動によるキュレーションの後、694のOMIM表現型を同定した。これらのうち、307の遺伝子が、T2D関連遺伝性障害と関連していた。
【0241】
バリアントと表現型を関連付ける、UK BioBank(UKBB)などのデータベースを使用して、GWASで同定された遺伝子に集中するレアバリアントを評価した。
【0242】
独立した重要なSNPと連鎖不平衡にある全SNPを位置決めすることにより、タンパク質コーディングバリアントのマッピングを評価した。これらのSNPから、エクソンSNP及びスプライシングSNPが保存され、対応するタンパク質をコードする遺伝子にマッピングされた。GWASデータからマッピングされた2,540の遺伝子のうち、116の遺伝子を同定して、タンパク質をコードするバリアントを含有した。
【0243】
調節バリアントマッピングを、eQTL共局在化を介して実施した。eQTL共局在化を実施して、単一のバリアントが遺伝子座(遺伝子発現表現型の遺伝的分散の一部を説明する遺伝子座)内のGWASシグナル及びeQTLシグナルの両方に関与しているかどうかを評価した。疾患関連組織内でシグナルを有する遺伝子に、より高い重みが与えられた。GWAS分析により同定された2,540の遺伝子のうち、193の遺伝子が、組織全体でeQTL共局在を有することが確認された。
【0244】
クロマチン相互作用マッピング(例えば、Hi-Cまたは3Cデータに基づく)により、調節バリアントマッピングも実施した。疾患関連組織内でシグナルを有する遺伝子に、より高い重みが与えられた。GWAS分析により同定された2,540の遺伝子のうち、1,038の遺伝子が、クロマチン相互作用と関連していることが確認された。
【0245】
遺伝子のスコアリング及び優先順位付けは、以下のそれぞれのデータを含む重み付けされた遺伝子優先順位付けスコアを使用して実施される。(a)コンデンセートに焦点を当てた多遺伝子性遺伝子特徴(PoPS)、(b)メンデル遺伝子解析、(c)レアバリアント負荷、(d)独立した有意なSNPを有するLDにおけるSNPによるマッピングタンパク質コーディング遺伝子、(e)組織全体にわたるeQTLの共局在、及び(f)クロマチン相互作用。さらに、各遺伝子座が、(例えば、文献に基づいた、またはGWASシグナルの微細マッピングに基づいた(例えば、以下を参照、H.Huang et al.Nature.2017;547(7662):173-178))0~2つの原因遺伝子及び最小の重み付けされた遺伝子優先順位付けスコアを有することが要求された。これにより、226のGWAS遺伝子座から228の遺伝子が同定され、優先順位が付けられた。これらのうち、169の遺伝子は、高い信頼性を有した(すなわち、重み付けされた遺伝子優先順位付けスコアが所定の閾値を上回っていた)。
【0246】
次に、相分離形成の確率(例えば、DeepPhaseスコア;以下を参照、C.Yu et al.,“Proteome-scale analysis of phase-separated proteins in immunofluorescence images,”Brief Bioinform.2021 May;22(3):bbaa187)、予測されるコンデンセート形成(例えば、Pscore)、天然変性領域(IDR領域)またはIDR領域の画分、コンデンセートとの既知の関連、及びHuman Protein Atlas(HPA)のタンパク質画像を含む、コンデンセート関連スコアに寄与するコンデンセートの特徴について、228の優先順位付けされた遺伝子を分析した。さらに、遺伝子の特徴は、優先順位付けされた228の遺伝子、例えば、遺伝子の説明、Uniprot ID及びタンパク質のクラス、生物学的経路及び分子機能との関連、関連疾患、細胞型特異的なRNA発現、ならびに細胞の位置及びセクレトームの位置のそれぞれと関連があった。
【0247】
上述の方法論の結果に基づいて、高精度の遺伝子同定(例えば、ゴールドスタンダードT2D遺伝子との一致)が達成された。その中で、KCNJ11及びABCC8が、目的遺伝子として優先順位付けされた(
図3を参照)。KCNJ11及びABCC8は、ATP感受性カリウムチャネルのメンバーであり、T2D感受性との既知の関連があり、KCNJ11またはABCC8変異を有する多くの患者は、スルホニル尿素薬で長年にわたって上手く処置することができる。従って、KCNJ11またはABCC8は、本発明者らの研究のマーカーまたは疾患関連因子の陽性対照として機能する。
【0248】
実施例4
この例は、コンデンセートの表現型を介して疾患と関連する目的コンデンセートを同定する方法を示す。
【0249】
特定のデスモプラキン(DSP)、デスモグレイン2(DSG2)、及びアルファプロテインキナーゼ3(ALPK3)変異体は、家族性DCMと関連していることが確認された。DSP及びDSG2は、双方ともに、心筋及び表皮細胞のデスモソーム構造にとって重要な成分であり、これは、隣接する細胞接触部の構造的完全性を維持するように機能する。ALPK3は、心筋細胞の分化に関与している。
【0250】
人工多能性幹細胞(iPSC)に由来したiCell(登録商標)心筋細胞を、細胞モデルとして取得した。以下を発現するプラスミドと共に、iCell(登録商標)心筋細胞をトランスフェクトすることにより、12の派生細胞モデルを生成した。1)GFP標識DSP野生型(WT)ポリペプチド「DSP-GFP-WT」(
図4A)、2)GFP標識DSP S299R点変異ポリペプチド「DSP-GFP-S299R」(
図4B)、3)GFP標識DSP終結変異ポリペプチド「DSP-GFP-Q331ter」(
図4C)、4)GFP標識DSG2野生型(WT)ポリペプチド「DSG2-GFP-WT」(
図5A)、5)GFP標識DSG2終結変異ポリペプチド「DSG2-GFP-W306ter」(
図5B)、6)GFP標識ALPK3野生型(WT)ポリペプチド「ALPK3-GFP-WT」(
図6A)、7)GFP標識ALPK3 L1299P点変異ポリペプチド「ALPK3-GFP-L1299P」(
図6B)、8)GFP標識ALPK3 L1622P点変異ポリペプチド「ALPK3-GFP-L1622P」(
図6C)、9)GFP標識ALPK3終結変異ポリペプチド「ALPK3-GFP-R1261ter」(
図6D)、10)GFP標識ALPK3終結変異ポリペプチド「ALPK3-GFP-W1264ter」(
図6E)、及び、11)GFP標識ALPK3終結変異ポリペプチド「ALPK3-GFP-W1765ter」(
図6F)。トランスフェクション後、細胞を48時間インキュベートして、上記のプラスミドを介してポリペプチドを発現させた。細胞を青色蛍光DNA染色剤であるDAPIで染色した。GFP及びDAPI用のチャネルを使用する40倍の水対物レンズを備えたスピニングディスク共焦点を使用して12の細胞モデルの蛍光画像を取り込んだ。
【0251】
蛍光画像から、上記12個の細胞モデルのそれぞれについて、コンデンセートの表現型を得た。コンデンセートの表現型は、コンデンセートの位置、数、サイズ、及び/または形状を含む。次に、野生型及びバリアントポリペプチドを発現する細胞モデルから得られたコンデンセートの表現型間の比較を実施し、これは、コンデンセートの表現型の変化を示す。
【0252】
図4Aに示されるように、野生型DSPを発現するiCell(登録商標)心筋細胞において、野生型DSPは、細胞周囲の点(DSPコンデンセート)に局在していた。DSP S299R点変異ポリペプチドを発現する細胞では、DSP点は、細胞の内部に局在していた(
図4B)。DSP-GFP-Q331terを発現する細胞(
図4C)では、DSP点が除去され、GFPレベルが細胞全体に拡散した。
【0253】
野生型DSPコンデンセートと同様に、野生型DSG2を発現するiCell(登録商標)心筋細胞では、野生型DSG2は、細胞周囲の点(DSG2コンデンセート)に局在していた(
図5A)。DSG2終結変異ポリペプチドを発現する細胞では、DSG2点が除去され、GFPレベルが細胞核の周囲に拡散した(
図5B)。
【0254】
図6Aで示されるように、野生型ALPK3を発現するiCell(登録商標)心筋細胞では、野生型ALPK3は、サイトゾル全体の点(ALPK3コンデンセート)に局在していた。ALPK3 L1299P(
図6B)またはL1622P(
図6C)点変異ポリペプチドを発現する細胞では、より小さく、より多数のALPK3点が観察された。ALPK3終結変異ポリペプチドを発現する細胞では、ALPK3点を除去し、GFPレベルを細胞全体に拡散した(
図6D~6F)。
【0255】
それに応じて、DSP、DSG2、及びALPK3コンデンセートが、家族性DCMと関連する目的コンデンセートとして確認された。DSP、DSG2、及びALPK3は、家族性DCMと関連する目的コンデンセートを同定するのに有用なマーカーとして機能し得る。
【国際調査報告】