(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-02-27
(54)【発明の名称】健康状態および疾患状態を監視および診断するための方法および組成物
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230217BHJP
C12Q 1/6874 20180101ALI20230217BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6874 Z
【審査請求】未請求
【予備審査請求】有
(21)【出願番号】P 2022538219
(86)(22)【出願日】2020-12-18
(85)【翻訳文提出日】2022-08-15
(86)【国際出願番号】 US2020066190
(87)【国際公開番号】W WO2021127549
(87)【国際公開日】2021-06-24
(32)【優先日】2019-12-20
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】508087147
【氏名又は名称】ユニヴァーシティー オブ ユタ リサーチ ファウンデーション
(71)【出願人】
【識別番号】507189666
【氏名又は名称】デューク ユニバーシティ
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100119013
【氏名又は名称】山崎 一夫
(74)【代理人】
【識別番号】100123777
【氏名又は名称】市川 さつき
(74)【代理人】
【識別番号】100111796
【氏名又は名称】服部 博信
(74)【代理人】
【識別番号】100123766
【氏名又は名称】松田 七重
(72)【発明者】
【氏名】ロウリー ジェシー ワース
(72)【発明者】
【氏名】ロンディーナ マシュー
(72)【発明者】
【氏名】ヴォーラ ディーパク
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ08
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
生体試料のトランスクリプトームワイド発現プロファイルを作製し、かつ対象における疾患の診断、その発症の監視、その進行の監視、およびその回復の評価に使用することができるバイオマーカーを特定するための方法が本明細書に開示される。これらのバイオマーカーを使用して、治療レジメンを確立および評価することもできる。
【特許請求の範囲】
【請求項1】
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、
a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、前記測定がRNAシーケンシングを含む、測定することと、
b)ステップa)で取得された前記測定された発現レベルから前記遺伝子の発現レベルを決定することと、
c)ステップa)の結果とステップb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、
d)前記トランスクリプトームワイド発現プロファイルをデータセットとして提供することと、を含み、
前記第1の生体試料が単離された血小板からなる、方法。
【請求項2】
前記方法が少なくとも1回繰り返される、請求項1に記載の方法。
【請求項3】
前記方法が第2の生体試料で繰り返され、前記第2の生体試料が単離された血小板からなる、請求項1に記載の方法。
【請求項4】
前記第1の生体試料および前記第2の生体試料が同じ対象または異なる対象から得られる、請求項3に記載の方法。
【請求項5】
前記第1の生体試料および前記第2の生体試料が、第1の時点および第2の時点で同じ対象から得られる、請求項4に記載の方法。
【請求項6】
前記第1の時点と前記第2の時点が異なる時点である、請求項5に記載の方法。
【請求項7】
前記第1の時点からの前記トランスクリプトームワイド発現プロファイルが前記第2の時点からの前記トランスクリプトームワイド発現プロファイルと比較される、請求項6に記載の方法。
【請求項8】
前記方法が、有効なトランスクリプトームワイド発現プロファイルが特定されるまでそれらのステップを繰り返すことをさらに含む、先行請求項のいずれか一項に記載の方法。
【請求項9】
前記発現レベルが、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定される、請求項1に記載の方法。
【請求項10】
ステップa)~d)が各生体試料で繰り返される、請求項4に記載の方法。
【請求項11】
前記対象の前記トランスクリプトームワイド発現プロファイルが比較される、請求項10に記載の方法。
【請求項12】
前記第1の生体試料および前記第2の生体試料が異なる対象から得られ、前記対象から追加の生体試料を得ることをさらに含み、前記追加の生体試料が異なる時点で得られる、請求項5に記載の方法。
【請求項13】
前記第1の時点からの前記トランスクリプトームワイド発現プロファイルが前記第2の時点からの前記トランスクリプトームワイド発現プロファイルと比較される、請求項12に記載の方法。
【請求項14】
2つのトランスクリプトームワイド発現プロファイル間の遺伝子発現差異を特定する方法であって、請求項0に記載の方法を使用して対象の血小板トランスクリプトームの1つ以上の変動を決定することであって、前記方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、決定することを含む、方法。
【請求項15】
対象由来の血小板における時間依存的遺伝子発現差異を測定する方法であって、請求項0に記載の方法を使用して対象の血小板トランスクリプトームの1つ以上の変動を決定することであって、前記方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、決定することと、前記対象からの前記時間依存的変化を基準と比較することと、を含む、方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2019年12月20日に出願された米国仮出願第62/951,004号の出願日の利益を主張する。先に出願されたこの出願の内容は、参照により本明細書にその全体が組み込まれる。
【0002】
連邦政府資金による研究に関する陳述
本発明は、国立衛生研究所により授与された助成金番号AG048022およびHL144957の下で政府の支援によりなされたものである。政府は、本発明においてある特定の権利を有する。
【0003】
配列表の組み込み
本出願は、本出願の出願と同時にEFS-Webを介して提出される配列表を含み、ファイル名「21101_0410P1_SL.txt」を含み、これは、4,096バイトのサイズであり、2020年12月6日に作成され、参照によりその全体が本明細書に組み込まれる。
【0004】
本開示は、対象における健康状態および疾患状態の監視および診断に使用することができる血小板の健常遺伝子発現シグネチャ基準に関する組成物および方法に関する。血小板の健常遺伝子発現シグネチャ基準は、疾患状態をスクリーニングし、それを診断し、その発症を監視し、その進行を監視し、かつそれを特定して診断するために使用ことができるか、または予後指標として使用することができる。血小板の健常遺伝子発現シグネチャ基準を使用して、治療計画を確立および評価することもできる。
【背景技術】
【0005】
現在の遺伝子発現診断は、個体間変動および個体内変動からのノイズを説明するために健常対照を含む大きな横断コホートを使用することに依存している。経時的な健常個体由来の血小板の予想される変動に関する利用可能な基準は存在しない。横断研究は、個体内変動を間接的に説明するために多数の健常対照を必要とする。これらの横断研究は、遺伝子発現に有意に影響を及ぼす可能性のある個体内変動または遺伝的バリアントを直接補正するものではない。診断試験にはより正確な「健常」基準が必要である。
【発明の概要】
【0006】
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含む、方法が本明細書に開示される。
【図面の簡単な説明】
【0007】
【
図1A】4ヶ月間(コホート1)から4年間(コホート2)にわたる血小板RNA発現の個体内安定性および個体間安定性を示す。
図1Aは、コホート1の試料由来の血小板における総RNA発現の教師なしクラスタリングおよびヒートマップを示す。各ヒートマップの左側のヒストグラムは、試料対間の距離の分布を示し、青色の濃さは、試料対間の類似度を示す。ヒートマップ樹状図内でネイバーとしてクラスター化する試料は、最も高い類似性を有するトランスクリプトームを反映する。最も近いネイバー自己対を黄色および灰色で強調表示しており、最も近いネイバー非自己対をオレンジ色で強調表示している。
【
図1B】4ヶ月間(コホート1)から4年間(コホート2)にわたる血小板RNA発現の個体内安定性および個体間安定性を示す。
図1Bは、コホート1の転写物の個体相関プロット例を示す。各データ点は、同じ個体内(上パネル)または異なる個体間(下パネル)の0時点(x軸)対0時点、2週時点、4ヶ月時点、または4年時点(y軸)の指定のドナーからの単一の転写物の正規化対数変換発現レベル(RLD)を表す。点が密度に従ってヒートカラー表示(heat-colored)されている。P値は、ピアソン相関からのものである。
【
図1C】4ヶ月間(コホート1)から4年間(コホート2)にわたる血小板RNA発現の個体内安定性および個体間安定性を示す。
図1Cおよび
図1Fは、(
図1C)0時点および4ヶ月時点、または(
図1F)試験した全時点(左)または個別に指定した時点(右)の総計の個体対内と個体対間との間のRNA発現ピアソン相関を要約する箱ひげ図を示す。
図1Fの指定の時点に関して、さらに分析した試料を比較した場合に平均個体間相関が有意に減少しなかったことに留意されたい。例えば、0時点対2週時点の平均個体内相関を0時点対4年時点の平均個体内相関と比較した場合、有意差はなかった。年齢、性別、および人種について調整する前および調整した後のコホート1(
図1C)の箱ひげ図が示されており、サンプルサイズがより小さいため、それらをコホート2(
図1F)では調整しない。P値は、ウィルコクソン検定からの値であり、調整済みのものである。
【
図1D】4ヶ月間(コホート1)から4年間(コホート2)にわたる血小板RNA発現の個体内安定性および個体間安定性を示す。
図1Dは、コホート2の試料由来の血小板における総RNA発現の教師なしクラスタリングおよびヒートマップを示す。各ヒートマップの左側のヒストグラムは、試料対間の距離の分布を示し、青色の濃さは、試料対間の類似度を示す。ヒートマップ樹状図内でネイバーとしてクラスター化する試料は、最も高い類似性を有するトランスクリプトームを反映する。最も近いネイバー自己対を黄色および灰色で強調表示しており、最も近いネイバー非自己対をオレンジ色で強調表示している。
【
図1E】4ヶ月間(コホート1)から4年間(コホート2)にわたる血小板RNA発現の個体内安定性および個体間安定性を示す。
図1Eは、コホート2の転写物の個体相関プロット例を示す。各データ点は、同じ個体内(上パネル)または異なる個体間(下パネル)の0時点(x軸)対0時点、2週時点、4ヶ月時点、または4年時点(y軸)の指定のドナーからの単一の転写物の正規化対数変換発現レベル(RLD)を表す。点が密度に従ってヒートカラー表示(heat-colored)されている。P値は、ピアソン相関からのものである。
【
図1F】4ヶ月間(コホート1)から4年間(コホート2)にわたる血小板RNA発現の個体内安定性および個体間安定性を示す。
図1Cおよび
図1Fは、(
図1C)0時点および4ヶ月時点、または(
図1F)試験した全時点(左)または個別に指定した時点(右)の総計の個体対内と個体対間との間のRNA発現ピアソン相関を要約する箱ひげ図を示す。
図1Fの指定の時点に関して、さらに分析した試料を比較した場合に平均個体間相関が有意に減少しなかったことに留意されたい。例えば、0時点対2週時点の平均個体内相関を0時点対4年時点の平均個体内相関と比較した場合、有意差はなかった。年齢、性別、および人種について調整する前および調整した後のコホート1(
図1C)の箱ひげ図が示されており、サンプルサイズがより小さいため、それらをコホート2(
図1F)では調整しない。P値は、ウィルコクソン検定からの値であり、調整済みのものである。
【
図2A】血小板中の各転写物の個体内変動および総変動のコホート間の比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図2Aは、コホート1(x軸)の各転写物をコホート2(y軸)の各転写物のそれぞれの変動に対してプロットした個体内変動を示す。0.5での水平線および垂直線は、
図2Bおよび
図2Dのベン図に使用した変動の任意の閾値を示す。
【
図2B】血小板中の各転写物の個体内変動および総変動のコホート間の比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。0.5での水平線および垂直線は、
図2Bおよび
図2Dのベン図に使用した変動の任意の閾値を示す。
図2Bは、総個体変動(D)が最も高い転写物の重複のベン図を示す。各ベンの下には、両コホート間で重複する転写物の有意に濃縮されたGO用語がリストされている。FDR=Davidによって計算されたベンジャミニ偽発見率(Huang DW,et al.Nat Protoc.2009;4:44-57)。
【
図2C】血小板中の各転写物の個体内変動および総変動のコホート間の比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図2Cは、コホート1(x軸)の各転写物をコホート2(y軸)の各転写物のそれぞれの変動に対してプロットした総個体変動を示す。0.5での水平線および垂直線は、
図2Bおよび
図2Dのベン図に使用した変動の任意の閾値を示す。
【
図2D】血小板中の各転写物の個体内変動および総変動のコホート間の比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。0.5での水平線および垂直線は、
図2Bおよび
図2Dのベン図に使用した変動の任意の閾値を示す。
図2Dは、個体内変動(B)および総個体変動(D)が最も高い転写物の重複のベン図を示す。各ベンの下には、両コホート間で重複する転写物の有意に濃縮されたGO用語がリストされている。FDR=Davidによって計算されたベンジャミニ偽発見率(Huang DW,et al.Nat Protoc.2009;4:44-57)。
【
図3A】反復性によってランク付けした転写物の遺伝性形質およびeQTLが濃縮されていることを示す。
図3Aは、コホート1のRNA-seqデータにおいて最も高い反復性を有する転写物、およびPRAX1(Simon LM,et al.Am J Hum Genet.2016;98:883-97、およびSimon LM,et al.Blood.2014;123(16):e37-45)マイクロアレイデータにおいて報告されたそれらの人種、性別、またはeQTLとの関連性の表を示す。FDR<1e-4との関連性をピンク色で強調表示している。NS=有意ではない。
【
図3B】反復性によってランク付けした転写物の遺伝性形質およびeQTLが濃縮されていることを示す。
図3Bは、0時点(x軸)および4ヶ月時点(y軸)でのMFN2のRNA発現(対数正規化)の相関プロットを示す。点がrs1474868遺伝子型に従って色付けされている(ND=決定されず)。上記は、遺伝子型による二峰性分布を示す密度ヒストグラムである。多峰性に対するハーティガンのディップ検定からの二峰性P値。
【
図3C】反復性によってランク付けした転写物の遺伝性形質およびeQTLが濃縮されていることを示す。
図3C(上)は、個体内変動、平均発現存在量、総変動、または反復性の異なる尺度に従ってランク付けしたeQTLの存在についての濃縮プロットを示す。プロットの下の軸は、各尺度に従う遺伝子ランクを示し、反復性尺度の値を示す(他の尺度の値は軸上には記載していない)。既知のeQTLを有する遺伝子を赤色で示し、有しない遺伝子を青色で示している。したがって、最も高い反復性を有する遺伝子がほぼ100%eQTL遺伝子である一方で、最も低い反復性を有する遺伝子はほぼ0%である。
図3C(下)は、各測定基準についての累積濃縮スコアのプロットを示す。
【
図3D】反復性によってランク付けした転写物の遺伝性形質およびeQTLが濃縮されていることを示す。
図3Dは、総変動によってランク付けした同じ数の遺伝子と比較した、指示した反復性閾値で遺伝子のeQTLを特定する可能性のオッズ比を示す。
【
図3E】反復性によってランク付けした転写物の遺伝性形質およびeQTLが濃縮されていることを示す。
図3Eは、0時点および4ヶ月時点でのコホート1およびNLコホートにおけるrs1168863遺伝子型によるLINC01089発現の箱ひげ図を示す(Best MG,et al.Cancer Cell.2017;32:238-252)。*年齢、性別、および人種(コホート1)または集団構造(コホート2)(推測遺伝的祖先(Purcell S,et al.Am J Hum Genet.2007;81:559-75、およびChang CC,et al.Gigascience.2015;4:7))について調整したP値。
【
図3F】反復性によってランク付けした転写物の遺伝性形質およびeQTLが濃縮されていることを示す。
図3Fは、コホート1およびNLコホートにおけるヘテロ接合体内のrs1168863の対立遺伝子不均衡を示す箱ひげ図を示す。Aヌクレオチドを有するRNA-seqリードのTヌクレオチドを有するRNA-seqリードに対する比率を計算し、各ヘテロ接合体個体についてプロットした。
【
図4A】血小板におけるエクソンスキッピングの個体内安定性および個体間安定性を示す。
図4Aは、エクソンスキッピング事象がどのように定義されるかの概略図を示す。スプライス接合部リードを使用してエクソンスプライスイン(PSI)パーセントを計算し、これは、エクソン包含接合部リードの総接合部リードに対する比率である。
【
図4B】血小板におけるエクソンスキッピングの個体内安定性および個体間安定性を示す。
図4Bは、個体内(左パネル)および個体間(右パネル)のエクソンスキッピング事象のPSIの相関プロットを示す。各点は、0時点(x軸)対0時点または4ヶ月時点(y軸)での指定のドナーからの単一エクソンスキッピング事象を表す。
【
図4C】血小板におけるエクソンスキッピングの個体内安定性および個体間安定性を示す。
図4Cは、0時点および4ヶ月時点ですべてのエクソンスキッピング事象のPSIを分析した際の、かつ年齢、性別、および人種について調整した後の、個体内対個体間のピアソン相関を要約した箱ひげ図を示す。*ウィルコクソン検定、調整済み。
【
図5A】SELPにおけるエクソン14スキッピングの反復性および人種との関連性を示す。
図5Aは、血小板における最も反復性の高いエクソンスキッピング事象の表を示す。
【
図5B】SELPにおけるエクソン14スキッピングの反復性および人種との関連性を示す。
図5Bは、0時点および4ヶ月時点での2つの異なる個体からのシーケンシングリードの代表的なIGVプロットを示し、SELPのエクソン14に整列する、またはそれをスキップする個体間のリードの差次的分布を示す。このヒストグラムは、各エクソンに整列したリードの累積存在量を示す。個々のリードのサブセットを各ヒストグラムの下に示しており、太い線(リードのマッピングされた部分)に繋がっている細い線(リード中に存在しない)によって分割されたスプライス接合部リードを示す。赤色リードおよび青色リードは、それぞれ、エクソン14に整列する、またはそれをスキップするスプライス接合部リードである。
【
図5C】SELPにおけるエクソン14スキッピングの反復性および人種との関連性を示す。
図5Cは、SELPエクソン14 PSIの相関プロットを示す。各点は、0時点(x軸)および4ヶ月時点(y軸)での個々のドナーのPSIを表す。BのIGVプロットに表されるドナーを赤色文字でラベル付けしている。
【
図5D】SELPにおけるエクソン14スキッピングの反復性および人種との関連性を示す。
図5Dは、0時点および4ヶ月時点での人種によるSELPエクソン14平均PSIの箱ひげ図を示す。
【
図6A】rs6128が血小板SELPエクソン14スプライスQTLであることを示す。
図6Aは、rs6128 A/Aおよび比較的高レベルのエクソンスキッピングリードを有する個体(上)またはrs6128 (T/T)バリアントを有する個体(下)のSELPエクソン14にわたるリード分布を示す拡大IGVプロットを示す。CからTへの変化はアミノ酸配列を変化させないが、Ex-Skipによって予測されるようにエクソンスプライシングサイレンサーおよびエンハンサー部位を変化させる(Raponi M,et al.Hum Mutat.2011;32:436-444)。
【
図6B】rs6128が血小板SELPエクソン14スプライスQTLであることを示す。
図6Bは、0時点および4ヶ月時点でのコホート1におけるRNA-seqから推測したrs6128遺伝子型によるSELPエクソン14平均PSIの箱ひげ図を示す。
【
図6C】rs6128が血小板SELPエクソン14スプライスQTLであることを示す。
図6Cは、NLコホートにおける公開されたRNA-seqデータから推測したrs6128遺伝子型によるSELPエクソン14平均PSIの箱ひげ図を示す。*年齢、性別、および人種(
図6B)または集団構造(
図6C)(推測遺伝的祖先(Purcell S,et al.Am J Hum Genet.2007;81:559-75、およびChang CC,et al.Gigascience.2015;4:7))について調整したP値。
【
図7A】rs6128がSELPにおけるエクソン14スキッピングを直接制御し、可溶性P-セレクチンタンパク質発現に対する表面の比率を変化させることを示す。
図7Aは、SELPのORFおよびエクソン14に隣接するイントロンを含むSELPのミニ遺伝子構築物の概略図である。C/C構築物およびT/T構築物は、rs6128で一塩基だけ異なる。構築物を、2つの異なるプロモーター(CMVまたはMSCV)を有するベクターにクローニングした。HEK293細胞にトランスフェクトした後、イントロンをスプライシングし、エクソン14を可変的にスプライシング(スキップ)する。エクソン14スキッピングの程度を、異なるサイズの2つのPCR産物を生成するエクソン14隣接プライマーを介してPCRによって測定する。
【
図7B】rs6128がSELPにおけるエクソン14スキッピングを直接制御し、可溶性P-セレクチンタンパク質発現に対する表面の比率を変化させることを示す。
図7Bは、HEK293細胞にrs6128 C/CベクターまたはT/Tベクターをトランスフェクトした後のSELPエクソン14スキッピングのRT-PCR分析を示す。5つの独立した実験からの代表的な結果を示す。下方には、上側バンドおよび下側バンドの合計(総計)で割ったエクソン14包含バンド(上側バンド)の密度測定分析に従って計算したPSIの棒グラフおよび標準誤差要約を示している。*対応のあるt検定、n=5つの独立した実験。
【
図7C】rs6128がSELPにおけるエクソン14スキッピングを直接制御し、可溶性P-セレクチンタンパク質発現に対する表面の比率を変化させることを示す。
図7Cは、HEK293細胞にrs6128 C/CベクターまたはT/Tベクターをトランスフェクトした後のP-セレクチン表面発現のフローサイトメトリー分析を示す。上は、CMVプロモーター空のベクター、rs6128 C/C、またはT/Tをトランスフェクトした24時間後のP-セレクチン表面発現の代表的なヒストグラムオーバーレイである。下は、トランスフェクトした後の表面P-セレクチンMFIの倍率変化(トランスフェクションに正規化)の棒グラフおよび標準誤差要約である。*対応のあるt検定、1群当たりn=5~6対。
【
図7D】rs6128がSELPにおけるエクソン14スキッピングを直接制御し、可溶性P-セレクチンタンパク質発現に対する表面の比率を変化させることを示す。
図7Dは、rs6128 C/CベクターまたはT/Tベクターをトランスフェクトした後のHEK293細胞の上清中の可溶性P-セレクチンのELISA分析を示す。*対応のあるt検定、1群当たりn=12~14対。
【
図8A】4ヶ月間(コホート1)および4年間(コホート2)にわたる血小板非コードRNA発現の個体内安定性および個体間安定性を示す。
図8Aは、コホート1の試料由来の血小板における非コードRNA発現の教師なしクラスタリングおよびヒートマップを示す。各ヒートマップの左側のヒストグラムは、試料対間の距離の分布を示し、青色の濃さは、試料対間の類似度を示す。ヒートマップ樹状図内でネイバーとしてクラスター化する試料は、最も高い類似性を有する非コードトランスクリプトームを反映する。最も近いネイバー自己対を黄色および灰色で強調表示しており、最も近いネイバー非自己対をオレンジ色で強調表示している。
【
図8B】4ヶ月間(コホート1)および4年間(コホート2)にわたる血小板非コードRNA発現の個体内安定性および個体間安定性を示す。
図8Bは、コホート1における非コード転写物の個々の相関プロットの例を示す。各データ点は、同じ個体内(上パネル)または異なる個体間(下パネル)の0時点(x軸)対0時点、2週時点、4ヶ月時点、または4年時点(y軸)での指定のドナーからの単一の非コード転写物の正規化対数変換発現レベル(RLD)を表す。点が密度に従ってヒートカラー表示されている。
【
図8C】4ヶ月間(コホート1)および4年間(コホート2)にわたる血小板非コードRNA発現の個体内安定性および個体間安定性を示す。
図8Cおよび
図8Fは、0時点および4ヶ月時点(
図8C)、または(
図8F)時点(左)または個別に指定した時点(右)の総計の個体対内と個体対間との間の非コードRNA発現ピアソン相関を要約する箱ひげ図を示す。
図8Cでは、年齢、性別、および人種について調整する前と調製した後のコホート1の箱ひげ図を示し、コホート2では調整していない(サンプルサイズがより小さいため)。ウィルコクソン検定からのP値、調整済み。
【
図8D】4ヶ月間(コホート1)および4年間(コホート2)にわたる血小板非コードRNA発現の個体内安定性および個体間安定性を示す。
図8Dは、コホート2(
図8D)の試料由来の血小板における非コードRNA発現の教師なしクラスタリングおよびヒートマップを示す。各ヒートマップの左側のヒストグラムは、試料対間の距離の分布を示し、青色の濃さは、試料対間の類似度を示す。ヒートマップ樹状図内でネイバーとしてクラスター化する試料は、最も高い類似性を有する非コードトランスクリプトームを反映する。最も近いネイバー自己対を黄色および灰色で強調表示しており、最も近いネイバー非自己対をオレンジ色で強調表示している。
【
図8E】4ヶ月間(コホート1)および4年間(コホート2)にわたる血小板非コードRNA発現の個体内安定性および個体間安定性を示す。
図8Eは、コホート2(
図8E)における非コード転写物の個々の相関プロットの例を示す。各データ点は、同じ個体内(上パネル)または異なる個体間(下パネル)の0時点(x軸)対0時点、2週時点、4ヶ月時点、または4年時点(y軸)での指定のドナーからの単一の非コード転写物の正規化対数変換発現レベル(RLD)を表す。点が密度に従ってヒートカラー表示されている。
【
図8F】4ヶ月間(コホート1)および4年間(コホート2)にわたる血小板非コードRNA発現の個体内安定性および個体間安定性を示す。
図8Cおよび
図8Fは、0時点および4ヶ月時点(
図8C)、または(
図8F)時点(左)または個別に指定した時点(右)の総計の個体対内と個体対間との間の非コードRNA発現ピアソン相関を要約する箱ひげ図を示す。
図8Cでは、年齢、性別、および人種について調整する前と調製した後のコホート1の箱ひげ図を示し、コホート2では調整していない(サンプルサイズがより小さいため)。ウィルコクソン検定からのP値、調整済み。
【
図9A】血小板中の各転写物の個体内変動と総変動との比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図9Aは、コホート1の各転写物(y軸)に対する個体内変動に対してプロットした正規化発現(x軸)を示す。ラベル付けした点は、低い個体内変動および高い総個体変動を有する代表的な転写物である。
【
図9B】血小板中の各転写物の個体内変動と総変動との比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図9Bは、コホート2(
図9B)の各転写物(y軸)に対する個体内変動に対してプロットした正規化発現(x軸)を示す。ラベル付けした点は、低い個体内変動および高い総個体変動を有する代表的な転写物である。
【
図9C】血小板中の各転写物の個体内変動と総変動との比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図9Cは、コホート1の各転写物(y軸)に対する総変動に対してプロットした正規化発現(x軸)を示す。ラベル付けした点は、低い個体内変動および高い総個体変動を有する代表的な転写物である。
【
図9D】血小板中の各転写物の個体内変動と総変動との比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図9Dは、コホート2(
図9D)の各転写物(y軸)に対する総変動に対してプロットした正規化発現(x軸)を示す。ラベル付けした点は、低い個体内変動および高い総個体変動を有する代表的な転写物である。
【
図9E】血小板中の各転写物の個体内変動と総変動との比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図9Eは、コホート1に対する各転写物の個体内変動(y軸)に対してプロットした各転写物(x軸)の総個体変動を示す。ラベル付けした点は、低い個体内変動および高い総個体変動を有する代表的な転写物である。
【
図9F】血小板中の各転写物の個体内変動と総変動との比較を示す。平均個体内変動および総個体変動(標準偏差、SD)を各転写物の正規化対数変換発現(RLD)から計算した。
図9Fは、コホート2(
図9F)に対する各転写物の個体内変動(y軸)に対してプロットした各転写物(x軸)の総個体変動を示す。ラベル付けした点は、低い個体内変動および高い総個体変動を有する代表的な転写物である。
【
図10】血小板遺伝子発現の分散分割分析を示す。指示した共変量(x軸)に起因する各転写物(y軸)の分散パーセントの分布を示すバイオリンプロット。バイオリンの幅は、各y値での転写物の確率密度を示す。箱ひげ図は、中央値および四分位範囲を示し、外れ値を個々の点としてプロットする。例えば、性別は、ほとんどの転写物では50%未満の変動を説明するが、Y染色体遺伝子EIF1AY、TMSB4Y、およびUTYは例外であり、これらは性別によってほぼ排他的に変化する。右端のプロットは、ほとんどの転写物(50%超)では、個体間の差異が変動の大部分を説明することを示す。
【
図11A】コホート1のRNA-seqデータにおいて最も高い発現(
図11A)を有する転写物、およびPRAX1マイクロアレイデータにおいて報告されたそれらの人種、性別、またはeQTLとの関連性の表を示す。FDR<1e-4との関連性をピンク色で強調表示している。NS=有意ではない。
【
図11B】コホート1のRNA-seqデータにおいて最も低い個体内変動(
図11B)を有する転写物、およびPRAX1マイクロアレイデータにおいて報告されたそれらの人種、性別、またはeQTLとの関連性の表を示す。FDR<1e-4との関連性をピンク色で強調表示している。NS=有意ではない。
【
図11C】コホート1のRNA-seqデータにおいて最も高い総変動(
図11C)を有する転写物、およびPRAX1マイクロアレイデータにおいて報告されたそれらの人種、性別、またはeQTLとの関連性の表を示す。FDR<1e-4との関連性をピンク色で強調表示している。NS=有意ではない。
【
図11D】コホート1のRNA-seqデータにおいて最も高い反復性(低い個体内変動、高い個体間変動)(
図11D)を有する転写物、およびPRAX1マイクロアレイデータにおいて報告されたそれらの人種、性別、またはeQTLとの関連性の表を示す。FDR<1e-4との関連性をピンク色で強調表示している。NS=有意ではない。
【
図12】PRAX1において報告されたeQTLを有する転写物について、FDRが反復性と関連していることを示す。x軸上に、各転写物と関連したeQTLの報告された最も低いlog FDR(すなわち、-125=10
-125)がある。y軸上に、各転写物の1-反復性(コホート1)がある。
【
図13】0時点および4ヶ月時点でコホート1の31体の個体内の血小板における245のすべての特定されたエクソンスキッピング事象のエクソンPSIに基づく教師なしクラスタリングおよびヒートマップを示す。左側のヒストグラムは、全試料対間の距離の分布を示し、青色の濃さは、試料対間の類似度を示す。ヒートマップ樹状図内でネイバーとしてクラスター化する試料は、エクソンスキッピングレベルで最も高い類似性を有する試料を反映する。最も近いネイバー自己対を黄色で強調表示している。左側のバーがシーケンシングバッチまたはレーンに従って色付けされている。
【
図14】血小板におけるSELPエクソン14スキッピングのPCR確認を示す。5体の異なる個体由来の血小板RNAを逆転写し、cDNAをSELPのエクソン14に隣接するプライマーで増幅した。バンドを抽出し、サンガーシーケンシングによって配列決定して、配列を確認した。
【
図15A】SELPのエクソン14スキッピングが疾患におけるrs6128と関連したままであることを示す。合計で(
図15A)分析した際のNLコホートにおいて報告された健常試料および疾患試料におけるRNA-seqから推測したrs6128遺伝子型によるSELPエクソン14平均PSIの箱ひげ図。*年齢、性別、喫煙、病院、および保管時間について調整したp値。
【
図15B】SELPのエクソン14スキッピングが疾患におけるrs6128と関連したままであることを示す。疾患別に(
図15B)分析した際のNLコホートにおいて報告された健常試料および疾患試料におけるRNA-seqから推測したrs6128遺伝子型によるSELPエクソン14平均PSIの箱ひげ図。
図15Bでは、少なくとも2つの異なる遺伝子型の複数のサンプルを有する疾患を示す。*年齢、性別、喫煙、病院、および保管時間について調整したp値。
【
図16】rs6128がP-セレクチンタンパク質のエクソン14スキッピングを直接制御することを示す。rs6128 C/CまたはT/T SELP(CMVプロモーター)構築物をトランスフェクトした後のHEK293細胞におけるP-セレクチン(c末端DYKタグに対する抗体)のウェスタンブロット分析。4つの独立した実験からの代表的なブロットを示す。下方には、上側バンドおよび下側バンドの合計(総計)で割ったエクソン14包含バンド(上側バンド)の密度測定分析に従って計算したPSIの棒グラフおよび標準誤差要約を示している。*対応のあるt検定、n=4つの独立した実験。抗DYK抗体が約19kDa異なる2つの別個のバンドを検出した一方で、エクソン14が40アミノ酸(5kDa未満)をコードすることに留意されたい。この差異は、PNGaseによる可溶化液の脱グリコシル化がバンドのサイズを区別不能にしたため、エクソン14の重いグリコシル化によるものである。
【
図17A】ゲノムバリアント呼び出しおよび集団層別化とのRNA-seqの比較を示す。
図17Aは、オランダゲノムデータベース(GoNL(Genome of the Netherlands Consortium,Francioli LC,Menelaou A,et.al.Nat Genet.2014;46:818-825))において報告された対立遺伝子頻度に対する、NLコホートにおけるRNA-seqによって呼び出されたeQTLの存在について試験した641個のバリアントの対立遺伝子頻度(x軸)を示す。ピアソン相関=0.93(p<2.2e-16)。1000ゲノムデータベース(Gibbs RA,et al.Nature.2015;526:68-74)において報告された対立遺伝子頻度と比較したコホート1の対立遺伝子頻度も評価したが、ここには示していない。欧州人超母集団ゲノムと比較したコホート1における白人個体のRNA-seq呼び出しの場合、相関=0.87(p<2.2e-16)、アフリカ人超母集団ゲノムと比較したコホート1における黒人/アフリカ系アメリカ人個体のRNA-seq呼び出しの場合、相関=0.89(p<2.2e-16)。
【
図17B】ゲノムバリアント呼び出しおよび集団層別化とのRNA-seqの比較を示す。
図17Bは、コホート1における黒人/アフリカ系アメリカ人(AA)もしくは白人またはNLコホートのRNA-seqによって呼び出された641個のバリアントの対立遺伝子頻度を、GoNLおよび1000ゲノムデータベース超亜集団:東アジア人(EAS)、南アジア人(SAS)、混合アメリカ人(AMR)、欧州人(EUR)、またはアフリカ人(AFR)において報告された対立遺伝子頻度と比較したPCA分析を示す。
【
図17C】ゲノムバリアント呼び出しおよび集団層別化とのRNA-seqの比較を示す。
図17Cは、コホート1および1000ゲノムからの個体に固定したNLコホートにおける各個体の集団構造のMDS分析(Purcell S,et al.Am J Hum Genet.2007;81:559-75、およびChang CC,et al.Gigascience.2015;4:7)を示す。1994個のバリアントをRNA-seqコホートで同時に特定し、1000ゲノムを本分析に使用した。結果は、コホート1の白人個体およびNLコホートのRNA-seq個体がEURゲノム超亜集団とほぼ排他的にクラスター化する一方で、コホート1の黒人/アフリカ系アメリカ人個体および他/未知のRNA-seqの個体がAFR超亜集団とクラスター化し、混合を示唆することを示す。上位3つのMDS成分をプロットする。コホート1の白人個体、NLコホートの個体、および欧州人個体の密度が高い場合、明確にするためにズームボックスを含める。
【発明を実施するための形態】
【0008】
本開示は、以下の発明を実施するための形態、本明細書に含まれる図面および実施例を参照することにより、より容易に理解することができる。
【0009】
本発明の方法および遺伝子発現パネルが開示され記述される前に、それらが、別途指定されない限り特定の合成法にも、別途指定されない限り特定の試薬にも限定されず、したがって、言うまでもなく変化し得ることを理解されたい。本明細書で使用される用語が特定の態様を説明することのみを目的としており、限定することを意図するものではないことも理解されたい。本明細書に記載されるものと同様または同等のいずれの方法および材料も本発明の実施または試験に使用することができるが、方法および材料の例がこれから記述される。
【0010】
さらに、別途明示的に記載されない限り、本明細書に記載のいずれの方法も、そのステップが特定の順序で行われることを要求すると解釈されるようには決して意図されていない。したがって、方法の請求項が、そのステップが従うべき順序を実際に列挙していない場合、またはステップが特定の順序に限定されることを特許請求の範囲または説明において別途具体的に記載されていない場合、いかなる点においても、順序が推測されるようには決して意図されていない。これは、ステップの配列または操作フローに関する論理的な問題、文法的な構成または句読点に由来する平易な意味、明細書に記載の態様の数またはタイプを含む、解釈のためのあらゆる可能性のある不明確な根拠にも当てはまる。
【0011】
本明細書に言及されるすべての刊行物は、その刊行物が引用されることに関連して、方法および/または材料を開示し記述するために、参照により本明細書に組み込まれる。本明細書に記述された刊行物は、本出願の出願日に先行してこれらの開示のためにのみ提供される。本明細書のいかなることも、本発明が先行発明によってかかる公表に先行する権利を有しないことを認めるものとして解釈されるべきではない。さらに、本明細書に提供される公表日は、実際の公表日と異なっている可能性があり、これは独立した確認を必要とする場合がある。
【0012】
定義
本明細書および添付の特許請求の範囲で使用される場合、単数形の「a」、「an」、および「the」は、文脈によって明確に別の規定が示されない限り、複数の指示対象を含む。
【0013】
本明細書で使用される「または」という語は、特定のリストのうちの任意の1つのメンバーを意味し、またそのリストのメンバーの任意の組み合わせも含む。
【0014】
本明細書において、範囲は、「約」または「およそ」1つの特定の値から、および/または「約」または「およそ」別の特定の値までとして表現され得る。こうした範囲が表現される場合、さらなる態様は、ある特定の値からおよび/またはもう一方の特定の値までを含む。同様に、値が近似値として表現される場合、先行する「約」または「およそ」の使用によって、特定の値がさらなる態様を形成することが理解されるであろう。範囲の各々の端点は、他の端点との関連において、および他の端点とは独立して、重要であることがさらに理解されるであろう。また、本明細書に開示されるいくつかの値があり、各値も、値自体に加えて、その特定の値について「約」として本明細書に開示されることも理解される。例えば、値「10」が開示される場合、「約10」も開示される。2つの特定の単位間の各単位も開示されることも理解される。例えば、10および15が開示される場合、11、12、13、および14も開示される。
【0015】
本明細書で使用される「任意選択的な」または「任意選択的に」という用語は、後に説明される事象または状況が生じる場合もあり、または生じない場合もあることを意味し、また、その説明が先述の事象または状況が生じる事例および生じない事例を含むことを意味する。
【0016】
本明細書で使用される場合、「試料」という用語は、対象からの組織または臓器、細胞(対象内、対象から直接採取された、または培養もしくは培養細胞株から維持された細胞のいずれか)、細胞可溶化物(または可溶化物分画)または細胞抽出物、または本明細書に記載されるようにアッセイされた細胞もしくは細胞材料(例えばポリペプチドまたは核酸)に由来する1つ以上の分子を含有する溶液を意味する。試料は、細胞または細胞成分を含有する任意の体液または排泄物(例えば、血液、尿、便、唾液、涙、胆汁であるが、これらに限定されない)である場合もある。
【0017】
本明細書で使用される場合、「対象」という用語は、投与の標的、例えば、ヒトを指す。したがって、本開示の方法の対象は、哺乳動物、魚、鳥、爬虫類、または両生類などの脊椎動物とすることができる。「対象」という用語は、家畜動物(例えば、ネコ、イヌなど)、家畜(例えば、ウシ、ウマ、ブタ、ヒツジ、ヤギなど)および実験動物(例えば、マウス、ウサギ、ラット、モルモット、ショウジョウバエなど)も含む。一態様では、対象は、哺乳動物である。別の態様では、対象は、ヒトである。この用語は、特定の年齢または性別を示すものではない。したがって、男性であるか女性であるかにかかわらず、成人、小児、青年、および新生児対象、ならびに胎児が網羅されるよう意図されている。
【0018】
本明細書で使用される場合、「患者」という用語は、疾患または障害に罹患している対象を指す。「患者」という用語は、ヒトおよび獣医学対象を含む。本開示の方法のいくつかの態様では、「患者」は、例えば、投与ステップ前などに、疾患の治療が必要であると診断されている。
【0019】
いくつかの態様では、「患者」、「対象」、「個体」などの用語は、本明細書で互換的に使用され、インビトロであるかインサイツであるかにかかわらず、本明細書に記載の方法を受け入れることのできる任意の動物またはその細胞を指す。いくつかの態様では、患者、対象、または個体は、ヒトである。
【0020】
本明細書で使用される場合、「含む」という用語は、「~からなる」および「~から本質的になる」態様を含むことができる。
【0021】
本明細書で使用される場合、「正常」または「健常」という用語は、疾患もしくは障害を有しないか、または疾患もしくは障害を発症する感受性の増加を有しない個体、試料、または対象を指す。
【0022】
本明細書で使用される場合、「感受性」という用語は、対象が疾患を有すると臨床的に診断される可能性を指す。例えば、疾患に対する感受性の増加を有するヒト対象は、対象が疾患を有する臨床的に診断される可能性の増加を有するヒト対象を指すことができる。
【0023】
本明細書で使用される場合、「ポリペプチド」という用語は、任意のペプチド、オリゴペプチド、ポリペプチド、遺伝子産物、発現産物、またはタンパク質を指す。ポリペプチドは、連続したアミノ酸から成る。「ポリペプチド」という用語は、天然に存在する分子または合成分子を包含する。本明細書で使用される場合、「アミノ酸配列」という用語は、アミノ酸残基を表す略語、文字(letter)、文字(character)、または単語のリストを指す。
【0024】
本明細書で使用される場合、「ペプチド」、「ポリペプチド」、および「タンパク質」という用語は、互換的に使用され、ペプチド結合によって共有結合したアミノ酸残基を含む化合物を指す。タンパク質またはペプチドは、少なくとも2つのアミノ酸を含まなければならず、タンパク質またはペプチドの配列を構成することができるアミノ酸の最大数には制限が設けられていない。ポリペプチドは、ペプチド結合によって互いに結合された2つ以上のアミノ酸を含む任意のペプチドまたはタンパク質を含む。本明細書で使用される場合、この用語は、例えば、当該技術分野でペプチド、オリゴペプチド、およびオリゴマーとも一般的に称される短い鎖と、当該技術分野でタンパク質とも一般的に称されるより長い鎖との両方を指し、それらには多くのタイプが存在する。「ポリペプチド」には、例えば、とりわけ、生物学的に活性な断片、実質的に相同なポリペプチド、オリゴペプチド、ホモ二量体、ヘテロ二量体、ポリペプチドのバリアント、修飾ポリペプチド、誘導体、類似体、融合タンパク質が含まれる。ポリペプチドには、天然ペプチド、組換えペプチド、合成ペプチド、またはそれらの組み合わせが含まれる。
【0025】
本明細書で使用される場合、「遺伝子」という用語は、機能性RNAまたはタンパク質をコードするDNAの領域を指す。「機能性RNA」とは、タンパク質に翻訳されないRNA分子を指す。概して、遺伝子記号はイタリック体を使用して示され、タンパク質記号は非イタリック体を使用して示される。
【0026】
本明細書で使用される「核酸」という語句は、DNAであるかRNAであるかDNA-RNAハイブリッドであるか、一本鎖であるか二本鎖であるか、センスであるかアンチセンスであるかにかかわらず、ワトソン・クリック塩基対合によって相補的核酸とハイブリダイズすることができる、天然に存在するまたは合成オリゴヌクレオチドまたはポリヌクレオチドを指す。本発明の核酸は、ヌクレオチド類似体(例えば、BrdU)、および非ホスホジエステルヌクレオシド間結合(例えば、ペプチド核酸(PNA)またはチオジエステル結合)も含み得る。具体的には、核酸には、DNA、RNA、cDNA、gDNA、ssDNA、dsDNA、またはそれらの任意の組合せが含まれ得るが、これらに限定されない。
【0027】
核酸は、それぞれ、ピリミジン塩基およびプリン塩基、好ましくは、シトシン、チミン、およびウラシル、ならびにアデニンおよびグアニンの任意のポリマーまたはオリゴマーも含み得る。実際に、本発明は、任意のデオキシリボヌクレオチド、リボヌクレオチド、またはペプチド核酸成分、ならびにそれらの任意の化学バリアント、例えば、それらの塩基のメチル化形態、ヒドロキシメチル化形態、またはグルコシル化形態などを企図する。ポリマーまたはオリゴマーは、組成物中で不均一であっても均一であってもよく、天然に存在する源から単離されても、人工的または合成的に作製されてもよい。加えて、核酸は、DNAもしくはRNA、またはそれらの混合物であってもよく、ホモ二本鎖、ヘテロ二本鎖、およびハイブリッド状態を含む、一本鎖または二本鎖形態で永久にまたは過渡的に存在してもよい。
【0028】
「オリゴヌクレオチド」または「ポリヌクレオチド」は、少なくとも2、好ましくは少なくとも8、15、または25ヌクレオチド長の範囲であるが、最大50、100、1000、または5000ヌクレオチド長であってもよい核酸、またはポリヌクレオチドに特異的にハイブリダイズする化合物である。ポリヌクレオチドは、天然源から単離されても、組換え的に産生されても、人工的に合成されてもよい、デオキシリボ核酸(DNA)またはリボ核酸(RNA)またはそれらの模倣物の配列を含む。本発明のポリヌクレオチドのさらなる例は、ペプチド核酸(PNA)であり得る。(参照により全体が本明細書に組み込まれる、米国特許第6,156,501号を参照されたい。)本発明は、ある特定のtRNA分子において特定されており、かつ三重ヘリックス中に存在すると仮定されるフーグスティーン型塩基対合などの非伝統的な塩基対合が存在する状況も包含する。本開示では、「ポリヌクレオチド」および「オリゴヌクレオチド」は互換的に使用される。ヌクレオチド配列がDNA配列(例えば、A、T、G、およびC)によって本明細書で表される場合、これは、「U」を「T」に置き換えた対応するRNA配列(例えば、A、U、G、C)も含むことが理解されよう。
【0029】
本明細書で使用される場合、「ポリヌクレオチド」は、センス鎖およびアンチセンス鎖の両方の、cDNA、RNA、DNA/RNAハイブリッド、アンチセンスRNA、リボザイム、ゲノムDNA、合成形態、および混合ポリマーを含み、非天然または誘導体化、合成、もしくは半合成ヌクレオチド塩基を含むように化学的または生化学的に修飾されていてもよい。また、1つ以上のヌクレオチドの欠失、挿入、置換、または他のポリヌクレオチド配列への融合を含むが、これらに限定されない、野生型または合成遺伝子の改変も企図される。
【0030】
「単離されたポリペプチド」または「精製されたポリペプチド」とは、ポリペプチドが自然界で通常会合する材料を実質的に含まないポリペプチド(またはその断片)を意味する。本発明のポリペプチド、またはその断片は、例えば、天然源(例えば、哺乳類細胞)からの抽出によって、ポリペプチドをコードする組換え型核酸の発現(例えば、細胞内もしくは無細胞翻訳系内)によって、またはポリペプチドの化学的合成によって得ることができる。加えて、ポリペプチド断片は、これらの方法のうちのいずれかによって、または全長ポリペプチドを切断することによって得ることができる。
【0031】
「単離された核酸」または「精製された核酸」とは、本発明のDNAが誘導される生物の天然に存在するゲノム中で、遺伝子に隣接する遺伝子を含まないDNAを意味する。したがって、この用語には、例えば、自己複製プラスミドまたはウイルスなどのベクターに組み込まれる組換えDNA、または原核生物もしくは真核生物のゲノムDNAに組み込まれる組換えDNA(例えば、導入遺伝子)、または別個の分子として存在する組換えDNA(例えば、PCR、制限エンドヌクレアーゼ消化、または化学もしくはインビトロ合成によって産生されるcDNAまたはゲノムまたはcDNA断片)が含まれる。これには、追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAも含まれる。「単離された核酸」という用語は、RNA、例えば、単離されたDNA分子によってコードされるmRNA分子、または化学的に合成されるmRNA分子、または少なくともいくつかの細胞成分、例えば、他のタイプのRNA分子もしくはポリペプチド分子から分離されるか、もしくはそれらを実質的に含まないmRNA分子も指す。
【0032】
「特異的に結合する」とは、抗体が、その同族抗原を認識し、それと物理的に相互作用し、かつ他の抗原を有意に認識せず、それと相互作用しないことを意味し、かかる抗体は、当該技術分野で周知の技法によって生成されるポリクローナル抗体またはモノクローナル抗体であり得る。
【0033】
「プローブ」、「プライマー」、またはオリゴヌクレオチドとは、相補配列を含む第2のDNAまたはRNA分子(「標的」)と塩基対合することができる定義された配列の一本鎖DNAまたはRNA分子を意味する。結果として生じるハイブリッドの安定性は、生じる塩基対合の程度に依存する。塩基対合の程度は、プローブと標的分子との間の相補性の程度、およびハイブリダイゼーション条件のストリンジェンシーの程度などのパラメータに影響される。ハイブリダイゼーションストリンジェンシーの程度は、温度、塩濃度、およびホルムアミドなどの有機分子の濃度などのパラメータに影響され、当業者に既知の方法によって決定される。特定の核酸に特異的なプローブまたはプライマー(例えば、遺伝子および/またはmRNA)は、それらがハイブリダイズする核酸の領域に対して少なくとも80%~90%の配列相補性、好ましくは少なくとも91%~95%の配列相補性、より好ましくは少なくとも96%~99%の配列相補性、最も好ましくは100%の配列相補性を有する。プローブ、プライマー、およびオリゴヌクレオチドは、当業者に周知の方法によって、放射活性的にまたは非放射活性的にのいずれかで検出可能に標識され得る。プローブ、プライマー、およびオリゴヌクレオチドは、核酸ハイブリダイゼーションを含む方法、例えば、核酸配列決定、ポリメラーゼ連鎖反応による逆転写および/または核酸増幅、一本鎖立体配座多型(SSCP)分析、制限断片多型(RFLP)分析、サザンハイブリダイゼーション、ノーザンハイブリダイゼーション、インサイツハイブリダイゼーション、電気泳動移動度シフトアッセイ(EMSA)に使用される。
【0034】
本明細書で使用される場合、「プローブ」という用語は、精製された制限消化物で見られるように天然に存在するか、合成的に、組換え的に、もしくはPCR増幅によって産生されるかにかかわらず、目的とする別のオリゴヌクレオチドにハイブリダイズすることができるオリゴヌクレオチド(すなわち、ヌクレオチドの配列)を指す。プローブは、一本鎖であっても二本鎖であってもよい。プローブは、特定の遺伝子配列の検出、特定、および単離に有用である。
【0035】
「プライマー」という用語は、条件がプライマー伸長産物の合成に好適である場合に、相補鎖に沿った合成開始点として作用することができるオリゴヌクレオチドを指す。合成条件には、4つの異なるデオキシリボヌクレオチド三リン酸および少なくとも1つの重合誘導剤、例えば、逆転写酵素またはDNAポリメラーゼの存在が含まれる。これらは、好適な緩衝液中に存在し、これは、補因子であるか、または様々な好適な温度でpHなどの条件に影響を及ぼす成分を含み得る。プライマーは、増幅効率が最適化されるように一本鎖配列であることが好ましいが、二本鎖配列を利用することもできる。
【0036】
「特異的にハイブリダイズする」とは、プローブ、プライマー、またはオリゴヌクレオチドが、高ストリンジェンシー条件下で、実質的に相補的な核酸を認識し、それと物理的に相互作用(すなわち、塩基対合)し、他の核酸とは実質的に塩基対合しないことを意味する。
【0037】
「高ストリンジェンシー条件」とは、65℃の温度の0.5M NaHPO4、pH7.2、7%SDS、1mM EDTA、および1%BSA(画分V)を含む緩衝液中、または42℃の温度の48%ホルムアミド、4.8倍SSC、0.2M Tris-Cl、pH7.6、1倍デンハルト溶液、10%硫酸デキストラン、および0.1%SDSを含む緩衝液中で少なくとも40ヌクレオチド長のDNAプローブを使用することによりもたらされる条件と同等のハイブリダイゼーションを可能にする条件を意味する。高ストリンジェンシーハイブリダイゼーション、例えば、PCR、ノーザン、サザン、またはインサイツハイブリダイゼーション、DNA配列決定などの他の条件は、分子生物学分野の当業者には周知である。(例えば、F.Ausubel et al.,Current Protocols in Molecular Biology,John Wiley & Sons,New York,NY,1998を参照されたい)。
【0038】
「異常」という用語は、「正常な」(予想される)それぞれの特性を呈する生物、組織、細胞、またはそれらの成分とは少なくとも1つの観察可能なまたは検出可能な特性(例えば、年齢、治療、時刻など)が異なる、生物、組織、細胞、またはそれらの成分を指すために使用される。1つの細胞型または組織型に正常であるか、または予想される特性は、異なる細胞型または組織型に異常である可能性がある。
【0039】
「増幅」という用語は、試料中に存在する標的ヌクレオチド配列のコピー数を乗じる操作を指す。
【0040】
本明細書で使用される「抗体」という用語は、抗原上の特定のエピトープに特異的に結合することができる免疫グロブリン分子を指す。抗体は、天然源または組換え源に由来するインタクトな免疫グロブリンとすることができ、インタクトな免疫グロブリンの免疫反応性部分とすることができる。本発明の抗体は、例えば、ポリクローナル抗体、モノクローナル抗体、細胞内抗体(「イントラボディ」)、Fv、Fab、およびF(ab)2、ならびに一本鎖抗体(scFv)、重鎖抗体、例えば、ラクダ科抗体、合成抗体、キメラ抗体、およびヒト化抗体を含む様々な形態で存在し得る(Harlow et al.,1999,Using Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,N.Y.、Harlow et al.,1989,Antibodies:A Laboratory Manual,Cold Spring Harbor,N.Y.、Houston et al.,1988,Proc.Natl.Acad.Sci.USA 85:5879-5883、Bird et al.,1988,Science 242:423-426)。
【0041】
本明細書で使用される場合、「イムノアッセイ」とは、標的分子に特異的に結合することができる抗体を使用して標的分子を検出および定量する任意の結合アッセイを指す。
【0042】
本明細書で使用される「コード配列」という用語は、mRNAおよび/またはポリペプチドもしくはその断片を産生するために転写および/または翻訳され得る核酸もしくはその相補体の配列、またはその一部を指す。コード配列には、ゲノムDNAまたは未成熟一次RNA転写物中のエクソンが含まれ、これらは細胞の生化学的機構によって一緒に結合されて成熟mRNAを提供する。アンチセンス鎖は、かかる核酸の相補体であり、コード配列はそれから推測することができる。対照的に、本明細書で使用される「非コード配列」という用語は、インビボでアミノ酸に翻訳されないか、またはtRNAが相互作用してアミノ酸を配置しない、またはその配置を試みない、核酸もしくはその相補体の配列、またはその一部を指す。非コード配列には、ゲノムDNAまたは未成熟一次RNA転写物中のイントロン配列と、プロモーター、エンハンサー、サイレンサーなどの遺伝子関連配列との両方が含まれる。
【0043】
本明細書で使用される場合、「相補的」または「相補性」という用語は、塩基対合規則によって関連付けられたポリヌクレオチド(すなわち、ヌクレオチドの配列)に関連して使用される。例えば、配列「A-G-T」は、配列「T-C-A」に相補的である。相補性は、核酸の塩基の一部のみが塩基対合規則に従って一致する「部分的」であってもよい。または、核酸間には「完全」相補性または「総」相補性が存在し得る。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に有意な影響を及ぼす。これは、増幅反応、ならびに核酸間の結合に依存する検出法において特に重要である。
【0044】
本明細書で使用される場合、「診断」という用語は、疾患または障害の存在の決定を指す。いくつかの態様では、特定の疾患または障害の存在の決定を可能にする診断を行うための方法が提供される。
【0045】
「疾患」とは、動物が恒常性を維持することができず、疾患が改善されない場合、動物の健康状態が悪化し続ける、動物の健康状態である。対照的に、動物における「障害」とは、動物が恒常性を維持することができるが、動物の健康状態が障害の不在下での健康状態よりも好ましくない健康状態である。治療しないまま放置した場合、障害によって必ずしも動物の健康状態がさらに低下するわけではない。
【0046】
本明細書で使用される場合、「コード」という用語は、定義されたヌクレオチド配列(すなわち、rRNA、tRNA、およびmRNA)または定義されたアミノ酸配列のいずれかおよびそれらから生じる生物学的特性を有する生物学的プロセスにおける他のポリマーおよび巨大分子の合成のための鋳型としての役割を果たすための、遺伝子、cDNA、またはmRNAなどのポリヌクレオチド中の特定のヌクレオチド配列の固有の特性を指す。したがって、遺伝子は、その遺伝子に対応するmRNAの転写および翻訳が細胞または他の生物系にタンパク質を産生する場合、タンパク質をコードする。コード鎖(そのヌクレオチド配列がmRNA配列と同一であり、配列表に通常提示される)も非コード鎖(遺伝子またはcDNAの転写のための鋳型として使用される)もいずれも、その遺伝子またはcDNAのタンパク質または他の産物をコードするものと称することができる。
【0047】
本明細書で使用される場合、「ハイブリダイゼーション」という用語は、相補的核酸の対合に関連して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度(すなわち、核酸間の会合の強度)は、核酸間の相補性の程度、関与する条件のストリンジェンシー、形成されたハイブリッドのTm、および核酸内のG:C比などの要因によって影響される。構造内に相補的核酸の対合を含む単一分子は、「自己ハイブリダイズ」されるといわれている。内部相補性を有する単一DNA分子は、ループ、キンク、または長い塩基対伸長の場合、コイルを含む様々な二次構造をとり得る。
【0048】
「教材」という用語には、本明細書で使用される場合、本明細書に列挙される様々な疾患または障害を特定する、診断する、または緩和もしくは治療するためのキット内の、本発明の核酸、ペプチド、および/または化合物の有用性を伝えるために使用することができる刊行物、記録、図、または任意の他の表現媒体が含まれる。任意選択的に、または代替的に、教材は、対象の細胞または組織における疾患または障害を特定する、診断する、または緩和する1つ以上の方法を記載してもよい。キットの教材は、例えば、本発明の1つ以上の成分を含む容器に貼り付けられてもよく、または本発明の1つ以上の成分を含む容器と一緒に出荷されてもよい。あるいは、教材は、受領者が教材と成分を協働的に使用する意向で容器とは別個に出荷されてもよい。
【0049】
「単離された」という用語は、天然状態から変更または除去されることを意味する。例えば、生きている動物に天然に存在する核酸またはペプチドは「単離され」ないが、その天然状態の共存物質から部分的または完全に分離された同じ核酸またはペプチドは「単離され」る。単離された核酸またはタンパク質は、実質的に精製された形態で存在することができ、または非天然環境、例えば、宿主細胞などに存在することができる。
【0050】
本明細書で使用される「標識」という用語は、プローブに直接または間接的にコンジュゲートされて「標識された」プローブを生成する検出可能な化合物または組成物を指す。標識は、それ自体で検出可能であってもよく(例えば、放射性同位体標識または蛍光標識)、または酵素標識の場合、検出可能な基質化合物または組成物の化学変化を触媒してもよい(例えば、アビジン-ビオチン)。いくつかの事例では、プライマーを標識して、PCR産物を検出することができる。
【0051】
「マイクロアレイ」および「アレイ」という用語は、「DNAマイクロアレイ」、「DNAチップ」、「タンパク質マイクロアレイ」、および「タンパク質チップ」を広範に指し、すべての当該技術分野で認識されている固体支持体、ならびに核酸、ペプチド、およびポリペプチド分子を固定するためのすべての当該技術分野で認識されている方法を包含する。好ましいアレイは、典型的には、異なる既知の位置で基質の表面に結合される複数の異なる核酸またはペプチドプローブを含む。「マイクロアレイ」または口語的に「チップ」とも称されるこれらのアレイは、当該技術分野で一般に説明されており、例えば、米国特許 第5,143,854号、同第5,445,934号、同第5,744,305号、同第5,677,195号、同第5,800,992号、同第6,040,193号、同第5,424,186号、およびFodor et al.,1991,Science,251:767-777に記載されており、これらは各々、参照によりその全体がすべての目的のために組み込まれる。アレイは、一般に、フォトリソグラフィー法と固相合成法との組み合わせを組み込む、機械的合成法または光指向合成法などの様々な技法を使用して生成され得る。機械的合成法を使用してこれらのアレイを合成するための技法は、例えば、米国特許 第5,384,261号および同第6,040,193号に記載されており、これらは、参照によりその全体がすべての目的のために本明細書に組み込まれる。平面アレイ表面が好ましいが、アレイは、実質的に任意の形状の表面またはさらには多様な表面上に作製されてもよい。アレイは、ビーズ、ゲル、ポリマー表面、光ファイバーなどの繊維、ガラス、または任意の他の適切な基材上の核酸であってもよい。(参照により全体がすべての目的のために本明細書に組み込まれる、米国特許第5,770,358号、同第5,789,162号、同第5,708,153号、同第6,040,193号、および同第5,800,992号を参照されたい。)アレイは、診断使用を可能にするような様式でパッケージングされてもよく、または包括的デバイスとすることができ、例えば、参照により全体がすべての目的のために組み込まれる、米国特許 第5,856,174号および同第5,922,591号を参照されたい。アレイは、例えば、Affymetrix(Santa Clara,Calif.)およびApplied Biosystems(Foster City,Calif.)から市販されており、様々な真核生物および原核生物の遺伝子型決定、診断、変異分析、マーカー発現、および遺伝子発現モニタリングを含む様々な目的を対象とする。固体支持体上のプローブの数は、個々の特徴サイズを変化させることによって変化し得る。いくつかの態様では、特徴サイズは、20×25平方ミクロンであり、他の態様では、特徴は、例えば、8×8、5×5、または3×3平方ミクロンであってもよく、約2,600,000、6,600,000、または18,000,000個の個々のプローブ特徴がもたらされる。
【0052】
既知の配列の増幅のためのアッセイも開示される。例えば、PCR用のプライマーは、配列の領域を増幅するように設計されていてもよい。RNAの場合、第1の逆転写酵素ステップを使用して、一本鎖RNAから二本鎖DNAを生成してもよい。アレイは、ゲノム全体から配列を検出するように設計されていてもよく、またはゲノムの1つ以上の領域、例えば、目的とするタンパク質もしくはRNAをコードする領域などのゲノムの選択された領域、または複数のゲノムから保存された領域、または複数のゲノム、アレイ、およびアレイを使用して遺伝子分析を行う方法は、各々参照により全体が本明細書に組み込まれる、Cutler,et al.,2001,Genome Res.11(11):1913-1925およびWarrington,et al.,2002,Hum Mutat 19:402-409、ならびに米国特許公開第20030124539号に記載されている。
【0053】
本明細書で使用される場合、「ポリメラーゼ連鎖反応」(PCR)という用語は、K.B.Mullisの方法(参照により本明細書に組み込まれる、米国特許第4,683,195号、同第4,683,202号、および同第4,965,188号)を指し、これらは、クローニングまたは精製を行うことなくゲノムDNA混合物中の標的配列のセグメントの濃度を増加させるための方法を記載している。標的配列を増幅するためのこのプロセスは、所望の標的配列を含むDNA混合物に大過剰量の2つのオリゴヌクレオチドプライマーを導入することと、その後、DNAポリメラーゼの存在下でサーマルサイクリングの正確な順序を導入することとからなる。これらの2つのプライマーは、二本鎖標的配列のそれぞれの鎖に相補的である。増幅をもたらすために、混合物を変性させ、その後、プライマーを標的分子内のそれらの相補配列にアニーリングする。アニーリングした後、新たな相補鎖対を形成するようにプライマーをポリメラーゼで伸長させる。変性ステップ、プライマーアニーリングステップ、およびポリメラーゼ伸長ステップを複数回繰り返して(すなわち、変性、アニーリング、および伸長が1つの「サイクル」を構成し、多数の「サイクル」となり得る)、所望の標的配列の高濃度の増幅セグメントを得ることができる。所望の標的配列の増幅セグメントの長さは、互いに対するプライマーの相対位置によって決定され、それ故に、この長さは、制御可能なパラメータである。本プロセスの繰り返し態様に基づいて、本方法は、「ポリメラーゼ連鎖反応」(以下、PCR)と称される。標的配列の所望の増幅セグメントが混合物中で優勢な配列(濃度の観点で)になるため、それらは「PCR増幅された」といわれている。本明細書で使用される場合、「PCR産物」、「PCR断片」、「増幅産物」、または「アンプリコン」という用語は、変性、アニーリング、および伸長のPCRステップの2サイクル以上が完了した後に結果として得られた化合物の混合物を指す。これらの用語は、1つ以上の標的配列の1つ以上のセグメントの増幅が存在する場合を包含する。
【0054】
生物、組織、細胞、またはそれらの成分との関連で使用される「異常」という用語は、(予想される)それぞれの特性を呈する生物、組織、細胞、またはそれらの成分とは少なくとも1つの観察可能なまたは検出可能な特性(例えば、年齢、治療、時刻など)が異なる、生物、組織、細胞、またはそれらの成分を指す。1つの細胞型または組織型に正常であるか、または予想される特性は、異なる細胞型または組織型に異常である可能性がある。
【0055】
「増幅」という用語は、試料中に存在する標的ヌクレオチド配列のコピー数を乗じる操作を指す。
【0056】
血小板は、遺伝子発現研究での使用が増えている大量に存在する入手しやすい血液細胞である。有核細胞と同様に、血小板は、コードmRNA、小さい非コードRNA、lncRNAなどを含むRNAの多様なポートフォリオを有する(Rowley JW,et al.Blood.2011;118:e101-e111、Bray PF,et al.BMC Genomics.2013;14:1、およびGnatenko D V,et al.Blood.2003;101:2285-931-3)。その上、それらの無核性質は、遺伝子発現の研究には有核細胞よりも有利である。一例として、有核細胞のエクスビボ処理(細胞単離法、処理時間、緩衝剤など)は、何千もの転写物の発現に直ちに影響を及ぼす可能性がある(Beliakova-Bethell N,et al.Cytometry A.2014;85:94-104、Bhattacharjee J,et al.F1000Research.2017;6:2045、およびBaechler EC,et al.Genes Immun.2004;5:347-534-6)。その一方で、血小板は、転写的に単離の影響を受けず(Angenieux C,et al.PLoS One.2016;11:e0148064、およびBest MG,et.al.Cancer Cell.2015;28:666-676)、生来のインビボ遺伝子発現シグネチャの捕捉を可能にする。これらの魅力的な特徴は、RNA診断および遺伝子発現研究のための優れた選択肢である。
【0057】
血小板は、健常時および疾患時の血小板反応性のメディエーターを解明するために、RNA存在量に重点を置いたGWAS研究、遺伝子表現型研究(Kondkar AA,et al.J Thromb Haemost.2010;8:369-78、およびEdelstein LC,et al.Nat Med.2013;19:1609-16)、診断研究(Best MG,et al.Cancer Res.2018;78:3407-3412)、および差次的発現研究(Schubert S,et al.Blood.2014;124:493-502)に使用されている。発現定量的形質遺伝子座(eQTL)と呼ばれる、血小板中のRNA存在量の遺伝的修飾因子についても説明されている(Simon LM,et al.Am J Hum Genet.2016;98:883-97、およびKong X,et al.Thromb Haemost.2017;117:962-970)。eQTLは、細胞型特異的様式で、近くの(シス-)遺伝子または遠くの(トランス-)遺伝子に影響を及ぼす遺伝子発現に関連するDNA配列バリアントである。eQTLは、表現型と遺伝子会合との間に中間リンクおよび機構的リンクを提供するため、遺伝子研究において特に重要である。
【0058】
RNA存在量を超越して、血小板および巨核球が、(Schubert S,et al.Blood.2014;124:493-502)は、トランスクリプトームおよびプロテオームを多様化し(Nassa G,et al.Sci Rep.2018;8:498、およびSchwertz H,et al.J Exp Med.2006;203:2433-40)、かつ細胞機能を変化させる、RNAの代替構造特徴、例えば、代替開始部位および終止部位、ならびに選択的スプライシングを有することが知られている。血小板において、活性化によりRNAスプライシングが誘導され、それにより、機能性タンパク質発現が調節される(Nassa G,et al.Sci Rep.2018;8:498、およびDenis MM,et al.Cell.2005;122:379-91)。スプライシングQTL(sQTL)と呼ばれる遺伝的バリアントも、血小板における基本的な活性化依存的RNAスプライシングレベルに影響を及ぼす可能性がある。しかしながら、血小板のsQTLはまだ説明されていない。
【0059】
血小板におけるRNA存在量および構造に関する他の主要な知識のギャップが存在する。ほとんどの血小板研究は、単一時点での遺伝子発現を調べる横断的なものになっている。その上、遺伝子発現は、経時的に個体間および個体内の両方を変化させることができる。ホルモン変化、概日リズム、炎症、食生活、および老化は、健常個体における遺伝子発現を変化させる可能性のある環境要因の例である(Bryois J,et al.Genome Res.2017;27:545-552、Waaseth M,et al..BMC Med Genomics.2011;4:29、およびArnardottir ES,et al.Sleep.2014;37:1589-600)。遺伝子発現におけるかかる正常な変化は、差次的遺伝子発現研究、診断研究、および遺伝子研究におけるシグナルを検出する能力を覆い隠し、それらの分析を混乱させる可能性がある。したがって、遺伝子発現における個体内変動と個体間変動との比較の理解は、遺伝子発現研究の設計および解釈に重要であり、遺伝子研究における候補に優先順位を付けるために使用することができる。
【0060】
遺伝的研究に関して、eQTL遺伝子を特定するために反復性を使用することをいくつかの報告書が示唆している(Barendse W.BMC Genomics.2011;12:232、Carlborg O,et al.Bioinformatics.2004;21:2383-93、およびHoffman GE,Schadt EE.BMC Bioinformatics.2016;17:48321-23)。インビボ反復性は、同じ個体からの複数回のサンプリングからのみ計算することができ、個体間変動と個体内変動との比較に起因する変動の比率を指す(Lessells CM,Boag PT.Auk.1987;104:116-121)。率直な見方では、反復性は、広義での遺伝性に上限を設けており(Dohm MR.Funct Ecol.2002;16:273-280)、個体間変動が低いおよび/または個体内変動が高いという理由で、個体間の差異が反復性でない場合、遺伝性の遺伝子シグナルを検出するには力不足である。このため、GWAS21を行う前に形質の反復性を測定することが推奨されている。Carlborgら (Carlborg O,et al.Bioinformatics.2004;21:2383-93)は、反復性に関するマウスeQTLデータの検閲が、eQTL特定を成功させる高い先験的可能性を有する転写物に優先順位を付けるための有効な方法であることを見出した。Hoffmanら (Hoffman GE,Schadt EE.BMC Bioinformatics.2016;17:483)も、候補を狭め、かつeQTL予測を容易にするための個体内技術的変動の潜在的な使用を実証したが、この研究は単一時点複製を用いた。まとめると、これらの研究は、遺伝子発現の縦断分析が、見込みのあるeQTL(およびsQTL)遺伝子発見を容易にし得ることを示唆している。驚くべきことに、遺伝子発現の縦断分析は、健常個体由来の初代細胞には乏しく、血小板には存在しない。継時的な選択的スプライシングの反復性は、いずれの初代細胞型についても確立されていない。当該技術分野で以前に存在しなかった生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法が本明細書に開示される。例えば、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含む、方法が本明細書に開示される。
【0061】
血小板トランスクリプトームが健常個体において4年間にわたって概ね安定しており、これにより、疾患診断のための縦断基準が提供されるという所見が本明細書に開示される。血小板遺伝子発現シグネチャは、がんを正確に分類および診断するために最近使用されている。健常個体と比較した血小板トランスクリプトームの変化は、多数の他の疾患(敗血症、インフルエンザ感染、ループス、および急性心筋梗塞)とも関連しており、様々な疾患の診断および分類のための血小板遺伝子発現シグネチャの可能性を増大させている。
【0062】
過剰なノイズにより、血小板遺伝子発現に基づく診断を含む診断における遺伝子発現シグネチャの使用が制限されることが知られている。ほとんどの遺伝子発現に基づく診断は、疾患における遺伝子発現を健常対照と比較する。環境的ノイズを最小限に抑え、かつ個体間(すなわち、遺伝的)変動を内部的に補正する遺伝子発現に基づく診断への別のアプローチは、疾患を有する個体の遺伝子シグネチャを、個体が健常であった時点での同じ個体からの遺伝子シグネチャと比較すること、すなわち、縦断サンプリングである。このアプローチは、遺伝子シグネチャが健常個体において経時的に比較的安定しているという仮定、または健常個体における経時的な変化が既知であり、かつ一貫しているという仮定に依存する。しかしながら、経時的な遺伝子発現の変動の程度は、血小板を含むほとんどの細胞型について不明である。血小板における縦断研究のための基準遺伝子シグネチャは、現在入手不能である。この問題を解決するために、最大4年間にわたる健常個体の血小板における遺伝子発現を評価し、健常個体のトランスクリプトームワイド発現プロファイルを特定した。このプロファイルには、健常個体由来の血小板で経時的に最も安定しているおよび最も安定していない遺伝子およびスプライシング事象が含まれる。トランスクリプトームワイド発現プロファイルは、経時的な健常個体内の予想される変動量を提供することによって、血小板差次的遺伝子発現分析および診断の基準として使用することができる。この基準からの逸脱は、疾患を示すことができる。
【0063】
本明細書に記載されるように、トランスクリプトームワイド発現プロファイルは、単一の健常個体または複数の健常個体内の経時的な予想される変動量を提供することによって、血小板差次的遺伝子発現分析および診断の基準として使用することができる。いくつかの態様では、本明細書に開示されるトランスクリプトームワイド発現プロファイルは、疾患を有する単一の個体または複数の個体内の経時的な予想される変動量を提供することによって、血小板差次的遺伝子発現分析および診断の基準として使用することができる。いくつかの態様では、本明細書に開示されるトランスクリプトームワイド発現プロファイルは、単一の個体または複数の個体内の予想される変動量を提供することによって、血小板差次的遺伝子発現分析および診断の基準として使用することができ、ここで、単一の個体または複数の個体は健常であるか、疾患を有するか、または健常と疾患の組み合わせである。この基準からの逸脱は、健康状態と疾患状態を区別するための定期的なスクリーニングとして有用であり得る。例えば、血小板で発現する最も変動性の低い遺伝子および最も変動性の高い遺伝子の個体内変動および個体間変動、ならびに反復性測定結果が本明細書に提供される。これらは、遺伝子発現を特に縦断的に評価する、すなわち、健常個体の疾患が疑われる場合、健常個体由来の試料の遺伝子発現を、同じ個体から縦断的に単離された試料の遺伝子発現と比較する将来の疾患研究の基準として使用することができる。eQTLの存在を予測するための血小板における遺伝子発現の反復性が本明細書で実証される。このリストは、疾患診断シグネチャへの組み入れに有用であり得る遺伝的バリアントの数を狭めるために使用することができる。
【0064】
本明細書に開示される方法の利点には、診断検査のためのより正確な「健常」基準を提供すること、および個々の患者が経時的に検査され、患者自身の基準としての役割を果たすことができることが含まれるが、これらに限定されない。本明細書に開示される方法は、他の診断検査、例えば、遺伝子検査のための標準として使用することもできる。さらに、縦断基準を使用することにより、さもなければ追加の健常個体における遺伝子発現を縦断的にサンプリングすることを必要とするであろう疾患診断シグネチャを開発する費用を削減することができる。
【0065】
トランスクリプトームワイド発現プロファイルおよびそれを生成する方法が本明細書に開示される。血小板試料から得られるトランスクリプトームワイド発現プロファイルが本明細書に開示される。血小板のトランスクリプトームワイド発現プロファイルが本明細書に開示される。例えば、健常個体から得られたトランスクリプトームワイド発現プロファイルが本明細書に開示される。このトランスクリプトームワイド発現プロファイルは、同じ個体を一定期間(4年間)にわたってサンプリングすることによって得られ、これにより、トランスクリプトームワイド発現プロファイルが経時的な個体内変動を説明することを可能にする。いくつかの態様では、トランスクリプトームワイド発現プロファイルは、特定の疾病、状態、疾患、もしくは損傷、または特定の疾病、状態、疾患、もしくは損傷のセットを有する個体から取得することができる。他の基準遺伝子シグネチャは、平均シグネチャを見つけ出すために、単一時点での多くの異なる人々のサンプリングに依存する。縦断方法は、単一個体における個々の遺伝子の発現の自然な変動の調査を可能にし、これにより、経時的に最も安定している遺伝子および最も安定していない遺伝子の特定が可能になる。
【0066】
トランスクリプトームワイド発現プロファイルは、改変されたまたは改変されていない生物学的プロセスまたは病原性病状の結果として生じる独特な特徴のある遺伝子発現パターンを有する細胞内の単一の遺伝子群または組み合わせられた遺伝子群である、遺伝子シグネチャまたは遺伝子発現シグネチャとすることができる。トランスクリプトームワイド発現プロファイルの臨床的適用は、予後シグネチャ、診断シグネチャ、および予測シグネチャに分類される。理論的にトランスクリプトームワイド発現プロファイルによって定義され得る表現型は、疾患を有する個体の生存期間または予後を予測するもの、疾患の異なるサブタイプを区別するために使用されるものから、特定の経路の活性化を予測するものに及ぶ。要約すると、開示される方法は、血小板遺伝子シグネチャの縦断研究のためのトランスクリプトームワイド発現プロファイルの必要性に対処する。本明細書に開示される方法は、疾患診断のための血小板RNA遺伝子シグネチャまたはマップを包含し、したがって、例えば、液体生検において、血液などの体液中の腫瘍成分を分析するための高感度分析法として使用することができる。
【0067】
健常個体内の経時的に予想される変動量を提供することによる血小板差次的遺伝子発現分析および診断の基準としてトランスクリプトームワイド発現プロファイル(個体内変動および個体間変動)を使用する方法が本明細書に開示される。
【0068】
トランスクリプトームワイド発現プロファイル(個体内変動および個体間変動)を使用して、健常個体の疾患が疑われる場合、健常個体由来の試料の遺伝子発現を、同じ個体から縦断的に単離された試料と比較する方法が本明細書に開示される。
【0069】
トランスクリプトームワイド発現プロファイル(個体内変動および個体間変動)を使用して、発現定量的形質遺伝子座(eQTL)およびスプライス定量的形質遺伝子座(sQTL)の存在を経時的に予測する方法が本明細書に開示される。
【0070】
トランスクリプトームワイド発現プロファイル(個体内変動および個体間変動)を使用して、eQTL遺伝子の発現を決定する方法が本明細書に開示される。
【0071】
トランスクリプトームワイド発現プロファイルを作製するための方法
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含む、方法が本明細書に開示される。いくつかの態様では、本方法は、少なくとも1回繰り返すことができる。いくつかの態様では、本方法は、第2の生体試料で繰り返すことができ、第2の生体試料は、単離された血小板からなる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0072】
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法が本明細書に開示される。いくつかの態様では、本方法は、第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することを含むことができる。いくつかの態様では、その測定は、RNAシーケンシングを含む。いくつかの態様では、本方法は、第1の生体試料で取得された測定された発現レベルから遺伝子の発現レベルを決定することを含むことができ、当該測定は、RNAシーケンシングを含む。いくつかの態様では、本方法は、第1の生体試料中に存在する遺伝子の発現レベルを測定した結果を、測定された発現レベルから遺伝子の発現レベルを決定した結果と組み合わせて、トランスクリプトームワイド発現プロファイルを生成することを含むことができる。いくつかの態様では、本方法は、データセットとしてトランスクリプトームワイド発現プロファイルをさらに提供することができる。いくつかの態様では、第1の生体試料は、単離された血小板からなることができる。いくつかの態様では、本方法は、少なくとも1回繰り返すことができる。いくつかの態様では、本方法は、第2の生体試料で繰り返すことができ、第2の生体試料は、単離された血小板からなる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0073】
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法が本明細書に開示される。生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含む、方法が本明細書に開示される。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0074】
2つのトランスクリプトームワイド発現プロファイル間の遺伝子発現差異を特定する方法であって、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法を使用して、対象の血小板トランスクリプトームの1つ以上の変動を決定することを含み、当該方法が、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とステップb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなり、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、提供することと、対象からの当該時間依存的変化を基準と比較することであって、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、比較することと、を含む、方法も本明細書に開示される。いくつかの態様では、本方法は、少なくとも1回繰り返すことができる。いくつかの態様では、本方法は、第2の生体試料で繰り返すことができ、第2の生体試料は、単離された血小板からなる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0075】
対象由来の血小板における時間依存的遺伝子発現差異を測定する方法であって、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法を使用して、対象の血小板トランスクリプトームの1つ以上の変動を決定することを含み、当該方法が、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とステップb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなり、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、提供することと、対象からの当該時間依存的変化を基準と比較することと、を含む、方法が本明細書にさらに開示される。いくつかの態様では、本方法は、少なくとも1回繰り返すことができる。いくつかの態様では、本方法は、第2の生体試料で繰り返すことができ、第2の生体試料は、単離された血小板からなる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0076】
生体試料は、任意の生体組織または体液のものとすることができる。多くの場合、試料は、患者由来の試料である「臨床試料」である。生体試料は、所望のバイオマーカーの検出に好適な任意の生体物質を含むことができ、個体から得られた細胞物質および非細胞物質を含み得る。生体試料は、例として、採血、体液採取、または生検などの適切な方法によって得ることができる。かかる試料の例には、血液、リンパ液、尿、婦人科学的体液、生検、羊水、およびスメアが挙げられるが、これらに限定されない。本質的に液体である試料は、本明細書で「体液」と称される。身体試料は、例えば、領域を掻爬するまたは拭き取ること、または体液を吸引するための針を使用することを含む様々な技法によって患者から得ることができる。様々な身体試料を収集するための方法は、当該技術分野で周知である。多くの場合、試料は、「臨床試料」、すなわち、患者由来の試料である。かかる試料には、細胞を含む場合も含まない場合もある体液、例えば、血液(例えば、全血、血清、または血漿)、尿、唾液、組織、または微細針生検試料、および既知の診断歴、治療歴、および/または転帰歴を有する記録保存試料が含まれるが、これらに限定されない。いくつかの態様では、生体試料は、血液細胞を含むことができる。いくつかの態様では、試料(または生体試料)は、組織、血液、血清、または血漿とすることができる。いくつかの態様では、生体試料は、血小板を含むことができる。いくつかの態様では、試料は、単離された血小板とすることができる。いくつかの態様では、生体試料は、健常対象由来のものとすることができる。いくつかの態様では、生体試料は、1つ以上の疾病、状態、疾患、または損傷を有する対象由来のものとすることができる。
【0077】
いくつかの態様では、本方法は、単離された血小板からRNAを抽出することをさらに含むことができる。
【0078】
いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。
【0079】
いくつかの態様では、本方法は、有効なトランスクリプトームワイド発現プロファイルが特定されるまでそれらのステップを繰り返すことをさらに含むことができる。
【0080】
いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0081】
マーカーまたはバイオマーカーの特定
疾患に関連するバイオマーカーを特定する方法が本明細書に開示される。いくつかの態様では、本方法は、a)疾患を有する対象から試料を得ること、または得ていることであって、試料が単離された血小板を含む、得ること、または得ていることと、b)試料中の単離された血小板を配列決定することと、c)ステップb)の配列の遺伝子発現を決定することと、d)ステップa)、b)、c)を異なる時点で繰り返すことと、e)異なる時点での遺伝子発現を比較することであって、それにより、遺伝子発現の変化が少なくとも2つの標準偏差である場合、対象の遺伝子に関連するバイオマーカーを特定する、比較することと、を含むことができる。いくつかの態様では、遺伝子発現の変化が少なくとも3つの標準偏差である場合、対象の遺伝子に関連するバイオマーカーを特定することができる。いくつかの態様では、疾患に関連するバイオマーカーを特定する方法は、対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復の評価に使用することができる。
【0082】
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含み、当該方法が、対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復の評価に使用することができる、方法が本明細書に開示される。
【0083】
対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復の評価に使用することができるトランスクリプトームワイド発現プロファイルが本明細書に開示される。
【0084】
対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復を評価するために使用することができる本明細書に開示される方法によって生成されるトランスクリプトームワイド発現プロファイルが本明細書に開示される。
【0085】
トランスクリプトームワイド発現プロファイル間の差異を特定するために使用することができる方法が本明細書に開示される。いくつかの態様では、本方法は、健常トランスクリプトームワイド発現プロファイルと非健常(例えば、疾患)トランスクリプトームワイド発現プロファイルとの間の差異を特定することを含むことができる。いくつかの態様では、2つのトランスクリプトームワイド発現プロファイル間の遺伝子発現差異を特定する方法は、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法を使用して、対象の血小板トランスクリプトームの1つ以上の変動を決定することを含み、当該方法が、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とステップb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなり、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、提供することと、対象からの当該時間依存的変化を基準と比較することであって、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、比較することと、を含むことができる。いくつかの態様では、本方法は、少なくとも1回繰り返すことができる。いくつかの態様では、本方法は、第2の生体試料で繰り返すことができ、第2の生体試料は、単離された血小板からなる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0086】
核酸マイクロアレイによって差次的に発現されたマーカーを検出する方法が本明細書に開示される。いくつかの態様では、本方法は、RNAおよびタンパク質などの差次的に発現されたマーカー発現産物のレベルを検出および測定して、1つ以上の差次的に発現されたマーカー発現産物のレベルを測定するために使用することができ、当業者に既知である。
【0087】
細胞成分に焦点を当てた方法(細胞調査)または細胞外成分の調査に焦点を当てた方法(流体調査)を使用して遺伝子発現を検出または測定する方法が本明細書に開示される。遺伝子発現がいくつかの異なる分子の規則正しい産生を伴うため、細胞調査または流体調査を使用して、RNA、タンパク質、およびタンパク質の機能の結果として修飾され得るいくつかの分子を含む様々な分子を検出または測定することができる。核酸に焦点を当てた典型的な診断法には、増幅技法、例えば、PCRおよびRT-PCR(定量的改良型を含む)、ならびにハイブリダイゼーション技法、例えば、インサイツハイブリダイゼーション、マイクロアレイ、ブロットなどが含まれる。タンパク質に焦点を当てた典型的な診断法には、結合技法、例えば、ELISA、免疫組織化学、マイクロアレイ、および機能的技法、例えば、酵素アッセイが含まれる。
【0088】
対象におけるトランスクリプトームの変動を特定する方法が本明細書に開示される。いくつかの態様では、本方法は、a)対象から試料を得ること、または得ていることであって、試料が単離された血小板を含む、得ること、または得ていることと、b)試料中の単離された血小板のトランスクリプトームを配列決定することと、c)ステップbのトランスクリプトームの遺伝子発現を決定することと、d)ステップa)、b)、c)を異なる時点で少なくとも1回繰り返すことと、e)ステップc)およびステップd)で決定された遺伝子発現を比較することであって、それにより、遺伝子発現の変化が少なくとも2つの標準偏差である場合、対象におけるトランスクリプトームの変動を特定する、比較することと、を含むことができる。いくつかの態様では、遺伝子発現の変化が少なくとも3つの標準偏差である場合、対象におけるトランスクリプトームの変動を特定することができる。いくつかの態様では、変動は、バイオマーカーとすることができる。いくつかの態様では、バイオマーカーは、対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復の評価に使用することができる。いくつかの態様では、配列変動の存在は、血小板定量的形質遺伝子座(eQTL)遺伝子中で検出することができる。いくつかの態様では、配列変動の存在は、血小板スプライス定量的形質遺伝子座(sQTL)遺伝子中にあり得る。
【0089】
データセットを調製する方法が本明細書に開示される。いくつかの態様では、本方法は、a)2名以上の対象から試料を得ること、または得ていることであって、試料が単離された血小板を含む、得ること、または得ていることと、b)a)の試料中のトランスクリプトームを配列決定することと、c)b)の配列からトランスクリプトームの遺伝子発現を決定することと、d)可変遺伝子を特定すること(可変遺伝子の遺伝子発現の変化が少なくとも2つの標準偏差である)、または反復性遺伝子を特定すること(反復性遺伝子の遺伝子発現の変化が2つ未満の標準偏差である)と、を含むことができる。いくつかの態様では、遺伝子発現の変化が少なくとも3つの標準偏差である場合、可変遺伝子または反復性遺伝子を特定することができる。いくつかの態様では、可変遺伝子または反復性遺伝子は、バイオマーカーとすることができる。いくつかの態様では、バイオマーカーは、対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復の評価に使用することができる。
【0090】
いくつかの態様では、データセットは、RNA-Seqリードの分析によって生成される出力とすることができる。データセットは、参照のすべてまたは実質的にすべての既知の特徴(例えば、エクソン、イントロンなど)を含むことができる。データセットを使用して、バイオマーカーを特定することができる。
【0091】
いくつかの態様では、本明細書に開示される方法は、注釈付き参照において実質的に包括的に表される配列リードを整列させるステップを含むことができる。アライメントアルゴリズムを使用して、RNA-Seq結果および実質的に包括的な参照に関連するリードが多数存在するにもかかわらず、リードを迅速にマッピングすることができる。
【0092】
いくつかの態様では、本方法は、トランスクリプトームから複数の配列リードを取得することによってトランスクリプトームを分析することと、所定の基準を満たすアライメントスコアを各々有するアライメントを見つけることと、トランスクリプトーム中の転写物を特定することと、を含むことができる。この方法は、RNA-Seqによって取得されたリードの分析に適している。所定の基準は、例えば、最高スコアのアライメントであり得る。
【0093】
いくつかの態様では、本明細書に開示される方法およびシステムは、データセットを参照として使用することができるトランスクリプトーム分析を含むことができる。
【0094】
いくつかの態様では、データセットは、少なくとも1つの染色体の実質的にすべての既知のエクソンを表すことができる。いくつかの態様では、アライメントは、各配列リードを、データセットを通る可能性のある経路の少なくとも大部分と比較することによって見つけることができる。本方法は、見つけられたアライメントに基づいて複数の配列リードをコンティグにアセンブルすることを含み得る。
【0095】
いくつかの態様では、転写物の特定は、既知のバイオマーカーおよび新規のバイオマーカーを特定することを含む。
【0096】
本明細書に開示される方法は、転写物の発現レベルを特定することを含むことができる。
【0097】
いくつかの態様では、本明細書に開示される方法は、発見されたバリアントもしくはバイオマーカーに基づいて、疾患進行を監視すること、残存疾患を監視すること、療法を監視すること、状態を診断すること、状態を予後診断すること、または療法を選択することをさらに含むことができる。
【0098】
いくつかの態様では、本明細書に開示される方法は、特定されたバリアントまたはバイオマーカーを引き起こす疑いのある組織異常の局在化のための画像検査(例えば、CT、PET-CT、MRI、X線、超音波)により追跡することができるバリアントまたはバイオマーカーの特定をさらに含むことができる。
【0099】
いくつかの態様では、本方法は、任意の遺伝子を特定するために使用することができる。いくつかの態様では、遺伝子は、遺伝性遺伝子とすることができる。いくつかの態様では、本明細書に開示される方法のいずれも、複数回繰り返すことができる。いくつかの態様では、本明細書に開示される方法のいずれも、1、2、3、4、5、6、7、8、9、10回、またはそれ以上繰り返すことができる。
【0100】
差次的に発現されたと特定された遺伝子を様々な核酸検出アッセイで評価して、所与の試料中の1つの遺伝子または複数の遺伝子の発現レベルを検出または定量化することができる。例えば、伝統的なノーザンブロッティング、ヌクレアーゼ保護、RT-PCR、マイクロアレイ、およびディファレンシャルディスプレイ法を使用して、遺伝子発現レベルを検出することができる。mRNAをアッセイするための方法には、ノーザンブロット、スロットブロット、ドットブロット、およびオリゴヌクレオチドの規則正しいアレイへのハイブリダイゼーションが含まれる。特定のタンパク質またはmRNAもしくはDNA産物を特異的かつ定量的に測定するためのいずれの方法も使用することができる。しかしながら、方法およびアッセイは、多数の遺伝子の発現を検出するためのアレイまたはチップハイブリダイゼーションベースの方法を用いて最も効率的に設計される。溶液ベースおよび固体支持体ベースのアッセイフォーマットを含む、任意のハイブリダイゼーションアッセイフォーマットを使用することができる。
【0101】
本明細書で特定される遺伝子のタンパク質産物も、発現量を決定するためにアッセイすることができる。タンパク質をアッセイするための方法には、ウェスタンブロット、免疫沈降、およびラジオイムノアッセイが含まれる。分析されるタンパク質は、細胞内(最も一般的には免疫組織化学の適用)または細胞外(最も一般的にはELISAなどのイムノアッセイの適用)で局在化することができる。
【0102】
いくつかの態様では、生体試料は、疾患または損傷の兆候または症状が発症する前に対象から得ることができる。例えば、いくつかの態様では、生体試料は、疾患または損傷の兆候または症状が発症する約1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週間、3週間、4週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年前に得ることができる。いくつかの態様では、試料は、疾患または損傷の兆候または症状が発症する2年、3年、4年、5年、6年、7年、8年、9年、または10年超前に得ることができる。いくつかの態様では、試料は、疾患または損傷の兆候または症状が発症する1分未満前に得ることができる。いくつかの態様では、複数の生体試料を1つ以上の異なる時点で得ることができる。
【0103】
いくつかの態様では、生体試料は、疾患または損傷の兆候または症状が発症した後に対象から得ることができる。例えば、いくつかの態様では、生体試料は、疾患または損傷の兆候または症状が発症した約1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週間、3週間、4週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年後に得ることができる。ある特定の実施形態では、試料は、疾患または損傷の兆候または症状が発症した2年、3年、4年、5年、6年、7年、8年、9年、または10年超後に得られる。いくつかの態様では、試料は、疾患または損傷の兆候または症状が発症した1分未満後に得ることができる。ある特定の実施形態では、複数の生体試料を1つ以上の異なる時点で得ることができる。
【0104】
いくつかの態様では、本方法は、対象から第2の試料を得ることをさらに含むことができる。いくつかの態様では、対象は、同じ対象とすることができる。いくつかの態様では、同じ対象由来の第2の試料は、4ヶ月~4年の間に得ることができる。いくつかの態様では、対象は、疾患の1つ以上の兆候または症状を有する。
【0105】
対照群試料は、正常もしくは健常対象由来の試料、または既知の疾患もしくは損傷を有する対象由来の試料のいずれかとすることができる。いくつかの態様では、対照試料は、既知の疾患もしくは損傷から回復した対象由来の試料または回復していない対象由来の試料のいずれかとすることができる。本明細書に記載されるように、試験される試料の発現パターンの対照の発現パターンとの比較は、疾患もしくは損傷の診断、疾患もしくは損傷の重症度の評価、または疾患もしくは損傷からの回復の評価に使用することができる。いくつかの態様では、対照群は、本明細書に記載のアッセイの初期カットオフまたは閾値を確立する目的のためのものである。したがって、いくつかの態様では、本明細書に開示されるシステムおよび方法は、対照群との比較を必要とすることなく、疾患もしくは損傷の診断、疾患もしくは損傷の重症度の評価、または疾患もしくは損傷からの回復の評価に使用することができる。
【0106】
診断法
トランスクリプトームワイド発現プロファイルを生成することによって、疾患または損傷の兆候または症状を経験した対象または経験していない対象における疾患または損傷を診断するための方法、疾患または損傷の重症度を評価するための方法、および疾患または損傷からの回復を評価するための方法が本明細書に開示される。
【0107】
いくつかの態様では、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法は、疾患または損傷の兆候または症状を経験した対象または経験していない対象における疾患または損傷の診断、疾患または損傷の重症度の評価、および疾患または損傷からの回復の評価に使用することができる。いくつかの態様では、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法は、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含むことができる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0108】
生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法であって、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含み、トランスクリプトームワイド発現プロファイルを生成することによって、疾患または損傷の兆候または症状を経験した対象または経験していない対象における疾患または損傷の診断、疾患または損傷の重症度の評価、および疾患または損傷からの回復の評価に使用することができる、方法が本明細書に開示される。
【0109】
対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復の評価に使用することができるトランスクリプトームワイド発現プロファイルが本明細書に開示される。
【0110】
対照または参照試料と比較して対象から得られた生体試料中の差次的に発現されたバイオマーカーを検出することによって、疾患の診断、疾患の重症度の評価、および疾患からの回復を評価するために使用することができる本明細書に開示される方法によって生成されるトランスクリプトームワイド発現プロファイルが本明細書に開示される。
【0111】
トランスクリプトームワイド発現プロファイル間の差異を特定するために使用することができる方法が本明細書に開示される。いくつかの態様では、本方法は、健常トランスクリプトームワイド発現プロファイルと非健常(例えば、疾患)トランスクリプトームワイド発現プロファイルとの間の差異を特定することを含むことができる。いくつかの態様では、2つのトランスクリプトームワイド発現プロファイル間の遺伝子発現差異を特定する方法は、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法を使用して、対象の血小板トランスクリプトームの1つ以上の変動を決定することを含み、当該方法が、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とステップb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなり、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、提供することと、対象からの当該時間依存的変化を基準と比較することであって、方法が異なる時点で行われ、それにより、遺伝子発現差異を特定する、比較することと、を含むことができる。いくつかの態様では、本方法は、少なくとも1回繰り返すことができる。いくつかの態様では、本方法は、第2の生体試料で繰り返すことができ、第2の生体試料は、単離された血小板からなる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。
【0112】
いくつかの態様では、トランスクリプトームワイド発現プロファイルを生成し、1つ以上のバイオマーカーを検出することによって、無症候の対象または疾患もしくは損傷の非特異的指標を呈する対象を含む疾患もしくは損傷を有する対象を特定するための方法。これらのバイオマーカーは、疾患もしくは損傷および/または疾患もしくは損傷に関連する状態の治療および療法を受けている対象の監視、ならびに疾患もしくは損傷を有する対象に有効であろう療法および治療の選択または修正(ここでは、かかる治療および療法の選択および使用)にも有用である。かかる治療は、疾患または損傷に関連する症状を遅延させるまたは予防することによって、疾患または損傷を治療することができる。
【0113】
疾患または損傷を診断および予後診断するための改善された方法が本明細書に開示される。疾患または損傷の診断または予後診断は、本明細書に記載のバイオマーカーのうちの1つ以上を測定し、かつ測定値を比較値、参照値、または指標値と比較することによって評価することができる。かかる比較は、複数の個々のバイオマーカー(例えば、シグネチャ、バリアント遺伝子)の結果からの情報と他のパラメータを組み合わせて単一の測定結果または指標を得るために、数学アルゴリズムまたは数式を用いて行うことができる。疾患または損傷を有すると特定された対象を、疾患または損傷に関連する症状を防止する、治療する、または遅延させるための治療化合物の投与などの治療レジメンを受けるように任意選択的に選択することができる。
【0114】
疾患または損傷の兆候または症状の発症の前後数時間以内に疾患または損傷を有すると対象を特定することにより、疾患または損傷に関連する症状を遅延させるか、軽減するか、または予防し、かつ回復を改善するための様々な治療的介入または治療レジメンの選択および開始が可能になる可能性がある。少なくとも1つのバイオマーカーのレベルを監視することにより、治療過程の監視も可能になる。例えば、試料は、治療レジメンまたは治療的介入を受けている対象から提供され得る。かかる治療レジメンまたは治療的介入には、疾患または損傷を有すると診断または特定された対象に使用される、医薬品の投与、および治療薬または予防薬での治療を含めることができるが、これらに限定されない。試料は、治療前、治療中、または治療後の様々な時点で対象から得ることができる。
【0115】
したがって、本明細書に開示される方法によって特定されるバイオマーカー(またはシグネチャ)は、(i)疾患または損傷を有しない対象、(ii)疾患もしくは損傷を有するか、また疾患もしくは損傷の症状もしくは兆候を有する対象、および/または(iii)疾患もしくは損傷から回復しているか、もしくは回復した対象のバイオマーカープロファイルまたはシグネチャを生成するために使用することができる。対象のバイオマーカープロファイルを所定のもしくは比較バイオマーカープロファイルまたは参照バイオマーカープロファイルと比較して、疾患または損傷を診断し、疾患または損傷に関連する症状または病理の進行または進行速度を監視し、疾患または損傷治療の有効性を監視することができる。本明細書に開示される方法によって特定されるバイオマーカーに関するデータは、疾患または損傷に関する臨床パラメータまたは他のアルゴリズムの測定結果などであるが、これらに限定されない、他のデータまたは検査結果と組み合わせるまたは相関させることもできる。他のデータには、年齢、性別、民族性、ボディマス指数(BMI)、神経学的検査、EEG記録データ、EKG記録データ、撮像結果(例えば、CTスキャン、MRI、血管造影)などが含まれる。データは、病歴および任意の関連する家族歴などの対象情報を含む場合もある。
【0116】
特定の対象に対して適切であるか、またはさもなければカスタマイズされる疾患または損傷を治療するための薬剤を特定するために使用することができる方法が本明細書に開示される。これに関して、治療剤または治療薬に曝露された対象由来の試験試料を採取することができ、1つ以上のバイオマーカーのレベルを決定することができる。1つ以上のバイオマーカーのレベルを治療前および治療後に対象から得られた試料と比較することができるか、またはかかる治療または曝露の結果としてリスク因子の改善を示した1名以上の対象から得られた試料と比較することができる。
【0117】
いくつかの態様では、本明細書に記載の方法は、試料中の1つ以上のバイオマーカーの検出のために、生体試料(例えば、血小板)を利用することができる。いくつかの態様では、本方法は、対象の血小板中の1つ以上のバイオマーカーの検出を含む。
【0118】
いくつかの態様では、本明細書に開示されるように生成されたトランスクリプトームワイド発現プロファイルは、対象の疾患、状態、疾患、または損傷の診断に使用することができる。いくつかの態様では、疾患または損傷には、細菌、真菌、ウイルス、および寄生虫感染症を含むが、これらに限定されない感染病、ならびに敗血症、重度の敗血症、および敗血症性ショックを含むが、これらに限定されない感染に起因する疾患、COVID-19、小児における多系統炎症症候群(MIS-C)、および全身性炎症が含まれるが、これらに限定されない。いくつかの態様では、疾患または損傷には、がん、自己免疫疾患、皮膚疾患、眼疾患、内分泌疾患、神経学的障害、および心血管疾患が含まれるが、これらに限定されない。
【0119】
いくつかの態様では、がんは、結腸がん、膵臓がん、脳がん、膀胱がん、乳がん、前立腺がん、肺がん、乳がん、卵巣がん、子宮がん、肝臓がん、腎臓がん、脾臓がん、胸腺がん、甲状腺がん、神経組織がん、上皮組織がん、リンパ節がん、骨がん、筋肉がん、および皮膚がんを含むが、これらに限定されない固形腫瘍がんとすることができる。
【0120】
いくつかの態様では、自己免疫疾患には、無酸症自己免疫活動性慢性肝炎、急性播種性脳脊髄炎、急性出血性白質脳炎、アジソン病、無ガンマグロブリン血症、円形脱毛症、筋萎縮性側索硬化症、強直性脊椎炎、抗GBM/TBM腎炎、抗リン脂質症候群、抗シンテターゼ症候群、多関節炎、アトピー性アレルギー、アトピー性皮膚炎、自己免疫性再生不良性貧血、自己免疫性心筋症、自己免疫性腸疾患、自己免疫性溶血性貧血、自己免疫性肝炎、自己免疫性内耳疾患、自己免疫性リンパ球増殖性症候群、自己免疫性末梢神経障害、自己免疫性膵炎、自己免疫性多内分泌腺症候群、自己免疫性プロゲステロン皮膚炎、自己免疫性血小板減少性紫斑病、自己免疫性ブドウ膜炎、バロ病/バロ同心性硬化症、ベーチェット症候群、バーガー病、ビッカースタッフ脳炎、ブラウ症候群、水疱性類天疱瘡、キャッスルマン病、セリアック病、シャーガス病、慢性疲労免疫機能不全症候群、慢性炎症性脱髄性多発神経障害、慢性再発性多病巣性骨髄炎、慢性ライム病、慢性閉塞性肺疾患、チャーグ・ストラウス症候群、瘢痕性類天疱瘡、セリアック病、コーガン症候群、寒冷凝集素症、補体成分2欠損症、頭部動脈炎、クレスト症候群、クローン病、クッシング症候群、皮膚白血球破砕性血管炎、デゴス病、ダーカム病、疱疹状皮膚炎、皮膚筋炎、1型糖尿病、びまん性皮膚全身性硬化症、ドレスラー症候群、円板状紅斑性狼瘡、湿疹、子宮内膜症、腱付着部炎関連関節炎、好酸球性筋膜炎、好酸球性胃腸炎、後天性表皮水疱症、結節性紅斑、必須混合クリオグロブリン血症、エバンス症候群、進行性骨化性線維形成異常症、線維筋痛/線維筋炎、線維化性肺胞炎、胃炎、胃腸類天疱瘡、巨細胞動脈炎、糸球体腎炎、グッドパスチャー症候群、グレーブス病、ギラン・バレー症候群、橋本脳炎、橋本甲状腺炎、溶血性貧血、ヘノッホ・シェーンライン紫斑病、妊娠性疱疹、汗腺膿瘍、ヒューズ症候群、低ガンマグロブリン血症、特発性炎症性脱髄疾患、特発性肺線維症、特発性血小板減少性紫斑病、IgA腎症、封入体筋炎、炎症性脱髄性多発神経障害、間質性膀胱炎、過敏性腸症候群(IBS)、若年性特発性関節炎、若年性リウマチ性関節炎、川崎病、ランバート・イートン筋無力症症候群、白血球破砕性血管炎、扁平苔癬、硬化性苔癬、線状IgA病、ルー・ゲーリック病、ルポイド肝炎、紅斑性狼瘡、マジード症候群、メニエール病、顕微鏡的多発性血管炎、ミラー・フィッシャー症候群、混合結合組織病、限局性強皮症、ムッハ・ハーベルマン病、マックル・ウェルズ症候群、多発性骨髄腫、多発性硬化症、重症筋無力症、筋炎、ナルコレプシー、視神経脊髄炎、神経性筋強直症、眼瘢痕性類天疱瘡、オプソクローヌス・ミオクローヌス症候群、オルド甲状腺炎、回帰性リウマチ、PANDAS、傍腫瘍性小脳変性症、発作性夜間血色素尿症、パリー・ロンバーグ症候群、パーソネージ・ターナー症候群、毛様体扁平部炎、天疱瘡、尋常性天疱瘡、悪性貧血、静脈周囲脳脊髄炎、POEMS症候群、結節性多発性動脈炎、リウマチ性多発性筋痛、多発性筋炎、原発性胆汁性肝硬変症、原発性硬化性胆管炎、進行性炎症性神経障害、乾癬、乾癬性関節炎、壊疽性膿皮症、赤芽球癆、ラスムッセン症候群、レイノー現象、再発性多発性軟骨炎、ライター症候群、下肢静止不能症候群、後腹膜線維化症、リウマチ性関節炎、リウマチ熱、サルコイドーシス、統合失調症、シュミット症候群、シュニッツラー症候群、強膜炎、強皮症、シェーグレン症候群、脊椎関節症、粘着性血症候群、スティル病、スティッフパーソン症候群、亜急性細菌性心内膜炎(SBE)、スザック症候群、スイート症候群、シデナム舞踏病、交感性眼炎、高安動脈炎、側頭動脈炎、トローザ・ハント症候群、横断性脊髄炎、潰瘍性大腸炎、未分化結合組織疾患、未分化脊椎関節症、血管炎、白斑、ウェゲナー肉芽腫症、ウィルソン症候群、およびウィスコット・アルドリッチ症候群が含まれ得るが、これらに限定されない。
【0121】
いくつかの態様では、皮膚疾患には、座瘡様発疹、自己炎症性症候群、慢性水疱形成、粘膜状態、皮膚付属器状態、皮下脂肪状態、先天性異常、結合組織病(真皮線維組織および弾性組織の異常など)、皮膚および皮下成長、皮膚炎(アトピー性皮膚炎、接触性皮膚炎、湿疹、膿疱性皮膚炎、および脂漏性皮膚炎など)、色素沈着異常、薬疹、内分泌関連皮膚疾患、好酸球増加症、表皮母斑、新生物、嚢胞、紅斑、遺伝性皮膚症、感染症関連皮膚疾患、苔癬様発疹、リンパ関連皮膚疾患、色素細胞性母斑および新生物(黒色腫など)、単球およびマクロファージ関連皮膚疾患、ムチン沈着症、神経皮膚、非感染性免疫不全関連皮膚疾患、栄養関連皮膚疾患、丘疹落屑性角質増殖性(掌蹠角皮症など)、妊娠関連皮膚疾患、掻痒、乾癬、反応性好中球、難治性掌蹠発疹、代謝エラーに起因するもの、物理的要因に起因するもの(イオン化放射線誘導など)、じんま疹および血管浮腫、血管関連皮膚疾患が含まれ得るが、これらに限定されない。
【0122】
いくつかの態様では、内分泌疾患には、副腎障害、グルコース恒常性障害、甲状腺障害、カルシウム恒常性障害および代謝性骨疾患、下垂体障害、および性ホルモン障害が含まれ得るが、これらに限定されない。
【0123】
いくつかの態様では、眼疾患には、H00-H06眼瞼、涙器系、および眼窩の障害、H10-H13結膜の障害、H15-H22強膜、角膜、虹彩、および毛様体の障害、H25-H28水晶体の障害、H30-H36脈絡膜および網膜の障害(H30脈絡網膜炎症、H31脈絡膜の他の障害、H32他の箇所で分類されている疾患における脈絡網膜障害、H33網膜剥離および裂孔、H34網膜血管閉塞、H35他の網膜障害、ならびにH36他の箇所で分類されている疾患における網膜障害を含む)、H40-H42緑内障、H43-H45硝子体および眼球の障害、H46-H48視神経および視覚伝導路の障害、H49-H52眼筋、両眼運動、調節、および反射の障害、H53-H54.9視覚障害および失明、ならびにH55-H59眼および付属器の他の障害が含まれ得るが、これらに限定されない。
【0124】
いくつかの態様では、神経学的障害には、重量感覚喪失、後天性てんかん様失語症、急性播種性脳脊髄炎、副腎白質ジストロフィー、脳梁無発育、失認症、アイカルディ症候群、アレキサンダー病、エイリアンハンド症候群、感覚体側逆転、アルパース病、交代性片麻痺、アルツハイマー病、筋萎縮性側索硬化症(運動ニューロン疾患を参照のこと)、無脳症、アンジェルマン症候群、血管腫症、酸素欠乏症、失語症、失行症、くも膜嚢胞、くも膜炎、アーノルド・キアリ奇形、動静脈奇形、毛細血管拡張性運動失調症、注意欠陥過多動性障害、聴覚処理障害、自律神経機能不全、背痛、バッテン病、ベーチェット病、ベル麻痺、良性特発性眼瞼痙攣、良性頭蓋内圧亢進症、両側性前頭多小脳回、ビンスワンガー病、眼瞼痙攣、ブロッホ・サルツバーガー症候群、上腕神経叢損傷、脳膿瘍、脳障害、脳損傷、脳腫瘍、ブラウン・セカール症候群、カナバン病、手根管症候群、灼熱痛、中心性疼痛症候群、橋中心髄鞘崩解、中心核ミオパシー、頭部障害、脳動脈瘤、脳動脈硬化症、脳萎縮症、脳性巨人症、脳性麻痺、脳血管炎、頸椎脊椎管狭窄症、シャルコー・マリー・ツース病、キアリ奇形、舞踏病、慢性疲労症候群、慢性炎症性脱髄性多発神経障害(CIDP)、慢性疼痛、コフィン・ローリー症候群、昏睡、複合性局所疼痛症候群、圧迫性神経障害、先天性両側顔面神経麻痺、大脳皮質基底核変性症、頭部動脈炎、頭蓋骨癒合症、クロイツフェルト・ヤコブ病、蓄積外傷疾患、クッシング症候群、巨細胞性封入体病(CIBD)、サイトメガロウイルス感染、ダンディ・ウォーカー症候群、ドーソン病、ドモルシア症候群、デジェリン・クルンプケ麻痺、デジェリン・ソッタス病、遅延睡眠期症候群、認知症、皮膚筋炎、発達行動不全、糖尿病性神経障害、びまん性硬化症、ドラベ症候群、自律神経障害、計算力障害、書字障害、失読症、ジストニア、エンプティセラ症候群、脳炎、脳ヘルニア、脳三叉神経領域血管腫症、遺糞症、てんかん、エルブ麻痺、肢端紅痛症、本態性振戦、ファブリー病、ファール症候群、失神、家族性痙性麻痺、熱性発作、フィッシャー症候群、フリードライヒ運動失調症、線維筋痛、ゴーシェ病、ゲルストマン症候群、巨細胞性動脈炎、巨細胞封入体病、球様細胞白質萎縮症、灰色質異所形成、ギラン・バレー症候群、HTLV-1関連脊髄症、ハレルフォルデン・スパッツ病、頭部損傷、頭痛、片側顔面痙攣、遺伝性痙性対麻痺、遺伝性多発神経炎性失調、耳帯状疱疹、帯状疱疹、平山症候群、全前脳症、ハンチントン病、水無脳症、水頭症、副腎皮質機能亢進症、低酸素症、免疫介在性脳脊髄炎、封入体筋炎、色素失調症、乳児フィタン酸蓄積症、乳児レフサム病、乳児痙攣、炎症性筋疾患、頭蓋内嚢胞、頭蓋内圧亢進、ジュベール症候群、カラク症候群、キーンズ・セイアー症候群、ケネディ病、キンズボーン症候群、クリッペル・ファイル症候群、クラッベ病、クーゲルバーグ・ウェランダー病、クールー病、ラフォーラ病、ランバート・イートン筋無力症候群、ランドウ・クレフナー症候群、外側延髄(ワレンベルグ)症候群、学習障害、リー病、レノックス・ガストー症候群、レッシュ・ナイハン症候群、大脳白質萎縮症、レヴィー小体認知症、脳回欠損、閉じ込め症候群、ルー・ゲーリック病(運動ニューロン疾患を参照のこと)、椎間板疾患、腰椎狭窄、ライム病-神経学的後遺症、マシャド・ジョセフ病(脊髄小脳失調3型)、大脳症、大視症、巨大脳髄症、メルカーソン・ローゼンタール症候群、メニエール病、髄膜炎、メンケス病、異染性白質萎縮症、頭症、小視症、片頭痛、ミラー・フィッシャー症候群、小発作(一過性脳虚血発作)、ミトコンドリア筋症、メビウス症候群、単肢筋萎縮症、運動ニューロン疾患、運動神経障害、モヤモヤ病、ムコ多糖症、多発脳梗塞性認知症、多巣性運動神経障害、多発性硬化症、多系統萎縮症、筋ジストロフィー、筋痛性脳脊髄炎、重症筋無力症、ミエリン崩壊性びまん性硬化症、乳児ミオクローヌス性脳症、ミオクローヌス、筋症、筋管筋症、先天性筋強直症、ナルコレプシー、神経線維腫症、神経弛緩薬性悪性症候群、AIDSの神経症状、狼瘡の神経学的後遺症、神経性筋強直症、神経セロイドリポフスチン症、ニューロン移動障害、ニーマン・ピック病、非24時間睡眠覚醒症候群、非言語的学習障害、オサリバン・マクレオド症候群、後頭神経痛、潜在性脊髄癒合不全続発(occult spinal dysraphism sequence)、大田原症候群、オリーブ橋小脳萎縮症、オプソクローヌス・ミオクローヌス症候群、視神経炎、起立性低血圧症、使い過ぎ症候群、反復視、錯感覚、パーキンソン病、先天性パラミオトニア、腫瘍随伴疾患、発作性発作、パリー・ロンバーグ症候群、ペリツェウス・メルツバッヘル病、周期性四肢麻痺、末梢神経障害、遷延性植物状態、広汎性発達障害、光くしゃみ反射、フィタン酸蓄積症、ピック病、圧迫神経、下垂体部腫瘍、PMG、ポリオ、多小脳回、多発性筋炎、孔脳症、ポリオ後症候群、帯状疱疹後神経痛(PHN)、感染後脳脊髄炎、体位性低血圧症、プラダー・ウィリ症候群、原発性側索硬化症、プリオン病、進行性顔面片側萎縮症、進行性多病巣性白質脳障害、進行性核上麻痺、偽脳腫瘍、狂犬病、ラムゼイ・ハント症候群(i型およびii型)、ラスムッセン脳炎、反射神経血管ジストロフィー、レフサム病、反復動作障害、反復性ストレス損傷、下肢静止不能症候群、レトロウイルス関連脊髄症、レット症候群、ライ症候群、調律運動障害、ロンベルク症候群、舞踏病、サンドホフ病、統合失調症、シルダー病、裂脳症、感覚統合機能不全、中隔視神経異形成症、揺さぶられっ子症候群、帯状疱疹、シャイ・ドレーガー症候群、シェーグレン症候群、睡眠時無呼吸、睡眠病、SNATIATION、ソトス症候群、痙縮、脊椎披裂、脊髄損傷、脊髄腫瘍、脊髄性筋萎縮症、脊髄小脳失調症、スティール・リチャードソン・オルゼウスキー症候群、スティッフパーソン症候群、発作、スタージ・ウェーバー症候群、亜急性硬化性全脳炎、皮質下動脈硬化性脳症、表面鉄沈着症、シデナム舞踏病、失神、共感覚、脊髄空洞症、足根管症候群、遅発性ジスキネジア、ターロブ嚢胞、テイ・サックス病、側頭動脈炎、強縮、係留脊髄症候群、トムゼン病、胸郭出口症候群、疼痛性チック、トッド麻痺、トゥレット症候群、中毒性脳症、一過性脳虚血発作、感染性海綿状脳症、横断性脊髄炎、外傷性脳損傷、振戦、三叉神経痛、熱帯性痙性不全対麻痺、トリパノソーマ症、結節硬化症、フォン・ヒッペル・リンドウ病、ビリウイスク脳脊髄炎、ワレンベルグ症候群、ウェルドニッヒ・ホフマン病、ウェスト症候群、むち打ち症、ウィリアムズ症候群、ウィルソン病、およびツェルヴェーガー症候群が含まれ得るが、これらに限定されない。
【0125】
いくつかの態様では、心血管疾患には、動脈瘤、狭心症、アテローム性動脈硬化症、脳血管障害(発作)、脳血管疾患、うっ血性心不全、冠動脈疾患、心筋梗塞(心臓発作)、および末梢血管疾患が含まれ得るが、これらに限定されない。
【0126】
いくつかの態様では、トランスクリプトームワイド発現プロファイルは、対象が疾患または損傷から回復したと決定するために使用することができる。
【0127】
いくつかの態様では、本方法は、疾患の兆候もしくは症状の発症前もしくは発症後または疾患の診断前もしくは診断後、1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週、3週、4週、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年以内に得られた試料中の1つ以上のバイオマーカーが対照試料と比較して上方制御されていることを検出することを含む。いくつかの態様では、本方法は、疾患の兆候もしくは症状の発症前もしくは発症後または疾患の診断前もしくは診断後、1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週、3週、4週、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年以内に得られた試料中の1つ以上のバイオマーカーが対照試料と比較して下方制御されていることを検出することを含む。いくつかの態様では、対照試料は、疾患または損傷の兆候または症状の発症前に得られた試料中で測定される、ベースラインでの1つ以上のバイオマーカーのレベルである。例えば、いくつかの態様では、本方法は、疾患の兆候もしくは症状の発症前もしくは発症後または疾患の診断前もしくは診断後、1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週、3週、4週、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年以内に得られた対象試料中の1つ以上のバイオマーカーの発現の変化が、ベースラインと比較して、疾患の兆候もしくは症状を有しないか、または疾患を有すると診断されていない対照対象または集団における1つ以上のバイオマーカーの発現の変化を超えると決定することによって上方制御を検出することを含むことができる。いくつかの態様では、本方法は、疾患の兆候もしくは症状の発症前もしくは発症後または疾患の診断前もしくは診断後、1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週、3週、4週、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年以内に得られた対象試料中の1つ以上のバイオマーカーが対照と比較して下方制御されていることを検出することを含むことができる。例えば、いくつかの態様では、本方法は、疾患の兆候もしくは症状の発症前もしくは発症後または疾患の診断前もしくは診断後、1分、5分、10分、30分、1時間、2時間、4時間、6時間、12時間、18時間、24時間、2日、3日、4日、5日、6日、7日、10日、2週、3週、4週、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、9ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年以内に得られた試料からの対象における1つ以上のバイオマーカーの発現の変化が、ベースラインと比較して、疾患もしくは損傷の兆候もしくは症状を経験していないまたは有しないか、または疾患を有すると診断されていない対照対象または集団における1つ以上のバイオマーカーの発現の変化未満であると決定することによって下方制御を検出することを含むことができる。
【0128】
いくつかの態様では、本方法は、対象の生体試料中の1つ以上のマーカーを検出することを含むことができる。いくつかの態様では、対象の生体試験試料中の1つ以上のマーカーのレベルが、比較対照中のバイオマーカーのレベルと比較される。比較対照の非限定的な例には、陰性対照、陽性対照、標準対照、標準値、対象の予想される正常バックグラウンド値、対象の歴史的正常バックグラウンド値、参照基準、参照レベル、対象がメンバーである集団の予想される正常バックグラウンド値、または対象がメンバーである集団の歴史的正常バックグラウンド値が挙げられるが、これらに限定されない。いくつかの態様では、比較対照は、疾患または損傷の兆候または症状の発症前に対象から得られた試料中の1つ以上のバイオマーカーのレベルとすることができる。いくつかの態様では、比較対照は、疾患または損傷の兆候または症状の発症後であるが、試験試料の収集前に対象から以前に得られた試料中の1つ以上のバイオマーカーのレベルとすることができる。
【0129】
いくつかの態様では、本方法は、対象の生体試料中の1つ以上のマーカーのレベルを評価することによって対象における疾患または損傷の進行を監視することを含むことができる。
【0130】
いくつかの態様では、対象は、ヒト対象とすることができ、任意の人種、性別、および年齢とすることができる。いくつかの態様では、対象は、健常とすることができるか、または疾患もしくは損傷を有することができる。
【0131】
いくつかの態様では、本明細書に記載の方法から取得された情報は、単独で、または対象からのまたは対象から得られた生体試料からの他の情報(例えば、疾患状態、疾患歴、バイタルサイン、血液化学、神経学的スコアなど)と組み合わせて使用することができる。
【0132】
本明細書に開示される方法のいくつかの態様では、1つ以上のマーカーのレベルが、比較対照と比較して、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも100%、少なくとも125%、少なくとも150%、少なくとも175%、少なくとも200%、少なくとも250%、少なくとも300%、少なくとも400%、少なくとも500%、少なくとも600%、少なくとも700%、少なくとも800%、少なくとも900%、少なくとも1000%、少なくとも1500%、少なくとも2000%、少なくとも2500%、少なくとも3000%、少なくとも4000%、または少なくとも5000%増加した場合に、1つ以上のマーカーのレベルが増加したと決定することができる。
【0133】
本明細書に開示される方法のいくつかの態様では、1つ以上のマーカーのレベルが、比較対照と比較して、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも100%、少なくとも125%、少なくとも150%、少なくとも175%、少なくとも200%、少なくとも250%、少なくとも300%、少なくとも400%、少なくとも500%、少なくとも600%、少なくとも700%、少なくとも800%、少なくとも900%、少なくとも1000%、少なくとも1500%、少なくとも2000%、少なくとも2500%、少なくとも3000%、少なくとも4000%、または少なくとも5000%減少した場合に、1つ以上のマーカーのレベルが減少したと決定することができる。
【0134】
いくつかの態様では、対象由来の生体試料は、患者から得られた生体試料中のマーカーのうちの1つ以上のレベルについて評価することができる。生体試料中のマーカーのうちの1つ以上のレベルは、生体試料中のバイオマーカーのうちの1つ以上のポリペプチドの量、生体試料中のバイオマーカーのうちの1つ以上のmRNAの量、生体試料中のバイオマーカーのうちの1つ以上の酵素活性の量、またはそれらの組み合わせを評価することによって決定することができる。
【0135】
トランスクリプトームワイド発現プロファイルの作製または対象における疾患の診断に使用することができるバイオマーカーに関する組成物および方法が本明細書に開示される。バイオマーカーは、疾患のスクリーニング、診断、発症の監視、進行の監視、および回復の評価に使用することができる。これらのバイオマーカーを使用して、治療計画を確立および評価することができる。いくつかの態様では、トランスクリプトームワイド発現プロファイルを使用して、バイオマーカーを特定することができる。いくつかの態様では、バイオマーカーが特定されると、それらのバイオマーカーを使用して、遺伝子シグネチャを作製することができ、その後、これらの遺伝子シグネチャを、疾患のスクリーニング、診断、発症の監視、進行の監視、および疾患の回復の評価に使用することができる。
【0136】
トランスクリプトームワイド発現プロファイルを作製するための組成物および方法が本明細書に開示される。疾患の診断および予後の提供に使用することができる組成物および方法が本明細書に開示される。いくつかの態様では、本方法は、関連バイオマーカーおよびそれらの発現を調べることを含むことができる。いくつかの態様では、バイオマーカー発現は、メッセンジャーRNA(mRNA)への転写およびタンパク質への翻訳を含む。複数の態様では、本方法は、関連バイオマーカーの発現レベルが対照と比較して差次的に発現されるかを決定することを含むことができる。いくつかの態様では、対照は、疾患を有しない対象、疾患を有しない集団、疾患から回復していない対象、疾患から回復していない集団、疾患から回復した対象、疾患から回復した集団、および診断される対象の対照試料(この対照試料は、疾患の兆候または症状の発症前に得られる)における関連バイオマーカーのレベルとすることができる。いくつかの態様では、本方法は、対象から得られた試料中の関連バイオマーカーの発現レベルが同じ対象から以前に得られた試料中の関連バイオマーカーの発現レベルと比較して差次的に発現されるかを決定することを含むことができ、以前に得られた試料とは、疾患のリスク因子または兆候または症状の発症後の早期の時点で得られたものである。いくつかの態様では、本方法は、経時的に同じ対象から得られた複数の試料にわたって関連バイオマーカーの発現レベルを検出することを含むことができ、それにより、バイオマーカー発現の経時変化が提供される。
【0137】
したがって、いくつかの態様では、疾患を診断するための方法が提供される。本方法は、a)対象から生体試料を提供することと、b)生体試料中の本発明の少なくとも1つのバイオマーカーを特異的に検出するアッセイを用いて、生体試料を分析することと、c)試料中の少なくとも1つのバイオマーカーのレベルを、対照試料中または以前に得られた生体試料中のレベルと比較することであって、試料中の少なくとも1つのバイオマーカーのレベルと対照試料中または以前に得られた生体試料中のレベルとの間の統計的有意差が脳損傷を示す、比較することと、を含む。いくつかの実施形態では、本方法は、d)それに基づいて治療レジメンを実施するステップをさらに含む。いくつかの態様では、本方法は、対象における定義された時間間隔にわたる遺伝子発現の変化を分析することと、検出された遺伝子発現の変化を対照対象において観察された遺伝子発現の変化と比較することと、を含む。
【0138】
いくつかの態様では、疾患の予後または治療レジメンを決定するための方法が提供される。本方法は、a)対象から生体試料を提供することと、b)生体試料中の少なくとも1つのバイオマーカーを特異的に検出するアッセイを用いて、生体試料を分析することと、c)試料中の少なくとも1つのバイオマーカーのレベルを、対照試料中または以前に得られた生体試料中のレベルと比較することであって、試料中の少なくとも1つのバイオマーカーのレベルと対照試料中または以前に得られた生体試料中のレベルとの間の統計的有意差が疾患の予後または治療レジメンを示す、比較することと、を含むことができる。いくつかの態様では、本方法は、対象における定義された時間間隔にわたる遺伝子発現の変化を分析することと、検出された遺伝子発現の変化を対照対象において観察された遺伝子発現の変化と比較することと、を含む。
【0139】
いくつかの態様では、バイオマーカータイプは、mRNAバイオマーカーを含むことができる。いくつかの態様では、mRNAは、質量分析、PCRマイクロアレイ、熱シーケンシング、キャピラリーアレイシーケンシング、固相シーケンシングなどのうちの少なくとも1つによって検出することができる。
【0140】
いくつかの態様では、バイオマーカータイプは、ポリペプチドバイオマーカーを含むことができる。いくつかの態様では、ポリペプチドは、ELISA、ウェスタンブロット、フローサイトメトリー、免疫蛍光、免疫組織化学、質量分析などのうちの少なくとも1つによって検出することができる。
【0141】
バイオマーカーの検出
生体試料中の1つ以上のmRNAバイオマーカー、ポリペプチドバイオマーカー、またはそれらの組み合わせを検出する方法が本明細書に開示される。バイオマーカーは、一般に、当業者に既知の様々なアッセイ、方法、および検出システムにより測定および検出することができる。
【0142】
方法の例には、イムノアッセイ、マイクロアレイ、PCR、RT-PCR、屈折率分光法(RI)、紫外線分光法(UV)、蛍光分析、電気化学分析、放射化学分析、近赤外分光法(近赤外)、赤外(IR)分光法、核磁気共鳴分光法(NMR)、光散乱分析(LS)、質量分析、熱分解質量分析、比濁法、分散ラマン分光法、ガスクロマトグラフィー、液体クロマトグラフィー、質量分析と組み合わせたガスクロマトグラフィー、質量分析と組み合わせた液体クロマトグラフィー、質量分析と組み合わせたマトリクス支援レーザー脱離イオン化-飛行時間(MALDI-TOF)、質量分析と組み合わせたイオンスプレー分光法、キャピラリー電気泳動法、比色法、および表面プラズモン共鳴(Biacore Life Sciencesによって提供されるシステムによるものなど)が挙げられるが、これらに限定されない。いくつかの態様では、バイオマーカーは、上述の検出法または当業者に既知の他の方法を使用して測定することができる。他のバイオマーカーも同様に、それらを検出するように特別に設計または調整された試薬を使用して検出することができる。
【0143】
異なるタイプのバイオマーカーおよびそれらの測定結果を、本明細書に記載の組成物および方法で組み合わせることができる。いくつかの態様では、バイオマーカーのタンパク質形態を測定することができる。いくつかの態様では、バイオマーカーの核酸形態を測定することができる。いくつかの態様では、核酸形態は、mRNAとすることができる。いくつかの態様では、タンパク質バイオマーカーの測定結果を、核酸バイオマーカーの測定結果と併せて使用することができる。
【0144】
免疫クロマトグラフィーアッセイ、免疫ドットアッセイ、Luminexアッセイ、ELISAアッセイ、ELISPOTアッセイ、タンパク質マイクロアレイアッセイ、リガンド-受容体結合アッセイ、受容体アッセイからのリガンドの置換、共有受容体アッセイからのリガンドの置換、免疫染色アッセイ、ウェスタンブロットアッセイ、質量分光分析アッセイ、ラジオイムノアッセイ(RIA)、放射免疫拡散アッセイ、液体クロマトグラフィー-タンデム質量分析アッセイ、オクタロニー免疫拡散アッセイ、逆相タンパク質マイクロアレイ、ロケット免疫電気泳動アッセイ、免疫組織染色アッセイ、免疫沈降アッセイ、補体固定アッセイ、FACS、酵素-基質結合アッセイ、酵素アッセイ、検出可能な分子、例えば、発色団、フルオロフォア、または放射性基質を用いる酵素アッセイ、かかる基質を用いる基質結合アッセイ、かかる基質を用いる基質置換アッセイ、およびタンパク質チップアッセイを含むが、これらに限定されない、対象から得られた生体試料中のポリペプチドレベルを測定する方法が本明細書に開示される。
【0145】
RT-PCR、リアルタイムPCR、マイクロアレイ、分岐DNA、NASBAなどの核酸(例えば、mRNA)を検出するための方法は、当該技術分野で周知である。バイオマーカー配列のデータベースエントリーによって提供される配列情報を使用して、バイオマーカー配列の発現を検出し(存在する場合)、当業者に既知の技法を使用して測定することができる。例えば、配列データベースエントリーの配列または本明細書に開示される配列を使用して、例えば、ノーザンブロットハイブリダイゼーション分析または特定の核酸配列を特異的かつ定量的に増幅する方法で、バイオマーカーRNA配列を検出するためのプローブを構築することができる。別の例として、配列を使用して、例えば、逆転写ベースのポリメラーゼ連鎖反応(RT-PCR)などの増幅ベースの検出法で、バイオマーカー配列を特異的に増幅するためのプライマーを構築することができる。遺伝子発現の変化が遺伝子増幅、欠失、多型、および変異と関連している場合、試験集団および参照集団における配列比較は、試験細胞集団と参照細胞集団における試験されたDNA配列の相対量を比較することによって行うことができる。ノーザンブロットおよびRT-PCRに加えて、RNAは、例えば、他の標的増幅法(例えば、TMA、SDA、NASBA)、シグナル増幅法(例えば、bDNA)、ヌクレアーゼ保護アッセイ、インサイツハイブリダイゼーションなどを使用して測定することができる。
【0146】
いくつかの態様では、サザン分析、ノーザン分析、またはインサイツハイブリダイゼーションなどの定量的ハイブリダイゼーション法を使用することができる。本明細書で使用される「核酸プローブ」は、DNAプローブまたはRNAプローブとすることができる。プローブは、例えば、遺伝子、遺伝子断片(例えば、1つ以上のエクソン)、遺伝子を含むベクター、プローブ、またはプライマーなどとすることができる。核酸プローブは、例えば、全長核酸分子、またはその一部分、例えば、少なくとも15、30、50、100、250、または500ヌクレオチド長であり、かつストリンジェントな条件下で適切な標的mRNAまたはcDNAに特異的にハイブリダイズするのに十分なオリゴヌクレオチドとすることができる。ハイブリダイゼーション試料は、核酸プローブのmRNAまたはcDNAへの特異的ハイブリダイゼーションを可能にするのに十分な条件下で維持することができる。特異的ハイブリダイゼーションは、必要に応じて、高ストリンジェンシー条件下または中程度のストリンジェンシー条件下で行うことができる。いくつかの態様では、特異的ハイブリダイゼーションのためのハイブリダイゼーション条件は、高ストリンジェンシーとすることができる。その後、特異的ハイブリダイゼーションは、存在する場合、標準方法を使用して検出される。試験試料中のmRNAまたはcDNAを有する核酸プローブ間で特異的ハイブリダイゼーションが生じた場合、試料中のmRNAまたはcDNAのレベルを評価することができる。2つ以上の核酸プローブもこの方法で同時に使用することができる。核酸プローブのうちのいずれか1つの特異的ハイブリダイゼーションは、本明細書に記載されるように、目的とするmRNAまたはcDNAの存在を示すことができる。
【0147】
あるいは、ペプチド核酸(PNA)プローブを、本明細書に記載の定量的ハイブリダイゼーション法で核酸プローブの代わりに使用することができる。PNAは、有機塩基(A、G、C、T、またはU)がメチレンカルボニルリンカーを介してグリシン窒素に結合した、N-(2-アミノエチル)グリシン単位などのペプチド様の無機骨格を有するDNA模倣物である。PNAプローブは、標的核酸配列に特異的にハイブリダイズするように設計することができる。PNAプローブの核酸配列へのハイブリダイゼーションを使用して、生体試料中の標的核酸のレベルを決定することができる。
【0148】
いくつかの態様では、対象から得られた生体試料中の標的核酸配列に相補的なオリゴヌクレオチドプローブのアレイを使用して、対象から得られた生体試料中の1つ以上のバイオマーカーのレベルを決定することができる。オリゴヌクレオチドプローブのアレイを使用して、1つ以上のバイオマーカーのレベルのみ、または生体試料中の1つ以上の他の核酸のレベルとの関連で1つ以上のバイオマーカーのレベルを決定することができる。オリゴヌクレオチドアレイは、典型的には、異なる既知の位置で基質の表面に結合された複数の異なるオリゴヌクレオチドプローブを含む。これらのオリゴヌクレオチドアレイ、別名、「Genechips」は、当該技術分野で、例えば、米国特許 第5,143,854号、ならびにPCT特許公開第WO90/15070号および同第WO92/10092号に一般に記載されている。これらのアレイは、一般に、フォトリソグラフィー法と固相オリゴヌクレオチド合成法との組み合わせを組み込む、機械的合成法または光指向合成法を使用して生成することができる。
【0149】
オリゴヌクレオチドアレイが調製された後、目的とする核酸をアレイとハイブリダイズすることができ、そのレベルを定量化することができる。ハイブリダイゼーションおよび定量化は、概して、本明細書に記載の方法によって行われる。簡潔には、標的核酸配列は、周知の増幅技術、例えば、PCRによって増幅することができる。典型的には、これは、標的核酸に相補的なプライマー配列の使用を伴う。非対称PCR技法を使用することもできる。その後、一般に標識を組み込む増幅された標的を、適切な条件下でアレイとハイブリダイズすることができる。アレイのハイブリダイゼーションおよび洗浄が完了した時点で、アレイをスキャンして、ハイブリダイズされた核酸の量を決定することができる。スキャンから取得されたハイブリダイゼーションデータは、典型的には、生体試料中の標的核酸の量または相対量の関数として蛍光強度の形態とすることができる。標的核酸は、1つ以上の比較対照(例えば、陽性対照、陰性対照、数量対照など)と組み合わせてアレイにハイブリダイズされて、試料中の標的核酸の定量化を改善することができる。
【0150】
本明細書に記載のプローブおよびプライマーは、検出可能なおよび/または定量化可能なシグナルを得るために、当業者に既知の方法によって、放射性または非放射性化合物で直接または間接的に標識することができ、プライマーまたはプローブの標識は、放射性元素または非放射性分子で行われる。使用される放射性同位体のうち、32P、33P、35S、または3Hが言及され得る。非放射活性実体は、リガンド、例えば、ビオチン、アビジン、ストレプトアビジン、またはジゴキシゲニン、ハプテン、色素、および発光剤、例えば、放射発光剤、化学発光剤、生物発光剤、蛍光剤、またはリン光発光剤から選択することができる。
【0151】
核酸は、既知の技法を使用して細胞から得ることができる。本明細書における核酸は、mRNAを含むRNA、およびcDNAを含むDNAを指す。核酸は、二本鎖または一本鎖(すなわち、センスまたはアンチセンス一本鎖)とすることができ、ポリペプチドをコードする核酸に相補的とすることができる。核酸含有量は、生体液および新鮮または固定組織試料を含む、生体試料上で行われるRNAまたはDNA抽出とすることもできる。
【0152】
特定の核酸配列を検出して定量化するための多くの方法が当該技術分野で既知であり、新たな方法が継続的に報告されている。既知の特異的核酸検出法および定量法の大部分は、特異的ハイブリダイゼーション反応において核酸プローブを利用する。いくつかの態様では、二本鎖形態へのハイブリダイゼーションの検出は、サザンブロット技法とすることができる。サザンブロット技法では、核酸試料をサイズ(分子量)に基づいてアガロースゲル中で分離し、膜に固定し、変性させ、ハイブリダイズ条件下で標識核酸プローブに曝露する(それと混合する)ことができる。標識核酸プローブがブロット上で核酸とハイブリッドを形成する場合、標識は、膜に結合することができる。
【0153】
サザンブロットでは、核酸プローブをタグで標識することができる。いくつかの態様では、タグは、放射性同位体、蛍光色素、または他の周知の材料とすることができる。生体試料中の核酸の特異的検出のための別のタイプのプロセスは、ハイブリダイゼーション法である。いくつかの態様では、目的とする核酸に相補的な配列を有する少なくとも10個のヌクレオチド、少なくとも15個のヌクレオチド、または少なくとも25個のヌクレオチドの核酸プローブを、脱重合条件に供された試料中でハイブリダイズすることができ、この試料をATP/ルシフェラーゼ系で処理することができ、これは、核酸配列が存在する場合、発光する。定量的サザンブロッティングでは、目的とする核酸のレベルを、目的とする第2の核酸のレベルおよび/または1つ以上の比較対照核酸(例えば、陽性対照、陰性対照、数量対照など)と比較することができる。
【0154】
いくつかの態様では、核酸の検出および定量化に有用な方法は、ポリメラーゼ連鎖反応(PCR)とすることができる。PCRプロセスは当該技術分野で既知である。PCRを簡潔に要約するために、核酸増幅標的配列の反対側の鎖に相補的な核酸プライマーが変性した試料にアニーリングすることが許可される。DNAポリメラーゼ(典型的には、熱安定性)は、ハイブリダイズされたプライマーからDNA二重鎖を伸長する。このプロセスを繰り返して、核酸標的を増幅することができる。核酸プライマーが試料にハイブリダイズしない場合、対応する増幅PCR産物は存在しない。この場合、PCRプライマーは、ハイブリダイゼーションプローブの役割を果たす。
【0155】
PCRでは、核酸プローブは、本明細書に記載のタグで標識することができる。いくつかの態様では、二本鎖の検出は、目的とする核酸に指向された少なくとも1つのプライマーを使用して行うことができる。PCRのいくつかの態様では、ハイブリダイズされた二本鎖の検出は、電気泳動ゲル分離、その後、色素に基づく可視化を含むことができる。
【0156】
典型的なハイブリダイゼーションおよび洗浄のストリンジェンシー条件は、部分的に、オリゴヌクレオチドプローブのサイズ(すなわち、ヌクレオチドの数が長さである)、塩基組成、ならびに一価および二価カチオン濃度に依存する。
【0157】
いくつかの態様では、本明細書に記載の目的とする核酸の定量的および定性的プロファイルを決定するためのプロセスは、増幅が、標識プローブまたは標識加水分解プローブを使用して行われるリアルタイム増幅であり、ストリンジェントな条件下で目的とする核酸のセグメントと特異的にハイブリダイズすることができることを特徴とすることができる。標識プローブは、各増幅サイクルが起こるたびに検出可能なシグナルを発することができ、これにより、サイクル毎に得られた信号を測定することが可能になる。
【0158】
リアルタイムPCRなどのリアルタイム増幅は、当該技術分野で既知であり、様々な既知の技法を、本プロセスを実施するための最良の方法で用いることができる。これらの技法は、加水分解プローブ、ハイブリダイゼーション隣接プローブ、または分子ビーコンなどの様々なカテゴリーのプローブを使用して行うことができる。加水分解プローブまたは分子ビーコンを用いる技法は、蛍光消光剤/レポーター系の使用に基づき、ハイブリダイゼーション隣接プローブは、蛍光受容体/ドナー分子の使用に基づく。
【0159】
蛍光消光剤/レポーター系を有する加水分解プローブは市販されている。FAM色素(6-カルボキシ-フルオレセイン)、または任意の他の色素ホスホロアミダイト試薬などの多くの蛍光色素を用いることができる。
【0160】
本明細書に記載の加水分解プローブのうちのいずれか1つに適用されるストリンジェントな条件の1つに、約65℃~75℃の範囲のTmが挙げられる。いくつかの態様では、本明細書に記載の加水分解プローブのうちのいずれか1つのTmは、約67℃~約70℃の範囲とすることができる。いくつかの態様では、本明細書に記載の加水分解プローブのうちのいずれか1つに適用されるTmは、約67℃とすることができる。
【0161】
いくつかの態様では、本明細書に記載の方法は、目的とする核酸に相補的なプライマーを含むことができ、より具体的には、このプライマーは、目的とする核酸に実質的に相補的な12個以上の連続したヌクレオチドを含む。いくつかの態様では、本明細書に記載の方法で使用することができるプライマーは、約12~25ヌクレオチドの核酸配列にハイブリダイズするのに十分に相補的なヌクレオチド配列を含むことができる。
【0162】
いくつかの態様では、プライマーは、標的隣接ヌクレオチド配列と1、2、または3ヌクレオチド以下だけ異なる。いくつかの態様では、プライマーの長さは、例えば、約15~28ヌクレオチド長(例えば、16、17、18、19、20、21、22、23、24、25、26、または27ヌクレオチド長)と異なり得る。
【0163】
試料中のバイオマーカーの濃度は、任意の好適なアッセイによって決定することができる。好適なアッセイは、以下の方法、酵素アッセイ、イムノアッセイ、質量分析、クロマトグラフィー、電気泳、または抗体マイクロアレイのうちの1つ以上、またはそれらの任意の組み合わせを含むことができる。したがって、当業者に理解されるであろうように、本明細書に開示されるシステムおよび方法には、試料中のバイオマーカーを検出するための当該技術分野で既知の任意の方法が含まれ得る。
【0164】
多重分析プラットフォームのための方法も本明細書に開示される。いくつかの態様では、本方法は、マーカーの分析測定を多重化するための分析方法を含む。
【0165】
本明細書で使用される場合、「発現」という用語は、1つ以上のバイオマーカーの発現または発現レベルの決定または検出との関連で使用される場合、バイオマーカーの転写の決定または検出(例えば、遺伝子、すなわち、mRNAレベルの決定)、および/またはバイオマーカーの翻訳の決定または検出(例えば、産生されたタンパク質の決定または検出)を指すことができる。バイオマーカーの発現レベルを決定することは、バイオマーカーが発現されるか否か、および発現される場合、どの程度の相対度で発現されるかを決定することを意味する。
【0166】
本明細書に開示される1つ以上のバイオマーカーの発現レベルは、直接決定する(例えば、イムノアッセイ、質量分析)こと、または間接的に決定する(例えば、タンパク質またはペプチドのmRNA発現を決定する)こともできる。質量分析の例には、EI、CI、MALDI、ESIなどのイオン化源、およびQuad、イオントラップ、TOF、FT、またはそれらの組み合わせなどの分析、分光法、同位体比質量分析(IRMS)、熱イオン化質量分析(TIMS)、スパーク光源質量分析、多重反応モニタリング(MRM)、またはSRMが挙げられる。これらの技法のうちのいずれも、事前分画法または濃縮法と組み合わせて行うことができる。イムノアッセイの例には、イムノブロット、ウェスタンブロット、酵素結合免疫吸着アッセイ(ELISA)、酵素イムノアッセイ(EIA)、放射免疫アッセイが挙げられる。
【0167】
イムノアッセイ法は、検出に抗体を使用し、抗原のレベルの決定は、当該技術分野で既知である。抗体は、スティック、プレート、ビーズ、マイクロビーズ、またはアレイなどの固体支持体に固定することができる。
【0168】
本明細書に記載のバイオマーカーのうちの1つ以上の発現レベルは、生体試料中の1つ以上のバイオマーカーのmRNA発現を決定することによって間接的に決定することもできる。RNA発現法には、遺伝子のすべてまたは一部をコードする転写物にハイブリダイズする標識プローブを使用する細胞mRNAの抽出およびノーザンブロット、遺伝子特異的プライマーを使用するmRNAの増幅、ポリメラーゼ連鎖反応(PCR)、および逆転写ポリメラーゼ連鎖反応(RT-PCR)、続いて、様々な方法による遺伝子産物の定量的検出、細胞からのRNAの抽出、続いて、標識、その後、遺伝子をコードするcDNAまたはオリゴヌクレオチドをプローブするための使用、インサイツハイブリダイゼーション、ならびにレポーター遺伝子の検出が含まれるが、これらに限定されない。
【0169】
タンパク質発現レベルを測定するための方法には、ウェスタンブロット、イムノブロット、ELISA、ラジオイムノアッセイ、免疫沈降、表面プラズモン共鳴、化学発光、蛍光偏光、リン光、免疫組織化学的分析、マイクロサイトメトリー、マイクロアレイ、顕微鏡法、蛍光活性化細胞分類(FACS)、およびフローサイトメトリーが含まれるが、これらに限定されない。本方法は、酵素活性または他のタンパク質パートナーとの酵素相互作用を含むが、これらに限定されない、特定のタンパク質特性に基づくアッセイも含むことができる。結合アッセイも使用することができ、当該技術分野で周知である。例えば、BIAcore機を使用して、2つのタンパク質間の複合体の結合定数を決定することができる。あるタンパク質の別のタンパク質への結合を決定または検出するための他の好適なアッセイには、ELISAおよびラジオイムノアッセイなどのイムノアッセイが含まれる。分光の変化の監視による結合の決定を使用することができるか、またはタンパク質の光学特性を、蛍光、紫外線吸収、円偏光二色性、もしくは核磁気共鳴(NMR)により決定することができる。
【0170】
本明細書で使用される場合、「比較対照」という用語は、「参照」、「参照発現」、「参照試料」、「参照値」、「対照」、「対照試料」などと互換的に使用することができ、1つ以上のバイオマーカーの試料または発現レベルとの関連で使用される場合、1つ以上の遺伝子またはタンパク質は、参照基準を指し、この参照は、試料中の一定レベルで表現され、実験条件の影響を受けず、所定の疾患状態の試料中のレベルを示す。参照値は、疾患もしくは疾病なし、または疾患もしくは疾病の所定の種類もしくは重症度を表す、所定の標準値または所定の標準値の範囲とすることができる。
【0171】
参照発現は、疾患に罹患していない、または疾患の所定の重症度もしくは種類に罹患していない対象または対象のプール由来の参照試料中の本明細書に記載の1つ以上のバイオマーカーまたは遺伝子のレベルとすることができる。いくつかの態様では、参照値は、1名の対象または複数の対象由来の試料中の本明細書に記載の1つ以上のバイオマーカーまたは遺伝子のレベルとすることができ、1名の対象または複数の対象は、健常であり、特定の疾患に罹患していないとみなされる。
【0172】
いくつかの態様では、1つ以上のバイオマーカーまたは遺伝子の発現レベルを比較することができる。対象から得られた1つ以上のバイオマーカーの発現レベルを参照発現レベルと比較することにより、対象の疾患に対する感受性を決定することができる。
【0173】
1つ以上のバイオマーカーまたは遺伝子の発現レベルを決定することは、バイオマーカーまたは遺伝子が、対照もしくは参照試料と比較して上方制御されるもしくは増加するか、対照もしくは参照試料と比較して下方制御されるもしくは減少するか、または対照もしくは参照試料と比較して変化しないかを決定することを含むことができる。本明細書で使用される場合、「上方制御された」および「増加した発現レベル」または「発現の増加したレベル」という用語は、発現される1つ以上のバイオマーカーまたは遺伝子に対応する配列を指し、配列の量の尺度は、参照試料(例えば、「疾患対照」または「正常」対照由来のもの)と比較して増加した発現レベルを呈する。例えば、「上方制御された」および「増加した発現レベル」または「発現の増加したレベル」という用語は、発現される1つ以上のバイオマーカーまたは遺伝子に対応する配列を指し、配列の量の尺度は、参照試料(例えば、「疾患対照」または「正常」対照由来のもの)由来の同じmRNAの発現と比較して1つ以上のバイオマーカー(例えば、タンパク質および/またはmRNA)の増加した発現レベルを呈する。「増加した発現レベル」とは、少なくとも1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、もしくはそれ以上、例えば、20%、30%、40%、もしくは50%、60%、70%、80%、90%、もしくはそれ以上、または1倍超、最大2倍、3倍、4倍、5倍、10倍、50倍、100倍、もしくはそれ以上の発現の増加を指す。本明細書で使用される場合、「下方制御された」および「減少した発現レベル」または「発現の減少したレベル」という用語は、発現される1つ以上のバイオマーカーまたは遺伝子に対応する配列を指し、配列の量の尺度は、参照試料(例えば、「疾患対照」または「正常」対照由来のもの)と比較して減少した発現レベルを呈する。例えば、「下方制御された」および「減少した発現レベル」または「発現の減少したレベル」という用語は、発現される1つ以上のバイオマーカーまたは遺伝子に対応する配列を指し、配列の量の尺度は、参照試料(例えば、「疾患対照」または「正常」対照由来のもの)由来の同じmRNAの発現と比較して1つ以上のバイオマーカー(例えば、タンパク質および/またはmRNA)の減少した発現レベルを呈する。「減少した発現レベル」とは、少なくとも1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、もしくはそれ以上、例えば、20%、30%、40%、もしくは50%、60%、70%、80%、90%、もしくはそれ以上、または1倍超、最大2倍、3倍、4倍、5倍、10倍、50倍、100倍、もしくはそれ以上の発現の減少を指す。
【0174】
いくつかの態様では、本方法は、対象が疾患に対する増加した感受性を有するかを決定することを含むことができる。本明細書に記載されるように、対象由来の試料を参照試料と比較して発現比を決定して、対象が疾患に対する増加した感受性を有するかを決定することができる。参照試料は、「正常」レベルの1つ以上のバイオマーカーまたは遺伝子を有する対象由来のものとすることができる。好適な統計分析および他の分析を行い、参照試料と比較した1つ以上のバイオマーカーの変化(例えば、発現の増加またはそのより高いレベル)を確認することができ、1つ以上のバイオマーカーの試料発現レベルの1つ以上のバイオマーカーの参照発現レベルに対する比率が、試料中の1つ以上のバイオマーカーのより高い発現レベルを示す。いくつかの態様では、2つ以上、3つ以上、4つ以上、5つ以上、または6つ以上のバイオマーカーの試料発現レベルの、2つ以上、3つ以上、4つ以上、5つ以上、または6つ以上のバイオマーカーの参照発現レベルに対する比率は、試料中の2つ以上、3つ以上、4つ以上、5つ以上、または6つ以上のバイオマーカーのより高い発現レベルを示し、対象が疾患に対する増加した感受性を有することを示す。
【0175】
1つ以上のバイオマーカーの参照発現レベルと比較して1つ以上のバイオマーカーのより高いまたは増加した発現レベルは、疾患に対する増加した感受性を示すことができる。1つ以上のバイオマーカーの参照発現レベルと比較した1つ以上のバイオマーカーの増加した(より高い)または減少した(より低い)試料発現レベルの特徴パターンを観察し、対象における疾患の感受性(例えば、より高いまたはより低い)を示すことができる。
【0176】
本明細書に記載の1つ以上のバイオマーカーまたは遺伝子の発現レベルは、例えば、単位重量または単位体積当たりの、1つ以上のバイオマーカーまたは遺伝子の尺度とすることができる。いくつかの態様では、発現レベルは、比率(例えば、参照値の1つ以上のバイオマーカーまたはマーカーの量に対する試料中の1つ以上のバイオマーカーまたは遺伝子の量)とすることができる。
【0177】
いくつかの態様では、対象由来の試料を参照試料と比較して変化パーセントを決定して、対象が疾患に対する増加した感受性を有するかを決定することができる。言い換えれば、発現レベルは、パーセントで表すことができる。例えば、1つ以上のバイオマーカーまたは遺伝子の発現レベルの変化パーセントであって、バイオマーカーのうちの1つ(または2、3、4、5、または6つ)以上の発現レベルがバイオマーカーの参照発現レベルと比較して10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%増加する(またはより高い)、変化パーセントは、疾患に対する増加した感受性を示す。あるいは、1つ以上のバイオマーカーまたは遺伝子の発現レベルの変化パーセントは、参照発現レベルと比較して10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%減少する(またはより低い)可能性がある。
【0178】
いくつかの態様では、バイオマーカー、遺伝子、またはタンパク質の発現レベルの増加または減少またはそれらの組み合わせは、対象における疾患に対する増加した感受性または疾患の診断を示すことができる。いくつかの態様では、本明細書に開示されるバイオマーカー、遺伝子、またはタンパク質のうちの1つ以上の増加または減少した発現レベルの特徴パターンが示される。
【0179】
いくつかの態様では、本明細書に開示される方法は、疾患罹患および/または死亡を防止する方法をさらに含むことができる。例えば、本方法は、対象に、さらなる検査(疾患についての検査を含むことができる)、例えば、定期身体検査を提供することを含み、ここで、疾患に対する増加した感受性が診断されている。本方法は、疾患の発症またはまん延を防止するための療法の投与をさらに含み、それにより、疾患罹患率および/または死亡率を減少させることができる。
【0180】
キット
本明細書に記載の方法に有用なキットが本明細書に開示される。いくつかの態様では、キットは、例えば、バイオマーカー(例えば、ポリペプチドおよび/または核酸)を定量的に分析するための材料、バイオマーカー(例えば、ポリペプチドおよび/または核酸)の活性を評価するための材料、および教材を含む、本明細書に記載の方法のいずれにも有用な成分の様々な組み合わせを含むことができる。例えば、いくつかの態様では、キットは、生体試料中の所望の核酸の定量化に有用な成分を含むことができる。いくつかの態様では、キットは、生体試料中の所望のポリペプチドの定量化に有用な成分を含むことができる。いくつかの態様では、キットは、生体試料中の所望のポリペプチドの活性(例えば、酵素活性、基質結合活性など)の評価に有用な成分を含むことができる。
【0181】
いくつかの態様では、キットは、教材および対象から得られた生体試料中のバイオマーカーのレベルが治療中または治療後に調節されるかを判断するための成分を含む、治療を必要とする対象に施される治療の有効性を監視するためのアッセイの成分を含むことができる。いくつかの態様では、対象から得られた生体試料中のバイオマーカーのレベルが調節されるかを決定するために、バイオマーカーのレベルは、キットに含まれる少なくとも1つの比較対照、例えば、陽性対照、陰性対照、歴史的対照、歴史的基準のレベル、または生体試料中の別の参照分子のレベルと比較することができる。いくつかの態様では、バイオマーカーの参照分子に対する比率を決定して、治療の監視を支援することができる。
【0182】
一態様では、本明細書に開示される1つ以上のバイオマーカーのRNA(例えば、RNA産物)を測定するためのキットが提供される。キットは、1つ以上のバイオマーカーのRNAの発現を測定するために使用することができる材料および試薬を含むことができる。好適なキットの例には、RT-PCRまたはマイクロアレイが挙げられる。これらのキットは、RNA発現レベルの測定を行うために必要な試薬を含むことができる。あるいは、これらのキットは、追加の材料および試薬をさらに含むことができる。例えば、これらのキットは、本明細書に開示されるバイオマーカーではない、最大1、2、3、4、5、10、またはそれ以上の任意の数の遺伝子のRNA発現レベルを測定するために必要な材料および試薬を含むことができる。
【0183】
治療法
トランスクリプトームワイド発現プロファイルを生成することによって、疾患または損傷の兆候または症状を経験した対象または経験していない対象における疾患または損傷を診断するための方法、疾患または損傷の重症度を評価するための方法、および疾患または損傷からの回復を評価するための方法が本明細書に開示される。いくつかの態様では、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法は、疾患または損傷の兆候または症状を経験した対象または経験していない対象における疾患または損傷の診断、疾患または損傷の重症度の評価、および疾患または損傷からの回復の評価に使用することができる。いくつかの態様では、生体試料のトランスクリプトームワイド発現プロファイルを作製するための方法は、a)第1の生体試料中に存在する1つ以上の遺伝子の発現レベルを測定することであって、測定がRNAシーケンシングを含む、測定することと、b)ステップa)で取得された測定された発現レベルから遺伝子の発現レベルを決定することと、c)ステップa)の結果とb)の結果を組み合わせて、トランスクリプトームワイド発現プロファイルを生成することと、d)トランスクリプトームワイド発現プロファイルをデータセットとして提供することであって、第1の生体試料が単離された血小板からなる、提供することと、を含むことができる。いくつかの態様では、第1の生体試料および第2の生体試料は、同じ対象または異なる対象から得ることができる。いくつかの態様では、ステップa)~d)は、各生体試料で繰り返すことができる。いくつかの態様では、対象のトランスクリプトームワイド発現プロファイルを比較することができる。いくつかの態様では、第1の生体試料および第2の生体試料は、第1の時点および第2の時点で同じ対象から得ることができる。いくつかの態様では、第1の生体試料および第2の生体試料は、異なる対象から得ることができ、さらに、対象から追加の生体試料を得ることを含み、追加の生体試料は、異なる時点で得られる。いくつかの態様では、第1の時点および第2の時点は、異なる時点とすることができる。いくつかの態様では、第1の時点からのトランスクリプトームワイド発現プロファイルを、第2の時点からのトランスクリプトームワイド発現プロファイルと比較することができる。いくつかの態様では、当該方法は、有効なトランスクリプトームワイド発現プロファイルが特定することができるまでそれらのステップを繰り返すことをさらに含む。いくつかの態様では、発現レベルは、マイクロアレイ、ビーズアレイ、液体アレイ、および核酸配列からなる群から選択されるデバイスで測定することができる。いくつかの態様では、本方法は、疾患もしくは損傷または疾患もしくは損傷の1つ以上の症状を有すると診断された対象を治療することをさらに含むことができる。
【0184】
疾患調節薬を対象に投与することを含む治療法が本明細書に開示される。疾患調節薬は、疾患を有すると診断もしくは特定されたか、または疾患を有するリスクのある対象に使用される治療的または予防的なものとすることができる。いくつかの態様では、療法の修正とは、療法の期間、頻度、または強度を変更すること、例えば、投薬量レベルを変更することを指す。
【0185】
いくつかの態様では、治療を実施することは、対象に治療を受けさせること、または治療を受ける必要性を対象に伝達することを含むことができる。いくつかの態様では、療法は、手術とすることができる。
【0186】
いくつかの態様では、バイオマーカーレベルの測定により、疾患の治療過程の監視が可能になる。疾患の治療レジメンの有効性は、経時的に対象から得られた試料から有効量の1つ以上のバイオマーカーを検出し、かつ検出されたバイオマーカーの量を比較することによって監視することができる。例えば、第1の試料は、対象が治療を受ける前に得ることができ、その後の1つ以上の試料は、対象の治療後または治療中に採取することができる。試料にわたるバイオマーカーレベルの変化は、療法の有効性に関する指標を提供し得る。
【0187】
いくつかの態様では、特定の対象に適切な治療薬または薬物を特定するために、対象由来の試験試料を治療薬または薬物に曝露することもでき、1つ以上のバイオマーカーのレベルを決定することができる。バイオマーカーレベルは、治療前および治療後または治療薬もしくは薬物への曝露前および曝露後に対象から得られた試料と比較することができるか、またはかかる治療もしくは曝露の結果として疾患に対して改善を示した1名以上の対象から得られた試料と比較することができる。したがって、療法の有効性を評価する方法であって、対象由来の第1の試料中のバイオマーカーパネルの第1の測定を行うことと、対象に対して治療を実施することと、対象由来の第2の試料中のバイオマーカーパネルの第2の測定を行うことと、第1の測定結果と第2の測定結果を比較して、療法の有効性を評価することとを含む、方法が本明細書に開示される。
【0188】
加えて、特定の対象への投与に好適な治療薬は、対象から得られた試料から有効量のバイオマーカーを1つ以上検出し、かつ対象から得られた試料を、対象から得られた試料中のバイオマーカーの量を決定する試験化合物に曝露することによって特定することができる。したがって、疾患(または疾患の1つ以上の兆候または症状)を有する対象に使用するための治療または治療レジメンを、対象から得られた試料中のバイオマーカーの量に基づいて選択し、参照値と比較することができる。2つ以上の治療または治療レジメンを並行して評価して、疾患の発症を遅延させるまたは疾患の進行を遅らせるのにどの治療または治療レジメンが対象に最も有効であるかを決定することができる。いくつかの態様では、疾患の治療を開始または継続するかについての提案を行うことができる。
【0189】
いくつかの態様では、療法を実施することは、疾患調節薬を対象に投与することを含むことができる。対象は、測定されたバイオマーカーの変化したレベルが、疾患を有しない集団、より比較的軽度の疾患を有する集団、または薬物での治療の結果として疾患バイオマーカーの改善を示す集団で測定されたベースライン値に戻るまで、1つ以上の薬物で治療することができる。いくつかの態様では、対象は、測定されたバイオマーカーの変化したレベルが、対象から得られた症状が出る前の試料で測定されたベースライン値に戻るまで、1つ以上の薬物で治療することができる。加えて、バイオマーカーまたは臨床パラメータの変化したレベルに関連する改善は、疾患調節薬での治療の結果とすることができる。
【0190】
本明細書に開示される任意の薬物または薬物の組み合わせは、疾患を治療するために対象に投与され得る。本明細書の薬物は、多くの場合、当該技術分野で既知の様々な製剤に従って、または本明細書に開示もしくは参照されるように、任意の数の方法で製剤化することができる。
【0191】
いくつかの態様では、本明細書に開示される任意の薬物または薬物の組み合わせは、疾患を治療するために対象に投与されない。いくつかの態様では、医療従事者は、薬物または薬物の組み合わせの投与を控えてもよく、対象に薬物または薬物の組み合わせが投与されないよう推奨してもよく、または対象に薬物または薬物の組み合わせが投与されるのを防止してもよい。
【0192】
いくつかの態様では、1つ以上の追加の薬物は、推奨されている薬物または投与されている薬物に加えて任意選択的に投与することができる。追加の薬物は、典型的には、推奨されない薬物または回避されるべき薬物ではない。
【実施例】
【0193】
実施例1:ヒト血小板における遺伝子発現およびスプライシングの反復性の縦断RNA-seq分析は、SELPスプライスQTLを特定する
縦断研究は、個体内変動と個体間変動を区別するために、かつ遺伝子発現の反復性に必要である。これらの研究は、環境的ノイズから遺伝子シグナルを解読するところまで来ており、遺伝子バリアントおよび発現研究への応用が見込まれている。しかしながら、健常個体における遺伝子発現の縦断分析には、特に選択的スプライシングに関して、血小板を含むほとんどの初代細胞型が不足している。
【0194】
血小板における遺伝子発現およびスプライシングの反復性を評価し、かつ反復性を使用して新規の血小板eQTLおよびsQTLを特定する方法を行った。
【0195】
健常個体から最長4年間繰り返し単離された血小板のトランスクリプトームを配列決定した。容易に測定される選択的スプライシング事象である、血小板RNA発現の個体内変動および個体間変動および反復性ならびにエクソンスキッピングを試験した。結果は、血小板遺伝子発現が経時的に個体間および個体内で概ね安定していることを示すが、炎症遺伝子オントロジーが濃縮された遺伝子のサブセットは例外である。結果は、既知のおよび新規の血小板eQTLを含む遺伝性形質との関連性について反復性の遺伝子間の濃縮も示す。いくつかのエクソンスキッピング事象も高度に反復性であり、血小板におけるスプライシングの遺伝性パターンを示唆する。最も反復性の高いものの1つは、SELPのエクソン14スキッピングであった。したがって、rs6128を血小板sQTLとして特定し、SELPエクソン14スキッピングと人種との間のrs6128依存的関連性を定義した。インビトロ実験は、この一塩基バリアントがエクソン14スキッピングに直接影響を及ぼし、膜貫通P-セレクチンタンパク質産生の可溶性P-セレクチンタンパク質産生に対する比率を変化させることを実証する。
【0196】
血小板トランスクリプトームは、4年間概ね安定している。所見は、新規の血小板eQTLおよびsQTLを特定するための遺伝子発現およびスプライシングの反復性の使用を実証した。rs6128は、SELPエクソン14スキッピングおよび可溶性P-セレクチンタンパク質産生の膜貫通P-セレクチンタンパク質産生に対する比率を変化させる血小板sQTLである。
【0197】
この実施例では、ヒト血小板トランスクリプトームの個体内(内)変動および個体間(間)変動を調べるために縦断RNA-seq分析を使用した。容易に測定される選択的スプライシング事象である遺伝子存在量の反復性およびエクソンスキッピングを調べた。反復性は、環境的ノイズから遺伝性シグナルを解読し、かつeQTL遺伝子を識別するためのその使用を回顧的に実証した。また、反復性を前向きに使用して、新規の血小板eQTLおよびsQTL発見のためのeQTLおよびsQTL遺伝子候補に優先順位を付けた。
【0198】
材料および方法.ヒト対象および血小板単離
【表1】
【0199】
対象は健常であり、活動性の病状はなかった。いずれの対象も過去4ヶ月間に手術を受けていなかった。いかなる疾患もサンプリング前の少なくとも7日間にわたる症状の解消を必要とした。コホート2対象を前向きに募集した。コホート1対象は、臨床研究の一部であり、この臨床研究では、対象は、以前にアスピリンに曝露されたが、各血液試料の採取前の少なくとも4週間はアスピリンの投与を受けなかった。血液を静脈穿刺によりクエン酸管(コホート1)または酸-クエン酸-デキストロース(コホート2)中に採血し、試料処理を静脈切開の30分以内に開始した。血小板を、CD45マイクロビーズ(Miltenyi)を使用した磁気白血球枯渇により単離した(Rowley JW,et al.Blood.2011;118:e101-e111、Bray PF,et al.BMC Genomics.2013;14:1、およびVoora D,Cyr D,et al.J Am Coll Cardiol.2013;62:1267-76)。
【0200】
RNAの単離および配列決定。RNAを、フェノール-クロロホルム抽出(コホート1)(Rowley JW,et al.Blood.2011;118:e101-e111)またはDirectZolキット(コホート2、Zymogen)を使用して単離した。コホート1およびコホート2の配列決定ライブラリをバーコード化し、それぞれ、キット:KAPA Stranded mRNA-Seq Kit(Roche、番号KK8421)およびポリ(A)選択ありTruSeq unstranded v2(Illumina、番号RS-122)を使用して調製した。ライブラリを、50サイクル、シングルエンド、Illumina HiSeq 4000(コホート1)またはIllumina HiSeq 2000(コホート2)上で、1試料当たり約2000万~4000万のマッピングリードの深度まで配列決定した。Fastqファイルは、NIH Sequence Read Archive PRJNA531691に寄託されている。
【0201】
RNA-seq分析.発現変動の分析について、リードを、Novoalign(Novocraft)(Rowley JW,et al.Blood.2011;118:e101-e111)を使用してGRCh38/hg38に整列させた。リードを、USeq分析パッケージ(Nix DA,et al.BMC Bioinformatics.2010;11:455)を使用してフラットファイルにした(flattened)Ensembl遺伝子アノテーションに割り当てた。リードカウントを、DESeq2分析パッケージ(Love MI,et al.Genome Biology.2014;15:550)を使用してコホート毎に別々に正規化した。非コードRNAを、Ensembl転写生物型に従って選択した。ヒートマップ、クラスタリング(完全連結)、密度プロット、箱ひげ図、および散布図を、R(R Development Core Team.R:A Language and Environment for Statistical Computing.2018、http://www.r-project.orgから入手可能)で生成した。リード分布プロットを、統合ゲノミクスビューアー(IGV)(Thorvaldsdottir H,et al.Brief Bioinform.2013;14:178-92)を使用して生成した。遺伝子オントロジーを、DAVID(Huang DW,et al.Nat Protoc.2009;4:44-57)を使用して分析した。
【0202】
RNAの単離および配列決定.単離後、新鮮な血小板ペレットを1mLのトリゾール中に懸濁し、RNA単離まで-80℃で凍結した。コホート1由来のRNAを、フェノール-クロロホルム抽出、グリコーゲンの存在下でのイソプロパノール沈殿、および75%エタノール洗浄を使用して単離した。試料をDNAse処理し(Invitrogen、番号AM1907)、RNAを、酢酸アンモニウム/イソプロパノール沈殿を使用して再精製した(Rowley JW,et al.Blood.2011;118:e101-e111)。コホート2由来のRNAを単離し、DirectZolキットおよびカラム(Zymogen)を使用してDNAse処理した。
【0203】
個々の転写物変動の分析.RNA-seqデータは、強い平均分散関係を有する。DESeq2正規化対数変換(RLD)(Love MI,et al.Genome Biology.2014;15:550)を、(外れ値を保持しながら)低存在量の転写物間の全体的な分散を優先的に小さくするカウントに適用し、それ故に、発現レベルにわたる転写物変動のより簡単な比較を可能にした。最も低い存在量の転写物も任意に排除した。個体内変動を、同じ個体由来の試料の標準偏差として計算した。総変動を、各コホートにおける個体にわたる試料の標準偏差として計算し、それ故に、個体内変動は、総個体変動のサブコンポーネントである。分散源を、Rパッケージ分散分割(Hoffman GE,et al.BMC Bioinformatics.2016;17:483)を使用して線形混合モデルで定量化した。反復性を、eQTL濃縮分析のための反復性計算における性別の補正ならびにeQTLおよびsQTL発見のための遺伝子優先順位付けを含む、Rパッケージ「遺伝性」(Kruijer W,et al.Genetics.2015;199:379-98)における式σb
2/(σw
2+σb
2)を用いて計算した。
【0204】
エクソンスキッピング分析.エクソンスキッピング事象を、1接合部当たり5超のリードを有するエクソン/エクソンおよびエクソン/イントロン接合部の三連構造から特定し、計算したスプライスインパーセント(PSI、
図5Dを参照のこと)は、試料の30%超で0.05超および 0.95未満であった。隣接エクソン/イントロン接合部対が試料の70%超で10倍超変化した接合部を除外した。この戦略により、245個のエクソン(194個の異なる転写物由来のもの)が特定され、これらはいくつかの試料中の転写物のかなりの割合でスキップされたものであった。
【0205】
SELPミニ遺伝子.c末端DYKタグを有するSELP転写物ENST00000263686.10の完全なオープンリーディングフレーム、ならびにエクソン14に隣接するイントロン13およびイントロン14を、PCDNA-CMVベクターおよびpCDH-MSCV-GFPベクターにクローニングした。CからTへの一塩基変化をrs6128に行った。293T細胞(HEK293T/17、ATCC CRL-11268)をATCCの提言に従って維持し、継代数10~20を使用した。293T細胞にリポフェクタミン2000をトランスフェクトした。トランスフェクトした24時間後、SELP RNAスプライシングを、エクソン14に隣接するプライマー(5’-gtcaactaccgtgccaacct(配列番号1)、5’-taaggactcgggtcaaatgc(配列番号2)を使用して25サイクルおよび30サイクルでPCRによって分析した。フローサイトメトリー実験の場合、細胞にGFPプラスミド(PCDNA-CMV)を共トランスフェクトするか、またはGFPをSELPと同じ骨格(PCDH-MSCV)内に含ませるかのいずれかを行った。P-セレクチンの表面発現を、Psel.KO2.3 APC抗体(ThermoFisher、番号17-0626-82)で染色することによって評価し、CytoFLEX分析器(Beckman Coulter)でフローサイトメトリーによって分析した。P-セレクチンのMFIを、前方/側方散乱(生)およびFL-1(GFP+)強度に従ってゲーティングした生細胞/トランスフェクト細胞で評価したGFP発現に対して正規化した。可溶性P-セレクチンを、Quantikine ELISAキット(R&D Systems、番号DPSE00)を使用して測定した。ウェスタンブロットの場合、細胞をRIPAで溶解させ、溶解物を変性させて還元し、10%SDS-PAGEを使用してタンパク質を分離し、PVDF膜に移し、and blotted for tagged P-セレクチン with 抗DYK抗体(Cell Signaling Tech.、番号2368S)、続いて、抗ウサギHRP二次抗体(Rockland、番号18-8816-33)で標識されたP-セレクチンについてブロットし、化学発光による検出(ThermoFisher、番号34580)を行った。
【0206】
新規血小板eQTLおよびsQTL分析.234個の以前に公開された試料についてのRNA-seq fastqファイル(Best et.al.(Best MG,et.al.Cancer Cell.2015;28:666-676、およびBest MG,et.al.Cancer Cell.2017;32:238-252)、オランダコホート、以下、NLコホートと称する)を、NCBIショートリードアーカイブPRJNA353588(Best MG,et.al.Cancer Cell.2017;32:238-252)から検索した。これらおよびコホート1のfastqファイルを、STAR(Dobin A,et al.Bioinformatics.2013;29:15-21)を用いてスプライス認識様式でヒト参照ゲノム(HG38を構築)に整列させ、バリアントを、RNA-seqを呼び出すバリアントのGenome Analysis Toolkit(GATK)(McKenna A,et al.Genome Res.2010;20:1297-1303)ベストプラクティスから構築したワークフローを使用して呼び出し、フィルタリングした。eQTLについて試験したバリアントを、PRAX1(Simon LM,et al.Am J Hum Genet.2016;98:883-97)データセットによってeQTLと特定されなかった遺伝子の2kb以内に限定し、コホート1のデータセットでは0.9超の反復性(238個の遺伝子)であった。比較のために、最も低い反復性を有する同等数の遺伝子も含めた。組み合わせたフィルタリングにより、遺伝子存在量とバリアントとの関連性について試験した181個の遺伝子にわたって641個のバリアントがもたらされた。これらのバリアントのRNA-seq対立遺伝子頻度は、Genome of the Netherlands project(GoNL(Genome of the Netherlands Consortium,Francioli LC,Menelaou A,et.al.Whole-genome sequence variation,population structure and demographic history of the Dutch population.Nat Genet.2014;46:818-825))および1000ゲノム(Gibbs RA,et al.Nature.2015;526:68-74)によって報告されたDNA対立遺伝子頻度と同等であり(
図17A)、対立遺伝子頻度のPCA分析によって予想される亜集団に従ってクラスター化された(
図17B)。有意なバリアントのRNA-seqおよび予想される対立遺伝子頻度。集団層別化を評価するために、トランスクリプトームワイドバリアントを呼び出した。多次元スケーリング(MDS)を、Plink 1.9(Purcell S,et al.Am J Hum Genet.2007;81:559-75、およびChang CC,et al.Gigascience.2015;4:7)を用いて、コホート1、NLコホートにおいてRNA-seqから、かつ1000ゲノムから同時特定された1994個のバリアント(フィルタリング処理およびプルーニング処理したもの:FS>30.0、QD<2.0、clusterSize=3、clusterWindowSize=35、--geno 0.2、--hwe 10e-6、--maf .01、--indep-pairwise 50 5 0.2)に実施した。MDSプロットの目視検査は、個々のRNA-seqサンプルが予想される遺伝的祖先に従ってクラスター化され、その集団構造が最初の4つのMDS成分内で捕捉されたことを示した(
図17C)。DESeq2パッケージ(Love MI,et al.Genome Biology.2014;15:550)内の分散安定化変換(VST)を使用して、遺伝子発現を正規化した。遺伝子とバリアントとの間の関連性を、共変量である性別、年齢、および集団構造を制御しながら(Purcell S,et al.Am J Hum Genet.2007;81:559-75、およびChang CC,et al.Gigascience.2015;4:7)、バリアント-対立遺伝子投与量の加法モデル(0、1、2)を使用して、SNPassoc Rパッケージ(Gonzalez JR,et al.Bioinformatics.2007;23:654-655)で調べた(詳細については
図17および方法を参照のこと)。複数回の検査(641回の遺伝子-バリアント検査)に対するベンジャミニ・ホッホベルグFDR補正が報告されている。しかしながら、保守的有意性閾値p<1e-6を使用して、ゲノムワイド分析が行われたかのように新規のeQTLをフィルタリングした(Simon LM,et al.Am J Hum Genet.2016;98:883-97)。各々の有意なeQTLの対立遺伝子不均衡を、各ヘテロ接合体個体における参照バリアントリードの総リードに対する比率についてのウィルコクソン順位和検定を用いて評価した。有意性を調べた後、RNA特異的(すなわち、RNA編集)呼び出しの可能性を最小限に抑えるために、eQTLをdbSNPで報告されたものに限定した。この閾値で、11個の新たな血小板eQTL遺伝子にわたって27個のバリアントが特定された。これらは、代理変数分析(SVA)(Leek JT,Storey JD.PLoS Genet.2007;3:e161)から推定された最初の5つの潜在的変数をさらに制御した後でも依然として有意であり、明示的な調整は性別および年齢に対するものであった。その後、27個の有意な遺伝子-バリアント関連性を、NLコホートについて本明細書に記載の戦略を使用してコホート1で試験し、性別、年齢、および人種を共変量として含めた。しかしながら、サンプルサイズが小さいため、加法モデル検定に必要な3つの遺伝子型のうちの1つが欠損していた場合、共優性モデルが認められた。コホート1のeQTL分析の結果は、比較的小さいサンプルサイズを含んでおり、それ故に、コホート1における有意性は予想されず、新規の血小板eQTL選択の基準とみなされなかった。
【0207】
一般化線形モデルを、Rにおけるロジスティック回帰分析に使用して、SELPエクソン14スプライシングと自己申告の人種またはrs6128バリアント-対立遺伝子投与量との関連性を調べた。このため、総包含カウントに対するSELPエクソン14包含カウント+除外カウントを二項応答変数として使用した。指定されている場合、モデルを、人種または集団構造、rs6128遺伝子型、性別、および年齢を含む潜在的共変量に対して制御した。
【0208】
遺伝的バリアントを推測するためにRNA-seqを使用する認識されている強度および制限が存在する(Piskol R,Ramaswami G,Li JB.Am J Hum Genet.2013;93:641-51)。RNAバリアント呼び出しは、ゲノム呼び出しとは異なる質のものである。これらは発現される領域に限定され、原因となるeQTLの微細マッピングを不可能にした。極端な対立遺伝子不均衡が存在する場合、遺伝的バリアントも見逃している可能性がある。他のeQTL分析と同様に、大規模集団層別化によって説明されない交絡LDおよび遺伝的部分構造からなどの偽陽性も可能である。RNA-seqデータにおけるバリアントの密度が低いため、詳細な構造分析は不可能である。かかる制限のため、これらの結果を解明する際に追加の観察が有用であり、有意なバリアントのRNA-seqコールの対立遺伝子頻度が予想される対立遺伝子頻度と一致しており(HBG1におけるrs879095052は除く)、27個のeQTLのうち22個(eGeneの場合は11個のうち7個)が他の組織で報告されており(The Genotype-Tissue Expression(GTEx)Project)、11個のeGeneのうち8個のバリアントが発現に対するeQTLの影響と一方向的に一致した対立遺伝子不均衡を示した。
【0209】
統計.多峰性の有意性を、ハーティガンのディップ検定の統計量に従って計算した。複数の比較を調整したウィルコクソン検定を使用して、試料間相関および試料内相関の分布の類似性について試験した。コルモゴロフ・スミルノフ検定を使用して、遺伝形質/遺伝性形質に関連する遺伝子のランクの濃縮について試験した。事前にランク付けした遺伝子セット濃縮分析(GSEA)(Subramanian A,et al.Proc Natl Acad Sci U S A.2005;102:15545-50)を使用して、PRAX1コホートで特定された有意なeQTLの存在について試験した遺伝子間の濃縮を評価した。このため、PRAX1によって試験した遺伝子のサブセットを含めた。eQTL存在と異なる反復性閾値との間の関連性を、オッズ比(閾値なしと比較した各閾値でのオッズ)および独立カイ二乗検定で評価した有意性を用いて推定した。有意性についての両側t検定および相関検定(アルファ=0.05)を、関数cor.testおよびt.testを使用して、R(R Development Core Team.R:A Language and Environment for Statistical Computing.2018、www.r-project.orgから入手可能)で行い、これにより、p値下限が2.2e-16に設定される。
【0210】
結果.血小板トランスクリプトームの個体内変動および個体間変動を評価するために、健常個体の2つの独立したコホートから縦断的に単離された白血球枯渇血小板のRNA-seq分析を使用した。コホート1の場合、31名の個体由来の血小板を、初診時(0時点)および4ヶ月後に分析した。コホート2の場合、0時点で、その後、4年間にわたって縦断的に得た7名の個体由来の血小板を分析した。これらの2つのコホートの特徴を表1に詳述する。
【0211】
血小板は、安定した個体内遺伝子発現シグネチャを含む。コホート1における個々のトランスクリプトーム内および個々のトランスクリプトーム間のペアワイズ距離の教師なしクラスタリング分析は、ロバストな個体内(自己)RNA発現シグネチャを示し(
図1A)、ほとんどの自己対が最も近いネイバー対としてクラスタリングしている。
図1B~
図1Cに示されるように、4ヶ月間隔で単離された血小板トランスクリプトームの平均個体内相関は非常に高かった(r平均±標準偏差=0.987±0.012)。全血小板トランスクリプトームの個体間相関も高かった(0.947±0.024)が、個体内相関よりも有意に低かった(p<2.2e-16)。人種、年齢、または性別別に試料をグループ化することにより、差異を部分的に補正した(
図1C)。非コードRNAの個体内クラスタリングもロバストであり(
図8A)、平均個体内相関は0.984±0.013であった。非タンパク質コード転写物(0.905±0.031、
図8B~
図8C)の平均個体間相関は、タンパク質コード転写物(p<2.2e-16)と比較して有意に弱く、これは、以前の横断研究と一致する。コホート1における各転写物の生のカウントおよび正規化したカウントを決定した。
【0212】
コホート2における全RNAトランスクリプトームの教師なしクラスタリングにより、ロバストな自己クラスタリングがもたらされ、4年間にわたる最小限の転写ドリフトを示唆する(
図1D)。4年間隔で単離された試料の個体内相関は、2週間間隔で単離された試料の個体内相関と同等のままであり、時点にかかわらず個体間相関よりも有意に高かった(
図1E~
図1F)。
図8Dに示されるように、自己内非コードRNAシグネチャもロバストであり、例外なく4年間にわたる時点で独自に特定された個体も存在し、これは、非コードRNA発現における個体間相関と比較して有意に高い自己内相関の反映である(
図8E~
図8F)。コホート2における各転写物の生のカウントおよび正規化したカウントを決定した。
【0213】
血小板の個体内および個体間転写物変動は、コホート間で反復性がある。まとめると、
図1のデータは、コホート1とコホート2との間の遺伝子発現変動の同様のパターンを示し、平均個体内相関は各コホートで同様であり(0.983±0.13に対して0.987±0.12)、平均個体間相関でも同様であった(0.958±0.021に対して0.947±0.024)であった。個体内変動と比較して最小および最大全(総)変動を呈した各コホートにおける特定の転写物をさらに定義した。
図2Aおよび
図9A~
図9Bに示されるように、個体内変動は、コホート1およびコホート2の両方で一貫して変動のあった少数の中程度に発現された転写物に限定された。両コホートの個体内で最も変動した転写物を、炎症および防御応答遺伝子オントロジー(GO、
図2B)(Bryois J,et al.Genome Res.2017;27:545-552、およびWhitney AR,et al.Proc Natl Acad Sci U S A.2003;100:1896-901)内のものに対して濃縮した。
図2Cおよび
図9C~
図9Dに示されるように、高い総変動を有する転写物は、より広い範囲の発現レベルに及ぶが、変動の程度はコホート1とコホート2との間では依然として一致していた。最も高い総変動を有する転写物は、主に、個体内変動が最も高かったものと重なり(
図9E~
図9F)、炎症および防御応答GOの濃縮をもたらした(
図2D)。炎症性転写物に加えて、いくつかの遺伝子が、以前に性別、人種、または血小板eQTLと関連した高い総変動を伴うことが認められた(Edelstein LC,et al.Nat Med.2013;19:1609-16、Simon LM,et al.Am J Hum Genet.2016;98:883-97、およびSimon LM,et al.Blood.2014;123(16):e37-45)。しかしながら、炎症性転写物とは異なり、これらの大半は、高い個体内変動を示さなかった(
図9E~
図9Fの右下の四分円を参照のこと)。
【0214】
分散分割分析(Hoffman GE,Schadt EE.BMC Bioinformatics.2016;17:483)を使用して、各遺伝子について、性別、人種、および他の共変量に起因する変動の量をさらに分割および定量化し、個体内変動と総変動との間で切り離した。
図10に示されるように、遺伝子の半分以上では、個体間変動が遺伝子発現変動の大部分(50%超)を占め、残りの個体内変動が続いた。その一方で、性別および人種は少数の遺伝子にしか影響を及ぼさなかった。年齢および試料処理を含む他の既知の共変量は、各遺伝子の変動のほんの一部にしか寄与しなかった。
【0215】
反復性は、遺伝性血小板遺伝子発現を定義し、eQTL遺伝子を予測する。
【0216】
本明細書で論じられるように、単一指標(方法を参照のこと)における個体内変動および個体間変動を捕捉する反復性を使用して、eQTL分析のために遺伝子に優先順位を付けることができるかを試験した。したがって、各遺伝子の反復性を計算し、反復性が血小板における遺伝子発現の遺伝的調節および遺伝性調節と関連しているかを回顧的に試験した。これを行うために、公開されたPRAX1(Simon LM,et al.Am J Hum Genet.2016;98:883-97)データセットを、独立(現在のコホートと重複しない)およびクロスプラットフォーム(マイクロアレイ)検証データセットとして利用した。PRAX1は、以前に血小板転写物を性別および人種と関連させ、612個の血小板eQTL遺伝子を特定した。コホート1のサイズがコホート2よりも大きく、PRAX1の多様性および人口統計により良好に一致したため、コホート1をこの分析に使用した。PRAX1マイクロアレイ中の遺伝子を、コホート1のRNA-seqによって計算された反復性に従ってランク付けした。反復性によるランク付けにより、性別、人種、またはeQTLに関連する遺伝子に対して有意な濃縮がもたらされ(p<2e-16)、これは、存在量、個体内変動、または総変動によって遺伝子をランク付けした場合よりも有意に大きかった(p<2e-6、
図11も参照のこと)。
図3Aに示されるように、上位15個の反復性によってランク付けされた遺伝子の100%が、性別、人種、またはシス-eQTLと発現において有意に関連している。一例として、MFN2は、最も反復性の高い遺伝子(反復性=0.98)のうち、確立された血小板eQTL遺伝子である(Simon LM,et al.Am J Hum Genet.2016;98:883-97)。これは、MFN2発現がeQTL遺伝子型に応じて変動するためであり(Simon LM,et al.Am J Hum Genet.2016;98:883-97)、この変動は、個体間で8倍超である一方で、個体内では経時的に比較的一定のままであった(
図3B)。
【0217】
特にeQTL遺伝子の濃縮を評価する際に、GSEAは、反復性が増加するにつれて既知のeQTLの有意な濃縮(p=0)を示し、0.68超(先端)の反復性を有するものが濃縮を説明している(
図3C)。平均発現存在量または総変動によってランク付けした差異にも有意な濃縮が観察されたが、これらの尺度の濃縮スコアは反復性よりも低くかった。オッズ比のビン分析によれば、0.5未満の反復性を有する遺伝子のeQTLを特定するオッズは、無作為に遺伝子を試験するよりも3.2倍低い(p=5e-15)(
図3D)。0.9超の反復性を有する遺伝子のeQTLを特定するオッズは、無作為よりも6.2倍高く(p=6e-45)、総変動によるランク付けよりも1.8倍高い(p=0.006、調整済み)。さらに、既知の血小板シス-eQTLの場合、eQTL FDRとその関連転写物の反復性との間に有意な相関があった(
図12)。したがって、反復性は、血小板中のシス-eQTLシグナルの濃縮および強度を示し、eQTLシグナルを有する遺伝子を特定するのに有用なフィルタリングおよび優先順位付け戦略であり得る。
【0218】
マイクロアレイは、正確度、感度、および包括性の点でRNA-seqとは異なり、RNA-seqによって識別可能ないくつかのeQTL遺伝子は、PRAX1によって見逃されたかもしれない。したがって、RNA-seqデータを使用して高い反復性(0.9超)を有する238個の遺伝子を再調査したが、以前に見つかったシス-eQTLはなかった。これらを、オランダで収集された公的に入手可能なデータセット(Simon LM,et al.Am J Hum Genet.2016;98:883-97、およびSimon LM,et al.Blood.2014;123(16):e37-45)を使用して、234名の健常個体(NLコホート)由来の血小板RNA-seqのcis-eQTLについて試験した。遺伝的バリアントを、各遺伝子にわたるRNA-seqリードから呼び出し、RNA-seq存在量との関連について試験した。遺伝的バリアントを呼び出す際のRNA-seqの既知の制限にもかかわらず(例えば、ほとんどのバリアントがプロモーターおよびイントロン内に位置する)、11個の新たな可能性のある血小板eQTL遺伝子が特定された。対照的に、最も低い反復性を有する同じ数の遺伝子を分析した際に、追加のeQTLは特定されず、この差は統計的に有意であった(11/238に対して0/238、p=0.0009、フィッシャーの正確確率検定)。ヘテロ接合体内の各対立遺伝子由来のリードカウントの比率を測定する対立遺伝子不均衡の対立遺伝子特異的発現(ASE)分析は、11個の遺伝子のうち8個について、対立遺伝子不均衡に対する有意な一方向的に一貫した試料内eQTL効果を確認した。新規の血小板eQTL遺伝子のうちの1つの例は、長い非コードRNA LINC01089であり、これは、血小板中で最も高い反復性(0.95)かつ存在量(RNA-seqによる上位10%)を有する転写物のうちの1つである。
図3Eに示されるように、両時点でコホート1の個体間で、かつNLコホートの個体間で、LINC01089発現に対するrs1168663の強力な相加的対立遺伝子投与量効果がある。
図3Fに示されるように、LINC01089発現は、コホート1およびNLコホートにおける有意な対立遺伝子不均衡を示す。まとめると、これらのデータは、いくつかの新規の血小板シス-eQTLを定義し、横断発現データからの反復性の有用性を実証し、遺伝性遺伝子発現変動を予測し、シス-eQTL遺伝子を前向きに特定するための標的に優先順位を付ける。
【0219】
血小板における代替エクソンスキッピングは、経時的に個体内で維持される。
選択的スプライシングの個体内安定性と個体間安定性との比較を評価するために、RNA-seqデータで容易に測定される選択的スプライシング事象であるエクソンスキッピングに焦点を当てた。コホート1のエクソンスキッピング事象(方法を参照のこと)を厳密に特定し、各々のエクソンスプライスインのパーセント(PSI、
図4A)を計算した。
図4Bに示されるように、異なるエクソンスキッピング事象間で広範囲のエクソンスキッピングレベルが存在し、これは、経時的に個体間と個体内との間でほぼ一貫していた。PSIを使用した教師なしクラスタリング分析により、個体間クラスタリングと比較して個体内クラスタリングの選好がもたらされた(
図13)が、これは発現に基づくクラスタリングほどロバストではなかった。それにもかかわらず、PSIの個体内相関は、年齢、人種、または性別とは無関係に、個体間相関よりも有意に高く(
図4B~
図4C)、血小板におけるエクソンスキッピングレベルの遺伝性成分を示唆する。
【0220】
SELPにおけるエクソン14スキッピングに影響を及ぼす人種に関連する血小板スプライスQTLの特定。eQTLとは異なり、血小板sQTLは以前には特定されていなかった。したがって、反復性を使用してエクソンスキッピング事象に優先順位を付け、新規のロバストな生理学的に意義のある血小板シス-sQTLを特定することを目標とした。この目標を達成するために、エクソンスキッピング事象毎にPSIの個体内変動/個体間変動を評価し、各々を反復性によってランク付けした。
図5Aに示されるように、白血球接着および血小板活性化マーカーP-セレクチンをコードするSELPのエクソン14を、反復性エクソンスキッピング事象のうち2番目にランク付けした。ドナー間のエクソン14のエクソンスキッピングに差異が見られるが、個体内安定性は、
図5Bのアラインメントプロットおよび
図5Cの相関プロットによって示される。
【0221】
エクソン14スキッピングは、P-セレクチンの膜貫通ドメインのインフレーム欠失を予測する。P-セレクチンのエクソン14欠損アイソフォームは、内皮細胞および血小板で以前に検出され(Johnston GI,et al.J Biol Chem.1990;265:21381-5、McEver RP.Blood Cells.1990;16:73-80、およびIshiwata N,et.J Biol Chem.1994;269:23708-15)、ヒト循環器では有意なレベルで検出された(McEver RP.Blood Cells.1990;16:73-80、Ishiwata N,et al.J Biol Chem.1994;269:23708-15、およびSemenov A V,et al.Biochem Biokhimiia.1999;64:1326-35)。PCR(
図14)、クローニング、およびサンガーシーケンシングにより、コホート中のRNA-seqによって予測されたRNAアイソフォームが血漿中の前述の可溶性タンパク質アイソフォームと一致することが検証された。まとめると、これは、エクソン14スキッピングを、個体間のP-セレクチンタンパク質細胞表面および可溶性血漿レベルの変動性の遺伝源として意味づける。
【0222】
以前の研究は、血漿中の可溶性P-セレクチンを、人種および一塩基多型(SNP)を含む様々な臨床的因子および遺伝的因子と関連付けていた(Ataga KI,et al.N Engl J Med.2017;376:429-439、Lee DS,et al.J Thromb Haemost.2007;6:20-31、Burger PC,Wagner DD.Blood.2003;101:2661-2666、およびPenman A,Hoadley S,et al.Am J Ophthalmol.2015;159:1152-1160.e2)。
図5Dに示されるように、SELPエクソン14包含の有意な増加が、両時点で白人と比較して黒人/アフリカ系アメリカ人の間で観察された。最も可能性の高い原因となる遺伝的バリアントの検索により、ヨーロッパ人(0.04)と比較してアフリカ人(0.29)の間ではるかに高いホモ接合性MAF(T/T)を有するSNP、rs6128がSELPのエクソン14内で特定された(Gibbs RA,et al.Nature.2015;526:68-74)。興味深いことに、rs6128は、特にアフリカ系アメリカ人(Penman A,et al.Am J Ophthalmol.2015;159:1152-1160.e2)の間で、血漿P-セレクチン(Sun BB,et.al.Nature.2018;558:73-79)レベルおよび糖尿病性網膜症と関連付けられている。しかしながら、CからTへの移行がタンパク質配列を変化させないため、または標準のスプライス部位を改変しないため、rs6128と可溶性P-セレクチンとの直接的な関係は不明である。rs6128を取り囲む配列のバイオインフォマティクス分析(Raponi M,et al.Hum Mutat.2011;32:436-444)により、エクソンスプライシングサイレンサー(ESS)モチーフの正味損失および2つのエクソンスプライシングエンハンサーモチーフ(ESE)の正味利得が予測された(
図6A)。rs6128が、血小板におけるSELPエクソン14スプライシングと関連しているかを決定するために、rs6128遺伝子型をコホート1およびNLコホート(Best MG,et.al.Cancer Cell.2017;32:238-252)のRNA-seqリードから推論した。
図6B~
図6Cに示されるように、rs6128 SNPは、両コホートにおいて血小板におけるSELPエクソン14スキッピングと有意に関連している。rs6128とSELPエクソン14スキッピングとの関連性は、年齢、性別、人種、または集団構造とは無関係であった。
【0223】
その後、アフリカ人とヨーロッパ人との間のrs6128 MAFの差異が、
図5Dに示されるエクソン14スキッピングと人種との関連性を説明するかを試験した。これと一致して、rs6128を補正した後、黒人/アフリカ系アメリカ人と白人との間にエクソン14スキッピングレベルの差異はなかった(それぞれ、0時点および4ヶ月時点でp=0.4および0.3)。
【0224】
疾患におけるP-セレクチンの重要性を考慮して、SELPエクソン14スプライシング分析を追加の疾患にまで拡大した(Bestら (Best MG,et.al.Cancer Cell.2015;28:666-676、およびBest MG,et.al.Cancer Cell.2017;32:238-252)からも入手可能)。
図15に示されるように、調べた疾患(非小細胞肺がん、多発性硬化症、または肺高血圧症)のいずれも、SELPエクソン14スプライシング、またはスプライシングに対するrs6128の影響とは有意に関連していなかった。これは、エクソン14スキッピングのレベルが、血小板転写物存在量の変化を引き起こすことが示されている環境ストレス因子に関しても、個体内で安定していることを示す(Best MG,et al.Cancer Res.2018;78:3407-3412、およびBest MG,et.al.Cancer Cell.2017;32:238-252)。
【0225】
Rs6128は、SELPエクソン14スキッピングおよびインビトロでの可溶性P-セレクチンの表面P-セレクチンに対する比率に直接影響を及ぼす。非原因マーカーは、他の観察されていない変数との関連のため、遺伝的関連研究では一般に偽って特定される(Platt A,et al.Genetics.2010;186:1045-52)。SELPエクソン14スプライシングに対するrs6128の原因となる影響を具体的に試験するために、rs6128 C/CまたはT/Tを有するSELP ORFのミニ遺伝子構築物を生成し、エクソン14に隣接するイントロンを含めた(
図7A)。プロモーターの違いがスプライシングに影響を及ぼすことが知られているため(Cramer P,et al.Proc Natl Acad Sci U S A.1997;94:11456-60)、2つの異なるプロモーター(CMVまたはMSCV)を各ミニ遺伝子構築物に対して試験した。構築物を内因性P-セレクチンを欠くHEK293細胞で発現させた。トランスフェクトした後、RT-PCR分析により、C/CからT/Tへの一塩基変化が、RNA-seq結果と一致する方向に、SELP RNAアイソフォームの比率に有意なシフトをもたらしたことを確認した(
図7B)。これは両プロモーターに生じたが、CMVプロモーターでより顕著なシフトが観察された。ウェスタンブロット分析により、T/TバリアントがP-セレクチンタンパク質中のエクソン14包含へのシフトをもたらしたことが示された(
図16)。
図7Cに示されるように、膜貫通ドメインの包含と一致して、C/CからT/Tへの一塩基変化により、HEK293細胞上の表面P-セレクチンの量が有意に増加した(2倍)。対照的に、T/Tバリアントは、ELISAによって測定されるように、上清中の可溶性P-セレクチンの量を有意に減少させた(
図7D)。まとめると、このデータは、rs6128遺伝子型と、SELP RNA中のエクソン14包含の量と、可溶性P-セレクチン発現の表面P-セレクチン発現に対する比率との間の因果関係を示す。
【0226】
考察.2つの独立したコホートにおける個体内変動と個体間変動とを比較した分析は、ヒト血小板トランスクリプトームが健常個体において最大4年間にわたって高度に安定していることを示した。比較のための初代有核細胞における利用可能な縦断研究はわずかしかない。Radichら (Radich JP,et al.Genomics.2004;83:980-988)による同様の設計を有する1つの研究は、個体間変動を最大化した遺伝子シグネチャを選択した後でさえも、白血球トランスクリプトームについて30%の個体内誤分類率を観察した。この公開された研究と本明細書に記載の結果との間には差異が存在するものの、血小板が、シグネチャ選択なしで、より低い個体内誤分類率(10~12%)を有したことが特定された。それらの無核性質および7~10日間の寿命が、血小板におけるインビトロおよびインビボRNA変化を緩和し、安定した定義されたインビボ健常遺伝子発現シグネチャを促進すると考えられる。
【0227】
RNA配列決定による血小板遺伝子発現プロファイリングは、血小板機能研究のため、疾患の因果関係と原因の定義のため、および疾患診断のための関連ツールとして出現している(Best MG,et.al.Cancer Cell.2015;28:666-676、Kondkar AA,et al.J Thromb Haemost.2010;8:369-78、Edelstein LC,et al.Nat Med.2013;19:1609-16、Schubert S,et al.Blood.2014;124:493-502、Kong X,et al.Thromb Haemost.2017;117:962-970、Best MG,et.al.Cancer Cell.2017;32:238-252、およびCampbell RA,et.al.Blood.2019;blood-2018-09-873984)。しかしながら、これまでのほとんどの公開された研究は、疾患コホートと健常対象との間の血小板トランスクリプトームの単一時点での比較に依存している。これらの研究では健常対象がしばしば「ベースライン」または「対照」条件として使用されるため、これらの比較のロバスト性を理解するために、血小板トランスクリプトームが健常時に耐久性があるか否かを理解することが重要である。血小板トランスクリプトームが健常個体において4年間にわたって概ね安定しているという所見は、これらの比較に妥当性を与える。個体内および個体間で異なる個々の転写物の徹底的な分析も、いくつかの制限および警告を示唆する。
【0228】
ほとんどの転写物が安定していたが、少数の転写物は個体内で著しく変動した。ほとんどの個体内変動転写物は炎症と関連していた。これらは、血小板遺伝子発現に対する炎症の影響を評価する研究の情報となる可能性があり、炎症ストレスが血小板数および機能と関連しているという臨床所見に関連性がある可能性がある58。疾患に対する炎症性遺伝子変化の影響を評価する際に、顕性炎症性疾患と比較した健常時の炎症性転写物の変動の範囲を調査する価値がある可能性がある。
【0229】
個体間で大きな血小板発現差異が観察された。性別および人種がいくつかの大きな差異の原因であった。個体変動の他の源がより多く寄与した。このデータは、シス-eQTLの顕著な役割を示唆する。変動源にかかわらず、差次的疾患遺伝子研究を解釈し、かつ検証実験を設計する際に、健常個体間(または個体内)で変動する遺伝子の傾向を考慮に入れてもよい。固有変動の高い遺伝子は、統計的信頼に到達するのにより大きいサンプルサイズを必要とする。サンプルサイズが小さい場合、偽陽性が生じる可能性は、固有変動の高い遺伝子の場合に高い。既知の共変量の補正は、この点において有用であり得る。性別、人種、および年齢の補正がしばしば差次的遺伝子発現分析で考慮されるが、eQTLは、通常入手できないか、または無視される。
【0230】
安定性情報は、(Minimum Information for Publication of Quantitative Real-Time PCR Experiments(MIQE(Bustin SA,et al.Clin Chem.2009;55:611-622)ガイドラインとともに)正規化対照のための参照遺伝子の選択を誘導する場合もある。SYK、AKT1/2、GP1BA、ACTBなどの個体内/個体間安定遺伝子が良い選択肢であり得る。その一方で、TUBB1遺伝子などの個体内変動の高い遺伝子は、一般に、参照遺伝子として避けるべきである。
【0231】
縦断データセットの応用として、反復性をフィルタリング戦略として使用して、新たな血小板eQTLを特定した。多重検定の制限のため(Altshuler D,et al.Science.2008;322:881-888)、さらに大規模な遺伝子発現関連研究でもフィルタリング戦略および優先順位付け戦略を用いて、何百万もの遺伝子座に対する何千もの遺伝子(およびさらなる選択的スプライス事象)の試験を回避する。一般的なフィルタリング戦略には、存在量(Kumar V,et.al.PLoS Genet.2013;9:e1003201)または全分散に対するハードフィルタリングが含まれる。しかしながら、全分散のみに対するフィルタリングにより、技術的ノイズまたは環境的ノイズによって過度に影響される転写物が濃縮されるようにもなる。これを回避するために、いくつかの研究(Barendse W.BMC Genomics.2011;12:232、Carlborg O,et al.Bioinformatics.2004;21:2383-93、およびHoffman GE,Schadt EE.BMC Bioinformatics.2016;17:483)は、代わりに反復性の使用を提案した。ここで、血小板縦断データを使用して、このアイデアを実験的に試験した。シス-eQTLの有意な濃縮が最も反復性の高い遺伝子間で観察され、存在量または総変動を使用したときと比較してeQTL遺伝子を特定する能力を有意に改善した。
【0232】
eQTLは有意に濃縮されたが、反復性との関連性は完全ではなかった。コホート1を、異なるプラットフォーム(RNA-seqに対してマイクロアレイ)上でアッセイし、PRAX1よりも小さく(31に対して154)、同様であるが、同じではない人口統計を有した(人種(黒人/アフリカ系アメリカ人:45%に対して42%(有意差なし)、性別(男性):49%に対して32%(有意差なし、年齢:42+/-11に対して29+/-7、p<0.05))。eQTL分析に使用した同じ試料で測定した反復性が恐らく最良の予測をもたらすであろう。しかしながら、大規模な縦断研究は、多くの場合、繰り返しのサンプリングの費用および課題のため、実用的ではない。さらに、反復性は、独立したコホートで測定された場合、eQTL結果に信頼度を深めることができる。このため、試験コホートの人口統計および環境を反映するより大きいサンプルサイズが恐らくより良好であろう。遺伝的変異を捕捉するには小さすぎるコホート(すなわち、MAFの低いeQTL)、または体系的環境変動の対象となるコホートは、全体的により低い反復性に悩まされ、eQTLを予測する感度を欠く。反復性が追加のデータセットの分析、細胞型、および遺伝子-環境相互作用の処理にどのようにより広く適用されるかを決定するために、追加の研究が必要である。
【0233】
追加のRNA-seqコホート(NLコホート)を使用して、コホート1における最も反復性の高い遺伝子のうちの報告されていない血小板eQTL遺伝子を試験した。特定された27個のeQTLのうち22個(eQTL遺伝子の場合、11個のうち7個)が他の組織で報告されている(The Genotype-Tissue Expression(GTEx)Project)。eQTL候補遺伝子の中で注目すべきは、以前にGWASによって血小板数と関連付けられていたTECPR2である(Astle WJ,et.al.Cell.2016;167:1415-1429.e19)。長い非コードRNA eQTL遺伝子:LINC01089、MAGI2-AS3、KANSL1-AS1も特定された。これらの3つの遺伝子と同様に、非コードRNAが個体内で概ね安定しているが、タンパク質コードRNAと比較して個体間でより変動性が高いことが見出され、非コードRNA間の遺伝的多様性がより高いことを示唆する。長い非コードRNAは、遺伝子発現を制御するそれらの多面的な能力で注目を集めているが、血小板では研究中である。
【0234】
反復性をさらに適用してエクソンスキッピング事象に優先順位を付けて、生物学的に扱い易いsQTLシグナルを特定する可能性が最も高いものを見つけた。rs6128とSELPエクソン14スキッピングとの間のロバストな関連性が特定された。rs6128スプライシングとエクソン14スキッピングとの間の有意な関連性も全血試料で特定され(Zhernakova DV,et.al.Nat Genet.2017;49:139-145)、この所見をさらに強化した。
【0235】
因果関係を確立するために、我々は、内因性SELPを有利に発現させないHEK293細胞においてトランスフェクション実験を行った。結果は、rs6128を、血小板における差次的SELPエクソン14スプライシングの原因として強く意味づけるが、内因性プロモーターまたは追加の関連したバリアントもしくは関連付けられたバリアントの潜在的な寄与効果を除外しない。無関係の細胞株における血小板観察の確認は、rs6128が、P-セレクチンの別の主要な産生株である内皮細胞などの複数の組織におけるSELPスプライシングに影響を及ぼす可能性を示唆する。
【0236】
表面P-セレクチンは、白血球相互作用および炎症を媒介し、アテローム発生に関与し、腫瘍転移の一因となる。可溶性P-セレクチンは、様々な疾患に関連する循環器中の機能的かつ臨床的に意義のある血小板タンパク質である(Ataga KI,et.al.N Engl J Med.2017;376:429-439、およびLudwig RJ,et al.Expert Opin Ther Targets.2007;11:1103-1117)。可溶性P-セレクチンの主な源が活性化によって誘導されるシェディングに関連する一方で、かなりの量が遺伝性である。血漿中のrs6128と可溶性P-セレクチンタンパク質レベルとの間の関連性が報告されている(Penman A,et al.Am J Ophthalmol.2015;159:1152-1160.e2、およびSun BB,Maranville JC,Peters JE,et.al.Genomic atlas of the human plasma proteome.Nature.2018;558:73-79)。エクソン14SELPスプライシングおよび可溶性P-セレクチン局在化と比較した表面P-セレクチン局在化に対するrs6128の観察された影響は、これらの観察結果間の関連を確立する。それらは、rs6128をアフリカ系アメリカ人における血漿P-セレクチンおよび糖尿病性網膜症と関連付けた以前の臨床研究を説明する可能性がある(Penman A,et al.Am J Ophthalmol.2015;159:1152-1160.e2)。最後に、SELPが人種によって差次的にスプライスされるという所見は、アフリカ家系の個体に主に影響を及ぼす疾患である鎌状赤血球貧血における疼痛発作を治療するためにP-セレクチン遮断を効果的に使用した有望な臨床試験に照らして、治療的に意義がある可能性がある(Ataga KI,et.al.N Engl J Med.2017;376:429-439)。
【0237】
ヒト血小板はRNAのレパートリーが豊富である一方で、血小板RNA発現は、健常個体と疾患個体との間で異なり、血小板機能と関連しており、血小板トランスクリプトームの単一時点研究は、ヒトの健康および疾患における生物学的発見のために利用されることが増えており、本明細書に開示される結果は、新たな情報を提供する。
【0238】
開示される結果は、健常ヒトドナーで経時的に評価した際に、血小板RNA発現が最大4年間にわたって安定しており、かつ反復可能であり、縦断反復性指標の統合使用により、遺伝子発現およびスプライシングに影響を及ぼす遺伝的バリアントの発見が著しく促され、SELP遺伝子の遺伝的バリアントがP-セレクチン膜貫通ドメインの除去を誘導することを示す。
【0239】
開示される結果は、無核であるが、血小板が豊富で動的なトランスクリプトームを有することを示す。血小板トランスクリプトミクスの使用が増えており、その用途はがん診断から遺伝子発見まで幅広い。本明細書に開示される結果は、最大4年間にわたって繰り返し評価された健常ドナーにおける血小板遺伝子発現およびスプライシングの安定性または反復性を確立することによって、当該技術分野に追加される。この種の縦断評価は、血小板だけでなく、いずれの初代ヒト細胞にも欠如している。これらの結果は、血小板トランスクリプトームが健常時に極めて安定していることを示し、これは、疾患状況における比較を助け、血小板RNAを使用する診断および予後診断を強化し得る。さらに、このデータは、反復性の尺度(例えば、血小板RNA発現およびスプライシングの個体間変動と個体内変動との比較)を統合することにより、近くの遺伝的バリアントによって影響される遺伝子の検出の改善がもたらされることを示す。この技法を血小板SELP sQTLの発見に適用することができる。機能的には、このスプライスQTLは、P-セレクチンの膜貫通ドメインの除去を誘導する。本明細書に開示される所見は、この膜貫通ドメイン欠失が白人と比較して黒人で減少することを示す。インビトロでは、これにより、表面P-セレクチンが増加するが、可溶性P-セレクチンが減少し、これが、P-セレクチンが治療標的である黒人においてより一般的な疾患(例えば、鎌状赤血球病)に影響し得ることを示唆する。
【配列表】
【国際調査報告】