【文献】
Biotechnol. Lett.,2006年,Vol.28,pp.1601-1613
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【0010】
発明の概要
本明細書、およびそれに続く請求の範囲の全体を通じて、文脈が別途必要としない限り、「含む」なる語、および「含み」または「含んで」のようなその変化形は、記述された実体または実体群の包含を意味するが、他のいかなる実体または実体群の除外も意味しない。
【0011】
本明細書において、「〜由来の」なる語は、特定の実体または実体群が指定された種に起源するが、必ずしも指定された源から直接に得られたものではないことを示すと解すべきである。さらに本明細書において、「a」、「an」および「the」の単数形は、文脈によってそれ以外が明確に指示されない限り、複数の指示対象を含む。
【0012】
他に定義されない限り、本明細書において用いる全ての技術用語および科学用語は、本発明が属する技術の当業者が共通に理解している同じ意味を有する。
【0013】
本発明の一の態様は、試料中のRNAの完全性を定量的に測定する方法を対象とし、該方法は;
(i)参照遺伝子から転写されたRNA分子の事象(instance)、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を決定すること、
を含む。
【0014】
いくつかの実施形態において、方法はさらに:
(iii)興味のあるRNAを定量化すること、および段階(ii)で計算された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含み得る。
【0015】
いくつかの実施形態において、方法はさらに:
(iii)標準遺伝子から転写された興味のある遺伝子から転写されたRNAを定量化すること、および段階(ii)で決定された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含み得る。
【0016】
関連する態様において、興味のあるRNAの定量化方法が提供され、該方法は;
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を決定すること;
(iii)興味のあるRNAを定量化すること、および段階(ii)で計算された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含む。
【0017】
他の態様において、試料中のmRNAの完全性を定量的に測定する方法が提供され、該方法は;
(i)参照遺伝子から転写されたmRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該mRNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該mRNA分子の事象の完全性の定量的尺度を決定すること、
を含む。
【0018】
さらに他の態様において、興味のあるmRNAの定量化方法が提供され、該方法は;
(i)参照遺伝子から転写されたmRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該mRNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該mRNA分子の事象の完全性の定量的尺度を決定すること、
(iii)興味のあるRNAを定量化すること、および段階(ii)で計算された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含む。
【0019】
N、該試料中の該RNA分子の事象の数、N
i、該試料中のRNA分子の複数のセグメントの各々iの無傷の事象の相対または絶対数の定量的尺度、L
i、該セグメントの長さ、およびRNA分子の事象のヌクレオチドあたりの傷害の平均数rの関係は、以下の式で与えられ得る:
【化1】
【0020】
直線関係は、:
【化2】
で、rの値がln(N
i)およびL
iの間の直線関係の傾きとなるように示され得る。
【0021】
また他の態様において、興味のある遺伝子から転写されたRNAの定量化方法が提供され、該方法は:
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を決定すること;
(iii)興味のある遺伝子から転写されたおよび標準遺伝子から転写されたRNAを定量化すること、および段階(ii)で算出された完全性の尺度および興味のあるRNAの長さを用いて結果を訂正すること、
を含む。
【0022】
興味のあるRNA分子の量の定量化が標準RNAの定量化に関連し、標準のRNA分子の量に対する試料中の興味のあるRNA分子の量は:
【化3】
によって与えられ、ここで、N
test/N
stanは興味があるRNA分子(試験分子)の量の標準のRNA分子の量に対する比率であり、S
test/S
stanは試料中のそれぞれの試験および標準のセグメントで測定された量の比率であり、L
testおよびL
stanは試験および標準分解関連セグメントのそれぞれの長さであり、r
testおよびr
stanは、それらが含まれている、試料における試験および標準のRNA分子の事象のヌクレオチドあたりの損傷の平均数rである。
【0023】
また他の態様において、試料中のRNAの完全性の定量的尺度を決定するために用いられる方法が提供され、該方法は:
(i)少なくとも一つのRNA分子の標準定量化を表すRNA発現プロファイリングデータにアクセスすること;
(ii)該RNA分子の各々の事象の完全性の定量的尺度を表すRNA完全性データにアクセスすること、
(iii)RNA分子のそれぞれの分解関連セグメント(またはそれらの派生物)の一つ以上の長さを表す長さデータにアクセスすること;および
(iv)RNA発現プロファイリングデータ、RNA完全性データおよび長さデータを処理して、該少なくとも一つのRNA分子の該定量化の訂正された値を表す、訂正済RNA発現プロファイリングデータを生成すること、
を含む。
【0024】
また他の態様において、試料中のRNAの完全性の定量的尺度の決定において用いられる方法が提供され、該方法は:
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定して、該定量的尺度および該長さを表すアッセイデータを生成すること、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該アッセイデータを処理して該試料中の該RNA分子の事象の完全性の定量的尺度を表す完全性データを生成すること、
を含む。
【0025】
いくつかの実施形態において、方法はさらに:
(iii)興味のあるRNAを定量化すること;および
(iv)段階(ii)で決定された完全性の尺度および興味のあるRNAの分解関連セグメント(またはそれらの派生物)に対応する長さを用いて該定量化の結果を訂正すること、
を含む。
【0026】
いくつかの実施形態において、該RNAはmRNAである。
【0027】
いくつかの実施形態において、各々の長さは定数成分および可変成分を有する。いくつかの実施形態において、各々の長さは複数の異なる長さの統計的平均である。
【0028】
また他の態様において:
(i)少なくとも一つのRNA分子の標準定量化を表すRNA発現プロファイリングデータにアクセスする;
(ii)該RNA分子の各々の事象の完全性の定量的尺度を表すRNA完全性データにアクセスする、
(iii)RNA分子のそれぞれの分解関連セグメント(またはそれらの派生物)の一つ以上の長さを表す長さデータにアクセスする;および
(iv)RNA発現プロファイリングデータ、RNA完全性データおよび長さデータを処理して、該少なくとも一つのRNA分子の該定量化の訂正された値を表す、訂正済RNA発現プロファイリングデータを生成する、
ように設定された、一つ以上のRNA完全性成分を含む、RNA発現プロファイリングシステムが提供される。
【0029】
いくつかの実施形態において、RNA完全性成分はさらに:
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定して、該定量的尺度および該長さを表すアッセイデータを生成する、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該アッセイデータを処理して該試料中の該RNA分子の事象の完全性の定量的尺度を表す完全性データを生成する、
ように設定される。
【発明を実施するための形態】
【0031】
発明の詳細な説明
本発明は、一つは興味のある生体試料のRNA塩基が破損されている確率を測定することに基づくRNA完全性を定量化するための手段の開発を前提とする。この開発は、初めて、興味のある試料における有意でより正確なRNA完全性の定量化、およびさらにこの情報を用いて、分解の度合いについて、同じ試料からの興味のある遺伝子を読み取るRNA発現レベルの定量化を訂正する能力の両方を可能にした。本方法の開発は、より有益で正確なRNA発現データを得ることを可能にし、その結果、RNA発現情報による、診断、予防および治療用途に関する実用性の有意な改善を容易にする。
【0032】
したがって、本発明の一の態様は試料中のRNAの完全性を定量的に測定する方法を対象とし、該方法は;
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を決定すること、
を含む。
【0033】
関連する態様において、興味のあるRNAの定量化方法が提供され、該方法は;
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を決定すること;
(iii)興味のあるRNAを定量化すること、および段階(ii)で計算された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含む。
【0034】
「RNA分子」の定量化または定量的尺度を得ることへの参照は、該RNA分子を直接定量化するかまたは定量的尺度を得るか、または該RNA分子の、cDNAなどの、派生物を定量化するかまたは定量的尺度を得ることとして理解されるべきである。
【0035】
「該試料中の該RNA分子」について得られる定量的尺度が、該試料中の他の種のRNA分子と同じであることもまた理解されるべきである。
【0036】
対象RNAの「完全性の測定」への参照は、RNA分解の範囲を測定することへの参照である。それは、補数または逆数として表現され得る。本発明はいかなる理論または作用機序にも拘泥されないが、RNAはそのDNA同等物と異なり、非常に不安定な分子である。試料中のRNAの品質は、1つの型の試料から次まで、広くばらつきを有し得、熱、照射、化学物質または組織リボヌクレアーゼなどの物理的および化学的なさまざまな要素によって影響される。したがって、それは容易に分解可能であるだけでなく、分解度が試料間で大いに異なり得て、その結果、それらが同じ患者から採取されても、試料間で定量的RNA発現データを評価するおよび/または比較することを実行不可能にする。
【0037】
「定量化するまたは定量的尺度を得る」への参照は、比尺度上の尺度を得ることとして理解されるべきである。比尺度上の完全性の測定は、RNA分子(r)あたりの損傷の数として表現され、この図は試験される試料のRNAの完全性の指標として、および興味のある別々の遺伝子と関連して得られ得る定量化されたRNA発現結果の訂正のために用いるための両方に関連する。完全性の尺度もまた、RNAヌクレオチドあたりの損傷の数の数学的に同等な統計値として表現できる。例えば、RNA配列の興味のある領域が考慮され、その領域の長さが知られているならば、そのRNA配列の完全性は、完全なその配列の事象の割合として表現することができる。
【0038】
「RNA」への参照は、リボ核酸またはそれらの派生物またはアナログへの参照として理解されるべきである。この点について、それがmRNA、一次RNA、リボソームRNA、tRNA、マイクロRNAなどを含むすべての形式のRNAを含むことが理解されるべきである。本発明のRNAは自然発生のもの(例えば、患者から採取された生体試料から得られる)、組み換え的に作製されたもの(例えば、インビトロ培養試料から採取された試料)または合成的に作製されたものを含むいかなる起源であり得る。
【0039】
「派生物」への参照は、天然、合成または組換え型の源からの該RNAの断片、ホモログまたはオーソログへの参照を含むことが理解されるべきである。該RNA配列の派生物は他の蛋白質性または非蛋白質性分子に融合したRNA分子の特定の領域を有する断片を含む。本明細書で考慮される「アナログ」は、その化学組成または全体的な配座の修飾などの、ヌクレオチドまたは核酸分子の修飾を含むが、これらに限定されない。これは例えば、新規または修飾されたプリンまたはピリミジン塩基の組み込み、または主鎖形成または相補的塩基対ハイブリダイゼーションのレベルなどの、ヌクレオチドまたは核酸分子が他のヌクレオチドまたは核酸分子と相互作用する様式での修飾、を含む。ビオチン化または他の形式のヌクレオチドまたは核酸分子の標識が、本明細書で定義される「派生物」の例である。本明細書に記載された派生物およびアナログが、患者から採取された生体試料で観察されないであろうが、それらの完全性の度合いを試験される組換え的にまたは合成で作製されたインビトロ試料において見出され得ることが理解されるであろう。 該RNAの「派生物」は、該RNAのcDNAを含むことが理解されるべきである。
【0040】
一の実施形態において、RNAはmRNAである。
【0041】
この実施形態によると、試料中のmRNAの完全性を定量的に測定する方法が提供され、該方法は;
(i)参照遺伝子から転写されたmRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該mRNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該mRNA分子の事象の完全性の定量的尺度を決定すること、
を含む。
【0042】
関連する実施形態において、興味のあるmRNAの定量化方法が提供され、該方法は;
(i)参照遺伝子から転写されたmRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該mRNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該mRNA分子の事象の完全性の定量的尺度を決定すること、
(iii)興味のあるRNAを定量化すること、および段階(ii)で計算された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含む。
【0043】
また他の実施形態において、興味のある遺伝子の第一のRNA転写を分析することを選択し得る。
【0044】
該試料のRNA分子の事象の完全性の定量的尺度はRNA分子の事象のヌクレオチドあたりの損傷の平均数を表し得る。
【0045】
関係は異なる長さの該セグメントおよびそれぞれの決定された定量的尺度の対数の間の直線関係として表され得て、ここで、完全性の定量的尺度は直線関係の勾配から決定される。勾配は回帰分析により決定され得る。
【0046】
RNAの損傷が、その分布がポアソン統計を用いて正確に示される、独立した確率事象の結果であると仮定するとN、該試料中の該RNA分子の事象の数、N
i、該試料中のRNA分子の複数のセグメントの各々iの無傷の事象の相対または絶対数の定量的尺度、L
i、該セグメントの長さ、およびRNA分子の事象のヌクレオチドあたりの傷害の平均数rの関係は、以下の式で与えられ得る:
【化5】
【0047】
両側の自然対数をとると、直線関係は:
【化6】
で、rの値がln(N
i)およびL
iの間の直線関係の傾きとなるように示され得る。
【0048】
RNAまたはそのDNA派生物の「分解関連セグメント」への参照は、RNAまたはDNA分子の領域であって、該領域がその範囲内のいかなる塩基の損傷が興味のあるRNAの定量化に影響し、その範囲外(すなわち外の)いかなる塩基の損傷が該定量化に影響しないであろう領域の参照として理解されるべきである。試料中のRNAが定量化に先立つcDNA構築の捕捉などの多数の工程に供され得て、分解損傷がそのような工程の効率に影響し、その結果、定量化の結果に影響し得て、最終的な定量化手順の方法で利用された配列に「相当する」RNAの領域が上記で定義されるセグメントと全体として相当しないかもしれないことが理解されるであろう。
【0049】
セグメントの「長さ」への参照は、そのセグメントを含む多数のヌクレオチドへの参照として理解されるべきであり、記号「L」への参照は、分解関連セグメントの長さへの参照として理解されるべきである。
【0050】
上記で定義された「分解関連」セグメントは、
図1において、使用され得る異なる定量化方法、該方法は、測定の最終段階に先立つ処理の様々な技術に関する、と比較して示される。記号「L」はセグメントの塩基の数をいい、図中の水平な矢印はセグメントの範囲を示す。図はまた、最終的な定量化方法で用いられるRNAまたはその派生物の領域を示し、この領域が上記で定義されたセグメントからの範囲と異なることが明らかである。
【0051】
「RNA分子の事象のヌクレオチドあたりの傷害の平均数r」への参照は、試料回収時点でRNAに既に存在する損傷およびRNA抽出、輸送、保存および測定工程の間に生成された損傷(簡単に工程損傷と称する)の両方への参照と理解されるべきである。RNAはDNAと比べて比較的不安定であるので、工程損傷はRNAアッセイの結果に影響する損傷の有意な比率を含み得る。RNAからcDNAの逆転写に関する尺度アッセイについて、工程損傷は逆転写酵素のリボヌクレアーゼ活性で発生した損傷を含むが、cDNAの不安定性から生じる損傷は実質的にない。ヌクレオチドあたりの既存の損傷の数がr
aであり、工程の間に生じたヌクレオチドあたりの傷害の数をr
pとすると、
【化7】
ここで、
【化8】
である。
【0052】
以上詳しく述べられるように、本発明の方法は、参照遺伝子から転写された複数の異なる長さのRNAをアッセイすることに基づく完全なRNAの量の測定を前提とする。この点で、対象RNAが直接アッセイされ得るか、またはこのRNAのcDNAバージョンがその後の全てのアッセイが、興味のあるRNAのcDNA同等物を利用して行われるように、最初に作製され得ることが理解されるべきである。本明細書における複数のセグメントを「アッセイ」することへの参照は、RNAを直接アッセイするか、またはRNAのcDNA同等物コピーをアッセイすることの両方を含むと理解されるべきである。
【0053】
完全性の尺度は興味のある試料に存在する参照遺伝子の文脈において決定される。したがって、「参照遺伝子」なる句が、完全性を測定する目的のために用いられる遺伝子または遺伝子領域であり、その結果が他の遺伝子のRNAの完全性を決定するために適用できるものを意味することが理解されるべきである。より具体的に、参照遺伝子から転写されたRNAは複数のセグメントを定量化することによる完全性の測定に用いられる。このために、参照遺伝子は転写を受けるDNA分子として理解されるべきである。転写産物は蛋白質産物への翻訳を受け得るかまたは受け得ない。当業者に理解されるように、必ずしも全てのRNA分子が蛋白質に転写されるわけではない。RNA分子が蛋白質への翻訳を受けるものであるかどうかは、本発明がいかなる型のRNA分子の完全性を定量化することのみに向けられているので、参照遺伝子または興味のある遺伝子を選ぶ観点からは無関係である。いくつかの遺伝子が、RNA転写産物を生成するが、蛋白質翻訳生成物を生成しないことが知られている。染色体DNAに関して、遺伝子はイントロンおよびエキソン領域の両方を含み得る。しかしながら、興味があるDNAがcDNA、それは興味のあるDNAがベクターDNAである場合に起こり得る、である場合、イントロン領域は存在しないかもしれない。にもかかわらず、そのようなDNAは5’または3’非翻訳領域を含み得る。したがって、本明細書における「遺伝子」への参照は、例えば、ゲノムDNAおよびcDNAを含む転写を受けるいかなる形式のDNAも含むことが理解されるべきである。対象の「遺伝子」は、ゲノムDNAの2つの領域間、またはゲノムDNAの1つの領域と、ウイルスまたは導入配列などの外来DNA領域間のいずれかで、組み換え的に作出され得る。それは部分的にまたは全体的に、合成または組換えで生成された核酸分子の領域であり得る。
【0054】
定量化されたセグメントのすべてから得られた定量化の結果の全てを検討することによって、複数の参照遺伝子が使用でき、完全性の複数の尺度を得ることができ、または完全性の単一の尺度を入手できることが理解されるであろう。しかしながら、最も簡単なアプローチは、1つの参照遺伝子を使用して、1つの完全性尺度を入得ることであることが理解されるであろう。
【0055】
いかなる方法で本発明を限定することなしに、遺伝子が転写を受けるものであれば、参照遺伝子としての使用のためにいかなる遺伝子も選択できる。
【0056】
遺伝子が、方法の感度を増加させるので、研究される組織で過剰に発現されるものであることが好ましい。参照遺伝子としての使用に適した遺伝子の例は、GAPDH、β−アクチン、HPRT、β2マイクログロブリンを含むが、これらに限定されない。参照遺伝子のRNA転写から得られたcDNAは、無作為の、ポリdTの、または、遺伝子固有のプライミングで生産され得る。
【0057】
いくつかの実施形態において、アッセイは該RNA分子の複数のセグメントの各々の配列のcDNA派生物のあらかじめ定義されたしきい値への周期増幅を含み、該試料中のRNA分子の事象の完全性の定量的尺度が、該セグメントの長さL
iおよびあらかじめ定義されたしきい値を満たすために必要とした増幅サイクルの各々の数Cq
iとの間の関係から決定される。
【0058】
この実施形態の文脈において、関係は該セグメントの異なる長さおよびあらかじめ定義されたしきい値を満たすために必要とした増幅サイクルの各々の数(Cq
i)との直線関係で示され得て、完全性の定量的尺度は直線関係の勾配から決定される。勾配は回帰で決定され得る。
【0059】
この実施形態における直線関係は:
【化9】
ここで、a
iはi回目のセグメントのサイクルあたりの増幅効率である、で示され得る。a
iの値が参照RNAの各々のセグメントのために決定できるが、効率的な増幅システムを使うのが好ましいので、実際にはa
iのすべての値が既知の同じ値aを有し、その結果、関係は:
【化10】
となる。
【0060】
方法は、該試料のRNA分子の事象の完全性の定量的尺度、該RNA分子の選択されたセグメントの完全な事象の相対数または絶対数の定量的尺度、および選択されたセグメントの長さに基づいて、該試料中の該RNA分子の事象の相対数または絶対数の定量的尺度を決定することを含み得る。
【0061】
該試料中の該RNA分子の事象の相対数または絶対数の定量的尺度Nは:
【化11】
で与えられ、ここで、N
iはRNA分子への長さLの完全なセグメントの事象の数である。
【0062】
詳細に上述したように、本発明者らがRNAの完全性の正確な定量化のための方法を開発したことに加えて、この決定も事実上試験された試料に存在するRNA分解の度合いを考慮に入れるために、興味のある遺伝子の定量的RNA分析の結果を調整するための訂正としてこの結果を使用することを可能にする。これはその結果、有意により正確な結果を得ることを可能にする。
【0063】
このために、「興味のあるRNA分子」への参照は、DNA分子から転写されるいかなるRNA分子、またはマイクロRNA、tRNA、リボソームRNA、siRNA、shRNAなどのそのものとしての同一性(すなわち、蛋白質産物のためのテンプレートとしてではない)を有するRNA分子などのRNA分子の参照としても理解されるべきである。したがって、興味のあるRNA分子はまた、蛋白質産物に翻訳されるものであるか、そうでないかもしれない。
【0064】
一の実施形態において、対象RNAは興味のある遺伝子から転写されたRNAである。
【0065】
この実施形態によると、興味のある遺伝子から転写されたRNAの定量化方法が提供され、該方法は;
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定すること、ここで該セグメントはそれぞれ異なった長さを有する;
(ii)決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を決定すること;
(iii)興味のある遺伝子から転写されたRNAを定量化すること、および段階(ii)で計算された完全性の尺度および興味のあるRNAの対応する分解関連セグメント(またはそれらの派生物)の長さを用いて結果を訂正すること、
を含む。
【0066】
一の実施形態において、該RNAはmRNAである。
【0067】
本発明はいかなる理論または作用機序にも拘泥されることなく、本明細書に記載された発明による「定量化すること」、「定量化」または「定量」への参照は、絶対的または相対的のいずれの定量化への参照である。絶対的定量化はRNA転写コピーの絶対数を得ることをいい、一方で相対的定量化は、「標準遺伝子」または「RNA標準」から転写されたRNAレベルと比較した、興味のあるRNAのレベルの定量化をいう。これらの2つの用語は必ずしも対照的というわけではない。
【0068】
興味のあるRNAの定量化は通常2つの段階:
1.試料中の興味のあるRNA転写産物の絶対数についての尺度を得る;
1.1もし尺度が、興味のあるRNA転写産物の長さLの完全なセグメントの事象(S
test)の数を直接決定する、高スループットRNAシークエンシングまたはデジタルPCRなどの直接法で得られるのであれば、興味のあるRNA転写の事象(N
test)の数は:
【化12】
で与えられ、ここでrは試験試料中のRNAの完全性の尺度であり、
1.2もし尺度が別個の試料に含まれる既知の量(N
stan)の外部RNA標準に関する相対的定量化を用いて間接的に得られるのであれば、興味のあるRNA転写の事象の数(N
test)は:
【化13】
で与えられ、ここで添字「test」および「stan」はそれぞれ試験および標準RNAに関する長さ(L)および完全性の尺度(r)を示す。その質量が既知の外部RNA標準の使用の例は、慢性骨髄性白血病でのBCR−ABL転写産物の定量化である。尺度は、試験試料および外部標準試料の両方において、BCRなどの他の遺伝子について得られる。このことは試験試料中のBCR転写産物の絶対数の決定を可能にし、それゆえ試料の妥当性の基準および可能な検出のレベルの決定を可能にする。
【0069】
外部標準が興味のある遺伝子のRNA発現レベルの定量化を可能にする目的で使用されると、評価される外部試料のRNA完全性、ならびに興味のある遺伝子の転写レベルが分析される試料のRNA完全性が必要となるであろうことが当業者によって理解されるべきである。このように、標準および興味のある遺伝子の定量化結果の両方が、個々の試料の各々のRNA分解の範囲を反映するために訂正できる。時々、外部標準が試験試料に添加され、興味のあるRNAと共に処理されるが、その完全性はまだ別々に測定しなければならない。
【0070】
実際には、DNAのより良い安定性のため、「RNA」標準は、例えばプラスミドに挿入される形で、興味のあるRNAの領域と同じ配列を有するDNAを形成標準でたいてい代用される。理論上、DNAの完全性が評価されるべきであるが、実際にはDNAは通常無傷とみなされ、すなわち、r
stanの値はゼロとなる。そうであれば:
【化14】
1.3もし尺度が、外部標準を使用せず、全ての遺伝子について尺度(S
test)が、興味のあるRNAの完全なセグメントの事象の数と同じであるが未知の関係にあると仮定して、間接的に得られるならば、興味のあるRNA転写の事象(N
test)の数は:
【化15】
で与えられ、ここで、kは未知であるがすべての遺伝子で同じである値を有する定数であり、Lは該セグメントの長さである。いかなる遺伝子の値が未知であるが、定数kは相殺されるため、いかなる2つの遺伝子(添字1および2)のための転写産物の数の比率が求められる。
【化16】
【0071】
2.上記の1.1、1.2または1.3で先に得られた試料中の興味のあるRNA転写産物の絶対数の測定によるところの相対的定量化の実施は、同じ試料中の内部標準RNAのRNA転写産物の絶対数の同様に得られた尺度と比較して表される。相対的定量化のこの手順は、時折正規化と呼ばれる。それは試料の起源の組織中の興味のあるRNAの事象の絶対数に対する、試料中の興味のあるRNAの事象の絶対数の関係の困難性を克服する試みで実施される。この困難性は、生理的または病理学的変化への応答における起源の組織において起こるRNAレベルの広い変動からの、インビトロでのRNA分解の結果としての、または定量化が上記1cの様に実施された場合の個々の遺伝子の実際の値の欠如からの、RNA回復の多様性から生じる
【0072】
相対的定量化または正規化は、内部標準に対する興味のあるRNAの発現の倍数差としてしばしば表現される。1つ以上の興味のある遺伝子が、RNA発現プロフィールが調製され、これらの個々の遺伝子の結果の各々が1つの標準の結果に対して評価できるところの、特定の試料の分析の対象であり得ることが当業者によって理解されるであろう、
【0073】
本発明のこの態様の方法は、参照遺伝子との関係で計算された完全性の尺度を用いて、興味のある遺伝子について得られた結果を訂正するときに、同様に述べられる。興味のある遺伝子から転写されたRNAの定量化が標準の遺伝子の転写レベルに対して評価されるので、事実上、修正が興味のある遺伝子と標準の遺伝子の両方で得られた結果に適用されることが理解されるであろう。一般に、RNA完全性を決定するために使用される標準の遺伝子と参照遺伝子は、2つの別々の遺伝子になるであろう。しかしながら、標準および参照の両方に同じRNA種を使用することも想定できる。
【0074】
つまり、上記のセクション1.1、1.2、および1.3の場合では、試料中の興味のあるRNA分子の量は式:
【化17】
で与えられ、試料中の内部標準RNA分子の量に対する試料中の興味のあるRNA分子の量は:
【化18】
で与えられ、ここでN
test/N
stanは標準RNA分子に対する興味のあるRNA分子(試験分子)の量の比率であり、S
test/S
stanは試料中の、試験および標準セグメントのそれぞれの測定量の比率であり、L
testおよびL
stanは試験および標準の分解関連セグメントのそれぞれの長さであり、rは試料中の試験および標準RNA分子の事象のヌクレオチドあたりの損傷の平均数である。
【0075】
「訂正」への参照は、RNA完全性の尺度の、完全なRNA分子の事象の数の測定を該RNA分子の事象の総数の絶対的または相対的尺度に変換するための使用への参照として意図される。該RNA分子の事象の総数の絶対的または相対的尺度が該RNA分子のセグメントの事象の総数の絶対的または相対的尺度と等しいことが理解されるであろう。
【0076】
このために、「標準遺伝子」または「RNA標準」から転写されたRNAへの参照は、興味のあるRNAレベルに関連して、その結果定量化されることになるであろう転写された遺伝子への参照として意図される。定量化のいくつかの事情では、RNA標準は、定量化に直接用いられる興味のある遺伝子のRNAまたはcDNAそのものの一部と同じ配列を有するDNA標準で代替され得ることが理解されるであろう。本発明はいかなる理論または作用機序にも拘泥されることなく、標準として使用されるために好適な遺伝子は好ましくは高レベルで発現される。さらにより好ましくは、発現のレベルは試料の起源の組織に影響されない。しかしながら、当業者に知られるように、これらの基準の両方を満たす遺伝子はわずかしかない。このため、代替的なアプローチは、標準遺伝子のパネルを分析することである。一般に標準遺伝子と参照遺伝子は2つの別々な遺伝子となるであろう。しかしながら、標準および参照の両方のために同じRNA種を使用し得ることも考えられる。
【0077】
「試料」への参照は生物学的試料または非生物学的試料への参照として理解されるべきである。非生体試料の例は、例えば合成で生産された核酸群の核酸製品を含む。「生体試料」への参照は、細胞材料、血液、粘液、糞、尿、組織生検標本、動物の生体に導入されてその後に除去される流体(例えば、肺洗浄に続いて抽出された食塩水、浣腸洗浄から取り出された液など)、種子、花などの植物材料または繁殖材料または微生物コロニーなどの、しかしこれらに限定されない、動物、植物または微生物(微生物の培養物を含む)由来の生体試料のいかなる試料への参照として理解されるべきである。本発明の方法によって試験される生体試料は、直接試験されるか、または試験の前に何らかの形式の処置を必要とし得る。例えば、生検標本は試験の前に均質化を必要とし得るか、またはそれはインシトゥ試験のために区分することを必要とし得る。さらに、生体試料が液体の形態(そのような形態が試験に必要とされる場合)でない範囲で、試料を動員するためにバッファーなどの試薬を添加する必要があり得る。
【0078】
標的RNAが試料中に存在する範囲で、試料は直接試験され得るか、または試料中に存在する核酸材料のすべてかまたはいくつかが、試験前に単離され得る。例えば生存ウイルスの不活性化またはゲル状の移動といった、試験前に予備処理されるべき標的核酸分子は本発明の範囲内である。試料は新たに採取され得るか、または試験前に保管され得るか(例えば、冷凍により)、または試験前に他に処理され得る(培養に供されるなど)ことが理解されるべきである。
【0079】
本明細書に開示された方法による試験のためにどの型の試料が最も適しているかの選択は、モニターされる状態の特性などの、状況の特性に依存するであろう。例えば、一の実施形態において、腫瘍性症状が分析の対象となる。腫瘍性症状が白血病であれば、血液試料、リンパ液試料または骨髄吸引がおそらく適当な検査試料を提供するであろう。腫瘍性症状がリンパ腫であるところでは、リンパ節生検、血液または骨髄の試料がおそらく試験するための組織の適当な源を提供するであろう。腫瘍性細胞の起源をモニターするかどうか、または起源の点からの転移または他の形態の新生物の拡散の存在がモニターされるかどうか、の必要性に関して考慮が必要であろう。この点で、いかなる一つの哺乳動物からの多くの異なるサンプルを採取して試験することが、好ましいであろう。いかなる検出シナリオのための適切なサンプルの選択が、当業者の技能に該当するであろう。
【0080】
本明細書で使用される範囲での、「哺乳動物」なる用語は、ヒト、霊長類、家畜動物(例えば、馬、牛、羊、豚、ロバ)、実験動物(例えば、マウス、ラット、ウサギ、モルモット)、コンパニオンアニマル(例えば、犬、猫)、および捕獲された野生動物(例えば、カンガルー、鹿、キツネ)を含む。好ましくは、哺乳動物はヒトまたは実験動物である。より好ましくは、哺乳動物はヒトである。
【0081】
本発明には、現行法と比べて、いくつかの利点がある。定性的のみの後者と異なり、本発明の方法は、定量的であり、その結果、
図3に示されるように、広い範囲の分解上で、試料中の興味のあるRNA分子の総数を定量化することを可能にする。それは、非常に少量のRNAだけが必要であるように、非常に敏感である。感度に関するデータは実施例1に示される。
【0082】
本発明の他の利点は、試料のRNA完全性の定量的尺度を決定すること、および、その後に増幅プロトコルを使用する必要なしに、興味のある遺伝子のRNA発現レベルを正確に定量化することの両方のための手段を提供することである。多くのRNA分析プロトコルがPCRの適用に基づくが、RNAは実際に核酸増幅を伴わない多くの方法で定量化できる。本発明の方法がいかなるRNA分析プロトコルに首尾良く適用でき、RNAの相対的または絶対的定量化が分解について訂正されることを可能にする事実は、これまで利用可能でなかった重要な進歩である。いかなる方法でも本発明を限定することなしに、その分解が結果に影響するRNAセグメント(値L)の「分解関連」または「臨界的な」長さの変化が、ハイブリダイゼーションがRNA鎖に沿った一点で起こり、RNA鎖に沿った可変距離での他の点を含むいかなる方法、例えば下記の方法、でも起こるであろう。
【0083】
1.マイクロアレイ
DNAプローブは固体表面にスポットされ、蛍光でラベルされたRNAと接触される。理論的に、参照遺伝子に沿った2つ以上の配列に対応する場所で蛍光を定量化することによって、マイクロアレイで分解を完全に測定できるが、これは、非常に煩雑であり、不正確である。ほぼ確実に、分解は限定的なマイクロアレイ研究の前に独立した技術で定量化されるであろう。興味のあるRNAおよび内部標準の定量化での分解の相対的な効果は、RNAが単離されてハイブリダイズされる手段および分解の測定の両方により決定されるであろう。次に、RNAが各々の2つのRNA種のためにポリTで捕捉されるならば、ポリA配列およびプライマーがハイブリダイズする配列との間の距離は定量化に影響するであろう。RNAが無作為のプライミングでcDNAに変換されたならば、2つのハイブリダイズする配列の相対的な長さは定量化の結果に影響するであろう。
【0084】
2.ナノストリング
各種のRNAは、遺伝子に固有の捕捉プローブで捕捉され、蛍光でラベルされたレポータープローブとハイブリダイズされ、電気泳動される。理論的に、分解は、各々が参照RNAの異なる配列にハイブリダイズする数個のレポータープローブを用いる本技術で定量化できるであろう。しかしながら、実際には、限定的なナノストリング研究の前に独立した方法で劣化を決定することが、はるかに簡単であろう。次に、興味のあるRNAおよび内部標準の定量化での分解の相対的な効果は、分解の尺度および、各々の興味のあるRNAおよび標準のRNAのために、捕捉プローブのハイブリダイゼーション配列およびレポータープローブのハイブリダイゼーション配列を含む、それらの間のRNAの長さにより決定されるであろう。
【0085】
3.SAGE
この技術には多くの種類がある。RNAは、ポリTで捕捉され、次に制限酵素によって消化される。次に、操作の複雑な配列が続き、最終的な結果は酵素切断部位の次の配列が配列決定により同定される。定量化はこの配列が明示される回数に基づく。
【0086】
実際には、参照遺伝子の研究による分解の定量化はSAGEで実用的ではなく、独立した技術が必要である。次に、興味のあるRNAおよび内部標準の定量化での分解の相対的な効果は、分解の尺度および、各々の興味のあるRNAおよび標準のRNAのために、ポリA配列および制限酵素切断配列を含む、それらの間のRNAの長さにより決定されるであろう。
【0087】
4.RNAシークエンシング
莫大な数の読み取りを得ることができる高スループットRNAシークエンシングは、RNA定量化にますます利用されている。最終的な定量化は、完全なおよび分解RNAの両方を認識し、外部標準の必要性なしで絶対数を提供する。しかしながら、シークエンシングによる定量化を準備する予備操作が、分解に影響する、ポリT捕捉による陽性選択などの長さに依存する工程に関すると、複数のRNA分子の複数のセグメントの読み取りの数を定量化することにより、または参照遺伝子を含む別個の方法を用いることにより、分解を測定する必要が生じる。
【0088】
5.核酸増幅(例えばPCR)
分解の程度は、異なる長さの2以上のアンプリコンを増幅することによって、またはRNAがポリTで捕捉されているならば2つ以上の別個のアンプリコンを増幅することによってのいずれかで、簡単におよび便利に参照遺伝子のqPCRにより測定される。
【0089】
興味のあるRNA分子および内部標準の定量化での分解の相対的な効果は、分解の尺度、および各々の興味のあるRNAおよび標準RNAのために、cDNAが生産される方法に依存する分解関連セグメントの長さの両方によって決定されるであろう。
【0090】
ポアソン統計
RNAの損傷は、傷害が下流の定量化によるその分子の検出を妨げるRNA分子への損傷と定義される状態で、1塩基あたりの傷害の平均数で定量化され得る。基本的な仮定では、傷害は無作為かつ独立して起こる。この仮定は、加水分解、加リン酸分解または熱力学的開裂、または付加物の生産によりRNAを損傷させる外部の物理的変化を生じさせるものまたは化学薬品を考慮すると、疑いがないように見える。しかしながら、RNAはまた多くの、エンドリボヌクレアーゼまたはエキソリボヌクレアーゼのいずれかのリボヌクレアーゼの作用で分解できる。エンドリボヌクレアーゼはいくつかの塩基または配列に特異性を示し得る。しかし、総RNA鎖との関係で、塩基および/または短い配列が無作為に生じるため、酵素活性は無作為であると見なすことができる。多くの酵素および様々なメカニズムがあるように、エキソリボヌクレアーゼの無作為性または非無作為性を評価することは難しい。しかしながら、大部分のエキソリボヌクレアーゼおよび大部分のRNA配列において、酵素によって分解されたRNA鎖は完全に分解され、我々はこれが非無作為の形式で起こるという説得力のある証拠を知らない。上記のことを考慮して、我々は、主要なRNA分解が無作為に起こるとみなす。
【0091】
定量化はRNA分子のセグメントの研究にのみかかわるので、このクリティカルセグメント内で塩基に影響する場合にだけ、損傷が大きい傷害は定量化に影響するであろう。このクリティカルセグメントの特性およびそこに含まれる塩基の数、Lと称される、は、RNA単離および定量化に使用される技術で決定される。特定の数の傷害がクリティカルセグメントに影響する確率は二項分布で説明される。RNAの傷害/塩基の平均数がrであれば、長さLのRNAセグメントに影響する傷害が全くないという確率は(1−r)
Lである。rが非常に小さいとき、ポアソン分布は良好な近似を二項分布に提供する。セグメントに全く傷害がないP(0)の確立はポアソン分布のゼロ項目(zero term)であり、分布の期待値μは鎖中の傷害の平均数である。
【0093】
もしNがmRNA分子の総数で、N
iが完全で定量可能な分子の数とすると、
【化20】
および
【化21】
【0094】
したがって、RNA分子の定数が、各々が異なるおよび既知の値のL(しかし同じ値のr)である、2つ以上の定量化を実施することによって検査されるならば、rの値は、ln(N
i)およびLの間の回帰直線の傾きと等しいものとして決定できる。デジタルPCRやRNAシークエンシングのようないくつかの方法は、N
iを絶対数として決定することを可能にするが、多くの場合ではN
iは絶対数として定義されず、むしろマイクロアレイおよびナノストリングでの蛍光、SAGEでの配列の数、または増幅法でのCqなどのようにユニットで測定されるであろう。しかしながら、任意のユニットと定量化された分子の数との関係は、rが決定されることをまだ可能にする。それゆえ、蛍光の強度がハイブリダイズした分子の数に比例しているならば:
【化22】
および、rは蛍光およびLの間の回帰直線の傾きの負の値に等しい。
【0095】
周期増幅方法について、
【化23】
ここで、N
tはしきい値における分子の数であり、aは各々の増幅サイクルの増幅定数に関する増幅効率であり、Cqはしきい値への繰返し数である。N
tは定数なので:
【化24】
再度変形して:
【化25】
それゆえ、
【化26】
【0096】
異なる値のLについて、選ばれた増幅系が効率的であれば、aは定数とみなすことができる。CqおよびLの間の回帰直線の傾きの決定は、rを
【化27】
として算出される。
【0097】
Lの値は
図1に示されるように、RNA単離および定量化に用いられる技術に依存する。ナノストリング技術による定量化では、Lは捕捉プローブにハイブリダイズされる配列の最も外側の塩基およびレポータープローブにハイブリダイズされる配列の最も外側の塩基の間の塩基数である。遺伝子発現連続分析(SAGE)による定量化では、LはポリdT捕捉プローブにハイブリダイズされる配列の最も外側の塩基および制限酵素切断部位のすぐで隣接する塩基の間の塩基数である。マイクロアレイ技術による定量化では、cDNAがプライマーとしてポリdTを使用してラベルされるならば、Lの値はマイクロアレイのポリdTプライマーにハイブリダイズされる配列の最も外側の塩基とDNAプローブにハイブリダイズされる配列の最も外側の塩基の間の塩基数であり、一方でcDNAが無作為のプライミングを使用してラベルされるなら、Lの値は無作為のプライマーがハイブリダイズされる平均点により定義された配列の最も外側の塩基およびマイクロアレイ上のDNAプローブにハイブリダイズされる配列の最も外側の塩基の間の塩基数である。ポリdTプライミングによるRNAおよびcDNA合成による定量化では、Lの値は読み取りの同じ鎖上の最も5’よりのTの塩基と最も3’よりの塩基の間の塩基数である。核酸増幅技術による定量化では、cDNAがポリdTまたは遺伝子特異的プライマーを使用することで生産されるならば、Lの値は、無作為のプライマーがハイブリダイズされる平均点により定義された配列の最も外側の塩基およびマイクロアレイ上のDNAプローブにハイブリダイズされる配列の最も外側の塩基の間の塩基数であるか、またはポリdTプライマーまたは遺伝子特異的プライマーとハイブリダイズされる配列の最も外側の塩基および上流のDNAプライマーにハイブリダイズされる配列の最も外側の塩基の間の塩基数であり、一方でcDNAが無作為のプライミングを使用してラベルされるなら、Lの値は無作為のプライマーがハイブリダイズされる平均点により定義される配列の最も外側の塩基と、上流のDNAの増幅プライマーにハイブリダイズされる配列の最も外側の塩基の間の塩基数である。
【0098】
いくつかの状況で、Lの値は定数の成分およびランダム成分からなり得る。Lの値は、RNAがプローブ捕捉により単離されるか、またはcDNAがポリdTまたは遺伝子特異的プライミングにより生産されるときに知られているが、cDNAが無作為のプライミングにより作製されるときは未知である。しかしながら、無作為のプライミングでは、
図2に示すように、長さLは2つの成分:無作為のプライマーから測定点まで伸びるcDNAの平均長を示す定数の成分、および測定に利用された配列を示す可変成分(長さlの)、から作製されるとみなすことができる。cDNAがマイクロアレイハイブリダイゼーションのための無作為のプライミングで作製されるとき、可変成分は、DNAプローブにハイブリダイズされる配列の長さである。cDNAがPCRまたは他の形式の核酸増幅によって定量化のための可変プライミングで作製されるとき、ランダム成分はアンプリコンの長さである。ポリdTまたは遺伝子固有のプライミングでは、Lの値は知られているが、いくつかの場合、同様にLを定数の成分および可変成分を有するとみなすことが都合がよい場合もある。cDNAの定数成分は、最も5’ T塩基寄りから、増幅の標的である最も基部に近い塩基まで伸び、各セグメントの末端の配列は可変成分である。再度:
【化28】
およびlは関係式においてLと置換でき、唯一の変更は定数の値の変化である、そして
【化29】
およびrはまたCqおよびlの間の回帰直線の傾きから
【化30】
のように算出できる。
【0099】
いったんrの値が知られると、RNA定量化の結果は分解で訂正できる。
【0100】
上記から見て、長さlの可変配列は長さLの分解関連配列の派生物として理解されるべきであり、この派生物が分解関連配列を代替でき、長さlが完全性に関連する関係式でLを代替することができることが理解されるべきである。
【0101】
大多数の場合、興味のあるRNA種は内部標準RNAに対して定量化される。N
testが試験RNAの分子の総数であれば、N
stanは標準RNAの分子の総数であり、「試験」は定量化された分子の数に比例する数として表現された試験RNAの定量化の結果であり、「標準」はまた、定量化された分子の数と同じ比例を有する数として表現される、標準RNAの定量化の結果であり:
【化31】
またそれゆえ
【化32】
または、lが利用可能な状況で、
【化33】
【0102】
RNA種の数は標準の結果を提供するために時々用いられる。この状況では、Lまたはlの平均長が使用されるべきである。
【0103】
少ないまれな場合では、興味のあるRNAは、同じRNAの外部標準との関係で定量化される。この場合、Lの値およびrの値は異なり得る。それゆえ:
【化34】
もしLの値が同じであれば:
【化35】
【0104】
本発明の方法は、さまざまな臨床および研究シナリオへの用途がある。例えば、RNA発現プロフィール(すなわち、数百または数千もの遺伝子を定量化する)を入手することは単一の遺伝子の発現を定量化するよりも非常に一般的に実施されている。研究の観点からは、細胞内プロセスで重要な遺伝子の、および細胞への外部物質の影響の、細胞内調節ネットワークの情報を提供できる。そのように得られた情報は、治療的介入に影響されやすいであろう標的を同定するか、または治療薬の活性の形態を解明し得る。診断の観点から、RNA発現プロファイリングは、白血病の新しいサブグループまたは他の形式のがんを同定でき、がんのいくつかの例で起源の組織を決定するための唯一の方法であり、それゆえ、適切な組織特異的処置が適用されることを可能にする。
【0105】
単一の遺伝子を定量化することに関して、慢性骨髄性白血病は特定のRNAが腫瘍特異的マーカーを提供する例であり、この病気では、BCR−ABLの定量化は、予後を決定するために、処理を誘導および調整するために使用される。
【0106】
上述の方法は、一般に、手動または自動化されたか半自動化されたシステムで実施できる。例えば、ロボットRNA発現プロファイリングシステムは、プロファイルの結果が、上述のように分解について自動的に訂正されるところで、RNAプロファイリングを実施するために構成できる。あるいは、訂正は以前の時間に取得されたRNAプロファイリングデータを訂正するための別々の段階として実施できる。そのような場合、訂正されていないRNA発現プロファイリングデータは、同じかまたは異なるコンピューターシステム上で、局所的に保存され得るか、または例えばインターネットなどの通信網を通して離れた位置のシステムから検索され得る。
【0107】
RNA発現プロファイリングデータの訂正(別々にまたは本質的に同時である、RNA発現プロファイリングデータの獲得)は、例えば、複数の遺伝子からの複数の転写産物のプロファイルをするときなどの、大きいデータセット上で自動的にまたは「バッチ」モード実施されるときに、特に有用である。
【0108】
一般に、本明細書に記載された方法は、それゆえシステムのユーザによって提供された入力に従って自動的にアッセイを実施するためのロボット部品を含み得るか含まないデータ処理システムで実現され得る。例として、一の実施形態において、データ処理システムは、
図6に示されるような32ビット、または64ビットのインテルアーキテクチャコンピューターシステム600などの標準のコンピューターシステムであり、
図6に示されるように、システム600で実行される方法は、システム600に関連づけられた非揮発性(例えば、固体素子またはハードディスク)ストレージ604に保存された1つ以上のソフトウェアモジュールまたは部品602の指示をプログラムする形式で実装される。しかしながら、方法は用途特定集積回路(ASIC)などの一つ以上の専用ハードウェア部品の形式で、および/または、例えばフィールドプログラミング可能なゲートアレイ(FPGA)などの構成可能なハードウェア部品のための構成データの形式で部分的にまたは完全に、代替として実装できる。
【0109】
図6に示されるシステム600は、ランダムアクセスメモリー(RAM)606、少なくとも1つのプロセッサー608、およびバス616によって相互接続されたすべての外部インターフェース610、612、614の標準のコンピューター部品を含む。外部インターフェースはそれらの少なくとも一つがキーボード318およびマウスなどのポインティングデバイスに接続されたユニバーサルシリアルバス(USB)インターフェース610、システム600によりアクセスできるRNA発現プロファイルデータを経由する、インターネットのようなコミュニケーションネットワーク620へシステム300を接続するネットワークインターフェースコネクタ(NIC)612を含む。システム300はまた、LCDパネルディスプレイ322などのディスプレイデバイスに接続するディスプレイアダプター314およびLinuxまたはMicrosoft Windowsなどのオペレーティングシステム624を含む多数の標準ソフトウェアモジュール626から630も含む。
【0110】
それゆえ、いくつかの実施形態において、部品602は:
(i)少なくとも1個のRNA分子の標準の定量化を示す保存されたRNA発現プロファイリングデータを検索するか、またはそうでなければ、アクセスする;
(ii)各々の該RNA分子の事象の完全性の定量的尺度を示す保存されたRNA完全性データを検索するか、またはそうでなければ、アクセスする;
(iii)RNA分子の分解関連セグメント(またはその派生物)に相当する1つ以上の長さを示す保存された長さのデータを検索するか、またはそうでなければ、アクセスする;および
(iv)RNA発現プロファイリングデータ、RNA完全性データおよび長さデータを処理して、該少なくとも1つのRNA分子の該定量化の訂正された値を示す訂正されたRNA発現プロファイリングデータを生成すること、
のために構成される。
【0111】
RNA発現プロファイリングデータまたはRNA完全性データ(または両方)はそれ自体がシステム600で生成されるか、または別のシステムから受け取られ得る。上述の通り、RNA分子(およびその長さ)の分解関連セグメントは、RNA発現プロファイリングデータを生成するために使用される発現プロファイリング方法で決定され、したがって、必ずそうでなければならないというわけではないが、後者は通常の長さのデータと関連して保存されるであろう。
【0112】
いくつかの実施形態において、部品602はシステム600を:
(i)参照遺伝子から転写されたRNA分子の事象、該事象の少なくともいくつかは破損している、を含む試料をアッセイし、該試料中の該RNA分子の複数のセグメントの各々の完全な事象の、相対的または絶対的な数の定量的尺度を決定し、該定量的尺度および該長さを示すアッセイデータを生成すること、ここで該セグメントはそれぞれ異なった長さを有する;および
(ii)該アッセイデータを処理して、決定された定量的尺度およびそれぞれ異なる長さの該セグメントとの間の関係に基づいて、該試料中の該RNA分子の事象の完全性の定量的尺度を示す完全性データを生成すること、
を生じるように構成される。
【0113】
いくつかの実施形態において、部品602はさらにシステム600を:
(iii)興味のあるRNAを定量化して、段階(ii)で算出された完全性の尺度および興味のあるRNAの対応する分解関連セグメントの長さを用いてこの結果を訂正すること、
を生じるように構成される。
【実施例】
【0114】
本発明はさらに以下の非限定的な実施例を参照して説明される。
【0115】
実施例
【表1】
【0116】
表1.分解の定量化に必要なmRNAの最小量への調査。実際には、研究に利用可能なmRNAの量はしばしば制限され、および/またはmRNAは多少分解され得る。これらの要素の両方が、相互作用し、mRNAを定量化する能力に影響し得る。この一連の実験では、mRNAは対照mRNAまたは加熱分解されたmRNAである。完全性は、GAPDH遺伝子を使用して測定された。完全性の対照見積もりは、分析されたRNAの最大級の塊の分析から得られ、Cqおよびアンプリコンの長さの間に信頼できる回帰直線を提供した最少の量のRNAの分析から、限界見積りを得た。分解を評価するための従来のRIN法は、分析に適当であるか、または不適当であるとしてRNA試料を分類するだけであり、少なくとも50pgのRNAを必要とし5〜6損傷/1000塩基以上を有するとして本発明で定量化されたRNAは、分析できない程度に分解していると結論する。本発明の方法はRINの欠点を克服した。RNAがわずかに分解された場合はわずかに鋭敏ではないが、総合的に、遺伝子特有のプライミングは無作為のプライミングより優れているように見えた。
【0117】
当業者は、本明細書に記載された発明が具体的に説明されたもの以外の変更および改変に影響されることを理解するであろう。本発明がそのようなすべての変更および改変を含むことが理解されるであろう。また、本発明はこの明細書に個別にまたはまとめて示されるか、または示された、段階、特徴、構成、および化合物のすべて、および前述の段階またはいかなる2つ以上の特徴のあらゆる組み合わせも含む。