IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニアの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-04
(45)【発行日】2024-09-12
(54)【発明の名称】がんを検出するための非コードRNA
(51)【国際特許分類】
   C12Q 1/6886 20180101AFI20240905BHJP
   G01N 33/536 20060101ALI20240905BHJP
   G01N 33/483 20060101ALI20240905BHJP
   G01N 33/574 20060101ALI20240905BHJP
   G01N 33/48 20060101ALI20240905BHJP
   G01N 27/62 20210101ALI20240905BHJP
   G01N 21/64 20060101ALI20240905BHJP
   C12Q 1/6813 20180101ALI20240905BHJP
   C12M 1/34 20060101ALI20240905BHJP
【FI】
C12Q1/6886 Z
G01N33/536 D ZNA
G01N33/483 C
G01N33/574 D
G01N33/48 P
G01N27/62 V
G01N21/64 F
C12Q1/6813 Z
C12M1/34 Z
【請求項の数】 17
(21)【出願番号】P 2020524429
(86)(22)【出願日】2018-11-09
(65)【公表番号】
(43)【公表日】2021-01-28
(86)【国際出願番号】 US2018060113
(87)【国際公開番号】W WO2019094780
(87)【国際公開日】2019-05-16
【審査請求日】2021-11-09
(31)【優先権主張番号】62/584,899
(32)【優先日】2017-11-12
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】506115514
【氏名又は名称】ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア
【氏名又は名称原語表記】The Regents of the University of California
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(72)【発明者】
【氏名】グッダルジ, ハニ
【審査官】野村 英雄
(56)【参考文献】
【文献】特開2014-003925(JP,A)
【文献】RASOOL, M., et al.,"Non-coding RNAs in cancer diagnosis and therapy.",NON-CODING RNA RESEARCH,2016年11月11日,Vol.1, No.1,pp.69-76,DOI: 10.1016/j.ncrna.2016.11.001
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/00- 3/00
C12M 1/00- 3/10
JSTPlus/JMEDPlus/JST7580(JDreamIII)
PubMed
(57)【特許請求の範囲】
【請求項1】
良性、前悪性、または悪性の過剰増殖性細胞を有する対象を診断するための指標を得る方法であって、
前記対象由来の試料を、配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、および配列番号191から選択される任意の核酸に対する少なくとも90%の配列同一性を含むオーファン非コード核酸配列のうちの1つもしくは組み合わせに相補的な少なくとも1つの核酸分子に曝露することによって、前記試料中の少なくとも1つのオーファン非コードRNAまたはその断片の存在、非存在、および/または量を検出するステップを含み、
前記少なくとも1つのオーファン非コードRNAまたはその断片の存在、非存在、および/または量が、前記良性、前悪性、または悪性の過剰増殖性細胞を有する前記対象を診断するための指標となる、方法。
【請求項2】
前記試料を前記少なくとも1つのオーファン非コードRNAまたはその断片に特異的な1つまたは複数のプローブと接触させること、および前記試料中の前記量を対照試料から取られた測定値に正規化することを更に含む、請求項1に記載の方法。
【請求項3】
前記試料の全RNAを、配列番号1~配列番号201の配列のうちのいずれかを含む核酸配列のうちの1つまたは組み合わせに相補的な少なくとも1つのプローブに接触させることを更に含む、請求項1または2に記載の方法。
【請求項4】
前記試料の全RNAをT3pまたはその断片に相補的な少なくとも1つのプローブに接触させることを含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
対照試料中の前記少なくとも1つのオーファン非コードRNAまたはその断片の量の測定値に対する前記試料中の前記少なくとも1つのオーファン非コードRNAまたはその断片の量を、前記対象が良性、前悪性、または悪性腫瘍を有する確率または可能性に関連付けることを更に含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記良性、前悪性、または悪性の過剰増殖性細胞が、胸部組織由来である、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記試料が、
a)前記対象由来の血液または血清
b)前記対象由来の少なくとも1個の細胞で播かれたか、または播種された細胞の培養物から採取されるRNA
c)前記対象の血漿、血清、もしくは血液採取、ブラッシング、生検、または外科的切除による組織または液体試料を含むヒト組織試料、または
d)新たに取得された、ホルマリン固定された、アルコール固定された、かつ/またはパラフィン包埋された細胞
を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
試料中の少なくとも1つのオーファン非コードRNAまたはその断片の量を測定する前記ステップが、試料をデジタル画像化すること、試料をオーファン非コードRNAまたはその断片のエピトープに特異的な既知の量の標識抗体に曝露させること、試料をオーファン非コードRNAまたはその断片に特異的な1つまたは複数の色素に曝露させること、試料を前記オーファン非コードRNAまたはその断片の配列に相補的な少なくとも1つの標識プローブに曝露させること、試料をクロマトグラフィーに曝露させること、試料の全RNAを単離し、前記全RNAを配列解析に曝露させること、および/または前記試料を質量分析に曝露させることのうちの1つまたは組み合わせを含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
a)前記少なくとも1つのオーファン非コードRNAまたはその断片の存在、非存在、もしくは量に基づいて1つ以上のスコアを計算すること;ならびに
b)前記少なくとも1つのオーファン非コードRNAもしくはその断片の存在、非存在、もしくは量を前記1つ以上のスコアに関連付けることを含み、
対照試料中の前記少なくとも1つのオーファン非コードRNAもしくはその断片の量を超える、前記少なくとも1つのオーファン非コードRNAもしくはその断片の量が、前記良性、前悪性、または悪性の過剰増殖性細胞を有する対象を診断するための指標となる、請求項1~8のいずれか一項に記載の方法。
【請求項10】
試料中の少なくとも1つのオーファン非コードRNAまたはその相同配列の存在、非存在、および/もしくは量を検出する前記ステップが、化学発光プローブ、蛍光プローブ、および/または蛍光顕微鏡法を使用することを含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記試料中の少なくとも1つのオーファン非コードRNAまたはその相同配列の存在、非存在、および/もしくは量を検出する前記ステップが、前記試料の全RNAをT3pに相補的な少なくとも1つのプローブに接触させることを含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記試料中の少なくとも1つのオーファン非コードRNAまたはその相同配列の存在、非存在、および/もしくは量を検出する前記ステップが、前記試料の前記全RNAを、配列番号1~配列番号201の配列のうちのいずれかを含む核酸配列のうちの1つまたは組み合わせに相補的な少なくとも1つのプローブに接触させることを更に含む、請求項11に記載の方法。
【請求項13】
対象におけるがん細胞を検出する方法において使用するための、オーファン非コードRNA配列のうちの1つまたは組み合わせと相補的なプローブのうちの1つまたは組み合わせを含む組成物であって、前記方法が、
前記対象の試料を、前記プローブのうちの1つまたは組み合わせと接触させることによってオーファン非コードRNAが前記試料中に存在するかどうかを検出することを含むものである、組成物であって、
ここで、前記オーファン非コードRNA配列のうちの1つもしくは組み合わせは、列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、および配列番号191から選択される意の核酸に対する少なくとも90%の配列同一性を有する配列を含む、組成物。
【請求項14】
前記方法が、
前記1つのオーファン非コードRNAおよび/またはその断片の存在、非存在、もしくは量に基づいて1つ以上のスコアを計算すること;ならびに 前記オーファン非コードRNAおよび/もしくはその断片の量が対照試料中の前記オーファン非コードRNAおよび/もしくはその断片の量を超える場合、または前記オーファン非コードRNAおよび/もしくはその断片の量ががんを有することが既知の対象から採取された試料中の前記オーファン非コードRNAおよび/もしくはその断片の量と実質的に等しい場合、前記対象が、がんを有すると診断されるように、前記1つ以上のスコアを前記オーファン非コードRNAおよび/またはその断片の存在、非存在、もしくは量に関連付けることを更に含むものである、請求項13に記載の組成物。
【請求項15】
前記方法が、配列番号1~配列番号201のそれらの核酸配列、あるいは、配列番号1~配列番号201の配列のうちのいずれかに対する少なくとも90%の配列同一性を含む核酸配列のうちの1つまたは組み合わせから選択される、2つ以上のオーファン非コードRNAの存在を検出することまたはこれを定量化することを更に含むものである、請求項13または14に記載の組成物。
【請求項16】
請求項1~12のいずれか一項に記載の方法において使用するためのシステムであって、
(a)試料と、
(b)少なくとも1つのオーファン非コードRNAおよび/またはその断片に結合する1つまたは複数のプローブおよび/または染色剤と、
(c)前記オーファン非コードRNAおよび/またはその断片に結合する少なくとも1つのプローブまたは染色剤の存在、非存在、および/または強度を定量化することができる1つ以上の装置と、を含み、
前記少なくとも1つのオーファン非コードRNAおよび/またはその断片が、配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、および配列番号191から選択される核酸のうちのいずれかに対する少なくとも90%の配列同一性を含むものである、システム。
【請求項17】
前記試料が、乳癌を有するものとして同定されたかまたは有すると疑われる対象から採取される、請求項16に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、2017年11月12日に出願の米国特許仮出願第62/584,899号の優先権を主張し、その内容は、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は、一般に、試料中の非コード核酸配列の検出または定量化に基づいた試料中の非コードRNA分子の検出または対象の診断、具体的には、乳癌を含むがんの分子バイオマーカーの同定および使用に関する。
【背景技術】
【0003】
遺伝子発現分布の広範囲に及ぶ再プログラム化は、がん発生の特徴である。したがって、病理学的な遺伝子発現パターンを駆動する調節経路の系統的な同定は、がんの理解および処置に向けた重要なステップである。長年にわたって、多数の調節機構が、がん細胞の分化、生存、浸潤、および転移に関与する遺伝子の発がん性発現に関係付けられてきた。多数の研究が発がんの根底にある転写経路に焦点を置いてきたが、転写後調節経路も、このプロセスの主要な調節因子として明らかになってきた。例えば、遺伝子サイレンシングにおいて機能する低分子RNAのサブクラスであるマイクロRNA(低分子非コードRNA)は、乳癌進行の最初に特徴付けられた転写後調節因子の一つであった(1)。RNA結合タンパク質(RBP)も遺伝子発現の重要な転写後調節因子であり、いくつかの特異的なRBPが、発がんおよびがんの進行に影響を及ぼすことを示した(例えば2~5)。近年、低分子非コードRNAの他のクラスであるtRNA(6)およびtRNA断片(7)が、乳癌進行において根本的役割を果たすことが実証された。
【0004】
多様なレパートリーの調節機構ががんに関与しているにもかかわらず、それらの間で共有される特徴は、それらが細胞内の既存の経路を利用するか、または調節不全にするということである。換言すれば、がん細胞は、発がん経路を過剰に活性化するため、および腫瘍抑制性経路を下方調節するために、体細胞突然変異(例えばKRAS、8)、遺伝子融合(例えばBCR-ABL、9)、エピジェネティクス修飾(例えばプロモーターの高メチル化、10)、および調節機構の破壊(NFkB転写因子、10)などの無数の戦略を採用する(11、12)。これらの戦略が、既に存在する制御プログラムの病理学的な調節に依存する一方で、がん細胞が、腫瘍形成を駆動する特殊な制御経路を発達させるかまたは作りだすことができるというしばしば見落とされる可能性が存在する。
【発明の概要】
【課題を解決するための手段】
【0005】
記載される本発明は、乳癌などのがんの存在を示し、対象における乳癌を正確に診断するために使用され得るバイオマーカーとして機能する新規の低分子非コードRNAを提供する。いくつかの実施形態では、本発明の方法は、適切な試料中の細胞外循環低分子RNAの検出を含む。いくつかの実施形態では、試料は、ヒト血清試料である。いくつかの実施形態では、試料は、低分子非コードmRNAを含むエキソソームを含む分画されたヒト血清試料である。
【0006】
本発明はまた、血液または血清試料中の非コードRNAの存在を検出することに関する。いくつかの実施形態では、本開示は、対象における過剰増殖性細胞を検出するための方法であって、血清または血漿試料中の非コード核酸の非存在、存在、または量を検出することを含む方法に関する。いくつかの実施形態では、本発明の方法は、試料から全RNAを単離すること、および非コードmRNA配列の存在を検出すること、および非コードmRNAの量を対象が1つまたは複数の過剰増殖性細胞を含むかどうかの可能性に関連付けることを含む。いくつかの実施形態では、本発明の方法は、試料から全RNAを単離すること、および非コードmRNA配列の存在を検出すること、および非コードmRNAの量を対象が1つまたは複数のがん細胞を含むかどうかの可能性に関連付けることを含む。幾つかの実施形態では、本発明の方法は、試料から全RNAを単離すること、および非コードmRNA配列の存在を検出すること、および非コードmRNAの量を対象が1つまたは複数の固形腫瘍細胞を含むかどうかの可能性に関連付けることを含む。幾つかの実施形態では、本発明の方法は、試料から全RNAを単離すること、および非コードmRNA配列の存在を検出すること、および非コードmRNAの量を対象が1つまたは複数の乳癌細胞を含むかどうかの可能性に関連付けることを含む。
【0007】
幾つかの実施形態では、本明細書に記載の方法は、診断を判定するためのものであり、先に記載した方法により対象の血漿または血清試料に由来する試料から非コード核酸のうちの1つまたは組み合わせの存在を判定すること、および当該非コード核酸のうちの1つまたは組み合わせの存在に基づいて診断を提供することを含む。幾つかの実施形態では、判定される診断は、乳癌などのがんである。
【0008】
幾つかの実施形態では、コンピュータ実施方法は、非コード核酸のうちの1つまたは組み合わせの存在または非存在を判定するために使用され、先に記載した方法を実施することを含み、非コード核酸のうちの1つまたは組み合わせを含む1つまたは複数の試料からの参照物質の非コード核酸のうちの1つまたは組み合わせの存在量を定量化すること、1つまたは複数の試料中の非コード核酸のうちの1つまたは組み合わせの正規化された量を計算により判定すること、および当該正常化された量に基づいて非コード核酸のうちの1つまたは組み合わせの存在または非存在を判定すること含む。幾つかの実施形態では、問題の試料から単離された全RNAの試料を配列決定することを含む定量化。幾つかの実施形態では、計算解析は、全血または血清試料から得られる配列データに対して実行される。いくつかの実施形態では、先に記載したコンピュータ実施方法の結果は、出力であって、診断、例えば乳癌などの過剰増殖障害の診断であり得る出力である。他の実施形態では、追加の試料関連情報、例えば、試料中の既知の腫瘍抗原の存在または非存在に関する情報が出力され得る。出力は、本明細書に記載される種々の手段によるものであり得、例えば、結果は、例えばコンピュータ・モニターなどに視覚的に出力され得るか、または出力は、ハードコピー、例えば、印刷された紙のレポートなどであり得る。
本発明は、例えば以下の項目を提供する。
(項目1)
良性、前悪性、または悪性の過剰増殖性細胞を有する対象を診断する方法であって、
試料中の少なくとも1つの非コードRNAまたはその機能的断片の存在、非存在、および/または量を検出するステップを含む方法。
(項目2)
前記対象が、乳癌と診断されたかまたは疑われているヒトである、項目1に記載の方法。
(項目3)
前記検出するステップが、前記対象から試料を得るステップの後にある、項目1に記載の方法。
(項目4)
対象由来の試料を、配列番号1~配列番号201から選択される非コードRNAのうちの1つもしくは組み合わせ、または表1、2、および/もしくは3のうちの任意の核酸に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%の配列相同性を含む非コード核酸配列のうちの1つもしくは組み合わせに相補的な少なくとも1つの核酸分子に曝露することを更に含む、項目1~3のいずれか一項に記載の方法。
(項目5)
前記少なくとも1つの非コードRNAが、T3pまたはその機能的断片である、項目1~4のいずれか一項に記載の方法。
(項目6)
前記検出するステップが、BRCA遺伝子発現の存在、非存在、および/または量を検出することを更に含む、項目1~5のいずれか一項に記載の方法。
(項目7)
試料中の少なくとも1つの非コードRNAまたはその相同配列の存在、非存在、および/または量を検出する前記ステップが、前記試料を前記少なくとも1つの非コードRNAまたはその機能的断片に特異的な1つまたは複数のプローブと接触させること、および前記試料中の前記量を対照試料から取られた測定値に正規化することを含む、項目1~6のいずれか一項に記載の方法。
(項目8)
対照試料中の少なくとも1つの非コードRNAまたはその相同配列の量の測定値に対する前記試料中の少なくとも1つの非コードRNAまたはその相同配列の量を、前記対象が良性、前悪性、または悪性腫瘍を有する確率または可能性に関連付けることを更に含む、項目1~7のいずれか一項に記載の方法。
(項目9)
前記良性、前悪性、または悪性の過剰増殖性細胞が、胸部組織由来である、項目1~8のいずれか一項に記載の方法。
(項目10)
前記試料が、対象由来の血液または血清である、項目1~9のいずれか一項に記載の方法。
(項目11)
前記方法が、前記対象における基底または管腔がんのうちの1つまたは複数から選択される前悪性または悪性過剰増殖性細胞の存在を診断する、項目1~10のいずれか一項に記載の方法。
(項目12)
前記試料が、対象由来の少なくとも1個の細胞で播かれたか、または播種された細胞の培養物から採取される、項目1~11のいずれか一項に記載の方法。
(項目13)
前記対象由来の少なくとも1つの生検を、培養培地を用いて、対象の胸部組織由来の少なくとも1個の細胞を増殖させるのに十分な条件下かつ期間、培養することを更に含む、項目1~12のいずれか一項に記載の方法。
(項目14)
試料中の少なくとも1つの非コードRNAまたはその機能的断片の量を測定する前記ステップが、試料をデジタル画像化すること、試料を非コードRNAまたはその機能的断片のエピトープに特異的な既知の量の標識抗体に曝露させること、試料を非コードRNAまたはその機能的断片に特異的な1つまたは複数の色素に曝露させること、試料を前記非コードRNAまたはその機能的断片の配列に相補的な少なくとも1つの標識プローブに曝露させること、試料をクロマトグラフィーに曝露させること、試料の全RNAを単離し、前記全RNAを配列解析に曝露させること、および/または前記試料を質量分析に曝露させることのうちの1つまたは組み合わせを含む、項目1~6のいずれか一項に記載の方法。
(項目15)
前記試料由来の細胞の形態を解析することを更に含む、項目14に記載の方法。
(項目16)
前記試料が、対象の血漿、血清、もしくは血液採取、ブラッシング、生検、または外科的切除による組織または液体試料を含むヒト組織試料である、項目1~15のいずれか一項に記載の方法。
(項目17)
前記試料が、新たに取得された、ホルマリン固定された、アルコール固定された、かつ/またはパラフィン包埋された細胞を含む、項目1~16のいずれか一項に記載の方法。
(項目18)
試料中の少なくとも1つの非コードRNAまたはその相同配列の存在、非存在、および/もしくは量を検出する前記ステップが、化学発光プローブ、蛍光プローブ、および/または蛍光顕微鏡法を使用することを含む、項目1~17のいずれか一項に記載の方法。
(項目19)
前記試料中の少なくとも1つの非コードRNAまたはその相同配列の存在、非存在、および/もしくは量を検出する前記ステップが、前記試料の全RNAをT3pに相補的な少なくとも1つのプローブに接触させることを含む、項目1~18のいずれか一項に記載の方法。
(項目20)
前記試料中の少なくとも1つの非コードRNAまたはその相同配列の存在、非存在、および/もしくは量を検出する前記ステップが、前記試料の前記全RNAを、表1、2、および/または3における配列のうちのいずれかを含む核酸配列のうちの1つまたは組み合わせに相補的な少なくとも1つのプローブに接触させることを更に含む、項目19に記載の方法。
(項目21)
対象におけるがん細胞を検出する方法であって、
前記試料を、非コードRNA配列のうちの1つまたは組み合わせに相補的なプローブのうちの1つまたは組み合わせのある量と接触させることによって非コードRNAが前記試料中に存在するかどうかを検出することを含む、方法。
(項目22)
1つの非コードRNAまたはその相同配列の存在を検出するかまたはその量を定量化する前記ステップが、前記対象から試料を取得するステップの後にある、項目21に記載の方法。
(項目23)
前記方法が、
1つの非コードRNAおよび/またはその相同配列の存在、非存在、もしくは量に基づいて1つ以上のスコアを計算すること;ならびに
前記非コードRNAおよび/もしくはその機能的断片の量が対照試料中の非コードRNAおよび/もしくはその機能的断片の量を超える場合、または前記非コードRNAおよび/もしくはその機能的断片の量ががんを有することが既知の対象から採取された試料中の非コードRNAおよび/もしくはその機能的断片の量と実質的に等しい場合、前記対象が、がんを有すると診断されるように前記1つ以上のスコアを前記非コードRNAおよび/またはその機能的断片の存在、非存在、もしくは量に関連付けることを更に含む、項目21または22に記載の方法。
(項目24)
表1、2、および/もしくは3のそれらの核酸配列または表1、2、および/もしくは3の配列のうちのいずれかに対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%の配列相同性を含む核酸配列のうちの1つまたは組み合わせから選択される2つ以上の非コードRNAの存在を検出することまたはこれをを定量化することを更に含む、項目21~23のいずれか一項に記載の方法。
(項目25)
前記試料が、対象の血清もしくは血漿もしくは血液採取、ブラッシング、生検、または外科的切除による組織を含むヒト組織試料である、項目21~24のいずれか一項に記載の方法。
(項目26)
前記試料が、新たに取得された、ホルマリン固定された、アルコール固定された、かつ/またはパラフィン包埋された細胞からの全RNAを含む、項目21~25のいずれか一項に記載の方法。
(項目27)
試料中の非コードRNAおよび/またはその断片のうちの少なくとも1つの量を定量化する前記ステップが、前記試料から全RNAを単離することを含む、項目21~26のいずれか一項に記載の方法。
(項目28)
相補的なプローブが1つであるかまたはT3pであるRNA配列である、項目21~27のいずれか一項に記載の方法。
(項目29)
前記試料が、血漿、血液または血清である、項目21~28のいずれか一項に記載の方法。
(項目30)
対象を乳癌と診断する方法であって、
(a)前記対象の試料中の非コードRNAおよび/またはその機能的断片の存在または量を、前記試料を非コードRNAおよび/またはその相同配列に特異的なプローブと接触させることによって検出または定量化すること;ならびに
(b)前記非コードRNAおよび/またはその相同配列の存在または量が、検出または定量化される場合に対象を乳癌と診断すること、を含む方法。
(項目31)
非コードRNAおよび/またはその相同配列の存在を検出するかまたはその量を定量化する前記ステップが、前記対象から試料を採取するステップの後にある、項目30に記載の方法。
(項目32)
ステップ(a)が、
非コードRNAおよび/またはその相同配列の存在、非存在、もしくは量に基づいて1つ以上のスコアを計算することを更に含み、
ステップ(b)が、
前記非コードRNAおよび/もしくはその相同配列の量が対照試料中の非コードRNAおよび/もしくはその相同配列の量を超える場合、または前記非コードRNAおよび/もしくはその相同配列の量が乳癌を有することが既知の対象から採取された試料中の非コードRNAおよび/もしくはその相同配列の量と実質的に等しい場合、前記対象が、乳癌を有すると診断されるように、前記1つ以上のスコアを非コードRNAおよび/またはその機能的断片の存在、非存在、もしくは量に関連付けることを更に含む、項目30または31に記載の方法。
(項目33)
がん抗原の存在を検出するかまたはその量を定量化することを更に含む、項目30~32のいずれか一項に記載の方法。
(項目34)
前記試料が、対象の血漿、血清もしくは血液採取、ブラッシング、生検、または外科的切除による細胞または組織を含むヒト組織試料である、項目30~33のいずれか一項に記載の方法。
(項目35)
前記試料が、新たに取得された、ホルマリン固定された、アルコール固定された、かつ/またはパラフィン包埋された細胞からの全RNAを含む、項目30~34のいずれか一項に記載の方法。
(項目36)
試料中の非コードRNAおよび/またはその相同配列のうちの少なくとも1つの量を定量化する前記ステップが、蛍光イメージングおよび/またはデジタルイメージングを使用することを含む、項目30~35のいずれか一項に記載の方法。
(項目37)
前記プローブが、フルオロフォアを任意に含む、T3pに相補的な1つまたは複数の核酸配列である、項目30~36のいずれか一項に記載の方法。
(項目38)
前記試料がヒト血清である、項目30~37のいずれか一項に記載の方法。
(項目39)
乳癌と診断されたかまたは疑われる治療の必要がある対象を治療する方法であって、
(a)非コードRNAおよび/またはその相同配列のうちの1つまたは組み合わせに特異的な1つまたは複数のプローブを試料と接触させるステップ;
(b)前記試料中の非コードRNAおよび/またはその相同配列の存在、非存在、または量を定量化するステップ;
(c)前記非コードRNAおよび/またはその相同配列の存在、非存在、または量に基づいて1つ以上のスコアを計算するステップ;
(d)前記非コードRNAおよび/またはその相同配列の量が対照試料中の非コードRNAおよび/またはその相同配列の量を超える場合、前記1つ以上のスコアを前記非コードRNAおよび/またはその相同配列の存在、非存在、または量に関連付けるステップであって、前記関連付けるステップが、対象を乳癌と診断することを含むステップ;ならびに
(e)前記乳癌に対する治療上有効量の処置薬を前記対象に投与するステップを含む方法。
(項目40)
がんを有すると診断されたかまたは疑われる治療の必要がある対象を治療する方法であって、
(a)非コードRNAおよび/またはその相同配列に特異的な1つまたは複数のプローブを試料と接触させるステップ;
(b)前記試料中の非コードRNAおよび/またはその相同配列の量を定量化するステップ;
(c)前記非コードRNAおよび/またはその相同配列の量に基づいて1つ以上のスコアまたは正規化された数値を計算するステップ;
(d)前記非コードRNAおよび/またはその相同配列の量が対照試料中の非コードRNAおよび/またはその相同配列の量を超える場合、前記1つ以上のスコアを前記非コードRNAおよび/またはその相同配列の量に関連付けるステップであって、前記関連付けるステップが、対象をがんと診断することを含むステップ;ならびに
(e)前記がんに対する治療上有効量の処置薬を前記対象に投与するステップを含む方法。
(項目41)
前記プローブが、表1、表2、および/または表3の配列のうちの1つまたは組み合わせから選択される核酸配列に相補的な1つまたは複数の核酸配列である、項目40に記載の方法。
(項目42)
1つで、基質に、フルオロフォア、化学発光剤および/または消光剤が含まれる、項目40に記載の方法。
(項目43)
システムであって、
(a)試料と、
(b)少なくとも1つの非コードRNAおよび/またはその相同配列に結合する1つまたは複数のプローブおよび/または染色剤と、
(c)前記非コードRNAおよび/またはその相同配列に結合する少なくとも1つのプローブまたは染色剤の存在、非存在、および/または強度を定量化することができる1つ以上の装置と、を含むシステム。
(項目44)
前記試料が、乳癌を有するものとして同定されたかまたは有すると疑われる対象から採取される、項目43に記載のシステム。
(項目45)
過剰増殖性細胞を含む試料の発生段階または病理を特徴づける方法であって、
(a)非コードRNAおよび/またはその相同配列に特異的な複数のプローブを試料と接触させるステップ;
(b)前記試料中の非コードRNAおよび/またはその相同配列の量を定量化するステップ;
(c)非コードRNAおよび/またはその相同配列の存在、非存在、または量に基づいて1つ以上の正規化されたスコアを計算するステップ;ならびに
(d)前記非コードRNAおよび/またはその相同配列の量が対照試料中の非コードRNAおよび/またはその相同配列の量を超える場合となるように、前記1つ以上のスコアを前記非コードRNAおよび/またはその相同配列の前記量に関連付けるステップであって、前記関連付けるステップが、前記試料を過剰増殖性細胞を含むと特徴付けることを含むステップを含む方法。
(項目46)
対象が悪性腫瘍を有するかどうか判定する方法であって、
前記対象由来の試料中の非コードRNAおよび/またはその相同配列の存在、非存在、または量を、前記試料を非コードRNAおよび/もしくはその相同配列に特異的なプローブならびに/または非コードRNAおよび/もしくはその相同配列に特異的な基質と接触させることによって検出することを含む方法。
(項目47)
前記対象由来の前記試料中の非コードRNAおよび/またはその相同配列の存在、非存在、または量を、前記試料を非コードRNAおよび/もしくはその相同配列に特異的なプローブならびに/またはT3pもしくはその機能的断片に特異的な基質と接触させることによって検出することを更に含む、項目46に記載の方法。
(項目48)
対象がBRCAを発現しているがんを有するかどうか判定する方法であって、
前記対象由来の試料中の非コードRNAおよび/またはその相同配列の存在、非存在、または量を、前記試料を非コードRNAおよび/もしくはその相同配列に特異的なプローブならびに/または非コードRNAおよび/もしくはその相同配列に特異的な基質と接触させることによって検出することを含む方法。
【図面の簡単な説明】
【0009】
図1A】乳癌におけるがん特異的オーファン非コードRNAの発見、注釈付け、および検証を示す。図1Aは、乳癌株で有意に発現されているが、正常なHUMECでは有意に発現されていない437個の低分子非コードRNAの相対量を表わすヒートマップである。HUMECは三重反復で処理されたが、全ての他の細胞株は二重反復で分析された。図1Bは、(図1A)において同定された437個の低分子RNAのうち、201個がCancer Genome Atlas(TCGA-BRCA)の一部として収集された乳房腫瘍生検の低分子RNA遺伝子発現プロファイルにおいて有意に発現されており、またこれらの201が、このデータセットにおける約200個体から収集された隣接する正常組織にはほとんど存在しなかったことを示すヒートマップである。図1Cは、これらの201個のがん特異的低分子RNAが、オーファン非コードRNAまたはoncRNAとして分類され、4種の正常な上皮試料および10種の患者由来異種移植片モデルからの低分子RNAプロファイルを比較する第3のデータセットで独立して検証されたことを示すヒートマップである。
図1B】同上。
図1C】同上。
図2A】オーファン低分子RNAが、がん細胞において相対的に豊富であり、正常組織ではほとんど検出されないことを示す。図2Aにおいて、がん特異的低分子RNAを同定するために、正常細胞/組織においてはほとんど存在しないが、がん細胞において一般に発現されているRNAが探索された。かかるRNA種は、以下の2つの独立した供給源から同定された:(i)HUMECと比較した乳癌細胞株のプロファイル、および(ii)約200個の正常組織生検および約1000個の腫瘍試料を有するThe Cancer Genome Atlasデータセット(TCGA-BRCA)。次いで、これらの2つの独立したセットは、オーファン非コードRNA(oncRNA)を同定するために重ね合わせられた。図2Aに示すように、強い重複がこれらの2つ解析間で見られた(超幾何検定、P値約0)。図2Bにおいて、201個のoncRNAの全存在量が、4個の正常上皮試料および10個のPDXモデルに対して計算された。図2Bに示すように、全oncRNA発現は、試料ががん性であるかまたは正常であるかを完璧に予測することができる(AUCおよびAUPRCの両方が1.0に等しい)。
図2B】同上。
図3A】oncRNA T3pが乳癌進行と強く関連することを示す。図3Aは、低転移性乳癌細胞におけるoncRNAの発現を、それらの高転移性派生株に対して比較するボルケーノプロットである。高転移性細胞において有意に上方調節されているoncRNA T3pが強調されている。図3Bは、T3pが、テロメラーゼのRNA成分であるTERCの3’末端(CR7ドメイン)に位置付けられることを示す概略図である。図3Cは、TCGA-BRCAデータセットの乳房腫瘍生検およびその対応する正常組織におけるT3p(cpm)の発現を示す。対応のあるウィルコクソン検定を使用して関連P値を計算した。図3Dは、TCGA-BRCAデータセット全体でのT3p発現を示す。図3Eは、腫瘍におけるT3pの発現に基づいて層化された患者についてのTCGA-BRCAデータセットの生存率解析を示す。上および下から3分の1の試料がこの解析に含まれた(ログランク検定)。図3Fは、TCGA-BRCAデータセットにおける、正常試料、ステージI、およびステージIIまたはIII試料の間のT3pの発現を示す(*:P<0.05;***、P:<0.001;マン・ホイットニー検定を使用)。
図3B】同上。
図3C】同上。
図3D】同上。
図3E】同上。
図3F】同上。
図4A】oncRNA T3pが高悪性度の乳癌と関連することを示す。図4Aは、試料タイプ(正常対乳癌)に基づいたTCGA-BRCAデータセット内の試料数の集計を示す。各分割表に不随するフィッシャー正確検定カイ二乗検定も含まれる。図4Bは、TCGA-BRCAデータセット内の患者の、それらのT3pが腫瘍生検で検出されたかどうかに基づく層別化を示す。生検でのT3pのわずかな検出でも、乳癌における悪い生存率と関連する(pはログランク検定に基づいて計算された)。図4Cは、ER、PR、またはHER2状態に基づいて分割されたTCGA-BRCA試料におけるT3p発現レベルの比較を示す。図4Dは、T3pが乳癌PDXモデルにおいて有意に発現されていることを示す(***:P<0.001;マン・ホイットニー検定)。
図4B】同上。
図4C】同上。
図4D】同上。
図5】T3pが転移性進行を促進することを示す。anti-T3p LNAによって引き起こされた遺伝子発現の変化は、(i)スクランブルLNAまたは(ii)anti-TERC(しかし、T3pではない)LNAのどちらの対照が使用されるかにかかわらずほとんど同等である。ピアソン相関係数および関連P値が含まれる。
図6A】遺伝子発現調節因子および転移性進行の促進要因としてのT3pを示す。図6Aは、MDA-LM2細胞においてanti-T3p LNAによって引き起こされた遺伝子発現の変化のMDA-MB-231細胞におけるT3p模倣物に対する比較を示す。付随するピアソン相関(P値約0)が報告されている。図6Bは、anti-T3p LNA(LNA-T3p)またはスクランブルLNA(LNA-Scr)を用いて形質移入されたMDA-LM2細胞による肺転移の生物発光イメージングプロットを示す(各コホートにおいてn=4または5)。統計的有意性は、2元配置ANOVAを使用して測定された。各マウスについての曲線下面積も計算された(正規化された肺の光子束掛ける経過した日数の変化)。エラーバーは、平均値の標準誤差を示す。**:片側マン・ホイットニー検定によるP<0.01。図6Cは、各コホートからの3匹のマウスにおいて計数された可視的な転移性結節の数を視覚的に示す。右のパネルは、各コホートからのヘマトキシリン-エオシン染色法(H&E)で染色された代表的肺切片を中央値カウント数と共に示す。エラーバーは、平均値の標準誤差を示す。*:片側マン・ホイットニー検定によるP<0.05。
図6B】同上。
図6C】同上。
図7A】エキソソームコンパートメントにおけるoncRNAの系統的プロファイリングを示す。図7Aは、oncRNAの大部分が、MDA-MB-231細胞から収集されたエキソソーム低分子RNAデータにおいて検出されたが、正常HUVEC細胞では検出されなかったことを示す。図7Bは、乳癌細胞株および正常HUMECから収集されたエキソソームRNAの低分子RNAプロファイリングを示す。細胞外集団間のoncRNAの検出を示すヒートマップを示す。図7Cは、ステージIIおよびIIIの疾患を有する乳癌患者から収集された血清試料におけるoncRNAの検出を示す。評価の基準として、独立した研究の11人の健常な個体からのデータが、参照として使用されている。
図7B】同上。
図7C】同上。
図8A】T3pがエキソソームおよび循環コンパートメントにおいて検出され得ることを示す。図8Aは、以前に公開された低分子RNA-seqデータ(7)および定量RT-PCRにおける、低転移性の親細胞と比較した高転移性MDA-LM2細胞におけるT3p上方調節の検証の結果を示す(各試料においてn=6、**:P<0.01の;両側マン・ホイットニー検定を使用。図8Bは、T3pが患者から収集された血清の絶対多数において高レベルで検出され得、健常な個体から収集された血清試料において非常に低いレベルで存在する(または検知されない)ことを示す。
図8B】同上。
図9A】oncRNA T3pが高悪性度の乳癌と関連することを示す。図9Aは、X軸の示された細胞株の低分子RNA配列決定による正規化されたT3p発現を示す。全てのがん株は、生物的に三重反復でおよびHMECは生物的に二重反復で調製および処理された。サブタイプによって形状分けされる細胞株:HMEC(パネルの左側の円)、3重に陰性の乳癌(TNBC;パネルの中央の正方形、三角形、およびダイヤモンド)、HER2陽性(パネルの右側の円および正方形)、および管腔(パネルの右側の三角形)。図9Bは、ER、PRまたはHER2の状態に基づいて分割されたTCGA-BRCA試料におけるT3p発現レベルの比較を示す(それぞれ、n=1033、1030および715)。各コホートについて平均値±標準偏差を示す。図9Cは、2つの低転移性および2つの高転移性乳癌PDXモデルにおけるqRT-PCRによって測定された相対的T3p発現を示す。
図9B】同上。
図9C】同上。
図10A】T3pが細胞外および循環コンパートメントにおいて検出され得ることを示す。図10Aは、T3pが、7/8の乳癌細胞株からの細胞外小胞(EV)から単離された配列決定された低分子RNAに存在したが、HMEC EVには存在しなかったことを示す。試料は、生物的に反復して処理および調製され、百万リード当たりのカウント数の計算の前に集約された。サブタイプによって形状分けされる細胞株:HMEC(X軸上で左から見て最初の列)、3重に陰性の乳癌(TNBC;HMECの右隣の4列)、HER2陽性(試料のうちのHER2セットの右隣の2つのカラム)、および管腔(グラフの最も右側の最後の2つのカラム)。図10Bは、全細胞内(IC)コンパートメントと全細胞外(CM)コンパートメントとの間の、およびICと細胞外小胞(EV)コンパートメントとの間のoncRNA発現レベルのピアソン相関係数を示す。細胞株当たりn=2の生物的に独立した実験。図10Cは、TCGA-BRCAデータセットのoncRNA発現レベルで訓練され、健常ボランティアまたは乳癌患者(GSE49035)からの血清試料で試験された勾配ブースティング分類器の分類性能を示す10本のブートストラップベースの受信者動作特性(ROC)曲線を示す。図10Dは、T3pが患者から収集された血清の絶対多数において高レベルで検出され得るが、健常な個体から収集された血清試料においては非常に低いレベルで存在する(または検知されない)ことを示す。右のパネルは、個々の乳癌患者から収集された血清のT3pレベルを示す。n=40の生物的に独立した試料。平均値±平均値の標準誤差を示す。P値は、両側マン・ホイットニー検定を使用して計算された。図10Eは、T3pが患者から収集された血清の絶対多数において高レベルで検出され得るが、健常な個体から収集された血清試料においては非常に低いレベルで存在する(または検知されない)ことを示す。右のパネルは、個々の乳癌患者から収集された血清のT3pレベルを示す。n=40の生物的に独立した試料。平均値±平均値の標準誤差を示す。P値は、両側マン・ホイットニー検定を使用して計算された。ブートストラップROC曲線(10回)は、TCGA-BRCAデータセット内のmiRNA発現で訓練され、健常ボランティアまたは乳癌患者からの血清試料で試験された勾配ブースティング分類器について生成された(データ非表示)。
図10B】同上。
図10C】同上。
図10D】同上。
図10E】同上。
図10F】同上。
【発明を実施するための形態】
【0010】
本開示は、乳癌の存在を示し、対象の乳癌を正確に診断または段階分けするために使用され得るバイオマーカーとして機能する新規の低分子非コードRNAを提供する。幾つかの実施形態では、本発明の方法は、適切な試料中の細胞外循環低分子RNAの検出を伴う。
【0011】
定義
本発明を詳細に記載する前に、本明細書において使用されるある種の用語の定義を提供する。
【0012】
特に定義しない限り、本明細書において使用される技術用語および科学用語は、本発明が属する技術分野の当業者により一般的に理解される意味と同じ意味を有する。例えば、Singleton et al.,Dictionary of Microbiology and Molecular Biology 2nd ed.,J.Wiley & Sons(New York,NY 1994)は、本出願において使用される用語の多くの一般的な手引きを当業者に提供する。更に、本発明の実施は、特に明記しない限り、当業者の技能範囲内にある分子生物学(組換え技術を含む)、微生物学、細胞生物学、および生化学の従来技術を使用する。かかる技術は、“Molecular Cloning:A Laboratory Manual”,2nd edition(Sambrook et al.,1989)、“Oligonucleotide Synthesis”(M.J.Gait,ed.,1984)、“Animal Cell Culture”(R.I.Freshney,ed.,1987)、“Methods in Enzymology”(Academic Press,Inc.)、“Handbook of Experimental Immunology”,4th edition(D.M.Weir & C.C.Blackwell,eds.,Blackwell Science Inc.,1987)、“Gene Transfer Vectors for Mammalian Cells”(J.M.Miller & M.P.Calos,eds.,1987)、“Current Protocols in Molecular Biology”(F.M.Ausubel et al.,eds.,1987)、および“PCR:The Polymerase Chain Reaction”,(Mullis et al.,eds.,1994)などの文献において詳細に説明されている。
【0013】
本開示および特許請求の範囲において使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」には、明確に特記しない限り複数形も含まれる。
【0014】
実施形態が用語「含む」を用いて本明細書に記載されている場合は、「からなる」および/または「本質的にからなる」という言葉で記載された別様の類似した実施形態もまた提供されていると理解されよう。更に、実施形態が用語「本質的にからなる」を用いて本明細書に記載されている場合は、「からなる」という言葉で記載された別様の類似した実施形態もまた提供されていると理解されよう。
【0015】
本明細書において「Aおよび/またはB」などの語句で使用される場合、用語「および/または」は、AおよびB;AまたはB;A(単独);およびB(単独)を含むことを意図する。同様に、「A、Bおよび/またはC」などの語句で使用される場合、用語「および/または」は、以下の具体的表現の各々を包含することを意図する:A、BおよびC;A、BまたはC;AまたはC;AまたはB;BまたはC;AおよびC;AおよびB;BおよびC;A(単独);B(単独);およびC(単独)。
【0016】
本明細書で使用する場合、用語「約」または「ほぼ」は、所与の値または範囲の5%以内、4%以内、3%以内、2%以内、1%以内を指すことを意味する。
【0017】
本明細書で使用する場合、用語「抗体」は、少なくとも1つの抗原結合部位によってタンパク質、ポリペプチド、ペプチド、炭水化物、ポリヌクレオチド、脂質、または前述の組み合わせなどの標的を認識し、特異的に結合する免疫グロブリン分子を指す。本明細書で使用する場合、上記用語は、抗体が所望の生物学的結合活性を示す限り、インタクトポリクローナル抗体、インタクトモノクローナル抗体、一本鎖抗体、抗体断片(例えばFab、Fab´、F(ab´)2、およびFv断片)、単鎖Fv(scFv)抗体、二重特異性抗体などの多特異性抗体、単一特異性抗体、一価抗体、キメラ抗体、ヒト化抗体、ヒト抗体、抗体の抗原結合部位を含む融合タンパク質、および抗原結合部位を含む任意の他の改変された免疫グロブリン分子を包含する。抗体は、それぞれα、δ、ε、γ、およびμと称されるそれらの重鎖定常ドメインの同一性に基づいて、免疫グロブリンの以下の5つの主要なクラスのいずれかであり得る:IgA、IgD、IgE、IgG、およびIgMまたはそのサブクラス(アイソタイプ)(例えば、IgG1、IgG2、IgG3、IgG4、IgA1およびIgA2)。免疫グロブリンの異なるクラスは、異なるかつよく知られたサブユニット構造および三次元配置を有する。抗体は、裸であるか、または毒素および放射性同位体を含むがこれらに限定されない他の分子に複合化され得る。
【0018】
用語「抗体断片」は、インタクトな抗体の一部を指し、インタクトな抗体の抗原決定可変領域を指す。抗体断片の例としては、Fab、Fab´、F(ab´)2、およびFv断片、直鎖状抗体、一本鎖抗体、ならびに抗体断片から形成される多特異性抗体が挙げられるが、これらに限定されない。本明細書で使用する場合、「抗体断片」は、少なくとも1つの抗原結合部位またはエピトープ結合部位を含む。抗体の「可変領域」という用語は、単独または組み合わせの抗体軽鎖の可変領域または抗体重鎖の可変領域を指す。重鎖または軽鎖の可変領域は、一般に、「超可変領域」としても既知の3つの相補性決定領域(CDR)によって連結された4つのフレームワーク領域(FR)からなる。各鎖のCDRは、フレームワーク領域によって近接してまとめられ、抗体の抗原結合部位の形成に寄与する。CDRを決定するために、以下の少なくとも2つの技術が存在する:(1)異種間の配列多様性に基づいた手法(すなわち、Kabat et al.,1991,Sequences of Proteins of Immunological Interest,5th Edition,National Institutes of Health,Bethesda,MD)および(2)抗原抗体複合体の結晶学的研究に基づいた手法(Al-Lazikani et al.,1997,J.Mol.Biol.,273:927-948)。加えて、これらの2つの手法の組み合わせは、CDRを決定するために当該技術分野において時々使用される。
【0019】
本明細書で使用する場合、用語「バイオマーカー」は、異なる濃度で個体に存在する、個体のがんの状態を予測する際に有用な生体分子を指す。バイオマーカーとしては、核酸、タンパク質、およびバリアント、ならびにこれらの断片が挙げられ得るが、これらに限定されない。バイオマーカーは、バイオマーカーをコードする全体もしくは一部分の核酸配列またはこのような配列の相補体を含むDNAであり得る。本発明に有用なバイオマーカー核酸には、関心対象の核酸配列のいずれかの全体または部分配列を含むDNAおよびRNAの両方が含まれると考えられる。
【0020】
本明細書で使用する場合、用語「体液」は、血液(または血漿もしくは血清などの血液の画分)、リンパ液、粘液、涙液、唾液、痰、尿、精液、便、CSF(脳脊髄液)、母乳、および腹水液を含む非コードRNA(ncRNA)を含む体液を指す。幾つかの実施形態では、体液は尿である。幾つかの実施形態では、体液はエキソソームを含む分画された血清である。
【0021】
本明細書で使用する場合、用語「がん」および「がん性」は、細胞集団が未制御の細胞増殖により特徴付けられる、哺乳動物における生理的状態を指すかまたは表現する。幾つかの実施形態では、がんは、乳癌である。
【0022】
本明細書で使用する場合、用語「関連付ける」または「関連付けること」は、2つの事象例の間の統計的関連性を指し、ここで、事象には数値、データセットなどが含まれ得る。例えば、事象が数値を伴う場合は、正相関(本明細書において「直接相関」とも称される)は、一方が増加するにつれて、他方も増加することを意味する。負相関(本明細書において「逆相関」とも称される)は、一方が増加するにつれて、他方は減少することを意味する。本発明は、低分子非コードRNAを提供し、そのレベルは低分子非コードRNAのレベルと乳癌を発症する可能性との間などの特定の転帰の尺度と相関する。例えば、低分子非コードRNAのレベルの増加は、患者の良好な臨床転帰の可能性と負相関を示し得る。この場合、例えば、患者のがんの再発を伴わない長期生存の可能性および/または化学療法に対する陽性反応などは減少し得る。かかる負相関により、患者が予後不良を有するまたは化学療法に対する応答が不十分になる可能性が示され、これは、種々の方法で、例えばハザード比が高いことによって統計学的に実証され得る。
【0023】
本明細書で使用する場合、用語「高ストリンジェンシー」は、以下の条件を指す:(1)洗浄のために低イオン強度および高温、例えば50℃にて15mMの塩化ナトリウム/1.5mMのクエン酸ナトリウム/0.1%のドデシル硫酸ナトリウムを使用する条件;(2)ハイブリダイゼーション中にホルムアミドなどの変性剤、例えば、42℃にて5xSSC(0.75MのNaCl、75mMのクエン酸ナトリウム)中の50%(v/v)ホルムアミドと0.1%のウシ血清アルブミン/0.1%のフィコール/0.1%のポリビニルピロリドン/50mMのリン酸ナトリウム緩衝液(pH6.5)を使用する条件;または(3)ハイブリダイゼーション中に42℃にて5xSSC中の50%ホルムアミド、50mMのリン酸ナトリウム(pH6.8)、0.1%のピロリン酸ナトリウム、5xデンハルト溶液、超音波処理サケ精子DNA(50μg/ml)、0.1%のSDS、および10%の硫酸デキストランを使用し、0.2xSSCおよび50%のホルムアミドで42℃にて洗浄した後、55℃にてEDTAを含有する0.1xSSCからなる洗浄を行う条件。
【0024】
用語「過剰増殖障害」は、生物における細胞の異常増殖、異常成長、異常老化、異常な静止状態、異常な除去を特徴とする疾患または障害を指し、全ての形態の過形成、新形成、およびがんを含む。幾つかの実施形態では、過剰増殖疾患は、消化管または泌尿器系に由来するがんである。幾つかの実施形態では、過剰増殖疾患は、副腎、膀胱、骨、骨髄、脳、脊椎、胸部、頸部、胆嚢、神経節、消化管、胃、大腸、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、または子宮のがんである。幾つかの実施形態では、過剰増殖疾患という用語は、以下から選択されるがんである:肺癌、骨癌、CMML、膵癌、皮膚癌、頭頸部癌、皮膚黒色腫もしくは眼内黒色腫、子宮癌、卵巣癌、直腸癌、肛門部のがん、胃癌、大腸癌、乳癌、精巣腫瘍、婦人科腫瘍(例えば、子宮肉腫、卵管癌、子宮内膜癌、子宮頸癌、膣癌、または外陰癌)、ホジキン病、食道のがん、小腸のがん、内分泌系のがん(例えば、甲状腺、副甲状腺、または副腎のがん)、軟部組織肉腫、尿道のがん、陰茎のがん、前立腺癌、慢性もしくは急性白血病、小児期の固形腫瘍、リンパ球性リンパ腫、膀胱のがん、腎臓もしくは尿管のがん(例えば、腎細胞癌、腎盂癌)、または中枢神経系腫瘍、(例えば、中枢神経系原発リンパ腫、脊髄軸腫瘍、脳幹部神経膠腫または下垂体腺腫)。
【0025】
本明細書で使用する場合、2つ以上の核酸の文脈における用語「同一の」または「同一性パーセント」または「相同性」は、同一であるかまたは、なんらの保存的アミノ酸置換を配列同一性の一部とみなさずに最大の一致について比較およびアラインメント(必要に応じてギャップを導入)された場合に同一である特定の百分率のヌクレオチドまたはアミノ酸残基を有する2つ以上の配列または部分配列を指す。同一性パーセントは、配列比較ソフトウェアもしくはアルゴリズムを使用して、または目視検査により測定され得る。アミノ酸またはヌクレオチド配列の配列比較を取得するために使用され得る様々なアルゴリズムおよびソフトウェアは、当技術分野において周知である。これらとしては、BLAST、ALIGN、Megalign、BestFit、GCG Wisconsin Package、およびこれらのバリエーションが挙げられるが、これらに限定されない。幾つかの実施形態では、本発明の2つの核酸は、実質的に同一であり、これはそれらが、配列比較アルゴリズムを使用して、または目視検査により測定されるように最大の一致について比較およびアラインメントされた場合に、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、および幾つかの実施形態では、少なくとも約95%、96%、97%、98%、99%のヌクレオチドまたはアミノ酸残基配列同一性を有することを意味する。幾つかの実施形態では、同一性は、少なくとも約10、少なくとも約20、少なくとも約40~60ヌクレオチド、少なくとも約60~80ヌクレオチド、またはそれらの間の任意の整数値である配列の領域にわたって存在する。幾つかの実施形態では、同一性は、少なくとも約80~100ヌクレオチドなどの60~80ヌクレオチドより長い領域にわたって存在し、幾つかの実施形態では、配列は、比較されている配列の全長にわたって実質的に同一である。
【0026】
本明細書で使用される場合、用語「レベル」は、非コードRNA転写物のコピー数の定性的または定量的判定を指す。RNA転写物のレベルが第1の試料、例えば、臨床的に関連する患者の亜集団(例えば、がんを有する患者)において、第2の試料、例えば、関連する亜集団(例えば、がんを有さない患者)におけるよりも高い場合に、RNA転写物は「増加したレベル」を示す。個々の患者から取得した腫瘍試料におけるRNA転写物のレベルの解析の文脈において、対象におけるRNA転写物のレベルが臨床的に関連性のある患者の亜集団に特徴的なレベルに傾くまたはより密接に近づく場合、RNA転写物は、「増加したレベル」を示す。
【0027】
本明細書で使用する場合、用語「転移」は、新たな位置での同様のがん病変の発生を伴う、がんが、起源部位から身体の他の領域に広がるかまたは移るプロセスを指す。「転移性」または「転移している」細胞は、隣接する細胞と接着性接触を欠き、疾患の第一部位からの第二部位に(例えば、血流またはリンパ液を介して)移動するものである。
【0028】
本明細書で使用する場合、用語「モノクローナル抗体」は、単一の抗原決定基またはエピトープの非常に特異的な認識および結合に関与する均一な抗体集団を指す。これは、通常は、種々の異なる抗原決定基に対して作られた異なる抗体の混合物を含むポリクローナル抗体とは対照的である。用語「モノクローナル抗体」は、インタクトな、かつ全長のモノクローナル抗体、ならびに抗体断片(例えば、Fab、Fab´、F(ab´)2、Fv)、単鎖(scFv)抗体、抗体部分を含む融合タンパク質、ならびに抗原結合部位を含む任意の他の改変された免疫グロブリン分子を包含する。更に、「モノクローナル抗体」は、ハイブリドーマ産成、ファージ選択、組換え発現、およびトランスジェニック動物を含むがこれらに限定されない任意の数の技術によって作られるかかる抗体を指す。
【0029】
本明細書で使用する場合、非コードRNA転写物に関する用語「正規化された」は、参照RNA転写物のセットの転写物の平均レベルに対するRNA転写物のレベルを指す。参照RNA転写物は、患者、組織、または治療にわたるそれらの変動が最小であることに基づく。あるいは、非コードRNA転写物は、試験したRNA転写物またはそのような試験したRNA転写物のサブセットの全体に対して正規化され得る。
【0030】
「患者の応答」は、限定されるものではないが、(1)減速および完全な成長停止を含めた、腫瘍成長のある程度の阻害、(2)腫瘍細胞の数の減少、(3)腫瘍サイズの減少、(4)隣接する末梢器官および/または組織への腫瘍細胞の浸潤の阻害(すなわち、減少、減速または完全な停止)、(5)転移の阻害(すなわち、減少、減速または完全な停止)、(6)腫瘍の退縮または拒絶をもたらし得るが、もたらされなくてもよい抗腫瘍免疫応答の増強、(7)がんに付随する1つ以上の症状のある程度の軽減、(8)処置後の生存の長さの増加、および/または(9)処置後の所与の時点での死亡率の減少を含む、患者への利益を示す任意のエンドポイントを使用して評価され得る。
【0031】
用語「ポリヌクレオチド」ならびに「核酸」および「核酸分子」は、本明細書において互換的に使用され、任意の長さのヌクレオチドポリマーを指し、DNAおよびRNAが含まれる。ポリヌクレオチドは、デオキシリボヌクレオチド、リボヌクレオチド、修飾ヌクレオチドもしくは塩基、および/またはそれらの類似体、またはDNAまたはRNAポリメラーゼによってポリマーに組み込まれ得る任意の基質であり得る。
【0032】
用語「ポリペプチド」および「ペプチド」および「タンパク質」は、本明細書において互換的に使用され、任意の長さのアミノ酸のポリマーを指す。ポリマーは、直鎖または分枝鎖であり得、修飾アミノ酸を含み得、非アミノ酸によって中断され得る。上記用語は、自然に修飾されたかまたは介入、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、または標識成分との結合などの任意の他の操作もしくは修飾によって修飾されたアミノ酸ポリマーも包含する。また例えば、1つ以上のアミノ酸の類似体(例えば、非天然アミノ酸を含む)および当該技術分野において公知の他の修飾を含むポリペプチドも定義内に含まれる。本発明のポリペプチドは抗体または融合タンパク質に基づき得るため、ある種の実施形態では、ポリペプチドは単鎖または会合した鎖(例えば、二量体)として生じ得ると理解されよう。
【0033】
本明細書で使用する場合、用語「予後」は、乳癌などの腫瘍性疾患の再発、転移拡散、および薬剤耐性を含むがんに起因し得る死亡または進行の可能性の予測を指す。
【0034】
本明細書で使用する場合、用語「参照」RNA転写物は、そのレベルを試験試料中のRNA転写物のレベルと比較するために使用することができるRNA転写物を指す。本発明の実施形態では、参照RNA転写物としては、β‐グロビン、アルコールデヒドロゲナーゼなどのハウスキーピング遺伝子、または任意の他のRNA転写物が挙げられ、そのレベルもしくは発現は、RNA転写物を含有する細胞の疾患状態に応じて変動しない。別の実施形態では、アッセイされるRNA転写物またはそのサブセットの全ては、参照RNA転写物として機能し得る。
【0035】
本明細書で使用する場合、用語「低分子非コードRNA」(ncRNA)は、タンパク質に翻訳されないRNAを指し、転移RNA(tRNA)、リボソームRNA(リボソームRNA)、snoRNA、マイクロRNA(miRNA)、siRNA、核内低分子(snRNA)、Y RNA、ヴォールトRNA、アンチセンスRNA、tiRNA(転写開始RNA)、TSSa-RNA(転写開始部位関連RNA)、およびpiwiRNA(piRNA)が含まれる。低分子ncRNAは、200未満のヌクレオチド長を有する。好ましくは、本明細書で使用する場合、低分子ncRNAは、50~100ヌクレオチドである。ncRNAは、内因性起源(例えば、ヒト低分子非コードRNA)または外因性起源(例えば、ウイルス、細菌、寄生生物)のものであり得る。「カノニカル」ncRNAは、ゲノム配列から予測されるようにRNAの配列を指し、特定のRNAについて同定される最も豊富に存在する配列である。「トリミングされた」ncRNAは、エキソヌクレアーゼにより媒介されるヌクレオチドのトリミングにより、分子の5’末端および/または3’末端の1つ以上のヌクレオチドが除去されたncRNAを指す。「延長されたncRNA」は、カノニカル低分子非コードRNA配列より長い低分子非コードRNAを指し、当該技術分野において理解されている用語である。延長部を構成するヌクレオチドは、前駆体配列のヌクレオチドに対応し、したがって、鋳型を使用しないヌクレオチド付加とは対照的にゲノムによってコードされる。幾つかの実施形態では、本明細書において開示される方法のいずれかは、上記の開示されたRNAのいずれかまたは組み合わせを検出することを含む。
【0036】
本明細書で使用する場合、用語「対象」は、ヒト、非ヒト霊長類、イヌ、ネコ、げっ歯動物などを含むが、これらに限定されない任意の動物(例えば、哺乳動物)を指す。好ましくは、対象は、ヒト対象である。用語「対象」、「個体」、および「患者」は、本明細書において互換的に使用される。したがって、用語「対象」、「個体」、および「患者」は、がん(例えば、乳癌)を有する個体を包含し、がん組織を除去する切除術(外科手術)を受けたかまたはその候補である個体を含む。
【0037】
用語「治療上有効量」は、所望の治療効果を達成するのに十分な量、例えば、処置されている疾患に関連する症状、例えば、がんの成長または過剰増殖障害に関連する障害の予防もしくは改善または減少をもたらす量を意味する。対象に投与される化合物の量は、疾患の種類および重症度ならびに個体の特徴、例えば、健康状態、年齢、性別、体重、および薬剤耐性に依存する。またそれは、疾患の程度、重症度、および種類にも依存する。当業者は、これらのおよび他の要素に応じて適切な投与量を決定することが可能である。投与計画は、有効量を構成するものに影響を及ぼし得る。更に、幾つかの分割された用量および時差用量は、毎日もしくは逐次的に投与され得るか、または用量は、継続的に注入され得るか、もしくはボーラス注射であり得る。更に、本発明の化合物の用量は、治療または予防状況の緊急性によって示されるように比例的に増加または減少され得る。通常、治療効果を達成するのに十分な本発明の化合物の有効量は、1日当たりキログラム体重当たり約0.000001mg~1日当たりキログラム体重当たり約10,000mgの範囲である。好ましくは、用量範囲は、1日当たりキログラム体重当たり約0.0001mg~1日当たりキログラム体重当たり約100mgである。本明細書において開示される化合物は、お互いに組み合わされて、または1つ以上の追加の治療用化合物と共に投与され得る。
【0038】
用語「塩」は、無機および/または有機酸により形成される酸性塩ならびに無機および/または有機塩基により形成される塩基性塩を指す。これらの酸および塩基の例は、当業者に周知である。かかる酸付加塩は、通常、薬学的に許容されるが、薬学的に許容されない酸の塩は、問題となる本発明の化合物の調製および精製に有用であり得る。本発明の化合物の酸付加塩は、薬学的に許容される酸から最も適切に形成され、例えば、無機酸(例えば塩酸、臭化水素酸、硫酸、またはリン酸)および有機酸(例えばコハク、マレイン酸、酢酸、またはフマル酸)により形成されるものが含まれる。他の薬学的に許容されない塩(例えばシュウ酸塩)は、例えば本発明の化合物の単離に、実験用に、またはその後の薬学的に許容される酸付加塩への変換に使用することができる。本発明の溶媒和物および水和物も、本発明の範囲内に含まれる。本発明のある種の化合物のインビボで加水分解可能なエステルまたはアミドは、遊離ヒドロキシまたはアミノ官能性を有するそれらの化合物を不活性溶媒(例えばジクロロメタンまたはクロロホルム)中の塩基の存在下で、所望のエステルの酸塩化物で処理することによって形成され得る。適切な塩基には、トリエチルアミンまたはピリジンを含まれる。逆に、遊離カルボキシ基を有する本発明の化合物は、活性化に続く適切な塩基の存在下での所望のアルコールによる処理を含み得る標準条件を使用してエステル化され得る。薬学的に許容される付加塩の例としては、非毒性の無機および有機酸付加塩、例えば、塩酸から誘導される塩酸塩、臭化水素酸から誘導される臭化水素酸塩、硝酸から誘導される硝酸塩、過塩素酸から誘導される過塩素酸塩、リン酸から誘導されるリン酸塩、硫酸から誘導される硫酸塩、ギ酸から誘導されるギ酸塩、酢酸から誘導される酢酸塩、アコニット酸から誘導されるアコニット酸塩、アスコルビン酸から誘導されるアスコルビン酸塩、ベンゼンスルホン酸から誘導されるベンゼンスルホン酸塩、安息香酸から誘導される安息香酸塩、ケイ皮酸から誘導されるケイ皮酸塩、クエン酸から誘導されるクエン酸塩、エンボン酸から誘導されるエンボン酸塩、エナント酸から誘導されるエナント酸塩、フマル酸から誘導されるフマル酸塩、グルタミン酸から誘導されるグルタミン酸塩、グリコール酸から誘導されるグリコール酸塩、乳酸から誘導される乳酸塩、マレイン酸から誘導されるマレイン酸塩、マロン酸から誘導されるマロン酸塩、マンデル酸から誘導されるマンデル酸塩、メタンスルホン酸から誘導されるメタンスルホン酸塩、ナフタレン-2-スルホン酸から誘導されるナフタレン-2-スルホン酸塩、フタル酸から誘導されるフタル酸塩、サリチル酸から誘導されるサリチル酸塩、ソルビン酸から誘導されるソルビン酸塩、ステアリン酸から誘導されるステアリン酸塩、コハク酸から誘導されるコハク酸塩、酒石酸から誘導される酒石酸塩、p-トルエンスルホン酸から誘導されるトルエン-p-スルホン酸塩などが挙げられるが、これらに限定されない。特に好ましい塩は、本発明の化合物のナトリウム、リシン、およびアルギニン塩である。かかる塩は、当該技術分野において周知であり、記載されている手順によって形成され得る。
【0039】
薬学的に許容されるとみなすことができないシュウ酸などの他の酸は、本発明の化合物およびその薬学的に許容される酸付加塩の取得において中間体として有用な塩の調製に有用であり得る。本発明の化合物の金属塩には、アルカリ金属塩、例えば、カルボキシ基を含有する本発明の化合物のナトリウム塩が含まれる。本発明により取得可能な異性体の混合物は、それ自体既知の方法で個々の異性体に分離され得、ジアステレオアイソマーは、例えば、多相の溶媒混合液間での分配、再結晶化および/または例えばシリカゲルでのクロマトグラフ分離、もしくは例えば、逆相カラムでの中圧液体クロマトグラフィーにより分離され得、ラセミ体は、例えば、光学的に純粋な塩形成試薬による塩の形成およびこうして得られるジアステレオ異性体の混合物の分離によって、例えば分別結晶化によって、または光学活性カラム材料上でのクロマトグラフィーによって分離され得る。
【0040】
本明細書で使用する場合、用語「試料」は、本明細書で記載されるように、関心対象の供給源から取得されるかまたはそれに由来する生体試料を指す。幾つかの実施形態では、関心対象の供給源には、動物またはヒトなどの生物が含まれる。幾つかの実施形態では、生体試料には、生物組織または生体液が含まれる。幾つかの実施形態では、生体試料は、骨髄;血液;血液細胞;腹水;組織もしくは微細針生検試料;細胞を含有する体液;浮動性核酸;痰;唾液;尿;脳脊髄液、腹膜液;胸膜液;糞便;リンパ液;婦人科学的液体;皮膚スワブ;膣スワブ;口腔スワブ;鼻腔スワブ;管洗浄液もしくは気管支肺胞洗浄液などの洗液もしくは洗浄液;吸引液;擦過物;骨髄検体;組織生検検体;手術検体;便、他の体液、分泌物、および/もしくは排泄物;ならびに/またはそれら由来の細胞などであるかまたはそれらを含み得る。幾つかの実施形態では、生体試料は、個体から取得される細胞であるかまたはそれを含む。幾つかの実施形態では、試料は、任意の適切な手段によって関心対象の供給源から直接に取得される「一次試料」である。例えば、幾つかの実施形態では、一次生体試料は、生検(例えば、穿刺吸引または組織生検)、外科手術、体液(例えば、血液、リンパ液、糞便など)の収集などからなる群から選択される方法によって取得される。幾つかの実施形態では、文脈から明らかであるように、用語「試料」は、一次試料を処理することによって(例えば、一次試料の1つ以上の成分を除去することによって、および/または1つ以上の薬剤を添加することによって)、取得される調製物を指す。例えば、半透膜を使用した濾過。かかる「処理された試料」には、例えば、試料から抽出されるかまたは一次試料を例えば、mRNAの増幅もしくは逆転写、ある種の成分の単離および/もしくは精製などの技術に供することによって取得される核酸またはタンパク質が含まれ得る。
【0041】
本明細書で使用する場合、用語「処置すること」または「処置」または「治療する」は、1)診断された病態または障害の症状を治療、遅延、軽減し、かつ/またはその進行を停止させる治療手段および2)標的とする病態または障害の発症を予防または遅延する予防薬または予防手段の両方とも指す。したがって、処置を必要とする者としては、すでに障害と診断されている者;障害を有する傾向がある者;および障害が予防されるべきである者が含まれる。幾つかの実施形態では、対象は、患者が以下のうちの1つ以上を示す場合に本発明の方法により成功裡に「治療される」:がん細胞の数の減少および/もしくはがん細胞が完全に存在しないこと;腫瘍サイズの減少;腫瘍成長の阻害;がん細胞の軟組織および骨への拡散を含むがん細胞の末梢臓器への浸潤の阻害および/もしくはその非存在;腫瘍またはがん細胞の転移の阻害および/もしくはその非存在;がん成長の阻害および/もしくは非存在;特定の特異的がんに関連する1つ以上の症状の軽減;罹患率および死亡率の低減;生活の質の改善;腫瘍形成性の低減;がん幹細胞の数もしくは頻度の低減;またはかかる効果の幾つかの組み合わせ。
【0042】
本明細書で使用する場合、用語「腫瘍」は、悪性か良性かを問わない、全ての腫瘍細胞の成長および増殖、ならびに全ての前がん性およびがん性の細胞および組織を指す。
【0043】
用語「T3p」は、ヒトTERCヌクレオチド配列によってコードされるかまたは生成される非コードRNAの(5’~3’の方向での)最後の45ヌクレオチドを指す。上記配列は、PCT番号第PCT/US2008/055709号および関連する配列リストにおいて見出され得、その内容はその全体が参照により本明細書に組み込まれる。
【0044】
本明細書で使用する場合、用語「腫瘍試料」は、がん患者から取得される腫瘍材料を含む試料を指す。上記用語は、腫瘍組織試料、例えば、外科的切除によって取得される組織および生検、例えば、コア生検または微細針生検によって取得される組織を包含する。特定の実施形態では、腫瘍試料は、固定され、蝋に包埋された組織試料、例えば、ホルマリン固定され、パラフィン包埋された組織試料である。更に、用語「腫瘍試料」は、原発性腫瘍以外の部位から取得される腫瘍細胞、例えば、循環腫瘍細胞を含む試料を包含する。上記用語は、患者の腫瘍細胞の子孫である細胞、例えば、原発性腫瘍細胞または循環腫瘍細胞に由来する細胞培養試料も包含する。上記用語は、インビボで腫瘍細胞から排出されたタンパク質または核酸材料を含み得る試料、例えば、骨髄、血液、血漿、血清などを更に包含する。上記用語は、腫瘍細胞が濃縮されたかまたは別の方法でそれらの入手後に操作された試料ならびに患者の腫瘍材料から取得されるポリヌクレオチドおよび/またはポリペプチドを含む試料も包含する。
【0045】
がんの低分子RNAバイオマーカー
ヒトゲノムは、膨大な量の低分子非タンパク質コードRNA(ncRNA)転写物をコードする。非常に豊富な転移RNA(tRNA)、リボソームRNA(rRNA)、核小体低分子RNA(snoRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、核内低分子RNA(snRNA)、およびPiwi結合RNA(piRNA)を含む複数のncRNAクラスが記載されている(Amaral et al.,2008、Martens-Uzunova et al.,2013)。低分子非コードRNAは、適切な配列相補性を有する部位で標的mRNAに結合することによる翻訳リプレッサーとして働く(Ameres et al.,2007)が、非常に豊富な細胞質Y RNAは、Roタンパク質の細胞内位置に影響を及ぼすことによってRNAの品質管理において機能する(Sim et al.,2009)。mRNA翻訳に対する成熟低分子非コードRNAの抑制活性は、既定の細胞内位置でレトロトランスポゾンをサイレンシングするpiRNAに加えて、siRNAおよび内在性siRNAを含む他のクラスのncRNAと共有される(Chuma and Pillai,2009)。低分子非コードRNAの活性は、細胞質中の十分なレベルの存在量およびエンドソーム膜に局在するRNA誘導サイレンシング複合体(RISC)との相互作用に依存する(Gibbings et al.,2009、Lee et al.,2009a)が、少ない量の低分子非コードRNAは、翻訳の抑制に対するより小さい効果を有する。結果として、ある種の低分子非コードRNAのレベルの微妙な変化でも、すでに細胞プロセスに影響を与え得るが、強い撹乱は、疾患を引き起こし得る。存在量の他に、(RISC)タンパク質のみならずRNAパートナーとの相互作用および正しい細胞内局在は、低分子非コードRNAの生理機能を制御する相互関係のある因子である(Mullokandov et al.,2012、Wee et al.,2012)。
【0046】
低分子RNAは、エキソソームなどの細胞由来の細胞外小胞内に分泌され得る。mRNAおよび低分子非コードRNA種の両方が、エキソソームに含有されることが発見されている。したがって、エキソソームは、RNA含量の移送および環境中でのその分解からの保護のための手段を提供し得、RNAバイオマーカーの信頼性の高い検出のための安定した供給源を使用可能にする。
【0047】
本開示は、「正常」である対象、すなわち乳癌を有さない対象と比較して、乳癌を有する対象に由来する生体試料中に差次的に存在することが分かっている低分子非コードRNAバイオマーカーに関する。低分子非コードRNAバイオマーカーまたは低分子非コードRNAバイオマーカーのセットは、試料における低分子非コードRNAバイオマーカーまたは低分子非コードRNAバイオマーカーのセットの発現レベルの間の差が、統計的に有意であると判定される場合、試料間で差次的に存在する。統計的有意差の一般的な検定としては、t検定、ANOVA、クラスカル・ワリス、ウィルコクソン、マン・ホイットニー、およびオッズ比が挙げられるが、これらに限定されない。単独または組み合わせの低分子非コードRNAバイオマーカーは、対象ががんを有するかまたは有さない相対リスクの尺度を提供するために使用され得る。
【0048】
乳癌の低分子非コードRNAバイオマーカーは、複数の乳癌サブタイプおよびヒト乳房上皮細胞の低分子RNAの配列決定ならびに乳癌細胞において特異的に発現されている今まで知られていなかった低分子非コードRNAの同定によって発見された。乳癌細胞において特異的に発現されている200個の今まで知られていなかった低分子非コードRNAは、このように同定された(表1を参照のこと)。現在、これらの低分子非コードRNAバイオマーカーは、対象、例えば、乳癌の状態が今まで未知であった対象または乳癌に罹患していると疑われる対象のがんの状態を判定するために使用することができる。これは、対象に由来する生体試料中の同定された低分子非コードRNAまたはその組み合わせのうちの1つ以上のレベルを判定することによって達成され得る。これらの低分子非コードRNAバイオマーカーのうちの1つ以上のレベルの正常な対象に由来する生体試料中のそれと比較した差は、対象が乳癌を有することの指標である。
【0049】
正常な対象と比較して、1つ以上の低分子非コードRNAバイオマーカーのレベルに差を有する対象は、初期の、中程度もしくは中期の、または重度もしくは末期の乳癌を含む乳癌を有し得る。一実施形態では、1つ以上の低分子非コードRNAバイオマーカーのレベルは、初期のがんに特徴的な症状を有する対象の乳癌を診断するために使用され得る。
【0050】
一実施形態では、1つ以上の低分子非コードRNAバイオマーカーのレベルは、対象におけるがんの進行、例えば、乳癌の進行の経過をモニタリングするために使用され得る。対象のがんの状態は、経時的に変化し得る。例えば、がんは、経時的に悪化するかまたは改善し得る。かかる悪化または改善に伴い、1つ以上の低分子非コードRNAバイオマーカーのレベルは、対象に由来する試料において検出されるように統計的に有意な様式で変化し得る。例えば、低分子非コードRNAバイオマーカーのうちの1つ以上のレベルは、乳癌の発生に伴って経時的に増加し得る。したがって、対象における乳癌の経過(進行)は、対象に由来する第1の試料中の1つ以上の低分子非コードRNAバイオマーカーのレベルを判定すること、および対象に由来する第2の試料中の1つ以上の低分子非コードRNAバイオマーカーのレベルを判定することによってモニタリングされ得、ここで、第2の試料は第1の試料の後に取得される。第1の試料におけるレベルと比較した第2の試料におけるレベルは、疾患進行を示す。例えば、第1の試料から第2の試料への表1、表2または表3の低分子非コードRNAバイオマーカーのうちの1つ以上のレベルの増加は、対象が乳癌を発症したか、または疾患が悪化したことを示す。逆に、第1の試料から第2の試料への表1、表2または表3の低分子非コードRNAバイオマーカーのうちの1つ以上のレベルの減少は、疾患が改善したことを示す。一実施形態では、1つ以上の低分子非コードRNAバイオマーカーは、表3のものおよびその組み合わせである。
【0051】
試験対象に由来する生体試料中の低分子非コードRNAバイオマーカーのレベルが、正常な対象に存在する低分子非コードRNAバイオマーカーのレベルと異なるか否かは、試験対象由来の試料中の低分子非コードRNAバイオマーカーのレベルを適切な対照と比較することによって確認され得る。当業者は、問題となるアッセイのための適切な対照を選択することができる。例えば、適切な対照は、既知の対象、例えば、がんを有さない正常な対象であることが既知の対象に由来する生体試料であり得る。適切な対照が正常な対象から取得される場合、試験対象における低分子非コードRNAバイオマーカーのレベルの適切な対照と比較した統計学的有意差は、対象が乳癌を有することを示す。一実施形態では、低分子非コードRNAバイオマーカーのレベルの差は、増加である。適切な対照は、参照標準でもあり得る。参照標準は、対象の乳癌の状態を推定するために試験試料を参照標準と比較できるように、比較のための参照レベルとして機能する。参照標準は、既知の対象、例えば、正常な対象であることが既知の対象または乳癌を有することが既知の対象における1つ以上の低分子非コードRNAバイオマーカーのレベルを表わし得る。同様に、参照標準は、既知の対象の集団、例えば、正常な対象であることが既知の対象の集団または乳癌を有することが既知の対象の集団における1つ以上の低分子非コードRNAバイオマーカーのレベルを表わし得る。参照標準は、例えば、複数の個体からの試料をプールすること、およびプールされた試料中の低分子非コードRNAバイオマーカーのレベルを測定することによって取得され、これにより、平均化された集団についての標準をもたらすことができる。このような参照標準は、個体の集団中の低分子非コードRNAバイオマーカーの平均レベルを表す。参照標準は、例えば、複数の個体から取得された個々の試料中に存在することが判定された低分子非コードRNAバイオマーカーのレベルの平均をとることによっても取得され得る。またこのような標準は、個体の集団中の低分子非コードRNAバイオマーカーの平均レベルも表わす。参照標準は、各々が個体の集団における既知の対象の低分子非コードRNAバイオマーカーのレベルを表わす値の集まりでもあり得る。ある種の実施形態では、試験試料は、対象の乳癌、状態を推定するために、かかる値の集まりに対して比較され得る。ある種の実施形態では、参照標準は、絶対値である。かかる実施形態では、試験試料は、対象の乳癌、状態を推定するために、絶対値に対して比較され得る。一実施形態では、試料における1つ以上の低分子非コードRNAバイオマーカーレベルの適切な対照に対する比較は、ソフトウェアの分類アルゴリズムを実行することによってなされる。幾つかの実施形態では、表1、2、および/または3における1つまたは組み合わせの非コードRNAの増加した発現は、正常な試料における同一の非コードRNAの発現と比べて約10%、20%、30%、40%、50%、60%、70%、80%、90%、95パーセント、または約100%以上の発現である。幾つかの実施形態では、表1、2、および/または3における1つまたは組み合わせの非コードRNAの増加した発現は、正常な試料における同一の1つまたは組み合わせの非コードRNAの発現と比べて約2X、3X、4X、5X、6X、7X、8X、9X、または10X以上の発現である。幾つかの実施形態では、表1、2、および/または3の核酸配列に対する約70%、80%、81%、82%、83%、84、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または約99%の相同性を有する1つまたは複数の非コードRNA配列または核酸配列。幾つかの実施形態では、表1、2、または3のうちの1つまたは複数の配列の発現を伴う、単独または組み合わせの1つまたは複数の非コードRNAの単なる存在または発現。幾つかの実施形態では、表1、2、および/または3の核酸配列に対する約70%、80%、81%、82%、83%、84、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または約99%の相同性を有する配列のうちの1つまたは複数の発現を伴う、単独または組み合わせに対応する1つまたは複数の非コードRNAの単なる存在または発現。幾つかの実施形態では、これらの相同配列は、表1、2、および/または3において開示される核酸配列の断片のうちの1つまたは複数を含む。
【0052】
当業者は、問題となるアッセイに応じた適切であり得る追加の適切な対照を容易に想定することができる。上述の適切な対照は、例示であり、限定であることを意図するものではない。
【0053】
一般に、正常な対象における表1、表2または表3の低分子非コードRNAバイオマーカーのうちの1つ以上のレベルを表す適切な対照と比較した、試験対象に由来する生体試料における表1、表2または表3の低分子非コードRNAバイオマーカーのうちの1つ以上のレベルの増加は、試験対象が乳癌を有することを示すであろう。2つ以上の低分子非コードRNAバイオマーカーレベルが試験対象において測定される幾つかの例では、適切な対照と比較して、1つ以上の低分子非コードRNAバイオマーカーのレベルが増加し、1つ以上の追加の低分子非コードRNAバイオマーカーのレベルが変化しないかまたは増加し得る。かかる例では、低分子非コードRNAバイオマーカーのうちの1つ以上のレベルの、正常な対象における低分子非コードRNAバイオマーカーのレベルを表す適切な対照と比較した差は、試験対象が乳癌を有することを示す。このような差の判定は、本明細書に記載されるように、ソフトウェアの分類アルゴリズムの実行によって補助され得る。
【0054】
生体試料
1つ以上の低分子非コードRNAバイオマーカーの発現レベルが、対象に由来する生体試料において測定され得る。対象に由来する試料は、対象から生じるものである。かかる試料は、それが対象から取得された後に更に処理され得る。例えば、RNAは、試料から単離され得る。この例では、試料から単離されたRNAは、対象に由来する試料でもある。1つ以上の低分子非コードRNAバイオマーカーのレベルを判定するのに有用な生体試料は、基本的には身体中の細胞、組織、および液体を含む任意の供給源から取得され得る。
【0055】
幾つかの実施形態では、1つ以上の低分子非コードRNAバイオマーカーのレベルを判定するために使用される生体試料は、循環低分子非コードRNA、例えば、細胞外低分子非コードRNAを含有する試料である。細胞外低分子非コードRNAは、循環系からの液体などの体液、例えば、血液試料もしくはリンパ液試料または別の体液、例えば、尿もしくは唾液を含む広範囲の生物学的材料中を自由に循環する。したがって、幾つかの実施形態では、1つ以上の低分子非コードRNAバイオマーカーのレベルを判定するために使用される生体試料は、体液、例えば、血液、その画分、血清、血漿、尿、唾液、涙液、汗、精液、膣液、リンパ液、気管支分泌物、CSF、全血などである。幾つかの実施形態では、試料は、非侵襲的に取得される試料である。幾つかの実施形態では、試料は、ヒト由来の血清試料である。
【0056】
幾つかの実施形態では、本明細書において開示される方法のいずれかは、少量試料を使用することを含む。幾つかの実施形態では、開示される方法は、約20マイクロリットル以下の試料、40マイクロリットルの試料、80マイクロリットルの試料、100マイクロリットルの試料、200マイクロリットルの試料、300マイクロリットルの試料、400マイクロリットルの試料、500マイクロリットルの試料、600マイクロリットルの試料、700マイクロリットルの試料、800マイクロリットルの試料、900マイクロリットルの試料、1ミリリットルの試料、1.1ミリリットルの試料、1.2ミリリットルの試料、1.3ミリリットルの試料、1.4ミリリットルの試料、1.5ミリリットルの試料、1.6ミリリットルの試料、1.7ミリリットルの試料、1.8ミリリットルの試料、1.9ミリリットルの試料、2.0ミリリットルの試料のうちの試料中の全RNAを単離することおよび/または非コードRNAを増幅することを含む。幾つかの実施形態では、試料サイズは、対象の血漿、全血、または血清形態の約25マイクロリットル~約2ミリリットルの液体試料である。
【0057】
幾つかの実施形態では、開示される方法は、約20マイクロリットル以下の血清、40マイクロリットルの血清、80マイクロリットルの血清、100マイクロリットルの血清、200マイクロリットルの血清、300マイクロリットルの血清、400マイクロリットルの血清、500マイクロリットルの血清、600マイクロリットルの血清、700マイクロリットルの血清、800マイクロリットルの血清、900マイクロリットルの血清、1ミリリットルの血清、1.1ミリリットルの血清、1.2ミリリットルの血清、1.3ミリリットルの血清、1.4ミリリットルの血清、1.5ミリリットルの血清、1.6ミリリットルの血清、1.7ミリリットルの血清、1.8ミリリットルの血清、1.9ミリリットルの血清、2.0ミリリットルの血清の試料中の全RNAを単離することおよび/または非コードRNAを増幅することを含む。
【0058】
循環低分子非コードRNAとしては、細胞中の低分子非コードRNA、マイクロ小胞中、エキソソーム中の細胞外低分子非コードRNA、および細胞またはマイクロ小胞を伴わない細胞外低分子非コードRNA(非小胞性の細胞外低分子非コードRNA)が挙げられる。幾つかの実施形態では、1つ以上の低分子非コードRNAバイオマーカーのレベルを判定するために使用される生体試料(例えば、循環低分子非コードRNAを含有する試料)は、細胞を含有し得る。他の実施形態では、生体試料は、細胞を含まなくてもよく、または実質的に含まなくてもよい(例えば、血清試料)。幾つかの実施形態では、循環低分子非コードRNA(例えば、細胞外低分子非コードRNA)を含有する試料は、血液由来の試料である。例示的な血液由来の試料の種類としては、例えば、血漿試料、血清試料、血液試料などが挙げられる。他の実施形態では、循環低分子非コードRNAを含有する試料は、リンパ液試料である。循環低分子非コードRNAは、尿および唾液中においても見出され、これらの供給源に由来する生体試料も同様に、1つ以上の低分子非コードRNAバイオマーカーのレベルを判定するのに適している。
【0059】
幾つかの実施形態では、本開示の方法のうちのいずれかは、試料または細胞もしくはエキソソームもしくはマイクロ小胞から全RNAを単離するステップを含む。発現解析のために血液、血漿、および/または血清からRNAを単離する方法(例えば、Tsui NB et al.(2002)Clin.Chem.48,1647-53を参照のこと(参照によりその全体が本明細書に組み込まれる))、ならびに尿からRNAを単離する方法(例えば、Boom R et al.(1990)J Clin Microbiol.28,495-503を参照のこと(参照によりその全体が本明細書に組み込まれる))が記載されている。
【0060】
試料中の低分子RNAバイオマーカーのレベルの判定
生体試料中の1つ以上の低分子非コードRNAバイオマーカーのレベルは、任意の適切な方法によって判定され得る。試料中の低分子非コードRNAのレベルまたは量を測定するための任意の信頼性の高い方法が使用され得る。一般に、低分子非コードRNAは、例えば、増幅ベースの方法(例えば、ポリメラーゼ連鎖反応(PCR)、リアルタイムポリメラーゼ連鎖反応(RT-PCR)、定量的ポリメラーゼ連鎖反応(qPCR)、ローリングサークル増幅など)、ハイブリダイゼーションベースの方法(例えば、ハイブリダイゼーションアレイ(例えば、マイクロアレイ)、NanoString解析、ノーザンブロット解析、分岐DNA(bDNA)シグナル増幅法、in situハイブリダイゼーションなど)、および配列決定ベースの方法(例えば、IlluminaまたはIonTorrentプラットフォームを使用した次世代配列決定法)を含むmRNAのための公知の各種の方法によって単離されたRNA試料などの試料(その画分を含む)から検出または定量化され得る。他の例示的な技術としては、リボヌクレアーゼ保護アッセイ(RPA)および質量分析が挙げられる。
【0061】
幾つかの実施形態では、RNAは、解析前にDNA(cDNA)に変換される。cDNAは、単離された低分子非コードRNAの従来技術を使用した逆転写により生成され得る。幾つかの実施形態では、低分子非コードRNAは、測定前に増幅される。他の実施形態では、低分子非コードRNAのレベルは、増幅プロセスの間に測定される。更なる他の実施形態では、低分子非コードRNAのレベルは、測定前に増幅されない。試料中の低分子非コードRNAのレベルを判定するのに好適な幾つかの例示的な方法は、以下で更に詳細に記載される。これらの方法は、単に例証として提供される。他の好適な方法が同様に使用され得ることは、当業者にとって明らかである。
【0062】
A.増幅ベースの方法
PCR、RT-PCR、qPCR、およびローリングサークル増幅を含むがこれらに限定されない、低分子非コードRNA核酸配列のレベルを検出するための多数の増幅ベースの方法が、存在する。他の増幅ベースの技術としては、例えば、リガーゼ連鎖反応、多様なライゲーション可能なプローブを用いる増幅(multiplex ligatable probe amplification)、インビトロ転写(IVT)、鎖置換増幅、転写媒介増幅、RNA(Eberwine)増幅、および当業者に公知である他の方法が挙げられる。
【0063】
典型的なPCR反応には、標的核酸種を選択的に増幅する以下の複数のステップまたはサイクルが含まれる:標的核酸が変性される変性ステップ;PCRプライマーのセット(すなわち、フォワードプライマーおよびリバースプライマー)が相補的DNA鎖とアニーリングするアニーリングステップ、ならびに耐熱性DNAポリメラーゼがプライマーを伸長させる伸長ステップ。これらのステップを複数回繰り返すことによって、DNAフラグメントが増幅されて標的配列に対応するアンプリコンを産生する。典型的なPCR反応は、20回以上の変性、アニーリング、および伸長のサイクルを含む。多くの場合、アニーリングステップおよび伸長ステップを同時に行うことができ、その場合、サイクルは2つのステップのみを含む。逆転写反応(低分子非コードRNAと相補性を有するcDNA配列を産生する)が、PCR増幅の前に実行され得る。逆転写反応は、例えば、RNAベースのDNAポリメラーゼ(逆転写酵素)およびプライマーの使用を含む。
【0064】
低分子非コードRNAの定量的リアルタイムPCR用のキットは、公知であり、市販されている。適切なキットの例としては、TaqMan miRNAアッセイ(Applied Biosystems)およびmirVana.qRT-PCR miRNA検出キット(Ambion)が挙げられるが、これらに限定されない。逆転写酵素の前に、低分子非コードRNAをユニバーサルプライマー配列、ポリアデニル化配列、またはアダプター配列を含有する一本鎖オリゴヌクレオチドにライゲーションし、ユニバーサルプライマー配列に相補的なプライマー、ポリ(T)プライマー、またはアダプター配列に相補的な配列を含むプライマーを使用して増幅することができる。
【0065】
一部の例では、低分子非コードRNAレベルの判定のために、カスタムqRT-PCRアッセイが開発され得る。生体試料(例えば、体液)中の低分子非コードRNAを測定するために、例えば、延長された逆転写プライマーおよびロックド核酸改変PCRを伴う方法を使用して、カスタムqRT-PCRアッセイが、開発され得る。カスタム低分子非コードRNAアッセイは、標的配列に対応する化学合成した低分子非コードRNAの希釈系列に対してアッセイ法を行うことによって検査され得る。これは、検出限界および各アッセイの定量の直線範囲の判定を可能にする。更に、検量線として使用される場合、これらのデータは、生体試料において測定された低分子非コードRNAの絶対存在量の推定を可能にする。
【0066】
場合により増幅曲線をチェックして、Ct値が各増幅プロットの直線範囲内で評価されることを検証してもよい。典型的には、直線範囲は、数桁に及ぶ。アッセイされる各候補低分子非コードRNAについて、化学合成されたバージョンの低分子非コードRNAを得て、希釈系列で解析し、アッセイの感度限界および定量の直線範囲を判定することができる。相対発現レベルは、例えば、Livak et al.,Methods(2001)December;25(4):402-8によって記載されているように判定され得る。
【0067】
幾つかの実施形態では、2つ以上の低分子非コードRNAが単一反応容量で増幅される。例えば、qRT-PCRなどの多重q-PCRは、2対以上のプライマーおよび/または2つ以上のプローブを使用することによって、1つの反応容量で少なくとも2つの関心対象の低分子非コードRNAの同時増幅および定量を可能にする。プライマー対は、各低分子非コードRNAと特異的に結合する少なくとも1つの増幅プライマーを含み、プローブは、それらが互いに識別可能なように標識され、これにより、複数の低分子非コードRNAの同時定量が可能となる。
【0068】
ローリングサークル増幅は、環状化オリゴヌクレオチドプローブを等温条件下で線形または幾何学的動態のいずれかで複製することができる、DNAポリメラーゼ駆動反応である(例えば、Lizardi et al.,Nat.Gen.(1998)19(3):225-232;Gusev et al.,Am.J.Pathol.(2001)159(1):63-69、Nallur et al.,Nucleic Acids Res.(2001)29(23):E118を参照のこと)。2つのプライマーの存在下で、一方はDNAの(+)鎖にハイブリダイズし、他方は(-)鎖にハイブリダイズし、鎖置換の複合パターンが、90分以内に各DNA分子の10個超のコピーの生成をもたらす。単一のプライマーを使用することによって、閉環状DNA分子のタンデムに連結されたコピーが形成され得る。マトリックスに結合したDNAを使用して、このプロセスを実行することもできる。ローリングサークル増幅のために使用される鋳型は、逆転写され得る。この方法を、低分子非コードRNA配列および非常に低い低分子非コードRNA濃度での発現レベルの高感度な指標として使用することができる(例えば、Cheng et al.,Angew Chem.Int.Ed.Engl.(2009)48(18):3268-72、Neubacher et al.,Chembiochem.(2009)10(8):1289-91を参照のこと)。
【0069】
B.ハイブリダイゼーションベースの方法
低分子非コードRNAは、ハイブリダイゼーションアレイ(例えば、マイクロアレイ)、NanoString解析、ノーザンブロット解析、分岐DNA(bDNA)シグナル増幅法、およびin situハイブリダイゼーションを含むが、これらに限定されないハイブリダイゼーションベースの方法を使用して検出され得る。
【0070】
多数の低分子非コードRNAの発現レベルを同時に測定するためにマイクロアレイが使用され得る。先細ピンを用いたガラススライド上へのプリント、予備製造されたマスクを使用するフォトリソグラフィー、ダイナミックマイクロミラーデバイス(dynamic micromirror device)を使用するフォトリソグラフィー、インクジェットプリント、または微小電極アレイを用いた電気化学を含む種々の技術を使用して、マイクロアレイが製作され得る。マイクロ流体qRT-PCR反応のアレイに基づくマイクロ流体TaqMan Low-Density Arrayおよび関連するqRT-PCRに基づくマイクロ流体法も有用である。
【0071】
Axon B-4000スキャナーおよびGene-Pix Pro 4.0ソフトウェアまたは他の適切なソフトウェアを使用して、画像をスキャンすることができる。バックグラウンド除去後の非陽性スポットおよびESD手順によって検出された外れ値が、除去される。得られたシグナル強度値は、チップ当たりの中央値に対して正規化され、次いで、各低分子非コードRNAについての幾何平均および標準誤差を取得するために使用される。各シグナルを対数の底2に変換することができ、一標本t検定を実施することができる。データの強固性を上げるために各低分子非コードRNAを複数回スポットして、各試料について独立したハイブリダイゼーションをチップ上で行うことができる。
【0072】
疾患における各低分子非コードRNAの発現プロファイリングのためにマイクロアレイを使用することができる。例えば、RNAを試料から抽出することができ、所望により、低分子非コードRNAが全RNAからサイズ選択される。オリゴヌクレオチドリンカーを低分子非コードRNAの5’および3’末端に結合させることができ、得られたライゲーション産物が、RT-PCR反応用のテンプレートとして使用される。センス鎖PCRプライマーは、その5’末端にフルオロフォアを結合させることによって、PCR産物のセンス鎖を標識することができる。PCR産物は、変性され、次いでマイクロアレイにハイブリダイズされる。標的核酸と呼ばれる、アレイ上の対応する低分子非コードRNA捕捉プローブ配列に相補的なPCR産物は、捕捉プローブが固定されているスポットで塩基対形成を介してハイブリダイズする。次いで、スポットは、マイクロアレイレーザスキャナーを使用して励起されると、蛍光を発する。
【0073】
次いで、幾つかの陽性および陰性対照ならびにアレイデータ正規化法を使用して、各スポットの蛍光強度が特定の低分子非コードRNAのコピー数の観点から評価され、その結果、特定の低分子非コードRNAの発現レベルの評価がもたらされる。
【0074】
低分子非コードRNAをサイズ選択せずに、体液試料から抽出された低分子非コードRNAを含有する全RNAを直接使用することもできる。例えば、T4 RNAリガーゼおよびフルオロフォア標識短鎖RNAリンカーを使用して、RNAを3’末端標識することができる。アレイ上の対応する低分子非コードRNA捕捉プローブ配列に相補的なフルオロフォア標識低分子非コードRNAは、捕捉プローブが固定されているスポットで塩基対形成を介してハイブリダイズする。次いで、幾つかの陽性および陰性対照ならびにアレイデータ正規化法を使用して、各スポットの蛍光強度が特定の低分子非コードRNAのコピー数の観点から評価され、その結果、特定の低分子非コードRNAの発現レベルの評価がもたらされる。
【0075】
スポットされたオリゴヌクレオチドマイクロアレイ、予め製作されたオリゴヌクレオチドマイクロアレイまたはスポットされた長鎖オリゴヌクレオチドアレイが含まれるが、これらに限定されない幾つかの種類のマイクロアレイが使用され得る。
【0076】
増幅せずにnCounter Analysis System(NanoString Technologies、Seattle、Wash.)を使用して低分子非コードRNAを検出することもできる。この技術は、溶液中でハイブリダイズする2つの核酸ベースのプローブ(例えば、レポータープローブおよび捕捉プローブ)を使用する。ハイブリダイゼーション後に、過剰のプローブが除去され、製造者のプロトコールに従ってプローブ/標的複合体が解析される。nCounter miRNAアッセイキットは、NanoString Technologiesから入手可能であり、高度に類似した低分子非コードRNAを高い特異性で識別することができる。
【0077】
分岐DNA(bDNA)シグナル増幅法を使用して、低分子非コードRNAを検出することもできる(例えば、Urdea,Nature Biotechnology(1994),12:926-928を参照のこと)。bDNAシグナル増幅に基づく低分子非コードRNAアッセイが市販されている。かかるアッセイの1つは、QuantiGene(登録商標)2.0 miRNA Assay(Affymetrix,Santa Clara,Calif.)である。
【0078】
ノーザンブロットおよびin situハイブリダイゼーションを使用して、低分子非コードRNAを検出してもよい。ノーザンブロットおよびin situハイブリダイゼーションを行うための適切な方法が、当技術分野において公知である。
【0079】
幾つかの実施形態では、バイオマーカーの発現は、多検体プロファイル試験、酵素結合免疫吸着測定法(ELISA)、放射免疫アッセイ、ウエスタンブロットアッセイ、免疫蛍光アッセイ、酵素免疫測定法、免疫沈降アッセイ、化学発光アッセイ、免疫組織化学アッセイ、ドットブロットアッセイ、またはスロットブロットアッセイが含まれるがこれらに限定されない、当業者に公知のアッセイによって測定される。アッセイにおいて抗体が使用される幾つかの実施形態では、抗体は、検出可能に標識される。抗体標識としては、免疫蛍光標識、化学発光標識、リン光性標識、酵素標識、放射標識、アビジン/ビオチン、コロイド金粒子、着色した粒子、および磁気粒子が挙げられるが、これらに限定されない。幾つかの実施形態では、バイオマーカーの発現は、IHCアッセイによって測定される。
【0080】
幾つかの実施形態では、バイオマーカーの発現は、バイオマーカーに特異的に結合する薬剤を使用して測定される。バイオマーカーへの特異的結合を示す任意の分子実体が、試料中のそのバイオマーカータンパク質のレベルを測定するために使用され得る。特異的に結合する薬剤としては、抗体、抗体断片、抗体ミメティック、およびポリヌクレオチド(例えば、アプタマー)が挙げられるが、これらに限定されない。技術者は、必要とされる特異性の程度が、バイオマーカータンパク質を検出するために使用される特定のアッセイによって決まることを理解する。幾つかの実施形態では、本開示は、固体支持体(例えば、T3pまたはその塩に結合することができる抗体、抗体断片、抗体ミメティック、および/またはポリヌクレオチドを含むELISAプレート、ゲル、ビーズ、またはカラムを含むシステムに関する。
【0081】
C.配列決定ベースの方法
利用可能な限り、高度な配列決定法が同様に使用され得る。例えば、低分子非コードRNAは、Illumina次世代配列決定法(例えば、HiSeq、HiScan、GenomeAnalyzer、またはMiSeqシステム(Illumina,Inc.、San Diego、Calif.)を使用した、例えば、Sequencing-By-SynthesisまたはTruSeq法)を使用して検出することができる。低分子非コードRNAは、Ion Torrent Sequencing(Ion Torrent Systems,Inc.、Gulliford、Conn.)または他の適切な半導体配列決定法を使用して検出することもできる。
【0082】
D.追加の低分子非コードRNA検出ツール
RNaseマッピングを使用して低分子非コードRNAを定量するために、質量分析を使用することができる。単離されたRNAを、MSまたはタンデムMS(MS/MS)アプローチによるそれらの解析前に、高い特異性を有するRNAエンドヌクレアーゼ(RNase)(例えば、全ての未修飾グアノシン残基の3’側で切断するRNase Tl)で酵素的に消化することができる。開発された第1の手法は、ESIーMSに直接カップリングした逆相HPLCによるエンドヌクレアーゼ消化物のオンラインクロマトグラフィー分離を利用した。RNA配列に基づき予想される質量からの質量シフトによって、転写後修飾の存在を明らかにすることができる。次に、異常な質量/電荷値のイオンをタンデムMS配列決定のために単離して、転写後改変ヌクレオシドの配列の配置を突き止めることができる。
【0083】
マトリックス支援レーザ脱離/イオン化質量分析(MALDI-MS)も、転写後修飾ヌクレオシドに関する情報を得るための解析手法として使用されている。MALDIベースの手法は、分離ステップによってESIベースの手法と区別することができる。MALDI-MSでは、質量分析計が使用され、低分子非コードRNAが分離される。
【0084】
限られた量のインタクトな低分子非コードRNAを解析するために、カスタム製造ナノスプレーイオン源、Nanovolume Valve(Valco Instruments)、およびスプリットレスナノHPLCシステム(DiNa,KYA Technologies)を備えた、リニアイオントラップ-オービトラップハイブリット質量分析計(LTQ Orbitrap XL,Thermo Fisher Scientific)またはタンデム四重極型飛行時間型質量分析計(QSTAR XL,Applied Biosystems)を使用することによって、ナノESI-MSとカップリングしたキャピラリーLCシステムを使用することができる。分析物/TEAAがナノ-LCトラップカラムにロードされ、脱塩され、次いで濃縮される。インタクトな低分子非コードRNAがトラップカラムから溶出され、Cl8キャピラリーカラムに直接注入され、漸増する極性の溶媒勾配を使用するRP-HPLCによってクロマトグラフィー分離される。ネガティブ極性モードでイオンをスキャン可能にするイオン化電圧を使用して、キャピラリーカラムに結合したスプレイヤー先端からクロマトグラフィー溶出液がスプレーされる。
【0085】
低分子非コードRNAの検出および測定のための追加の方法としては、例えば、ストランド侵入アッセイ法(Third Wave Technologies,Inc.)、表面プラズモン共鳴法(SPR)、cDNA、MTDNA(メタリックDNA;Advance Technologies、Saskatoon、SK)、およびUS Genomicsによって開発されたものなどの一分子方法が挙げられる。表面酵素反応をナノ粒子増幅SPRイメージング(SPRI)と組み合わせた新規な手法を使用するマイクロアレイ形式で、複数の低分子非コードRNAを検出することができる。ポリ(A)ポリメラーゼの表面反応は、ロックド核酸(LNA)マイクロアレイ上にハイブリダイズされた低分子非コードRNAにポリ(A)テールを作り出す。次いで、DNA修飾されたナノ粒子がポリ(A)テールに吸着され、SPRIで検出される。この超高感度ナノ粒子増幅SPRI方法をアトモルレベルの低分子非コードRNAプロファイリングのために使用することができる。
【0086】
E.増幅されたかまたは増幅されていない低分子非コードRNAの検出
ある種の実施形態では、標識、色素、または標識プローブおよび/またはプライマーが、増幅されたかまたは増幅されていない低分子非コードRNAを検出するために使用される。当業者は、検出法の感度および標的の存在量に基づいて、どの検出法が適切であるかが分かるであろう。検出法の感度および標的の存在量に応じて、検出の前に増幅が必要とされても必要とされなくてもよい。当業者は、低分子非コードRNAを増幅することが好ましい検出法が分かるであろう。
【0087】
プローブまたはプライマーは、標準的な塩基(A、TまたはU、G、およびC)または修飾塩基を含み得る。修飾塩基としては、例えば、米国特許第5,432,272号、同5,965,364号、および同6,001,983号に記載されているAEGIS塩基(Eragen Biosciencesから入手)が挙げられるが、これに限定されない。ある種の態様では、塩基は、天然のホスホジエステル結合または異なる化学結合で連結されている。異なる化学結合としては、例えば、米国特許第7,060,809号に記載されているペプチド結合またはロックド核酸(LNA)による連結が挙げられるが、これらに限定されない。
【0088】
更なる態様では、増幅反応物中に存在するオリゴヌクレオチドプローブまたはプライマーは、時間の関数として産生された増幅産物の量をモニタリングするのに適切である。ある種の態様では、二本鎖特徴に対する異なる一本鎖特徴を有するプローブが、核酸を検出するために使用される。プローブとしては、5’-エキソヌクレアーゼアッセイ(例えば、TAQMAN)プローブ(米国特許第5,538,848号を参照のこと)、ステムループ分子ビーコン(米国特許第6,103,476号および同5,925,517号を参照のこと)、ステムレスまたは直鎖状ビーコン(WO9921881、米国特許第6,485,901号、および同6,649,349号を参照のこと)、ペプチド核酸(PNA)分子ビーコン(米国特許第6,355,421号および同6,593,091号を参照のこと)、直鎖状PNAビーコン(例えば、米国特許第6,329,144号を参照のこと)、非FRETプローブ(米国特許第6,150,097号を参照のこと)、Sunrise(商標)/AmplifluorB(商標)プローブ(米国特許第6,548,250号を参照のこと)、ステムループおよび二重鎖SCORPIONプローブ(米国特許第6,589,743号を参照のこと)、バルジループプローブ(米国特許第6,590,091号を参照のこと)、シュードノットプローブ(米国特許第6,548,250号を参照のこと)、サイクリコン(米国特許第6,383,752号を参照のこと)、MGB Eclipse(商標)プローブ(Epoch Biosciences)、ヘアピンプローブ(米国特許第6,596,490号を参照のこと)、PNAライトアッププローブ、アンチプライマークエンチプローブ(Li et al.,Clin.Chem.53:624-633(2006))、自己組織化ナノ粒子プローブ、および例えば、米国特許第6,485,901号に記載されているフェロセン修飾されたプローブが挙げられるが、これらに限定されない。
【0089】
ある種の実施形態では、増幅反応におけるプライマーのうちの1つ以上が、標識を含み得る。更に他の実施形態では、異なるプローブまたはプライマーは、互いに識別可能な検出可能な標識を含む。幾つかの実施形態では、プローブまたはプライマーなどの核酸は、2つ以上の識別可能な標識で標識され得る。
【0090】
一部の態様では、標識は、1つ以上のプローブに結合されており、以下の特性のうちの1つ以上を有する:(i)検出可能なシグナルを提供する;(ii)第2の標識と相互作用し、第2の標識、例えば、FRET(蛍光共鳴エネルギー移動)によって提供される検出可能なシグナルを修飾する;(iii)ハイブリダイゼーション(例えば、二本鎖形成)を安定化する;および(iv)結合複合体または親和性セット、例えば、親和性複合体、抗体抗原複合体、イオン結合型錯体、ハプテンリガンド(例えば、ビオチン-アビジン)のメンバーを提供する。更に他の態様では、標識の使用は、既知の標識、結合、連結基、試薬、反応条件、ならびに解析法および精製法を使用する多数の既知の技術のいずれかを使用して達成され得る。
[00100]低分子非コードRNAは、直接的または間接的な方法によって検出され得る。直接的な検出法では、1つ以上の低分子非コードRNAは、核酸分子に連結された検出可能な標識によって検出される。かかる方法では、低分子非コードRNAは、プローブに結合する前に標識され得る。したがって、結合は、プローブに結合している標識された低分子非コードRNAをスクリーニングすることによって検出される。プローブは、所望により、反応容量中のビーズに連結され得る。
【0091】
ある種の実施形態では、核酸は、標識プローブとの直接的な結合によって検出され、その後にプローブが検出される。本発明の一実施形態では、増幅された低分子非コードRNAなどの核酸は、所望の核酸を捕捉するためのプローブと複合化されたFlexMAPミクロスフェア(Luminex)を使用して検出される。幾つかの方法は、例えば、蛍光標識により修飾されたポリヌクレオチドプローブによる検出または分岐DNA(bDNA)検出を伴い得る。
【0092】
幾つかの実施形態では、バイオマーカーの発現は、各バイオマーカーに特異的なプライマーおよび/またはプローブを含むPCRベースのアッセイを使用して測定される。本明細書で使用する場合、用語「プローブ」は、特に目的とする標的生体分子と選択的に結合することができる任意の分子を指す。本明細書において、幾つかの実施形態では、用語「プローブ」は、本明細書において開示される基質および/または反応産物および/またはプロテアーゼのいずれかと、間接的または直接的に、共有結合的または非共有結合的に結合または会合し得る任意の分子を指し、その会合または結合は、本明細書において開示される方法を使用して検出可能である。幾つかの実施形態では、プローブは、発蛍光性プローブ、抗体、または吸光度ベースのプローブである。吸光度ベースのプローブである場合、発色団であるpNA(パラニトロアニリン)が、本明細書において開示される標的核酸配列の検出および/または定量化のためのプローブとして使用され得る。幾つかの実施形態では、プローブは、酵素に曝露された際に発蛍光性になる発蛍光性分子または基質を含む核酸配列であり得、当該核酸配列は、表1、2および/または3における核酸配列のいずれかまたは組み合わせに対する70%、80%、81%、82%、83%、84、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または約100%の配列同一性を含む核酸配列の断片に相補的である。
【0093】
標的分子は、表1、2、および/または3において特定される核酸配列のいずれかまたは組み合わせであり得る。幾つかの実施形態では、標的分子は、表1、2および/または3における核酸配列のいずれかまたは組み合わせに対する70%、80%、81%、82%、83%、84、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または約99%の配列同一性を含む核酸配列である。プローブは、既知の技術を使用して当業者によって合成されてもよく、または生物学的調製物に由来してもよい。プローブとしては、RNA、DNA、タンパク質、ペプチド、アプタマー、抗体、および有機分子が挙げられるが、これらに限定されない。用語「プライマー」または「プローブ」は、特定の配列を有するオリゴヌクレオチドまたは特定の配列を有するオリゴヌクレオチドを包含する。幾つかの実施形態では、標的分子は、表1、2および/または3において特定される核酸配列のいずれかもしくは組み合わせおよび/または表1、2および/または3における核酸配列のいずれかまたは組み合わせに対する70%、80%、81%、82%、83%、84、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または約99%の配列同一性を含む核酸配列のいずれかもしくは組み合わせの任意の増幅された断片である。
【0094】
他の実施形態では、核酸は、間接的な検出法によって検出される。例えば、ビオチン化プローブは、結合した核酸を検出するために、ストレプトアビジンと複合化された色素と組み合わされ得る。ストレプトアビジン分子は、増幅された低分子非コードRNA上のビオチン標識と結合し、結合した低分子非コードRNAは、ストレプトアビジン分子に結合された色素分子を検出することによって検出される。一実施形態では、ストレプトアビジンと複合化された色素分子は、PHYCOLINKを含む。Streptavidin R-Phycoerythrin(PROzyme)。他の複合化された色素分子は、当業者に公知である。
【0095】
標識としては、検出可能な蛍光、化学発光、または生物発光シグナルを発生させるかまたは消光する発光化合物、光散乱化合物、および光吸収化合物が挙げられるが、これらに限定されない(例えば、Kricka,L.,Nonisotopic DNA Probe Techniques,Academic Press,San Diego(1992)およびGarman A.,Non-Radioactive Labeling,Academic Press(1997)を参照のこと)。レポーターフルオロフォアおよびクエンチャーフルオロフォアを含む二重標識蛍光プローブが、幾つかの実施形態において使用される。異なる発光スペクトルを有するフルオロフォアの対が、これらを容易に区別できるように選択されることが理解されるであろう。
【0096】
特定の実施形態では、標識は、二本鎖のハイブリダイゼーションを増強するか、安定化させるか、またはこれに影響を及ぼすハイブリダイゼーション安定化部分、例えば、挿入剤または挿入色素(臭化エチジウムおよびSYBR-Greenが挙げられるが、これらに限定されない)、小溝結合剤、および架橋官能基である(例えば、Blackburn et al.,eds.“DNA and RNA Structure” in Nucleic Acids in Chemistry and Biology(1996)を参照のこと)。
【0097】
他の実施形態では、低分子非コードRNAを定量化するためにハイブリダイゼーションおよび/またはライゲーションに基づく方法が使用され得、これにはオリゴヌクレオチドライゲーション(OLA)法および標的核酸配列にハイブリダイズしている、区別可能なプローブが未結合のプローブから分離されるのを可能にする方法が挙げられる。一例として、米国特許出願公開第2006/0078894号において開示されるHARP様プローブが、miRNAの量を測定するために使用され得る。かかる方法では、プローブと標的化核酸との間のハイブリダイゼーション後に、ハイブリダイズしたプローブをハイブリダイズしていないプローブと区別するために、プローブが修飾される。その後、プローブは、増幅および/または検出され得る。一般的に、プローブ不活性化領域は、プローブの標的ハイブリダイゼーション領域内のヌクレオチドのサブセットを含む。標的核酸にハイブリダイズしていないHARPプローブの増幅または検出を低減または防止するために、すなわち、標的核酸の検出を可能にするために、標的とされる核酸配列にハイブリダイズしているHARPプローブと対応するハイブリダイズしていないHARPプローブを区別することができる薬剤を使用して、ハイブリダイゼーション後のプローブ不活性化ステップが実行される。この薬剤は、ハイブリダイズしていないHARPプローブが増幅できないように、これを不活性化または修飾することができる。プローブライゲーション反応を使用して、低分子非コードRNAを定量化することもできる。多重ライゲーション依存性プローブ増幅法(Schouten et al.,Nucleic Acids Research 30:e57(2002))では、標的核酸上で互いに隣接して直ちにハイブリダイズするプローブ対は、標的核酸の存在により駆動されて、互いに連結される。幾つかの態様では、MLPAプローブは、隣接するPCRプライマー結合部位を有する。MLPAプローブは、連結される場合に特異的に増幅され、これにより、低分子非コードRNAバイオマーカーの検出および定量化を可能にする。
【0098】
低分子RNAバイオマーカーのレベルの検出
本明細書において記載される低分子非コードRNAバイオマーカーは、対象の乳癌の状態を評価するための診断試験において、個別にまたは組み合わせて使用され得る。乳癌の状態には、乳癌の存在または非存在が含まれる。乳癌の状態には、乳癌の経過をモニタリングすること、例えば、疾患の進行をモニタリングすることも含まれ得る。対象の乳癌の状態に基づいて、例えば、追加の診断試験または治療手段を含む追加の処置が指示され得る。
【0099】
一般に、診断試験が疾患の状態を正しく予測する能力は、アッセイの正確度、アッセイの感度、アッセイの特異性、または「曲線下面積」(AUC)、例えば、受信者動作特性(ROC)曲線下面積の観点から測定される。本明細書で使用する場合、正確度は、誤分類された試料の割合の尺度である。正確度は、例えば、試験集団における試料の総数で割った正しく分類された試料の総数として計算され得る。感度は、試験によって陽性であると予測される「真の陽性」の尺度であり、乳癌試料の総数で割った正しく特定された乳癌試料の数として計算され得る。特異性は、試験によって陰性であると予測される「真の陰性」の尺度であり、正常な試料の総数で割った正しく特定された正常な試料の数として計算され得る。AUCは、感度対偽陽性率(1-特異性)のプロットである受信者動作特性曲線の下面積の尺度である。AUCが大きいほど、試験の適中率は高くなる。試験の有用性の他の有用な尺度としては、陽性として試験される実際の陽性の百分率である「陽性適中率」、および陰性として試験される実際の陰性の百分率である「陰性適中率」が挙げられる。好ましい実施形態では、異なる乳癌の状態を有する対象に由来する試料中の1つ以上の低分子非コードRNAバイオマーカーのレベルは、適切な対照と比較して測定される場合、正常な対象と比較して少なくともp=0.05の、例えば、p=0.05、p=0.01、p=0.005、p=0.001などの統計学的有意差を示す。他の好ましい実施形態では、本明細書に記載の低分子非コードRNAバイオマーカーを個別にまたは組み合わせで使用する診断試験は、少なくとも約75%の正確度、例えば、少なくとも約75%、約80%、約85%、約90%、約95%、約97%、約99%、または約100%の正確度を示す。他の実施形態では、本明細書に記載の低分子非コードRNAバイオマーカーを個別にまたは組み合わせで使用する診断試験は、少なくとも約75%の特異性、例えば、少なくとも約75%、約80%、約85%、約90%、約95%、約97%、約99%、または約100%の特異性を示す。他の実施形態では、本明細書に記載の低分子非コードRNAバイオマーカーを個別にまたは組み合わせで使用する診断試験は、少なくとも約75%の感度、例えば、少なくとも約75%、約80%、約85%、約90%、約95%、約97%、約99%、または約100%の感度を示す。他の実施形態では、本明細書に記載の低分子非コードRNAバイオマーカーを個別にまたは組み合わせで使用する診断試験は、それぞれ少なくとも約75%の特異性および感度、例えば、少なくとも約75%、約80%、約85%、約90%、約95%、約97%、約99%、または約100%の特異性および感度を示す(例えば、少なくとも約80%の特異性および少なくとも約80%の感度、または例えば、少なくとも約80%の特異性および少なくとも約95%の感度)。
【0100】
表1、2および3に列挙する各バイオマーカーは、正常な対象と比較して乳癌を有する対象に由来する生体試料中に差次的に存在し、各々が、試験対象における乳癌の判定を容易にするのにそれぞれ有用である。このような方法は、対象に由来する試料中のバイオマーカーのレベルを測定することを伴う。試料中のバイオマーカーのレベルを判定することは、任意の適切な方法、例えば、本明細書に記載の方法を使用して試料中のバイオマーカーのレベルを測定、検出、または分析することを含み得る。試料中のバイオマーカーのレベルを判定することは、試料中のバイオマーカーのレベルを測定、検出、または検定したアッセイの結果を調査することも含み得る。上記方法は、試料中のバイオマーカーのレベルを適切な対照と比較することも伴い得る。適切な対照を使用して評価される場合、バイオマーカーのレベルの正常な対象のそれに対する変化は、対象の乳癌の状態を示す。対象が特定の乳癌の状態を有さないと分類される上限または下限のバイオマーカーの量を示すバイオマーカーの診断量が使用され得る。例えば、乳癌を有する個体に由来する試料において、上記バイオマーカーが正常な個体と比較して上方調節される場合、診断的カットオフを超える測定量は、乳癌の診断を提供する。一般に、表1~3の個々の低分子非コードRNAバイオマーカーは、乳癌試料において正常な個体から取得される試料と比較して上方調節される。当該技術分野において良く理解されているように、アッセイにおいて使用される特定の診断的カットオフを調整することは、所望する通りに診断アッセイの感度および/または特異性を調整することを可能にする。特定の診断的カットオフは、例えば、異なる乳癌の状態を有する対象由来の統計的に有意な数の試料におけるバイオマーカーの量を測定すること、および所望のレベルの正確度、感度、および/または特異性でカットオフを導くことによって判定され得る。ある種の実施形態では、診断的カットオフは、本明細書に記載されるように、分類アルゴリズムの援助によって判定され得る。
【0101】
したがって、対象由来の循環低分子非コードRNAを含有する試料中の少なくとも1つの低分子非コードRNAのレベルを判定することによって対象における乳癌を診断するための方法であって、少なくとも1つの低分子非コードRNAのレベルの正常な対象のそれに対する差(適切な対照と比較して判定される)が、対象における乳癌の存在を示す方法が提供される。一実施形態では、少なくとも1つの低分子非コードRNAには、好ましくは表1からの1つ以上の低分子非コードRNAが含まれる。一実施形態では、少なくとも1つの低分子非コードRNAには、好ましくは表2からの1つ以上の低分子非コードRNAが含まれる。一実施形態では、少なくとも1つの低分子非コードRNAには、好ましくは表3からの1つ以上の低分子非コードRNAが含まれる。例えば、本発明は、対象に由来する循環低分子非コードRNAを含有する試料中の少なくとも1つの低分子非コードRNAのレベルを判定する方法であって、少なくとも1つの低分子非コードRNAのレベルの対照と比較した増加が、対象における乳癌の存在を示す方法を提供する。
【0102】
所望により、本発明の方法は、試料中の少なくとも1つの低分子非コードRNAのレベルに基づいて、対象が乳癌を有するかまたは有さないという診断を提供することを更に含み得る。加えて、またはあるいは、本発明の方法は、適切な対照と比較した少なくとも1つの低分子非コードRNAのレベルの差またはレベルを対象における乳癌の診断と関連付けることを更に含み得る。幾つかの実施形態では、かかる診断は、対象に直接的に提供されてもよく、対象の介護に関与する別の関係者に提供されてもよい。
【0103】
本明細書において示されるように、個々の低分子非コードRNAバイオマーカーは、乳癌の診断応用に有用であるが、低分子非コードRNAバイオマーカーの組み合わせは、単独で使用した場合の低分子非コードRNAバイオマーカーよりも乳癌の状態のより高い適中率を提供し得る。具体的には、複数の低分子非コードRNAバイオマーカーの検出は、診断試験の正確度、感度、および/または特異性を増加させ得る。例示的な低分子非コードRNAバイオマーカーおよびバイオマーカーの組み合わせを、表1に示す。例示的な低分子非コードRNAバイオマーカーおよびバイオマーカーの組み合わせを、表2に示す。例示的な低分子非コードRNAバイオマーカーおよびバイオマーカーの組み合わせを、表3に示す。本発明には、これらの表に記載されるような個々のバイオマーカーおよびバイオマーカーの組み合わせ、ならびに本明細書に記載の方法およびキットにおけるそれらの使用が含まれる。
【0104】
したがって、対象由来の循環低分子非コードRNAを含有する試料中の2つ以上の低分子非コードRNAのレベルを判定することによって対象における乳癌を診断するための方法であって、低分子非コードRNAのレベルの正常な対象のそれに対する差(適切な対照と比較して判定される)が、対象における乳癌の存在を示す方法が提供される。一実施形態では、低分子非コードRNAには、好ましくは表1に示す低分子非コードRNAのうちの1つ以上が含まれる。一実施形態では、低分子非コードRNAには、好ましくは表2に示す低分子非コードRNAのうちの1つ以上が含まれる。一実施形態では、低分子非コードRNAには、好ましくは表3に示す低分子非コードRNAのうちの1つ以上が含まれる。
【0105】
対象由来の循環低分子非コードRNAを含有する試料中の2つ以上の低分子非コードRNAのレベルを判定すること、試料中の2つ以上の低分子非コードRNAのレベルを正常な対象および乳癌を有する対象において存在する同一の低分子非コードRNAのレベルを示すデータセットと比較すること、および対象を比較に基づいて乳癌を有するまたは有さないと診断することによる対象における乳癌を診断する方法も提供される。このような方法では、データセットは、対象由来の試料との比較のための適切な対照または参照標準として機能する。
【0106】
対象由来の試料のデータセットとの比較は、試料中の2つ以上の低分子非コードRNAの総体的レベルと正常な対象または乳癌を有する対象において存在する同一の低分子非コードRNAのレベルとの間に統計学的有意差が存在するか否か計算する分類アルゴリズムによって援助され得る。
【0107】
がんの状態を評価するための分類アルゴリズムの生成
幾つかの実施形態では、「既知の試料」などの試料を使用して生成されるデータは、次いで、分類モデルを「訓練する」ために使用され得る。「既知の試料」は、事前に分類された、例えば、正常な対象または乳癌を有する対象に由来するとして分類された試料である。スペクトルに由来し、分類モデルを形成するために使用されるデータは、「訓練データセット」と称され得る。一旦訓練されると、分類モデルは、未知の試料を使用して生成されるスペクトルに由来するデータのパターンを認識することができる。分類モデルは、次いで、未知の試料をクラスに分類するために使用され得る。これは、例えば、特定の生体試料がある種の生物学的状態(例えば、発症している対発症していない)に関連付けられるか否かを予測するのに有用であり得る。
【0108】
幾つかの実施形態では、分類モデルを形成するために使用される訓練データセットのためのデータは、定量PCR(例えば、ダブルデルタCt法を使用して取得されたCt値)から、またはマイクロアレイ分析などのハイスループット発現プロファイリング(例えば、低分子非コードRNA発現アッセイからの総カウント数または正規化されたカウント数)から直接的に取得され得る。
【0109】
分類モデルは、データに存在する目的パラメータに基づいてデータの集合体をクラスに分離することを試みる任意の適切な統計的分類(または「学習」)法を使用して形成され得る。分類法は、教師ありまたは教師なしのいずれかであり得る。教師ありおよび教師なし分類プロセスの例は、Jain,「Statistical Pattern Recognition:A Review」,IEEE Transactions on Pattern Analysis and Machine Intelligence,Vol.22,No.1,January 2000に記載されており、その教示は参照により組み込まれる。
【0110】
教師あり分類では、既知の分類の例を含有する訓練データが、既知のクラスの各々を定義する関係のうちの1つ以上のセットを学習する学習機構に掲示される。次いで、新しいデータが学習機構に適用され得、次いで、学習機構は学習した関係を使用して新しいデータを分類する。教師あり分類プロセスの例としては、線形回帰プロセス(例えば、多重線形回帰(MLR)、部分最小二乗(PLS)回帰、および主成分退縮(PCR))、2分決定木(例えば、CART―分類木と回帰木―などの再帰分割プロセス)、逆伝播ネットワークなどの人工ニューラルネットワーク、判別解析(例えば、ベイズ分類器またはフィッシャー解析)、ロジスティック分類器、およびサポートベクトル分類器(サポートベクトルマシン)が挙げられる。
【0111】
他の実施形態では、作成される分類モデルは、教師なし学習法を使用して形成され得る。教師なし分類は、訓練データセットが由来したスペクトルを事前に分類することなく、訓練データセットにおける類似性に基づいて、分類の学習を試みる。教師なし学習法には、クラスター解析が含まれる。クラスター解析は、互いに非常に類似し、他のクラスターのメンバーと非常に異なるメンバーを理想的には有するべきである「クラスター」または群にデータを区分することを試みる。次いで、データ項目間の距離を測定する幾つかの距離メトリックを使用して、類似度が測定され、これにより、互いにより近いデータ項目を一緒にクラスター化する。クラスター化技術としては、マッキーンのK平均アルゴリズムおよびコホーネンの自己組織化マップアルゴリズムが挙げられる。生物学的情報の分類における使用が主張されている学習アルゴリズムは、例えば、国際特許公開第WO01/31580(Barnhill et al.,「Methods and devices for identifying patterns in biological systems and methods of use thereof」)、米国特許出願番号第2002 0193950 A1号(Gavin et al,「Method or analyzing mass spectra」)、米国特許出願番号第2003 0004402 A1号(Hitt et al.,「Process for discriminating between biological states based on hidden patterns from biological data」)、および米国特許出願番号第2003 0055615 A1号(Zhang and Zhang,「Systems and methods for processing biological expression data」)に記載されている。前述の特許出願の内容は、参照によりその全体が本明細書に組み込まれる。
【0112】
分類モデルは、任意の好適なデジタルコンピュータ上で形成され、使用され得る。好適なデジタルコンピュータとしては、Unix(登録商標)、Windows(登録商標)、またはLinux(登録商標)ベースのオペレーティングシステムなどの任意の標準的または特殊なオペレーティングシステムを使用するマイクロ、小型、または大型コンピュータが挙げられる。
【0113】
訓練データセット(複数可)および分類モデルは、デジタルコンピュータにより実行または使用されるコンピュータコードによって表現され得る。コンピュータコードは、光ディスクまたは磁気ディスク、スティック、テープ等を含む任意の適切なコンピュータ読み取り可能なメディア上に記憶され得、C、C++、visual basic等の任意の適切なコンピュータプログラミング言語で記述され得る。
【0114】
上記の学習アルゴリズムは、乳癌の低分子非コードRNAバイオマーカーのための分類アルゴリズムを開発するために使用され得る。次に、分類アルゴリズムは、単独でまたは組み合わされて使用されるバイオマーカーについての診断値(例えば、カットオフ点)を提供することにより、診断試験において使用され得る。
【0115】
追加の診断試験
乳癌の存在を示す低分子非コードRNAバイオマーカーのレベルは、対象における乳癌の独立した診断上の指標として使用され得る。所望により、本発明の方法は、乳癌の診断を容易にする少なくとも1つの追加の試験の実行を含み得る。例えば、乳癌の診断を容易にするために、1つ以上の低分子非コードRNAバイオマーカーのレベルを判定することに加えて他の試験が、実行され得る。乳癌の診断を容易にするために臨床診療において使用される任意の他の試験または試験の組み合わせが、本明細書に記載の低分子非コードRNAバイオマーカーと共に使用され得る。
【0116】
処置方法
本明細書に記載の方法によって対象が乳癌と診断される幾つかの実施形態では、本発明は、乳癌を有することが確認されたかかる対象を処置する方法を更に提供する。したがって、一実施形態において、本発明は、対象における乳癌を処置する方法であって、対象に由来する試料中の少なくとも1つの低分子非コードRNAバイオマーカーのレベルを判定することであって、適切な対照と比較して判定される、少なくとも1つの低分子非コードRNAバイオマーカーのレベルの正常な対象におけるそれに対する差が対象における乳癌の存在を示す、判定すること、および対象に治療上有効量の乳癌治療薬を投与することを含む方法に関する。別の実施形態では、本発明は、乳癌を有する対象を処置する方法であって、適切な対照と比較して判定されるように、対象に由来する試料中の少なくとも1つの低分子非コードRNAバイオマーカーのレベルが、正常な対象におけるそれに対して異なる(例えば、増加している)乳癌を有する対象を特定すること、および対象に治療上有効量の乳癌治療薬を投与することを含む方法に関する。
【0117】
用語「乳癌治療薬」には、例えば、乳癌の処置のためのU.S.Food and Drug Administrationにより認可された物質が含まれる。乳癌を処置するための認可された薬物としては、アベマシクリブ、アビトレキサート(メトトレキサート)、アブラキサン(パクリタキセル・アルブミン安定化小粒子製剤)、アドトラスツズマブエムタンシン、アフィニトール(エベロリムス)、アナストロゾール、アレディア(パミドロン酸二ナトリウム)、アリミデックス(アナストロゾール)、アロマシン(エキセメスタン)、カペシタビン、クラフェン(シクロホスファミド)、シクロホスファミド、シトキサン(シクロホスファミド)、ドセタキセル、ドキソルビシン塩酸塩、エレンス(エピルビシン塩酸塩)、エピルビシン塩酸塩、エリブリンメシル酸塩、エベロリムス、エキセメスタン、5-FU(フルオロウラシル注射薬)、フェアストン(トレミフェン)、フェソロデックス(フルベストラント)、フェマーラ(レトロゾール)、フルオロウラシル注射薬、FOLEX(メトトレキサート)、Folex PFS(メトトレキサート)、フルベストラント、ゲムシタビン塩酸塩、ゲムザール(ゲムシタビン塩酸塩)、ゴセレリン酢酸塩、ハラヴェン(エリブリンメシル酸塩)、ハーセプチン(トラスツズマブ)、イブランス(パルボシクリブ)、イクサベピロン、イグゼンプラ(イクサベピロン)、カドサイラ(アドトラスツズマブエムタンシン)、キスカリ(リボシクリブ)、ラパチニブ、ジトシラート、レトロゾール、酢酸メゲストロール、メトトレキサート、メトトレキサート LPF(メトトレキサート)、Mexate(メトトレキサート)、Mexate-AQ(メトトレキサート)、Neosar(シクロホスファミド)、ネラチニブマレイン酸塩、Nerlynx(ネラチニブマレイン酸塩)、ノルバデックス(タモキシフェンクエン酸塩)、パクリタキセル、パクリタキセル・アルブミン安定化小粒子製剤、パルボシクリブ、パミドロン酸二ナトリウム、Perjeta(ペルツズマブ)、ペルツズマブ、リボシクリブ、タモキシフェンクエン酸塩、タキソール(パクリタキセル)、タキソテール(ドセタキセル)、チオテパ、トレミフェン、トラスツズマブ、タイケルブ(ラパチニブトシル酸塩二水和物)、Velban(ビンブラスチン硫酸塩)、Velsar(ビンブラスチン硫酸塩)、Verzenio(アベマシクリブ)、ビンブラスチン硫酸塩、ゼローダ(カペシタビン)、ゾラデックス(ゴセレリン酢酸塩)が挙げられるが、これらに限定されない。
【0118】
乳癌治療薬は、医薬組成物を使用して対象に投与され得る。適切な医薬組成物は、薬学的に有効な量の乳癌治療薬(またはその薬学的に許容される塩もしくはエステル)を含み、所望により薬学的に許容される担体を含む)。ある種の実施形態では、これらの組成物は、所望により1つ以上の追加の治療薬を更に含む。
【0119】
本明細書で使用する場合、用語「薬学的に許容される塩」は、適切な医学的判断の範囲内で、過度の毒性、刺激作用、アレルギー応答などを伴わずにヒトおよび下等動物の組織と接触して使用されるのに適切であり、妥当な利益/リスク比に対応する塩を指す。アミン、カルボン酸、および他のタイプの化合物の薬学的に許容される塩は、当該技術分野において周知である。例えば、S.M.Bergeらは、薬学的に許容される塩を、参照により本明細書に組み入れられる、J.Pharmaceutical Sciences,66:1-19(1977)において詳細に記載している。塩は、本発明の化合物の最後の単離および精製中にその場で、または別途、遊離塩基または遊離酸官能基を、適切な試薬と反応させることによって調製され得る。例えば、遊離塩基官能基は、適切な酸と反応し得る。更に、本発明の化合物が酸性部分を保有する場合、その適切な薬学的に許容される塩としては、アルカリ金属塩(例えばナトリウムまたはカリウム塩)およびアルカリ土類金属塩(例えばカルシウムまたはマグネシウム塩)などの金属塩が挙げられる。
【0120】
本明細書で使用する場合、用語「薬学的に許容されるエステル」は、インビボで加水分解するエステルを指し、人体内で容易に分解し、親化合物またはその塩を残すものが挙げられる。適切なエステル基としては、例えば、薬学的に許容される脂肪族カルボン酸から誘導されるもの、特にアルキルまたはアルケニル部分がそれぞれ有利には6個以下の炭素原子を有するアルカン酸、アルケン酸、シクロアルカン酸、およびアルカンジオン酸(alkanedioic acids)が挙げられる。
【0121】
前述したように、医薬組成物は、薬学的に許容される担体を付加的に含み得る。担体という用語には、所望の特定の剤形を調製するのに適したあらゆる溶媒、希釈剤、または他の液状ビヒクル、分散または懸濁助剤、表面活性剤、等張剤、増粘剤または乳化剤、防腐剤、固体の結合剤、滑沢剤などが含まれる。Remington’s Pharmaceutical Sciences,Sixteenth Edition,E.W.Martin(Mack Publishing Co.,Easton,Pa.,1980)は、医薬組成物を製剤化する際に使用される様々な担体およびその調製のための既知の技術を開示している。薬学的に許容される担体として機能し得る材料の幾つかの例としては、ラクトース、グルコース、およびスクロースなどの糖;トウモロコシデンプンおよびジャガイモデンプンなどのデンプン;カルボキシメチルセルロースナトリウム、エチルセルロース、および酢酸セルロースなどのセルロースおよびその誘導体;トラガント末;麦芽;ゼラチン;タルク;ココアバターおよび座薬ワックスなどの賦形剤;落花生油、綿実油などの油;サフラワー油、ゴマ油;オリーブ油;トウモロコシ油およびダイズ油;グリコール類;プロピレングリコールなど;オレイン酸エチルおよびラウリン酸エチルなどのエステル;寒天;水酸化マグネシウムおよび水酸化アルミニウムなどの緩衝剤;アルギン酸;発熱物質を含まない水;等張食塩水;リンガー液;エチルアルコール、ならびにリン酸緩衝液が挙げられるが、これらに限定されず、加えて、ラウリル硫酸ナトリウムおよびステアリン酸マグネシウムなどの他の非毒性の相溶性のある滑沢剤、ならびに着色剤、放出剤、コーティング剤、甘味料、香味料および芳香剤、防腐剤および抗酸化物質も、配合者の判断により組成物中に存在し得る。
【0122】
本発明に使用するための組成物は、任意の濃度の所望の乳癌治療薬を有するように製剤化され得る。好ましい実施形態では、組成物は、治療上有効量の乳癌治療薬を含むように製剤化される。
【0123】
本開示は、一般に、良性、前悪性、または悪性の過剰増殖性細胞を有する対象を診断する方法であって、試料中の少なくとも1つの非コードRNAまたはその機能的断片の存在、非存在、および/または量を検出するステップを含む方法に関する。幾つかの実施形態では、検出するステップは、対象(例えばヒト対象)由来の試料を1つまたは複数のプローブに曝露することであって、各プローブが試料中の1つまたは複数の非コードRNA分子と結合することができる、曝露することを含む。幾つかの実施形態では、プローブは、表1、2、および/または3の任意の核酸配列に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%の配列相同性または配列同一性を含む核酸分子(DNA、RNAまたはこれらのハイブリッド)である。幾つかの実施形態では、プローブは、配列番号:3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%の配列相同性または配列同一性を含む核酸分子(DNA、RNAまたはこれらのハイブリッド)である。幾つかの実施形態では、プローブは、各チミンがウラシルに置換されている、配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%の配列相同性または配列同一性を含むRNA配列である核酸分子(DNA、RNAまたはこれらのハイブリッド)である。幾つかの実施形態では、複数のプローブは、配列番号:3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%の配列相同性または配列同一性を含む核酸配列に相補的なRNAである核酸配列のうちの1つまたは組み合わせである。幾つかの実施形態では、複数のプローブは、以下から選択される核酸配列のうちの1つまたは組み合わせである:配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191。幾つかの実施形態では、複数のプローブは、以下から選択される核酸配列に相補的な核酸配列のうちの1つまたは組み合わせである:配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191。
【0124】
本開示の方法の実施形態のいずれかでは、対象は、乳癌を有すると診断されたかまたは疑われるヒトであり得る。検出するステップが対象から試料を得るステップの後にある、本開示の方法の実施形態のいずれかでは。
【0125】
幾つかの実施形態では、プローブまたは複数のプローブは、配列番号:3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列相同性または配列同一性を含む核酸分子(DNA、RNA、またはこれらのハイブリッド)に結合するCDRを含む1つまたは複数の抗体または抗体断片である。幾つかの実施形態では、プローブまたは複数個のプローブは、配列の各々が、配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191の各々におけるチミンがウラシルに置換されように修飾されている、配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、または配列番号191に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列相同性または配列同一性を含む核酸分子(DNA、RNA、またはこれらのハイブリッド)に結合するCDRを含む1つまたは複数の抗体または抗体断片である。実施形態のうちの幾つかでは、本発明の方法は、試料を1つまたは複数のプローブに曝露させる前に試料からRNAを単離することを更に含む。幾つかの実施形態では、本発明の方法は、試料中の非コードRNAの半定量もしくは定量PCRまたは配列解析を実行することによって試料中の低分子RNA(smRNA)などの非コードRNAの量を検出または定量化することを含む。プローブは、一本鎖のヌクレオチド配列が対象由来の非コードRNAを含む試料に曝露されるように、ELISAプレート、プラスチック、スライドガラス、マイクロアレイ、シリカチップ、または他の表面などの固体支持体に固定化され得る。幾つかの実施形態では、プローブは、約5~約100ヌクレオチドの長さを含み得、表1、2、および/もしくは3の配列のいずれかまたは表1、2、および/もしくは3に記載される配列のうちのRNAもしくはDNAでの任意の相補配列を含む。本開示の方法の実施形態のいずれかでは、試料中の少なくとも1つの非コードRNAまたは非コードRNAのうちの1つに対して少なくとも70%相同なその相同配列の存在、非存在、および/または量を検出するステップは、化学発光プローブ、蛍光プローブ、および/または蛍光顕微鏡法を使用して、検出可能なプローブのシグナルを非コードRNAの存在と関連付けることによって存在または量を計算することを含む。
【0126】
本開示は、一般に、試料中のT3pの存在を検出すること、および試料中のT3pの存在を乳癌の存在に関連付けることに関する。また本開示は、配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148、もしくは配列番号191または配列識別子のいずれかにおけるチミンのうちの1つ以上がウラシルに置換されているこれらのRNA分子に対する少なくとも70%、80%、85%、90%、95%、96%、97%、98%、99%または100%の配列相同性または配列同一性を含む、からなる、または本質的にからなる核酸分子(DNA、RNAまたは、これらのハイブリッド)の存在を検出することにも関する。幾つかの実施形態では、固体支持体上のプローブまたは複数のプローブは、約5~約1000ヌクレオチド長である配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148または配列番号191に対する配列相補性を含む。幾つかの実施形態では、固体支持体上のプローブまたは複数のプローブは、約5~約500ヌクレオチド長である配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148または配列番号191に対する配列相補性を含む。幾つかの実施形態では、固体支持体上のプローブまたは複数のプローブは、約5~約100ヌクレオチド長である配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148または配列番号191に対する配列相補性を含む。幾つかの実施形態では、固体支持体上のプローブまたは複数のプローブは、約5~約50ヌクレオチド長である配列番号3、配列番号19、配列番号32、配列番号40、配列番号41、配列番号79、配列番号82、配列番号83、配列番号126、配列番号148または配列番号191に対する配列相補性を含む。
【0127】
幾つかの実施形態では、本明細書において開示される方法のいずれかは、表1、2、および/もしくは3またはこれらの任意の組み合わせにおいて開示されるものなどの非コードRNAの存在または量を、対象が乳癌などのがんを有する可能性に関連付けるステップを更に含む。
【0128】
検出低分子RNAバイオマーカーのためのキット
別の態様では、本発明は、対象における乳癌の状態を診断するためのキットであって、表1、表2、または表3およびこれらの組み合わせ(ここで、配列は所望により、開示されたチミンのうちの1つ、2つ以上または全ての代わりにウラシルを含む)の低分子非コードRNAバイオマーカーのうちの1つ以上のレベルを判定するのに有用であるキットを提供する。一実施形態では、1つ以上の低分子非コードRNAは、表1に列挙されるバイオマーカーから選択される。一実施形態では、2つ以上の低分子非コードRNAは、表2に列挙されるバイオマーカーから選択される。一実施形態では、3つ以上の低分子非コードRNAは、表3に列挙されるバイオマーカーから選択される。キットは、対象に由来する試料中の、乳癌の診断に役立つ低分子非コードRNAまたは一群の低分子非コードRNAの存在を選択的に検出するのに適した材料および試薬を含み得る。例えば、一実施形態では、キットは、低分子非コードRNAに特異的にハイブリダイズする試薬を含み得る。かかる試薬は、低分子非コードRNAを検出するのに好適な形態の核酸分子、例えば、プローブまたはプライマーであり得る。キットは、1つ以上の低分子非コードRNAを検出するためのアッセイを実行するのに有用な試薬、例えば、qPCR反応で1つ以上の低分子非コードRNAを検出するために使用され得る試薬を含み得る。同様にキットは、1つ以上の低分子非コードRNAを検出するのに有用なマイクロアレイを含むことができる。
【0129】
更なる実施形態では、キットは、ラベルまたは添付文書の形態の適切な操作パラメータについての使用説明書を含有し得る。例えば、使用説明書は、試料を収集する方法、試料中の1つ以上の低分子非コードRNAバイオマーカーのレベルを判定する方法、または試料中の1つ以上の低分子非コードRNAバイオマーカーのレベルを対象の乳癌の状態と関連付ける方法に関する情報または指示を含み得る。
【0130】
別の実施形態では、キットは、試験試料中のバイオマーカーを検出するためのアッセイの参照標準として、適切な対照として、または較正のために使用される低分子非コードRNAバイオマーカーの試料を有する1つ以上の容器を含有し得る。
【0131】
他の実施形態は、以下の非限定的な実施例に記載されている。特許、公開された出願、技術論文、および学術論文を含む様々な刊行物が、本明細書全体にわたって引用される。これらの引用された刊行物の各々は、参照によりその全体が本明細書に組み込まれる。
【実施例
【0132】
実施例1.方法
実施例2~6は、以下を含むがそれらに限定されない方法によって実施された。
【0133】
組織培養
MDA-MB-231およびMDA-LM2細胞を、10%ウシ胎児血清、L-グルタミン、ピルビン酸ナトリウム、ペニシリン-ストレプトマイシン、およびアンホテリシンを補足したダルベッコ培地で培養した。細胞株は、American Type and Culture Collection(ATCC)から入手し、プロトコールに従って成長させた。
【0134】
全ての細胞を、37℃、5%COの加湿インキュベーター内で培養した。MDA-MB-231、MDA-LM2、CN34-par、CN34-Lm1a、MCF7、およびMDA-MB-453細胞株を、4.5g/Lのグルコース、10%のFBS、4mMのL-グルタミン、1mMのピルビン酸ナトリウム、ペニシリン(100単位/mL)、ストレプトマイシン(100μg/mL)、およびアンホテリシン(1μg/mL)を補足したDMEMベースの培地で増殖させた。HCC1395、ZR-75-1、およびHCC38細胞株を、10%のFBS、2mMのL-グルタミン、ペニシリン(100単位/mL)、ストレプトマイシン(100μg/mL)、およびアンホテリシン(1μg/mL)を補足したRPMI 1640ベースの培地で増殖させた。SK-BR-3細胞株を、10%のFBS、ペニシリン(100単位/mL)、ストレプトマイシン(100μg/mL)、およびアンホテリシン(1μg/mL)を補足したマッコイ5a改変培地で増殖させた。HMECを、Thermo Fisher Scientificから入手し、既製のHuMEC培地(Thermo Fisher Scientific)で増殖させた。
【0135】
低分子RNAおよびエキソソームRNA抽出および配列決定細胞外小胞からのRNAの単離のための馴化培地および完全な馴化培地の調製を、7×10で細胞を播種することによって実施した。24時間後に、細胞をPBSで2回洗浄し、10mLのエキソソームを除去した培地を添加した。48時間後に、培地を、200×gで15分間遠心し、上澄みを取ることによって収集した。FBSをエキソソームを除去したFBS(Thermo Fisher Scientific)で代用することによって、エキソソームを除去した培地を調製した。エキソソームを除去したHMEC培地を、4℃にて100,000×gで16時間、ウシ脳下垂体抽出物の培地成分を遠心分離することによって調製した。
【0136】
細胞外小胞RNAを、Cell Culture Media Exosome Purification and RNA Isolation kit(Norgen Biotek)を使用して、上記で概説されるように調製された5mLの馴化培地から単離した。馴化培地からのRNAを、miRNeasy serum/plasma kit(Qiagen)を使用して400ulの完全な馴化培地から単離した。細胞内の全低分子RNA試料を、製造者のプロトコールに従ってNorgen Biotekの低分子RNA精製キットを使用して抽出した。その後にRNA試料を、製造者のプロトコール(Bioo Scientific)を使用してNEXTflex Small RNA Sequencing Kit v3を用いたハイスループットな配列決定用に調製した。次いで、得られたライブラリーを、製造者によって推奨される通りに配列決定し、処理した。要約すると、cutadapt(v1.4)を使用してアダプター配列を除去し、各リードの最初および最後の縮重配列をトリミングした。次いで、本発明者らはbowtie2(v2.3.3)を使用して、得られた配列をヒトゲノム(build hg38)とアラインメントした。次いで、得られたBAMファイルを、ソートし、更なる解析のためにBEDに変換した。細胞外小胞RNAを、製造者の使用説明書に従ってPlasma/serum Exosome Purification and RNA isolation kit(Norgen Biotek)を使用して血清試料から単離した。
【0137】
TCGA-BRCAからの低分子RNA配列決定データおよびTCGA-BRCAプロジェクトによるoncRNAリードの同定を、Genomic Data Commons(GDC)からBAMフォーマット(hg38)でダウンロードし、試料をGDC APIを使用して注釈付けした。BEDフォーマット変換の際に、Piranhaパッケージ40を使用して、発現された低分子RNAの遺伝子座を同定した。得られた遺伝子座を、mergeBedを使用した全ての試料間でマージして胸部組織および乳癌において発現された低分子RNA遺伝子座の網羅的なリストを作成した。
【0138】
乳癌細胞株およびHMECから取得された低分子RNA配列を列挙することによって、本発明者らは、各低分子RNA遺伝子座についてカウント表を生成した。次いで、本発明者らは、ライブラリーサイズで得られたテーブルを正規化し、3回のHMEC反復試験全体でリードが観察されなかった遺伝子座のみを保持した。本発明者らは、以下の2つの独立した統計的検定を使用して、全てのがん細胞株または個別に各サブタイプ(TNBC、HER2+、および管腔)を比較した:(i)本発明者らはDESeq Rパッケージを使用して、調整済みp値を計算し、(ii)本発明者らはフィッシャーの正確検定を使用して、各低分子RNAの存在および非存在を比較した。本発明者らは、前者の検定において調整済みP値<0.05を有するかまたは後者の検定において全ての比較にわたってP<0.1を有する遺伝子座を選択した。
【0139】
437個の遺伝子座(図1Aに列挙する)が、これらの基準を満たした。可視化のために、本発明者らは、各列を最大値に正規化し、k-平均法クラスタリング(k=3)を実行した。TCGA-BRCAデータベースについて、本発明者らは、サブタイプが注釈付された全ての試料(PAM50分類に基づく)および全ての低分子RNA遺伝子座の間で同様のカウント表を生成し、得られたテーブルを正規化して、百万リード当たりのカウント数(cpm)の表を生成した。『オーファン』低分子RNA、すなわち正常細胞においてほとんど存在しない低分子RNAを特定するために、本発明者らは、最初に、正常な試料において0.5cpm未満の90パーセンタイルの発現を有する遺伝子座だけを保持した。上記の437個の遺伝子座のうち、268個が、このステップを通過した。次いで、本発明者らはフィッシャーの正確検定を実行して、腫瘍試料および正常な生検の間で全ての低分子RNAの存在を比較した。本発明者らは、正常な試料と乳癌サブタイプの各々との間で同様の比較を実行した。次いで、本発明者らは、調整済みp値<0.05を有する、これらの試験のうちの少なくとも1つで有意であった遺伝子座を保持した。201個の低分子RNAが、この最終ステップを通過し、したがって、オーファン非コードRNAとして分類された。本発明者らは、これらの低分子RNAのいずれも以前にmiRNA、snoRNA、またはtRNAとして注釈付けされていないことを確認した。
【0140】
PDXモデルおよび正常な上皮試料の低分子RNA配列決定
PDX腫瘍およびヒト非腫瘍試料を生成するために使用された全てのヒト試料は、以前に記載されていた41。低分子RNAプロファイリングおよびデータ前処理を、QSolutionsにより実施した。これらの試料中のoncRNAの存在量を、上記の通りに判定した。低転移性細胞と高転移性細胞との間のoncRNA発現の比較
本発明者らは、高転移性細胞で有意に上方調節されていたoncRNAを同定するために、DESeq2 Rパッケージを使用して、図1の親細胞株(MDA231およびCN34)とそれらのインビボで選択された高転移性の派生株(MDA-MB-231バックグラウンド)との間でoncRNAの発現を比較した。本発明者らはこの解析でT3pを同定した。また本発明者らは、これらの細胞株で以前生成された低分子RNAデータセットにおいてもT3pを確認した。加えて、本発明者らは、定量RT-PCRアッセイも実行した。これについて、本発明者らは、MDA-231親細胞およびその高転移性MDA-LM2から低分子RNAを抽出し(microRNA Purification Kit、Norgen)、以下のプライマーを使用してステムループqPCRを実行した:R:5’-CCAGTGCAGGGTCCGAGGTAおよびF:5’-CCCAGGACTCGGCTCACAC。
TCGA-BRCAデータセットにおけるT3pの発現および臨床的関連性
本発明者らは、TCGA-BRCAデータセットに付随するメタデータを使用して腫瘍試料におけるT3pの発現に基づいた生存率解析を実行した。本発明者らは、T3pレベルに基づいて患者を層化し、全ての三分位値を使用してカプラン・マイアー曲線を生成し、ログランク(マンテル・コックス)検定を実行して関連P値を計算した。本発明者らは、臨床データを同様に使用して、初期および末期腫瘍の間でのT3p発現を比較した(片側マン・ホイットニーU検定)。
T3p調節および遺伝子発現プロファイリング本発明者らは、以下の配列に対してmiRCURY LNA阻害剤(Exiqon)を使用した:T3p:CAGGACTCGGCTCACACATGC;TERC:TTGTCTAACCCTAACTGAGAAGG;スクランブル配列:AGACGACAGCTGGATCACACG。同様に、本発明者らは、T3p模倣物(IDT)を使用した:rC*rArGrGrArCrUrCrG rGrCrUrCrArCrArCrArUrG*rC(T3p模倣物)およびrA*rGrA rCrGrA rCrArG rCrUrG rGrArU rCrArC rArC*rG(対照)。次いで、本発明者らは、LNAを高転移性MDA-LM2細胞に、および模倣物をMDA-MB-231親細胞に形質移入し、前述したように遺伝子発現プロファイリングを実行した。差次的遺伝子発現解析も、前述したように実行した
Tough Decoyならびにインビボでの肺でのコロニー形成および腫瘍成長アッセイ
MDA-LM2細胞を、anti-T3pまたはスクランブルLNA(上記と同一)で形質移入し、48時間後に、細胞を免疫不全NOD SCIDγ(NSG)マウスの尾静脈を介して血管系に注入した(マウス当たり2.5×10個;コホート当たりのn=5)。インビボでのイメージングおよび曲線の比較を、前述したように実行した19。次いで、コホート当たり少なくとも3匹のマウス(中間のシグナル)から肺を摘出し、固定し、薄切し、染色し(H&E)、前述したように定量化した19
T3pの安定した阻害を引き起こすために、本発明者らは、レンチウイルスバックボーンのRNA PolIIIプロモーター(pLKO.1)下にこの低分子RNAに対するTuDを設計した。次いで、本発明者らは、MDA-LM2細胞を安定的に形質導入し、肺でのコロニー形成アッセイを実行した(上記と同様;マウス当たり5×10個の細胞)。HCC1395細胞を同様に形質導入し、マウス当たり2×10個の細胞で注入した。同所性の腫瘍成長アッセイを、50ulのマトリゲルを混合した50ulのPBS中に再懸濁された2.5×10個の細胞を同日齢の6~8週齢の雌性NOD/SCIDγマウスの乳腺に28ゲージ針を使用して注入することによって実行した。キャリパスを使用して腫瘍径(L)および幅(W)を2日毎に測定し、式πLW2/6を使用して計算することによって、腫瘍体積を判定した。一旦腫瘍が800mmの体積に到達したら、実験はエンドポイントに到達した。インビトロでの細胞増殖:がん細胞の増殖アッセイを、0日目に5×10個の細胞を播種し、次いで、3日目および5日目に三重反復でそれらを計数することによって実行される。線形モデルを使用して推定される、細胞数の対数と日数との間の最良近似直線の傾きを、記録する増殖速度(日-1)とする。細胞周期解析のために、細胞を、6cmプレートで80%の培養密度まで成長させ、収集し、70%のエタノールで固定した。次いで、細胞をペレット化し、50ug/mLのヨウ化プロピジウム(Thermo Fisher Scientific)および1mg/mLのRNA分解酵素A(Thermo Fisher Scientific)中に再懸濁し、37℃にて1時間培養した。次いで、FACS解析のためにBD Aria2フローサイトメーターを使用し、post-FACS解析および細胞周期の定量を、『fcsparser』のpythonパッケージを使用して実行した。FCSparser:https://github.com/eyurtsev/fcsparser/tree/master/fcsparser
【0141】
T3p生合成因子を発見するための共発現解析T3p生合成の調節因子を同定するために、本発明者らは、既知のヌクレアーゼ活性(GO:0004540およびGO:0004525)を有する遺伝子をリストにし、更にこれらのヌクレアーゼと相互作用することが公知であるRNA結合タンパク質を追加した42。次いで、本発明者らは、TCGA-BRCAデータセット内のT3pレベルとこのリスト上の遺伝子のレベルとの間の共発現解析を実行した。本発明者らは、高転移性MDA-LM2細胞において上方調節されており、同様にTCGA-BRCAデータセットにおける正常な生検と比較して乳癌試料において高い遺伝子と強い関連性を有する遺伝子を重ね合わせた。これらの基準に基づいて、本発明者らは7個の候補を同定した。これらのうちの2つは既知の二本鎖結合活性を有した。TERCのCR7ドメインが構築される(すなわち二本鎖領域を形成する)ため、本発明者らは、これらのタンパク質(すなわち、DROSHAおよびTARBP2)が追跡調査するのに最も良い候補であると結論した。本発明者らは、siRNAを使用してDROSHAおよびTARBP2、ならびに更にこれらのタンパク質とそれぞれ相互作用することが公知であるDGCR8およびDICER1をノックダウンした(IDT)。本発明者らは、以下の標的配列を使用した:TARBP2:5’-ACCTGGGATTCTCTACGAAATTCAGT、DROSHA:5’-CCTTGATTGAGGTATAGTTCTTGTCT、DICER1:5’-TGGTGCTTAGTAAACTCTTGGTTCCA、およびDGCR8:5’-CTGCAGGAGTAAGGACAGGAAGGTGC。siRNA遺伝子導入およびノックダウンの確認後に、本発明者らは、上記の通り低分子RNAの配列決定を実行した。
【0142】
oncRNAベースの分類器の訓練および試験201個のoncRNAのうち、100個は、少なくとも1つの血清試料において検出された。本発明者らは、これら100個のoncRNAを使用して、サブタイプが注釈付けされたTCGA-BRCA試料に関してGBCを訓練した(sklearnモジュール)。次いで、本発明者らは、35人の健常な患者および40人のがん患者由来の血清試料の大要を100回ブートストラップして、分類器の性能パラメータ、すなわち、平均AUROC、精度、および正確度スコアを計算した。本発明者らは、TCGA-BRCAとは対照的に血清データに関して訓練および検定を実行することによってoncRNAの独立した評価も実行した(5分割交差検証)。本発明者らは、以下のmiRNAを使用して、上記と同様の解析を実行した:miR-10b-5p、miR-10b-3p、miR-148b-3p、miR-148b-5p、miR-155-3p、miR-155-5p、miR-34a-3p、miR-376a-3p、miR-652-3p、miR-133a-3p、miR-139-3p、miR-143-3p、miR-145-3p、miR-15a-3p、miR-18a-3p、miR-425-3p、miR-34a-5p、miR-376a-5p、miR-652-5p、miR-133a-5p、miR-139-5p、miR-143-5p、miR-145-5p、miR-15a-5p、miR-18a-5p、miR-425-5p、miR-127-3p、miR-194-5p、miR-205-5p、miR-21-5p、miR-375、miR-376c-3p、miR-382-5p、miR-409-3p、およびmiR-411-5p。動物試験全ての動物試験を、University of California San Francisco IACUCガイドラインに従って完了した。統計的方法データの有意性を評価するために使用された統計的検定を、レジェンドに記載する。要約すると、特に明記しない限り、本発明者らは、ノンパラメトリック検定法を使用して対比較を実行した。マウス実験について、本発明者らは、共変量として時間を用いた2元配置ANOVAを使用した。増殖速度について、本発明者らは、線形モデルを使用した。解析は、python、R、およびprism環境で実行した。
【0143】
実施例2.乳癌におけるオーファン低分子非コードRNAの系統的探索
乳癌細胞において発現されているが、正常な胸部組織では検出不可能である新規なクラスのがん特異的低分子RNAを探すために、複数の乳癌サブタイプおよびヒト乳房上皮細胞の低分子RNA配列決定に基づいた偏りのない手法が使用された。乳癌細胞において特異的に発現されているおよそ200個の今まで知られていなかった低分子RNAが、発見され、注釈付けされた。それらのがん特異的生合成を強調するために、これらのRNAは、細菌遺伝学からの用語を借りて、『オーファン』非コードRNA(oncRNA)と名付けられている。
【0144】
最初に、がん細胞にのみ存在し、これらの細胞における潜在的な調節因子のアクセス可能なプールを提供し得る低分子RNAのセットが存在するかどうかが決定された。かかるoncRNAは、がん細胞株においてのみ検出可能であり、正常細胞では検出可能ではないであろうと推測された。この仮説を検証するために、低分子RNAの配列決定が、9種の乳癌細胞株(全て主要な乳癌サブタイプを表わす)および参照としてヒト乳房上皮細胞(HMEC)について実行された。全ての乳癌株で有意に検出されるが、HMEC試料では検知されない437個の注釈付けされていない低分子RNAが同定された(図1A)。
【0145】
更に探索を狭め、これらの発見を強固にするために、同様の解析が、およそ200個の正常組織試料および1200個の乳癌生検全ての低分子RNA発現プロフィールを提供したThe Cancer Genome Atlas(TCGA)から取得された低分子RNA配列決定データに対して実行された。この解析において、268個のがん特異的低分子RNAが同定され、そのうちの201個は乳癌株の解析でも存在した。これらの2つの独立した解析間での高度に有意な重複は、下記の表1に示す高信頼度の201個のoncRNAのセットを明らかにした(図1Bおよび図2A)。
【表1-1】
【表1-2】
【表1-3】
【表1-4】
【表1-5】
【表1-6】
【表1-7】
【表1-8】
【表1-9】
【表1-10】
【表1-11】
【表1-12】
【表1-13】
【0146】
第3の証拠として、10の患者由来異種移植片(PDX)モデルおよび4つの正常上皮試料(非対応)からの低分子RNAプロファイルのデータセットを解析した。図1Cに示すように、これらのoncRNAは、正常な試料でほとんど存在しないが、PDXモデルでは頻繁に検出され得る。全ての試料で201個全てのoncRNAの発現を合計することによって、正常なプロファイルおよびPDXプロファイルを完璧に分類する単純な分類ルールを導き出すことができる(図2B)。総合すると、これらの発見は、その発現が乳癌と強く関連付けられるoncRNAの大きなプールの存在を確立する。
【0147】
実施例3.乳癌進行に関連するoncRNAであるT3pの同定
前述の細胞株に加えて、免疫不全マウスにおいてインビボで高い転移能力について選択された高転移性細胞株も、プロファイリングされた(1、15)。これらの高転移性細胞のoncRNAの発現をそれらの低転移性親株に対して比較すると、高転移性細胞においてレベルが優位に増加した1つのoncRNAが認められた(図3A)。この40ヌクレオチドのoncRNAは、テロメラーゼのRNA成分をコードするTERC遺伝子の3’末端から生成される(図3B)。したがって、この今まで知られていなかった低分子RNAは、TERCの3’側のRNAであるためにT3pと名付けられた。同一の細胞株からの以前に公開されたデータセットの解析(7)は、高転移性細胞におけるT3pの高い発現を更に確証した(図3C)。転移細胞におけるT3p発現のこの上方調節は、qPCRによって確認された(図3C)。
【0148】
次に、T3pの発現増加が原疾患の病因に寄与したかどうかが調査された。TCGA-BRCA(The Cancer Genome Atlas、乳癌)からの約400個の対応する正常および乳癌腫瘍組織試料が解析され、T3pの発現が非常にがん特異的であることが認められた(図3D)。次いで、およそ1000個の腫瘍試料を有するTCGA-BRCAデータセット全体が、含まれた。図3Eに示すように、oncRNAとしてのその同一性と一致して、T3pは、大多数の正常な試料において検出されなかったが、腫瘍生検において相対的に高いレベルで検出された。より重要なことに、高転移性細胞株におけるT3pの高い発現と一致して、患者生存とT3p発現との間の高度に有意な関連性が観察された(図3F)。更に、図3Gに示すように、T3pの発現は、TCGA-BRCAデータセットにおける正常試料、ステージI、およびステージIIまたはIIIの試料の間で増加する。腫瘍試料におけるT3pのいかなるレベルの検出も、乳癌およびより短い全生存率の両方に強く関連した(図4Aおよび図4B)。臨床乳癌試料におけるT3pのより高い発現は、進行期乳癌とも強く相関した(図3E)。興味深いことに、ホルモン受容体およびHER2の状態によるこれらのがん試料の層別化は、T3pレベルのエストロゲン受容体、プロゲステロン受容体、またはHER2受容体の発現との強い関連性を示さなかった(図4C)。この発見と一致して、正常な上皮組織と比較した乳癌のPDXモデルにおけるT3pの発現増加も認められた(図4D)。総合すると、これらの結果は、高い予後値を有するがん特異的バイオマーカーとしてのoncRNA T3pを確立する。
【0149】
実施例4.T3pは、乳癌細胞において遺伝子発現の幅広い調節因子として働く
複数の独立したデータセットからのT3p発現と乳癌進行との間の強い関連性は、T3pが乳癌進行において直接的および機能的役割を果たす可能性を増加させる。その分子機能を解明するために、T3p発現レベルの調節が結果の調節をもたらしたかどうかが調査された。このために、高転移性MDA-LM2細胞をT3pを標的とするアンチセンスロックド核酸(LNA)または対照のスクランブルLNAを用いて形質移入することによって、T3pがサイレンシングされた。次いで、遺伝子発現プロファイリングを実行して、T3pサイレンシングのゲノム全体での調節的影響を測定した。驚くべきことに、何千もの遺伝子に影響を及ぼす、T3pサイレンシングによる細胞の遺伝子発現分布の高度に有意な変化が観察された。これは、低分子非コードRNAなどの多数の確立されている転写後調節因子の影響と同等である(7、16)。しかしながら、T3pを標的とするLNAはTERCの機能にも影響を与え、これにより、観察された遺伝子発現の変化の原因となり得るため、全長TERC転写物が潜在的な交絡因子のままである。これらの2つの可能性を区別するために、2つの独立した手法が使用された。第1に、スクランブルLNAに加えて、全長TERC、T3pの5’側に対するアンチセンスLNAも使用された。図5に示すように、anti-T3p LNAによって引き起こされた遺伝子発現の変化は、スクランブルLNAまたはanti-全長TERC LNAが参照として使用されるかどうかにかかわらず同程度である。この観察は、全長TERCの阻害がT3p阻害によって引き起こされる同一の劇的な調節的変化を引き起こさないことを示す。更にこれらの発見を強固にするために、機能獲得型の実験も実行された。T3p模倣物として合成オリゴヌクレオチドを使用して、MDA-MB-231親乳癌細胞を、対照としてスクランブルオリゴヌクレオチドを用いて形質移入し、次いで、遺伝子発現プロファイリングを実行した。LNA実験と同様に、細胞の遺伝子発現分布における重要な変化が観察された。重要なことに、これらの遺伝子発現の変化は、機能欠損型のLNA実験において観察されたものと一般に反相関した(図6A)。これは、anti-T3p LNAおよびT3p模倣物が反対の遺伝子発現の変化を誘発するはずであるという予想と一致している。総合すると、これらの観察は、乳癌細胞における遺伝子発現の幅広い調節因子としてのT3pを確立する。
【0150】
実施例5.T3pは、乳癌転移を促進する
T3pの遺伝子発現に対する幅広い調節効果、ならびにその転移との関連性および乳癌における悪い生存率との関連性を考慮して、次に、このoncRNAがインビボで転移に影響を及ぼし得るかどうかを調べた。この仮説を検証するために、高転移性のMDA-LM2細胞を、anti-T3p LNAを用いて形質移入し、これらの細胞を免疫不全マウスの静脈循環に注入することによって、転移性肺コロニー形成アッセイを実施した。次いで、インビボイメージングを使用して、これらの細胞の経時的な転移性肺コロニー形成に対するT3p阻害の影響を測定した。図6Bに示すように、anti-T3p LNAを形質移入された細胞は、肺コロニー形成能力が優位に減弱した。各コホートからの肺の肉眼での組織学的検査も、T3p-LNAを遺伝子導入した細胞を注射されたマウスの肺における有意に少ない数の可視的な転移性結節を明らかにした。図6Cに示すように、可視的な転移性結節が、各コホートからの3匹のマウスにおいて計数された。各コホートからのH&E染色された代表的肺切片も、中央値カウント数と共に示される。これらの観察は、今まで知られていなかったncRNAであるT3pの乳癌転移の駆動における機能的役割を強く支持する。
【0151】
実施例6.特定のoncRNAは、エキソソームコンパートメントにソーティングされる
エキソソームコンパートメントは、低分子非コードRNAおよびtRNA断片など低分子RNAの生物学的に関連した目的地として以前に報告された(28)。公開されているMDA-MB-231細胞からのエキソソーム低分子RNA-seqデータの解析(29)は、この研究の多数の注釈付けされたoncRNAが、がん細胞から分泌されるエキソソームにおいて検出され得ることを明らかにした(図7A)。比較において、これらのうちの少数のoncRNAのみが、HUVEC細胞からのエキソソーム試料において検出された(30)。例えば、T3pは、HUVEC細胞でなくMDA-MB-231細胞から収集されたエキソソームに存在した(図8A)。これらの観察は、エキソソーム低分子RNAをプロファイリングすることを目的とした次の一連の実験を促した。この目的のために、低分子RNAが、8種の乳癌細胞株およびHMECから分泌されるエキソソームから単離された。この材料の低分子RNA配列決定は、201個の注釈付けされたoncRNAのうち、約2/3がこれらの乳癌株のうちの1つ以上からのエキソソームRNAにおいて検出されたが、HMECにおいては検出されなかったことを明らかにした(図7B)。興味深いことに、T3pは8種の細胞株中の5種において検出された。
【0152】
oncRNAが循環RNA集団中にも存在するかどうか評価するために、乳癌患者由来の血清から単離されたRNAから生成されたRNA-seqデータの集まりを再解析した(31)。評価の基準として、11人の健常な個体の血清から収集されたデータが含まれた(32)。図7Cに示すように、oncRNAの大部分は、乳癌患者由来の循環RNA試料中に検出され得るが、一般に、健常な個体には存在しなかった。この観察は、循環oncRNAが液体生検によるがんのフィンガープリンティングに使用することができる可能性を増加させる。この可能性を評価するために、線形モデルを、細胞株から収集されたエキソソームoncRNAデータセットに関して訓練し(図7B)、それを使用して循環RNAプロファイルの分類を予測した(図7C)。訓練されたモデルは、11/11の健常試料および31/40のがん患者由来の試料を成功裡に割り当てた(AUC:0.96、AUPRC:0.99、およびACC:0.82)。例えば、T3pは、単独で乳癌患者と健常なボランティアとの間で有意に異なる発現レベルを示した(図7Cおよび図8B)。この単純な分類器の成功を考慮して、より一般化可能な機械学習手法が、TCGA-BRCAデータセットの201個のoncRNAで勾配ブースティング分類器を訓練することによって調べられた。TCGAデータで訓練されたこのモデルを、図7Cの循環低分子RNAプロファイルで試験した。この分類器は、11/11の健常試料および37/40の患者試料を成功裡に分類した(AUC:0.976、AUPRC:0.993、およびACC:0.948)。これらの結果に基づいて、本発明者らは、循環oncRNAの検出が、潜在的ながんの存在に関する高特異性を有する確固たる情報として使用することができると推測する。同定された67個の循環oncRNAのリストを、以下の表2に示す。
【表2-1】
【表2-2】
【表2-3】
【表2-4】
【表2-5】
【0153】
最後に、同定された201個のoncRNAから、表3に示す以下のoncRNAが、血清試料の解析によって対象における乳癌の存在を予測する際に最も強い性能を持つものであることが分かった。
【表3-1】
【表3-2】
【0154】
乳癌発生および進行の現在の仮説は、発がん性表現型の選択の増加をもたらす、異常な細胞内機構の悪性転換を強調する。その結果として、がん治療法および診断薬の開発は、これらのがん細胞の生存、分裂、または拡散する能力を低減するためにこれらの経路を標的とすることを目的とする。本発明の実施例において、がん細胞ががん特異的調節経路を創るようにも進化し得ることが提唱された。臨床的乳癌データと組み合わされた8種の乳癌細胞株およびHUMECを対象にした系統的および偏りのない発見ステップによって、乳癌細胞において発現されるが、正常組織においてほとんど検出不可能である201個のRNA種の集団が同定された。総称的にオーファン非コードRNAと名付けられたこれらのRNA分子は、がん細胞が新規な調節回路を作りだすために利用することができる新規な潜在的調節因子のプールを提供する。oncRNAが乳癌進行において機能することができるかどうかを問うために、低転移性および高転移性の細胞が比較された。T3pと名付けられた、これらのRNAのうちの1つが、細胞株モデルおよび臨床データセットの両方において転移性進行と強く関連することが発見された。最後に、本明細書に記載の実施例は、oncRNAが循環およびエキソソームコンパートメントにおいて検出され得ることを示す。
【0155】
これらの発見は、がんの進行および腫瘍が転移拡散への途中でどのように進化し、調節経路を配線し直すことができるかについて新規のパラダイムを提供する。更に、これらの結果は、現行の方法を補い得る乳癌検出およびモニタリングのための新規の手段も提案する。マンモグラフィーおよび超音波を含む乳癌の現行のスクリーニング方法は、低解像度に起因して限られた検出シグナルを提供し、それらの使用者の解釈への依存を考慮すると偏りがある。早期がんを発見するための開発における他の戦略は、患者の血清から循環腫瘍細胞およびDNAを含むがんの生物学的マーカーを検出することを試みる、「液体生検」に焦点を置いてきた。患者の血清内の分泌されたエキソソームの高い存在量およびoncRNAのがん細胞特異性は、早期発見またはスクリーニングのより信頼性が高い方法のための我々のレパートリーの大幅な強化を提供し得る。換言すれば、本明細書に記載の研究は、oncRNAが潜在的な腫瘍のデジタルフィンガープリントとして働く-すなわち、各マーカーが検出されるかまたは検出されない-という考えを支持する。
【0156】
本明細書に記載の実施例は、乳癌転移におけるT3pの役割にほとんど焦点を置いたが、本明細書において掲示される手法および概念は、一般化可能であり、いくつかのがんに対して適用され得る。総合すると、これらの発見は、がん特異的RNA分布の更なる調査およびoncRNAの研究が、多数のがんタイプに対する代替的な治療および診断方法をもたらし得るという可能性を開く。

参考文献
1.S.F.Tavazoie et al.,Endogenous human microRNAs that suppress breast cancer metastasis.Nature.451,147-U3(2008).
2.C.J.David,M.Chen,M.Assanah,P.Canoll,J.L.Manley,HnRNP proteins controlled by c-Myc deregulate pyruvate kinase mRNA splicing in cancer.Nature.463,364-368(2010).
3.S.Vanharanta et al.,Loss of the multifunctional RNA-binding protein RBM47 as a source of selectable metastatic traits in breast cancer.eLife.3(2014),doi:10.7554/eLife.02734.
4.L.Fish et al.,Muscleblind-like 1 suppresses breast cancer metastatic colonization and stabilizes metastasis suppressor transcripts.Genes Dev.30,386-398(2016).
5.L.-Y.Chen,J.Lingner,AUF1/HnRNP D RNA binding protein functions in telomere maintenance.Mol.Cell.47,1-2(2012).
6.H.Goodarzi et al.,Modulated expression of specific tRNAs drives gene expression and cancer progression.Cell.165,1416-1427(2016).
7.H.Goodarzi et al.,Endogenous tRNA-Derived Fragments Suppress Breast Cancer Progression via YBX1 Displacement.Cell.161,790-802(2015).
8.D.K.Simanshu,D.V.Nissley,F.McCormick,RAS Proteins and Their Regulators in Human Disease.Cell.170,17-33(2017).
9.R.Ren,Mechanisms of BCR-ABL in the pathogenesis of chronic myelogenous leukaemia.Nat.Rev.Cancer.5,172-183(2005).
10.R.-K.Lin,Y.-C.Wang,Dysregulated transcriptional and post-translational control of DNA methyltransferases in cancer.Cell Biosci.4,46(2014).
11.A.A.Alizadeh et al.,Toward understanding and exploiting tumor heterogeneity.Nat.Med.21,846-853(2015).
12.A.Nguyen,M.Yoshida,H.Goodarzi,S.F.Tavazoie,Highly variable cancer subpopulations that exhibit enhanced transcriptome variability and metastatic fitness.Nat.Commun.7,11246(2016).
13.R.J.Taft,K.C.Pang,T.R.Mercer,M.Dinger,J.S.Mattick,Non-coding RNAs:Regulators of disease.J.Pathol.220(2010),pp.126-139.
14.M.Esteller,Non-coding RNAs in human disease.Nat.Rev.Genet.12,861-874(2011).
15.A.J.Minn et al.,Distinct organ-specific metastatic potential of individual breast cancer cells and primary tumors.J.Clin.Invest.115,44-55(2005).
16.J.M.Loo et al.,Extracellular Metabolic Energetics Can Promote Cancer Progression.Cell.160,393-406(2015).
17.D.N.Cooper,L.P.Berg,V.V Kakkar,J.Reiss,Ectopic(illegitimate)transcription:new possibilities for the analysis and diagnosis of human genetic disease.Ann.Med.26,9-14(1994).
18.A.A.Margolin et al.,ARACNE:An Algorithm for the Reconstruction of Gene Regulatory Networks in a Mammalian Cellular Context.BMC Bioinformatics.7,S7(2006).
19.H.Goodarzi et al.,Metastasis-suppressor transcript destabilization through TARBP2 binding of mRNA hairpins.Nature(2014),doi:10.1038/nature13466.
20.B.Kim,K.Jeong,V.N.Kim,Genome-wide Mapping of DROSHA Cleavage Sites on Primary MicroRNAs and Noncanonical Substrates.Mol.Cell.66,258-269.e5(2017).
21.D.Ray et al.,A compendium of RNA-binding motifs for decoding gene regulation.Nature.499,172-177(2013).
22.Y.-C.T.Yang et al.,CLIPdb:a CLIP-seq database for protein-RNA interactions.BMC Genomics.16,51(2015).
23.E.L.Van Nostrand et al.,Robust transcriptome-wide discovery of RNA-binding protein binding sites with enhanced CLIP(eCLIP).Nat.Methods.13,508-514(2016).
24.H.Goodarzi et al.,Systematic discovery of structural elements governing stability of mammalian messenger RNAs.Nature.485,264-268(2012).
25.S.Memczak et al.,Circular RNAs are a large class of animal RNAs with regulatory potency.Nature.495,333-8(2013).
26.P.Sumazin et al.,An extensive microRNA-mediated network of RNA-RNA interactions regulates established oncogenic pathways in glioblastoma.Cell.147,370-381(2011).
27.A.Helwak,G.Kudla,T.Dudnakova,D.Tollervey,Mapping the human small non-coding RNA interactome by CLASH reveals frequent noncanonical binding.Cell.153,654-65(2013).
28.T.Fiskaa et al.,Distinct Small RNA Signatures in Extracellular Vesicles Derived from Breast Cancer Cell Lines.PLoS ONE.11(2016),doi:10.1371/journal.pone.0161824.
29.W.Zhou et al.,Cancer-secreted miR-105 destroys vascular endothelial barriers to promote metastasis.Cancer Cell.25,501-515(2014).
30.S.K.Chakrabortty,A.Prakash,G.Nechooshtan,S.Hearn,T.R.Gingeras,Extracellular vesicle-mediated transfer of processed and functional RNY5 RNA.RNA N.Y.N.21,1966-1979(2015).
31.X.Wu et al.,De novo sequencing of circulating small non-coding RNAs identifies novel markers predicting clinical outcome of locally advanced breast cancer.J.Transl.Med.10,42-42(2012).
32.M.D.Giraldez et al.,Accuracy,Reproducibility And Bias Of Next Generation Sequencing For Quantitative Small RNA Profiling:A Multiple Protocol Study Across Multiple Laboratories.bioRxiv,113050(2017).
33.O.Elemento,N.Slonim,S.Tavazoie,A universal framework for regulatory element discovery across all Genomes and data types.Mol.Cell.28,337-350(2007).
図1A
図1B
図1C
図2A
図2B
図3A
図3B
図3C
図3D
図3E
図3F
図4A
図4B
図4C
図4D
図5
図6A
図6B
図6C
図7A
図7B
図7C
図8A
図8B
図9A
図9B
図9C
図10A
図10B
図10C
図10D
図10E
図10F
【配列表】
0007549880000001.app