IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イマジナ バイオテクノロジー ソシエタ レスポンサビリタ リミタータの特許一覧

特開2025-28816疾患の診断、予後、治療モニタリング、または結果予測評価のための方法およびキット
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025028816
(43)【公開日】2025-03-05
(54)【発明の名称】疾患の診断、予後、治療モニタリング、または結果予測評価のための方法およびキット
(51)【国際特許分類】
   C12Q 1/686 20180101AFI20250226BHJP
   C12Q 1/6806 20180101ALI20250226BHJP
   C12Q 1/6851 20180101ALI20250226BHJP
   C12Q 1/48 20060101ALI20250226BHJP
   C12Q 1/25 20060101ALI20250226BHJP
   C12Q 1/6876 20180101ALN20250226BHJP
【FI】
C12Q1/686 Z
C12Q1/6806 Z ZNA
C12Q1/6851 Z
C12Q1/48 Z
C12Q1/25
C12Q1/6806 Z
C12Q1/6876 Z
【審査請求】未請求
【請求項の数】12
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024116884
(22)【出願日】2024-07-22
(31)【優先権主張番号】102023000016836
(32)【優先日】2023-08-07
(33)【優先権主張国・地域又は機関】IT
(71)【出願人】
【識別番号】524274875
【氏名又は名称】イマジナ バイオテクノロジー ソシエタ レスポンサビリタ リミタータ
(74)【代理人】
【識別番号】100113376
【弁理士】
【氏名又は名称】南条 雅裕
(74)【代理人】
【識別番号】100179394
【弁理士】
【氏名又は名称】瀬田 あや子
(74)【代理人】
【識別番号】100185384
【弁理士】
【氏名又は名称】伊波 興一朗
(74)【代理人】
【識別番号】100137811
【弁理士】
【氏名又は名称】原 秀貢人
(72)【発明者】
【氏名】デル ピアーノ アレッシア
(72)【発明者】
【氏名】ケックマン ティー
(72)【発明者】
【氏名】クラメール マッシミリアーノ
(57)【要約】      (修正有)
【課題】特定の疾患に関連する分子マーカーを同定および定量して、疾患の診断、予後、治療モニタリング、または結果予測評価を促進するための、包括的な方法を提供する。
【解決手段】対象における疾患または状態の診断、予後、治療モニタリング、または結果予測評価を、前記対象の生物学的試料中に包含される前記疾患または状態の少なくとも1の分子マーカーを検出することおよび定量することによって行う、インビトロまたはエクスビボ方法であって、前記少なくとも1の分子マーカーは、3′リン酸または2′/3′環状リン酸を含むRNA断片である方法、および脊髄性筋萎縮症および皮膚扁平上皮癌を診断するためのキット。
【選択図】図13
【特許請求の範囲】
【請求項1】
対象における疾患または状態の診断、予後、治療モニタリング、または結果予測評価を、前記対象の生物学的試料中に包含される前記疾患または状態の少なくとも1の分子マーカーを検出することおよび定量することによって行う、インビトロまたはエクスビボ方法であって、
前記少なくとも1の分子マーカーは、3′リン酸または2′/3′環状リン酸を含むRNA断片(3′P RNA)であり、
前記方法は、以下の各ステップ:
(a′)前記生物学的試料中に包含される前記少なくとも1の3′P RNAの5′末端をリン酸化して、少なくとも1のリン酸化RNA断片を得るステップ;
(b′)前記少なくとも1のリン酸化RNA断片の3′末端を、RNAベースのアダプターの5′末端にライゲートし、少なくとも1の第1のライゲーション生成物を得るステップ;
ここで前記RNAベースのアダプターは、式(Ia)を有し:

5′OH-E1-A-E2-OH 3′ (Ia)
ここで
- E1は、長さが15~30の間である、第1のオリゴリボヌクレオチド配列であり、
- Aは、脱塩基部位またはレトロ転写酵素(retrotranscriptase enzyme)活性の阻止を可能にするスペーサーであり、
- zは、1~5の整数であり、
- E2は、長さが15~30の間である、第2のオリゴリボヌクレオチド配列である;
(c′)前記少なくとも1の第1のライゲーション生成物を自己ライゲートし、少なくとも1の環状RNA分子を形成するステップ;
(d′)前記少なくとも1の環状RNA分子の逆転写を行い、前記少なくとも1の3′P RNAの配列を含む、少なくとも1の一本鎖cDNA分子を得るステップ;
ここで前記逆転写は、式(IIa)を有する逆転写プライマーを使用して行われ:

5′OH-G-F1-OH 3′ (IIa)
ここで
- F1は、E1の逆相補デオキシオリゴリボヌクレオチドであり、ここでF1のE1に対する相補性は、60%~100%の間であり、
および
- Gは、長さが10~30の間である、第1のDNAオリゴヌクレオチドである;
(e′)前記少なくとも1の一本鎖cDNA分子の第1および第2のqPCR増幅を並行して行い、第1および第2の増幅生成物を得るステップ;
ここで:
- 前記第1のqPCR増幅は、前記3′P RNA配列の少なくとも一部にアニーリングする第1のプライマー対を使用して行われ、
前記第1のプライマー対は、プライマー対セット1、セット2、およびセット3から選択され、
ここで各プライマー対は、フォワードプライマーおよびリバースプライマーを含み、
前記プライマー対セット1のフォワードプライマーおよびリバースプライマーは、それぞれ式(IIIa)および(IVa)に示される配列を有し、
前記プライマー対セット2のフォワードプライマーおよびリバースプライマーは、それぞれ式(IIIa′)および(IVa′)に示される配列を有し、
および
前記プライマー対セット3のフォワードプライマーおよびリバースプライマーは、それぞれ式(IIIa″)および(IVa″)に示される配列を有し:

セット1
5′OH-H2-N-OH 3′ (IIIa)
5′OH-H1-M-OH 3′ (IVa)

セット2
5′OH-H2-N-OH 3′ (IIIa′)
5′OH-H1-OH 3′ (IVa′)

セット3
5′OH-H2-OH 3′ (IIIa″)
5′OH-H1-M-OH 3′ (IVa″)

ここで、
◆ H1は、E1にアニーリングする第2のDNAオリゴヌクレオチドであり、ここでH1のE1に対する相補性は、30%~100%の間であり、
および
◆ Mは、長さが6~30の間であり、前記3′P RNA配列の3′末端の少なくとも6ヌクレオチドにアニーリングする、第3のDNAオリゴヌクレオチドであり、
◆ H2は、E2にアニーリングする第4のDNAオリゴヌクレオチドであり、ここでH2のE2に対する相補性は、30%~100%の間であり、
および
◆ Nは、長さが6~30の間であり、前記3′P RNA配列の5′末端の少なくとも6ヌクレオチドにアニーリングする、第5のDNAオリゴヌクレオチドであり;
- 前記第2のqPCR増幅は、前記RNAベースのアダプター配列にアニーリングする第2のプライマー対を使用して行われ、
前記第2のプライマー対は、それぞれ式(Va)および(VIa)を有する、第2のフォワードプライマーおよび第2のリバースプライマーを含み:

5′OH-H2-OH 3′ (Va)
5′OH-I1-OH 3′ (VIa)
ここで、
◆ H2は、上記に示された意味を有し、
および
◆ I1は、Gにアニーリングする第6のDNAオリゴヌクレオチドであり、ここでI1のGに対する相補性は、60%~100%の間である;
および
(f′)ステップ(a′)から(e′)を、少なくとも1の対照試料に対して繰り返すステップ;
ここで前記対照試料は、健康な、治療を受けている、または未治療の対象の、生物学的試料である;
(g′)前記生物学的試料および前記対照試料のいずれかについて、前記第1および第2の増幅生成物において、前記少なくとも1の3′P RNAの、および前記RNAベースのアダプターの、Ct値を決定するステップ;
(h′)ステップ(g′)において決定された前記Ct値の3′P-qPCR倍率変化(fold change)を、以下の等式に従って計算するステップ:
ここで
- Ct(A)3′Pは、前記生物学的試料で決定された前記3′P RNAの前記Ct値であり、
- Ct(B)3′Pは、前記対照試料で決定された前記3′P RNAの前記Ct値であり、
- Ct(A)adpは、前記生物学的試料で決定された前記RNAベースのアダプターの前記Ct値であり、
- Ct(B)adpは、前記対照試料で決定された前記RNAベースのアダプターの前記Ct値であり;
ここで3′P-qPCR倍率変化値≧2または≦0.5は、前記疾患または状態の前記診断、予後、治療モニタリング、または結果予測評価を示す;
を含む、
方法。
【請求項2】
請求項1に記載された方法であって、
ステップ(h′)において、前記3′P-qPCR倍率変化の3′P-qPCR p値を計算するステップをさらに含み;
ここで3′P-qPCR p値<0.5は、前記疾患または状態の前記診断、予後、治療モニタリング、または結果予測評価を示す;
方法。
【請求項3】
請求項1~2のいずれか一項に記載された方法であって、
式(Ia)の前記RNAベースのアダプターは、長さが50~100ヌクレオチド(nt)の間である、
方法。
【請求項4】
請求項1~3のいずれか一項に記載された方法であって、
式(IIa)の前記逆転写プライマーは、長さが10~100ヌクレオチドの間である、
方法。
【請求項5】
請求項1~4のいずれか一項に記載された方法であって、
ステップ(e′)の2つの前記qPCR増幅において使用される前記プライマーは、以下の特徴のうちの少なくとも1つ:
- それらは、1~20の修飾ヌクレオチドを包含する;
- それらは、長さが15~25ヌクレオチドの間である;
- それらは、最小自由エネルギーが-3~-150kcal/molの間である;
- それらは、強いまたは中程度の二次構造を包含せず、および/またはダイマーを形成しない;
- それらは、融解温度が57~70℃の間である;
- それらは、前記対のフォワードプライマーとリバースプライマーとの間の融解温度差が3℃以下である;
を有する、
方法。
【請求項6】
請求項1~5のいずれか一項に記載された方法であって、
ここで、ステップ(e′)の前記第1のqPCR増幅において使用される、前記第1のプライマー対のフォワードプライマーおよびリバースプライマーのうちの少なくとも一方が、それぞれ3′末端および5′末端で、前記3′P RNAの少なくとも6、好ましくは10ヌクレオチドにアニーリングする、
方法。
【請求項7】
請求項1~6のいずれか一項に記載された方法であって、
前記生物学的試料は、尿、全血、唾液、血漿、皮膚、線維芽細胞、神経細胞、肝臓、筋肉、初代細胞株、不死化細胞株、人工多能性幹細胞(iPS細胞)、非ヒト胚性幹細胞(ES細胞)から選択される、
方法。
【請求項8】
請求項1~7のいずれか一項に記載された方法であって、
前記疾患は、脊髄性筋萎縮症(SMA)であり、
および
脊髄性筋萎縮症(SMA)の前記少なくとも1の分子マーカーは、配列番号1~83、208~217のいずれかに示される配列、または配列番号1~83、208~217のいずれかに対して90%以上の、好ましくは95%以上の同一性を有する配列を有する、3′P RNAから選択される、
方法。
【請求項9】
請求項1~8のいずれか一項に記載された方法であって、
前記疾患は、皮膚扁平上皮癌(cSCC)であり、
および
皮膚扁平上皮癌(cSCC)の前記少なくとも1の分子マーカーは、配列番号84~172、218~221のいずれかに示される配列、または配列番号84~172、218~221のいずれかに対して90%以上の、好ましくは95%以上の同一性を有する配列を有する、3′P RNAから選択される、
方法。
【請求項10】
脊髄性筋萎縮症(SMA)の診断、予後、治療モニタリング、または結果予測評価のためのキットであって:
(a′)配列番号185に示される配列を有する、RNAベースのアダプター;
(b′)配列番号186に示される配列を有する、逆転写プライマー;
(c′)第1のqPCR増幅を行うための7つの第1のプライマー対であって、前記7つのプライマー対の第1のフォワードプライマーおよびリバースプライマーは、以下の配列対に示される配列を有する:配列番号187および188、配列番号187および189、配列番号190および191、配列番号192および193、および配列番号198および199、配列番号200および201、配列番号202および203;
および
(d′)第2のqPCR増幅を行うための第2のプライマー対であって、第2のフォワードプライマーおよび第2のリバースプライマーは、それぞれ配列番号204および205に示される配列を有する;
を含む、
キット。
【請求項11】
皮膚扁平上皮癌(cSCC)の診断、予後、治療モニタリング、または結果予測評価のためのキットであって:
(a′)配列番号185に示される配列を有する、RNAベースのアダプター、
(b′)配列番号186に示される配列を有する、逆転写プライマー、
(c′)第1のqPCR増幅を行うための4つの第1のプライマー対であって、前記2つのプライマー対の第1のフォワードプライマーおよびリバースプライマーは、それぞれ以下の配列対に示される配列を有する:配列番号194および195、配列番号196および197、配列番号222および223、配列番号224および225、
および
(d′)第2のqPCR増幅を行うための第2のプライマー対であって、第2のフォワードプライマーおよび第2のリバースプライマーは、それぞれ配列番号204および205に示される配列を有する;
を含む、
キット。
【請求項12】
請求項10または請求項11に記載されたキットであって、
前記キットは、以下のうちの少なくとも1つ:
(e′)生物学的試料からのRNA抽出および単離のための、試薬;
(f′)PNK酵素;
(g′)第1のリガーゼ酵素;
(h′)第2のリガーゼ酵素;
(i′)逆転写酵素(RT);
(j′)qPCRマスターミックス;
(k′)RT-qPCRアッセイを検証するための、陽性および陰性対照。
(l′)ヌクレアーゼフリー水;
(m′)反応チューブおよびプレート;
(n′)使用説明書およびプロトコル;
をさらに含む、
キット。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書は、疾患の分子マーカーとして、3′リン酸または2′/3′環状リン酸を含むRNA断片を検出することおよび定量することによって行う、疾患の診断、予後、治療モニタリング、または結果予測評価のための、方法およびキットに関係する。
【背景技術】
【0002】
バイオマーカーとは、その測定が疾患の存在または進行および治療の効果に関する有意義な情報を提供する、生体分子である1,2。RNAベースのバイオマーカーは、癌、神経変性疾患、および感染症を含む、様々な状態における疾患の診断、予後、および治療モニタリングの目的のための非常に有望な候補として、多様な分子マーカーの中で際立つ。バイオマーカーの開発を洗練させるために、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、転移RNA(tRNA)、長鎖ノンコーディングRNA(lncRNA)、および環状RNA(circRNA)を含む、様々なRNAタイプの調査のために、広範な研究が行われてきた4-6。RNAは、タンパク質ベースのバイオマーカーと比較して、それが通常豊富に存在し、費用対効果の高い方法を通じて検出が容易であり、および広範囲の生体液(例えば、尿、血液、唾液)内にそれが存在することを含む、いくつかの重要な利点を、この目的のために提供する。この他に、RNAは、健康状態と比較して、多くの病理学的条件で異なる発現パターンを示し3,8、特有の疾患マーカーとしての可能性を強調する。加えて、RNA分子は、大きな転写後修飾を受けることで、器官、組織、および細胞タイプに特異的な、その一意性をさらに高める10-12。既知の修飾の中でも、RNA分子上の3′リン酸または2′/3′環状リン酸基(3′P RNAと称される)の存在は、RNA処理事象から、すなわち主にrRNA、snRNA、およびtRNAなどのノンコーディングRNAの酵素的切断からだけでなく、タンパク質をコードするRNAの選択的分解からも生じる13,14。この処理により、長さ10~200ヌクレオチドの範囲のRNA断片が生成され、疾患特異的マーカーの膨大なコレクションを提供する。残念ながら、これらRNA生成物の真の可能性は、ポリアデニル化またはライゲーションなどの後続の処理ステップのために、3′OH基の存在に依存するという、現在の検出方法の限界のせいで、多くの場合見過ごされている。複雑で時間のかかる手法を使用することにより、予備的研究は、細胞内または生体液内で作用することによる17、不可欠な生物学的過程の特有のマーカーとしての3′P RNAの重要性を、明らかにし始めている15,16。特定の3′P RNA断片の発現の変化は、癌、ウイルス感染、および神経変性において観察されている18,19。この新たな理解は、ヒトの健康および疾患におけるそれらの役割を探求する重要性を強調する。試料のタイプによっては、全体の3′P RNAの5%~50%が、tRNA断片(tRF)であり、成熟tRNAの切断に由来する断片を意味する。例えば、アンギオゲニン(リボヌクレアーゼAスーパーファミリーに属するヌクレアーゼ)によって切断されたtRNAの特定のサブセットが、神経細胞から分泌されて、筋萎縮性側索硬化症患者の血清試料中に発見され、強い予後的価値を持つことが最近見出された20。さらに、特定のtRNA断片は、異常タンパク質合成を抑制し、骨髄異形成症候群における白血病の進行を予測することが最近発見されており21、疾患の潜在的なマーカーとしての3′P tRNA断片の役割を示唆している22-25
【0003】
今日まで多大な努力が費やされたにもかかわらず、本分野では、3′P RNA断片を効果的にスクリーニングおよび定量するための、信頼性が高く、簡易かつ正確な方法が、依然として欠如している。このような頑強なスクリーニング技術の欠如は、このタイプのRNA分子の同定における大きな障害となっており、疾患の診断、予後、および治療モニタリングなどの重要な目的における、その利用可能性を制限する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の目的は、特定の疾患に関連する分子マーカーを同定および定量して、疾患の診断、予後、治療モニタリング、または結果予測評価を促進するための、包括的な方法を提供することである。具体的には、3′末端でリン酸化されるRNA断片により表される分子マーカーに焦点を当てる。革新的な手法を活用することにより、より正確かつ信頼性の高い診断、予後、治療モニタリング、および結果予測評価を可能にすることが目的である。
【0005】
本開示のさらなる目的は、疾患の分子マーカーを同定するための方法を実施するための、およびそれらを診断、結果予測、予後、および治療モニタリングにおいて使用するための、キットを提供することである。
【課題を解決するための手段】
【0006】
本発明によれば、上記の目的は、以下の特許請求の範囲に具体的に記載された内容によって達成され、これらは形成するものと理解される。
【0007】
本発明は、請求項1に規定される、疾患または状態の診断、予後、治療モニタリング、または結果予測評価のためのインビトロまたはエクスビボ方法、および請求項10および11に規定される、脊髄性筋萎縮症(SMA)および皮膚扁平上皮癌(cSCC)を診断するためのキットに関係する。
【0008】
[図面の簡単な説明]
本発明は、純粋に例示であり非限定的な例として、添付の図面を参照しながら、ここで詳細に説明される。図面において:
【図面の簡単な説明】
【0009】
図1】翻訳開始部位および翻訳終止周辺のP部位の頻度を示す、メタプロファイル。ライブラリは、3′Pリボソーム保護断片のCHO細胞ペレットからのリボソーム精製および抽出後に、Dart-RNAシーケンシングにより生成された。
図2】マウス肝組織のDart-RNAseq解析。マウスの対照およびSMA肝組織のリード長分布。
図3】様々なトランスクリプトタイプへのリードマッピングの百分率。
図4】対照(黒線)およびSMA(灰色線)マウス肝組織における、3′P-tRFs_Val_AACの塩基ごとのカバレッジ。
図5】対照およびSMA肝組織における、tRNA_Val_AACにアライメントするリードの5′開始端および3′末端に関連する切断の頻度を示す、ヒートマップ。
図6】U2偽遺伝子の全長トランスクリプトの二次構造の模式図。濃い黒でSm結合部位と3′P Gm22973断片がマッピングされる領域とが強調される。各ステムループに関連する名称が、参考として記載される。
図7】A.対照およびSMA肝組織における、3′P-tRFs_Val_AAC/CACおよび3′P-tRFs_Val_TACの、3′P-qPCR発現解析。結果は、相対的なlog2倍率変化(fold change)として示される。 B.対照およびSMA肝組織からの、総全長tRNA Val AAC(上)および総3′PtRF_Val_AAC断片(下)の、ノーザンブロット解析の代表的な画像(左)。右側には、ゲル中のバンドの定量に基づいた、3′P-tRFs_Val_AACの相対発現(倍率変化)を示すヒストグラムが、右側に表示される。データは、平均±平均の標準誤差(s.e.m.)として表される。2群間の比較は、スチューデントのt検定を使用して行われた;n=3;*P<0.05、およびn.s.:有意差なし。
図8】A.対照およびSMA肝組織における、3′P-Gm22973断片の、3′P-qPCR発現解析。 B.対照およびSMA肝組織における、全長Gm22973トランスクリプトの、3′P-qPCR発現解析。 C.対照およびSMA肝組織における、3′P-U2の、3′P-qPCR発現解析の結果を示す、ヒストグラム。 D.対照およびSMA肝組織における、U2 snRNAトランスクリプトの、全長qPCR発現解析を示す、棒グラフ。データは、平均±平均の標準誤差(s.e.m.)として表される。群間の比較は、スチューデントのt検定を使用して行われた;N=3;*P<0.05;**P<0.01、およびn.s.:有意差なし。
図9】不死化ヒトケラチノサイト(HKC)およびSCC細胞株のdart-RNAseq解析における、異なるトランスクリプトタイプへのリードマッピングの百分率。
図10】HKCおよびSCC試料から得られたDart-RNAseq結果の、主成分分析(PCA)。
図11】A.ケラチノサイト(HKC)およびcSCCにおける、5′_tRFs_Glu_CTCの、3′P-qPCR解析および相対発現。 B.ケラチノサイトおよびcSCCにおける、3′_tRFs_Asp_GTCの、3′P-qPCR解析および相対発現。データは、平均±平均の標準誤差(s.e.m.)として表される。2群間の比較は、スチューデントのt検定を使用して行われた;n=3;***P<0.001。
図12】Dart-RNAseq法の模式図。 A.Dart-RNAseq 2ステップPCR。 B.Dart-RNAseq 1ステップPCR。
図13】3′P-qPCRアッセイの模式図。
【発明を実施するための形態】
【0010】
[定義]
「3′P RNA」とは、3′リン酸または2′/3′環状リン酸を含むRNA断片を意味する。
【0011】
「Dart-RNAseq解析(Dart-RNAseq analysis)」とは、本発明者によって開発され本明細書において開示される、生物学的試料中の疾患または病的状態の分子マーカーとして、3′P RNAを同定するための方法を意味する。
【0012】
「3′P-qPCRアッセイ(3′P-qPCR assay)」とは、本発明者によって開発され本明細書において開示される、生物学的試料中の3′P RNAにより表される分子マーカーのプロファイルを決定することにより、疾患または状態を、診断し、発症するリスクを評価し、または予後判断する方法を意味する。
【0013】
「PCR」すなわち「ポリメラーゼ連鎖反応(polymerase chain reaction)」とは、ポリメラーゼ連鎖反応を使用して、DNAまたはRNA標的を選択的に増幅することを意味する。PCR中に、短い一本鎖(ss)合成オリゴヌクレオチドまたはプライマーが、標的テンプレート上で、熱変性、プライマーアニーリング、およびプライマー伸長の繰り返しサイクルを使用して、伸長される。
【0014】
「qPCR」すなわち「定量ポリメラーゼ連鎖反応(quantitative polymerase chain reaction)」とは、標的DNAまたはRNA配列の増幅と、反応中のそのDNA/RNA種の濃度の定量とを組み合わせる、PCRベースの技術を意味する。この方法により、開始テンプレート濃度の計算が可能になる。
【0015】
「シーケンシングプラットフォームアダプター構造(sequencing platform adapter construct)」とは、市販のシーケンシングプラットフォーム、例えば、Illumina(登録商標)(例えば、HiSeg(商標)、MiSeg(商標)、およびNovaSeq(商標)シーケンシングシステム);Element Bioscience(商標)(例えば、AVITI(商標)シーケンシングシステム用LoopSeq);Singular genomics(例えば、G4システム);Life Technologies(商標)(例えば、SOLDシーケンシングシステム);Roche(例えば、454 GS FLX+および/またはGS Juniorシーケンシングシステム);MGI(例えば、E25、G400、G99、G50、およびT7、T10、T20システム)などによって利用される、核酸構造を意味する。
【0016】
シーケンシングプラットフォームアダプター構造には、1または複数の核酸ドメインを含む。
【0017】
「核酸ドメイン(nucleic acid domain)」とは、目的のシーケンシングプラットフォームに適する長さおよび配列を有するオリゴヌクレオチド分子を意味し、すなわち、目的のシーケンシングプラットフォームにより使用されるポリヌクレオチドが核酸ドメインへ特異的に結合できることを意味する。
【0018】
核酸ドメインは、4~200ヌクレオチド(nt)、4~100ヌクレオチド、6~75、8~50、または10~40ヌクレオチドの長さを有しうる。
【0019】
目的のシーケンシングプラットフォームでのシーケンシングに有用な核酸ドメインのヌクレオチド配列は、経時的に変動および/または変化しうる。アダプター配列は典型的には、シーケンシングプラットフォームの製造者によって提供される(例えば、シーケンシングシステムに付属する技術文書内および/または製造者のウェブサイト上で入手可能)。そのような情報に基づいて、アダプター、逆転写プライマー、および/または増幅プライマーの配列は、1または複数の核酸ドメインの全体または一部を含むように設計されてもよく、目的のプラットフォーム上で解析対象である核酸インサート(本例では3′P RNA)のシーケンシングが可能な構成とされる。
【0020】
核酸ドメインは、以下から選択されうる:表面付着シーケンシングプラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)シーケンシングシステムにおいて、フローセルの表面に付着した、P5またはP7オリゴヌクレオチド)に特異的に結合する「キャプチャードメイン(capture domain)」。;「シーケンシングプライマー結合ドメイン(sequencing primer binding domain)」(例えば、Illumina(登録商標)プラットフォームのRead 1またはRead 2プライマーが結合しうるドメイン);「バーコードドメイン(barcode domain)」(例えば、シーケンシングされている核酸の試料源を一意に同定して、所与の試料からの各分子に特定のバーコードまたは「タグ(tag)」を用いてマーク付けすることにより、試料を多重化することを可能にするドメイン);「バーコードシーケンシングプライマー結合ドメイン(barcode sequencing primer binding domain)」(バーコードをシーケンシングするために使用されるプライマーが結合するドメイン);「分子同定ドメイン(molecular identification domain)」(例えば、4、6、または他の数のヌクレオチドのランダム化されたタグなどの、分子インデックスタグ)で、目的の分子を一意にマーク付けして、ユニークタグがシーケンシングされる事例数に基づいて、発現レベルを決定するためのもの;または、そのようなドメインの任意の組合せ。ある態様において、バーコードドメイン(例えば、試料インデックスタグ)およびユニーク分子同定(UMI)ドメイン(例えば、分子インデックスタグ)が、同じ核酸ドメイン内に含まれうる。
【0021】
「レトロ転写酵素活性の阻止を可能にするスペーサー(spacer allowing the arrest of a retrotranscriptase enzyme activity)」とは、脱プリン化または他のメカニズムによって生じる、自然発生する脱塩基部位の存在を模倣するために使用されうる、化学修飾を意味する。修飾には、デオキシリボース糖を2′-ヒドロキシル基を欠く修飾糖分子で置換することを含む。この修飾により、オリゴヌクレオチド内のヌクレオチド間の正常な塩基対形成および水素結合相互作用が妨げられる。それは、1,2′-ジデオキシリボース修飾(以下の化学構造
を有するdSpacer、脱塩基部位としても知られる)、テトラヒドロフラン(THF)、または脱プリン/脱ピリミジン(AP)部位の中から選択されうる。あるいは、それは、ビオチン化遮断スペーサー、「IntビオチンdT」、すなわちビオチン分子と共役したデオキシチミジン(dT)であってもよく、以下の構造を有する。

【0022】
「核酸塩基(nucleobase)」、「窒素塩基(nitrogenous base)」、または単に「塩基(base)」とは、ヌクレオシドを形成する窒素含有生物学的化合物を意味し、これはさらにヌクレオチドの構成要素である。
【0023】
「p値(p-value)」とは、結果または観測の有意性の統計的尺度を意味する。p値は、様々な統計的パラメータによって決定されうる。最もよく知られた統計的パラメータは帰無仮説であり、これは変数間に影響が無いまたは関係が無いことを表す。p値は、帰無仮説に反する証拠を評価するのに役立ち、それを棄却するか棄却しないかの決定を助ける。具体的には、p値は、帰無仮説が真であると仮定した場合に、データで観測された統計量と同じか、またはそれよりも極端な検定統計量を得る確率を表す。p値が非常に小さい場合(典型的には0.05または0.01など、予め定められた有意水準未満)、観測されたデータが帰無仮説のみの下で発生した可能性が低いことを示唆する。そのような場合、帰無仮説に反する証拠が強いと見なされ、帰無仮説は棄却され、対立仮説が支持される。逆に、p値が相対的に大きい場合(選択された有意水準、通常は0.05を超える)、観測されたデータが帰無仮説の下で異常または極端ではないことを示す。この状況では、帰無仮説を棄却するのに十分な証拠がなく、帰無仮説は維持される。
【0024】
p値を定義する他の統計的パラメータが当業者に知られており、以下のものがある:
- 検定統計量:検定統計量は、検定される仮説を評価するために使用されるデータの数値的な要約である。検定統計量の選択は、データの性質および研究課題に依存する。一般的に使用される検定統計量の例には、t統計量、カイ二乗統計量、F統計量、およびzスコアを含む。
- 対立仮説:対立仮説は、帰無仮説の反対を表し、研究者が検出しようとする影響または関係を反映する。それは典型的には、特定の効果量または群間の差異を表す文として定式化される。
- 有意水準:有意水準は、一般にα(アルファ)として表され、統計的有意性を判断するために予め決められた閾値である。これは、帰無仮説が真である場合にそれを棄却する最大許容確率を表す。一般的に使用される有意水準は、0.05(5%)および0.01(1%)である。
【0025】
様々な統計ソフトウェアパッケージおよびライブラリが、様々な検定に対するp値を計算するための組み込み関数を提供し、研究者にとって処理をより平易にしている。p値は、効果量、信頼区間、および他の関連する尺度と組み合わせて解釈され、手元のデータおよび研究課題について十分な結論を導くべきである。
【0026】
3′P-qPCRアッセイとDart-RNAseq解析法では、p値の計算方法および解釈方法に違いがある。
【0027】
3′P-qPCRでは、p値は典型的には、スチューデントのt検定または分散分析(ANOVA)などの統計検定を使用して計算される。3′P-qPCRのp値は、2群間(例えば、処理と対照)の観測されたRNA発現の差が偶然のみによって生じた可能性を評価する。低いp値は、観測されたRNA発現の差が統計的に有意であることを示し、比較されている群間に実際の差があることを示唆する。有意性の閾値(通常アルファ、αとして表される)は、典型的には0.05に設定される。p値がこの閾値未満の場合、結果は統計的に有意と見なされる。
【0028】
Dart-RNAseq解析法では、p値は通常、発現差異解析に関連付けられ、これは2つの条件または群間で発現に有意な変化を示す遺伝子を同定することを目的とする。p値は、通常edgeR、DESeq2、またはlimmaのような統計手法を使用して計算され、これらはカウントベースのモデルを使用し、次世代シーケンシング(NGS)データに内在する変動を考慮する。p値は、観測されたRNA発現差異が、ランダムな変動のみによるものである確率を表す。低いp値は、観測された発現差異が統計的に有意であることを示し、比較される条件間に真の差があることを示唆する。p値の有意性閾値(α)はまた、通常0.05以下に設定され、発現差異が統計的に有意であると判断する。
【0029】
重要なのは、3′P-qPCRおよびDart-RNAseq解析におけるp値の計算および解釈は、使用される具体的な統計手法およびアルゴリズムに依存することである。加えて、Dart-RNAseq解析データにおける大規模データセットを解析する際には、多重検定補正(例えば、ボンフェローニ補正)などの他の要因を考慮して、偽発見率を制御することが重要である。
【0030】
明確にするために、3′P-qPCRアッセイにおいてp値が計算される場合は、「3′P-qPCR p値」と名付け、Dart-RNAseq解析においてp値が計算される場合は、「Dart-RNAseq p値」と名付けた。
【0031】
「マルチマッピングスコア(multimapping score)」とは、アライメントの曖昧さまたはリードがマッピングされる可能性のあるトランスクリプトーム位置の数を定量化する、計量を意味する。これは、所与のリードに関連する不確実性または複数マッピング可能性のレベルを評価する。シーケンシングデータ解析において(Dart-RNAseq解析と同様)、リードは、RNA分子のシーケンシングされた断片から得られた短い配列である。目的は、これらのリードをリファレンストランスクリプトームにアライメントまたはマッピングして、その起源または位置を決定することである。しかしながら、トランスクリプトームにおけるリードの長さ、反復領域、または類似性の高い配列など様々な要因により、いくつかのリードは、同じまたは類似したアライメントスコアで、複数の位置にマッピングされうる。マルチマッピングスコアは、リードマッピングに関連する曖昧さの尺度を提供する。これは、リードが類似したアライメントスコアでマッピングされる可能性のある、トランスクリプトーム位置の数を示す。マルチマッピングスコアが高いほど曖昧さのレベルが高いことを意味し、リードが複数のトランスクリプトーム領域または同等のアライメント品質を有する転写産物から由来しうることを示す。マルチマッピングスコアは、シーケンシングデータ解析パイプラインにおいて、リードマッピング結果の信頼性を評価するために、およびマッピングが過度に曖昧なリードを除外するために、一般に使用される。マルチマッピングスコアを考慮することで、リードアライメントの信頼性およびそれに続く下流解析について、当業者は適切な判断を行うことができる。
【0032】
「シーケンシング深度に基づく正規化カウント(normalized counts based on sequencing depth)」または「カウント数に基づく正規化パラメータ(a normalized parameter based on the number of counts)」とは、試料間のシーケンシング深度およびライブラリサイズの違いに対し、リードカウントデータを試料間で比較可能にして、有意義な統計解析を可能にするための、カウントを意味する。これは、各遺伝子または転写産物の生のリードカウントを正規化係数で割ることにより計算され、正規化係数は典型的には、試料中のリードの総数またはデータセット内の全試料にわたるリードカウントの中央値に基づく。正規化は、試料間の正確な比較、および発現差異遺伝子または転写産物の同定を可能にするため、シーケンシングデータ解析において重要である。正規化しない場合、シーケンシング深度およびライブラリサイズの違いにより、結果が偏り、真の生物学的変化を技術的変動から区別することが難しくなりうる。正規化カウントは典型的には、発現差異遺伝子解析、経路解析、およびクラスタリングなどの下流解析のために使用される。正規化は、以下によって行われる:(i)1000塩基あたり100万マッピングリードあたりのリード(RPKM)を計算すること、これは遺伝子長および試料中のマッピングされたリードの総数によりリードカウントを正規化し、結果を遺伝子長1000塩基あたり100万マッピングリードあたりのリード数として表す;または(ii)100万あたりの転写産物(TPM)を計算すること、これはRPKMと同様に、遺伝子長およびマッピングされたリードの総数によりリードカウントを正規化するが、各遺伝子のアイソフォームまたは転写産物バリアントの数も考慮に入れる。シーケンシングデータ解析には他の正規化方法も利用でき、例えば「M値のトリム平均(trimmed mean of M-values)」(TMM)、「クオンタイル正規化(quantile normalization)」、または「DESeq正規化(DESeq normalization)」がある。正規化方法の選択は、具体的な解析パイプライン、データ特性、および目的に依存しうる。
【0033】
「Ct値(Ct value)」とは、標的RNAの蛍光信号が検出可能な閾値レベルに達する、サイクル数を意味する。
【0034】
「倍率変化(fold change)」とは、2つの条件または試料間での遺伝子発現レベルにおける、相対的な変化の尺度を意味する。言い換えれば、具体的な処置、条件、または実験設定に応じた、標的RNAのアップレギュレーションまたはダウンレギュレーションの尺度である。これにより、RNA発現レベルにおける相対的な差異を理解し、実験変数がRNA発現パターンに与える影響を評価するのに役立つ。
【0035】
倍率変化は、通常2つの条件または試料(多くの場合「処理(treatment)」および「対照(control)」群と称される)間で、標的RNAの発現レベルを比較することによって計算される。
【0036】
重要なのは、倍率変化の計算にはまた、技術的変動を補正し、試料または条件間で比較可能なデータにするための、正規化ステップを含みうることである。具体的な正規化方法は、3′P-qPCRとDart-RNAseq解析実験との間で異なりうる。全体として、両方法は遺伝子発現変化についての情報を提供する一方、倍率変化の計算および解釈は、それぞれの原理およびデータ出力形式が異なるため、これらの方法間で異なりうる。
【0037】
明確にするために、3′P-qPCRアッセイにおいて倍率変化(FC)が計算される場合は、「3′P-qPCR倍率変化」と名付け、Dart-RNAseqデータ解析において倍率変化(FC)が計算される場合は、「Dart-RNAseq倍率変化」と名付けた。
【0038】
3′P-qPCRにおいて、倍率変化は、以下の等式に従って計算されうる:
ここで
Ct(対照)標的は、対照試料で決定された標的RNAのCt値であり、
Ct(処理)標的は、生物学的試料で決定された標的RNAのCt値であり、
Ct(対照)refは、対照試料で決定されたリファレンスのCt値であり、
Ct(処理)refは、生物学的試料で決定されたリファレンスのCt値である。
【0039】
3′P-qPCR倍率変化を計算するための、当業者に知られる別の数学的方法もある。以下はいくつかの例である:
【0040】
- 効率補正法(Efficiency Correction Method):この方法は、3′P RNA(標的遺伝子)とRNAベースのアダプター(リファレンス遺伝子)との間の、PCR増幅効率の差を考慮する。これは、各RNAの相対的な増幅効率(E)を計算し、それを使用して倍率変化を計算する前にCt値を補正することを含む。この方法による倍率変化の決定式は、以下のとおりである:

倍率変化=(E_標的)^(Ct(リファレンス)-Ct(標的))

ここで:
E=増幅効率=10^-1/傾き、
傾き=標準曲線の傾き、y軸はCt、x軸はlog(量)を用いてプロットされる。
【0041】
- 標準曲線法(Standard Curve Method):この方法は、一連の既知のテンプレート濃度から生成された標準曲線を利用して、標的遺伝子の相対的な発現を決定する。各試料における標的遺伝子のCt値は、標準曲線上に補間され、対応するテンプレート濃度(g/L)を得る。テンプレートは、処理または対照条件でありうる。「標準曲線に基づく倍率変化(fold change based on the standard curve)」はその後、処理条件と対照条件との間のテンプレート濃度を、以下の等式に従って比較することにより計算される26

標準曲線に基づく倍率変化=(処理条件のg/L)/(対照条件のg/L)。
【0042】
- 比較Ct法(Comparative Ct Method):2^-ΔCt法としても知られ、この手法は、リファレンス遺伝子を使用せずに、標的遺伝子のCt値を直接比較する。各条件/試料における標的遺伝子のCt値は、校正試料に、典型的にはリファレンス条件または対照試料に、正規化される。倍率変化は、2^(-ΔCt)として計算され、ΔCtは各条件/試料のCt値と校正試料のCt値との差を表す。
【0043】
- 相対発現ソフトウェアツール(Relative Expression Software Tool)(REST)27:RESTは、PCR効率およびCt値に基づく倍率変化を計算する、広く使用されるソフトウェアツールである。これは数学モデルを使用して倍率変化を推定し、信頼区間およびp値を含む統計解析を提供する。
【0044】
Dart-RNAseq解析において、倍率変化は、2つの条件または試料間で、遺伝子のリードカウントまたは発現レベルを比較することにより計算される。倍率変化は、処理群における遺伝子の発現レベルと対照群における遺伝子の発現レベルの比を、以下の等式に従って計算することにより、決定される:
ここで
nカウント処理は、生物学的試料中で決定される標的遺伝子の「カウント数に基づく正規化パラメータ」であり、
nカウント対照は、対照試料中で決定される標的遺伝子の「カウント数に基づく正規化パラメータ」である。
【0045】
Dart-RNAseq解析における発現レベルは、転写産物1000塩基あたり100万マッピングリードあたりのリード(RPKM)、または転写産物1000塩基あたり100万マッピングリードあたりの断片(FPKM)として表される、「カウント数に基づく正規化パラメータ」に、多くの場合基づく。Dart-RNAseq倍率変化値は、log2倍率変化またはlog10倍率変化など、通常は対数変換される。対数変換された倍率変化値が、変化の大きさをよりよく表現するため、およびデータ分布を線形化するために、一般に使用される。
【0046】
「ヌクレアーゼ耐性を与える修飾核酸塩基を有するリボヌクレオチド(ribonucleotide having a modified nucleobase conferring nuclease resistance)」とは、安定性が向上し、ヌクレアーゼ活性に対する耐性を備えた、リボヌクレオチドを意味する。リボヌクレオチドにヌクレアーゼ耐性を与えるために、様々な修飾が開発されてきた。これらの修飾は、特定の官能基の追加または特定の原子の置換など、核酸塩基構造への化学的改変を伴いうる。ヌクレアーゼ耐性を与える修飾核酸塩基の例には、以下を含むが、これらに限定されない:
【0047】
- 2′-O-メチル(2′-OMe)リボヌクレオチド:この修飾では、リボース糖の2′-ヒドロキシル基が、メチル基で置換される。この修飾により、RNAの折り畳みまたは機能に大きな影響を与えることなく、ヌクレアーゼ耐性および安定性が向上する。
【0048】
- 2′-フルオロ(2′-F)リボヌクレオチド:この修飾では、リボース糖の2′-ヒドロキシル基が、フッ素原子で置換される。これにより、ヌクレアーゼへの耐性が改善し、RNA安定性が向上する。
【0049】
- ロック(Locked)核酸(LNA):LNAは、リボース糖の2′酸素と4′炭素との間にメチレン架橋を導入することで、リボースをC3′-endo配座に効果的に「ロックする(locking)」。LNAは、ヌクレアーゼ耐性を改善し、また相補的なRNAまたはDNA配列への結合親和性も向上させる。
【0050】
- ホスホロチオエート結合:この修飾では、ホスホジエステル骨格の非架橋酸素原子の1つが、硫黄原子で置換される。この修飾は、キラル中心を導入し、骨格の配座を変化させることにより、ヌクレアーゼ耐性を向上させる。
【0051】
- ペプチド核酸(PNA):PNAは、糖-リン酸骨格がペプチド様骨格で置換される、合成核酸アナログである。PNAは、その非イオン性および独自の骨格構造により、優れたヌクレアーゼ耐性を示す。
【0052】
- 2′-O-(2-メトキシエチル)(2′-MOE)リボヌクレオチド:この修飾では、2′-ヒドロキシル基が2-メトキシエチル基で置換される。これにより、ヌクレアーゼ耐性が向上し、安定性が改善される一方で、RNAのハイブリダイゼーション特性を維持する。
【0053】
「5-メチルシトシン(5-methylcytosine)」(5mC)とは、修飾リボヌクレオチドを意味し、この修飾では、シトシンの5位にメチル基が付加される。
【0054】
「マイナーグルーブバインダー(Minor Groove Binder)」またはMGBとは、DNAの副溝(DNAらせんの浅い溝)へ非共有結合的に選択的に結合する、三日月形分子を意味する。
【0055】
「スペーサー分子(Spacer Molecule)」とは、2つの目的分子を連結させるために使用される、柔軟な分子または一続きの分子を意味する。
【0056】
[発明の詳細な説明]
以下の説明において、多数の具体的な詳細が、実施形態の十分な理解を提供するために与えられる。実施形態は、1または複数の具体的な詳細が無くとも、または他の方法、構成要素、材料などを用いても、実行されうる。場合によっては、周知の構造、材料、または操作は、実施形態の態様が不明瞭になるのを避けるために、詳細に示されず説明されない。
【0057】
本明細書全体を通して「一実施形態」または「ある実施形態」という表現は、実施形態に関連して記載された特定の特徴、構造、または特性が、少なくとも1の実施形態に含まれることを意味する。従って、本明細書を通して様々な箇所で現れる「一実施形態において」または「ある実施形態において」という表現は、必ずしも全て同じ実施形態を指しているわけではない。さらに、特定の特徴、構造、または特性は、1または複数の実施形態において任意の適切な形で組み合わされうる。
【0058】
本明細書に記載される見出しは、便宜上のものであり、実施形態の範囲また意味を解釈するものではない。
【0059】
RNAバイオマーカーの開発における主要な問題は、頑強な候補を同定する技術と、それらを検出するための簡易かつ費用対効果の高い技術の欠如にある28。バイオマーカーの発見を促進するために、本発明者らはある方法(「Dart-RNAseq」と名付けられた)を開発し、3′P RNAを疾患バイオマーカーとして同定することを可能にし、続いて標的定量PCRアッセイ(「3′P-qPCRアッセイ」と名付けられた)によって、バイオマーカーを正確に同定し、目的の疾患を診断し、発症リスクを評価し、または予後判断するための方法となることを確認した。
【0060】
図12に模式的に示されるDart-RNAseq法は、本質的に以下を必要とする:
a.3′P RNAの5′リン酸化;
b.前記3′P RNAとRNAベースのアダプターとの、第1のライゲーション。場合によっては、前記RNAベースのアダプターは、シーケンシングプラットフォームアダプター構造の1つの核酸ドメインの少なくとも一部を含み、および、特定の源(すなわち、ユニークタイプの細胞または単一細胞)からの各3′P RNAをマーク付けするための、ユニーク分子識別子または他のバーコードを含んでもよい;
c.第2のライゲーションステップであって、分子内環状化と呼ばれ、環状RNAを得る;
d.単一ステップのレトロ転写であって、前記RNAベースのアダプター配列の一部にアニーリングするDNAプライマーを用い、前記環状RNAのcDNAコピーを得る。これは、前記シーケンシングプラットフォームアダプター構造の核酸ドメインを、包含しなくてもよく、または少なくとも1つ包含してもよい;
e.1ステップ(図12のパネルB参照)で、または2つの連続するステップ(図12のパネルA参照)で、行われるPCR増幅であって、ここで:
- 前記1ステップのPCRは、前記RNAベースのアダプター配列の少なくとも一部にアニーリングし、および前記シーケンシングプラットフォームアダプター構造の前記核酸ドメインの全てを包含する、プライマーを用いてなされ、
- 前記2つの連続するステップは、以下を含む:
第1のPCRステップは、前記RNAベースのアダプター配列の少なくとも一部にアニーリングし(前記環状RNAの前記cDNAコピーを増幅するため)、および前記シーケンシングプラットフォームアダプター構造の1または複数の核酸ドメインを包含する、プライマーを用いて行われ、
および
第2のPCRステップは、前記第1のPCRプライマー配列にアニーリングし、および前記シーケンシングプラットフォームアダプター構造の1または複数の核酸ドメインを包含する、プライマーを用いて行われる;
f.前記増幅生成物をシーケンシングするステップ;
g.健康な、治療を受けている、または未治療の対象の、対照としての少なくとも1の生物学的試料に対して、ステップ(a)から(f)を繰り返すステップ;
h.少なくとも1つの3′P RNA分子を、疾患の分子マーカーとして、いくつかの特定の条件および閾値を満たすことを決定することにより、同定するステップ。
【0061】
3′P-qPCRアッセイは、図13に模式的に示され、配列特異的3′P RNA疾患マーカー(複数可)の増幅、検出、および評価のための、ハイブリッドプライマーの最適設計に基づく。3′P-qPCRアッセイは、Dart-RNAseq解析のために記載されたステップ「a~e」を必要とするが、RNAベースのアダプター配列およびPCRプライマーのタイプが異なる。具体的には、Dart-RNAseq解析のステップ「e」が、並行して行われる2つのqPCR増幅で置換され、ここで第1のqPCRは、定義されたRNAベースのアダプター配列および3′P RNAに部分的にアニーリングするプライマー対を使用して行われ、第2のプライマー対は、RNAベースのアダプターにアニーリングする。第1のqPCRのフォワードプライマーまたはリバースプライマーのうちの少なくとも1つが、RNAベースのアダプターと3′P RNAとの間の接合部にマッピングされているため、本アッセイは、3′P RNAの3′および5′末端に対して強い特異性を有し、3′および5′アニーリング配列上でヌクレオチド単位の分解能を有する。qPCR増幅後、3′P RNAのいくつかのパラメータが評価され、いくつかの特定の閾値と比較されるが、これは疾患または状態の診断、予後、治療モニタリング、または結果予測評価を決定するためである。3′P-qPCRアッセイは、他の蛍光および抗体ベースの方法、およびシーケンシング方法と比較して、時間および費用を削減できる利点を有する。さらに、本アッセイは、標準的な96ウェルプレート上で、特定の3′P RNAマーカーに対して様々な試料をスクリーニングすることにより、または特定の試料に対して3′P RNAマーカーのパネルを試験することにより、ハイスループット実験のために設計されうる。
【0062】
本発明は、疾患に罹患している対象の生物学的試料に包含される、3′リン酸または2′/3′環状リン酸を含む少なくとも1のRNA断片(3′P RNA)を、疾患の分子マーカーとして、同定するための方法を開示し、
前記方法は、以下の各ステップを含む:
(a)前記生物学的試料中に包含される前記少なくとも1の3′P RNAを、5′末端でリン酸化して、少なくとも1のリン酸化RNA断片を得るステップ(図12のステップ1);
(b)前記少なくとも1のリン酸化RNA断片の3′末端を、RNAベースのアダプターの5′末端にライゲートし、少なくとも1の第1のライゲーション生成物を得るステップ(図12のステップ2);
ここで前記RNAベースのアダプターは、式(I)を有し:

5′OH-N-C1-L1-A-PR1-N-C2-B-OH 3′ (I)

ここで
- Nは、リボヌクレオチドであり、
- xおよびyは、独立に1~20から選択される整数であり、
- L1は、長さが15~30の間である、オリゴリボヌクレオチド配列であり、
- Aは、脱塩基部位またはレトロ転写酵素活性の阻止を可能にするスペーサーであり、
- zは、1~5の整数であり、
- PR1は、長さが10~80の間である、シーケンシングプラットフォームアダプター構造の第1の核酸ドメインの第1の部分であり、
- Bは、無いか、または2′フルオロ塩基を有するリボヌクレオチドか、またはヌクレアーゼ耐性を与える修飾核酸塩基を有するリボヌクレオチドであり、
および
- C1およびC2は、無いか、または最大20ヌクレオチドを含むバーコード配列であり、但しC1とC2の少なくとも一方が無い;
(c)前記少なくとも1の第1のライゲーション生成物を自己ライゲートし、少なくとも1の環状RNA分子を形成するステップ(図12のステップ3);
(d)前記少なくとも1の環状RNA分子の逆転写を行い、前記少なくとも1の3′P RNAの配列を含む、少なくとも1の一本鎖cDNA分子を得るステップ(図12のステップ4);
ここで前記逆転写は、式(II)を有する逆転写プライマーを使用して行われ:

5′OH-R2-N-D1-OH 3′ (II)
ここで
- D1は、L1の逆相補デオキシオリゴリボヌクレオチドであり、ここでD1のL1に対する相補性は、60%~100%の間であり、
- Nは、リボヌクレオチドであり、
- zは、1~20の整数であり、
および
- R2は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の第2の核酸ドメインである;
(e)前記少なくとも1の一本鎖cDNA分子のPCR増幅を行い、少なくとも1の増幅生成物を得るステップ;
ここで前記PCR増幅は、以下のいずれかで行われる:
(i)2つの連続するステップ(図12Aのステップ5および6)であり、ここで:
- 第1のPCR増幅は、第1のプライマー対を使用して行われ、第1のフォワードプライマーおよび第1のリバースプライマーは、それぞれ式(III)および(IV)を有し:

5′OH-T1-T2-OH 3′ (III)
5′OH-T3-OH 3′ (IV)
ここで
◆ T1は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの第2の部分であり、
◆ T2は、長さが10~30の間であり、前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの前記第1の部分の少なくとも一部にアニーリングする、第1のDNAオリゴヌクレオチド配列であり(式IのPR1)、
および
◆ T3は、長さが10~50の間であり、前記シーケンシングプラットフォームアダプター構造の前記第2の核酸ドメインの少なくとも一部にアニーリングする、第2のDNAオリゴヌクレオチド配列であり(式IIのR2);
- 第2のPCR増幅は、第2のプライマー対を使用して行われ、第2のフォワードプライマーおよび第2のリバースプライマーは、それぞれ式(V)および(VI)を有し:

5′OH-Q1-Q2-Q3-OH 3′ (V)
5′OH-Q4-Q5-Q6-OH 3′ (VI)
ここで
◆ Q1は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の第3の核酸ドメインであり、
◆ Q2は、長さが6~20の間である、前記シーケンシングプラットフォームアダプター構造の第4の核酸ドメインであり、
◆ Q3は、長さが10~50の間であり、前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの少なくとも一部にアニーリングする、第3のDNAオリゴヌクレオチド配列であり(式IおよびIIIのT1+PR1)、
◆ Q4は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の第5の核酸ドメインであり、
◆ Q5は、長さが6~20の間である、前記シーケンシングプラットフォームアダプター構造の第6の核酸ドメインであり、
◆ Q6は、長さが10~50の間であり、前記シーケンシングプラットフォームアダプター構造の前記第2の核酸ドメインの少なくとも一部にアニーリングする、第4のDNAオリゴヌクレオチド配列である(式IIのR2);
または
(ii)第3のプライマー対を使用する1つの単一ステップ(図12Bのステップ5)であり、第3のフォワードプライマーおよび第3のリバースプライマーは、それぞれ式(VII)および(VIII)を有し;

5′OH-Q1-Q2-Q7-OH 3′ (VII)
5′OH-Q4-Q5-Q6-OH 3′ (VIII)
ここで
◆ Q1、Q2、Q4、Q5、およびQ6は、上記に示された意味を有し、
および
◆ Q7は、長さが10~50の間であり、5′末端に前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの第2の部分(式(III)のT1に対応する)を含み、および3′末端で前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの前記第1の部分(式(I)のPR1)の少なくとも一部にアニーリングする、DNAオリゴヌクレオチド配列である;
(f)前記少なくとも1の増幅生成物をシーケンシングし、前記少なくとも1の一本鎖cDNA分子中に含まれる、前記少なくとも1の3′P RNAの配列を得るステップ;
(g)ステップ(a)から(f)を、少なくとも1の対照試料に対して繰り返すステップ;
ここで前記対照試料は、健康な、治療を受けている、または未治療の対象の、生物学的試料である;
(h)前記生物学的試料および前記対照試料から得られた前記増幅生成物中に包含される、前記少なくとも1の3′P RNAについて、以下を計算するステップ:(i)カウント数、(ii)Dart-RNAseq p値、(iii)切断パターン、および(iv)以下の等式に従った、前記生物学的試料と前記対照試料との比較におけるカウント数に基づく正規化パラメータのDart-RNAseq倍率変化:
ここで
- nカウント処理は、前記生物学的試料中で決定される前記3′P RNAのカウント数に基づく正規化パラメータであり;
- nカウント対照は、前記対照試料中で決定される前記3′P RNAのカウント数に基づく正規化パラメータであり;
ここで前記少なくとも1の3′P RNAは、以下の場合における前記疾患の前記少なくとも1の分子マーカーであり:
- カウント数が、>200であり、
- 前記Dart RNAseq p値が、≦0.05であり、
- 前記切断パターンは、前記3′P RNAの長さに沿った1塩基あたりの切断頻度が≦40%であり、前記3′P RNAの5′および3′末端における1塩基あたりの切断頻度が≧60%であり、
および
- 前記Dart RNAseq倍率変化が、≧2または≦0.5である。
【0063】
ステップ(h)は、以下の操作のうちの少なくとも1つをさらに含み:
- 前記生物学的試料および前記対照試料から得られた前記増幅生成物中に包含される、前記少なくとも1の3′P RNAの配列を、リファレンスゲノムまたはトランスクリプトーム上にマッピングし、前記少なくとも1の3′P RNAのマルチマッピングスコアを計算するステップ、
- 前記少なくとも1の3′P RNAの長さを計算するステップ、
および
- 前記少なくとも1の3′P RNAのシーケンシング深度に基づく正規化カウントを計算するステップ;
ここで、前記少なくとも1の3′P RNAは、以下の場合における前記疾患の前記少なくとも1の分子マーカーである:
- 前記長さが、>15および<200ヌクレオチドである、
または
- シーケンシング深度に基づく前記正規化カウントが、>5である、
または
- 前記マルチマッピングスコアが、≦100である。
【0064】
フェーズ(e)の最後で得られた増幅生成物は、図12Aまたは図12Bに示される組成を有する、少なくとも1のDNA分子を包含する。DNA分子のセンス鎖は、5′末端から3′末端までに、以下の要素を含む:シーケンシングプラットフォームアダプター構造の第3の(Q1)、第4の(Q2)、第1の(T1+PR1)核酸ドメイン(第1の核酸ドメインは、第1のPR1部分と第2のT1部分との組み合わせにより与えられる)、y個のデオキシリボヌクレオチド(N)、バーコード配列または無し(C2)、無しまたはデオキシリボヌクレオチド(B)、3′P RNAの配列、x個のデオキシリボヌクレオチド(N)、無しまたはバーコード配列(C1)、デオキシリボヌクレオチド(D1)、z個のデオキシリボヌクレオチド(N)、シーケンシングプラットフォームアダプター構造の第2の(R2)、第6の(Q5)、および第5の(Q4)核酸ドメイン。
【0065】
前記シーケンシングプラットフォームは、Illumina(例えば、HiSeg(商標)、MiSeg(商標)、およびNovaSeq(商標)シーケンシングシステム);Element Bioscience(例えば、AVITI(商標)シーケンシングシステム用LoopSeq);Singular genomics(例えば、G4システム);Life Technologies(例えば、SOLDシーケンシングシステム);Roche(例えば、454 GS FLX+および/またはGS Juniorシーケンシングシステム);MGI(例えば、E25、G400、G99、G50、およびT7、T10、T20システム)によって、市販されるものから選択される。好ましくは、前記シーケンシングプラットフォームは、Illuminaによって市販されるものから選択される。
【0066】
シーケンシングプラットフォームアダプター構造の第3の(Q1)、第4の(Q2)、第1の(T1+PR1)核酸ドメインの組合せは、以下から選択される配列を有する:(i)Life Technologiesによる、P1アダプター(「Applied Biosystems SOLiDTM 4 System Library Preparation Guide」にて報告、2010年4月、
https://tools.thermofisher.com/content/sfs/manuals/SOLiD4_Library_Preparation_man.pdf)、(ii)Rocheによる、GSアダプターA(「GS FLX Titanium General Library Preparation Method Manual」にて報告、2009年4月、USM-00048.B、
https://dna.uga.edu/wp-content/uploads/sites/51/2013/12/GS-FLX-Titanium-General-Library-Preparation-Method-Manual-Roche.pdf)、および(iii)MGIによる、MGI 5′アダプター(「MGIEasy RNA Directional Library Prep Set User Manual」にて報告、カタログ番号:1000006385(16RXN)、1000006386(96RXN)、キットバージョン:V2.1、マニュアルバージョン:5.0)。
【0067】
シーケンシングプラットフォームアダプター構造の第2の(R2)、第6の(Q5)、および第5の(Q4)核酸ドメインの組合せは、以下から選択される配列を有する:(i)Life Technologiesによる、P2アダプター(「Applied Biosystems SOLiDTM 4 System Library Preparation Guide」にて報告、2010年4月、
https://tools.thermofisher.com/content/sfs/manuals/SOLiD4_Library_Preparation_man.pdf)、(ii)Rocheによる、GSアダプターB(「GS FLX Titanium General Library Preparation Method Manual」にて報告、2009年4月、USM-00048.B、
https://dna.uga.edu/wp-content/uploads/sites/51/2013/12/GS-FLX-Titanium-General-Library-Preparation-Method-Manual-Roche.pdf)、および(iii)MGIによる、MGI 3′アダプター(「MGIEasy RNA Directional Library Prep Set User Manual」にて報告、カタログ番号:1000006385(16RXN)、1000006386(96RXN)、キットバージョン:V2.1、マニュアルバージョン:5.0)。
【0068】
当該分野の専門家が、市販されるシーケンシングプラットフォームにより使用されるシーケンシングプラットフォームアダプター構造の配列を「切り貼り」し、RNAベースのアダプター、逆転写プライマー、およびPCRプライマーの(および結果として、上記で同定された様々な核酸ドメインの)配列を適切な形で生成する方法を知っていることは、確かに明らかであり、その結果、ステップ(e)の最後で得られるDNA分子は、図12に示される配列を有し、専門家が利用可能なものから選択したシーケンシングプラットフォームによって、シーケンシングされうる。
【0069】
前記シーケンシング(ステップf)が、Illuminaによるシーケンシングプラットフォーム上で行われる場合:
- 前記シーケンシングプラットフォームアダプター構造の第1の核酸ドメインPR1+T1の配列は、配列SP1から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第2の核酸ドメインR2は、配列SP2から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第3の核酸ドメインQ1は、配列P5であり;
- 前記シーケンシングプラットフォームアダプター構造の前記第4の核酸ドメインQ2は、配列i5(すなわちインデックス5)から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第5の核酸ドメインQ4は、配列P7であり;
- 前記シーケンシングプラットフォームアダプター構造の前記第6の核酸ドメインQ5は、配列i7(すなわちインデックス7)から選択される。
【0070】
配列SP1、SP2、i5、i7、P5、およびP7は、当業者の一般的な知識の一部であり、「Illumina Adapter Sequences」にて完全に開示されている。文献番号1000000002694 v11、2019年5月;
https://www.science.smith.edu/cmbs/wp-content/uploads/sites/36/2020/01/illumina-adapter-sequences-1000000002694-11.pdf。
【0071】
前記シーケンシング(ステップf)が、Element Bioscienceによるシーケンシングプラットフォーム上で行われる場合:
- 前記シーケンシングプラットフォームアダプター構造の第1の核酸ドメインPR1+T1の配列は、配列リードプライマー1から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第2の核酸ドメインR2は、配列リードプライマー2から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第3の核酸ドメインQ1は、配列アウターアダプターであり;
- 前記シーケンシングプラットフォームアダプター構造の前記第4の核酸ドメインQ2は、配列インデックス2から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第5の核酸ドメインQ4は、配列アウターアダプターであり;
- 前記シーケンシングプラットフォームアダプター構造の前記第6の核酸ドメインQ5は、配列アダプターから選択される。
【0072】
配列アウターアダプター、インデックス2、リードプライマー1、リードプライマー2、アダプター、およびアウターアダプターは、当業者の一般的な知識の一部であり、「Amplicon LoopSeqTM for AVITITM」文献番号MA-00023 Rev.C、2023年6月、
go.elementbiosciences.com/amplicon-loopseq-aviti-workflow-guide、および「Element ElevateTM Library Prep」文献番号MA-00004 Rev.B、2023年6月、
go.elementbiosciences.com/elevate-library-prep-workflow-guideにて完全に開示されている。
【0073】
前記シーケンシング(ステップf)が、Singular Genomicsによるシーケンシングプラットフォーム上で行われる場合:
- 前記シーケンシングプラットフォームアダプター構造の第1の核酸ドメインPR1+T1の配列は、配列SP1から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第2の核酸ドメインR2は、配列SP2から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第3の核酸ドメインQ1は、配列S1であり;
- 前記シーケンシングプラットフォームアダプター構造の前記第4の核酸ドメインQ2は、配列インデックス1から選択され;
- 前記シーケンシングプラットフォームアダプター構造の前記第5の核酸ドメインQ4は、S2であり;
- 前記シーケンシングプラットフォームアダプター構造の前記第6の核酸ドメインQ5は、配列インデックス2から選択される。
【0074】
配列S1、S2、SP1、SP2、インデックス1、およびインデックス2は、当業者の一般的な知識の一部であり、「ADAPTING LIBRARIES FOR THE G4TM ― INSERT ONLY」文献番号600024 Rev.0、2023年5月、
https://singulargenomics.com/wp-content/uploads/2023/06/Adapting-Library-Insert-600024.pdfにて完全に開示されている。
【0075】
前記第1および第2のDNAオリゴヌクレオチド配列T2およびT3は、それぞれ前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの前記第1の部分(PR1)および第2の核酸ドメイン(R2)の、少なくとも6ヌクレオチドにアニーリングする。
【0076】
前記第3および第4のDNAオリゴヌクレオチド配列Q3およびQ6は、それぞれ前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの前記第2の部分(T1)および前記第2の核酸ドメイン(R2)の、少なくとも6ヌクレオチドにアニーリングする。
【0077】
ステップ(a)を行う前に、前記生物学的試料および/または前記対照試料が、スモールRNA濃縮操作を受け、すなわち、200ヌクレオチド未満(好ましくは10~200ヌクレオチド)の全てのRNA断片が、当業者に既知の任意の方法(例えば、シリカカラムベースの方法)を用いてサイズ選別される。
【0078】
前記生物学的試料は、尿、全血、唾液、血漿、皮膚、線維芽細胞、神経細胞、肝臓、筋肉、初代および不死化細胞株、人工多能性幹細胞(iPS細胞)、非ヒト胚性幹細胞(ES細胞)から選択される。
【0079】
リン酸化ステップ(a)は、T4 PNK 3′minus、T4 PNK、および組換え型のT4 PNK(例えば、Optikinase(商標))から選択される、リン酸化酵素を使用して、行われる。
【0080】
ライゲーションステップ(b)は、RtcB、アーキアーゼ、シロイヌナズナ(Arabidopsis Thaliana)tRNAリガーゼ、および真核生物tRNAリガーゼから選択される、第1のリガーゼ酵素を使用して、行われる。
【0081】
自己ライゲーションステップ(c)は、T4 Rnl1、T4 Rnl2、T4 Rnl2tr、T4 Rnl2 K227Q、Mth Rnl、および分子内ライゲーションを触媒するATP非依存性リガーゼ(例えば、CircLigase(商標)、CircLigaseII(商標))から選択される、第2のリガーゼ酵素を使用して、行われる。
【0082】
逆転写ステップ(d)は、改変M MLV-RT酵素(モロニーマウス白血病ウイルス逆転写酵素)およびAMV-RT酵素(トリ骨髄芽球症ウイルス(Avian Myeoloblastosis Virus)逆転写酵素)から選択される、好ましくはMaxima H Minus(商標)、Superscript(商標)I-II-III-IV、Sunscript(商標)から選択される、逆転写酵素(RT)を使用して、行われる。
【0083】
PCR増幅ステップ(e)は、改変Taq DNAポリメラーゼ、好ましくは高忠実度活性を有するもの(例えば、Q5(登録商標)High-Fidelity DNAポリメラーゼ、Platinum(登録商標)Taq、KAPA HiFi HotStart)から選択される、DNAポリメラーゼ酵素を使用して、行われる。
【0084】
上記のDart-RNAseq解析法は、脊髄性筋萎縮症および皮膚扁平上皮癌のいくつかの分子マーカーの同定を可能にし;脊髄性筋萎縮症の3′P RNAマーカーは、配列番号1~83に示される配列を有し;皮膚扁平上皮癌の3′P RNAマーカーは、配列番号84~172に示される配列を有する。
【0085】
本発明はまた、少なくとも1の3′P RNAを疾患の分子マーカーとして同定するための、上記のDart-RNAseq解析法を実施するのに適したキットを開示し、
前記キットは、以下を含む:
(a)式(I)を有する、少なくとも1のRNAベースのアダプター:
5′OH-N-C1-L1-A-PR1-N-C2-B-OH 3′ (I)
ここで
- Nは、リボヌクレオチドであり、
- xおよびyは、独立に1~20から選択される整数であり、
- L1は、長さが15~30の間である、オリゴリボヌクレオチド配列であり、
- Aは、脱塩基部位またはレトロ転写酵素活性の阻止を可能にするスペーサーであり、
- zは、1~5の整数であり、
- PR1は、長さが10~80の間である、シーケンシングプラットフォームアダプター構造の第1の核酸ドメインの一部分であり、
- Bは、無いか、2′フルオロ塩基を有するリボヌクレオチドか、またはヌクレアーゼ耐性を与える修飾核酸塩基を有するリボヌクレオチドであり、
および
- C1およびC2は、無いか、または最大20ヌクレオチドを含むバーコード配列であり、但しC1とC2の少なくとも一方が無い;
(b)式(II)を有する、逆転写プライマー:
5′OH-R2-N-D1-OH 3′ (II)
ここで
- D1は、L1の逆相補デオキシオリゴリボヌクレオチドであり、ここでD1のL1に対する相補性は、60%~100%の間であり、
および
- R2は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の第2の核酸ドメインであり、
- Nは、リボヌクレオチドであり、
- zは、独立に1~20から選択される整数である;
および以下のいずれか一方、
(c)第1および第2のプライマー対であって、ここで
- 前記第1のプライマー対は、それぞれ式(III)および(IV)を有する、第1のフォワードプライマーおよび第1のリバースプライマーを含み:
5′OH-T1-T2-OH 3′ (III)
5′OH-T3-OH 3′ (IV)
ここで
◆ T1は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの第2の部分であり、
◆ T2は、長さが10~30の間であり、前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの第1の部分(PR1)の少なくとも一部にアニーリングする、第1のDNAオリゴヌクレオチド配列であり、
および
◆ T3は、長さが10~50の間であり、前記シーケンシングプラットフォームアダプター構造の前記第2の(R2)核酸ドメインの少なくとも一部にアニーリングする、第2のDNAオリゴヌクレオチド配列であり;
- 前記第2のプライマー対は、それぞれ式(V)および(VI)を有する、第2のフォワードプライマーおよび第2のリバースプライマーを含み:
5′OH-Q1-Q2-Q3-OH 3′ (V)
5′OH-Q4-Q5-Q6-OH 3′ (VI)
ここで
◆ Q1は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の第3の核酸ドメインであり、
◆ Q2は、長さが6~20の間である、前記シーケンシングプラットフォームアダプター構造の第4の核酸ドメインであり、
◆ Q3は、長さが10~50の間であり、前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメイン(T1+PR1)の少なくとも一部にアニーリングする、第3のDNAオリゴヌクレオチド配列であり、
◆ Q4は、長さが10~50の間である、前記シーケンシングプラットフォームアダプター構造の第5の核酸ドメインであり、
◆ Q5は、長さが6~20の間である、前記シーケンシングプラットフォームアダプター構造の第6の核酸ドメインであり、
◆ Q6は、長さが10~50の間であり、前記シーケンシングプラットフォームアダプター構造の前記第2の核酸ドメイン(R2)の少なくとも一部にアニーリングする、第4のDNAオリゴヌクレオチド配列である;
または
(d)少なくとも1のプライマー対であって、フォワードプライマーおよびリバースプライマーは、それぞれ式(VII)および(VIII)を有し:
5′OH-Q1-Q2-Q7-OH 3′ (VII)
5′OH-Q4-Q5-Q6-OH 3′ (VIII)
ここで
◆ Q1、Q2、Q4、Q5、およびQ6は、上記に示された意味を有し、
および
◆ Q7は、長さが10~50の間であり、5′末端に前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの第2の部分(T1)を含み、および3′末端で前記シーケンシングプラットフォームアダプター構造の前記第1の核酸ドメインの前記第1の部分(式(I)のPR1)の少なくとも一部にアニーリングする、DNAオリゴヌクレオチド配列である。
【0086】
前記キットは、以下を含む:
(a)配列番号173~177に示される配列から選択される配列を有する、少なくとも1のRNAベースのアダプター;
(b)配列番号178に示される配列を有する、逆転写プライマー;
および以下のいずれか一方、
(c)それぞれ配列番号179および180に示される配列を有する、第1のフォワードプライマーおよび第1のリバースプライマーを含む、1つの第1のプライマー対、およびそれぞれ式(IX)および(X)を有する、第2のフォワードプライマーおよび第2のリバースプライマーを含む、少なくとも1つの第2のプライマー対:

5′OH-AATGATACGGCGACCACCGAGATCTACAC(i5)ACACTCTTTCCCTACACGACGCTCTTCCGATCT-OH 3′ (IX)

5′OH-CAAGCAGAAGACGGCATACGAGAT(i7)GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-OH 3′ (X)

ここで
(i5)は、Illuminaによる配列i5(すなわちインデックス5)から選択され、
および
(i7)は、Illuminaによる配列i7(すなわちインデックス7)から選択される;
または
(d)上記に示される式(IX)および(X)を有する、フォワードプライマーおよびリバースプライマーを含む、少なくとも1つのプライマー対。
【0087】
前記キットは、以下のうちの少なくとも1つをさらに含む:
【0088】
(e)前記生物学的試料からのRNA抽出および単離のための、試薬。これらには、汚染を最小限に抑えながら200ヌクレオチド未満のRNAを効率的に抽出するための、溶解緩衝液、シリカベースのスピンカラム、および回収チューブを含む。溶解緩衝液の例は、以下の通りである:Tris-HCl(pH7.5):10mM;EDTA(pH8.0):0mM~1mM;塩化ナトリウム(NaCl):10mM~0.5M;ドデシル硫酸ナトリウム(SDS):0.5%;ドデシルコール酸ナトリウム(SDC):0%~0.5%;プロテイナーゼK:0μg/ml~100μg/ml;HEPES:0nM~100mM。
【0089】
(f)PNK酵素(3′P RNAの5′末端のリン酸化のため、および任意選択でPNK溶液および緩衝液)。
【0090】
(g)第1のリガーゼ酵素(例えばRtcB)(第1のライゲーション反応を行うために必要であり、および任意選択でライゲーション溶液および緩衝液)。
【0091】
(h)第2のリガーゼ酵素(例えばT4 RNAリガーゼ)(第1のライゲーション生成物の分子内環状化のため、および任意選択でライゲーション溶液および緩衝液)。
【0092】
(i)逆転写酵素(RT)、および任意選択でヌクレオチド(dNTP)、溶液、および緩衝液。
【0093】
本キットで使用可能なRT酵素の例は、以下の通りである:
- モロニーマウス白血病ウイルス逆転写酵素(M-MLV RT)(この酵素は、DNAポリメラーゼ酵素であり、逆転写の過程中にRNAテンプレートから相補的DNA(cDNA)の合成を触媒する。これは、RNA依存性DNAポリメラーゼ活性とリボヌクレアーゼH活性の両方を有する);
- トリ骨髄芽球症ウイルス(Avian Myeloblastosis Virus)逆転写酵素(AMV RT)(この酵素は、トリ骨髄芽球症ウイルス由来の、別のRNA依存性DNAポリメラーゼである);
- HIV-1逆転写酵素(この酵素は、ヒト免疫不全ウイルス1型に由来する);
- Thermoscript逆転写酵素(この酵素は、改変型のM-MLV RTであり、高温での安定性と活性の向上を示す);
- SuperScript逆転写酵素(この酵素は、Thermo Fisher Scientificによって開発された独自の酵素である。SuperScript IIおよびSuperScript IIIを含む、いくつかのバリエーションが入手可能である。これらの酵素は、熱安定性の向上、cDNA収量の増加、およびリボヌクレアーゼH活性の低減のために、改変されている);
- Transcriptor逆転写酵素(この酵素は、Roche Diagnostics製の逆転写酵素である。これは、高い熱安定性を示し、高温で行われる逆転写反応に適している)。
【0094】
(j)PCRマスターミックス:PCR増幅に必要な全ての構成要素を含有する、すぐに使用できる混合物。これには、Taq DNAポリメラーゼ、dNTP、および反応緩衝液を含む。PCRマスターミックスはまた、安定剤、増強剤、およびPCR性能を向上させる他の添加物も含有しうる。
- Taq DNAポリメラーゼ:Platinum Taq DNAポリメラーゼ、AccuPrime Taq DNAポリメラーゼ、GoTaq DNAポリメラーゼ、GoTaq GreenおよびGoTaq Flexi DNAポリメラーゼ、KAPA Taq DNAポリメラーゼ、Phusion Taq DNAポリメラーゼ、Q5 High-Fidelity DNAポリメラーゼ。通常は、反応セットアップ中は不活性のままであり、最初の変性ステップ中に活性化される、ホットスタートDNAポリメラーゼである。
- dNTP(デオキシヌクレオチド三リン酸):4つのヌクレオチド(dATP、dCTP、dGTP、およびdTTP)全ての混合物であり、各々の濃度は約200~400μMである。
- 緩衝液:使用される特定のDNAポリメラーゼに最適化された反応緩衝液。典型的には、最適な酵素活性および反応条件を維持するための、塩類および安定剤を含有する。
- MgCl:濃度が約1.5~5mMの塩化マグネシウムであり、DNAポリメラーゼ酵素の補因子として働く。
- プライマー:目的のDNA領域を標的とする、特定のフォワードプライマーおよびリバースプライマー。各プライマーの濃度は変動しうるが、典型的には200~900nMの範囲である。
- 安定剤および増強剤:BSA(ウシ血清アルブミン)またはグリセロールなどの様々な添加物が含まれてもよく、qPCR反応の安定性および性能を向上させる。
【0095】
(k)ヌクレアーゼフリー水。これは、RNAを分解しうる、または反応を妨げうるヌクレアーゼが含まれていない、分子グレードの水である。これは、凍結乾燥成分の再構成、試料の希釈、および対照反応の準備のために、使用される。
【0096】
(l)反応チューブおよびプレート。これらのチューブまたはプレートは、最適な熱伝導性、および使用されているqPCR装置との適合性を提供するように、設計される。
【0097】
(m)使用説明書およびプロトコル。ステップごとのプロトコル、反応条件を最適化するためのガイドライン、およびデータ解析のための推奨事項を含む。
【0098】
一実施形態において、本明細書は、対象における疾患または状態の診断、予後、治療モニタリング、または結果予測評価を、前記対象の生物学的試料中に包含される前記疾患または状態の少なくとも1の分子マーカーを検出することおよび定量することによって行う、インビトロまたはエクスビボ方法に関係し(前記方法の模式図を示す、図13参照)、ここで前記少なくとも1の分子マーカーは、3′リン酸または2′/3′環状リン酸を含むRNA断片(3′P RNA)であり、
前記方法は、以下の各ステップを含む:
(a′)前記生物学的試料中に包含される前記少なくとも1の3′P RNAの5′末端をリン酸化して、少なくとも1のリン酸化RNA断片を得るステップ(図13のステップ1);
(b′)前記少なくとも1のリン酸化RNA断片の3′末端を、RNAベースのアダプターの5′末端にライゲートし、少なくとも1の第1のライゲーション生成物を得るステップ(図13のステップ2);
ここで前記RNAベースのアダプターは、式(Ia)を有し:
5′OH-E1-A-E2-OH 3′ (Ia)
ここで
- E1は、長さが15~30の間である、第1のオリゴリボヌクレオチド配列であり、
- Aは、脱塩基部位またはレトロ転写酵素活性の阻止を可能にするスペーサーであり、
- zは、1~5の整数であり、
- E2は、長さが15~30の間である、第2のオリゴリボヌクレオチド配列である;
(c′)前記少なくとも1の第1のライゲーション生成物を自己ライゲートし、少なくとも1の環状RNA分子を形成するステップ(図13のステップ3);
(d′)前記少なくとも1の環状RNA分子の逆転写を行い、前記少なくとも1の3′P RNAの配列を含む、少なくとも1の一本鎖cDNA分子を得るステップ(図13のステップ4);
ここで前記逆転写は、式(IIa)を有する逆転写プライマーを使用して行われ:

5′OH-G-F1-OH 3′ (IIa)
ここで
- F1は、E1の逆相補デオキシオリゴリボヌクレオチドであり、ここでF1のE1に対する相補性は、60%~100%の間であり、
および
- Gは、長さが10~30の間である、第1のDNAオリゴヌクレオチドである;
(e′)前記少なくとも1の一本鎖cDNA分子の、第1および第2のqPCR増幅を並行して行い、第1および第2の増幅生成物を得るステップ(図13のステップ5);
ここで:
- 前記第1のqPCR増幅は、前記3′P RNA配列の少なくとも一部にアニーリングする第1のプライマー対を使用して行われ、前記第1のプライマー対は、プライマー対セット1、セット2、およびセット3から選択され、ここで各プライマー対は、フォワードプライマーおよびリバースプライマーを含み、前記プライマー対セット1のフォワードプライマーおよびリバースプライマーは、それぞれ式(IIIa)および(IVa)に示される配列を有し、前記プライマー対セット2のフォワードプライマーおよびリバースプライマーは、それぞれ式(IIIa′)および(IVa′)に示される配列を有し、および前記プライマー対セット3のフォワードプライマーおよびリバースプライマーは、それぞれ式(IIIa″)および(IVa″)に示される配列を有し:

セット1
5′OH-H2-N-OH 3′ (IIIa)
5′OH-H1-M-OH 3′ (IVa)

セット2
5′OH-H2-N-OH 3′ (IIIa′)
5′OH-H1-OH 3′ (IVa′)

セット3
5′OH-H2-OH 3′ (IIIa″)
5′OH-H1-M-OH 3′ (IVa″)

ここで、
◆ H1は、E1にアニーリングする第2のDNAオリゴヌクレオチドであり、ここでH1のE1に対する相補性は、30%~100%の間であり、
および
◆ Mは、長さが6~30の間であり、前記3′P RNA配列の3′末端の少なくとも6ヌクレオチドにアニーリングする、第3のDNAオリゴヌクレオチドであり、
◆ H2は、E2にアニーリングする第4のDNAオリゴヌクレオチドであり、ここでH2のE2に対する相補性は、30%~100%の間であり、
および
◆ Nは、長さが6~30の間であり、前記3′P RNA配列の5′末端の少なくとも6ヌクレオチドにアニーリングする、第5のDNAオリゴヌクレオチドであり;
- 前記第2のqPCR増幅は、前記RNAベースのアダプター配列にアニーリングする第2のプライマー対を使用して行われ、前記第2のプライマー対は、それぞれ式(Va)および(VIa)を有する、第2のフォワードプライマーおよび第2のリバースプライマーを含み:

5′OH-H2-OH 3′ (Va)
5′OH-I1-OH 3′ (VIa)
ここで、
◆ H2は、上記に示された意味を有し、
および
◆ I1は、Gにアニーリングする第6のDNAオリゴヌクレオチドであり、ここでI1のGに対する相補性は、60%~100%の間である;
および
(f′)ステップ(a′)から(e′)を、少なくとも1の対照試料に対して繰り返すステップ;
ここで前記対照試料は、健康な、治療を受けている、または未治療の対象の、生物学的試料である;
(g′)前記生物学的試料および前記対照試料のいずれかについて、前記第1および第2の増幅生成物において、前記少なくとも1の3′P RNAの、および前記RNAベースのアダプターの、Ct値を決定するステップ;
(h′)ステップ(g′)において決定された前記Ct値の3′P-qPCR倍率変化を、以下の等式に従って計算するステップ:
ここで
- Ct(A)3′Pは、前記生物学的試料で決定された前記3′P RNAの前記Ct値であり、
- Ct(B)3′Pは、前記対照試料で決定された前記3′P RNAの前記Ct値であり、
- Ct(A)adpは、前記生物学的試料で決定された前記RNAベースのアダプターの前記Ct値であり、
- Ct(B)adpは、前記対照試料で決定された前記RNAベースのアダプターの前記Ct値であり;
ここで3′P-qPCR倍率変化値≧2または≦0.5は、前記疾患または状態の診断、予後、治療モニタリング、または結果予測評価を示す。
【0099】
一実施形態において、前記方法は、ステップ(h′)において、前記3′P-qPCR倍率変化の3′P-qPCR p値を計算するステップをさらに含み、ここで3′P-qPCR p値<0.5は、前記疾患または状態の診断、予後、治療モニタリング、または結果予測評価を示す。
【0100】
一実施形態において、式(Ia)のRNAベースのアダプターは、長さが50~100ヌクレオチドの間である。
【0101】
一実施形態において、式(Ia)のRNAベースのアダプターに包含されるスペーサーAは、1,2′-ジデオキシリボース修飾(dSpacer)、テトラヒドロフラン(THF)、脱プリン/脱ピリミジン(AP)部位、またはビオチン化遮断スペーサーから選択される。
【0102】
一実施形態において、式(IIa)の逆転写プライマーは、長さが10~100ヌクレオチドの間である。
【0103】
一実施形態において、2つのqPCR増幅に使用されるプライマー(第1および第2のプライマー対の両方)は、以下の特徴のうちの少なくとも1つを有する:
- それらは、1~20の修飾ヌクレオチドを包含する;好ましくは、修飾は、ホスホロチオエート修飾、ロック核酸(LNA)、2′-O-メチル修飾、5-メチルシトシン修飾、マイナーグルーブバインダー、スペーサー分子、PNAのうちの1つを包含する。これらの修飾は、プライマー特異性、安定性、および融解温度を含むプライマー性能を最適化するために、単独でまたは組み合わせて使用されうる。
- それらは、長さが15~25ヌクレオチドの間である;
- それらは、最小自由エネルギーが-3~-150kcal/molの間である;
- それらは、強いまたは中程度の二次構造を包含せず、および/またはダイマーを形成しない;
- それらは、融解温度が57~70℃の間である;
- それらは、前記対のフォワードプライマーとリバースプライマーとの間の融解温度差が3℃以下である。
【0104】
一実施形態において、第1のqPCR増幅において使用される、第1のプライマー対のフォワードプライマーおよびリバースプライマーのうちの少なくとも一方が、それぞれ3′末端および5′末端で、3′P RNAの少なくとも6、好ましくは10ヌクレオチドにアニーリングする。
【0105】
一実施形態において、リン酸化ステップ(a′)は、T4 PNK 3′minus、T4 PNK、および組換え型のT4 PNK(例えば、Optikinase(商標))から選択される、リン酸化酵素を使用して、行われる。
【0106】
一実施形態において、ライゲーションステップ(b′)は、RtcB、アーキアーゼ、シロイヌナズナtRNAリガーゼ、および真核生物tRNAリガーゼから選択される、第1のリガーゼ酵素を使用して、行われる。
【0107】
一実施形態において、自己ライゲーションステップ(c′)は、T4 Rnl1、T4 Rnl2、T4 Rnl2tr、T4 Rnl2 K227Q、Mth Rnl、および分子内ライゲーションを触媒するATP非依存性リガーゼ(例えば、CircLligase(商標)、CircLligaseII(商標))から選択される、第2のリガーゼ酵素を使用して、行われる。
【0108】
一実施形態において、逆転写ステップ(d′)は、改変M MLV-RT酵素(モロニーマウス白血病ウイルス逆転写酵素)およびAMV-RT酵素(トリ骨髄芽球症ウイルス(Avian Myeoloblastosis Vvirus)逆転写酵素)から選択される、好ましくはMaxima H Mminus(商標)、Superscript(商標)I-II-III-IV、Sunscript(商標)から選択される、逆転写酵素(RT)を使用して、行われる。
【0109】
一実施形態において、qPCR増幅ステップ(e′)は、改変Taq DNAポリメラーゼ酵素から選択される、DNAポリメラーゼ酵素を使用して行われ、これらは好ましくは、反応セットアップ中は不活性のままであり、最初の変性ステップ中に活性化される。
【0110】
3′P-qPCRアッセイにおいて使用可能なTaq DNAポリメラーゼ酵素の例は、以下の通りである:Platinum Taq DNAポリメラーゼ、AccuPrime Taq DNAポリメラーゼ、GoTaq DNAポリメラーゼ、GoTaq GreenおよびGoTaq Flexi DNAポリメラーゼ、KAPA Taq DNAポリメラーゼ、Phusion Taq DNAポリメラーゼ、Q5 High-Fidelity DNAポリメラーゼ。
【0111】
一実施形態において、疾患は、脊髄性筋萎縮症(SMA)または皮膚扁平上皮癌(cSCC)である。
【0112】
一実施形態において、脊髄性筋萎縮症(SMA)の少なくとも1つの分子マーカーは、配列番号1~83に示される配列を有する3′P RNAから選択される。
【0113】
一実施形態において、皮膚扁平上皮癌(cSCC)の少なくとも1つの分子マーカーは、配列番号84~172に示される配列を有する3′P RNAから選択される。
【0114】
一実施形態において、本明細書は、脊髄性筋萎縮症(SMA)および皮膚扁平上皮癌(cSCC)の診断、予後、治療モニタリング、または結果予測評価のためのキットに関係する。
【0115】
一実施形態において、脊髄性筋萎縮症(SMA)の診断、予後、治療モニタリング、または結果予測評価のためのキットであって、以下を含む:
(a′)配列番号185に示される配列を有する、RNAベースのアダプター;
(b′)配列番号186に示される配列を有する、逆転写プライマー;
(c′)第1のqPCR増幅を行うための7つの第1のプライマー対であって、7つのプライマー対の第1のフォワードプライマーおよびリバースプライマーは、以下の配列対に示される配列を有する:配列番号187および188、配列番号187および189、配列番号190および191、配列番号192および193、および配列番号198および199、配列番号200および201、配列番号202および203;
(d′)第2のqPCR増幅を行うための第2のプライマー対であって、第2のフォワードプライマーおよび第2のリバースプライマーは、それぞれ配列番号204および205に示される配列を有する。
【0116】
一実施形態において、皮膚扁平上皮癌(cSCC)の診断、予後、治療モニタリング、または結果予測評価のためのキットであって、以下を含む:
(a′)配列番号185に示される配列を有する、RNAベースのアダプター、
(b′)配列番号186に示される配列を有する、逆転写プライマー、
(c′)第1のqPCR増幅を行うための2つの第1のプライマー対であって、2つのプライマー対の第1のフォワードプライマーおよびリバースプライマーは、それぞれ以下の配列対に示される配列を有する:配列番号194および195、配列番号196および197、
(d′)第2のqPCR増幅を行うための第2のプライマー対であって、第2のフォワードプライマーおよび第2のリバースプライマーは、それぞれ配列番号204および205に示される配列を有する。
【0117】
一実施形態において、前記キットは、以下のうちの少なくとも1つをさらに含む:
【0118】
(e′)前記生物学的試料からのRNA抽出および単離のための、試薬。これらには、汚染を最小限に抑えながら200ヌクレオチド未満のRNAを効率的に抽出するための、溶解緩衝液、シリカベースのスピンカラム、および回収チューブを含む。溶解緩衝液の例は、以下の通りである:Tris-HCl(pH7.5):10mM;EDTA(pH8.0):0mM~1mM;塩化ナトリウム(NaCl):10mM~0.5M;ドデシル硫酸ナトリウム(SDS):0.5%;ドデシルコール酸ナトリウム(SDC):0%~0.5%;プロテイナーゼK:0μg/ml~100μg/ml;HEPES:0nM~100mM。
【0119】
(f′)PNK酵素(3′P RNAの5′末端のリン酸化のため)、および任意選択でPNK溶液および緩衝液。
【0120】
(g′)第1のリガーゼ酵素(例えばRtcB)(第1のライゲーション反応を行うために必要)、および任意選択でライゲーション溶液および緩衝液。
【0121】
(h′)第2のリガーゼ酵素(例えばT4 RNAリガーゼ)(第1のライゲーション生成物の分子内環状化のため)、および任意選択でライゲーション溶液および緩衝液。
【0122】
(i′)逆転写酵素(RT)、および任意選択でヌクレオチド(dNTP)、溶液、および緩衝液。
【0123】
本キットで使用可能なRT酵素の例は、以下の通りである:
- モロニーマウス白血病ウイルス逆転写酵素(M-MLV RT)(この酵素は、DNAポリメラーゼ酵素であり、逆転写の過程中にRNAテンプレートから相補的DNA(cDNA)の合成を触媒する。これは、RNA依存性DNAポリメラーゼ活性とリボヌクレアーゼH活性の両方を有する);
- トリ骨髄芽球症ウイルス逆転写酵素(AMV RT)(この酵素は、トリ骨髄芽球症ウイルス由来の、別のRNA依存性DNAポリメラーゼである);
- HIV-1逆転写酵素(この酵素は、ヒト免疫不全ウイルス1型に由来する);
- Thermoscript逆転写酵素(この酵素は、改変型のM-MLV RTであり、高温での安定性と活性の向上を示す);
- SuperScript逆転写酵素(この酵素は、Thermo Fisher Scientificによって開発された独自の酵素である。SuperScript IIおよびSuperScript IIIを含む、いくつかのバリエーションが入手可能である。これらの酵素は、熱安定性の向上、cDNA収量の増加、およびリボヌクレアーゼH活性の低減のために、改変されている);
- Transcriptor逆転写酵素(この酵素は、Roche Diagnostics製の逆転写酵素である。これは、高い熱安定性を示し、高温で行われる逆転写反応に適している)。
【0124】
(j′)qPCRマスターミックス:PCR増幅に必要な全ての構成要素を含有する、すぐに使用できる混合物。これには、Taq DNAポリメラーゼ、dNTP、反応緩衝液、および増幅をリアルタイムで検出するための蛍光色素またはプローブを含む。qPCRマスターミックスはまた、安定剤、増強剤、およびPCR性能を向上させる他の添加物も含有しうる。
qPCRマスターミックスには従って、以下のものを含みうる:
- 以下から選択される、Taq DNAポリメラーゼ:Platinum Taq DNAポリメラーゼ、AccuPrime Taq DNAポリメラーゼ、GoTaq DNAポリメラーゼ、GoTaq GreenおよびGoTaq Flexi DNAポリメラーゼ、KAPA Taq DNAポリメラーゼ、Phusion Taq DNAポリメラーゼ、Q5 High-Fidelity DNAポリメラーゼ。通常は、反応セットアップ中は不活性のままであり、最初の変性ステップ中に活性化される、ホットスタートDNAポリメラーゼである。
- dNTP(デオキシヌクレオチド三リン酸):4つのヌクレオチド(dATP、dCTP、dGTP、およびdTTP)全ての混合物であり、各々の濃度は約200~400μMである。
- 緩衝液:使用される特定のDNAポリメラーゼに最適化された反応緩衝液。典型的には、最適な酵素活性および反応条件を維持するための、塩類および安定剤を含有する。
- MgCl:濃度が約1.5~5mMの塩化マグネシウムであり、DNAポリメラーゼ酵素の補因子として働く。
- プライマー:目的のDNA領域を標的とする、特定のフォワードプライマーおよびリバースプライマー。各プライマーの濃度は変動しうるが、典型的には200~900nMの範囲である。
- 安定剤および増強剤:BSA(ウシ血清アルブミン)またはグリセロールなどの様々な添加物が含まれてもよく、qPCR反応の安定性および性能を向上させる。
【0125】
(k′)RT-qPCRアッセイを検証するための、陽性および陰性対照。陽性対照は、既知の量の標的3′P RNAを包含して、アッセイ感度を決定し、標準曲線を確立することを可能にする。陰性対照は、汚染または非特異的増幅がないことを確認する。
【0126】
(l′)ヌクレアーゼフリー水。これは、RNAを分解しうる、または反応を妨げうるヌクレアーゼが含まれていない、分子グレードの水である。これは、凍結乾燥成分の再構成、試料の希釈、および対照反応の準備のために、使用される。
【0127】
(m′)反応チューブおよびプレート。これらのチューブまたはプレートは、最適な熱伝導性、および使用されているqPCR装置との適合性を提供するように、設計される。
【0128】
(n′)使用説明書およびプロトコル。ステップごとのプロトコル、反応条件を最適化するためのガイドライン、およびデータ解析のための推奨事項を含む。
【0129】
以下に、Illuminaシーケンシングプラットフォームに適用されるDart-RNAseq解析法および3′P-qPCRアッセイを行うための、プロトコルの説明が提供される。
【0130】
[Dart-RNAseq解析の概略説明]
[スモールRNAの濃縮]
Dart-RNAseq解析を開始する前に、カラムベースまたはビーズベースの手法を使用して、スモールRNA(smRNA)の濃縮が行われる。Dart-RNAseq解析のための供給源として、細胞株、急速凍結組織、および全血が使用されうる。
【0131】
smRNAの濃縮のために、mirVana(ThermoFisher)、miRNeasy(Qiagen)、RNA Clean and Concentrator(Zymo)、Agencourtビーズ(Beckman)などの、いくつかの市販キットが使用されうる。
【0132】
[ステップ(a).リン酸化]
スモールRNAの濃縮(<200ヌクレオチド)後すぐに、3′P RNAは、表1に示されるプロトコルに従って、T4ポリヌクレオチドキナーゼ(T4 PNK 3′Minus)による5′リン酸化を受ける。
【0133】
【0134】
37℃で1時間、サーマルサイクラーで反応をインキュベートする。
【0135】
RNA Clean & Concentrator(商標)-5キットを通じて、スモールRNA用のプロトコルに従って反応を精製し、6μLのヌクレアーゼフリー水(NFW)中で最終溶出を行う。
【0136】
[ステップ(b).ライゲーション]
両末端でリン酸化された3′P RNAは、2~3つの脱塩基部位、8つの縮退ヌクレオチド、3′末端にフルオロウリジン、および部分的なSP1配列を包含するRNAベースのアダプター(配列番号173~177から選択される配列を有する)に、RtcBリガーゼを介してライゲートされる。
【0137】
RNAベースのアダプターは、上記に開示された式(I)を有する。式(I)を構成する要素は、以下のように対応する:
- 配列番号173は、以下の通りである:N:1~4ヌクレオチド;L1:5~28ヌクレオチド;A:29~31;PR1(Illuminaアダプター構造の第1の核酸ドメイン):32~51ヌクレオチド;N:52~55ヌクレオチド;B:56ヌクレオチド;
- 配列番号174は、以下の通りである:N:1~4ヌクレオチド;L1:5~28ヌクレオチド;A:29~31;PR1(Illuminaアダプター構造の第1の核酸ドメインの第1の部分):32~51ヌクレオチド;N:52~55ヌクレオチド;C2:56~63;B:64ヌクレオチド;
- 配列番号175は、以下の通りである:N:1~4ヌクレオチド;L1:5~28ヌクレオチド;A:29~31;PR1(Illuminaアダプター構造の第1の核酸ドメインの第1の部分):32~51ヌクレオチド;N:52~55ヌクレオチド;C2:56~63;B:64ヌクレオチド;
- 配列番号176は、以下の通りである:N:1~4ヌクレオチド;C1:5~12ヌクレオチド;L1:13~36ヌクレオチド;A:37~39;PR1(Illuminaアダプター構造の第1の核酸ドメインの第1の部分):40~59ヌクレオチド;N:60~63ヌクレオチド;B:64ヌクレオチド;
- 配列番号177は、以下の通りである:N:1~4ヌクレオチド;C1:5~12ヌクレオチド;L1:13~36ヌクレオチド;A:37~39;PR1(Illuminaアダプター構造の第1の核酸ドメインの第1の部分):40~59ヌクレオチド;N:60~63ヌクレオチド;B:64ヌクレオチド。
【0138】
RtcBリガーゼは、RNAベースのアダプターの5′OH末端を、存在する場合スモールRNAの3′P/3′cP末端へ、表2に示されるプロトコルに従って結合させる。
【0139】
【0140】
RNAベースのアダプターの量は、開始材料のsmRNAの量に依存し、以下の表3に示される通りである。
【0141】
【0142】
37℃で1時間、サーマルサイクラーでインキュベートする。
【0143】
ヌクレアーゼフリー水を加えて最終体積を50μLにし、その後RNA Clean & Concentrator(商標)-5キットを通じて、スモールRNA用のプロトコルに従って反応を精製し、8μLのヌクレアーゼフリー水中で最終溶出を行う。
【0144】
[ステップ(c).環状化]
RtcBライゲーション生成物は、T4 RNAリガーゼ1による5′P末端と3′OH末端のライゲーションを通じて、環状化を受ける。反応条件は、表4に示される。
【0145】
【0146】
25℃で2時間インキュベートする。
【0147】
ヌクレアーゼフリー水を加えて最終体積を50μLにし、その後RNA Clean & Concentrator(商標)-5キットを通じて、スモールRNA用のプロトコルに従って反応を精製し、10μLのヌクレアーゼフリー水中で最終溶出を行う。任意停止点(-80℃で保存)。
【0148】
[ステップ(d).逆転写(Superscript III)]
一本鎖cDNAの生成のために、逆転写反応は、上記に開示された式(II)を有する逆転写プライマー(配列番号178)を使用して行われる。式(II)を構成する要素は、以下のように配列番号178に対応する:R2(Illuminaアダプター構造の第2の核酸ドメイン):1~34ヌクレオチド;N:35~38;D1:39~59ヌクレオチド。
【0149】
試薬は、以下の表5に示される量で混合される。
【0150】
【0151】
環状RNAプライマー混合物を70℃で5分間加熱し、その後氷上で少なくとも1分間インキュベートする。アニーリングされたRNAに、表6に示される量の試薬を加える。
【0152】
【0153】
50℃で40分間インキュベートし、その後混合物を80℃で5分間加熱する。
【0154】
[ステップ(e).PCR増幅]
[第1のPCR]
KAPAマスターミックスまたはPhusionマスターミックスが、使用されうる。第1のPCR増幅は、上記に開示された式(III)および(IV)を有する第1のプライマー対(配列番号179および180)を使用して、行われる。式(III)を構成する要素は、以下のように配列番号179に対応する:T1(Illuminaアダプター構造の第1の核酸ドメインの第2の部分):1~13ヌクレオチド;T2:14~33ヌクレオチド。式(IV)の要素T3は、配列番号180の配列全体に対応する。
【0155】
試薬は、表7に示される量で混合され、表8に示される反応条件を適用する。
【0156】
【0157】
【0158】
Ampure XPビーズを1.6倍の比率で使用して、反応を精製する。最終生成物は、総体積40μLのヌクレアーゼフリー水中に溶出される。
【0159】
[第2のPCR]
KAPAマスターミックスまたはPhusionマスターミックスが、使用されうる。第2のPCR増幅は、それぞれ上述した式(IX)および式(X)を有する第2のプライマー対を使用して、行われる。式(IX)を構成する要素は、好ましくは以下のものである:Q1は、Illuminaアダプター構造の第3の核酸ドメインであり、配列番号181に示されるヌクレオチド配列を有する;Q2は、Illuminaアダプター構造の第4の核酸ドメインであり、Illuminaによる配列i5(10ヌクレオチド)から選択される配列を有する;Q3は、配列番号182に示されるヌクレオチド配列を有する。式(X)を構成する要素は、好ましくは以下のものである:Q4は、Illuminaアダプター構造の第5の核酸ドメインであり、配列番号183に示されるヌクレオチド配列を有する;Q5は、Illuminaアダプター構造の第6の核酸ドメインであり、Illuminaによる配列i7(10ヌクレオチド)から選択される配列を有する;Q6は、配列番号184に示されるヌクレオチド配列を有する。
【0160】
試薬は、表9に示される量で混合され、表10に示される反応条件を適用する。
【0161】
【0162】
【0163】
Agencourt XPビーズ(1.6倍の比率)またはNucleoSpin GelおよびPCR CleanUpキットを使用して、100μlのPCR反応全体を精製する。
【0164】
Agencourt XPビーズ:製造者の指示に従い、試料を40μlのヌクレアーゼフリー水中に溶出する。
【0165】
Nucleospin Gelカラム:製造マニュアルの第5.1節の標準プロトコルに従う。各試料を20μlのNFW中に溶出する。最終PCRをネイティブ10%アクリルアミドゲル上で泳動し、約200ヌクレオチドでのバンドを切り取る(図8)。
【0166】
最終ライブラリの質は、バイオアナライザーまたは同様のもの(例えば、tapestation、QIAxcel)でチェックされ、PCR生成物の長さ分布をテストし、およびライブラリの平均長さを定義し、それは190ヌクレオチド~300ヌクレオチドの間でなければならない。
【0167】
ライブラリの最終濃度は、P5(AATGATACGGCGACCACCGAGATCTACAC - 配列番号206)およびP7プライマー(CAAGCAGAAGACGGCATACGAGAT - 配列番号207)を用いたqPCRによって、テストされる。濃度は、0.5nMよりも高くなければならない。
【0168】
ライブラリの品質チェックは、以下のように行われる:
【0169】
1.1 Agilent 2100 Bioanalyzerによって、Agilent High Sensitivity DNA Kitを使用して、サイズ選別された各ライブラリを評価する。
【0170】
1.2 ライブラリプロファイルの結果を使用して、各試料がシーケンシングに適するかを決定する。成功したライブラリ生成は、~200bpに主要ピークを生じるはずである。
【0171】
1.3 各最終Dart-RNAseqライブラリに対してP5およびP7プライマーを使用して、qPCR解析を行う。成功したライブラリ生成は、少なくとも0.1nMの最終濃度を生じるはずである。
【0172】
[ステップ(f).増幅生成物のシーケンシング]
増幅された生成物のシーケンシングは、以下の各ステップによって説明されるが、これに限定されない:
【0173】
1. ライブラリ変性およびクラスター生成:このステップにおいて、ライブラリは、2本のDNA鎖を分離するように変性されて、その後フローセルまたはシーケンシングチップ上にロードされる。ライブラリ分子は固定され、ブリッジ増幅または他のクラスター生成方法を通じて、クラスターに増幅される。各クラスターは、同一のDNA断片のクラスターを表す。
【0174】
2. 実際のシーケンシング:クラスターが形成されると、シーケンシングが行われる。具体的なシーケンシング方法は、使用されるプラットフォームに依存しうる(本件ではIllumina)。蛍光標識されたヌクレオチドが順次追加され、その取り込みが検出される、シーケンシング・バイ・シンセシス法(sequencing-by-synthesis method)が、一般的に使用される。
【0175】
3. ベースコーリングおよび画像解析:シーケンシング中に、蛍光信号または他の検出信号が捕捉され、ベースコールに変換される。ベースコールは、DNAテンプレートのヌクレオチド配列を表す。画像解析ソフトウェアが生データを処理して、各クラスターのベースコールを生成する。
【0176】
4. データ処理および解析:シーケンシング後、生データは、シーケンシングエラー、アダプター配列、および低品質リードを除去するために処理される。得られた高品質リードはその後、リファレンストランスクリプトームにアライメントされ、最終的な配列情報が生成される。
【0177】
5. データ解釈:最終ステップでは、シーケンシングされたデータを解釈し、意味のある生物学的情報を抽出する。これは、「材料および方法」節の「NGSデータ解析」に記載されているように行われる。
【0178】
[ステップ(g).対照]
ステップ(a)から(f)が、少なくとも1の対照試料に対して行われ、ここで対照試料は、健康な、治療を受けている、または未治療の対象の、生物学的試料である。
【0179】
[ステップ(h).疾患バイオマーカーとしての3′P RNAの同定]
疾患バイオマーカーとしての3′P RNAの同定は、以下のように行われる:
a. 疾患を持つまたは治療を受けている対象の生物学的試料および対照から得られた増幅生成物中に包含される、少なくとも1の3′P RNAの配列を、リファレンスゲノムまたはトランスクリプトーム上にマッピングするステップ;および
b. 生物学的試料および対照試料から得られた増幅生成物中に包含される、少なくとも1の3′P RNAについて、以下を計算するステップ:(i)カウント数、(ii)Dart-RNAseq p値、(iii)カウント数のDart-RNAseq倍率変化、または生物学的試料と対照試料との比較におけるカウント数に基づく正規化パラメータのDart-RNAseq倍率変化、(iv)切断パターン、(v)シーケンシング深度に基づく正規化カウント、(vi)マルチマッピングスコア、および(vii)3′P RA配列の長さ。
【0180】
疾患を持つ対象の生物学的試料の増幅生成物中に包含される3′P RNAが、以下の条件を満たす場合、3′P RNAは疾患の分子マーカーである:
- カウント数>200、
- Dart RNAseq p値:≦0.05、
- Dart RNAseq倍率変化≧2または≦0.5、および
- 切断パターンは、3′P RNAの長さに沿った1塩基あたりの切断頻度が≦40%であり、3′P RNAの5′および3′末端における1塩基あたりの切断頻度が≧60%である。
【0181】
3′P RNAが疾患の分子マーカーであるかを決定するために有用なさらなる条件は、以下の通りである:
- シーケンシング深度に基づく正規化カウント>5、
- マルチマッピングスコア≦100、
- 長さ>15および<200ヌクレオチド。
【0182】
[3′P-qPCRアッセイの概略説明]
[ステップ(a′).スモールRNAリン酸化]
スモールRNAの濃縮(<200ヌクレオチド)後すぐに、3′P RNAは、表11に示されるプロトコルに従って、T4 PNK 3′Minusによる5′リン酸化を受ける。

【0183】
【0184】
37℃で1時間、サーマルサイクラーで反応をインキュベートする。
【0185】
RNA Clean & Concentrator(商標)-5キットを通じて、スモールRNA用のプロトコルに従って反応を精製し、6μLのヌクレアーゼフリー水(NFW)中で最終溶出を行う。
【0186】
[ステップ(b′).3′Pライゲーション]
5′末端でリン酸化されたスモールRNAは、上記に開示された式(Ia)を有し3つの脱塩基部位を有するRNAベースのアダプター(配列番号185)に、RtcBリガーゼを介してライゲートされる。式(Ia)を構成する要素は、以下のように配列番号185に対応する:E1:1~24ヌクレオチド、A:25~27、E2:28~48ヌクレオチド。RtcBリガーゼは、RNAベースのアダプターの5′OH末端を、存在する場合スモールRNAの3′P/3′cP末端へ、表12に示されるプロトコルに従って結合させる。
【0187】
【0188】
RNAベースのアダプター(Linker_qPCR、配列番号185)の量は、smRNA開始材料に依存し、以下の表13に示される通りである。
【0189】
【0190】
37℃で1時間、サーマルサイクラーでインキュベートする。
【0191】
ヌクレアーゼフリー水を加えて最終体積を50μLにし、その後RNA Clean & Concentrator(商標)-5キットを通じて、スモールRNA用のプロトコルに従って反応を精製し、8μLのヌクレアーゼフリー水中で最終溶出を行う。
【0192】
[ステップ(c′).環状化]
RtcBライゲーション生成物は、T4 RNAリガーゼ1による5′P末端と3′OH末端のライゲーションを通じて、環状化を受ける。反応条件は、表14に示される。
【0193】
【0194】
インキュベーション:25℃で2時間。
【0195】
ヌクレアーゼフリー水を加えて最終体積を50μLにし、その後RNA Clean & Concentrator(商標)-5キットを通じて、スモールRNA用のプロトコルに従って反応を精製し、10μLのヌクレアーゼフリー水中で最終溶出を行う。任意停止点(-80℃で保存)。
【0196】
[ステップ(d′).逆転写(Superscript III)]
一本鎖cDNAの生成のために、試薬は表15に示される量で混合される。逆転写プライマー(配列番号186)は、上記に開示された式(IIa)を有する。式(IIa)を構成する要素は、以下のように配列番号186に対応する:G:1~19ヌクレオチド、F1=20~35ヌクレオチド。
【0197】
【0198】
環状RNAプライマー混合物を70℃で5分間加熱し、その後氷上で少なくとも1分間インキュベートする。アニーリングされたRNAに、表16に示される量の試薬を加える。
【0199】
【0200】
50℃で40分間インキュベートし、その後混合物を80℃で5分間加熱する。
【0201】
[ステップ(e′).3′P-qPCR]
少なくとも1の一本鎖cDNA分子の、第1および第2のqPCR増幅が、並行して行われ、ここで:
(i)第1のqPCR増幅は、セット1、セット2、およびセット3から選択される第1のプライマー対を使用して、行われる。式(IIIa、IIIa′、IIIa″、IVa、IVa′、およびIVa″)の要素H1およびH2は、調査中の疾患とは無関係に固定された配列を有する一方、要素MおよびNは、解析中の3′P RNAマーカーにアニーリングする特定の配列を有さねばならない;
(ii)第2のqPCR増幅は、それぞれ式(Va)および(VIa)を有する第2のフォワードプライマーおよび第2のリバースプライマー(配列番号204および205)を含む、第2のプライマー対を使用して行われる。
【0202】
qPCR増幅は、全てのqPCR増幅ステップに対して、SYBR(商標)Green PCRマスターミックスによって行われた。
【0203】
【0204】
【0205】
融解温度は、増幅に使用される特定のプライマーに応じて調整されねばならない。
【0206】
[ステップ(f′).対照]
ステップ(a′)から(e′)が、少なくとも1の対照試料に対して行われ、ここで対照試料は、健康な、治療を受けている、または未治療の対象の、生物学的試料である。
【0207】
[ステップ(g′).Ct値の決定]
qPCRの定量解析は、qPCR装置によって与えられるサイクル値(Ctすなわち閾値サイクル)の定量化の分析を通じて得られる。サイクル値(Ct)が増加するにつれて、検出される蛍光も増加する。蛍光が任意のラインを超えるときに、装置はその時までのサイクル値を記録し、これがCt値として知られる。所与の試料中の3′P RNAの量はその後、相対定量または比較定量を使用して決定される。
【0208】
少なくとも1の3′P RNAのCt値は、各生物学的試料の第1および第2の増幅生成物において決定される。
【0209】
[ステップ(h′).3′P-qPCR倍率変化の計算]
相対定量または比較定量では、生物学的試料および対照試料における3′P RNAの濃度の差の決定要素として、Ctの差を使用する。
【0210】
少なくとも1の3′P RNAのCt値の3′P-qPCR倍率変化の計算は、以下の式に従って行われ:
ここで
- Ct(A)3′Pは、生物学的試料で決定された3′P RNAのCt値であり、
- Ct(B)3′Pは、対照試料で決定された3′P RNAのCt値であり、
- Ct(A)adpは、生物学的試料で決定されたRNAベースのアダプターのCt値であり、
- Ct(B)adpは、対照試料で決定されたRNAベースのアダプターのCt値であり;
3′P-qPCR倍率変化値≧2または≦0.5は、疾患または状態の診断、予後、治療モニタリング、結果予測評価を示す。
【実施例0211】
バイオマーカーとして可能性がある3′P RNA断片を詳しく調査するために、発明者らは2つのケーススタディに注目した:(i)脊髄性筋萎縮症(SMA)および(ii)皮膚扁平上皮癌(cSCC)。本開示において開示される具体的な実施形態は、本出願の保護の範囲を制限するものとして解釈されるべきではなく、これは本明細書において開示される方法が、様々な疾患の分子マーカーを同定するために、および様々な疾患を診断し、予測し、モニタリングするために、使用されうるためである。
【0212】
SMAの診断は、SMN1突然変異およびSMN1タンパク質欠失の遺伝学的検出を通じて、十分に確立されている;しかし、これまでに3つの薬物治療が承認されているものの、疾患の進行および治療効果に関するマーカーは非常に乏しい29
【0213】
SMAに関しては、初期症状を示すSMAマウスモデルからの肝組織のDart-RNAseq解析により、3′P RNAの全体的なダウンレギュレーションが明らかとなり、その多くがtRNA断片(tRF)として分類された。以前の報告では、tRFは、癌および神経疾患を含む様々な疾患のバイオマーカーとしての可能性を有することが、見出された5,19,30~32。概念の実証として、本手法を用いて、3′Pを有するtRFの亜集団のみをスクリーニングすることで、この特定カテゴリーの断片に対してより良い解像度を確保した。その中で、3′P-tRFs_Valは、対照群と比較してSMA肝臓において3倍の減少を示し、アンチコドンループおよびCCA tRNA末端で明確な切断部位を有し、3′tRNAハーフとしても知られる39ヌクレオチドの断片を形成した33。アップレギュレーションしたRNAとして、3′P Gm22973が同定されたが、これはGm22973トランスクリプトから生じる断片であり、マウストランスクリプトームではU2 snRNA偽遺伝子としても知られる。興味深いことに、SMA病態におけるSMNタンパク質の機能喪失は、snRNP集合の変化と関連しており、SMAと3′P-Gm22973断片の過剰発現との間の相関を示唆する。
【0214】
皮膚扁平上皮癌は、扁平上皮細胞の異常な増殖を特徴とする。ほとんどのcSCCは、手術により治療されうるが、その一部は再発および転移し、高い確率(>50%)で死亡に至る。cSCCの発症率は年々増加しているが、癌の進行、再発、および転移の信頼できる分子マーカーは、いまだ存在しない34。ここでは、低インプット3′P RNA次世代シーケンシング(NGS)法を、標的3′P-qPCRアッセイと組み合わせて、3′P RNA断片のプロファイリングおよび定量化を行うことを目指す。
【0215】
cSCCに関しては、不死化扁平上皮癌細胞および健康なケラチノサイト細胞が、解析された。cSCCに特異的な3′P RNA断片の発現が、調査された。
【0216】
tRNAグルタミン酸の5′末端(5′_tRFs_Glu_CTC)およびtRNAアスパラギン酸_GTCの3′末端(3′_tRFs_Asp_GTC)に由来する3′P tRFが、潜在的な疾患マーカーとして同定された。全体として、3′P-qPCRによって発明者は、選択されたcSCC標的試料においてDart-RNAseqデータを確認することに成功し、また高度に保存されたtRNA配列間の識別もできた。
【0217】
結論として、本明細書は、Dart-RNAseq解析と3′P-qPCRアッセイとの組み合わせが、潜在的な新しい疾患マーカーをスクリーニングし、同定し、検証するために有用であり、3′P RNA-オミクスが疾患のバイオマーカーとして明らかにならないことを示す。
【0218】
[結果]
[脊髄性筋萎縮症における3′P RNA断片]
バイオマーカー研究に必要な低インプット要件に対応するために、我々はDart-RNAseqと名付けられた方法を設計した。この方法は、以前に開発されたcircAID技術(3′P RNAナノポアシーケンシング用プロトコルに基づく35)から、2つの主な改良を導入することにより、進化させたものである。1つめは、以下を包含する特定のアダプターを用いた、ライゲーションステップである:(i)内部レトロ転写停止部位、(ii)PCR重複識別のためのユニーク分子識別子(UMI)としての、12ヌクレオチド、および(iii)1回の実行で複数の試料をプールするための、バーコード配列(8ヌクレオチド)。2つめは、2ステップPCRと組み合わせたレトロ転写であり、これによりワークフローはNGSシーケンシングに理想的なものとなる。この手法により、トランスクリプトーム全体にわたる3′P RNAのシーケンシングおよびプロファイリングが可能となる。我々は、外因性ヌクレアーゼ(リボヌクレアーゼI)をCHO細胞ライセートの粗細胞ライセートへ加え、その後リボソーム分離およびRNA抽出を行うことにより、このワークフローをテストした。この手順は、リボソームプロファイリングと呼ばれ、リボソームフットプリント(RPF)を同定するために使用される36。我々の結果では、リボソームP部位の明確な3ヌクレオチド周期性を有するコーディング配列における、RPFの濃縮が確認され、リボヌクレアーゼIの酵素的切断により生成された3′P RNAをシーケンシングする、本方法の能力が確認された(図1)。我々は、この方法をDart-RNAseqと名付けた。
【0219】
バイオマーカーのスクリーニングに適した出発材料を同定するために、我々は公開されているRNAシーケンシングデータセットを解析した。SMAモデルのRNAシーケンシングデータセット37をスクリーニングした結果、初期症状を示す(P5)SMAマウスの肝臓が、3′P tRFを形成する周知の酵素であるアンギオゲニン38,39のレベル上昇を示すことを、我々は観測した。P5 SMAおよび健康な肝臓のDart-RNAseq解析は、500ngのサイズ選別されたスモールRNA(<200ヌクレオチド長)から出発して行われた。全RNA断片のシーケンシングアウトプットのリード長分布は、15~70ヌクレオチドの範囲であり、2つの主要なピークを20および35ヌクレオチド付近に有する(図2)。リードの大部分は、ノンコーディングRNA上にマッピングされ、主にrRNA(対照群で25%、SMA群で23%)およびtRNA(対照群で29%、SMA群で25%)であった(図3)。
【0220】
驚くべきことに、Dart-RNAseqの発現差異解析(SMA対対照)は、P5肝臓における3′P RNAの全体的な減少を、対照と比較して示し(表19-検出されたアップレギュレーションおよびダウンレギュレーションされた3′P RNA断片数)、アンギオゲニンの過剰発現が、これらの試料中の3′P RNA断片の主な原因ではないことを示唆するが、他のヌクレアーゼも関与しているはずである。表で強調される全ての3′P RNA断片は、Dart-RNAseq log2FC>1またはlog2FC<-1、およびDart-RNAseq p値<0.05で、フィルタリングされる。
【0221】
【0222】
より具体的には、我々は50のダウンレギュレーションされた3′P RNA(p値<0.05;Dart-RNAseq log2FC<-1)を見出し、そのうち38はtRNA断片であった。対照的に、アップレギュレーションされたのは、3つの断片だけであった(Dart-RNAseq p値<0.05;Dart-RNAseq log2FC>1)。さらなる調査のため最も頑強なヒットを選択するために、我々は以下に基づくより厳密なフィルタリングステップを適用した:(i)リードカウント(>300)、(ii)Dart-RNAseq倍率変化(log2FC>2またはlog2FC<-2)、(iii)Dart-RNAseq p値<0.05、および(iv)断片の長さ>15ヌクレオチド、(iv)切断パターンの形状。最後のパラメータを測定するために、各断片のリードカウントを、ヌクレオチド位置の関数としてプロットした。全長に沿った1塩基あたりの切断頻度が40%未満であり、かつ5′および3′末端における1塩基あたりの切断頻度が少なくとも60%の断片(図5)だけが考慮された。解析には、15ヌクレオチドより長く、標的上に一意にマッピングされるか、または低いマルチマッピングスコア(≦100マルチマッピングリード-「材料および方法」を参照)を有する断片のみを含めた。我々は、3つのダウンレギュレーションされた断片(全てtRNAバリン(tRFs Val-AAC、tRFs Val-CAC、およびtRFs Val-TAC)に由来する)、および1つのアップレギュレーションされた断片(Gm22973(U2 snRNA偽遺伝子)に由来する)を標的とした。特に、tRFs Valは、アンチコドンループのヌクレオチド37で明確な切断を示す唯一の断片であり(図4)、CCAテールのヌクレオチド75で終了する39ヌクレオチドの断片を生成し、3′tRNAハーフとして規定される33。Gm22973断片は、全長Gm22973トランスクリプトから生じる。興味深いことに、検出された3′P RNA断片は、Smタンパク質結合RNA結合部位にアライメントされている(図6)。Smタンパク質は、snRNAと結合してスプライシングに関与する核内低分子リボヌクレオタンパク質(snRNP)を形成する、一群のタンパク質である。注目すべきは、SMNが、Smタンパク質をリクルートし組み立ててsnRNPにするのに関与し、SMNタンパク質の欠損が、SMAにおいて集合体の変化を引き起こすことである40
【0223】
特定の5′および3′末端を有する3′P RNA断片を正確に定量するために、アダプターライゲーション、環状化、および選択的増幅に基づく専用の3′P-qPCRアッセイを、我々は設計した。アダプターおよび最終的なqPCRステップは、Dart-RNAseqにおいて使用されるものとは異なる特徴を有する(「方法」を参照)。我々は、アダプターと断片との接合部にプライマーを設計し、それは目的の断片の両端で、少なくとも6ヌクレオチドで標的配列にアニーリングする。ダウンレギュレーションされたバリンのアイソデコーダー(3′P tRFs Val-AAC、tRFs Val-CAC、およびtRFs Val-TAC)は、同一の切断パターンを有し、最初の検証として良い候補として選ばれた。我々は、3つの選ばれた候補(3′P tRFs Val-AAC/CAC、3′P tRFs Val-TACから)の各々に対して、アダプター-断片接合部でプライマーを設計した。この過程で、我々は3′P tRFs Val TACを識別することができた。予想通り、両断片の5′および3′末端で最後の10ヌクレオチドが完全に同一であるため、我々は3′P tRFs Val-AACとtRFs Val-CACを識別できなかった。3′P-qPCRの後、我々はSMA肝組織において、対照と比較して3′P tRFs Val-AAC/CACの2倍のダウンレギュレーションを観察し(図7A)、Dart-RNAseqデータと一致した。逆に、3′P tRFs Val-TACでは、有意なダウンレギュレーションは観察されず、特定の断片の評価には標的qPCR手法が必要であることが明らかになった。我々の結果をさらに検証するために、我々はノーザンブロット解析を行った。ゲル中の3′P tRFs Val-AAC/CAC断片バンドは、健康なマウス肝臓と比較して、SMAマウスの肝臓試料において2倍低い強度を示し、3′P-qPCRの結果を確認した(図7B)。総合的に、我々のデータは、3′P tRFs Val AAC/CACが、検討中の生物学的モデルの中で、良い疾患マーカーであることを示唆する。
【0224】
次に我々は、シーケンシングによって同定されたGm22973由来の断片を検証しようとした。このRNAは、SMA肝臓試料においてアップレギュレーションされ、我々のシーケンシングアウトプットに存在しU2トランスクリプト上にマッピングする別の断片と比較して、位置15に1点だけ変異を示すが、その断片は対照とSMA試料との間で有意な変化はない。注目すべきは、U2由来の断片が、偽遺伝子由来の断片と比較して、はるかに豊富であることである(U2断片のカウント:24000;Gm22973断片のカウント:600。いずれもSMA試料における平均カウント)。2種類の断片を識別するために(これらは1ヌクレオチドだけが異なる)、我々は2組のプライマーを設計した。フォワードプライマーは、アダプター-断片接合部に配置され、2つの断片に共通である一方、リバースプライマーは、3′末端で最後のヌクレオチドだけ異なり、それがGm22973由来の断片とU2由来の断片との間のミスマッチの位置にマッピングする。我々は、Gm22973特異的プライマーで4倍の増加を観察したが、U2由来の断片では変化が見られなかった(図8AおよびC)。これは、我々の3′P-qPCR手法が、目的とする特定の3′P RNA断片を検出する際に、1ヌクレオチドの分解能を有することを示す。
【0225】
我々はさらに、SMA試料における豊富な増加が、全長偽遺伝子トランスクリプトの変化を反映するのか、または特定の断片にのみ関連するのかを評価しようとした。そのために我々は、全長Gm22973およびU2トランスクリプトに対して、標準的なqPCRを行った。我々は、Gm22973断片の増加もまた、SMA試料における全長偽遺伝子の高発現を反映する(図8B)が、全長U2トランスクリプトは減少する(図8D)ことを観察した。我々のデータを総合すると、全長Gm22973トランスクリプトおよび派生断片生成物が、潜在的な疾患マーカーであることが示唆された。
【0226】
マウス試料に適用された方法が、ヒト由来のSMA細胞にも使用されうるかをさらに調査するため、我々はDart-RNAseqを、SMA I型患者、SMA II型患者、および健常者から得られたヒト線維芽細胞に適用した。
【0227】
発現差異解析の後、我々は、健常者対SMA1、健常者対SMA2、およびSMA1対SMA2の間で発現差異のある、3′P RNAのリストを同定した(表20)。その中で我々は、マウスのデータと比較して異なる断片配列を有するものの、tRFs Val-AAC/CACを標的として確認した。
【0228】
我々の結果は、本方法の種を超えた頑強さを確認し、SMAのバイオマーカーとしてのtRFs Val-AAC/CACおよび他の3′P RNA(表20に記載)の可能性を強調した。

【0229】
【0230】
最後に我々は、SMN2遺伝子を調節し、SMNタンパク質産生を増加させるよう設計された2つの薬物、リスジプラムおよびヌシネルセンを用いた治療後の、3′P RNAプロファイルの変化を評価した。この解析は、これらの治療が3′P RNA発現をどのように変化させるかを明らかにし、それにより分子効果関する洞察および3′P RNAが治療反応のマーカーとして役立つ可能性を提供することを目的とした。
【0231】
同定された治療反応の3′P RNA分子マーカーは、以下の表21に記載される。
【0232】
【0233】
[皮膚扁平上皮癌における3′P RNA断片]
悪性皮膚病変の潜在的な分子マーカーを同定するために、我々はまず、ヒト皮膚扁平上皮癌細胞株であるHSC-1の4つの複製試料に対して、Dart-RNAseq解析を行い、その結果をケラチノサイトの4つの対照試料から得られたものと比較した。Dart-RNAseqを適用した結果、SMA試料で得られたものと同様のマッピング結果が示された。リードの大部分は、ノンコーディングRNA上にマッピングされ、そのうち25%がtRNAであった(図9)。3′P tRFに基づく主成分分析(PCA)により、cSCCおよびケラチノサイト試料が、明確にクラスター化され(図10)、3′P RNAのこのサブグループが、疾患状態の指標として使用されうることを示唆した。正常試料対腫瘍試料の発現差異解析は、1930ヒットのうち105のtRNA断片が有意にダウンレギュレーションされ、1108のtRNA断片のうち77が有意にアップレギュレーションされたことを示す。興味深いことに、tRFは、コードされるアミノ酸の電荷に従って、アップレギュレーションまたはダウンレギュレーションされ(すなわち、ダウンレギュレーションされた3′P tRFは陰性アミノ酸をコードし、アップレギュレーションされたものは陽性アミノ酸をコードする)、対照細胞と比較してcSCCにおいてコドン使用の選好がある可能性を示唆した。tRFの種類を確認したところ、我々は5′および3′の長いtRFの明確なダウンレギュレーションを観察した一方で、3′Pの短いtRFは、主にアップレギュレーションされた(表22-アップレギュレーションおよびダウンレギュレーションされた合計3′P tRNA断片数(tRF、レーン1)およびtRFサブタイプごとに報告された数(レーン2~レーン6))。表で強調される全ての3′P tRNA断片は、dart-RNAseq log2FC>1またはlog2FC<-1、およびDart-RNAseq p値<0.05で、フィルタリングされる。
【0234】
【0235】
3′P-qPCRを用いたさらなる調査のための最良のヒットは、前述したフィルタリングステップに基づいて選択された:(i)リードカウント(>200)、(ii)Dart-RNAseq倍率変化(log2FC>1またはlog2Fc<-1)、(iii)Dart-RNAseq p値<0.05、および(iv)鋭い切断パターン。最初の検証として、我々は、tRNAグルタミン酸の5′末端(5′_tRFs_Glu_CTC)およびtRNAアスパラギン酸_GTCの3′末端(3′_tRFs_Asp_GTC)由来の3′P tRFに対して、プライマーを設計した。3′P-qPCRアッセイによって我々は、cSCC細胞株における両方のtRFのダウンレギュレーションを、健康なケラチノサイトと比較して確認した(図11)。同定されたcSCCの3′P RNA分子マーカーは、表23に記載される。

【0236】


【0237】
3′P tRFがcSCCインビトロモデルにおいて発現差異があることを確認した後、我々はヒト血漿試料中のそれらの存在を調査した。この目的のために、我々はDart-RNAseqによって、9人の健康なドナーおよび9人のcSCC患者からの血漿試料を解析した。同定された血漿中のcSCCの3′P RNA分子マーカーは、以下の表24に記載される。
【0238】
【0239】
[材料および方法]
[マウス肝組織]
肝組織は、重度SMAの「台湾型」マウスモデルから、初期症状の時(生後5日目-P5)に採取された。表現型が正常な同腹仔(Smn±;SMN2tg/0)が対照として使用された。解剖後、肝組織は急速凍結され、使用まで-80°Cで保存された。
【0240】
[細胞株]
ヒト皮膚の扁平上皮癌の細胞株(HSC-1、アクセッション番号JCRB1015)は、JRB(https://cellbank.nibiohn.go.jp/english/)から購入され、20%ウシ胎児血清を含むダルベッコ改変イーグル培地中の10cmプレート内で培養された。細胞は、0.02%EDTAおよび0.05%トリプシンを用いて3分間;大気95%、二酸化炭素5%(CO2)下で処理した後に、収穫された。細胞を2週間ごとに継代培養する。
【0241】
ヒト表皮ケラチノサイトは、ATCC(カタログ番号 PCS-200-011)から購入された。ヒト表皮ケラチノサイトは、供給者の指示に従って培養された。
【0242】
SMA実験のためのヒト由来線維芽細胞は、Coriell Instituteから購入され(下表25参照)、供給者の指示に従って培養された。線維芽細胞は、ヌシネルセン(Biogen)またはリスジプラム(Sanbio、カタログ番号29028-1)を用いて処理された。ヌシネルセンおよびリスジプラムを用いた処理は、75~80%のコンフルエンシーで行われた。ヌシネルセン処理では、薬剤は最終濃度10nMで使用され、Lipofectamine(商標)LTX ReagentおよびPLUS(商標)Reagentキット(Invitrogen、カタログ番号A12621)を用いて、製造者の推奨に従いトランスフェクトされた。リスジプラム処理では、細胞は最終濃度0.5μMで処理された。処理は24時間ごとに2回繰り返された。
【0243】
【0244】
[ヒト血漿]
患者血漿は、Proteogenex(Proteogenex,Inc. カリフォルニア州、米国)で購入された。全ての血液製品は、認定採血技師(certified phlebotomists)によってIRB承認の下で採取され、血液処理は厳格な標準作業手順(機密文書は要請に応じて入手可能)の下で行われる。以下に、健康なドナーおよびSCC患者のリストを示す。

【0245】
【0246】
[RNA抽出]
全RNAおよびスモールRNA濃縮は、MirVana Kit(ThermoFisher カタログ番号AM1561)によって、製造業者の指示に従って行われた。簡単に言えば、マウス肝組織は、乳鉢とすり棒を使用して液体窒素下で粉砕された。粉末はその後、1.5mLチューブ中に移され、そこで細胞は、MirVana溶解緩衝液およびmiRNA添加剤を加えることにより破壊され、その後カラム精製した。細胞株は、MirVana Kitの仕様に従って溶解され処理された。RNA精製後、全RNAは、Nanodropにより定量され、スモールRNA分画は、QuBit miRNAアッセイ(ThermoFisher カタログ番号Q32880)により定量された。RNAの完全性は、Total RNAナノチップ(Agilent カタログ番号5067-1511)により確認された。
【0247】
[Dart-RNAseq解析]
[5′リン酸化およびアダプターライゲーション]
スモールRNA分画が、ライブラリ調製のためのインプットとして使用された。具体的には、500ngのスモールRNAが、T4 PNK 3′マイナス(NEB、カタログ番号M0236S)用いて、製造者の指示に従って、5′リン酸化を受けた。スモールRNAは、RNA Clean & Concentrator(商標)-5カラム(Zymo Research、カタログ番号R1013)を使用して精製され、RtcB(NEB カタログ番号M0458S)を介して以下の条件に従って、RNAアダプターにライゲートされた:500ngのスモールRNA、0.7pmolのアダプター、15pmolのRtcB、1×RtcB緩衝液(50mM Tris-HCl、75mM KCl、10mM DTT)、150μM GTP、1.8mM mM MnCl、最終体積10μL。反応は37℃で1時間インキュベートされ、その後RNA Clean & Concentrator(商標)-5カラムによって精製された。RNAベースのアダプター(表24に記載されるRNAベースのアダプター)には、以下を含む:(i)Illuminaシーケンシングに必要な、SP1配列の一部、(ii)ユニーク分子識別子(UMI)として使用される、8つの縮退ヌクレオチド、(iii)RT酵素の停止および一本鎖cDNAの生成を可能にする、3つの脱塩基部位、および(iv)リボヌクレアーゼ分解を防ぐ、末端フルオロウリジン。
【0248】
[環状化]
アダプターがライゲートされたRNA(RNA:アダプター)の環状化は、25℃で2時間、10UのT4 RNAリガーゼ1(NEB、カタログ番号M0204L)、1×T4 RNAリガーゼ緩衝液(50mM Tris-HCl、1mM MgCl、1mM DTT)、20%PEG8000、50μM ATPを包含する総体積20μl中で、行われた。環状RNAは、RNA Clean & Concentrator(商標)-5カラム(Zymo research、カタログ番号R1013)を使用することにより精製された。
【0249】
[RTおよびPCR増幅]
一本鎖cDNAの生成のために、環状RNAは、Superscript III酵素(Thermo Fisher カタログ番号18080093)を使用して、以下の条件に従って逆転写を受けた:200uM dNTP混合物、10uM RTプライマー(表25に記載)、1×RT緩衝液、5mM DTT。RTプライマーには、Illuminaシーケンシングに必要な全長SP2配列、およびUMIのための4つの縮退ヌクレオチドを含む。混合物は、環状RNA変性を可能にするために70℃で5分間インキュベートされ、その後氷上で2分間、50℃で40分間、およびRT酵素を熱失活させるために80℃で5分間加熱した。直鎖一本鎖cDNAの形成後、RT反応混合物は、2ステップのPCRによって増幅された。第1のPCR増幅では、cDNA増幅およびフォワードプライマーによる全長SP1配列の導入が行われた。第2のPCR増幅ステップは、Illuminaシーケンシングに必要な、ユニークデュアルインデックス(UDI)アダプターの統合のために必要である。
【0250】
簡単に言えば、第1のPCRステップは、以下の条件に従って行われた:20uLのRT反応、0.8uM SP1フォワードプライマーおよび0.8 SP2リバースプライマー、1×Phusion高忠実度マスターミックス(Thermo Fisher、カタログ番号F531S)、最終体積100uL。PCR混合物は、サーマルサイクラー内の0.2チューブ中で、以下のように増幅された:98℃で1分間、その後98℃で30秒間、61℃で30秒間、72℃で10秒間を8サイクル。反応はその後、1.6倍量のAgencourt AMPure XPビーズ(Agencourt、カタログ番号A63882)によって、製造者の指示に従って精製された。
【0251】
精製されたDNAが、第2のPCRステップのために使用された:40uLのPCR1、1.5uM UDIアダプター(Eurofins、セット番号48/1)、1×Phusion高忠実度マスターミックス(Thermo Fisher、カタログ番号F531S)、最終体積100uL。PCR混合物は、サーマルサイクラー内の0.2チューブ中で、以下のように増幅された:98℃で1分間、その後98℃で30秒間、60℃で30秒間、72℃で10秒間を6サイクル。反応はその後、NucleoSpin GelおよびPCR CleanUpキットによって精製された。Dart-RNAseqライブラリ調製に使用された全ての配列は、表24(配列番号173~184)に記載されている。
【0252】
[ライブラリのゲル精製およびシーケンシング]
最終ライブラリは、10%TBEゲル(Thermo Fisher、カタログ番号EC6275BOX)上にロードされ、200Vで1時間泳動され、Sybr(商標)Gold(Invitrogen、カタログ番号S11494)を用いて染色され、Chemidoc(GE Healthcare、ピスカタウェイ(Piscataway)、ニュージャージー州)を使用してスキャンされた。アダプターダイマー汚染を除去するために、200ヌクレオチドでの正しいバンドがゲルから分離され、Buffer II(Immagina Biotechnology srl、カタログ番号#KGE002)中に、室温で一定の回転のもと、砕かれて一晩浸漬された。水溶性ゲル破片は、Millipore ultrafree MCチューブを用いて濾過され、その後イソプロパノール(Sigma、カタログ番号I9516)を用いて、-80℃で2時間または一晩沈殿された。沈殿後、試料は12000g、4℃で30分間、遠心分離された。ペレットは70%エタノールを用いて1回洗浄され、12000g、4℃で5分間遠心分離され、空気乾燥され、12uLのヌクレアーゼフリー水中に再懸濁された。正しい長さを評価するために、サイズ選別された各ライブラリは、Agilent 2100 BioanalyzerによってAgilent High Sensitivity DNA Kitを使用して確認され、一方、P5およびP7プライマーを使用したqPCRは、高精度のライブラリ定量に使用された。最終プールは、Illumina Novaseq上の100サイクルのシングルリードを用いて、シーケンシングされた。
【0253】
[NGSデータ解析]
細胞株またはマウス肝組織から得られたNGSデータは、Cutadaptを用いて、3′末端アダプターを除去することによりトリミングされた。UMIは、UMI-tools extract(Smith, 2017)を使用して抽出された。10ヌクレオチド未満の長さのトリミングされたリードは、破棄された。残ったリードはその後、対応するゲノムにアライメントされた。tRAXパイプライン(Holmes AD et al 2022)を使用して後続の解析に使用される、生成されたBAMファイルは、bioRxiv(生命科学における未発表プレプリントのための、無料オンラインアーカイブおよび配信サービス)上に発表された。発現差異解析は、DEseq2を使用して行われた41
【0254】
発現差異解析からのヒットは、以下のフィルターに従って選択された:
- リードカウント:≧200カウント
- Dart-RNAseq Log2 FC:アップレギュレーションでは≧1、ダウンレギュレーションでは≦-1、対照または未処理試料と比較。
- Dart-RNAseq p値:≦0.05、または試料間での統計的に頑強な閾値を保証する、任意の統計パラメータ。
- 切断パターン:目的の断片は、明確な切断部位を示さねばならず、すなわち、断片長に沿った1塩基あたりの切断頻度が≦40%であり、断片の5′および3′末端における1塩基あたりの切断頻度≧60%である。
- マルチマッピングスコア:
○ (全ての断片に対して):≦100マルチマップの断片のみが、受け入れられる
○ (tRNA断片に対して):≦100マルチマップの断片のみが、受け入れられる。これらのうち、我々はtRFを、以下のようにさらに分類する:
・ トランスクリプト特異的(対応するtRNAトランスクリプト配列に一意にマッピングされるリード);
・ アイソデコーダー特異的(対応するアンチコドンを有するトランスクリプトに一意にマッピングされるリード);
・ アイソタイプ特異的(対応するtRNAアイソタイプのトランスクリプトにのみマッピングされるリード);
・ アミノ特異的でない(複数のtRNAアイソタイプにマッピングされるリード);
・ 具体的には以下のtRFが好ましい:トランスクリプト特異的>アイソデコーダー特異的>アイソタイプ特異的。アミノ特異的でないものは、考慮されない。
【0255】
[3′P-qPCR]
3′P-qPCRは、レトロ転写までのdart-RNAseq解析の全てのステップが共通するが、異なるRNAベースのアダプターを使用する。テストされたスモールRNAインプット材料の最小量は、100ngであった(QuBit miRNAアッセイによって定量)。3′P-qPCRに使用された特異的RNAベースのアダプターおよびRTプライマーは、表27に示される。3′P-qPCR増幅のために、各プライマー対は以下のルールに従って設計された:
- フォワードおよびリバースプライマーは、15~23ヌクレオチドの範囲の長さを有し、3′P RNAの5′および3′末端での特異性を維持するために、アダプターと目的の3′P RNAとの間の接合部に設計されねばならない。
- フォワードおよびリバースプライマーは、配列特異性を与えるために、目的の3′P RNAと少なくとも6ヌクレオチドでアニーリングすべきである。
- 融解温度は58℃~63℃の範囲にすべきであり、各プライマー対のフォワードおよびリバースプライマーの間の差は、最大1.5℃である。
- フォワードおよびリバースプライマーは、最小限の二次構造を有し、ヘテロおよびホモダイマー形成の可能性がないようにすべきである。
【0256】
3′P RNA断片の検証に使用されたプライマーのリストは、表28に記載される。全てのqPCR増幅は、SYBR(商標)Green PCR Master Mix(Thermo Fisher、カタログ番号4309155)によって行われた。各3′P RNAのCt値は、RNAベースのアダプターの総量を使用して正規化される。正規化のためのプライマーは、表28に記載される。

【0257】
【0258】

【0259】
[参考文献一覧]
1. Slamon, D. J. et al. Use of chemotherapy plus a monoclonal antibody against HER2 for metastatic breast cancer that overexpresses HER2. N Engl J Med 344, 783-92 (2001).
2. Goossens, N., Nakagawa, S., Sun, X. & Hoshida, Y. Cancer biomarker discovery and validation. Transl Cancer Res 4, 256-269 (2015).
3. Sparano, J. A. et al. Adjuvant Chemotherapy Guided by a 21-Gene Expression Assay in Breast Cancer. New England Journal of Medicine 379, 111-121 (2018).
4. Wang, K. et al. Circular RNA mediates cardiomyocyte death via miRNA- dependent upregulation of MTP18 expression. Cell Death Differ 24, 1111-1120 (2017).
5. Honda, S. et al. Sex hormone-dependent tRNA halves enhance cell proliferation in breast and prostate cancers. Proceedings of the National Academy of Sciences 112, E3816-E3825 (2015).
6. Tang, J. et al. A novel biomarker Linc00974 interacting with KRT19 promotes proliferation and metastasis in hepatocellular carcinoma. Cell Death Dis 5, e1549-e1549 (2014).
7. Pardini, B., Sabo, A. A., Birolo, G. & Calin, G. A. Noncoding RNAs in Extracellular Fluids as Cancer Biomarkers: The New Frontier of Liquid Biopsies. Cancers (Basel) 11, 1170 (2019).
8. Paik, S. et al. Gene Expression and Benefit of Chemotherapy in Women With Node-Negative, Estrogen Receptor-Positive Breast Cancer. Journal of Clinical Oncology 24, 3726-3734 (2006).
9. Roundtree, I. A., Evans, M. E., Pan, T. & He, C. Dynamic RNA Modifications in Gene Expression Regulation. Cell 169, 1187-1200 (2017).
10. Frye, M., Harada, B. T., Behm, M. & He, C. RNA modifications modulate gene expression during development. Science (1979) 361, 1346-1349 (2018).
11. Meyer, K. D. & Jaffrey, S. R. Rethinking m 6 A Readers, Writers, and Erasers. Annu Rev Cell Dev Biol 33, 319-342 (2017).
12. Zhou, J. et al. Dynamic m6A mRNA methylation directs translational control of heat shock response. Nature 526, 591-594 (2015).
13. Shigematsu, M., Morichika, K., Kawamura, T., Honda, S. & Kirino, Y. Genome-wide identification of short 2′,3′-cyclic phosphate-containing RNAs and their regulation in aging. PLoS Genet 15, e1008469 (2019).
14. Shigematsu, M., Kawamura, T. & Kirino, Y. Generation of 2′,3′-Cyclic Phosphate-Containing RNAs as a Hidden Layer of the Transcriptome. Front Genet 9, (2018).
15. Sidrauski, C. & Walter, P. The Transmembrane Kinase Ire1p Is a Site-Specific Endonuclease That Initiates mRNA Splicing in the Unfolded Protein Response. Cell 90, 1031-1039 (1997).
16. Trotta, C. R. et al. The Yeast tRNA Splicing Endonuclease: A Tetrameric Enzyme with Two Active Site Subunits Homologous to the Archaeal tRNA Endonucleases. Cell 89, 849-858 (1997).
17. Zhu, L. et al. Exosomal tRNA-derived small RNA as a promising biomarker for cancer diagnosis. Mol Cancer 18, 74 (2019).
18. Maute, R. L. et al. tRNA-derived microRNA modulates proliferation and the DNA damage response and is down-regulated in B cell lymphoma. Proceedings of the National Academy of Sciences 110, 1404-1409 (2013).
19. Goodarzi, H. et al. Endogenous tRNA-Derived Fragments Suppress Breast Cancer Progression via YBX1 Displacement. Cell 161, 790-802 (2015).
20. Hogg, M. C. et al. 5′ValCAC tRNA fragment generated as part of a protective angiogenin response provides prognostic value in amyotrophic lateral sclerosis. Brain Commun 2, (2020).
21. Guzzi, N. et al. Pseudouridine-modified tRNA fragments repress aberrant protein synthesis and predict leukaemic progression in myelodysplastic syndrome. Nat Cell Biol 24, 299-306 (2022).
22. Schimmel, P. The emerging complexity of the tRNA world: mammalian tRNAs beyond protein synthesis. Nat Rev Mol Cell Biol 19, 45-58 (2018).
23. Yu, M. et al. tRNA-derived RNA fragments in cancer: current status and future perspectives. J Hematol Oncol 13, 121 (2020).
24. Wang, Q. et al. Identification and Functional Characterization of tRNA-derived RNA Fragments (tRFs) in Respiratory Syncytial Virus Infection. Molecular Therapy 21, 368-379 (2013).
25. Ivanov, P. et al. G-quadruplex structures contribute to the neuroprotective effects of angiogenin-induced tRNA fragments. Proceedings of the National Academy of Sciences 111, 18201-18206 (2014).
26. Boulter, N. et al. A simple, accurate and universal method for quantification of PCR. BMC Biotechnol 16, 27 (2016).
27. Pfaffl, M. W. Relative expression software tool (REST(C)) for group-wise comparison and statistical analysis of relative expression results in real-time PCR. Nucleic Acids Res 30, 36e-336 (2002).
28. Xi, X. et al. RNA Biomarkers: Frontier of Precision Medicine for Cancer. Noncoding RNA 3, 9 (2017).
29. Mercuri, E., Sumner, C. J., Muntoni, F., Darras, B. T. & Finkel, R. S. Spinal muscular atrophy. Nat Rev Dis Primers 8, 52 (2022).
30. Oberbauer, V. & Schaefer, M. tRNA-Derived Small RNAs: Biogenesis, Modification, Function and Potential Impact on Human Disease Development. Genes (Basel) 9, 607 (2018).
31. Kumar, P., Mudunuri, S. B., Anaya, J. & Dutta, A. tRFdb: a database for transfer RNA fragments. Nucleic Acids Res 43, D141-D145 (2015).
32. Kumar, P., Anaya, J., Mudunuri, S. B. & Dutta, A. Meta-analysis of tRNA derived RNA fragments reveals that they are evolutionarily conserved and associate with AGO proteins to recognize specific RNA targets. BMC Biol 12, 78 (2014).
33. Shen, Y. et al. Transfer RNA-derived fragments and tRNA halves: biogenesis, biological functions and their roles in diseases. J Mol Med 96, 1167-1176 (2018).
34. Fania, L. et al. Cutaneous Squamous Cell Carcinoma: From Pathophysiology to Novel Therapeutic Approaches. Biomedicines 9, 171 (2021).
35. Del Piano, A. et al. Phospho-RNA sequencing with circAID-p-seq. Nucleic Acids Res 50, e23-e23 (2022).
36. Clamer, M. et al. Active Ribosome Profiling with RiboLace. Cell Rep 25, 1097-1108.e5 (2018).
37. Doktor, T. K. et al. RNA-sequencing of a mouse-model of spinal muscular atrophy reveals tissue-wide changes in splicing of U12-dependent introns. Nucleic Acids Res 45, 395-416 (2017).
38. Ivanov, P., Emara, M. M., Villen, J., Gygi, S. P. & Anderson, P. Angiogenin- Induced tRNA Fragments Inhibit Translation Initiation. Mol Cell 43, 613-623 (2011).
39. Saikia, M. et al. Angiogenin-Cleaved tRNA Halves Interact with Cytochrome c, Protecting Cells from Apoptosis during Osmotic Stress. Mol Cell Biol 34, 2450-2463 (2014).
40. Singh, R. N., Howell, M. D., Ottesen, E. W. & Singh, N. N. Diverse role of survival motor neuron protein. Biochimica et Biophysica Acta (BBA) - Gene Regulatory Mechanisms 1860, 299-315 (2017).
41. Love, M. I., Huber, W. & Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol 15, 550 (2014).
図1
図2
図3
図4
図5
図6
図7A
図7B
図8A
図8B
図8C
図8D
図9
図10
図11
図12A
図12B
図13
【配列表】
2025028816000001.xml
【外国語明細書】