IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

2024-541478人工表面を用いたRNAおよびDNA解析
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-08
(54)【発明の名称】人工表面を用いたRNAおよびDNA解析
(51)【国際特許分類】
   C12Q 1/6876 20180101AFI20241031BHJP
   C12N 15/11 20060101ALI20241031BHJP
   C12Q 1/6869 20180101ALI20241031BHJP
   C07K 16/00 20060101ALI20241031BHJP
   C12N 15/115 20100101ALI20241031BHJP
   C07K 14/46 20060101ALI20241031BHJP
   C12N 9/16 20060101ALI20241031BHJP
   C12N 9/10 20060101ALI20241031BHJP
   C12N 9/24 20060101ALI20241031BHJP
   C12N 9/02 20060101ALI20241031BHJP
   C12N 9/12 20060101ALI20241031BHJP
   C12N 11/08 20200101ALI20241031BHJP
   C12N 11/14 20060101ALI20241031BHJP
【FI】
C12Q1/6876 Z
C12N15/11 Z ZNA
C12Q1/6869 Z
C07K16/00
C12N15/115 Z
C07K14/46
C12N9/16 Z
C12N9/10
C12N9/24
C12N9/02
C12N9/12
C12N11/08
C12N11/14
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024531038
(86)(22)【出願日】2022-11-23
(85)【翻訳文提出日】2024-07-18
(86)【国際出願番号】 US2022080452
(87)【国際公開番号】W WO2023097295
(87)【国際公開日】2023-06-01
(31)【優先権主張番号】63/282,808
(32)【優先日】2021-11-24
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/388,036
(32)【優先日】2022-07-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】523194477
【氏名又は名称】アリダ・バイオサイエンシーズ・インコーポレイテッド
【氏名又は名称原語表記】Alida Biosciences, Inc.
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100138911
【弁理士】
【氏名又は名称】櫻井 陽子
(72)【発明者】
【氏名】シュテンゲル,グドルン
(72)【発明者】
【氏名】ユー,ホア
(72)【発明者】
【氏名】プライス,アンドリュー
(72)【発明者】
【氏名】サントス,ジェローム
(72)【発明者】
【氏名】ファン-フー,ユー-シエン
(72)【発明者】
【氏名】パース,バイロン
【テーマコード(参考)】
4B033
4B063
4H045
【Fターム(参考)】
4B033NA25
4B033NC04
4B033ND05
4B063QA13
4B063QQ53
4B063QR36
4B063QR62
4B063QS15
4B063QS25
4B063QS36
4B063QS39
4B063QX02
4H045AA10
4H045AA20
4H045AA30
4H045BA54
4H045BA60
4H045BA62
4H045DA89
4H045EA50
4H045FA50
4H045FA74
(57)【要約】
本発明は、トランスクリプトームおよびゲノムにわたるRNA修飾およびDNA修飾の多重プロファイリングのための組成物および方法を提供する。この方法は、標的核酸の非カノニカルな特徴(例えば、塩基修飾、骨格修飾、病変、および/または構造的エレメント)の分子認識と、この認識イベントからの情報をバーコードを用いて標的核酸の隣接遺伝子配列内に書き込む工程とを組み合わせている。バーコード化された核酸は、配列決定ライブラリーに変換され、DNA/RNA配列決定法で読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非カノニカルな特徴と相関する。本明細書に記載の高速プロファイリング法は、標的核酸における1以上の修飾の同定および/または局在化を可能にする。また、この方法では、複数またはすべてのDNA/RNA修飾の性質および位置を並行して同定できる。
【特許請求の範囲】
【請求項1】
i)基質、
ii)第1のリンカーを介して該基質に結合する結合ドメイン、および
iii)第2のリンカーを介して該基質に結合するアダプター、
を含む組成物であって、ここで、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、前記アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物。
【請求項2】
基質が、ビーズ、チップ、プレート、スライド、ディッシュ、ゲルまたは3次元ポリマーマトリックスである、請求項1に記載の組成物。
【請求項3】
結合ドメインが、抗体、scFv、Fabフラグメント、抗体の軽鎖(VL)、抗体の重鎖(VH)、可変フラグメント(Fv)、F(ab’)2フラグメント、ダイアボディ、VHHドメイン、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、エンドヌクレアーゼV、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、請求項1または2に記載の組成物。
【請求項4】
結合ドメインが、ライタータンパク質またはイレイサータンパク質の触媒的に不活性な変異体を含む、請求項1または2に記載の組成物。
【請求項5】
リーダータンパク質が、NUDT16、ALYREFまたはYTHドメインタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項3に記載の組成物。
【請求項6】
ライタータンパク質が、DNMTタンパク質、NAT10タンパク質、METTLタンパク質、TRMタンパク質、BMTタンパク質、DUSタンパク質、PUSタンパク質、ADARタンパク質、またはNSUNタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項3に記載の組成物。
【請求項7】
イレイサータンパク質が、FTOタンパク質、ALKBHタンパク質、またはTETタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項3に記載の組成物。
【請求項8】
第1のリンカーまたは第2のリンカーが切断可能である、請求項1から7のいずれか一項に記載の組成物。
【請求項9】
アダプターが切断可能である、請求項1から7のいずれか一項に記載の組成物。
【請求項10】
非カノニカルな特徴が修飾ヌクレオシドである、請求項1から9のいずれか一項に記載の組成物。
【請求項11】
修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、7-メチルグアノシン(m7G)-Cap、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン(4mdC)、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-カルボキシシチジン(5caC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、リボースメチル化(Nm)、N2,N2-ジメチルグアノシン(m G)、5-カルバモイルメチル-2’-O-メチルウリジン(ncm5Um)、5-メトキシカルボニルメチルウリジン(ncm5mU)、5-メトキシカルボニルメチル-2-チオウリジン(mcm5s2U)、ケウオシン(Q)、2-チオウリジン(s2U)、5-タウリノメチルウリジン(τm5U)、5-タウリノメチル-2-チオウリジン(τm5s2U)、N6-イソペンテニルアデノシン(I6A)、2-メチルチオ-N6-トレオニルカルバモイルアデノシン(ms2t6A)である、請求項10に記載の組成物。
【請求項12】
非カノニカルな特徴が核酸損傷である、請求項1から9のいずれか一項に記載の組成物。
【請求項13】
核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項12に記載の組成物。
【請求項14】
核酸損傷が、外因性薬剤による嵩高い付加体形成または塩基アルキル化に起因する、請求項12に記載の組成物。
【請求項15】
損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項12に記載の組成物。
【請求項16】
非カノニカルな特徴が構造的要素である、請求項1から9のいずれか一項に記載の組成物。
【請求項17】
構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、I-モチーフ、バルジ、スリーウェイジャンクション、十字型構造、テトラループ、リボースジッパー、またはシュードノットである、請求項16に記載の組成物。
【請求項18】
アダプターがユニバーサルフォワードプライマー(UFP)およびユニバーサルリバースプライマー(URP)の少なくとも1つを含む、請求項1から17のいずれか一項に記載の組成物。
【請求項19】
アダプターが固有の分子バーコード(UMI)を含む、請求項1から18のいずれか一項に記載の組成物。
【請求項20】
アダプターが1以上の非天然核酸塩基を含む、請求項1から19のいずれか一項に記載の組成物。
【請求項21】
アダプターが3’末端に2個以上のランダム塩基を含む、請求項1から20のいずれか一項に記載の組成物。
【請求項22】
1以上の非天然核酸塩基が、Gクランプ(9-(2-アミノエトキシ)-3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、tC(3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、tC(3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、イノシン、スーパーT(5-ヒドロキシブチニル-2’-デオキシウリジン)、スーパーG(8-アザ-7-デアザグアノシン)、ウラシル、または8-オキソ-Gから独立して選択される、請求項20に記載の組成物。
【請求項23】
アダプターが、ロック核酸(LNA)、ペプチド核酸(PNA)、グリコール核酸(GNA)、ホスホロチオエート、2’-フルオロリボース、2’-メトキシリボース、ホスホロジチオエート、メチルホスホネート、ホスホロアミデート、グアニジノプロピルホスホロアミデート、トリアゾール、グアニジニウム、モルホリノ、スレオース核酸(TNA)またはヘキシトール核酸(HNA)から選択される1以上の骨格修飾を含む、請求項2から22のいずれか一項に記載の組成物。
【請求項24】
アダプターが1以上の3’または5’ブロッキング基を含む、請求項1から21のいずれか一項に記載の組成物。
【請求項25】
1以上の3’または5’ブロッキング基が、ジデオキシリボース、ホスフェート、逆塩基またはリンカーから独立して選択される、請求項24に記載の組成物。
【請求項26】
結合ドメインが少なくとも1つの修飾ヌクレオシドと接触している、請求項1から25のいずれか一項に記載の組成物。
【請求項27】
結合ドメインが修飾ヌクレオチドおよびそれに隣接する1以上のヌクレオチドと接触している、請求項1から25のいずれか一項に記載の組成物。
【請求項28】
結合ドメインおよびアダプターが、アダプターまたはアダプター配列のコピーの標的核酸への移行を可能にするように、基質上で空間的に離れて配置されている、請求項1から27のいずれか一項に組成物。
【請求項29】
結合ドメインがアダプターから200nm未満の距離で基質に結合している、請求項28に記載の組成物。
【請求項30】
組成物が、結合ドメインに結合した塩基編集酵素をさらに含む、請求項1から29のいずれか一項に記載の組成物。
【請求項31】
塩基編集酵素が結合ドメインに共有結合している、請求項30に記載の組成物。
【請求項32】
塩基編集酵素が、ペプチドタグ、タンパク質タグ、二次抗体、核酸配列、または生体直交型反応基から選択される標的化部分を介して結合ドメインに結合されている、請求項30に記載の組成物。
【請求項33】
塩基編集酵素が、アデノシンデアミナーゼ、シトシンデアミナーゼ、グリコシラーゼ、メチラーゼ、デメチラーゼ、またはジオキシゲナーゼである、請求項30から32のいずれか一項に記載の組成物。
【請求項34】
請求項1から31のいずれか一項に記載の組成物および結合ドメインに非共有結合または共有結合した標的核酸を含む、複合体。
【請求項35】
複数の標的核酸を分析する方法であって、
(i)複数の標的核酸を含む溶液を、請求項1から33のいずれか一項に記載の組成物と接触させること、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する;
(ii)以下のうち1つを実行すること:
(a)核酸バーコードを非カノニカルな特徴を含む標的核酸にトランスファーさせて、バーコード化標的核酸を生成すること、または
(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;
(iii)バーコード化標的核酸を増幅させること;および
(iv)バーコード化標的核酸の配列を決定すること
を含み、ここで、工程(i)および(ii)は順次または同時に行われる、
方法。
【請求項36】
核酸バーコードが、転移酵素によって標的核酸にトランスファーされる、請求項35に記載の方法。
【請求項37】
核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、逆転写、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、請求項35に記載の方法。
【請求項38】
工程(i)の前に、標的核酸の3’末端もしくは5’末端または両末端にユニバーサル核酸配列をライゲーションすることをさらに含む、請求項35から37のいずれか一項に記載の方法。
【請求項39】
工程(i)の前に、標的核酸の3’末端を複数の単一型のヌクレオチドで酵素的にテーリングすることをさらに含む、請求項35から38のいずれか一項に記載の方法。
【請求項40】
酵素的テーリングがポリ(A)ポリメラーゼまたはポリ(U)ポリメラーゼを用いて行われる、請求項39に記載の方法。
【請求項41】
アダプターの3’末端が標的核酸の3’末端に結合し、工程(ii)が修飾特異的バーコードを導入することをさらに含み、ここで、アダプターの3’末端が逆転写酵素またはDNAポリメラーゼによって伸長されるか、またはアダプターが3’スペーサー配列を含み、かつ標的核酸によって示される合成スペーサー配列に部位特異的に結合し、かつアダプターの3’末端および標的核酸の3’末端の一方または両方が逆転写酵素またはDNAポリメラーゼによって伸長される、請求項35から40のいずれか一項に記載の方法。
【請求項42】
3’縮重塩基を有するアダプターが標的核酸をランダムにプライミングし、工程(ii)が修飾特異的バーコードを導入することをさらに含み、ここで、アダプターの3’末端が逆転写酵素またはDNAポリメラーゼによって伸長される、請求項35から41のいずれか一項に記載の方法。
【請求項43】
核酸バーコードが化学的ライゲーションによって標的核酸にトランスファーされる、請求項35に記載の方法。
【請求項44】
バーコード化標的核酸が、その5’末端を介して基質上に固定化されている、請求項35から43のいずれか一項に記載の方法。
【請求項45】
バーコード化標的核酸が、その3’末端を介して基質上に固定化されている、請求項35から43のいずれか一項に記載の方法。
【請求項46】
増幅工程(iii)が基質の表面上で行われる、請求項35から45のいずれか一項に記載の方法。
【請求項47】
工程(iii)において、標的核酸の同一コピーのクラスターを形成することをさらに含む、請求項35から46のいずれか一項に記載の方法。
【請求項48】
工程(iv)において、基質上の標的核酸の同一コピーのクラスターをインサイチュウで配列決定することをさらに含む、請求項46に記載の方法。
【請求項49】
非カノニカルな特徴の位置がバーコード化標的核酸またはそのコピーの一次核酸配列に基づいて同定可能なように、バーコード化標的核酸またはそのコピーを修飾することをさらに含む、請求項35から48のいずれか一項に記載の方法。
【請求項50】
修飾工程が、請求項30から33に記載の組成物のいずれか1つを用いて、結合ドメインが標的核酸に結合している結合部位の1~20塩基内の塩基を編集することを含む、請求項49に記載の方法。
【請求項51】
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)第2の認識エレメントに結合するアダプター、および
iv)結合ドメイン
を含み、ここで、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成されており、かつ前記結合ドメインは第2の認識エレメントによって固定化されており、前記アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物。
【請求項52】
組成物が複数の第2の認識エレメントを含み、ここで、前記複数の第2の認識エレメントが互いに異なる第2の認識エレメントを含み、前記アダプターが該複数の第2の認識エレメントの1つに結合され、かつ前記結合ドメインが異なる第2の認識エレメントに結合されている、請求項51に記載の組成物。
【請求項53】
組成物が複数の第2の認識エレメントを含み、ここで、前記アダプターが複数の第2の認識エレメントの1つに結合され、かつ前記結合ドメインが同じ第2の認識エレメントの別の部分(instance)に結合される、請求項51に記載の組成物。
【請求項54】
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)第2の認識エレメントを介して基質に結合する結合ドメイン、
iv)リンカーを介して基質に結合するアダプター、
を含み、ここで、前記結合ドメインは、DNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成されており、前記アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物。
【請求項55】
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)リンカーを介して基質に結合する結合ドメイン、
iv)第2の認識エレメントを介して基質に結合するアダプター、
を含み、ここで、前記結合ドメインは、DNAまたはRNAの非共有的特徴に特異的に結合するように構成されており、前記アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物。
【請求項56】
基質がビーズ、チップ、プレート、スライド、ディッシュ、ゲルまたは3次元ポリマーマトリックスである、請求項51から55のいずれか一項に記載の組成物。
【請求項57】
第2の認識エレメントが、プロテインG、プロテインL、プロテインA、プロテインAG、プロテインAL、プロテインLGまたは抗体である、請求項51から56のいずれか一項に記載の組成物。
【請求項58】
第2の認識エレメントが、ペプチドタグ、共有結合ペプチドタグ、タンパク質タグ、または核酸である、請求項51から56のいずれか一項に記載の組成物。
【請求項59】
第2の認識エレメントが、ストレプトアビジン、アビジンまたはニュートラビジンである、請求項51から56のいずれか一項に記載の組成物。
【請求項60】
アダプターが、非カノニカルな特徴への結合ドメインの結合を妨げないアミノ酸部位で、第2の認識エレメントに結合している、請求項51から53、および55のいずれか一項に記載の組成物。
【請求項61】
複数のアダプターが第2の認識エレメントに結合されている、請求項51から60のいずれか一項に記載の組成物。
【請求項62】
結合ドメインが、抗体、scFv、Fabフラグメント、抗体の軽鎖(VL)、抗体の重鎖(VH)、可変フラグメント(Fv)、F(ab’)2フラグメント、ダイアボディ、VHHドメイン、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、エンドヌクレアーゼV、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、請求項51から61のいずれか一項に記載の組成物。
【請求項63】
結合ドメインが、ライタータンパク質またはイレイサータンパク質の触媒的に不活性な変異体を含む、請求項51から61のいずれか一項に記載の組成物。
【請求項64】
リーダータンパク質が、NUDT16、ALYREFまたはYTHドメインタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項62に記載の組成物。
【請求項65】
リンカーが切断可能である、請求項54から55のいずれか一項に記載の組成物。
【請求項66】
アダプターが切断可能である、請求項51から65のいずれか一項に記載の組成物。
【請求項67】
ライタータンパク質が、DNMTタンパク質、NAT10タンパク質、METTLタンパク質、TRMタンパク質、BMTタンパク質、DUSタンパク質、PUSタンパク質、ADARタンパク質、またはNSUNタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項62に記載の組成物。
【請求項68】
イレイサータンパク質が、FTOタンパク質、ALKBHタンパク質、またはTETタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項62に記載の組成物。
【請求項69】
非カノニカルな特徴が修飾ヌクレオシドである、請求項51から68のいずれか一項に記載の組成物。
【請求項70】
修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、7-メチルグアノシン(m7G)-Cap、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン(4mdC)、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-カルボキシシチジン(5caC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、リボースメチル化(Nm)、N2,N2-ジメチルグアノシン(m G)、5-カルバモイルメチル-2’-O-メチルウリジン(ncm5Um)、5-メトキシカルボニルメチルウリジン(ncm5mU)、5-メトキシカルボニルメチル-2-チオウリジン(mcm5s2U)、ケウオシン(Q)、2-チオウリジン(s2U)、5-タウリノメチルウリジン(τm5U)、5-タウリノメチル-2-チオウリジン(τm5s2U)、N6-イソペンテニルアデノシン(I6A)、2-メチルチオ-N6-トレオニルカルバモイルアデノシン(ms2t6A)である、請求項69に記載の組成物。
【請求項71】
非カノニカルな特徴が核酸損傷である、請求項51から68のいずれか一項に記載の組成物。
【請求項72】
核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項71に記載の組成物。
【請求項73】
核酸損傷が、外因性薬剤による嵩高い付加体形成または塩基アルキル化に起因する、請求項71に記載の組成物。
【請求項74】
損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項71に記載の組成物。
【請求項75】
非カノニカルな特徴が構造的要素である、請求項51から68のいずれか一項に記載の組成物。
【請求項76】
構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、I-モチーフ、バルジ、スリーウェイジャンクション、十字型構造、テトラループ、リボースジッパー、またはシュードノットである、請求項70に記載の組成物。
【請求項77】
アダプターがユニバーサルフォワードプライマー(UFP)およびユニバーサルリバースプライマー(URP)の少なくとも1つを含む、請求項51から76のいずれか一項に記載の組成物。
【請求項78】
アダプターが分子バーコード(UMI)を含む、請求項51から77のいずれか一項に記載の組成物。
【請求項79】
アダプターが1以上の非天然核酸塩基を含む、請求項51から78のいずれか一項に記載の組成物。
【請求項80】
アダプターが3’末端に2個以上のランダム塩基を含む、請求項51から79のいずれか一項に記載の組成物。
【請求項81】
1以上の非天然核酸塩基が、Gクランプ、tC、tC、イノシン、スーパーT(5-ヒドロキシブチニル-2’-デオキシウリジン)、スーパーG(8-アザ-7-デアザグアノシン)、ウラシル、または8-オキソ-Gから独立して選択される、請求項79に記載の組成物。
【請求項82】
アダプターがロック核酸(LNA)、ペプチド核酸(PNA)、グリコール核酸(GNA)、ホスホロチオエート、2’-フルオロリボース、2’-メトキシリボース、ホスホロジチオエート、メチルホスホネート、ホスホロアミデート、グアニジノプロピルホスホロアミデート、トリアゾール、グアニジニウム、モルホリノ、スレオース核酸(TNA)またはヘキシトール核酸(HNA)から選択される1以上の骨格修飾を含む、請求項51から81のいずれか一項に記載の組成物。
【請求項83】
アダプターが1以上の3’または5’ブロッキング基を含む、請求項51から82のいずれか一項に記載の組成物。
【請求項84】
1以上の3’または5’ブロッキング基が、ジデオキシリボース、ホスフェート、逆塩基またはリンカーから独立して選択される、請求項83に記載の組成物。
【請求項85】
結合ドメインが少なくとも1つの修飾ヌクレオシドと接触している、請求項51から84のいずれか一項に記載の組成物。
【請求項86】
結合ドメインが修飾ヌクレオチドおよびそれに隣接する1以上のヌクレオチドと接触している、請求項51から85のいずれか一項に記載の組成物。
【請求項87】
結合ドメインおよびアダプターが、アダプターまたはアダプター配列のコピーの標的核酸へのトランスファーを可能にするように、基質上で空間的に離れて配置されている、請求項51から86のいずれか一項に記載の組成物。
【請求項88】
結合ドメインがアダプターから200nm未満の距離で基質に結合している、請求項87に記載の組成物。
【請求項89】
組成物が、結合ドメインに結合した塩基編集酵素をさらに含む、請求項51から88のいずれか一項に記載の組成物。
【請求項90】
塩基編集酵素が結合ドメインに共有結合している、請求項89に記載の組成物。
【請求項91】
塩基編集酵素が、ペプチドタグ、タンパク質タグ、二次抗体、核酸配列、または生体直交型反応基から選択される標的部分を介して結合ドメインに結合される、請求項89に記載の組成物。
【請求項92】
塩基編集酵素が、アデノシンデアミナーゼ、シトシンデアミナーゼ、グリコシラーゼ、メチラーゼ、デメチラーゼ、またはジオキシゲナーゼである、請求項89から91のいずれか一項に記載の組成物。
【請求項93】
請求項51から92のいずれか一項に記載の組成物および結合ドメインに非共有結合または共有結合した標的核酸を含む、複合体。
【請求項94】
複数の標的核酸を分析する方法であって、
(i)複数の標的核酸を含む溶液を、請求項51から92のいずれか一項に記載の組成物と接触させること、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する;
(ii)以下のうち1つを実行すること:
(a)核酸バーコードを非カノニカルな特徴を含む標的核酸にトランスファーして、バーコード化標的核酸を生成すること、または
(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;
(iii)バーコード化標的核酸を増幅させること;および
(iv)バーコード化標的核酸の配列を決定すること
を含み、ここで、工程(i)および(ii)は順次または同時に行われる、
方法。
【請求項95】
核酸バーコードが、酵素的または化学的トランスファーによって標的核酸にトランスファーされる、請求項94に記載の方法。
【請求項96】
核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、逆転写、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、請求項94に記載の方法。
【請求項97】
工程(i)の前に、標的核酸の3’末端もしくは5’末端または両末端にユニバーサル核酸配列をライゲーションすることをさらに含む、請求項94に記載の方法。
【請求項98】
工程(i)の前に、標的核酸の3’末端を複数の単一型ヌクレオチドで酵素的にテーリングすることをさらに含む、請求項97に記載の方法。
【請求項99】
酵素的テーリングがポリ(A)ポリメラーゼまたはポリ(U)ポリメラーゼを用いて行われる、請求項98に記載の方法。
【請求項100】
アダプターの3’末端が標的核酸の3’末端に結合し、工程(ii)が修飾特異的バーコードを導入することをさらに含み、ここで、アダプターの3’末端が逆転写酵素またはDNAポリメラーゼによって伸長されるか、またはアダプターが3’スペーサー配列を含み、かつ標的核酸によって示される合成スペーサー配列に部位特異的に結合し、かつアダプターの3’末端および標的核酸の3’末端の一方または両方が逆転写酵素またはDNAポリメラーゼによって伸長される、請求項94に記載の方法。
【請求項101】
3’縮重塩基を有するアダプターが標的核酸をランダムにプライミングし、工程(ii)が修飾特異的バーコードを導入することをさらに含み、ここで、アダプターの3’末端が逆転写酵素またはDNAポリメラーゼによって伸長される、請求項94に記載の方法。
【請求項102】
核酸バーコードが化学ライゲーションによって標的核酸にトランスファーされる、請求項94に記載の方法。
【請求項103】
バーコード化標的核酸が、その5’末端を介して基質上に固定化されている、請求項94に記載の方法。
【請求項104】
バーコード化標的核酸が、その3’末端を介して基質上に固定化されている、請求項94に記載の方法。
【請求項105】
該方法が、非カノニカルな特徴の位置がバーコード化標的核酸またはそのコピーの一次核酸配列に基づいて識別可能であるように、バーコード化標的核酸またはそのコピーを改変することを含む、請求項94から104のいずれか一項に記載の方法。
【請求項106】
修飾工程が、結合部位の1~20塩基内の塩基を編集することを含み、ここで、結合ドメインは、請求項51から55に記載の組成物のいずれか1つを用いて標的核酸に結合される、請求項105に記載の方法。
【請求項107】
増幅工程(iii)が基質の表面上で行われる、請求項94から106のいずれか一項に記載の方法。
【請求項108】
工程(iii)において、標的核酸の同一コピーのクラスターを形成することをさらに含む、請求項94から107のいずれか一項に記載の方法。
【請求項109】
工程(iv)において、基質上の標的核酸の同一コピーのクラスターをインサイチュウで配列決定することをさらに含む、請求項108に記載の方法。
【請求項110】
i)基質、
ii)第1のリンカーまたは第2の認識エレメントを介して基質に結合する結合ドメイン、
iii)第2のリンカーまたは第2の認識エレメントを介して基質に結合するモザイク末端(ME)アダプター、および
iv)トランスポザーゼ、
を含む組成物であって、ここで、前記トランスポザーゼは固定化MEアダプターに負荷され、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記MEアダプターの少なくとも1つは、非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物;または
i)基質、
ii)リンカーまたは第2の認識エレメントを介して基質に結合する結合ドメイン、および
iii)結合ドメインと結合したトランスポザーゼ、
を含む組成物であって、ここで、前記トランスポザーゼはMEアダプターに負荷され、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記MEアダプターの少なくとも1つは、非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物。
【請求項111】
トランスポザーゼがTn5トランスポザーゼである、請求項110に記載の組成物。
【請求項112】
トランスポザーゼが、プロテインL、プロテインG、プロテインA、プロテインGA、プロテインAL、またはプロテインGLを介して結合ドメインに結合される、請求項110から111のいずれか一項に記載の組成物。
【請求項113】
トランスポザーゼが、ペプチドタグ、共有結合ペプチドタグ、タンパク質タグ、または核酸を介して結合ドメインに結合される、請求項110から111のいずれか一項に記載の組成物。
【請求項114】
基質が、ビーズ、チップ、プレート、スライド、ディッシュ、ゲルまたは3次元ポリマーマトリックスである、請求項110から113のいずれか一項に記載の組成物。
【請求項115】
結合ドメインが、抗体、scFv、Fabフラグメント、抗体の軽鎖(VL)、抗体の重鎖(VH)、可変フラグメント(Fv)、F(ab’)2フラグメント、ダイアボディ、VHHドメイン、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、エンドヌクレアーゼV、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、請求項110から114のいずれか一項に記載の組成物。
【請求項116】
結合ドメインが、ライタータンパク質またはイレイサータンパク質の触媒的に不活性な変異体を含む、請求項110から115のいずれか一項に記載の組成物。
【請求項117】
リーダータンパク質が、NUDT16、ALYREFもしくはYTHドメインタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項115に記載の組成物。
【請求項118】
ライタータンパク質が、DNMTタンパク質、NAT10タンパク質、METTLタンパク質、TRMタンパク質、BMTタンパク質、DUSタンパク質、PUSタンパク質、ADARタンパク質もしくはNSUNタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項115に記載の組成物。
【請求項119】
イレイサータンパク質が、FTOタンパク質、ALKBHタンパク質、TETタンパク質、またはそれらのフラグメントもしくは誘導体である、請求項115に記載の組成物。
【請求項120】
第1および/または第2のリンカーが切断可能である、請求項110から119のいずれか一項に記載の組成物。
【請求項121】
アダプターが切断可能である、請求項110から119のいずれか一項に記載の組成物。
【請求項122】
非カノニカルな特徴が修飾ヌクレオシドである、請求項110から121のいずれか一項に記載の組成物。
【請求項123】
修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、7-メチルグアノシン(m7G)-Cap、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン(4mdC)、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-カルボキシシチジン(5caC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、リボースメチル化(Nm)、N2,N2-ジメチルグアノシン(m G)、5-カルバモイルメチル-2’-O-メチルウリジン(ncm5Um)、5-メトキシカルボニルメチルウリジン(ncm5mU)、5-メトキシカルボニルメチル-2-チオウリジン(mcm5s2U)、ケウオシン(Q)、2-チオウリジン(s2U)、5-タウリノメチルウリジン(τm5U)、5-タウリノメチル-2-チオウリジン(τm5s2U)、N6-イソペンテニルアデノシン(I6A)、2-メチルチオ-N6-トレオニルカルバモイルアデノシン(ms2t6A)である、請求項122に記載の組成物。
【請求項124】
非カノニカルな特徴が核酸損傷である、請求項110から123のいずれか一項に記載の組成物。
【請求項125】
核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項124に記載の組成物。
【請求項126】
核酸損傷が、外因性薬剤による嵩高い付加体形成または塩基アルキル化に起因する、請求項124に記載の組成物。
【請求項127】
損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項124に記載の組成物。
【請求項128】
非カノニカルな特徴が構造的要素である、請求項110から121のいずれか一項に記載の組成物。
【請求項129】
構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、I-モチーフ、バルジ、スリーウェイジャンクション、十字型構造、テトラループ、リボースジッパー、またはシュードノットである、請求項128に記載の組成物。
【請求項130】
アダプターがユニバーサルフォワードプライマー(UFP)およびユニバーサルリバースプライマー(URP)の少なくとも1つを含む、請求項110から129のいずれか一項に記載の組成物。
【請求項131】
アダプターが分子バーコード(UMI)を含む、請求項110から130のいずれか一項に記載の組成物。
【請求項132】
アダプターが1以上の非天然核酸塩基を含む、請求項110から131のいずれか一項に記載の組成物。
【請求項133】
1以上の非天然核酸塩基が、Gクランプ(9-(2-アミノエトキシ)-3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、tC(3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、tC(3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、イノシン、スーパーT(5-ヒドロキシブチニル-2’-デオキシウリジン)、スーパーG(8-アザ-7-デアザグアノシン)、ウラシル、または8-オキソ-Gから独立して選択される、請求項132に記載の組成物。
【請求項134】
アダプターが、ロック核酸(LNA)、ペプチド核酸(PNA)、グリコール核酸(GNA)、ホスホロチオエート、2’-フルオロリボース、2’-メトキシリボース、ホスホロジチオエート、メチルホスホネート、ホスホロアミデート、グアニジノプロピルホスホロアミデート、トリアゾール、グアニジニウム、モルホリノ、スレオース核酸(TNA)またはヘキシトール核酸(HNA)から選択される1以上の骨格修飾を含む、請求項110から133のいずれか一項に記載の組成物。
【請求項135】
アダプターが1以上の3’または5’ブロッキング基を含む、請求項110から134のいずれか一項に記載の組成物。
【請求項136】
1以上の3’または5’ブロッキング基が、ジデオキシリボース、ホスフェート、逆塩基またはリンカーから独立して選択される、請求項135に記載の組成物。
【請求項137】
アダプターが19bpのモザイク末端(ME)を含む、請求項110から136のいずれか一項に記載の組成物。
【請求項138】
結合ドメインが少なくとも1つの修飾ヌクレオシドと接触している、請求項110から137のいずれか一項に記載の組成物。
【請求項139】
結合ドメインが修飾ヌクレオチドおよびそれに隣接する1以上のヌクレオチドと接触している、請求項110から137のいずれか一項に記載の組成物。
【請求項140】
結合ドメインおよびアダプターが、トランスポザーゼによる標的核酸へのアダプターの転移を可能にするように、基質上で空間的に離れて配置されている、請求項110から139のいずれか一項に記載の組成物。
【請求項141】
結合ドメインがアダプターから200nm未満の距離で基質に結合している、請求項140に記載の組成物。
【請求項142】
組成物が、結合ドメインに結合した塩基編集酵素をさらに含む、請求項110から141のいずれか一項に記載の組成物。
【請求項143】
塩基編集酵素が結合ドメインに共有結合している、請求項142に記載の組成物。
【請求項144】
塩基編集酵素が、ペプチドタグ、タンパク質タグ、二次抗体、核酸配列、または生体直交型反応基から選択される標的部分を介して結合ドメインに結合されている、請求項142に記載の組成物。
【請求項145】
塩基編集酵素が、アデノシンデアミナーゼ、シトシンデアミナーゼ、グリコシラーゼ、メチラーゼ、デメチラーゼ、またはジオキシゲナーゼである、請求項142から144のいずれか一項に記載の組成物。
【請求項146】
請求項110から145のいずれか一項に記載の組成物および結合ドメインに非共有結合または共有結合した標的核酸を含む、複合体。
【請求項147】
複数の標的核酸を分析する方法であって、
(i)標的RNA分子を逆転写してDNA-RNAヘテロ二本鎖分子を形成するか、標的二本鎖DNA分子を供給することにより、複数の標的核酸を供給すること;
(ii)複数の標的核酸を含む溶液を、請求項110から145のいずれか一項に記載の組成物と接触させること、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合している;
(iii)トランスポザーゼを用いて、2つのアダプター(そのうちの少なくとも1つは核酸バーコードを含む)を、非カノニカルな特徴を含む二本鎖標的核酸にトランスファーして、バーコード化標的核酸を生成すること、
(iv)バーコード化された標的核酸を増幅すること;および
(v)バーコード化標的核酸の配列を決定すること
を含み、ここで、工程(ii)および(iii)は順次または同時に行われる、
方法。
【請求項148】
工程(ii)がMg2+イオンの不存在下で行われ、工程(ii)が工程(iii)の前に行われる、請求項147に記載の方法。
【請求項149】
工程(iii)がMg2+イオンを添加することをさらに含み、工程(iii)が工程(ii)の後に行われる、請求項147または148に記載の方法。
【請求項150】
核酸バーコードが転移酵素により標的核酸にトランスファーされる、請求項147に記載の方法。
【請求項151】
バーコードを含むMEアダプター鎖が、その5’末端を介して基質上に固定化されている、請求項147に記載の方法。
【請求項152】
該方法が、非カノニカルな特徴の位置がバーコード化標的核酸またはそのコピーの一次核酸配列に基づいて識別可能であるように、バーコード化標的核酸またはそのコピーを修飾することを含む、請求項147~151のいずれか一項に記載の方法。
【請求項153】
修飾工程が、結合ドメインが標的核酸に結合している結合部位の1~20塩基以内の塩基を編集することを含む、請求項152に記載の方法。
【請求項154】
複数の標的核酸中の複数の非カノニカルな特徴を検出する方法であって、
(i)複数の標的核酸を含む溶液を複数の組成物と接触させること;
ここで、複数の組成物はそれぞれ独立して以下から選択される:
(a)請求項1から33のいずれか一項に記載の組成物、
(b)請求項51から92のいずれか一項に記載の組成物、
(c)請求項110から145のいずれか一項に記載の組成物、
ここで、工程(i)で接触される複数の組成物の数は、非カノニカルな特徴の数に等しいか、またはそれよりも多く、前記複数の組成物の結合ドメインは、各々、DNAもしくはRNAの異なる非カノニカルな特徴に結合しているか、または複数の結合ドメインがDNAもしくはRNAの同じ非カノニカルな特徴に結合しており、かつ前記複数の組成物のアダプターは各々、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の核酸バーコード配列を含む;
(ii)以下のうち1つを実行すること:
(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーするか、または
(b)複数の標的核酸のバーコード化コピーを生成する;
(iii)バーコード化された標的核酸を増幅させること;および
(iv)バーコード化された標的核酸の塩基配列を決定すること
を含む、方法。
【請求項155】
複数の標的核酸中の複数の非カノニカルな特徴を検出する方法であって、
(i)複数の組成物を含むマイクロアレイ、ビーズ、および/または流体デバイスを提供すること;
ここで、複数の組成物はそれぞれ独立して以下から選択される:
(a)請求項1から33のいずれか一項に記載の組成物、
(b)請求項51から92のいずれか一項に記載の組成物、
(c)請求項110から145のいずれか一項に記載の組成物、
ここで、工程(i)で提供される複数の組成物の数は、非カノニカルな特徴の数に等しいか、またはそれよりも多く、前記複数の組成物の結合ドメインは、各々、DNAもしくはRNAの異なる非カノニカルな特徴に結合しているか、または複数の結合ドメインがDNAもしくはRNAの同じ非カノニカルな特徴に結合しており、かつ前記複数の組成物のアダプターは各々、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の核酸バーコード配列を含む;
(ii)複数の標的核酸を複数の組成物と接触させ、かつ以下のうち1つを実行すること:
(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーするか、または
(b)複数の標的核酸のバーコード化コピーを生成する;
(iii)バーコード化された標的核酸を増幅すること;および
(iv)バーコード化された標的核酸の塩基配列を決定こと
を含む、方法。
【請求項156】
前記流体デバイスが、複数のチャネルおよび複数の組成物を備え、前記複数のチャネルの各々が、前記複数の組成物のうちの1つを含む、請求項155に記載の方法。
【請求項157】
複数の組成物中の各組成物がマイクロアレイ上のスポットである、請求項156に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願との相互参照
本出願は、2021年11月24日出願の米国仮出願第63/282,808号および2022年7月11日出願の米国仮出願第63/388,036号に基づく優先権の利益を主張し、これらの開示は引用によりその内容全体を本明細書に包含させる。
【0002】
技術分野
本発明は、一般的に、エピトランスクリプトミック、エピジェネティック、およびRNAおよびDNAを含む核酸の構造に対する他の修飾または非カノニカルな特徴の同定および解析に関する。
【0003】
連邦政府資金援助条項
本発明は、米国国立ヒトゲノム研究所から供与された助成金番号1R43HG012170-01による米国政府の支援を受けて行われた。米国政府は本発明に対して一定の権利を有する。
【背景技術】
【0004】
背景
ヌクレオチドの化学変化を含むエピジェネティックな変化は広く存在し、遺伝子発現、遺伝子サイレンシング、DNA損傷への応答などの生物学的プロセスにおいて主要な役割を果たしている。同様に、エピトランスクリプトミックな(以下、エピトランスクリプトームという)修飾として知られるRNAの化学修飾は、転写中または転写後に細胞内で頻繁に起こる。RNA修飾は、翻訳の開始、翻訳エラー率、選択的スプライシング、RNAの安定性、フォールディングおよび輸送において重要な役割を果たしている。
【0005】
ほとんどすべての種類の癌、認知機能障害、呼吸器系、循環器系、生殖器系、自己免疫系、神経行動系の疾患など、多様な疾患、行動、その他の健康指標がDNAのエピジェネティックな変化と相関している。しかし、ゲノム全体におけるエピジェネティックな変化の分布、特に健康および疾患との関連については、ほとんど知られていない。エピトランスクリプトーム修飾の機能はいくつか知られているが、細胞内RNA全体におけるこれらの修飾の位置を特定し定量化する分析法がないため、多くは知られていない。現在のところ、エピトランススクリプトームRNA修飾の相関レベルおよび細胞内での変化についてはほとんど何もわかっていない。
【0006】
化学的誘導体化法、分子認識法(通常、濃縮および検出の両方に抗体を使用)、逆転写による塩基配列決定法を組み合わせることで、限られた数のDNAおよびRNAの修飾に対するプロファイリング法が提供されてきた。しかし、これらの方法は感度が高くなく、核酸の分解/フラグメント化を引き起こし、一塩基分解能で修飾の位置を同定できないことが多い。さらに、これらの方法は、複数のDNAまたはRNA修飾を同時に多重検出することはできない。一般的なエピトランスクリプトームRNA修飾の塩基配列を決定する既存の方法は、検出された修飾の数(一桁以上異なる)および修飾の位置の両方において、しばしば相反する所見を与える。
【0007】
従って、DNAおよびRNAの修飾を同定、分析、定量、位置特定するための改良された組成物および方法が当技術分野で必要とされている。このような進歩は、健康および疾患における生物学の重要な制御メカニズムの発見、ならびに医学における新しい治療パラダイムの開発に道を開き得る。
【発明の概要】
【0008】
概要
本発明は、RNAおよびDNAを含む核酸の構造に対するエピトランスクリプトーム、エピジェネティック、その他の化学的修飾を同定および分析するための組成物および方法を提供する。本発明は、潜在的に無制限の数のDNAおよび/またはRNA修飾を同時にプロファイリングするための、高度に並列化された、高感度、高精度、高速処理の方法を提供する。
【0009】
本発明は、i)基質、ii)第1のリンカーを介して該基質に結合する結合ドメイン、およびiii)第2のリンカーを介して該基質に結合するアダプターを含む組成物であって、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む組成物を提供する。
【0010】
本発明はまた、i)基質、ii)基質に結合した第2の認識エレメント、iii)第2の認識エレメントに結合するアダプター、およびiv)結合ドメインを含む組成物であって、ここで、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成されており、かつ結合ドメインは第2の認識エレメントによって固定化されており、ここで、アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む組成物を提供する。ある側面において、組成物は複数の第2の認識エレメントを含み、ここで、該複数の第2の認識エレメントが互いに異なる第2の認識エレメントを含み、該アダプターが該複数の第2の認識エレメントの1つに結合され、かつ結合ドメインが異なる第2の認識エレメントに結合されている。ある側面において、組成物は複数の第2の認識エレメントを含み、ここで、アダプターは複数の第2の認識エレメントの1つに結合され、かつ結合ドメインは同じ第2の認識エレメントの別の部分(instance)に結合される。
【0011】
また、本明細書では、i)基質、ii)基質に結合された第2の認識エレメント、
iii)リンカーを介して基質に結合する結合ドメイン、iv)第2の認識エレメントを介して基質に結合するアダプターを含む組成物であって、ここで、結合ドメインは、DNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成されており、該アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む組成物も提供する。
【0012】
また、本発明は、i)基質、ii)第1のリンカーまたは第2の認識エレメントを介して基質に結合する結合ドメイン、iii)第2のリンカーまたは第2の認識エレメントを介して基質に結合するモザイク末端(ME)アダプター、およびiv)トランスポザーゼを含む組成物であって、ここで、前記トランスポザーゼは固定化MEアダプターに負荷され、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記MEアダプターの少なくとも1つは、非カノニカルな特徴に固有の核酸バーコード配列を含むか;またはi)基質、ii)リンカーまたは第2の認識エレメントを介して基質に結合する結合ドメイン、およびiii)結合ドメインと結合したトランスポザーゼを含む組成物であって、ここで、前記トランスポザーゼはMEアダプターに負荷され、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記MEアダプターの少なくとも1つは、非カノニカルな特徴に固有の核酸バーコード配列を含む、組成物、を提供する。
【0013】
また、本発明では、i)基質、ii)基質に結合された複数の第2の認識エレメント、iii)複数の第2の認識エレメントの1つに結合されたアダプター、およびiv)複数の第2の認識エレメントの別の1つに結合された結合ドメインを含む組成物であって、ここで、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつアダプターは結合ドメインによって特異的に結合された非カノニカルな特徴に固有の核酸バーコード配列を含む組成物も提供する。
【0014】
また、本発明は、本明細書に記載の結合ドメインを含む組成物の1以上および結合ドメインに結合された標的核酸を含む複合体も提供する。
【0015】
また、本明細書に開示され、図面に描かれている組成物および複合体の製造方法も提供される。
【0016】
本発明はまた、複数の標的核酸を分析する方法であって、該方法は、(i)複数の標的核酸を含む溶液を、本明細書に記載の組成物と接触させる工程、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する、工程;(ii)以下のいずれかを行う工程:(a)核酸バーコードを非カノニカルな特徴を含む標的核酸にトランスファーして、バーコード化標的核酸を生成すること、または(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;(iii)バーコード化標的核酸を増幅させる工程;および(iv)バーコード化標的核酸の配列を決定する工程を含み、ここで、工程(i)および(ii)は順次または同時に行われる、方法を提供する。ある側面では、3’ 縮重塩基を有するアダプターが標的核酸をランダムにプライミングする。ある側面において、工程(ii)は修飾特異的バーコードを導入することをさらに含み、ここで、アダプターの3’末端は逆転写酵素またはDNAポリメラーゼによって伸長される。
【0017】
また、本発明は、複数の標的核酸を分析する方法であって、該方法は:(i)複数の標的核酸を含む溶液を、本明細書に記載の組成物と接触させる工程であって、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する、工程;(ii)以下のうちの1つを実施する工程:(a)核酸バーコードを、非カノニカルな特徴を含む標的核酸にトランスファーして、バーコード化標的核酸を生成すること、または(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;(iii)バーコード化標的核酸を増幅する工程;および、(iv)バーコード化標的核酸を配列決定する工程を含み、ここで、工程(i)および(ii)は順次または同時に行われる、方法を提供する。ある側面では、3’スペーサー配列を有するアダプターは、標的核酸により示される合成スペーサー配列に部位特異的に結合する。ある側面において、工程(ii)は修飾特異的バーコードを導入することをさらに含み、ここで一方または両方の3’末端は逆転写酵素またはDNAポリメラーゼによって伸長される。
【0018】
また、本発明は、複数の標的核酸を分析する方法であって、該方法は、(i)複数の標的核酸を含む溶液を、本明細書に記載の組成物と接触させる工程であって、非カノニカル特徴を含む標的核酸が結合ドメインに結合する、工程;(ii)以下のうちの1つを実施する工程:(a)核酸バーコードを、非カノニカルな特徴を含む標的核酸にトランスファーして、バーコード化標的核酸を生成すること、または(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;(iii)バーコード化標的核酸を増幅する工程;および、(iv)バーコード化標的核酸を配列決定する工程を含み、ここで、工程(i)および(ii)は順次または同時に行われる、方法も提供する。
【0019】
また、本発明は、複数の標的核酸を分析する方法であって、該方法は、(i)標的RNA分子を逆転写してDNA-RNAヘテロ二本鎖分子を形成させるか、または標的二本鎖DNA分子を提供することにより、複数の標的核酸を提供する工程;(ii)複数の標的核酸を含む溶液を、本明細書に記載の組成物と接触させる工程であって、非カノニカルな特徴を含む標的核酸を結合ドメインに結合させる、工程;(iii)トランスポザーゼを用いて、2つのアダプターであって、そのうちの少なくとも1つは核酸バーコードを含むアダプターを、非カノニカルな特徴を含む二本鎖標的核酸にトランスファーして、バーコード化標的核酸を生成する工程;(iv)バーコード化標的核酸を増幅する工程;および(v)バーコード化標的核酸を配列決定する工程を含み、ここで、工程(ii)および(iii)は同時または逐次的に行われる、方法も提供する。
【0020】
また、本発明は、複数の標的核酸中の複数の非カノニカルな特徴を検出する方法であって、該方法は、(i)複数の標的核酸を含む溶液を、本明細書に記載の複数の組成物と接触させる工程であって、工程(i)において接触させる複数の組成物の数は、非カノニカルな特徴の数と等しいか、または非カノニカルな特徴の数よりも多く、ここで、複数の組成物の結合ドメインは、各々、DNAまたはRNAの異なる非カノニカルな特徴に結合するか、または複数の結合ドメインがDNAまたはRNAの同じ非カノニカルな特徴に結合し、かつ複数の組成物のアダプターは各々、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の、核酸バーコード配列を含む;(ii)以下のうちの1つを実施する:(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーすること、または(b)複数の標的核酸のバーコード化されたコピーを生成すること;(iii)バーコード化された標的核酸を増幅する工程;および、(iv)バーコード化された標的核酸を配列決定する工程、を含む方法を提供する。ある側面では、トランスポザーゼによるアダプター導入も含まれる。
【0021】
また、本発明は、複数の標的核酸中の複数の非カノニカルな特徴を検出する方法であって、該方法は、(i)本明細書に記載の複数の組成物を含むマイクロアレイ、ビーズ、および/または流体デバイスを提供する工程であって、ここで、工程(i)において提供される複数の組成物の数が、非カノニカルな特徴の数と等しいか、または非カノニカルな特徴の数よりも多く、複数の組成物の結合ドメインが、各々、DNAまたはRNAの異なる非カノニカルな特徴に結合するか、または複数の結合ドメインが、DNAまたはRNAの同じ非カノニカルな特徴に結合し、かつ、複数の組成物のアダプターが、各々、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の核酸バーコード配列を含む;(ii)複数の標的核酸を複数の組成物と接触させ、かつ以下のうちの1つを実施する:(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーすること、または(b)複数の標的核酸のバーコード化されたコピーを生成すること;(iii)バーコード化された標的核酸を増幅する工程;および、(iv)バーコード化された標的核酸を配列決定する工程、を含む方法を提供する。ある側面では、トランスポザーゼによるアダプター導入も含まれる。
【0022】
本発明のこれらの面および他の側面は、以下の詳細な説明、図面、特許請求の範囲、態様、手順、化合物、および/または組成物、ならびに関連する背景情報および参考文献を参照することにより明らかになり得る。
【図面の簡単な説明】
【0023】
図1図1A-1Hは、DNAアダプターおよび結合ドメインを表面(例えば、基質)に結合させるための種々の分子構造を示す。例示的な態様では、DNAアダプターは、修飾を同定する目的で標的RNAにトランスファーされるRNA修飾特異的バーコードを含む。図1Aでは、DNAアダプターおよび結合ドメインは両方とも、同じか直交型(orthogonal)化学反応によって表面に共有結合している。表面結合分子の柔軟性およびアクセス性を高めるために、リンカーが含まれていてもよい。図1Bでは、アダプターはRNA特異的結合ドメインに結合する第2の認識エレメント、例えばプロテインG、AまたはLを介して固定化されたRNA特異的一次抗体、あるいは二次抗体に結合している。図1Cは、アダプター固定化のための異なる第2の認識エレメント、例えばストレプトアビジンに結合したビオチン化アダプター分子の層の使用を示す。この例では、結合ドメインはリンカーを介して固定化されている。あるいは、結合ドメインおよびアダプターの両方をストレプトアビジンを介して固定化してもよいか、または結合ドメインが第2の認識エレメントに結合している間にアダプターを基質に共有結合させてもよい。図1Dは、結合ドメインおよびアダプターを固定化するための2つの異なる第2の認識エレメントの使用を示す。例えば、抗体結合ドメインはプロテインGを介して基質に固定化され、ビオチン化アダプターはストレプトアビジンを介して基質に固定化される。図1Eは、プロテインGを介して基質に固定化された2種の抗体を示す。一方の抗体種はアダプターで標識され、核酸とは結合しないが、もう一方の抗体種は核酸の非カノニカルな特徴に特異的であり、標識されていない。図1Fは結合ドメインの表面への固定化を示し、結合ドメインは捕捉配列に相補的な核酸に結合している。捕捉配列が(例えば、リンカーを介して)基質上に固定化されると、結合ドメインに結合した核酸配列とハイブリダイズし、その結果、結合ドメインが基質上に固定化される。この例では、アダプターは、標的RNAまたはcDNAを表面結合アダプターに酵素的に結合させた後、表面から放出するための切断部位を含む。切断は、USER酵素を用いたウラシル修飾アダプター内で起こるか、FpG酵素を用いた8-オキソグアニン修飾アダプター内で起こるか、あるいはリンカーの一部、例えば光開裂可能なPCまたはジスルフィドリンカーであってもよい。図1Gは、結合ドメインに近接した転移(transposition)用モザイク末端(ME)アダプターを示す基質である。各Tn5トランスポザーゼ二量体には2つのアダプター分子が包含されている。タグメンテーションによるDNAライブラリー調製には、フォワードプライマー部位およびリバースプライマー部位をそれぞれ有するMEアダプターを包含するTn5二量体が含まれる。図1Hは、抗体結合ドメインの近傍にTn5分子を連結する別の方法を示す。Tn5-プロテインA融合タンパク質の二量体は、MEアダプターに負荷され、プロテインAと抗体のFc領域との親和性結合を介して抗体に結合する。
図2図2A-2Gは、アダプターをRNA分子またはそれに対応するcDNAに結合させるための種々の方法を示す。図2Aは、T4 RNAリガーゼ1によって触媒される、RNAの3’OH(アクセプター)とDNAまたはRNAの5’-リン酸(ドナー)の間のライゲーションを示す。関連する例示的なフォーマットには、T4 RNAリガーゼ2によるプレアデニル化RNAまたはDNAドナーとRNAアクセプターとのライゲーション、およびRtcBリガーゼによるRNAの3’リン酸とRNAの5’OHとのライゲーションが含まれる。CircLigase(サークリガーゼ)によって2つの一本鎖DNAフラグメントをライゲーションできる。図2Bは、T4 RNAリガーゼ2によるニック構造のライゲーションを示す。ドナーおよびアクセプターの両方がRNAであってもよい、ドナーがDNAであってもよい。二本鎖DNAのニックはT4 DNAリガーゼによって塞がれる。図2Cは、標的RNAをテンプレートとして逆転写酵素を用いたスプリント伸長を示す。このフォーマットでは、バーコード化されたcDNAが生成される。図2Dでは、標的RNAがプライマーとして作用し、バーコードが付加されている。DNAポリメラーゼによる伸長には、既知の配列を有する短いスペーサー配列(SP)のライゲーションが必要である。ある側面において、本発明は、複数回の連続的なバーコードトランスファーを含む方法も含み、例えば、バーコードが標的核酸に直接結合している。図2Dに示すような2つのスペーサー領域を有するアダプターは、このような反復バーコード化工程に適するアダプターの一例である。逆転写酵素は、図2Gに示すようにアダプターを伸長し、それによってRNA標的のcDNAコピーを合成できる。図2Eは、T4 DNAリガーゼによる平滑末端DNAまたは付着末端DNAの二本鎖ライゲーションによるバーコード化を示す。図2Fは、2つの部分AとBの間で起こる化学的ライゲーションを示す。部分Aは短いスペーサーの一部で、RNA標的にライゲーションして化学的ライゲーションに適した状態にする。図2H図2Gに似ているが、RNA標的へのスペーサー配列のライゲーションには依存していない。アダプターの3’末端は、標的RNAのランダムプライミングを可能にするために縮重塩基を示し、次いで単一または双方向プライマー伸長によってバーコードがトランスファーされる。
図3図3は、人工表面(例えばビーズ)を用いたRNAプロファイリングの一般的概要を示す。複数のRNA鎖を化学的にフラグメント化する。修飾されたRNAフラグメント(六角形で示された修飾)は、RNA修飾特異的結合ドメインとの相互作用を介して表面上に富化される。複数のビーズを用いて、各ビーズが同じ結合ドメインおよびバーコードのコピーを示するようすることもできる。この反応には、RNAの修飾を調べるために、何種ものビーズを使用できる。標的RNAにバーコードをトランスファーすることで、RNAの修飾がDNAコードに変換される。cDNAライブラリーの塩基配列を決定すると、各RNAフラグメントの修飾状態がわかる。
【0024】
図4図4A-4Cは、異なる鎖上の複数の非カノニカルな特徴(例えば、RNA修飾)を同じ反応で同時に調べるための、いくつかの表面ベースのアッセイフォーマットを示す。これらのフォーマットは、異なるタイプの結合ドメインと関連するバーコードを空間的に分離し、それらを同じアナライトに曝露して多重分析を可能にすることを目的としている。図4Aは、プール内で組み合わされた異なるタイプのビーズを示し、各タイプのビーズが特定のRNA修飾を捕捉し、バーコード化する。ビーズは、フリットカラムでろ過され、または磁化によって回収できる。図4Bは、表面介在バーコーディングおよび結合ドメインの捕捉のためのDNAアレイの使用を示す。アレイの各スポットは、少なくとも1つの固有のバーコード化されたアダプターを含み、結合ドメインによって表示されるDNAタグとのハイブリダイゼーションによって、1種の結合ドメインのみを捕捉する。図4Cでは、バーコードおよび結合ドメインが共固定化されたモノクローナルパッチが、個々のチャネルを形成するマイクロ流体チップに組み込まれている。各チャンネルには、固定化されたバーコードと、1つのDNA/RNA修飾または非カノニカルな特徴に対する結合ドメインが含まれる。アナライトはサンプル分割によって供給される。
図5図5は、3’-固定化アダプターおよびライゲーションによるバーコード化を利用した、完全なRNA修飾プロファイリングワークフローを示す。ワークフロー工程には、修飾特異的RNAキャプチャー、一本鎖ライゲーションによるバーコーディング、一本鎖cDNA合成、およびテンプレートスイッチングによる二本鎖合成が含まれる。DNAアダプターは、表面固定化のための3’アミン、ユニバーサルプライミング部位、固有の分子バーコード、修飾特異的バーコード、および5’リン酸を含む。
図6図6は、5’固定化アダプターおよびプライマー伸長によるバーコード化を利用した、完全なRNA修飾プロファイリングワークフローを示す。この限定されない例では、ショートスペーサー(SP)が上流にライゲーションされる。スペーサーは表面に結合したアダプターと相補的であり、RNA標的と表面に結合したアダプターがアニーリングすることで、逆転写酵素のプライミング部位が形成される。標的のRNA修飾特異的プルダウンを確実にするため、スペーサー相互作用は弱く、抗体結合がない状態では単独では安定しない。抗体およびスペーサーの同時結合が示されている。DNAアダプターは、表面固定化のための5’アミン、ユニバーサルプライミング部位、固有の分子バーコード、修飾特異的バーコード、および3’スペーサーを含む。テンプレートスイッチングオリゴの存在下、逆転写酵素によって表面に結合したアダプターを伸長させると、バーコード化された第1鎖cDNAが生成され、第2の配列決定アダプターが導入され、cDNAが表面に共有結合する。cDNAの増幅は、ビーズをインプットするPCRによる別の反応で行われるか、または表面上でインサイチュウにて行われる(それぞれ図7および図8に示される)。
図7図7は、標的核酸の同一コピーのクラスターを基質上に形成するために用いられ得る表面ベースのcDNA増幅の概略図を示す。溶液PCRと同様に、このプロセスは温度サイクルを用いてDNA鎖をアニール、伸長、融解させ、指数関数的な増幅をもたらす。表面ベースの増幅は、最初のcDNA鎖の同一コピーの単クローン性クラスターを生成する。それぞれのクラスターは、基質と結合している結合ドメインが非カノニカルな特徴を認識することによってシードされる。結合ドメインの表面密度は、隣接するクラスターの重合を避けるために疎になっている。最初のcDNA鎖は、P5プライマーおよびP7プライマーを示す表面を用いて、図6に示すワークフローに従って作製される。低温で、cDNA鎖を相補的な表面プライマーにアニールする。DNAポリメラーゼが中温でプライマーを伸長させると、親鎖のコピーが生成される。得られた二重鎖は、熱により、および/またはカオトロープ(chaotrope)の添加によって分離され、次のサイクルの出発点となる。同一コピーのクラスターが1つ形成されることもあれば、複数形成されることもある。本発明の方法は、基質上の標的核酸の同一コピーのクラスターのインサイチュウ配列決定を含む。
【0025】
図8図8は、合成による配列決定に適したモノクローナルcDNAクラスターを生成するプロセスを示し、各クラスターは修飾RNA鎖を表す。フラグメント化されたRNAは、RNA修飾と結合ドメインとの相互作用に基づいて、フローセル上に分割されシードされる(図6参照)。フローセルはセグメント化されており、各セグメントは異なる修飾を標的としている。例えば、10の修飾を検出するために、フローセルは適切な結合ドメインおよびアダプター対を有する修飾された10の領域を含む。増幅時に隣接配列とのコンタミネーションを防ぐため、抗体の表面密度は低い。RNA鎖はその修飾に基づいて捕捉され、表面に共有結合され、プライマー伸長によってバーコード化され、次いでクローン増幅が行われる(図7参照)。クローン増幅されたバーコード化cDNAは、その後直鎖化され、シーケンシング・バイ・合成(SBS)ケミストリー法を用いて直接配列決定される。
図9図9は、バーコーディングのためのTn5トランスポザーゼを用いたRNA修飾の迅速なプロファイリング法を示す。RNAをDNA/RNAのヘテロ二重鎖に逆転写する。ヘテロ二重鎖は、抗体およびモザイク末端(ME)を有するアダプターを提示する表面(例えば、ビーズ)上に免疫沈降される。MEアダプターに結合したTn5トランスポーズ分子を含むトランスポソームが構成され、Tn5トランスポザーゼがMg2+イオンの存在下で、1段階のカット・アンド・ペースト機序でバーコード化されたアダプターを挿入する。ギャップフィルの後にPCRを行うことで、ライブラリー調製のワークフローが完成する。
図10図10は、ADAR酵素による塩基編集によって、同じRNA鎖内の複数のm6A修飾の位置をマーキングするプロセスを示す。ポジションマーキング後、図9に示すように、個々のRNA鎖はトランスポザーゼによってバーコード化される。同じ親RNA分子に由来するNGS(次世代シーケンシング)リードは、同じバーコードを共有する。“A>I”とは、ADAR酵素によって触媒されるアデニンのイノシンへの変異を意味する。
図11図11は、ロングリードフェーズの概念を示す。図10に示すプロセスによるポジションマーキングおよびバーコード化により、短いシーケンスリードから長い転写産物を再構築できる。同じ親分子に由来する各短い核酸フラグメントをユニークにバーコード化するために、各ビーズは、RNA修飾および個々のビーズを示す複数の固有のバーコードを示す。ビーズの表面は小さく、平均してフルサイズの親分子を1つしか捕捉できない。固定化されたトランスポソームは親分子を短いフラグメントに切断し、ビーズに特異的なバーコードを挿入する。短いリードは対照ゲノムにアライメントされ、同じバーコードを示すジャンクションで結合される。“A>I”はアデニンのイノシンへの変異を意味する。
図12図12A-12Dは種々のDNAアダプターの構造を示す。図12Aは、UFPまたはURPを含むアダプターを示す。図12Bは、環状化によるライブラリー調製に用い得るアダプターを示す。図12Cは、ライゲーションによるバーコード導入に用い得るアダプターを示す。図12Dは、プライマー伸長による単一または複数のバーコード転写に用い得るアダプターを示す。スペーサーは特定の塩基配列であってもよいし、ランダムな塩基から構成されていてもよい。凡例に示すように、“UFP”はユニバーサルフォワードプライマーの略称であり、“URP”はユニバーサルリバースプライマーの略称であり、“MBC”は修飾エンコードバーコードの略称であり、“UMI”は分子バーコード(Unique Molecular Identifier)の略称であり、そして“CLS”は切断部位の略称である。“SP”はスペーサーの略称である。
図13図13は、例示的なモザイク末端アダプター分子(MEおよびME’)を示す。灰色の線はDNAの一部であり、配列はMEアダプターおよびME’アダプターである。各トランスポザーゼは2つのアダプター(この例では、Tn5ME-/MEおよびTn5ME-B/ME)を負荷し、それらはds-DNAの両端にライゲーションされる。以下の配列が示されている: 配列番号: 14 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG 15 TCTACACATATTCTCTGTC 16 CTGTCTCTTATACACATCT 17 GACAGAGAATATGTGTAGACTGCGACGGCTGCT
【0026】
図14図14A-14Gは、Biolayer Interferometry (BLI)によって測定された異なる抗体の結合曲線および解離曲線を示す。実線は、中央の塩基が修飾された変性RNAオリゴに対する抗体の結合を示す。点線は、同じ長さの未修飾RNAオリゴに対する抗体の結合を示す。
図15図15Aは、レポーター抗体を異なる量のアダプターオリゴで標識し、変性ゲル電気泳動で分離して生成した生成物を示す。この反応では、標識された化学量論分布が生じる。平均標識化学量論は、抗体に対するオリゴのモル過剰が増加するにつれて増加する。図15Bは、表面上のレポーター抗体の数が増加するにつれて、バーコード化率が増加することを示す。データは、RNA修飾特異的抗体およびレポーター抗体の混合物をビーズに負荷し、次いで修飾RNAを末端色素標識で免疫沈降させ、バーコード化反応を開始することによって得られる。バーコード化は、溶出したRNAの変性ゲル電気泳動およびゲルバンドのデンシトメトリーによって定量される。図15Cは、“モノクローナル”ビーズの構成を模式的に示す。モノクローナルビーズは、単一のRNA修飾特異的抗体およびその抗体を示す単一のアダプター配列を示す。免疫沈降したRNAを効果的にバーコード化するには、アダプターがRNAとアダプター分子の相互作用を可能にする密度で存在する必要がある。
図16図16は、キャピラリー電気泳動を用いた、スペーサーライゲーション前後のフラグメント化RNAの分析結果である。フラグメントのサイズは、それぞれ104ヌクレオチドおよび109ヌクレオチド付近に正規分布している。
図17図17Aは、逆転写によるバーコードの分子構造を示す。3プレックス実験には3種のビーズが含まれる。一方のビーズタイプはm6A抗体およびm6A特異的アダプター(MBC3-Ab05(m6A))を示し、第2のビーズタイプはイノシン抗体およびイノシン特異的アダプター(MBC4-Ab10(I))を示し、第3のビーズタイプはm5C抗体およびm5C特異的アダプター(MBC5-Ab16(m5C))を示す。標的RNAとアダプターとの間のスペーサーハイブリダイゼーション(SP-SP’)により、逆転写酵素による双方向伸長が可能になり、修飾バーコード(MBC)がコピーされ、cDNAが産生される。逆転写反応にテンプレートスイッチングオリゴ(TSO)を含めると、第2の配列決定アダプターが結合される。図17Bおよび17Cは、4つの異なるゲノムからインビトロ転写(IVT)によって得られた修飾RNAを、示した修飾ヌクレオチドの存在下で用いた3-プレックス実験で得られた配列決定結果をまとめたものである。図17Bにまとめた実験ではSuperScript IV逆転写酵素を用いたが、図17CではMaxima Minus逆転写酵素を用いた。各MBCの正規化画分を各ゲノムについてプロットし、修飾を示す。
図18図18A-18Gは、単一のビーズタイプおよび4つの異なるゲノムからの修飾IVT RNAを含む標的プールを用いたシングルプレックス実験の配列決定結果を示す。実験の目的は、異なる抗体によるバーコーディングの効率を比較することであった。MBC画分は、RNA修飾を正しいゲノムに関連付ける。抗体は、修飾標的とともにプロットの上に示される。
図19図19Aは、DNAポリメラーゼを用いたバーコード化に必要な核酸アーキテクチャーを示す。ビーズの命名法は図17Aと同様であるが、アダプターの3’末端がブロックされ、ボトム鎖の伸長を防いでいる(薄いグレーの点)。図19Bは、関連する配列データを報告する。RNA修飾は、大部分を占めるバーコードで示される。
【0027】
図20図20Aは、バーコード化方法としてスプリントライゲーションを示す。スプリント(黒線)はRNA標的およびアダプターを架橋している。リガーゼがギャップを塞ぎ、アダプターをRNA標的に連結させる。m6Aおよびm5Cを標的とした2種のビーズが示される。図20B-20Cは、m6Aおよびm5Cの同時検出を示す対応する配列決定データをまとめたものである。アダプターにハイブリダイズするスプリントの部分の長さは7ntであるのに対し、RNA標的に面した部分の長さは6nt(7-6スプリント)または3nt(7-3スプリント)である。以下の配列が示される: 配列番号: 18 AAAGCTGCACTCA/3SpC3/ 19 ATATAGGCACTCA/3SpC3 20 AAAGCTGCAC/3SpC3/ 21 ATATAGGCAC/3SpC3/
図21図21Aは、ユニバーサルスペーサーをRNA標的にライゲートする代替法を示す。プライマー伸長によるバーコーディングのために、RNAをA-テール(ポリAテール(AAAAAAAAAAAAAAA(配列番号22))とし、配列NVTTTTTTTで終わるアダプター配列とハイブリダイズさせる。逆転写およびテンプレートスイッチは上記のように行う。図21Bは、シングルプレックスデータセットの概念実証を示す。
図22図22Aは、バーコーディングのためにTn5トランスポザーゼを用いてRNA修飾をプロファイリングする迅速な方法を示す。RNAをDNA/RNAのヘテロ二重鎖に逆転写する。表面(例えば、ビーズ)には抗体およびそこに担持されるMEアダプターが含まれる。ヘテロ二重鎖は抗体およびアダプターを提示する表面に免疫沈降される。ビーズを洗浄した後、Mg2+不存在下でTn5トランスポザーゼをMEアダプターに負荷する。次にMg2+を含むタグメンテーションバッファーを加え、ビーズに確実に捕捉されたDNA-RNA二重鎖にアダプターを挿入する。ギャップ充填(filling)に続いてPCRを行うことで、ライブラリー調製のワークフローが完成する。図22Bは、m6A特異的ビーズおよび4つの異なるゲノムからの修飾IVT RNAを含む標的プールを用いた実験で得られたカバレッジプロットである。このプロットは、m6Aを含むフラグメントが有意に濃縮されていることを示しており、m6A修飾RNAの選択的タグメンテーションを証明している。
図23図23Aは、バーコード化IP RNAおよび非濃縮(インプット)サンプルのテクニカルトリプリケートについて、MBC分画で測定したグローバルバーコード表示を示す。図23Bは、遺伝子内のコールされたピークの位置を示す。図23Cは、各修飾および各複製サンプルについてコールされたピークの数をベン図で示す。
図24図24Aは、DNA/RNAヘテロ二重鎖のタグメンテーションに、抗体およびプロテインA-Tn5融合タンパク質を含む固定化コンジュゲートを用いる方法を示す。表面(例えば、ビーズ)にはプロテインGが結合しており、抗体およびプロテインA-Tn5分子を含むコンジュゲートを結合する。各Tn5二量体には、バーコードを含む一対のモザイクエンド(ME)アダプターが担持されている。転移の基質を作成するために、RNAをDNA/RNAヘテロ二重鎖に逆転写し、ビーズ上に免疫沈降させる。ビーズを洗浄し、Mg2+含有タグメンテーションバッファーを加えてタグメンテーション反応を開始する。タグ付けされたDNA/RNAヘテロ二重鎖はギャップ充填され、PCR増幅される。その後、ライブラリー調製が行われ、ワークフローが完成する。図24Bは、m6Aを標的にした実験で得られたインプット(対照)および免疫沈降サンプルのリードカバレッジプロットを比較したものである。
【発明を実施するための形態】
【0028】
詳細な説明
本発明は、トランスクリプトームおよびゲノムにわたるRNA修飾およびDNA修飾の多重プロファイリングのための組成物および方法を提供する。この方法は、標的核酸の非カノニカルな特徴(例えば、塩基修飾、骨格修飾、病変、および/または構造的エレメント)の分子認識と、この認識イベントからの情報をバーコードを用いて標的核酸の隣接遺伝子配列に書き込む工程とを組み合わせる。次いで、得られたバーコード化された核酸は、配列決定ライブラリーに変換され、例えば、DNA/RNA配列決定法または他の方法によって読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非カノニカルな特徴と相関する。配列決定により、標的核酸中の非カノニカルな特徴の局在を確認することもできる。本明細書に記載される高速プロファイリング法は、複数またはすべてのDNA/RNA修飾の性質および位置を並行して同定することを可能にする。これらの方法はまた、DNA/RNA修飾の存在量および化学量論を決定することもできる。
【0029】
いくつかの態様では、本明細書に記載の方法は、標的核酸上の修飾を同定するだけでなく、標的核酸上の修飾を1塩基ほどの高分解能で局在化するためにも用いられる。
【0030】
本発明は、以下に、例示的かつ限定されない態様で、かつ添付図面を用いてより詳細に説明される。しかしながら、本発明は、多くの異なる形態で具体化され得るものであり、以下に示す態様に限定して解釈されるべきではない。むしろ、これらの態様は、本明細書の記載を完全にし、当業者に本明細書に記載された範囲を伝えるために提供される。
【0031】
別段の定義がない限り、本明細書で用いるすべての技術用語および科学用語は、本発明が属する技術分野における当業者によって一般的に理解されるのと同じ意味を有する。本明細書の詳細な説明で用いられる用語は、特定の態様を説明するためだけのものであり、限定を意図するものではない。
【0032】
すべての刊行物、特許出願、特許、GenBank/Uniprotまたは他の受託番号、および本明細書に記載される他の参考文献は、すべての目的のために引用によりその内容全体が本明細書に包含される。
【0033】
定義
以下の用語は、本明細書および添付の特許請求の範囲において用いられる。
【0034】
単数形の“a”、“an”、および“the”は、文脈上そうでないことが明らかな場合を除き、複数形も含むものとする。
【0035】
さらに、ポリヌクレオチドまたはポリペプチド配列の長さ、投与量、時間、温度などの測定可能な値に言及するとき、本明細書で用いる用語“約”とは、規定量の±20%、±10%、±5%、±1%、±0.5%、またはさらに±0.1%の変動を包含することを意味する。
【0036】
また、本明細書で用いる“および/または”は、関連する列挙された項目の1以上の何れかの可能な組み合わせ、ならびに代替的に解釈されるとき、組み合わせの欠失(“または”)を意味し、それらを包含する。
【0037】
他にこれと異なる記載がない限り、本明細書に記載される種々の特徴は、何れかの組み合わせで使用できることが特に意図されている。さらに、いくつかの態様では、本明細書に記載の特徴または特徴の組み合わせのいずれかを除外または省略できる。さらに説明すると、例えば、本明細書において、特定のDNA塩基がA、T、Gおよび/またはCから選択され得ることが示されている場合、この用語は、その塩基がこれらの塩基の何れかのサブセット、例えばA、T、GまたはC;A、TまたはC;TまたはG;Cのみ等から選択され得ることも示しており、かかるサブコンビネーションがそれぞれ本明細書において明示的に記載されているかのように記載される。さらに、かかる用語は、指定された塩基の1以上が除外されうることも示している。例えば、いくつかの態様では、核酸はA、TまたはGではない;Aではない;GまたはCではないなど、そのような可能性のある各除外が本明細書に明示されているかのように記載される。
【0038】
本明細書で用いる用語“減少”、“低減”、“低下”および類似の用語は、少なくとも約10%、約15%、約20%、約25%、約35%、約50%、約75%、約80%、約85%、約90%、約95%、約97%またはそれ以上の減少を意味する。
【0039】
本明細書で用いる用語“増加”、“改善”、“増強”、“強化”、および類似の用語は、少なくとも約10%、約15%、約20%、約25%、約50%、約75%、約100%、約150%、約200%、約300%、約400%、約500%またはそれ以上の増加を示す。
【0040】
用語“エピジェネティック変化”とは、本明細書では、その細胞または生物のDNAの一次配列(すなわち、A、T、CおよびG)にコードされていない、生細胞、生物などにおける表現型の変化を意味するために用いられる。エピジェネティックな変化には、例えば、ヌクレオチドおよび/またはヒストン(すなわち、核内のDNAのコイル化およびパッケージングに関与するタンパク質)の化学的変化が含まれ得る。例示的なDNAヌクレオチド修飾には、一般的なエピジェネティックマーカーである5-メチルシチジン(5mC)およびその酸化産物である5-ヒドロキシメチルシチジン(5hmC)、5-ホルミルシチジン(5fC)、5-カルボキシメチルシチジン(5caC)などが含まれる。5mCは遺伝子サイレンシングにおけるその役割でよく知られているが、5mCの脱メチル化経路における酸化中間体5hmC、5fCおよび5caCの代謝機能を示唆する証拠が増えている。さらに代謝的に関連するDNA修飾には、酸化、アルキル化、二量体化、架橋、その他DNA損傷に関連する化学修飾ヌクレオチドがある。このようなDNA修飾は毒性(toxicity)を理解する上で重要であるが、損傷が生じた際のゲノム全体におけるその分布はよくわかっていない。DNA修飾は、例えばプロモーターおよびゲノムの他の領域におけるG-四重鎖の動態に関与するなど、さらなる制御的役割を担っている可能性がある。
【0041】
本明細書で用いる用語“エピトランスクリプトーム変化”とは、転写中または転写後に起こるRNAの化学修飾を意味する。核酸塩基、リボース、ホスホジエステル骨格への化学変化を含め、170以上の異なるRNA修飾が知られている。RNA修飾は、mRNA、tRNA、rRNA、lncRNA、miRNAなど、全てのRNAタイプに見出だされ、RNAの構造および動態を変化させたり、タンパク質など他の生体分子によるRNAの分子認識を変化させたりすることによって、細胞の表現型を変化させ得る。エピトランスクリプトームの天然化学RNA修飾は、RNAプロセシング、スプライシング、ポリアデニル化、編集、構造、安定性、局在化、翻訳開始、遺伝子発現など、RNA代謝における幅広い機能を制御している。エピトランススクリプトームは、細胞タイプ、代謝状態、健康状態によって異なり、細胞の表現型および機能の分化に重要な役割を果たし(しかし、あまり理解されていない)、同一の一次遺伝配列を有する同一生物の細胞間の劇的な表現型の違いを説明するのに役立っている。エピトランススクリプトームの変化は疾患と相関する。例えば、mRNAおよびncRNAの修飾は、がん幹細胞の分化過程において、時空間的な遺伝子発現の変化を制御することが知られており、それによって疾患の進行に組織化した役割を果たしている。さらに、RNA修飾は、RNAウイルス(例えば、コロナウイルス科およびフラビウイルス科)が宿主を裏切り、自然免疫系を回避する重要な機序であることが強く推測される。
【0042】
用語“ゲノム”とは、細胞または細胞集団に含まれるすべてのDNA、あるいは特定のタイプのDNA分子(例えば、コーディングDNA、非コーディングDNA、ミトコンドリアDNA、または葉緑体DNA)の選択を意味する。用語“トランスクリプトーム”とは、1つの細胞または細胞集団で産生されるすべてのRNA分子、あるいは完全なトランスクリプトームに含まれる特定の種類のRNA分子の選択(例えば、mRNA 対 ncRNA、またはmRNAトランスクリプトーム内の特定のmRNA)を意味する。いくつかの態様では、トランスクリプトームは、コーディングRNA(すなわち、タンパク質に翻訳されるRNA、例えばmRNA)および非コーディングRNAなどの複数の異なるタイプのRNAを含む。トランスクリプトーム中に見出される様々なタイプのRNA分子の限定されないリストには、修飾ヌクレオシドを含み得るものが含まれる:7SK RNA、シグナル認識粒子RNA、アンチセンスRNA、CRISPR RNA、ガイドRNA、ロング非コーディングRNA、マイクロRNA、メッセンジャーRNA、piwi相互作用RNA、リピート関連siRNA、レトロトランスポゾン、リボヌクレアーゼMRP、リボヌクレアーゼP、リボソームRNA、カハール小体(small Cajal body)特異的RNA、小干渉RNA、smY RNA、小核RNA、およびトランス作用siRNA。
【0043】
本明細書で用いる用語、核酸の“非カノニカルな特徴”とは、その一次配列とは別個の核酸の特徴を意味する。例えば、非カノニカルな特徴とは、DNAまたはRNA塩基、あるいはDNAまたはRNA骨格に対する化学的修飾であり得る。いくつかの態様では、非カノニカルな特徴は、ヘアピンまたはループのような構造配列であってもよい。他の例示的な非カノニカルな構造としては、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、脱塩基部位、三重鎖、三方向結合、十字形構造、四重ループ、リボースジッパー、シュードノットなどが挙げられるが、これらに限定されない。DNAおよびRNAを含む核酸は、多くの非カノニカルな特徴を含む。これらの修飾の頻度はRNAおよび特徴の種類によって大きく異なるが、修飾のクラスターが発生することもある。いくつかの態様では、非カノニカルな特徴はDNAおよび/またはRNAの損傷に起因し得る。本明細書で用いる用語“非カノニカルな特徴”および“改変”とは、当業者であれば文脈上理解されるように、互換的に使用できる。
【0044】
本明細書で用いる用語“標的核酸”とは、1以上の非カノニカルな特徴を含む核酸を意味する。本明細書に記載の核酸結合分子は、分子の結合ドメインが非カノニカルな特徴を認識するとき、標的核酸に結合できる。
【0045】
本明細書で用いる用語“基質”とは、何れかの固体支持体を意味するために用いられる。例えば、基質はビーズ、チップ、プレート、スライド、ディッシュ、ゲル、チューブ、フローセル、マトリックス、アレイ、マイクロ流体デバイスまたはそのコンポーネント、ウェル、カートリッジ、または3次元マトリックスなどである。本明細書に記載されているように、本明細書に記載の結合ドメインは、1以上の基質に結合してもよく、基質は1以上の結合ドメインに結合してもよい。さらに、本明細書に記載のアダプターは1以上の基質に結合してもよく、基質は1以上のアダプターに結合してもよい。基質は種々の材料で形成できる。いくつかの態様では、基質は樹脂、膜、繊維、ポリマーである。いくつかの態様において、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および/またはポリアクリルアミドを含む。いくつかの態様では、基質は合成ポリマーなどのポリマーを含む。合成ポリマーの限定されないリストには、ポリ(エチレン)グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸-コ-グリコール酸、ポリ(ε-カプロラクトン)(PCL)、ポリ乳酸、ポリ(3-ヒドロキシ酪酸-コ-3-ヒドロキシバレレート)(PHBV)、キトサンおよびセルロースが含まれる。
【0046】
本明細書で用いる用語“バーコード”とは、合成産生された核酸を意味する。固有のバーコードを特定の核酸修飾に割り当てて、本明細書に記載の方法においてそれらの修飾を特異的に同定できるようにしてもよい。したがって、バーコードは、本明細書に記載される1以上の方法において、その改変を同定するために特別に用いられるとき、非カノニカルな改変に対して“ユニーク”である。バーコードは、固相オリゴヌクレオチド合成など、当技術分野で知られている方法を用いて製造できる。ある態様では、バーコードはDNAバーコードであってもよい(すなわち、DNA配列を含んでいてもよい)。いくつかの態様において、バーコードは、ペプチド核酸(PNA)またはロック核酸(LNA)などの合成DNA構造を含んでいてもよい。いくつかの態様では、合成DNA構造は、1以上の修飾塩基を含んでいてもよい。ある態様では、合成DNA構造は、1以上の修飾塩基を含んでいてもよい。ある態様では、バーコードはRNAバーコードであってもよい(すなわち、RNA配列を含んでいてもよい)。バーコードはどのような長さであってもよく、例えば、約4から約150ヌクレオチド長の範囲であり得る。いくつかの態様において、バーコードは、約4~約20ヌクレオチド長、例えば、約4ヌクレオチド長、約5ヌクレオチド長、約6ヌクレオチド長、約7ヌクレオチド長、約8ヌクレオチド長、約9ヌクレオチド長、約10ヌクレオチド長、約11ヌクレオチド長、約12ヌクレオチド長、約13ヌクレオチド長、約14ヌクレオチド長、約15ヌクレオチド長、約16ヌクレオチド長、約17ヌクレオチド長、約18ヌクレオチド長、約19ヌクレオチド長、または約20ヌクレオチド長である。通常、バーコードは、既知の生物のゲノムにはない、合理的に設計された配列を含み得る。しかしながら、いくつかの態様では、バーコードは既知の配列を含み得る。例えば、バーコード配列は、病原体または他の生物学的物質に関連するシグネチャーを含み得る。ある態様では、バーコードは、配列決定反応を促進するように構成された配列を含んでいてもよい。用語“バーコード”および“アダプター”とは、本明細書で互換的に用いられ得る。当技術分野で理解されるように、アダプターは、いくつかの態様では、バーコードで構成される。いくつかの態様では、アダプターは、以下に説明され、図12A-12Dに示されるように、バーコードおよび1以上の追加要素を含み得る。
【0047】
用語“増幅”とは、核酸に関して使われるとき、その核酸のコピーを生成することを意味する。核酸は、例えばポリメラーゼ連鎖反応(PCR)を用いて増幅できる。核酸増幅の代替法としては、ヘリカーゼ依存性増幅(HAD)、リコンビナーゼポリメラーゼ増幅(RPA)、ループ介在等温増幅(LAMP)、核酸配列ベース増幅(NASBA)、自家持続配列複製法(3SR)およびローリングサークル増幅(RCA)などが含まれる。
【0048】
本明細書で用いる用語“結合(coupled)”とは、互いに関連する2以上の構成要素を表すために用いられ得る。例えば、第2の成分に結合した第1の成分は、共有結合または非共有結合で結合しているか、あるいは他の方法で結合している。
【0049】
本明細書で用いる用語“複合体内アダプタートランスファー”または“複合体内バーコードトランスファー”とは、結合ドメインおよびアダプターが結合している間に、アダプターおよび/またはバーコードが標的核酸(例えば、DNAまたはRNA)にトランスファーすることを意味する。したがって、本明細書中、用語“複合体”とは、標的核酸、結合ドメイン、およびその同族アダプターの間に形成される複合体を意味する。
【0050】
本明細書で用いる用語“クロストーク”、“バーコードクロストーク”、および同様の用語は、核酸バーコードの標的外トランスファーを意味する。例えば、バーコードのクロストークは、アダプターのバーコードが、核酸結合分子の結合ドメインに結合していない核酸にトランスファーされるとき、バーコードのクロストークが起こり得る。
【0051】
用語“DNAアドレス”とは、プログラム可能な結合エレメントとして用いられ、特定の結合事象を促進するDNAまたはRNA配列および/またはその相補体を意味する。例えば、デアミナーゼは、標的DNAまたはRNA配列(例えば、第2のDNAアドレス)に結合するDNAまたはRNA配列(すなわち、第1のDNAアドレス)に結合し、デアミナーゼをそこに誘導できる。
【0052】
“DNA損傷”または“RNA損傷”などの“核酸損傷”は、内因性プロセスおよび/または外因性薬剤の結果として起こりうる核酸の化学的修飾である。例えば、DNA損傷は、酸化的損傷(8-オキソグアニンなど)、炭化した肉およびタバコの煙に含まれるような親電子物質およびアルキル化剤との反応(ベンゾ[a]ピレン付加物およびアルキル化核酸塩基)、紫外線損傷(シクロブタンピリミジン二量体および6-4ピリミジン-ピリミジン光生成物)、金属錯体形成(水銀錯体およびプラチナ架橋)などによって引き起こされる。内因性プロセスによって生じるDNA損傷は頻繁に起こる。DNA損傷は通常、様々な修復酵素によって修復されるか、遺伝暗号の複製中に損傷バイパスポリメラーゼによってバイパスされる。不自然な細胞増殖および成長をもたらす突然変異は、がん発生を駆動する。変異は通常のDNA配列決定で容易に検出できるが、損傷自体は標準的なDNA配列決定ワークフローでは検出できない。損傷はゲノム全体に一様に分布しているわけではなく、修復の効果はDNA遺伝子座および細胞状態に関連している。さらに、最も一般的ながん化学療法薬(シスプラチン、ゲムシタビンなど)はDNA損傷を誘発し、そのため、ヒトゲノム全体のDNA損傷をマッピングすることは、老化と癌の病因を理解し、癌化学治療薬の有効性を向上させ、毒性を低下させるための大きな可能性を提供する。
【0053】
表面構造および組成
本明細書には、核酸上の非カノニカルな特徴を同定するためのアダプターおよび結合ドメインを含む組成物が記載されている。本明細書に記載の組成物は、基質上に空間的に分離した結合ドメインおよびアダプターの異なる表面構造を含む。
【0054】
ある態様では、本明細書に記載の結合ドメインは基質に結合している。ある態様では、結合ドメインは基質に直接結合している。ある態様では、結合ドメインはリンカーに結合され、リンカーは基質に結合されている。ある態様では、結合ドメインは基質に共有結合している。ある態様では、結合ドメインは基質に非共有結合している。
【0055】
ある態様では、本明細書に記載のアダプターは基質に結合している。ある態様では、アダプターは基質に直接結合している。ある態様では、アダプターはリンカーに結合され、リンカーは基質に結合されている。ある態様では、アダプターは基質に共有結合している。ある態様では、アダプターは基質に非共有結合している。
【0056】
ある態様において、本発明は、基質、アダプター、および結合ドメインを含む組成物を提供する。ある態様において、組成物は、図1Aに示すように、基質、結合ドメインおよびアダプターを含む。ある態様では、組成物は、基質に直接結合した結合ドメイン、および基質に直接結合したアダプターを含む。ある態様では、組成物は、リンカーを介して基質に結合する結合ドメイン、および基質に直接結合したアダプターを含む。ある態様では、組成物は、基質に直接結合した結合ドメイン、およびリンカーを介して基質に結合するアダプターを含む。いくつかの態様では、組成物は、第1のリンカーを介して基質に結合する結合ドメイン、および第2のリンカーを介して同じ基質に結合するアダプターを含む。
【0057】
ある態様において、組成物は、
i)基質、
ii)第1のリンカーを介して該基質に結合する結合ドメイン、および
iii)第2のリンカーを介して該基質に結合するアダプター、
を含む。ある側面では、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、そしてアダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0058】
いくつかの態様において、本発明は、第2の認識エレメント、基質、結合ドメイン、およびアダプターを含む組成物を提供する。
【0059】
ある側面において、本発明は、本明細書に開示され、図面に示される組成物およびコンジュゲートを製造する1以上の方法を含む。一側面において、この方法は、1以上のアダプターを基質に直接的または間接的に結合させること、および1以上の結合ドメインを基質に直接的または間接的に結合させることを含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。例えば、図1Aを参照のこと。
【0060】
一側面において、前記製造方法は、1以上の第2の認識エレメントを基質に直接的または間接的に結合させること、および1以上の結合ドメインを1以上の第2の認識エレメントに直接的または間接的に結合させること、および1以上のアダプターを1以上の第2の認識エレメントに直接的または間接的に結合させることを含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。例えば、図1Bを参照のこと。
【0061】
一側面において、前記製造方法は、1以上の第2の認識エレメントを基質に直接的または間接的に結合させること、および1以上の結合ドメインを基質に直接的または間接的に結合させること、および1以上のアダプターを1つ以上の第2の認識エレメントに直接的または間接的に結合させること、または1以上のアダプターを基質に直接的または間接的に結合させることを含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。例えば、図1Cを参照のこと。一側面において、製造方法は、1以上の第2の認識エレメントを基質に直接的または間接的に結合させること、および1以上の結合ドメインを第2の認識エレメントに直接的または間接的に結合させること、および1以上のアダプターを基質に直接的または間接的に結合させることを含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。
【0062】
一側面では、製造方法は、2種以上の第2の認識エレメントを基質に直接的または間接的に結合させること、および1種以上の結合ドメインを第2の認識エレメントの少なくとも1種に直接的または間接的に結合させること、および1種以上のアダプターを1種以上の第2の認識エレメントに直接的または間接的に結合させることを含み、ここで、何れかの間接的結合はリンカーを介していてもよい。例えば、図1Dを参照のこと。
【0063】
一側面において、製造方法は、1以上の第2の認識エレメントを基質に直接的または間接的に結合させること、および2以上の結合ドメインを第2の認識エレメントに直接的または間接的に結合させること、および1つの結合ドメイン種がアダプターで標識され、かつ核酸と結合せず、一方、1以上の他の結合ドメイン種が核酸の非カノニカルな特徴に特異的であり標識されないように、1以上のアダプターを結合ドメインの一部に直接的または間接的に結合させることを含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。例えば、図1Eを参照のこと。
【0064】
一側面において、製造方法は、2以上の異なるタイプの切断可能なアダプターを基質に直接的または間接的に結合させること、および1以上の捕捉分子を基質に直接的または間接的に結合させること、および捕捉分子の捕捉配列に相補的な核酸が捕捉分子とハイブリダイズするように、捕捉分子の捕捉配列に相補的な核酸に結合した1以上の結合ドメインを提供することを含み、ここで、何れかの間接的結合はリンカーを介していてもよい。例えば、図1Fを参照のこと。
【0065】
一側面では、製造方法は、2つのモザイクエンド(ME)含有アダプター分子を担持したトランスポザーゼ二量体を含むトランスポソームを形成すること、トランスポソームを基質に直接的または間接的に結合させること、1以上の第2の認識エレメントを基質に直接的または間接的に結合させること、1以上の結合ドメインを第2の認識エレメントに直接的または間接的に結合させることを含み、ここで、何れかの間接的結合はリンカーを介していてもよい。例えば、図1Gを参照のこと。一側面では、製造方法は、2つのモザイクエンド(ME)含有アダプター分子を担持したトランスポザーゼ二量体を含むトランスポソームを形成すること、トランスポソームを基質に直接的または間接的に結合させること、および1以上の結合ドメインを基質に直接的または間接的に結合させることを含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。
【0066】
一側面では、製造方法は、第2の認識エレメントを基質に直接的または間接的に結合させること、Tn5をプロテインAに融合してTn5-プロテインA融合タンパク質を形成すること、融合タンパク質の二量体を形成すること、Tn5-プロテインA融合タンパク質の二量体にMEアダプターを負荷すること、結合ドメインを第2の認識エレメントに結合させること、融合タンパク質のプロテインAを結合ドメイン(例えば、抗体のFc領域)に結合させること、を含み、ここで、何れかの間接的な結合はリンカーを介していてもよい。例えば、図1Hを参照のこと。一側面において、製造方法は、第2の認識エレメントを基質に直接的または間接的に結合させること、Tn5をプロテインAに融合してTn5-プロテインA融合タンパク質を形成すること、融合タンパク質の二量体を形成すること、Tn5-プロテインA融合タンパク質の二量体にMEアダプターを負荷すること、結合ドメインを基質に直接的または間接的に結合させること、融合タンパク質のプロテインAを結合ドメイン(例えば、抗体のFc領域)に結合させること、を含み、ここで、何れかの間接的な結合はリンカーを介して行われる。
【0067】
いくつかの態様では、組成物は、第2の認識エレメント、基質、結合ドメインおよびアダプターを含み、アダプターは図1Bに示されるように第2の認識エレメントに結合している。いくつかの態様では、組成物は、第2の認識エレメント、基質、結合ドメインおよびアダプターを含み、アダプターは図1Cに示されるように第2の認識エレメントに結合している。いくつかの態様では、組成物は、基質に直接結合された第2の認識エレメントを含む(図1C)。いくつかの態様では、組成物は、例えばリンカーを介して、基質に間接的に結合した第2の認識エレメントを含む(図1B)。いくつかの態様では、組成物は、基質に直接結合された第2の認識エレメント、および第2の認識エレメントに直接結合されたアダプターを含む。いくつかの態様では、組成物は、リンカーを介して基質に結合された第2の認識エレメント、および基質に直接結合されたアダプターを含む。いくつかの態様では、組成物は、第1のリンカーを介して基質に結合された第2の認識エレメント、および第2のリンカーを介して基質に結合されたアダプターを含む。
【0068】
いくつかの態様において、組成物は、
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)第2の認識エレメントに結合するアダプター、および
iv)結合ドメイン
を含む。ある側面において、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、結合ドメインは第2の認識エレメントによって固定化され、そしてアダプターは、結合ドメインによって特異的に結合された非カノニカルな特徴に特異的な核酸バーコード配列を含む。
【0069】
いくつかの態様では、第2の認識エレメントは単一の結合ドメインに結合できる。いくつかの態様では、第2の認識エレメントは、複数種の異なるタイプの結合ドメインに結合できる。ある側面において、第2の認識エレメントは、ストレプトアビジン、アビジン、ニュートラビジン、または類似の分子である。ある側面では、第2の認識エレメントはプロテインG、プロテインA、プロテインL、その変異体、または抗体である。
【0070】
いくつかの態様において、組成物は、
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)第2の認識エレメントに結合するアダプター、および
iv)結合ドメイン
を含む。ある側面において、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成され、結合ドメインは第2の認識エレメントによって固定化され、アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む。ある側面では、組成物は、基質に直接的にまたはリンカーを介して結合したアダプターを代替的またはさらに含む。
【0071】
いくつかの態様において、組成物は複数の第2の認識エレメントを含み、複数の第2の認識エレメントは互いに異なる第2の認識エレメントを含み、ここで、アダプターは複数の第2の認識エレメントの1つに結合され、かつ結合ドメインは異なる第2の認識エレメントに結合されている。
【0072】
いくつかの態様において、組成物は複数の第2の認識エレメントを含み、ここで、アダプターは複数の第2の認識エレメントの1つに結合され、かつ結合ドメインは同じ第2の認識エレメントの別の部分(instance)に結合される。
【0073】
いくつかの態様において、組成物は、
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)第2の認識エレメントを介して基質に結合する結合ドメイン、
iv)リンカーを介して基質に結合するアダプター、
を含む。いくつかの態様では、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成され、アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0074】
いくつかの態様において、組成物は、
i)基質、
ii)基質に結合された第2の認識エレメント、
iii)リンカーを介して基質に結合する結合ドメイン、
iv)第2の認識エレメントを介して基質に結合するアダプター、
を含む。いくつかの態様では、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合するように構成され、アダプターは非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0075】
いくつかの態様では、組成物は、基質、捕捉分子、アダプター、および結合ドメインを含む。いくつかの態様において、組成物は、図1Fに示す基質、捕捉分子、アダプター、および結合ドメインを含む。いくつかの態様では、結合ドメインは捕捉分子によって固定化される。
【0076】
いくつかの態様において、組成物は、
i)基質、
ii)基質に結合した捕捉分子、
iii)基質に結合されたアダプター、および
iv)捕捉分子を介して基質に固定化された結合ドメイン
を含む。
【0077】
いくつかの態様では、捕捉分子は、図1Fに示すような捕捉分子である。いくつかの態様では、捕捉分子は基質に直接結合される。いくつかの態様では、捕捉分子はリンカーを介して基質に結合する。いくつかの態様では、捕捉分子はオリゴヌクレオチドであり、例えば、それに結合した相補的オリゴヌクレオチド配列に結合することによって結合ドメインを捕捉できるオリゴヌクレオチドである。いくつかの態様では、捕捉分子はポリエチレングリコールであり、DBCO、アジド、アルキン、mTETまたはTCOなどのペンダントクリック化学基を有する。
【0078】
いくつかの態様では、捕捉分子は共有結合または非共有結合機序によって結合ドメインの捕捉をもたらし得る。例えば、共有結合捕捉は、生体直交化学(biorthogonal chemistry)(DBCO/アジド、アルキン/アジド、mTet/TCOなど)を用いることで達成できる。非共有結合捕捉は、結合ドメイン上の特定の結合部位を標的とするタンパク質ベースの捕捉分子によって達成される。
【0079】
いくつかの態様において、組成物は、
i)基質、
ii)基質に結合した捕捉分子、
iii)基質に結合されたアダプター、および
iv)結合ドメイン
を含み、ここで、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、結合ドメインは捕捉分子によって固定化され、かつアダプターは、結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0080】
ある側面において、本発明は、以下を含む組成物を含む:
i)基質、
ii)第1のリンカーまたは第2の認識エレメントを介して基質に結合する結合ドメイン、
iii)第2のリンカーまたは第2の認識エレメントを介して基質に結合するモザイク末端(ME)アダプター、および
iv)トランスポザーゼ、
ここで、前記トランスポザーゼは固定化MEアダプターに負荷され、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記MEアダプターの少なくとも1つは、非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0081】
ある側面において、本発明は、以下を含む組成物を含む:
i)基質、
ii)リンカーまたは第2の認識エレメントを介して基質に結合する結合ドメイン、および
iii)結合ドメインと結合したトランスポザーゼ、
ここで、前記トランスポザーゼはMEアダプターに負荷され、前記結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつ前記MEアダプターの少なくとも1つは、非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0082】
いくつかの態様において、組成物は、基質、第1のリンカーを介して基質に結合されるか、または基質に直接的または間接的に結合される第2の認識エレメントに結合される結合ドメイン、第2のリンカーを介して基質に結合されるモザイク末端(ME)アダプター、およびトランスポザーゼを含み、ここで、トランスポザーゼはMEアダプターに負荷され、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつアダプターは結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含む。例えば、図1Gを参照のこと。いくつかの態様では、トランスポザーゼはTn5トランスポザーゼである。図1Hは、Tn5-プロテインA融合タンパク質の二量体をMEアダプターで負荷し、プロテインAと抗体のFc領域との親和性結合を介して抗体に結合したものを示す。いくつかの態様において、組成物は、基質、基質に結合された複数の第2の認識エレメント、複数の第2の認識エレメントの1つに結合されたアダプター、および複数の第2の認識エレメントの別の1つに結合された結合ドメインを含み、ここで、結合ドメインは、DNAまたはRNAの非カノニカルな特徴に特異的に結合し、かつアダプターは、結合ドメインによって特異的に結合された非カノニカルな特徴に固有の核酸バーコード配列を含む。例えば、図1Dを参照のこと。ある側面において、組成物は、例えば図15Cに示すように、基質としてビーズを含む。本明細書に記載の組成物の側面のいずれかによれば、組成物は、結合ドメインに対して1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍過剰のアダプターを含み得る。このような比率は、副生成物を最小限に抑えながら、効率的なバーコーディング収量を提供する。
【0083】
また、本明細書には、本発明の1以上の結合ドメインを含む組成物も提供される。いくつかの態様では、組成物は2以上の異なる結合ドメインを含む。例えば、組成物は、第1の非カノニカルな特徴に結合する第1の結合ドメイン、および第2の非カノニカルな特徴に結合する第2の結合ドメインを含み得る。いくつかの態様において、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、71、80、90、100、125、150、175、または200以上の異なるタイプの結合ドメインを含む。
【0084】
また、本明細書には、1以上の結合ドメインおよび1以上のアダプターを含む組成物が提供され、各アダプターは、各結合ドメインによって特異的に結合される非カノニカルな特徴に特異的な核酸バーコード配列を含む。例えば、2つの結合ドメインおよび2つのアダプターを含む組成物では、第1のアダプターは、第1の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含み、第2のアダプターは、第2の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0085】
いくつかの態様において、本発明の組成物は、1以上の基質を含む。いくつかの態様では、組成物は2つの基質を含む。いくつかの態様では、組成物は1個、2個、3個、4個、5個またはそれ以上の基質を含む。
【0086】
本明細書に記載の組成物は、いくつかの態様において、塩基編集酵素をさらに含み得る。いくつかの態様では、塩基編集酵素はアデノシンデアミナーゼ、シトシンデアミナーゼ、グリコシラーゼ、メチラーゼ、デメチラーゼ、またはジオキシゲナーゼである。いくつかの態様では、塩基編集酵素は塩基を除去する酵素、例えばグリコシラーゼである。塩基編集酵素は、例えば結合ドメインに結合させることができる。結合ドメインに結合した塩基編集酵素を有することで、酵素は結合ドメインに結合した標的核酸に近接する。その後、塩基編集酵素は標的核酸を編集できる。核酸が増幅され、配列決定された後、編集された塩基の位置が決定され、結合ドメインが標的核酸に結合した位置(すなわち、標的核酸上の非カノニカルな特徴の位置)を測定するために使用され得る。
【0087】
いくつかの態様では、塩基編集酵素は結合ドメインに共有結合している。例えば、塩基編集酵素を結合ドメインに融合させることができる(すなわち、融合タンパク質として)。ある態様では、塩基編集酵素は、塩基編集酵素と結合ドメインの両方に融合したリンカーを介して結合ドメインに共有結合していてもよい。いくつかの態様では、塩基編集酵素は標的部分を介して結合ドメインに結合される。標的部分は、例えば、ペプチドタグ、タンパク質タグ、二次抗体、核酸配列、または生体直交型反応基(bioorthogonal reactive group)から選択できる。一つの例示的な態様では、塩基編集酵素を二次抗体に結合させることができ、二次抗体は結合ドメイン(例えば、一次抗体)を認識する。いくつかの態様において、標的部分は、プロテインA、プロテインL、またはプロテインGである。いくつかの態様において、標的部分は、塩基編集酵素に結合した核酸であり、塩基編集酵素に結合した核酸は、結合ドメインに結合した核酸と相補的である。
【0088】
いくつかの態様において、本明細書に記載の組成物は、1以上の担体、賦形剤、緩衝剤などを含む。組成物は、約0.5、約1.0、約1.5、約2.0、約2.5、約3.0、約3.5、約4.0、約4.5、約5.0、約5.5、約6.0、約6.5、約7.0、約7.5、約8.0、約8.5、約9.0、約9.5、約10.0、約10.5、約11.0、約11.5、約12.0、約12.5、約13.0、約13.5、または約14.0のpHを有し得る。いくつかの態様では、組成物は医薬組成物である。
【0089】
アダプター
本明細書で用いる用語“アダプター”とは、DNAまたはRNA分子の末端に結合でき、何らかの機能を付与する何れかの短い核酸配列を意味する。例えば、いくつかの態様では、アダプターはDNAまたはRNA分子の配列決定および/または同定を容易にできる。ある態様では、アダプターは、DNA、RNA、あるいはDNAおよびRNAの混合配列である。いくつかの例では、核酸アダプターは、骨格修飾、例えばロック核酸(LNA)、ペプチド核酸(PNA)、グリコール核酸(GNA)、ホスホロチオエート、2’-フルオロリボース、2’-メトキシリボースホスホロジチオエート、メチルホスホネート、ホスホロアミデート、グアニジノプロピルホスホロアミデート、トリアゾール、グアニジニウム、モルホリノ、スレオース核酸(TNA)またはヘキシトール核酸(HNA)から選択される1以上の骨格修飾を含む。
【0090】
ある態様では、アダプターは5’リン酸を含む。いくつかの態様では、アダプターは3’リン酸を含む。ある態様では、アダプターは5’リン酸および3’リン酸を含む。いくつかの態様では、アダプターは一本鎖である。いくつかの態様では、アダプターは二本鎖である。いくつかの態様では、二本鎖アダプターは、相補的オリゴヌクレオチドにハイブリダイズした一本鎖アダプターを含み得る。
【0091】
いくつかの態様では、アダプターは切断可能である。例えば、アダプターは1以上の切断部位を含んでいてもよい。開裂部位は、例えば、1個以上のウラシル塩基、酵素(例えば、制限酵素または他のヌクレアーゼ)によって認識される配列、または合成化学部分を含み得る。いくつかの態様では、図1Fに示すように、アダプターは切断可能である。いくつかの態様では、リンカーは、例えばジスルフィド、カテプシンB切断部位、光切断などを用いた化学的または酵素的切断によって切断される。ある態様では、アダプターはアダプター内の部位で切断される。例えば、制限部位で(二本鎖形成が必要)、ウラシル/USER酵素を用いて、8-oxoG/FPG酵素を用いて、あるいは光切断可能なリン酸骨格修飾を介してなどである。
【0092】
いくつかの態様では、アダプターはユニバーサルフォワードプライマー(UFP)を含む。いくつかの態様において、アダプターはユニバーサルリバースプライマー(URP)を含む。いくつかの態様では、アダプターはUFPおよびURPを含む。いくつかの態様では、アダプターはUFPまたはURPを含む。UFP配列およびURP配列は、天然には存在しないDNA配列であり、標的核酸(またはそのコピー)に導入された配列のみを選択的に増幅できる。配列決定中、UFPおよび/またはURPはDNA標的にアニールされ、新しいDNA分子(すなわち、そのコピー)の伸長のための開始部位を提供する。例示的なUFPおよびURPのリストは、lslabs.com/resources/universal-primer-listのワールドワイドウェブアドレスで見ることができる。いくつかの態様において、アダプターに用いられる(そして標的核酸にトランスファーされる)ユニバーサルプライマー配列は、確立されたDNA配列決定プラットフォームと互換性があり、下流のPCR反応においてIllumina P5およびP7のような表面アダプターを導入するために用いられ得る。
【0093】
いくつかの態様では、アダプターは、修飾コード化バーコード(MBC)などのバーコードを含んでいてもよい。MBCは短いユニークな核酸配列である。各MBCは、特定のエピジェネティック修飾またはエピトランススクリプトーム修飾に関連して用いられ、その同定および/または解析に役立つ。例えば、MBCは、特定の非カノニカルな特徴に特異的な結合ドメインに結合したアダプターに用いられ得る。いくつかの態様では、アダプターはバーコードで構成され得る。いくつかの態様では、アダプターはMBCで構成され得る。
【0094】
いくつかの態様では、アダプターは固有の分子バーコード(UMI)を含み得る。UMIは、4 [UMIの長さ] 個のユニークな変異体を有する短いランダム配列で構成されている。例えば、10塩基長のUMIは1,048,576(410)のユニークな分子をコードできる。UMIは、PCR増幅バイアスおよびエラーを補正するために、配列決定リードの絶対的定量に用いられる。例えば、RNAサンプルは100コピーの転写産物Aおよび100コピーの転写産物Bを含み得る。転写産物Bの方がより効率的に増幅するため、PCR増幅後、1Mコピーの転写産物Aおよび2Mコピーの転写産物Bが検出され得る。転写産物Aに対してUMIを使用するとき、100UMI変異体の10,000コピーが検出され、転写産物Bに対しては100 UMI変異体の20,000コピーが検出される。リード数を数える代わりにUMI変異体の数を数えることで、分子の絶対数がわかる。
【0095】
いくつかの態様では、アダプターは1以上の非天然核酸塩基を含む。いくつかの態様において、1以上の非天然核酸塩基は、Gクランプ(9-(2-アミノエトキシ)-3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、tC(3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、tC(3H-ベンゾ[b]ピリミド[4,5-e][1,4]オキサジン-2(10H)-オン)、イノシン、スーパーT(5-ヒドロキシブチニル-2’-デオキシウリジン)、スーパーG(8-アザ-7-デアザグアノシン)、ウラシル、または8-オキソ-Gから独立して選択される、
【0096】
いくつかの態様では、アダプターはその3’末端に2以上のランダム塩基、例えば1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはそれ以上、あるいは2-12、または3-8、または4-6のランダム塩基を含む。ある側面において、本発明は、そのようなランダム塩基を用いてバーコードを導入するためにRNAをランダムプライミングする方法を含む。この方法では、バーコーディング工程の前に、標的核酸にスペーサー配列をライゲーションする必要がない。
【0097】
ある側面では、アダプターは3’または5’ブロッキング基を含む。ある側面において、3’または5’ブロッキング基は、ジデオキシリボース、リン酸、逆塩基またはリンカーから独立して選択される。
【0098】
図12A-12Dは、例示的な核酸アダプターの構造を示しており、凡例はそこで使用されている各要素の説明を提供する。これらのアダプターには、参照を容易にするため、タイプA、タイプB、タイプCおよびタイプDのラベルが付けられている。
【0099】
図12Aに示すアダプター(タイプA)は、UFP配列またはURP配列のいずれかを含み得る最小限のアダプターを表す。タイプAアダプターは、非カノニカルな核酸機能の同定または分析に使用できる配列を含まず、代わりにライブラリー構築に用いられる。いくつかの態様では、タイプAアダプターは非カノニカルな特徴を含まない核酸分子に結合される。いくつかの態様では、タイプAアダプターは、標的核酸の他端にバーコード化アダプターを導入した後、非カノニカルな特徴を含む核酸分子に結合される。例えば、タイプAアダプターは、1以上のバーコードが付加された後、PCR増幅のために核酸をキャップし、調製するために使用できる。
【0100】
図12B-12Dに示したアダプターはそれぞれ、非カノニカルなDNA/RNAの1つの特徴(例えば、修飾塩基)に特異的なMBCを含む。図12Bに示すように、タイプBアダプターは、cDNAの環化を伴うライブラリー調製ワークフローに使用できる。これらは切断部位(CLS)を含む。タイプBアダプターの切断はPCR増幅前に行ってもよい。図12Cに示すように、タイプCアダプターはCLSを欠き、ユニバーサルプライマー領域を1つだけ含んでいる。タイプCアダプターは、例えばライゲーション反応によるバーコード導入に使用できる。これらは、Smart-Seq技術によるテンプレートスイッチングオリゴヌクレオチドまたは他のアダプターライゲーションなどの第二鎖合成法と組み合わせてもよい。図12Dに示すように、タイプDアダプターはプライマー伸長によるエンコード用に特別に設計されている。タイプDアダプターは、3’末端スペーサー(SP)を1つ、あるいは両端に2つのスペーサー領域(例えばSP1、SP2)を有する。反応は、短いスペーサー領域(SP)を標的核酸の3’末端にライゲーションし、相補的スペーサーを有するタイプDアダプターを結合させることによって開始される。スペーサーは、すべての核酸結合分子およびサイクルにわたって普遍的であってもよく、核酸結合分子の各タイプに固有であってもよく、またはバーコード化の各サイクルに固有であってもよい。いくつかの態様では、アダプターは、1つ、2つ、3つ、または4つのスペーサーを含む。いくつかの態様では、アダプターは1つのスペーサーを含む。いくつかの態様では、アダプターは2つのスペーサーを含む。いくつかの態様において、スペーサーは、3ヌクレオチド長、4ヌクレオチド長、5ヌクレオチド長、6ヌクレオチド長、7ヌクレオチド長、8ヌクレオチド長、9ヌクレオチド長、10ヌクレオチド長、11ヌクレオチド長、12ヌクレオチド長、13ヌクレオチド長、14ヌクレオチド長、15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長または20ヌクレオチド長である。いくつかの態様において、スペーサーは6ヌクレオチド長である。いくつかの態様において、スペーサーは7ヌクレオチド長である。いくつかの態様では、スペーサーは8ヌクレオチド長である。タイプDアダプターは、例えば、プライマー伸長反応による1回のバーコード転写、または複数の連続したバーコード転写に使用できる。複数サイクルのバーコーディングは、各サイクルにおいて1つだけ、または非カノニカルな特徴のサブセットだけを調べるために使用できる。例えば、第1のコード化サイクルでは、m5Cに特異的な核酸結合分子を用いることができる。第2のコード化サイクルでは、m6Aに特異的な核酸結合分子を用いることができる。第3のコード化サイクルは、イノシンなどに特異的な核酸結合分子を用いることができる。別の態様では、第1サイクルはm5Cおよびm6Aを調べ、第2サイクルはイノシンを調べることができる。別の態様では、第1のエンコード化サイクルはすべての非カノニカルな特徴を試用し、第2のエンコード化サイクルはすべての非カノニカルな特徴を2回目に試用し得る。
【0101】
いくつかの態様では、アダプターはUFP、URP、またはUFPおよびURPを含む。いくつかの態様では、アダプターはUFPおよび/またはURPを含み、さらにMBCも含む。いくつかの態様では、アダプターは、UFPおよび/またはURP、MBC、およびUMIを含む。いくつかの態様では、アダプターは、UFPおよび/またはURP、MBC、UMIおよびCLSを含む。いくつかの態様では、アダプターは、UFPおよび/またはURP、MBC、UMI、CLS、およびSPを含む。いくつかの態様では、アダプターは、UFP、CLS、URP、UMI、およびMBCを含む。いくつかの態様では、アダプターは、UFP、UMI、およびMBCを含む。いくつかの態様では、アダプターは、URP、UMI、およびMBCを含む。いくつかの態様では、アダプターは、第1のSP、MBC、UMI、および第2のSPを含む。
【0102】
本明細書に記載のアダプターは、いくつかの態様では、結合ドメインとアダプターの連結を補助するリンカーなど、1以上のリンカーを含んでいてもよい。リンカーとしては、ポリエチレングリコール、炭化水素、ペプチド、DNAまたはRNAが挙げられる。リンカーの長さは様々である。DNAまたはRNAの非カノニカルな特徴が核酸配列の5’末端または3’末端から離れた場所にある場合には、より長いリンカーを使用できる。より短いリンカーは、DNAまたはRNAの非カノニカルな特徴が核酸配列の5’末端または3’末端に比較的近い位置にある場合に使用される。
【0103】
いくつかの態様では、アダプター、またはその中に含まれるリンカー配列は切断可能である。例えば、アダプターは1以上の切断部位を含んでいてもよい。アダプターは化学的、光化学的、酵素的に切断可能であってもよい。開裂部位は、例えば、1個または数個のウラシル塩基、酵素(例えば、制限酵素または他のヌクレアーゼ)によって認識される配列、または合成化学部分、例えば、ジスルフィド、炭酸エステル、ヒドラゾン、シス-アコニチル、または(β-グルクロニド)を含み得る。
【0104】
以下にさらに詳しく述べるように、アダプターは、バーコード転移反応を用いて、一本鎖または二本鎖の標的核酸(例えば、DNAまたはRNA)に融合させることができる。
【0105】
いくつかの態様において、プライマー伸長によるバーコード化は、RNA標的に3’ポリ-rAテールを付加することを含む。3’ポリ-rAテールは、何れかの公知のポリ(A)ポリメラーゼ(例えば、大腸菌ポリ(A)ポリメラーゼ)を用いたポリアデニル化によって付加される。いくつかの態様では、RNA標的はポリ(A)ポリメラーゼおよび競合ポリdTオリゴヌクレオチドと共にインキュベートされる。ポリ(A)ポリメラーゼと競合するポリdTオリゴヌクレオチドとの共処理は、付加された3’ポリ-rAテールの長さを制御する。通常、ポリアデニル化によって、平均3’ポリ-rAテール長は約150塩基となる。いくつかの態様において、3’ポリ-rAテールの長さは、約5塩基長、約10塩基長、約15塩基長、約20塩基長、約25塩基長、約30塩基長、約35塩基長、約40塩基長、約45塩基長、約50塩基長、約55塩基長、または約60塩基長である。
【0106】
いくつかの態様では、プライマー伸長は、3’ポリ-UテールをRNA標的に付加することを含む。3’ポリ-Uテールは、公知のポリ(U)ポリメラーゼ(例えば、分裂酵母;Schizosaccharomyces pombe Cid1)を用いてポリウリジル化によって付加される。いくつかの態様では、3’ポリUテールの長さは、約5塩基長、約10塩基長、約15塩基長、約20塩基長、約25塩基長、約30塩基長、約35塩基長、約40塩基長、約45塩基長、約50塩基長、約55塩基長、または約60塩基長である。
【0107】
いくつかの態様では、アダプターは、表4に提供されている配列番号1-5のいずれか1つを含む。いくつかの態様では、アダプターは配列番号1を含む。いくつかの態様では、アダプターは配列番号2を含む。いくつかの態様では、アダプターは配列番号3を含む。いくつかの態様では、アダプターは配列番号4を含む。いくつかの態様では、アダプターは配列番号5を含む。いくつかの態様において、表4に示すアダプター、またはそれに対して1個、2個、3個、4個または5個のアミノ酸置換を有する配列を含む。
【0108】
いくつかの態様では、本明細書に記載のアダプターは、5’-アミン部分(5AmMC6)を含む。いくつかの態様では、アダプターは3’アミノ部分(3AmMO)を含む。いくつかの態様では、アダプターは18原子のヘキサエチレングリコールスペーサー(iSp18)を含む。いくつかの態様では、アダプターは、USER酵素(NEB)の切断によって基質表面から遊離するためのフィラーATリピートに囲まれた1個のウラシルを含む。いくつかの態様では、アダプターは8塩基バーコードを含む。
【0109】
いくつかの態様において、本明細書に記載のアダプターは、TCO-PEG4-NHSエステルで基質に官能基化される。いくつかの態様では、アダプターはプロテインG、AまたはLを用いて基質に固定化される。
【0110】
【表1-1】

【表1-2】

【表1-3】

【表1-4】
【0111】
結合ドメイン
本明細書で用いる用語“結合ドメイン”とは、修飾ヌクレオシドのような標的核酸の非カノニカルな特徴に結合する核酸、ポリペプチドなどを意味する。用語“結合ドメイン”は、当業者には文脈から理解され得るように、本明細書中、“結合剤”、“認識エレメント”、“抗体”などの用語と互換的に用いられ得る。いくつかの態様では、結合ドメインは標的核酸の非カノニカルな特徴に結合する。いくつかの態様では、結合ドメインは、非カノニカルな特徴に隣接する何れかの核酸特徴にも結合しない。いくつかの態様において、結合ドメインは、(i)標的核酸の非カノニカルな特徴、および(ii)非カノニカルな特徴に隣接する1以上の核酸特徴(例えば、核酸塩基、糖、リン酸、またはそれらの組み合わせ)の両方に結合する。いくつかの態様では、結合ドメインは保存配列モチーフに結合し得る。例えば、mAはしばしば以下のモチーフに生じる:GG(mA)CT。したがって、結合ドメインがmAに結合するとき、それに隣接する1以上の核酸(例えば、GGまたはCT)にも結合し得る。別の例として、結合ドメインはtRNAのアンチコドンループの全部または一部に結合できる。
【0112】
本明細書に記載の核酸結合分子は、1以上の結合ドメインを含み、結合ドメインはDNAまたはRNAの非カノニカルな特徴に特異的に結合する。本明細書に記載される結合ドメインは、標的核酸の非カノニカルな特徴を認識して結合できるタンパク質、核酸、またはそのフラグメントもしくは誘導体である。例えば、いくつかの態様において、結合ドメインは、抗体、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、エンドヌクレアーゼV、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む。いくつかの態様において、結合ドメインは、ライタータンパク質またはイレイサータンパク質の触媒的に不活性な変異体を含む。ある側面において、リーダータンパク質は、NUDT16、YTHDC1、YTHDC2、YTHDF1、YTHDF2、またはそれらのフラグメントもしくは誘導体である。ある側面において、ライタータンパク質は、DNMTタンパク質、NAT10タンパク質、METTLタンパク質、TRMタンパク質、BMTタンパク質、DUSタンパク質、PUSタンパク質、ADARタンパク質もしくはNSUNタンパク質、またはそれらのフラグメントもしくは誘導体である。ある側面において、ライタータンパク質はDNTM1、DNTM3A/B、NAT10、METTL3、METTL8、METTL14、METTL16、TRM、BMT、DUS2、PUS、もしくはNSUN2、またはそれらのフラグメントもしくは誘導体である。ある局面では、イレイサータンパク質は、FTOタンパク質、ALKBHタンパク質、TETタンパク質、またはそれらのフラグメントもしくは誘導体である。ある局面では、イレイサータンパク質は、FTO、ALKBH3、もしくはALKBH5、またはそれらのフラグメントもしくは誘導体である。いくつかの態様において、結合ドメインは、IgG抗体、抗原結合フラグメント(Fab)、一本鎖可変フラグメント(scFv)、または重鎖もしくは軽鎖単一ドメイン(VおよびV)を含む。いくつかの態様において、結合ドメインは、重鎖抗体(hcAb)またはhcAbのVHドメイン(ナノボディ)を含む。いくつかの態様において、結合ドメインは、アデクチン、アフィボディ、アフィリン、アンチカリン、アトリマー、アビマー、二環式ペプチド、センチリン、シスノット、ダーピン、フィノマー、クニッツドメイン、オボディまたはプロネクチンなどの人工タンパク質スキャフォールドを含む。
【0113】
IgG抗体は免疫グロブリンの主なアイソタイプである。IgGは2本の同一の重鎖および2本の同一の軽鎖を含み、共有結合でジスルフィド結合を介して安定化されている。IgGは、重鎖(V)および軽鎖(V)の可変N末端ドメインおよび6つの相補性決定領域(CDR)を介して抗原を認識する。いくつかの修飾DNAおよびRNA塩基に結合する抗体は市販されている。例えば、5-メチルシチジン(m5C)、5-ヒドロキシメチルシチジン(hm5C)、N6-メチルアデノシン(m6A)に特異的な抗体をActive Motif社およびSigma社など数社が販売している。ユーロジェンテック社(ベルギー)はm5Cに結合するモノクローナル抗体を販売している。イノシンに結合するモノクローナル抗体は、例えばDiagenode社から購入できる。Megabase Research Products社(米国)は、m5C 6-メチルアデノシンおよび7-メチルグアノシンに結合するウサギのポリクローナル血清を販売している。Abcam社(米国)は、RNA修飾m6A、ac4C、m1A、m2,2G、m4C、m2A、m6,6Aおよびm8Aに対する組換え抗体を販売している。修飾塩基に結合する抗体は、当業者に公知の方法に従って開発できる。いくつかの態様では、抗体はモノクローナル抗体、ポリクローナル抗体、またはそれらの機能的フラグメントもしくは変異体である。本明細書で用いる用語“抗体”とは、必要な特異性を有する結合ドメインを有するあらゆる特異的結合物質を対象とする。したがって、この用語は、天然か合成か、モノクローナルかポリクローナルかを問わず、免疫グロブリン結合ドメインを含むあらゆるポリペプチドを含む、抗体フラグメント、誘導体、機能的等価物、抗体のホモログをカバーする。免疫グロブリン結合ドメイン、またはそれと同等のものと他のポリペプチドとの融合体からなるキメラ分子も含まれる。
【0114】
いくつかの態様では、結合ドメインはナノボディを含んでいてもよい。ナノボディは、ラクダ類およびいくつかの軟骨魚類が産生するように、重鎖抗体の単一の可変ドメイン(VH)を含む。VHドメインは、IgG抗体のCDRに比べて拡大された3つのCDRを含み、IgGと同程度の大きさ(すなわち、約800Å2)の抗原相互作用表面を提供する。ナノボディは、IgG抗体と同様の親和性で抗原と結合するが、それに対していくつかの利点がある:小さい(15kDa)、ジスルフィド結合が少ないため還元環境に弱い、より可溶性である、翻訳後グリコシル化がない。ナノボディは細菌発現系で生産できるため、ファージおよびその他のディスプレイ技術によって親和性および特異性を成熟させることができる。その他の利点としては、熱安定性および溶解性の向上、部位特異的標識への容易なアプローチが挙げられる。ナノボディはサイズが小さいため、凸状のパラトープを形成でき、アクセスしにくい抗原との結合に適している。ナノボディを産生するための例示的な方法には、それぞれの動物(例えば、ラクダ)を目的の抗原で免疫すること、既存のナイーブライブラリーをさらに進化させること、またはそれらの組み合わせが含まれる。
【0115】
いくつかの態様では、結合ドメインは、リーダータンパク質、ライタータンパク質、またはイレイサータンパク質を含む。“リーダータンパク質”とは、DNAまたはRNA上の特定の化学修飾を選択的に認識して結合するタンパク質である。“ライタータンパク質”とは、DNAまたはRNAに特定の化学修飾を加えるタンパク質である。“イレイサータンパク質”とは、DNAまたはRNAから特定の化学修飾を取り除く酵素である。いくつかの態様では、結合ドメインは、リーダータンパク質、ライタータンパク質、またはイレイサータンパク質のフラグメントまたは誘導体を含む。いくつかの態様では、結合ドメインは、核酸結合を保持するが酵素活性を欠くように操作された形態などの、リーダー、ライター、またはイレイサータンパク質の操作された形態を含む。いくつかの態様では、結合ドメインは、ライターまたはイレイサータンパク質の触媒的に不活性な変異体を含む。本明細書に記載の結合ドメインに用いられ得る、例示的なリーダータンパク質、ライタータンパク質、イレイサータンパク質を表1および表2に示す。その他のリーダータンパク質、ライタータンパク質、イレイサータンパク質は、以下のワールド・ワイド・ウェブ・アドレスに掲載されている:rnawre.bio2db.com。
【0116】
【表2】

【0117】
【表3-1】


【表3-2】

【表3-3】

凡例:W:ライター、E:イレイサー、R:リーダー、TS:腫瘍抑制因子、Onc:癌遺伝子。
RNA修飾:m1A:1-メチルアデノシン、ms2i6A:2-メチルチオ-N6-イソペンテニルアデノシン,i6A:N6-イソペンテニルアデノシン,m6A:N6-メチルアデノシン,m3C:3-メチルシトシン、m5C:5-メチルシトシン、ac4C:N4-アセチルシトシン、m7Gpp(pN):7-メチルグアノシンキャップ、m7G:7-メチルグアノシン内部、m2,2G:N2,N2,-ジメチルグアノシン、m2G:N2-メチルグアノシン、Q:ケウオシン(queuosine)、yW et al:ウィブトシンおよび誘導体、m5U:5-メチルウリジン、ncm5U:5-カルバモイル-メチルウリジン、mcm5U:5-メトキシカルボニル-メチルウリジン、mcm5s2U:5-メトキシカルボニルメチル-2-チオウリジン、D.ジヒドロウリジン、Ψ:シュードウリジン、Nm:2’-O-メチルヌクレオチド、m(pN):5’リン酸モノメチル化、A-to-I:アデノシンの脱アミノ化、C-to-U:シトシンの脱アミノ化。RNA修飾酵素:ADAR1-3:アデノシンデアミナーゼ RNA特異的1-3、ALKBH1/3/5/8:AlkBホモログ1/3/5/8,APOBEC1/3G:アポリポタンパク質B mRNA 編集触媒サブユニット1/3G,BCDIN3D:BCDIN3ドメイン含有RNAメチルトランスフェラーゼ,BUD23:RRNAメチルトランスフェラーゼおよびリボソーム成熟因子,CDK5RAP1:CDK5調節サブユニット関連タンパク質1,CMTR1/2:キャップメチルトランスフェラーゼ1/2,CTU1/2:細胞質チオウリジラーゼサブユニット1/2,DKC1:ディスケリンシュードウリジンシンターゼ1,DNMT2:tRNA アスパラギン酸メチルトランスフェラーゼ1,DUS2:ジヒドロウリジンシンターゼ2,ELP3:エロンゲーターアセチルトランスフェラーゼ複合体サブユニット3,FTO:FTOα-ケトグルタル酸依存性ジオキシゲナーゼ、HENMT1:HENメチルトランスフェラーゼ1、METTL1/2/3/6/8/14/16:メチルトランスフェラーゼ様-1/2/3/6/8/16、NAT10:N-アセチルトランスフェラーゼ10、NSUN1-5:NOP2/Sun RNAメチルトランスフェラーゼ1-5,NUDT16:Nudixヒドロラーゼ16,RNMT:RNAグアノシン-7メチルトランスフェラーゼ,TGT:クエウイン(Queuine)TRNA-リボシルトランスフェラーゼ触媒サブユニット1,TRIT1:tRNAイソペンテニル転移酵素1、TRMT1/2A/2B1/5/6/10C/11/61A/61B/112:tRNAメチルトランスフェラーゼサブユニット、TYW2:tRNA-YW合成タンパク質2ホモログ。
【0118】
いくつかの態様では、結合ドメインはリーダータンパク質を含む。いくつかの態様において、結合ドメインは、NUDT16、YTHDC1、YTHDC2、YTHDF1またはYTHDF2から選択されるリーダータンパク質を含む。NUDTはU8 snoRNAデキャッピング酵素である(例えば、Uniprotアクセッション番号Q96DE0を参照)。YTHDC1は、N6-メチルアデノシン(m6A)含有RNAを特異的に認識して結合するオルタナティブスプライシングの調節因子である(例えば、Uniprot アクセッション番号Q96MU7を参照)。YTHDC2は3’-5’RNAヘリカーゼである(例えば、Uniprotアクセッション番号Q9H6S0を参照)。YTHDF1はN6-メチルアデノシン(m6A)を含むmRNAを特異的に認識して結合し、その安定性を制御している(例えば、Uniprot アクセッション番号Q9BYJ9を参照)。YTHDF2はN6-メチルアデノシン(m6A)を含むmRNAを特異的に認識して結合し、その安定性を制御している(例えば、Uniprot アクセッション番号Q9Y5A9を参照)。いくつかの態様において、結合ドメインは、NUDT16、YTHDC1、YTHDC2、YTHDF1またはYTHDF2のフラグメントまたは誘導体を含む。
【0119】
いくつかの態様では、結合ドメインはライタータンパク質を含む。いくつかの態様において、結合ドメインは、DNTM1、DNTM3 A/B、NAT10、METTL3、METTL8、METTL15、TRM、BMT、DUS2、PUS、およびNSUN2から選択されるライタータンパク質を含む。DNMT1およびDNTM3A/BはDNA(シトシン-5)メチルトランスフェラーゼである。NAT10はRNAシチジンアセチルトランスフェラーゼである(例えば、Uniprotアクセッション番号Q9H0A0を参照)。METTL3は、N6-アデノシン-メチルトラスフェラーゼ触媒サブユニットである(例えば、Uniprotアクセッション番号Q86U44を参照)。NSUN2はRNAシトシンC(5)-メチルトランスフェラーゼである(例えば、Uniprotアクセッション番号Q08J23を参照)。いくつかの態様において、結合ドメインは、NAT10、METTL3、またはNSUN2のフラグメントまたは誘導体であるライタータンパク質を含む。ある側面において、ライタータンパク質は、DNMTタンパク質、NAT10タンパク質、METTLタンパク質、TRMタンパク質、BMTタンパク質、DUSタンパク質、PUSタンパク質、ADARタンパク質もしくはNSUNタンパク質、またはそれらのフラグメントもしくは誘導体である。
【0120】
いくつかの態様では、結合ドメインはイレイサータンパク質を含む。いくつかの態様において、結合ドメインは、FTO、ALKBH3、およびALKBH5から選択される操作されたイレイサータンパク質を含む。FTOはα-ケトグルタル酸依存性ジオキシゲナーゼである(例えば、Uniprotアクセッション番号Q9C0B1を参照)。ALKBH3は、α-ケトグルタル酸依存性ジオキシゲナーゼalkBホモログ3である(例えば、Uniprotアクセッション番号Q96Q83を参照)。ALKBH5はRNA脱メチル化酵素である(例えば、Uniprotアクセッション番号Q6P6C2を参照)。いくつかの態様において、結合ドメインは、FTO、ALKBH3、またはALKBH5のフラグメントまたは誘導体であるライタータンパク質を含む。
【0121】
結合ドメインは、DNAまたはRNAの非カノニカルな特徴に結合するように選択および/または操作され得る。例えば、非カノニカルな特徴は、修飾された塩基、修飾された骨格、または構造的要素である。いくつかの態様では、結合ドメインは2以上の非カノニカルな特徴に結合し得る。
【0122】
いくつかの態様では、結合ドメインは修飾塩基および/またはヌクレオシドに結合する。いくつかの態様において、結合ドメインは、少なくとも1つ、少なくとも2つ、または少なくとも3つの修飾ヌクレオシドと接触する。いくつかの態様において、結合ドメインは、少なくとも1つの修飾ヌクレオシドと接触する。いくつかの態様において、結合ドメインは、少なくとも1つの修飾ヌクレオシドおよびそれに隣接する1以上のヌクレオチドと接触する。ヒトおよび他の生物で生じ得る例示的な修飾ヌクレオシドを表3Aに示す。ヒトにおいて発現することが知られている修飾ヌクレオシドを表3Bに示す。その他の修飾塩基およびヌクレオシドは、genesilico.pl/modomics/modificationsのワールドワイドウェブアドレスに掲載されている。
【0123】
【表4】

*当業者には理解されるであろうが、一般的にはRNA中に存在する修飾塩基/ヌクレオシドがDNA中に存在することがあり、一般的にはDNA中に存在する修飾塩基/ヌクレオシドがRNA中に存在することもある。
【0124】
【表5-1】


【表5-2】
【0125】
いくつかの態様において、結合ドメインは、以下の修飾ヌクレオシドの1以上に結合する:3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、7-メチルグアノシン(m7G)-キャップ、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-カルボキシシトジン(5caC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、リボースメチル化(Nm)、N2,N2-ジメチルグアノシン(m G)、5-カルバモイルメチル-2’-O-メチルウリジン(ncm5Um)、5-メトキシカルボニルメチルウリジン(ncm5mU)、5-メトキシカルボニルメチル-2-チオウリジン(mcm5s2U)、ケウオシン(Q)、2-チオウリジン(s2U)、5-タウリノメチルウリジン(τm5U)、5-タウリノメチル-2-チオウリジン(τm5s2U)、N6-イソペンテニルアデノシン(I6A)、2-メチルチオ-N6-トレオニルカルバモイルアデノシン(ms2t6A)。
【0126】
いくつかの態様において、非カノニカルな特徴は以下である:3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、7-メチルグアノシン(m7G)-キャップ、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-カルボキシシトジン(5caC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N-メチルグアノシン(m7G)、2,7,2 ’-メチルグアノシン、またはリボースメチル化(Nm)。
【0127】
いくつかの態様では、結合ドメインは、天然に生じる酸化的もしくは紫外線誘発性損傷、または外因性薬剤による大きな付加体形成もしくは塩基アルキル化に起因する核酸損傷に結合する。いくつかの態様において、核酸損傷は、該損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加物、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である。いくつかの態様において、非カノニカルな特徴は、天然に生じる酸化的もしくは紫外線誘発性損傷、または外因性薬剤による大きな付加体形成もしくは塩基アルキル化に起因する核酸損傷である。いくつかの態様において、核酸損傷は、該損傷が、8-オキソグアニン(8-oxoG)、1つ以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加物、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である。
【0128】
いくつかの態様では、結合ドメインは構造的要素に結合する。構造的要素は、例えばヘアピンやループであってもよい。他の例示的な構造的要素としては、Z-DNA構造、G-四重鎖、I-モチーフ、バルジ、脱塩基部位、三重鎖、三方向結合、十字形構造、テトラループ、リボースジッパー、シュードノットなどが挙げられるが、これらに限定されない。いくつかの態様において、複数の組成物が提供され、各組成物は結合ドメインを含み、各結合ドメインは異なるタイプの非カノニカルな特徴に結合する。これにより、多数の非カノニカルな特徴を同時に検出できる多重化アプローチが可能になる。
【0129】
本明細書に記載の結合ドメインは、RNAと特異的に結合するか、またはDNAと特異的に結合してもよい。いくつかの態様では、結合ドメインはRNAおよびDNAの両方に結合する。いくつかの態様では、結合ドメインは、1以上の非カノニカルな特徴を有する二本鎖核酸に特異的に結合する。いくつかの態様では、結合ドメインは、1以上の非カノニカルな特徴を有する一本鎖核酸に特異的に結合する。
【0130】
いくつかの態様では、標的核酸の非カノニカルな特徴に結合ドメインが結合することで、DNAアダプターが標的核酸の5’または3’末端に近接する。例えば、図3には結合ドメインに結合した標的核酸が示されており、アダプターは標的核酸の3’末端に近接して配置されている。図5は、第2の認識エレメントに固定化された結合ドメインを示しており、標的核酸が結合ドメインに結合することで、アダプターが標的核酸の3’末端に近接して配置される。いくつかの態様では、標的核酸は結合ドメインに結合され、アダプターを標的核酸の3’末端に近接して配置する。いくつかの態様では、標的核酸は結合ドメインに結合され、アダプターを標的核酸の5’末端に近接して配置する。
【0131】
結合ドメインは、標準的な分子生物学、タンパク質工学、および/または化学的技術を用いて作製できる。
【0132】
アダプター(例えば、リンカーを含むアダプター)は、いくつかの異なる方法を用いて基質に結合させることができる。いくつかの態様では、アダプターは、ランダムなタグ付けによって第2の認識エレメントまたは中間体タンパク質に共有結合できる(例えば、図1Bおよび図1Eを参照)。例えば、アダプター上のNHSで活性化された残基は、第2の認識エレメントまたは中間体タンパク質の表面に露出したタンパク質リジン残基の1以上のアミン基と反応し得る。同様に、マレイミドで活性化されたアダプターは、第2の認識エレメントまたは中間体タンパク質の天然または人工のシステインと反応し得る。当業者には理解されるように、第2の認識エレメントまたは中間体タンパク質に連結されるアダプターの数は、それぞれ反応性リジン残基またはシステイン残基の数、および反応条件の選択によって変化し得る。いくつかの態様では、アダプターは第2の認識エレメントに非共有結合で結合できる(例えば、図1Cおよび図1D参照)。例えば、5’-ビオチン化アダプターは、基質アンカー化ストレプトアビジン、アビジン、ニュートラビジン、またはそれらの変異体に結合させ得る。
【0133】
部位選択的カップリング法もまた、アダプターを第2の認識エレメントにカップリングさせるために用いることができる(例えば、図1Bおよび図1E参照)。部位選択的方法は、Tn5トランスポザーゼを結合ドメインに結合させるため(例えば、図1H参照)、または核酸編集酵素を結合ドメインに結合させるため(例えば、図10参照)にも使用できる。部位特異的カップリングは、結合ドメイン、第2の認識エレメント、中間体タンパク質の機能への影響を回避し、再現性のある材料製造を可能にする。第2の認識エレメントまたは中間体タンパク質の部位選択的な内部タグ付けは、アミノアシルtRNA合成酵素/tRNA対を操作した細胞株を用いて、非天然アミノ酸を遺伝子的に組み込むことで達成できる。組み込まれた非天然アミノ酸は、生体直交型反応を起こし得る部位を示す。一般的に用いられるのは、銅触媒によるアジドアルキン環化付加反応(CuAAC)、光活性化1,3-双極性環化付加反応、歪み促進アジドアルキン環化付加反応(SPAAC)、または逆電子要求型ディールス・アルダー環化付加反応(IEDDA)を起こし得る部位を有するアミノ酸である。結合ドメイン、第2の認識エレメントまたは中間体タンパク質のC末端またはN末端または内部タグ付けのための例示的で汎用性のある方法は、タンパク質タグまたはペプチドタグの使用を含む。SNAP-tag、Halo-tag、Spy-tag、Snoop-tag、Isopeptag、Dog-tag、Sdy-tag、Clip-tagなどのタンパク質タグは、結合ドメイン、第2の認識エレメント、中間体タンパク質をタンパク質-タグ融合タンパク質として発現させるために、あらゆるタンパク質遺伝子にクローニングできる小さなタンパク質またはペプチドである。このようなタンパク質タグは、特定のペプチドまたは基質との共有結合形成を自己触媒し得る。例えば、スパイキャッチャーは113残基のタンパク質で、あらゆるDNA配列に容易に結合できる13残基のペプチドSpyTagを認識する。いくつかの態様では、スパイキャッチャーは配列番号12を含む。いくつかの態様において、SpyTagは配列番号10を含む。結合ドメイン、第2の認識エレメント、中間体タンパク質の分子量によっては、より小さいペプチドタグが好ましい場合もある。ペプチドタグは通常10-12アミノ酸長で、酵素を介したカップリング反応で作用する。第2の認識エレメントまたは中間体タンパク質をアダプターに結合させるための酵素を介した反応の例としては、(a)AP-ペプチド標識結合ドメインおよびビオチン-DNAを結合させるためのビオチンリガーゼの使用(例えば、ビオチンリンカー)、(b)LAP-ペプチド標識第2の認識エレメントおよびリポ酸-DNAを連結するためのリポ酸リガーゼの使用(例えば、リポ酸-リンカー)、(c)Tub-tag標識第2の認識エレメントおよびチロシン修飾DNAを連結するためのチューブリンチロシンリガーゼの使用(例えば、チロシン修飾リンカー)、(d)LPxTGペプチドおよびグリシン修飾DNAと反応するSortase-Aの使用(例えば、グリシン修飾リンカー)などが挙げられるが、これらに限定されない。いくつかの態様では、Tn5トランスポザーゼ-プロテインA融合タンパク質を生成し、RNA修飾特異的抗体のFc領域に結合させることができる(例えば、図1H参照)。いくつかの態様では、アデノシンデアミナーゼであるADAR酵素は、プロテインLと遺伝子融合し、RNA修飾特異的抗体のFc領域に結合させることができる(例えば、図10参照)。いくつかの態様では、SpyTagは結合ドメインに遺伝子操作され得て、SpyCatcherは核酸編集酵素またはTn5トランスポザーゼに遺伝子操作され得る。SpyTag修飾結合ドメインとSpyCatcher修飾核酸編集酵素を混合すると、非カノニカルな特徴の位置をマーキングするために用いられるような、結合ドメインおよび核酸編集酵素を含む共有結合体が生成され得る。SpyTag修飾結合ドメインとTn5トランスポザーゼを混合すると、結合ドメインおよびTn5トランスポザーゼを含む共有結合体が生成される。さらに、一群の金属イオン認識タグおよび低分子結合モチーフを用いることもできる。ペプチドタグ付けのもう一つの方法は、内因性の細胞機構をリダイレクトして、組換えタンパク質にアルデヒドを導入することである。この方法は、保存された13残基のコンセンサス配列内でシステインをホルミルグリシン(FGly)に共翻訳的に変換するホルミルグリシン生成酵素(FGE)を利用する。得られたアルデヒドタグは、DNAに結合する反応性アミンで容易に修飾できる。
【0134】
いくつかの態様では、アダプターは生体直交型化学反応を介して第2の認識エレメントまたは中間体タンパク質に結合される。いくつかの態様では、第2の認識エレメントまたは中間タンパク質は、バーコードの結合を促進するDNAオリゴヌクレオチドを含む。DNAオリゴヌクレオチドは、アミノ、アジド、ビオチン、アルキンで修飾されたものが容易に市販されている。アルキンおよびアジドオリゴは、銅触媒を用いたアジド-アルキン環化付加反応、またはストレインプロモートを用いたアジド-アルキン環化付加反応において、非天然アミノ酸と結合させることができる。アミノオリゴヌクレオチドはホルミルグリシンと反応し、ホルミルグリシン生成酵素(FGE)によって13アミノ酸(aa)の保存配列内の結合ドメインに導入される。
【0135】
本明細書に記載の結合ドメインが標的核酸に結合すると、複合体が形成される。いくつかの態様では、複合体の結合ドメインは標的核酸に共有結合していてもよい。例えば、結合ドメインは標的核酸に化学的および/または光化学的に結合させることができる。
【0136】
第2の認識エレメント
第2の認識エレメントとは、本明細書に記載の結合ドメインを基質表面につなぎとめるために用いられる抗体、タンパク質、またはペプチドである。いくつかの態様では、本明細書に記載の第2の認識エレメントはリンカーに結合され、リンカーは基質に結合される。いくつかの態様では、第2の認識エレメントは抗体結合ドメインに結合する。いくつかの態様では、第2の認識エレメントは、プロテインG、プロテインL、プロテインA、プロテインAG、プロテインAL、プロテインLG、または抗体である。いくつかの態様では、抗体は種特異的抗体である。いくつかの態様では、種特異的抗体は、マウス、ラット、ウサギ、ヒト、または非ヒト霊長動物から選択されるが、これらに限定されない。
【0137】
いくつかの態様では、アダプターが第2の認識エレメントに結合されている。例えば、いくつかの態様では、第2の認識エレメントは抗体であり、アダプターは抗体のFc領域に結合している。アダプターは、N-ヒドロキシスクシンイミジルエステル(NHSエステル)を用いてタンパク質のリジンに結合させ得る。アダプターは、マレイミド基またはヨードアセチル基を用いてタンパク質のシステインに結合させ得る。アダプターは抗体または他の糖鎖タンパク質の糖鎖基と反応させ得る。いくつかの態様では、1つのアダプターが第2の認識エレメントに結合されている。いくつかの態様では、2つのアダプターが第2の認識エレメントに結合されている。いくつかの態様では、複数のアダプターが第2の認識エレメントに結合されている。
【0138】
いくつかの態様では、第2の認識エレメントはタンパク質である。いくつかの態様では、第2の認識エレメントはペプチドタグである。ペプチドタグの例としては、Flag、Avi、HA、His、MycおよびStrep-tagなどが挙げられるが、これらに限定されない。いくつかの態様では、第2の認識エレメントは共有結合ペプチドタグである。ペプチドタグの例としては、Spyタグ、SnoopタグまたはDogタグなどが挙げられるが、これらに限定されない。いくつかの態様では、第2の認識エレメントはタンパク質タグである。タンパク質タグの例としては、MBD、CLIPおよびHaloなどが挙げられるが、これらに限定されない。
【0139】
いくつかの態様では、第2の認識エレメントはアビジンタンパク質、例えばストレプトアビジン、ニュートラビジンまたは関連変異体である。例えば、基質をストレプトアビジンでコートし、ビオチン標識アダプターおよびビオチン化プロテインGで共機能化でき、ここで、プロテインGはさらに抗体結合ドメインに結合される。
【0140】
アダプター/バーコード転移反応
本明細書に記載の核酸結合分子は、バーコードを含むアダプターのような、アダプターを標的核酸にトランスファーさせるために使用できる。したがって、いくつかの態様では、本明細書に記載の結合ドメインは、標的核酸にバーコードをトランスファーするために使用され得る。バーコードは、MBC、すなわち、結合ドメインによって特異的に結合される非カノニカルな機能に固有のバーコードであってもよい。アダプターが導入された標的核酸は、本明細書では“標識標的核酸”、“標識標的”または同様の用語で称される。バーコードが転写された標的核酸は、本明細書では“バーコード化標的核酸”、“バーコード化標的”または同様の用語で称される。アダプターが標的核酸に転移される反応を、本明細書では“アダプター転移反応”と呼ぶ。同様に、バーコードが標的核酸にトランスファーされる反応を、本明細書では“バーコード転移反応”と呼ぶ。
【0141】
アダプター/バーコードトランスファーの目的は、アダプター/バーコードを標的核酸分子、あるいは標的核酸分子のコピーに共有結合させることである。例えば、いくつかの態様では、バーコードは標的核酸の5’末端または3’末端に化学的または酵素的にライゲーションされる。いくつかの態様では、バーコード化は、バーコードを導入するためのテンプレートとしてアダプターを用いて、DNAポリメラーゼ、RNAポリメラーゼまたは逆転写酵素によって核酸の3’末端を伸長することによって達成される。いくつかの態様では、標的核酸の3’末端およびアダプターの3’末端はそれぞれ、逆転写酵素によってハイブリダイズされて、同時に伸長される。いくつかの態様では、3’末端に縮重塩基を有するアダプターは、DNAまたはRNA標的をランダムにプライミングし、DNAポリメラーゼまたは逆転写酵素によって伸長される。標識/バーコード化された核酸分子は、いくつかの態様では、下流の工程で配列決定され得る。いくつかの態様では、標識標的核酸のコピーを配列決定できる。図2A-2Gはアダプター/バーコード転移反応の例を示す。
【0142】
アダプター転移に用いられる酵素はDNAおよびRNAの標的核酸で異なり、アダプターの構造によって変わる。標的DNAへのアダプター/バーコードの導入は、T4 DNAリガーゼ、サークリガーゼ、Klenowフラグメント、Bst DNAポリメラーゼまたはBsu DNAポリメラーゼなどの1以上の酵素を用いて行うことができる。アダプター/バーコードの標的RNAへの転移は、例えばT4 RNAリガーゼ1、T4 RNAリガーゼ2またはRtcBリガーゼなどを用いて行うことができる。逆転写酵素を用いて、バーコードのコピーとcDNAの合成を同時に行うこともできる。この反応は、M-MLV逆転写酵素、AMV逆転写酵素、またはグループIIイントロンコード逆転写酵素、例えばInduro(商標)逆転写酵素(NEB)によって触媒される。Superscript II RT(Thermo Fisher)、Superscript IV RT(Thermo Fisher)、およびMaxima H Minus RT(Thermo Fisher)などの市販のM-MLV変異体の中には、テンプレートスイッチング反応を触媒できるものがあり、それらはバーコード転写後に第2のアダプターを導入するために用いられ得る(例えば、図5および図6参照)。
【0143】
例えば、図5は、一本鎖DNAアダプター(例えば、バーコードを含むか、またはバーコードからなるアダプター)と一本鎖標的核酸とのライゲーションを示す。標的核酸がRNAであるいくつかの態様では、アダプターは5’リン酸を含み、T4 RNAリガーゼ1によって触媒される。あるいは、アダプターを5’-プレアデニル化し、T4 RNAリガーゼ2によってトランスファーさせ、ATPの必要性をなくし、反応を1回のターンオーバーに制限することもできる。あるいは、リン酸化されていないアダプターを用いてもよく、RtcBリガーゼを用いて3’-リン酸化RNAにトランスファーさせてもよい。標的核酸がDNAであるいくつかの態様では、アダプター/バーコードはサークリガーゼによって触媒される反応でトランスファーされ得る。
【0144】
図6は逆転写酵素によるバーコード化を示す。普遍的なスペーサー配列(SP)をライゲーションすることで、標的RNAのアダプターへのハイブリダイゼーションが可能になる一方、結合ドメインはRNA修飾を捕捉する。ハイブリダイゼーションは、図2Gに示した構成で起こる。逆転写酵素がRNAの3’末端を伸長し、修飾バーコードをコピーする。同時に、酵素はアダプターの3’末端を伸長し、cDNAを生成する。テンプレートスイッチングオリゴを反応に含めることで、例えばイルミナシーケンスアダプターのような、選択したユニバーサル領域が導入される。
【0145】
スプリント(splint)ライゲーションは、アダプター/バーコードを標的核酸に導入するためにも使用できる。スプリントライゲーションでは、架橋するDNAまたはRNAオリゴヌクレオチドを用いて2つの核酸を結合させ、それらは1以上の酵素によって結合される。例えば、2つのRNA(例えば、標的RNAおよびアダプター/バーコード)のスプリントライゲーションは、T4リガーゼ1と、RNAに相補的な架橋RNAオリゴヌクレオチドを用いて行うことができる。例えば、図2Bに示すスプリント核酸構築物は、スプリントライゲーションを用いて作成できる。SplintRリガーゼは、RNAの3’末端を5’-pDNAに連結するために用いられ、DNAまたはRNA相補体にアニールされる。標的分子がDNAのとき、T4 DNAリガーゼ、T3 DNAリガーゼ、T7 DNAリガーゼまたは大腸菌DNAリガーゼなどの酵素を用いて、スプリントDNAライゲーションを行うことができる。
【0146】
スプリント伸長は、アダプター/バーコードの標的核酸へのトランスファーに使用できる別の方法である。“スプリント”とは、ライゲーションジャンクションに亘る配列のことである。プライマーが用いられるとき、プライマーは一般的に、ライゲーションジャンクションをまたがない。スプリントは、未知の配列の標的核酸との結合を促進するために、ランダム塩基または普遍的合成塩基を示し得る。図2Cは、3’塩基のオーバーハングを有する二本鎖アダプターを用いて、標的核酸分子の配列のコピーが作られる、スプリント伸長によるアダプター転移を示す。3’塩基オーバーハングには、ランダム塩基や、無作為(promiscuously)に塩基対を形成する合成ユニバーサル塩基が含まれ得る。標的核酸分子がRNAのとき、この反応はトリ骨髄芽球症ウイルス(Avian Myeloblastosis Virus (AMV))リバーストランスクリプターゼおよびモロニ-マウス白血病ウイルス(M-MuLV、MMLV)のような逆転写酵素により触媒される。標的分子がDNAであるとき、プライマーは、3’→5’エキソヌクレアーゼ活性を有するか有しないかに関わらず、何れかの適切なDNAポリメラーゼによって伸長され得る。
【0147】
いくつかの態様では、アダプター/バーコードを標的核酸にトランスファーするために、テンプレート伸長を用い得る。図2Gは、標的RNAへのアダプターのハイブリダイゼーションによって開始される、プライマー伸長による直接アダプタートランスファーを示す。逆転写酵素を用いて、アダプターおよび標的核酸を伸長し、その結果標的RNAおよびそのcDNAコピーにバーコードを導入できる(“双方向伸長”)。アダプターは、上流で標的核酸にライゲーションできる短いスペーサー配列(SP)を介してハイブリダイズしてもよく(図2G)、またはアダプター配列の一部である縮重塩基を介してランダムにハイブリダイズしてもよい(図2H)。3’末端のどちらか一方をブロックすることで、プライマーの伸長が一方向性か双方向性かを制御する。図2Dに示すような一方向伸長は、2つのスペーサー配列を有するアダプターを用いたマルチサイクルコード化プロセスの一部として、あるいはシングルサイクルとして実行できる。DNAアダプター/バーコードの場合、標的核酸の伸長はDNAポリメラーゼ、例えばクレノウ(Klenow)フラグメント、T7、T4、BstまたはBsu DNAポリメラーゼによって触媒される。いくつかの態様では、生成されたバーコード化核酸は、最終工程として下流の増幅のためにユニバーサルプライマーでキャップされる。
【0148】
さらに、二本鎖ライゲーションも、アダプター/バーコードを標的核酸にトランスファーさせるために用い得る。例えば、図2Eは、アダプター/バーコードトランスファーのための二本鎖ライゲーションを示す。いくつかの態様では、標的核酸分子は二本鎖DNA、またはRNA/DNAハイブリッドであってもよく、平滑末端または粘着末端のいずれかを有していてもよい。二本鎖DNAの平滑末端および粘着末端のライゲーションは、T4、T3、T7または大腸菌リガーゼによって触媒される。
【0149】
いくつかの態様では、アダプター/バーコードを標的核酸に導入するために、化学的ライゲーションが用いられ得る。
【0150】
いくつかの態様では、標的核酸は、Tn5トランスポザーゼ(図9および図13)を用いた酵素的転位によってバーコード化できる。Tn5とランスポザーゼは、一工程のカット&ライゲーション機序を用いて、モザイク末端(ME)アダプターを二本鎖核酸標的に挿入する。適切な標的は、ゲノムDNAまたはDNA/RNAヘテロ二重鎖である。MEアダプターは、19bpのME配列、MBC、UMI、およびUFPまたはURPなどのユニバーサル配列を含み得る。転移反応の生成物の例を図13に示す。トランスポザーゼはホモダイマーを形成し、各トランスポザーゼモノマーは1つのMEアダプターを負荷する。標的核酸を切断し、切断部位で遊離した両末端をバーコード化するには、2つのMEアダプターを包含するトランスポザーゼ二量体が必要である。
【0151】
結合ドメインによって固定化された標的核酸へのバーコードトランスファーを促進する方法
アダプター/バーコードのトランスファーは、反応に関与する分子(結合ドメイン、アダプター、第2の認識エレメント、中間体たんぱく質など)を空間的に分離することで促進され得る。具体的には、標的核酸に結合した結合ドメインがアダプターに近接し、アダプターの標的核酸へのトランスファーを可能にするように、分子(例えば、アダプターおよび結合ドメイン)、標的核酸、および/または標的核酸に結合した結合ドメインを含む複合体を配置することによって、トランスファーを促進できる。
【0152】
いくつかの態様では、空間的配置は表面固定化によって達成できる。例えば、本明細書に記載の結合ドメインは、基質に結合させることで固定化できる(図1A-1H参照)。ほとんどの基質フォーマットでは、結合ドメインは1種しかない。アダプターが結合ドメインにも結合している第2の認識エレメントに結合している、図1Bに示すフォーマットは、結合ドメインが単一分子間隔で構成されていれば、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、またはそれ以上のタイプの結合ドメインをさらに含んでいてもよい。それぞれの“タイプ”の結合ドメインは、異なる非カノニカルな特徴に結合し、かつ/または異なるバーコードを含む。いくつかの態様では、結合ドメインはアダプターに近接して基質上に配置され、結合ドメインに結合した標的核酸へのアダプターのトランスファーを可能にする。いくつかの態様では、結合ドメインはアダプターに近接して基質上に配置され、アダプター配列のコピーの標的核酸へのトランスファーを可能にする。ライゲーションによるバーコード化には、アダプターをトランスファーする。しかしながら、プライマー伸長によるバーコード化では、アダプターのコピーがトランスファーされる。例えば、結合ドメインおよびアダプターの距離は200nm以下、190nm以下、180nm以下、170nm以下、160nm以下、150nm以下、140nm以下、130nm以下、120nm以下、110nm以下、100nm以下、90nm以下、80nm以下、70nm以下、60nm以下、50nm以下、40nm以下、30nm以下、20nm以下、10nm以下、または5nm以下である。
【0153】
結合ドメイン、アダプター、第2の認識エレメント、および/または中間タンパク質が結合され得る例示的な基質には、例えば、ビーズ、チップ、プレート、スライド、ディッシュ、または3次元マトリックスが含まれる。いくつかの態様では、基質は樹脂、膜、繊維、またはポリマーである。いくつかの態様では、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および/またはポリアクリルアミドを含むビーズなどのビーズである。いくつかの態様では、基質は磁気ビーズである。いくつかの態様では、支持体は合成ポリマーなどのポリマーである。合成ポリマーの限定されないリストには、ポリスチレン、ポリ(エチレン)グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸-コ-グリコール酸、ポリ(ε-カプロラクトン)(PCL)、ポリ乳酸、ポリ(3-ヒドロキシ酪酸-コ-3-ヒドロキシバレレート)(PHBV)、キトサンおよびセルロースなどが含まれる。
【0154】
分子(例えば、結合ドメイン、アダプター、第2の認識エレメント、および/または中間タンパク質)は、基質表面に直接結合させることができる。例えば、分子は1以上の共有結合または非共有結合によって基質に直接結合できる。基質が3Dマトリックスまたは他の3D構造である態様では、核酸結合分子は基質の複数の表面に結合していてもよい。
【0155】
いくつかの態様では、核酸結合分子は基質の表面に間接的に結合され得る。例えば、結合分子は捕捉分子を介して間接的に基質表面に結合させることができ、捕捉分子は基質に直接結合される。捕捉分子は、基質と核酸結合分子および/または標的核酸の両方に結合または連結できる核酸、タンパク質、糖、化学リンカーなどであってよい。いくつかの態様では、捕捉分子は結合ドメインまたはアダプター(例えば、アダプターのリンカー)に結合し、基質上に固定化される。
【0156】
いくつかの態様では、各アダプターが1つの標的核酸(すなわち、結合ドメインによって固定化された標的核酸)のみと相互作用できるように、第1のアダプターは基質表面上で第2のアダプターから分離されている。いくつかの態様では、結合ドメインおよびアダプターが基質表面に配置され、アダプターと結合ドメインに結合した標的核酸との相互作用を確実にする。いくつかの態様では、アダプターは結合ドメインから少なくとも1nm、最大でも30nm離れている。例えば、いくつかの態様では、アダプターと結合ドメインは約15nm離れている。
【0157】
いくつかの態様では、アダプターの複数のコピーが、約1アダプター/5nmから約1アダプター/50nm、例えば1アダプター/20nmの密度で基質に結合される。いくつかの態様では、結合ドメインの複数のコピーが、1000nmあたり約1結合ドメインから15000nmあたり約1結合ドメイン、例えば8000nmあたり1結合ドメインの密度で、基質に結合される。
【0158】
一般に、結合ドメインを基質に結合させる目的は、結合ドメインに結合した標的核酸へのアダプターおよび/またはバーコードのトランスファーを確実にすることである。図1A-1Hは、結合ドメインおよびアダプターを基質に結合させ、固定化する方法の限定されない例を示す。これらの例を以下に詳しく説明する。
【0159】
結合ドメインの基質への結合
いくつかの態様では、結合ドメインは基質に直接的または間接的に結合している。いくつかの態様では、複数の結合ドメインが、部位特異的化学を用いて基質上に固定化され得る。例えば、いくつかの態様では、結合ドメインは、基質上に固定化できる部位を含んでいてもよい。結合ドメインの基質表面への結合は、結合ドメインの末端に自己触媒タンパク質タグ(例えば、スパイキャッチャー、ソルターゼA、SNAPタグ、HaloタグおよびCLIPタグ)を融合させることによって促進される。結合ドメイン上のこれらのタンパク質タグは、基質表面上の同族反応性部位と共有結合で反応させることができる。例えば、スパイキャッチャータンパク質を結合ドメインに人工的に組み込むことができる。スパイタグ(Spytag)はスパイタグタンパク質(13aaペプチド)と共有結合を形成する。スパイタグが基質表面に結合している場合、スパイキャッチャー(Spycatcher)に結合した結合ドメインおよびスパイタグの反応は、結合ドメインを基質に共有結合させる役割を果たす。同様に、結合ドメインをソルターゼAタグと融合させ、基質表面に結合したペンタグリシンと反応させることもできる。別の例として、結合ドメインをSNAPタグと融合させ、基質表面に結合したO6-ベンジルグアニンと反応させることもできる。いくつかの態様では、結合ドメインはCLIPタグと融合され、基質表面に結合したO2-ベンジルシトシンと反応するために使用され得る。いくつかの態様では、結合ドメインはHaloタグと融合され、基質表面に存在するハロゲン化アルキルと反応するために用いられ得る。
【0160】
いくつかの態様では、結合ドメインはビオチン部分を含んでいてもよい。このような結合分子は、ビオチンと結合する捕捉分子(例えば、ストレプトアビジン)によって基質表面に固定化できる。
【0161】
結合ドメインはSpytag-Spycatcher相互作用を介して基質に結合していてもよい。これは、標準的なNHS化学を用いて、適切な表面密度で基質をSpytagペプチドで官能基化することで達成できる。Spytagは13aaの短いペプチドである(AHIVMVDAYKPTK;配列番号11)。スパイキャッチャーは139アミノ酸のタンパク質で、ほとんどの結合ドメインに遺伝子操作できる: msyyhhhhhh dydipttenl yfqgamvdtl sglsseqgqs gdmtieedsa thikfskrde dgkelagatm elrdssgkti stwisdgqvk dfylypgkyt fvetaapdgy evataitftv neqgqvtvng katkgdahi (配列番号10)。スパイキャッチャーで修飾された結合ドメインをスパイタグでコーティングされた表面に曝すと、スパイタグのC末端とスパイキャッチャーのN末端が自発的に反応してイソペプチド結合を形成し、結合ドメインが固定化される。
【0162】
市販のストレプトアビジンおよびプロテインGビーズは、結合ドメインを固定化するのに有用な基質である。いくつかの態様では、ストレプトアビジンビーズは、ビオチン化アダプターとビオチン化プロテインGの混合物で官能化される。第2工程において、プロテインGは、親和性結合によって抗体結合ドメインにさらに結合される(図1D)。ビオチン化アダプターとプロテインGの表面密度は、高収率で特異的なバーコードトランスファーを達成するために調整できる。いくつかの態様では、トランスポザーゼビーズは、5’ビオチン化MEアダプターをストレプトアビジンビーズに結合させ、次いでMEアダプターにTn5トランスポザーゼを負荷することによって調製できる(図1G)。いくつかの態様では、プロテインGビーズは、タンパク質のリジンとアミノ修飾アダプターの化学的コンジュゲーションを用いて、アダプターによって官能化される。第2工程において、プロテインGに抗体結合ドメインを結合させる(図1B)。ここで、プロテインGとアダプターの標識化学量論は、プロテインGが抗体に結合する能力を維持するために制御されなければならない。いくつかの態様では、トランスポザーゼビーズは、最初に抗体結合ドメインを負荷し、次いでTn5トランスポアーゼ-プロテインA融合タンパク質を抗体に結合させることによって、プロテインGビーズから調製できる(図1H)。
【0163】
基質
いくつかの態様において、本明細書の組成物は、1つの基質を含む。いくつかの態様において、本明細書の組成物は、2種以上の基質を含む。いくつかの態様では、組成物は複数の基質を含み、各基質は同じ材料から形成されている。いくつかの態様では、組成物は複数の基質を含み、各基質は異なる材料から形成されている。いくつかの態様では、基質はビーズ、チップ、プレート、チューブ、スライド、ディッシュ、ゲル、または3次元ポリマーマトリックスである。基質は様々な材料で形成できる。いくつかの態様では、基質は樹脂、膜、繊維、ポリマーである。いくつかの態様において、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および/またはポリアクリルアミドを含む。いくつかの態様では、基質は合成ポリマーなどのポリマーである。合成ポリマーの限定されないリストには、ポリ(エチレン)グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸-コ-グリコール酸、ポリ(ε-カプロラクトン)(PCL)、ポリ乳酸、ポリ(3-ヒドロキシ酪酸-コ-3-ヒドロキシバレレート)(PHBV)、キトサンおよびセルロースが含まれる。
【0164】
いくつかの態様では、標的核酸は結合ドメインを介して基質に間接的に結合され得る。いくつかの態様では、アダプターは結合ドメインを含む表面活性化ビーズに結合される。表面活性化ビーズは、共有結合のためにエポキシ基、トシル基、カルボン酸基、またはアミン基を提示し得る。カルボキシビーズは通常、ペプチド結合形成を促進するためにカルボジイミドと反応させる必要があり、アミンビーズは通常、二官能性NHS-リンカーを必要とする。いくつかの態様では、ビーズの表面は非特異的結合を防ぐために不動態化(passivated)されている。不動態化(passivation)は、いくつかの態様では、同じ連結化学を有するポリエチレングリコール(PEG)分子を共移植することによって達成できる。例えば、結合ドメインおよびアミノ末端ポリエチレングリコール(PEG)は、平均して、ほとんどの基質部位が結合ドメインを空間的に分離させる役割を果たすPEG分子によって占有されるように用いられる。PEGを過剰に使用した場合、結合ドメインは平均して互いに空間的に離れる。結合ドメインの表面密度は、結合ドメインとPEG分子の比率を変えることで、調整できる。
【0165】
いくつかの態様では、ビーズはmTet(テトラジン)およびカルボキシ-PEGで作られたセファロースビーズである。mTet対カルボキシPEGの比率を下げると、標的核酸間の架橋が減少する。いくつかの態様において、mTet:カルボキシ-PEG比は、1:500、1:600、1:700、1:800、1:900、1:1000、1:1100、1:1200、1:1300、1:1400、1:500または1:2000である。いくつかの態様において、mTet:カルボキシ-PEG比は1:1000である。
【0166】
いくつかの態様では、基質は複数の同じ結合ドメインを含む。いくつかの態様では、基質は複数の同じアダプターを含む。
【0167】
核酸分析法
本明細書に記載の組成物(例えば、結合ドメイン、アダプター、および基質を含む組成物)は、核酸を分析する種々の方法において、特に標的核酸上の非カノニカルな特徴を認識するために用い得る。従って、本発明は、トランスクリプトームおよびゲノムにわたるRNA修飾およびDNA修飾の多重プロファイリング法を含む、標的核酸上の非カノニカルな特徴を分析する方法を提供する。これらの方法では、RNAまたはDNAの非カノニカルな特徴が結合ドメインによって認識される。次いで、アダプターまたはその一部(例えば、バーコード)を基質から標的核酸に(すなわち、標識/バーコード化標的核酸を生成するために)、あるいは標的核酸のコピーに転移させる。バーコードは標的核酸によって結合された特定の非カノニカルな特徴に固有であるため、この工程は認識イベントからの情報を標的核酸の核酸配列に書き込む役割を果たす。バーコード化された標的核酸は、配列決定ライブラリーに変換され、DNA/RNA配列決定法で読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非カノニカルな特徴と相関する。塩基配列決定により、標的核酸中の非カノニカルな特徴の局在を確認することもできる。本明細書に記載される高速プロファイリング法は、いくつかの、あるいはすべてのDNA/RNA修飾を並行して同定することを可能にする。
【0168】
本明細書に記載する方法は、以下に記載する一連の工程を含む。当業者には理解されるように、いくつかの態様では、様々な工程が省略され、および/または異なる順序で実行され得る。
【0169】
結合ドメインと標的核酸との接触
いくつかの態様において、本明細書に記載の方法は、本明細書に記載の組成物(例えば、基質、結合ドメイン、およびアダプター)を1以上の標的核酸と接触させる工程を含む。標的核酸は、DNA、RNA、またはDNAおよびRNAの組み合わせを含む。標的核酸は、例えば、生物の細胞または組織から単離できる。いくつかの態様では、標的核酸はフラグメント化されていてもよい。
【0170】
本明細書に記載の組成物と標的核酸との接触は、溶液中で起こりうる。例えば、1以上の標的核酸を含む組成物を、基質、結合ドメイン、アダプターを含む1以上の組成物と接触させることができる。いくつかの態様では、接触は希薄溶液中で起こり、1つの結合ドメインのみが各標的核酸と相互作用できる。
【0171】
いくつかの態様では、1以上の結合ドメインが基質に結合され、1以上の標的核酸が、基質に結合する結合ドメインと接触され得る。
【0172】
標的核酸は、1種の結合ドメインのみと接触させてもよく(すなわち、1種の非カノニカルな特徴を検出するため)、またはいくつかの態様では、標的核酸は、複数の非カノニカルな特徴を検出するために、2種以上の結合ドメインと接触させてもよい。例えば、標的核酸は、少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも20種、少なくとも30種、少なくとも40種、少なくとも50種、少なくとも60種、少なくとも70種、少なくとも80種、少なくとも90種、少なくとも100種、少なくとも150種、または少なくとも200種以上の異なるタイプの結合ドメインと接触させることができる。いくつかの態様において、標的核酸は、1~5、5~10、10~25、25~50、50~100、100~150、150~175、175~200、またはそれ以上の異なるタイプの結合ドメインと接触させることができる。複数種の結合ドメインを用いるとき、接触は同時に行ってもよいか(すなわち、標的核酸は、異なる非カノニカルな特徴を認識する複数の結合ドメインと同時に接触させられる)、または接触は順次行ってもよい(すなわち、標的核酸を、第1の非カノニカルな特徴を認識する第1の結合ドメインと接触させ、その後、第2の非カノニカルな特徴を認識する第2の結合ドメインと接触させる)。
【0173】
バーコードトランスファー
各結合ドメインは、標的核酸の非カノニカルな特徴と特異的に結合し、結合ドメインに近接して結合したアダプターは、標的核酸の3’末端または5’末端のいずれかとアダプターとの相互作用を可能にする。その後、アダプター(例えば、バーコードを含む、またはバーコードからなるアダプター)を標的核酸にトランスファーすることができる。いくつかの態様では、アダプターは切断可能なリンカーによって基質に結合されている。いくつかの態様では、アダプターが標的核酸に結合すると、アダプターは切断部位で放出される。いくつかの態様では、転写は、バーコード化核酸のオフターゲット生成を実質的に防止する環境下で行われる。このような環境は、例えば、アダプターおよび結合ドメインが定義された密度にあり、各結合ドメインおよびその同族アダプターが、第2の結合ドメインおよびその同族アダプターとは別の定義された空間を占める(例えば、各結合ドメインおよびアダプターのペアは、第2の結合ドメインおよびアダプターのペアと相互作用できない別のビーズ、スポット、またはアレイ上にある)環境である。いくつかの態様では、トランスファーは標的核酸をコピーすることによって行われ、標的核酸の標識/バーコード化コピーを生成する。例えば、少なくともバーコードおよびユニバーサルプライマー部位を含むアダプターが標的核酸にトランスファーされた場合、ポリメラーゼ連鎖反応(PCR)を用いて標的核酸のバーコード化コピーを生成できる。
【0174】
標的核酸(またはそのコピー)の修飾
いくつかの態様において、本方法は、バーコード化標的核酸(複数可)またはそのバーコード化コピー(複数可)を修飾する工程を含み得る。この修飾は、結合ドメインが非カノニカルな特徴に結合した後に起こり得て、いくつかの態様では、バーコードが標的核酸にトランスファーされた(または標的核酸のバーコード化コピーが生成された)後に起こり得る。
【0175】
修飾は、非カノニカルな特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて識別可能であり、したがって下流の配列決定工程で検出され得るように行われる。この目的のために、多くの異なるタイプの修飾が行われる。例えば、いくつかの態様において、修飾は、標的核酸(またはそのバーコード化コピー)のコピー中のポリメラーゼバイパスを防止し得る。
【0176】
いくつかの態様において、修飾は、部分的には、結合ドメインを化学的に修飾することによって達成される。これは、いくつかの態様では、結合ドメインが結合している間、標的核酸のコピー中に切断を誘導し得る。
【0177】
いくつかの態様において、修飾は、結合ドメイン(または結合ドメインなどのそのフラグメント)を標的核酸(またはそのバーコード化コピー)に光化学的に連結することを含む。核酸およびタンパク質を光化学的に連結する方法は当業者に知られている。例えば、光化学的結合は、結合ドメインおよび標的核酸を含む複合体を紫外線(UV)に曝すことによって誘導できる。
【0178】
いくつかの態様において、修飾は、結合ドメインが標的核酸に結合する部位またはその近傍の、例えば1~20塩基以内を編集することを含む。例えば、シトシンデアミナーゼまたはアデノシンデアミナーゼを用いて塩基を編集できる。塩基編集分子は、第2の認識エレメントを介して結合ドメインに結合できる。いくつかの態様では、シトシンデアミナーゼはプロテインAに遺伝的に融合し、抗体結合ドメインのFc領域に結合させることができる。いくつかの態様では、シトシンデアミナーゼはSpycatcherと遺伝子融合し、Spytag標識結合ドメインに結合させることができる。アデノシンデアミナーゼはアデノシン(A)をイノシン(I)に変換し、増幅酵素はシトシン(C)と塩基対を形成してチミン(T)からシトシン(C)への変異を導入する。シトシンデアミナーゼは、修飾部位の近くにあるシトシン(C)をウラシル(U)に変換し、グアニン(G)からアデノシン(A)への変異を導入する。非カノニカルな特徴を局在化するもう一つの方法は、NEB(登録商標)社のUSER(商標)(ウラシル脱グリコシラーゼおよびエンドヌクレアーゼVIIIの混合酵素)によってウラシル(U)を切断することである。
【0179】
増幅および配列決定
標的核酸(またはそのバーコード化コピー)が改変された後、それを増幅し、配列決定できる。この工程によってバーコードの配列が明らかになり、標的核酸中の結合ドメインがもともと結合していた非カノニカルな特徴と相関する。塩基配列の決定により、切断フラグメントの長さも明らかになり、これにより標的核酸中の非カノニカルな特徴を局在化できる。塩基配列の決定によって、非カノニカルな特徴の近くに変異が見つかることもあり、そこから非カノニカルな特徴の位置が情報的に導き出されることもある。変異は、脱アミナーゼ酵素による塩基編集の結果であり得るか、核酸標的の非カノニカルな特徴をコピーアンドペーストするために用いられる酵素(標的がDNAの場合はDNAポリメラーゼ、標的がRNAの場合は逆転写酵素)の塩基挿入エラー率が増加した結果かもしれない。非カノニカルな特徴は、酵素的バイパスエラー率を自然に増加させるかもしれないし、非カノニカルな特徴を化学的に修飾することによって効果を増幅させるかもしれない。
【0180】
したがって、ある態様では、本明細書に記載の方法は、バーコード化標的核酸またはそのコピーを配列決定する工程を含み得る。配列決定工程は、当技術分野で知られている何れかの適切な方法を用いて実施できる。例えば、配列決定は、次世代シーケンシング(NGS)法、超並列シーケンシング法、またはディープシーケンシング法を用いて実施できる。本発明の方法で使用できるNGSプラットフォームは多数ある。例えば、Illumina(登録商標) (Solexa(登録商標))のシーケンシングは、各塩基が蛍光シグナルを発すると同時にDNA塩基を識別し、核酸鎖に加えることで機能する。Roche(登録商標) 454シークエンシングは、ポリメラーゼによってヌクレオチドがDNAの新しい鎖に組み込まれた後、蛍光を用いてピロリン酸の遊離を検出する技術であるパイロシーケンシングに基づく。Ion Torrent(プロトン/PGMシーケンス)は、DNAポリメラーゼによる個々のヌクレオチドの組み込みからプロトン(H+)の直接放出を測定する。
【0181】
いくつかの態様では、標的核酸を検出するために配列決定は必須ではない。例えば、PCRを用いて標的核酸を検出できる。例えば、PCRは、標的核酸(例えば、バーコード)が存在するかどうかを検出するために使用できる。いくつかの態様では、標的核酸は、蛍光プローブ(例えば、蛍光標識ハイブリダイゼーションプローブ)を用いて検出される。いくつかの態様では、マイクロアレイまたは他の核酸アレイを用いて標的核酸を検出する。
【0182】
いくつかの態様では、核酸結合分子を介する反応によるバーコードの付加を検出するために、配列決定は必要とされない。例えば、DNA/RNA修飾の存在は、核酸電気泳動、蛍光ハイブリダイゼーションプローブ、PCR、ローリングサークル増幅、LAMP、またはバーコードによって誘発され得る他の核酸増幅法を用いて、関連するバーコードを検出することによって確認され得る。
【0183】
標的核酸上の非カノニカルな特徴の同定および定量のための例示的方法
いくつかの態様では、本明細書に記載の方法は、標的核酸上の修飾(すなわち、非カノニカルな特徴)を同定するだけでなく、存在する修飾の数を定量するためにも用いることができる。いくつかの態様では、本明細書に記載の方法は、複数の標的核酸上の複数の修飾(すなわち、非カノニカルな特徴)を同定し、存在する各修飾の数を定量するために使用される。
【0184】
いくつかの態様において、標的核酸中の非カノニカルな特徴を検出する方法は、(i)標的核酸を本明細書に記載の組成物と接触させる工程;(ii)(a)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程;および、(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程、を包含する。
【0185】
いくつかの態様において、複数の標的核酸中の2以上の非カノニカルな特徴を検出し、および/または定量するための方法は、(i)標的核酸を少なくとも2つの組成物と接触させる工程、ここで、各組成物は、結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインは、DNAまたはRNAの異なる非カノニカルな特徴に結合し、かつアダプターは、各結合ドメインによって特異的に結合される非カノニカルな特徴に特異的な核酸バーコード配列を含む;(ii)(a)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程;(iii)バーコード化標的核酸またはそのバーコード化コピーを、非カノニカル特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定できるように改変する工程;および、(iv)バーコード化標的核酸の配列を決定する工程、を含む。一部の態様では、本方法は、配列決定前にバーコード化標的核酸またはそのコピーを増幅することを含む。
【0186】
いくつかの態様において、複数の標的核酸を分析する方法は、(i)標的核酸を本明細書に記載される組成物と接触させる工程;(ii)(a)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程;(iii)バーコード化標的核酸またはそのバーコード化コピーを、非カノニカル特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定できるように改変する工程;および、(iv)バーコード化標的核酸を配列決定する工程、を含む。
【0187】
いくつかの態様では、上記の工程のいずれか1以上が少なくとも1回(例えば、少なくとも2回、少なくとも3回、少なくとも4回、少なくとも5回、少なくとも6回、少なくとも7回、少なくとも8回、少なくとも9回、少なくとも10回、またはそれ以上)繰り返される。ある側面において、上記の工程の1以上は、同時または逐次的に実行され得る。いくつかの態様では、工程(i)~(iii)を反復するたびに、同じまたは異なる結合ドメインが用いられる。一部の態様では、本方法は、配列決定前にバーコード化標的核酸またはそのコピーを増幅することを含む。
【0188】
ある態様では、修飾RNA転写物および非修飾RNA転写物を含むRNAサンプルが提供される。RNAサンプルの各転写物は、非カノニカルな特徴を含んでいてもいなくてもよい。次に、RNA転写物をビーズと接触させ、ビーズを非カノニカルな特徴に特異的な結合ドメイン(すなわち、図4Aのタイプ1、タイプ2およびタイプIIIのビーズ)に直接的または間接的に結合させる。修飾されたRNA分子はビーズに結合するが、未修飾のRNAは上清に残る。RNA修飾のレベルを定量するために、両画分(基質結合画分および上清画分)を処理し、配列決定ライブラリーに変換できる。未修飾RNA分子は、UFPおよびURPを含むアダプターで両端をキャップされ、一方、修飾RNA分子は、その修飾を示す(すなわち、それはビーズに結合したアダプターからトランスファーされる)バーコードを受け取る。
【0189】
いくつかの態様において、本明細書に記載される方法は、基質がビーズである基質を含む。いくつかの態様では、基質はビーズのプールである。いくつかの態様では、各ビーズは異なる結合ドメインを含む。いくつかの態様では、各ビーズは異なるアダプターを含む。いくつかの態様では、各ビーズは異なる結合ドメインおよびアダプターを含み、アダプターは結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含む。
【0190】
本発明は、複数の標的遺伝子を基質と接触させることを含む標的遺伝子の測定方法を提供し、ここで、基質はマイクロアレイ上に固定化されている。いくつかの態様では、マイクロアレイはスポット型(spotted)マイクロアレイである。ある態様では、マイクロアレイはプリント型(printed)マイクロアレイである。マイクロアレイの一例は、図4Bに示されている。いくつかの態様では、マイクロアレイ上の各スポットは、異なる結合ドメインおよびアダプターを含み、アダプターは、結合ドメインによって特異的に結合される非カノニカルな特徴に特異的な核酸バーコード配列を含む。いくつかの態様では、マイクロアレイ上の各スポットは、本明細書に記載される異なる組成物を含む。
【0191】
本発明は、複数の標的遺伝子を基質と接触させることを含む標的遺伝子の測定方法を提供し、ここで、基質はマイクロ流体デバイスのチャネルに固定化されている。いくつかの態様では、マイクロ流体デバイスは、1、2、3、4、5、6、7、8、9、10、20、30、40、または50チャンネルからなる。マイクロ流体デバイスの一例は、図4Cに示されている。いくつかの態様では、マイクロ流体デバイスの各チャンネルは、異なる結合ドメインおよびアダプターを含み、アダプターは、結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含む。いくつかの態様では、マイクロ流体デバイスの各チャンネルは、本明細書に記載される異なる組成物を含む。
【0192】
いくつかの態様において、本明細書の方法は、複数の標的核酸を分析することを含む。いくつかの態様において、本方法は、複数の標的核酸を本明細書に記載の何れかの組成物と接触させることを含む。
【0193】
ある側面において、本発明は、複数の標的核酸を分析するための方法を含み、該方法は、
(i)複数の標的核酸を含む溶液を、本発明の組成物と接触させること、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する;
(ii)以下のうち1つを実行すること:
(a)核酸バーコードを非カノニカルな特徴を含む標的核酸にトランスファーして、バーコード化標的核酸を生成すること、または
(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;
(iii)バーコード化標的核酸を増幅させること;および
(iv)バーコード化標的核酸の配列を決定すること
を含み、ここで、工程(i)および(ii)は順次または同時に行われる。
【0194】
ある側面において、本発明は、複数の標的核酸を分析するための方法を含み、該方法は、
(i)複数の標的核酸を含む溶液を、本発明の組成物と接触させること、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する;
(ii)以下のいずれか1つを実施すること:
(a)核酸バーコードを非カノニカルな特徴を含む標的核酸にトランスファーして、バーコード化標的核酸を生成するか、または
(b)非カノニカルな特徴を含む標的核酸のバーコード化コピーを生成すること;
(iii)バーコード化された標的核酸を増幅すること;および
(iv)バーコード化された標的核酸の塩基配列を決定すること、
を含み、ここで、工程(i)および(ii)は順次または同時に行われる。
【0195】
ある側面において、本発明は、複数の標的核酸を分析するための方法を含み、該方法は、
(i)標的RNA分子を逆転写してDNA-RNAヘテロ二本鎖分子を形成するか、標的二本鎖DNA分子を供給することにより、複数の標的核酸を供給すること;
(ii)複数の標的核酸を含む溶液を、本発明の組成物と接触させること、ここで、非カノニカルな特徴を含む標的核酸が結合ドメインに結合する;
(iii)トランスポザーゼを用いて、2つのアダプター(そのうちの少なくとも1つは核酸バーコードを含む)を、非カノニカルな特徴を含む二本鎖標的核酸にトランスファーして、バーコード化標的核酸を生成すること、
(iv)バーコード化された標的核酸を増幅すること;および
(v)バーコード化標的核酸の配列を決定すること
を含み、ここで、工程(ii)および(iii)は順次または同時に行われる、
【0196】
ある側面において、本発明は、複数の標的核酸中の複数の非カノニカルな特徴を検出するための方法を含み、該方法は、
(i)複数の標的核酸を含む溶液を、本発明の複数の組成物と接触させる工程;
ここで、工程(i)で接触される複数の組成物の数は、非カノニカルな特徴の数に等しいか、またはそれよりも多い;
ここで、複数の組成物の結合ドメインは、各々、DNAもしくはRNAの異なる非カノニカルな特徴に結合するか、または複数の結合ドメインがDNAもしくはRNAの同じ非カノニカルな特徴に結合する;および
ここで、複数の組成物のアダプターは各々、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の核酸バーコード配列を含む;
(ii)以下のうちの1つを実施する工程:(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーするか、または(b)複数の標的核酸のバーコード化されたコピーを生成する;
(iii)バーコード化された標的核酸を増幅する工程;および
(iv)バーコード化された標的核酸の塩基配列を決定する工程
を含む。
いくつかの態様では、トランスファーはトランスポザーゼによるアダプター転移である。
【0197】
ある側面において、本発明は、複数の標的核酸中の複数の非カノニカルな特徴を検出するための方法を含み、該方法は、
(i)本発明の複数の組成物を含むマイクロアレイ、ビーズ、および/または流体デバイスを提供すること;
ここで、工程(i)で提供される複数の組成物の数は、非カノニカルな特徴の数に等しいか、またはそれよりも多い;
ここで、前記複数の組成物の結合ドメインは、各々、DNAもしくはRNAの異なる非カノニカルな特徴に結合しているか、または複数の結合ドメインがDNAもしくはRNAの同じ非カノニカルな特徴に結合している;および
ここで、複数の組成物のアダプターは各々、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の核酸バーコード配列を含む;
(ii)複数の標的核酸を複数の組成物と接触させ、かつ以下のうちの1つを実施すること:(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーするか、または(b)複数の標的核酸のバーコード化コピーを生成する;
(iii)バーコード化された標的核酸を増幅すること;および
(iv)バーコード化された標的核酸の塩基配列を決定こと
を含む。
【0198】
いくつかの態様において、複数の標的核酸を分析する方法は、複数の標的核酸を含む溶液を、本明細書に記載の複数の組成物と接触させることを含み、各組成物の基質は、図4Aに示されるようなビーズである。
【0199】
いくつかの態様において、複数の標的核酸を分析する方法は、
(i)マイクロ流体デバイスを、複数の標的核酸を含む溶液と接触させる工程であって、ここで、前記マイクロ流体デバイスが、複数のチャネルを含み、各チャネルが、本明細書に記載の組成物を含み、前記アダプターが、結合ドメインによって特異的に結合される非カノニカルな特徴に固有の核酸バーコード配列を含み、かつ組成物の各々が、異なる非カノニカルな特徴を結合し、それにより、標的核酸上の複数の非カノニカルな特徴を結合する、工程;
(ii)(a)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程のいずれか;
(iii)バーコード化された標的核酸を増幅する工程;および
(iv)バーコード化された標的核酸の塩基配列を決定する工程
を含む。
【0200】
いくつかの態様において、複数の標的核酸を分析する方法は、複数の標的核酸を含む溶液を、本明細書に記載される複数の組成物と接触させることを含み、各組成物の基質は、図4Bに示されるようにマイクロアレイ上に固定化される。
【0201】
いくつかの態様において、複数の標的核酸を分析する方法は、
(i)複数の標的核酸を含む溶液を、本明細書に記載の複数の組成物と接触させる工程であって、ここで、各組成物は、アダプターが、結合ドメインによって特異的に結合される非カノニカルな特徴に特異的な核酸バーコード配列を含むマイクロアレイ上に固定化されており、かつ各組成物は、異なる非カノニカルな特徴を結合し、それによって標的核酸上の複数の非カノニカルな特徴を結合する、工程;
(ii)(a)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程のいずれか;
(iii)バーコード化された標的核酸を増幅する工程;および
(iv)バーコード化された標的核酸の塩基配列を決定する工程
を含む。
【0202】
いくつかの態様において、複数の標的核酸を分析する方法は、複数の標的核酸を含む溶液を、本明細書に記載の複数の組成物と接触させることを含み、各組成物の基質は、図4Cに示されるように、マイクロ流体デバイスのチャネルに固定化される。
【0203】
複数の標的核酸中の複数の非カノニカルな特徴を検出する方法であって、該方法は、
(i)複数の標的核酸を含む溶液を、本明細書に記載の複数の組成物と接触させる工程;
ここで、複数の組成物の結合ドメインは、各々、DNAもしくはRNAの異なる非カノニカルな特徴に結合するか、または複数の結合ドメインがDNAもしくはRNAの同じ非カノニカルな特徴に結合する;
ここで、工程(i)で接触される複数の組成物の数は、非カノニカルな特徴の数に等しいか、またはそれよりも多い、
ここで、複数の組成物のアダプターはそれぞれ、その組成物の結合ドメインによって特異的に結合される非カノニカルな特徴に固有の、または結合ドメインに固有の核酸バーコード配列を含み;
(ii)以下のいずれか1つを実施する工程:
(a)複数の組成物の各々の核酸バーコード配列を複数の標的核酸にトランスファーするか、または
(b)複数の標的核酸のバーコード化コピーを生成する;
(iii)バーコード化された標的核酸を増幅する工程;および
(iv)バーコード化された標的核酸の塩基配列を決定する工程、を含む。
【0204】
そのため、この方法では、それぞれが独自のバーコードを示す複数の結合ドメインで、同じ修飾を検出することが可能となる。
【0205】
いくつかの態様では、正規化プローブ(対照)は、標的核酸を含む溶液(表面結合、上清)にスパイクして、相対定量を可能にする。さらに、アダプター中に存在する可能性のある固有の分子バーコードをカウントすることによって、絶対定量を達成できる。多くのRNA修飾は低いコピー数で起こる。従って、標的核酸の修飾画分および非修飾画分を、所定のシーケンシング深度で低コピー数の転写産物に対して最適な感度を提供する比率で組み合わせることができる。このアプローチにより、RNA修飾の化学量論および存在量を測定できる。“化学量論”は相対数であり、非カノニカルな特徴を含む特定の遺伝子座のコピー数を、その遺伝子座の全コピー数で割ったものとして計算される。“存在量”とは、ある遺伝子座における核酸の非カノニカルな特徴の絶対出現数のことである。
【0206】
いくつかの態様では、複数の標的核酸を分析する方法は、ライゲーションによるバーコードトランスファーによるRNAプロファイリングと、cDNA切断による非カノニカルな特徴の局在化とを含み得る。その後、本明細書に記載される1以上の組成物をRNAサンプルに添加できる。組成物の結合ドメインがRNA修飾を認識し、アダプター(例えば、DNAバーコードを含むアダプター)がRNA標的の末端に結合される。いくつかの態様では、逆転写酵素が認識エレメントを越えてコピーするのを防ぐマーク(すなわち、修飾)を生成するために、標的RNAおよび結合ドメインを架橋(例えば、光化学的架橋)することができる。いくつかの態様では、ポリメラーゼ-RNA相互作用を破壊する、および/または同じ目的のために関与できる付加的な反応性基を提示する認識エレメントを選択し、操作することによって、架橋することなく停止点を作成できる。その後、一本鎖アダプターライゲーションを使って逆転写のためのプライマー結合部位を提供し、プライマー伸長によってcDNAを合成できる。cDNAは、転写物の末端がRNA修飾の位置を示すように合成される。修飾が局在化する分解能は、切断メカニズムの性質に依存する。
【0207】
cDNA分子は環化されていてもよい。例えば、タイプBアダプターを有するcDNA分子は、サイクリガーゼによって環化できる。環化されたcDNAを切断すると、鎖特異的な直鎖状cDNAフラグメントが得られ、PCR増幅を用いて配列決定ライブラリーに容易に変換できる。プライマーは、配列決定などの下流工程に有用なアダプターピースを導入するために使用され得る。
【0208】
いくつかの態様では、複数の標的核酸を分析する方法を用いて、反応ごとに1種のDNAまたはRNA修飾を検出/定量できる。いくつかの態様では、複数の標的核酸を分析する方法は、サンプル分割によって複数のDNA修飾またはRNA修飾を検出するために適合され得る。
【0209】
いくつかの態様では、トランスポザーゼは、本明細書に記載されるように、基質に結合している。ある態様では、タグメンテーションはバーコード化に用いられる。いくつかの態様では、図9に示すように、タグメンテーションがバーコード化に用いられる。トランスポザーゼは、原核生物および真核生物の両方に存在し、'カット・アンド・ペースト’メカニズムで、定義されたDNAエレメント(トランスポゾン)をゲノムの別の場所に移動させる触媒となる。トランスポザーゼ分子には、特定のRNA修飾を示す二本鎖DNAアダプターが負荷されている。トランスポザーゼは二本鎖DNAアダプターに結合し、二本鎖DNA基質の5’末端にライゲーションすることでアダプターを切断し挿入する。3’末端にはタグを付けず、生じたギャップはポリメラーゼ反応によって埋めることができる。いくつかの態様では、トランスポザーゼはDNA/RNAヘテロ二重鎖を基質として用い得る。タグメンテーション反応は一般的に、30-200ntの長さのフラグメントを生成し、サンプルインプットによって最適化できる。いくつかの態様では、結合ドメイン-トランスポザーゼ複合体を、フラグメント化されていない全RNAまたは濃縮/欠失したRNAに添加する。修飾されたRNA塩基を認識すると、トランスポザーゼは特定のバーコードをRNA/DNA二重鎖に挿入し、ユニバーサルプライマー部位およびリバースプライマー部位を付加する。適切なポリメラーゼを用いてギャップを埋めることで、ライブラリー調製は完了する。タグメンテーションは、特定のバーコードによってRNA修飾部位をフレーミングし、位置情報は、位置分解能を最適化する長さにトランスポザーゼ・リンカーを操作することによって得られる。いくつかの態様では、トランスポーズはTn5トランスポザーゼである。
【0210】
トランスポザーゼは多くの生物医学的適用に広く用いられている。例えば、大腸菌由来の高活性Tn5トランスポザーゼは、二本鎖の合成19bpモザイク末端(ME)認識配列に結合でき、この配列はあらゆる配列決定アダプターに付加できる。いくつかの態様において、ME-アダプターは、CTGTCTCTTATACACATCT(配列番号16)を含む。いくつかの態様において、ME-アダプターは、AGATGTGTATAAGAGACAG(配列番号24)を含む。いくつかの態様において、ME-アダプターは、TTTGTGAUGCGATGAACTCAGAGTGCTTNNNNNNNNNNNNAGATGTGTATAAGAGACAG(配列番号52)を含み、ここで、Nはバーコードである。いくつかの態様において、配列番号16を含むモザイク末端は、配列番52を含むME-アダプターにハイブリダイズされる。各トランスポザーゼ分子は同時に2つのMEタグ付きアダプターを付加する。Tn5トランスポザーゼは、二本鎖DNAまたはRNA/DNAヘテロ二本鎖を基質とするインビトロタグメンテーション反応(標的配列をフラグメント化し、配列決定アダプターで同時にタグ付けする)に利用されてきた。タグメンテーションの大きな利点は、使用する核酸の量を減らし、アッセイワークフローを大幅に簡略化できることである。タグメンテーションは一般的にピコグラム単位のDNAまたはRNAを用いて行われ、単一細胞アプローチに成功している。
【0211】
いくつかの態様では、結合ドメイン-酵素コンジュゲートは、RNA修飾、DNA修飾、またはRNAおよびDNA修飾の両方の修飾に特異的に結合し、トランスポザーゼを標的核酸に誘導する結合ドメインを含む。修飾特異的結合ドメインに結合したトランスポザーゼは、RNA/DNA二重鎖に特異的バーコードを挿入し、ユニバーサルプライマー部位およびリバースプライマー部位を付加する。タグメンテーションはマグネシウムイオンに依存しており、マグネシウムイオンの添加によってタグメンテーションが誘発され得る。タグ付けされた二重鎖の長さは反応条件によって異なり、30塩基対という短さに最適化できる。したがって、標的化タグメンテーションは、DNAまたはRNA修飾を最大30塩基対の塩基分解能で検出できる。
【0212】
いくつかの態様では、トランスポザーゼはDNA/RNA修飾を認識する結合ドメインに直接テザー結合または融合されないことがある。いくつかの態様において、トランスポザーゼは、DNA/RNA修飾を認識する結合ドメインの構造的要素に共有結合的または非共有結合的に結合するペプチドまたはタンパク質ドメインにテザー結合または融合され得る。いくつかの態様では、結合ドメイン、例えば抗体はスパイタグ(Spy-tag)ペプチドと遺伝子融合しており、一方トランスポザーゼはスパイキャッチャー(SpyCatcher)タンパク質と遺伝子融合している。スパイタグおよびスパイキャッチャーは自発的に共有結合を形成し、トランスポザーゼを修飾部位に標的化する。いくつかの態様では、トランスポザーゼはプロテインA、G、またはLに遺伝的に融合している。いくつかの態様では、トランスポザーゼはプロテインGに遺伝的に融合している。いくつかの態様では、トランスポザーゼはプロテインLに遺伝的に融合している。プロテインA、G、またはLは、IgG抗体の特定の領域に結合し、トランスポザーゼ活性をDNAまたはRNA修飾結合抗体に向ける。
【0213】
いくつかの態様では、トランスポザーゼは結合ドメインに共有結合したMEタグ付きアダプターに結合できる。アダプターはMEタグ付き一本鎖として存在し、ME相補体のハイブリダイゼーションがトランスポザーゼのインサイチュウでのローディングを誘発する。結合ドメインは2以上のMEアダプター分子を提示し、トランスポザーゼに2つのアダプターを付加できるようにできる。いくつかの態様では、ME-アダプター分子は同じ配列を有する。いくつかの態様では、MEアダプター分子は異なる配列を有する。いくつかの態様では、ME-アダプターはDNAまたはRNA修飾に特異的なバーコードを含む。
【0214】
本明細書に記載の方法は、疾患、障害、または状態を診断するために使用できる。例えば、いくつかの態様において、本方法は、それを必要とする対象において癌を診断するために用いられ得る。いくつかの態様では、キットは、1以上の治療に対する反応など、疾患、障害または状態を経時的にモニタリングするために用いられ得る。例えば、本キットは、がんの治療(すなわち、化学療法、放射線療法など)を受けている対象におけるエピジェネティックおよび/またはエピトランススクリプトームの経時的変化をモニタリングするために使用できる。いくつかの態様では、本方法は、それを必要とする対象からの細胞または組織を分析するために用いられ得る。例えば、血液サンプル、生検サンプル、剖検サンプルなどから単離された細胞や組織における非カノニカルな特徴を検出するために、本方法を用い得る。
【0215】
いくつかの態様において、本方法は、工業的発酵に用いられる細胞など、1以上の製品の生産に商業的に用いられる細胞におけるエピジェネティックな変化を検出および/またはモニタリングするために用いられ得る。いくつかの態様において、本方法は、植物細胞または組織におけるエピジェネティックな変化を検出および/またはモニタリングするために用いられ得る。
【0216】
核酸分析用キット
本明細書に記載の組成物は、キットで(例えば、キットの構成成分として)提供できる。例えば、キットは、組成物、またはその1以上の成分、および情報資料を含み得る。いくつかの態様において、キットは、本明細書に記載される2以上の組成物を含む。情報資料は、例えば、本明細書に記載の方法および/または組成物の使用に関する説明資料、教示資料、販売資料、またはその他の資料であり得る。キットの情報資料の形式は限定されない。いくつかの態様において、情報提供材は、組成物の製造に関する情報、分子量、濃度、有効期限、バッチまたは生産地情報などを含み得る。いくつかの態様では、情報資料は、キットを用いて診断または評価され得る障害および/または病状のリストを含み得る。
【0217】
いくつかの態様では、組成物は、本明細書に記載の方法に使用するのに適切な方法(例えば、使いやすいチューブ、適切な濃度など)で提供され得る。いくつかの態様では、キットは使用前に組成物の何らかの調製または操作を必要とし得る。いくつかの態様において、組成物は、液体、乾燥、または凍結乾燥の形態で提供される。いくつかの態様では、組成物は水溶液で提供される。いくつかの態様では、組成物は、滅菌されたヌクレアーゼを含まない溶液で提供される。いくつかの態様では、組成物は、分子自体を構成し得る核酸以外に核酸を実質的に含まない。
【0218】
いくつかの態様において、キットは、1以上のシリンジ、チューブ、アンプル、ホイルパッケージ、またはブリスターパックを含み得る。キットの容器は、気密性、防水性(すなわち、水分または蒸発の変化を防ぐ)、および/または遮光性を備え得る。
【0219】
いくつかの態様では、キットは、標的核酸の集団を分析する方法など、本明細書に記載の方法の1以上を実施するために用いられ得る。いくつかの態様において、キットは疾患、障害または病状を診断するために使用できる。例えば、いくつかの態様では、キットは癌の診断に使用できる。いくつかの態様では、キットは、1以上の治療に対する反応など、疾患、障害、または状態を経時的にモニタリングするために用いられ得る。例えば、本キットは、癌の治療を受けている対象のエピジェネティックおよび/またはエピトランススクリプトームの経時的変化をモニタリングするために使用できる。
【実施例
【0220】
以下の限定されない例は、本発明の組成物および方法の態様をさらに例示する。
【0221】
実施例1:結合ドメインの選択
シュードウリジン、イノシン、m5C、およびm6Aに特異的な結合ドメインは、バイオレイヤー干渉計(BLI)で測定した結合速度(オンレート)および解離速度(オフレート)に基づいて選択される。最初に、市販の抗体のスクリーニングを行う。目標は、オフレートを最小限に抑え、特異性の高い抗体を同定することである。
【0222】
BLI装置(Gator Prime)にプロテインGプローブ(Gator Bio、カタログ番号160006)を装填した。プロテインGプローブは、ほとんどのアイソフォームのIgG抗体に0.02~2000μg/mL結合する能力を有する。IgG抗体は、BLIシグナルの1nmシフトに相当する密度でプロテインGプローブ(リン酸緩衝生理食塩水(PBS)中5μg/μL抗体)上に固定化される。抗原のリアルタイムオンレートは、1以上の修飾を示すRNA標的の1~250nM溶液にBLIプローブを浸漬することで得られる。オフレートは、抗原を含まないPBS緩衝液にプローブを移すことによって生じる。同じ手順を、修飾されていないRNA鎖で繰り返す。試験RNAアナライトの分子量によっては、例えばストレプトアビジンと結合したビオチン標識RNAを用いるなど、高分子量のレポーター分子をRNAに結合させることによってシグナルを増幅させる必要がある。オフレートが最も低く、特定の標的に対するオフレート選択性が最も高い抗体(オフレート特異的/オフレート非特異的)が、さらなる特性解析のために選択される。
【0223】
実施例2:抗体およびDNAアダプター分子を共有結合させたビーズの作製
本実施例では、抗体およびDNAアダプターを共有結合させたビーズ表面の調製について概説する(図1A)。抗体は活性を維持するために部位特異的に連結され、抗体およびDNAアダプターの密度は独立して調整可能である。抗体に対してアダプターを10倍過剰に使用することで、副生成物を最小限に抑えながら、効率的なバーコーディング収率を実現する。
【0224】
標準的な1-エチル-3-(-3-ジメチルアミノプロピル)カルボジイミド塩酸塩(EDC)を用いて、カルボキシル化磁性ビーズ(Thermo Fisher, Dynabeads(登録商標)M-270 Carboxylic Acid)をアミンカップリング用に活性化させる。EDCで活性化された表面は、不動態化(passivating)分子(COOH-PEG4-アミン、Broadpharm カタログ番号 BP-20423)、抗体反応性リンカー(DBCO-PEG10-アミン、Broadpharm カタログ番号 BP-24181)、DNA反応性リンカー(mTET-PEG3-アミン、Broadpharm カタログ番号 BP-26276)の3成分系(ternary)混合物で官能化されている。抗体はサイト-クリックケミストリー(Thermo Fisher, カタログ番号 S20026)を用いてDBCOカップリング用に活性化される。サイト-クリックケミストリーは、IgG抗体のFc領域のグリコシル化部位にアジド基を導入する。アミノ修飾DNAアダプターはTCO-PEG4-NHSエステル (Broadpharm,カタログ番号 BP-22418)で官能化されている。
【0225】
3’固定化ライゲーションバーコードを有する表面を生成するために、以下の一般的な構築技術のアダプターが用いられる(配列番号1):
5’末端は酵素的ライゲーションを可能にするためにリン酸化されており、次いでRNA修飾を示す7bバーコード(下線)、少なくとも3塩基の固有の分子バーコード(NNN、Nは何れかのヌクレオチド)が続き、イルミナアダプター(太字)、18原子のヘキサエチレングリコールスペーサー(iSp18)、USER酵素(NEB)の切断によって表面から遊離するためのフィラーATリピートに囲まれた1個のウラシル、および3’アミノ部分(3AmMO)が続く。
【0226】
5’固定化プライマー伸長バーコードを有する表面は、配列番号2
の一般的な構築技術を用いて調製され、ここで5AmMC6は5’-アミン部分であり、CACTCAGT配列はプライマー伸長によるバーコード化のためのスペーサーである。
【0227】
ビーズの最終的な官能基化は段階的に行われる。まず、アジド活性化抗体をDBCO部位に固定化し、続いてmTet部位をTCOアダプターで充填する。
【0228】
実施例3:アダプターを負荷したプロテインGおよび抗体を提示するビーズの調製
本実施例では、実施例2の代替法を説明する。DNAアダプターをビーズ表面に直接固定化する代わりに、プロテインGに付着させる(図1B)。プロテインGはまた、親和性結合によってIgG抗体を固定する役割も果たしている。
【0229】
磁気ビーズ(Thermo Fisher)表面のプロテインGのリジン残基は、S-HyNicリンカー(Vector Labs、カタログ番号 50-204-5741)で標識されている。連鎖球菌から単離された全長のプロテインGのサイズは63kDaであるが、市販のものはIgG抗体との親和性をサブナノモル(subnanomolar)に維持しながら、より小さくなるように設計されている(例えば、Abcam, Uniprot ID: P19909)。プロテインGのIgG結合部位を機能的損傷から保護するために、HyNic反応は標識後0.2MグリシンpH2で溶出される犠牲的な(sacrificial)IgG抗体の存在下で行われる。HyNic修飾はS-4FBリンカー(Vector Labs, カタログ番号50-204-5743)でアミン基が活性化されたDNAアダプター(例えば、配列番号1または2)と速やかに反応する。
【0230】
犠牲的抗体を除去し、目的のRNA修飾特異的抗体を負荷すれば、ビーズの調製は完了である。
【0231】
実施例4:抗体の平面アレイの調製
本実施例では、DNAハイブリダイゼーションプローブを介して抗体を平面上に固定化するDNAマイクロアレイ技術を用いる(図1Fおよび図4B)。パターニング後、表面には48のスポットが形成され、各スポットにはRNA修飾特異的抗体が1つずつ、RNA修飾特異的バーコード化i7アダプターおよびユニバーサルi5イルミナアダプターと共に配置される。本実施例では、i7アダプターはUSER酵素ミックスで切断するための1個のウラシルを含み、i5アダプターはFpG酵素で切断するための1個の8-oxoGを含む。目標は、パターン化された表面をフローセルに組み込み、捕捉した核酸配列のクローン増幅とそれに続くインサイチュウ配列決定を可能にすることである。フォワード鎖またはリバース鎖の選択的切断は、それぞれリード1およびリード2に先行する鎖の直線化に不可欠な工程である。フローセルをペルチェ(Peltier)素子にマウントし、ポンプ駆動の流路系(fluidics system)に接続することで、温度制御および液体交換の自動化が可能になる。これらの機能は、実施例6で概説したように、完全に自動化されたライブラリー調製ワークフローを構築するために利用される。
【0232】
顕微鏡スライドは、合成DNAプローブのインクジェットプリントによってパターン化され、一般的な接着手順でフローセルに組み込まれる。顕微鏡スライドには48のスポットがあり、各スポットには3つの異なるオリゴヌクレオチドが混合されている。i7アダプターは、図2Dに従ってプライマー伸長によるバーコード化を可能にするため、3’末端に8bスペーサー領域を示す。DNAプローブの密度は、バーコーディングを容易にするために実験的に最適化されている。RNA修飾特異的抗体は、サイト-クリックケミストリー(Thermo Fisher)を用いてDNAアドレスで部位特異的に標識されている。抗体は、DNAアドレスを介して捕捉プローブにハイブリダイゼーションすることでアレイに負荷される。
【0233】
実施例5:ビーズプールを用いたライゲーションによるRNA修飾特異的バーコード化
本実施例では、実施例2に従って調製したビーズプールを用いてRNA修飾をプロファイリングするワークフローを説明する。各ビーズタイプには、1種のRNA修飾を標的とする抗体およびバーコードがライゲーションによって標的RNAに転写されるDNAアダプターが提示される(図5)。バーコードの同一性は次世代シーケンシングによって決定され、RNA修飾の特性が明らかになる。
【0234】
4種のビーズが用意される:ビーズタイプ1は、m6A抗体およびライゲーションによるバーコーディング用DNAアダプター(配列番号1)を提示する。さらに3種のビーズが、m5C、シュードウリジン、イノシンに対する抗体、ならびに異なるバーコードを有するDNAアダプターを用いて生成される(配列番号3-5)。ビーズはプールされ、化学的に平均100bのサイズにフラグメント化され、脱リン酸化された100ngのRNAサンプルと共にインキュベートされる。未修飾RNAを洗浄した後、修飾RNAの3’末端は、T4 RNAリガーゼ1の作用により、表面に結合したアダプターに連結される。DNAアダプターをプライミングし、dNTPs、DTT、テンプレートスイッチングオリゴヌクレオチド(AGACGTGTGCTCTTCCGrGrGrG、ここでrはリボヌクレオチドを表す;配列番号6)、SuperScript IV逆転写酵素、および適切な酵素バッファーを含む単一の反応で、第1鎖および第2鎖合成を行う。得られたcDNAライブラリーは、illuminaの完全なアダプターを導入するためにPCR増幅され、塩基配列が決定される。
【0235】
実施例6:フローセル上でのプライマー伸長とその後の増幅によるRNA修飾特異的バーコード化
本実施例では、実施例4に従って作製したパターン化アレイをRNA修飾のプロファイリングに用いる。パターン化されたアレイの利点は、流路系(fluidics system)に組み込むことで、完全自動化されたライブラリー調製ワークフローを可能にすることである。本実施例では、mRNAに存在する8つのRNA修飾(m5C、m6A、m7G、m1A、m3C、ac4C、イノシン、シュードウリジン)をすべて検出する。それぞれの修飾について、アレイは少なくとも3つの同族抗体のスポットを示す。
【0236】
RNAサンプルを、95℃にて塩化マグネシウムで処理することにより化学的にフラグメント化する。RNAフラグメントを、エビアルカリホスファターゼおよびT4ポリヌクレオチドキナーゼで脱リン酸化させる。RNA溶液を抗体アレイに接触させて、修飾されたRNA鎖が抗体によって特異的に捕捉され、RNAフラグメントが修飾度によってスポットに分離される。RNA鎖の3’スペーサーはIllumina i7アダプターにハイブリダイズし、アダプターはSuperscript IV逆転写酵素によって伸長され、バーコード化cDNA鎖が生成される(図6)。i5アダプター相補体は、実施例5に記載されているように、逆転写反応にテンプレートスイッチングオリゴヌクレオチドを含めることによって、第1鎖の3’末端に付加される。表面を0.1M水酸化ナトリウムで処理すると、RNAが加水分解され、抗体が剥がれ落ちる。DNAは、耐熱性DNAポリメラーゼ(例えば、Bstポリメラーゼ)の存在下、温度サイクルによって増幅される(図7)。温度プロトコールは3段階を含む:(1)37℃でのDNAおよび表面結合アダプターのアニーリング、(2)60℃でのアダプターの伸長、(3)融解温度を下げるためのホルムアミド、エチレングリコール、ベタイン、プロパンジオールなどの変性剤の存在により、60~95℃での変性。この工程により、バーコード化されたcDNAのクローンコピーが作成される。抗体の密度が低い状態でこのプロセスを実施すると、合成による直接配列決定(SBS)に適した、空間的に分離したモノクローナルクラスターが生成される(図8)。
【0237】
実施例7:固定化されたトランスポザーゼを用いたm6A修飾RNAのバーコード化
本実施例では、RNA修飾の抗体を介したプルダウンと、その後の転移酵素を利用して、迅速なワンステップ反応で修飾RNAフラグメントにバーコードを導入する(図9および図22A)。
【0238】
タグメンテーションは、NGSライブラリー調製のための確立されたプロセスであり、Tn5トランスポザーゼのMgイオン依存性の“カット&ライゲーション”活性を意味する。トランスポザーゼは19bpの短い“モザイク末端(ME)”二重鎖に選択的に結合し、この二重鎖はタグメンテーションに用いるDNAアダプターに付加できる。
【0239】
本実施例では、ビーズの表面にトランスポソームが担持されている(図1G)。トランスポソームは、2つのモザイクエンド(ME)含有アダプター分子を担持するトランスポザーゼ二量体から構成される。本明細書で用いるMEおよびME’(それぞれモザイク末端およびモザイク末端プライム)は、Tn5トランスポザーゼが自発的に結合する二本鎖配列5’-CTG TCT CTT ATA CAC ATC T-3’(配列番号7)を表すために用いられる。この配列は、例えばユニバーサルプライマー部位またはイルミナアダプターフラグメントなど、何れかのDNA配列に融合させることができる(例えば、図13参照)。
【0240】
ストレプトアビジンビーズに、等モル比のイルミナi5およびi7 MEアダプターを、m6A抗体と共に、全ローディング能の5%、10%、20%または40%で負荷した(図1G)。i7 MEアダプターの配列は、以下の通りであった:
di5 MEアダプターの配列は以下の通りであった:
ME配列は太字で示し、NNNNNNNNはバーコードを示す。
【0241】
ビーズ調製後、Superscript IV逆転写酵素を用いて、非修飾IVT RNAおよびm6A修飾IVT RNAの混合物を逆転写した。その後、逆転写したRNAサンプルを、MEアダプターおよびm6A抗体を共固定化したストレプトアビジンビーズを用いて免疫沈降させた。ビーズを洗浄した後、Tn5トランスポザーゼ(Diagenode, カタログ番号C01070010-10)を、結合バッファー(50mM HEPES pH 7.5、300mM NaCl、0.1mM EDTA、0.05% Tween(登録商標)(ポリソルベート)-20)中でMEアダプターに負荷した。Mg2+含有タグメンテーションバッファー(10mM Tris-HCl pH 8.5、5mM MgCl、10% DMF)を加えると、捕捉したDNA-RNA二重鎖にアダプターが挿入される。このフォーマットでは、タグメンテーション産物は確実にビーズ上に捕捉され、ギャップフィルPCR(0.5uMフォワードプライマー、0.5uMリバースプライマー、NEBNext Ultra II Q5 (カタログ番号M0544X, New England Biolabs)を17-19サイクル(72℃で5分、98℃で2分、98℃で10秒-65℃で75秒のサイクルをnサイクル、および最終伸長は65℃で5分)行った。DNAライブラリーの塩基配列を決定し、バーコードのデコンボリューションおよび配列アライメントを行った。
【0242】
カバレッジプロット(図22B)は、m6A修飾RNAの選択的タグメンテーションを証明する、m6Aを含むフラグメントの有意な濃縮を示す。MEアダプターを全結合能の5%または10%でビーズに負荷すると、ME密度が高い場合よりも濃縮のシグナル対ノイズがわずかに向上し、ライブラリー調製収率も高くなった(データ示さず)。この実験は、MEアダプターおよびm6A抗体を共固定化したビーズを用いて、m6A修飾RNAを検出することが可能であることを示す。複数のRNA修飾を検出するには、それぞれ1種の抗体を示す複数のビーズタイプ、および抗体をコードするバーコードを有するMEアダプターを混合すればよい。
【0243】
実施例8:複数のm6A修飾を有する長鎖RNAのリードフェージング
本実施例は、同じ種類の複数の修飾の位置をマークするためのベース編集工程を導入することで、実施例7を拡張したものである(図10)。
【0244】
全長RNA鎖は逆転写され、m6A抗体およびビオチン標識MEアダプターを提示するビーズで捕捉される。洗浄後、ADAR-プロテインLコンジュゲートを導入する。プロテインLはIgG抗体の軽鎖に特異的かつ高い親和性で結合する。ADAR酵素は二本鎖RNAと、A>I(イノシン)変異を有するDNA/RNAヘテロ二本鎖中のDNA鎖を編集する。ADAR-プロテインLコンジュゲートの連結構造は、ADAR活性をm6A修飾の直接近傍に限定するようなものである。ADARによって導入されたアデニンからイノシンへの変異(A-to-I)はm6Aの位置を示す。塩基編集後、Tn5トランスポザーゼが表面に連結されたMEアダプターに結合することで、トランスポソームが構築される。転移タグ配列決定は、同じバーコードで同じ分子に由来するリードを識別し、短いシーケンスリードから長い転写産物を再構築することを可能にする(図11)。
【0245】
実施例9:結合ドメイン選択
シュードウリジン、イノシン、m5C、m6Aに特異的な結合ドメインは、バイオレイヤー干渉計(BLI)で測定された結合速度(オンレート)および解離速度(オフレート)に基づいて選択された。最初に、市販の抗体のスクリーニングが行われた。その目的は、抗体のオンレート・オフレートを測定し、抗体の特性とバーコードアッセイでの性能との相関を調べることであった。
【0246】
BLI装置(Gator Prime)にストレプトアビジンプローブ(カタログ番号160002、Gator Bio)を添加した。m5C、イノシン、m6Aまたはシュードウリジン塩基を中心に有する5’ビオチン化RNAオリゴは、1:1の抗体:RNA複合体の形成を確実にするため、疎な表面被覆で固定化した。塩基を修飾していないオリゴを陰性対照とした。抗体の1~250nM溶液にBLIプローブを浸漬することにより、抗原のリアルタイムオンレートを得た。オフレートは、抗体を含まないPBS緩衝液にプローブを移動させることによって得た。同じ手順を修飾されていないRNA鎖で繰り返した。
【0247】
図14A-14Gは、m6A、m5C、イノシンおよびシュードウリジンに対するいくつかの市販抗体のオンレートおよびオフレートを示す(Ab02(m6A)=MA5-33030、Thermo Fisher;Ab05(m6A)=345E11、Synaptic Systems;Ab08(m6A)=Rb212B11、Synaptic Systems;Ab09(m6A)=C15200082-50、Diagenode;Ab10(イノシン)=C15200251、Diagenode;Ab16(m5C)=MA5-24694、Thermo Fisher;Ab19(シュードウリジン)=D347-3、MBL)。特異的抗原結合のオンレートは10から10-1-1であるのに対し、オフレートは10-4から10-2-1の間で変動が大きい。対応する解離定数Kは3.5~150nMである。一般的に、陰性オリゴ対照ではごくわずかな結合しか観察されず、標的特異性が確認された。ELISAデータに基づくと、ほとんどの抗体は修飾されていないRNAに弱く結合し、そのKは特異的標的に対するそれよりも100-500倍大きい。
【0248】
図14A-14Gに示された抗体はすべて、抗体を介したバーコーディングアッセイに有用であり(実施例6を参照)、この方法が様々な抗体特性に適合することを示している。ナノモル親和性の抗体は、ハイブリドーマ技術によって容易に入手可能であり、この方法の多様性を証明している。K値が150nMを超えると、RNA標的の捕捉効率が低くなる。
【0249】
実施例10:修飾核酸の免疫沈降およびバーコーディング用ビーズの調製
本実施例では、2種のIgG抗体を親和性結合でプロテインG磁性ビーズに負荷した。ある抗体は、あるタイプの核酸修飾に特異的に結合する。もう一方の抗体は核酸結合活性を有さないが、DNAアダプターで標識されている(レポーター抗体)(図1E)。アダプター設計の一部は、修飾バーコード(MBC)である。以下の実施例では、核酸修飾は抗体介在反応でMBCを標的核酸にトランスファーさせることで検出した。このビーズ構造、特にレポーター抗体の目的は、抗体を直接標識することなく、アダプターから標的核酸へのバーコードのトランスファーを顕著に容易にする空間的な方向でDNAアダプターを提示することである(図1E参照)。各ビーズは“モノクローナル”であり、単ー一種の修飾特異的抗体およびユニークなMBCを有する単一タイプのREPAを含むように負荷された(図15C)。
【0250】
レポーター抗体は、mTET-PEG5-NHSエステル(カタログ番号BP-22945、Broadpharm)。核酸結合活性を有さないIgG抗体であれば何れも使用可能であり、例えば、モノクローナル抗ウシ血清アルブミン抗体を用い得る(カタログ番号MA1-82941、Thermo Fisher)。mTET-NHSエステルおよびレポーター抗体のカップリングは、最大1mgの抗体および30mol等量のリンカーを含むリン酸緩衝生理食塩水(PBS)中で行った。反応を25℃で12時間進行させ、得られた抗体-リンカー複合体を7kDA MWCO Zeba脱塩カラムで精製した(カタログ番号89882、Thermo Fisher)で過剰のリンカーを除去した。別の反応において、アダプターDNAオリゴ(例えば、/5AmMC6/T/iSp18//iSp18//AGACGTGTGCTCTTCCGATCTNNNCAGCTTTCACTCAGT、5AmMC6は5’アミノ修飾であり、iSp18はPEGスペーサー(配列番号23)である、Integrated DNA Technologies)を、トランス-シクロオクテン(TCO)-PEG4-NHSエステル(カタログ番号BP-22418、Broadpharm)、PBS緩衝液中、25℃、12時間であった。最終生成物はアセトン沈殿で精製した。iSp18リンカーユニットは、空間的柔軟性およびリーチの両方を提供し、記載されたフォーマットでのバーコード化に必要である。最終的なアダプター標識レポーター抗体は、mTET抗体を化学量論当量のTCOと共にインキュベートすることで調製した。抗体はmTETで高標識されているため、最終的な標識率は、定量的収率で反応するTCO標識アダプターのモル当量によって決定された。得られた抗体-オリゴ複合体のサイズを変性SDSゲル電気泳動で分析すると、標識化学量論がTCO-オリゴ過剰に比例して滴定することがわかる(図15A)。3.5倍モル過剰のTCO-オリゴは、プロテインGの結合を阻害し得る過剰標識を防ぎながら、未修飾抗体の発生をなくすため理想的である。この手順により、IgGサブタイプおよびアダプター配列に関係なく、平均2-3個のアダプターを表示するレポーター抗体を作製した。
【0251】
標準的なバーコーディング反応では、2μLのプロテインG ダイナビーズ(カタログ番号10004D、Thermo Fisher)に、修飾特異的抗体およびレポーター抗体を含む合計0.5ugの混合物を負荷した。抗体はPBSTに室温で30分間負荷し、余分な抗体はPBSTで3回洗浄して除去した。通常、核酸特異的抗体とレポーター抗体の50:50の混合物を用いた。比率を変えても、レポーター抗体の20%から80%の範囲では、バーコーディング特異性に大きな影響はないが、バーコーディングの収率は変わる。色素標識修飾RNAの捕捉、バーコード化、溶出、変性ゲル電気泳動で測定すると、バーコード化収率(バーコード化されたRNA分子を捕捉されたRNA分子で割った比率)は、レポーター抗体の表面密度が高くなるにつれて増加する(図15B)。
【0252】
実施例11:修飾塩基を真理モデルとしたインビトロ転写RNAの作製
本実施例では、修飾含量が既知のRNA標的の調製について説明する。得られた修飾RNA標的は、下記のバーコーディング実験において真理セットとして用いた。
【0253】
インビトロ転写(IVT)RNAは、HiScribe(商標)T7 High Yield RNA Synthesis キット(カタログ番号E2040S, New England Biolabs)のマニュアルに従った。IVT反応に用いるテンプレートDNAアンプリコンは、T7プロモーター配列を有するプライマーを用いてゲノムファージまたは細菌DNAの領域を増幅し、PureLink(商標)PCR Purification キット(カタログ番号K310001、Thermo Fisher)を用いてアンプリコンを精製することにより作製した。T7タグアンプリコン作製には以下のゲノムを用いた(New England Biolabs):ΦX174ウイルスDNA(カタログ番号N3023S)、M13mp18一本鎖DNA(カタログ番号N4040S)、ラムダDNA(カタログ番号N3011S)およびFLuc対照プラスミド(カタログ番号E2040S)である。IVT反応は、PCRアンプリコンを示すT7プロモーターをインプットとし、天然のNTPの10~50%をメチルアデノシン-5’-三リン酸(m6ATP、カタログ番号N-1013-5、Trilink)、イノシン-5’-三リン酸(ITP、カタログ番号N-1020、TriLink)、5-メチルシチジン-5’-三リン酸(m5CTP、カタログ番号N-1014、TriLink)またはシュードウリジン-5’-三リン酸(YTP、カタログ番号N-1019、TriLink)などの修飾NTPで置換した。IVT反応はDNAse Iで処理した(カタログ番号M0303S, New England Biolabs)を用いてDNAテンプレートを除去し、Monarch(登録商標)RNA Cleanup Columns(カタログ番号T2047L、New England Biolabs)を用いて精製した。
【0254】
この手順で、異なるゲノムに由来するIVT RNAからなるモデル標的プールを作製した。例えば、PhiX RNAは修飾されておらず、Fluc RNAはm6Aを含み、M13mp18 RNAはm5Cを含み、Lambda RNAはイノシンを含んでいた。
【0255】
修飾がわかっているモデルRNAプールをバーコーディング実験に用いて、塩基配列を決定した。バーコーディングの特異性は、免疫沈降したサンプルおよびバーコーディングしたサンプルのリードをアライメントし、正しい修飾バーコード(MBC)を示すRNAフラグメントの数を数え、結果を入力サンプルに対して正規化することによって決定される。
【0256】
実施例12:ユニバーサルスペーサー配列の付加による下流修飾分析用RNAサンプルの調製
本実施例は、RNA分子のプールにスペーサー配列を付加するプロトコールを提供する。プロキシミティ・エンコーディング(proximity encoding)の間、スペーサーはビーズアンカー型アダプターのスペーサー’相補体に結合し、DNAポリメラーゼ(図2D)または逆転写酵素(図2G)によって伸長される。
【0257】
RNAは、1X T4 RNA リガーゼI緩衝液(New England Biolabs)で90℃、8-25分間インキュベートしてフラグメント化した。この処理により、フラグメントのピークサイズは60-150塩基となった。その後、RNAの3’末端をRNase阻害剤(カタログ番号AM2694, Thermo Fisher)存在下で、37℃で30分間、T4ポリヌクレオチドキナーゼ(カタログ番号T4PK-200、MCLab)の添加により脱リン酸化した。DNAポリメラーゼまたは逆転写酵素によるプライマー伸長によって、スペーサーをライゲーションしてRNAをバーコード化する。0.3ユニット/uL T4 RNAリガーゼI、10uMスペーサー(/5Phos/NNACTGAGTG)、1X T4 RNAリガーゼIバッファー、1mM ATP、1mM DTT、15% PEG-8000、0.2ユニット/uL RNアーゼ阻害剤を含む反応において、20℃にて1時間、スペーサーを結合させた。スペーサーをライゲーションしたRNAは、1X RNAClean XPビーズ(カタログ番号A63987、Beckman Coulter)で精製した後、バーコーディングアッセイに用いる準備をした。図16は、1.5kbのIVT RNAフラグメントの混合物をフラグメント化した後、スペーサーをライゲーションして得られたフラグメントサイズを示す。スペーサーの添加により、見かけのフラグメントサイズは104ntから109ntに増加した。
【0258】
実施例13:逆転写によるコード化、テンプレートスイッチングおよびプロテインGビーズを用いたm6A、イノシンおよびm5Cの多重検出
本実施例では、RNA修飾を検出するためのバーコーディング工程を統合した、エンドトゥエンド(end-to-end)のライブラリー調製ワークフローについて説明する。バーコーディングは、逆転写酵素を用いたRNA標的およびアダプターの双方向伸長によって達成される(図17A)。
【0259】
RNAサンプル中のm5C、m6Aおよびイノシンを検出するには、最低3種のビーズが必要であり、実施例10に従って調製する。第1のビーズタイプは抗m6A(カタログ番号345E11、Synaptic Systems)およびMBC-3
を含むアダプターに結合したレポーター抗体を提示する。第2のビーズタイプは抗イノシン作用(カタログ番号C15200251、Diagenode)およびMBC-4
を含むアダプターに結合したレポーター抗体を示す。第3のビーズタイプは抗m5C抗体(カタログ番号MA5-24694、Thermo Fisher)およびMBC-5
を含むアダプターを有するレポーター抗体である。
【0260】
アダプターには、スペーサー’配列(3’末端の太字)、MBC(下線)、UMI(NNN)およびi7イルミナアダプター(UMIの5’配列)が含まれた。
【0261】
サンプルごとに、等容量の各負荷したビーズタイプを組み合わせた。最初のアッセイ工程は、実施例4に従って調製したスペーサー結合RNAの免疫沈降(IP)であった。ビーズプール、0.5~50ngのRNA、10ユニット/uLのRNase阻害剤を1XPBST中でインキュベートした。インキュベーション後、ビーズをPBSTバッファーで洗浄し、1X Superscript IV逆転写バッファー(カタログ番号18090050、Thermo Fisher)に再懸濁した。洗浄によって非特異的に結合したRNAは除去され、特異的なRNA修飾-抗体複合体は保存された。次の工程では、i7アダプターおよびユニバーサルi5アダプターを含むMBCを標的RNAに加えた。この工程では、逆転写酵素がRNA標的の3’末端を伸長してMBCおよびi7アダプターをコピーし、同時にアダプターの3’末端を伸長してcDNAを合成する。テンプレートのスイッチには、M-MLV変異体のSuperscript IIまたはIV(カタログ番号18064014 または 18090200, Thermo Fisher)、マキシマHマイナス(カタログ番号EP0751、Thermo Fisher)またはSmartscribe逆転写酵素(カタログ番号18064014、Takara Bio)などの、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)活性を有する逆転写酵素が必要であった。TdT活性はDNA/RNAヘテロ二重鎖の末端にC-テールを付加し、イルミナi5アダプターを含み、3つのG塩基で終わるテンプレートスイッチングオリゴ(TSO)の結合およびコピーを可能にする。
【0262】
IPビーズを逆転写反応(1X SSIV緩衝液、0.5u/uL Superase-In、5u/uL SSIV逆転写酵素、1mM dNTP、2uMテンプレートスイッチングオリゴ“TSO”)に加え、23℃にて15分間、次いで50℃にて60分間インキュベートした。TSOのいくつかのバージョンは、例えば、CTACACGACGCTCTTCCGATCTrGrG+G(rGは、riboGであり、+GはLNA-Gである)(配列番号28)、CTACACGACGCTCTTCCGATCTrGrGrG(配列番号29)、または
のように、良好に機能した。反応完了後、上清を標準的なIlluminaインデックスプライマー(0.5uMフォワードプライマー、0.5uMリバースプライマー、NEBNext Ultra II Q5(カタログ番号M0544X, New England Biolabs)を10~13サイクル行った(98℃で30秒、98℃で10秒、65℃で75秒、および65℃で5分をnサイクル)。
【0263】
ライブラリーの塩基配列が決定され、各RNAフラグメントに付加されたMBCのバイオインフォマティックなデコンボリューションにより、RNA修飾が同定され、特定の遺伝子座に局在した。図17Bは、5ngのプールされたIVTをインプットとして、およびSuperScript IV逆転写酵素を使用した、記載したバーコード法で得られた配列決定結果を示す。図17Cは、エンコーディングにMaxima Minus逆転写酵素を用いた同じ結果を示す。この実施例では、IVT RNAプールは70%の非修飾PhiX RNA、10%のm6A修飾FLuc-RNA、10%のイノシン修飾Lambda RNA、10%のm5C修飾M13 RNAから構成されていた。このプロットは、各MBCのほとんどが正しいゲノムに結合していることを示しており、SuperScript IVデータセットはより良いシグナル対ノイズ比を示した。
【0264】
実施例14:エンコード用DNAポリメラーゼを用いたm6A、イノシンおよびm5Cの多重検出
本実施例では、プライマー伸長によるバーコーディングの異なるバージョンについて説明し、テンプレートスイッチングによるライブラリー調製に代わる方法を提供する。逆転写によるバーコーディングと同様に、このワークフローでは、上流のRNAプールにスペーサー配列をライゲーションする必要がある。スペーサー伸長RNAを免疫沈降させた後、DNAポリメラーゼ(Klenow fragment exo-)を用いて、上鎖のプライマー伸長により標的RNAにバーコードを付加した(図19A)。
【0265】
RNAサンプル中のm5C、m6Aおよびイノシンを検出するために、実施例10に記載のように3種のビーズを調製した。しかしながら、この実施例では、アダプター配列の3’末端は、例えば/3SpC3/(Integrated DNA Technologiesによる命名法を参照)によって伸長が阻止された。ビーズローディングおよびIPは、実施例13で説明したのと同じプロトコールに従った。IP洗浄後、捕捉したRNAを示すビーズを1X Klenowバッファー(50mM Tris pH7.9、2mM MgCl、50mM NaCl、0.1% Tween(登録商標)-20)に再懸濁し、同量のバーコーディングミックス(200uM dNTP、0.5ユニット/uL Klenow フラグメント エキソ- (カタログ番号KPIM-200、MCLAB)、50mM Tris pH7.9、2mM MgCl、50mM NaCl、0.1% Tween(登録商標)-20)を添加した。クレノウ(Klenow)反応を室温にて5分間行った。バーコード化RNAは、5mM DTTおよび1mM EDTAを添加した水中で37℃にて5分間インキュベートすることによりビーズから溶出した。溶出したRNAを、i5アダプター(2uM I5 RNAアダプター(/5SpC3/rCrUrArCrArCrGrArCrGrCrUrCrUrUrCrCrGrArUrCrU)(配列番号31)、1XT4 RNAリガーゼバッファー、1mM ATP、10% PEG-8000、0.5u/uL Superase-in、1u/uL T4ポリヌクレオチドキナーゼ、1u/uL T4 RNAリガーゼ1)を添加し、室温にて1時間インキュベートした。3Xアンピュア(Ampure)ビーズで洗浄した後、アダプターをライゲーションしたRNAを55℃にて10分間逆転写した(1uM cDNAプライマー(AGACGTGTGCTCTTCCG)(配列番号32)、0.5mM dNTP、1X SSIVバッファー、5mM DTT、2u/uL RNAseOUT、10u/uL SuperScript IV逆転写酵素)。要すれば、この時点でcDNAをNaOH処理し、中和し、そして3X Ampureビーズで洗浄してもよいし、インデックスPCR(cDNA、0.5uMフォワードプライマー、0.5uMリバースプライマー、NEBNext Ultra II Q5)のインプットとしてそのまま10~13サイクル(98℃で30秒間、次いで98℃で10秒間、65℃で75秒間、および65℃で5分間のサイクルをnサイクル繰り返す)を使用してもよい。
【0266】
このワークフローを用いて、BLIで特徴付けられた抗体をシングルプレックス実験でスクリーニングした(実施例9および図14A-14G)。すなわち、修飾特異的抗体およびレポーター抗体を負荷した1種のビーズを、m6A修飾Fluc RNA、イノシン修飾Lambda RNAおよび5C標識M13 RNA、ならびに場合によっては非修飾PhiX RNAを含むIVT RNAプールに暴露する。各抗体について、配列決定解析に基づくと、MBCの少なくとも80%が正しいゲノムと関連していた(図18A-18G)。3プレックス反応(図19A)で3種のビーズを組み合わせると、対応するシングルプレックス反応(図19B)に比べてバックグラウンドがわずかに上昇するが、同様の結果が得られた。
【0267】
実施例15:実施例15:コード化のためのスプリントライゲーションを用いたm6Aおよびm5Cの同時検出
本実施例は、プライマー伸長ではなく、酵素的ライゲーションによって修飾特異的バーコードを導入する。具体的には、この実施例は、T4 DNAリガーゼによって触媒されるDNAスプリントライゲーションを用いる(図20A)。
【0268】
この実施例では、アダプターを3’-アミン基を介してレポーター抗体に結合させ、ライゲーションのために5’-リン酸を示した(実施例10参照)。さらに、必要に応じてアダプター鎖を切断できるようにウラシル塩基を導入した。 (MBC3:/5Phos/CAGCTTTNNNAGATCGGAAGAGCACACGTCT/ideoxyU/ATATATA/iSp18//iSp18//iSp18//iSp18/T/3AmMO/(配列番号33);および、MBC4:/5Phos/CCTATATNNNAGATCGGAAGAGCACACGTCTTAATATTTAATAT/ideoxyU/ATATAT/iSp18//iSp18//iSp18//iSp18/T/3AmMO/)(配列番号34)。
【0269】
1つはMBC3およびAb05を有するレポーター抗体(m6A)と、もう1つはMBC4およびAb16を有するレポーター抗体(m5C)の2種のビーズを調製した。スペーサー修飾RNAサンプルのIPは上記のように行った。スプリントオリゴヌクレオチドの混合物を含むライゲーションミックスにRNAを負荷し、洗浄したビーズを添加して、バーコード化を誘導した。スプリントは、片側が標的RNAのスペーサー領域にハイブリダイズし、もう片側がアダプターの7nt長のMBC3またはMBC4に相補的になるように設計した。スプリントの1セットはスペーサー領域の6塩基(AAAGCTGCACTCA/3SpC3/ (7-6 MBC3) (配列番号18)およびATATAGGCACTCA/3SpC3/ (7-6 MBC4) (配列番号19))にハイブリダイズし、もう1セットはスペーサー領域の3塩基(AAAGCTGCAC/3SpC3/ (7-3 MBC3) (配列番号20)および ATATAGGCAC/3SpC3/ (7-3 MBC4) (配列番号21))に結合する。スプリントの両側、ユニバーサルスペーサーおよびアダプターの相補体の長さおよび配列は、近接ライゲーションによるコード化を確実にするために、抗体による修飾認識以外の機構による結合安定化を阻止するように調整された。エンコーディングのためにプライマー伸長に依存するワークフローでは、スペーサーおよびスペーサー補体はIP工程中に存在した(すなわち、図17Aおよび図19Aに示す)が、このプロトコールではIP後にスプリントを追加し、核酸ハイブリダイゼーションとIPを区別した。m6Aおよびm5Cを同時に検出するために、ライゲーションミックスは0.5uMのMBC3およびMBC4スプリント、10ユニット/uLのT4 DNAリガーゼ、50mMのTris-HCl、10mMのMgCl、1mMのATP、10%のPEG8000が含まれた。アダプターライゲーション完了後、i7アダプターをプライミングし、次いで実施例13に記載したように、テンプレートのスイッチングを伴う逆転写およびPCR増幅を行った。ライブラリーの塩基配列を決定し、各RNAフラグメントに付加されたMBCをバイオインフォマティックにデコンボリューションすることによって、RNA修飾を同定し、特定の遺伝子座に局在させた(図20Bおよび20C)。このワークフローは、逆転写によるコード化で報告されているのと同様の特異性で、m6Aおよびm5Cを検出できた(実施例13)。
【0270】
実施例16:A-テーリングおよびエンコーディング例
本実施例では、プライマー伸長によるコード化のためのユニバーサル配列が、RNAの3’末端のA-テーリングによって導入され(図21A)、その結果、一本鎖スペーサーライゲーション(実施例12)の必要性がなくなった。A-テーリング反応は、一本鎖ライゲーションよりも収率が高く、不偏的であることが知られており、トランスクリプトームカバレッジを向上させるという意味で、アッセイ感度に有利である。
【0271】
1.5kbのIVT RNAを、1X T4 RNA リガーゼ Iバッファー(New England Biolabs)で90℃にて20分間インキュベートして150塩基にフラグメント化した。RNAの3’末端は、T4ポリヌクレオチドキナーゼ(カタログ番号T4PK-200、MCLab)存在下、RNase阻害剤(カタログ番号AM2694, Thermo Fisher)を37℃にて30分間添加して脱リン酸化した。反応液に5ユニットの大腸菌ポリ(A)ポリメラーゼ(カタログ番号M0276L, New England Biolabs)、0.95mM ATP、0.05mM dATP、1X 大腸菌ポリ(A) ポリメラーゼ緩衝液を加え、37℃にて10分間インキュベートした。A-テール化 RNAを1.8倍量のRNAClean XPビーズで精製した。
【0272】
RNAサンプル中のm6Aを検出するために、Ab05(m6A)およびm6A(MBC000)を識別するバーコードを含むアダプターに結合したレポーター抗体
を提示するビーズを調製した。アダプター構造は、A-テール RNAにハイブリダイズするポリ(dT)配列、MBC(下線部)、UMI(NNNNNNNN)、i7イルミナアダプター(UMIの5’配列)を含む。
【0273】
各サンプルについて、ビーズを負荷し、実施例13と同じ方法でA-テール化RNAフラグメントのIPを行った。簡潔には、ビーズ、0.05~50ngのRNA、10ユニット/uLのRNase阻害剤を1X PBST中でインキュベートした。インキュベーション後、ビーズを洗浄し、固定化したイルミナi7アダプターの伸長によって逆転写した。TSOによるテンプレートスイッチングにより、PCR増幅および配列決定に必要なイルミナi5アダプターが導入された。反応終了後、上清を、標準的なイルミナインデックスプライマー(1uMフォワードプライマー、1uMリバースプライマー、NEBNext Ultra II Q5(カタログ番号M0544X, New England Biolabs)を用いてPCRを10~13サイクル行った(98℃で30秒、次いで98℃で10秒、65℃で75秒および最終に伸長を65℃で5分間のサイクルをnサイクル)。ライブラリーの塩基配列が決定され、各RNAフラグメントに付加されたMBCのバイオインフォマティックなデコンボリューションにより、RNA修飾が同定され、特定の遺伝子座に局在した。
【0274】
図21Bは、0.5ngのプールされたIVTをインプットとして用いて、記載したバーコーディング法で得られた配列決定結果を示す。この実施例では、IVT RNAプールは70%の非修飾PhiX RNA、10%のm6A修飾FLuc-RNA、10%のイノシン修飾Lambda RNA、10%のm5C修飾M13 RNAから構成されていた。プロットは、MBCが正しいゲノムと関連していることを示す。
【0275】
実施例17:逆転写によるコード化、テンプレートスイッチング、ストレプトアビジンビーズを用いたmRNA中のm6A、イノシンおよびm5Cの多重検出
本実施例では、ヒト肺がん不死化細胞株(A549、カタログ番号636141、Takara)由来のmRNA濃縮サンプル中のRNA修飾を検出するための、統合バーコード化工程を含むエンドトゥエンド(end-to-end)のライブラリー調製ワークフローについて説明する。バーコーディングは、逆転写酵素を用いたRNA標的およびアダプターの双方向伸長によって達成される(図17A)。
【0276】
RNAサンプル中のm5C、m6Aおよびイノシンを検出するには、最低3種のビーズが必要である。ビオチン化アダプターおよびプロテインGをストレプトアビジンコートしたビーズ(カタログ番号65305、Thermo Fisher)、次いで修飾特異的抗体をアフィニティー結合させた(図1D)。第1のビーズタイプは抗m6A(カタログ番号MA5-3303、Thermo Fisher)およびMBC-111

を含むアダプターを提示する。第2のビーズタイプは抗イノシン(カタログ番号PM098、MBL)およびMBC-112

を含むアダプターを示した。第3のビーズタイプは抗m5C(カタログ番号MA5-24694、Thermo Fisher)およびMBC-113

を含むアダプターを特徴付けた。
【0277】
アダプターには、スペーサー配列(3’末端の太字)、MBC(下線)、UMI(NNNNNNNNNNN)、i5イルミナアダプター(UMIの5’側の配列)が含まれた。
【0278】
サンプルごとに、等量の各ビーズを組み合わせてIPの基質とした。最初のアッセイ工程は、実施例12に従って調製したスペーサーライゲーションRNAのIPである。ビーズプールを10uLの50ngのRNAおよび10ユニット/uLのRNase阻害剤と共に1XTBST中で混合し、30分間インキュベートする。インキュベーション後、ビーズを1XTBSTバッファーで洗浄し、1X Superscript IV逆転写バッファー(カタログ番号18090050, Thermo Fisher)に再懸濁した。洗浄により非特異的に結合したRNAを除去し、特異的RNA修飾-抗体複合体を保持した。逆転写酵素はRNA標的の3’末端を伸長し、それによってMBCおよびi5アダプターをコピーし、同時にアダプターの3’末端を伸長してcDNAを合成した。
【0279】
IPビーズを逆転写反応(1X Superscript IVバッファー、0.5u/uL Superase-In、5u/uL Superscript IV逆転写酵素、1mM dNTP、2uMテンプレートスイッチングオリゴ、“TSO”(AGACGTGTGCTCTTCCGATCTrGrGrG)(配列番号9)に加え、23℃にて15分間、次いで50℃にて60分間インキュベートした。反応終了後、ビーズを1XTBSTで洗浄し、0.1N NaOHで変性させてRNAを除去し、さらに1XTBSTで洗浄して中和した。ビーズに付着させたcDNAを、標準的なイルミナインデックスプライマー(0.5uMフォワードプライマー、0.5uMリバースプライマー、NEBNext Ultra II Q5 (カタログ番号M0544X、New England Biolabs))を含む反応混合物にビーズを直接加えて、17~19サイクル(98℃で30秒、その後98℃で10秒、65℃で75秒および65℃で5分のサイクルをnサイクル)でPCR増幅した。
【0280】
ライブラリーをイルミナシーケンサーで配列決定し、各RNAフラグメントに付加されたMBCのバイオインフォマティックデコンボリューションにより、RNA修飾を同定し、特定の遺伝子座に局在させた。図23Aは、IP RNAのテクニカルトリプリケートおよび非濃縮(インプット)サンプルのグローバルバーコード表示を示す。mRNAのm6A修飾は、イノシンまたはm5Cよりも5-10倍頻繁に起こることが知られているため、予想通り、IPサンプルはMBC111リードの濃縮を示す。リードをアライメントし、各バーコードのリードのスタックアップをIPサンプルと入力サンプルで比較し、MACS2でピークをコールした。図23Bに遺伝子内のコールされたピークの位置を示す。MBC111-m6Aのピークコールが3’末端側にシフトしているのは、m6Aの修飾が3’UTR(非翻訳領域)側に起こるという既知のバイアスと一致する。図23Cは、各修飾および各複製サンプルについてコールされたピークの数をベン図で示したものである。信頼度の高いピークの数、すなわち3つの複製すべてに出現したピークの数は、m6Aで6,805、イノシンで773、m5Cで2741であり、これは他の方法で報告されたこれらの修飾の修飾部位の数と一致している。
【0281】
実施例18:抗体-プロテインA-Tn5複合体を用いたm6Aの検出
本実施例では、m6A修飾部位に特異的なDNA-RNAヘテロ二重鎖のタグメンテーションのための、抗体およびプロテインA-Tn5融合タンパク質を含む固定化コンジュゲートの使用について説明する(図1H)。タグメンテーション反応は、RNA修飾を識別するバーコードを導入する。このフォーマットの利点は、トランスポザーゼが抗体と直接結合しているため、タグメンテーション活性がRNA修飾部位に限定されることである。
【0282】
m6A特異的ビーズは、m6A抗体およびプロテインA-Tn5分子を含むコンジュゲートを形成することにより調製した(Diagnode, カタログ番号C01070002)を溶液に溶解し、プロテインGビーズに固定化した(図1Hおよび24A)。プロテインGと同様に、プロテインAも抗体のFc領域と強く結合するため、Tn5はm6A抗体結合ポケットに直接近接してビーズ上に固定化される。各Tn5ダイマーには、m6Aを示すバーコードを含む一対のモザイク末端(ME)アダプターが負荷された(I7 MEアダプター):5’Phos- CTGTCTCTTATACACATCT (配列番号16)をCAAGCAGAAGACGGCATACGAGAT-NNNNNNNN-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG (配列番号39)にハイブリダイズさせた;i5 MEアダプター:5'Phos- CTGTCTCTTATACACATCT (配列番号16)をAATGATACGGCGACCACCGAGATCTACAC-NNNNNNNN-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG (配列番号40)にハイブリダイズさせた。
【0283】
まず、Superscript IV逆転写酵素およびポリ-dTオリゴプライマーを用いて、非修飾IVT RNAおよびm6A修飾A-テール化 IVT RNA(実施例11参照)の混合物を含むRNAを逆転写した。次に、DNA-RNAヘテロ二重鎖をIPバッファー(50mM HEPES pH7.5、300mM NaCl、0.1M EDTA、0.05% Tween(登録商標)-20)中のビーズに加え、30分間免疫沈降(IP)させた。この工程で、m6A抗体はm6A修飾RNAに選択的に結合した。ビーズを洗浄し、Mg2+含有タグメンテーションバッファー(10mM Tris-HCl pH8.5, 5mM MgCl, 10% DMF)を加えてタグメンテーション反応を開始した。タグメンテーションされたDNA-RNAヘテロ二重鎖をギャップ充填し、標準的なイルミナインデックスプライマーまたはライブラリー増幅プライマー(0.5uMフォワードプライマー、0.5uMリバースプライマー、NEBNext Ultra II Q5(カタログ番号M0544X、New England Biolabs)を含む反応混合物を用いて17~19サイクル(72℃で5分、98℃で2分、その後98℃で10秒、65℃で75秒のサイクルをnサイクル、最終伸長65℃で5分)でPCR増幅させた。ライブラリーはIlluminaシークエンサーで配列決定され、RNA修飾は、各RNAフラグメントに付加されたバーコードのバイオインフォマティックデコンボリューションによって同定され、特定の遺伝子座に局在した。
【0284】
図24Bは、インプット(対照)および免疫沈降サンプルのリードカバレッジプロットを比較したものである。m6A修飾領域は、免疫沈降されたサンプルにおいて顕著なリードの濃縮を示すが、他の領域はRNAインプットと比較して枯渇している。最適なプロテインA-Tn5の負荷比率を決定するため、抗体に対して2倍、4倍、8倍過剰のプロテインA-Tn5を用いて実験を行った。すべての条件でm6Aの特異的濃縮が見られたが、プロテインA-Tn5比が高くなると特異性が改善されることなくライブラリー収量に悪影響が出たため、プロテインA-Tn5の2-4倍過剰が理想的であると結論した。これらの実験から、抗体-pA-Tn5複合体によるIPとタグメンテーションの組み合わせは、複合体RNAプール中のm6Aを検出するのに効果的であることが証明された。
【0285】
本開示の主題は、特徴の様々な組み合わせおよびサブ組み合わせを含む特定の例示的な態様を参照してかなり詳細に説明および示されてきたが、当業者であれば、本開示の範囲内に包含されるものとして、他の態様ならびにその変形および変更を容易に理解するであろう。さらに、このような態様、組合せ、およびサブ組合せの記載は、特許請求される主題が、特許請求の範囲に明示的に記載された特徴以外の特徴または特徴の組合せを必要とすることを伝えることを意図するものではない。したがって、本開示の範囲は、以下の添付の特許請求の範囲の精神および範囲内に包含されるすべての修正および変形を含むことを意図している。
図1-1】
図1-2】
図1-3】
図2-1】
図2-2】
図2-3】
図3-1】
図3-2】
図4-1】
図4-2】
図5
図6-1】
図6-2】
図7
図8-1】
図8-2】
図9-1】
図9-2】
図10-1】
図10-2】
図11
図12-1】
図12-2】
図13
図14-1】
図14-2】
図14-3】
図14-4】
図15-1】
図15-2】
図16
図17-1】
図17-2】
図17-3】
図18-1】
図18-2】
図18-3】
図18-4】
図18-5】
図18-6】
図18-7】
図19-1】
図19-2】
図20-1】
図20-2】
図20-3】
図21-1】
図21-2】
図22-1】
図22-2】
図23-1】
図23-2】
図23-3】
図23-4】
図23-5】
図24-1】
図24-2】
【配列表】
2024541478000001.xml
【国際調査報告】