IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イーエムベーアー−インスティテュート フュール モレクラレ バイオテクロノジー ゲゼルシャフト ミット ベシュレンクテル ハフツングの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023155370
(43)【公開日】2023-10-20
(54)【発明の名称】核酸を修飾して同定する方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20231013BHJP
   C12Q 1/6853 20180101ALI20231013BHJP
【FI】
C12Q1/6869 Z
C12Q1/6853 Z
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2023139052
(22)【出願日】2023-08-29
(62)【分割の表示】P 2019556245の分割
【原出願日】2018-04-13
(31)【優先権主張番号】17166629.0
(32)【優先日】2017-04-13
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】18165712.3
(32)【優先日】2018-04-04
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】513048519
【氏名又は名称】イーエムベーアー-インスティテュート フュール モレクラレ バイオテクノロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【弁理士】
【氏名又は名称】武居 良太郎
(74)【代理人】
【識別番号】100196977
【弁理士】
【氏名又は名称】上原 路子
(72)【発明者】
【氏名】シュテファン エル.アメレス
(72)【発明者】
【氏名】ブライアン ライヒホルフ
(72)【発明者】
【氏名】ベローニカ アー.ヘルツォーク
(72)【発明者】
【氏名】ヨハンネス ツーバー
(72)【発明者】
【氏名】マティーアス ムハール
(57)【要約】
【課題】修飾された核酸を検出する方法を好ましくは自動化検出が可能になる程度まで簡単化する。
【解決手段】本発明により、ポリ核酸(PNA)を同定する方法として、PNAを用意する工程と;水素結合パートナーを付加または除去してそのPNAの1個以上の核酸塩基を修飾することによりその1個以上の核酸塩基の塩基対形成能力を変化させる工程と;相補的な核酸をそのPNAと塩基対形成(修飾された少なくとも1個の核酸塩基との塩基対形成を含む)させる工程と;少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置において、その相補的な核酸の配列を同定する工程を含む方法が提供される。
【選択図】なし
【特許請求の範囲】
【請求項1】
ポリ核酸(PNA)を同定する方法であって、
PNAを用意する工程と;
水素結合パートナーを付加または除去してそのPNAの1個以上の核酸塩基を修飾することによりその1個以上の核酸塩基の塩基対形成能力を変化させる工程と;
相補的な核酸をそのPNAと塩基対形成(修飾された少なくとも1個の核酸塩基との塩基対形成を含む)させる工程と;
少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置において、その相補的な核酸の配列を同定する工程を含む方法。
【請求項2】
前記修飾が、塩基対形成の挙動を変化させ、そのことによってAとT/Uの間と、CとGの間の優先的な塩基対形成を、A、T/U、C、Gから選択された天然の核酸塩基と比べて変化させる、請求項1に記載の方法。
【請求項3】
前記修飾工程が、チオールで修飾された核酸塩基を含めることによる、請求項1または2に記載の方法。
【請求項4】
水素結合パートナーを含むアルキル化剤を用いて前記チオール核酸塩基をアルキル化することをさらに含む、請求項3に記載の方法。
【請求項5】
前記チオール核酸塩基を酸化することをさらに含む、請求項3に記載の方法。
【請求項6】
前記修飾が、前記水素結合パートナーを含むアルキル化剤を用いてウリジンの4位をアルキル化することを含む、請求項1または2に記載の方法。
【請求項7】
前記PNAが1つ以上の4-チオウリジンまたは6-チオグアノシンを含む、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記PNAが、前記塩基対形成能力を変化させる修飾を有する細胞内で合成される、請求項1~7のいずれか1項に記載の方法。
【請求項9】
修飾された核酸塩基、好ましくはチオールで修飾された核酸塩基を、細胞内での生合成を通じて前記PNAの中に組み込み、好ましくは1つ以上の核酸塩基の修飾が、水素結合パートナーを前記修飾された核酸塩基に付加または除去することを含む、請求項1~8のいずれか1項に記載の方法。
【請求項10】
修飾された少なくとも1個の核酸塩基との塩基対形成により、修飾されていない核酸塩基との塩基対形成ではなく、他の点ではその核酸塩基との違いがない別のヌクレオチドとの塩基対形成がなされる、請求項1~9のいずれか1項に記載の方法。
【請求項11】
前記PNAがRNAまたはDNAを含むか、RNAまたはDNAからなる、請求項1~10のいずれか1項に記載の方法。
【請求項12】
A、G、C、U、又はTから選択された各タイプのヌクレオチドについて、前記修飾されたPNAが、修飾されたヌクレオチドよりも多数の天然のヌクレオチドを含む、請求項1~11のいずれか1項に記載の方法。
【請求項13】
前記PNAが、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数、かつ30個までの修飾されたヌクレオチドを含む、請求項1~12のいずれか1項に記載の方法。
【請求項14】
PNAを用意する前記工程が細胞内でそのPNAを発現させることを含み;
前記方法はさらに、
前記PNAをその細胞から単離し;
その細胞内で、および/または単離後に、前記PNAの1個以上の核酸塩基を修飾し;
ここで、細胞内または単離後のその修飾が、または細胞内と単離後を合わせたその修飾が、1個以上の核酸塩基の水素結合パートナーを付加または除去することによって前記1個以上の核酸塩基の塩基対形成能力を変化させることを含む、請求項1~13のいずれか1項に記載の方法。
【請求項15】
1個以上の細胞を少なくとも2つの培養段階または増殖段階で培養するか増殖させ、
ここで、1つの培養段階または増殖段階は、修飾されたヌクレオチドを、生合成されたPNAに組み込むことを含み、ここで、水素結合パートナーの付加または除去によってそのPNAは修飾されている、
別の培養段階または増殖段階は、生合成されたPNAへの修飾されたヌクレオチドのそのような組み込みが欠けているか、又は修飾されたヌクレオチドが生合成されたPNAにもう一方の培養段階または増殖段階とは異なる濃度で組み込まれている;あるいは、
前記方法が、少なくとも2個の異なる細胞の生合成されたPNAに、または少なくとも2つの異なる細胞群に修飾されたヌクレオチドを組み込むことを含み、ここで、好ましくはその2個の異なる細胞、またはその2つの異なる細胞群への組み込みが比較される、請求項1~14のいずれか1項に記載の方法。
【請求項16】
前記2つの培養段階または増殖段階の生合成されたPNAを前記細胞から回収するか、少なくとも2個の異なる細胞、または2つの異なる細胞群の生合成されたPNAを前記細胞から回収し、好ましくは混合もし、特に好ましくはPNAの出所である細胞に応じてPNAに標識することと、前記PNAへの相補的な核酸の塩基対形成が、転写、好ましくは逆転写による相補的なポリ核酸鎖、好ましくはDNA鎖の生成を含むことが含まれる、請求項15に記載の方法。
【請求項17】
前記相補的なポリ核酸鎖の配列を求め、その鎖の配列を比較することをさらに含んでいて、ここで、水素結合パートナーの付加または除去による修飾の結果として変化した相補的な核酸は、修飾なしのその相補的な核酸との比較によって同定が可能である、請求項16に記載の方法。
【請求項18】
相補的な核酸の同定された配列を、少なくとも、少なくとも2個の細胞内の少なくとも1個の修飾された核酸塩基と相補的な位置で比較するか、細胞内の少なくとも2つの異なる増殖段階における少なくとも1個の修飾された核酸塩基と相補的な位置で比較することを含み、ここで、前記少なくとも2個の細胞または少なくとも2つの増殖段階は、その少なくとも2個の細胞または少なくとも2つの増殖段階の間での遺伝子の発現の違いを持ち、好ましくは遺伝子の発現の違いが、細胞内の少なくとも1個の遺伝子の抑制または刺激によって起こる、請求項1~17のいずれか1項に記載の方法。
【請求項19】
請求項1~18のいずれか1項に記載の方法を実施するためのキットであって、チオールで修飾された核酸塩基と、チオールで修飾されたその核酸塩基をチオール基の位置でアルキル化するのに適したアルキル化剤を含み、そのアルキル化剤が、水素結合ドナーまたは水素結合アクセプタを含み、前記アルキル化剤はヨードアセトアミドであることが好ましいキット。
【請求項20】
プライマーと、A、G、C、及びTから選択されたヌクレオチドと、逆転写酵素を含むか、これらの組み合わせを含み、好ましくはこれらの構成要素をすべて含む、請求項19に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核酸のプロセシングとシークエンシングの分野に関する。
【背景技術】
【0002】
ヌクレオチド類似体である4-チオウリジン(s4U)や6-チオグアノシン(s6G)などは、例えば天然の酵素によって新生RNAに容易に組み込まれる(Tani他、Genome Res. 第22巻、947~956ページ(2012年))。よく知られた類似体として5-ブロモウリジン(5BrU)、5-エチニルウリジン(5-EU)、6-チオグアノシン(s6G)、4-チオウリジン(s4U)があり、これらは細胞によって容易に組み込まれてさらに、抗体検出、環付加反応、チオール特異的な反応性と親和性それぞれのための独自の生理化学的特性を提供する(Eidinoff他、Science. 第129巻、1550~1551ページ(1959年); Jao他、PNAS第105巻、15779~15784ページ(2008年);Melvin他、Eur. J. Biochem. 第92巻、373~379ページ(1978年);Woodford他、Anal. Biochem. 第171巻、166~172ページ(1988年);Dolken他、RNA第14巻、1959~1972ページ(2008年);Rabani他、Nat Biotechnol. 第29巻、436~442ページ(2011年))。4-チオウリジン(s4U)は、RNA発現の動態を研究するために最も広く用いられているヌクレオチドである。s4Uは、他のヌクレオチドと同様、電気穿孔やリポフェクションを必要とすることなく細胞に迅速に取り込まれる。細胞では、細胞のウリジン-キナーゼによるリン酸化によってリン酸化されたs4Uが蓄積したプールが生成し、それが、さまざまなタイプの細胞(ハエ、マウス、ヒトの細胞が含まれる)内で新たに合成されるRNAに効果的に組み込まれる(Dolken、2008年、上記文献)。さらに、ハエとマウスの体内では、4-チオウラシルを、トキソプラズマ(Toxoplasma gondii)のウラシルホスホリボシルトランスフェラーゼ(UPRT)が細胞のタイプに特異的な発現をすることと組み合わせて利用することで、生体内転写産物に、細胞のタイプに特異的な標識をすることができる。このUPRTは、ウラシル(または4-チオウラシル)のN1窒素にリボース5-リン酸をカップルさせて(4-チオ)ウリジン一リン酸を生成させ、それがRNAに組み込まれる(Cleary他、Nat Biotechnol. 第23巻、232~237ページ(2005年))。4-チオウリジン(s4U)代謝RNA標識を利用して細胞内におけるRNAの生合成、プロセシング、代謝回転の動態を特徴づけている現在のプロトコルは、s4U内のチオール基の可逆的ビオチニル化を通じた[例えばN-[6-(ビオチンアミド)ヘキシル]-3'-(2'-ピリジルジチオ)プロピオンアミド(HPDP-ビオチン)またはビオチンがカップルしたメタンチオスルホン酸塩(MTS-ビオチン)を通じた]生化学的分離を利用している(Cleary他、2005年、上記文献)。しかしあらゆる生化学的分離法と同様、基礎となるプロトコルは、時間がかかることに加え、典型的にはビオチニル化効率(特に短いRNA種に適用するとき)と標的外反応性が理由で小さな信号対雑音比という問題に遭遇する(Duffy他、Mol Cell. 第59巻、858~866ページ(2015年);Neymotin他、RNA 第20巻:1645~1652ページ(2014年))。
【0003】
WO 2006/125808 A1には、チオール化されたRNAを含有する新たに転写されたRNAをマイクロアレイに基づいて分析する方法が記載されている。
【0004】
WO 2004/101825 A1とWO 2016/154040 A2は、RNAを生合成標識して分離する方法に関する。
【0005】
Miller他、Nature Methods第6巻(6)、2009年:439~441ページには、ショウジョウバエで4-チオールウラシル餌供給源を通じてRNAに標識することが記載されている。
【0006】
Schwalb他、Science 第352巻(6290)、2016年:1225~1228ページは、全mRNAの合成と分解を評価することのできる一過性トランスクリプトームシークエンシングの方法に関する。
【0007】
Hartmann他、『Handbook of RNA Biochemistry』第2巻、2014年、8.3.3章、164~166ページ)は、4-チオウリジンで修飾されたRNAの合成後標識を、4-チオウリジン残基をヨードアセトアミドまたはイオウ系化合物で修飾することによって実施することに関する。
【0008】
Testa他、Biochemistry、第38巻(50)、1999年:16655~16662ページには、チオウラシル(s2Uとs4U)の塩基対形成力がウラシルと比べて変化することが開示されている。
【0009】
Hara他、Biochemical and Biophysical Research Communications 第38巻(2)、1970年:305~311ページには、tRNAの4-チオウリジン特異的スピン標識が開示されている。
【0010】
Fuchs他、Genome Biology 第15巻(5)、2014年:1465~6906ページは、RNA上の4-チオウリジンタグを調べることによってゲノム全体での転写伸長速度を求めることに関する。この方法は、そのように標識されたRNAのビオチニル化と精製を必要とする。
【0011】
さらに、可逆的ビオチニル化戦略では、標識されたRNAは単離状態でしか分析することができない。すなわち全RNAの文脈では分析できない。したがってハイスループットシークエンシングによって細胞内におけるRNAの動態を正確に測定するには、各時点で3つのRNAサブセット(標識されたRNA、全RNA、標識されていないRNA)を分析する必要があるため、こうしたアプローチは高価になり、下流分析が非現実的になる。
【発明の概要】
【発明が解決しようとする課題】
【0012】
したがって本発明の1つの目標は、修飾された核酸を検出する方法を、好ましくは自動化検出が可能になる程度まで簡単化することである。
【課題を解決するための手段】
【0013】
本発明は、ポリヌクレオチド(PNA)種の中の修飾を単一ヌクレオチドの解像度で検出することが可能なヌクレオチド類似体誘導体化化学に基づいている。本発明の方法により、PNA修飾を迅速かつトランスクリプトーム全体で分析するための、拡張性があって非常に定量可能でコスト効率と時間効率のよい方法が提供される。
【0014】
第1の側面では、本発明により、ポリ核酸(PNA)を同定する方法として、PNAを用意する工程と;水素結合パートナーを付加または除去してそのPNAの1個以上の核酸塩基を修飾することによりその1個以上の核酸塩基の塩基対形成能力を変化させる工程と;相補的な核酸をそのPNAと塩基対形成させ、その中には修飾された少なくとも1個の核酸塩基との塩基対形成を含む工程と;少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置において、その相補的な核酸の配列を同定する工程を含む方法が提供される。
【0015】
好ましい実施態様では、PNAは、特にそれ自体が塩基対形成能力を変化させる修飾をすでに有する状態で細胞内において合成されるか、塩基対形成能力を変化させるようにさらに修飾することができる。したがって本発明は、ポリ核酸(PNA)を同定する方法と定義することもでき、この方法は、細胞内でPNAを発現させる工程と;そのPNAを細胞から単離する工程と;細胞内の、および/または単離後のそのPNAの1個以上の核酸塩基を修飾し、細胞内のその修飾、または単離後のその修飾、または細胞内と単離後両方のその修飾により、1個以上の核酸塩基の水素結合パートナーを付加または除去することで、前記1個以上の核酸塩基の塩基対形成能力を変化させる工程と;相補的な核酸をそのPNAと塩基対形成させ、その中には修飾された少なくとも1個の核酸塩基との塩基対形成を含む工程と;修飾された少なくとも1個の核酸塩基と相補的な少なくとも1つの位置で前記相補的な核酸の配列を同定する工程を含んでいる。
【0016】
本発明によりさらに、本発明の方法を実施するためのキットとして、特にチオールで修飾された核酸塩基と、チオールで修飾されたその核酸塩基をチオール基の位置でアルキル化するのに適したアルキル化剤を含んでいて、そのアルキル化剤が、水素結合ドナーまたは水素結合アクセプタを含むキットが提供される。
【0017】
本発明のすべての実施態様は、以下の詳細な説明においてまとめて説明され、すべての好ましい実施態様は、すべての実施態様、側面、方法、キットに同様に関係する。例えばキットまたはその構成要素は、本発明の方法で用いること、または本発明の方法に適したものが可能である。記載されている方法で用いられるどの構成要素も、キットの中に備えることができる。本発明の方法の好ましい説明と詳細な説明は、方法の所与の工程のためのキットの構成要素、またはその適切さ、またはキットの構成要素の組み合わせについて同様に読まれる。すべての実施態様は互いに組み合わせることが可能だが、そうでない記載がある場合は別である。
【発明を実施するための形態】
【0018】
本発明は、ポリ核酸(PNAと略記)を修飾して合成PNA(修飾されたPNAとも呼ばれる)を生成させる方法に関する。PNAサンプルの中に合成PNAが存在することは、そのサンプルのPNAシークエンシングのリード結果に見つけることができるため、そのことによって修飾されたPNAが同定される。本発明の1つの利点は、この同定を、修飾されていないPNAからの精製/分離なしに実施できることである。
【0019】
詳細には、本発明の方法は、水素結合パートナーの付加または除去によってPNAの1個以上の核酸塩基を修飾することにより、その1個以上の核酸塩基の塩基対形成能力(または挙動)を変化させる工程と;相補的な核酸をそのPNAと塩基対形成させ、その中には修飾された少なくとも1個の核酸塩基との塩基対形成を含む工程を含んでいる。
【0020】
天然の核酸塩基は、A(アデニン)、G(グアニン)、C(シトシン)、T(チミン)/U(ウラシル)である。本発明の修飾により、RNAの場合にはA、G、C、Uヌクレオチドと比べて非天然の核酸塩基になり、DNAの場合にはA、G、C、Tヌクレオチドと比べて非天然の核酸塩基になる。この修飾によって塩基対を形成する挙動が変化することで、AとT/Uの間と、CとGの間の優先的な塩基対形成(水素結合による結合)が変化する。これは、相補的な核酸としての天然の核酸塩基との塩基対形成が1つの天然の核酸から別の天然の核酸へと変化することを意味する。好ましいのは、相補的な核酸がDNAであって、TがUの代わりに用いられることである。変化したAは、CまたはGに結合することができ;変化したTまたはUは、AまたはT/Uに結合することができ;変化したCは、AまたはT/Uに結合することができ;変化したGは、AまたはT/Uに結合することができる。このような修飾は本分野で知られている。修飾は通常はわずかであり、塩基対を形成する挙動だけが変化するよう、変化は最少に維持される。例えばAとGはそれぞれそれらが属するプリン環系を維持し、CとT/Uはそれらが属するピリミジン環を維持する。例えばHarcourtら(Nature 2017年、第541巻:339~346ページ)は、そのような修飾の概説とまとめを提示している。修飾の例は、Aからm6Aへ、m1Aへ、イノシンへ、2-アミノアデニンへの修飾;C からm5C(5-メチルシトシン)へ、hm5C(5-ヒドロキシメチルシトシン)へ、プソイドウリジンへ、2-チオシトシンへ、5-ハロシトシンへ、5-プロピニル(-C=C-CH3)シトシンへ、5-アルキニルシトシンへの修飾; T または Uから2-チオウラシルへ、s4U(4-チオウラシル)へ、2-チオチミンへ、4-ピリミジノンへ、プソイドウラシルへ、5-ハロウラシル、例えば5-ブロモウラシル(5-ブロモウリジン(5BrU)とも呼ばれる)へ、5-プロピニル(-C=C-CH3)ウラシルへ、5-アルキニルウラシル、例えば5-エチニルウラシルへの修飾;G からヒポキサンチンへ、キサンチンへ、イソグアニンへの修飾; AまたはGからアデニンとグアニンの6-メチル誘導体とそれ以外の6-アルキル誘導体へ、アデニンとグアニンの2-プロピル誘導体とそれ以外の2-アルキル誘導体への修飾である。さらなる修飾は、6-アゾ-ウラシルへ、6-アゾ-シトシンへ、6-アゾ-チミンへ、8-ハロ-アデニンと8-ハロ-グアニンへ、8-アミノ-アデニンと8-アミノ-グアニンへ、8-チオール-アデニンと8-チオールグアニンへ、8-チオアルキル-アデニンと8-チオアルキルグアニンへ、8-ヒドロキシル-アデニンと8-ヒドロキシル-グアニンへ、他の8-置換されたアデニンとグアニンへ、5-ハロ(特に5-ブロモ)-ウラシルと5-ハロ(特に5-ブロモ)-シトシンへ、5-トリフルオロメチル-ウラシルと5-トリフルオロメチル-シトシンへ、他の5-置換されたウラシルとシトシンへ、7-メチルグアニンと7-メチルアデニンへ、2-F-アデニンへ、2-アミノアデニンへ、8-アザグアニンへ、8-アザアデニンへ、7-デアザグアニンへ、7-デアザアデニンへ、3-デアザグアニンへ、3-デアザアデニンへの修飾である。天然の核酸塩基は上記のように最も近い修飾された核酸塩基へと修飾されることが好ましいが、原則として、核酸塩基を修飾して上記の任意の修飾された核酸塩基にすることができる。重要な因子は水素結合パターンの変化であり、その結果として、修飾されていない核酸塩基と比べて修飾された核酸塩基には別の塩基対形成パートナーが結合するようになる。結合パートナーの変化が絶対に確実である必要はなく、天然の結合パートナーへの結合の確実さが例えば少なくとも10%、または少なくとも20%、または少なくとも30%、または少なくとも40%、または少なくとも50%、または少なくとも60%、または少なくとも70%、または少なくとも80%、または少なくとも90%、または100%変化するだけで十分である。特別な核酸塩基は2個以上の相補的な核酸塩基(特にゆらぎ塩基)に結合することができる。変化を判断する参照条件は、等張生理水溶液中での逆転写酵素のための標準条件であり、大気圧かつ37℃が好ましい。条件の例は、pHが7.5~8.5の50 mMトリス-HCl、75 mM KCl、3 mM MgCl2、10 mM DTTである。このようなあらゆる変化を現在の検出手段(シークエンシング、配列比較など)によってモニタすることができる。また、2つ以上の修飾を1個のPNA分子の中に含めることができて、1個の分子につき1つだけ、または複数の分子につき1つだけを検出する必要がある。もちろん、(相補的な核酸内で)水素結合が1個の天然の核酸塩基から別の核酸塩基へと変化する割合が大きいほど、検出の確実性が大きくなる。したがって塩基対形成の割合の変化は大きいほうが好ましい(例えば少なくとも50%、少なくとも80%)。
【0021】
「ハロ」は、ハロゲン、特にF、Cl、Br、Iのいずれかを意味し、例えば5BrUの中に含まれているようにBrが特に好ましい。「アルキル」はアルキル残基を意味し、好ましいのは、長さがC1~C12の分岐した、または分岐していない、置換された、または置換されていないアルキル残基である。好ましいのは、アセトアミドにおけるように長さがC1~C4でオプションのO置換基および/またはオプションのN置換基を有するアルキル残基や、他のアルキルカルボニル、カルボン酸、アミドである。
【0022】
PNAの特に好ましい修飾された核酸塩基は、5-ブロモウリジン(5BrU)、5-エチニルウリジン(5-EU)、6-チオグアノシン(s6G)、4-チオウリジン(s4U)、5-ビニル-ウリジン、5-アジドメチル-ウリジン、N6-アリルアデノシン(a6A)である。
【0023】
塩基対形成の挙動は、本分野で知られているか、水素結合ドナーまたは水素結合アクセプタにおける変化(妨害によってそれらの対形成が阻止されることを含む)から導出することができる。例えば4-ピリミジノン(修飾されたUまたはT)は、Aの代わりにGと優先的に塩基対を形成する(Sochacka他、Nucleic Acids Res. 2015年3月11日;第43巻(5):2499~2512ページ)。
【0024】
PNAの核酸塩基の修飾は、酸素(O)原子上または窒素(N)原子上の水素(H)が(例えばメチル基または他のアルキル基におけるように)炭素などの置換基で置換されて水素結合ドナーとしてのHが除去されることによるものが可能である。修飾は、酸素(O)原子または窒素(N)原子の自由電子対が(例えばメチル基または他のアルキル基におけるように)炭素などの置換基で置換されて水素結合アクセプタとしての電子対が除去されることによるものが可能である。修飾には、Oをイオウ(S)またはSHで置換した後、上記の修飾のうちの1つ、特にSまたはSHのアルキル化を実施することを含めることができる。OをSまたはSHで置換する1つの好ましい方法は生合成による方法であり、酵素(例えば転写酵素)を用意してSまたはSHで修飾されたヌクレオチド(s4Uなど)にする。転写酵素は細胞内に存在することができる。
【0025】
本発明の修飾として、1工程の修飾、または2工程以上(例えば2工程、3工程、それよりも多い工程)の修飾が可能である。例えば修飾の最初の部分を一反応環境(細胞など)の中で実施し、第2の修飾を例えばその細胞からPNAを単離した後に別の反応環境の中で実施する。好ましいのは、そのような第2の修飾またはさらなる修飾が第1の修飾に依存していて、例えば第1の修飾によって変化した原子上で実施されることである。特に好ましいのは多工程修飾であり、その場合には、第1の修飾は、酵素による修飾、例えば修飾されたヌクレオチド/核酸塩基を酵素(RNAポリメラーゼやDNAポリメラーゼなど)によってPNAの中に組み込むことによる修飾である。この工程では、酵素の処理能力に関し、酵素活性が損なわれないか、許容可能な程度しか損なわれないようにするため、わずかな修飾だけが含まれる。わずかな修飾は、例えば対応する天然の核酸塩基と比べてほんの1個または2個の原子(水素はカウントしない)の変化である。その後の工程において、組み込まれた修飾された核酸塩基を任意の手段(湿式化学法などであり、アルキル化が含まれる)でさらに修飾して例えば本明細書に記載した修飾された核酸塩基にすることができる。このようなさらなる修飾は、細胞外で、または酵素によって、または非酵素的に実施することができる。この修飾は、最初の工程で導入された修飾を標的とすることが好ましい。細胞内での(最初の)修飾として、修飾された核酸塩基(例えば修飾されたヌクレオチド)を細胞に供給することによる誘導された修飾または増強された修飾が可能であり、細胞はその後、その修飾された核酸塩基を生合成されたPNAの中に組み込む。「増強された」は、天然の修飾発生率を超えていることを意味する。
【0026】
(最初の)修飾として、修飾された核酸塩基を細胞に供給しない細胞内の天然プロセスも可能である。このような天然プロセスは、例えばtRNAのチオール化である(Thomas他、Eur J Biochem. 1980年、第113巻(1):67~74ページ;Emilsson他、Nucleic Acids Res 1992年、第20巻(17):4499~4505ページ;Kramer他、J. Bacteriol. 1988年、第170巻(5):2344~2351ページ)。このように自然に起こる修飾も、本発明の方法による検出が、例えば修飾されたこれら核酸塩基との塩基のミスマッチ、または変化した塩基対形成の挙動を直接検出することによって、または自然に修飾されたこれら核酸塩基のさらなる(第2の)修飾によって可能である。いくつかの天然の修飾は、ストレス反応やそれ以外の環境の影響の結果である可能性がある。そのため本発明の方法を利用して細胞のそのような反応や細胞内の影響を検出することができる。一例は、UV光(特に近UV照射)に対して反応する、特にtRNAの中のs4U修飾である(Kramer他、上記文献)。特にtRNAの中のs4U修飾は、細胞の増殖速度の測定にも用いることができる(Emilsson他、上記文献)。この修飾は、増殖の指標として用いられるものであり、本発明の方法に従って検出することができる。好ましいのは、真正細菌または古細菌をそのような天然の修飾に用いることである。
【0027】
本発明の好ましい実施態様では、修飾の工程は、チオールで修飾された核酸塩基をPNAに組み込み(修飾の最初の部分)、そのチオール核酸塩基をアルキル化剤でアルキル化する(修飾の第2の部分)ことによって実施される。チオール反応性アルキル化剤に含まれるのは、ヨードアセトアミド、マレイミド、ハロゲン化ベンジル、ブロモメチルケトンである。アルキル化剤は、上記のアルキル基と離脱基(ハロゲンである例えばBr、Clなど)も含むことができる。アルキル化剤は反応してチオールをS-アルキル化することによって安定なチオエーテル生成物を生成させる。アリール化試薬(NBD(4-ニトロベンゾ-2-オキサ-1,3-ジアゾール)ハロゲン化物)はチオールまたはアミンと反応し、求核によって芳香族ハロゲン化物の同様の置換が起こる。チオ硫酸塩も可逆的チオール修飾に利用できる。チオ硫酸塩はチオールと化学量論的に反応して混合されたジスルフィドを形成する。チオールはイソチオシアネートおよびスクシンイミジルエステルとも反応する。イソチオシアネートとスクシンイミジルエステルはアミンとの反応にも用いることができる。
【0028】
チオールの修飾には、チオールをチオケトンに変換する工程も含めることができる。チオケトン基はその後、水素結合パートナーの付加または除去によってさらに修飾することができる。チオケトンへの変換は、例えばKohlerら(Angew. Chem. Int. Ed. Engl. 1996年、第35巻(9):993~995ページ)が記載しているように、触媒としての遷移金属クラスター上での水素の除去を含むことができる。チオケトンへの変換により、本発明の修飾を実施するための反応化学の追加の選択肢が可能になる。Kohlerらは、チオールまたはチオケトンをアリールに導入することも記載している。これも、本発明において本発明の修飾された核酸塩基にチオ修飾(チオール、チオケトン)を生成させるための1つの選択肢である。
【0029】
チオールのアルキル化は、チオール(SH)結合アルキル化とも呼ばれる。チオールアルキル化の利点は、「柔らかい」チオールに対する選択性がある一方で、非チオール化核酸塩基は不変の状態に留まれることである(HSAB理論 - 「硬い、柔らかい(ルイス)酸と塩基」、Pearson他、JACS 1963年、第85巻(22):3533~3539ページ)。ヨードアセトアミドはあらゆるチオールと容易に反応してチオエーテルを形成する。ヨードアセトアミドはブロモアセトアミドよりもいくらか反応性が大きいが、ブロモアセトアミドも使用できる。マレイミドは、チオール選択的な修飾、定量、分析のための優れた試薬である。この反応では、チオールがマレイミドの二重結合を横断して付加されてチオエーテルを生成させる。アルキル化は上記のチオケトンによっても可能である。
【0030】
好ましいのは、修飾がウリジンの4位のアルキル化を含むことである。この位置でウリジンの天然の水素結合挙動に干渉することが非常に効果的である。このような修飾は、アルキル化剤を用いて、例えば水素結合パートナー(水素結合アクセプタが好ましい)を含むアルキル化剤、または水素結合パートナーを含まないため通常はウリジンの4位で生じると考えられる水素結合が阻止されるアルキル化剤を用いて実施することができる。このようなアルキル化は、上記の4-チオウリジンを介した2工程の修飾で実施することができる。
【0031】
別の好ましいアルキル化は、グアノシンの6位の位置である。このようなアルキル化により、標準的なGC塩基対から、有効な水素結合が(GCでの3つではなく)2つしかないG*Aゆらぎ塩基対へのミスペア形成率が増大する。特に好ましい実施態様では、グアノシンの6位へのアルキル化の導入は、グアニジンから6-チオグアノシン(s6G)への修飾と、チオ位置のアルキル化を含んでいる。したがってこれは、上記の6-チオグアノシンを介した2工程修飾におけるそのようなアルキル化の別の好ましい一例である。6-チオグアノシンは、6-チオグアノシンヌクレオチドの存在下における生合成によってPNAの中に組み込むことができる。
【0032】
好ましいアルキル化剤は、式Hal-(C)xOyNz(水素は表示しない)を有する。ただしHalはハロゲンを意味し、Cはx個のC原子からなる分岐した炭素鎖、または分岐していない炭素鎖であり、xは1~8であり、OはC原子に対するy個の酸素置換基であってyは0~3であり、NはC原子に対するz個の窒素置換基であってzは0~3である。Nは、少なくとも1つの-NH2、または二重結合=NHであることが好ましく、Oは、-OHまたは二重結合=Oであることが好ましい。Halは、BrとIから選択されることが好ましい。
【0033】
特に好ましいのは、PNAが1個以上の4-チオウリジンまたは6-チオグアノシンを含むことであり、2個、または3個、または4個、または5個、または6個、または7個、または8個、または9個、または10個、またはそれよりも多数個の4-チオウリジンまたは6-チオグアノシンを含むことが好ましい。1個以上の核酸塩基の修飾には、水素結合パートナー(水素結合アクセプタまたは水素結合ドナー)をチオールで修飾された核酸塩基に付着させることを含めることができる。このような付着は、例えば上記のハロゲン化物含有アルキル化剤による任意の化学的修飾(アルキル化が好ましい)によって実現できる。
【0034】
アルキル化の1つの代替手段は酸化による修飾である。このような修飾は、例えばBurton、Biochem J 第204巻(1967年):686ページ と、Riml他、Angew Chem Int Ed Engl. 2017年;第56巻(43):13479~13483ページに開示されている。例えば核酸塩基、特にチオール化された核酸塩基を酸化によって修飾して水素結合ドナーまたは水素結合アクセプタに変化させることができる。上記のチオール化された核酸塩基を通じた2工程の方法では、チオール基のイオウを例えばOsO4、NaIO3、NaIO4によって、または過酸化物(クロロペルオキシ-安息香酸やH2O2など)によって酸化することができる。例えばs4Uを酸化してCにすることができる(Schofield他、Nature Methods、doi:10.1038/nMeth.4582)。すると塩基対形成/ハイブリダイゼーションの挙動がU-AからC-Gへと変化する。Burton(上記文献)が示しているように、この酸化はチオール中間体を必要としないが、特に生合成による修飾の場合にはそのチオール中間体が好ましい(下記参照)。このようなC類似体は、例えばトリフルオロエチル化シチジン(例えば2,2,2-トリフルオロエチルアミンの存在下における酸化の生成物)である。C類似体は、シトシンの塩基対形成の挙動、および/またはピリミジン-2-オン環を保持することができる。ピリミジン-2-オン環上の4位は、例えば(Cの中の)アミノ基で置換すること、または他の置換基(R-NH基(ただしRはアルキル基、芳香族基、アルカン基、NH2、トリフルオロエチレン、MeOなどから選択される))を含むことができる(Schofield他、上記文献の特に追加図1を参照されたい;参照によって本明細書に組み込まれている)。
【0035】
好ましい一実施態様では、修飾された核酸塩基、例えばチオールで修飾された塩基が、細胞内での生合成を通じて、または細胞の酵素によって(例えばインビトロでの転写によって)PNAの中に組み込まれる。また、例えば(非生物的な)化学的PNA合成(有機的合成または半合成的合成)により、修飾された核酸塩基を化学的に導入することが可能である。生合成は、鋳型PNA(通常はDNA、特にゲノムDNA)と鋳型依存性合成(転写、逆転写)に基づくPNAの合成である。このような転写に適した酵素は、RNAポリメラーゼ、DNAポリメラーゼ、逆転写酵素である。酵素は、天然のヌクレオチドと(修飾された核酸塩基を有する)修飾されたヌクレオチドを生合成されたPNA分子の中に組み込むことができる。PNAを形成するときには複数のヌクレオチドモノマー単位が接続される。このようなモノマーは、修飾された形態で提供されて、PNAに組み込むことができる。好ましいのは、1種類の天然のヌクレオチドだけ(A、G、C、T/U)が修飾されること、すなわち1種類の天然のヌクレオチドだけが、PNAに組み込まれる修飾された(非天然の)相手を有することである。全種類の天然のヌクレオチドが存在していて、修飾された核酸塩基が対応する天然の(修飾されていない)核酸塩基よりも少数であることも好ましい。「対応する」は、天然の核酸塩基を再現するのに必要な原子(水素はカウントしない)の変化が最少である天然の核酸塩基を意味する。例えばA、G、C、T/Uが、修飾されたU(またはA、G、C、Tから選択された他の任意のタイプの修飾されたヌクレオチド)に加えて提供される。好ましいのは、所与のタイプの修飾されていない(天然の)ヌクレオチドに対する修飾されたヌクレオチドの比が、20%以下、例えば15%以下、または10%以下、それどころか5%以下であることである(すべてモル%)。修飾されたヌクレオチドは、対応する天然のヌクレオチドの代わりに組み込まれるが、その後本発明の方法において非典型的な塩基対形成をする(上に詳しく説明したように塩基対形成の挙動が変化する)。すると今度は、別の相補的なヌクレオチドが、塩基対を形成するはずであった天然の相手方ヌクレオチドとは異なる修飾されたヌクレオチドと塩基対を形成する。したがってハイブリダイズした相補的鎖(例えば新たに合成された相補的鎖)の配列に変化が現われることになる。そのため修飾された少なくとも1個の核酸塩基との塩基対形成により、修飾されていないが他の点は同じである核酸塩基との塩基対形成とは異なる別のヌクレオチドとの塩基対形成が可能になる。
【0036】
アルキル化された核酸塩基をPNAの中に生合成を通じて(例えば上記のアルキル化された核酸塩基を、チオール中間体を使用せずに)組み込むことも可能である。例えばアルキル化されたヌクレオチドを細胞の中に組み込み、PNA合成の間にその細胞に利用させることができる。そのような方法は、Jao他、Proc. Nat. Acad. Sci. USA 第105巻(41)、2008年:15779ページと、Darzynkiewicz他、Cytometry A第79A巻、2011年:328ページに記載されている。特に、本発明で用いるのに効果的な修飾されたヌクレオチドは、5-エチニル-ウリジン(5-EU)である。エチニルで標識したウリジンは細胞に浸透することができ、天然の類似体ウリジンの代わりに新生RNAの中に組み込まれる。好ましい実施態様では、得られるエチニル機能性PNAは、(例えばPresolski他、Current Protocols in Chemical Biology 第3巻、2011年:153ページ;またはHong他、Angew. Chem. Int. Ed. 第48巻、2011年:9879ページに記載されている)例えばCu(I)を触媒とするクリックケミストリーを通じてさらに修飾されて追加の官能基がアジド機能性分子(例えばNHSエステル、マレイミド、アジド-酸、アジド-アミン)を介して導入され、オルト位のケトンがエチニル基に水素結合する能力に影響を与える。
【0037】
別の実施態様では、そのようなアジド機能性分子を細胞そのものの中に導入して生合成させ、修飾された核酸塩基としてPNAの中に導入することができる。得られるアジド機能性分子はその後、核酸塩基の水素結合能力を修飾されていない核酸塩基(C、T/U、A、G)と比べて変化させる官能基を導入するためのCu(I)を触媒とした(CuAAC)、またはCu(I)なしのアジド-アルキン付加環化(SPAAC)クリックケミストリーを通じて検出することができる。
【0038】
PNAの1個以上の核酸塩基を修飾するさらに別の一例は、PNAへのビニル機能性核酸塩基(5-ビニル-ウリジンなど)の組み込みを含んでいる。ビニル基はさらに修飾されて、修飾されなかった場合の核酸塩基の水素結合能力を変化させる(Rieder 他、Angew. Chem. Int. Ed. 第53巻、2014年:9168ページを参照されたい)。
【0039】
特に好ましい実施態様では、PNAの1個以上の核酸塩基の修飾に、アリル基の環化、および/またはPNAの核酸塩基のハロゲン化(特にヨード化)が含まれる。修飾された核酸塩基は、アリル核酸塩基(N6-アリルアデノシン(「a6A」)など)であることが好ましい。アリル核酸塩基は、アリル基が関与する環化によってさらに修飾することができる。このようなアリル核酸塩基は、PNA合成の間に、PNAの中に、特に本明細書の他の実施態様で記載した細胞の中に組み込むことができる。ハロゲン化および/または環化は、Shu他、J. Am. Chem. Soc.、2017年、第139巻(48):17213~17216ページに記載されている原理に従って実施することができる。好ましいのは、この方法が、細胞へのN6-アリルアデノシンの組み込みの後に例えば元素ヨード(I2)を用いたヨウ素化を含むことである。するとヨード化された以前のアリル基が、核酸塩基のプリン基上(修飾されたAまたはGの場合)またはピリミジン基(修飾されたCまたはT/Uの場合)上の窒素で環化される。この修飾によって塩基対形成が変化するため、それをシークエンシングまたはハイブリダイゼーションの間に読み取ることができる。例えばa6AはAのように振る舞うため、哺乳動物の細胞内で新たに合成されたRNAに代謝によって組み込むことができる。穏やかなバッファー条件下でのa6A のN6-アリル基のヨード化によってN1,N6-環化アデノシンの形成が自発的に誘導されて、逆転写の相補的DNA合成の間に反対側の部位に変異が生成する。
【0040】
さらに別の好ましい一実施態様では、PNAの1個以上の核酸塩基の修飾に、PNAの中への5-ブロモ-ウリジン(5-BrU)核酸塩基の導入が含まれる。5-BrUは、互変異性体として存在する変異誘発物質である。これは、5-BrUがアデニンまたはグアニンと塩基対を形成するケト形態またはエノール形態で存在し(図37a参照)、それが今度はPCRなどの増幅反応で(修飾されていないUと比べて)T>C変換の増大につながることを意味する。したがって本発明のこの実施態様と一般に好ましい実施態様では、PNAの1個以上の核酸塩基を修飾すると互変異性核酸塩基が導入され、この互変異性形態は、修飾されたT/Uと修飾されたCの場合には両方のプリン塩基(AとG)と塩基対を形成することができ、修飾されたAとGの場合には両方のピリミジン塩基(TとC)と塩基対を形成することができる。プリン/ピリミジン塩基の両方との塩基対形成は、本明細書では、(相補的でない塩基と対を形成することが稀な)修飾されていないA、G、U/T、Cの場合よりも塩基対を形成する挙動がより同等であることを意味する(が、必ずしも同等ではない)。言い換えると、互変異性塩基は、塩基コア構造(プリンまたはピリミジン)が同じ非相補的な塩基との対形成が、修飾されていない塩基と比べて増加する(ゆらぎ挙動)。この増加は、特にPCRのための標準的な条件で起こる。
【0041】
このようなゆらぎ挙動は、修飾された核酸塩基に対応する特定の位置に混合された塩基が増加する結果から判断することができる。ゆらぎ塩基の検出は、本発明の方法のあらゆる実施態様における好ましいリード(read)である(図5B図24B図37Cを比較されたい)。
【0042】
関連するさらに別の実施態様では、5-BrUまたは他の任意のハロゲン化された核酸塩基をさらに修飾することが、ハロゲンをアミノ基で置換することによって可能である。例えば5-BrUをアンモニアとともに加熱して5-アミノウリジンに変換することができる。このようなアミノ修飾された核酸塩基は、塩基対形成を逆転写の間に変化させる、および/または追加のゆらぎ挙動を導入する。
【0043】
(修飾された核酸塩基を有する)PNAは、RNAまたはDNAを含むこと、またはRNAまたはDNAからなることが可能である。RNAの例は、mRNA、マイクロRNA(miRNAまたはmiR)、短いヘアピンRNA(shRNA)、小さな干渉性RNA(siRNA)、PIWI相互作用するRNA(piRNA)、リボソームRNA(rRNA)、tRNAに由来する小さなRNA(tsRNA)、トランスファーRNA(tRNA)、小さな核小体RNA(snoRNA)、小さな核RNA(snRNA)、長い非コード化RNA(lncRNA)のいずれか、またはこれらの前駆RNA分子である。DNAは、例えばゲノムDNA、cDNA、プラスミドDNA、DNAベクターのいずれかである。PNAは、二本鎖または一本鎖が可能である。
【0044】
「含む」は、列挙する事項の数に制限がない用語に関係しているため、分子が他のメンバー、例えば他のタイプのヌクレオチド(RNAやDNA(人工的に修飾されたヌクレオチドであるLNAなどが含まれる)が存在できる)を含有することも可能である。「からなる」は、条件に合致するメンバー(すなわち完全なRNAまたは完全なDNA)であることが必要とされる閉じられた定義と見なされる。
【0045】
好ましいのは、A、G、C、U、又はTから選択されたそれぞれのタイプのヌクレオチドについて、修飾されたPNAが修飾されたヌクレオチドよりも多数の天然ヌクレオチドを含むことである。本明細書では、PNAは、本発明によるあらゆる修飾を有する最終的なPNAに関係する。PNAは、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多数個、かつ30個までの修飾されたヌクレオチドを含むことが好ましい。好ましいのは、PNA分子の中の少数個(例えば20%以下)の核酸塩基が修飾されていること、例えば15%以下、または10%以下、それどころか5%以下(すべてモル%)のヌクレオチドが修飾されていることである。
【0046】
PNA分子は任意の長さを持つことができる。好ましいのは、PNA分子が少なくとも10 nt(ヌクレオチド)の長さを持つことである。特に好ましいのは、長さが10 nt、20 nt、30 nt、40 nt、50 nt、75 nt、100 nt、250 nt、500 nt、1000 nt、2500 nt、5000 nt、10000 nt、25000 nt、50000 nt、100000 ntのいずれか、またはこれらの値の間の任意の範囲であることである。好ましい範囲は、10 nt~100000 nt、または50 nt~50000 ntの長さである。
【0047】
好ましいのは、PNAがヌクレオチドの特定の細胞分画(全RNA分画、mRNA分画、DNA分画(プラスミドDNAやゲノムDNAなど))に由来することである。分画は、共通する特徴(長さ、ヌクレオチドのタイプまたは配列(例えばmRNAの中のポリ(A)尾部または5'キャップ))を持つPNAを単離することによって選択できる。
【0048】
本発明の方法は、PNAに相補的な核酸との塩基対を形成させる工程を含有している。この塩基対形成では、(通常はPNAの数個の核酸塩基が塩基対を形成することによって)少なくとも1個の修飾された核酸塩基が塩基対を形成せねばならない。相補的な核酸との塩基対形成は、PNAを核酸鎖にハイブリダイズさせることによって容易にできる。これは、伸長反応(例えばPCR)の間に、またはプローブ核酸をハイブリダイズさせることによって起こる可能性もある。相補的な核酸は任意の長さを持つことができ、例えばPNAに関して上に開示した長さが可能である。
【0049】
相補的な核酸の配列は、少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置において同定される。配列決定は、本分野で知られている一般的な任意の手続きによって実現することができる。そのような方法に含まれるのは、断片に基づくシークエンシング法である次世代シークエンシング(NGS)におけるように、相補鎖の全体または一部を例えばPCRによって生成させることに基づく方法である。望むのであれば、断片のリードを組み立てて組み合わされた配列にすることができる。しかし本発明の利用では、修飾された核酸塩基に対して相補的な核酸塩基が、特にその隣接配列(±5 nt、または±10 nt、または±15 nt、または±20 nt)とともに同定される限り、その必要はない。配列を求めるためのさらに別の方法に含まれるのは、プローブへの結合である。そうすることで、ハイブリダイズする既知のプローブの配列を通じ、PNAの配列が、相補的な配列として求まる。
【0050】
別の1つの選択肢は、相補的な核酸が特にmiRNA、shRNA、siRNAと相補的な核酸の場合のように小さい場合には、小さな核酸のシークエンシングである。小さな核酸は、長さが例えば10 nt~200 ntの範囲が可能であり、12 nt~100 ntの範囲、または14 nt~50 ntの範囲が好ましい。200 ntより長いか、10 ntより短いことも可能である。相補的な核酸の断片は、平均でそのような長さを持つことができる。断片は、NGSに関して本分野で知られている物理的手段または化学的手段によって生成させることができる。小さな核酸(その中には、NGSの間に得られるような断片が含まれる)の場合には、プライマーまたはプローブのためのハイブリダイゼーション配列として使用できるその核酸にアダプタを結合させることが好ましい。そのようなアダプタは、小さな核酸を標識によって同定するための特徴的な配列(バーコードなど)も含有することができる。バーコードは、PNAを取得したサンプルの出所、またはPNA分子の出所、またはそのPNA分子と相補的で断片であった核酸の出所(断片の出所)のための標識を提供することができる。そのようなバーコードは、配列が異なる多数の核酸(例えば複数の異なる相補的な核酸および/または1つ以上の相補的な核酸の複数の断片)がシークエンシングされる多重化シークエンシングにおいて有用である可能性がある。そのような複数として、例えば2~1000個、またはそれよりも多数個の核酸が可能である。別の可能性は、必ずしもアダプタを必要とせず、プライマーまたはプローブを、PNAに対応する相補的な核酸配列にハイブリダイズさせることによる。そのようなプライマーまたはプローブは、既知の配列にハイブリダイズさせること、または例えばランダムプライマーを用いてランダムにハイブリダイズさせることができる。ランダムプライマーは、本発明のキットに関連して下に説明する。そのような任意のランダムプライマーを本発明の方法で用いることができる。
【0051】
本発明の好ましい一実施態様では、単一細胞のPNAが、本発明に従って同定される。したがって細胞のPNAは単離されて、他の細胞のPNAから分離された状態に維持される。「PNAを分離した状態に維持する」は、調べている細胞のPNAシークエンシング情報が他の細胞のシークエンシング情報と混ざることがなく、調べている細胞のPNAが同定可能な状態に留まることを意味する。これは、PNAを物理的に分離することによって、またはPNAまたは相補的な核酸に興味ある細胞を特定する標識(例えばバーコード)を付けることによって実現できる。こうすることで、単一細胞のPNA代謝を分析することが可能になる。単一細胞分析は、単一細胞シークエンシング法(Eberwine 他、Nat. Methods. 第11巻(1):25~27ページ)によって実施できる。シークエンシングの代わりに、ライブラリの中に相補的な核酸またはその断片を好ましくは(だが必ずしもその必要はない)アダプタとともに用意することも可能である。その後このライブラリを独立にシークエンシングすること、または他の用途に提供することができる。
【0052】
本発明の修飾(例えばチオール特異的アルキル化)によって相補的なヌクレオチドの定量可能な程度の「間違った」組み込みが促進され、それらヌクレオチドが上記のように今や異なる水素結合パートナーを形成する。グアノシンがアデノシンの代わりに例えば修飾された核酸塩基(例えばアルキル化された4-チオウリジン)と相補的な核酸結合を通じて例えば転写または逆転写の間に組み込まれる可能性がある。それでも(逆)転写酵素の処理性能は通常は影響を受けない。というのも代わりに塩基対を形成したヌクレオチドはさらに妨害されることなく対応するPNAとともに増幅することができるからである。好ましいのは、酵素を用いた(修飾された核酸塩基の組み込みによる)第1の修飾の後に第2の修飾と組み合わせることである。それは例えば、上記のよく確立されていて非毒性のs4U代謝標識プロトコルとの組み合わせである。
【0053】
修飾された核酸塩基が原因で相補的な核酸の配列が変化する本発明のシークエンシング法は、利用可能なハイスループットシークエンシング法(例えばNGS)と組み合わせることができる。PNA/相補的な核酸の個々の異なる分子間で違っている配列の変化は、特に不完全であるか部分的である場合には、利用可能なコンピュータ化された方法によって同定することができる。例えば(G塩基対形成の増加につながるU修飾に起因する)T>C変換は、次世代シークエンシングデータセットの中で追跡することができる。そのような高度に自動化された方法をコンピュータ化された分析と組み合わせることで、本発明により細胞内RNAプロセシングの動態に迅速にアクセスすることが可能になる。これは本発明の1つの好ましい応用である。本発明は、相補的な塩基対形成に起因するRNAポリメラーゼII依存性の転写出力を正確に知らせてくれることができる。RNAの生合成、プロセシング、代謝回転の細胞内動態への見通しは、生体内で実質的にあらゆる生物学的プロセスに影響を与える遺伝子発現パターンの変化に関する分子的基礎を明らかにする上で不可欠である。
【0054】
したがって好ましい一実施態様では、本発明の方法を利用して細胞内のPNAの修飾または容易に修飾される変化を明らかにすることができる。そのような「容易に修飾される変化」は、例えば上記の多工程法に関係しており、その方法では、第1の修飾(変化とも呼ぶ)を細胞内で実施し、あとからの修飾を、通常はPNAを単離した後に細胞外で第2の工程またはその後の工程で実施する。
【0055】
好ましいのは、本発明の方法を利用して少なくとも第1の修飾/変化を細胞(特に生きている細胞)内で実施し、RNA(PNAなど)を修飾することである。発現するRNAは修飾されているため、こうすることでRNAの発現の変化を追跡することが可能になる。
【0056】
遺伝情報の調節された発現が、細胞のホメオスタシスを維持する上で不可欠であり、変化する環境条件に応答する柔軟性を細胞に与え、調節が異常になった場合には、がんなどのヒト疾患へと導く。こうした極めて重要な生物学的プロセスの裏には、RNAの転写、プロセシング、分解の相対的な動態を転写産物特異的なやり方で制御する厳密に調節された分子事象がある。
【0057】
細胞RNAのプール(多数のRNA種が包含され、その中にはmRNAや非コード化RNA(マイクロRNAなど)が含まれる)は、ゲノム内の選択された遺伝子座の転写によって規定されており、RNAプロファイリング技術(ハイスループットシークエンシングなど)によって定性的かつ定量的に評価することができる。しかし定常状態でのRNAレベルの含量測定は、転写活性そのものを正確には反映していない。実際には、RNAの安定性が、RNA分子の相対含量を決める上で主要な役割を担っている。したがってゲノムスケールで転写速度とRNA分解速度を測定するためのアプローチが、RNAの発現と、その裏にある調節機構の動態への見通しを明らかにするのに有用である。本発明によれば、RNAの生合成と代謝回転の細胞内動態を明らかにすることが可能である。
【0058】
RNAは、変化したヌクレオチドまたは修飾されたヌクレオチドを自然に処理されたRNAの中に組み込むことにより、細胞自身の代謝によって変化させること、または修飾することができる。このような変化を利用して本発明の修飾を選択的に導入し、(単独で、またはさらなる修飾の後に)水素結合の挙動を変化させることができる。代謝が影響を与えることが理由で、修飾されたヌクレオチドがその後シークエンシングされる場合にはそのような方法は「代謝シークエンシング」と呼ばれる。シークエンシング工程、または一般に、相補的な(ポリ)ヌクレオチドとのあらゆる塩基対形成工程は、上記のハイスループットシークエンシング法において自動化して処理することができる。本発明により、RNAの生合成と代謝回転の細胞内動態を明らかにするのに適していて、ハイスループットに適合した代謝標識プロトコルが提供される。このプロトコルは、RNAポリメラーゼIIに依存したポリアデニル化された転写出力を正確に測定し、包括的転写後遺伝子調節シグネチャを再現することで、細胞内のRNA発現の動態(生合成と代謝回転が含まれる)を高い時間解像度で提供するという問題を解決する。
【0059】
細胞として、任意の細胞、例えば細菌細胞(真核細胞と原核細胞が含まれる)、グラム陰性細胞、グラム陽性細胞、真菌細胞、藻類細胞、植物細胞、動物細胞、哺乳動物細胞(齧歯類細胞、霊長類細胞、ヒト細胞、非ヒト細胞など)、古細菌細胞、鳥類細胞、両生類細胞(カエル細胞など)、爬虫類細胞、有袋動物細胞が可能である。
【0060】
修飾を時間制御することによって変化をモニタすること、例えば修飾のない細胞RNA発現の段階を、修飾がある細胞RNA発現の段階と比較することが可能である。このような段階は、同じ細胞または細胞培養物の中で比較することが好ましい。例えば修飾がある段階の後に修飾なしの段階、またはその逆にする。したがって本発明の好ましい一実施態様では、1個以上の細胞を少なくとも2つの培養段階で培養する。その場合、1つの培養段階は、修飾されたヌクレオチドを生合成されたRNAに組み込むことを含んでいて、ここで、水素結合パートナーの付加または除去によってそのRNAが修飾されているのに対し、別の1つの培養段階は、修飾されたヌクレオチドを生合成されたRNAにそのように組み込むことが欠けている。その「別の1つの培養段階」は、修飾されたヌクレオチドを生合成されたRNAに組み込むことを含むが、他方の培養段階におけるのとは異なる(例えばより低い)濃度で組み込むことも可能である。他方の培養段階におけるのとは異なる濃度またはより低い濃度は、生合成されたRNAへの修飾されたヌクレオチドの組み込みに違い(特に濃度の違い)が観察されるのに十分でなければならない。したがって本発明の方法は、ポリ核酸(PNA)を同定する方法と規定することができ、この方法は、細胞内でPNAを発現させる工程と;そのPNAの1個以上の核酸塩基を修飾する工程と;その細胞からPNAを単離する工程と;場合によっては、単離の前または後か、単離と同時にそのPNAをさらに修飾し、その修飾によって1個以上の核酸塩基の水素結合パートナーを付加または除去することにより、その1個以上の核酸塩基の塩基対形成能力を変化させる工程と;相補的な核酸をそのPNAと塩基対形成させ、その中には修飾された少なくとも1個の核酸塩基との塩基対形成を含む工程と;その相補的な核酸の配列を、少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置で同定する工程を含んでいる。特に好ましい代謝標識(すなわち細胞代謝(例えばRNAポリメラーゼなどの酵素)による修飾)は、4-チオウリジン組み込み事象による。これを利用してUが塩基対を形成する挙動を変化させることができる。
【0061】
特に好ましいのは、細胞の少なくとも2つの培養段階における方法であり、この方法では、少なくとも2つの培養段階においてPNA修飾、特にRNA修飾のレベルが異なるようにすることが容易になる。これは、細胞に異なる濃度の修飾された核酸塩基を供給することにより、細胞がその修飾された核酸塩基を異なるレベルまたは濃度でPNA(特にRNA)の中に組み込めるようにすることによって実現できる。上記のように、修飾された核酸塩基はチオールで修飾された核酸塩基であることが好ましい。1つの段階におけるPNA修飾のレベルは、修飾なしが可能である。段階、特にPNA修飾がなされる段階は、そのPNA修飾のためのあらかじめ設定した期間を持つ必要がある。異なる段階での組み込みを互いに比較することにより、そのあらかじめ設定した期間における代謝回転速度を計算することが可能である。特に好ましい一実施態様では、代謝回転または分解の速度は、少なくとも1つの段階におけるPNAへの修飾された核酸塩基の組み込みを他の段階と比較することに基づいて計算される。前記段階は連続する培養段階が好ましい。
【0062】
さらに別の比較は、異なる細胞の培養段階の間で実施することができる。そのような比較によってこれら細胞間での発現差とPNA代謝回転を推定することが可能になる。細胞または細胞群の1つを対照とし、別の細胞または細胞群を、調べる候補細胞または候補細胞群とすることができる。両方の細胞または細胞群が、修飾された核酸塩基をPNAの中に組み込む段階を持つことができ、そのPNAが比較される。好ましいのは、そのような組み込み段階が、PNAに組み込まれるようにするため細胞に修飾された核酸塩基を供給することによって制御されることである。好ましいのは、細胞代謝の比較に適した同量の修飾された核酸塩基を各細胞または各細胞群に供給することである。好ましいのは、組み込み段階の後に、それ以上組み込まない段階が続くことであり、それは、例えば細胞または細胞群への修飾された核酸塩基のさらなる供給を停止することによる。組み込み段階の後に、減少した組み込みの段階、または異なるレベルでの組み込みの段階が続くことも可能である。修飾された核酸塩基がPNAの中に組み込まれるレベルが何らかの変化をした後には、細胞の代謝の適応が続く。その適応は、本発明の方法によってモニタすることができる。例えば組み込み段階の後に、減少した組み込みの段階、または組み込みがない段階が続く場合には、修飾されたPNAの分解をモニタすることが可能である。組み込みがない段階、または組み込みが制限された段階の後に、制限された組み込みよりも多い組み込みの段階が続く場合には、修飾されたPNAの増加をモニタすることが可能である。
【0063】
したがって本発明の1つの利用は、相補的な核酸の同定された配列を、少なくとも2個の細胞の中で、または1個の細胞内の少なくとも2つの異なる増殖段階で、(上記のように)少なくとも1個の修飾された核酸塩基と相補的な位置で比較する際の利用である。その少なくとも2個の細胞または少なくとも2つの増殖段階は、その少なくとも2個の細胞の間、またはその少なくとも2つの増殖段階の間で発現(通常は遺伝子発現だが、mRNAまたは調節RNAの発現が含まれる)が異なっている。(遺伝子)発現のこの違いは、細胞内の少なくとも1個の遺伝子を抑制または刺激することによって引き起こすことができる。そのような方法を利用して、細胞代謝においてある種の擾乱が発現の違いに及ぼす効果をスクリーニングすることができる。発現のこの違いは、例えばスクリーニング法における未知の遺伝子による可能性があるため、調節阻害剤または調節活性化剤や、表現型に対する効果を有する他の任意の物質が、細胞内で特別な遺伝子効果を持つかどうかを調べる。この方法の別の実施態様では、標的遺伝子を既知のものにできるため、他の遺伝子が遺伝子発現に及ぼすさらなる二次的効果を調べる。例えばその既知の遺伝子として、既知の調節遺伝子(がん遺伝子や腫瘍抑制遺伝子など)が可能である。
【0064】
細胞または細胞群として、インビトロ培養物の中、または生きている生物(植物、細菌細胞、真菌細胞、藻類細胞、非ヒト動物、ヒト)の生体内のものが可能である。生体内細胞の場合には、修飾された核酸塩基は、その修飾された核酸塩基を、生物に対して例えば血管系などに全身投与すること、またはその生物の興味ある臓器に局所投与することによって細胞に供給することができる。したがって、生体内で、または興味ある特定の臓器内でPNAの代謝をモニタすることが可能である。PNAはその後、その生物から、例えば剖検によって、または分泌されたPNAの場合には体液サンプルから、または非ヒト生物を安楽死させることによって単離される。好ましいのは、その生物に由来する単一細胞のPNAを単離した後、本発明の方法に従って、例えば上記のように標識すること、および/またはライブラリを生成させること、および/または単一細胞シークエンシングにより分析することである。培養段階に関するあらゆる記述は生体内処理にも当てはまり、「増殖段階」と呼ばれる。「増殖段階」は、細胞の増殖や細胞の倍増を必要としておらず、同定されて分析されるPNA代謝または「増殖」を意味する。
【0065】
PNAとPNA代謝回転のレベル差の比較は、生物の成長中や疾患中で状態が異なっている細胞の間の細胞代謝の違いを明らかにする上で重要である。PNAの代謝回転速度を測定できると、どの経路が活性であり、どの経路がより低い活性または不活性であるかを明らかにするのに役立つ。この点に関し、代謝回転速度は、PNA(例えば細胞または組織または器官の中に存在するmRNA)の濃度だけを測定するPNA(特にRNA)の定常状態での濃度測定に1つの追加の指標を提供する。
【0066】
好ましいのは、2つの培養段階の生合成されたPNA(RNAが好ましい)を細胞から回収し、好ましくは混合もすることであり、相補的な核酸にPNAとの塩基対を形成させることは、転写(PNAがRNAの場合には逆転写)によって相補的なポリ核酸鎖(DNA鎖が好ましい)を生成させることを含んでいる。
【0067】
本発明にとって特に有益なのは、修飾付きで生成されたPNAと、修飾なしの、または修飾がより少ない同等なPNA、またはそれぞれの相補的な核酸を分離する必要がないことである。PNAに相補的な核酸との塩基対を形成させることは、修飾されたPNAと修飾されていないPNA両方の混合物の中で実施できる。すると、PNA/相補的な核酸の配列を組み合わせて求めることができる。なぜなら相補的な核酸の配列/素性を(修飾ありと修飾なしの)両方の場合に決定することができ、比較によって修飾事象を推定できるからである。このような比較は、コンピュータ化された配列比較であることが好ましい。修飾された少なくとも1個の核酸塩基と塩基対を形成し、そのことで修飾されていない核酸塩基と塩基対を形成するよりも別のヌクレオチドと塩基対を形成する方向へと導かれる実施態様に従うことが特に好ましい本発明の方法は、相補的なポリ核酸鎖の配列を求め、その鎖配列を比較することをさらに含んでいて、水素結合パートナーの付加または除去による修飾の結果として変化した相補的な核酸は、修飾がない場合のその相補的な核酸との比較によって同定することができる。好ましいのは、ヌクレオチドの配列が、例えばNGSとハイスループットシークエンシングで用いられるような断片として求まることである。(修飾された少なくとも1個の核酸塩基と相補的な位置を含んでいる可能性がある)求める配列は、10 nt~500 nt、好ましくは12 nt~250 nt、または15 nt~100 ntの長さが可能である。
【0068】
少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置で、相補的な核酸の配列をコンピュータによって同定することには、修飾されていないPNAの配列との比較を含めることができる。そのような比較配列は、配列データベース(EBIやNCBI)から入手すること、または修飾を導入せずにPNAを生成させる(例えば天然の塩基を天然の相補的な塩基と塩基対形成させる)ことによって得られる。そのような比較のためのコンピュータプログラム製品、またはその方法のためのコンピュータ可読媒体は、本発明のキットの中に含めることができる。
【0069】
本発明によりさらに、本発明の方法を実施するのに適したキットとして、チオールで修飾された核酸塩基と、チオールで修飾された核酸塩基のチオール基をアルキル化するのに適したアルキル化剤を含んでいて、そのアルキル化剤が水素結合ドナーまたは水素結合アクセプタを含んでいるキットが提供される。アルキル化剤は、上に言及したものうちの1つ、特にヨードアセトアミドであることが好ましい。しかし上記のアルキル化剤のうちの任意のもの、上記の任意の修飾(特に修飾された塩基)を有する修飾されたヌクレオチド(チオールで修飾されたヌクレオチドなど)に適したアルキル化剤を本発明のキットに含めることができる。
【0070】
キットはさらに、プライマーと、A、G、C、及びTから選択されたヌクレオチドと、逆転写酵素を含むこと、またはこれらの組み合わせを含むことが好ましく、これらの構成要素をすべて含むことが好ましい。プライマーの例はランダムプライマーである。ランダムプライマーは、ランダムに選択された複数のプライマーの混合物である。このようなランダムプライマー混合物は、少なくとも50、または少なくとも100、または少なくとも500の異なるプライマーを含むことができる。ランダムプライマーは、ランダムな六量体、ランダムな五量体、ランダムな五量体、ランダムな八量体などを含有している可能性がある。
【0071】
キットはさらにPNAポリメラーゼを含むことができ、好ましいのはそのポリメラーゼを重合するためのバッファーをさらに含んでいることである。ポリメラーゼとして、DNAポリメラーゼまたはRNAポリメラーゼが可能である。
【0072】
本発明のキットは、アダプタ核酸も含むことができる。そのようなアダプタを核酸に結合させて、上記のようなアダプタが結合した相補的な核酸を生成させることができる。アダプタは、上記のような1つ以上のバーコードを含むことができる。キットは、リガーゼ(DNAリガーゼなど)も含むことができる。
【0073】
キットの構成要素は、適切な容器(バイアルやフラスコなど)に入れて提供することができる。
【0074】
キットは、本発明の任意の方法を実施するための指示またはマニュアルも含むことができる。
【0075】
以下の図面と実施例によって本発明をさらに説明するが、本発明がこれらの側面に限定されることはない。
【図面の簡単な説明】
【0076】
図1】RNAの代謝シークエンシングを実施するためのチオール(SH)結合アルキル化の全体模式図。細胞を4-チオウリジン(s4U)で処理すると、そのs4Uは、細胞に取り込まれたとき、新たに転写されたRNAに組み込まれる。所与の時点で全RNAを調製するとき、新たに生成されたRNA種の中に存在するs4U残基がヨードアセトアミド(IAA)を用いた処理によってカルボキシアミドメチル化されると、塩基対形成界面にかさばる基が得られる。s4U組み込み部位におけるかさばる基の存在を、よく確立されているRNAライブラリ調製プロトコルと組み合わせると、逆転写(RT)の間に、アルキル化されたs4UにGが特異的かつ定量可能な程度に間違って組み込まれる。s4U含有部位は、TからCへの変換のコーリングにより、ハイスループットシークエンシングライブラリの中でバイオインフォマティクスによって単一ヌクレオチドの解像度で同定することができる。
図2A-E】チオール結合アルキル化による4-チオウラシル誘導体化。(A)4-チオウラシル(s4U)はチオール反応性化合物であるヨードアセトアミド(IAA)と反応して求核置換(SN2)反応する結果としてカルボキシアミドメチル基をs4Uの中のチオール基に付加する。吸収が最大になる波長を抽出物(4-チオウラシル;s4U;λmax≒335 nm)と生成物(カルボキシアミドメチル化された4-チオウラシル;*s4U;λmax≒297 nm)について示してある。(B)記載されている濃度のヨードアセトアミド(IAA)の不在下と存在下における4-チオウラシル(s4U)の吸収スペクトル。1 mMのs4Uを記載されている濃度のIAAとともに、50 mMのリン酸ナトリウムバッファー(pH 8.0)と10%DMSOの存在下にて37℃で1時間インキュベートした。データは、少なくとも3つの独立なレプリケートの平均値±SDを表わしている。(C)(B)に示した335 nmでの吸収の定量結果。p値(スチューデントのt検定)を示してある。(D)10 mMのヨードアセトアミド(IAA)の不在下と存在下で、1 mMの4-チオウラシル(s4U)を、50 mMのリン酸ナトリウムバッファー(pH 8.0)と10%DMSOの存在下で記載されている温度にて5分間インキュベートした後の吸収スペクトル。データは、少なくとも3つの独立なレプリケートの平均値±SDを表わしている。(E)(D)に示した335 nmでの吸収の定量結果。p値(スチューデントのt検定)を示してある。
図2F-M】チオール結合アルキル化による4-チオウラシル誘導体化。(F)10 mMのヨードアセトアミド(IAA)の不在下と存在下で、1 mMの4-チオウラシル(s4U)を、50 mMのリン酸ナトリウムバッファー(pH 8.0)と10%DMSOの存在下で37℃にて記載されている時間インキュベートした後の吸収スペクトル。データは、少なくとも3つの独立なレプリケートの平均値±SDを表わしている。(G)(F)に示した335 nmでの吸収の定量。p値(スチューデントのt検定)を示してある。(H)10 mMのヨードアセトアミド(IAA)の不在下と存在下で、1 mMの4-チオウラシル(s4U)を、50 mMのリン酸ナトリウムバッファー(pH 8.0)と記載されている量のDMSOの存在下で50℃にて2分間インキュベートした後の吸収スペクトル。データは、少なくとも3つの独立なレプリケートの平均値±SDを表わしている。(I)(H)に示した335 nmでの吸収の定量結果。p値(スチューデントのt検定)を示してある。(J)10 mMのヨードアセトアミド(IAA)の不在下と存在下で、1 mMの4-チオウラシル(s4U)を、記載されているpHの50 mMのリン酸ナトリウムバッファーと10%DMSOの存在下で50℃にて5分間インキュベートした後の吸収スペクトル。データは、少なくとも3つの独立なレプリケートの平均値±SDを表わしている。(K)(J)に示した335 nmでの吸収の定量結果。p値(スチューデントのt検定)を示してある。(L)10 mMのヨードアセトアミド(IAA)の不在下と存在下で、1 mMの4-チオウラシル(s4U)を、50 mMのリン酸ナトリウムバッファー(pH 8.0)と50%DMSO(最適な反応[rxn]条件)の存在下で50℃にて15分間インキュベートした後の吸収スペクトル。データは、少なくとも3つの独立なレプリケートの平均値±SDを表わしている。(M)(L)に示した335 nmでの吸収の定量結果。p値(スチューデントのt検定)を示してある。
図3A】チオール結合アルキル化による4-チオウリジン誘導体化。(A)4-チオウリジン(s4U)はチオール反応性化合物であるヨードアセトアミド(IAA)と反応して求核置換(SN2)反応する結果としてカルボキシアミドメチル基をs4Uの中のチオール基に付加する。
図3B-C】チオール結合アルキル化による4-チオウリジン誘導体化。(B)質量分析によるs4Uアルキル化の分析。標準的な反応バッファー(50 mMのNaPO4(pH 8)、50%DMSO)の中で、40ナノモルの4-チオウリジンを記載されている濃度のヨードアセトアミドとともに50℃にて15分間インキュベートした。1%酢酸を用いて反応を停止させた。酸性化されたサンプルを、Ulitimate U300 BioRSLC HPLCシステム(Dionex;Thermo Fisher Scientific社)上で、Kinetex F5ペンタフルオロフェニルカラム(150 mm×2.1 mm;2.6μm、100Å;Phenomenex)を用いて流速100μl/分にて分離した。ヌクレオシドは、エレクトロスプレーイオン化した後、TSQ Quantiva質量分析器(Thermo Fisher Scientific社)を用いてオンラインで分析した。そのときのSRMは以下の通りである:4-チオウリジン m/z 260→129、アルキル化された4-チオウリジン m/z 318→186。データはTrace Finderソフトウエアスイート(Thermo Fisher Scientific社)を用いて解釈し、手作業で確認した。(C)(B)に示した2つのテクニカルレプリケートでの2つの独立な実験の定量結果。記載されている濃度のIAAでアルキル化されたs4Uの割合は、s4Uとアルキル化されたs4Uのピーク保持時間における規格化された相対的信号強度を表わす。データは平均値±SDを表わしている。
図4A-C】4-チオウリジン含有RNAのアルキル化は逆転写酵素の処理性能に影響を与えない。(A)s4Uアルキル化が逆転写酵素の処理性能に及ぼす効果を明らかにするため、5'アダプタ配列と3'アダプタ配列が隣接したショウジョウバエの小さなRNAであるdme-let-7の配列内の単一位置(p9)に組み込まれた4-チオウラシル(s4U)を含有する長さ76 ntの合成RNAを使用した。逆転写は、5' 32Pで標識したDNAオリゴヌクレオチド(3'アダプタ配列とは配列が逆で相補的)の伸長に従い、市販の逆転写酵素を使用して、ヨードアセトアミド(IAA)で処理する前と処理した後に実施した。(B)(A)のようにして調製した反応物をポリアクリルアミドゲル電気泳動によって分析した後、蛍光イメージングを実施した。IAA処理ありとIAA処理なしでのs4U含有RNAとs4U非含有RNAのプライマー伸長を、逆転写酵素Superscript II(SSII)、Superscript III(SSIII)、Quant-seq RT(QS)のいずれかを用いて実施した結果を示してある。アダプタ配列を除くRNA構成要素の配列を示してある。s4U残基の位置は赤色で示してある。RNAのシークエンシングは、記載されているddNTPを逆転写反応物に付加することによって実施した。PR、5' 32Pで標識したDNAプライマー;bg、バックグラウンド停止信号;*p9、9位の停止信号;FL、完全長産物。(C)(B)に示した実験の3つの独立なレプリケートの定量結果。記載されている逆転写酵素を使用し、先行するバックグラウンド脱離信号に規格化した後のp9における脱離信号の比(IAA処理あり 対 IAA処理なし)を、対照RNAとs4U含有RNAについて求めた。データは平均値±SDを表わしている。スチューデントのt検定を利用して統計的分析を実施した。
図5A】アルキル化により、RNAへのs4U組み込みを定量的に同定することが単一ヌクレオチドの解像度で可能になる。(A)単一位置(p9)に4-チオウリジン(s4U)が存在する、または存在しないRNAをヨードアセトアミド(IAA)で処理し、完全長産物の逆転写とゲル抽出を実施した後、PCR増幅とハイスループット(HTP)シークエンシングを実施した。
図5B-1】(B)記載されている逆転写酵素を使用し、ヨードアセトアミド(IAA)で処理した場合と処理しなかった場合の対照RNA(左図)とs4U含有RNA(右図)の各位置での変異率を示してある。棒は、3つの独立なレプリケートの平均変異率±SDを表わしている。各レプリケート(r1~r3)でシークエンシングされたリードの数を示してある。p9に出現するヌクレオチドが何であるかを示してある。
図5B-2】(B)記載されている逆転写酵素を使用し、ヨードアセトアミド(IAA)で処理した場合と処理しなかった場合の対照RNA(左図)とs4U含有RNA(右図)の各位置での変異率を示してある。棒は、3つの独立なレプリケートの平均変異率±SDを表わしている。各レプリケート(r1~r3)でシークエンシングされたリードの数を示してある。p9に出現するヌクレオチドが何であるかを示してある。
図5C】(C)逆転写酵素Superscript II(SSII)、Superscript III(SSIII)、Quant-seq RT(QS)のいずれかを使用し、IAA処理ありの場合とIAA処理なしの場合の記載されている変異に関する変異率。変異率は、s4U含有RNAオリゴヌクレオチドとs4U非含有RNAオリゴヌクレオチドの両方でヌクレオチドが同じである位置について平均した。(スチューデントのt検定によって求めた)p値を示してある。n.s.は、有意でないことを示す(p>0.05)。
図6】s4U処理がmES細胞の生存率と代謝RNA標識に及ぼす効果。(A)記載されている濃度の4-チオウリジン(s4U)の存在下で12時間(左)または24時間(右)培養したmES細胞の生存率を処理なし条件と比較して示している。その後の実験で用いる最終濃度(100μM)を三角形と点線で示してある。(B)記載されている時間にわたってパルスでs4U代謝標識した後に、またはウリジン追跡における培地交換の後に、全RNAに組み込まれたs4Uの定量結果。s4Uの組み込みは、全RNAの消化と脱リン酸化の後にHPLC分析によって単一ヌクレオシドの精度で求めた。バックグラウンドを差し引いた330 nmでのs4Uの信号強度をパルス標識が24時間の時点に規格化したものと、260 nmでのウリジンの信号強度の吸光度を示してある。(C)修飾されていないウリジンと比べたs4Uの置換率をHPLCによって求めた。mES細胞でのs4U代謝パルスと追跡標識の実験の全時点における全RNA へのs4U組み込み。数値は、3つの独立なレプリケートの平均値±SDを表わしている。標識してから24時間後に組み込み率が最大になることが示されている。
図7】Quant-seq mRNA 3'末端シークエンシングライブラリを調製するプロトコル。Quant-seqは入力として全RNAを用いるため、ポリ(A)を事前に富化したりrRNAを欠乏させたりする必要がない。ライブラリの生成は、オリゴ(dT)プライミングによって開始される。プライマーは、Illuminaに適合したリンカー配列(緑色で表示、上:「アダプタ」、次工程:最後の曲げ)をすでに含有している。第1の鎖を合成した後、RNAを除去し、第2の鎖の合成をランダムプライミングとDNAポリメラーゼによって開始する。ランダムプライマーも、Illuminaに適合したリンカー配列(青色で表示)を含有している。第1の鎖の合成と第2の鎖の合成の間に精製する必要はない。挿入サイズは、より短いリード(SR50またはSR100)に対して最適化される。第2の鎖を合成した後に磁性ビーズに基づく精製工程が続く。次にライブラリを増幅し、クラスター生成に必要な配列(赤色と紫色で表示)を導入する。多重化のため、PCR増幅抗体の間に外部バーコード(BC)を導入する。
図8A】代謝標識したときのmES細胞のmRNAにおけるs4U組み込み事象。(A)mES細胞の全RNAから生成した3つの独立なmRNAライブラリに関する代表的なゲノムブラウザのスクリーンショットであり、これらmRNAライブラリは、標準的なmRNAシークエンシング(上の3つの図)と、Cap分析遺伝子発現(CAGE;中央の3つの図)と、mRNA 3'末端シークエンシング(下の3つの図)を利用して調製された。マウスゲノムでTrim28をコードしている代表的な領域を示してある。
図8B-1】(B)Trim28のmRNA 3'末端をコードするゲノム領域の拡大図であり、3'非翻訳領域(UTR)が含まれている。処理なしのmES細胞、またはs4U 代謝標識を24時間実施したmES細胞の全RNAから調製したmRNA 3'末端シークエンシングライブラリを修飾し、シークエンシングしたもののカバレッジプロットを示してある。カバレッジプロットの基礎となる個々のリードからなる1つのサブセットを示してある。個々のリード内の赤色の棒はT>C変換を表わし、黒色の棒はT>C以外のあらゆる変異を表わす。
図8B-2】(B)Trim28のmRNA 3'末端をコードするゲノム領域の拡大図であり、3'非翻訳領域(UTR)が含まれている。処理なしのmES細胞、またはs4U 代謝標識を24時間実施したmES細胞の全RNAから調製したmRNA 3'末端シークエンシングライブラリを修飾し、シークエンシングしたもののカバレッジプロットを示してある。カバレッジプロットの基礎となる個々のリードからなる1つのサブセットを示してある。個々のリード内の赤色の棒はT>C変換を表わし、黒色の棒はT>C以外のあらゆる変異を表わす。
図9】mES細胞でRNAにs4U代謝標識した後のmRNA 3'末端シークエンシングにおける変異率の全体的分析。mES細胞の全RNAから生成したmRNA 3'末端シークエンシングライブラリを、s4U代謝標識を24時間実施する前と後について、アノテーション付き3'非本約領域(UTR)にマッピングし、変異率を、発現したすべての遺伝子について求めた。テューキー箱髭図は、UTRごとの変異を%値で示している。外れ値は示していない。個々の変異それぞれについて観察された頻度の中央値を示してある。T>C変換の増加の統計的分析は、マン-ホイットニー検定によって実施した。
図10A】mES細胞でのポリアデニル化されたmRNAの転写出力の測定。(A)本発明によってmES細胞でポリアデニル化された転写出力を求めるための実験設定。
図10B】(B)T>C変換を含有する転写産物(「SLAM-seq」)と、T>C変換を含有しない転写産物(「定常状態」)の相対含量を、(A)に記載したmRNA 3'末端シークエンシングによってカウント百万分率(cpm)を単位として求めた。定常状態と比べてSLAM-seqで過剰出現している転写産物を赤色で示してある(大きな転写出力;n=828)。定常状態で豊富な大半の転写産物は黄色で示してある(大きな定常状態発現;n=825)。mES細胞特異的な主要miRNAクラスターmiR-290とmiR-182に対応する転写産物を示してある。
図10C】(C)従来のmRNA 3'末端シークエンシングによって定常状態で検出された上位825個の遺伝子(定常状態)と、新たに転写されたRNAのうちで過剰出現した828個の遺伝子(SLAM-seq)を、(Ingenuity Pathway Analysis;www.Ingenuity.comを用いた)背後にある転写因子の予測と、(Enrichrを用いた)分子経路の予測に関して比較した結果。
図11】mES細胞におけるmRNAの安定性の全体的分析。(A)本発明によってmES細胞におけるポリアデニル化されたmRNAの安定性を調べるための実験設定。(B)mES細胞におけるmRNAの半減期の全体的分析。mES細胞で豊富に発現した9430個の遺伝子のアノテーション付き3' UTRにマッピングされたT>C変換含有リードの相対的割合を24時間パルス標識した時点に規格化し、中央値、上位四分位、下位四分位の経時変化を、単一指数関数型の減衰動態を利用してフィットさせると、mRNAの半減期(~t1/2)の中央値が4.0時間になることが明らかになった。(C)個々の転写産物の例に関する半減期の計算。Junb、Id1、Eif5a、Ndufa7について、3つの独立なレプリケートでのT>C変換含有リードの割合の平均値をパルスが24時間の時点と比べた値を示しており、単一指数関数型の減衰動態にフィットする。曲線フィッティングによって求めた各転写産物の平均半減期(t1/2)を示してある。(D)関連するGOタームに従って調節(すなわち転写調節、シグナル伝達、細胞周期、発生)、またはハウスキーピング(すなわち細胞外マトリックス、代謝プロセス、タンパク質合成)に分類された転写産物について、mRNA 3'末端シークエンシングによって求めたmRNA半減期のテューキー箱髭図表示。各カテゴリーの転写産物の数を示してある。(マン-ホイットニー検定によって求めた)p値を示してある。
図12A】小さなRNAの代謝標識のためのチオール結合アルキル化。(A)ショウジョウバエS2細胞のサイズ選択された全RNAから生成した小さなRNAライブラリに関する代表的なゲノムブラウザのスクリーンショット。ショウジョウバエのゲノムでmiR-184をコードしている代表的な領域を示してある。チミン(T、赤色)をコードしているヌクレオチドの相対位置を、それぞれの小さなRNA種の5'末端を基準として示してある。miR-184-3pとmiR-184-5pに関してすべての5'アイソフォームのうちの99%のリードを示すとともに、リードのそれぞれの数を百万分率(ppm)で示してある。
図12B】(B)s4U代謝標識を24時間実施する前と後のショウジョウバエS2細胞の全RNAから生成した小さなRNAシークエンシングライブラリをアノテーション付きmiRNAにマッピングし、変異率を、豊富に(100 ppm超)発現したmiRNAについて求めた。テューキー箱髭図は、miRNAごとの変異を%値で示している。外れ値は示していない。個々の変異それぞれについて、観察された頻度の中央値を示してある。マン-ホイットニー検定によって求めたp値を示してある。
図13A-B】マイクロRNA生合成の細胞内動態。(A)マイクロRNAは、ヘアピン含有PNAポリメラーゼII転写産物(一次マイクロRNA、プリ-miRNA)に由来し、RNアーゼIII酵素である核内のDroshaと細胞質内のDicerによる逐次プロセシングを通じて約22 ntのマイクロRNA二本鎖になる。ヘアピンプロセシング中間体(前駆-マイクロRNA、プレ-miRNA)は、RanGTPに依存して、Ranbp21によって核から細胞質へと搬出される。(B)累積分布プロットは、記載されている時間にわたってs4Uで処理したショウジョウバエago2ko S2細胞の全RNAから生成した小さなRNAライブラリの中で豊富に発現した42個のmiRNA(左)または20個のmiR*(右)に関するT>C変異の中央値を示している。p値は、コルモゴロフ-スミルノフ検定によって求めた(****=p<10-4)。Bgmaxは、最大バックグラウンドエラー率を示す。
図13C】(C)記載されているmiRNA(左)またはmiR*(右)の平均含量を、定常状態について、またはs4Uによる代謝標識の後の記載されている時点におけるT>C変異含有リードについて示している。全小さなRNAに規格化したリードの数を、百万に対する割合(ppm)を単位として示してある。バックグラウンド最大値(Bgmax)よりも変異率(Mu)が大きくなるケースを示してある。
図13D-E】(D)転写産物をコードするタンパク質のスプライシングを通じてミルトロンヘアピンが生成する。投げ縄状イントロンの枝切り(debranching)の後にミルトロンヘアピンに対して細胞質内で転写後ウリジル化を実施する。するとプレ-ミルトロンの2 ntの3'オーバーハングが変化し、DicerによってmiRNAの生合成が阻止される。(E)s4U標識実験の記載されている時点における、古典的miRNA(灰色)またはミルトロン(赤色)についてのT>C変異率(上)、または小さなRNAに規格化したT>Cリード(単位は百万に対する割合(ppm))。中央値と四分位の範囲を示してある。p値(マン-ホイットニー検定)を示してある(*、p<0.05;**、p<0.01;***、p<0.001)。n.d.、検出されず。
図14】マイクロRNAローディングの細胞内動態。(A)マイクロRNA二本鎖は、生成すると、アルゴノートタンパク質Ago1にロードされる。このプロセスで2本の鎖の一方(miR鎖)がAgo1の中に選択的に保持される一方で、他方の鎖(miR*鎖)は排除されて分解される。Ago1に結合する一本鎖miRNAは、成熟したmiRNA誘導サイレンシング複合体(miRISC)を形成する。(B)ago2ko S2細胞でのs4U代謝標識実験の間に豊富に発現した20個のmiRとmiR*のペアのT>C変換含有リードの蓄積の中央値(単位はppm)。miR(赤色)とmiR*(青色)について中央値と四分位の範囲を示してある。数値は、2つの独立な実験からのものである。p値は、マン-ホイットニー検定によってわかるように、miRとmiR*の分離が有意であることを示している(*、p<0.05;****、p<0.0001)。(C)miR(赤色、上)とmiR*(青色、下)に関して(B)に示した経時変化の拡大図。
図15】エキソ核酸分解(exonucleolytic)miRNAトリミングの細胞内動態。(A)ショウジョウバエにおけるエキソ核酸分解miRNA成熟のためのモデル。マイクロRNA(例えばmiR-34)の集合を、Dicerにより、より長い約24 ntのmiRNA二本鎖として生成させる。このmiRNA二本鎖は、Ago1にロードされてmiR*鎖が除去されると、3'→5'エキソリボヌクレアーゼであるNibblerによってエキソ核酸分解成熟を受け、成熟した遺伝子調節性miRNA誘導サイレンシング複合体を形成する。(B)ショウジョウバエのago2ko S2細胞の中のmiR-34-5pの定常状態における長さ分布を、小さなRNAのハイスループットシークエンシング(左、棒は、18回の測定の平均値±標準偏差を表わす;クローニングの平均カウント数は、百万に対する割合(ppm)で示す)によって、またはノーザン-ハイブリダイゼーション実験(右)によって求めた。(C)記載されている時間にわたってs4U代謝標識したショウジョウバエago2ko S2細胞から調製したライブラリの中のmiR-34-5pの長さ分布。T>C変換含有リード(標識あり、赤色、上)と全リード(定常状態、黒色、下)の長さ分布を示す。リードの基礎となる数を示してある。データは、2つの独立なレプリケートの平均値±標準偏差を示している。(D)記載されている時間にわたってs4U代謝標識したショウジョウバエago2ko S2細胞から調製したライブラリの中のmiR-34-5pの重み付き平均長。データは、T>C変換含有リード(標識あり、赤色)と全リード(定常状態、黒色)の平均値±標準偏差を示している。T>C変換含有リードの重み付き平均長の減少は、エキソ核酸分解トリミングがあったことを示している(灰色の領域によって強調)。(E)ショウジョウバエS2細胞のs4U代謝標識の後のmiR-34-5p(miR鎖、赤色)とmiR-34-3p(miR*鎖、青色)におけるT>C変換含有リードの相対含量によって求めたmiR-34-5pのローディング。2つの独立な実験の平均値±標準偏差を示してある。ローディングは、miR*からのmiRの分離によって表わし、灰色の領域によって強調してある。
図16A-C】miRNAの安定性の差。(A)マイクロRNA二本鎖をAgo1にロードするとプレ-miRISCが形成され、miR*鎖(青色)が分解される結果として、成熟したmiRNA誘導サイレンシング複合体(miRISC)になる。miRISC の中でのmiRNAの安定性は正確にはわからないままである。(B)ショウジョウバエago2ko S2細胞においてs4U代謝標識している時間の間に大量に発現した41個のmiRNA(赤色、左)と20個のmiR*(青色、右)に関するT位置当たり変異率の増加。それぞれの小さなRNAについて、すべてのT位置での変異率の中央値を求め、24時間の時点に規格化した。中央値と四分位範囲を示してある。数値は、2つの独立なレプリケートの平均を表わしている。半減期(t1/2)の中央値と95%信頼区間は、単一指数関数型曲線のフィッティングによって求めた。(C)41個のmiR(赤色)と20個のmiR*(青色)の半減期を示すテューキー箱髭図。p値はマン-ホイットニー検定によって求めた。
図16D】(D)記載されているmiR(赤色)とmiR*(青色)に関する定常状態での含量と平均半減期。平均半減期は、2つの独立なレプリケートの平均を表わしている。2つの独立な実験(r1とr2)における個々の半減期測定結果が示されている。測定の全時間を超える半減期のデータは、24時間超として示してある。
図16E-F】(E)41個のmiR鎖(赤色)と20個のmiR*鎖(青色)に関して2つの独立な生物レプリケートで求めた半減期の値の比較。ピアソンの相関係数(rp)と、関連するp値を示してある。(F)マイクロRNAの安定性は、定常状態でのmiRNAの含量に異なる寄与をする。40個のmiRに関する半減期の値を定常状態での含量と比べて示してある。データは、2つの独立な生物レプリケートの平均値を表わす。
図17A-B】アルゴノートタンパク質の素性が、小さなRNAの安定性を決定する。(A)ショウジョウバエでは、miRNAはAgo1に優先的にロードされてmiRISCを形成する。それと並行してmiR*のサブセットがAgo2にロードされてsiRISCを形成する。siRISCの形成には、Ago2が結合した小さなRNAの3'末端リボースの2'位における特異的メチル化が伴う。アルゴノートタンパク質の素性が小さなRNAの安定性に異なる影響を与えるかどうかはわかっていない。(B)円グラフは、野生型ショウジョウバエS2細胞に由来する小さなRNAライブラリの中のさまざまなエンド-siRNAのクラスとmiR-NAの相対含量を表わしている。標準的なクローニングプロトコルからの結果(酸化されていない、上の図)と、小さなRNAに修飾された3'末端が豊富になるクローニング戦略からの結果(酸化されている、下の図)を示してある。miRとmiR*の割合を両方のライブラリについて示してある。7つのデータセットの平均分布を示してある。平均ライブラリ深度を示してある。
図17C】(C)ヒートマップは、(灰色スケールで)示されているライブラリの中のmiR(赤色)とmiR*(青色)の相対含量を示している。ライブラリの中の相対出現比は、小さなRNAがAGO1(緑色)またはAGO2(赤色)と優先的に結び付くことを示す。
図17D-G】(D)野生型(wt)S2細胞、またはCRISPR/Cas9ゲノム操作によってAgo2が欠乏したS2細胞(ago2ko)のウエスタンブロット分析。アクチンは、ローディング対照を表わす。(E)ショウジョウバエの野生型(wt)S2細胞とago2ko S2細胞の中のAgo2が富化されたmiRとmiR*の相対含量。中央値と四分位範囲を示してある。p値は、ウィルコクソンの対応あるデータ間の符号順位検定によって求めた。(F)s4U代謝標識した野生型S2細胞(wt、黒色)またはago2ko S2細胞(赤色)から調製するか、修飾された3'末端を有する小さなRNAを富化するクローニング戦略を利用して野生型S2細胞(wt酸化、青色)から調製した標準的なライブラリの中のAgo2が富化された小さなRNA(左)とAgo1が富化された小さなRNA(右)の分解動態。(本文中に具体的に記載した)二相または単相の指数関数フィットの中央値と四分位範囲を示してある。曲線フィッティングによって求めた半減期(t1/2)を示してある。二相動態の場合には、早い動態と遅い動態の相対的寄与を示してある。(G)ago2ko S2細胞の中の最も豊富な30個のmiRNA(赤色、Ago1)、または修飾された3'末端を有する小さなRNAを豊富にするクローニング戦略を利用した小さなRNAライブラリの中の最も豊富な30個のmiRとmiR*(青色、Ago2)の半減期。中央値と四分位範囲を示してある。p値はマン-ホイットニー検定によって求めた。
図18】ショウジョウバエS2細胞における4-チオウリジン代謝標識。ショウジョウバエS2細胞でのパルス標識実験において、記載されている時間にわたってs4U代謝標識した後の全RNAへのs4U組み込みの定量結果。修飾されていないウリジンと比べたs4Uの置換率をHPLCによって求めた結果を示してあり、この置換率は、以前に記載されているようにして求めた(Spitzer 他(2014年)Meth Enzymol 第539巻、113~161ページ)。数値は、3つの独立なレプリケートの平均値±SDを表わしている。標識を24時間実施した後の最大組み込み率を示してある。
図19】ヨードアセトアミド処理は小さなRNAライブラリの品質に影響を与えない。処理前と処理後のショウジョウバエS2細胞の全RNAから生成した小さなRNAシークエンシングライブラリをアノテーション付きmiRNAにマッピングし、大量に(100 ppm超)発現したmiRNAを分析した。(A)ヨードアセトアミドで処理した、または処理していない全RNAの小さなRNAライブラリからの各miRNAについて変異率を求めた。テューキー箱髭図は、miRNAごとの変異を、%を単位として示している。外れ値は示していない。それぞれの個別の変異について、観察された頻度の中央値を示してある。(B)ヨードアセトアミドで処理した、または処理していない全RNAから調製した小さなRNAライブラリの中のmiRNAの含量。ピアソン相関係数と、関連するp値を示してある。(C)ヨードアセトアミドで処理した、または処理していない全RNAから調製した小さなRNAライブラリの中の個別のmiRNAの発現の倍数変化。
図20】代謝標識された小さなRNAにおけるs4U組み込みの頻度。テューキー箱髭図は、s4U代謝標識を24時間実施したショウジョウバエS2細胞のサイズ選択された全RNAから調製した小さなRNAライブラリの中で大量に(100 ppm超)発現した71個のmiRNAのそれぞれについて、 T>C変異を1個、または、2個、または3個含有するT>C変換リードの割合を示している。T>C変換リードの割合の中央値を示してある。
図21】s4U代謝標識は、マイクロRNAの生合成またはローディングに影響を与えない。マイクロRNA前駆体の5pアームまたは3pアームに由来する所与の小さなRNA(左)、または選択的アルゴノートローディングによって規定されてmiR鎖またはmirR*鎖を構成する所与の小さなRNA(右)の個別の位置におけるT>C変換の過剰出現または過少出現。結果は、大量に(100 ppm超)発現した(35個の5p-miRNAと36個の3p-miRNA、または44個のmiRと27個のmiR*に対応する)71個のmiRNAからのものである。相対的出現の統計的な有意差を、記載されている位置について、マン-ホイットニー検定によって集団全体と比較した。n.s.、p>0.05;n.d.、データ点が限定されているため求めることができない。
図22】前駆miRNAテーリングがmiRNAの効率的な生合成を妨げる。記載されている時間にわたってs4Uで処理した後のago2ko S2細胞から調製されたSLAM-seqによる小さなRNAライブラリにおけるプレ-miRNAウリジル化とT>C変異率の間の相関。ピアソンの相関係数(rp)と、関連するp値を示してある。
図23】ヨードアセトアミドを用いた6-チオグアノシン(s6G)の化学的修飾。6-チオグアノシンとヨードアセトアミドの化学反応(A)と、6-チオグアノシンをヨードアセトアミドで処理したときに質量分析によって求めたアルキル化効率(B)を示してある。
図24A】アルキル化することで、GからAへの変換によりRNAへのs6G組み込みが単一ヌクレオチドの解像度で同定される。(A)単一位置(p8)に6-チオグアノシン(s6G)の組み込みがある、またはないRNAをヨードアセトアミド(IAA)で処理し、完全長産物の逆転写とゲル抽出を実施した後、PCR増幅とハイスループット(HTP)シークエンシングを実施した。
図24B】(B)記載されている逆転写酵素を使用し、ヨードアセトアミド(IAA)で処理した場合と処理しなかった場合の対照RNA(左図)とs6G含有RNA(右図)の各位置での変異率を示してある。数値は、3つの独立なレプリケートの平均変異率±SDを表わしている。各レプリケート(r1~r3)でシークエンシングされたリードの数を示してある。p8に出現するヌクレオチドが何であるかを示してある。
図24C】(C)逆転写酵素Superscript II(SSII)、Superscript III(SSIII)、Quant-seq RT(QS)のいずれかを使用し、IAA処理ありの場合とIAA処理なしの場合の記載されている変異に関する変異率。変異率は、s6U含有RNAオリゴヌクレオチドとs6U非含有RNAオリゴヌクレオチドの両方についてヌクレオチドが同じである位置について平均した。(スチューデントのt検定によって求めた)p値を示してある。n.s.は有意でないことを示す(p>0.05)。
図25A】SLAM-seqを利用した転写応答の時間分解マッピング。(A)K562細胞においてフラボピリドール(300 nM)で15~60分間処理した後の応答をマッピングするSLAM-seq実験の作業フローの例。
図25B-D】(B)代謝回転が少ない遺伝子GAPDHで、フラボピリドール処理なし、またはフラボピリドール処理ありの場合の全リードと変換がある(2つ以上のT>C)リードのマッピング。(C)全リード、またはT>C変換が1つ以上あるリードとT>C変換が2つ以上あるリードでフラボピリドールによって誘導される発現変化の箱髭図。髭は5~95%の範囲を示す。(D)K562細胞でSLAM-seqを利用して調べたBCR/ABLエフェクタ経路とキナーゼ阻害剤の模式図(前処理を30分間、s4U標識を60分間)。
図25E】(E)記載されている阻害剤で処理したK562細胞において、SLAM-seqで上方調節と下方調節が最も大きかった50個の遺伝子のヒートマップおよび階層的クラスタリングと、全mRNAのレベルでのこれら遺伝子の挙動。
図25F-G】(F)全mRNAまたはSLAM-seqにおいて(D)の少なくとも1つの阻害剤によって半分以下に下方調節されることが検出された遺伝子の推定半減期。(G)(D)に記載されている阻害剤で処理したK562からのSLAM-seqリードの主成分分析。
図26A-D】BETi超感受性は、BRDによる包括的転写制御とは明確に異なる。(A)AID-BRD4ノックインアレルとTir1送達ベクターSOPの模式図。(B)SOPを用いて形質導入してオーキシン(100μMのIAA)で処理したK562AID-BRD4細胞の中のBRD4のイムノブロッティング。(C)s4U標識を60分間実施する前にオーキシンで30分間処理したK562AID-BRD4細胞のSLAM-seq応答。(D)s4U標識を60分間実施する前にJQ1(200 nM)で30分間処理したK562細胞のSLAM-seq応答。
図26E-F】(E)(C)に示したK562細胞と、同じ処理をしたMV4-11細胞でのJQ1に対するSLAM-seq応答の比較。R、ピアソン相関係数。(F)平均SLAM-seq応答と平均CRISPRスコアの比較結果であり、K562細胞、MOLM-13細胞、MV4-11細胞における遺伝子の重要性(14、15)を示している。3つの細胞系すべてで有意に下方調節されたすべての遺伝子を示してある(FDR≦0.1)。
図26G-H】(G)(C)で実施したようにしてJQ1またはCDK9阻害剤NVP-2で処理したMOLM-13細胞からのs4U標識SLAM-seqリードの主成分分析。(H)記載されている細胞系におけるJQ1とCDK9抑制に対するSLAM-seq応答の間のスピアマンの順位相関のヒートマップと階層的クラスタリング。
図27A-E】クロマチンの文脈がBETi超感受性を決定する。(A)K562細胞の中の記載されている予測因子によって、発現が一致した対照セットからBETi超感受性遺伝子を識別するためのROC曲線。(B)K562細胞の中のBETi超感受性遺伝子と公開されているスーパーエンハンサー標的が重複していることを示すベン図。(C)(B)のカテゴリーの例となる選択された遺伝子に関するH3K27ac ChIP-seqのサンプルトラックとスーパーエンハンサーアノテーション。(D)TSSから500 bp以内または2000 bp以内の214個のクロマチンシグネチャに基づいてBETi超感受性遺伝子を分類するための簡略化したモデル作成作業フロー。(E)ホールドアウト試験セットで評価したBETi超感受性の2つの独立なモデルについての(A)と同様のROC曲線であり、これらモデルはクロマチンシグネチャに基づいている。
図27F-G】(F)最も強力な正と負の5個の予測因子の、(E)に示したGLMに対する相対的な寄与度を、これら予測因子の規格化されたモデル係数に基づいて示した図。(G)125個のBETi超感受性遺伝子のTSSにおける、(F)に示した予測因子の相対ChIP-seq密度のヒートマップと階層的クラスタリング。
図28A-D】MYCは、さまざまなタイプのがんにおける細胞代謝の選択的な直接活性化因子である。(A)MYC-AIDアレルとTir1ベクターの模式図。(B)記載されている時間にわたってオーキシンで処理した後のK562MYC-AID細胞におけるMYCイムノブロッティング。(C)K562MYC-AID細胞の中でMYCが分解された後のSLAM-seqプロファイル(オーキシンでの前処理を30分間、s4U標識を60分間)。(D)全mRNAと有意に富化された遺伝セットのSLAM-seq応答。
図28E-L】(E)HCT116MYC-AID細胞での(B)と同様のMYCイムノブロッティング。(F)K562MYC-AID細胞とHCT116MYC-AID細胞におけるSLAM-seq応答の比較。(G)(C)のMYC依存遺伝子(FDR≦0.1、log2FC≦-1)を発現が一致した対照セットから識別するさまざまな予測因子のROC曲線。MYC/MAX ChIP 、TSSから2 kbp以内のChIP-seq信号によって順位付けされた遺伝子;GLM、214個のクロマチンプロファイルに基づく弾性ネットGLM。(H)最も強力な正と負の予測因子の、(G)の中のGLMに対する相対的な寄与度。(I)672個のがん細胞系におけるMYCの発現とSLAM-seqに基づくMYC-標的シグネチャの発現。MYCNまたはMYCLのレベルがMYCのレベルを超えているサンプルを強調してある。(J、K)(I)からの細胞系、またはMYCの発現が多いか少ないAML患者からの細胞系におけるMYC-標的シグネチャのGSEA。(L)MYC発現の高低とがんのタイプに基づいて分離された5583個の患者サンプルにおけるMYC-標的シグネチャの発現。****、p<0.0001(ウィルコクソンの順位和検定)。
図29A-D】遺伝子発現の差をマッピングするためのSLAM-seqの実験設定。(A)標的とする1つの擾乱と、代謝回転率が異なる遺伝子でmRNAのレベルに対してその擾乱が及ぼす一次的効果および二次的効果の模式図であり、BETi処理とMYC標的遺伝子の間接的な抑制が例示されている。(B)mRNAの中の4-チオウリジン残基をヨードアセトアミドでアルキル化する。(C)標識時間が60分間のSLAM-seq実験において、T>C変換が1つ以上または2つ以上であるリードに対するバックグラウンドエラー率の寄与度。バックグラウンド信号は、s4U処理をした細胞とs4U処理をしなかった細胞からのmRNAのアルキル化とシークエンシングを並列して実施することによって測定した。箱髭図は、s4U処理をしたライブラリの中の標識されたリードの割合から推定したmRNA代謝回転が多い遺伝子(上位10%)、中程度の遺伝子(中位45~55%)、少ない遺伝子(下位10%)のエラー率を示している。髭は5~95%の範囲を示す。(D)SLAM-seqによる新たに合成されたmRNAの回収をリード当たりのT含量の関数として示している。推定は、新たに合成されたmRNAの中でのT当たりの標識効率が11.4%であることに基づいている。上に示したヒストグラムは、リード長が異なる場合の3'UTRリードのT含量を示している。
図29E】(E)図25Eに示したSLAM-seqサンプルについて、記載されているキナーゼ阻害剤で処理したK562細胞におけるMAPK・AKT経路抑制の確認。
図30A-C】骨髄性白血病細胞系における直接的なJQ1応答。(A)図26DでJQ1を用いて処理したK562細胞について、SLAM-seqによって測定した遺伝子発現の全体的変化をまとめた箱髭図。(B、C)細胞系MOLM-13とMV4-11について、図2DのようにSLAM-seqによってマッピングしたJQ1処理に対する一次応答。
図30D-G】(D)(A)におけるように、MOLM-13細胞とMV4-11細胞について、JQ1で処理したときの遺伝子発現の全体的変化のまとめ。(E、F)記載されている細胞系についてJQ1で処理したときの遺伝子発現の変化の一対比較。(G)図26B図26Cに示したK562細胞におけるJQ1と急速なBRD4分解に対するSLAM-seq応答の比較。MOLM-13、MV4-11、K562でJQ1を用いた処理によって誘導される遺伝子と、BRD4分解によって誘導される遺伝子で共通するものを青色で強調してある。****は、中央値が0からずれていることをウィルコクソンの符号順位検定によって計算したときp<0.0001であることを示す。
図31A-B】細胞レベルと転写レベルでのCDK9抑制とBETブロモドメイン抑制の相乗効果。(A)記載されている用量のNVP-2とJQ1によるMOLM-13細胞とOCI-AML3細胞の増殖抑制をCellTiter-Glo発光細胞生存アッセイで3日間測定した結果。(B)(A)におけるNVP-2とJQ1の相乗効果をブリス加算性からの過剰として表示した図。
図31C】(C)s4U標識を60分間実施する前にMOLM-13細胞で30分間実施した記載されている用量のJQ1処理、NVP-2処理、組み合わせ処理に対する一次応答。
図31D-F】(D)JQ1に対する応答と(C)に示した中間用量のNVP-2(6 nM)に対する応答の一対比較。Rは、ピアソン相関係数を表わす。(E)(C)におけるようにしてOCI-AML3細胞をNVP-2とJQ1で処理したときのmRNA出力の全体的な変化。点は、3つの独立なレプリケートについて、SLAM-seqにおける全リードに対するs4Uで標識されたリードの割合を示す。(F)(E)でNVP-2とJQ1を用いて処理したOCI/AML3細胞からのSLAM-seqリードの主成分分析。%は、各主成分によって説明される全分散の割合を示す。
図32A-B】JQ1超感受性を予測する因子の導出と検証。(A)JQ1で90分間処理した(前処理を30分間+s4U標識を60分間)後、JQ1超感受性遺伝子と、対照遺伝子のバランスの取れたセットとをSLAM-seq応答に基づいて選択するための作業フロー。対照遺伝子は、コルモゴロフ-スミルノフ検定(KS)を利用して、ベースライン発現が同じであることについてサブサンプリングと検証を繰り返すことによって選択した。(B)スーパーエンハンサー(SE)によってJQ1超感受性遺伝子を対照遺伝子と比較して予測するためのROC曲線。それぞれのSEが、最も近いTSSを持つ遺伝子に割り当てられ、遺伝子がスーパーエンハンサーのランクによってソーティングされた。
図32C-D】(C)図27Eに示したK562細胞におけるBETi超感受性をTSSに基づいて分類する因子を導出するための作業フロー。SVM - サポートベクターマシン、GLM - 弾性ネット正則化によって導出される一般化された線形モデル、GBM - 勾配ブースティングモデル。
図33A】K562細胞におけるJQ1超感受性を予測するGLMの特徴づけ。(A)図27Eに示したGLMに寄与するすべての予測因子に関する係数の棒グラフ。隣の表には、それぞれの予測因子と、対応する公開ChIP-seqトラックの識別因子(表S1も参照のこと)と、転写開始部位から500 bp以内または2000 bp以内で信号が測定されたかどうかが記載されている。
図33B】(B)(A)の正と負の5個の独自の最強予測因子の相対的ChIP-seq信号に基づく、JQ1超感受性遺伝子と対照遺伝子のヒートマップと階層的クラスタリング。
図34A-B】内在タグ付きMYC-AID細胞系におけるMYC分解に対する一次応答。(A)図4Cに示したオーキシンで処理したK562MYC-AID細胞のSLAM-seq応答のVolcanoプロット。枠内には、下方調節された遺伝子および上方調節された遺伝子(FDR≦0.1)と、2倍超の調節解除があった遺伝子の総数が記載されている。縦軸の数値は見やすくするため20までに制限してある。(B)(A)におけるHCT116MYC-AID 細胞のSLAM-seq応答を、記載されているGOタームに関係する遺伝子について示した図。
図34C-D】(C)(A)におけるようにしてオーキシンで処理したHCT116MYC-AID 細胞のSLAM-seqの結果を示すVolcanoプロット。(D)K562MYC-AID細胞における急激なMYC分解に対するSLAM-seq応答を、異なるRNAポリメラーゼ複合体のサブユニットをコードする遺伝子について、GOタームによってグループ化して示してある。
図35A-B】MYC依存性遺伝子発現のクロマチンに基づく予測。(A)MYCの分解に応答しない遺伝子(FDR≦0.1、-0.2≦log2FC≦0.2)からMYC依存性遺伝子(FDR≦1、log2FC≦-1)を識別する性能を図28Cの中の5個の分類因子について測定するROC曲線。モデルは図32におけるようにして導出し、802個の遺伝子からなる試験セットで訓練し、268個の遺伝子からなる試験セットで評価した。(B)検証のためホールドアウトされた遺伝子の追加セットで(A)に示したGLMの性能を評価するROC曲線。
図35C-E】(C)(A)に示したGLMの全予測因子の係数。(D)遺伝子のTSSから2000 bp以内にMYC ChIP-seqのピークが存在することに基づいてMYC依存性遺伝子を予測するためのROC。図32におけるように、各遺伝子について、細胞mRNAのレベルに最も寄与するTSSを、CAGE-seq信号に基づいて選択した。SPPピーク - SPPによってコールされるピーク;IDRピーク - 発見再現不能率の閾値である2%を超えるピーク。(E)上記のようにしてMYC結合遺伝子とMYC依存遺伝子に分類される7135個の遺伝子のベン図。
図36】ヒトがん細胞系におけるMYCオルソログの発現。(A)672個のがん細胞系からのRNA-seqプロファイルにおけるMYC発現とMYCL発現の比較。(B)(A)と同じがん細胞系におけるMYC発現とMYCN発現の比較。
図37】5-ブロモウリジン(5BrU)含有RNAオリゴヌクレオチドを逆転写している間のpHに依存した塩基対形成の頻度をシークエンシングによって測定した。(a)5BrUの互変異性体形態は、アデニンまたはグアニンに対してpHに依存した異なる塩基対形成特性を示す。(b)RNAの文脈において、5BrUで修飾された位置にヌクレオチドが間違って組み込まれることに関するpHに依存した効果を検出するための実験の概略。(c)記載されているpH条件で逆転写した後に、5BrUで修飾されたヌクレオチドの位置で観察される特定の変換に関する変換率。pH 7の条件と比べて変換率が増大することが示されている。独立な測定の数はn=3であり、棒は、平均収束率±SDを示している。p値(対応のない、パラメトリックなスチューデントのt検定)を示してある。n.s.、有意ではない(p>0.05);*、p<0.05;**、p<0.01;***、p<0.001;****、p<0.0001。
【実施例0077】
実施例1:材料と方法
【0078】
s4Uのカルボキシアミドメチル化
【0079】
特に断わらない限り、カルボキシアミドメチル化は、1 mMの4-チオウラシル(SIGMA社)、800μMの4-チオウリジン(SIGMA社)、s4U 代謝標識実験から調製した5~50μgの全RNAのいずれかを用いて標準的な条件(50%DMSO、10 mMのヨードアセトアミド、50 mMのリン酸ナトリウムバッファーpH8、50℃で15分間)で実施した。過剰なDTTを添加して反応を停止させた。
【0080】
吸着測定
【0081】
特に断わらない限り、1 mMの4-チオウラシルを最適な条件(10mMのヨードアセトアミド、50%DMSO、50 mMのリン酸ナトリウムバッファーpH8、50℃で15分間)でインキュベートした。100 mMのDTTを添加することによって反応を停止させ、吸着スペクトルをNanodrop 2000装置(Thermo Fisher Scientific社)で測定した後、400 nmでの吸着からベースラインを差し引いた。
【0082】
質量分析
【0083】
40ナノモルの4-チオウラシルまたは6-チオグアノシンを、標準的な反応条件(50 mMのリン酸ナトリウムバッファー、pH 8;50%DMSO)のもとで、0.05、 0.25、0.5、5マイクロモルいずれかのヨードアセトアミドの不在下または存在下にて50℃で15分間反応させた。1%酢酸を用いて反応を停止させた。酸性化されたサンプルを、Ulitimate U300 BioRSLC HPLCシステム(Dionex;Thermo Fisher Scientific社)上で、Kinetex F5ペンタフルオロフェニルカラム(150 mm×2.1 mm;2.6μm、100Å;Phenomenex社)を用いて流速100μl/分にて分離した。ヌクレオシドは、エレクトロスプレーイオン化した後、TSQ Quantiva質量分析器(Thermo Fisher Scientific社)を用いてオンラインで分析した。そのときのSRMは以下の通りである:4-チオウリジン m/z 260→129、アルキル化された4-チオウリジン m/z 318→186、6-チオ-グアノシンm/z 300→168、アルキル化された6-チオ-グアノシンm/z 357→225。データはTrace Finderソフトウエアスイート(Thermo Fisher Scientific社)を用いて解釈し、手作業で確認した。
【0084】
プライマー伸長アッセイ
【0085】
プライマー伸長アッセイは、本質的にNilsenら(Cold Spring Harb Protoc. 2013年、1182~1185ページ)が以前に記載しているようにして実施した。簡単に述べると、鋳型RNAオリゴヌクレオチド(5L-let-7-3L or 5L-let-7-s4Up9-3L;Dharmacon;配列に関しては表を参照されたい)を製造者の指示に従って脱保護し、変性ポリアクリルアミドゲル-溶離によって精製した。100μMの精製RNAオリゴヌクレオチドを、標準的な反応条件(50%DMSO、50 mMのリン酸ナトリウムバッファー、pH 8)のもとで、10 mMのヨードアセトアミド(+IAA)またはEtOH(-IAA)を用いて50℃にて15分間処理した。20 mMのDTTを添加して反応を停止させた後、エタノール沈降を実施した。γ-32P-ATP(Perkin-Elmer社)とT4-ポリヌクレオチドキナーゼ(NEB社)を用いてRTプライマー(配列に関しては表を参照されたい)の5'を放射性標識した後、変性ポリアクリルアミドゲル-精製を実施した。PCR装置の中の2×アニーリングバッファー(500 mM KCl、50 mMトリス pH 8.3)の中で640 nMのγ-32P-RTプライマーを400 nMの5L-let-7-3Lまたは5L-let-7-s4Up9-3Lにアニールした(3分間95℃、30秒間85℃、移行速度0.5℃/秒、5分間25℃、移行速度0.1℃/秒)。逆転写は、Superscript II(Invitrogen社)、Superscript III(Invitrogen社)、Quant-seq RT(Lexogen社)のいずれかを製造者が推奨するようにして用いて実施した。ジデオキシヌクレオチド反応のため、(指示されているように)最終濃度500μMのddNTPをRT反応物に添加した。反応が完了するとRT反応物をホルムアルデヒドローディングバッファー(ゲルローディングバッファーII、Thermo Fisher Scientific社)の中に再懸濁させ、12.5%変性ポリアクリルアミドゲル電気泳動を実施した。ゲルを乾燥させ、ストレージ蛍光スクリーン(Perkin-Elmer社)で露光し、Typhoon TRIO可変モード撮像装置(Amersham Biosciences社)で画像を取得し、ImageQuant TL v7.0(GE Healthcare社)を用いて定量した。脱離を分析するため、個々の反応について、p9位における信号強度を先行する脱離信号強度(bg、図4B)に規格化した。s4U含有RNAオリゴヌクレオチドとs4U非含有RNAオリゴヌクレオチドに関する脱離信号の変化(+IAA/-IAA)を表わす値を、記載されている逆転写酵素について比較した。4-チオウリジンに代わる6-チオグアノシン修飾を、対応する設定を利用して分析した。
【0086】
【表1】
【0087】
【表2】
【0088】
【表3】
【0089】
s4Uまたはs6Gで標識したRNAのHPLC分析
【0090】
代謝標識の後の全RNAへのs4U またはs6G の組み込みを、以前にSpitzerら(Meth Enzymol. 第539巻、113~161ページ(2014年))が記載しているようにして分析した。
【0091】
細胞生存アッセイ
【0092】
実験の前日に5000個のmES細胞を96ウエルに播種した。(記載されている)異なる濃度のs4Uを含有する培地を細胞に12時間または24時間にわたって添加した。細胞の生存を、CellTiter-Glo(登録商標)Luminescent Cell Viability Assay(Promega社)を製造者の指示に従って用いて評価した。蛍光信号は、SynergyでGen5ソフトウエア(v2.09.1)を用いて測定した。
【0093】
細胞の培養
【0094】
マウス胚性幹(mES)細胞(クローンAN3-12)をHaplobank(Elling他、WO 2013/079670)から取得し、15%FBS(Gibco社)1×ペニシリン-ストレプトマイシン溶液(100 U/mlのペニシリン、0.1 mg/mlのストレプトマイシン、SIGMA社)、2 mMのL-グルタミン(SIGMA社)、1×MEM非必須アミノ酸溶液(SIGMA社)、1 mMのピルビン酸ナトリウム(SIGMA社)、50μMの2-メルカプトエタノール(Gibco社)、20 ng/mlのLIF(自家製)の中で培養した。細胞は、5%CO2で37℃に維持し、2日ごとに継代した。
【0095】
シークエンシングを変化させるためのRNAの修飾("SLAM-seq")
【0096】
実験の前日に、10 cmの皿にmES細胞を105細胞/mlの密度で播種した。mES細胞を、標準的な培地だが水中の500 mM貯蔵溶液からs4Uまたはs6G(SIGMA社)を100μM添加した点が異なる培地の中でインキュベートすることにより、s4U代謝標識を実施した。代謝標識の間、s4Uまたはs6Gを含有する培地を3時間ごとに交換した。ウリジン追跡実験のため、s4Uまたはs6Gを含有する培地を廃棄し、細胞を1×PBSで2回洗浄し、10 mMのウリジン(SIGMA社)を補足した標準的な培地とともにインキュベートした。細胞をTRIzol(登録商標)(Ambion社)の中で直接溶解させ、RNAを製造者の指示に従って抽出したが、イソプロパノール沈降の間に最終濃度0.1 mMのDTTを添加した点が異なっている。RNAは1 mMのDTTで再懸濁した。5μgの全RNAを最適な反応条件下にて10 mMのヨードアセトアミドで処理した後、エタノール沈降させ、Quant-seq 3'末端mRNAライブラリを調製した(Moll他、Nat Methods 第11巻(2014年);WO 2015/140307)。
【0097】
RNAライブラリの調製
【0098】
Illumina(登録商標)(NEB社)のためのNEBNext(登録商標)Ultra(商標)Directional RNA Library Prep Kitを製造者の指示に従って用いて標準的なRNA配列ライブラリを調製した。Mohnら(Cell. 第157巻、1364~1379ページ(2014年))が以前に記載しているようにしてCap-seqライブラリを調製したが、断片化の前に磁性RiboZero Kit(Epicenter社)を用いてリボソームRNAを欠乏させた点が異なっている。Quant-seq mRNA 3'末端ライブラリ調製キット(Lexogen社)を製造者の指示に従って用いてメッセンジャーRNAの3'末端のシークエンシングを実施した。
【0099】
データ分析
【0100】
ImageQuant v7.0a(GE Healthcare社)を用いてゲル画像を定量した。Prism v7.0(GraphPad社)またはR(v2.15.3)で一次反応のための統合速度則に従って曲線フィッティングを実施した。Prism v7.0a(GraphPad社)、Excel v15.22(Microsoft社)、R(v2.15.3)のいずれかで統計的分析を実施した。
【0101】
バイオインフォマティクス
【0102】
合成RNAサンプルのシークエンシング分析(図5)を目的として、バーコード内に0個のミスマッチを許容するPicard Tools BamIndexDecoder v1.13を用い、バーコード化したライブラリを逆多重化した。得られたファイルを、picard-tools SamToFastq v1.82を用いてfastqに変換した。Cutadapt v1.7.1を用いてアダプタをトリミングし(デフォルトでアダプタ配列中に10%のミスマッチを許容)、フィルタして長さ21 ntの配列を探す。得られた配列を、3個のミスマッチが可能なbowtie v0.12.9を用いて成熟dme-let-7配列(5'-TGAGGTAGTAGGTTGTATAGT-3'、配列ID番号7)にアラインメントし、samtools v0.1.18を用いてbamに変換した。あいまいなヌクレオチド(N)を含有する配列は除去した。残っているアラインメントされたリードをパイルアップ形式に変換した。最後に、位置ごとの各変異の割合をパイルアップから抽出した。出力表をExcel v15.22(Microsoft社)とPrism v7.0a (GraphPad社)の中で分析してプロットした。
【0103】
mRNA 3'末端シークエンシングのデータを分析するため、バーコード内に1個のミスマッチを許容するPicard Tools BamIndexDecoder v1.13を用い、バーコード化したライブラリを逆多重化した。Cutadapt v1.5を用いてアダプタをクリップし、リードをサイズでフィルタして15ヌクレオチド以上を探した。STAR aligner v2.5.2bを用いてリードをマウスゲノムmm10にアラインメントした。アラインメントをフィルタしてアラインメントスコアが0.3以上のものを探し、アラインメントアイデンティティが0.3以上をリード長に規格化した。30箇所以上が一致したアラインメントだけを報告した。15 bp以上が重複するキメラアラインメントだけを許容した。2-パスマッピングを利用した。200 kb未満のイントロンをフィルタし、非古典的接合部を含有するアラインメントをフィルタした。マッピングされた塩基に対するミスマッチの比が0.1以上であるアラインメント、またはミスマッチの最大数が10個であるアラインメントをフィルタした。1個、2個、3個、N個のリードによって接合部に許容されるギャップの最大数をそれぞれ 10 kb、20 kb、30 kb、50 kbに設定した。(1)非古典的モチーフ、(2)GT/AGモチーフとCT/ACモチーフ、(3)GC/AGモチーフとCT/GCモチーフ、(4)AT/ACモチーフとGT/ATモチーフについて、両側のスプライス接合部に関する最小オーバーハング長は、それぞれ20、12、12、12に設定した。「擬似」接合フィルタリングを利用し、1つのリードに許容される多重アラインメントの最大数を1に設定した。FeatureCounts を用いてエキソンのリード(Gencode)を定量した。
【0104】
キャップ分析遺伝子発現(CAGE)のため、バーコード内に1個のミスマッチを許容するPicard Tools BamIndexDecoder v1.13を用い、バーコード化したライブラリを逆多重化した。seqtkを用いてリードの最初の4 ntをトリミングした。BWA(v0.6.1)を用いて既知のrRNA配列(Ref-Seq)にアラインメントすることにより、リードをリボソームRNAに関してスクリーニングした。TopHat (v1.4.1)を用い、rRNAを差し引いたリードをマウスゲノム(mm10)にアラインメントした。最大マルチヒットを1に、セグメント長を18に、セグメント-ミスマッチを1に設定した。それに加え、遺伝子モデルがGTF(Gencode VM4)として提供された。
【0105】
mRNA 3'末端シークエンシング(Quant-seq)のデータセットを分析するため、バーコード内に1個のミスマッチを許容するPicard Tools BamIndexDecoder v1.13を用いてリードを逆多重化した。逆多重化したリードの5'末端にある5個のヌクレオチドをトリミングした。SLAMdunk(NeumannとRescheneder、t-neumann.github.io/slamdunk/;Herzog他、Nature Methods 第14巻、1198~1204ページ(2017年))を用いてリードをマウスゲノムmm10にアラインメントし、アノテーション付き3' UTR(Gencode)の中のアラインメントをカウントした。簡単に述べると、SLAMdunkは、柔軟で速いリードマッピングプログラムであるSLAMdunkはNextGenMapに依存しており、マッピング工程のためのT>Cミスマッチペナルティをなくす適合スコアリングスキームを利用して作られたオーダーメイドである。3'UTRにアラインメントされるT>C含有リードとT>C非含有リードを定量し、s4Uで標識した転写産物または標識なし転写産物の含量をそれぞれ導出した。
【0106】
転写出力を分析するため、SLAMdunkを用いてハイスループットシークエンシングのデータをマウスゲノムmm10にアラインメントした後、全遺伝子について、規格化されたリードの数(単位はcpm;「定常状態発現」)と、T/C変異を1つ以上含有する規格化されたリードの数(単位はcpm;「転写出力」)を取得した。ミトコンドリア(Mt-)遺伝子と予測される(GM-)遺伝子を分析から除外した。バックグラウンドのT/Cリード(s4U標識なしで観察されるT/Cリード)を1時間の時点におけるT/Cリードから差し引き、「定常状態発現」の平均値に関して5 cpm超という発現閾値を設定した。転写出力が大きい遺伝子を同定するため、log10(定常状態発現)対log10(転写出力)(遺伝子の数:6766個)をプロットした後に線形回帰によりフィットさせると、式Y=0.6378×X - 1.676で表わされた。各遺伝子について、フィットさせた直線への距離(ΔY)を、ΔY=転写出力(cpm)- (0.6378×定常状態発現(cpm)-1.676)として計算した。「高転写出力」遺伝子は、ΔY>0.5と定義した(遺伝子の数:828個)。「高発現遺伝子」は、定常状態のCPM>log10(2.15)と定義した(遺伝子の数:825個)。各クラスの遺伝子を規定する転写因子ネットワークを予測するため、Ingenuity Pathway Analysis(Qiagen社)v27821452を「高転写出力」遺伝子または「高発現」遺伝子で用いた。Ingenuity Pathway Analysisは、生物学者が自分たちの実験結果にとって重要な治療に関係するネットワークを発見し、可視化し、探索することを可能にするウェブ上のアプリケーションである。Ingenuity Pathway Analysisの詳細な説明に関してはwww.Ingenuity.comを訪問されたい。予測される上位5個の上流調節因子が示される。
【0107】
「高転写出力」の経路または「高発現」遺伝子を予測するため、オンラインツールであるEnrichrを、2つの遺伝子クラスの入力で用いた。予測される上位5つの経路が表示される。
【0108】
実施例2:RNAの代謝シークエンシングのためのチオール結合アルキル化
【0109】
原理の検証として、培養した細胞中のRNA発現動態を明らかにするのにs4Uまたはs6Gで標識した、または標識していないRNA種を生化学的に分離せねばならないことを回避するための誘導体化戦略の例として、チオールヌクレオチドを選択した(図1)。この戦略はよく確立された代謝標識アプローチに基づいているが、効果的でなくて時間のかかるビオチニル化工程を回避している。この戦略は、s4U含有RNAをヨードアセトアミドで修飾することを含む短い化学処理プロトコルを含有している。ヨードアセトアミドはスルフヒドリル反応性化合物であり、s4Uまたはs6Gと反応すると塩基対形成界面にかさばる基を生じさせる(図1)。s4U組み込み部位にかさばる基が存在していると、よく確立されたRNAライブラリ調製プロトコルと組み合わせるとき、逆転写(RT)の間にGが特異的かつ定量可能な程度に間違って組み込まれるが、RTの処理性能には影響がない。したがってs4Uまたはs6Gを含有する配列は、TからCへの移行のコーリングにより、配列比較によって、すなわちハイスループットシークエンシングライブラリの中でバイオインフォマティクスによって、単一ヌクレオチドの解像度で同定することができる。重要なことだが、ウリジンをシトシンに変換する酵素は知られておらず、例えばIllumina HiSeq 2500プラットフォームを用いたハイスループットRNAシークエンシングのデータセットにおける同様のエラー率(すなわちT>C変換)は極めて小さく、1万個に1個未満の頻度で起こる。このアプローチは、その最も好ましい実施態様であるRNAのthiol(SH)-linked alkylation for the metabolic sequencing(代謝シークエンシングのためのチオール(SH)結合アルキル化)の略号として「SLAM-seq」と呼ばれる。
【0110】
SLAM-seqは、RNA種における代謝-標識由来の4-チオウリジン組み込み事象の検出をハイスループットシークエンシングにより単一ヌクレオチドの解像度で可能にするヌクレオチド類似体誘導体化化学に基づいている。われわれは、この新しい方法が、マウス胚性幹細胞の中でRNAポリメラーゼIIに依存したポリアデニル化転写出力を正確に測定し、包括的転写後遺伝子調節シグネチャを再現することを示す。本発明により、RNA発現動態を高い時間解像度で迅速かつトランスクリプトーム全体で分析するための、拡張性があって非常に定量可能でコスト効率と時間効率のよい方法が提供される。
【0111】
s4U誘導体化のため、効果的な第1のチオール反応性化合物の一例として、求核置換(SN2)反応の結果としてカルボキシアミドメチル基をチオール基に付加するヨードアセトアミド(IAA)を使用した(図2A)。同様の反応が、他のチオール化された核酸塩基(s6Gなど)で起こる(図23A)。s4U誘導体化の効率をさまざまなパラメータ(すなわち時間、温度、pH、IAAの濃度、DMSO)の関数として定量的にモニタするため、4-チオウラシルの特徴的な吸収スペクトル(ほぼ335 nmであり、ヨードアセトアミド(IAA)と反応すると、ほぼ297 nmへとシフトする)をモニタした(図2B図2K)(45)。最適な反応条件(10 mMのIAA;50 mMのNaPO4、pH 8;50%DMSO;50℃;15分間)では、335 nmでの吸収が、処理なしの4-チオウラシルと比べて1/50に低下する結果、アルキル化率が少なくとも98%になる(図2L図2M)。(注:4-チオウラシルとそのアルキル化された誘導体は一部が重複するため、変換率は過小評価されている可能性がある。)リボースの文脈(すなわち4-チオウリジンまたは6-チオグアノシン)における質量分析によるチオール特異的アルキル化の分析から、完全に近い誘導体化効率が確認された(図3図23B)。
【0112】
s4Uまたはs6Gの組み込み事象の量的回収では、逆転写酵素が、脱離のないアルキル化されたs4U残基群を通過することが前提とされている。s4Uアルキル化またはs6Gアルキル化が逆転写酵素の処理性能に及ぼす効果を明らかにするため、s4Uまたはs6Gの組み込みを1つだけ含有する合成RNA(配列に関しては実施例1の表を参照されたい)を使用し、市販されている3種類の逆転写酵素(RTs)(Superscript II、Superscript III、Quant-seq RT)をプライマー伸長アッセイで調べた(図4A)。バックグラウンド脱離信号に規格化すると、同じ配列だがs4U またはs6Gを含有しないオリゴと比べたとき、s4Uアルキル化またはs6Gアルキル化がRTの処理性能に及ぼす有意な効果は観察されなかった(図4B図4C図24B)。われわれは、アルキル化によって逆転写の終了が早くなりすぎることはないと結論した。
【0113】
s4Uアルキル化とs6Gアルキル化が逆転写酵素に指示されるヌクレオチド組み込みに及ぼす効果を評価するため、プライマー伸長反応の完全長産物を単離し、cDNAをPCRで増幅し、ライブラリに対してIllumina HiSeq 2500装置を用いてハイスループットシークエンシングを実施した(図5A図24A)。予想通り、s4U非含有対照RNAまたはs6G非含有対照RNAにおける全3回のRTによってウリジンが正確に逆転写され、ヨードアセトアミドを用いた処理とは無関係で平均変異率は10-2未満であった(図5B図24B、左図)。それとは対照的に、s4Uの存在は、アルキル化がない場合でさえTからCへの一定の10%~11%の変換を促進したが、それはおそらくs4U互変異性体の塩基対形成が変化したことに起因する(図5B、右上の図)。s6Gの場合には、GからAへの変換が観察された(図24B、右の図)。注目すべきことに、ヨードアセトアミド処理によるs4Uのアルキル化は、TからCへの変換を8.5倍に増大させ、調べたすべてのRTで変異率が0.94超になった(図5Bの右下の図)。Illuminaハイスループットシークエンシングのデータセットで報告されているシークエンシングエラー(10-3未満)と比べると、940超:1という信号対雑音比が得られた。重要なことだが、ヨードアセトアミド処理がチオール非含有ヌクレオチドの変異率に及ぼす有意な効果は観察されなかった(図5C図24C)。われわれは、ヨードアセトアミド処理に続く逆転写により、RNAへのs4Uまたはs6Gの組み込みを単一ヌクレオチドの解像度で定量的に同定することが可能になる一方で、チオール非含有ヌクレオチドの配列情報には影響がないと結論した。
【0114】
実施例3:mES細胞における、代謝標識されたmRNAへの修飾されたヌクレオチドの組み込み
【0115】
マウス胚性幹細胞がさまざまな濃度のs4Uで12時間後または24時間後にs4U代謝RNA標識を許容する能力を調べた(図6A)。以前に報告されているように、高濃度のs4Uは細胞の生存を損ない、標識してから12時間後または24時間後のEC50はそれぞれ3.1 mMまたは380μMである(図6A)。したがって標識条件として100μMのs4Uを利用した。この濃度だと細胞の生存に深刻な影響がなかった。この条件下で、標識してから3時間後、6時間後、12時間後、24時間後に全RNA調製物へのs4Uの組み込みの安定な増加が検出されるとともに、ウリジン追跡の3時間後、6時間後、12時間後、24時間後に安定な減少が検出された(図6B)。予想通り、組み込みの動態は単一の指数関数に従い、s4Uの最大平均組み込み値は1.78%であり、これは全RNAの中に56個のウリジンにつき1個のs4Uが組み込まれることに対応する(図6C)。これらの実験により、mES細胞でのs4U標識条件が確立される。それを利用して、擾乱がない条件下におけるRNAの生合成と代謝回転率を測定することができる。
【0116】
この方法がハイスループットシークエンシングのデータセットでs4U組み込み事象を明らかにする能力を検証するため、24時間にわたるs4U代謝RNA標識の後に培養した細胞から調製した全RNAを用いて(Lexogen社のQuant-seqという3' mRNAシークエンシングライブラリ調製キットを利用して)mRNA 3'末端ライブラリを生成させた(図7)(Moll他、上記文献)。Quant-seq 3' mRNA-Seq Library Prep Kitは、遺伝子Trim28に関して例示してあるように、ポリアデニル化されたRNAの3'末端に近い配列のライブラリでIlluminaに適合しているものを生成させる(図8A)。他のmRNAシークエンシングプロトコルとは異なり、転写産物ごとに1つの断片だけが生成されるため、リードを遺伝子の長さに規格化する必要がない。その結果として鎖特異性の大きい正確な遺伝子発現値が得られる。
【0117】
さらに、シークエンシングが容易なライブラリをほんの4.5時間以内に生成させることができ、実施時間は約2時間である。Quant-seqを本発明と組み合わせると、転写産物特異的な領域での変異率を正確に求めることが容易になる。なぜならライブラリは配列の不均一性の程度が小さいからである。実際、s4U代謝RNA標識の24時間後にmES細胞の全RNAからUで修飾されたRNAのライブラリをQuant-seq のプロトコルで生成させると、標識のないmES細胞の全RNAから調製したライブラリと比べてT>C変換の強い蓄積が観察された(図8B)。この観察結果をトランスクリプトーム全体で確認するため、リードをアノテーション付きの3' UTRにアラインメントし、UTRごとの変異の発生を調べた(図9)。s4U代謝RNA標識がない場合には、任意の変異について0.1%以下という変異率中央値が観察された。この変異率は、Illuminaで報告されているシークエンシングのエラー率に合致している。s4U代謝RNA標識の24時間後、T>C変異率の統計的に有意な(p<10-4、マン-ホイットニー検定)25倍の増加が観察された一方で、他のすべての変異率は、予想されるシークエンシングエラー率未満に留まっていた(図9)。より具体的には、標識してから24時間後に2.56%というs4U組み込み中央値が観察された。これは、ウリジン39個ごとにs4Uが1個組み込まれることに対応する。(注:mRNAに関するこの組み込み頻度中央値は、全RNAでのHPLCによって推定される値よりも大きい[図6C]。安定な非コード化RNA種(rRNAなど)が全RNAでは強く過剰出現している可能性が大きいからである。)これらの分析から、新規な方法により、培養した細胞において、s4U代謝RNA標識の後にmRNAへのs4U組み込み事象が明らかになることが確認される。
【0118】
以前に報告されているように(Eidinoff 他、Science. 第129巻、1550~1551ページ(1959年);Jao他、PNAS第105巻、15779~15784ページ(2008年);Melvin他、Eur. J. Biochem. 第92巻、373~379ページ(1978年);Woodford他、Anal. Biochem. 第171巻、166~172ページ(1988年))、修飾された他のヌクレオチド(s6Gまたは5-エチニルウリジン)でも同じ組み込み結果になることが予想される。
【0119】
実施例4:5-ブロモ-ウリジンの利用と、逆転写の間のpHに依存した塩基対形成頻度
【0120】
Yuら(The Journal of Biological Chemistry、第268巻:21、15935~15943ページ、1993年)は、塩基類似体であるブロモウラシルが、重合の間に、pHの関数として、G(グアニン)と間違ってペアを形成することを示した。さらに、5BrUは、細胞に取り込まれ、リン酸化され、新生RNAに組み込まれることが示されている(Larsen他、Current Protocols in Cytometry. 第12 (7.12)巻:7.12.1~7.12.11ページ、2001年)。われわれは、両者を利用して、pHバリアントNGSライブラリ調製物とシークエンシングによって5BrU標識を同定できることを明らかにする。中央位置の1箇所だけに5BrU修飾を含有する合成RNAオリゴヌクレオチドを100ピコモル使用した。RNA配列5'-ACACUCUUUCCCUACACGACGC
UCUUCCGAUCU-UGAGGUAGU[5BrU]AGGUUGUAUAGUAGAUCGGAAGAGCACACGUCUC-3'(配列ID番号8)は、下線を引いた2つのリンカー配列(逆転写と増幅に使用)と、[5BrU](中央位置の5-ブロモウリジン標識)を有する。逆転写は、RT DNAオリゴヌクレオチドプライマー(5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGAT-CT-3'、配列ID番号9)と5×RTバッファー(そのpHは、それぞれpH 7、pH 8、pH 9に調節した)を使用し、Superscript II(Thermo Fisher Scientific社)を製造者の指示に従って用いることにより実施した。逆転写の後、DNAオリゴヌクレオチドSolexa PCR Fwd(5'- AATGATACGGCG
ACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'、配列ID番号10)とSolexa IDX rev(5'-CAAGCAGAAGACGGCATACGAGATNNNNNN-GTGACTGGAGTTCA
GACGTGTGCTCTTCCGATCT-3'、配列ID番号11;NNNNNNはバーコード-ヌクレオチドの位置を示す)を使用し、KAPAリアルタイムライブラリ増幅キット(KAPA Biosystems社)を製造者の指示に従って用いて1ピコモルの逆転写産物をPCRで増幅した。増幅されたライブラリのシークエンシングを、Illumina MiSeqプラットフォームを用いたハイスループットシークエンシングによって実施した。5BrUヌクレオチドの変換率は、5BrUの位置で過半数となることが予想されるT(チミン)のリードではなく、ヌクレオチドA(アデニン)、G(グアニン)、C(シトシン)の頻度をカウントすることによって求めた。
【0121】
最終リードにおける5BrUまたはTからAへ(T>A変換)のpHに依存した変換率は、逆転写の間にpHがpH 8からpH 9へと増加すると、バックグラウンドであるpH 7における3×10-4という変換率と比べてそれぞれ1.1倍と1.4倍の増加を示す(図37C)。T>G変換率は、バックグラウンドであるpH 7における1×10-4というより低い変換率と比べてそれぞれ1.2倍と1.9倍に増加する。それとは対照的に、T>C変換率は、バックグラウンドであるpH 7における3×10-4という変換率と比べて2.2倍と4.3倍に増加する。変換率がpHに依存して変化するというシグネチャはRNAの中の5BrUに関して特徴的であり、転写中に新生RNAに組み込まれる5BrUの数を特定するのに使用できる。
【0122】
実施例5:mES細胞におけるポリアデニル化された転写出力の測定
【0123】
mRNA 3'末端シークエンシングの後の短いs4Uパルス標識が、ポリアデニル化された転写出力を正確に教えてくれるかどうかを検証するため、mES細胞に短い1時間のs4Uパルスを加えた後、全RNAを抽出し、mRNA 3'末端ライブラリを調製した(図10A)。Quant-seqによって生成したライブラリをマウスゲノムの中のアノテーション付き3' UTRにマッピングし、新たに転写されたRNAを表わすT>C変換の存在を分析した(図10A)。新たに転写された(すなわちT>C変換を含有する)ポリアデニル化された転写産物の相対含量を定常状態の(すなわちT>C変換と非T>C変換を含有する)ポリアデニル化された転写産物と比較すると、新たに転写されたRNAの中で過剰出現している828個の遺伝子からなる転写産物のサブセットが観察された(図10B)。過剰出現した上位の転写産物には、mES細胞特異的マイクロRNAのクラスター(miR-290クラスターとmiR182クラスター)が含まれていた。これらは核内のDroshaによってマイクロRNAヘアピンが切除されると急速に分解するため特に短命であると考えられているため、定常状態において高レベルで蓄積することはない(図10B)。新規な方法で測定されるデノボ転写出力をより系統的に特徴づけるため、新たに転写されたRNAのうちで過剰出現していた828個の遺伝子と、予測される背後の転写因子(Ingenuity Pathway Analysis, www.Ingenuity.comを利用)ならびに関連する分子経路(Enrichrを利用)に関して従来のmRNA 3'末端シークエンシングによって定常状態で検出された825個の遺伝子で、遺伝子リストエンリッチメント分析を実施した(図10C)。予想通り、定常状態での高レベルの発現は、多能性に関係する転写因子ネットワークを予測できず、その大半は、ハウスキーピング経路(リボソームタンパク質、mRNAプロセシング、電子輸送など)に関係していた。それとは対照的に、本発明の方法によるデノボ転写産物分析は、カギとなるmES細胞特異的転写因子(Oct4(POU5F1)、NANOG、SOX2が含まれる)のほか、多能性ネットワークを予測するのに成功した(図10C)。われわれは、短いs4Uパルス標識にRNA修飾とmRNA 3'末端シークエンシングを組み合わせることで、即時的な転写出力を転写産物安定効果から分離でき、したがって転写遺伝子の調節を研究するための迅速で拡張性がある方法が提供されると結論した。
【0124】
実施例6:mRNA転写産物の安定性の測定
【0125】
本発明の方法を利用してmRNA転写産物の安定性を測定できるかどうかを調べるため、mES細胞の中のRNAにs4U を24時間標識した後、過剰なチオール非含有ウリジンを用いて追跡し、さまざまな時点(0分、15分、30分、1時間、3時間、6時間、12時間、24時間)で全RNAを調製し、次いでU修飾とmRNA 3'末端シークエンシングを実施した(図11A)。再度、ライブラリをマウスゲノムの中のアノテーション付き3' UTRにマッピングして分析し、古い転写産物を表わすT>C変換の存在を探した(図11A)。9430個の遺伝子について、T>C変換を含有する転写産物を(分析中は一定に留まった)定常状態での含量に規格化してその経時変化を全体的に分析することで、mRNAの半減期の中央値が4時間であることが明らかになった(図11B)。予想通り、個々の転写産物の半減期は大きさが1桁超変動した(図11C)。
【0126】
mRNAの安定性を制御することは、遺伝子発現の時間的順序にとって極めて重要である。新規な方法は、カギとなる基礎的な原理を再現している。なぜなら、「転写調節」、「シグナル伝達」、「細胞周期」、「発生」といったGO用語に関係する調節転写産物は、「細胞外マトリックス」、「代謝プロセス」、「タンパク質合成」などのGO用語に入るハウスキーピング転写産物と比べて有意に短い半減期を示したからである(図11D)。結論として、本発明によってmRNAの安定性の正確な評価が可能になるため、転写後の遺伝子調節を研究するための便利な方法が提供される。ここに示したように、この方法は、マウス胚性細胞における転写後の遺伝子調節シグネチャ全体を再現している。
【0127】
実施例7:小さなRNAの代謝シークエンシングのためのチオール結合アルキル化
【0128】
小さなRNAサイレンシング経路の細胞内動態に関する見通しを得るため、標識したRNA種の生化学的単離が必要になることを回避しつつ、全RNAの文脈でRNAの生合成と代謝回転の動態を明らかにすることを可能にするヌクレオチド類似体誘導化戦略を適用した(図12)。この戦略は、よく確立された4-チオウリジン(s4U)代謝RNA標識アプローチに基づいているが、効果的でなくて実験的に難しいビオチニル化工程の代わりに、s4U含有RNAをスルフヒドリル反応性化合物であるヨードアセトアミドと反応させることを含む短い化学処理(ヨードアセトアミドは、s4Uと反応すると、共有結合したアミドメチル基を塩基対形成界面に生成させる)を実施している(図1)。s4U組み込み部位に存在するかさばる基は、従来のRNAライブラリ調製プロトコル(小さなRNAシークエンシングなど)と組み合わされると、逆転写(RT)の間にGが特異的かつ定量可能な程度に間違って組み込まれるが、RTの処理性能には干渉しない。s4U組み込み事象は、配列比較により、通常はハイスループットシークエンシングライブラリの中でバイオインフォマティクスによって単一ヌクレオチドの解像度で同定することができるため、TからCへの変換のコーリングによる無標識RNAの文脈では、絶対的な標識効率を測定するためのスパイク-イン溶液の必要がない。重要なことだが、ウリジンをシトシンに変換する酵素は知られておらず、例えばIllumina HiSeq 2500プラットフォームを用いたハイスループットRNAシークエンシングのデータセットではT>Cエラーは稀であり、1万分の1未満の頻度で起こる。われわれはこのアプローチを、小さなRNAの代謝シークエンシングのためのチオール(SH)結合アルキル化と呼ぶ。
【0129】
代謝標識された小さなRNAを明らかにするこの方法の性能を検証するため、ショウジョウバエS2細胞を、細胞の生存に干渉しない条件(すなわち500μM)のs4Uとともに24時間インキュベートした後、全RNAの抽出と小さなRNAのシークエンシングを実施した。代謝標識を全RNAのHPLC分析によって確認すると(図18)、2.3%の標識効率であることが明らかになった。これは、43個のウリジンのうちの1個にs4Uが組み込まれたことに対応する。s4U代謝標識を24時間実施した後にショウジョウバエS2細胞のサイズ選択された全RNAからライブラリを生成させると、標識のない細胞から調製したライブラリと比べてT>C変換の強い蓄積が観察された(その例は、豊富に発現するマイクロRNAであるmir-184-3pと、そこまでは豊富でないmiR*であるmiR-184-5pを生じさせるmiR-184遺伝子座である)(図12A)。この観察結果をゲノムスケールで確認するため、リードを、ショウジョウバエゲノムのアノテーション付きマイクロRNA遺伝子座にアラインメントし、miRNAごとの全T含量に規格化した変異の頻度を調べた(図12B)。s4U代謝標識がない場合には、任意の変異について変異率の中央値は0.1%未満であることが観察された。これは、Illuminaで報告されているエラー率に合致している。(標識のない全RNAをヨードアセトアミドで処理しても、ハイスループットシークエンシングによって求めた小さなRNAの含量と変異率に検出可能な影響はなかったことに注意されたい。図19を参照のこと)。24時間にわたるs4U代謝標識の後、T>C変異の統計的に有意な(p<10-4、マン-ホイットニー検定)74倍の増加が観察された一方で、他のすべての変異は予想されるシークエンシングエラー率未満に留まった(図12B)。より具体的には、24時間標識した後にs4U組み込みの中央値は2.22%であることが観察されたが、これは45個のウリジンにつき1つのs4U組み込みであることに対応していて、全RNAのHPLC測定によって求めた組み込み率と整合している(図18)。したがって擾乱がない条件下での代謝標識によって大半(95%超)の小さなRNAが最大で1つのs4U組み込み事象を示す(図20)。これは、改良されたビオチニル化戦略(Duffy他、2015年、上記文献)によってさえ、定量可能な回収には不十分だが、化学的s4U誘導体化により容易に同定することができる(図12)。
【0130】
本発明の方法が単一ヌクレオチドの解像度でs4U組み込みを再現する性能により、マイクロRNAのプロセシングとローディングに対するs4U代謝標識の影響を系統的に分析することができた。その目的で、マイクロRNA前駆体の5pアームまたは3pアームに由来する所与の小さなRNAか、miR鎖またはmiR*鎖を構成する所与の小さなRNAの個々の位置におけるT>C変換の過剰出現と過少出現を調べた。それは、選択的アルゴノートローディングによってわかる。(35個の5p-miRNAと36個の3p-miRNA、または44個のmiRと27個のmiR*に対応する)71個の豊富に発現する(100 ppm超)マイクロRNAを調べたとき、所与のどの位置でも相対T>C変異率に有意な系統的変化は観察されなかった(図21)。われわれは、s4U代謝標識がマイクロRNAの生合成またはローディングに影響することはないと結論した。
【0131】
合わせると、培養したショウジョウバエS2細胞でのs4U代謝標識の後にSLAM-seqを実施することで、小さなRNAでのs4U組み込み事象が単一ヌクレオチドの解像度で定量可能な程度に回収されるため、s4U標識がマイクロRNAの生合成またはローディングに位置に依存した有意な影響を与えることはないことが明らかになる。
【0132】
実施例8:マイクロRNA生合成の細胞内動態
【0133】
マイクロRNAはヘアピン含有RNAポリメラーゼII転写産物に由来し、核内のDroshaと細胞質内のDicerによって順番に処理されて成熟miRNA二本鎖を生じさせる(図13)。miRNA生合成の細胞内動態を調べるため、ショウジョウバエS2細胞のサイズ選択された全RNAから調製された小さなRNAライブラリの中で豊富に(定常状態で100 ppm超)発現したmiRNAのT>C変異率の増加を、s4Uを用いた代謝標識の5分後、15分後、30分後、60分後に求め、s4U標識なしで検出されたエラー率と比較した(図13B)。5分間という短い標識時間の後にすでに、T>C変換率の有意な上昇が検出され、全miRの17%、全miR*の90%が、最大バックグラウンドレベルを超えるエラー率を示した。この割合は時間経過とともに増加し、15分後、30分後、1時間後にそれぞれ74%、93%、100%になった。従来の測定に基づくと、全miRNAの50%超(42個のうちの22個)が短期間(すなわち5分間)に検出可能な程度に生成した(すなわち、miRでも、そのmiR*パートナーでも、最大バックグラウンドT>C変換率を超えた)。これは、細胞におけるmiRNAプロセシング機構が非常に優れた効率を持つことを明らかにしている。
【0134】
時間経過とともに生成されるmiRNA分子の代替指標として、T>C変換を含有するリードの数も求めた(図13C)。平均では定常状態で豊富なmiRNA(miR-184、miR-14など)も大きな生成率を示すが、他のもの(miR-276b、miR-190など)は生合成率が大きいにもかかわらず定常状態における含量が少ないか、その逆である(すなわちmiR-980またはmiR-11)。これは、miRNAの生成率がその細胞内含量の唯一の決定因子ではないことを示している。
【0135】
われわれの全体分析では全miRNA生合成が予想外に大きな効率であることが明らかになったが、選択された小さなRNAは、それよりも有意に少ない割合で生成した。そのように低効率で生成したmiRNAの例は、ミルトロン(すなわちmiR-1003、miR-1006、miR-1008;図13C)である。ミルトロンはマイクロRNAの1つのクラスであり、Droshaに指示されるプロセシングの代わりにスプライシングによって生成する。ミルトロンの生合成は選択的に減らすことができる。なぜならスプライシングに由来する前駆ヘアピンは、3'末端スプライスアクセプタ部位を認識する末端ヌクレオチジルトランスフェラーゼTailorによるウリジル化の特異的標的であるため、Dicerを媒介とした効率的なプロセシングを阻止し、dmDis312に指示されるエキソ核酸分解を開始させるからである(図13D)。われわれのデータは、ミルトロンの生合成を選択的に抑制するための実験的証拠を提供している。なぜならミルトロンは、古典的miRNAと比べると、有意に低下したT>C変異率を示し、T>Cを含有するリードは、時間経過に伴う蓄積がより少ないからである(図13D)。プレ-miRNAヘアピンのウリジル化の裏にはミルトロン生合成の抑制があるという仮説に関し、プレ-miRNAテーリングとT>C変換率の間に有意な相関も検出された(図22)。
【0136】
まとめると、新規な方法は、細胞内でのmiRNA産生率が顕著に大きいことを明らかにし、前駆ヘアピンウリジル化がmiRNAの生合成に対して選択的抑制効果を及ぼすことを再現している。
【0137】
実施例9:リボ核タンパク質複合体への小さなRNAのローディングのモニタリング
【0138】
マイクロRNAの生合成によってmiRNA二本鎖が生成する。しかしmiRNA二本鎖の2本の鎖の一方(miR鎖)だけがAgo1の表面に優先的にロードされて選択的に安定化される一方で、他方の鎖(miR*鎖)は排除されて、miRNAローディングのプロセスで分解される(図14A)。本発明の方法が生きた細胞の中でのmiRNA二本鎖生成とmiRNAローディングのプロセスを再現しているかどうかを検証するため、20個のmiRNAについてT>C変換を含有するリードの相対的蓄積を分析したところ、miRとそのパートナーであるmiR*の両方が十分に高いレベルで検出された(図14B)。s4U代謝標識後の早い時点(すなわち5分、15分、30分;マン-ホイットニー検定 p>0.05)ではmiRペアとmiR*ペアの間に含量の有意差が観察されなかったため、miRNAは、最初は、動態に関してローディングとは関係のないプロセスで二本鎖として蓄積することが確認される。ようやく1時間後になり、miR鎖がmiR*鎖よりも有意に多く蓄積していることが検出された(マン-ホイットニー検定 p>0.05、図14B)。これは、平均として、Ago1へのmiRNAへのローディングが、miRNAの生合成と比べてはるかにゆっくりとした速度で起こることを示している。
【0139】
より詳細な分析から、miRNAの蓄積の裏にある2段階プロセスが明らかになった。第1の段階は、miRとmiR*で同じである(kmiR=0.35±0.03とkmiR*=0.32±0.03)。したがってmiRNAは二本鎖として蓄積することを反映していた。注目すべきなのは、第2のよりゆっくりとした段階が、miRとmiR*の両方で生合成段階とは異なっていたことである。miR*の蓄積速度の急激な低下(kmiR*=0.32±0.03)は、大半(すなわち約81%)のmiR*鎖が、miRローディングの帰結として急速に分解されることを示していた。それとは対照的に、miR鎖は、miR*鎖(kmiR*=0.32±0.03)と比べてはるかに大きな蓄積速度(kmiR=0.26±0.03)を示した。これは、miRISCの形成がおそらく原因となってmiR鎖が選択的に安定化されていることを示す。しかし初期生合成速度(kmiR=0.35±0.03)と比べると、miRも第2段階で反応速度の低下(kmiR=0.26±0.03)を示した。これは、miR鎖の約74%だけが効果的にロードされる一方で、ほぼ1/4のmiRNAはおそらく二本鎖として分解されたことを示している。これは、空のアルゴノート利用可能性と整合しており、miRNAの蓄積に関する1つの重要な制限因子であり、その過剰発現は細胞内miRNA含量を全体的に増加させる。
【0140】
さらに、個々のmiR:miR*ペアの調査から、miRNA二本鎖の間でローディング効率が異なることが明らかになった。鎖分離、したがってローディングは、miR-184の場合には数分以内に検出可能であるのに対し、bantamは、わずかに遅延したローディング動態を示し、鎖の分離は約30分後まで起こらず、miR-282は効果的なローディングが最低であるmiRNAの中にランクされた。注目すべきことに、ローディング動態の違いは、Ago1ローディングに関する熱力学的規則に従い、miRNA二本鎖の種または3'支持領域におけるミスマッチがmiRISCの効率的な形成を促進した。
【0141】
まとめると、新規な方法により、miRNAの生合成とローディングの動態への詳細な見通しが明らかになった。
【0142】
実施例10:isomiRの産生
【0143】
積み重なった証拠は、多彩な細胞内プロセスがマイクロRNAの配列と機能を多様化しているが、その背後にある機構に関する理解は乏しいため、定常状態の小さなRNAシークエンシングライブラリからの分析は難しいことを示唆している。isomiR産生に関してよく確立されている一例は、ハエにおけるmiRNAのエキソ核酸分解成熟である。ショウジョウバエの大半のmiRNAは約22 ntの小さなRNAとして産生されるが、選択されたmiRNAはより長い約24量体として生成される。この24量体は、遺伝子調節miRISCを形成するのに3'→5'エキソリボヌクレアーゼNibblerによって媒介されるさらなるエキソ核酸分解成熟を必要とする。標準的な小さなRNAシークエンシングライブラリと高分解能ノーザンハイブリダイゼーション実験では、miR-34-5pはさまざまな長さプロファイルを示し、同じ5'アイソフォームの3'末端切断から生じる発現が豊富な24量体~21量体の範囲のアイソフォームになる(図15B)。本発明の方法が、多彩なmiR-34-5pアイソフォームを生じさせる事象の細胞内での順序を解明する能力を検証するため、s4U代謝標識を実施した後のS2細胞の全RNAから調製した小さなRNAライブラリを分析した。時間経過全体を通じて非常によく似た長さプロファイルを示した定常状態の小さなRNAとは異なり、T>C変換を含有するmiR-34-5pのリードは、最初は完全に24量体アイソフォームとして蓄積しているため、組み換えDcr-1すなわちハエのライセートと、合成プレ-miR-34を用いた以前のインビトロプロセシング実験と整合している(図15C、下)。3時間後になって初めて、より短いT>C変換含有miR-34-5p 3'アイソフォームの出現が検出された(図15C、上)。この時点以後、miR-34-5pの重み付き平均長は時間経過とともに連続的に減少し、定常状態で観察されたmiR-34-5pの平均長プロファイルに近づいた(図15D)。われわれは、Nibblerに指示される3'→5'エキソ核酸分解トリミングによって例示されるように、本発明の方法によってisomiRの出現が明らかになると結論した。
【0144】
miRNAのエキソ核酸分解成熟は、miRNA をAgo1の中にローディングすることを必要とし、生化学的証拠は、トリミングがmiR*鎖の除去後にだけ起こることを示唆していた。それはおそらく、Nibblerが一本鎖特異的3'→5'エキソリボヌクレアーゼとしての機能を提供したためである。われわれの方法によってmiRNAローディングとisomiR産生を同時に測定することが可能になったため、この仮説を、miR-34-5pトリミング信号(図15D)とmiR-34二本鎖ローディング動態(図15E)を比較することによって検証した。トリミングがmiR-34をローディングしてmiR*鎖を除去した後に実際に起こることが観察された(図15E)。それは、われわれのライブラリで代謝標識の1時間後に始まるmiR-34-5pとmiR-34-3pの蓄積のずれから判断される。結論として、本発明の方法により、miRNAアイソフォーム産生の細胞内での順序が明らかになり、したがって生きている細胞内のmiRNAの配列と機能を多様化するプロセスに光を当てる強力なツールが提供される。
【0145】
実施例11:マイクロRNAの安定性
【0146】
さまざまなmiRNAが組み立てられて、そうでない場合には識別不能なタンパク質複合体になるが、積み重なった証拠は、これらタンパク質複合体の安定性は互いに劇的に異なっている可能性があることを示唆している(図16)。しかし現在利用できる技術では、個々のmiRNAについて絶対的な半減期ではなくて相対的な半減期しか測定されないため、miRNAの安定性への詳細な見通しを得ることが阻止される。さらに、擾乱のない条件下での代謝標識により、大半(95%超)の標識された小さなRNAは最大で1つのs4U組み込み事象を示すことが促進される(図20)。それでは改良されたビオチニル化戦略(Duffy他、2015年、上記文献)によってさえ、定量可能な回収には不十分であり、miRNA配列が異なるmiRNAではU含量が広範囲に異なることに起因するバイアスが導入される。それとは対照的に、本発明の方法では、標準的な小さなRNAライブラリの文脈において、絶対的で配列の内容に規格化されたmiRNA安定性への迅速なアクセスが提供される(図16)。s4U代謝標識を24時間まで実施したショウジョウバエS2細胞の全RNAから調製されたSLAM-seqによる小さなRNAライブラリの中でmiRNA-U含量に規格化されたT>C変換率を分析することにより、41個の豊富に発現するmiR鎖で半減期の中央値が12.13時間と求まった(図16B)。これは、miRNAの平均半減期が、約4~6時間という平均半減期を示すmRNAと比べて有意に長いことを示している。miR*は、miRとは異なり、0.44時間というはるかに短い半減期を示した(図16B)。これは、miRローディングの帰結としてのmiR*の増強された代謝回転と整合している(図14)。結局、miR*は、miRと比べて安定性が有意に低い(図16C)。しかしmiRでさえ本質的に互いに異なる安定性を示し、大きさが1桁超異なっていた。その例は、不安定なmiR-12-5p(t1/2=1.7時間)と安定なbantam-5p(t1/2>24時間)である。重要なことだが、本発明により、個別の小さなRNAの半減期へのロバストな見通しが提供されるため、多彩な小さなRNAの安定性に関して高度に再現可能な結果が提供される(図16E)。
【0147】
マイクロRNAの安定性は、定常状態で最高レベルに蓄積した2つのmiRNAによって例示されるように、S2細胞内の小さなRNAのプロファイルを確立するのに寄与する主要な因子である。bantamは比較的ゆっくりとした生合成(図13)と中程度のローディング速度を示した(図14)が、並外れて高い安定性(t1/2>24時間)が理由で最高の定常状態レベルに蓄積した。それとは対照的に、2番目に豊富なmiRNAであるmiR-184-3pは、bantam-5p(t1/2=6時間)と比べると安定性が1/3であったが、それでもその異常に大きな生合成とローディング動態が理由で高レベルに蓄積した(図13図14)。したがってSLAM-seqによる小さなRNAの代謝シークエンシングから、miRNAの生合成、ローディング、代謝回転が、miRNAを媒介とした遺伝子調節の主要な決定因子である定常状態の小さなRNAプロファイルの確立に相対的に寄与していることが明らかになる。
【0148】
実施例12:アルゴノートタンパク質の素性が、小さなRNAの安定性を規定する
【0149】
哺乳動物と昆虫両方のゲノムが、アルゴノートタンパク質ファミリーのいくつかのタンパク質をコードしている。そのうちのいくつかのタンパク質は、小さなRNAを選択的にローディングして転写産物の別々のサブセットをさまざまな機構によって調節する。miRNA二本鎖は本質的に非対称である、すなわちmiR鎖は優先的にAgo1にロードされるが、各miRNA前駆体は、潜在的に、ハエで普遍的に発現している2つの別々のアルゴノートタンパク質に分類される2本の成熟した小さなRNA鎖を生み出すことができる。miR*は、大半のmiRとは異なり、RNAi経路におけるエフェクタタンパク質であるAgo2の中に機能種としてロードされることがしばしばあり、Ago2-RISC組立体の最終工程において、3'末端リボースの2'位が、メチルトランスフェラーゼHen1による選択的メチル化を受ける(図17A)。Ago2欠乏によって細胞の生存が損なわれることはないため、小さなRNA の選択的安定化におけるAgoタンパク質の役割を調べることができた。さらに、Ago2欠乏は、小さなRNAの半減期が、それに付随するAgoタンパク質の素性によって本来的に決まるかどうかを理解する実験的枠組みを提供した。
【0150】
最初に、(Ago1が結合した小さなRNAを優先的に反映する)従来の小さなRNAのクローニングによって全RNAから調製される小さなRNAライブラリを、全RNAから調製されるが酸化によってメチル化された(すなわちAgo2が結合した)小さなRNAが豊富なライブラリと比較することにより、野生型ショウジョウバエS2細胞の中で特別に組み立てられてAgo2になるmiRNAのセットを確立した。従来のクローニングというアプローチにおける大半の小さなRNAはmiRNA(特にmiR鎖)で構成されていたが、トランスポゾンと、(主に重複したmRNA転写産物に由来する)遺伝子と、長い折り返し転写産物を生じさせる遺伝子座(構造化された遺伝子座)に由来するAgo2結合内在性の小さなRNAが、酸化によって選択的に富化された。前に記載されているように、メチル化された(すなわちAgo2が結合した)miRNAは、miR*が選択的に富化された。酸化されていない小さなRNAライブラリと酸化された小さなRNAライブラリを比較することで、miR鎖とmiR*鎖を、Ago1とAgo2の中でのこれら鎖の蓄積に従って分類することができた(図17C)。野生型S2細胞と、CRISPR/Cas9ゲノム操作によってAgo2が欠乏したS2細胞から生成させた従来の小さなRNAライブラリの中のAgo2が富化された小さなRNAの含量を比較することにより(図17D)、Ago2が富化された小さなRNAは、Ago2を欠乏させると含量が有意に少なくなることが確認された(p<0.002、ウィルコクソンの対応あるデータ間の符号順位検定、図17E)。
【0151】
次に、s4U代謝標識とその後のSLAM-seqによって野生型細胞とAgo2欠乏(ago2ko)細胞から調製したすべての小さなRNAライブラリの中の小さなRNAの安定性を測定することにより、Ago2が富化された小さなRNAの安定性を判断した。野生型細胞では、Ago2が富化された小さなRNAは2相分解動態に従った。ここでは集団の大半(すなわち94%)は大きな安定性(t1/2>24時間)を示したのに対し、ほんのわずかが確かに急速に分解し、半減期はmiR*と同様であった(t1/2=0.2時間)。長い半減期に関係する集団がAgo2結合分画を代表しているかどうかを、メチル化された小さなRNAライブラリの中の同じ小さなRNA種の安定性を調べることによって検証した。実際、Ago2が富化された小さなRNAは、単一指数関数型の分解動態に従い、半減期が24時間超であった(図17F)。逆に、Ago2が欠乏したS2細胞では、Ago2が富化された小さなRNAはやはり2相分解動態に従ったが、今度は大半(63%)の集団がmiR*と似た安定性を示した(t1/2=0.4時間)。これは、Ago2がないと、これらの小さなRNAは、そのパートナーとなる鎖がAgo1にロードされるときに主に分解することを示している。それとは対照的に、Ago1が富化された小さなRNAは、Ago2の存在下と不在下で同じ安定性を持っていた(図17F)。したがってわれわれのデータから、miRNAは集団特異的な安定性を持ち、その安定性は、miRNAが特定のAgoタンパク質にロードされることによって決まることが明らかになる。
【0152】
最後に、小さなRNAの半減期がAgoタンパク質の素性によって本来的に決まるかどうかを分析するため、Ago1とAgo2に最も多く含まれる30個の小さなRNAの安定性を比較した(図17G)。この分析により、Ago2が結合した小さなRNAは、Ago1が結合した小さなRNAと比べて有意に大きな安定性を示すことが明らかになった(p<10-4;マン-ホイットニー検定)。それはおそらく、Ago2が結合した小さなRNAのメチル化が、Ago1ではなくてAgo2の中の小さなRNAの安定化に寄与したからである。
【0153】
まとめると、健康状態と疾患状態における遺伝子発現状態に影響を与える小さなRNAのプロファイルの確立と維持の基礎となる分子機構を分析するための実験フレームワークが提供される。
【0154】
実施例13:SLAM-seqが、BRD4-MYC軸の直接的な遺伝子調節機能を決める
【0155】
BRD4やMYCなどの転写調節因子が直接標的とする遺伝子を明らかにすることは、細胞におけるその遺伝子の基本的な機能の理解と治療法開発の両方にとって極めて重要である。しかし直接的な調節関係を解明することはさまざまな理由で難しい。ゲノム結合部位は例えばクロマチン免疫沈降とシークエンシング(ChIP-seq)によってマッピングできるが、1つの因子の結合だけでは近傍の遺伝子に関する調節機能を予測できない。別の1つのアプローチは、所与の調節因子を実験的に擾乱した後に発現の違いを調べることを含んでいる。
【0156】
例えばシグナル伝達経路の擾乱によって生じるより特殊な転写応答もSLAM-seqで捕捉できるかどうかをさらに検証するため、K562細胞を、その細胞を駆動するがん遺伝子であるBCR/ABLのほか、BCR/ABLの下流にある別のシグナル伝達カスケードでメディエータとして作用するMEKとAKTの小分子阻害剤で処理した(図25D図30A図30B)。
【0157】
細胞の培養
【0158】
白血病細胞系K562、MOLM-13、MV4-11をRMPI 1640と10%ウシ胎仔血清(FCS)の中で培養した。OCI/AML-3細胞をMEM-α含有10%FCSの中で増殖させた。HCT116とLenti-Xレンチウイルスパッケージング細胞(Clontech社)をDMEMと10%FCSの中で培養した。すべての増殖培地にL-グルタミン(4 mM)を補足した。増殖曲線を求めるため、細胞を100μMのIAA(インドール-3-酢酸ナトリウム塩、Sigma-Aldrich社)の存在下または不在下にて初期密度2×106細胞/mlで播種し、24時間ごとに1:2.6の比に分割して培地とIAAを更新し、細胞が集密でない状態を維持した。細胞の密度は、Guava EasyCyteフローサイトメータ(Merck Millipore社)を用いて24時間ごとに測定した。
【0159】
JQ1とNVP-2の組み合わせで72時間処理した細胞の生存アッセイを、CellTiter-Glo Luminescent Cell Viability Assay(Promega社)を利用して実施した。EnSpire Multimode Plate Reader(Perkin Elmer社)を用いて相対ルミネセンス信号(RLU)を記録した。薬を用いた処理に対する部分反応は、α=1 - (RLUtreated/RLUuntreated)と定義し、相乗効果は、Bliss加算性に対する過剰(eob)として計算した。ただしeob=αNVP-2,JQ1 - αJQ1 - (αNVP-2 ・ 1 - αJQ1)である。
【0160】
この実施例で用いるプラスミドとベクター
【0161】
SpCas9とsgRNAは、プラスミドpLCG(hU6-sgRNA-EFS-SpCas9-P2A-GFP)から発現させた。pLCGを、公に入手できるCas9発現ベクター(lentiCRISPR v2、Addgeneプラスミド#52961)に基づいてクローニングした。このプラスミドは、改良されたchiRNA文脈を含んでいる。sgRNA配列に関してはpLCGにクローニングした。標的遺伝子座の相同組み換え修復のためのドナーとして、AIDノックインカセットを遺伝子合成によって作製し(Integrated DNA Technologies社)、標的細胞系のゲノムDNAからの約500 bpのホモロジーアーム(HA)をPCRで増幅した。すべての構成要素を組み立ててレンチウイルスプラスミド骨格(Addgeneプラスミド#14748)に入れると、トランスフェクションをモニタするための構成的GFP発現が追加して提供され、最終ベクターpLPG-AID-BRD4(5’HA-Blast(登録商標)-P2A-V5-AID-スペーサ-3’HA-hPGK-eGFP)とpLPG-MYC-AID(5’HA-スペーサ-AID-P2A-Blast(登録商標)-3’HA-hPGK-eGFP)が得られた。急性タンパク質欠乏実験のため、公開されているレンチウイルスベクターSOP(pRRL-SFFV-Tir1-3xMYC-タグ-T2A-Puro)を用いてアジアイネ(Oryza sativa)のTirlを導入した。競合的増殖アッセイのため、ベクターSO-ブルー(pRRL-SFFV-Tir1-3xMYC-タグ-T2A-EBFP2)を用いてTir1を導入した。shRNAmirインサートを送達するベクターLT3GENを用いてRNAiを実施した。
【0162】
ゲノム編集とレンチウイルス形質導入
【0163】
AIDノックイン細胞系を導出するため、プラスミドpLCGとpLPGを、MaxCyte STX電気穿孔装置を用いた電気穿孔によって(K562)、またはFuGENE HD Transfection Reagent(Promega社)を用いたトランスフェクションによって(HCT116)同時に送達した。ブラシチシジン(10μg/ml、Invitrogen社)を用いて成功したノックインを選択した後、BD FACSAria IIIセルソーター(BD Biosciences社)を用いてGFP-単一細胞クローンを単離した。粗細胞ライセートでのPCR遺伝子型決定によってクローンを特徴づけた。ノックインをタグ付きタンパク質のイムノブロッティングによってさらに確認し、K562に関しては、野生型細胞の免疫表現型と最もよく一致させるため、クローンをフローサイトメトリーによって特徴づけた。
【0164】
急性タンパク質欠乏実験のため、Tir1発現ベクターSOPを用いて検証済みのホモ接合AIDノックインクローンを形質導入した。標準的な手続きに従ったウイルスプラスミドとヘルパープラスミドpCMVR8.74(Addgeneプラスミド #22036)とpCMV-VSV-G(Addgeneプラスミド #8454)のポリエチレンイミン(PEI、MW 25000、Polysciences社)トランスフェクションにより、Lenti-X細胞の中でレンチウイルス粒子のパッケージングを実施した。標的細胞を限界希釈で感染させ、ピューロマイシン(2μg/ml、Sigma-Aldrich社)上で選択した。導入遺伝子の潜在的なサイレンシングを回避するため、新たに形質導入して選択した細胞ですべての欠乏実験を実施した。
【0165】
イムノブロッティングと免疫表現型検査
【0166】
HRP標識した二次抗体(Cell Signaling Technology社、カタログ番号#7074、#7076、#7077)を用いて一次抗体の化学発光を検出した。あるいは二次抗体であるIRDye 680RDヤギ抗ウサギIgGと IRDye 800CWヤギ抗マウスIgG (LI-COR Biosciences社)を用いてOdyssey CLx Imaging System(LI-COR Biosciences社)でウサギとマウスの一次抗体の蛍光を検出した。
【0167】
免疫表現型検査のため、細胞をFACS-バッファー(PBSの中に5%FCS)で洗浄し、FCS-受容体阻止ペプチド(Human TruStain FcX、Biolegend社、FACS-バッファーの中で1:20に希釈)とともに室温で10分間あらかじめインキュベートした。蛍光体標識した抗体を1:400の最終希釈率で添加し、細胞を4℃で20分間インキュベートした。染色された細胞を2回洗浄し、FACS-バッファーの中に再懸濁させた後、BD LSRFortessaフローサイトメータ(BD Biosciences社)で分析した。
【0168】
クロマチンの断片化
【0169】
クロマチンを断片化するため、細胞を氷冷PBSの中で洗浄し、クロマチン抽出バッファー(20mMのトリス-HCl、100 mMのNaCl、5mMのMgCl2、10%のグリセロール、0.2%のIGEPAL CA-630、20mMのβ-グリセロリン酸、2mMのNaF、2mMのNa3VO4、プロテアーゼ阻害剤カクテル(EDTAなし、Roche社)、pH 7.5)の中に再懸濁させた。溶けない分画を遠心分離(16000×g、5分間、4℃)によって沈殿させ、クロマチン抽出バッファーの中で3回洗浄した後、その中に再懸濁させた。最初の沈殿の前と後に全細胞分画と上清をサンプリングした。SDS(ドデシル硫酸ナトリウム、0.1%(w/v))を補足した全分画をベンゾナーゼ(Merck Millipore社、30分間、4℃)で消化させ、Bioruptor超音波処理装置(Diagenode社)の中で超音波処理によって再び溶かした。
【0170】
SLAM-seq
【0171】
すべてのSLAM-seqアッセイを、接着細胞に関しては60~70%の集密度で実施し、懸濁細胞に関しては血球計算器でカウントした最大細胞密度が60%の状態で実施した。各アッセイの5~7時間前に増殖培地を吸引して交換した。特に断わらない限り、細胞を指示されている小分子阻害剤または100μMのIAAで30分間にわたって前処理することで、標的が完全に抑制または分解されている状態をあらかじめ確立した。新たに合成されたRNAへの標識を、最終濃度100μMの4-チオウリジン(s4U、Carbosynth社)を用いて指示されている時間(45分間または60分間)にわたって実施した。接着細胞は、ドライアイス上でプレートを直接に急速凍結させることによって回収した。懸濁細胞は、遠沈させた後、ただちに急速凍結させた。RNAの抽出は、RNeasy Plus Mini Kit(Qiagen社)を用いて実施した。全RNAをヨードアセトアミド(Sigma社、10 mM)によって15分間アルキル化し、RNAをエタノール沈降によって再度精製した。500 ngのアルキル化されたRNAを入力として用い、市販されているキット(IlluminaのためのQuant-seq 3' mRNA-Seq Library Prep Kit FWDとIlluminaのためのPCR Add-on Kit、Lexogen社)を利用して3' mRNAシークエンシングライブラリを生成させた。HiSeq1500プラットフォームとHiSeq2500プラットフォーム(Illumina社)を用いてディープシークエンシングを実施した。
【0172】
遺伝子発現差分析、PCA、GO用語エンリッチメント
【0173】
遺伝子レベルを分析するため、同じ遺伝子の異なるUTRアノテーションにマッピングされた生のリードをEntrez Gene IDによって合計した。キナーゼ阻害剤を用いたK562細胞の予備研究を単一の実験群として実施した。遺伝子発現差の分析は、50 bpのシークエンシングランに関しては、少なくとも1つの条件(フラボピリドールとDMASO)で10個以上が読み取られる遺伝子に限定し、100 bpのシークエンシングランに関しては、少なくとも1つの条件(mk2206、トラメチニブ、ニロチニブ、トラメチニブ+mk2206、DMSO)で20個以上が読み取られる遺伝子に限定した。発現差を評価するため、1つの生のリードの1つの擬似カウントをすべての遺伝子に加えた。
【0174】
他のすべてのSLAM-seq実験をトリプリケートで実施して以下のように分析した。遺伝子発現差コーリングを、T>C変換が2以上の生のリードカウントに対し、DESeq2(バージョン1.14.1)をデフォルトの設定で用いるとともに、全体規格化のために対応する全mRNAに関して推定されたサイズ因子を用いて実施した。下流分析は、DESeq2によってFDRを推定するための全内部フィルタを通過する遺伝子に制限した。所与の実験のすべての条件で変動が最も大きかった500個の遺伝子に関する分散安定化変換の後、主成分分析を実施した。K562MYC-AID+Tir1でのIAA処理のときにSLAN-seqで有意かつ強く下方調節された遺伝子(FDR≦0.1、log2FC≦-1)について、GO用語エンリッチメント解析を、PANTHER 過剰出現検定(FDR多重検定補正のあるフィッシャーの正確確率検定、pantherdb.org)によって実施した。
【0175】
mRNA代謝回転の評価
【0176】
擾乱のないK562細胞でのmRNA代謝回転を大まかに見積もるため、mRNA生合成が定常状態で平衡していることと、s4Uに長期間曝露した後に完全な標識状態に近づく一次速度則で分解することを仮定した。したがって任意の遺伝子iについて、s4U標識を60分実施した後の全リードカウントの中の変換されたリード(T>C変換が2個以上)の割合βiを用いると、細胞mRNAの半減期は、
t1/2,i=-60×ln (2)/ln (βi)
と計算することができた。
【0177】
クロマチン免疫沈降の後のディープシークエンシング(ChIP-Seq)
【0178】
ChIP-Seqのため、1×108~2×108個の K562 AID-BRD4+Tir1細胞を100μMのIAAまたはDMSOで1時間処理し、室温で10分間かけて1%ホルムアルデヒドと架橋させ、500 mMのグリシンで5分間クエンチした後、氷冷PBSで2回洗浄した。核を単離した後、ペレットを、プロテアーゼ阻害剤(Complete、Roche社)を含有する溶解バッファー(10mMのトリス-HCl、100mMのNaCl、1mMのEDTA、0.5mMのEGTA、0.1%のデオキシコール酸Na、0.5%のN-ラウロイルサルコシン、pH 8.0)の中に溶解させた。Bioruptor超音波処理装置(Diagenode社)を用いてクロマチンを剪断した。4℃で10分間にわたる16000×gでの遠心分離によって細胞残滓をペレットにした。DMSOで処理したChIP-SeqサンプルとIAAで処理したChIP-Seqサンプルを直接比較できるようにするため、マウスAML細胞系(RN2)からのクロマチンを内部規格化のためのスパイク-イン対照としてRN2:K562≒1:10の比で添加した。トリトンX-100を添加し(最終濃度1%)、クロマチンのライセートを回転するホイールの上で5~10μgの抗体とともに4℃で一晩インキュベートすることによって免疫沈降を実施した。抗体-クロマチン複合体を回転するホイールの上で4℃にて2時間にわたって磁性セファロースビーズ(G&E Healthcare社;1 mg/mlのBSAを含むTEを用いて室温で2時間ブロックしたもの)で捕獲した。ビーズを、RIPAバッファー(150 mMのNaCl、50mMのトリス-HCl、0.1%のSDS、1%のIGEPAL CA-630、0.5%のデオキシコール酸Na、pH 8.0)、Hi-Saltバッファー(500mMのNaCl、50mMのトリス-HCl、0.1%のSDS、1%のIGEPAL CA-630、pH 8.0)、LiClバッファー(250mMのLiCl、50mMのトリス-HCl、1%のIGEPAL CA-630、0.5%のデオキシコール酸Na、pH 8.0)をそれぞれ1回用いて洗浄し、TEで2回洗浄した。免疫複合体を1%SDS、100 mM NaHCO3の中に溶離させた。サンプルをRNアーゼA(100μg/ml)で37℃にて30分間処理し、NaCl(200 mM)を添加し、65℃で6時間かけて架橋を反転させた後、200μg/mlのプロテイナーゼKを用いて45℃にて2時間消化させた。沈降した材料と剪断されたクロマチン入力(ChIPのために用いた材料の1%)の両方から、ゲノムDNAをフェノール-クロロホルム抽出とエタノール沈降によって回収した。Illumina のためのNEBNext Ultra II DNAライブラリ調製キット(New England Biolabs社、#7645)を用いてIlluminaシークエンシングのためのライブラリを調製した。
【0179】
スパイク-イン制御されたChIP-seqデータの分析
【0180】
スパイク-イン制御されたChIP-seqサンプルを分析するため、ヒトとマウスのゲノム配列(GRCh38とmm10)を混合することによってハイブリッド参照ゲノムを調製した。bowtie 2 v2.2.9(高感度)を用いてリードを最初にこのハイブリッドゲノムにアラインメントした後、ヒトのビンとマウスのビンに分離した。ディープツールv2.5.0.1を用いて各トラックのリードカバレッジを計算し、スパイク-イン規格化因子を用いて再スケーリングした。得られた規格化されたカバレッジトラックからさらにそれぞれの入力信号を差し引いた後、DMSOで処理したサンプルとIAAで処理したサンプルの比を計算した。
【0181】
ChIP-SeqとClick-seqのデータとスーパーエンハンサーコーリングの再分析
【0182】
以前に公開されているClick-seqデータ、H3K27ac ChIP-seqデータ、それに合致する入力サンプルを、カットアダプトを用いてアダプタ配列を除去した後にbowtie (バージョン1.1.2)を用いてGRCh38に再度アラインメントした。K562細胞に関しては、スーパーエンハンサー近位遺伝子を用いた。MV4-11とMOLM-13に関しては、MACS2(v2.1.0.20140616)をデフォルトパラメータで用いてH3K27acピークコーリングを実施した。スーパーエンハンサーコーリングを、ROSE v0.1をデフォルトパラメータで用いて実施した。スーパーエンハンサーを、100 kb以内の最も近いTSSに基づいて遺伝子に割り当てた。その後の比較は、Entrez GeneIDが割り当てられていてSLAM-seq内で発現が検出可能なスーパーエンハンサー近位転写産物に限定した。
【0183】
転写応答の予測のモデル化
【0184】
GRCh38.p9の中のすべてのRefseq転写産物のTSS位置をwww.ensembl.org/biomartからダウンロードした。それぞれの鎖上の各TSSから300 bp以内のCAGE-seqリードの密度を、K562について公開されているCAGE-seqデータから抽出した。2つのレプリケートの信号平均値が最大であるTSSを残しておいてさらに分析した。公開されていて入手可能なあらかじめ分析済みの213のChIP-Seqトラックと、1つの全ゲノム亜硫酸水素塩シークエンシング実験を、ENCODEプロジェクト(www.encodeproject.org/)またはCistrome Data Browser(cistrome.org/db/)から取得した。各TSS周辺の500 bp以内と2000 bp以内のChIP-Seq信号を分類モデルのための入力として用いた。
【0185】
JQ1超感受性の予測をモデル化するため、200 nMのJQ1に対するK562細胞の応答をSLAM-seqによって測定した結果(FDR≦0.1、log2FC≦-0.7)に基づき、遺伝子が下方調節された遺伝子に分類された。影響を受けなかった遺伝子(FDR>0.1、-0.1≦log2FC≦0.1)をサブサンプリングし、繰り返しリサンプリングとコルモゴロフ-スミルノフ検定による標的分布との比較から、サイズとベースラインmRNA発現が同じである一致した対照セットを得た。質問遺伝子と対照遺伝子をTSS-ChIP-seq信号マトリックスと交差させ、訓練セット(75%)と試験セット(25%)に分割した。スケーリングされて中心化されたChIP信号を用い、交差検証が5倍以上の5個の独立な分類因子(弾性ネットGLM、勾配ブースティングマシン、線形カーネルを用いるSVM、多項カーネルを用いるSVM、動径カーネルを用いるSVM)をパラメータチューニングの間にCARETパッケージを用いて訓練した。4つの最終モデルすべてをホールドアウト試験セットで比較した。
【0186】
MYCに依存する転写の予測をモデル化するため、K562MYC-AID+Tir1細胞をIAAで処理したときのSLAM-seqにおける応答に基づき、遺伝子を、下方調節される遺伝子(FDR≦0.1、log2FC≦-1)または影響を受けなかった遺伝子(FDR≦0.1、-0.2≦log2FC≦0.2)として分類した。影響を受けなかった遺伝子をさらにサブサンプリングして、JQ1応答モデリングに関して説明したようにサイズが同じで発現が一致した対照セットを得た。サンプルのサイズが大きいため、遺伝子を訓練セット(60%)と試験セット(20%)のほか、追加検証セット(20%)に分割し、JQ1応答モデリングに関して説明したようにして処理した。
【0187】
細胞系の中の直接的なMYC標的シグネチャとがん患者RNA-seqデータの分析
【0188】
MYCの発現を経験的MYC応答シグネチャと比較するため、672個のヒトがん細胞系のFPKM規格化遺伝子発現データをKlijnら(Nat. Biotechnol. 第33巻、306~312ページ(2015年)から取得した。MYCNまたはMYCLをMYCよりも高レベルで発現している細胞系を除外し、残ったサンプルをMYC-高(MYC発現の上位20%)またはMYC-低(MYC発現の下位20%)として分類した。Entrez GeneIDによる細胞系発現データセットの中のアノテーション付きの全遺伝子と、K562MYC-AID+Tir1とHCT116 MYC-AID+Tir1の中で有意に下方調節された(FDR≦0.1)全遺伝子のうちで、両方の細胞系で下方調節の平均値が最も大きい100個の遺伝子を共通MYC応答シグネチャと定義した。全シグネチャ遺伝子の発現のバランスの取れた推定値を得るため、各遺伝子のFPKM値を全細胞系でスケーリングし、全シグネチャ遺伝子のスケーリングされた発現値を各細胞系について平均した。11個のTCGAプロジェクトからの5583人のがん患者の規格化された上方四分位遺伝子発現データをportal.gdc.cancer.govからダウンロードし、細胞系データセットに関して記載したようにして各タイプのがんについて独立に処理した。遺伝子セットエンリッチメント分析は、GSEA Desktop v3.0ベータを用いて実施した。
【0189】
プロテオミクスのためのサンプル調製
【0190】
K562AID-BRD4+Tir1細胞を3つの独立な実験において100μMのIAAまたはDMSOで60分間処理し、氷冷PBSで3回洗浄し、遠心分離によってペレットにし、急速凍結させた。ペレットを溶解バッファー(10 Mの尿素、50mMのHCl)の中に再懸濁させ、室温で10分間インキュベートした後、1 Mのトリス-バッファー(トリス-HCl、cfinal=100 mM、pH 8)を用いてpHを調節した。核酸をベンゾナーゼ(Merck Millipore社、ペレット1つにつき250 U、1時間、37℃)で消化させ、ヨードアセトアミド(15 mM、30分間、室温)を添加してアルキル化した後、DTT(4 mM、30分間、37℃)でクエンチした。タンパク質分解のため、サンプル1つ当たり200μgのタンパク質を100 mMのトリス-バッファーで希釈して尿素の濃度を6 Mにし、Lys-C(Wako社)を酵素:タンパク質の比=1:50で用いて消化させた(3時間、37℃)。サンプルをさらに100 mMのトリス-バッファーで希釈して尿素の最終濃度を2 Mにし、トリプシン(Trypsin Gold、Promega社)を酵素:タンパク質の比=1:50で用いて消化させた(37℃、一晩)。10%トリフルオロ酢酸(TFA、Pierce社)を用いてpHを2未満に調節し、C18カートリッジ(Sep-Pak Vac(50mg)、Waters社)を用いて脱塩した。70%アセトニトリル(ACN、Chromasolv、勾配グレード、Sigma-Aldrich社)と0.1%TFAを用いてペプチドを溶離させた後、凍結乾燥させた。TMTsixplex Isobaric Label Reagent Set(Thermo Fisher Scientific社)を用いて同重体標識を実施し、サンプルを同じモル量で混合し、凍結乾燥させた。C18カートリッジを用いてペプチドを再精製した後、70%ACNと0.1%ギ酸(FA、Suprapur、Merck社)を用いてそのペプチドを溶離させ、次いで凍結乾燥させた。
【0191】
強力なカチオン交換クロマトグラフィ(SCX)によるプロテオミクスサンプルの分別
【0192】
乾燥サンプルをSCXバッファーA(5mMのNaH2PO4、15%のACN、pH 2.7)に溶かした。200μgのペプチドでSCXを実施した。そのとき、流速35μl/分にしたUltiMate 3000 Rapid Separationシステム(Thermo Fisher Scientific 社)と、カスタムメイドのTOSOH TSKgel SP-2PW SCXカラム(5μmの粒子、空孔のサイズ12.5 nm、内径1 mm×250 mm)を使用した。分離に三元勾配を利用し、100%バッファーAを10分間から始め、線形に80分間かけて10%バッファーB(5 mMのNaH2PO4、1 MのNaCl、15%のACN、pH 2.7)と50%バッファーC(5 mMのNa2HPO4、15%のACN、pH 6)まで増加させ、10分間かけて25%バッファーBと50%バッファーCにし、10分間かけて50%バッファーBと50%バッファーCにし、アイソクラティック溶離をさらに15分間実施した。フロースルーを単一の分画として回収するとともに、勾配分画を140分間にわたって毎分回収し、プールして110個の分画にし、-80℃で保管した。
【0193】
ペプチドを定量するためのLC-MS/MS
【0194】
Proxeon ナノスプレー源(Thermo Fisher Scientific 社)を備えるQ Exactive HF質量分析器(Thermo Fisher Scientific 社)に接続されたThermo Fisher RSLCナノシステム(Thermo Fisher Scientific 社)を用いてLC-MS/MSを実施した。0.1%TFAを移動相として用いてペプチドをトラップカラム(Thermo Fisher Scientific 社、PepMap C18、5 mm×300μm内径、5μmの粒子、空孔のサイズ100Å)に25μl/分でローディングした。10分後、トラップカラムを分析カラム(Thermo Fisher Scientific 社、PepMap C18、500 mm×75μm内径、2μm、100Å)と一直線になるように切り換えた。勾配は、移動相:98%A(H2O/FA、99.9/0.1、v/v)と2%B(H2O/ACN/FA、19.92/80/0.08、v/v/v)から開始して60分間かけて35%Bまで増加させた後、5分間かけて90%Bまで増加させ、5分間維持し、5分間かけて98%Aと2%Bまで低下させて30℃で平衡させた。
【0195】
Q Exactive HF質量分析器をデータ依存モードで作動させ、最も豊富な10種類のイオンのフルスキャン(m/zの範囲は350~1650、名目解像度は120000、標的値は3E6)の後にMS/MSスキャンを利用した。MS/MSスペクトルは、規格化された衝突エネルギー35%、単離幅1.2 m/z、解像度60.000、標的値1E5、第1の固定質量セット115 m/zを用いて取得した。断片化のために選択された前駆イオン(割り当てられていない帯電状態である1、>8は除外)を30秒間ダイナミック除外リストに載せた。それに加え、最小AGC標的を1E4に設定し、強度閾値は4E4であった。ペプチドが一致する特徴をpreferredに設定し、除外する同位体の特徴をイネーブルにした。
【0196】
プロテオミクスデータの分析
【0197】
生データをProteome Discoverer(バージョン1.4.1.14、Thermo Fisher Scientific社)で処理した。ヒトSwissProtデータベースと添付の汚染物質からなるデータベース(合計で20508個のタンパク質配列)でのデータベース検索を、MS Amanda(バージョン1.4.14.8240)を用いて実施した。メチオニンの酸化は動的な修飾として設定し、N末端位置のシステインおよびTMTのカルバニドメチル化とリシンのカルバニドメチル化は固定された修飾として指定した。トリプシンは、リシンまたはアルギニンの後ろを切断する(ただしプロリンがあとに続く場合は除く)タンパク質分解酵素と定義し、2個までの間違った切断を許容した。前駆イオンと断片イオンの許容度はそれぞれ5 ppmと0.03 Daに設定した。同定されたスペクトルはPercolatorを用いて再スコア化し、フィルタリングしてペプチドスペクトル一致レベルで0.5%FDRにした。Proteome Discovererの中で厳格な節約原理を適用してタンパク質のグループ化を実施した。レポータイオンの強度は、積分公差が10 ppmの最も信頼性のある重心質量から抽出した。少なくとも2つの独自のペプチドを有することが検出されたすべてのタンパク質について、タンパク質レベルの定量結果を、所与のタンパク質グループに含まれるすべての独自なペプチドに基づいて計算した。量が異なるタンパク質の統計的信頼性はlimmaを用いて計算した。
【0198】
質量分析のための細胞代謝産物の調製
【0199】
あらかじめ温めておいた増殖培地の中に、100μMのIAAまたはDMSO(1:5000 (v/v)の存在下で、細胞を2×105細胞/mlで播種した。培地を24時間後に交換し、48時間後に細胞をカウントして回収し、PBSで2回洗浄し、急速凍結させた。サンプル1つ当たり4×106細胞であるペレットをMeOHとACNとH2Oの混合物(比は2:2:1 (v/v))の中に溶かし、ボルテックスし、急速凍結させた。完全に溶解させるため、細胞に対して3サイクルの急速凍結を実施し、解凍し、超音波処理(10分間、4℃、Bioruptor超音波処理装置(Diagenode社)の中で最大強度)をした。タンパク質を-20℃で1時間沈降させた後、遠心分離した(15分間、18000×g、4℃)。上清を回収し、SpeedVac濃縮装置の中で蒸発させ、ペレットをACNとH2Oの1:1混合物(v/v)の中に超音波処理(10分間、4℃)によって再び溶かし、残滓を遠心分離(4℃、15分間、18000×g)によって除去した。
【0200】
細胞代謝産物のターゲットLC-MS/MS
【0201】
分析の前に、50μlのACNを60μlの各サンプルに添加し、3μlをUltiMate 3000 XRS HPLCシステム(Dionex、Thermo Scientific社)に注入した。ZIC-HILICカラム(100×2.1 mm、3.5μm、200Å、Merck社)と100μl/分の流速を用い、5%移動相A(10 mの酢酸アンモニウムを含む水、pH 7.5)から始まって相B(ACN)の中の50%Aまで増加する勾配を14分間利用して代謝産物を分離した。TSQ Quantiva三連四重極質量分析器(Thermo Scientific社)を用い、負イオンモードで選択反応モニタリング(SRM)を利用してMS/MSを実施した。3つの独立な実験からのサンプルはテクニカルトリプリケートにおいてそれぞれ分析し、MSデータはTraceFinder(Thermo Scientific社)を用いて分析した。
【0202】
結果
【0203】
前処理を30分間、s4U標識を60分間実施した後のSLAM-seqから、小分子阻害剤に対する顕著な即時応答が明らかになった(図25E図30)。この応答は、mRNA半減期によるバイアスを受けていなかった一方で、全mRNAレベルでの変化は、数個の短命mRNAに限られていた(図25F)。3つの阻害剤すべてでの単剤処理によって特異的かつ明確な転写応答が開始された(図30C)のに対し、MEK阻害剤とAKT阻害剤を組み合わせた処理は、BCR/ABL抑制後に観察された効果と似ていた(図25E図25G)。これは、BCR/ABLの主要なエフェクタ経路におけるこれら阻害剤の機能に合致している。合わせて考えると、これらの実験的研究により、mRNAの半減期には関係なく、間接的な効果が排除される時間スケールで、成熟mRNAのレベルで特異的な転写応答と全体的な転写応答を調べるための迅速でアクセスしやすく拡張性のあるアプローチとしてのSLAM-seqが確立される。したがってSLAM-seqを、特定の調節因子の速い擾乱と組み合わせることで、直接的な転写標的遺伝子をあいまいさなく同定することが可能になる。
【0204】
このアプローチを一般化して、BRD4の場合のように選択的阻害剤を利用できない多数の調節因子を調べられるようにするため、SLAM-seqを化学的-遺伝的なタンパク質分解と組み合わせることを試みた。あいまいさなく標的を特定することを目的として十分に速い反応速度を実現するため、オーキシンで誘導可能なデグロン(AID)システムを利用した。このシステムは、AIDタグの付いたタンパク質を1時間以内に分解する。具体的には、K562細胞のBRD4遺伝子座を改変して非常に小さなAIDタグを付け(図26A)、イネF-ボックスタンパク質Tir1を高レベルで発現するレンチウイルスベクターを用いて、ホモ接合でタグを付けたクローンを形質転換した。Tir1は、オーキシン(インドール3-酢酸、IAA)で処理したときにAIDタグを有するタンパク質のユビキチン化を媒介する。実際、AIDタグを有するタンパク質をオーキシンで処理すると、BRD4の非常に特異的(図31A図31C)でほぼ完全な分解が30分以内に始まった(図26B図31B)。タグまたはTir1の発現とオーキシン処理の導入はよく許容されたが、BRD4の長期にわたる分解が増殖を強力に抑制した(図31D図31E)。これは、BRD4に関して報告されている重要な機能に合致している。
【0205】
次にBRD4分解の直接的転写の帰結を正確に記述するため、細胞をオーキシンで30分間処理し、新たに合成したRNAにs4Uでその後の60分間にわたって標識した。標識されたmRNAをSLAM-seqによってその後定量すると、CDK9抑制の効果と同様、転写の全体的な下方調節が明らかになった(図26C図31F)。この現象の背後にある調節事象を調べるため、BRD4が分解するときのクロマチン結合コア転写機構のレベルを測定した。転写開始前複合体の構成要素も、DSIF、NELF、P-TEFbも、全体的なリクルートを損なうことはなかったが、Pol2のリン酸化がそのC末端塩基反復のS5ではなくてS2の位置で顕著に低下することに気づいた(図26D)。これは、プロモータ近位休止放出に欠陥があることを示している。実際、BRD4が分解するときのPol2のスパイク-イン制御されたChIPシークエンシング(オーキシン処理の60分後)から、活性な転写開始部位(TSS)を占めるPol2が顕著に増加した一方で、Pol2の密度は遺伝子の転写領域内全体で減少した(図26E図26F図32A)。同様に、S5がリン酸化されたPol2のレベルがプロモータの位置で上昇したのに対し、(後期伸長工程に関係する)S2がリン酸化されたPol2は、遺伝子の転写領域内全体で大きく減少した(図26E図26F図32B図32C)。これらの知見は、クロマチンへのCDK9のリクルートとは独立にpan-BETタンパク質が分解するときの転写の広範な減少と合致しており、これらの効果を媒介するにはBRD4だけが失われることで十分であることを示している。これらの結果が合わさって、大半の活性なプロモータの位置で停止したポリメラーゼのライセンシング放出におけるBRD4の中心的な役割が確立される。
【0206】
これらの知見は、BRD4が活性なTSSにランダムに結合してコア転写機構と物理的な相互作用することと合致しているが、従来の発現分析でBETi処理の後に観察された選択的効果とは矛盾している。BETiの即時転写効果を明確にしてその効果をBRD4の分解と比較するため、K562細胞と急性骨髄性白血病(AML)細胞系MV4-11において、さまざまな用量のBETi JQ1で処理した後にSLAM-seqを実施した。両方のタイプの細胞において、高用量(1μMまたは5μM)のJQ1で処理すると転写が広く抑制され(図26G図33A)、Pol2-S2リン酸化が全体的に減少した(図33B)。これはBRD4の分解後に観察された効果と似ており、BRD4の包括的転写機能がBETブロモドメインに依存することを示している。重要なことだが、高用量のBETi処理がPol2-S2リン酸化に及ぼす効果は、抗増殖効果の前の複数の時点におけるBRD4のノックダウンによっても再現された(図33C図33D)のに対し、BRD2またはBRD3(普遍的に発現している他の2つのBETi標的)の抑制は、そのような現象を開始させなかった。これらの結果は、BETiの包括的転写効果が主にBRD4抑制によって媒介されていて、他のBET-ブロモドメイン含有タンパク質によっては補償できないことを明らかにしている。
【0207】
1μMを超える用量のJQ1は、AMLとそれ以外のJQ1感受性がん細胞系における増殖抑制濃度を大きく超えるため、広範なAMLモデルで強い抗白血病効果を引き起こす200 nMというより注意深く選択した用量に対する直接的な転写応答を調べることを試みた。数少ないBETi非感受性白血病細胞系の1つであるK562細胞では、200 nMのJQ1が少数の転写産物の選択的分解を誘導した(図26H)。驚いたことに、感受性の大きい2つのAML細胞系を同じ用量で処理すると、同等のスケールで転写応答が始まり(図26H図34A図34B)、BETi超感受性転写産物の同様なセット(MYCとそれ以外の汎骨髄依存症が含まれていた)に影響を与えた(図26I図34C図34D)。これらの知見は、白血病におけるBETi抵抗性が一次転写応答の欠如ではなくて二次適応によって決まることを示している。われわれは、BRT抑制またはBRD4分解の後に共通して上方調節された遺伝子の小集団にも気づいた(図34E)。興味深いことに、その中には、AMLにおける腫瘍抑制因子であってこの文脈でBETiの強力な効果に寄与する可能性があるERG1が含まれている。合わせると、われわれの結果から、BETiに対する一次転写応答が用量に強く依存していることが明らかになり、治療に有効な用量が、超感受性遺伝子の小集団の調節を解除することを通じて抗白血病効果を開始させることが示される。さらに、これは、基本的な転写機構の部分的抑制が、がん依存性を選択的に標的とすることのできる非常に特異的な応答を誘導できることを示している。
【0208】
いくつかの転写産物をBETiに対して超感受性にする因子を探すため、この現象が、一般的なPol2休止放出機構への干渉に対する明確な感受性の単なる反映であるかどうかを調べた。これを検証するため、SLAM-seqを利用してBET抑制(200 nMのJQ1)に対する転写応答を、さまざまな用量の選択的CDK9阻害剤NVP-2によって開始される効果と比較した。高用量(60 nMのNVP-2)でCDK9を抑制すると転写は全体的に抑制されたが、中間用量(6 nMのNVP-2)だと、BETiに対する従来通りの応答(図27A図27B図35B)とは明確に異なる選択的な転写応答が起こった(図35A)。CDK9阻害剤とBET阻害剤は以前の報告とAMLにおけるわれわれの研究(図35C図35D)で強い相乗効果を示しているため、この現象の背後にある転写応答を調べることを試みた。選択的な単剤効果とは対照的に、中間用量のJQ1とNVP-2を組み合わせると、高用量でのCDK9抑制と同様、転写の全体的喪失が開始された(図27A図27B図35A)。これらの観察結果は、遺伝的に明確なAML細胞系に当てはまる(図35E図35F)。これは、BETiとCDK9iの間の治療相乗効果が包括的転写の相乗的抑制に主に基づいていることを示唆しているため、この組み合わせの認容性に関する懸念が生じる。全体として、われわれの結果から、治療に有効な用量のCDK9阻害剤とBET阻害剤は、Pol2休止放出におけるこれら阻害剤の標的の一般的な役割にもかかわらず、このプロセスにおける異なるボトルネックを利用して選択的な転写応答を開始させていることが明らかになる。
【0209】
BETi超感受性の現象がクロマチンの特定の特徴によって決まるかどうかを調べるため、最初に、TSSにおけるBRD4占有レベル、またはBETiへのBRD4のアクセス可能性が直接的なBETi標的(FDR≦0.1、log2FC≦-0.7)を、ベースラインの発現が同じ非応答遺伝子からなる同じサイズのコホート(FDR≦0.1、-0.1≦log2FC≦0.1;図36A)から識別できるかどうかを検証した。BRD4占有が遺伝子のランダムな選択(AUC 0.52、図31C)を凌駕する可能性はほとんどないが、Click-seqによって測定されたBETiのクロマチン結合レベルに関する最近の報告がBETi応答(AUC 0.63;図36B)を部分的に説明できる可能性がある。これは、薬のアクセス可能性の差が選択的なBETi効果に寄与することを示唆している。別の広く採用されているモデルは、BETiの転写効果と治療効果を、BETiがスーパーエンハンサーを選択的に抑制する能力に帰しているが、それは、H3K27acに基づく調節可能性をBETi標的の優れた予測因子と特定した最近の研究によって異議を申し立てられている。これらの研究は長期にわたって薬で治療した後の従来のRNA-seqに依存していたため、われわれは、SLAM-seqを利用して両方のモデルを評価し直した。遺伝子のH3K27acに基づく調節可能性のほか、スーパーエンハンサーとその可能性の関連性が、BETiに対する超感受性を中程度の精度で予測した(それぞれAUC 0.66と0.64、図27C)。しかしBETi感受性遺伝子の2/3はスーパーエンハンサーに割り当てることができず、発現したスーパーエンハンサー関連遺伝子の大半はBETi処理に応答しなかった(図27D図27E)。これらの観察結果は他の白血病細胞系に当てはまる(図36C)ため、BET抑制に対する感度はスーパーエンハンサーの存在と関連しているが、スーパーエンハンサーの存在によって決まるのではないことを示している。これは、より複雑な因子がこの現象の背後にあることを示唆している。
【0210】
それを探すため、K562細胞に関して利用できる包括的なプロファイリングデータを活用し、遺伝子調節の組み合わせモードをモデル化するための不偏アプローチを考案した。具体的には、BETi感受性遺伝子と非反応遺伝子のTSSの周囲500 bp以内と2000 bp以内で214個のChIPシークエンシング実験とメチロームシークエンシング実験の信号を抽出した後、このデータを利用して、後にホールドアウト試験遺伝子に基づいて評価するさまざまな分類モデルを訓練した(図27F図36D)。このアプローチから、BETi感受性を大きな忠実度で予測する多数の分類因子が生まれた(AUC>0.8、図27G図36D)。その中には、弾性ネット回帰によって導出される一般化された線形モデル(GLM)が含まれる。このモデルの係数を再分析することにより、いくつかの因子(高レベルのTSS近位RESTとH3K27acが含まれる)がBETi超感受性と関係していることが明らかになった一方で、SUPT5H(SUPT5Hそのものは伸長の調節因子である)の高占有度が最強の負の予測因子であることが明らかになった(図27H図37A)。教師なしクラスター化から、大半の予測TFと補因子はBETi感受性遺伝子または非反応遺伝子の別々のサブクラスターでだけ豊富であることが明らかになった(図27I図37B)。例えば正の予測因子であるNFRKBとHMBOX1の高ローディングがBETi感受性遺伝子の別々のグループで見いだされた一方で、CREMとSUPT5Hの高結合がBETi非感受性遺伝子の別々のサブクラスターで観察された。合わせると、これらの知見から、BETiに対する転写応答は遺伝子座特異的な調節因子によって決まっていて、単一の統一クロマチン因子に基づく予測はできないことが示唆される。
【0211】
BETi感受性の複雑な決定因子と同様、BETiの治療効果は、多数の超感受性標的遺伝子の調節解除を通じて生じている可能性が大きい。MYCが白血病における顕著なBETi超感受性遺伝子であることを確認した後、MYC抑制に対する転写応答と細胞応答をこの文脈におけるBETiの重要なエフェクタ機構と見なす必要がある。しかしMYCの直接的な遺伝子調節機能は、特定の標的に対する活性化効果、抑制効果、用量依存性効果を記述する研究や、一般的な転写増幅因子としてのMYCの役割を記述する研究の間で論争が続いている。これらのモデルを検証するため、内在性MYCが急速に失われた後のmRNA出力の直接的な変化を測定することを試みた。その目的で、K562細胞のMYC遺伝子座を操作してAIDタグを付けた(図28A)。このタグは、ホモ接合Tir1発現クローンの中で急速なMYC分解を30分以内に開始させた(図28B)。次にSLAM-seqを利用して、MYCの分解後に60分間で新たに合成されたmRNAの出力を定量した。BRD4の分解、ならびに薬によるCDK9とBETの抑制と比べると、MYCが急速に失われることにより、mRNA産生の全体的な変化と言うよりは非常に特異的な変化が起こった(図28C)。こうした変化は712個の遺伝子に対する抑制効果によって支配されていた一方で、わずか15個のmRNAが強く上方調節された。したがってK562細胞では、MYCは転写の直接的なリプレッサまたは一般的な増幅因子として作用するのではなく、主に特定の標的遺伝子の転写活性化因子として機能する。
【0212】
MYCは実質的にすべての能動的なプロモータを占拠することが知られているため、次に、MYCが、普遍的な結合にもかかわらずいかにして選択的転写活性化を及ぼすかを調べた。その目的で、プロモータの位置での異なるChIP-seq信号に基づいてMYC依存性転写産物(FDR≦0.1、log2FC≦-1)を予測できるように分類モデルを訓練した。弾性ネット回帰から、MYCに依存した遺伝子調節をよく予測する単純なGLMが生まれた(AUC 0.91)。このモデルにおける最強の寄与因子は、MYCそのものの含量であった。実際、従来のピークコーリングによって求まるプロモータ位置のMYCの存在は、MYC感受性転写産物を同定するのに失敗するのに対し、MYCまたはその補因子MAXの結合レベルは、MYCに依存した遺伝子調節を中程度の正確さで予測する(AUCはそれぞれ0.76と0.74)。合わせると、これらの結果から、MYCに直接依存する転写産物は、強力なMYC結合と、追加因子(MNT、NKRF、TBL1XR1、EP300、YY1など)によるさらなる変化または補償によって規定されることが示唆される。
【0213】
MYCに依存した遺伝子調節の細胞における機能を調べるため、直接的なMYC標的遺伝子の間で生物学的プロセスの豊富さを分析した。驚くべきことに、主にMYCの急激な喪失が、タンパク質とヌクレオチドの生合成に関係する遺伝子を下方調節した(図28D)。そうした遺伝子には、AMP代謝においてカギとなる調節因子であるすべてのリボソーム生合成因子の36%と、デノボプリン合成経路の全6個の酵素が含まれる(図28C図28D)。実際、MYCの分解はタンパク質の合成を徐々に損ない(図28E)、増殖に欠陥が生じ始める前に、細胞のAMPとGMPのレベルのほか、その上流の中間体AICARが大きく減少するに至った(図2
8F)。タンパク質とヌクレオチドの生合成における重要な酵素のほか、ポリメラーゼI、II、IIIのいくつかのサブユニットを直接制御するというMYCの役割により、MYCが過剰発現したときに報告されている全細胞RNAの増加が説明される。これは、これらの効果は二次的な性質であり、包括的転写効果に起因するのではないという考え方を支持している。
【0214】
MYCの直接的転写機能が他の文脈で保存されているかどうかを検証するため、ホモ接合AID-タグをHCT116大腸がん細胞のMYC遺伝子座に入れた。この細胞はMYCを特に高レベルで発現する。K562に関しては、Tir1を発現するHCT116MYC-AID細胞をオーキシンで処理するとMYCの完全な分解が30分以内に始まった(図28G)。SLAM-seqプロファイリングにより、同じ細胞プロセスに影響を与えていて、K562細胞での応答と相関している(R=0.64、図28H)高度に選択的な転写効果(図28H)が明らかになった。関連していない2つの細胞系の間でMYC標的の保存が他のタイプのがんに拡張されるかどうかを検証するため、SLAM-seqにおいて最も強力に下方調節された100個の遺伝子のシグネチャを導出し、その発現を、672個のがん細胞系からなるパネルの中のMYCのレベルと比較した。実際、MYCの発現レベルとわれわれのシグネチャはよく相関していた(図28I)が、そのシグネチャを失うことなくMYCを低レベルで発現するわずかな割合の外れ値は別である。注目すべきことに、これら外れ値のすべてがMYCNまたはMYCLを高レベルで発現する。これは、MYCパラログがコアMYC標的の調節に関して冗長な機能を有することを示している。直接的なMYC標的のわれわれのシグネチャは、11種類の主要なヒトがんにまたがる5583個の一次患者サンプルに由来するTCGA RNA-seqプロファイルにおけるMYCのレベルとも強く相関していた(図28J)。合わせると、これらの知見は、さまざまなヒトがんにおいてMYCが転写標的の保存されたセットの発現を駆動していることを明らかにしている。これを、MYCの発がん機能を阻止するための出発点とみなすべきである。
【0215】
まとめると、急速な化学的-遺伝的擾乱とSLAM-seqを組み合わせることで、転写因子と補因子の特殊な直接的機能と包括的な直接的機能を調べるための単純だが強力な戦略が確立される。このアプローチを利用して、細胞系譜と疾患に関連する発現プログラムの調節因子として広く研究されている因子であるBRD4の機能を、転写休止-放出における包括的な共因子として特徴づけた。その一方で、以前は包括的転写増幅因子と考えられていたMYCが、限定され保存されている標的遺伝子セットを活性化し、基本的な同化プロセス(特にタンパク質とヌクレオチドの生合成)を推進することが見いだされた。より一般的に、SLAM-seq は、mRNA出力の変化を直接定量できるようにすることで、あらゆる擾乱に対する直接的な転写応答を規定するための単純でロバストで拡張性のある方法を提供し、そのことによって細胞の調節ネットワークを探索する。
図1
図2A-E】
図2F-M】
図3A
図3B-C】
図4A-C】
図5A
図5B-1】
図5B-2】
図5C
図6
図7
図8A
図8B-1】
図8B-2】
図9
図10A
図10B
図10C
図11
図12A
図12B
図13A-B】
図13C
図13D-E】
図14
図15
図16A-C】
図16D
図16E-F】
図17A-B】
図17C
図17D-G】
図18
図19
図20
図21
図22
図23
図24A
図24B
図24C
図25A
図25B-D】
図25E
図25F-G】
図26A-D】
図26E-F】
図26G-H】
図27A-E】
図27F-G】
図28A-D】
図28E-L】
図29A-D】
図29E
図30A-C】
図30D-G】
図31A-B】
図31C
図31D-F】
図32A-B】
図32C-D】
図33A
図33B
図34A-B】
図34C-D】
図35A-B】
図35C-E】
図36
図37
【配列表】
2023155370000001.app
【手続補正書】
【提出日】2023-09-04
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ポリ核酸(PNA)を同定する方法であって、
PNAを用意する工程と;前記PNAの1個以上の核酸塩基を、チオールで修飾された核酸塩基を細胞内での生合成を通じて前記PNAに組み込み、そしてさらに水素結合パートナーを含むアルキル化剤を用いて前記チオール核酸塩基をアルキル化することにより修飾し、それによりその1個以上の核酸塩基の塩基対形成能力を変化させる工程と;
相補的な核酸をそのPNAと塩基対形成させる工程、ここでこの塩基形成は修飾された少なくとも1個の核酸塩基との塩基対形成を含む;
少なくとも、修飾された少なくとも1個の核酸塩基と相補的な位置において、その相補的な核酸の配列を同定する工程を含む、方法。
【請求項2】
前記修飾が、塩基対形成の挙動を変化させ、そのことによってAとT/Uの間と、CとGの間の優先的な塩基対形成を、A、T/U、C、Gから選択された天然の核酸塩基と比べて変化させる、請求項1に記載の方法。
【請求項3】
前記修飾が、前記水素結合パートナーを含むアルキル化剤を用いてウリジンの4位をアルキル化することを含む、請求項1または2に記載の方法。
【請求項4】
前記ポリ核酸が1つ以上の4-チオウリジンまたは6-チオグアノシンを含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記ポリ核酸が、前記塩基対形成能力を変化させる修飾により細胞内で合成される、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記修飾された少なくとも1個の核酸塩基との塩基対形成により、修飾されていない核酸塩基との塩基対形成ではなく、別のヌクレオチドとの塩基対形成がされる、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記PNAがRNAまたはDNAを含むか、RNAまたはDNAからなる、請求項1~6のいずれか1項に記載の方法。
【請求項8】
A、G、C、U、又はTから選択された各タイプのヌクレオチドについて、前記修飾されたPNAが、修飾されたヌクレオチドよりも多数の天然のヌクレオチドを含む、請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記PNAが、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数、かつ30個までの修飾されたヌクレオチドを含む、請求項1~8のいずれか1項に記載の方法。
【請求項10】
PNAを用意する前記工程が細胞内でそのPNAを発現させることを含み;
前記方法はさらに、
前記PNAをその細胞から単離し;
その細胞内で、および/または単離後に、前記PNAの1個以上の核酸塩基を修飾し;
ここで、細胞内または単離後のその修飾が、または細胞内と単離後を合わせたその修飾が、1個以上の核酸塩基の水素結合パートナーを付加または除去することによって前記1個以上の核酸塩基の塩基対形成能力を変化させることを含む、請求項1~9のいずれか1項に記載の方法。
【請求項11】
1個以上の細胞を少なくとも2つの培養段階または増殖段階で培養するか増殖させ、
ここで、1つの培養段階または増殖段階は、修飾されたヌクレオチドを、生合成されたポリ核酸に組み込むことを含み、ここで、水素結合パートナーの付加または除去によってそのポリ核酸は修飾されている、
別の培養段階または増殖段階は、生合成されたポリ核酸への修飾されたヌクレオチドのそのような組み込みが欠けているか、又は修飾されたヌクレオチドが生合成されたポリ核酸にもう一方の培養段階または増殖段階とは異なる濃度で組み込まれている;あるいは、
ii)前記方法が、少なくとも2個の異なる細胞の生合成されたポリ核酸に、または少なくとも2つの異なる細胞群に修飾されたヌクレオチドを組み込むことを含み、好ましくは少なくとも2個の異なる細胞または少なくとも2つの異なる細胞群の組み込みを比較する、請求項1~10のいずれか1項に記載の方法。
【請求項12】
前記2つの培養段階または増殖段階の生合成されたPNAを前記細胞から回収するか、少なくとも2個の異なる細胞、または2つの異なる細胞群の生合成されたPNAを前記細胞から回収し、好ましくは混合もし、特に好ましくはPNAの出所である細胞に応じてPNAに標識することと、前記PNAへの相補的な核酸の塩基対形成が、転写、好ましくは逆転写による相補的なPNA鎖、好ましくはDNA鎖の生成を含むことが含まれる、請求項1~11のいずれか1項に記載の方法。
【請求項13】
前記相補的なPNA鎖の配列を求め、その鎖の配列を比較することをさらに含んでいて、ここで、水素結合パートナーの付加または除去による修飾の結果として変化した相補的な核酸は、修飾なしのその相補的な核酸との比較によって同定が可能である、請求項12に記載の方法。
【請求項14】
相補的な核酸の同定された配列を、少なくとも、少なくとも2個の細胞内の少なくとも1個の修飾された核酸塩基と相補的な位置で比較するか、細胞内の少なくとも2つの異なる増殖段階における少なくとも1個の修飾された核酸塩基と相補的な位置で比較することを含み、ここで、前記少なくとも2個の細胞または少なくとも2つの増殖段階は、その少なくとも2個の細胞または少なくとも2つの増殖段階の間での遺伝子の発現の違いを持ち、好ましくは遺伝子の発現の違いが、細胞内の少なくとも1個の遺伝子の抑制または刺激によって起こる、請求項1~13のいずれか1項に記載の方法。