【文献】
J. Med. Chem.,2014年,57(9),3874-3883
(58)【調査した分野】(Int.Cl.,DB名)
鋳型核酸鎖および部分的にハイブリダイズされた核酸鎖を提供するステップをさらに含み、ステップ(a)は、前記鋳型鎖の対応する位置のヌクレオシドまたはヌクレオチドに対し相補的な少なくとも1つのヌクレオシドまたはヌクレオチドを、前記ハイブリダイズされた鎖に取り込み、ステップ(b)は、前記取り込まれたヌクレオシドまたはヌクレオチドの塩基を特定することにより、前記鋳型鎖の相補的なヌクレオシドまたはヌクレオチドの同一性を示す、請求項12に記載の方法。
【発明を実施するための形態】
【0017】
本明細書で開示する一部の実施形態は、リンカーを介してフルオロフォアに共有結合するヌクレオシドまたはヌクレオチドであって、前記リンカーは下記の式Iもしくは式II、または両者の組み合わせの構造を含み、その変数の定義は上記で定義される、ヌクレオシドまたはヌクレオチドに関する。
【0019】
式Iの構造の一部の実施形態において、R
1は水素である。一部の他の実施形態では、R
1は置換されていてもよいC
1-6アルキルである。一部のこのような実施形態では、R
1はメチルである。
【0020】
本明細書で記載する式IのR
1のいずれの実施形態でも、R
2は水素である。一部の他の実施形態では、R
2は置換されていてもよいC
1-6アルキルである。一部のこのような実施形態では、R
2はメチルである。一実施形態では、R
1およびR
2の両方がメチルである。別の実施形態では、R
1およびR
2の両方が水素である。
【0021】
式Iの構造の一部の実施形態において、mは0である。一部の他の実施形態では、mは1である。
【0022】
式Iの構造の一部の実施形態において、nは1である。
【0023】
式Iの構造の一部の実施形態において、式Iの構造はまた、式Iaまたは式Ibで表すことが可能である。
【0025】
本明細書で記載する一部の実施形態において、式Iaを「AEDI」といい、式Ibを「SS」という。
【0026】
式IIの構造の一部の実施形態において、R
3は水素である。一部の他の実施形態において、R
3は置換されていてもよいC
1-6アルキルである。一部のこのような実施形態において、R
3はメチルである。一部の実施形態において、R
3は-NR
5-C(=O)R
6である。一部のこのような実施形態において、R
5は水素である。一部のこのような実施形態において、R
6は置換されていてもよいC
1-6アルキル、例えば、メチルである。一部の実施形態において、R
3は-NR
7-C(=O)OR
8である。一部のこのような実施形態において、R
7は水素である。一部のこのような実施形態において、R
8は置換されていてもよいC
1-6アルキル、例えば、t-ブチルである。
【0027】
本明細書で記載する式IIのR
3のいずれの実施形態でも、R
4は水素である。一部の他の実施形態において、R
4は置換されていてもよいC
1-6アルキルである。一部のこのような実施形態において、R
4はメチルである。一実施形態において、R
3およびR
4の両方がメチルである。別の実施形態において、R
3およびR
4の両方が水素である。一実施形態において、R
3は-NH(C=O)CH
3であり、R
4は水素である。別の実施形態において、R
3は-NH(C=O)O
tBu (Boc)であり、R
4は水素である。
【0028】
式IIの構造の一部の実施形態において、Xはメチレンであり、これは置換されていてもよい。別の実施形態では、Xは酸素(O)である。さらに別の実施形態では、Xは硫黄(S)である。
【0029】
式IIの構造の一部の実施形態において、pは1である。一部の他の実施形態では、pは2である。
【0030】
式IIの構造の一部の実施形態において、式IIの構造はまた、式IIa、式IIb、式IIc、式IId、式IIe、または式IIfで表すことが可能である。
【0032】
本明細書で記載する一部の実施形態において、式IIaを「ACA」といい、式IIbを「AcLys」といい、式IIcを「BocLys」といい、式IIdを「dMeO」といい、式IIeを「dMeS」といい、式IIfを「DMP」という。
【0033】
本明細書で記載する式Iまたは式IIの構造を含むリンカーを介してフルオロフォアで標識したヌクレオシドまたはヌクレオチドの任意の実施形態において、ヌクレオシドまたはヌクレオチドはリンカーの左側に、直接または追加の連結部を介して結合することが可能である。
【0034】
本明細書で開示する一部の実施形態は、リンカーを介してフルオロフォアに共有結合するヌクレオシドまたはヌクレオチドであって、前記リンカーは式IIIの構造を含み、変数の定義は上記で定義される、ヌクレオシドまたはヌクレオチドに関する。
【0036】
式IIIの構造の一部の実施形態において、L
1は空である。一部の他の実施形態において、L
1は式Iまたは式II、特に式Ia、式Ib、式II、式IIa、式IIb、式IIc、式IId、式IIe、または式IIfの構造を含む上記のリンカーである。一部の他の実施形態において、L
1はDNAの損傷を防ぐ分子を含む保護部分とすることが可能である。一部のこのような実施形態において、保護部分はトロロックス、没食子酸、p-ニトロベンジル(pNB)、もしくはアスコルベート、またはその組み合わせを含む。
【0037】
式IIIの構造の一部の実施形態において、L
2は置換されていてもよいC
1-20アルキレンである。一部のさらなる実施形態において、L
2は置換されていてもよいC
4-10アルキレンである。一部のこのような実施形態において、L
2はヘプチレンである。一部の他の実施形態において、L
2は置換されていてもよいC
1-20ヘテロアルキレンである。一部のこのような実施形態において、置換されていてもよいC
1-20ヘテロアルキレンは、1つまたは複数の窒素原子を含む。一部のこのような実施形態において、C
1-20ヘテロアルキレンの少なくとも1つの炭素原子はオキソ(=O)で置換されている。一部のさらなる実施形態において、L
2は置換されていてもよいC
3-6ヘテロアルキレンである。一部の実施形態において、L
2は置換C
6-10アリール基などの置換芳香族基、または1〜3個のヘテロ原子を含む5〜10員置換ヘテロアリール基で中断される。一部のこのような実施形態において、L
2は置換フェニル基により中断される。一部のこのような実施形態において、フェニル基は、ニトロ、シアノ、ハロ、ヒドロキシ、C
1-6アルキル、C
1-6アルコキシ、C
1-6ハロアルキル、C
1-6ハロアルコキシ、またはスルホニルヒドロキシドから選択される1つまたは複数(最大4つ)の置換基で置換されている。一部のさらなるこのような実施形態において、フェニル基は、ニトロ、シアノ、ハロ、またはスルホニルヒドロキシド(つまり、-S(=O)
2OH)から選択される、1〜4つの置換基で置換されている。
【0038】
式IIIの構造の一部の実施形態において、
【化10】
のR
Aは、水素またはアジドから選択される。一部のこのような実施形態において、一方のR
Aがアジドであり、もう一方が水素である場合、kは2である。
【0039】
式IIIの構造の一部の実施形態において、L
3は置換されていてもよいC
1-20アルキレンである。一部のさらなる実施形態において、L
3は置換されていてもよいC
1-6アルキレンである。一部のこのような実施形態において、L
3はエチレンである。一部の他の実施形態において、L
3は置換されていてもよいC
1-20ヘテロアルキレンである。一部のこのような実施形態において、置換されていてもよいC
1-20ヘテロアルキレンは、1つまたは複数の酸素原子を含む。一部のこのような実施形態において、L
1は置換されていてもよいC
1-6アルキレンオキシド、例えばC
1-3アルキレンオキシドである。
【0040】
式IIIの構造の一部の実施形態において、R
Bは水素である。一部の実施形態において、R
Cは水素である。一部のさらなる実施形態において、R
BおよびR
Cの両方が水素である。
【0041】
式IIIの構造の一部の実施形態において、式IIIの構造はまた、式IIIa、式IIIb、または式IIIcにより表すことが可能である。
【0042】
【化11】
(式中、R
Dはニトロ、シアノ、ハロ、ヒドロキシ、C
1-6アルキル、C
1-6アルコキシ、C
1-6ハロアルキル、C
1-6ハロアルコキシ、またはスルホニルヒドロキシドから選択される。一部のさらなる実施形態において、R
Dはニトロ、シアノ、ハロ、またはスルホニルヒドロキシドから選択される。)
【0043】
本明細書で記載する、式IIIの構造を含むリンカーを介してフルオロフォアで標識したヌクレオシドまたはヌクレオチドの任意の実施形態において、フルオロフォアはリンカーの左側に、直接または追加の連結部を介して結合することが可能である。
【0044】
式I、式II、または式IIIの構造を含むリンカーに関する、本明細書に記載の任意の実施形態において、用語「置換されていてもよい」が変数を定義するために用いられる場合、そのような変数は置換されていなくてもよい。
【0045】
定義
別途定義がない限り、本明細書で用いる全ての科学技術用語は当業者により通常理解されるものと同じ意味である。用語「含んでいる(including)」ならびに他の形態、例えば「含む(include)」、「含む(includes)」、および「含んだ(included)」の使用は、限定的ではない。用語「有している(having)」ならびに他の形態、例えば「有する(have)」、「有する(has)」、および「有した(had)」の使用は、限定的ではない。本明細書で用いる場合、請求項の移行句でも本文でも、「含む(comprise(s))」および「含んでいる(comprising)」の用語は、非限定(open-ended)の意味を有すると解釈されるべきである。つまり、上記の用語は、「少なくとも有している(having at least)」または「少なくとも含んでいる(including at least)」と同義的に解釈されるべきである。例えば、プロセスの文脈で用いられる場合、用語「含んで(comprising)」は、該プロセスが少なくとも記載されたステップを含むものの、追加のステップも含んでよいことを意味する。化合物、組成物、またはデバイスの文脈で用いられる場合、用語「含んで(comprising)」は、該化合物、組成物、またはデバイスが、少なくとも記載された特徴または構成要素を含むものの、追加の特徴または構成要素も含んでよいことを意味する。
【0046】
本明細書で用いるセクションの見出しは構成を目的とするのみであり、記載する主題を限定するものと解釈されるべきではない。
【0047】
本明細書で用いる場合、一般的な有機物の略語を次のように定義する。
Ac アセチル
Ac
2O 無水酢酸
aq. 水性
Bn ベンジル
Bz ベンゾイル
BOCまたはBoc tert-ブトキシカルボニル
Bu n-ブチル
cat. 触媒性
°C 摂氏温度
CHAPS 3-[(3-コラミドプロピル)ジメチルアンモニオ]-1-プロパンスルホナート
dATP デオキシアデノシン三リン酸
dCTP デオキシシチジン三リン酸
dGTP デオキシグアノシン三リン酸
dTTP デオキシチミジン三リン酸
ddNTP(s) ジデオキシヌクレオチド
DCM メチレンクロリド
DMA ジメチルアセトアミド
DMAP 4-ジメチルアミノピリジン
DMF N,N'-ジメチルホルムアミド
DMSO ジメチルスルホキシド
DSC N,N'-スクシンイミジルカーボネート
EDTA エチレンジアミン四酢酸
Et エチル
EtOAc 酢酸エチル
ffN 完全機能性ヌクレオチド
ffA 完全機能性アデノシンヌクレオチド
g グラム
GPC ゲル浸透クロマトグラフィ
hまたはhr 時間
Hunig’s base N,N-ジイソプロピルエチルアミン
iPr イソプロピル
Kpi pH7.0の10 mMリン酸カリウム緩衝液
IPA イソプロピルアルコール
LCMS 液体クロマトグラフィ−質量分析
LDA ジイソプロピルアミドリチウム
mまたはmin 分
MeCN アセトニトリル
mL ミリリットル
PEG ポリエチレングリコール
PG 保護基
Ph フェニル
pNB p-ニトロ-ベンジル
ppt 沈殿物
rt 室温
SBS 合成による配列決定(Sequencing by Synthesis)
-S(O)
2OH スルホニルヒドロキシド
TEA トリエチルアミン
TEAB テトラエチルアンモニウムブロミド
TFA トリフルオロ酢酸
Tert, t 三級
THF テトラヒドロフラン
TLC 薄層クロマトグラフィ
TSTU O-(N-スクシンイミジル)-N,N,N′,N′-テトラメチルウロニウムテトラフルオロボラート
μL マイクロリットル
【0048】
本明細書で用いる場合、用語「アレイ」は、1つまたは複数の基質に結合されている異なるプローブ分子の集団であって、この異なるプローブ分子が、相対的な位置に従って互いに区別することが可能であるような、プローブ分子の集団を指す。アレイには、基質上の異なるアドレス指定可能な位置に各々位置付けられる異なるプローブ分子が含まれ得る。あるいは、または加えて、アレイは、異なるプローブ分子を各々担持する個別の基質を含むことができ、この異なるプローブ分子は、基質が結合している表面上の基質の位置、または液体中の基質の位置によって識別することが可能である。個別の基質が表面上に位置付けられている例示的なアレイとして、限定されるわけではないが、例えば、米国特許第6355431号明細書、米国特許出願公開第2002/0102578号明細書、およびPCT公開国際公開第00/63437号に記載されるような、ウェル中にビーズを含むものが挙げられる。液体アレイ、例えば、蛍光活性化細胞選別装置(FACS)などのマイクロ流体デバイスを用いたものの中のビーズを区別するために本発明で用いることができる例示的なフォーマットは、例えば、米国特許第6524793号明細書に記載されている。本発明において用いることが可能なアレイのさらなる例としては、限定されるわけではないが、米国特許第5429807号明細書、同第5436327号明細書、同第5561071号明細書、同第5583211号明細書、同第5658734号明細書、同第5837858号明細書、同第5874219号明細書、同第5919523号明細書、同第6136269号明細書、同第6287768号明細書、同第6287776号明細書、同第6288220号明細書、同第6297006号明細書、同第6291193号明細書、同第6346413号明細書、同第6416949号明細書、同第6482591号明細書、同第6514751号明細書、同第6610482号明細書、国際公開第93/17126号、同第95/11995号、同第95/35505号、欧州特許第742287号明細書および同第799897号明細書に記載されるものが挙げられる。
【0049】
本明細書で用いる場合、用語「共有結合した(covalently attached)」または「共有結合した(covalently bonded)」は、原子間における電子対の共有を特徴とする化学結合の形成を指す。例えば、共有結合したポリマーコーティングは、他の手段、例えば付着または静電相互作用による表面への結合と比較して、基質の官能化した表面との化学結合を形成するポリマーコーティングを指す。表面に共有結合したポリマーは、共有結合以外の手段によっても結合可能であることが理解されよう。
【0050】
本明細書で用いる場合、「a」および「b」が整数である「C
a」〜「C
b」または「C
a-b」は、特定の基の炭素原子数を指す。つまり、基は、「a」個以上「b」個以下の炭素原子を含み得る。したがって、例えば、「C
1〜C
4アルキル」基または「C
1-4アルキル」基は、1〜4個の炭素を有する全てのアルキル基、つまり、CH
3-、CH
3CH
2-、CH
3CH
2CH
2-、(CH
3)
2CH-、CH
3CH
2CH
2CH
2-、CH
3CH
2CH(CH
3)-、および(CH
3)
3C-を指す。
【0051】
用語「ハロゲン」または「ハロ」は、本明細書で用いる場合、フッ素、塩素、臭素、またはヨウ素などの、元素周期表の7列目の放射線安定性原子のうちのいずれか1つを意味し、フッ素および塩素が好適である。
【0052】
本明細書で使用する場合、「アルキル」は、完全に飽和した(つまり、二重結合も三重結合も含まない)直鎖または分岐鎖の炭化水素鎖を指す。アルキル基は、1〜20個の炭素原子を有してよい(これが本明細書で現れる場合は常に、「1〜20」などの数値範囲は、与えられた範囲における各整数を指し、例えば、「1〜20個の炭素原子」は、該アルキル基が1個の炭素原子、2個の炭素原子、3個の炭素原子など、20個以下の炭素原子からなっていてよいことを意味するが、本定義はまた、数値範囲が指定されていない用語「アルキル」の出現時にもあてはまる)。アルキル基はまた、1〜9個の炭素原子を有する中程度のサイズのアルキルとすることができる。アルキル基はまた、1〜4個の炭素原子を有する低級アルキルとすることが可能である。アルキル基は、「C
1-4アルキル」または類似の呼称で指定することができる。例に過ぎないが、「C
1-4アルキル」は、アルキル鎖中に1〜4個の炭素原子があること、つまり、該アルキル鎖がメチル、エチル、プロピル、イソ-プロピル、n-ブチル、イソ-ブチル、sec-ブチル、およびt-ブチルからなる群から選択されることを示す。典型的なアルキル基としては、限定されるわけではないが、メチル、エチル、プロピル、イソプロピル、ブチル、イソブチル、第三ブチル、ペンチル、およびヘキシルなどが挙げられる。アルキル基は、置換または非置換とすることができる。
【0053】
本明細書で用いる場合、「アルコキシ」は式-ORを指し、ここでRは、「C
1-9アルコキシ」など上記で定義したアルキルであり、限定されるわけではないが、メトキシ、エトキシ、n-プロポキシ、1-メチルエトキシ(イソプロポキシ)、n-ブトキシ、イソ-ブトキシ、sec-ブトキシ、およびtert-ブトキシなどが含まれる。
【0054】
本明細書で用いる場合、「ヘテロアルキル」は、1つまたは複数のヘテロ原子、つまり、窒素、酸素、および硫黄を含むがこれらに限定されない炭素以外の元素を鎖骨格中に含む直鎖または分岐鎖の炭化水素鎖を指す。ヘテロアルキル基は1〜20個の炭素原子を有してよいが、本定義はまた、数値範囲が指定されていない用語「ヘテロアルキル」の出現時にもあてはまる。ヘテロアルキル基はまた、1〜9個の炭素原子を有する中程度のサイズのヘテロアルキルとすることができる。ヘテロアルキル基はまた、1〜4個の炭素原子を有する低級ヘテロアルキルとすることができる。ヘテロアルキル基は、「C
1-4ヘテロアルキル」または類似の呼称で指定することができる。ヘテロアルキル基は、1つまたは複数のヘテロ原子を含むことができる。例に過ぎないが、「C
1-4ヘテロアルキル」は、ヘテロアルキル鎖中に1〜4個の炭素原子があり、加えて、鎖骨格中に1つまたは複数のヘテロ原子があることを示す。
【0055】
本明細書で用いる場合、「アルキレン」は炭素および水素のみを含む、分岐鎖または直鎖の完全飽和ジラジカル化学基を意味し、これは2つの結合点(つまり、アルカンジイル)を介して分子の残りの部分に結合する。アルキレン基は1〜20個の炭素原子を有することができるが、本定義は数値範囲が指定されていない用語アルキレンの出現時にもあてはまる。アルキレン基はまた、1〜9個の炭素原子を有する中程度のサイズのアルキレンとすることができる。アルキレン基はまた、1〜4個の炭素原子を有する低級アルキレンとすることができる。アルキル基は、「C
1-4アルキレン」または類似の呼称で指定することができる。例に過ぎないが、「C
1-4アルキレン」は、アルキレン鎖中に1〜4個の炭素原子があること、つまり、アルキレン鎖は、メチレン、エチレン、エタン-1,1-ジイル、プロピレン、プロパン-1,1-ジイル、プロパン-2,2-ジイル、1-メチル-エチレン、ブチレン、ブタン-1,1-ジイル、ブタン-2,2-ジイル、2-メチル-プロパン-1,1-ジイル、1-メチル-プロピレン、2-メチル-プロピレン、1,1-ジメチル-エチレン、1,2-ジメチル-エチレン、および1-エチル-エチレンからなる群から選択される。本明細書で用いる場合、アルキレンが芳香族基により中断される場合、それは、2つの結合点を介したアルキレン鎖の炭素−炭素結合間での芳香族基の挿入、または、1つの結合点を介したアルキレン鎖の一方の末端への芳香族基の結合を指す。例えば、n-ブチレンがフェニル基により中断される場合、例示的な構造としては、
【化12】
が挙げられる。
【0056】
本明細書で用いる場合、用語「ヘテロアルキレン」は、アルキレンの1つまたは複数の骨格原子が炭素以外の原子、例えば、酸素、窒素、硫黄、リン、またはその組み合わせから選択される、アルキレン鎖を指す。ヘテロアルキレン鎖の長さは、2〜20000とすることが可能である。例示的なヘテロアルキレンとしては、限定されるわけではないが、-OCH
2-、-OCH(CH
3)-、-OC(CH
3)
2-、-OCH
2CH
2-、-CH(CH
3)O-、-CH
2OCH
2-、-CH
2OCH
2CH
2-、-SCH
2-、-SCH(CH
3)-、-SC(CH
3)
2-、-SCH
2CH
2-、-CH
2SCH
2CH
2-、-NHCH
2-、-NHCH(CH
3)-、-NHC(CH
3)
2-、-NHCH
2CH
2-、- -CH
2NHCH
2-、および-CH
2NHCH
2CH
2-などが挙げられる。本明細書で用いる場合、ヘテロアルキレンが芳香族基に中断される場合、それは、2つの結合点を介したヘテロアルキレン鎖の1つの炭素−炭素結合もしくは炭素−ヘテロ元素結合の間への芳香族基の挿入、または、1つの結合点を介したヘテロアルキレン鎖の一方の末端への芳香族基の結合を指す。例えば、n-プロピレンオキシドがフェニル基により中断される場合、例示的な構造としては、
【化13】
が挙げられる。
【0057】
本明細書で用いる場合、「アルケニル」は、直鎖または分岐鎖の炭化水素鎖において1つまたは複数の二重結合を含むアルキル基を指す。アルケニル基は非置換または置換とすることができる。
【0058】
本明細書で用いる場合、「アルキニル」は、直鎖または分岐鎖の炭化水素鎖において1つもしくは複数の三重結合を含むアルキル基を指す。アルキニル基は、非置換または置換とすることができる。
【0059】
本明細書で用いる場合、「シクロアルキル」は、完全に飽和した(二重結合も三重結合もない)単環式または多環式の炭化水素環系を指す。2つ以上の環から構成される場合、該環は縮合した様式で互いに結合していてよい。シクロアルキル基は、環の中に3〜10個の原子を含むことが可能である。一部の実施形態において、シクロアルキル基は、環の中に3〜8個の原子を含むことが可能である。シクロアルキル基は非置換または置換とすることができる。典型的なシクロアルキル基としては、決して限定されるわけではないが、シクロプロピル、シクロブチル、シクロペンチル、シクロヘキシル、シクロヘプチル、およびシクロオクチルが挙げられる。
【0060】
用語「芳香族」は、Π電子共役系を有する環または環系を指し、これには炭素環式芳香族基(例えば、フェニル)および複素環式芳香族基(例えば、ピリジン)の両方が含まれる。該用語には、全ての環系が芳香族であれば、単環式または縮環多環(つまり、隣接する原子対を共有する環)の基が含まれる。
【0061】
本明細書で用いる場合、「アリール」は、環骨格において炭素のみを含む芳香族環または芳香族環系(つまり、2つの隣接する炭素原子を共有する2つ以上の縮合環)を指す。アリールが環系である場合、系の全ての環が芳香族である。アリール基は6〜18個の炭素原子を有することができるが、本定義は、数値範囲が指定されていない用語「アリール」の出願時にも当てはまる。一部の実施形態において、アリール基は6〜10個の炭素原子を有する。アリール基は、「C
6-10アリール」、「C
6もしくはC
10アリール」、または類似の呼称で指定することができる。アリール基の例としては、限定されるわけではないが、フェニル、ナフチル、アズレニル、およびアントラセニルが挙げられる。
【0062】
「アラルキル」または「アリールアルキル」は、「C
7-14アラルキル」などのアルキレン基を介して置換基として結合したアリール基であり、限定されるわけではないが、ベンジル、2-フェニルエチル、3-フェニルプロピル、およびナフチルアルキルが挙げられる。一部の場合、アルキレン基は低級アルキレン基(つまり、C
1-4アルキレン基)である。
【0063】
本明細書で用いる場合、「ヘテロアリール」は、芳香族環または芳香族環系(つまり、2つの隣接する原子を共有する2つ以上の縮合環)を指し、これは、1つまたは複数のヘテロ原子、つまり、限定されるわけではないが、窒素、酸素、および硫黄を含む炭素以外の元素を環骨格において含む。ヘテロアリールが環系である場合、系における全ての環は芳香族である。ヘテロアリール基は5〜18の環員(つまり、炭素原子およびヘテロ原子を含む、環骨格を構成する原子数)を有することができるが、本定義は、数値範囲が指定されていない用語「ヘテロアリール」の出現時にもあてはまる。一部の実施形態において、ヘテロアリール基は5〜10の環員または5〜7の環員を有する。ヘテロアリール基は、「5〜7員ヘテロアリール」、「5〜10員ヘテロアリール」、または類似の呼称で指定することができる。ヘテロアリール環の例としては、限定されるわけではないが、フリル、チエニル、フタラジニル、ピロリル、オキサゾリル、チアゾリル、イミダゾリル、ピラゾリル、イソオキサゾリル、イソチアゾリル、トリアゾリル、チアジアゾリル、ピリジニル、ピリダジニル、ピリミジニル、ピラジニル、トリアジニル、キノリニル、イソキノリニル、ベンゾイミダゾリル、ベンゾオキサゾリル、ベンゾチアゾリル、インドリル、イソインドリル、およびベンゾチエニルが挙げられる。
【0064】
「ヘテロアラルキル」または「ヘテロアリールアルキル」は、アルキレン基を介して置換基として結合したヘテロアリール基である。例としては、限定されるわけではないが、2-チエニルメチル、3-チエニルメチル、フリルメチル、チエニルエチル、ピロリルアルキル、ピリジルアルキル、イソオキサゾリルアルキル、およびイミダゾリルアルキルが挙げられる。一部の場合、アルキレン基は低級アルキレン基(つまり、C
1-4アルキレン基)である。
【0065】
本明細書で用いる場合、「シクロアルキル」は完全に飽和したカルボシクリル環またはカルボシクリル環系を意味する。例としては、シクロプロピル、シクロブチル、シクロペンチル、およびシクロヘキシルが挙げられる。
【0066】
「O-カルボキシ」基は、「-OC(=O)R」基を指し、式中、Rは、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。
【0067】
「C-カルボキシ」基は「-C(=O)OR」基を指し、式中、Rは、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。非限定的例としてはカルボキシル(つまり、-C(=O)OH)が挙げられる。
【0070】
「O-カルバミル」基は「-OC(=O)NR
AR
B」基を指し、式中、R
AおよびR
Bはそれぞれ独立して、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。
【0071】
「N-カルバミル」基は「-N(R
A)OC(=O)R
B」基を指し、式中、R
AおよびR
Bはそれぞれ独立して、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。
【0072】
「C-アミド」基は「-C(=O)NR
AR
B」基を指し、式中、R
AおよびR
Bはそれぞれ独立して、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。
【0073】
「N-アミド」基は「-N(R
A)C(=O)R
B」基を指し、式中、R
AおよびR
Bはそれぞれ独立して、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。
【0074】
「アミノ」基は「-NR
AR
B」基を指し、式中、R
AおよびR
Bはそれぞれ独立して、本明細書で定義されるように、水素、C
1-6アルキル、C
2-6アルケニル、C
2-6アルキニル、C
3-7カルボシクリル、C
6-10アリール、5〜10員ヘテロアリール、および5〜10員ヘテロシクリルから選択される。非限定的例としては遊離アミノ(つまり、-NH
2)が挙げられる。
【0075】
本明細書で用いる場合、用語「トロロックス(Trolox)」は6-ヒドロキシ-2,5,7,8-テトラメチルクロマン-2-カルボン酸を指す。
【0076】
本明細書で用いる場合、用語「アスコルベート」はアスコルビン酸塩を指す。
【0077】
本明細書で用いる場合、用語「没食子酸」は3,4,5-トリヒドロキシ安息香酸を指す。
【0078】
本明細書で用いる場合、置換基は、1つまたは複数の水素原子が別の原子または基に交換されている非置換親基(unsubstituted parent group)に由来する。別段の指示がない限り、基が「置換されている」とみなされる場合、それは該基が、C
1-C
6アルキル、C
1-C
6アルケニル、C
1-C
6アルキニル、C
1-C
6ヘテロアルキル、C
3-C
7カルボシクリル(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、C
3-C
7-カルボシクリル-C
1-C
6-アルキル(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、5〜10員ヘテロシクリル(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、5〜10員ヘテロシクリル-C
1-C
6-アルキル(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、アリール(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、アリール(C
1-C
6)アルキル(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、5〜10員ヘテロアリール(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、5〜10員ヘテロアリール(C
1-C
6)アルキル(ハロ、C
1-C
6アルキル、C
1-C
6アルコキシ、C
1-C
6ハロアルキル、およびC
1-C
6ハロアルコキシで置換されていてもよい)、ハロ、シアノ、ヒドロキシ、C
1-C
6アルコキシ、C
1-C
6アルコキシ(C
1-C
6)アルキル(つまり、エーテル)、アリールオキシ、スルフヒドリル(メルカプト)、ハロ(C
1-C
6)アルキル(例えば、-CF
3)、ハロ(C
1-C
6)アルコキシ(例えば、-OCF
3)、C
1-C
6アルキルチオ、アリールチオ、アミノ、アミノ(C
1-C
6)アルキル、ニトロ、O-カルバミル、N-カルバミル、O-チオカルバミル、N-チオカルバミル、C-アミド、N-アミド、S-スルホンアミド、N-スルホンアミド、C-カルボキシ、O-カルボキシ、アシル、シアナト、イソシアナト、チオシアナト、イソチオシアナト、スルフィニル、スルホニル、およびオキソ(=O)から独立して選択される、1つまたは複数の置換基で置換されていることを意味する。基が「置換されていてもよい」と記載されている場合は必ず、その基は上記の置換基で置換され得る。
【0079】
あるラジカル命名法は、文脈により、モノラジカルまたはジラジカルの何れかを含み得ることを理解すべきである。例えば、置換基が分子の残余に対し2つの結合点を必要とする場合、その置換基はジラジカルであることが理解される。例えば、2つの結合点を必要とするアルキルとして特定された置換基には、-CH
2-、-CH
2CH
2-、および-CH
2CH(CH
3)CH
2-などのジラジカルが含まれる。同様に、2つの結合点を必要とするアミノとして特定された基には、-NH-、および-N(CH
3)-などのジラジカルが含まれる。他のラジカル命名法は明確に、ラジカルが「アルキレン」または「アルケニレン」などのジラジカルであることを示す。
【0080】
置換基がジラジカルとして描かれる(つまり、分子の残余に対し2つの結合点を有する)場合は必ず、該置換基は別段の指示がない限り、任意の指向性構成で結合され得ることを理解するべきである。したがって、例えば、-AE-または
【化14】
と描かれる置換基には、Aが分子の一番左の結合点に結合するように方向づけられた置換基、および、Aが分子の一番右の結合点に結合する場合が含まれる。
【0081】
本明細書で開示する化合物が少なくとも1つの立体中心を持つ場合、それらは個別の鏡像異性体およびジアステレオマーとして、またはラセミ体を含むそのような異性体の混合物として存在し得る。個別異性体の分離または個別異性体の選択的合成は、当業者に周知の種々の方法の適用により達成される。別段の指示がない限り、全てのそのような異性体およびその混合物は、本明細書で開示する化合物の範囲に含まれる。
【0082】
本明細書で用いる場合、「ヌクレオチド」には、複素環塩基、糖、および1つまたは複数のリン酸基を含むニトロゲンが含まれる。それらは核酸配列のモノマー単位である。RNAでは、糖はリボースであり、DNAでは、デオキシリボース、つまり、リボースに存在するヒドロキシル基を欠いた糖である。複素環塩基を含むニトロゲンは、プリン塩基またはピリミジン塩基であり得る。プリン塩基にはアデニン(A)およびグアニン(G)、ならびにその修飾誘導体またはアナログが含まれる。ピリミジン塩基には、シトシン(C)、チミン(T)、およびウラシル(U)、ならびにその修飾誘導体またはアナログが含まれる。デオキシリボースのC-1原子は、ピリミジンのN-1またはプリンのN-9に結合する。
【0083】
本明細書で用いる場合、「ヌクレオシド」は構造的にヌクレオチドに類似しているが、リン酸部が欠けている。ヌクレオシドアナログの例は、標識が塩基に連結し、糖部分に結合したリン酸基がないものだろう。用語「ヌクレオシド」は、本明細書では、当業者により理解されるような通常の意味で用いられる。例としては、限定されるわけではないが、リボース部を含むリボヌクレオシドおよびデオキシリボース部を含むデオキシリボヌクレオシドが挙げられる。修飾ペントース部とは、酸素原子が炭素に替えられ、および/または、炭素が硫黄原子または酸素原子に替えられている、ペントース部である。「ヌクレオシド」は、置換塩基およびまたは糖部を有し得るモノマーである。加えて、ヌクレオシドは、より大きいDNAおよび/またはRNAの、ポリマーおよびオリゴマーに取り込まれ得る。
【0084】
本明細書で用いる場合、用語「ポリヌクレオチド」は通常、核酸を指し、DNA(例えば、ゲノムDNA、cDNA)、RNA(例えば、mRNA)、合成オリゴヌクレオチド、および合成核酸アナログが含まれる。ポリヌクレオチドには、天然もしくは非天然の塩基、またはその組み合わせ、および、天然または非天然の骨格結合(backbone linkage)、例えばホスホロチオエート、PNA、もしくは2′-O-メチル-RNA、またはその組み合わせが含まれ得る。
【0085】
本明細書で用いる場合、用語「フェージング(phasing)」はSBSにおける現象を指し、これは3'ターミネーターおよびフルオロフォアの不完全な除去、および、所定のシーケンシングサイクルにおいて、ポリメラーゼによるクラスタ内DNA鎖の一部の取り込みが完了されなかったことにより引き起こされる。プレフェージング(pre-phasing)は、有効3'ターミネーターのないヌクレオチドの取り込みにより引き起こされ、取り込み事象が1サイクル先に進む。フェージングおよびプレフェージングは、特定のサイクルについて抽出される強度が現在のサイクルのシグナル、ならびに、先行および後続のサイクルのノイズから構成される原因となる。サイクル数が増えるにつれ、フェージングに影響された各クラスタの配列断片は増え、正しい塩基の特定を妨げる。プレフェージングは、SBS中の非保護または非ブロック化の微量3'-OHヌクレオチドの存在により引き起こされ得る。非保護3'-OHヌクレオチドは、製造プロセス中に生成され得、または、貯蔵および試薬の取り扱いプロセス中に生成される可能性がある。従って、より速いSBSサイクル時間、より低いフェージング値およびプレフェージング値、ならびに、より長いシーケンシングリード長をもたらすヌクレオチドアナログまたは連結基の修飾は、SBSアプリケーションにより大きな利点をもたらす。
【0086】
本明細書で用いる場合、用語「保護部分」には、限定されるわけではないが、DNA損傷(例えば、光損傷または他の化学損傷)を防ぐことが可能な分子が含まれる。一部の特定の例としては、ビタミンC、ビタミンE誘導体、フェノール酸、ポリフェノール、ならびにその誘導体およびアナログなどの抗酸化剤が挙げられる。用語「保護部分」を定義するある文脈では、それは、保護部分の1つまたは複数の官能基と、本明細書で記載するリンカーの対応する官能基の間の反応により生じる部分を指す。例えば、保護部分が「没食子酸」である場合、それは遊離カルボキシル基を有する没食子酸自体ではなく、没食子酸のアミドおよびエステルを指し得る。
【0087】
検出可能標識
本明細書で記載する一部の実施形態は、従来の検出可能標識の使用に関する。検出は、蛍光分光法を含む任意の適切な方法または他の光学的方法により行うことが可能である。好適な標識はフルオロフォアであり、これはエネルギーの吸収後、定義された波長で放射線を発する。多くの適切な蛍光標識が知られている。例えば、Welch et al.(Chem. Eur. J. 5(3):951-960, 1999)は、本発明で用いることが可能なダンシル官能化(dansyl-functionalised)蛍光部分を開示する。Zhu et al.(Cytometry 28:206-211, 1997)は蛍光標識Cy3およびCy5の使用を記載し、これも本発明で用いることが可能である。使用に適した標識はまた、Prober et al. (Science238:336-341, 1987);Connell et al. (BioTechniques 5(4):342-384, 1987)、Ansorge et al. (Nucl. Acids Res. 15(11):4593-4602, 1987)、およびSmith et al. (Nature 321:674, 1986)に開示されている。他の商業的に利用可能な蛍光標識としては、限定されるわけではないが、フルオレセイン、ローダミン(TMR、texas red(登録商標)およびRoxを含む)、アレクサ、ボディピー(bodipy)、アクリジン、クマリン、ピレン、ベンゾアントラセン、およびシアニンが挙げられる。
【0088】
多数の標識、例えば、bi-fluorophore FRET cassette(Tet. Let. 46:8867-8871, 2000)を本出願で用いることも可能である。Multi-fluor dendrimeric system(J. Am. Chem. Soc. 123:8101-8108, 2001)も用いることが可能である。蛍光標識が好ましいが、他の形態の検出可能標識が有用であることが当業者には明らかであろう。例えば、量子ドット(Empodocles et al., Nature 399:126-130, 1999)、金ナノ粒子(Reichert et al., Anal. Chem. 72:6025-6029, 2000)、およびマイクロビーズ(Lacoste et al., Proc. Natl. Acad. Sci USA97(17):9461-9466, 2000)などの微粒子も全て用いることが可能である。
【0089】
多成分標識も本出願で用いることが可能である。多成分標識は、検出用のさらなる化合物との相互作用に依存するものである。生物学で用いる最も一般的な多成分標識は、ビオチン−ストレプトアビジンシステムである。ビオチンは、ヌクレオチド塩基に結合する標識として使用される。ストレプトアビジンは次に別途加えられ、検出を実行可能にする。他の多成分システムも利用可能である。例えば、ジニトロフェノールは、検出に用いることが可能である商業的に利用可能な蛍光抗体を有する。
【0090】
別段の指示がない限り、ヌクレオチドへの言及はまた、ヌクレオシドに適用可能であることを意図する。本出願はまた、DNAに関連してさらに記載されるだろうが、該記載も別段の指示がない限りRNA、PNA、および他の核酸に適用可能であろう。
【0091】
シーケンシング法
本明細書で記載するヌクレオシドまたはヌクレオチドは、種々のシーケンシング技法と共に用いることが可能である。一部の実施形態において、標的核酸のヌクレオチド配列を決定するプロセスは、自動化プロセスとすることが可能である。
【0092】
本明細書で提示するヌクレオチドアナログは、sequencing-by-synthesis(SBS)法などのシーケンシング手順で用いることが可能である。簡潔に言えば、SBSは、標的核酸を1つまたは複数の標識ヌクレオチド、DNAポリメラーゼなどに接触させることにより開始することが可能である。標的核酸を鋳型として用いてプライマーを伸長させる場所であるそれらのフィーチャが、検出可能な標識ヌクレオチドを取り込むだろう。オプションとして、標識ヌクレオチドはさらに、ヌクレオチドをプライマーにいったん加えたらさらなるプライマーの伸長を終了させる、可逆的終了特性を備えることが可能である。例えば、可逆的ターミネーター部分を有するヌクレオチドアナログを、非ブロック化剤を送達して該部分を取り除くまで後続の伸長が起き得ないように、プライマーに加えることが可能である。したがって、可逆的終了を用いる実施形態では、非ブロック化試薬をフローセルに(検出実行の前後で)送達することが可能である。洗浄は種々の送達ステップの間で行うことが可能である。サイクルをその後n回繰り返してプライマーをnヌクレオチド分伸長させ、それにより長さnの配列を検出することが可能である。本開示の方法により生成されるアレイと共に使用するのに容易に適合させることが可能な、例示的なSBS手順、流体システム、および検出プラットフォームは、例えば、Bentley et al., Nature 456:53-59 (2008)、国際公開第04/018497号;同第91/06678号;同第07/123744号;米国特許第7057026号明細書;同第7329492号明細書;同第7211414号明細書;同第7315019号明細書、または同第7405281号明細書、および米国特許出願公開第2008/0108082号明細書に記載されており、これらはそれぞれ参照により本明細書に組み込まれる。
【0093】
パイロシーケンシングなど、サイクル性反応を用いる他のシーケンシング手順を用いることが可能である。パイロシーケンシングは、特定のヌクレオチドが新生核酸鎖に取り込まれる際の無機ピロリン酸(PPi)の放出を検出する(Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996);Ronaghi, Genome Res. 11(1), 3-11 (2001);Ronaghi et al. Science 281(5375), 363 (1998);米国特許第6210891号明細書;同第6258568号明細書、および同第6274320号明細書(これらはそれぞれ参照により本明細書に組み込まれる))。パイロシーケンシングでは、放出されたPPiは、ATPスルフリラーゼによりアデノシン三リン酸(ATP)に変換されることにより検出することが可能であり、結果として生じるATPは、ルシフェラーゼ生成光子を介して検出することが可能である。したがって、シーケンシング反応は、発光検出システムを介してモニタリングすることが可能である。蛍光に基づく検出システムに用いられる励起放射線源は、パイロシーケンシング手順に必要ではない。本開示のアレイへのパイロシーケンシングの適用に用いることが可能な、有用な流体システム、検出器、および手順は、例えば、WIPO特許出願番号PCT/US11/57111、米国特許出願公開第2005/0191698号明細書、米国特許第7595883号明細書、および同第7244559号明細書に開示されており、これらはそれぞれ参照により本明細書に組み込まれる。
【0094】
例えば、Shendure et al. Science 309:1728-1732 (2005);米国特許第5599675号明細書;および同第5750341号明細書(これらはそれぞれ参照により本明細書に組み込まれる)に記載されているものを含む、sequencing-by-ligation反応も有用である。一部の実施形態は、例えばBains et al., Journal of Theoretical Biology135(3), 303-7 (1988);Drmanac et al., Nature Biotechnology 16, 54-58 (1998);Fodor et al., Science251(4995), 767-773 (1995);および国際公開第1989/10977号(これらはそれぞれ参照により本明細書に組み込まれる)に記載されているsequencing-by-hybridization手順を含み得る。sequencing-by-ligationとsequencing-by-hybridizationの手順の両方で、ゲル含有ウェル(または他の凹状フィーチャ)に存在する核酸を、オリゴヌクレオチド送達および検出の反復サイクルにかける。本明細書で記載する、または本明細書に引用する参考文献におけるSBS法のための流体システムは、sequencing-by-ligationまたはsequencing-by-hybridizationの手順のための試薬の送達に、容易に適合させることが可能である。典型的には、オリゴヌクレオチドは蛍光標識され、本明細書または本明細書で引用する参考文献でSBS手順に関し記載されたものと同様に、蛍光検出器を用いて検出することが可能である。
【0095】
一部の実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することが可能である。例えば、ヌクレオチドの取り込みは、フルオロフォア担持ポリメラーゼとγ-リン酸標識ヌクレオチドの間の蛍光共鳴エネルギー転移(FRET)相互反応を介して、または、ゼロモード波長を用いて検出することが可能である。FRETに基づくシーケンシングのための技法および試薬は、例えば、Levene et al. Science 299, 682-686 (2003);Lundquist et al. Opt. Lett.33, 1026-1028 (2008);Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)に記載されており、これらの開示は参照により本明細書に組み込まれる。
【0096】
一部のSBS実施形態には、ヌクレオチドの伸長生成物への取り込み時に放出される光子の検出を含む。例えば、放出光子の検出に基づくシーケンシングは、Ion Torrent社(コネチカット州ギルフォード、a Life Technologies社の子会社)から商業的に利用可能な電気検出器および関連技法、または、米国特許出願公開第2009/0026082号明細書;同第2009/0127589号明細書;同第2010/0137143号明細書;または同第2010/0282617号明細書(これらはそれぞれ参照により本明細書に組み込まれる)に記載されているシーケンシング法およびシステムを用いることが可能である。
【0097】
例示的な修飾リンカー
追加の実施形態が以下の例においてさらに詳細に開示されるが、これは特許請求の範囲を限定することを意図するものでは決してない。
【0098】
図1Aは、標識ヌクレオチド100の部分構造式を示す。標識ヌクレオチド100は、完全機能性アデノシンヌクレオチド(ffA)110、標準リンカー部115、および蛍光色素120を含む。標準リンカー部115は、sequencing-by-synthesis(SBS)用の標識ヌクレオチドの合成で典型的に用いられるリンカー部とすることができる。一例では、蛍光色素120はNR550S0である。この例では、標識ヌクレオチド100は「ffA-NR550S0」と記載することができる。別の例では、蛍光色素120はSO7181であり、標識ヌクレオチド100は「ffA-SO7181」と記載することができる。
【0099】
図1Bは、標準リンカー部115に対し2つの実現可能な構造修飾を有する、
図1Aの標識ヌクレオチド100を示す。一例では、標準リンカー部115は、アミド部のカルボニル(つまり、-C(=O)-)とアミノ(つまり、-NH-)部の間にAEDI挿入125を含む。この例では、修飾標識ヌクレオチドは「ffA-AEDI-NR550S0」と記載することができる。別の例では、標準リンカー部115はSS挿入130を含み、該修飾標識ヌクレオチドは「ffA-SS-NR550S0」と指定することができる。
【0100】
図2は、
図1Aの標識ヌクレオチド100と
図1Bの修飾標識ヌクレオチド100を用いた、ヌクレオチド取り込み速度のグラフを示す。アッセイを55℃で、40mMのエタノールアミン(pH9.8)、9mMのMgCl、40mMのNaCl、1mMのEDTA、20nMのプライマー:鋳型DNAおよび30μg/mLのポリメラーゼ812(MiSeqキットV2)を有する0.2% CHAPS、1mMのヌクレオチドにおいて実行した。酵素をDNAに結合し、次に、短時間(最大10秒)クエンチフローマシンにおいてヌクレオチドと急速に混ぜてから500mMのEDTAでクエンチする。いくつかの時点を各ヌクレオチドについてとる。生成したサンプルを次に変性ゲル上で分析し、DNA+1に変換されたDNAのパーセンテージを求め、時間に対しプロットして、各ヌクレオチドについて一次速度定数を求める。データを下記表1に集計する。データは、SS挿入130を含む標識ヌクレオチド(ffa-SS-NR550S0)の取り込み速度が、標準リンカー115を含む標識ヌクレオチド(ffa-NR550S0)の取り込み速度と比較し約2倍速かったことを示す。AEDI挿入125を含む標識ヌクレオチド(ffa-AEDI-NR550S0)の取り込み速度は、ffa-NR550S0の取り込み速度と比較し約4倍速かった。データはまた、標準リンカー115および蛍光色素SO7181を含む標識ヌクレオチド(ffA-SO7181)の取り込み速度が、ffa-NR550S0の取り込み速度と比較し約4倍速かったことを示す。
【0102】
図3A〜3Fは、
図1Aの標準リンカー部115に対する追加挿入310、315、320、325、330、および335の構造式を示す。ACA挿入310では、挿入125と比較して、ジメチル置換基を取り除き、硫黄−硫黄(S-S)結合を炭素−炭素結合に交換する。硫黄−硫黄結合はSBS(例えば、2色素SBSまたは4色素SBS)に必要ではない。
【0103】
AcLys挿入315では、アセチルに保護されたリシンを用いて挿入125を交換する。
【0104】
BocLys挿入320では、tert-ブトキシカルボニルに保護されたリシンを用いて挿入125を交換する。
【0105】
dMeO挿入325では、挿入125と比較し、硫黄-硫黄(S-S)結合を酸素−炭素(O-CH
2)結合と交換する。
【0106】
dMeS挿入330では、挿入125と比較し、硫黄−硫黄(S-S)結合を硫黄−炭素(S-CH
2)結合と交換する。
【0107】
DMP挿入335では、挿入125と比較し、硫黄−硫黄(S-S)結合を硫黄−炭素(CH
2)結合と交換する。
【0108】
本明細書に記載する種々の例において、ジメチル置換パターンを含む挿入(例えば、AEDI挿入125、dMeO挿入325、およびdMeS挿入330)では、SBS中のヌクレオチド取り込み速度が速いことが分かった。
【0109】
本明細書に記載する種々の例において、挿入における炭素鎖の長さはまた、変えることができる。
【0110】
図4は、
図1BのAEDI挿入125および
図3BのAcLys挿入315のシーケンシングの質に対する効果を評価するために用いた、2色素シーケンシングランについてのデータ表を示す。シーケンシングを、ヒト550bp鋳型を用いて2回150サイクルでMiseqハイブリッドプラットフォーム上を走らせた。新しい色素セット、V10/cyan-peg4 A-AEDI550S0、V10/cyan-peg4 A-AcLys550S0、およびV10/cyan A-AcLys 550S0を、標準的な商業的色素セットV4およびNova platform V5.75の改良色素セットと比較した。V10/cyan-peg4 A-AEDI550S0サンプル、V10/cyan-peg4 A-AcLys550S0サンプル、およびV10/cyan A-AcLys 550S0サンプルのそれぞれについて、フェージング値(Ph R1)は、AEDI挿入およびAcLys挿入のないサンプルのフェージング値よりも低かった。そのため、追加的な挿入125および挿入315を含む標識ヌクレオチドは、シーケンシングの質の向上を示した。
【0111】
図5Aおよび5Bは、それぞれ、
図4のシーケンシングランの、リード1の誤り率のグラフおよびリード2の誤り率のグラフを示す。リード1では、V10/cyan-peg4 A-AEDI550S0およびV10/cyan-peg4 A-AcLys550S0の誤り率は、挿入のない、色素V10/Cyan-peg4の同様のセットよりも低かった。リード2では、AcLys挿入315を用いる場合がさらに顕著であり、最終誤り率は、挿入なし色素セットに比べ30%減った。そのため、挿入125および挿入315は、シーケンシングの質を著しく向上させることが分かった。
【0112】
図6は、AEDI挿入125およびACA挿入310のシーケンシングの質に対する効果を評価するために用いた、シーケンシングランのデータ表を示す。シーケンシングを、ヒト550bp鋳型を用いて2回150サイクルでMiseqハイブリッドプラットフォーム上を走らせた。新しい色素セット、V10/cyan-peg4 A-AEDI550S0、V10/cyan-peg4 A-ACALys550S0を、標準的な商業的色素セットV4およびNova platform V5.75の改良色素セットと比較した。ここでも、V10/cyan-peg4 A-AEDI550S0サンプルおよびV10/cyan-peg4 A-ACA550S0サンプルそれぞれのフェージング値(Ph R1)は、AEDI挿入およびACA挿入のないサンプルと比較して低く、したがって、シーケンシングの質の向上を示した。
【0113】
図7Aおよび7Bはそれぞれ、
図6のシーケンシングランの、リード1の誤り率のグラフ、および、リード2の誤り率のグラフを示す。新しい挿入AEDI(V10/cyan-peg4 A-AEDI550S0)を含むセットでのリード1の誤り率は、挿入のない色素、V10/Cyan-peg4の同様のセットよりも低かった。挿入ACA(V10/Cyan-peg4 ACA550S0)は、標準的V10/Cyan-peg4に、両リードにおける類似の誤り率グラフを提供した。AEDIは再びシーケンシングの質の向上を示した。これらのデータはまた、挿入の構造自体がシーケンシングの質の向上に影響を与えることを示した。
【0114】
図8Aは、標準LN
3リンカー800の構造式を示す。LN
3リンカー800は、第1置換アミド官能部分810、第2アジド置換PEG官能部分815、および第3エステル官能部分820を含み、これらは色素分子825をヌクレオチド830に連結するためのリンカー構造であることが望まれ得る。第1官能部分810は、例えば、色素分子825をLN
3リンカー800に結合するために用いることができる。第2官能基815は、例えば、色素分子825をLN
3リンカー800から切断するために用いることができる、切断可能官能基である。第3官能部分820は、例えば、ヌクレオチド830をLN
3リンカー800に結合するために用いることができる。
図8Bは標準LN
3リンカー800に対する一部の修飾を示し、ここではフェノキシ部分850が、-NO
2、-CN、ハロ、または-SO
3Hから選択される1〜4個の置換基で置換されている。加えて、エステル部分820は、アミド部分855と交換されている。
【0115】
図9Aは、SSリンカーを有するffAにおける不純物の出現を示すグラフである。HPLC精製後のffA-SS-NR550S0で、不純物は微塩基性条件(pH8〜9)において一晩で出現した。0.1MのTEAB/CH3CNにおいて室温で一晩。
図9Bは、SSリンカーを有するffAとAEDIリンカーを有するffAの安定性を比較するものであり、AEDIリンカーがSSリンカーに比べ著しく向上した安定性を示す。ffA-LN3-NR550S0を内部基準として用いた。ジスルフィド副生成物:(NR550S0-S-)2。
図9Cは、22時間IMX 60°におけるSSリンカーffAとAEDIリンカーffAの比較を示し、ここでもSSリンカーで不純物が示される。内部管理はffA-LN3-NR550S0である。Di-P:二リン酸。
【0116】
図10A、10B、および10Cは、リンカーを変えた溶液におけるヌクレオチド取り込みスピードの予期せぬ増加を示す。
図Aは1μMにおける取り込み速度を示す。結果は、色素およびリンカーが、取り込みキネティクスに著しい影響を与えることを示し、表10Bは取り込みキネティクスにおけるAEDIリンカーの利点を明確に示す。
図10Cは、NR550S0と共にAEDIリンカーおよびSSリンカーを図式的に示す。
【0117】
図11Aは、異なるA-550S0(同じ濃度)を有するV10組み合わせについての散布図を示す。散布図は、タイル1、サイクル2である。
図11Bは溶液中のKcat FFAリンカーを示す。表面において、取込み速度の点で、AEDIリンカーはリンカーなしよりも速いことが分かる:(散布図の)「A」クラウドが中央にわずかに寄っている。AcLysリンカーはAEDIやリンカーなしより遅い:「A」クラウドがx軸に寄っている。BocLysリンカーはリンカーなしに似ており、AEDIリンカーから遠くはない。溶液では、ACAリンカーが最も遅い一方、AEDIとACLyのKcatは類似しており、BocLysがそれに続くことが分かる。
【0118】
図12Aおよび12Bは、M111、ヒト550、2x151サイクルでのシーケンシング基準を示す。異なるA-550S0(同じ濃度)と組み合わせたffNの使用。AEDIリンカーおよびBocLysリンカーの両方が、類似した良好なシーケンシング結果を提供することが分かる。AEDIおよびAcLysの溶液Kcatは類似しているが、AEDIのシーケンシング結果のほうがわずかに良い。
【0119】
LN
3リンカー800はオプションのフェノキシ部分835を含み、これは
図8Cに示すようにLN
3リンカー800から取り除くことができる。LN
3リンカー800はまた、オプションのアミド部分840およびオプションのエーテル部分845を含み、これは両方とも
図8Dに示すようにLN
3リンカー800から取り除くことができる。アミド部分810、フェノキシ部分835のようなある官能基を取り除く目的は、それらがヌクレオチドの取り込み中に、取込み効率を低減する可能性がある酵素との否定的な相互作用を有するか否かをテストするためである。
【0120】
図8Eは、保護部分860のリンカーへの挿入または追加を示す。保護部分860は、官能部分810と色素分子825の間に挿入される(または、
図8A〜8Cのフェノキシ部分835または850に結合することが可能である)。保護部分860は例えば、DNA損傷を防ぐ分子とすることができる。光損傷または他の化学損傷を含むDNA損傷は、SBSの累積的影響(つまり、サイクルごと)の一つである。DNA損傷を実質的に低減するまたは除去することは、より効率的なSBSおよびより長いシーケンシングリードを提供することができる。一部の実施形態において、保護部分860は、トロロックス、没食子酸、2-メルカプトエタノール(BME)などといった三重項状態のクエンチャから選択することが可能である。一部の他の実施形態において、保護部分860は、4-ニトロベンジルアルコール、またはアスコルビン酸ナトリウムなどのアスコルビン酸の塩といった、クエンチング試薬または保護試薬から選択することが可能である。一部の他の実施形態において、保護剤は、標識したヌクレオシドまたはヌクレオチドと共有結合を形成させるのではなく、緩衝液に物理的に混ぜることが可能である。しかしながら、このアプローチはより高い濃度の保護剤を必要とし、効率性が落ち得る。代替として、ヌクレオシドまたはヌクレオチドに共有結合した保護部分が、DNA損傷をよりうまく防ぐことができる。
図8C、8D、および8Eの一部のさらなる実施形態において、エステル部分821はまた、アミド部分855と交換することが可能であり、フェノキシ部分835はさらに置換することが可能である。
【0121】
図8A〜8Eに示す任意の例において、
図1BのAEDI挿入125およびSS挿入130、ならびに
図3A〜3Fの挿入300は、例えば、リンカー800の第1官能部分810および色素部分825の間に挿入され得る。
【実施例】
【0122】
例
追加の実施形態を以下の例においてさらに詳細に開示するが、これは特許請求の範囲を限定することを意図するものでは決してない。
【0123】
ffA-LN3-AEDI-NR550S0を調製するための通常の反応手順:
【化15】
【0124】
50mLの丸底フラスコで、Boc-AEDI-OH(1g、3.4mmol)をDCM(15mL)に溶解し、TFA(1.3mL、17mL)を室温で溶液に加えた。反応混合物を2時間撹拌した。TLC(DCM:MeOH=9:1)は、Boc-AEDI-OHの完全な消費を示した。反応混合物を蒸発乾固させた。TEAB(2M、〜15mL)を次に残渣に加え、中性になるまでpHをモニタリングした。混合物を次にH
2O/CH
3CN(1:1、〜15mL)に溶解し、蒸発乾固させた。手順を3回繰り返し、余分なTEAB塩を取り除いた。白色固体残渣をCH
3CN(20mL)で処置し、0.5時間撹拌した。溶液を濾過し、固体をCH
3CNで洗浄し、純AEDI-OH-TFA塩を得た(530 mg、80%)。
1H NMR(400MHz、D
2O、δ(ppm));3.32(t、J=6.5 Hz、2H、NH
2-CH
2);2.97(t、J=6.5 Hz、2H、S-CH
2);1.53(s、6H、2x CH
3)。
13C NMR(400 MHz、D
2O、δ(ppm)):178.21(s、CO);127.91、117.71(2s、TFA);51.87(s、C-(CH
3)
2);37.76(t、CH
2-NH
2);34.23(t、S-CH
2);23.84(q、2x CH
3)。
19F NMR(400 MHz、D
2O, δ(ppm)):-75.64。
【0125】
50mLの丸底フラスコで、色素NR550S0(114mg、176μmol)をDMF(無水、20mL)に溶解し、蒸発乾固させた。手順を3回繰り返した。無水DMA(10mL)とヒューニッヒ塩基(92μL、528μmol、3当量)を次に丸底フラスコにピペットで移した。TSTU(69mg、228μmol、1.3当量)を一部に加えた。反応混合物を室温で保持した。30分後、TLC(CH
3CN:H
2O=85:15)分析が、反応が終了したことを示した。0.1M TEAB中のAEDI-OH(68mg、352μmol、2当量)を反応混合物に加え、室温で3時間撹拌した。TLC(CH
3CN:H
2O=8:2)は活性エステルの完全な消費を示し、赤い斑点が活性エステル下に出現した。一方、分析HPLCはまた、活性エステルの完全な消費および生成物の形成を示した。反応はTEAB緩衝液(0.1M、10mL)でクエンチし、揮発性溶媒は減圧蒸発により取り除き(HV)、Axiaカラムにおいて精製して、NR550S0-AEDI-OHを得た。収率:60%。
【0126】
25mLの丸底フラスコで、NR550S0-AEDI-OH(10μmol)をDMF(無水、5mL)に溶解し、蒸発乾固した。手順を3回繰り返した。無水DMA(5mL)およびDMAP(1.8mL、15μmol、1.5当量)を次に丸底フラスコに加えた。DSC(5.2mg、20μmol、2当量)を一部に加えた。反応混合物を室温で保持した、30分後、TLC(CH
3CN:H
2O=8:2)分析が、反応が終了したことを示した。ヒューニッヒ塩基(3.5μL、20μmol)を反応混合物にピペットで移した。次にpppA-LN
3(0.5mLのH
2O中に20μmol、2当量)とEt
3N(5μL)との溶液を反応混合物に加え、室温で一晩撹拌した。TLC(CH
3CN:H
2O=8:2)が活性エステルの完全な消費を示し、赤い斑点がベースライン上に出現した。一方、分析HPLCも活性エステルの完全な消費と最終生成物の形成を示した。反応はTEAB緩衝液(0.1M、10mL)でクエンチし、DEAE Sephadexカラム(25g Biotageカラム)に搭載した。カラムを下記表2に示すようにグラディエントで溶出した。
【0127】
A:0.1 M TEAB緩衝液(10% CH
3CN)
B:1 M TEAB緩衝液(10% CH
3CN)
【0128】
グラディエント:
【表2】
【0129】
所望の生成物を45%〜100%の1M TEAB緩衝液から溶出した。生成物を含有する断片を組み合わせ、蒸発させ、HPLC(YCLコラム、8mL/分)により精製した。収率:53%。
【0130】
要約すると、本発明は、リンカーを介してフルオロフォアに共有結合したヌクレオシドまたはヌクレオチドであって、前記リンカーは式Iもしくは式II、または両者の組み合わせの構造を含む、クレオシドまたはヌクレオチドに関し得る。
【0131】
【化16】
(式中、R
1およびR
2はそれぞれ独立して、水素または置換されていてもよいC
1-6アルキルから選択され;
R
3は、水素、置換されていてもよいC
1-6アルキル、-NR
5-C(=O)R
6、または-NR
7-C(=O)-OR
8から選択され;
R
4 は水素または置換されていてもよいC
1-6アルキルから選択され;
R
5 およびR
7はそれぞれ独立して、水素、置換されていてもよいC
1-6アルキル、置換されていてもよいフェニル、または置換されていてもよいC
7-12アラルキルから選択され;
R
6およびR
8はそれぞれ独立して、置換されていてもよいC
1-6アルキル、置換されていてもよいフェニル、置換されていてもよいC
7-12アラルキル、置換されていてもよいC
3-7シクロアルキル、または置換されていてもよい5〜10員ヘテロアリールから選択され;
【化17】
の各メチレン反復単位は置換されていてもよく;
Xはメチレン(CH
2)、酸素(O)、または硫黄(S)から選択され;
mは0〜20の整数であり;
nは1〜20の整数であり、
pは、フルオロフォアで標識したヌクレオシドまたはヌクレオチドが次の構造を持たない場合は、1〜20の整数である:
【化18】
【0132】
上記のヌクレオシドまたはヌクレオチドの一部の場合では、式Iの構造はまた、式Iaまたは式Ibで表される。
【0133】
【化19】
【0134】
さらに、式IIの構造は、式IIa、式IIb、式IIc、式IId、式IIe、または式IIfで表すこともできる。
【0135】
【化20】
【0136】
具体的には、本発明は、リンカーを介してフルオロフォアに共有結合したヌクレオシドまたはヌクレオチドであって、前記リンカーは式Iもしくは式II、または両者の組み合わせの構造を含む、ヌクレオシドまたはヌクレオチドに関し得る。
【0137】
【化21】
(式中、R
1は置換されていてもよいC
1-6アルキルから選択され;
R
2は水素または置換されていてもよいC
1-6アルキルから選択され;
R
3は、置換されていてもよいC
1-6アルキル、-NR
5-C(=O)R
6、または-NR
7-C(=O)-OR
8から選択され;
R
4 は水素または置換されていてもよいC
1-6アルキルから選択され;
R
5 およびR
7はそれぞれ独立して、水素、置換されていてもよいC
1-6アルキル、置換されていてもよいフェニル、または置換されていてもよいC
7-12アラルキルから選択され;
R
6およびR
8はそれぞれ独立して、置換されていてもよいC
1-6アルキル、置換されていてもよいフェニル、置換されていてもよいC
7-12アラルキル、置換されていてもよいC
3-7シクロアルキル、または置換されていてもよい5〜10員ヘテロアリールから選択され;
【化22】
の各メチレン反復単位は置換されていてもよく;
Xはメチレン(CH
2)、酸素(O)、または硫黄(S)から選択され;
mは0〜20の整数であり;
nは1〜20の整数であり、
pは、1〜20の整数である。)
【0138】
式Iの構造はまた、式Iaで表されることが好適である。
【0139】
【化23】
【0140】
さらに、式IIの構造は、式IIb、式IIc、式IId、式IIe、または式IIfでも表される。
【0141】
【化24】