(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-04
(45)【発行日】2022-10-13
(54)【発明の名称】3’保護ヌクレオチド
(51)【国際特許分類】
C07H 23/00 20060101AFI20221005BHJP
C07H 19/10 20060101ALI20221005BHJP
C07H 21/04 20060101ALI20221005BHJP
C07H 19/20 20060101ALI20221005BHJP
C12Q 1/6869 20180101ALI20221005BHJP
C12Q 1/6806 20180101ALI20221005BHJP
C12M 1/00 20060101ALI20221005BHJP
C12M 1/34 20060101ALI20221005BHJP
C12N 15/11 20060101ALN20221005BHJP
【FI】
C07H23/00
C07H19/10
C07H21/04 Z
C07H19/20
C12Q1/6869 Z
C12Q1/6806 Z
C12M1/00 A
C12M1/34 Z
C12N15/11 Z
(21)【出願番号】P 2021535596
(86)(22)【出願日】2019-12-16
(86)【国際出願番号】 US2019066670
(87)【国際公開番号】W WO2020131759
(87)【国際公開日】2020-06-25
【審査請求日】2021-07-28
(32)【優先日】2018-12-19
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】591003013
【氏名又は名称】エフ.ホフマン-ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN-LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100157923
【氏名又は名称】鶴喰 寿孝
(72)【発明者】
【氏名】ベルクマン,フランク
(72)【発明者】
【氏名】ハインドル,ディーター
(72)【発明者】
【氏名】クリサリ,ピーター
(72)【発明者】
【氏名】タイング,メング
(72)【発明者】
【氏名】カクショール,オミド
【審査官】三上 晶子
(56)【参考文献】
【文献】国際公開第2013/191793(WO,A1)
【文献】国際公開第2015/148402(WO,A1)
【文献】国際公開第2013/154999(WO,A2)
【文献】国際公開第2012/162429(WO,A2)
(58)【調査した分野】(Int.Cl.,DB名)
C07H 23/00
C07H 19/10
C07H 21/04
C07H 19/20
C12Q 1/6869
C12Q 1/6806
C12M 1/00
C12M 1/34
C12N 15/11
CAplus/REGISTRY(STN)
(57)【特許請求の範囲】
【請求項1】
式(IIIA):
【化1】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、互いに1、3に位置する2つの硫黄原子を含む5-~8-員のシクロアルキル基、または構造:
【化2】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、独立して、ゼロまたは1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない。〕のヌクレオチドまたはその塩。
【請求項2】
R
5が、
【化3】
である、請求項1に記載のヌクレオチド。
【請求項3】
R
1が、-C(O)-O-である、請求項1から2のいずれか一項に記載のヌクレオチド。
【請求項4】
R
1が、結合である、請求項1から2のいずれか一項に記載のヌクレオチド。
【請求項5】
R
1が、-CH
2-であり、R
5が、-B(OZ
1)(OZ
2)である、請求項1から2のいずれか一項に記載のヌクレオチド。
【請求項6】
式(I):
【化4】
〔式中、
Xは、核酸塩基または修飾核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
「保護基」は、構造を有し:
【化5】
(式中:
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;および
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。)〕、
のヌクレオチドまたはその塩。
【請求項7】
「保護基」が、-B(OZ
1)(OZ
2)である、請求項6に記載のヌクレオチド。
【請求項8】
Z
1およびZ
2が、独立して、H、メチルおよびエチルからなる群から選択される、請求項6に記載のヌクレオチド。
【請求項9】
「保護基」が、-B(OH)
2である、請求項6に記載のヌクレオチド。
【請求項10】
式(VA):
【化6】
〔式中、
Xは、核酸塩基または修飾核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
式中、Z
1およびZ
2は、独立して、HまたはC
1~C
4アルキル基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、ゼロまたは1~3の範囲の整数である。〕のヌクレオチドまたはその塩。
【請求項11】
Z
1またはZ
2のうちの少なくとも一方がHである、請求項10に記載のヌクレオチド。
【請求項12】
Z
1およびZ
2の両方がHである、請求項10に記載のヌクレオチド。
【請求項13】
R
1が、結合である、請求項10から11のいずれか一項に記載のヌクレオチド。
【請求項14】
R
1が-CH
2-であり、Z
1およびZ
2の両方がHである、請求項10に記載のヌクレオチド。
【請求項15】
ナノポアを使用して核酸サンプルを配列決定する方法であって:
(a)ナノポアに結合した単一のポリメラーゼを用いて重合反応を実行することであって、重合反応は、核酸サンプルに由来する一本鎖核酸分子に相補的な成長中のポリヌクレオチド鎖に少なくとも4つの異なる3’保護ヌクレオチドの1つを組み込み、少なくとも4つの異なる3’保護ヌクレオチドの個々の3’保護ヌクレオチドは、構造:
【化7】
(式中:
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;および
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。)を有する部分を含むブロッキング基を含む、重合反応を実行することと;
(b)ナノポアを使用して、成長中のポリヌクレオチド鎖への3’保護ヌクレオチドまたはその副生成物の組み込みを検出することと;
(c)3’保護ヌクレオチドまたはその副生成物の組み込みを検出するステップと同時に、または、その後のいずれかで、3’保護ヌクレオチドを脱保護して、3’脱保護ヌクレオチドを提供することと、
を含む、方法。
【請求項16】
核酸分子を配列決定するための方法であって:
(a)複数の個別にアドレス指定可能なナノポアを含むチップを取得することであって、複数の個別にアドレス指定可能なナノポアのうちの各個別にアドレス指定可能なナノポアは、電極に隣接して配置された膜内のナノポアを含み、ナノポアは酵素に連結されており、各個別にアドレス指定可能なナノポアは、3’保護ヌクレオチドから放出される標識を検出するように適合されており、3’保護ヌクレオチドは、式(IIIA):
【化8】
〔式中、
Xは、標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化9】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であ;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、独立して、ゼロまたは1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジド基ではない。〕、
によって具体化される、取得することと;
(b)ナノポアに隣接または近接して核酸分子を方向付けることと;
(c)酵素を使用して、核酸分子の少なくとも一部に相補的なポリヌクレオチド鎖を生成するために、核酸分子に沿って3’保護ヌクレオチドを重合することと;
(d)ポリヌクレオチド鎖に3’保護ヌクレオチドを組み込んだ後、3’保護ヌクレオチドを脱保護することと;
(e)電極を使用して3’保護ヌクレオチドから放出された標識を検出することであって、放出された標識はナノポアを通ってまたはナノポアに近接して流れる、検出することと、
を含み、
ステップ(d)および(e)は、任意の順序で実行することができる、方法。
【請求項17】
ナノポアを使用して核酸サンプルを配列決定する方法であって:(a)ナノポアに結合した単一のポリメラーゼを用いて重合反応を実行することであって、重合反応は、請求項1から14のいずれか一項に記載の保護ヌクレオチドの少なくとも一つを、核酸サンプルに由来する一本鎖核酸分子に相補的な成長中のポリヌクレオチド鎖に組み込む、実行することと、ナノポアを使用して、成長中のポリヌクレオチド鎖への、少なくとも一つの保護ヌクレオチドまたはその副生成物の組み込みを検出することと、保護ヌクレオチドまたはその副生成物の組み込みを検出するステップと同時に、またはその後に、保護ヌクレオチドを脱保護して、3’脱保護ヌクレオチドを提供することと、を含む、方法。
【請求項18】
(a)
(i)少なくとも約250ウェル/mm2の密度で複数のウェルを有する半導体基板;および
(ii)複数のウェルのそれぞれに配置された電極、
を含むバイオチップと;
(b)請求項1から14のいずれか一項に記載のヌクレオチドの少なくとも一つと、
を含む、キット。
【請求項19】
(a)請求項1から14のいずれか一項に記載のヌクレオチドの少なくとも一つを含むリザーバと;
(b)
(iii)少なくとも約250ウェル/mm
2の密度で複数のウェルを有する半導体基板;および
(iv)複数のウェルのそれぞれに配置された電極、
を含むバイオチップと;
(c)リザーバのバイオチップに面する表面上に配置された対電極と、
を含む、アッセンブリ。
【請求項20】
【化10-1】
【化10-2】
〔式中:
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;および
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。〕、
からなる群から選択される、ヌクレオチドまたはその塩。
【請求項21】
【化11】
〔式中:
Xは、核酸塩基または標識化核酸塩基であり;および
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。〕、
からなる群から選択される、ヌクレオチドまたはその塩。
【請求項22】
【化12】
〔式中:
Xは、核酸塩基または標識化核酸塩基であり;および
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。〕、
からなる群から選択される、ヌクレオチドまたはその塩。
【請求項23】
請求項20から22のいずれか一項に記載の少なくとも2つの異なるヌクレオチドを含み、該少なくとも2つの異なるヌクレオチドはそれぞれ、異なる標識化核酸塩基を含む、キット。
【請求項24】
式(VIIIA)または(VIIID):
【化13】
または
〔式中、
R
15は核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数であり;
「保護基」は、次の構造を有し:
【化14】
「リンカー」は、1個と50個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基または芳香族基であり;および
「標識
-リンカー-R
15
」は
標識化核酸塩基であり、
「スペーサー」は、1個と16個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基または芳香族基であり;
「ブロッキング部分」は、1個と20個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基または芳香族基であり、ただし、「ブロッキング部分」は、アジド基、イソニトリル基、O、N、S、またはSeから選択される少なくとも1つのヘテロ原子を有する5-~8-員のヘテロシクロアルキル基、置換または非置換の1,4-エポキシ-1,4-ジヒドロナフタレン由来の部分、または構造:
【化15】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;および
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。)を含み;
ただし、「ブロッキング部分」が-N
3である場合、「スペーサー」は-CH
2-ではない。〕、
のいずれか一つを有するヌクレオチドまたはその塩。
【請求項25】
合成による配列決定を使用して標的一本鎖ポリヌクレオチドの配列を決定するための方法であって:(a)請求項1から14、20から22、および24のいずれか一項に記載の保護標識化ヌクレオチドを提供することと;(b)保護標識化ヌクレオチドを標的一本鎖ポリヌクレオチドの補体に組み込むことと;(c)ステップ(b)の保護標識化ヌクレオチドの標識を検出し、それによって組み込まれたヌクレオチドのタイプを決定する、標識を検出することと;(d)組み込まれた保護標識化ヌクレオチドを脱保護し、ステップ(b)の保護標識化ヌクレオチドの標識を除去することと;(e)任意選択的に、ステップ(b)~(d)を1回または複数回繰り返すこととを含み、それにより、標的一本鎖ポリヌクレオチドの配列を決定する、方法。
【請求項26】
式(IIIA):
【化16】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2が、Hであり:
R
3は、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化17】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。);
を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、ゼロまたは1~3の範囲の整数であ
る。〕のヌクレオチドまたはその塩。
【請求項27】
式(IIIA):
【化18】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、独立して、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化19】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基または ヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、ゼロまたは1~3の範囲の整数であ
る。〕のヌクレオチドまたはその塩。
【請求項28】
式(IIIA):
【化20】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化21】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、ゼロまたは1~3の範囲の整数であ
る。〕のヌクレオチドまたはその塩。
【請求項29】
式(IIIA):
【化22】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、
【化23】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。))であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基または ヘテロ芳香族基であり;
nは0または1~3の範囲の整数であり;および
pおよびqは、独立して、ゼロまたは1~3の範囲の整数であ
る。〕のヌクレオチドまたはその塩。
【請求項30】
合成による配列決定を使用して標的一本鎖ポリヌクレオチドの配列を決定するための方法であって:(a)請求項1から14、20から22、24、および26から29のいずれか一項に記載の保護標識化ヌクレオチドを提供することと;(b)保護標識化ヌクレオチドを標的一本鎖ポリヌクレオチドの補体に組み込むことと;(c)ステップ(b)の保護標識化ヌクレオチドの標識を検出し、それによって、組み込まれたヌクレオチドのタイプを決定することと;(d)組み込まれた保護標識化ヌクレオチドを脱保護し、ステップ(b)の保護標識化ヌクレオチドの標識を除去することと;(e)任意選択的に、ステップ(b)~(d)を1回または複数回繰り返すこととを含み、それにより、標的一本鎖ポリヌクレオチドの配列を決定する、方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年4月4日に出願された米国特許仮出願第62/781,638号の利益を主張するものであり、その開示は参照によりその全体が本明細書に組み込まれている。
本開示は、概して、配列決定での使用に適した3’保護ヌクレオチドに関する。
【背景技術】
【0002】
DNAの配列決定の重要性は40年前の開始から劇的に高まっている。これは、生物学と医学のほとんどの分野で重要なテクノロジーとして、またパーソナライズされた精密医療の新しいパラダイムの基盤として認識されている。個人のゲノムとエピゲノムに関する情報は、疾患の傾向、臨床的予後、および治療への反応を明らかにするのに役立つが、医学におけるゲノム配列決定の日常的な適用には、タイムリーで費用効果の高い方法で提供される包括的なデータが必要である。
【0003】
ナノポアベースの核酸配列決定は、広く研究されてきたアプローチである。過去20年間で、ポリマーの特性評価や低コストで迅速な単一分子の方法でヌクレオチドを区別するためにナノポアを利用することに大きな関心が寄せられてきた。例えば、Kasianowicz等は、一本鎖ポリヌクレオチドを、脂質二重層に埋め込まれたアルファ溶血素ナノポアを介して電気的に移動するものとして特徴づけた(例えば、Kasianowicz, J. (1996), Characterization of Individual Polynucleotide Molecules using a Membrane Channel. Proc. Natl. Acad. Sci., 93, 13770-3参照)。ポリヌクレオチド転座の間、ナノポア開口の部分的閉塞は、イオン電流の減少として測定できることが実証された。同様に、Gundlach等は、Mycobacterium smegmatis(「MspA」)に由来する低ノイズのナノポアを二重中断配列決定と呼ばれるプロセスと組み合わせて使用したDNAの配列決定方法を示した(例えば、Derrington, I等の(2010), Nanopore DNA Sequencing with MspA. Proc. Natl. Acad. Sci., 107(37), 16060-16065参照)。 ここでは、二本鎖二本鎖を使用して、MspA狭窄部(MspA constriction)に核酸の一本鎖部分を一時的に保持させた。Akeson等(例えば、PCT公報、国際公開第20150344945号パンフレット参照)は、隣接して配置された分子モーターを利用して、ナノポアの開口部を通過する、またはナノポアの開口部に隣接するポリヌクレオチドの移動速度を制御する、ナノポア内のポリヌクレオチドを特徴付けるための方法を開示している。
【0004】
一般に、3つのナノポア配列決定アプローチが追求されてきた:DNAの塩基がナノポアを順次通過するときに識別されるストランド配列決定、ヌクレオチドが、DNA分子から1つずつ酵素的に切断され、ナノポアによって捕捉されて通過するときに監視される、エキソヌクレアーゼベースのナノポア配列決定、および識別可能なポリマー標識がヌクレオチドに付着し、酵素触媒DNA合成中にナノポアに登録される合成によるナノポア配列決定(SBS)アプローチ。これらすべての方法に共通するのは、各塩基が順番に決定されるように、反応速度を正確に制御する必要があることである。ストランド配列決定には、ナノポアを通るDNAの通過を遅くし、チャネル内の複数の塩基をデコードする方法が必要であり;この目的のために、分子モーターを利用したラチェットアプローチが開発された。エキソヌクレアーゼベースの配列決定では、有効なイオン電流信号を取得するのに十分遅い速度で、その捕捉と細孔を通過することを保証するために、細孔に十分近い各ヌクレオチドの放出が必要である。さらに、これらの方法は両方とも、4つの天然塩基、2つの比較的類似したプリンと2つの類似したピリミジンの違いに依存している。ナノポアSBSアプローチは、配列決定のためのユニークで容易に区別できるイオン電流遮断署名を生成するように特別に設計されたヌクレオチドに取り付けられた合成ポリマー標識を利用する。
【発明の概要】
【0005】
本開示の一態様は、式(IIIA):
【化1】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q-(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または構造:
【化2】
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立してH、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない(例えば、R
5はN
3ではない。)である。〕、
のヌクレオチドまたはその塩である。
【0006】
【0007】
いくつかの実施形態において、Z1またはZ2の少なくとも一方はHである。いくつかの実施形態において、R1は、結合であり、Z1またはZ2の少なくとも一方は、Hである。いくつかの実施形態において、R1は、-CH2-であり、Z1またはZ2の少なくとも一方はHである。いくつかの実施形態において、Z1およびZ2はHである。いくつかの実施形態においてR5は、-B(OH)2である。
【0008】
いくつかの実施形態において、R1は、結合である。いくつかの実施形態にいて、R1は結合であり、R4は結合である。いくつかの実施形態において、R1は結合であり、R4は結合であり、R2またはR3の少なくとも一方はHである。いくつかの実施形態において、R1は結合であり、R4は、6-員のアリール基である。いくつかの実施形態において、R1は結合であり、R4は、6-員のアリール基であり、R2またはR3の少なくとも一方はHである。いくつかの実施形態において、R1は、-C(O)-O-である。いくつかの実施形態において、R1は-C(O)-O-であり、R4は6-員のアリール基である。いくつかの実施形態において、6-員のアリール基は、少なくとも一つの置換基を含み、該少なくとも一つの置換基は、メチルおよびエチルからなる群から選択される。いくつかの実施形態において、R1は-C(O)-O-であり、R4は6-員のアリール基であり、R2またはR3の少なくとも一方は、Hである。いくつかの実施形態において、R1は結合であり、R4は-CH=CH-である。
【0009】
いくつかの実施形態において、R
5は、
【化4】
(式中、C
2~C
6は、置換または非置換であることができる、2~6個の炭素の飽和アルキル鎖を表す。)である。いくつかの実施形態において、R
1は結合であり、R
5は、
【化5】
(式中、C
2~C
6C
2~C
6は、置換または非置換であることができる、2~6個の炭素の飽和アルキル鎖を表す。)である。
【0010】
いくつかの実施形態において、R5は、-(C(Ra)(Rb))n-CNである。いくつかの実施形態において、R1は結合であり、R5は、-(C(Ra)(Rb))n-CNである。いくつかの実施形態において、R5は-(C(Ra)(Rb))n-N+C-である。いくつかの実施形態において、R1は結合であり、R5は-(C(Ra)(Rb))n-N+C-である。
【0011】
いくつかの実施形態において、R1は結合であり、R2は-[(C(Ra)(Rb))p-O]q--(Ra)または-C(O)-ORa(式中、少なくとも一つのRaは、C1~C6アルキル基である。)である。いくつかの実施形態において、R1は-C(O)-Rx-である。いくつかの実施形態において、R1は-C(O)-Rx-であり、R5は-(C(Ra)(Rb))n-N3である。いくつかの実施形態において、R5は、置換または非置換の1,4-エポキシ-1,4-ジヒドロナフタレンから誘導される。
【0012】
いくつかの実施形態において、R1は-CH2-であり、R5は、-B(OZ1)(OZ2)である。いくつかの実施形態において、Z1およびZ2は、独立して、H、メチルおよびエチルからなる群から選択される。いくつかの実施形態において、R1は-CH2-であり、R5は-B(OH)2である。いくつかの実施形態において、R1は-CH2-であり、R5は-B(OH)2である。
【0013】
本開示の別の態様は、式(I):
【化6】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
「保護基」は、構造:
【化7】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有し;および
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。〕、
のヌクレオチドまたはその塩である。
【0014】
いくつかの実施形態において、「保護基」は、-B(OZ1)(OZ2)である。いくつかの実施形態において、「保護基」は、-B(OZ1)(OZ2)(式中、Z1およびZ2は、独立して、C1~C4アルキル基から選択される。)である。いくつかの実施形態において、「保護基」は、-B(OMe)(OMe)である。いくつかの実施形態において、「保護基」は-B(OEt)(OEt)である。いくつかの実施形態において、「保護基」は-B(OZ1)(OH)である。いくつかの実施形態において、「保護基」は-B(OH)2である。いくつかの実施形態において、「保護基」は-B(OH)3
-である。
【0015】
本開示の別の態様は、式(IV):
【化8】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和C
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化9】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1が結合であり、R
2およびR
3がいずれもHである場合、R
5はアジドではない(例えば、R
5はN
3ではない。)である。〕、
のヌクレオチドまたはその塩である。
【0016】
いくつかの実施形態において、R5は、-B(OZ1)(OZ2)である。いくつかの実施形態において、R5は、-B(OZ1)(OZ2)(式中、Z1およびZ2は、独立して、C1~C4アルキル基から選択される。)である。いくつかの実施形態において、R5は、-B(OMe)(OMe)である。いくつかの実施形態において、R5は、-B(OEt)(OEt)である。いくつかの実施形態において、R5は、-B(OZ1)(OH)である。いくつかの実施形態において、R5は、-B(OH)2である。いくつかの実施形態において、「保護基」は-B(OH)3
-である。
【0017】
本開示の別の態様は、式(VA):
【化10】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和C
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数である。〕。
を有する、ヌクレオチドまたはその塩である。
【0018】
いくつかの実施形態において、Z1およびZ2は、独立して、メチルまたはエチルから選択される。いくつかの実施形態において、Z1およびZ2は、独立して、メチルまたはエチルから選択され、R1は結合である。いくつかの実施形態において、Z1およびZ2は、独立して、メチルまたはエチルから選択され、R1は結合であり、R2およびR3はHである。
【0019】
いくつかの実施形態において、Z1はHであり、Z2は、メチルまたはエチルから選択される。いくつかの実施形態において、Z1はHであり、Z2は、メチルまたはエチルから選択され、R1は結合である。いくつかの実施形態において、Z1はHであり、Z2は、独立して、メチルまたはエチルから選択され、R1は結合であり、R2およびR3はHである。
【0020】
本開示はまた、核酸配列を配列決定する方法を提供し、該方法は、ここに記載のヌクレオチドのいずれか(例えば、式(I)または(II)のいずれかのヌクレオチド)を利用する。いくつかの実施形態において、標的核酸またはそのフラグメントの一部のヌクレオチド配列は、様々な方法およびデバイスを使用して決定され得る。配列決定方法の非限定的な例には、電気泳動配列決定法、合成による配列決定法、ライゲーションによる配列決定法、ハイブリダイゼーションによる配列決定法、単一分子配列決定法、およびリアルタイム配列決定法が含まれる。
【0021】
本開示の別の態様は、標的一本鎖ポリヌクレオチドの配列を決定するための方法であり、相補的ヌクレオチドの連続的な取り込みを監視することを含み、相補的ヌクレオチドはそれぞれ、ここに記載されるように、式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれかの構造を有し;組み込まれた各相補的ヌクレオチドの同一性は、各相補的ヌクレオチドから放出された、またはそれらに付着した標識(例えば、検出可能な部分)の検出によって決定される。いくつかの実施形態において、標識は、式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれかの相補的ヌクレオチドの3’保護基を脱保護するために使用されるのと同じ条件下で、各相補的ヌクレオチドから放出される。いくつかの実施形態において、タグは、その検出後に切断によって放出される。いくつかの実施形態において、方法は、式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれかの少なくとも4つの異なる相補的ヌクレオチドを利用し、該少なくとも4つの異なる相補的ヌクレオチドはそれぞれ、異なる核酸塩基を有する。いくつかの実施形態において、標識は、相補的ヌクレオチドの核酸塩基に結合される。いくつかの実施形態において、少なくとも4つの異なる相補的ヌクレオチドのそれぞれは、異なる標識を有する。いくつかの実施形態において、少なくとも4つの異なる相補的ヌクレオチドのそれぞれは、異なるタグを有するが、少なくとも4つの異なる相補的ヌクレオチドのそれぞれは、同じ保護基、ブロッキング基、またはR5部分(ここにおける式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)で具体化されるようなそれらの基)を含む。
【0022】
本開示の別の態様は、核酸配列を配列決定する方法であって、(a)ナノポアに結合した単一のポリメラーゼ(例えば、DNAポリメラーゼまたはその変形体またはナノポアに結合されたその変異体)を使用して重合反応を実行することであって、重合反応は、核酸サンプルに由来する一本鎖核酸分子に相補的な成長中のポリヌクレオチド鎖に少なくとも4つの異なる3’保護ヌクレオチドの1つを組み込み、少なくとも4つの異なる3’保護ヌクレオチドの個々の3’保護ヌクレオチドは、構造:
【化11】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。〕、
を有する部分を含むブロック基を含む、重合反応を実行することと;
(b)ナノポアを使用して、成長中のポリヌクレオチド鎖への3’保護ヌクレオチドまたはその副生成物の組み込みを検出することと;(c)3’保護ヌクレオチドまたはその副生成物の組み込みを検出するステップと同時に、またはその後に、3’保護ヌクレオチドを脱保護して3’脱保護ヌクレオチドを提供することと、を含む。いくつかの実施形態において、少なくとも4つの異なる3’保護ヌクレオチドはそれぞれが異なる検出可能な部分を含む。いくつかの実施形態において、検出するステップは、少なくとも4つの異なる3’保護ヌクレオチドのそれぞれに関連する異なる検出可能な部分を検出することを含む。いくつかの実施形態において、方法は、少なくとも4つの異なる3’保護ヌクレオチドのそれぞれに関連する検出された標識をヌクレオチドのタイプと相関させることをさらに含む。いくつかの実施形態において、方法は、重合中に検出された標識の評価に基づいて、核酸分子の核酸配列を生成することをさらに含む。
いくつかの実施形態において、脱保護は、3’保護ヌクレオチドを酸化剤(例えば、過酸化水素)と接触させることを含む。いくつかの実施形態において、方法は、3’保護ヌクレオチドの脱保護の副生成物を検出することをさらに含む。
【0023】
本開示の別の態様は、ナノポアを使用して核酸配列を配列決定する方法であり、該方法は:(a)ナノポアに結合した単一のポリメラーゼ(例えば、DNAポリメラーゼまたはその変形体またはナノポアに結合されたその変異体)を使用して重合反応を実行することであって、重合反応は、核酸サンプルに由来する一本鎖核酸分子に相補的な成長中のポリヌクレオチド鎖に少なくとも4つの異なる3’保護ヌクレオチドの1つを組み込み、少なくとも4つの異なる3’保護ヌクレオチドの個々の3’保護ヌクレオチドは、ここに記載されている式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれかのヌクレオチドから選択される、重合反応を実行することと;(b)ナノポアを使用して、成長するポリヌクレオチド鎖への3’保護ヌクレオチドまたはその副生成物の組み込みを検出することと;(c)3’保護ヌクレオチドまたはそれに由来する副生成物の組み込みを検出するステップと同時に、またはその後に、3’脱保護ヌクレオチドを提供するために、3’保護ヌクレオチドを脱保護することと、を含む。
【0024】
本開示の別の態様は、ナノポアを使用して核酸配列を配列決定する方法であり、該方法は:(a)ナノポアに結合した単一の酵素(例えば、ポリメラーゼ)を使用して重合反応を実行することであって、重合反応は、核酸サンプルに由来する一本鎖核酸分子に相補的な成長中のポリヌクレオチド鎖に少なくとも4つの異なる3’保護ヌクレオチドの1つを組み込み、少なくとも4つの異なる3’保護ヌクレオチドの個々の3’保護ヌクレオチドは、構造:
【化12】
〔式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。〕、
を有する部分を含む保護基を含む、重合反応を実行することと;
(b)ナノポアを使用して、成長中のポリヌクレオチド鎖への3’保護ヌクレオチドの取り込みを検出することと;(c)3’保護基を脱保護し、3’保護ヌクレオチドから標識を切断して3’-OH基を提供する(すなわち、脱保護ヌクレオチドを提供する)ために、酸化剤を導入することと、を含む。いくつかの実施形態において、少なくとも4つの異なる3’保護ヌクレオチドはそれぞれが異なる標識を含む。いくつかの実施形態において、検出するステップは、少なくとも4つの異なる3’保護ヌクレオチドのそれぞれに関連する異なる標識を検出することを含む。いくつかの実施形態において、方法は、少なくとも4つの異なる3’保護ヌクレオチドのそれぞれに関連する検出された標識をヌクレオチドのタイプと相関させることをさらに含む。いくつかの実施形態において、方法は、重合中に検出された標識の評価に基づいて、核酸分子の核酸配列を生成することをさらに含む。いくつかの実施形態において、脱保護は、3’保護ヌクレオチドを酸化剤と接触させることを含む。いくつかの実施形態において、酸化剤は、過酸化水素、過ヨウ素酸ナトリウム、過塩素酸ナトリウム、ペルオキシ硝酸塩、または他の適切な酸化剤からなる群から選択される。
【0025】
本開示の別の態様は、ナノポアを使用して核酸配列を配列決定する方法であり、該方法は:(a)複数の個別にアドレス指定可能なナノポアを含むチップを取得することであって、複数の個別にアドレス指定可能なナノポアのうちの各個別にアドレス指定可能なナノポアは、電極に隣接して配置された膜内のナノポアを含み、ナノポアは酵素に連結されており、各個別にアドレス指定可能なナノポアは、3’保護ヌクレオチドから放出される標識を検出するように適合されており、3’保護ヌクレオチド(または、任意のその塩)は、式(IIIA):
【化13】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化14】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基である。)であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない(例えば、R
5はN
3ではない。)である。〕、
によって具体化される、取得することと;
(b)ナノポアに隣接または近接して核酸分子を方向付けることと;(c)核酸分子の少なくとも一部に相補的なポリヌクレオチド鎖を生成するために、酵素を使用して、核酸分子に沿って3’保護ヌクレオチドを重合することと;(d)3’保護ヌクレオチドをポリヌクレオチド鎖に組み込んだ後、3’保護ヌクレオチドの3’保護基を脱保護することと;(e)電極を使用して、3’保護ヌクレオチドから放出された標識を検出することであって、放出された標識は、ナノポアを通過するか、ナノポアに近接して流れる、検出することと、を含む。いくつかの実施形態において、標識は、3’保護ヌクレオチドの3’保護基の脱保護の前に放出される。いくつかの実施形態において、標識は、3’保護ヌクレオチドの脱保護と同時に放出される。いくつかの実施形態において、標識は、保護基の放出の前に脱保護される。いくつかの実施形態において、3’保護ヌクレオチドの脱保護のステップは、3’保護ヌクレオチドを酸化剤、例えば、過酸化水素と接触させることを含む。いくつかの実施形態において、同じ反応条件および/または試薬が、3’保護基の脱保護および標識の放出に使用される。
【0026】
本開示の別の態様は、キットであり:少なくとも約250ウェル/mm2の密度の複数のウェルを有する半導体基板を含むバイオチップと;複数のウェルのそれぞれに配置された電極と、ここに開示の式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれかの少なくとも一つのヌクレオチドと、を含む。いくつかの実施形態において、ヌクレオチドの少なくとも1つは、ボロン酸またはその誘導体または類似体に由来する部分を含む。いくつかの実施形態において、ウェルの密度は、少なくとも約500ウェル/mm2である。いくつかの実施形態において、ヌクレオチドの少なくとも1つは、検出可能な部分を含み、検出可能な部分は、切断可能なリンカーを介して核酸塩基に結合される。いくつかの実施形態において、切断可能なリンカーは、酸化剤を使用して切断され得る。いくつかの実施形態において、検出可能な部分は、オリゴヌクレオチド、オリゴペプチド、ポリペプチド、オリゴホスフェート、PEG基、および他の部分を含む。
【0027】
本開示の別の態様は、キットであり:(a)ここに開示の式(I)、(II)、(IIIA)-(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれか1つのヌクレオチドの少なくとも一つと;(b)酸化剤とを含む。いくつかの実施形態において、キットは塩基をさらに含む。いくつかの実施形態において式(I)、(II)、(IIIA)-(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれか1つのヌクレオチドの少なくとも一つは、第1の容器に提供され;酸化剤は、第2の容器に提供される。
【0028】
本開示の別の態様は、アッセンブリであり:リザーバであって、式(I)、(II)、(IIIA)~(IIID)、(IV)、(VA)~(VD)、または(VIIIA)~(VIIIF)のいずれか1つのヌクレオチドの少なくとも1つを含むリザーバと;少なくとも約250ウェル/mm2の密度の複数のウェルを有する半導体基板を含むバイオチップと;複数のウェルのそれぞれに配置された電極と;リザーバのバイオチップに面する表面に配置された対電極と、を含む。いくつかの実施形態において、ヌクレオチドの少なくとも1つは、ボロン酸またはその誘導体または類似体に由来する部分を含む。いくつかの実施形態において、リザーバは、ヌクレオチドの脱保護に由来する副生成物さらに含む。いくつかの実施形態において、副生成物は、ホウ酸またはその誘導体または類似体である。
【0029】
本開示の別の態様は、組成物であり:ポリヌクレオチド、ホウ酸またはその誘導体または類似体の少なくとも一つ、キノンメチド、アセタール、アルデヒド、アクリルアルデヒド、および4-メチレン-2,5-シクロヘキサジエン-1-オンを含む。いくつかの実施形態において、組成物は、式(VIA)のヌクレオチド(またはその塩)、または微量の式(VIA)のヌクレオチド(またはその塩)をさらに含む。
【0030】
本開示の別の態様は、ヌクレオチドまたはその塩であって、ヌクレオチドは、
【化15-1】
【化15-2】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;および
Z
1およびZ
2は、独立して、HまたはC
1~C
4アルキル基である。〕、
からなる群から選択される。
いくつかの実施形態において、Z
1およびZ
2は、独立して、H、メチルまたはエチルである。いくつかの実施形態において、Z
1またはZ
2の少なくとも一方はHである。
いくつかの実施形態において、ヌクレオチドまたはその塩は、エチレングリコールまたはエチレングリコールに由来するポリマー、アミノ酸、炭水化物、ペプチド、色素(フルオロフォアを含む)、化学発光化合物、mass標識、モノヌクレオチド、ジヌクレオチド、トリヌクレオチド、テトラヌクレオチド、ペンタヌクレオチド、ヘキサヌクレオチド、オリゴヌクレオチド、修飾オリゴヌクレオチド、脂肪族酸、芳香族酸、アルコール、チオール基、シアノ基、ニトロ基、アルキル基、アルケニル基、アルキニル基、アジド基、およびそれらの任意の組み合わせのうちの1つまたは複数からなる群から選択される標識を含む。いくつかの実施形態において、核酸塩基またはその塩は、PEGベースの標識を含む。いくつかの実施形態において、標識化核酸塩基は、切断可能なリンカーを含む。いくつかの実施形態において、切断可能なリンカーは、酸化剤(例えば、過酸化水素)で切断される。
【0031】
本開示の特徴の一般的な理解のために、図面を参照する。図面では、同一の要素を特定するために、全体を通して同様の参照符号が使用されている。
【図面の簡単な説明】
【0032】
【
図1】ポリマー-標識化ヌクレオチド(140)のナノポアによる単一分子DNAの配列決定を示す。4つのヌクレオチドはそれぞれ異なる標識を有する。ナノポア配列決定中に、ヌクレオチドの5’の末端リン酸を介して付着したこれらの標識は、一度に1つずつナノポア(130)に放出され、そこで固有の電流遮断署名(150)が生成される。
【
図2】ナノポアベースの配列決定チップ内のセル100の実施形態を示す。
【
図3A】保護ヌクレオチドを、成長中のポリヌクレオチド、例えば、本開示のいくつかの実施形態に従って配列決定される核酸鎖に相補的な成長中のポリヌクレオチドに酵素的に組み込むステップを示すフローチャートを提供する。
【
図3B】保護標識化ヌクレオチドを、成長中のポリヌクレオチド、例えば、本開示のいくつかの実施形態に従って配列決定される核酸鎖に相補的な成長中のポリヌクレオチドに酵素的に組み込むステップを示すフローチャートを提供する。
【
図4】標識がナノポアを通過することによって生成される信号の例を示す。
【
図5】保護ヌクレオチドを脱保護して、遊離の3’-OH基を有する脱保護ヌクレオチドを提供するためのスキームを示す。
【
図6】塩基-標識化ヌクレオチド類似体を使用したDNA伸長反応を示す。
【発明を実施するための形態】
【0033】
反対に明確に示されない限り、複数のステップまたは行為を含む本明細書において特許請求の範囲に記載される任意の方法において、方法のステップまたは行為の順序は、必ずしも方法のステップまたは行為が記載される順序に限定されないことも理解されたい。
【0034】
ここで使用される場合、単数形「a」、「an」、及び「the」は、文脈が別途明確に指示しない限り、複数の指示対象を含む。同様に、「または」という単語は、文脈が明確に別のことを示さない限り、「および」を含むことを意図している。「含む」という用語は、「AまたはBを含む」がA、B、またはAおよびBを含むことを意味するように、包括的に定義される。
【0035】
ここおよび特許請求の範囲で使用される場合、「または」は、上記で定義された「および/または」と同じ意味を有することを理解されたい。例えば、リスト内の項目を区切る場合、「または」または「および/または」は、包括的であると解釈されるものとし、すなわち、要素の数またはリストの少なくとも1つを含むが、複数、および必要に応じて追加のリストに記載されていない項目を含むと解釈される。「のうちの1つのみ」または「のうちの正確に1つ」、または特許請求の範囲で使用される場合、「からなる」など、反対に明確に示される用語のみは、数または要素のリストのうちの正確に1つの要素を含むことを指す。一般に、ここで使用される「または」という用語は、「いずれか」、「のうちの1つ」、「のうちの1つのみ」または「のうちの正確に1つ」など、排他性の用語が先行する場合にのみ、排他的な代替案(すなわち、「一方または他方であるが双方ではない」)を示すものとしてのみ解釈されるものとする。「から本質的になる」は、特許請求の範囲で使用される場合、特許法の分野で使用される通常の意味を有するものとする。
【0036】
ここで使用される場合、「含む、備える(comprising)」、「含む(including)」、「有する(having)」などの用語は、交換可能に使用され、同じ意味を有する。同様に、「含む、備える(comprises」、「含む(includes)」、「有する(has)」などは、交換可能に使用され、同じ意味を有する。具体的には、各用語は、「含む、備える(comprising)」という一般的な米国特許法の定義と一致して定義されているため、「少なくとも以下」を意味するオープンな用語として解釈され、また、追加の特徴、制限、態様などを除外しないように解釈される。したがって、例えば、「構成要素a、b、およびcを有するデバイス」は、デバイスが少なくとも構成要素a、b、およびcを含むことを意味する。同様に、文言:「ステップa、b、およびcを含む方法」は、その方法が少なくともステップa、b、およびcを含むことを意味する。さらに、ステップおよびプロセスは、ここにおいて特定の順序で概説され得るが、当業者は、順序付けのステップおよびプロセスが変化し得ることを認識するであろう。
【0037】
本明細書においてここおよび特許請求の範囲で使用される場合、1つ以上の要素のリストに関連する「少なくとも1つ」という句は、要素のリストの任意の1つ以上の要素から選択される少なくとも1つの要素を意味すると理解されるべきであるが、必ずしも要素のリスト内に具体的にリスト化されているありとあらゆる要素の少なくとも1つを含まなくてもなく、要素のリスト内の要素の任意の組み合わせを除外するものではない。この定義はまた、「少なくとも1つ」という句が参照する要素のリスト内で具体的に特定される要素以外の要素が、具体的に特定されるそれらの要素に関連するかどうかにかかわらず、必要に応じて存在し得ることを可能にする。したがって、非限定的な例として、「AおよびBの少なくとも1つ」(または、同等に、「AまたはBの少なくとも1つ」、または同等に「Aおよび/またはBの少なくとも1つ」)は、一実施形態では、少なくとも1つ、必要に応じて1つを超えるAを含み、Bが存在しない(および必要に応じて、B以外の要素を含む)を指すことができ、別の実施形態では、少なくとも1つ、必要に応じて1つを超えるBを含み、Aが存在しない(および必要に応じて、A以外の要素を含む)を指すことができ、さらに別の実施形態では、少なくとも1つ、必要に応じて1つを超えるAを含み、少なくとも1つ、必要に応じて1つを超えるBを含む(および必要に応じて、他の要素を含む)などを指すことができる。
【0038】
この明細書全体を通して「一実施形態」または「実施形態」への言及は、実施形態に関連して説明される特定の特徴、構造または特性が少なくとも1つの実施形態に含まれることを意味する。したがって、この明細書全体を通して様々な場所での「一実施形態において」または「実施形態において」という句の出現は、必ずしも全てが同じ実施形態を指すとは限らない。さらにまた、特定の特徴、構造、または特性は、1つ以上の実施形態において、任意の適切な方法で組み合わせられることができる。
【0039】
「類縁体」または「誘導体」は、化学および生物学におけるその明白な通常の意味に従って使用され、別の化合物(すなわち、いわゆる「参照」化合物)と構造的に類似しているが、例えば、ある原子を異なる元素の原子で置き換える場合、または特定の官能基の存在下で、またはある官能基を別の官能基で置き換える場合、または参照化合物の1つ以上のキラル中心の絶対立体化学において、組成が異なる化合物を指す。したがって、類縁体は、機能および外観が類似または同等であるが、構造または起源が参照化合物と類似していない化合物である。
【0040】
ここで使用される場合、「脂肪族」という用語は、飽和またはモノ-またはポリ不飽和であり得る、直鎖状または分岐状の炭化水素鎖を意味する。不飽和脂肪族基は、1つまたは複数の二重結合および/または三重結合を含む。炭化水素鎖の分岐は、線状鎖ならびに非芳香族環状元素を含み得る。炭化水素鎖は、特に明記しない限り、任意の長さであり、任意の数の分岐を含み得る。主鎖および分岐の両方は、例えば、B、N、O、P、S、SeまたはSiなどのヘテロ原子をさらに含み得る。
【0041】
ここで使用される場合、「アルキル」という用語は、それ自体で、または別の置換基の一部として、特に明記しない限り、完全に飽和、モノまたはポリ不飽和であり得て、指定された炭素原子数(すなわち、C1~C10は1~10個の炭素を意味する)を持つジおよび多価ラジカルを含むことができる直鎖(すなわち、非分岐鎖)または分岐鎖、またはそれらの組み合わせを意味する。「アルキル」は環化されていない。アルキル基の例としては、限定されるものではないが、メチル、エチル、n-プロピル、イソプロピル、n-ブチル、t-ブチル、イソブチル、sec-ブチル、(シクロヘキシル)メチル、例えば、n-ペンチル、n-ヘキシル、n-ヘプチル、n-オクチルなどのホモログ及び異性体などの基が挙げられる。不飽和アルキル基は、1つ以上の二重結合または三重結合を有するものである。不飽和アルキル基の例としては、限定されるものではないが、ビニル、2-プロペニル、クロチル、2-イソペンテニル、2-ブタジエニル、2,4-ペンタジエニル、3-(1,4-ペンタジエニル)、エチニル、1-および3-プロピニル、3-ブチニル、ならびにより高次のホモログ及び異性体が挙げられる。アルコキシは、酸素原子(-O-)を介して分子の残りの部分に結合したアルキルである。
【0042】
ここで使用される場合、「アルキレン」という用語は、それ自体で、または別の置換基の一部として、特に明記しない限り、-CH2CH2CH2CH2-によって例示されるが、限定されるものではない、アルキルから誘導される二価ラジカルを意味する。典型的には、アルキル(またはアルキレン)基は、1~24個の炭素原子を有し、10個以下の炭素原子を有するそれらの基が本開示において好ましい。「低級アルキル」または「低級アルキレン」は、一般に8個以下の炭素原子を有する、より短い鎖のアルキルまたはアルキレン基である。
【0043】
ここで使用される場合、「アルキレン」という用語は、いくつかの実施形態において、1~3個の炭素原子を有する直鎖状、分岐状または環状のアルキレン基を意味し、例えば、メチレン基、エチレン基、プロピレン基、イソプロピレンまたはc-プロピレン基であり得る。
【0044】
ここで使用される場合、「芳香族」という用語は、特に明記しない限り、共役二重結合の平面環状炭化水素部分を意味し、これは、単一の環であるか、または複数の縮合または共有結合した環を含み得る。環状炭化水素部分の主鎖は、特に明記しない限り、任意の長さであり得、例えば、N、OおよびSのような任意の数のヘテロ原子を含み得る。
【0045】
ここで使用される場合、「ヘテロアルキル」という用語は、それ自体でまたは別の用語との組み合わせで、特に明記しない限り、少なくとも1個の炭素原子、ならびにO、N、SiおよびSからなる群から選択される少なくとも1個のヘテロ原子からなる、安定した直鎖もしくは分岐鎖、またはそれらの組み合わせを意味し、窒素及び硫黄原子は任意に酸化されてもよく、窒素ヘテロ原子は任意に四級化されてもよい。ヘテロ原子(複数の場合がある)O、N、P、SおよびSiは、ヘテロアルキル基の任意の内部位置、またはアルキル基が分子の残部に付加される位置に置かれてもよい。ヘテロアルキルは環化されていない。例として、限定されるものではないが、以下が挙げられる:-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-O-CH3、-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH-CH-O-CH3、-Si(CH3)3、-CH2-CH-N-OCH3、-CH-CH-N(CH3)-CH3、-O-CH3、-O-CH2-CH3、および-CN。例えば、-CH2-NH-OCH3などの、最大2個のヘテロ原子が連続している場合がある。
【0046】
ここで使用される婆、「シクロアルキル」および「ヘテロシクロアルキル」、という用語は、それ自体で、または他の用語と組み合わせて、特に明記しない限り、それぞれ、「アルキル」および「ヘテロアルキル」の環状バージョンを意味する。シクロアルキルおよびヘテロシクロアルキルは芳香族ではない。シクロアルキルおよびヘテロシクロアルキルは、例えば、ここに記載の置換基のいずれかでさらに置換することができる。
【0047】
上記の用語のそれぞれ(例えば、「アルキル」、「芳香族」、「ヘテロアルキル」、「シクロアルキル」など)は、示される基の置換形態および非置換形態の両方を含む。その点に関して、基または部分が「置換された」または「任意に置換された」(または「任意に有する」または「任意に含む」)と記載されるときはいつでも、その基は非置換であるか、または示された置換基の1つまたは複数で置換され得る。同様に、基が置換されている場合に「置換または非置換」であると記載される場合、置換基は、示された置換基のうちの1つまたは複数から選択され得る。置換基が示されていない場合、示された「任意に置換された」または「置換された」基は、アルキル、アルケニル、アルキニル、シクロアルキル、シクロアルケニル、シクロアルキニル、アリール、ヘテロアリール、ヘテロアリシクリル、アラルキル、ヘテロアラルキル、(ヘテロアリシクリル)アルキル、ヒドロキシ、保護ヒドロキシル、アルコキシ、アリールオキシ、アシル、メルカプト、アルキルチオ、アリールチオ、シアノ、シアネート、ハロゲン、チオカルボニル、O-カルバミル、N-カルバミル、O-チオカルバミル、N-チオカルバミル、C-アミド、N-アミド、S-スルホンアミド、N-スルホンアミド、C-カルボキシ、保護されたC-カルボキシ、O-カルボキシ、イソシアナト、チオシアナト、イソチオシアナト、ニトロ、シリル、スルフェニル、スルフィニル、スルホニル、ハロアルキル、ハロアルコキシ、トリハロメタンスルホニル、トリハロメタンスルホンアミド、エーテル、アミノ(例えば、一置換アミノ基または二置換アミノ基)、およびそれらの保護誘導体から個別にかつ独立して選択される1つ以上の基で置換され得ることを意味する。上記の基のいずれも、O、N、またはSを含む1つまたは複数のヘテロ原子を含み得る。例えば、部分がアルキル基で置換されている場合、そのアルキル基は、O、N、またはSから選択されるヘテロ原子を含み得る(例えば、-(CH2-CH2-O-CH2-CH3))。
【0048】
ここで使用される場合、「結合」または「結合する」という用語は、ある分子または原子の別の分子または原子への結合(joining)、結合(bonding)(例えば、共有結合)、または連結を指す。
【0049】
ここで使用される場合、「ハロ」または「ハロゲン」という用語は、それら自体でまたは別の置換基の一部として、特に明記しない限り、フッ素、塩素、臭素、またはヨウ素原子を意味する。加えて、「ハロアルキル」などの用語は、モノハロアルキル及びポリハロアルキルを含むことを意味する。例えば、「ハロ(C1~C4)アルキル」という用語は、これらに限定されないが、フルオロメチル、ジフルオロメチル、トリフルオロメチル、2,2,2-トリフルオロエチル、4-クロロブチル、3-ブロモプロピルなどを含む。
【0050】
ここで使用される場合、「ヘテロ原子」という用語は、ホウ素(B)、酸素(O)、窒素(N)、硫黄(S)、およびケイ素(Si)を含むことを意味する。いくつかの実施形態において、「複素環」は、1つまたは複数のヘテロ原子を含み得る。
【0051】
ここで使用される場合、「低級置換基(lower substituent)」または「低級置換基(lower substituent group)」は、「置換基」について上記のすべての置換基から選択される基を意味し、各置換または非置換アルキルは、置換または非置換C1~C8アルキルであり、各置換または非置換ヘテロアルキルは、置換または非置換の2~8員のヘテロアルキルであり、各置換または非置換シクロアルキルは、置換または非置換C5~C7シクロアルキルであり、各置換または非置換ヘテロシクロアルキルは、置換または非置換の5~7員ヘテロシクロアルキルである。
【0052】
ここで使用される場合、「ナノポア」という用語は、膜に形成された、またはそうでなければそこに設けられポア、チャネル、または通路を指す。ナノポアは、膜内の分子(タンパク質など)によって定義され得る。膜は、脂質二重層のような有機膜、またはポリマー材料から形成されたような合成膜であり得る。ここで使用される場合、「ポリマー」という用語は、ホモポリマーおよびコポリマーを含むものとして定義される。「ホモポリマー」という用語は、単一種のモノマーに由来するポリマーとして定義される。「コポリマー」という用語は、2つのモノマー種の共重合によって得られるコポリマー、3つのモノマー種から得られるもの(「ターポリマー」)、4つのモノマー種から得られるもの「クォーターポリマー」)などを含む、複数のモノマー種に由来するポリマーとして定義される。ナノポアは、例えば、相補型金属酸化膜半導体(CMOS)または電界効果トランジスタ(FET)回路などの検知回路に隣接してまたは近接して配置することができる。ナノポアは、0.1ナノメートル(nm)~約1000nmのオーダーの特徴的な幅または直径を有し得る。いくつかのナノポアはタンパク質である。アルファ溶血素はタンパク質ナノポアの一例である。いくつかの実施形態において、ナノポアは固体型のナノポアである(例えば、固体型のナノポアは、典型的に、合成膜(通常、SiNxまたはSiO2)に形成されたナノメートルサイズの穴である)。
【0053】
ここで使用される場合、「ナノポア配列決定複合体(nanopore sequencing complex)」という用語は、酵素、例えば、ポリメラーゼに連結または結合されたナノポアを指し、これは、次に、ポリマー、例えば、ポリヌクレオチドテンプレートに関連する。ナノポア配列決定複合体は、脂質二重層などの膜に配置され、ヌクレオチドやアミノ酸などのポリマー成分を識別するように機能する。
【0054】
ここで使用される場合、「ナノポア配列決定」または「ナノポアベースの配列決定」という用語は、ナノポアを使用してポリヌクレオチドの配列を決定する方法を指す。いくつかの実施形態において、ポリヌクレオチドの配列は、テンプレート依存的に決定される。ここに開示される方法は、ナノポア配列決定方法、システム、またはデバイスに限定されない。
【0055】
ここで使用される場合、「核酸」という用語は、1つまたは複数の核酸サブユニットを含む分子を指す。核酸は、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)を含むがこれらに限定されない1つまたは複数のサブユニット(天然に存在する、合成の、または修飾核酸塩基)を含み得る。これらの塩基の誘導体は、PCRシステム、試薬、および消耗品に例示されており(Perkin Elmer Catalogue 1996-1997, Roche Molecular Systems, Inc., Branchburg, N.J., USA)、参照によりここに完全に組み込まれる。いくつかの例において、核酸は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)、あるいはそれらの誘導体である。核酸は、一本鎖又は二本鎖であり得る。核酸は、DNA、RNA、およびそれらのハイブリッドまたは変形体を含むがこれらに限定されない、任意の核酸分子を含むことができる。
【0056】
ここで使用される場合、「核酸塩基」という用語は、別の核酸塩基と非共有結合的に対を形成することができる複素環部分を指す。「天然に存在する核酸塩基」または「非修飾核酸塩基」(交換可能に使用される)は、その天然に存在する形態に対して修飾されていない核酸塩基を指す。同様に、「修飾核酸塩基」は、天然の核酸塩基からの任意の置換および/または変化を意味する。核酸塩基(または塩基)の修飾または置換は、天然に存在するまたは合成の非修飾の核酸塩基とは構造的に区別可能であるが、機能的に交換可能である。天然の核酸塩基と修飾核酸塩基の両方が水素結合に関与することができる。そのような核酸塩基の修飾は、ヌクレアーゼ安定性、結合親和性、またはアンチセンス化合物に他のいくつかの有益な生物学的特性を与える可能性がある。修飾核酸塩基には、合成および例えば、5-メチルシトシン(5-me-C)などの天然の核酸塩基が含まれる。5-メチルシトシン置換を含む特定の核酸塩基置換は、標的核酸に対するアンチセンス化合物の結合親和性を増加させるために特に有用である。例えば、5-メチルシトシン置換は、核酸二重鎖の安定性を0.6~1.2℃増加させることが示されている(Sanghvi, Y. S., Crooke, S. T. and Lebleu, B., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278)。追加の修飾核酸塩基には、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、7-メチルグアニン、2-アミノアデニン、2-アミノプリン、iso-C、iso-G、thioT、thioG、5,6-ジヒドロウラシル、6-メチルアデニン、2-プロピルグアニンおよびアデニンおよびグアニンの他のアルキル誘導体、2-チオウラシル、2-チオチミンおよび2-チオシトシン、5-ハロウラシルおよびシトシン(5-ブロモ、5-トリフルオロメチルおよび他の5-置換ウラシルおよびシトシンなど)、5-プロピニル(-C≡C-CH3)ウラシルおよびシトシンおよびピリミジン塩基の他のアルキニル誘導体、6-アザウラシル、シトシンおよびチミン、ウラシル-5-イル(シュードウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシおよび他の8-置換アデニンおよびグアニン、7-メチルグアニンおよび7-メチルアデニン、2-F-アデニン、2-アミノ-アデニン、8-アザグアニンおよび8-アザアデニン、7-デアザグアニンと7-デアザアデニンと3-デアザグアニンと3-デアザアデニン、8-アザ-7-デアザグアニンと8-アザ-7-デアザアデニンが含まれるが、これらに限定されない。追加の核酸塩基は、Grecoet等のSynthesis and site-specific incorporation of a simple fluorescent pyrimidine, Nature Protocols, vol.2, no.2, 2007;Dien等のProgress Toward a Semi-Synthetic Organism with an Unrestricted Expanded Genetic Alphabet, J. Am. Chem. Soc. 2018, 140, 16115-16123; Zhang等のEvolution of Functional Six-Nucleotide DNA, J. Am. Chem. Soc. 2015, 137, 6734-6737; Biondi et. al. Artificially Expanded Genetic Information Systems for New Aptamer Technologies, Biomedicines 2018, 6, 53; Liu等のHelix-Forming Properties of Size-Expanded DNA, an Alternative Four-Base Genetic Form, J. Am. Chem. Soc. 9 Vol. 127, No. 5, 2005, 1396-1402;Tor等のDesigning new isomorphic fluorescent nucleobase analogues: the thieno[3,2-d]pyrimidine core, Tetrahedron 63 (2007) 3608-3614;Laos等のDirected Evolution of Polymerases to Accept Nucleotides with Nonstandard Hydrogen Bond Patterns, Biochemistry 2013, 52, 5288-5294;Krueger等のSynthesis and Properties of Size-expanded DNAs:Toward Designed, Functional Genetic Systems, Acc Chem Res. 2007 February ; 40(2): 141-150; Srivatsan等のA highly fluorescent nucleoside analog based on thieno[3,4-d]pyrimidine senses mismatched pairing, Org. Biomol. Chem., 2008, 6, 1334-1338; Kim等のSynthesis and Properties of 5-Cyano-Substituted Nucleoside Analog with a Donor-Donor-Acceptor Hydrogen-Bonding Pattern, J. Org. Chem. 2012, 77, 3664-3669; and Noe等のOligodeoxynucleotides Containing Multiple Thiophene-Modified Isomorphic Fluorescent Nucleosides, J. Org. Chem. 2013, 78, 8123-8128,に開示されており、それらの開示は、参照によりその全体が本明細書に組み込まれる。
【0057】
ここで使用される場合、「ヌクレオシド」という用語は、リボースまたは2’-デオキシリボースなどの糖に共有結合している核酸塩基を指す。
【0058】
ここで使用される場合、「ヌクレオチド」という用語は、アデノシン5’-一リン酸(AMP)、アデノシン5’-二リン酸(ADP)、アデノシン5’-三リン酸(ATP)アデノシン5’-四リン酸またはその2’-デオキシ誘導体などのリン酸またはポリリン酸に共有結合したヌクレオシドを指す。ここで使用される場合、「オリゴヌクレオチド」という用語は、ヌクレオチドまたはヌクレオシドモノマー単位のオリゴマーを指し、ここで、オリゴマーは、場合により、非ヌクレオチドモノマー単位、および/またはオリゴマーの内部および/または外部位置に結合した他の化学基を含む。オリゴマーは天然または合成であり得、天然に存在するオリゴヌクレオチド、または天然に存在しない(または修飾された)塩基、糖部分、ホスホジエステル-アナログ結合、および/または代替のモノマー単位キラリティーおよび異性体構造を有するヌクレオシドを含むオリゴマーを含み得る(例えば、5’-~2’-結合、L-ヌクレオシド、α-アノマーヌクレオシド)。本開示の組成物および方法においてナノポア検出可能な標識として有用な例示的なオリゴヌクレオチドには、表4に示されるオリゴヌクレオチド標識構造が含まれる。
【0059】
ここで使用される場合、「ポリメラーゼ」という用語は、重合反応を触媒することができる任意の酵素を指す。ポリメラーゼの例には、核酸ポリメラーゼ、逆転写酵素またはリガーゼが含まれるが、これらに限定されない。ポリメラーゼは重合酵素であり得る。「DNAポリメラーゼ」は、デオキシヌクレオチドの重合を触媒する。「RNAポリメラーゼ」は、リボヌクレオチドの重合を触媒する。ポリマーには、RNAテンプレートから相補的DNA(cDNA)を生成するために使用される酵素である逆転写酵素が含まれる場合がある。
【0060】
ここで使用される場合、「ポリヌクレオチド」は、少なくとも2つのヌクレオチドを含むポリマーまたはオリゴマーである。ポリヌクレオチドまたはオリゴヌクレオチドは、DNAポリヌクレオチドまたはオリゴヌクレオチド、RNAポリヌクレオチドまたはオリゴヌクレオチド、またはDNAポリヌクレオチドまたはオリゴヌクレオチドおよび/またはRNAポリヌクレオチドまたはオリゴヌクレオチドの1つまたは複数のセクションを含み得る。
【0061】
ここで使用される場合、「反応性基」または「反応性官能基」という用語は、異なる部分の官能基と化学的に会合、相互作用、ハイブリダイズ、水素結合、またはカップリングすることができる官能基を指す。いくつかの実施形態では、2つの反応性基または2つの反応性官能基の間の「反応」は、2つの反応性基または2つの反応性官能基の間で共有結合が形成されることを意味し得;または、2つの反応性基または2つの反応性官能基が互いに会合し、互いに相互作用し、互いにハイブリダイズし、互いに水素結合するなどを意味し得る。したがって、いくつかの実施形態では、「反応」は、ハプテンと抗ハプテン抗体との結合、または超分子宿主分子と結合するゲスト分子などの結合事象を含む。
【0062】
ここで使用される場合、「配列決定」という用語は、核酸中の塩基の順序および位置の決定を指す。
【0063】
ここで使用される場合、「標識」という用語は、原子または分子、あるいは原子または分子の集合体であり得る検出可能な部分を指す。標識は、光学的、電気化学的、磁気的、または静電的(例えば、誘導性、容量性)の署名を提供することができ、これは、ナノポアを使用して検出することができる。
【0064】
ここで提供される見出しは、便宜上のものであり、開示される実施形態の範囲または意味を解釈するものではない。
【0065】
ヌクレオチド
本開示は、糖、例えば、3’の除去可能な保護基を有するリボースまたはデオキシリボースなどを含むヌクレオチドおよび/またはヌクレオシド(またはその任意の塩)に関する。いくつかの実施形態において、本開示のヌクレオチドおよび/またはヌクレオシドは、標識化核酸塩基、例えば、検出可能な部分を含む塩基を含む。いくつかの実施形態において、3’除去可能保護基は、以下のような少なくとも1つの基準、例えば、(i)3’除去可能な保護基を有するヌクレオチドまたはヌクレオシドを成長中のオリゴヌクレオチドに正確かつ効率的に組み込む酵素(例えば、ポリメラーゼ)の能力;(ii)迅速かつ定量的な脱保護のための穏やかな条件の利用可能性、および(iii)脱保護ステップに続いてオリゴマー合成を再開する酵素の能力である。いくつかの実施形態において、3’保護基は、非還元条件下で(例えば、過酸化水素または別の酸化剤を使用して)除去される。
【0066】
いくつかの実施形態において、本開示によるヌクレオチド(その任意の塩を含む)は、式(I)によって具体化される構造を有する:
【化16】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
「保護基」は、構造:
【化17】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;および
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。)を有する。〕。
【0067】
いくつかの実施形態において、Yのオリゴヌクレオチドは、その3’末端を介して結合される。
【0068】
いくつかの実施形態において、「保護基」は、-B(OZ1)(OZ2)である。いくつかの実施形態において、Z1またはZ2は、H、メチルまたはエチルである。いくつかの実施形態において、両方のZ1およびZ2は、独立して、H、メチルまたはエチルから選択される。いくつかの実施形態において、1およびZ2は、独立して、メチルまたはエチルから選択される。いくつかの実施形態において、「保護基」は-B(OH)2である。いくつかの実施形態において、「保護基」は-B(OH)3
-である。
【0069】
いくつかの実施形態において、本開示によるヌクレオチド(その任意の塩を含む)は、式(II)によって具体化される構造を有する:
【化18】
〔式中、Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
「スペーサー」は、1個と16個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり;
「ブロッキング部分」は、1個と20個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり、ただし、「ブロッキング部分」は、アジド基、イソニトリル基、シアノ基、O、N、S、またはSeから選択される少なくとも一つのヘテロ原子を有する5-~8員のヘテロシクロアルキル基、置換または非置換の1,4-エポキシ-1,4-ジヒドロナフタレン、または構造:
【化19】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;および
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
ただし、「ブロッキング部分」が-N
3である場合、「スペーサー」は-CH
2-ではない。〕。
いくつかの実施形態において、「スペーサー」は、1個と12個との間の炭素原子を有し、任意選択的に、カルボニル基を含む、直鎖状または分岐状の、置換または非置換の、飽和または不飽和の脂肪族基である。他の実施形態において、「スペーサー」は、1個と10個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的にケトン、エステルまたはアミドを含む脂肪族基であり;さらに他の実施形態において、「スペーサー」は、1個と6個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、カルボニル基、例えばケトン、エステル、炭酸塩、カルバメート、ウレタン、またはアミドを含む脂肪族基である。
【0070】
いくつかの実施形態において、「ブロッキング部分」は、1個と20個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり、ただし、「ブロッキング部分」は、イソニトリル基、シアノ基、O、N、S、またはSeから選択される少なくとも一つのヘテロ原子を有する5-~8員のヘテロシクロアルキル基、置換または非置換の1,4-エポキシ-1,4-ジヒドロナフタレンに由来する部分、またはボロン酸またはその誘導体または類似体に由来する部分を含む。いくつかの実施形態において、「ブロッキング部分」は、1個と16個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の脂肪族または芳香族基である。他の実施形態において、「ブロッキング部分」は、1個と12個との間の炭素原子を有する、直鎖状または分岐状の、置換または非置換の、飽和または不飽和の脂肪族基または芳香族基である。さらに他の実施形態において、「ブロッキング部分」は、1個と6個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の脂肪族または芳香族基である。
【0071】
いくつかの実施形態において、「ブロッキング部分」は、-B(OZ1)(OZ2)基(式中、Z1およびZ2は、独立して、H、メチル、エチル、イソプロピル、またはtertブチルから選択される。)を含む。他の実施形態において、「ブロッキング部分」は、-B(OZ1)(OZ2)基(式中、Z1およびZ2は、独立して、H、メチル、またはエチルから選択される。)を含む。他の実施形態において、「ブロッキング部分」は、-B(OZ1)(OZ2)基(式中、Z1またはZ2の一方のみがHである。)を含む。他の実施形態において、「ブロッキング部分」は、-B(OZ1)(OZ2)基(式中、両方のZ1およびZ2がHである。)を含む。いくつかの実施形態において、「保護基」は、-B(OH)3
-である。
【0072】
他の実施形態において、「ブロッキング部分」は、少なくとも1つの硫黄原子またはセレン原子を含む5-~8-員のヘテロシクロアルキル基を含む。他の実施形態において、「ブロッキング部分」は、5-~8-員のヘテロシクロアルキル基を含み、これは、2つの硫黄原子または2つのセレン原子を含み、2つの硫黄原子または2つのセレン原子が1つの炭素原子によって互いに分離されている(例えば、-S-C-S-または-Se-C-Se-)。いくつかの実施形態において、5-~8-員のヘテロシクロアルキル基は、1,3-ジチアン基である。
【0073】
いくつかの実施形態において、本開示によるヌクレオチド(その任意の塩を含む)は、式(IIIA)によって具体化される構造を有する:
【化20】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和C
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化21】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない。〕。
【0074】
いくつかの実施形態において、R1は-CH2-であり、R5は-B(OZ1)(OZ2)である。いくつかの実施形態において、R1は-CH2-であり、R4は結合であり、R5は-B(OZ1)(OZ2)である。いくつかの実施形態において、R1は-CH2-であり、R4は結合であり、R5は-B(OZ1)(OZ2)であり、R2またはR3の少なくとも一方はHである。
【0075】
いくつかの実施形態において、R2またはR3の少なくとも一方はHである。他の実施形態において、R2またはR3の一方は-[(C(Ra)(Rb))p-O]q--(Ra)または-C(O)-ORa-である。さらに他の実施形態において、R2またはR3の一方は-[(C(Ra)(Rb))p-O]q--(Ra)または-C(O)-ORa-であり、Raはメチルまたはエチルである。さらなる実施形態において、R2またはR3の一方は、メチル、エチル、イソプロピルまたはtertブチルから選択される。さらに別の実施形態において、R2またはR3の少なくとも一方はHであり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はHである。またさらに別の実施形態では、両方のR2およびR3がHであり、R5は-B(OZ1)(OZ2)であり、Z1およびZ2の両方がHである。いくつかの実施形態において、R1は結合であり、R2およびR3は両方Hであり、R4は結合であり、R5は-B(OZ1)(OZ2)である。いくつかの実施形態において、「保護基」は-B(OH)3
-である。
【0076】
いくつかの実施形態において、R4は、-O-R6、ハロゲンC1~C6アルキル基、C2~C6アルケニル基、-C(O)-Rc、-C(O)-N(Rc)(Rd)、または、-NO2(式中、RcおよびRdは、それぞれ独立して、Hまたは飽和C1~C6アルキル基であり、R6は、C1~C6アルキル基である。)、-N-(Ra)(Rb)または-O(Ra)からなる群から選択される少なくとも一つの部分で置換された、フェニル基または5-または6-員のヘテロシクロアルキル基である。他の実施形態において、R6はC1~C4アルキル基である。さらなる実施形態において、R6は、メチル、エチル、イソプロピルまたはtertブチルから選択される。
【0077】
いくつかの実施形態において、R4は、置換または非置換のフェニル基である。他の実施形態において、R4は、1つまたは複数の電子求引基で置換されたフェニル基(例えば、ニトロ(-NO2)、シアノ(-CN)、カルボキシアミド(-C(O)NH2)、トリフルオロメチル(-CF3))である。いくつかの実施形態において、フェニル基は、1つ、2つ、または3つの電子求引基で置換されている。さらに他の実施形態では、R4は、電子求引基で置換されたフェニル基である。さらなる実施形態において、R4は、非置換のフェニル基である。
【0078】
いくつかの実施形態において、R4は、置換されたヘテロシクロアルキル基である。他の実施形態において、R4は、1つまたは複数の電子求引基で置換されたヘテロシクロアルキル基(例えば、ニトロ(-NO2)、シアノ(-CN)、カルボキシアミド(-C(O)NH2)、トリフルオロメチル(-CF3))である。さらに他の実施形態では、R4は、電子求引基で置換されたヘテロシクロアルキル基である。さらなる実施形態において、R4は、非置換のヘテロシクロアルキル基である。
【0079】
他の実施形態において、R4は、フェニル基または5-または6-員のヘテロシクロアルキル基であり、少なくとも1つのアルキル置換基で置換されており、各アルキル置換基は、メチル、エチル、イソプロピル、またはtertブチルから選択される。
【0080】
いくつかの実施形態において、R5は-B(OZ1)(OZ2)であり、Z1およびZ2は、独立して、H、メチル、エチル、イソプロピル、またはtertブチルから選択される。他の実施形態において、R5は、-B(OZ1)(OZ2)であり、Z1またはZ2の一方はHである。さらに他の実施形態において、R5は-B(OZ1)(OZ2)であり、両方のZ1およびZ2はHである。いくつかの実施形態において、R4は結合であり、R5は-B(OZ1)(OZ2)であり、Z1およびZ2は、独立してH、メチル、エチル、イソプロピル、またはtertブチルから選択される。他の実施形態において、R4は結合であり、R5は-B(OZ1)(OZ2)であり、両方のZ1およびZ2はHである。
【0081】
いくつかの実施形態において、R
5は、
【化22】
(式中、C
2~C
6は、置換または非置換であることができる、2~6個の炭素の飽和アルキル鎖を表す。)である。いくつかの実施形態において、基
【化23】
は、メチル、エチル、イソプロピル、またはtertブチルから選択される少なくとも一つの置換基を含む。いくつかの態様において、R
5は
【化24】
である。いくつかの態様において、R
5は
【化25】
である。
【0082】
式(IIIA)のヌクレオチド(その任意の塩を含む)の非限定的な例には、以下が含まれる:
【化26】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;および
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。〕。
【0083】
いくつかの実施形態において、上記で特定された例における複素環基は、2、3位または2、5位で置換されている。
【0084】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(IIIB)によって具体化される構造を有する:
【化27】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化28】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
7はOまたはNR
aであり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数である。)を有する。〕。
【0085】
いくつかの実施形態において、R2またはR3の少なくとも一方はHである。他の実施形態において、R2およびR3は両方Hである。さらに他の実施形態において、R2またはR3の一方は-[(C(Ra)(Rb))p-O]q--(Ra)または-C(O)-ORa-であり、Raはメチルまたはエチルである。いくつかの実施形態において、R2は、メチル、エチル、イソプロピル、およびtert-ブチルから選択され、R3はHである。さらに別の実施形態において、R2またはR3の少なくとも一方はHであり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方がHである。よりさらなる実施形態において、両方のR2およびR3がHであり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方がHである。さらにより別の実施形態において、両方のR2およびR3がHであり、R5は-B(OZ1)(OZ2)であり、Z1およびZ2の両方がHである。
【0086】
いくつかの実施形態において、R7はOである。他の実施形態において、R7はOであり、R5は-B(OZ1)(OZ2)であり、Z1およびZ2は、独立して、H、メチル、エチル、イソプロピル、またはtertブチルから選択される。さらに他の実施形態において、R7はOであり、R5は-B(OH)2である。さらに他の実施形態において、R7はOであり、R4はフェニルまたは置換フェニル(例えばメチル基、エチル基、イソプロピル基、またはtertブチル基で置換されたもの)であり、R5は-B(OH)2である。さらなる実施形態において、R7はOであり、R4は、置換または非置換の5-または6-員のヘテロシクロアルキル基(例えばメチル基、エチル基、イソプロピル基、またはtertブチル基で置換されたもの)であり、R5は-B(OH)2である。
【0087】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(IIIC)によって具体化される構造を有する:
【化29】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
8はO、NR
a、またはSであり;
R
9はH、ハロゲン、C
1~C
4アルキル基、-C(O)-R
a、-N(R
a)(R
b)、または-NO
2である。
R
11およびR
12は、それぞれ独立して、Hまたは直鎖状または分岐状のC
1~C
4アルキル基であり;
R
13は結合、-CH
2-または-CH
2-CH
2-であり;
R
14は-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、または-B(OZ
1)(OZ
2)(式中、Z
1およびZ
2は、独立して、H、メチル、エチル、イソプロピル、またはtertブチルから選択される。)であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C1~C
6アルキル基であり;
R
eは、HまたはC
1~C
4アルキルであり;および
nは0または1~3の範囲の整数であり;
いくつかの実施形態において、複素環は2,3位または2,5位で置換されており、例えば、-C(R
11)(R
12)-R
13-R
14は、複素環の3位または5位に存在する。
【0088】
いくつかの実施形態において、R11またはR12の少なくとも一方はHである。他の実施形態において、R11は、メチル、エチル、イソプロピル、またはtertブチルから選択され、R12はHである。さらに他の実施形態において、R11またはR12の少なくとも一方はHであり、R14は-B(OZ1)(OZ2)であり、Z1またはZ2の一方がHである。さらなる実施形態において、両方のR11およびR12がHであり、R14は-B(OZ1)(OZ2)であり、Z1はHであり、Z2はC1~C4アルキル基である。さらなる実施形態において、R9はHであり、R11またはR12の一方はHであり、R14は-B(OZ1)(OZ2)であり、Z1はHであり、Z2はC1~C4アルキル基である。よりさらなる実施形態において、両方のR11およびR12がHであり、R14は-B(OH)2である。
【0089】
いくつかの実施形態において、R11またはR12の少なくとも一方はHであり、R14はN3である。他の実施形態において、R11およびR12は、両方Hであり、R14はN3である。いくつかの実施形態において、R14はN3である。いくつかの実施形態において、R13は結合であり、R14はN3である。いくつかの実施形態において、R13は結合であり、R14はN3であり、R9はHである。いくつかの実施形態において、R13は結合であり、R14はN3であり、R8はOである。他の実施形態において、R13は結合であり、R14はN3であり、R8はNReである。さらに他の実施形態において、R13は結合であり、R14はN3であり、R8はSである。
【0090】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(IIID)によって具体化される構造を有する:
【化30】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;および
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化31】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-または6-員のアリール基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
2およびR
3がHであり、R
4が結合である場合、R
5はアジドではない。)有する基である。〕。
【0091】
いくつかの実施形態において、R4は、結合である。他の実施形態において、R4は結合であり、R5は-B(OH)2である。さらに他の実施形態において、R4は結合であり、R5は-(C(Ra)(Rb))n-N3であり、R2またはR3の少なくとも一方は、メチル、エチル、イソプロピル、またはtertブチルである。
【0092】
いくつかの実施形態において、R4はフェニル基であり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はHである。他の実施形態において、R4はフェニル基であり、R5は-B(OH)2である。他の実施形態において、R4は置換フェニル基であり、R5は-B(OH)2であり、ここで、フェニル基は、少なくとも一つのC1~C4アルキル基で置換されている。さらに他の実施形態において、R4は置換フェニル基であり、ここで、フェニル基は、メチル基、エチル基、イソプロピル基、またはtert-ブチル基から選択される単一の置換基で置換されている。
【0093】
いくつかの実施形態において、R4は-CH=CH-であり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はH、メチルまたはエチルである。他の実施形態において、R4は-CH=CH-であり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はH、メチルまたはエチルである。他の実施形態において、R4は-CH=CH-であり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はHである。さらに他の実施形態において、R2またはR3の少なくとも一方はHであり、R4は-CH=CH-であり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はHである。さらに他の実施形態において、R2またはR3の少なくとも一方はHであり、R4は-CH=CH-であり、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はH、メチルまたはエチルである。さらに他の実施形態において、R2またはR3の少なくとも一方はHであり、R4は-CH=CH-であり、R5は-B(OH)2である。
【0094】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(IV)によって具体化される構造を有する:
【化32】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化33】
(式中、
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1が結合であり、R
2およびR
3がいずれもHである場合、R
5はアジドではないである。〕。
【0095】
いくつかの実施形態において、R1は結合である。他の実施形態において、R2またはR3の少なくとも一方はHである。さらに他の実施形態において、R1は結合であり、R2またはR3の少なくとも一方はHである。さらに他の実施形態において、R1は結合であり、R2またはR3の一方のみがHであり、R5は-(C(Ra)(Rb))n-N3である。
【0096】
いくつかの実施形態において、R2またはR3の一方は、メチル、エチル、イソプロピルまたはtertブチルから選択される。他の実施形態において、R2またはR3はメチル、エチル、イソプロピル、またはtertブチルから選択され、R5は-B(OZ1)(OZ2)であり、Z1およびZ2は、独立して、H、メチル、エチル、イソプロピル、またはtertブチルから選択される。いくつかの実施形態において、R5は-B(OZ1)(OZ2)であり、Z1およびZ2は、独立して、H、メチル、エチル、イソプロピル、またはtertブチルから選択される。他の実施形態において、R5は-B(OZ1)(OZ2)であり、Z1またはZ2の一方はHである。さらに他の実施形態において、R5は-B(OZ1)(OZ2)であり、両方のZ1またはZ2がHである。より一層さらなる実施形態において、R5は-B(OZ1)(OZ2)であり、両方のZ1またはZ2がHであり、R2またはR3の少なくとも一方がHである。
【0097】
いくつかの実施形態において、R
5は、
【化34】
(式中、C
2~C
6は、置換または非置換であることができる、2~6個の炭素の飽和アルキル鎖を表す。)である。いくつかの態様において、R
5は
【化35】
である。他の実施形態において、R
5は
【化36】
である。さらに他の実施形態において、R
2またはR
3の少なくとも一方はHであり、R
5は
【化37】
である。さらに他の実施形態において、R
1は結合であり、R
2またはR
3の少なくとも一方はHであり、R
5は
【化38】
である。
【0098】
いくつかの実施形態において、R1は-CH2-であり、R5は-B(OZ1)(OZ2)である。いくつかの実施形態において、R1は-CH2-であり、R4は結合であり、R5は-B(OZ1)(OZ2)である。いくつかの実施形態において、R1は-CH2-であり、R4は結合であり、R5は-B(OZ1)(OZ2)であり、R2またはR3の少なくとも一方はHである。
【0099】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(VA)によって具体化される構造を有する:
【化39】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数である。〕。
【0100】
いくつかの実施形態において、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。さらに他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。
【0101】
いくつかの実施形態において、R1は-CH2-であり、Z1およびZ2は、独立して、H、メチル、またはエチルから選択される。いくつかの実施形態において、R1は-CH2-であり、Z1およびZ2は、独立して、H、メチル、またはエチルから選択され、R4は結合である。
【0102】
式(VA)のヌクレオチド(その任意の塩を含む)の非限定的な例には、以下が含まれる:
【化40-1】
【化40-2】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;および
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
いくつかの実施形態において、Z
1およびZ
2は、独立して、H、メチルまたはエチルから選択される。いくつかの実施形態において、Z
1およびZ
2は両方Hである。
【0103】
式(VA)のヌクレオチド(その任意の塩を含む)の追加の非限定的な例には、以下が含まれる:
【化41】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;および
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。〕。
【0104】
いくつかの実施形態において、複素環は、オルト位およびパラ位で-B(OH)2基で置換されている。
【0105】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(VB)によって具体化される構造を有する:
【化42】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は結合、置換または非置換の5-員または6-員のアリール基、-CH=CH-、または置換または非置換の5-員または6-員のヘテロシクロアルキル基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数である。〕。
【0106】
いくつかの実施形態において、R1は-CH2-である。いくつかの実施形態において、R1は-CH2-であり、R4は結合である。
【0107】
いくつかの実施形態において、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。さらに他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。
【0108】
いくつかの実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択され、R4は少なくとも一つの置換基を有するフェニル基である。他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択され、R4は少なくとも一つの置換基を有するフェニル基であり、ここで、少なくとも一つの置換基は、メチル、エチル、イソプロピル、またはtertブチルから選択される。さらに他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択され、R4は非置換のフェニル基である。
【0109】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(VC)によって具体化される構造を有する:
【化43】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数である。〕。
いくつかの実施形態において、R
1は結合であり、R
2またはR
3の少なくとも一方はHである。
いくつかの実施形態において、R
1は-CH
2-である。いくつかの実施形態において、R
1は-CH
2-であり、R
2またはR
3の少なくとも一方はHである。
【0110】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(VD)によって具体化される構造を有する:
【化44】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数である。〕。
【0111】
いくつかの実施形態において、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。さらに他の実施形態において、R1は結合であり、R2およびR3は、独立して、H、メチル、エチル、イソプロピル、およびtertブチルから選択される。
【0112】
いくつかの実施形態において、R1は-CH2-であり、Z1およびZ2は、独立して、H、メチル、またはエチルから選択される。いくつかの実施形態において、R1は-CH2-であり、Z1およびZ2は、独立して、H、メチル、またはエチルから選択され、R4は結合である。
【0113】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(VIA)によって具体化される構造を有する:
【化45】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換のフェニル基、-CH=CH-、または置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
10はOH、-(C(R
a)(R
b))
u-OH、-(C(R
a)(R
b))
u-C(O)H、または相互に1,3の位置にある2つの-S(O)-基を含む5-~8-員のシクロアルキル基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;および
uは、1~3の範囲の整数である。〕。
【0114】
いくつかの実施形態において、本開示のヌクレオチド(その任意の塩を含む)は、式(VIB)、(VIC)、(VID)、(VIE)、および(VIF)によって具体化される構造を有する:
【化46】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
R
1は、結合、-CH
2-、-C(O)-O-、-C(O)-NR
a-、または-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
8はO、NR
a、またはSである。
R
9はH、ハロゲン、C
1~C
4アルキル基、-C(O)-R
a、-N(R
a)(R
b)、または-NO
2である;
R
11およびR
12は、それぞれ独立して、Hまたは直鎖状または分岐状のC
1~C
4アルキル基であり;
R
13は結合、-CH
2-、または-CH
2-CH
2-であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eは、HまたはC
1~C
4アルキル基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
uは、1~3の範囲の整数である。〕。
【0115】
いくつかの実施形態において、複素環は、オルト位およびパラ位で-B(OH)2基で置換されている。
【0116】
いくつかの実施形態において、式(VIA)~(VIF)のいずれか1つの化合物は、ホウ酸または他の別の副生成物を含む混合物などの混合物として存在し得る。いくつかの実施形態において、式(VIA)~(VIF)のいずれか1つの化合物は、式(I)または式(II)のヌクレオチドとの混合物として存在し得る。
【0117】
核酸塩基および標識化核酸塩基
ここに記載されるように、本開示のヌクレオチドまたはヌクレオシドは、核酸塩基またはタグ付き核酸塩基を含み得る。「核酸塩基」とは、天然に存在する塩基および合成塩基を含む、オリゴヌクレオチド(例えば、RNAまたはDNA分子)内に含めるのに適した任意の窒素塩基を意味する。いくつかの実施形態において、核酸塩基は、アデニン、シトシン、グアニン、チミン、およびウラシルまたはそれらの誘導体または類似体から選択される。他の実施形態において、核酸塩基は、7-デアザグアニン、7-デアザアデニンまたは5-メチルシトシンである。
【0118】
いくつかの実施形態において、標識化核酸塩基は、式(VIIA)、(VIIB)、(VIIC)のいずれかによって具体化されるような構造を有する:
【化47】
〔式中、
R
15は核酸塩基であり;
「リンカー」は、1個と50個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり;
「標識」は、検出可能な種を含む。
【0119】
本発明のヌクレオチドを標識化する方法は、米国特許出願公開第2014/0134616号に開示されており、その開示は、参照によりその全体がここに組み込まれる。
【0120】
いくつかの実施形態において、「リンカー」は、ワトソン-クリック塩基対形成が依然として実行可能であるという条件で、核酸塩基上の任意の位置に付着され得る。いくつかの実施形態において、そしてプリン塩基の文脈において、リンカーは、7-デアザプリンの7位を介して、8-修飾プリンを介して、N-6修飾アデニンを介して、またはN-2修飾グアニンを介して結合される。いくつかの実施形態において、そしてピリミジンの文脈において、付着は、シトシン、チミンまたはウラシル上の5位およびシトシン上のN-4位を介する。
【0121】
いくつかの実施形態において、「リンカー」は、1個と50個との間の炭素原子を含む。いくつかの実施形態において、「リンカー」は、2個と25個との間の炭素原子を含む。いくつかの実施形態において、「リンカー」は、5個と20個との間の炭素原子を含む。いくつかの実施形態において、「リンカー」は、10個と20個との間の炭素原子を含む。いくつかの実施形態では、「リンカー」は、約100g/mol~約600g/molの範囲の分子量を有する。他の実施形態では、「リンカー」は、約40g/mol~約2000g/molの範囲の分子量を有する。他の実施形態では、「リンカー」は、約50g/mol~約1500g/molの範囲の分子量を有する。いくつかの実施形態において、「リンカー」は、約0.5nmと約80nmとの間の範囲の長さを有する。いくつかの実施形態において、「リンカー」は、約0.5nmと約50nmとの間の範囲の長さを有する。
【0122】
いくつかの実施形態では、「リンカー」は、切断することができる基、例えば、光切断可能な基、酵素的に切断可能な基、化学的に切断可能な基、特定のpHで切断可能な基を含む。「切断可能なリンカー」という用語の使用は、リンカー全体を核酸塩基から除去する必要があることを意味するものではない。むしろ、リンカー内の切断部位は、リンカーの一部が切断後に核酸塩基に付着したままであることを保証するリンカー上の位置に位置することができる。切断可能なリンカーを使用することで、必要に応じて、検出後に標識を除去できるようになり、その後に組み込まれる標識化ヌクレオチドとの干渉信号を回避できる。切断可能なリンカーは当技術分野で知られており、従来の化学を適用して、リンカーを核酸塩基および標識に付着させることができる。リンカーは、酸、塩基、求核試薬、求電子試薬、ラジカル、金属、還元剤または酸化剤、光、温度、酵素などへの曝露を含む、任意の適切な方法によって切断することができる。適切なリンカーは、Greene & Wuts, Protective Groups in Organic Synthesis, John Wiley & Sons.に開示されているように、標準的な化学的ブロッキング基から適合させることができる。固相合成で使用されるさらに適切な切断可能なリンカーは、Guillier等の(Chem. Rev. 100:2092-2157, 2000)に開示されており、その開示は、参照によりその全体がここに組み込まれる。
【0123】
いくつかの実施形態では、リンカーは、任意選択で1つまたは複数のスペーサー単位を含み得ると考えられている。スペーサーは、核酸塩基を切断部位、標識、またはリンカーから離間させる。標識がヌクレオチドと酵素、例えばポリメラーゼとの間の相互作用を妨害しないようにヌクレオチドから十分な距離に保持されている限り、リンカーの長さは重要ではない。いくつかの実施形態において、標識化核酸塩基は、構造-[核酸塩基]-[リンカー]-[エクステンダー]y-[標識]を含み、「エクステンダー」は、1個と60個との間の炭素原子を有し、任意選択的に、1つまたは複数のヘテロ原子で置換された、直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、脂肪族基または芳香族基であり;yは0、1、または2である。
【0124】
適切なリンカーには、ジスルフィドリンカー、酸に不安定なリンカーが包含され、ジアルコキシベンジルリンカー、Sieberリンカー、インドールリンカー、t-ブチルSieberリンカー、求電子的に切断可能なリンカー、求核的に切断可能なリンカー、光切断可能なリンカー、還元条件下での切断、酸化条件下、安全キャッチリンカーの使用による切断、および脱離機構による切断が含まれる。
【0125】
光切断可能なリンカーは、糖質化学で広く使用されてきた。いくつかの実施形態において、切断を活性化するために必要とされる光は、修飾ヌクレオチドの他の成分に影響を及ぼさない。フルオロフォアは、リンカー分子を切断するために必要な波長とは異なる波長の光を吸収するように選択される。適切なリンカーには、o-ニトロベンジル化合物およびニトロベラトリル化合物に基づくリンカーが含まれる(例として、5-ヒドロキシ-2-ニトロベンジルアルコールを出発物質として使用することができる。)。一実施形態では、光切断可能なリンカーは、2-ニトロベンジル部分である。ベンゾイン化学に基づくリンカーも使用できる(Lee等のJ. Org.Chem. 64:3454-3460, 1999)。
【0126】
例えば、基は、約200nmと約400nm(UV)との間の、または約400nmと約800nm(可視)との間の波長を有する電磁放射源への曝露時に切断され得るリンカー中に導入され得る。いくつかの実施形態では、UVまたは可視光の光切断可能な基は、アリールカルボニルメチル基(4-アセチル-2-ニトロベンジル、ジメチルフェナシル(DMP)、2-(アルコキシメチル)-5-メチル-α-クロロアセトフェノン、2,5-ジメチルベンゾイルオキシラン、およびベンゾイン基:3’,5’-ジメトキシベンゾイン(DMB)を含む。)、o-ニトロベンジル基(1-(2-ニトロフェニル)エチル(NPE)、1-(メトキシメチル)-2-ニトロベンゼン、4,5-ジメトキシ-2-ニトロベンジル(DMNB);1-(2-ニトロフェニル)エチルオキシカルボニルおよび2-ニトロ-2-フェノール誘導体、ならびにアシル化5-ブロモ-7-ニトロインドリンなどのo-ニトロアニリド)を含む、α-カルボキシニトロベンジル(α-CNB)、o-ニトロ-2-フェネチルオキシカルボニル基;クマリン-4-イル-メチル基(7-メトキシクマリン誘導体を含む);9-置換キサンテン、およびアリールメチル基(o-ヒドロキシアリールメチル基を含む)、からなる群から選択される。
【0127】
いくつかの実施形態において、約700nmと約1000nmとの間の波長を有する電磁放射線源への曝露時に切断され得る基がリンカーに導入され得る。適切な近赤外光切断基には、C4-ジアルキルアミン置換ヘプタメチンシアニンを含むシアニン基が含まれる。
【0128】
さらに他の実施形態では、「リンカー」は、還元剤を含む異なる化学反応物によって、またはpHの誘導された変化によって切断され得る化学的に切断可能な基を含む(例えば約7未満のpHでの基の切断。)。適切な化学的に切断可能な基には、ジスルフィドベースの基:ジアゾベンゼン基(亜ジチオン酸ナトリウムに感応性の2-(2-アルコキシ-4-ヒドロキシ-フェニルアゾ)安息香酸骨格(scaffolds)を含む);エステル結合ベースのグループ(高pH);酸性に感応性のリンカー(ジアルコキシジフェニルシランリンカーやアシルヒドラゾンなど)が含まれる。隣接するジオールで切断可能なリンカーは、“A simple and effective cleavable linker for chemical proteomics applications,” Mol Cell Proteomics, 2013 Jan;12(1):237-44. doi:10.1074/mcp.M112.021014. Epub 2012 Oct 1.に開示されているように、NaIO4によって切断される可能性がある。適切な酵素的に切断可能な基には、トリプシン切断可能基およびV8プロテアーゼ切断可能基が含まれる。本開示のヌクレオチドのいずれかで利用され得るさらなるリンカーは、米国特許出願公開第2018/0057870号に開示されており、その開示は、参照によりその全体がここに組み込まれる。
【0129】
求電子的に切断されたリンカーは、プロトンによって切断されると考えられており、酸に感応性の切断を含む。適切なリンカーには、トリチル、p-アルコキシベンジルエステルおよびp-アルコキシベンジルアミドなどの修飾ベンジル系が含まれる。他の適切なリンカーには、tert-ブチルオキシカルボニル(Boc)基およびアセタール系が含まれる。チオアセタールまたは他の硫黄含有保護基の切断におけるニッケル、銀または水銀などのチオフィリック金属の使用もまた、適切なリンカー分子の調製のために考慮され得る。
【0130】
求核性切断は、リンカー分子の調製においてもよく認識されている方法である。水中で不安定な(すなわち、塩基性pHで単純に切断することができる)エステルおよび非水性求核試薬に対して不安定である基などの基を使用することができる。フッ化物イオンは、トリイソプロピルシラン(TIPS)やt-ブチルジメチルシラン(TBDMS)などの基のシリコン-酸素結合を切断するために使用できる。
【0131】
還元的切断を受けやすいことが知られている多くのリンカーがある。パラジウムベースの触媒を使用した接触水素化は、ベンジル基とベンジルオキシカルボニル基を切断するために使用されてきた。ジスルフィド結合の還元も当技術分野で知られている。
【0132】
酸化ベースのアプローチは当技術分野でよく知られている。これらには、p-アルコキシベンジル基の酸化と硫黄およびセレンリンカーの酸化が含まれる。ジスルフィドおよび他の硫黄またはセレンベースのリンカーを切断するための水性ヨウ素の使用もまた、本開示の範囲内である。いくつかの実施形態において、リンカーは、基-CH2-O-CH[B(OH)2]-CH2--リンカーを含む。いくつかの実施形態において、リンカーは、1,2-ジオール(-CH(OH)-CH(OH)-)ベースのリンカーを含む。
【0133】
セーフティ-キャッチリンカーは、2つのステップで切断するリンカーである。いくつかの実施形態において、第1のステップは、反応性求核中心の生成であり、その後、切断をもたらす分子内環化を含む第2のステップが続く。例えば、レブリン酸エステル結合をヒドラジンまたは光化学で処理して活性アミンを放出し、次にこれを環化して分子内の他の場所でエステルを切断することができる(Burgess et al., J. Org. Chem. 62:5165-5168, 1997)。
【0134】
脱離反応も使用できる。例えば、Fmocおよびシアノエチルなどの塩基触媒による脱離、ならびにパラジウム触媒によるアリル系の還元的脱離を使用できる。
【0135】
標識は、検出可能な任意の化学基または分子であってよい。いくつかの実施形態において、標識は、例えば、その電荷、形状、サイズ、または任意の組み合わせによって、ナノポア内で検出することができる任意の化学基または分子であり得る。いくつかの実施形態において、標識は、エチレングリコールまたはエチレングリコールに由来するポリマー、アミノ酸、炭水化物、ペプチド、色素(フルオロフォアを含む)、化学発光化合物、質量標識、モノヌクレオチド、ジヌクレオチド、トリヌクレオチド、テトラヌクレオチド、ペンタヌクレオチド、ヘキサヌクレオチド、オリゴヌクレオチド、修飾オリゴヌクレオチド、脂肪酸、芳香族酸、アルコール、チオール基、シアノ基、ニトロ基、アルキル基、アルケニル基、アルキニル基、アジド基のうちの1つまたは複数、またはそれらの組み合わせを含む。他の標識はFuller等の“Real-time single-molecule electronic DNA sequencing by synthesis using polymer-tagged nucleotides on a nanopore array,” PNAS May 10, 2016 113 (19) 5233-5238によって開示されており、その開示は、参照によりその全体がここに組み込まれる。いくつかの実施形態において、標識は、化合物中のリン酸基の数のバランスをとるために、適切な数のリジンまたはアルギニンをさらに含む。他の適切な標識の例には、PCT公開番号、国際公開第1991/006678号パンフレット、国際公開第2018/191389号パンフレット、および国際公開第2004/018497号パンフレットに記載されているラベルが含まれ、それらの開示は、参照によりその全体がここに組み込まれる。
【0136】
いくつかの実施形態において、標識は、質量によって識別可能であり、したがって質量分析によって分析することができる1つまたは複数のレポーター基を含む質量標識である。レポーター基は化学的に異なる可能性があり、したがって分子量によって互いに区別される可能性がある。あるいはまた、レポーター基は化学的に同一である可能性があるが、異なる同位体を含むことによって互いに区別される(例えば、2C/13Cおよび1H/2H2C/13Cおよび1H/2H)。標識部分は、および/またはレポーター基は、例えば、光化学的または他の適切な手段による切断後、質量分析による分析に適しているか、または適合されている。適切な質量標識の例には、米国特許第7,132,519号、第9,291,597号、および第10,078,083号に記載されているものが含まれ、これらの開示は、参照によりその全体がここに組み込まれる。適切な質量標識の追加の例には、Xu L等の“Electrophore Mass Tag Dideoxy DNA Sequence,” Anal. Chem. 1997, Sept. 1;69(17):3595-602に開示されるようなエレクトロホアラベルが含まれ、その開示は、参照によりその全体がここに組み込まれる。
【0137】
いくつかの実施形態において、標識はポリマーである。いくつかの実施形態において、標識はポリエチレングリコール(PEG)ポリマーである。ポリマーがPEGである実施形態では、任意の数のエチレングリコール単位を有するPEGポリマーを選択することができる。例えば、PEGポリマー中のエチレングリコール単位の数は、1と100との間の範囲であってよい。いくつかの場合において、PEGポリマーのエチレングリコール単位の数はヌクレオチドの種類ごとに異なる。例えば、4つの異なるタイプのヌクレオチドの場合、それぞれが、PEGポリマー中に16個、20個、24個、または36個のエチレングリコール単位のいずれかを有する異なる標識を含み得る。いくつかの実施形態において、PEGベースのポリマーは直鎖状である。他の実施形態において、PEGベースのポリマーは分岐状、すなわち、PEGベースのポリマーは、複数のPEG鎖を含む。いくつかの場合において、標識は、クマリンベースの染料、またはクマリンベースの染料の誘導体または類似体などの追加の識別可能な部分をさらに含む。いくつかの場合において、ポリマーは帯電している。いくつかの場合において、ポリマーは帯電しておらず、標識は高濃度の塩(例えば、3~4M)で検出される。標識の追加の例は、米国特許出願公開第2015/0368710号、同第2018/0073071号、同第2015/0111759号、同第2013/0264207、同第2013/0244340号、同第2014/0134616号、および同第2018/0112257号に開示されており、それらの開示は、参照によりその全体がここに組み込まれる。特に、上記の米国出願公開第2015/0368710号および同第2015/0111759号は、ナノポアSBSのための標識化ヌクレオチドの使用を記載しており、分岐PEG鎖を含む単一の標識に付着した単一ヌクレオチドの可能な使用を開示している。他のPEGラベル化ヌクレオチドは、Shiv Kumar等の“PEG-Labeled Nucleotides and Nanopore Detection for Single Molecule DNA Sequencing by Synthesis,” Scientific Reports 2, Article Number 684 (2012);およびCarl Fuller等の“Real-time single molecule electronic DNA sequencing by synthesis using polymer-tagged nucleotides on a nanopore array,” Proc. Natl. Acad. Sci. USA 2016; May 10; 113(19):5233-5238に開示されている。
【0138】
いくつかの実施形態において、標識はフルオロフォアである。フルオロフォアは、クマリン、フルオレセイン(またはフルオレセイン誘導体および類縁体)、ローダミン、オキサジン(レゾルフィンを含む)、BODIPY、発光団およびシアニンを含むいくつかの一般的な化学クラスに属する。蛍光分子の追加の例は、Molecular Probes Handbook-A Guide to Fluorescent Probes and Labeling Technologies,Molecular Probes,Eugene,OR,TheroFisher Scientific,11th Editionに見ることができる。 他の実施形態では、フルオロフォアは、キサンテン誘導体、シアニン誘導体、スクアライン誘導体、ナフタレン誘導体、クマリン誘導体、オキサジアゾール誘導体、アントラセン誘導体、ピレン誘導体、オキサジン誘導体、アクリジン誘導体、アリールメチン誘導体、およびテトラピロール誘導体から選択される。他の実施形態では、蛍光部分は、CF色素(Biotiumから入手可能)、DRAQおよびCyTRAKプローブ(BioStatusから入手可能)、BODIPY(Invitrogen)、Alexa Fluor(Invitrogen)、DyLight Fluor(例えば、DyLight 649)(Thermo Scientific、Pierceから入手可能)、AttoおよびTracy(Sigma Aldrichから入手可能)、FluoProbes(Interchimから入手可能)、Abberior Dyes(Abberiorから入手可能)、DY and MegaStokes Dyes(Dyomicsから入手可能)、Sulfo Cy dyes(Cyandyeから入手可能)、HiLyte Fluor(AnaSpecから入手可能)、Seta、SeTau およびSquare Dyes(SETA BioMedicalsから入手可能)、QuasarおよびCal Fluor dyes(Biosearch Technologiesから入手可能)、SureLight Dyes(APC、RPEPerCP、Phycobilisomesから入手可能)(Columbia Biosciences)、ならびにAPC、APCXL、RPE、BPE(Phyco-Biotech、Greensea、Prozyme、Flogenから入手可能)から選択される。
【0139】
前述によれば、本開示の標識化ヌクレオチド(その任意の塩を含む)の非限定的な例は、式(VIIIA)、(VIIIB)、または(VIIIC)のいずれかによって具体化されるような構造を有する:
【化48】
〔式中、
R
15は、核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
「保護基」は、構造:
【化49】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-である。)を有する基であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-員または6-員のアリール基である。)を有する基であり;
「リンカー」は、1個と50個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり;および
「標識」は、ここに記載されている種のいずれかを含む、検出可能な種である。〕。
【0140】
本開示の標識化ヌクレオチド(その任意の塩を含む)の非限定的な他の例は、式(VIIID)、(VIIIE)、または(VIIIF)のいずれかによって具体化されるような構造を有する:
【化50】
〔式中、
R
15は、核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは、0または1~5の範囲の整数である。)であり;
「スペーサー」は、1個と16個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり;
「ブロッキング部分」は、1個と20個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり、ただし、「Blocking Moiety」は、アジド基、イソニトリル、シアノ基、O、N、S、またはSeから選択される少なくとも一つのヘテロ原子を有する5-~8員のヘテロシクロアルキル基、置換または非置換の1,4-エポキシ-1,4-ジヒドロナフタレン、または構造:
【化51】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-または6-員のアリール基である。)を有する基であり;
「リンカー」は、1個と50個との間の炭素原子を有する直鎖状または分岐状の、置換または非置換の、飽和または不飽和の、任意選択的に1つまたは複数のヘテロ原子で置換される脂肪族基もしく芳香族基であり;および
「標識」は、ここに記載されている種のいずれかを含む、検出可能な種であり、
ただし、「ブロッキング部分」が-N
3である場合、「スペーサー」は-CH
2-ではない。〕。
【0141】
保護ヌクレオチドの脱保護
本開示はまた、ここに記載の保護されたヌクレオチドのいずれかを脱保護する方法を提供する。ここに記載のように成長中のオリゴヌクレオチドに保護ヌクレオチドを組み込んだ後、保護ヌクレオチドを脱保護して、脱保護ヌクレオチドを生成することができる。ヌクレオチドが標識またはラベルを含み、脱保護が標識またはラベルの除去の前または後に起こり得る実施形態において。他の実施形態では、脱保護は、存在する場合、標識またはラベルの除去と同時に起こり得る。
【0142】
図5を参照すると、本開示による保護ヌクレオチド500は、中間体501を提供するために脱保護試薬で処理され得る。いくつかの実施形態において、脱保護は、非還元試薬を使用して実施される。他の実施形態において、脱保護は、酸化剤を使用して実施される。さらに他の実施形態において、脱保護は、レドックス中性試薬を使用して実施される。適切な試薬の例には、これらに限定されないが、過酸化水素、過ヨウ素酸ナトリウム、過塩素酸ナトリウム、または過オキシ硝酸塩が包含される。適切な試薬の他の例には、テトラジンまたはその誘導体、またはエステラーゼが含まれるが、これらに限定されない。適切な試薬のさらに別の例には、(トリス(2-カルボキシエチル)ホスフィン)およびジチオスレイトールが含まれる。
【0143】
いくつかの実施形態において、中間体501は、自然発生的な脱離または加水分解を受けて、脱保護されたヌクレオチド502を提供する。例えば、中間体は、中間体501の構成および中間体501が存在する条件に応じて、1,6脱離またはベータ脱離を受ける可能性がある。いくつかの実施形態において、中間体501は、次に、任意選択的に塩基で処理されて、脱保護されたヌクレオチド502を提供し得る。いくつかの実施形態において、適切な塩基には、ピペリジン、1,8-ジアザビシクロ[5.4.0]ウンデカ-7-エン(DBU)、アンモニア、ジイソプロピルエチルアミン、および水酸化ナトリウムが含まれるが、これらに限定されない。
【0144】
以下のスキーム1は、脱保護試薬、例えば、過酸化水素、過ヨウ素酸ナトリウム、過塩素酸ナトリウム、またはNaONO2の存在下で保護ヌクレオチド100(式(IIIA)を有する保護ヌクレオチドなど)を脱保護して、中間200(式(VIA)を有する中間体など)を提供し、次に、これは、自然発生的な脱離または加水分解を受けて、脱保護されたヌクレオチド300を提供し得る。ここに記載されるように、ヌクレオチド100、200、または300のそれぞれは、オリゴヌクレオチドに組み込むことができ、標識またはラベルを含み得る。さらに例示的な脱保護戦略を、以下に記載されるスキーム2~9に示す。
【0145】
【化52】
スキーム 1:保護ヌクレオチドの脱保護を示し、式中、R
1、R
2、R
3、R
4、R
5、R
10、Y、およびXは、ここに記載されている通りである。
【化53】
スキーム 2:本開示のいくつかの実施形態による、ボロネート部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化54】
スキーム 3:本開示のいくつかの実施形態による、ボロネート部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化55】
スキーム 4:本開示のいくつかの実施形態による、ボロネート部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化56】
スキーム 5:本開示のいくつかの実施形態による、ボロネート部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化57】
スキーム6:本開示のいくつかの実施形態による、ボロネート部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化58】
スキーム 7:本開示のいくつかの実施形態による、アジド部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化59】
スキーム8:本開示のいくつかの実施形態による、イソニトリル部分を含む保護ヌクレオチドの脱保護を示し、式中、YおよびXは、ここに記載される通りである。
【化60】
スキーム9:本開示のいくつかの実施形態による、マロン酸部分を含む保護されたヌクレオチドの脱保護を例示する。
【0146】
ナノポア配列決定
本開示はまた、ナノポア配列決定方法を提供し、それにより、この方法は、式(I)、(II)、(IIIA)、(IIIB)、(IIIC)、(IIID)、(IV)、(VA)、(VB)、(VC)、(VD)、(VIIIA)、(VIIIB)、(VIIIC)、(VIIID)、(VIIIE)、および(VIIIF)のヌクレオチド(またはその塩)のいずれかを含む、ここに記載のヌクレオチドまたは標識化ヌクレオチドのいずれかを利用する。
【0147】
概要
例えばDNAまたはRNAなどのポリヌクレオチドのナノポア配列決定は、ポリヌクレオチド配列の鎖配列決定および/またはエキソ配列決定によって達成することができる。いくつかの実施形態において、鎖配列決定は、ポリヌクレオチドテンプレートのヌクレオチドがナノポアを通るときに、サンプルポリヌクレオチド鎖のヌクレオチド塩基が直接決定される方法を含む。いくつかの実施形態において、ナノポアベースのヌクレオチド酸配列決定は、酵素によって成長中の鎖に組み込むことができる4つのヌクレオチド類似体の混合物を使用する。いくつかの実施形態において、ポリヌクレオチドは、それを膜の微細な細孔に通すことによって配列決定され得る。いくつかの実施形態において、塩基は、それらが膜の一方の側から他方の側に細孔を通って流れるイオンに影響を与える方法によって識別され得る。いくつかの実施形態において、1つのタンパク質分子は、DNAヘリックスを2つの鎖に「解凍(unzip)」することができる。2番目のタンパク質は、膜に細孔を作り、「アダプター」分子を保持することができる。細孔を通るイオンの流れは電流を生成することでき、それによって各塩基はイオンの流れを異なる程度に遮断し、電流を変化させることができる。アダプター分子は、塩基を電子的に識別するのに十分な時間、塩基を所定の位置に保つことができる(PCT公開番号、国際公開第2018/034745号パンフレット、および米国特許出願公開番号第2018/0044725号および同第2018/0201992号を参照されたい。これらの開示は、参照によりその全体がここに組み込まれる。)。
【0148】
いくつかの実施形態において、ナノポアは、核酸分子を間接的に配列決定するために使用され得る、すなわち、間接配列決定は、重合された核酸分子が配列決定中にナノポアを通過しない任意の方法を含み得る。これらの実施形態において、核酸分子は、ナノポアの前庭に少なくとも部分的に位置し得るが、ナノポアのポア(すなわち、最も狭い部分)には位置し得ない。ヌクレオチド組み込みイベントから放出される副生成物、例えば少なくとも式(I)および(II)に記載されているものを含む、標識化ヌクレオチドから切断された標識がナノポアで検出されるように、核酸分子は、ナノポアから任意の適切な距離内および/またはナノポアに近接して、および任意選択的に、ある距離内を通過することができる。
【0149】
いくつかの実施形態において、各ヌクレオチド類似体は、ナノポアで検出されたときに識別可能で、区別可能な署名を提供する共有結合した標識部分を有する。鎖伸長酵素(例えば、DNAポリメラーゼ)は、その活性部位で成長中の核酸鎖にハイブリダイズするテンプレート核酸鎖に相補的な標識化ヌクレオチド化合物に特異的に結合する。次に、鎖伸長酵素は、標識化ヌクレオチド化合物の相補的ヌクレオチド部分を、成長中の核酸鎖の末端に触媒的に結合する(すなわち、組み込む)。触媒的組み込みイベントの完了の結果、標識部分とオリゴリン酸部分(成長中の鎖に組み込まれた1つのリン酸を除く)が放出され、それらは次いで隣接するナノポアを通過する。しかしながら、それが組み込まれたヌクレオチドからそれを放出する触媒プロセスを受ける前でさえ、標識化ヌクレオチド化合物の標識部分は、印加された電位の下でナノポアのポアに入り、それによってナノポアを通るバックグラウンド正イオンの流れを変える。一般に、ナノポアに標識部分が存在すると、ナノポアを通る陽イオンの流れが減少(または遮断)する。この「ブロッキング電流」は、標識部分が存在しないナノポアを通る正イオンの流れから生じる「オープチャンネル」(または「O.C.」)電流のパーセンテージ(またはそれ以下)である信号として検出される。
【0150】
いくつかの実施形態において、ナノポアベースの配列決定は、保護ヌクレオチド、例えば、ここの少なくとも式(I)または(II)のものを、成長中の(新生)ポリヌクレオチド鎖に組み込む、ナノポアの近くに位置するものなどの酵素が利用され、ここで、成長中のポリヌクレオチド鎖は、対応するテンプレート核酸鎖に相補的である。ヌクレオチド組み込みイベントは、DNAポリメラーゼまたはその変形体または変異体などの酵素によって触媒され、テンプレート分子との塩基対相互作用を使用して、各位置での組み込みに利用可能なヌクレオチドの中から選択される。「ヌクレオチド組み込みイベント」は、その用語がここで使用される場合、保護ヌクレオチド(式(I)または(II)のもののいずれかを含む)の成長中のポリヌクレオチド鎖への組み込みを意味する。いくつかの実施形態において、ヌクレオチド組み込みイベントの副生成物は、ナノポアによって検出され得る。いくつかの実施形態において、副生成物は、所与のタイプのヌクレオチドの組み込みと相関し得る。いくつかの実施形態において、副生成物は、ナノポアを通過し、および/またはナノポアで検出可能な信号を生成する(例えば、
図4を参照)。上記で特定された標識のいずれかなどの放出された標識分子は、ヌクレオチド組み込みイベントの副生成物の例である。例として、
図1は、ナノポア(130)に近接して結合したDNAポリメラーゼ(120)を示している。配列決定されるポリヌクレオチドテンプレート(170)は、プライマーと共に加えられる(テンプレートは酵素に関連している)。このナノポア配列決定複合体(プライマーを含む)に、4つの異なる標識化ヌクレオチド(140)がバルク水相に追加される。ポリメラーゼが触媒する正しいヌクレオチドの組み込み後、標識は放出され、ナノポア(130)を通過して、固有のイオン電流遮断信号(150)が生成され、それにより、各標識が異なる化学構造を有するために、追加された塩基を電子的に識別することができる。そのようなナノポアベースの配列決定システムおよび方法に関する追加の詳細は、米国特許第9,605,309号および同第9,557,294号に記載されており、それらの開示は、参照によりその全体がここに組み込まれる。
【0151】
いくつかの実施形態において、核酸分子を配列決定するための方法は、(a)保護標識化ヌクレオチドを重合すること例えば、テンプレートとして第1の核酸分子を使用して一度に1つの標識化ヌクレオチドを組み込む酵素を使用する)であって、ここで、個々のヌクレオチドに関連する標識は、重合時に放出され、保護標識化ヌクレオチドは、式(I)または(II)のいずれかを有する、重合することと;および(b)ナノポアを使用して放出された標識を検出することを含む。いくつかの実施形態において、任意の3’保護ヌクレオチドのブロッキング基が除去され、次いで、プロセスが反復して繰り返される。いくつかの実施形態において、酵素は、保護標識化ヌクレオチドのプールから引き出す。ここに記載されるように、保護ヌクレオチドの各タイプは、標識が放出されてナノポアの近くまたはナノポアを通過するときに、生成される信号に基づいて互いに区別され得るように、異なる標識分子に結合される(例えば、
図1)。いくつかの実施形態において、各標識は、異なる検出可能な信号、例えば、異なる信号強度、異なる信号振幅などを有し得、これらは、ベース呼び出しアルゴリズムなどによって解釈され得る。
【0152】
いくつかの実施形態において、放出された標識は、ナノポアを通過するか、またはナノポアの近くを通過するときに、感知回路が標識に関連する電気信号を検出するように、ナノポアを通ってまたはナノポアに近接して流れる。検出された信号(すなわち、配列決定データ)は、収集され、メモリ位置に格納され、後で核酸の配列を構築するために使用され得る。収集された信号は、エラーなど、検出された信号の異常を説明するために処理される場合がある。適切なナノポア検出器は、米国特許出願公開第2011/0193570号および同第2018/0073071号に記載されており、それらの開示は、参照によりその全体がここに組み込まれる。同様に、米国特許第9,377,437号および同第8,324,914号は、ナノポアベースの配列決定システムからの電気信号の収集および分析を記載しており、その開示もまた、参照によりその全体がここに組み込まれる。
【0153】
いくつかの実施形態において、ナノポアに結合または他の方法で結合される酵素は、ポリヌクレオチドプロセシング酵素、例えば、DNAおよびRNAポリメラーゼ、逆転写酵素、エキソヌクレアーゼ、およびアンフォールダーゼを含む。いくつかの実施形態において、酵素はヘリカーゼである。いくつかの実施形態において、酵素は、野生型酵素であり得るか、または、野生型酵素の変形型であり得る。いくつかの実施形態において、酵素はポリメラーゼ変形体である。例えば、ポリメラーゼ変形体は、H223、N224、Y225、H227、I295、Y342、T343、I357、S360、L361、I363、S365Q、S366、Y367、P368、D417、E475、Y476、F478、K518、H527、T529、M531、N535、G539、P542、N545、Q546、A547、L549、I550、N552、G553、F558、A596、G603、A610、V615、Y622、C623、D624、I628、Y629、R632、N635、M641、A643、I644、T647、I648、T651、I652、K655、W656、D657、V658、H660、F662、およびL690に対応する位置に少なくとも一つの変化を含み得る。他の適切なポリメラーゼ変形体は、米国特許出願公開第2016/0222363号に開示されており、その開示は、参照によりその全体がここに組み込まれる。さらに他の適切な酵素は、米国特許第9,797,009号に開示されており、その開示は、参照によりその全体がここに組み込まれる。より一層さらに適切な酵素は、米国特許出願公開第2016/0257942号に開示されている。
【0154】
いくつかの実施形態において、ナノポア配列決定複合体のナノポアは、限定されることなく、生物学的ナノポア、固体ナノポア、およびハイブリッド生物学的固体ナノポアを含む。ナノポア配列決定複合体の生物学的ナノポアには、E. coli, sp.,Salmonella sp.、Shigella sp.およびPseudomonas sp.,Cytolysin A (ClyA)由来のOmpG、およびS. aureus sp.,MspA from M. smegmatis sp由来のアルファ溶血素が含まれる。例えば、米国特許出願公開第2017/0088588号を参照されたい。その開示は、参照によりその全体がここに組み込まれる。いくつかの実施形態では、ナノポアシーケンシング複合体のバリアントナノポアは、それが由来するナノポアのイオン電流ノイズを低減するように操作される。さらに他のナノポアは、米国特許出願公開第2017/0268052号、同第2017/0356037号、および同第2018/0201993号に記載されており、これらの開示は参照によりその全体がここに組み込まれる。現在知られている、または後に発見された任意のナノポア変形体は、1つまたは複数の酵素変形体のスクリーニングと同時に(例えば、望ましい特性を提供するナノポア変形体および酵素変形体のペアを同定するために)、ここに記載の方法に従ってスクリーニングされ得る。
【0155】
ナノポアは、集積回路などの感知回路の感知電極に隣接して配置された膜に形成されるか、さもなければ埋め込まれ得る。集積回路は、特定用途向け集積回路(ASIC)であり得る。いくつかの例では、集積回路は、電界効果トランジスタまたは相補型金属酸化膜半導体(CMOS)である。感知回路は、ナノポアを有するチップまたは他のデバイス内に、またはオフチップ構成などのチップまたはデバイスの外に配置することができる。半導体は、第IV族(例えば、ケイ素)および第III~第V族の半導体(例えば、ガリウムヒ素、二硫化モリブデン)を含むがこれらに限定されない任意の半導体であり得る。ナノポア配列決定複合体を組み立てるための方法は、米国特許出願公開第2017/0268052号に記載されており、その開示は、参照によりその全体がここに組み込まれる。異なるテンプレートのそれぞれをナノポア酵素コンジュゲートに複合体化するための他の適切な方法には、PCT公開番号、国際公開第2014/074727号パンフレット、同第2006/028508号パンフレット、および同第2012/083249号パンフレットに記載されている方法が含まれ、それぞれの開示は、参照によりその全体がここに組み込まれる。
【0156】
図2は、ナノポアベースの配列決定チップ内のセル160の実施形態を示す。いくつかの実施形態において、膜102は細胞の表面上に形成される。いくつかの実施形態において、膜102は脂質二重層である。タンパク質ナノポア膜貫通分子複合体(PNTMC)および目的の分析物を含むバルク電解質114は、細胞の表面に直接配置される。いくつかの実施形態において、単一のPNTMC104は、エレクトロポレーションによって膜102に挿入される。いくつかの実施形態において、アレイ内の個々の膜は、互いに化学的にも電気的にも接続されていない。したがって、アレイ内の各セルは独立した配列決定マシンであり、PNTMCに関連付けられた単一のポリマー分子に固有のデータを生成する。いくつかの実施形態において、PNTMC104は、分析物に作用し、そうでなければ不浸透性の二重層を通るイオン電流を変調する。
【0157】
図2を引き続き参照すると、
図2に示されるように、アナログ測定回路112は、電解質108の薄膜で覆われた金属電極170(例えば、ルテニウム、酸素、チタン、または窒素からなる電極)に接続されている。いくつかの実施形態において、電解質108の薄膜は、イオン不透過性膜102によってバルク電解質114から分離されている。PNTMC104は、膜102を通過し、イオン電流がバルク液体から作用電極170に流れるための唯一の経路を提供する。いくつかの実施形態において、セルはまた、電気化学ポテンシャルセンサーである対極(CE)116を含む。いくつかの実施形態において、セルはまた、参照電極117を含む。
【0158】
核酸サンプルを配列決定するためのチップは、複数の個別にアドレス指定可能なナノポアを含み得る。複数の個別にアドレス指定可能なナノポアは、集積回路に隣接して配置された膜に形成された少なくとも1つのナノポアを含むことができる。いくつかの実施形態において、個々にアドレス指定可能な各ナノポアは、個々のヌクレオチドに関連する標識を検出することができる可能性がある。
【0159】
複数のナノポアセンサーは、チップまたはバイオチップ上に存在するアレイなどのアレイとして提供され得る。ナノポアのアレイは、任意の適切な数のナノポアを有し得る。いくつかの場合において、アレイは、約200、約400、約600、約800、約1000、約1500、約2000、約3000、約4000、約5000、約10000、約15000、約20000、約40000、約60000、約80000、約100000、約200000、約400000、約600000、約800000、約1000000などのナノポアを含む。バイオチップおよびバイオチップを製造するための方法は、PCT公開番号、国際公開第2015/061511号に記載されており、その開示は、参照によりその全体がここに組み込まれる。複数のナノポアを含むさらに適切なバイオチップは、米国特許出願公開第2017/0268052号に記載されており、その開示は、参照によりその全体がここに組み込まれる。さらに適切なナノポアアレイは、米国特許第8,986,928号に記載されており、その開示は、参照によりその全体がここに組み込まれる。
【0160】
保護ヌクレオチドまたは保護標識化ヌクレオチドのオリゴマーへの組み込み
本開示は、ナノポア配列決定に使用されるオリゴヌクレオチドなどのオリゴマーを合成する方法を提供し、オリゴマーは、ここに開示される保護ヌクレオチドまたは保護標識化ヌクレオチドに由来する。
【0161】
図3Aは、式(I)、(II)、(IIIA)、(IIIB)、(IIIC)、(IIID)、(IV)、(VA)、(VB)、(VC)、(VD)、(VIIIA)、(VIIIB)、(VIIIC)、(VIIID)、(VIIIE)、および(VIIIF)のいずれかのヌクレオチドを使用してオリゴヌクレオチドを合成する一般的な方法を示すフローチャートを示す。ステップ320で、保護ヌクレオチドまたは保護標識化ヌクレオチドが、ナノポア配列決定複合体などに導入される。いくつかの実施形態において、保護ヌクレオチドまたは保護標識化ヌクレオチドは、保護ヌクレオチドまたは保護標識化ヌクレオチドの「プール」として導入され、ここで、プールは、異なる保護ヌクレオチドまたは保護されたタグ付きヌクレオチドを含み得、それぞれは、少なくともそれに結合された核酸塩基または標識化核酸塩基において異なる。いくつかの実施形態において、プールは、配列決定されるDNA中のA、T、G、またはCヌクレオチド(または、RNA配列決定の場合、A、G、C、およびU)とハイブリダイズすることができる保護ヌクレオチドまたは保護標識化ヌクレオチドを含む。いくつかの実施形態において、少なくとも4つの異なる保護ヌクレオチドがプールに導入される。
【0162】
ステップ321において、保護ヌクレオチドまたは保護標識化ヌクレオチドは、成長中のオリゴヌクレオチド鎖に酵素的に組み込まれる。例として、ポリメラーゼ酵素は、保護ヌクレオチドまたは保護標識化ヌクレオチドのプールから引き出し、保護ヌクレオチドまたは保護標識化ヌクレオチドを成長中のオリゴヌクレオチド鎖に酵素的に組み込むことができる。ステップ322で、保護ヌクレオチドまたは保護標識化ヌクレオチドは、ここに記載されるように、脱保護される。保護標識化ヌクレオチドが組み込まれる実施形態では、この方法は、標識を放出すること、および放出された標識を検出することをさらに含み得る。いくつかの実施形態において、標識は、脱保護の前(ステップ322)であるが、酵素的取り込みの後に(ステップ321)放出される。あるいはまた、および他の実施形態にいて、標識は、脱保護後(ステップ322)であるが、第2の保護ヌクレオチドまたは保護標識化ヌクレオチドの酵素的組み込み(ステップ323)の前に放出される。さらに他の実施形態において、標識の放出および脱保護は、同じステップで起こり得る(例えば、保護基に作用して脱保護を促進すると同時に、切断可能な類似体に作用してそれに結合した標識の放出を可能にする試薬を選択することができる)。ステップ323は、配列全体の核酸配列、例えば、DNAまたはRNA配列がナノポアで配列決定されるまで、このプロセスが反復して繰り返されることを示している。当業者は、ヌクレオチドのプールがステップ320で導入される場合、ポリヌクレオチドが本開示に従って配列決定され得るように、必要に応じてステップ321および322が繰り返され得る(ステップ323)ことを理解するであろう。
【0163】
図3Bは、ここに記載の切断可能な部分を含むものなど、保護標識化ヌクレオチドの酵素的組み込みのステップ(ステップ331)、続いて、保護されたタグ付きヌクレオチドからタグを除去し(332)、続く、組み込まれたヌクレオチド(今や脱標識された保護ヌクレオチド)を脱保護する(ステップ333)を示すフローチャートを示している。いくつかの実施形態において、異なる保護標識化ヌクレオチドのそれぞれは、それが鎖伸長酵素によって新しい相補的鎖に組み込まれるときに標識が生成する特有の検出可能な信号によって区別される。いくつかの実施形態において、放出された標識は、それらがヌクレオチドから放出された後、ナノポアを通って流れることができる。いくつかの実施形態において、電圧を印加して、ナノポアを通して標識を引っ張る。当業者は、ポリヌクレオチドが本開示に従って配列決定され得るように、必要に応じて、酵素的組み込み、標識除去、および脱保護のステップが繰り返され得る(ステップ334)ことを理解するであろう。
【0164】
この方法は、
図3Cにさらに示されている。示されるように、核酸鎖300は、ナノポア302を横切って、またはナノポア302に近接して(しかし、302の矢印によって示されるように通過しない)通過する。酵素303(例えば、DNAポリメラーゼ)は、テンプレート300として第1の核酸分子を使用して一度に1つの保護ヌクレオチドまたは保護標識化ヌクレオチドを組み込むことによって成長中の核酸鎖304を伸長する(すなわち、酵素はヌクレオチド組み込みイベントを触媒する)。
【0165】
いくつかの実施形態において、そして
図3Cを引き続き参照すると、酵素は、標識分子(符号305の黒塗りの丸)に付着した保護標識化ヌクレオチド(符号305の白抜きの丸)のプールから引き出される。保護標識化ヌクレオチドの各タイプは、異なる標識分子に付着しているため、標識が放出されてナノポア306を通過するとき、それらは、ナノポアで生成される信号に基づいて互いに区別され得る。いくつかの実施形態において、標識がナノポアの中および/または通過するときに、標識は電子的変化を生成し得る。いくつかの実施形態において、電子的変化は、電流振幅の変化、ナノポアのコンダクタンスの変化、またはそれらの任意の組み合わせである。ナノポア検出法で保護標識化ヌクレオチドを区別するために使用できる、単独または組み合わせでの検出可能な信号特性の中には、ナノポア内の標識の存在によって引き起こされるイオンフローの変化があり、これにより、ナノポア検出システムの電極全体の電流レベル測定値が変化する(DCまたはAC電位のいずれかで)。「イオン流」とは、ここで用いる場合、アノードとカソードとの間の電位などの起電力に起因する、典型的には溶液中でのイオンの移動を指す。イオン流は、典型的には、電流または静電ポテンシャルの減衰として測定することができる。したがって、いくつかの実施形態において、本開示は、それぞれが異なる標識を有する保護標識化ヌクレオチドのセットを提供し、ここで、それぞれの異なる標識は、細孔を通る異なるイオンの流れを引き起こし、それがナノ細孔に位置するとき、電極を横切る異なる検出可能な標識電流レベルをもたらす。
【0166】
図4は、それらがナノポアによって検出されるときに、異なる標識によって生成される異なる信号の例を提供する。4つの異なる信号強度(401、402、403、404)が検出される。これらは、ここに開示される保護標識化ヌクレオチドのいずれかに含まれる標識などの4つの異なる標識に対応し得る。例えば、ナノポアに提示される、および/またはアデノシン(A)の組み込みによって放出される標識は、振幅401の信号を生成することができる。ナノポアに提示された、および/またはシトシン(C)の組み込みによって放出された標識は、より高い振幅403を有する信号を生成し得;ナノポアに提示される、および/またはグアニン(G)の組み込みによって放出される標識は、さらに高い振幅404を有する信号を生成し得;ナノポアに提示される、および/またはチミン(T)の組み込みによって放出される標識は、さらに高い振幅402を有する信号を生成し得る。いくつかの場合において、検出の間に信号がベースラインレベル405に戻ることがある。
【0167】
図6は、保護標識化ヌクレオチドの成長中のポリヌクレオチド鎖への組み込みをさらに示す。図示のように、各保護標識化ヌクレオチドは、本開示による保護基を表すR基を含む(例えば、Rは、式(I)および(II)の「保護基」または-スペーサー-ブロッキング部分をそれぞれ表すことができる。)。この特定の実施形態では、標識(すなわち、標識1、2、3、および4)の切断はまた、R基、すなわち保護部分の除去をもたらし、その結果、追加の標識化保護標識化ヌクレオチドを反復して導入することができる。
【0168】
合成による配列決定
本開示はまた、合成による配列決定の方法(SBS)を提供し、それにより、この方法は、式(I)、(II)、(IIIA)、(IIIB)、(IIIC)、(IIID)、(IV)、(VA)、(VB)、(VC)、(VD)、(VIIIA)、(VIIIB)、(VIIIC)、(VIIID)、(VIIIE)、および(VIIIF)のヌクレオチド(またはその塩)のいずれかを含む、ここに記載のヌクレオチドまたは標識化ヌクレオチドのいずれかを利用する。SBS技術は一般に、テンプレート鎖に対するヌクレオチドの反復的付加による新生核酸鎖の酵素的伸長を伴う。各ヌクレオチドの追加は、テンプレート鎖の1つまたは数塩基を照会する。SBSの1つの例示的なタイプでは、サイクル配列決定は、例えば、切断可能または光退色性の染料ラベルを含む可逆的ターミネーターヌクレオチドの段階的添加によって達成される(例えば、PCT出願公開番号、国際公開第91/06678号パンフレットを参照。その開示は、参照によりその全体がここに組み込まれる。)。いくつかの実施形態において、1つまたは複数の保護標識化ヌクレオチドは、5’~3’方向に伸長するポリヌクレオチド鎖に連続的に付加されて、配列決定されるテンプレート核酸に相補的な伸長ポリヌクレオチドを形成する。付加された保護標識化ヌクレオチドの1つまたは複数に存在する塩基の同一性は、各ヌクレオチドの取り込み後などの検出または画像化ステップで決定することができる。
【0169】
例えば、合成による配列決定を使用して標的一本鎖ポリヌクレオチドの配列を決定するための方法であって:(a)保護標識化ヌクレオチド(式(I)、(II)、(IIIA)、(IIIB)、(IIIC)、(IIID)、(IV)、(VA)、(VB)、(VC)、(VD)、(VIIIA)、(VIIIB)、(VIIIC)、(VIIID)、(VIIIE)、および(VIIIF)の保護標識化ヌクレオチドのいずれかなど)を提供することと;(b)保護標識化ヌクレオチドを標的一本鎖ポリヌクレオチドの補体に組み込むことと;(c)ステップ(b)の保護標識化ヌクレオチドの標識を検出し、それによって組み込まれたヌクレオチドのタイプを決定することと;(d)ステップ(b)の3’保護基および保護標識化ヌクレオチドの標識を除去することと;(e)オプションでステップ(b)-(d)を1回以上繰り返し;それにより、標的の一本鎖ポリヌクレオチドの配列を決定すると、を含む。いくつかの実施形態において、方法は、標識を放出させること、および放出された標識を検出することをさらに含み得る。いくつかの実施形態において、保護標識化ヌクレオチドは、ここに記載されるように、脱保護される。いくつかの実施形態において、標識は、3’保護基の脱保護の前であるが、酵素的取り込みの後に放出される。他の実施形態において、標識は、3’保護基の脱保護後、第2の保護ヌクレオチドまたは保護標識化ヌクレオチドの酵素的取り込みの前に放出される。いくつかの実施形態において、標識の切断および3’保護基の脱保護は、実質的に同時に起こる。いくつかの実施形態において、提供される保護標識化ヌクレオチドは、少なくとも4つの異なる保護標識化ヌクレオチド(保護標識化ヌクレオチドのプールなど)を含み、それぞれの異なる保護標識化ヌクレオチドは、異なる保護標識化ヌクレオチドのそれぞれが互いに区別可能であるような異なる標識を含む。
【0170】
いくつかの実施形態において、合成による配列決定を使用して標的ポリヌクレオチドの配列を決定するための方法は、標的ポリヌクレオチドを異なる保護標識化ヌクレオチドと別々に接触させて、標的ポリヌクレオチドの相補体を形成し、保護標識化ヌクレオチドの組み込みを検出することによって実施することができる。ここに記載されるように、そのような方法は重合を利用し、それにより、ポリメラーゼ酵素は、標的上のヌクレオチドに相補的な正しい保護標識化ヌクレオチドを組み込むことによって相補鎖を伸長する。重合反応には、重合を開始するための特定のプライマーも必要である。各サイクルについて、標識化ヌクレオチドの組み込みは、ポリメラーゼ酵素(ここに記載されているものなど)によって実行され、その後、組み込みイベントが決定される。
【0171】
いくつかの実施形態において、配列決定法は、固体支持体上に配列された標的ポリヌクレオチドを用いて実施される。複数の標的ポリヌクレオチドは、リンカー分子を介して固体支持体上に固定化することができるか、あるいは粒子、例えば、固体支持体材料に付着することもできるミクロスフェアに付着させることができる。いくつかの実施形態において、ポリヌクレオチドは、ビオチン-アビジン相互作用の使用を含む、いくつかの手段によって固体支持体に付着させることができる。適切な固体支持体には、スライドガラスおよびビーズ、セラミックおよびケイ素表面、ならびにプラスチック材料が含まれるが、これらに限定されない。いくつかの実施形態において、支持体は平坦な表面である。他の実施形態において、微視的ビーズ(ミクロスフェア)も使用することができ、次に、既知の手段によって別の固体支持体に取り付けることができる。ミクロスフェアは、任意の適切なサイズ、典型的には直径約10nm~約100nmの範囲であり得る。いくつかの実施形態において、ポリヌクレオチドは、平面表面、例えば、平面ガラス表面に直接付着される。いくつかの実施形態において、付着は、共有結合を介する。適切なアレイの非限定的な例は、PCT出願公開番号、国際公開第00/06770号パンフレットに記載されており、その開示は、参照によりその全体がここに組み込まれる。配列決定法は、単一のポリヌクレオチド分子およびマルチポリヌクレオチド分子アレイ、すなわち、別個の個々のポリヌクレオチド分子のアレイ、および1つの個々のポリヌクレオチド分子の複数のコピーを含む別個の領域のアレイの両方で実施することができる。いくつかの実施形態において、単一分子アレイは、個々のポリヌクレオチドを別々に分解することを可能にする。いくつかの実施形態におい、単一分子アレイを非破壊的に配列決定することにより、空間的にアドレス可能なアレイを形成することができると考えられている。
【0172】
ポリメラーゼ反応を実施するために、いくつかの実施形態において、プライマー配列は、標的ポリヌクレオチドにアニールされ、プライマー配列は、ポリメラーゼ酵素によって認識され、相補鎖のその後の伸長のための開始部位として作用する。プライマー配列は、標的ポリヌクレオチドに関して別個の成分として付加され得る。あるいはまた、プライマーおよび標的ポリヌクレオチドはそれぞれ、一本鎖分子の一部であり得、プライマー部分は、標的の一部、すなわちヘアピンループ構造と分子内二重鎖を形成する。いくつかの実施形態において、この構造は、分子上の任意の点で固体支持体に固定化され得る。いくつかの実施形態において、次に、本開示の保護標識化ヌクレオチドを、重合が起こることを可能にするために、標的ポリヌクレオチドと接触させる。いくつかの実施形態において、保護標識化ヌクレオチドは、順次、すなわち、各ヌクレオチドタイプの別々の添加(例えば、A、T、GまたはCなどの核酸塩基を組み込んだ保護標識化ヌクレオチド)、または一緒に添加され得る。いくつかの実施形態において、保護標識化ヌクレオチドが一緒に添加される場合、異なる核酸塩基を有するそれぞれの異なるタイプの保護標識化ヌクレオチドは、異なる標識で標識される。いくつかの実施形態において、重合ステップは、保護標識化ヌクレオチドの組み込みを可能にするのに十分な時間進行させることが可能である。いくつかの実施形態において、次に、組み込まれていない保護標識化ヌクレオチドは、例えば、アレイを洗浄ステップに供することによって除去され、次いで、組み込まれた標識の検出を実施することができる。いくつかの実施形態において、この方法は、ここに記載されるように、脱保護ステップをさらに含む。いくつかの実施形態において、検出後、リンカーを切断する適切な条件を使用して標識を除去することができる。
【0173】
いくつかの実施形態において、保護標識化ヌクレオチドのそれぞれは、次の保護標識化ヌクレオチドの添加の前に、組み込まれていない保護標識化ヌクレオチドを除去して、標的と連続的に接触させることができ、その再、標識の検出および除去は、保護標識化ヌクレオチドをそれぞれ添加した後、または保護標識化ヌクレオチドの4つすべてを添加した後に実行される。他の実施形態において、保護標識化ヌクレオチドの異なるタイプのすべてが同時に標的と接触させられる、すなわち、異なる保護標識化ヌクレオチドのすべてを含む組成物が標的と接触させられ、組み込まれていないヌクレオチドは、検出前および標識の除去後に除去される。
【0174】
いくつかの実施形態において、方法は、第1のステップおよび第2のステップを含むことができ、第1のステップにおいて、4つのヌクレオチドのうちの2つを含む第1の組成物が標的と接触させられ、組み込まれていない保護標識化ヌクレオチドは、検出前および標識の除去後に除去され、第2のステップにおいて、第1の組成物に含まれない2つの保護標識化ヌクレオチドを含む第2の組成物は、標的と接触させられ、組み込まれていない保護標識化ヌクレオチドは、検出前および標識の除去後に除去され、ここで、ここで、第1のステップおよび第2のステップは、組み込まれたヌクレオチドの3’保護基の脱保護後に、任意選択的に、1回または複数回繰り返すことができる。
【0175】
いくつかの実施形態において、方法は、第1のステップおよび第2のステップを含むことができ、第1のステップにおいて、4つのヌクレオチドのうちの2つを含む第1の組成物が標的と接触させられ、組み込まれていない保護標識化ヌクレオチドは、検出前および標識の除去後に除去され、第2のステップにおいて、第1の組成物に含まれない2つの保護標識化ヌクレオチドを含む第2の組成物は、標的と接触させられ、組み込まれていない保護標識化ヌクレオチドは、検出前および標識の除去後に除去され、ここで、ここで、第1のステップおよび第2のステップは、組み込まれたヌクレオチドの3’保護基の脱保護後に、任意選択的に、1回または複数回繰り返すことができる。
【0176】
いくつかの実施形態において、方法は、第1のステップおよび第2のステップを含むことができ、第1のステップにおいて、4つの異なる保護標識化ヌクレオチドのうちの3つを含む第1の組成物を標的と接触させ、組み込まれていないヌクレオチドを、検出前および標識の除去後に除去し、第2のステップにおいて、第1の組成物に含まれない保護標識化ヌクレオチドを含む組成物を標的と接触させ、組み込まれていない保護標識化ヌクレオチドを、検出前および標識の除去後に除去し、ここで、第1のステップおよび第2のステップは、組み込まれたヌクレオチドの3’保護基の脱保護後に、任意選択的に、1回または複数回繰り返すことができる。
【0177】
いくつかの実施形態において、標的ポリヌクレオチドの配列を決定するための方法は、相補的な保護標識化ヌクレオチドの連続的な組み込みを監視することを含み、ここで、保護標識化ヌクレオチドは、切断可能なリンカーを介して保護標識化ヌクレオチドに連結された検出可能な標識を含み、これにより、標識を監視することによって組み込みが検出され、方法は、さらに保護標識化ヌクレオチドの組み込みが起こることを可能にするための脱保護ステップをさらに含む。
【0178】
合成による配列決定のための追加の構成要素および方法は、米国特許第9,605,310号および同第9,441,272号に記載されており、それらの開示は、参照によりその全体がここに組み込まれる。
【実施例】
【0179】
【0180】
255mg(1.1mmol)の4-(ヒドロキシメチル)ベンゼンボロン酸ピナコールエステルおよび340mgのCDI(2.1mmol)を15mL管に仕込んだ。1.5mLの乾燥ジクロロメタンを加え、溶液を30分間振とうした。次に、酢酸エチルで10mLに希釈し、5mLの水(x2)で洗浄した。次に、それを無水硫酸ナトリウムで乾燥させ、真空下で濃縮して、300mgの白色固体(80%収率)を得た。
【0181】
440mgのDMT-dT(0.81mmol)を1mLの無水DMSOに溶解した。122mgのDMAP(1.0mmol)を加え、撹拌して溶解させた。次に、それを上記の300mgの白色固体(0.91mmol)に加え、窒素下で一晩撹拌した。次に、それを100mLの酢酸エチルに溶解し、100mLの水(×3)およびブラインで洗浄した。それを無水硫酸ナトリウムで乾燥させ、真空下で蒸発させて、800mgの粘稠な油を得た。それを、溶媒ヘキサン/酢酸エチル(1%トリエチルアミン)50:50~0:100を用いて40gのシリカゲルコンビフラッシュで15分かけて精製した。質量803(ネガティブモード)の純粋な画分を真空下で濃縮して、30mgのボロネート-カーボネート-DMT-dTを粘稠なフィルムとして得た。
【0182】
ボロネート-カルボネート-DMT-dTの調製
【化62】
【0183】
【0184】
マスキング解除反応
上記の30mgのボロネート-カーボネート-DMT-dT生成物を、3mLのアセトニトリルに溶解して、10mg/mL(約12.5mM)の溶液を作った。次に、以下の反応を調製した:
10μLの10mg/mLボロネート-カーボネート-DMT-dTを、90μLの20mM重炭酸ナトリウム緩衝液pH~8.5に添加した。ボロネート-カーボネート-DMT-dTの水への溶解度が低いため、溶液は濁った。2μLの1%aqH2O2を加え、反応物を1分間ボルテックスした。溶液は再び透明になった。10μLを1mLの水に希釈し、LC-MS(ネガティブモード)で分析した。543の主要な質量ピークは、化合物のマスキング解除の、DMT-dTに戻るまでを示している。出発物質は観察されなかった。
【0185】
対照反応:
10μLの10mg/mLボロネート-カーボネート-DMT-dTを、90μLの20mM重炭酸ナトリウム緩衝液pH~8.5に添加した。溶液が濁った。2μLの水を加え、反応液を10分間ボルテックスした。溶液は依然として濁っていたが、程度は低かった。10μLを1mLの水に希釈し、LC-MS(ネガティブモード)で分析した。2つの主要な質量ピークが観察された:出発物質からの803およびピナコールエステルの加水分解からの721。
【0186】
次いで、対照反応物を、室温で40時間振とうした。10μLを1mLの水に希釈し、LC-MS(ネガティブモード)で分析した。ピナコールエステルの加水分解による唯一の主要な質量ピーク721が観察された。
【化64】
【0187】
マロニル基を有する保護ヌクレオチドの調製
10mmolのビス(ヒドロキシメチル)化合物1を8mLの乾燥ピリジンに溶解する。2mLの乾燥ピリジンに溶解した9mmolのtert-ブチルジメチルシリルクロリドをゆっくりと加え、反応物を3日間撹拌する。混合物を真空下で蒸発乾固し、50mLのCH
2Cl
2に溶解する。それを50mLの水で洗浄し、水溶液を50mLのCH
2Cl
2で抽出する。すべての有機画分を合わせ、無水硫酸ナトリウムで乾燥させ、真空下で濃縮する。生成物2を、溶媒としてヘキサン/酢酸エチルを使用するシリカゲルクロマトグラフィーによってさらに精製する。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【化65】
【0188】
10mmolの化合物2を、20mLの無水酢酸、6mLの酢酸、および30mLのDMSOの予混合溶液に溶解する。反応物を一晩撹拌し、次に150mLの冷10%Na
2CO
3水溶液で注意深く希釈する。生成物をジエチルエーテル(5x50mL)で抽出する。有機相を合わせ、無水硫酸ナトリウムで乾燥させ、真空下で濃縮する。生成物3を、溶媒としてCH
2Cl
2を用いたシリカゲルクロマトグラフィーによってさらに精製する。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【化66】
【0189】
10mmolの化合物を50mLの乾燥CH
2Cl
2に溶解し、溶液をアルゴン下で撹拌する。CH
2Cl
2中の塩化スルフリルの1M溶液12mL(12mmol)を3つのアリコートに加え、反応物をアルゴン下で1時間撹拌する。溶媒を真空下で除去し、残留物を30mLの乾燥CH
2Cl
2に溶解する。17mmolの酢酸カリウムの溶液および30mLの乾燥CH
2Cl
2中の7.5mmolのジベンゾ-18-クラウン-6を加え、反応物を1.5時間撹拌する。80mLの酢酸エチルを加え、有機相を100mLの水で洗浄する。それを硫酸ナトリウムで乾燥させ、真空下で濃縮する。生成物4を、溶媒としてCH
2Cl
2を用いたシリカゲルクロマトグラフィーによってさらに精製する。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【化67】
【0190】
10mmolの化合物4を30mLの乾燥THFに溶解し、2mL(12mmol)のトリエチルアミントリヒドロフルオリドを加える。反応物を1週間撹拌する。18mLの2M酢酸トリエチルアンモニウム水溶液を加え、混合物を真空下で蒸発乾固させる。化合物5を含む残留物を、溶媒としてCH
2Cl
2およびメタノールを用いたシリカゲルクロマトグラフィーによって精製する。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【化68】
【0191】
10mmolの化合物5を20mLの1,2-ジクロロエタンに溶解し、20mmolのピリジンを加え、溶液を-10℃で撹拌する。10mLの1,2-ジクロロエタン中の12mmolの予冷したトリフルオロメタンスルホン酸無水物を加え、混合物を-10℃で30分間撹拌する。次に、それを200mLの5%NaHCO
3水溶液で急冷し、混合物を室温で30分間撹拌する。有機層を分離し、硫酸ナトリウムで乾燥させ、真空下にて濃縮する。化合物6を含む残留物は、さらに精製することなく次のステップで直接使用される。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【化69】
【0192】
2mmolの化合物6を1mLのDMFに溶解し、50mMのHEPES緩衝液pH7.5中の1mLの1MdATP、dCTP、dGTP、またはdTTPの溶液に添加する。その反応物を37℃で24時間撹拌する。次に、溶媒を真空下で除去し、残留物を、溶媒として50mMの重炭酸トリエチルアンモニウムpH7.5およびアセトニトリルを使用する逆相HPLCによって精製する。溶媒を除去し、アセトン中の過塩素酸ナトリウムを使用して生成物をナトリウム塩として沈殿させる。生成物7の同一性および純度は、LC-MS分析法によって分析される。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【化70】
【0193】
【0194】
5’-ジメトキシトリチル(DMTr-)保護デオキシヌクレオチドを乾燥THFに溶解し、1.2当量のジミルナトリウムでゆっくりと処理する。反応物を30分間撹拌した後、1.2当量のトリフラート(化合物6)を混合物にゆっくりと加える。反応終了後、溶媒を蒸発させ、シリカゲルカラムクロマトグラフィーで精製する。DMTr保護基は酢酸で処理することにより除去され、三リン酸(化合物7)は典型的な三リン酸調製法によって得られ、イオン交換および逆相HPLC精製法によって精製される。この例では、Rは-CNまたは-C(O)O-Etであり得る。
【0195】
5’-O-DMT-N3-アニソイル-チミジン9
【化72】
【0196】
乾燥MeCN(100mL)中の5’-O-DMT-チミジン8(5.08g、9.33mmol)の溶液に、N,O-ビス-トリメチルシリル-アセトアミド(4.60mL、3.83g、18.8mmol)を加えた。反応混合物を1時間還流し、続いて室温に冷却した。次に、4-メトキシベンゾイルクロリド(1.65mL、2.08g、12.2mmol)およびNEt3(2.60mL、1.89g、18.7mmol)を加え、反応混合物を室温で一晩撹拌した。TBAF(THF中1M、28.5mL、28.5mmol)を加え、得られた混合物を室温で撹拌した。2時間後、混合物を真空で濃縮し、粗生成物をEtOAc(200mL)に溶解した。有機相を洗浄し(2x100mL飽和NaHCO3;100mL塩水)、Na2SO4で乾燥させた。5’-O-DMT-N3-アニソイル-チミジン9(1.95g、2.78mmol、3ステップで31%)が、移動相としてn-ヘキサン/酢酸エチル(2/1→1/2)を使用するシリカゲルのフラッシュクロマトグラフィーによる精製後、黄色の固体として単離された。
【0197】
ESI-MS:m/z=677.9(C39H37N2O9(M-H-);計算677.2(M-H-))。
【0198】
3’-O-メチルボロン酸-5’O-DMT-N3-アニソイル-チミジン10
5’-O-DMT-N3-アニソイル-チミジン9(648mg、1.00mmol)を、アルゴン雰囲気下、活性化モレキュラーシーブ(4A)の存在下で乾燥MeCN(20mL)に溶解した。K2CO3(415mg、3.00mmol)を加え、懸濁液を室温で30分間撹拌した。2-(クロロメチル)-4,4,5,5-テトラメチル-1,3,2-ジオキサボロラン(351μL、442mg、2.00mmol)を加え、反応混合物を60℃で撹拌した。24時間後、追加のK2CO3(138mg、1.00mmol)およびアルキルクロリド(176μl、222mg、1.00mmol)を加えた。60℃での撹拌をさらに16時間続けた。混合物を室温に冷却し、ろ過し、真空中で濃縮した。粗生成物をn-ヘキサン/酢酸エチル(1/2→1/4)およびジクロロメタン/メタノール(2/1)を移動相として使用するシリカゲルのフラッシュクロマトグラフィーで生成した。RP-HPLCによる最終精製により、凍結乾燥後、所望の3’-O-メチルボロン酸-5’-O-DMT-N3-アニソイル-チミジン10(167mg、0.23mmol、23%)を白色固体として得た。
【0199】
ESI-MS:m/z=735.4(C40H40BN2O11(M-H-);計算735.3(M-H-))。
【0200】
3’-O-メチルボロン酸-N3-アニソイル-チミジン11
【化73】
【0201】
3’-O-メチルボロン酸-N3-アニソイル-チミジン11は、3’-O-メチルボロン酸-5’-O-DMT-N3-アニソイル-チミジン10の合成中に、5’-DMT保護基により形成され、RP-HPLC精製の過程で分離された。3’-O-メチルボロン酸-N3-アニソイル-チミジン11(5mg、11.5μmol)は、凍結乾燥後に白色固体として単離された。
【0202】
ESI-MS:m/z=433.2(C19H22BN2O9(M-H-);計算433.1(M-H-))。
【0203】
脱保護
3’-O-メチルボロン酸-5’O-DMT-N3-アニソイル-チミジン10→5’O-DMT-N3-アニソイル-チミジン9
【化74】
【0204】
メチルボロン酸保護ヌクレオシド10(1.23mg、1.67μmol)を134μLのMeCN(c(ヌクレオシド)=12.5mM)に溶解した。この溶液20μLをMeCN80μLで希釈し、40mMのNaHCO3水溶液(c(ヌクレオシド)=1.25mM)100μLを添加した。50μLの溶液を1μLの1%H2O2水溶液に加え、反応混合物を室温で撹拌した。HPLC-MS分析で示されるように、出発物質の定量的変換10(ESI-MS:m/z=735.4(C40H40BN2O11(M-H-);計算所望のアルコール9中への735.3(M-H-))(ESI-MS:m/z=677.5(C39H37N2O9(M-H-);計算677.2(M-H-))は5分以内に進行した。
【0205】
3’-O-メチルボロン酸-N3-アニソイル-チミジン11→N3-アニソイル-チミジン12
【化75】
【0206】
メチルボロン酸保護ヌクレオシド11(0.75mg、1.73μmol)を138μLのMeCN(c(ヌクレオシド)=12.5mM)に溶解した。20μLのこの溶液を160μLの20mMのNaHCO3水溶液(c(ヌクレオシド)=1.25mM)で希釈した。50μLの溶液を1μLの1%H2O2に加えた。HPLC-MS分析で示されるように、出発物質の定量的変換11(ESI-MS:m/z=433.3(C19H22BN2O9(M-H-);計算所望のアルコール12中への433.1(M-H-))(ESI-MS:m/z=375.3(C18H19N2O7(M-H-);計算375.1(M-H-))は5分以内に進行した。
【0207】
アリール(アジドメチル)ブロックヌクレオチド三リン酸の合成
【化76】
上記で特定された構造、YおよびXは、ここに記載されている通りである。
【0208】
1.22グラムの2-(アジドメチル)安息香酸13を8.1mLの無水DMSOに溶解し、透明な溶液を室温で撹拌した。1.11グラムのN,N’-カルボニルジイミダゾール14を撹拌しながら部分的に加えた(1当量)。CDIが溶解したら、反応物を室温で2時間撹拌し、得られた混合物(生成物:イミダゾール、1:1)を、活性化アシルイミダゾリド15の0.85Mストック溶液として使用した。
【0209】
55mgのdATP16(二ナトリウム塩)を反応管に入れた。182μLの活性化アシルイミダゾール15溶液(DMSO中0.85M)を添加し、続いて500μLの無水DMSOと500μLの水を添加した。得られた透明な溶液を55℃で一晩インキュベートし、次に室温に冷却した。分析LCMSにより、生成物17(MW obs 649.04、MW calc 649)および二リン酸副生成物(MW obs 569.07)の形成が確認された。この物質を、0.1M酢酸トリエチルアンモニウム、pH7.5中のアセトニトリルの勾配を使用するC18カラムでの逆相HPLCによって精製した。生成物の画分を収集し、凍結乾燥して、白色の固体を得た。
【0210】
ブロックアジドのTCEP還元
30mMのHEPES、pH7.5中のdATPブロック(アジドメチル)安息香酸エステル17の1mM溶液を、15mMのTCEP(トリス(2-カルボキシエチル)ホスフィン)で処理し、室温でインキュベートした。LCMS分析では、水中の反応混合物の10倍希釈液を、100mMの酢酸トリエチルアンモニウム勾配中のアセトニトリルを使用して分析し、260nMでネガティブモードESI-MSで検出する。切断前に、ブロックdATPは、分子量649.03(ネガティブモード)のLC勾配で4分で溶出する。アジドが還元され、分子内の環化と脱保護が行われると、放出されたdATPは、分子量489.99(ネガティブモード)のLCMS勾配において1.8分で溶出する。
【0211】
単一の塩基の組み込み:
ポリメラーゼによる三リン酸7の組み込みの効率は、挿入部位に相補的塩基を含む15-merのプライマーと25-merのテンプレートを使用した単一ヌクレオチド挿入実験で調べることができる。挿入の成功は、LC-MS分析メソッドを使用して分析される。
【0212】
マスキング基の切断:
単一塩基の挿入実験混合物は、不特定の量のエステラーゼに約1分と約30分との間供される。完全なマスキング解除の成功は、LC-MS分析法によって検証された。
【0213】
本明細書中で及されるおよび/または出願データシートにおいてリスト化される全ての米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、及び非特許刊行物は、参照によりそれらの全体が本明細書に組み込まれる。実施形態の態様は、必要に応じて、様々な特許、出願、および刊行物の概念を使用してさらに別の実施形態を提供するように修正することができる。
【0214】
本開示は、いくつかの例示的な実施形態を参照して説明されてきたが、本開示の原理の精神および範囲内に含まれるであろう多くの他の変更および実施形態が当業者によって考案されることができることを理解されたい。より具体的には、合理的な変形および変更は、本開示の精神から逸脱することなく、前述の開示、図面、および添付の特許請求の範囲内の主題の組み合わせ構成の構成部品および/または配置において可能である。構成部品および/または配置の変形および変更に加えて、代替の使用法も当業者にとって明らかであろう。
【0215】
追加の実施形態
本開示の別の態様では、式(IIIA)のヌクレオチドまたはその塩である:
【化77】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。
R
1は、結合であり;
・ R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化78】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり、
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;。
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない。〕。
いくつかの実施形態において、R
4は、結合である。いくつかの実施形態において、R
4は結合であり、R
2またはR
3はHである。
いくつかの実施形態において、R
4は6員のアリール基である。いくつかの実施形態において、R
4は6員のアリール基であり、R
2またはR
3の少なくとも一方はHである。
【0216】
いくつかの実施形態では、R4は、-CH=CH-である。
【0217】
いくつかの実施形態において、R
5は、
【化79】
(式中、C
2~C
6は、置換または非置換であることができる、2~6個の炭素の飽和アルキル鎖を表す。)である。いくつかの実施形態において、R
5は、
【化80】
(式中、C
2~C
6は、置換または非置換であることができる、2~6個の炭素の飽和アルキル鎖を表す。)であり、R
2は、-[(C(R
a)(R
b))
p-O]
q--(R
a)または-C(O)-OR
a-であり、少なくとも一つのR
aは、C
1~C
6アルキル基である。
【0218】
いくつかの実施形態において、R5は、-(C(Ra)(Rb))n-CNまたは-(C(Ra)(Rb))n-N+C-である。いくつかの実施形態において、R5は、-(C(Ra)(Rb))n-CNまたは-(C(Ra)(Rb))n-N+C-であり、R2は、-[(C(Ra)(Rb))p-O]q--(Ra)または-C(O)-ORa-であり、少なくとも一つのRaは、C1~C6アルキル基である。
【0219】
本開示の別の態様では、式(IIIA)のヌクレオチドまたはその塩である:
【化81】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。
R
1は-C(O)-O-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化82】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない。〕。
【0220】
いくつかの実施形態において、R4は6員のアリール基である。いくつかの実施形態において、6-員のアリール基は、少なくとも一つの置換基を含み、該少なくとも一つの置換基は、メチルおよびエチルからなる群から選択される。いくつかの実施形態において、R4は6員のアリール基であり、R2またはR3の少なくとも一方はHである。
【0221】
本開示の別の態様では、式(IIIA)のヌクレオチドまたはその塩である:
【化83】
〔式中、
Xは、核酸塩基または標識化核酸塩基であり;
Yは、-O-P(O)(OH)-[O-P(O)(OH)]
z-OHまたは-O-P(O)(OH)-[O-P(O)(OH)]
z-O-オリゴヌクレオチド(式中、zは0または1~5の範囲の整数である。)である。
R
1は-C(O)-R
x-であり;
R
2およびR
3は、それぞれ独立して、H、飽和または不飽和のC
1~C
6アルキル基、C
5~C
6アリール基またはヘテロアリール基、ハロゲン、-[(C(R
a)(R
b))
p-O]
q--(R
a)、-C(O)-OR
a、-C(O)-N(R
a)(R
b)、-(C(R
a)(R
b))
n-N
+C
-、-CN、または-NO
2であり;
R
4は、結合、置換または非置換の5-~7-員のアリール基、-CH=CH-、置換または非置換の5-または6-員のヘテロシクロアルキル基、または-O-C(O)-アリール-であり;
R
5は、-(C(R
a)(R
b))
n-N
3、-(C(R
a)(R
b))
n-N
+C
-、-(C(R
a)(R
b))
n-CN、互いに1、3の位置にある2つの硫黄原子を含む5-~8-員のシクロアルキル基、または、構造:
【化84】
(式中、Z
1およびZ
2は、独立して、H、C
1~C
4アルキル基、または任意選択的に1つまたは複数のヒドロキシル基で置換された5-~6-員のアリール基であり;
Q
1およびQ
3は、それぞれ独立して、結合、-C(R
e)(R
f)-、または-C(O)-であり;
Q
2は、結合、o-フェニレン、または-[C(R
e)(R
f)]
w-(式中、wは、1または2である。)である。)を有する基であり;
R
aおよびR
bは、それぞれ独立して、Hまたは飽和C
1~C
6アルキル基であり;
R
eおよびR
fは、独立して、H、メチル、エチル、イソプロピル、または置換または非置換の5-または6-員のアリール基であり;
R
xは、置換または非置換の5-員または6-員の芳香族基またはヘテロ芳香族基であり;
nは、0または1~3の範囲の整数であり;および
pおよびqは、それぞれ独立して、1~3の範囲の整数であり;
ただし、R
1およびR
4がいずれも結合であり、かつ、R
2およびR
3がいずれもHである場合、R
5は、アジドではない。〕。
【0222】
いくつかの実施形態において、R5は、-(C(Ra)(Rb))n-N3である。