(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-28
(45)【発行日】2022-05-12
(54)【発明の名称】低反復性ヌクレオチド配列を有する、プロリンおよびアラニン残基が豊富な反復性アミノ酸配列をコードする核酸
(51)【国際特許分類】
C12N 15/62 20060101AFI20220502BHJP
C12N 15/63 20060101ALI20220502BHJP
C12N 1/15 20060101ALI20220502BHJP
C12N 1/19 20060101ALI20220502BHJP
C12N 1/21 20060101ALI20220502BHJP
C12N 5/10 20060101ALI20220502BHJP
C12P 19/34 20060101ALI20220502BHJP
C12P 21/02 20060101ALI20220502BHJP
A61P 43/00 20060101ALI20220502BHJP
A61K 47/64 20170101ALI20220502BHJP
A61K 48/00 20060101ALI20220502BHJP
A61K 39/395 20060101ALI20220502BHJP
A61K 38/19 20060101ALI20220502BHJP
A61K 38/18 20060101ALI20220502BHJP
A61K 38/22 20060101ALI20220502BHJP
A61K 38/43 20060101ALI20220502BHJP
A61K 39/00 20060101ALI20220502BHJP
A61K 38/16 20060101ALI20220502BHJP
A61K 39/44 20060101ALI20220502BHJP
A61K 38/17 20060101ALI20220502BHJP
A61K 38/36 20060101ALI20220502BHJP
A61K 38/55 20060101ALI20220502BHJP
A61K 45/00 20060101ALI20220502BHJP
A61K 31/56 20060101ALI20220502BHJP
A61K 31/70 20060101ALI20220502BHJP
A61K 31/702 20060101ALI20220502BHJP
A61K 31/713 20060101ALI20220502BHJP
A61K 31/711 20060101ALI20220502BHJP
A61K 31/7105 20060101ALI20220502BHJP
A61K 31/7088 20060101ALI20220502BHJP
C07K 19/00 20060101ALN20220502BHJP
A61K 38/02 20060101ALN20220502BHJP
【FI】
C12N15/62 Z ZNA
C12N15/63 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12P19/34 A
C12P21/02 C
A61P43/00 111
A61K47/64
A61K48/00
A61K39/395 D
A61K39/395 N
A61K38/19
A61K38/18
A61K38/22
A61K38/43
A61K39/00 H
A61K38/16
A61K39/44
A61K39/395 Y
A61K38/17 100
A61K38/36
A61K38/55
A61K45/00
A61K31/56
A61K31/70
A61K31/702
A61K31/713
A61K31/711
A61K31/7105
A61K31/7088
C07K19/00
A61K38/02
(21)【出願番号】P 2018532638
(86)(22)【出願日】2016-12-22
(86)【国際出願番号】 EP2016082407
(87)【国際公開番号】W WO2017109087
(87)【国際公開日】2017-06-29
【審査請求日】2019-12-23
(32)【優先日】2015-12-22
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】512300159
【氏名又は名称】エクスエル‐プロテイン ゲーエムベーハー
(73)【特許権者】
【識別番号】504150162
【氏名又は名称】テクニシェ ユニバーシタット ミュンヘン
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100135943
【氏名又は名称】三橋 規樹
(74)【代理人】
【識別番号】100104282
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】ビンダー,ウリ
(72)【発明者】
【氏名】アチャッツ,ステファン
(72)【発明者】
【氏名】スケラ,アルネ
【審査官】福澤 洋光
(56)【参考文献】
【文献】特表2010-531139(JP,A)
【文献】特表2013-531480(JP,A)
【文献】Protein Engineering Design and Selection,2013年,Vol.26, No.8,pp.489-501
(58)【調査した分野】(Int.Cl.,DB名)
C12N 1/00-15/90
C07K 1/00-19/00
CA/MEDLINE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
Genbank/EMBL/DDBJ/GeneSeq
PubMed
(57)【特許請求の範囲】
【請求項1】
プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、
前記ポリペプチドが、ランダムコイルを形成し、
前記核酸の前記ヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、
前記ヌクレオチド配列が、50,000未満のヌクレオチド反復スコア(NRS)を有し、
前記ヌクレオチド反復スコア(NRS)が、数式:
【数1】
により決定され、式中、
N
totは、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復
の異なる配列の数であり、そうでなければ、前記長さnの反復についてk(n)は1である、核酸分子。
【請求項2】
前記コードされたポリペプチドが、プロリンおよびアラニンからなる、請求項1に記載の核酸分子。
【請求項3】
前記プロリン残基が、前記コードされたポリペプチドの約10%超および約75%未満を構成する、請求項2に記載の核酸分子。
【請求項4】
前記コードされたポリペプチドが、プロリン、アラニン、およびセリンからなる、請求項1に記載の核酸分子。
【請求項5】
前記プロリン残基が、前記コードされたポリペプチドの4%超および40%未満を構成する、請求項4に記載の核酸分子。
【請求項6】
前記ヌクレオチド反復スコア(NRS)が、1000未満、100未満、50未満、または35未満である、請求項1~5のいずれか一項に記載の核酸分子。
【請求項7】
前記核酸の前記ヌクレオチド配列が、少なくとも900ヌクレオチドの長さを有する、請求項1~6のいずれか一項に記載の核酸分子。
【請求項8】
増強された遺伝子安定性を有する、請求項1~7のいずれか一項に記載の核酸分子。
【請求項9】
前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長n
maxを有し、n
maxが、数式:
【数2】
により決定され、式中、N
totが、前記ヌクレオチド配列の長さである、請求項1~8のいずれか一項に記載の核酸分子。
【請求項10】
前記反復が、約14、15、16、または17ヌクレオチドから約55ヌクレオチドまでの最大長を有する、請求項1~9のいずれか一項に記載の核酸分子。
【請求項11】
前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を含み、9個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを形成する、請求項1~10のいずれか一項に記載の核酸分子。
【請求項12】
(a)配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号87、配列番号88、配列番号89、配列番号90、配列番号91、配列番号92、配列番号93、配列番号94、配列番号95、配列番号96、配列番号97、配列番号98、配列番号99、配列番号100、配列番号101、配列番号102、配列番号103、配列番号104、配列番号105、配列番号106、配列番号107、配列番号108、配列番号109、配列番号110、配列番号111、配列番号112、配列番号113、配列番号114、配列番号115、配列番号116、配列番号117、配列番号118、配列番号119、配列番号120、配列番号121、配列番号122、配列番号192、および配列番号193からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(b)配列番号42、配列番号43、配列番号44、配列番号45、配列番号153、配列番号154、配列番号155、配列番号156、配列番号157、配列番号158、配列番号159、配列番号160、配列番号161、配列番号162、配列番号163、配列番号164、配列番号165、配列番号166、配列番号167、配列番号168、配列番号169、配列番号170、配列番号171、配列番号172、および/または配列番号173からなるヌクレオチド配列を含む核酸分子;
(c)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子;
(d)(a)、(b)、および(c)のいずれか1つで規定されるヌクレオチド配列と少なくとも66.7%の同一性を有するヌクレオチド配列を含む核酸分子;ならびに
(e)(a)または(b)で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、請求項1~3および6~11のいずれか一項に記載の核酸分子。
【請求項13】
(a)配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号123、配列番号124、配列番号125、配列番号126、配列番号127、配列番号128、配列番号129、配列番号130、配列番号131、配列番号132、配列番号133、配列番号134、配列番号135、配列番号136、配列番号137、配列番号138、配列番号139、配列番号140、配列番号141、配列番号142、配列番号143、配列番号144、配列番号145、配列番号146、配列番号147、配列番号148、配列番号149、配列番号150、配列番号151、配列番号152、配列番号194、および配列番号195からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(b)配列番号38、配列番号39、配列番号40、配列番号41、配列番号174、配列番号175、配列番号176、配列番号177、配列番号178、配列番号179、配列番号180、配列番号181、配列番号182、配列番号184、配列番号185、配列番号186、配列番号187、配列番号188、配列番号189、配列番号190、および配列番号191からなる群から選択されるヌクレオチド配列を含む核酸分子;
(c)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子;
(d)(a)、(b)、および(c)のいずれか1つで規定されるヌクレオチド配列と少なくとも56%の同一性を有するヌクレオチド配列を含む核酸分子;
(e)(a)または(b)で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、請求項1および4~11のいずれか一項に記載の核酸分子。
【請求項14】
生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、請求項1~13のいずれか一項に記載の核酸分子。
【請求項15】
前記生理活性タンパク質が、治療上有効なタンパク質である、請求項14に記載の核酸分子。
【請求項16】
請求項1~15のいずれか一項に記載の核酸分子を含むベクター。
【請求項17】
請求項1~15のいずれか一項に記載の核酸分子を含む宿主もしくは宿主細胞、または請求項16に記載のベクターを含む宿主もしくは宿主細胞。
【請求項18】
請求項1~15のいずれか一項に記載の核酸分子を調製するための方法であって、請求項17に記載の宿主または宿主細胞を培養すること、および任意選択で、産生された核酸分子を単離することを含む方法。
【請求項19】
請求項16に記載のベクターを調製するための方法であって、請求項17に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたベクターを単離することを含む方法。
【請求項20】
請求項1~15のいずれか一項に記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、請求項17に記載の宿主または宿主細胞を培養/成長させること、および任意選択で、産生されたポリペプチドを単離することを含む方法。
【請求項21】
薬物コンジュゲートを調製するための方法であって、
前記薬物コンジュゲートが、請求項1~13のいずれか一項に記載の核酸分子によりコードされるポリペプチドを含み、
(i)生理活性タンパク質および/または(ii)低分子および/または(iii)炭水化物をさらに含み、
前記方法が、請求項17に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたポリペプチドおよび/または薬物コンジュゲートを単離することをさらに含む方法。
【請求項22】
前記生理活性タンパク質が、治療上有効なタンパク質である、請求項21に記載の薬物コンジュゲートを調製するための方法。
【請求項23】
遺伝子的に安定な核酸分子を選択するための方法であって、
前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、
前記ポリペプチドが、ランダムコイルを形成し、
前記ヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、
前記方法が、50,000未満のヌクレオチド反復スコア(NRS)を有するヌクレオチド配列を含む核酸分子を選択するステップを含み、
前記ヌクレオチド反復スコア(NRS)が、数式:
【数3】
により決定され、式中、
N
totは、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復
の異なる配列の数であり、そうでなければ、前記長さnの反復についてk(n)は1である、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を含む核酸分子に関する。コードされたポリペプチドは、ランダムコイルを形成する反復性アミノ酸配列を含む。前記低反復性ヌクレオチド配列を含む核酸分子は、生理活性または薬理活性タンパク質をコードするヌクレオチド配列をさらに含むことができる。さらに、本発明は、前記低反復性ヌクレオチド配列を含む前記核酸分子を特定するための選択手段および方法を提供する。本発明は、前記核酸分子を調製するための方法にも関する。本明細書では、本明細書で提供される核酸分子を使用して、コードされたポリペプチドまたはコードされたポリペプチドとの薬物コンジュゲートを調製するための方法も提供される。薬物コンジュゲートは、生理活性または薬理活性タンパク質または低分子薬物を含んでもよい。本明細書では、そのような核酸分子を含むベクターおよび宿主も提供される。
【背景技術】
【0002】
ランダムコイルを形成するポリペプチドは、従来技術で公知である。例えば、国際公開第2008/155134号パンフレットは、少なくとも約100個のアミノ酸残基のアミノ酸配列を含み、プロリン、アラニン、およびセリン(PAS)残基からなるタンパク質を開示している。ランダムコイルコンフォメーションを形成するアミノ酸配列は、複数のアミノ酸反復を含んでもよい。これら反復は、少なくとも3~30個またはそれよりも多くのアミノ酸残基からなっていてもよい。国際公開第2011/144756号パンフレットは、プロリンおよびアラニン(PA)残基のみからなる反復性アミノ酸配列を含むポリペプチドを開示している。これらポリペプチドも、ランダムコイルを形成し、少なくとも50個のプロリンおよびアラニン残基からなる。国際公開第2015/132004号パンフレットは、PASからなるランダムコイルドメインを含む組換えクロストリジウム神経毒を開示している。米国特許出願公開第2006/0252120号明細書は、アミノ酸配列モチーフ[(AP)5]nを有するプロリンリッチ糖モジュールとしてコードされているセグメントを含む、ヒドロキシプロリンリッチ糖タンパク質を開示している。天然ポリペプチドも、遺伝子バンク受託番号(AAP41454.1)として公開されているマカクヘルペスウイルス(Macacine herpesvirus)1遺伝子の超大型テグメントタンパク質等の、プロリンおよびアラニンが豊富な配列を包含する。コドン最適化の方法は、国際公開第2007/142954号パンフレットに開示されている。
【0003】
PASまたはPA配列のような、反復性の従来技術のポリペプチドは、典型的には、対応する反復性核酸によりコードされる。そのため、従来技術の核酸は、それらのヌクレオチド配列にもコードされているアミノ酸配列の反復構造を反映する。したがって、従来技術の核酸は、配列レベルで高度に反復性である。従来技術の核酸が反復性であることは、特に、長いPASまたはPA配列、例えば300残基以上がコードされる場合、部分的な遺伝子不安定性等の懸念に結び付く場合がある。
【発明の概要】
【0004】
したがって、本発明の根底にある技術的課題は、アミノ酸反復を含むポリペプチド、特に、プロリン、アラニン、および任意選択でセリンからなるアミノ酸反復を含むポリペプチドの便利で信頼性の高い調製のための手段および方法の提供である。
【0005】
この技術的課題は、本明細書の下記に提供されている実施形態を提供することにより、および添付の特許請求の範囲で特徴付けられているように解決される。
【0006】
本発明は、以下の項目に関する。
【0007】
1.プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、
前記核酸のヌクレオチド配列が、少なくとも300個のヌクレオチドの長さを有し、
前記ヌクレオチド配列が、50,000未満のヌクレオチド反復スコア(NRS)を有し、
前記ヌクレオチド反復スコア(NRS)が、数式:
【0008】
【数1】
により決定され、式中、
N
totは、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は1である、核酸分子。
【0009】
2.前記コードされたポリペプチドが、プロリンおよびアラニンからなる、項目1に記載の核酸分子。
【0010】
3.前記プロリン残基が、前記コードされたポリペプチドの約10%超および約75%未満を構成する、項目2に記載の核酸分子。
【0011】
4.前記コードされたポリペプチドが、プロリン、アラニン、およびセリンからなる、項目1に記載の核酸分子。
【0012】
5.前記プロリン残基が、前記コードされたポリペプチドの4%超および40%未満を構成する、項目4に記載の核酸分子。
【0013】
6.前記ヌクレオチド反復スコア(NRS)が、100未満である、項目1~5のいずれか一項に記載の核酸分子。
【0014】
7.増強された遺伝子安定性を有する、項目1~6のいずれか一項に記載の核酸分子。
【0015】
8.前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長nmaxを有し、nmaxが、数式:
【0016】
【数2】
により決定され、式中、N
totが、前記ヌクレオチド配列の長さである、項目1~7のいずれか一項に記載の核酸分子。
【0017】
9.前記反復が、約14、15、16、または17個のヌクレオチドから約55個のヌクレオチドまでの最大長を有する、項目1~8のいずれか一項に記載の核酸分子。
【0018】
10.前記反復が、前記ヌクレオチド配列の長さの50%に対応する最大長を有する、項目1~9のいずれか一項に記載の核酸分子。
【0019】
11.前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を含み、9個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを形成する、項目1~10のいずれか一項に記載の核酸分子。
【0020】
12.(a)配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、および配列番号27からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(b)配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、および配列番号37からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(c)配列番号38、配列番号39、配列番号40、および配列番号41からなる群から選択されるヌクレオチド配列を含む核酸分子;
(d)配列番号42、配列番号43、配列番号44、および/または配列番号45からなるヌクレオチド配列を含む核酸分子;
(e)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子;
(f)(a)、(c)、および(e)のいずれか1つで規定されるヌクレオチド配列と少なくとも56%の同一性を有するヌクレオチド配列を含む核酸分子;
(g)(b)、(d)、および(e)のいずれか1つで規定されるヌクレオチド配列と少なくとも66.7%の同一性を有するヌクレオチド配列を含む核酸分子、ならびに
(h)(a)~(d)のいずれか1つで規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、項目1~11のいずれか一項に記載の核酸分子。
【0021】
13.前記核酸分子が、2つの相補的5’-突出を含み、コード鎖の5’-突出が5’-GCCであり、非コード鎖の5’-突出が5’-GGCである、項目1~12のいずれか1項に記載の核酸分子。
【0022】
14.生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、項目1~13のいずれか一項に記載の核酸分子。
【0023】
15.前記生理活性タンパク質が、治療上有効なタンパク質である、項目14に記載の核酸分子。
【0024】
16.前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大50個のアミノ酸残基からなるペプチド、またはペプチド模倣体からなる群から選択される、項目14または15に記載の核酸分子。
【0025】
17.前記結合タンパク質が、抗体、Fab断片、Fab’断片、F(ab’)2断片、単鎖可変断片(scFv)、(単一)ドメイン抗体、抗体の単離された可変領域(VLおよび/またはVH領域)、CDR、免疫グロブリンドメイン、CDR由来ペプチド模倣体、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメイン、プロテインAドメイン、SH3ドメイン、アンキリン反復ドメイン、およびリポカリンからなる群から選択される、項目16に記載の核酸分子。
【0026】
18.前記生理活性タンパク質が、インターロイキン1受容体アンタゴニスト、レプチン、酸性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルファ-1アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ-ガラクトシダーゼ、アルファ-グルコシダーゼ、アルファ-N-アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ(amediplase)、アミリン、アミリン類似体、抗HIVペプチド融合阻害剤、アルギニンデイミナーゼ、アスパラギナーゼ、Bドメイン欠損第VIII因子、骨形態形成タンパク質、ブラジキニンアンタゴニスト、B型ナトリウム利尿ペプチド、ブーガニン(bouganin)、成長ホルモン、絨毛性ゴナドトロピン、CD3受容体アンタゴニスト、CD19アンタゴニスト、CD20アンタゴニスト、CD40アンタゴニスト、CD40Lアンタゴニスト、セレブロシドスルファターゼ、凝固第VIIa因子、凝固第XIII因子、凝固第IX因子、凝固第X因子、補体成分C3阻害剤、補体成分5aアンタゴニスト、C-ペプチド、CTLA-4アンタゴニスト、C型ナトリウム利尿ペプチド、ディフェンシン、デオキシリボヌクレアーゼI、EGFR受容体アンタゴニスト、上皮成長因子、エリスロポエチン、エキセンディン-4、エズリンペプチド1、FcγIIB受容体アンタゴニスト、線維芽細胞成長因子21、卵胞刺激ホルモン、胃抑制ポリペプチド(GIP)、GIP類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド1(GLP-1)、GLP-1類似体、グルカゴン様ペプチド2(GLP-2)、GLP-2類似体、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモンアンタゴニスト、gp120、gp160、顆粒球コロニー刺激因子(G-CSF)、顆粒球マクロファージコロニー刺激因子(GM-CSF)、グレリン、グレリン類似体、成長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子受容体(HGFR)アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Her2/neu受容体アンタゴニスト、ヒストレリン、ヒルジン、hsp70アンタゴニスト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート-2-スルファターゼ、IgEアンタゴニスト、インスリン、インスリン類似体、インスリン様成長因子1、インスリン様成長因子2、インターフェロン-アルファ、インターフェロン-アルファアンタゴニスト、インターフェロン-アルファスーパーアゴニスト、インターフェロン-アルファ-n3、インターフェロン-ベータ、インターフェロン-ガンマ、インターフェロン-ラムダ、インターフェロンタウ、インターロイキン、インターロイキン2融合タンパク質、インターロイキン-22受容体サブユニットアルファ(IL-22ra)アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、ケラチノサイト成長因子、Kv1.3イオンチャネルアンタゴニスト、ランチペプチド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダーゼ、N-アセチルガラクトサミン-6-スルファターゼ、N-アセチルグルコサミニダーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω-コノトキシン、オルニトドロス・モウバタ(Ornithodoros moubata)補体阻害剤、骨形成タンパク質-1、オステオプロテゲリン、シュウ酸デカルボキシラーゼ、P128、副甲状腺ホルモン、フィロマー(Phylomer)、PD-1アンタゴニスト、PDGFアンタゴニスト、フェニルアラニンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインC、リラキシン、リラキシン類似体、セクレチン、RGDペプチド、リボヌクレアーゼ、センレボターゼ(senrebotase)、セリンプロテアーゼ阻害剤、可溶性1型補体受容体、可溶性DCC受容体、可溶性TACI受容体、可溶性腫瘍壊死因子I受容体(sTNF-RI)、可溶性腫瘍壊死因子II受容体(sTNF-RII)、可溶性VEGF受容体Flt-1、可溶性FcγIIB受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、T細胞受容体リガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアルファ1、toll様受容体阻害剤、腫瘍壊死因子(TNFα)、腫瘍壊死因子αアンタゴニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、VEGFアンタゴニスト、フォンビルブラント因子からなる群から選択される、項目14~17のいずれか一項に記載の核酸分子。
【0027】
19.項目1~18のいずれか一項に記載の核酸分子を含むベクター。
【0028】
20.前記ベクターが、エンドヌクレアーゼ制限酵素により認識される上流認識配列、およびエンドヌクレアーゼ制限酵素により認識される下流認識配列を含み、前記上流認識配列および前記下流認識配列が、逆相補的に配向されている、項目19に記載のベクター。
【0029】
21.前記下流認識配列を認識する前記エンドヌクレアーゼ制限酵素が、上流認識配列を認識するエンドヌクレアーゼ制限酵素とは異なる、項目20に記載のベクター。
【0030】
22.前記上流認識配列が、2つの異なる制限酵素の2つの認識配列を含む、項目20または21に記載のベクター。
【0031】
23.前記下流認識配列が、上流認識配列に含まれている、項目20~22のいずれか一項に記載のベクター。
【0032】
24.前記上流認識配列および/または前記下流認識配列が、ヌクレオチド突出を生成する制限酵素の認識配列である、項目20~23のいずれか一項に記載のベクター。
【0033】
25.前記上流認識配列および/または前記下流認識配列が、認識配列の外側を切断する制限酵素の認識部位である、項目20~24のいずれか一項に記載のベクター。
【0034】
26.前記制限酵素が、IIS型制限酵素である、項目20~25のいずれか一項に記載のベクター。
【0035】
27.前記上流認識配列がヌクレオチド配列「5’-GCTCTTC-3’」を有し、および/または前記下流認識配列がヌクレオチド配列「5’-CTCTTC-3’」を有する、項目20~26のいずれか一項に記載のベクター。
【0036】
28.前記上流認識配列がSapIおよびEarIにより認識され、ならびに/または前記下流認識配列がEarIにより認識される、項目20~27のいずれか一項に記載のベクター。
【0037】
29.前記ベクターが、配列番号48または配列番号55に示されている配列を有する、項目20~28のいずれか一項に記載のベクター。
【0038】
30.項目1~18のいずれか一項に記載の核酸分子を含むか、または項目19~29のいずれか一項に記載のベクターで形質転換された宿主。
【0039】
31.細菌、哺乳動物細胞、昆虫細胞、藻細胞、繊毛虫、酵母、および植物細胞からなる群から選択される、項目30に記載の宿主。
【0040】
32.細菌が、エシェリキア属(Escherichia)、コリネバクテリウム属(Corynebacterium)、シュードモナス属(Pseudomonas)、またはバチルス属(Bacillus)に属する、項目30または31に記載の宿主。
【0041】
33.前記細菌が、大腸菌(Escherichia coli)、コリネバクテリウム・グルタミカム(Corynebacterium glutamicum)、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)、またはバチルス・メガテリウム(Bacillus megaterium)である、項目32に記載の宿主。
【0042】
34.前記哺乳動物細胞が、ハムスター細胞である、項目31に記載の宿主。
【0043】
35.前記哺乳動物細胞が、CHO細胞である、項目34に記載の宿主。
【0044】
36.前記酵母が、サッカロマイセス属(Saccharomyces)、ピキア属(Pichia)、ハンゼヌラ属(Hansenula)、またはクリベロマイセス属(Kluyveromyces)に属する、項目31に記載の宿主。
【0045】
37.前記酵母が、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)、シゾサッカロミセス・ポンベ(Schizosaccharomyces pombe)、ピキア・パストリス(Pichia pastoris)、ピキア・メタノリカ(Pichia methanolica)、ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、またはクリベロマイセス・ラクティス(Kluyveromyces lactis)である、項目36に記載の宿主。
【0046】
38.項目1~18のいずれか一項に記載の前記核酸分子、または項目19~29のいずれか一項に記載の前記ベクターを調製するための方法であって、項目30~37のいずれか一項に記載の宿主を培養/成長させること;ならびに任意選択で、産生された核酸分子および/またはベクターを単離することを含む方法。
【0047】
39.項目1~18のいずれか一項に記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、項目1~18のいずれか一項に記載の核酸分子を含む、項目30~37のいずれか一項に記載の宿主を培養/成長させること;および任意選択で、産生されたポリペプチドを単離することを含む方法。
【0048】
40.薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、項目1~18のいずれか一項に記載の核酸分子によりコードされるポリペプチドを含み、(i)生理活性タンパク質および/または(ii)低分子および/または(iii)炭水化物をさらに含む、方法。
【0049】
41.前記核酸分子が、増強された遺伝子安定性を有する、項目40に記載の薬物コンジュゲートを調製するための方法。
【0050】
42.前記生理活性タンパク質が、治療上有効なタンパク質である、項目40または41に記載の薬物コンジュゲートを調製するための方法。
【0051】
43.前記ポリペプチドが、前記薬物コンジュゲートの増強されたin vivoおよび/またはin vitro安定性を媒介する、項目40~42のいずれか一項に記載の薬物コンジュゲートを調製するための方法。
【0052】
44.前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大50個のアミノ酸残基からなるペプチド、またはペプチド模倣体からなる群から選択される、項目40~43のいずれか一項に記載の薬物コンジュゲートを調製するための方法。
【0053】
45.前記結合タンパク質が、抗体、Fab断片、Fab’断片、F(ab’)2断片、単鎖可変断片(scFv)、(単一)ドメイン抗体、抗体の単離された可変領域(VLおよび/またはVH領域)、CDR、免疫グロブリンドメイン、CDR由来ペプチド模倣体、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメイン、プロテインAドメイン、SH3ドメイン、アンキリン反復ドメイン、およびリポカリンからなる群から選択される、項目40~44のいずれか一項に記載の薬物コンジュゲートを調製するための方法。
【0054】
46.前記生理活性タンパク質が、インターロイキン1受容体アンタゴニスト、レプチン、酸性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルファ-1アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ-ガラクトシダーゼ、アルファ-グルコシダーゼ、アルファ-N-アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗HIVペプチド融合阻害剤、アルギニンデイミナーゼ、アスパラギナーゼ、Bドメイン欠損第VIII因子、骨形態形成タンパク質、ブラジキニンアンタゴニスト、B型ナトリウム利尿ペプチド、ブーガニン、成長ホルモン、絨毛性ゴナドトロピン、CD3受容体アンタゴニスト、CD19アンタゴニスト、CD20アンタゴニスト、CD40アンタゴニスト、CD40Lアンタゴニスト、セレブロシドスルファターゼ、凝固第VIIa因子、凝固第XIII因子、凝固第IX因子、凝固第X因子、補体成分C3阻害剤、補体成分5aアンタゴニスト、C-ペプチド、CTLA-4アンタゴニスト、C型ナトリウム利尿ペプチド、ディフェンシン、デオキシリボヌクレアーゼI、EGFR受容体アンタゴニスト、上皮成長因子、エリスロポエチン、エキセンディン-4、エズリンペプチド1、FcγIIB受容体アンタゴニスト、線維芽細胞成長因子21、卵胞刺激ホルモン、胃抑制ポリペプチド(GIP)、GIP類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド1(GLP-1)、GLP-1類似体、グルカゴン様ペプチド2(GLP-2)、GLP-2類似体、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモンアンタゴニスト、gp120、gp160、顆粒球コロニー刺激因子(G-CSF)、顆粒球マクロファージコロニー刺激因子(GM-CSF)、グレリン、グレリン類似体、成長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子受容体(HGFR)アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Her2/neu受容体アンタゴニスト、ヒストレリン、ヒルジン、hsp70アンタゴニスト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート-2-スルファターゼ、IgEアンタゴニスト、インスリン、インスリン類似体、インスリン様成長因子1、インスリン様成長因子2、インターフェロン-アルファ、インターフェロン-アルファアンタゴニスト、インターフェロン-アルファスーパーアゴニスト、インターフェロン-アルファ-n3、インターフェロン-ベータ、インターフェロン-ガンマ、インターフェロン-ラムダ、インターフェロンタウ、インターロイキン、インターロイキン2融合タンパク質、インターロイキン-22受容体サブユニットアルファ(IL-22ra)アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、ケラチノサイト成長因子、Kv1.3イオンチャネルアンタゴニスト、ランチペプチド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダーゼ、N-アセチルガラクトサミン-6-スルファターゼ、N-アセチルグルコサミニダーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω-コノトキシン、オルニトドロス・モウバタ(Ornithodoros moubata)補体阻害剤、骨形成タンパク質-1、オステオプロテゲリン、シュウ酸デカルボキシラーゼ、P128、副甲状腺ホルモン、フィロマー(Phylomer)、PD-1アンタゴニスト、PDGFアンタゴニスト、フェニルアラニンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインC、リラキシン、リラキシン類似体、セクレチン、RGDペプチド、リボヌクレアーゼ、センレボターゼ、セリンプロテアーゼ阻害剤、可溶性1型補体受容体、可溶性DCC受容体、可溶性TACI受容体、可溶性腫瘍壊死因子I受容体(sTNF-RI)、可溶性腫瘍壊死因子II受容体(sTNF-RII)、可溶性VEGF受容体Flt-1、可溶性FcγIIB受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、T細胞受容体リガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアルファ1、toll様受容体阻害剤、腫瘍壊死因子(TNFα)、腫瘍壊死因子αアンタゴニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、VEGFアンタゴニスト、フォンビルブラント因子からなる群から選択される、項目40~45のいずれか一項に記載の薬物コンジュゲートを調製するための方法。
【0055】
47.前記低分子が、血管新生阻害剤、抗アレルギー薬、制吐薬、抗うつ薬、抗高血圧薬、抗炎症薬、抗感染症薬、抗精神病薬、抗増殖(細胞毒性および細胞増殖抑制)薬、カルシウムアンタゴニストおよび他の循環器薬、コリン作動性アゴニスト、中枢神経系に作用する薬物、呼吸器系に作用する薬物、ホルモン、ステロイド、ポリケチド、炭水化物、オリゴ糖、核酸、核酸誘導体、アンチセンス核酸、低分子干渉RNA(siRNA)、マイクロRNA(miR)阻害剤、マイクロRNA模倣体、DNAアプタマー、およびRNAアプタマーからなる群から選択される、項目40~46のいずれか一項に記載の薬物コンジュゲートを調製するための方法。
【0056】
48.項目39に記載の方法により得られるかまたは得ることができるポリペプチド、項目40~47のいずれか一項に記載の方法により得られる薬物コンジュゲート。
【0057】
49.項目1~18のいずれか一項に記載の核酸分子を配列決定するための方法。
【0058】
50.項目1~18のいずれか一項に記載の核酸分子を増幅するための方法。
【0059】
51.項目1~18のいずれか一項に記載の核酸分子をクローニングするための方法。
【0060】
52.遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、少なくとも300個のヌクレオチドの長さを有し、
前記方法が、50,000未満のヌクレオチド反復スコア(NRS)を有するヌクレオチド配列を含む核酸分子を選択するステップを含み、
前記ヌクレオチド反復スコア(NRS)が、数式:
【0061】
【数3】
により決定され、式中、
N
totが、前記ヌクレオチド配列の長さであり、
nが、前記ヌクレオチド配列内の反復の長さであり、
f
i(n)が、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は1である、方法。
【0062】
ある特定の態様では、本出願は、以下の項目に関する。
【0063】
1.プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、
前記核酸のヌクレオチド配列が、少なくとも300個のヌクレオチドの長さを有し、
前記ヌクレオチド配列が、50,000未満のヌクレオチド反復スコア(NRS)を有し、
前記ヌクレオチド反復スコア(NRS)が、数式:
【0064】
【数4】
により決定され、式中、
N
totは、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は1である、核酸分子。
【0065】
2.前記コードされたポリペプチドがプロリンおよびアラニンからなり、前記プロリン残基が、前記コードされたポリペプチドの約10%超および約75%未満を構成する、項目1に記載の核酸分子。
【0066】
3.前記コードされたポリペプチドがプロリン、アラニン、およびセリンからなり、前記プロリン残基が、前記コードされたポリペプチドの4%超および40%未満を構成する、項目1に記載の核酸分子。
【0067】
4.前記ヌクレオチド反復スコア(NRS)が、100未満である、項目1~3のいずれか一項に記載の核酸分子。
【0068】
5.増強された遺伝子安定性を有する、項目1~4のいずれか一項に記載の核酸分子。
【0069】
6.前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長nmaxを有し、nmaxが、数式:
【0070】
【数5】
により決定され、式中、N
totが、前記ヌクレオチド配列の長さである、項目1~5のいずれか一項に記載の核酸分子。
【0071】
7.前記反復が、約14、15、16、または17個のヌクレオチドから約55個のヌクレオチドまでの最大長を有する、項目1~6のいずれか一項に記載の核酸分子。
【0072】
8.前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を含み、9個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを形成する、項目1~7のいずれか一項に記載の核酸分子。
【0073】
9.(a)配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、および配列番号27からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(b)配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、および配列番号37からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(c)配列番号38、配列番号39、配列番号40、および配列番号41からなる群から選択されるヌクレオチド配列を含む核酸分子;
(d)配列番号42、配列番号43、配列番号44、および/または配列番号45からなるヌクレオチド配列を含む核酸分子;
(e)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子;
(f)(a)、(c)、および(e)のいずれか1つで規定されるヌクレオチド配列と少なくとも56%の同一性を有するヌクレオチド配列を含む核酸分子;
(g)(b)、(d)、および(e)のいずれか1つで規定されるヌクレオチド配列と少なくとも66.7%の同一性を有するヌクレオチド配列を含む核酸分子;ならびに
(h)(a)~(d)のいずれか1つで規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、項目1~8のいずれか一項に記載の核酸分子。
【0074】
10.生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、項目1~9のいずれか一項に記載の核酸分子。
【0075】
11.前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大50個のアミノ酸残基からなるペプチド、またはペプチド模倣体からなる群から選択され、前記結合タンパク質が、抗体、Fab断片、Fab’断片、F(ab’)2断片、単鎖可変断片(scFv)、(単一)ドメイン抗体、抗体の単離された可変領域(VLおよび/またはVH領域)、CDR、免疫グロブリンドメイン、CDR由来ペプチド模倣体、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメイン、プロテインAドメイン、SH3ドメイン、アンキリン反復ドメイン、およびリポカリンからなる群から選択される、項目10に記載の核酸分子。
【0076】
12.前記生理活性タンパク質が、酸性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルファ-1アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ-ガラクトシダーゼ、アルファ-グルコシダーゼ、アルファ-N-アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗HIVペプチド融合阻害剤、アルギニンデイミナーゼ、アスパラギナーゼ、Bドメイン欠損第VIII因子、骨形態形成タンパク質、ブラジキニンアンタゴニスト、B型ナトリウム利尿ペプチド、ブーガニン、成長ホルモン、絨毛性ゴナドトロピン、CD3受容体アンタゴニスト、CD19アンタゴニスト、CD20アンタゴニスト、CD40アンタゴニスト、CD40Lアンタゴニスト、セレブロシドスルファターゼ、凝固第VIIa因子、凝固第XIII因子、凝固第IX因子、凝固第X因子、補体成分C3阻害剤、補体成分5aアンタゴニスト、Cペプチド、CTLA-4アンタゴニスト、C型ナトリウム利尿ペプチド、ディフェンシン、デオキシリボヌクレアーゼI、EGFR受容体アンタゴニスト、上皮成長因子、エリスロポエチン、エキセンディン-4、エズリンペプチド1、FcγIIB受容体アンタゴニスト、線維芽細胞成長因子21、卵胞刺激ホルモン、胃抑制ポリペプチド(GIP)、GIP類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド(GLP-1)、GLP-1類似体、グルカゴン様ペプチド2(GLP-2)、GLP-2類似体、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモンアンタゴニスト、gp120、gp160、顆粒球コロニー刺激因子(G-CSF)、顆粒球マクロファージコロニー刺激因子(GM-CSF)、グレリン、グレリン類似体、成長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子受容体(HGFR)アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Her2/neu受容体アンタゴニスト、ヒストレリン、ヒルジン、hsp70アンタゴニスト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート-2-スルファターゼ、IgEアンタゴニスト、インスリン、インスリン類似体、インスリン様成長因子1、インスリン様成長因子2、インターフェロン-アルファ、インターフェロン-アルファアンタゴニスト、インターフェロン-アルファスーパーアゴニスト、インターフェロン-アルファ-n3、インターフェロン-ベータ、インターフェロン-ガンマ、インターフェロン-ラムダ、インターフェロンタウ、インターロイキン、インターロイキン1受容体アンタゴニスト、インターロイキン2融合タンパク質、インターロイキン-22受容体サブユニットアルファ(IL-22ra)アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、ケラチノサイト成長因子、Kv1.3イオンチャネルアンタゴニスト、ランチペプチド、レプチン、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソフスタフィン、マンノシダーゼ、N-アセチルガラクトサミン-6-スルファターゼ、N-アセチルグルコサミニダーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω-コノトキシン、オルニトドロス・モウバタ(Ornithodoros moubata)補体阻害剤、骨形成タンパク質-1、オステオプロテゲリン、シュウ酸デカルボキシラーゼ、P128、副甲状腺ホルモン、フィロマー(Phylomer)、PD-1アンタゴニスト、PDGFアンタゴニスト、フェニルアラニンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインC、リラキシン、リラキシン類似体、セクレチン、RGDペプチド、リボヌクレアーゼ、センレボターゼ、セリンプロテアーゼ阻害剤、可溶性1型補体受容体、可溶性DCC受容体、可溶性TACI受容体、可溶性腫瘍壊死因子I受容体(sTNF-RI)、可溶性腫瘍壊死因子II受容体(sTNF-RII)、可溶性VEGF受容体Flt-1、可溶性FcγIIB受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、T細胞受容体リガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアルファ1、toll様受容体阻害剤、腫瘍壊死因子(TNFα)、腫瘍壊死因子αアンタゴニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、VEGFアンタゴニスト、フォンビルブラント因子からなる群から選択される、項目10または11に記載の核酸分子。
【0077】
13.項目1~12のいずれか一項に記載の核酸分子を含むか、または項目1~12のいずれか一項に記載の核酸分子を含むベクターで形質転換された宿主。
【0078】
14.項目1~12のいずれか一項に記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、項目13に記載の宿主を培養/成長させること;および任意選択で、産生されたポリペプチドを単離することを含む方法。
【0079】
15.薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、項目1~12のいずれか一項に記載の核酸分子によりコードされるポリペプチドを含み、(i)生理活性タンパク質および/または(ii)低分子および/または(iii)炭水化物をさらに含む、方法。
【0080】
本発明は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする低反復性ヌクレオチド配列を有する核酸分子に関する。そのようなポリペプチドは、本明細書では、PAリッチまたはプロリン/アラニンリッチポリペプチドとも称される。本明細書で提供される本発明の核酸分子は、1ヌクレオチド反復配列当たり約14、15、16、または17ヌクレオチドの最大長等の、ある最大長のヌクレオチド反復をほとんど有していないかまたは有していない。さらに、PAリッチコードヌクレオチド配列は、少なくとも300ヌクレオチドの全長を有し、このコード配列内の個々のヌクレオチド反復は、14、15、16、17、約20、約25、約30、約35、約40、約45、約50、または約55ヌクレオチドの個々の最長長を有する。
【0081】
1つの態様では、本発明の核酸分子は、反復性アミノ酸配列(例えば、PAリッチポリペプチド)をコードするヌクレオチド配列を含み、前記核酸分子の前記ヌクレオチド配列は、少なくとも300ヌクレオチドの長さを有し、前記ヌクレオチド配列は、50,000未満のヌクレオチド反復スコア(NRS)を有し、前記ヌクレオチド反復スコア(NRS)は、数式:
【0082】
【0083】
この数式中、Ntotは、前記ヌクレオチド配列の長さであり、nは、前記ヌクレオチド配列内の反復の長さであり、fi(n)は、前記長さnの反復の頻度であり、1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は、1である。定義は以下の通りである。
【0084】
ある特定の態様では、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードしており、前記核酸分子のヌクレオチド配列内に繰り返して出現するヌクレオチド配列伸長(すなわち、「反復」)は、最大で、14、15、16、17、約20、約25、約30、約35、約40、約45、約50、または約55ヌクレオチドの長さを有する。言い換えれば、核酸分子は、PAリッチポリペプチドをコードするヌクレオチド配列を含み、前記コードヌクレオチド配列は、14、15、16、17、約20、約25、約30、約35、約40、約45、約50、または約55ヌクレオチドの最大長を有するヌクレオチド反復を含む。また、本発明の核酸分子/配列は、特に生理活性または薬理活性タンパク質のような、追加のコード配列を含んでもよい。
【0085】
添付の例では、本発明の低反復性核酸分子は、従来技術の高度に反復性の核酸分子と比較して有利であることが実証されている。特に、本明細書で提供される低反復性核酸分子の遺伝子安定性は、本明細書に記載されているように、および添付の例に示されているように向上されている。PAリッチポリペプチドをコードする従来技術の反復性核酸分子の遺伝子安定性を評価するために、国際公開第2008/155134号パンフレットに開示されている複数の60量体ヌクレオチド配列ユニットで構成されている反復性プロリン/アラニンリッチ配列をコードする従来技術の反復性核酸分子(PAS#1a(600)、配列番号12、実施例6、
図2B)を含むベクターを構築した。このベクターは、本明細書では、「pASK75-PAS#1a(600)-IL1Ra」(配列番号51)と称される。宿主(大腸菌(E. coli))を、このベクターで形質転換し、数日間、例えば7日間培養した。7日目、およそ70世代にわたって連続的に増殖させた後、細胞をLB/Amp寒天にプレーティングし、クローンをピッキングし、プラスミド調製を実施した。プラスミドは、制限酵素を使用し、その後アガロースゲル電気泳動法を使用して分析した(
図5)。pASK75-PAS#1a(600)-IL1Raの5つの分析したクローンのうちの4つは、プロリン/アラニンリッチ配列をコードする短縮核酸断片を示した(
図5、レーン1~5)。
【0086】
したがって、反復性プロリン/アラニンリッチ配列をコードする従来技術の反復性核酸分子は、遺伝子的に不安定である。言い換えれば、従来技術の核酸分子は、低in vivo安定性を有する。理論により束縛されないが、遺伝子不安定性は、相同組換えの結果であり得る。遺伝子不安定性および遺伝子カセットの短縮化により、その結果生じるプロリン/アラニンリッチアミノ酸配列も変更されることになる。したがって、長期培養中の不安定なプラスミドによりコードされたプロリン/アラニンリッチアミノ酸配列は、元のプラスミドによりコードされたものとは異なるものになるだろう。したがって、従来技術の反復性核酸分子を使用して長期培養中に得られるポリペプチドが所望のポリペプチドでなくなってしまうというリスクは、かなり高い。
【0087】
さらに、その結果生じるポリペプチド組成物が、様々な異なるポリペプチド(例えば、種々のサイズ、長さ、および/または配列のプロリン/アラニンリッチポリペプチド)を含み得るというリスクが存在する。これは、特に生物学的製品に使用するための生物学的産物に求められる画一性に反する。したがって、プロリン/アラニンリッチポリペプチドをコードする従来技術の反復性核酸分子の遺伝子不安定性は、生物学的最終産物の品質低下に結び付き、特に治療応用の規制面で、その産生を不都合で信頼性の低いものにする場合がある。
【0088】
本発明では、遺伝子不安定性の問題は、低内部ヌクレオチド反復を有する核酸分子を設計することにより解決される。しかしながら、プロリン/アラニンリッチアミノ酸配列をコードするために利用可能なヌクレオチドトリプレットコドンの数が少ないことを考慮すると、これはささいな課題ではない。
【0089】
添付の非限定的な例に示されているように、本発明の核酸分子は、上述の欠点を回避する。例えば、実施例5および6、ならびに
図4および
図5レーン6~10を参照されたい。それにも関わらず、本発明の核酸分子は、従来技術の核酸分子のように、複数のプロリン/アラニンリッチ反復を含むプロリン/アラニンリッチポリペプチドをコードする。しかしながら、従来技術の核酸分子とは非常に対照的に、本発明の核酸分子は、低反復性ヌクレオチド配列を有する(すなわち、少数のおよび/または短いヌクレオチド反復しか含まない)。
【0090】
例示的な実施例5は、プロリン/アラニンリッチポリペプチドをコードする低反復性ヌクレオチド配列を含む、本発明の例示的なベクターの調製を示している。例示的なベクターで使用されている「PAS#1f/1c/1b(600)」と称する低反復性ヌクレオチド配列は、配列番号38に示されている。その結果生じたプラスミドを、「pASK75-PAS#1f/1c/1b(600)-IL1Ra」(配列番号50)と命名した。それは、
図4に示されている。
【0091】
本発明のプラスミド「pASK75-PAS#1f/1c/1b(600)-IL1Ra」を、ベクター「pASK75-PAS#1a(600)-IL1Ra」に関して上述されている同じ培養に供した。後者のベクターは、国際公開第2008/155134号パンフレットに開示されている複数の60量体ヌクレオチド配列ユニットで構成されている反復性プロリン/アラニンリッチ配列(PAS#1a(600);配列番号12)をコードする従来技術の反復性核酸分子を含む(
図1A)。「pASK75-PAS#1a(600)-IL1Ra」とは対照的に、本発明のプラスミド「pASK75-PAS#1f/1c/1b(600)-IL1Ra」は、高い遺伝子安定性を示した。「pASK75-PAS#1f/1c/1b(600)」の全ての分析したクローンのみが、3093bpおよび2377bpに予想通りのバンドを示した(
図5、レーン6~10)。これは、1800塩基対を含み、プロリン/アラニンリッチ配列PAS#1をコードする低反復性PAS#1f/1c/1b(600)遺伝子カセットの高い遺伝子安定性を示す。この高い遺伝子安定性により、従来技術の核酸分子の欠点が回避される。これは、低反復性ヌクレオチド配列を含む本発明の核酸分子が、プロリン/アラニンリッチポリペプチドおよび/または対応する融合タンパク質の便利で信頼性の高い生合成に有用であることを明らかに示す。
【0092】
例示的な実施例4は、本発明により提供される核酸分子のさらなる利点を示している。ここでは、本発明の低反復性ヌクレオチド配列を含む例示的な核酸分子(PAS#1f/1c/1b(600)カセットと称される;配列番号38;例えば、実施例1を参照)を、自動DNA配列決定に供した。その結果、900個よりも多くの塩基対を含む、明確に画定されたエラーフリー電気泳動図(
図3)が得られた。これは、非特異的プライマー結合の徴候を示していなかった。したがって、対応するクローニングされた遺伝子カセットの上流または下流にハイブリダイズするプライマーでしか信頼性の高い配列決定ができない反復性ヌクレオチド配列とは対照的に、プロリン/アラニンリッチ配列をコードする長い低反復性DNA断片は、容易な様式で完全に配列決定することができる。この場合、内部に結合するプライマーを適用し、したがって、必要に応じて複数のオーバーラップ配列リードを生成することもできる。特筆すべきことに、そのような内部にハイブリダイズするプライマーを使用すると、反復性ヌクレオチド配列の場合に特有な配列決定パターンに帰結しない。したがって、低反復性ヌクレオチド配列を含む本発明の核酸分子は、これらの配列決定問題を回避する。
【0093】
要約すると、本発明は、特に、高度に反復性の配列を含む従来技術の核酸分子に対して、以下の利点を有する。本発明の有利な低反復性ヌクレオチド配列は、従来技術の核酸分子とは対照的に、さらなる労苦を伴うことなく完全に配列決定することができる。本発明の核酸分子のさらなる利点は、本発明の核酸分子は、反復性が低いため、増幅特性(例えば、ポリメラーゼ連鎖反応PCRによる)が向上されていることである。さらに、本発明の核酸分子は、繰り返し/反復性配列を含むヌクレオチド配列と比較して、クローニング手順を向上させる。本明細書で提供される核酸分子の特定の利点は、従来技術の高度に反復性の核酸分子と比較して、遺伝子安定性が向上されているということである。これは、プロリン/アラニンリッチポリペプチドおよび/またはそれらの融合タンパク質の信頼性の高い産生を可能にする。
【0094】
本発明の核酸分子を特徴付ける特徴は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列が、上述の有利な技術的効果を付与する「低反復性ヌクレオチド配列」であることである。添付の実施例には、核酸分子が、本発明による低反復性ヌクレオチド配列を含むか否かを分析するために使用することができる方法が示されている。特に、添付の実施例は、本明細書では「ヌクレオチド反復スコア(NRS)」と称されるスコアを提供している。このヌクレオチド反復スコア(NRS)は、本明細書では、上記で論じられている数式:
【0095】
【数7】
により決定され、式中、N
totは、前記ヌクレオチド配列の長さであり、nは、前記ヌクレオチド配列内の反復の長さであり、f
i(n)は、前記長さnの反復の頻度であり、1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は、1である。このスコアは、下記に詳細に記載されており、添付の例に示されている。
【0096】
NRSは、当業者が、本発明で使用するための低反復性ヌクレオチド配列を選択することを可能にする。言い換えれば、NRSは、ヌクレオチド配列の反復性の度合いを決定するためのツールを提供する。反復を自動的に特定し、NRSを算出するために、本明細書で提供されるNRSカリキュレータと称するアルゴリズムを使用することができる。
【0097】
添付の例示的な実施例、例えば実施例13に示されているように、プロリン/アラニンリッチ配列をコードするいくつかの従来技術の核酸を、実施例14に記載のNRSカリキュレータを使用して、本発明によるプロリン/アラニンリッチ配列をコードする低反復性核酸と比較した。例えば、以下の従来技術の配列のNRSを決定した:国際公開第2008/155134号パンフレットに開示されているPAS#1a(200)、国際公開第2011144756号パンフレットに開示されているPA#1a(200)、米国特許出願公開第20060252120号明細書に開示されている[(AP)
5]
20APA、GenBank受託番号DQ399411aとして公開されている[AAPAPAPAP]
10AS、GenBank受託番号NP_851896として公開されているマカクヘルペスウイルス(macacine herpesvirus)1の大型テグメントタンパク質。加えて、それぞれの長さに対してプロットしたヌクレオチド反復の頻度を示すヒストグラムを、これら従来技術のヌクレオチド配列、およびPAS#1b(200)(配列番号19)またはPA#1e/1d/1c/1b(800)(配列番号44)等の本発明の低反復性ヌクレオチド配列について決定した(
図9)。従来技術のヌクレオチド配列のヒストグラムは、高度に反復性の性質を明らかにした。対照的に、本発明の低反復性ヌクレオチド配列、例えば、PAS#1b(200)およびPA#1e/1d/1c/1b(800)のヒストグラムは、14ヌクレオチドの最大長を有するほんの少数の反復を示している。例えば、
図9F~Iを参照されたい。
【0098】
従来技術のヌクレオチド配列と本発明のヌクレオチド配列との間の反復性の差異は、それらのヌクレオチド反復スコアを比較すると、さらにより明白になる。本明細書で分析した従来技術の配列は、80000を超えるNRSを明らかにしている(表2)。対照的に、例示的な本発明のヌクレオチド配列は、低いヌクレオチド反復スコア、例えば34未満を示している。表1を参照されたい。したがって、本明細書では、本発明のプロリン/アラニンリッチ配列をコードするヌクレオチド配列の反復品質が、従来技術の配列と比較してはるかに高く、ヌクレオチド配列反復は、より少数であり、かつより短いことが、明らかに証明されている。したがって、本発明の核酸分子は、低反復性配列を有する。
【0099】
上記に示されているように、当業者であれば、核酸分子の反復性の度合いを分析するための、いくつかの選択肢を認識している。添付の例には、本発明の核酸分子および従来技術の核酸分子の反復性が、ドットプロット分析でも分析されたことが示されている。例えば、実施例3を参照されたい。ドットプロット分析は、国際公開第2011/144756号パンフレットに開示されている反復性プロリン/アラニンリッチ配列PA#3a(配列番号15;
図2A)、国際公開第2008/155134号パンフレットに開示されているPAS#1(配列番号11;
図2B)、米国特許出願公開第2006/0252120号明細書に開示されているコードされた[(AP)
5]
n多量体(配列番号16)、およびGenBank受託番号AAP41454.1として公開されている、マカクヘルペスウイルス(Macacine herpesvirus)1遺伝子の超大型テグメントタンパク質の反復性プロリン/アラニンリッチ領域(配列番号18;
図2C)をコードする核酸について実施した。添付の実施例では、Geneiousソフトウェアパッケージ バージョン8.1(Biomatters、オークランド、ニュージーランド)の「dottup」ツールを使用した。このアルゴリズムは、それぞれの配列をそれ自体にアラインし、例えば、14または15ヌクレオチドの反復ウィンドウを適用する。従来技術のヌクレオチド配列のドットプロットを、本発明の低反復性ヌクレオチド配列、例えば、ユニットPA#3b(200)(配列番号36)、PA#1b(配列番号28)、または構築された低反復性ヌクレオチド配列PAS#1f/1c/1b(600)(配列番号38)およびPAS#1d/1f/1c/1b(800)(配列番号39)のドットプロットと比較した。分析した従来技術の配列は全て、黒色の並行対角線により示されているように、ヌクレオチド配列レベルで高度に反復性の性質を明らかにしたが(
図2A~C)、本発明による例示的なヌクレオチド配列のドットプロットは、それぞれ、600ヌクレオチド(
図2A、C)、1800ヌクレオチド、または2400ヌクレオチド(
図2B)のヌクレオチド配列全体内に、最長長が14ヌクレオチドの反復(黒色線)が存在しないかまたはほんの少数しか散在していないことを示している。したがって、本明細書では、本明細書で提供されるヌクレオチド配列が、反復を含まないかまたはほんの少数の短い反復しか含まない低反復性ヌクレオチド配列であることが証明されている。
【0100】
要約すると、添付の例は、本発明の核酸分子が、プロリン/アラニンリッチアミノ酸反復配列をコードしつつ、低反復性ヌクレオチド配列を有することを明らかに示している。本明細書では、本明細書で提供される核酸分子の「低繰り返し性」または「低反復性」は、代替戦略、例えば、本明細書で提供されるヌクレオチド反復スコア、またはドットプロット分析等の当業者に公知の方法により、容易に評価することができることが、さらに示されている。あるいは、当業者であれば、ヌクレオチド配列反復、したがってヌクレオチド配列の反復性の度合いを、手作業で、またはVisual Gene Developer(Jung (2011) BMC Bioinformatics 12:340)もしくはRepfindツール(Betley (2002) Curr Biol 12:1756-1761)等の一般ソフトウェアプログラムの支援を受けてのいずれかで特定することができる。それにより、予期しない有利な特性を有する本発明の核酸分子を、これらの特徴を欠く従来技術の核酸分子と容易に区別することができる。
【0101】
上述されているように、本発明の低反復性ヌクレオチド配列は、50,000未満のNRSを有し得るか、または約17、約20、約25、約30、約35、約40、約45、約50、もしくは約55ヌクレオチドの最大長を有する反復を有し得る。本発明の低反復性ヌクレオチド配列は、少なくとも100ヌクレオチド、好ましくは少なくとも150個の、より好ましくは少なくとも200個の、さらにより好ましくは少なくとも300ヌクレオチド、さらにより好ましくは少なくとも350ヌクレオチドの、さらにより好ましくは少なくとも600ヌクレオチドの、さらにより好ましくは少なくとも900個の、さらにより好ましくは少なくとも1200個の、さらにより好ましくは少なくとも1500ヌクレオチドの、または最も好ましくは少なくとも1800ヌクレオチドの長さを有する。言い換えれば、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含むかまたはそれからなり、前記核酸のヌクレオチド配列は、少なくとも100ヌクレオチドの、好ましくは少なくとも150個の、より好ましくは少なくとも200個の、さらにより好ましくは少なくとも300ヌクレオチドの、さらにより好ましくは少なくとも350ヌクレオチドの、さらにより好ましくは少なくとも400個もしくは500ヌクレオチド、さらにより好ましくは少なくとも600ヌクレオチドの、さらにより好ましくは少なくとも700個もしくは800ヌクレオチドの、さらにより好ましくは少なくとも900ヌクレオチドの、さらにより好ましくは少なくとも1000個もしくは1100個の、さらにより好ましくは少なくとも1200ヌクレオチド(例えば、1203ヌクレオチド)の、さらにより好ましくは少なくとも1300個もしくは1400ヌクレオチドの、さらにより好ましくは少なくとも1500ヌクレオチドの、さらにより好ましくは少なくとも1600個もしくは1700ヌクレオチドの、または最も好ましくは少なくとも1800ヌクレオチドの長さを有する。
【0102】
本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含んでもよく、またはそれからなっていてもよく、前記核酸のヌクレオチド配列は、最大で5000ヌクレオチド、好ましくは最大で4800ヌクレオチド、3600ヌクレオチド、または2400ヌクレオチドの長さを有する。本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含んでもよく、またはそれからなっていてもよく、前記核酸のヌクレオチド配列は、最大で5000ヌクレオチド、4900ヌクレオチド、4800ヌクレオチド、4700ヌクレオチド、4600ヌクレオチド、4500ヌクレオチド、4400ヌクレオチド、4300ヌクレオチド、4200ヌクレオチド、4100ヌクレオチド、4000ヌクレオチド、3900ヌクレオチド、3800ヌクレオチド、3700ヌクレオチド、3600ヌクレオチド、3500ヌクレオチド、3400ヌクレオチド、3300ヌクレオチド、3200ヌクレオチド、3100ヌクレオチド、3000ヌクレオチド、2900ヌクレオチド、2800ヌクレオチド、2700ヌクレオチド、2600ヌクレオチド、2500ヌクレオチド、2400ヌクレオチド、2300ヌクレオチド、2200ヌクレオチド、2100ヌクレオチド、2000ヌクレオチド、または最大で1900ヌクレオチドの長さを有する。
【0103】
特に好ましい態様では、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含んでもよく、またはそれからなっていてもよく、前記核酸のヌクレオチド配列は、1200~3600ヌクレオチドの長さを有する。
【0104】
さらに、低反復性ヌクレオチド配列は、50,000未満、好ましくは40,000未満、より好ましくは30,000未満、より好ましくは20,000未満、より好ましくは10,000未満、より好ましくは1000未満、より好ましくは500未満、さらにより好ましくは100未満のヌクレオチド反復スコア(NRS)を有する。50未満、より好ましくは48未満、より好ましくは45未満、より好ましくは43未満、より好ましくは40未満、より好ましくは38未満、または最も好ましくは35未満のヌクレオチド反復スコア(NRS)を有する低反復性ヌクレオチド配列が、特に好ましい。言い換えれば、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列は、50,000未満、好ましくは40,000未満、より好ましくは30,000未満、より好ましくは20,000未満、より好ましくは10,000未満、より好ましくは1000未満、より好ましくは500未満、さらにより好ましくは400、300、200未満、さらにより好ましくは100未満のヌクレオチド反復スコア(NRS)を有する。プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、90、80、70、60未満、より好ましくは50未満、より好ましくは48未満のヌクレオチド反復スコア(NRS)、より好ましくは45または45未満、より好ましくは43未満、より好ましくは40未満のNRSスコア、より好ましくは39、38、37、もしくは36、または39、38、37、もしくは36未満のNRSスコア、あるいは最も好ましくは35または35未満のNRSスコアを有する核酸分子が特に好ましい。プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、34、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、もしくは8のヌクレオチド反復スコア(NRS)、または34、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、もしくは8未満のNRSを有する核酸分子がさらにより特に好ましい。
【0105】
上記で論じられているように、「ヌクレオチド反復スコア」または「NRS」は、以下の数式により決定することができる。
【0106】
【0107】
したがって、NRSは、全ての考え得る反復長にわたって(n=4からNtot-1まで)、各反復長(n)の二乗の和にその全体頻度の平方根を掛けたものを、分析したヌクレオチド配列の全長(Ntot)で除算したものと定義される。言い換えれば、NRSは、前記長さnの反復の頻度(fi(n))の和の平方根を掛けた、前記ヌクレオチド配列内の反復の長さの二乗の和であり、1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は1であり、前記和は、前記ヌクレオチド配列の全長で除算される。
【0108】
本明細書で使用される場合、「Ntot」は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする前記ヌクレオチド配列の全長である。また、長さNtotは、前記ヌクレオチド配列のヌクレオチドの数である。したがって、Ntotは、分析されるヌクレオチド配列の全長である。
【0109】
本明細書で使用される場合、「n」は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする前記ヌクレオチド配列内の反復の長さである。また、長さnは、前記反復のヌクレオチドの数である。したがって、nは、分析されるヌクレオチド配列内の反復の長さである。定義では、最も長い考え得る反復は、分析されるヌクレオチド配列の全長(Ntot)よりもヌクレオチドが1個分だけ短い、すなわちn=Ntot-1の長さを有していてもよい。その一方で、NRS分析のために考慮される反復の最も短い長さは、n=4であり、これは、アミノ酸の単一トリプレットコドンよりも長いヌクレオチドの最短伸長に相当する。そのようなコドンは、単にコードされるアミノ酸配列の結果として複数回出現するに過ぎないため、解決しようとする技術的課題に関するヌクレオチド配列反復とみなされるべきではない。
【0110】
用語「反復」は、本明細書で使用される場合、ヌクレオチド配列が、1回を超える、長さnのヌクレオチドの同一連続配列(すなわち、反復)を含むことを意味する。言い換えれば、ヌクレオチド配列は、少なくとも2つのまたは複数のコピーの、ある長さのヌクレオチドの連続部分/伸長/配列を含む。言い換えれば、用語「反復」は、ヌクレオチド配列中に1回よりも多く存在する、長さnのヌクレオチドの配列を指す。本明細書では、分析されるヌクレオチド配列の全長内に、1つのタイプの長さnの反復しか存在しなくてもよく、または同じ長さnの1つよりも多くの異なる反復が存在していてもよいことが企図される。したがって、ヌクレオチド配列は、例えば、その出現が全て同じ配列を有する、長さnの反復を有していてもよく、前記反復は、分析されるヌクレオチド配列の全長内に、少なくとも2回出現するが、複数回出現してもよいことが理解される。あるいは、異なる配列を有し、長さnが同じである反復、すなわち同じ長さ(n)を共有するが、配列レベルでは同一でない反復が存在する。この場合、各々の異なる反復性配列は、別のタイプの反復を構成する。
【0111】
本明細書で使用される場合、「fi(n)」は、長さnの反復の頻度である。言い換えれば、fi(n)は、長さnの反復の出現数である。1つのタイプの長さnの反復しか存在しない場合、k(n)は、1である。あるいは、長さnの1つよりも多くの異なる反復が存在する場合、k(n)は、前記長さnの反復の異なる配列の数である。言い換えれば、異なる配列を有する1つより多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数である。したがって、2つまたはそれよりも多くの異なるタイプの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数である。そうでなければ、長さnの反復全てが、同じ(すなわち、同一の)配列を有する場合、前記長さnの反復のk(n)は、1である。
【0112】
例えば、ヌクレオチド配列(長さNtotの)内の、14ヌクレオチド(n=14)の長さの反復の頻度は、5であってもよい。これは、14ヌクレオチドの長さを有する5つの反復が全て同一の配列を有する(同じタイプに属する)、すなわちその反復の配列が、ヌクレオチド配列内に5回出現することを意味し得る。この場合、k(n)は1であり、f1(n)=5である。別のシナリオでは、14ヌクレオチドの長さの5つ反復は、異なる配列を有している場合がある。このシナリオでは、5つの反復のうちの2つが、同一の配列を共有し(1つのタイプを構成する)、5つの反復のうちの3つが、別の同一配列を共有し(第2のタイプを構成する)、それにより1つの配列を共有する前者2つの反復の配列および別の配列を共有する後者3つの反復の配列は互いと異なることが想定される。したがって、このシナリオでは、前記長さnの異なる配列の数は2であり、すなわち、k(n)は2であり、f1(n)=2およびf2(n)=3である。用語fi(n)のインデックス「i」は、同じ長さnを有する一組の異なる反復内の反復のタイプを表すと理解することができる。
【0113】
NRSを決定するための数式は、反復の長さの二乗(n2)の和を含み、式中、nは、総和のインデックスであり、4は総和の下限であり、Ntot-1は総和の上限である。したがって、最小で考慮される反復の長さは、4である。4ヌクレオチドの長さの反復は、1つのアミノ酸コドントリプレットよりも長い全て配列を含む。インデックスnは、各逐次項毎に1だけ増加され、n=Ntot-1のとき中止される。
【0114】
さらに、NRSを決定するための数式は、前記長さnの反復の頻度(fi(n))の和の平方根を含み、式中、iは総和のインデックスであり、fi(n)は、系列の各逐次項を表すインデックス変数であり、1は総和の下限であり、k(n)は総和の上限である。インデックスiは、各逐次項毎に1だけ増加され、i=k(n)のとき中止される。したがって、1つのタイプの長さnの反復しか存在しない場合、すなわち長さnの全ての反復が同一の配列を有する場合、前記長さnの反復のk(n)は1であり、ヌクレオチド配列の全長(Ntot)内の、この長さnの反復の和ではなく、頻度f1(n)のみが分析される。
【0115】
例えば、以下のNRSカリキュレータスクリプトを、本発明に従って使用して、NRSを決定することができる。
【0116】
【0117】
【0118】
【0119】
さらに、本発明は、最大長nmaxを有するヌクレオチド反復を含むヌクレオチド配列にも関し、nmaxは、数式
【0120】
【数9】
により決定され、式中、N
totは、前記ヌクレオチド配列の全長である。用語「最大長」または「最長長」または「n
max」は、本明細書で使用される場合、前記ヌクレオチド配列または核酸分子内に少なくとも2つのコピーが存在するヌクレオチドの最長連続部分/伸長/配列のヌクレオチドの個数を規定する。言い換えれば、用語「最大長」または「最長長」または「n
max」は、本明細書で使用される場合、本発明による核酸分子のヌクレオチド配列が、この長さよりも長い反復を有していないことを意味する。
【0121】
添付の例では、本発明の例示的な核酸分子が、例えば14ヌクレオチドの長さの反復をほんの少数しか含んでいないことが示されている。例えば、添付の実施例2を参照されたい。上記で説明されているように、反復分析は、本明細書で提供されるNRS分析等の任意の好適なツールを用いて、手作業で、または例えば、Visual Gene Developer(Jung (2011) loc. cit)もしくはRepfindツール(Betley (2002) loc. cit)を使用したドットプロット分析等の一般ソフトウェアプログラムの支援を受けて実施することができる。ドットプロットは、2つの配列間の類似性の視覚的な提示である。
【0122】
添付の例では、本明細書で提供されるヌクレオチド配列を、それら自体とアラインした。矩形配置の各軸は、比較されている2つの(全体的に同一の)ヌクレオチド配列の一方を表す。第1の入力配列の全ての位置を、第2の入力配列の全ての位置と比較し、指定されている置換行列を使用してスコア化する。これにより、類似性/同一性の局所領域(ドットプロットの対角線に対応する)が特定されるスコアリングマトリックスが生成される。ユーザが指定する長さの反復ウィンドウ/閾値を、全ての考え得る対角線に沿って移動させる。反復ウィンドウ/閾値の各位置は、スコア行列の対スコアに相当する。ウィンドウ全体のスコアは、その内にある個々の位置のスコアの合計である。ウィンドウスコアが、ユーザが定義する閾値を超える場合、そのウィンドウに対応するドットプロットに線がプロットされる(例えば、http://emboss.sourceforge.net/apps/cvs/emboss/apps/dotmatcher.htmlを参照)。
【0123】
添付の例、例えば実施例3では、核酸分子のヌクレオチド配列の反復性を分析するために、ドットプロット分析が使用されている。本発明の核酸分子、例えば、配列番号36(本明細書ではPA#3b(200)と称する)または配列番号28(本明細書ではPA#1bと称する)が、14の反復ウィンドウ/閾値を適用した場合、600ヌクレオチドの長さ全体内にほんの少数の散在性の14ヌクレオチド反復しか有していないことが証明されている。14の反復ウィンドウ/閾値を1ヌクレオチドだけ増加させると、すなわち15ヌクレオチドの反復ウィンドウ/閾値は、分析されるヌクレオチド配列全体内にさらなる反復を明らかにしない(
図2および実施例3を参照)。これは、調査した核酸配列全体内の反復の最長長が、14ヌクレオチドの長さを有する(それよりも短い反復も含む)ことを意味する。一般的に、そのようなヌクレオチド反復は、短ければ短いほど、遺伝子安定性に有害な役割を果たさないと仮定することができる。
【0124】
しかしながら、従来技術に開示されているプロリン/アラニンリッチ配列をコードする核酸分子は、例えば、添付の実施例(実施例3を参照)で使用されているように14個または15ヌクレオチドの反復ウィンドウ/閾値を適用すると、より長いおよび/またはより多くの反復配列を示す。例えば、国際公開第2011/144756号パンフレットに開示されているプロリン/アラニンリッチ配列(配列番号15;本明細書ではPA#3a(200)と称する)は、長さ60の複数のヌクレオチド反復を有する。それらは、連続しており、オーバーラップさえしており、したがって、多数の長い平行線を生じさせる。配列番号12に示されており、国際公開第2008/155134号パンフレットに開示されているPAS#1a(600);配列番号16に示されており、米国特許出願公開第2006/0252120号明細書に開示されている[(AP)5]n多量体;または配列番号18に示されており、GenBankエントリーAAP41454.1において開示されているマカクヘルペスウイルス(Macacine herpesvirus)1の大型テグメントタンパク質等の従来技術に開示されているさらなる核酸分子も、これらヌクレオチド配列の高度に反復性の性質を実証している。
【0125】
これは、ヌクレオチド配列レベルでの低反復性を示している本発明の核酸分子とは著しく対照的である。例えば、従来技術の配列PA#3a(200)(配列番号15)の反復の数を、14ヌクレオチドの反復ウィンドウ/閾値を使用して、本発明の低反復性ヌクレオチド配列PA#3b(200)(配列番号36)の反復の数と比較すると、従来技術の配列の100個を超える多く反復に対して(600ヌクレオチド残基当たり)、本発明の配列は、29個の反復(600ヌクレオチド残基当たり)を有することを観察することができる。15ヌクレオチドのウィンドウを適用すると、本発明の例示的な分析された核酸分子またはヌクレオチド配列は、一切の反復を含まない。対照的に、従来技術の核酸分子では、15個またはそれを超えるヌクレオチドの長さを有する多数の反復が明らかになる。添付の例で証明されているように、本発明の核酸分子が、低反復性ヌクレオチド配列を有することを確認するためには、14~20個、例えば14、15、16、17、18、19、または20ヌクレオチドの反復ウィンドウ/閾値が、特に好適である。反復ウィンドウ/閾値の長さは、特定のヌクレオチド配列で特定されることになる反復の数と逆相関すると理解される。例えば、反復ウィンドウ/閾値が「1」である場合、反復の数は、ヌクレオチド配列中にある全てのヌクレオチド残基(A、T、G、および/またはC)の数と等しい場合がある(ただし、分析される配列に出現する各タイプのヌクレオチドが、少なくとも2つのコピーで存在する)。反復ウィンドウ/閾値の長さが増加すると、分析されるヌクレオチド配列中の反復の数は、配列特異的な様式で減少することになる。したがって、本発明の「低反復性」ヌクレオチド配列も、反復を有していてもよいが、同じパラメータを分析に適用した場合、反復は、従来技術の配列と比較してより短く、より少数である。
【0126】
したがって、本明細書で提供される核酸分子は、14、15、16、17、約18、約19、約20、約21、約25、約30、約35、約40、約45、約50、または約55ヌクレオチドの最大長の反復を含む。さらに、本明細書で提供される核酸分子は、約17ヌクレオチドの最大長~約55ヌクレオチドの最大長の反復を含む。反復の最大長の状況では、用語「約」は、最長反復長が、示されている反復長の+/-4ヌクレオチドであることを意味する。言い換えれば、この状況では、「約」は、反復の長さが、示されている反復長よりも、4ヌクレオチドだけより長くともよく、または短くともよい範囲を指す。例えば、約55ヌクレオチドの最大反復長は、51~59ヌクレオチドの最大長の反復を含むヌクレオチド配列を指す。さらに、約17ヌクレオチドの最大反復長は、13~21ヌクレオチドの最大長の反復を含むヌクレオチド配列を指す。
【0127】
さらに、本発明は、59ヌクレオチド、好ましくは54ヌクレオチド、より好ましくは50ヌクレオチド、より好ましくは48ヌクレオチド、より好ましくは40ヌクレオチド、より好ましくは36ヌクレオチド、より好ましくは35ヌクレオチド、より好ましくは30ヌクレオチド、より好ましくは25ヌクレオチド、より好ましくは24ヌクレオチド、より好ましくは21ヌクレオチド、より好ましくは20ヌクレオチド、より好ましくは19ヌクレオチド、より好ましくは18ヌクレオチド、より好ましくは16ヌクレオチド、より好ましくは15ヌクレオチド、より好ましくは14ヌクレオチド、または最も好ましくは17ヌクレオチドの最大長の反復を含む核酸分子に関する。
【0128】
本明細書で使用される場合、例えば、17ヌクレオチドの最大長の反復を含む核酸分子は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、または17ヌクレオチドの長さを有する反復配列を含む核酸分子に関する。同様に、14ヌクレオチドの最大長の反復を含む核酸分子は、最大14ヌクレオチドの、すなわち、「≦14ヌクレオチド」または「1、2、3、4、5、6、7、8、9、10、11、12、13、もしくは14ヌクレオチド」の反復を含む核酸分子に関する。言い換えれば、14ヌクレオチドの最大長の反復を含む核酸分子は、14ヌクレオチドよりも長い、すなわち「>14ヌクレオチド」の反復を含んでいない。
【0129】
本発明は、低反復性核酸分子にさらに関し、低反復性は、反復性アミノ酸配列をコードするより長いヌクレオチド配列内に反復して出現するヌクレオチド配列伸長が、その繰り返しアミノ酸配列伸長をコードするヌクレオチド配列の長さの、最大で0.05%、好ましくは0.1%、より好ましくは0.5%、より好ましくは1%、より好ましくは2%、より好ましくは3%、より好ましくは4%、より好ましくは5%、より好ましくは6%、より好ましくは7%、より好ましくは8%、より好ましくは9%、より好ましくは10%、より好ましくは15%、より好ましくは20%、より好ましくは25%、より好ましくは30%、より好ましくは40%、または最も好ましくは50%に相当することを意味する。言い換えれば、本発明の核酸は反復を含み、前記反復は、プロリン、アラニン、および任意選択でセリンからなるポリペプチド中のアミノ酸配列反復をコードする前記ヌクレオチド配列の長さの、0.05%、好ましくは0.1%、より好ましくは0.5%、より好ましくは1%、より好ましくは2%、より好ましくは3%、より好ましくは4%、より好ましくは5%、より好ましくは6%、より好ましくは7%、より好ましくは8%、より好ましくは9%、より好ましくは10%、より好ましくは15%、より好ましくは20%、より好ましくは25%、より好ましくは30%、より好ましくは40%、または最も好ましくは50%に相当する最大長を有する。
【0130】
本発明は、PAリッチ配列をコードし、少なくとも300ヌクレオチド(100個のアミノ酸残基に相当する)の長さを有する新規で進歩性のあるヌクレオチド配列を提供するだけでなく、本発明は、遺伝子的に安定な配列に結び付き、ならびに/または便利なクローニング、配列決定、および/もしくは増幅を可能にする組換えおよび/または合成核酸分子の選択手段および方法も提供することは明白である。この選択方法は、本明細書で提供されるNRSおよび/または本明細書に記載されている最長反復長に基づく。したがって、本発明は、遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、方法が、50,000未満のヌクレオチド反復スコア(NRS)を有するヌクレオチド配列を含む核酸分子を選択するステップを含み、前記ヌクレオチド反復スコア(NRS)が、本明細書の上記に提供されている数式により決定される、方法に関する。さらに、本発明は、遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、方法が、nmaxの最大長を有する反復を含む前記ヌクレオチド配列を選択するステップを含む方法に関する。さらに、本発明は、遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、方法が、約17ヌクレオチドの最大長~約55ヌクレオチドの最大長の反復を含む前記ヌクレオチド配列を選択するステップを含む方法に関する。PAリッチ配列をコードする本発明の核酸の状況における、本明細書の上記で提供されているNRS数式および低反復性ヌクレオチド配列の実施形態およびパラメータは、必要な変更を加えれば、本明細書で提供および例示されている、PAリッチ配列をコードする遺伝子的に安定な核酸分子の選択方法、ならびにさらなる実施形態に当てはまる。
【0131】
本明細書では、驚くべきことに、本発明の核酸分子が、増強されたin vivo安定性を有することが見出され、実証された。添付の実例、例えば実施例6に示されているように、本明細書で提供される核酸分子は、より反復性のヌクレオチド配列を含む核酸分子よりも安定している。実施例6では、ヌクレオチド配列の反復性が異なる、プロリン、アラニン、およびセリンからなるポリペプチドをコードする核酸分子が比較されている。例えば、配列番号50に示されているような、本明細書で提供される低反復性ヌクレオチド配列を含む本発明の核酸分子(
図2Bも参照)は、従来技術で示されているもの、例えば、配列番号51等の、高度に反復性のヌクレオチド配列と比較して、より高い遺伝子安定性を有する。したがって、用語「in vivo安定性」は、本明細書で使用される場合、特に「遺伝子安定性」を指す。用語「遺伝子安定性」は、本明細書で使用される場合、核酸が、宿主細胞内で安定的に維持され、配列が、例えば、突然変異、挿入、または欠失により、遺伝子的に修飾されないことを意味する。本明細書で使用される場合、突然変異は、ヌクレオチド配列の変化、例えば、置換、欠失、挿入、または延長を指す。高度に反復性のヌクレオチド配列を含む核酸分子は、欠失または短縮を受けやすいことが、添付の例に示されている。例えば、実施例6を参照されたい。したがって、高度に反復性のヌクレオチド配列/反復性の遺伝子カセットを含む核酸分子は、遺伝子安定性が劣っており、それは、例えば、細胞分裂中の組換え事象に起因する場合がある。本明細書で定義されているパラメータNRSまたはn
maxは、従来技術に由来するもの等の、高い値のNRSおよび/またはn
maxを有する高度に反復性のヌクレオチド配列を、低い値のNRSおよび/またはn
maxを有する本発明の低反復性ヌクレオチド配列と区別するための客観的手段を提供する。
【0132】
本明細書で提供される核酸分子は、反復性アミノ酸配列を含むポリペプチドをコードする。特筆すべきことには、コードされた反復性アミノ酸配列は、融合タンパク質の一部/断片であってもよい。例えば、本明細書で開示されている核酸分子は、プロリン/アラニンリッチ反復、例えば、プロリン、アラニン、および任意選択でセリンからなる反復からなるポリペプチドをコードしていてもよい。プロリン/アラニンリッチポリペプチドは、ランダムコイルを形成する場合がある。ある特定の態様では、本明細書で開示されている核酸分子は、プロリン、アラニン、およびセリンからなるポリペプチドをコードし、上記ポリペプチドは、ランダムコイルを形成する。ある特定の態様では、本明細書で開示されている核酸分子は、プロリンおよびアラニンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。
【0133】
特に、ヌクレオチド配列は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする。このコードされたポリペプチドは、ランダムコイルを形成する。ヌクレオチド配列は、本明細書で提供される核酸分子に含まれる。したがって、ある特定の態様では、本明細書で開示されている核酸分子は、反復性アミノ酸配列を含み、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。ある特定の態様では、本明細書で開示されている核酸分子は、反復性アミノ酸配列を含み、プロリン、アラニン、およびセリンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。ある特定の態様では、本明細書で開示されている核酸分子は、反復性アミノ酸配列を含み、プロリンおよびアラニンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。
【0134】
本明細書で使用される場合、用語「ランダムコイル」は、アミノ酸ポリマー、特にLアミノ酸で作られているポリペプチドを含むポリマー分子の任意のコンフォメーションに関し、前記ポリマー構造を形成する個々の単量体要素が、化学的に連結したまま、1つまたは複数の隣接単量体要素に対して本質的にランダムに配向されている。特に、「ランダムコイルコンフォメーション」を取る/有する/形成する、コードされたポリペプチドまたはアミノ酸ポリマーは、明確な二次および三次構造を実質的に欠く。コードされたポリペプチドランダムコイルの性質、およびそれらを実験的に特定するための方法は、当業者に公知であり、科学文献(Cantor (1980) Biophysical Chemistry, 2nd ed., W. H. Freeman and Company, New York;Creighton (1993) Proteins - Structures and Molecular Properties, 2nd ed., W. H. Freeman and Company, New York;Smith (1996) Fold. Des. 1:R95-R106)、ならびに特許文献、例えば国際公開第2011/144756号パンフレットおよび国際公開第2008/155134号パンフレットに記載されている。
【0135】
本発明のコードされたランダムコイルポリペプチドは、例えば、水溶液中でおよび/または生理学的条件で、ランダムコイルコンフォメーションを取る/形成する。用語「生理学的条件」は、当技術分野で公知であり、タンパク質が、通常それらの天然折り畳みコンフォメーションを取る条件に関する。より詳しくは、用語「生理学的条件」は、典型的には、高等生物、特に哺乳動物、最も好ましくはヒトに有効であるような環境的生物物理学的パラメータに関する。用語「生理学的条件」は、哺乳動物、特にヒトの体内に、特に体液中に通常見出されるような生化学的および生物物理学的パラメータに関する場合がある。前記「生理学的条件」は、健常体内に見出される対応するパラメータ、ならびに疾患状態下でまたはヒト患者に見出されるパラメータに関する場合がある。例えば、哺乳動物またはヒトが発熱を患っている場合、前記病気の哺乳動物または前記ヒト患者は、より高温であるものの「生理学的な」体温(すなわち、温度条件)を有する場合がある。タンパク質がそれらの天然コンフォメーション/状態を取る「生理学的条件」に関して、最も重要なパラメータは、温度(健常ヒト体内では、37℃)、pH(ヒト血液では、7.35~7.45)、浸透圧モル濃度(280~300mmol/kg H2O)、および必要に応じて、一般的タンパク質含有量(66~85g/l血清)である。
【0136】
しかしながら、当業者であれば、生理学的条件では、これらパラメータは様々であり得、例えば、温度、pH、浸透圧モル濃度、およびタンパク質含有量は、所与の体内、または血液、脳脊髄液、腹水、およびリンパ液等の組織液で異なっている場合があることを認識している(Klinke (2005) Physiologie, 4th edition., Georg Thieme Verlag, Stuttgart)。例えば、脳脊髄液では、浸透圧モル濃度は、290mmol/kg H2O付近であってもよく、タンパク濃度は、0.15g/l~0.45g/lであってもよく、リンパ液のpHは、7.4付近であってもよく、タンパク質含有量は、3g/l~5g/lであってもよい。コードされたポリペプチド/アミノ酸配列が、実験条件下でランダムコイルコンフォメーションを形成するか/取るか否かを決定する場合、温度、pH、浸透圧モル濃度、およびタンパク質含有量等の生物物理学的パラメータは、in vivoで通常見出される生理学的条件とは異なっていてもよい。1℃~42℃または好ましくは4℃~25℃の温度を、in vitroの生理学的条件下でタンパク質の生物物理学的特性および生理活性を試験および/または検証するために有用であるとみなすことができる。
【0137】
in vitro、特に実験の設定では、例えば、当業者がタンパク質/アミノ酸配列の構造特性を決定することを可能にするCD測定または他の方法の状況では、医薬組成物用の溶媒および/または賦形剤を含んでもよいいくつかの緩衝液が、「生理学的溶液」/「生理学的条件」であるとみなされる。そのような緩衝液の例は、例えば、リン酸緩衝生理食塩水(PBS、例えば:115mM NaCl、4mM KH2PO4、16mM Na2HPO4 pH7.4)、Tris緩衝液、酢酸緩衝液、クエン酸緩衝液、または類似の緩衝液である。一般的に、「生理学的溶液条件」を表す緩衝液のpHは、6.5から8.5までの範囲、好ましくは7.0から8.0までの範囲、最も好ましくは7.2から7.7までの範囲に入るべきであり、浸透圧モル濃度は、10から1000mmol/kg H2Oまでの範囲、より好ましくは50から500mmol/kg H2Oまでの範囲、および最も好ましくは200から350mmol/kg H2Oまでの範囲に入るべきである。任意選択で、生理学的溶液のタンパク質含有量は、ランダムコイルコンフォメーションを取る調査対象のタンパク質自体を除き、0から100g/lまでの範囲に入っていてもよく、さらに、典型的な安定化タンパク質、例えば、ヒトまたはウシ血清アルブミンが存在してもよい。
【0138】
本発明の核酸分子によりコードされるポリペプチドは、生理学的条件下でランダムコイルコンフォメーションを形成するだけでなく、より一般的には、水溶液中でもランダムコイルコンフォメーションを形成する。例えば、国際公開第2011/144756号パンフレットを参照されたい。用語「水溶液」は、当技術分野で周知である。「水溶液」は、少なくとも約20%の、少なくとも約30%の、少なくとも約40%の、少なくとも約50%の、少なくとも約60%の、少なくとも約70%の、少なくとも約80%の、または少なくとも約90%のH2O(重量/重量)の水(H2O)含有量を有する溶液であってもよい。したがって、本発明で提供されるコードされたポリペプチドは、恐らくは他の混和性溶媒を含む水溶液中で、または広範囲の温度、pH値、浸透圧モル濃度、もしくはタンパク質含有量を有する水性分散液中でランダムコイルコンフォメーションを形成することができる。これは、医学的療法またはin vivo診断以外の、例えば、化粧品、栄養、または食品技術における、ランダムコイルポリペプチドの応用に特に関連する。
【0139】
また、本発明の状況では、コードされたポリペプチドのランダムコイルコンフォメーションは、液体医薬品/生物学的製剤または凍結乾燥医薬組成物のような医薬組成物中で維持されることが想定される。これは、特にランダムコイルポリペプチドを含む、本明細書で提供されるコードされた生理活性タンパク質または薬物コンジュゲートの状況では特に重要である。好ましくは、「生理学的条件」は、対応する緩衝液系、溶媒、および/または賦形剤に使用されることになる。しかしながら、例えば、凍結乾燥または乾燥させた組成物(例えば、医薬組成物/生物学的製剤のような)では、本明細書で提供されるコードされたランダムコイルポリペプチドのランダムコイルコンフォメーションは、一時的に存在していなくてもよく、および/または検出することができないことが想定される。しかしながら、前記コードされたランダムコイルポリペプチドは、対応する緩衝液/溶液/賦形剤/溶媒に再構成した後、または患者もしくは動物の体に投与された後で、そのランダムコイルを再び取る/形成することになる。
【0140】
本発明のある特定の態様では、本明細書で開示されている核酸分子は、プロリン、アラニン、および任意選択でセリンから(主にまたは排他的に)なるポリペプチドをコードし、9個以下の連続アミノ酸残基が同一である。そのようなコードされたポリペプチドは、ランダムコイルを形成する。ある特定の態様では、ランダムコイルコンフォメーションを取るコードされたアミノ酸配列/ポリペプチドは、複数のアミノ酸反復を含んでもよく、前記「アミノ酸反復」は、プロリン、アラニン、および任意選択でセリンアミノ酸残基から主にまたは排他的になり、9個以下の連続アミノ酸残基が同一である。ある特定の態様では、ランダムコイルコンフォメーションを取るコードされたアミノ酸配列/ポリペプチド(本明細書で定義されるランダムコイルポリペプチド)は、複数のアミノ酸反復を含んでもよく、前記「アミノ酸反復」は、プロリン、アラニン、およびセリンアミノ酸残基から主にまたは排他的になり、9個以下の連続アミノ酸残基が同一である。ある特定の態様では、ランダムコイルコンフォメーションを取るコードされたアミノ酸配列/ポリペプチドは、複数のアミノ酸反復を含んでもよく、前記「アミノ酸反復」は、プロリンおよびアラニンアミノ酸残基から主にまたは排他的になり、9個以下の連続アミノ酸残基が同一である。
【0141】
好ましい態様では、本明細書で開示されている核酸分子は、8個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。好ましくは、本明細書で開示されている核酸分子は、7個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。より好ましくは、本明細書で開示されている核酸分子は、6個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。特に好ましくは、本明細書で開示されている核酸分子は、5個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。より特に好ましくは、本明細書で開示されている核酸分子は、4個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。最も好ましくは、本明細書で開示されている核酸分子は、3個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。
【0142】
プロリン、アラニン、およびセリン残基から排他的になるアミノ酸反復の非限定的な例は、本明細書の下記で提供されている。例えば、配列番号6を参照されたい。プロリンおよびアラニン残基から排他的になるコードされたアミノ酸反復の非限定的な例は、本明細書の下記で提供されている。例えば、配列番号8を参照されたい。コードされたポリペプチドは、同じ配列または異なる配列の複数のコピーを含んでもよい。
【0143】
本明細書で開示されている核酸分子は、3種類のアミノ酸残基:プロリン(Pro、P)、アラニン(Ala、A)、および任意選択でセリン(Ser、S)から主にまたは排他的になるポリペプチドをコードする。用語「任意選択で」は、本明細書で使用される場合、本発明のコードされたポリペプチドが、プロリン、アラニン、およびセリンから主にもしくは排他的になっているか、またはプロリンおよびアラニンから主にもしくは排他的になっているかのいずれかであることを意味する。3種類のアミノ酸残基:プロリン、アラニン、およびセリンから主にまたは排他的になるコードされたポリペプチドは、本明細書では「PAS」ポリペプチドと呼ばれる。2種類のアミノ酸残基:プロリンおよびアラニンから主にまたは排他的になるコードされたポリペプチドは、本明細書では「PA」ポリペプチドと呼ばれる。プロリンおよびアラニンからなるコードされたポリペプチドの非限定的な例は、配列番号8に示されている。プロリン、アラニン、およびセリンからなるコードされたポリペプチドの非限定的な例は、配列番号6に示されている。用語「主に」は、本明細書で使用される場合、コードされたアミノ酸の好ましくは少なくとも約90%または少なくとも約95%が、プロリン、アラニン、および任意選択でセリンであり、そのため、プロリン、アラニン、およびセリンが合わさると、大多数を構成するが、それらだけがアミノ酸残基ではなくともよく、したがって、コードされたアミノ酸配列は、必ずしも100%がプロリン、アラニン、および任意選択のセリンではないことを意味する。したがって、コードされたポリペプチド/アミノ酸配列は、アミノ酸配列がランダムコイルコンフォメーションを形成する/取る/有する限り、プロリン、アラニン、および任意選択でセリン以外の他のアミノ酸も、微量成分として含んでもよい。そのようなランダムコイルコンフォメーションは、本明細書に記載の手段および方法により、容易に決定することができる。したがって、本発明は、一実施形態では、ランダムコイルポリペプチドをコードし、そのためアミノ酸配列がプロリン、アラニン、および任意選択でセリンから主になる核酸分子に関する。
【0144】
コードされたポリペプチドがプロリンおよびアラニンからなる場合、前記プロリン残基は、前記コードされたアミノ酸配列の約10%超および約75%未満を構成する。したがって、コードされたランダムコイルポリペプチドは、プロリンおよびアラニンから主になり、プロリン残基は、アミノ酸配列の約10%超および75%未満を構成する。アラニン残基は、前記アミノ酸配列の残り少なくとも25%~90%を構成する。
【0145】
好ましくは、コードされたアミノ酸配列は、約10%を超える、好ましくは約12%を超える、より好ましくは約14%、18%、20%を超える、より好ましくは約22%、23%、24%、または25%を超える、より好ましくは約27%、29%、または30%を超える、より好ましくは約32%、33%、または34%を超える、および最も好ましくは約35%を超えるプロリン残基を含む。アミノ酸配列は、好ましくは、約75%未満、より好ましくは70%未満、より好ましくは65%未満、より好ましくは60%未満、より好ましくは55%未満、より好ましくは50%未満のプロリン残基を含み、より低い値が好ましい。さらにより好ましくは、アミノ酸配列は、約48%、46%、44%、42%未満のプロリン残基を含む。約41%、40%、39%、38%、37%、または36%未満のプロリン残基を含むアミノ酸配列がより好ましく、より低い値が好ましい。約34%、32%、または30%未満を含むアミノ酸配列がより好ましい。約28%、26%、または25%未満を含むアミノ酸配列がより好ましい。より好ましくは、アミノ酸配列は、約35%未満のプロリン残基を含む。
【0146】
逆も同様に、アミノ酸配列は、好ましくは約90%未満、より好ましくは88%、86%、84%、82%、または80%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、アミノ酸配列は、約79%、78%、77%、76%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、アミノ酸配列は、約74%、72%、または70%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、アミノ酸配列は、約69%、67%、または65%未満のアラニン残基を含み、より低い値が好ましい。最も好ましくは、アミノ酸配列は、約75%未満のアラニン残基を含む。本明細書では、約25%を超える、好ましくは約30%を超える、より好ましくは約35%を超える、より好ましくは約40%を超える、より好ましくは約45%を超える、より好ましくは約50%を超える、より好ましくは約52%、54%、56%、58%、または59%を超えるアラニン残基を含むアミノ酸配列も好ましく、より高い値が好ましい。さらにより好ましくは、アミノ酸配列は、約60%、61%、62%、63%、または64%を超えるアラニン残基を含む。より好ましくは、アミノ酸配列は、約66%、67%、69%、または70%を超えるアラニン残基を含む。より好ましくは、アミノ酸配列は、約72%、74%、または75%を超えるアラニン残基を含む。より好ましくは、アミノ酸配列は、約65%を超えるアラニン残基を含む。
【0147】
したがって、ランダムコイルポリペプチドは、それぞれ、約25%または30%のプロリン残基および約75%または70%のアラニン残基からなるアミノ酸配列を含んでもよい。あるいは、ランダムコイルポリペプチドは、約35%のプロリン残基および約65%のアラニン残基からなるアミノ酸配列を含んでもよい。本明細書の上記で使用されているような用語「約X%」は、パーセンテージの簡潔な数に限定されず、それよりも10%~20%多いまたは10%~20%少ない残基の値も含む。例えば、用語10%は、それぞれ、11%または12%および9%または8%にも関し得る。
【0148】
コードされたポリペプチドがプロリン、アラニン、およびセリンからなる場合、前記プロリン残基は、前記コードされたアミノ酸配列の約4%超および約40%未満を構成する。アラニンおよびセリン残基は、前記アミノ酸配列の残りの量を構成する。
【0149】
好ましくは、コードされたアミノ酸配列は、約4%を超える、好ましくは約6%を超える、より好ましくは約10%を超える、より好ましくは約15%を超える、より好ましくは約20%を超える、より好ましくは約22%、23%、または24%を超える、より好ましくは約26%、29%、または30%を超える、より好ましくは約31%、32%、33%、34%、または35%を超える、および最も好ましくは約25%を超えるプロリン残基を含む。コードされたアミノ酸配列は、好ましくは約40%未満、より好ましくは38%、35%、30%、26%未満のプロリン残基を含み、より低い値が好ましい。
【0150】
コードされたアミノ酸配列は、好ましくは約95%未満、より好ましくは90%、86%、84%、82%、または80%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約79%、78%、77%、76%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約75%、73%、71%、または70%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約69%、67%、66%、または65%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約64%、63%、62%、または60%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約59%、57%、56%、または55%未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約54%、53%、または51%未満のアラニン残基を含み、より低い値が好ましい。最も好ましくは、コードされたアミノ酸配列は、約50%未満のアラニン残基を含む。
【0151】
本明細書では、約10%を超える、好ましくは約15%、17%、19%、または20%を超える、より好ましくは約22%、24%、または25%を超える、より好ましくは約27%、29%、または30%を超える、より好ましくは約32%、34%、または35%を超える、より好ましくは約37%、39%、または40%を超える、より好ましくは約42%、44%、または45%を超える、より好ましくは約46%、47%、または49%を超えるアラニン残基を含むコードされたアミノ酸配列も好ましく、より高い値が好ましい。最も好ましくは、コードされたアミノ酸配列は、約50%を超えるアラニン残基を含む。上記で言及されているように、セリン残基は、前記アミノ酸配列の残りの量を構成する。
【0152】
したがって、コードされたランダムコイルポリペプチドは、約35%のプロリン残基、約50%のアラニン、および15%のセリン残基からなるアミノ酸配列を含んでもよい。例示的なヌクレオチド配列およびそのコードされたポリペプチドは、表1に見出すことができる。本明細書の上記で使用されているような用語「約X%」は、パーセンテージの簡潔な数に限定されず、それよりも10%~20%多いまたは10%~20%少ない残基の値も含む。例えば、用語10%は、それぞれ、11%または12%または9%および8%にも関し得る。
【0153】
しかしながら、上記で言及されているように、および本明細書の下記でさらに詳述されているように、前記コードされたランダムコイルポリペプチド、および特にアミノ酸配列は、プロリン、アラニン、および任意選択でセリンとは異なる追加のアミノ酸も微量成分として含むことができる。本明細書の上記で既に論じられているように、前記微量成分、すなわちプロリン、アラニン、または任意選択でセリンとは異なるアミノ酸は、本発明のコードされたランダムコイルポリペプチドの約10%未満または約5%未満を構成していてもよい。
【0154】
当業者であれば、プロリン、アラニン、および任意選択でセリン以外の他の残基が、前記アミノ酸配列/ポリペプチド(ポリペプチド断片)に微量成分として含まれている場合、コードされたアミノ酸配列/ポリペプチドも、ランダムコイルコンフォメーションを形成することができることを認識する。用語「微量成分」は、本明細書で使用される場合、本発明のコードされたランダムコイルポリペプチド中、最大で5%、または最大で10%のアミノ酸残基が、プロリン、アラニン、またはセリンとは異なることを意味する。これは、100個のアミノ酸のうち最大で10個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、好ましくは、最大で8%、すなわち100個のアミノ酸のうち最大で8個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、より好ましくは、最大で6%、すなわち100個のアミノ酸のうち最大で6個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、さらにより好ましくは、最大で5%、すなわち100個のアミノ酸のうち最大で5個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、特に好ましくは、最大で4%、すなわち100個のアミノ酸のうち最大で4個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、より特に好ましくは、最大で3%、すなわち100個のアミノ酸のうち最大で3個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、さらにより特に好ましくは、最大で2%、すなわち100個のアミノ酸のうち最大で2個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、最も好ましくは、最大で1%、すなわちランダムコイルポリペプチドに含まれる100個のアミノ酸のうち最大で1個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよいことを意味する。プロリン、アラニン、および任意選択でセリンと異なる前記アミノ酸は、翻訳後に修飾されたアミノ酸または非天然アミノ酸を含む、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr、およびValからなる群から選択することができる(例えば、Budisa (2004) Angew Chem Int Ed Engl 43: 6426-6463;Young (2010) J Biol Chem 285:11039-11044;Liu (2010) Annu Rev Biochem 79:413-444;Wagner (1983) AngewChem Int Ed Engl 22:816-828;Walsh (2010) Drug Discov Today 15: 773-780を参照)。ある特定の場合では、PAリッチ配列は、微量成分としてSerも含むことができる。例えば、コードされたランダムコイルポリペプチドが、プロリンおよびアラニンからなる場合、セリンも微量成分とみなすことができる。
【0155】
一般的に、本明細書では、これら「微量」アミノ酸(プロリン、アラニン、および任意選択でセリン以外の)は、本明細書に記載のコードされたランダムコイルポリペプチド、または融合タンパク質の一部/断片としてのコードされたランダムコイルポリペプチドに存在しないことが好ましい。本発明によると、コードされたランダムコイルポリペプチド/アミノ酸配列は、特に、プロリン、アラニン、および任意選択でセリン残基から排他的になっていてもよい(すなわち、コードされたランダムコイルポリペプチドまたはアミノ酸配列に、他のアミノ酸残基が存在しない)。
【0156】
本発明の状況では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子、またはプロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列は、少なくとも300ヌクレオチドからなっていてもよい。しかしながら、本明細書で提供されるヌクレオチド配列の長さは、コードされたポリペプチドがランダムコイルを形成する限り、限定されないことは、当業者であれば明白である。添付の例は、低反復性ヌクレオチド配列を含む、本明細書で提供される核酸分子は、驚くべきことに、それらの長さに関わらず合成することができることを実証している。例えば、約600ヌクレオチドの長さを有するヌクレオチド配列を合成することができることが、本明細書で証明されている。そのようなヌクレオチド配列は、さらにより長いヌクレオチド配列を構築するために使用することができる。言い換えれば、これらヌクレオチド配列は、本発明の核酸分子に包含されるより長いヌクレオチド配列を組み合わせる/構築するためのユニット/モジュール/構成単位として使用することができる。一実施形態では、単一のヌクレオチド配列ユニット/モジュール/構成単位も、本発明の核酸分子に相当する。
【0157】
本発明によると、構築されたヌクレオチド配列が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする限り、同一または非同一のヌクレオチド配列ユニット/モジュール/構成単位を、互いに組み合わせることができる。さらに、本発明によると、反復性アミノ酸配列を有するポリペプチドをコードする構築されたヌクレオチド配列がランダムコイルを形成する限り、同一または非同一のヌクレオチド配列ユニット/モジュール/構成単位を、互いに組み合わせることができる。上記で言及されているように、これらユニット/モジュール/構成単位を使用することにより、低反復性ヌクレオチド配列を含む本明細書で提供される核酸分子を構築することが、特に有利である。少なくとも2400ヌクレオチドの長さを有する長いヌクレオチド配列を構築することができることが、本明細書で実証されている。本発明のヌクレオチド配列は、互いに、または追加の非同一ヌクレオチド配列と組み合わせることができる。したがって、本明細書で提供される核酸分子は、同一または非同一のヌクレオチド配列から構築することができ、前記ヌクレオチド配列は、低反復性ヌクレオチド配列である。ある特定の態様では、本明細書で提供される核酸分子は、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号87、配列番号88、配列番号89、配列番号90、配列番号91、配列番号92、配列番号93、配列番号94、配列番号95、配列番号96、配列番号97、配列番号98、配列番号99、配列番号100、配列番号101、配列番号102、配列番号103、配列番号104、配列番号105、配列番号106、配列番号107、配列番号108、配列番号109、配列番号110、配列番号111、配列番号112、配列番号113、配列番号114、配列番号115、配列番号116、配列番号117、配列番号118、配列番号119、配列番号120、配列番号121、配列番号122、配列番号123、配列番号124、配列番号125、配列番号126、配列番号127、配列番号128、配列番号129、配列番号130、配列番号131、配列番号132、配列番号133、配列番号134、配列番号135、配列番号136、配列番号137、配列番号138、配列番号139、配列番号140、配列番号141、配列番号142、配列番号143、配列番号144、配列番号145、配列番号146、配列番号147、配列番号148、配列番号149、配列番号150、配列番号151、配列番号152、配列番号192、配列番号193、配列番号194および配列番号195からなる群から選択される少なくとも1つのヌクレオチド配列を含む。これら例示的なヌクレオチド配列を使用して、より長いヌクレオチド配列を構築することができるため、これらヌクレオチド配列を、ユニットまたはモジュールまたは構成単位と称する場合がある。したがって、本明細書では、本発明の核酸分子は、より長いヌクレオチド配列へと構築される複数のこれらのヌクレオチドモジュールまたはヌクレオチド配列を含むことができ、前記より長いヌクレオチド配列それ自体が、本明細書の上記に記載されている低反復性ヌクレオチド配列であることが理解される。当業者であれば、本発明の核酸分子は、所与のヌクレオチド配列モジュールの断片も含み得ることを理解する。言い換えれば、本明細書で提供される核酸分子は、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号87、配列番号88、配列番号89、配列番号90、配列番号91、配列番号92、配列番号93、配列番号94、配列番号95、配列番号96、配列番号97、配列番号98、配列番号99、配列番号100、配列番号101、配列番号102、配列番号103、配列番号104、配列番号105、配列番号106、配列番号107、配列番号108、配列番号109、配列番号110、配列番号111、配列番号112、配列番号113、配列番号114、配列番号115、配列番号116、配列番号117、配列番号118、配列番号119、配列番号120、配列番号121、配列番号122、配列番号123、配列番号124、配列番号125、配列番号126、配列番号127、配列番号128、配列番号129、配列番号130、配列番号131、配列番号132、配列番号133、配列番号134、配列番号135、配列番号136、配列番号137、配列番号138、配列番号139、配列番号140、配列番号141、配列番号142、配列番号143、配列番号144、配列番号145、配列番号146、配列番号147、配列番号148、配列番号149、配列番号150、配列番号151、配列番号152、配列番号192、配列番号193、配列番号194および配列番号195からなる群から選択される少なくとも1つのヌクレオチド配列またはその断片を含むかまたはそれである。
【0158】
本明細書では、本明細書で提供される低反復性ヌクレオチド配列またはユニットもしくはモジュールもしくは構成単位は、構築されたヌクレオチド配列が、本発明による低反復性ヌクレオチド配列を含む限り、互いに任意の組合せで並び替えまたは組み合わせることができることが理解される。例示的な構築されたヌクレオチド配列は、本明細書の下記に提示されており、例えば、配列番号38または本明細書ではPAS#1f/1c/1b(600)として表示されており、配列番号39または本明細書ではPAS#1d/1f/1c/1b(800)として表示されており、配列番号40または本明細書ではPAS#1h/1e/1i(600)として表示されており、配列番号41または本明細書ではPAS#1j/1h/1e/1i(800)として表示されており、本明細書ではPA#1d/1c/1b(600)として表示されている配列番号42、配列番号43または本明細書ではPA#1i/1h/1g/1f(800)として表示されており、配列番号44または本明細書ではPA#1e/1d/1c/1b(800)として表示されており、配列番号45または本明細書ではPA#1i/1h/1g/1f/1e/1d/1c/1b(1600)として表示されており、配列番号153、配列番号154、配列番号155、配列番号156、配列番号157、配列番号158、配列番号159、配列番号160、配列番号161、配列番号162、配列番号163、配列番号164、配列番号165、配列番号166、配列番号167、配列番号168、配列番号169、配列番号170、配列番号171、配列番号172、配列番号173;配列番号174、配列番号175、配列番号176、配列番号177、配列番号178、配列番号179、配列番号180、配列番号181、配列番号182、配列番号184、配列番号185、配列番号186、配列番号187、配列番号188、配列番号189、配列番号190、および/または配列番号191である。
【0159】
したがって、本明細書で提供される核酸分子は、本発明の好ましい態様では、前記構築されたヌクレオチド配列を有するか、含むか、またはそれである。
【0160】
添付の例(実施例1を参照)で実証されているように、本発明による長いヌクレオチド配列は、段階的な様式で構築することができる。構築されたヌクレオチド配列は、低反復性を維持する。添付の例には、配列番号39に示されているか、または本明細書ではPAS#1d/1f/1c/1b(800)として表示されている、2400ヌクレオチドを含み、800個のアミノ酸をコードする例示的なヌクレオチド配列の構築方法が示されている。
【0161】
本明細書では、これら構築されたヌクレオチド配列は、低反復性ヌクレオチド配列であると理解される。例えば、添付の例は、配列番号39に示されているか、または本明細書ではPAS#1d/1f/1c/1b(800)配列として表示されている例示的なヌクレオチド配列は、15の反復ウィンドウの場合、2400ヌクレオチドのヌクレオチド配列全体内に、反復を示さないか、または単一の14ヌクレオチドの反復しか示さないことを実証している。
図2Bを参照されたい。比較のため、従来技術に開示されている長いヌクレオチド配列は、本明細書では配列番号12として示されているPAS#1a(600)の場合、例示的に実証されているように、反復性ヌクレオチド配列を含む。したがって、本発明による長い核酸分子は、低反復性ヌクレオチド配列を有しており、したがって、上記で言及されているような繰り返しヌクレオチド伸長に伴う技術的課題を克服する。
【0162】
核酸分子および関連核酸分子(プロリンおよびアラニンからなるポリペプチドをコードする特定のヌクレオチド配列と少なくとも66%、例えば少なくとも66.6%の同一性を有するバリアント、断片、核酸分子のような;または本明細書で提供および規定されている、プロリン、アラニン、およびセリンからなるポリペプチドをコードする特定のヌクレオチド配列と少なくとも56%、例えば少なくとも56.6%の同一性を有するバリアント、断片、核酸分子等のような)は、in vivo/vitro安定性を増加させるランダムコイルコンフォメーションを形成するポリペプチドをコードする低反復性ヌクレオチド配列を含むかまたはそれらである。
【0163】
核酸分子および関連核酸分子は、ランダムコイルコンフォメーションを形成し、生理活性または薬理活性タンパク質または薬物のin vivo/vitro安定性を増加させるポリペプチドをコードする低反復性ヌクレオチド配列を有するか、含むか、またはそれらである。前記関連核酸分子は、前記核酸分子のバリアントおよび断片を含むかまたはそれらである。前記関連核酸分子は、プロリンおよびアラニンからなるポリペプチドをコードする特定のヌクレオチド配列と、少なくとも66%、例えば少なくとも66.6%の同一性を有するか、または本明細書で提供および規定されている、プロリン、アラニン、およびセリンからなるポリペプチドをコードする特定のヌクレオチド配列と、少なくとも56%、例えば少なくとも56.6%の同一性を有する等である。
【0164】
ある特定の態様では、プロリンおよびアラニンからなるポリペプチドをコードするオルソロガスな/相同性の/同一の/類似の(したがって、関連する)ヌクレオチド配列を含む核酸分子は、特に、配列番号28、29、30、31、32、33、34、35、36、37、42、43、44、45、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、192および193に示されているヌクレオチド配列と、少なくとも66%、例えば少なくとも66.6%相同性/同一である。より好ましくは、プロリンおよびアラニンからなるポリペプチドをコードするオルソロガスな/相同性の/同一の/類似の(したがって、関連する)ヌクレオチド配列を含む核酸分子は、特に、28、29、30、31、32、33、34、35、36、37、42、43、44、45、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、192および193に示されているヌクレオチド配列と、少なくとも68%、70%、75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、または98%相同性/同一であり、より高い値が好ましい。最も好ましくは、プロリンおよびアラニンからなるポリペプチドをコードするオルソロガスな/相同性の/同一の/類似の(したがって、関連する)ヌクレオチド配列を含む核酸分子は、特に、28、29、30、31、32、33、34、35、36、37、42、43、44、45、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、192および193に示されているヌクレオチド配列と、少なくとも99%相同性であり/同一であり/類似している。
【0165】
さらなる態様では、プロリン、アラニン、およびセリンからなるポリペプチドをコードするオルソロガスな/相同性の/同一の/類似の(したがって、関連する)ヌクレオチド配列を含む核酸分子は、特に、配列番号19、20、21、22、23、24、25、26、27、38、39、40、41、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、174、175、176、177、178、179、180、181、182、184、185、186、187、188、189、190、191、194および195に示されているヌクレオチド配列と、少なくとも56%、例えば少なくとも56.6%相同性であり/同一であり/類似している。より好ましくは、プロリン、アラニン、およびセリンからなるポリペプチドをコードするオルソロガスな/相同性の/同一の/類似の(したがって、関連する)ヌクレオチド配列を含む核酸分子は、特に、19、20、21、22、23、24、25、26、27、38 39、40、41、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、174、175、176、177、178、179、180、181、182、184、185、186、187、188、189、190、191、194および195に示されているヌクレオチド配列と、少なくとも58%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、または98%相同性/同一である。最も好ましくは、プロリン、アラニン、およびセリンからなるポリペプチドをコードするオルソロガスな/相同性の/同一の/類似の(したがって、関連する)ヌクレオチド配列を含む核酸分子は、特に、配列番号19、20、21、22、23、24、25、26、27、38、39、40、41、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、174、175、176、177、178、179、180、181、182、184、185、186、187、188、189、190、191、194および195に示されているヌクレオチド配列と、少なくとも99%相同性であり/同一であり/類似している。上記で規定されている関連ヌクレオチド配列も、より長いかまたはより短いアイソフォーム、スプライストバリアント、または融合構築物に包含され得る。
【0166】
ある特定の態様では、本明細書で提供される核酸分子は、特に、配列番号19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、184、185、186、187、188、189、190、191、192、193、194および195に示されているヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズすることができる。用語「ハイブリダイゼーション」または「ハイブリダイズする」は、本明細書で使用される場合、ストリンジェントなまたは非ストリンジェントな条件下でのハイブリダイゼーションに関していてもよい。さらに指定されない場合、条件は、好ましくはストリンジェントである。前記ハイブリダイゼーション条件は、例えば、Sambrook (2001) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 3rd ed., New York;Ausubel (1989) Current Protocols in Molecular Biology, Green Publishing Associates and Wiley Interscience, New York、またはHiggins(1985)Nucleic acid hybridization, a practical approach, IRL Press Oxford, Washington DCに記載されている従来のプロトコールに従って確立することができる。好適な条件の設定は、十分に当業者の技術範囲内にあり、当技術分野に記載されているプロトコールにより決定することができる。したがって、特異的にハイブリダイズする配列のみの検出は、通常、例えば、65℃での0.1×クエン酸ナトリウム生理食塩水緩衝液(SSC)、0.1w/v%SDS、または60℃での2×SSC、0.1w/v%SDS等の、ストリンジェントなハイブリダイゼーションおよび洗浄条件を必要とするだろう。相同性のまたは厳密には相補性ではない配列を検出するための低ストリンジェントなハイブリダイゼーション条件は、例えば、65℃での6×SCC、1w/v%SDSに設定してもよい。周知のように、核酸プローブの長さ、および決定しようとする核酸の組成は、ハイブリダイゼーション条件のさらなるパラメータを構成する。
【0167】
本発明によると、2つまたはそれよりも多くのヌクレオチド配列の状況での、用語「相同性」または「相同性パーセント」または「同一」または「同一性パーセント」または「同一性パーセンテージ」または「配列同一性」は、当技術分野で知られている配列比較アルゴリズムを使用して、または手作業によるアラインメントおよび目視検査により測定し、比較のウィンドウにわたって(好ましくは全長にわたって)または指定領域にわたって、最大限に対応するように比較およびアラインした場合に、同じであるか、または同じであるヌクレオチドの指定パーセンテージ(プロリンおよびアラニンからなるポリペプチドをコードする核酸分子の場合は、好ましくは少なくとも66%、例えば少なくとも66.6%の同一性、より好ましくは少なくとも68%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、もしくは98%の同一性、最も好ましくは少なくとも99%の同一性;またはプロリン、アラニン、およびセリンをコードする核酸分子の場合は、好ましくは少なくとも56%、例えば少なくとも56.6%の同一性、より好ましくは少なくとも58%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、もしくは98%の同一性、最も好ましくは少なくとも99%の同一性)を有する2つまたはそれよりも多くの配列または部分配列を指す。
【0168】
例えば、70%~90%またはそれを超える配列同一性を有する配列は、実質的に同一または類似しているとみなすことができる。そのような定義は、試験核酸配列の相補体にも当てはまる。好ましくは、記載されている同一性は、長さが少なくとも約15~25ヌクレオチドである領域にわたって、より好ましくは長さが少なくとも約50~100ヌクレオチドである領域にわたって、より好ましくは長さが少なくとも約125~200ヌクレオチドである領域にわたって、より好ましくは長さが少なくとも約225~300ヌクレオチドである領域にわたって、さらにより好ましくは長さが少なくとも約325~600ヌクレオチドである領域にわたって、さらにより好ましくは長さが少なくとも約625~800ヌクレオチドである領域にわたって、および最も好ましくは長さが少なくとも約825~1200ヌクレオチドである領域にわたって存在する。当業者であれば、例えば、CLUSTALWコンピュータプログラム(Thompson (1994) Nucl. Acids Res. 2:4673-4680)、CLUSTAL Omega(Sievers (2014) Curr. Protoc. Bioinformatics 48:3.13.1-3.13.16)、またはFASTDB(Brutlag (1990) Comp App Biosci 6: 237-245)に基づくもの等のアルゴリズムを使用して、配列間/配列内の同一性パーセントを決定する方法を知っているだろう。Basic Local Alignment Search Toolの略であるBLASTおよびBLAST 2.0アルゴリズムも、当業者であれば利用可能である(Altschul, (1997) Nucl. Acids Res. 25:3389-3402;Altschul (1990) J. Mol. Biol. 215:403-410)。核酸配列用のBLASTNプログラムは、ワード長(W)11、期待値(E)10、M=5、N=4、および両鎖比較を使用する。BLOSUM62スコアリングマトリックス(Henikoff (1992) Proc. Natl. Acad. Sci. U.S.A. 89:10915-10919)は、アラインメント(B)50、期待値(E)10、M=5、N=4、および両鎖比較を使用する。
【0169】
所与のヌクレオチド配列のヌクレオチド残基が、例えば、それぞれ、配列番号19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、184、185、186、187、188、189、190、191、192、193、194および195のヌクレオチド配列のある位置に対応するか否かを決定するために、当業者であれば、当技術分野で周知の手段および方法、例えばアラインメントを、手作業で、または本明細書で言及されているもの等のコンピュータプログラムを使用することによってのいずれかで使用することができる。例えば、BLAST2.0を使用して、局所的な配列アラインメントを探索することができる。上記で論じられているようなBLASTまたはBLAST2.0は、ヌクレオチド配列のアラインメントを生成して、配列類似性を決定する。アラインメントの局所的性質のため、BLASTまたはBLAST2.0は、完全一致を決定するのに、または類似もしくは同一配列を特定するのに特に有用である。
【0170】
添付の例に示されているように、本明細書では、前記ヌクレオチド配列を含む長い低反復性ヌクレオチド配列または長い低反復性核酸分子を迅速および容易にクローニングするための手段および方法が提供される。例えば、実施例1、2、5、7、および10を参照されたい。添付の例に示されているように、本明細書では、本発明のヌクレオチド配列をより長い構築物へと構築するのに特に好適な例示的なベクターが提供される。上記で言及されているように、本明細書で提供される核酸分子またはヌクレオチド配列は、段階的な様式で構築され、長い核酸分子または長いヌクレオチド配列を組み立てることができる。本明細書では、構築された核酸分子もしくはヌクレオチド配列のサイズは限定されないか、またはプラスミドサイズもしくは形質転換/形質移入効率等の実際的な状況により制限されるに過ぎないことが想定される。
【0171】
プロリン、アラニン、およびセリンの反復性アミノ酸配列をコードする、約2400ヌクレオチドの長さ(800個アミノ酸残基の長さを有するポリペプチドをコードする)の低反復性ヌクレオチド配列または核酸分子を含む核酸分子の例示的な構築は、添付の実施例2に示されている。そこでは、最初に、配列番号19に示されているヌクレオチド配列ユニット(構成単位)PAS#1b(200)、次に、配列番号20に示されているヌクレオチド配列ユニットPAS#1c(200)、その後、配列番号23に示されているヌクレオチド配列ユニットPAS#1f(200)、および最後に、配列番号21に示されているヌクレオチド配列ユニットPAS#1d(200)を、例示的なpXL2ベクターにクローニングおよび構築することが示されている。この例示的な構築された核酸分子または構築されたヌクレオチド配列は、本明細書では、PAS#1d/1f/1c/1b(800)として表示されており、配列番号39に示されている。加えて、本明細書では、これら構築された本発明の核酸分子は、低反復性ヌクレオチド配列を有するかまたは含むことが証明されている。特に、実施例2には、配列番号39に示されているこの例示的な構築されたヌクレオチド配列は、14ヌクレオチドの最大長の反復配列しか有していないことが示されている。
【0172】
本発明は、本発明の核酸分子を提供するための方法にも関する。例えば、より長いヌクレオチド配列を構築するための例示的な手順を示している
図1Eを参照されたい。さらに、本発明は、PAリッチポリペプチドをコードする低反復性核酸分子を構築するための特に好適なベクターに関する。
【0173】
上記によると、本明細書で提供される核酸分子は、プロリンおよびアラニンからなるポリペプチドをコードすることができる。
【0174】
したがって、本明細書で提供される核酸分子は、
(a)配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号87、配列番号88、配列番号89、配列番号90、配列番号91、配列番号92、配列番号93、配列番号94、配列番号95、配列番号96、配列番号97、配列番号98、配列番号99、配列番号100、配列番号101、配列番号102、配列番号103、配列番号104、配列番号105、配列番号106、配列番号107、配列番号108、配列番号109、配列番号110、配列番号111、配列番号112、配列番号113、配列番号114、配列番号115、配列番号116、配列番号117、配列番号118、配列番号119、配列番号120、配列番号121、配列番号122、配列番号192および配列番号193からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(b)配列番号42、配列番号43、配列番号44、配列番号45、配列番号153、配列番号154、配列番号155、配列番号156、配列番号157、配列番号158、配列番号159、配列番号160、配列番号161、配列番号162、配列番号163、配列番号164、配列番号165、配列番号166、配列番号167、配列番号168、配列番号169、配列番号170、配列番号171、配列番号172、および/または配列番号173からなるヌクレオチド配列を含む核酸分子;
(c)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子;
(d)(a)、(b)、および(c)のいずれか1つで規定されるヌクレオチド配列と少なくとも66.7%の同一性を有するヌクレオチド配列を含む核酸分子;ならびに
(e)(a)または(b)で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択することができる。
【0175】
上記によると、本明細書で提供される核酸分子は、プロリン、アラニン、およびセリンからなるポリペプチドをコードすることができる。
【0176】
したがって、本明細書で提供される核酸分子は、
(a)配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号123、配列番号124、配列番号125、配列番号126、配列番号127、配列番号128、配列番号129、配列番号130、配列番号131、配列番号132、配列番号133、配列番号134、配列番号135、配列番号136、配列番号137、配列番号138、配列番号139、配列番号140、配列番号141、配列番号142、配列番号143、配列番号144、配列番号145、配列番号146、配列番号147、配列番号148、配列番号149、配列番号150、配列番号151、配列番号152;配列番号194および配列番号195からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子;
(b)配列番号38、配列番号39、配列番号40、配列番号41、配列番号174、配列番号175、配列番号176、配列番号177、配列番号178、配列番号179、配列番号180、配列番号181、配列番号182、配列番号184、配列番号185、配列番号186、配列番号187、配列番号188、配列番号189、配列番号190、および配列番号191からなる群から選択されるヌクレオチド配列を含む核酸分子;
(c)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子;
(d)(a)、(b)、および(c)のいずれか1つで規定されるヌクレオチド配列と少なくとも56%の同一性を有するヌクレオチド配列を含む核酸分子;ならびに
(e)(a)または(b)で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択することができる。
【0177】
ある特定の態様では、本発明は、本発明の低反復性ヌクレオチド配列を含む核酸分子を調製するための方法であって、
(a)エンドヌクレアーゼ制限酵素により認識される上流認識配列、およびエンドヌクレアーゼ制限酵素により認識される下流認識配列を含むベクターを準備するステップであり、
任意選択で、前記下流認識配列を認識する前記エンドヌクレアーゼ制限酵素が、上流認識配列を認識するエンドヌクレアーゼ制限酵素とは異なり、
前記上流認識配列および前記下流認識配列が、逆相補的に配向されており、
前記上流認識配列が、2つの異なる制限酵素の2つの認識配列を含み、
前記下流認識配列が、上流認識配列に含まれており、ならびに/または
前記上流認識配列および/もしくは前記下流認識配列が、認識配列の外側を切断する制限酵素の認識部位である、ステップ;
(b)前記上流および/または前記下流認識配列を認識する制限酵素で(a)の前記ベクターを切断するステップ;
(c)任意選択で、(b)の前記ベクターを脱リン酸化して、相補性粘着末端のハイブリダイゼーションを防止するステップ;
(d)プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子を準備するステップであり、ヌクレオチド配列の末端が、(b)または(c)のベクターの切断末端にハイブリダイズする、ステップ;ならびに
(e)(d)の前記核酸分子を、DNAリガーゼの存在下で、前記切断されたベクターに挿入するステップを含む方法に関する。
【0178】
本発明のある特定の態様では、本明細書で提供される方法は、より長い核酸分子を調製するために使用することができ、核酸分子は、構築された低反復性ヌクレオチド配列を含み、上述されている、核酸分子を調製するための方法は、
(f)前記上流または前記下流認識配列のいずれかを認識する制限酵素で(e)の前記ベクターを切断するステップ;
(g)任意選択で、(f)の前記ベクターを脱リン酸化して、相補性粘着末端のハイブリダイゼーションを防止するステップ;
(h)プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子を準備するステップであり、ヌクレオチド配列の末端が、(f)または(g)のベクターの切断末端にハイブリダイズする、ステップ;
(i)(h)の前記ヌクレオチド配列を、DNAリガーゼの存在下で、前記切断されたベクターに挿入するステップ;
(j)ヌクレオチド配列の所望の長さに到達するまで、ステップ(f)~(i)を繰り返すステップをさらに含む。
【0179】
当業者であれば、PAリッチポリペプチドをコードする構築されたヌクレオチド配列または構築された核酸分子の所望の長さが得られるまで、この方法のステップを反復して繰り返すことができることを理解する。
【0180】
本明細書で提供される核酸分子を有利にクローニングにするための手段および方法を提供するためには、好適なクローニングベクターは、エンドヌクレアーゼ制限酵素により認識される上流認識配列、およびエンドヌクレアーゼ制限酵素により認識される下流認識配列を含み、任意選択で、前記下流認識配列を認識する前記エンドヌクレアーゼ制限酵素は、前記上流認識配列を認識する前記エンドヌクレアーゼ制限酵素とは異なり、前記上流認識配列および前記下流認識配列は、逆相補的に配向されている。さらに、前記上流認識配列は、2つの異なる制限酵素の2つの認識配列を含んでもよい。さらに、前記下流認識配列は、上流認識配列に含まれていてもよい。したがって、前記下流認識配列は、上流認識配列の1つに含まれていてもよい。添付の実例、特に
図1、4、6、および8は、例示的なベクターおよび核酸分子ならびにそれらを準備するための方法を示している。
【0181】
添付の例では、下流認識配列が上流認識配列に含まれていることが特に有益であることが実証されている。そのような戦略を使用することにより、上流認識部位を使用して、さらなるヌクレオチド配列を、本明細書で提供されるベクターに構築することができる。無論、そのようなベクターの上流および下流制限部位の位置は交換可能である。本発明のヌクレオチド配列が挿入される例示的なクローニング領域は、
図1Dに示されている。この場合、下流認識配列を認識する制限酵素は、上流認識配列も認識および切断する。したがって、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする本発明のヌクレオチド配列または核酸分子を、下流および上流認識配列を認識する制限酵素を使用することにより、本明細書で提供されるベクターから切り出すことができ、したがって、他の核酸またはベクターとのライゲーションに使用して、例えば、遺伝子発現を可能にするか、または融合タンパク質のコード領域を生成することが可能になる。長い低反復性ヌクレオチド配列の構築を達成するための、このクローニング戦略の例は、本明細書の下記に示されている。例えば、
図1Eを参照されたい。
【0182】
ある特定の態様では、第1の突出は、アラニンをコードするヌクレオチドトリプレット/コドンを含んでもよく、それは、特にGCCだが、GCT、GCA、またはGCGであってもよい。好ましい態様では、本発明の核酸分子は、2つの相補的5’-突出を含む、すなわち、一方の5’-突出はコード鎖にあり、他方の5’-突出は非コード鎖にある。特に好ましい実施形態では、コード鎖にある5’-突出はGCCであり、非コード鎖にある5’-突出はGGCである。
【0183】
ある特定のさらなる態様では、第1の突出は、プロリンまたはセリンをコードするヌクレオチドトリプレット/コドン、例えば、CCT、CCC、CCA、CCG、TCT、TCC、TCA、TCG、AGT、またはAGCも含んでもよい。しかしながら、当業者であれば、本明細書で提供される核酸分子を調製するための方法は、突出に限定されず、核酸分子またはヌクレオチド配列は、例えば、平滑末端を介してライゲーションすることができることを知っている。本明細書で使用される場合、用語「突出」は、相補体が結合されていない二本鎖DNA分子の一部としての核酸鎖の末端部分に関し、粘着末端としても知られている。本明細書で使用される場合、用語「平滑末端」は、突出を有していないDNA鎖の末端部分に関する。突出の長さは限定されないことが想定されているが、1~10ヌクレオチドを含む突出が、特に好適であると考えられる。添付の例では、アミノ酸アラニンをコードする3ヌクレオチドの突出を使用した。この種のトリプレット突出は、本発明による核酸分子をアミノ酸翻訳するためのリーディングフレームとそのままで適合するという利点を提供する。
【0184】
特筆すべきことに、突出は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子に、1つの追加のトリプレットを導入する。したがって、本発明のクローニング戦略は、1つの追加のアミノ酸、例えばアラニンを導入する。この追加アミノ酸または対応するトリプレット/コドンは、それぞれ、プロリン、アラニン、および任意選択でセリンからなるポリペプチドまたはコードする核酸の一部とみなすことができる。結果的に、当業者であれば認識するように、例えば300ヌクレオチドを含むヌクレオチド配列に、上述のクローニング戦略を使用する場合、切り出される核酸分子は、3ヌクレオチドの5’-突出も一緒に数えると、303ヌクレオチドを含む。本明細書では、このクローニング手順により、本明細書で使用される突出の長さに応じて、さらに多くのトリプレット/コドン、またはしたがってより多くのアミノ酸残基を導入することができることが想定される。
【0185】
さらに、ベクターにクローニングされると、またはより長い合成DNA断片(例えば、ストリング)の一部として、本明細書で提供される核酸分子またはヌクレオチド配列は、前記上流認識配列および/または前記下流認識配列を含み、前記上流認識配列および/または前記下流認識配列は、認識配列の外側を切断する制限酵素の認識部位である。本明細書で使用される制限酵素、例えばIIS型クラスの制限酵素は、好ましくは、一方の側ではそれらの認識配列の外側を切断し、それにより、非対称的認識配列の適切な配向に応じて、認識部位を含まない切断された核酸分子またはヌクレオチド配列がもたらされる。
【0186】
また、本明細書で提供されるベクターでは、そのような制限酵素による切断により、制限酵素の認識配列が維持される。例示的なベクターpXL2のクローニング部位は、
図1Cに示されている。このベクターから切り出される核酸分子またはヌクレオチド配列は、そのクローニングまたは切り出しに使用された制限酵素の認識部位を欠く。これは、例えば、発現ベクターにクローニングするための、または融合タンパク質のコード領域を生成するための、本明細書に記載されている手順に従って、より長い核酸分子またはより長いヌクレオチド配列を構築するために特に有利である。
【0187】
さらなる実施形態では、例示的なベクターpXL1が提供されており(配列番号55)、
図1Bに示されている。この場合、本発明によるクローニング/挿入された核酸分子またはヌクレオチド配列は、2つのSapI制限部位により隣接されている。したがって、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子は、単一の制限酵素、すなわちSapI(またはEarIも)を用いた消化/切断により、このベクターから簡単に切り出すことができる。これは、その後の発現ベクターへのクローニングおよび/または融合タンパク質のコード領域の生成に特に有利である。
【0188】
添付の例に示されているように、本明細書で提供される核酸分子またはヌクレオチド配列は、ベクターpXL2(配列番号48)に反復的な様式で構築されている;例えば、実施例2を参照されたい。したがって、ベクター内の認識部位の一方または両方を使用して、さらなるヌクレオチド配列をベクターに(存在するインサートの一方の側に)挿入してもよく、または代わりに(構築された)ヌクレオチド配列もしくは核酸分子全体をベクターから切り出してもよい。
【0189】
さらなる利点として、本明細書で提供される本発明の核酸分子を産生するための方法では、本発明による核酸分子内に制限酵素の認識部位が存在しないことにより、(i)本明細書で提供される構築されたより長いヌクレオチド配列が、内部的に、例えば、構築されたヌクレオチド配列のユニット/モジュール間で切断されることが防止され、(ii)構築されたヌクレオチド配列の隣接するユニット/モジュールにあるコードされたアミノ酸配列間、または本発明のヌクレオチド配列および生理活性タンパク質のヌクレオチド配列にあるコードされたアミノ酸配列間での不偏性移行がもたらされる。この戦略は、「トレースレス」または「シームレス」構築またはクローニングと称される場合がある。
【0190】
添付の例では、IIS型の制限酵素を使用することができることが示されている。例えば、実施例1および2を参照されたい。このクラスの制限酵素は、認識部位が切断部位から離れており、それらのいくつか、例えば、SapIおよびEarIは、一方の側では認識配列の外側を切断する。本明細書の下記では、pXL2の前記上流認識配列は、SapIおよびEarIにより認識され、前記下流認識配列は、EarIにより認識されることが示されている。したがって、前記上流認識配列は、ヌクレオチド配列5’-GCTCTTC-3’を有し、前記下流認識配列は、ヌクレオチド配列5’-CTCTTC-3’を有する。当業者であれば、本明細書で規定されている目的または限定を満たす限り、制限酵素は、本明細書では特に限定されないことを知っている。
【0191】
本明細書で使用される場合、用語「エンドヌクレアーゼ制限酵素」は、核酸分子またはヌクレオチド配列、例えばDNA内の、一続きのヌクレオチドを含む特定の認識配列のまたは付近の、あるヌクレオチドを接続しているリン酸ジエステル結合でオリゴ/ポリヌクレオチドをカット/切断/加水分解するエンドヌクレアーゼ酵素に関する。したがって、制限酵素は、ヌクレオチド配列または核酸分子内のリン酸ジエステル結合の加水分解を触媒する。制限酵素は、一般的に、構造の差異、および認識配列で基質をカット/切断するかまたは別の部位で基質をカット/切断するかで、3つのタイプに分類される。二本鎖DNAをカット/切断するために、制限酵素は、通常、2つのリン酸ジエステル結合、DNA二重らせんの各糖-リン酸主鎖(すなわち、各鎖)の1つずつを切断する。
【0192】
本明細書で使用される場合、用語「認識配列」は、制限酵素により認識される、ヌクレオチドの特定の配列、例えば、長さが4~8個の特定の塩基対に関する。
【0193】
本明細書で使用される場合、用語「切断」は、核酸分子および/またはベクターが、制限酵素によりカット/消化/加水分解されることを意味する。上記で言及されているように、制限酵素は、ポリヌクレオチド鎖内のリン酸ジエステル結合を切断する。
【0194】
本明細書で使用される場合、用語「挿入」は、酵素の作用により、核酸分子をベクターにライゲーションすることを指す。それにより、1つのポリヌクレオチドの末端の3’-ヒドロキシル基と、別の5’-ホスホリル基との間にリン酸ジエステル結合が形成されることにより、ポリヌクレオチドの末端が一緒に接合される。プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子またはヌクレオチド配列は、ベクターの切断末端にハイブリダイズすることができる末端を有する。本発明の好ましい態様では、そのような末端は、切断されたベクターのそれぞれの突出にハイブリダイズすることができる突出である。
【0195】
核酸分子をベクターに挿入する場合、ベクターを脱リン酸化して、インサートを有していない再環化ベクターDNAのバックグラウンドが高くなることを回避することが好ましい。脱リン酸化用の例示的な酵素は、子ウシ腸アルカリホスファターゼ(CIPまたはCIAP)またはエビアルカリホスファターゼであってもよく、これらは両方とも、消化されたポリヌクレオチドの5’末端からリン酸基を除去する。
【0196】
本明細書で使用される場合、用語「上流」および「下流」は両方とも、核酸分子またはヌクレオチド配列の相対的位置を指す。核酸分子またはヌクレオチド配列の各鎖は、5’末端および3’末端を有し、それらは、デオキシリボース(またはリボース)糖の炭素原子がそう呼ばれている。一般的に、上流および下流は、RNA転写が生じるコード鎖の5’から3’方向に関する。二本鎖DNAを考慮すると、上流は、検討中の遺伝子またはリーディングフレームのコード鎖の5’末端に向かい、下流は、3’末端に向かう。二本鎖DNAには逆平行の性質があるため、これは、非コード鎖の3’末端が、遺伝子の上流であり、その5’末端が下流であることを意味する。
【0197】
本明細書で使用される場合、用語「核酸分子」または「ヌクレオチド配列」は、DNA分子およびRNA分子等の核酸分子を含むことが意図される。本明細書では、用語「ヌクレオチド配列」は、用語「核酸配列」と等しく、これら用語は、本明細書では同義的に使用することができると理解される。前記核酸分子または前記ヌクレオチド配列は、一本鎖であってもよく、または二本鎖であってもよいが、好ましくは、二本鎖DNAである。当業者であれば、二本鎖DNAは、実際には、大部分が相補的なヌクレオチド配列を有する(粘着末端が存在する場合は、それを除く)2つの異なる核酸分子を含み、それらが非共有結合で会合/ハイブリダイズされて二本鎖が形成されていることを知っている。
【0198】
本発明の一態様では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子は、生理活性または薬理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されている。本発明の好ましい態様では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子は、生理活性または薬理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されている。したがって、核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドならびに生理活性または薬理活性タンパク質を含む異種性薬物コンジュゲートをコードする。本明細書で使用される場合、異種性は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドならびに生理活性または薬理活性タンパク質をコードする核酸分子が、自然界には見出されないことを意味する。
【0199】
本明細書で使用される場合、用語「作動可能に連結される」は、検討中の成分が、両方とも意図されている様式で機能することが可能な関係性にある並置を指す。
【0200】
プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列は、生理活性または薬理活性タンパク質をコードするヌクレオチド配列と、シームレスに、すなわちそれら2つの配列間にリンカーを介在させることなく、コンジュゲートすることができる。あるいは、リンカーまたはスペーサー構造が、ランダムコイルポリペプチドと生理活性または薬理活性タンパク質との間に含まれている。したがって、本発明のある特定の態様では、アミノ酸リンカーをコードするヌクレオチド配列が、プロリン/アラニンリッチポリペプチドをコードするヌクレオチド配列と、生理活性または薬理活性タンパク質をコードするヌクレオチド配列との間に挿入されている。例示的なリンカーは、プロテアーゼ感受性切断部位、セリン/グリシンリンカー、His6-タグまたはStrep-タグII等の親和性タグ、シグナルペプチド、保持ペプチド、膜輸送ペプチドまたは追加のエフェクタードメインのような標的指向性ペプチド、例えば、抗腫瘍トキシンまたはプロドラッグ活性用酵素等と関連する、腫瘍標的化用の抗体断片であってもよい。リンカー/スペーサーを含むポリペプチドは、前記生理活性タンパク質の制御放出を可能にする血漿プロテアーゼ切断部位を有していてもよい。特定のタンパク質の最適な生理活性を得るための異なるタイプまたは長さのリンカー/スペーサーは、過度の負担なく特定することができる。
【0201】
リンカー/スペーサーは、リンカーまたはスペーサー構造を担持する融合タンパク質を受容する対象において免疫応答を引き起こす場合がある。したがって、本発明の好ましい態様では、プロリン/アラニンリッチポリペプチドをコードするヌクレオチド配列は、生理活性または薬理活性タンパク質をコードするヌクレオチド配列とシームレスにコンジュゲートされている。本明細書で使用される場合、「シームレス」は、ランダムコイルポリペプチドをコードするヌクレオチド配列を、生理活性または薬理活性タンパク質をコードするヌクレオチド配列と直接的にコンジュゲートすることを意味する。したがって、プロリン、アラニン、または任意選択でセリン以外のアミノ酸残基をコードする追加のヌクレオチドは導入されない。添付の例に示されているように、シームレスクローニングは、アミノ酸残基アラニンをコードする突出を使用することにより達成された。例えば、実施例7を参照されたい。したがって、本発明は、核酸分子を調製するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンをコードするヌクレオチド配列、ならびに生理活性または薬理活性タンパク質またはペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、生理活性または薬理活性タンパク質をコードする前記ヌクレオチド配列とシームレスにコンジュゲートされる、方法にさらに関する。また、添付の例および本明細書の上記では、シームレスクローニングを使用して、PAリッチポリペプチドをコードするより長いヌクレオチド配列を構築することができることが示されている。したがって、シームレスクローニング法が適用される場合、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするその結果生じたヌクレオチド配列は、本明細書に記載のような低反復性ヌクレオチド配列である。
【0202】
本明細書で使用される場合、用語「生理活性」は、生体、例えば生物に対する物質の生物学的作用を記述する。したがって、用語「生理活性タンパク質」または「生理活性ペプチド」は、本明細書で使用される場合、前記タンパク質またはポリペプチドまたはペプチドに曝露した生細胞/生物において生物学的効果を誘導することが可能なタンパク質またはペプチドに関する。本発明の状況では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子は、生理活性タンパク質をコードする異種性核酸と同じリーディングフレームに作動可能に連結される。
【0203】
本明細書では、コードされた生理活性タンパク質またはペプチドは、「生理活性を有するおよび/または媒介するアミノ酸配列」であるか、または「生理活性を有するアミノ酸配列」であり、ならびに/または薬理活性を有するおよび/もしくは媒介するアミノ酸配列であることが理解される。用語「生理活性タンパク質」、「生理活性を有するおよび/または媒介するアミノ酸配列」、もしくは「生理活性を有するアミノ酸配列」、および/または「薬理活性を有するおよび/または媒介するアミノ酸配列」には、in vivoまたはin vitroいずれかでの半減期の延長が有益である任意の目的のタンパク質またはペプチド(ならびに、抗体断片、膜受容体の細胞外または細胞内ドメインを含む断片、成長因子またはサイトカインの短縮形態等の、それらの機能性断片)も含まれる。当業者であれば、プロリン、アラニン、および任意選択でセリンからなるポリペプチドのランダムコイルコンフォメーションは、生理活性/薬理活性(「機能性」)タンパク質またはペプチドに、in vivoおよび/またはin vitro安定性の増加、特に血漿内半減期の増加を媒介することを知っている。
【0204】
本発明の一実施形態では、本発明による、生理活性を有するおよび/または媒介するコードされたアミノ酸配列は、任意の「目的タンパク質」、すなわち薬学的もしくは生物学的目的の任意のタンパク質、または治療上有効なタンパク質として有用な任意のタンパク質から推定することができる。したがって、前記生理活性タンパク質またはペプチドは、薬理学的に活性な、または治療上有効なタンパク質またはペプチドであってもよい。薬理学的に活性であるかまたは治療上有効なタンパク質またはペプチドは、所望の薬理学的、薬学的、および/または生理学的効果を有する任意のタンパク質またはペプチドである。効果は、(i)疾患/医学的状態/障害またはそれらの症状を完全にまたは部分的に予防および/または緩和する点で予防的であってもよく、ならびに/あるいは(ii)疾患/医学的状態/障害を部分的にもしくは完全に阻害する、すなわちその進行を停止させる点で、または疾患/医学的状態/障害を軽減する、すなわち疾患/医学的状態/障害の退縮を引き起こす点で、治療的であってもよい。最も好ましくは、前記生理活性タンパク質は、例えばワクチンとして使用するための治療上有効なタンパク質である。したがって、前記生理活性タンパク質は、ワクチン接種にも使用することができる。
【0205】
さらに、前記生理活性タンパク質は、診断関連タンパク質であってもよい。本明細書で使用される場合、「診断関連タンパク質」は、診断に使用されるタンパク質またはポリペプチドに関する。本発明の状況では、診断は、対象の疾患、例えば、がんおよび腫瘍、または臨床症状の認識および(早期)検出に関する。診断は、鑑別診断も含んでもよい。疾患または臨床状態の重症度の評価も、ある特定の実施形態では、用語「診断」に包含される場合がある。特に、本発明の核酸分子によりコードされるポリペプチドおよび/または薬物コンジュゲートは、in vitroまたはin vivo診断に使用することができる。例えば、コードされたポリペプチドおよび/または薬物コンジュゲートは、医用画像法に使用することができる。コードされたPAリッチポリペプチドおよび/または薬物コンジュゲートは、腫瘍細胞内への取り込みが向上しているため、これらの方法に特に好適である。さらに、コードされたPAリッチポリペプチドおよび/または薬物コンジュゲートは、腫瘍細胞と血液または健常細胞/組織との間で高いコントラストを示す。
【0206】
コードされた生理活性タンパク質は、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、またはペプチドもしくはペプチド模倣体からなる群から選択される。本明細書で使用される場合、「ペプチド」は、好ましくは、最大50個のアミノ酸残基を含む/からなり、「タンパク質」は、好ましくは、50個またはそれよりも多くのアミノ酸残基を含む/からなる。
【0207】
本明細書で使用される場合、用語「結合タンパク質」は、(a)潜在的結合パートナーを、前記潜在的結合パートナーとは異なる複数の分子と区別することができるように、潜在的結合パートナーとしての複数の異なる分子の貯留から、前記潜在的結合パートナーのみが結合するか、または著しく結合する程度に、潜在的結合パートナーと特異的に相互作用することができる分子に関する。結合タンパク質と潜在的結合パートナーとの間の結合活性を測定するための方法は、当技術分野で公知であり、例えば、酵素結合免疫吸着測定法(ELISA)、等温滴定熱量測定法(ITC)、平衡透析法、プルダウンアッセイ法、マイクロスケール熱泳動法、蛍光滴定法、または例えばBiacore機器を使用する表面プラズモン共鳴(SPR)分光法を使用することにより、日常的に実施することができる。
【0208】
本発明の状況で有用な例示的な結合タンパク質/結合分子として、これらに限定されないが、抗体;Fab断片、Fab’断片、F(ab’)2断片、単鎖可変断片(scFv)(単一)ドメイン抗体等の抗体断片、特にラクダ、ラマ、またはサメに由来するもの;抗体の単離された可変領域(VLおよび/またはVH領域)、特にヒトまたは霊長類に由来するもの;CDR;免疫グロブリンドメイン;CDR由来ペプチド模倣体;レクチン;フィブロネクチンドメイン;テネイシンドメイン;プロテインAドメイン;SH3ドメイン;アンキリン反復ドメイン;およびリポカリン;または例えばSkerra (2000) J. Mol. Recognit. 13:167-187、Gebauer (2009) Curr. Opin. Chem. Biol. 13:245-255、またはBinz (2005) Nat. Biotechnol. 23:1257-1268に記載されている種々のタイプのスキャフォールド由来結合タンパク質が挙げられる。
【0209】
本発明の状況で有用な、他の例示的なコードされた生理活性、薬理活性タンパク質または治療上有効な目的タンパク質としては、これらに限定されないが、インターロイキン受容体アンタゴニスト、EBI-005またはアナキンラのようなインターロイキン-1受容体アンタゴニスト、レプチン、アセチルコリンエステラーゼ、活性化プロテインC(ドロトレコギン)、アクチビン受容体IIBアンタゴニスト、アデノシンデアミナーゼ、アガルシダーゼアルファ、エントリモド(entolimod)のようなトール様受容体5のアゴニスト、アルファ-1アンチトリプシン、アルファ-1プロティナーゼ阻害剤、アルファ-ガラクトシダーゼ、アルファ-ヒト心房性ナトリウム利尿ペプチド、アルファ-N-アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、ANF-Rho、アンギオテンシン(1~7)、アンギオテンシンII、アンギオテンシン転換酵素2、抗上皮細胞接着分子単鎖抗体断片、抗トロンビンアルファ、抗トロンビンIII、アポトーシス誘導性酵素mi-APO、アルギニンデイミナーゼ、カラスパルガーゼ(calaspargase)、ペグアスパルガーゼ、クリサンタスパーゼのようなアスパラギナーゼ、ベロクトコグ(beroctocog)アルファまたはオクトファクター(octofactor)のようなBドメイン欠損第VIII因子、ベクツモマブ(bectumomab)(Lymphoscan)、ブセリパーゼ(bucelipase)アルファのような胆汁酸塩刺激性リパーゼ、パブリズマブ(pavlizumab)のようなRSウイルスに対する結合タンパク質、BMP-2(ジボテルミンアルファ)またはBMP-6のような骨形態形成タンパク質、ブーガニン、ウシカルボキシヘモグロビン、ウシ成長ホルモン、C1-エステラーゼ阻害剤、C3細胞外酵素タンパク質、カルボキシヘモグロビン、CD19アンタゴニスト、リツキサンのようなCD20アンタゴニスト、CD3受容体アンタゴニスト、CD40アンタゴニスト、ダピロリズマブ(dapirolizumab)またはAntovaのようなCD40Lアンタゴニスト、セレブロシドスルファターゼ、VGX-210のようなセトリン、コンドロイチンリアーゼ、コナコグ(conacog)ガンマ、コナコグベータ、アルブトレペノナコグアルファのような凝固第IX因子、エプタコグアルファ、マルゼプタコグアルファ(marzeptacog alfa)、バトレプタコグアルファ、オレプタコグアルファ(oreptacog alfa)のような凝固第VIIa因子、スソクトコグアルファ(susoctocog alfa)、ダモクトコグアルファ、ツロクトコグアルファ、ルリオクトコグアルファ、エフモロクトコグアルファ、エフラロクトコグアルファ、シモクトコグアルファ(simoctocog alfa)のような凝固第VIII因子、凝固第X因子、カトリデカコグのような凝固第XIII因子、クロストリジウム・ヒストリチクム(clostridium histolyticum)のコラゲナーゼ、補体因子C3阻害剤、補体受容体5aアンタゴニスト、副腎皮質刺激ホルモン放出因子、FPA008のようなCSF1受容体アンタゴニスト、CSF1Rアンタゴニスト、イピリムマブのようなCTLA-4アンタゴニスト、シアノビリン-N、ドルナーゼアルファのようなデオキシリボヌクレアーゼI、EGFR受容体アンタゴニスト、ボナパニターゼのようなヒトI型膵臓エラスターゼのようなエラスターゼ、エンドスタチン、エンカスチム(enkastim)、上皮成長因子、エリスロポエチンアルファ、エリスロポエチンゼータ、FcγIIB受容体アンタゴニスト、フィブリノゲナーゼ、ブリナーゼのような線維素溶解酵素、線維芽細胞成長因子1(ヒト酸性線維芽細胞成長因子)、線維芽細胞成長因子18、線維芽細胞成長因子2(ヒト塩基性線維芽細胞成長因子)、線維芽細胞成長因子21、FPA144のような線維芽細胞成長因子受容体2アンタゴニスト、Fms様チロシンキナーゼ3リガンド、フォリトロピンアルファまたはフォリトロピンベータのような卵胞刺激ホルモン、ヒト殺菌性/透過性増強タンパク質21(オペバカン/rBPI21)の断片、ゲロニン、グルカゴン受容体アゴニスト、アブシキシマブのような糖タンパク質IIb/IIIaアンタゴニスト、コンドリアーゼのようなグリコサミノグリカン分解酵素、gp120/gp160、顆粒球コロニー刺激因子(G-CSF)、顆粒球マクロファージコロニー刺激因子(GM-CSF)、転写因子E7(ベルパセプカルテスペン(verpasep caltespen))と融合されているミコバクテリウムBCGに由来する熱ショックタンパク質hsp65、肝細胞成長因子、肝細胞成長因子受容体(HGFR)アンタゴニスト、ヘプシジンアンタゴニスト、ハーセプチンのようなHer2/neu受容体アンタゴニスト、ヘテロ二量体15:IL-15Ra(hetIL-15)、ヒルジン、hsp70アンタゴニスト、ヒト酸性スフィンゴミエリナーゼ、コリオゴナドトロピンアルファのようなヒト絨毛性ゴナドトロピン、レベグルコシダーゼアルファ(reveglucosidase alfa)またはアルグルコシダーゼアルファのようなヒト酵素酸性α-グルコシダーゼ、ヒト成長ホルモン、ヒトケラチノサイト成長因子(KGF)、ヒトマトリックスメタロプロテイナーゼ、ヒトミエリン塩基性タンパク質断片、ヒト骨形成タンパク質1、ヒト骨形成タンパク質-1、ヒト副甲状腺ホルモン、ヒトトロンボモジュリンアルファ、rHuPH20のようなヒアルロニダーゼ、ヒトヒアルロニダーゼPH-20(ボルヒアルロニダーゼアルファ(vorhyaluronidase alfa))、ヒアロシダーゼ、またはボブヒアルロニダーゼ(bovhyaluronidase)のようなヒアルロニダーゼ、グルコセレブロシダーゼ、ベラグルセラーゼアルファ、またはタリグルセラーゼアルファのような加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート-2-スルファターゼ、オマリズマブのようなIgEアンタゴニスト、イロコイ(iIroquois)ホメオボックスタンパク質2(IRX-2)、インスリン、インスリン類似体、インテグリンα4β1アンタゴニスト、インターフェロンタウ、インターフェロン-アルファ、インターフェロン-アルファアンタゴニスト、インターフェロン-アルファスーパーアゴニスト、インターフェロン-アルファ-n3(Alferon N注射剤)、インターフェロン-ベータ、インターフェロン-ガンマ、インターフェロン-ラムダ、DAB(389)IL-2のようなインターロイキン2融合タンパク質、オプレレブキン(oprelevkin)のようなインターロイキン-11、インターロイキン-12、インターロイキン-17受容体アンタゴニスト、インターロイキン-18結合タンパク質、インターロイキン-2、インターロイキン-22、ピトラキンラのようなインターロイキン-4、インターロイキン-4ムテイン、インターロイキン-6受容体アンタゴニスト、インターロイキン-7、インターロイキン-22受容体サブユニットアルファ(IL-22ra)アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、カリジノゲナーゼ、ラクトフェリン、ラクトフェリン断片、ラノテプラーゼ、ブルルリパーゼ(burlulipase)、リゾリパーゼ(rizolipase)、エパフィパーゼ(epafipase)、またはセベリパーゼアルファのようなリパーゼ酵素、黄体形成ホルモン、ルトロピンアルファ、リンパ球膨張分子(lymphocyte expansion molecule)、リソスタフィン、哺乳動物胃リパーゼ酵素(メリスペース(merispace))、ベルマナーゼアルファ(velmanase alfa)のようなマンノシダーゼ、メラノコルチン-4受容体アゴニスト、MEPE由来23アミノ酸ペプチド、メチオニルヒト幹細胞因子(アンセスチム)、マイクロプラスミン、エロスルファーゼアルファのようなN-アセチルガラクトサミン-6-スルファターゼ、N-アセチルグルコサミニダーゼ、ナサルプラーゼベータ、神経成長因子、ニューレグリン-1、神経毒(例えば、クロストリジウム・ボツリヌム(Clostridium botulinum)神経毒(クロストリジウム・ボツリヌム(Clostridium botulinum)神経毒セロタイプA、B、C、D、E、F、またはG、特にクロストリジウム・ボツリヌム(Clostridium botulinum)神経毒セロタイプA等)のようなクロストリジウム神経毒)、好中球ゼラチナーゼ関連リポカリン、オクリプラスミン、オルニトドロス・モウバタ(Ornithodoros moubata)補体阻害剤(OmCI/Coversin)、オステオプロテゲリン、P128(StaphTAME)、パミテプラーゼ、パラトルモン(PTH)、PD-1アンタゴニスト、PDGFアンタゴニスト、ペントラキシン-2タンパク質、HY133のようなファージリシン、バリアーゼ(valiase)のようなフェニルアラニンアンモニアリアーゼ、組織非特異性アルカリホスファターゼまたはアスホターゼアルファのようなホスファターゼ、プラスミノーゲン、V10153のようなプラスミノーゲンバリアント、血小板由来成長因子-BB、ブタ成長ホルモン、プロヒビチン標的指向性ペプチド1、プロインスリン、プロテインA、ドロトレコグニン(drotrecognin)のようなプロテインC、FP-1039のようなタンパク結合線維芽細胞成長因子受容体リガンド、組換え組織因子経路阻害剤(チファコギン)、リラキシン、セレラキシンのようなリラキシン類似体、レテプラーゼ、rhPDGF-BB、オンコナーゼまたはアンフィナーゼのようなリボヌクレアーゼ、センレボターゼ、コネスタットアルファのようなセリンプロテアーゼ阻害剤、スフェリカーゼ、シアリダーゼ、可溶性補体受容体1型、可溶性DCC(結腸直腸がんにおいて欠失)受容体、可溶性TACI受容体(アタシセプト)、可溶性腫瘍壊死因子I受容体(sTNF-RI)、可溶性腫瘍壊死因子II受容体(sTNF-RII)、可溶性VEGF受容体Flt-1、可溶性ヒトFcγIIB受容体、スタフィロキナーゼ、ストレプトキナーゼ、スルファミダーゼ、T細胞受容体リガンド、テネクテプラーゼ、血小板新生刺激タンパク質(AMG-531)、トロンボポエチン、トロンボスポンジン-1、甲状腺ホルモン、タルチレリンのような甲状腺刺激ホルモン放出ホルモン(TRH)類似体、組織プラスミノーゲン活性化因子、パミテプラーゼのような組織型プラスミノーゲン活性化因子、トリペプチジルペプチダーゼI、腫瘍壊死因子(TNFアルファ)、腫瘍壊死因子αアンタゴニスト、ラスブリカーゼまたはペガドリカーゼ(pegadricase)のようなウリカーゼ、ウロジラチン、ウロフォリトロピン、ウロキナーゼ、ウテログロビン、ランビズマブ(ranbizumab)またはベバシズマブのようなVEGFアンタゴニスト、VEGF/PDGFアンタゴニスト、マルチVEGF/PDGF DARPinまたは融合タンパク質のようなVEGF/PDGFアンタゴニスト、ビスキュミン、ボニコグアルファ(vonicog alfa)のようなフォンビルブラント因子が挙げられる。本明細書では、インターロイキン受容体アンタゴニスト、特に、EBI-005またはアナキンラのようなインターロイキン-1受容体アンタゴニスト、およびレプチン、特にヒトレプチンまたは突然変異体ヒトレプチン(huLeptin(W100Q)、成熟ポリペプチド鎖の100位に、トリプトファンからグルタミンへの置換を有するヒトレプチン突然変異体)が好ましい。ヒトレプチンのアミノ酸配列は、例えば、UniProtKB受託コードP41159に開示されている。突然変異体huLeptin(W100Q)は、Murphy (ed.) Misbehaving proteins: protein (mis)folding, aggregation, and stability, Springer, 1st edition, New YorkのRicci(2006) Mutational approach to improve physical stability of protein therapeutics susceptible to aggregationにより記載されている。
【0210】
例示的ペプチドおよびペプチド模倣体としては、これらに限定されないが、副腎皮質刺激ホルモン(ACTH)、アファメラノチド、アラレリン、アルファ4インテグリン阻害剤、抗HIV融合阻害剤(エンフルビチド(enfurvitide)、V2o、SC34EK、SC35EK、IQN17、またはIZN17のような)、アンギオテンシンII2型(AT2)受容体アゴニスト(LT2のような)、抗イディオタイプp53ペプチド、アミリン、アミリン類似体、アストレシン、アトシバン、抗がんおよび抗HIV活性を有する細菌ペプチド断片(ATP-01のような)、二環式ペプチド(TG-758のような)、ビバリルジン、ブラジキニンアンタゴニスト(イカチバントのような)、ブレメラノチド、B型ナトリウム利尿ペプチド、カルシトニン、カルベトシン、カルフィルゾミブ、クリサリン(chrysalin)、シレンギチド、C型ナトリウム利尿ペプチド、コロストリニン(colostrinin)、副腎皮質刺激ホルモン放出因子(Xerecept、コイスントロピン(coysnthropin)のような)、CNGRCG腫瘍ホーミングペプチド、ω-コノトキシンペプチド(ジコノチドのような)、C-ペプチド、ダネガプチド(danegaptide)、ディフェンシン、エカランチド、エルカトニン、エレドイシン、エキセンディン-4、エキセンディン-4類似体(エキセンディン9~39のような)、エズリンペプチド1、ヒトマトリックス細胞外リン糖タンパク質由来断片(AC-100のような)、ガラニン、胃抑制ポリペプチド(GIP)、GIP類似体、グラチラマー、グルカゴン、グルカゴン類似体、グルカゴン様ペプチド1(GLP-1)、GLP-1類似体(リキシセナチド、リラグルチド、またはセミグルチド(semiglutide)のような)、グルカゴン様ペプチド2(GLP-2)、GLP-2類似体(テデュグルチドのような)、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト(ゴセレリン、ブセレリン、トリプトレリン、ロイプロリド、プロチレリン、レシレリン、フェルチレリン、またはデシオレリン(desiorelin)のような)、ゴナドトロピン放出ホルモンアンタゴニスト(アバレリクス、セトロレリクス、デガレリクス、ガニレリクス、またはテベレリクスのような)、グレリン、グレリン類似体(AZP-531のような)、成長ホルモン放出ホルモン、成長ホルモン放出ホルモン類似体(セルモレリンまたはテサモレリンのような)、ヘマタイド、ヘプシジン模倣体ペプチド、ヒストレリン、インドリシジン、インドリシジン類似体(オミガナンのような)、IgE下方調節ペプチド(SC-01のような)、INGAPペプチド(エキスリン(exsulin))、インスリン様成長因子1、インスリン様成長因子2、Kv1.3イオンチャネルアンタゴニスト(cgtxA、cgtxE、またはcgtxFのような)、ランレオチド、レクチン結合ペプチド(sv6B、sv6D、svC2、svH1C、svH1D、またはsvL4のような)、ランチペプチド、ララゾチド、リナクロチド、ルスプルチド(lusupultide)、メラノコルチン-4受容体アゴニスト(AZD2820のような)、MEPE由来23アミノ酸ペプチド、ミトコンドリア由来ペプチド(MOTS-c、ヒューマニン、SHLP-6、またはSHLP-2のような)、インスリン様成長因子結合タンパク質-2の突然変異体(I-HBD1のような)、Navイオンチャネルモジュレーター(GTx1-15またはVSTx3のような)、オクトレオチド、プロタンパク質転換酵素サブチリシン/ケキシン9型(PCSK9)阻害性ペプチド、アズリンのペプチド断片、フィロマー(Phylomer)、MHCクラスII関連インバリアントペプチド(CLIP)のペプチドアンタゴニスト(VG1177のような)、熱ショックタンパク質に由来するペプチド(エンカスチム(enkastim)のような)、ペキシガナン、プロバマー(plovamer)、プラムリンチド、プロヒビチン標的指向性ペプチド1、プロ膵島ペプチド、ペプチドチロシンチロシン(PYY3-36)、RGDペプチドまたはペプチド模倣体、ラモプラニン、セクレチン、シナプルチド(sinapultide)、ソマトスタチン、ソマトスタチン類似体(パシレオチドまたはCAP-232のような)、特異的標的化抗菌ペプチド(STAMP)(C16G2のような)、骨形態形成タンパク質の受容体アゴニスト(THR-184またはTHR-575のような)、ストレスコピン(stresscopin)、サーファクシン(surfaxin)、Tc99mアプシチド、テリパラチド(PTH1-34)、テトラコサクチド、チモシンアルファ1、TLR2阻害性ペプチド、TLR3阻害性ペプチド、TLR4阻害性ペプチド、チモシンB4、チモシンB15、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体(例えばデスモプレシン、フェリプレシン、またはテルリプレシン)が挙げられる。
【0211】
ワクチン接種の状況で有用な例示的な目的の生理活性タンパク質としては、これらに限定されないが、AE37ペプチド、ボンベシン-ガストリン放出ペプチド、がん胎児性抗原(CEA)、E型肝炎ウイルスのカプシドタンパク質オープンリーディングフレーム2(ORF2)タンパク質、コレラ毒素B、黄色ブドウ球菌(staphylococcus aureus)のクランピング因子A、ジフテリア毒素、ジフテリア毒素突然変異体(CRM197のような)、大腸菌(E. coli)熱不安定性エンテロトキシン、シュードモナス・エルギノーサ(pseudomonas aeruginosa)の菌体外毒素A、麻疹ウイルスのFタンパク質、日本脳炎(JE)ウイルスの糖タンパク質E、GPC3由来ペプチド、A型肝炎ポリタンパク質、HER2由来ペプチドGP2、ヘレグリン、Her2neuペプチド、B型肝炎ウイルス表面抗原(HbSAg)、ヒトグルタミン酸デカルボキシラーゼタンパク質アイソフォーム65kDa(rhGAD65)、インフルエンザ赤血球凝集素抗原(HA)、インフルエンザノイラミニダーゼ(NA)、ヒトパピローマウイルスのL1タンパク質、li-Key/HER2/neuハイブリッドペプチド、ボレリア・ブルグドルフェリ(borrelia burgdorferi)の細胞表層リポタンパク質(OspA)、ロタウイルスの主要外側カプシドタンパク質、ムチン-1(MUC-1)ペプチド、ノーウォークウイルス(rNVP)カプシドタンパク質、パルボウイルスB19 VLP、顆粒球マクロファージコロニー刺激因子由来ペプチド、ブタサーコウイルス2カプシド(PCV2 ORF2)タンパク質、ダニ媒介性脳炎ウイルスのCタンパク質、ダニ媒介性脳炎ウイルスのEタンパク質、黄熱病ウイルスのEタンパク質、風疹ウイルスのE-1タンパク質、ラブドウイルス科(rhabdoviridae)のGタンパク質、麻疹ウイルスのHタンパク質、パラミクソウイルス科(paramyxoviridae)のHタンパク質、黄熱病ウイルスのNSタンパク質、パラミクソウイルス科(paramyxoviridae)のNタンパク質、ブタコレラウイルスの前立腺特異抗原E2タンパク質、ロタウイルスのVP6タンパク質、ロタウイルスのVP7タンパク質、SARSウイルス由来スパイクタンパク質(D3252)、ポリオウイルスのVP1タンパク質、ポリオウイルスのVP4タンパク質、Ras腫瘍性タンパク質、精子由来ペプチド(YLP12、P10G、A9D、mFA-12-19、SP56、および/またはmFA-1117-136のような)、破傷風毒素、ツベルクリン、腫瘍関連ペプチド(TUMAP)(IMA901、IMA910、またはIMA950のような)が挙げられる。
【0212】
一態様では、本発明は、本明細書で開示されている核酸分子、例えば、プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、前記核酸のヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有する、核酸分子に関するか、または
本発明は、一態様では、生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、本明細書で開示されている核酸分子、例えば、プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、前記核酸のヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、核酸分子が、生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されており、
前記ヌクレオチド配列が、
【0213】
【0214】
【0215】
【0216】
一態様では、本発明は、本明細書で開示されている核酸分子、例えば、プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、前記核酸のヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有する、核酸分子に関するか、または
本発明は、一態様では、生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、本明細書で開示されている核酸分子、例えば、プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、前記核酸のヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、核酸分子が、生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されており、
前記ヌクレオチド配列が、
【0217】
【0218】
【0219】
一態様では、本発明は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列からなる核酸分子であって、
前記核酸のヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、
前記ヌクレオチド配列が、50,000未満のヌクレオチド反復スコア(NRS)を有し、
前記ヌクレオチド反復スコア(NRS)が、数式:
【0220】
【数10】
により決定され、式中、
N
totは、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記異なる配列の数であり、そうでなければ、前記長さnの反復のk(n)は1である、核酸分子に関する。
【0221】
さらに、本発明は、本発明の核酸分子またはヌクレオチド配列を含むベクターにも関する。また、ベクターは、(i)アラニン、プロリン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列、ならびに(ii)生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子を提供するために使用することができる。例えば、
図4および実施例7を参照されたい。
【0222】
そのようなベクターは、コードされたランダムコイルポリペプチドおよび生理活性タンパク質を含む融合タンパク質を発現するために、発現ベクターとして使用することができる。したがって、コードされた融合タンパク質は、(ii)生理活性タンパク質とカップリングされた、(i)低反復性ヌクレオチド配列によりコードされているランダムコイルポリペプチドを包含する。好ましくは、ランダムコイルポリペプチドは、アラニン、プロリン、および任意選択でセリンからなる。例示的なベクターは、配列番号56に示されている。添付の例には、そのようなベクターまたは核酸分子を提供するための例示的な方法が示されている。例えば、
図6および実施例7を参照されたい。
【0223】
本発明の方法では、本明細書で提供されるベクターは、生理活性タンパク質をコードするヌクレオチド配列を含み、第2のステップにて、PAリッチポリペプチドをコードするヌクレオチド配列がベクターに導入される。生理活性タンパク質をコードするヌクレオチド配列を含むベクターに、プロリン/アラニンリッチ配列をコードするヌクレオチド配列を導入するためには、例えば、アラニン、プロリン、および/または任意選択でセリンをコードする少なくとも1つのヌクレオチドトリプレット/コドンを含む突出を使用することができる。上記を参照されたい。したがって、そのようなトリプレットまたはコドンは、プロリン/アラニンリッチ配列の一部とみなされるアミノ酸、特にアラニンをコードすることができる。
【0224】
結果的に、本明細書で提供される方法およびベクターは、従来の制限部位を使用することにより導入される場合がある追加のアミノ酸リンカーの導入を回避する。したがって、本明細書で提供される手段および方法は、(i)アラニン、プロリン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列、および(ii)生理活性タンパク質をコードするヌクレオチド配列を含む本発明の核酸分子のシームレスクローニングを可能にする。
【0225】
多くの好適なベクターが、分子生物学分野の当業者に知られている。プラスミド、コスミド、ウイルス、バクテリオファージ、および遺伝子工学で従来使用される他のベクターを含む好適なベクターの選択は、所望の機能に依存する。
【0226】
好ましくは、ベクターは、プラスミドであり、より好ましくは、一般的な大腸菌(E. coli)発現ベクターpASK37、pASK75、またはpXL2に基づくプラスミドである。
【0227】
当業者に周知である方法を使用して、種々のプラスミドを構築することができる。例えば、Sambrook(2001) loc. cit.およびAusubel(1989) loc. cit.に記載されている技法を参照されたい。典型的なプラスミドベクターとしては、例えば、pQE-12、pUC系列のプラスミド、pBluescript(Stratagene)、pET系列の発現ベクター(Novagen)またはpCRTOPO(Invitrogen)、lambda gt11、pJOE、pBBR1-MCS系列、pJB861、pBSMuL、pBC2、pUCPKS、pTACT1が挙げられる。哺乳動物細胞での発現に適合する典型的なベクターとしては、E-027 pCAG Kosak-Cherry(L45a)ベクター系、pREP(Invitrogen)、pCEP4(Invitrogen)、pMC1neo(Stratagene)、pXT1(Stratagene)、pSG5(Stratagene)、EBO-pSV2neo、pBPV-1、pdBPVMMTneo、pRSVgpt、pRSVneo、pSV2-dhfr、pIZD35、Okayama-Berg cDNA発現ベクターpcDV1(Pharmacia)、pRc/CMV、pcDNA1、pcDNA3(Invitrogen)、pcDNA3.1、pSPORT1(GIBCO BRL)、pGEMHE(Promega)、pLXIN、pSIR(Clontech)、pIRES-EGFP(Clontech)、pEAK-10(Edge Biosystems)pTriEx-Hygro(Novagen)、およびpCINeo(Promega)が挙げられる。ピキア・パストリス(Pichia pastoris)に好適なプラスミドベクターの非限定的な例は、例えば、プラスミドpAO815、pPIC9K、およびpPIC3.5K(全てInvitrogen)を含む。
【0228】
一般的に、ベクターは、クローニングまたは発現用の1つまたは複数の複製開始点(ori)および遺伝系、宿主での選択用の1つまたは複数のマーカー、例えば、抗生物質耐性、ならびに1つまたは複数の発現カセットを含んでもよい。好適な複製開始点の例としては、例えば、全長ColE1、pUCプラスミドに存在するもの等のその短縮型、SV40ウイルスおよびM13ファージ複製開始点が挙げられる。選択可能なマーカーの非限定的な例としては、アンピシリン、クロラムフェニコール、テトラサイクリン、カナマイシン、dhfr、gpt、ネオマイシン、ヒグロマイシン、ブラストサイジン、またはジェネテシンが挙げられる。
【0229】
さらに、前記ベクターは、本明細書で規定されている前記ヌクレオチド配列または核酸分子に作動可能に連結された調節配列を含む。
【0230】
コード配列、例えば、ベクターに含まれる、PAリッチポリペプチドをコードする前記ヌクレオチド配列は、確立されている方法を使用して、(a)転写調節エレメントおよび/または他のアミノ酸コード配列に連結することができる。そのような調節配列は当業者に周知であり、限定ではないが、転写の開始を保証する調節配列、内部リボソーム進入部位(IRES)、ならびに任意選択で、転写の終結および転写物の安定化を保証する調節エレメントが挙げられる。転写の開始を保証するそのような調節配列の非限定的な例は、プロモーター、翻訳開始コドン、エンハンサー、インスレーター、および/または転写終結を保証する調節エレメントを含む。さらに、例としては、RNAスプライシングの供与および受容部位により隣接されているコザック配列および介在配列、分泌シグナルをコードする核酸配列、または、使用される発現系に応じて、発現されたタンパク質を細胞区画または培養培地へと方向付けることが可能なシグナル配列が挙げられる。
【0231】
好適なプロモーターの例としては、限定ではないが、サイトメガロウイルス(CMV)プロモーター、SV40プロモーター、RSV(ラウス肉腫ウイルス)プロモーター、lacZプロモーター、ニワトリβ-アクチンプロモーター、CAGプロモーター(ニワトリβ-アクチンプロモーターおよびサイトメガロウイルス最初期エンハンサーの組合せ)、ヒト伸長因子1αプロモーター、AOX1プロモーター、GAL1プロモーター、CaM-キナーゼプロモーター、lac、trp、またはtacプロモーター、lacUV5プロモーター、T7またはT5プロモーター、オートグラファ・カリフォルニカ(Autographa californica)多核多角体病ウイルス(AcMNPV)多角体プロモーター、または哺乳動物および他の動物細胞のグロビンイントロンが挙げられる。エンハンサーの一例は、例えばSV40エンハンサーである。転写終結を保証する調節エレメント/配列の非限定的な追加の例としては、SV40ポリA部位、tkポリA部位、またはAcMNPV多角体ポリアデニル化シグナルが挙げられる。
【0232】
さらに、発現系に応じて、ポリペプチドを細胞区画へと方向付けることが可能であるか、またはそれを培地内に分泌させることが可能であるリーダー配列を、本明細書で提供される核酸分子のコード配列に追加してもよい。リーダー配列は、翻訳、開始、および終結配列とインフレームで構築されており、好ましくは、リーダー配列は、翻訳されたタンパク質またはその部分の分泌を、細胞周辺腔へとまたは細胞外培地へと方向付けることが可能である。好適なリーダー配列は、例えば、大腸菌(E. coli)では、BAP(細菌アルカリホスファターゼ)、CTB(コレラ毒素サブユニットB)、DsbA、ENX、OmpA、PhoA、stII、OmpT、PelB、Tat(ツインアルギニン透過系)のシグナル配列、ならびに真核細胞では、ウシ成長ホルモン、ヒトキモトリプシノーゲン、ヒト第VIII因子、ヒトig-カッパ、ヒトインスリン、ヒトインターロイキン-2、メトリダ(Metrida)またはバルグラ(Vargula)に由来するルシフェラーゼ、ヒトトリプシノーゲン-2、クリベロマイセス・マルキシアヌス(Kluyveromyces marxianus)に由来するイヌリナーゼ、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)に由来する交尾因子アルファ-1、メリチン、およびヒトアズロシジン等のシグナル配列である。
【0233】
また、ベクターは、タンパク質の正しい折り畳みを促進するための1つまたは複数のシャペロンをコードする追加の発現可能な核酸配列を含んでもよい。
【0234】
好ましくは、本発明のベクターは、発現ベクターである。本発明による発現ベクターは、本発明の核酸分子、例えば、プロリン/アラニンリッチポリペプチドをコードするヌクレオチド配列および生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子の複製および発現を方向付けることが可能である。添付の例では、(i)プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列、ならびに(ii)IL-1Ra等の生理活性タンパク質を含む発現ベクターを構築した。実施例6を参照されたい。プロリンおよびアラニンからなるポリペプチドをコードする核酸分子を含む例示的な発現ベクターは、実施例10に示されている。
【0235】
好適な細菌発現宿主は、例えば、大腸菌(Escherichia coli)に由来する菌株JM83、W3110、KS272、TG1、BL21(BL21(DE3)、BL21(DE3)PlysS、BL21(DE3)RIL、BL21(DE3)PRARE等)、Origami(K-12)、Origami B、またはRosettaを含む。ベクター修飾、PCR増幅、およびライゲーション技法については、Sambrook(2001) loc. cit. に記載されている方法を参照されたい。
【0236】
加えて、バキュロウイルス系も、真核生物発現系で本発明の核酸分子を発現するためのベクターとして使用することができる。これらの態様では、pFBDMベクターを、発現ベクターとして使用することができる。MultiBacバキュロウイルスDNAへの挿入は、DH10 MultiBac大腸菌(E. coli)細胞の形質転換時に、Tn7転位配列により媒介される(Berger (2013) J. Vis. Exp. 77:50159, Fitzgerald (2006) Nat. Methods. 2006 3:1021-1032.)。ウイルス増幅および発現は、Sf21(スポドプテラ・フルギペルダ(Spodoptera frugiperda))またはHigh Five(イラクサギンウワバ(Trichoplusia ni))細胞で実施することができる。
【0237】
本明細書の上記に記載されている本発明の核酸分子および/またはベクターは、例えば、非化学的な方法(エレクトロポレーション、ソノポレーション、光学形質移入、遺伝子電気泳動転写、流体力学的送達、または細胞を本発明の核酸分子と接触させる際に自然に生じる形質転換)、化学薬品に基づく方法(リン酸カルシウム、DMSO、PEG、リポソーム、DEAE-デキストラン、ポリエチレンイミン、ヌクレオフェクション等)、粒子に基づく方法(遺伝子ガン、マグネトフェクション、インパルフェクション(impalefection))、ファージまたはファージミドベクターに基づく方法およびウイルス方法により細胞内に導入するために設計することができる。例えば、核酸分子を標的細胞集団に送達するために、レトロウイルス、ワクシニアウイルス、アデノ随伴ウイルス、ヘルペスウイルス、セムリキ森林ウイルス、またはウシパピローマウイルス等のウイルスに由来する発現ベクターを使用することができる
【0238】
好ましくは、本発明の核酸分子および/またはベクターは、エレクトロポレーションによるエレクトロコンピテント大腸菌(E. coli)の形質転換用に、またはリン酸カルシウム、ポリエチレンイミン、もしくはリポフェクタミン形質移入によるCHO細胞の安定形質移入用に設計されている(Pham (2006) Mol. Biotechnol. 34:225-237;Geisse(2012) Methods Mol. Biol. 899:203-219;Hacker (2013) Protein Expr. Purif. 92:67-76)。
【0239】
本発明は、本発明のベクターまたは核酸分子で形質転換された宿主細胞または非ヒト宿主にも関する。本発明によると、用語「本発明のベクターで形質転換された宿主細胞または非ヒト宿主」は、本発明のベクターまたは核酸分子を含む宿主細胞または非ヒト宿主に関することが理解されるだろう。ポリペプチドを発現するための宿主細胞は、当技術分野で周知であり、原核細胞ならびに真核細胞を含む。したがって、宿主は、細菌、哺乳動物細胞、藻細胞、繊毛虫、酵母、および植物細胞からなる群から選択することができる。
【0240】
典型的な細菌としては、エシェリキア属(Escherichia)、コリネバクテリウム属(Corynebacterium)(グルタミカム(glutamicum))、シュードモナス属(Pseudomonas)(フルオレッセンス(fluorescens))、ラクトバチルス属(Lactobacillus)、ストレプトミセス属(Streptomyces)、サルモネラ属(Salmonella)、バチルス属(Bacillus)(バチルス・メガテリウム(Bacillus megaterium)またはバチルス・スブチリス(Bacillus subtilis)等)、またはコリネバクテリウム属(Corynebacterium)(コリネバクテリウム・グルタミカム(Corynebacterium glutamicum)のような)が挙げられる。本明細書では、最も好ましい細菌宿主は、大腸菌(E. coli)である。本明細書で使用される例示的な繊毛虫は、テトラヒメナ属(Tetrahymena)、例えばテトラヒメナ・サーモフィラ(Tetrahymena thermophila)である。
【0241】
典型的な哺乳動物細胞としては、Hela、HEK293、HEK293T、H9、Per.C6、およびジャーカット細胞、マウスNIH3T3、NS0、およびC127細胞、COS1、COS7、およびCV1、ウズラQC1-3細胞、マウスL細胞、マウス肉腫細胞、Bowesメラノーマ細胞、ならびにチャイニーズハムスター卵巣(CHO)細胞が挙げられる。本発明による最も好ましい哺乳動物宿主細胞は、CHO細胞である。本明細書で使用される例示的な宿主は、モンゴルキヌゲネズミ属(Cricetulus)、例えばモンゴルキヌゲネズミ(Cricetulus griseus)(チャイニーズハムスター)である。ヒト胚腎臓(HEK)細胞も好ましい。
【0242】
他の好適な真核宿主細胞は、例えば、ピキア・パストリス(Pichia pastoris)、クリベロマイセス・ラクティス(Kluyveromyces lactis)、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)、およびシゾサッカロミセス・ポンベ(Schizosaccharomyces pombe)等の酵母、または例えばDT40細胞等のニワトリ細胞である。発現に好適な昆虫細胞は、例えば、ショウジョウバエ(Drosophila)S2、ショウジョウバエ(Drosophila)Kc、スポドプテラ(Spodoptera)Sf9およびSf21、またはトリコプルシア(Trichoplusia)Hi5細胞である。好ましい藻細胞は、コナミドリムシ(Chlamydomonas reinhardtii)またはシネココッカス・エロンガツス(Synechococcus elongatus)細胞等である。例示的な植物は、ニセツリガネゴケ属(Physcomitrella)、例えばヒメツリガネゴケ(Physcomitrella patens)である。例示的な植物細胞は、ニセツリガネゴケ属(Physcomitrella)植物細胞、例えばヒメツリガネゴケ(Physcomitrella patens)植物細胞である。
【0243】
初代哺乳動物細胞または細胞株も、本発明の範囲内にある。初代細胞とは、生物から直接得られる細胞である。好適な初代細胞は、例えば、マウス胚線維芽細胞(MEF)、マウス初代肝細胞、心筋細胞、およびニューロン細胞、ならびにマウス筋肉幹細胞(衛星細胞)、ヒト皮膚および肺線維芽細胞、ヒト上皮細胞(鼻、気管、腎、胎盤、腸、気管支の上皮細胞)、ヒト分泌細胞(唾液腺、皮脂腺、および汗腺からの)、ヒト内分泌細胞(甲状腺細胞)、ヒト脂肪細胞、ヒト平滑筋細胞、ヒト骨格筋細胞、B細胞、T細胞、NK細胞、または樹状細胞等のヒト白血球、およびそれらに由来する安定不死化細胞株(例えば、hTERTまたはオンコジーン不死化細胞)である。上述の宿主細胞の適切な培養培地および条件は、当技術分野で公知である。
【0244】
宿主細胞を使用して、例えば、本明細書で提供される核酸分子、本明細書で提供されるコードされたポリペプチド、および/または本明細書で提供される前記薬物コンジュゲートを大量に産生することができる。したがって、宿主細胞を使用して、本明細書で提供される核酸分子、PAリッチポリペプチドをコードするヌクレオチド配列を含む核酸分子によりコードされるポリペプチド、ならびに/またはPAリッチポリペプチドおよび生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子によりコードされるポリペプチドを大量に産生することができる。
【0245】
したがって、本発明は、本明細書で提供される核酸分子またはベクターを調製するための方法であって、本発明の宿主または宿主細胞を好適な条件下で培養すること、ならびに任意選択で、産生された核酸分子および/またはベクターを単離することを含む方法にも関する。
【0246】
さらに、本発明は、本明細書で提供される核酸分子またはヌクレオチド配列によりコードされるポリペプチドを調製するための方法であって、本発明の宿主または宿主細胞を好適な条件下で培養すること、および任意選択で、産生されたポリペプチドを単離することを含む方法に関する。
【0247】
さらに、本発明は、薬物コンジュゲートを調製するための方法であって、本発明の宿主細胞を好適な条件下で培養すること、および任意選択で、産生された前記薬物コンジュゲートを単離することを含む方法に関する。好ましくは、本発明は、薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、プロリン、アラニン、および任意選択でセリンからなるポリペプチドならびに生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子によりコードされている、方法に関する。
【0248】
したがって、本発明は、一態様では、薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、本明細書で規定されている核酸分子によりコードされたポリペプチドを含み、(i)生理活性タンパク質および/または(ii)低分子および/または(iii)炭水化物をさらに含み、方法が、本明細書で提供される宿主または宿主細胞を培養すること、ならびに任意選択で、産生されたポリペプチドおよび/または薬物コンジュゲートを単離することをさらに含む方法に関する。例えば、薬物コンジュゲートが、本明細書で規定されている核酸分子によりコードされたポリペプチドを含み、生理活性タンパク質をさらに含む融合タンパク質である場合、本方法は、本明細書で提供される宿主または宿主細胞(すなわち、本明細書で提供される、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸、ならびに本明細書で規定されている生理活性タンパク質、特に治療的活性タンパク質をコードする核酸を含む宿主または宿主細胞)を培養すること、および任意選択で、産生された融合タンパク質(薬物コンジュゲート)を単離することをさらに含んでもよい。無論、薬物コンジュゲートがタンパク質である場合、本方法は、本明細書で提供される宿主または宿主細胞(すなわち、本明細書で提供される、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸を含む宿主または宿主細胞)を培養すること、および/または本明細書で規定されている生理活性タンパク質、特に治療的活性タンパク質をコードする核酸を含む宿主もしくは宿主細胞を培養すること、ならびに任意選択で、プロリン、アラニン、および任意選択でセリンからなる産生されたポリペプチドを単離すること、ならびに/または産生された生理活性タンパク質を単離すること、ならびにさらに任意選択で、ポリペプチドおよび生理活性タンパク質をコンジュゲートして(例えば、化学的カップリングにより)、薬物コンジュゲート産生することも含んでもよい。
【0249】
例えば、薬物コンジュゲートが、本明細書で規定される核酸分子によりコードされたポリペプチド(すなわち、本明細書で提供される、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸)の、ならびに低分子のおよび/または炭水化物のコンジュゲートである場合、本方法は、本明細書で提供される宿主または宿主細胞(すなわち、本明細書で提供されるプロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸を含む宿主または宿主細胞)を培養すること、ならびに任意選択で、産生されたポリペプチドを単離すること、ならびにさらに任意選択で、ポリペプチドを、低分子および/または炭水化物とコンジュゲートすること(例えば、化学的カップリングにより)をさらに含んでもよい。
【0250】
「宿主または宿主細胞を培養する」ことは、この状況では、宿主または宿主細胞中で、本明細書で規定されているポリペプチドおよび/または生理活性タンパク質を発現させることを含む。
【0251】
添付の例には、(i)プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列、ならびに(ii)IL-1Ra等の生理活性タンパク質を含むそのような核酸分子を、細菌で発現させ、その後精製することができることが示されている。実施例8および
図7を参照されたい。さらに、本明細書には、本明細書で提供される核酸分子によりコードされた、プロリンおよびアラニンからなるポリペプチドを発現させ、精製することができることが示されている。例えば、実施例11および
図8を参照されたい。プロリン、アラニン、および任意選択でセリンからなるコードされたポリペプチドを、低分子薬物、炭水化物、および/または生理活性タンパク質とコンジュゲートすることにより、低分子/低分子薬物および/または生理活性タンパク質の血漿内半減期および/または溶解度を増加させ、非特異的毒性を減少させることができ、標的細胞または構造に対する活性薬物の体内での曝露を延長させることにより、薬物動力学の増強をもたらすことができる。
【0252】
本発明の宿主に存在するベクターは、発現ベクター、またはタンパク質の発現が保証されるような様式で、宿主細胞のゲノムへの本発明の核酸分子の安定した組み込みを媒介するベクターのいずれかである。タンパク質の発現が保証されるように本発明の核酸分子を導入することに成功した宿主細胞を選択するための手段および方法は、当技術分野で周知であり、記載されている(Browne (2007) Trends Biotechnol. 25:425-432;Matasci (2008) Drug Discov. Today: Technol. 5:e37-e42;Wurm (2004) Nat. Biotechnol. 22:1393-1398)。
【0253】
原核または真核宿主細胞の培養に好適な条件は、当業者に周知である。例えば、例えば大腸菌(E. coli)等の細菌は、ルリアベルターニ(LB)培地中で通気しながら、典型的には4から約37℃までの温度で培養することができる。発現産物の収量および溶解度を増加させるために、培地を緩衝化してもよく、またはこれらを両方とも増強または促進することが知られている好適な添加剤で補完してもよい。誘導可能なプロモーターが、宿主細胞に存在するベクター内の本発明の核酸分子を制御する場合、ポリペプチドの発現は、例えば、添付の例で使用されているようなイソプロピル-β-D-チオガラクトピラノシド(IPTG)またはアンヒドロテトラサイクリン(aTc)等の適切な誘導剤を添加することにより誘導することができる。好適な発現プロトコールおよび戦略は、当技術分野に、例えば、Sambrook (2001) loc. cit.、(Gebauer (2012) Meth. Enzymol. 503:157-188)に記載されており、必要に応じて、特定の宿主細胞の必要性および発現させようとするタンパク質の必要条件に適合させることができる。
【0254】
細胞タイプおよびその特定の必要条件に応じて、哺乳動物細胞培養は、例えば、10%(v/v)FCS、2mM L-グルタミン、および100U/mlペニシリン/ストレプトマイシンを含む、RPMI、Williams’E、またはDMEM培地で実施することができる。DT40ニワトリ細胞の場合、細胞は、例えば、37℃または41℃にて、5%CO2の水飽和大気中で維持することができる。昆虫細胞培養用の好適な培地は、例えば、TNM+10%FCS、SF900、またはHyClone SFX昆虫培地である。昆虫細胞は、通常、接着または懸濁培養として27℃で増殖させる。真核生物または脊椎動物細胞の好適な発現プロトコールは、当業者に周知であり、例えば、Sambrook (2001) (loc. cit)に見出すことができる。
【0255】
好ましくは、本発明の核酸分子、ベクター、ポリペプチド、および/または薬物コンジュゲートを調製するための方法は、例えば大腸菌(E. coli)細胞等の細菌細胞、または例えばCHO細胞等の哺乳動物細胞のいずれかを使用して実施される。より好ましくは、本方法は、大腸菌(E. coli)細胞またはCHO細胞を使用して実施され、最も好ましくは、本方法は、大腸菌(E. coli)細胞を使用して実施される。
【0256】
産生されたコードされたポリペプチドを単離するための方法は、限定ではないが、親和性クロマトグラフィー(好ましくは、StrepタグIIまたはHis6タグ等の融合タグを使用して)、ゲル濾過(サイズ排除クロマトグラフィー)、陰イオン交換クロマトグラフィー、陽イオン交換クロマトグラフィー、疎水性相互作用クロマトグラフィー、高圧液体クロマトグラフィー(HPLC)、逆相HPLC、硫安沈殿、または免疫沈降等の精製ステップを含む。これら方法は、当技術分野で周知であり、例えば、Sambrook (2001) loc. cit.に一般的に記載されており、添付の例にも記載されている。例えば、実施例8および11を参照されたい。そのような方法は、実質的に純粋なポリペプチドを提供する。前記純粋なポリペプチドは、好ましくは少なくとも約90~95%(タンパク質レベルで)、より好ましくは少なくとも約98~99%の均質性を有する。最も好ましくは、これらの純粋なポリペプチドは、薬学的使用/応用に好適である。また、本明細書では、食品または化粧品産業での応用が想定される。産生手順で使用される宿主細胞/生物に応じて、本発明のコードされたポリペプチドは、グリコシル化されていてもよく、またはグリコシル化されていなくともよい。好ましくは、本発明の核酸分子によりコードされた、プロリン、アラニン、および任意選択でセリンからなるポリペプチドは、グリコシル化されていない。最も好ましくは、本発明の核酸分子によりコードされた、プロリン、アラニン、および任意選択でセリンからなるポリペプチドは、例えばプロリンヒドロキシル化等により、その側鎖が翻訳後修飾されていない。
【0257】
コードされたランダムコイルポリペプチドは、アラニン、プロリン、および任意選択でセリン残基から主になり、O-グリコシル化またはN-グリコシル化に必要なセリン、トレオニン、またはアスパラギンは、好ましくは存在しない。したがって、ポリペプチド自体の、またはコードされたランダムコイルポリペプチドを含む生理活性タンパク質の産生は、好ましくは、Pro/Ala/SerまたはPro/Ala配列内に翻訳後修飾を欠如する単分散性産物をもたらすことができる。これは、複雑なタンパク質の生合成に選択されることが多い、チャイニーズハムスター卵巣細胞(CHO)、HEK細胞、または酵母のような、真核細胞で組換えタンパク質を産生する利点である。
【0258】
本発明は、薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、本明細書で提供される本発明の核酸分子によりコードされたポリペプチドを含み、(i)生理活性タンパク質および/または(ii)低分子および/または(iii)炭水化物をさらに含む、方法にも関する。そのような炭水化物コンジュゲートは、ワクチンとして特に有用であり得る。
【0259】
上述のように、PAリッチポリペプチドおよび生理活性タンパク質を含む薬物コンジュゲートは、PAリッチポリペプチドをコードするヌクレオチド配列および生理活性タンパク質をコードする核酸配列を含む核酸分子を発現させることより調製することができる。発現された薬物コンジュゲートは単離してもよい。あるいは、薬物コンジュゲートは、プロリン、アラニン、および任意選択でセリンからなる前記ポリペプチドをコードするヌクレオチド配列または核酸分子を含む宿主を培養/成長させることにより調製することができる。したがって、核酸分子は、宿主中で発現される。任意選択で、前記産生されたポリペプチドを単離する。プロリン、アラニン、および任意選択でセリンからなる産生されたポリペプチドを、例えばペプチド結合または非ペプチド結合により、生理活性タンパク質にコンジュゲートすることができる。
【0260】
実例には、本明細書で提供される核酸分子によりコードされたPAリッチポリペプチドは、細菌で発現させることができ、それらから精製することができることが示されている。例えば、実施例11および
図8を参照されたい。特に、驚くべきことに、調製されたポリペプチドの開始メチオニン(N末端メチオニン)は、切断されており、したがって、産生されたポリペプチドには欠如していることが示された。例えば、実施例12および
図8Dを参照されたい。調製されたポリペプチドに開始メチオニンが欠如することにより、生理活性タンパク質、低分子、および/または炭水化物のN末端を、次のアミノ酸(開始メチオニンの後)の一級アミノ基にシームレスにコンジュゲートすることが可能になる。したがって、本発明の核酸分子およびそれらの調製されたポリペプチドは、例えば、生理活性タンパク質とのコンジュゲーションに特に有利である。
【0261】
特に、生理活性タンパク質は、例えば、N-(3-ジメチルアミノプロピル)-N’-エチルカルボジイミド(EDC)またはN-ヒドロキシサクシニミド(NHS)エステル等の活性化剤の存在下で(Hermanson (1996) Bioconjugate Techniques, 1st edition, Academic Press, San Diego, CA)、産生されたランダムコイルポリペプチドのN末端と、部位特異的にコンジュゲートしてもよい。あるいは、生理活性タンパク質は、例えば、EDC等の活性化剤の存在下で、または活性化後のNHSエステルとして、プロリン、アラニン、および任意選択でセリンからなる産生されたランダムコイルポリペプチドのC末端と、部位特異的にコンジュゲートしてもよい。
【0262】
さらに、プロリン、アラニン、および任意選択でセリンからなる産生されたポリペプチドは、非ペプチド結合を介して、低分子および/または炭水化物にコンジュゲートすることができる。タンパク質の架橋に有用な非ペプチド結合は、当技術分野で公知であり、例えば2つのCys側鎖および/またはチオール基間のジスルフィド結合、チオエーテル結合、ならびにカルボキシル基とアミノ基とのアミド結合を含み得る。非ペプチド共有結合は、スベリン酸ジサクシンイミジル(DSS)、N-β-マレイミドプロピル-オキシスクシンイミドエステル(BMPS)、またはスルホサクシニミジル4-[p-マレイミドフェニル]ブチレート(スルホ-SMPB)等の化学的架橋剤、金属キレート/錯体形成基、ならびに非共有結合性のタンパク質-タンパク質またはタンパク質-ペプチド相互作用により提供することもできる。
【0263】
さらに、低分子薬物を、ランダムコイルを形成するポリペプチドと、部位特異的にコンジュゲートすることができる。任意選択で、ポリペプチドのN末端は、好適な保護基、例えばアセチル基またはピログルタミル基で修飾することができ、例えば、一般的な試薬EDCおよびNHSを使用して、C末端カルボキシレート基を活性化した後で(Hermanson (1996) loc. cit.)、ランダムコイルポリペプチドのC末端と薬物との部位特異的カップリングを達成することができる。このようにして、均一な薬物コンジュゲートを容易に得ることができる。
【0264】
単一の部位特異的コンジュゲーションの代わりに、プロリン、アラニン、および任意選択でセリンからなるランダムコイルポリペプチドは、ε-アミノ基を有するリジン残基、チオール基を有するシステイン残基、またはさらに非天然アミノ酸等の化学的修飾に好適な追加の側鎖を、N-もしくはC-末端にまたは内部に備え、例えばNHSまたはマレイミド活性基を使用して、1つ、2つ、または複数の低分子のコンジュゲーションを可能にしてもよい。
【0265】
安定コンジュゲーションとは別に、プロドラッグが、ランダムコイルポリペプチドと一時的に連結されていてもよい。連結は、予測可能な様式で、酵素機序、または例えば難溶性抗腫瘍剤カンプトテシンをPEGポリマーにコンジュゲートした場合と同様の生理学的pHで開始される遅延加水分解のいずれかにより、in vivoで切断されるように設計することができ、したがって、生体内分布の増加、毒性の減少、効力の増強、および腫瘍蓄積を達成することができる(Conover (1998) Cancer Chemother. Pharmacol. 42:407-414)。さらなるプロドラッグの例は、ドセタキセル(Liu (2008) J. Pharm. Sci. 97:3274-3290)、ドキソルビシン(Veronese (2005) Bioconjugate Chem. 16: 775-784)、またはパクリタキセル(Greenwald (2001) J. Control Release 74:159-171)のような化学療法剤である。
【0266】
本明細書では、低分子を、融合タンパク質、例えば、標的指向性ドメイン、例えば抗体断片と遺伝子的に融合されている、プロリン、アラニン、任意選択でセリンからなり、ランダムコイルを形成するポリペプチドとカップリングさせ、したがって、低分子薬物の特異的送達をもたらすことができることも想定されている。細胞毒性低分子とのコンジュゲーションにより後者の場合に生成される免疫毒素は、標的指向性ドメインが、例えば内部移行を起こす細胞表面受容体に向けられている場合、特に有用である。
【0267】
本明細書で使用される場合、用語「薬物」は、低分子、生理活性タンパク質、ペプチド、または炭水化物を指す。本明細書で使用される場合、用語「低分子」は、(有機)低分子量(<900ダルトン)化合物を指す場合がある。低分子は、生物学的プロセスの調節を支援することができ、通常、ナノメートル程度のサイズを有する。本明細書では、低分子は、治療法、診断法で使用されるか、または食品もしくは化粧品産業で使用されることが想定されている。例えば、本明細書で提供されるヌクレオチド配列または核酸分子によりコードされる産生されたポリペプチドとの薬物コンジュゲートは、(a)血管新生阻害剤、抗アレルギー薬、制吐薬、抗うつ薬、抗高血圧薬、抗炎症薬、抗感染症薬、抗精神病薬、抗増殖(細胞毒性および細胞増殖抑制)薬、カルシウムアンタゴニストおよび他の循環器薬、コリン作動性アゴニスト、中枢神経系に作用する薬物、呼吸器系に作用する薬物、ステロイド、アンチセンス核酸、低分子干渉RNA(siRNA)、マイクロRNA(miR)阻害剤、マイクロRNA模倣体、DNAアプタマー、およびRNAアプタマーからなる群から選択される低分子を含んでもよい。
【0268】
例示的な血管新生阻害剤としては、これらに限定されないが、MetAP2阻害剤(フマギリン、フマギリン誘導体、2-{3-[3,5-ビス[4-ニトロベンジリデン]-4-オキソピペリジン-1-イル]-3-オキソプロピルスルファニル}エタンスルホン酸のような)、VGFR阻害剤(アキシチニブ、ブリバニブ、カボザンチニブ、チボザニブ、およびモテサニブのような)、胎盤成長因子(PIGF)阻害剤、および血小板由来成長因子受容体阻害剤(AC710、ソラフェニブ、スニチニブ、およびバタラニブのような)等が挙げられる。
【0269】
例示的な抗アレルギー薬としては、これらに限定されないが、抗ヒスタミン剤(ジフェンヒドラミン(ベナドリル)、ジメンヒドリナート(ドラマミン、ドリミナート(driminate))、塩酸ヒドロキシジン(レストール(restall)、ビスタコート(vistacot))、およびプロメタジン(フェネルガン)のような)等が挙げられる。
【0270】
例示的な抗うつ薬としては、これらに限定されないが、グラニセトロンおよびパロノセトロン等が挙げられる。
【0271】
例示的な抗うつ薬としては、これらに限定されないが、cis-フルペンチキソール、塩酸イミプラミン、およびミアンセリン等が挙げられる。
【0272】
例示的な抗高血圧薬としては、これらに限定されないが、アルプロスタジル、ジアゾキシド、およびニカルジビン等が挙げられる。
【0273】
例示的な抗炎症薬としては、これらに限定されないが、コルチゾン、ヒアルロン酸、およびケトロラク等が挙げられる。
【0274】
例示的な抗感染症薬としては、これらに限定されないが、アミノグリコシド、アマドビル(amadovir)、アモキシシリン、アンピシリン、ベンジルペニシリン、カルバペネム、セファロスポリン、セフチオフル、クロラムフェニコール、セフェピム、セフタジジム、セフトビプロール、クリンダマイシン、ドラクシン、ダルババンシン、ダプトマイシン、ジヒドロストレプトマイシン、エリスロマイシン、フロルフェニコール、フルオロキノロン、フルニキシンメグルミン、リネゾリド、マルボフロキサシン、ミカファンギン、ニトロフラゾン、オリタバンシン、オキシテトラサイクリン、ペニシリン、ピペラシリン、プロカイン(procain)、ルピントリビル(rupintrivir)、スピラマイシン、ストレプトグラミン、スルファジメトキシン(sulfadimethoxin)、スルファメタジン、テジゾリド、テラバンシン、チカルシリン、チルミコシン、チゲサイクリン、チルジピロシン、チロシン、およびバンコマイシン等が挙げられる。
【0275】
例示的な抗精神病薬としては、これらに限定されないが、アミスルプリド(amisulprid)、アリプラゾール(ariprazole)、ベンペリドール、ブロムペリドール、クロルプロマジン(clorpromazin)、クロルプロチキセン(chlorprothixen)、クロペンチキソール、クロザピン、フルペンチキソール、フルフェナジン(fluphenazin)、フルスピリレン(fluspirilen)、ハロペリドール、レボメプロマジン(levomepromazin)、メルペロン(melperon)、オランザピン、ペラジン(perazin)、ペルフェナジン(perphenazin)、ピモジド(pimozid)、ピパンペロン(pipamperon)、プロマジン(promazin)、プロメタジン、プロチペンジル、クエチアピン、リスペリド(risperido)、スルピリド(sulpirid)、チオリダジン(thioridazin)、トリフルオペラジン(trifluoperazin)、トリフルプロマジン(triflupromazin)、およびズクロペンチキソール等が挙げられる。
【0276】
例示的な抗腫瘍薬としては、これらに限定されないが、アントラサイクリン(ドキソルビシン、エピルビシン、イダルビシン、およびダウノルビシンのような)、アルキル化剤(カリチアマイシン、ダクチノマイシン、ミトロマイシン(mitromycine)、およびピロロベンゾジアゼピンのような)、AKT阻害剤(AT7867のような)、アマトキシン(ax-アマニチン、P-アマニチン、y-アマニチン、c-アマニチン、アマヌリン、アマヌリン酸、アマニンアミド、アマニン、およびプロアマヌリン、SN-38、ならびにカンプトテシンのような)、ATM阻害剤、オーリスタチン(オーリスタチンEB(AEB)、オーリスタチンEFP(AEFP)、モノメチルオーリスタチンE(MMAE)、モノメチルオーリスタチンF(MMAF)、オーリスタチンF、およびドラスタチンのような)、クリプトフィシン、サイクリン依存性キナーゼ阻害剤(BMS-387032、PD0332991、GSK429286、AZD7762;AZD1152、MLN8054、およびMLN8237;BI2536、B16727、GSK461364、ON-01910、SB743921、SB715992、MK-0731、AZD8477、AZ3146、およびARRY-520のような)、デュオカルマイシン、DNA-PK阻害剤、エポチロン(エポチロンA、B、C、D、E、またはF、および誘導体のような)、GSK-3阻害剤、HDAC阻害剤(ベリノスタット、CUDC-101、ドロキシノスタット、ITF2357、JNJ-26481585、LAQ824、およびパノビノスタットMC1568、モセチノスタット、エンチノスタット、PCI-24781、ピロキサミド、トリコスタチンA、およびボリノスタットのような)、hsp70阻害剤、hsp90阻害剤(17AAG誘導体、B11B021、B11B028、SNX-5422、NVP-AUY-922、KW-2478、およびゲルダナマイシンのような)、MAPKシグナル伝達経路阻害剤(MEK、Racs、JNK、B-Rafのような)、マイタンシノイド、マイタンシノイド類似体(マイタンシノール、マイタンシノール類似体、マイタンシン、DM-1、およびDM-4のような)、p38MAPK阻害剤(GDC-0973、GSK1 120212、MSC1936369B、AS703026、R05126766、およびR04987655、PD0325901、AZD6244、AZD8330、GDC-0973、CDC-0879、PLX-4032、SB590885、BIRB796、LY2228820、SB202190、AEE788、BIBW2992、アファチニブ、ラパチニブ、エルロチニブ、およびゲフィチニブのような)、PARP阻害剤(イニパリブ、オラパリブ、ベリパリブ、AG014699、CEP9722、MK4827、KU-0059436、LT-673、3アミノベンズアミド、A-966492、およびAZD2461のような)、PDK-1阻害剤、白金化合物(シスプラチン、カルボプラチン、オキサリプラチン、イプロプラチン、オルマプラチン、またはテトラプラチンのような)、タキサン(taxan)(パクリタキセルおよび/またはドセタキセルのような)、チューブリシン(チューブリシンA、チューブリシンB、およびチューブリシン誘導体のような)、ビンカアルカロイド(ビンブラスチン、ビンデシン、およびナベルビンのような)、およびWnt/ヘッジホッグシグナル伝達経路阻害剤(例えばビスモデギブ、GDC-0449、シクロパミン、およびXAV-939)等が挙げられる。
【0277】
中枢神経系に作用する例示的な薬物としては、これらに限定されないが、ブプレノルフィン(buprenorphin)、クリオスタチン(cryostatin)、ナルトロキスレキソン(naltroxrexone)、およびナロキソン等が挙げられる。
【0278】
例示的なビタミンとしては、これらに限定されないが、ビタミンB-12(シアノコバラミン)およびビタミンA等が挙げられる。
【0279】
例示的なステロイドとしては、これらに限定されないが、アンドロゲン性ステロイド(steriod)(フルオキシメステロン、メチルテストステロン、テストステロン、トレンボロンのような)、エストロゲン(ベータ-エストラジオール、ジエチルスチルベストロール、エストロン、エストリオール、エキリン、エストロピペート、エキリン、メストラノールのような)、およびプロゲステロン化合物(19-ノルプロゲステロン、アルファプロストール、クロルマジノン、デメゲストン、ジドロゲステロン、ジメチステロン、エチステロン、二酢酸エチノジオール、ノルエチンドロン、酢酸ノルエチンドロン、メドロキシプロゲステロン、メレンゲストロールプロゲステロン、ノルゲストレル、プロメゲストン、ゼラノールのような)等が挙げられる。
【0280】
例示的なアンチセンス核酸としては、これらに限定されないが、アンドロゲン受容体(ISIS-AR、AZD5312のような)、アンギオポエチン様3タンパク質(ISIS-ANGPTL3のような)、アポリポタンパク質B100(ミポメルセンのような)、アポリポタンパク質CIII(ISIS-APOCIII、ボランソルセンのような)、結合組織成長因子(CTGF)(EXC001、PF-06473871のような)、クラステリン(クスチルセン、OGX-011のような)、C-反応性タンパク質(ISIS-CRPのような)、ジアシルグリセロールアシルトランスフェラーゼ(ISIS-DGAT2のような)、第VII因子(ISIS-FVIIのような)、線維芽細胞成長因子受容体4(ISIS-FGFR4のような)、ヘプシジン(XEN701のような)、Hsp27(アパトルセン、OGX-427のような)、HTT遺伝子(ISIS-HTTのような)、ICAM-1(アリカホルセンのような)、プレカリクレン(prekallikren)(ISIS-PKKのような)、SMN2(ISIS-SMNのような)、STAT3(ISIS-STAT3-2.5、AZD9150のような)、およびトランスサイレチン遺伝子(ISIS-TTRのような)等を標的とするアンチセンス核酸が挙げられる。
【0281】
例示的な低分子干渉RNA(siRNA)としては、これらに限定されないが、アルファ-1-アンチトリプシン突然変異体Z-AAT(ALN-AATのような)、アミノレブリン酸シンターゼ1(ALAS-1)(ALN-AS1、ALN-AS2のような)、抗トロンビンIII(ALN-AT3のような)、補体成分C5(ALN-CC5のような)、補体成分C6(ALN-CC6のような)、結合組織成長因子(RXI-109のような)、ジストロフィン遺伝子のエクソン8(SRP-4008のような)、ジストロフィン遺伝子のエクソン44(SRP-4044のような)、ジストロフィン遺伝子のエクソン45(SRP-4045のような)、ジストロフィン遺伝子のエクソン50(SRP-4050のような)、エボラウイルス(AVI-7537のような)、ジストロフィン遺伝子のエクソン51(エテプリルセン、AVI-4658のような)、ジストロフィン遺伝子のエクソン52(SRP-4052のような)、ジストロフィン遺伝子のエクソン53(SRP-4053のような)、インフルエンザウイルス(AVI-7100のような)、キネシンスピンドルタンパク質(KSP)、肺疾患(Atu111のような)、マールブルグウイルス(AVI-7288のような)、多標的低分子干渉RNA(siRNA)カクテル(STP503、STP523、STP601、STP702、STP705、STP801、STP805、STP900、STP902、STP911、STP916、siPOOLのような)、ウイルスゲノムのヌクレオカプシドN(ALN-RSV01のような)、PCSK9(ALN-PCS01、ALN-PCSscのような)、アポトーシス促進性タンパク質カスパーゼ2(QPI-1007のような)、アポトーシス促進性タンパク質p53(QPI-1002のような)、RTP801(PF-655のような)、SERPINC1(ALN-AT4のような)、膜貫通プロテアーゼセリン6(Tmprss6)(ALN-TMPのような)、トランスサイレチン(ALN-TTRsc、ALN-TTR02のような)、PCSK10(ALN-PCS02のような)、PKN3(Atu027のような)、および血管内皮成長因子(VEGF)(ALN-VSPのような)等を標的とするsiRNAが挙げられる。
【0282】
例示的なマイクロRNA阻害剤としては、これらに限定されないが、miR-10b、miR-15、miR-21、miR-29、miR-33、miR-92、miR-145、miR195、miR-208、miR-221、miR-451、およびmiR-499等の阻害剤が挙げられる。
【0283】
例示的なマイクロRNA模倣体としては、これらに限定されないが、miR-34(MRX34のような)、miR-Rx06、miR-Rx07、miR-Rx16の類似体、およびlet7(miR-Rxlet-7のような)の類似体等が挙げられる。
【0284】
例示的なDNAアプタマーとしては、これらに限定されないが、ヌクレオリン阻害剤(AS1411のような)、pGDF阻害剤(E10030のような)、トロンビン阻害剤(NU172のような)、およびvWF阻害剤(ARC1779のような)等が挙げられる。
【0285】
例示的なRNAアプタマーとしては、これらに限定されないが、C5a阻害剤(NOX-D21またはARC1905のような)、カルシトニン遺伝子関連ペプチド阻害剤(NOX-L41のような)、C-Cケモカインリガンド2阻害剤(NOX-E36のような)、CXCL12阻害剤(NOX-A12のような)、グルカゴン阻害剤(NOX-G16のような)、ヘプシジンアンタゴニスト(NOX-H94のような)、病原体認識受容体アゴニスト(RIG-Iアゴニストのような)、スフィンゴシン-1-リン酸阻害剤(NOX-S93のような)、およびVEGFアンタゴニスト(NX1838のような)等が挙げられる。
【0286】
ワクチンの調製に潜在的に有用な例示的な炭水化物としては、限定ではないが、レクチン、大腸菌(E. coli)O121 O-抗原、大腸菌(E. coli)O121 O-抗原誘導体、HIV-I gpl20由来のMan9、シゲラ・フレックスネリ(shigella flexneri)2a O-ポリサッカライド、黄色ブドウ球菌(staphylococcus aureus)ポリサッカライド莢膜ポリサッカライド5、黄色ブドウ球菌(staphylococcus aureus)ポリサッカライド莢膜ポリサッカライド8、腫瘍関連炭水化物抗原(TACA)(Tn抗原(例えば、α-GalNAc-O-Ser/Thr)、シアリルTn抗原(例えば、NeuAcα(2,6)-GalNAcα-O-Ser/Thr)、Thomsen-Friedenreich抗原(Galβ1-3GalNAcα1)、LewisY(例えば、Fucα(1,2)-Galβ(1,4)-[Fucα(1,3)]-GalNAc)、シアリルLewisX、およびシアリルLewisA、LewisX(ステージ特異的胎児抗原-1/SSEA-1)、Globo H抗原(例えば、Fucα(1,2)-Galβ(1,3)-GalNAcβ(1,3)-Galα(1,4)-Galβ(1,4)-Glc)、T抗原(例えば、Galβ(1,3)-GalNAcα-O-Ser/Thr)、スフィンゴ糖脂質ステージ特異的胎児抗原-3(SSEA-3)、シアル酸含有スフィンゴ糖脂質、ガングリオシドGD2、GD3、ガングリオシドGM2、ガングリオシドフコシルGM、およびガングリオシドNeu5GcGM3のような)等と特異的に結合する炭水化物エピトープが挙げられる。
【0287】
本明細書で提供される本発明の核酸分子によりコードされたポリペプチドを含み、生理活性タンパク質および/または低分子および/または炭水化物を含む薬物コンジュゲートは、炎症性疾患、感染性疾患、呼吸器疾患、内分泌障害、中枢神経系の疾患、筋骨格疾患、心血管疾患、腫瘍学的疾患、泌尿生殖器疾患、および代謝疾患の治療に使用することができる。
【0288】
例示的な炎症性疾患としては、これらに限定されないが、強直性脊椎炎、関節炎、アテローム性動脈硬化症、非典型溶血性尿毒症症候群(aHUS)、線維筋痛、ギランバレー症候群(GBS)、過敏性腸症候群(IBS)、クローン病、大腸炎、皮膚炎、憩室炎、骨関節炎、乾癬性関節炎、ランバート-イートン筋無力症症候群、全身性紅斑性狼瘡(SLE)、腎炎、パーキンソン病、多発性硬化症、発作性夜間血色素尿症(PNH)、関節リウマチ(RA)、シェーグレン症候群、および潰瘍性大腸炎等が挙げられる。
【0289】
例示的な感染症としては、これらに限定されないが、アフリカトリパノソーマ症、ボレリア症、コレラ、クリプトスポリジウム症、デング熱、A型肝炎、B型肝炎、C型肝炎、HIV/AIDS、インフルエンザ、日本脳炎、リーシュマニア症、マラリア、麻疹、脳膜炎、回旋糸状虫症、肺炎、ロタウイルス感染症、住血吸虫症、敗血症、細菌性赤痢、連鎖球菌性扁桃炎、結核、腸チフス、および黄熱病等が挙げられる。
【0290】
例示的な呼吸器疾患としては、これらに限定されないが、喘息、慢性閉塞性肺疾患(COPD)、および嚢胞性線維症等が挙げられる。
【0291】
例示的な内分泌障害としては、これらに限定されないが、先端巨大症、I型糖尿病、II型糖尿病、妊娠性糖尿病、グレーブス病、成長ホルモン欠損症、高血糖症、副甲状腺機能亢進症、甲状腺機能亢進症、低血糖症、不妊、肥満、副甲状腺疾患、モルキオA症候群、およびムコ多糖症等が挙げられる。
【0292】
中枢神経系の例示的な疾患としては、これらに限定されないが、アルツハイマー病、カタレプシー、ハンチントン病、およびパーキンソン病等が挙げられる。
【0293】
例示的な筋骨格疾患としては、これらに限定されないが、骨粗鬆症および筋ジストロフィー等が挙げられる。
【0294】
例示的な心血管疾患としては、これらに限定されないが、急性心不全、脳血管疾患(脳卒中)、および虚血性心疾患等が挙げられる。
【0295】
例示的な腫瘍学的疾患としては、これらに限定されないが、副腎がん、膀胱がん、乳がん、結腸および直腸がん、子宮内膜がん、腎臓がん、急性リンパ芽球性白血病(ALL)、他のタイプの白血病、肺がん、黒色腫、非ホジキンリンパ腫、膵臓がん、前立腺がん、ならびに甲状腺がん等が挙げられる。
【0296】
例示的な泌尿生殖器疾患としては、これらに限定されないが、良性前立腺過形成(BPH)、血尿症、過敏膀胱、およびペーロニー病等が挙げられる。
【0297】
例示的な代謝疾患としては、これらに限定されないが、ゴーシェ病、ファブリ病、成長ホルモン欠損症、ハーラー症候群、ハンター症候群、高シュウ酸尿症、神経セロイドリポフスチン症、マロトー・ラミー症候群、モルキオ症候群、ヌーナン症候群、SHOX遺伝子ハプロ不全、ターナー症候群、プラダー・ウィリー症候群、フェニルケトン尿症、およびサンフィリッポ症候群等が挙げられる。
【0298】
上述のように、本明細書で提供される核酸分子は、単独で、または遺伝子治療目的用のベクターの一部としても使用することができる。遺伝子治療は、ex vivoまたはin vivo技法により、治療用遺伝子を細胞内に導入することに基づくものであり、遺伝子移入の最も重要な応用の1つである。in vivo遺伝子治療に好適なベクター、方法、または遺伝子送達系は、文献に記載されており、当業者に公知である。例えば、Giordano (1996) Nat. Med. 2:534-539;Schaper (1996) Circ. Res. 79:911-919;Anderson (1992) Science 256:808-813;Verma (1997) Nature 389:239-249;Isner (1996) Lancet 348:370-374;Muhlhauser (1995) Circ. Res. 77:1077-1086;Onodera (1998) Blood 91:30-36;Verma (1998) Gene Ther. 5:692-699;Nabel (1997) Ann. N.Y. Acad. Sci. 811:289-292;Verzeletti (1998) Hum. Gene Ther. 9:2243-2251;Wang (1996) Nat. Med. 2:714-716;国際公開第94/29469号パンフレット;国際公開第97/00957号パンフレット、米国特許第5,580,859号明細書;米国特許第5,589,466号明細書;またはSchaper (1996) Curr. Opin. Biotechnol. 7:635-640を参照されたい。本明細書で提供される核酸分子およびベクターは、細胞内に直接導入するように、またはリポソームもしくはウイルスベクター(例えば、アデノウイルス、レトロウイルス)により導入するように設計することができる。例えば、ベクターは、アデノ随伴ウイルス(AAV)ベクター、特にAAV8ベクターであってもよい。AAVベクターは、遺伝子治療に魅力的である。AAV系は、長期的な遺伝子発現、ヘルパーウイルスなしでは自己複製できないこと、分裂および非分裂細胞の形質導入、ならびに野生型感染による病原性の欠如を含む、いくつかの利点を有する。好ましくは、核酸分子またはベクターが導入される前記細胞は、生殖系列細胞、胚細胞、もしくは卵細胞、またはそれらに由来するものであり、最も好ましくは、前記細胞は、幹細胞である。胚幹細胞の例は、特に、Nagy (1993) Proc. Natl. Acad. Sci. USA 90:8424-8428に記載の幹細胞であってもよい。
【0299】
用語「ポリペプチド」、「ペプチド」、および「タンパク質」は、本明細書では同義的に使用され、1つのアミノ酸のアミノ基と別のアミノ酸のカルボキシル基との間で形成されるアミドまたはペプチド結合により連結されている2つまたはそれよりも多くのアミノ酸のポリマーを指す。好ましくは、ペプチド結合は、1つのアミノ酸のα-アミノ基と別のアミノ酸のα-カルボキシル基との間で形成される。ペプチドまたはタンパク質に含まれるアミノ酸は、アミノ酸残基とも呼ばれ、20種の標準タンパク質新生α-アミノ酸(すなわち、Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、およびVal)から選択してもよいが、非タンパク質新生および/または非標準α-アミノ酸(例えば、オルニチン、シトルリン、ホモリジン、ピロリジン、または4-ヒドロキシプロリン)ならびにβ-アミノ酸(例えば、β-アラニン)、γ-アミノ酸、およびδ-アミノ酸から選択してもよい。好ましくは、ペプチドまたはタンパク質に含まれるアミノ酸残基は、α-アミノ酸から選択され、より好ましくは20種の標準タンパク質新生α-アミノ酸(それらは、L-異性体またはD-異性体として存在することができ、好ましくは、Glyを除いて全てがL-異性体として存在する)から選択される。
【0300】
コードされたポリペプチドまたはタンパク質は、未修飾であってもよく、または例えば、そのN末端が、そのC末端が、および/またはそのアミノ酸残基のいずれかの側鎖が(特に、1つまたは複数のLys、His、Ser、Thr、Tyr、Cys、Asp、Glu、および/またはArg残基の側鎖官能基が)修飾されていてもよい。そのような修飾としては、例えば、Wuts (2006) Greene's protective groups in organic synthesis, John Wiley & Sons, 4th edition, Hoboken, N.J.において、対応する官能基について記載されている保護基のいずれかを結合させることが挙げられ得る。そのような修飾としては、1つまたは複数の脂肪酸(例えば、1つまたは複数のC8~30アルカン酸またはアルケン酸;脂肪酸アシル化ペプチドまたはタンパク質を形成)によるグリコシル化および/またはアシル化も挙げることができる。コードされたポリペプチドは、好ましくはヒドロキシル化されておらず、特に、ヒドロキシプロリンを含んでいない。
【0301】
コードされたペプチドまたはタンパク質に含まれるアミノ酸残基は、例えば、直鎖分子鎖(直鎖ペプチドまたはタンパク質を形成する)として存在してもよく、あるいは例えばペプチドもしくはイソペプチド結合またはジスルフィド架橋により環化されている1つまたは複数の環(環状ペプチドまたはタンパク質に対応する)を形成していてもよい。ペプチドまたはタンパク質は、2つまたはそれよりも多くの同一のまたは異なる分子からなるオリゴマーも形成してもよい。本明細書で使用される場合、用語「ドメイン」は、特定の構造および/または機能を自律的に取ることが可能なアミノ酸配列の任意の領域/部分に関する。したがって、本発明の状況では、「ドメイン」は、機能的ドメインまたは構造ドメインであってもよく、それらは、例えば、より大きなポリペプチドの一部を形成していてもよい。
【0302】
本明細書で使用される場合、用語「含む(comprising)」および「含む(including)」またはそれらの文法的異型は、記載されている特徴、整数、ステップ、または成分を指定すると理解されるべきであるが、1つまたは複数の追加の特徴、整数、ステップ、成分、またはそれらのグループの付加を排除しない。これら用語は、用語「~からなる」および「~から本質的になる」を包含する。
【0303】
したがって、用語「含む(comprising)」/「含む(including)」/「有する(having)」は、任意のさらなる成分(または類似の特徴、整数、およびステップ等)が存在することができる/存在していてもよいことを意味する。したがって、用語「含む(comprising)」/「含む(including)」/「有する(having)」が本明細書で使用される場合はいつでも、「~から本質的になる」に、または好ましくは「~からなる」に置き換えることができる。
【0304】
用語「~からなる」は、さらなる成分(または類似の特徴、整数、およびステップ等)が存在しないことを意味する。
【0305】
用語「~から本質的になる」またはその文法的異型は、本明細書で使用される場合、記載されている特徴、整数、ステップ、または成分を指定すると理解されるべきであるが、1つまたは複数の追加の特徴、整数、ステップ、成分、またはそれらのグループの付加は、追加の特徴、整数、ステップ、成分、またはそれらのグループが、特許請求されている組成物、デバイス、または方法の基本的および新規な特徴を実質的に変更しない場合にのみ排除されない。
【0306】
したがって、用語「~から本質的になる」は、特定のさらなる成分(または類似の特徴、整数、およびステップ等)、すなわち組成物、デバイス、または方法の本質的な特徴に実質的な影響を及ぼさないものが存在し得ることを意味する。言い換えれば、用語「~から本質的になる」(本明細書では、用語「実質的に含む」と同義的に使用することができる)は、デバイスまたは方法の本質的な特徴が他の成分の存在により実質的に影響を受けない限り、必須成分(または類似の特徴、整数、およびステップ等)に加えて、組成物、デバイス、または方法に他の成分が存在することを許容する。
【0307】
用語「方法」は、所与の作業を達成するための様式、手段、技法、および手順を指し、そのようなものとしては、化学、生物学、および生物物理学分野の実務者に知られているか、または既知の様式、手段、技法、および手順から容易に開発されるかのいずれかである様式、手段、技法、および手順が挙げられるが、それらに限定されない。
【0308】
本明細書で使用される場合、別様の指示がない限り、用語「約」は、好ましくは、示されている数値の±10%、より好ましくは、示されている数値の±5%、および特に、示されている数値そのものを指す。
【0309】
以下の非限定的な図および例を参照することにより、本発明をさらに説明する。別様の指定がない限り、例えば、その全体が参照により本明細書に組み込まれるSambrook (2001) loc. cit.に記載されている組換え遺伝子技術の確立されている方法を使用した。
【0310】
以下の非限定的な図および例を参照することにより、本発明をさらに説明する。図は、以下の通りである。
【図面の簡単な説明】
【0311】
【
図1-1】プラスミドpXL2を使用した、プロリン/アラニンリッチ配列をコードする低反復性核酸の構築。(A)pXL2(配列番号48)のプラスミドマップ。SapI認識部位(5’-GCTCTTC-3’)およびEarI認識部位(5’-CTCTTC-3’」)が、lacプロモーター/オペレーター(lac
p/o)の転写制御下にある選択可能なマーカー遺伝子lacZに挿入されている。SapI制限部位は、プロリン/アラニンリッチ配列をコードする低反復性核酸分子の1つまたは複数のユニット(構成単位)の連続挿入を可能にする。EarI、その認識配列がSapI認識配列とオーバーラップする/SapI認識配列のサブセットである制限酵素による切断は、プロリン/アラニンリッチ配列をコードする構築された低反復性核酸分子(遺伝子カセット)の切り出しおよび/または単離を可能にする。プラスミド骨格は、サイレント突然変異による追加のSapIおよびEarI制限部位の欠失を除いて、汎用クローニングベクターpUC19(Yanisch-Perron (1985) Gene 33:103-119)の骨格と同一である。 (B)pXL1(配列番号55)のプラスミドマップ。反対向きの2つのSapI認識部位(5’-GCTCTTC-3’)が、lacプロモーター/オペレーター(lac
p/o)の転写制御下にある選択可能なマーカー遺伝子lacZに挿入されている。SapI制限部位は、プロリン/アラニンリッチ配列をコードする低反復性核酸分子(遺伝子カセット)の挿入/クローニング、ならびに増殖/増幅ならびにその後の切り出しおよび/または単離を可能にする。プラスミド骨格は、サイレント突然変異による追加のSapI制限部位の欠失を除いて、pUC19の骨格と同一である。なお、挿入された遺伝子カセットは、pXL2と比較して逆向きである。 (C)低反復性核酸分子のクローニングおよび構築に有用な、pXL2のクローニング部位のおよびその周辺のヌクレオチド配列伸長。ヌクレオチド配列は、逆向きのSapI制限部位およびEarI制限部位を含む。EarI認識配列は、SapI認識配列の一部でもあるため、EarIは、両認識部位を切断する。SapIまたはEarIのいずれの制限酵素が使用されるかに関わらず、消化により、GCC/CGG末端(Alaをコードする)の突出がもたらされ、それらは、プロリン/アラニンリッチ配列をコードする低反復性核酸分子のGCC/CGG突出と適合するため、効率的なライゲーションが可能になる。認識配列には、下線が引かれている。
【
図1-2】(D)1つの低反復性核酸ユニット/構成単位PAS#1b(200)(配列番号19)を挿入した後の、pXL2のクローニング部位のヌクレオチド配列およびコードされたアミノ酸配列。クローニングされた低反復性核酸ユニット/構成単位に隣接するSapIおよびEarI制限部位には、名称が表示されている(認識配列には下線が引かれている)。
【
図1-3】(E)プロリン/アラニンリッチアミノ酸反復配列をコードする、より長いクローニングされたヌクレオチド配列(核酸分子)を得るための、低反復性核酸配列ユニットの構築。第1のステップでは、pXL2をSapIで消化し、脱リン酸化し、第1の配列ユニットPAS#1b(200)とライゲーションする。第2のステップでは、その結果生じたプラスミドを、唯一のSapI制限消化により、クローニングされた配列ユニットの上流で開環/線形化し、その後脱リン酸化し、第2のヌクレオチド配列ユニットPAS#1c(200)とライゲーションする。その結果生じたプラスミドpXL2-PAS#1c/1b(400)は、合計で長さが1200個の塩基対を含む、挿入された遺伝子/DNAカセットを含む。全体として、プロリン/アラニンリッチアミノ酸反復配列をコードするその結果生じたクローニングされた低反復性ヌクレオチド配列は、14ヌクレオチドの最大長を有するヌクレオチド反復のみを含む(配列番号52)。構築された遺伝子カセット/核酸分子全体を、EarIによる消化で容易に切り出すことができ、その後、例えば、生理活性タンパク質をコードするヌクレオチド配列と同じリーディングフレームで、発現ベクターにサブクローニングするため等に使用することができる。特筆すべきことには、第2のステップを繰り返すことにより、連続して増加する長さを有する遺伝子カセットを、系統的な様式でpXL2に構築およびクローニングすることができる。異なる好適なヌクレオチド配列ユニットを使用すると、プロリン/アラニンリッチアミノ酸反復配列をコードするその結果生じる長い低反復性核酸分子は、ほんの少数のまたは短いヌクレオチド反復しか含まない。
【
図2-1】プロリン/アラニンリッチ配列の反復分析。(A)従来技術のプロリン/アラニンリッチ配列PA#3a(200)(配列番号15)のドットプロットが、本発明による低反復性ヌクレオチド配列PA#3b(200)(配列番号36)のドットプロットと比較されている。これらは両方とも、Geneious V8.1ソフトウェアパッケージ(Biomatters、オークランド、ニュージーランド)に含まれているドットプロットツール「dottup」を使用し、14または15の反復ウィンドウを適用して生成した。分析されるヌクレオチド配列を、それぞれ二次元グラフのx軸およびy軸でそれ自体と比較することにより、「dottup」ツールは、指定の長さ(反復ウィンドウ)の同一の配列が出現する全ての領域を特定して対角線を引き、したがって、x軸およびy軸に反復配列の位置を示す(中央の対角線と異なる対角線により示される場合、中央の対角線は、自己同一性を示す)。連続する反復は、対角線を延長する。ここで分析されたPA#3a(200)ヌクレオチド配列は、多くのおよび/または長い対角線により示されているように、高度に反復性の性質を明らかにしている。この場合、ヌクレオチド配列は、各々60塩基対の多数の反復を示している。14の反復ウィンドウを適用することにより、60bp反復内に、より短い14bp反復さえ現れる。対照的に、PA#3b(200)ヌクレオチド配列は、600bpの分析されたヌクレオチド配列全体内に、ほんの少数の散在性の14bp反復しか示さないが、分析のためにわずかにより大きな15の反復ウィンドウを適用すると、反復は検出可能ではない。
【
図2-2】(B)プロリン/アラニンリッチ配列をコードする、国際公開第2008155134号パンフレットに開示されている核酸PAS#1a(600)(配列番号12)のドットプロットが、本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする構築された低反復性ヌクレオチド配列PAS#1d/1f/1c/1b(800)(配列番号39)およびPAS#1f/1c/1b(600)(配列番号38)のドットプロットと、14および15塩基対の反復ウィンドウを使用して比較されている。ヌクレオチド配列PAS#1a(600)は、60塩基対反復の組成を明らかにするが、PAS#1d/1f/1c/1b(800)およびPAS#1f/1c/1b(600)ヌクレオチド配列は、それぞれ2400または1800bpの分析されたヌクレオチド配列全体内に、反復が存在しないか、または14個ヌクレオチド反復ウィンドウの場合、たった1つの単一14個ヌクレオチド反復(対角線)しかないことを示している。
【
図2-4】(C)米国特許出願公開第2006/0252120号明細書に開示されている[(AP)
5]
n多量体をコードする合成DNA配列(配列番号16)およびマカクヘルペスウイルス(Macacine herpesvirus)1の超大型テグメントタンパク質の反復性プロリン/アラニンリッチ領域をコードする天然DNA配列(GenBank AAP41454.1)(配列番号18)のドットプロット分析が、14および15ヌクレオチドの反復ウィンドウを適用して、本発明による低反復性ヌクレオチド配列PA#3a(200)(配列番号15)と比較されている。[(AP)
5]
n多量体およびマカクヘルペスウイルス(Macacine herpesvirus)1の超大型テグメントタンパク質のプロリン/アラニンリッチ領域をコードするDNA配列のドットプロットは、これらヌクレオチド配列の、高度に反復性の性質を示している。対照的に、PA#1b(200)ヌクレオチド配列のドットプロットは、600bpの分析されたヌクレオチド配列全体内に、ほんの少数の散在性の14ヌクレオチド反復しかない(14個ヌクレオチド反復ウィンドウ)ことを示すか、または反復が全くない(15個ヌクレオチド反復ウィンドウ)ことを示している。
【
図3】プロリン/アラニンリッチアミノ酸配列をコードする低反復性核酸分子のDNA配列決定の電気泳動図。 本発明によるプロリン/アラニンリッチ配列をコードする低反復性ヌクレオチド配列を有するpXL2-PAS#1f/1c/1b(600)(配列番号38)のDNA配列決定の電気泳動図。二本鎖プラスミドDNAを、PAS#1b(200)ヌクレオチド配列ユニット(配列番号19)のコード領域内と特異的にハイブリダイズするプライマーXLP-1(配列番号3)を使用して配列決定した。この電気泳動図では、900個よりも多くの塩基が判読可能であり、pXL2-PAS#1f/1c/1b(600)の既知ヌクレオチド配列に対応する。特筆すべきことには、この電気泳動図は、非特異的または多重プライマーハイブリダイゼーションの徴候を示していない。
【
図4】pASK75 PAS#1f/1c/1b(600)-IL1Ra、治療関連性を有するPAS#1(600)-IL1Ra融合タンパク質の細菌産生用の遺伝子的に安定な発現ベクター (A)pASK75-IL1Ra(配列番号49)のプラスミドマップ、および(B)PAS#1f/1c/1b(600)遺伝子カセット挿入後の、その誘導体pASK75-PAS#1f/1c/1b(600)-IL1Ra(配列番号50)。601個のアミノ酸残基を有するPAS#1ポリペプチドをコードする低反復性ヌクレオチド配列、およびヒトIL-1Raの構造遺伝子、ならびに細菌性OmpAシグナル配列およびHis
6タグのコード領域を含む、生理活性/薬理活性(プレ)タンパク質PAS#1(600)-IL1Raの構造遺伝子が、tetプロモーター/オペレーター(tet
p/o)の転写制御下にクローニングされている。XbaIおよびHindIII制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターpASK75(Skerra (1994) Gene 151:131-135)の骨格と同一である。本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子を挿入した後の保持された唯一のSapI制限部位が示されている。
【
図5】従来技術のヌクレオチド配列PAS#1a(600)と比較した、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子PAS#1f/1c/1b(600)の遺伝子安定性の分析 pASK75-PAS#1a(600)-IL1Ra(レーン1~5)(配列番号51)またはpASK75-PAS#1f/1c/1b(600)-IL1Ra(レーン1~10)(配列番号50)で形質転換し、細菌細胞分裂のおよそ70世代に相当する7日間にわたって培養した大腸菌(E. coli)JM83クローンの10個のプラスミド調製物を、XbaI/HindIII制限分析した後のアガロースゲル電気泳動。pASK75-PAS#1a(600)-IL1Raの分析された5つのクローンのうちの4つは、プロリン/アラニンリッチアミノ酸反復配列をコードする核酸インサートを含む短縮DNA断片を明らかにした(
図5A)。これは、遺伝子不安定性を明らかに示す。対照的に、pASK75-PAS#1f/1c/1b(600)-IL1Raの5つのクローンは全て、それぞれ3093bpおよび2377bpに対応する予想通りのバンドのみを示した。これは、プロリン/アラニンリッチアミノ酸反復配列をコードする核酸インサートが完全であること、および遺伝子プラスミド安定性が高いことを示す。したがって、本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列は、従来技術の反復性ヌクレオチド配列よりも、明らかに有利である。
【
図6】生理活性タンパク質IL-1Raをコードする発現プラスミドへの、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列のシームレスクローニング。 (A)OmpAシグナル配列遺伝子を含む融合タンパク質のコード領域の概要図であり、OmpAシグナル配列遺伝子の後には、GCCアラニンコドン、非コード鎖の第1のSapI認識配列GCTCTTC、GCジヌクレオチドスペーサー、およびコード鎖でのその認識配列はGCTCTTCである、逆向きの第2のSapI認識配列があり、その後最後にはGCCアラニンコドン、および成熟IL-1Raのコード配列(UniProt ID P18510)がある。示されている配列全体を、汎用発現ベクターpASK75のXbaI/HindIII制限部位によりクローニングした。(B)SapIで切断し、2つのSapI制限部位により隣接されている短い24bpインサートを切り出した後の、(A)に記載されているDNAカセットの概要図。なお、2つの5’-突出があるため、中間の18ヌクレオチドのみが、DNA二本鎖を形成し、したがって真の意味での塩基対を含む。(C)例えば、EarI制限消化により生成された適合する粘着GCC/CGG末端により(
図1を参照)pXL2-PA#1b(200)(配列番号54)から切り出された、低反復性ヌクレオチド配列PA#1b(200)を含むDNA断片の一方向様式でのシームレス挿入。本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を含むその結果生じた発現カセットは、配列番号47として本明細書のさらに下記に示されている。
【
図7】遺伝子的に安定な発現ベクターpASK75-PAS#1f/1c/1b(600)-IL1Raを使用して大腸菌(E. coli)で産生されたPAS#1(600)-IL1Ra融合タンパク質の特徴付け (A)IMAC、AEX、CEX、および10%SDS-PAGEによるSECで精製したPAS#1(600)-IL1Ra融合タンパク質の分析。ゲルは、2-メルカプトエタノールで還元したPAS#1(600)-IL1Raの2μg試料(レーン1)を示しており、還元しなかったもの(レーン2)も示している。タンパク質マーカータンパク質(M)のサイズは、左側に示されている。PAS#1(600)-IL1Ra融合タンパク質は、116kDaを超える見掛けの分子サイズを有する単一均質バンドとして出現する。PAS融合タンパク質は、SDS結合が不良であるため、一般的に、例えばPAS#1(600)-IL1Raの計算質量である68kDaよりも著しくより大きなサイズを示す(Schlapschy (2013) Protein Eng Des Sel. 26:489-501)。(B)エレクトロスプレーイオン化質量分析(ESI-MS)によるPAS#1(600)融合タンパク質の特徴付け。精製したPAS#1(600)-IL1Ra融合タンパク質のデコンボリューションESI-MSスペクトルは、67994.8Daの測定質量を明らかにしている。これは、計算質量である67994.9Daとほとんど完全に一致する。
【
図8-1】遺伝子的に安定な発現ベクターpASK37-MP-PA#1d/1c/1b(600)を使用して、大腸菌(E. coli)で産生された純粋なPA#1(600/)ポリペプチドの特徴付け (A)pASK37-MP-PA#1d/1c/1b(600)(配列番号53)のプラスミドマップ。PA#1(600)ポリペプチドをコードする低反復性ヌクレオチド配列を、開始Met残基およびPro残基のコドンがその前にあるlacUV5プロモーター/オペレーター(lacUV5
p/o)の転写制御下にクローニングした。XbaIおよびHindIII制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターpASK37(Skerra (1991) Protein Eng. 4:971-979)の骨格と同一である。(B)10%SDS-PAGE後にヨウ化バリウムで染色した組換えPA#1(600)ポリペプチドの分析。ロードした試料は、3時間の発現後の溶解細胞(レーン1)、20w/v%(NH
4)
2SO
4で析出させたタンパク質(レーン2)、17,000rpmで20分間遠心分離し、その後1v/v%AcOHで処理した後の、20mM Tris/HClに溶解した(NH
4)
2SO
4析出物の上清(レーン3)、およびPA#1(600)ポリペプチド処理物をその後にサブトラクティブ陽イオン交換クロマトグラフィーにかけた際の通過画分(レーン4)である。PA#1(600)ポリペプチドは、SDSとの結合が不良であり、したがって、PA#1(600)ポリペプチドは、スタッキングゲル内に赤色/黄色のヨウ素染色バンドとして出現し、組成が均質であることを示す。(C)水で脱染色し、クーマシーブリリアントブルーで染色した後の(B)に示されているゲル。PA#1(600)ポリペプチドは、SDSとの結合が不良であり、クーマシー染料により染色されず、したがって不純物(宿主細胞タンパク質)のみが、クーマシー染色ゲルで視覚化されている。
【
図8-2】(D)エレクトロスプレーイオン化質量分析(ESI-MS)による、純粋なPA#1(600)ポリペプチドの特徴付け。デコンボリューションスペクトルは、48301.78Daの測定質量を明らかにし、これは、SapI制限部位を遺伝子クローニングに使用したため、上記で説明されているように、N末端に追加のPro残基およびC末端に追加のAla残基を担持する組換えPA#1(600)ポリペプチドの計算質量(48301.4Da)とほとんど完全に一致する。なお、この組換えポリペプチドは、もはや開始Met残基を担持せず、これは、メチオニンアミノペプチダーゼの細胞内作用に起因する可能性が最も高い(Giglione (2015) Biochimie 114:134-46)。
【
図9-1】プロリン/アラニンリッチアミノ酸配列をコードするヌクレオチド配列の自動化反復分析。 従来技術のプロリン/アラニンリッチアミノ酸配列をコードする天然ならびに合成ヌクレオチド配列の反復を、PythonスクリプトNRSカリキュレータ(実施例14を参照)を使用して、実施例13に記載のように分析し、ここでは、本発明による低反復性ヌクレオチド配列PAS#1b(200)およびPA#1e/1d/1c/1b(800)と比較した。分析されたヌクレオチド配列内の、ある長さの全ての反復の頻度(出現数)を、反復の長さに対してプロットした。(A)従来技術のヌクレオチド配列PAS#1a(200)(配列番号11)のヒストグラム。(B)ヌクレオチド配列PA#1a(200)(配列番号14)のヒストグラム。(C)糖モジュール[(AlaPro)
5]
20APAをコードするヌクレオチド配列(配列番号16)のヒストグラム。(D)糖モジュール[AAPAPAPAP]
10ASをコードするヌクレオチド配列(配列番号17)のヒストグラム。
【
図9-2】(E)マカクヘルペスウイルス(macacine herpesvirus)1の大型テグメントタンパク質内のプロリン/アラニンリッチ伸長をコードするヌクレオチド配列(配列番号18)のヒストグラム。(F)低反復性ヌクレオチド配列PAS#1b(200)(配列番号19)のヒストグラム。(G)(F)に示されているPAS#1b(200)データの拡大図。
【
図9-3】(H)本発明による低反復性ヌクレオチド配列PA#1e/1d/1c/1b(800)(配列番号44)のヒストグラム。(I)(H)に示されているPA#1e/1d/1c/1b(800)データの拡大図。分析されたヌクレオチド配列の全長(N
tot)およびそのヌクレオチド反復スコア(NRS)は、プロリン/アラニンリッチアミノ酸配列をコードする核酸分子の品質を、反復の頻度および長さに関して評価するため尺度であり、様々なヌクレオチド配列について表1および2に要約されている。
【
図10】pASK75-PA#1d/1c/1b(600)-IL1Ra、治療関連性を有するPA#1(600)-IL1Ra融合タンパク質の細菌産生用の遺伝子的に安定な発現ベクター pASK75-PA#1d/1c/1b(600)-IL1Ra(配列番号77)のプラスミドマップ。601個のアミノ酸残基を有するPA#1ポリペプチドをコードする低反復性ヌクレオチド配列、およびヒトIL-1Raの構造遺伝子、ならびに細菌性OmpAシグナル配列およびHis6タグのコード領域を含む、生理活性/薬理活性(プレ)タンパク質PA#1(600)-IL1Raの構造遺伝子が、tetプロモーター/オペレーター(tet
p/o)の転写制御下にクローニングされている。XbaIおよびHindIII制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターpASK75(Skerra (1994) Gene 151:131-135)の骨格と同一である。本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子を挿入した後の保持された唯一のSapI制限部位が示されている。
【
図11】従来技術のヌクレオチド配列PA#1a(600)と比較した、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子PA#1d/1c/1b(600)の遺伝子安定性の分析 細菌細胞分裂のおよそ70世代に相当する7日間にわたって培養した、pASK75-PA#1d/1c/1b(600)-IL1Ra(
図10)(配列番号77)で形質転換した大腸菌(E. coli)JM83クローンの10個のプラスミド調製物、またはpASK75-PA#1a(600)-IL1Ra(配列番号78)の10個のプラスミド調製物をXbaI/HindIII制限分析した後のアガロースゲル電気泳動。レーン:Mは、分子サイズ標準物質(GeneRuler 1kb DNAラダー:500、750、1000、1500、2000、2500、3000、3500、4000、5000、6000、8000、および10000bp);1~10は、制限消化後の個々のクローンに由来するプラスミド試料。pASK75-PA#1a(600)-IL1Raの分析した10個のクローンのうちの少なくとも4個は、プロリン/アラニンリッチアミノ酸反復配列をコードする核酸インサートを含む短縮DNA断片を明らかにした(
図11A)。これは、遺伝子不安定性を明らかに示す。対照的に、pASK75-PA#1d/1c/1b(600)-IL1Ra(
図11B)の10個のクローンは全て、それぞれ3093bpおよび2377bpに対応する予想通りのバンドのみを示した。これは、プロリン/アラニンリッチアミノ酸反復配列をコードする核酸インサートが完全であること、および遺伝子プラスミド安定性が高いことを示す。したがって、本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列は、従来技術の反復ヌクレオチド配列よりも、明らかに有利である。
【
図12】プロリン/アラニンリッチアミノ酸配列と融合されたヒトレプチンを細菌で産生するための遺伝子的に安定な発現ベクターの構築 (A)プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を、ヒトレプチンの構造遺伝子とインフレームでシームレスにおよび定方向にクローニングすることを可能にするための、SapI制限部位により隣接されているシームレスクローニングカセットを含むpASK37-MP-huLeptin(配列番号81)のプラスミドマップ。(B)PA#1d/1c/1b(600)遺伝子カセット(配列番号42)の挿入を有するpASK37-MP-huLeptinの誘導体である、pASK37-MP-huLeptin-PA#1d/1c/1b(600)(配列番号82)のプラスミドマップ。(C)PAS#1f/1c/1b(600)遺伝子カセット(配列番号38)の挿入を有するpASK37-MP-huLeptinの誘導体である、pASK37-MP-huLeptin-PAS#1f/1c/1b(600)(配列番号83)のプラスミドマップ。生理活性/薬理活性ヒトタンパク質レプチンの構造遺伝子、PA#1(600)をコードする低反復性ヌクレオチド配列に融合されたヒトレプチン、およびPAS#1(600)ポリペプチドをコードする低反復性ヌクレオチド配列に融合されたヒトレプチンを、全ての場合で開始Met残基およびPro残基のコドンがその前にあるlacUV5プロモーター/オペレーター(lacUV5
p/o)の転写制御下にクローニングした。XbaIおよびHindIII制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターpASK37(Skerra (1991) Protein Eng. 4:971-979)の骨格と同一である。
【
図13】PA#1(600)ポリペプチドに融合されており、遺伝子的に安定な発現ベクターpASK37-MP-PA#1d/1c/1b(600)-huLeptin(W100Q)を使用して大腸菌(E. coli)で産生されたヒトレプチン変異体の特徴付け (A)10%ポリアクリルアミドゲルを使用した後、クーマシーブリリアントブルーR-250で染色したPA#1(600)-huLeptin(W100Q)融合タンパク質のSDS-PAGE分析。ゲルは、タンパク質分子量(MW)マーカー(レーンM;Thermo Fisher Scientific、ウォルサム、マサチューセッツ州)、還元試料条件下で19時間発現させた後の大腸菌(E. coli)全細胞抽出物(レーン1)、1M(NH
4)
2SO
4で析出した還元タンパク質(レーン2)および非還元タンパク質(レーン5)、陰イオン交換クロマトグラフィー後の還元タンパク質(レーン3)および非還元タンパク質(レーン6)、ならびにサイズ排除クロマトグラフィー後の還元タンパク質(レーン4)および非還元タンパク質(レーン7)を示している。PA#1(600)-huLeptin(W100Q)は、単一のバンドとして出現している。これは組成が均質であることを示す。 (B)エレクトロスプレーイオン化質量分析(ESI-MS)によるPA#1(600)-huLeptin(W100Q)融合タンパク質の特徴付け。デコンボリューションスペクトルは、64249.5Daの測定質量を明らかにしている。これは、組換え融合タンパク質の計算質量(64249.8Da)と一致し、細菌メチオニンアミノペプチダーゼによる開始Met残基の切断が成功したことを示す。
【発明を実施するための形態】
【0312】
本発明およびその多くの利点についてのより良好な理解を提供する以下の例示的な非限定的な例により、本発明をさらに説明する。
【実施例】
【0313】
[実施例1]
プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列ユニットの合成
各々が200個の残基のプロリン/アラニンリッチアミノ酸反復配列をコードする1セットの異なるヌクレオチド配列を最適化した。最適化には、ヌクレオチドレベルでの低反復性、低GC含量、低RNA二次構造、大腸菌(E. coli)での発現に好ましいコドン使用頻度、および抗ウイルスモチーフの回避、ならびにCIS作用性エレメントに関する、手作業による調整が含まれていた。この目的を達成するために、条件特異的コドン最適化手法(Lanza (2014) BMC Syst Biol 8:33)またはGeneOptimizerアルゴリズム(Raab (2010) Syst Synth Biol 4:215-225)等の、確立されているアルゴリズムを適用した。それらの得られた初期配列を、以下の様式で手作業により調整した。
【0314】
所与の閾値(例えば、14ヌクレオチド)よりも長い反復を、http://visualgenedeveloper.netにて自由に利用可能であるVisual Gene Developerソフトウェア バージョン1.2を使用して特定した。その後、特定された反復内のコドンを、段階的に置換した。特に、特定された反復内のGCリッチコドンを、選択した宿主生物(例えば大腸菌(E. coli)、P.パストリス(P. pastoris)、またはCHO)で高度に発現される遺伝子に多くみられるATリッチコドンに置き換えた。各置換後、ヌクレオチド配列全体を、反復について再び分析した。置換が、所与の閾値よりも長い新しい反復に結び付いた場合、ヌクレオチド交換を却下し、以前に特定された反復内の異なるコドンを置換した。この手法が失敗した場合、特定された長い反復内の2つのコドンを、同時に置換した。このようにして、所与の閾値を超える全ての特定された反復を、コードされたプロリン/アラニンリッチアミノ酸配列を維持しつつ、反復的に除去した。
【0315】
第2のステップでは、最適化されたヌクレオチド配列のコドン適応インデックス(CAI)、GC含量、および安定なmRNA構造を、Visual Gene Developerソフトウェアを使用して分析し、開始配列と比較した。最適化されたヌクレオチド配列が、開始配列と等しいかまたはより良好なCAI、GC含量、またはmRNA構造に到達するまで、この場合もコドン置換/サイレント突然変異により、追加の手作業による調整を実施した。ステップ1の反復分析を再び実施し、必要に応じて、目標を満たすために他のコドンを交換した。目標は、反復閾値、CAI、GC含量、およびmRNA構造(二次構造)であった。
【0316】
第3のステップでは、各々が同じ200残基のプロリン/アラニンリッチアミノ酸反復配列をコードする異なる個々に最適化されたヌクレオチド配列を組み合わせた、すなわち互いに付け加えた。その結果生じたより長いヌクレオチド配列を、ステップ1および2と同じ様式で最適化した。最後に、その結果生じた長い酸配列を、より短い、例えば600ヌクレオチド長のDNAカセットに分割した。例えば、2400ヌクレオチドの配列PAS#1d/1f/1c/1b(配列番号39)を、4つのより短いカセット(配列番号19、20、21、23)に分割した。同様に、2400ヌクレオチドの配列PA#1e/1d/1c/1b(配列番号44)を、各々が600ヌクレオチドを含む、4つのより短いカセット(配列番号28、29、30、31)に分割した。
【0317】
これら最適化されたヌクレオチド配列ユニットは、逆相補的に配向されている2つのSapI認識部位(5’-GCTCTTC-3’)により隣接され、制限酵素消化後に5’-GCC/5’-GGCヌクレオチド突出がもたらされるように、異なる商業的供給業者が個々に合成した。なお、2つのGCC/GGCヌクレオチド突出が存在するため、中間の597ヌクレオチドのみが、切り出し後にDNA二本鎖を形成し、したがって塩基対(bp)を含む。また、最適化された600個ヌクレオチド配列は、第2のSapI制限部位が存在するため、追加のAlaコドンで延長されており、したがって、プロリン/アラニンリッチアミノ酸配列をコードする全体として603ヌクレオチドの、クローニングされたDNAカセットに結び付く。2つの隣接するSapI制限部位の存在は、例えば本発明のDNAカセット全体の正確な切り出し、およびpXL2へのサブクローニングを可能にする。
【0318】
大腸菌(Escherichia coli)、ピキア・パストリス(Pichia pastoris)、ヒト胚腎臓(HEK)細胞、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)、コリネバクテリウム・グルタミカム(Corynebacterium glutamicum)、バチルス・スブチリス(Bacillus subtilis)、テトラヒメナ・サーモフィラ(Tetrahymena thermophila)、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)、クリベロマイセス・ラクティス(Kluyveromyces lactis)、ヒメツリガネゴケ(Physcomitrella patens)、またはモンゴルキヌゲネズミ(Cricetulus griseus)での発現用にコドンが最適化された、プロリン/アラニンリッチアミノ酸反復配列をコードするヌクレオチド配列ユニットのさらなるセットを、同じ様式で設計および合成した。これら生物用のコドン選択表は、http://www.kazusa.or.jp/codonからダウンロードして入手可能である。本発明による合成された核酸分子およびそれらのヌクレオチド配列特徴は、表1に要約されている。
【0319】
[実施例2]
低反復性ヌクレオチド配列ユニットの、プロリン/アラニンリッチアミノ酸反復配列をコードするより長いヌクレオチド配列への構築
各々がクローニングされた合成DNA断片を担持する商業的供給業者から得たプラスミドを、SapIで消化し、その結果生じた600ヌクレオチドのDNA断片を、標準的な手順(Sambrook (2001) loc. cit.)によるアガロースゲル電気泳動法で精製した。個々のヌクレオチド配列ユニットを、
図1Aに示されている、pUC19(Yanisch-Perron (1985). Gene. 33, 103-119)の誘導体であるプラスミドpXL2(配列番号48)を使用して、より長いヌクレオチド配列へと構築した。pXL2は、単一のSapI制限部位を含み、このIIS型制限酵素による消化は、アラニンをコードする5’-GCC/5’-GGC突出を生成し、これは、合成され精製されたDNA断片の粘着末端と適合する(
図1C)。1つのヌクレオチド配列ユニットを挿入/ライゲーションした後、別のSapI制限消化により、クローニングされた配列ユニットの一方の末端、ここでは上流の末端で、プラスミドを開環することができる(
図1D)。このベクター設計は、同一のまたは異なる低反復性ヌクレオチド配列ユニットの段階的な挿入を可能にし、プロリン/アラニンリッチアミノ酸反復配列をコードするより長いクローニングされた遺伝子カセットを産出する(
図1E)。
【0320】
一例として、まず、ヌクレオチド配列ユニットPAS#1b(200)(配列番号19)、次に、配列ユニットPAS#1c(200)(配列番号20)、およびその後配列ユニットPAS#1f(200)(配列番号23)を、記載されている様式でSapI制限部位によりpXL2に挿入して、プラスミドpXL2-PAS#1f/1c/1b(600)(配列番号38)がもたらされた。その後のステップで、配列ユニットPAS#1d(200)(配列番号19)を、SapI制限部位を使用して、同じ様式でさらに挿入した。その結果生じたプラスミドは、全体で、14ヌクレオチドの最大長を有するヌクレオチド配列反復を明らかにした、構築された2400bp DNAカセットPAS#1d/1f/1c/1b(800)(配列番号39)を含んでいた。pXL2にクローニングされた低反復性DNAカセットの下流にあるEarI(5’-CTCTTC-3’)の認識配列は、SapIの認識配列の一部でもあるため、構築されたDNAカセット全体を、EarIで制限消化して、したがって2回切断して、容易に切り出すことができ、さらなるサブクローニングのために後で使用することが可能である。
【0321】
同じ様式で、低反復性ヌクレオチド配列PA#1e/1d/1c/1b(800)(配列番号44)を、ヌクレオチド配列ユニットPA#1b(200)(配列番号28)、PA#1c(200)(配列番号29)、PA#1d(200)(配列番号30)、およびPA#1e(200)(配列番号31)から、記載されている順序で構築した。大腸菌(E. coli)とは異なる宿主生物用にコドン使用頻度も最適化されている、記載されている構築されたヌクレオチド配列ならびに本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードするさらなる例示的な低反復の核酸分子は、表1に要約されている。開示されているクローニング戦略は、一般的な遺伝子合成法では直接得ることができない、プロリン/アラニンリッチアミノ酸反復配列をコードする長い低反復性核酸分子を含む複雑な遺伝子カセットの単純で段階的な構築を提供する。
【0322】
[実施例3]
プロリン/アラニンリッチアミノ酸反復配列をコードするヌクレオチド配列の反復性分析
ドットプロット分析を、国際公開第2011144756号パンフレットに開示されているプロリン/アラニンリッチアミノ酸反復配列PA#3(配列番号15)(
図2A)、国際公開第2008155134号パンフレットに開示されているPAS#1(配列番号11)(
図2B)、国際公開第2004094590号パンフレットに開示されている[(AP)
5]
n多量体(配列番号16)、およびGenBank受託番号AAP41454.1として公開されている、マカクヘルペスウイルス(Macacine herpesvirus)1遺伝子の超大型テグメントタンパク質の反復性プロリン/アラニンリッチアミノ酸配列領域(配列番号18)(
図2C)をコードする異なるヌクレオチド配列について実施した。分析は、Geneiousソフトウェアパッケージ バージョン8.1(Biomatters、オークランド、ニュージーランド)のドットプロットツール「dottup」を使用し、14または15ヌクレオチドの反復ウィンドウを適用して、各ヌクレオチド配列をそれ自体に対してアラインすることにより実施した。このソフトウェアのアルゴリズムは、自由に利用可能なEMBOSS6.5.7ツール「dottup」(Sanger Institute、ケンブリッジ、英国)に基づいている。従来技術のヌクレオチド配列について得られたその結果生じた二次元ドットプロットグラフを、低反復性ヌクレオチド配列ユニットPA#3b(200)(配列番号36)、PA#1b(200)(配列番号28)、ならびにより長いプロリン/アラニンリッチアミノ酸反復配列をコードする構築されたヌクレオチド配列PAS#1f/1c/1b(600)(配列番号38)およびPAS#1d/1f/1c/1b(800)(配列番号39)のドットプロットと比較した。黒色対角線によって示されているように(
図2A、B、C)、分析した従来技術のヌクレオチド配列は全て、ヌクレオチド配列レベルで高度に反復性の性質を明らかにしたが、本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする最適化されたヌクレオチド配列のドットプロットは、600ヌクレオチドのPA#3b(200)およびPA#1b(200)カセット(
図2A、C)、1800ヌクレオチドのPAS#1f/1c/1b(600)カセット(
図2B)、または2400ヌクレオチドのPAS#1d/1f/1c/1b(800)カセット(
図2B)の分析したヌクレオチド配列全体内に、ほんの少数の散在性のまたは短い14ヌクレオチド反復(黒色線)しか示さなかった。
【0323】
[実施例4]
長いプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子のDNA配列決定
プラスミドpXL2にクローニングした実施例2に記載されている低反復性PAS#1f/1c/1b(600)DNAカセット(配列番号38)は、DNA配列決定サービス提供業者(Eurofins Genomics、エーバースベルク、ドイツ)が、サンガーサイクル配列決定法を使用して、ABI 3730XL機器(Thermo Fisher Scientific、ウォルサム、マサチューセッツ州)で配列決定した。この目的を達成するため、形質転換された大腸菌(E. coli)XL1-blue細胞から、QIAprepスピンミニプレップキット(Qiagen、ヒルデン、ドイツ)を使用して単離した8μl(150ng/μl)のpXL2-PAS#1f/1c/1b(600)プラスミドDNAを、5μlの二重蒸留H
2O、およびPAS#1b(200)ヌクレオチド配列ユニットのコード領域内にハイブリダイズする2μlのプライマーXLP-1(10μM)(配列番号3)と混合し、DNA配列決定サービス提供業者に提出した。その結果、900個よりも多くの帰属可能なヌクレオチドを含むエラーフリー電気泳動図(
図3)が得られた。これは、非特異的または多重プライマー結合の徴候を示していなかった。したがって、クローニングされたDNAの上流または下流にあるベクターヌクレオチド配列にハイブリダイズするプライマーの使用では、部分的にしか配列決定することができない長い反復ヌクレオチド配列とは対照的に、プロリン/アラニンリッチアミノ酸反復配列をコードする本発明による長い低反復性核酸分子は、クローニングされたヌクレオチド配列内で内部的に特異的ハイブリダイズするプライマーも使用して、容易に配列決定することができる。これは、異なる好適なプライマーを使用して、複数のオーバーラップ配列リードを可能にし、したがって本発明による非常に長い核酸分子の配列決定でさえ、全配列範囲を網羅することが可能になる。
【0324】
[実施例5]
治療用のPAS#1(600)-IL1Ra融合タンパク質を細菌で産生するための遺伝子的に安定な発現ベクターであるpASK75-PAS#1f/1c/1b(600)の構築
インターロイキン-1受容体アンタゴニスト(IL-1Ra)を、600残基PAS#1アミノ酸反復配列(配列番号38)との融合体としてコードする発現プラスミドを構築する場合、ベクターpASK75-IL1Ra(
図4A)(配列番号49)を、SapIで切断し、エビアルカリホスファターゼ(Thermo Fisher Scientific、ウォルサム、マサチューセッツ州)で脱リン酸化し、600残基PAS#1ポリペプチドをコードする低反復性ヌクレオチド配列カセットに対応するDNA断片とライゲーションし、それを、EarIによる制限消化でプラスミドpXL2-PAS#1f/1c/1b(600)から切り出した。大腸菌(E. coli)XL1-Blue(Bullock (1987) Biotechniques 5:376-378)を形質転換した後、プラスミドDNAを調製し、挿入したDNA断片の存在を、制限分析およびDNA配列決定により確認した。その結果生じたプラスミドを、pASK75-PAS#1f/1c/1b(600)-IL1Ra(配列番号50)と命名した。これは、
図4Bに示されている。
【0325】
[実施例6]
プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子を内包するプラスミドの長期遺伝子安定性試験
プラスミドpASK75-PAS#1f/1c/1b(600)-IL1Ra(配列番号50)の遺伝子安定性を、PAS#1f/1c/1b(600)DNAカセットが、反復性核酸PAS#1a(600)(配列番号12)により置換された誘導体であるpASK75-PAS#1a(600)-IL1Ra(配列番号51)の遺伝子安定性と比較した。この目的を達成するため、大腸菌(E. coli)KS272(Strauch (1988) Proc. Natl. Acad. Sci. USA 85:1576-1580)を、塩化カルシウム法(Sambrook (2001) loc. cit.)を使用して、それぞれのプラスミドで形質転換し、遺伝子発現を誘導せずに、100mL振盪フラスコ中の、100mg/mLアンピシリンで補完した50mlルリアベルターニ(LB)培地で、37℃、170rpmにて7日間培養した。この期間中、細菌細胞を、1日2回(朝および夕)、1:1000稀釈を使用して新しい培地に移した。7日目、およそ70世代にわたって連続的に増殖させた後、培養物を最終的には定常期まで増殖させ、細胞をLB/Amp寒天にプレーティングした。次いで、個々のクローンをピッキングし、LB培地の50mL培養の接種に使用し、定常期まで一晩増殖させた後、Qiagenミニプレップキット(Qiagen、ヒルデン、ドイツ)を使用して、2つのプラスミドの各々につき5つのクローンから、プラスミドDNAを調製し、XbaI/HindIII制限消化により分析した(
図5)。
【0326】
pASK75-PAS#1a(600)-IL1Raの5つの分析したクローンのうち1つのクローンのみが、3093bpおよび2377bpに対応する予想通りのバンドを示した(
図5、レーン1)。2つのクローン(
図5、レーン3および5)は、OmpAおよびIL1Raをコードする遺伝子配列の組合せのおよそのサイズである573bpのバンドを明らかにした。これは、恐らくは組換えにより、反復性PAS#1a(600)配列カセットがほぼ完全に喪失したことを示す。他の2つのクローンは、著しく短縮されたDNA断片を示した(
図5、レーン2および4)。これも、反復性PAS#1a(600)配列カセット内の欠失事象、したがって遺伝子不安定性を示す。対照的に、pASK75-PAS#1f/1c/1b(600)-IL1Raの5つの分析したクローンは全て、3093bpおよび2377bpに予想通りのバンドを明らかにした(
図5、レーン6~10)。これは、プロリン/アラニンリッチアミノ酸反復配列をコードする遺伝子カセットが完全であること、したがって、本発明による低反復性核酸分子の遺伝子プラスミド安定性が高いことを示す。
【0327】
[実施例7]
生理活性タンパク質IL-1Raをコードする発現プラスミドへの、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列のシームレスおよび定方向クローニング。
薬学的応用を目標として、生理活性タンパク質およびプロリン/アラニンリッチアミノ酸反復配列のみを含む融合タンパク質が望まれている。例えば、クローニング用の制限部位を提供または使用するために導入される追加のアミノ酸リンカーが存在しないことにより、臨床使用中の潜在的な免疫応答を防止することができ、および/またはタンパク質レベルでの意図しない相互作用を回避することができる。したがって、ここではPA#1b(200)(配列番号28)を含むDNA断片で例示される低反復性ヌクレオチド配列を、生理活性タンパク質IL1-Ra(Molto (2010) Joint Bone Spine. 77:102-107)をコードする、汎用発現プラスミドpASK75(Skerra (1994) loc. cit.)の誘導体に定方向挿入するためのシームレスクローニング戦略を開発した(
図6)。
【0328】
最初に、IL1-Raの成熟アミノ酸配列(UniProt ID P18510)をコードする合成DNA断片を、遺伝子合成提供業者(Thermo Fisher Scientific、レーゲンスブルク、ドイツ)から得た。この遺伝子断片(配列番号46)は、XbaI制限部位、その次にリボソーム結合部位、OmpAシグナルペプチドをコードするヌクレオチド配列、その次にGCCアラニンコドン、非コード鎖にある第1のSapI認識配列GCTCTTC、GCジヌクレオチドスペーサー、および逆相補的に配向されており、コード鎖でのその認識配列がGCTCTTCである第2のSapI制限配列、その次に成熟IL1Ra(UniProt ID P18510)のコード配列に直接連結されているGCCアラニンコドンを含み、最後にHindIII制限部位がその次に続いていた。
【0329】
この遺伝子断片を、標準的手順(Sambrook (2001) loc. cit.)に従って、隣接する制限部位XbaIおよびHindIIIによりpASk75にクローニングした。その結果生じたプラスミド(
図6Aを参照)をSapIで消化した。それにより、両SapI認識部位を含む小型(24bp)DNAインサートの放出、およびプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子の挿入に理想的に適している、IL-1Raのコードされた成熟N末端の直前の位置に、適合する5’-GCC/5’-GGC粘着末端を有する切断されたベクター骨格がもたらされた(
図6B)。いずれも製造業者の説明書に従って、QIAquickゲル抽出キット(Qiagen、ヒルデン、ドイツ)を使用してベクター断片を単離し、温度感受性アルカリホスファターゼFastAP(Thermo Fisher Scientific、ウォルサム、マサチューセッツ州)で脱リン酸化した後、それを、EarI制限消化により、pXL2-PA#1b(200)(配列番号54)から切り出したPA#1b(200)遺伝子カセットとライゲーションした(
図6C)。その結果生じたプラスミド(配列番号56)は、生理活性タンパク質IL-1Raと融合されたプロリン/アラニンリッチアミノ酸反復配列のみからなる融合タンパク質(配列番号10)の細菌での発現を可能にする(大腸菌(E. coli)の周辺質分泌時のOmpAシグナルペプチドのin vivoプロセシング後)。
【0330】
[実施例8]
遺伝子的に安定なプラスミドpASK75-PAS#1f/1c/1b(600)-IL1Raにコードされた、PAS#1(600)配列とIL-1Raとの融合タンパク質の細菌での産生および精製
8L卓上型発酵槽を使用し、公開されている手順(Schiweck (1995) Proteins 23:561-565)に従って、100mg/Lアンピシリンおよび30mg/Lクロラムフェニコールで補完した合成グルコースミネラル培地を用いて、PAS#1(600)-IL1-Ra融合タンパク質(計算質量:68kDa)を、25℃にて、実施例6の遺伝子的に安定な発現プラスミドpASK75-PAS#1f/1c/1b(600)-IL1Raおよび折り畳みヘルパープラスミドpTUM4(Schlapschy (2006) Protein Eng. Des. Sel. 20:273-284)を内包する大腸菌(E. coli)KS272で産生した。組換え遺伝子発現は、培養がOD550=28に達したら直ちに、500μg/Lアンヒドロテトラサイクリンを添加することにより誘導した(Skerra (1994) loc. cit.)。2.5時間の誘導期間後、遠心分離により細胞を回収し、氷冷の周辺質分画緩衝液(500mMスクロース、1mM EDTA、100mM Tris/HCl pH8.0;1LおよびOD550当たり2ml)に10分間再懸濁した。15mM EDTAおよび250μg/mLリゾチームを添加した後、細胞懸濁物を、氷上で20分間インキュベートし、数回遠心分離し、組換えタンパク質を含む清浄上清を回収した。
【0331】
周辺質抽出物を、4℃にて4回、それぞれ5Lの40mMリン酸Na pH7.5、500mM NaClで透析し、80mlのHisTrap HPカラム(GE Healthcare、フライブルク、ドイツ)を使用して、His6タグにより精製した。タンパク質は、40mMリン酸Na、pH7.5、0.5M NaCl中0から200mMまでのイミダゾール/HCl pH7.5濃度勾配で溶出した。精製したタンパク質を貯留し、5Lの20mM Tris/HCl pH8.0、1mM EDTAで、それぞれ少なくとも6時間4℃にて2回透析した。20mM Tris/HCl pH8.0、1mM EDTAをランニング緩衝液として使用し、Source15Qレジンを充填した60ml XKカラム(GE Healthcare、フライブルク、ドイツ)をAkta purifierシステム(GE Healthcare、フライブルク、ドイツ)に接続して使用て、透析したタンパク質溶液を、陰イオン交換クロマトグラフィーにかけた。タンパク質は、ランニング緩衝液中0から200mMまでのNaCl濃度勾配を使用して溶出した。
【0332】
溶出画分を、10mM MES/HCl pH6.0、1mM EDTAで、それぞれ少なくとも6時間4℃にて2回透析し、その後、36mlのSource15Sレジン(GE Healthcare、フライブルク、ドイツ)を充填したXKカラムを使用して、陽イオン交換クロマトグラフィーにかけた。陽イオン交換クロマトグラフィーは、10mM MES/HCl pH6.0、1mM EDTAをランニング緩衝液として使用して、Akta purifierシステムで実施し、4カラム体積にわたってランニング緩衝液中0から500mMまでのNaCl濃度勾配を使用して、タンパク質を溶出した。PAS#1(600)-IL1-Raを含む溶出タンパク質画分を再び貯留し、5Lリン酸緩衝生理食塩水(PBS:115mM NaCl、4mM KH2PO4、および16mM Na2HPO4 pH7.4)で一晩4℃にて透析し、Amicon Ultra遠心濾過デバイス(30000MWCO;15mL;Millipore、ビルリカ、マサチューセッツ州)を使用して、5mg/mlに濃縮し、PBSで平衡化したHiLoad26/60 Superdex200調製用カラム(GE Healthcare、フライブルク、ドイツ)を使用したサイズ排除クロマトグラフィーでさらに精製した。
【0333】
凝集の徴候がない均質なタンパク質調製物が、1つの8L発酵槽から70mgの最終収量で得られた。タンパク濃度は、15720M
-1cm
-1の計算吸光係数(Gill (1989) Anal. Biochem. 182:319-326)を使用し、280nmの吸収を測定することにより決定した。高モル濃度Tris緩衝液系(Fling (1986) Anal. Biochem. 155:83-88)を使用してSDS-PAGEを実施した(
図7A)。
【0334】
[実施例9]
PAS#1(600)-IL1Ra融合タンパク質のESI-MS分析
実施例8に記載のように産生および精製したPAS#1(600)-IL1Raを、1000倍容積の10mM酢酸アンモニウムpH6.8で2回透析し、陽イオンモードを使用してQ-Tof Ultima機器(Waters、エッシュブロン、ドイツ)で、ESI質量分析法により分析した。PA#1(600)-IL1Ra融合タンパク質のデコンボリューションスペクトルは、67994.8Daの質量を明らかにした。これは、67994.8Daの計算質量と本質的に一致する(
図7B)。これは、遺伝子的に安定な発現プラスミドpASK75-PAS#1f/1c/1b(600)-IL1Raを使用して、大腸菌(E. coli)にて、PA#1(600)-IL1Ra融合タンパク質全体を効率的に産生することができることを明らかに示す。
【0335】
[実施例10]
プロリン/アラニンリッチアミノ酸反復ポリペプチドを大腸菌(E. coli)で産生するための遺伝子的に安定なプラスミドであるpASK37-MP-PA#1d/1c/1b(600)の構築
純粋なPA#1(600)ポリペプチドをコードする安定な発現プラスミドを構築するため、100pmolのプライマーNdeI-MP-SapI-HindIIIfw(配列番号4)およびNdeI-MP-SapI-HindIIIrev(配列番号5)をリン酸化し、混合し、80℃まで10分間加熱し、ゆっくりと一晩かけて室温に冷却して、ハイブリダイゼーションを可能にした。その結果生じた二本鎖DNA断片は、NdeIおよびHindIII突出に適合する粘着末端を示した。プラスミドpASK37(Skerra (1991) loc. cit)を、NdeIおよびHindIIIで切断し、骨格断片を、ハイブリダイズされたプライマーとライゲーションした。
【0336】
その結果生じたプラスミドをSapIで消化した。それにより、2つのSapI認識部位を含む小型(24bp)インサートの放出、および適合する粘着5’-GCC/5’-GGC末端を有する切断されたベクター骨格がもたらされた。これら粘着末端は、プロリンコドンCCAがその後にあるN末端開始メチオニンコドン(ATG)のすぐ下流の位置に、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を挿入するのに理想的に適しており、それにより効率的な翻訳開始が可能になることを見出した。製造業者の説明書に従って、QIAquickゲル抽出キットを使用してベクター断片を単離し、温度感受性アルカリホスファターゼFastAPで脱リン酸化した後、それを、EarI制限消化によりpXL2-PA#1d/1c/1b(600)から切り出した低反復性遺伝子カセットPA#1d/1c/1b(600)(配列番号42)とライゲーションした。その結果生じたプラスミド(配列番号53)は、プロリン/アラニンリッチアミノ酸反復配列を含むポリペプチドの発現を可能にする(
図8A)。
【0337】
[実施例11]
遺伝子的に安定なプラスミドpASK37-MP-PA#1d/1c/1b(600)にコードされたPA#1(600)ポリペプチドの細菌発現および精製
N末端に追加のPro残基およびC末端に追加のAla残基を有するPA#1(600)ポリペプチド(計算質量:48302Da)を、実施例10に記載の発現プラスミドpASK37-PA#1d/1c/1b(600)を内包する大腸菌(E. coli)KS272の細胞質中で産生した。pASK37-PA#1d/1c/1b(600)で形質転換された大腸菌(E. coli)KS272のコロニーを、1w/v%グルコースおよび100mg/Lアンピシリンで置換された、無菌13mLポリプロピレンチューブ(Sarstedt、ニュームブレヒト、ドイツ)中の4ml LB培地に接種し、37℃、170rpmで一晩増殖させた。細菌でのタンパク質産生は、2.5g/LのD-グルコースおよび100mg/Lのアンピシリンで補完された2Lテリフィックブロス(TB)培地(Sambrook (2001) loc. cit.)を有する5L振盪フラスコで30℃にて実施した。
【0338】
大腸菌(E. coli)培養に2mlの一晩培養物を接種し、細胞を一晩増殖させ、OD550=5になったら、イソプロピル-β-D-チオガラクトピラノシド(IPTG)を、0.5mMの終濃度になるまで添加することにより、組換え遺伝子発現を誘導した。誘導3時間後に細菌を回収し、20mlの40mMリン酸Na pH7.2、1mM EDTAに再懸濁し、フレンチプレスセル(Thermo Scientific、ウォルサム、マサチューセッツ州)を使用して溶菌した。溶菌物を遠心分離(17,000rpm、1時間、4℃)した後、封入体は観察されなかった。可溶性PA#1(600)ポリペプチドを含む上清を、室温で連続撹拌しながら20w/v%の終濃度になるまで固体(NH4)2SO4を段階的に添加することによる硫酸アンモニウム析出法にかけた。上清を、室温で20分間、17,000rpmで遠心分離した。析出したPA#1(600)ポリペプチドを含む沈殿物を、20mM Tris/HCl pH8.0に溶解し、溶液を遠心分離し(13,000rpm、10分間、室温)、不溶性狭雑物を除去した。
【0339】
純粋な酢酸(Sigma-Aldrich、シュタインハイム、ドイツ)を、1v/v%の終濃度になるまで添加し、13,000rpmで10分間遠心分離することにより不純物を沈殿させた。ほとんど純粋なPA#1(600)ポリペプチドを含む上清を、100倍容積の1v/v%酢酸で4℃にて一晩透析した。残留不純物を除去するため、1v/v%酢酸をランニング緩衝液として使用し、1mlのSource15Sカラム(GE Healthcare、フライブルク、ドイツ)をAkta purifierシステムに接続して使用して、透析したタンパク質を、サブトラクティブ陽イオン交換クロマトグラフィーにかけた。
【0340】
各精製ステップの試料を、高モル濃度Tris緩衝液系(Fling (1986) loc. cit.)を使用して、SDS-PAGEにより分析した。SDS-PAGE後に、ゲルを、まず、PEGの分析について記載されているように(Kurfurst (1992) Anal. Biochem. 200:244-248)ヨウ化バリウムで染色した。手短に言えば、ポリアクリルアミドゲルを水ですすいだ後、2.5w/v%のBaI
2(ヨウ化バリウム二水和物;Sigma-Aldrich、シュタインハイム、ドイツ)水溶液中で5分間インキュベートした。水ですすいだ後、ゲルを、ルゴール溶液(水中の、10w/v%のp.a.等級KI(AppliChem、ダルムシュタット、ドイツ 5%のp.a.等級I
2(Riedel de Haen AG、ゼールツェ、ドイツ))に5分間移した。10v/v%酢酸で脱染色した後、オレンジ色のPA#1(600)ポリペプチドバンドが視覚化された(
図8B)。その後、ゲルを水で脱染色し、10%酢酸(Honeywell Specialty Chemicals、ゼールツェ、ドイツ)、65%H
2O、および25%イソプロパノール(CLN、ニーダーフンメル、ドイツ)に溶解したクーマシーブリリアントブルーR250(Applichem)による第2の染色にかけた。10v/v%酢酸で脱染色した後、青色タンパク質バンド(宿主細胞タンパク質の)が視覚化された(
図8C)。
【0341】
[実施例12]
純粋なPA#1(600)ポリペプチドのESI-MS分析
5mg/mL濃度の実施例11の単離されたPA#1(600)ポリペプチドの200μlを、2v/v%アセトニトリル、1v/v%ギ酸をランニング緩衝液として使用して、Akta purifierシステムに接続された1mL Resource RPCカラム(GE Healthcare、フライブルク、ドイツ)にアプライした。タンパク質は、20カラム体積にわたって2v/v%アセトニトリル、0.1v/v%ギ酸から80v/v%アセトニトリル、0.1v/v%ギ酸までのアセトニトリル勾配を使用して溶出した。溶出したタンパク質は、そのまま、陽イオンモードを使用してQ-Tof Ultima機器でESI質量分析により分析した。PA#1(600)ポリペプチドのデコンボリューションスペクトルは、48301.78Daの質量を明らかにした。これは、N末端に追加のPro残基およびC末端に追加のAla残基を有するが、開始メチオニンを欠如するPA#1(600)ポリペプチドの計算質量(48301.4Da)と本質的に一致する(
図8D)。これは、遺伝子的に安定なヌクレオチド配列によりコードされた純粋なPA#1(600)ポリペプチド(親和性タグを有していない)を、その完全な形態で大腸菌(E. coli)において産生させることができることを明らかに示す。
【0342】
[実施例13]
プロリン/アラニンリッチアミノ酸配列をコードするヌクレオチド配列の反復分析
プロリン/アラニンリッチ配列をコードする核酸分子の品質を、ヌクレオチド配列反復の頻度(出現)に関して評価するための尺度として、本発明者らは、以下の数式により算出されるヌクレオチド反復スコア(NRS)を考案した。
【0343】
【0344】
この数式中、Ntotは、分析するヌクレオチド配列の全長さであり、nは、分析するヌクレオチド配列内の配列反復の長さであり、頻度fi(n)は、この配列反復の出現数である。同じ長さnを有するいくつかの異なる配列反復が存在する場合、これらの異なる配列反復は、インデックスiにより区別され、同じ長さnを有する異なる配列反復の数は、k(n)である。1つのタイプの長さnを有する配列反復しか存在しない場合、k(n)は1と等しい。NRSは、反復長の二乗の和に、それぞれの全体頻度の平方根をかけ、それを、分析するヌクレオチド配列の全長で除算したものと定義される。NRSの算出に考慮される最小反復長は、4つのヌクレオチドを含み、1つのコドントリプレットよりも長い全てのヌクレオチド配列を含み、最大で、Ntot-1までの範囲であり、つまり、分析するヌクレオチド配列に1回よりも多く出現し得る最も長いヌクレオチド配列反復の長さである。
【0345】
この状況では、用語「反復」は、ヌクレオチド配列が、分析するヌクレオチド配列内に少なくとも2回出現することを意味する。頻度を計数する場合、本発明者らは、少なくとも2回出現する同一配列を有するヌクレオチド伸長、ならびに各々がまた少なくとも2回出現する同じ長さの異なる配列を有するヌクレオチド伸長を両方とも考慮した。例えば、14量体反復の全体頻度が5である場合、これは、同じ14量体ヌクレオチド伸長が5回出現するか、または1つの14量体ヌクレオチド配列が、分析するヌクレオチド配列に2回出現し、1つの異なる14個ヌクレオチド配列が3回出現するかのいずれかを意味する。
【0346】
さらに、より長いヌクレオチド配列反復内に含まれているより短い反復は、各々が別々に計数される。例えば、分析するヌクレオチド配列が、2つのGCACCヌクレオチド伸長(すなわち、反復)を含む場合、GCACおよびCACC反復も、それらが前記GCACCヌクレオチド伸長内に、または恐らくは加えて、分析するヌクレオチド配列内の他所に出現するか否かに関わらず、個々に数えられる。なお、核酸分子のコード鎖の反復のみが考慮される。
【0347】
当業者であれば、手作業で、またはhttp://www.visualgenedeveloper.netでダウンロードで入手可能なVisual Gene Developer(Jung (2011) loc. cit.)、もしくはhttp://zlab.bu.edu/repfindで利用可能なRepfindツール等(Betley (2002) loc. cit)の一般ソフトウェアプログラムの支援を受けてのいずれかで、ヌクレオチド配列反復を特定することができる。しかしながら、全てのアルゴリズムが、各種の反復を検出するとは限らず、例えば、Visual Gene Developerの結果は、オーバーラップ反復を含まない。したがって、ソフトウェアツールの結果を点検し、必要に応じて、手作業で修正しなければならない。あるいは、実施例14に記載のNRSカリキュレータと称するアルゴリズムを使用して、ヌクレオチド配列反復を明確に特定し、自動的にNRSを算出してもよい。
【0348】
当技術分野では、プロリン/アラニンリッチアミノ酸配列をコードする天然核酸ならびにある合成核酸が知られている。しかしながら、それらの配列は全て、下記に記載されているNRS分析で明らかに明白になるように、遺伝子レベルで高度に反復性であり、したがって、それらの生物工学的および/または生物薬学的な応用への使用には制限がある。
【0349】
プロリン/アラニンリッチアミノ酸配列をコードするいくつかの従来技術のヌクレオチド配列を、実施例14に記載のNRSカリキュレータを使用して、本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子と比較した:国際公開第2008/155134号パンレットに開示されているヌクレオチド配列PAS#1a(200)(配列番号11)(
図9A)、国際公開第2011144756号パンフレットに開示されているヌクレオチド配列PA#1a(200)(配列番号14)(
図9B)、米国特許出願公開第20060252120号明細書に開示されている[(AP)
5]
20APA糖モジュール(配列番号16)をコードするヌクレオチド配列(
図9C)、GenBank受託番号DQ399411.1として公開されている糖モジュール[AAPAPAPAP]
10AS(配列番号17)をコードする合成遺伝子構築物のヌクレオチド配列(
図9D)、GenBank受託番号NP_851896として公開されている、マカクヘルペスウイルス(macacine herpesvirus)1の大型テグメントタンパク質内のプロリン/アラニンリッチ配列をコードする225ヌクレオチド配列(配列番号18)(
図9E)、本発明による低反復性ヌクレオチド配列PAS#1b(200)(配列番号19)(
図9F、G)、および本発明による低反復性ヌクレオチド配列PA#1e/1d/1c/1b(800)(配列番号44)(
図9H、I)。
【0350】
算出された反復頻度を、Kaleidagraph V3.6ソフトウェア(Synergy Software、レディング、ペンシルベニア州)を使用して、それぞれの反復長に対してプロットした(
図9)。従来技術のヌクレオチド配列の全てのヒストグラムは、高度に反復性の性質を明らかにするが、これは、高頻度を示すバーが多数あり、反復長は、非常に長い反復まで幅広い分布を有することにより示されている。特筆すべきことには、これらの場合では、反復頻度は、反復長が長くなると共にゆっくりとしか減少しない(
図9A~E)。対照的に、本発明による低反復性ヌクレオチド配列PAS#1b(200)およびPA#1e/1d/1c/1b(800)のヒストグラムは、ほんの少数の反復しか示さず、最大長は14ヌクレオチドであり、それらの頻度は、より短い反復からより長い反復に移行するときに、急激に減少してゼロになる(
図9F、G、H、I)。
【0351】
従来技術のヌクレオチド配列と本発明の低反復性ヌクレオチド配列との間の反復性の差異は、それらのヌクレオチド反復スコアを比較すると、さらにより明白になる。従来技術の配列は全て、80000を超えるNRSを明らかにするが(表2)、600ヌクレオチド配列PAS#1b(200)および2400ヌクレオチド配列PA#1e/1d/1c/1b(800)は、それぞれ、わずか13および14のNRS値を示す(表1)。これは、本発明によるプロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列の反復品質が、従来技術の配列と比較してはるかにより高く、ヌクレオチド配列反復が、より少数であり、かつより短いことを明らかに示す。
【0352】
【0353】
【0354】
【0355】
【0356】
【0357】
【0358】
【0359】
【0360】
【0361】
【0362】
【0363】
【0364】
【0365】
[実施例14]
ヌクレオチド配列反復を明確に特定し、ヌクレオチド反復スコアを算出するためのアルゴリズムであるNRSカリキュレータ
Visual Gene Developer(Jung (2011) loc. cit)またはRepfindツール(Betley (2002) loc. cit)等の一般的に利用可能なソフトウェアプログラムは、必ずしも信頼性高く作動するとは限らず、分析するヌクレオチド配列内にある全ての配列反復を正確に算出するためには、手作業による修正が必要となる場合がある。加えて、反復は、手作業で計数しなければならず、NRSは、実施例13に記載の数式により別々に算出しなければならない。明確な結果を産出するアルゴリズムを提供するための、およびNRSの算出を容易にするための、NRSカリキュレータと称する簡単なPythonスクリプトをここに記載する。このスクリプトは、ランタイム環境Python2.7.10(http://www.python.org)で実行され、ドットマトリックス配列比較に基づき、潜在的に長いヌクレオチド配列内にある、オーバーラップ反復を含む全ての順方向反復を、ギャップを考慮せずに特定する。ドットマトリックス配列比較は、当業者に周知の方法であり、例えば、Mount (2004) Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory Press, 2nd edition, New York等の一般的なバイオインフォマティクスの教科書に記載されている。
【0366】
NRSカリキュレータは、各反復長の頻度を計数し、実施例13に記載の数式に従ってNRSを自動的に算出する。NRSカリキュレータスクリプトを実行するために、ランタイム環境Pythonバージョン2.7.10を、https://www.python.org/downloadsからダウンロードし、Windows7オペレーティングシステムを実行するThinkPad L530ノートブック(Lenovo、シュツットガルト、ドイツ)にインストールした。Microsoft Windows Editorバージョン6.1を使用して、下記に記載されているNRSカリキュレータスクリプトを、NRScalculator.pyと命名したプレーンテキストファイルとして保存した。分析しようとするヌクレオチド配列を、sequence.fasという名前のFASTAファイルとして、同じフォルダー内に保存した。その後、コマンドラインシェルを開き、NRScalculator.pyおよびsequence.fasファイルを両方とも含むディレクトリーを選択した。計算を開始させるために、以下のコマンドラインを実行した。
c:\user\admin\NRSfolder>c:\Python27\python.exe NRScalculator.py sequence.fas
【0367】
このコマンドは、2列のスクリーン出力をもたらした。左側の列は、反復長(長さ)を示し、右側の(第2の)列は、それぞれの反復頻度(頻度)を示す。加えて、NtotおよびNRS(端数のない整数)は、それぞれ、出力の始めおよび終わりに記載されていた。
【0368】
NRSカリキュレータスクリプト:
【0369】
【0370】
【0371】
NRSカリキュレータの例示的な出力:
【0372】
【0373】
[実施例15]
治療用のPA#1(600)-IL1Ra融合タンパク質を細菌で産生するための遺伝子的に安定な発現ベクターであるpASK75-PA#1d/1c/1b(600)-IL1Raの構築
インターロイキン-1受容体アンタゴニスト(IL-1Ra)を、600残基PA#1アミノ酸反復配列との融合体としてコードする発現プラスミドを構築するために、ベクターpASK75-IL1Ra(
図4A)(配列番号49)を、SapIで切断し、エビアルカリホスファターゼ(Thermo Fisher Scientific、ウォルサム、マサチューセッツ州)で脱リン酸化し、600残基PA#1ポリペプチドをコードする低反復性ヌクレオチド配列カセットに対応するDNA断片とライゲーションし、それを、SapIでの制限消化によりプラスミドpXL1-PA#1d/1c/1b(600)(配列番号79)から切り出した。大腸菌(E. coli)XL1-Blue(Bullock (1987) loc. cit.)を形質転換した後、プラスミドDNAを調製し、挿入したDNA断片の存在を、制限分析およびDNA配列決定により確認した。その結果生じたプラスミドを、pASK75-PA#1d/1c/1b(600)-IL1Ra(配列番号77)と命名した。それは
図10に示されている。
【0374】
[実施例16]
プロリン/アラニンリッチアミノ酸反復配列をコードする低反復の核酸分子PA#1d/1c/1b(600)を内包するプラスミドpASK75-PA#1b/1c/1b(600)-IL1Raの長期遺伝子安定性試験
プラスミドpASK75-PA#1d/1c/1b(600)-IL1Ra(配列番号77)の遺伝子安定性を、PA#1d/1c/1b(600)DNAカセットが、反復性核酸PA#1a(600)(配列番号80)により置き換えられた誘導体であるpASK75-PA#1a(600)-IL1Ra(配列番号78)の遺伝子安定性と比較した。この目的を達成するため、大腸菌(E. coli)JM83(Yanisch-Perron C. (1985) loc. cit.)を、塩化カルシウム法(Sambrook (2001) loc. cit.)を使用して、それぞれのプラスミドで形質転換し、遺伝子発現を誘導せずに、100mL振盪フラスコ中の、100mg/Lアンピシリンで補完した50mlルリアベルターニ(LB)培地で、37℃、170rpmにて7日間培養した。この期間中、細菌細胞を、1日2回(朝および夕)、1:1000稀釈を使用して新しい培地に移した。7日目、およそ70世代にわたって連続的に増殖させた後、培養物を最終的には定常期まで増殖させ、細胞をLB/Amp寒天にプレーティングした。その後、2つのプラスミドの各々の10個の個々のクローンをピッキングし、各々を、LB/Amp培地の50mL培養の接種に使用し、定常期まで一晩増殖させた後、Qiagenミニプレップキット(Qiagen、ヒルデン、ドイツ)を使用して、プラスミドDNAを調製し、XbaI/HindIII制限消化により分析した(
図11)。
【0375】
pASK75-PA#1a(600)-IL1Raの10個の分析したクローンのうち6つのみが、3093bpおよび2377bpに対応する予想通りのバンドを示した(
図11A、レーン1、3、4、5、7、および8)。4つのクローンは、著しく短縮されたDNA断片を示した(
図11A、レーン2、6、9、および10)。これは、反復性PA#1a(600)配列カセット内の欠失、したがって遺伝子不安定性を示す。対照的に、pASK75-PA#1d/1c/1b(600)-IL1Raの10個の分析したクローンは全て、3093bpおよび2377bpに予想通りのバンドを明らかにした(
図11B、レーン1~10)。これは、プロリン/アラニンリッチアミノ酸反復配列をコードする遺伝子カセットが完全であること、したがって、本発明による低反復性核酸分子の遺伝子プラスミド安定性が高いことを示す。
【0376】
[実施例17]
プロリン/アラニンリッチアミノ酸反復配列と融合されたヒトレプチンを細菌で産生するための遺伝子的に安定な発現ベクターの構築。
600残基PA#1アミノ酸反復配列(配列番号82)とN末端で融合されたヒトレプチン(huLeptin)をコードする発現プラスミドを構築するために、ベクターpASK37-MP-huLeptin(
図12A)(配列番号81)を、SapIで切断した。それにより、両SapI認識部位を含む小型(24bp)DNAインサートの切除、およびヒトレプチンのコードされた成熟N末端のすぐ上流の位置に、適合する5’-GCC/5’-GGC粘着末端を有する切断されたベクター骨格がもたらされた。これら粘着末端は、プロリンコドンCCAがその後にあるN末端開始メチオニンコドン(ATG)のすぐ下流の位置に、プロリン/アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を挿入するのに理想的に適しており、それにより効率的な翻訳開始が可能になることを見出した。いずれも製造業者の説明書に従って、QIAquickゲル抽出キット(Qiagen、ヒルデン、ドイツ)を使用してベクター断片を単離し、温度感受性アルカリホスファターゼFastAP(Thermo Fisher Scientific、ウォルサム、マサチューセッツ州)で脱リン酸化した後、プラスミドを、SapIでの制限消化によりプラスミドpXL1-PA#1d/1c/1b(600)(配列番号79)から切り出した、600残基PA#1bポリペプチドをコードする低反復性ヌクレオチド配列カセットに対応するDNA断片とライゲーションした。大腸菌(E. coli)XL1-Blue(Bullock (1987) loc. cit.)を形質転換した後、プラスミドDNAを調製し、挿入したDNA断片の存在を、制限分析およびDNA配列決定により確認した。その結果生じたプラスミドを、pASK37-MP-PA#1d/1c/1b(600)-huLeptin(配列番号82)と命名した。それは
図12Bに示されている。同じ様式で、
図12Cに示されている600残基PAS#1アミノ酸反復配列とN末端で融合されたヒトレプチン(huLeptin)をコードする発現プラスミドである、pASK37-MP-PAS#1f/1c/1b(600)-huLeptin(配列番号83)を、プラスミドpASK37-MP-huLeptin(
図12A)(配列番号81)に、pXL1-PAS#1f/1c/1b(配列番号84)から切り出した低反復性ヌクレオチド配列PAS#1f/1c/1b(配列番号38)を挿入することにより構築した。同様のクローニング戦略を適用して、プロリン/アラニンリッチアミノ酸反復配列とC末端で融合された型のレプチンを構築することができる。
【0377】
[実施例18]
遺伝子的に安定なプラスミドpASK37-PA#1d/1c/1b(600)hu-Leptin(W100Q)にコードされた、プロリン/アラニンリッチアミノ酸反復配列とヒトレプチン突然変異との融合タンパク質の細菌での産生、精製、および特徴付け
成熟アミノ酸配列の100位にトリプトファンからグルタミンへの置換を有するヒトレプチン突然変異体(UniProtKB受託コードP41159)とプロリン/アラニンリッチアミノ酸反復配列PA#1(600)(配列番号85)との融合タンパク質であるPA#1(600)-huLeptin(W100Q)(計算質量:64.25kDa)を、trxB、gor、およびahpC突然変異により酸化性細胞質を有する大腸菌(E. coli)菌株(Bessette (1999) Proc. Natl. Acad. Sci. USA 96:13703-13708)であるOrigami B(Novagene/Merck Millipore、ビルリカ、マサチューセッツ州)の細胞質において30℃で産生した。この目的を達成するため、1w/v%のD-グルコースおよび100mg/Lのアンピシリンで補完した、無菌13mLポリプロピレンチューブ(Sarstedt、ニュームブレヒト、ドイツ)中の4ml LB培地に、遺伝子的に安定な発現プラスミドpASK37-MP-PA#1d/1c/1b(600)-huLep(W100Q)(配列番号86)で形質転換した大腸菌(E. coli)Origami Bのコロニーを接種した。細菌細胞を、30℃にて170rpmの振盪器で一晩増殖させた。
【0378】
細菌でのタンパク質産生は、2mlの大腸菌(E. coli)一晩培養物を接種した、2.5g/LのD-グルコースおよび100mg/Lのアンピシリンで補完された2Lテリフィックブロス(TB)培地(Sambrook (2001) loc. cit.)を有する5Lバッフルフラスコで30℃にて実施した。細菌細胞を30℃で増殖させ、OD550=0.85になったら、イソプロピル-β-D-チオガラクトピラノシド(IPTG)を、0.5mMの終濃度になるまで添加することにより、組換え遺伝子発現を誘導した。誘導の19時間後に細菌を回収し、細菌細胞湿重量1g当たり3mlのPBS/E(10mM EDTAで補完されたPBS)に再懸濁し、Panda細胞破砕器(GEA、パルマ、イタリア)を使用して溶菌した。溶菌物を遠心分離(20,000rpm、30分間、4℃)した後、封入体は観察されなかった。1mMの2,2’-ジチオジピリジンを上清に添加して、組換えレプチンのジスルフィド架橋形成を促進させた。可溶性レプチン融合タンパク質を含む上清を、100倍容積のPBSで一晩4℃にて透析した。その後、1Mの(NH4)2SO4の終濃度に到達するまで連続的に撹拌しながら4Mの(NH4)2SO4(水に溶解した)を滴加することにより、融合タンパク質を、室温で析出させた。室温にて20分間17,000rpmで遠心分離した後、析出したPA#1(600)-hu-Leptin(W100/Q)融合タンパク質を含む沈殿物を、PBSに溶解し、溶液を遠心分離(13,000rpm、10分間、室温)して、不溶性狭雑物を除去した。
【0379】
PA#1(600)-hu-Leptin(W100Q)融合タンパク質を、5Lの20mM Tris/HCl pH8.5で2回、各々少なくとも6時間4℃にて透析した。次いで、ランニング緩衝液として20mM Tris/HCl pH8.5を使用し、6mlのResourceQカラム(GE Healthcare、フライブルク、ドイツ)をAkta purifierシステム(GE Healthcare、フライブルク、ドイツ)に接続して使用して、タンパク質溶液を、陰イオン交換クロマトグラフィーにかけた。その後、融合タンパク質を、NaCl濃度勾配を使用して溶出した。溶出画分を収集し、PBSで平衡化したSuperdex 200 HR10/300カラム(GE Healthcare、フライブルク、ドイツ)を使用して、サイズ排除クロマトグラフィーでさらに精製した。
【0380】
この手順により、凝集の徴候がない均質なタンパク質調製物が、0.8mg/L細菌培
養の最終収量で得られた。タンパク濃度は、8605M
-1cm
-1の計算吸光係数(Gi
ll (1989) loc. cit.)を使用して、280nmの吸光を測定することにより決定した。
10%高モル濃度Tris緩衝液系(Fling (1986) loc. cit.)を使用してSDS-PA
GEを実施した(
図13A)。溶出したタンパク質を、10000倍容積の10mM酢酸
アンモニウムpH5.5で2回透析し、陽イオンモードを使用してmaXis Q-TO
F機器(Bruker Daltonics、ブレーメン、ドイツ)で、ESI質量分析
により分析した。PA#1(600)-hu-Leptin(W100Q)のデコンボリ
ューションスペクトルは、64249.53Daの質量を明らかにした(
図13B)。こ
れは、この融合タンパク質の計算質量(64249.80Da)と本質的に一致する。こ
れは、本発明による遺伝子的に安定な低反復性核酸分子によりコードされたPA#1(6
00)-hu-Leptin(W100Q)融合タンパク質を、その完全な形態で大腸菌
(E. coli)にて産生させることができることを明らかに示す。
本発明は以下の態様を含む。
<1>
プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌク
レオチド配列を含む核酸分子であって、
前記核酸の前記ヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、
前記ヌクレオチド配列が、50,000未満のヌクレオチド反復スコア(NRS)を有
し、
前記ヌクレオチド反復スコア(NRS)が、数式:
【数1】
により決定され、式中、
N
tot
は、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i
(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記
異なる配列の数であり、そうでなければ、前記長さnの反復についてk(n)は1である
、核酸分子。
<2>
前記コードされたポリペプチドが、プロリンおよびアラニンからなる、<1>に記載の核酸分子。
<3>
前記プロリン残基が、前記コードされたポリペプチドの約10%超および約75%未満を構成する、<2>に記載の核酸分子。
<4>
前記コードされたポリペプチドが、プロリン、アラニン、およびセリンからなる、<1>に記載の核酸分子。
<5>
前記プロリン残基が、前記コードされたポリペプチドの4%超および40%未満を構成する、<4>に記載の核酸分子。
<6>
前記ヌクレオチド反復スコア(NRS)が、100未満である、<1>~<5>のいずれかに記載の核酸分子。
<7>
前記ヌクレオチド反復スコア(NRS)が、50未満である、<1>~<6>のいずれかに記載の核酸分子。
<8>
前記ヌクレオチド反復スコア(NRS)が、35未満である、<1>~<7>のいずれかに記載の核酸分子。
<9>
前記核酸の前記ヌクレオチド配列が、少なくとも900ヌクレオチドの長さを有する、<1>~<8>のいずれかに記載の核酸分子。
<10>
増強された遺伝子安定性を有する、<1>~<9>のいずれかに記載の核酸分子。
<11>
前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長n
max
を有し、n
max
が、数式:
【数2】
により決定され、式中、N
tot
が、前記ヌクレオチド配列の長さである、<1>~<10>のいずれかに記載の核酸分子。
<12>
前記反復が、約14、15、16、または17ヌクレオチドから約55ヌクレオチドまでの最大長を有する、<1>~<11>のいずれかに記載の核酸分子。
<13>
前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を
含み、9個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを
形成する、<1>~<12>のいずれかに記載の核酸分子。
<14>
(a)配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配
列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号87
、配列番号88、配列番号89、配列番号90、配列番号91、配列番号92、配列番号
93、配列番号94、配列番号95、配列番号96、配列番号97、配列番号98、配列
番号99、配列番号100、配列番号101、配列番号102、配列番号103、配列番
号104、配列番号105、配列番号106、配列番号107、配列番号108、配列番
号109、配列番号110、配列番号111、配列番号112、配列番号113、配列番
号114、配列番号115、配列番号116、配列番号117、配列番号118、配列番
号119、配列番号120、配列番号121、配列番号122、配列番号192、および
配列番号193からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸
分子;
(b)配列番号42、配列番号43、配列番号44、配列番号45、配列番号153、
配列番号154、配列番号155、配列番号156、配列番号157、配列番号158、
配列番号159、配列番号160、配列番号161、配列番号162、配列番号163、
配列番号164、配列番号165、配列番号166、配列番号167、配列番号168、
配列番号169、配列番号170、配列番号171、配列番号172、および/または配
列番号173からなるヌクレオチド配列を含む核酸分子;
(c)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェント
な条件下でハイブリダイズする核酸分子;
(d)(a)、(b)、および(c)のいずれか1つで規定されるヌクレオチド配列と
少なくとも66.7%の同一性を有するヌクレオチド配列を含む核酸分子;ならびに
(e)(a)または(b)で規定されるヌクレオチド配列に対する遺伝子コードの結果
として縮重している核酸分子
からなる群から選択される、<1>~<3>および<6>~<13>のいずれかに記載の核酸分子。
<15>
(a)配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配
列番号24、配列番号25、配列番号26、配列番号27、配列番号123、配列番号1
24、配列番号125、配列番号126、配列番号127、配列番号128、配列番号1
29、配列番号130、配列番号131、配列番号132、配列番号133、配列番号1
34、配列番号135、配列番号136、配列番号137、配列番号138、配列番号1
39、配列番号140、配列番号141、配列番号142、配列番号143、配列番号1
44、配列番号145、配列番号146、配列番号147、配列番号148、配列番号1
49、配列番号150、配列番号151、配列番号152、配列番号194、および配列
番号195からなる群から選択される少なくとも1つのヌクレオチド配列を含む核酸分子
;
(b)配列番号38、配列番号39、配列番号40、配列番号41、配列番号174、
配列番号175、配列番号176、配列番号177、配列番号178、配列番号179、
配列番号180、配列番号181、配列番号182、配列番号184、配列番号185、
配列番号186、配列番号187、配列番号188、配列番号189、配列番号190、
および配列番号191からなる群から選択されるヌクレオチド配列を含む核酸分子;
(c)(a)または(b)で規定されるヌクレオチド配列の相補鎖にストリンジェント
な条件下でハイブリダイズする核酸分子;
(d)(a)、(b)、および(c)のいずれか1つで規定されるヌクレオチド配列と
少なくとも56%の同一性を有するヌクレオチド配列を含む核酸分子;
(e)(a)または(b)で規定されるヌクレオチド配列に対する遺伝子コードの結果
として縮重している核酸分子
からなる群から選択される、<1>および<4>~<13>のいずれかに記載の核酸分子。
<16>
生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結さ
れた、<1>~<15>のいずれかに記載の核酸分子。
<17>
前記生理活性タンパク質が、治療上有効なタンパク質である、<16>に記載の核酸分子。
<18>
前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホ
ルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大50個のアミノ酸残基から
なるペプチド、またはペプチド模倣体からなる群から選択される、<16>または<17>に記載の核酸分子。
<19>
前記結合タンパク質が、抗体、Fab断片、Fab’断片、F(ab’)
2
断片、単鎖
可変断片(scFv)、(単一)ドメイン抗体、抗体の単離された可変領域(VL領域お
よび/またはVH領域)、CDR、免疫グロブリンドメイン、CDR由来ペプチド模倣体
、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメ
イン、プロテインAドメイン、SH3ドメイン、アンキリン反復ドメイン、およびリポカ
リンからなる群から選択される、<18>に記載の核酸分子。
<20>
前記生理活性タンパク質が、インターロイキン1受容体アンタゴニスト、レプチン、酸
性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルフ
ァ-1アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ-ガラクト
シダーゼ、アルファ-グルコシダーゼ、アルファ-N-アセチルグルコサミニダーゼ、ア
ルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗HIVペプチド融合阻害
剤、アルギニンデイミナーゼ、アスパラギナーゼ、Bドメイン欠損第VIII因子、骨形
態形成タンパク質、ブラジキニンアンタゴニスト、B型ナトリウム利尿ペプチド、ブーガ
ニン、成長ホルモン、絨毛性ゴナドトロピン、CD3受容体アンタゴニスト、CD19ア
ンタゴニスト、CD20アンタゴニスト、CD40アンタゴニスト、CD40Lアンタゴ
ニスト、セレブロシドスルファターゼ、凝固第VIIa因子、凝固第XIII因子、凝固
第IX因子、凝固第X因子、補体成分C3阻害剤、補体成分5aアンタゴニスト、C-ペ
プチド、CTLA-4アンタゴニスト、C型ナトリウム利尿ペプチド、ディフェンシン、
デオキシリボヌクレアーゼI、EGFR受容体アンタゴニスト、上皮成長因子、エリスロ
ポエチン、エキセンディン-4、エズリンペプチド1、FcγIIB受容体アンタゴニス
ト、線維芽細胞成長因子21、卵胞刺激ホルモン、胃抑制ポリペプチド(GIP)、GI
P類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド1(GLP
-1)、GLP-1類似体、グルカゴン様ペプチド2(GLP-2)、GLP-2類似体
、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモン
アンタゴニスト、gp120、gp160、顆粒球コロニー刺激因子(G-CSF)、顆
粒球マクロファージコロニー刺激因子(GM-CSF)、グレリン、グレリン類似体、成
長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子
受容体(HGFR)アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、H
er2/neu受容体アンタゴニスト、ヒストレリン、ヒルジン、hsp70アンタゴニ
スト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異
的酵素、イズロネート-2-スルファターゼ、IgEアンタゴニスト、インスリン、イン
スリン類似体、インスリン様成長因子1、インスリン様成長因子2、インターフェロン-
アルファ、インターフェロン-アルファアンタゴニスト、インターフェロン-アルファス
ーパーアゴニスト、インターフェロン-アルファ-n3、インターフェロン-ベータ、イ
ンターフェロン-ガンマ、インターフェロン-ラムダ、インターフェロンタウ、インター
ロイキン、インターロイキン2融合タンパク質、インターロイキン-22受容体サブユニ
ットアルファ(IL-22ra)アンタゴニスト、イリシン、島ネオゲネシス関連タンパ
ク質、ケラチノサイト成長因子、Kv1.3イオンチャネルアンタゴニスト、ランチペプ
チド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダ
ーゼ、N-アセチルガラクトサミン-6-スルファターゼ、N-アセチルグルコサミニダ
ーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω-コノトキシン、オルニ
トドロス・モウバタ(Ornithodoros moubata)補体阻害剤、骨形成タンパク質-1、オス
テオプロテゲリン、シュウ酸デカルボキシラーゼ、P128、副甲状腺ホルモン、フィロ
マー(Phylomer)、PD-1アンタゴニスト、PDGFアンタゴニスト、フェニルアラニ
ンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインC、リラキシ
ン、リラキシン類似体、セクレチン、RGDペプチド、リボヌクレアーゼ、センレボター
ゼ、セリンプロテアーゼ阻害剤、可溶性1型補体受容体、可溶性DCC受容体、可溶性T
ACI受容体、可溶性腫瘍壊死因子I受容体(sTNF-RI)、可溶性腫瘍壊死因子I
I受容体(sTNF-RII)、可溶性VEGF受容体Flt-1、可溶性FcγIIB
受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、T細胞受容体リ
ガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアル
ファ1、toll様受容体阻害剤、腫瘍壊死因子(TNFα)、腫瘍壊死因子αアンタゴ
ニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、
VEGFアンタゴニスト、フォンビルブラント因子からなる群から選択される、<16>~<18>のいずれかに記載の核酸分子。
<21>
<1>~<20>のいずれかに記載の核酸分子を含むベクター。
<22>
<1>~<20>のいずれかに記載の核酸分子を含む宿主もしくは宿主細胞、<21>に記載のベクターを含む宿主もしくは宿主細胞、または<21>に記載のベクターで形質転換された宿主もしくは宿主細胞。
<23>
<1>~<20>のいずれかに記載の核酸分子を調製するための方法であって、<22>に記載の宿主または宿主細胞を培養すること、および任意選択で、産生された核酸分子を単離することを含む方法。
<24>
<21>に記載のベクターを調製するための方法であって、<22>に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたベクターを単離することを含む方法。
<25>
<1>~<20>のいずれかに記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、<22>に記載の宿主または宿主細胞を培養/成長させること、および任意選択で、産生されたポリペプチドを単離することを含む方法。
<26>
薬物コンジュゲートを調製するための方法であって、
前記薬物コンジュゲートが、<1>~<15>のいずれかに記載の核酸分子によりコードされるポリペプチドを含み、
(i)生理活性タンパク質および/または(ii)低分子および/または(iii)炭
水化物をさらに含み、
前記方法が、<22>に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたポリペプチドおよび/または薬物コンジュゲートを単離することをさらに含む方法。
<27>
前記生理活性タンパク質が、治療上有効なタンパク質である、<26>に記載の薬物コンジュゲートを調製するための方法。
<28>
前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホ
ルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大50個のアミノ酸残基から
なるペプチド、またはペプチド模倣体からなる群から選択される、<26>または<27>に記載の薬物コンジュゲートを調製するための方法。
<29>
前記結合タンパク質が、抗体、Fab断片、Fab’断片、F(ab’)
2
断片、単鎖
可変断片(scFv)、(単一)ドメイン抗体、抗体の単離された可変領域(VL領域お
よび/またはVH領域)、CDR、免疫グロブリンドメイン、CDR由来ペプチド模倣体
、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメ
イン、プロテインAドメイン、SH3ドメイン、アンキリン反復ドメイン、およびリポカ
リンからなる群から選択される、<28>に記載の薬物コンジュゲートを調製するための方法。
<30>
前記生理活性タンパク質が、インターロイキン1受容体アンタゴニスト、レプチン、酸
性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルフ
ァ-1アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ-ガラクト
シダーゼ、アルファ-グルコシダーゼ、アルファ-N-アセチルグルコサミニダーゼ、ア
ルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗HIVペプチド融合阻害
剤、アルギニンデイミナーゼ、アスパラギナーゼ、Bドメイン欠損第VIII因子、骨形
態形成タンパク質、ブラジキニンアンタゴニスト、B型ナトリウム利尿ペプチド、ブーガ
ニン、成長ホルモン、絨毛性ゴナドトロピン、CD3受容体アンタゴニスト、CD19ア
ンタゴニスト、CD20アンタゴニスト、CD40アンタゴニスト、CD40Lアンタゴ
ニスト、セレブロシドスルファターゼ、凝固第VIIa因子、凝固第XIII因子、凝固
第IX因子、凝固第X因子、補体成分C3阻害剤、補体成分5aアンタゴニスト、C-ペ
プチド、CTLA-4アンタゴニスト、C型ナトリウム利尿ペプチド、ディフェンシン、
デオキシリボヌクレアーゼI、EGFR受容体アンタゴニスト、上皮成長因子、エリスロ
ポエチン、エキセンディン-4、エズリンペプチド1、FcγIIB受容体アンタゴニス
ト、線維芽細胞成長因子21、卵胞刺激ホルモン、胃抑制ポリペプチド(GIP)、GI
P類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド1(GLP
-1)、GLP-1類似体、グルカゴン様ペプチド2(GLP-2)、GLP-2類似体
、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモン
アンタゴニスト、gp120、gp160、顆粒球コロニー刺激因子(G-CSF)、顆
粒球マクロファージコロニー刺激因子(GM-CSF)、グレリン、グレリン類似体、成
長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子
受容体(HGFR)アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、H
er2/neu受容体アンタゴニスト、ヒストレリン、ヒルジン、hsp70アンタゴニ
スト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異
的酵素、イズロネート-2-スルファターゼ、IgEアンタゴニスト、インスリン、イン
スリン類似体、インスリン様成長因子1、インスリン様成長因子2、インターフェロン-
アルファ、インターフェロン-アルファアンタゴニスト、インターフェロン-アルファス
ーパーアゴニスト、インターフェロン-アルファ-n3、インターフェロン-ベータ、イ
ンターフェロン-ガンマ、インターフェロン-ラムダ、インターフェロンタウ、インター
ロイキン、インターロイキン2融合タンパク質、インターロイキン-22受容体サブユニ
ットアルファ(IL-22ra)アンタゴニスト、イリシン、島ネオゲネシス関連タンパ
ク質、ケラチノサイト成長因子、Kv1.3イオンチャネルアンタゴニスト、ランチペプ
チド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダ
ーゼ、N-アセチルガラクトサミン-6-スルファターゼ、N-アセチルグルコサミニダ
ーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω-コノトキシン、オルニ
トドロス・モウバタ(Ornithodoros moubata)補体阻害剤、骨形成タンパク質-1、オス
テオプロテゲリン、シュウ酸デカルボキシラーゼ、P128、副甲状腺ホルモン、フィロ
マー(Phylomer)、PD-1アンタゴニスト、PDGFアンタゴニスト、フェニルアラニ
ンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインC、リラキシ
ン、リラキシン類似体、セクレチン、RGDペプチド、リボヌクレアーゼ、センレボター
ゼ、セリンプロテアーゼ阻害剤、可溶性1型補体受容体、可溶性DCC受容体、可溶性T
ACI受容体、可溶性腫瘍壊死因子I受容体(sTNF-RI)、可溶性腫瘍壊死因子I
I受容体(sTNF-RII)、可溶性VEGF受容体Flt-1、可溶性FcγIIB
受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、T細胞受容体リ
ガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアル
ファ1、toll様受容体阻害剤、腫瘍壊死因子(TNFα)、腫瘍壊死因子αアンタゴ
ニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、
VEGFアンタゴニスト、フォンビルブラント因子からなる群から選択される、<26>~<28>のいずれかに記載の薬物コンジュゲートを調製するための方法。
<31>
前記低分子が、血管新生阻害剤、抗アレルギー薬、制吐薬、抗うつ薬、抗高血圧薬、抗
炎症薬、抗感染症薬、抗精神病薬、抗増殖(細胞毒性および細胞増殖抑制)薬、カルシウ
ムアンタゴニストおよび他の循環器薬、コリン作動性アゴニスト、中枢神経系に作用する
薬物、呼吸器系に作用する薬物、ホルモン、ステロイド、ポリケチド、炭水化物、オリゴ
糖、核酸、核酸誘導体、アンチセンス核酸、低分子干渉RNA(siRNA)、マイクロ
RNA(miR)阻害剤、マイクロRNA模倣体、DNAアプタマー、およびRNAアプ
タマーからなる群から選択される、<26>~<30>に記載の薬物コンジュゲートを調製するための方法。
<32>
<1>~<20>のいずれかに記載の核酸分子を配列決定するための方法。
<33>
<1>~<20>のいずれかに記載の核酸分子を増幅するための方法。
<34>
<1>~<20>のいずれかに記載の核酸分子をクローニングするための方法。
<35>
遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン
、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配
列を含み、前記ヌクレオチド配列が、少なくとも300ヌクレオチドの長さを有し、
前記方法が、50,000未満のヌクレオチド反復スコア(NRS)を有するヌクレオ
チド配列を含む核酸分子を選択するステップを含み、
前記ヌクレオチド反復スコア(NRS)が、数式:
【数3】
により決定され、式中、
N
tot
は、前記ヌクレオチド配列の長さであり、
nは、前記ヌクレオチド配列内の反復の長さであり、
f
i
(n)は、前記長さnの反復の頻度であり、
1つよりも多くの長さnの反復が存在する場合、k(n)は、前記長さnの反復の前記
異なる配列の数であり、そうでなければ、前記長さnの反復についてk(n)は1である
、方法。
【配列表】