(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-30
(45)【発行日】2024-11-08
(54)【発明の名称】非定型スプリットインテインおよびそれらの使用
(51)【国際特許分類】
C07K 14/00 20060101AFI20241031BHJP
C07K 19/00 20060101ALI20241031BHJP
C12N 15/11 20060101ALI20241031BHJP
C12N 15/63 20060101ALI20241031BHJP
C12N 15/62 20060101ALI20241031BHJP
C12N 1/15 20060101ALI20241031BHJP
C12N 1/19 20060101ALI20241031BHJP
C12N 1/21 20060101ALI20241031BHJP
C12N 5/10 20060101ALI20241031BHJP
【FI】
C07K14/00 ZNA
C07K19/00
C12N15/11 Z
C12N15/63 Z
C12N15/62 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
(21)【出願番号】P 2022513402
(86)(22)【出願日】2019-08-28
(86)【国際出願番号】 US2019048508
(87)【国際公開番号】W WO2021040703
(87)【国際公開日】2021-03-04
【審査請求日】2022-08-25
【新規性喪失の例外の表示】特許法第30条第2項適用 1.掲載アドレス https://pubs.acs.org/toc/jacsat/140/37 2.掲載日 2018年8月29日 3.公開者 アダム ジェイ.スティーブンズ、ジリッダー セカール、ヨーゼフ エイ.グラムスパッハー、デイビッド カウバーン、トム ダブリュー.ミューア
【新規性喪失の例外の表示】特許法第30条第2項適用 〔刊行物等〕 1.刊行物名 Adam J.Stevens et al.,“An Atypical Mechanism of Split Intein Molecular Recognition and Folding”,Journal of American Chemical Society,(米),2018年9月19日,Vol.140,No.37,p.11791-11799 2.発行日 2018年9月19日 3.公開者 アダム ジェイ.スティーブンズ、ジリッダー セカール、ヨーゼフ エイ.グラムスパッハー、デイビッド カウバーン、トム ダブリュー.ミューア
【前置審査】
(73)【特許権者】
【識別番号】500184305
【氏名又は名称】ザ・トラスティーズ・オブ・プリンストン・ユニバーシティ
【氏名又は名称原語表記】THE TRUSTEES OF PRINCETON UNIVERSITY
【住所又は居所原語表記】619 Alexander Road, Suite 102, Princeton,NJ 08540-6000 U.S.A.
(73)【特許権者】
【識別番号】515314797
【氏名又は名称】アルバート アインシュタイン カレッジ オブ メディシン
(74)【代理人】
【識別番号】100120031
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100120617
【氏名又は名称】浅野 真理
(74)【代理人】
【識別番号】100126099
【氏名又は名称】反町 洋
(72)【発明者】
【氏名】トム、ダブリュー.ミューア
(72)【発明者】
【氏名】アダム、スティーブンズ
(72)【発明者】
【氏名】ヨーゼフ、グラムスパッハー
(72)【発明者】
【氏名】デイビッド、カウバーン
(72)【発明者】
【氏名】ジリッダー、セカール
【審査官】福間 信子
(56)【参考文献】
【文献】国際公開第2015/086825(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12N
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
GenBank/EMBL/DDBJ/GeneSeq
UniProt/GeneSeq
SwissProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
配列番号1のアミノ酸配列または配列番号1と少なくとも90%の配列同一性を有するその
機能的に同等の変異体
であって、配列番号1のN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体を含んでなる、スプリットインテインN末端断片。
【請求項2】
前記変異体が配列番号2~6、125~127および168~170からなる群から選択されるアミノ酸配列を含んでなる、請求項1に記載のスプリットインテインN末端断片。
【請求項3】
前記機能的に同等の変異体が配列番号4または配列番号125のアミノ酸配列を含んでなる、請求項
2に記載のスプリットインテインN末端断片。
【請求項4】
(i)目的化合物、および
(ii)請求項1に記載のスプリットインテインN末端断片、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる複合体であって、
前記複合体は、場合により(i)と(ii)の間にリンカーを含んでなり、
前記目的化合物は、アミド結合によって前記スプリットインテインN末端断片のN末端に連結されているか、あるいは
前記複合体がリンカーを含んでなる場合には、前記目的化合物はアミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインN末端断片のN末端に結合されている、
複合体。
【請求項5】
前記スプリットインテインN末端断片が、配列番号49~68からなる群から選択されるアミノ酸配列または
配列番号49~68と少なくとも90%の配列同一性を有するその
機能的に同等の変異体
であって、それらのN末端切断を触媒する能力および/またはそれらのトランススプライシング活性を維持または改善する変異体を含んでなる、請求項4に記載の複合体。
【請求項6】
前記目的化合物がポリペプチドもしくはタンパク質、抗体、またはタンパク質の断片であり、前記複合体がリンカーを含んでなる場合には、前記リンカーはペプチドリンカーである、請求項
4または
5に記載の複合体。
【請求項7】
配列番号7に記載のアミノ酸配列または配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその
機能的に同等の変異体
であって、配列番号7のC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体を含んでなるスプリットインテインC末端断片。
【請求項8】
前記変異体が配列番号8~48および128~166からなる群から選択されるアミノ酸配列を含んでなる、請求項
7に記載のスプリットインテインC末端断片。
【請求項9】
前記機能的に同等の変異体が配列番号10~22および128~140からなる群から選択されるアミノ酸配列を含んでなる、請求項
8に記載のスプリットインテインC末端断片。
【請求項10】
(i)請求項
7~
9のいずれか一項に記載のスプリットインテインC末端断片または配列番号114~120からなる群から選択される配列を含んでなるスプリットインテインC末端断片、および
(ii)目的化合物
を含んでなる複合体であって、
前記複合体は、場合により(i)と(ii)の間にリンカーを含んでなり、
前記目的化合物は、アミド結合によって前記スプリットインテインC末端断片のC末端に結合されているか、あるいは
前記複合体がリンカーを含んでなる場合には、前記目的化合物はアミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインC末端断片のC末端に結合されている、
複合体。
【請求項11】
前記スプリットインテインC末端断片が配列番号69~87から選択される配列または
配列番号69~87と少なくとも90%の配列同一性を有するその
機能的に同等の変異体
であって、それらのC末端切断を触媒する能力および/またはそれらのトランススプライシング活性を維持または改善する変異体を含んでなる、請求項
10に記載の複合体。
【請求項12】
前記目的化合物がポリペプチドもしくはタンパク質、抗体、またはタンパク質の断片であり、前記複合体がリンカーを含んでなる場合には、前記リンカーはペプチドリンカーである、請求項
11に記載の複合体。
【請求項13】
(i)請求項
7~
9のいずれか一項に記載のスプリットインテインC末端断片または配列番号114~120からなる群から選択される配列を含んでなるスプリットインテインC末端断片、
(ii)目的化合物、および
(iii)請求項1~
3のいずれか一項に記載のスプリットインテインN末端断片または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる複合体であって、
前記複合体は、場合により、(i)と(ii)の間および/または(ii)と(iii)の間にリンカーを含んでなり、
前記目的化合物は、アミド結合によって前記スプリットインテインC末端断片のC末端に連結されているか、あるいは
前記複合体がリンカーを含んでなる場合には、前記目的化合物はアミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインC末端断片のC末端に結合され、
前記目的化合物は、アミド結合によって前記スプリットインテインN末端断片のN末端に連結されているか、または
前記複合体がリンカーを含んでなる場合には、前記目的化合物はアミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインN末端断片のN末端に結合されている、
複合体。
【請求項14】
請求項
4に記載の複合体および請求項
10に記載の複合体を含んでなる組成物。
【請求項15】
前記スプリットインテインN末端断片のC末端が、ペプチド結合によって前記スプリットインテインC末端断片のN末端に連結されている、請求項
4に記載の複合体および請求項
10に記載の複合体を含んでなるコンジュゲート。
【請求項16】
(a)請求項
6に記載の複合体、および
(b)配列番号7に記載のアミノ酸配列、
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその
機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片
を含んでなるコンジュゲートであって、
前記スプリットインテインN末端断片のC末端がペプチド結合によって前記スプリットインテインC末端断片のN末端に連結されている、
コンジュゲート。
【請求項17】
以下から選択される物:
(i)請求項1に記載のスプリットインテインN末端断片、もしくは
請求項
6に記載の複合体、もしくは
請求項
7に記載のスプリットインテインC末端断片、もしくは
請求項
12に記載の複合体、もしくは
請求項
13に記載の複合体であって、前記目的化合物がタンパク質であり、前記複合体がリンカーを含む場合、前記リンカーはペプチドリンカーである、複合体、もしくは
請求項
16に記載のコンジュゲート
をコードするポリヌクレオチド;または
(ii)(i)のポリヌクレオチドを含んでなるベクター;または
(iii)(i)のポリヌクレオチドもしくは(ii)のベクターを含んでなる宿主細胞。
【請求項18】
第1の目的化合物と第2の目的化合物の間のコンジュゲートを得るための方法であって、以下の方法から選択される方法:
(A)以下を含んでなる方法
(i)
(a)第1の目的化合物、および配列番号1のアミノ酸配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片を含んでなる請求項
4に記載の複合体
と、
(b)第2の目的化合物、および配列番号7のアミノ酸配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなる請求項
10に記載の複合体、あるいは
AceL-TerLスプリットインテインC末端断片またはその機能的に同等の変異体
であって、AceL-TerLスプリットインテインC末端断片と少なくとも90%の配列同一性を有し、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、および第2の目的化合物を含んでなる複合体であって、
場合により、前記スプリットインテインC末端断片と前記第2の目的化合物の間にリンカーを含んでなり、
・第2の目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に結合されているか、または
・前記複合体がリンカーを含んでなる場合には、前記第2の目的化合物はアミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインC末端断片のC末端に結合されている、
複合体
とを、
前記スプリットインテインN末端断片と前記スプリットインテインC末端断片を結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)前記インテイン中間体を反応させて、第1の目的化合物と第2の目的化合物の間のコンジュゲートを形成させること;並びに
(B)以下を含んでなる方法
(i)
(a)第1の目的化合物、および配列番号1のアミノ配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片を含んでなる請求項
4に記載の複合体、あるいは
第2の目的化合物、およびAceL-TerLスプリットインテインN末端断片またはその機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインN末端断片と少なくとも90%の配列同一性を有し、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体を含んでなる複合体であって、
場合により、前記目的化合物と前記スプリットインテインN末端断片の間にリンカーを含んでなり、
・前記目的化合物は、アミド結合によって前記スプリットインテインN末端断片のN末端に連結されているか、または
・前記複合体がリンカーを含んでなる場合には、前記目的化合物は、アミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインN末端断片のN末端に結合されている、複合体
と、
(b)第2の目的化合物、および配列番号7のアミノ酸配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなる請求項
10に記載の複合体
とを、
前記スプリットインテインN末端断片と前記スプリットインテインC末端断片を結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)前記インテイン中間体を反応させて、第1の目的化合物と第2の目的化合物の間のコンジュゲートを形成させること。
【請求項19】
目的化合物と求核試薬のコンジュゲートを得るための方法であって、
(i)
(a)スプリットインテインN末端断片が配列番号1のアミノ酸配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなる請求項
4に記載の複合体、あるいは
目的化合物およびAceL-TerLスプリットインテインN末端断片またはその機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインN末端断片と少なくとも90%の配列同一性を有し、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体を含んでなる複合体であって、
場合により、前記目的化合物と前記スプリットインテインN末端断片の間にリンカーを含んでなり、
・前記目的化合物は、アミド結合によって前記スプリットインテインN末端断片のN末端に連結されているか、または
・前記複合体がリンカーを含んでなる場合には、前記目的化合物は、アミド結合によって前記リンカーに結合され、かつ/または前記リンカーは、アミド結合によって前記スプリットインテインN末端断片のN末端に結合されている、
複合体
と、
(b)配列番号8、9、23~48および141~166からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片
とを、
前記スプリットインテインN末端断片と前記スプリットインテインC末端断片の間で結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)前記インテイン中間体と外因性求核試薬を接触させること
を含んでなる、方法。
【請求項20】
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその
機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその
機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインC末端断片と少なくとも90%の配列同一性を有し、そのC末端切断を触媒する能力および/またはトランススプライシング活性を維持または改善する変異体、または配列番号7の配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその
機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド、
あるいは、
(c)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその
機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインN末端断片と少なくとも90%の配列同一性を有し、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその
機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(d)N末端からC末端へ向かって、
・配列番号7の配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその
機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド
を含んでなる組成物。
【請求項21】
細胞において目的遺伝子を発現させるための方法であって、以下の方法から選択される方法:
(A)以下を含んでなる方法
(i)前記細胞を
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・配列番号1の配列または配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインC末端断片と少なくとも90%の配列同一性を有し、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号7の配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド、
あるいは、
(c)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインN末端断片と少なくとも90%の配列同一性を有し、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、および
(d)N末端からC末端へ向かって、
・配列番号7の配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその
機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド
と接触させること、
(ii)前記第1の融合タンパク質および前記第2の融合タンパク質が生産されるように前記第1のポリヌクレオチドおよび前記第2のポリヌクレオチドを発現させること、ならびに
(iii)前記スプリットインテインN末端断片が前記スプリットインテインC末端断片と結合してインテイン中間体を形成し、前記インテイン中間体が反応して前記第1の目的ポリペプチドのC末端と前記第2の目的ポリペプチドのN末端を共有結合的に連結するように、前記第1の融合タンパク質と前記第2の融合タンパク質を接触させること;
(B)以下を含んでなる方法
(i)第1の細胞を、
N末端からC末端へ向かって
・第1の目的ポリペプチド、および
・配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチドであって、前記第1の融合タンパク質はシグナルペプチドを含んでなる第1のポリヌクレオチド
と接触させること、ならびに
(ii)第2の細胞を、N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその機能的に同等の変異体
であって、前記AceL-TerLスプリットインテインC末端断片と少なくとも90%の配列同一性を有し、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号7の配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチドであって、前記第2の融合タンパク質はシグナルペプチドを含んでなる第2のポリヌクレオチド
と接触させること、
あるいは、
(iii)第1の細胞を、N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその機能的に同等の変異体
であって、前記AceL-TerLと少なくとも90%の配列同一性を有し、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体
であって、そのN末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチドであって、前記第1の融合タンパク質はシグナルペプチドを含んでなる第1のポリヌクレオチド
と接触させること、ならびに
(iv)第2の細胞を、
N末端からC末端へ向かって、
・配列番号7の配列もしくは
配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体
であって、そのC末端切断を触媒する能力および/またはそのトランススプライシング活性を維持または改善する変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチドであって、前記第2の融合タンパク質はシグナルペプチドを含んでなる第2のポリヌクレオチド
と接触させること、
(v)前記第1の融合タンパク質および前記第2の融合タンパク質が生産および分泌されるように前記第1のポリヌクレオチドおよび前記第2のポリヌクレオチドを発現させること、ならびに
(vi)前記スプリットインテインN末端断片が前記スプリットインテインC末端断片と結合してインテイン中間体を形成し、前記インテイン中間体が反応して前記第1の目的ポリペプチドのC末端と前記第2の目的ポリペプチドのN末端を共有結合的に連結するように、前記第1の融合タンパク質と前記第2の融合タンパク質を接触させること。
【発明の詳細な説明】
【技術分野】
【0001】
発明における政府の権利
本発明は、米国国立衛生研究所により与えられた助成番号GM086868、OD016305、RR015495およびOD016432の下、政府の支援で行われた。米国政府は本発明において一定の権利を有する。
【0002】
発明の分野
本開示は、バイオテクノロジーの分野に含まれ、具体的には、スプリットインテインおよびそれらの使用に関する。
【背景技術】
【0003】
発明の背景
インテインは、宿主タンパク質からそれ自体を切り出すと同時に、痕跡無くその隣接ポリペプチド配列(エクステイン)を連結して天然型のペプチド結合を形成するタンパク質スプライシングと呼ばれる翻訳後オートプロセシングイベントを受ける介在タンパク質ドメインである。ほとんどのインテインは、単一の遺伝子内に埋め込まれた連続的ドメインとして見られ、シスでスプライスする。しかしながら、一部はスプリット形態で天然に存在し、それにより、各インテイン断片は別々に発現される遺伝子にコードされ、トランスでのスプライシングの前にまず会合しなければならない。これらのスプリットインテインはタンパク質工学のツールとして一般に適用され、それらの特異性の高い認識および独特な活性のために、細胞環境において特に使用しやすい。
【0004】
化学生物学においてインテインがますます使用されているにもかかわらず、それらの実用的有用性は、いくつかの一般的特徴、すなわち(i)速度が遅い、(ii)直接隣接するエクステイン配列に関してコンテキスト依存性の効率、(iii)他のタンパク質との組換え融合の発現レベルが低い、および(iv)安定性が最適に至っていないことによって制約を受けてきた。
【0005】
よって、様々なタンパク質精製およびタンパク質修飾用途における使用のための、よりロバストでより効率的なスプリットインテインの必要性が存在する。
【発明の概要】
【0006】
発明の概要
本開示の著者らは、これにより、本願の実施例1(
図5、表5および6)に示されるように、悪条件下でも加速化されたスプライシング速度および活性を示す、非定型スプリット部位を有するスプリットインテインを提供する。開示されるインテインは、発現されるタンパク質のN末端修飾に有用であり、発現したタンパク質の連結、トランスペプチダーゼに基づく連結戦略、および様々なタンパク質化学法など、タンパク質のN末端修飾に関して報告されている他の方法を補う。これに関して、これらのインテインのN末端インテイン断片は著しく短いことから、目的のスプリットインテインN末端断片の複合タンパク質が固相ペプチド合成を用いて容易に得ることができるので、単離されるポリペプチドは、ある範囲のタンパク質修飾において使用するのに理想的に適している。
【0007】
よって、本開示の1つの側面において、本発明は、配列番号1のアミノ酸配列または配列番号1と少なくとも90%の配列同一性を有するその変異体を含んでなるスプリットインテインN末端断片に関する。
【0008】
本開示の別の側面は、
(i)目的化合物、
(ii)本開示のスプリットインテインN末端断片、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる複合体であって、
上記複合体は、場合により(i)と(ii)の間にリンカーを含んでなり、
上記目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、上記目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている複合体に関する。
【0009】
本開示の別の側面は、配列番号7のアミノ酸配列または配列番号7と少なくとも88%の配列同一性を有するその変異体を含んでなるスプリットインテインC末端断片に関する。
【0010】
本開示の別の側面は、
(i)本開示のスプリットインテインC末端断片または配列番号114~120からなる群から選択される配列を含んでなるスプリットインテインC末端断片、および
(ii)目的化合物
を含んでなる複合体であって、
上記複合体は、場合により(i)と(ii)の間にリンカーを含んでなり、
上記目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に結合されているか、または
上記複合体がリンカーを含んでなる場合には、上記目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合されている複合体に関する。
【0011】
別の側面において、本開示は、本開示の第1の複合体および第2の複合体を含んでなる組成物に関する。
【0012】
本開示の別の側面は、
(i)本開示のスプリットインテインC末端断片または配列番号114~120からなる群から選択される配列を含んでなるスプリットインテインC末端断片、
(ii)目的化合物、および
(iii)本開示のスプリットインテインN末端断片または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる複合体であって、
上記複合体は、場合により、(i)と(ii)の間および/または(ii)と(iii)の間にリンカーを含んでなり、
上記目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、上記目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合され、
上記目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、上記目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている、
複合体に関する。
【0013】
本開示の別の側面は、(a)本開示の第1の複合体、および(b)アミノ酸配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなり、スプリットインテインN末端断片のC末端がペプチド結合によってスプリットインテインC末端断片のN末端に連結されているコンジュゲートに関する。
【0014】
別の側面において、本開示は、本開示のスプリットインテインN末端断片、または本開示のスプリットインテインC末端断片、または目的化合物がポリペプチドもしくはタンパク質であり、リンカーが、存在する場合、ペプチドリンカーである本開示の複合体のいずれか1つをコードするポリヌクレオチドに関する。
【0015】
別の側面において、本開示は、本開示のポリヌクレオチドを含んでなるベクターに関する。
【0016】
別の側面において、本開示は、本開示のポリヌクレオチドまたはベクターを含んでなる宿主細胞に関する。
【0017】
別の側面において、本開示は、本開示の第1の複合体および本開示の第2の複合体を含んでなる組成物に関する。
【0018】
別の側面において、本開示は、第1の目的化合物と第2の目的化合物の間のコンジュゲートを得るための方法であって、
(i)
(a)第1の目的化合物、および配列番号1のアミノ配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片を含んでなる本開示の第1の複合体と、
(b)第2の目的化合物、および配列番号7のアミノ酸配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなる本開示の第2の複合体、あるいは
AceL-TerLスプリットインテインC末端断片またはその機能的に同等の変異体および第2の目的化合物を含んでなる複合体であって、場合により、上記スプリットインテインC末端断片と上記第2の目的化合物の間にリンカーを含んでなり、
・第2の目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に結合されているか、または
・上記複合体がリンカーを含んでなる場合には、上記第2の目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合されている、複合体
とを、スプリットインテインN末端断片とスプリットインテインC末端断片を結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)上記インテイン中間体を反応させて、第1の目的化合物と第2の目的化合物の間のコンジュゲートを形成させること
を含んでなる方法に関する。
【0019】
別の側面において、本開示は、第1の目的化合物と第2の目的化合物の間のコンジュゲートを得るための方法であって、
(i)
(a)第1の目的化合物、および配列番号1のアミノ配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片を含んでなる本開示の第1の複合体、あるいは
第2の目的化合物およびAceL-TerLスプリットインテインN末端断片またはその機能的に同等の変異体を含んでなる複合体であって、場合により、上記目的化合物とスプリットインテインN末端断片の間にリンカーを含んでなり、
・上記目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
・上記複合体がリンカーを含んでなる場合には、上記目的化合物は、アミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている、複合体と、
(b)第2の目的化合物、および配列番号7のアミノ酸配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなる本開示の第2の複合体
とを、スプリットインテインN末端断片とスプリットインテインC末端断片を結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)上記インテイン中間体を反応させて、第1の目的化合物と第2の目的化合物の間のコンジュゲートを形成させること
を含んでなる方法に関する。
【0020】
別の態様において、本開示は、目的化合物と求核試薬のコンジュゲートを得るための方法であって、
(i)
(a)スプリットインテインN末端断片が配列番号1のアミノ酸配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなる本開示の第1の複合体、あるいは
目的化合物およびAceL-TerLスプリットインテインN末端断片またはその機能的に同等の変異体を含んでなる複合体であって、場合により、上記目的化合物とスプリットインテインN末端断片の間にリンカーを含んでなり、
・上記目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
・上記複合体がリンカーを含んでなる場合には、上記目的化合物は、アミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている、複合体と、
(b)配列番号8、9、23~48および141~166からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片
とを、スプリットインテインN末端断片とスプリットインテインC末端断片の間で結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)上記インテイン中間体と外因性求核試薬を接触させること
を含んでなる方法に関する。
【0021】
別の側面において、本開示は、
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその変異体、または配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド、
あるいは、
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその変異体、または配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド
を含んでなる組成物に関する。
【0022】
別の側面において、本開示は、細胞において目的遺伝子を発現させるための方法であって、
(i)上記細胞を
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・配列番号1の配列または少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその機能的に同等の変異体、または配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド、
あるいは、
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその機能的に同等の変異体、または配列番号1の配列もしくは少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、および
(b)N末端からC末端へ向かって、
・配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド
と接触させること、
(ii)上記第1の融合タンパク質および上記第2の融合タンパク質が生産されるように上記第1のポリヌクレオチドおよび上記第2のポリヌクレオチドを発現させること、ならびに
(iii)上記スプリットインテインN末端断片が上記スプリットインテインC末端断片と結合してインテイン中間体を形成し、上記インテイン中間体が反応して上記第1の目的ポリペプチドのC末端と上記第2の目的ポリペプチドのN末端を共有結合的に連結するように、上記第1の融合タンパク質と上記第2の融合タンパク質を接触させること、
を含んでなる方法に関する。
【0023】
別の側面において、本開示は、目的遺伝子を発現させるための方法であって、
(i)第1の細胞を、N末端からC末端へ向かって
・第1の目的ポリペプチド、および
・配列番号1の配列もしくは少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチドと接触させること、ここで、上記第1の融合タンパク質はシグナルペプチドを含んでなる、ならびに
(ii)第2の細胞を、N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその機能的に同等の変異体、または配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチドと接触させること、上記第2の融合タンパク質はシグナルペプチドを含んでなる、
あるいは、
(i)第1の細胞を、N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその機能的に同等の変異体、または配列番号1の配列もしくは少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチドと接触させること、ここで、上記第1の融合タンパク質はシグナルペプチドを含んでなる、ならびに
(ii)第2の細胞を、N末端からC末端へ向かって、
・配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチドと接触させること、ここで、上記第2の融合タンパク質はシグナルペプチドを含んでなる、
1.上記第1の融合タンパク質および上記第2の融合タンパク質が生産および分泌されるように上記第1のポリヌクレオチドおよび上記第2のポリヌクレオチドを発現させること、ならびに
2.上記スプリットインテインN末端断片が上記スプリットインテインC末端断片と結合してインテイン中間体を形成し、上記インテイン中間体が反応して上記第1の目的ポリペプチドのC末端と上記第2の目的ポリペプチドのN末端を共有結合的に連結するように、上記第1の融合タンパク質と上記第2の融合タンパク質を接触させること
を含んでなる方法に関する。
【図面の簡単な説明】
【0024】
【
図1】(A)~(E)本研究において使用されるインテインのRP-HPLC分析。各RP-HPLCクロマトグラムに相当する質量を表3に示す。
【
図2】(A)~(D)タンパク質トランススプライシング反応の代表的スプライシングゲル。(A)示された温度におけるCatおよびAceL
*に関するタンパク質トランススプライシング反応の代表的なSDS-PAGEゲル。MBP-Int
N(N)、Int
C-GFP(C)およびスプライス産物(SP)に相当するバンドを示す。(B)示された尿素濃度におけるCatおよびAceL
*に関するタンパク質トランススプライシング反応の代表的なSDS-PAGEゲル。MBP-Int
N(N)、Int
C-GFP(C)およびスプライス産物(SP)に相当するバンドを示す。(C)示された-1および-2 N-エクステイン突然変異(WT「FE」配列からの)を有するCatに関するタンパク質トランススプライシング反応の代表的なSDS-PAGEゲル。MBP-Cat
N(N)、Cat
C-GFP(C)およびスプライス産物(SP)に相当するバンドを示す。-1Aおよび-1P突然変異ではC末端切断が見られ、ゲルに示される(GFP)。(D)示された+2および+3 C-エクステイン突然変異(WT「EF」からの)を有するCatに関するタンパク質トランススプライシング反応の代表的なSDS-PAGEゲル。MBP-Cat
N(N)、Cat
C-GFP(C)およびスプライス産物(SP)に相当するバンドを示す。
【
図3】(A)~(B)反応進行曲線。(A)および(B)本研究において実施したスプライシング反応に関して反応進行曲線を示す。各反応のベストフィットラインを示す。
【
図4】(A)~(D)非定型スプリットインテインの発現。レーンは(W)全細胞溶解液、(P)封入体ペレット、(S)溶解液の可溶性画分、(FT)Ni-NTAアフィニティービーズに結合した可溶性溶解液バッチのフロースルー、(E)250mMイミダゾールの3CV溶出に相当する。(A)大腸菌発現(18℃、16時間)からのSUMO-GOS
C、SUMO-AceL
*C、およびSUMO-Cat
Cの精製。(B)大腸菌発現(37℃、3時間)からのSUMO-GOS
C、SUMO-AceL
*C-Sumo、およびSUMO-Cat
Cの精製。(C)大腸菌発現(37℃、3時間)からのSUMO-GOS
N、SUMO-AceL
*N、およびSUMO-Cat
Nの精製。(D)大腸菌発現(18℃、16時間)からのGOS
C-GFP、AceL
*C-GFP、およびCat
C-GFPの精製。
【
図5】(A)~(D)コンセンサス非定型(Cat)スプリットインテインの特性決定。(A)同一残基(黒)および類似残基(グレー)を強調したCatおよびAceL
*のペアワイズ配列アラインメント。(B)30℃でのCatスプライシングに関する反応進行曲線。(C)温度の関数としてのCatおよびAceL
*に関するスプライシング速度(n=3、誤差=SEM)。AceL
*は50℃では不活性である。(D)添加した尿素の関数としてのCatおよびAceL
*に関するスプライシング速度(n=3、誤差=SEM)。AceL
*は、2Mおよび4M尿素(NA)の存在下では活性がない。
【
図6】(A)~(D)Cat断片会合の構造的効果。(A)非標識Cat
Cを含まない15N標識Cat
N(黒)および非標識Cat
Cとの複合体としての15N標識Cat
N(グレー)の
1H-
15N HSQCスペクトル。(B)非標識Cat
Nを含まない15N標識Cat
C(黒)および非標識Cat
Nとの複合体としての15N標識Cat
C(グレー)の1H-15N HSQCスペクトル。(C)Cat
N(黒)、Cat
C(濃いグレー)およびCat
N+Cat
C複合体(薄いグレー)の遠UV円偏光二色性スペクトル。(D)Cat
N(黒)、Cat
C(濃いグレー)、およびCat
N+Cat
C複合体(薄いグレー)のサイズ排除クロマトグラム。
【
図7】(A)~(D)Cat
Nの無秩序型から秩序型への遷移。(A)Cat
C(左)の存在下および不在下(右)のCat
Nの(
15N-
1H)ヘテロ核NOE。(B)Cat
Cの存在下(左)および不在下(右)でのCat
Nのスピン-スピン弛緩速度。(C)Cat
Cの存在下(左)および不在下(右)でのCat
NのCαおよびCβ化学シフトの摂動。Δδ(Cα,Cβ)=(δCβ-δCα)Observed-(δCβ-δCα)Random Coil。
【
図8】(A)~(C)Catの溶液NMR構造。(A)Cat
N(暗い)-Cat
C(明るい)スプリットインテイン複合体の構造計算で得られた20の最低エネルギー立体配座異性体の骨格コンフォメーション。Cat
C溶解度タグは、透明グレーで表す。構造を180°回転して示す(上面と底面を示す)。(B)最低エネルギー立体配座異性体のアニメーション表示である。構造を180°回転して示す(上面と底面を示す)。(C)Ala
1、Ser
75、His
78、およびHis
133を棒として示すCat活性部位の拡大図である。Ala
1のカルボニル酸素とSer
75のアミドおよびヒドロキシルプロトンの間の距離を示す。
【
図9】(A)~(C)Cat複合体の構造。(A)NMR構造計算で得られたCat
N-Cat
C複合体の20の最小エネルギー立体配座異性体の平均構造からの残差平均平方根偏差(Root Mean Square Deviation)(RMSD)当たりの平均。(B)Cat
N(グレー)-Cat
C(黒)複合体の残基数に対してプロットした残差RMSD当たりの平均。エクステイン領域をグレーで表示し、Cat
Cとともに使用した溶解度タグを破線として示す。(C)TerLインテインホモログのアラインメント(表1)から作成したブロックBループ(左)、ブロックFループ(中央)およびC末端ブロックG(右)の配列ロゴ。
【
図10】(A)~(C)Cat断片における無秩序の局在。(A)示された時間の後に急冷したサンプルを用いたCat
N(左)、Cat
C(中央)および1:1 Cat
N+Cat
C複合体(右)の制限タンパク質分解から得られたRP-HPLCクロマトグラム。(B)Cat
Cの無秩序領域が濃いグレーで強調され、保護中心が薄いグレーで強調されたCatの配列。(C)N-インテインが薄いグレーで強調され、Cat
Cの無秩序領域が濃いグレーで強調され、保護中心が中間的なグレーで強調された、NMR構造上にマッピングしたCat無秩序のモデル。スプライシング残基を棒として示す活性部位の拡大図を示す。
【
図11】(A)~(B)Cat断片の制限タンパク質分解のRP-HPLC分析。(A)表8のESI-MSデータに相当する番号の付いたサンプルを用いたCat
N(左)およびCat
C(右)タンパク質分解実験(t=30分)から得られたRP-HPLC。(B)制限タンパク質分解実験で使用したCat
NおよびCat
Cインテインの一次配列(検出されたタンパク質分解断片を下に角型括弧で示す)。各括弧の数字は、パネルAのRP-HPLCピークに相当する。
【
図12】(A)~(D)疎水性残基はCat会合を駆動する。(A)標準化コンセンサス疎水性スケールに基づいて疎水性残基をグレースケールで着色したCat
Nの表面レンダリング。Cat
Cをアニメーションで表す。(B)疎水性残基をグレースケールで示すCat
Cの表面レンダリング。Cat
Nをアニメーションで表す。(C)低塩バッファー(100mM NaCl黒)および高塩バッファー(500mM NaClグレーの破線)中、SUMO-Cat
C(示された濃度)の存在下でのFl-Cat
N(500pM)の平衡蛍光異方性測定。(D)低塩バッファー(100mM NaCl黒)および高塩バッファー(500mM NaClグレーの破線)中、得られたFl-Cat
N+SUMO-Cat
C会合速度の濃度依存性。
【
図13】(A)~(C)Cat静電表面。(A)Cat
Nの静電表面電位(電気陰性領域が滑らかなグレースケールで着色され、電気陽性領域が模様のあるグレースケールで着色され、中性領域が白で着色される)Cat
Cをアニメーションで表す。(B)Cat
Cの静電表面電位(電気陰性領域が滑らかなグレースケールで着色され、電気陽性領域が模様のあるグレースケールで着色され、中性領域が白で着色される)。Cat
Nをアニメーションで表す。(C)動態結合実験の代表的データおよびフィット。上:SUMO-Cat
Cと混合した場合のFl-Cat
Nのストップフロー異方性測定の非線形最小2乗フィッティングの単一指数関数モデル(左)および二重指数関数モデル(右)。下:実験値と予測値の間に得られた残差値を単一指数関数フィット(左)および二重指数関数フィット(右)についてプロットした。
【
図14】(A)~(E)Catのエクステイン依存性。(A)Catスプライシング時のローカルエクステイン配列の影響を検討するために使用したアッセイの模式図。N-エクステインマルトース結合タンパク質(MBP)はCat
Nに融合し、C-エクステイン緑色蛍光タンパク質(GFP)はCat
Cに融合する。これらの融合タンパク質内に天然エクステイン配列(Phe
-2、Glu
-1、Cys
+1、Glu
+2、Phe
+3)を示す。(B)非天然C-エクステイン残基(n=3、誤差=SEM)の存在下でのCatのスプライシング速度。示されている各値は、野生型(WT)配列からの、C-エクステイン内の単一の点突然変異に相当する。(C)非天然N-エクステイン残基(n=3、誤差=SEM)の存在下でのCatのスプライシング速度。示されている各値は、野生型(WT)配列からの、N-エクステイン内の単一の点突然変異に相当する。(D)Cys
+1、Glu
+2、Asp
115、Asn
123、His
133、およびAla
134を棒として示すCat活性部位の拡大図。(E)Glu
-1、Ala
1、Ser
75、およびHis
78を棒として示すCat活性部位の拡大図。
【発明を実施するための形態】
【0025】
発明の詳細な説明
本開示は、新規非定型スプリットインテインおよび生物化学工学におけるその使用の提供に関する。
【0026】
スプリットインテインN末端断片
第1の側面において、本開示は、配列番号1のアミノ酸配列または配列番号1と少なくとも90%の配列同一性を有するその変異体を含んでなるスプリットインテインN末端断片に関する。
【0027】
本明細書において使用する場合、用語「インテイン」は、前駆体タンパク質からインテイン配列を切り出し、隣接配列(N-エクステインとC-エクステイン)をペプチド結合で連結するタンパク質スプライシング反応を触媒することができる、天然に存在するまたは人為的に構築されたポリペプチド配列を意味する。インテインは一般に150~550アミノ酸の大きさであり、ホーミングエンドヌクレアーゼドメインも含み得る。既知のインテインのリストは、https://inteins.biocenter.helsinki.fi/に公開されている。
【0028】
用語「ポリペプチド」、「ペプチド」または「タンパク質」は本明細書では、いずれの長さのアミノ酸ポリマーも指して、互換的に使用される。
【0029】
用語「アミノ酸」は、天然に存在するアミノ酸および合成アミノ酸、ならびに天然に存在するアミノ酸に類似の様式で機能するアミノ酸類似体およびアミノ酸模倣剤を指す。さらに、用語「アミノ酸」は、D-アミノ酸およびL-アミノ酸(立体異性体)の両方を含む。
【0030】
用語「天然アミノ酸」または「天然に存在するアミノ酸」は、20の天然に存在するアミノ酸を含んでなり、これらのアミノ酸は多くの場合、in vivoで翻訳後修飾を受け、例えば、ヒドロキシプロリン、ホスホセリンおよびホスホトレオニン;ならびに限定されるものではないが、2-アミノアジピン酸、ヒドロキシリジン、イソデスモシン、ノルバリン、ノルロイシンおよびオルニチンを含むその他の異常アミノ酸が含まれる。
【0031】
本明細書において使用する場合、用語「非天然アミノ酸」または「合成アミノ酸」は、カルボン酸、またはアミン基で置換され、天然アミノ酸に構造的に関連するその誘導体を指す。修飾または異常アミノ酸の例示的非限定例としては、2-アミノアジピン酸、3-アミノアジピン酸、β-アラニン、2-アミノ酪酸、4-アミノ酪酸、6-アミノカプロン酸、2-アミノヘプタン酸、2-アミノイソ酪酸、3-アミノイソ酪酸、2-アミノピメリン酸、2,4-ジアミノ酪酸、デスモシン、2,2’-ジアミノピメリン酸、2,3-ジアミノプロピオン酸、N-エチルグリシン、N-エチルアスパラギン、ヒドロキシリシン、アリオヒドロキシリシン、3-ヒドロキシプロリン、4-ヒドロキシプロリン、イソデスモシン、アロイソロイシン、N-メチルグリシン、N-メチルイソロイシン、6-N-メチル-リシン、N-メチルバリン、ノルバリン、ノルロイシン、オルニチンなどが挙げられる。この群にはまた、「天然アミノ酸」のD-異性体も含まれる。
【0032】
用語「スプリットインテイン」は、本明細書において使用する場合、N末端およびC末端アミノ酸配列がペプチド結合によって直接連結されず、その結果、N末端配列とC末端配列はトランススプライシング反応にとって機能的なインテインへと非共有結合的に再会合、または再構成し得る別個の断片となる、いずれのインテインも指す。
【0033】
本明細書において使用する場合、用語「スプリットインテインN末端断片」または「N末端スプリットインテイン」または「N末端インテイン断片」または「N末端インテイン配列」(「Int N」と略される)は、トランススプライシング反応にとって機能的な、すなわち、機能的スプリットインテインC末端断片と会合して、宿主タンパク質からそれ自体を切り出してペプチド結合によるエクステインもしくは隣接配列の連結を触媒し得る完全なインテインを形成し得る、またはスプリットインテインC末端断片と会合した際に「N末端切断」、すなわち、エクステインとスプリットインテインN末端断片のN末端の間のペプチド結合の求核攻撃を触媒して上記ペプチド結合の破断を生じるN末端アミノ酸配列を含んでなる、いずれのインテイン配列も指す。
【0034】
本明細書および添付の特許請求の範囲において使用する場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈がそうでないことを明示しない限り、複数の指示対象を含む。よって、例えば、「1つのスプリットインテイン」という場合には、複数のこのようなスプリットインテインを含み、「そのポリペプチド」という場合には、1以上のポリペプチドおよび当業者に公知のその等価物を含むなどであることに留意されたい。
【0035】
特定の実施形態において、スプリットインテインN末端断片は、配列番号1のアミノ酸配列を含んでなる。スプリットインテインN末端断片は、配列番号1の配列のN末端および/またはC末端に連結されている付加的アミノ酸残基を含んでなり得る。特定の実施形態において、スプリットインテインN末端断片は、配列番号1の配列のN末端および/またはC末端に連結されている10個未満、9個未満、8個未満、7個未満、6個未満、5個未満、4個未満、3個未満、2個未満、または1個の付加的アミノ酸残基を含んでなる。別の実施形態において、スプリットインテインN末端断片は、配列番号1のアミノ酸配列からなる。
【0036】
特定の実施形態において、スプリットインテインN末端断片は、配列番号1と少なくとも90%の配列同一性を有する配列番号1のアミノ酸配列の変異体を含んでなる、またはからなる。
【0037】
用語「変異体」は、本明細書において使用する場合、特定のポリペプチド配列に実質的に類似するポリペプチド分子を指す。この変異体は、それが由来するポリペプチドに構造および生物活性が類似するものであり得る。よって、変異体は、ポリペプチド配列の突然変異体を指し得る。用語「突然変異体」は、その配列が、それが由来するポリペプチド分子に比べて1以上のアミノ酸付加、欠失、置換またはそれ以外の化学修飾を有するポリペプチド分子を指す。突然変異体は、それが由来するポリペプチド分子と実質的に同じ特性を保持してもよいし、または特許請求される配列の生物活性を欠いていてもよい。
【0038】
配列番号1のスプリットインテインN末端断片の変異体は、配列番号1と少なくとも90%の配列同一性を有する。特定の実施形態において、配列番号1のスプリットインテインN末端断片の変異体は、配列番号1と少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%の配列同一性を有する。
【0039】
本開示のこの側面の特定の実施形態において、配列番号1のスプリットインテインN断片の変異体は、14~60アミノ酸、例えば、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59または60アミノ酸の長さを有する。
【0040】
2以上のアミノ酸またはヌクレオチド配列に関して用語「同一性」、「同一」、「同一性パーセント」または「配列同一性」とは、配列同一性の一部として保存的アミノ酸置換を考慮せずに、最大限一致するように比較およびアラインした場合(必要であれば、ギャップを導入する)に同じである、または同じであるアミノ酸残基の特定のパーセンテージを有する2以上の配列または部分配列を指す。同一性パーセントは、配列比較ソフトウエアもしくはアルゴリズムを用いて、または目視によって評価することができる。当技術分野では、アミノ酸配列のアラインメントを得るために使用することができる様々なアルゴリズムおよびソフトウエアが知られている。配列アラインメントアルゴリズムの1つのこのような限定されない例としては、Karlin et al., 1990, Proc. Natl. Acad. Sci., 87:2264-8に記載され、Karlin et al., 1993, Proc. Natl. Acad. Sci., 90:5873-7で改変され、NBLASTおよびXBLASTプログラム(Altschul et al., 1991 , Nucleic Acids Res., 25:3389-402)に組み込まれているものが挙げられる。特定の実施形態において、Gapped BLASTは、Altschul et al., 1997, Nucleic Acids Res. 25:3389-402に記載されているようにして使用するこができる。BLAST-2、WU-BLAST-2(Altschul et al., 1996, Methods in Enzymology, 266:460-80)、ALIGN、ALIGN-2(Genentech、サウスサンフランシスコ、カリフォルニア州)またはMegalign(DNASTAR)は、配列をアラインするために使用可能なさらなる公開ソフトウエアプログラムである。特定の別の実施形態において、Needleman and Wunsch (J. Mol. Biol. 48:444-53 (1970))のアルゴリズムを組み込んでいるGCGソフトウエアパッケージのGAPプログラムは、2つのアミノ酸配列間の同一性パーセントを決定するために使用することができる(例えば、Blossum 62マトリックス
またはPAM250マトリックス、およびギャップウエイト16、14、12、10、8、6、または4およびレングスウエイト1、2、3、4、5を使用)。あるいは、特定の実施形態において、アミノ酸配列間の同一性パーセントは、Myers and Miller (CABIOS, 4:1 1 -7 (1989))のアルゴリズムを用いて決定される。例えば、同一性パーセントは、ALIGNプログラム(バージョン2.0)を使用し、PAM120を残基表、ギャップレングスペナルティー12およびギャップペナルティー4とともに用いて決定することができる。特定のアラインメントソフトウエアによる最大アラインメントのための適当なパラメーターは、当業者により決定可能である。特定の実施形態において、アラインメントソフトウエアのデフォルトパラメーターを使用する。特定の実施形態において、第2のアミノ酸配列に対する第1のアミノ酸配列の同一性パーセンテージ「X」は、100×(Y/Z)として計算され、式中、Yは、第1の配列と第2の配列のアラインメント(目視または特定の配列アラインメントプログラムによりアライン)において同一の一致としてスコアリングされたアミノ酸残基数であり、Zは、第2の配列の残基総数である。第2の配列が第1の配列よりも長い場合には、両配列の全体を考慮したグローバルアラインメントを使用し、従って、各配列の総ての文字およびヌルをアラインする必要がある。この場合、上と同じ式が使用可能であるが、Z値としては、第1の配列と第2の配列がオーバーラップする領域の長さを用い、上記領域は第1の配列の長さと実質的に同じ長さを有する。
【0041】
限定されない例として、任意の特定のポリペプチドが参照配列に対して特定の配列同一性パーセンテージを有する(例えば、少なくとも80%同一、少なくとも85%同一、少なくとも90%同一である、いくつかの実施形態においては、少なくとも95%、96%、97%、98%、または99%同一である)かどうかは、特定の実施形態においては、Bestfitプログラム(Unix用Wisconsin Sequence Analysis Package、バージョン8、Genetics Computer Group、University Research Park、575 Science Drive、マディソン、Wl 5371 1)を用いて決定することができる。Bestfitは、2配列間のホモロジーのベストセグメントを見つけ出すためにSmith and Waterman, Advances in Applied Mathematics 2:482-9 (1981)のローカルホモロジーアルゴリズムを使用する。Bestfitまたは特定の配列が本開示に従って参照配列と例えば95%同一であるかどうかを決定するための他のいずれかの配列アラインメントプログラムを用いる場合、パラメーターは、同一性のパーセンテージが参照アミノ酸配列の全長にわたって計算され、ホモロジーに参照配列のヌクレオチド総数の5%までのギャップを許容するように設定する。
【0042】
特定の実施形態において、配列番号1のスプリットインテインN末端断片の変異体は、配列の全長にわたって配列番号1と少なくとも90%の配列同一性を有する。
【0043】
特定の実施形態において、配列番号1のスプリットN-インテイン断片の変異体は、配列番号2~6、および125~127からなる群から選択されるアミノ酸配列を含んでなる、またはからなる。
【0044】
別の実施形態において、配列番号1のスプリットN-インテイン断片の変異体は、配列番号1の機能的に同等の変異体である。
【0045】
用語「機能的に同等の変異体」とは、本明細書において使用する場合、1以上のアミノ酸の修飾、挿入および/または欠失によって配列から誘導される総てのタンパク質を意味するものと理解され、その機能が実質的に維持される場合、特に、スプリットインテインN末端断片の機能的に同等の変異体の場合には、その活性を維持することを指す。
【0046】
特定の実施形態において、配列番号1のスプリットインテインN末端断片の機能的に同等の変異体は、配列番号1のスプリットインテインN末端断片の活性を維持または改善する。
【0047】
用語「活性」は、スプリットインテインN末端断片に関して本明細書において使用する場合、スプリットインテインC末端断片に結合し、「N末端切断」、すなわち、エクステインとスプリットインテインN末端断片のN末端の間のペプチド結合の求核攻撃を触媒して上記ペプチド結合の破断を生じるスプリットインテインN末端断片の能力を指す。スプリットインテインN末端断片の活性はまた「トランススプライシング活性」も指すことができ、これは、機能的スプリットインテインC末端断片に結合し、宿主タンパク質から完全なインテインを切り出し、ペプチド結合によるエクステインまたは隣接配列の連結を触媒する上記スプリットインテインN末端断片の能力として理解される。この活性は、温度、pHおよびカオトロピック剤の存在を含む反応条件に依存する。慣用単位はt1/2であり、これは触媒される反応の半分が完了する時間を表す。さらに、インテイン活性はまた、触媒される反応の速度定数(k)、すなわち、毎秒何回の反応が起こるかによって評価される。
【0048】
あるポリペプチドがそのトランススプライシング活性に関して、所与のスプリットN-インテインの機能的に同等の変異体であるかどうかを決定するための好適なアッセイは、これらのアッセイにおいて、スプリットインテインN末端断片が、機能的スプリットインテインC末端断片、すなわち、「C末端切断」を触媒し得るスプリットインテインC末端断片と組み合わされる限り、例えば、本願の方法またはShah NH et al (Shah NH et al., 2012, J Chem Soc, vol 134, 11338)に開示されている方法に記載されているものなどのスプライシングアッセイを含む。上記のアッセイは、機能的N-インテイン断片およびC-インテイン断片が互いに結合し、次に、それらが自身を切り出し、N-エクステインとC-エクステインの間に新たなペプチド結合を生じる反応を遂行するトランススプライシング反応の判定および特性決定を可能とする。その他のアッセイとして、機能的N-インテインおよびトランススプライシングを妨げるC-インテイン突然変異体の使用に頼り、その結果、N-インテインからN-エクステインが切り出された後に反応が停止されるものが開発されている。このようなアッセイ(Vila-Perello et al. J Am Cem Soc. 2013, 135(1): 286-292)は、N末端切断反応を遂行するN-インテインの能力の特性決定を可能とする。さらに、N末端インテインとC末端インテインの間の親和性を測定するための他のアッセイも存在する(Shah et al. Angew Chem Int Ed Engl. 2011, 50(29): 6511-5)。
【0049】
本開示によれば、本開示のスプリットN-インテインの活性は、機能的同等物がその活性の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも100%を有する場合に、実質的に維持されている。さらに、本開示のスプリットN-インテインの活性は、機能的に同等の変異体がその活性の少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも6%、少なくとも7%、少なくとも8%、少なくとも9%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、または少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも150%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、少なくとも1000%、またはそれを超える活性を有する場合に、実質的に改善されている。
【0050】
前述のように、本開示のスプリットN-インテインの活性は、温度、カオトロピック環境およびpHを含むいくつかの反応パラメーターに依存する。よって、1つの実施形態において、本開示のスプリットインテインN末端断片の機能的に同等の変異体は、少なくとも0℃、少なくとも5℃、少なくとも10℃、少なくとも15℃、少なくとも20℃、少なくとも25℃、少なくとも30℃、少なくとも35℃、少なくとも37℃、少なくとも40℃、少なくとも45℃、少なくとも50℃、少なくとも55℃、少なくとも60℃、少なくとも65℃、少なくとも70℃またはそれより高い温度、特定の実施形態においては、50℃の温度でその活性を維持または改善する。同様に、別の実施形態において、本開示のスプリットN-インテインの機能的に同等の変異体は、少なくともpH2.0で、または少なくともpH2.5で、または少なくともpH3.0で、または少なくともpH3.5で、または少なくともpH4.0で、または少なくともpH4.5で、または少なくともpH5.0で、または少なくともpH5.5で、または少なくともpH6.0で、または少なくともpH6.5で、または少なくともpH7.0で、または少なくともpH7.2で、または少なくともpH7.5で、または少なくともpH8.0で、または少なくともpH8.5で、または少なくともpH9.0で、または少なくともpH9.5で、または少なくともpH10.0で、または少なくともpH10.5で、または少なくともpH11.0で、または少なくともpH11.5で、または少なくともpH12.0で、または少なくともpH12.5で、または少なくともpH13.0で、または少なくともpH13.5で、または少なくともpH14で、特定の実施形態においては、pH7.2でその活性を維持または改善する。別の実施形態において、本開示のスプリットN-インテインの機能的に同等の変異体は、尿素1Mで、または少なくとも尿素1.5Mで、または尿素少なくとも2Mで、または少なくとも尿素3Mで、または少なくとも尿素3.5Mで、または少なくとも尿素4Mで、または少なくとも尿素4.5Mで、または少なくとも尿素5Mで、特定の実施形態においては、尿素2Mでまたは尿素4Mでその活性を維持または改善する。特定の実施形態において、本開示のスプリットN-インテインの機能的に同等の変異体は、尿素2Mまたは尿素4Mでその活性を維持または改善する。特定の実施形態において、本開示のスプリットN-インテインの機能的に同等の変異体は、50℃の温度で、pH7.2で、および尿素2Mまたは尿素4Mでその活性を維持または改善する。また、温度、尿素濃度、その他の変性剤およびpHのあらゆる可能性のある組合せが本発明により企図される。
【0051】
特定の実施形態において、その活性を維持または改善する本開示のスプリットインテインN末端断片の機能的に同等の変異体は、配列番号1と少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有する。
【0052】
別の実施形態において、配列番号1のスプリットインテインN末端断片の機能的に同等の変異体は、配列番号4または配列番号125のアミノ酸配列を含んでなるまたはからなる。
【0053】
スプリットインテインN末端断片を含んでなる複合体
別の側面において、本開示は、
(i)目的化合物、
(ii)本開示のスプリットインテインN末端断片、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる複合体、以下、本開示の第1の複合体であって、
上記複合体は、場合により(i)と(ii)の間にリンカーを含んでなり、
目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている複合体に関する。
【0054】
本明細書において使用する場合、用語「目的化合物」には、タンパク質またはペプチド、一本鎖または二本鎖オリゴヌクレオチド、小分子薬または細胞傷害性分子を含むいずれの合成または天然に存在する分子も含む。従って、この用語は、薬物、ワクチン、ならびにタンパク質、ペプチドなどの分子を含む生物製剤と従来見なされている化合物を包含する。治療薬の例は、メルクインデックス(第14版)、PDR(Physician’s Desk Reference)(第64版)、およびThe Pharmacological Basis of Therapeutics(第1版)などの周知の文献に記載され、それらには限定するものではないが、薬剤;疾患または病気の治療、予防、診断、治癒または緩和のために使用される物質;身体の構造または機能に影響を及ぼす物質;または生理学的環境に置かれた後に生物学的に活性型となるかもしくはより活性が高くなるプロドラッグが含まれる。さらに、「目的化合物」は、N-インテインのアミノ末端に結合することができるカルボキシル基を有するいずれの非タンパク質分子も含み得る。
【0055】
場合により、目的化合物およびスプリットインテインN末端断片はリンカーを介して連結されてもよく、従って、リンカーは目的化合物とN-インテインの間に配置される。リンカーの性質は、目的化合物の性質によって異なる。特定の実施形態において、リンカーはペプチドである。特定の実施形態において、リンカーは、1、2、3、4、5、10、20、50、100またはそれを超えるアミノ酸残基長を有するペプチドであり;具体的には、それは1~3アミノ酸残基であり得る。目的化合物がペプチドまたはタンパク質である場合、リンカーのN末端は目的化合物のC末端に連結され、リンカーのC末端はN-インテインのN末端にペプチド結合を介して連結される。
【0056】
特定の実施形態において、リンカーは、非ペプチドリンカーである。非ペプチドリンカーは、例えば、アルキルリンカー、例えば、-HN-(CH2)s-CO-であり、ここで、s=2~20が使用可能である。これらのアルキルリンカーは、低級アルキル(例えば、Ci-Ce)、ハロゲン(例えば、Cl、Br)、CN、NH2、フェニルなどのいずれの非立体障害基によってさらに置換されていてもよい。
【0057】
非ペプチドリンカーのもう1つのタイプは、ポリエチレングリコール基、例えば、-HN-(CH2)2-(0-CH2-CH2)n-0-CH2-COであり、ここで、nは、リンカーの総分子量がおよそ101~5000、特定の実施形態においては、101~500の範囲となるようなものである。
【0058】
別の実施形態において、非ペプチドリンカーは、塩基ヌクレオチド、ポリエーテル、ポリアミン、ポリアミド、炭水化物、脂質、ポリ炭化水素、または他のポリマー化合物を含んでなる。
【0059】
特定の実施形態において、複合体は、目的化合物とスプリットインテインN末端断片の間にリンカーを含まない。この実施形態において、目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されている。
【0060】
特定の実施形態において、複合体は、目的化合物とスプリットインテインN末端断片の間にリンカーを含んでなる。この実施形態において、目的化合物は、目的化合物およびリンカーの化学的性質に応じていずれの好適な手段によってリンカーに結合されてもよい。この実施形態において、リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている。別の実施形態において、目的化合物はアミド結合によってリンカーに結合され、この場合には、リンカーは、いずれの好適な手段によってスプリットインテインN末端断片のN末端に結合(found)されてもよい。別の実施形態において、目的化合物は、アミド結合によってリンカーに結合され、そのリンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合される。
【0061】
別の実施形態において、目的化合物は、配列番号1のN-インテインを含んでなるインテインによりスプライシングされ得るエクステインのC末端アミノ酸残基を有するタンパク質である。別の実施形態において、目的化合物は、そのC末端に配列Glu-Phe-Gluを有するタンパク質である。別の実施形態において、目的化合物は、そのC末端に配列Phe-Gluを有するタンパク質である。別の実施形態において、目的化合物は、そのC末端に残基Gluを有するタンパク質である。
【0062】
別の実施形態において、目的化合物がタンパク質でない場合、N-インテインは、配列番号4~6、125~127または168~170のポリペプチドを含んでなるまたはからなる。別の実施形態において、目的化合物がタンパク質でない場合、目的化合物およびN-インテインはリンカーを介して連結され、この場合には、リンカーは、配列番号1の配列のスプリットインテインN末端断片を含んでなるインテインによりスプライシングされ得るエクステインのC末端アミノ酸残基を有するペプチドであり、特定の実施形態においては、リンカーは、そのC末端に配列Glu-Phe-Glu、Phe-GluまたはGluを有するペプチドである。
【0063】
別の実施形態において、目的化合物は、配列番号1のスプリットインテインN末端断片を含んでなるインテインによりスプライシングされ得るエクステインのC末端アミノ酸残基を有さないタンパク質であり、この場合には、(i)N-インテインは配列番号4~6、125~127もしくは168~170の配列のポリペプチドを含んでなる、もしくはからなるか、または(ii)目的化合物およびN-インテインは、リンカーを介して連結され、この場合には、リンカーは、配列番号1のスプリットインテインN末端断片を含んでなるインテインによりスプライシングされ得るエクステインのC末端アミノ酸残基を有するペプチドであり、特定の実施形態においては、リンカーは、そのC末端に配列Glu-Phe-Glu、Phe-GluまたはGluを有するペプチドである。
【0064】
「ペプチド結合」という句は、一方の分子のカルボキシ部分(カルボキシ成分と呼ばれる)が他方の分子のアミノ部分(アミノ成分と呼ばれる)と反応して分子の遊離を引き起こす場合に2分子間に形成される共有結合的化学結合-CO-NH-を指す。例えば、タンパク質を構成するL-アミノ酸は、1分子の水の遊離を伴って連結する際にペプチド結合を形成し得る。従って、タンパク質およびペプチドは、ペプチド結合によって一緒に保持されるアミノ酸残基の鎖と見なすことができる。ペプチド結合は、「アミド結合(amide bond)」または「アミド結合(amide linkage)」である。
【0065】
特定の実施形態において、目的化合物は、タンパク質またはポリペプチドである。
【0066】
別の実施形態において、目的化合物は、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質である。
【0067】
特定の実施形態において、タンパク質は、Cas9、またはCas9の断片である。用語「Cas9」または「CRISPR関連エンドヌクレアーゼCas9」は、本明細書において使用する場合、II型CRISPR-Casシステムの特徴的なタンパク質であり、2つの非コードRNA:CRISPR RNA(crRNA)とトランス活性化crRNA(tracrRNA)の複合体によって、PAM(プロトスペーサー隣接モチーフ)配列モチーフに隣接するDNA標的配列にガイドされる大きな単量体DNAヌクレアーゼであるタンパク質を指す。Cas9タンパク質は、RuvCおよびHNHヌクレアーゼに相同な2つのヌクレアーゼドメインを含む。HNHヌクレアーゼドメインは相補的DNA鎖を切断し、RuvC様ドメインは非相補鎖を切断し、結果として、標的DNAに平滑切断が導入される。Cas9をsgRNAとともに異種発現させると、様々な生物の生細胞のゲノムDNAに部位特異的な二本鎖切断(DSB)を導入することができる。Cas9は、例えば、とりわけストレプトコッカス・サーモフィルス(Streptocccus thermophilus)、化膿連鎖球菌(Streptococcus pyogenes)、黄色ブドウ球菌(Staphylococcus aeureus)、野兎病菌(Francisella tularensis)、アクチノマイセス・ネスランディ(Actinomyces naeslundii)、髄膜炎菌(Neiserria meningitides)、リステリア・イノキュア(Listeria innocua)を含む、いずれの起源のものであってもよい。特定の実施形態において、用語「Cas9」は、UniProtKB/Swiss-Prot受託番号G3ECR1(2019年4月10日のエントリーバージョン31、2012年6月13日の配列バージョン2)、Q99ZW2(2019年7月31日のエントリーバージョン112、2001年6月1日の配列バージョン1)、J7RUA5(2019年5月8日のエントリーバージョン33、2012年10月31日の配列バージョン1)、A0Q5Y3(2019年1月16日のエントリーバージョン62、2007年1月9日の配列バージョン1)、J3F2B0(2019年5月8日のエントリーバージョン33、2012年10月3日の配列バージョン1)、Q03JI6(2019年5月8日のエントリーバージョン70、2006年11月14日の配列バージョン1)、C9X1G5(2019年7月31日のエントリーバージョン47、2009年11月24日の配列バージョン1)、Q927P4(2019年5月8日のエントリーバージョン94、2001年12月1日の配列バージョン1)によって定義されるタンパク質のいずれか1つを指す。
【0068】
特定の実施形態において、複合体の目的化合物はポリペプチドまたはタンパク質であり、複合体がリンカーを含んでなる場合、リンカーはペプチドリンカーである。この実施形態において、複合体は融合タンパク質である。
【0069】
用語「融合タンパク質」は、当技術分野で周知であり、天然および/または人工の異なる起源に由来する2つ以上の配列を含んでなる人工的に設計された単一のポリペプチド鎖を指す。融合タンパク質は、定義に従えば、天然にそのものとしては見られない。
【0070】
用語「単一のポリペプチド鎖」は、本明細書において使用する場合、融合タンパク質のポリペプチド成分は端と端をコンジュゲートすることもできるし、共有結合により連結された、それらの間に挿入される1以上の任意選択のペプチドまたはポリペプチド「リンカー」または「スペーサー」を含んでもよいことを意味する。
【0071】
別の実施形態において、目的ポリペプチドは、抗体または抗体のフラグメントである。
【0072】
本明細書において使用する場合、用語「抗体」は、決定された抗原、または抗原内のエピトープに対する結合能を有し、軽鎖または重鎖の全部または一部を含んでなる少なくとも1つのポリペプチドを含んでなる単量体または多量体タンパク質を指す。
【0073】
用語抗体はまた、例えば、ポリクローナル抗体、モノクローナル抗体および遺伝子操作抗体、例えば、キメラ抗体、ヒト化抗体、霊長類化抗体、ヒト抗体、ラクダ科動物抗体および二重特異性抗体(ダイアボディを含む)、多重特異性抗体(例えば、二重特異性抗体)、および所望の生物活性を示す限り抗体フラグメントといったいずれのタイプの既知の抗体も含む。
【0074】
用語「抗体フラグメント」は、Fab、F(ab’)2、Fab’、一本鎖Fv断片(scFv)、ダイアボディおよびナノボディなどの抗体フラグメントを含む。
【0075】
抗体の例示的非限定例は、DEC-205受容体に対する抗体である。用語「DEC-205受容体」、または「リンパ球抗原75」、または「C型レクチンドメインファミリー13メンバーB」は、本明細書において使用する場合、捕捉した抗原を細胞外間隙から特殊な抗原プロセッシングコンパートメントへ向けるためのエンドサイトーシス受容体として働き、主として樹状細胞上に見られるタンパク質を指す。特定の実施形態において、DEC-205は、UniProtKB/Swiss-Prot受託番号O60449(2019年7月31日のエントリーバージョン170、2011年1月11日の配列バージョン3)により定義されるヒトタンパク質である。特定の実施形態において、抗DEC205抗体は、モノクローナル抗体である。抗DEC-205抗体は、例えば、マウス、ウサギ、ヒトなどのいずれの起源であってもよく、またはヒト化抗体であってもよい。特定の実施形態において、目的化合物は、抗DEC-205抗体の鎖、特定の実施形態においては、重鎖である。別の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5により記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0076】
別の実施形態において、目的化合物はタンパク質の断片、特定の実施形態においては、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質の断片である。
【0077】
別の実施形態において、目的化合物はタンパク質のN末端断片、特定の実施形態においては、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質の断片である。用語「タンパク質のN末端断片」は、本明細書において使用する場合、タンパク質のN末端を含む様々な長さの断片を指す。特定の実施形態において、N末端断片は、全長タンパク質の長さの100%未満、90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満を含んでなる断片である。
【0078】
特定の実施形態において、複合体は、配列番号111、112および113からなる群から選択されるアミノ酸配列を含んでなるまたはからなるスプリットインテインN末端断片を含んでなる。
【0079】
特定の実施形態において、配列番号112および113の配列は、配列番号1の配列より高い温度安定性を有する。
【0080】
特定の実施形態において、複合体は、配列番号49~68またはその変異体からなる群から選択されるアミノ酸配列を含んでなるまたはからなるスプリットインテインN末端断片を含んでなる。特定の実施形態において、変異体は、機能的に同等の変異体である。
【0081】
用語「変異体」および「機能的に同等の変異体」は、従前に定義されている。特定の実施形態において、配列番号49~68のスプリットインテインN末端断片の機能的に同等の変異体は、それらが由来する配列と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%または少なくとも99%の配列同一性を有する。
【0082】
特定の実施形態において、配列番号49~68のスプリットインテインN末端断片の機能的に同等の変異体は、それらが由来する配列の活性を維持するか、またはその活性を改善する。用語「活性」ならびにこの活性を測定するための方法は、配列番号1のスプリットインテインN末端断片の機能的に同等の変異体に関して従前に定義されている。配列番号1のスプリットインテインN末端断片の変異体の活性に関する実施形態は、配列番号49~68のスプリットインテインN末端断片の変異体の活性にもそのまま当てはまる。
【0083】
スプリットインテインC末端断片
別の側面において、本開示は、アミノ酸配列番号7の配列または配列番号7と少なくとも88%の配列同一性を有するその変異体を含んでなるスプリットインテインC末端断片に関する。
【0084】
本明細書において互換的に使用される場合、用語「スプリットインテインC末端断片」、「C末端スプリットインテイン」、「C末端インテイン断片」および「C末端インテイン配列」(「IntC」と略す)は、トランススプライシング反応に関して機能的な、すなわち、機能的スプリットインテインN末端断片と会合して、宿主タンパク質からそれ自体を切り出してペプチド結合によるエクステインもしくは隣接配列の連結を触媒し得る完全なインテインを形成し得る、またはスプリットN-インテインと会合した際に「C末端切断」、すなわち、エクステインとスプリットインテインC末端断片のC末端の間のペプチド結合の求核攻撃を触媒して上記ペプチド結合の破断を生じるC末端アミノ酸配列を含んでなる、いずれのインテイン配列も指す。よって、IntCはまた、トランススプライシングが生じた際にスプライシングによって除去される配列も含んでなる。IntCは、天然に存在するインテイン配列のC末端部分の修飾としての配列を含んでなり得る。例えば、それは、付加的アミノ酸残基および/または変異残基を含んでなり得る(そのような付加および/または変異残基の包含がIntCをトランススプライシングに非機能的としない限り)。特定の実施形態において、付加的残基および/または変異残基の包含は、IntCのトランススプライシング活性を改善または増強する。
【0085】
特定の実施形態において、スプリットインテインC末端断片は、配列番号7のアミノ酸配列を含んでなる。スプリットインテインC末端断片は、配列番号7の配列のN末端および/またはC末端に連結された付加的アミノ酸残基を含んでなり得る。特定の実施形態において、スプリットインテインC末端断片は、配列番号7の配列のN末端および/またはC末端に連結された10未満、9未満、8未満、7未満、6未満、5未満、4未満、3未満、2未満、または1個の付加的アミノ酸残基を含んでなる。別の実施形態において、スプリットインテインN末端断片は、配列番号7のアミノ酸配列からなる。
【0086】
特定の実施形態において、スプリットインテインC末端断片は、配列番号7と少なくとも88%の配列同一性を有する配列番号7のアミノ酸配列の変異体を含んでなるまたはからなる。
【0087】
用語「アミノ酸」および「変異体」は、N-インテインに関してすでに記載されており、この場合にも同様に当てはまる。
【0088】
配列番号7のスプリットインテインC末端断片の変異体は、配列番号7と少なくとも88%の配列同一性を有する。特定の実施形態において、配列番号7のスプリットインテインC末端断片の変異体は、配列番号7と少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%の配列同一性を有する。
【0089】
特定の実施形態において、配列番号7のスプリットインテインC末端断片の変異体は、50~160アミノ酸長、特定の実施形態においては、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155または160アミノ酸長を有する。
【0090】
特定の実施形態において、配列番号7のスプリットインテインC末端断片の変異体は、配列の全長にわたって配列番号7と少なくとも88%の配列同一性を有する。
【0091】
特定の実施形態において、配列番号7の配列のスプリットインテインC末端断片の変異体は、配列番号848および128~166からなる群から選択されるアミノ酸配列を含んでなるまたはからなる。
【0092】
別の実施形態において、配列番号7のスプリットC-インテインの変異体は、配列番号7の機能的に同等の変異体である。
【0093】
用語「機能的に同等の変異体」は、スプリットインテインC末端断片に関して従前に定義されている。配列番号7のスプリットインテインC末端断片の機能的に同等の変異体の場合、スプリットインテインC末端断片の活性は、スプリットインテインN末端断片に結合し、「C末端切断」、すなわち、エクステインとスプリットインテインC末端断片のC末端の間のペプチド結合の求核攻撃を触媒して上記ペプチド結合の破断を生じるその能力を指す。スプリットインテインC末端断片の活性はまた「トランススプライシング活性」を指す場合もあり、これは、機能的スプリットインテインN末端断片に結合し、宿主タンパク質から完全なインテインを切り出し、ペプチド結合によるエクステインまたは隣接配列の連結を触媒する上記スプリットインテインC末端断片の能力として理解される。あるポリペプチドがそのトランススプライシング活性に関して、所与のスプリットC-インテインの機能的に同等の変異体であるかどうかを決定するための好適なアッセイは、これらのアッセイにおいて、スプリットインテインC末端断片が、機能的スプリットインテインN末端断片、すなわち、N末端切断を触媒し得るスプリットインテインN末端断片と組み合わされる限り、例えば、本願の方法またはShah NH et al (Shah NH et al., 2012, J Chem Soc, vol 134, 11338)に開示されている方法に記載されているものなどのスプライシングアッセイを含む。また、タンパク質スプライシングの各段階、特に、本明細書において「C末端切断」(Shah et al. JACS 2013)と呼ぶC-インテインとC-エクステインの間のペプチド結合の切断を含む最終工程の特性決定を可能とする他のより詳細なアッセイも記載されている。
【0094】
本開示によれば、C-インテインの活性は、その機能的同等物が特許請求された配列のインテインの活性の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも100%を有する場合に、実質的に維持されている。さらに、C-インテインの活性は、機能的に同等の変異体が本開示のC-インテインの活性の少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも6%、少なくとも7%、少なくとも8%、少なくとも9%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、または少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも150%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、少なくとも1000%、またはそれを超える活性を有する場合に、実質的に改善されている。
【0095】
前述のように、本開示のスプリットインテインC末端断片の活性は、温度、カオトロピック環境およびpHを含むいくつかの反応パラメーターに依存する。よって、1つの実施形態において、本開示のスプリットインテインC末端断片の機能的に同等の変異体は、少なくとも0℃、少なくとも5℃、少なくともl0℃、少なくともl5℃、少なくとも20℃、少なくとも25℃、少なくとも30℃、少なくとも35℃、少なくとも37℃、少なくとも40℃、少なくとも45℃、少なくとも50℃、少なくとも55℃、少なくとも60℃、少なくとも65℃、少なくとも70℃またはそれより高い温度でその活性を維持または改善する。特定の実施形態において、本開示のスプリットインテインC末端断片の機能的に同等の変異体は、50℃の温度でその活性を維持または改善する。同様に、別の実施形態において、本開示のスプリットインテインC末端断片の機能的に同等の変異体は、少なくともpH0.1で、または少なくともpH0.5で、または少なくともpH1.0で、または少なくともpH1.5で、または少なくともpH2.0で、または少なくともpH2.5で、または少なくともpH3.0で、または少なくともpH3.5で、または少なくともpH4.0で、または少なくともpH4.5で、または少なくともpH5.0で、または少なくともpH5.5で、または少なくともpH6.0で、または少なくともpH6.5で、または少なくともpH7.0で、または少なくともpH7.2で、または少なくともpH7.5で、または少なくともpH8.0で、または少なくともpH8.5で、または少なくともpH9.0で、または少なくともpH9.5で、または少なくともpH10.0で、または少なくともpH10.5で、または少なくともpH11.0で、または少なくともpH11.5で、または少なくともpH12.0で、または少なくともpH12.5で、または少なくともpH13.0で、または少なくともpH13.5で、またはpH14でその活性を維持または改善する。特定の実施形態において、本開示のスプリットインテインC末端断片の機能的に同等の変異体は、pH7.2でその活性を維持または改善する。別の実施形態において、本開示のスプリットインテインC末端断片の機能的に同等の変異体は、尿素1Mで、または少なくとも尿素1.5Mで、または少なくとも尿素2Mで、または少なくとも尿素3Mで、または少なくとも尿素3.5Mで、または少なくとも尿素4Mで、または少なくとも尿素4.5Mで、または少なくとも尿素5Mでその活性を維持または改善する。特定の実施形態において、本開示のスプリットC-インテインの機能的に同等の変異体は、尿素2Mまたは尿素5Mでその活性を維持または改善する。特定の実施形態において、本開示のスプリットC-インテインの機能的に同等の変異体は、50℃の温度、pH7.2および尿素2Mまたは尿素4Mでその活性を維持または改善する。温度、尿素濃度およびpHのあらゆる可能性のある組合せが本発明により企図される。
【0096】
特定の実施形態において、その活性を維持または改善する本開示のスプリットインテインC末端断片の機能的に同等の変異体は、配列番号7と少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有する。
【0097】
別の実施形態において、スプリットインテインC末端断片の機能的に同等の変異体は、配列番号10~22および128~140からなる群から選択されるアミノ酸配列を含んでなるまたはからなる。
【0098】
スプリットインテインC末端断片を含んでなる複合体
別の側面において、本開示は、
(i)配列番号7のスプリットインテインC末端断片または配列番号114~120からなる群から選択される配列を含んでなるスプリットインテインC末端断片、および
(ii)目的化合物
を含んでなる複合体、以下、本開示の第2の複合体であって、
上記複合体は、場合により、(i)と(ii)の間にリンカーを含んでなり、
目的化合物がアミド結合によってスプリットインテインC末端断片のC末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合されている複合体に関する。
【0099】
用語「目的化合物」および「リンカー」は、本開示の第1の複合体に関して従前に定義されている。本開示の第1の複合体の目的化合物およびリンカーの実施形態は総て、本開示の第2の複合体にそのまま当てはまる。
【0100】
特定の実施形態において、複合体は、目的化合物とスプリットインテインC末端断片の間にリンカーを含まない。この実施形態において、目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に連結される。
【0101】
特定の実施形態において、複合体は、目的化合物とスプリットインテインC末端断片の間にリンカーを含んでなる。この実施形態において、目的化合物は、目的化合物およびリンカーの化学的性質に応じていずれの好適な手段によってリンカーに結合されてもよい。この実施形態において、リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合されている。別の実施形態において、目的化合物はアミド結合によってリンカーに結合され、この場合には、リンカーは、いずれの好適な手段によってスプリットインテインC末端断片のC末端に結合されてもよい。別の実施形態において、目的化合物は、アミド結合によってリンカーに結合され、そのリンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合される。
【0102】
別の実施形態において、目的化合物は、配列番号7の配列のスプリットインテインC末端断片を含んでなるインテインによってスプライシングされ得るエクステインのN末端アミノ酸残基を有するタンパク質である。別の特定の実施形態において、目的化合物は、そのN末端に配列Cys-Xaa1-Xaa2またはCys-Xaa1-Xaa2-Leuを有するタンパク質であり、ここで、
Xaa1およびXaa2は任意のアミノ酸であり;
Xaa1はAla、Gly、ArtまたはPheであり、Xaa2は任意のアミノ酸であり;
Xaa1は任意のアミノ酸であり、Xaa2はGly、Glu、AlaまたはArgであり;
Xaa1はAla、Gly、ArtまたはPheであり、Xaa2はGly、Glu、AlaまたはArgである。
【0103】
別の実施形態において、目的化合物は、そのN末端にCys-Glu-Phe、Cys-Ala-Phe;Cys-Gly-Phe;Cys-Arg-Phe、Cys-Phe-Phe、Cys-Glu-Gly、Cys-Glu-Glu、Cys-Glu-Ala、Cys-Glu-Phe-Leu、Cys-Ala-Phe-Leu;Cys-Gly-Phe-Leu;Cys-Arg-Phe-Leu、Cys-Phe-Phe-Leu、Cys-Glu-Gly-Leu、Cys-Glu-Glu-LeuおよびCys-Glu-Ala-Leuから選択される配列を有するタンパク質である。
【0104】
別の実施形態において、目的化合物がタンパク質でない場合、C-インテインは、配列番号10~48または配列番号128~166からなる群から選択されるポリペプチドを含んでなるまたはからなる。別の実施形態において、目的化合物がタンパク質でない場合、目的化合物およびC-インテインはリンカーを介して連結され、この場合には、リンカーは、配列番号7の配列のスプリットインテインC末端断片を含んでなるインテインによりスプライシングされ得るエクステインのN末端アミノ酸残基を有するペプチドであり、特定の実施形態においては、リンカーは、そのN末端に配列Cys-Xaa1-Xaa2またはCys-Xaa1-Xaa2-Leuを有するペプチドであり、ここで、
Xaa1およびXaa2は任意のアミノ酸であり;
Xaa1はAla、Gly、ArtまたはPheであり、Xaa2は任意のアミノ酸であり;
Xaa1は任意のアミノ酸であり、Xaa2はGly、Glu、AlaまたはArgであり;
Xaa1はAla、Gly、ArtまたはPheであり、Xaa2はGly、Glu、AlaまたはArgである;
あるいはリンカーは、そのN末端にCys-Glu-Phe、Cys-Ala-Phe、Cys-Gly-Phe、Cys-Arg-Phe、Cys-Phe-Phe、Cys-Glu-Gly、Cys-Glu-Glu、Cys-Glu-Ala、Cys-Glu-Phe-Leu、Cys-Ala-Phe-Leu、Cys-Gly-Phe-Leu、Cys-Arg-Phe-Leu、Cys-Phe-Phe-Leu、Cys-Glu-Gly-Leu、Cys-Glu-Glu-LeuおよびCys-Glu-Ala-Leuから選択される配列を有するペプチドである。
【0105】
別の実施形態において、目的化合物は、配列番号7のスプリットC-インテインを含んでなるインテインによってスプライシングされ得るエクステインのN末端アミノ酸残基を有さないタンパク質であり、この場合には、(i)C-インテインは、配列番号10~44もしくは128~166の配列のポリペプチドを含んでなるもしくはからなるか、または(ii)目的化合物およびC-インテインはリンカーを介して連結され、この場合には、リンカーは、配列番号7のスプリットインテインC末端断片を含んでなるインテインによってスプライシングされ得るエクステインのC末端アミノ酸残基を有するペプチドであり、特定の実施形態においては、リンカーは、そのN末端に配列Cys-Xaa1-Xaa2またはCys-Xaa1-Xaa2-Leuを有するペプチドであり、ここで、
Xaa1およびXaa2は任意のアミノ酸であり;
Xaa1はAla、Gly、ArtまたはPheであり、Xaa2は任意のアミノ酸であり;
Xaa1は任意のアミノ酸であり、Xaa2はGly、Glu、AlaまたはArgであり;
Xaa1はAla、Gly、ArtまたはPheであり、Xaa2はGly、Glu、AlaまたはArgであり;
あるいはリンカーは、そのN末端にCys-Glu-Phe、Cys-Ala-Phe、Cys-Gly-Phe、Cys-Arg-Phe、Cys-Phe-Phe、Cys-Glu-Gly、Cys-Glu-Glu、Cys-Glu-Ala、Cys-Glu-Phe-Leu、Cys-Ala-Phe-Leu;Cys-Gly-Phe-Leu;Cys-Arg-Phe-Leu、Cys-Phe-Phe-Leu、Cys-Glu-Gly-Leu、Cys-Glu-Glu-LeuおよびCys-Glu-Ala-Leuから選択される配列を有するペプチドである。
【0106】
特定の実施形態において、目的化合物は、タンパク質またはポリペプチドである。
【0107】
別の実施形態において、目的化合物は、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質である。
【0108】
特定の実施形態において、タンパク質は、Cas9またはCas9の断片である。特定の実施形態において、目的化合物は、ポリペプチドまたはタンパク質であり、複合体がリンカーを含んでなる場合、リンカーはペプチドリンカーである。この実施形態において、複合体は融合タンパク質である。
【0109】
別の実施形態において、目的ポリペプチドは、抗体または抗体のフラグメントである。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5により記載されているように、マウスαDec205モノクローナル抗体の重鎖である。
【0110】
別の実施形態において、目的化合物は、タンパク質の断片、特定の実施形態においては、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質の断片である。別の実施形態において、目的化合物は、タンパク質のC末端断片である。用語「タンパク質のC末端断片」は、本明細書において使用する場合、タンパク質のC末端を含む様々な長さの断片を指す。特定の実施形態において、C末端断片は、全長タンパク質の長さの100%未満、90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満を含んでなる断片である。
【0111】
別の実施形態において、目的化合物は抗体である。抗体という用語は、N-インテインに関して記載されており、この場合にも同様に当てはまる。
【0112】
特定の実施形態において、複合体は、配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるまたはからなるスプリットインテインC末端断片を含んでなる。
【0113】
特定の実施形態において、配列番号123および124の配列は、配列番号7の配列よりも高い温度安定性を有する。
【0114】
特定の実施形態において、複合体は、配列番号69~87からなる群から選択されるアミノ酸配列またはその変異体を含んでなるまたはからなるスプリットインテインC末端断片を含んでなる。特定の実施形態において、変異体は、機能的に同等の変異体である。
【0115】
用語「変異体」および「機能的に同等の変異体」は、従前に定義されている。特定の実施形態において、配列番号69~87のスプリットインテインC末端断片の機能的に同等の変異体は、それらが由来する配列と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%または少なくとも99%の配列同一性を有する。
【0116】
特定の実施形態において、配列番号69~87のスプリットインテインC末端断片の機能的に同等の変異体は、それらが由来する配列の活性を維持または改善する。用語「活性」ならびにこの活性を測定するための方法は、列番号7のスプリットインテインN末端断片の機能的に同等の変異体に関して従前に定義されている。配列番号7のスプリットインテインC末端断片の変異体の活性に関する実施形態は、配列番号69~87のスプリットインテインC末端断片の変異体の活性にそのまま当てはまる。
【0117】
スプリットインテインN末端断片およびスプリットインテインC末端断片を含んでなる複合体
別の側面において、本開示は、
(iv)本開示のスプリットインテインC末端断片または配列番号114~120からなる群から選択される配列を含んでなるスプリットインテインC末端断片、
(v)目的化合物、および
(vi)本開示のスプリットインテインN末端断片、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる複合体、以下、本開示の第3の複合体であって、
上記複合体は、場合により、(i)と(ii)の間および/または(ii)と(iii)の間にリンカーを含んでなり、
目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合され、
目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
上記複合体がリンカーを含んでなる場合には、目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている
複合体に関する。
【0118】
用語「目的化合物」および「リンカー」は、本開示の第1の複合体に関して従前に定義されている。本開示の第1の複合体の目的化合物およびリンカーの実施形態は総て、本開示の第2の複合体にそのまま当てはまる。
【0119】
特定の実施形態において、目的化合物はタンパク質またはポリペプチドである。
【0120】
別の実施形態において、目的化合物は、25KDaより大きい、50KDaより大きいまたは100KDaはより大きいタンパク質である。特定の実施形態において、目的化合物は、ポリペプチドまたはタンパク質であり、複合体がリンカーを含んでなる場合、リンカーはペプチドリンカーである。この実施形態において、複合体は融合タンパク質である。
【0121】
特定の実施形態において、目的ポリペプチドは、抗体または抗体のフラグメントである。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5により記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0122】
特定の実施形態において、複合体は、配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるまたはからなるスプリットインテインC末端断片を含んでなる。
【0123】
特定の実施形態において、配列番号123および124の配列は、配列番号7の配列より高い温度安定性を有する。
【0124】
特定の実施形態において、複合体は、配列番号69~87からなる群から選択されるアミノ酸配列またはその変異体を含んでなるまたはからなるスプリットインテインC末端断片を含んでなる。特定の実施形態において、変異体は機能的に同等の変異体である。
【0125】
特定の実施形態において、複合体は、配列番号111、112および113からなる群から選択されるアミノ酸配列を含んでなるまたはからなるスプリットインテインN末端断片を含んでなる。
【0126】
特定の実施形態において、配列番号112および113の配列は、配列番号1の配列より高い温度安定性を有する。
【0127】
特定の実施形態において、複合体は、配列番号49~68からなる群から選択されるアミノ酸配列またはその変異体を含んでなるまたはからなるスプリットインテインN末端断片を含んでなる。別の実施形態において、変異体は機能的に同等の変異体である。
【0128】
用語「変異体」および「機能的に同等の変異体」は、従前に定義されている。これらの用語に関する実施形態は、本開示の第3の複合体にそのまま当てはまる。
【0129】
本開示の複合体を含んでなる組成物
別の側面において、本開示は、本開示の第1の複合体および第2の複合体を含んでなる組成物、以下、本開示の第1の組成物に関する。
【0130】
用語「組成物」は、指定の成分を含有する生成物、ならびに指定の量での指定の成分の組合せから直接または間接的に得られるいずれの生成物も包含することを意図する。組成物の成分は、単一の処方物として一緒に包装されてもよいし、または異なる処方物として別個に包装されてもよい。よって、ある実施形態において、本開示の第1の複合体は、単一の処方物中に本開示の第2の複合体と一緒に包装される。別の実施形態において、本開示の第1の複合体および本開示の第2の複合体は、別個に包装される。
【0131】
1つの実施形態において、第1の複合体および第2の複合体は、同じタンパク質のそれぞれN末端断片とC末端断片を、両複合体が本開示の方法に従って合わせられた場合に、タンパク質のN末端断片がそのタンパク質のC末端断片に連結されて全長タンパク質を生じるような様式で含んでなる。
【0132】
本開示のコンジュゲート
別の側面において、本開示は、本開示の第1の複合体および本開示の第2の複合体を含んでなるコンジュゲート、以下、本開示の第1のコンジュゲートであって、スプリットインテインN末端断片のC末端がペプチド結合によってスプリットインテインC末端断片のN末端に連結されているコンジュゲートに関する。
【0133】
別の側面において、本開示は、(a)本開示の第1の複合体、および(b)配列番号7のアミノ酸配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなり、スプリットインテインN末端断片のC末端がペプチド結合によってスプリットインテインC末端断片のN末端に連結されているコンジュゲート、以下、本開示の第2のコンジュゲートに関する。
【0134】
特定の実施形態において、コンジュゲートは、配列番号121~124から選択される配列を含んでなるまたはからなるスプリットインテインC末端断片を含んでなる。
【0135】
特定の実施形態において、コンジュゲートは、配列番号69~87から選択される配列またはその変異体を含んでなるまたはからなるスプリットインテインC末端断片を含んでなる。特定の実施形態において、変異体は機能的に同等の変異体である。配列番号69~87のスプリットインテインC末端断片の機能的に同等の変異体は従前に定義されている。
【0136】
特定の実施形態において、目的化合物は、タンパク質またはポリペプチドである。
【0137】
別の実施形態において、目的化合物は、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質である。
【0138】
特定の実施形態において、タンパク質は、Cas9またはCas9の断片である。
【0139】
特定の実施形態において、目的化合物は、ポリペプチドまたはタンパク質であり、複合体がリンカーを含んでなる場合、リンカーはペプチドリンカーである。
【0140】
特定の実施形態において、目的ポリペプチドは、抗体または抗体のフラグメントである。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5により記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0141】
本開示のポリヌクレオチド、ベクターおよび宿主細胞
別の側面において、本開示は、
本開示のスプリットインテインN末端断片、または
本開示のスプリットインテインC末端断片、または
本開示の第1、第2または第3の複合体(ここで、目的化合物はポリペプチドもしくはタンパク質であり、リンカーは、存在する場合、ペプチドリンカーである)、または
本開示のコンジュゲート
をコードするポリヌクレオチドに関する。
【0142】
本明細書において使用する場合、用語「ポリヌクレオチド」は、ホスホジエステル結合(またはその関連構造変異体もしくは合成類似体)を介して連結された複数のヌクレオチド単位(デオキシリボヌクレオチドもしくはリボヌクレオチド、またはその関連構造変異体もしくは合成類似体)から構成されるポリマーを指す。用語ポリヌクレオチドには、二本鎖または一本鎖ゲノムおよびcDNA、RNA、任意の合成および遺伝子操作ポリヌクレオチド、ならびにセンスおよびアンチセンス両方のポリヌクレオチド(本開示にはセンス鎖のみが開示されている)が含まれる。これには一本鎖および二本鎖分子、すなわち、DNA-DNA、DNA-RNAおよびRNA-RNAハイブリッドが含まれる。
【0143】
本開示のポリヌクレオチドは、単離されたままの状態でまたは好適な宿主細胞中での上記ポリヌクレオチドの増幅を可能とするベクターの一部をなす状態で見られる。よって、別の側面において、本開示は、上記のような本開示のポリヌクレオチドを含んでなるベクターに関する。
【0144】
上記ポリヌクレオチドの挿入に好適なベクターは、pUC18、pUC19、Bluescriptおよびその誘導体、mpl8、mpl9、pBR322、pMB9、ColEl、pCRl、RP4などの原核生物における発現ベクター;pSA3およびpAT28などのファージおよび「シャトル」ベクター;酵母の発現ベクター、例えば、2ミクロンプラスミド、組込みプラスミド、YEPベクター、セントロメアプラスミドなどのタイプのベクターなど;pAC系およびpVLのベクターなどの昆虫細胞における発現ベクター;pIBI、pEarleyGate、pAVA、pCAMBIA、pGSA、pGWB、pMDC、pMY、pORE系などの植物における発現ベクター;ならびに任意の市販のバキュロウイルス系を用いて昆虫細胞を感染させるのに好適なバキュロウイルスを含む真核細胞の発現ベクターに由来するベクターである。真核細胞のためのベクターとしては、ウイルスベクター(アデノウイルス、アデノ随伴ウイルス(AAV),レトロウイルスおよびレンチウイルス)ならびにpSilencer 4.1-CMV(Ambion)、pcDNA3、pcDNA3.1/hyg、pHMCV/Zeo、pCR3.1、pEFI/His、pIND/GS、pRc/HCMV2、pSV40/Zeo2、pTRACER-HCMV、pUB6/V5-His、pVAXl、pZeoSV2、pCI、pSVLおよびPKSV-10、pBPV-1、pML2dおよびpTDTlなどの非ウイルスベクターが挙げられる。
【0145】
ベクターはまた、それと接触させた後にベクターに組み込まれた細胞を識別することを可能とするリポーターまたはマーカー遺伝子を含んでなってよい。
【0146】
本開示に関して有用なリポーター遺伝子としては、lacZ、ルシフェラーゼ、チミジンキナーゼ、GFPなどが挙げられる。本発明に関して有用なマーカー遺伝子としては、例えば、アミノグリコシドG418に対する耐性を付与するネオマイシン耐性遺伝子;ハイグロマイシンに対する耐性を付与するハイグロマイシンホスホトランスフェラーゼ遺伝子;オルニチンデカルボキシラーゼ(2-(ジフルオロメチル)-DL-オルニチン(DFMO)の阻害剤に対する耐性を付与するODC遺伝子;メトトレキサートに対する耐性を付与するジヒドロ葉酸レダクターゼ遺伝子;ピューロマイシンに対する耐性を付与するピューロマイシン-N-アセチルトランスフェラーゼ遺伝子;ゼオシンに対する耐性を付与するble遺伝子;9-β-D-キシロフラノースアデニンに対する耐性を付与するアデノシンデアミナーゼ遺伝子;N-(ホスホンアセチル)-L-アスパラギン酸の存在下での細胞の増殖を可能とするシトシンデアミナーゼ遺伝子;アミノプテリンの存在下での細胞の増殖を可能とするチミジンキナーゼ遺伝子;キサンチンの存在下およびグアニンの不在下での細胞の増殖を可能とするキサンチン-グアニンホスホリボシルトランスフェラーゼ遺伝子;トリプトファンの代わりにインドールの存在下での細胞の増殖を可能とする大腸菌のtrpB遺伝子;細胞がヒスチジンの代わりにヒスチジノールを使用することを可能とする大腸菌のhisD遺伝子が挙げられる。選択遺伝子は、加えて真核細胞における上記遺伝子の発現に好適なプロモーター(例えば、CMVまたはSV40プロモーター)、最適翻訳開始部位(例えば、いわゆるKozakルールに従う部位またはIRES)、ポリアデニル化部位、例えば、SV40ポリアデニル化またはホスホグリセリン酸キナーゼ部位、イントロン、例えば、β-グロブリン遺伝子イントロンを含み得るプラスミドに組み込まれる。あるいは、同じベクターに同時にリポーター遺伝子およびマーカー遺伝子の両方の組合せを使用することも可能である。
【0147】
他方、当業者が知るように、ベクターの選択は次にそれが導入される宿主細胞によって異なる。例として、上記ポリヌクレオチドが導入されるベクターは、酵母人工染色体(YAC)、細菌人工染色体(BAC)またはPI由来人工染色体(PAC)であってもよい。YAC、BACおよびPACの特徴は当業者に知られている。上記タイプのベクターに関する詳細な情報は、例えばGiraldo and Montoliu (Giraldo, P. & Montoliu L., 2001 Size matters: use of YACs, BACs and PACs in transgenic animals, Transgenic Research 10(2): 83-110)によって提供されている。本開示のベクターは、当業者に公知の従来法によって得ることができる(Sambrook J. et al., 2000 "Molecular cloning, a Laboratory Manual", 3rd ed., Cold Spring Harbor Laboratory Press, N.Y. Vol 1-3)。
【0148】
本開示のポリヌクレオチドは、限定されるものではないが、トランスフェクション、エレクトロポレーション(例えば、経皮エレクトロポレーション)、マイクロインジェクション、形質導入、細胞融合、DEAEデキストラン、リン酸カルシウム沈殿法、遺伝子銃の使用、またはDNAベクター輸送体の使用を含む当技術分野で公知の方法によって、裸のDNAプラスミドとして、また、ベクターを用いて、宿主細胞にin vivo導入することができる。裸のDNAを製剤し、哺乳動物筋肉組織に投与するための方法も知られている。Feigner Pら、米国特許第5,580,859号、および同第5,589,466号を参照のこと。陽イオンオリゴペプチド、DNA結合タンパク質由来のペプチド、または陽イオンポリマーなどの他の分子も、in vivoにおいて核酸のトランスフェクションを促進するために有用である。Bazile Dら、WO1995021931、およびByk Gら.、WO1996025508を参照のこと。
【0149】
宿主細胞にポリヌクレオチドを導入するために使用することができるもう1つの周知の方法は、粒子衝撃(aka微粒子銃形質転換)である。微粒子銃形質転換は一般に、いくつかの方法のうち1つで達成される。1つの一般的な方法は、不活性のまたは生物学的に活性な粒子を細胞に発射することを含む。Sanford Jら、米国特許第4,945,050号、同第5,036,006号、および同第5,100,792号を参照のこと。
【0150】
あるいは、ベクターは、in vivoにおいてリポフェクションによって導入することができる。陽イオン脂質の使用は、負電荷を有する核酸のカプセル封入を促進することができ、また、負電荷を有する細胞膜との融合を促進することもできる。Feigner P, Ringold G, Science 1989; 337:387-388を参照のこと。核酸の導入に有用な脂質化合物および組成物は記載されている。Feigner Pら、米国特許第5,459,127号、Behr Jら、WO1995018863、およびByk G、WO1996017823を参照のこと。
【0151】
よって、別の側面において、本開示は、本開示のポリヌクレオチドまたはベクターを含んでなる宿主細胞に関する。これらの細胞は、当業者に公知の従来の方法によって得ることができる(例えば、Sambrookらを参照のこと、上記に引用)。
【0152】
用語「宿主細胞」は、本明細書において使用する場合、本開示によるポリヌクレオチドまたはベクターなどの本開示の核酸が導入され、本開示のスプリットインテインN末端断片または上記スプリットインテインN末端断片を含んでなる融合タンパク質を発現し得る細胞を指す。用語「宿主細胞」および「組換え宿主細胞」は、本明細書では互換的に使用される。特定の目的細胞だけでなくそのような細胞の後代または潜在的後代も指すと理解されるべきである。後続世代には突然変異または環境的影響のいずれかのために特定の改変が生じ得るので、このような後代は、実際には親細胞と同一とは言えないが、本明細書において使用する場合、この用語の範囲内にやはり含まれる。この用語は、異種DNAの導入によって改変され得るいずれの培養細胞も含む。特定の実施形態において、宿主細胞は、本開示のポリヌクレオチドが安定発現、翻訳後修飾、適当な細胞内コンパートメントへの局在、および適当な転写装置との会合が可能なものである。適当な宿主細胞の選択はまた、検出シグナルの選択によっても影響を受ける。例えば、リポーター構築物は、上記のように、転写調節タンパク質に応答した遺伝子転写の活性化または阻害の際に選択可能またはスクリーニング可能な形質を提供することができ、最適な選択またはスクリーニングを達成するために、宿主細胞表現型が考慮される。本開示の宿主細胞としては、原核細胞および真核細胞が挙げられる。原核生物としては、グラム陰性またはグラム陽性生物、例えば、大腸菌(E.coli)または桿菌が挙げられる。特定の実施形態においては、本開示のポリヌクレオチドまたはベクターを含んでなる転写制御配列の増幅のために原核細胞が使用されると理解される。形質転換のための好適な原核生物宿主細胞としては、例えば、大腸菌(E.coli)、枯草菌(Bacillus subtilis)、ネズミチフス菌(Salmonella typhimurium)、およびその他シュードモナス属(Pseudomonas)、ストレプトマイセス属(Streptomyces)、およびブドウ球菌属(Staphylococcus)の様々な種が挙げられる。真核細胞としては、限定するものではないが、酵母細胞、植物細胞、真菌細胞、昆虫細胞(例えば、バキュロウイルス)、哺乳動物細胞、および寄生生物細胞、例えば、トリパノソーマ属(trypanosomes)が挙げられる。本明細書において使用する場合、酵母には、厳密な分類学的意味においての酵母、すなわち、単細胞生物だけでなく、糸状真菌の酵母様多細胞真菌も含む。例示的な種としては、クルイベロミセス・ラクチス(Kluyverei lactis)、シゾサッカロミセス・ポンベ(Schizosaccharomyces pombe)、およびトウモロコシ黒穂菌(Ustilaqo maydis)、ならびにサッカロミセス・セレビシエ(Saccharomyces cerevisiae)が挙げられる。本開示の実施において使用可能な他の酵母としては、アカパンカビ(Neurospora crassa)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・ニジュランス(Aspergillus nidulans)、ピキア・パストリス(Pichia pastoris)、カンジダ・トロピカリス(Candida tropicalis)、およびハンセヌラ ・ポリモルファ(Hansenula polymorpha)がある。哺乳動物宿主細胞培養系としては、COS細胞、L細胞、3T3細胞、チャイニーズハムスター卵巣(CHO)細胞、胚性幹細胞、BHK、HeKまたはHeLa細胞などの樹立細胞株が挙げられる。特定の実施形態において、真核細胞が組換え遺伝子発現に使用される。
【0153】
2つの目的化合物をコンジュゲートするための方法
別の側面において、本開示は、第1の目的化合物と第2の目的化合物の間のコンジュゲートを得るための方法であって、
(i)
(a)第1の目的化合物、および配列番号1のアミノ配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片を含んでなる本開示の第1の複合体と、
(b)第2の目的化合物、および配列番号7のアミノ酸配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなる本開示の第2の複合体、あるいは
AceL-TerLスプリットインテインC末端断片またはその機能的に同等の変異体および第2の目的化合物を含んでなる複合体であって、場合により、上記スプリットインテインC末端断片と上記第2の目的化合物の間にリンカーを含んでなり、
・第2の目的化合物は、アミド結合によってスプリットインテインC末端断片のC末端に結合されているか、または
・上記複合体がリンカーを含んでなる場合には、上記第2の目的化合物はアミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインC末端断片のC末端に結合されている、複合体
とを、スプリットインテインN末端断片とスプリットインテインC末端断片を結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)上記インテイン中間体を反応させて、第1の目的化合物と第2の目的化合物の間のコンジュゲートを形成させること
を含んでなる方法に関する。
【0154】
別の側面において、本開示は、第1の目的化合物と第2の目的化合物の間のコンジュゲートを得るための方法であって、
(i)
(a)第1の目的化合物、および配列番号1のアミノ配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片を含んでなる本開示の第1の複合体、あるいは
目的化合物およびAceL-TerLスプリットインテインN末端断片またはその機能的に同等の変異体を含んでなる複合体を含んでなる複合体であって、場合により、上記目的化合物とスプリットインテインN末端断片の間にリンカーを含んでなり、
・上記目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
・上記複合体がリンカーを含んでなる場合には、上記目的化合物は、アミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている、複合体と、
(b)第2の目的化合物、および配列番号7のアミノ酸配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片を含んでなる請求項17~21のいずれか一項に記載の複合体
とを、スプリットインテインN末端断片とスプリットインテインC末端断片を結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)上記インテイン中間体を反応させて、第1の目的化合物と第2の目的化合物の間のコンジュゲートを形成させること
を含んでなる方法に関する。
【0155】
用語「AceL-TerLインテイン」は、本明細書において使用する場合、南極の永久成層塩湖エース湖で同定された非カノニカルスプリットインテインの一ファミリーを指す。このファミリーのインテインは、Thiel et al., Angew. Chem. Int. Ed 2014, 53: 1306-1310によって記載されている。特定の実施形態において、AceL-TerLスプリットインテインN末端断片は、配列番号101または102の配列を含んでなるまたはからなる。特定の実施形態において、AceL-TerLスプリットインテインC末端断片は、配列番号99または100の配列を含んでなるまたはからなる。
【0156】
用語「目的化合物」および「機能的に同等の変異体」は、従前に記載されている。いくつかの実施形態において、第1の化合物および/または第2の化合物は、ペプチドまたはポリペプチドであるか、またはそれを含む。いくつかの実施形態において、第1の化合物および/または第2の化合物は、抗体、抗体鎖、または抗体重鎖であるかまたはそれを含む。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5に記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0157】
いくつかの実施形態において、第1の化合物および/または第2の化合物は、ペプチド、オリゴヌクレオチド、薬物、または細胞傷害性分子であるか、またはそれを含む。
【0158】
特定の実施形態において、スプリットインテインN末端断片は、配列番号111~113からなる群から選択される配列を含んでなるまたはからなる。
【0159】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0160】
特定の実施形態において、スプリットインテインC末端断片は、配列番号121~124からなる群から選択される配列を含んでなるまたはからなる。特定の実施形態において、スプリットインテインC末端断片は、配列番号69~87からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0161】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなり、スプリットインテインC末端断片は、配列番号69~87からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0162】
スプリットインテインN末端断片とスプリットインテインC末端断片を結合させてインテイン中間体を形成させるための適当な条件は、当業者によって容易に決定することができる。特定の実施形態において、これらの条件は、第1の複合体と第2の複合体を0℃~70℃、例えば5℃~65℃、10℃~60℃、15℃~55℃、20℃~50℃、25℃~45℃、30℃~40℃、25℃~35℃、45℃~55℃の温度で、特定の実施形態においては、30℃または50℃で接触させることを含む。別の実施形態において、これらの条件は、第1の複合体と第2の複合体を0.1~14、例えば0.5~13.5、1.0~13.0、1.5~12.5、2.0~12.0、2.5~11.5、3.0~11.0、3.5~10.5、4.0~10.0、4.5~9.5、5.0~9.0、5.5~8.5、6.0~8.0、6.5~7.5のpHで、特定の実施形態においては、pH7.2で接触させることを含む。別の実施形態において、これらの条件は、第1の複合体と第2の複合体を尿素の不在下で、または1M~5M、例えば1.5M~4.5M、2M~4.0M、2.5M~3.5Mの濃度の尿素の存在下で、特定の実施形態においては、尿素2Mもしくは尿素4Mで接触させることを含む。特定の実施形態において、これらの条件は、第1の複合体と第2の複合体を50℃の温度、pH7.2、および尿素2Mまたは尿素4Mの存在下で接触させることを含む。また、温度、尿素濃度およびpHのあらゆる可能性のある組合せが本発明により企図される。
【0163】
目的化合物と求核試薬のコンジュゲートを得るための方法
別の側面において、本開示は、目的化合物と求核試薬のコンジュゲートを得るための方法であって、
(i)
(a)スプリットインテインN末端断片が配列番号1のアミノ酸配列もしくは配列番号1と少なくとも90%の配列同一性を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなる本開示の第1の複合体、あるいは
目的化合物およびAceL-TerLスプリットインテインN末端断片またはその機能的に同等の変異体を含んでなる複合体であって、場合により、上記目的化合物とスプリットインテインN末端断片の間にリンカーを含んでなり、
・上記目的化合物は、アミド結合によってスプリットインテインN末端断片のN末端に連結されているか、または
・上記複合体がリンカーを含んでなる場合には、上記目的化合物は、アミド結合によってリンカーに結合され、かつ/または上記リンカーは、アミド結合によってスプリットインテインN末端断片のN末端に結合されている、複合体と、
(b)配列番号8、9、23~48および141~166からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片
とを、スプリットインテインN末端断片とスプリットインテインC末端断片の間で結合させてインテイン中間体を形成させるために適当な条件下で接触させること、ならびに
(ii)上記インテイン中間体と外因性求核試薬を接触させること
を含んでなる方法に関する。
【0164】
用語「AceL-TerLスプリットインテインN末端断片」、「目的化合物」および「機能的に同等の変異体」は、従前に定義されている。特定の実施形態において、AceL-TerLスプリットインテインN末端断片は、配列番号101または102の配列を含んでなるまたはからなる。いくつかの実施形態において、第1の化合物および/または第2の化合物は、ペプチドまたはポリペプチドであるか、またはそれを含む。いくつかの実施形態において、第1の化合物および/または第2の化合物は、抗体、抗体鎖、または抗体重鎖であるか、またはそれを含む。特定の実施形態において、目的ポリペプチドは、抗体または抗体のフラグメントである。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5に記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0165】
いくつかの実施形態において、第1の化合物および/または第2の化合物は、ペプチド、オリゴヌクレオチド、薬物、または細胞傷害性分子であるか、またはそれを含む。
【0166】
用語「求核試薬」は、本明細書において使用する場合、電子対を求電子試薬に供与して反応に関連して化学結合を形成する任意の化学種を指す。自由な電子対または少なくとも1つのパイ結合を持つ総ての分子またはイオンが求核試薬として働き得る。求核試薬は電子を供与するため、それらは定義上ルイス塩基である。本開示の1つの実施形態において、求核試薬は、硫黄求核試薬または窒素求核試薬のいずれかであり得る。
【0167】
用語「硫黄求核試薬」は、本明細書において使用する場合、少なくとも1つの硫黄原子を含んでなる求核試薬を指す。硫黄求核試薬の例としては、硫化水素およびその塩、チオール(RSH)、チオレートアニオン(RS-)、チオールカルボン酸のアニオン(RC(O)-S-)、およびジチオカーボネートのアニオン(RO-C(S)-S-)およびジチオカルバメート(R 2N-C(S)-S-)が挙げられる。本開示の1つの実施形態において、硫黄求核試薬はメスナまたはDTTである。
【0168】
用語「窒素求核試薬」は、本明細書において使用する場合、少なくとも1つの窒素原子を含んでなる求核試薬を指す。窒素求核試薬としは、アンモニア、アジド、アミン、ヒドラジン、および亜硝酸塩が挙げられる。本開示の1つの実施形態において、窒素求核試薬はヒドラジンである。
【0169】
用語「外因性求核試薬」は、本明細書において使用する場合、求核試薬が本開示の複合体またはスプリットインテインC末端断片の一部をなさないことを意味する。
【0170】
よって、本方法において、目的化合物はタンパク質またはポリペプチドであり、インテイン中間体を求核試薬と反応させて結合したインテインN末端断片およびC末端断片から目的ポリペプチドを遊離させ、それにより、求核試薬によって修飾されたC末端を有するタンパク質またはポリペプチドが得られる。この種の修飾は、求核試薬のタイプによって異なる。例えば、求核試薬がチオールである場合、修飾された目的ポリペプチドはα-チオエステルであり、これは次に、例えば、種々の求核試薬(例えば、薬物、ポリマー、別のポリペプチド、オリゴヌクレオチド)、またはC末端におけるタンパク質修飾のための周知のα-チオエステル化学を用いるその他の任意の部分でさらに修飾することができる。この化学法の1つの利点は、C末端のみがさらなる修飾のためにチオエステルで修飾され、従って、ポリペプチド中の他の酸性残基ではなくC末端のみでの選択的修飾を可能とすることである。目的化合物がタンパク質またはポリペプチドでない場合には、目的化合物は求核試薬と反応することができる部分、すなわち求電子試薬を有する。求核試薬と反応し得る好適な求電子試薬は、当分野で一般に知られている。
【0171】
特定の実施形態において、求核試薬は、本開示の第1の複合体とスプリットインテインC末端断片を接触させた後に反応に添加する。別の実施形態において、本開示の第1の複合体、スプリットインテインC末端断片および求核試薬は同時に接触させる。
【0172】
特定の実施形態において、この方法は、目的化合物と求核試薬のコンジュゲートを第2の外因性求核試薬と接触させることをさらに含んでなる。
【0173】
本明細書に開示される方法においてインテイン中間体とともに、または例えばα-チオエステルと反応する後続のまたは第2の求核試薬として使用される求核試薬は、好適な求核部分を有するいずれの化合物または材料であってもよい。例えば、チオエステルを形成するためには、チオール部分が求核試薬として企図される。場合によっては、チオールは、1,2アミノチオール、または1,2-アミノセレノールである。α-セレノチオエステルは、セレノチオール(R-SeH)を使用することで形成することができる。企図される別の求核試薬としては、アミン(すなわち、アミドを直接得るためのアミノリシス)、ヒドラジン(ヒドラジドを得るため)、アミノ-オキシ基(ヒドロキサム酸を与えるため)が挙げられる。さらに、求核試薬は、目的ポリペプチドとのコンジュゲーションのための目的化合物内の官能基であってもよく(例えば、タンパク質-薬物コンジュゲートを形成するための薬物)、または代わりにアジドもしくはアルキン(2つの官能基間のクリック化学反応によるトリアゾールの形成のため)、テトラゾール、a-ケト酸、アルデヒドもしくはケトン、またはシアノベンゾチアゾールなどの後続の既知の生体直交反応のための追加の官能基を有してもよい。
【0174】
特定の実施形態において、スプリットインテインN末端断片は、配列番号111~113からなる群から選択される配列を含んでなるまたはからなる。
【0175】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0176】
ポリヌクレオチドを含んでなる組成物
別の側面において、本開示は、
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその変異体、または配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド、
あるいは、
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその変異体、または配列番号1の配列もしくは配列番号1と少なくとも90%の配列同一性を有するその変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド
を含んでなる組成物、以下、本開示の第2の組成物に関する。
【0177】
特定の実施形態において、変異体は機能的に同等の変異体である。
【0178】
用語「組成物」は、従前に定義されている。特定の実施形態において、第1のポリヌクレオチドは、単一の製剤として第2のポリヌクレオチドとともに包装される。別の実施形態において、第1のポリヌクレオチドおよび第2のポリヌクレオチドが別個に包装される。
【0179】
用語「AceL-TerLインテイン」は、従前に定義されている。特定の実施形態において、AceL-TerLスプリットインテインN末端断片は、配列番号101または102の配列を含んでなるまたはからなる。特定の実施形態において、AceL-TerLスプリットインテインC末端断片は、配列番号99または100の配列を含んでなるまたはからなる。
【0180】
特定の実施形態において、第1の目的ポリペプチドはタンパク質のN末端断片であり、第2の目的ポリペプチドは上記タンパク質のC末端断片、特定の実施形態においては、第1の目的ポリペプチドのC末端と第2の目的ポリペプチドのN末端を共有結合的に連結すると全長タンパク質が得られるように、25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質である。
【0181】
いくつかの実施形態において、第1の化合物および第2の化合物は、抗体、抗体鎖、または抗体重鎖であるか、またはそれを含む。特定の実施形態において、目的ポリペプチドは、抗体または抗体のフラグメントである。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5に記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0182】
特定の実施形態において、スプリットインテインN末端断片は、配列番号111~113からなる群から選択される配列を含んでなるまたはからなる。
【0183】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0184】
特定の実施形態において、スプリットインテインC末端断片は、配列番号121~124からなる群から選択される配列を含んでなるまたはからなる。
【0185】
特定の実施形態において、スプリットインテインC末端断片は、配列番号69~87からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0186】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなり、スプリットインテインC末端断片は、配列番号69~87からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0187】
本開示の第2の組成物は、本開示の方法を用いて細胞において目的遺伝子を発現させるために使用することができる。
【0188】
目的遺伝子を発現させるための方法
別の側面において、本開示は、細胞において目的遺伝子を発現させるための方法、以下、
目的遺伝子を発現させるための第1の方法であって、
(i)上記細胞を
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・配列番号1の配列または少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、ならびに
(b)N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその機能的に同等の変異体、または配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド、
あるいは、
(a)N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその機能的に同等の変異体、または配列番号1の配列もしくは少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチド、および
(b)N末端からC末端へ向かって、
・配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチド
と接触させること、
(ii)上記第1の融合タンパク質および上記第2の融合タンパク質が生産されるように上記第1のポリヌクレオチドおよび上記第2のポリヌクレオチドを発現させること、ならびに
(iii)上記スプリットインテインN末端断片が上記スプリットインテインC末端断片と結合してインテイン中間体を形成し、上記インテイン中間体が反応して上記第1の目的ポリペプチドのC末端と上記第2の目的ポリペプチドのN末端を共有結合的に連結するように、上記第1の融合タンパク質と上記第2の融合タンパク質を接触させること
を含んでなる方法に関する。
【0189】
別の側面において、本開示は、目的遺伝子を発現させるための方法であって、
(i)第1の細胞を、N末端からC末端へ向かって
・第1の目的ポリペプチド、および
・配列番号1の配列もしくは少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチドと接触させること、上記第1の融合タンパク質はシグナルペプチドを含んでなる、ならびに
(ii)第2の細胞を、N末端からC末端へ向かって、
・AceL-TerLスプリットインテインC末端断片もしくはその機能的に同等の変異体、または配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチドと接触させること、上記第2の融合タンパク質はシグナルペプチドを含んでなる、
あるいは、
(i)第1の細胞を、N末端からC末端へ向かって、
・第1の目的ポリペプチド、および
・AceL-TerLスプリットインテインN末端断片もしくはその機能的に同等の変異体、または配列番号1の配列もしくは少なくとも90%を有するその機能的に同等の変異体、または配列番号103~110からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインN末端断片
を含んでなる第1の融合タンパク質をコードする第1のポリヌクレオチドと接触させること、上記第1の融合タンパク質はシグナルペプチドを含んでなる、ならびに
(ii)第2の細胞を、N末端からC末端へ向かって、
・配列番号7の配列もしくは配列番号7と少なくとも88%の配列同一性を有するその機能的に同等の変異体、または配列番号114~120からなる群から選択されるアミノ酸配列を含んでなるスプリットインテインC末端断片、および
・第2の目的ポリペプチド
を含んでなる第2の融合タンパク質をコードする第2のポリヌクレオチドと接触させること、上記第2の融合タンパク質はシグナルペプチドを含んでなる、
(iii)上記第1の融合タンパク質および上記第2の融合タンパク質が生産および分泌されるように上記第1のポリヌクレオチドおよび上記第2のポリヌクレオチドを発現させること、ならびに
(iv)上記スプリットインテインN末端断片が上記スプリットインテインC末端断片と結合してインテイン中間体を形成し、上記インテイン中間体が反応して上記第1の目的ポリペプチドのC末端と上記第2の目的ポリペプチドのN末端を共有結合的に連結するように、上記第1の融合タンパク質と上記第2の融合タンパク質を接触させること、
を含んでなる方法に関する。
【0190】
用語「AceL-TerLインテイン」は、従前に定義されている。特定の実施形態において、AceL-TerLスプリットインテインN末端断片は、配列番号101または102の配列を含んでなるまたはからなる。特定の実施形態において、AceL-TerLスプリットインテインC末端断片は、配列番号99または100の配列を含んでなるまたはからなる。
【0191】
特定の実施形態において、第1の目的ポリペプチドはタンパク質のN末端断片であり、第2の目的ポリペプチドは上記タンパク質のC末端断片、特定の実施形態においては、第1の目的ポリペプチドのC末端と第2の目的ポリペプチドのN末端を共有結合的に連結すると全長タンパク質が得られるように25KDaより大きい、50KDaより大きいまたは100KDaより大きいタンパク質である。
【0192】
特定の実施形態において、第1の目的ポリペプチドまたは第2の目的ポリペプチドは、Cas9またはCas9の断片である。特定の実施形態において、第1の目的ポリペプチドは、Cas9のN末端断片であり、第2の目的ポリペプチドは、Cas9のC末端断片である。別の実施形態において、第1の目的ポリペプチドがCas9のN末端断片であり、第2の目的ポリペプチドがCas9のC末端断片である場合、Cas9のN末端断片のC末端とCas9のC末端断片のN末端を共有結合的に連結すると、全長Cas9タンパク質が得られる。
【0193】
いくつかの実施形態において、第1の化合物および/または第2の化合物は、抗体、抗体フラグメント、抗体鎖、または抗体重鎖であるか、またはそれを含む。特定の実施形態において、目的ポリペプチドは、抗DEC-205抗体の重鎖である。特定の実施形態において、目的ポリペプチドは、抗DEC-205モノクローナル抗体の重鎖である。特定の実施形態において、目的化合物は、Stevens et al., JACS 2016, 138: 2162-5に記載されているようにマウスαDEC-205モノクローナル抗体の重鎖である。
【0194】
特定の実施形態において、スプリットインテインN末端断片は、配列番号111~113からなる群から選択される配列を含んでなるまたはからなる。
【0195】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0196】
特定の実施形態において、スプリットインテインC末端断片は、配列番号121~124からなる群から選択される配列を含んでなるまたはからなる。
【0197】
特定の実施形態において、スプリットインテインC末端断片は、配列番号69~87からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0198】
特定の実施形態において、スプリットインテインN末端断片は、配列番号49~68からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなり、スプリットインテインC末端断片は、配列番号69~87からなる群から選択される配列またはその機能的に同等の変異体を含んでなるまたはからなる。
【0199】
細胞を第1のポリヌクレオチドおよび/または第2のポリヌクレオチドと接触させることは、例えば、トランスフェクション、エレクトロポレーション、マイクロインジェクション、形質導入、リポフェクション、細胞融合、DEAEデキストラン、リン酸カルシウム沈殿法、遺伝子銃の使用、またはDNAベクター輸送体の使用など、目的ポリヌクレオチドを細胞に導入することを可能とするためのいずれの好適な手段によって行ってもよい。本開示の目的遺伝子を発現させるための第1の方法において、細胞を第1のポリヌクレオチドおよび第2のポリヌクレオチドに同時に接触させるか、または第1のポリヌクレオチドおよび第2のポリヌクレオチドと任意の順序で順次接触させる、すなわち、細胞をまず第1のポリヌクレオチドに接触させ、次に第2のポリヌクレオチドに接触させることもできるし、またはまず第2のポリヌクレオチドに接触させ、次に第1のポリヌクレオチドに接触させることができると考えられる。
【0200】
宿主細胞として従前に定義されるいずれの細胞もこれらの方法において使用可能である。
【0201】
用語「シグナルペプチド」または「分泌シグナルペプチド」は、本明細書において使用する場合、比較的短い、一般に5~30アミノ酸残基長で、細胞内で合成されたタンパク質を分泌経路に向けるペプチドを指す。シグナルペプチドは通常、二次αヘリックス構造を採る一連の疎水性アミノ酸を含む。さらに、多くのペプチドは、そのトランスロケーションに好適なトポロジーを採るタンパク質に寄与し得る正電荷を有する一連のアミノ酸を含む。シグナルペプチドは、そのカルボキシル末端にペプチダーゼによる認識のためのモチーフを有する傾向があり、これはシグナルペプチドを加水分解して遊離シグナルペプチドと成熟タンパク質を生じ得る。シグナルペプチドは、目的タンパク質が適当な場所に達したところで切断され得る。いずれの分泌シグナルペプチドも本開示において使用可能である。
【0202】
特定の実施形態において、シグナルペプチドは、第1の融合タンパク質中の第1の目的ポリペプチドのN末端に連結される。
【0203】
特定の実施形態において、シグナルペプチドは、第2の融合タンパク質中のスプリットインテインC末端断片のN末端に連結される。
【0204】
本発明を以下の実施例により説明するが、これらは本開示の範囲を限定するものではなく単に例示と見なされるべきである。
【実施例】
【0205】
材料および方法
材料
オリゴヌクレオチドおよび合成遺伝子はIntegrated DNA Technologies(コーラルビル、IA)から購入した。クローニング用のPfu Ultra II Hotsart融合ポリメラーゼはAgilent(ラホヤ、CA)から購入した。総ての制限酵素および2×Gibson Assembly Master Mixは、New England Biolabs(イプスウィッチ、MA)から購入した。クローニングおよびタンパク質発現に使用される高コンピテント細胞は、One Shot Bl21(DE3)化学コンピテント大腸菌およびInvitrogen(カールスバッド、CA)から購入したサブクローニングエフィシェンシーDH5αコンピテント細胞から作製した。DNA精製キットは、Qiagen(バレンシア、CA)から購入した。総てのプラスミドはGENEWIZ(サウス・プレインフィールド、NJ)によって配列決定した。Luria Bertani(LB)培地、および総ての緩衝塩はFisher Scientific(ピッツバーグ、PA)から購入した。ジメチルホルムアミド(DMF)、ジクロロメタン(DCM)、クーマシーブリリアントブルー、トリイソプロピルシラン(TIS)、β-メルカプトエタノール(BME)、DL-ジチオトレイトール(DTT)、2-メルカプトエタンスルホン酸ナトリウム(メスナ)、5(6)-カルボキシフルオレセイン、およびサーモライシンは、Sigma-Aldrich(ミルウォーキー、WI)から購入した。トリス(2-カルボキシエチル)ホスフィンヒドロクロリド(TCEP)およびイソプロピル-β-D-チオガラクトピラノシド(IPTG)は、Gold Biotechnology(セントルイス、MO)から購入した。タンパク質精製のためにRoche Completeプロテアーゼ阻害剤(Roche、ブランチバーグ、NJ)を使用した。ニッケル-ニトリロ三酢酸(Ni-NTA)樹脂は、Thermo scientific(ロックフォード、IL)から購入した。Fmocアミノ酸は、Novabiochem(ダルムシュタット、ドイツ)またはBachem(トーランス、CA)から購入した。O-(ベンゾトリアゾール-1-イル)-N,N,N’,N’-テトラメチルウロニウムヘキサフルオロホスフェート(HBTU)は、Genscript(ピスカタワ、NJ)から購入した。トリフルオロ酢酸(TFA)は、Halocarbon(ノースオーガスタ、SC)から購入した。MES-SDSランニングバッファーは、Boston Bioproducts(アッシュランド、MA)から購入した。
【0206】
機器
分析逆相高速液体クロマトグラフィー(RP-HPLC)は、C18 Vydacカラム(5μm、4.6×150mm)を備えたHewlett-Packard 1100および1200シリーズ機で行った。総てのHPLC分析では、以下の溶媒を1mL/分の流速で使用した:水中0.1%TFA(トリフルオロ酢酸)(溶媒A)および0.1%TFAを含有する水中90%アセトニトリル(溶媒B)。総てのペプチドおよびタンパク質を勾配:0%B 2分、その後、0~73%B 30分を用いて分析した。エレクトロスプレーイオン化質量分析(ESI-MS)は、Bruker Daltonics MicroTOF-Q II質量分析計で実施した。サイズ排除クロマトグラフィー(SEC)は、AKTA FPLCシステム(GE Healthcare)にて、分取実施にはSuperdex S75 16/60カラム(カラム容量125mL)および分析実施にはSuperdex S75 10/300カラムを用いて実施した。ゲルはLI-COR Odyssey赤外線イメージャーを用いて画像化した。円偏光二色性実験は、Chirascan円偏光二色性分光計(Applied Photophysics)にて実施した。細胞溶解は、S-450D Branson Digital Sonifierを用いて実施した。NMR実験は、5mm TCI三重共鳴クライオプローブを備えたBruker 900、800、600および500MHz分光計にて実施した。定常状態の蛍光測定は、Horiba Floumax 4蛍光計にて実施した。ストップフロー異方性測定は、Applied Photophysics SX20ストップフロー分光計にて実施した。
【0207】
コンセンサスタンパク質の設計
AceL TerLのホモログをTerL DNA配列を用いたNCBI(ヌクレオチドコレクション)およびJGIデータベースでのメタゲノムデータのBLAST検索によって同定した。これによりAceLと高い配列同一性を有するTerL N-インテインおよびC-インテインが同定された(表1)。同族のN-インテインとC-インテインを一致させることができなかったため、スプリットインテインを2つの異なるデータセットとして処理し、別々に分析した。 次に、これらのスプリットインテインのMSAをJalview4で生成し、コンセンサス配列を決定した。N-インテインのいくつかの位置では、AceLに存在しないループに相当するアラインメントからのさらなる残基がコンセンサス配列に含まれた。
【0208】
【0209】
組換えDNAのクローニング
合成遺伝子を購入し、Gibsonアセンブリを用いてpET-30発現ベクターに導入した。標的突然変異は、Pfu Ultra II HFポリメラーゼを用いる逆PCRを使用して導入した。総ての組換えプラスミドの同一性を配列決定によって確認し、対応するタンパク質配列を表2に示す。
【0210】
【0211】
スプライシングアッセイのためのインテインの発現および精製
インテインの発現および精製は、従前に記載されているように実施した。発現したN-インテイン構築物は、以下の構造を含んでいた:His6-SUMO-MBP-EFE-IntN、ここで、「His6」は6×ポリヒスチジンアフィニティータグであり、「SUMO」はユビキチン様タンパク質SMT3であり、「MBP」はマルトース結合タンパク質であり、「EFE」はTerLインテインの野生型-1、-2、および-3 N-エクステイン配列であり、IntNはN-インテインである。発現したC-インテイン構築物は、以下の構造を含んでいた:His
6
-SUMO-Int
C
-CEFL-GFP、ここで、「IntC」はC-インテインであり、「CEFL」はTerLインテインの+1、+2、+3、および+4 C-エクステイン残基であり、「GFP」は緑色蛍光タンパク質である。エクステイン依存性のスクリーニングのために、「EFE」または「CEFL」エクステイン配列に示されている各点突然変異に相当する構築物を使用した。
【0212】
大腸菌BL21(DE3)細胞をMBP-IntNまたはIntC-GFPインテインプラスミドで形質転換させ、50μg/mLのカナマイシンを含有する1LのLB中、37℃で増殖させた。培養物がOD600=0.6に達したところで、0.5mM IPTGを加えて発現を誘導した(終濃度0.5mM、18℃で18時間)。SUMO-CatC構築物の試験発現のために、IPTGの添加時にも37℃で3時間発現試験を行った。発現後、細胞を遠心分離(5,000rcf、30分)によりペレットとし、-80℃で保存した。
【0213】
次に、細胞ペレットを、プロテアーゼ阻害剤カクテルを含有する30mLの溶解バッファー(50mMリン酸塩、300mM NaCl、5mMイミダゾール、pH8.0)に再懸濁させた。細胞を音波処理(35%振幅、8×20秒パルスオン/30秒オフ)によって溶解させた後、遠心分離(35,000rcf、30分)によりペレットとした。上清を4mLのNi-NTA樹脂とともに4℃で30分間インキュベートしてHisタグを有するインテインを結合させた。次に、このスラリーをフリット付きカラムに載せ、フロースルーを回収し、カラムを20mL
の溶解バッファーで洗浄した。その後、タンパク質を20mLの溶出バッファー(溶解バッファー+250mMイミダゾール)でカラムから溶出させた。
【0214】
溶出したタンパク質を溶解バッファーに対して透析するとともに10mM TCEPおよびUlp1プロテアーゼで、4℃にて一晩処理してHis
6-SUMO発現タグを切断した。次に、透析されたタンパク質を4mL Ni-NTA樹脂とともに4℃で30分間インキュベートし、その後、これをフリット付きカラムに適用し、フロースルーを10mLの溶解バッファー洗液と一緒に回収した。次に、タンパク質を10mM TCEPで処理し、2mLに濃縮し、脱気したスプライシングバッファー(100mMリン酸ナトリウム、150mM NaCl、1mM EDTA、pH7.2)を移動相として用いるS75 16/60ゲル濾過カラムで精製した。画分を分析RP-HPLCおよびESI-MSにより分析し(
図1、表3)、すぐにスプライシングアッセイに用いるか、または液体窒素中で急速冷凍した後にグリセロール(20%v/v)中で長期保存した。
【0215】
【0216】
スプライシングアッセイ
スプライシングアッセイは、従前に記載されたプロトコール
8から適合させたものとして実施した。簡単に述べれば、N-インテインおよびC-インテイン(4μM Int
N、4μM Int
C)を個々に、2mM TCEPを含むスプライシングバッファー(100mMリン酸ナトリウム、150mM NaCl、1mM EDTA、pH7.2)中で15分間プレインキュベートした。スプライシング反応を示された温度および尿素濃度で実施した。エクステインの特性評価のために、示しているエクステイン突然変異を含むCat
C-GFPおよびMBP-Cat
Nタンパク質は、それらの同族野生型N-インテインまたはC-インテインで30℃にてスプライシングした。尿素の存在下でのCatおよびAceL
*のスプライシングを30℃で行った。スプライシングは等容量のN-インテインとC-インテインを混合することによって開始し、示された時間にアリコートを取り出し、4×ローディング色素(160mM Tris、40%グリセロール、4%SDS、0.08%ブロモフェノールブルー、8%BME)を1:1で添加することによって急冷した。サンプルをSDS-PAGEゲル電気泳動により分析し(12%ビス-トリス、60分、150v)、濃度計により定量した(
図2および3)。
【0217】
トランススプライシング反応の動態分析
トランススプライシング反応のスプライシング速度を決定するために、GraphPad Prismソフトウエアを用いてデータを一次速度方程式に当てはめた。
【数1】
【0218】
式中、[P]は生成物正規化強度であり、[P]maxは反応プラトーであり、kは速度定数(s-1)である。各値の平均および標準誤差を報告する(n=3)。
【0219】
構造研究のためのインテインの発現
構造特性評価のために最小のエクステイン配列でCat
Cを単離するためには構築物の最適化が必要であった。大腸菌での組換え発現の際(18℃、16時間または37℃3時間)、AceL
*CおよびGOS
Cに比べてSUMO-Cat
Cは収量増を示した(
図4)。しかしながら、SUMO発現タグを除去すると、切断時にCat
Cの凝集が生じた(おそらく生理学的pH、pI=7.2でのその中性荷電のため)。従って、溶液中でのタンパク質の溶解度を改善するために直接隣接するCat
Cに荷電残基、具体的には、N末端FLAGエピトープタグおよび「CESRGK」C-エクステイン配列を付加した(SUMO-Flag-Cat
C)。これらの構造研究に使用したCat
N構築物はSUMO融合物(SUMO-Cat
N)として発現され、SUMO切断後に最小の「EFE」N-エクステインを含む。さらに、会合した複合体の構造分析中にスプライシングを防ぐために構築物に不活性化C1AおよびN134A突然変異を含めた。構造研究のためのこれらのCat
NおよびCat
C構築物の発現および精製は、スプライシングのために使用したタンパク質に関して上記した通りに実施した。
【0220】
NMR分光法で使用するために、同位体が濃縮されたCatタンパク質の発現を従前に記載したように実施した。インテインプラスミドを用いてBL-21(DE3)細胞を形質転換させ、これらの細胞を5mL LB開始培養液物中で一晩増殖させた(37℃、18時間)。次に、開始培養物を回転沈降させた(4,000rcf、5分)。上清を廃棄した後、細胞を唯一の炭素および窒素源として13C-グルコースおよび15NH4Clを添加した1LのM9培地(50μg/mLカナマイシン、37℃)に再懸濁させ、増殖させた。細胞がOD600=0.6に達したところで、IPTGを添加して発現を誘導した(0.5mM、18時間、18℃)。発現後、細胞を遠心分離(5,000rcf、30分)によって回転沈降させ、-80℃で保存した。インテイン構築物に関して上記した一般法を用いて精製を行った。精製されたタンパク質の質量は、CatNおよびCatCの両タンパク質で99%の同位体標識効率に相当する。
【0221】
NMR分光法
NMR実験は、遊離形態および複合体のCat
NおよびCat
Cを用いて実施した。NMRサンプルは、精製タンパク質を20mMリン酸ナトリウム、150mM NaCl、2mM TCEP(pH6.8、37℃)にバッファー交換することによって調製した。均一に標識された
15N、
13C、
1Hタンパク質を終濃度が約300~600μMとなるように濃縮した。
図3A、3Bに示す複合体のHSQC実験に関して、同位体で標識したインテイン断片を相補的非標識インテイン溶液と1:1.5比で混合し、遊離タンパク質と同様の終濃度まで濃縮し、直接測定した。構造決定のために、同位体で標識したインテイン断片を1.5:1のCat
N:Cat
C比で混合した。この複合体をサイズ排除クロマトグラフィーによりさらに精製して遊離形態を除去した。
【0222】
実験は、600、700、800または900MHzの電界強度で実施し、要すれば非均一サンプリング(Non-Uniform Sampling)(NUS)取得を採用した。NMRスペクトルは、Bruker Topspin 3.0またはNMR Pipeソフトウエアを用いて処理し、NUSスペクトルは、qMDDを用いた圧縮センシングによって再構築した。
【0223】
化学シフトの割り当て
主鎖化学シフトは、HNCO、HN(CA)CO、HNCACB、CBCA(CO)NH三重共鳴実験を使用して割り当てた。側鎖の割り当ては、H(CC)(CO)NH、(H)CC(CO)NH、H(C)CH-TOCYおよび(H)CCH-TOCSY実験から得た。芳香族の割り当てはCT-13C分解[1H,1H]-NOESY(混合時間=100ms)、(HB)CB(CGCD)HDおよび(HB)CB(CGCDCE)HE実験から得た。手動による化学シフトの割り当ておよびその他のデータ分析のためには、CcpNmr分析ソフトウエアを使用した。化学シフト値のバリデーションを行い、Biological Magnetic Resonance Bank(BMRB No:30480)に寄託した。ランダムコイル化学シフトは、CcpNmr分析を用いて計算した。
【0224】
スピン弛緩の測定
15Nスピンのスピン-スピン弛緩(R2)速度(混合時間0、17、34、51、85、119、170、255、340、510、680ms)および[15N-1H]NOE実験を600MHの電界強度で測定した。
【0225】
構造決定
二面角拘束は、TALOSソフトウェアを使用して化学シフトから計算した13。NOEクロスピークは、15N分解[1H,1H]-NOESY実験(混合時間=80ms)、13C分解[1H,1H]-NOESY実験(混合時間=80ms)、CT-13C分解芳香族[1H,1H]-NOESY実験(混合時間=100ms)から選択し、ARIAおよびCNSソフトウエアを用いて自動的に割り当てた。割り当ておよび構造計算は8サイクルで行い、各ステップで20の構造を計算した。割り当てられたNOEを手動で確認し、違反分析を行った。確認済みのNOEピークリストを用いて距離制限を生成した。3,283の明確な拘束、206の曖昧な拘束および180の二面角拘束を用いて、最終的に256の構造を計算した。20の最小エネルギー構造を選択し、水の精密化を行った。構造のバリデーションを行い。タンパク質データバンク(Protein Data Bank)(PDB ID:6DSL)に寄託した。
【0226】
円偏光二色性(CD)
CatN、CatC、およびCatNとCatCの1:1複合体をCDバッファー(25mMリン酸ナトリウム、50mM NaF、1mM DTT、pH7.2)に対して透析した。CDスペクトルを光路長1mmのキュベットにて25℃で測定した(10μMサンプル濃度)。
【0227】
分析サイズ排除クロマトグラフィー(SEC)
分析SEC実験は、S75 10/300カラムにて、4℃、スプライシングバッファー(25mMリン酸ナトリウム、150mM NaCl、1mM DTT、pH7.2)中で行った。総ての分析で、UV吸光度を214nmでモニタリングした。サンプルはサンプル容量500μL(25μM)で注入し、流速0.5mL/分で溶出させた。
【0228】
制限タンパク質分解
EFE-CatN、Flag-CatC、およびEFE-CatNとFlag-CatCの1:1複合体をサーモライシンバッファー(50mM Tris HCl、100mM NaCl、2mM MgSO4、2mM CaCl2、1mM DTT、pH7.4)に対して透析し、10μMの濃度まで希釈した。サーモライシン粉末(Sigma)をサーモライシンバッファーで溶解させて0.4mg/mLとしたものを調製し、各溶液に添加した(1:50v/v)。示された時点で、アリコートを取り出し、8MグアニジンHCL 4%TFAを1:3で添加して急冷した。次に、これらのサンプルをRP-HPLCおよびESI-MSによって分析した。各ピークからの質量をProteinProspector(UCSF)から得られたインテインの推定切断生成物と比較した。
【0229】
結合実験のためのインテインの生産
フルオレセイン標識CatN(Fl-CatN)ペプチドを、標準的な9-フルオレニルメチル-オキシカルボニル(Fmoc)固相ペプチド合成(SPPS)によって合成した。ペプチドの最後のアミノ酸を結合した後、N末端を5(6)-カルボキシフルオレセインでキャップした。合成されたFl-CatNペプチドを分取RP-HPLCによって精製し、分析RP-HPLCおよびESI-MSによって特性評価した。結合実験のために発現させたC-インテインは、上記で詳細に示したSUMO-Flag-CatC構築物であった。Ulp1消化を行う代わりに、発現させたSUMO-Flag-CatCタンパク質はそのまま、Ni-NTA濃縮の後にS75 16/60ゲル濾過カラムで精製した。
【0230】
定常状態蛍光異方性
平衡測定は、低塩バッファー(50mMリン酸ナトリウム、100mM NaCl、1mM DTT、1mM EDTA、pH7.0)および高塩バッファー(50mMリン酸ナトリウム、500mM NaCl、1mM DTT、1mM EDTA、pH7.0)中で、所与の濃度のSUMO-Flag-CatC(0pM~2,500pM)とともに500pM Fl-CatNを用いて実施した。タンパク質を保存溶液から所望の濃度に希釈し、25℃で30分間インキュベートした。サンプルを光路長1cmのキュベットに移し、すぐに蛍光異方性を測定した。一部位結合方程式の定数を、MATLABの非線形最小二乗曲線フィッティング法を用いて得た。高塩条件および低塩条件の両方で、これらのフィットから得られた定数(表4)は、測定に使用したCatNの濃度を下回った。よって、本発明者らは、より低濃度のCatNで蛍光異方性を測定することができなかったので、Kdを<500pMと報告する。
【0231】
【0232】
ストップフロー蛍光異方性
ストップフローシリンジにFl-CatNおよびSUMO-Flag-CatCタンパク質溶液を終濃度が100nM CatNおよび示された濃度のCatC(200、325、500、750、1000nM)となるように充填した。異方性値の変化を低塩バッファーおよび高塩バッファー中で50秒間測定した。異方性の経時的変化をMATLABの非線形最小二乗曲線フィッティング法を用いて従前に報告されている二重指数速度論モデルに当てはめて、各濃度について結合速度定数(kobs1およびkobs2)を得た16。次に、kobs1値およびkobs2値をCatC濃度の関数としてプロットし、直線に当てはめ、直線の傾きをkonと解釈した。
【0233】
結果
1.安定性および活性が増強されたコンセンサス非定型スプリットインテインの設計
断片会合の機構を決定するために、最少のエクステイン残基を有する非定型スプリットインテインを単離した。スプライシング速度がin vitroにおいて特徴付けられた両方の天然に存在する非定型スプリットインテインは、メタゲノムシーケンシングデータから、T4-バクテリオファージ型DNAパッケージングターミナーゼ大サブユニット(TerL)内に同定された。南極の塩水部分循環エース湖からの第1のものは(AceL)、8℃で最適スプライシング速度を示す(t1/2=7分)。さらに、定向進化により、37℃で活性を増す(t1/2=6分)AceL内の安定化突然変異(AceL
*)が見出された。2番目に特徴付けられた非定型スプリットインテインは、グローバル・オーシャン・サンプリング・プロジェクト(GOS)においてプンタ・コルモラント(Punta Cormorant)から採取されたサンプルで配列決定され、最適温度30℃でスプライスする(t1/2=3分)。大腸菌での発現からの可溶性GOS
N(すなわち、N末端GOSインテイン断片)、GOS
C、またはAceL
*Cの精製は、大きな安定化エクステインタンパク質によって行った(
図4)。カオトロピック剤を用いた不溶性封入体画分から可溶化エクステインを欠く非定型スプリットインテインの抽出は、再折りたたみの際の凝集問題のために上手くいかなかった。
【0234】
コンセンサス設計は、安定化突然変異を予測するために相同タンパク質配列からの進化情報を利用するタンパク質工学的戦略であり、活性の高い耐熱性天然スプリットDnaEインテイン(Cfa)を作製するためにこれまでに適用されている。in vitro構造特性評価に適した非定型スプリットインテインを作出しようと、JGIおよびNCBIデータベースにおけるメタゲノム配列決定情報のBLAST検索から発見されたTerL
NおよびTerL
Cインテインのマルチプル配列アラインメント(MSA)からコンセンサス非定型(Cat)TerLインテインを設計した(表1)。Cat
N(60%)およびCat
C(64%)は両方ともそれぞれAceL
*NおよびAceL
*Cとの高い配列類似性を含み、非同一残基は一次配列中に分散していた(
図5)。Catインテイン対を単離し、そのin vitroトランススプライシング活性を測定するためにモデルエクステインに融合した(表5)。Catは、超高速のスプライシング活性を示し(30℃でt
1/2=59s)、一連の温度で一貫してAceL
*を上回る(
図5)。さらに、Catは、AceL
*がスプライスできない温度である50℃でも活性を維持する。PTSはまた、凝集しやすいエクステイン断片を可溶化させるためによく使用されるカオトロピック剤の存在下でも測定した。1 Catはカオトロピック安定性の増強を示し、2Mおよび4M尿素の両方でスプライス可能であり(
図5、表6)、一方、AceL
*はこれらの条件の両方の下で不活性である。悪条件下での加速されたスプライシング速度と活性は、Catをこれまでに報告された最も速く、最も堅牢な非定型スプリットインテインとして確立し、従って、タンパク質の合成N末端修飾のツールとして役立つはずである。
【0235】
【0236】
【0237】
2.断片のアセンブリは無秩序型から秩序型への構造遷移を誘導する
非定型スプリットインテインの会合過程を検討するために、最小エクステインを保持するCat
NおよびCat
Cを同位体濃縮培地(
15N、
13C)中で発現させ、精製し、核磁気共鳴(NMR)分光法によって分析した。これらの構築物には、複合体の構造分析中にスプライシングを防ぐために不活性化C1AおよびN134A突然変異も含めたことに留意されたい。単独のCat
Nの
1H-
15N HSQCスペクトルは、
1H次元に最小の分散を示し、これは無秩序なタンパク質に共通の現象で、Ssp
CおよびNpu
Cに関してこれまでに見られている(
図6)。非標識Cat
Cを添加するとスターク遷移が起こり、よく分散した
1H-
15N HSQCスペクトルが得られるが、これはCat
Nの折りたたみと一致している(
図6)。さらに、Cat
Nにおける
1H-
15Nヘテロ核NOE、スピン-スピン弛緩速度、およびCα-Cβ化学シフト摂動の測定により、Cat
Cの結合時の、Cat
Nの無秩序型から秩序型への遷移のさらなる証拠が得られる(
図7)。単独のCat
Cの
1H-
15N HSQCは、そのタンパク質の残基数から予想されるよりもはるかに少ないクロスピークを示し、これは化学交換を受けている動的タンパク質に存在する特徴であり、SspNおよびNpuNの両方でこれまでに見られたものである(
図6)。非標識Cat
Nの添加は、新たなクロスピークの出現をもたらし、これはより秩序的な複合体への遷移を示す(
図6)。遊離形態のCat
Cのスペクトルの質のために本発明者らはタンパク質の割り当てができなかったが、いくつかのクロスピークは結合型で見られたものとオーバーラップし、このことは、遊離形態と結合形態のCat
Cは部分的な構造同一性を有することを示唆する。
【0238】
NMR研究と一致して、円偏光二色性分光法による分析は、非結合型のCat
Nは二次構造を抽出する傾向があってあまり構造化されず、Cat
NおよびCat
Cインテインは両方とも会合時に構造遷移を受けることを示す(
図6)。Cat
Cはより小さい分子量を有するにもかかわらず結合した複合体よりも速く溶出するので、結合時の折りたたみのさらなる証拠はサイズ排除クロマトグラフィー(SEC)によって得られた(
図6)。SEC溶出プロファイルは、その同族インテインが結合した際のCat
Cの圧縮と一致している。
【0239】
3.非定型スプリットインテイン複合体の溶液構造
同位体が濃縮されたCat
NおよびCat
Cタンパク質を複合体に組み立て、その構造をNMR分光法から得られた距離制限および二面角拘束から計算した。構造計算から得られた20の最低エネルギーの立体配座異性体を示す(
図8A、PDB ID:6DSL)。この構造アンサンブルは、タンパク質の総ての領域(Cat
Cおよびエクステイン内の短い溶解性タグを除く)で正確であり、平均構造に対する平均主鎖RMSDは1.19Åである(表7)。タンパク質の構造化された領域で、<0.5Åの残基的主鎖RMSD値が得られた(
図9Aおよび9B)。Catの構造は主としてβ-シートであり、Cat
NのC末端に存在する最後の8残基が唯一のα-ヘリックスである(
図8)。それはHINTドメインを含むタンパク質に典型的な馬蹄形構造を有する。Catの構造は、Npu(PDB ID:2KEQ、アラインされた92のCα原子にわたってRMSD 1.45Å)およびSsp(PDB ID:1ZDE、アラインされた90のCα原子にわたってRMSD 1.34Å)などのDnaEインテインの構造と類似している(ただし、NpuおよびSspは付加的なヘリックスを有し、これはCatには存在しない)。
【0240】
Cat活性部位において、セリン残基(Ser
75)は、カノニカルなTXXH B-ブロックモチーフに位置するトレオニンに置き換わっている(
図9C)。C1Aのカルボニル酸素は、Ser75のアミドプロトン(2.4Å)およびヒドロキシルプロトン(3.7Å)に近接している(
図8C)。DnaEインテインのトレオニン残基は類似の立体配座を採り、Ser75がN末端の切れやすいペプチド結合の切断を補助するトレオニンの役割を果たしていることが示唆される。構造上のもう1つの注目すべき特徴がF-ブロックヒスチジンの欠如であり(
図9C)、従って、分岐のある中間体の分解能は、最後から2番目のG-ブロックヒスチジン(His133)によって媒介される可能性がある。
【表7】
【0241】
4.Catにおける無秩序局在のマッピング
Catにおける局部構造の分布を検討するためにサーモライシン消化による制限タンパク質分解を適用した(
図10A)。単独で、Cat
Nは急速分解を受けるが、Cat
Cは、タンパク質分解に対してやや大きい耐性を示す。しかしながら、インテイン複合体は30分後に無傷のままであった。見られたプロテアーゼ感受性の変動は、大部分無秩序なCat
N、部分的に無秩序なCat
C、および結合時の球状の折りたたみの形成と一致している。本発明者らは、次に、タンパク質分解から保護される領域(局在構造要素に相当するはずである)を決定するためにエレクトロスプレーイオン化質量分析(ESI-MS)を用いて切断生成物(t=30分)を調べた(
図11、表8)。Cat
Nでは、切断部位は一次配列中に一様に分散していると思われた。これに対して、Cat
Cの大部分はタンパク質分解に対して耐性がある。残基57~112を中心とする無傷断片に相当する多くのピークが見られ、これはこの領域を無秩序なN末端およびC末端ペプチドによって挟み込まれた構造化領域として指し示す(
図10B)。このモデルをCatの構造上にマッピングすると、Cat
CのN末端およびC末端がCat
Nと直接相互作用することが示される(
図10C)。さらに、スクシンイミド形成のための重要な触媒残基(Asp115、His133、およびAsn
134)は、Cat
Cの無秩序領域内に存在する。
【0242】
【0243】
5.アセンブリは主として疎水性相互作用によって誘導される
スプリット形態におけるCat断片の構造特性を調べた後に、会合を引き起こす分子成分の同定をしようとした。Cat
NおよびCat
Cの一次配列は電荷の分離を示すが、Cat
N-Cat
Cの結合表面は疎水性残基に富む(
図12AおよびB)。複合体では、Cat
NおよびCat
Cの両方の荷電残基は、タンパク質の外部に向かって排除されるが、疎水性残基は結合界面にクラスター化する(
図13AおよびB)。これらの疎水性相互作用が複合体の形成を誘導することを確認するために、断片会合に及ぼすバッファーのイオン強度の影響を、蛍光異方性に基づく結合アッセイを用いて評価した。N末端フルオレセインを含むCat
N(Fl-Cat
N)を固相ペプチド合成によって合成し、SUMO-Cat
C融合タンパク質と会合した際の蛍光異方性の増大を観察した(
図12C)。この異方性の増大は、非結合Cat
Nと比べた場合のCat複合体の回転相関時間の予想される増大を一致し、Cat複合体形成の尺度として使用した。他のスプリットインテインと同様に、Cat
NおよびCat
Cは、in vitroにおいて高い結合アフィニティーを示し、Kd値は、このアッセイの検出限界であった500pMを下回った(表9)。重要なこととして、Cat複合体形成の結合等温線は少なくともバッファーのイオン強度の変化によって摂動し、疎水性相互作用によって引き起こされる会合過程と一致する。
【0244】
次に、Fl-Cat
NとSUMO-Cat
Cの間の結合の速度をストップフロー蛍光によってモニタリングし、そのデータは二重指数関数モデルに最もよく当てはまることが分かった(
図13C)。決定された両速度定数(kobs1およびkobs2)は濃度依存性を示し、計算値は、低塩条件下でkon1(2.80±0.28)×106 M-1 s-1およびkon2(0.16±0.019)×106 M-1 s-1、高塩条件下でkon1(2.34±0.30)×106 M-1 s-1およびkon2(0.18±0.016)×106 M-1 s-1となる(
図12D、表4)。このモデルは、インテインの異なる立体配座異性体から並行会合事象が進行する可能性があり、立体配座異性体のサブセットは速度論的に識別可能であることを示唆する。さらに、kobs1およびkobs2はどちらも、総ての測定されたCat
C濃度でバッファーイオン強度によって摂動しないという所見は、会合が主として疎水性相互作用によって引き起こされるということをさらに示唆する。
【0245】
【0246】
6.Catのエクステイン依存性
これまでに、特性評価した総てのインテインが、隣接エクステイン残基に依存するスプライシング速度を示す。天然エクステイン配列からの逸脱は多くの場合スプライシングを減速し、その結果、PTSの適用を制限し得る。TerLインテインのエクステイン依存性はまだ十分に特性評価がなされていないことから、本発明者らは、天然残基とは電荷および立体的嵩の異なる置換を導入することによってCatの配列好選性を特定しようとした(
図14A)。天然C-エクステインからの、Cys+1、Glu+2、Phe+3の置換を+2および+3の位置に導入し、in vitroでアッセイした(
図14B、表10)。Catは顕著なC-エクステイン無差別性を示し、1~3分の範囲の半減期でスプライシングを行う。C-エクステイン置換に対するこの広い許容は、従前に無差別な活性を有するように設計されたNpuの操作バージョンよりもさらに優れている。このC-エクステイン置換に対する許容性とは異なり、Catは-1残基の同一性にスターク依存性を示し、この位置へのアラニン(t1/2=54分)、グリシン(t1/2=146分)、またはプロリン(t1/2=158分)の挿入から活性の低下が生じる(
図14C、表10)。評価されたin vitroエクステイン依存性はおそらくCat複合体の溶液構造に見られる相互作用によって説明される。Glu+2およびPhe+3はいずれも、活性部位触媒残基との接触が最小であると思われ、実験的に見られたC-エクステイン無差別性と一致する(
図14D)。興味深いことに、Glu+2は、F-ブロックヒスチジンの代わりに存在するAsn123と接触する。これに対して、Glu-1は、チオエステル形成に関与する2つの保存されている残基Ser75およびHis78と直接相互作用する(
図14E)。従って、N-エクステイン置換は、Ser75およびHis78のタンパク質スプライシング触媒能に直接干渉し得る。
【0247】
【配列表】