(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024123021
(43)【公開日】2024-09-10
(54)【発明の名称】モグロシドの生合成
(51)【国際特許分類】
C12N 15/61 20060101AFI20240903BHJP
C12N 1/19 20060101ALI20240903BHJP
C12N 1/21 20060101ALI20240903BHJP
C12P 19/44 20060101ALI20240903BHJP
C12P 15/00 20060101ALI20240903BHJP
C12N 15/54 20060101ALI20240903BHJP
C12N 9/90 20060101ALN20240903BHJP
C12N 9/10 20060101ALN20240903BHJP
【FI】
C12N15/61
C12N1/19 ZNA
C12N1/21
C12P19/44
C12P15/00
C12N15/54
C12N1/19
C12N15/61 ZNA
C12N9/90
C12N9/10
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024088815
(22)【出願日】2024-05-31
(62)【分割の表示】P 2021524387の分割
【原出願日】2019-11-09
(31)【優先権主張番号】62/758,474
(32)【優先日】2018-11-09
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】516286741
【氏名又は名称】ギンゴー バイオワークス, インコーポレイテッド
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100122301
【弁理士】
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100170520
【弁理士】
【氏名又は名称】笹倉 真奈美
(72)【発明者】
【氏名】アンダーソン,キム セセリア
(72)【発明者】
【氏名】ブーシェ,ジェフリー イアン
(72)【発明者】
【氏名】フロレス,ニコラス
(72)【発明者】
【氏名】ジェンセン,ジェイド
(72)【発明者】
【氏名】マー,スコット
(72)【発明者】
【氏名】マクマホン,マシュー
(72)【発明者】
【氏名】サラン,ダヤル
(72)【発明者】
【氏名】ワン,ジュエ
(72)【発明者】
【氏名】ジュー,ジエ
(57)【要約】 (修正有)
【課題】組み換え細胞におけるモグロール前駆体、モグロールおよび/またはモグロシドを産生する方法を提供する。
【解決手段】特定の配列を有する酵素(例えば、ククルビタジエノールシンターゼ(CDS)、UDP-グリコシルトランスフェラーゼ(UGT)、C11ヒドロキシラーゼ、エポキシドヒドロラーゼ(EPH)、スクアレンエポキシダーゼおよび/またはシトクロムP450レダクターゼ)、該酵素を発現する宿主細胞およびこのような宿主細胞を使用してモグロール前駆体、モグロールおよび/またはモグロシドを産生する方法である。
【選択図】なし
【特許請求の範囲】
【請求項1】
ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞であって、ここで、該CDSが
a)モチーフGX1WASDLGGP(配列番号331)(ここで、X1はNまたはHである);
b)モチーフDX1GWL(配列番号332)(ここで、X1はHまたはQである);および/または
c)モチーフCWGVCFTYAGW(配列番号333)
を含み、ここで、該CDSは、ラカンカCDS(配列番号73)の配列を含まず;そしてここで、該宿主細胞は、対照に比して少なくとも10%、20%または30%多いククルビタジエノール化合物を産生し、ここで、該対照は、配列番号33に対応するポリヌクレオチドによりコードされるラカンカCDSを発現する宿主細胞である、宿主細胞。
【請求項2】
a)モチーフGX1WASDLGGP(配列番号331)がCDSにおいて配列番号73における残基117~126に対応する残基に存在し;
b)モチーフDX1GWL(配列番号332)がCDSにおいて配列番号73における残基479~483に対応する残基に存在し;および/または
c)モチーフCWGVCFTYAGW(配列番号333)がCDSにおいて配列番号73における残基612~622に対応する残基に存在する、
請求項1に記載の宿主細胞。
【請求項3】
ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞であって、該CDSが
a)モチーフGHWASDLGGP(配列番号334);および/または
b)モチーフDQGWL(配列番号335)を含む、
宿主細胞。
【請求項4】
a)モチーフGHWASDLGGP(配列番号334)がCDSにおいて配列番号73における残基117~126に対応する残基に存在し;および/または
b)モチーフDQGWL(配列番号335)がCDSにおいて配列番号73における残基479~483に対応する残基に存在する、
請求項3に記載の宿主細胞。
【請求項5】
ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞であって、該CDSが
a)モチーフGHWANDLGGP(配列番号336);
b)モチーフDQGWL(配列番号335);および/または
c)モチーフCWGVCYTYAGW(配列番号337)を含む、
宿主細胞。
【請求項6】
a)モチーフGHWANDLGGP(配列番号336)がCDSにおいて配列番号73における残基117~126に対応する残基に存在し;
b)モチーフDQGWL(配列番号335)がCDSにおいて配列番号73において残基479~483に対応する残基に存在し;および/または
c)モチーフCWGVCYTYAGW(配列番号337)がCDSにおいて配列番号73における残基612~622に対応する残基に存在する、
請求項5に記載の宿主細胞。
【請求項7】
異種ポリヌクレオチドが配列番号3、9または12と少なくとも90%同一である、請求項1~6の何れかに記載の宿主細胞。
【請求項8】
該CDSが配列番号43、49または52と少なくとも90%同一である、請求項7に記載の宿主細胞。
【請求項9】
異種ポリヌクレオチドが配列番号3と少なくとも90%同一である、請求項7に記載の宿主細胞。
【請求項10】
該CDSが配列番号43と少なくとも90%同一である、請求項8に記載の宿主細胞。
【請求項11】
ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞であって、該異種ポリヌクレオチド配列が配列番号3と少なくとも90%同一であるおよび/または異種ポリヌクレオチドによりコードされるCDSのアミノ酸配列が配列番号43と少なくとも90%同一であり、そしてここで、該宿主細胞がククルビタジエノール化合物を産生する、宿主細胞。
【請求項12】
ククルビタジエノール化合物が24-25エポキシ-ククルビタジエノールまたはククルビタジエノールである、請求項1~11の何れかに記載の宿主細胞。
【請求項13】
該CDSが配列番号743の123位のアミノ酸残基に対応するアミノ酸残基にロイシンを含む、請求項1~12の何れかに記載の宿主細胞。
【請求項14】
該CDS酵素が基質溝および活性部位腔を含む、請求項1~13の何れかに記載の宿主細胞。
【請求項15】
該宿主細胞がUDP-グリコシルトランスフェラーゼ(UGT)、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、エポキシドヒドロラーゼ(EPH)および/またはスクアレンエポキシダーゼをコードする1以上の異種ポリヌクレオチドをさらに含む、請求項1~14の何れかに記載の宿主細胞。
【請求項16】
請求項1~15の何れかに記載の宿主細胞とオキシドスクアレンを接触させ、それにより、ククルビタジエノール化合物を産生することを含む、ククルビタジエノール化合物を産生する方法。
【請求項17】
ククルビタジエノール化合物が24-25エポキシ-ククルビタジエノールまたはククルビタジエノールである、請求項16に記載の方法。
【請求項18】
オキシドスクアレンが2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレンである、請求項16または17に記載の方法。
【請求項19】
方法がククルビタジエノール化合物の単離をさらに含む、請求項16~18の何れかに記載の方法。
【請求項20】
該宿主細胞が酵母細胞、植物細胞または細菌細胞である、請求項1~15の何れかに記載の宿主細胞。
【請求項21】
該宿主細胞がサッカロマイセス・セレビシエ細胞である、請求項20に記載の宿主細胞。
【請求項22】
該宿主細胞が大腸菌細胞である、請求項20に記載の宿主細胞。
【請求項23】
UDP-グリコシルトランスフェラーゼ(UGT)をコードする異種ポリヌクレオチドを含む宿主細胞であって、ここで、該UGTが
(a)野生型UGT94-289-1(配列番号109)の残基83~92に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基83~92に対応する位置にアミノ酸置換を含む領域;および/または
(b)野生型UGT94-289-1(配列番号109)の残基179~198に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基179~198に対応する位置にアミノ酸置換を含む領域
を含み;そしてここで、該宿主細胞が少なくとも1つのモグロシド前駆体の存在下、野生型UGT94-289-1(配列番号109)をコードする異種ポリヌクレオチドを含む対照宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%多い1以上のモグロシドを産生する、
宿主細胞。
【請求項24】
UDP-グリコシルトランスフェラーゼ(UGT)をコードする異種ポリヌクレオチドを含む宿主細胞であって、ここで、該UGTが
(a)野生型UGT94-289-1(配列番号109)の残基83~92に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基83~92に対応する位置にアミノ酸置換を含む領域;および/または
(b)野生型UGT94-289-1(配列番号109)の残基179~198に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基179~198に対応する位置にアミノ酸置換を含む領域
を含み、そしてここで、該UGTが配列番号109に90%未満の同一性を含む、
宿主細胞。
【請求項25】
UDP-グリコシルトランスフェラーゼ(UGT)をコードする異種ポリヌクレオチドを含む宿主細胞であって、ここで、該UGTが野生型UGT94-289-1(配列番号109)のH21/D122に対応する触媒ダイアドから7オングストローム以内であるアミノ酸残基の位置にアミノ酸置換を含み、ここで、該UGTがアミノ酸置換を含まない同じUGTに対して比活性が少なくとも1.3倍増加する、宿主細胞。
【請求項26】
循環置換UDP-グリコシルトランスフェラーゼ(UGT)をコードする異種ポリヌクレオチドを含む宿主細胞であって、該循環置換UGTが
(a)触媒ダイアド;そして
(b)補因子結合部位
を含み、ここで、触媒ダイアドは補因子結合部位に対してC末端に位置し、そして
ここで、該宿主細胞が少なくとも1つのモグロシド前駆体の存在下、野生型UGT94-289-1(配列番号109)をコードする異種ポリヌクレオチドを含む対照宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%多い1以上のモグロシドを産生する、
宿主細胞。
【請求項27】
該循環置換UGTが表6内の配列と少なくとも90%同一である配列を含む、請求項26に記載の宿主細胞。
【請求項28】
該UGTが表3または表7内の配列と少なくとも90%同一である配列を含む、請求項23~25の何れかに記載の宿主細胞。
【請求項29】
該UGTが野生型UGT94-289-1(配列番号109)に対して比活性が少なくとも1.3倍増加を示す、請求項23、24および26~28の何れかに記載の宿主細胞。
【請求項30】
該UGTが野生型UGT94-289-1(配列番号109)におけるループ6、アルファヘリックス3、ループ11、アルファヘリックス6、ループ12およびアルファヘリックス7から選択される構造モチーフに対応する構造モチーフに位置するアミノ酸残基にアミノ酸置換を含む、請求項23~29の何れかに記載の宿主細胞。
【請求項31】
該UGTがモグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる、請求項23~30の何れかに記載の宿主細胞。
【請求項32】
該UGTがモグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる、請求項23~31の何れかに記載の宿主細胞。
【請求項33】
UGTの比活性が1時間あたり酵素1グラムあたり少なくとも1mmolのグリコシル化モグロシド標的の産生である、請求項23~32の何れかに記載の宿主細胞。
【請求項34】
該UGTが野生型UGT94-289-1(配列番号109)におけるH83;T84;T85;N86;P89;L92;Y179;S180;A181;G184;A185;V186;T187;K189;H191;K192;G194;E195;およびA198から選択されるアミノ酸残基に対応するアミノ酸残基の位置にアミノ酸置換を含む、請求項23~33の何れかに記載の宿主細胞。
【請求項35】
該宿主細胞がアミノ酸置換を含まないUGTをコードする異種遺伝子を発現する宿主細胞に対して少なくとも1つのモグロシド前駆体の存在下、少なくとも40%、50%、60%、70%、80%、90%または100%多い1以上のモグロシドを産生する、請求項34に記載の宿主細胞。
【請求項36】
該宿主細胞がククルビタジエノールシンターゼ(CDS)酵素、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、エポキシドヒドロラーゼ(EPH)および/またはスクアレンエポキシダーゼをコードする異種ポリヌクレオチドをさらに含む、請求項23~35の何れかに記載の宿主細胞。
【請求項37】
該CDSをコードする異種ポリヌクレオチドが配列番号3、9または12と少なくとも90%同一である、請求項36に記載の宿主細胞。
【請求項38】
該CDSが配列番号43、49または52と少なくとも90%同一である、請求項37に記載の宿主細胞。
【請求項39】
細胞が酵母細胞、植物細胞または細菌細胞である、請求項23~38の何れかに記載の宿主細胞。
【請求項40】
該宿主細胞がサッカロマイセス・セレビシエ細胞である、請求項39に記載の宿主細胞。
【請求項41】
該宿主細胞が大腸菌細胞である、請求項39に記載の宿主細胞。
【請求項42】
モグロシドを産生する方法であって、請求項23~40の何れかに記載の宿主細胞を少なくとも1つのモグロシド前駆体と共に培養することを含む、方法。
【請求項43】
モグロシド前駆体がモグロール、MIA1、MIIA1、MIIIA1、MIIE、MIIIおよびMIIIEから選択される、請求項42に記載の方法。
【請求項44】
産生されるモグロシドがMIA1、MIIA1、MIIIA1、MIIE、MIII、シアメノシドおよびMIIIEから選択される、請求項42または43に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年11月9日出願の「Biosynthesis of Mogrosides」なる名称の米国仮出願62/758,474に基づく35 U.S.C. § 119(e)下の優先権の利益を主張し、その開示を、全体として引用により本明細書に包含させる。
【0002】
EFS-WEBによりテキストファイルとして提出した配列表の記載
本出願は、EFS-Webを介してASCII形式で提供した配列表を含み、ここにその全体を引用により包含させる。該ASCIIコピーは2019年11月9日に作成し、G091970023WO00-SEQ-OMJ.TXTなる名称であり、928キロバイトサイズである。
【0003】
発明の分野
本発明は、組み換え細胞におけるモグロール前駆体、モグロールおよびモグロシドの産生に関する。
【背景技術】
【0004】
背景
モグロシドは、ククルビタン誘導体の配糖体である。甘味料および糖代替物として高度に需要がある、モグロシドは、シライチア・グロスベノリイ(Siraitia grosvenorii)(ラカンカ)を含む食物果実で天然に合成されている。抗癌、抗酸化および抗炎症性質はモグロシドに帰属するとされているが、モグロシド生合成に関与する正確な酵素の特徴づけは限られている。さらに、果実からのモグロシド抽出は大きな労働力を要し、モグロシドの構造の複雑さが、デノボ化学合成をしばしば妨げている。
【発明の概要】
【0005】
概要
本発明の態様は、UDP-グリコシルトランスフェラーゼ(UGT)をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)の残基83~92に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基83~92に対応する位置にアミノ酸置換を含む領域;および/または野生型UGT94-289-1(配列番号109)の残基179~198に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基179~198に対応する位置にアミノ酸置換を含む領域を含み;ここで、該宿主細胞は、少なくとも1つのモグロシド前駆体の存在下、野生型UGT94-289-1(配列番号109)をコードする異種ポリヌクレオチドを含む対照宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%多い1以上のモグロシドを産生する。
【0006】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)に比して活性(例えば、比活性)の少なくとも1.3倍増加を示す。ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるループ6、アルファヘリックス3、ループ11、アルファヘリックス6、ループ12およびアルファヘリックス7から選択される構造モチーフに対応する構造モチーフのアミノ酸残基の位置にアミノ酸置換を含む。ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる。ある実施態様において、UGTは、モグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる。ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるH83;T84;T85;N86;P89;L92;Y179;S180;A181;G184;A185;V186;T187;K189;H191;K192;G194;E195;およびA198から選択されるアミノ酸残基に対応するアミノ酸残基の位置にアミノ酸置換を含む。ある実施態様において、宿主細胞は、ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドをさらに含む。
【0007】
本発明のさらなる態様は、UGTをコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)の残基83~92に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基83~92に対応する位置にアミノ酸置換を含む領域;および/または野生型UGT94-289-1(配列番号109)の残基179~198に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基179~198に対応する位置にアミノ酸置換を含む領域を含み;ここで、該UGTは、配列番号109に90%未満の同一性を含む。
【0008】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)に比して活性(例えば、比活性)の少なくとも1.3倍増加を示す。ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるループ6、アルファヘリックス3、ループ11、アルファヘリックス6、ループ12およびアルファヘリックス7から選択される構造モチーフに対応する構造モチーフのアミノ酸残基の位置にアミノ酸置換を含む。ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる。ある実施態様において、UGTは、モグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる。ある実施態様において、宿主細胞は、CDS酵素をコードする異種ポリヌクレオチドをさらに含む。
【0009】
本発明のさらなる態様は、UGTをコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)のN143またはL374に対応する残基の位置にアミノ酸置換を含み、ここで、該宿主細胞は、少なくとも1つのモグロシド前駆体存在下、野生型UGT94-289-1(配列番号109)をコードする異種ポリヌクレオチドを含む宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%多い1以上のモグロシドを産生する。
【0010】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)に比して、活性(例えば、比活性)の少なくとも1.3倍増加を示す。ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるループ6、アルファヘリックス3、ループ11、アルファヘリックス6、ループ12およびアルファヘリックス7から選択される構造モチーフに対応するUGTの構造モチーフのアミノ酸残基の位置にアミノ酸置換を含む。ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる。ある実施態様において、UGTは、モグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる。ある実施態様において、宿主細胞は、CDS酵素をコードする異種ポリヌクレオチドをさらに含む。
【0011】
本発明のさらなる態様は、UGTをコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)のループ8;ベータシート5;ループ10;アルファヘリックス5;ループ11;ループ2;アルファヘリックス6;ループ12;アルファヘリックス1;アルファヘリックス7;ループ18;アルファヘリックス14;ループ26;アルファヘリックス2;ループ6;およびアルファヘリックス3から選択される構造モチーフに対応する構造モチーフのアミノ酸残基の位置にアミノ酸置換を含み;ここで、該宿主細胞は、少なくとも1つのモグロシド前駆体存在下、アミノ酸置換を含まないUGTをコードする異種ポリヌクレオチドを含む宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%多い、1以上のモグロシドを産生する。
【0012】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)に比して活性(例えば、比活性)の少なくとも1.3倍増加を示す。ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる。ある実施態様において、UGTは、モグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる。ある実施態様において、宿主細胞は、CDS酵素をコードする異種ポリヌクレオチドをさらに含む。
【0013】
本発明のさらなる態様は、UGTをコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)のH21/D122に対応する触媒ダイアドから7オングストローム以内であるアミノ酸残基にアミノ酸置換を含み、ここで、該UGTは、アミノ酸置換を含まない同じUGTに比して活性(例えば、比活性)の少なくとも1.3倍増加を示す。
【0014】
本発明のさらなる態様は、循環置換(circularly permuted)UDP-グリコシルトランスフェラーゼ(UGT)をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該循環置換UGTは(a)触媒ダイアド;および(b)補因子結合部位を含み;
ここで、触媒ダイアドは補因子結合部位に対してC末端に位置し、そして
ここで、該宿主細胞は、少なくとも1つのモグロシド前駆体の存在下、野生型UGT94-289-1(配列番号109)をコードする異種ポリヌクレオチドを含む対照宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%多い1以上のモグロシドを産生する。
【0015】
ある実施態様において、循環置換UGTは、表6内の配列と少なくとも90%同一である配列を含む。
【0016】
ある実施態様において、本明細書に記載するUGTは、表3または表7内の配列と少なくとも90%同一である配列を含む。
【0017】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるループ6、アルファヘリックス3、ループ11、アルファヘリックス6、ループ12およびアルファヘリックス7から選択される構造モチーフに対応する構造モチーフのアミノ酸残基の位置にアミノ酸置換を含む。
【0018】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)に比して活性(例えば、比活性)の少なくとも1.3倍増加を示す。ある実施態様において、宿主細胞は、少なくとも1つのモグロシド前駆体の存在下、アミノ酸置換を含まないUGTをコードする異種ポリヌクレオチドを含む宿主細胞に比して、少なくとも40%、50%、60%、70%、80%、90%、または100%多い1以上のモグロシドを産生する。
【0019】
ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる。ある実施態様において、UGTは、モグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる。ある実施態様において、宿主細胞は、CDS酵素をコードする異種ポリヌクレオチドをさらに含む。
【0020】
ある実施態様において、UGTの比活性は、1時間あたり酵素1グラムあたり少なくとも1mmolのグリコシル化モグロシド標的の産生である。
【0021】
本発明のさらなる態様は、UGTをコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)におけるH83;T84;T85;N86;P89;L92;Y179;S180;A181;G184;A185;V186;T187;K189;H191;K192;G194;E195;およびA198から選択されるアミノ酸残基に対応するアミノ酸残基の位置にアミノ酸置換を含む。
【0022】
本発明のさらなる態様は、UGTをコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該UGTは、野生型UGT94-289-1(配列番号109)におけるG18;Y19;S123;N47;F124;N143、T144;T145;V149;F276;N355;H373およびL374から選択されるアミノ酸残基に対応するアミノ酸残基の位置にアミノ酸置換を含む。
【0023】
ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIIE;および/またはMIIIEからシアメノシドIの変換を触媒できる。ある実施態様において、UGTは、モグロールのC24でのグリコシル化;モグロールのC3でのグリコシル化;モグロールのC3での分岐グリコシル化;またはモグロールのC24での分岐グリコシル化ができる。ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)に比して活性(例えば、比活性)の少なくとも1.3倍増加を示す。ある実施態様において、宿主細胞は、少なくとも1つのモグロシド前駆体存在下、野生型UGT94-289-1(配列番号109)をコードする異種ポリヌクレオチドを含む宿主細胞に比して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%多い1以上のモグロシドを産生する。
【0024】
ある実施態様において、Y179はグルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、バリンまたはトリプトファンに変異され;S180はアラニンまたはバリンに変異され;A181はリシンまたはスレオニンに変異され;G184はアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニンまたはチロシンに変異され;A185はシステイン、アスパラギン酸、グルタミン酸、グリシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、スレオニン、トリプトファンまたはチロシンに変異され;V186はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、スレオニン、トリプトファンまたはチロシンに変異され;T187はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、ヒスチジン、イソロイシン、リシン、ロイシン、アスパラギン、プロリン、アルギニン、セリン、バリン、トリプトファンまたはチロシンに変異され;K189はアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、グリシン、ヒスチジン、イソロイシン、ロイシン、メチオニン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリン、トリプトファンまたはチロシンに変異され;H191はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、リシン、メチオニン、プロリン、グルタミン、セリン、スレオニン、バリン、トリプトファンまたはチロシンに変異され;K192はシステインまたはフェニルアラニンに変異され;G194はアスパラギン酸、ロイシン、メチオニン、アスパラギン、プロリン、セリンまたはトリプトファンに変異され;E195はアラニン、イソロイシン、リシン、ロイシン、アスパラギン、グルタミン、セリン、スレオニンまたはチロシンに変異され;A198はシステイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリンまたはチロシンに変異され;H83はグルタミンまたはトリプトファンに変異され;T84はチロシンに変異され;T85はグリシン、リシン、プロリン、セリンまたはチロシンに変異され;N86はアラニン、システイン、グルタミン酸、イソロイシン、リシン、ロイシン、セリン、トリプトファンまたはチロシンに変異され;P89はメチオニンまたはセリンに変異され;および/またはL92はヒスチジンまたはリシンに変異される。
【0025】
ある実施態様において、N143はアラニン、システイン、グルタミン酸、イソロイシン、ロイシン、メチオニン、グルタミン、セリン、スレオニンまたはバリンに変異され;L374はアラニン、システイン、フェニルアラニン、ヒスチジン、メチオニン、アスパラギン、グルタミン、セリン、スレオニン、バリン、トリプトファンまたはチロシンに変異され;S123はアラニン、システイン、グリシンまたはバリンに変異され;F124はチロシンに変異され;T144はアラニン、システイン、アスパラギンまたはプロリンに変異され;T145はアラニン、システイン、グリシン、メチオニン、アスパラギン、グルタミンまたはセリンに変異され;V149はシステイン、ロイシンまたはメチオニンに変異され;G18はセリンに変異され;Y19はフェニルアラニン、ヒスチジン、ロイシンまたはバリンに変異され;F276はシステインまたはグルタミンに変異され;N355はグルタミンまたはセリンに変異され;H373はリシン、ロイシン、メチオニン、アルギニン、バリンまたはチロシンに変異され;および/またはN47はグリシンに変異される。
【0026】
ある実施態様において、宿主細胞は、CDS酵素、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、エポキシドヒドロラーゼ(EPH)および/またはスクアレンエポキシダーゼをコードする異種ポリヌクレオチドをさらに含む。ある実施態様において、CDSをコードする異種ポリヌクレオチドは、配列番号3、9または12と少なくとも90%同一である。ある実施態様において、CDSは、配列番号43、49または52と少なくとも90%同一である。
【0027】
ある実施態様において、UGTの活性(例えば、比活性)は、1時間あたり酵素1グラムあたり少なくとも1mmolのグリコシル化モグロシド標的の産生である。ある実施態様において、細胞は酵母細胞、植物細胞または細菌細胞である。ある実施態様において、細胞はサッカロマイセス・セレビシエ(出芽酵母)細胞である。ある実施態様において、細胞はエシェリキア・コリ(大腸菌)細胞である。
【0028】
本発明のさらなる態様は、本明細書に記載の宿主細胞の何れかを少なくとも1つのモグロシド前駆体と共に培養することを含む、モグロシドを産生する方法に関する。ある実施態様において、モグロシド前駆体は、モグロール、MIA1、MIIA1、MIIIA1、MIIE、MIIIおよびMIIIEから選択される。ある実施態様において、産生されるモグロシドは、MIA1、MIIA1、MIIIA1、MIIE、MIII、シアメノシドおよびMIIIEから選択される。
【0029】
本発明のさらなる態様は、CDS酵素をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該CDS酵素は、表2内の配列から選択される配列と少なくとも90%同一であるアミノ酸配列を含み、ここで、該宿主細胞は、異種遺伝子を発現しない同じ宿主細胞と比較して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%以上のククルビタジエノール化合物を産生する。
【0030】
ある実施態様において、ククルビタジエノール化合物は、24-25エポキシ-ククルビタジエノールまたはククルビタジエノールである。ある実施態様において、CDS酵素は、配列番号73の123位のアミノ酸残基に対応するアミノ酸残基にロイシンを含む。ある実施態様において、CDSは、オキシドスクアレンをククルビタジエノール化合物に変換できる。ある実施態様において、オキシドスクアレンは、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレンである。ある実施態様において、CDS酵素は、基質溝および活性部位腔を含む。
【0031】
ある実施態様において、宿主細胞は、C11ヒドロキシラーゼ酵素、シトクロムP450レダクターゼ酵素、エポキシドヒドロラーゼ(EPH)酵素および/またはスクアレンエポキシダーゼ酵素をコードする異種遺伝子をさらに発現する。
【0032】
本発明のさらなる態様は、ククルビタジエノール化合物を産生する方法であって、本明細書に記載の宿主細胞とオキシドスクアレンを接触させることを含み、それにより、ククルビタジエノール化合物を産生する、方法に関する。ある実施態様において、ククルビタジエノール化合物は、24-25エポキシ-ククルビタジエノールまたはククルビタジエノールである。ある実施態様において、オキシドスクアレンは、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレンである。ある実施態様において、方法は、ククルビタジエノール化合物の単離をさらに含む。
【0033】
本発明のさらなる態様は、モグロールまたはモグロシドを産生する方法であって、本明細書に記載の宿主細胞とオキシドスクアレンを接触させることを含み、それによりモグロールまたはモグロシドを産生する、方法に関する。本発明のさらなる態様は、モグロシドを産生する方法であって、本明細書に記載の宿主細胞を少なくとも1つのモグロシド前駆体と共に培養することを含む、方法に関する。
【0034】
本発明のさらなる態様は、ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該CDSは、a)モチーフGX1WASDLGGP(配列番号331)(ここで、X1はNまたはHである);b)モチーフDX1GWL(配列番号332)(ここで、X1はHまたはQである);および/またはc)モチーフCWGVCFTYAGW(配列番号333)を含み、ここで、該CDSは、ラカンカCDS(配列番号73)の配列を含まず;そしてここで、該宿主細胞は、対照に比して少なくとも10%、20%または30%以上のククルビタジエノール化合物を産生し、ここで、該対照は、配列番号33に対応するポリヌクレオチドによりコードされるラカンカCDSを発現する宿主細胞である。
【0035】
ある実施態様において、モチーフGX1WASDLGGP(配列番号331)は、CDSにおいて配列番号73における残基117~126に対応する残基に存在し;モチーフDX1GWL(配列番号332)は、CDSにおいて配列番号73における残基479~483に対応する残基に存在しおよび/またはモチーフCWGVCFTYAGW(配列番号333)は、CDSにおいて配列番号73における残基612~622に対応する残基に存在する。
【0036】
本発明のさらなる態様は、ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該CDSは、a)モチーフGHWASDLGGP(配列番号334);および/またはb)モチーフDQGWL(配列番号335)を含む。
【0037】
ある実施態様において、モチーフGHWASDLGGP(配列番号334)は、CDSにおいて配列番号73における残基117~126に対応する残基に存在し;および/またはモチーフDQGWL(配列番号335)は、CDSにおいて配列番号73における残基479~483に対応する残基に存在する。
【0038】
本発明のさらなる態様は、ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、該CDSは、a)モチーフGHWANDLGGP(配列番号336);b)モチーフDQGWL(配列番号335);および/またはc)モチーフCWGVCYTYAGW(配列番号337)を含む。
【0039】
ある実施態様において、モチーフGHWANDLGGP(配列番号336)は、CDSにおいて配列番号73における残基117~126に対応する残基に存在し;モチーフDQGWL(配列番号335)は、CDSにおいて配列番号73における残基479~483に対応する残基に存在し;および/またはモチーフCWGVCYTYAGW(配列番号337)は、CDSにおいて配列番号73における残基612~622に対応する残基に存在する。
【0040】
ある実施態様において、異種ポリヌクレオチドは、配列番号3、9または12と少なくとも90%同一である。ある実施態様において、CDSは、配列番号43、49または52と少なくとも90%同一である。ある実施態様において、異種ポリヌクレオチドは、配列番号3と少なくとも90%同一である。ある実施態様において、CDSは、配列番号43と少なくとも90%同一である。
【0041】
本発明のさらなる態様は、ククルビタジエノールシンターゼ(CDS)酵素をコードする異種ポリヌクレオチドを含む宿主細胞に関し、ここで、異種ポリヌクレオチド配列は、配列番号3と少なくとも90%同一であるおよび/または異種ポリヌクレオチドによりコードされるCDSのアミノ酸配列は、配列番号43と少なくとも90%同一であり、そしてここで、該宿主細胞はククルビタジエノール化合物を産生する。
【0042】
ある実施態様において、ククルビタジエノール化合物は、24-25エポキシ-ククルビタジエノールまたはククルビタジエノールである。ある実施態様において、CDSは、配列番号73の123位のアミノ酸残基に対応するアミノ酸残基の位置にロイシンを含む。ある実施態様において、CDSは、オキシドスクアレンをククルビタジエノール化合物に変換できる。ある実施態様において、オキシドスクアレンは、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレンである。ある実施態様において、CDS酵素は、基質溝および活性部位腔を含む。
【0043】
ある実施態様において、宿主細胞は、UDP-グリコシルトランスフェラーゼ(UGT)、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、エポキシドヒドロラーゼ(EPH)および/またはスクアレンエポキシダーゼをコードする1以上の異種ポリヌクレオチドをさらに含む。
【0044】
本発明のさらなる態様は、ククルビタジエノール化合物を産生する方法であって、本明細書に記載の宿主細胞の何れかとオキシドスクアレンを接触させることを含み、それにより、ククルビタジエノール化合物を産生する、方法に関する。ある実施態様において、ククルビタジエノール化合物は、24-25エポキシ-ククルビタジエノールまたはククルビタジエノールである。ある実施態様において、オキシドスクアレンは、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレンである。ある実施態様において、方法は、ククルビタジエノール化合物の単離をさらに含む。ある実施態様において、宿主細胞は酵母細胞、植物細胞または細菌細胞である。ある実施態様において、宿主細胞はサッカロマイセス・セレビシエ細胞である。ある実施態様において、宿主細胞は大腸菌細胞である。
【0045】
本発明の限定の各々は、種々の本発明の実施態様を含み得る。それ故に、要素の何れか一つまたは複数要素の組み合わせを含む本発明の限定の各々が、本発明の各態様に包含され得ると見込まれる。この発明は、以下に記載されまたは図面において説明される、構成の詳細および要素の配置にその適用は限定されない。本発明は、他の実施態様が可能であり、種々の方法で実施または実行されることが可能である。
【図面の簡単な説明】
【0046】
添付する図面は、正確な比率であることは意図しない。図面は説明のためのみであり、本発明の実施可能性に必要なものではない。明確にする目的で、全ての図面に全ての要素がラベルされていない可能性がある。図面は次のとおりである。
【0047】
【
図1】
図1A~1Dは、推定されるモグロール生合成経路の図式的概略を示す。SQSはスクアレンシンターゼを示し、EPDはエポキシダーゼを示し、P450はC11ヒドロキシラーゼを示し、EPHはエポキシドヒドロラーゼを示し、CDSはククルビタジエノールシンターゼを示す。
図1Aおよび
図1Bは、推定されるモグロール生合成経路を示す。
図1Cは、一次UGT活性の非限定的例を示す。
図1Dは、二次UGT活性の非限定的例を示す。
【0048】
【
図2】
図2は、モグロール、モグロシドI-A1、モグロシドI-E1、モグロシドII-A1、モグロシドII-A2、モグロシドII-E、モグロシドIII-A1、モグロシドIII-E、モグロシドIVおよびシアメノシドIの液体クロマトグラフィー-マススペクトロメトリー(LC-MS)プロファイルを示すグラフである。8分LC-MS方法を使用して、これら全モグロシド標品間を区別した。
【0049】
【
図3】
図3A~3Bは、モグロシド基質に対してスクリーニングしたUGTライブラリーからのモグロシドI-A1(
図3A)およびシアメノシドI(
図3B)の産生を示す、一連のグラフである。各株の各2個の生物学的反復をスクリーニングした。
【0050】
【
図4】
図4A~4Bは、個々の基質の的中株の二次スクリーニングにおける、モグロールからモグロシドI-A1の産生(
図4A)およびモグロシドIII-A1からシアメノシドIの産生(
図4B)を示す、一連のグラフである。各々の2個の技術的反復を伴う2個の生物学的反復を、各的中株についてスクリーニングした。
【0051】
【
図5】
図5は、UGT94-289-1の相同性モデルの図式である。触媒ダイアド側鎖を四角内に示し、活性増強変異を特徴づける位置を黒色で強調する。
【0052】
【
図6】
図6は、UGT94-289-1相同性モデルのN末端およびC末端の近接を示す略図である。
【0053】
【
図7】
図7は、タンパク質の循環置換を示す図式である。天然タンパク質の元のN末端およびC末端は、直接的にまたはリンカー配列により共に結合される。新規N末端およびC末端がタンパク質配列内の他の位置に導入され、配列/構造バリアントが産生される。
【0054】
【
図8】
図8は、t85024_N143Vの残基50~59の位置特異的スコアマトリックス(PSSM)(上部パネル)およびロゼッタエネルギー関数を使用するこれら潜在的変異の影響の評価(下部パネル)を示す略図である。下部パネルにおいて、変異残基をステイックとして示し、周囲の原子を線で示す。
【0055】
【
図9】
図9は、UGT U73C6(配列番号103)とUGT94-289-1(配列番号109)のアライメントの非限定的例を示す図式である。四角は、UGT94-289-1(配列番号109)における123位、143位および273位に対応するU73C6(配列番号103)における残基を強調する。
【0056】
【
図10】
図10は、循環置換により産生されたUGTによる、MIII、MIVおよびMVと比較したM、MIおよびMIIの相対的産生を示すグラフである。
【0057】
【
図11】
図11は、推定されるUGTによる、MIII、MIVおよびMVと比較したM、MIおよびMIIの相対的産生を示すグラフである。
【発明を実施するための形態】
【0058】
詳細な記載
モグロシドは、例えば、飲料において、天然甘味料として広く使用されている。しかしながら、デノボ合成および天然源からのモグロシド抽出にはしばしば高い製造費と低収量が伴う。本明細書は、モグロール(または11,24,25-トリヒドロキシククルビタジエノール)、モグロシドおよびその前駆体を効率的に産生するよう操作された宿主細胞を記載する。方法は、ククルビタジエノールシンターゼ(CDS)酵素、UDP-グリコシルトランスフェラーゼ(UGT)酵素、C11ヒドロキシラーゼ酵素、シトクロムP450レダクターゼ酵素、エポキシドヒドロラーゼ(EPH)酵素、スクアレンエポキシダーゼ(SQE)酵素またはこれらの組み合わせの異種発現を含む。本明細書は、モグロールおよびモグロシド産生のための改善されたUGTおよびCDS酵素の特徴を記載する。本明細書に記載の酵素および宿主細胞は、モグロール、モグロシドおよびその前駆体の製造に使用され得る。
【0059】
モグロールおよびモグロシドの合成
図1A~1Bは、推定されるモグロール合成経路を示す。経路における初期工程は、スクアレンから2,3-オキシドスクアレンへの変換を含む。
図1Aに示すとおり、2,3-オキシドスクアレンをまずククルビタジエノールに環化し、続いてエポキシ化して24,25-エポキシククルビタジエノールを形成できるかまたは2,3-オキシドスクアレンを2,3,22,23-ジオキシドスクアレンにエポキシ化し、次いで24,25-エポキシククルビタジエノールに環化し得る。次に、24,25-エポキシククルビタジエノールを、エポキシド加水分解、次いで酸化または酸化、次いでエポキシド加水分解の後にモグロール(モグロシドのアグリコン)に変換し得る。
図1Bに示すとおり、2,3-オキシドスクアレンをまずククルビタジエノールに環化し、次いでシトクロムP450 C11ヒドロキシラーゼにより11-ヒドロキシククルビタジエノールに変換し得る。次いで、シトクロムP450 C11ヒドロキシラーゼは、11-ヒドロキシククルビタジエノールを11-ヒドロキシ-24,25-エポキシククルビタジエノールに変換し得る。11-ヒドロキシ-24,25-エポキシククルビタジエノールは、エポキシドヒドロラーゼによりモグロールに変換され得る。C11ヒドロキシラーゼは、シトクロムP450レダクターゼと共に働く(
図1A~1Bに示していない)。
【0060】
モグロールは、C3、C11、C24およびC25での酸素化により、他のククルビタントリテルペノイド類と区別され得る。モグロールの、例えばC3および/またはC24のグリコシル化により、モグロシドが形成され得る。
【0061】
モグロール前駆体は、スクアレン、2-3-オキシドスクアレン、2,3,22,23-ジオキシドスクアレン、ククルビタジエノール、24,25-エポキシククルビタジエノール、11-ヒドロキシククルビタジエノール、11-ヒドロキシ-24,25-エポキシククルビタジエノール、11-ヒドロキシ-ククルビタジエノール、11-オキソ-ククルビタジエノールおよび24,25-ジヒドロキシククルビタジエノールを含むが、これらに限定されない。用語「ジオキシドスクアレン」を使用して、2,3,22,23-ジエポキシスクアレンまたは2,3,22,23-ジオキシドスクアレンを言い得る。用語「2,3-エポキシスクアレン」は、用語「2-3-オキシドスクアレン」と相互交換可能に使用され得る。本明細書で使用する、モグロシド前駆体はモグロール前駆体、モグロールおよびモグロシドを含む。
【0062】
モグロシドの例は、モグロシドI-A1(MIA1)、モグロシドIE(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIV、モグロシドIVa、イソモグロシドIV、モグロシドIII-E(MIIIE)、モグロシドVおよびモグロシドVIを含むが、これらに限定されない。ある実施態様において、産生されるモグロシドは、Siamと称され得るシアメノシドIである。ある実施態様において、産生されるモグロシドはMIIIEである。
【0063】
他の実施態様において、モグロシドは、式1
【化1】
の化合物である。
【0064】
ある実施態様において、本明細書に記載する方法は、US2019/0071705に開示の化合物1~20を含み、US2019/0071705に記載され、引用により本明細書に包含される化合物の何れかを産生するのに使用され得る。ある実施態様において、本明細書に記載する方法は、US2019/0071705に開示の化合物1~20のバリアントを含み、US2019/0071705に記載され、引用により本明細書に包含される化合物のバリアントの何れかを産生するのに使用され得る。例えば、US2019/0071705に記載の化合物のバリアントは、US2019/0071705に記載の化合物における1以上のアルファ-グリコシル結合の、1以上のベータ-グリコシル結合への置換を含み得る。ある実施態様において、US2019/0071705に記載の化合物のバリアントは、US2019/0071705に記載の化合物における1以上のベータ-グリコシル結合の、1以上のアルファ-グリコシル結合での置換を含む。ある実施態様において、US2019/0071705に記載の化合物のバリアントは、上記式1の化合物である。
【0065】
ククルビタジエノールシンターゼ(CDS)酵素
本発明の態様は、例えば、24-25エポキシ-ククルビタジエノールまたはククルビタジエノールなどのククルビタジエノール化合物の産生に有用であり得る、ククルビタジエノールシンターゼ(CDS)酵素を提供する。CDSは、オキシドスクアレン(例えば、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレン)から24-25エポキシ-ククルビタジエノールまたはククルビタジエノールなどのククルビタジエノール化合物の形成を触媒できる。
【0066】
ある実施態様において、CDS酵素は、配列番号74の123位に対応するロイシン残基を有し、これは、引用により全体として本明細書に包含させる、Takase et al. Org. Biomol. Chem., 2015,13, 7331-7336に記載のとおり、他のオキシドスクアレンシクラーゼと区別する。
【0067】
本発明のCDSは、表2における核酸またはアミノ酸配列または配列番号1~80から選択される配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%同一(各数値間の全数値を含む)である、配列を含み得る。
【0068】
ある実施態様において、CDS酵素は配列番号43、配列番号52または配列番号49に対応する。
【0069】
ある実施態様において、CDS酵素をコードするポリヌクレオチド配列は、出芽酵母を含む特定の宿主細胞における発現のために、再コード化され得る。ある実施態様において、再コード化されたCDS酵素をコードするポリヌクレオチド配列は、配列番号34に対応する。
【0070】
ある実施態様において、CDSをコードするポリヌクレオチド配列は、配列番号3、9または12と少なくとも90%同一である。ある実施態様において、CDSは、配列番号43、49または52と少なくとも90%同一である。
【0071】
ある実施態様において、本発明のCDSは、基質としてオキシドスクアレン(例えば、2,3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレン)を使用できる。ある実施態様において、本発明のCDSは、ククルビタジエノール化合物(例えば、24-25エポキシ-ククルビタジエノールまたはククルビタジエノール)を産生できる。ある実施態様において、本発明のCDSは、オキシドスクアレン(例えば、2-3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレン)からククルビタジエノール化合物(例えば、24-25エポキシ-ククルビタジエノールまたはククルビタジエノール)の形成を触媒する。
【0072】
CDSの活性は、当業者に知られるあらゆる手段により測定され得ることは認識される。ある実施態様において、CDSの活性は、産生されたククルビタジエノールの正規化ピーク面積として測定され得る。ある実施態様において、この活性は、任意単位で測定される。ある実施態様において、本発明のCDSの比活性などの活性は、対照CDSより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍または少なくとも100倍(各数値間の全数値を含む)大きい。
【0073】
当業者は、タンパク質に付随する構造的および/または機能的情報に基づき、CDS酵素としてタンパク質を特徴づけできることは認識される。例えば、ある実施態様において、タンパク質は、基質としてオキシドスクアレン(例えば、2,3-オキシドスクアレンまたは2,3;22,23-ジエポキシスクアレン)を使用して、ククルビタジエノール化合物(例えば、24-25エポキシ-ククルビタジエノールまたはククルビタジエノール)を産生する能力などの機能に基づき、CDS酵素として特徴づけされ得る。ある実施態様において、タンパク質は、少なくとも一部、配列番号73の123位に対応する位置のロイシン残基の存在に基づき、CDS酵素として特徴づけされ得る。
【0074】
ある実施態様において、CDSは、モチーフGX1WASDLGGP(配列番号331)(ここで、X1はNまたはHである)を含む。ある実施態様において、モチーフGX1WASDLGGP(配列番号331)は、CDSにおいて、配列番号73における117~126位に対応する残基の位置に存在する。
【0075】
ある実施態様において、CDSは、モチーフDX1GWL(配列番号332)(ここで、X1はHまたはQである)を含む。ある実施態様において、モチーフDX1GWL(配列番号332)は、CDSにおいて配列番号73における479~483位に対応する残基の位置に存在する。
【0076】
ある実施態様において、CDSは、モチーフCWGVCFTYAGW(配列番号333)を含む。ある実施態様において、モチーフCWGVCFTYAGW(配列番号333)は、CDSにおいて配列番号73における612~622位に対応する残基の位置に存在する。
【0077】
ある実施態様において、CDSは、モチーフGHWASDLGGP(配列番号334)を含む。ある実施態様において、モチーフGHWASDLGGP(配列番号334)は、CDSにおいて、配列番号73における117~126位に対応する残基の位置に存在する。ある実施態様において、CDSは、モチーフDQGWL(配列番号335)を含む。ある実施態様において、モチーフDQGWL(配列番号335)は、CDSにおいて、配列番号73における479~483位に対応する残基の位置に存在する。
【0078】
ある実施態様において、CDSは、モチーフGHWASDLGGP(配列番号334)、モチーフDQGWL(配列番号335)および/またはモチーフCWGVCFTYAGW(配列番号333)を含む。
【0079】
ある実施態様において、CDSは、配列番号73における123位に対応する残基の位置にロイシンを含む。ある実施態様において、CDSは、配列番号73における483位に対応する残基の位置にロイシンを含む。ある実施態様において、CDSは、配列番号73における612位に対応する残基の位置にシステイン、配列番号73における614位に対応する残基の位置にグリシン、配列番号73における620位に対応する残基の位置にアラニンおよび/または配列番号73における621位に対応する残基の位置にグリシンを含む。ある実施態様において、CDSは、配列番号73における123位に対応する残基の位置にロイシン、配列番号73における483位に対応する残基の位置にロイシン、配列番号73における612位に対応する残基の位置にシステイン、配列番号73における614位に対応する残基の位置にグリシン、配列番号73における620位に対応する残基の位置にアラニンおよび/または配列番号73における621位に対応する残基の位置にグリシンを含む。
【0080】
ある実施態様において、CDSは、モチーフGHWANDLGGP(配列番号336)を含む。ある実施態様において、モチーフGHWANDLGGP(配列番号336)は、CDSにおいて、配列番号73における117~126位に対応する残基の位置に存在する。
【0081】
ある実施態様において、CDSは、モチーフDX1GWL(配列番号332)を含む。ある実施態様において、モチーフDX1GWL(配列番号332)は、CDSにおいて、配列番号73における479~483位に対応する残基の位置に存在する。
【0082】
ある実施態様において、CDSは、モチーフCWGVCYTYAGW(配列番号337)を含む。ある実施態様において、モチーフCWGVCYTYAGW(配列番号337)は、CDSにおいて、配列番号73における612~622位に対応する残基の位置に存在する。
【0083】
ある実施態様において、CDSは、配列番号73における117~126位に対応する残基の位置に存在するモチーフGHWANDLGGP(配列番号336);配列番号73における479~483位に対応する残基の位置に存在するモチーフDQGWL(配列番号335);および/または配列番号73における612~622位に対応する残基の位置に存在するモチーフCWGVCYTYAGW(配列番号337)を含む。
【0084】
ある実施態様において、CDS酵素をコードする異種ポリヌクレオチドを含む宿主細胞は、異種遺伝子を発現しない同じ宿主細胞と比較して、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%以上のククルビタジエノール化合物を産生する。
【0085】
ある実施態様において、CDS酵素をコードする異種ポリヌクレオチドを含む宿主細胞は、対照宿主細胞に比して少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%以上のククルビタジエノール化合物を産生し、ここで、該対照宿主細胞は、配列番号33に対応するポリヌクレオチドによりコードされるラカンカCDSを発現する。
【0086】
本明細書をとおして、本明細書に記載する異種ポリヌクレオチドの何れかを発現する宿主細胞を、対照宿主細胞と比較し得る。対照宿主細胞は、特定の異種ポリヌクレオチド配列を発現する宿主細胞と、対照宿主細胞が同じ特定の異種ポリヌクレオチド配列を発現しない以外同じ遺伝的背景を有し得ることは認識される。
【0087】
他の実施態様において、タンパク質は、該タンパク質と既知CDS酵素のパーセント同一性に基づき、CDS酵素として特徴づけされ得る。例えば、タンパク質は、本明細書に記載のCDS配列の何れかまたは他のCDS酵素の何れかの配列と、少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%同一(各数値間の全数値を含む)であり得る。他の実施態様において、タンパク質は、該タンパク質における、CDS酵素と関連する1以上のドメインの存在に基づき、CDS酵素として特徴づけされ得る。例えば、ある実施態様において、タンパク質は、当分野で知られるCDS酵素の基質溝および/または活性部位腔特徴の存在に基づき、CDS酵素として特徴づけられる。ある実施態様において、活性部位腔は、この溝へのゲートとして作用し、該腔から水を排除することを助ける、残基を含む。ある実施態様において、活性部位は、基質のエポキシドを開環するプロトンドナーとして、そして環化過程を触媒する残基を含む。
【0088】
他の実施態様において、タンパク質は、既知CDS酵素の三次元構造に対応する、タンパク質の三次元構造の比較に基づき、CDS酵素として特徴づけされ得る。CDS酵素は合成タンパク質であり得ることが認識される。
【0089】
UDP-グリコシルトランスフェラーゼ(UGT)酵素
本発明の態様は、例えば、モグロシド(例えば、モグロシドI-A1(MIA1)、モグロシドI-E(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIII-E(MIIIE)、モグロシドIV、モグロシドIVa、イソモグロシドIV、モグロシドVまたはモグロシドVI)の産生に有用であり得る、UDP-グリコシルトランスフェラーゼ酵素(UGT)を提供する。
【0090】
本明細書で使用する、「UGT」は、UTP-糖からの化合物(例えば、モグロシドまたはモグロール)へのグリコシル基の付加を触媒できる、酵素をいう。UGTは、一次および/または二次UGTであり得る。「一次」UGTは、グリコシル基を含まない化合物上の位置へのグリコシル基の付加の触媒ができるUGTをいう。例えば、一次UGTは、イソプレノイド基質(例えば、モグロール)のC3および/またはC24位へのグリコシル基が可能であり得る。例えば、
図1C参照。「二次」UGTは、グリコシル基を既に含む化合物のある位置へのグリコシル基の付加を触媒できるUGTをいう。例えば、
図1D参照。非限定的例として、二次UGTは、モグロシドI-A1(MIA1)、モグロシドI-E(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIII-E(MIIIE)、モグロシドIV、モグロシドIVa、イソモグロシドIV、モグロシドVおよび/またはモグロシドVIにグリコシル基を付加し得る。
【0091】
構造的に、UGTはしばしばUDPGT(Prosite: PS00375)ドメインおよび触媒ダイアドを含む。非限定的例として、当業者は、UGT配列をUGT94-289-1(ラカンカであるシライチア・グロスベノリイからの野生型UGT配列)とアラインし、該UGTにおけるUGT94-289-1のヒスチジン21(H21)およびアスパラギン酸122(D122)に対応する2残基を同定することにより、該UGTにおける触媒ダイアド(catalytic dyad)を同定し得る。
【0092】
UGT94-289-1のアミノ酸配列は次のとおりである。
MDAQRGHTTTILMFPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSSSSDSIQLVELCLPSSPDQLPPHLHTTNALPPHLMPTLHQAFSMAAQHFAAILHTLAPHLLIYDSFQPWAPQLASSLNIPAINFNTTGASVLTRMLHATHYPSSKFPISEFVLHDYWKAMYSAAGGAVTKKDHKIGETLANCLHASCSVILINSFRELEEKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVHFIWVVRFPQGDNTSAIEDALPKGFLERVGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHLDQPFNAGLAEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKMDEMVAAISLFLKI(配列番号109)。
【0093】
UGT94-289-1をコードする核酸配列の非限定的例は次のとおりである。
atggacgcgcaacgcggacatacgactaccatcctgatgtttccgtggttggggtacggccaccttagtgcattcctcgaattagccaagagcttgtcgcgtaggaactttcatatttatttctgttccacatctgtcaatttagatgctataaaacccaaactaccatcatcttcaagttccgattctattcagcttgtagagttatgcttgccttcctcgccagaccaactacccccacacctgcatacaactaatgctctacctccacatctaatgcctaccctgcaccaggccttttcaatggcagctcaacattttgcagctatattacatactttagcaccgcacttgttaatctatgattcgttccagccttgggcgccacaattggccagctctcttaacattcctgctattaattttaataccacgggtgccagtgtgctaacaagaatgttacacgcgactcattacccatcttcaaagttcccaatctccgaatttgttttacatgattattggaaagcaatgtattcagcagctggtggtgctgttacaaaaaaggaccataaaataggagaaaccttggcaaactgtttacacgcttcttgctcggtaattctgatcaattcattcagagagttggaagaaaaatacatggattacttgtctgtcttactaaacaagaaagttgtgcccgtgggtccgcttgtttatgagccaaaccaagatggcgaagacgaaggttatagttcgataaagaattggctcgataaaaaggagccctcctcaactgtctttgtttccttcgggtccgaatattttccgtccaaagaagaaatggaagaaattgcccatggcttggaggctagcgaggtacactttatttgggtcgttagattcccacaaggagacaatacttctgcaattgaagatgcccttcctaagggttttcttgagcgagtgggcgaacgtggaatggtggttaagggttgggctcctcaggccaaaattttgaaacattggagcacaggcggtttcgtaagtcattgtggatggaatagtgttatggagagcatgatgtttggtgtacccataataggtgttccgatgcatttagatcaaccatttaatgcagggctcgcggaagaagcaggagtaggggtagaggctaaaagggaccctgatggtaagatacagagagatgaagtcgctaaactgatcaaagaagtggttgtcgaaaaaacgcgcgaagatgtcagaaagaaggctagggaaatgtctgaaattttacgttcgaaaggtgaggaaaagatggacgagatggttgcagccattagtctcttcttgaagatataa(配列番号93)。
【0094】
当業者は、あらゆるUGT酵素ついて、例えば、配列のアラインおよび/または二次または三次構造の比較により、どのアミノ酸残基がUGT94-289-1(配列番号109)における特定のアミノ酸残基に対応するかをどのようにして決定するかを容易に認識する。
【0095】
ある実施態様において、本発明のUGTは、野生型UGT94-289-1における構造モチーフに対応する(例えば、表5に示す構造モチーフに対応する)1以上の構造モチーフを含む。ある実施態様において、UGTは、表5における全構造モチーフに対応する構造モチーフを含む。ある実施態様において、UGTは、表5に示す全てではなく、一部の構造モチーフに対応する構造モチーフを含む。ある実施態様において、一部構造モチーフは、異なる長さまたは異なるらせん構造を有する点で、異なり得る。例えば、本発明のUGTは、UGT94-289-1におけるループ11、16、20またはこれらの組み合わせの拡張バージョンを含み得る。本発明のUGTは、UGT94-289-1における対応物(例えば、UGT94-289-1におけるループ11、16、20またはこれらの組み合わせ)より大きならせん構造を有するループを含み得る。
【0096】
ある実施態様において、UGTは、対照UGTの循環置換バージョンである。ある実施態様において、UGTは、対照UGTと異なる順番で表5からの少なくとも2つのモチーフを含む配列を含む。例えば、UGT94-289-1を対照UGTとして用い、第二モチーフのC末端に位置する第一モチーフを含むならば、循環置換UGTにおいて第一モチーフは第二モチーフのN末端に位置し得る。
【0097】
UGTは、表5におけるベータシート7、ループ16、アルファヘリックス9、ループ17、ベータシート8、ループ18、アルファヘリックス10、ループ19、ベータシート9、アルファヘリックス11、ループ20、アルファヘリックス12、ループ21、ベータシート10、ループ22、アルファヘリックス13、ループ23、ベータシート11、ループ24、アルファヘリックス14、ループ25、ベータシート12、ループ26、アルファヘリックス15、ループ27、ベータシート13、ループ28、アルファヘリックス16、ループ29、アルファヘリックス17、ループ30、アルファヘリックス18およびループ31から選択される1以上のモチーフに対応する1以上のモチーフに対してC末端に位置する、表5からのループ1、ベータシート1、ループ2、アルファヘリックス1、ループ3、ベータシート2、ループ4、アルファヘリックス2、ループ5、ベータシート3、ループ6、アルファヘリックス3、ループ7、ベータシート4、ループ8、アルファヘリックス4、ループ9、ベータシート5、ループ10、アルファヘリックス5、ループ11、アルファヘリックス6、ループ12、アルファヘリックス7、ループ13、ベータシート6、ループ14、アルファヘリックス8およびループ15から選択される1以上のモチーフに対応する1以上のモチーフを含み得る。
【0098】
ある実施態様において、UGTのN末端部分は、触媒ダイアドおよび/または基質結合部位を含む触媒部位を含む。ある実施態様において、UGTのC末端部分は、補因子結合部位を含む。例えば、UGT94-289-1のN末端部分は、野生型UGT94-289-1の残基21および122(例えば、ヒスチジン21およびアスパラギン酸122)に対応する触媒ダイアドを含む。UGT94-289-1のC末端部分は、補因子結合部位を含む。
【0099】
本発明のある態様は、循環置換されているUGTを含む。ある実施態様において、UGTの循環置換バージョンにおいて、N末端部分およびC末端部分は、全体的にまたは一部逆転し得る。例えば、循環置換UGTのC末端部分は触媒ダイアドおよび/または基質結合部位を含む触媒部位を含み得て、一方N末端部分は補因子結合部位を含み得る。
【0100】
ある実施態様において、UGTの循環置換バージョンはUGTをコードする異種ポリヌクレオチドを含み、ここで、該UGTは触媒ダイアドおよび補因子結合部位を含み、ここで、触媒ダイアドは補因子結合部位に対してC末端に位置する。
【0101】
本発明に包含される循環置換UGTは、循環置換に付されていない同じUGTと異なる性質を示し得る。ある実施態様において、このようなUGTの循環置換バージョンを発現する宿主細胞は、野生型UGT94-289-1(配列番号109)などの循環置換されていない対照UGTをコードする異種ポリヌクレオチドを含む宿主細胞に比して、少なくとも1つのモグロシド前駆体の存在下、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%多い1以上のモグロシドを産生する。ある実施態様において、このようなUGTの循環置換バージョンを発現する宿主細胞は、野生型UGT94-289-1(配列番号109)などの循環置換されていない参照UGTをコードする異種ポリヌクレオチドを含む宿主細胞に比して、少なくとも1つのモグロシド前駆体の存在下、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%少ない1以上のモグロシドを産生する。
【0102】
ある実施態様において、UGTの循環置換バージョンにおいて、UGTのN末端部分は、UGT94-289-1などのUGTのC末端部分に通常存在する残基を含む。ある実施態様において、UGTの循環置換バージョンにおいて、UGTのC末端部分は、UGT94-289-1などのUGTのN末端部分に通常存在する残基を含む。
【0103】
ある実施態様において、UGT94-289-1などのUGTのN末端部分は、UGT94-289-1(配列番号109)などのUGTのおおよその残基2~122、残基2~123、残基2~124、残基2~125、残基2~126、残基2~127、残基2~128、残基2~129、残基2~130、残基2~131、残基2~132、残基2~133、残基2~134、残基2~135、残基2~136、残基2~137、残基2~138、残基2~139、残基2~140、残基2~141、残基2~142、残基2~143、残基2~144、残基2~145、残基2~146、残基2~147、残基2~148、残基2~149、残基2~150、残基2~151、残基2~152、残基2~153、残基2~154、残基2~155、残基2~156、残基2~157、残基2~158、残基2~159、残基2~160、残基2~161、残基2~162、残基2~163、残基2~164、残基2~165、残基2~166、残基2~167、残基2~168、残基2~169、残基2~170、残基2~171、残基2~172、残基2~173、残基2~174、残基2~175、残基2~176、残基2~177、残基2~178、残基2~179、残基2~180、残基2~181、残基2~182、残基2~183、残基2~184、残基2~185、残基2~186、残基2~187、残基2~188、残基2~189、残基2~190、残基2~191、残基2~192、残基2~193、残基2~194、残基2~195、残基2~196、残基2~197、残基2~198、残基2~199、残基2~200、残基2~201、残基2~202、残基2~203、残基2~204、残基2~205、残基2~206、残基2~207、残基2~208、残基2~209、残基2~210、残基2~211、残基2~212、残基2~213、残基2~214、残基2~215、残基2~216、残基2~217、残基2~218、残基2~219、残基2~220、残基2~221、残基2~222、残基2~223、残基2~224、残基2~225、残基2~226、残基2~227、残基2~228、残基2~229、残基2~230、残基2~231、残基2~232、残基2~233、残基2~234、残基2~235、残基2~236、残基2~237、残基2~238、残基2~239、残基2~240、残基2~241、残基2~242、残基2~243、残基2~244、残基2~245、残基2~246、残基2~247、残基2~248、残基2~249、残基2~250、残基2~251または残基2~252または他のUGTにおける対応する残基に対応する。
【0104】
ある実施態様において、UGT94-289-1などのUGTのC末端ドメインは、UGT94-289-1(配列番号109)などのUGTのおおよそ残基123~456、残基124~456、残基125~456、残基126~456、残基127~456、残基128~456、残基129~456、残基130~456、残基131~456、残基132~456、残基133~456、残基134~456、残基135~456、残基136~456、残基137~456、残基138~456、残基139~456、残基140~456、残基141~456、残基142~456、残基143~456、残基144~456、残基145~456、残基146~456、残基147~456、残基148~456、残基149~456、残基150~456、残基151~456、残基152~456、残基153~456、残基154~456、残基155~456、残基156~456、残基157~456、残基158~456、残基159~456、残基160~456、残基161~456、残基162~456、残基163~456、残基164~456、残基165~456、残基166~456、残基167~456、残基168~456、残基169~456、残基170~456、残基171~456、残基172~456、残基173~456、残基174~456、残基175~456、残基176~456、残基177~456、残基178~456、残基179~456、残基180~456、残基181~456、残基182~456、残基183~456、残基184~456、残基185~456、残基186~456、残基187~456、残基188~456、残基189~456、残基190~456、残基191~456、残基192~456、残基193~456、残基194~456、残基195~456、残基196~456、残基197~456、残基198~456、残基199~456、残基200~456、残基201~456、残基202~456、残基203~456、残基204~456、残基205~456、残基206~456、残基207~456、残基208~456、残基209~456、残基210~456、残基211~456、残基212~456、残基213~456、残基214~456、残基215~456、残基216~456、残基217~456、残基218~456、残基219~456、残基220~456、残基221~456、残基222~456、残基223~456、残基224~456、残基225~456、残基226~456、残基227~456、残基228~456、残基229~456、残基230~456、残基231~456、残基232~456、残基233~456、残基234~456、残基235~456、残基236~456、残基237~456、残基238~456、残基239~456、残基240~456、残基241~456、残基242~456、残基243~456、残基244~456、残基245~456、残基246~456、残基247~456、残基248~456、残基249~456、残基250~456または残基251~456または他のUGTにおける対応する残基に対応する。
【0105】
ある実施態様において、本発明のUGTは、表3、6または7における配列、配列番号207~242、配列番号243~316、配列番号225~242、配列番号280~316、配列番号317~322、配列番号323~328または配列番号330から選択される配列または本明細書に開示するUGTの何れかと少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%同一(各数値間の全数値を含む)である、配列(例えば、核酸またはアミノ酸配列)を含む。
【0106】
ある実施態様において、本発明のUGTは、野生型UGT94-289-1(配列番号109)のアミノ酸残基に対応するアミノ酸残基でアミノ酸置換を含み得る。例えば、置換を含むアミノ酸残基は、例えば、S123;F124;N143;T144;T145;V149;Y179;G18;S180;A181;G184;A185;V186;T187;K189;Y19;H191;K192;G194;E195;A198;F276;N355;H373;L374;N47;H83;T84;T85;N86;P89;および/またはL92から選択される、野生型UGT94-289-1(配列番号109)のアミノ酸残基に対応するアミノ酸であり得る。このようなアミノ酸置換の非限定的例は次のものを含む。S123はアラニン、システイン、グリシンまたはバリンにまたはアラニン、システイン、グリシンまたはバリンの保存的置換に変異され得る;F124はチロシンにまたはチロシンの保存的置換に変異され得る;N143はアラニン、システイン、グルタミン酸、イソロイシン、ロイシン、メチオニン、グルタミン、セリン、スレオニンまたはバリンにまたはアラニン、システイン、グルタミン酸、イソロイシン、ロイシン、メチオニン、グルタミン、セリン、スレオニンまたはバリンの保存的置換に変異され得る;T144はアラニン、システイン、アスパラギンまたはプロリンにまたはアラニン、システイン、アスパラギンまたはプロリンの保存的置換に変異され得る;T145はアラニン、システイン、グリシン、メチオニン、アスパラギン、グルタミンまたはセリンにまたはアラニン、システイン、グリシン、メチオニン、アスパラギン、グルタミンまたはセリンの保存的置換に変異され得る;V149はシステイン、ロイシンまたはメチオニンにまたはシステイン、ロイシンまたはメチオニンの保存的置換に変異され得る;Y179はグルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、バリンまたはトリプトファンにまたはグルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、バリンまたはトリプトファンの保存的置換に変異され得る;G18はセリンにまたはセリンの保存的置換に変異され得る;S180はアラニンまたはバリンにまたはアラニンまたはバリンの保存的置換に変異され得る;A181はリシンまたはスレオニンにまたはリシンまたはスレオニンの保存的置換に変異され得る;G184はアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニンまたはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニンまたはチロシンの保存的置換に変異され得る;A185はシステイン、アスパラギン酸、グルタミン酸、グリシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、スレオニン、トリプトファンまたはチロシンにまたはシステイン、アスパラギン酸、グルタミン酸、グリシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、スレオニン、トリプトファンまたはチロシンの保存的置換に変異され得る;V186はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、スレオニン、トリプトファンまたはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、スレオニン、トリプトファンまたはチロシンの保存的置換に変異され得る;T187はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、ヒスチジン、イソロイシン、リシン、ロイシン、アスパラギン、プロリン、アルギニン、セリン、バリン、トリプトファンまたはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、ヒスチジン、イソロイシン、リシン、ロイシン、アスパラギン、プロリン、アルギニン、セリン、バリン、トリプトファンまたはチロシンの保存的置換に変異され得る;K189はアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、グリシン、ヒスチジン、イソロイシン、ロイシン、メチオニン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリン、トリプトファンまたはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、フェニルアラニン、グリシン、ヒスチジン、イソロイシン、ロイシン、メチオニン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリン、トリプトファンまたはチロシンのその保存的置換に変異され得る;Y19はフェニルアラニン、ヒスチジン、ロイシンまたはバリンにまたはフェニルアラニン、ヒスチジン、ロイシンまたはバリンの保存的置換に変異され得る;H191はアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、リシン、メチオニン、プロリン、グルタミン、セリン、スレオニン、バリン、トリプトファンまたはチロシンにまたはアラニン、システイン、アスパラギン酸、グルタミン酸、グリシン、リシン、メチオニン、プロリン、グルタミン、セリン、スレオニン、バリン、トリプトファンまたはチロシンへの変異の保存的置換に変異され得る;K192はシステインまたはフェニルアラニンにまたはシステインまたはフェニルアラニンの保存的置換に変異され得る;G194はアスパラギン酸、ロイシン、メチオニン、アスパラギン、プロリン、セリンまたはトリプトファンにまたはアスパラギン酸、ロイシン、メチオニン、アスパラギン、プロリン、セリンまたはトリプトファンの保存的置換に変異され得る;E195はアラニン、イソロイシン、リシン、ロイシン、アスパラギン、グルタミン、セリン、スレオニンまたはチロシンにまたはアラニン、イソロイシン、リシン、ロイシン、アスパラギン、グルタミン、セリン、スレオニンまたはチロシンの保存的置換に変異され得る;A198はシステイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリンまたはチロシンにまたはシステイン、アスパラギン酸、グルタミン酸、フェニルアラニン、ヒスチジン、イソロイシン、リシン、ロイシン、メチオニン、アスパラギン、プロリン、グルタミン、アルギニン、セリン、スレオニン、バリンまたはチロシンの保存的置換に変異され得る;F276はシステインまたはグルタミンにまたはシステインまたはグルタミンの保存的置換に変異され得る;N355はグルタミンまたはセリンまたはその何らかの保存的置換に変異され得る;H373はリシン、ロイシン、メチオニン、アルギニン、バリンまたはチロシンにまたはリシン、ロイシン、メチオニン、アルギニン、バリンまたはチロシンの保存的置換に変異され得る;L374はアラニン、システイン、フェニルアラニン、ヒスチジン、メチオニン、アスパラギン、グルタミン、セリン、スレオニン、バリン、トリプトファンまたはチロシンにまたはアラニン、システイン、フェニルアラニン、ヒスチジン、メチオニン、アスパラギン、グルタミン、セリン、スレオニン、バリン、トリプトファンまたはチロシンの保存的置換に変異され得る;N47はグリシンにまたはグリシンの保存的置換に変異され得る;H83はグルタミンまたはトリプトファンにまたはグルタミンまたはトリプトファンの保存的置換に変異され得る;T84はチロシンにまたはチロシンの保存的置換に変異され得る;T85はグリシン、リシン、プロリン、セリンまたはチロシンにまたはグリシン、リシン、プロリン、セリンまたはチロシンの保存的置換に変異され得る;N86はアラニン、システイン、グルタミン酸、イソロイシン、リシン、ロイシン、セリン、トリプトファンまたはチロシンにまたはアラニン、システイン、グルタミン酸、イソロイシン、リシン、ロイシン、セリン、トリプトファンまたはチロシンの保存的置換に変異され得る;P89はメチオニンまたはセリンにまたはメチオニンまたはセリンの保存的置換に変異され得る;および/またはL92はヒスチジンまたはリシンにまたはヒスチジンまたはリシンの保存的置換に変異され得る;。
【0107】
当業者は、あらゆるUGT酵素ついて、例えば、配列のアラインおよび/または二次構造の比較により、どのアミノ酸残基がUGT94-289-1(配列番号109)における特定のアミノ酸残基に対応するかを決定する方法を容易に認識する。非限定的例として、UGT94-289-1(配列番号109)とU73C6(配列番号103)の配列アライメント(例えば、Clustal Omegaを使用して実施、例えば、Larkin et al., Bioinformatics. 2007 Nov 1;23(21):2947-8)が
図9に提供される。例えば、
図9において、UGT94-289-1(配列番号109)の123位に対応するU73C6(配列番号103)における残基はメチオニン(M)である。他の非限定的例として、UGT94-289-1(配列番号109)における143位に対応するU73C6(配列番号103)の残基はヒスチジン(H)である(
図9)。他の非限定的例として、UGT94-289-1(配列番号109)における273位に対応するU73C6(配列番号103)における残基は、フェニルアラニン(F)である(
図9)。
【0108】
ある実施態様において、UGTは、表4に示すUGT94-289-1におけるアミノ酸置換に対応するアミノ酸置換を含む。
【0109】
本発明のUGTは、保存的アミノ酸置換および/または非保存的アミノ酸置換を含み得る。ある実施態様において、本発明のUGTは、1、2、3、4、5、6、7、8、9、10または10を超える保存的アミノ酸置換を含む。ある実施態様において、本発明のUGTは、1、2、3、4、5、6、7、8、9、10または10を超える非保存的アミノ酸置換を含む。ある実施態様において、保存的または非保存的アミノ酸置換は、UGTタンパク質の保存された領域に位置しない。ある実施態様において、保存的または非保存的アミノ酸置換は、野生型UGT94-289-1の残基83~92;残基179~198;残基N143;残基L374;残基H21;または残基D122に対応する領域に位置しない。当業者は、保存的および/または非保存的置換を含むUGTを試験して、該保存的および/または非保存的置換がUGTの活性または機能に影響するか否かを決定することが容易に可能である。
【0110】
ある実施態様において、UGT酵素は、触媒ダイアドの10オングストローム、9オングストローム8オングストローム、7オングストローム、6オングストローム、5オングストローム、4オングストローム、3オングストローム、2オングストローム以内または1オングストローム以内(各数値間の全数値を含む)に位置するアミノ酸置換を含む。触媒ダイアドは野生型UGT94-289-1の残基21および122(例えば、ヒスチジン21およびアスパラギン酸122)に対応し得る。当業者は、あらゆるUGT酵素ついて、例えば、UGT94-289-1(配列番号109)との配列のアラインおよび/または二次構造の比較により、触媒ダイアドの対応位置を決定する方法を容易に認識することは認められる。
【0111】
ある実施態様において、UGT酵素は、UGTの1以上の構造モチーフに位置するアミノ酸残基でアミノ酸置換を含む。UGT94-289-1(配列番号109)におけるUGTの二次構造の非限定的例は、ベータシート4とアルファヘリックス5の間のループ;ベータシート5;ベータシート5とアルファヘリックス6の間のループ;アルファヘリックス6;アルファヘリックス6と7の間のループ;ベータシート1とアルファヘリックス1の間のループ;アルファヘリックス7;アルファヘリックス7と8の間のループ;アルファヘリックス1;アルファヘリックス8;ベータシート8とアルファヘリックス13の間のループ;アルファヘリックス17;ベータシート12とアルファヘリックス18の間のループ;アルファヘリックス2;ベータシート3とアルファヘリックス3の間のループ;アルファヘリックス3;およびアルファヘリックス3と4の間のループ;ループ8;ベータシート5;ループ10;アルファヘリックス5;ループ11;ループ2;アルファヘリックス6;ループ12;アルファヘリックス1;アルファヘリックス7;ループ18;アルファヘリックス14;ループ26;アルファヘリックス2;ループ6;およびアルファヘリックス3を含む。
【0112】
ある実施態様において:ループ8に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるS123またはF124に対応する残基である;ベータシート5に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるN143に対応する残基である;ループ10に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるT144またはT145に対応する残基である;アルファヘリックス5に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるV149に対応する残基である;ループ11に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるY179に対応する残基である;ループ2に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるG18に対応する残基である;アルファヘリックス6に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるS180またはA181に対応する残基である;ループ12に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるG184、A185、V186、T187またはK189に対応する残基である;アルファヘリックス1に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるY19に対応する残基である;アルファヘリックス7に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるH191、K192、G194、E195またはA198に対応する残基である;ループ18に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるF276に対応する残基である;アルファヘリックス14に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるN355に対応する残基である;ループ26に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるH373またはL374に対応する残基である;アルファヘリックス2に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるN47に対応する残基である;ループ6に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるH83、T84、T85またはN86に対応する残基である;および/またはアルファヘリックス3に位置するアミノ酸残基は、UGT94-289-1(配列番号109)におけるP89またはL92に対応する残基である。
【0113】
ある実施態様において、UGTは、UGT94-289-1(配列番号109)の残基83~92、179~189、1~82、93~142、144~178、199~373または375~453に対応する領域にアミノ酸置換(例えば、少なくとも1、2、3、4、5、6、7または8置換)を含む。ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるN143およびL374から選択されるアミノ酸残基に対応するアミノ酸残基にアミノ酸置換を含む。ある実施態様において、N143に対応する残基は、負電荷R基、極性非電荷R基または非極性脂肪族R基に変異される。ある実施態様において、L374に対応する残基は、非極性脂肪族R基、正電荷R基、極性非電荷R基または非極性芳香族R基に変異される。ある実施態様において、UGTは、UGT94-289-1の残基83~92と少なくとも90%同一またはUGT94-289-1の残基179~198と少なくとも95%同一である領域を含む。UGTは、UGT94-289-1の残基83~92と少なくとも70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または少なくとも99%同一または100%同一である領域を含み得る。UGTは、UGT94-289-1(配列番号109)の残基179~198と少なくとも70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または少なくとも99%同一または100%同一である領域を含み得る。
【0114】
ある実施態様において、宿主細胞はUGTをコードする異種ポリヌクレオチドを含み、ここで、該UGTは、野生型UGT94-289-1(配列番号109)の残基83~92に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基83~92に比してアミノ酸置換を含む領域;および/または野生型UGT94-289-1(配列番号109)の残基179~198に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基179~198に比してアミノ酸置換を含む領域を含む。用語「アミノ酸置換」は1アミノ酸置換に限定されず、1を超えるアミノ酸置換を含む実施態様も含むことは認識される。ある実施態様において、宿主細胞はUGTをコードする異種ポリヌクレオチドを含み、ここで、該UGTは、野生型UGT94-289-1(配列番号109)の残基83~92に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基83~92に比して、1を超えないアミノ酸置換を含む領域;および/または野生型UGT94-289-1(配列番号109)の残基179~198に対応する領域であって、野生型UGT94-289-1(配列番号109)の残基179~198に比して、1を超えないアミノ酸置換を含む領域を含む。
【0115】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)における、H83、T84、T85、N86、P89、L92、Y179、S180、A181、G184、A185、V186、T187、K189、H191、K192、G194、E195またはA198から選択されるアミノ酸残基に対応するアミノ酸残基にアミノ酸置換を含む。
【0116】
ある実施態様において、H83に対応する残基は、極性非電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;T84に対応する残基は、非極性芳香族R基を含むアミノ酸に変異されている;T85に対応する残基は、非極性脂肪族R基、正電荷R基、極性非電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;N86に対応する残基は、非極性脂肪族R基、極性非電荷R基、負電荷R基、正電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;P89に対応する残基は、非極性脂肪族R基または極性非電荷R基を含むアミノ酸に変異されている;L92に対応する残基は、正電荷R基を含むアミノ酸に変異されている;Y179は、負電荷R基、非極性芳香族R基、正電荷R基または非極性脂肪族R基を含むアミノ酸に変異されている;S180に対応する残基は、非極性脂肪族R基を含むアミノ酸に変異されている;A181に対応する残基は、正電荷R基または極性非電荷R基を含むアミノ酸に変異されている;G184に対応する残基は、非極性脂肪族R基、極性非電荷R基、負電荷R基、非極性芳香族R基または正電荷R基を含むアミノ酸に変異されている;A185に対応する残基は、極性非電荷R基、負電荷R基、非極性脂肪族R基、正電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;V186に対応する残基は、非極性脂肪族R基、極性非電荷R基、負電荷R基、正電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;T187に対応する残基は、非極性脂肪族R基、極性非電荷R基、負電荷R基、正電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;K189に対応する残基は、非極性脂肪族R基、極性非電荷R基、負電荷R基、非極性芳香族R基または正電荷R基を含むアミノ酸に変異されている;H191に対応する残基は、非極性脂肪族R基、極性非電荷R基、負電荷R基、正電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;K192に対応する残基は、極性非電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;G194は、負電荷R基、非極性脂肪族R基、極性非電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;E195に対応する残基は、非極性脂肪族R基、正電荷R基、極性非電荷R基または非極性芳香族R基を含むアミノ酸に変異されている;および/またはA198に対応する残基は、極性非電荷R基、負電荷R基、非極性芳香族R基、正電荷R基または非極性脂肪族R基を含むアミノ酸に変異されている。
【0117】
ある実施態様において、UGTは、野生型UGT94-289-1(配列番号109)におけるN143およびL374から選択されるアミノ酸残基に対応するアミノ酸残基に、アミノ酸置換を含む。ある実施態様において、N143に対応する残基は、負電荷R基、極性非電荷R基または非極性脂肪族R基に変異される。ある実施態様において、L374に対応する残基は、非極性脂肪族R基、正電荷R基、極性非電荷R基または非極性芳香族R基に変異される。
【0118】
本発明のUGTは、酸素化部位の何れか(例えば、C3、C11、C24およびC25)でモグロールまたはモグロシドのグリコシル化が可能であり得る。ある実施態様において、UGTは、分岐グリコシル化(例えば、モグロシドのC3またはC24での分岐グリコシル化)が可能である。
【0119】
本発明のUGTのための適当な基質の非限定的例は、モグロールおよびモグロシド(例えば、モグロシドIA1(MIA1)、モグロシドIE(MIE)、モグロシドII-A1(MIIA1)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)またはモグロシドIII-E(MIIIE)、シアメノシドI)を含む。
【0120】
ある実施態様において、本発明のUGTは、モグロシドIA1(MIA1)、モグロシドIE(MIE)、モグロシドII-A1(MIIA1)、モグロシドII-A2(MIIA2)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIII-E(MIIIE)、モグロシドIV、モグロシドIVa、イソモグロシドIVおよび/またはモグロシドVを産生できる。
【0121】
ある実施態様において、UGTは、モグロールからMIA1;モグロールからMIE1;MIA1からMIIA1;MIE1からMIIE;MIIA1からMIIIA1;MIA1からMIIE;MIIA1からMIII;MIIIA1からシアメノシドI;MIIEからMIII;MIIIからシアメノシドI;MIIEからMIIE;および/またはMIIIEからシアメノシドIの変換の触媒ができる。
【0122】
UGTの比活性などの活性は、当業者に知られるあらゆる手段により測定され得ることは認識される。ある実施態様において、UGT(例えば、バリアントUGT)の比活性などの活性は、単位時間あたりの単位酵素あたりに産生されるグリコシル化モグロシドの量の測定により決定され得る。例えば、比活性などの活性は、1時間あたり酵素1グラムあたりに産生されるグリコシル化モグロシド標的のmmolで測定され得る。活性(例えば、比活性)を測定する方法の非限定的例は、下記実施例に提供される。ある実施態様において、本発明のUGT(例えば、バリアントUGT)は、1時間あたり酵素1グラムあたりに産生されるグリコシル化モグロシド標的が少なくとも0.1mmol(例えば、少なくとも1mmol、少なくとも1.5mmol、少なくとも2mmol、少なくとも2.5mmol、少なくとも3、少なくとも3.5mmol、少なくとも4mmol、少なくとも4.5mmol、少なくとも5mmol、少なくとも10mmol(各数値間の全数値を含む))である比活性などの活性を有し得る。
【0123】
ある実施態様において、本発明のUGTの比活性などの活性は、対照UGTより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍または少なくとも100倍(各数値間の全数値を含む))大きい。ある実施態様において、対照UGTはUGT94-289-1(配列番号109)である。ある実施態様において、アミノ酸置換を有するUGTに関して、対照UGTは、アミノ酸置換がない以外同じUGTである。
【0124】
当業者は、タンパク質に付随する構造的および/または機能的情報に基づき、タンパク質をUGT酵素として特徴づけされ得ることは認識される。例えば、タンパク質は、モグロールなどのモグロシド前駆体存在下、1以上のモグロシドを産生する能力などの、機能に基づき、UGT酵素として特徴づけされ得る。
【0125】
他の実施態様において、タンパク質は、該タンパク質と既知UGT酵素間のパーセント同一性に基づき、UGT酵素として特徴づけされ得る。例えば、タンパク質は、本明細書に記載するUGT配列の何れかまたは他のUGT酵素の何れかの配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%同一(各数値間の全数値を含む)であり得る。他の実施態様において、タンパク質は、該タンパク質における、UGT酵素と関連する1以上のドメインの存在に基づき、UGT酵素として特徴づけされ得る。例えば、ある実施態様において、タンパク質は、当分野で知られるUGT酵素の特徴である糖結合ドメインおよび/または触媒ドメインの存在に基づき、UGT酵素として特徴づけされ得る。ある実施態様において、触媒ドメインは、グリコシル化される基質に結合する。
【0126】
他の実施態様において、タンパク質は、既知UGT酵素の三次元構造造と比較する、タンパク質の三次元構造の比較に基づき、UGT酵素として特徴づけされ得る。例えば、タンパク質は、アルファヘリックスドメイン、ベータシートドメインなどの数または位置に基づき、UGTとして特徴づけされる。UGT酵素は合成タンパク質であり得ることは認識される。
【0127】
ある実施態様において、UGTは、配列番号109の配列を含まない。ある実施態様において、UGTは、配列番号109に95%未満、94%未満、93%未満、92%未満、91%未満、90%未満、89%未満、88%未満、87%未満、86%未満、85%未満、84%未満、83%未満、82%未満、81%未満、80%未満、79%未満、78%未満、77%未満、76%未満、75%未満、74%未満、73%未満、72%未満、71%未満または70%未満の同一性を含む。
【0128】
C11ヒドロキシラーゼ酵素
本発明の態様は、例えば、モグロールの産生に有用であり得る、C11ヒドロキシラーゼ酵素を提供する。
【0129】
本発明のC11ヒドロキシラーゼは、表8におけるC11ヒドロキシラーゼ配列(例えば、核酸またはアミノ酸配列)、配列番号113、114、129または130に示す配列または本明細書に開示するもしくは当分野で知られるあらゆるC11ヒドロキシラーゼ配列と、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(各数値間の全数値を含む)である配列を含み得る。
【0130】
ある実施態様において、本発明のC11ヒドロキシラーゼは、モグロール前駆体(例えば、ククルビタジエノール、11-ヒドロキシククルビタジエノール、24,25-ジヒドロキシ-ククルビタジエノールおよび/または24,25-エポキシ-ククルビタジエノール)を酸化できる。ある実施態様において、本発明のC11ヒドロキシラーゼは、モグロールの形成を触媒する。
【0131】
C11ヒドロキシラーゼの比活性などの活性は、当業者に知られるあらゆる手段により決定され得ることは認識される。ある実施態様において、C11ヒドロキシラーゼの活性(例えば、比活性)は、単位時間あたり酵素単位あたり産生されるモグロール前駆体または産生されるモグロールの濃度として測定され得る。ある実施態様において、本発明のC11ヒドロキシラーゼは、少なくとも0.0001~0.001μmol/分/mg、少なくとも0.001~0.01μmol/分/mg、少なくとも0.01~0.1μmol/分/mgまたは少なくとも0.1~1μmol/分/mg(各数値間の全数値を含む)の活性(例えば、比活性)を有する。
【0132】
ある実施態様において、C11ヒドロキシラーゼの比活性などの活性は、対照C11ヒドロキシラーゼより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも100倍、少なくとも1000倍または少なくとも10000倍(各数値間の全数値を含む))大きい。
【0133】
シトクロムP450レダクターゼ酵素
本発明の態様は、例えば、モグロールの産生に有用であり得る、シトクロムP450レダクターゼ酵素を提供する。シトクロムP450レダクターゼは、NADPH:フェリヘモタンパク質オキシドレダクターゼ、NADPH:ヘムタンパク質オキシドレダクターゼ、NADPH:P450オキシドレダクターゼ、P450レダクターゼ、POR、CPRおよびCYPORとも称される。これらのレダクターゼは、NADPHからC11ヒドロキシラーゼへの電子移動を触媒することにより、C11ヒドロキシラーゼ活性を助長できる。
【0134】
本発明のシトクロムP450レダクターゼは、表8におけるシトクロムP450レダクターゼ配列(例えば、核酸またはアミノ酸配列)、配列番号115、116、131または132に示す配列または本明細書に開示するもしくは当分野で知られるあらゆるシトクロムp450レダクターゼと、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(各数値間の全数値を含む)である配列を含み得る。
【0135】
ある実施態様において、本発明のシトクロムP450レダクターゼは、モグロール前駆体(例えば、ククルビタジエノール、11-ヒドロキシククルビタジエノール、24,25-ジヒドロキシ-ククルビタジエノールおよび/または24,25-エポキシ-ククルビタジエノール)の酸化を促進できる。ある実施態様において、本発明のP450レダクターゼは、モグロール前駆体またはモグロールの形成を触媒する。
【0136】
シトクロムP450レダクターゼの活性(例えば、比活性)は、当業者に知られるあらゆる手段により測定され得ることは認識される。ある実施態様において、組み換えシトクロムP450レダクターゼの活性(例えば、比活性)は、C11ヒドロキシラーゼ存在下、単位時間あたり酵素単位あたり産生されるモグロール前駆体または産生されるモグロールの濃度として測定され得る。ある実施態様において、本発明のシトクロムP450レダクターゼは、少なくとも0.0001~0.001μmol/分/mg、少なくとも0.001~0.01μmol/分/mg、少なくとも0.01~0.1μmol/分/mgまたは少なくとも0.1~1μmol/分/mg(各数値間の全数値を含む)の活性(例えば、比活性)を有する。
【0137】
ある実施態様において、シトクロムP450レダクターゼの活性(例えば、比活性)は、対照シトクロムP450レダクターゼより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも100倍、少なくとも1000倍または少なくとも10000倍(各数値間の全数値を含む)大きい。
【0138】
エポキシドヒドロラーゼ酵素(EPH)
本発明の態様は、例えば、24-25エポキシ-ククルビタジエノールから24-25ジヒドロキシ-ククルビタジエノールへの変換または11-ヒドロキシ-24,25-エポキシククルビタジエノールからモグロールへの変換に有用であり得る、エポキシドヒドロラーゼ酵素(EPH)を提供する。EPHは、エポキシドを2個のヒドロキシルに変換できる。
【0139】
本発明のEPHは、表8におけるEPH配列(例えば、核酸またはアミノ酸配列)、配列番号117~125または133~141に示す配列または本明細書に開示するもしくは当分野で知られるあらゆるEPH配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(各数値間の全数値を含む)である配列を含み得る。
【0140】
ある実施態様において、組み換え本発明のEPHは、ククルビタジエノール化合物におけるエポキシドの加水分解(例えば、24-25エポキシ-ククルビタジエノールにおけるエポキシドの加水分解)を促進できる。ある実施態様において、本発明のEPHは、モグロール前駆体(例えば、24-25ジヒドロキシ-ククルビタジエノール)の形成を触媒する。
【0141】
EPHの活性(例えば、比活性)は、当業者に知られるあらゆる手段により測定され得ることは認識される。ある実施態様において、EPHの活性(例えば、比活性)は、産生されるモグロール前駆体(例えば、24-25ジヒドロキシ-ククルビタジエノール)またはモグロールの濃度として測定され得る。ある実施態様において、組み換え本発明のEPHは、少なくとも1~100μg/L、少なくとも100~1000μg/L、少なくとも1~100mg/L、少なくとも100~1000mg/L、少なくとも1~10g/Lまたは少なくとも10~100g/L(各数値間の全数値を含む)の産生を可能とする。
【0142】
ある実施態様において、EPHの活性(例えば、比活性)は、対照EPHより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍または少なくとも100倍(各数値間の全数値を含む))大きい。
【0143】
スクアレンエポキシダーゼ酵素(SQE)
本発明の態様は、スクアレン(例えば、スクアレンまたは2-3-オキシドスクアレン)を酸化して、スクアレンエポキシド(例えば、2-3-オキシドスクアレンまたは2-3,22-23-ジエポキシスクアレン)を産生できる、スクアレンエポキシダーゼ(SQE)を提供する。SQEは、スクアレンモノオキシゲナーゼとも称され得る。
【0144】
本発明のSQEは、表8におけるSQE配列(例えば、核酸またはアミノ酸配列)、配列番号126~128または142~144に示す配列または本明細書に開示するもしくは当分野で知られるあらゆるSQE配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも100%同一(各数値間の全数値を含む)である配列を含み得る。
【0145】
ある実施態様において、本発明のSQEは、スクアレン化合物におけるエポキシド形成(例えば、スクアレンまたは2,3-オキシドスクアレンのエポキシ化)を促進できる。ある実施態様において、本発明のSQEは、モグロール前駆体(例えば、2-3-オキシドスクアレンまたは2-3,22-23-ジエポキシスクアレン)の形成を促進する。
【0146】
組み換えSQEの比活性などの活性は、単位時間あたり酵素単位あたり産生されるモグロール前駆体(例えば、2-3-オキシドスクアレンまたは2-3,22-23-ジエポキシスクアレン)の濃度として測定され得る。ある実施態様において、本発明のSQEは、少なくとも0.0000001μmol/分/mg(例えば、少なくとも0.000001μmol/分/mg、少なくとも0.00001μmol/分/mg、少なくとも0.0001μmol/分/mg、少なくとも0.001μmol/分/mg、少なくとも0.01μmol/分/mg、少なくとも0.1μmol/分/mg、少なくとも1μmol/分/mg、少なくとも10μmol/分/mgまたは少なくとも100μmol/分/mg(各数値間の全数値))の比活性などの活性を有する、
【0147】
ある実施態様において、SQEの比活性などの活性は、対照SQEより少なくとも1.1倍(例えば、少なくとも1.3倍、少なくとも1.5倍、少なくとも1.7倍、少なくとも1.9倍、少なくとも2倍、少なくとも2.5倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍または少なくとも100倍(数値間の全数値を含む))大きい。
【0148】
バリアント
本発明の態様は、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼおよびEPHおよびSQE酵素など、記載される組み換えポリペプチドの何れかをコードするポリヌクレオチドに関する。本明細書に記載するポリヌクレオチドまたはアミノ酸配列のバリアントも、本発明により包含される。バリアントは、参照配列と少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%配列同一性(数値間の全数値を含む)を共有し得る。
【0149】
特に断らない限り、用語「配列同一性」は、当分野で知られるとおり、配列比較(アライメント)により決定した、2つのポリペプチドまたはポリヌクレオチドの配列間の関係をいう。ある実施態様において、配列同一性は、配列の全長にわたり決定されるが、他の実施態様において、配列同一性は、配列領域にわたり決定される。
【0150】
同一性は、一連の2以上の残基(例えば、核酸またはアミノ酸残基)間のマッチ数により決定される、2個の配列間の配列関連性の程度ともいい得る。同一性は、特定の数学的モデル、アルゴリズムまたはコンピュータープログラムにより処理されるギャップアライメント(あるならば)を伴う2以上の配列の小さいほうの間の同一マッチのパーセントを測定する。
【0151】
関連ポリペプチドまたは核酸配列の同一性は、当業者に知られる方法の何れかにより容易に計算され得る。2個の配列(例えば、核酸またはアミノ酸配列)の「パーセント同一性」は、例えば、Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993におけるように改変したKarlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990のアルゴリズムを使用して決定され得る。このようなアルゴリズムは、Altschul et al., J. Mol. Biol. 215:403-10, 1990のNBLAST(登録商標)およびXBLAST(登録商標)プログラム(バージョン2.0)に組み込まれている。BLAST(登録商標)タンパク質サーチは、例えば、XBLASTプログラムで、スコア=50、単語長=3で実施して、本発明のタンパク質分子と相同であるアミノ酸配列を得ることができる。2配列間にギャップが存在するとき、Gapped BLAST(登録商標)を、例えば、Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997に記載のとおり実施できる。BLAST(登録商標)およびGapped BLAST(登録商標)プログラムを使用するとき、各プログラム(例えば、XBLAST(登録商標)およびNBLAST(登録商標))のデフォルトパラメータを使用できまたはパラメータを当業者により理解されるとおり適切に調整できる。
【0152】
使用され得る他の局所アライメント技術は、例えば、Smith-Watermanアルゴリズム(Smith, T.F. & Waterman, M.S. (1981) “Identification of common molecular subsequences.” J. Mol. Biol. 147:195-197)に基づく。使用され得る一般的包括的アライメント技術は、例えば、動的計画法に基づく、Needleman-Wunschアルゴリズム(Needleman, S.B. & Wunsch, C.D. (1970) “A general method applicable to the search for similarities in the amino acid sequences of two proteins.” J. Mol. Biol. 48:443-453)である。
【0153】
さらに最近、Fast Optimal Global Sequence Alignment Algorithm(FOGSAA)が開発され、これは、Needleman-Wunschアルゴリズムを含む他の最適包括的アライメント方法より速く、核酸およびアミノ酸配列の包括的アライメントを作成するとされている。ある実施態様において、2個のポリペプチドの同一性を、2個のアミノ酸配列をアラインし、同一アミノ酸数を計算し、アミノ酸配列の一方の長さで除すことにより決定する。ある実施態様において、2個の核酸の同一性を、2個のヌクレオチド配列をアラインし、同一ヌクレオチド数を計算し、核酸の一方の長さで除すことにより決定する。
【0154】
複数配列アライメントのために、Clustal Omega(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)を含むコンピュータープログラムが使用され得る。
【0155】
核酸またはアミノ酸配列を含む配列は、当業者に知られる何らかの方法を使用して、本明細書に開示の配列および/または特許請求の範囲に記載する配列などの参照配列と特定のパーセント同一性を有することが判明し得ることは認識される。異なるアルゴリズムは、ある1組の配列で異なるパーセント同一性値となり得る。本発明の特許請求の範囲は、参照配列に対するパーセント同一性があるアルゴリズムについてデフォルトパラメータおよび/または一般に当業者により使用されるパラメータを使用して計算された配列を含むことは理解される。
【0156】
本明細書で使用する、配列「X」における残基(例えば核酸残基またはアミノ酸残基)は、配列XおよびYを当分野で知られるアミノ酸配列アライメントツールを使用してアラインしたとき、配列「X」における該残基が異なる配列「Y」における「z」のカウンターパート位置にあるならば、該配列「Y」における「z」位または残基(例えば核酸残基またはアミノ酸残基)に対応するという。
【0157】
バリアント配列は相同配列であり得る。本明細書で使用する、相同配列は、特定のパーセント同一性(例えば、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%パーセント同一性(各数値間の全数値を含む))を共有する配列(例えば、核酸またはアミノ酸配列)である。相同配列は、パラロガス配列、オルソロガス配列または収斂進化に起因する配列を含むが、これらに限定されない。パラロガス配列は、種のゲノム内の遺伝子の重複に起因し、一方オルソロガス配列は、種分化事象後分岐する。2つの異なる種は、独立して進化しているかもしれないが、各々、収斂進化の結果として、他方の種からの配列と特定のパーセント同一性を有する配列を含み得る。
【0158】
ある実施態様において、ポリペプチドバリアント(例えば、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQEバリアント)は、対照ポリペプチド(例えば、対照CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQE)と二次構造(例えば、アルファヘリックス、ベータシート)を共有するドメインを含む。ある実施態様において、ポリペプチドバリアント(例えば、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQEバリアント)は、対照ポリペプチド(例えば、対照CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQE)と三次構造を共有する。非限定的例として、バリアントポリペプチドは、対照ポリペプチドと比較して低い一次配列同一性(例えば、80%未満、75%未満、70%未満、65%未満、60%未満、55%未満、50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満または5%未満配列同一性)を有するが、1以上の二次構造(例えば、ループ、アルファヘリックスまたはベータシートを含むが、これらに限定されない)を共有するかまたは対照ポリペプチドと同じ三次構造を有し得る。例えば、ループは、ベータシートとアルファヘリックス間、2個のアルファヘリックス間または2個のベータシート間に位置し得る。相同性モデリングを使用して、2以上の三次構造を比較し得る。
【0159】
当業者に知られる多様な方法により、ヌクレオチド配列に変異を付し得る。例えば、変異を、PCR指向変異、Kunkel(Kunkel, Proc. Nat. Acad. Sci. U.S.A. 82: 488-492, 1985)の方法による部位特異的変異誘発、ポリペプチドをコードする遺伝子の化学合成、遺伝子編集ツールまたはタグ(例えば、HISタグまたはGFPタグ)挿入などの挿入により付し得る。変異は、例えば、当分野で知られる何らかの方法により産生される、置換、欠失および転座を含み得る。変異を産生する方法は、Molecular Cloning: A Laboratory Manual, J. Sambrook, et al., eds., Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 2012またはCurrent Protocols in Molecular Biology, F.M. Ausubel, et al., eds., John Wiley & Sons, Inc., New York, 2010などの参考書に見られ得る。
【0160】
ある実施態様において、バリアントを産生する方法は、循環置換を含む(Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25)。循環置換の非限定的例は、実施例5および
図7に提供される。循環置換において、ポリペプチドの直鎖状一次配列が環状化(例えば、配列のN末端とC末端の結合による)され、ポリペプチドを異なる位置で切断(「破壊」)し得る。故に、新規ポリペプチドの直鎖状一次配列は、直鎖状配列アライメント方法(例えば、Clustal OmegaまたはBLAST)により決定して、低配列同一性(例えば、80%未満、75%未満、70%未満、65%未満、60%未満、55%未満、50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満または5%未満(各数値間の全数値を含む))を有し得る。しかしながら、2個のタンパク質の位相的分析は、2個のポリペプチドの三次構造が類似または相違することを確認し得る。特定の理論に拘束されないが、対照ポリペプチドの循環置換により作製し、対照ポリペプチドと類似する三次構造を有するバリアントポリペプチドは、類似する機能的特徴(例えば、酵素活性、酵素動力学、基質特異性または産物特異性)を有し得る。ある場合、循環置換は二次構造、三次構造または四次構造を変え、異なる機能的特徴(例えば、酵素活性が増加または低減、異なる基質特異性または異なる産物特異性)の酵素を生じ得る。例えば、Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25参照。
【0161】
循環置換を受けたタンパク質で、タンパク質の直鎖状アミノ酸配列は、循環置換を受けていない対照タンパク質と異なることは認識される。しかしながら、循環置換を受けたタンパク質のどの残基が、循環置換を受けていない対照タンパク質における残基に対応するか、例えば、配列をアラインし、保存されたモチーフを決定するおよび/または、例えば、相同性モデリングにより、タンパク質の構造または予測構造の比較により、当業者は容易に決定できる。
【0162】
ある実施態様において、目的の配列と本明細書に記載の対照配列のパーセント同一性を決定するアルゴリズムは、これら配列間の循環置換の存在を説明する。循環置換の存在は、例えば、RASPODOM(Weiner et al., Bioinformatics. 2005 Apr 1;21(7):932-7)を含む、当分野で知られる何らかの方法を使用して検出され得る。ある実施態様において、循環置換の存在は、目的の配列と本明細書に記載の配列のパーセント同一性前に補正される(例えば、少なくとも1つの配列におけるドメインが再配列される)。本発明の特許請求の範囲は、対照配列に対するパーセント同一性が、配列の循環置換の可能性を考慮した後、計算されている配列を含むと理解される。
【0163】
本明細書に開示する組み換えCDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHおよびスクアレンエポキシダーゼの機能的バリアントも、本発明により包含される。例えば、機能的バリアントは、1以上の同じ基質(例えば、モグロール、モグロシドまたはその前駆体)と結合するか、1以上の同じ産物(例えば、モグロール、モグロシドまたはその前駆体)を産生し得る。機能的バリアントは、当分野で知られる何らかの方法を使用して、同定され得る。例えば、上記Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990のアルゴリズムを、既知機能を有する相同タンパク質の同定に使用し得る。
【0164】
推定される機能的バリアントは、機能的にアノテートされたドメインを有するポリペプチドのサーチによっても同定され得る。Pfam(Sonnhammer et al., Proteins. 1997 Jul;28(3):405-20)を含むデータベースを使用して、特定のドメインを有するポリペプチドを同定し得る。例えば、オキシドスクアレンシクラーゼ中で、さらなるCDS酵素が、ある場合、配列番号74の123位に対応するロイシン残基を有するポリペプチドのサーチにより同定され得る。このロイシン残基は、CDS酵素の産物特異性決定と関連付けられている;この残基の変異は、例えば、産物としてシクロアルテノールまたはパルケオールをもたらす(Takase et al., Org Biomol Chem. 2015 Jul 13(26):7331-6)。
【0165】
さらなるUGT酵素が、例えば、UDPGTドメイン(PROSITE accession number PS00375)を有するポリペプチドのサーチにより、同定され得る。
【0166】
相同性モデリングも、機能に影響することなく、変異しやすいアミノ酸残基の同定に使用され得る。このような方法の非限定的例は、位置特異的スコアマトリックス(PSSM)およびエネルギー最小化プロトコールの使用を含み得る(例えば、下記実施例5参照)。例えば、Stormo et al., Nucleic Acids Res. 1982 May 11;10(9):2997-3011参照。
【0167】
PSSMは、野生型と単一点変異体の間の差異を決定する、ロゼッタエネルギー関数の計算と対合され得る。特定の理論に拘束されないが、潜在的に安定化する変異が、タンパク質操作(例えば、機能的ホモログの産生)で望まれる。ある実施態様において、潜在的に安定化する変異は、-0.1未満(例えば、-0.2未満、-0.3未満、-0.35未満、-0.4未満、-0.45未満、-0.5未満、-0.55未満、-0.6未満、-0.65未満、-0.7未満、-0.75未満、-0.8未満、-0.85未満、-0.9未満、-0.95未満または-1.0未満)のロゼッタエネルギー単位(R.e.u.)のΔΔGcalc値を有する。例えば、Goldenzweig et al., Mol Cell. 2016 Jul 21;63(2):337-346. doi: 10.1016/j.molcel.2016.06.012参照。
【0168】
ある実施態様において、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQEコード配列は、対照コード配列に対応する、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100または100を超える位置に変異を含む。ある実施態様において、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQEコード配列は、対照コード配列に対してコード配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99,100またはそれ以上のコドンに変異を含む。当業者には理解されるとおり、コドン内の変異は、遺伝暗号の縮重により、該コドンによりコードされるアミノ酸を変化させるかもしれないし、させないかもしれない。ある実施態様において、コード配列における1以上の変異は、対照ポリペプチドのアミノ酸配列に対して、コード配列のアミノ酸配列を変えない。
【0169】
ある実施態様において、組み換えCDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQE配列における1以上の変異は、対照ポリペプチドのアミノ酸配列に対して、ポリペプチドのアミノ酸配列を変える。ある実施態様において、1以上の変異は、対照ポリペプチドのアミノ酸配列に対して組み換えポリペプチドのアミノ酸配列を変え、対照ポリペプチドに対してポリペプチドの活性を変える(増強または低減)。
【0170】
本明細書に記載する組み換えポリペプチドの何れかの、比活性を含む活性は、日常的な方法を使用して測定され得る。非限定的例として、組み換えポリペプチドの活性を、その基質特異性、生産される産物、生産される産物の濃度またはこれらの何らかの組み合わせの測定により決定し得る。本明細書で使用する、組み換えポリペプチドの「比活性」は、単位時間あたりある量(例えば、濃度)の組み換えポリペプチドにより産生される特定の産物の量(例えば、濃度)をいう。
【0171】
組み換えポリペプチドコード配列における変異は、前記ポリペプチドの機能的に等価なバリアント、例えば、ポリペプチドの活性を保持するバリアントを提供するための保存的アミノ酸置換をもたらし得ることも当業者は認識する。本明細書で使用する、「保存的アミノ酸置換」は、アミノ酸置換がなされたタンパク質の相対的電荷もしくはサイズ特徴または機能的活性を変えないアミノ酸置換をいう。
【0172】
ある場合、アミノ酸は、そのR基(例えば、表1参照)により特徴づけられる。例えば、アミノ酸は、非極性脂肪族R基、正電荷R基、負電荷R基、非極性芳香族R基または極性非電荷R基を含み得る。非極性脂肪族R基を含むアミノ酸の非限定的例は、アラニン、グリシン、バリン、ロイシン、メチオニンおよびイソロイシンを含む。正電荷R基を含むアミノ酸の非限定的例は、リシン、アルギニンおよびヒスチジンを含む。負電荷R基を含むアミノ酸の非限定的例は、アスパラギン酸およびグルタミン酸を含む。非極性、芳香族R基を含むアミノ酸の非限定的例は、フェニルアラニン、チロシンおよびトリプトファンを含む。極性非電荷R基を含むアミノ酸の非限定的例は、セリン、スレオニン、システイン、プロリン、アスパラギンおよびグルタミンを含む。
【0173】
ポリペプチドの機能的に等価なバリアントの非限定的例は、本明細書に開示のタンパク質のアミノ酸配列に保存的アミノ酸置換を含み得る。アミノ酸の保存的置換は、次の群内のアミノ酸間でなされる置換である:(a)M、I、L、V;(b)F、Y、W;(c)K、R、H;(d)A、G;(e)S、T;(f)Q、N;および(g)E、D。保存的アミノ酸置換のさらなる非限定的例を表1に提供する。
【0174】
ある実施態様において、バリアントポリペプチドの調製時、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または20を超える残基を変え得る。ある実施態様において、アミノは保存的アミノ酸置換により置換される。
【0175】
【0176】
所望の性質および/または活性を有する組み換えポリペプチドバリアントを産生するためのポリペプチドのアミノ酸配列におけるアミノ酸置換は、ポリペプチドのコード配列の改変により行い得る。同様に、ポリペプチドの機能的に等価なバリアントを産生するためのポリペプチドのアミノ酸配列における保存的アミノ酸置換は、一般に組み換えポリペプチド(例えば、UGT、CDS、P450、シトクロムP450レダクターゼ、EPHまたはスクアレンエポキシダーゼ)のコード配列の改変により行う。
【0177】
宿主細胞における核酸の発現
本発明の態様は、酵素、その機能的修飾体およびバリアントをコードする遺伝子の組み換え発現ならびにそれに関連する使用に関する。例えば、本明細書に記載する方法を、モグロール前駆体、モグロールおよび/またはモグロシドの産生に使用され得る。
【0178】
遺伝子を含むポリヌクレオチドなどのポリヌクレオチドに関する用語「異種」は、用語「外来性」および用語「組み換え」と相互交換可能に使用され、生物系に人工的に供給されているポリヌクレオチド;生物系内で修飾されているポリヌクレオチド;または発現または制御が生物系内で操作されているポリヌクレオチドをいう。宿主細胞に導入されるまたは発現される異種ポリヌクレオチドは、宿主細胞と異なる生物または種由来のポリヌクレオチドであり得るかまたは合成ポリヌクレオチドであり得るかまたは宿主細胞と同じ生物または種でまた内因性に発現されるポリヌクレオチドであり得る。例えば、宿主細胞で内因性に発現されるポリヌクレオチドは、宿主細胞で天然ではない位置である;安定的または一過性に宿主細胞で組み換え発現される;宿主細胞内で修飾される;宿主細胞内で選択的に編集される;天然に存在するコピー数と異なるコピー数で宿主細胞内で発現される;またはポリヌクレオチドの発現を制御する制御領域の操作によるなど、宿主細胞内で天然ではない方法で発現されるとき、異種とみなされる。ある実施態様において、異種ポリヌクレオチドは、宿主細胞で内因性に発現されるポリヌクレオチドであるが、発現が該ポリヌクレオチドの発現を天然では制御しないプロモーターにより駆動される。他の実施態様において、異種ポリヌクレオチドは宿主細胞で内因性に発現されるポリヌクレオチドであり、その発現は該ポリヌクレオチドの発現を天然で制御するプロモーターにより駆動されるが、該プロモーターまたは他の制御領域が修飾される。ある実施態様において、プロモーターは、組み換えにより活性化または抑制される。例えば、遺伝子編集ベースの技術を使用して、内因性ポリヌクレオチドを含むポリヌクレオチドの、内因性プロモーターを含むプロモーターからの発現を制御し得る。例えば、Chavez et al., Nat Methods. 2016 Jul; 13(7): 563-567参照。異種ポリヌクレオチドは、対照ポリヌクレオチド配列と比較して野生型配列または変異体配列を含み得る。
【0179】
本明細書に記載するCDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはSQEなどの組み換えポリペプチドの何れかをコードする核酸を、当分野で知られる何れかの方法により何れかの適切なベクターに組み込み得る。例えば、ベクターは、ウイルスベクター(例えば、レンチウイルス、レトロウイルス、アデノウイルスまたはアデノ随伴ウイルスベクター)を含むが、これらに限定されない発現ベクター、一過性発現に適するあらゆるベクター、構成的発現に適するあらゆるベクターまたは誘導型発現に適するあらゆるベクター(例えば、ガラクトース誘導型またはドキシサイクリン誘導型ベクター)であり得る。組み換えポリペプチド(例えば、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHまたはスクアレンエポキシダーゼ)の発現のためのベクターの非限定的例は、下の実施例1に記載される。
【0180】
ある実施態様において、ベクターは、細胞で自律的に複製する。ベクターは、1以上のエンドヌクレアーゼ制限部位を含み、本明細書に記載の遺伝子を含む核酸の挿入およびライゲートのために制限エンドヌクレアーゼにより切断され、細胞で複製できる組み換えベクターが産生され得る。ベクターは、一般にDNAからなるが、RNAベクターも利用可能である。クローニングベクターは、プラスミド、フォスミド、ファージミド、ウイルスゲノムおよび人工染色体を含むが、これらに限定されない。本明細書で使用する、用語「発現ベクター」または「発現構築物」は、酵母細胞などの宿主細胞における特定の核酸の転写を可能とする一連の特定の核酸要素を有する、組み換えまたは合成により産生された、核酸構築物をいう。ある実施態様において、本明細書に記載する遺伝子の核酸配列を、制御配列と操作可能に結合し、ある実施態様において、RNA転写物として発現されるように、クローニングベクターに挿入される。ある実施態様において、ベクターは、組み換えベクターで形質転換またはトランスフェクトされた細胞を同定するための、本明細書に記載する選択可能マーカーなどの1以上のマーカーを含む。ある実施態様において、本明細書に記載する遺伝子の核酸配列は再コード化される。再コード化は、再コード化されていない対照配列に比して、遺伝子産物の産生を少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%または100%(各数値間の全数値を含む))増加させ得る。
【0181】
コード配列および制御配列は、コード配列と制御配列が共有結合され、コード配列の発現または転写が該制御配列の影響または制御下にあるならば、「操作可能に結合」または「操作可能に連結」されたという。コード配列が機能的タンパク質に翻訳されるならば、コード配列および制御配列は、5’制御配列におけるプロモーターの導入がコード配列を翻訳させるならばおよびコード配列と制御配列の間の結合の性質が、(1)フレームシフト変異の導入をもたらす、(2)プロモーター領域がコード配列の転写を指示する能力を妨害するまたは(3)対応するRNA転写物がタンパク質に翻訳される能力を妨害することがないならば、操作可能に結合または連結されたという。
【0182】
ある実施態様において、本明細書に記載するタンパク質の何れかをコードする核酸は、制御配列(例えば、エンハンサー配列)の制御下にある。ある実施態様において、核酸は、プロモーターの制御下発現される。プロモーターは、天然プロモーター、例えば、内因性状況で遺伝子のプロモーターであり、該遺伝子の発現の通常の制御を提供する。あるいは、プロモーターは、遺伝子の天然プロモーターと異なるプロモーター、例えば、その内因性状況における遺伝子のプロモーターと異なるプロモーターである。本明細書で使用する、「異種プロモーター」または「組み換えプロモーター」は、天然ではないまたは通常関連していないまたは操作可能に結合したDNA配列の転写を天然でもしくは通常制御しない、プロモーターである。ある実施態様において、ヌクレオチド配列は異種プロモーターの制御下にある。
【0183】
ある実施態様において、プロモーターは、真核生物プロモーターである。真核生物プロモーターの非限定的例は、当業者に知られるとおり、TDH3、PGK1、PKC1、PDC1、TEF1、TEF2、RPL18B、SSA1、TDH2、PYK1、TPI1 GAL1、GAL10、GAL7、GAL3、GAL2、MET3、MET25、HXT3、HXT7、ACT1、ADH1、ADH2、CUP1-1、ENO2およびSOD1を含む(例えば、Addgene website: blog.addgene.org/plasmids-101-the-promoter-region参照)。ある実施態様において、プロモーターは、原核生物プロモーター(例えば、バクテリオファージまたは細菌プロモーター)である。バクテリオファージプロモーターの非限定的例は、Pls1con、T3、T7、SP6およびPLを含む。細菌プロモーターの非限定的例は、Pbad、PmgrB、Ptrc2、Plac/ara、PtacおよびPmを含む。
【0184】
ある実施態様において、プロモーターは誘導型プロモーターである。本明細書で使用する、「誘導型プロモーター」は、分子の存在または不在により制御されるプロモーターである。誘導型プロモーターの非限定的例は、化学制御プロモーターおよび物理制御プロモーターを含む。化学制御プロモーターについて、転写活性は、アルコール、テトラサイクリン、ガラクトース、ステロイド、金属または他の化合物などの1以上の化合物により制御される。物理制御プロモーターについて、転写活性は、光または温度などの現象により制御され得る。テトラサイクリン制御プロモーターの非限定的例は、ヒドロテトラサイクリン(aTc)応答性プロモーターおよび他のテトラサイクリン応答性プロモーター系(例えば、テトラサイクリンリプレッサータンパク質(tetR)、テトラサイクリンオペレーター配列(tetO)およびテトラサイクリントランスアクティベーター融合タンパク質(tTA))を含む。ステロイド制御プロモーターの非限定的例は、ラットグルココルチコイド受容体、ヒトエストロゲン受容体、ガエクジソン受容体およびステロイド/レチノイド/甲状腺受容体スーパーファミリーからのプロモーターに基づくプロモーターを含む。金属制御プロモーターの非限定的例は、メタロチオネイン(金属イオンを結合および隔離するタンパク質)遺伝子に由来するプロモーターを含む。病因制御プロモーターの非限定的例は、サリチル酸、エチレンまたはベンゾチアジアゾール(BTH)により誘導されるプロモーターを含む。温度/熱誘導型プロモーターの非限定的例は、ヒートショックプロモーターを含む。光制御プロモーターの非限定的例は、植物細胞の光反応性プロモーターを含む。ある実施態様において、誘導型プロモーターはガラクトース誘導型プロモーターである。ある実施態様において、誘導型プロモーターは、1以上の生理学的条件(例えば、pH、温度、放射、浸透圧、食塩水勾配、細胞表面結合または1以上の外因性もしくは内因性誘導剤の濃度)により誘導される。外因性インデューサーまたは誘導剤の非限定的例は、アミノ酸およびアミノ酸アナログ、サッカライドおよび多糖、核酸、タンパク質転写アクティベーターおよびリプレッサー、サイトカイン、毒素、石油ベースの化合物、金属含有化合物、塩、イオン、酵素基質アナログ、ホルモンまたはこれらの何らかの組み合わせを含む。
【0185】
ある実施態様において、プロモーターは構成的プロモーターである。本明細書で使用する、「構成的プロモーター」は、遺伝子の連続的転写を可能とする非制御プロモーターをいう。構成的プロモーターの非限定的例は、TDH3、PGK1、PKC1、PDC1、TEF1、TEF2、RPL18B、SSA1、TDH2、PYK1、TPI1、HXT3、HXT7、ACT1、ADH1、ADH2、ENO2およびSOD1を含む。
【0186】
当業者に知られる他の誘導型プロモーターまたは構成的プロモーターも考慮される。
【0187】
遺伝子発現に必要な制御配列の厳密な性質は種または細胞型により変わり得るが、一般に、必要に応じて、TATAボックス、キャッピング配列、CAAT配列など、それぞれ転写および翻訳の開始に関与する5’非転写および5’非翻訳配列を含む。特に、このような5’非転写制御配列は、操作可能に結合した遺伝子の転写制御のためのプロモーター配列を含むプロモーター領域を含む。制御配列は、エンハンサー配列または上流アクティベーター配列も含み得る。本明細書に開示するベクターは、5’リーダーまたはシグナル配列を含み得る。制御配列はターミネーター配列も含み得る。ある実施態様において、ターミネーター配列は、転写中のDNA遺伝子の終わりを示す。宿主細胞における本明細書に記載する1以上の遺伝子の発現に適する1以上の適切なベクターの選択および設計は、当業者の能力および裁量の範囲内である。
【0188】
発現に必要な要素を含む発現ベクターは市販され、当業者に知られる(例えば、Sambrook et al., Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, 2012参照)。
【0189】
ある実施態様において、宿主細胞への組み換えポリペプチドをコードするポリヌクレオチドなどのポリヌクレオチドの導入は、ポリヌクレオチドのゲノム統合をもたらす。ある実施態様において、宿主細胞は、ゲノムにおいて、本明細書に記載する組み換えポリペプチドの何れかをコードするポリヌクレオチド配列などのポリヌクレオチド配列を少なくとも1コピー、少なくとも2コピー、少なくとも3コピー、少なくとも4コピー、少なくとも5コピー、少なくとも6コピー、少なくとも7コピー、少なくとも8コピー、少なくとも9コピー、少なくとも10コピー、少なくとも11コピー、少なくとも12コピー、少なくとも13コピー、少なくとも14コピー、少なくとも15コピー、少なくとも16コピー、少なくとも17コピー、少なくとも18コピー、少なくとも19コピー、少なくとも20コピー、少なくとも21コピー、少なくとも22コピー、少なくとも23コピー、少なくとも24コピー、少なくとも25コピー、少なくとも26コピー、少なくとも27コピー、少なくとも28コピー、少なくとも29コピー、少なくとも30コピー、少なくとも31コピー、少なくとも32コピー、少なくとも33コピー、少なくとも34コピー、少なくとも35コピー、少なくとも36コピー、少なくとも37コピー、少なくとも38コピー、少なくとも39コピー、少なくとも40コピー、少なくとも41コピー、少なくとも42コピー、少なくとも43コピー、少なくとも44コピー、少なくとも45コピー、少なくとも46コピー、少なくとも47コピー、少なくとも48コピー、少なくとも49コピー、少なくとも50コピー、少なくとも60コピー、少なくとも70コピー、少なくとも80コピー、少なくとも90コピー、少なくとも100コピーまたはそれ以上(各数値間のあらゆる数値を含む)含む。
【0190】
宿主細胞
本発明のタンパク質または酵素の何れかを、宿主細胞で発現させ得る。本明細書で使用する、用語「宿主細胞」は、モグロール、モグロシドおよびその前駆体の産生に使用する酵素をコードするポリヌクレオチドなどのポリヌクレオチドを発現させるために使用され得る細胞をいう。
【0191】
真核生物細胞または原核生物細胞を含む、あらゆる適当な宿主細胞を、本明細書に開示するCDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHおよびSQEを含む組み換えポリペプチドの何れかの産生に使用できる。適当な宿主細胞は、真菌細胞(例えば、酵母細胞)、細菌細胞(例えば、大腸菌細胞)、藻類細胞、植物細胞、昆虫細胞および哺乳動物細胞を含む動物細胞を含むが、これらに限定されない。
【0192】
適当な酵母宿主細胞は、カンジダ、エシェリキア、ハンセヌラ、サッカロミセス(例えば、出芽酵母)、シゾサッカロマイセス、ピキア、クルイベロマイセス(例えば、クルイベロマイセス・ラクチス)およびヤロウイアを含むが、これらに限定されない。ある実施態様において、酵母細胞がハンセヌラ・ポリモルファ、サッカロミセス・セレビシエ、サッカロミセス・カールスベルゲンシス、サッカロミセス・ディアスタティックス、サッカロミセス・ノルベンシス、サッカロミセス・クルイベリ、シゾサッカロミセス・ポンベ、ピキア・フィンランディカ、ピキア・トレハロフィラ、ピキア・コダマエ、ピキア・メンブラナエファシエンス、ピキア・オプンティアエ、ピキア・サーモトレランス、ピキア・サリクタリア、ピキア・ケルクウム、ピキア・ピジェペリ、ピキア・スティピティス、ピキア・メタノリカ、ピキア・アングスタ、クルイベロミセス・ラクティス、カンジダ・アルビカンスまたはヤロウイア・リポリティカである。
【0193】
ある実施態様において、酵母株は工業的多数体酵母株である。真菌細胞の他の非限定的例は、アスペルギルス属、ペニシリウム属、フザリウム属、リゾプス属、アクレモニウム属、アカパンカビ属、ソルダリア属、マグナポルテ属、アロミセス属、ウスティラゴ属ボトリチス属、およびトリコデルマ属から得られた細胞を含む。
【0194】
ある実施態様において、宿主細胞はクラミドモナス(例えば、クラミドモナス・ラインハルトチイ)およびフォルミディウム(P.sp.ATCC29409)などの藻類細胞である。
【0195】
他の実施態様において、宿主細胞は原核生物細胞である。適当な原核生物細胞は、グラム陽性、グラム陰性およびグラム不定細菌細胞を含む。宿主細胞は、アグロバクテリウム、アリシクロバチルス、アナバエナ、アナシスティス、アシネトバクター、アシドサーマス、アートロバクター、アゾバクター、バチルス、ビフィドバクテリウム、ブレビバクテリウム、ブチリビブリオ、ブフネラ、カンペストリス、カンプリオバクター、クロストリジウム、コリネバクテリウム、クロマチウム、コプロコッカス、エシェリキア、エンテロコッカス、エンテロバクター、エルウィニア、フソバクテリウム、フィーカリバクテリウム、フランシセラ、フラボバクテリウム、ゲオバチルス、ヘモフィルス、ヘリコバクター、クレブシエラ、ラクトバチルス、ラクトコッカス、イリオバクター、マイクロコッカス、ミクロバクテリウム、メソリゾビウム、メチロバクテリウム、メチロバクテリウム、マイコバクテリウム、ナイセリア、パントエア、シュードモナス、プロクロロコッカス、ロドバクター、ロドシュードモナス、ロドシュードモナス、ロゼブリア、ロドスピリルム、ロドコッカス、セネデスムス、ストレプトマイセス、ストレプトコッカス、シネコッカス、サッカロモノスポラ、サッカロポリスポラ、スタフィロコッカス、セラチア、サルモネラ、シゲラ、サーモアナエロバクテリウム、トロフェリマ、ツラレンシス、テメキュラ、サーモシネココッカス、サーモコッカス、ウレアプラズマ、キサントモナス、キシレラ、エルシニアおよびザイモモナスを含むが、これらに限定されない属のものであり得る。
【0196】
ある実施態様において、細菌宿主細胞は、アグロバクテリウム属(例えば、アグロバクテリウム・ラジオバクター、アグロバクテリウム・リゾゲネス、アグロバクテリウム・ルビ)、アルスロバクター属(例えば、アルスロバクター・アウレッセンス、アルスロバクター・シトレウス、アルスロバクター・グロビフォルミス、アルスロバクター・ヒドロカルボグルタミナス、アルスロバクター・マイソレンス、アルスロバクター・ニコチアナエ、アルスロバクター・パラフィネウス、アルスロバクター・プロトフォルミアエ、アルスロバクター・ロゼオパラフィナス、アルスロバクター・スルフレウス、アルスロバクター・ウレアファシエンス)またはバシラス属(例えば、バシラス・チューリンゲンシス、バシラス・アントラシス、バシラス・メガテリウム、バシラス・スブチリス、バシラス・レンタス、バシラス・サーキュランス、バシラス・プミラス、バシラス・ラクタス、バシラス・コアギュランス、バシラス・ブレビス、バシラス・フィルムス、バシラス・アルカオフィウス、バシラス・リヒェニフォルミス、バシラス・クラウジ、バシラス・ステアロテルモフィルス、バシラス・ハロデュランスおよびバシラス・アミロリクエファシエンス)のものである。具体的実施態様において、宿主細胞は、バシラス・スブチリス、バシラス・プミラス、バシラス・リヒェニフォルミス、バシラス・メガテリウム、バシラス・クラウジ、バシラス・ステアロテルモフィルスおよびバシラス・アミロリクエファシエンスを含むが、これらに限定されない工業的バシラス属である。ある実施態様において、宿主細胞は、工業的クロストリジウム属(例えば、クロストリジウム・アセトブチリカム、クロストリジウム・テタニE88、クロストリジウム・リツセブレンス、クロストリジウム・サッカロブチリカム、クロストリジウム・パーフリンジェンス、クロストリジウム・ベイジェリンキー)。ある実施態様において、宿主細胞は、工業的コリネバクテリウム族(例えば、コリネバクテリウム・グルタミナム、コリネバクテリウム・アセトアシドフィルム)。ある実施態様において、宿主細胞は、工業的エシェリキア属(例えば、大腸菌)である。ある実施態様において、宿主細胞は、工業的エルウィニア属(例えば、エルウィニア・ウレドボラ、エルウィニア・カロトボラ、エルウィニア・アナナス、エルウィニア・ハービコラ、エルウィニア・プンクタタ、エルウィニア・テレウス)である。ある実施態様において、宿主細胞は工業的パントエア属(例えば、パントエア・シトレア、パントエア・アグロメランス)である。ある実施態様において、宿主細胞は工業的シュードモナス属(例えば、シュードモナス・プイチダ、シュードモナス・エアルギノーザ、シュードモナス・メバロニ)である。ある実施態様において、宿主細胞は工業的ストレプトコッカス属(例えば、ストレプトコッカス・エキシミレス、ストレプトコッカス・ピオゲネシス、ストレプトコッカス・ウベリス)である。ある実施態様において、宿主細胞は工業的ストレプトマイセス属(例えば、ストレプトマイセス・アンボファシエンス、ストレプトマイセス・アクロモゲネス、ストレプトマイセス・アベルミチリス、ストレプトマイセス・コエリカラー、ストレプトマイセス・アウレオファシエンス、ストレプトマイセス・アウレウス、ストレプトマイセス・フンギシジカス、ストレプトマイセス・グリセウス、ストレプトマイセス・リビダンス)である。ある実施態様において、宿主細胞は、工業的ザイモモナス属(例えば、ザイモモナス・モビリス、ザイモモナス・リポリティカ)である。
【0197】
本発明はまた哺乳動物細胞、例えば、ヒト(293、HeLa、WI38、PER.C6およびボーズ黒色腫細胞を含む)、マウス(3T3、NS0、NS1、Sp2/0を含む)、ハムスター(CHO、BHK)、サル(COS、FRhL、Vero)およびハイブリドーマ細胞株を含む多様な動物細胞型での使用に適する。
【0198】
本発明はまた多様な植物細胞型での使用に適する。
【0199】
本明細書で使用する用語「細胞」は、単一細胞または同じ細胞株もしくは種に属する細胞集団などの細胞集団をいい得る。単数表現「細胞」の使用は、細胞集団ではなく、明示的に単一の細胞をいうと解釈されてはならない。
【0200】
宿主細胞は、野生型カウンターパートに比して遺伝子修飾を含み得る。非限定的例として、宿主細胞(例えば、出芽酵母)は、次の遺伝子:ヒドロキシメチルグルタリル-CoA (HMG-CoA)レダクターゼ(HMG1)、アセチル-CoA C-アセチルトランスフェラーゼ(アセトアセチル-CoAチオラーゼ)(ERG10)、3-ヒドロキシ-3-メチルグルタリル-CoA(HMG-CoA)シンターゼ(ERG13)、ファルネシル-ジホスフェートファルネシルトランスフェラーゼ(スクアレンシンターゼ)(ERG9)の1以上の低減または不活性化のために修飾されてよく、スクアレンエポキシダーゼ(ERG1)を過発現するよう修飾されてよくまたはラノステロールシンターゼ(ERG7)を下方制御するよう修飾されてよい。例えば、下記実施例1および2参照。
【0201】
遺伝子発現の低減および/または遺伝子不活性化は、遺伝子の欠失、遺伝子への点変異導入、遺伝子短縮化、遺伝子への挿入導入、遺伝子へのタグもしくは融合の導入または遺伝子の選択的編集を含むが、これらに限定されない何れかの適当な方法で達成され得る。例えば、ポリメラーゼ連鎖反応(PCR)ベースの方法が使用され得る(例えば、Gardner et al., Methods Mol Biol. 2014;1205:45-78)または周知遺伝子編集技術が使用され得る。非限定的例として、遺伝子を、遺伝子置換(例えば、選択マーカーを含むマーカーで)により欠失させ得る。遺伝子を、トランスポゾン系の使用により切断することもできる(例えば、Poussu et al., Nucleic Acids Res. 2005; 33(12): e104参照)。
【0202】
本明細書に記載する組み換えポリペプチドの何れかをコードするベクターを、当分野で知られる何れかの方法を使用して適当な宿主細胞に導入し得る。酵母形質転換プロトコールの非限定的例は、引用によりその全体として本明細書に包含させる、Gietz et al., Yeast transformation can be conducted by the LiAc/SS Carrier DNA/PEG method. Methods Mol Biol. 2006;313:107-20に記載される。宿主細胞を、当業者により理解される何らかの適当な条件下で培養し得る。例えば、当分野で知られるあらゆる培地、温度およびインキュベーション条件が使用され得る。誘導型ベクターを担持する宿主細胞について、細胞を、発現を促進する適切な誘導剤と培養し得る。
【0203】
本明細書に開示の細胞のいずれも、核酸の接触および/または統合前、途中および/または、あらゆるタイプ(リッチまたは最小)およびあらゆる組成の培地で培養できる。培養条件または培養過程は、当業者により理解されるとおり、慣用の実験により最適化され得る。ある実施態様において、選択培地は種々の成分が添加される。ある実施態様において、補助的成分の濃度および量は、最適化される。ある実施態様において、培地および増殖条件(例えば、pH、温度など)の他の態様は、慣用の実験により最適化される。ある実施態様において、培地に1以上の補助的成分を添加する頻度および細胞を培養する時間は最適化される。
【0204】
本明細書に記載する細胞の培養は、当分野で知られ、かつ使用される培養容器で実施できる。ある実施態様において、通気した反応器(例えば、撹拌タンクリアクター)を細胞の培養に使用する。ある実施態様において、バイオリアクターまたは発酵槽を細胞の培養に使用する。故に、ある実施態様において、細胞は、発酵で使用される。本明細書で使用する、用語「バイオリアクター」および「発酵槽」は相互交換可能に使用され、生存生物、生存生物の一部または精製酵素が関与する、生物学的、生化学的および/または化学的反応が行われるハウジングまたは部分的ハウジングをいう。「大規模バイオリアクター」または「工業的規模バイオリアクター」は、商業的または準商規模で生産物を産生するのに使用するバイオリアクターをいう。大規模バイオリアクターは、一般に数リットル、数百リットル、数千リットルまたはそれ以上の範囲の体積を有する。
【0205】
バイオリアクターの非限定的例は、撹拌タンク発酵槽、回転混合デバイスで撹拌されているバイオリアクター、ケモスタット、振盪デバイスで撹拌されているバイオリアクター、気泡ポンプ発酵槽、充填床リアクター、固定床リアクター、流動床バイオリアクター、波誘発撹拌を用いるバイオリアクター、遠心性バイオリアクター、ローラーボトルおよび中空繊維バイオリアクター、ローラー装置(例えばベンチトップ、カート搭載および/または自動化改変種)、垂直積層プレート、スピナーフラスコ、撹拌またはロッキングフラスコ、振盪多ウェルプレート、MDボトル、T-フラスコ、Rouxボトル、多表面組織培養プロパゲーター、修飾発酵槽および被覆ビーズ(例えば、細胞接着阻止のために血清タンパク質、ニトロセルロースまたはカルボキシメチルセルロースで被覆されたビーズ)を含む。
【0206】
ある実施態様において、バイオリアクターは、細胞(例えば、酵母細胞)が動いている液体および/または気泡と接触する細胞培養系を含む。ある実施態様において、細胞または細胞培養物は懸濁液で増殖される。他の実施態様において、細胞または細胞培養物は、固相担体に結合される。担体系の非限定的例は、マイクロ担体(例えば、多孔性または非多孔性であり得るポリマースフェア、マイクロビーズおよびマイクロディスク)、特定の化学基(例えば、三級アミン基)で荷電された架橋ビーズ(例えば、デキストラン)、非多孔性ポリマー繊維に捕捉された細胞を含む2Dマイクロ担体、3D担体(例えば、担体繊維、中空繊維、多カートリッジリアクターおよび多孔性繊維を含み得る半透膜)、イオン交換能が低減したマイクロ担体、封入細胞、キャピラリーおよび凝集体を含む。ある実施態様において、担体は、デキストラン、ゼラチン、ガラスまたはセルロースなどの材料から製作される。
【0207】
ある実施態様において、工業的規模過程を、連続的、半連続的または非連続的モードで操作する。操作モードの非限定的例は、バッチ、流加、拡張バッチ、反復バッチ、排出/充填、回転壁、回転フラスコおよび/または潅流モードの操作である。ある実施態様において、バイオリアクターは、基質ストック、例えば炭水化物源の連続的または半連続的補充および/またはバイオリアクターからの生成物の連続的または半連続的分離を可能にする。
【0208】
ある実施態様において、バイオリアクターまたは発酵槽は、反応パラメータを測定および/または調節するためのセンサーおよび/または制御系を含む。反応パラメータの非限定的例は、生物学的パラメータ(例えば、増殖速度、細胞サイズ、細胞数、細胞密度、細胞型または細胞状態など)、化学パラメータ(例えば、pH、酸化還元電位、反応基質および/または生成物濃度、酸素濃度およびCO2濃度などの溶解ガス濃度、栄養素濃度、代謝物濃度、オリゴペプチド濃度、アミノ酸濃度、ビタミン濃度、ホルモン濃度、添加剤濃度、血清濃度、イオン強度、イオン濃度、相対湿度、モル濃度、モル浸透圧濃度、他の化学物質、例えば緩衝剤、アジュバントまたは反応副産物の濃度)、物理的/機械的パラメータ(例えば、密度、伝導性、撹拌の程度、圧力および流速、剪断応力、剪断速度、粘性、色、濁度、光吸収、混合速度、変換速度ならびに温度、光強度/質などの熱力学パラメータなど)を含む。本明細書に記載のパラメータを測定するセンサーは、関連する機械および電子分野の当業者に周知である。本明細書に記載のセンサーからの入力に基づきバイオリアクターのパラメータを調節する制御系は、バイオリアクター工学の分野の当業者に周知である。
【0209】
ある実施態様において、方法はバッチ発酵(例えば、振盪フラスコ発酵)を含む。バッチ発酵(例えば、振盪フラスコ発酵)の一般的懸念は、酸素およびグルコースのレベルを含む。例えば、バッチ発酵(例えば、振盪フラスコ発酵)は、酸素およびグルコースを限定してよく、よって、ある実施態様において、株が適切に設計された流加発酵において実行する能力は過小評価されている。また、最終産物(例えば、モグロール前駆体、モグロール、モグロシド前駆体またはモグロシド)は、溶解度、毒性、細胞蓄積および分泌の観点で基質(例えば、モグロール前駆体、モグロール、モグロシド前駆体またはモグロシド)とある程度異なり得て、ある実施態様において異なる発酵力学を有し得る。
【0210】
本明細書に記載する方法は、組み換え細胞、細胞ライセートまたは単離組み換えポリペプチド(例えば、CDS、UGT、C11ヒドロキシラーゼ、シトクロムP450レダクターゼ、EPHおよびスクアレンエポキシダーゼ)を使用する、モグロール前駆体(例えば、スクアレン、2,3-オキシドスクアレンまたは24-25エポキシ-ククルビタジエノール)、モグロールまたはモグロシド(例えば、MIA1、MIE1、MIIA1、MIIA2、MIIIA1、MIIE、MIII、シアメノシドI、モグロシドIV、イソモグロシドIV、MIIIEおよびモグロシドV)の産生を包含する。
【0211】
本明細書に開示の組み換え細胞の何れかにより産生されたモグロール前駆体(例えば、スクアレン、2,3-オキシドスクアレンまたは24-25エポキシ-ククルビタジエノール)、モグロール、モグロシド(例えば、MIA1、MIE、MIIA1、MIIA2、MIIIA1、MIIE、MIII、シアメノシドI、モグロシドIV、イソモグロシドIV、MIIIEおよびモグロシドV)は、当分野で知られる何らかの方法を使用して同定および抽出され得る。マススペクトロメトリー(例えば、LC-MS、GC-MS)は、同定方法の非限定的例であり、目的の化合物の抽出の一助として使用し得る。
【0212】
本明細書において使用する表現および用語は、説明の目的であり、限定としてみなしてはならない。本明細書における「含む」、「包含する」、「有する」、「含有する」、「関与する」などの用語および/またはこれらのバリエーションは、その前に挙げられた項目ならびにさらなる項目を包含することを意味する。
【0213】
本発明を次の実施例によりさらに説明し、これは、決してさらなる限定と解釈されてはならない。本明細書をとおして引用する全引用文献(文献引用文献、登録特許、公開特許出願および同時係属特許出願)の内容全体は、引用により明示的に本明細書に包含させる。
【実施例0214】
実施例1. CDS酵素の同定および機能的特徴づけ
想定されるCDS酵素のライブラリーを設計した。ライブラリーは、CDSにより類似するよう修飾したいくつかのオキシドスクアレンシクラーゼ配列を含んだ。
ラカンカCDSを発現する対照株により産生される産物は、NMRによりククルビタジエノールとして同定され、この産物のヒドロキシル化により、モグロールが産生されることを確認した。想定されるCDS酵素を、2,3-オキシドスクアレンのククルビタジエノールへの環化を触媒する活性酵素を同定するために評価した。想定されるCDSライブラリーから計506構築物を、操作した出芽酵母スクリーニング株へのライブラリーの形質転換により試験した。出芽酵母スクリーニング株は、切断HMG1遺伝子;ERG10、ERG13、ERG9およびERG1遺伝子過発現;およびERG7遺伝子下方制御からなった。推定されるCDSをコードする遺伝子を、pESC-URAプラスミドで発現させ、4%ガラクトース含有SC-URAでの培養により発現を誘導した。ククルビタジエノールをGC-MSを使用して測定した。
40CDSがスクリーニングで活性を示すことが示された(表2)。これらCDSは、以前同定されなかったCDSおよび操作したCDSを含んだ。新たに発見された酵素のいくつかは、ラカンカからの以前に特徴づけられたCDS(配列番号73)を発現する対照株からのククルビタジエノールの産生と比較して、ククルビタジエノールの2倍以上の産生を示した。配列番号33は、配列番号73をコードするポリヌクレオチド配列の非限定的例である。
それ故に、2,3-オキシドスクアレンをククルビタジエノールに環化する種々の酵素が同定され、特徴づけされた。
【0215】
【0216】
同定された酵素はククルビタジエノールを産生すると結論付けられた。新たに発見された酵素により産生された産物のGC-MSスペクトルは、出芽酵母におけるラカンカCDSで産生されたククルビタジエノールに極めて類似した。この結果はGC-MS、LC-MSおよびNMRで確認した。これら酵素から製造されたククルビタジエノールは、ラカンカCDSから製造されたククルビタジエノールと同一の保持時間、イオン化パターンおよび質量および断片化パターンを有した。
【0217】
実施例2. 推定されるUGT酵素の同定および機能的特徴づけ
この実施例は、モグロールおよびモグロシド前駆体をグリコシル化モグロシドに変換できるUGTを同定するための、UGTライブラリーの設計およびスクリーニングを記載する。具体的に、ライブラリーは、種々のグルコース単位を有するモグロシドを産生するためにモグロールのC3およびC24ヒドロキシル基でグリコシル化するUGTを同定することを目的とした。計1,059の想定されるUGTを得た。
UGTライブラリーを試験するために、インビトロアッセイが開発された。UGTを担持するプラスミドを、出芽酵母CEN.PK ΔGAL80に形質転換した。UGTライブラリーを、計8基質モグロール、モグロシドI-A1、モグロシドI-E1、モグロシドII-A1、モグロシドII-E、モグロシドIII、モグロシドIII-A1およびモグロシドIII-Eを使用して、このアッセイでスクリーニングした。細胞ライセートを50μMの基質と30℃で24時間インキュベートし、その後反応停止させた。産物形成を、反応停止後、LC-MSで試験した。モグロールおよびモグロシド標品のLC-MSプロファイルを
図2に示す。
このスクリーニングに基づき、モグロシドI-A1およびシアメノシドIを含む既知モグロシド産物を産生するUGTを同定した(
図3A~3B)。このスクリーニングから同定された株を、次いでさらなるスクリーニングで試験した(
図4A~4B、表3)。
【0218】
【0219】
実施例3. UGTのさらなる特徴づけ
実施例2に記載のスクリーニングから同定した16のUGT中13を、大腸菌で組み換えにより発現させ、6xHisタグを使用して精製した。これら精製UGTのタンパク質濃度をブラッドフォードアッセイにより決定した。13のUGT比活性を、50μMの各基質とUGTを5分間、30℃でインキュベートすることにより決定した。反応停止させ、産物濃度をLC-MSにより定量した(
図4)。比活性を、産物濃度を酵素濃度および反応時間で除すことにより計算した。測定した比活性は、0.01~5.53mmol産物/(g UGT×時間)であり、平均1.14であった。
【0220】
実施例4. UGT94-289-1のタンパク質工学
出芽酵母株t85024(UGT94-289-1をコードする再コード化ポリヌクレオチドを発現)を得て、6-1&2-1グリコシル化反応を触媒させた。しかしながら、この酵素は、これら反応を高速で触媒しなかった。
各UGT配列がUGT94-289-1配列に比して単一アミノ酸置換を含むUGT配列のライブラリーを設計した。UGT配列のライブラリーを、6-1&2-1グリコシル化の活性増強について試験した。ライブラリーは893メンバーを含んだ。変異する位置を、触媒ダイアド(His
21/Asp
122)への近位(4.5オングストローム以内)に基づきまたは基質分子との予測相互作用に基づき、選択した。UGT94-289-1の相同性モデルを
図5に示す。
野生型酵素(UGT94-289-1)より活性が改善した218の変異がインビトロスクリーニングで同定された(表4)。変異UGT94-289-1遺伝子を担持するプラスミドを出芽酵母CEN.PK ΔGAL80に形質転換した。UGT変異ライブラリーを試験するために、実施例2のインビトロアッセイを実施した。計3基質 - モグロシドII-A1、モグロシドIIIおよびモグロシドII-E - を、このアッセイを使用してUGT変異ライブラリーで試験した。
これらグリコシル化工程の活性を増強する多数の変異が同定された(表4)。表4において、MIIA1はモグロシドII-A1を示し、MIIEはモグロシドII-Eを示し、MIIIA1はモグロシドIII-A1を示し、MIIIはモグロシドIIIを示し、MIIIEはモグロシドIII-Eを示し、SiamはシアメノシドIを示す。同定された変異含有UGTのサブセット(N143V、N143I、L374N、L374YおよびL374W)を大腸菌で発現させ、精製した。N143V、N143I&L374Nは、野生型タンパク質を超える、それぞれモグロシドII-A1からモグロシドIII-A1およびモグロシドIIIからシアメノシドIへの反応の比活性の4~8倍および12~16倍増強が判明した。L374YおよびL374Wは、モグロシドII-EからモグロシドIII-E反応の比活性を、それぞれ野生型の13倍および28倍増強した。これらの観察は、一般に出芽酵母スクリーニングにおける観察と合う(表4)。さらに、N143V変異が、野生型UGTまたは他の変異体では観察されなかった活性である、シアメノシドIからモグロシドVを産生することが観察された。
UGT94-289-1における構造モチーフの非限定的例および構造モチーフの配列を表5に示す。
【0221】
【表4-1】
【表4-2】
【表4-3】
【表4-4】
【表4-5】
【表4-6】
【表4-7】
【表4-8】
【表4-9】
【表4-10】
【表4-11】
【表4-12】
【表4-13】
【表4-14】
【表4-15】
【0222】
【0223】
実施例5. さらなるUGTの同定および特徴づけ
この実施例は、さらなるUGT酵素のUGT酵素のさらなる工学および同定を記載する。
UGTの工学は、タンパク質配列の循環置換を含んだ。代表的UGTであるUGT94-289-1の予測構造(
図5)は、N末端およびC末端が柔軟であり、ごく接近していることを示す(7~10A、
図6)。循環置換させるために、元のN末端およびC末端を互いに融合し、新規末端をタンパク質構造内の他の位置に導入した(
図7)。
2つのライブラリーをスクリーニングした。一方はUGTの循環置換バージョン配列を含んだ。他方はさらなる推定されるUGT配列を含んだ。スクリーニングに使用した出芽酵母株は、CDS、2個のEPH、変異体C11-ヒドロキシラーゼ融合タンパク質、2個のシトクロムP450レダクターゼ、上方制御SQE、2個の一次UGTおよび2個のトランスポーターノックアウトを含んだ。同じ株の2個の異なる生物学的反復をスクリーニングに使用した。生物学的反復はバックグラウンド1およびバックグラウンド2と称する。UGTをコードするプラスミドを、スクリーニング株に形質転換した。形質転換体を、前培養培地に接種し、接種培地の一定量を産生プレートにその後移した。
産生プレートのインキュベーション後、モグロシド産生をLX4多重化カラム配置のthermo QQQ TSQ-Quantiva ESIを使用して評価した。モグロール主鎖のグリコシル化のクラス(M、MI、MII、MIII、MIV、MV)の選択イオンモニタリング(SIM)の質量は次のとおりであった。それぞれ535.4g/mol(M)、697.47g/mol(MI)、799.51g/mol(MII)、961.56g/mol(MIII)、1123.61g/mol(MIV)および1285.68g/mol(MV)。MIは、1グルコース部分の産物を示し、MIIは2グルコース部分の産物を示し、MIIIは3グルコース部分の産物を示し、MIVは4グルコース部分の産物を示し、MVは5グルコース部分の産物を示す。MIおよびMIIは二次UGTの基質と考えられ、MIII、MIVおよびMVは二次UGTの産物と考えられた。これらの選択イオンモニタリング(SIM)強度を、次いで内部標準に対して正規化し、次のMIA1、MIIA1、MIIIA1、シアメノシドおよびMVのサロゲートについて校正した。UGT94-289-1 N143Iを陽性対照として使用した。陰性対照株は二次UGTを発現しなかった。
【0224】
各UGTを担持する株により産生されるMI、MII、MIII、MIVおよびMVのパーセンテージを、陽性対照株と比較した。MI、MII、MIII、MIVおよびMVの画分は、産生された産物の総量からの各タイプの量に対応する。
酵素を次の基準に基づきUGT活性を有する(ヒット)と指定した。循環置換UGTライブラリーについて、MIVの平均画分(各陽性対照株のMIV画分の2標準偏差)より多いMIVの画分(MIV画分)を生ずるならば、酵素をヒットと考えた。このカットオフを使用して、活性と兼ね合いがある折り畳みおよび安定性が改善した構造バリアントを同定した。生物学的反復の両者に陽性である構築物のみをヒットと考えた。表6は、MIVおよびMV画分のデータを示す。
推定されるUGTのライブラリーについて、陰性対照株の最大観察値を2標準偏差を超え、陽性対照株の平均より大きいならば、酵素を各産物(MIII、MIVおよびMVについてヒットと考えた。表7は、MIII、MIVおよびMV画分のデータを提供する。
【0225】
【0226】
【0227】
実施例6:UGTのさらなるタンパク質操作
この実施例は、UGT酵素のさらなる操作を記載する。UGT変異ライブラリーを、位置特異的スコアマトリックス(PSSM)およびエネルギー最小化プロトコール(Goldenzweig et al., Mol Cell. 2016 Jul 21;63(2):337-346)に基づき構築した。このアプローチで、UGTの近接ホモログをBLASTサーチにより決定した。これらのホモログをアラインし、位置特異的スコアマトリックス(PSSM)を多重配列アライメントから計算した(
図8)。
図8の53位および57位などの大きな配列可変性を特徴とする位置を、変異の位置として選択した。潜在的アミノ酸変化のプールを、PSSMにおいて観察されたものから選択した。例えば、52位を、PSSMにおいてその値でみられたアミノ酸である、L、I、MまたはVに変異させた(
図8)。変異体プールをさらに減少させるため、タンパク質安定性に対する全潜在的置換の影響を、ロゼッタを使用して評価した。ライブラリー構築のために使用した変異のプールは、高度に可変の位置で安定性の有意な増強をするPSSM内で観察される置換を含んだ(Goldenzweig et al., Mol Cell. 2016 Jul 21;63(2):337-346)。ライブラリーを、UGT活性を有する酵素の同定のためにスクリーニングする。
【0228】
実施例7:モグロール前駆体、モグロールまたはモグロシドを産生するための異種酵素の組み合わせの発現
本発明の組み換えタンパク質を組み合わせて使用して、モグロール前駆体(例えば、2-3-オキシドスクアレン、2,3,22,23-ジオキシドスクアレン、ククルビタジエノール、24,25-エポキシククルビタジエノール、24,25-ジヒドロキシククルビタジエノール)、モグロールまたはモグロシド(例えば、モグロシドI-A1(MIA1)、モグロシドI-E(MIE)、モグロシドII-A1(MIIA1)、モグロシドIII-A1(MIIIA1)、モグロシドII-E(MIIE)、モグロシドIII(MIII)、シアメノシドI、モグロシドIV、モグロシドIII-E(MIIIE)、モグロシドVおよびモグロシドVI)を産生する。
例えば、モグロールを産生するために、スクアレンエポキシダーゼ、CDS、エポキシドヒドロラーゼおよびシトクロムP450などの酵素をコードする遺伝子を、宿主細胞で発現させた。ある場合、シトクロムP450レダクターゼも酵母細胞で発現させる。適当なスクアレンエポキシダーゼ、エポキシドヒドロラーゼ、C11ヒドロキシラーゼおよびシトクロムP450レダクターゼの非限定的例は、下記表8に示す。CDSの非限定的例は表2に提供される。モグロールはLC-MSを使用して定量される。UGTはモグロシドを産生するために宿主細胞でさらに発現される。
あるいは、組み換えタンパク質を宿主細胞から精製し、モグロールを宿主細胞の外で産生する。組み換えタンパク質をスクアレンを含む反応緩衝液に逐次的にまたは同時に加える。
【0229】
【0230】
等価物
当業者は、本明細書に記載する特定の本発明の実施態様の多くの等価物を認識するかまたは、常套的なものを超えない試験を使用して、確認できる。このような等価物は次の特許請求の範囲に包含されることが意図される。
本明細書に開示される特許文献を含む全引用文献は、全体として、特に本明細書で引用される開示について引用により本明細書に包含される。