(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024096897
(43)【公開日】2024-07-17
(54)【発明の名称】標的RNAを編集する方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20240709BHJP
C12N 15/63 20060101ALI20240709BHJP
C12N 15/62 20060101ALI20240709BHJP
C07K 14/415 20060101ALI20240709BHJP
C07K 19/00 20060101ALI20240709BHJP
C12N 1/15 20060101ALI20240709BHJP
C12N 1/21 20060101ALI20240709BHJP
C12N 5/10 20060101ALI20240709BHJP
C12N 15/29 20060101ALI20240709BHJP
C12N 1/19 20060101ALI20240709BHJP
【FI】
C12N15/09 100
C12N15/63 Z ZNA
C12N15/62 Z
C07K14/415
C07K19/00
C12N1/15
C12N1/21
C12N5/10
C12N15/29
C12N1/19
【審査請求】有
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2024065910
(22)【出願日】2024-04-16
(62)【分割の表示】P 2022512682の分割
【原出願日】2021-03-31
(31)【優先権主張番号】P 2020065065
(32)【優先日】2020-03-31
(33)【優先権主張国・地域又は機関】JP
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和1(2019)年11月21日 ウェブサイト(https://doi.org/10.1016/j.molp.2019.11.002)を通じて発表 〔刊行物等〕 令和2(2020)年2月3日 Molecular Plant,Volume 13,Issue 2,p215-230,Elsevier Inc.において公開発表
(71)【出願人】
【識別番号】517163227
【氏名又は名称】エディットフォース株式会社
(74)【代理人】
【識別番号】110000109
【氏名又は名称】弁理士法人特許事務所サイクス
(72)【発明者】
【氏名】一瀬 瑞穂
(72)【発明者】
【氏名】グットマン ベルナルド
(72)【発明者】
【氏名】八木 祐介
(72)【発明者】
【氏名】赤岩 ゆみ
(72)【発明者】
【氏名】島尻 恭香
(72)【発明者】
【氏名】中村 崇裕
(57)【要約】 (修正有)
【課題】標的RNAに含まれる編集標的CをUに、又は編集標的UをCに変換する方法を提供する。
【解決手段】本研究において我々は、PPR-DYWタンパク質のC末端DYWドメインを含む部分がRNA編集のモジュラードメイン(modular editing domain)として利用可能であることを示す。本研究において設計した3種のDYWドメインをそれぞれPPR-P又はPLSアレイと融合させた場合、DYW:PG及びDYW:WWドメインはC-to-U、DYW:KPはU-to-CのRNA編集活性を示した。
【選択図】なし
【特許請求の範囲】
【請求項1】
下記に記載のDYWドメイン;
該DYWドメイン、及び少なくとも1個のPPRモチーフを含み、標的RNAに配列特異的に結合可能なRNA結合ドメインを含む、DYWタンパク質;又は
該DYWタンパク質であって、RNA結合ドメインが、PLS型である、DYWタンパク質
をコードする核酸。
下記a2、b1、c1、bc2、a3、及びbc3のいずれか一のポリペプチドからなるDYWドメイン:
a2. xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と78%を超える配列同一性を有し、かつC-to-U編集活性を有するポリペプチド
b1. xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と少なくとも40%の配列同一性を有し、かつC-to-U編集活性を有するポリペプチド
c1. KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつU-to-C編集活性を有するポリペプチド
bc2. xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:90の配列と少なくとも60%の配列同一性を有し、かつU-to-C編集活性を有するポリペプチド
a3. xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と少なくとも40%の配列同一性を有し、かつC-to-U編集活性を有するポリペプチド
bc3. xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:90の配列と少なくとも40%の配列同一性を有し、かつU-to-C編集活性を有するポリペプチド
(配列中、xは任意のアミノ酸を表し、…は任意のポリペプチド断片を表す。)
【請求項2】
請求項1に記載の核酸を含む、ベクター。
【請求項3】
請求項2に記載のベクターを含む、細胞(ヒト個体は除く。)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、標的RNAに結合可能なタンパク質を用いるRNA編集技術に関する。本発明は、医療(創薬支援、治療)、農業(農水畜産物生産、育種)、化学(生物学的物質生産)などの幅広い分野で有用である。
【背景技術】
【0002】
植物のミトコンドリア及び葉緑体ではゲノム中の特定の塩基がRNAレベルで置換されるRNA編集が頻繁に起こり、この現象にRNA結合タンパク質であるペンタトリコペプチドリピート(PPR)タンパク質が介在していることが知られている。
【0003】
PPRタンパク質は、このタンパク質を構成するPPRモチーフの構造によって、PとPLSの2つのファミリーに分類される(非特許文献1)。PクラスのPPRタンパク質が標準的な35アミノ酸のPPRモチーフ(P)の単純な繰り返しから構成されている一方、PLSタンパク質は、Pの他に、それに類似したL及びSと呼ばれる2つのモチーフを含んでいる。PLSタンパク質のPPRアレイ(PPRモチーフの並び)は、P1(約35アミノ酸)、L1(約35アミノ酸)、そしてS1(約31アミノ酸)の3つのPPRモチーフがP-L-Sの繰り返し単位として構成され、そのP1L1S1のC末端側に、少し配列の異なるP-L-S、すなわち、P2(35アミノ酸)、L2(36アミノ酸)、そしてS2(32アミノ酸)モチーフが続く。また、P-L-Sの繰り返し単位で構成されているものとは別に、SS(31アミノ酸)が繰り返している場合もある。さらにこの最後のP2L2S2モチーフのC末端側にE1及びE2と呼ばれる2つのPPR様モチーフ、そして136アミノ酸のシチジンデアミナーゼドメイン様配列を持つDYWドメインが続く場合がある(非特許文献2)。
【0004】
PPRタンパク質とRNAの相互作用は、各PPRモチーフ中の数カ所のアミノ酸の組み合わせによって結合RNA塩基を指定するPPRコードによって規定されており、これらのアミノ酸が水素結合を介して対応するヌクレオチドと結合する(特許文献1、特許文献2、非特許文献3、非特許文献4、非特許文献5、非特許文献6、非特許文献7、非特許文献8)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開WO2013/058404
【特許文献2】国際公開WO2014/175284
【非特許文献】
【0006】
【非特許文献1】Lurin, C., Andres, C., Aubourg, S., Bellaoui, M., Bitton, F., Bruyere, C., Caboche, M., Debast, C., Gualberto, J., Hoffmann, B., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16:2089-2103.
【非特許文献2】Cheng, S., Gutmann, B., Zhong, X., Ye, Y., Fisher, M. F., Bai, F., Castleden, I., Song, Y., Song, B., Huang, J., et al. (2016). Redefining the structural motifs that determine RNA binding and RNA editing by pentatricopeptide repeat proteins in land plants. Plant J. 85:532-547.
【非特許文献3】Barkan, A., Rojas, M., Fujii, S., Yap, A., Chong, Y. S., Bond, C. S., and Small, I. (2012). A combinatorial amino acid code for RNA recognition by pentatricopeptide repeat proteins. PLoS Genet. 8:e1002910.
【非特許文献4】Shen, C., Zhang, D., Guan, Z., Liu, Y., Yang, Z., Yang, Y., Wang, X., Wang, Q., Zhang, Q., Fan, S., et al. (2016). Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins. Nat. Commun. 7:11285.
【非特許文献5】Yagi, Y., Hayashi, S., Kobayashi, K., Hirayama, T., and Nakamura, T. (2013). Elucidation of the RNA recognition code for pentatricopeptide repeat proteins involved in organelle RNA editing in plants. PLoS One 8:e57286.
【非特許文献6】Kobayashi, T., Yagi, Y., and Nakamura, T. (2019). Comprehensive Prediction of Target RNA Editing Sites for PLS-Class PPR Proteins in Arabidopsis thaliana. Plant Cell Physiol. 60:862-874.
【非特許文献7】Yan, J., Yao, Y., Hong, S., Yang, Y., Shen, C., Zhang, Q., Zhang, D., Zou, T., and Yin, P. (2019). Delineation of pentatricopeptide repeat codes for target RNA prediction. Nucleic Acids Res. 47:3728-3738.
【非特許文献8】Takenaka, M., Zehrmann, A., Brennicke, A., and Graichen, K. (2013). Improved computational target site prediction for pentatricopeptide repeat RNA editing factors. PLoS One 8:e65343.
【非特許文献9】Knie, N., Grewe, F., Fischer, S., and Knoop, V. (2016). Reverse U-to-C editing exceeds C-to-U RNA editing in some ferns - a monilophyte-wide comparison of chloroplast and mitochondrial RNA editing suggests independent evolution of the two processes in both organelles. BMC Evol. Biol. 16:134.
【非特許文献10】Gerke, P., Szovenyi, P., Neubauer, A., Lenz, H., Gutmann, B., McDowell, R., Small, I., Schallenberg-Rudinger, M., and Knoop, V. (2020). Towards a plant model for enigmatic U-to-C RNA editing: the organelle genomes, transcriptomes, editomes and candidate RNA editing factors in the hornwort Anthoceros agrestis. New Phytologist 225: 1974-1992.
【非特許文献11】Gutmann B., Royan S., Schallenberg-Rudinger M., Lenz H., Castleden I.R., McDowell R., Vacher M.A., Tonti-Filippini J., Bond C.S., Knoop V., and Small I.D. (2020). The Expansion and Diversification of Pentatricopeptide Repeat RNA-Editing Factors in Plants. Molecular Plant 13:215-230
【非特許文献12】Oldenkott, B., Yang, Y., Lesch, E., Knoop, V., and Schallenberg-Rudinger, M. (2019). Plant-type pentatricopeptide repeat proteins with a DYW domain drive C-to-U RNA editing in Escherichia coli. Communications Biology 2:85.
【発明の概要】
【発明が解決しようとする課題】
【0007】
陸上植物のオルガネラにおいて、RNA塩基がシチジンからウリジンに置換されるC-to-U RNA編集が一般的に起こる。しかし、ツノゴケ類や、小葉類及びシダ植物の一部では、ウリジンがシチジンへ置換されるU-to-C RNA編集も見られる(非特許文献9)。2つの異なるバイオインフォマティクス研究から、U-to-C RNA編集を持つ植物において、標準的なDYWドメインと配列の異なるユニークなDYWドメインが発見された(非特許文献10、非特許文献11)。
【0008】
ヒメツリガネゴケ(Physcomitrella patens)由来の2種のDYW:PGタンパク質が、大腸菌内でCからUのRNA編集活性を示すことが報告された(非特許文献12)。陸上植物の進化の初期に分岐した植物群において、DYWドメインは大きく2つのグループに分類される。1つ目はDYW:PG/WWグループと呼ばれ、これには標準的なDYWドメインであるDYW:PG型及びPGボックスにトリプトファン(W)が1つ付加されたDYW:WW型が含まれる。2つ目のグループはDYW:KPと呼ばれ、このDYWドメインはPGボックスとC末端の3つのアミノ酸配列がPG/WWグループと異なる配列を持ち、さらにU-to-C RNA編集を持つ植物のみに存在する。任意のRNA配列内の1塩基を特定の塩基に変える技術は、遺伝子治療や、産業利用における遺伝子変異導入技術において有用である。これまでに、様々なRNA結合分子が開発されているが、DYWドメインと人工的なRNA結合タンパク質を用いることで、任意の標的RNAのシチジン(C)をウリジン(U)に、あるいはその逆方向であるウリジン(U)をシチジン(C)に変換する分子の設計方法は確立されていない。
【課題を解決するための手段】
【0009】
本研究において我々は、PPR-DYWタンパク質のC末端DYWドメインを含む部分がRNA編集のモジュラードメイン(modular editing domain)として利用可能であることを示す。本研究において設計した3種のDYWドメインをそれぞれPPR-P又はPLSアレイと融合させた場合、DYW:PG及びDYW:WWドメインはC-to-U、DYW:KPはU-to-CのRNA編集活性を示した。
【0010】
本発明は、以下を提供する。
[1] 下記a、b、c、及びbcのいずれか一のポリペプチドからなるDYWドメインを含む、人工DYWタンパク質を標的RNAに適用する、標的RNAを編集する方法。
a. xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
b. xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
c. KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
bc. xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:2の90の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
(配列中、xは任意のアミノ酸を表し、…は任意のポリペプチド断片を表す。)
[2] 下記a、b、c、及びbcのいずれか一のポリペプチドからなるDYWドメイン。
a. xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
b. xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
c. KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
bc. xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:2の90の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
[3] 少なくとも1個のPPRモチーフを含み、標的RNAに配列特異的に結合可能なRNA結合ドメイン、及び2に記載のDYWドメインを含む、DYWタンパク質。
[4] RNA結合ドメインが、PLS型である、2に記載のDYWタンパク質。
[5] 標的RNAを編集する方法であって、
下記c又はbcのポリペプチドからなるDYWドメインを標的RNAに適用して編集標的UをCに変換する工程を含む、方法。
c. KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
bc. xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:2の90の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
[6] DYWドメインが、少なくとも1個のPPRモチーフを含み、PPR-codeのルールにしたがって標的RNAに配列特異的に結合可能なRNA結合ドメインに融合されている、5に記載の方法。
[7] 真核細胞においてRNAを編集するための、2に記載のDYWドメインを含む、組成物。
[8] 2に記載のDYWドメイン、又は3又は4に記載のDYWタンパク質をコードする核酸。
[9] 8に記載の核酸を含む、ベクター。
[10] 9に記載のベクターを含む、細胞(ヒト個体は除く。)。
【0011】
[1] 下記a~cのいずれか一のポリペプチドからなるDYWドメインを含む、人工DYWタンパク質を標的RNAに適用する、標的RNAを編集する方法。
a. xa1PGxa2SWIExa3-xa16HP … HSE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
b. xb1PGxb2SWWTDxb3-xb16HP … HSE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
c. KPAxc1Axc2IExc3 … HAE … Cxc4xc5CH … Dxc6xc7を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
(配列中、xは任意のアミノ酸を表し、…は任意のポリペプチド断片を表す。)
[2] 下記a~cのいずれか一のポリペプチドからなるDYWドメイン。
a. xa1PGxa2SWIExa3-xa16HP … HSE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
b. xb1PGxb2SWWTDxb3-xb16HP … HSE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
c. KPAxc1Axc2IExc3 … HAE … Cxc4xc5CH … Dxc6xc7を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
[3] 少なくとも1個のPPRモチーフを含み、標的RNAに配列特異的に結合可能なRNA結合ドメイン、及び2に記載のDYWドメインを含む、DYWタンパク質。
[4] RNA結合ドメインが、PLS型である、2に記載のDYWタンパク質。
[5] 標的RNAを編集する方法であって、
下記cのポリペプチドからなるDYWドメインを標的RNAに適用して編集標的UをCに変換する工程を含む、方法。
c. KPAxc1Axc2IExc3 … HAE … Cxc4xc5CH … Dxc6xc7を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
[6] DYWドメインが、少なくとも1個のPPRモチーフを含み、PPR-codeのルールにしたがって標的RNAに配列特異的に結合可能なRNA結合ドメインに融合されている、5に記載の方法。
[7] 真核細胞においてRNAを編集するための、2に記載のDYWドメインを含む、組成物。
[8] 2に記載のDYWドメイン、又は3又は4に記載のDYWタンパク質をコードする核酸。
[9] 8に記載の核酸を含む、ベクター。
[10] 9に記載のベクターを含む、細胞(ヒト個体は除く。)。
【発明の効果】
【0012】
本発明により、標的RNAに含まれる編集標的CをUに、又は編集標的UをCに変換できる。
【図面の簡単な説明】
【0013】
【
図1】DYWタンパク質におけるC末端ドメインの近似的最尤系統樹。(a)DYW:PG型、(b)DYW:WW型及び(c)DYW:KP型ドメインの系統樹をFastTreeを用いて作成した。DYW:PGドメインは、小葉類由来のDYW:PGタンパク質に基づいて設計した。DYW:WW及びDYW:KPドメインを設計するために選んだタンパク質の系統群(クレード)を黒色の線で示している。系統樹はiTOL(Letunic, I. and Bork, P. (2016) Nucleic Acids Res. 44 W242-245)を使って可視化しており、赤はツノゴケ類、緑は小葉類、青はシダ植物由来のタンパク質を示している。
【
図2】本研究で設計したPPRタンパク質の構成。(a)PPRタンパク質は、N末端側にチオレドキシン、His-タグ及びTEV部位、それに続いて、P又はPLSモチーフからなるPPRアレイ、最後に、DYWドメイン(DYW:PG、DYW:WW又はDYW:KP)を含む。PPRタンパク質の標的配列(RNA編集部位を含む)は終止コドンの下流に挿入した。(b)P、P1、L1、S1及びP2モチーフ内のRNA認識に関わる4番目とii番目のアミノ酸。L2、S2、E1及びE2の4番目とii番目のアミノ酸はCLB19のものと同一である(Chateigner-Boutin, A.L., et al. (2008). Plant J. 56 590-602.)。
【
図3】大腸菌を使ったRNA編集アッセイ。(a)各PPR-DYWのDNA上における標的塩基(C又はT)。(b)PPR-DYW:PG及びWWのC-to-U RNA編集活性と(c)PPR-DYW:KPのU-to-C RNA編集活性を示す。3回独立して行った実験結果のうち1つを例として示している。(d)C-to-U及び(e)U-to-C RNA編集効率を3回測定した平均値(ただし、P-DYW:KPは2回)。エラーバーは標準偏差を示す。
【
図4-1】選抜した各DYWドメイン系統群におけるアミノ酸の出現頻度。WebLogoにより作成したシーケンスロゴで視覚化した。
図4-2及び
図4-3において同じ。(a)DYW:PG
【
図5】HEK293T細胞におけるRNA編集活性(C to U またはU to C)。PLS型にPG1もしくはWW1ドメイン(a)、またはKP1ドメイン(b)を融合したときの標的部位のシークエンシング結果。3回の独立した実験におけるRNA編集活性(c)。棒グラフは平均を示し、各点は3回の実験におけるRNA編集活性を示す。左の棒グラフは、C to U編集活性、右の棒グラフはU to C編集活性を示す。
【
図6】ドメインスワッピングによるKPドメイン性能の向上。KP1のActive site(HxEx
nCxxCH)を含む中央部分を残し、前後のドメインについてWW1ドメインとスワップしたChimeric KP1aのRNA編集活性について調べた。ドメインスワッピングの模式図(a)、実際のRNA編集活性(b, c)。
【
図7】KPドメイン変異体のRNA編集活性測定。KP1, KP2, KP3, KP4の大腸菌でのRNA編集活性(a)とHEK293TでのRNA編集活性(b)、KP5~KP23のHEK293TでのRNA編集活性(c)。
【
図8】PGドメイン変異体のRNA編集活性測定. PG1, PG2,の大腸菌でのRNA編集活性(a)とHEK293TでのRNA編集活性(b). PG3~PG13のHEK293TでのRNA編集活性
【
図9】WWドメイン変異体のRNA編集活性測定。WW1, WW2,の大腸菌でのRNA編集活性(a)とHEK293TでのRNA編集活性(b)。WW3~WW14のHEK293TでのRNA編集活性
【
図10】ヒトミトコンドリアRNA編集。標的配列情報(a)。RNA編集活性(b, c)
【発明を実施するための形態】
【0014】
本発明は、下記a、b、c、及びbcのいずれか一のポリペプチドからなるDYWドメインを含むDYWタンパク質を標的RNAに適用する、標的RNAを編集する方法に関する。
a. xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
b. xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
c. KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8を有し、配列番号:3の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
bc. xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:2の90の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチド
【0015】
本発明に関し、C-to-U/U-to-C編集活性とは、対象ポリペプチドを、標的RNAに配列特異的に結合可能なRNA結合ドメインのC末端側に連結して編集アッセイを行ったとき、標的RNAに含まれる編集標的CをUに、又は編集標的UをCに変換できる活性をいう。変換は、適切な条件において編集標的塩基の少なくとも約3%、好ましくは約5%が目的の塩基に置き換わっていればよい。
【0016】
[DYWドメイン]
xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYW、xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYW、及びKPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8は、いずれもアミノ酸配列を表す。配列中、xは、それぞれ独立に、任意のアミノ酸を表し、…は、それぞれ独立に、任意の長さの任意のアミノ酸配列からなるポリペプチド断片を表す。本発明に関し、DYWドメインは、これらの3つのアミノ酸配列のいずれか一つで表すことができる。特に、xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWからなるDYWドメインをDYW:PG、xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWからなるDYWドメインをDYW:WW、及びKPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8からなるDYWドメインをDYW:KPと表すことがある。
【0017】
DYWドメインは、N末端の約15アミノ酸からなるPGボックスを含む領域、中心部のzinc結合ドメイン(HxExnCxxCH、xnは任意のアミノ酸の任意の数n個の連なりである。)、及びC末端のDYWの3つの領域を有する。zinc結合ドメインはさらに、HxE領域とCxxCH領域に分けることができる。各DYWドメインのこれらの領域は、下表のように表すことができる。
【0018】
【0019】
(DYW:PG)
DYW:PGは、xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWからなるポリペプチドである。好ましくは、xa1PGxa2SWIExa3-xa16HP … HxaaE … Cxa17xa18CH … DYWを有し、配列番号:1の配列と配列同一性([用語]の項で詳述する)を有し、かつC-to-U/U-to-C編集活性を有するポリペプチドである。DYW:PGは、編集標的CをUに変換する活性(C-to-U編集活性)を有する。配列番号:1には、本明細書の実施例の項に示した実験で使用した、全長136アミノ酸長からなるDYW:PGの配列を示した。この配列は、本願が初めて開示するものであり、新規である。
【0020】
DYW:PGの全長は、C-to-U編集活性を発揮できる限り特に限定されないが、例えば110~160アミノ酸長であり、好ましくは124~148アミノ酸長であり、より好ましくは128~144アミノ酸長であり、さらに好ましくは132~140アミノ酸長である。
【0021】
DYW:PGのPGボックスを含む領域(xa1PGxa2SWIExa3-xa16HP)において:
xa1は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはE(グルタミン酸)又はそれに性質の似たアミノ酸であり、より好ましくはGである。
xa2は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはC(システイン)又はそれに性質の似たアミノ酸であり、より好ましくはCである。
xa3-xa16の各々のアミノ酸は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:1の配列の位置9~22の対応するアミノ酸と同じか、又は対応するアミノ酸と性質の似たアミノ酸であり、より好ましくは配列番号:1の配列の位置9~22の対応するアミノ酸と同じアミノ酸である。
【0022】
好ましい態様の一つにおいて、DYW:PGのHxE領域は、他の領域がどのような場合であってもHSEである。
【0023】
DYW:PGのCxxCH領域、すなわちCxa17xa18CHにおいて:
xa17は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはG(グリシン)又はそれに性質の似たアミノ酸であり、より好ましくはGである。
xa18は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはD(アスパラギン酸)又はそれに性質の似たアミノ酸であり、より好ましくはDである。
【0024】
DYW:PGにおいて、PGボックスを含む領域とHxaaEを結合する…部分、HxaaE領域とCxxCH領域を結合する…部分、及びCxxCH領域とDYWを連結する…部分を、順に、第一の連結部、第二の連結部、及び第三の連結部という(他のDYWドメインにおいても同じ。)。
【0025】
DYW:PGの第一の連結部の全長は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、例えば39~47アミノ酸長であり、好ましくは40~46アミノ酸長であり、より好ましくは41~45アミノ酸長であり、さらに好ましくは42~44アミノ酸長である。第一の連結部のアミノ酸配列は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:1の配列の位置25~67の部分と同じか、その部分配列において1~22個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0026】
DYW:PGの第一の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、43アミノ酸長の下式で表されるポリペプチドである。
【0027】
Na25-Na26-Na27- … -Na65-Na66-Na67
【0028】
上記ポリペプチドは、好ましくは配列番号:1の配列の位置25~67の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:PGとしてC-to-U編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
a29、N
a30、N
a32、N
a33、N
a35、N
a36、N
a40、N
a44、N
a45、N
a47、N
a48、N
a52、N
a53、N
a54、N
a55、N
a58、N
a61、N
a65、N
a67)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0029】
DYW:PGの第二の連結部の全長は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、例えば21~29アミノ酸長であり、好ましくは22~28アミノ酸長であり、より好ましくは23~27アミノ酸長であり、さらに好ましくは24~26アミノ酸長である。第二の連結部のアミノ酸配列は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:1の配列の位置71~95の部分と同じか、その部分配列において1~13個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0030】
DYW:PGの第二の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、25アミノ酸長の下式で表されるポリペプチドである。
【0031】
Na71-Na72-Na73- … -Na93-Na94-Na95
【0032】
上記ポリペプチドは、好ましくは配列番号:1の配列の位置71~95の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:PGとしてC-to-U編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
a71、N
a72、N
a73、N
a76、N
a77、N
a78、N
a79、N
a81、N
a82、N
a86、N
a88、N
a89、N
a91、N
a92、N
a93、N
a94)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0033】
DYW:PGの第三の連結部の全長は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、例えば29~37アミノ酸長であり、好ましくは30~36アミノ酸長であり、より好ましくは31~35アミノ酸長であり、さらに好ましくは32~34アミノ酸長である。第三の連結部のアミノ酸配列は、DYW:PGとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:1の配列の位置101~133の部分と同じか、その部分配列において1~17個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0034】
DYW:PGの第三の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、33アミノ酸長の下式で表されるポリペプチドである。
【0035】
Na101-Na102-Na103- … -Na131-Na132-Na133
【0036】
上記ポリペプチドは、好ましくは配列番号:1の配列の位置101~133の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:PGとしてC-to-U編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
a102、N
a104、N
a107、N
a112、N
a114、N
a117、N
a118、N
a121、N
a122、N
a123、N
a124、N
a125、N
a128、N
a130、N
a131、N
a132)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0037】
配列番号:1の配列からなるPGドメインに変異を導入することにより、RNA編集活性を向上することができる。このような変異を導入したドメインの好ましい例は、本明細書の実施例の項に示したPG11(配列番号:50のアミノ酸配列からなるポリペプチド)である。
【0038】
(DYW:WW)
DYW:WWは、xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWからなるポリペプチドである。好ましくは、xb1PGxb2SWWTDxb3-xb16HP … HxbbE … Cxb17xb18CH … DYWを有し、配列番号:2の配列と配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチドである。DYW:WWは、編集標的CをUに変換する活性(C-to-U編集活性)を有する。配列番号:2には、本明細書の実施例の項に示した実験で使用した、全長137アミノ酸長からなるDYW:WWの配列を示した。この配列は、本願が初めて開示するものであり、新規である。
【0039】
DYW:WWの全長は、C-to-U編集活性を発揮できる限り特に限定されないが、例えば110~160アミノ酸長であり、好ましくは125~149アミノ酸長であり、より好ましくは129~145アミノ酸長であり、さらに好ましくは133~141アミノ酸長である。
【0040】
DYW:WWのPGボックスを含む領域、すなわちxb1PGxb2SWWTDxb3-xb16HPにおいて、WTDからなる部分は、WSDであってもよい。
【0041】
DYW:WWのPGボックスを含む領域において:
xb1は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはK(リシン)又はそれに性質の似たアミノ酸であり、より好ましくはKである。
xb2は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはQ(グルタミン)又はそれに性質の似たアミノ酸であり、より好ましくはQである。
xb3-xb16の各々のアミノ酸は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:2の配列の位置10~23の対応するアミノ酸と同じか、又は対応するアミノ酸と性質の似たアミノ酸であり、より好ましくは配列番号:2の配列の位置10~23の対応するアミノ酸と同じアミノ酸である。
【0042】
好ましい態様の一つにおいて、DYW:WWのHxE領域は、他の部分の配列がどのような場合であっても、HSEである。
【0043】
DYW:WWのCxxCH領域、すなわちCxb17xb18CHにおいて:
xb17は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはD(アスパラギン酸)又はそれに性質の似たアミノ酸であり、より好ましくはDである。
xb18は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくはD又はそれに性質の似たアミノ酸であり、より好ましくはDである。
【0044】
DYW:WWの第一の連結部の全長は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、例えば39~47アミノ酸長であり、好ましくは40~46アミノ酸長であり、より好ましくは41~45アミノ酸長であり、さらに好ましくは42~44アミノ酸長である。第一の連結部のアミノ酸配列は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:2の配列の位置25~67の部分と同じか、その部分配列において1~22個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0045】
DYW:WWの第一の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、43アミノ酸長の下式で表されるポリペプチドである。
【0046】
Nb26-Nb27-Nb28- … -Nb66-Nb67-Nb68
【0047】
上記ポリペプチドは、好ましくは配列番号:2の配列の位置26~68の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:PGとしてC-to-U編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
b26、N
b30、N
b33、N
b34、N
b37、N
b41、N
b45、N
b46、N
b48、N
b49、N
b51、N
b52、N
b53、N
b55、N
b56、N
b57、N
b59、N
b61、N
b62、N
b63、N
b64、N
b66、N
b67、N
b68)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0048】
DYW:WWの第二の連結部の全長は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、例えば21~29アミノ酸長であり、好ましくは22~28アミノ酸長であり、より好ましくは23~27アミノ酸長であり、さらに好ましくは24~26アミノ酸長である。第二の連結部のアミノ酸配列は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:2の配列の位置71~95の部分と同じか、その部分配列において1~13個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0049】
DYW:WWの第二の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、25アミノ酸長の下式で表されるポリペプチドである。
【0050】
Nb72-Nb73-Nb74- … -Nb94-Nb95-Nb96
【0051】
上記ポリペプチドは、好ましくは配列番号:2の配列の位置72~96の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:WWとしてC-to-U編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
b72、N
b73、N
b74、N
b75、N
b77、N
b78、N
b79、N
b81、N
b82、N
b84、N
b88、N
b89、N
b90、N
b91、N
b92、N
b93、N
b94、N
b95、N
b96)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0052】
DYW:WWの第三の連結部の全長は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、例えば29~37アミノ酸長であり、好ましくは30~36アミノ酸長であり、より好ましくは31~35アミノ酸長であり、さらに好ましくは32~34アミノ酸長である。第三の連結部のアミノ酸配列は、DYW:WWとしてC-to-U編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:2の配列の位置101~133の部分と同じか、その部分配列において1~17個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0053】
DYW:WWの第三の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、33アミノ酸長の下式で表されるポリペプチドである。
【0054】
Nb102-Nb103-Nb104- … -Nb132-Nb133-Nb134
【0055】
上記ポリペプチドは、好ましくは配列番号:2の配列の位置102~134の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:WWとしてC-to-U編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
b104、N
b105、N
b107、N
b108、N
b109、N
b110、N
b111、N
b113、N
b115、N
b116、N
b117、N
b118、N
b119、N
b121、N
b122、N
b123、N
b124、N
b126、N
b129、N
b131、N
b132、N
b133 N
b134)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0056】
配列番号:2の配列からなるWWドメインに変異を導入することにより、RNA編集活性を向上することができる。このような変異を導入したドメインの好ましい例は、本明細書の実施例の項に示したWW2~11及びWW13であり、特に編集活性が高いのはWW11(配列番号:63のアミノ酸配列からなるポリペプチド)である。
【0057】
(DYW:KP)
DYW:KPは、KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8からなるポリペプチドである。好ましくは、KPAxc1Axc2IExc3 … HxccE … Cxc4xc5CH … xc6xc7xc8を有し、配列番号:3の配列と配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチドである。DYW:KPは、編集標的UをCに変換する活性(U-to-C編集活性)を有する。配列番号:3には、本明細書の実施例の項に示した実験で使用した、全長133アミノ酸長からなるDYW:KPの配列を示した。この配列は、本願が初めて開示するものであり、新規である。
【0058】
DYW:KPの全長は、U-to-C編集活性を発揮できる限り特に限定されないが、例えば110~160アミノ酸長であり、好ましくは121~145アミノ酸長であり、より好ましくは125~141アミノ酸長であり、さらに好ましくは129~137アミノ酸長である。
【0059】
DYW:KPのPGボックスを含む領域、すなわちKPAxc1Axc2IExc3において:
xc1は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはS(セリン)又はそれに性質の似たアミノ酸であり、より好ましくはSである。
xc2は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはL(ロイシン)又はそれに性質の似たアミノ酸であり、より好ましくはLである。
xc3は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはV(バリン)又はそれに性質の似たアミノ酸であり、より好ましくはVである。
【0060】
好ましい態様の一つにおいて、DYW:KPのHxE領域は、他の部分の配列がどのような場合であっても、HAEである。
【0061】
DYW:KPのCxxCH領域、すなわちCxc4xc5CHにおいて:
xc4は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはN(アスパラギン)又はそれに性質の似たアミノ酸であり、より好ましくはNである。
xb5は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはD(アスパラギン酸)又はそれに性質の似たアミノ酸であり、より好ましくはDである。
【0062】
DYW:KPのDYWに相当する部分、すなわちxc6xc7xc8において:
xc6は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはD(アスパラギン酸)又はそれに性質の似たアミノ酸であり、より好ましくはDである。
xc7は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはM(メチオニン)又はそれに性質の似たアミノ酸であり、より好ましくはMである。
xb8は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくはF(フェニルアラニン)又はそれに性質の似たアミノ酸であり、より好ましくはFである。
好ましい態様の一つにおいて、xc6xc7xc8は、他の部分の配列がどのような場合であっても、Dxc7xc8である。
別の好ましい態様の一つにおいて、xc6xc7xc8は、他の部分の配列がどのような場合であっても、GRPである。
【0063】
DYW:KPの第一の連結部の全長は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、例えば51~59アミノ酸長であり、好ましくは52~58アミノ酸長であり、より好ましくは53~57アミノ酸長であり、さらに好ましくは54~56アミノ酸長である。第一の連結部のアミノ酸配列は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:3の配列の位置10~64の部分と同じか、その部分配列において1~28個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0064】
DYW:KPの第一の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、55アミノ酸長の下式で表されるポリペプチドである。
【0065】
Nc10-Nc11-Nc12- … -Nc62-Nc63-Nc64
【0066】
上記ポリペプチドは、好ましくは配列番号:3の配列の位置10~64の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW: :KPとしてU-to-C編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
c10、N
c13、N
c14、N
c15、N
c16、N
c17、N
c18、N
c19、N
c25、N
c26、N
c29、N
c30、N
c33、N
c34、N
c36、N
c38、N
c41、N
c42、N
c44、N
c45、N
c47、N
49、N
c55、N
c58、N
c59、N
c62、N
c63、N
c64)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0067】
DYW:KPの第二の連結部の全長は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、例えば21~29アミノ酸長であり、好ましくは22~28アミノ酸長であり、より好ましくは23~27アミノ酸長であり、さらに好ましくは24~26アミノ酸長である。第二の連結部のアミノ酸配列は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:3の配列の位置68~92の部分と同じか、その部分配列において1~13個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0068】
DYW:KPの第二の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、25アミノ酸長の下式で表されるポリペプチドである。
【0069】
Nc68-Nc69-Nc70- … -Nc90-Nc91-Nc92
【0070】
上記ポリペプチドは、好ましくは配列番号:3の配列の位置68~92の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:KPとしてU-to-C編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
c68、N
c70、N
c71、N
c72、N
c73、N
c74、N
c75、N
c76、N
c77、N
c78、N
c79、N
c80、N
c81、N
c83、N
c84、N
c85、N
c86、N
c87、N
c88、N
c89、N
c90、N
c91、N
c92)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0071】
DYW:KPの第三の連結部の全長は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、例えば29~37アミノ酸長であり、好ましくは30~36アミノ酸長であり、より好ましくは31~35アミノ酸長であり、さらに好ましくは32~34アミノ酸長である。第三の連結部のアミノ酸配列は、DYW:KPとしてU-to-C編集活性を発揮できる限り特に限定されないが、好ましくは配列番号:3の配列の位置98~130の部分と同じか、その部分配列において1~17個のアミノ酸を置換、欠失、又は付加した配列か、又はその部分配列と配列同一性を有する配列であり、より好ましくは、その部分配列と同じ配列である。
【0072】
DYW:KPの第三の連結部の好ましい態様の一つは、DYWドメインの他の部分の配列がどのような場合であっても、33アミノ酸長の下式で表されるポリペプチドである。
【0073】
Nc98-Nc99-Nc100- … -Nc128-Nc129-Nc130
【0074】
上記ポリペプチドは、好ましくは配列番号:3の配列の位置98~130の部分と同じか、その部分配列において複数個のアミノ酸を置換した配列であってDYW:KPとしてU-to-C編集活性を発揮できるものである。このときアミノ酸の置換は、
図4の対応する位置においてbits値が大きいアミノ酸(例えば、N
c98、N
c100、N
c101、N
c103、N
c104、N
c105、N
c107、N
c109、N
c110、N
c111、N
c112、N
c114、N
c115、N
c117、N
c118、N
c119、N
c120、N
c121、N
c122、N
c123、N
c124、N
c125、N
c127、N
c129、N
c130)は
図4と同じであり、それ以外のアミノ酸が置換されるように行われていることが好ましい。
【0075】
配列番号:3の配列からなるKPドメインに変異を導入することにより、編集活性を向上することができる。このような変異を導入したドメインの好ましい例は、本明細書の実施例の項に示したKP2~23(配列番号:68~89)である。KP22(配列番号:88)が最もU to Cへの編集活性が高く、かつC to Uへの編集活性が低く、配列番号:3の配列からなるKPドメインと比較してRNA編集活性が改善されている。
【0076】
(Chimeric DYW)
DYWドメインは、アミノ酸配列の保存性からいくつかの領域に区分けすることができる。これらの各領域を交換したChimeric DYWにより、C-to-U編集活性又はU-to-C編集活性を向上しうる。好ましい態様の一つは、DYW:WWのPGボックスを含む領域、すなわちxb1PGxb2SWWTDxb3-xb16HPとDYWを、DYW:KPのその他の領域(… HxccE … Cxc4xc5CH …)に融合したものである。このときのxb1、xb2、xb3-xb16は、DYW:WWについての上記の説明のとおりである。また第一の連結部、第二の連結部、第三の連結部は、DYW:KPについての上記の説明のとおりである。DYW部分は、Dxbc1xbc2であってもよい。全長は、U-to-C編集活性を発揮できる限り特に限定されないが、例えば例えば110~160アミノ酸長であり、好ましくは125~149アミノ酸長であり、より好ましくは129~145アミノ酸長であり、さらに好ましくは133~141アミノ酸長である。
【0077】
好ましいChimericドメインの一つは、xb1PGxb2SWWTDxb3-xb16HP … HxccE … Cxc4xc5CH … Dxbc1xbc2を有し、配列番号:2の90の配列と少なくとも40%の配列同一性を有し、かつC-to-U/U-to-C編集活性を有するポリペプチドからなる。
【0078】
特に好ましいChimericドメインの一つは、配列番号:90の配列と配列同一性を有し、かつU-to-C編集活性を有するポリペプチドである。配列番号:90には、本明細書の実施例の項に示した実験で使用したChimericドメインの配列を示した。このドメインは、配列番号:3の配列からなるDYW:KPよりも高いU to C編集活性が認められ、さらにC to U編集活性がほとんどない。
【0079】
(公知の配列との比較)
前述のとおり、配列番号:1、2、3の配列からなるDYWドメインは新規なものである。以下に、PPRデータベース(https://ppr.plantenergy.uwa.edu.au/onekp/;前掲非特許文献11)を用いて調査した結果を示す。
【0080】
【0081】
したがって本発明はまた、下記d~iのいずれか一のポリペプチドを提供する:
d. 配列番号:1の配列と78%を超える配列同一性を有し、好ましくは80%以上、より好ましくは85%以上、さらに好ましくは90%の配列同一性を有し、さらに好ましくは95%の配列同一性を有し、、さらに好ましくは97%の配列同一性を有し、かつC-to-U編集活性を有するポリペプチド;
e. 配列番号:2の配列と84%を超える配列同一性を有し、好ましくは85%以上、より好ましくは90%以上、さらに好ましくは95%の配列同一性を有し、、さらに好ましくは97%の配列同一性を有し、かつC-to-U編集活性を有するポリペプチド;
f. 配列番号:3の配列と86%を超える配列同一性を有し、好ましくは87%以上、より好ましくは90%以上、さらに好ましくは95%の配列同一性を有し、さらに好ましくは97%の配列同一性を有し、かつU-to-C編集活性を有するポリペプチド。
g. 配列番号:1の配列において、1~29個、好ましくは1~25個、より好ましくは1~21個、さらに好ましくは1~17個、さらに好ましくは1~13個、さらに好ましくは1~9個、さらに好ましくは1~5個のアミノ酸を、のアミノ酸を、置換、欠失、又は付加した配列を有し、かつC-to-U編集活性を有するポリペプチド;
h. 配列番号:2の配列において、1~21個、好ましくは1~18個、より好ましくは1~15個、さらに好ましくは1~12個、さらに好ましくは1~9個、さらに好ましくは1~6個のアミノ酸を、置換、欠失、又は付加した配列を有し、かつC-to-U編集活性を有するポリペプチド;
i. 配列番号:3の配列において、1~18個、好ましくは1~16個、より好ましくは1~14個、さらに好ましくは1~12個、さらに好ましくは1~10個、さらに好ましくは1~8個のアミノ酸を、さらに好ましくは1~6個のアミノ酸を、置換、欠失、又は付加した配列を有し、かつU-to-C編集活性を有するポリペプチド。
【0082】
また、これらの配列のアライメントを下記に示す。アライメントはAliViewを用いて作成した(Larsson, A. (2014). AliView: a fast and lightweight alignment viewer and editor for large data sets. Bioinformatics30(22): 3276-3278. http://dx.doi.org/10.1093/bioinformatics/btu531)。なお、同一のアミノ酸はドットで表した。
【0083】
【0084】
[RNA結合ドメイン]
本発明においては、DYWドメインを用いて編集標的を変換する際に、編集標的が含まれるRNAを標的化するために、RNA結合タンパク質が、RNA結合ドメインとして使用される。
【0085】
RNA結合ドメインとして用いられるRNA結合タンパク質の好ましい例は、PPRモチーフにより構成されるPPRタンパク質である。
【0086】
(PPRモチーフ)
PPRモチーフは、特に記載した場合を除き、Web上のタンパク質ドメイン検索プログラムでアミノ酸配列を解析した際に、PfamにおいてPF01535、PrositeにおいてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PF01535とほぼ同義である一方で、PS51375のアミノ酸の場所から2引いた数(例;本発明の1番→PS51375の3番)に相当する。ただし、“ii”(-2)番のアミノ酸というときは、PPRモチーフを構成するアミノ酸の後ろ(C末端側)から2番目のアミノ酸、又は次のPPRモチーフの1番アミノ酸に対して2個N末端側、すなわち-2番目のアミノ酸とする。次のPPRモチーフが明確に同定されない場合、次のヘリックス構造の1番目のアミノ酸に対して、2個前のアミノ酸を“ii”とする。Pfamについてはhttp://pfam.sanger.ac.uk/、Prositeについては、http://www.expasy.org/prosite/を参照することができる。
【0087】
PPRモチーフの保存アミノ酸配列は、アミノ酸レベルでの保存性は低いが、2次構造上で2つのαへリックスはよく保存されている。典型的なPPRモチーフは35アミノ酸で構成されるが、その長さは30~38アミノ酸と可変的である。
【0088】
PPRモチーフは、より具体的には、式1で表される、30~38アミノ酸長のポリペプチドからなる。
【0089】
【0090】
式中:
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
【0091】
【0092】
式2中、A1~A12はそれぞれ独立にアミノ酸を表し;
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
【0093】
【0094】
式3中、各アミノ酸は、“i” (-1)、“ii”(-2)、とC末端側からナンバリングされ、
ただし、Liii~Lviiは存在しない場合がある。
【0095】
(PPR-code)
PPRモチーフは、1、4、ii番の3つのアミノ酸の組み合わせが、塩基との特異的な結合のために重要であり、これらの組み合わせにより、結合する塩基がいずれであるかを決定できる。1、4、ii番の3つのアミノ酸の組み合わせと結合可能な塩基との関係は、PPR-codeとして知られており(前掲特許文献2)、下記のとおりである。
【0096】
(1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン及びアスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに、その次にA又はGに対して結合するという、選択的なRNA塩基結合能を有する。
(2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに、その次にCに対して結合するが、Uには結合しないという、選択的なRNA塩基結合能を有する。
(3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にA又はUに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にUに、その次にAに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にUに対して結合するが、AとCには結合しないという、選択的なRNA塩基結合能を有する。
(7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、リジン、トレオニン、アスパラギン酸、の場合、そのPPRモチーフは、Gに強く結合し、次にAに対して結合するが、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にCに、その次にG及びUに対して結合するという、選択的なRNA塩基結合能を有する。
(9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸の場合PPR、そのモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合するが、A、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、ロイシン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
【0097】
(Pアレイ)
PPRタンパク質は、構成するPPRモチーフの構造によって、PとPLSの2つのファミリーに分類される。
P型のPPRタンパク質は、標準的な35アミノ酸のPPRモチーフ(P)の単純な繰り返し(Pアレイ)から構成されている。本発明のDYWドメインは、P型のPPRタンパク質に連結して用いることができる。
【0098】
(PLSアレイ)
PLS型のPPRタンパク質のPPRモチーフの並びは、P1、L1、そしてS1の3つのPPRモチーフの繰り返し単位として構成され、その繰り返しのC末端側に、P2、L2、そしてS2モチーフが続く。さらにこの最後のP2L2S2モチーフのC末端側にE1及びE2と呼ばれる2つのPPR様モチーフ、そしてDYWドメインが続く場合がある。
【0099】
P1の全長は、標的塩基に結合することができる限り特に限定されないが、例えば33~37アミノ酸長であり、好ましくは34~36アミノ酸長であり、より好ましくは35アミノ酸長である。L1の全長は、標的塩基に結合することができる限り特に限定されないが、例えば33~37アミノ酸長であり、好ましくは34~36アミノ酸長であり、より好ましくは35アミノ酸長である。S1の全長は、標的塩基に結合することができる限り特に限定されないが、例えば30~33アミノ酸長であり、好ましくは30~32アミノ酸長であり、より好ましくは31アミノ酸長である。
【0100】
P2の全長は、標的塩基に結合することができる限り特に限定されないが、例えば33~37アミノ酸長であり、好ましくは34~36アミノ酸長であり、より好ましくは35アミノ酸長である。L2の全長は、標的塩基に結合することができる限り特に限定されないが、例えば34~38アミノ酸長であり、好ましくは35~37アミノ酸長であり、より好ましくは36アミノ酸長である。S2の全長は、標的塩基に結合することができる限り特に限定されないが、例えば30~34アミノ酸長であり、好ましくは31~33アミノ酸長であり、より好ましくは32アミノ酸長である。配列番号:17、22、及び27には、本明細書の実施例の項で使用したP2の配列を示した。配列番号:18、23、及び28には、本明細書の実施例の項で使用したL2の配列を示した。配列番号:19、24、及び29には、本明細書の実施例の項で使用したS2の配列を示した。
【0101】
E1の全長は、標的塩基に結合することができる限り特に限定されないが、例えば32~36アミノ酸長であり、好ましくは33~35アミノ酸長であり、より好ましくは34アミノ酸長である。配列番号:20、25、30には本明細書の実施例の項で使用したE1の配列を示した。
【0102】
E2の全長は、標的塩基に結合することができる限り特に限定されないが、例えば30~34アミノ酸長であり、好ましくは31~33アミノ酸長であり、より好ましくは33アミノ酸長である。配列番号:21、26、31には本明細書の実施例の項で使用したE2の配列を示した。
【0103】
PLS型のPPRタンパク質において、P1L1S1の繰り返し部分とP2までの部分は、上述したPPR-codeのルールに従い、標的RNAの配列に応じて設計することができる。
【0104】
S2モチーフはiiのアミノ酸(配列番号19の31番目のN)が対応するヌクレオチドと相関がある(前掲非特許文献8)。また、S2モチーフの標的塩基の4つ右のC又はUが、DYWドメインによる編集標的塩基であることに留意してPLS型PPRタンパク質に組み込むことができる。
【0105】
E1モチーフでは、ヌクレオチドとの相関は4番目(配列番号:20の4番目のG)のアミノ酸にしか見られない(Ruwe et al. (2019)New Phytol. 222 218-229.)。
【0106】
E2モチーフ中の4番目(配列番号:21の4番目のV)及び最後(配列番号:21の33番目のK)のアミノ酸は高度に保存されており、特定のPPR-RNA認識には関与していない(前掲非特許文献2)。
【0107】
P1L1S1の繰り返し数は、標的塩基配列に結合することができる限り特に限定されないが、例えば1~5であり、好ましくは2~4であり、より好ましくは3である。原理的には1単位(3個)でも用い得る。PPRモチーフが5個から構成されるMEF8(L1-S1-P2-L2-S2-E-DYW)は約60箇所の編集に関わることが知られている。
【0108】
天然のPPRタンパク質では、最初と最後に位置するP1L1S1は、特定の位置にあるアミノ酸残基に明確な違いが見られ、内部のP1L1S1とは異なる。天然に存在するものになるべく近い人工PLSアレイを設計するとの観点からは、一番目(N末端側)に位置するP1L1S1、内部に位置するP1L1S1、そしてP2L2S2の直前に位置する最後(C末端側)のP1L1S1に分け、PPRモチーフの位置に応じた3種類のP1L1S1を設計するとよい。なお、天然にはP-L-Sの繰り返し単位で構成されているものとは別に、SS(31アミノ酸)が繰り返している場合もあり、このようなものも本発明に利用できる。
【0109】
[DYWタンパク質]
本発明は、少なくとも1個のPPRモチーフを含み、PPR-codeのルールにしたがって標的RNAに配列特異的に結合可能なRNA結合ドメイン、及び前述したDYW:PG、DYW:WW、又はDYW:KPのいずれか一であるDYWドメインを含む、標的RNAを編集するためのDYWタンパク質を提供する。
【0110】
このようなDYWタンパク質は、人工の物でありうる。人工とは、天然物ではなく、人為的に合成したものであることをいう。人工であることは、例えば、天然にはない配列のDYWドメインを有する場合、天然にはない配列のPPR結合ドメインを有する場合、RNA結合ドメインとDYWドメインとの天然にはない組み合わせを有する場合、動物細胞におけるRNA編集用のタンパク質が、植物由来の天然DYWタンパク質には存在しない部分、例えば、核移行シグナル、ヒトミトコンドリア移行シグナルがさらに付加されている場合が当てはまる。核移行シグナル配列としては、例えば、SV40ラージT抗原由来の、PKKKRKV(SEQ ID NO:32)、ヌクレオプラズミンのNLSである KRPAATKKAGQAKKKK(SEQ ID NO:33)などが挙げられる。
【0111】
PPRモチーフの数は、標的とするRNAの配列に応じて適宜とすることができる。PPRモチーフの数は、少なくとも1個あればよく、2個以上であってもよい。PPRモチーフが2個でRNAと結合できることが知られている(Nucleic Acids Research, 2012, Vol. 40, No. 6, 2712-2723)。
【0112】
DYWタンパク質の好ましい態様の一つは、下記のものである。
少なくとも1個、好ましくは2~25個、より好ましくは5~20個、さらに好ましくは10~18個のPPRモチーフを含み、PPR-codeのルールにしたがって標的RNAに配列特異的に結合可能なRNA結合ドメイン、及び前述したDYW:PG、DYW:WW、又はDYW:KPのいずれか一であるDYWドメインを含む、標的RNAを編集するための人工DYWタンパク質。
【0113】
他のDYWタンパク質の好ましい態様の一つは、下記のものである。
少なくとも1個、好ましくは2~25個、より好ましくは5~20個、さらに好ましくは10~18個のPPRモチーフを含み、PPR-codeのルールにしたがって動物の標的RNAに配列特異的に結合可能なRNA結合ドメイン(好ましくはPLS型のPPRタンパク質であるRNA結合ドメイン)、及び前述したDYW:PG、DYW:WW、又はDYW:KPのいずれか一であるDYWドメインを含む、標的RNAを編集するためのDYWタンパク質。
【0114】
本発明のDYWドメイン、RNA結合ドメインであるPPRタンパク質、及びDYWタンパク質は、当業者にはよく知られた方法で、比較的大量にも調製可能である。そのような方法は、目的のドメイン又はタンパク質が有するアミノ酸配列から、それをコードする核酸配列を決定し、クローニングし、目的のドメイン又はタンパク質を生産する形質転換体を作製することを含みうる。
【0115】
[DYWタンパク質の利用]
(DYWタンパク質等をコードする核酸、ベクター、細胞)
本発明は、上述の、PPRモチーフ、DYWタンパク質、又はDYWタンパク質をコードする核酸、核酸を含むベクター(例えば増幅のためのベクター、発現ベクター)も提供する。ベクターには、ウイルスベクターも含まれる。増幅のためのベクターは、大腸菌や酵母を宿主として用いうる。本明細書において、発現ベクターとは、例えば上流から、プロモーター配列を有するDNA、所望のタンパク質をコードするDNA、及びターミネーター配列を有するDNAを含むベクターを意味するが、所望の機能を発揮する限り、必ずしもこの順に配列されている必要はない。本発明においては、当業者が通常使用し得る様々なベクターを組み換えて使用することができる。
【0116】
具体的には、本発明は、少なくとも1個のPPRモチーフを含み、PPR-codeのルールにしたがって標的RNA(好ましくは動物の標的RNA)に配列特異的に結合可能なRNA結合ドメイン(好ましくはPLS型のPPRタンパク質であるRNA結合ドメイン)、及び前述したDYW:PG、DYW:WW、又はDYW:KPのいずれか一であるDYWドメインを含む、DYWタンパク質をコードするヌクレオチド配列を提供する。
【0117】
また具体的には、本発明は、少なくとも1個のPPRモチーフを含み、PPR-codeのルールにしたがって標的RNA(好ましくは動物の標的RNA)に配列特異的に結合可能なRNA結合ドメイン(好ましくはPLS型のPPRタンパク質であるRNA結合ドメイン)、及び前述したDYW:PG、DYW:WW、又はDYW:KPのいずれか一であるDYWドメインを含む、DYWタンパク質をコードするヌクレオチド配列を含む、標的RNAを編集するためのベクターを提供する。
【0118】
本発明のDYWタンパク質は、真核生物(例えば、動物、植物、微生物(酵母、等)、原生生物)の細胞で機能し得る。本発明のDYWタンパク質は、特に、動物細胞内(in vitro又はin vivo)で機能し得る。本発明のDYWタンパク質、又はDYWタンパク質を発現するベクターを導入し得る動物細胞としては、例えば、ヒト、サル、ブタ、ウシ、ウマ、イヌ、ネコ、マウス、ラット由来の細胞を挙げることができる。また、本発明のDYWタンパク質、又はDYWタンパク質を発現するベクターを導入し得る培養細胞としては、例えば、チャイニーズハムスター卵巣(CHO)細胞、COS-1細胞、COS-7細胞、VERO(ATCC CCL-81)細胞、BHK細胞、イヌ腎由来MDCK細胞、ハムスターAV-12-664細胞、HeLa細胞、WI38細胞、HEK293細胞、HEK293T細胞、PER.C6細胞を挙げることができるが、これらに限定されない。
【0119】
(用途)
本発明のDYWタンパク質により、標的RNAに含まれる編集標的CをUに、又は編集標的UをCに変換できる。RNA結合性のPPRタンパク質は、オルガネラで見られるすべてのRNA加工のステップ、切断、RNA編集、翻訳、スプライシング、RNA安定化に関与している。
【0120】
また本発明のDYWタンパク質により、ミトコンドリアのRNA1塩基編集ができる。ミトコンドリアは、独自のゲノムを有しており、呼吸やATP生産に関わる重要な複合体の構成タンパク質がコードされている。それらの変異により様々な病気が発症することが知られている。本発明を用いた変異修復により、さまざまな病気の処置が期待できる。
【0121】
一方でCRISPR-Casシステムは、Casタンパク質を改変したADARドメインに融合させることで、細胞質におけるC-to-U RNA編集ツールとして開発されている(Abudayyeh et al.、2019年)。しかしながら、CRISPR-Casシステムはタンパク質とガイドRNAで構成されており、ガイドRNAの効率的なミトコンドリア輸送が難しい。一方で、PPRタンパク質は1分子でRNA編集が可能であり、一般的にタンパク質はN末側にミトコンドリア局在シグナル配列を融合することでミトコンドリアへの送達が可能である。そこで、本技術がミトコンドリアのRNA編集に利用できるかどうかを確認するために、MT-ND2とMT-ND5を標的するPPRをデザインし、PGまたはWWドメインを融合した遺伝子を作成した(
図10a)。
【0122】
ミトコンドリア標的配列(MTS)とPPR-P配列からなるこれらのタンパク質は、HEK293T細胞に悪影響を与えないように、MT-ND2とMT-ND5の178番目と301番目のコドンの3番目の位置を標的としている(
図10a)。HEK293T細胞へプラスミドで導入後、MT-ND2とMT-ND5のmRNA内で編集を確認した(
図10b,c)。これらの4つのタンパク質は、ターゲットに対して最高70%の編集活性が検出され、同じmRNA分子に対してオフターゲット変異は検出されなかった(
図10bc)。
【0123】
したがって、本発明により提供されるRNA塩基の編集方法は、様々な分野で、以下のような利用が期待できる。
【0124】
(1)医療
・特定の疾患に関連した特定のRNAを認識し、編集する。本発明の利用により、1塩基変異による遺伝病を処置しうる。遺伝病における多くの変異の方向はCからUへの変異である。そのため、特にUをCに変換できる本発明の方法は有用でありうる。
【0125】
・RNAの抑制・発現をコントロールした細胞を作製する。このような細胞には、分化・未分化状態をモニタリングした幹細胞(例えば、iPS細胞)、化粧品の評価用モデル細胞、創薬のメカニズム解明や薬理試験を目的として、機能性RNAの発現をON/OFFできる細胞が含まれる。
【0126】
(2)農林水産業
・農作物、林産物、水産物などにおいて、収量や品質を改善する。
・耐病性の向上、環境耐性の向上、向上された又は新たな機能性を有した生物を育種する。
【0127】
例えば、雑種第一代(F1)作物に関し、DYWタンパク質によるミトコンドリアRNAの編集により人工的にF1作物を作出し、収率や品質を改善できる可能性がある。DYWタンパク質によるRNA編集は、従来技術よりも正確かつ迅速に、生物の品種改良、育種(生物を遺伝的に改良すること)が可能である。また、DYWタンパク質によるRNA編集は、遺伝子組み換えのように外来遺伝子により形質を転換するものではないため、変異体の選抜や戻し交雑という旧来の育種の手法に近いといえる。そのため、地球規模腕の食糧問題、環境問題にも、確実かつ迅速に対応しうる。
【0128】
(3)化学
・微生物、培養細胞、植物体、動物体(例えば昆虫体)を利用した有用物質生産において、RNAの操作により、タンパク発現量を制御する。これにより、有用物質の生産性を向上することができる。有用物質の例は、抗体、ワクチン、酵素等のタンパク質性の物質のほか、医薬品の中間体、香料、色素等の比較的低分子の化合物である。
【0129】
・藻類や微生物の代謝経路の改変により、バイオ燃料の産生効率を改善する。
【0130】
[用語]
数値範囲x~yは、特に記載した場合を除き、両端の値x及びyを含む。
【0131】
タンパク質やポリペプチドのアミノ酸配列に関し、アミノ酸残基を、単に、アミノ酸ということがある。
【0132】
塩基配列(ヌクレオチド配列ということもある。)又はアミノ酸配列に関し「同一性」とは、特に記載した場合を除き、2つの配列を最適の態様で整列させた場合に、2つの配列間で共有する一致した塩基又はアミノ酸の個数の百分率を意味する。すなわち、同一性=(一致した位置の数/位置の全数)×100で算出でき、市販されているアルゴリズムを用いて計算することができる。また、このようなアルゴリズムは、Altschul et al., J.Mol.Biol. 215(1990) 403-410に記載されるNBLAST及びXBLASTプログラム中に組込まれている。より詳細には、塩基配列又はアミノ酸配列の同一性に関する検索・解析は、当業者には周知のアルゴリズム又はプログラム(例えば、BLASTN、BLASTP、BLASTX、ClustalW)により行うことができる。プログラムを用いる場合のパラメーターは、当業者であれば適切に設定することができ、また各プログラムのデフォルトパラメーターを用いてもよい。これらの解析方法の具体的な手法もまた、当業者には周知である。
【0133】
塩基配列又はアミノ酸配列に関し、配列同一性は、特に記載した場合を除き、高い方が好ましい。具体的には、40%以上であることが好ましく、45%以上であることがより好ましく、50%以上であることがさらに好ましく、55%以上であることがさらに好ましく、60%以上であることがさらに好ましく、65%以上であることがさらに好ましい。また、70%以上であることが好ましく、80%以上であることがより好ましく、85%以上であることがさらに好ましく、90%以上であることがさらに好ましく、95%以上であることがさらに好ましく、97.5%以上であることがさらに好ましい。
【0134】
ポリぺプチド又はタンパク質に関し、「置換、欠失、又は付加した配列」というときの置換等されるアミノ酸の個数は、特に記載した場合を除き、いずれのモチーフ又はタンパク質においても、そのアミノ酸配列からなるモチーフ又はタンパク質が所望の機能を有する限り特に限定されないが、1~9個又は1~4個程度であるか、性質の似たアミノ酸への置換であれば、さらに多くの個数の置換等がありうる。このようなアミノ酸配列に係るポリヌクレオチド又はタンパク質を調製するための手段は、当業者にはよく知られている。
【0135】
性質の似たアミノ酸とは、ハイドロパシー、荷電、pKa、溶解性等の物性が似ているアミノ酸をいい、例えば、次のようなものを指す。
疎水性(非極性)アミノ酸;アラニン、バリン、グリシン、イソロイシン、ロイシン、フェニルアラニン、プロリン、トリプトファン、チロシン
非疎水性アミノ酸;アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、トレオニン、システイン、ヒスチジン、メチオニン;
親水性アミノ酸;アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、トレオニン;
酸性アミノ酸:アスパラギン酸、グルタミン酸;
塩基性アミノ酸:リジン、アルギニン、ヒスチジン;
中性アミノ酸:アラニン、アスパラギン、システイン、グルタミン、グリシン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン;
含硫アミノ酸:メチオニン、システイン;
含芳香環アミノ酸:チロシン、トリプトファン、フェニルアラニン。
【実施例0136】
[1. DYWドメインの設計と大腸菌内でのRNA編集活性測定]
[結果]
(DYWドメインの設計)
現在利用可能な植物のゲノム情報のほとんどが被子植物のものであるため、人工DYWタンパク質の開発はDYW:PG型に限定される。一方、トランスクリプトームデータは部分配列であるものの、C-to-U及びU-to-C RNA編集の両方を持つ初期の陸上植物種の情報も含まれる。そこで我々は、1000 Plants(1KP)国際コンソーシアムによって作成されたトランスクリプトームデータセットに基づいて構築されたPPRタンパク質のデータベース(前掲非特許文献11)を用い、完全な人工DYWドメインを設計した。
【0137】
人工DYWドメインを設計するにあたり、シチジンデアミナーゼ様DYWドメインに加えて、PPR(P2及びL2)モチーフ並びにPPR様(S2、E1及びE2)モチーフを設計に加えた。これは、これらのモチーフがRNA編集活性に与える重要性が現時点で分かっていないためである。我々は、ツノゴケ類、小葉類及びシダ植物のDYWドメインの系統樹を作成し、DYW:PG、DYW:WW及びDYW:KPの3つのグループに分類した。次いで、これらグループごとのDYWドメインについて新たに系統樹を作成し、人工DYWドメインの設計に利用可能なタンパク質の系統群を選抜した(
図1)。DYW:PGグループは配列間の差が大きかったため、設計に用いるタンパク質の系統群を選択するのが困難であった(
図1a)。小葉類のタンパク質の配列が多様性に富み、数も多かったため、我々はこのタンパク質に焦点を当てることとした(PG1)。DYW:WWドメインの設計には、ツノゴケ類にのみ見られる分枝が短いタンパク質の系統群を選択した(
図1b、WW1)。この系統群は分枝が短いことからタンパク質間の遺伝子の変異が小さいことが推定される。そしてDYW:KPドメインの設計には、シダ植物に特異的なDYWドメインの系統群に着目した。この系統群に含まれるタンパク質の配列は、アミノ酸の変異は大きいが、長さは保存されている(
図1c、KP1)。
【0138】
(RNA結合ドメインの設計)
我々は、各DYWドメインを、植物のゲノム情報から同定されたPPRモチーフ配列(前掲非特許文献2)に基づいて設計した人工P又はPLSアレイと融合させた(
図2a)。PアレイのPPRモチーフは、35アミノ酸のPモチーフのアライメントから得られた共通配列に基づいて構築し、RNA認識を高めるためにいくつかのアミノ酸を置き換えたものである。PLSアレイの設計には、標準的な長さの35アミノ酸のモチーフ(P1及びL1)と31アミノ酸のモチーフ(S1)を選んだ。天然のPPRタンパク質では、最初と最後に位置するP1L1S1は、特定の位置にあるアミノ酸残基に明確な違いが見られ、内部のP1L1S1とは異なる。天然に存在するものになるべく近い人工PLSアレイを設計するために、一番目(N末端側)に位置するP1L1S1、内部に位置するP1L1S1、そしてP2L2S2の直前に位置する最後(C末端側)のP1L1S1に分け、PPRモチーフの位置に応じた3種類のP1L1S1を設計した。今後、これらのタンパク質をその構造に基づいて命名する。例えば、PアレイにDYW:WWドメインを融合させたものは、P-DYW:WWとする。
【0139】
(人工DYWタンパク質は、標的配列を特異的に編集可能である)
シロイヌナズナにおいて、PPRタンパク質CLB19は葉緑体rpoA及びclpP RNA上にあるRNA編集部位を認識する。我々は、rpoA編集部位を標的とするPPRタンパク質を設計することにした。P1、L1、S1及びP2モチーフにおける4番目とii番目のアミノ酸はPPRコードに従った。一方、C末端PPR様モチーフ(L2、S2、E1、E2)に関するPPRコードは分かっていないため、L2、S2、E1及びE2モチーフに関しては、CLB19の4番目とii番目のアミノ酸を使用した(
図2b)。
【0140】
組換え人工DYWタンパク質をコードしている遺伝子領域を発現ベクターにクローニングし、その終止コドンの下流に標的配列を付加した。過去に行われたヒメツリガネゴケの2種類のPPRタンパク質(PPR56、PPR65)に関する研究に基づき(前掲非特許文献12)、設計したPPRタンパク質のRNA編集活性を大腸菌内で試験する方法を開発した。設計したPLS-DYW:PG1及びPLS-DYW:WW1はDNAに対して編集活性が見られなかった一方、RNAに対して90%を上回る編集効率でシチジンをウリジンに置換した(
図3a、b、d)。PLSドメインの代わりにPアレイを用いた場合、編集効率が10~40%低下した。一方で、P-DYW:KP及びPLS-DYW:KPの両方でU-to-C RNA編集活性が見られた(
図3c、e)。しかしながら、その編集活性はDYW:PG及びDYW:WWと比較して下がっている。
【0141】
[方法]
(系統樹)
DYWドメイン(最短132アミノ酸)を含むP2-L2-S2-E1-E2-DYW領域を、PPRデータベース(https://ppr.plantenergy.uwa.edu.au/onekp/;前掲非特許文献11)から抽出した。得られた配列のアライメントをMAFFT L-INS-i(v7.407 automatic mode)(K. Katoh, D. M. Standley (2013). Mol Biol Evol. 30(4): 772-780.)を使って作成し、その後、trimAl(v.1.4.rev15)(Salvador Capella-Gutierrez, et al. (2009). Bioinformatics. 25(15): 1972-1973.)を用いてトリミングした。トリミングではパラメーターをgt 0.2 cons 20とした。活性部位(HxEx
nCxxCH)に変異を持つ配列はアライメントから除いた(
図4)。
【0142】
残りの配列から、FastTree(v2.1.10)(Price, M. N., et al. (2010). PLoS One 5:e9490.)を使用して系統樹を作成し、DYW:PG、DYW:WW及びDYW:KPを同定した。このときのパラメーターはwag及びcat 8とした。
【0143】
(Trx-PPR-DYWタンパク質及び標的配列のクローニング)
各DYWドメイン(P2、L2、S2、E1、E2を含む)の共通配列をEMBOSS:cons(v.6.6.0.0)を使って設計した。タンパク質発現用ベクターはpET21b+PAを改変して、元のEsp3IとBpiI制限酵素部位を除去し、クローニングサイトとして2つのEsp3I部位を付加した。遺伝子は4つのセクション(Trx、PPRアレイ、DYWドメイン及びRNA編集部位)に分けて、2段階のGolden Gate法を使って構築した。初めに、改変pET21bベクターのEsp3I部位に、1)チオレドキシン-6×His-TEV遺伝子領域(3’にBpiI制限酵素部位を含む)、2)P2-L2-S2-E1-E2-DYW遺伝子領域(5’にBpiI制限酵素部位を含む)、及び3)RNA編集部位のコード配列領域、の3部分をクローニングした。次いで、BpiI部位に完全長PLSドメイン又はPドメインをクローニングし、PLS:DYW(配列番号:35~37)又はP:DYW(配列番号:38~40)タンパク質を作製した。
【0144】
(大腸菌内でのRNA編集活性測定)
組換えタンパク質のRNA編集活性を大腸菌内で分析するために、我々は、Oldenkottらによって開発されたプロトコール(前掲非特許文献12)を改変した。上記で作成したプラスミドDNAを大腸菌Rosetta 2株に導入し、1mLのLB培地(カルベニシリン50μg/mL及びクロラムフェニコール17μg/mL含有)で37℃、一晩培養した。5mLの適切な抗生物質を含むLB培地を深底24ウェルプレートに準備し、前培養液100μLをここに播種した。この培養液を、吸光度(OD600)が0.4~0.6に達するまで、37℃、200rpmで生育させた後、プレートを4℃で10~15分間冷却した。次いで、0.4mMのZnSO4と0.4mMのIPTGを加え、さらに16℃、180rpmで18時間培養した。培養液750μLを採取して遠心分離した後、菌体ペレットを液体窒素中で凍結させ、-80℃で保存した。
【0145】
凍結した細胞塊を200μLの1-チオグリセロール/ホモジナイズ溶液に再懸濁し、40Wで10秒間、超音波処理して細胞を分離した後、200μLの溶解バッファーを加えた。Maxwell(登録商標) RSC simplyRNA Tissue Kit(プロメガ)を使いRNAを抽出した。RNAをDNaseI(タカラバイオ)で処理し、SuperScript(登録商標)III Reverse Transcriptase(インビトロジェン)を使い、処理したRNA 1μgと1.25μMのランダムプライマー(6 mer)を用いてcDNAを合成した。NEBNext High-Fidelity 2x PCR Master Mix(ニューイングランドバイオラボ)、1μLのcDNA及び、チオレドキシンとT7ターミネーター配列のプライマーを使って編集部位を含む領域を増幅した。NucleoSpin(登録商標)Gel and PCR Cleanup(タカラバイオ)でPCR産物を精製し、DYWドメイン配列に特異的なフォワードプライマーを用いてシークエンス解析を行い、RNA編集部位の塩基を決定した。RNA編集効率の測定には、編集部位のCとUの波形ピークの高さの比を用い、C-to-U RNA編集効率はU/(C+U)×100、U-to-C編集効率はC/(C+U)×100によって算出した。独立した実験を3回繰り返した。
【0146】
[引用した配列の一覧]
【0147】
【0148】
【0149】
【0150】
[2. 動物培養細胞での実施例]
[結果]
PLS型PPRと各DYWドメイン(PG1(配列番号:1), WW1(配列番号:2), KP1(配列番号:3))を融合した遺伝子と、標的配列を含むプラスミドをHEK293T細胞にトランスフェクションし、培養後RNAを回収した。標的部位のシチジン(C)からウリジン(U)、またはウリジン(U)からシチジン(C)への変換効率をサンガーシーケンシングにより解析した(
図5)。PG1またはWW1ドメインを融合した場合、90%以上のC to U活性があり、一方でU to C活性は検出されなかった(
図5a, c)。KP1ドメインを融合した場合、U to C活性が25%検出されたが、C to U活性も10%程度検出された(
図5b, c)。これらのことから、動物培養細胞においても編集酵素が機能することが分かった。
【0151】
[方法]
(動物培養細胞試験用PPR発現プラスミドの作成)
図3で使用したプラスミドから、6xHis-PPR-DYWタンパク質(大腸菌での実験に用いたものと同じタンパク質(配列番号:35~37))遺伝子配列と編集サイトを含む領域( 配列番号:34)をPCRで増幅し、Golden Gate Assembly法により動物細胞発現ベクターへクローニングした。ベクターは、CMVプロモーターとヒトβ-グロビンキメライントロンを含むプロモーター制御化でPPRが発現し、SV40 polyadenylation signal によってpoly Aシグナルが付与される。
【0152】
(HEK293T細胞培養)
HEK293T細胞は、高グルコース、グルタミン、フェノール-RED、ピルビン酸ナトリウム(富士フイルム和光純薬株式会社)を含むDulbecco's Modified Eagle Medium (DMEM)培地に10%牛胎児血清(カプリコム)と1% ペニシリン-ストレプトマイシン(富士フイルム和光純薬株式会社)を加えたものを用い、37℃、5% CO2で培養した。細胞は80-90%コンフルエントになった時点で2-3日ごとに継代した。
【0153】
(トランスフェクション)
RNA編集アッセイでは,24ウェル平底細胞培養プレートの各ウェルにHEK293T細胞を約8.0 x104個入れ,37℃,5% CO2で24時間培養した。各ウェルに500 ngのプラスミドを18.5 μlのOpti-MEM(登録商標) I Reduced Serum Medium (ThermoFisher)と1.5 μlのFuGENE(登録商標) HD Transfection Reagent (Promega)を加え、最終的に25 μlの容量とした。混合液は、細胞に添加する前に、室温で10分間インキュベートした。トランスフェクションの24時間後に細胞を回収した。
【0154】
(RNA抽出、逆転写、シークエンシング)
上述の大腸菌でのアッセイと同様に行った。なお、以下の実施例では、特に記載した場合を除き、大腸菌でのアッセイおよび本実施例と同様の方法で実験を行った。
【0155】
[3. ドメインスワップによるRNA編集活性への影響]
DYWドメインは、アミノ酸配列の保存性からいくつかの領域に区分けすることができるが、これらのRNA編集活性との関連性は分かっていない。ここでは、KP1 とWW1ドメインの一部をスワップし、HEK239T細胞中で、RNA編集活性への影響を調べた(
図6)。WW1ドメインのPG boxとDYWをKP1ドメインのActive siteを含む中央部位に融合したもの(chimKP1a 配列番号:90)において、KP1ドメインよりも高い50% 近いU to C活性が認められ、さらにC to U活性がほとんどなくなることが分かった。ドメインスワッピングにより、KPドメインの U to C編集の性能を改善することに成功した。
【0156】
[4. 変異導入によるKPドメインのRNA編集活性の改善]
KPドメインに様々な変異を導入し、KPドメインのRNA編集活性の向上を目指した。KP2~KP23(配列番号:68~89)をデザインし、C to U または U to CのRNA編集活性を、大腸菌(
図7a)及びHEK293T細胞(
図7b、c)で調べた。KP22(配列番号:88)が最もU to Cへの編集活性が高く、C to Uへの編集活性が低く、KP1と比較してRNA編集活性を改善することに成功した。
【0157】
[5. 変異導入によるPGドメインのRNA編集活性の改善]
PGドメインに様々な変異を導入し、PGドメインのRNA編集活性の向上を目指した。PG2~PG13(配列番号:41~53)をデザインし、C to U のRNA編集活性を大腸菌(
図8a)及びHEK293T細胞(
図8b、c)で調べた。PG11(配列番号:50)が最もC to Uへの編集活性が高く、RNA編集活性を改善することに成功した。
【0158】
[6. 変異導入によるWWドメインのRNA編集活性の改善]
WWドメインに様々な変異を導入し、WWドメインのRNA編集活性の向上を目指した。WW2~WW14をデザインし、C to U のRNA編集活性を大腸菌(
図9a)及びHEK293T細胞(
図9b、c)で調べた。WW11(配列番号:63)が最もC to Uへの編集活性が高く、WW1と比較してRNA編集活性を改善することに成功した。
【0159】
[7. PPRタンパク質を用いたヒトミトコンドリアRNA編集]
[結果]
ミトコンドリアは、独自のゲノムを有しており、呼吸やATP生産に関わる重要な複合体の構成タンパク質がコードされている。それらの変異により様々な病気が発症することが知られており、変異修復方法が求められている。
【0160】
CRISPR-Casシステムは、Casタンパク質に改変したADARドメインに融合させることで、細胞質におけるC-to-U RNA編集ツールとして開発されている(Abudayyeh et al. 2019 Science Vol.365, Issue 6451, pp.382-386)。しかしながら、CRISPR-Casシステムはタンパク質とガイドRNAで構成されており、ガイドRNAの効率的なミトコンドリア輸送が難しい。一方で、PPRタンパク質は1分子でRNA編集が可能であり、一般的にタンパク質はN末側にミトコンドリア局在シグナル配列を融合することでミトコンドリアへの送達が可能である。そこで、本技術がミトコンドリアのRNA編集に利用できるかどうかを確認するために、MT-ND2とMT-ND5を標的するPPRをデザインし、PG1またはWW1ドメインを融合した遺伝子を作成した(
図10a)。
【0161】
ミトコンドリア標的配列(MTS)とP-DYW配列からなるこれらのタンパク質は、HEK293T細胞に悪影響を与えないように、MT-ND2とMT-ND5の178番目と301番目のコドンの3番目の位置を標的としている(
図10a)。HEK293T細胞へプラスミドで導入後、MT-ND2とMT-ND5 mRNA内で編集を確認した(
図10b,c)。これらの4つのタンパク質は、ターゲットに対して最高70%の編集活性が検出され、同じmRNA分子に対してオフターゲット変異は検出されなかった(
図10bc)。
【0162】
[方法]
(ミトコンドリア編集のためのクローニング)
Zea maysのLOC100282174タンパク質からのミトコンドリア標的配列(Chin et al. 2018)、10個のPPR-P及びPPR様モチーフ、及びDYWドメイン部分(DYWドメインはPG1とWW1を使用)を、Golden Gate AssemblyによりCMVプロモーターの制御下の発現プラスミドにクローニングした(配列番号:91~94)。
【0163】
[引用した配列の一覧]
【0164】
【0165】
【0166】
【0167】