(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-05
(45)【発行日】2023-06-13
(54)【発明の名称】PPRモチーフを利用したDNA結合性タンパク質およびその利用
(51)【国際特許分類】
C12N 15/09 20060101AFI20230606BHJP
C12Q 1/68 20180101ALI20230606BHJP
C07K 14/415 20060101ALN20230606BHJP
【FI】
C12N15/09 Z ZNA
C12Q1/68
C07K14/415
(21)【出願番号】P 2022053594
(22)【出願日】2022-03-29
(62)【分割の表示】P 2020201866の分割
【原出願日】2014-04-22
【審査請求日】2022-03-29
(31)【優先権主張番号】P 2013089840
(32)【優先日】2013-04-22
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】504145342
【氏名又は名称】国立大学法人九州大学
(73)【特許権者】
【識別番号】504136568
【氏名又は名称】国立大学法人広島大学
(74)【代理人】
【識別番号】110000109
【氏名又は名称】弁理士法人特許事務所サイクス
(72)【発明者】
【氏名】山本 卓
(72)【発明者】
【氏名】佐久間 哲史
(72)【発明者】
【氏名】中村 崇裕
(72)【発明者】
【氏名】八木 祐介
(72)【発明者】
【氏名】大川 恭行
【審査官】田中 晴絵
(56)【参考文献】
【文献】国際公開第2011/111829(WO,A1)
【文献】日本分子生物学会年会プログラム・要旨集,2013年11月20日,Vol.36th,2P-1016
【文献】Molecular and Cellular Biology,1999年12月,Vol.19, No.12,pp.8113-8122
【文献】Science,2007年,Vol.316,pp.715-719
【文献】The Plant Cell,2006年,Vol.18,pp.176-197
【文献】Plant Physiology,2008年,Vol.147,pp.573-584
【文献】Plant Cell,Vol.18,2006年,pp.815-830
【文献】PLoS Genet.,2012年08月16日,Vol.8, No.8,e1002910,doi:10.1371/journal.pgen.1002910
【文献】PLOS ONE,2013年03月05日,Vol.8, Issue.3,e57286
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/00- 3/00
C07K 1/00-19/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
UniProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
以下の工程を含む、細胞の遺伝物質を改変する方法(ヒト個体での実施を除く):
標的配列を有するDNAに結合可能なタンパク質を設計する工程であって、このときタンパク質が、以下の式1の構造を有するPPRモチーフ
【化1】
(式1中:
Helix Aは、αヘリックス構造を形成可能な部分であり;
Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
Helix Bは、αヘリックス構造を形成可能な部分であり;そして
Lは、2~7アミノ酸長からなる部分である。)
を1個または2~30個含んでなるタンパク質であって、
タンパク質に含まれる一のPPRモチーフ(M
n)が、
Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
・PPRモチーフ(M
n)のC末端側に連続して次のPPRモチーフ(M
n+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(M
n)とそのC末端側の次のPPRモチーフ(M
n+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(M
n+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(M
n)のC末端側に次のPPRモチーフ(M
n+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(M
n+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸
を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸を、標的配列を有するDNAにおける結合すべき塩基に対応したアミノ酸の組み合わせで有するPPRモチーフであり、
前記アミノ酸の組み合わせが、下記のいずれか:
(2-1) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-7) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-9) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
(2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
(2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する
に基づく、工程;
設計されたタンパク質からなる領域と機能性領域とを連結して複合体を製造する工程;および
製造された複合体を、標的配列を有するDNAを含む細胞に導入することより、複合体のタンパク質からなる領域が標的配列を有するDNAに結合し、そのため機能性領域が、標的配列を有するDNAを改変する工程。
【請求項2】
以下の工程を含む、細胞の遺伝物質を改変する方法(ヒト個体での実施を除く):
標的配列を有するDNAに結合可能なタンパク質からなる領域と機能性領域とが連結されてなる複合体を、標的配列を有するDNAを含む細胞に導入することにより、複合体のタンパク質からなる領域が標的配列を有するDNAに結合し、そのため機能性領域が、標的配列を有するDNAを改変する工程であって、
このときタンパク質が、以下の式1の構造を有するPPRモチーフ
【化2】
(式1中:
Helix Aは、αヘリックス構造を形成可能な部分であり;
Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
Helix Bは、αヘリックス構造を形成可能な部分であり;そして
Lは、2~7アミノ酸長からなる部分である。)
を1個または2~30個含んでなるタンパク質であって、
タンパク質に含まれる一のPPRモチーフ(M
n)が、
Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
・PPRモチーフ(M
n)のC末端側に連続して次のPPRモチーフ(M
n+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(M
n)とそのC末端側の次のPPRモチーフ(M
n+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(M
n+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(M
n)のC末端側に次のPPRモチーフ(M
n+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(M
n+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸
を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸を、標的配列を有するDNAにおける結合すべき塩基に対応したアミノ酸の組み合わせで有するPPRモチーフであって、
前記アミノ酸の組み合わせが、下記のいずれか:
(2-1) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-7) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-9) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
(2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
(2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
に基づく、工程。
【請求項3】
PPRモチーフが、配列番号1のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号2のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフ、配列番号3のアミノ酸配列からなるタンパク質が有する15個のPPRモチーフ、配列番号4のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、および配列番号5のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群から選択されるいずれかである、請求項1または2に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、意図したDNA塩基またはDNA配列に選択的または特異的に結合可能なタンパク質に関する。本発明では、pentatricopeptide repeat (PPR)モチーフを利用する。本発明は、DNA結合性タンパク質の同定、設計、PPRモチーフを有するタンパク質の標的DNAの同定、DNAの機能制御のために用いることができる。本発明は、医療分野、農学分野等で有用である。本発明はまた、PPRモチーフを含むタンパク質、および機能性領域を規定するタンパク質との複合体、を利用した新しいDNA切断酵素に関する。
【背景技術】
【0002】
近年、様々な解析より明らかになった核酸結合性のタンパク質因子を用いて、意図する配列に結合する技術が確立され、利用されつつある。この配列特異的な結合を利用することで、標的とする核酸(DNAまたはRNA)の細胞内局在の解析、標的とするDNA配列の除去、またはその下流に存在するタンパク質コード遺伝子の発現の制御(活性化、または不活化)が可能になりつつある。
【0003】
DNAに作用するタンパク質性因子として、ジンクフィンガータンパク質(非特許文献1、非特許文献2)やTALエフェクター(TALE、非特許文献3、特許文献1)、CRISPR(非特許文献4、非特許文献5)をタンパク質工学的材料とした研究および開発が行われているが、そのようなタンパク質性因子の種類はいまだ非常に限定されている。
【0004】
例えば、人工のDNA切断酵素として知られている人工酵素ジンクフィンガーヌクレアーゼ(ZFN)は、3~4塩基のDNAを特異的に認識して結合するジンクフィンガーを3~6個連結させて構成される3~4塩基の配列単位で塩基配列を認識する部分に対して、細菌のDNA切断酵素(たとえば、FokI)のDNA切断ドメインを1つ連結させたキメラタンパク質である(非特許文献2)。このようなキメラタンパク質は、ジンクフィンガードメインが、DNAに対して結合することが知られているタンパク質ドメインであり、多くの転写調節因子がこのドメインを持ち、特異的なDNA配列に結合して遺伝子の発現調節を行なっていることが知られていることに基づいている。3個のジンクフィンガーをもつこのZFNを2つ用いることにより、理論上は、約700億塩基に1箇所の切断を誘導することができる。
【0005】
しかしながら、このZFNを使用する方法は、その作製に費用がかかることなどから、広く利用されるには至っていない。また、機能的なZFNの選別効率が悪く、その点でも問題があることが示唆されている。さらに、n個のジンクフィンガーからなるジンクフィンガードメインは、(GNN)nという配列を認識する傾向があることから、標的遺伝子配列の自由度が低いという問題も有していた。
【0006】
一方、1塩基ごとに認識することのできるモジュール部分の組み合わせ配列からなるタンパク質、TALエフェクター(TALE)に、細菌のDNA切断酵素(たとえば、FokI)のDNA切断ドメインを結合させたもの(TALEN)が開発され、ZFNに代わる人工酵素として検討が行われている(非特許文献3)。このTALENは、植物病原細菌Xanthomonasが持つ転写因子のDNA結合ドメインと、DNA制限酵素FokIのDNA切断ドメインとを融合させた酵素であり、近接するDNA配列に結合し、二量体を形成して二本鎖DNAを切断することが知られている。この分子は、植物に感染する細菌から見出されたTALEのDNA結合ドメインは、34アミノ酸からなるTALEモチーフ中の2カ所のアミノ酸の組み合わせで1つの塩基を認識することから、TALEモジュールの繰り返し構造の選択によって、標的DNAへの結合性を選択することができるという特徴を有している。このような特徴を有するDNA結合ドメインを利用したTALENは、ZFNと同様に標的遺伝子への変異導入が可能であるという特徴を有しているが、その標的遺伝子(塩基配列)の自由度が大幅に向上していること、さらに結合塩基をコード化できることが、ZFNと比較したときの大きな優位性である。
【0007】
しかしながら、TALENの完全な立体構造が明らかになっていないため、TALENのDNAの切断部位を同定することが現状ではできていない。そのため、TALENは、ZFNと比較して、切断箇所が不正確で一定しておらず、類似の配列まで切断してしまうという問題点を有している。そのため、正確に標的塩基配列箇所をDNA切断酵素により切断することができないという問題点が存在していた。このようなことから、上記の問題点を有しない、新しい人工のDNA切断酵素の開発・提供が望まれている。
【0008】
ゲノム配列情報から、植物のみで500個もの大きなファミリーを形成するタンパク質、PPRタンパク質(pentatricopeptide repeat(PPR)モチーフを有するタンパク質)が同定された(非特許文献6)。PPRタンパク質は核コードであるが、専らオルガネラ(葉緑体とミトコンドリア)のRNAレベルでの制御、切断、翻訳、スプライシング、RNA編集、RNA安定性に遺伝子特異的に作用することが知られているタンパク質である。PPRタンパク質は、典型的には、保存性の低い35アミノ酸のモチーフ、すなわちPPRモチーフが約10個連続した構造を有しており、PPRモチーフの組み合わせが、RNAとの配列選択的な結合を担っていると考えられている。ほとんどのPPRタンパク質はPPRモチーフ約10個の繰り返しのみで構成されており、多くの場合、触媒作用を発揮するために必要なドメインが見いだせない。そのため、このPPRタンパク質の実体はRNAアダプターだと考えられている(非特許文献7)。
【0009】
一般的に、タンパク質とDNAとの間の結合と、タンパク質とRNAとの間の結合とは、異なる分子機構に基づいて行われており、DNA結合型タンパク質は、一般的にはRNAに対して結合せず、反対にRNA結合型タンパク質は、一般的にはDNAに対して結合しない。例えば、RNA結合因子として知られており、認識RNAをコード化することができるPumilioタンパク質の場合、DNAとの結合は報告されていない(非特許文献8および9)。
【0010】
しかしながら、様々な種類のPPRタンパク質の性質を検討する過程において、いくつかのタイプのPPRタンパク質がDNA結合性因子として働くことが示唆されることが明らかになった。
【0011】
小麦のp63は、9個のPPRモチーフを有するPPRタンパク質であるが、ゲルシフトアッセイにより、配列特異的にDNAと結合することが示唆されている(非特許文献10)。
【0012】
シロイヌナズナのGUN1タンパク質は、11個のPPRモチーフを有し、プルダウンアッセイによりDNAと結合することが示唆されている(非特許文献11)。
【0013】
シロイヌナズナのpTac2(15個のPPRモチーフを有するタンパク質、非特許文献12)およびシロイヌナズナのDG1(10個のPPRモチーフを有するタンパク質、非特許文献13)は、DNAを鋳型としてRNAを生成する転写に直接関与することがRun-Onアッセイによって示されており、DNAに結合すると考えられる。
【0014】
シロイヌナズナのGRP23(11個のPPRモチーフを有するタンパク質、非特許文献14)の遺伝子欠損株は、胚性致死の表現形を示すが、そのタンパク質は、DNA依存型RNA転写酵素である真核生物型RNA転写ポリメラーゼ2のメジャーサブユニットと物理的に相互作用することが示されており、このことからGRP23もDNA結合に働くと考えられている。
【0015】
しかしながら、これらのPPRタンパク質は、DNAへの結合が間接的に示唆されたに過ぎず、実際に配列特異的に結合していることの証明は十分でない。また、仮にこれらのタンパク質がDNAと配列特異的に結合するとしても、一般的にタンパク質とDNAとの間の結合と、タンパク質とRNAとの間の結合とは、異なる分子機構に基づいて行われていると考えられていることから、具体的にどのような配列規則を介して結合しているのか、等については全く予想すらもされていない。
【先行技術文献】
【特許文献】
【0016】
【文献】WO2011/072246
【文献】WO2011/111829
【非特許文献】
【0017】
【文献】Maeder, M.L., et al. (2008). Rapid "open-source" engineeringof customized zinc-fingernucleases for highly efficient gene modification. Mol.Cell 31, 294-301.
【文献】Urnov, F.D., et al., (2010) Genome editing with engineered zinc finger nucleases, Nature Review Genetics, 11, 636-646
【文献】Miller, J.C., et al. (2011). A TALE nuclease architecture for efficient genome editing. Nature biotech. 29, 143-148.
【文献】Mali P, et al. (2013) RNA-guided human genome engineering via Cas9. Science. 339, 823-826.
【文献】Cong L, et al. (2013) Multiplex genome engineering using CRISPR/Cas systems. Science. 339, 819-823
【文献】Small, I.D., and Peeters, N. (2000). The PPR motif - a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, 46-47.
【文献】Woodson, J.D., and Chory, J. (2008). Coordination of gene expression between organellar and nuclear genomes. Nature Rev. Genet. 9, 383-395.
【文献】Wang, X., et al. (2002). Modular recognition of RNA by a human pumilio-homology domain. Cell 110, 501-512.
【文献】Cheong, C.G., and Hall, T.M. (2006). Engineering RNA sequence specificity of Pumilio repeats. Proc. Natl. Acad. Sci. USA 103, 13635-13639.
【文献】Ikeda T.M. and Gray M.W. (1999) Characterization of a DNA-binding protein implicated in transcription in wheat mitochondria. Mol Cell Biol19(12):8113-8122
【文献】Koussevitzky S, et al. (2007) Signals from chloroplasts converge to regulate nuclear gene expression. Science 316: 715-719.
【文献】Pfalz J, et al. (2006) pTAC2, -6, and -12 are components of the transcriptionally active plastid chromosome that are required for plastid gene expression. Plant Cell 18: 176-197.
【文献】Chi W, et al. (2008) The pentratricopeptide repeat proteinDELAYED GREENING1 is involved in the regulation of early chloroplast development and chloroplast gene expression in Arabidopsis. Plant Physiol. 147: 573-584.
【文献】Ding YH, et al. (2006) Arabidopsis GLUTAMINE-RICH PROTEIN23 is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III. Plant Cell 18: 815-830.
【発明の概要】
【発明が解決しようとする課題】
【0018】
本発明者らは、PPRタンパク質(PPRモチーフを有するタンパク質)のRNAアダプターとしての性質は、PPRタンパク質を構成するそれぞれのPPRモチーフの性質、および複数個のPPRモチーフの組み合わせで決定されると予想し、このPPRモチーフを利用した、RNA結合性タンパク質の改変方法について、提案してきた(特許文献2)。そして、PPRモチーフとRNAが一対一の対応で結合し、連続したPPRモチーフにより、RNA配列中の連続したRNA塩基を認識すること、PPRモチーフを構成する35アミノ酸のうち、特定の3箇所のアミノ酸の組み合わせでRNA認識が決定されることを明らかにし、PPRモチーフのRNA認識コードを利用したカスタムRNA結合タンパク質の設計方法とその利用について特許出願を行った(PCT/JP2012/077274;Yagi, Y., et al. (2013) PLoS One, 8, e57286;そしてBarkan, A., etal. (2012) PLoS Genet., 8, e1002910.)。
【0019】
一般的には、タンパク質とDNAとの間の結合と、タンパク質とRNAとの間の結合とは、異なる分子機構に基づくと考えられていた。これに対して、今回、PPRモチーフが有するRNA認識規則が、DNAの認識に対しても利用可能であるとの予測を立てて、DNA結合に働くPPRタンパク質の解析を行い、そのような特徴を有するPPRタンパク質を探索することを課題とした。また、このようにして得られたDNAに対して特異的に結合しうるPPRタンパク質を用いて、所望の配列に結合するカスタムDNA結合タンパク質の調製を行うとともに、機能性領域を規定するタンパク質とともに使用することにより、新たな人工酵素を提供すること、そして、機能性領域としてDNA切断活性領域とともに使用することにより、新たな人工DNA切断酵素を提供することもまた課題とした。
【課題を解決するための手段】
【0020】
PPRタンパク質の場合、様々なドメイン検索プログラム(Pfam、Prosite、Interproなど)において、一般的なRNA結合型のPPRタンパク質に含まれるPPRモチーフと、前述したいくつかの種類のDNA結合型のPPRタンパク質に含まれるPPRモチーフとは、特に区別されていないことが明らかになった。そのため、PPRタンパク質については、核酸認識に必要なアミノ酸とは別に、DNAとの結合性またはRNAとの結合性を決定するアミノ酸(アミノ酸群)が含まれるのではないかと考えられる。
【0021】
本発明者らは、PCT/JP2012/077274において、RNA結合型PPRモチーフとRNAとが一対一の対応で結合し、連続したPPRモチーフにより、RNA配列中の連続したRNA塩基を認識すること、その際にPPRモチーフを構成する35アミノ酸のうち、特定の3箇所のアミノ酸(すなわち、モチーフを構成する2つのαヘリックス構造のうちの最初のヘリックス(Helix A)の1番および4番アミノ酸(1番A.A.および4番A.A.)およびC末端側から-2番目のアミノ酸(“ii”(-2)番A.A.)の3箇所のRNA認識アミノ酸の組み合わせで塩基選択的なRNAとの結合が決定されることを明らかにし、PPRモチーフのRNA認識コードを利用したカスタムRNA結合タンパク質の設計方法とその利用について特許出願を行った。
【0022】
そこで、PPRタンパク質のうちでDNAとの結合が示唆された前述の小麦のp63(非特許文献11、シロイヌナズナの相同タンパク質のアミノ酸配列をSEQ ID NO: 1)、シロイヌナズナのGUN1タンパク質(非特許文献12、アミノ酸配列をSEQ ID NO: 2)、シロイヌナズナのpTac2(非特許文献13、アミノ酸配列をSEQ ID NO: 3)、DG1(非特許文献14、アミノ酸配列をSEQ ID NO: 4)、シロイヌナズナのGRP23(非特許文献15、アミノ酸配列をSEQ ID NO: 5)について、RNAを標的とする場合に重要と考えられたPPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)について、アミノ酸出現頻度をRNA結合型モチーフと比較したところ、これらのDNA結合性が示唆されるPPRタンパク質のPPRモチーフと、RNA結合型モチーフとの間でのアミノ酸出現頻度の傾向がほぼ一致することが明らかになった。
【0023】
このことから、RNA結合型PPRモチーフの核酸認識コードがDNA結合型PPRモチーフにも適用することができることが示唆される。チミン(T)は、5-メチルウラシルとも呼ばれるように、ウラシル(U)の5位の炭素をメチル化した構造を有するウラシル(U)誘導体である。この様な核酸を構成する塩基の性質から、RNA結合型PPRモチーフのウラシル(U)を認識するアミノ酸の組み合わせは、DNAの場合のチミン(T)の認識に用いられることが示唆された。
【0024】
これらの知見に基づいて、DNA結合型PPRタンパク質である前述のp63(SEQ ID NO: 1のアミノ酸配列)、シロイヌナズナのGUN1タンパク質(SEQ ID NO: 2のアミノ酸配列)、シロイヌナズナのpTac2(SEQ ID NO: 3のアミノ酸配列)、DG1(SEQ ID NO: 4のアミノ酸配列)、シロイヌナズナのGRP23(SEQ ID NO: 5のアミノ酸配列)を鋳型として用い、これらのPPRタンパク質に対してRNA結合型PPRモチーフの検討の結果得られた知見を適用して3箇所のアミノ酸(1番A.A.および4番A.A.および“ii”(-2)番A.A.)を配置することにより、任意DNA配列に結合するカスタムDNA結合タンパク質の作製が可能になることを明らかにした。
【0025】
すなわち、本発明者らは、SEQ ID NO: 1のアミノ酸配列、SEQ ID NO: 2のアミノ酸配列、SEQ ID NO: 3のアミノ酸配列、SEQ ID NO: 4のアミノ酸配列、SEQ ID NO: 5のアミノ酸配列により代表される、それぞれのPPRモチーフのうちの3箇所のアミノ酸(1番A.A.および4番A.A.および“ii”(-2)番A.A.)を後述する特定のアミノ酸にしたPPRモチーフを、複数個、好ましくは2~30個、より好ましくは5~25個、もっとも好ましくは9~15個含む、DNA塩基選択的に、またはDNA塩基配列特異的に結合可能なタンパク質を提供することにより、本発明を完成した。
【0026】
本発明は、以下を提供する:
[1] 以下の式1の構造を有するPPRモチーフ:
【0027】
【0028】
(式1中:
Helix Aは、αヘリックス構造を形成可能な部分であり;
Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
Helix Bは、αヘリックス構造を形成可能な部分であり;そして
Lは、2~7アミノ酸長からなる部分である。)
を1個以上含むタンパク質であって、
タンパク質に含まれる一のPPRモチーフ(Mn)が、
Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(Mn+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸
を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、
1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸を、対象DNA塩基または対象DNA塩基配列に対応した特定のアミノ酸の組み合わせで有するPPRモチーフである、DNA塩基選択的に、またはDNA塩基配列特異的に結合可能なタンパク質。
[2] 1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、[1]に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
(1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)である;
(1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
に基づいて決定される、タンパク質。
[3] 1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、[1]に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
(2-1) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-7) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-9) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
(2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
(2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
に基づいて決定される、前記タンパク質。
[4] [1]に定義されるPPRモチーフ(Mn)が、2~30個含まれる、[1]~[3]のいずれか1項に記載のタンパク質。
[5] [1]に定義されるPPRモチーフ(Mn)が、5~25個含まれる、[1]~[3]のいずれか1項に記載のタンパク質。
[6] [1]に定義されるPPRモチーフ(Mn)が、9~15個含まれる、[1]~[3]のいずれか1項に記載のタンパク質。
[7] PPRモチーフを9個有するSEQ ID NO: 1のアミノ酸配列、PPRモチーフを11個有するSEQ ID NO: 2のアミノ酸配列、PPRモチーフを15個有するSEQ ID NO: 3のアミノ酸配列、PPRモチーフを10個有するSEQ ID NO: 4のアミノ酸配列、PPRモチーフを11個有するSEQ ID NO: 5のアミノ酸配列から選択される配列からなる、[6]に記載のPPRタンパク質。
[8] [1]に定義されるPPRモチーフ(Mn)を、1個以上(好ましくは2~30個)含む、DNA結合性タンパク質の標的となるDNA塩基、またはDNA塩基配列を同定する方法であって:
同定が、[1]に記載の(1-1)~(1-9)または3に記載の(2-1)~(2-50)のいずれかに基づいて、PPRモチーフの1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせに応じたDNA塩基の有無を認定することにより行われる、方法。
[9] 標的DNA塩基、または特定の塩基配列を有する標的DNAに結合可能な、[1]に定義されるPPRモチーフ(Mn)を1個以上(好ましくは2~30個)含む、PPRタンパク質を同定する方法であって:
同定が、[1]に記載の(1-1)~(1-9)または[1]に記載の(2-1)~(2-50)のいずれか基づいて、標的DNA塩基、または標的DNAを構成する特定の塩基に応じた、PPRモチーフの1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせの有無を認定することにより行われる、方法。
[10] [1]に記載されたタンパク質を用いる、DNAの機能の制御方法。
[11] [1]に記載されたタンパク質からなる領域と機能性領域とが連結されてなる、複合体。
[12] 複合体が、[1]に記載されたタンパク質のC末端側に、機能性領域を融合してなる、[11]に記載の複合体。
[13] 機能性領域が、DNA切断酵素またはそのヌクレアーゼドメイン、または転写制御ドメインであり、複合体が標的配列特異的DNA切断酵素、または転写制御因子として機能する、[11]または[12]に記載の複合体。
[14] DNA切断酵素がFokIのヌクレアーゼドメイン(SEQ ID NO: 6)である、[13]に記載の複合体。
[15] 以下の工程を含む、細胞の遺伝物質を改変する方法:
標的配列を有するDNAを含む細胞を準備し;そして
[11]に記載された複合体を細胞に導入することにより、複合体のタンパク質からなる領域が標的配列を有するDNAに結合し、そのため機能性領域が、標的配列を有するDNAを改変する、前記方法。
[16] PPRモチーフを1個以上含むPPRタンパク質を用いて、DNA塩基または特定の塩基配列を有するDNAを、同定、認識または標的化する方法。
[17] タンパク質が、構成するアミノ酸のうち3つが特定のアミノ酸の組み合わせであるものであるPPRモチーフを1個以上含む、[16]に記載の方法。
[18] タンパク質が、1に定義されたPPRモチーフ(Mn)を1個以上含む、[16]または[17]に記載の方法。
【発明の効果】
【0029】
本発明により、対象DNA塩基に結合可能なPPRモチーフおよびそれを含むタンパク質が提供できる。複数個のPPRモチーフを配することにより、任意の配列や長さを有する標的DNAに結合可能なタンパク質が提供できる。
【0030】
本発明により、任意のPPRタンパク質の標的DNAを予測し、同定することができ、また逆に、任意のDNAに結合するPPRタンパク質を予測し、同定することができる。標的DNA配列を予測することで、その遺伝子的実体を明らかにし、また利用できる可能性が広がる。さらに、本発明により、産業的に有用なPPRタンパク質遺伝子について、様々なアミノ酸多型を有した相同遺伝子の機能性をその標的DNA配列の相違から検定することができる。
【0031】
さらに、本発明により、PPRモチーフを利用した新たなDNA切断酵素を提供することもでき、すなわち、本発明により提供されるPPRモチーフまたはPPRタンパク質に機能性領域タンパク質を連結し、特定の核酸配列に対する結合活性を有しかつ特定の機能性を有するタンパク質とを含む複合体を調製することができる。
【0032】
本発明において利用することができる機能性領域としては、様々な機能の内、DNAの切断、転写、複製、修復、合成、修飾などのいずれかの機能を付与することができる領域のことをいう。本発明の特徴であるPPRモチーフの配列を調整し、標的とするDNAの塩基配列を定めることにより、ほとんどすべてのDNA配列を標的として利用することができ、その標的で、DNAの切断、転写、複製、修復、合成、修飾など、機能性領域の持つ機能を利用したゲノム編集を実現することができる。
【0033】
例えば、機能性領域がDNAの切断機能を有するある場合、本願発明において調製されるPPRタンパク質部分とDNAの切断領域が連結された複合体が提供される。この様な複合体は、PPRタンパク質部分により標的とするDNAの塩基配列を認識したのち、DNAの切断領域によりDNAを切断する、人工DNA切断酵素として機能することができる。機能性領域が転写制御機能を有する場合、本願発明において調製されるPPRタンパク質部分とDNAの転写制御領域が連結された複合体が提供される。この様な複合体は、PPRタンパク質部分により標的とするDNAの塩基配列を認識したのち、目的のDNAの転写を促す、人工転写制御因子として機能することができる。
【0034】
さらに本発明により、上記の複合体を生体内にデリバリーし、機能させる方法、または本発明により得られたタンパク質をコードする核酸配列(DNA、RNA)を用いた形質転換体の作製や、生物(細胞、組織、個体)における様々な場面での、特異的な改変、制御および機能の付与に利用できる。
【図面の簡単な説明】
【0035】
【
図1】
図1は、PPRモチーフの保存配列とアミノ酸番号を示す。(A)本発明で定義するPPRモチーフを構成するアミノ酸、およびそのアミノ酸番号を記す。(B)結合塩基選択性を制御する3つのアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)の予測構造上での位置を示す。(C)PPRモチーフの構造的な2つの例と、それぞれの場合における予測構造上でのアミノ酸の位置を示す。ここで、1番A.A.、4番A.A.および“ii”(-2)番A.A.は、タンパク質立体構造図においてマゼンタ色(白黒表示では濃灰色)のスティックとして示した。
【
図2】
図2は、DNA結合型でDNAの代謝に機能するPPRタンパク質であるシロイヌナズナp63(SEQ ID NO: 1のアミノ酸配列)、シロイヌナズナのGUN1タンパク質(SEQ ID NO: 2のアミノ酸配列)、シロイヌナズナのpTac2(SEQ ID NO: 3のアミノ酸配列)、DG1(SEQID NO: 4のアミノ酸配列)、シロイヌナズナのGRP23(SEQ ID NO: 5のアミノ酸配列)の構造的な概要およびそれらがDNAに結合することを示すアッセイ系の概要について、まとめたものである。
【
図3】
図3は、DNA結合性が示唆されるPPRタンパク質(SEQ ID NO: 1~5)のPPRモチーフと、公知のRNA結合型モチーフとの間での、PPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)についてのアミノ酸出現頻度をまとめたものである。
【
図4-1】
図4-1は、(A)シロイヌナズナp63(SEQ ID NO: 1のアミノ酸配列)、(B)シロイヌナズナのGUN1タンパク質(SEQ ID NO: 2のアミノ酸配列)のそれぞれについて、内部に包含されるPPRモチーフの位置ならびにPPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)の位置を示したものである。
【
図4-2】
図4-2は、(C)シロイヌナズナのpTac2(SEQ ID NO: 3のアミノ酸配列)、(D)DG1(SEQ ID NO: 4のアミノ酸配列)のそれぞれについて、内部に包含されるPPRモチーフの位置ならびにPPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)の位置を示したものである。
【
図4-3】
図4-3は、(E)シロイヌナズナのGRP23(SEQ ID NO: 5のアミノ酸配列)について、内部に包含されるPPRモチーフの位置ならびにPPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)の位置を示したものである。
【
図5】PPR分子の配列特異的なDNA結合能の評価。3種類のDNA結合型(と目される)PPR分子に、転写活性化ドメインであるVP64を融合させた人工転写因子を作製し、ヒト培養細胞内でそれぞれの標的配列を有するルシフェラーゼレポーターを活性化できるかどうかを検討した。
【
図6】pTac2-VP64およびGUN1-VP64のそれぞれについて、ネガティブコントロールとなるpminCMV-luc2と共導入した場合、および標的配列を4つまたは8つ有するレポーターベクターと共導入した場合で、ルシフェラーゼ活性を比較した。その結果、双方とも標的配列を増やすほど活性が上昇する傾向が見られ、これらのPPR-VP64分子がそれぞれの標的配列に特異的に結合し、部位特異的な転写活性化因子として機能していることが証明された。
【発明を実施するための形態】
【0036】
[PPR モチーフおよびPPRタンパク質]
本発明で「PPRモチーフ」というときは、特に記載した場合を除き、Web上のタンパク質ドメイン検索プログラム(例えば、Pfam、Prosite、Uniprotなど)でアミノ酸配列を解析した際に、Pfam(http://pfam.sanger.ac.uk/)においてPF01535、Prosite(http://www.expasy.org/prosite/)においてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。また、Uniprot database(http://www.uniprot.org)でも、様々なタンパク質中のPPRモチーフが定義されている。
【0037】
本発明のPPRモチーフは、PPRモチーフのアミノ酸配列の保存性は低いが、下図で示すようなヘリックス、ループ、ヘリックス、ループ、の2次構造は良く保存されている。
【0038】
【0039】
本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、本発明者らによる論文(Kobayashi K, et al., Nucleic Acids Res., 40, 2712-2723 (2012))、に準ずる。すなわち、本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PfamにおけるPF01535のアミノ酸番号とほぼ同義である一方で、PrositeにおけるPS51375のアミノ酸の番号から2引いた数(例;本発明の1番→PS51375の3番)に相当し、Uniprotで定義されるPPRモチーフのアミノ酸の番号からも2引いた数に相当する。
【0040】
詳しくは、本発明において、1番アミノ酸は式1で示すHelix Aが始まる最初のアミノ酸である。4番アミノ酸は、1番アミノ酸から数えて4番目のアミノ酸である。ただし、“ii”(-2)番のアミノ酸というときは、
・PPRモチーフ(M
n)のC末端側に連続して次のPPRモチーフ(M
n+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき、例えば、
図4-1の(A)では、Motif Nos.1, 2, 3, 4, 6および7が該当する。)は、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸を指す;
・PPRモチーフ(M
n)とそのC末端側の次のPPRモチーフ(M
n+1)の間に1~20アミノ酸の非PPRモチーフ(PPRモチーフではない部分)が見いだされるとき(例えば、
図4-1の(A)では、Motif Nos. 5および8が該当する。
図4-3の(D)では、Motif Nos. 1, 2, 7および8が該当する。)は、次のPPRモチーフ(M
n+1)の1番アミノ酸に対して2個上流、すなわち-2番目のアミノ酸を“ii”(-2)番アミノ酸とする(
図1を参照);そして
・PPRモチーフ(M
n)のC末端側に次のPPRモチーフ(M
n+1)が見いだせないとき(例えば、
図4-1では、(A)のMotif No. 9、(B)のMotif No. 11が該当する。)、もしくはC末端側の次のPPRモチーフ(M
n+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸を“ii”(-2)番のアミノ酸とする。
【0041】
本発明で「PPRタンパク質」というときは、特に記載した場合を除き、上述のPPRモチーフを、複数有するPPRタンパク質をいう。本明細書で「タンパク質」というときは、特に記載した場合を除き、ポリペプチド(複数のアミノ酸がペプチド結合した鎖)からなる物質全般をいい、比較的低分子のポリペプチドからなるものも含まれる。本発明で「アミノ酸」という場合、通常のアミノ酸分子を指すことがあるほか、ペプチド鎖を構成しているアミノ酸残基を指すことがある。いずれを指しているかは、文脈から、当業者には明らかである。
【0042】
PPRタンパク質は植物に多く存在し、シロイヌナズナでは500タンパク質、約5000モチーフが見いだせる。イネ、ポプラ、イワヒバ等、多くの陸上植物にも多様なアミノ酸配列のPPRモチーフおよびPPRタンパク質が存在する。いくつかのPPRタンパク質は、花粉形成(雄性配偶子)の形成に働く稔性回復因子として、雑種強勢のためのF1種子取得のための重要な遺伝子であることが知られている。稔性回復と類似して、いくつかのPPRタンパク質は種分化に作用していることが明らかになっている。ほとんどのPPRタンパク質は、ミトコンドリアか葉緑体中のRNAに働くことも分かっている。
【0043】
動物では、LRPPRCと同定されるPPRタンパク質の異常がLeigh syndromFrench Canadian(LSFC;リー症候群、亜急性壊死性脳脊髄症)を引き起こすことが知られている。
【0044】
本発明で、PPRモチーフのDNA塩基との結合性に関し、「選択的」というときは、特に記載した場合を除き、DNA塩基のいずれか一つの塩基に対する結合活性が、他の塩基に対する結合活性より高いことをいう。この選択性は、当業者であれば実験を企画し、確認することができるほか、本明細書の実施例に開示されているように、計算により求めることもできる。
【0045】
本発明でDNA塩基というときは、特に記載した場合を除き、DNAを構成するデオキシリボヌクレオチドの塩基を指し、具体的には、アデニン(A)、グアニン(G)、シトシン(C)、またはチミン(T)のいずれかをいう。なおPPRタンパク質は、DNA中の塩基に対して選択性を有しうるが、核酸モノマーに結合するわけではない。
【0046】
本発明以前には、PPRモチーフとしての保存アミノ酸の配列検索法は確立しているが、選択的なDNA塩基との結合に関する法則性は、まったく発見されていなかった。
【0047】
[本発明により提供される知見]
本発明により、以下の知見が提供される。
【0048】
(I) 選択的結合のために重要なアミノ酸の位置に関する情報。
具体的には、PPRモチーフの、Helix Aの最初のアミノ酸を1番アミノ酸、そして4番目のアミノ酸を4番アミノ酸とし、そして
・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(Mn+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸
を“ii”(-2)番のアミノ酸とした場合に、ヘリックス(Helix A)の1番および4番アミノ酸である1番A.A.、4番A.A. および上記で定義する“ii”(-2)番A.A.の3つのアミノ酸の組み合わせ(1番A.A.、4番A.A.および“ii”(-2)番A.A.)が、DNA塩基との選択的な結合のために重要であり、これらの組み合わせにより、結合するDNA塩基がいずれであるかを決定できる。
【0049】
本発明は、本発明者らにより見出された、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせに関する知見に基づく。 具体的には、
(1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)であり、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*GD)、
・好ましくは、グルタミン酸(E)とアスパラギン酸(D)との組み合わせ(EGD)、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*GN)、
・好ましくは、グルタミン酸(E)とアスパラギン(N)との組み合わせ(EGN)、または
・任意のアミノ酸とセリン(S)との組み合わせ(*GS)、であってもよい;
(1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*IN)、であってもよい;
(1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*LD)、または
・任意のアミノ酸とリシン(K)との組み合わせ(*LK)、であってもよい;
(1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*MD)、または
・イソロイシン(I)とアスパラギン酸(D)との組み合わせ(IMD)、であってもよい;
(1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*ND)、
・フェニルアラニン(F)、グリシン(G)、イソロイシン(I)、トレオニン(T)、バリン(V)、チロシン(Y)のいずれかとアスパラギン酸(D)との組み合わせ(FND、GND、IND、TND、VND、またはYND)、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*NN)、
・イソロイシン(I)、セリン(S)、バリン(V)のいずれかとアスパラギン(N)との組み合わせ(INN、SNN、またはVNN)、
・任意のアミノ酸とセリン(S)との組み合わせ(*NS)、
・バリン(V)とセリン(S)との組み合わせ(VNS)、
・任意のアミノ酸とトレオニン(T)との組み合わせ(*NT)、
・バリン(V)とトレオニン(T)との組み合わせ(VNT)、
・任意のアミノ酸とトリプトファン(W)との組み合わせ(*NW)、または
・イソロイシン(I)とトリプトファン(W)との組み合わせ(INW)、であってもよい;
(1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*PD)、
・フェニルアラニン(F)とアスパラギン酸(D)との組み合わせ(FPD)、または
・チロシン(Y)とアスパラギン酸(D)との組み合わせ(YPD)、であってもよい;
(1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*SN)、
・フェニルアラニン(F)とアスパラギン(N)との組み合わせ(FSN)、または
・バリン(V)とアスパラギン(N)との組み合わせ(VSN)、であってもよい;
(1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*TD)、
・バリン(V)とアスパラギン酸(D)との組み合わせ(VTD)、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*TN)、
・フェニルアラニン(F)とアスパラギン(N)との組み合わせ(FTN)、
・イソロイシン(I)とアスパラギン(N)との組み合わせ(ITN)、または
・バリン(V)とアスパラギン(N)との組み合わせ(VTN)、であってもよい;
(1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・イソロイシン(I)とアスパラギン酸(D)との組み合わせ(IVD)、
・任意のアミノ酸とグリシン(G)との組み合わせ(*VG)、または
・任意のアミノ酸とトレオニン(T)との組み合わせ(*VT)、であってもよい。
【0050】
(II) 1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせとDNA塩基との対応に関する情報。
具体的には、下記のようなものである。
(2-1) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-7) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-9) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
(2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
(2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;に基づいて決定される、タンパク質であって、選択的なDNA塩基結合能を有する。
【0051】
特定の位置のアミノ酸の特定の組み合わせとDNA塩基との結合性は、実験により確認することができる。このような目的での実験は、PPRモチーフまたは複数のPPRモチーフを含むタンパク質の調製、基質DNAの調製、および結合性試験(例えば、ゲルシフト法)を含む。各々の実験は当業者にはよく知られているし、より具体的な手順
・条件としては、例えば特許文献2を参考にすることができる。
【0052】
[PPRモチーフおよびPPRタンパク質の利用]
同定および設計:
一つのPPRモチーフは、DNAの特定の一塩基を認識し、連続した複数個のPPRモチーフで、DNA配列中の連続した塩基を認識しうる。そして、本発明に基づけば、特定の位置のアミノ酸を適切にすることで、A、T、G、Cそれぞれに選択的なPPRモチーフを選択または設計することができ、さらにはそのようなPPRモチーフの適切な連続を含むタンパク質は、対応する特異的な配列を認識しうる。そのため、本発明に基づけば、特定の塩基配列を有するDNAに選択的に結合する天然型PPRタンパク質を予測
・同定することができ、また逆に、PPRタンパク質の結合の標的となるDNAを予測
・同定することができる。標的の予測
・同定は、遺伝子的実体を明らかにするのに役立ち、また標的の利用可能性を拡大しうる点でも有用である。
【0053】
さらに本発明により、所望のDNA塩基に選択的に結合可能なPPRモチーフ、および所望のDNAに配列特異的に結合可能な、複数個のPPRモチーフを有するタンパク質を設計することができる。設計に際し、PPRモチーフ中の重要な位置のアミノ酸以外の部分は、SEQ ID NO: 1から5に記したようなDNA結合型PPRタンパク質中の天然型のPPRモチーフの配列情報を参考にすることができる。また、全体として天然型を用い、該当位置のアミノ酸だけを置換することにより、設計してもよい。PPRモチーフの繰り返し数は、標的配列に応じ、適宜とすることができるが、例えば2個以上とすることができ、2~30個、より好ましくは5~25個、もっとも好ましくは9~15個とすることができる。
【0054】
設計に際し、1番A.A.、4番A.A.および“ii”(-2)番A.A.のアミノ酸の組み合わせ以外に配慮してもよい。例えば、前掲特許文献2に記載された8番および12番のアミノ酸の考慮は、DNA結合活性を呈するために重要である場合がある。本発明者らの検討に拠ると、あるPPRモチーフの8番アミノ酸と、それと同じPPRモチーフの12番アミノ酸とが、DNA結合において協同している可能性がある。8番アミノ酸は、塩基性アミノ酸、好ましくはリシン、または酸性アミノ酸、好ましくはアスパラギン酸とすることができ、12番アミノ酸は、塩基性アミノ酸または中性アミノ酸または疎水性アミノ酸とすることができる。
【0055】
設計されたモチーフまたはタンパク質は、当業者にはよく知られた方法により調製することができる。すなわち、本発明は、1番A.A.、4番A.A.および“ii”(-2)番A.A.のアミノ酸の組み合わせに着目した特定のDNA塩基に選択的に結合するPPRモチーフ、および特定配列を有するDNAに特異的に結合するPPRタンパク質を提供する。このようなモチーフおよびタンパク質は、当業者にはよく知られた方法で、比較的大量にも調製可能であり、そのような方法は、目的のモチーフまたはタンパク質が有するアミノ酸配列から、それをコードする核酸配列が決定し、クローニングし、目的のモチーフまたはタンパク質を生産する形質転換体を作製することを含みうる。
【0056】
複合体の調製およびその利用:
本発明により提供されるPPRモチーフまたはPPRタンパク質は、機能性領域を連結し、複合体とすることができる。機能性領域とは一般的に、生体内または細胞内で特定の生物学的機能、例えば酵素機能、触媒機能、阻害機能、亢進機能などの機能を有する部分、または標識としての機能を有する部分をいう。そのような領域は、例えば、タンパク質、ペプチド、核酸、生理活性物質、薬剤からなる。
【0057】
本発明においては、PPRタンパク質に対して、機能性領域を連結させることにより、PPRタンパク質により発揮される標的DNA配列結合機能と、機能性領域により発揮される機能とを、組み合わせて発揮させることができる。例えば、機能性領域として、DNA切断機能を有するタンパク質(例えば、FokIなどの制限酵素)またはそのヌクレアーゼドメインを使用することにより、複合体が人工DNA切断酵素として機能することができる。
【0058】
このような複合体を製造するためには、当該技術分野において一般的に利用可能である手法を利用することができ、複合体を1つのタンパク質分子として合成する方法や、複数のタンパク質の部材を別途合成したのちにそれらの部材を組み合わせて複合体を形成する方法などが知られている。
【0059】
一例として複合体を1つのタンパク質分子として合成する方法の場合、PPRタンパク質のC末端に、アミノ酸リンカーを介して切断酵素を融合したタンパク質複合体を設計し、そのタンパク質複合体を発現するための発現用ベクター構造体を構築し、該構造体から目的の複合体を発現させることができる。この様な調製方法については、特願2011-242250に記載された方法などを使用することができる。
【0060】
PPRタンパク質と機能性領域タンパク質との連結は、アミノ酸によるリンカーを介した連結、アビジン-ビオチンなどの特異的親和性を介した連結、その他の化学的リンカーを介した連結など、当該技術分野において知られているいずれの連結手段を用いてもよい。
【0061】
本発明において利用することができる機能性領域としては、様々な機能の内、DNAの切断、転写、複製、修復、合成、修飾などのいずれかの機能を付与することができる領域のことをいう。本発明の特徴であるPPRモチーフの配列を調整し、標的とするDNAの塩基配列を定めることにより、ほとんどすべてのDNA配列を標的として利用することができ、その標的で、DNAの切断、転写、複製、修復、合成、修飾など、機能性領域の持つ機能を利用したゲノム編集を実現することができる。
【0062】
例えば、機能性領域の機能がDNAの切断機能である場合、本願発明において調製されるPPRタンパク質部分とDNAの切断領域が連結された複合体が提供される。この様な複合体は、PPRタンパク質部分により標的とするDNAの塩基配列を認識したのち、DNAの切断領域によりDNAを切断する、人工DNA切断酵素として機能することができる。
【0063】
本発明において使用することができる切断機能を有する機能性領域の例は、エンドデオキシリボヌクレアーゼとして機能するデオキシリボヌクレアーゼ(DNase)である。この様なDNaseの例としては、DNase A(例えば、bovine pancreatic ribonuclease A: PDB 2AAS)、DNase H、DNase Iなどのエンドデオキシリボヌクレアーゼ、あるいは種々の細菌由来の制限酵素(例えば、FokI(SEQ ID NO: 6)など)やそのヌクレアーゼドメインを利用することができる。このようなPPRタンパク質と機能性領域とを含む複合体は天然には存在せず、新規なものである。
【0064】
機能性領域の機能が転写制御機能である場合、本願発明において調製されるPPRタンパク質部分とDNAの転写制御領域が連結された複合体が提供される。この様な複合体は、PPRタンパク質部分により標的とするDNAの塩基配列を認識したのち、目的のDNAの転写を制御する、人工転写制御因子として機能することができる。
【0065】
本発明において使用することができる転写制御機能を有する機能性領域は、転写を活性化するドメインであってもよく、転写を抑制するドメインであってもよい。転写制御ドメインの例は、VP16、VP64、TA2、STAT-6、p65である。このようなPPRタンパク質と転写制御ドメインとを含む複合体は天然には存在せず、新規なものである。
【0066】
さらに本発明により得られる複合体は、生体内または細胞内に、DNA配列特異的に機能性領域をデリバリーし、機能させることができる可能性がある。これにより、ジンクフィンガータンパク質(前掲非特許文献1および非特許文献2)やTAL effector(前掲非特許文献3、前掲特許文献1)を利用したタンパク質複合体と同様、生体内または細胞内において、DNA配列特異的に改変・破壊を行うことができるようになり、DNA切断およびその機能を利用したゲノム編集という新たな機能を付与できることとなる。具体的には、特定の塩基と結合することができるPPRモチーフを複数連結したPPRタンパク質により、特定のDNA配列を認識することができる。そして、PPRタンパク質に連結した機能性領域により、機能性領域の持つ機能を利用して、認識したDNA領域のゲノム編集を実現することができる。
【0067】
さらにはDNA配列特異的に結合するPPRタンパク質に対して薬物を結合することにより、そのDNA配列周辺を標的として、薬物を送達することができる可能性がある。したがって、本発明は、DNA配列特異的な機能性物質の送達方法を提供するものでもある。
【0068】
本発明で材料にしたPPRタンパク質は、DNA編集の編集部位の指定に働き、そしてこの様な1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置に特定のアミノ酸を配置したPPRモチーフが、DNA上の特異的な塩基を認識した上で、そのDNAの結合活性を有することを明らかにした。この様な特徴に基づいて、1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置に特定のアミノ酸を配置したこのタイプのPPRタンパク質は、それぞれのPPRタンパク質に対してDNA上の特異的な塩基を認識し、その結果として塩基多型を導入すること、または塩基多型に起因した疾患または状態を処置することが期待できる他、上述した様な他の機能性領域と組み合わせることを通じて、DNAを切断し、ゲノム編集を実現するための機能の改変・向上に資することができると考えられる。
【0069】
また、PPRタンパク質のC末端側には、外来性のDNA切断酵素を融合させることができる。あるいは、N末端側のPPRモチーフの結合DNA塩基選択性を改良することで、DNA配列特異的なDNA切断酵素を構成することもできる。また、GFP等の標識部分を連結した複合体は、所望のDNAを生体内で可視化するために用いることもまた可能である。
【実施例】
【0070】
実施例1:DNA編集に関わるPPRタンパク質およびその標的配列の収集
先行技術文献(非特許文献11~非特許文献15)に示された情報を参照し、p63タンパク質(SEQ ID NO: 1)、GUN1タンパク質(SEQ ID NO: 2)、pTac2タンパク質(SEQ ID NO: 3)、DG1タンパク質(SEQ ID NO: 4)、そしてGRP23タンパク質(SEQ ID NO: 5)の構造および機能を解析した。
【0071】
これらのタンパク質中のPPRモチーフ構造は、Uniprot データベース (http://www.uniprot.org/)の情報と共に、本発明で定義するアミノ酸番号を付与した。実験に用いたシロイヌナズナの5種類(SEQ ID NO: 1~5)のPPRタンパク質に含まれるPPRモチーフとそのアミノ酸番号を、
図3に記す。
【0072】
具体的には、前述のp63タンパク質(SEQ ID NO: 1)、GUN1タンパク質(SEQ ID NO: 2)、pTac2タンパク質(SEQ ID NO: 3)、DG1タンパク質(SEQ ID NO: 4)、そしてGRP23タンパク質(SEQ ID NO: 5)について、RNAを標的とする場合に重要と考えられたPPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)について、アミノ酸出現頻度をRNA結合型モチーフと比較した。
【0073】
シロイヌナズナのp63タンパク質(SEQ ID NO: 1)は、9個のPPRモチーフを有し、そしてそのアミノ酸配列中の1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置は、以下の表、ならびに
図3にまとめた通りである。
【0074】
【0075】
シロイヌナズナのGUN1タンパク質(SEQ ID NO: 2)は、11個のPPRモチーフを有し、そしてそのアミノ酸配列中の1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置は、以下の表、ならびに
図3ににまとめた通りである。
【0076】
【表2】
シロイヌナズナのpTac2タンパク質(SEQ ID NO: 3)は、15個のPPRモチーフを有し、そしてそのアミノ酸配列中の1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置は、以下の表、ならびに
図3ににまとめた通りである。
【0077】
【0078】
シロイヌナズナのDG1タンパク質(SEQ ID NO: 4)は、10個のPPRモチーフを有し、そしてそのアミノ酸配列中の1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置は、以下の表、ならびに
図3ににまとめた通りである。
【0079】
【表4】
シロイヌナズナのGRP23タンパク質(SEQ ID NO: 5)は、11個のPPRモチーフを有し、そしてそのアミノ酸配列中の1番A.A.、4番A.A.および“ii”(-2)番A.A.の残基の位置は、以下の表、ならびに
図3ににまとめた通りである。
【0080】
【0081】
これらの位置のアミノ酸頻度をそれぞれのタンパク質について確認し、RNA結合型モチーフの場合の同じ位置のアミノ酸頻度と比較した。結果を
図2に示す。これらのDNA結合性が示唆されるPPRタンパク質のPPRモチーフと、RNA結合型モチーフとの間でのアミノ酸出現頻度の傾向がほぼ一致することが明らかになった。すなわち、DNA結合に働くPPRタンパク質は、RNA結合に働くPPRタンパク質と同じ配列規則で核酸と結合すること、本発明者らが出願中の特許(PCT/JP2012/077274)に記したRNA認識コードが、DNA結合に働くPPRタンパク質に対するDNA認識コードとして適用できることが明らかになった。
【0082】
非特許文献(Yagi, Y. et al., Plos One, 2013, 8, e57286)のRNA認識コードを参考にして、それぞれの塩基に選択的に結合するDNA結合型PPRモチーフの評価を行った。詳しくは、表6に示す塩基出現頻度(occurrence nuceotide frequency)と、バックグラウンド頻度から算出した期待値(Expected nucleotide frequency)を基にカイ二乗検定により算出した。検定は、それぞれの塩基(NT)、プリン
・ピリミジン(AG or CT;PY)、水素結合グループ(AT or GC;HB)、もしくは、アミノ
・ケト型(AC or GT)において行った。有意値をP<0.06(5.E-02;5%有意水準)とし、いずれかの検定において有意値が得られた場合に、1番アミノ酸、4番アミノ酸、“ii”(-2)番アミノ酸の組み合わせを選択した。
【0083】
【0084】
表6には、有意な塩基選択性を示したアミノ酸の組み合わせの場合を列挙した。すなわち、これらの結果は、有意なP値が得られた1番アミノ酸、4番アミノ酸、“ii”(-2)番アミノ酸(表中では、(NSRs;1、4、ii)のアミノ酸種を有するPPRモチーフが、塩基選択的な結合能力を付与するPPRモチーフであること、そしてバックグラウンドの差し引き後において、「正」の数値が大きいほど、その塩基に対する塩基選択性が高くなることを意味している。1番アミノ酸、4番アミノ酸、“ii”(-2)番アミノ酸のうち、4番アミノ酸が塩基選択性に対してもっとも強く関与しており、“ii”(-2)番アミノ酸が塩基選択性に対して次に強く関与しており、1番アミノ酸が塩基選択性に対して3つのアミノ酸の中では弱く関与している。
【0085】
実施例2:PPR分子の配列特異的なDNA結合能の評価
本実施例では、p63、pTac2、GUN1の3種類のDNA結合型(と目される)PPR分子に、転写活性化ドメインであるVP64を融合させた人工転写因子を作製し、ヒト培養細胞内でそれぞれの標的配列を有するルシフェラーゼレポーターを活性化できるかどうかを検討することで、各PPR分子が配列特異的なDNA結合能を有するかどうかを調べた(
図5)。
【0086】
(実験方法)
1. PPR-VP64発現ベクターの作製
p63、pTac2、GUN1のコード配列のうち、PPRモチーフに相当する部分のみを人工合成により作製した。DNA合成はBiomatik社の人工遺伝子合成サービスを利用した。バックボーンベクターとしてはCMVプロモーターを有するpCS2Pベクターを利用し、合成したPPR配列を挿入した。更にPPR配列のN末端にFlagタグと核移行シグナルを、C末端にVP64配列をそれぞれ挿入した。作製したp63-VP64、pTac2-VP64、GUN1-VP64の配列を配列表のSEQ ID NO:7~9に示す。
【0087】
2. PPR標的配列を有するレポーターベクターの作製
Minimal CMVプロモーターの下流にホタルのルシフェラーゼ遺伝子を連結し、プロモーターの上流にマルチクローニングサイトを配置したレポーターベクター(pminCMV-luc2、SEQ ID NO:10)を作製した。このベクターのマルチクローニングサイトに各PPRの予測標的配列を挿入した。各PPRの標的配列(p63はTCTATCACT、pTac2はAACTTTCGTCACTCA、GUN1はAATTTGTCGAT。配列表のSEQ ID NO:11~13)は、RNA結合型PPRでのモチーフ-RNA間の認識コードから、DNA結合型PPRでのモチーフ-DNA間のコードを予測することによって決定した。それぞれのPPRにつき、標的配列を4つ挿入したものと8つ挿入したものをそれぞれ作製し、以下のアッセイに使用した。各ベクターの塩基配列は、配列表のSEQ ID NO:14~19に示す。
【0088】
3. HEK293T細胞へのトランスフェクション
1で作製したPPR-VP64発現ベクターと、2で作製したホタルルシフェラーゼ発現ベクター、更にリファレンスとしてプロメガ社のpRL-CMVベクター(ウミシイタケルシフェラーゼの発現ベクター)を、ライフテクノロジーズ社のLipofectamine LTXを用いて導入した。96ウェルプレートの各ウェルに、DMEM培地を25 μl加え、更にPPR-VP64発現ベクター400 ngとホタルルシフェラーゼ発現ベクター100 ng、pRL-CMVベクター20 ngを混合した溶液を加えた。その後DMEM培地25 μlとLipofectamine LTX 0.7 μlを混合した溶液を各ウェルに加え、30分室温で静置した後、100 μlの15%ウシ胎児血清を含むDMEM培地に懸濁した6×104細胞分のHEK293T細胞を加え、37℃のCO2インキュベーターで24時間培養した。
【0089】
4. ルシフェラーゼアッセイ
ルシフェラーゼアッセイは、プロメガ社のDual-Glo Luciferase Assay Systemを使用し、キットの取扱説明書の通りに行った。ルシフェラーゼ活性の測定にはベルトールド社のTriStar LB 941プレートリーダーを使用した。
【0090】
(結果・考察)
pTac2-VP64およびGUN1-VP64のそれぞれについて、ネガティブコントロールとなるpminCMV-luc2と共導入した場合、および標的配列を4つまたは8つ有するレポーターベクターと共導入した場合で、ルシフェラーゼ活性を比較した(下表、
図6)。活性の比較はFluc(ホタルルシフェラーゼ)の測定値をリファレンスのRluc(ウミシイタケルシフェラーゼ)の測定値で割り込んで標準化したスコア(Fluc/Rluc)に基づいて行った。その結果、双方とも標的配列を増やすほど活性が上昇する傾向が見られ、これらのPPR-VP64分子がそれぞれの標的配列に特異的に結合し、部位特異的な転写活性化因子として機能していることが証明された。
【0091】
【配列表】