【課題を解決するための手段】
【0020】
PPRタンパク質の場合、様々なドメイン検索プログラム(Pfam、Prosite、Interproなど)において、一般的なRNA結合型のPPRタンパク質に含まれるPPRモチーフと、前述したいくつかの種類のDNA結合型のPPRタンパク質に含まれるPPRモチーフとは、特に区別されていないことが明らかになった。そのため、PPRタンパク質については、核酸認識に必要なアミノ酸とは別に、DNAとの結合性またはRNAとの結合性を決定するアミノ酸(アミノ酸群)が含まれるのではないかと考えられる。
【0021】
本発明者らは、PCT/JP2012/077274において、RNA結合型PPRモチーフとRNAとが一対一の対応で結合し、連続したPPRモチーフにより、RNA配列中の連続したRNA塩基を認識すること、その際にPPRモチーフを構成する35アミノ酸のうち、特定の3箇所のアミノ酸(すなわち、モチーフを構成する2つのαヘリックス構造のうちの最初のヘリックス(Helix A)の1番および4番アミノ酸(1番A.A.および4番A.A.)およびC末端側から2番目のアミノ酸(“ii”(-2)番A.A.)の3箇所のRNA認識アミノ酸の組み合わせで塩基選択的なRNAとの結合が決定されることを明らかにし、PPRモチーフのRNA認識コードを利用したカスタムRNA結合タンパク質の設計方法とその利用について特許出願を行った。
【0022】
そこで、PPRタンパク質のうちでDNAとの結合が示唆された前述の小麦のp63(非特許文献11、シロイヌナズナの相同タンパク質のアミノ酸配列をSEQ ID NO: 1)、シロイヌナズナのGUN1タンパク質(非特許文献12、アミノ酸配列をSEQ ID NO: 2)、シロイヌナズナのpTac2(非特許文献13、アミノ酸配列をSEQ ID NO: 3)、DG1(非特許文献14、アミノ酸配列をSEQ ID NO: 4)、シロイヌナズナのGRP23(非特許文献15、アミノ酸配列をSEQ ID NO: 5)について、RNAを標的とする場合に重要と考えられたPPRモチーフ中の核酸認識コードを担う3箇所のアミノ酸(1番A.A.、4番A.A.および“ii”(-2)番A.A.)について、アミノ酸出現頻度をRNA結合型モチーフと比較したところ、これらのDNA結合性が示唆されるPPRタンパク質のPPRモチーフと、RNA結合型モチーフとの間でのアミノ酸出現頻度の傾向がほぼ一致することが明らかになった。
【0023】
このことから、RNA結合型PPRモチーフの核酸認識コードがDNA結合型PPRモチーフにも適用することができることが示唆される。チミン(T)は、5-メチルウラシルとも呼ばれるように、ウラシル(U)の5位の炭素をメチル化した構造を有するウラシル(U)誘導体である。この様な核酸を構成する塩基の性質から、RNA結合型PPRモチーフのウラシル(U)を認識するアミノ酸の組み合わせは、DNAの場合のチミン(T)の認識に用いられることが示唆された。
【0024】
これらの知見に基づいて、DNA結合型PPRタンパク質である前述のp63(SEQ ID NO: 1のアミノ酸配列)、シロイヌナズナのGUN1タンパク質(SEQ ID NO: 2のアミノ酸配列)、シロイヌナズナのpTac2(SEQ ID NO: 3のアミノ酸配列)、DG1(SEQ ID NO: 4のアミノ酸配列)、シロイヌナズナのGRP23(SEQ ID NO: 5のアミノ酸配列)を鋳型として用い、これらのPPRタンパク質に対してRNA結合型PPRモチーフの検討の結果得られた知見を適用して3箇所のアミノ酸(1番A.A.および4番A.A.および“ii”(-2)番A.A.)を配置することにより、任意DNA配列に結合するカスタムDNA結合タンパク質の作製が可能になることを明らかにした。
【0025】
すなわち、本発明者らは、SEQ ID NO: 1のアミノ酸配列、SEQ ID NO: 2のアミノ酸配列、SEQ ID NO: 3のアミノ酸配列、SEQ ID NO: 4のアミノ酸配列、SEQ ID NO: 5のアミノ酸配列により代表される、それぞれのPPRモチーフのうちの3箇所のアミノ酸(1番A.A.および4番A.A.および“ii”(-2)番A.A.)を後述する特定のアミノ酸にしたPPRモチーフを、複数個、好ましくは2〜30個、より好ましくは5〜25個、もっとも好ましくは9〜15個含む、DNA塩基選択的に、またはDNA塩基配列特異的に結合可能なタンパク質を提供することにより、本発明を完成した。
【0026】
本発明は、以下を提供する:
[1] 以下の式1の構造を有するPPRモチーフ:
【0027】
【化1】
【0028】
(式1中:
Helix Aは、αヘリックス構造を形成可能な部分であり;
Xは、存在しないかまたは1〜9アミノ酸長からなる部分であり;
Helix Bは、αヘリックス構造を形成可能な部分であり;そして
Lは、2〜7アミノ酸長からなる部分である。)
を1個以上含むタンパク質であって、
タンパク質に含まれる一のPPRモチーフ(M
n)が、
Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
・PPRモチーフ(M
n)のC末端側に連続して次のPPRモチーフ(M
n+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(M
n)とそのC末端側の次のPPRモチーフ(M
n+1)の間に1〜20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(M
n+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(M
n)のC末端側に次のPPRモチーフ(M
n+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(M
n+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(M
n)を構成するアミノ酸の最後(C末端側)から2番目のアミノ酸
を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、
1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸を、対象DNA塩基または対象DNA塩基配列に対応した特定のアミノ酸の組み合わせで有するPPRモチーフである、DNA塩基選択的に、またはDNA塩基配列特異的に結合可能なタンパク質。
[2] 1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、[1]に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
(1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)である;
(1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
(1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
に基づいて決定される、タンパク質。
[3] 1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、[1]に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
(2-1) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-7) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
(2-9) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
(2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
(2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
(2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
に基づいて決定される、前記タンパク質。
[4] [1]に定義されるPPRモチーフ(M
n)が、2〜30個含まれる、[1]〜[3]のいずれか1項に記載のタンパク質。
[5] [1]に定義されるPPRモチーフ(M
n)が、5〜25個含まれる、[1]〜[3]のいずれか1項に記載のタンパク質。
[6] [1]に定義されるPPRモチーフ(M
n)が、9〜15個含まれる、[1]〜[3]のいずれか1項に記載のタンパク質。
[7] PPRモチーフを9個有するSEQ ID NO: 1のアミノ酸配列、PPRモチーフを11個有するSEQ ID NO: 2のアミノ酸配列、PPRモチーフを15個有するSEQ ID NO: 3のアミノ酸配列、PPRモチーフを10個有するSEQ ID NO: 4のアミノ酸配列、PPRモチーフを11個有するSEQ ID NO: 5のアミノ酸配列から選択される配列からなる、[6]に記載のPPRタンパク質。
[8] [1]に定義されるPPRモチーフ(M
n)を、1個以上(好ましくは2〜30個)含む、DNA結合性タンパク質の標的となるDNA塩基、またはDNA塩基配列を同定する方法であって:
同定が、[1]に記載の(1-1)〜(1-9)または3に記載の(2-1)〜(2-50)のいずれかに基づいて、PPRモチーフの1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせに応じたDNA塩基の有無を認定することにより行われる、方法。
[9] 標的DNA塩基、または特定の塩基配列を有する標的DNAに結合可能な、[1]に定義されるPPRモチーフ(M
n)を1個以上(好ましくは2〜30個)含む、PPRタンパク質を同定する方法であって:
同定が、[1]に記載の(1-1)〜(1-9)または[1]に記載の(2-1)〜(2-50)のいずれか基づいて、標的DNA塩基、または標的DNAを構成する特定の塩基に応じた、PPRモチーフの1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせの有無を認定することにより行われる、方法。
[10] [1]に記載されたタンパク質を用いる、DNAの機能の制御方法。
[11] [1]に記載されたタンパク質からなる領域と機能性領域とが連結されてなる、複合体。
[12] 複合体が、[1]に記載されたタンパク質のC末端側に、機能性領域を融合してなる、[11]に記載の複合体。
[13] 機能性領域が、DNA切断酵素またはそのヌクレアーゼドメイン、または転写制御ドメインであり、複合体が標的配列特異的DNA切断酵素、または転写制御因子として機能する、[11]または[12]に記載の複合体。
[14] DNA切断酵素がFokIのヌクレアーゼドメイン(SEQ ID NO: 6)である、[13]に記載の複合体。
[15] 以下の工程を含む、細胞の遺伝物質を改変する方法:
標的配列を有するDNAを含む細胞を準備し;そして
[11]に記載された複合体を細胞に導入することにより、複合体のタンパク質からなる領域が標的配列を有するDNAに結合し、そのため機能性領域が、標的配列を有するDNAを改変する、前記方法。
[16] PPRモチーフを1個以上含むPPRタンパク質を用いて、DNA塩基または特定の塩基配列を有するDNAを、同定、認識または標的化する方法。
[17] タンパク質が、構成するアミノ酸のうち3つが特定のアミノ酸の組み合わせであるものであるPPRモチーフを1個以上含む、[16]に記載の方法。
[18] タンパク質が、1に定義されたPPRモチーフ(Mn)を1個以上含む、[16]または[17]に記載の方法。