(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-06-27
(54)【発明の名称】核酸ガイドヌクレアーゼ細胞ターゲティングスクリーニングのための方法及び組成物
(51)【国際特許分類】
C12N 15/63 20060101AFI20220620BHJP
C12Q 1/686 20180101ALI20220620BHJP
C12Q 1/6869 20180101ALI20220620BHJP
C12Q 1/6837 20180101ALI20220620BHJP
C12N 1/15 20060101ALI20220620BHJP
C12N 1/19 20060101ALI20220620BHJP
C12N 1/21 20060101ALI20220620BHJP
C12N 5/10 20060101ALI20220620BHJP
C40B 40/08 20060101ALI20220620BHJP
C12Q 1/02 20060101ALN20220620BHJP
C12N 15/11 20060101ALN20220620BHJP
C07K 19/00 20060101ALN20220620BHJP
C12N 9/16 20060101ALN20220620BHJP
C07K 16/00 20060101ALN20220620BHJP
C12N 15/113 20100101ALN20220620BHJP
C12N 5/0789 20100101ALN20220620BHJP
C12N 5/0783 20100101ALN20220620BHJP
C12N 5/0787 20100101ALN20220620BHJP
C12N 5/0784 20100101ALN20220620BHJP
C12N 5/0786 20100101ALN20220620BHJP
【FI】
C12N15/63 Z
C12Q1/686 Z
C12Q1/6869 Z
C12Q1/6837 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C40B40/08
C12Q1/02 ZNA
C12N15/11 Z
C07K19/00
C12N9/16 Z
C07K16/00
C12N15/113 Z
C12N5/0789
C12N5/0783
C12N5/0787
C12N5/0784
C12N5/0786
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021562949
(86)(22)【出願日】2020-04-24
(85)【翻訳文提出日】2021-11-29
(86)【国際出願番号】 US2020029864
(87)【国際公開番号】W WO2020219913
(87)【国際公開日】2020-10-29
(32)【優先日】2019-04-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521437747
【氏名又は名称】スポットライト セラピューティクス
(74)【代理人】
【識別番号】100102978
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】タンベ アクシャイ
(72)【発明者】
【氏名】ジャヤラム ハリハラン
(72)【発明者】
【氏名】ストラット スティーブン
【テーマコード(参考)】
4B050
4B063
4B065
4H045
【Fターム(参考)】
4B050CC04
4B050CC05
4B050KK13
4B050LL10
4B063QA01
4B063QA13
4B063QA18
4B063QQ34
4B063QQ52
4B063QQ79
4B063QR08
4B063QR14
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QX01
4B065AA01X
4B065AA01Y
4B065AA26X
4B065AA26Y
4B065AA57X
4B065AA57Y
4B065AA72X
4B065AA72Y
4B065AA77X
4B065AA77Y
4B065AA83X
4B065AA83Y
4B065AA90X
4B065AA90Y
4B065AA93X
4B065AA93Y
4B065AB01
4B065AC14
4B065BA02
4B065CA23
4B065CA24
4B065CA46
4H045AA10
4H045AA30
4H045BA41
4H045DA89
4H045EA50
4H045FA74
(57)【要約】
核酸ガイドヌクレアーゼ細胞ターゲティングスクリーニングに関する方法及び組成物を提供する。本発明は、核酸ガイドヌクレアーゼ(例えば、Cas9)に会合するときに、少なくとも当該核酸ガイドヌクレアーゼを、標的細胞の表面にターゲティングさせる、または、標的細胞によって、すなわち、細胞ターゲティング剤により標的とされた細胞によって内部移行させることを可能にする、細胞ターゲティングタンパク質を識別するための組成物及び方法に関する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
細胞ターゲティング剤を識別する方法であって:
それぞれがRNAガイドヌクレアーゼ融合タンパク質及び固有の識別RNA(uiRNA)を含む複数のリボ核タンパク質(RNP)を提供することであって、前記RNAガイドヌクレアーゼ融合タンパク質が、RNAガイドヌクレアーゼまたはその機能性フラグメント、及び試験タンパク質を含み;前記uiRNAが、ガイドRNA(gRNA)及び配列識別子を含む、提供すること;
前記RNPを標的細胞の集団と接触させること;
前記標的細胞の集団からRNAを単離し、それにより、単離されたRNAを得ること;ならびに
前記識別子配列の存在に関して、前記単離されたRNAを試験することであって、前記識別子配列の存在が、前記試験タンパク質が細胞ターゲティング剤であることを示す、試験すること
を含む、前記方法。
【請求項2】
細胞ターゲティング剤を識別する方法であって:
RNAガイドヌクレアーゼまたはその機能性フラグメント、及び試験タンパク質を含む、RNAガイドヌクレアーゼ融合タンパク質をコードし、かつ、ガイドRNA(gRNA)及び配列識別子を含む固有の識別RNA(uiRNA)をコードするベクターを提供すること;
前記ベクターを、前記RNAガイドヌクレアーゼ融合タンパク質及び前記uiRNAを発現するのに好適な宿主細胞に移入すること;
それぞれが前記RNAガイドヌクレアーゼ融合タンパク質及び前記uiRNAを含むリボ核タンパク質(RNP)が形成されるように、前記宿主細胞において前記RNAガイドヌクレアーゼ融合タンパク質及び前記uiRNAを発現すること;
前記RNPを前記宿主細胞から単離すること;
前記RNPを標的細胞の集団と接触させること;
前記標的細胞の集団からRNAを単離すること;ならびに
前記識別子配列の存在に関して、前記単離されたRNAを試験することであって、前記識別子配列の存在が、前記試験タンパク質が細胞ターゲティング剤であることを示す、試験すること
を含む、前記方法。
【請求項3】
前記核酸配列識別子をコードする前記ベクターの部分及び前記試験タンパク質をコードする前記ベクターの部分が、前記ベクターが前記宿主細胞に移入される前にシーケンシングされて、これにより、前記試験タンパク質を識別するためのリファレンスを提供する、請求項2に記載の方法。
【請求項4】
前記識別子配列の存在が、ポリメラーゼ連鎖反応(PCR)または核酸マイクロアレイを使用して検出される、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記ベクターが、複数のベクター内にあり、前記複数のベクターは、宿主細胞当たりの平均ベクターが1以上となるような条件下で宿主細胞に移入される、請求項2~4のいずれか一項に記載の方法。
【請求項6】
前記ベクターが、前記RNAガイドヌクレアーゼ融合タンパク質をコードする核酸配列に動作可能に連結された第1プロモーター、及び前記uiRNAをコードする核酸配列に動作可能に連結された第2プロモーターを含む、請求項2~5のいずれか一項に記載の方法。
【請求項7】
前記RNAガイドヌクレアーゼ融合タンパク質の発現レベル及び前記uiRNAの発現レベルが、RNPを得るよう制御され得るように、前記第1及び第2プロモーターがそれぞれ誘導性である、請求項6に記載の方法。
【請求項8】
前記第1及び/または第2プロモーターが、構成的プロモーターである、請求項6に記載の方法。
【請求項9】
前記ベクターが、前記ベクターが移入された前記宿主細胞について選択する選択可能なマーカーを含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記ベクターが、細菌の複製起点を含む、請求項2~9のいずれか一項に記載の方法。
【請求項11】
前記ベクターが、真核生物の複製起点を含む、請求項2~9のいずれか一項に記載の方法。
【請求項12】
前記細胞ターゲティング剤が、前記標的細胞のコンパートメントに内部移行する、または前記標的細胞の細胞表面に結合する、のいずれかである、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記コンパートメントが、膜結合型細胞小器官または細胞質である、請求項12に記載の方法。
【請求項14】
前記膜結合型細胞小器官が、核、小胞体、ゴルジ装置、液胞、リソソーム、エンドソーム、またはミトコンドリアである、請求項13に記載の方法。
【請求項15】
前記単離されたRNAが、RNA単離の前に前記標的細胞から抽出される膜結合型細胞小器官から得られる、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記単離されたRNAが、RNA単離の前に前記標的細胞から抽出される細胞質から得られる、請求項1~13のいずれか一項に記載の方法。
【請求項17】
前記試験する工程が、前記単離されたRNAを逆転写してcDNAを産生すること、及び前記cDNAをシーケンシングして前記識別子配列の存在を決定することを含む、請求項1~16のいずれか一項に記載の方法。
【請求項18】
前記試験する工程が、前記単離されたRNAをシーケンシングして前記識別子配列の存在を決定することを含む、請求項1~16のいずれか一項に記載の方法。
【請求項19】
前記試験タンパク質が、ペプチドである、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記試験タンパク質が、抗原結合タンパク質である、請求項1~18のいずれか一項に記載の方法。
【請求項21】
前記抗原結合タンパク質が、ナノボディ、ドメイン抗体、scFv、Fab、ダイアボディ、BiTE、ダイアボディ、DART、ミニボディ、F(ab’)
2、イントラボディ、または抗体模倣体である、請求項20に記載の方法。
【請求項22】
前記抗体模倣体が、アドネクチン(すなわち、フィブロネクチン系結合分子)、アフィリン、アフィマー、アフィチン、アルファボディ、アフィボディ、DARPin、アンチカリン、アビマー、フィノマー、クニッツドメインペプチド、モノボディ、ナノクランプ、ユニボディ、またはヴァーサボディ、アプタマー、またはシクロチドである、請求項21に記載の方法。
【請求項23】
前記試験タンパク質が、リガンド、またはその部分である、請求項1~17のいずれか一項に記載の方法。
【請求項24】
前記宿主細胞が真核細胞である、請求項1~23のいずれか一項に記載の方法。
【請求項25】
前記宿主細胞が細菌細胞である、請求項1~23のいずれか一項に記載の方法。
【請求項26】
前記細菌細胞が、大腸菌(E.coli)である、請求項25に記載の方法。
【請求項27】
前記RNAガイドヌクレアーゼが、クラス2のCasポリペプチドである、請求項1~26のいずれか一項に記載の方法。
【請求項28】
前記クラス2のCasポリペプチドが、II型、V型、またはVI型Casポリペプチドである、請求項27に記載の方法。
【請求項29】
前記II型Casポリペプチドが、Cas9である、請求項28に記載の方法。
【請求項30】
前記標的細胞が、哺乳類細胞である、請求項1~29のいずれか一項に記載の方法。
【請求項31】
前記哺乳類細胞が、造血幹細胞(HSC)、好中球、T細胞、B細胞、樹状細胞、マクロファージ、眼の細胞、または線維芽細胞である、請求項30に記載の方法。
【請求項32】
細胞発現ベクターであって:
試験タンパク質の核酸を挿入するためにクローニング部位に動作可能に連結されたRNAガイドヌクレアーゼをコードし、それにより、前記RNAガイドヌクレアーゼ及び前記試験タンパク質を含むRNAガイドヌクレアーゼ融合タンパク質を形成する、核酸;ならびに
固有の識別RNA(uiRNA)をコードする核酸であって、前記uiRNAがガイドRNA及び配列識別子を含む、前記核酸
を含む、前記細胞発現ベクター。
【請求項33】
前記試験タンパク質を含む核酸をさらに含む、請求項32に記載の細胞発現ベクター。
【請求項34】
プラスミドである、請求項32または33に記載の細胞発現ベクター。
【請求項35】
前記RNAガイドヌクレアーゼをコードする核酸配列に動作可能に連結された第1プロモーターを含み、かつ、前記uiRNAをコードする核酸配列に動作可能に連結された第2プロモーターを含む、請求項32~34のいずれか一項に記載の細胞発現ベクター。
【請求項36】
前記第1及び第2プロモーターは、それぞれが、前記RNAガイドヌクレアーゼ融合タンパク質の発現レベル及び前記uiRNAの発現レベルが制御され得るような誘導性の要素を含む、請求項35に記載の細胞発現ベクター。
【請求項37】
前記第1及び/または第2プロモーターが、T7またはT5である、請求項35または36に記載の細胞発現ベクター。
【請求項38】
前記第1及び/または第2プロモーターが、構成的プロモーターである、請求項35に記載の細胞発現ベクター。
【請求項39】
選択可能なマーカーを含む、請求項32~38のいずれか一項に記載の細胞発現ベクター。
【請求項40】
細菌の複製起点を含む、請求項32~39のいずれか一項に記載の細胞発現ベクター。
【請求項41】
真核生物の複製起点を含む、請求項32~39のいずれか一項に記載の細胞発現ベクター。
【請求項42】
前記RNAガイドヌクレアーゼが、クラス2のCasポリペプチドである、請求項32~41のいずれか一項に記載の細胞発現ベクター。
【請求項43】
前記クラス2のCasポリペプチドが、II型、V型、またはVI型Casポリペプチドである、請求項42に記載の細胞発現ベクター。
【請求項44】
前記II型Casポリペプチドが、Cas9である、請求項43に記載の細胞発現ベクター。
【請求項45】
請求項32~44のいずれか一項に記載の細胞発現ベクターを含む、キット。
【請求項46】
前記試験タンパク質をコードするポリヌクレオチドを前記細胞発現ベクターのクローニング部位に挿入するための試薬をさらに含む、請求項45に記載のキット。
【請求項47】
請求項32~44のいずれか一項に記載の細胞発現ベクターを含む、単離された細胞。
【請求項48】
真核細胞または細菌細胞である、請求項47に記載の細胞。
【請求項49】
前記真核細胞が、哺乳類細胞、酵母細胞、または昆虫細胞である、請求項48に記載の細胞。
【請求項50】
前記哺乳類細胞が、COP細胞、L細胞、C127細胞、Sp2/0細胞、NS-0細胞、NIH3T3細胞、PC12細胞、PC12h細胞、BHK細胞、CHO細胞、COS1細胞、COS3細胞、COST細胞、CV1細胞、Vero細胞、HeLa細胞、HEK-293細胞、PER C6細胞、2倍体線維芽細胞由来の細胞、骨髄腫細胞、またはHepG2である、請求項49に記載の細胞。
【請求項51】
前記酵母細胞が、ピキア・パストリス(Pichia pastoris)または出芽酵母(Saccharomyces cerevisiae)であり、前記昆虫細胞が、ツマジロクサヨトウ(Spodoptera frugiperda)である、請求項49に記載の細胞。
【請求項52】
前記細菌細胞が、大腸菌細胞である、請求項48に記載の細胞。
【請求項53】
前記RNAガイドヌクレアーゼ融合タンパク質及び前記uiRNAを含む少なくとも1つのRNPを作製するための方法であって、請求項32~44のいずれか一項に記載の発現ベクターを含む細胞を、前記少なくとも1つのRNPの発現及びアセンブリを可能にする条件下で細胞培養培地において培養することを含む、前記方法。
【請求項54】
前記少なくとも1つのRNPが、前記細胞培養培地中に分泌され、方法が、前記細胞培養培地から前記少なくとも1つのRNPを単離する工程をさらに含む、請求項51に記載の方法。
【請求項55】
請求項32~44のいずれか一項に記載の、複数の細胞発現ベクターを含む、細胞発現ベクターのライブラリ。
【請求項56】
前記細胞発現ベクターのそれぞれが、異なる配列識別子を含む、請求項55に記載のライブラリ。
【発明の詳細な説明】
【背景技術】
【0001】
発明の背景
CRISPR会合RNAガイドエンドヌクレアーゼ、例えば、Cas9は、様々な細胞タイプ及び生物におけるゲノム工学のための多目的なツールとなっている(例えば、US8,697,359(特許文献1)を参照されたい)。ガイドRNA、例えば、二重-RNA複合体またはキメラ単一ガイドRNAによってガイドされると、RNAガイドエンドヌクレアーゼ(例えば、Cas9)は、標的核酸(例えば、二本鎖DNA(dsDNA)、一本鎖DNA(ssDNA)、またはRNA)内に部位特異的二本鎖切断(DSB)または一本鎖切断(SSB)を生じ得る。標的核酸の開裂が細胞(例えば、真核細胞)内で起こると、標的核酸における切断は、非相同末端結合(NHEJ)または相同組み換え修復(HDR)によって修復され得る。また、触媒不活性RNAガイドエンドヌクレアーゼ(例えば、Cas9)は、単独で、または、転写アクチベーターもしくはリプレッサードメインと融合して、開裂することなく標的部位に結合することによって標的核酸内の部位で転写レベルを変更するのに使用され得る。しかし、RNAガイドエンドヌクレアーゼを特定の細胞または組織にターゲティングさせる能力は、依然として課題のままである。そのため、所望の細胞または組織をターゲティングする能力によってRNAガイドエンドヌクレアーゼを識別するという、満たされていない要求が存在する。
【先行技術文献】
【特許文献】
【0002】
【発明の概要】
【0003】
核酸ガイドヌクレアーゼを細胞にターゲティングさせ及び/または当該細胞もしくはそのコンパートメント(例えば、核)への当該核酸ガイドヌクレアーゼの内部移行を促進することが可能である細胞標的指向剤を識別するためのスクリーニングに関する方法及び組成物を本明細書において提供する。
【0004】
一態様において、細胞ターゲティング剤を識別する方法であって:それぞれがRNAガイドヌクレアーゼ融合タンパク質及び固有の識別RNA(uiRNA)を含む複数のリボ核タンパク質(RNP)を提供することであって、RNAガイドヌクレアーゼ融合タンパク質が、RNAガイドヌクレアーゼ、またはその機能性フラグメント、及び試験タンパク質を含み、uiRNAが、ガイドRNA(gRNA)及び配列識別子を含む、提供すること;RNPを標的細胞の集団と接触させること;標的細胞の集団からRNAを単離し、それにより、単離されたRNAを得ること;ならびに、識別子配列の存在に関して、単離されたRNAを試験することであって、識別子配列の存在が、試験タンパク質が細胞ターゲティング剤であることを示す、試験すること、を含む、上記方法を本明細書において提供する。
【0005】
別の態様において、細胞ターゲティング剤を識別する方法であって:RNAガイドヌクレアーゼ、またはその機能性フラグメント、及び試験タンパク質を含むRNAガイドヌクレアーゼ融合タンパク質をコードし、かつ、ガイドRNA(gRNA)及び配列識別子を含む固有の識別RNA(uiRNA)をコードするベクターを提供すること;上記ベクターを、RNAガイドヌクレアーゼ融合タンパク質及びuiRNAを発現するのに好適な宿主細胞に移入すること;それぞれがRNAガイドヌクレアーゼ融合タンパク質及びuiRNAを含むリボ核タンパク質(RNP)が形成されるように、宿主細胞においてRNAガイドヌクレアーゼ融合タンパク質及びuiRNAを発現すること;RNPを宿主細胞から単離すること;RNPを標的細胞の集団と接触させること;標的細胞の集団からRNAを単離すること;ならびに、識別子配列の存在に関して、単離されたRNAを試験することであって、識別子配列の存在が、試験タンパク質が細胞ターゲティング剤であることを示す、試験すること、を含む、上記方法を本明細書において提供する。
【0006】
いくつかの実施形態において、核酸配列識別子及び試験タンパク質をコードするベクターの部分は、ベクターが宿主細胞に移入される前にシーケンシングされて、これにより、試験タンパク質を識別するためのリファレンスを提供する。
【0007】
いくつかの実施形態において、識別子配列の存在は、ポリメラーゼ連鎖反応(PCR)または核酸マイクロアレイを使用して検出される。
【0008】
いくつかの実施形態において、ベクターは、複数のベクター内にあり、複数のベクターは、宿主細胞当たりの平均ベクターが1以上となるような条件下で宿主細胞に移入される。いくつかの実施形態において、ベクターは、複数のベクター内にあり、複数のベクターは、宿主細胞当たりの平均ベクターが1未満となるような条件下で宿主細胞に移入される。
【0009】
いくつかの実施形態において、ベクターは、RNAガイドヌクレアーゼ融合タンパク質をコードする核酸配列に動作可能に連結された第1プロモーター、及びuiRNAをコードする核酸配列に動作可能に連結された第2プロモーターを含む。ある特定の実施形態において、第1及び第2プロモーターは、RNAガイドヌクレアーゼ融合タンパク質の発現レベル及びuiRNAの発現レベルが、RNPを得るように制御され得るようにそれぞれ誘導性である。ある特定の実施形態において、第1及び/または第2プロモーターは、T7またはT5である。
【0010】
いくつかの実施形態において、第1及び/または第2プロモーターは、構成的プロモーターである。
【0011】
いくつかの実施形態において、ベクターは、そのベクターが移入された宿主細胞を選択するための選択可能なマーカーを含む。いくつかの実施形態において、選択可能なマーカーは、発現の際に、選択因子(例えば、薬物、例えば、抗生物質)への耐性を与える遺伝子である。いくつかの実施形態において、選択可能なマーカーは、発現の際に、識別可能な表現型を与える遺伝子である。例えば、選択可能なマーカーは、視覚的に、または、機械、例えば、フローサイトメトリーによって識別され得るベクターを持つ細胞において蛍光を与える蛍光マーカーであってよい。
【0012】
いくつかの実施形態において、ベクターは、細菌の複製起点を含む。
【0013】
いくつかの実施形態において、ベクターは、真核生物の複製起点を含む。
【0014】
いくつかの実施形態において、細胞ターゲティング剤は、標的細胞のコンパートメントに内部移行する、または標的細胞の細胞表面に結合する、のいずれかである。ある特定の実施形態において、コンパートメントは、膜結合型細胞小器官または細胞質である。ある特定の実施形態において、膜結合型細胞小器官は、核、小胞体、ゴルジ装置、液胞、リソソーム、エンドソーム、またはミトコンドリアである。
【0015】
いくつかの実施形態において、単離されたRNAは、RNA単離の前に標的細胞から抽出される膜結合型細胞小器官から得られる。ある特定の実施形態において、膜結合型細胞小器官は、核、小胞体、ゴルジ装置、液胞、リソソーム、エンドソーム、またはミトコンドリアである。
【0016】
いくつかの実施形態において、単離されたRNAは、RNA単離の前に標的細胞から抽出される細胞質から得られる。
【0017】
いくつかの実施形態において、試験する工程は、単離されたRNAを逆転写してcDNAを産生すること、及びcDNAをシーケンシングして識別子配列の存在を決定することを含む。いくつかの実施形態において、試験する工程は、単離されたRNAをシーケンシングして識別子配列の存在を決定することを含む。
【0018】
いくつかの実施形態において、試験タンパク質は、ペプチドである。
【0019】
いくつかの実施形態において、試験タンパク質は、抗原結合タンパク質である。
【0020】
いくつかの実施形態において、抗原結合タンパク質は、ナノボディ、ドメイン抗体、scFv、Fab、ダイアボディ、BiTE、ダイアボディ、DART、ミニボディ、F(ab’)2、イントラボディ、または抗体模倣体である。ある特定の実施形態において、抗体模倣体は、アドネクチン(すなわち、フィブロネクチン系結合分子)、アフィリン、アフィマー、アフィチン、アルファボディ、アフィボディ、DARPin、アンチカリン、アビマー、フィノマー、クニッツドメインペプチド、モノボディ、ナノクランプ、ユニボディ、またはヴァーサボディ、アプタマー、またはシクロチドである。
【0021】
いくつかの実施形態において、試験タンパク質は、リガンド、またはその部分である。
【0022】
いくつかの実施形態において、宿主細胞は、真核細胞である。
【0023】
いくつかの実施形態において、宿主細胞は、細菌細胞である。ある特定の実施形態において、細菌細胞は、大腸菌(E.coli)である。
【0024】
いくつかの実施形態において、RNAガイドヌクレアーゼは、クラス2のCasポリペプチドである。ある特定の実施形態において、クラス2のCasポリペプチドは、II型、V型、またはVI型Casポリペプチドである。ある特定の実施形態において、II型Casポリペプチドは、Cas9である。
【0025】
いくつかの実施形態において、標的細胞は、哺乳類細胞である。ある特定の実施形態において、哺乳類細胞は、造血幹細胞(HSC)、好中球、T細胞、B細胞、樹状細胞、マクロファージ、眼の細胞、または線維芽細胞である。
【0026】
別の態様において、細胞発現ベクターであって:試験タンパク質の核酸を挿入するためにクローニング部位に動作可能に連結されたRNAガイドヌクレアーゼをコードし、それにより、RNAガイドヌクレアーゼ及び試験タンパク質を含むRNAガイドヌクレアーゼ融合タンパク質を形成する、核酸;ならびに、固有の識別RNA(uiRNA)をコードする核酸であって、当該uiRNAがガイドRNA及び配列識別子を含む、上記核酸;を含む、上記細胞発現ベクターを本明細書において提供する。
【0027】
いくつかの実施形態において、発現ベクターは、試験タンパク質をコードする核酸をさらに含む。
【0028】
いくつかの実施形態において、発現ベクターは、プラスミドである。
【0029】
いくつかの実施形態において、細胞発現ベクターは、RNAガイドヌクレアーゼをコードする核酸配列に動作可能に連結された第1プロモーターを含み、uiRNAをコードする核酸配列に動作可能に連結された第2プロモーターを含む。ある特定の実施形態において、第1及び第2プロモーターは、それぞれが、RNAガイドヌクレアーゼ融合タンパク質の発現レベル及びuiRNAの発現レベルが制御され得るような誘導性の要素を含む。ある特定の実施形態において、第1及び/または第2プロモーターは、T7またはT5である。
【0030】
いくつかの実施形態において、第1及び/または第2プロモーターは、構成的プロモーターである。
【0031】
いくつかの実施形態において、ベクターは、選択可能なマーカーを含む。いくつかの実施形態において、選択可能なマーカーは、発現の際に、選択因子(例えば、薬物、例えば、抗生物質)への耐性を与える遺伝子である。いくつかの実施形態において、選択可能なマーカーは、発現の際に、識別可能な表現型を与える遺伝子である。例えば、選択可能なマーカーは、視覚的に、または、機械、例えば、フローサイトメトリーによって識別され得るベクターを持つ細胞において蛍光を与える蛍光マーカーであってよい。
【0032】
いくつかの実施形態において、ベクターは、細菌の複製起点を含む。
【0033】
いくつかの実施形態において、ベクターは、真核生物の複製起点を含む。
【0034】
いくつかの実施形態において、RNAガイドヌクレアーゼは、クラス2のCasポリペプチドである。ある特定の実施形態において、クラス2のCasポリペプチドは、II型、V型、またはVI型Casポリペプチドである。ある特定の実施形態において、II型Casポリペプチドは、Cas9である。
【0035】
別の態様において、本発明の細胞発現ベクターのいずれかを含むキットを本明細書において提供する。
【0036】
いくつかの実施形態において、キットは、試験タンパク質をコードするポリヌクレオチドを細胞発現ベクターのクローニング部位に挿入するための試薬をさらに含む。
【0037】
別の態様において、本発明の細胞発現ベクターのいずれかを含む単離された細胞を本明細書において提供する。ある特定の実施形態において、細胞は、真核細胞または細菌細胞である。いくつかの実施形態において、真核細胞は、哺乳類細胞、昆虫細胞、または酵母細胞である。ある特定の実施形態において、哺乳類細胞は、COP細胞、L細胞、C127細胞、Sp2/0細胞、NS-0細胞、NIH3T3細胞、PC12細胞、PC12h細胞、BHK細胞、CHO細胞、COS1細胞、COS3細胞、COST細胞、CV1細胞、Vero細胞、HeLa細胞、HEK-293細胞、PER C6細胞、2倍体線維芽細胞由来の細胞、骨髄腫細胞、またはHepG2である。ある特定の実施形態において、酵母細胞は、ピキア・パストリス(Pichia pastoris)または出芽酵母(Saccharomyces cerevisiae)である。ある特定の実施形態において、細菌細胞は、大腸菌細胞である。ある特定の実施形態において、昆虫細胞は、ツマジロクサヨトウ(Spodoptera frugiperda)細胞である。
【0038】
別の態様において、RNAガイドヌクレアーゼ融合タンパク質及びuiRNAを含む少なくとも1つのRNPを作製するための方法であって、本発明の発現ベクターのいずれかを含む細胞を、少なくとも1つのRNPの発現及びアセンブリを可能にする条件下で細胞培養培地において培養することを含む、上記方法を本明細書において提供する。いくつかの実施形態において、少なくとも1つのRNPは、細胞培養培地に分泌され、方法は、細胞培養培地から少なくとも1つのRNPを単離する工程をさらに含む。
【0039】
別の態様において、複数の本発明の細胞発現ベクターのいずれかを含む細胞発現ベクターのライブラリを、本明細書において提供する。いくつかの実施形態において、細胞発現ベクターは、それぞれが、異なる配列識別子を含む。
【0040】
さらなる実施形態において、選択された試験因子の変異体のサブライブラリを作成する方法を本明細書において提供し、本明細書において記載されている方法を使用して、サブライブラリを標的細胞集団と接触させた後にサブライブラリを試験して所望の活性を有する変異体を識別する。
【図面の簡単な説明】
【0041】
【
図1】Cas9の内部移行を効果的に容易にし得る細胞透過性ペプチドに関する例示的な核酸ガイドヌクレアーゼ細胞ターゲティングスクリーニングにおける工程を概説するフローチャートをグラフにより示す。
【
図2】それぞれが、試験CPPと会合する固有の識別RNA(uiRNA)をコードするCPP-Cas9ベクターのライブラリを作成する高スループットクローニングプロセスの結果を示す。Aは、uiRNA及び6xHis-CPP
*-Cas9-2xNLS(配列番号22として開示されている「6xHis」)(星印はCPPが可変であることを示している)をコードする核酸のマップを示す。Bは、およそ5000の大腸菌形質転換細胞の小さなライブラリからのコロニーを含む例示的な寒天プレートの写真を示す。Cは、核酸ラダー(レーン1)と比較した、PCR増幅したCPP-Cas9プラスミドライブラリ(約1200bpバンド;レーン2及び3)の2つの複製のゲル電気泳動分析の結果を示す。
【
図3】CPP-Cas9プラスミドライブラリのシーケンシングに関する結果を示す。Aは、2つのライブラリ複製間のプラスミド-seq固有の分子識別子(UMI)カウントを比較した結果をグラフにより示す。Bは、x軸における存在度によって及びy軸に示されている相対存在度(百万当たりのカウント)を用いて選別されるライブラリにおいて表される各CPP-Cas9-融合物に関するライブラリカバレッジ分布をグラフにより示す。
【
図4A】プラスミド不均一性を評価する研究の結果を示す。2つのライブラリ複製に関してのCPP-Cas9融合物当たりのプラスミドUMIの数をグラフにより示し、大腸菌におけるライブラリバイアスまたはクローニングバイアスを示唆している(例えば、コピー数または成長率)。
【
図4B】プラスミド不均一性を評価する研究の結果を示す。CPP-Cas9融合物当たりのsgRNAバーコード(すなわち、uiRNA)の数をグラフにより示し、ライブラリアセンブリバイアスを示唆している。
【
図4C】プラスミド不均一性を評価する研究の結果を示す。sgRNAバーコード(すなわち、uiRNA)当たりのUMIの数をグラフにより示し、シーケンシングバイアスを示唆している。
【
図5A】CPP-Cas9融合物間で形成されバーコード化されたRNP、または、大腸菌におけるプラスミドライブラリにおいてプラスミドから発現されたGFP sgRNAのライブラリの共精製に関する結果を示す。それぞれ示されたRNP精製工程から収集したサンプルにおけるタンパク質(例えば、Cas9、150kDaバンド)のSDS-PAGEゲル分析(クーマシー染色)の画像を示す。
【
図5B】CPP-Cas9融合物間で形成されバーコード化されたRNP、または、大腸菌におけるプラスミドライブラリにおいてプラスミドから発現されたGFP sgRNAのライブラリの共精製に関する結果を示す。それぞれ示されたRNP精製工程から収集したサンプルにおける核酸のゲル電気泳動分析(2%アガロース;SyBr safe染料)の画像を示す。
【
図5C】CPP-Cas9融合物間で形成されバーコード化されたRNP、または、大腸菌におけるプラスミドライブラリにおいてプラスミドから発現されたGFP sgRNAのライブラリの共精製に関する結果を示す。S200カラムにおける精製されたRNPのサイズ排除分析からのクロマトグラムをグラフにより示す。
【
図5D】CPP-Cas9融合物間で形成されバーコード化されたRNP、または、大腸菌におけるプラスミドライブラリにおいてプラスミドから発現されたGFP sgRNAのライブラリの共精製に関する結果を示す。精製されたRNPから抽出されたバルクRNAのゲル電気泳動分析(2%アガロース、SyBr Safe染料)の画像を示す。Synthego sgRNAを陽性対照として示す。
【
図6】CPP-Cas9 RNPのライブラリと共精製したRNAの逆転写から得られた産物のゲル電気泳動分析(2%アガロースゲル、SyBr Safe染料)の画像を示し、バーコード化されたまたはGFP sgRNA産物、鋳型なしの陰性対照、及びSynthego sgRNA陽性対照を示す。
【
図7】DNA開裂アッセイからのサンプルのゲル電気泳動分析(2%アガロースゲル、SyBr Safe染料)の画像を示し、標的sgRNA(GFP)及び非標的sgRNA(バーコード)を有するCPP-Cas9 RNPのライブラリをdsRNAによってインキュベートした。非開裂及び開裂dsRNAに相当するバンドを示す。RNPなしの対照条件からのdsRNAも示す。
【
図8】CPP-Cas9 RNPのライブラリによる共精製されたRNAのRNA-seq分析からの結果をグラフにより示し、複製間のRNA-seq UMIカウント(A)、及びプラスミド対RNPの存在度についてのサンプルの相互関係(B)を比較している。
【
図9】1時間または5時間のいずれかでCPP-Cas9 RNPのライブラリと共インキュベートしたヒトまたはマウスT細胞から単離した核RNAのゲル電気泳動分析の画像を示す。gRNAを上方のバンドによって表す。RNP単独または陰性対照(緩衝剤と(しかし、Cas9 RNPなし)5時間共インキュベートしたT細胞またはヒトT細胞)からのRNAも評価した。
【
図10】1時間(A)または5時間(B)、精製されたCPP-Cas9 RNPのライブラリによってインキュベートした刺激ヒトT細胞から単離したRNAに関する複製間のRNA-seq UMIカウントを比較したRNA-seq結果をグラフにより示す。
【
図11A】1時間(A)または5時間(B及びC)のいずれかでCPP-Cas9 RNPのライブラリと共インキュベートした、ヒト刺激T細胞において異なって発現され内部移行されたCPP-Cas9 RNPと会合するRNAを分析した結果をグラフにより示す。グラフは、ヒト刺激T細胞から得られる核抽出物(ATSeq-01C)においてシーケンシングされたRNAの変化倍率を、出発物質(共インキュベーション前にプールされたRNP;ATSeq-01A)においてシーケンシングされかつ合計RNP存在度(ATSeq-01A;y軸)に対してプロットされるRNAの変化倍率に対して比較する。Cは、CPP-Cas9 RNPのライブラリとの5時間の共インキュベーション後に、ヒト刺激T細胞において高い存在度及び高い核内部移行を有するCPP-Cas9 RNPと会合するRNAを表す重要なデータ点(星印を参照されたい)をハイライトしている。ハイライトしたデータ点に会合するCPPを表1にまとめる。
【
図11B】1時間(A)または5時間(B及びC)のいずれかでCPP-Cas9 RNPのライブラリと共インキュベートした、ヒト刺激T細胞において異なって発現され内部移行されたCPP-Cas9 RNPと会合するRNAを分析した結果をグラフにより示す。グラフは、ヒト刺激T細胞から得られる核抽出物(ATSeq-01C)においてシーケンシングされたRNAの変化倍率を、出発物質(共インキュベーション前にプールされたRNP;ATSeq-01A)においてシーケンシングされかつ合計RNP存在度(ATSeq-01A;y軸)に対してプロットされるRNAの変化倍率に対して比較する。Cは、CPP-Cas9 RNPのライブラリとの5時間の共インキュベーション後に、ヒト刺激T細胞において高い存在度及び高い核内部移行を有するCPP-Cas9 RNPと会合するRNAを表す重要なデータ点(星印を参照されたい)をハイライトしている。ハイライトしたデータ点に会合するCPPを表1にまとめる。
【
図11C】1時間(A)または5時間(B及びC)のいずれかでCPP-Cas9 RNPのライブラリと共インキュベートした、ヒト刺激T細胞において異なって発現され内部移行されたCPP-Cas9 RNPと会合するRNAを分析した結果をグラフにより示す。グラフは、ヒト刺激T細胞から得られる核抽出物(ATSeq-01C)においてシーケンシングされたRNAの変化倍率を、出発物質(共インキュベーション前にプールされたRNP;ATSeq-01A)においてシーケンシングされかつ合計RNP存在度(ATSeq-01A;y軸)に対してプロットされるRNAの変化倍率に対して比較する。Cは、CPP-Cas9 RNPのライブラリとの5時間の共インキュベーション後に、ヒト刺激T細胞において高い存在度及び高い核内部移行を有するCPP-Cas9 RNPと会合するRNAを表す重要なデータ点(星印を参照されたい)をハイライトしている。ハイライトしたデータ点に会合するCPPを表1にまとめる。
【
図12A】線維芽細胞におけるCPP-Cas9 RNP内部移行に関してのスクリーニングの結果をグラフにより示す。線維芽細胞を、精製されたCPP-Cas9 RNPのプールされたライブラリと、37℃で1時間共インキュベートし、その後、細胞を洗浄し、核及び細胞質ゾルに分画し、RNA-seqによってさらに分析した。Aは、入力対照、非分画細胞、細胞質画分、及び核画分からのuiRNAカウントにおける主な構成要素の分析の結果をグラフにより示す。これらの結果を、使用した共インキュベーションプロトコル(低RNP濃度対高RNP濃度プロトコル)に基づいてさらに分析した。Bは、P値(y軸)に対して火山プロットにおいてプロットした、入力対照におけるRNAに対する核抽出物におけるRNAの変化倍率(x軸)をグラフにより示す。プールされたCPP-Cas9 RNPとの共インキュベーション後の線維芽細胞における核局在化を表すCPP-Cas9 RNPと会合するRNAをグラフの右上部分に示す(Bの囲まれた部分及びCにおける星印状のヒットを参照されたい)。Cは、線維芽細胞において核内部移行が富化したCPP-Cas9 RNPと会合するRNAを表すBの頂部の8つのデータ点をハイライトしている(星印状のデータ点を参照されたい)。Dは、スクリーニングにおいて識別されたCPPのハイドロパシー(y軸)及び残基当たりの正味電荷(x軸)をグラフにより示す。各ドットは、B及びCにおけるペプチドを表しており、ドットのサイズが、P値(Log10)を示しており、陰影部分は変化倍率(Log10)を示している。グラフの右下部分におけるデータは、疎水性度が低い高電荷のCPPを示している。B及びDにおける丸状のデータ点は、同じCPP-Cas9 RNPに関するデータに相当する(例えば、各図における丸状のデータ点1は、同じCPP-Cas9 RNPに関するデータに相当する)。丸状のデータ点1は、高電荷のCPPヒットに相当し、丸状のデータ点2は、非極性CPPヒットに相当する。
【
図12B】線維芽細胞におけるCPP-Cas9 RNP内部移行に関してのスクリーニングの結果をグラフにより示す。線維芽細胞を、精製されたCPP-Cas9 RNPのプールされたライブラリと、37℃で1時間共インキュベートし、その後、細胞を洗浄し、核及び細胞質ゾルに分画し、RNA-seqによってさらに分析した。Aは、入力対照、非分画細胞、細胞質画分、及び核画分からのuiRNAカウントにおける主な構成要素の分析の結果をグラフにより示す。これらの結果を、使用した共インキュベーションプロトコル(低RNP濃度対高RNP濃度プロトコル)に基づいてさらに分析した。Bは、P値(y軸)に対して火山プロットにおいてプロットした、入力対照におけるRNAに対する核抽出物におけるRNAの変化倍率(x軸)をグラフにより示す。プールされたCPP-Cas9 RNPとの共インキュベーション後の線維芽細胞における核局在化を表すCPP-Cas9 RNPと会合するRNAをグラフの右上部分に示す(Bの囲まれた部分及びCにおける星印状のヒットを参照されたい)。Cは、線維芽細胞において核内部移行が富化したCPP-Cas9 RNPと会合するRNAを表すBの頂部の8つのデータ点をハイライトしている(星印状のデータ点を参照されたい)。Dは、スクリーニングにおいて識別されたCPPのハイドロパシー(y軸)及び残基当たりの正味電荷(x軸)をグラフにより示す。各ドットは、B及びCにおけるペプチドを表しており、ドットのサイズが、P値(Log10)を示しており、陰影部分は変化倍率(Log10)を示している。グラフの右下部分におけるデータは、疎水性度が低い高電荷のCPPを示している。B及びDにおける丸状のデータ点は、同じCPP-Cas9 RNPに関するデータに相当する(例えば、各図における丸状のデータ点1は、同じCPP-Cas9 RNPに関するデータに相当する)。丸状のデータ点1は、高電荷のCPPヒットに相当し、丸状のデータ点2は、非極性CPPヒットに相当する。
【
図12C】線維芽細胞におけるCPP-Cas9 RNP内部移行に関してのスクリーニングの結果をグラフにより示す。線維芽細胞を、精製されたCPP-Cas9 RNPのプールされたライブラリと、37℃で1時間共インキュベートし、その後、細胞を洗浄し、核及び細胞質ゾルに分画し、RNA-seqによってさらに分析した。Aは、入力対照、非分画細胞、細胞質画分、及び核画分からのuiRNAカウントにおける主な構成要素の分析の結果をグラフにより示す。これらの結果を、使用した共インキュベーションプロトコル(低RNP濃度対高RNP濃度プロトコル)に基づいてさらに分析した。Bは、P値(y軸)に対して火山プロットにおいてプロットした、入力対照におけるRNAに対する核抽出物におけるRNAの変化倍率(x軸)をグラフにより示す。プールされたCPP-Cas9 RNPとの共インキュベーション後の線維芽細胞における核局在化を表すCPP-Cas9 RNPと会合するRNAをグラフの右上部分に示す(Bの囲まれた部分及びCにおける星印状のヒットを参照されたい)。Cは、線維芽細胞において核内部移行が富化したCPP-Cas9 RNPと会合するRNAを表すBの頂部の8つのデータ点をハイライトしている(星印状のデータ点を参照されたい)。Dは、スクリーニングにおいて識別されたCPPのハイドロパシー(y軸)及び残基当たりの正味電荷(x軸)をグラフにより示す。各ドットは、B及びCにおけるペプチドを表しており、ドットのサイズが、P値(Log10)を示しており、陰影部分は変化倍率(Log10)を示している。グラフの右下部分におけるデータは、疎水性度が低い高電荷のCPPを示している。B及びDにおける丸状のデータ点は、同じCPP-Cas9 RNPに関するデータに相当する(例えば、各図における丸状のデータ点1は、同じCPP-Cas9 RNPに関するデータに相当する)。丸状のデータ点1は、高電荷のCPPヒットに相当し、丸状のデータ点2は、非極性CPPヒットに相当する。
【
図12D】線維芽細胞におけるCPP-Cas9 RNP内部移行に関してのスクリーニングの結果をグラフにより示す。線維芽細胞を、精製されたCPP-Cas9 RNPのプールされたライブラリと、37℃で1時間共インキュベートし、その後、細胞を洗浄し、核及び細胞質ゾルに分画し、RNA-seqによってさらに分析した。Aは、入力対照、非分画細胞、細胞質画分、及び核画分からのuiRNAカウントにおける主な構成要素の分析の結果をグラフにより示す。これらの結果を、使用した共インキュベーションプロトコル(低RNP濃度対高RNP濃度プロトコル)に基づいてさらに分析した。Bは、P値(y軸)に対して火山プロットにおいてプロットした、入力対照におけるRNAに対する核抽出物におけるRNAの変化倍率(x軸)をグラフにより示す。プールされたCPP-Cas9 RNPとの共インキュベーション後の線維芽細胞における核局在化を表すCPP-Cas9 RNPと会合するRNAをグラフの右上部分に示す(Bの囲まれた部分及びCにおける星印状のヒットを参照されたい)。Cは、線維芽細胞において核内部移行が富化したCPP-Cas9 RNPと会合するRNAを表すBの頂部の8つのデータ点をハイライトしている(星印状のデータ点を参照されたい)。Dは、スクリーニングにおいて識別されたCPPのハイドロパシー(y軸)及び残基当たりの正味電荷(x軸)をグラフにより示す。各ドットは、B及びCにおけるペプチドを表しており、ドットのサイズが、P値(Log10)を示しており、陰影部分は変化倍率(Log10)を示している。グラフの右下部分におけるデータは、疎水性度が低い高電荷のCPPを示している。B及びDにおける丸状のデータ点は、同じCPP-Cas9 RNPに関するデータに相当する(例えば、各図における丸状のデータ点1は、同じCPP-Cas9 RNPに関するデータに相当する)。丸状のデータ点1は、高電荷のCPPヒットに相当し、丸状のデータ点2は、非極性CPPヒットに相当する。
【発明を実施するための形態】
【0042】
発明の詳細な説明
本発明は、ポリペプチドを編集する核酸ガイド遺伝子、例えば、Cas9、を、細胞にターゲティングさせるための細胞ターゲティング剤に関するスクリーニングのための組成物及び方法に関する。
【0043】
I.定義
用語「核酸ガイドヌクレアーゼ融合タンパク質」は、核酸配列を認識する核酸ガイドヌクレアーゼ(例えば、RNAガイドヌクレアーゼまたはDNAガイドヌクレアーゼ)にコンジュゲートした試験因子を含む分子の複合体を指す。核酸ガイドヌクレアーゼの例は、RNAガイドエンドヌクレアーゼ、例えば、Cas9である。
【0044】
本明細書において使用されているとき、「核酸ガイドヌクレアーゼ」は、修飾するポリペプチド自身または会合する分子(例えば、RNA)により特定の配列(複数可)の認識を介して特定の核酸配列または一連の同様のポリヌクレオチド鎖配列に標的とされるタンパク質を指し、ここで、ポリペプチドは、ポリヌクレオチド鎖を修飾し得る。
【0045】
本明細書において使用されているとき、用語「核酸」は、ポリヌクレオチド、オリゴヌクレオチド、または他のDNAもしくはRNAを含めた、ヌクレオチドを含む分子を指す。一実施形態において、核酸は、細胞に存在し、細胞分裂を介して細胞の子孫に伝達され得る。いくつかの場合において、核酸は、染色体内の細胞のゲノムにおいて見出される遺伝子(例えば、内在性遺伝子)である。他の場合において、核酸は、細胞にトランスフェクトされた哺乳類発現ベクターである。例えば、トランスフェクション方法を使用して細胞のゲノムに組み込まれるDNAはまた、組み込まれるDNAが子孫細胞に伝達されることが意図されていないときでも、本明細書において使用されているときの「核酸」の範囲内であるとされる。
【0046】
本明細書において使用されているとき、用語「核酸を修飾する」は、部位特異的な修飾ポリペプチドによって標的とされる核酸に対しての任意の修飾を指す。かかる修飾の例として、限定されないが、参照配列(例えば、野生型またはネイティブ配列)に対して核酸配列においてアミノ酸残基のいずれかの挿入、欠失、または置換を含む、アミノ酸配列についての任意の変化を含む。かかるアミノ酸変化は、例えば、遺伝子の発現の変化(例えば、発現の増加もしくは減少)または核酸配列の置き換えにつながり得る。核酸の修飾は、二本鎖開裂、一本鎖開裂、または標的部位への本明細書に開示されているいずれかのRNAガイドエンドヌクレアーゼの結合をさらに含み得る。RNAガイドエンドヌクレアーゼの結合は、核酸の発現を阻害し得、または、標的部位を含む核酸への動作可能な連結において任意の核酸の発現を増加させ得る。
【0047】
本明細書において使用されているとき、用語「固有の識別核酸」(uiNA)は、核酸ガイドヌクレアーゼに安定に会合することが可能であるガイド核酸(例えば、DNAまたはRNA)、及び、核酸の集団から核酸を区別するために使用され得る固有の配列識別子(例えば、バーコード)を含む核酸配列を指す。いくつかの実施形態において、uiNAは、ポリヌクレオチド(例えば、試験タンパク質もしくはCPP-試験タンパク質融合物をコードするポリヌクレオチド)に動作可能に連結され得、または、ポリペプチドと安定に会合して核タンパク質(例えば、RNPもしくはDNP)を形成し得る。したがって、uiNAにおける識別子は、uiNAに動作可能に連結されたポリヌクレオチド、または、uiNAに安定に会合された核タンパク質を識別するのに使用され得る。配列識別子は、ガイド核酸のいずれの箇所に位置していても、ガイド核酸に隣接していてもよい(例えば、crRNA、tracrRNAにあっても、もしくはこれに隣接していても、または、単一のガイドRNAにおけるcrRNA/trRNA間のテトラループにあってもよい)。いくつかの場合において、固有の識別子は、ランダム化されたガイド核酸である。かかる実施形態において、ランダム化されたガイド配列は、標的配列とハイブリダイズすることが可能でないが核酸ガイドヌクレアーゼと依然として安定して会合し得るものであってよい。他の実施形態において、ガイド核酸は、相補的核酸配列とハイブリダイズする能力を保持する。
【0048】
用語「細胞ターゲティング剤」は、核酸ガイドヌクレアーゼと会合しているとき、少なくとも、核酸ガイドヌクレアーゼ(例えば、Cas9)を、標的細胞の表面にターゲティングさせる、または、標的細胞、すなわち、細胞ターゲティング剤により標的とされる細胞によって内部移行させることができるタンパク質を指す。いくつかの実施形態において、細胞ターゲティング剤は、細胞膜において示される細胞外標的分子(例えば、細胞外タンパク質またはグリカン)に特異的に結合するものであってよい。かかる場合において、細胞ターゲティング剤は、少なくとも核酸ガイドヌクレアーゼが標的細胞、すなわち、細胞ターゲティング剤によって結合される細胞外分子を発現する細胞によって内部移行されるように核酸ガイドヌクレアーゼに会合され得る。いくつかの実施形態において、細胞ターゲティング剤は、細胞における膜結合型細胞小器官、例えば、核への核酸ガイドヌクレアーゼの内部移行を促進する。
【0049】
用語「ポリペプチド」または「タンパク質」は、本明細書において互換可能に使用されているとき、アミノ酸の任意のポリマー鎖を指す。用語「ポリペプチド」は、ネイティブまたは人工タンパク質、タンパク質フラグメント、及びタンパク質配列のポリペプチドアナログを包含する。
【0050】
「試験タンパク質」は、本明細書に記載されている方法によって細胞ターゲティングに関して評価され得る任意のタンパク質を指す。いくつかの実施形態において、試験タンパク質は、核酸ガイドヌクレアーゼにコンジュゲートされ得るタンパク質である。核酸ガイドヌクレアーゼと会合し得る細胞ターゲティング剤を識別することに加えて、本明細書における方法は、所望の細胞ターゲティング特性を有する、核酸ガイドヌクレアーゼの変異体(例えば、ガイド核酸に結合する能力が保持されている、突然変異した核酸ガイドヌクレアーゼ)を、さらなる剤を用いてまたは用いることなく識別するのにさらに有用である。かかる場合において、核酸ガイドヌクレアーゼは、試験タンパク質であるとされる。
【0051】
本明細書において使用されているとき、用語「標的細胞」は、核酸の部位特異的な修飾が(例えば、遺伝子組み換え細胞を産生するために)望まれる核酸配列を含む、細胞または細胞の集団、例えば、哺乳類細胞(例えば、ヒト細胞)を指す。いくつかの場合において、標的細胞は、その細胞膜において、TAGE剤の細胞外細胞膜結合部位によって特異的に結合される細胞外分子(例えば、細胞外タンパク質、例えば、レセプターもしくはリガンド、またはグリカン)を示す。
【0052】
本明細書において使用されているとき、用語「遺伝子組み換え細胞」は、DNA配列が、部位特異的な修飾ポリペプチド(例えば、核酸ガイドヌクレアーゼ)によって意図的に修飾されている、細胞またはその祖先を指す。用語「コンジュゲーション部位」は、本明細書において使用されているとき、2つの以上の分子、例えば、試験タンパク質及び核酸ガイドヌクレアーゼをコンジュゲートすることが可能である部位を指す。用語「コンジュゲーション」は、本明細書において使用されているとき、分子(例えば、試験タンパク質用)と第2分子(例えば、核酸ガイドヌクレアーゼ)との間で形成される物理的または化学的複合体化を指す。化学的複合体化は、具体的には、第1分子(例えば、試験タンパク質)の官能基と第2分子(例えば、核酸ガイドヌクレアーゼ)の官能基との間で形成される結合または化学的部位を構成する。かかる結合として、限定されないが、共有結合的連結及び非共有結合的結合が挙げられる一方で、かかる化学的部位として、限定されないが、エステル、カーボネート、イミン、リン酸エステル、ヒドラゾン、アセタール、オルトエステル、ペプチド連結、及びオリゴヌクレオチド連結が挙げられる。一実施形態において、コンジュゲーションは、物理的会合または非共有結合的複合体化を介して達成される。
【0053】
本明細書において使用されているとき、用語「リガンド」は、細胞上または内の別の分子に特異的に結合することが可能である分子、例えば、1つ以上の細胞表面レセプター、を指し、例えば、タンパク質、ホルモン、神経伝達物質、サイトカイン、成長因子、細胞接着分子、または栄養素を含む。核酸ガイドヌクレアーゼは、共有結合的または非共有結合的連結を通して1つ以上のリガンドに会合され得る。本明細書において有用なリガンド、またはリガンドによって結合される標的、及びリガンドのさらなる記載の例は、概して、Bryant & Stow(2005)。Traffic,6(10),947-953;Olsnes et al.(2003).Physiological reviews,83(1),163-182;and Planque,N.(2006).Cell Communication and Signaling,4(1),7に開示されており、これらは、参照により本明細書に組み込まれる。
【0054】
本明細書において使用されているとき、用語「特異的に結合する」は、サンプルに存在する抗原を認識してこれに結合する抗原結合ポリペプチドを指すが、この抗原結合ポリペプチドは、サンプルにおける他の分子を実質的に認識せず、またはこれに結合しない。一実施形態において、抗原に特異的に結合する抗原結合ポリペプチドは、表面プラズモン共鳴、または、本明細書においてさらに記載されているものを含めた、当該分野において公知の他のアプローチ(例えば、フィルタ結合アッセイ、蛍光偏光、等温滴定カロリメトリー)によって求められるKdが少なくとも約1×10-4、1×10-5、1×10-6M、1×10-7M、1×10-8M、1×10-9M、1×10-10M、1×10-11M、1×10-12M以上である抗原に結合する。一実施形態において、抗原結合ポリペプチドが、表面プラズモン共鳴によって求められる親和性が非特異的抗原に関するその親和性よりも少なくとも2倍大きい抗原に結合していると、抗原結合ポリペプチドは、抗原に特異的に結合している。
【0055】
用語「細胞透過性ペプチド」(CPP)は、コンジュゲート分子の細胞取り込みを容易にし得る、概して約5~60のアミノ酸残基長さのペプチド、特に、1つ以上の部位特異的修飾ポリペプチド(例えば、核酸ガイドヌクレアーゼ)を指す。CPPはまた、ある特定の実施形態において、脂質二重層、ミセル、細胞膜、細胞小器官膜(例えば、核膜)、ベシクル膜、または細胞壁の1つ以上を横断しての/通しての分子コンジュゲートの移動または横断を容易にすることができるとしても特徴付けられ得る。本明細書におけるCPPは、ある特定の実施形態において、カチオン性であっても、両親媒性であっても、疎水性であってもよい。本明細書において有用なCPP、及び、CPPのさらなる記載の例は、概して、Borrelli,Antonella,et al.Molecules 23.2(2018):295;Milletti,Francesca.Drug discovery today 17.15-16(2012):850-860に開示されており、これらは、参照により本明細書に組み込まれる。さらに、実験的に立証されたCPPのデータベース(CPPsite、Gautam et al.,2012)が存在する。CPPは、任意の公知のCPP、例えば、CPPsiteデータベースに示されているCPPであってよい。
【0056】
用語「抗原結合タンパク質」は、本明細書において使用されているとき、特定の標的抗原に結合するタンパク質、例えば、細胞外細胞-膜結合タンパク質(例えば、細胞表面タンパク質)を指す。抗原結合ポリペプチドの例として、抗体、抗体の抗原結合フラグメント、及び抗体模倣体が挙げられる。ある特定の実施形態において、抗原結合ポリペプチドは、抗原結合ペプチドである。
【0057】
用語「抗体」は、本明細書において広義で使用され、所望の抗原結合活性を示す限り、限定されないが、モノクローナル抗体、ポリクローナル抗体、多重特異的抗体(例えば、二重特異的抗体)、ナノボディ、モノボディ、及び抗体フラグメントを含めた様々な抗体構造を包含する。
【0058】
用語「抗体」は、4つのポリペプチド鎖、ジスルフィド結合によって相互接続された2つの重(H)鎖及び2つの軽(L)鎖、ならびにこれらのマルチマー(例えば、IgM)を含む免疫グロブリン分子を含む。各重鎖(HC)は、重鎖可変領域(またはドメイン)(本明細書においてHCVRまたはVHと略記される)及び重鎖定常領域(またはドメイン)を含む。重鎖定常領域は、3つのドメイン、CH1、CH2及びCH3を含む。各軽鎖(LC)は、軽鎖可変領域(本明細書においてLCVRまたはVLと略記される)及び軽鎖定常領域を含む。軽鎖定常領域は、1つのドメイン(CL1)を含む。各VH及びVLは、以下の順:FR1、CDR1、FR2、CDR2、1-R3、CDR3、FR4においてアミノ末端からカルボキシ末端まで配置されている3つのCDR及び4つのFRから構成されており、免疫グロブリン分子は、任意のタイプ(例えば、IgG、IgE、IgM、IgD、IgA及びIgY)、クラス(例えば、IgG1、IgG2、IgG3、IgG4、IgA1及びIgA2)またはサブクラスのものであってよい。VH及びVL領域は、超可変性の領域、より保存される領域と共に散在している、いわゆる相補性決定領域(CDR)、いわゆるフレームワーク領域(FR)にさらに細分され得る。各VH及びVLは、以下の順:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4でアミノ末端からカルボキシ末端まで配置されている3つのCDR及び4つのFRから構成されている。
【0059】
本明細書において使用されているとき、用語「CDR」または「相補性決定領域」は、重及び軽鎖両方のポリペプチドの可変領域内に見出される不連続な抗原結合部位を指す。これらの特定の領域は、Kabat et al.,J.Biol.Chem.252,6609-6616(1977)及びKabat et al.,Sequences of protein of immunological interest.(1991)により、ならびに、Chothia et al.,J.Mol.Biol.196:901-917(1987) and by MacCallum et al.,J.Mol.Biol.262:732-745(1996)により説明されており、定義は、互いに比較されたとき、アミノ酸残基の重複またはサブセットを含んでいる。上記に列挙されている参照文献のそれぞれによって定義されているCDRを包含するアミノ酸残基が比較のために記載されている。好ましくは、用語「CDR」は、配列の比較に基づいて、Kabatによって定義されているCDRである。
【0060】
用語「Fcドメイン」は、無傷抗体のパパイン分解によって発生し得る、免疫グロブリン重鎖のC末端領域を定義するのに使用される。Fcドメインは、ネイティブ配列Fcドメインまたは変異体Fcドメインであってよい。免疫グロブリンのFcドメインは、2つの定常ドメイン、CH2ドメイン及びCH3ドメインを概して含み、CH4ドメインを任意選択的に含む。抗体エフェクター機能を変更するための、Fc部におけるアミノ酸残基の置き換えは、当該分野において公知である(Winter,et al.米国特許第5,648,260号;同第5,624,821号)。抗体のFcドメインは、いくつかの重要なエフェクター機能、例えば、サイトカイン誘導、ADCC、食作用、補体依存性細胞傷害(CDC)、ならびに抗体及び抗原-抗体複合体の半減期/クリアランス率を媒介する。ある特定の実施形態において、少なくとも1つのアミノ酸残基は、結合タンパク質のエフェクター機能が変更されるようにFcドメイン含有結合タンパク質のFcドメインにおいて変更される(例えば、欠失され、挿入され、または置き換えられる)。
【0061】
「無傷」、または「全長」抗体は、本明細書において使用されているとき、4つのポリペプチド鎖、2つの重(H)鎖及び2つの軽(L)鎖を含む抗体を指す。一実施形態において、無傷抗体は、無傷IgG抗体である。
【0062】
用語「モノクローナル抗体」は、本明細書において使用されているとき、実質的に均一な抗体の集団から得られる抗体を指し、すなわち、集団を含む個々の抗体は、例えば、自然発生の変異体を含有するまたはモノクローナル抗体調製物の作製の際に生じる、可能性のある変異体抗体を除いて、同じエピトープと同一であり及び/またはこれに結合しており、かかる変異体は、概して少量で存在する。異なる決定因子(エピトープ)を対象とする異なる抗体を典型的には含むポリクローナル抗体調製物とは対照的に、モノクローナル抗体調製物の各モノクローナル抗体は、抗原における単一の決定因子を対象とする。そのため、修飾因子「モノクローナル」は、実質的に均質な抗体集団から得られるとして抗体の特徴を示しており、任意の特定の方法によって抗体の産生を必要とすると解釈されるべきではない。例えば、本発明によって使用されるモノクローナル抗体は、限定されないが、ハイブリドーマ法、組み換え型DNA法、ファージ提示法、ならびに、ヒト免疫グロブリン座の全体または一部を含有するトランスジェニック動物を利用する方法を含めた様々な技術によって作製されてよく、かかる方法、及びモノクローナル抗体を作製するための他の例示的な方法は、本明細書に記載されている。
【0063】
用語「ヒト抗体」は、本明細書において使用されているとき、フレームワーク及びCDR領域の両方がヒト生殖細胞系列免疫グロブリン配列に由来する可変領域を有する抗体を指す。さらに、抗体が定常領域を含むとき、定常領域もまた、ヒト生殖細胞系列免疫グロブリン配列に由来する。本発明のヒト抗体は、ヒト生殖細胞系列免疫グロブリン配列(例えば、in vitroでのランダムもしくは部位特異的突然変異生成によってまたはin vivoでの体細胞変異によって導入される変異体)によってコードされないアミノ酸残基を含んでいてよい。しかし、用語「ヒト抗体」は、本明細書において使用されているとき、別の哺乳類種、例えば、マウスの生殖細胞系列に由来するCDR配列がヒトフレームワーク配列においてグラフト化されている抗体を含むことは意図されない。
【0064】
用語「ヒト化抗体」は、1の哺乳類種、例えば、マウスの生殖細胞系列に由来するCDR配列がヒトフレームワーク配列にグラフト化されている抗体を指す。さらなるフレームワーク領域修飾は、ヒトフレームワーク配列内でなされてよい。抗体、例えば、非ヒト抗体の「ヒト化形態」は、ヒト化を経た抗体を指す。
【0065】
用語「キメラ抗体」は、可変領域配列が一方の種に由来し、定常領域配列が別の種に由来する抗体、例えば、可変領域配列がマウス抗体に由来し、定常領域配列がヒト抗体に由来する抗体を指すことが意図される。
【0066】
抗体の「抗体フラグメント」、「抗原結合フラグメント」または「抗原結合部分」は、無傷抗体の部分を含み、無傷抗体が結合する抗原に結合する無傷抗体以外の分子を指す。抗体フラグメントとして、限定されないが、Fv、Fab、Fab’、Fab’-SH、F(ab’)2;ダイアボディ;線状抗体;一本鎖抗体分子(例えば、scFv);及び抗体フラグメントから形成される多重特異的抗体が挙げられる。
【0067】
「多重特異的抗原結合ポリペプチド」または「多重特異的抗体」は、1を超える抗原またはエピトープを標的とするものである。「二重特異的(bispecific)」、「二重特異的(dual-specific)」または「二元機能」抗原結合ポリペプチドまたは抗体は、それぞれ、2つの異なる抗原結合部位を有するハイブリッド抗原結合ポリペプチドまたは抗体である。二重特異的抗原結合ポリペプチド及び抗体は、多重特異的抗原結合ポリペプチドまたは多重特異的抗体の例であり、限定されないが、ハイブリドーマの融合またはFab’フラグメントの連結を含めた様々な方法によって産生され得る。例えば、Songsivilai and Lachmann,1990,Clin.Exp.Immunol.79:315-321;Kostelny et al.,1992,J.Immunol.148:1547-1553,Brinkmann and Kontermann.2017.MABS.9(2):182-212を参照されたい。二重特異的抗原結合ポリペプチドまたは抗体の2つの結合部位は、例えば、同じまたは異なるタンパク質標的に存在し得る2つの異なるエピトープに結合する。
【0068】
用語「抗体模倣体」または「抗体模擬体」は、抗体に構造的に関連しないが、抗原に特異的に結合することが可能である分子を指す。抗体模倣体の例として、限定されないが、アドネクチン(すなわち、フィブロネクチン系結合分子)、アフィリン、アフィマー、アフィチン、アルファボディ、アフィボディ、DARPins、アンチカリン、アビマー、フィノマー、クニッツドメインペプチド、モノボディ、ナノクランプ、ナノボディ、ユニボディ、ヴァーサボディ、アプタマー、シクロチド及びペプチド分子が挙げられ、これらの全てが、常套の抗体結合を模擬する一方で、異なるメカニズムを介して発生されて機能する結合構造を用いている。
【0069】
本明細書に記載されているアミノ酸配列は、核酸変更が化学的に同様のアミノ酸の置換を結果として生じさせるコード配列において単一のアミノ酸または少量のアミノ酸を変更、付加または削除する核酸の置換、欠失または付加を含めた、「保存変異体」を含んでいてよい。保存アミノ酸置換は、第1アミノ酸を、第1アミノ酸のものと同様である化学的及び/または物理的特性(例えば、電荷、構造、極性、疎水性/親水性)を有する第2アミノ酸によって置き換えることを指す。同類置換は、1つのアミノ酸を以下の群内の別のものによって置き換えることを含む:リシン(K)、アルギニン(R)及びヒスチジン(H);アスパラギン酸塩(D)及びグルタミン酸塩(E);アスパラギン(N)及びグルタミン(Q);N、Q、セリン(S)、トレオニン(T)、及びチロシン(Y);K、R、H、D、及びE;D、E、N、及びQ;アラニン(A)、バリン(V)、ロイシン(L)、イソロイシン(I)、プロリン(P)、フェニルアラニン(F)、トリプトファン(W)、メチオニン(M)、システイン(C)、及びグリシン(G);F、W、及びY;H、F、W、及びY;C、S及びT;C及びA;S及びT;C及びS;S、T、及びY;V、I、及びL;V、I、及びT。他の保存アミノ酸置換もまた、当該のアミノ酸の事情に応じて、有効であると認識される。例えば、いくつかの場合において、メチオニン(M)は、リシン(K)と置き換わり得る。また、保存の変動によって異なる配列は、概して均質である。
【0070】
用語「単離された」は、他の細胞物質を実質的に含まない、例えば、核タンパク質、タンパク質、または核酸であってよい化合物を指す。
【0071】
本明細書において使用されているとき、用語「動作可能に連結された」は、互いに機能的関係に配置されているポリヌクレオチド配列またはアミノ酸配列を指す。例えば、調節配列(例えば、プロモーターまたはエンハンサー)は、調節配列がポリヌクレオチドの転写または翻訳を制御するまたはその調節に寄与するとき、ポリヌクレオチド(例えば、ガイドRNAまたは核酸ガイドヌクレアーゼをコードする)に「動作可能に連結されている」。同様に、2つのポリペプチドコードヌクレオチド配列は、これらが、連続的であり、かつ、転写及び翻訳の後に「融合タンパク質」を産生するように同じリーディングフレームを発現することが可能であるとき、動作可能に連結されている。
【0072】
さらなる定義を以下のセクションにおいて説明する。
【0073】
本発明の様々な態様を以下のサブセクションにおいてさらに詳細に説明する。
【0074】
II.細胞ターゲティング剤を識別する方法
核酸ガイドヌクレアーゼと会合しているとき、少なくとも、核酸ガイドヌクレアーゼ(例えば、Cas9)を、標的細胞の表面にターゲティングさせる、または、標的細胞、すなわち、細胞ターゲティング剤によって標的とされる細胞によって内部移行させることができる細胞ターゲティング剤を識別する方法を本明細書において提供する。いくつかの実施形態において、細胞ターゲティング剤は、細胞膜において示される細胞外標的分子(例えば、細胞外タンパク質またはグリカン)に特異的に結合するものであってよい。かかる場合において、細胞ターゲティング剤は、少なくとも核酸ガイドヌクレアーゼが標的細胞、すなわち、細胞ターゲティング剤によって結合される細胞外分子を発現する細胞によって内部移行されるように核酸ガイドヌクレアーゼに会合され得る。
【0075】
核酸ガイドヌクレアーゼと会合し得る細胞ターゲティング剤を識別することに加えて、本明細書における方法は、所望の細胞ターゲティング特性を有する、核酸ガイドヌクレアーゼの変異体(例えば、ガイド核酸に結合する能力が保持されている、突然変異した核酸ガイドヌクレアーゼ)を、さらなる剤を用いてまたは用いることなく識別するのにさらに有用である。かかる場合において、核酸ガイドヌクレアーゼは、試験タンパク質であるとされる。
【0076】
いくつかの実施形態において、方法は、(1)核酸ガイドヌクレアーゼ(例えば、RNAガイドヌクレアーゼ(例えば、RNA)もしくはDNAガイドヌクレアーゼ)、またはその機能性フラグメント、及び試験タンパク質を含むRNAガイドヌクレアーゼ融合タンパク質をコードし、(2)ガイド核酸(例えば、gRNAまたはgDNA)及び配列識別子を含む固有の識別核酸(uiNA)(例えば、uiRNAまたはuiDNA)をコードするベクターを提供することを含む。ベクター(セクションIII)、核酸ガイドヌクレアーゼ(セクションIV)、及び試験タンパク質の例を本明細書においてさらに詳細に説明する。いくつかの実施形態において、方法は、核酸配列識別子をコードするベクターの部分をシーケンシングすることをさらに含み、試験タンパク質がシーケンシングされることにより、試験タンパク質と識別子配列との間の会合を確立させる。この会合は、例えば、方法のより後の行程において、識別子配列の存在に基づいて試験タンパク質を識別するためのリファレンスまたは指標を提供するのに使用され得る。
【0077】
代替的には、方法は、uiNA及び核酸ガイドヌクレアーゼ融合タンパク質、またはこれらの構成要素をコードする2つ以上のベクターを提供することを含んでいてよい。2つのベクターが使用される場合において、例えば、第1ベクターは、uiNA及び試験因子をコードし得、第2ベクターは、試験因子にコンジュゲートすることが可能であるコンジュゲート性部位を含む核酸ガイドヌクレアーゼをコードし得る。2つのベクターを同じ宿主細胞に移入する際、コンジュゲート性部位を含む、第2ベクターから発現される核酸ガイドヌクレアーゼ、及び、第1ベクターから発現される試験因子が、安定に会合して核酸ガイドヌクレアーゼ融合物を形成することができる。核酸ガイドヌクレアーゼ融合物は、uiNAにさらに会合して核タンパク質を形成することができる。
【0078】
いくつかの実施形態において、方法は、ベクターを、核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを発現するのに好適な宿主細胞に移入することをさらに含む。いくつかの実施形態において、ベクターは、複数のベクター内にあり、複数のベクターは、宿主細胞当たりの平均ベクターが1以上となるような条件下で宿主細胞に移入される。いくつかの実施形態において、ベクターは、複数のベクター内にあり、複数のベクターは、宿主細胞当たりの平均ベクターが1未満となるような条件下で宿主細胞に移入される。核酸ガイドヌクレアーゼ融合タンパク質及びuiNAは、宿主細胞においてベクターから発現され得、その結果、核タンパク質(NP:例えば、DNPまたはRNP)が形成されることとなり、ここで、核タンパク質は、ベクターにおいてコードされる核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを含む。いくつかの実施形態において、ベクターは、RNAガイドヌクレアーゼ融合タンパク質をコードする核酸配列に動作可能に連結された第1プロモーターを含み、uiNAをコードする核酸配列に動作可能に連結された第2プロモーターを含む。ある特定の実施形態において、第1及び第2プロモーターは、核酸ガイドヌクレアーゼ融合タンパク質の発現レベル及びuiNAの発現レベルが核タンパク質を得るように制御され得るようにそれぞれ誘導性である(例えば、T7またはT5)。いくつかの実施形態において、第1及び/または第2プロモーターは、構成的プロモーターである。
【0079】
いくつかの実施形態において、核タンパク質は、例えば、gNA及び核酸ガイドヌクレアーゼ融合物が共精製後に安定して会合したままとなるように、宿主細胞から次いで精製される。精製された核タンパク質は、任意選択的に一緒にプールされ、プールされた核タンパク質ライブラリとしてさらに評価され得、または、核タンパク質は、個々に評価され得る。核タンパク質は、核タンパク質を標的細胞と共に含有すること(例えば、共インキュベートすること)により細胞ターゲティング能力について次いで評価され得る。
【0080】
したがって、別の態様において、方法は、それぞれが核酸ガイドヌクレアーゼ融合タンパク質及び固有の識別核酸(uiNA)を含む複数の核タンパク質(例えば、RNPまたはDNP)を提供すること、ならびに、上記に概説されているように、核タンパク質を標的細胞と共に含有する工程によって進行することを含み得る。いくつかのかかる実施形態において、リファレンスまたは指標はまた、例えば、方法における後の工程において、識別子配列の存在に基づいて試験タンパク質を識別するために提供されてもよい。代替的には、リファレンスは、核タンパク質ポリペプチドにおける試験タンパク質及びuiNAの識別を確立させるために様々な方法によって確立されてよい。
【0081】
核タンパク質を標的細胞と共に含有させた後、標的細胞内の核酸が、内部移行したuiNAを識別するために評価され得る。いくつかの実施形態において、方法は、核酸を標的細胞、またはその画分(例えば、細胞質画分もしくは膜結合型細胞小器官画分(例えば、核、小胞体、ゴルジ装置、液胞、リソソーム、エンドソーム、もしくはミトコンドリア)から単離することを含む。単離の際、単離された核酸は、(例えば、シーケンシングによって)識別子配列の存在に関して試験され得る。識別子配列の存在は、会合した試験タンパク質が細胞ターゲティング剤であることを示唆している。例えば、細胞ターゲティング剤としての試験因子の識別は、核タンパク質においてuiNAと試験タンパク質との間の会合を確立する予め確立されたリファレンスまたは指標であってよい。
【0082】
所望の特性を有する試験因子の識別または選択の後、選択された試験因子の変異体を試験及び識別するためにさらなる一連のスクリーニングが実施され得る。試験因子の変異体を含むサブライブラリが作成され、次いで本明細書に記載されているようにスクリーニングされ得る。サブライブラリは、それぞれが試験因子(例えば、試験細胞ターゲティング剤)を含む、単一の選択された試験因子または第1選択ラウンドにおいてスクリーニングされた試験因子の数よりも少ない数の試験因子に由来する、ヌクレオチドのライブラリを指す。サブライブラリを作成するのに使用される試験因子の変異体は、タンパク質変異体を作り出す当該分野において公知のいずれの手段によって作り出されても選択されてもよい。サブライブラリの製造及び試験は、本明細書において概説されている方法によって実施され得る。サブライブラリが標的細胞と接触した後、サブライブラリ内の個々の変異体が所望の活性を有するために選択され得る。特定の実施形態において、識別された変異体の所望の活性とは、標的細胞のコンパートメントに核酸ガイドヌクレアーゼをターゲティングさせることまたは標的細胞の細胞表面に結合することができるということであり得る。
【0083】
本発明の方法のさらなる実施形態を本明細書においてさらに詳細に説明する。
【0084】
試験タンパク質
試験タンパク質は、核酸ガイドヌクレアーゼにコンジュゲートされ得、また、本明細書に記載されている方法によって細胞ターゲティングに関して評価され得るいずれのタンパク質であってもよい。例えば、いくつかの実施形態において、試験タンパク質は、細胞透過性ペプチド(CPP)である。いくつかの実施形態において、試験タンパク質は、リガンド、またはその部分である。他の実施形態において、抗原結合タンパク質。いくつかの実施形態において、抗原結合タンパク質は、ナノボディ、ドメイン抗体、scFv、Fab、ダイアボディ、BiTE、ダイアボディ、DART、ミニボディ、F(ab’)2、イントラボディ、または抗体模倣体である。ある特定の実施形態において、抗体模倣体は、アドネクチン(すなわち、フィブロネクチン系結合分子)、アフィリン、アフィマー、アフィチン、アルファボディ、アフィボディ、DARPin、アンチカリン、アビマー、フィノマー、クニッツドメインペプチド、モノボディ、ナノクランプ、ユニボディ、またはヴァーサボディ、アプタマー、またはシクロチドである。
【0085】
試験タンパク質は、天然、組み換え型、または合成であってよい。いくつかの実施形態において、試験タンパク質は、試験タンパク質のライブラリから選択される1つである。いくつかの実施形態において、試験タンパク質は、ランダム変異タンパク質のライブラリから選択され得る。したがって、いくつかの実施形態において、試験タンパク質を(例えば、ランダムな突然変異生成を通して)突然変異させること、及び、突然変異したタンパク質のライブラリを作成することを含み得る。突然変異した試験タンパク質は、次いで、本明細書に記載されているように、細胞ターゲティング剤として評価され得る。
【0086】
いくつかの実施形態において、試験タンパク質は、タンパク質もしくはペプチドデータベース(例えば、SWISS-PROT、TrEMBL、SBASE、PFAM、CPPsite、もしくは当該分野において公知であるもの)において見出されるタンパク質もしくはペプチド、またはそのフラグメントもしくは変異体である。試験タンパク質は、当該分野において公知の核酸配列、例えば、核酸データベース(例えば、GenBank、TIGR、CPPsite、もしくは当該分野において公知であるもの)において見出される核酸配列に(例えば、転写及び/もしくは翻訳によって)由来し得るタンパク質もしくはペプチド、またはそのフラグメントもしくは変異体であってよい。
【0087】
固有の識別核酸
本明細書に記載されている固有の識別核酸(uiNA)は、核酸ガイドヌクレアーゼに安定に会合することが可能であるガイド核酸(例えば、DNAまたはRNA)、及び、核酸の集団から核酸を区別するために使用され得る固有の配列識別子(例えば、バーコード)を含む。uiNAは、ポリヌクレオチド(例えば、試験タンパク質もしくはCPP-試験タンパク質融合物をコードするポリヌクレオチド)に動作可能に連結され得、または、ポリペプチドと安定に会合して核タンパク質(例えば、RNPもしくはDNP)を形成し得る。したがって、uiNAにおける識別子はまた、uiNAに動作可能に連結されたポリヌクレオチド、または、uiNAに安定に会合された核タンパク質を識別するのにも使用され得る。
【0088】
ガイド核酸に加えて、uiNAは、固有の配列識別子またはバーコードを含む。配列識別子は、ガイド核酸を固有に識別するいずれの核酸配列であってもよく、バルク合成ポリヌクレオチドバーコード、ランダム合成バーコード配列、マイクロアレイベースのバーコード合成、ネイティブヌクレオチド、N-マー、ランダムN-マー、擬ランダムN-マー、またはこれらの組み合わせによる部分的補完を含めた様々な異なるフォーマットから生じてよい。いくつかの実施形態において、配列識別子は、非自然発生の配列であってよい。配列識別子は、例えば、10未満、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、88、90、100、110、120、130、140、150、160、170、180、190、200、または200を超えるヌクレオチドを含み得る。さらに、配列識別子は、ガイド核酸のいずれの箇所に位置していても、ガイド核酸に隣接していてもよい(例えば、crRNA、tracrRNAにあっても、もしくはこれに隣接していても、または、単一のガイドRNAにおけるcrRNA/trRNA間のテトラループにあってもよい)。いくつかの場合において、固有の識別子は、ランダム化されたガイド核酸である。かかる実施形態において、ランダム化されたガイド配列は、標的配列とハイブリダイズすることが可能でないが核酸ガイドヌクレアーゼと依然として安定して会合し得るものであってよい。他の実施形態において、ガイド核酸は、相補的核酸配列とハイブリダイズする能力を保持する。
【0089】
uiNAは、さらなる配列セグメントを含んでいてもよい。かかるさらなる配列セグメントは、機能的配列、例えば、プライマー配列、プライマーアニーリング部位配列、固定化配列、または後の処理に有用な他の認識もしくは結合配列、例えば、uiNAオリゴヌクレオチドが付着するサンプルのシーケンシングに使用されるシーケンシングプライマーもしくはプライマー結合部位を含んでいてよい。
【0090】
ベクターまたは核タンパク質ライブラリ
いくつかの実施形態において、方法は、複数(例えば、ライブラリ)の発現ベクターを作製することを含み、方法が、各発現ベクターが、少なくとも1つの試験タンパク質に動作可能に連結された核酸ガイドヌクレアーゼまたはその機能性フラグメント、及び固有の識別核酸(uiRNAまたはuiDNA)をコードするポリヌクレオチドを含有するように、複数の試験タンパク質をコードする核酸を発現ベクターにクローニングすることを含んでおり、uiNAは、ガイド核酸(例えば、RNAまたはDNA)及び配列識別子を含む。いくつかの実施形態において、各ベクターは、単一の試験タンパク質を含む。他の実施形態において、各ベクターは、2つ以上の試験ポリペプチドを含む。例えば、いくつかの実施形態において、方法は、組み合わせのベクターライブラリを調製することを含み、各ベクターが、2つ以上(例えば、2、3、4、5、6、7、8、9、または10個以上)の試験因子をコードして、その結果、核酸ガイドヌクレアーゼをコードする核酸が、2つのまたは試験因子に動作可能に連結されることとなる。
【0091】
いくつかの実施形態において、ライブラリは、オリゴクローナルライブラリである。例えば、プラスミドライブラリは、目的の特定の試験タンパク質をコードし得、同じ試験タンパク質をコードするプラスミドの複製を含み得る。この方法は、例えば、qPCR法を使用した分画を最適化するのに有用であり得る。
【0092】
いくつかの実施形態において、方法は、それぞれが、(1)核酸ガイドヌクレアーゼ(例えば、RNAガイドヌクレアーゼもしくはDNAガイドヌクレアーゼ)、またはその機能性フラグメント、及び試験タンパク質を含む核酸ガイドヌクレアーゼ融合タンパク質をコードし、(2)ガイド核酸(例えば、gRNAまたはgDNA)及び配列識別子を含む固有の識別核酸(uiNA)(例えば、uiRNAまたはuiDNA)をコードする、複数(例えば、ライブラリ)のベクターを提供することを含む。
【0093】
いくつかの実施形態において、方法は、複数(例えば、ライブラリ)の核タンパク質(例えば、RNPまたはDNP)を作製することを含み、方法は、核酸ガイドヌクレアーゼまたはその機能性フラグメントをコードするポリヌクレオチドを固有の識別核酸(uiRNAまたはuiDNA)と複合体化することを含んでおり、uiNAは、ガイド核酸(例えば、RNAまたはDNA)及び配列識別子を含む。いくつかの実施形態において、それぞれの核タンパク質が、単一の試験タンパク質を含む。他の実施形態において、それぞれの核タンパク質が、2つ以上の試験ポリペプチドを含む。
【0094】
別の態様において、方法は、それぞれが核酸ガイドヌクレアーゼ融合タンパク質及び固有の識別核酸(uiNA)を含む複数(例えば、ライブラリ)の核タンパク質(例えば、RNPまたはDNP)を提供すること、ならびに、上記に概説されているように、核タンパク質を標的細胞と共に含有する工程によって進行することを含んでいてよい。
【0095】
複数のベクターまたは核タンパク質は、ベクターまたは核タンパク質のライブラリであってよい。用語「ライブラリ」は、異種のポリペプチドまたは核酸の混合物を指す。ライブラリは、単一のポリペプチドまたは核酸配列を有するメンバーから構成される。ライブラリメンバー間の配列差、例えば、異なる試験因子またはuiNA間の配列差は、ライブラリに存在する多様性の原因となる。ライブラリは、ポリペプチドまたは核酸の簡単な混合物の形態を取ってよく、または、核酸のライブラリ、例えば、本発明の発現ベクターによって形質転換された、生物もしくは細胞、例えば、細菌、ウイルス、動物もしくは植物細胞などの形態であってよい。好ましくは、それぞれ個々の生物または細胞は、ライブラリのうちの唯1つのメンバーを含む。
【0096】
ベクターは、目的の構成要素(例えば、試験タンパク質、核酸ガイドヌクレアーゼ、uiNA、または調節要素)をコードするDNAからアセンブルされ得る。DNAは、例えば、ゲノムDNAからの目的の配列の増幅を通して、または合成を通して、いずれの源から得られてもよい。目的の構成要素をコードするDNAは、充分な量のDNAを産生するために、かつ、発現ベクター(例えば、セクションIIIに記載されているもの)へのインサートとして導入され得るような方法で(例えば、適切な制限部位の付加によって)DNAを修飾するために、公知の技術、例えば、適切に選択されたプライマーを使用するPCRを使用して増幅及びクローニングされ得る。増幅及びクローニングされたDNAは、試験タンパク質ならびに新規の試験タンパク質のより多くの多様性またはより広いレパートリーを生じさせるために、突然変異生成、例えば、PCRを使用してさらに多様化され得る。
【0097】
本明細書に記載されている任意のベクター構成要素(例えば、試験タンパク質、核酸ガイドヌクレアーゼ、uiNA、または調節要素)をコードする、クローニングされたポリヌクレオチドは、発現ベクター(例えば、プラスミド)、例えば、セクションIIIに記載されているベクターに導入される。タンパク質または融合タンパク質をコードするポリヌクレオチドの場合、ポリヌクレオチドは、タンパク質が適切な宿主細胞においてタンパク質として発現されるような方法でベクターに挿入される。
【0098】
いくつかの実施形態において、方法は、(例えば、プラスミド-seqを介して)ベクターの1つ以上の部分をシーケンシングすることをさらに含む。例えば、方法は、核酸配列識別子及び/または試験タンパク質をコードするベクターの1つ以上の部分をシーケンシングし、それにより、試験タンパク質と識別子配列との間の会合を確立することをさらに含んでいてよい。この会合は、例えば、方法における後の工程において、識別子配列の存在に基づいて試験タンパク質を識別するためのリファレンスまたは指標を提供するのに使用され得る。例えば、シーケンシングは、自動サンガーシーケンシング(ABI 3730x1ゲノムアナライザー)、固体支持体におけるパイロシーケンシング(454シーケンシング、Roche)、可逆的終端による合成ごとのシーケンシング(ILLUMINA(登録商標)Genome Analyzer)、ライゲーションごとのシーケンシング(ABI SOLiD(登録商標))または事実上の終端による合成ごとのシーケンシング(HELISCOPE(登録商標))を使用することによって実施され得る;Moleculoシーケンシング(Voskoboynik et al.eLife 2013 2:e00569及び2012年9月10日に出願された米国特許出願第13/608,778号を参照されたい);DNAナノボールシーケンシング;一分子リアルタイム(SMRT)シーケンシング;ナノポアDNAシーケンシング;ハイブリダイゼーションによるシーケンシング;質量分析によるシーケンシング;及びマイクロ流体サンガーシーケンシング。当業者に公知の例示的な次世代のシーケンシング方法として、超並列シグネチャーシーケンシング(MPSS)、ポロニーシーケンシング、パイロシーケンシング(454)、合成によるIllumina(Solexa)シーケンシング、ライゲーションによるSOLiDシーケンシング、イオン半導体シーケンシング(Ion Torrentシーケンシング)、DNAナノボールシーケンシング、鎖終端シーケンシング(サンガーシーケンシング)、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング(Pacific Biosciences)及びナノポアシーケンシングが挙げられ、例えば、世界のウェブサイトnanoporetech.comに記載されている。
【0099】
これらのベクターのライブラリは、ベクター(例えば、試験タンパク質、核酸ガイドヌクレアーゼ、ヌクレアーゼ-試験タンパク質融合物、及び/またはuiNA)においてコードされる1つ以上の構成要素の発現のために、真核生物または原核生物のものであり得る宿主細胞に次いで導入される。宿主細胞へのベクターの移入(例えば、感染、形質転換、またはトランスフェクションによる)は、公知の技術、例えば、エレクトロポレーション、原形質融合、またはリン酸カルシウム共沈を使用して実施され得る。方法が2つのベクターを必要とする場合、両方のライブラリが、同時または逐次的のいずれかで適切な宿主細胞に導入され得る。
【0100】
コンパートメント化された核タンパク質発現
いくつかの実施形態において、方法は、ベクターを、核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを発現するのに好適な宿主細胞に導入すること、ならびに宿主細胞において核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを発現することをさらに含み、その結果、発現した核タンパク質(NP;RNPまたはDNP)が、それぞれ、核酸ガイドヌクレアーゼ融合タンパク質及び対応するuiNAを含むこととなる。いくつかの実施形態において、ベクターは、複数のベクター内にあり、複数のベクターは、宿主細胞当たりの平均ベクターが1以上となるような条件下で宿主細胞に移入される。いくつかの実施形態において、ベクターは、複数のベクター内にあり、複数のベクターは、宿主細胞当たりの平均ベクターが1未満となるような条件下で宿主細胞に移入される。核酸ガイドヌクレアーゼ融合タンパク質及びuiNAは、宿主細胞においてベクターから発現され得、その結果、核タンパク質が形成されることとなり、ここで、発現した核タンパク質は、ベクターにおいてコードされる核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを含む。
【0101】
用語「宿主細胞」は、タンパク質、タンパク質フラグメント、またはベクターからの目的のペプチドを発現し得る細胞を指す。例えば、宿主細胞は、原核細胞または真核細胞、例えば、細菌細胞、動物細胞、植物細胞、または真菌細胞であってよい。いくつかの実施形態において、真核細胞は、酵母細胞(例えば、出芽酵母細胞、ピキア・パストリスなど)、植物細胞、または哺乳類細胞であってよい。いくつかの場合において、細菌細胞は、大腸菌細胞である。
【0102】
いくつかの実施形態において、宿主細胞は、齧歯類(ラット、マウス、モルモットもしくはハムスター)由来の哺乳類培養細胞、例えば、CHO、BHK、NSO、SP2/0、YB2/0;またはヒト組織もしくはハイブリドーマ細胞、酵母細胞、もしくは昆虫細胞である。この用語は、特定の対象細胞だけでなく、かかる細胞の子孫も包含する。ある特定の修飾は、変異または環境のいずれかの影響に起因して後世において起こり得るため、かかる子孫は、親細胞と同一でない場合があるが、用語「宿主細胞」の範囲内に依然として含まれる。ある特定の実施形態において、哺乳類細胞は、COP細胞、L細胞、C127細胞、Sp2/0細胞、NS-0細胞、NIH3T3細胞、PC12細胞、PC12h細胞、BHK細胞、CHO細胞、COS1細胞、COS3細胞、COST細胞、CV1細胞、Vero細胞、HeLa細胞、HEK-293細胞、PER C6細胞、2倍体線維芽細胞由来の細胞、骨髄腫細胞、またはHepG2である。
【0103】
ポリヌクレオチド(例えば、発現ベクター)を宿主細胞に導入する方法は当該分野において公知であり、宿主細胞の種類に基づいて典型的には選択される。かかる方法として、例えば、ウイルスまたはバクテリオファージ感染、トランスフェクション、コンジュゲーション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン媒介トランスフェクション、DEAE-デキストラン媒介トランスフェクション、原形質融合、リポフェクション、リポソーム媒介トランスフェクション、パーティクルガン技術、直接微小注入、及びナノ粒子媒介送達が挙げられる。
【0104】
代替的には、方法は、ベクターを、核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを発現するのに好適な非細胞コンパートメント(例えば、エマルジョン液滴)に移入すること、ならびに非細胞コンパートメント(例えば、エマルジョン液滴)において核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを発現することを含んでいてよく、その結果、核酸ガイドヌクレアーゼ融合タンパク質及びuiNAをそれぞれ含むリボ核タンパク質(NP)が形成されることとなる。
【0105】
ある特定の実施形態において、非細胞コンパートメントは、液滴、例えば、エマルジョンにおける液滴及び/またはマイクロ流体液滴である。乳化は、サンプルまたはサンプルセットを、一連のコンパートメント、例えば、単一の細胞、あるいは、細胞サンプルの別々の部分、例えば、細胞不含抽出物または細胞不含転写及び/もしくは細胞不含翻訳混合物を有するコンパートメントに分離または隔離するために、本開示の方法において使用され得る。典型的には、本明細書に開示されている方法及び組成物と併せて使用されているとき、エマルジョンは、各液滴がベクターを含んで複数の液滴を含み、その結果、各液滴が、これを他の液滴から区別する、1つの試験因子及びuiNAをコードするベクターを含むこととなる。乳化は、エマルジョン液滴中の1つ以上の標的分子を、uiNAをコードする1つのベクターによってコンパートメント化するために本開示の方法において使用され得る。エマルジョンにおける液滴は、当該分野において周知の方法によって選別及び/または単離され得る。例えば、蛍光シグナルを含むダブルエマルジョン液滴は、>104液滴s”1の速度で従来の蛍光活性化細胞選別(FACS)機を使用して分析及び/または選別され得、単一の細胞によって、または、単一の遺伝子のin vitro翻訳によって産生される酵素の活性を改良するために使用されてきた(Aharoni et al.,Chem Biol 12(12):1281-1289,2005;Mastrobattista et al.,Chem Biol 2(12):1291-1300,2005)。しかし、エマルジョンは、定量分析を制限する、高度多分散系であり、予め形成された液滴に新しい試薬を添加することは困難である(Griffiths et al.,Trends Biotechnol 24(9):395-402,2006)。これらの制限は、しかし、ピコリットル体積の高度単分散液滴が、作製され(Anna et al.,Appl Phys Lett 82(3):364-366,2003)、融合され(Song et al.,Angew Chem Int Edit 42(7):767-772,2003;Chabert et al.,Electrophoresis 26(19):3706-3715,2005)、分裂され(Song et al.,Angew Chem Int Edit 42(7):767-772,2003;Link et al.,Phys Rev Lett 92(5):054503,2004)、インキュベートされ(Song et al.,Angew Chem Int Edit 42(7):767-772,2003;Frenz et al.,Lab on a chip 9(10):1344-1348,2009)、かつ、kHz周波数で蛍光において選別されてトリガーされ(Baret,et al,Lab on a chip 9(13):1850-1858,2009)得る、液滴系マイクロ流体系に基づいたプロトコル(例えば、Teh et al.,Lab on a chip 8(2):198-220,2008;Theberge et al.,Angew Chem Int Ed Engl 49(34):5846-5868,2010;及びGuo et al.,Lab on a chip 12(12):2146,2012を参照されたい)、例えば、参照により本明細書に組み込まれる、Mazutis et al.{Nat.Protoc.8(5):870-891,2013)に記載されているものを使用することによって克服され得る。本明細書に開示されているように、エマルジョンは、標的分子、標的核酸及び起源特異的バーコードに加えて、様々な化合物、酵素、または試薬を含み得る。これらの添加物は、乳化の前にエマルジョン溶液に含まれていてよい。代替的には、添加物は、乳化後に個々の液滴に添加されてよい。
【0106】
エマルジョンは、当該分野において公知の様々な方法(例えば、US2006/0078888Alを参照されたい、段落[0139]-[0143]が参照により本明細書に組み込まれる)によって得られてよい。例示的なエマルジョンは、油中水エマルジョンである。いくつかの実施形態において、エマルジョンの連続相は、フッ素化油を含む。エマルジョンは、エマルジョンを安定化するために界面活性剤または乳化剤(例えば、洗浄剤、アニオン性界面活性剤、カチオン性界面活性剤、または両性界面活性剤)を含有し得る。他の油/界面活性剤混合物、例えば、シリコーン油もまた、特定の実施形態において使用されてもよい。エマルジョンは、取り扱いの容易さのために、ウェルまたは複数のウェル、例えば、プレートに含有され得る。いくつかの例において、1つ以上のベクター分子、標的核酸及び核酸バーコードがコンパートメント化されている。エマルジョンは、単分散系エマルジョンまたは多分散系エマルジョンであってよい。ある特定の実施形態において、液滴は、細胞系、例えば、細胞不含抽出物を含んでいてよい。本発明に関連するエマルジョンは、細胞不含転写または翻訳を達成するためにベクターに加えて様々な化合物、酵素、または試薬を含んでいてよい。これらの添加物は、乳化の前にエマルジョン溶液に含まれていてよい。代替的には、添加物は、乳化後に個々の液滴に添加されてよい。
【0107】
RNPの単離
いくつかの実施形態において、方法は、核タンパク質を、本明細書に記載されている発現ベクターを含む宿主細胞から単離することをさらに含み、それぞれの核タンパク質が、核酸ガイドヌクレアーゼ融合タンパク質及び固有の識別核酸(uiNA)を含み、核酸ガイドヌクレアーゼ融合タンパク質が、核酸ガイドヌクレアーゼ、またはその機能性フラグメント、及び試験タンパク質を含み;uiNAがガイド核酸及び配列識別子を含む。宿主細胞から核タンパク質を単離するためにいずれの精製方法を使用することもできる。例示的な単離技術として、限定することなく、アフィニティー捕捉、免疫沈降、クロマトグラフィ(例えば、サイズ排除クロマトグラフィ、疎水性相互作用クロマトグラフィ、逆相クロマトグラフィ、イオン交換クロマトグラフィ、親和性クロマトグラフィ、金属結合クロマトグラフィ、免疫親和性クロマトグラフィ、高速液体クロマトグラフィ(HPLC)、及び液体クロマトグラフィ-質量分析(LC-MS))、電気泳動、捕捉オリゴヌクレオチドとのハイブリダイゼーション、フェノール-クロロホルム抽出、ミニカラム精製、またはエタノールもしくはイソプロパノール沈殿が挙げられる。クロマトグラフィ法は、例えば、Hedhammar et al.(「Chromatographic methods for protein purification」,Royal Institute of Technology,Stockholm,Sweden)に詳細に記載されており、これは、参照により本明細書に組み込まれる。かかる技術は、標識された核タンパク質、または核タンパク質と会合するuiNAもしくは試験タンパク質を認識する捕捉分子を利用することができる。
【0108】
試験配列識別子
核酸ガイドヌクレアーゼ融合タンパク質及び固有の識別核酸(uiNA)を含む単離された核タンパク質は、核タンパク質を標的細胞と共に含有すること(例えば、共インキュベートすること)により、細胞ターゲティング能力及び/または核内部移行能力について評価され得る。例えば、含有する工程は、細胞を核タンパク質と共にインキュベートすること、露光することまたは混合することを含んでいてよい。
【0109】
いくつかの実施形態において、標的細胞(複数可)は、真核細胞、例えば、哺乳類細胞(例えば、ヒト細胞)である。ある特定の実施形態において、標的細胞は、造血幹細胞(HSC)、造血前駆幹細胞(HPSC)、天然キラー細胞、マクロファージ、DC細胞、非DC骨髄性細胞、B細胞、T細胞(例えば、活性化T細胞)、線維芽細胞または他の細胞である。ある特定の実施形態において、標的細胞は、T細胞である。いくつかの実施形態において、T細胞は、CD4またはCD8T細胞である。ある特定の実施形態において、T細胞は、調節T細胞(Tregs)またはエフェクターT細胞である。いくつかの実施形態において、T細胞は、腫瘍湿潤T細胞である。いくつかの実施形態において、細胞は、造血幹細胞(HSC)または造血前駆細胞(HPSC)である。いくつかの実施形態において、マクロファージは、M0、M1、またはM2マクロファージである。いくつかの実施形態において、標的細胞は、異常細胞である。ある特定の実施形態において、標的細胞は、腫瘍細胞である。
【0110】
いくつかの実施形態において、単離された核タンパク質は、核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを含んでいて、複数(例えば、2、3、4、5、6、7、8、9、10以上)の標的細胞、例えば、HSC、HPSC、ナチュラルキラー細胞、マクロファージ(例えばM0、M1、またはM2マクロファージ)、DC、非DC骨髄性細胞、B細胞、T細胞(例えば、活性化T細胞、CD4T細胞、CD8T細胞、Tregs、エフェクターT細胞、及び/または腫瘍湿潤T細胞)、線維芽細胞、眼細胞、小孔細胞、異常細胞(例えば、腫瘍細胞)、または他の細胞から選択される複数の標的細胞と接触させることによって細胞標的能及び/または核内部移行能に関して評価され得る。ある特定の実施形態において、単離された核タンパク質は、核酸ガイドヌクレアーゼ融合タンパク質及びuiNAを含んでいて、核タンパク質を、複数の標的細胞集団、例えば、T細胞の集団及びマクロファージの集団と接触させる、例えば共インキュベートすることによって細胞標的能及び/または核内部移行能に関して評価され得る。
【0111】
細胞は、細胞の生存に好適ないずれの条件または細胞培養培地にあってもよい。さらに、細胞は、表面に付着していても、細胞培養培地に懸濁していてもよい。核タンパク質を標的細胞と共に含有させた後、標的細胞内の核酸が、内部移行したuiNAを識別するために次いで評価され得る。
【0112】
いくつかの実施形態において、方法は、核酸を、標的細胞、またはその画分から単離することを含む。例えば、いくつかの実施形態において、単離された核酸は、核酸単離前に標的細胞から抽出される細胞質から得られる。代替的には、単離した核酸は、核酸単離前に標的細胞から抽出される膜結合型細胞小器官(例えば、核、小胞体、ゴルジ装置、液胞、リソソーム、エンドソーム、またはミトコンドリア)から得られる。例えば、いくつかの実施形態において、核が、標的細胞から抽出され、抽出された核内の核酸(例えば、uiNAを含む)が単離されて、さらに分析される。ある特定の実施形態において、方法は、標的細胞を、標的細胞の核を含む第1画分及び標的細胞の細胞質ゾルを含む第2画分に分画することを含み、抽出された核及び抽出された細胞質ゾル内の核酸(例えば、uiNAを含む)が単離されて、さらに分析される。
【0113】
いくつかの実施形態において、最初の核タンパク質プールにおけるuiNA(標的細胞を核タンパク質と接触させる前の初期入力)が、比較基準としてさらに評価される。かかる場合において、入力対照と比較した、標的細胞、またはそのコンパートメント(例えば、標的細胞の核)におけるuiNAレベルの富化は、会合する試験タンパク質が細胞ターゲティング剤であることを示唆している。
【0114】
いくつかの実施形態において、方法は、本明細書に記載されているように、核酸ガイドヌクレアーゼ融合タンパク質及び固有の識別核酸(uiNA)を含む核タンパク質と共に混合細胞集団を含有する(例えば、共インキュベーションを介して)ことを含む。ある特定の実施形態において、混合細胞集団は、細胞の第1細胞集団(すなわち、標的細胞)及び細胞の第2細胞集団(すなわち、標的細胞でない細胞)を含む。かかる場合において、方法は、第1細胞の集団及び第2細胞の集団の両方から核酸を単離することを含んでいてよい。いくつかの実施形態において、単離した核酸は、第1細胞の集団及び第2細胞の集団の両方における膜結合型細胞小器官から得られる。したがって、いくつかの実施形態において、核が第1及び第2細胞の集団の両方から抽出され、抽出された核内の核酸(例えば、uiNAを含む)が単離されて、さらに分析される。いくつかの実施形態において、最初の核タンパク質プールにおけるuiNA(第1及び第2細胞の集団を核タンパク質と接触させる前の初期入力)が、比較基準としてさらに評価される。いくつかの実施形態において、最初の核タンパク質プール(標的細胞を核タンパク質と接触させる前の初期入力)におけるuiNAが、比較基準としてさらに評価される。かかる場合において、入力対照及び第2細胞集団(例えば、標的細胞でない細胞)の両方と比較した、標的細胞、またはそのコンパートメント(例えば、標的細胞の核)におけるuiNAレベルの富化は、会合する試験タンパク質が細胞ターゲティング剤であることを示唆している。いくつかの実施形態において、複数の標的細胞集団、例えば、上記に記載されている2、3、4、5、6、7、8、9、10以上の標的細胞集団が使用されてよい。例えば、T細胞の集団及びマクロファージの集団が標的細胞集団として使用され得、最初の核タンパク質プール(T細胞及びマクロファージを核タンパク質と接触させる前の初期入力)におけるuiNAが、比較基準としてさらに評価され得る。かかる場合において、入力対照と比較した、T細胞及びマクロファージ、またはそのコンパートメント(例えば、T細胞及びマクロファージの核)におけるuiNAレベルの富化は、会合した試験タンパク質が細胞ターゲティング剤であることを示唆し得る。代替の実施形態において、ヒトHSCの集団及びマウスHSCの集団が標的細胞集団として使用されよく、最初の核タンパク質プール(ヒトHSC及びマウスHSCを核タンパク質と接触させる前の初期入力)におけるuiNAが、比較基準としてさらに評価され得る。かかる場合において、入力対照と比較した、ヒトHSC及びマウスHSC、またはそのコンパートメント(例えば、ヒトHSC及びマウスHSCの核)におけるuiNAレベルの富化は、会合した試験タンパク質が細胞ターゲティング剤であることを示唆し得る。
【0115】
試験核タンパク質との接触の後に標的細胞から得られる核酸は、当該分野において公知のいずれの増幅方法に従ってさらなる分析のために増幅されてもよい。増幅の例は、ポリメラーゼ連鎖反応(PCR)であり、ここでは、サンプルを、サンプルにおける核酸鋳型へのプライマーのハイブリダイゼーションを可能にする条件下で1対のオリゴヌクレオチドプライマーと接触させる。プライマーは、好適な条件下で伸長され、鋳型から解離され、再アニーリングされ、伸長され、解離されて、核酸のコピー数を増幅することができる。このサイクルが繰り返され得る。増幅の産物は、電気泳動としてのかかる技術、制限エンドヌクレアーゼ開裂パターン、オリゴヌクレオチドハイブリダイゼーションもしくはライゲーション、及び/または核酸シーケンシングによって特徴付けられ得る。
【0116】
in vitro増幅技術の他の例として、とりわけ、定量的リアルタイムPCR;逆転写酵素PCR(RT-PCR);リアルタイムPCR(rtPCR);リアルタイム逆転写酵素PCR(rtRT-PCR);ネステッドPCR;ストランド置換増幅(米国特許第5,744,311号を参照されたい);転写フリー等温増幅(米国特許第6,033,881号を参照されたい)、リガーゼ連鎖反応増幅(WO90/01069を参照されたい);リガーゼ連鎖反応増幅(欧州特許公開公報第EP-A-320 308号を参照されたい);ギャップ充填リガーゼ連鎖反応増幅(米国特許第5,427,930号を参照されたい);結合リガーゼ検出及びPCR(米国特許第6,027,889号を参照されたい);ならびにNASBA(商標)RNA転写フリー増幅(米国特許第6,025,134号を参照されたい)が挙げられる。ある特定の実施形態において、試験する工程は、単離されたRNAを逆転写してcDNAを産生すること、及びcDNAをシーケンシングして識別子配列の存在を決定することを含む。いくつかの実施形態において、試験する工程は、単離されたRNAをシーケンシングして識別子配列の存在を決定することを含む。
【0117】
核酸を増幅するための他の例示的な方法として、ポリメラーゼ連鎖反応(PCR)(例えば、Mullis et al.(1986) Cold Spring Harb.Symp.Quant.Biol.51 Pt 1:263及びCleary et al.(2004) Nature Methods 1 :241;ならびに米国特許第4,683,195号及び同第4,683,202号を参照されたい)、アンカーPCR、RACE PCR、ライゲーション連鎖反応(LCR)(例えば、Landegran et al.(1988) Science 241:1077-1080;and Nakazawa et al.(1994) Proc.Natl.Acad.Sci.U.S.A.91 :360-364を参照されたい)、自立配列複製(Guatelli et al.(1990) Proc.Natl.Acad.Sci.U.S.A.87:1874)、転写増幅システム(Kwoh et al.(1989) Proc.Natl.Acad.Sci.U.S.A.86:1173)、Q-ベータレプリカーゼ(Lizardi et al.(1988) BioTechnology 6:1197)、再帰的PCR(Jaffe et al.(2000) J.Biol.Chem.275:2619;及びWilliams et al.(2002) J.Biol.Chem.277:7790)、米国特許第6,391,544号、同第6,365,375号、同第6,294,323号、同第6,261,797号、同第6,124,090号及び同第5,612,199号に記載されている増幅方法、等温増幅(例えば、ローリングサークル増幅(RCA)、超分岐ローリングサークル増幅(HRCA)、ストランド置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、PWGA)、または当業者に周知の技術を使用するいずれか他の核酸増幅が挙げられる。
【0118】
得られた核酸(例えば、単離した核酸)は、当該分野において公知の任意のシーケンシングまたはマイクロアレイ方法を含めた様々な方法によって識別子配列の存在について試験され得る。いくつかの実施形態において、固有の識別核酸の識別性は、DNAまたはRNAシーケンシング(例えば、RNA-seq)によって決定される。例えば、シーケンシングは、自動サンガーシーケンシング(ABI 3730x1ゲノムアナライザー)、固体支持体におけるパイロシーケンシング(454シーケンシング、Roche)、可逆的終端による合成ごとのシーケンシング(ILLUMINA(登録商標)Genome Analyzer)、ライゲーションごとのシーケンシング(ABI SOLiD(登録商標))または事実上の終端による合成ごとのシーケンシング(HELISCOPE(登録商標))を使用することによって実施され得る;Moleculoシーケンシング(Voskoboynik et al.eLife 2013 2:e00569及び2012年9月10日に出願された米国特許出願第13/608,778号を参照されたい);DNAナノボールシーケンシング;一分子リアルタイム(SMRT)シーケンシング;ナノポアDNAシーケンシング;ハイブリダイゼーションによるシーケンシング;質量分析によるシーケンシング;及びマイクロ流体サンガーシーケンシング。当業者に公知の例示的な次世代のシーケンシング方法として、超並列シグネチャーシーケンシング(MPSS)、ポロニーシーケンシング、パイロシーケンシング(454)、合成によるIllumina(Solexa)シーケンシング、ライゲーションによるSOLiDシーケンシング、イオン半導体シーケンシング(Ion Torrentシーケンシング)、DNAナノボールシーケンシング、鎖終端シーケンシング(サンガーシーケンシング)、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング(Pacific Biosciences)及びナノポアシーケンシングが挙げられ、例えば、世界のウェブサイトnanoporetech.comに記載されている。いくつかの実施形態において、uiNAは、鋳型-切り替え反応(例えば、SMARTseq由来のMaximaH-Minus逆転写酵素による、10x Genomics)、ssRNAライゲーション(例えば、マイクロRNAseqに由来するT4 RNAリガーゼK227Qによる)、ssDNAライゲーション(例えば、SHAPE-seq由来のcricLigase)、ホモポリマーテーリング(例えば、HTL-PCR由来の末端トランスフェラーゼ)、またはスプリンテッドライゲーション(例えば、SRSLY-seq由来のT4DNAリガーゼ)を使用してシーケンシングされる。
【0119】
標的細胞における識別子配列の存在は、会合した試験タンパク質が細胞ターゲティング剤であることを示唆している。例えば、細胞ターゲティング剤としての試験因子の識別は、核タンパク質においてuiNAと試験タンパク質との間の会合を確立する予め確立されたリファレンスまたは指標であってよい。
【0120】
いくつかの実施形態において、本方法によって識別される細胞ターゲティング剤は、核酸ガイドヌクレアーゼを、標的細胞のコンパートメント内にターゲティングさせる、または標的細胞の細胞表面に結合させるタンパク質である。例えば、細胞ターゲティング剤コンパートメントは、膜結合型細胞小器官または細胞質である。ある特定の実施形態において、膜結合型細胞小器官は、核、小胞体、ゴルジ装置、液胞、リソソーム、エンドソーム、またはミトコンドリアである。特定の実施形態において、内部移行は、少なくとも0.01%、少なくとも0.05%、少なくとも0.1%、少なくとも0.5%、少なくとも1%、少なくとも2%、少なくとも5%、少なくとも10%、少なくとも15%、または少なくとも20%の、内部移行したペプチドまたは組成物が、(例えば、1時間、2時間、3時間、4時間以上の間に)細胞の細胞質に局在化することを指す。
【0121】
III.発現ベクター
別の態様において:試験タンパク質の核酸を挿入するためにクローニング部位に任意選択的に動作可能に連結された核酸ガイドヌクレアーゼをコードし、それにより、核酸ガイドヌクレアーゼ及び試験タンパク質を含む核酸ガイドヌクレアーゼ融合タンパク質を形成する、核酸;ならびに固有の識別核酸(uiNA)をコードする核酸;を含む細胞発現ベクターであって、uiNAが、ガイド核酸及び配列識別子を含む、上記細胞発現ベクターを本明細書において提供する。いくつかの実施形態において、発現ベクターは、試験タンパク質をコードする核酸をさらに含む。
【0122】
「発現ベクター」または「ベクター」は、本明細書において使用されているとき、細胞に遺伝物質を導入するのに使用され得るポリヌクレオチドビヒクルを指す。ベクターは、線状または環状であってよい。本明細書において発現ベクターとして有用なベクターとして、プラスミド、ウイルスベクター(ファージを含む)、及び統合可能なDNAフラグメント(すなわち、相同的組み換えによって宿主ゲノムに統合可能なフラグメント)が挙げられる。4つの主なベクタータイプは、プラスミド、ウイルスベクター、コスミッド、及び人工染色体である。ベクターは、好適な宿主細胞においてベクターの複製を行うことが可能である複製配列(すなわち、複製起点)を含有し得る。典型的には、ベクターは、複製起点、マルチクローニング部位、及び/または選択可能なマーカーを含む。好適な宿主の形質転換の際、ベクターは、宿主ゲノムとは独立して複製及び機能してよく、または、宿主ゲノムに統合してよい。ベクター設計は、とりわけ、意図する用途及びベクターの宿主細胞に左右され、特定の用途及び宿主細胞のための本発明のベクターの設計は、当該分野における技能のレベルの範囲内である。
【0123】
発現ベクターの構築のための一般的な方法は、当該分野において公知である。大部分の宿主細胞のための発現ベクターは、市販されている。適切なベクター及びその構築、例えば、細菌細胞における細菌形質転換及び遺伝子発現のための細菌プラスミド、酵母及び他の真菌における細胞形質転換及び遺伝子発現のための酵母プラスミド、哺乳類細胞または哺乳類における哺乳類細胞形質転換及び遺伝子発現のための哺乳類ベクター、細胞形質転換及び遺伝子発現のためのウイルスベクター(レトロウイルス、レンチウイルス及びアデノウイルスベクターを含む)、ならびに、かかるポリヌクレオチドのクローニングを容易に可能にするための方法の選択を容易にするために設計された、いくつかの市販のソフトウェア製品がある。
【0124】
発現ベクターは、以下:転写の調節、転写後調節、及び翻訳の調節;の1つ以上に関与する調節配列を典型的には含む。発現ベクターは、細菌細胞、酵母細胞、哺乳類細胞、及び植物細胞を含めた様々な生物に導入され得る。ベクターは、導入される宿主細胞または生物(複数可)に対応する機能的調節配列を典型的には含む。さらに、発現ベクターは、タンパク質タグ(例えば、poly-Hisタグ、血球凝集素タグ、蛍光タンパク質タグ、生物発光タグ、核局在化タグ)をコードするポリヌクレオチドを含み得る。かかるタンパク質タグのコード配列は、コード配列(例えば、核酸ガイドヌクレアーゼをコードする配列)に融合され得る。
【0125】
いくつかの態様において、ベクターの様々な構成要素(例えば、ガイドNA、uiNA、核酸ガイドヌクレアーゼ、及び/または核酸ガイド融合タンパク質)の1つ以上をコードするポリヌクレオチドは、プロモーターに動作可能に連結されている。例えば、動作可能に連結されたプロモーターは、誘導性プロモーター、抑制性プロモーター、または構成的プロモーターであってよい。いくつかの実施形態において、細胞発現ベクターは、RNAガイドヌクレアーゼをコードする核酸配列に動作可能に連結された第1プロモーターを含み、uiRNAまたはgRNAをコードする核酸配列に動作可能に連結された第2プロモーターを含む。ある特定の実施形態において、第1及び第2プロモーターは、それぞれ、RNAガイドヌクレアーゼ融合タンパク質の発現レベル及びuiRNAの発現レベルまたはgRNAが制御され得るような誘導性の要素を含む。ある特定の実施形態において、第1及び/または第2プロモーターは、T7またはT5である。いくつかの実施形態において、第1及び/または第2プロモーターは、構成的プロモーターである。
【0126】
ベクターは、原核または真核細胞における、記載されている方法の様々な構成要素の発現のために設計され得る。代替的には、転写は、例えば、T7プロモーター調節配列及びT7ポリメラーゼを使用するin vitroであってよい。他のRNAポリメラーゼ及びプロモーター配列が使用され得る。
【0127】
ベクターは、原核生物に導入されて伝播され得る。原核生物ベクターは、当該分野において周知である。典型的には、原核生物ベクターは、標的宿主細胞に好適な複製起点(例えば、大腸菌由来のoriC、pBR322由来のpUC、サルモネラ菌由来のpSC101)、15A起源(p15A由来)または細菌人工染色体)を含む。ベクターは、選択可能なマーカーを含み得る。「選択可能なマーカー遺伝子」は、ベクターを持つ成功裏に形質転換された細胞が識別され得る表現型を発現の際に与える遺伝子を指す。選択可能なマーカー遺伝子は、本明細書において使用されているとき、細胞培養における選択因子への耐性を与え得及び/または目視検査の際に識別可能である表現型を与え得る。いくつかの実施形態において、選択可能なマーカーは、選択因子(例えば、薬物、例えば、抗生物質、例えば、アンピシリン、クロラムフェニコール、ゲンタマイシン、及びカナマイシン)に対する耐性を発現の際に与える遺伝子である。Zeocin(商標)(Life Technologies,Grand Island,NY)は、細菌、真菌(酵母を含む)、植物及び哺乳類細胞株における選択として使用され得る。したがって、ベクターは、多数の生物における選択作業のために、Zeocinに対する薬物抵抗性を1つだけ保有するように設計され得る。いくつかの実施形態において、選択可能なマーカーは、発現の際に、識別可能な表現型を与える遺伝子である。例えば、選択可能なマーカーは、視覚的に、または、機械、例えば、フローサイトメトリーによって識別され得るベクターを持つ細胞において蛍光を与える蛍光マーカーであってよい。
【0128】
有用なプロモーターは、原核生物におけるタンパク質発現について公知であり、例えば、T5、T7、ラムノース(誘導性)、アラビノース(誘導性)、及びPhoA(誘導性)である。さらに、T7プロモーターは、T7 RNAポリメラーゼもコードするベクターにおいて広く使用される。原核生物ベクターはまた、様々な強度、及び分泌シグナルのリボソーム結合部位を含み得る(例えば、mal、sec、tat、ompC、及びpelB)。また、ベクターは、gRNAの発現のためのRNAポリメラーゼプロモーターを含み得る。原核生物RNAポリメラーゼ転写終結配列も周知である(例えば、S.pyogeneからの転写終結配列)。原核生物の安定な形質転換のための統合ベクターも当該分野において公知である(例えば、Heap,J.T.,et al.,「Integration of DNA into bacterial chromosomes from plasmids without a counter-selection marker」,Nucleic Acids Res.(2012) 40:e59を参照されたい)。
【0129】
原核生物におけるタンパク質の発現は、多くの場合において、細菌、例えば、Escherichia coliにおいて、ベクターの発現される構成要素(例えば、uiNA及び核酸ガイドヌクレアーゼ融合タンパク質)の発現を対象とする構成的または誘導性プロモーターを含有するベクターを用いて行われる。
【0130】
様々な構成要素の発現に好適な様々なRNAポリメラーゼプロモーターが原核生物において利用可能である(例えば、Jiang,Y.,et al.,「Multigene editing in the Escherichia coli genome via the CRISPR-Cas9 system」,Environ Microbiol.(2015) 81:2506-2514);Estrem,S.T.,et al.,(1999)「Bacterial promoter architecture:subsite structure of UP elements and interactions with the carboxy-terminal domain of the RNA polymerase alpha subunit」,Genes Dev.15;13(16):2134-47を参照されたい)。
【0131】
いくつかの態様において、ベクターは、上記の方法の1つ以上の構成要素を含む酵母発現ベクターである。出芽酵母における発現のためのベクターの例として、限定されないが、以下:pYepSec1、pMFa、pJRY88、pYES2、及びpicZが挙げられる。酵母細胞における遺伝子発現のための方法は、当該分野において公知である(例えば、Methods in Enzymology,Volume 194,「Guide to Yeast Genetics and Molecular and Cell Biology,Part A」,(2004) Christine Guthrie and Gerald R.Fink(eds.),Elsevier Academic Press,San Diego,CAを参照されたい)。典型的には、酵母におけるタンパク質コード遺伝子の発現は、目的のコード領域に動作可能に連結されたプロモーター、及び転写ターミネーターを必要とする。様々な酵母プロモーターを使用して、酵母における遺伝子の発現のために発現カセットを構築することができる。プロモーターの例として、限定されないが、以下の酵母タンパク質をコードする遺伝子のプロモーターが挙げられる:アルコール脱水素酵素1(ADH1)またはアルコール脱水素酵素2(ADH2)、ホスホグリセリン酸キナーゼ(PGK)、トリオースリン酸イソメラーゼ(TPI)、グリセルアルデヒド-3-リン酸脱水素酵素(GAPDH;TDH3、またはトリオースリン酸脱水素酵素としても公知)、ガラクトース-1-リン酸ウリジル-トランスフェラーゼ(GAL7)、UDP-ガラクトースエピメラーゼ(GAL10)、チトクロムci(CYC1)、酸性ホスファターゼ(PHO5)及びグリセロール-3-リン酸脱水素酵素遺伝子(GPD1)。ハイブリッドプロモーター、例えば、ADH2/GAPDH、CYC1/GAL10及びADH2/GAPDHプロモーター(低い細胞グルコース濃度、例えば、約0.1パーセント~約0.2パーセントで誘発される)が使用されてもよい。Schizosaccharomyces pombeにおいて、好適なプロモーターとして、チアミン抑圧nmtlプロモーター及びpTL2Mにおける構成的サイトメガロウイルスプロモーターが挙げられる。
【0132】
酵母RNAポリメラーゼIIIプロモーター(例えば、5S、U6またはRPR1遺伝子からのプロモーター)、ならびにポリメラーゼIII終結配列は、当該分野において公知である(例えば、www.yeastgenome.org;Harismendy,O.,et al.,(2003)「Genome-wide location of yeast RNA polymerase III transcription machinery」,The EMBO Journal.22(18):4738-4747.を参照されたい)。
【0133】
プロモーターに加えて、エンハンサーとも呼ばれる、いくつかの上流活性化配列(UAS)が、ポリペプチド発現を向上させるために使用されてよい。酵母における発現のための例示的な上流活性化配列として、これらのタンパク質をコードする遺伝子のUASが挙げられる:CYC1、ADH2、GAL1、GAL7、GAL10、及びADH2。酵母における発現のための例示的な転写終結配列として、α-因子、CYC1、GAPDH、及びPGK遺伝子の終結配列が挙げられる。1つまたは複数の終結配列が使用され得る。
【0134】
好適なプロモーター、ターミネーター、及びコード領域は、大腸菌-酵母シャトルベクター中にクローニングされて酵母細胞に形質転換されてよい。これらのベクターは、酵母及び大腸菌株の両方で菌株伝播を可能にする。典型的には、ベクターは、選択可能なマーカー、及び、各宿主における自己複製または染色体統合を可能にする配列を含む。酵母において典型的に使用されるプラスミドの例は、シャトルベクターpRS423、pRS424、pRS425、及びpRS426(American Type Culture Collection,Manassas,VA)である。これらのプラスミドは、酵母の2ミクロン複製起点、大腸菌複製起点(例えば、pMB1)、及び選択可能なマーカーを含有する。
【0135】
様々な構成要素は、昆虫または昆虫細胞においても発現され得る。かかる細胞における使用に好適な発現制御配列は、当該分野において周知である。いくつかの態様において、発現制御配列が構成的プロモーターを含むことが望ましい。好適な強力なプロモーター例として、限定されないが、以下が挙げられる:piOについてのバキュロウイルスプロモーター、ポリへドリン(polh)、p6.9、カプシド、UAS(Gal4結合部位を含有する)、Ac5、カテプシン様遺伝子、B.moriアクチン遺伝子プロモーター;Drosophila melanogaster hsp70、アクチン、α-1-チューブリンまたはユビキチン遺伝子プロモーター、RSVまたはMMTVプロモーター、コピアプロモーター、ジプシープロモーター、及びサイトメガロウイルスIE遺伝子プロモーター。使用され得る弱いプロモーターの例として、限定されないが、以下が挙げられる:iel、ie2、ieO、etl、39K(aka pp31)、及びgp64遺伝子のためのバキュロウイルスプロモーター。弱いプロモーターからの遺伝子発現の量を増加させることが望ましいとき、エンハンサーエレメント、例えば、バキュロウイルスエンハンサーエレメント、hr5が、プロモーターと併せて使用されてよい。
【0136】
昆虫における、本明細書に開示されている構成要素のいくつかの発現のために、RNAポリメラーゼIIIプロモーター、例えば、U6プロモーターが当該分野において公知である。昆虫におけるRNAポリメラーゼIIIプロモーターの保存されている特徴も公知である(例えば、Hernandez,G.,(2007)「Insect small nuclear RNA gene promoters evolve rapidly yet retain conserved features involved in determining promoter activity and RNA polymerase specificity」,Nucleic Acids Res.2007 Jan;35(1):21-34を参照されたい)。
【0137】
別の態様において、様々な構成要素が、哺乳類細胞における使用のための哺乳類ベクターに組み込まれる。本発明のシステムと共に使用されるのに好適な多数の哺乳類ベクターが市販されている(例えば、Life Technologies,Grand Island,NY;NeoBiolab,Cambridge,MA;Promega,Madison,WI;DNA2.0,Menlo Park,CA;Addgene,Cambridge,MAから)。
【0138】
哺乳類ウイルスに由来するベクターはまた、哺乳類細胞において本方法の様々な構成要素を発現するのに使用され得る。これらとして、ウイルス、例えば、アデノウイルス、パポバウイルス、ヘルペルウイルス、ポリオーマウイルス、サイトメガロウイルス、レンチウイルス、レトロウイルス、牛痘及びシミアンウイルス40(SV40)由来のベクターが挙げられる(例えば、Kaufman,R.J.,(2000)「Overview of vector design for mammalian gene expression」,Molecular Biotechnology,Volume 16,Issue 2,pp 151-160;Cooray S.,et al.,(2012)「Retrovirus and lentivirus vector design and methods of cell conditioning」,Methods Enzymol.507:29-57を参照されたい)。構成要素に動作可能に連結された調節配列には、アクチベーター結合配列、エンハンサー、イントロン、ポリアデニル化認識配列、プロモーター、リプレッサー結合配列、ステムループ構造、翻訳開始配列、翻訳リーダー配列、転写終結配列、翻訳終結配列、プライマー結合部位などが含まれ得る。一般的に使用されているプロモーターは、構成的哺乳類プロモーターCMV、EF1a、SV40、PGK1(マウスまたはヒト)、Ubc、CAG、CaMKIIa、及びベータ-Act、ならびに当該分野において公知であるもの(Khan,K.H.(2013)「Gene Expression in Mammalian Cells and its Applications」,Advanced Pharmaceutical Bulletin 3(2)、257-263)である。さらに、HI及びU6を含めた、哺乳類RNAポリメラーゼIIIプロモーターが使用され得る。
【0139】
HEK293(ヒト胎児腎臓)及びCHO(チャイニーズハムスター卵巣)を含めて多数の哺乳類細胞株が遺伝子産物の発現のために利用されてきた。これらの細胞株は、標準的方法(例えば、リン酸カルシウムもしくはポリエチレンイミン(PEI)の使用、またはエレクトロポレーション)によってトランスフェクトされ得る。他の典型的な哺乳類細胞株として、限定されないが:HeLa、U2OS、549、HT1080、CAD、P19、NIH3T3、L929、N2a、ヒト胎児腎臓293細胞、MCF-7、Y79、SO-Rb50、HepG2、DUKX-X11、J558L、及びベビーハムスター腎臓(BHK)細胞が挙げられる。ある特定の実施形態において、哺乳類細胞は、COP細胞、L細胞、C127細胞、Sp2/0細胞、NS-0細胞、NIH3T3細胞、PC12細胞、PC12h細胞、BHK細胞、CHO細胞、COS1細胞、COS3細胞、COST細胞、CV1細胞、Vero細胞、HeLa細胞、HEK-293細胞、PER C6細胞、2倍体線維芽細胞由来の細胞、骨髄腫細胞、またはHepG2である。
【0140】
ポリヌクレオチド(例えば、発現ベクター)を宿主細胞に導入する方法は、当該分野において公知であり、宿主細胞の種類に基づいて典型的には選択される。かかる方法として、例えば、ウイルスまたはバクテリオファージ感染、トランスフェクション、コンジュゲーション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン媒介トランスフェクション、DEAE-デキストラン媒介トランスフェクション、原形質融合、リポフェクション、リポソーム媒介トランスフェクション、パーティクルガン技術、直接微小注入、及びナノ粒子媒介送達が挙げられる。
【0141】
IV.核酸ガイドヌクレアーゼ
本明細書において使用されているとき、「核酸ガイドヌクレアーゼ」は、ヌクレアーゼと会合するガイド核酸(すなわち、ガイドRNAもしくはgRNA、ガイドDNAもしくはgDNA、またはガイドDNA/RNAハイブリッド)と標的配列との間の相補性(全部または部分)に基づいた特異的な標的配列を対象とするヌクレアーゼを指す。特定の実施形態において、核酸ガイドヌクレアーゼは、RNAガイドヌクレアーゼである。ガイドRNAと標的配列との間の結合は、ヌクレアーゼを標的配列の近傍に補充する働きをする。現在開示されている組成物及び方法に好適な核酸ガイドヌクレアーゼの非限定例として、原核生物(例えば、細菌、古細菌)またはその変異体からの、天然の、クラスター化され、規則的に間隔が空いている短い回文の反復(CRISPR)に関連する(Cas)ポリペプチドが挙げられる。原核生物において見出されるCRISPR配列は、侵入するウイルスからのポリヌクレオチドのフラグメントに由来する配列であり、後の感染の際に同様のウイルスを認識し、ウイルスポリヌクレオチドを開裂するRNAガイドヌクレアーゼとして機能するCRISPR関連(Cas)ポリペプチドを介してウイルスポリヌクレオチドを開裂するのに使用される。本明細書において使用されているとき、「CRISPR関連ポリペプチド」または「Casポリペプチド」は、天然CRISPR系内のCRISPR配列の近位の範囲内で見出される天然ポリペプチドを指す。ある特定のCasポリペプチドは、RNAガイドヌクレアーゼとして機能する。
【0142】
少なくとも2つの天然CRISPR系のクラス、クラス1及びクラス2が存在する。概して、現在開示されている組成物及び方法の核酸ガイドヌクレアーゼは、クラス2 CRISPR系が核酸ガイドヌクレアーゼ活性を有する単一のポリペプチドを含むことを考慮してクラス2のCasポリペプチドまたはその変異体であるが、一方で、クラス1 CRISPR系は、ヌクレアーゼ活性のためのタンパク質の複合体を必要とする。少なくとも3つの公知のタイプのクラス2 CRISPR系、II型、V型、及びVI型が存在し、これらの中に、複数のサブタイプが存在する(他の定義されていないまたは推定のサブタイプの中でも、サブII型-A、II-B、II-C、V-A、V-B、V-C、VI-A、VI-B、及びVI-C)。概して、II型及びV型-B系は、活性のために、crRNAに加えてtracrRNAを必要とする。対照的に、V型-A及びVI型は、活性のために、crRNAのみを必要とする。全ての公知のII型及びV型RNAガイドヌクレアーゼが二本鎖DNAを標的とする一方で、全ての公知のVI型RNAガイドヌクレアーゼは一本鎖RNAを標的とする。II型CRISPR系のRNAガイドヌクレアーゼは、本明細書及び文献においてCas9と称される。いくつかの実施形態において、現在開示されている組成物及び方法の核酸ガイドヌクレアーゼは、II型Cas9タンパク質またはその変異体である。RNAガイドヌクレアーゼとして機能するV型Casポリペプチドは、標的配列のターゲティング及び開裂のためにtracrRNAを必要としない。本明細書及び文献において、VA型CRISPR系のRNAガイドヌクレアーゼは、Cpf1と称され;VB型CRISPR系のRNAガイドヌクレアーゼは、C2C1と称され;VC型CRISPR系のRNAガイドヌクレアーゼは、Cas12CまたはC2C3と称され;VIA型CRISPR系のRNAガイドヌクレアーゼは、C2C2またはCas13A1と称され;VIB型CRISPR系のRNAガイドヌクレアーゼは、Cas13Bと称され;VIC型CRISPR系のRNAガイドヌクレアーゼは、Cas13A2と称される。ある特定の実施形態において、現在開示されている組成物及び方法の核酸ガイドヌクレアーゼは、VA型Cpf1タンパク質またはその変異体である。核酸ガイドヌクレアーゼとして機能する、自然発生のCasポリペプチド及びその変異体は、当該分野において公知であり、限定されないが、Streptococcus pyogene Cas9、Staphylococcus aureus Cas9、Streptococcus thermophilus Cas9、Francisella novicida Cpf1、または、それぞれの全体が本明細書に組み込まれる、Shmakov et al.(2017) Nat Rev Microbiol 15(3):169-182;Makarova et al.(2015) Nat Rev Microbiol 13(11):722-736;及び米国特許第9790490号に記載されているものが挙げられる。クラス2 V型CRISPRヌクレアーゼとして、Cas12及びCas12のサブタイプ、例えば、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、及びCas12iが挙げられる。Cas13を含めたクラス2VI型CRISPRヌクレアーゼが、RNA標的配列を開裂するために使用され得る。
【0143】
現在開示されている組成物及び方法の核酸ガイドヌクレアーゼは、天然核酸ガイドヌクレアーゼ(例えば、S.pyogene Cas9)またはその変異体であってよい。変異体の核酸ガイドヌクレアーゼは、操作されていてよく、または、例えば、ヌクレアーゼドメインのうちの1つ以上の活性を変更する、核酸ガイドヌクレアーゼを、修飾特性を付与する非相同ドメイン(例えば、転写活性化ドメイン、後成的修飾ドメイン、検出可能な標識)に融合する、ヌクレアーゼの安定性を修飾する、もしくはヌクレアーゼの特異性を修飾するアミノ酸の置換、欠失、もしくは付加を含む自然発生の変異体であってよい。
【0144】
いくつかの実施形態において、核酸ガイドヌクレアーゼは、細胞内微環境における、標的部位への特異性、及び/または安定性を改良するために1つ以上の変異体を含む。例えば、タンパク質がCas9(例えば、SpCas9)または修飾Cas9であるとき、Rec2ドメインのN175~R307(包含)のいずれかまたは全ての残基を欠失させることが有益であり得る。より小さい、またはより低分子量のバージョンのヌクレアーゼがより効果的であることが見出され得る。いくつかの実施形態において、ヌクレアーゼは、天然バージョンのヌクレアーゼと比較して少なくとも1つの置換を含む。例えば、タンパク質がCas9または修飾Cas9であるとき、C80またはC574(インデルによって修飾されたタンパク質においては、そのホモログ)を変異させることが有益であり得る。Cas9において、望ましい置換は、C80A、C80L、C80I、C80V、C80K、C574E、C574D、C574N、C574Q(任意の組み合わせにおいて)のいずれか、特にC80Aを含んでいてよい。置換は、ヌクレアーゼの細胞内タンパク質の結合を低減する及び/または標的部位特異性を増加させるために含まれていてよい。付加的または代替的には、置換は、組成物の標的外の毒性を低減するために含まれていてよい。
【0145】
核酸ガイドヌクレアーゼは、ガイド核酸(例えば、ガイドRNA(gRNA)、ガイドDNA(gDNA))との会合を通して特定の標的配列に向けられる。核酸ガイドヌクレアーゼは、非共有結合的相互作用を介してガイド核酸に結合し、それにより、複合体を形成する。ポリヌクレオチドターゲティング核酸は、標的配列の配列に相補的であるヌクレオチド配列を含むことによって複合体への標的特異性を付与する。複合体の核酸ガイドヌクレアーゼまたはこれに融合もしくは他の場合にはコンジュゲートしたドメインもしくは標識は、部位特異的活性を付与する。すなわち、核酸ガイドヌクレアーゼは、ポリヌクレオチドターゲティングガイド核酸のタンパク質結合セグメントとの会合のおかげで、標的ポリヌクレオチド配列(例えば、染色体核酸における標的配列;染色体外核酸、例えば、エピソーム核酸、ミニサークルにおける標的配列;ミトコンドリア核酸における標的配列;葉緑体核酸における標的配列;プラスミドにおける標的配列)にガイドされる。
【0146】
そのため、ガイド核酸は、2つのセグメント、「ポリヌクレオチドターゲティングセグメント」及び「ポリペプチド結合セグメント」を含む。「セグメント」は、分子のセグメント/セクション/領域(例えば、RNAにおけるヌクレオチドの連続ストレッチ)を意味する。セグメントはまた、セグメントが1を超える分子の領域を含み得るような複合体の領域/セクションを指すこともできる。例えば、いくつかの場合において、ポリヌクレオチドターゲティング核酸のポリペプチド結合セグメント(後述されている)は、唯1つの核酸分子を含み、ポリペプチド結合セグメントは、そのため、かかる核酸分子の領域を含む。他の場合において、DNAターゲティング核酸のポリペプチド結合セグメント(後述されている)は、相補性の領域と併せてハイブリダイズされた2つの別個の分子を含む。
【0147】
ポリヌクレオチドターゲティングセグメント(または「ポリヌクレオチドターゲティング配列」もしくは「ガイド配列」)は、標的配列内の特定の配列に相補的(完全にまたは部分的に)であるヌクレオチド配列(例えば、標的DNA配列の相補鎖)を含む。ポリペプチド結合セグメント(または「ポリペプチド結合配列」)は、核酸ガイドヌクレアーゼ(例えば、RNAガイドヌクレアーゼ)と相互作用する。概して、核酸ガイドヌクレアーゼによる標的DNAの部位特異的開裂または修飾は、(i)核酸及び標的DNAのポリヌクレオチドターゲティング配列間の塩基対形成相補性;ならびに(ii)標的DNAにおけるショートモチーフ(プロトスペーサー隣接モチーフ(PAM)とも称される)の両方によって決定される箇所において起こる。
【0148】
プロトスペーサー隣接モチーフは、異なる長さのものであってよく、標的配列からの可変距離であってよいが、PAMは、概して、標的配列から約1、約2、約3、約4、約5、約6、約7、約8、約9、または約10ヌクレオチドを含めた、標的配列から約1~約10ヌクレオチド内である。PAMは、標的配列の5’または3’であってよい。概して、PAMは、約3~4ヌクレオチドのコンセンサス配列であるが、特定の実施形態においては、2、3、4、5、6、7、8、9以上の長さのヌクレオチドである。所与のRNAガイドヌクレアーゼに好ましいPAM配列またはコンセンサス配列を識別する方法は、当該分野において公知であり、限定されないが、それぞれ、全体が参照により組み込まれる、Karvelis et al.(2015) Genome Biol 16:253によって記載されているPAM枯渇アッセイ、またはPattanayak et al.(2013) Nat Biotechnol 31(9):839-43に開示されているアッセイが挙げられる。
【0149】
本明細書に記載されている固有の識別核酸(uiNA)は、ガイド核酸配列を含む。ポリヌクレオチドターゲティング配列(すなわち、ガイド配列)は、目的の標的配列と直接ハイブリッドを形成するヌクレオチド配列である。ガイド配列は、目的の標的配列と完全にまたは部分的に相補性であるように操作される。様々な実施形態において、ガイド配列は、約8ヌクレオチド~約30ヌクレオチド、またはこれを超えるヌクレオチドを含み得る。例えば、ガイド配列は、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30以上の長さのヌクレオチドであってよい。いくつかの実施形態において、ガイド配列は、約10~約26の長さのヌクレオチド、または約12~約30の長さのヌクレオチドである。特定の実施形態において、ガイド配列は、約30の長さのヌクレオチドである。いくつかの実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、好適な整列アルゴリズムを使用して最適に整列されているとき、約または約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%を超える、またはそれ以上である。特定の実施形態において、ガイド配列は、二次構造を含まず、これは、限定されないが、mFold(例えば、Zuker and Stiegler(1981) Nucleic Acids Res.9:133-148を参照されたい)及びRNAfold(例えば、Gruber et al.(2008) Cell 106(1):23-24を参照されたい)を含めた、当該分野において公知の任意の好適なポリヌクレオチドの折り畳みアルゴリズムを使用して予測され得る。
【0150】
いくつかの実施形態において、ガイド核酸は、2つの別個の核酸分子(「アクチベーター-核酸」及び「ターゲッター-核酸」、以下を参照されたい)を含み、本明細書において「二重分子ガイド核酸」、または「2分子ガイド核酸」と称される。他の実施形態において、対象のガイド核酸は、単一の核酸分子(単一のポリヌクレオチド)であり、本明細書において「単分子ガイド核酸」、「単一の-ガイド核酸」、または「sgNA」と称される。用語「ガイド核酸」または「gNA」は、包含的であり、二重分子ガイド核酸及び単分子ガイド核酸(すなわち、sgNAs)の両方を指している。ガイド核酸がRNAであるこれらの実施形態において、gRNAは、二重分子ガイドRNAまたは単一の-ガイドRNAであってよい。同様に、ガイド核酸がDNAであるこれらの実施形態において、gDNAは、二重分子ガイドDNAまたは単一の-ガイドDNAであってよい。
【0151】
例示的な2分子ガイド核酸は、crRNA様(「CRISPR RNA」または「ターゲッター-RNA」または「crRNA」または「crRNAリピート」)分子及び対応するtracrRNA様(「trans-アクチンCRISPR RNA」または「アクチベーター-RNA」または「tracrRNA」)分子を含む。crRNA様分子(ターゲッター-RNA)は、ガイドRNAのポリヌクレオチドターゲティングセグメント(一本鎖)、及び、ガイドRNAのポリペプチド結合セグメントのdsRNAデュプレックスの半分を形成するヌクレオチドのストレッチ(「デュプレックス形成セグメント」)の両方を含み、本明細書においてCRISPRリピート配列とも称される。
【0152】
用語「アクチベーター-核酸」または「アクチベーター-NA」は、二重分子ガイド核酸のtracrRNA様分子を意味するように本明細書において使用されている。用語「ターゲッター-核酸」または「ターゲッター-NA」は、二重分子ガイド核酸のcrRNA様分子を意味するように本明細書において使用されている。用語「デュプレックス形成セグメント」は、対応するアクチベーター-NAまたはターゲッター-NA分子のヌクレオチドのストレッチをハイブリダイズすることによってdsRNAデュプレックスの形成に貢献するアクチベーター-NAまたはターゲッター-NAのヌクレオチドのストレッチを意味するように本明細書において使用されている。すなわち、アクチベーター-NAは、対応するターゲッター-NAのデュプレックス形成セグメントに相補的であるデュプレックス形成セグメントを含む。そのため、アクチベーター-NAは、デュプレックス形成セグメントを含むが、ターゲッター-NAは、デュプレックス形成セグメント及びガイド核酸のDNAターゲティングセグメントの両方を含む。ゆえに、対象の二重分子ガイド核酸は、任意の対応するアクチベーター-NA及びターゲッター-NA対から構成され得る。
【0153】
アクチベーター-NAは、アクチベーター-NA(ガイド核酸のポリペプチド結合セグメントの他の部分)にハイブリダイズするのに充分な相補性を有する領域を含むヌクレオチド配列を含むCRISPRリピート配列を含む。様々な実施形態において、CRISPRリピート配列は、約8ヌクレオチド~約30ヌクレオチド、またはこれを超えるヌクレオチドを含み得る。例えば、CRISPRリピート配列は、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30以上の長さのヌクレオチドであってよい。いくつかの実施形態において、CRISPRリピート配列と、その対応するtracr配列のアンチリピート領域との相補性の程度は、好適な整列アルゴリズムを使用して最適に整列されているとき、約または約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%を超える、またはそれ以上である。
【0154】
対応するtracrRNA様分子(すなわち、アクチベーター-NA)は、ガイド核酸のポリペプチド結合セグメントの二本鎖デュプレックスの他の部分を形成するヌクレオチド(デュプレックス形成セグメント)のストレッチを含む。すなわち、crRNA様分子(すなわち、CRISPRリピート配列)のヌクレオチドのストレッチは、ガイド核酸のポリペプチド結合ドメインの二本鎖デュプレックスを形成するためのtracrRNA様分子(すなわち、アンチリピート配列)のヌクレオチドのストレッチと相補的であり、これとハイブリダイズする。crRNA様分子は、一本鎖DNAターゲティングセグメントをさらに提供する。そのため、crRNA様及びtracrRNA様分子(対応する対として)は、ハイブリダイズしてガイド核酸を形成する。所与のcrRNAまたはtracrRNA分子の正確な配列は、CRISPR系、及びRNA分子が見出される種を特徴とする。対象の二重分子ガイドRNAは、任意の対応するcrRNA及びtracrRNA対を含み得る。
【0155】
トランス活性化様CRISPR RNAまたはtracrRNA様分子(本明細書において「アクチベーター-NA」とも称される)は、crRNAのCRISPRリピート配列にハイブリダイズするのに充分な相補性を有する領域を含むヌクレオチド配列を含み、本明細書においてアンチリピート領域と称される。いくつかの実施形態において、tracrRNA様分子は、二次構造(例えば、ステムループ)を有する領域をさらに含み、またはその対応するcrRNAとハイブリダイズする際に二次構造を形成する。特定の実施形態において、CRISPRリピート配列に完全にまたは部分的に相補的であるtracrRNA様分子の領域は、分子の5’端にあり、tracrRNA様分子の3’端は二次構造を含む。二次構造のこの領域は、ネクサスヘアピンを含めたいくつかのヘアピン構造を概して含み、アンチリピート配列に隣接することが分かっている。ネクサスヘアピンは、多くの場合、ヘアピンステムのベースに保存ヌクレオチド配列を有し、モチーフUNANNCが、tracrRNAにおける多くのネクサスヘアピンにおいて見出される。構造及び数が変動し得るが、GC-リッチRho-依存性転写ターミネーターヘアピン、続いて3’端におけるUのストリングを含み得る、tracrRNAの3’端において末端ヘアピンが存在する場合が多い。例えば、Briner et al.(2014) Molecular Cell 56:333-339,Briner and Barrangou(2016) Cold Spring Harb Protoc;doi:10.1101/pdb.top090902、及び米国特許出願公開公報第2017/0275648号を参照されたい、これらは、それぞれ、全体が参照により本明細書に組み込まれる。
【0156】
様々な実施形態において、CRISPRリピート配列に完全にまたは部分的に相補的であるtracrRNA様分子のアンチリピート領域は、約8ヌクレオチド~約30ヌクレオチド、またはこれを超えるヌクレオチドを含む。例えば、tracrRNA様アンチリピート配列とCRISPRリピート配列との間の塩基対形成の領域は、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30以上の長さのヌクレオチドであってよい。いくつかの実施形態において、CRISPRリピート配列とその対応するtracrRNA様アンチリピート配列との間の相補性の程度は、好適な整列アルゴリズムを使用して最適に整列されているとき、約または約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%を超える、またはそれ以上である。
【0157】
様々な実施形態において、tracrRNA様分子全体は、約60ヌクレオチド~約140超のヌクレオチドを含み得る。例えば、tracrRNA様分子は、約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140以上の長さのヌクレオチドであってよい。特定の実施形態において、tracrRNA様分子は、約80、約81、約82、約83、約84、約85、約86、約87、約88、約89、約90、約91、約92、約93、約94、約95、約96、約97、約98、約99、及び約100の長さのヌクレオチドを含めた約80~約100の長さのヌクレオチドである。
【0158】
対象の単分子ガイド核酸(すなわち、sgNA)は、互いに相補的であるヌクレオチド(ターゲッター-NA及びアクチベーター-NA)の2つのストレッチを含み、介在するヌクレオチド(「リンカー」または「リンカーヌクレオチド」)によって共有結合的に連結されており、ハイブリダイズしてタンパク質結合セグメントの二本鎖核酸デュプレックスを形成することにより、ステムループ構造を結果として生じさせる。ターゲッター-NA及びアクチベーター-NAは、ターゲッター-NAの3’端及びアクチベーター-NAの5’端を介して共有結合的に連結され得る。代替的には、ターゲッター-NA及びアクチベーター-NAは、ターゲッター-NAの5’端及びアクチベーター-NAの3’端を介して共有結合的に連結され得る。
【0159】
単分子DNAターゲティング核酸のリンカーは、約3ヌクレオチド~約100ヌクレオチドの長さを有し得る。例えば、リンカーは、限定されないが約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20以上のヌクレオチドを含めた、約3ヌクレオチド(nt)~約90nt、約3nt~約80nt、約3nt~約70nt、約3nt~約60nt、約3nt~約50nt、約3nt~約40nt、約3nt~約30nt、約3nt~約20ntまたは約3nt~約10ntの長さを有し得る。いくつかの実施形態において、単分子DNAターゲティング核酸のリンカーは、4ntである。
【0160】
例示的な単分子DNAターゲティング核酸は、ハイブリダイズして二本鎖デュプレックスを形成するヌクレオチドの2つの相補的ストレッチを、特定の標的配列にハイブリダイズするガイド配列と併せて含む。
【0161】
適切な天然の同系crRNA対(及び、いくつかの実施形態において、tracrRNA)は、発見されている核酸ガイドヌクレアーゼとして機能する大部分のCasタンパク質について公知であり、または、核酸ガイドヌクレアーゼ活性を有する特定の天然Casタンパク質について、Cas核酸ガイドヌクレアーゼタンパク質のフランキング配列をシーケンシング及び分析して、公知のアンチリピート-コード配列またはその変異体に関して調査することによってtracrRNA-コード配列、及び、これによりtracrRNA配列を識別することにより、決定され得る。tracrRNAのアンチリピート領域は、dsタンパク質結合デュプレックスの半分を含む。dsタンパク質結合デュプレックスの半分を含む相補的リピート配列は、CRISPRリピートと呼ばれる。公知のCRISPR核酸ガイドヌクレアーゼによって利用されるCRISPRリピート及びアンチリピート配列は、当該分野において公知であり、例えば、世界のウェブcrispr.i2bc.paris-saclay.fr/crispr/におけるCRISPRデータベースにおいて見出され得る。
【0162】
単一のガイド核酸または二重-ガイド核酸は、化学的にまたはin vitro転写を介して合成され得る。核酸ガイドヌクレアーゼとガイド核酸との間の配列特異的結合を決定するためのアッセイは、当該分野において公知であり、限定されないが、発現した核酸ガイドヌクレアーゼと、検出可能な標識(例えば、ビオチン)によってタグ化され得、また、核タンパク質複合体が検出可能な標識を介して(例えば、ストレプトアビジンビーズによって)が捕捉されるプルダウン検出アッセイにおいて使用され得るガイド核酸との間のin vitro結合アッセイを含む。ガイド核酸に関係しない配列または構造を有する対照ガイド核酸は、核酸への核酸ガイドヌクレアーゼの非特異的結合について陰性対照として使用され得る。
【0163】
ガイド核酸に加えて、uiNAは、固有の配列識別子またはバーコードを含む。配列識別子は、ガイド核酸を固有に識別するいずれの核酸配列であってもよく、バルク合成ポリヌクレオチドバーコード、ランダム合成バーコード配列、マイクロアレイベースのバーコード合成、ネイティブヌクレオチド、N-マー、ランダムN-マー、擬ランダムN-マー、またはこれらの組み合わせによる部分的補完を含めた様々な異なるフォーマットから生じてよい。いくつかの実施形態において、配列識別子は、非自然発生の配列であってよい。配列識別子は、例えば、10未満、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、88、90、100、110、120、130、140、150、160、170、180、190、200、または200を超えるヌクレオチドを含み得る。さらに、配列識別子は、ガイド核酸のいずれの箇所に位置していても、ガイド核酸に隣接していてもよい(例えば、crRNA、tracrRNAにあっても、もしくはこれに隣接していても、または、単一のガイドRNAにおけるcrRNA/trRNA間のテトラループにあってもよい)。いくつかの場合において、固有の識別子は、ランダム化されたガイド核酸である。かかる実施形態において、ランダム化されたガイド配列は、標的配列とハイブリダイズすることが可能でないが核酸ガイドヌクレアーゼと依然として安定して会合し得るものであってよい。他の実施形態において、ガイド核酸は、相補的核酸配列とハイブリダイズする能力を保持する。
【0164】
uiNAは、さらなる配列セグメントを含んでいてもよい。かかるさらなる配列セグメントは、機能的配列、例えば、プライマー配列、プライマーアニーリング部位配列、固定化配列、または後の処理に有用な他の認識もしくは結合配列、例えば、uiNAオリゴヌクレオチドが付着するサンプルのシーケンシングに使用されるシーケンシングプライマーもしくはプライマー結合部位を含んでいてよい。
【0165】
ある特定の実施形態において、現在開示されている組成物及び方法の核酸ガイドヌクレアーゼは、ニッカーゼとして機能するヌクレアーゼ変異体を含み、ヌクレアーゼは、二本鎖核酸分子の一本鎖を開裂することのみが可能であるヌクレアーゼを結果として生じさせまたはヌクレアーゼ活性を完全に欠失している(すなわち、ヌクレアーゼ不活性型)野生型ヌクレアーゼと比較して変異を含む。
【0166】
ニッカーゼとして機能するヌクレアーゼ、例えば、核酸ガイドヌクレアーゼは、単一の機能のヌクレアーゼドメインを含むだけである。これらの実施形態のいくつかにおいて、さらなるヌクレアーゼドメインは、この特定のドメインのヌクレアーゼ活性が低減または排除されるように変異されている。
【0167】
他の実施形態において、ヌクレアーゼ(例えば、RNAガイドヌクレアーゼ)は、ヌクレアーゼ活性を完全に欠失しており、本明細書においてヌクレアーゼ不活性型と称される。これらの実施形態のいくつかにおいて、ヌクレアーゼ内の全てのヌクレアーゼドメインは、ポリペプチドの全てのヌクレアーゼ活性が排除されるように変異されている。核酸ガイドヌクレアーゼの1つ以上のヌクレアーゼドメインに変異を導入するために、それぞれ、全体が参照により組み込まれる、米国特許出願公開公報第2014/0068797号及び米国特許第9,790,490号に記載されているものを含め、当該分野において公知のいずれの方法が使用されてもよい。
【0168】
ニッカーゼ活性を有する核酸ガイドヌクレアーゼまたはヌクレアーゼ不活性型核酸ガイドヌクレアーゼを生じさせるために、ヌクレアーゼ活性を低減または排除するヌクレアーゼドメイン内のいずれの変異体が使用されてもよい。かかる変異体は、当該分野において公知であり、限定されないが、RuvCドメイン内のD10A変異体、またはS.pyogene Cas9のHNHドメイン内もしくはS.pyogene Cas9と最大の相同性で整列されたとき別の核酸ガイドヌクレアーゼ内の同様に位置(複数可)におけるH840A変異体を含む。変異してニッカーゼまたはヌクレアーゼ不活性型タンパク質を生じさせ得るS.pyogene Cas9のヌクレアーゼドメイン内の他の位置として、G12、G17、E762、N854、N863、H982、H983、及びD986が挙げられる。ニッカーゼまたはヌクレアーゼ不活性型タンパク質を生じ得る核酸ガイドヌクレアーゼのヌクレアーゼドメイン内の他の変異体として、Francisella novicida Cpf1タンパク質の、または、F.novicida Cpf1タンパク質と最大の相同性で整列されたとき別の核酸ガイドヌクレアーゼ内の同様に位置(複数可)における、D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A、及びN1257Aが挙げられる(全体が参照により組み込まれる、米国特許第9,790,490号)。
【0169】
ヌクレアーゼ不活性型ドメインを含む核酸ガイドヌクレアーゼは、ポリヌクレオチドを修飾することが可能であるドメインをさらに含み得る。ヌクレアーゼ不活性型ドメインに融合され得る修飾ドメインの非限定例として、限定されないが、転写活性化または抑制ドメイン、塩基編集ドメイン、及び後成的修飾ドメインが挙げられる。他の実施形態において、ヌクレアーゼ不活性型ドメインを含む核酸ガイドヌクレアーゼは、標的配列の存在の検出を助け得る検出可能な標識をさらに含む。
【0170】
ヌクレアーゼ不活性型ドメインに融合され得る後成的修飾ドメインは、DNAまたはヒストンタンパク質を共有結合的に修飾して、DNA配列自体を変更することなくヒストン構造及び/または染色体構造を変更し、これにより遺伝子発現の変化(上方調節または下方調節)を引き起こす役割をし得る。核酸ガイドヌクレアーゼによって誘発され得る後成的修飾の非限定例として、ヒストン残基の以下の変更及びその逆反応:sumo化、アルギニンまたはリシン残基のメチル化、リシン残基アセチル化またはユビキチン化、セリン及び/またはトレオニン残基のリン酸化;ならびにDNAの以下の変更及びその逆反応:シトシン残基のメチル化またはヒドロキシメチル化が挙げられる。そのため、後成的修飾ドメインの非限定例として、ヒストンアセチルトランスフェラーゼドメイン、ヒストン脱アセチル化ドメイン、ヒストンメチルトランスフェラーゼドメイン、ヒストンデメチラーゼドメイン、DNAメチルトランスフェラーゼドメイン、及びDNAデメチラーゼドメインが挙げられる。
【0171】
いくつかの実施形態において、核酸ガイドヌクレアーゼは、転写制御要素及び/または転写調節タンパク質、例えば、転写因子またはRNAポリメラーゼとの相互作用を通して少なくとも1つの隣接遺伝子の転写を活性化する転写活性化ドメインを含む。好適な転写活性化ドメインは、当該分野において公知であり、限定されないが、VP16活性化ドメインを含む。
【0172】
他の実施形態において、核酸ガイドヌクレアーゼは、転写制御要素及び/または転写調節タンパク質、例えば、転写因子またはRNAポリメラーゼとも相互作用して、少なくとも1つの隣接遺伝子の転写を低減または終端させることもできる、転写リプレッサードメインを含む。好適な転写抑制ドメインは、当該分野において公知であり、限定されないが、IκB及びKRABドメインを含む。
【0173】
さらに他の実施形態において、ヌクレアーゼ不活性型ドメインを含む核酸ガイドヌクレアーゼは、疾患関連配列である場合がある標的配列の存在の検出を助け得る検出可能な標識をさらに含む。検出可能な標識は、可視化または他の場合には観察することができる分子である。検出可能な標識は、融合タンパク質(例えば、蛍光タンパク質)としての核酸ガイドヌクレアーゼに融合され得、または視覚的にもしくは他の手段によって検出され得るヌクレアーゼポリペプチドにコンジュゲートした小分子であってよい。融合タンパク質として現在開示されている核酸ガイドヌクレアーゼに融合され得る検出可能な標識として、限定されないが、特定の抗体によって検出され得る蛍光タンパク質またはタンパク質ドメインを含めた、任意の検出可能なタンパク質ドメインが挙げられる。蛍光タンパク質の非限定例として、緑色蛍光タンパク質(例えば、GFP、EGFP、ZsGreen1)及び黄色蛍光タンパク質(例えば、YFP、EYFP、ZsYellow1)が挙げられる。小分子の検出可能な標識の非限定例として、放射性標識、例えば、3H及び35Sが挙げられる。
【0174】
核酸ガイドヌクレアーゼは、そのガイド核酸に結合した核酸ガイドヌクレアーゼを含む核タンパク質複合体として細胞に融合タンパク質(例えば、RNAガイドヌクレアーゼ融合タンパク質)の部分として送達され得る。代替的には、核酸ガイドヌクレアーゼは、融合タンパク質として送達され、ガイド核酸は、別個に提供される。ある特定の実施形態において、ガイドRNAは、RNA分子として標的細胞に導入され得る。ガイドRNAは、in vitroで転写されても化学的に合成されてもよい。他の実施形態において、ガイドRNAをコードするヌクレオチド配列は、細胞に導入される。これらの実施形態のいくつかにおいて、ガイドRNAをコードするヌクレオチド配列は、ネイティブプロモーターであっても、ガイドRNAコードヌクレオチド配列と非相同であってもよい、プロモーター(例えば、RNAポリメラーゼIIIプロモーター)に動作可能に連結されている。特定の実施形態において、プロモーターに動作可能に連結されているガイドRNA及びRNAガイドヌクレアーゼをコードする核酸配列は、ベクター、例えば、本明細書において詳細に記載されている発現ベクターにおいて送達され得る。
【0175】
ある特定の実施形態において、核酸ガイドヌクレアーゼ融合タンパク質は、さらなるアミノ酸配列、例えば、少なくとも1つの核局在化配列(NLS)を含み得る。核局在配列は、細胞の核への核酸ガイドヌクレアーゼの輸送を向上させる。核に輸送されたタンパク質は、リシン及びアルギニン残基に概して最も良好に結合する、核孔複合体内のタンパク質、例えば、インポーチン/カリオフェリンタンパク質の1つ以上に結合する。核局在化のための最も良好に特徴付けられた経路は、インポーチン-αタンパク質に結合する短いペプチド配列を含む。これらの核局在化配列は、多くの場合、塩基性アミノ酸のストレッチを含み、2つのかかる結合部位がインポーチン-αに存在すると仮定して、少なくとも10個のアミノ酸によって分離される2つの塩基性配列が、二分されたNLSを構成し得る。核の輸送に関して二番目に良好に特徴付けられた経路は、それぞれインポーチン-β1に結合する、配列RKKRRQRRR(配列番号23)及びRQARRNRRRRWR(配列番号24)を使用する、インポーチン-β1タンパク質、例えば、HIV-TAT及びHIV-REVタンパク質に結合するタンパク質を含む。他の核局在化配列は、当該分野において公知である(例えば、Lange et al.,J.Biol.Chem.(2007) 282:5101-5105を参照されたい)。NLSは、核酸ガイドヌクレアーゼの天然NLSであっても、非相同NLSであってもよい。本明細書において使用されているとき、配列に関連して「非相同」は、外来種が起源である配列であり、または、同じ種からであるときには、意図的な人間の介在により組成及び/またはゲノム遺伝子座がそのネイティブ形態から実質的に修飾されている。核酸ガイドヌクレアーゼまたは核酸ガイドヌクレアーゼ融合タンパク質の核局在化を向上させるのに使用され得るNLS配列の非限定例として、SV40 Large T-抗原及びc-MycのNLSが挙げられる。ある特定の実施形態において、NLSは、アミノ酸配列PKKKRKV(配列番号25)を含む。
【0176】
核酸ガイドヌクレアーゼ融合タンパク質は、1を超えるNLSを超える、例えば、2、3、4、5、6つ、またはそれを超えるNLS配列を含み得る。複数のNLSは、それぞれ、配列において固有であり得、または、1を超える同じNLS配列が使用され得る。NLSは、核酸ガイドヌクレアーゼ融合タンパク質のアミノ末端(N末端)端部、カルボキシ末端(C末端)端部、または融合タンパク質のN末端及びC末端の両方の端部にあり得る。ある特定の実施形態において、核酸ガイドヌクレアーゼ融合タンパク質は、そのN末端端部に2つのNLS配列を含む。他の実施形態において、核酸ガイドヌクレアーゼ融合タンパク質は、部位特異的ポリペプチドのC末端端部に2つのNLS配列を含む。さらに他の実施形態において、部位特異的ポリペプチドは、そのN末端端部に4つのNLS配列及びそのC末端端部に2つのNLS配列を含む。
【0177】
いくつかの実施形態において、核酸ガイドヌクレアーゼ融合タンパク質は、エピトープタグを含み得る。例えば、エピトープタグは、ポリ-ヒスチジンタグ、例えば、ヘキサヒスチジンタグ(配列番号22)またはドデカヒスチジン(配列番号26)、FLAGタグ、Mycタグ、HAタグ、GSTタグまたはV5タグであってよい。特定の実施形態において、核酸ガイドヌクレアーゼ融合タンパク質は、5’~3’ヘキサヒスチジンタグ(6xHis)(配列番号22)、試験タンパク質(例えば、CPP、またはその変異体)、Cas9、及び2xNLSを含む。
【0178】
ある特定の実施形態において、核酸ガイドヌクレアーゼ融合タンパク質は、試験タンパク質、またはその変異体を含む。試験タンパク質は、本明細書に記載されている方法及び組成物を使用して試験される、いずれのタンパク質、またはその変異体であってもよい。
【0179】
いくつかの実施形態において、試験タンパク質は、細胞の原形質膜を通して、連結されたタンパク質またはペプチドの吸収を誘発する、細胞透過性ペプチド(CPP)である。概して、CPPは、それらの全体形状、及び、膜貫通孔に自己アセンブルする傾向、または、次いで内部移行を活性化する、膜の湾曲を誘発する負に帯電したリン脂質外膜と相互作用する、いくつかの正に帯電した残基を有すること傾向のいずれかに起因して、細胞に入ることを誘発する。例示的な透過性ペプチドとして、限定されないが、トランスポータン、PEP1、MPG、p-VEC、MAP、CADY、polyR、HIV-TAT、HIV-REV、ペネトラチン、R6W3、P22N、DPV3、DPV6、K-FGF、及びC105Yが挙げられ、それぞれ、全体が参照により本明細書に組み込まれる、van den Berg and Dowdy(2011) Current Opinion in Biotechnology 22:888-893及びFarkhani et al.(2014) Peptides 57:78-94にレビューされている。
【0180】
NLSと併せてまたはその代替として、核酸ガイドヌクレアーゼ融合タンパク質は、さらなる非相同アミノ酸配列、例えば、本明細書のいずれかの箇所に記載されている検出可能な標識(例えば、蛍光タンパク質)、または精製タグを含んで、融合タンパク質を形成し得る。精製タグは、タンパク質または融合タンパク質を混合物(例えば、生物サンプル、培地)から単離するのに利用され得る任意の分子である。精製タグの非限定例として、ビオチン、myc、マルトース結合タンパク質(MBP)、及びグルタチオン-S-トランスフェラーゼ(GST)が挙げられる。
【実施例】
【0181】
本発明は、以下の例を参照することにより、より完全に理解される。これらは、しかし、本発明の範囲を限定すると解釈されるべきではない。全ての文献及び特許文献は、参照により本明細書に組み込まれる。
【0182】
実施例1-CPP-Cas9ライブラリの高スループットクローニング
実施例1~4は、Cas9の内部移行を効果的に容易にする細胞透過性ペプチド(CPP)のための異なる試験CPPを含むCas9-融合タンパク質のプールを迅速に評価するように設計されたスクリーニングに関する。ガイドRNA(gRNA)を含む複数の固有の識別RNA(uiRNA)及び3000を超える異なる試験CPPをコードするポリヌクレオチドのライブラリを、Cas9をコードするベクターライブラリにコンビナトリアルアセンブルした。CPPがCas9に動作可能に連結されるようにベクターをアセンブルした。ベクターをシーケンシングすることにより、各ベクターにおけるuiRNA及び試験CPPを識別し、これにより、後の工程においてuiRNAの存在に基づいてCPP-Cas9リボ核タンパク質を識別するのに使用され得る会合したuiRNA及び試験CPPの対のリファレンスを提供した。
【0183】
プラスミドライブラリを大腸菌に形質転換し、ここで、CPP-Cas9融合物及びuiRNAのコンパートメント化された発現は、CPP-Cas9 RNP(すなわち、単一のライブラリベクターにおいて対であるとして先に確立されているuiRNA及びCPP-Cas9融合物を含む)の形成を可能にした。CPP-Cas9融合物を細菌細胞から単離して、CPP-Cas9 RNPのプールを生じさせた。プールされたCPP-Cas9 RNPを、次いで、標的細胞による共インキュベーションによって細胞ターゲティングに関して評価した。共インキュベーション後、核分画を標的細胞において実施し、RNAを核抽出物から単離してシーケンシングした。単離した核RNAにおいて識別したuiRNAを使用して、Cas9の細胞取り込みを効果的に容易にする候補CPPを識別した。このスクリーニングの全体のワークフローをまとめるフローチャートを
図1に示す。
【0184】
まず、ベクターライブラリをコンビナトリアルアセンブルするために、NLS及びCPPペプチドに関する既存のデータベースからコンピュータで識別されたおよそ3200の固有の試験CPPのライブラリからランダムに選択された試験CPPに動作可能に連結されたuiRNAカセット及びCas9ホモログを含むモジュールプラスミドを構築した。具体的な試験タンパク質は、目的の任意の試験タンパク質と容易に取り替えることができる。同様に、Cas9ホモログは、目的の任意の他の核酸ガイドヌクレアーゼと容易に交換することができる。構築物のsgRNAカセットは、T7プロモーター、sgRNA(ランダムバーコードを有するまたは有さない)、3’HDVリボザイム、及び3’RRNBターミネーターを含んだ。CPPコードヌクレオチドに連結されたuiRNAをコードする核酸の例示的なマップを
図2Aに示す。プラスミドは、CPP-Cas9融合物の精製を助けるHis6タグ(配列番号22)、HRV 3cプロテアーゼ部位、及びCas9(C80A)をコードするポリヌクレオチドのN末端におけるCPPの挿入のためのモジュール部位をさらにコードした。
【0185】
プラスミドの各構成要素をプラスミドアセンブリの前にPCR増幅によって調製した。ベクター骨格及びCas9(C80A)を、Golden Gateクローニングプライマーを使用してPCR増幅した。異なるCPPをコードするオリゴヌクレオチドのプールを設計するために、CPPのライブラリからの各試験CPPをin silicoで逆翻訳及びコドン最適化し、DNAヘアピンを除去し、プライマー結合部位を添加し、合成オリゴ類を各CPPにおいて順序づけた。CPPコードオリゴヌクレオチドプールを次いでPCR増幅し、発現ベクターに挿入した。gBlocksまたはultramerの合成DNAから調製したuiRNAブロック(プロモーター、可変sgRNA部分、HDV、及びRRNBターミネーターを含む)をPCR増幅した。全てのPCR増幅をQ5 2x Master Mix(New England Bio)によって50ulの体積で実施し、35サイクル行った。全てのPCR反応は、60℃のアニーリング温度によって1μMのプライマー濃度を有しており、プライマーを15秒間アニーリングした。Cas9 PCR増幅(72℃で3分)及びベクター骨格(72℃で5分)を除いて全ての構築物について72℃で1分間、伸長を実施した。PCR増幅後、全ての産物をZymo DNA Clean及びConcentrateキットによって精製しゲル電気泳動によってアガロースゲルにおいて産物を可視化することによって検証した。
【0186】
次に、CPPコードオリゴヌクレオチドプール、uiRNAブロック、及びプロモーターカセットをオーバーラップ伸長PCRによってアセンブルした。250ngの各インサートを50μlのQ5master mix反応において混合した。反応を、次いで、標準の温度及び時間(60℃のアニーリングを15秒、72℃で1分)に従って、プライマーを付加することなく熱サイクルに供し、次いでZymo DNA Clean及びConcentrateキットを使用して精製した。
【0187】
Cas9(C80A)をコードするポリヌクレオチドカセットを、次いで、Golden Gateクローニングを可能にするPCRプライマーを使用して増幅した。次に、発現ベクターを、2.5μgのCas9(C80)PCR産物を2.5μgのベクターPCR産物及び500ngのオーバーラップ伸長インサートと混合することによってアセンブルし、Sap IのII型S制限酵素及びT4DNAリガーゼを使用して標準Golden Gateクローニングによってアセンブルした。アセンブルした構築したものを、製造のプロトコルに従って、クローニング大腸菌株(Top10またはNebTurbo)に電気-形質転換した。およそ5000の大腸菌 形質転換細胞のライブラリからのコロニーを含有する例示的な寒天プレートを
図2Bに示す。プラスミドライブラリを、Qiagen Midi-prepキットを使用して形質転換細胞から採取した。単離したプラスミドライブラリ(2つの複製)のゲル電気泳動分析の結果を
図2Cに提供する。プラスミドライブラリを実施例2に概説するようにさらに評価した。
【0188】
実施例2-CPP-Cas9ライブラリのgRNA/CPPマッピング
実施例1に概説されているように調製した、uiRNA及びCPP-Cas9融合物をコードするプラスミドライブラリを、次いで、以下のワークフローに従ってIlluminaシーケンサーにおいて次世代シーケンシング(NSG)用に調製した。
【0189】
PCRバイアスに関して制御する、固有の分子識別子(UMI)を、プラスミドライブラリの2-サイクルPCR増幅によって添加した。UMIプライマー(1μM)を50μlのQ5 master mixにおいてプライマープール(10ngプラスミド;約10-9分子)と混合した。混合物を、次いで、標準プロトコルに従って2サイクルにわたって熱サイクルに供した。1μL ExoIを反応に添加して過剰のプライマーを分解した。ExoIを、次いで、サンプルを80℃でインキュベートすることによって熱不活化した。
【0190】
指数関数的PCR増幅を実施して、標準的な製造者プロトコル(65℃のアニーリング温度)を使用して、Illuminaシーケンシングアダプタを付加した。PCR産物をゲル精製し、150サイクルキットによるIllumina MiSequencerにおいてシーケンシングした。
【0191】
プールされたプラスミドデータをカスタムスクリプトによって分析した。読み取りを、UMI、バーコード化されたuiRNA、及びCas9 CPP融合に基づいて様々なフィールドに分割した。PCRバイアスを占めるUMIをカウントして、二重UMIによる読み取りを廃棄した。
【0192】
CPP-Cas9融合物を、次いで、Bowtie2アライナーを使用してCPP-Cas9融合物をCPPコードオリゴヌクレオチドに整列させることによって、特定のバーコード化されたuiRNAに割り当てた。CPP-Cas9融合物を各uiRNAバーコードに関連付けるマップを、アライメント及びuiRNAフィールドを解析することによって構築した。各uiRNAを各ベクターにおいて識別された特定のCPP-Cas9融合物にマッピングする表を作成した。
【0193】
複製間のプラスミド-seqUMIカウントを比較しているデータは、
図3Aに示されている通り、再現可能であった。CPPコードオリゴヌクレオチドの最初のプールにおける最初の3400(約58%カバレッジ)のうちの2000の試験CPPをベクターライブラリにおいて観察した。
図3Bは、各ランからのCPP-Cas9融合物に関するライブラリカバレッジ分布をグラフにより示し、異なるCPP-融合物の相対存在度がバイアスをかけられたことを示している。潜在的なプラスミド不均一性源を識別するために、Cas9-CPP融合物当たりのUMIカウントの数、Cas9-CPP融合物当たりのガイドの数、及びuiRNA当たりのUMIの数を評価した。
【0194】
図4Aは、2つのライブラリ複製に関してのCPP-Cas9融合物当たりのプラスミドUMIの数をグラフにより示し、大腸菌におけるライブラリバイアスまたはクローニングバイアスを示唆している(例えば、コピー数または成長率の差による)。大部分の変異体は変異体当たりほとんどUMIを有していないが、少数の変異体は、多数のUMIを有する。このことは、プラスミドプールにおいて過剰発現された少数の変異体(すなわち、異なるCPP-Cas9融合物)が存在することを示唆している。
【0195】
図4Bは、CPP-Cas9融合物当たりのsgRNAバーコード(すなわち、uiRNA)の数をグラフにより示し、ライブラリアセンブリバイアスを示唆している(例えば、PCRまたはオーバーラップアセンブリ工程の期間中)。大部分の変異体(すなわち、異なるCPP-Cas9融合物)は、少しの違ったsgRNAバーコードを有するが、少しの変異体は、これに会合するいくつかの違ったsgRNAバーコードを有する。このことは、
図4Aに示すバイアスの根本原因が、ランダム化されたsgRNAバーコードがCas9ベクターにライゲーションされる前に起こったことを暗示している。これについての大まかな結論は、異なるCPP-Cas9融合物をコードする基礎のオリゴプールを初めに非対称にしたことである。
【0196】
図4Cは、sgRNAバーコード(すなわち、uiRNA)当たりのUMIの数をグラフにより示し、シーケンシングバイアスを示唆している。シーケンシングライブラリを、PCRバイアスを占めるのに使用される固有の分子識別子(UMI)によって作成した。これらの結果は、PCRバイアスが有意でないこと(logスケールy軸に注意されたい)、これで占められていることを示した。このことは、
図4A及び
図4Bの考察をより定量的にする。
【0197】
まとめると、これらの結果は、モジュール式の高スループットクローニングストラテジーが機能し、実施例3及び実施例4にさらに概説されているように、精製及び評価され得る異なるCas9-CPP融合物のライブラリをコードするプラスミドライブラリの作成を可能にすることを示している。
【0198】
実施例3-ライブラリからの候補CPP-Cas9 RNPの精製
次に、プラスミドライブラリを大腸菌に形質転換し、ここで、CPP-Cas9融合物及びuiRNAのコンパートメント化された発現は、CPP-Cas9 RNP(すなわち、単一のライブラリベクターにおいて対であるとして先に確立されているuiRNA及びCPP-Cas9融合物を含む)の形成を可能にした。CPP-Cas9融合物の発現をT5/lac誘導性プロモーターによって駆動し、uiRNA発現をT7プロモーターによって駆動した。BL21DE細胞において、T7 RNAポリメラーゼの発現もまたlac誘導性である。ゆえに、IPTGの付加は、Cas9及びuiRNAの両方の同時の発現を結果として生じさせる。
【0199】
プラスミドライブラリによって形質転換された1Lの大腸菌を、OD1の光学密度に達するまで37℃において2~5時間成長させた。CPP-Cas9融合物発現及びuiRNA発現を1mM IPTGの添加によって誘発した。温度を次いで16℃に降下し、培養物を16~20時間にわたって一晩成長させた。大腸菌細胞をペレット化し、超音波処理によって溶解した。His6x-CPP-Cas9(配列番号:22として開示されている「His6x」)RNPを、ニッケル樹脂を使用してアフィニティー精製し、イミダゾールによって樹脂から溶出した。アフィニティー精製した核タンパク質をSDS-PAGE分析(
図5A)及びゲル電気泳動(
図5B)によって立証した。CPP-Cas9 RNPを、ACTA FPLC及びS200カラムを使用したサイズ排除クロマトグラフィによってさらに精製した(
図5C)。バルクRNAをRNPからフェノール抽出し、ゲル電気泳動(2%アガロース、SyBr Safe染料)によって分析したところ、
図5Dに示すように、精製されたRNPから抽出された共精製されたRNAの存在が確認された。
【0200】
RNPと共精製されたRNAの識別性を検証するために、共精製されたRNAを鋳型切り替え逆転写によって増幅した。ガイド特異的逆転写プライマーを鋳型の5’端における鋳型切り替えによって使用した。これにより、第2プライマー結合配列を付加し、UMIを付加する。
図6は、逆転写によって増幅されたRNAサンプルのゲル電気泳動分析(2%アガロースゲル、SyBr Safe染料)の画像を示す。結果は、uiRNAまたはGFP sgRNAがRNPによって成功裏に共精製されたことを示す。
【0201】
次いで、ライブラリからの精製されたCPP-Cas9融合物を触媒活性に関して評価した。標的sgRNA(GFP)及び非標的sgRNA(uiRNA)を有する、0uM、1uM、2uM、または10uMのCas9 RNPをdsDNAによって37℃で30分間インキュベートした。
図7は、DNA開裂アッセイからのサンプルのゲル電気泳動分析の画像を示す。非開裂及び開裂dsRNAに相当するバンドを示す。RNPなしの対照条件からのdsRNAも示す。標的DNA開裂を、ガイド依存性及びRNP濃度依存性の方法で観察した。ランダム化されたgRNA(非ターゲティング)を含む精製されたRNP複合体が開裂活性を示さなかった一方で、ターゲティングされたsgRNA RNP複合体が開裂活性を保持した。ターゲティングされたsgRNAに完全な開裂を示させたRNPが1.25uM RNP及び0.25uM DNA基質において観察された。これらの結果は、共精製されたCPP-Cas9 RNPが、本明細書におけるプラスミドライブラリを使用して調製されて、触媒活性であることを示唆している。
【0202】
最後に、CPP-Cas9 RNPのプールと共精製されたRNAをRNA-seqによって分析した。
図8A及び8Bは、データが再現可能であることを示している、複製間のRNA-seq UMIカウントを比較した結果(
図8A)、及び、RNP存在度がプラスミド存在度に追随することを示している、プラスミド対RNP存在度のサンプル相互関係(
図8B)をグラフにより示す。
【0203】
まとめると、この例は、プールCPP-Cas9 RNPのRNP精製が作動し、RNPがsgRNA(例えば、uiRNA)と成功裏に共溶出し、同系dsDNAをin vitroでターゲティングさせ得る触媒活性なCPP-Cas9 RNPを提供することを実証している。
【0204】
実施例4-候補CPP-Cas9 RNPの、T細胞との共インキュベーション
プールされたCPP-Cas9 RNPを、プールされたRNPをヒトまたはマウスT細胞と共インキュベートすることによって細胞ターゲティングに関して評価した。共インキュベーション後、核分画を標的細胞において実施し、RNAを核抽出物から単離してシーケンシングした。単離した核RNAにおいて識別したuiRNAを使用して、Cas9の細胞取り込みを効果的に容易にする候補CPPを識別した。
【0205】
プールされたCPP-Cas9 RNPをヒトT細胞(PBMC、刺激)またはマウスT細胞(脾臓、刺激)と共インキュベートした。2.5μmのプールされたCas9 RNPをおよそ200細胞/μl及び培地と混合した。サンプルをCPP-Cas9 RNPSによる1時間または5時間のインキュベーションの後に評価した(研究設計の概要に関する表1を参照されたい)。陰性対照サンプルを緩衝剤であるがCas9 RNPを含まないものと、5時間、共インキュベートした。細胞を直ちに溶解し、核及び細胞質を各時点で得られたサンプルから分画した。核及び細胞質画分を分離するために、細胞を300RCFで5分間ペレット化した。上清を注意深く除去した。200ul溶解緩衝剤(10mM tris-Cl、10mM NaCl、3mM MgCl2、0.1% NP-40)を再懸濁した細胞に添加し、氷上で5分間インキュベートした。サンプルを500RCFで5分間4℃にて遠心分離した。細胞質画分に相当する上清を除去し、保存した。1mLの核洗浄緩衝剤(1×PBS、1% BSA)を添加し、先の工程を2回繰り返した。細胞着色剤を使用して集塊を除去した。最後に、核画分を核洗浄緩衝剤に再懸濁させた。
【0206】
【0207】
図9において上方のバンドに示されているように、核gRNAの明白な産物を、RNPを細胞によって1時間及び5時間インキュベートした後、ヒトT細胞の核画分において観察した。さらに、核画分においてバーコード化されたgRNAの量は、時間依存的に増加した(
図9)。
【0208】
単離されたRNAを次いで逆転写(RT)PCRによって増幅して、シーケンシング用のcDNA産物を生じさせた。単離された核gRNAから作成したcDNAライブラリをシーケンシングするために、cDNAsのライブラリを、NEBNextバーコード化プライマーを使用して増幅し、アガロースゲルによってサイズ選択し、UMIを含むプラスミドにライゲーションし、定量し(QuBit、フラグメントアナライザー)、混合し、Illuminaシーケンシングによってシーケンシングした。UMIカウントに基づいて、RNA-seq複製間のUMIカウントは、精製されたRNPライブラリによって1時間(
図10A)または5時間(
図10B)インキュベートした刺激ヒトT細胞から単離したRNAのシーケンシングに関する運転間で一致した。
【0209】
次に、上記で概説されているように、ヒトT細胞から単離されたRNAを分析して、差示的に内部移行したCPP-Cas9 RNPを識別した。出発物質(共インキュベーション前にプールされたRNP;ATSeq-01A)においてシーケンシングされたRNAに対しての、ヒト刺激T細胞から核抽出物(ATSeq-01C)においてシーケンシングされたRNAの変化倍率を、
図11B及び11Cに示すように、合計RNP存在度(ATSeq-01A;y軸)に対してプロットした。
図11Cは、CPP-Cas9 RNPのプールによる5時間の共インキュベーション後にヒト刺激T細胞において高い核内部移行を有するCPP-Cas9 RNPと会合するRNAを表す重要なデータ点(星印状のデータ点)をハイライトしている。ハイライトしたデータ点に関連するCPPを表2にまとめる。
【0210】
【0211】
これらの結果は、本スクリーニング方法が、標的細胞におけるuiRNAの存在に基づいてCas9の取り込みを容易にする(すなわち、Cas9と複合体化されたとき)候補CPPを成功裏に識別し得ることを示している。
【0212】
実施例5-sgRNA交換の測定
sgRNAがプラスミド構築及びRNP精製プロセスの際にCPP-Cas9融合物間で交換されるか否かを評価するために、uiRNA交換を測定する実験を実施する。2つのプラスミドを用意する。FLAGアフィニティー-タグ化Cas9タンパク質をコードする第1プラスミドを、公知のsgRNA(すなわち、sgRNA-GFP)と併せて用意する。非タグ化Cas9をコードする第2プラスミドを、ランダム化されたuiRNAと併せて用意する。これらのプラスミドを等しい比で一緒に混合する。プールされた細菌の形質転換を実施し、RNPを精製する。RNA-seqを、FLAGアフィニティープルダウンの前後に実施する。RNPプールにおけるuiRNAまたはsgRNA-GFPの存在度及びFLAG精製した物質におけるuiRNAまたはsgRNA-GFPの存在度を評価する。入力物質における、及び、FLAGプルダウンにおける、sgRNA-GFP:uiRNAカウントの比を見ることにより、sgRNA交換の頻度を決定する。低いsgRNA交換度であると、FLAGプルダウン物質は公知のGFP sgRNAを主に含有する。対照的に、高い交換度が生じると、入力におけるuiRNAカウントがFLAGプルダウン物質におけるものと相関している。
【0213】
実施例6-ライブラリ精製の最適化
実施例3に記載されているように、CPP-Cas9のライブラリを精製するために、RNPを、固定化した金属アフィニティークロマトグラフィを使用して(IMAC、例えば、Hisタグについてアフィニティーでニッケル樹脂を使用して)、続いて、S200カラムを使用するサイズ排除クロマトグラフィを使用して大腸菌細胞溶解物から精製した。しかし、精製の際、DNA混入が、精製されたRNPにおいて存在した。さらに、ライブラリにおけるCas9 RNPが2つの主な種に区分化され、これは、タンパク質または核酸混入物質の存在を示唆している。これらの問題に対処するために、最適化されたRNP精製プロトコルを開発した。
【0214】
DNA混入物質を除去するために、RNPのDNase処理を評価した。30℃で1時間のRNPのDNase処理により、DNA混入が低減した純粋なRNPを得た。したがって、DNase処理工程をIMAC工程後に付加した。
【0215】
混入タンパク質及び核酸を除去するために、RNP純度を、DNase I処理及びアニオン交換クロマトグラフィの両方の後に評価した。RNPをIMAC工程の後及びアニオン交換クロマトグラフィを実施する前にDNase Iで処理した。アニオン交換クロマトグラフィのために、RNPを5mL HiScreen Q HPカラムに添加した。RNPの収率はアニオン交換クロマトグラフィ工程の付加によって低減したが、イオン交換により、大部分の混入タンパク質及び核酸が除去された。
【0216】
したがって、改良されたRNP精製プロトコルは、IMAC工程の後及びSEC工程の前にDNase処理及びアニオン交換クロマトグラフィ工程を組み込むことにより、高純度RNPを得た。
【0217】
実施例7-細胞内分画の立証
細胞内分画プロトコルをさらに立証するために、定量的PCR(qPCR)を使用して品質管理実験を実施して、公知の細胞内でレポーター転写物を追跡して分画ワークフローを評価した。SNROD22(核小体低分子RNA)を核に局在化することが知られている対照RNAとして使用し、GAPDH mRNAを細胞質ゾルに局在化することが知られている対照mRNAとして使用した。細胞を、qPCRを使用してマーカー転写物の存在について評価した。各対照RNAの細胞内局在化パターンと一致して、核画分ではSNORD22が富化され、細胞質画分ではGAPDHが富化された。
【0218】
次に、実験を実施して核内部移行及びゲノム編集の相互関係を評価した。Cas9 RNPを、CD47ターゲティングガイドRNAを使用して生じさせた。T細胞を、Cas9、Cas9-2xNLSもしくは4xNLS-Cas9-2xNLSを含むRNP、またはRNPなしの対照と共インキュベートした。細胞を、次いで、(i)CD47枯渇(ゲノム編集の表現型の読み出し)を検出するFACSまたは(ii)細胞から得られる核画分においてsgRNAを検出するqPCRのいずれかを使用して評価した。sgRNAの核内部移行はFACSによって検出されるようにゲノム編集と一致しており、これは、核内部移行がゲノム編集についてプロキシとして働き得ることを示唆している。
【0219】
実施例8-RNA-seqライブラリ調製の最適化
本実施例において利用されるuiRNAは、5’~3’までバーコードを含んで、RNA-seqを使用したuiRNAを分析した。代替の方法を開発して、プライマーにシーケンシングハンドル及び第2PCRハンドルを与えて増幅を可能にした。実施例3に記載されているように、鋳型切り替え逆転写(例えば、SMART-seqから誘導されるように、10x Genomics)は、uiRNA-seqライブラリを作成し得る1つの方法である。鋳型切り替え逆転写による、例えば、SMART-seqを使用することによるuiRNA-seqライブラリの作成はまた、例えば、全体が参照により本明細書に組み込まれる、Picelli et al.(Nat Protoc 9:171-181(2014)に記載されている。代替の方法として、T4 DNAリガーゼを使用するスプリンテッドライゲーションを使用して、例えば、全体が参照により本明細書に組み込まれるTroll et al.(BMC Genomics 20:1023(2019))に記載されているように、SRSLY-seq系を使用するuiRNA-seqライブラリを作成した。鋳型切り替えアプローチによって生じるライブラリをSRSLY-seqアプローチと比較した。この比較は、SRSLY-seqが、鋳型切り替えプロトコルよりも高収率でuiRNA-seqライブラリを生じたことを示唆した。
【0220】
実施例9-線維芽細胞におけるCPP-Cas9スクリーニング
実施例1~4において使用したものと同様の方法を使用して、スクリーニングを実施して、線維芽細胞へのCas9の内部移行を効果的に容易にするCPPのための異なる試験細胞透過性ペプチド(CPP)を含むCas9-融合タンパク質のプールを迅速に評価した。ガイドRNA(gRNA)を含む複数の固有の識別RNA(uiRNA)及び5885の異なる試験CPPをコードするポリヌクレオチドのライブラリを、Cas9をコードするベクターライブラリにコンビナトリアルアセンブルした。CPPをCPC scientific、CPPsite2、及びNLSDBデータベースから得た。CPPは、ペプチド当たりおよそ15~34個のアミノ酸であり、短いペプチドのタンデムリピートを含んだ。ベクターをCPPがCas9に動作可能に連結されるようにアセンブルした。ベクターをシーケンシングすることにより、各ベクターにおけるuiRNA及び試験CPPを識別し、これにより、後の工程においてuiRNAの存在に基づいてCPP-Cas9リボ核タンパク質を識別するのに使用され得る会合したuiRNA及び試験CPPの対のリファレンスを提供した。
【0221】
uiRNAを含むCPP-RNPの発現及び単離の際、プールされたCPP-Cas9 RNPのライブラリを、マウス線維芽細胞による共インキュベーション後に細胞内部移行を向上させたRNPについてスクリーニングした。共インキュベーション後、核分画を標的細胞において実施し、RNAを核抽出物から単離してシーケンシングした。単離した核RNAにおいて識別したuiRNAを使用して、線維芽細胞へのCas9の細胞取り込みを効果的に容易にする候補CPPを識別した。
【0222】
プールされたCPP-Cas9 RNPを、実施例6に記載されているように、Dnase処理及びアニオン交換クロマトグラフィ工程を使用して精製した。プールされたCPP-Cas9 RNPを、低RNP濃度アプローチまたは高RNP濃度アプローチのいずれかを介して線維芽細胞と共インキュベートした。低RNP濃度アプローチにおいて、プールされたCPP-Cas9 RNPを、およそ300,000細胞及び90μlの培地と、2uM RNPの最終濃度まで混合した。高RNP濃度アプローチにおいて、プールされたCPP-Cas9 RNPを、およそ300,000細胞及び30μlの培地と、5uM RNPの最終濃度まで混合した。両方のアプローチにおいて、線維芽細胞を、37℃で60分間、プールされたRNPと共インキュベートし、その後、細胞を洗浄し、核及び細胞質ゾルに分画して、実施例4に記載されているように、RNA-seqによってさらに分析した。
【0223】
CPP-RNPを発現及び単離する前に、各CPP-RNPを発現するプラスミドをプラスミド-seqによって評価してuiRNAバーコード-CPP会合をマッピングした。CPP-RNPと共インキュベートした細胞の分画の後、鋳型切り替え逆転写法を使用して、核対細胞質ゾルで存在するuiRNAをシーケンシングした。CPP-Cas9ライブラリと共インキュベートした非分画細胞を比較基準として評価した。uiRNAにおけるシーケンシングされたバーコード及び先に確立されたマップに基づいて、各細胞内画分にあるCPP-RNPを識別した。uiRNA-seqカウントにおけるPCRバイアスを除去し(重複排除、デマルチプレックス工程)、核対細胞質ゾルで違った内部移行を有するuiNRAを識別した。
【0224】
主な構成要素の分析を、入力対照(出発物質(共インキュベーション前にプールされたRNP)においてシーケンシングされる、例えばgRNAなどのRNA)、非分画細胞、細胞質画分、及び核画分からのuiRNAカウントにおいて実施した。これらの結果を、使用した共インキュベーションプロトコル(低RNP濃度対高RNP濃度)に基づいてさらに分析した。
図12Aに示されているように、RNA-seqデータを、uiRNAを単離した細胞内画分に基づいて集団化した。データは、共インキュベーションに使用した実験プロトコルに基づいて隔離しなかった。
【0225】
次に、線維芽細胞から単離したRNAを、上記で概説されているように、分析して、線維芽細胞の核画分において富化されたCPP-Cas9 RNPを識別した。核画分において富化されたペプチドを、出発物質(共インキュベーション前にプールされたRNP、すなわち、入力対照)においてシーケンシングされたRNAに対して0.5以上のlog10変化倍率を有する核においてuiRNAに基づいて識別した。入力対照に対して核において存在度が統計的に有意に変化したペプチドを、-10以下のLog10P-値を有するヒットに基づいて識別した。P-値は、Wald試験、及び、多重仮説検定用に補正されたBonferroniを使用してコンピュータ計算した。核において富化され入力対照に対して統計的に有意に変化した存在度を示した合計96のヒットを識別した。
【0226】
入力対照におけるRNAに対する核抽出物におけるRNAの変化倍率を、
図12Bに示されているように、P値(y軸)に対しての火山プロットにおいてプロットした。プールされたCPP-Cas9 RNPによる共インキュベーション後に線維芽細胞において核局在化を示すCPP-Cas9 RNPに会合するRNAをグラフの右上部分(
図12Bの囲まれた部分及び
図12Cにおける星印状のヒットを参照されたい)に示す。
【0227】
識別されたペプチドを化学的特性によってさらに区分化した(CPP-Cas9 RNP核局在化に関連するCPPが同様の化学的特性を有するときに決定する。
図12Dに示されているように、識別されたCPPをハイドロパシー(y軸)及び残基当たりの正味電荷(x軸)に基づいて区分化した。各ドットは、
図12B及び12Cにおけるペプチドを表しており、ドットのサイズが、P値(Log10)を示しており、陰影部分は変化倍率(Log10)を示している。グラフの右下部分におけるデータは、疎水性度が低い高電荷のCPPを示している。富化した核局在化及びより高いP値に関連するCPPは概して高電荷であり(例えば、残基当たりの正味電荷が+0.4を超える)、低減した疎水度を有するが、CPP-Cas9 RNPの富化した核局在化に関連するいくつかの非極性ペプチド(
図12Dにおける丸を付けたデータ点2を参照されたい)もまた識別した。
【0228】
図12Cは、線維芽細胞において核内部移行が富化したCPP-Cas9 RNPと会合するRNAを表す頂部の8つのデータ点をハイライトしている(星印状のデータ点を参照されたい)。ハイライトしたデータ点に関連するCPPを表3にまとめる。ある特定の場合において、いくつかのCPPを同様の配列によって識別した。例えば、2つのCPPを、アミノ酸モチーフCVQWSLLRGYQPC(配列番号:20;表3におけるヒット番号1及び番号3を参照されたい)を含めたスクリーニングにおいて識別した。さらに、3つのCPPを、アミノ酸モチーフXKXRX-GSGS(配列番号:21)を含めたスクリーニングにおいて識別した。ここで、Xは、アミノ酸RまたはKのいずれかである。大部分のヒットがポリカチオン性であった(例えば、R/Kリッチ)。TAT細胞透過性ペプチドの10個の変異体を、S41ペプチドの2つの変異体と共にさらに識別した。また、Bacillus thuringiensisエンドトキシンデルタ及びペネトラチンをスクリーニングにおいて識別した。
【0229】
(表3)線維芽細胞の核画分が富化されたuiRNA(CPP-Cas9 RNPの)と会合するCPP
【0230】
【配列表】
【国際調査報告】